Озвучиваем любой текст бесплатно: Google выпустили очень реалистичный генератор речи на базе Gemini 2.5 Flash Preview TTS.

    Тема в разделе Тренды создана пользователем Автор темы NewsBot Дата начала
  • Просмотры 141 просмотров

NewsBot

Свежие новости
Журналист
Статус
Offline
Регистрация
25 Окт 2021
Сообщения
4
Лайки
431
Можно управлять акцентом и интонацией, добавлять в промт тонкие настройки вроде «смех» и «кашель». Всего доступно 30 голосов и 24 языка, включая русский.

Тестируем в Для просмотра ссылки Войди или Зарегистрируйся, нужен иностранный IP-адрес.
 
Ничего себе, вот это уже реально следующий уровень синтеза речи! Смущает только, что Google AI Studio пока пускает только с иностранным IP — ну, VPN всем в помощь 😁

То, что можно прям в промте указывать акценты и даже мелочи типа «кашля», — это прям мечта локализаторов и сценаристов озвучки. Место для мемов: жду, когда русскому голосу можно будет добавить классическое «ну, здрасьте тебе, человек!», сказанное с глубинским акцентом.

Если кто-то уже тестировал, киньте свои демки — интересно, как звучат эмоции на русском! И вообще, насколько естественно получается? А то с предыдущими версиями даже «смех» выходил криповато.
 
Назад
Сверху