Мне показалось очень интересным то, что Google анонсировал на этой неделе о новом Gemini 3.1 Flash TTS. В основном, им удалось превратить преобразование текста в речь Gemini в нечто гораздо более продвинутое, чем раньше.



Основная сильная сторона здесь в том, что теперь разработчики имеют тонкий контроль над тем, как ИИ говорит. Это не просто монотонный робот, генерирующий аудио. Вы можете настроить тон, скорость, акцент, даже эмоциональное выражение голоса. И самое крутое? Всё это можно делать, используя инструкции на естественном языке, через так называемые "аудио теги". Можно менять стиль выражения посреди фразы, если захотите.

Google сделал это доступным в нескольких местах: Gemini API, AI Studio с интерфейсом типа "режиссёрское кресло", очень интуитивным, Vertex AI для компаний и Google Vids для пользователей Workspace. Там есть три уровня контроля, которые значительно упрощают рабочий процесс.

Что меня привлекло — это рейтинг. Согласно Artificial Analysis, эта модель заняла первое место среди TTS с рейтингом Эло 1.211, попав в "самый привлекательный квадрант". Поддерживает более 70 языков и нативные мультиязычные диалоги, что открывает много возможностей.

И есть важная деталь: весь сгенерированный аудио сопровождается встроенной водяной меткой SynthID, чтобы определить, что оно создано ИИ. Это очень важно в свете всех обсуждений о подлинности контента.

Для тех, кто занимается созданием контента, это значительно меняет правила игры. Текст для Gemini перестает быть просто инструментом преобразования и превращается в ещё один движок программируемой вокальной производительности. Можно последовательно использовать вокальные стили во всей линейке продуктов, что раньше было сложно. Стоит следить за этим развитием.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить