ElevenLabs представила Flash v2.5 с поддержкой русского языка и сверхбыстрой озвучкой
Компания ElevenLabs выпустила новую модель синтеза речи Flash v2.5, которая обеспечивает самую низкую задержку среди решений компании и поддерживает 32 языка, включая русский.
Модели Flash v2 и v2.5 способны генерировать речь всего за 75 миллисекунд. В то время как Flash v2 работает только с английским языком, версия v2.5 открывает возможности для мультиязычного использования.
Flash v2.5 предназначена для создания голосовых помощников и озвучивания игровых персонажей, где важен естественный ритм диалога. Для демонстрации возможностей модели компания показала пример генерации аудио на русском языке: 60 символов текста были озвучены менее чем за две секунды.
Для выбора подходящего ИИ-агента, адаптированного под русский язык, достаточно воспользоваться библиотекой голосов, где можно настроить параметры и выбрать понравившийся голос. При этом, доступ к сервису ограничен для пользователей с российскими IP-адресами.
Платформа ElevenLabs позволяет пользователям протестировать Flash v2.5 бесплатно, предоставляя 10 тысяч кредитов в месяц. Платная подписка начинается с $5 в месяц и включает от 30 тысяч кредитов, а также лицензию для коммерческого использования голосов.
Напомним, что недавно в приложении ElevenLabs появилась функция GenFM, с помощью которой можно генерировать подкасты с несколькими голосами на основе загруженного контента, например, текста или PDF-документа.
Flash v2.5 представляет собой мощный инструмент для разработчиков и контент-мейкеров, предоставляя быстрый и качественный синтез речи, что значительно упрощает создание мультиязычных приложений и сервисов.
Ранее видегенератор Kling AI обновился до версии 1.6.