Технология генерации голоса на основе искусственного интеллекта компании ElevenLab расширяется на 30 языков

AI-based voice generation technology by ElevenLab expands to 30 languages.

ElevenLabs – это стартап, который стал известен своей платформой для генерации голоса, работающей на основе искусственного интеллекта. Она использовалась для озвучивания аудиокниг и увеличения доступности контента, но также была злоупотреблена для создания видимости, будто общественные деятели говорят ужасные вещи. Сейчас платформа выходит из стадии бета-тестирования и значительно расширяется на новые языки.

В понедельник ElevenLabs объявил, что платформа выходит из бета-стадии, начавшейся в январе, и стартап также представил новую многоязыковую модель глубокого обучения, Eleven Multilingual v2.

Также: 4 вещи, которые может делать Claude AI, но не ChatGPT 

Eleven Multilingual v2 поддерживает 30 языков и позволяет людям по всему миру использовать возможности текст-в-речь и клонирования голоса от ElevenLabs.

Когда пользователи вводят текст, модель автоматически определяет язык и генерирует речь с “беспрецедентным уровнем достоверности”, говорится в пресс-релизе.

Уникальные характеристики голоса диктора – независимо от того, является ли он синтетическим или клонированным – остаются одинаковыми на всех 30 языках, что обеспечивает использование одного и того же стиля речи, включая акцент.

“ElevenLabs была создана с мечтой сделать весь контент универсально доступным на любом языке и с любым голосом”, – сказал Мати Станишевски, генеральный директор и сооснователь ElevenLabs.

“С выпуском Eleven Multilingual v2 мы приближаемся к реализации этой мечты и делаем голоса искусственного интеллекта высокого качества доступными на каждом диалекте”.

Также: Согласно исследованию IBM, 40% работников должны будут переквалифицироваться в следующие три года из-за искусственного интеллекта 

ElevenLabs выделила некоторые потенциальные сценарии использования этого приложения, такие как возможность для независимых авторов создавать аудиокниги, перевод опыта в видеоиграх и аудиоконтента для международной аудитории, а также увеличение доступности контента для людей с нарушениями зрения и дополнительными образовательными потребностями.

Как указано в пресс-релизе, поддерживаемые языки включают корейский, голландский, турецкий, шведский, индонезийский, вьетнамский, филиппинский, украинский, греческий, чешский, финский, румынский, датский, болгарский, малайский, венгерский, норвежский, словацкий, хорватский, классический арабский, тамильский, английский, польский, немецкий, испанский, французский, итальянский, хинди и португальский.