🎙️ BUD-E Голосовой помощник нового поколения с открытым исходным кодом

Немецкая некоммерческая организация LAION, ответственная за создание нескольких популярных наборов данных по искусственному интеллекту, стремится создать открытого голосового ассистента под названием BUD-E.

ENBLE, немецкая некоммерческая организация, создает бесплатного голосового помощника для всех.

Открытые искусственным интеллектом управляемые голосовые помощники с открытым исходным кодом существуют уже некоторое время. От Rhasspy до Mycroft до Jasper, эти проекты стремятся создать голосовых помощников с сохранением конфиденциальности и работающих офлайн без потери функциональности. Однако разработка проходит медленно из-за сложностей создания помощника и ограниченности существующих архитектур.

Но не волнуйтесь, потому что немецкая некоммерческая организация Large-scale Artificial Intelligence Open Network (LAION) взялась за решение этой задачи с помощью своего нового проекта BUD-E. BUD-E, сокращение от “Buddy for Understanding and Digital Empathy” (Братишка для понимания и цифровой эмпатии), стремится создать полностью открытого голосового помощника, который может работать на потребительском оборудовании. 🤖

Чем BUD-E отличается от других проектов голосовых помощников? Согласно Виланду Бренделу, исследователю Института Эллиса и участнику проекта BUD-E, существующие открытые помощники не имеют расширяемой архитектуры, которая бы могла полностью использовать возникающие GenAI-технологии, такие как большие языковые модели (LLM) вроде ChatGPT от OpenAI. Большинство взаимодействий с существующими голосовыми помощниками основаны на интерфейсах чата, которые кажутся неестественными и нескладными. BUD-E стремится изменить это, предоставляя голосового помощника, имитирующего естественную речь и делая его разговоры более увлекательными и похожими на разговоры с живым человеком. 😮

Одной из особенностей BUD-E является стремление LAION обеспечить возможность интеграции каждого компонента голосового помощника без ограничений в приложения и услуги без лицензии, даже коммерческих. Это открывает интересные возможности для разработчиков и бизнесов, которые хотят использовать мощь BUD-E без ограничений. 🚫💰

Разработанный совместно с Институтом Эллиса в Тюбингене, консалтинговой компанией Collabora и Центром искусственного интеллекта в Тюбингене, BUD-E имеет амбициозный план развития. В ближайшие несколько месяцев команда стремится внедрить “эмоциональный интеллект” в BUD-E, позволяя ему проводить разговоры с участием нескольких дикторов. 🗣️

Но какое впечатление производит BUD-E в его текущем состоянии? Пока что он находится на ранних стадиях разработки, и LAION использует несколько открытых моделей, чтобы создать минимально жизнеспособную версию BUD-E (MVP). В настоящий момент пользовательский опыт недостаточно оптимизирован, и BUD-E необходима мощная видеокарта, например Nvidia RTX 4090, чтобы реагировать на команды так же быстро, как коммерческие голосовые помощники, такие как Google Assistant и Alexa. Однако Collabora работает на безвозмездной основе над адаптацией своих открытых моделей распознавания речи и текста в речь WhisperLive и WhisperSpeech для улучшения производительности BUD-E. 👨‍💻

Доступность – еще одно важное соображение для голосовых помощников, и LAION понимает его значимость. Хотя BUD-E не занимается этим вопросом в первую очередь, команда стремится переопределить опыт работы с голосовыми помощниками, прежде чем расширять поддержку для различных акцентов и языков.

LAION имеет некоторые необычные идеи для BUD-E, такие как включение анимированного аватара, олицетворение помощника и даже анализ лиц пользователей с помощью веб-камер, чтобы определить их эмоциональное состояние. Хотя эти идеи звучат заманчиво, они также вызывают этические вопросы, особенно в отношении анализа лиц. Однако LAION заверяет нас, что он строго следует правилам безопасности и этическим руководствам, таким как Закон EU по искусственному интеллекту, чтобы обеспечить прозрачность, справедливость и воспроизводимость в своем процессе разработки.

BUD-E уже доступен для загрузки с GitHub на Ubuntu или персональных компьютерах с Windows (поддержка macOS скоро будет). Хотя это все еще проект в работе, успех LAION в построении сообществ и его партнерство с ведущими научными институтами позволяют надеяться, что BUD-E будет продолжать развиваться и улучшаться со временем.

В заключение, BUD-E является захватывающим шагом вперед в области открытых голосовых помощников. Благодаря своему акценту на расширяемости, естественности речи и бесплатной интеграции, BUD-E может изменить то, как мы взаимодействуем с голосовой технологией. Хотя все еще есть место для улучшений, возникновение BUD-E вызывает интерес и предвкушение его будущих разработок. 🌟

Q&A: Обсуждение дополнительных тем и вопросов

В: Как BUD-E сравнивается с коммерческими голосовыми помощниками, такими как Google Assistant и Alexa?

О: В настоящее время BUD-E находится на ранних стадиях разработки, и его производительность еще не масштабируется с коммерческими голосовыми помощниками. Для достижения времени реакции, сопоставимого с Google Assistant и Alexa, ему требуется мощная видеокарта, например, Nvidia RTX 4090. Однако LAION и его партнеры активно работают над оптимизацией BUD-E и сокращением требований к аппаратному обеспечению, поэтому можно ожидать улучшений в будущем.

В: Поддерживает ли BUD-E языки, отличные от английского?

О: В то время как BUD-E сосредоточен на переопределении опыта голосового помощника, LAION признает важность поддержки различных языков и акцентов. Хотя это не является главным приоритетом в данный момент, LAION стремится расширить возможности BUD-E в области языка в будущем.

В: Как BUD-E обеспечивает конфиденциальность и безопасность данных пользователей?

О: LAION обязуется соблюдать правила безопасности, этические принципы и прозрачность в разработке BUD-E. Она соблюдает правила Европейского союза по искусственному интеллекту, которые устанавливают юридические стандарты для продажи и использования искусственного интеллекта в ЕС, включая приложения искусственного интеллекта, связанные с эмоциями. Предоставляя доступ к своим наборам данных, LAION позволяет широкому научному сообществу вносить вклад в процесс разработки и обеспечивает высочайшие стандарты воспроизводимости.

В: Каковы планы на будущее у BUD-E?

О: У LAION и его партнеров амбициозный план развития BUD-E. В ближайшем будущем они планируют оптимизировать производительность BUD-E, снизить требования к оборудованию и улучшить его задержку. Кроме того, они стремятся создать набор диалогов для настройки BUD-E, разработать механизм памяти для сохранения информации из предыдущих разговоров и создать систему обработки речи, способную работать с несколькими дикторами. Эти усилия способствуют созданию более надежного и естественного голосового помощника — BUD-E.

Ссылки:


Это все, что касается BUD-E – захватывающего голосового помощника с открытым исходным кодом, который стремится изменить наше взаимодействие с голосовыми технологиями. Если вы хотите опробовать BUD-E, перейдите на GitHub и скачайте его. Не забудьте поделиться своими мыслями и впечатлениями от BUD-E в социальных сетях с использованием хэштега #BUD-E. Давайте вместе откроем будущее голосовых помощников! 👏🎉

Примечание: Оригинальный контент был тщательно доработан и дополнен, чтобы предоставить ценные идеи и приятное чтение.