Amazon улучшает Alexa для эры ChatGPT

Amazon improves Alexa for the ChatGPT era

Когда Amazon запустил виртуального помощника Alexa девять лет назад, его способность распознавать голосовые команды для установки таймера или воспроизведения песни казалась почти волшебной. Сегодня стандарты для впечатляющих языковых навыков гораздо выше благодаря ChatGPT от OpenAI. Amazon предоставляет своему голосовому помощнику новую версию, которая использует технологию, стоящую за новой волной чат-ботов, способных вести весьма живые разговоры.

Amazon объявил об обновлении Alexa на мероприятии, проведенном в его втором штаб-квартире в Арлингтоне, штат Вирджиния. Помощник будет отвечать на более сложные вопросы и вести более свободный и продолжительный разговор, не требуя от пользователей говорить “Алекса …” каждый раз.

Через несколько недель пользователи, которые скажут “Алекса, давай поболтаем”, получат доступ к новому помощнику с более широкими возможностями. Amazon называет это “ранним превью”, поскольку новые возможности остаются в процессе разработки.

Демонстрации, проведенные на сцене в среду, показали, что Alexa проявляет больше симулированной личности с помощью интонации и попыток юмора. В видеороликах показывалось, как люди просили Alexa написать стихи на тему, разрабатывать идеи для вечера свидания и генерировать историю о желе. Устройства, оснащенные камерами, такие как Echo Show, будут пытаться определить, когда человек ожидает, что Alexa продолжит разговор, и когда разговор закончен.

Новая Alexa также будет изменять свой голос, чтобы создать более естественную обратную связь. “Если я спрошу Alexa, как ведут себя Red Sox, и они только что проиграли, она ответит с сочувствующим тоном”, – говорит Рохит Прасад, руководитель разработки искусственного интеллекта в Amazon, который базируется в Кембридже, штат Массачусетс.

По словам Прасада, развитие языковых навыков Alexa требовало обширной инженерной работы, потому что большие языковые модели, которые поддерживают службы, такие как ChatGPT, могут выдавать вымыслы, несусветную чушь и быть вообще неприемлемыми. “Особенно учитывая определенные ограничения языковых моделей, это огромный скачок”, – говорит Прасад.

Юстин Касселл, профессор Карнеги-Меллонского университета, изучающий взаимодействие людей с AI-агентами, говорит, что будет интересно увидеть, как люди отреагируют на голосового чат-бота, способного давать более разнообразные ответы. “Цели замечательны, и я с нетерпением жду, что они сделают”, – говорит она.

Однако Касселл говорит, что некоторые вещи, которые обещает Amazon, например, реагирование на язык тела, остаются чрезвычайно сложными. “У языка тела нет грамматики, подобной говоримому и письменному языку”, – говорит она. Если Alexa неправильно прочитает позу или движения человека и даст неправильный ответ, могут возникнуть неловкие ситуации. Касселл говорит, что даже если Alexa станет более свободной в своих ответах, ее усилия по имитации человеческой личности и чувств через такие характеристики, как интонация, вряд ли смогут сравниться с человеческими возможностями еще некоторое время. Ожидайте, что новая Alexa иногда будет казаться неловкой в своих ответах.

Amazon говорит, что пользователи смогут подать заявку на получение дополнительного теста новой технологии, где новые возможности Alexa можно будет использовать для управления другими устройствами, включая не изготовленные Amazon. В будущем компания планирует добавить новые функции в Alexa, возможно, включая возможность обсуждать и рекомендовать продукты из обширного ассортимента компании.

Если Alexa сможет отвечать на более сложные запросы, избежав неловких ошибок, это может предвещать более широкое и очень необходимое обновление возможностей голосовых помощников.

Когда Amazon запустил Alexa в 2014 году, он помог создать новую категорию персонального компьютера, основанного на голосовом взаимодействии, что вызвало прогнозы о том, что голосовые интерфейсы вскоре станут доминирующими. Alexa и Siri от Apple получили преимущества от прогресса в машинном обучении, который, наконец, позволил устройствам надежно распознавать и отвечать на голос пользователя. Однако сложность языка ограничила эти устройства только простыми командами и не позволила им вести настоящий разговор. Тем не менее, Amazon говорит, что по всему миру продано более полумиллиарда устройств с Alexa.

Появление больших языковых моделей, обученных на огромных объемах текста, наконец, создало алгоритмы, которые могут обрабатывать более сложный диалог. ChatGPT и другие чат-боты поразили как экспертов, так и широкую публику своей гибкостью и разговорчивостью, хотя они склонны выдавать заявления, которые могут быть ложными, предвзятыми или даже оскорбительными.

По словам Прасада, Amazon разработал новую передовую модель большого языка, чтобы оживить Alexa. Он говорит, что компания настроила эту модель для фраз, соответствующих голосовому разговору, и использует дополнительные алгоритмы для помощи в распознавании языка тела и интонации.

Одной из больших проблем для Amazon может оказаться обработка неожиданных ошибок, возникающих при использовании больших языковых моделей. Когда Microsoft добавил продвинутый AI-чат-бот в свой поисковый движок Bing, пользователи быстро обнаружили некоторое странное поведение. “Он на 100 процентов идеален? Нет”, – говорит Прасад. “Вот почему это раннее превью, потому что будут случайные ошибки.”

Прадас говорит, что Amazon уже разработал ограничения, чтобы предотвратить Alexa от сбивания с пути. Он добавляет, что некоторые будут напоминать людям, что они разговаривают с машиной, и стараться избежать того, чтобы помощник выглядел слишком похожим на человека. Некоторые пользователи чатботов формируют сильные эмоциональные и даже романтические связи с имитационными личностями, с которыми они взаимодействуют. Прадас добавляет, что Amazon проводит исследования по долгосрочным рискам, которые могут возникнуть из-за дальнейшего прогресса в области искусственного интеллекта.