Священный Грааль’ Компании Qualcomm Генеративный искусственный интеллект скоро появится на телефонах

Qualcomm's 'Sacred Grail' of Generative Artificial Intelligence to soon appear on phones.

Генеративный искусственный интеллект, такой как ChatGPT и Midjourney, поразил воображение и нарушил индустрии, но их дебют в основном ограничивался окнами браузера на настольных компьютерах. В следующем году вы сможете использовать генеративный искусственный интеллект в пути, когда премиальные телефоны выйдут с флагманскими чипами Qualcomm внутри.

Телефоны уже несколько лет используют искусственный интеллект для улучшения фотографий и автокоррекции, но инструменты генеративного искусственного интеллекта могут принести следующий уровень улучшений к мобильному опыту. Qualcomm встраивает генеративный искусственный интеллект в свое следующее поколение премиальных чипов, которые должны дебютировать на ежегодной конференции Qualcomm Summit в Гавайях в конце октября.

Участники конференции смогут на собственном опыте увидеть, что принесет генеративный искусственный интеллект на телефоны, но вице-президент по управлению продуктами Qualcomm Зиад Асгар рассказал ENBLE, почему пользователям следует радоваться наличию искусственного интеллекта на устройстве. Во-первых, доступ к данным пользователя – данные о поездках, поиске ресторанов, фотографии и т. д. – в одном месте позволит создаваемым искусственным интеллектом решениям на вашем телефоне быть гораздо более настроенными и полезными, чем общие ответы от генеративного искусственного интеллекта, работающего на основе облачных вычислений.

“Я думаю, это будет священный Грааль”, – сказал Асгар. “Это истинное обещание, которое заставляет нас действительно волноваться, куда может пойти эта технология”.

Использование генеративного искусственного интеллекта на устройстве также имеет другие преимущества. Прежде всего, запросы и личные данные, которые были найдены, сохраняются в безопасности и не передаются через удаленный сервер. Использование локального искусственного интеллекта также быстрее, чем ожидание вычислений в облаке, и он может работать во время путешествий на самолете или в других областях, где отсутствует сотовая связь.

Но использование решения на устройстве также имеет смысл с точки зрения бизнеса и эффективности. Как объяснила Qualcomm в опубликованной в прошлом месяце белой книге, с увеличением сложности моделей машинного обучения (от сотен тысяч параметров до миллиардов) стало дороже запускать серверы для ответов на запросы. В апреле OpenAI было оценено, что ежедневно тратится около 700 000 долларов на ChatGPT для ответа на запросы, и эта оценка была основана на модели GPT-3, а не на более сложной и, вероятно, более дорогостоящей модели GPT-4. Вместо того, чтобы иметь целую ферму серверов, решением Qualcomm является использование существующего кремниевого мозга устройства для выполнения всех необходимых вычислений – без дополнительных затрат.

“Запуск искусственного интеллекта на вашем телефоне фактически бесплатен – вы заплатили за вычислительную мощность заранее”, – сказал аналитик Techsponential Ави Грингарт в электронной почте ENBLE.

Грингарт видел работу генеративного искусственного интеллекта на устройстве Qualcomm, когда производитель чипов продемонстрировал его на выставке Mobile World Congress в феврале, используя смартфон на базе Android с процессором Snapdragon 8 Gen 2 для работы с программным обеспечением по генерации изображений Stable Diffusion. Несмотря на то, что это была ранняя демонстрация, он нашел ее “чрезвычайно захватывающей”.

Чипсет Snapdragon 8 Gen 2.

Дэвид Ламб/CNET

Какие возможности предоставляет генеративный искусственный интеллект для пользователей

У Qualcomm есть идеи о том, что люди могут делать с генеративным искусственным интеллектом на телефонах, улучшая все, начиная от задач повышения продуктивности до просмотра развлекательных материалов и создания контента.

Как показала демонстрация Stable Diffusion, генеративный искусственный интеллект на устройстве может позволить людям настраивать изображения по команде, например, просить изменить фон так, чтобы вас поместить перед венецианскими каналами, как сказал Асгар. Или они могут создать совершенно новое изображение – но это только начало, так как текст и визуальные модели обучения могут последовательно работать от идеи до готового результата.

Используя несколько моделей, сказал Асгар, пользователь может сделать так, чтобы его речь была переведена автоматическим распознаванием речи в текст, который затем подается на вход генератору изображений. Придумайте еще что-нибудь и пусть ваш телефон воспроизводит лицо человека, используя генеративный искусственный интеллект для создания реалистичных движений губ и текст в речь для общения с вами, и вуаля, у вас есть генеративный искусственный интеллект, основанный на виртуальном помощнике, с которым можно вести полноценные разговоры.

Этот конкретный пример может быть реализован с помощью стороннего искусственного интеллекта, такого как недавно запущенная крупная языковая модель Llama 2 от компании Meta, входящей в состав Facebook, в партнерстве с Microsoft, а также с Qualcomm.

“[Llama 2] позволит клиентам, партнерам и разработчикам создавать такие сценарии использования, как интеллектуальные виртуальные помощники, приложения для повышения продуктивности, инструменты для создания контента, развлекательные материалы и многое другое”, – говорится в пресс-релизе Qualcomm. “Эти новые опыты работы с искусственным интеллектом на устройстве, основанные на Snapdragon, могут работать в областях без подключения или даже в авиарежиме”.

Внутри музея Qualcomm HQ с предварительной записью, наполненного ретро-телефонами

Qualcomm не ограничит эти функции только для телефонов. На предстоящем саммите компания планирует объявить о генеративных решениях искусственного интеллекта для ПК и автомобилей. Этот персональный помощник может помочь вам с вашими списками дел, планированием встреч и отправкой электронных писем. Если вы застряли за пределами офиса и вам нужно сделать презентацию, Асгар сказал, что искусственный интеллект может создать новый фон, чтобы не выглядело так, будто вы сидите в машине, и показать слайды (или даже помочь их презентовать).

“Для тех из нас, кто вырос, смотря сериал “Рыцарь дорог”, ну, КИТТ теперь станет реальностью”, – сказал Асгар, отсылаясь к знаменитому умному автомобилю из сериала.

Независимо от платформы, основное генеративное решение искусственного интеллекта будет работать на устройстве. Оно может помочь в офисной работе, например, автоматически генерировать заметки по звонку и создавать пятислайдовую презентацию, подводящую итоги ключевых моментов (“Это как Клиппи, но на стероидах, верно?” – сказал Асгар). Или оно может создавать цифровые миры с нуля в дополненной и виртуальной реальности.

Помимо фантастических миров, генеративный искусственный интеллект может помочь слепым людям ориентироваться в реальном мире. Асгар описал ситуацию, когда модель изображение-3D-изображение-текст-в-речь может использовать камеру телефона, чтобы распознать, когда пользователь находится на перекрестке, и сообщить ему, когда нужно остановиться, а также сколько машин приближается с разных направлений.

В образовательной сфере – возможно, с использованием веб-камеры или камеры телефона – генеративный искусственный интеллект может оценить, насколько хорошо студенты усваивают учебный материал, например, отслеживая их выражения и мимику. Затем генеративный искусственный интеллект может настроить материал под сильные и слабые стороны каждого студента, предположил Асгар.

Это все предсказания Qualcomm, но третьи стороны должны решить, как лучше использовать технологию для улучшения своих продуктов и услуг. Для телефонов генеративный искусственный интеллект может оказать реальное влияние, когда он будет интегрирован с мобильными приложениями для более индивидуальных игровых впечатлений, социальных медиа и создания контента, – сказал Грингарт из Techsponential.

Трудно сказать, что это значит для пользователей, пока разработчики приложений не получат доступ к генеративному искусственному интеллекту и не начнут интегрировать его в свои приложения. Легче предположить, что он может делать, исходя из того, как искусственный интеллект помогает людям сейчас. Роджер Энтнер, аналитик Recon Analytics, предсказывает, что генеративный искусственный интеллект поможет исправлять недостатки неоптимальных фотографий, создавать фильтры для социальных медиа и улучшать автозамену – проблемы, которые существуют уже сейчас.

Чип Snapdragon 8 Gen 2, заключенный в красный пакет перед установкой на тестовую плату.

Дэвид Ламб / ENBLE

Генеративный искусственный интеллект приходит на премиальные телефоны первыми

Текущие генеративные решения искусственного интеллекта полагаются на большие серверные фермы для обработки запросов в масштабе, но Qualcomm уверен, что его собственные чипы на устройстве справятся с потребностями одного пользователя. В лабораториях Асгара чипы компании обрабатывали модели искусственного интеллекта с 7 миллиардами параметров (аспектов, которые оценивают данные и изменяют тональность или точность их вывода), что значительно меньше, чем 175 миллиардов параметров модели GPT-3 от OpenAI, которая используется в ChatGPT, но должно подходить для мобильного поиска.

“Мы сможем продемонстрировать это на устройстве на саммите в [Гавайях]”, – сказал Асгар.

Демонстрационное устройство, вероятно, будет оснащено следующим флагманским чипом Qualcomm, предположительно Snapdragon 8 Gen 3, который появится в премиальных Android-телефонах следующего года. Демонстрационное устройство, работающее на MWC 2023, использовало Snapdragon 8 Gen 2, анонсированный на прошлогоднем саммите Snapdragon в Гавайях.

В эпоху, когда телефоны едва хватает на день до необходимости зарядки, также возникают опасения, что вызов генеративного искусственного интеллекта в течение дня будет еще быстрее разряжать батарею. Нам придется подождать результатов тестов в реальных условиях, чтобы увидеть, как телефоны реализуют и оптимизируют эту технологию, но Асгар указал, что демонстрационное устройство на MWC 2023 работало с запросами для участников весь день и не истощило батарею и даже не нагрелось до ощутимой температуры. Он считает, что чипы Qualcomm уникально способны обрабатывать генеративный искусственный интеллект, в основном используя процессор Hexagon и нейронную обработку Snapdragon, с “очень низким энергопотреблением”.

“Я думаю, что это вызовет беспокойство у тех, у кого нет специального оборудования для обработки”, – сказал Асгар.

Асгар считает, что следующие премиальные Android-телефоны, оснащенные кремнием Qualcomm, смогут использовать генеративный искусственный интеллект. Однако потребуется некоторое время, чтобы эта технология стала доступна на более дешевых телефонах. Подобно тому, как на текущих телефонах помощь искусственного интеллекта в очистке изображений, аудио и видео лучше всего работает на топовых моделях и становится менее эффективной на более дешевых телефонах, возможности генеративного искусственного интеллекта будут меньше (но все еще присутствуют) на моделях чипов Qualcomm нижнего уровня.

“Возможно, вы сможете использовать модель с 10 миллиардами плюс параметров на премиальной модели, а на следующем уровне она может быть меньше, если вы находитесь ниже этого уровня, то она может быть еще меньше”, – сказал Асгар. “Таким образом, это будет плавное снижение качества этих возможностей, но они также распространятся на другие продукты”.

Как и с 5G, Qualcomm может быть первой компанией, внедрившей новую технологию генеративного искусственного интеллекта, но не последней. Apple тихо улучшает свой встроенный искусственный интеллект, и старший вице-президент по программному обеспечению Крэйг Федериги отметил в беседе после конференции разработчиков Worldwide Developers Conference, что они заменили более мощную модель языка-трансформера, чтобы улучшить автокоррекцию. По сообщениям, Apple даже тестирует своего собственного внутреннего чат-бота “Apple GPT”. Говорят, что технологический гигант разрабатывает свою собственную платформу для создания больших языковых моделей, чтобы конкурировать в области искусственного интеллекта, которая набирает обороты с момента публичного релиза ChatGPT компании OpenAI в конце 2022 года.

Смотрите это:

Искусственный интеллект Apple может вступить в борьбу с искусственным интеллектом Bard от Google и искусственным интеллектом Bing от Microsoft, которые в этом году имели ограниченный выпуск для публичного тестирования. Они следуют более традиционной модели “интеллектуального чат-бота” генеративного искусственного интеллекта для улучшения программного обеспечения, но возможно, они появятся на телефонах через приложения или будут доступны через веб-браузер. Google и Microsoft уже интегрируют генеративный искусственный интеллект в свои продуктивные платформы, поэтому пользователи, скорее всего, увидят их усилия в первую очередь в мобильных версиях Google Docs или Microsoft Office.

Но для большинства владельцев телефонов генеративный искусственный интеллект на базе чипов Qualcomm может стать первым значимым использованием новой технологии. Придется подождать Snapdragon Summit, чтобы увидеть, насколько наша мобильная экспериенция может измениться уже в следующем году.