Шаг в сторону, Bing Image Creator! Google объявляет о новом инструменте для создания изображений с помощью искусственного интеллекта

Шаг вперед, создатель изображений Bing! Google представляет новый инструмент для создания изображений с помощью искусственного интеллекта

На сегодняшний день эксперимент по поиску Google с использованием искусственного интеллекта, названный SGE, является многомодальным. Вслед за выпуском DALL-E 3 от OpenAI и Bing Image Creator от Microsoft, SGE Google теперь имеет свой собственный инструмент для генерации изображений с помощью ИИ.

С помощью моделей размытия текста в изображение Imagen от Google, пользователи с доступом к SGE могут описать желаемое изображение, и в течение нескольких секунд SGE предложит им выбрать из четырех вариантов. Затем пользователи могут дополнительно отредактировать описание для тонкой настройки желаемого изображения. В примере от Google исходный запрос состоял в создании необычного изображения капибары в шляпе повара, приготовляющей бекон. Пользователи могут отредактировать описание так, чтобы капибара готовила хэшбрауны вместо этого.

В борьбе за первенство в области искусственного интеллекта, мультимодальность является заветной стратегической территорией. Мультимодальность относится к способности модели ИИ понимать и обрабатывать разные типы медиа, включая изображения и звук.

Разговор чат-бота на ИИ с пользователями – это одно, но “видение” и “слышание” и создание креативных продуктов – это совершенно новый уровень сложности ИИ. Недавно OpenAI выпустила последнюю версию своего инструмента для генерации изображений DALL-E 3. Microsoft, являющийся инвестором OpenAI, теперь использует DALL-E 3 для Bing Image Creator. И теперь Google представляет свою собственную версию в SGE.

Общедоступный доступ к инструментам генерации изображений на основе ИИ не обходится без основных проблем, включая распространение неправдивой информации и нарушения авторских прав. SGE была обучена блокировать вредный или вводящий в заблуждение контент, нарушающий политику создания ИИ Google, и она не будет создавать изображения с реалистичными людскими лицами. Более того, изображение известной публичной личности (например, знаменитости) будет заблокировано в результатах генерации изображений, что предотвратит возможные дипфейки. Кроме того, этот инструмент предназначен для пользователей в возрасте 18 лет и старше.

Изображения, созданные SGE, будут содержать метаданные и водяные знаки, указывающие, что они созданы с помощью ИИ. Кроме того, модели Imagen от Google были обучены на публично доступном контенте. ENBLE спросил Google, используются ли данные пользователей из текстовых указаний и сгенерированных изображений для обучения модели. Мы также спросили, есть ли возможность отказаться от этого. Мы обновим эту историю, когда получим ответ.

Также в SGE появилась возможность создания письменного контента. Эта функция такая же, как в чат-боте Bard от Google, но теперь ее можно использовать прямо в поисковой функции SGE, что позволяет вам экономить время, переключаясь между окнами.

Возможность создания сообщения с использованием генеративного ИИ в функции SGE Google

Возможность создания изображений и написания сообщений внутри SGE сегодня вводится на английском языке для пользователей США.