OpenAI Dall-E 3 – это генератор искусства, работающий на основе ChatGPT.

OpenAI Dall-E 3 - генератор искусства, основанный на ChatGPT.

OpenAI объявила о Dall-E 3, своем последнем инструменте искусственного интеллекта. Он использует популярного чат-бота OpenAI, ChatGPT, для создания более сложных и тщательно составленных произведений искусства путем автоматического расширения исходной информации таким образом, чтобы генератор получал более подробные и последовательные указания.

Новшеством в Dall-E 3 является то, что он упрощает процесс совершенствования текста, подаваемого на вход программе, и позволяет пользователям вносить изменения через разговорный интерфейс ChatGPT. Этот новый инструмент может снизить порог для создания сложного искусства с использованием ИИ и помочь OpenAI оставаться впереди конкурентов благодаря улучшенным возможностям его чат-бота.

AI Art с любезного разрешения OpenAI

Возьмем, к примеру, это изображение короля картофелей.

Такой необычный искусственный интеллект, созданный с помощью ИИ, стал обычным на социальных медиа благодаря ряду инструментов, которые превращают текстовые подсказки в визуальные композиции. Но в этом случае ChatGPT оказал существенную помощь в создании более детальных подсказок и инструкций по правильной композиции.

Это означает значительный шаг вперед не только для Dall-E, но и для генеративного искусства, в целом. Dall-E, названный в честь персонажа из фильма Pixar “ВАЛЛ-И” и художника Сальвадора Дали, был анонсирован в 2021 году и запущен в 2022 году. Он представляет собой алгоритм, питаемый огромным количеством размеченных изображений, собранных из Интернета и других источников. Он использует так называемую модель диффузии для предсказания, как изобразить изображение с заданной подсказкой. При достаточно большом объеме данных это может создавать сложные, последовательные и эстетически приятные изображения. Отличие Dall-E 3 заключается в способе взаимодействия между людьми и машинами.

AI Art с любезного разрешения OpenAI

Это изображение, созданное Dall-E 3, показывает, как использование ChatGPT для заполнения подсказки приводит к более последовательному и сложному изображению. Обычно это требует множества попыток создания сложных подсказок для создания чего-то сложного. Но с Dall-E 3 ChatGPT берет на себя работу по созданию более сложной подсказки.

AI Art с любезного разрешения OpenAI

Dall-E 3 создало это изображение в ответ на следующую подсказку: “Иллюстрация человеческого сердца из прозрачного стекла, стоящего на пьедестале среди бурного моря. Лучи солнца проникают сквозь облака, освещая сердце и раскрывая внутри него маленькую вселенную. На горизонте выгравирована цитата ‘Найди вселенную внутри себя'”.

С помощью Dall-E 3 пользователи также могут улучшать созданные произведения через ChatGPT, будто обращаясь к настоящему художнику с просьбой о внесении изменений. “Вам не нужно заморачиваться с длинными подсказками”, – говорит Адитья Рамеш, ведущий исследователь и руководитель команды Dall-E. “Вместо этого, вы можете взаимодействовать с ChatGPT так, как будто разговариваете с коллегой”.

Габриэль Го, ведущий исследователь команды Dall-E, продемонстрировал этот прием ENBLE, попросив Dall-E 3 создать несколько рекламных плакатов для вымышленного ресторана с лапшой. После представления нескольких вариантов Го попросил Dall-E 3, через ChatGPT, превратить один из них в иллюстрацию вывески, размещенной за пределами ресторана.

Dall-E 3 уже доступен через ChatGPT Plus, платную версию чат-бота.

В 2022 году появление множества генераторов искусственного интеллекта стало началом более широкого генеративного ИИ-бума. Многие из первых генераторов были грубыми и не могли усовершенствовать или изменять изображения. Помимо OpenAI, стартапы, такие как Midjourney, Stable Diffusion и Ideogram, привлекли значительные инвестиции и общественный интерес. Однако использование этих систем искусственного интеллекта также вызывает опасения, что профессиональные художники могут быть вытеснены, и о том, как компании-разработчики ИИ используют защищенные авторские материалы для обучения своих алгоритмов.

В ответ на этот конфликт, OpenAI также объявила сегодня, что запустит способ, позволяющий художникам удалять свои работы из будущих обучающих запусков. Dall-E 3 также предотвратит возможность пользователей попытаться создать произведение искусства в стиле известного художника, обнаруживая, когда это включено в подсказку.

OpenAI также имеет механизмы защиты, чтобы блокировать пользователей от генерации порнографического или графически насильственного искусства, или изображений с общеизвестными личностями. Сандхини Агарвал, исследователь политики в OpenAI, говорит, что новая версия Dall-E прошла еще больше “красных испытаний”, которые включают в себя попытки исследователей обойти ее защитные ограждения. “Очень явный запрос на вызывающий контент, это то, что должно пройти через классификатор и будет отклонено”, – говорит Агарвал. Конечно, некоторые программисты создали генераторы изображений с открытым исходным кодом без каких-либо ограничений.

Одним из наиболее заметных результатов бума в искусстве, созданном с помощью ИИ, являются сюрреалистические образы, которые наводняют социальные сети. Следующее изображение было создано с использованием Dall-E 3 с помощью ChatGPT, с использованием следующей подсказки: “Перед зрителем раскинулся обширный пейзаж, полностью состоящий из различных видов мяса. Нежные, сочные холмы жареной говядины, деревья из куриной ножки, реки из бекона и валуны из ветчины создают сюрреалистическую, но аппетитную картину. Небо украшено пепперони-солнцем и салями-облаками.”

AI Art Courtesy of OpenAI