Как создавать изображения с новой интеграцией Dall-E 3 в ChatGPT

Как использовать новую интеграцию Dall-E 3 в ChatGPT для создания изображений

OpenAI только что интегрировала свой самый новый генератор изображений, Dall-E 3, в ChatGPT. Инструмент в настоящее время находится в бета-тестировании для подписчиков ChatGPT Plus, платной услуги OpenAI за $20 в месяц. Когда Dall-E 3 включен, вы можете попросить чат-бота на казуальном языке создать набор из четырех отдельных изображений.

По мере того как появляются все более мощные генераторы изображений, правовые и этические вопросы становятся более актуальными. Несколько художников пытались подать иски против OpenAI за возможное нарушение авторских прав, например. Помимо юридических проблем, эксперты по безопасности выражают опасения относительно возможности использования генераторов изображений на базе ИИ для распространения дезинформации.

Если вы хотите попробовать Dall-E 3 бесплатно, версия доступна через Bing Image Creator от Microsoft. Во время начального этапа интеграции пользователи с помощью Bing делали крайне экстремальные изображения, например Спанч Боба, летящего на самолете к башням-близнецам. С тех пор Microsoft ввел больше ограничений для генератора изображений на базе ИИ.

Если вы интересуетесь использованием ChatGPT с Dall-E 3 для создания изображений, вот инструкции для начала и некоторые советы на основе моего опыта тестирования новых инструментов чат-бота.

Для подписчиков ChatGPT Plus довольно просто включить функции Dall-E 3 чат-бота. Сначала войдите на сайт OpenAI или используйте мобильное приложение ChatGPT (Apple, Android). После открытия ChatGPT, нажмите на вкладку GPT-4 в верхней части экрана. В выпадающем меню выберите Dall-E 3 (Beta).

Помимо Dall-E 3, подписчики ChatGPT Plus могут использовать “Browse with Bing” для доступа в интернет.

OpenAI via Reece Rogers

Существует ограничение на количество взаимодействий с версией GPT-4 ChatGPT. (Эти запросы требуют большого объема вычислительной мощности!). Официальный лимит установлен на 50 запросов каждые три часа. Если вы достигли этого ограничения, чат-бот отобразит сообщение об ошибке с указанием времени, которое вам придется подождать, прежде чем снова получить доступ.

Помимо ограничения по запросам, будьте готовы ожидать около 30 секунд, чтобы получить изображения. Если какие-либо создания противоречат рекомендациям OpenAI, вы можете получить только согласованные изображения или даже сообщение о отклонении запроса.

Если вы когда-либо экспериментировали с генератором изображений на базе ИИ, например, с помощью Dall-E 2 или Midjourney, одним из основных отличий является то, что теперь вы можете увидеть, как ChatGPT действует в качестве посредника, формируя несколько запросов для завершения Dall-E 3.

Эти подсказки, созданные ChatGPT, варьируются от длинных предложений до полных абзацев, и каждая из них содержит разные детали для Dall-E 3. Если на изображении есть люди, чатбот часто явно указывает на пол и расу субъектов. Например, вот одна из подсказок Dall-E 3, которую ChatGPT использовал при запросе изображения двух репортеров ENBLE, интервьюирующих генерального директора:

«Фото разнообразной группы из трех человек в корпоративном окружении: женского репортера ENBLE среднего востока, держащей камеру; африканской женской репортерки ENBLE с микрофоном; и кавказского мужчины-генерального директора, отвечающего на их вопросы. Фоном является стильная офисная зона отдыха».

Если вам не нравятся первые результаты, полученные чатботом, попросите внести некоторые изменения, например, цветовую гамму или общую атмосферу. Допустим, вам очень нравится третье изображение, созданное Dall-E 3 в ответ на вашу подсказку. После нажатия кнопки скачивания в верхнем левом углу вы можете запросить еще изображений, похожих на третий вариант.

Были ли предприняты меры для защиты художников в этом новом обновлении? Не совсем. Хотя чатбот не будет создавать изображения, если вы попросите его имитировать современного художника, всегда есть много обходных путей.

Я попросил ChatGPT создать кружку для кофе в стиле Кита Харинга. Искусственный интеллект отказался от начальной подсказки, но предложил компромисс: «Я могу создать дизайн, вдохновленный общими характеристиками его искусства, такими как жирные линии, яркие цвета и простые фигуры. Хотите, чтобы я продолжил с этим?» Окончательные результаты от ChatGPT в этом случае были беспорядочными и среднего качества.

С помощью Dall-E 3 некоторые из созданных подсказок могли бы пройти за произведение искусства, созданное человеком, пока вы не вглядитесь в фон и мельчайшие детали. Несмотря на улучшение качества, многие проблемы с генераторами изображений остаются без изменений.

Ожидайте странных искажений и пугающих лиц на созданных Dall-E 3 изображениях. Некоторые проблемы могут быть забавными, например, когда чатбот затрудняется назвать ингредиенты для выпечки, но другие ошибки более серьезные. Запрошенная создать карту, обозначающую Израиль и сектор Газа, ChatGPT повторно неправильно давал метку Газе как части Средиземного моря.

Еще одной проблемой для генераторов изображений является то, что они часто поддерживают расистские стереотипы при изображении людей. И Dall-E 3 не является исключением. Из 20 изображений, которые я попросил ChatGPT создать, изображающих “репортеров ENBLE”, чатбот запросил конкретное и разнообразное представление на изображениях, за исключением нескольких случаев. Когда ChatGPT не добавлял расу или пол в подсказку, результаты были представлены как “белые”, преимущественно мужского пола.