OpenAI усиливает свой инструмент искусственного интеллекта по генерации изображений с помощью DALL-E 3

OpenAI улучшает свой инструмент DALL-E 3 для генерации изображений.

OpenAI представила новое поколение своего инструмента для создания изображений. Известная как DALL-E 3, новая версия разработана для лучшего понимания ваших текстовых описаний и создания более точных и достоверных изображений. На своей новой веб-странице DALL-E 3, OpenAI не раскрыла много информации об инструменте, но дала подсказки о том, как она стремится превзойти своего предшественника DALL-E 2.

DALL-E 3 разработан таким образом, чтобы лучше улавливать нюансы и детали ваших описаний, тем самым создавая более точные изображения, заявила OpenAI. Текущие генераторы изображений на базе искусственного интеллекта иногда игнорируют слова в ваших описаниях, что приводит к изображениям, которые не соответствуют требованиям. Основываясь на изображениях, показанных на странице DALL-E 3, новая версия, похоже, способна создавать более точные, детализированные и фантазийные изображения.

Также: Лучшие генераторы изображений на базе искусственного интеллекта 2023 года

С развитием искусственного интеллекта генераторы изображений стали популярными среди отдельных лиц и бизнеса. Такие инструменты, как DALL-E 2, Bing Image Creator от Microsoft, Midjourney, Stable Diffusion, DreamStudio и Craiyon, работают примерно одинаково. С помощью подсказки вы описываете желаемое созданное изображение. Выбираете стиль и другие атрибуты. В ответ инструмент создает одно или несколько изображений, которые, как надеется пользователь, соответствуют его запросу.

Но, как и многие современные боты на базе искусственного интеллекта, эти генераторы изображений могут быть сложными в использовании. Обычно вам нужно формулировать подсказку именно таким образом. И даже тогда они не всегда правильно интерпретируют ваши запросы. Признавая, что современные системы текст-изображение заставляют вас изучать инженерию подсказок, OpenAI заявила, что DALL-E 3 будет значительным прорывом в создании изображений, которые лучше соответствуют вашим описаниям.

Основанный на ChatGPT, DALL-E 3 будет доступен через платформу ChatGPT. Преимущество здесь заключается в том, что вы сможете использовать ChatGPT для обсуждения своих идей и подсказок для изображений. Затем вы можете предложить запрос на создание изображения, используя простое предложение или более подробный абзац.

Также: Мои два любимых плагина ChatGPT Plus и замечательные вещи, которые я с ними могу делать

В приведенных примерах, представленных на веб-странице DALL-E 3, OpenAI показала, как будет работать новая версия.

Одно изображение было создано на основе следующего описания: “Маленькие короли-картофельчики с величественными коронами, сидящие на троне, наблюдающие за своим огромным картофельным королевством, заполненным картофельными подданными и картофельными замками”.

Второе изображение было создано на основе описания: “Иллюстрация авокадо, сидящего на кресле терапевта и говорящего ‘Я просто чувствую себя таким пустым внутри’, с ямочкой размером с косточку в его центре. Терапевт, ложка, делает пометки”.

И два изображения были созданы на основе описания, которое звучало так: “Экспрессивная масляная живопись баскетболиста, забивающего мяч, изображенного как взрыв небулы”. Одно изображение создано с использованием DALL-E 2, а другое – с использованием DALL-E 3.

OpenAI также подчеркнула, что она ограничила возможность DALL-E 3 создавать насильственный, для взрослых или ненавистный контент, как и в предыдущих версиях. Были внесены улучшения в области безопасности, такие как создание общедоступных лиц и определенных вредоносных предубеждений. Например, инструмент будет отклонять запросы, которые просят указать публичную фигуру по имени.

Также: Кому принадлежат код, изображения и сюжеты, созданные ИИ?

Изображения, созданные искусственным интеллектом, также могут вызвать проблемы, когда они используются для изображения реального человека или события, вводя людей в заблуждение и заставляя их думать, что изображение является реальным. Чтобы бороться с этой проблемой, OpenAI заявила, что тестирует новый внутренний инструмент, который может определить, создано ли изображение DALL-E 3 или нет.

На данный момент DALL-E 3 находится в закрытом тестировании и планируется выпуск для клиентов ChatGPT Plus и Enterprise в начале октября.