OpenAI усиливает свой инструмент искусственного интеллекта по генерации изображений с помощью DALL-E 3
OpenAI улучшает свой инструмент DALL-E 3 для генерации изображений.
![](https://www.zdnet.com/a/img/resize/1174ddb4b7d4c8a864e9aef3cf00ce9168435e75/2023/09/21/7a5804cc-4aa2-4589-9137-2bc19f13f543/figure-top-openai-beefs-up-its-image-generating-ai-tool-with-dall-e-3.jpg?auto=webp&width=1280)
OpenAI представила новое поколение своего инструмента для создания изображений. Известная как DALL-E 3, новая версия разработана для лучшего понимания ваших текстовых описаний и создания более точных и достоверных изображений. На своей новой веб-странице DALL-E 3, OpenAI не раскрыла много информации об инструменте, но дала подсказки о том, как она стремится превзойти своего предшественника DALL-E 2.
DALL-E 3 разработан таким образом, чтобы лучше улавливать нюансы и детали ваших описаний, тем самым создавая более точные изображения, заявила OpenAI. Текущие генераторы изображений на базе искусственного интеллекта иногда игнорируют слова в ваших описаниях, что приводит к изображениям, которые не соответствуют требованиям. Основываясь на изображениях, показанных на странице DALL-E 3, новая версия, похоже, способна создавать более точные, детализированные и фантазийные изображения.
Также: Лучшие генераторы изображений на базе искусственного интеллекта 2023 года
С развитием искусственного интеллекта генераторы изображений стали популярными среди отдельных лиц и бизнеса. Такие инструменты, как DALL-E 2, Bing Image Creator от Microsoft, Midjourney, Stable Diffusion, DreamStudio и Craiyon, работают примерно одинаково. С помощью подсказки вы описываете желаемое созданное изображение. Выбираете стиль и другие атрибуты. В ответ инструмент создает одно или несколько изображений, которые, как надеется пользователь, соответствуют его запросу.
Но, как и многие современные боты на базе искусственного интеллекта, эти генераторы изображений могут быть сложными в использовании. Обычно вам нужно формулировать подсказку именно таким образом. И даже тогда они не всегда правильно интерпретируют ваши запросы. Признавая, что современные системы текст-изображение заставляют вас изучать инженерию подсказок, OpenAI заявила, что DALL-E 3 будет значительным прорывом в создании изображений, которые лучше соответствуют вашим описаниям.
- Ecovacs объявила о новом робот-пылесосе, который конкурирует с друг...
- Лучшие интернет-сделки на сентябрь 2023 года | ENBLE
- Сделки Новые наушники AirPods Pro 2 с USB-C уже в продаже за $199.9...
Основанный на ChatGPT, DALL-E 3 будет доступен через платформу ChatGPT. Преимущество здесь заключается в том, что вы сможете использовать ChatGPT для обсуждения своих идей и подсказок для изображений. Затем вы можете предложить запрос на создание изображения, используя простое предложение или более подробный абзац.
Также: Мои два любимых плагина ChatGPT Plus и замечательные вещи, которые я с ними могу делать
В приведенных примерах, представленных на веб-странице DALL-E 3, OpenAI показала, как будет работать новая версия.
Одно изображение было создано на основе следующего описания: “Маленькие короли-картофельчики с величественными коронами, сидящие на троне, наблюдающие за своим огромным картофельным королевством, заполненным картофельными подданными и картофельными замками”.
Второе изображение было создано на основе описания: “Иллюстрация авокадо, сидящего на кресле терапевта и говорящего ‘Я просто чувствую себя таким пустым внутри’, с ямочкой размером с косточку в его центре. Терапевт, ложка, делает пометки”.
И два изображения были созданы на основе описания, которое звучало так: “Экспрессивная масляная живопись баскетболиста, забивающего мяч, изображенного как взрыв небулы”. Одно изображение создано с использованием DALL-E 2, а другое – с использованием DALL-E 3.
OpenAI также подчеркнула, что она ограничила возможность DALL-E 3 создавать насильственный, для взрослых или ненавистный контент, как и в предыдущих версиях. Были внесены улучшения в области безопасности, такие как создание общедоступных лиц и определенных вредоносных предубеждений. Например, инструмент будет отклонять запросы, которые просят указать публичную фигуру по имени.
Также: Кому принадлежат код, изображения и сюжеты, созданные ИИ?
Изображения, созданные искусственным интеллектом, также могут вызвать проблемы, когда они используются для изображения реального человека или события, вводя людей в заблуждение и заставляя их думать, что изображение является реальным. Чтобы бороться с этой проблемой, OpenAI заявила, что тестирует новый внутренний инструмент, который может определить, создано ли изображение DALL-E 3 или нет.
На данный момент DALL-E 3 находится в закрытом тестировании и планируется выпуск для клиентов ChatGPT Plus и Enterprise в начале октября.