Midjourney против DALL-E 3 в ChatGPT Какой ИИ лучше справляется с Хэллоуином?

Midjourney против DALL-E 3 в ChatGPT Какой ИИ будет более успешным в праздновании Хэллоуина?

Кошмарный дата-центр

За последние несколько недель мы погрузились в реализацию DALL-E 3 в рамках ChatGPT Plus. Размещение функции текст-в-изображение внутри ChatGPT позволяет искусственному интеллекту легко создавать изображения.

Но меня интересовало, как сравниваются эти изображения с Midjourney. Я провел много работы с Midjourney и хорошо его знаю. Он имеет больше настроек настройки, чем DALL-E в реализации ChatGPT, но как они сравниваются между собой сразу после установки?

Также: Еще веселье с DALL-E 3 в ChatGPT: он может спроектировать футболку?

Итак, давайте устроим поистине традиционное поединок, в стиле ИИ. Мы поставим DALL-E 3 в ChatGPT против Midjourney в восьми тестах сравнения изображений. И поскольку это время Хэллоуина, то и тема нашего соревнования соответствующая. Каждая подсказка включает в себя стиль и изображение для создания.

Для тестирования я дал одинаковые подсказки обоим ИИ. Я должен был предшествовать всем подсказкам Midjourney тегом / imagine, а подсказкам DALL-E – “изображение” в начале, но в остальном подсказки были идентичными. Midjourney автоматически генерирует четыре изображения, тогда как DALL-E генерирует два. Я запустил подсказку дважды с DALL-E, чтобы у нас было четыре варианта для выбора с обоими ИИ.

Затем я упаковал их все в Photoshop, чтобы мы могли видеть все восемь изображений-кандидатов рядом. Мои критерии для оценки состояли в следующем:

  • Насколько хорошо ИИ справляется с указанным стилем?
  • Интегрирует ли ИИ указанные элементы изображения?
  • Какое изображение является любимым моей жены, и какой ИИ его сделал?
  • Какое изображение является моим любимым, и какой ИИ его сделал?

Также: Как я использовал ChatGPT и инструменты искусства ИИ для быстрого запуска моего бизнеса на Etsy

В конце я подведу итоги и объявлю победителя. И, с этим, пусть начнется Хэллоуинский ИИ-поединок!

Дружелюбная ведьма

Вот наша подсказка:

Реалистичная, 35-мм дружелюбная веселая ведьма, в дверном проеме предместья, раздает угощения на Хэллоуин

Вот, что придумали две ИИ. Результаты Midjourney слева, результаты DALL-E 3 справа. Вы можете щелкнуть на маленький прямоугольник в верхнем правом углу, чтобы увидеть увеличенное изображение.

Вот где моя подсказка могла бы быть точнее. Я хотел, чтобы кто-то находился в дверном проеме, обращаясь из дома наружу. Но я не уточнил это, поэтому я получил изображения, которые обращены внутрь дома и некоторые – наружу.

Midjourney не соответствовал требованиям, не предлагая сладостей на любом из изображений. Все они казались немного странными. Что же держит ведьма на изображении номер #4? Это телефон, бритва или трикодер? Определенно это не угощение.

DALL-E 3 справился гораздо лучше. Все четыре его представления содержали сладости, хотя ведьма с печеньями, вероятно, не предлагает практическое угощение в стиле “хеллоуин”.

Также: ChatGPT против Bing Chat против Google Bard: Какой чатбот наилучший?

Я сомневался, какую выбрать из коллекции DALL-E. Но лучше всего мне понравилась №1. Она не открывает дверь, но она гораздо больше напоминает то, что я имел в виду, когда задавал предложение. Моя жена Дениз предпочла №3, полагая, что она очень сильно встроилась в праздник, у нее явно есть миска с угощениями, и она выглядит как настоящая добрая ведьма, а не просто кто-то в дешевом ведьмином костюме.

  • Указанный стиль: галстук, оба присутствуют в фото-стиле
  • Включает указанные элементы: DALL-E, без сомнения
  • Любимица Дениз: DALL-E №3
  • Любимица Дэвида: DALL-E №1

В этом раунде DALL-E однозначно победитель.

Сноупи и Великолепная Тыква

Вот предложение:

Картонный стиль 60-х годов, Сноупи на Хэллоуине, счастливый пес в стиле Сноупи

Я должен признать, что варианты DALL-E удивили меня. DALL-E не создал пса в стиле Сноупи, он создал практически самого Сноупи. Изображение DALL-E №1 даже имеет Чарли Брауна на заднем плане. Очевидно, здесь есть проблемы с торговой маркой. Мы воспроизводим эти изображения только чтобы показать вам, что DALL-E создает, как журналистская деятельность, но вы не можете, например, использовать эти изображения на футболке или в производственной графике, которую вы планируете продавать или использовать коммерческим образом.

С другой стороны, Midjourney создала небольших белых собачек, хотя ни одна из тыкв не достаточно большая, чтобы считаться Великой Тыквой (которая сама по себе является активной торговой маркой Peanuts Worldwide LLC).

Также: Лучшие генераторы AI-искусства: DALL-E 2 и интересные варианты для попробовать

Не обращая внимания на проблему торговой марки и основываясь только на предпочтениях, Дениз предпочла DALL-E №3. Для меня DALL-E №2 почти точно соответствует тому, что я представлял в голове, создавая предложение, но я надеялся на что-то более вдохновленное Сноупи, чем просто клонирование Сноупи. Поэтому я должен сказать, что мне очень нравятся и №3, и №4 от Midjourney. Маленькие шляпы очень милые. В целом, мой любимый выбор Midjourney №4, потому что на ней улыбающийся белый пес с ошейником в виде кости и несколько довольно больших тыкв.

  • Указанный стиль: DALL-E, потому что он создал плоский мультфильм в стиле 60-х годов
  • Включает указанные элементы: Midjourney, потому что DALL-E была прямым копированием, а не похожим на Сноупи
  • Любимица Дениз: DALL-E №3
  • Любимица Дэвида: Midjourney №4

В этом раунде победителем является Midjourney. DALL-E создал мультфильмы о Сноупи, но так как он создал их так точно, включая Чарли Брауна на заднем плане, все четыре работы должны быть дисквалифицированы как непригодные к использованию без лицензирования.

Черная кошка на Хэллоуине

Вот предложение:

Гиперреалистический стиль Маттиаса Хакера, счастливая черная кошка на Хэллоуине, ночь полной луны

Маттиас Хакер – немецкий фотограф, создающий искусство с архитектурными изображениями, которые имеют величественность и призрачность, а также яркие цвета. Я хотел увидеть, что произойдет, если попросить его стиль, но для кошки. Я раньше не слышал о Хакере, но мне понравилось то, что я увидел, когда я искал стили искусства в Midjourney, в базе данных Midlibrary.

Перед тем, как мы рассмотрим эти результаты, давайте поговорим минуту об использовании стиля художника в образе созданном искусственным интеллектом. Художники потратили всю свою жизнь на создание собственных уникальных стилей, и что-то тревожно в том, чтобы кормить их именем искусственный интеллект и наблюдать, как машина выплевывает почти идеальных клонов.

С одной стороны, использование художника для задания стиля может быть формой сокращения для понимания искусственным интеллектом того, что вы хотите. С другой стороны, вы выравниваете и приписываете себе стиль этого художника.

Кроме того: Мы не готовы к влиянию генеративного искусственного интеллекта на выборы

Здесь, в нашем примере, вряд ли Хакер создаст хэллоуинскую кошку, и я предоставляю ссылки, рекламирующие его веб-сайт, но стоит ли поддерживать использование искусственным интеллектом стиля художника? Дайте нам знать в комментариях ниже. Я также обратился к самому Хакеру за его мыслями, и если получу ответ, я обновлю эту статью.

О, и в то время как DALL-E без проблем воспроизвел Снупи и Чарли Брауна, ему не понравился запрос на Маттиаса Хакера, и он вернул следующую ошибку:

Прошу прощения, но из-за ограничений политики контента я не смог создать изображения на основе предоставленного описания. Пожалуйста, дайте мне знать, если у вас есть еще какие-либо запросы или если я могу помочь вам другим способом!

Таким образом, запрос для DALL-E превратился в:

Гиперреалистичная, счастливая кошка ко Хэллоуину, ночь полной луны

И вот результат:

Оба Midjourney и DALL-E произвели отличные изображения, хотя ни одно из них не смогло изобразить счастливую кошку. Мой любимый – Midjourney #3, у которого прекрасные насыщенные цвета и хороший контраст между светящейся луной, зловещим домом на заднем плане и кошкой. Единственный недостаток – кошка показана только с одним глазом.

Я не смог зафиксировать выбор Дениз по одному изображению. Ей понравились одинаково Midjourney #1 и DALL-E #3, именно как искусственный интеллект передал лица и различные настроения и цвета.

  • Указанный стиль: Midjourney, потому что DALL-E отказался принять “Маттиас Хакер” в запросе
  • Включены указанные элементы: Ничья, хотя все кошки кажутся немного раздраженными, а не счастливыми
  • Любимая Дениз: Midjourney #1 и DALL-E #3
  • Любимая Дэвида: Midjourney #3

Оба искусственных интеллекта справились с этим заданием на отлично, но я отдаю предпочтение Midjourney, потому что он предложил более яркие цвета, которые я хотел получить, указав стиль художника Маттиаса Хакера.

8-битные монстры

Вот запрос:

8-битные Хэллоуинские вампиры, мумии, костюмы Франкенштейна

И вот что мы получили:

Очевидно, DALL-E выполнил букву закона, создавая 8-битные изображения, которые могли бы быть выдернуты из 8-битной видеоигры. Но, с другой стороны, хотя Midjourney #3 соответствовал этим критериям, он создал изображения, которые, строго говоря, не были 8-битными. Вместо этого, он создал изображения, вдохновленные стилем 8-бит.

Кроме того: Как получить идеальный заменитель лица с использованием искусственного интеллекта Midjourney

Это не то, чего я ожидал от своего запроса, но мне это нравится. Также Дениз понравилось. Нам обоим понравился Midjourney #1. Но Дениз выбрала DALL-E #2, потому что он правильно изобразил монстров и был явно 8-битным.

  • Указанный стиль: DALL-E, потому что все они действительно вырваны из 8-битных видеоигр
  • Включены указанные элементы: DALL-E, потому что монстры точно соответствуют запросу
  • Любимая Дениз: DALL-E #2
  • Любимая Дэвида: Midjourney #1

Технически, DALL-E выиграл этот раунд. Но я гораздо больше очарован результатами Midjourney. Я отдаю этот раунд DALL-E, потому что он соответствовал техническим требованиям. Но Midjourney был гораздо больше моим фаворитом.

Haunted house

Вот задание:

Фотореалистический стиль, стиль Грасиэлы Итурбиде, замок-особняк на Хэллоуин, наполненный ужасами

Как и с котом, я использовал стиль конкретного художника в задании. Грасиэла Итурбиде – мексиканская фотограф, запечатлевающая сцены домашней жизни в довольно заметном стиле черно-белой высококонтрастной техники, который, по моим предположениям, должен отлично подходить для изображения замка, наполненного ужасами. Я ранее не слышал об Итурбиде, но мне понравилось то, что я увидел, когда я снова искал стили искусства в Midjourney, в базе данных Midlibrary.

Как и с Маттиасом Хакером, я связался с Грасиэлой Итурбиде, чтобы узнать, что она думает о том, что искусственный интеллект использует ее стиль. Я обновлю эту статью, если получу ответ.

Вот результат:

Одно из того, что я люблю в программах для генерации изображений по тексту, это то, что результат может быть неожиданным. Мой явный фаворит – это Midjourney #3, у которого даже нет замка, но он передает такое замечательное ощущение ужаса, что я просто его обожаю. Дениз предпочла DALL-E #1, сказав, что он реально выделяется для нее как замечательный, привлекательный и страшный особняк, созданный для приманки и запутывания с помощью иллюзий уюта, хотя он и не соответствует заданному стилю.

  • Заданный стиль: Midjourney, с использованием резкой черно-белой графики художника
  • Заданные элементы включены: DALL-E нарисовал классический особняк, наполненный ужасами
  • Фаворит Дениз: DALL-E #1
  • Фаворит Дэвида: Midjourney #3

Вау! Обе программы создали замечательные изображения. Я отдаю приз DALL-E, потому что если бы вы искали конкретно изображение особняка с ужасами, результат работы DALL-E гораздо больше соответствует ожиданиям. Однако, с точки зрения художественного видения, я лично влюблен в то, что сделал Midjourney.

Kids in costume

Вот задание:

Дети в костюмах для Хэллоуина в стиле Pixar

Я совсем не уверен, что пытается сделать Midjourney. Его дети выглядят как смесь мультяшных и реальных детей. Дети DALL-E выглядят как персонажи прямо из мультфильма Pixar.

Это легко выигрывает DALL-E. Дениз понравились супер-возбужденные улыбающиеся лица на DALL-E #1, включая динозавра. Мне понравился DALL-E #3, особенно маленький пришелец.

  • Заданный стиль: DALL-E
  • Заданные элементы включены: DALL-E
  • Фаворит Дениз: DALL-E #1
  • Фаворит Дэвида: DALL-E #3

Friendly ghost

Вот задание:

Дружелюбный призрак в стиле Диснея с пугающей светящейся тыквой

Чтобы быть ясным, классический персонаж Дружелюбный Призрак Каспер никогда не был собственностью Диснея. Он был собственностью Paramount, оказавшейся в зонтом Dreamworks как для анимации, так и для комиксов.

Тем не менее, мне нужен был дружелюбный призрак, не обязательно Каспер. И я хотел его с действительно недружелюбной и, надеюсь, пугающей светящейся тыквой. Под стилем Диснея я имел в виду более современный анимационный стиль, а не что-то, что явно выглядит доставленным из рук винтажного художника Диснея, нарисованного на перфорированные диски.

Вот что у нас получилось:

В середине пути они, похоже, неправильно поняли суть, некак связав стиль “Кошмары перед Рождеством” (о нём пойдёт речь дальше) с образами призраков. К тому же, призраки слегка пугают, а фонарь Джека-Лося, наоборот, нет.

Дениз и я оба предпочли графику от DALL-E, хотя она сказала, что эта работа не совсем в стиле Диснея. Её самой понравилась DALL-E #1, а второе место занял DALL-E #2. Мне больше всего понравилась DALL-E #1 без вариантов. Мне нравится дружелюбный призрак, а фонарь Джека-Лося выглядит довольно угрожающе, что именно то, что я хотел, написав эту задачу.

  • Заданный стиль: DALL-E
  • Включает заданные элементы: DALL-E
  • Любимый стиль Дениз: DALL-E #1 или #2
  • Любимый стиль Дэвида: DALL-E #1

Кроме того: Непосредственношрение AI-инструментов несут ответственность за 55% неудач в бизнесе AI

Победитель здесь — DALL-E. Оба алгоритма нарисовали милые комические изображения, но только DALL-E понял задание и нарисовал дружелюбного призрака и страшную тыкву. Midjourney наоборот, промахнулся и не понял сути задачи.

Кошмар в данных центрах

Это, наверное, моя самая любимая задача. Вот что я подал алгоритмам:

Стиль “Кошмары перед Рождеством”, стиль Тима Бёртона, IT специалист в данных центрах

Мне понравились все изображения. Все. DALL-E снова использовал фактически указанный стиль, в то время как Midjourney вдохновился им. В DALL-E изображениях скелет Джека явно оказался внутри центра данных.

Изображения Midjourney показывают IT-специалистов, но не слишком много данных центров. Всё же, любимым Дениз стал Midjourney #1, потому что тот парень идеально подходит её представлению о страшном ИТ-шнике, которого пришлось бы разыскивать в недрах компании (не так как Дениз, у неё ИТ-шник рядом на диване каждый день).

Моим абсолютным любимым изображением является DALL-E #4. Да, это несомненно Джек Скеллингтон, но дизайн центра данных идеально точен, и мне он нравится. Я бы повесил его на стену в офисе, серьёзно. Тем не менее, мы снова сталкиваемся с проблемами лицензирования (Джек Скеллингтон – это торговая марка Диснея), поэтому изображения Midjourney могут быть более пригодными, если вы хотите поместить их на футболку или что-то подобное.

  • Заданный стиль: Midjourney правильно передал цветовую гамму “Кошмаров перед Рождеством”
  • Включает заданные элементы: Ничья. DALL-E показал центры данных, а Midjourney — нет. Тем не менее, Midjourney создал уникальных персонажей, а не просто скопировал Джека Скеллингтона.
  • Любимый стиль Дениз: Midjourney #1
  • Любимый стиль Дэвида: DALL-E #4

В этом раунде я отдаю победу Midjourney — по той же причине, по которой Midjourney одолел DALL-E в стилистике Снупи выше. DALL-E создал комические изображения с Джеком Скеллингтоном, но потому что он создал Джека Скеллингтона так точно, все четыре работы должны быть отклонены из-за отсутствия лицензии. DALL-E #1 можно спорно назвать Джеком Скеллингтоном, но это пустяк, учитывая, что остальные работы изображают полный образ Скеллингтона.

Какой искусственный интеллект лучше в Хэллоуине?

Вау, это сложный вопрос. Если подсчитать победы, то DALL-E в ChatGPT выиграл пять из восьми соревнований, а Midjourney выиграл три из восьми. Итак, я думаю, что победителем является DALL-E.

Кроме того: Как искусственный интеллект помог разместить мою музыку на всех основных потоковых сервисах

“`html

В процессе работы DALL-E было потеряно несколько баллов из-за его полного клонирования Снупи и Джека Скеллингтона вместо использования их в качестве вдохновения. Midjourney иногда полностью пропускал часть задания, но по крайней мере не возвращал результаты, которые стали бы проблемами с лицензированием. Это не тот вид кошмара, которым я хотел вдохновиться в этих изображениях.

Есть ли у меня рекомендация по покупке на основе этих тестов? Нет. Я считаю, что Midjourney предлагает большую ценность и некоторую гибкость, но, как и большинство художников, у него есть свои собственные предпочтения. DALL-E 3 внутри ChatGPT – это бесплатный бонус, учитывая, что я уже плачу за ChatGPT Plus. Я скажу, что мне приятно удивили результаты DALL-E, но меня немного поразила его склонность к клонированию лицензированных объектов.

Что вы думаете? Какие изображения вам нравятся больше всего? Кто, по вашему мнению, выиграл нашу конкуренцию? Дайте нам знать в комментариях ниже.


Вы можете следить за ежедневными обновлениями моих проектов в социальных сетях. Не забудьте подписаться на мою еженедельную рассылку обновлений «на Substack», и следить за мной в Twitter по адресу @DavidGewirtz, на Facebook по адресу Facebook.com/DavidGewirtz, в Instagram по адресу Instagram.com/DavidGewirtz, и на YouTube по адресу YouTube.com/DavidGewirtzTV.

“`