5 способов, как искусственный интеллект изменил интернет в 2023 году

5 способов, которыми искусственный интеллект изменил интернет к 2023 году

Трудно поверить, но ChatGPT младше всего года.

Когда OpenAI в ноябре 2022 года представила ChatGPT, она стала самым быстро растущим приложением всех времен, вызвала панику в Google и поджег фитиль для AI-гонки великих компаний.

С тех пор появление генеративного искусственного интеллекта стали называть следующей промышленной революцией, возникли философские и этические вопросы о выживании человечества, и правительства обратили внимание на его разрушительный потенциал. Да, это был довольно большой год для искусственного интеллекта.

Теперь это особенно заметно в Интернете. Очевидно, искусственный интеллект зависит от Интернета, но это не так важно. Важнее то, как мы воспринимаем рост генеративного искусственного интеллекта через призму Веба: паникерство, циклы переоценки, вирусные дипфейки, размышления о экзистенциальных угрозах ИИ, этические дебаты, скандалы и, наконец, быстрая эншитификация Веба при помощи ИИ. Хотите доказательств? Когда модель ИИ обучается на ИИ созданных данных, она рушится.

Было было бы ли упомянуто явно или нет, ИИ оставил свой след в Интернете в этом году.

Генеративный искусственный интеллект в 2023 году стал дикой поездкой, которая постарела нас намного больше, чем за год. Мы уверены, что отсюда всё будет спокойно, но сначала давайте взглянем назад.

1. Придал новое значение слову “галлюцинация”, не связанное с наркотиками

Этот год стал годом, когда все узнали, что компьютеры тоже могут галлюцинировать, но не в веселом или трансцендентном смысле. Галлюцинация — это когда генеративный ИИ уверенно фабрикует свои ответы, создавая иллюзию веры в то, что не является истиной. 

ChatGPT на мобильном устройстве

LLM работают, вероятностно предсказывая следующее слово на основе огромного количества данных, на которых он обучен. Из-за этого галлюцинации ИИ часто имеют смысл с лингвистической точки зрения и иногда содержат элементы реальности, что затрудняет разделение фактов и абсолютного бессмыслицы. Или это начинает звучать, как ваш друг на наркотиках на Burning Man. 

С тех пор, как был выпущен ChatGPT, а затем Bing Chat и Bard, интернет был полон сумасшедшей дичи, которую произносили чат-боты ИИ – запрограммированные или освобожденные. Они варьировались от невинного и глупого (хотя жутковатого) до обвиняющего и вредного. Даже Google столкнулся со своим собственным чат-ботом Bard, включив неточную информацию в демонстрационном видео. Независимо от всего этого, это имело кумулятивный эффект в виде того, что Интернет начал сомневаться в реальности. 

2. Повернул дипфейки в сторону массы

Дипфейки или медиа, измененные ИИ, чтобы выглядеть реальными, были проблемой уже некоторое время. Но в этом году широкое распространение генеративных инструментов ИИ сделало их создание реалистичных изображений, видео и аудио проще простого.

OpenAI DALL-E 3, Google Bard и генератор изображений SGE, Microsoft Copilot (ранее Bing Chat Image Creator) и Meta’s Imagine – все это примеры моделей, которые используют генеративное искусственного интеллекта (ГИИ) для создания изображений на основе текстовых подсказок. Даже медиа-платформы Shutterstock, Adobe и Getty Images также присоединились к игре со своими инструментами генерации изображений на основе искусственного интеллекта.

DALL-E 2 против DALL-E 3 с изображением баскетболиста

Многие из этих сервисов имеют меры предосторожности и ограничения для борьбы с возможными угрозами и вредом, которые создает генерация изображений с помощью ГИИ. Водяные знаки на изображениях как создания искусственного интеллекта, отказ генерировать реалистичные фотографии лиц или рендеры публичных лиц и запрет на опасное или неуместное содержание – вот некоторые из способов, которыми они предотвращают злоупотребление.

Но это не останавливает людей от поиска путей. В этом году песня, которая убедительно звучала, как Дрейк и TheWeeknd, была распространена на музыкальных стриминговых сервисах, прежде чем была снята с публикации. С помощью ГИИ, Том Хэнкс, казалось бы, раскручивал стоматологический план на Instagram, и голос и изображение Скарлетт Йоханссон были использованы для продвижения приложения для создания фотографий в стиле 90-х годов.

Deepfake стали такой угрозой для публичных фигур и их средств к существованию, что Конгресс внес законопроект для защиты художников от подделок на основе искусственного интеллекта без их согласия. Исполнительный приказ Президента Байдена по искусственному интеллекту также затрагивает угрозу deepfake, говоря, что все контент, созданный с помощью искусственного интеллекта, должен иметь водяной знак.

3. Поднятие тревоги в отношении обучающих данных

Как же стали такими хорошими модели языковых моделей ГИИ? Они обучены на всем интернете. Все — посты Reddit, социальные медиа, страницы Википедии, сотни тысяч пиратских книг, новостные сайты, научные статьи, субтитры YouTube, кулинарные блоги, мемы – все это удовлетворяет неутолимый аппетит моделей искусственного интеллекта.

ChatGPT в форме мобильного приложения на телефоне

Скрапинг интернета для обучения моделей искусственного интеллекта – вопрос, на который сложно ответить. OpenAI и Google оба были подвержены групповым искам юридической фирмой Clarkson Law Firm за якобы “кражу” персональной информации без согласия и нарушение авторских прав. Meta и Microsoft также сталкиваются с судебными исками за обучение своих моделей на базе данных Books3, которая включала пиратские книги. (База данных Books3 была снята с публикации в августе после жалобы на нарушение авторских прав.)

В явном случае нарушения авторского права, автор Джейн Фридман обнаружила кэш книг, созданных при помощи искусственного интеллекта, написанных ее именем и продаваемых на Amazon.

Некоторые считают, что использование публично доступных данных в Интернете является законной практикой. Другие считают, что законы о конфиденциальности и авторском праве не учитывали сложности современных технологий машинного обучения и должны быть пересмотрены. Все согласны, что это действительно сложный вопрос, который пока не был решен.

4. Познакомление с генеративным искусственным интеллектом

Одним из удивительных возможностей генеративного искусственного интеллекта является создание естественного языка. В настоящее время большинство контента, созданного с помощью ИИ, читается так, будто его написал старшеклассник, не ознакомившись с материалом – в нем могут присутствовать неточности и роботичность. Но с течением времени LLM-модели становятся лучше, что делает автоматизацию статьей, пресс-релизов, вакансий, творческих работ и другого контента слишком привлекательной возможностью для многих.

Иллюстрация использования текстовых подсказок для генерации ИИ

Однако ранние попытки внедрения контента, созданного ИИ, для потребителей вызвали значительные негативные реакции. ENBLE рассердил сотрудников и читателей, опубликовав тихо несовершенные статьи, созданные искусственным интеллектом. Gizmodo был пойман на том, что опубликовал неточную историю про Star Wars, а Sports Illustrated придумал себе автора, который, кажется, не существует.

В других уголках Интернета Meta решила полностью рассмотреть генеративный ИИ и создать “Персоны” на основе знаменитостей, но на самом деле это не высокопоставленные лица – и разрабатывает инструменты для рекламодателей для создания контента, созданного ИИ.

Даже музыкальная индустрия присоединяется к игре. Записывающий лейбл UMG, который представляет Дрейка, якобы исследует возможность продажи голосов музыкантов для создания музыки при помощи ИИ и деления лицензионных сборов с артистом. В отличие от Дрейка, против использования ИИ для воссоздания своего голоса высказался в этом году, некоторые артисты, такие как Граймс, видят в этом новый способ сотрудничества с поклонниками и делятся роялти от созданных при помощи ИИ произведений с фанатами.

Если контент, созданный ИИ, здесь, чтобы остаться, тогда настоящим вопросом становится, кто будет получать прибыль от такого контента – и за чей счет?

5. Обещали изменить наше отношение к работе

Обещание повышения производительности работы стало главным преимуществом технологических компаний, запустивших инструменты ИИ в этом году. Microsoft, Google, Zoom, Slack, Grammarly и другие все превозносят возможность генеративного ИИ сократить время выполнения задач.

Но с учетом того, что эти инструменты все еще находятся в зародышевом состоянии и многие из них находятся на этапе пилотных проектов или доступны только для платных клиентов, масштабные последствия пока неизвестны.

То, что мы знаем, так это то, что инструменты генеративного искусственного интеллекта для работы ненадежны – по крайней мере, без присмотра человека, что вызывает определенные сомнения в общем обещании повышения производительности. Вам определенно следует дважды проверять их ответы, и вы должны осторожно подходить к тому, что вы делитесь с инструментами, подобными ChatGPT. Samsung почувствовал это на собственной шкуре, когда его сотрудники непреднамеренно поделились патентной информацией с ChatGPT, не осознавая, что их вклады могут быть использованы для обучения модели.

В конечном итоге OpenAI выпустила функционал, позволяющий отказаться от предоставления данных ChatGPT и представила версии, удобные для предприятий, чтобы обеспечить безопасность и надежность деловых сделок – если только у нас нет нарушения данных , конечно.