Гонка вооружений в области обнаружения ИИ началась

AI detection arms race has begun.

Эдвард Тян не считал себя писателем. Как студент компьютерных наук в Принстоне, он посещал несколько журналистских курсов, где осваивал основы репортажа, и его солнечное настроение и любопытство делали его популярным среди учителей и однокурсников. Но он описывает свой стиль письма того времени как “довольно плохой” – формульный и громоздкий. Один из его преподавателей журналистики сказал, что Тян хорош в “распознавании шаблонов”, что было полезно при создании новостных материалов. Так что Тян был удивлен, когда во втором курсе он смог получить место в эксклюзивном семинаре по написанию нехудожественной литературы Джона Макфи.

Каждую неделю 16 студентов собирались, чтобы услышать, как легендарный писатель из New Yorker разбирает свое искусство. Макфи давал упражнения, которые заставляли их строго мыслить о словах: Опишите произведение современного искусства на кампусе или сократите Геттисбургский адрес по длине. С помощью проектора и слайдов Макфи демонстрировал свои собственные эссе, структурированные различными способами: прямая линия, треугольник, спираль. Тян помнит, как Макфи говорил, что не может научить своих студентов писать, но может помочь им найти свой уникальный голос.

Эта статья опубликована в октябрьском номере 2023 года. Подпишитесь на ENBLE.

Фотография: Джессика Чоу

Если Макфи разожг романтическое представление о языке в Тяне, то компьютерные науки предложили другую перспективу: язык как статистика. Во время пандемии он взял год отпуска, чтобы поработать в BBC и стажироваться в проекте открытого исследования журналистики Bellingcat, где он написал код для обнаружения ботов в Twitter. Во время учебы в старших классах он изучал машинное обучение и обработку естественного языка. И осенью 2022 года он начал работать над своей выпускной работой по обнаружению различий между текстом, созданным искусственным интеллектом, и текстом, написанным человеком.

Когда в ноябре появился ChatGPT, Тян оказался в необычном положении. В то время как весь мир сходил с ума от этого нового, радикально улучшенного чат-бота, Тян уже был знаком с базовой технологией GPT-3. И как журналист, который работал над выявлением кампаний дезинформации, он понимал значение текстов, созданных искусственным интеллектом, для отрасли.

Находясь дома в Торонто на зимних каникулах, Тян начал играться с новой программой: детектором ChatGPT. Он сел в своем любимом кафе, наслаждаясь жасминовым чаем, и поздно засиживался в своей комнате, пиша код. Его идея была проста. Программа должна была сканировать текст на два фактора: “перплексия”, случайность выбора слов, и “вспышность”, сложность или вариативность предложений. Человеческое письмо обычно имеет более высокий рейтинг по обоим показателям, что позволяло Тяну догадываться, как был создан текст. Тян назвал инструмент GPTZero – “ноль” сигнализировал о правде, возвращении к основам – и выложил его онлайн вечером 2 января. Он разместил ссылку в Twitter с кратким введением. Цель состояла в том, чтобы бороться с “все возрастающим плагиатом искусственного интеллекта”, написал он. “Хотят ли учителя старших классов, чтобы ученики использовали ChatGPT для написания их исторических эссе? Скорее всего, нет”. Затем он пошел спать.

Тян проснулся на следующее утро от сотен ретвитов и ответов. Трафик на хост-сервере был так велик, что многие пользователи не могли получить доступ к нему. “Это было совершенно безумно”, – говорит Тян. “Мой телефон взорвался”. Один из друзей поздравил его с победой в интернете. Подростки на TikTok назвали его задушевным. “Много первоначальной ненависти было похоже на то, что этот парень – доносчик, у него нет жизни, у него никогда не было подруги”, – сказал Тян с ухмылкой. “Классика”. (У Тяна есть подруга.) В течение нескольких дней он получал звонки от журналистов со всего мира и в конечном итоге появился на NPR, South China Morning Post и Anderson Cooper 360. В течение недели его первоначальный твит набрал более 7 миллионов просмотров.

GPTZero был новым поворотом в медиа-рассказе о ChatGPT, который вдохновил всю отрасль на тревогу и привел к бушующей волне текстов, созданных искусственным интеллектом. (Исследователи создали детектор для текста GPT-2 в 2019 году, но Тян был первым, кто затронул ChatGPT.) Учителя поблагодарили Тяна за его работу, благодаря которой они наконец-то могли подтвердить свои подозрения о подозрительных эссе студентов. Нашел ли человечество своего спасителя от роботического захвата?

Программа Тяна была своеобразным стартовым пистолетом. Теперь началась гонка за создание определительного инструмента для обнаружения искусственного интеллекта. Предполагалось, что в мире, все больше насыщенном текстами, созданными искусственным интеллектом, нам потребуется отличать их от текстов, созданных людьми. GPTZero представлял собой обещание, что мы действительно сможем отличить одно от другого и что это имеет значение. Во время своего медийного тура Тян – улыбчивый, серьезный, воплощение отличника – развил эту успокаивающую точку зрения, что несмотря на то, насколько совершенными становятся генеративные инструменты искусственного интеллекта, мы всегда сможем их раскрыть. В человеческом письме есть нечто неделимое, сказал Тян: “В нем есть элемент, который никогда не может быть выражен в цифрах”.

Жизнь в интернете всегда была битвой между подделками и обнаружителями подделок, и оба стороны извлекали выгоду из этого столкновения. Ранние спам-фильтры отсеивали электронные письма по ключевым словам, блокируя сообщения с фразами типа «БЕСПЛАТНО!» или «старше 21 года» и со временем научились фильтровать целые стили письма. Спаммеры отвечали, окружая свои предложения отрывками похожих на человеческую речь фраз, поднятых из старых книг и смешанных вместе. (Этот тип сообщений, названный «литспамом», стал отдельным жанром.) С появлением популярности поисковых систем создатели, стремящиеся повысить рейтинг своих страниц, прибегали к «загромождению ключевыми словами» — повторению одного и того же слова снова и снова, чтобы получить приоритет. Поисковые системы отвечали, снижая рейтинг этих сайтов. После того, как Google ввел свой алгоритм PageRank, благоприятствующий сайтам с большим количеством входящих ссылок, спаммеры создали целые экосистемы взаимодополняющих друг друга страниц.

Вокруг начала нового тысячелетия появился инструмент captcha, который отличал людей от ботов на основе их способности интерпретировать изображения искаженного текста. Когда некоторые боты смогли справиться с этим, captcha добавила другие методы обнаружения, которые включали разбор изображений мотоциклов и поездов, а также определение движения мыши и другого поведения пользователя. (В недавнем тесте ранняя версия GPT-4 показала, что она знает, как нанять человека на Taskrabbit, чтобы пройти captcha от ее имени.) Судьба целых компаний зависела от проблемы обнаружения подделок: Элон Маск в попытке избавиться от сделки по покупке Twitter ссылался на обнаружитель ботов, чтобы подкрепить свой аргумент о том, что Twitter преувеличил количество ботов на своем сайте.

Генеративное искусственное интеллекта повысило ставки. В то время как большие языковые модели и генераторы текста к изображениям развивались постепенно на протяжении последнего десятилетия, в 2022 году произошел взрыв потребительских инструментов, таких как ChatGPT и Dall-E. Пессимисты утверждают, что мы скоро можем утонуть в цунами синтетических медиа. “Через несколько лет подавляющее большинство фотографий, видео и текста, с которыми мы сталкиваемся в интернете, может быть создано искусственным интеллектом”, предупредил в прошлом году технологический колумнист New York Times Кевин Руз. The Atlantic представил приближающуюся “текстопокалипсис”, когда мы боремся с фильтрацией генеративного шума. Политические кампании используют инструменты ИИ для создания рекламы, а Amazon затоплен книгами, написанными ChatGPT (многие из них о ИИ). Прокрутка отзывов о продуктах уже напоминает самый раздражающий тест Тьюринга в мире. Следующий шаг кажется ясным: если вы думали, что письма от нигерийских принцев были плохими, подождите, пока вы увидите чат-ботов нигерийских принцев.

Вскоре после того, как Тянь выпустил GPTZero, появилась волна аналогичных продуктов. OpenAI представила свой собственный инструмент обнаружения в конце января, а Turnitin, гигант антиплагиата, представил классификатор в апреле. Все они использовали одну и ту же базовую методологию, но каждая модель обучалась на разных наборах данных. (Например, Turnitin сосредоточился на студенческом письме.) В результате точность сильно разнится от заявленных OpenAI 26 процентов точности обнаружения текста, до наиболее оптимистичного утверждения от компании под названием Winston AI на 99,6 процента. Чтобы опережать конкурентов, Тянь должен был продолжать улучшать GPTZero, придумывать следующий продукт и закончить колледж за это время.

Сразу же Тянь нанял своего школьного друга Алекса Куи в качестве технического директора и в течение следующих недель привлек нескольких программистов из Принстона и Канады. Затем, весной, он привлек к команде троих программистов из Уганды, которых он встретил четыре года назад, работая в стартапе, который обучает инженеров в Африке. (Мировой гражданин, Тянь родился в Токио и жил в Пекине до 4-летнего возраста, пока его родители, оба китайские инженеры, не переехали семью в Онтарио.) Вместе команда начала работать над следующим приложением: плагином Chrome, который будет сканировать текст веб-страницы и определять, был ли он создан с помощью ИИ.

Еще одной угрозой для GPTZero был сам GPTZero. Почти сразу после его запуска скептики в социальных сетях начали публиковать смешные примеры проблем с классификацией текстов инструментом. Кто-то указал на то, что он отметил части Конституции США как возможно созданные ИИ. Издевательства сменились возмущением, когда истории о студентах, ложно обвиненных в см cheating из-за GPTZero, начали захлестывать Reddit. В один момент родитель одного из таких студентов обратился к Сохейлу Фейзи, профессору компьютерных наук Университета Мэриленда. “Они были действительно яростными”, – сказал Фейзи. Прошлой осенью, до того, как GPTZero дебютировал, Фейзи и некоторые его коллеги из Мэриленда начали готовить исследовательский проект о проблемах с обнаружением ИИ, которые, по его подозрению, могут быть ненадежными. Теперь GPTZero и его подражатели заставили его задуматься о том, что они могут причинить больше вреда, чем пользы.

Еще одной головной болью для Тяня стало количество хитроумных студентов, находящих способы обойти обнаружитель. Один человек на Twitter инструктировал пользователей вставлять нулевой пробел перед каждой буквой “е” в тексте, созданном ChatGPT. Пользователь TikTok написал программу, которая обходила обнаружение, заменяя некоторые английские буквы их кириллическими аналогами. Другие начали запускать свой ИИ-текст через популярный инструмент парафразирования QuillBot. Тянь исправлял эти уязвимости, но обходные пути продолжали появляться. Вопрос времени, когда кто-то запустит конкурирующий продукт – анти-обнаружитель.

В начале марта студент первого курса Стэнфордского университета по имени Джозеф Семрай и несколько его друзей ехали по Тихоокеанскому побережью к Лос-Анджелесу, когда они оказались запертыми в своем Zipcar в Вентуре. Они пошли в ближайшую звездбакс и ждали помощи на дороге. Но поскольку ожидание затянулось на несколько часов, Семрай и его друг задумались о том, как скомпенсировать упущенное время. У Семрай было эссе, которое следовало сдать на следующей неделе по обязательному курсу письменного творчества для первокурсников. Это был его наименее любимый тип задания: формульное эссе, предназначенное для демонстрации логического мышления. “Это довольно алгоритмический процесс”, – говорит Семрай.

Очевидным решением был ChatGPT. Но на тот момент его ответы обычно ограничивались несколькими параграфами, поэтому написание полноценного эссе было бы многоэтапным процессом. Семрай хотел создать инструмент, который мог бы написать эссе сразу. Он также знал, что есть шанс, что это может быть обнаружено GPTZero. Поддерживаемый другом, Семрай достал свой ноутбук и создал скрипт, который позволял бы написать эссе на основе подсказки, запустить текст через GPTZero, а затем подкручивать фразировку, пока искусственный интеллект больше не обнаруживался – фактически использовал GPTZero против самого себя.

Через несколько дней Семрай представил свою программу на Friends and Family Demo Day, своего рода шоу-и-рассказ для студенческого сообщества разработчиков Стэнфорда. Стоя перед аудиторией из своих однокурсников, он попросил аудиторию предложить тему эссе – кто-то предложил “изысканные ужины” в Калифорнии – и ввел ее в поле подсказки. Через несколько секунд программа выдала восьмипараграфное эссе, неоригинальное, но связное, с приведенными в работе источниками. “Не говорю, что я бы когда-нибудь представил эту работу”, – сказал Семрай, вызвав смех. “Но вот. Я не знаю, это экономит время”. Он назвал инструмент WorkNinja и выпустил его в магазине приложений через два месяца. С помощью рекламной кампании с участием влиятельного лица поколения Z Дэвида Добрика и раздачи 10 автомобилей Tesla пользователям, которые зарегистрировались, он получил более 350 000 загрузок в первую неделю; количество регистраций с тех пор замедлилось до нескольких сотен в день, согласно Семрай. (Семрай не сказал, кто финансировал кампанию, только что это был крупный инвестор-ангел из Силиконовой долины.)

Моп и спокойное поведение Семрая не соответствуют его тлеющей интенсивности. В то время как Тиан прыгает и бурлит по миру, Семрай кажется сосредоточенным и бесстрастным. 19-летний парень говорит уверенным, готовым к подкасту тоном Силиконовского предпринимателя, который видит мир в терминах проблем, которые нужно решать, заканчивая каждое второе предложение словами: “Правильно?” Слушая его говорить о защитных рвах и “S-кривой” общественного роста, легко забыть, что ему еще нет 21 года. Но потом, иногда, он скажет что-то, что раскрывает его наивного студента, открытого для мира и все еще пытающегося разобраться в своем месте в нем. Как-то раз он с другом гулял вокруг пристани Санта-Моники до 3 утра, “говоря о том, что нам дорого”. Семрай много думает о том, как найти баланс и счастье. “Я думаю, пока я молод, оно, вероятно, лежит больше в исследовании производной”, – говорит он, – “погоня за пиками и спадами”.

Родившись в Нью-Йорке, а затем переехав во Флориду, его родители – пожарник из Йонкерса и домохозяйка из Китая – дали ему длинный поводок. “В детстве меня оставляли преследовать то, что действительно меня волновало”, – сказал он. – “Лучший способ сделать это было создавать что-то на компьютере”. Когда Семрай было 6 лет, он создал плагин для назначения уровней разрешения для серверов Minecraft, а в 7 лет он написал программу, которая позволяла запустить Windows XP на Windows 7. “Мне просто искренне приятно создавать вещи для людей”, – говорит он.

Его семья переехала из Квинса в Палм-Сити, когда ему было 9 лет, и Семрай увидел разницу между системами общего образования. Основная компьютерная грамотность, которую он принимал как должное в школах Нью-Йорка, была редкостью во Флориде. Он начал писать программы, чтобы помочь заполнить пробелы в образовании – траектория, позволяющая ему сказать, что, будучи 19-летним, он “работает в образовательных технологиях всю свою жизнь”. В первом году старшей школы он создал платформу для онлайн-обучения, которая получила финансирование стартапов на местном конкурсе. До Covid он создал систему цифровых пропусков, которая стала основой для контактного трейсинга и была принята 40 школьными округами на Юго-Востоке.

Семрай в своей сути является техно-оптимистом. Он говорит, что считает нужным ускорить развитие технологий, включая искусственный общий интеллект, потому что в конечном счете это приведет нас к “постдефицитному” обществу – мировоззрению, иногда описываемому как “эффективный акселерационизм” (не следует путать с эффективным альтруизмом, который считает, что мы должны предпринимать действия, которые максимизируют “хорошие” результаты, как бы они не определялись). Аргумент Семрай за WorkNinja основан на своего рода логике акселерациониста. Инструменты искусственного интеллекта для написания эссе хороши, по его мнению, не потому, что они помогают детям списывать, а потому, что они заставят школы пересмотреть свои учебные планы. “Если вы можете следовать формуле для создания эссе, это, вероятно, не очень хорошее задание”, – говорит он. Он предвидит будущее, в котором каждый студент сможет получить тот вид образования, который раньше был зарезервирован для аристократов, благодаря персонализированному обучению с помощью искусственного интеллекта. Когда он только учился программированию, говорит Семрай, он в основном полагался на видео на YouTube и интернет-форумы, чтобы найти ответы на свои вопросы. “Мне было бы проще, если бы был наставник, который бы меня руководил”, – говорит он. Теперь, когда AI-наставники реальны, почему стоять у них на пути?

Джозеф Семрай, 19-летний создатель WorkNinja, инструмента, генерирующего эссе, написанные искусственным интеллектом.

Иллюстрация: Джеймс Маршалл; Фотография: Чарис Морган

Недавно я использовал WorkNinja, чтобы сгенерировать несколько эссе, включая одно о теории эволюции Дарвина. Первая версия, которую он мне предоставил, была неуклюжей и повторяющейся, но приемлемой, исследуя последствия теории для биологии, генетики и философии. GPTZero отметил его как вероятно созданное искусственным интеллектом.

Поэтому я нажал кнопку “Перефразировать” в WorkNinja. Текст немного изменился, заменяя некоторые слова синонимами. После трех перефразировок GPTZero наконец-то дал тексту свою печать человечности. (Когда я протестировал тот же текст через несколько недель, инструмент пометил его как смесь человеческого и искусственного интеллекта.) Проблема заключается в том, что многие перефразированные предложения больше не имеют смысла. Например, следующее предложение:

Теория эволюции Дарвина – это идея, что живые виды эволюционируют с течением времени из-за взаимодействия с окружающей средой.

превратилось в:

Теория эволюции Дарвина – это мысль, что живые виды приобретают со временем из-за взаимодействия с окружающей средой.

По крайней мере, любому студенту, ищущему ярлык, придется отредактировать свой черновик WorkNinja перед его представлением. Но это указывает на реальную проблему: если даже такая недоделанная работа может обойти детекторы, что может сделать более надежный продукт?

В марте Сохейл Фейзи из Университета Мэриленда опубликовал свои результаты по производительности детекторов искусственного интеллекта. Он утверждал, что проблемы с точностью неизбежны, учитывая способ работы детекторов текста искусственного интеллекта. По мере увеличения чувствительности инструмента для обнаружения большего количества текста, сгенерированного искусственным интеллектом, нельзя избежать увеличения количества ложных срабатываний до того уровня, который он считает неприемлемым. Пока, по его словам, невозможно получить одно без другого. И по мере того, как статистическое распределение слов в тексте, сгенерированном искусственным интеллектом, приближается к распределению слов у людей, т.е. становится более убедительным, он говорит, что детекторы станут менее точными. Он также обнаружил, что перефразировка сбивает с толку детекторы искусственного интеллекта, делая их оценки “почти случайными”. “Я не думаю, что будущее светло для этих детекторов”, – говорит Фейзи.

Он также говорит, что “водяные знаки” не помогают. По этому подходу инструмент искусственного интеллекта, такой как ChatGPT, превентивно корректирует статистические веса определенных взаимозаменяющихся “токенов” – скажем, используя “начать” вместо “начинать” или “выбрать” вместо “выбирать” – таким образом, чтобы это было незаметно для читателя, но легко обнаружено алгоритмом. Любой текст, в котором эти слова появляются с определенной частотой, может быть помечен как сгенерированный определенным инструментом. Но Фейзи утверждает, что с достаточным количеством перефразировок “водяной знак может быть стерт”.

Тем временем, по его словам, детекторы наносят вред студентам. Предположим, что инструмент обнаружения имеет 1% ложно положительных результатов – оптимистичное предположение. Это означает, что в аудитории из 100 студентов за время написания 10 домашних эссе будет в среднем 10 студентов, которых ложно обвинят в списывании. (Фейзи говорит, что тариф в одном из 1000 был бы приемлемым.) “Это нелепо даже думать о том, чтобы использовать такие инструменты для контроля использования моделей искусственного интеллекта”, – говорит он.

Тиан говорит, что целью GPTZero не является поймать жуликов, но это, безусловно, было его основным использованием до сих пор. (Результаты обнаружения GPTZero теперь сопровождаются предупреждением: “Эти результаты не следует использовать для наказания студентов.”) Что касается точности, Тиан говорит, что текущий уровень GPTZero составляет 96 процентов при обучении на самом последнем наборе данных. Другие детекторы хвалятся более высокими показателями, но Тиан говорит, что это является красным флагом, так как это означает, что они “подгоняют” свои данные обучения, чтобы соответствовать сильным сторонам своих инструментов. “Вы должны поставить искусственный интеллект и человека на одну ногу”, – говорит он.

Удивительно, но гораздо легче обнаружить искусственно созданные изображения, видео и аудиофрагменты, по крайней мере, пока что, чем синтетический текст. В 2018 году стартап Reality Defender, поддерживаемый Y Combinator, запустился с фокусом на обнаружение фальшивых изображений и видео, а затем расширился на аудио и текст. Intel выпустила инструмент под названием FakeCatcher, который обнаруживает deepfake-видео, анализируя паттерны кровотока в лице, видимые только камерой. Компания Pindrop использует “биометрию” голоса для обнаружения поддельного аудио и аутентификации звонящих вместо контрольных вопросов о безопасности.

Зов искусственного интеллекта говорит: “Не обязательно, чтобы все было так”. И когда вы думаете о миллиардах людей, которые находятся за пределами элитного клуба страдающих писателей, вы начинаете задумываться: “Может быть, так и быть не должно”.

Текст, созданный искусственным интеллектом, сложнее обнаружить, потому что у него относительно мало точек данных для анализа, что означает меньше возможностей для отклонения результатов искусственного интеллекта от человеческого стандарта. Сравните это с FakeCatcher от Intel. Илке Демир, исследователь-ученый в Intel, который также работал над фильмами Pixar, говорит, что создание достаточно большого и подробного набора данных, чтобы позволить глубоким фейкерам имитировать сигнатуры кровотока для обмана детектора, будет крайне сложно. Когда я спросил, можно ли в конечном итоге создать такое, она сказала, что ее команда предвидит будущие разработки технологии дипфейков, чтобы опережать их.

Бен Колман, генеральный директор Reality Defender, говорит, что инструменты их компании для обнаружения невозможно обойти, в частности потому, что они являются закрытыми. (До сих пор клиентами компании в основном были правительства и крупные корпорации.) С использованием общедоступных инструментов, таких как GPTZero, любой может прогнать текст через детектор, а затем настроить его, чтобы он прошел проверку. В отличие от этого, Reality Defender проверяет каждого человека и учреждение, использующих инструмент, говорит Колман. Они также следят за подозрительным использованием, поэтому если определенная учетная запись будет запускать тесты на том же изображении снова и снова с целью обойти обнаружение, их система это заметит.

В любом случае, подобно охотникам за спамом, шпионам, производителям вакцин, читерам в шахматы, разработчикам оружия и всей индустрии кибербезопасности, детекторы искусственного интеллекта во всех средствах массовой информации должны постоянно адаптироваться к новым методам уклонения. Предполагая, конечно, что разница между человеком и машиной по-прежнему имеет значение.

Чем больше времени я проводил, разговаривая с Тианом и Семраем и их одноклассниками-коллегами, тем больше я задавался вопросом: на самом ли деле кому-то из этих молодых людей нравится писать? “Да, очень!” – сказал Тиан, сверкая еще более обычного, когда я спросил его в прошлом мае на кампусе Принстонского университета. “Это как загадка”. Ему нравится выяснять, как слова сочетаются друг с другом, а затем организовывать идеи так, чтобы они логично следовали друг за другом. “Мне кажется, это весело”. Он также любит процесс интервью, так как это дает ему “окно в жизнь людей, а также зеркало, отражающее, как ты сам живешь”.

В школе, по словам Тиана, писать было похоже на обязанность. Он признается, что Макфи стимулировал его любовь к письму и расширил его вкус. В июне он восторженно рассказал мне, что только что купил бывшую в употреблении копию книги Энни Диллард “Жизнь писателя”.

Семраи также находил скучными и механистическими письменные задания в школе – это было больше о синтезе информации, чем о создании чего-то нового. “Я предпочел бы задания открытого формата, которые бы пробудили творческий потенциал”, – говорит он. Но он использовал эти навыки синтеза. Во втором курсе он написал 800-страничную учебную книгу под названием “Build for Anything”, предназначенную “способствовать переходу от незнания к знанию почти всего” в веб-разработке. (Он самостоятельно опубликовал книгу на Amazon в 2022 году и продал несколько сотен копий.) Семраи говорит, что ChatGPT теперь отлично справляется с таким видом прозы. “Я не считаю, что книга относится к категории значимого письма”, – говорит он.

После почти 20 лет печатания слов за деньги я могу сказать из опыта, что письмо – это ужасно. Спросите любого профессионального писателя, и он скажет вам, что это самое худшее, и с практикой это не становится легче. Я могу засвидетельствовать, что энтузиазм и любопытство, необходимые для постоянного сканирования мира, поиска фактов и извлечения из них смысла, могут быть трудными для поддержания. И это еще не учитывая состояние индустрии: сокращение ставок, уменьшение количества страниц и сокращение внимания (читателей и собственного). Я продолжаю делать это, потому что, лучше или хуже, это теперь то, кем я являюсь. Я делаю это не ради удовольствия, а потому что это имеет смысл – по крайней мере для меня.

Некоторые писатели романтизируют борьбу. Макфи однажды описал, как две недели лежал на пикниковом столе, пытаясь решить, как начать статью. “Статья в конечном итоге состояла из примерно пяти тысяч предложений, но в течение этих двух недель я не смог написать ни одного”, – написал он. Другой раз, в возрасте 22 лет, он привязал себя к своему письменному столу ремнем халата. По словам Томаса Манна, “Писатель – это тот, для кого письмо труднее, чем для других людей”. “Ты ищешь, ты ломаешь сердце, спину, мозг, и только тогда – только тогда – оно передается тебе”, – пишет Энни Диллард в книге “Жизнь писателя”. Она предлагает это после долгого сравнения письма с борьбой с аллигаторами.

Подразумевается, что чем сильнее сжатие, тем сладостнее сок – что есть добродетель в пристальном взгляде на пустую страницу, приручении ее, принуждении к прозе. Мы говорим себе, что именно так происходят самые значительные прорывы. Мука стоит того, потому что именно так рождаются идеи.

Приманка ИИ говорит: “Это не обязательно должно быть так”. И когда вы задумываетесь о миллиардах людей, которые находятся за пределами элитного клуба страдальцев-писателей, вы начинаете думать: возможно, это не должно быть так.

Мэй Хабиб провела свое раннее детство в Ливане, прежде чем переехать в Канаду, где она выучила английский язык как второй язык. “Мне казалось довольно несправедливым, что такая большая выгода приходится на долю того, кто действительно хорошо читает и пишет”, – говорит она. В 2020 году она основала Writer, одну из нескольких гибридных платформ, которые не стремятся заменить письменность человека, а помогают людям – и, точнее, брендам – лучше сотрудничать с ИИ.

Хабиб говорит, что она считает ценным пристальный взгляд на пустую страницу. Это помогает вам рассматривать и отбрасывать идеи и заставляет вас организовывать свои мысли. “Есть так много преимуществ в бродяжничестве, взрывающемся голова, хочется убить себя во время пристального взгляда на ваш курсор”, – говорит она. “Но это надо взвешивать по сравнению со скоростью миллисекунд”.

Цель Writer, говорит она, не заключается в том, чтобы писать за вас, а в том, чтобы сделать вашу письменность быстрее, сильнее и последовательнее. Это может означать предложение правок в прозе и структуре, или выделение другого написанного по данной теме и предложение контраргументов. Цель, говорит она, – помочь пользователям меньше сосредотачиваться на механике на уровне предложения и больше на идеях, которые они пытаются передать. Идеальным результатом является текст, который такой же “человеческий”, как если бы его написал сам человек. “Если детектор может отметить его как письменность ИИ, значит, вы неправильно использовали инструменты”, – говорит она.

Бело-черное представление о том, что письмо либо создается человеком, либо ИИ, уже уходит в прошлое, говорит Этан Моллик, профессор Школы Уортона Университета Пенсильвании. Вместо этого мы вступаем в эру того, что он называет “полуконевый” письменностью. Конечно, если попросить ChatGPT написать эссе о истории Монгольской империи, результаты будут предсказуемо “похожими на ИИ”, говорит он. Но “начните писать: ‘В параграфе три детали не совсем правильные – добавьте эту информацию и сделайте тон больше похожим на The New Yorker'”, – говорит он. “Тогда это становится более гибридным произведением и гораздо более качественным письмом”.

Моллик, который преподает предпринимательство в Уортоне, не только позволяет своим студентам использовать инструменты ИИ – он требует этого. “Теперь моя программа говорит, что вы должны сделать хотя бы одну невозможную вещь”, – говорит он. Если студент не умеет программировать, может быть, он напишет рабочую программу. Если он никогда не делал дизайнерскую работу, он может собрать визуальный прототип. “Каждую работу, которую вы сдаете, должны прокомментировать как минимум четыре знаменитых предпринимателя, которых вы имитируете”, – говорит он.

По словам Моллика, студенты все равно должны овладеть своей предметной областью для достижения хороших результатов. Цель состоит в том, чтобы заставить их мыслить критически и креативно: “Мне безразлично, какой инструмент они используют для этого, главное, чтобы они использовали инструменты в изощренной манере и использовали свой разум”.

Моллик признает, что ChatGPT не так хорош, как лучшие писатели. Но он может помочь всем остальным. “Если вы были писателем низшего квартиля, то теперь вы находитесь на 60-70 процентиле”, – говорит он. Это также освобождает некоторые типы мыслителей от тирании процесса письма. “Мы равняем писательскую способность с интеллектом, но это не всегда правда”, – говорит он. “Фактически, я бы сказал, что это часто не так”.

Эдвард Тиан, возраст 23 года, создатель GPTZero, инструмента, распознающего письмо, созданное ИИ.

Иллюстрация: Джеймс Маршалл; Фотография: Лорин Хилл

В майский безоблачный день мы с Тианом прогуливались по кампусу Принстонского университета; на ухоженных газонах, казалось, приземлились большие белые палатки для встреч. По моей просьбе Тиан пригласил нескольких однокурсников на обед в суэцзянский ресторан возле кампуса, чтобы поговорить о ИИ.

Пока некоторые школы спешат запретить использование ChatGPT, а генеральные директоры технологических компаний подписывают письма, предупреждающие об угрозе, и студенты были заметно спокойны по поводу машинно-помогаемого будущего. (Принстон оставил это на усмотрение преподавателей, чтобы установить свои правила.) Одна из них недавно использовала ChatGPT для написания раздела благодарностей к своей диссертации. Другие, включая Тиана, полагались на него, чтобы заполнить куски кода. Лидия Ю, старшекурсница и студентка компьютерных наук, которая планирует работать в журналистике, попросила ChatGPT написать стихотворение о потере в стиле Элизабет Бишоп – попытку воссоздать ее знаменитое стихотворение “One Art”. (“Искусство потери не сложно освоить.”) Результат был “очень близким” к оригинальному стихотворению, сказала Ю, и она обнаружила, что чат-бот сделал еще более хорошую работу, анализируя оригинал и описывая, что делает его таким волнующим. “Мы видели много паники практически по всему в нашей жизни”, – сказала Ю, называя ТикТок, Твиттер и сам Интернет. “Мне кажется, что мы, представители нашего поколения, можем сами разобраться, как использовать это”.

Софи Амитон, студентка старшего курса по механической и аэрокосмической инженерии, включилась в разговор: «Кроме того, я думаю, что наша поколение во многих отношениях ленивее», – сказала она, кивая вам в знак согласия. «Я вижу гораздо больше людей, которые не хотят традиционных работ, не хотят работать с 9 до 5».

«Они разочарованы», – сказали вы. «Много работы сводится к таблицам».

«Я думаю, что это произошло из-за Covid», – продолжала Амитон. «Люди переоценили, для чего вообще нужна работа, и если вы можете использовать ChatGPT, чтобы упростить свою жизнь и иметь лучшее качество жизни или баланс между работой и личной жизнью, то почему бы не воспользоваться этим сокращением?»

Лиз, недавно окончившая Принстон и предпочитающая не использовать свою фамилию, отправила мне статью, которую она написала с помощью ChatGPT для урока по глобальной политике. Вместо того, чтобы просто задать ему вопрос эссе, она ввела контур с подробными пунктами и попросила его написать статью на основе ее заметок. После длительных обсуждений и переделок – с указаниями переписать и переставить, добавить нюансы и контекст – она наконец получила статью, с которой она чувствовала себя комфортно. Она получила отличную оценку.

Я скопировал и вставил ее статью в GPTZero. Вердикт: “Ваш текст, скорее всего, написан полностью человеком”.

В начале мая, всего за несколько недель до того, как Тиан и его одноклассники надели на себя черные выпускные мантии, команда GPTZero выпустила разрабатываемое ими расширение для Chrome и назвала его Origin. Origin все еще является элементарным: вам нужно выбрать текст веб-страницы самостоятельно, и его точность не идеальна. Но Тиан надеется, что однажды этот инструмент автоматически будет сканировать каждый просматриваемый вами веб-сайт, выделяя контент, созданный искусственным интеллектом – от текста до изображений и видео – а также все “токсичное” или фактически сомнительное. Он описывает Origin как “лобовое стекло” для информационной автострады, отражающее бесполезный или вредоносный материал и позволяющее нам видеть дорогу четко.

Тиан был безгранично оптимистичен по поводу компании; он также просто чувствовал себя счастливым, что окончательно находится в работе, которую он действительно хотел. Многие его друзья поступили в Принстон с планами стать предпринимателями, но сжатие пояса в секторе технологий изменило их планы.

«Мы видели много паники почти на все в нашей жизни. Я чувствую, что люди нашего поколения говорят: Мы можем сами разобраться, как использовать это».

Как студент-бакалавр со стажем в три года в Стэнфорде, Семрай отнесся к лету с более непринужденным настроем. В жаркий четвергий послеполуденный июньский день, на крыше Pier 17 возле Уолл-стрит, Семрай, в зеленой рубашке с узором и белых кроссовках Nikes, ярко говорил со мной о будущем, или по крайней мере о следующих нескольких неделях. Его лето еще только начиналось. («Я быстро тестирую свою тезу.») Но пока он находился в Нью-Йорке, останавливаясь у друзей и занимаясь несколькими проектами, связанными с искусственным интеллектом. В предыдущую ночь он спал в рабочем пространстве в Сохо. Сейчас он стоял в тенистом VIP-секторе мероприятия, организованного Techstars New York City, стартап-акселератором, пока сотни потных участников шатались в ярком свете.

Рядом на сцене стоял мэр Нью-Йорка Эрик Адамс в темных очках и в полном костюме, восхваляя преимущества программирования. «Я технический человек», – сказал Адамс, прежде чем призвать гостей искать разнообразных партнеров и использовать «исходный код» для решения общественных проблем, таких как рак и огнестрельное насилие. Затем он призвал холостяков в зале найти себе «коротышку или партнера и связаться с ними».

Семрай использовал подход “попробуй и посмотри, что получится” в своей работе. Помимо WorkNinja, он разрабатывал платформу для чат-ботов на основе реальных знаменитостей, обученных на большом количестве их данных, с которыми поклонники могли взаимодействовать. Он также создавал прототип браслета, который будет записывать все, что мы говорим и делаем – Семрай называет его “идеальной памятью” – и предлагать советы в режиме реального времени для облегчения разговоров. (Группа одноклассников в Стэнфорде недавно создала похожий продукт под названием RizzGPT, которые помогает его носителю флиртовать.)

Он ожидал, что лето приведет к взрыву приложений искусственного интеллекта, поскольку молодые программисты будут смешиваться и перекрещиваться. (Эрик Адамс был бы одобрен.) «Я думаю, что образуются созвездие стартапов, и через пять лет мы сможем провести линии между людьми – начало экосистемы», – сказал он.

К лету у Тиана была команда из 12 сотрудников, и он собрал 3,5 миллиона долларов от нескольких венчурных капиталистов, включая Джека Альтмана (брата генерального директора OpenAI Сэма Альтмана) и Эмада Мостака из Stability AI. Но в ходе наших разговоров я заметил, что его представление о GPTZero/Origin немного меняется. Теперь, по его словам, обнаружение ИИ будет только одной частью набора инструментов для подтверждения человечности. Так же важным будет акцент на происхождении или «информационных активов». Идея заключается в том, чтобы присоединить кусочек контента к криптографическому тегу, который подтверждает, что он был создан человеком, как определено его процессом создания – своего рода капча для цифровых файлов. Adobe Photoshop уже присоединяет тег к фотографиям, созданным с использованием его нового инструмента генерации искусственного интеллекта Firefly. Любой, кто смотрит на изображение, может щелкнуть правой кнопкой мыши и увидеть, кто его сделал, где и как. Тиан говорит, что хочет сделать то же самое для текста и что он обсуждал это с Content Authenticity Initiative – консорциумом, посвященным созданию стандарта происхождения для всех медиа, – а также с Microsoft о возможном сотрудничестве.

Можно интерпретировать его упор на происхождение как неявное признание того, что одного только обнаружения недостаточно. (OpenAI закрыла свой текстовый классификатор в июле из-за его низкой точности.) Это также предвещает возможный сдвиг парадигмы в том, как мы относимся к цифровым медиа. Вся задача обнаружения подразумевает, что люди оставляют неподдельную подпись в тексте – что-то ощутимое – подобно тому, как лжедетектор предполагает, что нечестность оставляет объективную след. Происхождение опирается на нечто вроде этикетки “Сделано в Америке”. Если бы не этикетка, мы бы не знали разницы. Это тонкое, но значимое отличие: письмо человека может быть не лучше, не более творческим и даже не более оригинальным. Но оно будет человеческим, что будет иметь значение для других людей.

В июне команда Тяна сделала еще один шаг в сторону практичности. Он сказал мне, что они создают новую платформу для написания под названием HumanPrint, которая поможет пользователям улучшить их текст, написанный с помощью ИИ, и позволит им поделиться “доказательством подлинности”. Хотя не генерируя текст. Вместо этого она будет использовать технологию GPTZero для выделения секций текста, недостаточно человеческих, и подталкивать пользователя переписать их своими словами – своего рода инверсия существующих помощников по написанию с использованием ИИ. “Так что учителя могут указать: хорошо, может быть, более 50 процентов эссе все же должно быть написано своими словами”, – сказал он. Когда я спросил, является ли это поворотом для компании, Тянь утверждал, что это “естественное расширение обнаружения”. “Это всегда было видение быть золотым стандартом ответственного использования ИИ”, – сказал Тянь, – “и это остается”. Однако, здесь ясно: ИИ-написание нельзя остановить; единственный вариант – работать с ним.

Когда Тянь впервые тестировал GPTZero, он просканировал эссе Макфи, написанное в 2015 году для New Yorker под названием “Система отсчета”. В нем Макфи размышляет о радостях и рисках использования культурных ссылок в письме. “Упомяните Бейонсе, и все знают, кто она. Упомяните Веронику Лейк, и вам бы лучше было находиться в Кветико-Супериор”, – он пишет с улыбкой. Он перечисляет список прилагательных, которые он использовал, чтобы описать усы, включая “искренний”, “безошибочный”, “гироскопический”, “безобидный”, “анальгезирующий”, “успокаивающий”, “одобен” и “тетраграмматонический”. Он заканчивает анекдотом о борьбе с редактором, чтобы включить ссылку на малоизвестное британское выражение, используемое верхними туристами в Индию во время Раджа. (Он выиграл.) Это классический Макфи: точный, с большим сердцем, немного самодовольный, с радостью уходящий в сторону, но всегда возвращающийся к нужной точке. GPTZero определил, что статья была “самой человеческой по всем параметрам”, – сказал Тянь. Я позвонил Макфи, чтобы узнать, что он думает о том, что его письмо особенно человеческое.

“У меня действительно нет очень хорошей идеи”, – сказал Макфи мне по телефону. “Но если бы я угадывал, то мои работы отражают науку, или сельское хозяйство, или авиацию, или любую другую тему, через людей. Всегда есть центральный персонаж, от которого я учусь”. Действительно, Макфи пишет глазами экспертов. Читатель уходит не только со знаниями о геологии или физике элементарных частиц или апельсинах, но и с ощущением человека, изучающего предмет, а также Макфи, изучающего человека.

Макфи, теперь 92 года, сказал, что не беспокоится о том, что ИИ заменит писателей. “Я очень скептичен и совершенно не беспокоюсь об этом”, – сказал он. “Я не думаю, что есть Марк Твен искусственного интеллекта”.

Но, спросил я, что если через несколько лет кто-то создаст McPheeBot3000, обученного на письмах Макфи, и потом попросит его написать книгу по новой теме? Ему, возможно, не удастся пересечь реки с экологическими активистами или отправиться на рыбалку с ихтиологами, но не мог он запечатлеть голос, стиль и мировоззрение Макфи? Тянь утверждал, что машины могут только имитировать, тогда как Макфи никогда не повторяется: “Уникальное в Макфи в том, что он придумывает вещи, о которых Макфи день назад не думал”.

Я спросил Макфи о гипотетическом McPheeBot3000. (Или, если Семрай добьется своего, не таком уж и гипотетическом.) “Если когда-нибудь это случится, в будущем, когда меня уже не будет”, – сказал он, – “я надеюсь, что мои дочери придут с адвокатом”.


Эта статья публикуется в октябрьском номере 2023 года. Подпишитесь сейчас.

Дайте нам знать, что вы думаете об этой статье. Отправьте письмо редактору по адресу [email protected].