Расширение ChatGPT Могут ли плагины ИИ-чатботов действительно изменить игру?

ChatGPT Can AI chatbot plugins really change the game?

Плагины давно являются неотъемлемой частью сложных программных систем. Еще в 1980-х годах я основал компанию под названием Hyperpress, которая предоставляла плагины для HyperCard от Apple (представьте себе веб до того, как появился Интернет… или сетевое подключение). Мои плагины добавляли возможности в HyperCard, которые не были частью исходной версии.

Сегодня плагины расширяют возможности популярных продуктов, таких как Photoshop и WordPress. WordPress предлагает около 60 000 плагинов, которые изменяют его возможности.

На двух основных веб-сайтах, которыми я управляю, я использую 49 отдельных плагинов (которые добавляют примерно 49 новых функций) на одном сайте и 25 плагинов (которые добавляют примерно 25 новых функций) на другом сайте. Ни один из этих сайтов не стал бы таким сложным профессиональным сайтом электронной коммерции без широкого спектра плагинов, добавляющих функции и ценность.

Что такое плагины?

Фундаментально, плагины – это отдельные фрагменты кода, которые взаимодействуют с родительской программной платформой. Они делают это через API (интерфейс программирования приложений). Все платформы, поддерживающие плагины, предоставляют API, которые позволяют внешним программистам подключаться к функциональности платформ.

Часто ширина и надежность API определяют устойчивость и гибкость всей платформы, особенно когда пользователи полагаются на большое количество плагинов для расширения возможностей используемой платформы.

Правильно реализованные плагины приносят пользу трем группам лиц: поставщику платформы (например, Adobe для Photoshop, сообществу WordPress с открытым исходным кодом и OpenAI для ChatGPT), разработчику плагина и пользователям платформы, которые получают новые возможности.

Кроме того: Я попросил ChatGPT написать мне плагин для WordPress, который мне нужен. Он сделал это менее чем за 5 минут

Поставщики платформ часто решают конкурировать с разработчиками. Если они видят, что плагин особенно популярен, они иногда решают включить эту функциональность в основной продукт. Они изменяют API. Иногда, если они предлагают маркетплейс (подобно магазину приложений, но для плагинов), они выбирают, кого позволить на маркетплейс и кого продвигать.

Но когда сотрудничество между поставщиком платформы и разработчиком плагинов работает, это волшебно. Оригинальная платформа может зайти в места, о которых никто не предполагал, и предоставлять возможности, недоступные иначе.

Кроме того: Лучшие плагины ChatGPT (и как их максимально использовать)

Возможности плагинов были анонсированы для Bard от Google, Bing AI от Microsoft и ChatGPT от OpenAI. Однако пока только ChatGPT предлагает обширный набор плагинов, которые можно действительно использовать.

Как в настоящее время работают плагины в ChatGPT

Плагины для ChatGPT доступны только для платных клиентов ChatGPT Plus. Это услуга стоимостью $20 в месяц, которая предоставляет доступ к набору данных GPT-4, плагинам и специальному плагину под названием Advanced Data Analysis (об этом позже).

За эти $20 в месяц вы получаете доступ к очень бета-версии, очень незавершенному продукту. Он все еще удивителен, но также очень раздражает. Вы ограничены 25 запросами в течение трех часов, поэтому если вы пытаетесь выполнить работу, вы можете исчерпать лимит запросов прямо в середине рабочего времени. Да, это говорю из очень разочаровывающего опыта. Вам также потребуется включить их в настройках.

Теперь, когда у вас включены плагины, готовьтесь к впечатлению.

Плагины, которые меняют ситуацию

Я экспериментировал с большим количеством плагинов. Поскольку вы можете использовать только три плагина одновременно, вам действительно нужно выбирать основную библиотеку плагинов, которую вы используете регулярно. Вот список, который я составил, и на основе которого работают приведенные мной примеры:

  • Stories: Этот плагин создает сборник историй на основе подсказки. Я использовал его только один раз (потому что у меня нет детей), но он настолько впечатляющий, что вам нужно его увидеть.
  • MixerBox WebSearchG: Это делает текущий веб доступным для ChatGPT, и делает это довольно хорошо. Это действительно расширяет ценность ChatGPT.
  • World News: Этот плагин сканирует новостные источники и предоставляет сводки актуальных новостей.
  • AskYourPDF: Вы можете подать на вход ChatGPT PDF-файл и взаимодействовать с данными в документе в формате PDF.
  • Advanced Data Analysis: Это специальный дополнительный плагин, предоставленный OpenAI. Если вы его запустите, вы не сможете запустить ни один из других плагинов. Он позволяет использовать код для общения с ChatGPT, но также интерпретирует сложные запросы и значительно расширяет возможности запросов, которые вы можете задать ChatGPT.

Обратите внимание, что я не предоставляю URL-адреса для каждого из этих отдельных плагинов. Магазин плагинов ChatGPT не предлагает уникальных URL-адресов для каждого плагина. Но их довольно легко найти. Просто перейдите в магазин плагинов ChatGPT и выполните поиск по их названиям. Если вы хотите узнать, как включить плагины и получить доступ к магазину плагинов, Стивен Вон-Николс из ENBLE предлагает отличное руководство.

Плагин, по которому писатели объявили забастовку

Давайте начнем с Stories. В предыдущей статье я показал вам, как я заставил ChatGPT написать короткую историю “Звездного пути” (и как он в основном справился). Stories воплощает эту идею и делает ее реальностью.

Внутри ChatGPT вы можете дать Stories подсказку, описывающую историю, которую вы хотите рассказать. Вот что я ему подал на вход:

Используя истории, расскажите историю о группе друзей, живущих на звездолете (трое из них – люди, один – робот). Расскажите о их приключении в путешествии на планету, населенную разумными динозаврами, где творчество, проявленное разумными динозаврами, является незаконным, а все истории, развлечения, музыка и т. д. создаются генеративными системами искусственного интеллекта.

Затем Stories генерирует полную историческую книгу на основе этой предпосылки. Хотя сгенерированная графика была немного слабой (ей бы не помешала технология Midjourney), в целом производство довольно хорошее. Я дал плагину предпосылку, которая включала некоторые моральные выборы, и ИИ не только придумал хорошую маленькую историю, но и сделал ее связной.

Но истории идут дальше. Вы можете прочитать историю онлайн в цифровой форме. Или вы можете перейти на сайт Stories и заказать твердокрылый экземпляр. Вы даже можете опубликовать историю на Amazon.

Вы можете видеть, как этот вид вещей внушает страх в сердца профессиональных творческих людей, особенно тех, кто сейчас находится в забастовке. За менее чем пять минут у меня была полностью пригодная для использования книга с историей. Написанная и иллюстрированная традиционным образом, эта 50-страничная книга с абзацем на каждой странице могла занять недели или месяцы.

Я только что выпил глоток кофе, составил предпосылку, в основе которой лежит типичная тема “Звездного пути”, и подал ее на вход ИИ.

Когда ChatGPT может читать веб

Как мы все знаем, база знаний ChatGPT заканчивается в 2021 году. Но с помощью плагина MixerBox WebSearchG мы получаем представление о том, что произойдет, когда ИИ сможет читать веб-страницы. Это также вызывает у меня ощущение “вау”, когда я понимаю, что прикасаюсь к будущему.

10 июля 2023 года я опубликовал статью ENBLE о проблемах, с которыми я столкнулся в связи с моим корпоративным планом хранения в Google Cloud. В этой статье я придумал термин “инфра-тряска” и упомянул его в двух заключительных абзацах статьи.

Затем 11 июля я задал ChatGPT следующий вопрос:

Как Гевирц определяет “инфра-тряску”

Я не сообщил ChatGPT, о каком Гевирце идет речь, и не сказал ему, что статья была опубликована на ENBLE. И все же он дал очень четкое (и, могу добавить, точное) описание намерения, стоящего за новосозданным словом “инфра-тряска”.

Ясно, что ChatGPT теперь может получать доступ к текущим данным и обрабатывать их для получения значения с помощью плагина.

Также: Как на самом деле работает ChatGPT?

В этом следующем примере вы также можете увидеть, как способность ChatGPT сохранять контекст смешивается с возможностью плагина получать доступ к веб-страницам. Я задал ему следующий вопрос:

Расскажи мне о собаке Дэвида Гевирца по имени Пиксель

Он не только извлек информацию, но и показал картинку этого малыша и привел ссылку на статью, в которой я рассказал о выборе его имени.

Понимание текущих событий

В процессе работы над этой специальной функцией я нашел три “убийственных приложения”, которые я буду использовать регулярно в своей работе. Давайте сначала обсудим первое: создание кратких сводок, объясняющих текущие новости с полной фоновой информацией.

В своей работе я отслеживаю много новостей. Клиенты часто просят меня дать перспективу на новости в области технологий, технологические тенденции и некоторые геополитические вопросы. Это означает, что я каждый день трачу несколько часов на чтение, чтобы хорошо понимать, что происходит.

Но нет способа удержаться во всем и я не могу уделять много времени темам, которые не относятся к моей основной “теме”. Тем не менее, я хотел бы иметь прочное понимание этих вопросов.

Также: Что такое генеративный искусственный интеллект? Вот все, что вам нужно знать

Один из примеров – война между Украиной и Россией. Хотя я писал о том, как атаки влияют на украинских разработчиков и даже освещал проблемы безопасности в Украине, которые произошли почти десять лет назад, я не был “полностью осведомлен” о вопросе о желании Украины стать членом НАТО.

Я мог прочитать множество новостных статей и провести фоновое исследование, но у меня просто нет времени для этого. Вместо этого, я попросил ChatGPT, MixerBox WebSearchG и World News подготовить мне полный обзор. Я задал два вопроса:

Вы консультант по политике США, который информирует генерального директора о ситуации с НАТО. Вам поручили объяснить, почему президент Байден говорит, что Украина не готова присоединиться к НАТО. Используйте World News и MixerBox WebSearchG, чтобы предоставить четкий обзор обеих сторон аргумента, чтобы ваш клиент имел глубокое и актуальное понимание проблем, сложностей и политических последствий. Свяжите свой ответ с политической обстановкой в США.

и

Используя те же плагины, есть ли противоположная точка зрения от Партии Республиканцев на вступление Украины в НАТО?

Из этих двух вопросов ИИ дал мне полный обзор вопроса о членстве в НАТО, основных политических вопросов, связанных с членством, и позиции обеих сторон по этому вопросу.

Моя жена подписана на сервис под названием Blinkist. Компания описывает свою услугу как “Blinkist предлагает ключевые идеи из лучших научно-популярных книг в формате, созданном для мобильных устройств”. Это по сути аудио- или текстовые конспекты для популярных научно-популярных книг, позволяющие ей ознакомиться с интересующими ее темами примерно за полчаса.

Комбинируя ChatGPT с MixerBox WebSearchG и World News, я могу получить краткий обзор “ключевых идей” Blinkist по любому текущему мировому новостному вопросу. Это мощный инструмент, но, как и вся пресса, важно понимать, что в том, что представляет вам ИИ, может быть предвзятость, пропуски и неточности.

Использование PDF-файлов в качестве исходного материала для анализа

Недавно у меня был проект анализа, в котором я должен был прочитать очень длинные и сухие научные статьи, чтобы понять взаимосвязь между некоторыми ключевыми технологиями. Используя плагин AskYourPDF, я подал эти PDF-файлы на ChatGPT и задавал вопросы, связанные с содержанием PDF-файлов.

Это было необычайно. Я мог попросить ChatGPT проанализировать различные концепции, содержащиеся в PDF-файлах. Я даже мог попросить его составить таблицу, сравнивающую элементы, обсуждаемые в PDF-файлах, но которые не сравнивались между собой напрямую в исходных документах.

Я никогда бы не использовал ChatGPT в качестве замены для чтения всей фоновой информации по проекту, с которым мне поручено провести исследование. Но многие аналитические задачи, которые я выполняю для собственного процесса обучения, требуют очень трудоемкой клирикальной работы по составлению таблиц и графиков для углубленного понимания взаимосвязей в документах.

Я также использовал это для изучения некоторых контрактов. Я подал ему договор, который у нас был с поставщиком услуг, и попросил его показать мне, в чем отличаются ограничения между сторонами, что обычно требует много времени для извлечения и определения. Вот пример, который я использовал:

Создайте таблицу, сравнивая ограничения, перечислив каждое ограничение. Покажите только те места, где ограничения различаются между сторонами, суммируйте каждое отличное ограничение в 8 словах или менее.

А вот таблица, которую я получил:

Конечно, безусловно, результаты от ChatGPT нельзя полностью доверять. Но быстрый просмотр определенно может сэкономить время.

Также: 5 способов исследования использования генеративного искусственного интеллекта на работе

Используя ChatGPT и AskYourPDF, клирические исследовательские задачи, которые обычно занимают полдня или больше, уменьшились до нескольких минут. Это потрясающее приложение.

Анализ данных в большом масштабе

Наконец, я хочу изучить дополнение для ChatGPT от OpenAI, которое работает самостоятельно. Оно называется Advanced Data Analysis и делает гораздо больше, чем интерпретирует код. Advanced Data Analysis позволяет загружать данные, которые ChatGPT может анализировать.

ПРЕДУПРЕЖДЕНИЕ: Если у вас есть еще что-то, что нужно сделать в этот день, не используйте эту функцию впервые. Вы будете вовлечены в нее. Она более разрушительна для продуктивности, чем видео с котятами и щенками.

Спросите меня, как я это знаю. Я имею в виду, сложно поверить, что что-то такое увлекательное может быть на самом деле легальным.

Этот инструмент позволяет импортировать файлы данных (Excel, CSV и т. д.) в ChatGPT. Он может проводить анализ и даже создавать базовые графики. Он опасно привыкательный. Часы спустя после начала использования я обнаружил, что скачиваю наборы данных с data.gov и безудержно смеюсь от мощи, которая находится у меня под рукой. Это было не очень приятное зрелище.

Также: Золотая лихорадка ИИ делает основную безопасность данных критичной

Я думаю, в конечном счете, поэтому ChatGPT Plus ограничивает вас 25 запросами каждые три часа. Это не для снижения нагрузки на их инфраструктуру. Это для нашего собственного блага. Мне это очень пригодилось. Весь день я, вероятно, не поел бы, если бы меня не заставили отойти от компьютера из-за ограничения по запросам.

Я не буду приводить больше тревожных аналитических видений из Мозга Дэвида и, вместо этого, покажу вам простое применение: из контактов моей электронной почты, с какими крупными PR-агентствами я регулярно взаимодействую, и какие крупные технологические компании имеют наибольшую представленность. Для этого я экспортировал свои контакты из Google Contacts.

Используя поле, связанное с электронной почтой, перечислите 20 наиболее часто встречающихся доменных имён

Из топ-20 доменных имён, какие связаны с PR-компаниями

Затем я попросил ИИ перечислить и построить круговую диаграмму, показывающую, с какими технологическими компаниями я имел наибольший контакт. Вот что я спросил:

Просмотрев набор данных, создайте круговую диаграмму, показывающую относительное представление крупных многомиллиардных технологических компаний

И вот что я получил в ответ.

Формат круговой диаграммы не идеален, но информация имеется. И снова, здесь речь идет о минутах, а не часах.

Но… мы все еще на ранних этапах

Плагины доступны, но они очень новые. Некоторые из них, как те, которые я продемонстрировал выше, имеют большие преимущества. Но поскольку они настолько новые, они также имеют несколько недостатков и неприятностей:

  • В магазине плагинов ChatGPT есть почти 700 плагинов. Большинство не проверены (практически все допускается).
  • Хотя вы можете искать по ключевому слову, они в прочем не классифицированы. Плагины, такие как Pluginpedia и PlugFinder, утверждают, что помогают в этом, но они не очень надежны.
  • Многие плагины… какое слово? Мэх. Некоторые делают не больше, чем обращение на веб-сайт провайдера. Например, есть плагин для получения скидочных купонов. В чем преимущество по сравнению с RetailMeNot?
  • Многие плагины кажутся брендовыми или PR-акциями, чтобы занять позиции на новом рынке в самом начале. Например, есть плагин “AI клон” конкретного CEO небольшой стартап-компании из Силиконовой Долины. Предположительно, вы можете спросить все, что хотели знать о нем. Так что, да. Это не совсем то, чем большинство из нас, вероятно, будут пользоваться.
  • Многие плагины не работают или не делают много. Я пытался узнать у плагина для локальной доставки еды, где можно получить стейк-ужин в моем городе, и он рекомендовал Subway. Да, у них есть стейк-сэндвич, но лучший результат я мог получить на Yelp. Я также нашел несколько плагинов, которые просто зависли без результатов.
  • Вы можете запустить только три плагина одновременно, и если вы хотите заменить набор плагинов, вам придется запустить новую сессию чата в ChatGPT, потеряв всю вашу текущую историю обсуждения. Это большое ограничение. Но даже с только тремя плагинами вы видели, как я заставил интерфейс плагина делать некоторые волшебные вещи.

Согласно Пэм Бейкер, автору “ChatGPT для чайников”, “Сейчас сложнее увидеть волшебство из-за ограничений на 3 плагина / 25 запросов и сомнительной ценности некоторых существующих плагинов. Но ограничения необходимы, чтобы OpenAI могло лучше управлять стабильностью модели и укреплять систему защиты по мере усвоения новых возможностей”.

Также: Microsoft поддерживает стандарт плагинов ChatGPT от OpenAI

Честно говоря, мы все еще на очень раннем этапе. Вот почему я не называю названия плагинов, которые не оправдали ожидания. Есть большая вероятность, что они станут гораздо лучше со временем.

Итак, плагины действительно меняют игру?

Да. Они меняют. Они действительно меняют. Мы только на начальном этапе, где мне пришлось потратить дополнительное время, чтобы выбрать четыре плагина, которые я считаю, что буду использовать постоянно (плюс Stories, которая показывает дополнительный уровень потенциала генеративного искусственного интеллекта).

Я заметил, что если я устанавливаю в качестве основного набора плагинов MixerBox WebSearch G, World News и AskYouTPDF, то я могу многое сделать. Я могу переключиться на Advanced Data Analysis, если хочу выполнить более глубокий анализ данных. Обратите внимание, что я обнаружил, что WebSearch G не всегда надежен. Если возникают проблемы, отключите его и попробуйте вместо него плагин WebPilot.

По мере развития ChatGPT в способности работать с плагинами, улучшения в области обнаружения и отбора плагинов, а также возможность использовать большее количество плагинов одновременно, становится ясно, что вид чат-бота, который мы только начали знать в 2023 году, ждут будущие модификации, предоставляющие нам все больше помощи в выполнении наших задач и проектов.

Также: GPT-3.5 против GPT-4: стоит ли платная подписка на ChatGPT Plus?

Автор книги “ChatGPT для чайников” Бейкер делится своим видением будущего плагинов. Она говорит: “Плагины добавляют возможности, которые в конечном итоге позволят нам модифицировать ChatGPT на лету”. Ее предпосылка заключается в том, что ChatGPT (и, как следствие, другие языковые модели) смогут развивать свои собственные возможности.

Она сказала ENBLE: “В одно мгновение ChatGPT сможет превратиться в идеальный инструмент для любой задачи. В конечном итоге ChatGPT сможет автоматически определить и выбрать плагины, необходимые для ответа на каждый запрос. Если плагин, который ему нужен, еще не существует, он создаст его на лету и бесшовно внедрит новую возможность”.

На данный момент я не могу сказать, создаем ли мы Скайнет или Борга. В любом случае наслаждайтесь дополнительными возможностями, которые предоставляют плагины, пока вы еще можете.

Сопротивление бесполезно.


Вы можете следить за обновлениями моих проектов в социальных сетях. Обязательно подпишитесь на мою еженедельную информационную рассылку на Substack и следите за мной в Twitter по адресу @DavidGewirtz, на Facebook по адресу Facebook.com/DavidGewirtz, в Instagram по адресу Instagram.com/DavidGewirtz и на YouTube по адресу YouTube.com/DavidGewirtzTV.