Как использовать ChatGPT для создания графиков и таблиц

Использование ChatGPT для создания графиков и таблиц

Знаете, что меня вдохновляет? Диаграммы и графики.

Дайте мне интересную диаграмму, и я буду безумно счастлив. Я люблю смотреть новости в день выборов, не из-за подсчета голосов, а из-за всех замечательных графиков. Я переключаюсь между каналами весь вечер, чтобы увидеть каждый возможный способ представления числовых данных каждой сетью.

Это странно? Я не думаю, что это странно.

Также: Момент, когда я понял, что ChatGPT Plus изменит мою бизнес-игру

Оказывается, ChatGPT прекрасно справляется с созданием диаграмм и таблиц. И учитывая, что этот повсеместно используемый генеративный AI-чатбот может синтезировать огромное количество информации во что-то, заслуживающее диаграммы, то то, что ChatGPT теряет в красивом оформлении, оно более чем компенсируется информационной ценностью.

Какие инструменты для создания диаграмм доступны для ChatGPT? Есть три способа продолжить:

  1. В бесплатной версии ChatGPT можно создавать таблицы (но не диаграммы)
  2. В версии ChatGPT Plus можно создавать диаграммы и таблицы с использованием дополнения Advanced Data Analysis (ранее “Code Interpreter”)
  3. В ChatGPT Plus можно создавать таблицы, а для создания диаграмм использовать случайные плагины для создания диаграмм

В этой статье я буду говорить о первых двух вариантах, но пропущу третий. Хотя для ChatGPT Plus существует множество плагинов для создания диаграмм, все они выводят вас из интерфейса ChatGPT и используют внешние сервисы. Все они пытаются взимать плату за дополнительные услуги, чтобы вы использовали их сервисы по созданию диаграмм на основе SaaS. Фактически, они перечислены в магазине ChatGPT как реклама, а не как готовые функциональные инструменты. Кроме того, они обычно являются очень ненадежными.

Примечание: То, что раньше называлось “Code Interpreter” в ChatGPT, теперь называется “Advanced Data Analysis”. Так что теперь мы будем называть его Advanced Data Analysis, а не Code Interpreter.

Advanced Data Analysis создает относительно некрасивые диаграммы. Но он замечателен. Во-первых, давайте поговорим о том, откуда ChatGPT получает свои данные, а затем мы создадим некоторые таблицы.

Как использовать ChatGPT для создания диаграмм и таблиц

Шаг 1: Понять различные версии ChatGPT

Ранее мы говорили о том, какие инструменты для создания диаграмм доступны в разных версиях ChatGPT. Но это не все. Если вы хотите использовать ChatGPT продуктивно, вам нужно понять, что могут делать различные редакции.

Бесплатная версия ChatGPT: В этой версии используется модель языка GPT-3.5 large, которая не так мощна, как версия GPT-4. С точки зрения данных, ее представление о мировых знаниях заканчивается в сентябре 2021 года. Вы можете вставить около 1500 слов данных в диалог чата, который она может обработать.

ChatGPT Plus с использованием Advanced Data Analysis: В этой версии используется модель языка GPT-4 large. Она может импортировать данные таблиц в широком диапазоне форматов файлов. Хотя она не указывает ограничение размера для импортированных данных, она может обработать достаточно большие файлы, но может не справиться, если файлы превышают некий неопределенный уровень сложности. Ее представление о мировых знаниях заканчивается в сентябре 2021 года, но вы можете расширить это знание, загрузив файлы данных.

Также: GPT-3.5 против GPT-4: стоит ли платить подписку на ChatGPT Plus?

ChatGPT с плагином WebPilot: В этой версии также используется модель языка GPT-4 LLM. По сути, вы можете запускать и Advanced Data Analytics, и плагины. Если вы выберете плагины, плагин WebPilot довольно надежен при поиске в Интернете (хотя он не справляется с большими запросами). Это означает, что знания ChatGPT о мире не должны заканчиваться в 2021 году, а в целом могут охватывать текущую дату.

ChatGPT Enterprise: Advanced Data Analytics и плагины также доступны в недавно анонсированной корпоративной версии. Вы можете загружать файлы в Enterprise, и они будут оставаться конфиденциальными. Enterprise также должен позволять работать с более крупными файлами и получать более крупные ответы. Цены не указаны.

Шаг 2: Создание базовой таблицы

Начнем с примера. В этой демонстрации мы будем работать с пятью крупнейшими городами по населению.

Перечислите пять крупнейших городов мира по населению. Включите также страну.

Я задал этот вопрос бесплатной версии ChatGPT и вот что мне ответили:

Превратить это в таблицу очень просто. Просто скажите ChatGPT, что вы хотите таблицу:

Создайте таблицу пятью крупнейших городов мира по населению. Включите также страну.

Шаг 3: Манипуляция таблицей

Вы можете манипулировать и настраивать таблицу, давая ChatGPT более подробные инструкции. Снова используя бесплатную версию, мы добавим поле с числом населения. Конечно, эти данные устарели, но они все равно представлены:

Создайте таблицу пятью крупнейших городов мира по населению. Включите также страну и поле с числом населения.

Вы также можете указать определенные детали таблицы, такие как порядок полей и единицы измерения. Здесь я перемещаю страну первой и сжимаю числа населения.

Создайте таблицу пятью крупнейших городов мира по населению. Включите также страну и поле с числом населения. Отобразите поля в порядке ранга, страны, города, населения. Отобразите население в миллионах (с одним десятичным знаком), так, чтобы 37,833,000 отображалось как 37.8M.

Обратите внимание, что я дал ИИ пример того, как я хочу отображать числа.

Это примерно все, что бесплатная версия может сделать. Теперь мы переходим к платной версии ChatGPT Plus за $20 в месяц.

Шаг 4: Создание столбчатой диаграммы

ChatGPT Plus с включенным расширенным анализом данных может создавать линейные диаграммы, столбчатые диаграммы, гистограммы, круговые диаграммы, точечные диаграммы, тепловые карты, бокс-плоты, площадные диаграммы, шаровые диаграммы, диаграммы Ганта, диаграммы Парето, сетевые диаграммы, диаграммы Сэнки, хороплетические карты, радарные диаграммы, облака слов, деревянные диаграммы и трехмерные диаграммы.

В этом примере мы просто создадим простую столбчатую диаграмму.

Создайте столбчатую диаграмму пятью крупнейших городов мира по населению.

Интересный инструмент, не так ли?

Наблюдательные зрители могли заметить расхождение в населении между предыдущей показанной таблицей и результатами здесь. Обратите внимание, что у таблицы есть зеленая иконка, а у этой диаграммы – фиолетовая. Мы перешли от GPT-3.5 (бесплатной версии ChatGPT) к GPT-4 (в ChatGPT Plus). Интересно, что различные языковые модели дают немного разные данные. Вот почему важно быть осторожным при использовании ИИ и проверять свою работу. В нашем случае мы просто демонстрируем диаграммы, но это конкретный пример того, как уверенно представленные данные могут быть неверными или несогласованными.

Шаг 5: Загрузка данных

Одно из суперспособностей расширенного анализа данных – возможность загрузки набора данных. Для нашего примера я скачал набор данных “Популярные имена для младенцев” с сайта Data.gov. Это файл, разделенный запятыми, содержащий имена детей в Нью-Йорке с 2011 по 2014 годы. Несмотря на то, что данные устарели на десять лет, с ними все равно интересно поиграть.

Набор данных, который я выбрал для этой статьи, легко доступен на государственном сайте, поэтому вы можете повторить этот эксперимент самостоятельно. На Data.gov есть множество отличных наборов данных, но многие из них слишком велики для использования ChatGPT. Когда я скачал этот набор данных, я обнаружил, что он также содержит информацию о этнической принадлежности, поэтому мы можем создать несколько разных диаграмм на основе одного и того же набора данных.

Также: Как использовать ChatGPT для создания приложения

Нажмите на маленькую кнопку загрузки, а затем укажите файл данных, который вы хотите импортировать.

Я попросил показать мне первые пять строк файла, чтобы узнать больше о его формате.

Шаг 6: Создание круговой диаграммы (и изменение цветов)

Меня интересовало, как распределены имена в датасете по полу. Вот моя первая инструкция:

Создайте круговую диаграмму, показывающую процентное соотношение пола в общем датасете

А вот результат:

К сожалению, темный оттенок зеленого цвета затрудняет чтение чисел. К счастью, вы можете указать Advanced Data Analytics использовать разные цвета. Я тщательно выбрал цвета, которые не поддерживают стереотипы пола.

Создайте круговую диаграмму, показывающую процентное соотношение пола в общем датасете. Используйте светло-зеленый цвет для мужчин и средне-желтый цвет для женщин.

Шаг 7: Нормализация данных для точности

Как мы видели ранее, собранные данные включают этничность. Вот как увидеть распределение различных этнических групп, зарегистрированных в Нью-Йорке в начале 2010-х:

Показать распределение этнических групп в датасете с помощью круговой диаграммы. Используйте только светлые цвета.

А вот результат. Замечаете что-нибудь?

По-видимому, Нью-Йорк неправильно нормализовал свои данные. Он объединил “WHITE NON HISPANIC” и “WHITE NON HISP” вместе, “BLACK NON HISPANIC” и “BLACK NON HISP” вместе, и “ASIAN AND PACIFIC ISLANDER” и “ASIAN AND PACI” вместе. Это привело к неточным представлениям данных.

Одним из преимуществ ChatGPT является то, что он запоминает инструкции на протяжении сессии. Поэтому я смог дать ему следующую инструкцию:

Для всех последующих запросов объедините “WHITE NON HISPANIC” и “WHITE NON HISP” вместе. Объедините “BLACK NON HISPANIC” и “BLACK NON HISP” вместе. Объедините “ASIAN AND PACIFIC ISLANDER” и “ASIAN AND PACI”. Используйте более длинное из двух названий этничности при отображении этничности.

И он ответил:

Давайте попробуем снова создать диаграмму, используя ту же инструкцию.

Показать распределение этнических групп в датасете с помощью круговой диаграммы. Используйте только светлые цвета.

Теперь лучше:

Вы должны быть внимательны при просмотре результатов. Например, при запросе о популярных именах для детей, ИИ разделил “Madison” и “MADISON” как два разных имени:

Для всех последующих запросов имена детей должны быть регистронезависимыми.

Шаг 8: Экспорт ваших графиков

Давайте завершим с комплексной диаграммой, созданной по одной инструкции. Вот наша инструкция:

Для каждой этнической группы представьте две круговые диаграммы, по одной для каждого пола. Каждая круговая диаграмма должна содержать пять самых популярных имен для данного пола и данной этнической группы. Используйте только светлые цвета.

Как оказалось, текст на генерируемой диаграмме оказался слишком маленьким для чтения. Поэтому, чтобы получить более полезную диаграмму, мы можем ее экспортировать. Я указал формат файла и его ширину:

Экспортируйте эту диаграмму в виде файла JPG шириной 3000 пикселей.

А вот результат:

Обратите внимание, что София и София очень популярны, но они показаны как два разных имени. Но именно это делает диаграммы такими увлекательными.

Часто задаваемые вопросы

Сколько стоит использование Advanced Data Analytics?

Advanced Data Analytics доступен в качестве бета-функции в ChatGPT Plus, которую нужно включить в панели настроек. ChatGPT Plus стоит $20 в месяц. Advanced Data Analytics также включен в Enterprise-версию, но цены на нее еще не были опубликованы.

Загруженные данные для создания диаграммы в ChatGPT хранятся конфиденциально или есть риск их раскрытия?

Предполагайте, что всегда есть риск конфиденциальности данных.

Я спросил об этом у ChatGPT, и вот что оно мне сказало: Конфиденциальность данных является приоритетом для ChatGPT. Загруженные данные используются исключительно в целях текущей сессии пользователя и не хранятся в долгосрочной перспективе или не используются для каких-либо других целей. Однако для высокочувствительных данных пользователи всегда должны быть осторожны и рассмотреть возможность использования корпоративной версии ChatGPT, которая обеспечивает улучшенную конфиденциальность данных.

Также: Генеративный ИИ представляет новые риски для всех. Вот как вы можете оставаться в безопасности

Мое рекомендация: Не доверяйте ChatGPT или любому другому генеративному инструменту ИИ. Корпоративная версия предположительно имеет больше возможностей для контроля конфиденциальности, но я бы рекомендовал загружать только те данные, которые вам не будет жаль, если они станут доступны общему обзору.

Может ли ChatGPT Advanced Data Analysis обрабатывать данные в режиме реального времени или он больше подходит для статических наборов данных?

Это возможно, но есть некоторые практические ограничения. Во-первых, аккаунт Plus ограничит количество запросов, которые вы можете сделать за определенный период времени. Во-вторых, вам нужно загружать каждый файл отдельно. Существует возможность использовать лицензированный API ChatGPT для проведения аналитики в режиме реального времени. Но для самого чат-бота вам понадобится анализировать данные в покое.


Вы можете следить за моими ежедневными обновлениями проекта в социальных сетях. Обязательно подпишитесь на мою еженедельную рассылку обновлений на Substack и следите за мной в Twitter по адресу @DavidGewirtz, в Facebook по адресу Facebook.com/DavidGewirtz, в Instagram по адресу Instagram.com/DavidGewirtz и на YouTube по адресу YouTube.com/DavidGewirtzTV.