Почему визуализация искусственного интеллекта DeepMind абсолютно бесполезна

Почему визуализация DeepMind AI бесполезна

Впечатляющие, но что это означает? Изображения DeepMind, такие как это, разработанные Тимом Вестом, впечатляют, но не объясняют, что на самом деле происходит в программах искусственного интеллекта. По-видимому, изображение представляет “преимущества и недостатки больших языковых моделей”, таких как ChatGPT, но каким образом?

“Превосходство в статистической графике заключается в том, чтобы сложные идеи передавались с ясностью, точностью и эффективностью.” – Эдвард Р. Тафти, The Visual Display of Quantitative Information.

Обычно визуализация предназначена для помощи в понимании того, что нельзя увидеть. Компания DeepMind, подразделение Google, недавно опубликовала визуализации искусственного интеллекта, созданные различными визуальными художниками. Возможно, намерение хорошее, но результаты – полная катастрофа.    

“Visualising AI привлекает художников со всего мира, чтобы создавать более разнообразные и доступные образы искусственного интеллекта, вдохновленные разговорами с учеными, инженерами и этиками в Google DeepMind”, – говорит компания. Она противопоставляет эти “разнообразные и доступные” изображения типичным изображениям ИИ, которые включают светящиеся мозги или роботов и подобное. 

Также: Генеративный искусственный интеллект: просто не называйте его “художником”, говорят ученые в журнале Science

Действительно, типичные фотографии для ИИ, такие как светящиеся буквы “A” и “I”, не помогают понять достаточно таинственное искусство и науку форм машинного обучения ИИ, являющихся доминирующей формой искусственного интеллекта.

Знаменитый специалист по визуализации Эдвард Р. Тафти, автор книги The Visual Display of Quantitative Information, ставшей вехой в понимании визуализации, написал, что успешные визуальные отображения должны, среди прочего, “побуждать зрителя думать о сути, а не о методологии, графическом дизайне, технологии графического производства или чем-то еще”.

Также: Google обновляет Vector AI, чтобы предоставить предприятиям возможность обучения GenAI на их собственных данных

Изображения DeepMind в основном относятся только к графическому дизайну. Фактически, они являются перегрузкой графического дизайна. 

Одно изображение, созданное студией Novoto, показывает то, что похоже на конфеты тик-так, приближающиеся к какому-то компьютерному интерфейсу. В глубинном обучении – или любой другой форме ИИ – нет ничего, что включало бы тик-таки.

Тик-так, кто-нибудь? Изображения DeepMind, такие как это, разработанные студией Novoto, впечатляют, но не объясняют, что на самом деле происходит в программах искусственного интеллекта.

Текст, сопровождающий тик-таки, также загадочен. “Электронное устройство с большим количеством маленьких объектов на нем”, – гласит описание. “Художественное изображение искусственного интеллекта (ИИ). Это изображение изображает потенциал ИИ для общества через 3D визуализации”. Что это значит, вероятно, мало связано с тик-таками.

Также: Многопредставительный волновой подход ИИ наступает и будет мощным

Сопровождающее видео тик-таков также непонятно, хотя и в какой-то мере завораживающе. Его можно назвать “Марш тик-таков”, но это, возможно, не поможет понять ИИ.

Другое изображение, созданное Весом Коксом, должно изображать “металлическую конструкцию из дерева и металла” и направлено на изображение “метода прогнозирования, используемого в больших языковых моделях”.

Это увлекательная мнимая структура, но неясно, что она делает в предсказании. Также не очень помогает сопровождающее видео, показывающее деревянно-металлическую конструкцию в действии. Оно показывает нечто похожее на аппарат, возможно, гигантский счеты какого-то рода, но что делает это устройство? 

Некоторые изображения настолько фантастичны, что кажется, что они не имеют никакого отношения к чему-либо. Одно изображение, созданное студией XK, изображающее что-то вроде куба из некоторого сорта желеобразной массы, которая, кажется, сбрасывает другие виды клеточной желеобразной массы, снова довольно увлекательно, но не имеет ничего общего с ИИ или чем-либо еще. Заставленный гадать, можно подумать, что это рендеринг процесса образования желе. 

Видео желеобразного объекта показывает, как много всего образуется, что в свою очередь формирует другие объекты. Опять же, кто знает, какие объекты образуются и почему?

Также: Что такое генеративное искусственное интеллекта и почему оно так популярно? Вот все, что вам нужно знать

В сопроводительном тексте объясняется, что изображение и видео “исследуют, как люди могут творчески сотрудничать с искусственным общим интеллектом (AGI) в будущем и как это может предложить новые точки зрения, ускорить процессы и привести к открытию новых территорий”. Помимо того, что не объясняется, что такое AGI, текст так неопределен, что бесполезен. Это случай, когда ни картинка, ни тысяча слов не помогут кому-либо.

Единственное изображение, которое приближается к цели, сделано студией Новото и показывает, что кажется разветвленной конфигурацией. В тексте говорится, что это “вдохновленные нейронные сети, используемые в глубоком обучении”.

Оно приближается к цели, потому что искусственные нейронные сети могут, фактически, рассматриваться в некотором смысле как разветвленные сети, включающие множество элементов в коллективной деятельности. 

Также: Все хотят ответственного искусственного интеллекта, но мало кто что-то делает

На самом деле, странно, что все иллюстрации такие неуместные, потому что в искусственном интеллекте есть богатая традиция иллюстраций. Оригинальные исследования нейронных сетей Фрэнка Розенблатта из аэролаборатории Корнеллского университета, “Персептрон”, запустили 60 лет попыток создания искусственных нейронных сетей. Розенблатт изобразил в своей иллюстрации сеть, состоящую из искусственных нейронов. Она красива своей простотой:

Легко понять хотя бы немного о том, что происходит, потому что сети связей пронизывают нашу жизнь. Схемы станций метро показывают сети связей. Социальный граф Facebook – это совокупность связанных сущностей. Граф связей чего-либо является мощным инструментом – гораздо мощнее, чем странные рендеринги Новото и прочие. 

Можно даже превратить оригинальную техническую диаграмму Розенблатта в изящные изображения. Такие изображения могут быть не конкретными, но они могут передать некоторое представление о системе, которая имеет вход и выход и создает связи между ними:

Нейронная сеть преобразует входные данные, круги слева, в выходные данные справа. Как это происходит – это преобразование весов (центр), которые мы часто путаем с паттернами в самих данных. 

Основная проблема с изображениями DeepMind заключается в том, что художники, кажется, понимают очень мало о ИИ, и поэтому их миссия в основном заключается в создании собственного неосведомленного, импрессионистического изображения того, как они представляют себе ИИ. Это не особенно полезно, если хотите, чтобы публика узнала что-то о том, что фактически происходит с ИИ. 

Также: ИИ идет в Голливуд: навигация по двухстороннему мечу развивающихся технологий в искусстве повествования

Это печально, потому что в области машинного обучения есть много людей, которые прекрасно понимают технологию и создают визуализации. Например, исследовательская группа People+AI в Google создала некоторые хорошие визуализации различных аспектов технологии.  

Иллюстрация от команды People+AI в Google о компромиссе между точностью и конфиденциальностью в машинном обучении.

Бывший член этой группы, профессор Гарвардского университета Мартин Ваттенберг, является настоящим ученым в области визуализации сложных идей. Он известен, в частности, своей работой над картой рынка SmartMoney, разработанной для веб-сайта финансового издания для потребителей, которое вошло в состав MarketWatch в 2013 году.

Существуют люди, которые понимают ИИ и могут в своем роде передать некоторую информацию о нем. Есть также люди, которые отлично владеют визуальным повествованием и объяснением. DeepMind, кажется, пропустили их в пользу дизайнерских студий, которые мало что знают о том и о другом.