«Искусственный интеллект может в реальном времени копировать навыки социального обучения человека, согласно исследованию DeepMind»

«Искусственный интеллект способен в реальном времени осваивать навыки социального обучения человека, в соответствии с исследованием DeepMind»

Интеллект человека в значительной степени зависит от приобретения знаний от других людей, которые накоплены со временем как часть нашей культурной эволюции. Этот тип социального обучения, известный в литературе как культурная передача, позволяет нам имитировать действия и поведение в режиме реального времени. Но может ли искусственный интеллект (AI) развивать такие социальные навыки обучения?

Имитационное обучение давно является подходом к обучению искусственного интеллекта, при котором алгоритмы наблюдают, как люди выполняют задачу, а затем пытаются повторить их. Но обычно AI-инструментам требуется несколько примеров и доступ к огромным объемам данных, чтобы успешно повторить своего тренера.

Теперь, по результатам передового исследования исследователей из команды DeepMind, AI-агенты также могут демонстрировать навыки социального обучения в режиме реального времени, имитируя человека в новых контекстах “без использования собранных вручную данных о людях”.

Конкретно, команда сосредоточилась на определенной форме культурной передачи, известной как наблюдательное обучение или (накопление небольшого количества данных) имитация, которая относится к копированию движений тела.

DeepMind провела свой эксперимент в виртуальной среде под названием GoalCycle3D, виртуальном мире с неровным рельефом, тропинками и препятствиями, которые AI-агенты должны были преодолеть.

Чтобы помочь AI-системе научиться, исследователи использовали обучение с подкреплением. Для тех, кто не знаком с работой Павлова в этой области, этот метод основан на даче награды за каждое поведение, облегчающее обучение и достижение желаемого результата – в данном случае, нахождение правильного пути.

На следующем этапе команда добавила опытных агентов (либо встроенных в программу, либо контролируемых людьми), которые уже знали, как перемещаться в данной симуляции. AI-агенты быстро поняли, что лучший способ достижения цели – учиться у экспертов.

Наблюдения исследователей были двоякими. Во-первых, они обнаружили, что ИИ не только быстрее учился, имитируя экспертов, но и применял полученные знания на других виртуальных трассах. Во-вторых, DeepMind обнаружила, что ИИ-агенты могут по-прежнему использовать свои новые навыки даже в отсутствие экспертов, что, по мнению авторов исследования, является примером социального обучения.

В ходе дальнейших исследований авторы замечают, что требуется больше исследований, и они считают, что их метод может проложить путь “для культурной эволюции, играющей алгоритмическую роль в развитии искусственного обобщенного интеллекта”. Они также с нетерпением ждут дальнейшего междисциплинарного сотрудничества между областями искусственного интеллекта и культурной эволюционной психологии.

Несмотря на то, что работа DeepMind находится на ранней стадии, ее прорыв может иметь значительные последствия для индустрии искусственного интеллекта. Такой прогресс имеет потенциал для уменьшения традиционного, ресурсоемкого обучения алгоритмов, одновременно повышая их способности к решению проблем. Это также поднимает вопрос о том, сможет ли искусственный интеллект когда-либо научиться усваивать социальные и культурные элементы человеческой мысли.

Полное исследование опубликовано в журнале Nature Communications.