Новая ИИ компания DeepMind управляет роботизированными задачами без специальной подготовки

Новая ИИ компания DeepMind управляет роботами без подготовки

Google DeepMind представила новую модель искусственного интеллекта, способную управлять роботизированными задачами, для которых она никогда не была обучена.

Модель RT-2 изучает данные из Интернета и робототехнических источников, а затем превращает эту информацию в простые инструкции для машин.

В ходе испытаний модели было предложено выполнить действия, которые не встречались в робототехнических данных, например, поместить апельсины в соответствующую чашу. Для выполнения таких команд системе требовалось перевести знания из данных, полученных из Интернета. По словам DeepMind, модель имела 62% успеха в этих операциях, что в два раза превышает показатели ее предшественника RT-1.

«Так же, как языковые модели обучаются на текстах из Интернета для изучения общих идей и концепций, RT-2 переносит знания из веб-данных для формирования роботического поведения», – сказал Винсент Ванхуке, руководитель отдела робототехники в DeepMind. «Другими словами, RT-2 может говорить на языке роботов».

RT-2 была протестирована на различных навыках робототехники, которые не присутствовали в робототехнических данных. Кредит: Google DeepMind

Испытания показали, что RT-2 обладает впечатляющими возможностями обобщения. Она также имеет улучшенное семантическое и визуальное понимание робототехнических данных, с которыми ранее не сталкивалась.

Заметно, что модель может использовать элементарное логическое мышление для выполнения новых команд пользователя. Впечатляющим является ее способность осуществлять многовариантное семантическое мышление. Например, при инструкции подобрать объект, который можно использовать в качестве молотка, RT-2 правильно определила, что лучшим вариантом является камень.

В одном из тестов RT-2 определила, что камень лучше всего подойдет в качестве самодельного молотка. Кредит: Google DeepMind

В рамках другой оценки модели была дана команда толкнуть бутылку с кетчупом в сторону синего куба.

На сцене находилось несколько предметов, но единственный предмет из обучающего набора данных был куб. Тем не менее, RT-2 успешно толкнула бутылку с кетчупом в указанном направлении.

RT-2 успешно справилась с задачами в реальной среде. Кредит: Google DeepMind

DeepMind называет RT-2 прорывом в области искусственного интеллекта. Лондонская лаборатория утверждает, что модель приближает нас к будущему помощников-роботов.

«RT-2 не только показывает, как прогресс в области искусственного интеллекта быстро проникает в робототехнику, но и предлагает огромные возможности для создания универсальных роботов», – сказал Ванхуке. «Хотя остается еще много работы для создания полезных роботов в условиях, ориентированных на человека, RT-2 показывает нам захватывающее будущее робототехники, которое уже наступило».

Статью о RT-2 можно прочитать здесь.