Не рассчитывайте на суперкомпьютер Dojo от Tesla, чтобы запустить революцию в области искусственного интеллекта

Don't count on Tesla's Dojo supercomputer to revolutionize artificial intelligence

Чтобы сделать ставку против идеи применения большей вычислительной мощности и данных к машинному обучению – рецепта, благодаря которому появился ChatGPT – требуется быть довольно смелым. Тем не менее, быть еще смелее – ставить на то, что эта комбинация приведет к конкретным прорывам или достижениям в определенные сроки, несмотря на их желательность.

Отчет, опубликованный на прошлой неделе инвестиционным банком Morgan Stanley, предсказывает, что суперкомпьютер под названием Dojo, который Tesla строит для улучшения работы в области автономного вождения, может добавить 500 миллиардов долларов к стоимости компании, обеспечивая огромное преимущество в автопроизводстве, роботакси и продаже программного обеспечения другим компаниям.

Отчет поднял цену акций Tesla, добавив более 6 процентов или 70 миллиардов долларов – примерно столько, сколько стоит BMW и намного меньше, чем заплатил Элон Маск за Twitter – к капитализации производителя электромобилей на 13 сентября.

Отчет Morgan Stanley в 66 страниц интересно почитать. В нем приводятся аргументы в пользу того, что Dojo, специальные процессоры, разработанные Tesla для запуска алгоритмов машинного обучения и огромное количество данных о вождении, собираемых компанией от автомобилей Tesla на дорогах, могут принести огромные дивиденды в будущем. Аналитики Morgan Stanley говорят, что Dojo обеспечит прорывы, которые дадут Tesla “асимметричное” преимущество перед другими производителями автомобилей в области автономного вождения и разработки продуктов. В отчете даже утверждается, что суперкомпьютер поможет Tesla войти в другие отрасли, где критическим является компьютерное зрение, включая здравоохранение, безопасность и авиацию.

Есть веские причины быть осторожными по отношению к этим грандиозным заявлениям. Вы можете понять, почему в этот особенный момент искусственного интеллекта стратегия Tesla может показаться такой завораживающей. Благодаря замечательному скачку возможностей базовых алгоритмов, потрясающие способности ChatGPT могут быть прослежены до простого уравнения: больше вычислений x больше данных = больше умения.

Волшебники из OpenAI были ранними сторонниками этой формулы “moar”, ставя свою репутацию и миллионы своих инвесторов на то, что увеличение инженерной инфраструктуры для искусственных нейронных сетей приведет к большим прорывам, включая модели языка, подобные тем, которые обеспечивают работу ChatGPT. В годы, предшествующие основанию OpenAI, та же самая тенденция наблюдалась в области распознавания изображений, когда увеличение объема данных и более мощные компьютеры привели к удивительному скачку в способности компьютеров распознавать – хотя и на поверхностном уровне – что показывает изображение.

Новая биография Маска, написанная Уолтером Айзексоном, которая была широко цитирована на протяжении прошлой недели, описывает то, как последняя версия оптимистически названного программного обеспечения Full Self Driving (FSD) Tesla, которое направляет его автомобили по оживленным улицам, полагается менее на жестко заданные правила и больше на нейронную сеть, обученную имитировать хорошее вождение человека. Это похоже на то, как ChatGPT учится писать, поглощая бесконечные примеры текста, написанного людьми. Маск заявил в интервью, что ожидает, что Tesla в ближайший год или около того достигнет “момента ChatGPT” с FSD.

Маск много раз делал крупные обещания о прорывах в автономном вождении, включая прогноз, что к концу 2020 года будет миллион роботакси Tesla. Итак, давайте тщательно рассмотрим этот вопрос.

Разработка собственных микросхем машинного обучения и создание Dojo позволит Tesla, безусловно, сэкономить деньги на обучении ИИ-систем, стоящих за FSD. Это может помочь компании больше улучшить свои алгоритмы вождения с использованием реальных данных о вождении, которые собирает из своих автомобилей, которых у конкурентов нет. Но то, преодолеет ли эти улучшения точку перегиба в автономном вождении или в компьютерном зрении в целом, кажется практически невозможным предсказать.

Во-первых, FSD не очень похож на ChatGPT. Как объяснили инженеры компании во время ее события AI Day в прошлом году, этот функционал работает на нескольких программах и системах машинного обучения, предназначенных для решения множества различных задач на дороге, таких как управление или декодирование дорожной разметки. Больше данных и больше вычислений могут привести к значительным прорывам в некоторых из них, но большой скачок в автономном вождении требует значительных скачков во многих или всех этих подсистемах. Замечательные общие возможности ChatGPT, напротив, были обеспечены улучшением одной основной системы – монолитного алгоритма, который разворачивает текст.

Еще одна проблема: видео и другие данные сенсоров фундаментально отличаются от текста. На прошлой неделе я встретился с робототехниками, которые объяснили, что центральным вопросом для их области является то, может ли масштабирование, позволившее обеспечить новые возможности в ChatGPT, перенестись на робототехнику, включая восприятие, навигацию и рассуждение. Вы можете создать суперкомпьютер для работы над этими проблемами. Но обучение на основе видеоданных требует гораздо большей вычислительной мощности, чем обработка текста, и для достижения фундаментальных прорывов может потребоваться экспоненциально больше. Никто – ни Tesla, ни Morgan Stanley – не знает наверняка, сколько данных или насколько большой суперкомпьютер необходим для достижения фундаментальных прорывов в робототехнике.

Третьей трудностью в доминировании Dojo от Morgan Stanley является идея о том, что прогресс в автономном вождении передастся на другие проблемы. Научиться водить машину требует обширного понимания физического мира, но это не научит машину ничему о том, как функционировать в мире за пределами относительно контролируемого мира шоссе с его правилами и дорожными знаками.

Я спросил Кристиана Гердеса, соруководителя Центра автомобильных исследований в Стэнфорде (CARS), что он думает о подходе Tesla. Он ответил по электронной почте из автотрека в Португалии, где он тестирует самоуправляемую систему, разработанную в его лаборатории. Гердес говорит, что в его области возрастает уверенность в том, что возможности самоуправления машин масштабируются с помощью данных и вычислительной мощности, но пока неясно, насколько далеко это может зайти. “У нас есть относительно простые нейронные сети, обучающиеся физике гонок”, – говорит Гердес о своих собственных экспериментах. “Результаты довольно хорошие, но, интересно, они не всегда улучшаются с увеличением объема данных”.

Возможно, все, что вам нужно, – это еще больше данных и кремния. По оценкам отчета Morgan Stanley, в ближайшее время мы узнаем, верно ли это. Он предсказывает, что следующая версия FSD будет представлена на Tesla AI Day в начале 2024 года и продемонстрирует, что Tesla сделала фундаментальные прорывы в автономном вождении благодаря Dojo.

Возможно. Но, учитывая рекорд Tesla в обещаниях о неминуемой автономной утопии, я бы не ставил на это, и не инвестировал.