«Фей-Фей Ли начала революцию в области искусственного интеллекта, видя мир так, как видит алгоритм»

«Фей-Фей Ли начала переворот в области искусственного интеллекта, увидев мир глазами алгоритма»

В начале пандемии агент – литературный, не программный – предложил Фей-Фей Ли написать книгу. Это было логичным предложением. Она оставила неизгладимый след в области искусственного интеллекта, возглавив проект, начатый в 2006 году и названный ImageNet. Он классифицировал миллионы цифровых изображений, став основной тренировочной площадкой для систем искусственного интеллекта, которые сегодня потрясают наш мир. Ли в настоящее время является основным соучредителем Института искусственного интеллекта, ориентированного на человека, в Стэнфорде (HAI), чьё название само по себе является призывом к сотрудничеству, если не сосуществованию, между людьми и интеллектуальными машинами. Приняв вызов агента, Ли провела год на карантине, выбивая черновик. Но когда ее соучредитель в HAI, философ Джон Этчеменди, прочитал его, он сказал ей начать сначала – в этот раз включив свой собственный путь в этой области. “Он сказал, что среди технически подкованных людей достаточно тех, кто может прочитать книгу об искусственном интеллекте”, – говорит Ли. “Но я упускала возможность рассказать всем молодым эмигрантам, женщинам и людям с разным происхождением, что они тоже могут заниматься искусственным интеллектом.”

Текстовый формат

Зарегистрироваться для доступа к тексту

Ли – человек, который не любит говорить о себе. Однако она обдуманно решила, как интегрировать свой опыт эмигранта, который прибыл в Соединенные Штаты, будучи 16-летней, не зная языка, и преодолел преграды, чтобы стать ключевой фигурой в этой переломной технологии. По пути к своей текущей должности она также была директором лаборатории искусственного интеллекта в Стэнфорде и главным ученым в области искусственного интеллекта и машинного обучения в Google Cloud. Ли говорит, что ее книга “Миры, которые я вижу” структурирована как двойная спираль, сочетающая ее личное стремление и траекторию искусственного интеллекта воедино. “Мы по-прежнему видим себя через отражение того, кто мы такие”, – говорит Ли. “Частью этого отражения является и сама технология. Самый трудноувидимый мир – это мы сами.”

Наиболее впечатляющим образом в ее рассказе слились воедино ImageNet и его создание и реализация. Ли описывает свое решимость противостоять тем, включая ее коллег, которые сомневались, что возможно маркировать и классифицировать миллионы изображений, с по крайней мере 1 000 примеров для каждой из огромного списка категорий, начиная от подушек до скрипок. Для этого потребовалась не только техническая смелость, но и пот ее и тысячи других людей (спойлер: сервис Mechanical Turk от Amazon помог решить эту задачу). Проект можно понять только, когда мы понимаем ее личный путь. Отвага, с которой она взялась за такой рискованный проект, возникла благодаря поддержке ее родителей, которые, несмотря на финансовые трудности, настаивали, чтобы она отказалась от высокооплачиваемой работы в бизнес-мире ради осуществления своей мечты – стать ученым. Реализация этого амбициозного проекта стала воплощением их жертвы.

Приношение было глубоким. Ли описывает, как создание ImageNet потребовало от нее смотреть на мир так, как это делают алгоритмы искусственных нейронных сетей. Когда она встречала собак, деревья, мебель и другие объекты в реальном мире, ее ум теперь проникал сквозь инстинктивную категоризацию ее восприятия, чтобы ощущать, какие аспекты объекта могут раскрыть его сущность для программного обеспечения. Какие визуальные подсказки позволят цифровому интеллекту определить эти вещи и, далее, способны ли они определить различные подкатегории – бигли против грейхаундов, дуб против бамбука, стул Eames против кресла Mission? В книге есть увлекательная секция, посвященная тому, как ее команда пыталась собрать изображения каждой возможной модели автомобиля. Когда ImageNet был завершен в 2009 году, Ли организовала конкурс, в котором исследователи использовали набор данных для обучения своих алгоритмов машинного обучения, чтобы узнать, смогут ли компьютеры достичь новых высот в идентификации объектов. В 2012 году победителем стал AlexNet, созданный в лаборатории Джеффри Хинтона в Торонтском университете, который значительно превзошел предыдущих победителей. Можно сказать, что сочетание ImageNet и AlexNet заложило фундамент глубинного обучения, которое до сих пор вдохновляет нас и поддерживает ChatGPT.

То, чего Ли и ее команда не поняли, заключается в том, что новый способ восприятия мира также может быть связан с трагической склонностью человечества позволять предубеждениям окрашивать наш взгляд на мир. В своей книге она описывает свою “совестьные колкости”, когда стало известно, что Google ошибочно изображает чернокожих людей как горилл. Следовали и другие удручающие примеры. “Когда интернет демонстрирует в основном белое, западное и часто мужское представление об повседневной жизни, у нас возникают трудности понимания каждого”, – пишет Ли, осознавая свою ошибку с задержкой. Именно поэтому она решила запустить программу под названием AI4All, чтобы привлечь женщин и представителей меньшинств в эту область. “Когда мы были пионерами ImageNet, мы знали далеко не все, что мы знаем сегодня”, – говорит Ли, ясно указывая, что она использовала “мы” в коллективном смысле, а не только в отношении своей небольшой команды. “Мы массово развились с тех пор. Но если есть то, что мы сделали не так хорошо, нам нужно это исправить.”

В день, когда я говорил с Ли, The Washington Post опубликовала длинную статью о том, как предубеждение в машинном обучении все еще остается серьезной проблемой. Современные ГИС-генераторы изображений, такие как Dall-E и Stable Diffusion, все еще проявляют стереотипы при интерпретации нейтральных заданий. Когда просят нарисовать “продуктивного человека”, системы обычно показывают белых мужчин, но запрос на “человека в социальных службах” часто показывает людей цвета. Является ли ключевой изобретательницей ImageNet, точкой отсчета внедрения человеческого предубеждения в искусственный интеллект, уверена, что проблему можно решить? “Уверенность – слишком простое слово”, – говорит она. “Я осторожно оптимистична, что существуют и технические решения, и решения в сфере управления, а также рыночные требования быть лучше и лучше.” Этот осторожный оптимизм также относится к способу, которым она говорит о пугающих предсказаниях того, что искусственный интеллект может привести к исчезновению человечества. “Я не хочу создавать ложное чувство, что все будет хорошо”, – говорит она. “Но я также не хочу создавать чувство уныния и безысходности, потому что людям нужна надежда.”

Ли считает, что важным элементом в дальнейшем развитии искусственного интеллекта будет финансирование, чтобы следующие прорывы, подобные ImageNet, происходили не только от коммерческих предприятий, сосредоточенных на прибыли и не сгорающих от желания поделиться с общественностью, но и от академического и государственного секторов. В прошлом июне она вошла в небольшую группу ученых, экспертов и критиков по искусственному интеллекту, которые лично встречались с Джо Байденом, когда президент посетил Сан-Франциско. Она призвала правительство финансировать больше крупных проектов по искусственному интеллекту. “Если мы отнимаем ресурсы у публичного сектора, мы делаем зло следующему поколению”, – сказала она ему. (Обратите внимание, она не сказала, что такое лишение эквивалентно убийству, как утверждал Марк Андрессен в его недавней 5200-словной речи в духе Айн Рэнда.)

И что президент сказал Ли, когда она предложила такие крупные проекты? “Ну, он не выписал чек прямо там”, – говорит она. “Но он проявил интерес”. Она указывает на то, что недавний широкий указ президента о искусственном интеллекте содержит раздел о вложениях в публичный сектор. Ли не склонна публично хвастаться успехами, но похоже, что она достигла желаемого результата. Возможно, такие инвестиции делают вероятнее то, что следующий прорыв в масштабе ImageNet в области искусственного интеллекта произойдет от кого-то вроде Ли, который не сразу перешел в Google или какую-то стартап-компанию.

В своей книге Фей-Фей Ли описывает возрождение забытой лаборатории искусственного интеллекта Стэнфорда в здании Гейтса на ухоженном кампусе университета. Но как я описывал почти 40 лет назад в своей книге Хакеры, первоначальная лаборатория SAIL была чем-то особенным. Обратите внимание на представление Интернета в конце этого отрывка.

[Расположение SAIL] – полукруглое бетонно-стеклянное здание красного дерева, которое раньше было конференц-центром на холмах с видом на кампус Стэнфорда. Внутри этого здания хакеры работали за 64 терминалами, разбросанными по разным офисам. Вместо боевых образов выстрелов в космической научной фантастике, которые царили в Tech Square [MIT], у Стэнфорда была нежная легенда об эльфах, хоббитах и волшебниках, описанная в “Трилогии Средиземья” Дж. Р. Р. Толкина. Комнаты в лаборатории ИИ назывались именами мест из Средиземья, а принтер SAIL был настроен так, чтобы он мог работать с тремя разными эльфийскими шрифтами…

Не прошло много времени, как хакеры из SAIL заметили, что пространство между низким подвесным потолком и комнатой может служить удобной спальной нишей, и несколько из них действительно жили там в течение нескольких лет. Один из хакеров системы провел ранние 1970-е годы, живя в своей неисправной машине, припаркованной на парковке у здания – раз в неделю он ездил на велосипеде в Пало Альто за снабжением. Другой альтернативой для еды был Prancing Pony, автомат по продаже продуктов питания в SAIL, загруженный здоровой пищей и пельменями из местного китайского ресторана. Каждый хакер имел учетную запись на Prancing Pony, обслуживаемую компьютером.

Стэнфорд и другие лаборатории, будь то университеты, такие как Карнеги-Меллон, или исследовательские центры, такие как Исследовательский институт Стэнфорда, приблизились друг к другу, когда ARPA связала их компьютерные системы через систему связи. Эта “ARPAnet” была в значительной степени олицетворением хакерской этики, поскольку среди ее ценностей было убеждение в том, что системы должны быть децентрализованными, содействовать исследованиям и стимулировать свободный поток информации. С компьютера на любом “узле” ARPAnet вы могли работать так, как если бы сидели у терминала отдаленной компьютерной системы. Люди отправляли друг другу огромное количество электронной почты, обменивались техническими эзотериками, сотрудничали в проектах, играли в “Приключение”, заводили близкие дружеские отношения с хакерами, которых они еще не встречали лично, и поддерживали контакт с друзьями из мест, где они раньше хакерились.

Лиен спрашивает: “Могут ли великие идеи приходить от великих измененных умов? Не следует ли умным людям немного больше изменять свое мышление в наше время?”

Привет, Лиен. Я предполагаю, что ты говоришь о психоделиках, которые сейчас очень популярны. И, конечно, они оказали свое влияние на некоторых лучших технических специалистов. На недавнем подкасте Джо Рогана, Сэм Альтман, под влиянием энтузиазма ведущего, прославил добродетель психоделической терапии. И Стив Джобс сказал журналисту Джону Маркоффу, что принятие LSD “было одним из двух или трех самых важных дел в его жизни.” Подумай об этом, когда возьмешь в руки свой iPhone 58 раз в день.

Но это не только химические вещества меняют наши мысли. Как я объясняю в вышеупомянутой статье, мысли Фей-Фей Ли изменялись при виде того, как нейронные сети видят мир. И ей не нужно было посещать аптеку или торговца! На мой взгляд, наиболее приводящие в отрыв мысли находятся на полках книжных магазинов и библиотек. Между обложками этих томов находятся идеи, которые могут расширить даже самые преисполненные умы. И я сомневаюсь в интеллекте тех, кто не читает. Примером этому является крипто-мошенник Сэмюэль Банкман-Фрид, который сказал, что нет смысла читать книги, и “если бы ты написал книгу, то значит тебе это не удалось, и оно должно было стать шестипараграфным блог-постом.” Может быть, Сэм увидит свои ошибки и изменит свое мышление в библиотеке тюрьмы.

Вы можете задавать вопросы на [email protected]. Укажите в теме письма ASK LEVY.

Вампирские летучие мыши направляются в США. В худшем случае – случаи бешенства и еще больше сиквелов Сумерек.

Мое эксклюзивное предварительное видео ТГЛ, в котором происходит переосмысливание гольфа как высокотехнологичной телевизионной стадионной соревновательной дисциплины. В этом задействован Тайгер!

Как наблюдение и видео, снятое на сотовый телефон, стали гражданским языком Сан-Франциско.

Хотите освободить свинью? Ознакомьтесь с руководством по операциям для более деструктивной радикальной группы освобождения животных.

Закрепите эту AI гаджет на груди, чтобы (возможно) избавиться от зависимости от смартфона.