Прогнозы искусственного интеллекта о ураганах взволновали мир метеорологических прогнозов

Прогнозы искусственного интеллекта о ураганах вызвали волнение в мире метеорологических прогнозов

Ураган Ли не беспокоил никого в начале сентября, бушуя где-то далеко в море между Африкой и Северной Америкой. Стена высокого давления стояла на его пути на запад, готовая отклонить шторм от Флориды и величественным дуговидным образом направить его на северо-восток. Но куда именно? От момента возможного высадки было еще 10 дней – века в прогнозировании погоды, но метеорологи Европейского центра среднесрочного прогноза погоды (ECMWF) следили за событиями близко. Даже самые маленькие неопределенности могли стать решающими между дождливым днем в Шотландии или серьезными проблемами для северо-востока США.

Обычно синоптики полагаются на модели атмосферной физики, чтобы сделать такой прогноз. На этот раз у них было еще одно средство: новое поколение моделей погоды на основе искусственного интеллекта, разработанных чипмейкером Nvidia, китайским гигантом Huawei и подразделением искусственного интеллекта Google – DeepMind. Для Ли все три модели технологических компаний предсказали путь, который пройдет где-то между Род-Айлендом и Новой Шотландией – прогнозы, которые в целом согласовывались с официальным, основанным на физике прогнозом. Земля в поле зрения, где-то. Конечно, дьявол содержался в деталях.

Синоптики описывают приход моделей искусственного интеллекта языком, который кажется неуместным в их прогнозирующей профессии: “Внезапно”. “Неожиданно”. “Казалось, что оно просто появилось из ниоткуда”, – говорит Марк ДеМария, атмосферный ученый из Колорадского государственного университета, недавно ушедший на пенсию из руководящей должности в отделении Национального центра ураганов США. Когда он начал проект в этом году с Национальным океанографическим и атмосферным управлением США для проверки модели FourCastNet компании Nvidia на реальных данных о штормах в реальном времени, он был “скептиком” новых моделей, говорит он. “Я думал, что нет никаких шансов, что это может сработать”.

ДеМария с тех пор изменил свою позицию. В конце концов, ураган Ли приземлился на границе диапазона прогноза ИИ, достигнув Новой Шотландии 16 сентября. Даже в активный сезон ураганов – на данный момент прошло чуть больше половины, и уже было 16 именованных атлантических штормов – еще рано делать какие-либо окончательные выводы. Но пока что производительность моделей искусственного интеллекта сравнима с традиционными моделями, иногда они даже лучше в отслеживании тропических штормов. И модели искусственного интеллекта делают это быстро, выдавая прогнозы на ноутбуках в течение нескольких минут, в то время как традиционные прогнозы занимают часы вычислительного времени на суперкомпьютере.

Традиционные модели погоды состоят из уравнений, описывающих сложную динамику атмосферы Земли. Подаешь в них данные в реальном времени о таких факторах, как температура, ветер и влажность, и получаешь прогнозы о том, что произойдет дальше. С годами они стали более точными, поскольку ученые улучшают свое понимание атмосферной физики, а собираемые ими данные становятся все более обширными.

В основе своей метеорологи пытаются укротить физику хаоса. В 1960-х годах метеоролог и математик Эдвард Лоренц заложил основы теории хаоса, заметив, что небольшие неопределенности в погодных данных могут привести к сильно отличающимся прогнозам – как в примере с известной бабочкой, чья крыльевая вспышка вызывает торнадо. Он оценил, что состояние атмосферы можно предсказать максимум за две недели вперед. Каждый, кто наблюдал приближение отдаленного урагана или изучал еженедельный прогноз перед свадьбой на открытом воздухе, знает, что прогнозы все еще далеки от этого теоретического предела.

Некоторые надеются, что искусственный интеллект в конечном итоге сможет приблизить прогнозы к этому пределу. Новые модели погоды не имеют встроенной физики. Они работают подобно технологии генерации текста, лежащей в основе ChatGPT. В этом случае алгоритмы машинного обучения не получают правил грамматики или синтаксиса, но они становятся способными подражать им после того, как усваивают достаточно данных для изучения закономерностей использования. Аналогично, новые модели прогнозирования погоды изучают эти закономерности на основе десятилетий физических атмосферных данных, собранных в наборе данных ECMWF, называемом ERA5.

Это, по словам Мэтью Чантри, координатора машинного обучения в ECWMF, который в это время сезона штормов оценивает их производительность, не выглядело гарантированным. Алгоритмы, лежащие в основе ChatGPT, были обучены на триллионах слов, в основном собранных из Интернета, но нет такого обширного образца для атмосферы Земли. Ураганы в частности составляют крошечную долю доступных данных для обучения. То, что предсказанные треки штормов для Ли и других оказались такими хорошими, означает, что алгоритмы уловили некоторые основы атмосферной физики.

Этот процесс имеет свои недостатки. Поскольку алгоритмы машинного обучения фокусируются на наиболее распространенных закономерностях, они имеют тенденцию преуменьшать интенсивность выбросов, таких как экстремальные тепловые волны или тропические штормы, говорит Чантри. И есть пробелы в том, что эти модели могут предсказать. Например, они не предназначены для оценки осадков, которые разворачиваются с более высоким разрешением, чем глобальные погодные данные, используемые для их обучения.

Шакир Мохамед, директор по исследованиям в DeepMind, говорит, что дождь и экстремальные события – погодные явления, которые, по мнению людей, представляют наибольший интерес, – представляют “наиболее сложные случаи” для моделей погоды на основе искусственного интеллекта. Существуют и другие методы прогнозирования осадков, в том числе локализованный радарный подход, разработанный DeepMind, известный как NowCasting, но интеграция этих двух методов является сложной задачей. Более детализированные данные, ожидающиеся в следующей версии набора данных ECMWF, используемого для обучения моделей прогнозирования, могут помочь моделям искусственного интеллекта начать предсказывать дождь. Исследователи также изучают возможности настроить модели таким образом, чтобы они были более склонны предсказывать необычные события.

Одним из сравнений, в которых модели искусственного интеллекта безусловно побеждают, является эффективность. Синоптики и специалисты по управлению чрезвычайными ситуациями все больше нуждаются в так называемых вероятностных прогнозах событий, таких как ураганы – разборе диапазона возможных сценариев и их вероятности. Поэтому синоптики создают ансамблевые модели, которые отображают различные результаты. В случае тропических систем они известны как модели-спагетти, потому что они показывают пучки возможных треков шторма. Но вычисление каждой дополнительной “лапши” может занимать несколько часов.

В отличие от этого, модели искусственного интеллекта могут производить несколько прогнозов за несколько минут. “Если у вас есть модель, которая уже обучена, наша модель FourCastNet работает за 40 секунд на простом старом графическом ускорителе”, – говорит ДеМария. “Таким образом, вы можете сделать целый гигантский ансамбль, который был бы невозможен с физически основанными моделями”.

К сожалению, истинные ансамблевые прогнозы раскрывают две формы неопределенности: как в начальных наблюдениях о погоде, так и в самой модели. Искусственный интеллект не может решить вторую проблему. Эта слабость проистекает из проблемы “черного ящика”, характерной для многих систем машинного обучения. Когда вы пытаетесь предсказать погоду, важно знать, насколько сомневаться в модели. Лингси Си, старший исследователь по искусственному интеллекту в компании Huawei, говорит, что добавление объяснений к прогнозам искусственного интеллекта – это главная просьба от синоптиков. “Мы не можем предоставить удовлетворительный ответ”, – говорит он.

Несмотря на эти ограничения, Си и другие надеются, что модели искусственного интеллекта смогут сделать точные прогнозы более широко доступными. Однако, как говорит Си, перспектива передачи метеорологии, усиленной искусственным интеллектом, в руки каждого все еще находится на растоянии. Чтобы делать прогнозы любого рода, нужны хорошие наблюдения о погоде – с помощью спутников, буев, самолетов, датчиков – пропущенные через такие организации, как NOAA и ECMWF, которые обрабатывают данные в машинночитаемые наборы данных. Исследователи по искусственному интеллекту, стартапы и страны с ограниченными возможностями сбора данных хотят узнать, что они могут сделать с этими первичными данными, но существует множество чувствительных моментов, включая интеллектуальную собственность и национальную безопасность.

Ожидается, что эти большие прогностические центры продолжат тестировать модели, прежде чем будут удалены “экспериментальные” ярлыки. Синоптики по своей сути консервативны, говорит ДеМария, учитывая жизни и собственность, и модели, основанные на физике, не собираются исчезать. Но он считает, что улучшения означают, что уже через один или два урагановых сезона искусственный интеллект будет играть какую-то роль в официальных прогнозах. “Они, конечно, видят потенциал”, – говорит он.