«Почему остановка прогресса искусственного интеллекта более вероятна, чем мировое господство»

«Почему остановка прогресса искусственного интеллекта - это более вероятный сценарий, чем мировое господство»

Существует нарастающий дефицит мировой вычислительной мощности, который нельзя устойчиво решить таким способом, как сейчас.

Простыми словами, из-за экспоненциального роста моделей искусственного интеллекта (ИИ) и продолжающейся глобальной цифровой трансформации центры обработки данных иссякают. Их уровень занятости достигает рекордно низких значений, а цены растут в ответ на спрос, что вызывает беспокойство среди руководителей в технологической сфере.

Если эта тенденция продолжится, мы достигнем точки, где больше не сможем выполнить все, что теоретически позволяет технология, потому что наша способность обрабатывать данные будет ограничена.

Возможно, самое большое беспокойство заключается в том, что потенциал трансформации ИИ, который мы только начинаем использовать, будет ограничен чисто физическими ограничениями. Это помешает новым открытиям и развитию более совершенных моделей машинного обучения, что плохая новость для всех, кроме сторонников “апокалипсиса от ИИ”.

Есть ли способ избежать кризиса в области вычислительных мощностей? Поскольку существенно снизить потребности в вычислительных мощностях не представляется возможным, единственным альтернативным вариантом является существенное увеличение мощностей, что сводится к двум доступным курсам действий: строительство дополнительных центров обработки данных и развитие лучшей цифровой инфраструктуры.

Но это гораздо сложнее, чем кажется.

Почему дополнительные центры данных не являются ответом

До настоящего времени увеличение спроса на вычислительные мощности частично компенсировалось строительством дополнительных центров обработки данных, причем консервативные оценки показывают, что площадь, занимаемая центрами обработки данных, растет примерно на 40% ежегодно. Эта цифра, скорее всего, останется стабильной, поскольку проблемы с поставками, энергетическими вызовами и задержками в строительстве серьезно ограничивают возможности масштабирования и расширения вычислительных мощностей.

Другими словами, сегодня спрос не может быть удовлетворен путем простого повышения строительства центров обработки данных.

И это не то, что нам следует стремиться к. Каждый из этих центров, по размерам сравнимый с футбольное поле, потребляет гигантские объемы энергии и воды, оказывая серьезное давление на окружающую среду, как на местном, так и на глобальном уровнях. Один центр обработки данных может потреблять столько же электроэнергии и воды, сколько 50 000 домов, а углеродный след облака уже превышает след авиационной индустрии.

Справедливости ради, центры обработки данных проделали большую работу по минимизации их воздействия на окружающую среду. Это в значительной степени благодаря энергичной гонке за устойчивость, которая способствовала инновациям, особенно в области охлаждения и энергоэффективности. В наше время вы можете найти центры обработки данных в подземных шахтах, на море и использовать другие естественные возможности охлаждения, такие как течения фьордов, все это с целью сокращения энергопотребления и воды.

Проблема в том, что это невозможно в глобальном масштабе, и исчезновение наших морей – не жизнеспособный путь вперед. Строительство дополнительных центров обработки данных – несмотря на их эффективность – продолжит наносить ущерб местным экосистемам и препятствовать национальным и международным усилиям по сохранению окружающей среды. И все это при отсутствии возможности удовлетворить потребность в ресурсах вычислений.

Тем не менее, две микросхемы лучше, чем одна, пока…

Думайте в рамках

… пока эта одна микросхема работает вдвое быстрее. Чтобы избежать кризиса вычислительных мощностей, все надежды лежат на улучшении цифровой инфраструктуры, а именно на микросхемах, коммутаторах, проводах и других компонентах, которые могут улучшить скорость и пропускную способность передачи данных при снижении энергопотребления.

Позвольте мне повторить – эволюция искусственного интеллекта зависит от того, как найти способы передачи большего объема данных без увеличения энергопотребления.

По сути, это означает две вещи. Во-первых, разработку более мощных и сфокусированных на искусственном интеллекте микросхем. Во-вторых, улучшение скорости передачи данных.

1. Разработка специальных чипов для искусственного интеллекта

Существующая цифровая инфраструктура не особенно подходит для эффективной разработки моделей машинного обучения. Универсальные центральные процессоры (ЦПУ), которые до сих пор являются основными вычислительными компонентами в центрах обработки данных, испытывают трудности с выполнением специфических для искусственного интеллекта задач из-за их недостатка в специализации и вычислительной эффективности.

Когда дело доходит до искусственного интеллекта, графические процессоры (ГПУ) справляются намного лучше за счет лучших вычислительных возможностей, более высокой энергоэффективности и параллелизма. Вот почему все стремятся их приобрести, что привело к дефициту чипов.

Тем не менее, ГПУ также сталкиваются с теми же проблемами. Они не оптимизированы для задач искусственного интеллекта, что приводит к потере энергии и субоптимальной производительности при обработке все более сложных и требовательных данных в современных применениях искусственного интеллекта.

Вот почему компании, такие как IBM, разрабатывают чипы, подходящие для вычислительных требований искусственного интеллекта, которые обещают извлекать максимальную производительность, минимизируя потребление энергии и пространства.

2. Улучшение пропускной способности передачи данных

Современные модели искусственного интеллекта не работают на одной микросхеме. Вместо этого для максимального использования доступных ресурсов используются несколько чипов, объединенных в кластеры. Эти кластеры часто являются частью более крупных сетей, каждая из которых предназначена для выполнения определенных задач.

Соответственно, важным компонентом является взаимосвязь или система обеспечения связи между чипами, кластерами и сетями. Если она не может сопровождать скорость остальной части системы, это рискует стать узким местом, препятствующим эффективной работе.

Проблемы пропускной способности устройств передачи данных отражают проблемы с чипами: они должны работать со скоростью, потреблять минимум энергии и занимать минимальное физическое пространство. Поскольку традиционные электрические интерконнекты почти исчерпывают свои возможности в отношении пропускной способности и энергоэффективности, все глаза обращены на оптические вычисления, в частности, на кремниевую фотонику.

В отличие от электрических систем, оптические системы используют свет для передачи информации, что обеспечивает ключевые преимущества в ключевых областях – фотонные сигналы могут передаваться со скоростью света и нести более высокую плотность данных. Кроме того, оптические системы потребляют меньше энергии, и фотонные компоненты могут быть гораздо меньше размером по сравнению с электрическими аналогами, что позволяет создавать более компактные чипы.

Оперативные слова здесь – “могут быть”.

Болезненные переживания передовых технологий

Оптические вычисления, несмотря на свою высокую скорость и энергоэффективность, сталкиваются с проблемами уменьшения размеров, совместимости и стоимости.

Оптические коммутаторы и другие компоненты могут быть более массивными и сложными по сравнению с электронными аналогами, что создает проблемы в достижении такого же уровня уменьшения размеров. На данный момент мы еще не нашли материалы, которые могли бы служить эффективной оптической средой и могли бы масштабироваться для вычислений с высокой плотностью.

Принятие также представляет собой серьезное испытание. Центры обработки данных обычно оптимизированы для электронной, а не оптической обработки, и интеграция оптических компонентов с существующими электронными архитектурами представляет собой серьезную проблему.

Плюс, как и в случае с любой передовой технологией, оптические вычисления еще не доказали свою эффективность на практике. Существует серьезный дефицит исследований по долговременной надежности оптических компонентов, особенно в условиях больших нагрузок и высокого напряжения, характерных для центров обработки данных.

И чтобы завершить все это – специализированные материалы для оптических компонентов являются дорогостоящими, что делает их широкое применение потенциально невыгодным с точки зрения затрат, особенно для маленьких центров обработки данных или тех, которым необходимо соблюсти бюджетные ограничения.

Так что, движемся ли мы достаточно быстро, чтобы избежать кризиса?

Вероятно, нет. Определенно нет на короткую перспективу, чтобы прекратить строительство центров обработки данных.

Если вам угодно, знайте, что ученые и инженеры очень хорошо осознают эту проблему и упорно работают над поиском решений, которые не уничтожат планету, постоянно расширяя границы и достигая значительных прорывов в оптимизации центров обработки данных, разработке чипов и во всех аспектах оптических вычислений.

Моя команда одна только взломала три мировых рекорда скорости передачи данных в центрах обработки данных с использованием метода модуляции интенсивности и прямой детекции.

Но здесь есть серьезные сложности, и важно решить их прямо сейчас, чтобы современные технологии могли реализовать свой полный потенциал.

Профессор Оскарс Озолиньш получил степень Dr.sc.ing. в области оптической связи в Рижском техническом университете (Латвия) в 2013 году и степень хабилитации по физике с специализацией в оптической коммуникации в Королевском институте технологий KTH в 2021 году. Он является автором около 270 международных публикаций в журналах, конференционных материалов, приглашенных докладов/учебных курсов/пленарных докладов/лекций, патентов и глав книг. Вы можете следить за ним на LinkedIn здесь.