Исследовательский центр в области искусственного интеллекта – Cerebras – имеет ‘монструозный год’ в гибридном вычислении искусственного интеллекта

Центр исследований по искусственному интеллекту Cerebras имеет феноменальный год в области гибридных вычислений

cerebras-ceo-andrew-feldman-with-packaged-condor-galaxy

Основатель Cerebras Эндрю Фелдман на упаковочных ящиках для Condor Galaxy 1, или “CG-1” — массово-параллельного ИИ-компьютера, разработанного для клиента G42.

Мир страдает от нехватки графических процессорных чипов от лидера рынка искусственного интеллекта Nvidia. Это пока не привело к значительному росту продаж конкурентов Advanced Micro Devices и Intel. Но это может способствовать развитию новой модели вычислений.

“Сейчас сложно найти альтернативу Nvidia”, — сказал Эндрю Фелдман, сооснователь и генеральный директор стартапа по ИИ-вычислениям Cerebras Systems, который продает массовый ИИ-компьютер CS-2, работающий на самом большом в мире чипе.

Также: Nvidia усиливает свой “суперчип” Грейс-Хоппер более быстрой памятью для ИИ

Четыре года назад Фелдман и его команда начали продавать компьютеры, чтобы конкурировать с графическими процессорами Nvidia. В развитии бизнеса произошли интересные изменения. Сейчас у Cerebras все больше продаж массово параллельных систем, которые компания строит в течение нескольких месяцев и затем работает от имени клиентов в качестве специализированного облачного сервиса для ИИ-вычислений.

Для Cerebras бизнес “полностью изменился”, — сообщил Фелдман ENBLE. “Вместо покупки одной или двух машин и запуска на них вычислительных заданий в течение недели, клиенты предпочитают запускать их на 16 машинах в течение нескольких часов в модели облачного сервиса”.

Результатом для Cerebras стало то, что “в случае продаж аппаратного обеспечения можно сделать меньше, но более крупных сделок, а также затратить много времени и усилий на управление своим собственным облачным сервисом”, — отметил Фелдман.

В понедельник на суперкомпьютерной конференции в Денвере, называемой SC23, Фелдман и его команда представили последнее достижение этого развивающегося облачного сервиса для ИИ.

Также: Cerebras только что построила гигантскую компьютерную систему с 27 миллионами ИИ-ядер

Компания объявила, что завершила создание массового ИИ-компьютера Condor Galaxy 1, или “CG-1”, созданного для клиента G42 — инвестиционной фирмы, основанной пять лет назад в Абу-Даби, Объединенные Арабские Эмираты.

“Теперь у нас есть такая большая вычислительная мощность, что другие люди используют наши системы самыми разными способами”, — сказал Фелдман о Condor Galaxy.

Condor Galaxy, о котором было объявлено в начале этого года, назван в честь спиральной галактики, находящейся на расстоянии 212 миллионов световых лет от Земли. Эта машина представляет собой совокупность из 64 компьютеров CS-2 от Cerebras. Стоимость CG-1, сообщил Фелдман, составляет несколько меньше, чем стоимость эквивалентного количества графических процессоров Nvidia, примерно 150 миллионов долларов, основываясь на цене 8-системного компьютера “DGX” от Nvidia.

“Это очень хороший бизнес”, — сказал Фелдман о сделках с такими крупными суммами. “У нас настоящий заяц” в плане продаж, — добавил он.

Кроме того: Почему Nvidia учит роботов крутить ручки и как помогает генеративное искусственное интеллект

Система Condor Galaxy физически находится не в Абу-Даби, а установлена на объектах компании Colovore, размещающейся в Санта-Кларе, штат Калифорния, и составляющей конкуренцию на рынке облачных услуг с такими компаниями, как Equinix.

Cerebras начинает строительство второй версии Condor Galaxy, номер два или “CG-2”, который добавит еще 64 компьютера и еще 4 эксаФЛОПС вычислительной мощности. (ЭксаФЛОПС это миллиард миллиардов операций с плавающей запятой в секунду, см. Википедию), что в совокупности составит 8 эксаФЛОПС для системы Condor Galaxy.

Ожидается, что система Condor Galaxy в своей окончательной конфигурации будет иметь 36 эксаФЛОПС, используя 576 компьютеров CS-2, каждый из которых управляется 654 000 ядрами процессоров AMD.

Согласно новой гибридной модели бизнеса, успехом становится не только продажа систем, но и скорость привлечения новых клиентов, арендующих вычислительные мощности в облаке Cerebras без предварительных покупок. “Раньше вы отправляли им оборудование, они его устанавливали, и вы запускали испытания или доказывали на месте, а теперь мы даем вам доступ,” – объяснил Фельдман новый метод продаж.

Фармацевтический гигант GlaxoSmithKline, первый клиент CS-2 оборудования, также арендует вычислительные мощности в облаке Cerebras, по словам Фельдмана. “У них есть наше оборудование на их объектах, и когда им нужно сделать большие вычисления, они используют наше облако,” – пояснил он. “И это очень интересная модель.”

Кроме того: Bиологические исследования Glaxo с помощью новато машины Cerebras показывают, что оборудование может изменить подход к ИИ

“У нас теперь так много вычислительных мощностей, что другие люди используют нашу систему для самых разных творческих целей,” – сказал Фельдман. “В области ИИ они обучают интересные модели, а в области суперкомпьютеров занимаются интересной работой, и ни у кого больше такого не наблюдалось.”

Фельдман привел в пример работу в области ИИ, проведенную на системе Condor Galaxy, разработку открытой модели большого языка, подобной GPT от OpenAI. Как отметил Фельдман, это самая эффективная модель с 3 миллиардами параметров нейронной сети на ресурсе машинного обучения Hugging Face с более чем миллиардом загрузок. Такая модель достаточно маленькая, чтобы работать на смартфоне для выполнения ИИ-выводов, что и является ее назначением.

В качестве примера научной работы Фельдман привел исследовательскую статью ученых из Университета Короля Абдуллы науки и технологии в Саудовской Аравии, которая была финалистом престижной премии Гордона Белла, вручаемой Association for Computing Machinery, организатором мероприятия SC23.

“Мы предоставили им время на Condor Galaxy, чтобы они могли установить рекорды в области сейсмической обработки,” – отметил Фельдман.

Первая версия Condor Galaxy, CG-1, заняла 70 дней для завершения, сказал Фельдман. Машина CG-2 будет готова “в начале следующего года.” Компания уже планирует Condor Galaxy-3, что добавит еще 64 компьютера и еще 4 эксаФЛОПС, для общей системной мощности 12 эксаФЛОПС.

Одним из ключевых преимуществ такой машины, как Condor Galaxy, CG-1 и CG-2, является их инженерия систем. Собрать эквивалентное число чипов GPU крайне сложно, сказал Фельдман. “Количество компаний, способных объединить тысячу GPU, очень мало,” – сказал Фельдман. “Их, может быть, 25.”

Также: Qualcomm Snapdragon X Elite усиливает возможности искусственного интеллекта для вашего будущего ПК

“Очень трудно достичь эффективного использования такого количества распределенного вычисления, это очень сложная проблема”, – говорит Фелдман. “Это одна из проблем, которую мы фундаментально решаем.”

Каждый компьютер CS-2 в галактике Кондор 1 и 2 содержит новейший AI-чип Cerebras, “Wafer-Scale-Engine” или WSE. Эти чипы, самые большие в мире, содержат 850 000 отдельных “ядер”, чтобы обрабатывать инструкции AI параллельно, что делает их эквивалентом нескольких чипов GPU.

Кроме того, компьютеры CS-2 подкрепляются специальным “фабричным” переключателем Cerebras Swarm-X и его выделенным дисковым хабом Memory-X, которые используются для кластеризации компьютеров CS-2.