AWS представляет новый AI-чип Trainium и Graviton 4, расширяет партнерство с Nvidia

AWS представляет новый AI-чип Trainium и Graviton 4, углубляет сотрудничество с компанией Nvidia

aws-graviton4-and-aws-trainium2-prototype

Чип Graviton 4, слева, является микропроцессором общего назначения, который используется компанией SAP и другими для работы с большими нагрузками, в то время как Trainium 2 – это специализированный ускорительный чип для очень больших программ нейронных сетей, таких как генеративный ИИ.

На ежегодной конференции разработчиков AWS re:Invent в Лас-Вегасе компания Amazon объявила о выпуске новой версии чипа Trainium 2, предназначенного для обучения нейронных сетей. Trainium 2 специально настроен для тренировки так называемых больших моделей языка (LLM) и базовых моделей – таких генеративных программ ИИ, как GPT-4 от OpenAI.

Компания также представила новую версию своего пользовательского микропроцессора Graviton 4 и заявила о расширении партнерства с Nvidia для работы с самыми передовыми чипами Nvidia в ее облачных вычислительных услугах. 

Также: Будущее облачных вычислений: от гибридных до периферийных и на основе ИИ

Trainium 2 предназначен для работы с нейронными сетями, содержащими триллионы параметров или весов нейронов, которые являются функциями алгоритма программы и обеспечивают ей масштаб и мощность в общем случае. Масштабирование до все более крупных параметров является активной задачей всей отрасли искусственного интеллекта. 

Трлллион параметров стали чем-то вроде одержимости для всей отрасли из-за того, что считается, что человеческий мозг содержит 100 триллионов нейронных связей – что делает трлллион-параметров программы нейронной сети похожей на человеческий мозг, вне зависимости от того, действительно ли это так или нет.

Компания утверждает, что чипы “предназначены для обеспечения учета в четыре раза более быстрой производительности при обучении и увеличения объёма оперативной памяти в три раза ” по сравнению со своими предшественниками, “улучшая энергоэффективность (производительность/ватт) вдвое”, – заявила Amazon.

Amazon делает эти чипы доступными в рамках своего вычислительного облачного сервиса EC2 под названием “Trn2”. Каждый экземпляр включает 16 чипов Trainium 2, работающих вместе, количество экземпляров может быть увеличено до 100 000, как утверждает Amazon. Более крупные экземпляры взаимосвязаны с помощью сетевой системы компании, называемой Elastic Fabric Adapter, которая обеспечивает общую вычислительную мощность в 65 экзафлопсов. (Один экзафлопс – это миллиард, миллиард операций с плавающей запятой в секунду.)

Также: AWS представляет локальные облачные зоны для эксклюзивного использования клиентами

На таких вычислительных мощностях, как отмечает Amazon, “за счет их использования посетители могут обучить модель с 300 миллиардами параметров LLM в течение недель, а не месяцев.” 

Помимо обслуживания клиентов, у Amazon есть дополнительные стимулы для продолжения разработки чипов ИИ. Компания инвестировала $4 млрд в частную компанию по генеративному ИИ Anthropic, которая выделилась из OpenAI. Благодаря этому инвестиции Amazon сможет конкурировать с эксклюзивным соглашением между Microsoft и OpenAI.

Чип Graviton 4, основанный на интеллектуальной собственности микропроцессора ARM Holdings, конкурирует с процессорами Intel и Advanced Micro Devices на основе стандарта x86. Как заявляет Amazon, Graviton 4 имеет “30% лучшую производительность вычислений”. 

Также: Почему Nvidia учит роботов крутить ручки и как помогает генеративный ИИ

В отличие от Trainium-чипов для ИИ, процессоры Graviton предназначены для выполнения более традиционных рабочих нагрузок. Пользователи из числа клиентов Amazon AWS, включая Datadog, DirecTV, Discovery, Formula 1, Nielsen, Pinterest, SAP, Snowflake, Sprinklr, Stripe и Zendesk, используют чипы Graviton “для выполнения широкого спектра задач, таких как базы данных, аналитика, веб-серверы, пакетная обработка, обслуживание рекламы, серверы приложений и микросервисы.”

SAP сказала в своих готовых замечаниях, что ей удалось достичь “35% лучшей производительности по цене для аналитических рабочих нагрузок”, запуская свою базу данных HANA в оперативной памяти с помощью микросхем Graviton, и что “мы с нетерпением ждем оценки Graviton4 и преимуществ, которые он может принести нашим совместным клиентам”.

Новые микросхемы следуют за двумя годами введения в 2021 году Graviton 3 и оригинального Trainium.

Новости Amazon вышли вперед последней неделей выхода чипов от Microsoft для искусственного интеллекта. Alphabet’s Google, еще один облачный гигант наряду с Amazon и Microsoft, предшествовал им обоим в 2016 году с первым облачным чипом для искусственного интеллекта TPU или Tensor Processing Unit, которого с тех пор было предложено несколько поколений.

Также: Amazon turns Fire TV Cube into a thin client for enterprises

В дополнение к двум новым чипам Amazon заявила о расширении стратегического партнерства с гигантом по чипам для искусственного интеллекта Nvidia. AWS будет первой облачной службой, которая будет запускать готовящийся к выпуску многочиповой продукт GH200 Grace Hopper от Nvidia, который объединяет CPU на базе архитектуры ARM и чип GPU Hopper H100.

Чип GH200, который, предположительно, начнет поставки в следующем году, является следующей версией комбинированного чипа Grace Hopper, анонсированного ранее в этом году, который уже поставляется в своей первоначальной версии в компьютеры от Dell и других производителей.

Чипы GH200 будут размещены на AWS с использованием специальных компьютеров для искусственного интеллекта от Nvidia, DGX, с помощью которых, по заявлению компаний, обучение нейронных сетей со свыше триллиона параметров будет ускорено.

Nvidia заявила, что AWS станет “основным облачным провайдером для своих исследований и разработок в области машинного обучения”.