AWS представляет чипы следующего поколения для облачных вычислений и ИИ
Семейство процессоров Graviton на базе Arm используется AWS для обеспечения высокой производительности и снижения затрат при выполнении широкого спектра рабочих нагрузок облачных вычислений в Amazon Elastic Compute Cloud (EC2). Новый Graviton4 обеспечивает до 30% большую вычислительную мощность, имеет на 50% больше ядер и на 75% большую пропускную способность памяти, по сравнению с процессорами Graviton3.
«Graviton4 — это четвертое поколение процессоров, которое мы выпустили всего за пять лет, и это самый мощный и энергоэффективный чип, который мы когда-либо создавали для широкого спектра рабочих нагрузок», — сказал Дэвид Браун, вице-президент по вычислениям и сетям AWS. «Кремниевые компоненты лежат в основе каждой рабочей нагрузки клиента, что делает их важнейшей областью инноваций для AWS».
Amazon выпустила свой первый чип Graviton1 в 2018 году. Каждое последующее поколение Graviton принесло с собой значительное увеличение производительности и эффективности, а также снижение затрат. Доступность чипов Graviton привела к росту экосистемы AWS. На сегодняшний день AWS внедрила по всему миру более 2 миллионов процессоров Graviton и предлагает более 150 различных типов инстансов Amazon EC2 на базе Graviton.
По мере того, как базовые модели ИИ и большие языковые модели становятся все крупнее, они требуют обработки огромных наборов данных, а это означает постоянное увеличение времени и затрат на их обучение. Самые крупные и продвинутые модели могут масштабироваться от сотен миллиардов до триллионов точек данных и генерировать текст, изображения, аудио, видео и программный код.
Для решения этих задач AWS анонсировала Trainium2 - специальный высокопроизводительный чип для обучения базовых и больших языковых моделей, имеющих до триллионов параметров. Он может обеспечить до четырех раз большую производительность обучения и имеет в три раза больший объем памяти по сравнению с чипом первого поколения. Компания также заявила, что в два раза улучшила энергоэффективность процессора.
«С ростом интереса к генеративному искусственному интеллекту Trainium2 поможет клиентам обучать свои модели быстрее, с меньшими затратами и с большей энергоэффективностью», — сказал Браун.
Чипы Trainium действуют как ускорители искусственного интеллекта для высокопроизводительных рабочих нагрузок искусственного интеллекта и машинного обучения. Они также оптимизированы для обучения обработке естественного языка, компьютерному зрению и рекомендательным моделям, используемым в приложениях искусственного интеллекта, таких как обобщение текста, ответы на вопросы, генерация кода, изображений и видео.