Все о Цифровых системах - новости, статьи, обзоры, аналитика. Более 1000 компаний, товаров и услуг в каталоге.
Добавить компанию

Intel и Hewlett Packard завершили сборку суперкомпьютера Aurora

Рубрики: «Наука», «Искусственный интеллект (AI)», «Суперкомпьютеры»

Intel и Hewlett Packard завершили сборку суперкомпьютера Aurora

Суперсистема Aurora является результатом сотрудничества Министерства энергетики, Intel и Hewlett Packard Enterprise Co и расположена в Аргоннской национальной лаборатории. Ученые будут использовать ее для запуска моделей искусственного интеллекта, симуляций и крупномасштабных приложений для анализа данных.

Ожидается, что к концу этого года пиковая производительность Aurora превысит 2 экзафлопса, благодаря чему, она станет почти в два раза быстрее, чем самый быстрый в мире существующий суперкомпьютер под названием Frontier. Один экзафлоп равен миллиарду миллиардов вычислений в секунду.

«Пока мы работаем над приемочным тестированием, мы собираемся использовать Aurora для обучения некоторых крупномасштабных моделей генеративного искусственного интеллекта с открытым исходным кодом», - сказал Рик Стивенс, заместитель директора Аргоннской национальной лаборатории. «Aurora имеет более чем 60 тысяч графических процессоров Intel Max, очень быструю систему ввода-вывода, полностью твердотельную систему хранения данных и, поэтому, является идеальной средой для обучения этих моделей».

Суперкомпьютер Aurora состоит из 10’624 вычислительных модулей, известных как блейд-серверы, каждый из которых весит более 27 кг. Блейд-серверы работают в 166 шкафах размером с холодильник. Полностью собранная система занимает столько же места, сколько две профессиональные баскетбольные площадки.

Каждый блейд-сервер Aurora включает в себя два центральных процессора из линейки процессоров серии Intel Xeon Max. Есть также 6 графических карт Intel Max Series GPU. Процессоры поддерживаются чипами памяти, сетевым оборудованием и охлаждающими устройствами, встроенными в каждый блейд.

Чипы центральных процессоров Intel Xeon Max основаны на 10-нанометровой архитектуре. Они оптимизированы для таких рабочих нагрузок, как модели искусственного интеллекта, которые требуют возможности частого перемещения данных в память и из памяти. Для ускорения таких рабочих нагрузок процессоры оснащены памятью с высокой пропускной способностью - HBM (High Bandwidth Memory), которой не было в более ранних чипах Intel.

Графические процессоры Intel серии Max, которые составляют другой основной строительный блок Aurora, также оптимизированы для рабочих нагрузок искусственного интеллекта. Язык, на котором графическая карта выполняет вычисления, известен как набор инструкций. Набор инструкций графических процессоров Intel серии Max специально предназначен для умножения матриц — математических операций, которые модели ИИ используют для обработки данных.

Чипы также включают в себя до 128 блоков трассировки лучей. Трассировка лучей - это метод рендеринга эффектов освещения и тени. По данным Intel, эта технология ускоряет функции визуализации данных в научных приложениях.

Всего в Aurora установлено 21’248 процессоров и 63’744 видеокарт. Благодаря этому, Aurora является крупнейшим в мире кластером графических процессоров. Чипы поддерживаются 220-петабайтным пулом объектного хранилища, которое Aurora будет использовать для хранения данных научных приложений. 

Чтобы в полной мере использовать производительность Aurora, исследователям необходимо специально оптимизировать свои приложения для этой системы. Чтобы облегчить задачу, Министерство энергетики создало миниатюрную версию Авроры под названием «Sunspot» («Солнечное пятно»). Sunspot предоставляет среду, в которой исследователи могут тестировать различные методы оптимизации программного обеспечения. По состоянию на начало этого года более дюжины исследовательских групп использовали эту систему. Как только Aurora заработает, команды начнут переносить код из Sunspot. Ранние пользователи Aurora сосредоточатся на выявлении любых технических проблем, которые, возможно, придется решить, прежде чем можно будет развернуть первые рабочие приложения.

Источник: