IBM рекламирует оптоволоконную технологию, которая может сократить время обучения ИИ и потребление энергии на 80%
Основная причина, по мнению исследователей, заключается в том, что соединения в центрах обработки данных по-прежнему опираются на медные провода вместо скоростного оптоволокна.
«По нашим оценкам, графические процессоры проводят около половины своего времени в состоянии простоя», — сказал Джон Никербокер, главный инженер IBM. «Таким образом очень много энергии тратится впустую».
Теперь IBM заявляет, что достигла значительного прогресса в решении этой проблемы. Компания представила новый процесс, который интегрирует оптические компоненты напрямую с электронными чипами в одном пакете, чтобы обеспечить связь со скоростью света между устройствами в центре обработки данных. Компания утверждает, что создала и успешно испытала межсоединения на основе полимерного оптического волновода — гибкой и легкой конструкции из полимерных материалов, которая направляет и ограничивает световые сигналы, сводя к минимуму потери, сохраняя при этом целостность сигнала.
По сравнению с электрическими соединениями новый модуль IBM снижает энергопотребление более чем на 80%, одновременно увеличивая длину кабелей, соединяющих компоненты в центре обработки данных, с одного метра до сотен метров. В результате, по словам специалистов IBM, большие языковые модели ИИ могут быть обучены в пять раз быстрее при одновременной экономии, которая эквивалентна годовому энергопотреблению 5’000 домов на одну обученную модель.
«До появления генеративного ИИ и больших языковых моделей спрос на вычисления удваивался каждые 20 месяцев», — сказал Мукеш Кхаре, генеральный менеджер полупроводникового подразделения IBM и вице-президент по исследованиям гибридного облака в IBM Research. «С тех пор как появились больщие языковые модели, спрос удваивается каждые шесть месяцев».
Потребление электроэнергии и соответствующий ему углеродный след — одно из последствий ИИ, которое часто замалчивается. Ранее в этом году Международное энергетическое агентство подсчитало, что потребление электроэнергии центрами обработки данных, обрабатывающими рабочие нагрузки ИИ и выполняющими майнинг криптовалюты, может удвоиться к 2026 году. К тому времени оно сравняется с общим потреблением электроэнергии в Японии.
Технология полимерного оптического волновода уже широко используется в телекоммуникациях и при передаче данных, но никогда не применялась в центрах обработки данных. Причины заключаются в высокой начальной стоимости, хрупкости носителя, доминировании медного провода в устаревших системах и размере оптических волокон. При диаметре около 250 микрон, что в три раза больше толщины человеческого волоса, они занимают площадь около четверти миллиметра. Это значительно больше, чем требуется для электронных схем.
«Несмотря на то, что индустрия добилась значительного прогресса в создании все более и более быстродействующих чипов, скорость, с которой эти чипы могут взаимодействовать друг с другом, не поспевает за ними», - сказал Кхаре. «Существует разрыв в несколько порядков».
Исследователи IBM использовали специальную технологию для выстраивания пучков оптических волокон высокой плотности по краям чипа, чтобы обеспечить прямую связь через полимерные волокна. Благодаря этому подходу допуски между волокном и разъемом составляли не более полумикрона, что считается критерием успеха.
Компания заявила, что ее новые оптические структуры позволяют производителям чипов упаковывать в шесть раз больше оптических волокон на краю кремниевого фотонного чипа. Каждое волокно может охватывать всего несколько сантиметров и переносить терабиты данных в секунду. При настройке на передачу нескольких длин волн на оптический канал технология может увеличить пропускную способность между чипами в 80 раз.
IBM также сообщила, что ее технология позволила сократить размер на 80% по сравнению с обычными оптическими каналами, а тестирование показывает, что возможно и дальнейшее сокращение, которое позволит увеличить пропускную способность до 1200%.