Все о Цифровых системах - новости, статьи, обзоры, аналитика. Более 1000 компаний, товаров и услуг в каталоге.
Добавить компанию

DeepMind выпускает компактную, но мощную модель ИИ Gemma 3 270M

Рубрики: «Искусственный интеллект (AI)», «Генеративный AI (Gen AI)»

DeepMind выпускает компактную, но мощную модель ИИ Gemma 3 270M

Количество параметров в модели обычно характеризует её мощность, но в Gemma 3 270M компания решила создать нечто гораздо более оптимизированное, чтобы модель могла работать непосредственно на маломощных устройствах, таких как смартфоны, без подключения к интернету. Команда DeepMind заявляет, что несмотря на малые размеры модель Gemma 3 270M по-прежнему более чем способна справиться с узким кругом сложных, специфических задач, а разработчики могут быстро настроить её под свои нужды.

Инженер по связям с разработчиками искусственного интеллекта Google DeepMind Омар Сансевьеро сообщил: «Gemma 3 270M имеет открытый исходный код и достаточно мала, чтобы работать в вашем тостере или, в качестве альтернативы, на таком устройстве, как компьютер Raspberry Pi размером с ладонь».

Архитектура Gemma 3 270M подходит для высокой производительности в задачах, связанных с выполнением инструкций, но при этом достаточно компактна для быстрой настройки и развёртывания на устройствах с ограниченной мощностью. Её архитектура основана на более крупных моделях Gemma 3, разработанных для работы на одном графическом процессоре,

Результаты тестирования Gemma 3 270M выглядят весьма впечатляюще. В бенчмарке IFEval, предназначенном для оценки способности моделей ИИ правильно выполнять инструкции, модель достигла результата 51,2%. Это значительно превосходит результаты небольших моделей аналогичного размера, таких как Qwen 2.5 0.5B Instruct и SmolLM2 135M Instruct. Кроме того, DeepMind отмечает, что моедль ненамного отстаёт от некоторых небольших моделей с миллиардом параметров. Таким образом, Gemma 3 270M является отличным вариантом для разработчиков, желающих развернуть искусственный интеллект на устройстве для приложений, требующих конфиденциальности и автономной работы.

DeepMind подчеркнула, что разработчикам ИИ необходимо выбирать для работы правильный инструмент, а не просто концентрироваться на размере модели для повышения производительности своих ИИ-приложений. Модель Gemma 3 270M может быть точно настроена для выполнения таких задач, как творческое написание текстов, проверка соответствия требованиям, извлечение сущностей, маршрутизация запросов, анализ настроений и генерация структурированного текста. Таким образом, с ее помощью можно выполнять эффективную работу с гораздо большей экономичностью, чем при использовании большой языковой модели с многомиллиардными параметрами.

Источник: