Microsoft выпускает новые небольшие, но мощные модели рассуждений ИИ Phi-4

Рубрики: «Генеративный AI (Gen AI)», «Языковые модели (LLM)»

05.05.2025

Корпорация Microsoft выпустила три новые усовершенствованные модели искусственного интеллекта, которые расширяют линейку моделей «Phi» и имеют способности к рассуждению.

В новых моделях Phi-4-reasoning, Phi-4-reasoning-plus и Phi-4-mini-reasoning добавлена способность мыслить, благодаря которой они могут разбивать сложные запросы и эффективно их анализировать. Семейство моделей предназначено для локальной работы на графическом процессоре ПК или на мобильном устройстве.

Phi-4-reasoning — это модель с открытым весом из 14 миллиардов параметров, которая, по словам компании, конкурирует в сложных задачах с более крупными моделями. Модель с открытыми весами относится к типу больших языковых моделей (LLM), где параметры модели, также известные как «веса», доступны пользователям. Это означает, что любой может загрузить, проверить, использовать или настроить модель, не сталкиваясь с какими-либо лицензионными ограничениями или ограничениями прав собственности.

Phi-4-reasoning-plus — это более продвинутая версия с тем же весом параметров. Модель была настроена с помощью системы обучения с подкреплением, позволяющей использовать в 1,5 раза больше токенов для обеспечения более высокой точности по сравнению с базовой моделью. Однако вследствие этого она имеет увеличенное время отклика и вычислений.

Самая маленькая из моделей, Phi-4-mini-reasoning, предназначена для загрузки на мобильные и малогабаритные устройства. Она имеет всего лишь 3,8 миллиарда параметров с открытым весом и оптимизирована для математических рассуждений с расчетом на применение в образовательных приложениях.

«Модели рассуждений Phi представляют новую категорию небольших языковых моделей. Используя дистилляцию, обучение с подкреплением и высококачественные данные, эти модели обеспечивают баланс размера и производительности», — говорится в блоге команды Microsoft. «Они достаточно малы для сред с низкой задержкой, но при этом сохраняют сильные возможности рассуждений, которые соперничают с гораздо более крупными моделями».

Чтобы реализовать эти важнейшие возможности, Microsoft обучила свою модель Phi-4-reasoning, используя веб-данные и специально подготовленные демонстрации модели o3-mini компании OpenAI. Логическая модель Phi-4-mini была доработана с использованием синтетических обучающих данных, сгенерированных китайской моделью Deepseek-R1, и обучена решению более 1 миллиона разнообразных математических задач, охватывающих различные уровни сложности: от средней школы до доктора наук.

Microsoft заявила, что, несмотря на значительно меньший размер, Phi-4-reasoning и Phi-4-reasoning-plus превзошли по большинству тестов для математических и научных рассуждений модели o1-min от OpenAI и Distill-Llama-70B от DeepSeek. Компания также заявила, что модели могут превзойти полную модель DeepSeek-R1, которая весит 671 миллиард параметров, на тесте AIME 2025, который использовался в качестве 15-вопросного трехчасового отборочного теста для Международной математической олимпиады США.

Новые модели Phi-4 уже доступны на Azure AI Foundry и HuggingFace.

Источник: