Все о Цифровых системах - новости, статьи, обзоры, аналитика. Более 1000 компаний, товаров и услуг в каталоге.
Добавить компанию

Alibaba выпускает модель рассуждений QwQ-32B-Preview, которая конкурирует с o1 от OpenAI

Рубрики: «Искусственный интеллект (AI)», «Генеративный искусственный интеллект»

Разработанная командой Qwen из Alibaba, новая модель QwQ-32B-Preview содержит 32,5 миллиарда параметров и может рассматривать подсказки длиной около 32’000 слов. В некоторых тестах она работает лучше, чем модели рассуждений o1-preview и o1-mini от американской компании OpenAI. Количество параметров примерно соответствует навыкам модели в решении задач, а модели с большим количеством параметров, как правило, работают лучше, чем модели с меньшим количеством параметров. OpenAI не раскрывает количество параметров для своих моделей.

Согласно тестированию Alibaba, QwQ-32B-Preview превосходит модели OpenAI o1 на тестах AIME и MATH. Тест AIME использует для оценки производительности другие модели ИИ, тогда как MATH представляет собой набор текстовых задач.

Благодаря своим возможностям «рассуждений» QwQ-32B-Preview может решать логические головоломки и отвечать на достаточно сложные математические вопросы. При этом модель пока не идеальна. Alibaba отмечает, что модель может неожиданно переключать языки, застревать в циклах и плохо справляться с задачами, требующими «здравого смысла».

В отличие от большинства моделей искусственного интеллекта, QwQ-32B-Preview и другие модели рассуждений сами эффективно проверяют факты. Это помогает им избегать некоторых ловушек, которые обычно мешают остальным моделям. Недостатком же является то, что на поиск решений у них часто уходит больше времени. Подобно o1, QwQ-32B-Preview рассуждает о задачах, планируя и выполняя ряд действий, которые помогают ей выдавать ответы.

Модель QwQ-32B-Preview «открыто» доступна по лицензии Apache 2.0, то есть её можно использовать для коммерческих приложений. Но пока были выпущены только некоторые компоненты модели, так что её невозможным повторить или получить глубокое представление о внутренней работе системы. «Открытость» моделей ИИ — не решенный вопрос, но существует общий континуум от более закрытого (доступ только через API) до более открытого (модель, веса, данные раскрыты), и эта модель находится где-то посередине.

Повышенное внимание к моделям рассуждений проявляется в связи с тем, что все больше внимания уделяется жизнеспособности «законов масштабирования» - давних теорий о том, что использование большего объема данных и вычислительной мощности в модели постоянно увеличивает ее возможности. Многочисленные сообщения в прессе свидетельствуют, что модели от крупнейших лабораторий искусственного интеллекта, включая OpenAI, Google и Anthropic, уже не улучшаются так резко, как раньше.

Это привело к поиску новых подходов, архитектур и методов разработки в области искусственного интеллекта, одним из которых является «вычисление во время тестирования». Также известное как вычисление логического вывода, вычисление во время тестирования по сути дает моделям дополнительное время обработки для выполнения задач и лежит в основе таких моделей, как o1 и QwQ-32B-Preview.

Крупные лаборатории (помимо OpenAI и китайских фирм) делают ставку на то, что будущее принадлежит вычислениям во время тестирования. Согласно недавнему отчету The Information, компания Google расширила до 200 человек свою команду специалистов, сосредоточенную на моделях рассуждений, а также добавила существенные вычислительные мощности.

Источник: