OpenAI делает общедоступной свою языковую модель рассуждений o3-mini
Компания OpenAI перенесла дату выпуска модели o3-mini на более ранний срок в ответ на оптимизированную модель рассуждений R1, которую китайская компания DeepSeek представила пару недель назад. Новый алгоритм вызвал массовую распродажу акций в секторе искусственного интеллекта и поставил под сомнение рентабельность моделей OpenAI.
Представленная в декабре, o3-mini позиционируется как более доступная версия o3 (флагманской модели OpenAI), которая также работает быстрее. OpenAI уточнила, что задержка у o3-mini сравнима с o1-mini, менее продвинутой моделью для рассуждений, дебютировавшей в сентябре прошлого года.
Компания сделала o3-mini доступной в бесплатной версии, а также на тарифах ChatGPT Plus, Pro и Team. На следующей неделе модель также будет доступна в плане Enterprise. В версиях Plus и Team лимит для o3-mini составляет 150 сообщений в день, что в три раза больше, чем поддерживает модель o1-mini.
OpenAI также предоставила доступ к новой модели через несколько своих интерфейсов прикладного программирования (API). Разработчики могут использовать API для интеграции o3-mini в свои приложения. Версия API доступна в трёх вариантах с различным качеством вывода: o3-mini-low, o3-mini-medium и o3-mini-high.
Оптимизированные для рассуждений модели OpenAI используют метод обработки под названием «test-time compute». Этот метод повышает качество ответов модели, увеличивая объем используемого оборудования для генерации каждого ответа. Базовая версия o3-mini-low требует для обработки запросов минимальной инфраструктуры и наименьшего времени, тогда как o3-mini-high использует больше ресурсов.
В декабрьской демонстрации OpenAI сравнила производительность o3-mini со своей флагманской моделью для рассуждений o3. В тесте, где моделям нужно было решить набор задач по программированию, o3-mini набрала 2073 балла, а o3 — 2727. В одном из тестов o3-mini самостоятельно написала веб-интерфейс для своего API на Python.
Инженеры OpenAI провели и другие тесты. Выяснилось, что o3-mini-high набрала 79,6 из 100 баллов на квалификационном экзамене математической олимпиады США, отстав от o3 менее чем на 16 баллов. По обновленным результатам тестов, опубликованным OpenAI, o3-mini-high улучшила свой показатель до 83,6 балла, что может свидетельствовать об обновлениях модели с момента декабрьской демонстрации.
Также во время декабрьской демонстрации генеральный директор OpenAI Сэм Альтман сообщил, что компания планирует перед запуском o3-mini сотрудничать с внешними исследователями в области безопасности ИИ, чтобы провести тестирование модели. Ранее компания полагалась исключительно на внутреннее тестирование. Альтман добавил, что флагманская модель o3 будет запущена «вскоре после» o3-mini.