OpenAI запускает Flex Processing для более дешевых и медленных задач ИИ

18.04.2025

Компания OpenAI запускает Flex Processing (гибкая обработка) — опцию API, которая обеспечивает более низкие цены на использование модели ИИ в обмен на более медленное время отклика и «периодическую недоступность ресурсов».

По словам OpenAI, опция Flex Processing, доступная в бета-версии для недавно выпущенных OpenAI моделей рассуждений o3 и o4-mini, нацелена на низкоприоритетные и «непроизводственные» задачи, такие как оценка моделей, обогащение данных и асинхронные рабочие нагрузки.

Что такое Flex Processing?

Представьте, что вы в кофейне с двумя очередями: одна быстрая, но дорогая, а другая медленнее, но в два раза дешевле. Flex Processing — это «бюджетная очередь» OpenAI для моделей ИИ o3 и o4-mini. Это новая опция API, которая позволяет запускать задачи ИИ со скидкой 50%, но для взамен придется немного дольше ждать результатов и иногда могут возникать перебои с ресурсами. Подумайте об этом как о компромиссе: вы экономите деньги, но это не для срочных задач.

Для модели o3 обработка Flex составляет 5 долларов за миллион входных токенов (~750 000 слов) и 20 долларов за миллион выходных токенов. Для модели o4-mini Flex снижает цену до 55 центов за миллион входных токенов и 2,20 долларов за миллион выходных токенов. В обоих вариантах это стоимость API снижается ровно в два раза.

Для чего это можно использовать?

Flex Processing создан для задач, не требующих мгновенных результатов. Вот несколько примеров:

Обогащение данных: очистка или улучшение наборов данных, например, добавление аналитических сведений в записи о клиентах.
Тестирование модели: оценка эффективности работы модели ИИ без расходования бюджета.
Исследовательские проекты: проведение экспериментов или анализ текста для академических или маркетинговых исследований.
Пакетная обработка: обработка больших объемов несрочных задач, таких как составление резюме документов.

Запуск компанией OpenAI Flex Processing происходит на фоне выпуска конкурентами все более дешевых и эффективных бюджетно-ориентированных моделей. Так компания Google выпустила Gemini 2.5 Flash - модель рассуждений, которая соответствует или превосходит DeepSeek R1 с точки зрения производительности при более низкой стоимости входного токена.

Для кого это предназначено?

Flex Processing это удобное решение, которое могу использовать:

Разработчики: если вы создаете инструменты на базе искусственного интеллекта или экспериментируете с моделями, Flex Processing сократит ваши расходы вдвое.
Стартапы: Ограниченный бюджет? Теперь вы можете позволить себе использовать мощные модели OpenAI для несрочных задач.
Исследователи: ученые и исследователи рынка, анализирующие большие наборы данных, могут существенно сэкономить.
Малый бизнес: Хотите добавить искусственный интеллект в свои процессы без огромных счетов? Это ваш вариант.

В электронном письме клиентам, объявляющем о запуске Flex Processing, OpenAI также указала, что разработчикам 1-го – 3-го уровней иерархии использования придется пройти недавно введенную процедуру верификации для доступа к модели o3. Уровни определяются суммой денег, потраченных на услуги OpenAI. Также верифкацией защищены выводы рассуждений o3 и поддержка API потоковой передачи. Ранее OpenAI заявляла, что проверка личности призвана не допустить нарушения злоумышленниками политики использования.

Источник: