OpenAI запускает Flex Processing для более дешевых и медленных задач ИИ
По словам OpenAI, опция Flex Processing, доступная в бета-версии для недавно выпущенных OpenAI моделей рассуждений o3 и o4-mini, нацелена на низкоприоритетные и «непроизводственные» задачи, такие как оценка моделей, обогащение данных и асинхронные рабочие нагрузки.
Что такое Flex Processing?
Представьте, что вы в кофейне с двумя очередями: одна быстрая, но дорогая, а другая медленнее, но в два раза дешевле. Flex Processing — это «бюджетная очередь» OpenAI для моделей ИИ o3 и o4-mini. Это новая опция API, которая позволяет запускать задачи ИИ со скидкой 50%, но для взамен придется немного дольше ждать результатов и иногда могут возникать перебои с ресурсами. Подумайте об этом как о компромиссе: вы экономите деньги, но это не для срочных задач.
Для модели o3 обработка Flex составляет 5 долларов за миллион входных токенов (~750 000 слов) и 20 долларов за миллион выходных токенов. Для модели o4-mini Flex снижает цену до 55 центов за миллион входных токенов и 2,20 долларов за миллион выходных токенов. В обоих вариантах это стоимость API снижается ровно в два раза.
Для чего это можно использовать?
Flex Processing создан для задач, не требующих мгновенных результатов. Вот несколько примеров:
- Обогащение данных: очистка или улучшение наборов данных, например, добавление аналитических сведений в записи о клиентах.
- Тестирование модели: оценка эффективности работы модели ИИ без расходования бюджета.
- Исследовательские проекты: проведение экспериментов или анализ текста для академических или маркетинговых исследований.
- Пакетная обработка: обработка больших объемов несрочных задач, таких как составление резюме документов.
Запуск компанией OpenAI Flex Processing происходит на фоне выпуска конкурентами все более дешевых и эффективных бюджетно-ориентированных моделей. Так компания Google выпустила Gemini 2.5 Flash - модель рассуждений, которая соответствует или превосходит DeepSeek R1 с точки зрения производительности при более низкой стоимости входного токена.
Для кого это предназначено?
Flex Processing это удобное решение, которое могу использовать:
- Разработчики: если вы создаете инструменты на базе искусственного интеллекта или экспериментируете с моделями, Flex Processing сократит ваши расходы вдвое.
- Стартапы: Ограниченный бюджет? Теперь вы можете позволить себе использовать мощные модели OpenAI для несрочных задач.
- Исследователи: ученые и исследователи рынка, анализирующие большие наборы данных, могут существенно сэкономить.
- Малый бизнес: Хотите добавить искусственный интеллект в свои процессы без огромных счетов? Это ваш вариант.
В электронном письме клиентам, объявляющем о запуске Flex Processing, OpenAI также указала, что разработчикам 1-го – 3-го уровней иерархии использования придется пройти недавно введенную процедуру верификации для доступа к модели o3. Уровни определяются суммой денег, потраченных на услуги OpenAI. Также верифкацией защищены выводы рассуждений o3 и поддержка API потоковой передачи. Ранее OpenAI заявляла, что проверка личности призвана не допустить нарушения злоумышленниками политики использования.