Все о Цифровых системах - новости, статьи, обзоры, аналитика. Более 1000 компаний, товаров и услуг в каталоге.
Добавить компанию

OpenAI запускает Flex Processing для более дешевых и медленных задач ИИ

Рубрика: «Искусственный интеллект (AI)»

По словам OpenAI, опция Flex Processing, доступная в бета-версии для недавно выпущенных OpenAI моделей рассуждений o3 и o4-mini, нацелена на низкоприоритетные и «непроизводственные» задачи, такие как оценка моделей, обогащение данных и асинхронные рабочие нагрузки.

Что такое Flex Processing?

Представьте, что вы в кофейне с двумя очередями: одна быстрая, но дорогая, а другая медленнее, но в два раза дешевле. Flex Processing — это «бюджетная очередь» OpenAI для моделей ИИ o3 и o4-mini. Это новая опция API, которая позволяет запускать задачи ИИ со скидкой 50%, но для взамен придется немного дольше ждать результатов и иногда могут возникать перебои с ресурсами. Подумайте об этом как о компромиссе: вы экономите деньги, но это не для срочных задач.

Для модели o3 обработка Flex составляет 5 долларов за миллион входных токенов (~750 000 слов) и 20 долларов за миллион выходных токенов. Для модели o4-mini Flex снижает цену до 55 центов за миллион входных токенов и 2,20 долларов за миллион выходных токенов. В обоих вариантах это стоимость API снижается ровно в два раза.

Для чего это можно использовать?

Flex Processing создан для задач, не требующих мгновенных результатов. Вот несколько примеров:

  • Обогащение данных: очистка или улучшение наборов данных, например, добавление аналитических сведений в записи о клиентах.
  • Тестирование модели: оценка эффективности работы модели ИИ без расходования бюджета.
  • Исследовательские проекты: проведение экспериментов или анализ текста для академических или маркетинговых исследований.
  • Пакетная обработка: обработка больших объемов несрочных задач, таких как составление резюме документов.

Запуск компанией OpenAI Flex Processing происходит на фоне выпуска конкурентами все более дешевых и эффективных бюджетно-ориентированных моделей. Так компания Google выпустила Gemini 2.5 Flash - модель рассуждений, которая соответствует или превосходит DeepSeek R1 с точки зрения производительности при более низкой стоимости входного токена.

Для кого это предназначено?

Flex Processing это удобное решение, которое могу использовать:

  • Разработчики: если вы создаете инструменты на базе искусственного интеллекта или экспериментируете с моделями, Flex Processing сократит ваши расходы вдвое.
  • Стартапы: Ограниченный бюджет? Теперь вы можете позволить себе использовать мощные модели OpenAI для несрочных задач.
  • Исследователи: ученые и исследователи рынка, анализирующие большие наборы данных, могут существенно сэкономить.
  • Малый бизнес: Хотите добавить искусственный интеллект в свои процессы без огромных счетов? Это ваш вариант.

В электронном письме клиентам, объявляющем о запуске Flex Processing, OpenAI также указала, что разработчикам 1-го – 3-го уровней иерархии использования придется пройти недавно введенную процедуру верификации для доступа к модели o3. Уровни определяются суммой денег, потраченных на услуги OpenAI. Также верифкацией защищены выводы рассуждений o3 и поддержка API потоковой передачи. Ранее OpenAI заявляла, что проверка личности призвана не допустить нарушения злоумышленниками политики использования.

Источник: