OpenAI обновляет ChatGPT с помощью агента Codex AI
Новый инструмент доступен через боковую панель в интерфейсе ChatGPT. Одна кнопка на боковой панели настраивает Codex на генерацию нового кода на основе инструкций пользователя, а другая позволяет ему отвечать на вопросы о существующем коде. Генерация оперативных ответов занимает от одной до 30 минут в зависимости от сложности запроса. Codex работает на основе новой модели ИИ под названием «codex-1». Это версия модели «o3» - самой эффективной модели рассуждений OpenAI, оптимизированной для задач программирования.
OpanAI обучила Codex на наборе реальных задач программирования. Эти задачи включают ряд программных сред. Часть программного обеспечения, которая хорошо работает в одной среде, например, на облачной платформе, может работать не так эффективно или вообще не работать на сервере Linux или на рабочем столе разработчика. В результате набор данных для обучения модели искусственного интеллекта должен включать техническую информацию о каждой среде, которую она будет использовать.
Чтобы научить codex-1 компания OpenAI использовала «обучение с подкреплением». Это способ разработки моделей ИИ, который для повышения качества вывода применеят метод «проб и ошибок». Когда нейронная сеть правильно выполняет задачу, она получает виртуальное вознаграждение, в то время как неправильные ответы приводят к штрафам, которые побуждают алгоритм придумать лучший подход.
В серии тестов кодирования, проведенных OpenAI, агент ИИ Codex достиг точности 75%. Это на 5% лучше, чем у самой мощной версии o3. Для сравнения - модель рассуждений первого поколения OpenAI, o1, набрала в этом тесте всего 11%.
Codex выполняет задачи кодирования в изолированных программных контейнерах, которые не имеют доступа к сети. Согласно OpenAI, агент запускает отдельный контейнер для каждой задачи. Разработчики могут настраивать эти среды разработки, загружая текстовый файл AGENTS.md. В файле может быть описано, какие программы должен установить Codex, как следует проверять сгенерированный код на наличие ошибок и другие связанные с этим детали. Используя файл AGENTS.md, разработчики могут гарантировать, что контейнер, в котором Codex генерирует код, настроен так же, как и производственная система, на которой будет работать созданная программа. Это снижает необходимость в модификации кода перед его выпуском в производство.
После того, как Codex завершает задачу, он предоставляет разработчикам технические данные, которые можно использовать для проверки каждого шага рабочего процесса. Если код не соответствует требованиям проекта, то разработчики могут попросить агента внести исправления.
OpenAI начал внедрять Codex в ChatGPT в режиме предварительного ознакомления. Первоначально будет предоставлен «широкий доступ без каких-либо дополнительных затрат». Через несколько недель OpenAI переведет Codex на более низкие тарифы с «гибкими ценовыми опциями, которые позволят приобретать дополнительные услуги по запросу».
Компания также планирует расширить набор функций Codex. Одна из них позволит пользователям предоставлять агенту инструкции, пока он находится в процессе выполнения задачи. Кроме того, Open AI планирует интегрировать Codex с другими инструментами для разработчиков. Одной из предстоящих интеграций станет «Codex CLI» - помощник по кодированию с открытым исходным кодом на основе ИИ, который разработчики могут установить на свои рабочие столы и получать к нему доступ из командной строки. В связи с выпуском Codex компания OpenAI представила новую версию Codex CLI.
Помощник с открытым исходным кодом теперь может выполнять задачи программирования, используя модель Codex-mini. Она основана на легкой, аппаратно эффективной модели рассуждений o4-mini, которую OpenAI впервые представила в прошлом месяце. Обновление позволит Codex CLI быстрее отвечать на вопросы разработчиков и генерировать программный код.