OpenAI выпускает агента искусственного интеллекта Operator
Новый агент Operator от OpenAI изначально доступен в качестве предварительного просмотра только для пользователей ChatGPT Pro. Он может заказывать продукты, бронировать рейсы, заполнять формы и выполнять другие многошаговые задачи. Пользователи могут указывать агенту, какие задачи необходимо выполнить, вводя подсказки на естественном языке.
Агент работает на основе недавно представленной модели OpenAI, известной как CUA. Она частично основана на мультимодальной большой языковой модели (LLM) GPT-4o. OpenAI утверждает, что CUA сочетает LLM с «продвинутым рассуждением через обучение с подкреплением».
Когда пользователи просят агента Operator выполнить задачу на веб-сайте, он переходит по соответствующему URL-адресу с помощью встроенного браузера. Чтобы выполнить запрошенное действие Operator может печатать текст, кликать на кнопки или ссылки и прокручивать формы. Агент ИИ регулярно делает снимки экрана веб-сайта, чтобы пользователи могли удостовериться, что все работает так, как ожидалось.
В любой момент рабочего процесса пользователь может взять на себя управление. Агент ИИ заранее попросит пользователя переключиться в ручной режим для таких деликатных действий, как ввод учетных данных для входа на веб-страницу. Согласно OpenAI, в этом случае агент прекращает делать снимки экрана, пока задача по вводу учетных данных не будет завершена.
Также компания встроила в Operator несколько функций защиты данных. Пользователи могут выйти из всех своих учетных записей одним щелчком мыши и запретить OpenAI использовать их данные для обучения искусственного интеллекта. Кроме того, есть система, которая определяет, когда вредоносные веб-сайты пытаются обманом заставить Operator раскрыть конфиденциальные данные.
Некоторые из функций агента можно настроить. Например, пользователь может сохранить список покупок и дать команду агенту ИИ покупать указанные товары каждый раз, когда он посещает определенный сайт электронной коммерции. Также можно создать параметры настройки, которые будут применяться ко всем веб-сайтам, которые посещает агент.
В дальнейшем OpenAI планирует расширить доступность своего агента ИИ для других уровней подписки ChatGPT. Компания также предложит Operator через свой API и добавит улучшения, которые позволят агенту лучше справляться с выполнением сложных задач.
«В настоящее время Operator находится на стадии раннего предварительного просмотра, и хотя он уже способен выполнять широкий спектр задач, он все еще учится и может совершать ошибки», — написали исследователи OpenAI в своем блоге. «Ранние отзывы пользователей будут играть важную роль в повышении его точности, надежности и безопасности».