OpenAI расширяет линейку больших языковых моделей новой GPT-4.5

Рубрики: «Искусственный интеллект (AI)», «Генеративный AI (Gen AI)», «Чат-боты»

28.02.2025

Компания OpenAI представила GPT-4.5 — большую языковую модель общего назначения, которую она называет самой крупной LLM на сегодняшний день.

Разработчик ChatGPT предоставляет две коллекции больших языковых моделей. Модели в первой коллекции ориентированы на задачи рассуждения, такие как генерация программного кода. Модели второй коллекции LLM не имеют расширенных возможностей рассуждения и фокусируются на задачах генерации текста, требующих креативности или общих знаний. Модель GPT-4.5 как раз попадает в последнюю категорию.

По сравнению с предыдущим поколением GPT-4o, последняя языковая модель лучше интерпретирует пользовательский ввод. OpenAI подробно описала в своем блоге, что GPT-4.5 может понимать «тонкие сигналы или неявные ожидания» в запросах. Это позволяет ей более точно согласовывать свой вывод с требованиями пользователя.

По сравнению с GPT-4o в модели GPT-4.5 также реализованы улучшения в области эмоционального интеллекта. Это позволяет ей выполнять определенные задачи более эффективно. Например, GPT-4.5 может более надежно определять, ищет ли пользователь краткий или развернутый ответ на запрос.

В основе модели лежит технология разработки искусственного интеллекта, называемая «неконтролируемым обучением». Многие модели ИИ обучаются с помощью так называемого контролируемого процесса обучения. Это предполагает предоставление большой языковой модели набора данных, в котором каждая часть информации сопровождается пояснениями. Эти пояснения, или метаданные, помогают направлять процесс обучения. Неконтролируемое обучение устраняет необходимость в метаданных и требует, чтобы модель самостоятельно понимала набор данных.

В OpenAI заявляют, что использовали больше данных об инфраструктуре и обучении, чем в предыдущих проектах по неконтролируемому обучению. В рамках инициативы были разработаны «масштабируемые методы, которые позволяют обучать более крупные и мощные модели с использованием данных, полученных из моделей меньшего размера». Это намекает на то, что для генерации обучающих данных для GPT-4.5 компания OpenAI использовала более ранние LLM, такие как оптимизированный для рассуждений алгоритм o3.

Хотя GPT-4.5 не оптимизирована специально для рассуждений, она может выполнять ряд сложных задач. Например, модель завершила серию задач по программированию SWE-Lancer Diamond с более высоким баллом, чем оптимизированная для рассуждений модель o3-mini-high. Кроме того, GPT-4.5 решила чуть более трети вопросов на отборочном экзамене по математической олимпиаде США.

Модель GPT-4.5 доступна разработчикам через интерфейс прикладного программирования (API). Цены OpenAI на 1 миллион входных и 1 миллион выходных токенов в 30 и 15 раз выше, чем для GPT-4o соответственно. GPT-4.5 также начала распространяться с ChatGPT. После запуска она будет доступна в топовом плане ChatGPT Pro. Также на следующей неделе OpenAI добавит модель в версии Plus и Team, а пользователи уровней Enterprise и Edu получат к ней доступ примерно через 2 недели.

Источник: