OpenAI расширяет линейку больших языковых моделей новой GPT-4.5
Разработчик ChatGPT предоставляет две коллекции больших языковых моделей. Модели в первой коллекции ориентированы на задачи рассуждения, такие как генерация программного кода. Модели второй коллекции LLM не имеют расширенных возможностей рассуждения и фокусируются на задачах генерации текста, требующих креативности или общих знаний. Модель GPT-4.5 как раз попадает в последнюю категорию.
По сравнению с предыдущим поколением GPT-4o, последняя языковая модель лучше интерпретирует пользовательский ввод. OpenAI подробно описала в своем блоге, что GPT-4.5 может понимать «тонкие сигналы или неявные ожидания» в запросах. Это позволяет ей более точно согласовывать свой вывод с требованиями пользователя.
По сравнению с GPT-4o в модели GPT-4.5 также реализованы улучшения в области эмоционального интеллекта. Это позволяет ей выполнять определенные задачи более эффективно. Например, GPT-4.5 может более надежно определять, ищет ли пользователь краткий или развернутый ответ на запрос.
В основе модели лежит технология разработки искусственного интеллекта, называемая «неконтролируемым обучением». Многие модели ИИ обучаются с помощью так называемого контролируемого процесса обучения. Это предполагает предоставление большой языковой модели набора данных, в котором каждая часть информации сопровождается пояснениями. Эти пояснения, или метаданные, помогают направлять процесс обучения. Неконтролируемое обучение устраняет необходимость в метаданных и требует, чтобы модель самостоятельно понимала набор данных.
В OpenAI заявляют, что использовали больше данных об инфраструктуре и обучении, чем в предыдущих проектах по неконтролируемому обучению. В рамках инициативы были разработаны «масштабируемые методы, которые позволяют обучать более крупные и мощные модели с использованием данных, полученных из моделей меньшего размера». Это намекает на то, что для генерации обучающих данных для GPT-4.5 компания OpenAI использовала более ранние LLM, такие как оптимизированный для рассуждений алгоритм o3.
Хотя GPT-4.5 не оптимизирована специально для рассуждений, она может выполнять ряд сложных задач. Например, модель завершила серию задач по программированию SWE-Lancer Diamond с более высоким баллом, чем оптимизированная для рассуждений модель o3-mini-high. Кроме того, GPT-4.5 решила чуть более трети вопросов на отборочном экзамене по математической олимпиаде США.
Модель GPT-4.5 доступна разработчикам через интерфейс прикладного программирования (API). Цены OpenAI на 1 миллион входных и 1 миллион выходных токенов в 30 и 15 раз выше, чем для GPT-4o соответственно. GPT-4.5 также начала распространяться с ChatGPT. После запуска она будет доступна в топовом плане ChatGPT Pro. Также на следующей неделе OpenAI добавит модель в версии Plus и Team, а пользователи уровней Enterprise и Edu получат к ней доступ примерно через 2 недели.