OpenAI представляет новую флагманскую модель ИИ GPT-5

Рубрики: «Искусственный интеллект (AI)», «Генеративный AI (Gen AI)»

08.08.2025

Компания OpenAI сделала долгожданное заявление о выпуске новейшей модели ИИ GPT-5, которая превосходит предыдущие модели по показателям интеллекта и отвечает на вопросы с более высокой точностью.

«GPT-5 — это серьёзное усовершенствование по сравнению с GPT-4o и важный шаг на нашем пути к AGI», — сказал соучредитель и генеральный директор OpenAI Сэм Альтман. «Общение с GPT-3 было чем-то вроде разговора со старшеклассником. Были проблески гениальности, было много раздражения, но люди начали использовать его и извлекать из него пользу».

OpenAI подчеркнула значительный скачок возможностей GPT-5, особенно в области программирования, разработки интерфейсов и отладки больших кодовых баз. Модель также обеспечивает более глубокое понимание контекста и выразительные возможности для написания текстов или создания отчётов — областей, где предыдущие модели иногда давали сбои.

Модель GPT-5 представляет собой гибридную систему. Она переключается между стандартной моделью для прямых ответов и моделью «рассуждений» для более глубокого анализа. В зависимости от сложности запроса пользователя, GPT-5 автоматически выбирает, какую модель использовать, предоставляя пользователям возможность вручную включить режим «рассуждения» с помощью инструмента выбора модели или введя команду, например, «подумай хорошенько об этом».

По данным OpenAI, GPT-5 продемонстрировала значительное повышение интеллекта по сравнению с предыдущими моделями в тестах производительности, особенно в математике, программировании, в визуальном восприятии и медицине.

Компания отметила, что в области математических тестов GPT-5 устанавливает новую планку: 94,6% в тесте AIME 2025 без инструментов, 74,9% по программированию в бенчмарке SWE-bench Verified и 88% в тесте Aider Polyglot, 84,2% по мультимодальному пониманию в MMMU и 46,2% по здоровью в тесте HealthBench Hard. Компания заявила, что эти результаты получены в ходе повседневного использования, а не только во время соревнований.

Приятно видеть это по сравнению с предыдущими моделями, но как он выглядит на фоне конкурентов? Недавняя модель Claude Opus 4.1 от Anthropic набрала 74,5% на SWE-bench Verified, что немного ниже GPT-5, а Gemini 2.5 Pro от Google набрала в том же тесте 59,6%.

«GPT-5 как языковая модель демонстрирует непрерывный прогресс в повышении эффективности ИИ для реальной работы», — сказал Арвинд Джайн, основатель и генеральный директор Glean Technologies Inc. «Примечательно, что точность модели определяется не только планированием, но и рассуждениями о данных».

OpenAI представляет новую флагманскую модель ИИ GPT-5

Для сравнения, на последнем экзамене «Humanity’s Last Exam» - тесте, проверяющем общий интеллект в различных дисциплинах — версия GPT-5 Pro набрала 42% с инструментами, уступив лишь модели Grok 4 Heavy от компании xAI, которая набрала около 44%.

Однако пользователей может больше заинтересовать, что OpenAI сделала для решения критически проблем, так называемых, «галлюцинаций», при которых модель фантазирует и полностью выдумывает ответ. По данным компании, при включённом веб-поиске вероятность фактических ошибок у GPT-5 примерно на 45% ниже, чем у GPT-4o, а при включённом режиме «рассуждений» вероятность снижается примерно на 80% по сравнению с моделью o3.

Сегодня GPT-5 становится новой моделью по умолчанию для зарегистрированных пользователей ChatGPT, заменяя GPT-4o. Она автоматически переключается между режимом «рассуждений»и обычным режимом, а платные пользователи могут вручную включить режим более глубоких «рассуждений».

Источник: