Google обновляет модель Gemini 2.5 Pro и называет её лучшей в программировании и математике

Рубрики: «Искусственный интеллект (AI)», «Генеративный AI (Gen AI)»

06.06.2025

Компания Google представила обновление своей модели Gemini 2.5 Pro, назвав её «самой интеллектуальной» большой языковой моделью, выпущенной на сегодняшний день.

Сегодняшнее обновление большой языковой модели Gemini 2.5 Pro является предварительной версией, а общедоступная версия должна появиться через пару недель. Google заявила, что компании уже могут начать создавать тестовые приложения с использованием новой модели или заменить более ранние версии Gemini 2.5 Pro в своих существующих приложениях. Если они это сделают, то заметят, что новая модель в своих ответах более креативна и лучше работает при генерации программного кода и рассуждениях.

Данное обновление основано на версии Gemini Pro 2.5, которая была анонсирована месяцем ранее на конференции разработчиков Google I/O. Та версия модели была известна как «Версия ввода-вывода», а сегодняшняя называется «Gemini 2.5 Pro Preview 06-05 Thinking».

«В сравнении с предыдущими моделями, новая модель достигла превосходных результатов в тестах по программированию. Например, последняя итерация улучшила свой результат в тесте LMArena на 24 балла, а результат в WebDevArena увеличился на 35 баллов, что вывело эту модель на вершину рейтинга лидеров», - сообщил генеральный директор Google DeepMind Демис Хассабис.

Кроме того, Google выпустила многочисленные бенчмарки, которые показывают, как модель превосходит конкурентов, таких как o3, o3-mini и o4-mini от OpenAI, Grok 3 Beta от xAI, R1 от DeepSeek и Claude 4 Opus от Anthropic в таких областях, как написание программного кода, наука и математика. Например, модель продемонстрировала улучшенные результаты в бенчмарках AIDER Polyglot, GPQA, HLE и нескольких других.

Генеральный директор Google Сундар Пичаи заявил: «В новой модели также учтены некоторые отзывы и критические замечания, которые были получены в предыдущих версиях Gemini 2.5 Pro, а также внесены улучшения в ее стиль и структуру, которые позволяют ей быть более креативной и лучше форматировать ответы».

В связи с ускоренным графиком обновлений Gemini 2.5 Pro Google работает над интеграцией модели в различные приложения и сервисы. Последняя версия доступна в приложении Google «Deep Think», которое, прежде чем дать ответ, тщательно рассматривает различные гипотезы. Другие способы доступа к модели включают интерфейс прикладного программирования Gemini, Google AI Studio и Vertex AI.

С выпуском Gemini 2.5 Pro и последующими обновлениями компании Google удалось забрать себе часть внимания пользователей от таких конкурентов, как OpenAI и DeepSeek, которые в начале этого года оказались в центре обсуждений благодаря первому поколению своих моделей рассуждений.

Источник: