Google обновляет модель Gemini 2.5 Pro и называет её лучшей в программировании и математике
Сегодняшнее обновление большой языковой модели Gemini 2.5 Pro является предварительной версией, а общедоступная версия должна появиться через пару недель. Google заявила, что компании уже могут начать создавать тестовые приложения с использованием новой модели или заменить более ранние версии Gemini 2.5 Pro в своих существующих приложениях. Если они это сделают, то заметят, что новая модель в своих ответах более креативна и лучше работает при генерации программного кода и рассуждениях.
Данное обновление основано на версии Gemini Pro 2.5, которая была анонсирована месяцем ранее на конференции разработчиков Google I/O. Та версия модели была известна как «Версия ввода-вывода», а сегодняшняя называется «Gemini 2.5 Pro Preview 06-05 Thinking».
«В сравнении с предыдущими моделями, новая модель достигла превосходных результатов в тестах по программированию. Например, последняя итерация улучшила свой результат в тесте LMArena на 24 балла, а результат в WebDevArena увеличился на 35 баллов, что вывело эту модель на вершину рейтинга лидеров», - сообщил генеральный директор Google DeepMind Демис Хассабис.
Кроме того, Google выпустила многочисленные бенчмарки, которые показывают, как модель превосходит конкурентов, таких как o3, o3-mini и o4-mini от OpenAI, Grok 3 Beta от xAI, R1 от DeepSeek и Claude 4 Opus от Anthropic в таких областях, как написание программного кода, наука и математика. Например, модель продемонстрировала улучшенные результаты в бенчмарках AIDER Polyglot, GPQA, HLE и нескольких других.
Генеральный директор Google Сундар Пичаи заявил: «В новой модели также учтены некоторые отзывы и критические замечания, которые были получены в предыдущих версиях Gemini 2.5 Pro, а также внесены улучшения в ее стиль и структуру, которые позволяют ей быть более креативной и лучше форматировать ответы».
В связи с ускоренным графиком обновлений Gemini 2.5 Pro Google работает над интеграцией модели в различные приложения и сервисы. Последняя версия доступна в приложении Google «Deep Think», которое, прежде чем дать ответ, тщательно рассматривает различные гипотезы. Другие способы доступа к модели включают интерфейс прикладного программирования Gemini, Google AI Studio и Vertex AI.
С выпуском Gemini 2.5 Pro и последующими обновлениями компании Google удалось забрать себе часть внимания пользователей от таких конкурентов, как OpenAI и DeepSeek, которые в начале этого года оказались в центре обсуждений благодаря первому поколению своих моделей рассуждений.