Google запускает Gemini 2.5 Flash в предварительной версии для разработчиков
Модель Gemini 2.5 Flash построена на основе существующей модели 2.0 Flash, которая обладает низкой задержкой и высокой производительностью, разработанной для поддержки агентов ИИ. Компания Google заявила, что новая модель обладает улучшенными возможностями рассуждения и является «мыслящей», то есть перед ответом она может разбивать сложные задачи на более мелкие шаги.
Новая модель теперь доступна через интерфейс программирования приложений Gemini в Google AI Studio и в Vertex AI - полностью управляемой платформе машинного обучения Google Cloud для создания, обучения и развертывания моделей ИИ.
«Gemini 2.5 Flash — наша первая полностью гибридная модель рассуждений, дающая разработчикам возможность включать и выключать мышление», — говорится в объявлении Google. «Модель также позволяет разработчикам устанавливать бюджеты на мышление, чтобы найти правильный компромисс между качеством, стоимостью и задержкой».
Способность модели мыслить требует расхода токенов (единиц, используемых для обработки информации), что может увеличить время и стоимость вывода. Чтобы предоставить гибкость в работе модели, Google дает разработчикам возможность ограничить максимальное количество токенов, которые модель будет тратить на обдумывание. Более высокий бюджет улучшит качество, но замедлит вывод; меньший бюджет заставит модель работать быстрее.
Новая модель также обучена автоматически устанавливать бюджет на основе сложности заданного запроса. Например, вопросы «Как сказать: «Спасибо» на испанском языке» или «Сколько провинций в Канаде?», не требует особых рассуждений, поскольку они, вероятно, существуют в общем обучении модели или могут быть обнаружены за один шаг после поиска в Интернете.
Рассуждения среднего уровня могут, например, включать такие задачи, как запрос модели на построение ежедневного расписания для пользователя на основе набора событий календаря или определение вероятности выпадения пары игральных костей. Рассуждения высокого уровня будут заключаться в запросе ИИ на написание программного кода целой функции на языке Python, которая вычисляет сложную математику. Некоторые пользователи уже просили Gemini помочь им кодировать целые веб-игры, но результаты были неоднозначными.
Токены для Gemini 2.5 Flash стоят 15 центов за миллион входных токенов и 60 центов за миллион выходных токенов без рассуждений. При активном мышлении стоимость возрастает до 3,5 долларов за миллион токенов. По данным Google, модель 2.5 Flash оказалась значительным обновлением по сравнению с версией 2.0 Flash, особенно в плане рассуждений. Благодаря активным рассуждениям значительно улучшилась способность модели разбивать сложные задачи на несколько более простых шагов, например, при решении математических задач и исследовательских вопросов.
На «Последнем экзамене человечества» модель Gemini 2.5 Flash набрала 12,1% по сравнению с 5,1% у 2.0 Flash. Тест «Последний экзамен человечества» представляет собой набор из 3000 однозначных и проверяемых академических вопросов по математике, гуманитарным и естественным наукам и предназначен для тестирования систем искусственного интеллекта.
Компания Google заявила, что 2.5 Flash продолжает оставаться ведущей моделью с лучшим соотношением цены и производительности на рынке. Модель также демонстрирует высокие результаты в Hard Prompts в LMArena - рейтинге лидеров оценки чат-ботов, уступая только выпущенной в прошлом месяце модели Gemini 2.5 Pro.