Все о Цифровых системах - новости, статьи, обзоры, аналитика. Более 1000 компаний, товаров и услуг в каталоге.
Добавить компанию

Google представляет общедоступную оптимизированную модель рассуждений Gemini 2.5 Pro

Рубрики: «Искусственный интеллект (AI)», «Генеративный искусственный интеллект»

До сих пор большая языковая модель была доступна через бесплатный интерфейс прикладного программирования с низкими лимитами использования. Разработчики могли отправлять только 25 запросов в день со скоростью до пяти запросов в минуту. Новая общедоступная предварительная версия Gemini 2.5 Pro предлагает платные уровни, которые имеют значительно более высокие лимиты скорости.

По данным Google, разработчики теперь могут отправлять модели до 2000 запросов в минуту без дневного ограничения. Gemini 2.5 Pro способна обрабатывать до 8 миллионов токенов данных в минуту. Это делает модель подходящей для производственных приложений с большим количеством пользователей.

За запросы, содержащие до 200’000 токенов, Google взимает плату в размере 1,25 доллара за 1 миллион входных токенов и 15 долларов за 1 миллион выходных токенов. Когда количество токенов в запросе превышает 200’000, то расценки увеличиваются до 2,5 и 15 долларов соответственно. Такие цены Google делают Gemini 2.5 Pro дороже, чем DeepSeek-R1, но дешевле, чем Claude 3.7 Sonnet от компании Anthropic.

«Экспериментальная версия Gemini 2.5 Pro по-прежнему доступна бесплатно с более низкими тарифными ограничениями», — написал в своем блоге старший менеджер по продуктам Google Логан Килпатрик.

Во время своего первого дебюта в прошлом месяце Gemini 2.5 Pro со значительным отрывом заняла первое место в популярном бенчмарке для больших языковых моделей «LMArena». Бенчмарк сравнивает производительность моделей ИИ на основе отзывов пользователей. Gemini 2.5 Pro также набрала 86,7% на «AIME 2025» - квалификационном экзамене для участия в математической олимпиаде США.

Представители Google также утверждают, что большая языковая модель компании превзошла несколько моделей, оптимизированных для рассуждений, без использования методов «вычисления во время тестирования», которые увеличивают стоимость. Вычисления во время тестирования — это метод машинного обучения, который повышает качество выходных данных языковой модели за счет увеличения количества времени и аппаратных ресурсов, которые она вкладывает в выполнение задач. Этот метод может значительно увеличить стоимость вывода.

Gemini 2.5 Pro является улучшенной версией модели Gemini 2.0 Pro, которую Google представила в декабре. Инженеры компании усовершенствовали как базовую модель, так и рабочий процесс «пост-тренинга». Пост-тренинг - это практика улучшения качества выходных данных большой языковой модели после обучения путем предоставления ей дополнительных данных.

Серия моделей Gemini от Google и большие языковые модели с открытым исходным кодом, такие как DeepSeek R1, создают большую конкуренцию компании OpenAI. Чтобы сохранить свои позиции на рынке, разработчик ChatGPT в ближайшие две недели запустит пару новых моделей рассуждений. OpenAI намерена выпустить модель рассуждений o3, доступную как автономный сервис, а также ранее не анонсированную языковую модель под названием o4-mini. Также через несколько месяцев компания выпустит модель GPT-5. Она описывается как система ИИ, которая объединяет оптимизированную для рассуждений модель o3 с несколькими другими функциями. OpenAI будет использовать GPT-5 для работы как с бесплатной, так и с платной версий ChatGPT.

Источник: