Anthropic запускает новую модель ИИ, которая «думает» столько, сколько вы хотите

25.02.2025

Компания Anthropic выпускает новую передовую модель искусственного интеллекта под названием Claude 3.7 Sonnet, которую компания разработала так, чтобы она «думала» над вопросами столько времени, сколько нужно пользователям.

Anthropic называет Claude 3.7 Sonnet первой в отрасли «гибридной моделью рассуждений ИИ», так как это модель, которая может давать как ответы в реальном времени, так и более взвешенные, «продуманные» ответы на вопросы. Пользователи могут выбирать, активировать ли способности модели к рассуждению, которые заставят Claude 3.7 Sonnet «думать» в течение короткого или длительного периода времени.

С понедельника Claude 3.7 Sonnet доступна всем пользователям и разработчикам, но только те, кто заплатит за премиум-планы чат-бота Claude, получат доступ к функциям рассуждения модели. Бесплатные пользователи Claude получат стандартную версию Claude 3.7 Sonnet без рассуждений, которая, по утверждению Anthropic, превосходит ее предыдущую передовую модель ИИ Claude 3.5 Sonnet.

Claude 3.7 Sonnet представляет собой первую модель рассуждений Anthropic, которая по сравнению с традиционными моделями использует больше вычислительной мощности и требует больше времени для генерации ответов. Перед составлением своего ответа модель разбивает вопрос или проблему пользователя на ряд небольших шагов, рассматривая каждый из них по отдельности, и эта техника часто приводит к лучшему ответу.

На данный момент пользователи должны самостоятельно выбирать, как долго Claude 3.7 Sonnet будет думать над вопросом. Но в предстоящем обновлении, как утверждает компания, модель сможет сама определять наиболее подходящие временные рамки для размышлений, достигая оптимального баланса между стоимостью и качеством ответа.

«Сама модель должна распознавать, когда проблема требует более интенсивного мышления и корректировки, а не заставлять пользователей явно выбирать различные режимы рассуждений», — сказала руководитель отдела продуктов и исследований Anthropic Дайанна Пенн.

Еще одной интересной особенностью Claude 3.7 Sonnet является то, что модель будет показывать свои внутренние мыслительные процессы через специальный «видимый блокнот». Для большинства запросов пользователи смогут видеть всю логическую цепочку рассуждений, хотя в некоторых случаях некоторые элементы могут быть отредактированы из соображений доверия и безопасности.

Что касается производительности, то Claude 3.7 Sonnet значительно превосходит своих конкурентов, набрав 62,3% в реальном тесте SWE-Bench, по сравнению с 49,3% у OpenAI o3-mini и 49,2% у DeepSeek R1. В другом тесте, разработанном для оценки способности модели взаимодействовать с моделируемыми пользователями и внешними прикладными программными интерфейсами, который называется TAU-Bench, Claude 3.7 Sonnet набрала 81,2%, превысив показатель модели o1 от OpenAI, равный 73,5%.

Anthropic запускает новую модель ИИ, которая «думает» столько, сколько вы хотите