Как это работает
Ключевые преимущества
Прозрачность
Видимость процесса принятия решений моделью
Улучшенное качество
Лучшее решение сложных задач
Отладка
Понимание источников ошибок
Обучение
Изучение подходов к решению проблем
Поддерживаемые модели
| Модель | type | effort | effort_level | max_tokens | enabled | exclude | summary |
|---|---|---|---|---|---|---|---|
| T-Pro 2.0 | — | — | — | — | + | — | — |
| OpenAI o-series | — | + | — | +* | + | + | + |
| Anthropic Opus 4.6 | — | + | — | + | + | + | + |
| Anthropic Opus 4.7 | + | — | + | — | + | + | + |
| DeepSeek R1 | — | + | — | +* | + | + | — |
| Grok | — | + | — | — | + | + | — |
| Gemini Thinking | — | +* | — | + | + | + | + |
* — значение принимается, но провайдер может нормализовать его вниз до ближайшего поддерживаемого (см. описание конкретного параметра).
Claude Opus 4.7 управляется через адаптивное мышление: type: "adaptive" + опционально effort_level. Для остальных моделей используйте effort и/или max_tokens как раньше.
Параметры управления
type
Явный переключатель режима рассуждений. Поддерживается только моделями с адаптивным мышлением (Claude Opus 4.7 и новее). Значения:adaptive— включить адаптивное мышление: модель сама выбирает глубину рассуждений под задачу. Поляeffortиmax_tokensпри этом игнорируются — управление только черезeffort_level.disabled— явно отключить рассуждения.
effort и/или max_tokens.
effort
Пресет «усилия» для моделей с явно управляемым бюджетом рассуждений (OpenAI o-series, DeepSeek R1, Grok, Gemini Thinking, Claude Opus 4.6 и младше). Значения:none— рассуждения отключеныminimal— минимальные рассужденияlow— сниженные рассужденияmedium— сбалансированный режим (по умолчанию)high— детальные рассужденияxhigh— максимально детальные рассужденияmax— предельные усилия
Для Claude Opus 4.7 с
type: "adaptive" параметр effort игнорируется — используйте effort_level. На моделях, не поддерживающих верхние уровни (xhigh, max), значение может быть нормализовано провайдером до ближайшего поддерживаемого.effort_level
Подсказка глубины для адаптивного мышления Claude 4.6+. Действует только совместно сtype: "adaptive". Для остальных моделей игнорируется.
Значения: low / medium / high / max.
В отличие от effort, параметр effort_level не задаёт бюджет токенов напрямую — модель по-прежнему сама выбирает глубину, но ориентируется на указанный уровень усилий.
max_tokens
Жёсткий лимит токенов рассуждений (бюджет). Работает на моделях с явным бюджетом (OpenAI o-series, DeepSeek R1, Gemini Thinking, Claude Opus 4.6 и младше). Для Claude Opus 4.7 игнорируется — бюджетом управляет сама модель в адаптивном режиме.enabled
Явное включение/выключение рассуждений (true / false). По умолчанию определяется из effort или max_tokens.
exclude
Еслиtrue, рассуждения не включаются в ответ (но всё равно учитываются в биллинге).
summary
Управляет уровнем детализации резюме рассуждений:auto— автоматический выбор (по умолчанию)concise— краткое резюмеdetailed— подробное резюме
Управление глубиной адаптивного мышления
Для Claude Opus 4.7 и новее глубина рассуждений задаётся парой параметров:Значение effort_level | Когда использовать |
|---|---|
low | Простые вопросы, быстрые ответы |
medium | Стандартные задачи (по умолчанию) |
high | Сложный анализ, многошаговые задачи |
max | Предельные усилия, максимально глубокий разбор |
effort_level не задаёт бюджет токенов напрямую — модель по-прежнему сама выбирает глубину, но ориентируется на указанный уровень усилий.
Когда adaptive не тратит reasoning-токены
Adaptive thinking — это не «всегда думать», а «модель сама решает». Для простых запросов модель отвечает сразу, без рассуждений, и тогда:usage.completion_tokens_details.reasoning_tokens = 0- Поле
choices[0].message.reasoningотсутствует
effort_level: "max" как сильную подсказку. Окончательное решение всё равно за моделью.
Управление рассуждениями в Claude Opus 4.7
Claude Opus 4.7 поддерживает только адаптивное мышление — модель сама определяет глубину рассуждений под каждую задачу. Старый формат с фиксированным бюджетом токенов (budget_tokens) для 4.7 недоступен.
Адаптивное мышление выключено по умолчанию: запросы без явного включения выполняются без рассуждений.
Через Anthropic-совместимый endpoint (/v1/messages)
Через унифицированный endpoint (/v1/chat/completions, /v1/responses)
reasoning.type: "adaptive"— включает адаптивное мышление.reasoning.effort_level— опциональная подсказка уровня усилий (low/medium/high/max).reasoning.effortиreasoning.max_tokensдля Claude Opus 4.7 игнорируются. Передать их можно, ошибки не будет, но эффекта они не дадут.
Миграция с Opus 4.6
Anthropic-совместимый endpoint (/v1/messages)
Унифицированный endpoint (/v1/chat/completions, /v1/responses)
"effort_level": "max".
Когда использовать
Рекомендуется
- Математические задачи
- Программирование
- Анализ данных
- Планирование
- Логические головоломки
- Объяснение сложных концепций
Не рекомендуется
- Простые фактические вопросы
- Генерация контента
- Перевод текстов
- Простые диалоги
- Когда скорость критична
