Reasoning Tokens, также известные как thinking tokens или токены рассуждений, предоставляют прозрачный взгляд на процесс рассуждения модели искусственного интеллекта.Documentation Index
Fetch the complete documentation index at: https://speshu.ai/docs/llms.txt
Use this file to discover all available pages before exploring further.
Как это работает
Ключевые преимущества
Прозрачность
Видимость процесса принятия решений моделью
Улучшенное качество
Лучшее решение сложных задач
Отладка
Понимание источников ошибок
Обучение
Изучение подходов к решению проблем
Поддерживаемые модели
| Модель | type | effort | effort_level | max_tokens | enabled | exclude | summary |
|---|---|---|---|---|---|---|---|
| T-Pro 2.0 | — | — | — | — | + | — | — |
| OpenAI o-series | — | + | — | +* | + | + | + |
| Anthropic Opus 4.6 | — | + | — | + | + | + | + |
| Anthropic Opus 4.7 | + | — | + | — | + | + | + |
| DeepSeek R1 | — | + | — | +* | + | + | — |
| Grok | — | + | — | — | + | + | — |
| Gemini Thinking | — | +* | — | + | + | + | + |
* — значение принимается, но провайдер может нормализовать его вниз до ближайшего поддерживаемого (см. описание конкретного параметра).
Claude Opus 4.7 управляется через адаптивное мышление: type: "adaptive" + опционально effort_level. Для остальных моделей используйте effort и/или max_tokens как раньше.
Параметры управления
type
Явный переключатель режима рассуждений. Поддерживается только моделями с адаптивным мышлением (Claude Opus 4.7 и новее). Значения:adaptive— включить адаптивное мышление: модель сама выбирает глубину рассуждений под задачу. Поляeffortиmax_tokensпри этом игнорируются — управление только черезeffort_level.disabled— явно отключить рассуждения.
effort и/или max_tokens.
effort
Пресет «усилия» для моделей с явно управляемым бюджетом рассуждений (OpenAI o-series, DeepSeek R1, Grok, Gemini Thinking, Claude Opus 4.6 и младше). Значения:none— рассуждения отключеныminimal— минимальные рассужденияlow— сниженные рассужденияmedium— сбалансированный режим (по умолчанию)high— детальные рассужденияxhigh— максимально детальные рассужденияmax— предельные усилия
Для Claude Opus 4.7 с
type: "adaptive" параметр effort игнорируется — используйте effort_level. На моделях, не поддерживающих верхние уровни (xhigh, max), значение может быть нормализовано провайдером до ближайшего поддерживаемого.effort_level
Подсказка глубины для адаптивного мышления Claude 4.6+. Действует только совместно сtype: "adaptive". Для остальных моделей игнорируется.
Значения: low / medium / high / max.
В отличие от effort, параметр effort_level не задаёт бюджет токенов напрямую — модель по-прежнему сама выбирает глубину, но ориентируется на указанный уровень усилий.
max_tokens
Жёсткий лимит токенов рассуждений (бюджет). Работает на моделях с явным бюджетом (OpenAI o-series, DeepSeek R1, Gemini Thinking, Claude Opus 4.6 и младше). Для Claude Opus 4.7 игнорируется — бюджетом управляет сама модель в адаптивном режиме.enabled
Явное включение/выключение рассуждений (true / false). По умолчанию определяется из effort или max_tokens.
exclude
Еслиtrue, рассуждения не включаются в ответ (но всё равно учитываются в биллинге).
summary
Управляет уровнем детализации резюме рассуждений:auto— автоматический выбор (по умолчанию)concise— краткое резюмеdetailed— подробное резюме
Управление глубиной адаптивного мышления
Для Claude Opus 4.7 и новее глубина рассуждений задаётся парой параметров:Значение effort_level | Когда использовать |
|---|---|
low | Простые вопросы, быстрые ответы |
medium | Стандартные задачи (по умолчанию) |
high | Сложный анализ, многошаговые задачи |
max | Предельные усилия, максимально глубокий разбор |
effort_level не задаёт бюджет токенов напрямую — модель по-прежнему сама выбирает глубину, но ориентируется на указанный уровень усилий.
Когда adaptive не тратит reasoning-токены
Adaptive thinking — это не «всегда думать», а «модель сама решает». Для простых запросов модель отвечает сразу, без рассуждений, и тогда:usage.completion_tokens_details.reasoning_tokens = 0- Поле
choices[0].message.reasoningотсутствует
effort_level: "max" как сильную подсказку. Окончательное решение всё равно за моделью.
Управление рассуждениями в Claude Opus 4.7
Claude Opus 4.7 поддерживает только адаптивное мышление — модель сама определяет глубину рассуждений под каждую задачу. Старый формат с фиксированным бюджетом токенов (budget_tokens) для 4.7 недоступен.
Адаптивное мышление выключено по умолчанию: запросы без явного включения выполняются без рассуждений.
Через Anthropic-совместимый endpoint (/v1/messages)
Через унифицированный endpoint (/v1/chat/completions, /v1/responses)
reasoning.type: "adaptive"— включает адаптивное мышление.reasoning.effort_level— опциональная подсказка уровня усилий (low/medium/high/max).reasoning.effortиreasoning.max_tokensдля Claude Opus 4.7 игнорируются. Передать их можно, ошибки не будет, но эффекта они не дадут.
Миграция с Opus 4.6
Anthropic-совместимый endpoint (/v1/messages)
Унифицированный endpoint (/v1/chat/completions, /v1/responses)
"effort_level": "max".
Когда использовать
Рекомендуется
- Математические задачи
- Программирование
- Анализ данных
- Планирование
- Логические головоломки
- Объяснение сложных концепций
Не рекомендуется
- Простые фактические вопросы
- Генерация контента
- Перевод текстов
- Простые диалоги
- Когда скорость критична
