Полная карта компонентов, связей и потоков данных в экосистеме Claude. Все данные из официальной документации Anthropic (docs.anthropic.com). Версия 1 / Апрель 2026
Способы взаимодействия с Claude без написания кода. Все интерфейсы используют один и тот же Claude API под капотом.
Основной веб-чат. Поддерживает артефакты (генерация HTML, React, SVG прямо в чате), проекты (группировка чатов с общим контекстом), memory (Claude запоминает информацию между чатами), загрузку файлов (PDF, изображения, документы), подключение внешних MCP-коннекторов (GitHub, Gmail, Notion и др. через меню "Search and tools").
Терминальный AI-агент для кодинга. Работает в CLI, читает и пишет файлы, запускает команды, поддерживает субагентов (параллельные агенты на подзадачи). Конфигурируется через CLAUDE.md в корне проекта. Поддерживает hooks (shell-команды до/после действий), plugins, и локальные MCP-серверы через STDIO.
Нативное десктоп-приложение (macOS, Windows). Поддерживает локальные MCP-серверы через файл конфигурации claude_desktop_config.json. MCP-серверы запускаются как локальные процессы (STDIO transport) и работают с локальными файлами, базами данных, и API.
Десктоп-инструмент для не-разработчиков. Автоматизация задач с файлами: обработка документов, организация, конвертация. Поддерживает remote MCP-коннекторы (как claude.ai). Бета-продукт.
Браузерный агент (бета). Управляет вкладками Chrome, читает содержимое страниц, заполняет формы, навигирует по сайтам. Использует собственный набор инструментов: computer, navigate, read_page, form_input, javascript_tool и др.
Нативные приложения для iOS и Android. Функционально аналогичны claude.ai: чат, загрузка файлов, memory, MCP-коннекторы. Поддерживают камеру для фото-ввода.
Программный доступ к Claude для интеграции в приложения.
Официальный SDK. Автоматическая аутентификация (читает ANTHROPIC_API_KEY из env), типизация, retry с экспоненциальным backoff, поддержка streaming (SSE), async/sync клиенты.
Официальный SDK для Node.js/Deno/Bun. Полная типизация TypeScript, async/await, streaming через async iterators. Тот же набор возможностей что и Python SDK.
Тот же движок, который работает внутри Claude Code, доступный программно. Предоставляет: agent loop (цикл думай-действуй-наблюдай), встроенные инструменты (bash, text_editor, web_search), подключение MCP-серверов, субагенты, hooks, structured outputs. Позволяет строить автономных агентов на Python или TypeScript.
Любой язык программирования через HTTP. Требует заголовки: x-api-key (API-ключ), anthropic-version (версия API, напр. 2023-06-01), Content-Type: application/json.
Claude доступен на Amazon Bedrock (ID: anthropic.claude-opus-4-6-v1), Google Vertex AI, и Microsoft Foundry. Те же модели, но оплата и аутентификация через облачного провайдера. MCP connector в API на Bedrock и Vertex пока не поддерживается.
RESTful API на api.anthropic.com. Единая точка входа для всех взаимодействий с моделями Claude.
Основной эндпоинт. Принимает: model (ID модели), messages (массив сообщений user/assistant), system (системный промпт), tools (определения инструментов), max_tokens (лимит выхода), temperature, stream (SSE). Возвращает текст, tool_use блоки, thinking блоки.
GAАсинхронная обработка больших объёмов запросов. Скидка 50% на все токены. До 100,000 запросов или 256MB на батч. Результаты доступны до 29 дней. Opus 4.6 и Sonnet 4.6 поддерживают до 300K output токенов через beta header output-300k-2026-03-24.
GAПодсчёт токенов до отправки запроса. Позволяет заранее оценить стоимость и проверить, помещается ли контекст в окно модели.
GAСписок доступных моделей. Возвращает max_input_tokens, max_tokens (output), и объект capabilities для каждой модели. Позволяет программно определить, какие фичи поддерживает конкретная модель.
GAЗагрузка и управление файлами для использования в нескольких запросах. Файл загружается один раз, затем ссылка на него передаётся в messages. Экономит трафик при повторном использовании.
GAСоздание и управление кастомными навыками агентов. Skill — это переиспользуемый набор инструкций и поведения, который можно подключить к агенту.
GAУправление организацией: workspaces (сегментация ключей и расходов), участники, роли. Отдельный от основного API, работает через admin.anthropic.com или через API-ключи с admin-правами.
GAТри линейки моделей, отличающиеся балансом между интеллектом, скоростью и ценой.
| Модель | API ID | Контекст (вход) | Max выход | Цена (input/output за 1M) | Назначение |
|---|---|---|---|---|---|
| Opus 4.6 | claude-opus-4-6 |
1M токенов | 32K (sync), 300K (batch) | $5 / $25 | Самая умная модель. Кодинг, агенты, сложные рассуждения, enterprise |
| Sonnet 4.6 | claude-sonnet-4-6 |
1M токенов | 64K (sync), 300K (batch) | $3 / $15 | Баланс ум/скорость. Кодинг, агенты, рабочие нагрузки |
| Haiku 4.5 | claude-haiku-4-5-20251001 |
200K токенов | 8K | $1 / $5 | Быстрая и дешёвая. Классификация, роутинг, простые задачи |
Фичи, которые контролируют как модель рассуждает и форматирует ответы. Включаются через параметры в Messages API.
Модель генерирует внутренний блок рассуждений (thinking) перед ответом. Thinking-токены оплачиваются как output-токены по стандартной ставке. Минимальный бюджет: 1024 токена. Улучшает качество на сложных задачах: математика, кодинг, анализ. Thinking-блок не виден пользователю по умолчанию.
GAМодель автоматически подбирает глубину рассуждений под задачу. Простой вопрос — мало thinking, сложный — много. Не требует ручной настройки бюджета thinking-токенов.
GAРучная настройка усилий модели: low, medium, high. Позволяет контролировать баланс скорость/качество. Отличается от extended thinking тем, что влияет на всю генерацию, а не только на thinking-блок.
GAРежим ускоренной генерации для задач, где скорость важнее максимального качества. Beta research preview.
BetaГарантированный JSON-ответ по заданной JSON-схеме. Включается через strict: true в tool definitions. Claude всегда вернёт валидный JSON, точно соответствующий схеме. JSON-схемы кэшируются до 24 часов.
Ссылки на конкретные предложения из источников. Работает с search results, загруженными документами. Каждая цитата указывает на индекс документа и предложения.
GASSE (Server-Sent Events) поток токенов в реальном времени. Каждый токен отправляется по мере генерации. Типы событий: message_start, content_block_start, content_block_delta, content_block_stop, message_stop. Позволяет показывать ответ пользователю по мере генерации.
GAАнализ изображений: фото, скриншоты, графики, диаграммы. Поддерживает PNG, JPEG, GIF, WebP. До 20 изображений за запрос. Изображения передаются как base64 или через URL. Токены считаются по формуле на основе размера изображения.
GAЧтение PDF файлов. PDF конвертируется в изображения (каждая страница — отдельное изображение). Поддерживает таблицы, графики, текст, формулы. Подходит для документов, отчётов, научных статей.
GAАсинхронная обработка до 100K запросов. Скидка 50% на все токены. Результаты в течение 24 часов (обычно быстрее). Идеально для: генерация контента, классификация данных, обработка документов.
GAAnthropic НЕ предоставляет собственную модель эмбеддингов. Документация рекомендует сторонние решения: Voyage AI, и др. Это часто путает новых пользователей.
Tools позволяют Claude выполнять действия в реальном мире. Делятся на два типа по месту исполнения.
Результат возвращается inline в потоке ответа. Клиент не участвует в исполнении. Могут иметь дополнительную стоимость сверх токенов.
Поиск в интернете. Возвращает до 10 результатов с заголовками, URL, сниппетами. Claude автоматически цитирует источники. Стоимость: $10 за 1000 поисков + токены.
Загрузка полного содержимого веб-страницы по URL. Извлекает текст в markdown. Без дополнительной платы сверх токенов.
Исполнение Python-кода в изолированной песочнице Anthropic. Возвращает stdout/stderr. Бесплатно при использовании вместе с web_search или web_fetch. Отдельно — оплата по времени исполнения.
Поиск по каталогу инструментов. Два режима: regex (точное совпадение по имени) и BM25 (семантический поиск по описаниям). Возвращает 3-5 наиболее релевантных tool_reference блоков, которые автоматически раскрываются в полные определения. Добавляет ~500 токенов overhead.
Claude возвращает tool_use блок с именем инструмента и JSON-аргументами. Клиент исполняет действие и отправляет tool_result обратно. Цикл продолжается пока модель не решит, что задача выполнена (stop_reason: end_turn).
Определяются через JSON-схему: name, description, input_schema. Claude решает когда вызвать на основе описания. Вы определяете логику исполнения. Поддержка parallel tool use (несколько вызовов за один ход) и strict mode (гарантия соответствия схеме).
Anthropic-schema tool для shell-команд. Предоставляется Anthropic (стандартная схема), но исполняется на вашей стороне. Claude отправляет команду, вы запускаете и возвращаете результат. Добавляет 245 input-токенов к каждому запросу.
Anthropic-schema tool для редактирования файлов. Операции: view (чтение), str_replace (замена уникальной строки), create (создание файла). Вы исполняете операции в файловой системе.
Управление компьютером через мышь и клавиатуру. Claude отправляет действия (click, type, screenshot), вы исполняете через драйвер (например, PyAutoGUI) и возвращаете скриншот результата.
Механизмы обнаружения, оркестрации и масштабирования инструментов.
Решает проблему "context bloat" — когда определения сотен инструментов съедают контекстное окно. Вместо загрузки всех tool definitions сразу, Claude видит только индекс (имена и описания) и подгружает полные определения по запросу. Результат: экономия 85%+ контекста. Типичный пример: 50+ MCP tools потребляют ~77K токенов без tool search, и ~8.7K с tool search.
Стратегии управления контекстом при использовании инструментов: фильтрация tool_result (не возвращать лишние данные), усечение длинных результатов, кэширование определений.
Claude может вызвать несколько инструментов в одном ходу (несколько tool_use блоков в одном ответе). Клиент исполняет все параллельно и отправляет все tool_result в одном сообщении.
Гарантия что аргументы tool_use точно соответствуют JSON-схеме. Включается через strict: true в определении инструмента. Если модель не может сгенерировать валидные аргументы, она не вызовет инструмент.
Принудительный вызов конкретного инструмента через tool_choice: auto (модель решает), any (обязательно вызвать хотя бы один), tool (конкретный инструмент по имени), none (запретить вызовы).
Открытый стандарт для подключения AI к внешним инструментам и источникам данных. Позволяет Claude работать с базами данных, API, файловыми системами без написания кастомных интеграций.
Подключение к удалённым MCP-серверам прямо из Messages API. Сервер должен быть публично доступен через HTTP. Только tool calls поддерживаются (не prompts/resources из MCP спецификации). Anthropic подключается к серверу от своего имени — сервер должен быть доступен из интернета. Не поддерживается на Bedrock и Vertex.
MCP-серверы как локальные процессы. Работают только в Claude Code и Claude Desktop. Сервер запускается командой (npx, python, node) и общается через stdin/stdout. Примеры: файловая система, PostgreSQL, git. Конфигурируются в claude_desktop_config.json или .claude.json.
MCP-серверы доступные через интернет. Работают во всех клиентах: claude.ai, Desktop, Cowork, mobile. Два транспорта: Streamable HTTP (новый, рекомендуемый) и SSE (legacy). Поддержка auth headers и OAuth 2.1. Примеры: GitHub, Slack, Gmail, Notion, Figma, Canva, Supabase, Vercel, ClickUp, Sentry.
Agent SDK автоматически управляет MCP-подключениями. Поддерживает все транспорты. MCP-серверы определяются в опциях агента, SDK сам подключается, получает список инструментов, и предоставляет их модели.
Всё, что модель "видит" при генерации ответа — это контекстное окно. Эти механизмы управляют его эффективностью.
Максимальный объём информации, который модель обрабатывает за один запрос. Opus 4.6 и Sonnet 4.6: 1M токенов (~750K слов). Haiku 4.5: 200K токенов. Контекст включает: system prompt + conversation history + tool definitions + файлы. Всё, что за пределами окна — модель не видит.
Кэширование повторяющихся частей контекста (system prompt, tool definitions, длинные документы). Cache hit стоит 10% от стандартной цены input. Два режима: 5-минутный кэш (write = 1.25x) и 1-часовой кэш (write = 2x). Кэширование окупается уже после 1-2 повторных запросов.
Автоматическое сжатие контекста когда окно переполняется. Модель резюмирует историю, сохраняя суть и убирая детали. Используется в Claude Code и Agent SDK для длинных сессий.
Ручное редактирование контекстного окна: удаление ненужных сообщений, замена блоков. Позволяет освободить место для нового контента без потери важной информации.
Компоненты для построения автономных AI-агентов. Доступны через Claude Code и Agent SDK.
Цикл: модель думает → вызывает инструмент → получает результат → думает снова. Продолжается пока модель не решит, что задача выполнена (stop_reason: end_turn). Agent SDK и Claude Code управляют этим циклом автоматически.
Параллельные агенты, каждый на свою подзадачу. Главный агент координирует работу, назначает задачи, и объединяет результаты. Доступно в Claude Code и Agent SDK.
Markdown-файл в корне проекта. Claude Code читает его в начале каждой сессии. Содержит: стандарты кода, архитектурные решения, предпочтительные библиотеки, чеклисты ревью. Также Claude сохраняет auto memory — выученные паттерны между сессиями.
Shell-команды, выполняемые до или после действий Claude Code. Примеры: автоформатирование после редактирования файла, запуск lint перед коммитом. Конфигурируются в settings.json.
Переиспользуемые пакеты для Claude Code, включающие MCP-серверы, hooks, и slash-команды. Устанавливаются на уровне команды — все участники получают одинаковые инструменты.
Переиспользуемые навыки через Skills API. Skill — это набор инструкций, определяющий поведение агента для конкретной задачи. Может включать промпты, примеры, ограничения. Подключается через API или claude.ai.
Управление доступом, расходами, и соответствием требованиям.
Параметр inference_geo в Messages API. Определяет где запускается инференс модели. Поддерживаемые регионы: US, EU. US-only inference = наценка 1.1x на все токены. Global routing (по умолчанию) — стандартная цена.
Сегментация API-ключей и расходов. Каждый workspace — свои ключи, свои лимиты, свой биллинг. Позволяет разделять расходы по проектам, командам, клиентам.
Мониторинг расхода токенов и денег по моделям, ключам, и workspaces. Позволяет строить дашборды и алерты.
Zero Data Retention — промпты и ответы не хранятся. Доступно для enterprise. Исключения: MCP connector, tool search (каталог инструментов хранится), web search с dynamic filtering. Structured outputs — только JSON-схемы кэшируются до 24 часов.
Пошаговый путь сообщения от пользователя до ответа.
Клиент отправляет POST /v1/messages с параметрами: model, messages[], system, tools[], max_tokens, stream. Заголовки: x-api-key, anthropic-version, Content-Type: application/json.
API проверяет API-ключ, права доступа, и лимиты: RPM (requests per minute), ITPM (input tokens per minute), OTPM (output tokens per minute). При превышении — 429 Too Many Requests.
API собирает полный контекст для модели: system prompt + conversation history (все messages) + tool definitions + загруженные файлы/изображения. Если prompt caching включен — проверяет cache hit для повторяющегося префикса.
Выбранная модель обрабатывает контекст. Если extended thinking включен — сначала генерирует thinking-блок (внутренние рассуждения), затем основной ответ. Inference_geo определяет регион исполнения.
Модель генерирует токены. Три возможных stop_reason:
end_turn — модель закончила ответ. Финальный текст отправляется клиенту.
tool_use — модель хочет вызвать инструмент. Возвращает tool_use блок с именем и JSON-аргументами.
max_tokens — достигнут лимит output-токенов. Ответ обрезан.
Server tools (web_search, code_execution, web_fetch, tool_search): Anthropic исполняет на своей инфраструктуре. Результат появляется в потоке ответа автоматически.
Client tools (bash, text_editor, computer, ваши кастомные): API возвращает tool_use блок клиенту. Клиент исполняет действие и отправляет новый запрос с tool_result в messages.
MCP tools: MCP connector подключается к удалённому серверу, вызывает tool, получает результат. Для API — работает как server tool (результат inline). Для Agent SDK/Claude Code — может быть и локальный (STDIO).
После получения tool_result, модель снова обрабатывает контекст (теперь включающий результат инструмента) и генерирует следующий ответ. Цикл повторяется до stop_reason: end_turn.
Модель возвращает финальный контент: текст, citations (если был web_search), structured output (если strict mode). При streaming — каждый токен отправляется через SSE по мере генерации. Usage в ответе содержит точный подсчёт: input_tokens, output_tokens, cache_creation_input_tokens, cache_read_input_tokens.
Все цены за 1 миллион токенов (MTok). 1M токенов ~ 750,000 слов. Данные актуальны на апрель 2026.
| Модель | Input / MTok | Output / MTok | Cache write | Cache read |
|---|---|---|---|---|
| Opus 4.6 | $5.00 | $25.00 | 1.25x input (5min) / 2x (1hr) | 0.1x input |
| Sonnet 4.6 | $3.00 | $15.00 | 1.25x / 2x | 0.1x |
| Haiku 4.5 | $1.00 | $5.00 | 1.25x / 2x | 0.1x |
| Модификатор | Эффект |
|---|---|
| Batch API | -50% на input и output |
| Prompt caching (cache hit) | -90% на закэшированные input токены |
| Data residency (US-only) | +10% на все категории токенов |
| Extended thinking | Thinking-токены = output rate (без наценки) |
| Tool | Стоимость |
|---|---|
| web_search | $10 за 1000 поисков + стандартные токены |
| web_fetch | Без доп. платы, только токены |
| code_execution | Бесплатно с web_search/web_fetch; отдельно — по времени |
| tool_search | ~500 токенов overhead |
| Tool use system prompt | ~313-346 доп. input-токенов при наличии хотя бы 1 tool |
| bash tool | +245 input-токенов |
Источник: docs → pricing