OpenClaw Install

Российские LLM в OpenClaw: GigaChat и YandexGPT — архитектурный разбор

Российские LLM в OpenClaw: GigaChat и YandexGPT — архитектурный разбор
Из этой статьи:
  • GigaChat и YandexGPT нельзя подключить к OpenClaw напрямую — обе модели говорят на собственных протоколах с OAuth Сбера и Yandex Cloud API; решение — прокси-слой, который транслирует OpenAI Chat Completions в нативный формат провайдера
  • Архитектурный паттерн «главный + специалисты»: 80% рутинных запросов уходят в дешёвый GigaChat-Pro, 15% — в YandexGPT для двуязычных задач, 5% — в Claude для сложных кейсов; средний счёт за токены падает в 5–10 раз
  • Контур данных полностью внутри РФ — критично для 152-ФЗ: OpenClaw на VPS в России, прокси на localhost, GigaChat и YandexGPT на серверах Сбера и Яндекса; для регулируемых отраслей это не альтернатива Claude, а единственный вариант
  • Готовый стек openclaw-ru-skills закрывает не сам код (это сотни строк), а пять конкретных подводных камней: defunct-процессы gpt2giga, путаница IAM permissions vs folder roles, CalDAV-пути для Yandex.Calendar, SMTP-блокировки Railway, утечка credentials через ps aux
  • Какую модель куда: GigaChat-Pro для коротких ответов в Telegram, YandexGPT для двуязычных текстов и аналитики 32K, Claude Sonnet для длинных юр.документов, Claude Opus для кода с Extended Thinking, GigaChat Lite для простых классификаций

Из этой статьи:

  • Почему нельзя подключить GigaChat и YandexGPT напрямую — обе модели говорят на собственных протоколах, OpenAI-совместимости из коробки нет.
  • Прокси-слой как стандартное решение: между OpenClaw и российской LLM ставится транслятор протокола, и фреймворк продолжает считать, что разговаривает с OpenAI.
  • GigaChat vs YandexGPT vs Claude — где какую модель ставить: бытовые ответы, длинные документы, код, двуязычные задачи.
  • 152-ФЗ и контур данных — для медицины, финансов и госсектора это не «приятный бонус», а юридическое требование.
  • Архитектурный паттерн «главный + специалисты» — почему мульти-агент с делегированием экономнее, чем один универсальный агент на дорогой модели.

Почему этот вопрос вообще возник

OpenClaw в стандартной поставке настроен на западные модели: Claude от Anthropic, GPT от OpenAI, опционально DeepSeek или Qwen. Это удобно, пока вы не упираетесь в три ситуации:

  • Картой РФ платить нельзя. Anthropic и OpenAI напрямую из России не принимают платежи — нужны посредники, ВПН, иностранные карты, а у бизнеса это значит чеки на услуги, которых нельзя показать в бухгалтерии.
  • Данные не должны покидать РФ. Для медорганизаций, банков, страховых, госструктур и любого подрядчика, работающего с персональными данными граждан РФ — отправка переписки в условный Anthropic это нарушение 152-ФЗ.
  • Русскоязычные тонкости. Сбер и Яндекс десятилетиями обучали свои модели на русском интернете, документации и переписке. На «внутренних» формулировках (например, «провести сверку с контрагентом», «закрыть период», «снять остатки») они часто срабатывают точнее зарубежных конкурентов.
  • GigaChat и YandexGPT решают все три проблемы. Вопрос в том, как их аккуратно встроить в OpenClaw, не сломав остальную архитектуру.

    Главная архитектурная проблема — несовместимость протоколов

    OpenClaw общается с моделями через протокол OpenAI Chat Completions. Это де-факто стандарт: его поддерживают Anthropic (через адаптер), DeepSeek, Together.ai, vLLM, Ollama. Ваш код один раз пишется под эндпоинт /v1/chat/completions, а модель за ним — взаимозаменяема.

    GigaChat и YandexGPT в этот ряд не встраиваются:

    • GigaChat требует собственную OAuth-авторизацию, использует корневой CA Сбера (которого нет в стандартных доверенных хранилищах), отдаёт ответы в своём формате.
    • YandexGPT работает через Yandex Cloud API: авторизация по Api-Key, обязательный folderId, путь foundationModels/v1/completion, своя структура запроса/ответа.
    Если подключать их напрямую — придётся либо ждать встроенной поддержки в OpenClaw (которая может никогда не приехать), либо форкать фреймворк. Оба варианта плохие.

    Решение: прокси-слой

    Практика, к которой пришло сообщество — поставить между OpenClaw и российской моделью транслятор протокола. Маленький локальный сервер, который:

    [OpenClaw] --POST /v1/chat/completions--> [Прокси на 127.0.0.1] --> [GigaChat/YandexGPT API]
       ↑                                            |
       └────────────── ответ в формате OpenAI ←─────┘

    Для OpenClaw это выглядит как ещё один OpenAI-совместимый провайдер — она ничего не знает про Сбер и Яндекс. Прокси берёт на себя весь грязный код: авторизацию, маппинг полей, обработку SSL-сертификатов, нормализацию usage-статистики.

    Для GigaChat готовое решение — открытый Python-проект gpt2giga. Для YandexGPT — собственный Node.js-прокси, который выложен в составе репозитория smvlx/openclaw-ru-skills (~150 строк, без зависимостей). Оба слушают локальные порты, оба регистрируются в openclaw.json обычным блоком провайдера.

    Это архитектурно правильное решение: фреймворк остаётся в неприкосновенности, а замена модели сводится к перезапуску прокси на другом порту.

    Какая модель под какую задачу

    Подключить — полдела. Дальше нужно понять, какую модель куда направлять. Ниже — практическая разбивка по задачам.

    ЗадачаЛучше всегоПочему
    Короткие ответы клиентам в TelegramGigaChat-ProДёшево, говорит по-русски, отвечает быстро
    Длинные юридические документыClaude Sonnet 4.5Контекст 200K+, точное следование инструкциям
    Код и рефакторингClaude Opus 4.6Лучшее качество кода, поддержка Extended Thinking
    Двуязычные тексты (RU+EN)YandexGPTБилингвальная модель, не «русифицирует» английский
    Бизнес-аналитика, отчётыYandexGPT 32KКонтекст 32K, неплохое качество, цена ниже Claude
    Маркетинговый креатив на русскомGigaChat-MaxСильнее держит стиль, чем YandexGPT
    Простые классификации (тег/категория)GigaChat LiteСамый дешёвый вариант, для рутины хватает
    Это не «Claude всегда лучший» — для большинства бытовых задач русскоязычного бота GigaChat-Pro закрывает всё, а стоит он на порядок дешевле. Claude разумно держать в резерве для сложных кейсов: длинные документы, код, аналитика с цепочками рассуждений.

    Архитектурный паттерн «главный + специалисты»

    Из этого вытекает естественная архитектура мульти-агентной системы:

    Пользователь → главный агент (Claude Sonnet) → решает: рутинно или сложно?
                                                  ├─ рутина → делегирует GigaChat
                                                  ├─ юр.документ → оставляет себе
                                                  ├─ английский → делегирует YandexGPT
                                                  └─ код → делегирует Claude Opus

    Главный агент дорогой, но умный — его задача правильно роутить. Специалисты дешёвые, но узкоспециализированные. Экономика получается такая:

    • 80% запросов уходит в GigaChat-Pro (~₽1–2 за тысячу токенов)
    • 15% — в YandexGPT для двуязычной работы
    • 5% — в Claude для сложных кейсов
    По итогу средний счёт за токены падает в 5–10 раз по сравнению с конфигурацией «всё на Claude». На объёмах 100K+ запросов в месяц это разница между «терпимо» и «окупается».

    В OpenClaw такая схема собирается через блок tools.agentToAgent с allow-листом subagents — главный агент через инструмент sessions_send передаёт задачу нужному специалисту и получает ответ.

    Контур данных и 152-ФЗ

    Если вы работаете с персональными данными граждан РФ — переписка пользователя автоматически становится «обработкой ПДн». А Закон 152-ФЗ требует, чтобы базы с ПДн физически находились на серверах в РФ.

    При подключении российских моделей контур получается чистый:

    • OpenClaw Gateway — на VPS в РФ (например, Selectel, Timeweb, MCS).
    • gpt2giga / yandexgpt-proxy — на той же машине, локальные порты 127.0.0.1:8443/8444.
    • GigaChat / YandexGPT API — серверы Сбера и Яндекса в РФ, по их публичным заявлениям.
    • Telegram — формально иностранный, но с массовым корпоративным использованием в РФ; для строгих сценариев заменяется на VK Teams или MAX.
    Для Claude или GPT в этом контуре места нет — данные уйдут за рубеж. Поэтому в регулируемых отраслях GigaChat/YandexGPT не альтернатива, а единственный вариант.

    Что внутри готового стека openclaw-ru-skills

    Репозиторий smvlx/openclaw-ru-skills — это набор готовых компонентов, которые избавляют от необходимости писать прокси и навыки с нуля:

    • gigachat/ — навык-обёртка над gpt2giga. Стартует прокси, пробрасывает credentials через переменные окружения, регистрируется в OpenClaw.
    • yandexgpt/ — Node.js translation-прокси без зависимостей. Принимает запросы в формате OpenAI на порту 8444, переводит в Yandex Cloud Foundation Models API.
    • yax/ — отдельный CLI для всей экосистемы Yandex 360: Disk, Calendar (через CalDAV API с auto-discovery), Mail (IMAP/SMTP), Telemost. Авторизация через OAuth с сохранением токена в ~/.openclaw/yax/token.json.
    Ключевая ценность стека — не код (это несколько сотен строк), а закрытые подводные камни:
    • gpt2giga имеет привычку оставаться defunct-процессом и держать порт — рецепт лечения известен.
    • В Yandex Cloud путаница между permissions на сервисный аккаунт и ролями на folder — стек даёт правильные yc команды.
    • CalDAV у Yandex.Calendar требует точных путей вида /calendars/{login}@yandex.ru/events-{id}/{uid}.ics, а не корня /calendars/events/.
    • При деплое на Railway блокируются исходящие SMTP-порты (25/465/587), что ломает Yandex Mail. Стек документирует это как известное ограничение.
    По сути это «дистрибутив» — фреймворк уже умеет работать с российскими LLM, осталось скопировать конфиг и запустить.

    Где обычно ломается

    Коротко о пяти типичных граблях, на которые натыкаются те, кто настраивает связку самостоятельно:

  • GigaChat возвращает 402 Payment Required — исчерпан бесплатный лимит scope GIGACHAT_API_PERS, нужно переходить на платный тариф или новые credentials.
  • YandexGPT возвращает 403 — почти всегда забыли назначить роль ai.editor на folder, а не на сервисный аккаунт. Permissions на SA модель не видит.
  • Прокси работает, но ответы медленные — проверить, что прокси и OpenClaw на одной машине (через 127.0.0.1, а не публичный IP).
  • OpenClaw не видит провайдера — после правки openclaw.json нужен openclaw gateway restart.
  • Credentials утекают в ps aux — никогда не передавайте Client Secret через CLI-аргументы, только через переменные окружения или файлы с правами 600.
  • Когда нужна помощь профессионала

    Собрать проксиями обвешанного мульти-агента с GigaChat, YandexGPT и Telegram-ботом — это не «вечер выходного дня». Это OAuth-фло, отладка SSL-сертификатов Сбера, правильная настройка systemd-юнитов для двух прокси, мониторинг расходов токенов, бэкапы памяти агентов и обвязка SSL для самого Telegram-бота. Реалистичная оценка — 8–14 часов работы для опытного DevOps.

    Сервис OpenClaw Install ставит OpenClaw под российский стек под ключ: GigaChat + YandexGPT + опциональный Claude в гибридной схеме, мульти-агент в Telegram, контур внутри РФ. Установка — от 4000 ₽ разово, сопровождение — 7000 ₽/мес. Подробнее: тарифы или сразу в @openclawinstallru_bot.

    Итог

    Подключение российских LLM к OpenClaw — это не «костыль», а штатная архитектурная схема: прокси-слой между фреймворком и API провайдера. На выходе вы получаете:

    • ✅ Контур данных полностью внутри РФ (152-ФЗ-совместимый)
    • ✅ Оплата с российских карт без посредников
    • ✅ Снижение расходов на токены в 5–10 раз через мульти-агентную схему «главный + специалисты»
    • ✅ Хорошее качество русскоязычных ответов на бытовых задачах
    • ⚠️ Claude/GPT остаются для сложных кейсов (длинные документы, код), но через гибридную схему
    Для русскоязычного Telegram-бота, корпоративного помощника или ассистента в регулируемой отрасли это сегодня практический выбор по умолчанию. Технология зрелая, готовый стек открытый, подводные камни задокументированы.

    Дальше читать

    • Пошаговая инструкция по сборке (включая команды и JSON-конфиги): habr.com/ru/articles/996966/ — гайд от автора smvlx, на котором основан репозиторий openclaw-ru-skills.
    • Как сравнивается OpenClaw с Hermes по архитектуре, памяти и каналам: /blog/openclaw-vs-hermes/.
    • Локальный AI без облака — Gemma 4 + Ollama для приватных задач: /blog/openclaw-gemma-ollama/.

    Дмитрий Мочалов

    Основатель OpenClaw Install. Помогаем настроить AI-ассистентов для бизнеса и личных задач.

    @openclawinstallru_bot

    Читайте также