Агентные платформы

Агентные платформы и приватный ChatGPT on-premise

Open WebUI, Dify, n8n, Hermes Agent, Open Claw, vLLM, Unsloth — разворачиваем готовые open-source платформы на вашем Proxmox под ключ. Приватный ChatGPT, AI-workflows, self-improving агенты, fine-tuning ваших моделей. 2-4 недели до пилота.

10+
готовых open-source стеков
2-4
недели до пилота
100%
on-premise, ваши данные
0₽
лицензий — open-source

Что мы делаем

Полный спектр услуг для решения ваших задач

Open WebUI + Ollama

Open WebUI + Ollama

Приватный ChatGPT для команды. GigaChat / YandexGPT локально, RAG по корпоративной базе, multi-user, RBAC, аудит-лог. Заменяет паблик-ChatGPT там, где данные нельзя в облако.

Open WebUIOllamaRAGRBAC
Dify — no-code LLM приложения

Dify — no-code LLM приложения

Визуальный builder LLM-приложений: workflow-редактор, RAG из коробки, multi-modal, eval-suite. Контент-команда строит ассистентов сама, без разработчиков.

DifyWorkflowRAGNo-code
n8n + AI nodes

n8n + AI nodes

Open-source Zapier с LLM-нодами. Автоматизация: классификация писем, генерация отчётов из CRM, обработка тикетов, AI-обогащение лидов. 400+ интеграций.

n8nWorkflowWebhooksSelf-hosted
Hermes Agent — self-improving

Hermes Agent — self-improving

AI-агент от Nous Research со встроенным learning loop: автономно создаёт и улучшает навыки, держит persistent memory, спавнит сабагентов. Деплой везде — TUI, MAX, Discord, Slack, WhatsApp. Atropos RL environments + trajectory generation для дообучения собственных моделей.

Hermes AgentAtropos RLSelf-improvingMulti-channel
Open Claw — личный AI через мессенджеры

Open Claw — личный AI через мессенджеры

Local-first персональный AI-ассистент. 20+ мессенджеров (WhatsApp / MAX / Slack / Discord / Signal / iMessage), Live Canvas с визуальным workspace, voice wake words, isolated workspaces. Работает на macOS / iOS / Android, Node.js — никакой привязки к облаку.

Open Claw20+ channelsVoice wakeLocal-first
Fine-tuning: Unsloth + LLaMA-Factory

Fine-tuning: Unsloth + LLaMA-Factory

Pipeline дообучения моделей на ваших данных: Hermes Agent генерит trajectory-датасеты с реальных задач → Unsloth ускоряет LoRA/QLoRA в 2-5× → LLaMA-Factory даёт Gradio WebUI для не-разработчиков (загрузил датасет → конфиг → train → eval). Базовые модели: GigaChat, YandexGPT, Hermes 3. Без выгрузки данных.

UnslothLLaMA-FactoryPyTorchAtroposLoRA

Как мы работаем

Прозрачный процесс от первого звонка до запуска

1

Discovery & выбор стека

Понимаем сценарий (приватный ChatGPT / workflow-автоматизация / мульти-агенты), оцениваем железо, выбираем 1-3 платформы из стека.

1 неделя
2

Развёртывание инфраструктуры

Поднимаем GPU-сервер (если нужен), Proxmox VE, Docker, Caddy, Postgres+pgvector, Qdrant. Сетевая изоляция, SSO, бэкапы.

1-2 недели
3

Pilot use-case

Выбранную платформу настраиваем под 1-2 пилотных кейса. Загружаем корпоративную базу знаний, настраиваем роли, тестируем с командой.

1-2 недели
4

Hand-off с обучением

Документация, обучение администратора, регламент обновлений. Каждая платформа — open-source, никакого vendor lock-in.

1 неделя
5

Поддержка и развитие

SLA 24/7 при необходимости. Расширение базы знаний, новые workflow, мониторинг качества и стоимости.

Постоянно

Кейсы

Реальные проекты и результаты наших клиентов

Внутренний ChatGPT для юристов
Юридическая компания

Внутренний ChatGPT для юристов

Задача

Юристы 60+ человек используют публичный ChatGPT с корпоративными договорами. Юридические риски, утечка данных клиентов.

Решение

Open WebUI + Ollama (GigaChat) на 2×A100. RAG по корпоративной базе договоров и нормативки. SSO через Active Directory, аудит-лог запросов.

Результат

100% запросов остаются на корпоративном сервере. 80% юристов используют ежедневно. Окупаемость 6 месяцев vs ChatGPT Enterprise.

Open WebUIGigaChatRAGSSO
n8n-конвейер обработки тикетов поддержки
ИТ-компания

n8n-конвейер обработки тикетов поддержки

Задача

Поддержка обрабатывает 500+ тикетов/день вручную: классификация, маршрутизация, заглушки-ответы.

Решение

n8n с AI-нодами GigaChat: классификация (urgent/normal/spam), извлечение сущностей, авто-ответ для типовых, маршрутизация на инженера. Интеграция с Jira и Slack.

Результат

60% тикетов закрываются автоматически или полу-автоматически. Время до первого ответа упало с 4 часов до 8 минут.

n8nGigaChatJiraSlack
Dify-RAG по технической документации
Промышленность

Dify-RAG по технической документации

Задача

Инженеры терялись в 50 000+ страниц регламентов, чертежей, инструкций. Ответ на типовой вопрос занимал час поиска.

Решение

Dify с workflow: parse PDF/CAD → embeddings в pgvector → hybrid retrieval → GigaChat с цитатами-источниками. Развёрнут в DMZ заказчика.

Результат

Ответ за 15 секунд с прямыми ссылками на параграф документа. Используется 200+ инженерами, 1500+ запросов/день.

DifyGigaChatpgvectorPDF

Технологический стек

Инструменты и технологии, которые мы используем

LLM Frontends

Open WebUIDifyLobeChatAnythingLLMFlowise

Workflow / Automation

n8nMake (self-hosted)Apache AirflowTemporal

Agent frameworks

Hermes Agent (Nous)Open ClawAutoGenCrewAILangGraphGigaChat Agent SDK

Fine-tuning

UnslothLLaMA-Factory (WebUI)PyTorchPEFT / LoRAQLoRAAtropos RL

Inference / Serving

vLLMOllamaTGIllama.cppTriton

Models

GigaChatYandexGPTHermes 3

Vector DB / RAG

pgvector (Postgres)QdrantMilvusWeaviate

Инфраструктура

NVIDIA A100 / RTX 6000 AdaProxmox VEDocker ComposeCaddyPostgres 16MinIO
Все платформы — open-source с пермиссивными лицензиями (MIT / Apache 2 / BSD). Никаких enterprise-подписок. Развёртывание на нашем Proxmox VE и потом миграция в инфру заказчика — один docker compose up. Полная независимость от иностранных облаков.

Хотите свой ChatGPT без облака?

Проведём бесплатный воркшоп: подберём open-source стек под ваш сценарий, оценим железо, согласуем pilot за 2-4 недели.

Бесплатный технический воркшоп
Pilot за 2-4 недели на нашем Proxmox
Open-source без vendor lock-in
Все данные — у вас on-premise

Другие направления