Агентные платформы и приватный ChatGPT on-premise
Open WebUI, Dify, n8n, Hermes Agent, Open Claw, vLLM, Unsloth — разворачиваем готовые open-source платформы на вашем Proxmox под ключ. Приватный ChatGPT, AI-workflows, self-improving агенты, fine-tuning ваших моделей. 2-4 недели до пилота.

Что мы делаем
Полный спектр услуг для решения ваших задач

Open WebUI + Ollama
Приватный ChatGPT для команды. GigaChat / YandexGPT локально, RAG по корпоративной базе, multi-user, RBAC, аудит-лог. Заменяет паблик-ChatGPT там, где данные нельзя в облако.

Dify — no-code LLM приложения
Визуальный builder LLM-приложений: workflow-редактор, RAG из коробки, multi-modal, eval-suite. Контент-команда строит ассистентов сама, без разработчиков.

n8n + AI nodes
Open-source Zapier с LLM-нодами. Автоматизация: классификация писем, генерация отчётов из CRM, обработка тикетов, AI-обогащение лидов. 400+ интеграций.

Hermes Agent — self-improving
AI-агент от Nous Research со встроенным learning loop: автономно создаёт и улучшает навыки, держит persistent memory, спавнит сабагентов. Деплой везде — TUI, MAX, Discord, Slack, WhatsApp. Atropos RL environments + trajectory generation для дообучения собственных моделей.

Open Claw — личный AI через мессенджеры
Local-first персональный AI-ассистент. 20+ мессенджеров (WhatsApp / MAX / Slack / Discord / Signal / iMessage), Live Canvas с визуальным workspace, voice wake words, isolated workspaces. Работает на macOS / iOS / Android, Node.js — никакой привязки к облаку.

Fine-tuning: Unsloth + LLaMA-Factory
Pipeline дообучения моделей на ваших данных: Hermes Agent генерит trajectory-датасеты с реальных задач → Unsloth ускоряет LoRA/QLoRA в 2-5× → LLaMA-Factory даёт Gradio WebUI для не-разработчиков (загрузил датасет → конфиг → train → eval). Базовые модели: GigaChat, YandexGPT, Hermes 3. Без выгрузки данных.
Как мы работаем
Прозрачный процесс от первого звонка до запуска
Discovery & выбор стека
Понимаем сценарий (приватный ChatGPT / workflow-автоматизация / мульти-агенты), оцениваем железо, выбираем 1-3 платформы из стека.
1 неделяРазвёртывание инфраструктуры
Поднимаем GPU-сервер (если нужен), Proxmox VE, Docker, Caddy, Postgres+pgvector, Qdrant. Сетевая изоляция, SSO, бэкапы.
1-2 неделиPilot use-case
Выбранную платформу настраиваем под 1-2 пилотных кейса. Загружаем корпоративную базу знаний, настраиваем роли, тестируем с командой.
1-2 неделиHand-off с обучением
Документация, обучение администратора, регламент обновлений. Каждая платформа — open-source, никакого vendor lock-in.
1 неделяПоддержка и развитие
SLA 24/7 при необходимости. Расширение базы знаний, новые workflow, мониторинг качества и стоимости.
ПостоянноDiscovery & выбор стека
Понимаем сценарий (приватный ChatGPT / workflow-автоматизация / мульти-агенты), оцениваем железо, выбираем 1-3 платформы из стека.
1 неделяРазвёртывание инфраструктуры
Поднимаем GPU-сервер (если нужен), Proxmox VE, Docker, Caddy, Postgres+pgvector, Qdrant. Сетевая изоляция, SSO, бэкапы.
1-2 неделиPilot use-case
Выбранную платформу настраиваем под 1-2 пилотных кейса. Загружаем корпоративную базу знаний, настраиваем роли, тестируем с командой.
1-2 неделиHand-off с обучением
Документация, обучение администратора, регламент обновлений. Каждая платформа — open-source, никакого vendor lock-in.
1 неделяПоддержка и развитие
SLA 24/7 при необходимости. Расширение базы знаний, новые workflow, мониторинг качества и стоимости.
ПостоянноКейсы
Реальные проекты и результаты наших клиентов

Внутренний ChatGPT для юристов
Юристы 60+ человек используют публичный ChatGPT с корпоративными договорами. Юридические риски, утечка данных клиентов.
Open WebUI + Ollama (GigaChat) на 2×A100. RAG по корпоративной базе договоров и нормативки. SSO через Active Directory, аудит-лог запросов.
100% запросов остаются на корпоративном сервере. 80% юристов используют ежедневно. Окупаемость 6 месяцев vs ChatGPT Enterprise.

n8n-конвейер обработки тикетов поддержки
Поддержка обрабатывает 500+ тикетов/день вручную: классификация, маршрутизация, заглушки-ответы.
n8n с AI-нодами GigaChat: классификация (urgent/normal/spam), извлечение сущностей, авто-ответ для типовых, маршрутизация на инженера. Интеграция с Jira и Slack.
60% тикетов закрываются автоматически или полу-автоматически. Время до первого ответа упало с 4 часов до 8 минут.

Dify-RAG по технической документации
Инженеры терялись в 50 000+ страниц регламентов, чертежей, инструкций. Ответ на типовой вопрос занимал час поиска.
Dify с workflow: parse PDF/CAD → embeddings в pgvector → hybrid retrieval → GigaChat с цитатами-источниками. Развёрнут в DMZ заказчика.
Ответ за 15 секунд с прямыми ссылками на параграф документа. Используется 200+ инженерами, 1500+ запросов/день.
Технологический стек
Инструменты и технологии, которые мы используем
LLM Frontends
Workflow / Automation
Agent frameworks
Fine-tuning
Inference / Serving
Models
Vector DB / RAG
Инфраструктура
Хотите свой ChatGPT без облака?
Проведём бесплатный воркшоп: подберём open-source стек под ваш сценарий, оценим железо, согласуем pilot за 2-4 недели.
Другие направления