Support Triage
AI-копилот L1/L2-агента в helpdesk-системе. Каждый новый тикет за 2 секунды получает категорию, severity, ответственную команду, draft ответа из вашей KB и три похожих закрытых случая с финальным решением. Агент перестаёт быть «коммутатором» — открывает тикет и сразу видит готовый рабочий контекст.
L1-поддержка тратит первые 5-10 минут на каждый тикет: понять команду, определить приоритет, искать похожие тикеты в Jira, открывать KB-статьи. До реальной работы доходит на 2-м контакте. Этот flow заточен под helpdesk-системы с тикет-моделью (статус, assignee, priority, SLA) — не для разбора общего info@ ящика (для этого — Inbox Warden).
Модель учится на ваших данных
Стартуем на универсальной multilingual-модели — F1 0.78 из коробки. После 2 недель на ваших тикетах с разметкой запускаем fine-tune — выходит F1 0.91+. Через 2 месяца стабильно 0.93–0.95.
Пошаговая архитектура
Webhook от helpdesk
Jira Service Management / Zendesk / Freshdesk / Helpdeskeddy / OTRS — каждая система имеет webhook на создание тикета, который триггерит pipeline.
PII-маскинг
Перед обработкой моделью затирается чувствительная информация (карты, паспорта, телефоны).
Классификация
Fine-tuned multilingual классификатор присваивает категорию × подкатегорию × команду × severity с confidence-score'ом.
Поиск похожих
Vector-search по архиву закрытых тикетов даёт 3 наиболее релевантных — с временем до закрытия и итоговым решением.
Черновик ответа
RAG-агент собирает ответ из KB-статей и похожих тикетов с обязательными цитатами.
Эскалация
Critical — мгновенный MAX + SMS дежурному. High — попадание в приоритетную очередь.
Стек, который не запирает
Classifier: fine-tuned multilingual-e5-large (560M params), 2 часа обучения на A100
Similar tickets: Chroma vector DB по архиву closed-tickets с embeddings BGE-M3
Draft generation: YandexGPT или GigaChat — выбор в админке
Orchestration: n8n — гибкие правила роутинга и нотификаций
Active learning: каждое исправление агента → точка в датасете для следующей итерации
Online learning: модель достраивается на новых данных раз в месяц
Идеально для
- B2C-saas с тикетной службой (1000+ /день, Zendesk / Freshdesk)
- Корп-IT с внутренним service-desk в Jira SD
- Маркетплейсы с большим pipeline'ом тикетов от партнёров
- Финтех / банки — где severity-роутинг и SLA-tracking особенно важны
Границы кейса
- Не работает с общим info@ / office@ ящиком — для этого Inbox Warden (без тикет-модели, с FAQ-автоответом)
- Не отправляет ответ клиенту самостоятельно — только готовит черновик
- Не закрывает тикеты сам — это всегда решение агента
- Не работает с голосовыми обращениями — для них Speech Actions
- Не делает full-customer-360 — это контур CRM
Частые вопросы
Маскинг номеров карт, паспортов, телефонов через regex + spaCy NER. Маскированная версия в логах, оригинал — только в isolated storage с access-log.
Что ещё может пригодиться
Покажем на ваших данных
за 1-2 недели
Подключаемся к ограниченной выборке, разворачиваем PoC на ваших реальных кейсах. Оценка качества, точности и UX — на вашей специфике, не на наших красивых демо.