Data Explorer
Без SQL, без BI-аналитика. Натуральный вопрос «топ-10 клиентов по выручке за квартал» → таблица + график за 8 секунд. Безопасно (read-only), explainable (видно сгенерированный SQL).
Менеджеру хочется «посмотреть продажи по регионам». BI-аналитик занят, очередь — 1–3 дня. Существующий дашборд не отвечает на конкретный вопрос. SQL писать сам не умеет. Excel-выгрузки устаревают. Data Explorer — natural-language интерфейс к корпоративным БД. Спросил — получил таблицу + график.
Три слоя безопасности
1) Read-only DB-role — модель физически не может ничего изменить. 2) sqlglot validation — SELECT-only check. 3) Per-user whitelist — junior-менеджер не увидит salary-таблицу. 4) Resource limits — timeout 30 сек, max-rows 100K.
Пошаговая архитектура
Schema introspection
Модель видит таблицы / колонки / связи / описания. Plus semantic-layer с metrics и dimensions.
NL → SQL
GigaChat с few-shot из вашей истории успешных запросов.
Validation
sqlglot parses, проверяет SELECT-only + whitelist таблиц/колонок.
Execute
Read-only DB-role с resource-limits (timeout, max-rows).
Visualization
Auto-select chart type (bar / line / pie / heatmap) на основе data shape.
Insight
Короткий LLM-комментарий «что интересного видно».
Стек, который не запирает
GigaChat — лучший NL→SQL генератор
sqlglot для AST-парсинга и валидации
Vega-Lite для interactive charts
YAML semantic layer — определения metrics + dimensions
Redis caching — повторяющиеся запросы за миллисекунды
Active learning loop: каждый 👍 добавляет пример в few-shot pool
Идеально для
- Sales / Marketing — продажи, конверсии, retention
- Финансы — операционная отчётность
- Operations — производственные метрики, supply chain
- HR — headcount, turnover, salary equity
- Customer Success — usage analytics
Границы кейса
- Не пишет в БД (только read-only)
- Не работает на неструктурированных данных (это Knowledge Copilot)
- Не заменяет BI-команду в build dimensional models — работает поверх готовой схемы
- Не делает predictive analytics (это другие кейсы)
Частые вопросы
sqlglot оценивает план. Если EXPLAIN показывает full-scan на огромной таблице → предупреждение.
Что ещё может пригодиться
Покажем на ваших данных
за 1-2 недели
Подключаемся к ограниченной выборке, разворачиваем PoC на ваших реальных кейсах. Оценка качества, точности и UX — на вашей специфике, не на наших красивых демо.