Property Valuation
AVM (Automated Valuation Model) с causal-features (DoWhy для эффектов location, infrastructure, sentiment в близлежащих объявлениях) + **OOD-detection** для нетипичных объектов («низкая уверенность — нужен оценщик»). SHAP-explanation для каждой оценки. На residential SPb-Москва MAPE 8.4%.
Банкам, REIT и оценочным компаниям нужна массовая оценка недвижимости — ипотечный pipeline, портфолио-аудит, due diligence. Profession-оценщик стоит дорого и медленно. Стандартные AVM (на основе Авито/ЦИАН) дают цифру без обоснования. Property Valuation даёт цифру + честный confidence + объяснение «почему» + OOD-flag когда модель сомневается.
OOD-detection — система знает свои границы
Стандартный AVM на нетипичный объект (эксклюзивный пентхаус, историческое здание, нестандартная планировка) выдаст plausible-looking число — и оно будет неправильным. Property Valuation видит, что объект — outlier в feature-space, и flag'ит «низкая уверенность, нужен оценщик». Это спасает от crucial errors в ипотечных flows.
Пошаговая архитектура
Параметры объекта
Адрес (геокодинг через Yandex/Mapbox), площадь, этажность, состояние, год постройки, тип дома. Опционально — фото для проверки заявленных характеристик.
Geo + infrastructure features
Расстояние до метро/центра/школ/больниц/парков. Quality of nearby infrastructure через OSM-данные. Air-quality для exclusive segments.
Comparable retrieval
kNN-search по embeddings: ближайшие 20 объектов с похожими характеристиками + close geo. Шероховатость comparable-метрики штрафуется.
AVM prediction
CatBoost или XGBoost на features (object + geo + comparables-stats). Output — point estimate + 80% / 95% CI через quantile regression.
Causal-correction
DoWhy estimates causal effect отдельных features (например, location vs объект). Корректирует pure-correlation overfit.
OOD-detection
Isolation Forest на features pre-prediction. Если объект «outlier» в feature-space — flag «низкая уверенность, нужен оценщик». Защищает от оценки эксклюзивных объектов pure-AVM'ом.
SHAP explanation
Per-feature contribution к финальной цене. Top-5: «локация (метро 5 мин): +12%», «этаж средний: +3%», «состояние без ремонта: −18%».
Стек, который не запирает
CatBoost / XGBoost для core AVM (regression)
SHAP для feature importance + per-prediction explanations
kNN на text+image embeddings для comparables (через ChromaDB)
DoWhy для causal-effects estimation
Isolation Forest для OOD-detection
Source data: Росреестр (исторические сделки), Авито/ЦИАН scrapers (текущие предложения), OSM (geo-features), Yandex Maps API (геокодинг)
Идеально для
- Банки — ипотечная оценка (mass-market)
- Оценочные компании — pre-screening, ранжирование сложности
- REIT-фонды — portfolio valuation на ежеквартальной основе
- Агентства недвижимости — fair price для листингов
Границы кейса
- Не заменяет professional appraiser для high-stakes сделок (загородная недвижимость, эксклюзив, коммерция)
- Не работает с земельными участками без построек (отдельный модель)
- Не делает legal due diligence — это работа юриста
- Не предсказывает рыночный crash — это моделирование behavior рынка целиком, не объекта
Частые вопросы
Росреестр — основная база. Авито/ЦИАН — для current-listings (price discovery). Без access к Росреестру модель работает только на listings, точность падает на 3-5 п.п.
Что ещё может пригодиться
Покажем на ваших данных
за 1-2 недели
Подключаемся к ограниченной выборке, разворачиваем PoC на ваших реальных кейсах. Оценка качества, точности и UX — на вашей специфике, не на наших красивых демо.