✨ Major Features: - Complete RAG system for hotel website analysis - Hybrid audit with BGE-M3 embeddings + Natasha NER - Universal horizontal Excel reports with dashboards - Multi-region processing (SPb, Orel, Chukotka, Kamchatka) 📊 Completed Regions: - Орловская область: 100% (36/36) - Чукотский АО: 100% (4/4) - г. Санкт-Петербург: 93% (893/960) - Камчатский край: 87% (89/102) 🔧 Infrastructure: - PostgreSQL with pgvector extension - BGE-M3 embeddings API - Browserless for web scraping - N8N workflows for automation - S3/Nextcloud file storage 📝 Documentation: - Complete DB schemas - API documentation - Setup guides - Status reports
2.9 KiB
2.9 KiB
📊 Генератор горизонтальных отчётов для аудита отелей
Основной скрипт
create_horizontal_report.py - универсальный генератор отчётов для любого региона
Как использовать
- Откройте файл
create_horizontal_report.py - Найдите блок настроек в начале файла:
# ========== НАСТРОЙКИ РЕГИОНА ==========
REGION = 'г. Санкт-Петербург' # Измените на нужный регион
AUDIT_VERSION = 'v1.0_with_rkn' # Версия аудита
# =======================================
- Измените
REGIONна нужный регион (например:'Орловская область','Чукотский АО') - При необходимости измените
AUDIT_VERSION - Запустите:
python3 create_horizontal_report.py
Результат
Скрипт создаст файл experimental_report_YYYYMMDD_HHMMSS.xlsx с двумя листами:
Лист 1: "📊 Дашборд"
- Общая статистика по региону
- Статистика по 18 критериям
- Распределение по баллам
- Графики (круговые и столбчатые)
Лист 2: "🏨 Аудит отелей" (горизонтальный формат)
- Базовые колонки: Отель, Запись в реестре (РКН), Владелец, ОГРН, ИНН и т.д.
- 18 критериев × 3 колонки каждый:
- Статус (Да/Нет) с цветовой индикацией
- URL (ссылка на страницу)
- Комментарий (детали находки)
Примеры использования
Для Санкт-Петербурга (по умолчанию):
REGION = 'г. Санкт-Петербург'
AUDIT_VERSION = 'v1.0_with_rkn'
Для Орловской области:
REGION = 'Орловская область'
AUDIT_VERSION = 'v1.0_with_rkn'
Для Чукотского АО:
REGION = 'Чукотский АО'
AUDIT_VERSION = 'v1.0_with_rkn'
Технические детали
- Размер файла: ~1-2 MB в зависимости от количества отелей
- Цветовая индикация: зелёный (найдено), красный (не найдено)
- Автоматическая очистка недопустимых символов для Excel
- Автофильтры и замороженные заголовки
- Поддержка данных РКН реестра
Другие скрипты
check_report_status.py- проверка статуса отчётовexport_website_status_report.py- экспорт статуса сайтов