Files
hotels/REPORT_README.md
Фёдор 684fada337 🚀 Full project sync: Hotels RAG & Audit System
 Major Features:
- Complete RAG system for hotel website analysis
- Hybrid audit with BGE-M3 embeddings + Natasha NER
- Universal horizontal Excel reports with dashboards
- Multi-region processing (SPb, Orel, Chukotka, Kamchatka)

📊 Completed Regions:
- Орловская область: 100% (36/36)
- Чукотский АО: 100% (4/4)
- г. Санкт-Петербург: 93% (893/960)
- Камчатский край: 87% (89/102)

🔧 Infrastructure:
- PostgreSQL with pgvector extension
- BGE-M3 embeddings API
- Browserless for web scraping
- N8N workflows for automation
- S3/Nextcloud file storage

📝 Documentation:
- Complete DB schemas
- API documentation
- Setup guides
- Status reports
2025-10-27 22:49:42 +03:00

2.9 KiB
Raw Permalink Blame History

📊 Генератор горизонтальных отчётов для аудита отелей

Основной скрипт

create_horizontal_report.py - универсальный генератор отчётов для любого региона

Как использовать

  1. Откройте файл create_horizontal_report.py
  2. Найдите блок настроек в начале файла:
# ========== НАСТРОЙКИ РЕГИОНА ==========
REGION = 'г. Санкт-Петербург'  # Измените на нужный регион
AUDIT_VERSION = 'v1.0_with_rkn'  # Версия аудита
# =======================================
  1. Измените REGION на нужный регион (например: 'Орловская область', 'Чукотский АО')
  2. При необходимости измените AUDIT_VERSION
  3. Запустите: python3 create_horizontal_report.py

Результат

Скрипт создаст файл experimental_report_YYYYMMDD_HHMMSS.xlsx с двумя листами:

Лист 1: "📊 Дашборд"

  • Общая статистика по региону
  • Статистика по 18 критериям
  • Распределение по баллам
  • Графики (круговые и столбчатые)

Лист 2: "🏨 Аудит отелей" (горизонтальный формат)

  • Базовые колонки: Отель, Запись в реестре (РКН), Владелец, ОГРН, ИНН и т.д.
  • 18 критериев × 3 колонки каждый:
    1. Статус (Да/Нет) с цветовой индикацией
    2. URL (ссылка на страницу)
    3. Комментарий (детали находки)

Примеры использования

Для Санкт-Петербурга (по умолчанию):

REGION = 'г. Санкт-Петербург'
AUDIT_VERSION = 'v1.0_with_rkn'

Для Орловской области:

REGION = 'Орловская область'
AUDIT_VERSION = 'v1.0_with_rkn'

Для Чукотского АО:

REGION = 'Чукотский АО'
AUDIT_VERSION = 'v1.0_with_rkn'

Технические детали

  • Размер файла: ~1-2 MB в зависимости от количества отелей
  • Цветовая индикация: зелёный (найдено), красный (не найдено)
  • Автоматическая очистка недопустимых символов для Excel
  • Автофильтры и замороженные заголовки
  • Поддержка данных РКН реестра

Другие скрипты

  • check_report_status.py - проверка статуса отчётов
  • export_website_status_report.py - экспорт статуса сайтов