Files
aiform_dev/docs/WIZARD_OPTIMIZATION.md
AI Assistant 4c8fda5f55 Добавлено логирование для отладки черновиков
- Добавлены логи в frontend (ClaimForm.tsx) для отслеживания unified_id и запросов к API
- Добавлены логи в backend (claims.py) для отладки SQL запросов
- Создан лог сессии с описанием проблемы и текущего состояния
- Проблема: API возвращает 0 черновиков, хотя в БД есть данные
2025-11-19 18:46:48 +03:00

2.6 KiB

Оптимизация генерации визарда

Проблема

AI Agent генерирует визард за ~40 секунд, что слишком долго для UX.

Варианты оптимизации

1. Сократить промпт (приоритет: ВЫСОКИЙ)

Текущий промпт ~2000+ символов. Можно сократить до ~800-1000, убрав:

  • Повторения инструкций
  • Детальные объяснения форматов (оставить только примеры)
  • Лишние поля в ответе (если не используются)

Ожидаемый эффект: -15-20 секунд

2. Использовать более быструю модель

  • gpt-4o-mini вместо gpt-4.1-mini (быстрее в 2-3 раза)
  • Или gpt-3.5-turbo для простых случаев

Ожидаемый эффект: -20-25 секунд

3. Streaming ответа

Начать обрабатывать JSON по частям, как только начинают приходить данные.

Ожидаемый эффект: UX улучшится (показываем прогресс), но общее время не изменится

4. Кэширование для похожих запросов

Кэшировать результаты для похожих описаний (по хэшу первых 200 символов).

Ожидаемый эффект: -35-40 секунд для повторных запросов

5. Упростить схему ответа

Убрать неиспользуемые поля:

  • coverage_report.questions (если не используется)
  • risks, deadlines (если не критично)
  • Детальные rationale для каждого вопроса

Ожидаемый эффект: -5-10 секунд

6. Разбить на этапы

  1. Быстро генерировать базовый план (5-7 вопросов, список документов) - 10-15 сек
  2. Параллельно/асинхронно дорабатывать prefill и coverage_report

Ожидаемый эффект: UX улучшится (показываем план быстрее)

Рекомендуемый подход

Комбинация 1 + 2 + 5:

  • Сократить промпт до минимума
  • Переключиться на gpt-4o-mini
  • Убрать неиспользуемые поля

Ожидаемый результат: 40 сек → 10-15 сек