- Добавлены логи в frontend (ClaimForm.tsx) для отслеживания unified_id и запросов к API - Добавлены логи в backend (claims.py) для отладки SQL запросов - Создан лог сессии с описанием проблемы и текущего состояния - Проблема: API возвращает 0 черновиков, хотя в БД есть данные
2.6 KiB
2.6 KiB
Оптимизация генерации визарда
Проблема
AI Agent генерирует визард за ~40 секунд, что слишком долго для UX.
Варианты оптимизации
1. Сократить промпт (приоритет: ВЫСОКИЙ)
Текущий промпт ~2000+ символов. Можно сократить до ~800-1000, убрав:
- Повторения инструкций
- Детальные объяснения форматов (оставить только примеры)
- Лишние поля в ответе (если не используются)
Ожидаемый эффект: -15-20 секунд
2. Использовать более быструю модель
gpt-4o-miniвместоgpt-4.1-mini(быстрее в 2-3 раза)- Или
gpt-3.5-turboдля простых случаев
Ожидаемый эффект: -20-25 секунд
3. Streaming ответа
Начать обрабатывать JSON по частям, как только начинают приходить данные.
Ожидаемый эффект: UX улучшится (показываем прогресс), но общее время не изменится
4. Кэширование для похожих запросов
Кэшировать результаты для похожих описаний (по хэшу первых 200 символов).
Ожидаемый эффект: -35-40 секунд для повторных запросов
5. Упростить схему ответа
Убрать неиспользуемые поля:
coverage_report.questions(если не используется)risks,deadlines(если не критично)- Детальные
rationaleдля каждого вопроса
Ожидаемый эффект: -5-10 секунд
6. Разбить на этапы
- Быстро генерировать базовый план (5-7 вопросов, список документов) - 10-15 сек
- Параллельно/асинхронно дорабатывать prefill и coverage_report
Ожидаемый эффект: UX улучшится (показываем план быстрее)
Рекомендуемый подход
Комбинация 1 + 2 + 5:
- Сократить промпт до минимума
- Переключиться на
gpt-4o-mini - Убрать неиспользуемые поля
Ожидаемый результат: 40 сек → 10-15 сек