# Оптимизация генерации визарда ## Проблема AI Agent генерирует визард за ~40 секунд, что слишком долго для UX. ## Варианты оптимизации ### 1. Сократить промпт (приоритет: ВЫСОКИЙ) Текущий промпт ~2000+ символов. Можно сократить до ~800-1000, убрав: - Повторения инструкций - Детальные объяснения форматов (оставить только примеры) - Лишние поля в ответе (если не используются) **Ожидаемый эффект:** -15-20 секунд ### 2. Использовать более быструю модель - `gpt-4o-mini` вместо `gpt-4.1-mini` (быстрее в 2-3 раза) - Или `gpt-3.5-turbo` для простых случаев **Ожидаемый эффект:** -20-25 секунд ### 3. Streaming ответа Начать обрабатывать JSON по частям, как только начинают приходить данные. **Ожидаемый эффект:** UX улучшится (показываем прогресс), но общее время не изменится ### 4. Кэширование для похожих запросов Кэшировать результаты для похожих описаний (по хэшу первых 200 символов). **Ожидаемый эффект:** -35-40 секунд для повторных запросов ### 5. Упростить схему ответа Убрать неиспользуемые поля: - `coverage_report.questions` (если не используется) - `risks`, `deadlines` (если не критично) - Детальные `rationale` для каждого вопроса **Ожидаемый эффект:** -5-10 секунд ### 6. Разбить на этапы 1. Быстро генерировать базовый план (5-7 вопросов, список документов) - 10-15 сек 2. Параллельно/асинхронно дорабатывать prefill и coverage_report **Ожидаемый эффект:** UX улучшится (показываем план быстрее) ## Рекомендуемый подход **Комбинация 1 + 2 + 5:** - Сократить промпт до минимума - Переключиться на `gpt-4o-mini` - Убрать неиспользуемые поля **Ожидаемый результат:** 40 сек → 10-15 сек