# 🔍 КАК РАБОТАЕТ WORKFLOW OCR

## ⚠️ **ВАЖНО: Нет ручного запуска!**

**Workflow OCR** работает **ТОЛЬКО через правила автоматизации**!

В нём **НЕТ** кнопки "Submit to OCR" в меню файла.

---

## 🔄 **КАК ЭТО РАБОТАЕТ:**

### **Принцип работы:**
```
1. Создаёшь правило workflow
2. Загружаешь файл в Nextcloud
3. Workflow Engine видит событие
4. Запускает OCR автоматически
5. Результат сохраняется
```

**Это АВТОМАТИЗАЦИЯ, а не ручной инструмент!**

---

## 📝 **КАК СОЗДАТЬ ПРАВИЛО:**

### **Вариант 1: Через интерфейс Nextcloud**

**Шаг 1: Открой настройки Flow**
```
https://office.clientright.ru:8443/settings/admin/workflow
```

**Шаг 2: Добавь правило**
1. Нажми **"Add new workflow"**
2. Выбери условия:
   - **When:** File created
   - **And:** File MIME type is `application/pdf`
   - **And:** Path matches `Documents/Project/*`
3. Выбери действие:
   - **Then:** `OCR processing`
4. Нажми **Save**

---

### **Вариант 2: Через команду (автоматически)**

Я могу создать правило автоматически через БД!

Команда создаст правило:
```
Имя: "CRM - Автоматический OCR судебных документов"

Условия:
- Файл создан
- Тип: PDF
- Имя содержит: решение, определение, постановление, договор, иск

Действие:
- OCR с русским + английским
- Создать searchable PDF
```

---

## 🧪 **КАК ПРОТЕСТИРОВАТЬ:**

### **После создания правила:**

1. **Загрузи тестовый PDF** в папку проекта
2. **Дождись 30-60 секунд** (OCR работает в фоне)
3. **Проверь через поиск:**
   ```
   Files → Search (🔍)
   Введи слово из документа
   ```
4. Если находит → **OCR работает!** ✅

---

## 📊 **КАК ПРОВЕРИТЬ ЧТО OCR ВЫПОЛНЕН:**

### **Способ 1: Через теги**
После OCR файл получит тег в Nextcloud (если настроено)

### **Способ 2: Через логи**
```bash
docker exec nextcloud-fresh tail -100 /var/www/html/data/nextcloud.log | grep -i ocr
```

### **Способ 3: Через поиск**
Если файл находится по тексту из него → OCR выполнен!

---

## ⚡ **АЛЬТЕРНАТИВА: Ручной OCR**

### **Если нужен РУЧНОЙ OCR (не автоматический):**

Есть другое приложение: **OCR** (не workflow_ocr!)

**Установка:**
```bash
docker exec -u www-data nextcloud-fresh php occ app:install ocr
```

**В нём есть:**
- Кнопка "OCR" в меню файла
- Ручной запуск для выбранных файлов
- Выбор языка

**НО:** Это старое приложение, может не работать на Nextcloud 31

---

## 🎯 **ЧТО ДЕЛАТЬ СЕЙЧАС:**

### **Вариант А: Я создам правило автоматически**

Создам через команду, займёт 10 секунд:
```sql
INSERT INTO oc_flow_operations ...
```

**Результат:** Все новые PDF в проектах автоматически пройдут OCR

---

### **Вариант Б: Ты создашь сам через интерфейс**

Я покажу пошагово со скриншотами:
```
Settings → Flow → Add rule → ...
```

**Результат:** Ты понимаешь как создавать правила

---

### **Вариант В: Установить приложение для ручного OCR**

```bash
docker exec -u www-data nextcloud-fresh php occ app:install ocr
```

**Результат:** Появится кнопка OCR в меню файла

**⚠️ Внимание:** Может не работать на Nextcloud 31!

---

## 💡 **МОЯ РЕКОМЕНДАЦИЯ:**

**Используй АВТОМАТИЧЕСКИЙ OCR** (Workflow):
- ✅ Настроил один раз → работает всегда
- ✅ Не нужно помнить запускать OCR
- ✅ Все документы обрабатываются одинаково
- ✅ Современный подход

**Ручной OCR** нужен редко (только для старых файлов)

---

## 🚀 **ДАВАЙ СОЗДАМ ПРАВИЛО?**

**Что создать:**

**Правило 1: Судебные документы**
```
PDF с словами: решение, определение, постановление, иск
→ OCR (русский + английский)
```

**Правило 2: Договоры**
```
PDF в папке Contracts
→ OCR (русский + английский)
```

**Правило 3: Все PDF в проектах < 10MB**
```
PDF в Documents/Project/*, размер < 10MB
→ OCR (русский + английский)
```

---

**Какое правило создать?** Или все три сразу? 😊