Image to Text OCR — веб-инструмент для извлечения текста из изображений
Вердикт
Полезная, но не приоритетная находка. Основная ценность — потенциальное закрытие известного пробела в GDrive-RAG (сканированные PDF без текстового слоя), однако серверный Tesseract или встроенный OCR в marker-pdf скорее всего будут эффективнее для автоматизированного пайплайна. Рекомендуется добавить в backlog GDrive-RAG как альтернативу и использовать для ручных ad-hoc задач команды.
Описание
id: 48db3de7-3604-4703-b708-89be25827505 type: github category: ai_tools relevance: 5.3 captured: 2026-03-15T19:30:06.521129+00:00
Сценарии использования
Анализ по линзам
Утилитарный инструмент без прямой привязки к OKR 2026, но закрывает известный пробел в пайплайне GDrive-RAG, где сканированные PDF пропускаются из-за отсутствия текстового слоя.
Можно развернуть как веб-сервис на Mac Mini или UNO для ad-hoc OCR задач; однако для системной интеграции в RAG-пайплайн лучше подойдёт серверный Tesseract или встроенный OCR в marker-pdf, который уже используется.
Не даёт конкурентного преимущества — это commodity-инструмент, аналоги широко доступны (Tesseract, Google Vision, Apple Live Text); ценность только в удобстве браузерного доступа.
Минимальные риски: AGPL-3.0 требует открытия кода при модификации и распространении, что неприемлемо для встраивания в коммерческие продукты (iKarma, Otrar); как standalone-сервис — без проблем.
Актуально в этом квартале в контексте доработки GDrive-RAG индексера, но не является приоритетом — сначала нужно завершить базовую индексацию 535+ файлов CIAQ.