5.0/10

Image to Text OCR — веб-инструмент для извлечения текста из изображений

smart_toyAI ToolsOpen Source

ai-tools

★251stars

⑂30forks

Vue

AGPL-3.0

Последний коммит: 2025-04-16

Вердикт

Полезная, но не приоритетная находка. Основная ценность — потенциальное закрытие известного пробела в GDrive-RAG (сканированные PDF без текстового слоя), однако серверный Tesseract или встроенный OCR в marker-pdf скорее всего будут эффективнее для автоматизированного пайплайна. Рекомендуется добавить в backlog GDrive-RAG как альтернативу и использовать для ручных ad-hoc задач команды.

Описание

id: 48db3de7-3604-4703-b708-89be25827505 type: github category: ai_tools relevance: 5.3 captured: 2026-03-15T19:30:06.521129+00:00

Сценарии использования

→Оцифровка сканированных PDF и фотографий документов для Plaud-пайплайна и архивов Creata

→Извлечение текста из скриншотов для наполнения Content Factory и контент-пайплайнов

Анализ по линзам

Стратегия

5.0

Практичность

6.5

Конкуренция

3.0

Риски

2.5

Утилитарный инструмент без прямой привязки к OKR 2026, но закрывает известный пробел в пайплайне GDrive-RAG, где сканированные PDF пропускаются из-за отсутствия текстового слоя.

Можно развернуть как веб-сервис на Mac Mini или UNO для ad-hoc OCR задач; однако для системной интеграции в RAG-пайплайн лучше подойдёт серверный Tesseract или встроенный OCR в marker-pdf, который уже используется.

Не даёт конкурентного преимущества — это commodity-инструмент, аналоги широко доступны (Tesseract, Google Vision, Apple Live Text); ценность только в удобстве браузерного доступа.

Минимальные риски: AGPL-3.0 требует открытия кода при модификации и распространении, что неприемлемо для встраивания в коммерческие продукты (iKarma, Otrar); как standalone-сервис — без проблем.

Актуально в этом квартале в контексте доработки GDrive-RAG индексера, но не является приоритетом — сначала нужно завершить базовую индексацию 535+ файлов CIAQ.

Проектный маппинг

MEDIUM

GDrive-RAG

Оценить как fallback OCR для сканированных PDF без текстового слоя в пайплайне gdrive_indexer.py; сравнить с Tesseract CLI

LOW

Exocortex

Добавить в knowledge-базу как reference-инструмент для OCR-задач команды

Действия

Сравнить производительность Nuxt OCR vs Tesseract CLI vs marker-pdf OCR на 10 сканированных PDF из GDrive — выбрать оптимальное решение для gdrive_indexer.py

Добавить ссылку в _Meta/exocortex/knowledge/ как утилиту для ручного OCR при работе с изображениями документов

Инструменты

Nuxt.jspnpmNetlifyUnoCSSTesseract.js