IHItems/Image to Text OCR — веб-инструмент для извлечения текста из изображений
AI-инструментыOpen Sourcevault_md · ai-tools

Image to Text OCR — веб-инструмент для извлечения текста из изображений

251stars
30forks
Vue
AGPL-3.0
Последний коммит: 2025-04-16

Вердикт

Полезная, но не приоритетная находка. Основная ценность — потенциальное закрытие известного пробела в GDrive-RAG (сканированные PDF без текстового слоя), однако серверный Tesseract или встроенный OCR в marker-pdf скорее всего будут эффективнее для автоматизированного пайплайна. Рекомендуется добавить в backlog GDrive-RAG как альтернативу и использовать для ручных ad-hoc задач команды.

Описание

id: 48db3de7-3604-4703-b708-89be25827505 type: github category: ai_tools relevance: 5.3 captured: 2026-03-15T19:30:06.521129+00:00

Сценарии использования

Оцифровка сканированных PDF и фотографий документов для Plaud-пайплайна и архивов Creata
Извлечение текста из скриншотов для наполнения Content Factory и контент-пайплайнов

Анализ по линзам

Стратегия
5.0
Практичность
6.5
Конкуренция
3.0
Риски
2.5

Утилитарный инструмент без прямой привязки к OKR 2026, но закрывает известный пробел в пайплайне GDrive-RAG, где сканированные PDF пропускаются из-за отсутствия текстового слоя.

Можно развернуть как веб-сервис на Mac Mini или UNO для ad-hoc OCR задач; однако для системной интеграции в RAG-пайплайн лучше подойдёт серверный Tesseract или встроенный OCR в marker-pdf, который уже используется.

Не даёт конкурентного преимущества — это commodity-инструмент, аналоги широко доступны (Tesseract, Google Vision, Apple Live Text); ценность только в удобстве браузерного доступа.

Минимальные риски: AGPL-3.0 требует открытия кода при модификации и распространении, что неприемлемо для встраивания в коммерческие продукты (iKarma, Otrar); как standalone-сервис — без проблем.

Актуально в этом квартале в контексте доработки GDrive-RAG индексера, но не является приоритетом — сначала нужно завершить базовую индексацию 535+ файлов CIAQ.

Маппинг по проектам

MEDIUM
GDrive-RAG
Оценить как fallback OCR для сканированных PDF без текстового слоя в пайплайне gdrive_indexer.py; сравнить с Tesseract CLI
LOW
Exocortex
Добавить в knowledge-базу как reference-инструмент для OCR-задач команды

Действия

Сравнить производительность Nuxt OCR vs Tesseract CLI vs marker-pdf OCR на 10 сканированных PDF из GDrive — выбрать оптимальное решение для gdrive_indexer.py
Добавить ссылку в _Meta/exocortex/knowledge/ как утилиту для ручного OCR при работе с изображениями документов

Рекомендации к изучению

🔬Сравнить с marker-pdf и встроенным OCR в Claude для определения лучшего решения для сканированных PDF в GDrive-RAG пайплайне

Упомянутые инструменты

Nuxt.jspnpmNetlifyUnoCSSTesseract.js

Теги

#ai-tools

Похожие находки

Статус
analyzed
Добавлено
15.03.2026
Проанализировано
16.03.2026
ID
48db3de7