IHItems/PageIndex — RAG без векторных баз, на основе рассуждений
21.6kstars
1.7kforks
Python
MIT
Последний коммит: 2026-03-04

Вердикт

PageIndex — интересный R&D-сигнал для упрощения RAG-архитектуры, но не приоритет: Nexus RAG (80K docs) и GDrive-RAG работают, миграция нецелесообразна. Стоит зафиксировать как кандидата для Q2 бенчмарка на длинных документах, где чанкинг теряет контекст. Практическая ценность проявится только если reasoning-подход покажет значимо лучшее качество при сопоставимой стоимости.

Описание

id: c5d2591c-8761-4cc7-9a82-4920d414c1ac type: github category: exocortex relevance: 5.5 captured: 2026-03-15T19:30:15.532963+00:00

Сценарии использования

Альтернатива Nexus RAG (80K ChromaDB docs) — тестирование vectorless-подхода на документах Creata для сравнения качества retrieval
Анализ длинных юридических документов и договоров портфеля (Наукоград, Temirdos) без необходимости индексации в ChromaDB
MCP-интеграция в Claude Code для прямого reasoning-поиска по PDF/DOCX без предварительного embedding

Анализ по линзам

Стратегия
6.0
Практичность
5.5
Конкуренция
6.0
Риски
5.0

Релевантно для Exocortex v2.1 и эволюции RAG-инфраструктуры, но не является приоритетом OKR 2026 — текущий Nexus RAG (80K docs, ChromaDB) работает в продакшене.

MCP-интеграция — плюс (уже 6 MCP-серверов в стеке), но миграция с работающего ChromaDB/embeddings пайплайна нецелесообразна сейчас; можно протестировать на длинных документах (контракты, стратегии) как дополнение, не замену.

Упрощение RAG-пайплайна (без чанкинга, без векторной БД) может снизить операционную сложность, но 24 AI-инструмента уже отслеживаются — преимущество инкрементальное.

Зависимость от VectifyAI (open-source, но нет гарантий поддержки), стоимость LLM-вызовов для reasoning-подхода может быть выше embeddings, миграция существующих 80K документов рискованна.

Текущий Nexus RAG стабилен, GDrive-RAG в процессе внедрения — переключение фокуса преждевременно; оценить в Q2 после стабилизации всех RAG-источников.

Маппинг по проектам

MEDIUM
Exocortex
Добавить в exocortex/knowledge как R&D-заметку; оценить reasoning-подход для длинных стратегических документов (50+ стр.)
MEDIUM
Intelligence Hub (D46)
Сравнить качество поиска PageIndex vs ChromaDB на 10 тестовых документах при следующем R&D-спринте
MEDIUM
Nexus RAG
Не мигрировать; рассмотреть как fallback для документов, где чанкинг теряет контекст (PDF-отчёты, юр. документы)

Действия

Сохранить ссылку в _Meta/exocortex/knowledge/ как R&D-находку категории vectorless-RAG
При следующем R&D-спринте (Q2) протестировать PageIndex на 5-10 длинных документах из Наукоград/контракты и сравнить с Nexus RAG по качеству ответов

Рекомендации к изучению

🔬Протестировать PageIndex на корпусе документов Наукоград/Temirdos и сравнить качество с текущим Nexus RAG (ChromaDB + qwen3-embedding)
🔬Изучить MCP-интеграцию PageIndex для подключения к Claude Code как альтернативный поисковый backend

Упомянутые инструменты

PageIndexPageIndex ChatMCPLLM

Теги

#ai-tools

Похожие находки

Статус
analyzed
Добавлено
15.03.2026
Проанализировано
16.03.2026
ID
c5d2591c