RAG нового поколения.
Entropy-Controlled Retrieval — единственный путь к системам без галлюцинаций.
Проблема
«Конфетти-эффект» убивает точность.
Традиционные RAG-системы нарезают документы на фиксированные чанки, игнорируя семантические границы.
- Факты из разных секций смешиваются
- Контекст обрывается на середине мысли
- Невозможность отследить источник
Результат LLM
«Базовый план предлагает безлимитный API...»
Legacy RAG vs ECR-RAG
Ключевые метрики
| Параметр | Legacy | ECR-RAG |
|---|---|---|
| Точность фактов | 60-80% | 99%+ |
| Контекст | Шум + повторы | Оптимальный (-40%) |
| Структура | Flat Chunks | Content Envelope |
| Маршрутизация | Linear | 6 Intent Strategies |
ECR-RAG превращает поиск из «угадайки» в проверяемую систему.
В Legacy-подходе качество ответа зависит от того, какие куски текста случайно попали в контекст. В ECR-RAG ответ строится из когерентного envelope: факты привязаны к якорям, маршрутизация подбирает правильный слой, а контекст остается коротким и точным.
Таблица слева — это не «маркетинг про проценты», а разница в механике: меньше шума, больше структуры и контроль сборки контекста.
Архитектура
Как работает ECR-RAG
Вместо слепого vector search — интеллектуальная маршрутизация запросов к правильному слою Content Envelope.
Путь запроса
Контентный конверт
Сборка из правильного слоя — без шума
Слой 01: Структура
Типизированные сущности
Слой 02: Нарратив
Чистый Markdown
Семантически верные секции с глубоким контекстом.
Слой 03: Индекс
Стабильные якоря
Персистентные ID для сборки контекста.
Ключевое отличие
Традиционный RAG
запрос → векторный_поиск → случайные_фрагменты → LLM
ECR-RAG
запрос → классификация → маршрутизация → когерентные_конверты → LLM
Маршрутизация
6 стратегий для 6 типов запросов
Каждый тип запроса требует своего подхода. ECR автоматически классифицирует входящий поток.
Ingestion Engine
Конвейер обработки данных
В отличие от маршрутизации (runtime), этот процесс происходит один раз при загрузке. Мы превращаем хаос входящих форматов в стандартизированный Content Envelope.
NoiseStripper
Очистка от метаданных, хедеров и мусора.
AnchorGenerator
Создание стабильных ID для каждой секции.
StructureExtractor
Извлечение фактов (Цена, Дата, Продукт).
StructureBinder
Привязка фактов к тексту (Anchor Ref).
EnvelopeBuilder
Сборка финального JSON-файла.
Интеграция
Интеграция в один вызов
Весь пайплайн — одна функция. Минимум кода, максимум точности.
from aio_core.pipeline import AIOPipeline
pipeline = AIOPipeline()
# Process any content → Content Envelope
result = pipeline.process_with_report(
html_content,
source_url="https://example.com"
)
envelope = result["envelope"]
print(f"Noise: {result['report']['noise_score']:.0%}")
from aio_core.retrieval import IntentClassifier
classifier = IntentClassifier()
query = "What's the price of Premium?"
result = classifier.classify(query)
print(result.intent) # FACT_EXTRACTION
print(result.strategy) # structure_first
print(result.confidence) # 0.98
Технический стандарт
Анатомия Content Envelope
Результат работы ECR-пайплайна — универсальный JSON-контейнер с тремя слоями данных, связанных через якоря. AI-агент мгновенно проверяет факты без перечитывания текста.
Source Layer
Метаданные источника, URI, тип данных и хеш для верификации.
Narrative Layer
Чистый текст, разбитый на семантические секции с уникальными ID.
Structure Layer
Типизированные сущности (JSON-LD) со ссылками на Narrative-якоря.
{
"header": {
"version": "2.1",
"source_uri": "https://example.com/pricing",
"content_hash": "sha256:a1b2c3..."
},
"narrative": {
"sections": [
{
"id": "#pricing",
"content": "Premium план стоит $29/мес..."
}
]
},
"structure": {
"entities": [
{
"@type": "PriceSpecification",
"price": 29,
"anchor_ref": "#pricing"
}
]
}
}
Экосистема
Интеграции из коробки
No-Code платформы
Готовые модули для автоматизации без программирования.
AI-фреймворки
Drop-in Retriever replacement для популярных RAG-библиотек.
Custom-код
SDK на 5 языках + полная совместимость с любой Vector DB.
Любая Vector Database
ECR использует абстрактный IndexInterface — подключите любой бэкенд.
Применение
Где ECR раскрывается на полную
Финтех
- →Точный поиск по тарифам
- →Связывание цифр с источниками
- →Нулевая терпимость к ошибкам
Юриспруденция
- →Навигация по законам
- →Кросс-ссылки на статьи
- →Верификация в договорах
Крупный бизнес
- →Внутренние базы знаний
- →Ответы для саппорта
- →Автоматизация пайплайнов
Фарма и Биотех
- →Поиск по научным статьям
- →Извлечение формул
- →Связь с цитатами
Образование
- →Поиск по учебным материалам
- →Автоматическая проверка работ
- →Персонализированные ответы
Госсектор
- →Анализ регламентов
- →Поиск по архивам
- →Безопасная обработка данных
Научные центры
- →Анализ экспериментов
- →База знаний лаборатории
- →Ускорение открытий
Малый бизнес
- →Поддержка клиентов
- →Автоматизация FAQ
- →Снижение издержек
Бизнес-ценность
Не только точность. Время и деньги.
ECR — технология, которая экономит ресурсы с первого дня.
Меньше токенов = меньше счета
99% точность = минимум модерации
Готовые стратегии маршрутизации
Меньше compute на inference
Масштаб Enterprise (1М+ запросов/день)
5 млн – 20 млн ₽ / год
Прогнозируемая экономия за счет оптимизации контекста и устранения галлюцинаций.
Научный фундамент
Основано на теории когнитивной уязвимости
ECR — практическая реализация G-модели из Theory of Stupidity. Маршрутизация оптимизирует внимание (\(A\)), noise stripping минимизирует энтропию (\(D\)).
RAG нового поколения.
Переходите от вероятностного поиска к детерминированному знанию. Стройте системы, которым можно доверять.
Открытая Наука • Открытый код • Бесплатно для всех