AiConf

GraphRAG: 8 способов укротить расширенный контекст

Обработка данных и бенчмарки

PostgreSQL
Базы данных / другое
Оптимизация производительности
Machine Learning
Хранилища
Обработка данных

Доклад принят в программу конференции

Целевая аудитория

o Data Scientists и ML-инженеры, разрабатывающие и оптимизирующие RAG-системы. o Архитекторы данных и ПО, проектирующие пайплайны обработки знаний на основе LLM. o Технические лидеры, заинтересованные в повышении точности, релевантности и управляемости генеративных моделей при работе с большими объемами данных. o Разработчики, работающие с NLP, графовыми базами данных (Neo4j) и векторным поиском. o Специалисты, сталкивающиеся с проблемами галлюцинаций и нерелевантных ответов в существующих RAG-решениях.

Тезисы

Стандартные RAG-системы часто не справляются со сложными корпоративными данными, приводя к неточным ответам, упущенным возможностям и замедлению принятия критически важных решений. Это напрямую влияет на эффективность бизнеса и конкурентоспособность. GraphRAG решает эту проблему, используя графы знаний для структурирования информации и выявления скрытых связей, превращая ваши данные из пассива в стратегический актив.
Почему мы рассматриваем 8 различных стратегий GraphRAG? Потому что универсального решения не существует. Разные бизнес-задачи, типы данных (текст, таблицы, изображения), требования к скорости ответа и бюджеты требуют разных подходов для достижения оптимальных результатов. Понимание спектра возможностей – от базового извлечения связей до продвинутых техник вроде графового чанкинга, поиска по сообществам (для выявления клиентских сегментов или скрытых рисков) и гибридных методов – позволяет выбрать наиболее эффективную и экономически оправданную стратегию именно для вашей компании. Это ключ к максимизации ROI от внедрения RAG.
Будут продемонстрированы различные способы "укрощения" расширенного контекста: от базового извлечения сущностей и связей до продвинутых техник, таких как графовый семантический чанкинг, поиск по сообществам и путям, иерархическое резюмирование графа, работа с мультимодальными данными и гибридные подходы, сочетающие графы и векторный поиск.
Мы детально разберем каждый метод, его архитектуру, преимущества и недостатки. На основе сопоставимых бенчмарков (на примере датасетов из областей MedTech и LegalTech) мы покажем, как выбор конкретного способа GraphRAG влияет на метрики точности (Precision, Recall), полноты ответа, скорости и стоимости вычислений. Обсудим ключевые параметры настройки моделей (LLM, embedding), графовой базы данных Neo4j и алгоритмов Graph Data Science.
Участники получат ценные рецепты и рекомендации по выбору и реализации наиболее подходящего GraphRAG-пайплайна для своих задач, чтобы строить более надежные, точные, интерпретируемые и оптимальные по цене RAG-системы.

NLP Lead.
Архитектор ИИ.

Видео