首页 > Ai资讯 > Ai产品

Hyper-RAG：清华大学和西安交通大学提出的超图驱动的检索增强生成方法

映技派于2025-04-20发布在Ai产品

Hyper-RAG是什么？

Hyper-RAG 是清华大学和西安交通大学提出的一种超图驱动的检索增强生成方法，它通过超图技术提升大型语言模型（LLM）在专业领域知识建模中的精准度，减少模型生成内容时的“幻觉”现象。实验表明，Hyper-RAG 在多个数据集上平均准确率较传统图方法提升12.3%，且在复杂查询下性能稳定，适用于医疗、金融等高可靠需求领域。

Hyper-RAG：清华大学和西安交通大学提出的超图驱动的检索增强生成方法.webp

Hyper-RAG核心原理

Hyper-RAG 的核心在于利用超图来同时捕捉原始数据中的低阶关联（成对关系）和高阶关联（多实体关系）。传统的基于图的 RAG 方法（如 Graph RAG 和 Light RAG）只能表示成对关系，无法有效处理复杂的多实体关系，这会导致信息丢失，进而影响 LLM 的输出准确性。而超图能够通过超边表示多个实体之间的复杂关系，从而提供更全面的知识表示。

Hyper-RAG功能特征：

超图知识表示：通过超图结构捕捉多实体复杂关系，减少信息丢失，实现更完整、准确的知识表示。
检索增强生成：结合超图检索，精准提取相关知识，优化生成回答，降低幻觉现象，提升回答可信度。
复杂查询处理：能够高效处理多实体和复杂关系的查询，性能稳定，适应复杂问题解答。
高效检索效率：轻量级检索速度快，兼顾准确率，适合实时性要求高的场景。
领域适应性强：适用于医疗、金融、法律等多领域，可定制化，通用性高。
减少幻觉现象：通过知识校准，减少因模型知识不足导致的错误生成。
可扩展性强：知识库动态更新，可与不同规模的语言模型结合，适应性强。

Hyper-RAG工作流程

知识库构建：从特定领域的语料库中提取实体和关系，构建超图知识库。
检索增强：通过超图检索技术，从知识库中提取与查询相关的知识。
生成回答：将检索到的知识与用户的问题一起输入到 LLM 中，生成更准确的回答。

实验结果

在神经科学任务上，Hyper-RAG 的准确率比直接使用 LLM 平均提升了 12.3%，并且比 Graph RAG 和 Light RAG 分别高出 6.3% 和 6.0%。
在查询复杂性增加的情况下，Hyper-RAG 的性能保持稳定，而其他方法的性能则会下降。
在九个不同领域的数据集上，Hyper-RAG 的性能比 Light RAG 提高了 35.5%。
此外，Hyper-RAG 的轻量级变体 Hyper-RAG-Lite 在检索速度上达到 Light RAG 的两倍，性能提升了 3.3%。

Hyper-RAG：清华大学和西安交通大学提出的超图驱动的检索增强生成方法.webp