知识图谱

最后更新:2026-06-08 数据来源:data/data-and-knowledge.yaml 自动生成


🕸️ 什么时候需要知识图谱?

知识图谱不是万能的。大多数 RAG 场景用向量检索就够了,只有在这些情况下才需要图谱

场景 需要图谱吗 理由
"张三的老板是谁" ✅ 需要 多跳关系推理,向量检索搞不定
"公司所有项目的负责人" ✅ 需要 结构化查询,图数据库天然擅长
"这个产品的说明书" ❌ 不需要 纯文本检索,向量够用
"帮我写个周报" ❌ 不需要 生成任务,不需要图谱
"A 和 B 之间有什么关系" ✅ 需要 关系发现,图谱核心优势

[!TIP] 90% 的 RAG 场景不需要知识图谱 如果你的需求是"基于文档回答问题",纯向量检索 + Reranking 就够了。知识图谱适合的是实体关系密集的场景(组织架构、供应链、法律条文关联等)。


📋 知识图谱生态总览

名称 简介 标签 亮点
GraphRAG 微软出品的图增强 RAG 框架 rag, microsoft 微软出品
图增强 RAG
25K Stars
Neo4j 最流行的图数据库,生态成熟 rag, enterprise 行业标杆的原生图数据库引擎
Cypher 查询语言完美协同大模型
无缝集成主流 RAG 框架
NebulaGraph 分布式图数据库,支持大规模图数据 rag, distributed 分布式图数据库
大规模图数据
11K Stars
LightRAG LLM 驱动的轻量级知识图谱 RAG 框架 rag, openai-compatible 香港大学开源,双层极速图谱检索架构
成本不到微软方案的十分之一
原生支持图谱的无缝增量更新
FalkorDB 超快图数据库,GraphBLAS 底层,适合知识图谱 RAG rag, fast-inference 4.5K Stars
GraphBLAS 加速
超快图查询
HippoRAG 受海马体启发的 RAG 框架,NeurIPS 2024 论文,知识图谱+检索融合 rag, academic 3.5K Stars
NeurIPS 2024
海马体启发

🏗️ 图谱构建流程

原始文档
  ↓
实体抽取 (LLM / NER 模型)
  ↓
关系抽取 (LLM / 关系分类)
  ↓
实体消歧 (同义词合并)
  ↓
图数据库存储 (Neo4j / NebulaGraph)
  ↓
查询与推理 (Cypher / SPARQL)

用 LLM 构建图谱(最简方案):

import openai

def extract_entities(text: str) -> list[dict]:
    """用 LLM 抽取实体和关系"""
    response = openai.chat.completions.create(
        model="gpt-5.4-mini",
        messages=[{
            "role": "user",
            "content": f"""从以下文本中抽取实体和关系,返回 JSON 格式:
            实体类型:人物、组织、产品、地点
            关系类型:任职于、创建了、位于、合作
            
            文本:{text}
            
            返回格式:
            {{"entities": [...], "relations": [...]}}"""
        }]
    )
    return response.choices[0].message.content

🔧 工具对比

工具 类型 适合谁 学习成本
Neo4j 图数据库 入门首选,生态最好
NebulaGraph 图数据库 大规模,国产
LightRAG LLM + 图谱 快速构建,LLM 驱动
GraphRAG 微软方案 企业级,与 Azure 集成
HippoRAG 海马体启发 学术研究,NeurIPS 论文
FalkorDB 图数据库 超快查询,GraphBLAS

[!TIP] LightRAG 是个人/小团队的最佳起点 它用 LLM 自动从文档中抽取实体和关系,构建图谱,然后用图谱增强 RAG 检索。不需要手动设计 Schema,开箱即用。


更新频率:每季度更新 自动化:运行 python scripts/build_docs.py 从 YAML 重新渲染表格。