知识图谱

最后更新：2026-06-08 数据来源：data/data-and-knowledge.yaml 自动生成

🕸️ 什么时候需要知识图谱？

知识图谱不是万能的。大多数 RAG 场景用向量检索就够了，只有在这些情况下才需要图谱：

场景	需要图谱吗	理由
"张三的老板是谁"	✅ 需要	多跳关系推理，向量检索搞不定
"公司所有项目的负责人"	✅ 需要	结构化查询，图数据库天然擅长
"这个产品的说明书"	❌ 不需要	纯文本检索，向量够用
"帮我写个周报"	❌ 不需要	生成任务，不需要图谱
"A 和 B 之间有什么关系"	✅ 需要	关系发现，图谱核心优势

[!TIP] 90% 的 RAG 场景不需要知识图谱 如果你的需求是"基于文档回答问题"，纯向量检索 + Reranking 就够了。知识图谱适合的是实体关系密集的场景（组织架构、供应链、法律条文关联等）。

📋 知识图谱生态总览

名称	简介	标签	亮点
GraphRAG	微软出品的图增强 RAG 框架	rag, microsoft	微软出品图增强 RAG 25K Stars
Neo4j	最流行的图数据库，生态成熟	rag, enterprise	行业标杆的原生图数据库引擎 Cypher 查询语言完美协同大模型无缝集成主流 RAG 框架
NebulaGraph	分布式图数据库，支持大规模图数据	rag, distributed	分布式图数据库大规模图数据 11K Stars
LightRAG	LLM 驱动的轻量级知识图谱 RAG 框架	rag, openai-compatible	香港大学开源，双层极速图谱检索架构成本不到微软方案的十分之一原生支持图谱的无缝增量更新
FalkorDB	超快图数据库，GraphBLAS 底层，适合知识图谱 RAG	rag, fast-inference	4.5K Stars GraphBLAS 加速超快图查询
HippoRAG	受海马体启发的 RAG 框架，NeurIPS 2024 论文，知识图谱+检索融合	rag, academic	3.5K Stars NeurIPS 2024 海马体启发

🏗️ 图谱构建流程

原始文档
  ↓
实体抽取 (LLM / NER 模型)
  ↓
关系抽取 (LLM / 关系分类)
  ↓
实体消歧 (同义词合并)
  ↓
图数据库存储 (Neo4j / NebulaGraph)
  ↓
查询与推理 (Cypher / SPARQL)

用 LLM 构建图谱（最简方案）：

import openai

def extract_entities(text: str) -> list[dict]:
    """用 LLM 抽取实体和关系"""
    response = openai.chat.completions.create(
        model="gpt-5.4-mini",
        messages=[{
            "role": "user",
            "content": f"""从以下文本中抽取实体和关系，返回 JSON 格式：
            实体类型：人物、组织、产品、地点
            关系类型：任职于、创建了、位于、合作
            
            文本：{text}
            
            返回格式：
            {{"entities": [...], "relations": [...]}}"""
        }]
    )
    return response.choices[0].message.content

🔧 工具对比

工具	类型	适合谁	学习成本
Neo4j	图数据库	入门首选，生态最好	中
NebulaGraph	图数据库	大规模，国产	高
LightRAG	LLM + 图谱	快速构建，LLM 驱动	低
GraphRAG	微软方案	企业级，与 Azure 集成	中
HippoRAG	海马体启发	学术研究，NeurIPS 论文	中
FalkorDB	图数据库	超快查询，GraphBLAS	中

[!TIP] LightRAG 是个人/小团队的最佳起点 它用 LLM 自动从文档中抽取实体和关系，构建图谱，然后用图谱增强 RAG 检索。不需要手动设计 Schema，开箱即用。

更新频率：每季度更新 自动化：运行 python scripts/build_docs.py 从 YAML 重新渲染表格。