Neo4j 超详细入门

2301_80224467

424人浏览 · 2026-04-21 11:18:44

2301_80224467 · 2026-04-21 11:18:44 发布

Neo4j 是全球最主流、原生高性能属性图数据库，专门存储节点 - 关系 - 属性的图结构数据，是 GraphRAG、知识图谱、多跳推理系统的标准底层存储底座。

一、核心定义与数据模型

1. 原生图数据库

底层物理存储就是图结构，不是 MySQL 套图插件，遍历多跳关系毫秒级，远超关系型数据库 JOIN 查询。

2. 三大核心元素（属性图标准）

节点 Node：实体（人物、技术、文档、代码模块、概念）
关系 Relationship：实体关联（属于、调用、依赖、合作、引用）
属性 Property：节点 / 关系附带键值信息（描述、时间、来源、向量）

3. 查询语言：Cypher

类 SQL 语法、可视化图匹配，专门做路径遍历、多跳查询

# 查找A依赖的所有2跳技术路径
MATCH (a:Code)-[:DEPENDS]->(b)-[:USES]->(c) RETURN a,b,c

二、核心优势（对比 MySQL / 向量库）

多跳关系极速查询MySQL 多层 JOIN 指数变慢；Neo4j 天生邻接存储，N 跳关联毫秒返回，完美适配 GraphRAG 多跳推理。
结构灵活无表约束不用建表、不用外键，新增实体 / 关系无需改库结构，适配文档动态抽取知识图谱。
企业级稳定支持ACID 事务、集群高可用、持久化、备份恢复，可上生产环境。
可视化 + 图算法自带 Neo4j Browser 图形可视化；内置路径、聚类、社区发现算法，匹配 GraphRAG 社区分层检索。
AI 生态无缝打通原生适配 LlamaIndex、LangChain、微软 GraphRAG，一键做文本→知识图谱→图检索 RAGNeo4j。

三、Neo4j 在 GraphRAG 里的角色（你项目核心）

传统 RAG：向量库 → 文本块语义匹配GraphRAG：Neo4j（知识图谱）+ 向量库 双存储

LlamaIndex 从文档抽取实体 + 关系，写入 Neo4j 构建属性图
用户提问 → LLM 转 Cypher → Neo4j 做多跳路径检索
结合向量语义召回 + 图结构化关联，拼接上下文给 LLM
输出可溯源、可推理、低幻觉的问答结果Neo4j

四、Neo4j vs 向量数据库（Milvus/Chroma）

表格

对比项	Neo4j 图数据库	向量数据库
存储单元	节点、关系、路径	文本向量
擅长能力	关系推理、多跳链路、全局关联	语义相似度模糊匹配
GraphRAG 定位	结构化知识底座	语义补充检索
幻觉控制	极强（显式关系约束）	一般
适用场景	复杂代码依赖、论文引用、企业关联知识	普通文档问答、摘要

五、LlamaIndex + Neo4j 极简实战代码

# 安装依赖
pip install llama-index llama-index-graph-stores-neo4j

# 连接Neo4j + 构建知识图谱索引
from llama_index.graph_stores.neo4j import Neo4jPropertyGraphStore
from llama_index.core import PropertyGraphIndex, SimpleDirectoryReader

# 连接本地Neo4j
graph_store = Neo4jPropertyGraphStore(
    url="bolt://localhost:7687",
    username="neo4j",
    password="你的密码"
)

# 加载文档→自动抽实体关系→写入Neo4j
docs = SimpleDirectoryReader("./code_docs").load_data()
index = PropertyGraphIndex.from_documents(docs, graph_store=graph_store)

# 图检索问答（多跳推理）
query_engine = index.as_query_engine()
print(query_engine.query("这个模块依赖哪些底层组件？调用链路是什么"))

六、典型落地场景

GraphRAG 企业知识库、学术论文关联图谱
代码依赖图谱、项目架构溯源（你的 CodeFlow-AI）
社交网络、风控关联链路、供应链上下游
法律法条关联、医疗疾病因果推理

DeepSeek技术社区

欢迎加入DeepSeek 技术社区。在这里，你可以找到志同道合的朋友，共同探索AI技术的奥秘。

更多推荐

AI、Agent、Agentic 的区别到底有多大？别再傻傻分不清了

DeepSeek技术社区

Claude 大模型在真实业务中的落地应用指南

DeepSeek技术社区

2024专科生考证怎么规划？高含金量证书怎么选与适合谁（附AI应用能力认证测评）

对于专科背景的求职者而言，合理的职业证书规划是提升自身竞争力的重要路径。随着生成式 AI 工具的普及，不少求职者会在简历的技能栏中标注 “熟练使用 ChatGPT 等大模型工具”，但基础的指令操作正逐渐成为通用数字素养，难以形成差异化的职业壁垒。在数字化转型的行业趋势下，企业更关注求职者是否具备系统化的业务解构能力与工作流优化能力，高含金量的能力认证，是客观证明这类能力的参考依据之一。