开源RAG项目到底如何选型？

首先，我们参与比较的开源 RAG 项目包括 dify、maxkb、ragflow，当然其实还有 fastgpt、bisheng 等等之流，但本文主要集中在 dify、maxkb、ragflow 以及 langflow。

大靠山

919人浏览 · 2025-06-26 21:26:17

大靠山 · 2025-06-26 21:26:17 发布

结论

首先，我们参与比较的开源 RAG 项目包括 dify、maxkb、ragflow，当然其实还有 fastgpt、bisheng 等等之流，但本文主要集中在 dify、maxkb、ragflow 以及 langflow。

首先给结论：
只专注知识库 ragflow > dify > maxkb，但如果有其他考虑，可以继续看下文。

ragflow分析

1、重点追求 RAG 知识库的可控可用，甚至打算后期商业化，就选 ragflow，从开源许可，RAG 深度，ragflow 做得最好，代码质量相对也不错。

ragflow 功能相对全面，特别是知识库，内置的deepdoc自研，基本满足了一般场景下的文档解析。
同时在知识召回方面，除了基本的混合检索能力，也支持 graphrag 的知识图谱和召回能力以及 raptor 等，同时支持两种文档向量数据库，自家自研的infinity 就不建议了，优先推荐 elasticsearch，特别是 9.0 版本以后，官网的 bbq 能力进一步提升和稳定，简直是企业场景首选，这个后面单独写一篇文章。
上述讲了，除了独有的 deepdoc 模块，见上图，可以把文档的详细解析处理流程展示出来，可谓产品优秀小细节，还有下图中对于引用源的处理，也有小细节。

dify分析

2、追求工作流扩展+知识库齐飞，功能最全面，就选 dify 没错，美中不足就是开源许可，不适合二次开发商业化，同时项目复杂度也比较高，对于没有 saas 需求，有些设计不太合适，说白了 dify 是开源版本 coze 对齐。
至于更详细的技术分析，见我前一篇文章(1.0 版本)，不过好像 dify 已经发布了 1.3 版本，后面对于这三个次要版本，dify 到底更新了什么，我也挖个坑，下下篇文章来聊下。

maxkb

3、追求二开，轻量级，小清新，就选 maxkb，maxkb工程虽小，但功能真不少，也支持工作流，页面交互也是我最喜欢的，当然 maxkb 开源许可也不太适合商业化，但不妨碍一些小团队或者个人使用，代码也清晰可读，整体就依赖了 PostgreSQL 数据库来实现工程元数据以及向量数据库，以及全文检索，谁叫 PG 这么强呢，在 MySQL 日渐式微的当下，PG 就是王者。

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述