基于大模型的数字化制造探索2-通过RAG结合DeepSeek和西门子Insights Hub实现基于IIoT的设备数字化维护

RAG（Retrieval-Augmented Generation，检索增强生成），RAG是一种 AI 框架，它将传统信息检索系统（例如数据库）的优势与生成式大语言模型 (LLM) 的功能结合在一起，用于解决通用大模型（如DeepSeek）在制造领域缺乏特定领域知识的问题。大模型的知识来源于公开的互联网和开源数据集训练数据，无法覆盖特定领域或高度专业化的内部知识。信息过时则指模型难以处理实时信息

Python蛋挞

864人浏览 · 2025-02-10 11:08:16

Python蛋挞 · 2025-02-10 11:08:16 发布

我们初步探索了如何将当红炸子鸡DeepSeek大模型和西门子Insights Hub数字化制造平台相结合并进行数据打通。

然而，任何的大模型，不管是DeepSeek，ChatGPT, 千问等，通常都是指的通用大模型，也称基础大模型，它的数据来源更多是来自于互联网和开源数据集，无法覆盖特定领域或高度专业化的内部知识，尤其是企业内部私有化的业务知识。

本篇将介绍，如何通过RAG（Retrieval-Augmented Generation，检索增强生成）技术，在DeepSeek通用大模型基础之上，通过LangChain框架实现企业设备维护保养知识的向量化嵌入，并通过西门子Insights Hub的IIoT技术能力，实现车间现场设备监控及基于知识库的维护保养的一站式闭环应用场景。

本篇的重点在于如何把LLM大模型技术，RAG技术，向量数据库等技术与西门子数据驱动制造平台的能力相结合，并实现最小化的闭环场景的验证与打通。如果需要了解LLM，RAG，LangChain，向量数据库，嵌入式模型，Python, AI agent等技术细节，可以参考其他第三方文章。

一. RAG, LangChain, 向量数据库技术概述

RAG

RAG（Retrieval-Augmented Generation，检索增强生成），RAG是一种 AI 框架，它将传统信息检索系统（例如数据库）的优势与生成式大语言模型 (LLM) 的功能结合在一起，用于解决通用大模型（如DeepSeek）在制造领域缺乏特定领域知识的问题。大模型的知识来源于公开的互联网和开源数据集训练数据，无法覆盖特定领域或高度专业化的内部知识。信息过时则指模型难以处理实时信息，因为训练过程耗时且成本高昂**，**模型一旦训练完成，就难以获取和处理新信息。

LangChain

LangChain是一个专门为利用语言模型创建应用程序而设计的全面框架。它的主要目标是帮助开发人员轻松构建基于语言模型的应用。LangChain与多种语言模型兼容，例如与Open AI ChatGPT，DeepSeek等无缝集成，从中受益于其先进功能。

更多详细信息请参考：https://docs.langchain.com.cn/docs/introduction
向量数据库

向量数据库也叫矢量数据库，是一种以数学向量的形式存储数据集合的数据库。更通俗的说法，向量就是一个数字列表，例如：[12, 13, 19, 8, 9]。这些数字表示维度空间中的一个位置，代表在这个维度上的特征。就像行和列号表示电子表格中特定单元格一样（例如，“A10”表示 A 列 10 行）。在人工智能（AI）主导的时代，文字、图像、语音、视频等多模态数据的复杂性显著增加。由于这些数据具有非结构化和多维特征，向量表示能够有效表示语义和捕捉其潜在的语义关系，促使向量数据库成为存储、检索和分析高维数据向量的关键工具。

常见的向量数据库如下图所示：

本篇将采用在开源领域使用比较广泛的Chroma来作为向量数据库，并通过LangChain框架实现企业设备维护文档的向量化存储，并结合DeepSeek大模型的能力，实现了对DeepSeek大模型工业专业领域的知识扩充，来作为一个MVP（Minimal Viable Product）版本的企业级知识库。

二. 通过嵌入式模型实现设备维护文档的向量化存储

嵌入模型（Embedding Model） 负责将文本数据映射到高维向量空间中，将输入的文档片段转换为对应的嵌入向量（embedding vectors）。这些向量捕捉了文本的语义信息，并被存储在**向量数据库（VectorStore）中，以便后续检索使用。用户查询（Query）同样通过嵌入模型的处理生成查询嵌入向量，这些向量用于在向量数据库中通过向量检索（Vector Retrieval）**匹配最相似的文档片段。根据不同的场景需求，评估并选择最优的嵌入模型，以确保 RAG 的检索性能符合要求。

本篇使用的嵌入式模型是bge-small-zh-v1.5，它是由北京人工智能研究院（BAAI，智源）开发的开源向量模型。虽然模型体积较小，但仍然能够提供高精度和高效的中文向量检索。更多详细信息请参考：https://gitee.com/hf-models/bge-small-zh-v1.5。

本篇将使用一个企业内部使用机器人维护保养手册的pdf文档作为样例：

LangChain支持各种文档的内容提取。例如PDF，Doc/Docx，PPT/PPTX，XLSX，txt，csv，html，xml等等。它可以尽量多地提取企业各种不同的文档中的内容，使其加入到知识库中。通过使用langchain的document loader可以很方便的实现。

在这里插入图片描述

通过LangChain实现pdf格式的机器人维护手册的向量化的输出结果如下图所示：

详细编程步骤限于篇幅原因，本篇无法进行详细讲解。关于如何使用LangChain实现文档的向量化嵌入请参考https://python.langchain.com/v0.2/docs/integrations/text_embedding。

三. 应用场景的概述

我们不妨从一次模拟的生产事故讲起…

一天深夜，生产线上的机器人突然停机，屏幕上显示了一串复杂的错误代码。李工和他的团队花了近两个小时翻阅设备手册、查看历史维修记录、分析设备控制台数据，最终才找到问题的根源。“如果当时有一个工具或者老师傅能直接告诉我问题的原因和解决方案，我们至少能节省90%的时间。”李工不由的想。

这就是本篇将要实现的场景。工厂设备在运行中，如发生异常情况会发出告警事件。另一种情况，就是在一些关键的传感器数据被监控时，如果超过设定的阈值时，也会触发报警事件。我们需要及时收到这些告警事件，同时能最快地获得故障相关的信息和维修建议。我们需要用一个AI agent来实现这个工作流。

四. 使用Insights Hub VFC实现一个简单的设备监控AI agent

下图是一个完整的VFC的工作流的实现和运行结果的截图，后面我们分别解释。

1. 首先模拟一个告警事件的发生，这可以通过VFC的create event的节点实现。

这个事件里包含的信息是 “故障代码 Q100”。

2. 使用VFC实现一个AI agent，持续检查事件信息，如果收到告警事件，就获取告警信息的内容。

3. 下一步调用前面准备好的知识库的HTTP API，进行知识库检索，返回多个最接近的文本块。

这里访问的HTTP API的地址就是我们前面实现知识库检索的HTTP API服务的地址。

http://xxxx:8000/query?question={{{query}}}

这里{{{query}}}是要查询的问题的文字，也就是填入前面的告警事件中的故障信息的内容。这里请求发出后，返回的就是从向量库中检索出的多个文本块。

4. 封装大模型提示词的结构，把返回的内容作为参考文档，让大模型从这里寻找问题回答的内容。

5. 调用DeepSeek API，将组织好的提示词发送给大模型，等待它生成解答。

6. 我们还可以继续增加这个工作流的分析任务，例如读取相关设备的IoT数据，从中分析相关时刻是否有异常，或者访问生产管理和生产执行的数据进行关联分析，以及访问质量数据分析是否有质量的影响。为了简化这个演示，我们暂且完成这个工作流，通过调用VFC的通知的功能，将问题信息和大模型解读的内容发送给相关人员。这个演示中就调用邮件发送的节点。

7. 接收到自动发送到邮件，包含了大模型输出的内容。

通过结合Insights Hub平台的IoT数据采集和存储，Visual Flow Creator的工作流能力，结合RAG本地知识库的建立，以及DeepSeek等大模型的调用，我们可以快速地在工业应用场景下端到端地实现AI智能体。大模型是智能体的大脑，RAG为智能体提供了知识，工业物联网平台为智能体提供了设备以及生产的实时信息，让智能体的触角可以延伸到工厂的每个角落。而智能体的workflow又可以通过VFC快速地实现。针对具体的业务需求，我们都可以快速建立各种用途的智能体，将人工智能全面用在工厂车间里。

五. 小结

本篇通过一个工厂中最常见的应用场景出发，演示了如何把DeepSeek大模型，RAG技术，向量数据库技术，LangChain技术，西门子Insights Hub提供的工业物联网技术等进行集成串接，实现了一个用户收到工厂运行设备报警后，通过邮件自动告知用户如何解决修复的最小可工作单元（MVP）。

通过这样的一个案例演示，证明了通过RAG，嵌入式模型和向量化技术，能够有效在通用大模型基础上，实现企业专有知识领域的扩展。并通过与西门子Insights Hub数字化制造平台的集成，实现了工业物联网和大模型的集成的闭环应用场景。从而实现了为工厂里的用户配备了一个专家级的顾问助手，帮助用户提升生产效率（降低MTTR），降低运维成本。

以后，对于李工来说（见本文第三节，应用场景概述），IIoT再也不是一对冷冰冰的物理数字，而是直接通过大模型转换成为可以被执行的生产操作建议，工厂小白都可以在AI agent的加持下，成为一个“懂业务，说人话，会算账”的老师傅！

六. 未来展望

基于大模型和工业互联网数字化制造的应用才刚刚起步，还有很多的路要走。从场景和价值角度，可以为企业打造一个“永不退休”的老师傅，让工厂运维效率提升；从技术角度，以用户友好的方式快速实现专有知识的向量化，生产多源数据的汇集，更加智能的AI agent，模型的微调等，都是需要深入思考的问题；从安全角度，在IT/OT更加融合的时代，如何避免大模型的“滥用”给企业生产带来安全影响，都是亟待解决的事项。
读者福利：如果大家对大模型感兴趣，这套大模型学习资料一定对你有用

对于0基础小白入门：