我们初步探索了如何将当红炸子鸡DeepSeek大模型和西门子Insights Hub数字化制造平台相结合并进行数据打通。

然而,任何的大模型,不管是DeepSeek,ChatGPT, 千问等,通常都是指的通用大模型,也称基础大模型,它的数据来源更多是来自于互联网和开源数据集,无法覆盖特定领域或高度专业化的内部知识,尤其是企业内部私有化的业务知识。

本篇将介绍,如何通过RAG(Retrieval-Augmented Generation,检索增强生成)技术,在DeepSeek通用大模型基础之上,通过LangChain框架实现企业设备维护保养知识的向量化嵌入,并通过西门子Insights Hub的IIoT技术能力,实现车间现场设备监控及基于知识库的维护保养的一站式闭环应用场景。

本篇的重点在于如何把LLM大模型技术,RAG技术,向量数据库等技术与西门子数据驱动制造平台的能力相结合,并实现最小化的闭环场景的验证与打通。如果需要了解LLM,RAG,LangChain,向量数据库,嵌入式模型,Python, AI agent等技术细节,可以参考其他第三方文章。

一. RAG, LangChain, 向量数据库技术概述

  • RAG

    RAG(Retrieval-Augmented Generation,检索增强生成),RAG是一种 AI 框架,它将传统信息检索系统(例如数据库)的优势与生成式大语言模型 (LLM) 的功能结合在一起,用于解决通用大模型(如DeepSeek)在制造领域缺乏特定领域知识的问题。大模型的知识来源于公开的互联网和开源数据集训练数据,无法覆盖特定领域或高度专业化的内部知识。信息过时则指模型难以处理实时信息,因为训练过程耗时且成本高昂**,**模型一旦训练完成,就难以获取和处理新信息。

  • LangChain

    LangChain是一个专门为利用语言模型创建应用程序而设计的全面框架。它的主要目标是帮助开发人员轻松构建基于语言模型的应用。LangChain与多种语言模型兼容,例如与Open AI ChatGPT,DeepSeek等无缝集成,从中受益于其先进功能。

    更多详细信息请参考:https://docs.langchain.com.cn/docs/introduction

  • 向量数据库

    向量数据库也叫矢量数据库,是一种以数学向量的形式存储数据集合的数据库。更通俗的说法,向量就是一个数字列表,例如:[12, 13, 19, 8, 9]。这些数字表示维度空间中的一个位置,代表在这个维度上的特征。就像行和列号表示电子表格中特定单元格一样(例如,“A10”表示 A 列 10 行)。在人工智能(AI)主导的时代,文字、图像、语音、视频等多模态数据的复杂性显著增加。由于这些数据具有非结构化和多维特征,向量表示能够有效表示语义和捕捉其潜在的语义关系,促使向量数据库成为存储、检索和分析高维数据向量的关键工具。

    常见的向量数据库如下图所示:

本篇将采用在开源领域使用比较广泛的Chroma来作为向量数据库,并通过LangChain框架实现企业设备维护文档的向量化存储,并结合DeepSeek大模型的能力,实现了对DeepSeek大模型工业专业领域的知识扩充,来作为一个MVP(Minimal Viable Product)版本的企业级知识库。


二. 通过嵌入式模型实现设备维护文档的向量化存储

嵌入模型(Embedding Model) 负责将文本数据映射到高维向量空间中,将输入的文档片段转换为对应的嵌入向量(embedding vectors)。这些向量捕捉了文本的语义信息,并被存储在**向量数据库(VectorStore)中,以便后续检索使用。用户查询(Query同样通过嵌入模型的处理生成查询嵌入向量,这些向量用于在向量数据库中通过向量检索(Vector Retrieval)**匹配最相似的文档片段。根据不同的场景需求,评估并选择最优的嵌入模型,以确保 RAG 的检索性能符合要求。

本篇使用的嵌入式模型是bge-small-zh-v1.5,它是由北京人工智能研究院(BAAI,智源)开发的开源向量模型。虽然模型体积较小,但仍然能够提供高精度和高效的中文向量检索。更多详细信息请参考:https://gitee.com/hf-models/bge-small-zh-v1.5。

本篇将使用一个企业内部使用机器人维护保养手册的pdf文档作为样例:

LangChain支持各种文档的内容提取。例如PDF,Doc/Docx,PPT/PPTX,XLSX,txt,csv,html,xml等等。它可以尽量多地提取企业各种不同的文档中的内容,使其加入到知识库中。通过使用langchain的document loader可以很方便的实现。

在这里插入图片描述

通过LangChain实现pdf格式的机器人维护手册的向量化的输出结果如下图所示:

详细编程步骤限于篇幅原因,本篇无法进行详细讲解。关于如何使用LangChain实现文档的向量化嵌入请参考https://python.langchain.com/v0.2/docs/integrations/text_embedding。


三. 应用场景的概述

我们不妨从一次模拟的生产事故讲起…

一天深夜,生产线上的机器人突然停机,屏幕上显示了一串复杂的错误代码。李工和他的团队花了近两个小时翻阅设备手册、查看历史维修记录、分析设备控制台数据,最终才找到问题的根源。“如果当时有一个工具或者老师傅能直接告诉我问题的原因和解决方案,我们至少能节省90%的时间。”李工不由的想。

这就是本篇将要实现的场景。工厂设备在运行中,如发生异常情况会发出告警事件。另一种情况,就是在一些关键的传感器数据被监控时,如果超过设定的阈值时,也会触发报警事件。我们需要及时收到这些告警事件,同时能最快地获得故障相关的信息和维修建议。我们需要用一个AI agent来实现这个工作流。


四. 使用Insights Hub VFC实现一个简单的设备监控AI agent

下图是一个完整的VFC的工作流的实现和运行结果的截图,后面我们分别解释。

1. 首先模拟一个告警事件的发生,这可以通过VFC的create event的节点实现。

这个事件里包含的信息是 “故障代码 Q100”。

2. 使用VFC实现一个AI agent,持续检查事件信息,如果收到告警事件, 就获取告警信息的内容。

3. 下一步调用前面准备好的知识库的HTTP API,进行知识库检索,返回多个最接近的文本块。

这里访问的HTTP API的地址就是我们前面实现知识库检索的HTTP API服务的地址。

http://xxxx:8000/query?question={{{query}}}

这里{{{query}}}是要查询的问题的文字,也就是填入前面的告警事件中的故障信息的内容。这里请求发出后,返回的就是从向量库中检索出的多个文本块。

4. 封装大模型提示词的结构,把返回的内容作为参考文档,让大模型从这里寻找问题回答的内容。

5. 调用DeepSeek API,将组织好的提示词发送给大模型,等待它生成解答。

6. 我们还可以继续增加这个工作流的分析任务,例如读取相关设备的IoT数据,从中分析相关时刻是否有异常,或者访问生产管理和生产执行的数据进行关联分析,以及访问质量数据分析是否有质量的影响。为了简化这个演示,我们暂且完成这个工作流,通过调用VFC的通知的功能,将问题信息和大模型解读的内容发送给相关人员。这个演示中就调用邮件发送的节点。

7. 接收到自动发送到邮件,包含了大模型输出的内容。

通过结合Insights Hub平台的IoT数据采集和存储,Visual Flow Creator的工作流能力,结合RAG本地知识库的建立,以及DeepSeek等大模型的调用,我们可以快速地在工业应用场景下端到端地实现AI智能体。大模型是智能体的大脑,RAG为智能体提供了知识,工业物联网平台为智能体提供了设备以及生产的实时信息,让智能体的触角可以延伸到工厂的每个角落。而智能体的workflow又可以通过VFC快速地实现。针对具体的业务需求,我们都可以快速建立各种用途的智能体,将人工智能全面用在工厂车间里。

五. 小结

本篇通过一个工厂中最常见的应用场景出发,演示了如何把DeepSeek大模型,RAG技术,向量数据库技术,LangChain技术,西门子Insights Hub提供的工业物联网技术等进行集成串接,实现了一个用户收到工厂运行设备报警后,通过邮件自动告知用户如何解决修复的最小可工作单元(MVP)。

通过这样的一个案例演示,证明了通过RAG,嵌入式模型和向量化技术,能够有效在通用大模型基础上,实现企业专有知识领域的扩展。并通过与西门子Insights Hub数字化制造平台的集成,实现了工业物联网和大模型的集成的闭环应用场景。从而实现了为工厂里的用户配备了一个专家级的顾问助手,帮助用户提升生产效率(降低MTTR),降低运维成本。

以后,对于李工来说(见本文第三节,应用场景概述),IIoT再也不是一对冷冰冰的物理数字,而是直接通过大模型转换成为可以被执行的生产操作建议,工厂小白都可以在AI agent的加持下,成为一个“懂业务,说人话,会算账”的老师傅!

六. 未来展望

基于大模型和工业互联网数字化制造的应用才刚刚起步,还有很多的路要走。从场景和价值角度,可以为企业打造一个“永不退休”的老师傅,让工厂运维效率提升;从技术角度,以用户友好的方式快速实现专有知识的向量化,生产多源数据的汇集,更加智能的AI agent,模型的微调等,都是需要深入思考的问题;从安全角度,在IT/OT更加融合的时代,如何避免大模型的“滥用”给企业生产带来安全影响,都是亟待解决的事项。
读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用

对于0基础小白入门:

如果你是零基础小白,想快速入门大模型是可以考虑的。

一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型!

😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓
在这里插入图片描述

👉AI大模型学习路线汇总👈

大模型学习路线图,整体分为7个大的阶段:(全套教程文末领取哈)

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

👉大模型实战案例👈

光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

在这里插入图片描述

👉大模型视频和PDF合集👈

观看零基础学习书籍和视频,看书籍和视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
在这里插入图片描述
在这里插入图片描述

👉学会后的收获:👈

• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

👉获取方式:

😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓
在这里插入图片描述

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐