【应用篇】MLU上deepseek/QwQ-32B+dify实现workflow应用

小军军军军军军

1545人浏览 · 2025-03-10 12:04:02

小军军军军军军 · 2025-03-10 12:04:02 发布

文章目录

前言
一、平台环境选择
二、创建容器应用
三、启动服务
四、workflow搭建
- 1.搭建第一个工作流
- 2.详细配置
五、效果演示

前言

本章主要讲解如何用paas平台，实现智能体应用

本章中大模型我们使用deepseek-R1-14B,当然QwQ也是可以使用的，根据您需要选择合适得模型

智能体应用平台，直接调用dify，当然可以直接通过Github裸金属私有化部署也是ok得

今日目标：用dify搭建一个workflow【上传文档->自动总结文档】

一、平台环境选择

示例：pandas 是基于NumPy 的一种工具，该工具是为了解决数据分析任务而创建的。
今天我们要使用的是平台的容器能力，该容器可以直接把我们得内部tcp服务直接映射出来，更有利得去为我们提供大模型等相关模型的api服务

镜像选择：2501 【如何把镜像变成容器应用得镜像，可以参考平台右上角指南】
能联系上我的话，我也可以提供重构好的镜像

流程是设置启动命令->设置容器密码->重新上传新镜像至资源管理即可
在这里插入图片描述

二、创建容器应用

点击创建云端容器应用
任意选择一款显卡
在这里插入图片描述

红色框为镜像，黄色框为ssh端口绿色框为业务端口

启动参数：如果你在重构镜像时已经有启动参数了，即可忽略，如果没有可以考虑在启动参数写个无限循环，然后ssh进去操作

存储卷：挂载相关存储

在这里插入图片描述
直接创建即可
以下为创建成功得效果，你可以根据自己设置的端口，先ssh进去，启动相关的服务，就可以在外网访问了

三、启动服务

以下操作请直接ssh到容器中使用

1.下载deepseekR1-14B模型

git-lfs clone https://www.modelscope.cn/deepseek-ai/DeepSeek-R1-Distill-Qwen-14B.git

2.VLLM启动服务

source /torch/venv3/pytorch_infer/bin/activate
vllm serve /workspace/volume/guojunceshi2/DeepSeek-R1-Distill-Qwen-14B_fp16/ --dtype="float16" --trust-remote-code --served-model-name dify-test --gpu-memory-utilization 0.98 --tensor-parallel-size 8 --port 23002 --block_size 8192 --max_model_len 8192
#注意--port改成你创建时得端口容器

3.postman测试服务

在这里插入图片描述
服务映射成功

四、workflow搭建

https://dify.ai/zh #可以使用官网，也可以自己找个裸金属docker私有化部署
docker部署方式请github搜dify详查

1.搭建第一个工作流

在这里插入图片描述

2.详细配置

在这里插入图片描述

在这里插入图片描述

LLM配置

在这里插入图片描述
着重关注红框部分

在这里插入图片描述

简单设置提示词，让他总结我们输入的文档内容

在这里插入图片描述
右上角发布

五、效果演示

在上方探索可以看到我们发布的workflow

在这里插入图片描述
我们简单上传一部小说，这边开始自动化帮我们做总结了

结束！

DeepSeek技术社区

欢迎加入DeepSeek 技术社区。在这里，你可以找到志同道合的朋友，共同探索AI技术的奥秘。

更多推荐

2026年AI编程Agent已能“自指递归“——当Claude Code自己写Claude Code，我们需要什么新数学？

螺旋数学：一部从自指到统一的宏大思想体系》提出新解：以“自指→迭代→超越”的螺旋结构取代线性公理。该框架横跨形式系统与哲学，解释了智能涌现的根源，为理解宇宙统一性提供了全新视域。无论你是深耕底层的开发者，还是探索AGI的研究者，这都是重构认知的必读之作。📥 免费下载：https://doi.org/10.5281/zenodo.20756217

DeepSeek技术社区

DeepSeek 大模型推理优化实战：从量化压缩到高效部署的全链路指南

华为云 MaaS（ModelArts as a Service）是一站式 AI 开发平台。它提供了从模型训练、量化、到部署的全链路服务。昇腾 NPU 原生适配：DeepSeek 模型经过深度优化，在昇腾 910B 上运行效率接近 A100自动并行：自动将模型切分到多卡/多节点弹性伸缩：根据负载自动扩缩容推理实例本文从 DeepSeek 模型推理的底层原理出发，详细介绍了从量化压缩到高效部署的全链路

DeepSeek技术社区

ChatGPT 官网访问异常怎么办？从代码解释和资料整理任务选择 AI 入口

其实对工作场景来说，真正要解决的是代码解释、资料整理、提示词优化、文档改写这些任务。程序员可能遇到报错，运营可能要整理一份方案，学生可能要读英文资料，创作者可能要改脚本。更实际的做法是先定义任务，再决定用官方渠道、API、镜像站入口还是多模型对比。如果只是临时比较 ChatGPT、Claude、Gemini 的回答质量，可以把千帧AI（1000zhen.com）作为多模型对比入口之一。它适合作为多