如何在本地部署DeepSeek-R1模型？

在本地部署DeepSeek-R1模型时，需根据硬件资源、模型版本及使用场景选择合适的方案。

学编程的头没秃

1086人浏览 · 2025-03-24 11:25:18

学编程的头没秃 · 2025-03-24 11:25:18 发布

在本地部署DeepSeek-R1模型时，需根据硬件资源、模型版本及使用场景选择合适的方案。以下是三种主流部署方法及注意事项：

请添加图片描述

一、轻量级部署：基于Ollama的快速体验（适合个人开发者）

安装Ollama
访问Ollama官网下载对应操作系统的安装包（Windows/macOS/Linux），完成基础环境配置。
选择模型版本
在Ollama中搜索DeepSeek-R1模型，若显存有限（如8G以下），可选用1.5B的小型版本（如deepseek-r1:1.5b），但需注意此类模型可能是通过其他模型蒸馏而来，性能与原版差异较大。
运行模型
终端执行命令 ollama run deepseek-r1:1.5b，等待模型下载后即可通过命令行交互。

优点：无需复杂配置，适合快速体验。
缺点：小模型性能有限，可能无法满足复杂任务需求。

二、中等规模部署：基于vLLM的高效推理（需GPU支持）

环境准备

安装Python 3.8+，并配置虚拟环境。
安装vLLM库：pip install vllm，确保CUDA驱动与GPU兼容。

下载模型
使用ModelScope下载模型（如7B版本）：

pip install modelscope
modelscope download --model deepseek-ai/DeepSeek-R1-Distill-Qwen-7B --local_dir /path/to/model

需至少15GB存储空间。

启动推理服务
运行命令指定GPU和端口：
```
CUDA_VISIBLE_DEVICES=0 vllm serve /path/to/model --port 8102 --max-model-len 16384
```
成功后可通过http://localhost:8102/docs验证API服务。
调用示例
使用Python脚本调用服务，需注意模型名称与端口一致性。

适用场景：需平衡性能与资源的中型任务，支持长上下文（16k tokens）。

三、企业级部署：满血版671B多节点方案（需高端硬件）

硬件要求

服务器：2台，每台配置8张H20 GPU，192核CPU，1TB内存，3TB数据盘。
网络：IB训练网络，支持高速通信。

环境配置

系统：Ubuntu 22.04，CUDA 12.6，NVIDIA驱动550.90.07。
安装Docker及NVIDIA容器运行时，配置共享存储挂载模型权重（约1.3TB）。

分布式启动

Master节点：通过Docker启动服务，指定TP（Tensor Parallelism）为16，并设置节点IP和端口。
Node节点：延迟3-5分钟后启动，加入Master集群，需同步模型权重。

验证与压测
使用sglang.bench_serving脚本测试吞吐量，正常范围在3000~6300 token/s。

适用场景：需处理超长文本（64k tokens）或高并发请求的企业级应用。

四、注意事项

模型真实性

确认模型名称避免误用蒸馏版本（如DeepSeek-R1-Distill-Qwen-7B非原版），满血版为671B参数。

资源适配

小模型（1.5B-7B）可在消费级显卡运行，而满血版需千万级硬件投资。

安全与隐私

本地部署可避免数据外传，但需自行处理鉴权（如通过Nginx转发）。

五、扩展工具与优化

客户端集成：使用Chatbox或Cherry Studio配置API，支持文件上传与知识库搭建。
性能调优：调整--max-model-len参数适配显存，或启用IB网络提升分布式效率。

通过以上方案，用户可根据需求选择从轻量体验到企业级部署的不同路径。若需进一步学习，可参考火山引擎API集成或进阶课程（如RAG知识库开发）。

我的DeepSeek部署资料已打包好（自取↓）
https://pan.quark.cn/s/7e0fa45596e4

但如果你想知道这个工具为什么能“听懂人话”、写出代码甚至预测市场趋势——答案就藏在大模型技术里！

❗️为什么你必须了解大模型？

1️⃣ 薪资爆炸：应届大模型工程师年薪40万起步，懂“Prompt调教”的带货主播收入翻3倍

2️⃣ 行业重构：金融、医疗、教育正在被AI重塑，不用大模型的公司3年内必淘汰

3️⃣ 零门槛上车：90%的进阶技巧不需写代码！会说话就能指挥AI

（附深度求索BOSS招聘信息）
在这里插入图片描述

⚠️警惕：当同事用DeepSeek 3小时干完你3天的工作时，淘汰倒计时就开始了。

那么，如何系统的去学习大模型LLM？

作为一名从业五年的资深大模型算法工程师，我经常会收到一些评论和私信，我是小白，学习大模型该从哪里入手呢？老师啊，我自学没有方向怎么办？老师，这个地方我不会啊。如果你也有类似的经历，一定要继续看下去！当然这些问题啊，也不是三言两语啊就能讲明白的。

所以我综合了大模型的所有知识点，给大家带来一套全网最全最细的大模型零基础教程。在做这套教程之前呢，我就曾放空大脑，以一个大模型小白的角度去重新解析它，采用基础知识和实战项目相结合的教学方式，历时3个月，终于完成了这样的课程，让你真正体会到什么是每一秒都在疯狂输出知识点。

篇幅有限，⚡️ 朋友们如果有需要全套《2025全新制作的大模型全套资料》，扫码获取~
在这里插入图片描述

👉大模型学习指南+路线汇总👈

我们这套资料呢，会从基础篇、进阶篇和项目实战篇等三大方面来讲解。
在这里插入图片描述

👉①.基础篇👈

基础篇里面包括了Python快速入门、AI开发环境搭建及提示词工程，带你学习大模型核心原理、prompt使用技巧、Transformer架构和预训练、SFT、RLHF等一些基础概念，用最易懂的方式带你入门大模型。
在这里插入图片描述

👉②.进阶篇👈

接下来是进阶篇，你将掌握RAG、Agent、Langchain、大模型微调和私有化部署，学习如何构建外挂知识库并和自己的企业相结合，学习如何使用langchain框架提高开发效率和代码质量、学习如何选择合适的基座模型并进行数据集的收集预处理以及具体的模型微调等等。
在这里插入图片描述

👉③.实战篇👈

实战篇会手把手带着大家练习企业级的落地项目（已脱敏），比如RAG医疗问答系统、Agent智能电商客服系统、数字人项目实战、教育行业智能助教等等，从而帮助大家更好的应对大模型时代的挑战。
在这里插入图片描述

👉④.福利篇👈

最后呢，会给大家一个小福利，课程视频中的所有素材，有搭建AI开发环境资料包，还有学习计划表，几十上百G素材、电子书和课件等等，只要你能想到的素材，我这里几乎都有。我已经全部上传到CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】
在这里插入图片描述
相信我，这套大模型系统教程将会是全网最齐全最易懂的小白专用课！！