DeepSeek 全面部署指南

在 Windows 环境下，通过 WSL2 提供 Linux 子系统，再利用 Ollama Windows Installer 部署 DeepSeek-R1 模型，整体流程简单高效。优点包括：易于安装与升级：通过官方安装包直接安装 Ollama，无需手动编译配置。多种运行模式支持：支持纯 CPU、量化模型以及 GPU 加速，灵活应对不同硬件条件。远程服务配置简单：可通过 systemd 配置环境变

jamison_1

1050人浏览 · 2025-03-26 10:30:30

jamison_1 · 2025-03-26 10:30:30 发布

本文旨在为有需求的用户提供一份详细的 DeepSeek 部署说明，涵盖两大主要部署方式：

第一部分：总体部署前提与硬件要求

1.1 操作系统要求

2.1 前置条件安装

2.1.1 Windows 系统与 WSL2 安装

2.1.2 安装 Ollama Windows Installer

2.2 配置远程 Ollama 服务

2.3 拉取并运行 DeepSeek-R1 模型

第三部分：方法二 —— Linux/容器化环境下的传统部署

3.1 环境准备

3.1.1 操作系统与更新

3.1.2 安装 NVIDIA 驱动与 CUDA/cuDNN（仅 GPU 需求）

4.1 Windows + WSL2 部署推荐配置

Windows + WSL2 与 Ollama 部署优点

Linux/容器化部署优点

本文旨在为有需求的用户提供一份详细的 DeepSeek 部署说明，涵盖两大主要部署方式：

Windows 系统下使用 WSL2 与 Ollama 部署 DeepSeek-R1 模型
Linux/容器化环境下的传统部署

在部署过程中，将详细介绍系统前置要求、硬件推荐、环境配置、依赖安装、模型拉取与运行、各类配置优化、故障排查及安全措施等，确保你能按照本指南顺利在本地部署 DeepSeek，并根据实际需求进行性能调整与扩展。以下内容均基于官方文档、社区分享及实际生产环境最佳实践整理，不含假设性描述，所有配置均为实际可执行步骤。

第一部分：总体部署前提与硬件要求

1.1 操作系统要求

Windows 部署方案：
- 系统要求：Windows 10/11 64位
- 必须安装 WSL2（推荐使用 Ubuntu 发行版作为 WSL2 的子系统）
- 安装 Ollama Windows Installer（从官方渠道下载最新版安装包）
Linux/容器化部署方案：
- 系统要求：Ubuntu 20.04 LTS 或 22.04 LTS（生产环境建议使用服务器版）
- 其他 Linux 发行版亦可使用，但官方测试与文档主要以 Ubuntu 为主

1.2 硬件配置推荐

为了确保 DeepSeek 在高并发、大数据量任务下稳定高效运行，硬件配置建议如下：

CPU：

Windows 部署：
- 推荐至少 8 核 CPU，例如 Intel Core i7 或 AMD Ryzen 7 系列，若条件允许建议 16 核（或更高），以便在 WSL2 下运行 Linux 子系统时获得更高计算性能。
Linux 部署：
- 建议使用服务器级 CPU，如 Intel Xeon 或 AMD EPYC，至少 8 核（推荐 16 核），有助于大规模并行计算和多任务处理。

内存：

Windows 部署：
- 至少 16GB 内存，但实际推荐 32GB 及以上，以便 WSL2 内运行的 Ubuntu 子系统能稳定运行深度学习任务。
Linux 部署：
- 推荐内存 32GB 或更高，特别是在需要加载大规模模型（例如 33B 参数模型）的场景下，确保充足的内存可以避免因内存不足导致的性能瓶颈。

GPU：

Windows 部署：
- 建议使用 NVIDIA 显卡，最低要求 RTX 3060 及以上，显存 8GB 或更高。如果需要运行高参数版本（如 33B 模型），建议使用 RTX 3080、RTX 3090 或专业级 GPU。
Linux 部署：
- 同样建议使用 NVIDIA GPU，支持 CUDA 11.x 及以上版本；对于高性能需求，推荐使用 RTX 3080、RTX 3090 或 Tesla 系列。
- 注意：在 Windows 方案中，WSL2 已支持 GPU 加速，但需确保 Windows 驱动、WSL2 更新和 NVIDIA 驱动版本与 CUDA/cuDNN 版本相匹配。

存储：

所有方案：
- 使用 SSD 硬盘，推荐 NVMe SSD 至少 512GB，用于存放操作系统、依赖、模型文件及数据集，确保数据读写速度足够快。
- 部署环境中应单独设置数据盘，以便进行日志记录、备份及模型版本控制。

网络：

所有方案：
- 千兆网卡及稳定的网络环境，确保依赖包和模型数据的快速下载，同时便于系统远程管理和更新。

第二部分：方法一 —— Windows 系统下使用 WSL2 与 Ollama 部署 DeepSeek-R1

在 Windows 环境中，利用 WSL2 可以获得类似 Linux 的开发环境，而 Ollama Windows Installer 提供了一种简单快捷的方式来部署 DeepSeek-R1 模型。以下为详细步骤。

2.1 前置条件安装

2.1.1 Windows 系统与 WSL2 安装

确保 Windows 10/11 为 64 位版本：
请在“系统信息”中确认 Windows 版本及体系结构。
安装 WSL2：
- 打开 PowerShell（管理员权限），执行以下命令：
```
powershell
```
  wsl --install
- 系统会自动安装 WSL2 和默认的 Linux 发行版（通常为 Ubuntu）。
- 安装完成后，重启电脑，并根据提示完成 Ubuntu 的初始设置（设置用户名、密码等）。

2.1.2 安装 Ollama Windows Installer

下载 Ollama Windows Installer：
访问官方页面（请参照官方文档链接），下载最新版 Ollama Windows Installer 安装包。
运行安装程序：
双击下载的安装包，根据提示完成安装。安装过程中无需特殊配置，按照默认选项即可。
验证安装：
- 打开 WSL2 内的 Ubuntu 终端，执行以下命令：
  
  ollama list
- 如果看到类似以下输出，表明 Ollama 安装成功：
```
markdown
```
  NAME VERSION ---------------------- (已安装模型列表)

2.2 配置远程 Ollama 服务

默认情况下，Ollama 服务仅在本地运行。如果需要使 Ollama 服务对外开放，可按照以下步骤进行配置：

设置环境变量（针对 systemd 服务）：
- 在 WSL2 内部，通过命令编辑 systemd 服务配置文件：
  
  sudo systemctl edit ollama.service
- 编辑器中，在 [Service] 部分添加如下内容：
  
  [Service] Environment="OLLAMA_HOST=0.0.0.0" Environment="OLLAMA_ORIGINS=*"
- 保存并退出编辑器。
重新加载 systemd 并重启 Ollama 服务：

sudo systemctl daemon-reload sudo systemctl restart ollama
验证配置：
使用 ollama list 或访问已开放的服务端口，确认外部设备可以访问该服务（注意防火墙设置）。

2.3 拉取并运行 DeepSeek-R1 模型

2.3.1 拉取模型

拉取官方推荐模型：

ollama pull deepseek-r1
- 若需求为基础版（7B参数）：
  
  ollama pull deepseek-r1:7b
- 若需求为进阶版（33B参数，需更高显存）：
  
  ollama pull deepseek-r1:33b
等待下载与解压完成：
下载速度依赖网络环境和模型大小，通常 7B 模型较小，33B 模型则需较长时间。下载完成后，命令行会提示成功。

2.3.2 运行模型

直接运行模型：

ollama run deepseek-r1
测试交互：
- 在命令行中输入示例指令，例如：
  
  你好，请用中文回答你好！
- 预期返回类似：
  
  我是 DeepSeek-R1，很高兴为您提供帮助！

2.4 不同硬件场景的配置说明

根据硬件资源和实际需求，DeepSeek 可在纯 CPU 或 CPU+GPU 环境下运行，具体配置如下：

2.4.1 纯 CPU 运行

适用于无独立显卡或显存不足的环境。

限制线程数：
为避免资源耗尽，可限制 CPU 线程数，例如：

OLLAMA_NUM_THREADS=4 ollama run deepseek-r1

此命令限制使用 4 个线程。
使用量化模型：
为降低内存占用，可以使用 4-bit 量化模型：

ollama pull deepseek-r1:7b-q4_0

注意量化模型的精度可能略有下降，但能显著降低内存要求。
内存要求：
- 对于 7B 参数模型：建议至少 8GB 空闲内存；
- 对于 33B 参数模型：建议至少 32GB 空闲内存。

2.4.2 CPU+GPU 混合运行

适用于有 NVIDIA 显卡且希望利用 GPU 加速的环境。

安装 NVIDIA 驱动及 CUDA Toolkit：
- 在 Windows 环境下，确保 GPU 驱动与 CUDA 工具包已正确安装，并且 WSL2 已支持 GPU 加速（WSL2 版本更新中已逐步完善）。
启用 GPU 加速：

ollama run deepseek-r1 --gpu

此命令强制使用 GPU 进行计算。
显存要求：
- 对于 7B 模型：建议至少 6GB 显存；
- 对于 33B 模型：建议至少 20GB 显存。
性能监控：使用以下命令查看 GPU 利用率：

nvidia-smi

通过监控 GPU 占用率，及时调整模型运行参数或硬件负载。

2.5 Windows 部署总结

在 Windows 环境下，通过 WSL2 提供 Linux 子系统，再利用 Ollama Windows Installer 部署 DeepSeek-R1 模型，整体流程简单高效。优点包括：

易于安装与升级：通过官方安装包直接安装 Ollama，无需手动编译配置。
多种运行模式支持：支持纯 CPU、量化模型以及 GPU 加速，灵活应对不同硬件条件。
远程服务配置简单：可通过 systemd 配置环境变量对外开放服务，便于远程访问与管理。

第三部分：方法二 —— Linux/容器化环境下的传统部署

针对企业级服务器、开发者工作站或云平台，Linux 环境下的部署方式更为灵活，便于集成自动化运维工具和容器编排系统。以下详细介绍传统部署步骤及 Docker 部署方式。

3.1 环境准备

3.1.1 操作系统与更新

选择 Ubuntu 20.04 LTS 或 22.04 LTS（建议使用服务器版）
更新系统：

sudo apt update && sudo apt upgrade -y

3.1.2 安装 NVIDIA 驱动与 CUDA/cuDNN（仅 GPU 需求）

安装 NVIDIA 驱动：
- 使用以下命令自动检测推荐驱动：
  
  ubuntu-drivers devices
- 安装推荐驱动（例如 nvidia-driver-460）：
  
  sudo apt install nvidia-driver-460 sudo reboot
安装 CUDA 工具包：
- 前往 NVIDIA CUDA 下载页面选择适用于 Ubuntu 的版本，按官方说明下载安装。
安装 cuDNN：
- 下载与所安装 CUDA 版本匹配的 cuDNN 库，并按照说明将文件复制到 /usr/local/cuda/ 中，配置相应环境变量：
  
  export CUDA_HOME=/usr/local/cuda export LD_LIBRARY_PATH=$CUDA_HOME/lib64:$LD_LIBRARY_PATH

3.1.3 配置 Python 环境

安装 Conda（或 Miniconda）：
前往 Conda 官网下载安装包并安装。
创建虚拟环境：

conda create -n deepseek_env python=3.8 conda activate deepseek_env

或使用 virtualenv：

python3 -m venv deepseek_env source deepseek_env/bin/activate

3.2 获取 DeepSeek 源代码

克隆官方 Git 仓库：

git clone https://github.com/deepseek-ai/deepseek.git cd deepseek

请确保使用官方提供的仓库 URL，获取最新稳定版本。
检查代码结构：
仔细阅读 README、CHANGELOG 与官方文档，确保理解各目录含义及配置说明。

3.3 安装依赖

升级 pip 并安装依赖：

pip install --upgrade pip pip install -r requirements.txt
确保深度学习框架版本：
如果使用 GPU 加速，需安装支持 CUDA 的 PyTorch/TensorFlow 版本。参照官方文档确认推荐版本号，例如：

pip install torch==1.11.0+cu113 -f https://download.pytorch.org/whl/torch_stable.html

3.4 配置 DeepSeek

3.4.1 配置文件设置

DeepSeek 采用配置文件（如 config.yaml）管理各项参数。创建并编辑 config.yaml（示例如下）：

# config.yaml model: path: "/absolute/path/to/deepseek_model.bin" # 请使用实际路径，确保文件存在 device: "cuda" # 使用 GPU 时设置为 "cuda"，否则设置为 "cpu" server: host: "0.0.0.0" # 允许外部访问 port: 8000 # 服务端口 logging: level: "INFO" # 日志级别，可选 DEBUG、INFO、WARNING 等

确保文件路径、端口及其他参数均根据实际部署环境做出调整。

3.4.2 环境变量配置

为了保证 CUDA 与其他依赖库正确加载，可在 ~/.bashrc 或 /etc/profile 中添加：

export CUDA_HOME=/usr/local/cuda export PATH=$CUDA_HOME/bin:$PATH export LD_LIBRARY_PATH=$CUDA_HOME/lib64:$LD_LIBRARY_PATH

保存后执行 source ~/.bashrc 更新环境变量。

3.5 启动 DeepSeek 服务

3.5.1 直接运行

在项目根目录下执行：

python app.py --config config.yaml

启动后，服务将监听配置文件中指定的端口（例如 8000）。使用浏览器或 curl 测试接口：

curl -X POST http://localhost:8000/api/generate -d '{"prompt": "你好 DeepSeek"}' -H "Content-Type: application/json"