本地部署 DeepSeek-R1:基于 Ollama 的完整安装教程(Windows)
前言
DeepSeek-R1 是深度求索(DeepSeek)发布的推理增强型大语言模型,在多项基准测试中表现优异。本文记录在 Windows 系统、无 GPU 环境下,通过 Ollama 框架完成本地部署的完整流程。
本文适合:
- 想在本地运行 LLM 但没有 GPU 的用户
- 对本地 AI 部署感兴趣的初学者
- 有隐私保护需求、不想使用云端 API 的用户
目录
环境说明
| 项目 | 配置 |
|---|---|
| 操作系统 | Windows 10/11 |
| CPU | Intel i5(无独立显卡) |
| 内存 | 8GB 及以上 |
| 硬盘空闲 | 10GB 以上 |
| GPU | 无(纯 CPU 推理) |
注意:无 GPU 情况下可以正常运行,但推理速度较慢(约 1-5 tokens/s)。有 NVIDIA GPU 的用户 Ollama 会自动调用 CUDA 加速。
什么是 Ollama
Ollama 是一个开源的本地 LLM 运行框架,主要特点:
- 支持 macOS、Windows、Linux
- 提供统一的模型管理接口(类似 Docker 的镜像管理概念)
- 内置 REST API(默认监听
localhost:11434),可与第三方工具集成 - 模型仓库包含 DeepSeek、Llama、Qwen、Gemma 等主流开源模型
安装 Ollama
下载安装包
访问官网:Ollama
点击首页 Download 按钮,选择 Windows 版本下载 .exe 安装包。
执行安装
双击安装包,按提示完成安装(默认配置即可,无需修改路径)。
验证安装
打开 PowerShell(Win + R → 输入 powershell),执行:
powershell
复制
ollama --version
预期输出:
ollama version 0.x.x
若显示版本号,说明安装成功,Ollama 服务已在后台运行。
拉取 DeepSeek-R1 模型
模型版本对比
DeepSeek-R1 提供多种参数规格,根据硬件选择合适版本:
| 模型标签 | 参数量 | 模型大小 | 推荐内存 | 适用场景 |
|---|---|---|---|---|
deepseek-r1:1.5b |
1.5B | ~1GB | 4GB | 极低配置 |
deepseek-r1:7b |
7B | ~4GB | 8GB | 日常使用 |
deepseek-r1:8b |
8B | ~4.7GB | 8GB | 推荐 |
deepseek-r1:14b |
14B | ~8GB | 16GB | 较强推理 |
deepseek-r1:32b |
32B | ~19GB | 32GB | 高性能需求 |
执行拉取命令
powershell
复制
ollama pull deepseek-r1:8b
下载过程输出示例:
pulling manifest
pulling aabd4debf0c8... 100% ▕████████████████▏ 4.7 GB
pulling 369ca498f347... 100% ▕████████████████▏ 387 B
verifying sha256 digest
writing manifest
success
下载完成后模型文件默认存储在 C:\Users\<用户名>\.ollama\models\ 目录下。
运行与测试
启动交互式对话
powershell
复制
ollama run deepseek-r1:8b
输出:
>>> Send a message (/? for help)
在提示符后输入问题即可开始对话。
测试示例
>>> 用Python写一个计算斐波那契数列的函数
退出对话
在对话中输入 /bye 或按 Ctrl+D 退出。
API 调用(可选)
Ollama 默认提供 REST API,可通过以下方式调用:
powershell
复制
curl http://localhost:11434/api/generate -d '{
"model": "deepseek-r1:8b",
"prompt": "Hello, who are you?",
"stream": false
}'
常见问题 FAQ
Q:下载完成后是否需要持续联网?
A:不需要。模型文件已下载到本地,推理过程完全离线运行。
Q:CPU 推理速度如何提升?
A:可以尝试使用更小的模型(如 deepseek-r1:1.5b 或 deepseek-r1:7b),或升级内存。有条件的话配置一块 NVIDIA 显卡效果最明显。
Q:如何列出已安装的模型?
powershell
复制
ollama list
Q:如何删除不用的模型释放硬盘空间?
powershell
复制
ollama rm deepseek-r1:8b
Q:Ollama 占用了哪个端口?
A:默认占用 11434 端口,可通过 OLLAMA_HOST 环境变量修改。
扩展:配置 Web UI
命令行交互对部分用户不够友好,推荐配合以下工具使用:
方案一:Page Assist(浏览器插件)
支持 Chrome/Firefox,安装后直接在浏览器侧边栏与本地模型对话,无需额外配置。
方案二:Open WebUI(本地 Web 服务)
功能更完整的 Web 界面,支持对话历史管理、多模型切换、RAG 知识库等高级功能。
部署命令(需要 Docker):
bash
复制
docker run -d -p 3000:8080 \
--add-host=host.docker.internal:host-gateway \
-v open-webui:/app/backend/data \
ghcr.io/open-webui/open-webui:main
总结
| 步骤 | 命令 |
|---|---|
| 安装 Ollama | 官网下载 Windows 安装包 |
| 拉取模型 | ollama pull deepseek-r1:8b |
| 启动对话 | ollama run deepseek-r1:8b |
| 查看已有模型 | ollama list |
| 删除模型 | ollama rm <模型名> |
| API 端口 | localhost:11434 |
本地部署 DeepSeek-R1 的核心优势:零成本、无隐私风险、无次数限制。对于没有 GPU 的用户,8b 模型是日常使用的最优选择。
如果本文对你有帮助,欢迎点赞收藏。 有问题欢迎在评论区交流,我会认真回复。
Tags:DeepSeek Ollama 本地部署 大语言模型 LLM AI Windows CPU推理
更多推荐



所有评论(0)