前言

DeepSeek-R1 是深度求索(DeepSeek)发布的推理增强型大语言模型,在多项基准测试中表现优异。本文记录在 Windows 系统、无 GPU 环境下,通过 Ollama 框架完成本地部署的完整流程。

本文适合:

  • 想在本地运行 LLM 但没有 GPU 的用户
  • 对本地 AI 部署感兴趣的初学者
  • 有隐私保护需求、不想使用云端 API 的用户

目录


环境说明

项目 配置
操作系统 Windows 10/11
CPU Intel i5(无独立显卡)
内存 8GB 及以上
硬盘空闲 10GB 以上
GPU 无(纯 CPU 推理)

注意:无 GPU 情况下可以正常运行,但推理速度较慢(约 1-5 tokens/s)。有 NVIDIA GPU 的用户 Ollama 会自动调用 CUDA 加速。


什么是 Ollama

Ollama 是一个开源的本地 LLM 运行框架,主要特点:

  • 支持 macOS、Windows、Linux
  • 提供统一的模型管理接口(类似 Docker 的镜像管理概念)
  • 内置 REST API(默认监听 localhost:11434),可与第三方工具集成
  • 模型仓库包含 DeepSeek、Llama、Qwen、Gemma 等主流开源模型

安装 Ollama

下载安装包

访问官网:Ollama

点击首页 Download 按钮,选择 Windows 版本下载 .exe 安装包。

执行安装

双击安装包,按提示完成安装(默认配置即可,无需修改路径)。

验证安装

打开 PowerShell(Win + R → 输入 powershell),执行:

powershell

复制

ollama --version

预期输出:

ollama version 0.x.x

若显示版本号,说明安装成功,Ollama 服务已在后台运行。


拉取 DeepSeek-R1 模型

模型版本对比

DeepSeek-R1 提供多种参数规格,根据硬件选择合适版本:

模型标签 参数量 模型大小 推荐内存 适用场景
deepseek-r1:1.5b 1.5B ~1GB 4GB 极低配置
deepseek-r1:7b 7B ~4GB 8GB 日常使用
deepseek-r1:8b 8B ~4.7GB 8GB 推荐
deepseek-r1:14b 14B ~8GB 16GB 较强推理
deepseek-r1:32b 32B ~19GB 32GB 高性能需求

执行拉取命令

powershell

复制

ollama pull deepseek-r1:8b

下载过程输出示例:

pulling manifest
pulling aabd4debf0c8... 100% ▕████████████████▏ 4.7 GB
pulling 369ca498f347... 100% ▕████████████████▏ 387 B
verifying sha256 digest
writing manifest
success

下载完成后模型文件默认存储在 C:\Users\<用户名>\.ollama\models\ 目录下。


运行与测试

启动交互式对话

powershell

复制

ollama run deepseek-r1:8b

输出:

>>> Send a message (/? for help)

在提示符后输入问题即可开始对话。

测试示例

>>> 用Python写一个计算斐波那契数列的函数

退出对话

在对话中输入 /bye 或按 Ctrl+D 退出。

API 调用(可选)

Ollama 默认提供 REST API,可通过以下方式调用:

powershell

复制

curl http://localhost:11434/api/generate -d '{
  "model": "deepseek-r1:8b",
  "prompt": "Hello, who are you?",
  "stream": false
}'

常见问题 FAQ

Q:下载完成后是否需要持续联网?

A:不需要。模型文件已下载到本地,推理过程完全离线运行。

Q:CPU 推理速度如何提升?

A:可以尝试使用更小的模型(如 deepseek-r1:1.5b 或 deepseek-r1:7b),或升级内存。有条件的话配置一块 NVIDIA 显卡效果最明显。

Q:如何列出已安装的模型?

powershell

复制

ollama list

Q:如何删除不用的模型释放硬盘空间?

powershell

复制

ollama rm deepseek-r1:8b

Q:Ollama 占用了哪个端口?

A:默认占用 11434 端口,可通过 OLLAMA_HOST 环境变量修改。


扩展:配置 Web UI

命令行交互对部分用户不够友好,推荐配合以下工具使用:

方案一:Page Assist(浏览器插件)

支持 Chrome/Firefox,安装后直接在浏览器侧边栏与本地模型对话,无需额外配置。

方案二:Open WebUI(本地 Web 服务)

功能更完整的 Web 界面,支持对话历史管理、多模型切换、RAG 知识库等高级功能。

部署命令(需要 Docker):

bash

复制

docker run -d -p 3000:8080 \
  --add-host=host.docker.internal:host-gateway \
  -v open-webui:/app/backend/data \
  ghcr.io/open-webui/open-webui:main

总结

步骤 命令
安装 Ollama 官网下载 Windows 安装包
拉取模型 ollama pull deepseek-r1:8b
启动对话 ollama run deepseek-r1:8b
查看已有模型 ollama list
删除模型 ollama rm <模型名>
API 端口 localhost:11434

本地部署 DeepSeek-R1 的核心优势:零成本、无隐私风险、无次数限制。对于没有 GPU 的用户,8b 模型是日常使用的最优选择。


如果本文对你有帮助,欢迎点赞收藏。 有问题欢迎在评论区交流,我会认真回复。

TagsDeepSeek Ollama 本地部署 大语言模型 LLM AI Windows CPU推理

 

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐