CentOS 部署 Ollama 运行 DeepSeek-R1:7B 完整实战教程（含避坑指南+离线方案）

CentOS服务器部署Ollama流程图+DeepSeek-R1:7B模型标识，背景为服务器命令行界面，突出“私有化部署”“极简操作”“全程可复制”核心亮点，适配CSDN技术教程封面尺寸。

空白ls

530人浏览 · 2026-04-15 23:19:58

空白ls · 2026-04-15 23:19:58 发布

CentOS 部署 Ollama 运行 DeepSeek-R1:7B 完整实战教程（含避坑指南+离线方案）

一、部署前提（硬件+系统要求）
二、CentOS 环境准备（必做步骤）
三、安装 Ollama（核心步骤）
四、拉取并运行 DeepSeek-R1:7B 模型
五、进阶配置（可选，按需操作）
六、总结与避坑汇总
- 核心总结
- 高频避坑点（必看）

标签：#CentOS #Ollama #DeepSeek-R1 #大模型部署 #私有化部署 #AI本地部署 #Linux运维 #避坑指南
前言：在CentOS系统上通过Ollama一键部署DeepSeek-R1:7B大模型，是本地私有化部署AI大模型的极简方案。本文从环境准备、Ollama安装、模型拉取、运行测试到优化配置，提供完整可复制的命令与步骤，补充每个环节的注意点、常见错误解决方法及所有下载资源的离线备用方案，适配网络不可用、镜像源失效场景，新手也能快速上手，直接照搬即可完成部署。

一、部署前提（硬件+系统要求）

1.1 硬件要求（DeepSeek-R1:7B 专属）

最低配置：CPU 8核+、内存 16GB+、NVIDIA GPU 显存 8GB+（无GPU可CPU运行，仅适合测试，速度较慢）
推荐配置：CPU 12核+、内存 32GB+、NVIDIA RTX 3060Ti/3090/4060及以上（显存12GB+，运行流畅，支持多轮对话）
存储要求：SSD可用空间 20GB+（模型约4.7GB，预留缓存和临时文件空间，避免机械硬盘导致加载失败）

1.2 系统要求

系统版本：CentOS 7 / CentOS 8 / CentOS Stream 9（CentOS 6不支持，需升级）
权限要求：需root或sudo权限（所有命令建议用root执行，避免权限不足）
网络要求：可访问外网（拉取安装包和模型，内网环境需配置代理或用离线方案）
补充：CentOS 7需确保内核版本≥3.10（通过uname -r查看，低于则升级内核）

1.3 核心注意点（提前避坑）

禁止用机械硬盘存储模型，会导致加载极慢甚至失败，优先使用SSD；
CPU运行仅适合简单测试，复杂场景（代码生成、长文本摘要）需GPU支持；
全程建议用root用户操作，避免频繁出现Permission denied错误；
若网络不稳定，提前准备离线资源（下文每个步骤均提供离线方案）。

二、CentOS 环境准备（必做步骤）

2.1 系统更新与依赖安装

先更新系统包、安装必备依赖和工具，为后续部署打好基础，所有命令可直接复制执行。

# 1. 更新系统包（确保依赖版本兼容，按回车确认即可）
sudo yum update -y

# 2. 安装 EPEL 源（必备，解决部分依赖缺失问题）
sudo yum install -y epel-release

# 3. 安装基础工具（curl、git等，用于后续安装和验证）
sudo yum install -y curl git wget pciutils lshw net-tools

# 4. 安装开发工具（可选，解决部分编译依赖问题）
sudo yum groupinstall "Development Tools" -y

# 5. 安装 Python3（可选，用于后续模型调用脚本）
sudo yum install -y python3 python3-pip
python3 -m pip install --upgrade pip

2.2 常见错误及解决（环境准备阶段）

错误1：yum update提示“Could not retrieve mirrorlist”（镜像源无法访问）

# 在线方案（网络可用时，更换阿里云镜像）
# CentOS 7 更换镜像
wget -O /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-7.repo
# CentOS 8 更换镜像
wget -O /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-8.repo
# 清除缓存并更新
yum clean all && yum makecache

# 离线备用方案（网络不可用）
1. 另一台能联网的机器，下载对应系统的阿里云repo文件：
   CentOS 7：http://mirrors.aliyun.com/repo/Centos-7.repo
   CentOS 8：http://mirrors.aliyun.com/repo/Centos-8.repo
2. 通过U盘、FTP上传到目标服务器的 /etc/yum.repos.d/ 目录
3. 执行：yum clean all && yum makecache

错误2：安装EPEL源提示“no package epel-release available”

# 在线方案（网络可用时）
wget https://dl.fedoraproject.org/pub/epel/epel-release-latest-7.noarch.rpm
sudo rpm -ivh epel-release-latest-7.noarch.rpm

# 离线备用方案（网络不可用/源被拦截）
1. 另一台能联网的机器，下载EPEL源rpm包（CentOS 7为例）：
   官方地址：https://dl.fedoraproject.org/pub/epel/epel-release-latest-7.noarch.rpm
   备用镜像：https://mirrors.aliyun.com/epel/epel-release-latest-7.noarch.rpm（推荐）
2. 上传到目标服务器（如/root/目录）
3. 执行安装：sudo rpm -ivh /root/epel-release-latest-7.noarch.rpm
# CentOS 8 替换为：epel-release-latest-8.noarch.rpm，下载地址同上（替换7为8）

错误3：Python3安装失败，提示“没有可用软件包python3”

# 核心解决：先安装EPEL源，再执行安装命令
sudo yum install -y python3

# 离线备用方案（EPEL源安装失败时）
1. 另一台能联网的机器，通过阿里云镜像下载Python3及依赖包：
   地址：https://mirrors.aliyun.com/centos/7/os/x86_64/Packages/（搜索python3、python3-pip）
2. 批量下载后打包，上传到目标服务器
3. 批量安装：sudo rpm -ivh *.rpm
4. 升级pip：python3 -m pip install --upgrade pip（pip离线升级需单独下载pip离线包）

2.3 NVIDIA GPU驱动安装（有GPU必做，无GPU跳过）

Ollama默认支持NVIDIA GPU加速，需先安装对应驱动，否则无法调用GPU，只能用CPU运行。

# 1. 禁用nouveau驱动（与NVIDIA驱动冲突，必须禁用）
echo "blacklist nouveau" | sudo tee /etc/modprobe.d/blacklist-nouveau.conf
echo "options nouveau modeset=0" | sudo tee -a /etc/modprobe.d/blacklist-nouveau.conf
sudo dracut --force

# 2. 重启服务器（禁用生效，重启后无图形界面，属正常现象）
sudo reboot

# 3. 验证nouveau已禁用（无输出则成功）
lsmod | grep nouveau

# 4. 安装NVIDIA驱动（以535版本为例，适配主流显卡）
sudo yum install -y kernel-devel kernel-headers  # 内核开发包，必须与当前内核版本一致
# 在线方案（网络可用时）
wget https://us.download.nvidia.com/XFree86/Linux-x86_64/535.183.01/NVIDIA-Linux-x86_64-535.183.01.run
sudo chmod +x NVIDIA-Linux-x86_64-535.183.01.run
# 无图形界面安装，跳过检查
sudo ./NVIDIA-Linux-x86_64-535.183.01.run -no-x-check -no-nouveau-check -no-opengl-files

# 5. 验证驱动安装（显示显卡信息、驱动版本则成功）
nvidia-smi

GPU驱动安装注意点

驱动版本需与显卡型号匹配（NVIDIA官网查询对应驱动），避免过高/过低导致失败；
kernel-devel和kernel-headers版本必须与当前内核一致（uname -r查看内核版本）；
安装驱动提示“kernel module failed to build”，大概率是内核开发包版本不匹配，重新安装对应版本即可；
重启后黑屏无需担心，通过SSH连接服务器正常操作即可，Ollama无需图形界面。

GPU驱动常见错误及解决

# 错误1：nvidia-smi提示“command not found”（驱动安装失败）
1. 核对内核版本与kernel-devel版本：uname -r 与 rpm -qa | grep kernel-devel
2. 卸载驱动：sudo ./NVIDIA-Linux-x86_64-535.183.01.run --uninstall
3. 重新安装对应版本的kernel-devel和驱动

# 错误2：下载驱动超时、解析失败（在线源失效）
# 在线备用方案（换阿里云镜像）
wget https://mirrors.aliyun.com/nvidia-drivers/linux-x86_64/535.183.01/NVIDIA-Linux-x86_64-535.183.01.run
# 离线备用方案
1. 另一台能联网的机器，从阿里云镜像下载对应版本驱动：
   地址：https://mirrors.aliyun.com/nvidia-drivers/linux-x86_64/
2. 上传到目标服务器（如/root/目录）
3. 赋予权限并安装：
   sudo chmod +x /root/NVIDIA-Linux-x86_64-535.183.01.run
   sudo ./NVIDIA-Linux-x86_64-535.183.01.run -no-x-check -no-nouveau-check -no-opengl-files

2.4 关闭防火墙/开放端口（远程访问用，可选）

仅本地使用可跳过，需远程访问（局域网/公网）需开放Ollama默认端口11434，或临时关闭防火墙。

# 临时关闭防火墙（重启后失效，适合测试）
sudo systemctl stop firewalld

# 永久关闭（可选，注意服务器安全，仅局域网推荐）
sudo systemctl disable firewalld

# 推荐：仅开放11434端口（更安全）
sudo firewall-cmd --permanent --add-port=11434/tcp
sudo firewall-cmd --reload

三、安装 Ollama（核心步骤）

3.1 官方脚本一键安装（推荐，新手首选）

Ollama官方提供一键安装脚本，自动适配CentOS系统，无需手动配置依赖，全程无需干预。

# 在线方案（网络可用时）
curl -fsSL https://ollama.com/install.sh | sh

# 在线备用方案（官方源失效时）
curl -fsSL https://mirror.ghproxy.com/https://ollama.com/install.sh | sh

# 离线备用方案（网络不可用/所有在线源失效）
1. 另一台能联网的机器，下载Ollama安装脚本：
   官方地址：https://ollama.com/install.sh
   备用镜像：https://mirror.ghproxy.com/https://ollama.com/install.sh
2. 上传到目标服务器（如/root/目录）
3. 赋予权限并运行：
   sudo chmod +x /root/install.sh
   sudo /root/install.sh

3.2 手动安装（脚本失败时备用）

若一键脚本安装失败，可手动下载二进制包安装，步骤简单，适合排查问题。

# 1. 下载Ollama二进制包（x86_64架构，适配主流服务器）
# 在线方案（网络可用时）
wget https://ollama.com/download/ollama-linux-amd64.tgz

# 在线备用方案（官方源失效时）
wget https://mirror.ghproxy.com/https://ollama.com/download/ollama-linux-amd64.tgz

# 离线备用方案（网络不可用）
1. 另一台能联网的机器，下载二进制包（地址同上）
2. 上传到目标服务器（如/root/目录）

# 2. 解压到默认安装路径（/usr目录，必须用sudo）
sudo tar -C /usr -xzf ollama-linux-amd64.tgz

# 3. 验证安装（输出版本号即成功）
ollama --version

3.3 启动并设置Ollama开机自启

无论一键安装还是手动安装，都需启动服务并设置开机自启，避免服务器重启后服务失效。

# 1. 启动Ollama服务（一键安装已自动创建服务）
sudo systemctl start ollama

# 2. 设置开机自启（重启后自动启动）
sudo systemctl enable ollama

# 3. 查看服务状态（显示active (running)则正常）
sudo systemctl status ollama

补充：手动安装后创建系统服务

# 1. 创建服务文件
sudo vim /etc/systemd/system/ollama.service

# 2. 写入以下内容（复制粘贴即可）
[Unit]
Description=Ollama Service
After=network.target

[Service]
ExecStart=/usr/local/bin/ollama serve
User=root
Restart=always

[Install]
WantedBy=multi-user.target

# 3. 保存退出（vim按Esc，输入:wq）
# 4. 重载服务配置
sudo systemctl daemon-reload

3.4 常用Ollama服务命令（必记）

# 重启服务（修改配置后需执行）
sudo systemctl restart ollama

# 停止服务
sudo systemctl stop ollama

# 查看日志（排查启动、运行失败问题，实时刷新）
journalctl -u ollama -f

# 查看Ollama版本
ollama --version

# 查看帮助信息
ollama help

Ollama安装常见错误及解决

# 错误1：执行脚本提示“curl: (7) Failed to connect to ollama.com port 443”
# 解决：用国内镜像脚本，或切换离线方案
curl -fsSL https://mirror.ghproxy.com/https://ollama.com/install.sh | sh

# 错误2：ollama --version提示“command not found”
# 解决：检查解压路径，重新解压到/usr目录，或添加环境变量
export PATH=$PATH:/解压路径

# 错误3：启动服务提示“Failed to start ollama.service: Unit not found”
# 解决：手动创建服务（见3.3补充步骤），重载配置后再启动

四、拉取并运行 DeepSeek-R1:7B 模型

4.1 拉取模型（一键自动下载，支持离线导入）

Ollama支持一键拉取模型，无需手动解压，同时提供离线方案，适配网络不可用场景，模型大小约4.7GB。

# 在线方案（网络可用时）
ollama pull deepseek-r1:7b

# 在线备用方案（官方模型源失效时）
ollama pull registry.aliyuncs.com/ollama/deepseek-r1:7b

# 离线备用方案（网络不可用）
1. 另一台能联网的机器（已安装Ollama），拉取并导出模型：
   ollama pull deepseek-r1:7b  # 拉取模型
   ollama save deepseek-r1:7b -f deepseek-r1-7b-ollama.tar  # 导出离线包
2. 上传离线包到目标服务器（如/root/目录）
3. 导入模型：ollama load deepseek-r1:7b -f /root/deepseek-r1-7b-ollama.tar
4. 验证导入：ollama list

4.2 查看已安装模型

拉取/导入完成后，执行以下命令，确认模型安装成功。

# 查看已安装模型（显示名称、ID、大小、修改时间）
ollama list

输出示例（有deepseek-r1:7b即成功）：

NAME              ID              SIZE      MODIFIED
deepseek-r1:7b    0a8c26691023    4.7 GB    3 hours ago

4.3 运行模型（命令行交互，简单测试）

模型安装成功后，可直接启动命令行交互，测试对话功能，无需额外配置。

# 启动DeepSeek-R1:7B对话（默认参数）
ollama run deepseek-r1:7b

# 退出交互模式：输入/bye 或 按Ctrl+D
# 首次启动加载模型需10-30秒（取决于硬件），后续启动更快

4.4 带参数优化运行（推荐，适配不同硬件）

默认参数可能不适合当前硬件，调整以下参数可优化运行速度和输出效果，尤其适配小显存GPU。

# 优化参数示例（适配8GB显存、16GB内存）
ollama run deepseek-r1:7b --temperature 0.3 --num_ctx 4096 --num-gpu-layers 20

核心参数说明

--temperature：0-1，值越低输出越严谨（推荐0.2-0.5，适合工作/学习），值越高越随机；
--num_ctx：上下文窗口大小（最大8192），16GB内存推荐4096，32GB内存推荐8192；
--num-gpu-layers：GPU加载层数，8GB显存推荐20-30，12GB显存推荐40-60，无GPU设为0。

模型运行常见错误及解决

# 错误1：启动提示“out of memory”（内存/显存不足）
1. 关闭其他占用内存/显存的进程：kill -9 进程ID
2. 降低参数：减少--num_ctx或--num-gpu-layers的值
3. 无GPU则切换到CPU模式（见下文5.3）

# 错误2：启动提示“model not found”（模型未找到）
1. 执行ollama list确认模型是否安装
2. 重新拉取：ollama pull deepseek-r1:7b --force
3. 离线导入失败则重新上传离线包，重新导入

# 错误3：交互无响应或提示“connection closed”
# 解决：重启Ollama服务
sudo systemctl restart ollama

五、进阶配置（可选，按需操作）

5.1 修改模型存储路径（避免系统盘爆满）

默认模型存储在系统盘（~/.ollama/models/），系统盘空间较小时，可修改到数据盘。

# 1. 创建新存储目录（自定义数据盘路径）
sudo mkdir -p /data/ollama-models
sudo chown -R $USER:$USER /data/ollama-models  # 赋予权限

# 2. 编辑Ollama服务文件，添加环境变量
sudo vim /etc/systemd/system/ollama.service
# 在[Service]下新增一行：
Environment="OLLAMA_MODELS=/data/ollama-models"

# 3. 重载配置并重启服务
sudo systemctl daemon-reload
sudo systemctl restart ollama

# 4. 验证路径（有输出即成功）
echo $OLLAMA_MODELS

5.2 开启远程访问（局域网/公网调用）

默认仅允许本地访问，需远程调用（如电脑、手机），需修改监听地址，开放11434端口。

# 1. 编辑Ollama服务文件
sudo vim /etc/systemd/system/ollama.service

# 2. 添加监听地址（允许所有设备访问）
Environment="OLLAMA_HOST=0.0.0.0:11434"

# 3. 重载配置并重启服务
sudo systemctl daemon-reload
sudo systemctl restart ollama

# 4. 远程访问地址：http://服务器IP:11434（如http://192.168.1.100:11434）

远程访问注意点

需确保防火墙已开放11434端口（见步骤2.4）；
公网访问需配置路由器端口映射，注意服务器安全（建议限制访问IP）；
远程调用示例（Python）：

import requests
url = "http://服务器IP:11434/api/chat"
data = {
    "model": "deepseek-r1:7b",
    "messages": [{"role": "user", "content": "介绍一下你自己"}]
}
response = requests.post(url, json=data)
print(response.json()["message"]["content"])

5.3 CPU模式运行（无GPU必做）

无NVIDIA GPU时，强制用CPU运行，速度较慢，仅适合简单测试。

# 临时CPU运行（仅当前会话有效）
OLLAMA_CPU_ONLY=1 ollama run deepseek-r1:7b

# 永久CPU运行（重启后生效）
sudo vim /etc/systemd/system/ollama.service
# 在[Service]下新增一行：
Environment="OLLAMA_CPU_ONLY=1"
# 重载配置并重启服务
sudo systemctl daemon-reload
sudo systemctl restart ollama