Ollama本地化部署指南

Ollama是一个开源工具，旨在简化大型语言模型（LLM）的本地部署和使用过程。它允许用户在个人计算机上运行各种先进的AI模型，如DeepSeek-R1、Qwen 3、Llama 3.3、Qwen 2.5‑VL和Gemma 3等，无需依赖云服务。本地化运行：所有模型在本地设备上运行，保护隐私和数据安全多平台支持：兼容Windows、macOS和Linux系统简单易用：提供简洁的命令行界面和API接

DS-RAG

2061人浏览 · 2025-06-01 17:38:52

DS-RAG · 2025-06-01 17:38:52 发布

Ollama本地化部署指南

在这里插入图片描述

1. Ollama简介

Ollama是一个开源工具，旨在简化大型语言模型（LLM）的本地部署和使用过程。它允许用户在个人计算机上运行各种先进的AI模型，如DeepSeek-R1、Qwen 3、Llama 3.3、Qwen 2.5‑VL和Gemma 3等，无需依赖云服务。

Ollama的主要特点包括：

本地化运行：所有模型在本地设备上运行，保护隐私和数据安全
多平台支持：兼容Windows、macOS和Linux系统
简单易用：提供简洁的命令行界面和API接口
GPU加速：支持NVIDIA和AMD GPU加速推理
模型管理：便捷的模型下载、切换和管理功能
API接口：提供与OpenAI兼容的API，便于集成到现有应用

通过Ollama，即使是普通消费级硬件也能运行强大的AI模型，为开发者和研究人员提供了极大的便利。

2. 系统要求

在安装Ollama之前，请确保您的系统满足以下基本要求：

Windows系统要求

在这里插入图片描述

Windows 10 22H2或更新版本，Home或Pro版本
NVIDIA 452.39或更新版本驱动（如果使用NVIDIA GPU）
AMD Radeon驱动（如果使用AMD GPU）
至少4GB可用存储空间（用于安装程序）
根据模型大小，需要额外的存储空间（从几GB到数百GB不等）

macOS系统要求

macOS系统
建议使用多核处理器
至少8GB内存，推荐16GB或更高
支持Apple Silicon (M系列芯片)和Intel芯片

Linux系统要求

在这里插入图片描述

现代Linux发行版（如Ubuntu 20.04+、Debian 11+、Fedora 35+等）
支持CUDA的NVIDIA GPU（可选，用于加速）
AMD ROCm支持（可选，用于AMD GPU加速）
至少8GB内存，推荐16GB或更高

请注意，实际运行大型语言模型时的内存和存储需求取决于所选模型的大小。较小的模型（如7B参数模型）可以在8GB内存的设备上运行，而较大的模型可能需要16GB或更多内存。

3. Windows安装指南

Windows版Ollama现在提供了原生支持，不再需要WSL（Windows Subsystem for Linux）。以下是详细的安装步骤：

3.1 下载安装程序

访问Ollama官网
点击"Download"按钮
选择Windows版本下载

3.2 安装过程

运行下载的安装程序
按照安装向导的指示完成安装
安装完成后，Ollama将在后台运行

3.3 验证安装

安装完成后，可以通过以下方式验证Ollama是否正常运行：

打开命令提示符（CMD）或PowerShell
输入以下命令：
```
ollama -v
```
如果显示版本信息，则表示安装成功

3.4 文件系统要求

Ollama安装不需要管理员权限，默认安装在用户主目录。安装后需要至少4GB空间用于二进制文件，以及额外的空间用于存储模型（可能从几GB到数百GB不等）。

如果您的主目录空间不足，可以在安装时选择不同的安装位置。

4. macOS安装指南

在这里插入图片描述

4.1 下载安装程序

访问Ollama官网
点击"Download"按钮
选择macOS版本下载

4.2 安装过程

打开下载的.dmg文件
将Ollama拖到Applications文件夹
首次运行时，右键点击应用程序并选择"打开"以绕过Gatekeeper限制

4.3 通过命令行使用

在macOS上，安装完成后可以通过终端使用Ollama：

打开终端
输入ollama -h查看所有可用命令
使用ollama serve启动Ollama服务
在另一个终端窗口中，可以使用ollama run <模型名称>来运行模型

4.4 系统集成

macOS版Ollama会在菜单栏显示一个图标，可以通过该图标快速访问Ollama功能或退出程序。

5. Linux安装指南

Linux系统上安装Ollama有多种方式，以下是最常用的方法：

5.1 使用官方脚本安装

最简单的方法是使用官方提供的安装脚本：

curl -fsSL https://ollama.com/install.sh | sh

这个脚本会自动下载并安装最新版本的Ollama。

5.2 手动安装

如果您希望手动安装，可以按照以下步骤操作：

下载适合您系统架构的包：

curl -L https://ollama.com/download/ollama-linux-amd64.tar.gz -o ollama-linux-amd64.tar.gz

解压文件：

sudo tar -C /usr -xzf ollama-linux-amd64.tar.gz

启动Ollama：
```
ollama serve
```

5.3 AMD GPU支持

如果您使用AMD GPU，还需要下载并安装ROCm包：

curl -L https://ollama.com/download/ollama-linux-amd64-rocm.tar.gz -o ollama-linux-amd64-rocm.tar.gz
sudo tar -C /usr -xzf ollama-linux-amd64-rocm.tar.gz

5.4 设置为系统服务

为了让Ollama在系统启动时自动运行，可以将其设置为系统服务：

创建用户和组：

sudo useradd -r -s /bin/false -m -d /usr/share/ollama ollama
sudo usermod -a -G ollama $(whoami)

创建服务文件：

sudo nano /etc/systemd/system/ollama.service

添加以下内容：

[Unit]
Description=Ollama Service
After=network-online.target

[Service]
User=ollama
Group=ollama
ExecStart=/usr/bin/ollama serve
Restart=always
RestartSec=3

[Install]
WantedBy=multi-user.target

启用并启动服务：

sudo systemctl enable ollama
sudo systemctl start ollama

6. 模型下载与使用

安装完Ollama后，您可以下载和使用各种大型语言模型。

6.1 查看可用模型

可以在Ollama模型库或通过命令行查看可用模型：

ollama list

6.2 下载模型

使用以下命令下载模型：

ollama pull <模型名称>

例如，下载Llama 3模型：

ollama pull llama3

6.3 运行模型

下载完成后，可以使用以下命令运行模型：

ollama run <模型名称>

例如：

ollama run llama3

这将启动一个交互式会话，您可以直接与模型对话。

6.4 使用API

Ollama提供了与OpenAI兼容的API，可以通过HTTP请求与模型交互：

curl -X POST http://localhost:11434/api/generate -d '{
  "model": "llama3",
  "prompt": "为什么天空是蓝色的？"
}'

6.5 模型管理

其他常用的模型管理命令：

列出已下载的模型：ollama list
删除模型：ollama rm <模型名称>
查看模型信息：ollama show <模型名称>

7. 常见问题与解决方案

7.1 内存不足

问题：运行模型时出现内存不足错误。

解决方案：

尝试使用参数较少的模型版本（如7B而非13B）
增加系统内存
调整模型参数，如上下文长度

7.2 GPU不被识别

问题：安装了GPU但Ollama没有使用它。

解决方案：

确保已安装最新的GPU驱动
对于NVIDIA GPU，确保安装了CUDA
对于AMD GPU，确保安装了ROCm
检查ollama -v输出中是否显示GPU信息

7.3 模型下载速度慢

问题：模型下载速度非常慢。

解决方案：

检查网络连接
尝试使用VPN或代理
在非高峰时段下载

7.4 API连接问题

问题：无法通过API连接到Ollama。

解决方案：

确保Ollama服务正在运行（ollama serve）
检查防火墙设置
默认API端口是11434，确保该端口未被占用

7.5 Windows特有问题

问题：在Windows上，终端显示乱码或方块。

解决方案：

Ollama使用Unicode字符显示进度，可能在某些终端中显示为方块
尝试更改终端字体设置

8. 总结

Ollama为本地部署和运行大型语言模型提供了一个简单而强大的解决方案。通过本指南，您应该能够在Windows、macOS或Linux系统上成功安装和使用Ollama，享受本地AI模型带来的便利和隐私保护。

无论您是开发者、研究人员还是AI爱好者，Ollama都能帮助您在本地计算机上运行先进的语言模型，无需依赖云服务，也无需担心数据隐私问题。

随着AI技术的不断发展，Ollama也在持续更新和改进，支持更多模型和功能。建议定期检查官方网站和GitHub仓库以获取最新信息和更新。

参考资料：

DeepSeek技术社区

欢迎加入DeepSeek 技术社区。在这里，你可以找到志同道合的朋友，共同探索AI技术的奥秘。

更多推荐

周红伟：OpenClaw安全防控：OpenClaw+Skills+DeepSeek-V4大模型安全部署、实操和企业应用实操

DeepSeek技术社区

Codex自定义API配置实战：多模型接入一次讲透

DeepSeek技术社区

DeepSeek V4架构革新引领大模型高效能时代

DeepSeek技术社区

所有评论(0)

查看更多评论

DS-RAG

@jjFreedom

已为社区贡献1条内容

Ollama本地化部署指南

DS-RAG

Ollama本地化部署指南

目录

1. Ollama简介

2. 系统要求

Windows系统要求

macOS系统要求

Linux系统要求

3. Windows安装指南

3.1 下载安装程序

3.2 安装过程

3.3 验证安装

3.4 文件系统要求

4. macOS安装指南

4.1 下载安装程序

4.2 安装过程

4.3 通过命令行使用

4.4 系统集成

5. Linux安装指南

5.1 使用官方脚本安装

5.2 手动安装

5.3 AMD GPU支持

5.4 设置为系统服务

6. 模型下载与使用

6.1 查看可用模型

6.2 下载模型

6.3 运行模型

6.4 使用API

6.5 模型管理

7. 常见问题与解决方案

7.1 内存不足

7.2 GPU不被识别

7.3 模型下载速度慢

7.4 API连接问题

7.5 Windows特有问题

8. 总结

所有评论(0)

温馨提示：您尚未绑定手机号

DS-RAG