本地大模型部署与开发应用教程
🚀 本地大模型部署与应用开发指南
本教程将指导您如何在本地 Windows 环境下,使用 Ollama 部署 Qwen(通义千问) 系列模型,并配置国内镜像源以加速下载,最后介绍如何将其接入开发工具。
安装 Ollama 运行环境
Ollama 是一个轻量级工具,可让您在本地轻松运行开源大语言模型。
下载与安装:
访问 Ollama 官方发布页下载 Windows 安装包。
下载地址:OllamaSetup.exe
操作:下载完成后双击运行,按照提示点击“Install”完成安装。安装后,Ollama 会在后台运行(任务栏右下角会有图标)。
优化配置:使用 ModelScope 镜像加速
由于网络原因,直接拉取模型可能较慢。您可以配置环境变量,利用 ModelScope(魔搭社区) 作为镜像源来加速模型下载。
配置步骤:
在 Windows 搜索栏输入“环境变量”,选择 “编辑系统环境变量”。
点击 “环境变量” 按钮。
在 “系统变量” 区域,点击 “新建”。
变量名:OLLAMA_MODELS
变量值:建议填写一个空间充足的磁盘路径(例如 D:OllamaModels),用于存放下载的模型文件。
点击确定保存。
注:ModelScope 社区提供了丰富的模型资源,配合 Ollama 使用可显著提升国内用户的体验。
部署 Qwen 大模型
配置完成后,我们可以通过命令行拉取并运行模型。这里以 Qwen2.5 为例。
打开 终端(Windows Terminal、CMD 或 PowerShell)。
执行拉取命令:
输入以下命令下载模型(以 4B 参数量版本为例,您可根据显存情况调整):
ollama run qwen2.5:4b
> 提示:如果提示模型未找到,Ollama 会自动尝试从库中拉取。配置好镜像源后,下载速度会明显提升。
验证运行:
当看到终端出现 >>> 提示符时,说明模型已加载成功。您可以直接输入“你好”进行测试。
验证 API 服务
Ollama 在本地启动了一个 API 服务,默认端口为 11434。
检查状态:
打开浏览器访问:http://localhost:11434
预期结果:
如果页面显示 Ollama is running,说明本地服务已正常启动,随时准备接收请求。
在开发工具中应用 (OpenWebUI/ChatGPT-Next-Web)
您提到的 “Openclaw” 可能是指 OpenWebUI 或类似的开源前端界面工具。配置好本地模型后,您可以在这些工具中调用它。
配置 API 地址:
在您的前端工具设置中,将 API Base URL 设置为:
http://localhost:11434
选择模型:
在模型列表中,您应该能看到已部署的 qwen2.5:4b,选择即可开始对话。
💡 小贴士:
显存要求:运行 4B 模型通常需要至少 8GB 的系统内存或 6GB 以上的 GPU 显存。
更多模型:您可以在 ModelScope 社区或 Ollama 库中探索更多模型(如 Llama 3, Gemma 等)并尝试部署。
更多推荐

所有评论(0)