千问3.5-2B十分钟快速部署教程：基于Ubuntu系统的开箱即用指南

本文介绍了如何在星图GPU平台上自动化部署千问3.5-2B镜像，快速搭建轻量级大语言模型环境。该平台提供预置镜像，简化了Ubuntu系统下的配置流程，用户可在十分钟内完成部署并通过Web界面或API实现智能文本生成，适用于个人开发者和小型团队的快速AI应用开发。

項羽Sama

131人浏览 · 2026-04-10 05:39:24

項羽Sama · 2026-04-10 05:39:24 发布

千问3.5-2B十分钟快速部署教程：基于Ubuntu系统的开箱即用指南

1. 前言：为什么选择千问3.5-2B

如果你正在寻找一个轻量级但性能出色的大语言模型，千问3.5-2B绝对值得考虑。这个2B参数的模型在保持较小体积的同时，提供了相当不错的文本理解和生成能力。特别适合个人开发者、小型团队或者需要快速部署的场景。

本教程将带你从零开始，在Ubuntu系统上完成千问3.5-2B的部署。整个过程只需要十分钟左右，即使你是AI模型部署的新手也能轻松完成。我们会使用星图GPU平台的预置镜像，省去复杂的配置过程，真正实现开箱即用。

2. 准备工作

2.1 系统要求

在开始之前，请确保你的Ubuntu系统满足以下基本要求：

Ubuntu 20.04或22.04 LTS版本
至少16GB内存（推荐32GB）
50GB可用磁盘空间
支持CUDA的NVIDIA GPU（推荐RTX 3090或更高）
已安装NVIDIA驱动和CUDA工具包

2.2 星图GPU平台账号

你需要一个星图GPU平台的账号。如果没有，可以前往官网注册。注册过程很简单，只需要提供邮箱和设置密码即可。

3. 创建GPU实例

3.1 登录星图控制台

首先，访问星图GPU平台并登录你的账号。进入控制台后，点击"创建实例"按钮。

3.2 选择镜像

在镜像选择界面，搜索"千问3.5-2B"。你会看到官方提供的预置镜像，选择最新版本即可。这个镜像已经包含了所有必要的依赖和配置，省去了手动安装的麻烦。

3.3 配置实例

接下来，为你的实例选择合适的配置：

实例类型：选择带有GPU的实例（如A10G或V100）
存储空间：建议分配至少100GB
网络设置：保持默认即可
安全组：确保开放了必要的端口（默认是7860）

确认配置无误后，点击"创建"按钮。实例通常会在1-2分钟内启动完成。

4. 连接到实例

4.1 获取连接信息

实例创建完成后，在控制台找到你的实例，点击"连接"按钮。你会看到SSH连接命令，类似于：

ssh -i your_key.pem ubuntu@your_instance_ip

4.2 使用SSH连接

打开你本地的终端，运行上面提供的SSH命令。如果是第一次连接，系统会询问是否信任该主机，输入"yes"继续。

成功连接后，你会看到Ubuntu的命令行提示符，表示已经进入实例系统。

5. 启动千问3.5-2B服务

5.1 检查预装环境

连接成功后，首先检查必要的组件是否已经安装：

ls /opt/qwen

你应该能看到模型文件和相关的启动脚本。星图镜像已经帮你完成了所有环境配置，包括Python环境、CUDA支持和必要的依赖库。

5.2 启动WebUI服务

运行以下命令启动Web界面：

cd /opt/qwen
python app.py

服务启动后，你会看到类似下面的输出：

Running on local URL:  http://0.0.0.0:7860

5.3 访问Web界面

现在，你可以通过浏览器访问这个服务了。在地址栏输入：

http://<你的实例IP>:7860

如果一切正常，你会看到千问3.5-2B的交互界面。恭喜，模型已经成功部署！

6. 使用API接口

除了Web界面，你也可以通过API与模型交互。服务启动后，API端点默认在：

http://<你的实例IP>:7860/api

你可以使用curl测试API：

curl -X POST "http://localhost:7860/api" \
     -H "Content-Type: application/json" \
     -d '{"prompt":"你好，介绍一下你自己"}'

API会返回JSON格式的响应，包含模型生成的文本。

7. 常见问题解决

7.1 端口无法访问

如果无法访问7860端口，请检查：

实例安全组是否开放了该端口
本地防火墙是否阻止了连接
服务是否成功启动（检查日志）

7.2 模型加载失败

如果模型加载失败，可能是由于：

显存不足 - 尝试重启实例或选择更大显存的GPU
文件权限问题 - 运行chmod -R 755 /opt/qwen
磁盘空间不足 - 清理空间或扩容存储

7.3 性能优化建议

如果响应速度不理想，可以尝试：

降低max_length参数值
使用量化版本（如果有）
升级到更高性能的GPU实例

8. 总结

通过这个教程，我们成功在Ubuntu系统上部署了千问3.5-2B模型。整个过程非常简单，得益于星图平台的预置镜像，我们省去了复杂的配置步骤。现在你可以通过Web界面或API与模型交互，开始你的AI应用开发了。

实际使用下来，这个2B参数的模型响应速度很快，生成质量也相当不错，特别适合需要快速部署和轻量级解决方案的场景。如果你刚开始接触大语言模型，这是一个很好的起点。熟悉后，你可以尝试更复杂的配置和优化，或者探索其他更大的模型。

获取更多AI镜像

想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

DeepSeek技术社区

欢迎加入DeepSeek 技术社区。在这里，你可以找到志同道合的朋友，共同探索AI技术的奥秘。

更多推荐

案例研究：Gemini + Creative Fabrica —— 揭秘多模态 Agent 如何重塑 3D 创意资产生产线

这不仅仅是一个技术升级工具，更是一个标志性案例：它展示了企业如何利用多模态大模型（LMM）将模糊的创意意图转化为精确的、工业级的参数化 3D 模型。传统的 3D 建模需要复杂的布线、贴图和参数调整。Creative Fabrica 利用 Gemini 的多模态能力，构建了一套“意图驱动”的生产管线。，从庞大的 Creative Fabrica 图库中学习“北欧风”的特征分布。生产出可商用的、高质量

DeepSeek技术社区

2026 AI 局势突变：国家大基金入场 DeepSeek，Kimi 2.0 豪掷 20 亿美元，大模型进入“内力”博弈时代

2026年中国AI行业迎来关键转折点，DeepSeek获得国家大基金450亿美元估值投资，月之暗面完成20亿美元B轮融资，标志AI竞争进入资本与算力的"内力"博弈阶段。技术层面，DeepSeek V4采用MoE架构实现1.6万亿参数的高效推理，Kimi K2.6则专注多智能体协同工作流。行业趋势显示：1)算力门槛提升至万卡级别；2)商业闭环开始形成；3)国家资本推动行业集中化。