千问3.5-27B从零开始：conda环境+supervisor服务管理完整指南

本文介绍了如何在星图GPU平台上自动化部署千问3.5-27B镜像，实现高效的多模态AI服务。通过conda环境配置和supervisor服务管理，用户可快速搭建文本对话和图片理解应用，适用于智能客服、内容分析等场景。该方案显著降低了大型语言模型的部署门槛。

BIG-HO

158人浏览 · 2026-03-15 00:45:46

BIG-HO · 2026-03-15 00:45:46 发布

千问3.5-27B从零开始：conda环境+supervisor服务管理完整指南

1. 环境准备与快速部署

在开始使用Qwen3.5-27B模型前，我们需要先搭建好运行环境。这个模型需要较强的计算资源，建议在配备4张RTX 4090 D 24GB显卡的服务器上运行。

1.1 系统要求

操作系统：推荐使用Ubuntu 20.04 LTS或更高版本
显卡驱动：NVIDIA驱动版本>=525.60.13
CUDA版本：11.7或更高
Python版本：3.8或3.9

1.2 安装conda环境

首先，我们需要创建一个独立的conda环境来运行Qwen3.5-27B：

# 创建conda环境
conda create -n qwen3527 python=3.9 -y

# 激活环境
conda activate qwen3527

# 安装基础依赖
pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu117
pip install transformers accelerate fastapi uvicorn

2. 模型下载与配置

2.1 下载模型权重

模型权重已经预置在镜像中，位于/root/ai-models/Qwen/Qwen3.5-27B目录。如果你需要重新下载：

# 创建模型目录
mkdir -p /root/ai-models/Qwen/Qwen3.5-27B
cd /root/ai-models/Qwen/Qwen3.5-27B

# 使用git-lfs下载模型
git lfs install
git clone https://huggingface.co/Qwen/Qwen3.5-27B .

2.2 服务目录结构

服务相关文件位于/opt/qwen3527-27b目录，结构如下：

/opt/qwen3527-27b/
├── app.py          # FastAPI主程序
├── config.py       # 配置文件
├── requirements.txt # 依赖列表
└── supervisor.conf # supervisor配置文件

3. 服务部署与启动

3.1 安装supervisor

Supervisor是一个进程管理工具，可以确保我们的服务持续运行：

# 安装supervisor
apt-get update && apt-get install -y supervisor

# 创建服务配置文件
cat > /etc/supervisor/conf.d/qwen3527.conf <<EOF
[program:qwen3527]
command=/root/miniconda3/envs/qwen3527/bin/uvicorn app:app --host 0.0.0.0 --port 7860
directory=/opt/qwen3527-27b
user=root
autostart=true
autorestart=true
stopasgroup=true
killasgroup=true
stderr_logfile=/root/workspace/qwen3527.err.log
stdout_logfile=/root/workspace/qwen3527.log
EOF

3.2 启动服务

配置完成后，我们可以启动服务：

# 重新加载supervisor配置
supervisorctl reread
supervisorctl update

# 启动服务
supervisorctl start qwen3527

# 查看服务状态
supervisorctl status qwen3527

4. 服务管理与维护

4.1 常用管理命令

# 查看服务状态
supervisorctl status qwen3527

# 重启服务
supervisorctl restart qwen3527

# 停止服务
supervisorctl stop qwen3527

# 查看日志
tail -f /root/workspace/qwen3527.log

4.2 端口检查

确保服务正常运行后，可以检查端口是否监听：

ss -ltnp | grep 7860

如果一切正常，你应该能看到类似输出：

LISTEN 0      100          0.0.0.0:7860      0.0.0.0:*    users:(("uvicorn",pid=1234,fd=3))

5. 使用指南

5.1 Web界面访问

服务启动后，可以通过浏览器访问Web界面：

https://gpu-{实例ID}-7860.web.gpu.csdn.net/

在页面输入框中输入问题，点击"开始对话"或使用Ctrl + Enter快捷键发送消息。

5.2 API接口调用

文本对话接口

curl -X POST http://127.0.0.1:7860/generate \
  -H "Content-Type: application/json" \
  -d '{"prompt":"请用中文介绍一下你自己。","max_new_tokens":128}'

图片理解接口

curl -X POST http://127.0.0.1:7860/generate_with_image \
  -F "prompt=请描述这张图片的主要内容" \
  -F "max_new_tokens=128" \
  -F "image=@/path/to/your/image.png"