Qwen3.5-4B-AWQ镜像免配置实践：supervisor开机自启+崩溃自动恢复

本文介绍了如何在星图GPU平台上自动化部署Qwen3.5-4B-AWQ-4bit镜像，该模型由阿里云通义千问团队推出，支持多语言处理、图文交互等能力。通过预配置的supervisor实现开机自启和崩溃自动恢复，特别适用于智能客服、知识库问答等轻量级AI应用场景，显著提升服务稳定性与运维效率。

鄧寜

191人浏览 · 2026-04-23 04:31:33

鄧寜 · 2026-04-23 04:31:33 发布

Qwen3.5-4B-AWQ镜像免配置实践：supervisor开机自启+崩溃自动恢复

1. 模型概述

Qwen3.5-4B-AWQ-4bit是由阿里云通义千问团队推出的轻量级稠密模型，经过4bit AWQ量化后显存占用仅约3GB，使得RTX 3060/4060等消费级显卡也能流畅运行。这款模型在保持轻量化的同时，性能表现依然出色：

性能均衡：MMLU-Pro得分接近Qwen3-30B-A3B，OmniDocBench表现甚至超过GPT-5-Nano
全能力覆盖：支持201种语言处理、原生多模态（图文交互）、长上下文理解和工具调用
场景适配：特别适合轻量Agent、知识库问答和智能客服等应用场景

2. 快速部署指南

2.1 基础环境准备

项目已预配置以下环境：

模型路径：/root/ai-models/cyankiwi/Qwen3___5-4B-AWQ-4bit
推理引擎：vLLM
WebUI访问端口：7860

2.2 服务管理命令

使用supervisor进行服务管理：

# 查看服务状态
supervisorctl status

# 启动服务
supervisorctl start qwen35-4b-awq

# 停止服务
supervisorctl stop qwen35-4b-awq

# 重启服务
supervisorctl restart qwen35-4b-awq

2.3 日志查看方法

# 实时查看运行日志
tail -f /root/Qwen3.5-4B-AWQ-4bit/logs/webui.log

# 查看错误日志（排查问题时特别有用）
tail -f /root/Qwen3.5-4B-AWQ-4bit/logs/webui.err.log

3. 开机自启与自动恢复配置

3.1 supervisor自动管理

项目已预配置supervisor实现两大关键功能：

开机自启：autostart=true确保系统重启后自动启动服务
崩溃恢复：autorestart=true在服务意外终止时自动重新启动

supervisord服务本身也已配置为开机自启，形成完整的管理闭环。

3.2 手动调试方法（可选）

如需手动调试运行，可使用以下命令：

cd /root/Qwen3.5-4B-AWQ-4bit
/opt/miniconda3/envs/torch28/bin/python webui.py

4. 常见问题解决方案

4.1 GPU显存问题处理

当服务启动失败并提示显存不足时，通常是因为有残留进程占用了显存：

# 检查当前GPU显存占用情况
nvidia-smi

# 查找可能的VLLM残留进程
ps aux | grep VLLM

# 终止残留进程后重新启动服务
kill -9 <PID>
supervisorctl start qwen35-4b-awq

4.2 目录结构说明

项目采用清晰的目录结构设计：

/root/Qwen3.5-4B-AWQ-4bit/
├── webui.py              # 主程序入口
├── supervisor.conf       # supervisor配置文件
└── logs/
    ├── webui.log         # 常规运行日志
    └── webui.err.log     # 错误日志记录