Qwen3.5-4B-AWQ实战教程:supervisor管理服务+日志定位+崩溃自恢复

1. 项目概述

Qwen3.5-4B-AWQ-4bit是阿里云通义千问团队推出的轻量级稠密模型,经过4bit AWQ量化后显存占用仅约3GB,使得RTX 3060/4060等消费级显卡也能流畅运行。该模型在保持轻量化的同时,性能表现优异:

  • 性能均衡:MMLU-Pro得分接近Qwen3-30B-A3B,OmniDocBench表现超越GPT-5-Nano
  • 全能力覆盖:支持201种语言处理、原生多模态(图文)理解、长上下文处理以及工具调用
  • 部署友好:适配llama.cpp、vLLM等主流推理引擎

核心参数

  • 模型路径:/root/ai-models/cyankiwi/Qwen3___5-4B-AWQ-4bit
  • 推理引擎:vLLM
  • WebUI端口:7860

2. 服务管理实战

2.1 服务状态监控

使用supervisorctl可以方便地查看服务运行状态:

supervisorctl status

正常运行时将显示类似输出:

qwen35-4b-awq   RUNNING   pid 12345, uptime 0:05:23

2.2 服务启停控制

通过以下命令管理服务生命周期:

# 启动服务
supervisorctl start qwen35-4b-awq

# 停止服务
supervisorctl stop qwen35-4b-awq

# 重启服务(推荐修改配置后使用)
supervisorctl restart qwen35-4b-awq

2.3 日志查看技巧

日志是排查问题的关键,模型提供了两种日志:

# 实时查看运行日志(Ctrl+C退出)
tail -f /root/Qwen3.5-4B-AWQ-4bit/logs/webui.log

# 查看错误日志(重点关注)
tail -f /root/Qwen3.5-4B-AWQ-4bit/logs/webui.err.log

日志分析技巧

  • 搜索"ERROR"或"Exception"快速定位问题
  • 注意时间戳判断问题发生时间点
  • 大段错误信息通常包含关键堆栈跟踪

3. WebUI访问与调试

3.1 正常访问

服务启动成功后,通过浏览器访问:

http://localhost:7860

3.2 手动调试模式

当需要调试或supervisor异常时,可手动运行:

cd /root/Qwen3.5-4B-AWQ-4bit
/opt/miniconda3/envs/torch28/bin/python webui.py

注意:手动运行时需保持终端开启,关闭终端会导致服务终止。

4. 崩溃自恢复机制

项目已配置完善的崩溃恢复策略:

  1. 开机自启:supervisor配置中设置autostart=true
  2. 崩溃重启autorestart=true确保异常退出后自动恢复
  3. 守护进程:supervisord本身也已配置为系统服务

验证自启配置:

cat /root/Qwen3.5-4B-AWQ-4bit/supervisor.conf | grep -E "autostart|autorestart"

5. 常见问题解决

5.1 GPU显存问题

若服务启动失败并提示显存不足,按以下步骤处理:

# 1. 检查当前显存占用
nvidia-smi

# 2. 查找可能的残留进程
ps aux | grep VLLM

# 3. 终止残留进程(替换<PID>为实际进程ID)
kill -9 <PID>

# 4. 重新启动服务
supervisorctl start qwen35-4b-awq

5.2 端口冲突

若7860端口被占用,可修改webui.py中的端口配置后重启服务。

6. 项目目录结构

了解目录结构有助于问题定位:

/root/Qwen3.5-4B-AWQ-4bit/
├── webui.py              # 主程序入口
├── supervisor.conf       # 服务管理配置
└── logs/
    ├── webui.log         # 标准运行日志
    └── webui.err.log     # 错误日志(重点监控)

7. 总结

通过本教程,您已经掌握:

  1. 使用supervisor高效管理Qwen3.5-4B-AWQ服务
  2. 通过日志分析快速定位各类问题
  3. 利用崩溃自恢复机制保障服务稳定性
  4. 解决常见的GPU显存和端口冲突问题

建议定期检查日志文件,特别是在服务异常后,可以从中获取有价值的调试信息。对于生产环境,可以考虑配置日志轮转避免磁盘空间耗尽。


获取更多AI镜像

想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐