千问3.5-27B部署教程：ss -ltnp端口检测+防火墙放行配置指南

本文介绍了如何在星图GPU平台上自动化部署千问3.5-27B镜像，并快速启动其视觉多模态AI服务。该平台提供了预配置环境，用户通过端口检测与防火墙放行配置，即可轻松访问模型。该镜像的核心应用场景包括智能对话与图片内容理解，可用于智能客服、内容创作及图像分析等任务。

宁南山

127人浏览 · 2026-03-19 01:14:30

宁南山 · 2026-03-19 01:14:30 发布

千问3.5-27B部署教程：ss -ltnp端口检测+防火墙放行配置指南

想快速体验一个能看懂图片、还能跟你流畅聊天的AI大模型吗？今天，我们就来手把手部署Qwen3.5-27B，一个功能强大的视觉多模态模型。它不仅文字对话能力强，还能理解图片内容，非常适合用来做智能客服、内容创作或者学习研究。

本教程将带你从零开始，完成模型的部署、服务启动，并重点解决部署中最常见的“服务跑起来了但访问不了”的问题——也就是端口检测和防火墙配置。我们会用到 ss -ltnp 这个命令来检查端口状态，并教你如何正确配置防火墙规则，确保你的模型服务能被顺利访问。

准备好了吗？让我们开始吧！

1. 环境准备与快速部署

在开始之前，我们先了解一下这个镜像的“家底”。它已经在 4 x RTX 4090 D 24GB 的强大GPU环境下完成了预部署和优化。这意味着，你拿到的是一个“开箱即用”的解决方案，模型权重已经下载好放在本地，省去了动辄几十GB的漫长下载等待。

核心信息速览：

模型：Qwen/Qwen3.5-27B
服务端口：7860 (这是Web界面和API的入口)
服务目录：/opt/qwen3527-27b
模型目录：/root/ai-models/Qwen/Qwen3.5-27B
运行环境：已配置好的 conda 环境 qwen3527
进程管理：使用 supervisor 托管服务，保证稳定运行

看到这里，你可能已经跃跃欲试了。部署本身非常简单，因为所有复杂的依赖和环境配置都已经在镜像里完成了。你的主要任务，就是让服务“跑起来”并且“能被访问到”。

2. 启动服务与初体验

首先，我们需要进入服务所在目录并激活Python环境。

# 1. 切换到服务目录
cd /opt/qwen3527-27b

# 2. 激活预置的 conda 环境
conda activate qwen3527

环境激活后，服务理论上应该已经由 supervisor 自动管理运行了。我们可以用以下命令来确认和操控服务的状态：

# 查看服务状态（最常用的命令）
supervisorctl status qwen3527

# 如果状态不是 RUNNING，可以尝试启动
supervisorctl start qwen3527

# 重启服务（修改配置或遇到问题时使用）
supervisorctl restart qwen3527

# 停止服务
supervisorctl stop qwen3527

正常情况下，执行 supervisorctl status qwen3527 后，你应该会看到类似 RUNNING 的状态提示，这意味着服务进程已经在后台欢快地运行了。

恭喜！ 到这一步，模型服务已经在你的服务器上启动了。但先别急着打开浏览器，我们得先确认它是否真的在监听我们期待的 7860 端口，以及网络通道是否畅通。这就是下一节的重点。

3. 核心技能：使用 ss -ltnp 检测端口状态

服务显示在运行，但为什么我访问不了？十有八九是端口问题。ss -ltnp 命令是你的第一道诊断工具，它像“网络听诊器”，能告诉你系统正在监听哪些端口，以及是哪个程序在监听。

命令分解与解读：

ss： Socket Statistics 的缩写，用来查看网络连接、端口监听等信息的强大工具，比老牌的 netstat 更快。
-l：仅显示监听（LISTEN）状态的套接字。
-t：仅显示 TCP 协议相关的套接字（我们的HTTP服务通常基于TCP）。
-n：以数字形式显示地址和端口号，不进行域名解析（更快更直接）。
-p：显示占用该端口的进程信息（PID和程序名）。

现在，让我们针对性地检查 7860 端口：

ss -ltnp | grep 7860

如何看懂输出结果？ 执行后，你可能会看到以下几种情况：

理想情况（服务正常监听）：
```
LISTEN 0      128          0.0.0.0:7860         0.0.0.0:*     users:(("python",pid=1234,fd=3))
```
- LISTEN：端口正在监听。
- 0.0.0.0:7860：服务监听在所有网络接口（0.0.0.0）的7860端口上，意味着可以从服务器外部（如你的电脑）访问。
- *:*：对任何来源的客户端连接都接受。
- users:(("python",pid=1234,fd=3))：是Python进程（PID 1234）在占用这个端口。这完全正确！
本地监听（仅限本机访问）：
```
LISTEN 0      128        127.0.0.1:7860         0.0.0.0:*     users:(("python",pid=1234,fd=3))
```
注意 127.0.0.1:7860，这表示服务只绑定了本地回环地址。这种情况下，你只能从服务器本机（通过 curl http://127.0.0.1:7860）访问，无法从外部网络访问。 这常常是部署后无法远程访问的根源。
没有输出： 如果 grep 后什么也没返回，那说明 根本没有程序在监听7860端口。这通常意味着服务启动失败。你需要回头检查服务日志：
```
tail -100 /root/workspace/qwen3527.err.log
tail -100 /root/workspace/qwen3527.log
```

假设我们遇到了第二种情况（绑定到127.0.0.1），或者压根就是第一种情况但依然无法访问，那么很可能是防火墙在“作祟”。

4. 防火墙配置：为服务打开通道

防火墙是服务器的安全卫士，但它有时会过于尽责，把我们的合法服务也给拦在外面。我们需要明确地告诉它：“放行7860端口的流量”。

重要提示：以下操作需要管理员权限（root 用户或使用 sudo）。请根据你服务器使用的防火墙软件选择对应步骤。

4.1 如果使用 firewalld（CentOS/RHEL/Rocky Linux 等常见）

# 1. 查看当前已开放的端口
sudo firewall-cmd --list-ports

# 2. 永久开放7860端口（TCP协议）
sudo firewall-cmd --permanent --add-port=7860/tcp

# 3. 重新加载防火墙配置，使规则生效
sudo firewall-cmd --reload

# 4. 再次确认端口已加入规则
sudo firewall-cmd --list-ports | grep 7860

4.2 如果使用 ufw（Ubuntu/Debian 常见）

# 1. 查看防火墙状态和规则
sudo ufw status verbose

# 2. 允许7860端口
sudo ufw allow 7860/tcp

# 3. 如果UFW默认是关闭的，需要启用它
sudo ufw enable
# 系统会提示可能影响现有SSH连接，请确认你已通过其他方式（如控制台）保障访问权限。

# 4. 再次查看状态确认
sudo ufw status numbered

4.3 如果使用 iptables（通用，但较底层）

# 1. 添加一条规则，允许INPUT链上目标端口为7860的TCP流量
sudo iptables -I INPUT -p tcp --dport 7860 -j ACCEPT

# 2. 保存iptables规则（否则重启失效）
# 对于CentOS/RHEL:
sudo service iptables save
# 或
sudo /sbin/iptables-save > /etc/sysconfig/iptables

# 对于Ubuntu/Debian，通常需要安装 iptables-persistent:
sudo apt-get install iptables-persistent -y
sudo netfilter-persistent save

配置完成后，请再次执行 ss -ltnp | grep 7860，确保服务监听在 0.0.0.0:7860，并且防火墙已放行。

5. 访问你的千问3.5-27B服务

好了，最关键的端口和防火墙问题解决了，现在终于可以享受成果了！

5.1 访问Web对话界面（最简单直观）

在你的浏览器地址栏中输入镜像提供的访问地址，格式通常为：

https://gpu-{你的实例ID}-7860.web.gpu.csdn.net/

将 {你的实例ID} 替换为你的实际实例ID。打开后，你应该能看到一个简洁的中文对话界面。

怎么玩？

在下方输入框里，用中文或英文输入你的问题，比如“你好，请介绍一下你自己”。
点击「开始对话」按钮，或者更酷一点，按 Ctrl + Enter 快捷键发送。
稍等片刻，你就会看到模型以“流式”的方式，一个字一个字地把回答“打”出来，体验非常流畅。

5.2 通过API接口调用（适合开发者）

如果你更喜欢编程交互，模型也提供了完善的API。

文本对话接口：

# 生成一个简单的请求JSON文件
cat > /tmp/qwen_req.json << 'EOF'
{
  "prompt": "请用中文写一首关于春天的五言绝句。",
  "max_new_tokens": 128
}
EOF

# 发送POST请求到生成接口
curl -X POST http://127.0.0.1:7860/generate \
  -H "Content-Type: application/json" \
  --data @/tmp/qwen_req.json

图片理解接口（这才是亮点！）： 假设你有一张图片 /home/user/cat.png，想让模型描述它：

curl -X POST http://127.0.0.1:7860/generate_with_image \
  -F "prompt=请描述这张图片的主要内容" \
  -F "max_new_tokens=128" \
  -F "image=@/home/user/cat.png"

模型会分析图片，并生成一段文字描述。这对于构建图像内容分析应用非常有用。

6. 服务管理与故障排查

日常使用中，你可能会需要一些维护操作。

6.1 常用管理命令

我们之前已经接触过 supervisorctl，这里再汇总一下：

# 状态检查（首选）
supervisorctl status qwen3527

# 重启服务（更新后或出问题时）
supervisorctl restart qwen3527

# 停止服务
supervisorctl stop qwen3527

# 启动服务
supervisorctl start qwen3527

# 查看实时日志（跟踪问题）
tail -f /root/workspace/qwen3527.log

6.2 遇到问题怎么办？

问题：页面能打开，但对话没反应或报错。

第一步：查看服务日志，寻找错误信息。
```
tail -100 /root/workspace/qwen3527.err.log
```
第二步：检查资源。Qwen3.5-27B是个大模型，确保你的GPU内存充足。可以先用 nvidia-smi 命令查看GPU使用情况。

问题：ss -ltnp 看到端口监听在 127.0.0.1，而不是 0.0.0.0。 这通常是服务启动脚本绑定了特定主机。你需要检查服务的启动命令或配置文件（通常在 /opt/qwen3527-27b 目录或 supervisor 配置中），将绑定的主机地址从 127.0.0.1 改为 0.0.0.0。如果不确定，可以尝试重启服务，有时配置会重置。

问题：服务启动失败，日志显示端口已被占用。 这说明7860端口被其他程序用了。你可以：