通义千问3-4B-Instruct-2507快速上手：5步配置跨域API接口

本文介绍了如何在星图GPU平台上自动化部署通义千问3-4B-Instruct-2507镜像，并快速配置跨域API接口。通过该平台，用户可以轻松将这一轻量化大语言模型转化为网络服务，实现诸如智能对话、文本生成等应用场景，便于集成到网页或移动端应用中进行调用。

一筐猪的头发丝

84人浏览 · 2026-03-19 01:14:19

一筐猪的头发丝 · 2026-03-19 01:14:19 发布

通义千问3-4B-Instruct-2507快速上手：5步配置跨域API接口

1. 从本地模型到网络服务：为什么需要跨域配置？

你刚刚在本地电脑上成功部署了通义千问3-4B-Instruct-2507模型，看着它在命令行里流畅地回答问题，感觉很不错。但当你兴奋地想把这个能力集成到自己的网页应用里时，问题来了——浏览器弹出一个红色的错误提示：“CORS header ‘Access-Control-Allow-Origin’ missing”。

这不是你的代码写错了，而是遇到了现代Web开发中一个常见但令人头疼的问题：跨域请求限制。

简单来说，浏览器出于安全考虑，默认不允许网页从一个域名（比如你的前端页面在localhost:3000）去请求另一个域名或端口（比如你的模型服务在localhost:8000）的资源。这就是所谓的“同源策略”。

对于通义千问3-4B-Instruct-2507这样的端侧模型来说，这个问题尤其关键。这个模型最大的优势就是“手机可跑、长文本、全能型”，你肯定希望能在各种设备上调用它，而不仅仅是本地命令行。

想象一下这些场景：

你想在手机浏览器里访问运行在树莓派上的模型
你的前端开发同事需要调用你本地部署的模型API
你想把模型集成到公司内部的管理系统中

所有这些场景都需要解决跨域问题。好消息是，配置起来并不复杂，跟着我走完下面5个步骤，你就能让任何设备安全地调用你的模型服务。

2. 环境检查与准备工作

在开始配置之前，我们先确保一切就绪。这个过程就像出门旅行前检查行李一样，虽然有点繁琐，但能避免路上遇到麻烦。

2.1 确认模型正常运行

首先，确保你的通义千问3-4B-Instruct-2507模型已经正确部署并能正常工作。无论你是用Ollama、vLLM还是直接通过Transformers加载，先做个简单的测试：

# 测试模型是否能正常响应
from transformers import AutoTokenizer, AutoModelForCausalLM
import torch

# 根据你的实际路径调整
model_path = "Qwen/Qwen3-4B-Instruct-2507"  # 或者本地路径

try:
    tokenizer = AutoTokenizer.from_pretrained(model_path)
    model = AutoModelForCausalLM.from_pretrained(
        model_path,
        device_map="auto",
        torch_dtype=torch.float16,
        low_cpu_mem_usage=True
    )
    
    # 简单测试
    prompt = "你好，请介绍一下你自己。"
    inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
    
    with torch.no_grad():
        outputs = model.generate(**inputs, max_new_tokens=100)
    
    response = tokenizer.decode(outputs[0], skip_special_tokens=True)
    print("✅ 模型测试成功！")
    print(f"模型回复：{response}")
    
except Exception as e:
    print(f"❌ 模型加载失败：{e}")
    print("请先确保模型正确下载并可以运行")

如果看到模型正常回复，说明基础环境没问题。如果遇到问题，可能需要先解决模型加载或依赖包的问题。

2.2 安装必要的Python包

接下来，我们需要安装创建API服务所需的包。如果你已经有一个FastAPI项目，可以跳过这一步；如果没有，打开终端执行：

# 创建并激活虚拟环境（推荐）
python -m venv qwen_api_env
source qwen_api_env/bin/activate  # Linux/macOS
# 或者 qwen_api_env\Scripts\activate  # Windows

# 安装核心依赖
pip install fastapi uvicorn

# 根据你的模型加载方式选择安装
# 如果你用Transformers（最常见的方式）
pip install torch transformers accelerate

# 如果你用vLLM（性能更好，支持并发）
# pip install vllm

# 如果你用GGUF量化版本（内存占用更小）
# pip install llama-cpp-python

安装完成后，可以用这个命令检查FastAPI是否安装成功：

python -c "import fastapi; print(f'FastAPI版本：{fastapi.__version__}')"

准备工作就绪，我们现在可以开始构建API服务了。

3. 创建支持跨域的FastAPI服务

这是整个配置的核心部分。我们将创建一个完整的FastAPI应用，它不仅提供模型推理接口，还内置了跨域支持。

3.1 基础API服务代码

创建一个新文件，命名为qwen_api.py，然后写入以下内容：

from fastapi import FastAPI, HTTPException
from fastapi.middleware.cors import CORSMiddleware
from pydantic import BaseModel
from typing import Optional
import torch
from transformers import AutoTokenizer, AutoModelForCausalLM
import logging

# 设置日志
logging.basicConfig(level=logging.INFO)
logger = logging.getLogger(__name__)

# 初始化FastAPI应用
app = FastAPI(
    title="通义千问3-4B-Instruct-2507 API服务",
    description="提供Qwen3-4B-Instruct-2507模型的HTTP API接口",
    version="1.0.0"
)

# ============================================
# ✅ 关键步骤1：配置CORS跨域中间件
# ============================================
app.add_middleware(
    CORSMiddleware,
    allow_origins=["*"],  # 允许所有来源访问（开发环境）
    allow_credentials=True,
    allow_methods=["*"],   # 允许所有HTTP方法
    allow_headers=["*"],   # 允许所有请求头
)

# 定义请求数据结构
class ChatRequest(BaseModel):
    """聊天请求结构"""
    messages: list  # 对话历史
    max_tokens: Optional[int] = 512  # 最大生成token数
    temperature: Optional[float] = 0.7  # 温度参数
    top_p: Optional[float] = 0.9  # 核采样参数
    stream: Optional[bool] = False  # 是否流式输出

class CompletionRequest(BaseModel):
    """补全请求结构"""
    prompt: str  # 输入文本
    max_tokens: Optional[int] = 512
    temperature: Optional[float] = 0.7
    top_p: Optional[float] = 0.9

# 全局变量存储模型和tokenizer
tokenizer = None
model = None

def load_model():
    """加载模型到内存"""
    global tokenizer, model
    
    try:
        # 根据你的实际情况修改模型路径
        model_path = "./models/Qwen3-4B-Instruct-2507"  # 本地路径
        # 或者使用HuggingFace模型ID
        # model_path = "Qwen/Qwen3-4B-Instruct-2507"
        
        logger.info(f"开始加载模型：{model_path}")
        
        tokenizer = AutoTokenizer.from_pretrained(
            model_path,
            trust_remote_code=True
        )
        
        model = AutoModelForCausalLM.from_pretrained(
            model_path,
            device_map="auto",  # 自动选择设备（GPU/CPU）
            torch_dtype=torch.float16,  # 使用半精度减少内存
            low_cpu_mem_usage=True,
            trust_remote_code=True
        )
        
        logger.info("✅ 模型加载完成！")
        
    except Exception as e:
        logger.error(f"❌ 模型加载失败：{e}")
        raise

@app.on_event("startup")
async def startup_event():
    """应用启动时加载模型"""
    load_model()

@app.get("/")
async def root():
    """根路径，返回服务信息"""
    return {
        "service": "Qwen3-4B-Instruct-2507 API",
        "version": "1.0.0",
        "status": "running",
        "endpoints": {
            "/chat": "聊天接口（OpenAI兼容格式）",
            "/completions": "文本补全接口",
            "/health": "健康检查",
            "/docs": "API文档（Swagger UI）"
        }
    }

@app.get("/health")
async def health_check():
    """健康检查接口"""
    if model is None or tokenizer is None:
        return {"status": "error", "message": "模型未加载"}
    
    # 简单测试模型是否正常
    try:
        test_input = tokenizer("测试", return_tensors="pt").to(model.device)
        _ = model.generate(**test_input, max_new_tokens=1)
        return {
            "status": "healthy",
            "model": "Qwen3-4B-Instruct-2507",
            "device": str(model.device)
        }
    except Exception as e:
        return {"status": "unhealthy", "error": str(e)}

@app.post("/v1/chat/completions")
async def chat_completion(request: ChatRequest):
    """
    OpenAI兼容的聊天接口
    支持messages格式：[{"role": "user", "content": "你好"}]
    """
    if model is None or tokenizer is None:
        raise HTTPException(status_code=503, detail="模型未就绪")
    
    try:
        # 将messages格式转换为Qwen的输入格式
        # Qwen使用特殊的对话格式，这里做简单转换
        formatted_prompt = ""
        for msg in request.messages:
            role = msg.get("role", "user")
            content = msg.get("content", "")
            if role == "system":
                formatted_prompt += f"<|im_start|>system\n{content}<|im_end|>\n"
            elif role == "user":
                formatted_prompt += f"<|im_start|>user\n{content}<|im_end|>\n"
            elif role == "assistant":
                formatted_prompt += f"<|im_start|>assistant\n{content}<|im_end|>\n"
        
        # 添加assistant开始标记
        formatted_prompt += "<|im_start|>assistant\n"
        
        # 编码输入
        inputs = tokenizer(formatted_prompt, return_tensors="pt").to(model.device)
        
        # 生成回复
        with torch.no_grad():
            outputs = model.generate(
                **inputs,
                max_new_tokens=request.max_tokens,
                temperature=request.temperature,
                top_p=request.top_p,
                do_sample=True,
                pad_token_id=tokenizer.eos_token_id
            )
        
        # 解码回复
        full_response = tokenizer.decode(outputs[0], skip_special_tokens=True)
        
        # 提取assistant的回复部分
        response_text = full_response[len(formatted_prompt):].strip()
        
        return {
            "choices": [{
                "message": {
                    "role": "assistant",
                    "content": response_text
                },
                "finish_reason": "length" if len(outputs[0]) >= request.max_tokens else "stop"
            }],
            "usage": {
                "prompt_tokens": inputs.input_ids.shape[1],
                "completion_tokens": len(outputs[0]) - inputs.input_ids.shape[1],
                "total_tokens": len(outputs[0])
            }
        }
        
    except Exception as e:
        logger.error(f"生成失败：{e}")
        raise HTTPException(status_code=500, detail=str(e))

@app.post("/v1/completions")
async def text_completion(request: CompletionRequest):
    """文本补全接口（简单格式）"""
    if model is None or tokenizer is None:
        raise HTTPException(status_code=503, detail="模型未就绪")
    
    try:
        inputs = tokenizer(request.prompt, return_tensors="pt").to(model.device)
        
        with torch.no_grad():
            outputs = model.generate(
                **inputs,
                max_new_tokens=request.max_tokens,
                temperature=request.temperature,
                top_p=request.top_p,
                do_sample=True,
                pad_token_id=tokenizer.eos_token_id
            )
        
        response_text = tokenizer.decode(outputs[0], skip_special_tokens=True)
        
        # 移除输入部分，只返回新生成的内容
        generated_text = response_text[len(request.prompt):].strip()
        
        return {
            "choices": [{
                "text": generated_text,
                "index": 0,
                "finish_reason": "length" if len(outputs[0]) >= request.max_tokens else "stop"
            }],
            "usage": {
                "prompt_tokens": inputs.input_ids.shape[1],
                "completion_tokens": len(outputs[0]) - inputs.input_ids.shape[1],
                "total_tokens": len(outputs[0])
            }
        }
        
    except Exception as e:
        logger.error(f"生成失败：{e}")
        raise HTTPException(status_code=500, detail=str(e))

if __name__ == "__main__":
    import uvicorn
    uvicorn.run(app, host="0.0.0.0", port=8000)

这段代码做了几件重要的事情：

创建了一个完整的FastAPI应用
添加了CORS中间件，允许跨域请求
实现了两个主要接口：聊天接口和补全接口
提供了健康检查接口
支持OpenAI兼容的API格式

3.2 关键配置解析：CORS中间件

让我们仔细看看第24-30行的CORS配置：

app.add_middleware(
    CORSMiddleware,
    allow_origins=["*"],  # 这里配置允许的来源
    allow_credentials=True,
    allow_methods=["*"],   # 允许所有HTTP方法
    allow_headers=["*"],   # 允许所有请求头
)

allow_origins=["*"]：这是开发环境下的配置，允许所有来源访问。在生产环境中，你应该替换为具体的前端域名，比如["https://your-app.com", "http://localhost:3000"]
allow_credentials=True：允许携带认证信息（如cookies）
allow_methods=["*"]：允许所有HTTP方法（GET、POST、PUT等）
allow_headers=["*"]：允许所有请求头

这个配置是解决跨域问题的核心。没有它，浏览器会阻止前端页面调用你的API。

4. 启动服务并绑定到所有网络接口

代码写好了，现在我们来启动服务。这一步有个关键点：绑定地址。

4.1 正确的启动方式

保存上面的代码为qwen_api.py，然后在终端中运行：

# 关键参数：--host 0.0.0.0
uvicorn qwen_api:app --host 0.0.0.0 --port 8000 --reload

让我解释一下这些参数：

--host 0.0.0.0：这是最关键的部分！0.0.0.0表示监听所有可用的网络接口，包括本地回环地址（127.0.0.1）和局域网IP地址。这样其他设备就能访问你的服务了。
--port 8000：指定服务运行的端口，你可以改成其他未被占用的端口
--reload：开发时使用，代码修改后自动重启服务

如果你看到类似这样的输出，说明服务启动成功了：

INFO:     Started server process [12345]
INFO:     Waiting for application startup.
INFO:     Application startup complete.
INFO:     Uvicorn running on http://0.0.0.0:8000 (Press CTRL+C to quit)

4.2 验证服务是否正常工作

打开浏览器，访问以下几个地址检查服务状态：

API文档页面：http://localhost:8000/docs
- 这里可以看到所有可用的接口，并且可以交互式测试
健康检查接口：http://localhost:8000/health
- 应该返回类似{"status":"healthy","model":"Qwen3-4B-Instruct-2507","device":"cuda:0"}的JSON
根路径：http://localhost:8000/
- 显示服务的基本信息

如果这些都能正常访问，说明你的API服务已经在本地运行起来了。

4.3 获取你的局域网IP地址

为了让其他设备能访问，你需要知道本机在局域网中的IP地址：

在Windows上：

ipconfig

找到"无线局域网适配器 WLAN"或"以太网适配器以太网"下的IPv4地址。

在macOS/Linux上：

ifconfig | grep "inet " | grep -v 127.0.0.1

或者用更简单的方式：

hostname -I

你会看到一个类似192.168.1.100的地址，记下它。

5. 配置防火墙和客户端调用

服务跑起来了，IP地址也有了，但其他设备可能还是访问不了。这是因为操作系统的防火墙在保护你的电脑。

5.1 配置防火墙规则

Windows系统：

打开"Windows Defender 防火墙"
点击"高级设置"
在左侧选择"入站规则"
右侧点击"新建规则"
选择"端口"，点击"下一步"
选择"TCP"，特定本地端口输入8000
选择"允许连接"，点击"下一步"
保持所有网络类型选中，点击"下一步"
名称输入"Qwen3-4B API Port"，点击"完成"

macOS系统：

# 临时开放端口（重启后失效）
sudo pfctl -f /etc/pf.conf  # 如果pf未运行则先启动
echo "pass in proto tcp from any to any port 8000" | sudo pfctl -f -

Linux系统（Ubuntu/Debian）：

# 使用ufw防火墙
sudo ufw allow 8000/tcp
sudo ufw reload

# 或者使用iptables
sudo iptables -A INPUT -p tcp --dport 8000 -j ACCEPT
sudo iptables-save > /etc/iptables/rules.v4

5.2 从其他设备测试访问

现在，从同一局域网内的其他设备（比如手机或另一台电脑）打开浏览器，访问：

http://[你的IP地址]:8000/health

例如，如果你的IP是192.168.1.100，就访问：

http://192.168.1.100:8000/health

如果看到健康检查返回正常，恭喜你！跨网络访问已经配置成功了。

5.3 前端调用示例

现在让我们看看前端代码如何调用这个API。这里提供几个常见的例子：

使用原生JavaScript：

// 调用聊天接口
async function callQwenAPI() {
    const response = await fetch('http://192.168.1.100:8000/v1/chat/completions', {
        method: 'POST',
        headers: {
            'Content-Type': 'application/json',
        },
        body: JSON.stringify({
            messages: [
                { role: 'system', content: '你是一个有帮助的助手。' },
                { role: 'user', content: '用简单的语言解释什么是人工智能？' }
            ],
            max_tokens: 300,
            temperature: 0.7
        })
    });
    
    const data = await response.json();
    console.log('AI回复：', data.choices[0].message.content);
    return data;
}

// 调用补全接口
async function callCompletionAPI() {
    const response = await fetch('http://192.168.1.100:8000/v1/completions', {
        method: 'POST',
        headers: {
            'Content-Type': 'application/json',
        },
        body: JSON.stringify({
            prompt: '写一个Python函数，计算斐波那契数列：',
            max_tokens: 200,
            temperature: 0.8
        })
    });
    
    const data = await response.json();
    console.log('生成的代码：', data.choices[0].text);
    return data;
}

使用axios（更推荐）：

import axios from 'axios';

const apiClient = axios.create({
    baseURL: 'http://192.168.1.100:8000',
    timeout: 30000, // 30秒超时
});

// 封装聊天函数
export async function chatWithQwen(messages, options = {}) {
    try {
        const response = await apiClient.post('/v1/chat/completions', {
            messages,
            max_tokens: options.maxTokens || 512,
            temperature: options.temperature || 0.7,
            top_p: options.topP || 0.9,
            stream: options.stream || false
        });
        
        return response.data;
    } catch (error) {
        console.error('调用API失败：', error);
        throw error;
    }
}

// 使用示例
const messages = [
    { role: 'user', content: '帮我写一个购物清单，包括水果、蔬菜和日用品' }
];

chatWithQwen(messages)
    .then(data => {
        console.log('AI回复：', data.choices[0].message.content);
    })
    .catch(error => {
        console.error('出错了：', error);
    });

在React组件中使用：

import React, { useState } from 'react';
import axios from 'axios';

function QwenChatComponent() {
    const [input, setInput] = useState('');
    const [response, setResponse] = useState('');
    const [loading, setLoading] = useState(false);
    
    const API_URL = 'http://192.168.1.100:8000/v1/chat/completions';
    
    const sendMessage = async () => {
        if (!input.trim()) return;
        
        setLoading(true);
        try {
            const result = await axios.post(API_URL, {
                messages: [{ role: 'user', content: input }],
                max_tokens: 500,
                temperature: 0.7
            });
            
            setResponse(result.data.choices[0].message.content);
            setInput('');
        } catch (error) {
            console.error('请求失败：', error);
            setResponse('抱歉，请求出错了，请稍后重试。');
        } finally {
            setLoading(false);
        }
    };
    
    return (
        <div className="chat-container">
            <div className="response-area">
                {response || '等待输入...'}
            </div>
            
            <div className="input-area">
                <textarea
                    value={input}
                    onChange={(e) => setInput(e.target.value)}
                    placeholder="输入你的问题..."
                    disabled={loading}
                />
                <button onClick={sendMessage} disabled={loading}>
                    {loading ? '生成中...' : '发送'}
                </button>
            </div>
        </div>
    );
}

export default QwenChatComponent;

5.4 常见问题排查

如果你在测试中遇到问题，可以按照这个清单排查：

服务未启动
- 检查：终端是否显示服务运行中？
- 解决：确保使用uvicorn qwen_api:app --host 0.0.0.0 --port 8000启动
端口被占用
- 检查：netstat -an | grep 8000（Linux/macOS）或netstat -ano | findstr :8000（Windows）
- 解决：换一个端口，如--port 8080
防火墙阻止
- 检查：从本机访问http://localhost:8000/health正常，但从其他设备访问失败
- 解决：按照上面的步骤配置防火墙
IP地址错误
- 检查：ipconfig或ifconfig获取正确的局域网IP
- 解决：确保使用正确的IP地址
CORS配置问题
- 检查：浏览器控制台是否有CORS错误
- 解决：确保代码中正确添加了CORS中间件
模型加载失败
- 检查：/health接口返回错误
- 解决：检查模型路径是否正确，是否有足够内存

6. 生产环境安全配置建议

到目前为止，我们使用的是开发配置，允许所有来源访问。这在生产环境中是不安全的。下面是一些安全加固的建议。

6.1 限制允许的域名

修改CORS配置，只允许特定的前端域名访问：

# 生产环境配置
allowed_origins = [
    "https://your-production-app.com",
    "https://admin.your-app.com",
    "http://localhost:3000",  # 开发环境
    "http://localhost:8080",  # 备用开发端口
]

app.add_middleware(
    CORSMiddleware,
    allow_origins=allowed_origins,  # 只允许列表中的域名
    allow_credentials=True,
    allow_methods=["GET", "POST", "OPTIONS"],  # 只允许必要的HTTP方法
    allow_headers=["Content-Type", "Authorization"],  # 只允许必要的请求头
)

6.2 添加API密钥认证

为API添加简单的Token认证：

from fastapi import Depends, HTTPException, Header
from typing import Optional

# 模拟的API密钥存储（生产环境应该用数据库或配置管理）
VALID_API_KEYS = {
    "your-secret-key-123": "web-frontend",
    "another-secret-key-456": "mobile-app",
}

async def verify_api_key(
    authorization: Optional[str] = Header(None)
):
    """验证API密钥"""
    if not authorization:
        raise HTTPException(
            status_code=401,
            detail="缺少Authorization头"
        )
    
    # 期望格式：Bearer your-secret-key-123
    if not authorization.startswith("Bearer "):
        raise HTTPException(
            status_code=401,
            detail="Authorization格式错误，应为Bearer <token>"
        )
    
    token = authorization[7:]  # 移除"Bearer "前缀
    
    if token not in VALID_API_KEYS:
        raise HTTPException(
            status_code=401,
            detail="无效的API密钥"
        )
    
    return VALID_API_KEYS[token]  # 返回客户端标识

# 在需要认证的接口上添加依赖
@app.post("/v1/chat/completions")
async def chat_completion(
    request: ChatRequest,
    client_id: str = Depends(verify_api_key)  # 添加认证依赖
):
    logger.info(f"来自客户端 {client_id} 的请求")
    # ... 原有的生成逻辑 ...

前端调用时需要添加Authorization头：

fetch('http://your-server:8000/v1/chat/completions', {
    method: 'POST',
    headers: {
        'Content-Type': 'application/json',
        'Authorization': 'Bearer your-secret-key-123'
    },
    body: JSON.stringify({...})
})

6.3 添加请求频率限制

防止API被滥用：

from slowapi import Limiter, _rate_limit_exceeded_handler
from slowapi.util import get_remote_address
from slowapi.errors import RateLimitExceeded

# 初始化限流器
limiter = Limiter(key_func=get_remote_address)
app.state.limiter = limiter
app.add_exception_handler(RateLimitExceeded, _rate_limit_exceeded_handler)

# 在接口上添加限流装饰器
from slowapi import Limiter, _rate_limit_exceeded_handler
from slowapi.util import get_remote_address
from slowapi.errors import RateLimitExceeded

limiter = Limiter(key_func=get_remote_address)
app.state.limiter = limiter
app.add_exception_handler(RateLimitExceeded, _rate_limit_exceeded_handler)

@app.post("/v1/chat/completions")
@limiter.limit("10/minute")  # 每分钟最多10次请求
async def chat_completion(request: ChatRequest):
    # ... 原有的生成逻辑 ...

6.4 使用Nginx作为反向代理

在生产环境中，建议使用Nginx作为反向代理，可以提供更多功能：

HTTPS支持：使用Let's Encrypt免费SSL证书
负载均衡：如果部署多个实例
静态文件服务：同时托管前端页面
访问日志：记录所有请求
限流和缓存：更强大的控制

简单的Nginx配置示例：

server {
    listen 443 ssl;
    server_name your-domain.com;
    
    ssl_certificate /path/to/cert.pem;
    ssl_certificate_key /path/to/key.pem;
    
    # 限制请求体大小
    client_max_body_size 10M;
    
    location /api/ {
        # 转发到FastAPI服务
        proxy_pass http://127.0.0.1:8000/;
        
        # 传递必要的头信息
        proxy_set_header Host $host;
        proxy_set_header X-Real-IP $remote_addr;
        proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
        proxy_set_header X-Forwarded-Proto $scheme;
        
        # 超时设置
        proxy_read_timeout 300s;
        proxy_connect_timeout 75s;
        
        # CORS头（也可以在FastAPI中设置）
        add_header Access-Control-Allow-Origin "https://your-frontend.com";
        add_header Access-Control-Allow-Methods "GET, POST, OPTIONS";
        add_header Access-Control-Allow-Headers "Content-Type, Authorization";
    }
    
    # 静态文件服务（前端页面）
    location / {
        root /var/www/your-frontend;
        try_files $uri $uri/ /index.html;
    }
}