日常用大模型做Agent、自动化脚本和内容生成。2026年,大模型API已经高度标准化(基本都兼容OpenAI格式),调用门槛很低,但很多人还卡在密钥获取、接口兼容、限速和成本上。本文手把手带你从零开始调用主流大模型API(OpenAI、Claude、Gemini、Grok等),包括:

  • 环境准备
  • 基础调用示例(Python)
  • 多模型统一接入(中转站方案)
  • 常见问题 & 优化技巧

1. 为什么2026年调用API这么简单?主流厂商基本统一了OpenAI兼容格式:

  • 请求端点:/v1/chat/completions
  • 参数:model、messages、temperature、max_tokens等
  • 响应:choices[0].message.content

所以你学一家,就能迁移到几乎所有模型。

2. 准备工作(5分钟搞定)环境:

  • Python 3.9+
  • 安装核心库:pip install openai anthropic google-generativeai groq requests

获取API Key(2026年最新途径):

3. Python基础调用示例(OpenAI格式兼容)

示例1:OpenAI / Grok / 兼容中转站(最常用)python

from openai import OpenAI
import os

# 配置(推荐用环境变量,避免泄露)
client = OpenAI(
    api_key=os.getenv("OPENAI_API_KEY"),          # 你的Key
    base_url="https://api.openai.com/v1"          # 官方;中转站改这里
    # base_url="https://prakasa.me/v1"            # 示例:用Prakasa中转
)

response = client.chat.completions.create(
    model="gpt-4o-mini",  # 或 "grok-3" / "claude-3.5-sonnet"(中转支持)
    messages=[
        {"role": "system", "content": "你是一个专业的Python助手。"},
        {"role": "user", "content": "写一个快速排序的Python函数"}
    ],
    temperature=0.7,
    max_tokens=800,
    stream=False  # True可流式输出
)

print(response.choices[0].message.content)

示例2:Claude(Anthropic原生接口)python

from anthropic import Anthropic
import os

client = Anthropic(api_key=os.getenv("ANTHROPIC_API_KEY"))

message = client.messages.create(
    model="claude-3-5-sonnet-20241022",
    max_tokens=1024,
    messages=[
        {"role": "user", "content": "解释Transformer的self-attention机制,用中文"}
    ]
)

print(message.content[0].text)

示例3:Gemini(Google官方)python

import google.generativeai as genai
import os

genai.configure(api_key=os.getenv("GEMINI_API_KEY"))

model = genai.GenerativeModel("gemini-2.0-flash")
response = model.generate_content("给我讲讲2026年AI Agent的发展趋势")

print(response.text)

4. 统一多模型接入:推荐用中转站(省钱+稳定)直接连官方常遇到:

  • 需要翻墙
  • 封号风险
  • 多Key管理麻烦
  • 价格贵

解决方案:用API中转站(兼容OpenAI格式,一Key调用所有模型)。推荐方式:

  • 注册Praka ai、PoloAPI、4SAPI、神马中转等→ 获取API Key
  • 改base_url和api_key,代码几乎不用动

示例(Prakasa中转接入):python

client = OpenAI(
    api_key="sk-你的Prakasa-Key",
    base_url="https://prakasa.me/v1"
)

# 模型名可填 claude-4-opus、gemini-3-pro、grok-4 等
response = client.chat.completions.create(
    model="claude-4-opus",
    messages=[{"role": "user", "content": "你好"}]
)

优点:

  • 国内直连,低延迟
  • 支持国内支付方式,精确token计费
  • 支持一键切换模型,批量集采更便宜

5. 高级技巧 & 避坑

  • 限速处理:用tenacity库重试python

    from tenacity import retry, stop_after_attempt, wait_exponential
    
    @retry(stop=stop_after_attempt(5), wait=wait_exponential(multiplier=1, min=4, max=10))
    def call_api(prompt):
        # 调用代码
  • 成本控制:设置max_tokens=500,用temperature=0.3减少胡说
  • 流式输出(实时打字效果):python

    stream = client.chat.completions.create(..., stream=True)
    for chunk in stream:
        if chunk.choices[0].delta.content:
            print(chunk.choices[0].delta.content, end="")
  • 报错常见:
    • 401:Key无效/过期
    • 429:限速 → 加sleep或升级套餐
    • 400:model名写错(中转站模型列表要查官网)

6. 总结 & 进阶建议大模型API调用本质就是发HTTP POST + 解析JSON,学会OpenAI格式就能玩转90%的模型。下一步推荐:

  • 用LangChain / LlamaIndex 封装多模型链
  • 结合OpenClaw(龙虾)做本地Agent
  • 监控token消耗(用tiktoken库估算)

有问题欢迎评论区留言,我看到会回复!也欢迎收藏,转发给需要的朋友~

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐