NVIDIA的GLM-5时好时坏后,我建议大家去白嫖一下modal
本文介绍了如何配置使用NVIDIA的GLM5模型API,指出该模型存在timeout等不稳定问题。作者推荐了几个免费使用GLM5.1的平台,包括Trae、阿里云和华为云,并重点介绍了Modal平台的限时免费服务。详细说明了Modal的注册流程:访问官网创建token,复制保存API密钥,并配置到CLIProxyAPI中。文章还提供了Modal可用的模型列表,建议选择zai-org/GLM-5-FP
教大家claude配置NVIDIA API这篇文章教大家配置使用NVIDIA的模型,近期有不少友友反馈NVIDIA的z-ai/glm5配置好后,容易出现time out失败等情况。
我也去验证了一下,确实使用z-ai/glm5,会时好时坏。
看了一下NVIDIA官网,有Deprecation in 3d的内容,不知晓是否与这个有关,或者是算力负荷的缘故。

但是如果使用起来会时不时出现问题,也不是办法。
查找了一下目前可以免费使用GLM5.1的平台,大致如下:
| 平台 | 接口兼容 | 免费额度 | 速度 / 稳定性 |
|---|---|---|---|
| Trae | 原生 | 免费使用 | 排队 |
| 阿里云 | OpenAI | 100 万 Token | 高 |
| 华为云 | 自研 + 兼容 | 体验 | 高(昇腾) |
| Modal | OpenAI | 限时免费 | 一般(限速) |
前面三个没啥好介绍的,大家一看也知道如何去使用,这里主要介绍一下Modal。Modal 平台,是在2026 年 4 月 15 日宣布,限时免费提供智谱 AI 的 GLM-5.1 模型 API 调用服务。
大家按照下述步骤注册,申请API token,并参考我配置NVIDIA那篇文章,即可配置好并使用。
1、访问 Modal 官方页面:https://modal.com/glm-5-endpoint,如下图:

2、注册 / 登录账号后,点左侧的「Create token」,输入一个token名称,这个名称随便输入,然后弹框里就出来了API token。这里注意,API token只显示一次,一定复制保存好。

3、将刚刚生成的API token以及https://api.us-west-2.modal.direct/v1配置到CLIProxyAPI中。
因为Modal和NVIDIA一样是OpenAI 兼容方式,直接照抄上篇文章的设置方式即可。Claude code如何设置,我在上篇文章中也已提及,这里就不再展开。
CLIProxyAPI中,配置时Modal可用的模型列表如下:

我自己选择使用的是zai-org/GLM-5-FP8-2
最终验证使用如下
好了,这次的分享就是上述内容,大家觉得有用的话,帮忙点个赞。
更多推荐



所有评论(0)