NVIDIA的GLM-5时好时坏后，我建议大家去白嫖一下modal

本文介绍了如何配置使用NVIDIA的GLM5模型API，指出该模型存在timeout等不稳定问题。作者推荐了几个免费使用GLM5.1的平台，包括Trae、阿里云和华为云，并重点介绍了Modal平台的限时免费服务。详细说明了Modal的注册流程：访问官网创建token，复制保存API密钥，并配置到CLIProxyAPI中。文章还提供了Modal可用的模型列表，建议选择zai-org/GLM-5-FP

liyou125

1605人浏览 · 2026-04-17 17:35:23

liyou125 · 2026-04-17 17:35:23 发布

教大家claude配置NVIDIA API这篇文章教大家配置使用NVIDIA的模型，近期有不少友友反馈NVIDIA的z-ai/glm5配置好后，容易出现time out失败等情况。

我也去验证了一下，确实使用z-ai/glm5，会时好时坏。

看了一下NVIDIA官网，有Deprecation in 3d的内容，不知晓是否与这个有关，或者是算力负荷的缘故。

但是如果使用起来会时不时出现问题，也不是办法。

查找了一下目前可以免费使用GLM5.1的平台，大致如下：

平台	接口兼容	免费额度	速度 / 稳定性
Trae	原生	免费使用	排队
阿里云	OpenAI	100 万 Token	高
华为云	自研 + 兼容	体验	高（昇腾）
Modal	OpenAI	限时免费	一般（限速）

前面三个没啥好介绍的，大家一看也知道如何去使用，这里主要介绍一下Modal。Modal 平台，是在2026 年 4 月 15 日宣布，限时免费提供智谱 AI 的 GLM-5.1 模型 API 调用服务。

大家按照下述步骤注册，申请API token，并参考我配置NVIDIA那篇文章，即可配置好并使用。

1、访问 Modal 官方页面：https://modal.com/glm-5-endpoint，如下图：

2、注册 / 登录账号后，点左侧的「Create token」，输入一个token名称，这个名称随便输入，然后弹框里就出来了API token。这里注意，API token只显示一次，一定复制保存好。

3、将刚刚生成的API token以及https://api.us-west-2.modal.direct/v1配置到CLIProxyAPI中。

因为Modal和NVIDIA一样是OpenAI 兼容方式，直接照抄上篇文章的设置方式即可。Claude code如何设置，我在上篇文章中也已提及，这里就不再展开。

CLIProxyAPI中，配置时Modal可用的模型列表如下：

我自己选择使用的是zai-org/GLM-5-FP8-2

最终验证使用如下

好了，这次的分享就是上述内容，大家觉得有用的话，帮忙点个赞。

DeepSeek技术社区

欢迎加入DeepSeek 技术社区。在这里，你可以找到志同道合的朋友，共同探索AI技术的奥秘。

更多推荐

cover

Spring AI + DeepSeek 入门实战：先跑通第一个对话接口

DeepSeek技术社区

cover

Grok 类实时检索的陷阱：如何避免污染 RAG 事实链

DeepSeek技术社区

cover

DeepSeek-V4 长上下文 RAG 实践：何时该用混合检索 vs 纯向量搜索？

DeepSeek技术社区

所有评论(0)

查看更多评论

liyou125

已为社区贡献2条内容