教大家claude配置NVIDIA API这篇文章教大家配置使用NVIDIA的模型,近期有不少友友反馈NVIDIA的z-ai/glm5配置好后,容易出现time out失败等情况。

我也去验证了一下,确实使用z-ai/glm5,会时好时坏。

看了一下NVIDIA官网,有Deprecation in 3d的内容,不知晓是否与这个有关,或者是算力负荷的缘故。

但是如果使用起来会时不时出现问题,也不是办法。

查找了一下目前可以免费使用GLM5.1的平台,大致如下:

平台 接口兼容 免费额度 速度 / 稳定性
Trae 原生 免费使用 排队
阿里云 OpenAI 100 万 Token
华为云 自研 + 兼容 体验 高(昇腾)
Modal OpenAI 限时免费 一般(限速)

前面三个没啥好介绍的,大家一看也知道如何去使用,这里主要介绍一下Modal。Modal 平台,是在2026 年 4 月 15 日宣布,限时免费提供智谱 AI 的 GLM-5.1 模型 API 调用服务。

大家按照下述步骤注册,申请API token,并参考我配置NVIDIA那篇文章,即可配置好并使用。

1、访问 Modal 官方页面:https://modal.com/glm-5-endpoint,如下图:

2、注册 / 登录账号后,点左侧的「Create token」,输入一个token名称,这个名称随便输入,然后弹框里就出来了API token。这里注意,API token只显示一次,一定复制保存好。

3、将刚刚生成的API token以及https://api.us-west-2.modal.direct/v1配置到CLIProxyAPI中。

 因为Modal和NVIDIA一样是OpenAI 兼容方式,直接照抄上篇文章的设置方式即可。Claude code如何设置,我在上篇文章中也已提及,这里就不再展开。

CLIProxyAPI中,配置时Modal可用的模型列表如下:

我自己选择使用的是zai-org/GLM-5-FP8-2

最终验证使用如下

好了,这次的分享就是上述内容,大家觉得有用的话,帮忙点个赞。

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐