deepseek云端免费部署及调用教程
当前大家对AI的使用热情高涨,deepseek因为其在大模型中的优秀表现而被大家熟知。但最近其官网服务的承载能力显然满足不了大家不断增长的使用需求,经常出现稍后重试的情况。同时也有人希望能自己来部署大模型,使用RAG,满足特定需求。但大模型对服务硬件配置的高要求,使得很多人无法自己在自己电脑上运行一个基本能玩的大模型。那么寻找免费的云服务就是一个很自然的选择,很多云厂商都有免费资源可供短期使用。这里做一个简单的大模型在云端部署教程做参考,目标是完成大模型云端部署并可在本地进行访问,完成定制个人AI的第一步。
资源选择
寻找云资源是第一步,现在有大模型的服务商如together.ai,老牌云厂商如亚马逊AWS、微软Azure、阿里云等,甚至包括一些模型平台如huggingface都支持大模型的部署使用,也有免费资源可用。
- huggingface提供空间使用免费硬件资源创建大模型

- together.ai提供免费额度可选择任意大模型对话,免费额度1美元。
上面平台虽然有免费额度可用,但不支持手动自定义选择模型,如果要手动部署模型,这平台免费模式下就无法满足。那么我们可以尝试使用阿里云作为入门,阿里云对新人提供了500人民币的免费额度来支持自定义模型选择。
平台使用注意事项
注册开通PAI
注册阿里云,开通PAI后,即可领取免费额度。

领取免费资源
在免费试用页面领取PAI-EAS资源使用额度500元,有效期1个月。

部署模型
-
进入Model Gallery页面。
-
登录PAI控制台。
-
在顶部左上角根据实际情况选择地域。
-
在左侧导航栏选择工作空间列表,单击指定工作空间名称,进入对应工作空间。
-
在左侧导航栏选择快速开始 > Model Gallery。
-
-
在Model Gallery页面右侧的模型列表中,找到需要部署的模型卡片,例如DeepSeek-R1-Distill-Qwen-7B模型(免费资源下可用的最大参数模型),单击卡片下部署按钮,出现如下配置选项。
-
将部署资源选择为免费资源,即试用活动下的资源,资源费用会在500的额度中按照运行时长扣除。
- 选择后直接部署即可,推荐使用BladeLLM部署方式,等待服务器配置完成,即可使用。
使用模型
在模型在线服务(EAS)下找到部署好的服务
部署完成后,可以在页面上选择在线调试,按照入参格式来发送请求。接口即参数如下:
接口使用参考链接如下:
部署DeepSeek-V3、DeepSeek-R1模型_人工智能平台 PAI(PAI)-阿里云帮助中心
API请求
-
completions 接口:<EAS_ENDPOINT>/v1/completions
-
chat 接口:<EAS_ENDPOINT>/v1/chat/completions
两个接口请求后的响应结果没有区别,只是入参的格式要求不同。
使用接口入参注意deepseek官方建议
如果需要了解所有可用的参数可以看deepseek官方接口文档,包括定义提示词、上下文补全、多轮对话等多个场景。对话补全 | DeepSeek API Docs
本地调用
为了方便调用,可用在本地启动一个web页面访问部署的大模型,直接在页面对话。部署方式参考WebUI使用的内容,链接部署DeepSeek-V3、DeepSeek-R1模型_人工智能平台 PAI(PAI)-阿里云帮助中心
1、首先按照部署方式不同下载对应py文件到本地
2、本地启动控制台,保证可以调用python3.10版本以上的服务。
3、(可选)建一个新目录,建一个虚拟环境,参考(12. Virtual Environments and Packages — Python 3.13.2 documentation)
1、进入新建目录(目录路径不要带中文字符),在控制台中运行命令。tutorial-env可以改成你希望取的目录名称(最好只有英文字母)
python -m venv tutorial-env
2、激活虚拟环境
On Windows, run:
tutorial-env\Scripts\activate
On Unix or MacOS, run:
source tutorial-env/bin/activate
3、如果不需要使用虚拟环境了,可以取消激活,在控制台运行
deactivate
4、下载好的webui_client.py文件放在本地目录(虚拟环境放在刚刚创建的虚拟环境目录下),控制台需要在此目录路径下运行命令行
python webui_client.py --eas_endpoint "<EAS API Endpoint>" --eas_token "<EAS API Token>"
其中,<EAS API Endpoint> 需替换为部署服务的Endpoint,<EAS API Token>需替换为部署服务的Token。您可以在Model Gallery > 任务管理 > 部署任务中单击已部署的服务名称,进入服务详情页,单击查看调用信息获取调用的 Endpoint 和 Token。即下图中的两行数据。
webui_client.py代码文件中有详细逻辑,了解细节可自行查看。
5、python运行过程中可能会报错无法调用到某个模块,使用pip命令下载即可。命令行运行后会生成url地址。
6、将地址复制到浏览器中即可访问,注意访问期间不可关闭控制台。
追加如下指令会直接在默认浏览器的新页签打开web对话窗口,不需要做复制粘贴。
--inbrowser
运行命令行后,控制台输出内容
使用url地址后浏览器的web页面
页面左边的是默认参数,可自行调节。
费用问题
服务器启动后即开始收费,这里没有计算推理费用,也就是说不按照对话多少收token使用费,服务器停止就停止计费。如果想要高效利用资源,那么可以事先明确要做的一些对话、调用研究等内容,资源启动后尽快完成,完成后停掉服务。具体计费查看:https://billing-cost.console.aliyun.com/finance/month-bill/account
更多推荐
所有评论(0)