目录

一、华为云ModelArts Studio服务

二、开通DeepSeek-V3/R1商用服务

三、DeepSeek-V3/R1商用服务使用方式

3.1 在线体验

3.2 调用 API 接口

3.2.1 创建 API Key

3.2.2 接口信息

3.2.3 代码示例

3.2.4 API 调用输出

3.2.4.1 流式输出

3.2.4.2 阻塞式输出

 四、总结


在当今科技飞速发展的时代,人工智能大模型的应用正如雨后春笋般不断涌现,为企业和开发者带来了前所未有的机遇。华为云ModelArts Studio平台上的DeepSeek-V3/R1大模型商用级推理服务,无疑是这股浪潮中的一颗璀璨明星。接下来,让我们深入体验下DeepSeek-V3/R1商用服务。

在人工智能浪潮席卷的当下,AI大模型商用服务已成为推动各行业智能化转型的核心力量。华为云ModelArts Studio平台推出的DeepSeek-V3/R1大模型商用级推理服务,凭借其卓越的性能与灵活的部署方案,为开发者提供了高效、稳定的AI开发工具。本文将围绕DeepSeek-V3/R1的商用优势展开,分享我在实际深入体验DeepSeek-V3/R1商用服务的过程,并探讨其在实际业务场景中的落地潜力。

一、华为云ModelArts Studio服务

华为云 ModelArts Studio 服务聚焦优质大模型全场景性能精度提升,构建云上大模型一站式模型开发托管服务,践行大模型即服务 MaaS(Model-as-a-Service)理念。

优势:

1. 模型全、免配置、免调优、性能优;

2. 开箱即用,一站式模型应用托管服务;

3. 资源一站式按需开通,建设周期短;

4. 多服务组合竞争力,一站式应用能力集成。

二、开通DeepSeek-V3/R1商用服务

首先,点击ModelArts Studio大模型即服务平台,进入ModelArts Studio大模型即服务平台页面,如下图所示。

图1  ModelArts Studio大模型即服务平台页面

然后,点击 ModelArts Studio控制台(如果没有账号需先注册账号),进入到 服务平台,如下图所示。

图2  服务平台页面

服务平台包括:模型广场、模型体验、模型推理、模型训练、模型管理、应用中心、管理与统计等功能。 点击 在线推理,进入 商用服务 页面,如下图所示。

图3 商用服务页面

点击需要开通的服务名称,例如: DeepSeek-V3-32K、DeepSeek-R1-32K,其中,DeepSeek-V3-32K模型是DeepSeek-V3-32K 是深度求索(DeepSeek)公司推出的高性能混合专家(MoE)架构大语言模型,参数量为671B。DeepSeek-R1-32K模型是是深度求索(DeepSeek)推出的第一代高性能推理大模型,专注于复杂推理任务(如数学、代码生成和逻辑推理),参数量为671B。

可以根据需要开通对应的模型,选择对应的模型开通服务即可,如下图所示。

图4  开通服务页面 

三、DeepSeek-V3/R1商用服务使用方式

3.1 在线体验

点击已开通模型的的 在线体验,如下图所示。

 图5 商用服务页面

即可在线体验对应的模型,例如:DeepSeek-V3,在线体验方式如下图所示。 

图6 在线体验页面 

可以在最下方的对话框中输入你的问题,然后回车,大模型自动返回对应的回答,回答采用流式返回,如下图所示。 

图7 对话界面 

3.2 调用 API 接口

在商用服务页面点击调用说明,进入API调用说明界面,如下图所示。

图8 商用服务页面 

首先,在调用MaaS的模型服务时,需要填写API Key用于接口的鉴权认证,创建新的API Key或使用已有API Key,下面介绍下创建API Key 的方法。

3.2.1 创建 API Key

进入API Key管理页面,如下图所示。

图9 API Key 管理页面 

然后,点击创建API Key,填写标签和描述,如下所示。

图10 创建API Key 页面 

注意:创建完 API Key后,需要保存 API Key 内容。 

3.2.2 接口信息

模型接口信息如下所示。

API地址:https://api.modelarts-maas.com/v1/chat/completions
模型名称:DeepSeek-V3 或者 DeepSeek-R1

其中,API地址为调用模型的 URL。 

3.2.3 代码示例

调用代码如下所示。

# coding=utf-8

import requests
import json

if __name__ == '__main__':
    url = "https://api.modelarts-maas.com/v1/chat/completions" # API地址
    api_key = "yourApiKey"  # 把yourApiKey替换成已获取的API Key 
    
    # Send request.
    headers = {
        'Content-Type': 'application/json',
        'Authorization': f'Bearer {api_key}' 
    }
    data = {
        "model":"DeepSeek-V3", # 模型名称
        "messages": [
            {"role": "system", "content": "You are a helpful assistant."},
            {"role": "user", "content": "你好"}
        ],
        # 是否开启流式推理, 默认为False, 表示不开启流式推理
        "stream": True,
        # 在流式输出时是否展示使用的token数目。只有当stream为True时改参数才会生效。
        # "stream_options": { "include_usage": True },
        # 控制采样随机性的浮点数,值较低时模型更具确定性,值较高时模型更具创造性。"0"表示贪婪取样。默认为0.6。
        "temperature": 0.6
    }
    response = requests.post(url, headers=headers, data=json.dumps(data), verify=False)

    # Print result.
    print(response.status_code)
    print(response.text)

 如上所示,通过 requests 包的 post 方法调用 API,替换上述代码中的 api_key、模型名称,即可通过API的方式调用模型。

3.2.4 API 调用输出

API调用远程模型有两种输出方式,分别是流式输出和阻塞式输出,流式传输,顾名思义,数据以连续、不间断的流水式方式依次传输,实现高效且持续的数据流动;而阻塞式传输则采取截然不同的策略,它倾向于一次性完成所需数据的整体传输,类似于一次性搬运大批货物的操作模式。

接下来,分别看一下。

3.2.4.1 流式输出

流式输出需要将 stream 设置为 True,执行代码后输出如下所示。 

E:\code\code\CSDN>python main.py
E:\Program Files\Python313\Lib\site-packages\urllib3\connectionpool.py:1097: InsecureRequestWarning: Unverified HTTPS request is being made to host '127.0.0.1'. Adding certificate verification is strongly advised. See: https://urllib3.readthedocs.io/en/latest/advanced-usage.html#tls-warnings
  warnings.warn(
200
data: {"id":"chat-51fe4bd0d70445209fedc9de6a010dd6","object":"chat.completion.chunk","created":1746885412,"model":"DeepSeek-V3","choices":[{"index":0,"delta":{"role":"assistant","content":""},"logprobs":null,"finish_reason":null}],"usage":{"prompt_tokens":10,"total_tokens":10,"completion_tokens":0}}

data: {"id":"chat-51fe4bd0d70445209fedc9de6a010dd6","object":"chat.completion.chunk","created":1746885412,"model":"DeepSeek-V3","choices":[{"index":0,"delta":{"content":"你好"},"logprobs":null,"finish_reason":null}],"usage":{"prompt_tokens":10,"total_tokens":11,"completion_tokens":1}}

data: {"id":"chat-51fe4bd0d70445209fedc9de6a010dd6","object":"chat.completion.chunk","created":1746885412,"model":"DeepSeek-V3","choices":[{"index":0,"delta":{"content":"!很高兴"},"logprobs":null,"finish_reason":null}],"usage":{"prompt_tokens":10,"total_tokens":13,"completion_tokens":3}}

data: {"id":"chat-51fe4bd0d70445209fedc9de6a010dd6","object":"chat.completion.chunk","created":1746885412,"model":"DeepSeek-V3","choices":[{"index":0,"delta":{"content":"见到你"},"logprobs":null,"finish_reason":null}],"usage":{"prompt_tokens":10,"total_tokens":15,"completion_tokens":5}}

data: {"id":"chat-51fe4bd0d70445209fedc9de6a010dd6","object":"chat.completion.chunk","created":1746885412,"model":"DeepSeek-V3","choices":[{"index":0,"delta":{"content":",有什么"},"logprobs":null,"finish_reason":null}],"usage":{"prompt_tokens":10,"total_tokens":17,"completion_tokens":7}}

data: {"id":"chat-51fe4bd0d70445209fedc9de6a010dd6","object":"chat.completion.chunk","created":1746885412,"model":"DeepSeek-V3","choices":[{"index":0,"delta":{"content":"我可以帮助"},"logprobs":null,"finish_reason":null}],"usage":{"prompt_tokens":10,"total_tokens":19,"completion_tokens":9}}

data: {"id":"chat-51fe4bd0d70445209fedc9de6a010dd6","object":"chat.completion.chunk","created":1746885412,"model":"DeepSeek-V3","choices":[{"index":0,"delta":{"content":"你的吗"},"logprobs":null,"finish_reason":null}],"usage":{"prompt_tokens":10,"total_tokens":21,"completion_tokens":11}}

data: {"id":"chat-51fe4bd0d70445209fedc9de6a010dd6","object":"chat.completion.chunk","created":1746885412,"model":"DeepSeek-V3","choices":[{"index":0,"delta":{"content":"?"},"logprobs":null,"finish_reason":"stop","stop_reason":null}],"usage":{"prompt_tokens":10,"total_tokens":23,"completion_tokens":13}}

data: {"id":"chat-51fe4bd0d70445209fedc9de6a010dd6","object":"chat.completion.chunk","created":1746885412,"model":"DeepSeek-V3","choices":[],"usage":{"prompt_tokens":10,"total_tokens":23,"completion_tokens":13}}

data: [DONE]



E:\code\code\CSDN>
3.2.4.2 阻塞式输出

将 stream 修改为 False,即为阻塞式输出,执行代码后输出如下所示。

E:\code\code\CSDN>python main.py
E:\Program Files\Python313\Lib\site-packages\urllib3\connectionpool.py:1097: InsecureRequestWarning: Unverified HTTPS request is being made to host '127.0.0.1'. Adding certificate verification is strongly advised. See: https://urllib3.readthedocs.io/en/latest/advanced-usage.html#tls-warnings
  warnings.warn(
200
{"id":"chat-83efd19ff7414deba9e96128e5a09892","object":"chat.completion","created":1746885488,"model":"DeepSeek-V3","choices":[{"index":0,"message":{"role":"assistant","content":"你好!很高兴见到你,有什么我可以帮忙的吗?","reasoning_content":null,"tool_calls":[]},"logprobs":null,"finish_reason":"stop","stop_reason":null}],"usage":{"prompt_tokens":10,"total_tokens":22,"completion_tokens":12},"prompt_logprobs":null}

E:\code\code\CSDN>

大家可以根据自己的需要进行调用。 

 四、总结

通过本文对DeepSeek-V3/R1商用服务的体验,华为云DeepSeek-V3/R1商用服务优势显著,其开通流程简便快捷,服务稳定性极高,为开发者提供了无忧的使用体验。性能上,该服务展现出强劲的算力,无论是复杂推理还是大数据处理,都能迅速响应,极大提升了开发效率。Flexus X实例的加入,更是以1.6倍算力提升和6倍关键业务加速,实现了性能与成本的双重优化。整体而言,华为云DeepSeek-V3/R1商用服务以其卓越性能、灵活应用和全方位支持,成为了AI应用开发的理想选择,值得每一位开发者深入体验与探索。。

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐