【实战指南】如何通过AML平台高效释放DeepSeek商业价值

AML 作为一款云原生大模型 PaaS 平台，提供了一键推理服务发布和部署的能力，并支持 NVIDIA 和华为昇腾等多种 GPU 设备，使得企业可以快速构建和优化 AI 推理服务。为了进一步提升 DeepSeek 在特定领域的专业回答能力，企业可以结合自身知识库构建 RAG（Retrieval-Augmented Generation）应用，使 DeepSeek在推理过程中结合企业内部的专业数据源

灵雀云

938人浏览 · 2025-02-14 16:21:56

灵雀云 · 2025-02-14 16:21:56 发布

在 AI 驱动的时代，企业对大模型的需求日益增长，但如何高效部署和管理这些模型仍然是一个挑战。AML 作为一款云原生大模型 PaaS 平台，提供了一键推理服务发布和部署的能力，并支持 NVIDIA 和华为昇腾等多种 GPU 设备，使得企业可以快速构建和优化 AI 推理服务。本文将介绍如何使用 AML启动DeepSeek-R1、V3 等全系列模型，并构建自己的 DeepSeek 推理服务，从而提升企业的工作效率。

01 AML平台重构大模型部署范式

AML 是一个高性能、灵活可扩展的 PaaS 平台，专为大模型推理服务设计，具备以下特点：

一键部署：无需繁琐的配置，即可快速上线推理服务。
多 GPU 兼容：支持 NVIDIA、华为昇腾、海光等国内外主流 GPU，提供高效的计算能力。（AML现已完成和NVIDIA、华为昇腾、海光、昆仑芯、寒武纪、天数智芯的全面适配）
弹性扩展：根据需求动态扩展资源，优化计算成本。
可视化管理：提供友好的用户界面，便于监控和管理模型推理任务。

02 AML支持DeepSeek全系列模型

DeepSeek作为当前最炙手可热的大语言模型，支持不同规模的参数配置，以满足不同应用场景的需求。在 AML 上，用户可以轻松部署DeepSeek-R1 、V3等全系列模型，遵循以下步骤即可。

1、选择适合的 DeepSeek 版本

例如：DeepSeek-R1 提供的多个版本

DeepSeek-R1 671B（大型，适用于复杂 AI 任务，提供最强的推理能力）

DeepSeek-R1-Distill-Qwen-32B（中型，兼顾性能与计算成本）

DeepSeek-R1-Distill-Qwen-14B（小型，适合轻量级推理任务）

DeepSeek-R1-Distill-Qwen-1.5B（微型，适用于资源受限的场景）

用户可以根据自己的业务需求选择合适的模型，并在 AML 平台上进行快速部署。

2、部署流程

- 登录 AML 平台：进入 AML 控制台，确保账户具备必要的权限。

- 创建推理任务：在控制台中选择 DeepSeek-R1 版本，配置 GPU 资源（如 NVIDIA A100 或华为 Ascend 910）。

- 设置推理参数：根据需求调整批处理大小、显存占用、优化策略等参数。

- 启动推理服务：点击“一键部署”按钮，AML 将自动完成模型的加载和优化。

- 推理与优化：通过 API 或 Web 界面测试推理服务，并根据响应时间和吞吐量调整参数。

3、快速构建 DeepSeek 推理服务

使用 AML 部署完成后，用户可以通过 API 访问 DeepSeek-R1 的推理能力，并集成到企业应用中。

3.1 API 调用示例

AML 提供 RESTful API 访问推理服务，示例如下：

import requests
url = "https://api.aml-platform.com/deepseek-r1/inference"headers = {"Authorization": "Bearer YOUR_API_KEY"}data = {"prompt": "请介绍一下 AI 在企业中的应用"}
response = requests.post(url, json=data, headers=headers)print(response.json())

3.2 典型应用场景