数字化时代,人工智能(AI)成为推动各行各业转型升级的核心驱动力。从智能制造到智慧城市,从金融服务到医疗健康,随着AI应用的深入,一系列亟待解决的行业问题也逐渐浮现:如何构建高效、稳定的AI算力底座以支撑日益增长的算力需求?如何优化AI基础设施,提升数据处理效率和安全性?如何推动AI技术在各行各业的深度融合与应用,实现真正的智能化转型?

在此背景下,鲲鹏昇腾开发者大会2025(KADC2025)成功举办,旨在从算力架构、开发工具、开源生态等领域,重新定义AI算力发展的新标杆。在鲲鹏开发者峰会上,华为正式发布了面向AI时代的"鲲鹏AI+解决方案"构建起涵盖 AI Core(人工智能核心)、AI Infra(人工智能基础设施)、AI 应用的完整技术体系,为产业智能化转型提供了系统性技术支撑。

回溯鲲鹏计算产业六年发展历程,其通过硬件开放与软件开源战略,构建了覆盖数据中心到边缘场景的完整生态,截至2025年5月,鲲鹏携手6300余家伙伴,孵化了超过18100个解决方案,并广泛应用于千行万业。

AI Core构建AI时代的先进算力底座

AI Core方面,鲲鹏计算发布了基于openEuler的鲲鹏+xPU推理解决方案和基于openEuler Intelligence的AI开发组件。

AI技术的发展,和以DeepSeek为代表,伴随高性能、低成本大模型的迅速普及,让国内AI算力需求呈现爆发式增长,行业焦点已从“算力供给”转向“算力高效利用”。鲲鹏+xPU推理方案能够兼容昇腾以及其他国产GPU,覆盖数据中心到边缘场景。一方面,鲲鹏+xPU推理实现了DeepSeek全模型适配,覆盖大、中、小企业场景,联合7家OEM推出10余款推理服务器及20余款边缘推理一体机/工作站,适配昇腾等主流xPU,确保生态协同;

另一方面通过与openEuler协同,实现内存融合和算力融合的双重优化。通过openEuler的安装部署工具,开发者可以灵活地以组件化配置方式安装部署所需AI环境,实现一键分钟级DeepSeek环境安装部署,经实测,原需3~5天手动安装的DeepSeek环境,利用安装工具仅需约20分钟即可完成;同时,openEuler通过GMEM统一xPU和CPU内存编址,提升xPU利用率;sysHAX组件动态调度鲲鹏和异构xPU算力资源,计算最佳算力配比,精准分配推理任务给CPU,实现算力协同,覆盖MoE和稠密模型,实现LLM推理吞吐量提升10%~30%。

目前,该方案已助力政府、医疗等行业落地 DeepSeek一体机,如山西某省级医院,基于华鲲振宇推理一体机,采用DeepSeek-70B模型,实现诊疗全流程智能化升级。通过本地化部署,患者数据全程“不出院”,单个病例处理耗时从传统人工的30分钟缩短至1分钟,保障数据隐私的同时实现了智能化升级。

随着AI时代的兴起,算力从单机运行发展到集群的规模化部署,面临着充分释放效率、解决异构算力协同难和硬件资源利用不足、软件生态的完善等问题。为此,华为推出了多样化算力集群软件解决方案,通过精细化调度异构算力资源,可以在在线和离线的场景下把利用率提升30%,同时性能提升20%,实现1.6万个超大规模集群的管理。

AI Infra:打造高效、智能的AI基础设施

在 AI Infra 领域,华为鲲鹏计算研发部部长刘林超指出,在鲲鹏推理一体机应用于各行各业的过程中,企业对安全的担忧始终是核心痛点,表现为知识库越权访问风险、企业私有数据和模型被非法篡改或获取等问题。针对这些安全挑战,鲲鹏致力于提升数据处理的效率和安全性,提供鲲鹏AI数据工程组件和鲲鹏AI安全组件。

一方面,鲲鹏AI+数据工程组件围绕大模型全生命周期,打造AI全链路数据基础设施,提供性能更优、更安全的数据处理、数据检索等能力。基于业界主流的开源数据处理平台,在电商订单、广告日志等实时数据处理场景上,鲲鹏提供代码自动翻译工具,使Java算子具备C++的性能,数据处理效率提升1倍以上;在文本去重、视频切片等多模态数据处理场景,通过多模态算子优化和算子调度优化,数据处理性能提升75%,算力的利用率提升2倍。模型推理阶段,通过openGauss DataVec的高效向量检索算法和稀疏召回能力,实现非首token时延下降25%;同时对KV Cache进行透明压缩,实现推理吞吐量提升20-30%。

另一方面,AI+数据安全组件的加入,为AI应用的全生命周期安全保驾护航。鲲鹏推出鲲鹏AI+安全使能套件,用3道安全防线实现纵深防御,端到端保护AI模型和私域数据安全。

  1. 第1道防线:基于鲲鹏可信计算,通过逐层度量硬件和系统软件,保障系统完整性,同时,通过白名单管控机制,防止非授权应用的加载;
  2. 第2道防线:通过在openGauss向量数据库中内置攻击检测插件,防止恶意命令注入攻击及高危命令执行;
  3. 第3道防线:基于鲲鹏virtCCA和PCIPC机密计算能力,构建CPU+xPU安全隔离的可信执行环境,实现机密AI和机密RAG,保护AI模型和RAG私域知识运行时安全,保护客户的核心资产。

从数据工程到数据安全,数据处理、数据检索、3道防线、纵深防御,助力企业在AI时代打造坚实的智能算力底座。

AI应用:推动AI技术在各行各业的落地

“DeepSeek的技术突破加速了AI推理的应用,激发了全产业链的应用热潮。我们预计到未来两年将有50%以上的行业核心场景接入AI应用场景,AI应用即将迎来爆发式增长。”刘林超对 AI 应用的未来发展做出展望。

事实上,在AI应用从模型训练到推理、再到行业落地的全链条中,CPU作为AI底座的核心作用无处不在,其处理能力的提升对AI应用端到端的性能优化具有决定性影响。鲲鹏凭借其完善的生态和低廉成本,提供了更高性价比的推理解决方案。

在AI应用层面,鲲鹏提供业务编排、部署、调度等能力,基于开源生态,构建企业端到端AI解决方案,做到开箱即优。发布鲲鹏搜广推解决方案,聚焦互联网搜索、广告推荐场景,召回阶段优化 ScaNN/faiss 检索框架使性能提升40%以上,排序阶段结合算子加速库与图编译器优化性能20%以上,助力企业打造新一代智能推荐引擎。

在本次大会上,鲲鹏展示了其在多个行业的深度实践和创新成果。其中,RAG解决方案1.0的推出,标志着鲲鹏在AI检索领域取得了重大突破。

当前,随着生成式AI技术被广泛应用于企业业务流程中,日均Token消耗量已从千亿级跃升至十万亿级。然而,企业如何确保大模型生成内容的准确性、时效性,并安全地利用企业私域数据?传统的AI应用面临着模型幻觉、数据隐私泄露以及部署复杂、成本高等痛点,鲲鹏RAG解决方案1.0通过优化检索算法和算子,能显著提升检索性能,为各行各业提供了高效、精准的检索服务,同时,AI+企业端到端解决方案的构建,更是为企业的智能化转型提供了全方位的支持。

鲲鹏RAG解决方案1.0基于鲲鹏CPU和昇腾NPU、第三方GPU卡,打造包含RAG业务编排、AI+微服务、部署调度、安全和存储的开源开放体系,定义企业级RAG的技术标杆。深度适配Dify、RAGflow等主流开源平台,提供鲲鹏原生容器镜像,开发者可一键拉取、分钟级部署,极大简化了RAG系统的搭建流程。资源调度层基于Kubernetes(K8S)与Ray构建,实现一键自动化安装,确保RAG方案即开即用。

在核心能力方面,鲲鹏RAG解决方案提供文档处理、向量数据库、模型服务等全面的AI+微服务。其中,向量数据库支持openGauss、Milvus等主流选择,为高效知识检索奠定基础。秉持“松耦合、易演进”的设计理念,RAG服务与大模型可分离部署,支持独立升级,确保了系统的高度灵活性和可维护性。

尤为重要的是,鲲鹏RAG解决方案1.0在数据安全方面提供了纵深防御能力。基于鲲鹏特有的virtCCA和PCIPC机密计算能力,构建了CPU+xPU安全隔离的可信执行环境,实现了机密AI和机密RAG,从根本上保护了AI模型和RAG私域知识在运行时的安全。

据了解,该解决方案支持多种开源组件,云上、线下不同部署方式,目前已被行业70+ISV伙伴预集成,如果使用鲲鹏+ openGauss 的产品组合,还能享受领先业界30%性能提升。

在本次峰会上,6家企业发布了基于鲲鹏RAG解决方案1.0打造各自行业的差异化RAG解决方案。江苏润和软件股份有限公司AI研究院总工程师朱凯表示,基于openGauss构建的多维度知识库系统通过知识增强技术和实时检索能力,实现了行业知识覆盖率超92%、文本一致性超90%的突破性进展。

此外,为了帮助开发者快速进行AI应用创新,鲲鹏推出AI工具链:鲲鹏DevKit AI开发套件和鲲鹏BoostKit AI使能套件,助力AI应用开发更高效、性能更卓越。

其中,鲲鹏DevKit AI开发套件能够一键完成源码向量化改造,快速调试大规模异构算力,定位AI程序问题,精准识别并排除K+X集群故障与配置错误,全面调优热点函数,智能迭代系统最优参数,实现端到端开发效率提升30%以上;

鲲鹏BoostKit AI使能套件则提供基于鲲鹏架构优化的AI加速库、图编译器、推理引擎和推理服务,典型场景性能提升20%以上,其中通过推理服务vllm优化,deepseek满血版本吞吐可达60TPS;在搜广推的应用中,推理引擎的向量化使能、配置优化等也可提供10%-30%不等的性能提升。

结语

从算力底座的构建到基础设施的完善,再到行业应用的深度落地,"鲲鹏AI +解决方案"不仅仅是一套技术体系,更是推动产业智能化转型的系统方法论。在AI算力成为核心生产力的时代,鲲鹏正通过全栈技术创新与生态共建,为千行百业搭建起通往智能未来的桥梁,让AI技术真正成为驱动产业升级的新引擎。

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐