昇思MindSpore2025年一季度总结

一、概述

2025年第一季度,昇思MindSpore开源社区以技术创新为驱动,持续扩大生态影响力,在框架升级、开发者生态建设、行业应用落地等方面取得显著进展。

昇思MindSpore开源社区将于4月12日在杭州举办MindSpore Developer Day 2025。本次会议将发布MindSpore 2.6.0全新版本,展示其端到端全流程支持DeepSeek等MoE大模型训练、微调、强化学习与推理部署的技术,以及在科学智能、开发易用性、与CANN协同提升计算效率等领域和方向的技术创新与成果。同时联合模力方舟(GiteeAI)举办AI应用开发者Meetup,分享各行业领域AI应用开发实践经验与开发心得。

在社区合作方面,社区与法本信息、三象智能、木愚科技、魔泊云、奥看科技、珑京科技、倍特威视、星舟志屹、易库智能等10+企业合作,基于DeepSeek、QwQ-32B等大模型打造了智能工作流、教育一体机、工业检测等解决方案,覆盖金融、教育、医疗、能源等多个行业,加速企业数智化转型。

在技术方面,目前昇思MindSpore支持多项前沿技术与开源模型,包括支持文生视频SOTA模型(如Step-Video-T2V、Wan2.1)、强化学习框架GRPO-Training-Suite,以及原生适配QwQ-32B等大模型,显著提升了开发效率与性能表现。

在社区运作方面,社区通过举办“昇思五日谈”系列技术直播、开源实习计划、量子计算黑客松大赛等活动,吸引了全球开发者深度参与,持续聚焦AI根技术研发,强化大模型与科学智能能力,为产业智能化升级提供坚实支撑。

以下是2025年第一季度昇思MindSpore社区进展的详细报告。

二、社区规模

截至3月底,昇思MindSpore面向全球开发者,凝聚产业力量,持续打造人工智能创新之源。社区秉持开放透明原则,稳步建设开源生态,规模和活跃度得到持续提升。

社区发展了4.5万+核心贡献者;

累计产生ISSUE共41.4K、PR共109K

image.png

三、社区大事件

1、你有一封MindSpore Developer Day 2025邀请函,请查收

为加速人工智能技术创新与产业落地,共建开源开放的AI框架技术生态昇思MindSpore开源社区将于2025年4月12日在杭州萧山万怡酒店举办MindSpore Developer Day 2025。

本次会议聚焦AI框架技术创新与开源开发者生态共建,将发布MindSpore 2.6.0全新版本,展示其端到端全流程支持DeepSeek等MoE大模型训练、微调、强化学习与推理部署的技术,以及在科学智能、开发易用性、与CANN协同提升计算效率等领域和方向的技术创新与成果。同时昇思社区联合模力方舟(GiteeAI)举办AI应用开发者Meetup,分享各行业领域AI应用开发实践经验与开发心得,为大家带来产研前线的第一手干货。

image.png

2、训推全面支持、开箱即用!DeepSeek V3昇思MindSpore版本上线开源社区

基于昇腾AI硬件与昇思MindSpore AI框架版本的DeepSeek-V3完成开发支持并上线昇思开源社区,面向开发者提供开箱即用的预训练和推理能力,并已成功在大规模集群上预训练和部署。通过获取昇思MindSpore版DeepSeek V3开源镜像,开发者可直接进行DeepSeek-V3的预训练和推理部署。

昇思MindSpore开源社区训练代码:

https://gitee.com/mindspore/mindformers/tree/dev/research/deepseek3

魔乐社区推理代码:

https://modelers.cn/models/MindSpore-Lab/DeepSeek-V3

image.png

3、携手北京大学,MindSpore+openEuler打造支持vLLM的DeepSeek全栈开源推理方案

北京大学联合OpenAtom openEuler(简称"openEuler") 开源社区与MindSpore社区,推出面向大模型的全栈开源方案,以操作系统+AI框架+模型生态的三层开放架构,替换操作系统和DL框架,秉承代码开源+标准开放+生态共建的理念,逐步成为智能时代的自主创新数字基座。

image.png

4、昇思MindSpore亮相2025年全球开发者先锋大会(2025 GDC)

2025年全球开发者先锋大会(2025 GDC)于2025年2月21日-23日在上海举办。会议期间,昇思MindSpore技术专家林翰在“融”见AI新生态,驱动经济新发展讲坛发表“大模型时代首选AI框架-昇思MindSpore”主题演讲。当前,昇思AI框架赋能用户开发大模型能力,充分发挥了硬件澎湃算力,同时兼顾开发效率与执行性能,架构、套件也在持续升级。

image.png

5、MindSpore Quantum 0.10.0 正式发布,量子算法开发更灵活、更高效

MindSpore Quantum是昇思MindSpore社区推出的全新量子经典混合计算框架,能够高效地支持主流的量子算法和经典量子混合算法,不但在量子机器学习、量子化学模拟和量子组合优化等变分量子算法上有着卓越的性能,而且在量子化学模拟规模上也处于领先地位,为量子计算的研究和发展提供了一个高效的开发环境。

经过开发者们几个月的精心打磨,MindSpore Quantum 0.10.0 版本正式上线!本次版本不仅升级了量子模拟器和线路编译工具,更引入了全新的高维量子系统支持,助力科研创新和实际应用。

image.png

四、社区动态

1、昇思五日谈 | 5场直播,深度解析昇思支持DeepSeek训推全流程核心技术

昇思MindSpore开源社区即将迎来开源五周年,为回馈开发者长期以来的支持与热爱,昇思MindSpore以一场硬核技术盛宴——「昇思五日谈」专题直播重磅上线!5场直播揭秘昇思MindSpore大模型训练与推理关键技术,助力开发者抢占AI技术高地!

直播回放链接:https://space.bilibili.com/526894060/lists/4660795?type=series

image.png

2、2025·昇思MindSpore开源实习启动

2025·昇思MindSpore开源实习已经启动,欢迎各位高校学子报名参加。实习方法:1)线上实习,不论在家还是宿舍都可参与实习,积累项目开发经验,为实习简历添砖加瓦;2)实习薪资丰厚,完成任务获得积分即可在次月底发放对应薪资;3)任务种类繁多,从易到难各个程度的任务均有,总有你的专属项。2025·昇思MindSpore开源实习等你来“打卡”。

image.png

3、【实战演练】开发基于昇思MindSpore Demo,昇思Demo制作人C位出道吧!

2月底,昇思MindSpore发布在线征集基于昇思MindSpore学习型项目案例的活动!无论是基于MindSpore的DeepSeek项目,还是开发「AI健身教练」「智能垃圾分类」等接地气项目,只要技术够硬,均可参加!此外,昇思MindSpore邀请开发者参与模型迁移挑战,将指定模型基于MindSpore NLP套件进行模型权重迁移,并上传至魔乐社区和大模型平台,均可获得相应激励!

image.png

4、第七届·2025 MindSpore量子计算黑客松全国大赛启动报名

一年一度的黑客松品牌赛事,“第七届·2025 MindSpore量子计算黑客松全国大赛”火热来袭!热身赛、量子组合优化、量子误差缓解、量子启发算法赛道目前已发布赛题,开发者将体验全新量子计算框架 MindSpore Quantum,本次赛题也将用到量子真机数据。诚邀各位开发者报名参赛,勇攀量子世界的高峰,挑战黑客松年度总冠军!

image.png

5、基于昇思实现古画修复,「昇思文旅SIG创新技术学习交流会」在西安成功举办

3月29日, MindSpore Cultural Tourism SIG(文旅SIG)与民歌智能计算与服务技术文旅部重点实验室在陕西师范大学雁塔校区举办《昇思文旅SIG创新技术学习交流会》。本次会议围绕昇思Mindspore和文旅主题,面向所有对AI文旅感兴趣的开发者,希望通过学习昇思MindSpore的最新技术路线与基于昇思的DeepSeek实践,学习AI文旅的有趣案例与实践,共同孵化基于昇思的文旅创新应用。

image.png

6、中国物理学会-量子科技长三角产业创新中心-MindSpore Quantum学术奖励基金(二期)申请指南

《中国物理学会-量子科技长三角产业创新中心-MindSpore Quantum学术奖励基金》是由中国物理学会、量子科技长三角产业创新中心和昇思MindSpore共同发起,致力于面向高校及科研院所的量子计算学者搭建学术交流平台,提供资金和技术支持、促进合作,推动开源量子计算软件在量子信息领域的广泛应用,并支持基于开源量子计算软件框架的国内外高水平期刊和会议的学术论文发表,激励原创性科学研究开展,为未来量子计算产业储备人才,构建中国量子计算研究的全球影响力。高校/科研院所的在职教师或研究人员(包括博士后)和在读博士研究生欢迎申报。

image.png

7、「她力量·代码之外」:当技术温度遇见跨界创造力

在三八妇女节之际,昇思MindSpore开源社区邀请了三位优秀女性开发者——中国科学院大学博士生孙宛奇、北京大学研究生王洁怡、瑞士巴塞尔大学神经生物学博士呼波,讲述她们以跨界思维、社区联结力与技术向善的初心,在量子计算、生物医学、自然语言等领域中绽放光彩的经历。她们的故事,既是科技女性的成长缩影,也是开源精神的最佳诠释。

image.png

五、社区案例

昇思MindSpore开源社区始终秉持“开放协作、技术赋能”的理念,积极推动大模型技术创新与行业实践深度融合,持续为开发者和企业提供前沿技术支撑与优化能力,助力大模型训练、微调、推理及场景应用创新。在2025年第一季度,社区联合生态伙伴,在金融、教育、医疗、能源、工业等多个行业孵化出一批解决方案,以下为部分案例的详细报告:

1、法本信息携手昇思:基于DeepSeek&QwQ-32B等打造企业级AI解决方案新范式

在数字经济与实体经济深度融合的浪潮下,法本信息作为国内软件与信息技术服务领域的领军企业,基于昇腾AI基础软硬件平台及昇思MindSpore开源框架,构建“AI大模型+行业场景”的创新解决方案。依托昇腾强大的算力底座、高效的昇思AI框架、DeepSeek&QwQ-32B等国内知名大模型,以及法本信息在垂直领域的场景化落地能力,三方联合打造了覆盖智能编码、知识管理、智能制造、安全生产等领域的全栈式AI解决方案,为企业智能化转型提供技术引擎。

image.png

2、三象智能基于昇思MindSpore,以DeepSeek&QwQ-32B等为基础大模型打造智能工作流升级解决方案

在数字化转型加速的今天,企业如何高效处理海量对话数据?如何确保文档对比的精准性与时效性?如何以有限人力应对广告内容审核的复杂需求?三象智能基于昇思MindSpore,为企业打造智能工作流升级解决方案,依托DeepSeek R1&QwQ-32B等大模型的强大能力,从精准对话到智能风控,每个功能升级都为数字化转型注入新动能。

image.png

3、木愚科技携手昇思,以千问QwQ32B&DeepSeek等大模型为基础推出全栈式智能教育解决方案

3月20日,深圳华为中国合作伙伴大会期间,木愚科技基于昇思与QwQ32B、DeepSeek等多个AI大模型,发布新一代“AI教育一体机”,以“AI+教育”深度融合为核心,为学校场景打造全栈式智能教育解决方案,助力教育提质增效与AI人才培养的双重目标。

image.png

4、西安电子科技大学人工智能学院携手昇思以千问QwQ-32B&DeepSeek等大模型为抓手,探索智慧教育,智慧科研新方式

西安电子科技大学作为“人工智能+教育”标杆大学,探索出了基于昇思与QwQ-32B、DeepSeek等多个AI大模型的新一代"AI教育科研协同平台",该平台支持万亿参数模型的本地化训练与实时推理,响应速度提升40%,能耗降低35%,满足高校对高效运算与节约能耗的双重诉求。

image.png

5、魔泊云携手昇思,打造AI解决方案加速企业数智化

在当前的数智化浪潮中,生成式人工智能 (GenAI) 正以前所未有的速度重塑各个行业。作为AI领域的创新先锋,魔泊云(MoPaaS)基于昇思MindSpore AI框架,以DeepSeek和Qwen等国产前沿大模型为基础,为企业提供了切实可行的AI解决方案,帮助企业在人工智能时代实现创新发展。

image.png

6、奥看科技携手江苏鲲鹏·昇腾生态创新中心驱动行业全场景跃迁

南京奥看信息科技有限公司携手江苏鲲鹏·昇腾生态创新中心,以昇思MindSpore AI框架为引擎,通过视觉AI大模型与DeepSeek语言模型结合,通过多模态赋能企业生产人、机、料、法、环的全量场景,实现场景的自主监测、智能分析、联动处置和精准治理,解决传统安检及时性差、人力成本高、管理效率低的痛点,助力工业制造企业降本增效、优化生产流程。

image.png

7、携手昇思,玲珑大模型一体机部署DeepSeek实践

随着DeepSeek在全球持续热度不减,珑京科技联合多方打造DeepSeek大模型的多样化部署解决方案,充分发挥DeepSeek开源模型的低成本高性能优势,进一步推动AI的企业级商用进程。玲珑一体机作为一款开箱即用的成长型AI助手,拥有用户友好界面,操作简单易上手,可节约调优适配时间。其软件包含三大核心产品:智能问答、智能办公和智能报告,支持多模态、多功能、多角度及云端多人并发访问,满足多样化部署需求。

image.png

8、倍特威视基于昇思,以DeepSeek为基础大模型打造异常检测及预测解决方案

倍特威视依托于武汉人工智能计算中心云端算力,离不开昇腾AI硬件强大的算力以及昇思MindSpore AI框架的支撑和稳定运行。通过结合MindIE推理引擎,倍特威视安全生产大模型系统在昇腾硬件上实现了高效且稳定地运行。这一结合使得大模型能够充分利用昇腾的强大算力,为工业安全生产作业中的复杂计算任务提供有力支持。尤其是在面对工业场景隐患排查任务时,即使模型输入的prompt长度达到上万,昇腾配合MindIE推理引擎仍能保持出色的性能表现,确保了模型的稳定性和高效性。

image.png

9、星舟志屹基于昇思MindSpore AI框架打造星舟大模型DeepSeek版,加速能源与旅游业智能化升级

随着大模型技术向垂直领域深度渗透,如何在复杂场景中实现高效、精准的智能化应用成为行业关注焦点。西安星舟志屹智能科技有限公司(以下简称“星舟志屹”),作为一家专注于人工智能技术,深耕智慧能源领域应用项目的创新企业,近日正式发布基于昇思MindSpore AI框架 的“星舟大模型DeepSeek版”。该模型通过知识蒸馏、微调技术、私有专家库及海量数据库理解等核心技术,为能源管理提供了全新的解决方案,助力行业实现技术跃迁。

image.png

10、易库智能携手昇思,结合DeepSeek打造大模型知识赋能平台

在数字经济高速发展的今天,知识数据已成为企业发展的"战略资源",如何通过AI技术实现知识的高效管理与价值释放,是各行业数字化转型的核心命题。易库智能基于昇思MindSpore AI框架,成功打造自主创新知识大模型应用体系,通过"私有化部署+垂直领域适配+知识全链路管理"的创新模式,为智能办公、装备运维、人才培养等场景提供智能化知识解决方案,助力企业构建智能知识中枢。

image.png

11、鹏城实验室发布基于昇思框架的强化学习训练框架GRPO-Training-Suite

鹏城实验室基于昇思MindSpore AI框架,率先突破大模型强化学习技术全栈壁垒。通过自主创新硬件、框架及超大规模集群的深度协同,成功构建从硬件算力、算法优化到集群调度的完整技术链条,实现GRPO强化学习训练在Qwen2.5(7B,32B)上的全流程部署,发布并开源GRPO强化学习训练流程和代码,为强化学习开发者提供了训练接口,支持算法快速开发,提供多种训练优化技术。

开源代码仓:

https://openi.pcl.ac.cn/PCL-Reasoner/GRPO-Training-Suite

https://gitee.com/mindspore/mindrlhf

image.png

六、技术分享

1、DeepSeek模型Janus-Pro香橙派开发板实践指南

2025 年春节, DeepSeek的Janus-Pro模型横空出世, 为了让更多开发者能够快速上手,昇思社区基于MindSpore AI框架和MindSpore NLP套件在香橙派AI pro(20T)24G开发板上,部署了DeepSeek-Janus-Pro 模型,欢迎广大开发者部署体验。

开源链接:

https://gitee.com/mindspore-lab/mindnlp.git

https://github.com/mindspore-lab/mindnlp.git

image.png

2、加速DeepSeek训练性能调优,揭秘昇思MindSpore大模型自动流水负载均衡技术

近年来,大模型不断突破参数规模瓶颈,推动模型体量向万亿级跃进,流水线并行(Pipeline Parallelism)已演变为大模型分布式训练的必备技术之一。但当前应用广泛的几种流水线编排技术,如GPipe、PipeDream和Megatron-LM等,在拉高了训练效率的上限的同时也引入了不同设备上内存开销的不均衡,增大了策略调优的难度和成本。

昇思MindSpore团队提出了一种同时均衡计算和内存的全局求解方法,面向复杂的流水线编排逻辑,自动生成最优的stage-layer分配和重计算策略。通过结合昇思MindSpore提供的自动流水负载均衡工具与Dryrun集群内存仿真工具,在大集群上实测DeepSeek-V3 671B调优,实现训练性能倍增;实测千亿参数Llama模型自动负载均衡调优相比于专家调优提升性能14%。

image.png

3、全流程加速MoE模型预训练及强化学习!揭秘昇思MindSpore并行技术

昇思MindSpore已实现DeepSeek V3 + GRPO强化学习训练全流程支持,并将相关代码开源,为强化学习开发者提供了训练接口,支持算法快速开发,提供多种训练优化技术。当前代码已在昇思社区开源,根据本教程,用户可以快速上手体验,或尝试完成DeepSeek V3 R1的训练全过程。

开源代码仓地址:https://gitee.com/mindspore/mindrlhf/tree/master/examples/grpo/deepseekv3_grpo_tutorial

image.png

4、支持GRPO强化学习训练全流程,揭秘MindSpore RLHF套件技术细节

不久之前,MindSpore携手鹏城实验室发布并开源了基于Qwen2.5(7B,32B)模型的GRPO强化学习训练全流程和代码,实现了组件化解耦训练流程与模型定义,通过训推共部署、训练和推理权重在线快速自动重排、异构内存Swap等技术,成功构建从硬件算力、算法优化到集群调度的完整技术链条。本文围绕MindSpore RLHF套件中的关键技术进行分析,重点解读训推共部署、多维混合并行在线快速自动重排、异构内存Swap、支持vLLM等特性。

image.png

5、文生视频SOTA模型推理开箱即用!MindSpore支持Step-Video-T2V

开发者基于昇思MindSpore AI框架实现了对阶跃星辰 (stepfun-ai ) 开源的 SOTA文生视频模型Step-Video-T2V支持,并将该版本代码开源,同时完成模型推理支持开箱即用。Step-Video-T2V 具有 30B 参数,能够生成204 帧 544p的高质量视频,在文生视频质量评估 benchmark Step-Video-T2V-Eval上,相比其他开源和或商业模型展示出 SOTA 能力。本文介绍了基于昇思 MindSpore +单机Atlas 800T A2使用Step-Video-T2V的流程。

MindSpore 版 Step-Video-T2V 开源链接:

https://github.com/mindspore-lab/mindone/tree/master/examples/step_video_t2v

image.png

6、视频生成SOTA模型推理开箱即用!MindSpore支持Wan2.1

在AI视频生成领域,Wan2.1作为最新的视觉生成模型,能够根据文本、图像或其他控制信号生成视频,在VBench评测中,Wan2.1以86.22%的总分,摘得桂冠。

MindSpore快速对Wan2.1进行适配,并将其开源至MindSpore ONE仓库,为开发者提供高效体验。本文详细介绍了如何基于昇思MindSpore和单机Atlas 800T A2,完整实现Wan2.1视频生成的部署流程。

image.png

7、基于昇思,玩转 CogView4生成汉字!

2025年3月4日,智谱开源了首个支持生成汉字的开源文生图模型 CogView4。该模型具有6B权重,支持原生中文输入,支持中文文字绘画。CogView4 在 DPG-Bench 基准测试中的综合评分排名第一,在开源文生图模型中达到 SOTA 水平。

昇思MindSpore 团队快速支持 CogView4 Diffusers 工作流并开源至MindSpore ONE仓库,结合昇腾硬件,为开发者提供简单易用体验。本文将介绍如何基于昇思MindSpore和单机Atlas 800T A2,通过简单命令,单卡玩转 CogView4 推理。

开源链接:

https://github.com/mindspore-lab/mindone/tree/master/examples/cogview

魔乐社区在线体验:

https://modelers.cn/spaces/MindSpore-Lab/cogview4

image.png

8、昇思MindSpore支持QwQ-32B并上线开源社区

QwQ-32B是阿里云于2025年3月6日发布的人工智能大型语言模型。这是一款拥有 320 亿参数的模型,其性能可与具备 6710 亿参数(其中 370 亿被激活)的 DeepSeek-R1 媲美。

昇思MindSpore原生支持Qwen2.5-32B, 在此基础上0Day完成QwQ-32B的支持,并且完成性能测试。昇思MindSpore开源社区、魔乐社区已第一时间上架该模型,欢迎广大开发者下载体验! 

魔乐社区:https://modelers.cn/models/MindSpore-Lab/QwQ-32B

image.png

9、基于MindSpore,玩转HunyuanVideo-I2V图生视频!

HunyuanVideo-I2V是腾讯混元系列模型中一个新型的图像到视频转换模型。用户只需要提供一张图片,简要描述要生成的视频内容,例如动作描述,镜头位置等等,HunyuanVideo-I2V就可以让图片动起来,生成高清连贯的视频,最高支持720P 5s。

昇思MindSpore团队现已完成对HunyuanVideo-I2V的适配,并将其开源至MindSpore ONE仓库,本文详细介绍了如何基于昇思MindSpore和Atlas 800T A2,完整实现HunyuanVideo-I2V从图像到视频生成的部署流程。

MindSpore ONE开源代码仓链接:https://github.com/mindspore-lab/mindone/tree/master/examples/hunyuanvideo-i2v

魔乐社区代码仓链接:https://modelers.cn/models/MindSpore-Lab/hyvideo

image.png

10、昇思MindSpore原生论文 | 基于MobileNetV2的家用睡眠呼吸障碍早筛模型

睡眠呼吸障碍(Sleep Apnea,简称SA)是一种常见但容易被忽视的健康问题,未及时诊断和干预可能会导致心血管疾病、代谢紊乱以及其他健康问题,因此,早期筛查至关重要,但目前的检测主要依赖于多导睡眠图(PSG)测试,复杂、昂贵且需要在专业医疗机构进行,因此开发一种家用的高效、低成本的筛查方法具有重要意义。

本研究提出了一种基于MobileNetV2的家用睡眠呼吸障碍筛查模型,通过在MindSpore框架上的实现,该模型在保证高预测精度的同时大幅降低了计算成本,且实验结果验证了该模型在实际应用场景中的潜力。

image.png

11、MindSpore源码精读之ckpt及safetensors权重保存流程

通过无数次迭代让模型达到满意的性能后,如何保存网络权重这个环节不可忽视。它承载着模型训练的成果与智慧结晶,从模型复用的角度来看,保存的权重能让我们在不同场景下快速调用已训练好的模型,无需重复训练,大大节省时间和计算资源。在迁移学习中,保存的权重更是成为知识迁移的桥梁,助力新任务快速收敛。本文详细介绍了 ckpt 和 safetensors 这两种权重保存的流程

image.png

12、MindSpore源码精读之权重加载实现全解析:从Checkpoint到神经网络的桥梁

在模型规模、加载速度和兼容性之间,永远存在权衡。深度理解加载流程,本质是掌握框架与硬件、算法与工程的对话规则。MindSpore的权重加载,本质是一场「参数元信息」的精确舞蹈——从.ckpt文件的魔数校验(0x6D73636B),到choice_func的布尔过滤,再到strict_load=False时的后缀匹配(源码中通过_get_parameter_tuple实现),每个环节都暗藏框架设计者对兼容性的极致追求。

image.png

13、MindSpore Transformers支持DeepSeek-R1蒸馏全流程

DeepSeek-R1具有生成长思维链(CoT)的能力,这种能力可以通过蒸馏技术迁移到小模型上。小模型学习了R1模型中的知识后,即使不经过强化学习(RL),也能得到出色的推理效果。

DeepSeek团队通过使用R1模型生成60万条CoT推理数据,蒸馏了Qwen和Llama这样的开源模型,成功验证了这一迁移能力。

MindSpore Transformers大模型使能套件依托MindSpore AI框架提供的丰富的多维混合并行能力,亲和开源工具与通用数据格式,原生支持大模型蒸馏的端到端全流程开发,提供了高效、便捷的解决方案。

image.png

14、视频生成效果惊艳!昇思率先完成Open-Sora 2.0支持

Open-Sora 2.0是潞晨科技推出的全新开源SOTA视频生成模型,相比传统高性能视频生成模型大幅降低了训练成本。Open-Sora 2.0基于3D自编码器 、3D全注意力机制和MMDiT架构,结合高效的并行训练方案和高压缩比自编码器,显著提升训练效率和推理速度。

MindSpore团队现已完成对Open-Sora 2.0的适配,并将其开源至MindSpore ONE仓库,本文详细介绍了如何基于昇思MindSpore和单机Atlas 800T A2,完整实现Open-Sora 2.0视频生成流程。

MindSpore ONE开源代码仓链接:https://github.com/mindspore-lab/mindone/tree/master/examples/opensora_hpcai

image.png

七、感谢每一位朋友、开发者的支持

在此感谢社区伙伴们、可爱的小孢子们以及昇思MindSpore SIG组成员们,因为大家的共同努力及辛勤奉献,昇思MindSpore才能不断成长与发展!同时我们对可能出现的不完善之处向您表示诚挚的歉意,并衷心感谢您的理解与支持。

未来,昇思MindSpore AI框架将持续致力于打造人工智能创新之源,凝聚产业力量,扎根AI根技术,使能大模型与科学智能,成为AI创新的首选框架。

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐