【云馨AI-大模型】2025年3月AI领域十大突破性进展：从万亿参数大模型到人形机器人量产，这些技术如何重塑未来？

2025 AGIC深圳国际通用人工智能大会将于8月27-29日举行，8万平方米展区汇聚华为、腾讯、商汤等千家企业，首发超100件黑科技，涵盖具身智能、万亿参数模型等领域，国际展商占比40%。阿里万相大模型开源6天后反超DeepSeek-R1，登顶Hugging Face热榜，总下载量超百万，GitHub Star数破6000，成为全球最受欢迎开源模型之一。Predibase受DeepSeek-R1

rundreamsFly

342人浏览 · 2025-04-03 18:34:56

rundreamsFly · 2025-04-03 18:34:56 发布

一、大模型军备竞赛再升级

腾讯混元T1模型颠覆推理成本
腾讯于3月21日发布全新推理模型T1，推理成本仅为竞品的1/4，推理速度达80 tokens/s，逻辑评分超越OpenAI-o1。混元大模型同步登上Chatbot Arena全球Top 15榜单，标志着国产模型首次跻身国际一线梯队。
Mistral Small 3.1单卡可跑
法国Mistral AI推出小型模型Mistral Small 3.1，支持128K上下文、单张RTX 4090显卡或32GB内存Mac本地运行，性能优于Gemma 3，推动边缘计算AI应用普及。
阿里万相登顶开源榜首
阿里万相大模型开源6天后反超DeepSeek-R1，登顶Hugging Face热榜，总下载量超百万，GitHub Star数破6000，成为全球最受欢迎开源模型之一。

二、开源生态与技术突破

DeepSeek开源协议放宽引爆生态
DeepSeek发布V3模型更新，采用MIT开源协议并提升编程能力，生成的动画天气卡片代码质量接近Claude 3.7，为商业集成打开大门。其开源代码已适配国产AI芯片，推动产业链协作。
全球首个强化微调平台开源
Predibase受DeepSeek-R1启发，发布端到端强化微调平台（RFT），支持无服务器训练，简化大模型微调流程，降低企业AI部署门槛。
UCSD华人团队优化LLM吞吐量
加州大学圣地亚哥分校全华人团队提出“预填充-解码分离”技术，通过DistServe系统将LLM吞吐量提升至传统方案的1.8倍，显著降低推理延迟。