1️⃣全球最大开源视频模型,现在也Created in China了,阶跃出品

量子位|阅读原文

阶跃星辰联合吉利汽车集团,开源了两款多模态大模型:1)全球范围内参数量最大的开源视频生成模型Step-Video-T2V;2)行业内首款产品级开源语音交互大模型Step-Audio。

从官方公布的技术报告来看,这次开源的两款模型在Benchmark中表现优秀,性能超过国内外同类开源模型。抱抱脸官方也转发了中国区负责人给予的高度评价。划重点,“The next DeepSeek”、“HUGE SoTA”。目前,本次2款新的开源模型都已接入跃问App,人人可以体验。

官方介绍,Step-Video-T2V共有4大技术特点:

第一,可直接生成最长204帧、540P分辨率的视频,确保生成的视频内容具有极高的一致性和信息密度。

第二,针对视频生成任务设计并训练了高压缩比的Video-VAE,在保证视频重构质量的前提下,能够将视频在空间维度压缩16×16倍,时间维度压缩8倍。当下市面上多数VAE模型压缩比为8x8x4,在相同视频帧数下,Video-VAE能额外压缩8倍,故而训练和生成效率都提升64倍。

第三,针对DiT模型的超参设置、模型结构和训练效率,Step-Video-T2V了进行深入的系统优化,确保训练过程的高效性和稳定性。

第四,详细介绍了预训练和后训练在内的完整训练策略,包括各阶段的训练任务、学习目标以及数据构建和筛选方式。

2️⃣马斯克20万块GPU炼出Grok-3,暴击DeepSeek R1数学屠榜!疯狂复仇OpenAI

新智元|阅读原文

人类史上首个在20万块GPU上训出的模型终于问世!刚刚,马斯克带队三位xAI成员在线开启直播,官宣Grok-3全家桶——1)Grok-3(Beta)、Grok-3 mini;2)首个推理模型Grok-3 Reasoning(Beta)、Grok-3 mini Reasoning:击败o3-mini/DeepSeek-R1,解锁推理时计算;3)首个AI智能体「DeepSearch」:联网深入搜索。

在多项基准测试中,Grok-3在数学(AIME 2024)、科学问答(GPQA)、编码(LCB)上刷新SOTA,大幅超越DeepSeek-V3、Gemini-2 Pro、GPT-4o。Grok-3 mini的性能基本上领先或媲美其他闭源/开源模型。在著名大模型LMSYS Arena排行榜中,Grok-3(chocolate终于揭秘)刷榜,Elo评分超1400位列最高,没有任何一个模型能与之相比。Grok-3的数学能力十分惊人,几乎能完成大部分美国数学专业能力测试的题目。

3️⃣DeepSeek Inside:彻底的技术开放,成就的商业奇观

晚点LatePost|阅读原文

中国正在经历自己的 “ChatGPT 时刻”。高潮是上周末,微信,这个几乎从不追赶任何潮流的国民级应用也在搜索页面接入了 DeepSeek-R1。

一个没花一分钱营销的技术公司实现了 “DeepSeek Inside” 的品牌奇迹。这个奇迹只能诞生在中国:互联网渗透最彻底的人口,每天 6 小时泡在数字世界里,抖音、小红书、微信、微博等平台接力将 DeepSeek 送到每个人眼前。先在全球技术社区引发热议,后在国内发酵,完美贴合在全球 AI 竞赛激发的情绪。春节假期造就社交裂变温床,被子女 “安利” 的长辈们点开小鲸鱼图标,完成 AI 在中国的首次全民级破圈。

紧接着,中国头部的公有云平台,腾讯云、阿里云、百度云、火山引擎,同样赶在春节期间上线 DeepSeek 模型的 API 服务,甚至拿出更低的价格。但因为晚了 48 小时,它们的增长幅度就比硅基流动差一大截。

英伟达 AI 科学家吉姆·范(Jim Fan)说,DeepSeek 不仅开源一系列模型,还公开训练秘诀。同一时间,Meta 首席科学家杨立昆(Yann LeCun)也说,外界不要只关注中美 AI 竞争,DeepSeek 更重要的价值是 “开源对闭源的胜利”。

对此,你怎么看?

详情查看参与互动赢蚂蚁周边


支付宝开放平台-开发者社区

 「AGI 之路」 内容库

欢迎你的投稿!戳我进群


支付宝/钉钉扫码加入支付宝开发者钉组织,可了解支付宝开放能力最新动态,订阅文档更新消息,和同城同行业交流业务,与支付宝产研沟通交流。

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐