中国的大模型怎么突然间就领先了？

DeepSeek用低成本和高性能震撼了世界，MiniMax一出手就是“王炸”，MiniMax-01凭借超长的长文本理解能力，被海外媒体、投资人和研究员认为是可以和OpenAI“掰手腕”的顶尖开源模型。DeepSeek的爆火也证明了这一点，它不宣传用户数、API调用量这些数据，就靠强悍的模型能力，便宜的价格，在7天内狂揽1亿用户，增长速度非常夸张。这种策略立刻点燃了全球用户的热情，掀起了讨论、部署、

IT界那些事儿

109人浏览 · 2025-02-25 14:59:25

IT界那些事儿 · 2025-02-25 14:59:25 发布

2025年开年，国产的大模型频频“刷屏”。

DeepSeek用低成本和高性能震撼了世界，MiniMax一出手就是“王炸”，MiniMax-01凭借超长的长文本理解能力，被海外媒体、投资人和研究员认为是可以和OpenAI“掰手腕”的顶尖开源模型。

之前还有人说中国顶尖企业的大型语言模型大约落后美国同行6到9个月，这怎么突然间就领先了呢？

其实，如果我们仔细看看这些优秀大模型的特点和最近的发展策略，就能从中找到答案。

01 底层技术创新是根本

MiniMax针对大模型最底层、最核心的Transformer架构进行了重构，它第一次在一个超大规模商用模型上，引入了有别于传统Transformer架构的线性注意力机制，以极低的算力成本，为困扰着整个大模型行业的难题提供一个新的解题思路。

这种底层技术创新让MiniMax-01大模型能够高效处理高达400万token的输入，可输入长度是GPT-4o的32倍，Claude-3.5-Sonnet的20倍。

特别值得一提的是，最近包括DeepSeek在内的多家公司的最新研究论文均聚焦于通过改进传统稀疏注意力机制的架构来提升大语言模型的长文本处理能力，而MiniMax早在1月中旬就把具备超长文本处理能力的模型发布并且开源了！

同样，DeepSeek也是在大模型中采用了创新的架构，从而实现了极低的训练成本和很好的推理能力。

由于MiniMax-01大模型在底层技术层面做出了创新，所以一经发布，立刻在海外引起了热议浪潮。

除了开源模型，在文生视频领域，MiniMax也做了重要更新。

基于MiniMax S2V-01视频模型的“主体参考”功能，仅需上传一张图片即可识别并锁定主体角色。文本框内输入Prompt提示词，无需漫长等待，即可生成富有创意且主体保持一致的高质量视频。

主体参考+Prompt：A close-up of a young boy in a dimly lit room, his eyes fixed on the glowing screen of a gaming console. The camera is positioned slightly above eye level, focusing on his concentrated expression as his fingers nimbly manipulate the controller. A game character appears, breaking free from the screen's confines.

2024年12月，基于MiniMax大模型的海螺AI海外访问量超2700万，突破历史新高并荣登12月全球AI视频产品榜首位。