小参数模型VibeThinker-3B,仅有30亿参数的密集推理模型,它在包括数学解题、竞赛编程等高难度可验证推理任务上,已经进入Gemini 3 Pro、GPT-5 high、Claude Opus 4.5、GLM-5、Kimi K2.5等国际前沿模型的性能区间,在国内也具备对标豆包、MiniMax、GLM、Kimi等一线模型的实力

“小而强”的推理专才:偏科背后的技术逻辑

VibeThinker-3B的核心亮点是其用远小于主流大模型的参数规模,在特定赛道做到了接近一线大模型的表现

第一是,包括数学竞赛与推理题,VibeThinker-3B可用于数学教育与培训;

第二,其还能解编程题与算法题,也能被用于编程教学辅助;

第三,VibeThinker-3B在STEM领域推理,例如物理、工程、逻辑推导、公式应用等结构明确的问题上同样拥有着不错表现;

第四,其还能进行数据分析类应用,可以在搭建Agent系统中,作为一个逻辑推理子部件,通过路由程序分发解决高难度的数学、竞赛代码、逻辑推理能问题

VibeThinker-3B的能力边界也同样清晰。在开放领域知识、通用对话和长尾场景理解上,VibeThinker-3B和千亿级通用大模型存在明显差距

从“规模竞赛”到“效率革命”

“规模即智能”的Scaling Law(规模定律)是AI行业的共识——参数越大、数据越多、算力越强,模型能力就越强

小参数模型可在消费级设备上本地运行,对于教育、代码生成、数学解题等有明确验证信号的场景

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐