小模型VibeThinker-3B 属于小而强”的推理

ejinxian

10人浏览 · 2026-06-29 10:33:36

ejinxian · 2026-06-29 10:33:36 发布

小参数模型VibeThinker-3B，仅有30亿参数的密集推理模型，它在包括数学解题、竞赛编程等高难度可验证推理任务上，已经进入Gemini 3 Pro、GPT-5 high、Claude Opus 4.5、GLM-5、Kimi K2.5等国际前沿模型的性能区间，在国内也具备对标豆包、MiniMax、GLM、Kimi等一线模型的实力

“小而强”的推理专才：偏科背后的技术逻辑

VibeThinker-3B的核心亮点是其用远小于主流大模型的参数规模，在特定赛道做到了接近一线大模型的表现

第一是，包括数学竞赛与推理题，VibeThinker-3B可用于数学教育与培训；

第二，其还能解编程题与算法题，也能被用于编程教学辅助；

第三，VibeThinker-3B在STEM领域推理，例如物理、工程、逻辑推导、公式应用等结构明确的问题上同样拥有着不错表现；

第四，其还能进行数据分析类应用，可以在搭建Agent系统中，作为一个逻辑推理子部件，通过路由程序分发解决高难度的数学、竞赛代码、逻辑推理能问题

VibeThinker-3B的能力边界也同样清晰。在开放领域知识、通用对话和长尾场景理解上，VibeThinker-3B和千亿级通用大模型存在明显差距

从“规模竞赛”到“效率革命”

“规模即智能”的Scaling Law（规模定律）是AI行业的共识——参数越大、数据越多、算力越强，模型能力就越强

小参数模型可在消费级设备上本地运行，对于教育、代码生成、数学解题等有明确验证信号的场景

DeepSeek技术社区

欢迎加入DeepSeek 技术社区。在这里，你可以找到志同道合的朋友，共同探索AI技术的奥秘。

更多推荐

薅羊毛啦！10 刀体验金，GPT/Claude 随便调！

随着 AI API 的使用场景越来越多，个人开发者、团队测试和企业项目对接口服务的要求也越来越高。大家不只是需要一个能调用的接口，更需要稳定的响应、清晰的价格、顺手的接入体验，以及可以长期使用的服务。无论是日常 AI API 调用、项目开发测试，还是 Claude Code 使用场景，我希望提供一个更简单、更清晰、更实用的选择。价格透明，分组明确，按需选择，不绕弯子👗舞七三洞酒舞酒吧酒）我们不想

DeepSeek技术社区

Headroom的中文文本适配方案，让CC/Codex节约30%-60%token

【摘要】Headroom是一个流行的AI编码辅助工具（GitHub 5.2万+星），专注于长上下文压缩优化，但原生版本对中文支持不足。为此推出的headroom-zh项目，在保留原有功能基础上，专门优化了中文/中英混合内容的处理能力：1）精准压缩技术文档/日志中的中文内容；2）保留路径/命令等关键信息；3）在Codex/Claude等场景下可减少60%+无效token消耗。经实测在1.4万字中文r

DeepSeek技术社区

Codex和Claude能帮门店做团购活动吗？套餐设计、员工话术和复盘表教程

Codex和Claude能帮门店做团购活动吗，真正要解决的不是“让 AI 随便写几段内容”，而是把一个重复、分散、容易遗漏的业务流程拆成可以检查、可以复用的小步骤。本地门店团购活动策划这个场景里，常见问题不是缺工具，而是资料散、口径乱、人工复制太多，最后很难稳定交付。这篇文章按真实工作流来讲：先明确要交付什么，再分清 Claude 和 Codex 各自适合