为什么本地部署DeepSeek选择7B模型

可以看到，7B模型的数据大多数超出8B，而大小还小一点，所以选择是当然的。来源：DeepSeek官方数据（

SayForLin

1556人浏览 · 2025-02-11 23:44:52

SayForLin · 2025-02-11 23:44:52 发布

不多说，上图表：

R1模型列表

Model	Base Model	Download
DeepSeek-R1-Distill-Qwen-1.5B	Qwen2.5-Math-1.5B	🤗 HuggingFace
DeepSeek-R1-Distill-Qwen-7B	Qwen2.5-Math-7B	🤗 HuggingFace
DeepSeek-R1-Distill-Llama-8B	Llama-3.1-8B	🤗 HuggingFace
DeepSeek-R1-Distill-Qwen-14B	Qwen2.5-14B	🤗 HuggingFace
DeepSeek-R1-Distill-Qwen-32B	Qwen2.5-32B	🤗 HuggingFace
DeepSeek-R1-Distill-Llama-70B	Llama-3.3-70B-Instruct	🤗 HuggingFace

R1模型对比

来源：DeepSeek官方数据（deepseek-ai/DeepSeek-R1）

可以看到，7B模型的数据大多数超出8B，而大小还小一点，所以选择是当然的。

Model	AIME 2024 pass@1	AIME 2024 cons@64	MATH-500 pass@1	GPQA Diamond pass@1	LiveCodeBench pass@1	CodeForces rating
GPT-4o-0513	9.3	13.4	74.6	49.9	32.9	759
Claude-3.5-Sonnet-1022	16.0	26.7	78.3	65.0	38.9	717
o1-mini	63.6	80.0	90.0	60.0	53.8	1820
QwQ-32B-Preview	44.0	60.0	90.6	54.5	41.9	1316
DeepSeek-R1-Distill-Qwen-1.5B	28.9	52.7	83.9	33.8	16.9	954
DeepSeek-R1-Distill-Qwen-7B	55.5	83.3	92.8	49.1	37.6	1189
DeepSeek-R1-Distill-Qwen-14B	69.7	80.0	93.9	59.1	53.1	1481
DeepSeek-R1-Distill-Qwen-32B	72.6	83.3	94.3	62.1	57.2	1691
DeepSeek-R1-Distill-Llama-8B	50.4	80.0	89.1	49.0	39.6	1205
DeepSeek-R1-Distill-Llama-70B	70.0	86.7	94.5	65.2	57.5	1633

DeepSeek技术社区

欢迎加入DeepSeek 技术社区。在这里，你可以找到志同道合的朋友，共同探索AI技术的奥秘。

更多推荐

cover

DeepSeek V4 全面开源：1.6T 参数背后的中国式创新

DeepSeek技术社区

cover

Agent 工具编排的边界控制：从 DeepSeek-V4 的验收标准看 MCP 容错设计

DeepSeek技术社区

cover

RAG 混合检索的离线评测门禁：何时向量搜索反而降低回答质量

DeepSeek技术社区

所有评论(0)

查看更多评论

SayForLin

已为社区贡献2条内容