一张图彻底拆解DeepSeek V3和R1双模型

DeepSeek-V3-Base，685B参数的MoE架构，256个专家模块，每次只激活8个专家（TopK=8）。简单说，就是“人多力量大，但干活的人少”，既高效又省钱。

耿直学编程

2412人浏览 · 2025-03-22 11:09:29

耿直学编程 · 2025-03-22 11:09:29 发布

一张图看懂DeepSeek

基座模型：DeepSeek-V3-Base，685B参数的MoE架构，256个专家模块，每次只激活8个专家（TopK=8）。简单说，就是“人多力量大，但干活的人少”，既高效又省钱。
衍生路径：

V3：走的是“聊天达人”路线，通过指令微调（SFT）和人类反馈强化学习（RLHF）优化对话能力。
R1：走的是“推理大神”路线，基于R1-Zero生成80万训练样本，通过两阶段SFT+RL提升推理能力。

核心模型解析

1、基座模型：DeepSeek-V3-Base

参数规模：685B参数的MoE架构，包含256个专家模块，每次激活前8个专家（TopK=8）。
核心特性：通过稀疏性与动态路由机制（Sigmoid），平衡计算效率与模型性能。
定位：所有衍生模型的共同基础，未针对对话任务优化。

2、对话优化版：DeepSeek-V3

技术路径：基于V3-Base，通过指令微调（SFT）与人类反馈强化学习（RLHF）优化对话能力。
核心改进：输出更符合人类偏好（有用、无害、诚实），适用于通用对话场景。

3、纯强化学习模型：DeepSeek-R1-Zero

训练方式：直接对V3-Base进行纯强化学习（RL），未使用监督微调数据。
优势：当前系列中推理能力最强，擅长复杂逻辑任务。
缺陷：输出存在语言混杂、可读性差等问题。

4、推理优化版：DeepSeek-R1

技术改进：

冷启动SFT：使用数千条数据对V3-Base初步微调，提升RL训练起点。
混合数据生成：通过RL生成60万推理样本+20万非推理样本（含CoT思维链）。
两阶段训练：对V3-Base进行两轮SFT+RL，最终输出高可读性推理模型。

核心价值：在保留R1-Zero强推理能力的同时，大幅提升输出的可读性。

5、轻量化衍生模型

模型类型	技术原理	应用场景
R1蒸馏模型	将R1能力迁移至Qwen/Llama等轻量模型	低资源设备推理任务
量化模型	降低参数精度（如INT8）以压缩模型体积	边缘计算与实时推理

DeepSeek V3与R1区别

维度	DeepSeek-V3	DeepSeek-R1
训练目标	通用对话能力优化	复杂推理任务优化
关键技术	SFT + RLHF	SFT + 多阶段RL + 混合数据生成
输出特点	自然流畅，符合人类交互习惯	逻辑严谨，附带思维链（CoT）
适用场景	日常问答、多轮对话	数学推导、代码生成、复杂问题解决

注意事项

术语澄清：RL阶段的具体实现（如奖励函数设计）在R1-Zero与R1中存在差异，需参考原文技术细节。
模型选择：

优先使用DeepSeek-V3处理交互式任务。
需强推理能力时选择DeepSeek-R1，若资源受限可选用其蒸馏或量化版本。

我的DeepSeek部署资料已打包好（自取↓）
https://pan.quark.cn/s/7e0fa45596e4

但如果你想知道这个工具为什么能“听懂人话”、写出代码甚至预测市场趋势——答案就藏在大模型技术里！

❗️为什么你必须了解大模型？

1️⃣ 薪资爆炸：应届大模型工程师年薪40万起步，懂“Prompt调教”的带货主播收入翻3倍

2️⃣ 行业重构：金融、医疗、教育正在被AI重塑，不用大模型的公司3年内必淘汰

3️⃣ 零门槛上车：90%的进阶技巧不需写代码！会说话就能指挥AI

（附深度求索BOSS招聘信息）
在这里插入图片描述

⚠️警惕：当同事用DeepSeek 3小时干完你3天的工作时，淘汰倒计时就开始了。

那么，如何系统的去学习大模型LLM？

作为一名从业五年的资深大模型算法工程师，我经常会收到一些评论和私信，我是小白，学习大模型该从哪里入手呢？老师啊，我自学没有方向怎么办？老师，这个地方我不会啊。如果你也有类似的经历，一定要继续看下去！当然这些问题啊，也不是三言两语啊就能讲明白的。

所以我综合了大模型的所有知识点，给大家带来一套全网最全最细的大模型零基础教程。在做这套教程之前呢，我就曾放空大脑，以一个大模型小白的角度去重新解析它，采用基础知识和实战项目相结合的教学方式，历时3个月，终于完成了这样的课程，让你真正体会到什么是每一秒都在疯狂输出知识点。

篇幅有限，⚡️ 朋友们如果有需要全套《2025全新制作的大模型全套资料》，扫码获取~
在这里插入图片描述

👉大模型学习指南+路线汇总👈

我们这套资料呢，会从基础篇、进阶篇和项目实战篇等三大方面来讲解。
在这里插入图片描述

👉①.基础篇👈

基础篇里面包括了Python快速入门、AI开发环境搭建及提示词工程，带你学习大模型核心原理、prompt使用技巧、Transformer架构和预训练、SFT、RLHF等一些基础概念，用最易懂的方式带你入门大模型。
在这里插入图片描述

👉②.进阶篇👈

接下来是进阶篇，你将掌握RAG、Agent、Langchain、大模型微调和私有化部署，学习如何构建外挂知识库并和自己的企业相结合，学习如何使用langchain框架提高开发效率和代码质量、学习如何选择合适的基座模型并进行数据集的收集预处理以及具体的模型微调等等。
在这里插入图片描述

👉③.实战篇👈

实战篇会手把手带着大家练习企业级的落地项目（已脱敏），比如RAG医疗问答系统、Agent智能电商客服系统、数字人项目实战、教育行业智能助教等等，从而帮助大家更好的应对大模型时代的挑战。
在这里插入图片描述

👉④.福利篇👈

最后呢，会给大家一个小福利，课程视频中的所有素材，有搭建AI开发环境资料包，还有学习计划表，几十上百G素材、电子书和课件等等，只要你能想到的素材，我这里几乎都有。我已经全部上传到CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】
在这里插入图片描述
相信我，这套大模型系统教程将会是全网最齐全最易懂的小白专用课！！

DeepSeek技术社区

欢迎加入DeepSeek 技术社区。在这里，你可以找到志同道合的朋友，共同探索AI技术的奥秘。

更多推荐

DeepSeek V4-Flash 昇腾910B单机部署详细方案文档

DeepSeek技术社区

DeepSeek-V4-PRO 昇腾910B多机多卡级联及大EP架构部署实操方案（含4台服务器+RoCE交换机+全闪存储）

DeepSeek技术社区

openclaw v2026.4.24 发布：Google Meet 深度集成、DeepSeek V4 上线、浏览器自动化与插件架构全面升级

代码地址：github.com/openclaw/openclawOpenClaw v2026.4.24 是一次里程碑式的大版本更新，涵盖了从模型生态、实时语音、浏览器自动化到多渠道集成、企业级可观测性的全方位进化。Google Meet 的原生接入使其成为真正意义上的全场景智能代理平台，DeepSeek V4 Flash 成为默认模型则大幅降低了新用户的使用门槛。同时，超过两百项的问题修复和优化