登录社区云,与社区用户共同成长
邀请您加入社区
📌 今天来解析 DeepSeek V4训练流程,主要关注预训练阶段与 V3/V3.2 的区别、1M长上下文拓展训练、后训练 On-Policy Distillation 实现。
欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。
更多推荐
vLLM 吞吐优化误区:为什么你的批处理大小反而拉低了 P99 延迟
Agent工具越多越好?权限失控时如何用OpenTelemetry快速定位故障边界
混合检索权重调参:BM25与向量分数归一化为何总踩坑?
扫一扫分享内容
为遵守国家网络实名制规定,未绑定将限制内容发布与互动
所有评论(0)