我们来学人工智能 -- 本地部署DeepSeek？

能否部署deepseek

meFunDS

1810人浏览 · 2025-02-05 17:22:03

meFunDS · 2025-02-05 17:22:03 发布

本地部署DeepSeek

题记
误解
训练
推理
结语

题记

本地部署DeepSeek R1？
听说他用了2000个英伟达H800芯片集群进行训练，没啥概念，那看贴图
广为流传600 万美元成本仅还指预训练过程中 GPU 的花费
确定没搞错？要咱们玩这个…，本地部署这个…

误解

本地部署的博客、视频已经有很多了
还能说都是财神爷吗！当然不是，这里存在误解
仔细看600万美元的花费，是用在训练上，那就不得不掰扯掰扯训练和推理两个概念了

训练

训练需要密集的计算，通过神经网络算出结果后。如今，神经网络复杂度越来越高，一个网络的参数可以达到百万级以上，因此每一次调整都需要进行大量的计算。曾在斯坦福大学做过研究，在谷歌和百度都任职过的吴恩达这样举例“训练一个百度的汉语语音识别模型不仅需要4TB的训练数据，而且在整个训练周期中还需要20 exaflops（百亿亿次浮点运算）的算力”，训练是一个消耗巨量算力的怪兽。