前言

从过年前到现在,deepseek的热度一直持续上升。很多圈外人只是知道中国推出了一个AI 大模型,但是很难理解为什么会这么火?因为在之前国内也有很多大模型的厂商,比如字节的豆包,阿里的千问等等,而且不管是生态还是应用都做的不错,推出的时候也没这么炸裂,为什么deepseek这一次的大模型就这么火呢,为什么一个大模型的推出会导致美股大跌。接下来由圈内人从技术角度和战略角度给你分析,篇幅有点长。

原因

deepseek火起来一共有2个原因,如果不想内容的可以直接看总结

1. 新AI架构

通过看V3和R1的论文可以看出,deepseek在性能优化方面都做到了极致,比如 DualPipe 算法、无损负载平衡、 FP8 低精度处理等等,但是这些都还不够。最炸裂的是它的底层竟然用的是PTX(Parallel Thread Execution)而不是CUDA(Compute Unified Device Architecture,统一计算架构),这说明

1.1. deepseek内部的开发实力非常之强,真正是做到技术推动企业发展
PTX语言的编写需要技术人员既懂懂AI 模型的算法,又要懂计算机系统架构来高效分配硬件资源.维护起来非常复杂和困难。简单说,你现在有一个需求需要计算全中国一共有多少人口的一个准确数字,cuda就相当于有一个接口,你输入一个日期,结果就出来了。而PTX相当于每个省、市、县、乡、镇、村、直辖市、特别行政区的人口你都得自己去找正确的对接方式来统计,然后再汇总给出去。

1.2. 未来是很有可能打破N卡一统江湖的局面
自从openai的chatgpt火了之后,老黄的N卡价格一路高涨,4090以及A100、H100甚至作为战略物资禁止向中国出售,CUDA的护城河导致AI的从业者研究人员只能忍着高价格千方百计买N卡,若是有架构真的能绕过CUDA,AI的硬件价格会极限下降。非圈内人可能对AI硬件价格没什么感受,下面以一个简单的例子来让大家有直观的感受

举个例子:以之前开源最火的llama3.1 70b为例

推理:

FP32全精度FP16半精度Int8精度Int4精度
约280GB显存约140GB显存约70GB显存约35GB显存

微调:

全参数微调(FP32全精度)全参数微调(FP16半精度)LoRA(FP16半精度)QLoRA(Int8精度)QLoRA(Int4精度)
约1200GB显存约600GB显存约160GB显存约80GB显存约48GB显存

上面2个表格我们就只看最后一列,就以最低的显存要求:推理35GB,微调48GB为例。分别至少需要2张以上的24GB显存的显卡

上面的精度越小损失就越大,简单理解就是AI输出的准确率就越低,但并不是绝对
比如说在二进制下:
如果用16位来存储数字3是 0000 0000 0000 0011
如果用8位来存储数字3是 0000 0011(可以发现比16位的3少了前面8个0,精度丢失了)

同系列不同型号显卡价格对比:

N卡N卡单卡价格总价A卡A卡单卡价格总价
40901.8w3.6w7900XTX740014800

可以发现,训练和微调一个这么小的模型。在显卡上N卡和A卡价格差距就在2倍以上更不要说按最高显存训练和推理,价格差距就是一笔巨款。当然N卡卖的贵的主要原因就是因为你要训练AI最简单的方式就是用N卡的CUDA,所以再贵也得接受,A卡没有CUDA,所以同样显存价格就低非常多。

DeepSeek-R1 依靠创新的 GRPO 训练算法、高效的奖励系统设计、精简的训练流程、模板化的训练方法使得开发成本仅为 600 万美元,性能就几乎和 OpenAI 的 O1 模型(约 5 亿美元)差不多甚至更强,节省了超过 98% 的成本。所以为什么deepseek出来后美东时间1月27日(周一)欧美科技股市值蒸发高达1.2万亿美元,其中,芯片制造商以及为AI和数据中心供电的全产业链公司遭受重创.英伟达(NVIDIA)收盘暴跌16.97%,市值一个交易日蒸发5926.58亿美元(约合人民币4.3万亿元)

总结1:
这里就可以回答最开篇的问题,为什么之前国内的AI推出并没有这么爆炸,很重要的原因是国内大模型大部分都用的国外的开源模型和框架来训练的,扮演的是一个追随者的角色,也就是别人开源完了之后我们直接拿来用自己的数据(语料)喂出来的大模型。而deepseek是让国内大模型从追随者变成创造者的转变,这才是漂亮国着急的。

2. 打碎"星际之门"的美梦

当地时间1月21日,美国新任总统唐纳德·特朗普在白宫抛下了一颗重磅炸弹,宣布了一项名为“Stargate”(星际之门)的人工智能基础设施投资计划,瞬间吸引了全球的目光。

特朗普表示,OpenAI、软银和甲骨文三家公司将成为这一宏大计划的先驱者,最初将向“星际之门”投入1000亿美元,而在未来四年,这一投资金额将大幅增加至5000亿美元。该项目将从美国得克萨斯州的一个数据中心破土动工,随后有望在全美各地推行。

据了解,“星际之门”项目旨在建立“为下一代人工智能提供动力的物理和虚拟基础设施”。甲骨文公司创始人拉里·埃里森透露,得克萨斯州的数据中心已在建设中。这意味着,美国在人工智能基础设施领域的布局已经从蓝图迈向了实际行动。
deepseek卡在这个时间点推出刚好打乱了星际之门计划的推进。顺便告诉全世界,搞AI,中国也可以!
致敬deepseek,致敬技术!

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐