英伟达反击AMD DeepSeek AI基准测试

英伟达指出，在DeepSeek R1模型中的推理性能测试里，RTX 5090尤其是在处理像Distill Qwen 7b和Distill Llama 8b这样的高级生成式AI模型时，每秒可运行200个Tokens，几乎是RX 7900 XTX的两倍。而英伟达的RTX 5090等产品则采用了其特有的架构设计和技术，例如CUDA生态系统，这是英伟达在AI计算领域的重要优势之一。对于市场格局来说，AMD

2401_86196562

1533人浏览 · 2025-02-05 06:51:17

2401_86196562 · 2025-02-05 06:51:17 发布

英伟达与AMD的竞争背景，在GPU市场，英伟达和AMD一直是主要竞争对手。长期以来，英伟达凭借其强大的技术实力和广泛的市场份额，在AI计算领域占据主导地位。然而，AMD近年来不断发力，在GPU性能和AI算力方面取得了显著进步，对英伟达构成了越来越大的威胁。

AMD DeepSeek AI基准测试情况

近期，AMD发布的DeepSeek AI基准测试结果引起了广泛关注。在该测试中，AMD的Radeon RX 7900 XTX在运行DeepSeek R1大模型时，展现出了出色的性能。例如，在运行Qwen 7B蒸馏模型时，其处理速度较英伟达的RTX 4090提升了13%，与RTX 4080 Super对比最高拉开了34%的差距。

英伟达的反击举措

英伟达迅速对AMD的DeepSeek AI基准测试做出了强势反击。英伟达在一篇博客文章中反驳称，其RTX 5090比RX 7900 XTX快达2.2倍。英伟达指出，在DeepSeek R1模型中的推理性能测试里，RTX 5090尤其是在处理像Distill Qwen 7b和Distill Llama 8b这样的高级生成式AI模型时，每秒可运行200个Tokens，几乎是RX 7900 XTX的两倍。这一反击试图重新确立英伟达在性能方面的优势地位。

双方竞争的技术层面分析

从硬件架构来看，AMD的RDNA3架构集成了192个专用计算模块，支持双精度浮点与整型混合运算。虽然该架构并非专为AI设计，但通过推出《DeepSeek R1部署方案》，实现了消费级硬件与大模型框架的深度适配。而英伟达的RTX 5090等产品则采用了其特有的架构设计和技术，例如CUDA生态系统，这是英伟达在AI计算领域的重要优势之一。CUDA使得英伟达的GPU在与各种AI软件和框架的兼容性和性能优化方面表现出色。

在显存方面，RTX 4090拥有24GB显存，像豪华集装箱卡车，而7900 XTX的96MB Infinity Cache则如同直连仓库的高速公路。在加载Qwen 1.5B量化模型时，AMD凭借缓存命中率优势，首token响应时间缩短至0.8秒，比对手快22%。但英伟达的显卡在整体显存容量和带宽等方面也有自身的特点和优势，能够满足不同规模和复杂度的AI任务需求。

双方竞争对市场的影响

对消费者而言，英伟达和AMD的竞争意味着更多的选择和可能。如果消费者更注重性价比，AMD的产品可能具有一定吸引力，因为其在价格相对较低的情况下能提供不错的性能。而如果消费者追求极致的性能和对复杂模型的支持能力，英伟达的高端显卡可能更符合需求。

对于市场格局来说，AMD在DeepSeek AI基准测试中的表现以及英伟达的反击，加剧了GPU市场的竞争态势。这可能促使双方进一步加大研发投入，不断推出性能更优、价格更具竞争力的产品。同时，也可能引发其他GPU厂商的关注和参与，推动整个行业的技术进步和创新。

未来发展趋势展望

随着人工智能技术的不断发展，GPU在AI领域的应用前景广阔。英伟达和AMD的竞争预计将在未来持续升级。双方可能会在硬件性能提升、软件生态完善、与更多AI框架和应用的适配等方面展开激烈角逐。此外，随着边缘计算需求的增长，显卡厂商还需要在架构设计和生态构建方面不断创新，以适应市场的变化和需求。

总之，英伟达反击AMD DeepSeek AI基准测试这一事件，反映了GPU市场竞争的激烈程度和人工智能领域对高性能计算的需求不断增长。无论是英伟达还是AMD，都需要不断创新和优化，以在这场竞争中占据有利地位，而消费者和整个市场也将从这场竞争中受益，迎来更多优质的产品和服务。