
GB300加速推进,RTX 50显卡芯片量产延后,NVIDIA面临新的挑战与机遇
AI硬件市场正处于快速变化的时期,GB200未达预期、GB300的加速推进、CoWoS技术瓶颈、RTX 50系显卡量产延后以及ASIC AI的崛起,都在共同塑造着未来的竞争格局。尽管NVIDIA在GPU市场仍占据主导地位,但随着DeepSeek等新兴技术的崛起以及ASIC硬件的竞争,NVIDIA将面临更多的挑战。为了继续巩固其市场地位,NVIDIA必须加速产品创新,尤其是在专用AI硬件的研发和优化
野村分析师Anne Lee在2月12日的报告中表示,2025年全球服务器营收将同比增长46%,2026年增长22%。其中,AI服务器营收预计在2025年和2026年分别增长75%和31%。这些预测与近期美国主要云服务提供商(CSP)上调的资本支出指引基本一致。
GB300加速推进,BOM设计仍存挑战
GB200的推出本应是AI服务器市场的一次重要升级,但由于性能与预期的差距,导致市场的接受度未能达到预期。很多客户在实际使用中发现GB200在某些应用场景下的表现不足以满足更高计算需求。此外,由于全球市场竞争加剧,GB200面临来自其他硬件厂商的激烈挑战,进一步影响了其市场表现。同时,市场已经很大程度上消化了2025年上半年GB200机架出货缓慢的风险。
鉴于GB200未能实现预期目标,AI服务器硬件供应链已经开始转向更高端、更具性能优势的GB300产品。GB300提供了更强的计算能力和更高效的能耗比,尤其适合用于大规模AI模型的训练和推理。英伟达的芯片和模块级供应链将从2025年第二季度开始加速向B300及相关模块迁移。估计到2025年第二季度,英伟达超过50%的芯片和模块将基于B300。
B300 HGX预计将在2025年年中推出,而GB300系统(标准型)可能在2025年第三季度小批量上市。然而,B300和GB300仍面临挑战。野村证券认为,B300 UBB和GB300计算板的物料清单(BOM)设计尚未确定,因为英伟达正试图引入大量新的组件供应商,以降低成本并实现供应多元化。
CoWoS供需缺口依然巨大
目前,全球主要的CoWoS供应商包括台积电等半导体巨头,然而在需求暴涨的情况下,CoWoS的生产能力无法迅速跟上市场需求,导致部分高端GPU和AI芯片的交货周期延长。这一问题对于NVIDIA尤其重要,因为其高端AI芯片(如用于AI训练的A100、H100等)都大量依赖CoWoS技术。由于供需缺口,NVIDIA的部分产品生产进度受到影响,这也导致了GPU交付周期延长,特别是在AI服务器市场和云计算客户的需求面前。随着台积电等主要半导体制造商扩建CoWoS生产线,预计到2026年,CoWoS的生产能力将得到显著提升,从而逐步解决当前的供需缺口问题。
报告指出,英伟达AI服务器供应链的不同层级(从芯片到模块再到最终机架)之间存在差异。在上游CoWoS芯片供应方面,野村证券调整了Hopper的供应量,并预计2025年所有CoWoS-L都将用于生产B200/300。在需求方面,野村证券估计2024年和2025年分别只有440万和550万颗英伟达GPU被制成模块和系统。理想的GB机架数量与最终GB机架出货量之间也存在较大差距。2024-2026年英伟达GPU的供需缺口约为20-23%。
RTX 50显卡芯片供应紧张
与GB200、GB300类似,RTX 50系显卡的市场供给面临着交货周期延长的问题。虽然NVIDIA已经开始进行RTX 50系显卡的量产,但由于CoWoS技术和GPU制造的高要求,生产进度依旧滞后。根据分析师郭明錤最新透露,英伟达RTX 50系列显卡面临芯片供应紧张问题,这也导致了已开售的RTX 5090和RTX 5080出现一卡难求的景象。不仅如此,中端的RTX 5070和RTX 5060的量产时间也受到影响,原本计划2月量产的RTX 5070和3月量产的RTX 5060,如今可能分别延后至3月和4月。郭明錤还表示,即使量产时间未推迟,这两款显卡也会因数量稀少而开卖即缺货。
根据NVIDIA的生产计划,RTX 50系显卡的量产将在2025年第一季度开始,预计全球出货量将在2025年中期逐渐攀升,届时供货压力有望得到缓解。这一供应瓶颈也将影响到相关的AI服务器硬件和高性能计算的交付时间。
RTX 50系显卡不仅面向游戏市场,还广泛应用于AI计算、云服务以及高端数据中心,市场需求非常旺盛。尤其是在生成式AI爆发的背景下,许多企业和研究机构都急需这些显卡来支持日益复杂的计算任务。
ASIC AI崛起
相较于通用GPU,ASIC(专用集成电路)的设计更适合某些特定的AI计算任务,尤其是在深度学习和大规模AI训练领域。ASIC硬件具有较高的计算效率和较低的功耗,能够在特定任务上实现更优的性能。同时,在DeepSeek驱动下,CSP业者预计将更积极发展成本较低的自有ASIC方案,并把重心从AI训练转往AI推理,预估将逐步推升AI推理服务器占比至接近50%。未来GPU仍将支持各种AI算法发展,但持续发展大型算法的CSP业者和更重视成本考量的边缘企业客户将各有需求。
总结
AI硬件市场正处于快速变化的时期,GB200未达预期、GB300的加速推进、CoWoS技术瓶颈、RTX 50系显卡量产延后以及ASIC AI的崛起,都在共同塑造着未来的竞争格局。尽管NVIDIA在GPU市场仍占据主导地位,但随着DeepSeek等新兴技术的崛起以及ASIC硬件的竞争,NVIDIA将面临更多的挑战。为了继续巩固其市场地位,NVIDIA必须加速产品创新,尤其是在专用AI硬件的研发和优化上,以应对新兴技术的冲击并维持其在AI计算领域的领导地位。
赋创(EMPOWER X),作为高性能计算领域的积极探索者,始终致力于技术创新的前沿,密切关注并吸收最新的科技进展。我们专注于提供高效且可靠的计算解决方案,旨在满足多样化的需求。
想了解更多有关AI训练推理服务器相关的信息,不管是技术问题还是应用规划,欢迎随时联系我们,期待能为您提供有价值的见解与支持。
更多推荐
所有评论(0)