重磅！DeepSeek有望提前发布新一代模型R2和V4

DeepSeek在春节期间发布的R1在中国掀起了一股AI热潮，甚至带动了A股、港股的科技股上涨。但从各种排行榜来看，R1的领先势头并未保持太久，全球科技公司AI大模型竞争白热化，新品不断推出，热点一波接一波，如果一个公司没有长期的竞争力，恐怕很快会被消费者遗忘。对于DeepSeek何时推出下一代模型，备受外界关注。市场普遍预期R2将带来显著的技术进步，包括更强的代码生成能力和更广泛的多语言推理能力

AI-椰子不椰

7440人浏览 · 2025-03-27 17:40:56

AI-椰子不椰 · 2025-03-27 17:40:56 发布

DeepSeek在春节期间发布的R1在中国掀起了一股AI热潮，甚至带动了A股、港股的科技股上涨。但从各种排行榜来看，R1的领先势头并未保持太久，全球科技公司AI大模型竞争白热化，新品不断推出，热点一波接一波，如果一个公司没有长期的竞争力，恐怕很快会被消费者遗忘。

对于DeepSeek何时推出下一代模型，备受外界关注。市场普遍预期R2将带来显著的技术进步，包括更强的代码生成能力和更广泛的多语言推理能力。尽管最初有传言称R2将于2025年3月发布，但DeepSeek已正式否认该消息，目前预计的发布时间为2025年5月，但不排除提前发布的可能性。R2和V4的潜在发布预计将在人工智能领域引发显著的影响。

与一些西方同行不同，DeepSeek似乎更侧重于AGI的研究与开发，而非短期内的商业化和盈利。DeepSeek在实现高性能的同时，可能使用了相对较少的计算资源。R2作为R1的继任者，以及V4作为DeepSeek追求AGI的另一关键模型，其重要性不言而喻。

据消息来源透露，DeepSeek创始人对来自中国大型科技公司、风险投资机构及主权财富基金的投资意向并不感兴趣。这让阿里巴巴和腾讯等科技巨头得以凭借其成熟的技术基础设施和服务，成功赢得中国市场的商业客户。《金融时报》因此对DeepSeek收入来源的可持续性提出质疑。

但随着企业客户对付费服务的需求持续增长，据称DeepSeek上月的收入首次实现了收支平衡。

另外自从腾讯开始采用DeepSeek的开源模型以后，其API销售量大幅增长。约半数云客户（主要来自政府和金融领域）已测试DeepSeek的模型，其中20%的客户向腾讯请求支持以定制专属版本。

我一位在移动云工作的朋友告诉我，他们那的GPU云服务器被租赁一空，对于这家国企的云服务提供商来说，到了一个业务井喷期，以往的长期投入有望看到回报。

DeepSeek R2：开发进展与预期发布

关于DeepSeek下一代模型R2的发布，早期在X平台（原Twitter）上流传着诸多传闻，暗示该模型可能会在3月17日发布。这些传闻声称R2在编程能力、多语言推理以及成本效益方面都取得了重大突破。一些用户甚至乐观地认为，R2有能力挑战Anthropic的Claude Sonnet 3.7等顶尖模型。这些早期传闻和围绕3月17日发布的兴奋情绪，突显了市场对DeepSeek R2的高度期待，以及行业对能够与现有顶级模型竞争的强大对手的渴望。

然而，DeepSeek通过其官方企业咨询账号正式否认了3月17日发布R2的传闻。该公司明确指出，这一传闻中的发布日期并不准确，并且尚未公布R2的官方发布日期或任何技术细节。不过，早些时候的报道暗示R2可能会在2025年5月发布。同时也有消息指出，为了保持发展势头，R2的开发进度可能会加快。

据报道，R2有望在代码生成和英语以外的多语言推理方面有所改进。尤其值得一提的是，增强代码生成能力被认为是R2的一个关键改进方向。对代码生成和多语言推理的重视表明，DeepSeek正瞄准开发者和全球应用的关键领域，旨在提供比其前身更通用、更强大的工具。

DeepSeek R2：预期的技术能力和进步

增强的代码能力

市场普遍预期DeepSeek R2将具备更强的代码生成能力。此前的基准测试显示，DeepSeek R1在代码方面表现出色，而R2有望在代码任务中超越Claude Sonnet 3.7等竞争对手。在ADA Polyglot代码基准测试中，R1也展现出了成本效益。如果R2确实能够超越以代码能力著称的模型，它将吸引大量寻求高效且经济实惠的人工智能解决方案的开发人员。

先进的多语言推理

R2预计将在多语言推理方面提供先进的能力，能够理解不同语言的复杂指令，并跨越语言障碍进行更有效的沟通。考虑到许多先进的语言模型往往以英语为中心，R2强大的多语言支持有可能使其成为全球范围内一个重要的竞争者。

潜在的多模态能力

有传言称R2可能具备多模态能力，支持文本、图像甚至视频处理。如果这些传言属实，这将使DeepSeek R2与正在向完全集成的多模态人工智能系统发展的西方人工智能模型处于同一水平，甚至可能超越它们。如果R2能够整合多模态处理，这将代表着一个显著的进步。多模态是人工智能发展的一个关键趋势。如果DeepSeek能够成功地将图像和视频处理集成到R2中，这将使该模型成为能够处理更复杂和多样化任务的尖端解决方案。

注重效率和成本效益

DeepSeek在以低廉的成本创造高性能模型方面已确立了优势。分析师估计，对于相当的性能，DeepSeek的定价可能比OpenAI便宜得多。R2有望延续这一趋势，提供先进功能和可承受性的引人注目的组合，这可能会推动更广泛的应用并颠覆现有AI服务的定价模式。

DeepSeek V4：探索通用人工智能的愿景

专注于AGI的开发

DeepSeek正专注于开发V4，其目标是实现通用人工智能（AGI）。与一些竞争对手不同，该公司将实现AGI的模型开发置于短期商业化之上。这种对AGI的明确关注表明，V4很可能是一个具备广泛能力的高度先进的模型，可能代表着机器向更类人智能迈出的重要一步。

有限的技术细节

目前关于V4的具体技术细节仍然很少。值得注意的是，V4的发布也计划在2025年5月，可能与R2同期发布。缺乏详细信息表明，V4可能仍处于开发的早期阶段，或者DeepSeek在临近发布时才会公开其具体规格。

与DeepSeek-VL的潜在联系

DeepSeek-VL作为一个开源的视觉-语言模型，专为现实世界的视觉和语言理解应用而设计，可以被视为“V系列”方向的一个潜在指标。它具备处理各种视觉和文本数据的能力，包括逻辑图、网页、公式识别、科学文献、自然图像以及复杂场景中的具身智能。DeepSeek-VL模型系列于2024年3月发布，它可能是更广泛的、以AGI为重点的V4模型的一个组成部分或先导。DeepSeek-VL的开发和发布表明，DeepSeek正在积极研发文本以外的模型。