相同的问题看看Grok3怎么说-如何看待Deepseek R2在ARC-AGI中得分90%？

Deepseek是一家位于中国的AI开发公司，以其低成本、高性能的开源模型闻名。2025年1月，Deepseek发布了R1模型，其性能与OpenAI的o1相当，但训练成本显著低于后者，引发行业震动。根据，R1的训练成本仅为数百万美元，远低于OpenAI和Meta的类似模型。Deepseek R2是R1的继任者，计划于2025年5月前发布，但据，发布时间可能提前。R2预计将提升编程能力和多语言推理，

释迦呼呼

808人浏览 · 2025-03-23 20:39:42

释迦呼呼 · 2025-03-23 20:39:42 发布

关键要点

研究表明，Deepseek R2在ARC-AGI中得分90%目前无官方证实，可能基于传闻或假设。
如果属实，这将是一个重大突破，超越当前最高87.5%（OpenAI o3）。
这可能显示Deepseek在高效AI开发上的领先地位，但需结合其他测试评估。

直接回答

Deepseek R2在ARC-AGI中得分90%目前尚未有官方信息证实，可能是基于未来的预测或未经验证的传闻。ARC-AGI是一个测试AI适应新任务能力的基准测试，截至2024年12月，最高成绩为55.5%，而OpenAI的o3模型在高计算模式下达到87.5%。如果Deepseek R2真的达到90%，这将是一个显著的进步，表明其推理能力可能领先于当前最先进模型。

背景
Deepseek R2是Deepseek公司计划于2025年5月前发布的AI模型，旨在提升编程和多语言推理能力。但截至2025年3月23日，R2尚未正式发布，其ARC-AGI成绩尚未公开。

意义
如果90%的分数属实，这将显示Deepseek在低成本、高效率AI训练上的优势，可能挑战OpenAI等巨头。这也可能推动AI行业更注重模型的适应性和推理能力，而非单纯依赖计算规模。

意外细节
有趣的是，Deepseek R1已以较低成本与OpenAI o1竞争，如果R2再突破ARC-AGI，这可能引发行业对AI开发成本和效率的重新评估。

报告

Deepseek R2在ARC-AGI中得分90%的说法引发了广泛关注，但目前缺乏官方证实。本报告将详细分析这一可能的成绩及其意义，涵盖背景、技术细节、行业影响以及潜在局限性，力求全面呈现这一话题的复杂性。

背景与模型介绍

Deepseek是一家位于中国的AI开发公司，以其低成本、高性能的开源模型闻名。2025年1月，Deepseek发布了R1模型，其性能与OpenAI的o1相当，但训练成本显著低于后者，引发行业震动。根据DeepSeek explained: Everything you need to know，R1的训练成本仅为数百万美元，远低于OpenAI和Meta的类似模型。

Deepseek R2是R1的继任者，计划于2025年5月前发布，但据DeepSeek is rushing to get its next-gen R2 model out sooner than expected，发布时间可能提前。R2预计将提升编程能力和多语言推理，可能是多模态模型，但具体细节尚未公开。

ARC-AGI基准测试概述

ARC-AGI（Abstraction and Reasoning Corpus for Artificial General Intelligence）由François Chollet创建，旨在测试AI在面对新颖任务时的推理和适应能力，与传统基准不同，它强调泛化而非记忆。根据ARC Prize 2024: Technical Report，ARC-AGI被认为是衡量AGI进展的重要指标，截至2024年12月，私人评估集的最高成绩为55.5%，而OpenAI的o3模型在高计算模式下达到87.5%（OpenAI's o3 Sets New Record, Scoring 87.5% on ARC-AGI Benchmark）。

ARC-AGI的测试包括100个任务，评估AI解决未见过的抽象推理问题的能力，人类通常能轻松完成，但对AI来说极具挑战。根据ARC Prize - Official Guide，ARC Prize 2024的目标是达到85%的分数，激励研究者开发更具泛化能力的AI系统。

Deepseek R2得分90%的分析

用户提到Deepseek R2在ARC-AGI中得分90%，但截至2025年3月23日，官方尚未发布相关数据。这可能基于传闻或对R2潜力的乐观预测。根据DeepSeek R2 features: Secrets behind the Chinese AI，R2预计在推理和编程上会有显著提升，但未提及具体ARC-AGI成绩。

如果90%的分数属实，这将是一个重大突破，超越当前最高87.5%。这可能表明Deepseek的训练方法（如强化学习和数据合成）在提升模型泛化能力上取得了成功。根据DeepSeek-R1 to launch soon? What we know about the highly-anticipated AI model，R2可能通过扩展的RL训练数据集进一步优化推理能力。

技术细节与用户观察

Deepseek R1在ARC-AGI上的成绩约为15-20%（R1-Zero and R1 Results and Analysis），远低于90%。这表明R2若达到90%，其性能提升将是显著的。可能的改进包括：

更高效的计算架构，可能利用软件优化弥补硬件限制（由于美国对中国的GPU出口限制）。
更大的训练数据集，特别是在推理和多语言任务上。
更强的强化学习（RL）策略，结合监督微调（SFT）提升泛化能力。

根据Notes on the new Deepseek r1，R1在数学和编码任务上表现优异，若R2进一步提升，这可能使其在ARC-AGI上取得高分。

行业影响与争议

如果Deepseek R2达到90%，这将对AI行业产生深远影响：

成本效率：Deepseek以较低成本开发高性能模型，可能引发价格战，挑战OpenAI和Google等高成本模型的地位。根据Why DeepSeek’s R1 Is Actually Good News For Enterprises Everywhere，R1已帮助企业降低AI部署成本，R2可能进一步扩大这一优势。
地缘政治影响：作为中国公司，Deepseek的成功可能加剧中美AI技术竞争。根据DeepSeek rushes to launch new AI model as China goes all in，R2的发布可能促使美国进一步限制GPU出口。
伦理与信任：高性能AI模型的快速发展引发了对AI伦理和透明度的讨论。根据2024 Progress on ARC-AGI-Pub，ARC-AGI的成绩可能受到计算资源的影响，需谨慎解读。

争议点包括：

ARC-AGI的100个任务可能存在过拟合风险，根据ARC Prize 2024: Technical Report，多次测试可能泄露任务信息。
Deepseek的低成本训练方法可能涉及数据来源争议，如OpenAI曾质疑R1是否依赖ChatGPT的蒸馏（DeepSeek explained: Everything you need to know）。

潜在局限性

即使达到90%，ARC-AGI的成绩也不代表完全的AGI能力。根据OpenAI o3 Breakthrough High Score on ARC-AGI-Pub，高计算模式下的成绩可能依赖大量资源，不一定适用于实际应用。此外，ARC-AGI可能偏向特定类型推理，需结合其他基准（如PlanBench、LiveCodeBench）全面评估。

具体实例与数据

以下是ARC-AGI相关成绩的对比，基于现有信息：

模型	ARC-AGI成绩	计算模式	发布时间
Deepseek R1	15-20%	低计算	2025年1月
OpenAI o3	75.7%-87.5%	低/高计算	2024年12月
假设Deepseek R2	90% (未证实)	未知	预计2025年3-5月

注：Deepseek R2的90%成绩目前为假设，需等待官方发布。

伦理与未来影响

Deepseek R2的潜在高分可能引发对AI伦理的讨论，例如模型是否应被视为道德主体，是否需要保护其“权利”。根据An analysis of DeepSeek's R1-Zero and R1，低成本模型的普及可能增加推理需求，影响能源消耗和计算资源分配。

结论

Deepseek R2在ARC-AGI中得分90%目前无官方证实，但若属实，将是AI发展中的重要里程碑，显示Deepseek在高效推理模型上的领先地位。这可能推动行业向更开放、更高效的方向发展，但需注意ARC-AGI的局限性和潜在争议，结合其他测试全面评估。

关键引文

DeepSeek技术社区

欢迎加入DeepSeek 技术社区。在这里，你可以找到志同道合的朋友，共同探索AI技术的奥秘。

更多推荐

2025年程序员转行大模型全攻略：职业前景、热门岗位与选择策略解析！

DeepSeek技术社区

HAproxy服务器带日志

我现在有两台WindowsAD域控 10.10.10.1 和10.10.10.2，我现在有一个准入系统10.10.11.100需要提供ldap认证，我现在想搭建一个haproxy服务器IP 10.10.10.200做ldap业务的负载均衡，这样在准入系统上只要填haproxy服务器地址即可，所有通过haproxy服务器获取ladp的信息在haproxy需要有日志，haproxy服务已经安装，配置