从OpenAI“叛将”到3800亿掌舵人:Claude之父对抗世界的理想主义豪赌

前言:2026年的冰与火之歌

2026年的春天,硅谷的空气中弥漫着一种奇特的对立情绪。

一边,是五角大楼的强硬施压,要求Anthropic解除其王牌模型Claude的核心安全限制,甚至将其列入“供应链风险”名单;另一边,是资本市场的疯狂追捧,300亿美元的G轮融资让这家公司的估值飙升至3800亿美元,年化收入突破140亿美元,成为仅次于OpenAI的全球第二大AI独角兽。

就在这冰火交织的时刻,这家公司的创始人——达里奥·阿莫迪(Dario Amodei),依然固执地站在风口浪尖,对着全世界重申那个让他离开OpenAI的信念:“无害(Harmless)第一,其次才是诚实和有用。”

从一个研究皮革的工匠之子,到百度、谷歌的普通研究员,再到亲手推开GPT-3时代大门的OpenAI研究副总裁,最后因理念不合“叛出”山门创立Anthropic——达里奥的故事,不仅仅是一部硅谷创业史,更是一场关于“人类文明该驶向何方”的理想主义豪赌。

第一章 皮革、物理学与迟到的救赎

如果时间倒回上世纪80年代,你很难将这个意大利裔男孩与未来的人工智能霸主联系在一起。

达里奥出生于旧金山,父亲是一位手工皮具匠人,母亲是图书馆项目经理。作为工匠的儿子,他从小浸润在“研究材料极限”的氛围中。然而,与硅谷同龄人痴迷于写网页代码不同,少年达里奥只对基础科学感兴趣。他甚至会在家里举办“数数日”,看看自己究竟能数到多高。

这种对极致的追求,让他在学术道路上走得极远。他拥有斯坦福大学物理学学士学位,随后又在普林斯顿大学拿下生物物理学博士学位,主攻神经回路统计力学模型。那时的他,离AI还很远。

命运的转折点出现在2006年。那一年,他的父亲因一种罕见疾病去世。四年后,一种新疗法问世,将该病的治愈率从50%提升至95%。

“有人发明了解药,拯救了许多生命。但如果早几年出现,也许就能救到我父亲。”达里奥在后来的回忆中说道。

这句话像一根刺,扎进了他的灵魂。他意识到,人类的科研速度太慢了。在斯坦福医学院做博士后研究时,他面对复杂的蛋白质和癌细胞数据,深感个人能力的渺小。他说:“生物学中这些底层问题的复杂性,感觉已经超出了人类的理解尺度。”

就在此时,他看到了深度学习浪潮的初现。AI,这个他曾经认为只存在于科幻小说里的东西,成了他眼中唯一能填补鸿沟、带领人类超越自身尺度的工具。

第二章 百度的“第一课”与谷歌的“安全种子”

2014年,达里奥踏出学术界,加入了吴恩达(Andrew Ng)在百度硅谷AI实验室组建的“梦之队”。

在百度,他参与了一项后来被载入史册的工作——Deep Speech 2语音识别项目。正是在这里,他首次验证了后来震惊世界的“Scaling Laws”(规模法则):随着模型参数和训练数据的增长,模型性能会呈现出极其平滑且持续的上升趋势。

“这对我冲击极大,我看到了一条极其平滑的趋势线,变化明确、持续上升。”达里奥回忆道。他意识到,这条路走下去,AI终将突破某个临界点。

随后,他短暂辗转于Google Brain。在谷歌,他与人合著了论文《AI安全中的具体问题》,开始探讨神经网络的内在不可预测性。如果说百度教会了他“AI能有多强”,那么谷歌则在他心中埋下了“AI有多危险”的种子。

第三章 OpenAI的裂痕:当“速度”撞上“安全”

2016年,达里奥加入了那个由马斯克和奥特曼刚刚成立的非营利组织——OpenAI。两年后,他的妹妹丹妮拉(Daniela Amodei)——一个拥有英语文学学位、曾混迹政坛和金融圈的“非典型”人才,也跟随而来。

兄妹俩在OpenAI如鱼得水。达里奥主导了GPT-2和GPT-3的开发,凭借Scaling Laws的理论基础,他成为了这家公司技术方向上最有分量的人之一;丹妮拉则负责安全与政策,一路升至副总裁。

但裂痕在GPT-3开发期间开始公开化。千亿级的参数,涌现出的强大通用能力,让所有人意识到,AI不再是玩具,它开始具备难以预测的“智能”潜力。

一场根本性的路线之争爆发了:

  • 达里奥认为:面对如此强大的模型,必须“放慢速度”,发布前需要进行前所未有的漫长安全评估。
  • 奥特曼则认为:必须抓住历史机遇,快速迭代,尽快商业化。

达里奥后来说过一句意味深长的话:“与别人的愿景争论,是极其没有效率的事情。” 2020年底,他带着妹妹和另外5名核心员工集体出走。后来,外界将他们称为 “OpenAI叛军”

第四章 Anthropic的诞生:为AI立一部“宪法”

2021年,新公司成立,取名 Anthropic,源自希腊语“Anthropos”,意为 “人类”

他们的核心目标只有一个:如何控制比人类更聪明的AI?

在外界看来,Anthropic和OpenAI都在做大模型,没什么区别。但在达里奥心中,两者的底层逻辑水火不容。

OpenAI信奉“性能优先,安全迭代”,是典型的互联网增长模式。而Anthropic奉行 “安全第一,功能殿后”

为了将这个理念落地,达里奥发明了 “宪法式人工智能”(Constitutional AI)

传统的AI对齐方式是“人类反馈强化学习”(RLHF),即雇佣大量廉价劳工给AI打分。达里奥认为这太像“黑盒”了,没人知道模型到底学到了什么,万一哪天学坏了呢?

于是,他给AI写了一部“宪法”——将《联合国世界人权宣言》、苹果服务条款等普世原则写入其中,让AI学会自我审查。这套体系的最终目标,被浓缩成AI行业赫赫有名的 “3H框架”无害(Harmless)、诚实(Honest)、有帮助(Helpful)

注意这个顺序:无害第一,帮助最后。 这意味着,当你的请求可能产生风险时,Claude会拒绝执行,哪怕你会因此给它打差评。

第五章 慢就是快:错失ChatGPT,却赢了企业市场

2022年夏天,Anthropic已经完成了对Claude的训练。整个团队都对它的表现赞叹不已,但达里奥做出了一个在今天看来极其“反商业”的决定:延迟发布

他担心引发军备竞赛,担心没有足够的时间确保安全。

几个月后,OpenAI发布了ChatGPT,引爆了全球AI狂潮。达里奥错过了先发优势,但他并不后悔。他在《时代》杂志的采访中说:“我想避免引发一场建造更大、也许更危险的人工智能系统的竞赛。”

虽然错过了C端市场的爆发,但达里奥押中了另一条更隐秘的赛道——企业级市场

银行、制药巨头、军工复合体,这些对数据安全和稳定性极度敏感的大客户,恰恰最欣赏Claude的“谨小慎微”。对于他们来说,一个动不动就拒绝回答问题的AI,远比一个为了讨好用户什么都敢说的AI更可靠。

事实证明,这种“慢”反而成了最深的护城河。如今,Anthropic近80%的收入来自企业客户,在《财富》全球500强前十的巨头里,有八家是Claude的付费用户。

第六章 2026年的新困局:护栏越坚固,拆除的力量越强大

2026年,达里奥的Anthropic站上了巅峰,但也陷入了更深的困局。

美国五角大楼要求其解除Claude的安全护栏,以便用于“所有合法用途”,包括可能的军事打击和监控。达里奥断然拒绝,称无法在良心上同意,警告这将跨越“国内大规模监控”和“完全自主武器”两条红线。

为此,他遭到了美国政府的打压,甚至被特朗普在社交媒体上点名怒斥。

与此同时,竞争对手们正在全速狂奔。面对巨大的商业压力和算力成本(2026年预计训练支出超120亿美元),Anthropic被迫对之前承诺的“单边暂停”政策进行了修改。

首席科学家坦言:“如果竞争对手都在全速前进,我们再做出单边承诺,其实并不合理。”

这不禁让人想起那个古老的悲剧:你为世界铸造的护栏越坚固,试图拆除它的力量就越强大。

结语:工匠之子的终极遗产

有人问达里奥,你为什么总是像个“末日论者”?

他愤怒地回应:“当有人说‘这个人是末日论者,他想要放慢进度’时,我真的很生气。你听到我父亲的故事了吗?我父亲死于一桩本可以在几年前就有治疗方法的疾病。我清楚这项技术的益处,我正是因为想要它来得更快、更安全,才如此焦虑。”

达里奥的父亲,那个一生研究皮革极限的工匠,可能从未想过,他的孩子们把这种“研究材料极限”的精神,用在了人类文明最前沿的工具——人工智能上。

达里奥正在做的,不是阻止AI的发展,而是在为这匹脱缰的野马,找到一条既能让它跑起来、又不会摔死骑手的路。

正如他妹妹丹妮拉所说:“在AI时代,人类的特质将变得更加重要,而不是更不重要。

在这个效率至上的时代,达里奥用他的固执告诉世界:比AI变聪明更重要的,是让它学会善良。

而这,或许就是我们在这个充满不确定性的2026年,最需要听到的声音。

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐