图片

作者 雨霏

编辑 庄泽

2025年春节前后,DeepSeek在AI界掀起了惊涛骇浪。这一AI大模型的卓越表现,不仅让中国科技界为之振奋,更促使世界重新审视中国在人工智能领域的实力。全球资本市场也因此重新评估中国科技股的价值,春节后A、H 股市场的科技股持续走强。

在中国的AI浪潮中,DeepSeek创始人梁文峰无疑是最为耀眼的明星之一。这位曾经的华尔街精英,仅用短短三年时间,就将 DeepSeek打造成了全球AI领域的领军企业。他的故事,不仅是一个技术创新的传奇,更是中国科技崛起的生动缩影。

个人奋斗与时代机遇的完美结合

1985年,梁文峰出生于广东湛江一个小镇,这是一个普通家庭,父亲是小学教师,一生专注教育事业,秉持独特的教育理念,从不只关注梁文峰的分数,而是询问他当天解决了什么问题。母亲从事普通工作,虽然家庭经济条件一般,但为梁文峰营造了良好的教育环境。自幼,梁文峰就展现出卓越的数学天赋,初中时便自学完成高中数学课程,还主动涉猎大学数学内容。

2002 年,年仅17岁的梁文峰以高考状元的身份考入浙江大学电子信息工程专业,得以接触到广阔的学术资源,拓宽了视野。随后,他一路攻读完信息与通信工程硕士学位。

在浙江大学求学期间,2008 年全球金融危机爆发,梁文峰敏锐地察觉到机器学习技术在全自动量化交易中的应用潜力,带领团队深入探索。这次探索成为他职业生涯的重要起点。2015 年,他与两位浙江大学校友共同创立了量化对冲基金 High - Flyer。在量化投资领域,梁文峰凭借扎实的数学功底和人工智能技术,让基金迅速崭露头角,收获了丰厚的利润。这段经历不仅让他在金融领域积累了丰富的经验和财富,也加深了他对人工智能技术应用的理解,为他日后在AI领域的发展奠定了坚实基础。

创立DeepSeek开启 AI新征程

在量化投资领域取得成功后,梁文峰对人工智能的热爱促使他做出了一个重大决定——进军人工智能领域。2023年7月,他成立了DeepSeek,正式开启AI新征程。

梁文峰的创业灵感源于他早年对机器学习技术在量化交易中潜力的敏锐捕捉,以及在杭州幻方科技有限公司的深入钻研。在幻方科技,他通过AI和算法分析影响股价的模式,发现了人工智能领域广阔天地。他预见到人工智能将对社会产生巨大的变革,希望通过自己的努力,让人工智能为人们的生活带来更多积极改变,提升社会整体的智能化水平。

梁文峰凭借敏锐的洞察力,精准识别了人工智能行业的核心痛点。他意识到,大模型训练效率的提升和数据更新的准确性是行业发展的关键。未来,大模型的训练将从按年更新转变为按月甚至按周更新,以提高数据处理的时效性和准确性。同时,人工智能的发展将从技术驱动转变为产品与销售双轮驱动,企业必须更加关注市场需求,打造符合用户需求的产品。在硬件兼容性方面,大模型在硬件上的适配能力对于满足实时性和高效性的应用需求至关重要。此外,他还预见到人工智能将在语音、图片和视频等领域实现优先突破,推动相关领域的快速发展。

创业初期,梁文峰面临着诸多挑战。美国对先进AI芯片的出口限制,给DeepSeek 的技术研发带来了巨大阻碍。但梁文峰带领团队通过优化技术,在受限的NVIDIA H800 GPU 上开发出性能优于OpenAI的GPT-4 和Meta 的 Llama 3.1 等模型的 DeepSeek V3,展现了公司在硬件效率和模型架构上的创新能力。这一进步不仅缩小了与全球领先企业的差距,还在一定程度上促进了中国人工智能生态系统中硬件效率和替代解决方案的发展。

面对行业竞争对手的关注,以及数据安全和政府监管带来的担忧,梁文峰采取了一系列应对措施。在大模型算法和GPU算力利用率上,DeepSeek做了出色的工程优化,引发了大模型行业的激烈价格战。梁文峰表示,DeepSeek从未想过要成为颠覆者,定价仅在成本之上保留了一定的利润空间,目的是让AI和API服务成为人人都能负担得起、随时可用。这一策略不仅降低了成本,也使DeepSeek 在竞争中占据了优势。

DeepSeek的发展与成就

2023年7月DeepSeek成立后,梁文峰在团队组建上独树一帜。他没有依赖海归或高级技术专家,而是组建了一支由本土年轻程序员组成的团队,成员多为应届毕业生或工作经验不超过5年的年轻人。梁文峰认为,创新需要摆脱惯性,经验有时会成为包袱。他在接受媒体采访时表示,DeepSeek的核心技术岗位主要由最近一两年毕业的人员担任。此外,DeepSeek的团队组成与硅谷诸多AI巨头大相径庭,梁文峰在组建研究团队时,专注于来自北大、清华等顶级高校的博士生。这些博士生许多人曾在顶级学术期刊发表论文,并在国际学术会议上获奖,但缺乏行业经验。这种团队构成不仅降低了训练成本,还为公司注入了新鲜的血液和创新思维。

在成立初期,梁文峰没有急于寻求外部资本,而是通过自己在量化交易领域积累的财富,为DeepSeek的技术研发提供了坚实的资金基础。这种自给自足的创业理念,使得DeepSeek能够在没有过早商业化压力的情况下,专注于技术创新和突破。之后,他有选择性地与那些能够为公司带来长期价值的投资者合作,获得了必要的资源支持,为公司的长远发展奠定了坚实的基础。

2024年12月,DeepSeek V3的发布成为公司发展的重要里程碑,其性能与海外领军闭源模型相匹敌。这一成就不仅复现了OpenAI o1的强化学习效果,还在有限算力下实现了算法创新,捅破了强化学习用于大模型推理的窗户纸,成为继 OpenAI之后推理领域的第二个里程碑。DeepSeek公开的数据显示,V3预训练成本仅为557.6万美金,使用1万张H800仅需11天就能完成训练,这一成本相对国际上领先模型大幅降低,对于我国突破算力限制具有重要意义。

当下,DeepSeek在金融和汽车行业也取得了重大突破。长江计算联合昇腾、华为云团队,使用 G440K V2 服务器,已为某国有大型银行成功部署DeepSeek V3 模型的本地化推理服务,使银行能够在内部安全环境下快速处理海量金融数据。此外,吉利和广汽也相继传来消息,吉利汽车集团CEO淦家阅宣布将于今年3月初对外发布重磅AI智能化战略,吉利将成为智能汽车AI科技的引领者。广汽智能车机借助 DeepSeek R1大模型回答语音提问的表现,标志着广汽自主研发的ADiGO SENSE端云一体大模型与DeepSeek R1大模型完成深度融合。新华保险在新华e家 App 成功接入DeepSeek R1和 DeepSeek V3两款模型产品,打造个人AI助理,支持多个智能应用场景。百融云 - W (06608) 完成与 DeepSeek 的全面接入,并在企业级智能体平台 CybotStar AgentBuilder 中实现应用。

DeepSeek 成功进入国际市场,已然成为中国 AI 出海的一张 “名片”。在沙特阿拉伯的利雅得 LEAP 2025 科技大会活动中,宣布 DeepSeek 在沙特达曼的阿美数字数据中心即将正式开始运营。目前 DeepSeek 已在 Apple App Store 上线了其官方应用,凭借先进模型 DeepSeek V3,给全球许多国家地区的用户提供了新的智能体验,被许多人视为 ChatGPT 等付费 AI 应用的免费版平替。

DeepSeek的核心技术与创新

在金融领域,梁文峰深入分析了人工智能如何通过算法和机器学习技术,提高金融分析的效率和准确性。人工智能系统能够处理和分析大量数据,识别出复杂的模式和趋势,通过深度学习算法,可以预测市场动态,为投资决策提供支持。此外,人工智能还能通过自然语言处理技术,分析新闻报道、社交媒体帖子等非结构化数据,以获取市场情绪和潜在风险信号。这些技术的应用,不仅提高了分析的速度,还增强了分析的深度和广度,为金融行业带来了革命性的变化。

DeepSeek 在数据挖掘技术领域取得显著成就,尝试预测 2025 年春节后 PE(聚乙烯)和 PP(聚丙烯)期货走势的研报,展现了 AI 在数据分析和策略生成方面的潜力。报告从供应端、需求端、成本与利润、价差与基差等多个维度进行了分析,并提出了具体的交易策略。推出的 DeepSeek V3 和 DeepSeek R1 两款先进的 AI 语言模型,通过多头潜在注意力(MLA)和专家混合等突破性技术,显著减少了训练模型所需的计算资源。

DeepSeek 专注于开发高性能、低成本的 AI 模型,致力于推动 AI 技术的普惠化。据独立研究公司 Melius Research 整理的数据显示,DeepSeek 的 AI 模型生成信息的成本大约是 OpenAI ChatGPT 的十分之一。DeepSeek 使用了一种只激活模型中最相关的部分来回答问题的计算类型,并且是开源的,这可以降低许可成本。此外,DeepSeek 对人才极其看重,不看经验,只看能力,人才密度极高,且多来自于中国本土市场。这些差异化优势使得 DeepSeek 在激烈的市场竞争中脱颖而出。

梁文峰预测,随着大模型性能的提升和成本的降低,生成式 AI 将在金融行业实现规模化应用,特别是在银行 IT、保险 IT 和证券 IT 领域。预计到 2030 年,生成式 AI 将为金融 IT 服务行业带来 690 亿元的增量收入,占行业总收入的 24%。DeepSeek 引领 AI 浪潮,金融科技 ETF (516860) 涨超 2%,显示出 DeepSeek 概念的活跃度和市场的认可度。博时基金率先部署 DeepSeek,以金融科技为业务赋能,全面提升金融科技能力,进行数智化、智能化转型。

梁文峰的领导风格与管理理念

梁文峰强调对AI能力边界的好奇,选人的标准始终是热爱和好奇心,信任并赋予团队成员充分的自由,以身作则塑造了DeepSeek自下而上的组织文化,不前置分工而是自然分工,极大地激发了团队的创造力和自主性。他推崇“极客文化”,推行扁平化管理,鼓励员工个人发挥潜能进行学习和创新,不采用“赛马”机制,减少团队内耗,对算力资源的调配上不设上限,只要员工提出有潜力的思路,都会给予足够的资源进行尝试研究。

梁文峰认为DeepSeek的长远目标是推动技术边界,而非仅仅追求短期盈利。公司选择将技术成果开源,以吸引顶尖人才并促进技术交流。他强调真正的竞争优势在于团队的成长、技术的积累和创新文化的培育。面对美国对中国 AI 公司的限制,他带领团队在有限的本土芯片计算能力下进行创新,展现出卓越的领导力和前瞻性。

梁文峰身价或超黄仁勋跻身全球富豪榜

据业内专家估算,DeepSeek 的估值可能高达1500亿美元,使得梁文峰的身家有望跻身全球富豪榜前列,甚至可能超越英伟达创始人黄仁勋。1月20日,梁文峰现身央视《新闻联播》,以DeepSeek创始人的身份参加座谈会并发言,进一步提升了DeepSeek的知名度和品牌形象。

在金融科技和人工智能领域,市场竞争日益激烈。随着越来越多的企业进入该领域,梁文峰和DeepSeek需要不断创新并保持差异化优势,以应对竞争对手的挑战,避免市场份额被侵蚀。

在国际市场拓展过程中,DeepSeek 需要遵守不同国家和地区的法律法规。金融科技行业监管趋严,若在合规方面出现问题,将面临罚款、业务受限等风险,影响公司的声誉和业务发展。

未来,尽管面临诸多挑战,但凭借着创新的技术、独特的团队文化和前瞻性的战略规划,DeepSeek有望在全球 AI 舞台上继续书写辉煌篇章。(本文涉及资料全部来源Wind)

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐