Deepseek的发展及应用

Deepseek是中国自主研发的大型人工智能模型系列，由杭州深度求索人工智能基础技术研究有限公司开发，自2024年起陆续推出多个版本，涵盖通用对话、代码生成、多模态理解等领域。

念故渊 · 2025-03-07 16:25:49 发布

Deepseek的发展

2016 年，量化资管巨头幻方量化成立，开始探索 AI 在量化投资领域的应用，梁文锋在浙江大学期间创立了幻方量化，此后公司逐渐聚焦于 AI 技术在量化交易中的应用，在 AI 技术研发和算力基础设施建设方面进行了大量投入。
2019 年，幻方量化开始构建名为 “萤火一号” 的计算集群，为 AI 模型的训练提供了强大的算力支持。
2021 年，“萤火一号” 计算集群建设完成，同年梁文锋开始储备英伟达 A100 GPU，为后续的 AI 项目做准备，并启动了 “萤火二号” 计算集群的建设，预算达 10 亿元。
2022 年，“萤火二号” 计算集群的利用率超过 96%，为幻方量化的 AI 研究和开发提供了充足的算力保障。

1 月 5 日，发布首个大模型 DeepSeek LLM，包含 670 亿参数，在 2 万亿 token 的数据集上训练，涵盖中英文。
5 月，宣布开源第二代 MoE 大模型 DeepSeek-V2，性能比肩 GPT-4Turbo，价格仅为 GPT-4 的百分之一，获 “AI 届拼多多” 名号。
9 月 5 日，合并 DeepSeek Coder V2 和 DeepSeek V2 Chat 两个模型，升级推出 DeepSeek V2.5 新模型，优化了写作任务、指令跟随等方面。
11 月 20 日，推理模型 DeepSeek-R1-Lite 预览版上线。
12 月 26 日，DeepSeek-V3 首个版本上线并开源。

1 月 11 日，正式发布官方 App 并上线 iOS 与安卓应用市场。
1 月 20 日，正式发布 DeepSeek-R1 模型，在数学、代码、自然语言推理等任务上性能比肩 OpenAI o1 正式版。
1 月 24 日，在国外大模型排名 Arena 上，DeepSeek-R1 基准测试升至全类别大模型第三，在风格控制类模型分类中与 OpenAI o1 并列第一。
1 月 27 日，DeepSeek 应用登顶 15 个国家和地区的苹果应用商店免费 APP 下载排行榜。
1 月 31 日，DeepSeek R1 671b 作为英伟达 NIM 微服务预览版在build.nvidia.com上发布。
2 月，DeepSeek-R1、V3、Coder 等系列模型陆续上线国家超算互联网平台；同月 4 日，DeepSeek V3 和 R1 模型完成海光 DCU 国产化适配并上线；同月吉利汽车、岚图汽车等宣布与 DeepSeek-R1 完成技术融合；同月 9 日，DeepSeek App 累计下载量超 1.1 亿次，周活跃用户规模最高近 9700 万，且开始在沙特阿拉伯达曼的阿美公司数字数据中心运营；同月 10 日，比亚迪 “璇玑架构” 全面接入 DeepSeek；同月 16 日，广州市政务服务和数据管理局在政务外网正式部署上线 DeepSeek-R1、V3 671B 大模型；同月百度搜索宣布全面接入 DeepSeek 和文心大模型最新的深度搜索功能；同月 DeepSeek 正式登陆江苏省多地的算力平台；同月浙江大学等高校上线 DeepSeek；同月 20 日，OPPO 小布接入满血版 DeepSeek。