Deepseek的发展及应用
Deepseek是中国自主研发的大型人工智能模型系列,由杭州深度求索人工智能基础技术研究有限公司开发,自2024年起陆续推出多个版本,涵盖通用对话、代码生成、多模态理解等领域。
·
Deepseek是中国自主研发的大型人工智能模型系列,由杭州深度求索人工智能基础技术研究有限公司开发,自2024年起陆续推出多个版本,涵盖通用对话、代码生成、多模态理解等领域。
Deepseek的发展
2016-2022 年 幻方量化时期技术积累
- 2016 年,量化资管巨头幻方量化成立,开始探索 AI 在量化投资领域的应用,梁文锋在浙江大学期间创立了幻方量化,此后公司逐渐聚焦于 AI 技术在量化交易中的应用,在 AI 技术研发和算力基础设施建设方面进行了大量投入。
- 2019 年,幻方量化开始构建名为 “萤火一号” 的计算集群,为 AI 模型的训练提供了强大的算力支持。
- 2021 年,“萤火一号” 计算集群建设完成,同年梁文锋开始储备英伟达 A100 GPU,为后续的 AI 项目做准备,并启动了 “萤火二号” 计算集群的建设,预算达 10 亿元。
- 2022 年,“萤火二号” 计算集群的利用率超过 96%,为幻方量化的 AI 研究和开发提供了充足的算力保障。
2023 年 成立与初步发布
- 4 月,幻方量化宣布全力投身人工智能技术,成立新的独立研究公司 DeepSeek。
- 7 月 17 日,杭州深度求索人工智能基础技术研究有限公司在杭州市拱墅区市场监督管理局登记成立。
- 11 月 2 日,DeepSeek 发布首个模型 DeepSeek Coder;11 月 29 日,发布 DeepSeek-LLM 系列模型。
2024 年 模型迭代与拓展
- 1 月 5 日,发布首个大模型 DeepSeek LLM,包含 670 亿参数,在 2 万亿 token 的数据集上训练,涵盖中英文。
- 5 月,宣布开源第二代 MoE 大模型 DeepSeek-V2,性能比肩 GPT-4Turbo,价格仅为 GPT-4 的百分之一,获 “AI 届拼多多” 名号。
- 9 月 5 日,合并 DeepSeek Coder V2 和 DeepSeek V2 Chat 两个模型,升级推出 DeepSeek V2.5 新模型,优化了写作任务、指令跟随等方面。
- 11 月 20 日,推理模型 DeepSeek-R1-Lite 预览版上线。
- 12 月 26 日,DeepSeek-V3 首个版本上线并开源。
2025 年 广泛应用与影响力扩大
- 1 月 11 日,正式发布官方 App 并上线 iOS 与安卓应用市场。
- 1 月 20 日,正式发布 DeepSeek-R1 模型,在数学、代码、自然语言推理等任务上性能比肩 OpenAI o1 正式版。
- 1 月 24 日,在国外大模型排名 Arena 上,DeepSeek-R1 基准测试升至全类别大模型第三,在风格控制类模型分类中与 OpenAI o1 并列第一。
- 1 月 27 日,DeepSeek 应用登顶 15 个国家和地区的苹果应用商店免费 APP 下载排行榜。
- 1 月 31 日,DeepSeek R1 671b 作为英伟达 NIM 微服务预览版在build.nvidia.com上发布。
- 2 月,DeepSeek-R1、V3、Coder 等系列模型陆续上线国家超算互联网平台;同月 4 日,DeepSeek V3 和 R1 模型完成海光 DCU 国产化适配并上线;同月吉利汽车、岚图汽车等宣布与 DeepSeek-R1 完成技术融合;同月 9 日,DeepSeek App 累计下载量超 1.1 亿次,周活跃用户规模最高近 9700 万,且开始在沙特阿拉伯达曼的阿美公司数字数据中心运营;同月 10 日,比亚迪 “璇玑架构” 全面接入 DeepSeek;同月 16 日,广州市政务服务和数据管理局在政务外网正式部署上线 DeepSeek-R1、V3 671B 大模型;同月百度搜索宣布全面接入 DeepSeek 和文心大模型最新的深度搜索功能;同月 DeepSeek 正式登陆江苏省多地的算力平台;同月浙江大学等高校上线 DeepSeek;同月 20 日,OPPO 小布接入满血版 DeepSeek。
更多推荐
所有评论(0)