【DeepSeek】带你认识DeepSeek，它为什么这么火？

DeepSeek（深度求索）是一家中国的人工智能公司，成立于，专注于研发通用人工智能（AGI）技术。它的名字"DeepSeek"可以拆解为"深度探索"（Deep + Seek），寓意通过深度学习技术不断探索AI的边界。如果把人工智能比作人类建造火箭，DeepSeek就是一群致力于造出能飞向宇宙深处的"星际飞船"的工程师。

aaaa_aaab

30339人浏览 · 2025-02-21 16:06:56

aaaa_aaab · 2025-02-21 16:06:56 发布

一、DeepSeek简介

1.什么是DeepSeek？

DeepSeek（深度求索）是一家中国的人工智能公司，成立于2023年，专注于研发通用人工智能（AGI）技术。它的名字"DeepSeek"可以拆解为"深度探索"（Deep + Seek），寓意通过深度学习技术不断探索AI的边界。如果把人工智能比作人类建造火箭，DeepSeek就是一群致力于造出能飞向宇宙深处的"星际飞船"的工程师。

2.成立时间和地点

DeepSeek成立于2023年，总部位于中国杭州。

3.创始人背景

DeepSeek由幻方量化创立，幻方量化是一家知名的量化资管巨头，具有深厚的金融背景和丰富的投资经验。幻方量化的创始人梁文锋在金融领域有着卓越的成就，他不仅参与了高毅资产的创立，还在金融危机期间涉足交易领域，积累了丰富的经验。

4.技术优势

DeepSeek的核心技术基于大语言模型和混合专家(MoE)模型。其发布的DeepSeek-V2模型在多个主流榜单中表现优异，以更低的训练成本和更高效的推理性能，为AI商业用途免费开放。此外，DeepSeek还具备多模态处理能力，能够处理图像、音频等多种数据类型，这使得其在教育、医疗、金融等多个领域都有广泛的应用潜力。

二、DeepSeek发展历程

‌2023年4月14日‌：DeepSeek的前身幻方量化宣布将以研究组织的形式投入AGI征程，标志着DeepSeek的正式启动‌1。
‌2023年11月‌：DeepSeek发布了首个开源代码大模型DeepSeekCoder，支持多语言生成与调试，性能超越CodeLlama，奠定了技术口碑‌2。
‌2024年1月‌：DeepSeek发布了DeepSeek LLM 67B，这是一个通用大模型，对标LLaMA2 70B，在中英文任务中表现出色‌2。
‌2024年1月至5月‌：DeepSeek实现了MoE架构的创新，发布了国内首个开源MoE模型DeepSeekMoE，采用细粒度专家共享架构。随后，DeepSeek-V2模型引入MLA技术，推理成本仅为LLaMA3的1/4，API定价低至GPT-4 Turbo的1/70，大幅降低了AI使用成本‌2。
‌2024年6月‌：DeepSeek发布了垂直领域模型DeepSeek Coder V2，代码能力超越GPT-4Turbo‌2。
‌2024年8月‌：DeepSeek发布了数学推理模型DeepSeek Prover-V1.5，覆盖初等数学至研究生水平‌2。
‌2024年12月‌：DeepSeek发布了DeepSeek-V3，宣称训练成本仅为550万美元，性能对标国际闭源模型，生成速度提升3倍。同时，发布了多模态MoE模型DeepSeek-VL2，视觉能力显著提升‌2。
‌2025年1月20日‌：DeepSeek正式发布了第一代推理模型DeepSeek-R1-Zero和DeepSeek-R1‌2。