在人工智能领域,DeepSeek 的每一次动作都如巨石投入平静湖面,激起千层浪。近期,DeepSeek 更是动作频频,从模型性能提升到应用场景拓展,从技术开源到市场策略调整,一系列新消息吸引着全球目光,下面就让我们深入探究。

新一代模型 R2 计划提前发布

2 月 25 日,路透社一则消息震惊业界:DeepSeek 计划提前发布新一代 AI 模型 R2。原本定于 5 月推出的 R2,如今公司正全力加速进程。据透露,R2 将在编程能力和多语言推理方面取得重大突破。这一消息瞬间点燃市场期待,行业人士纷纷猜测 R2 可能带来的变革。印度技术服务提供商 Zensar 首席运营官 Vijayasimha Alilughatta 评价:“DeepSeek 的 R2 模型发布或成 AI 行业关键时刻,其高性价比模型将打破行业垄断格局,促使全球公司加速研发。” 此前,有行业人士在 Reddit 发帖指出,DeepSeek-R1 在编码和 SWE-Bench 方面已与 OpenAI 匹敌,且未运用其最大突破 —— 强化学习(RL)。而未来版本将集成拒绝采样和异步评估,使强化学习可用于软件工程。DeepSeek 证明了自身解决优化问题的强大能力,R2 有望成为优化飞跃的关键一步。

服务器资源缓解,API 充值重新开放

此前,因服务器资源紧张,2 月 6 日 DeepSeek 暂停 API 服务充值。但在 2 月 25 日,好消息传来,DeepSeek 官方开放平台重新恢复 API 充值服务。不过,价格也有所调整,deepseek-chat 模型调用价格变为每百万输入 tokens 2 元,每百万输出 tokens 8 元 。高峰期使用 DeepSeek 时 “服务器繁忙,请稍后再试” 的情况已大幅减少。有接近 DeepSeek 的人士表示,此前资源紧张,如今官方团队通过技术架构优化,在资源有限情况下仍能支持大量用户使用。

开源周:推动技术共享与行业发展

2 月 24 日,DeepSeek 正式启动 “开源周”,计划连续 5 天每天开源一个项目,旨在通过开源透明化团队在通用人工智能(AGI)领域的探索进展,推动技术共享与行业应用加速 。2 月 24 日,首个开源代码库 Flash MLA 亮相,这是针对 Hopper GPU 优化的高效 MLA 解码内核,尤其针对可变长度序列进行优化,目前已投入生产。当 AI 同时处理长句子和短句子时,Flash MLA 能动态调整资源分配,避免算力浪费。2 月 25 日,DeepSeek 再度官宣开源 DeepEP 。它是首个用于 MoE(混合专家)模型训练和推理的开源 EP(Expert Parallelism,专家并行)通信库,具备高效的全员沟通、节点内和节点间均支持 NVLink 和 RDMA、用于训练和推理预填充的高吞吐量内核、用于推理解码的低延迟内核、原生 FP8 调度支持以及灵活的 GPU 资源控制以实现计算 - 通信重叠等特点。DeepSeek 的开源举动获得众多开发者称赞,有人称其为 “真正的 Open AI”。

商标抢注风波:国家知识产权局出手驳回

随着 DeepSeek 火爆出圈,个别企业和自然人打起了 “蹭热点” 的主意。近期,杭州深度求索人工智能基础技术研究有限公司研发的 DeepSeek 人工智能大模型在全球引发广泛关注,一些人以 “DEEPSEEK” 或相关图形向国家知识产权局商标局提交商标注册申请,个别代理机构涉嫌提供不法服务 。2 月 24 日,国家知识产权局发布通告,依法驳回第 82848449 号 “DEEPSEEK” 等 63 件商标注册申请。从驳回名单看,被驳回名称多为 “DEEPSEEK”“DEEP SEEK” 以及图形,申请最多的是深圳市复倍健合成生物科技有限公司,共申请 54 个相关商标 。国家知识产权局表示,将持续打击商标恶意注册行为,维护商标注册秩序,为实现科技自立自强、推动高质量发展提供支撑。

政务应用多点开花

DeepSeek 在政务领域的应用正不断拓展。广西玉林市兴业县山心镇作为首个实现 DeepSeek 大模型本地化部署的乡镇,于 2 月 21 日成功完成 DeepSeek-R1 模型本地化部署,依托国产算力架构与定制化部署方案,解决了数据隐私与响应效率痛点 。目前,DeepSeek 已在山心镇多个核心业务中应用:在防返贫监测方面,通过对全镇脱贫户数据动态分析,精准识别潜在返贫风险家庭并自动生成帮扶建议,分析效率较传统方式提升 50%;办文办公上,模型支持公文智能起草、会议纪要自动生成及政策文件快速检索,基层干部日均事务处理时间缩短 40%;矛盾调处时,模型通过语义分析快速匹配相似案例,推荐调解策略,辅助调解员高效解决纠纷 。此外,河南郑州市委办公室根据工作要求,上线运行基于 DeepSeek32B 框架下的 “AI 对话” 和 “AI 智慧办公平台”,赋能党办政务办公、机关运行。2 月 24 日,“郑政钉” PC 端上线 “市委办 AI 智慧办公平台”,覆盖市委办、市委政研室 200 余名干部,聚焦办文、办事、办会核心场景开发四大功能模块 。辽宁省朝阳市县乡村协同平台作为辽宁省首个基于 DeepSeek 大模型实现移动端公文生成的基层政务平台,于 2 月 24 日通过辽政通移动端,结合 DeepSeek 大模型成功生成首份公文,实现公文生成智能化和移动化,提升基层政务工作效率和精准度 。

巨头纷纷接入,运营商深度合作

自 DeepSeek 发布以来,众多科技巨头纷纷接入其模型。百度智能云千帆平台、阿里云 PAI Model Gallery、京东云、中国电子云等先后上架 DeepSeek-V3 模型 。三大电信运营商也积极布局,2 月初,天翼云 “息壤” 智算平台完成国产算力与 DeepSeek-R1/V3 系列大模型的深度适配优化,成为国内首家实现 DeepSeek 模型全栈国产化推理服务落地的运营商级云平台;移动云全面实现 DeepSeek 全版本覆盖、全尺寸适配、全功能畅用,在全国 13 个智算中心提供 DeepSeek 完整服务;联通云基于 “星罗” 平台实现多规格 DeepSeek-R1 模型适配,在全国 270 多个骨干云池完成预部署 。近期,中国电信、中国移动分别与中国石化、中国石油开展合作,实现 “满血 DeepSeek” 国产化私有部署。以中国电信与中国石化合作为例,采用先进推理加速技术,大模型推理计算效率提升近一倍,计算成本降低 50%,石化行业专业测试问题回答正确率超 80%,石化行业数学公式、化学结构式、专业图表等专业内容识别准确率超 90% 。

引发行业变革,带动算力需求

DeepSeek 的出现与发展,对整个 AI 行业产生深远影响。其高性能、低成本的特性,促使行业内其他企业重新审视自身技术与成本策略。OpenAI 本月降价,谷歌的 Gemini 推出折扣访问层级,一定程度上可视为对 DeepSeek 竞争压力的回应 。在算力需求方面,尽管 DeepSeek 通过技术优化降低了部分成本,但因其广泛应用,引发各行各业多家企业纷纷布局采用,使得英伟达 AI 芯片需求大增。路透社引述知情人士消息,自 DeepSeek 上个月引起全球瞩目以来,腾讯、阿里巴巴及字节跳动等中国企业都 “大幅增加” 对英伟达 H20 芯片的订单 。

从最新消息来看,DeepSeek 正处于快速发展与变革的轨道上。无论是技术层面的突破、市场策略的调整,还是在各行业的广泛应用,都显示出其强大的竞争力与影响力。未来,随着 R2 模型发布以及更多技术开源与应用拓展,DeepSeek 有望持续改写 AI 行业格局,为我们带来更多惊喜与变革。让我们拭目以待,共同见证 DeepSeek 在 AI 浪潮中乘风破浪,引领新的发展方向。你对 DeepSeek 的未来发展有何期待?欢迎在评论区留言分享。

科技脉搏,每日跳动。

与敖行客 Allthinker一起,创造属于开发者的多彩世界。

图片

- 智慧链接 思想协作 -

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐