DeepSeek 登顶140国应用商店榜首

春节期间AI科技圈发生了啥新鲜事？

啥都生

1108人浏览 · 2025-02-04 15:17:02

啥都生 · 2025-02-04 15:17:02 发布

春节期间AI科技圈发生了啥新鲜事？

DeepSeek 登顶140国应用商店榜首

中国人工智能公司 DeepSeek 发布的推理模型 R1 开放版本，凭借仅 560 万美元的训练成本，展现出匹敌甚至超越 OpenAI 模型的实力，引发科技界热议。该模型的成功不仅得到了风险投资家马克·安德森的高度评价，还被 Y Combinator 首席执行官 Garry Tan 认为将加速 AI 推理需求。DeepSeek 的 AI 助手应用发布后迅速登顶140个国家苹果 App Store 免费应用榜首，超越 ChatGPT，几乎是ChatGPT同期下载量的两倍，印度成为其最大新用户来源地，贡献了15.6%的下载量

https://www.huxiu.com/moment/1100328.html

DeepSeek发布全新多模态大模型Janus-Pro，性能超越DALL-E3

DeepSeek发布了多模态大模型Janus-Pro，正式进军文生图领域。在GenEval和DPG-Bench基准测试中，Janus-Pro-7B的性能超越了OpenAI的DALL-E3、Stable Diffusion等热门模型。该模型采用MIT开源协议，可无限制用于商业场景。相比前代，Janus-Pro优化了训练策略，扩展了训练数据，模型规模更大，尤其在多模态理解和文本到图像生成的稳定性方面取得了显著进步。尽管目前仅支持384×384分辨率图像，但其表现已令人瞩目

https://januspro.org/

英伟达创史上最大单日个股市值蒸发纪录

DeepSeek的推理大模型DeepSeek-R1凭借出色性能、开源性质以及低成本获得广泛关注，其预训练费用仅557.6万美元，使用2048块英伟达H800 GPU集群运行55天完成。尽管如此，英伟达股价暴跌16.86%，一日蒸发5900亿美元，创史上最大单日个股市值蒸发纪录，但英伟达仍高度评价DeepSeek为AI领域的卓越进步

https://xueqiu.com/3305476551/321911747

英伟达免费开放19门AI技术课程，涵盖大模型与深度学习

英伟达宣布将向公众免费开放19门自定进度的技术课程，原价最高可达90美元。这些课程涵盖生成式AI与大语言模型、图形与仿真、加速计算、数据科学以及深度学习等五大领域，学习时长在两到八小时之间。其中，深度学习类别提供了八门课程，是内容最丰富的部分。用户需先加入英伟达的免费开发者计划，即可按个人节奏自由学习

https://developer.nvidia.com/join-nvidia-developer-program

360无偿为DeepSeek提供安全服务，纳米AI搜索开通“DeepSeek高速专线”

360集团宣布无偿为国产大模型DeepSeek提供全方位网络安全防护，助力其应对外部网络攻击威胁。同时，360在旗下纳米AI搜索开通“DeepSeek高速专线”，启用最高规格的R1高速专线和专属防攻击机房，保障用户体验。此外，纳米AI搜索还联合国内16家顶级大模型，提供一站式AI服务

https://zhuanlan.zhihu.com/p/20766109337

英伟达与微软接入Deepseek，OpenAI急筹2800亿新融资

英伟达和微软等科技巨头纷纷接入Deepseek模型托管服务，而OpenAI则在压力下计划以3000亿美元估值筹集400亿美元（约合2800亿人民币）的新融资，本轮融资由软银领投。此外，OpenAI还计划通过“星际之门”项目投资1000亿美元建设AI基础设施，以应对市场竞争和填补亏损。与此同时，Deepseek在程序员社区中引发广泛关注，其模型已在多个平台上线并受到好评

https://www.qbitai.com/2025/01/249886.html

秘塔AI接入满血版DeepSeek R1推理模型

秘塔AI宣布接入DeepSeek的R1满血版推理模型，该模型在结合全网知识和学术文献的推理问题上表现出色。秘塔AI结合自身数十亿全网数据和数千万学术文献，进一步提升了模型的实用性。目前该版本已上线网页端，用户可通过秘塔AI搜索体验更“聪明”的模型

https://mp.weixin.qq.com/s/-3cN_AxqtydWSQzDc5DOUQ

宇树科技人形机器人亮相央视春晚，表演《秧Bot》

杭州宇树科技的人形机器人Unitree H1/H1-2登上央视春晚舞台，带来节目《秧Bot》。该节目由张艺谋执导，机器人穿上红色大花袄，手持手绢跳秧歌，展现了高度灵活性和精准性。Unitree H1/H1-2是国内第一台能跑的全尺寸通用人形机器人，身高约180厘米，配备3D激光雷达和深度相机，可实时获取高精度空间数据。此次表演展示了中国机器人技术的最新成果，以及科技与传统文化的深度融合

https://mp.weixin.qq.com/s/gbwX8NHrdyBvDQJhgMJAcg

首个OpenAI免费推理模型o3-mini发布

OpenAI推出了首个免费推理模型o3-mini系列，包含low、medium和high三个版本，旨在推动低成本推理的边界。o3-mini在STEM推理方面进行了优化，响应速度更快，平均响应时间比前代o1-mini提升了24%。在数学和科学问题上，o3-mini表现优异，高推理强度版本在复杂问题解决上超越了o1系列。然而，与DeepSeek-R1相比，o3-mini在价格上仍显昂贵。CEO奥特曼在Reddit活动中反思称，OpenAI在开源AI模型上“站在了历史错误的一边”，并承认领先优势将缩小。尽管如此，o3-mini的上线引发了网友的广泛实测，其表现被认为在某些任务上优于DeepSeek，但也面临性价比的挑战

https://www.jiqizhixin.com/articles/2025-02-01

阿里云发布Qwen2.5-1M开源模型：百万Token上下文处理能力登场

阿里云通义千问团队推出最新的开源模型Qwen2.5-1M，包含Qwen2.5-7B-Instruct-1M和Qwen2.5-14B-Instruct-1M两个版本。该模型首次原生支持百万Token上下文长度，能够轻松处理超长文档，无需分割处理，并支持更长时间、更深入的对话。此外，Qwen2.5-1M还配备了基于vLLM的推理框架，集成稀疏注意力机制，推理速度提升3倍到7倍，极大地提升了实际应用场景的效率和体验

https://huggingface.co/Qwen

阿里云通义开源Qwen2.5-VL，视觉理解能力全面超越GPT-4o

阿里云通义千问开源了全新的视觉模型Qwen2.5-VL，推出3B、7B和72B三个版本。其中，旗舰版Qwen2.5-VL-72B在13项权威评测中夺得冠军，全面超越GPT-4o与Claude3.5。该模型不仅能够准确解析图像内容，还支持超1小时的视频理解，并可直接操控手机和电脑完成复杂任务。Qwen2.5-VL系列模型全球总下载量已超3200万次，成为业界最受欢迎的多模态模型之一。此次升级后，模型在视觉知识解析、OCR能力、视频理解等方面均有显著提升