
DeepSeek 登顶140国应用商店榜首
春节期间AI科技圈发生了啥新鲜事?
春节期间AI科技圈发生了啥新鲜事?
DeepSeek 登顶140国应用商店榜首
中国人工智能公司 DeepSeek 发布的推理模型 R1 开放版本,凭借仅 560 万美元的训练成本,展现出匹敌甚至超越 OpenAI 模型的实力,引发科技界热议。该模型的成功不仅得到了风险投资家马克·安德森的高度评价,还被 Y Combinator 首席执行官 Garry Tan 认为将加速 AI 推理需求。DeepSeek 的 AI 助手应用发布后迅速登顶140个国家苹果 App Store 免费应用榜首,超越 ChatGPT,几乎是ChatGPT同期下载量的两倍,印度成为其最大新用户来源地,贡献了15.6%的下载量
https://www.huxiu.com/moment/1100328.html
DeepSeek发布全新多模态大模型Janus-Pro,性能超越DALL-E3
DeepSeek发布了多模态大模型Janus-Pro,正式进军文生图领域。在GenEval和DPG-Bench基准测试中,Janus-Pro-7B的性能超越了OpenAI的DALL-E3、Stable Diffusion等热门模型。该模型采用MIT开源协议,可无限制用于商业场景。相比前代,Janus-Pro优化了训练策略,扩展了训练数据,模型规模更大,尤其在多模态理解和文本到图像生成的稳定性方面取得了显著进步。尽管目前仅支持384×384分辨率图像,但其表现已令人瞩目
https://januspro.org/
英伟达创史上最大单日个股市值蒸发纪录
DeepSeek的推理大模型DeepSeek-R1凭借出色性能、开源性质以及低成本获得广泛关注,其预训练费用仅557.6万美元,使用2048块英伟达H800 GPU集群运行55天完成。尽管如此,英伟达股价暴跌16.86%,一日蒸发5900亿美元,创史上最大单日个股市值蒸发纪录,但英伟达仍高度评价DeepSeek为AI领域的卓越进步
https://xueqiu.com/3305476551/321911747
英伟达免费开放19门AI技术课程,涵盖大模型与深度学习
英伟达宣布将向公众免费开放19门自定进度的技术课程,原价最高可达90美元。这些课程涵盖生成式AI与大语言模型、图形与仿真、加速计算、数据科学以及深度学习等五大领域,学习时长在两到八小时之间。其中,深度学习类别提供了八门课程,是内容最丰富的部分。用户需先加入英伟达的免费开发者计划,即可按个人节奏自由学习
https://developer.nvidia.com/join-nvidia-developer-program
360无偿为DeepSeek提供安全服务,纳米AI搜索开通“DeepSeek高速专线”
360集团宣布无偿为国产大模型DeepSeek提供全方位网络安全防护,助力其应对外部网络攻击威胁。同时,360在旗下纳米AI搜索开通“DeepSeek高速专线”,启用最高规格的R1高速专线和专属防攻击机房,保障用户体验。此外,纳米AI搜索还联合国内16家顶级大模型,提供一站式AI服务
https://zhuanlan.zhihu.com/p/20766109337
英伟达与微软接入Deepseek,OpenAI急筹2800亿新融资
英伟达和微软等科技巨头纷纷接入Deepseek模型托管服务,而OpenAI则在压力下计划以3000亿美元估值筹集400亿美元(约合2800亿人民币)的新融资,本轮融资由软银领投。此外,OpenAI还计划通过“星际之门”项目投资1000亿美元建设AI基础设施,以应对市场竞争和填补亏损。与此同时,Deepseek在程序员社区中引发广泛关注,其模型已在多个平台上线并受到好评
https://www.qbitai.com/2025/01/249886.html
秘塔AI接入满血版DeepSeek R1推理模型
秘塔AI宣布接入DeepSeek的R1满血版推理模型,该模型在结合全网知识和学术文献的推理问题上表现出色。秘塔AI结合自身数十亿全网数据和数千万学术文献,进一步提升了模型的实用性。目前该版本已上线网页端,用户可通过秘塔AI搜索体验更“聪明”的模型
https://mp.weixin.qq.com/s/-3cN_AxqtydWSQzDc5DOUQ
宇树科技人形机器人亮相央视春晚,表演《秧Bot》
杭州宇树科技的人形机器人Unitree H1/H1-2登上央视春晚舞台,带来节目《秧Bot》。该节目由张艺谋执导,机器人穿上红色大花袄,手持手绢跳秧歌,展现了高度灵活性和精准性。Unitree H1/H1-2是国内第一台能跑的全尺寸通用人形机器人,身高约180厘米,配备3D激光雷达和深度相机,可实时获取高精度空间数据。此次表演展示了中国机器人技术的最新成果,以及科技与传统文化的深度融合
https://mp.weixin.qq.com/s/gbwX8NHrdyBvDQJhgMJAcg
首个OpenAI免费推理模型o3-mini发布
OpenAI推出了首个免费推理模型o3-mini系列,包含low、medium和high三个版本,旨在推动低成本推理的边界。o3-mini在STEM推理方面进行了优化,响应速度更快,平均响应时间比前代o1-mini提升了24%。在数学和科学问题上,o3-mini表现优异,高推理强度版本在复杂问题解决上超越了o1系列。然而,与DeepSeek-R1相比,o3-mini在价格上仍显昂贵。CEO奥特曼在Reddit活动中反思称,OpenAI在开源AI模型上“站在了历史错误的一边”,并承认领先优势将缩小。尽管如此,o3-mini的上线引发了网友的广泛实测,其表现被认为在某些任务上优于DeepSeek,但也面临性价比的挑战
https://www.jiqizhixin.com/articles/2025-02-01
阿里云发布Qwen2.5-1M开源模型:百万Token上下文处理能力登场
阿里云通义千问团队推出最新的开源模型Qwen2.5-1M,包含Qwen2.5-7B-Instruct-1M和Qwen2.5-14B-Instruct-1M两个版本。该模型首次原生支持百万Token上下文长度,能够轻松处理超长文档,无需分割处理,并支持更长时间、更深入的对话。此外,Qwen2.5-1M还配备了基于vLLM的推理框架,集成稀疏注意力机制,推理速度提升3倍到7倍,极大地提升了实际应用场景的效率和体验
https://huggingface.co/Qwen
阿里云通义开源Qwen2.5-VL,视觉理解能力全面超越GPT-4o
阿里云通义千问开源了全新的视觉模型Qwen2.5-VL,推出3B、7B和72B三个版本。其中,旗舰版Qwen2.5-VL-72B在13项权威评测中夺得冠军,全面超越GPT-4o与Claude3.5。该模型不仅能够准确解析图像内容,还支持超1小时的视频理解,并可直接操控手机和电脑完成复杂任务。Qwen2.5-VL系列模型全球总下载量已超3200万次,成为业界最受欢迎的多模态模型之一。此次升级后,模型在视觉知识解析、OCR能力、视频理解等方面均有显著提升
https://www.jiqizhixin.com/articles/2025-01-28-4
更多推荐
所有评论(0)