54-260506 AI 科技日报 (GPT-5.5 Instant开始推送)

AI模型

  1. GPT-5.5 Instant成为ChatGPT默认模型 — OpenAI开始推送GPT-5.5 Instant,已经变成了ChatGPT的默认模型。这次升级让对话更智能、清晰、个性化,界面也更简洁了。 🔗

产品发布

  1. Claude Code 2.1.129发布,支持URL插件安装 — Claude Code 更新了,现在可以用 --plugin-url 标志直接从URL安装插件,方便多了。错误信息里还加了API请求ID,调试起来更省事。 🔗

研究论文

  1. 评估基准中平均通过率的误导性 — 在评估模型时,“平均通过率”这个指标很容易误导人,因为它把大量简单测试也平均进去了,得看更细的分析才行。 🔗
  2. 关于训练损失突刺的讨论 — 早年训练GPT-3时,因为爬到了噪音数据,导致训练损失突然飙了一下。这事引发了怎么用损失统计来过滤异常数据批次的讨论。 🔗
  3. MIT公开神经网络剪枝课程资料 — MIT把神经网络剪枝的课程资料放出来了,想学模型压缩优化的朋友可以免费取用。 🔗
  4. 未来LLM可能需要三种关键能力 — 有种看法是,未来的大语言模型需要融合三种能力:隐空间推理、循环状态和世界模型。 🔗

工具推荐

  1. Meta版图神经网络编码工具性能大幅提升 — Meta 的 SPZ 4 发布了,编码速度快了3到5倍,在浏览器里渲染速度更是快了20倍,能处理几千万个点的数据。 🔗

行业动态

  1. Anthropic将于5月6日举办开发者大会 — Anthropic 的开发者大会今天(5月6日)开 🔗
  2. AI Agent在传统算命学Benchmark中表现优异 — 一个叫 Tianfu Agent 的AI智能体,在紫微斗数算命师全球测试里,水平已经接近人类Top-20了。 🔗

关注我,每天获取AI最新资讯。

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐