OpenAI 发布 GPT-4.5:性能提升,价格不菲

GPT-4.5[1] 是 OpenAI 最新推出的大语言模型,目前以研究预览版的形式向 ChatGPT Pro 订阅者(每月 200 美元)开放。

ChatGPT Plus 用户(每月 20 美元)则将在下周获得访问权限。开发者也可以通过 OpenAI 的付费 API 使用这一模型,定价为每百万输入 token 75 美元,每百万输出 token 150 美元,这个价格可以说是相当贵了。

在性能方面,GPT-4.5 在语言细节、世界知识和情感表达(如更自然的语气)上都有显著提升。值得注意的是,这个模型是 OpenAI 的最后一个非链式思维模型。

在 SimpleQA 基准测试中,GPT-4.5 的得分优于 GPT-4o 和 OpenAI 的推理模型 o1、o3-mini。不过,在编程能力方面,它还是不如 Anthropic 的 Claude 3.7 Sonnet。

微软开源多模态模型 Phi-4-Multimodal 和轻量化 Phi-4-Mini

Phi-4[2] 是微软开源的最新小语言模型,支持文本、视觉和语音/音频处理,并采用 MIT 许可证发布。

Phi-4-Multimodal 在多模态任务中全面领先,视觉基准相当于 GPT-4o,语音识别超越 WhisperV3,数学、推理和编码媲美更大规模的 Qwen2.5-7B,推理任务上相当于 DeepSeek-Rl-Distill-Qwen-7B。

而 Phi-4-Mini 则在轻量化模型中展现了强大的数学和编码能力,由于模型较小,定制和微调更容易且成本更低。

Mercury:首个商用大语言扩散模型

Mercury[3] 是由 Inception Labs 推出的一种新型大语言模型,该模型采用扩散模型技术,允许模型一次性生成多个 token,从而极大提升了生成速度。

在 NVIDIA H100 GPU 上能够以超过 1000 个 token/秒 的速度生成响应,比传统模型快约 10 倍,编程性能差不多相当于 GPT-4o-mini。

目前,Mercury 只支持在官方使用或者接入 API 调用(需要申请)。

如果你对大语言扩散模型感兴趣,可以看看前几天介绍过的开源大语言扩散模型 LLaDA[4]。

Ideogram 2a 发布:速度快、成本低的文生图模型

Ideogram 2a[5] 是 Ideogram 团队发布的最新文生图模型,官方宣称这是其迄今为止速度最快、成本最低的版本。

该模型在 Ideogram 2.0 的基础上进行了优化,特别针对平面设计和摄影领域进行了改进。

定价我看了下,每张图的生成成本为 US $0.04,价格不菲,不过生成速度是原来的两倍。

此外,还提供了一个低质量的 Turbo 模型,生成一张图为 US $0.025。

Meta 发布 Aria Gen 2 智能眼镜:面向研究人员的下一代实验性设备

Aria Gen 2[6] 是由 Meta 公司推出的面向研究人员的新一代实验性智能眼镜。

相比 Aria Gen 1,第二代在传感器性能、计算能力、电池寿命和人体工程学设计上都有改进。

X 上有人说续航时间达 6 小时,重量仅为 75 克

不过,这款眼镜依然不面向普通消费者,佬们看看就行。

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐