OpenAI 发布 GPT-4.5 价格不菲

Phi-4-Multimodal 在多模态任务中全面领先，视觉基准相当于 GPT-4o，语音识别超越 WhisperV3，数学、推理和编码媲美更大规模的 Qwen2.5-7B，推理任务上相当于 DeepSeek-Rl-Distill-Qwen-7B。Mercury[3] 是由 Inception Labs 推出的一种新型大语言模型，该模型采用扩散模型技术，允许模型一次性生成多个 token，从而极

三花AI

1183人浏览 · 2025-02-28 11:23:12

三花AI · 2025-02-28 11:23:12 发布

OpenAI 发布 GPT-4.5：性能提升，价格不菲

GPT-4.5[1] 是 OpenAI 最新推出的大语言模型，目前以研究预览版的形式向 ChatGPT Pro 订阅者（每月 200 美元）开放。

ChatGPT Plus 用户（每月 20 美元）则将在下周获得访问权限。开发者也可以通过 OpenAI 的付费 API 使用这一模型，定价为每百万输入 token 75 美元，每百万输出 token 150 美元，这个价格可以说是相当贵了。

在性能方面，GPT-4.5 在语言细节、世界知识和情感表达（如更自然的语气）上都有显著提升。值得注意的是，这个模型是 OpenAI 的最后一个非链式思维模型。

在 SimpleQA 基准测试中，GPT-4.5 的得分优于 GPT-4o 和 OpenAI 的推理模型 o1、o3-mini。不过，在编程能力方面，它还是不如 Anthropic 的 Claude 3.7 Sonnet。

微软开源多模态模型 Phi-4-Multimodal 和轻量化 Phi-4-Mini

Phi-4[2] 是微软开源的最新小语言模型，支持文本、视觉和语音/音频处理，并采用 MIT 许可证发布。

Phi-4-Multimodal 在多模态任务中全面领先，视觉基准相当于 GPT-4o，语音识别超越 WhisperV3，数学、推理和编码媲美更大规模的 Qwen2.5-7B，推理任务上相当于 DeepSeek-Rl-Distill-Qwen-7B。

而 Phi-4-Mini 则在轻量化模型中展现了强大的数学和编码能力，由于模型较小，定制和微调更容易且成本更低。

Mercury：首个商用大语言扩散模型

Mercury[3] 是由 Inception Labs 推出的一种新型大语言模型，该模型采用扩散模型技术，允许模型一次性生成多个 token，从而极大提升了生成速度。

在 NVIDIA H100 GPU 上能够以超过 1000 个 token/秒的速度生成响应，比传统模型快约 10 倍，编程性能差不多相当于 GPT-4o-mini。

目前，Mercury 只支持在官方使用或者接入 API 调用（需要申请）。

如果你对大语言扩散模型感兴趣，可以看看前几天介绍过的开源大语言扩散模型 LLaDA[4]。

Ideogram 2a 发布：速度快、成本低的文生图模型

Ideogram 2a[5] 是 Ideogram 团队发布的最新文生图模型，官方宣称这是其迄今为止速度最快、成本最低的版本。

该模型在 Ideogram 2.0 的基础上进行了优化，特别针对平面设计和摄影领域进行了改进。

定价我看了下，每张图的生成成本为 US $0.04，价格不菲，不过生成速度是原来的两倍。

此外，还提供了一个低质量的 Turbo 模型，生成一张图为 US $0.025。

Meta 发布 Aria Gen 2 智能眼镜：面向研究人员的下一代实验性设备

Aria Gen 2[6] 是由 Meta 公司推出的面向研究人员的新一代实验性智能眼镜。

相比 Aria Gen 1，第二代在传感器性能、计算能力、电池寿命和人体工程学设计上都有改进。

X 上有人说续航时间达 6 小时，重量仅为 75 克

不过，这款眼镜依然不面向普通消费者，佬们看看就行。

DeepSeek技术社区

欢迎加入DeepSeek 技术社区。在这里，你可以找到志同道合的朋友，共同探索AI技术的奥秘。

更多推荐

cover

《文字定律》下册第三篇（走向三级文明的人和AI）

DeepSeek技术社区

cover

DeepSeek 服务发现与熔断机制：高并发场景下的工程实践与性能优化

DeepSeek技术社区

cover

DeepSeek-V4 多语言应用上线中的测试点设计与直通率优化

DeepSeek技术社区

所有评论(0)

查看更多评论

三花AI

@weixin_51674085

已为社区贡献15条内容