AI本周大事件:OpenAI神秘更新、谷歌Gemini进化,更多内容看文章
可灵Kling AI发布了两个新模型:KLING 2.0 Master用于视频生成,KOLORS 2.0用于图像生成这两个模型在提示遵循性方面都有所改进,KLING 2.0在处理包含顺序动作和复杂运动的提示时表现尤为突出。
Kling AI发布2.0模型
可灵Kling AI发布了两个新模型:KLING 2.0 Master用于视频生成,KOLORS 2.0用于图像生成
这两个模型在提示遵循性方面都有所改进,KLING 2.0在处理包含顺序动作和复杂运动的提示时表现尤为突出。
demo展示确实很惊艳,看下面链接:
Coze支持MCP
coze总算支持MCP了,扣子发布新产品coze空间,使用体验类似于manus,可调用各种mcp服务完成复杂任务,同时即将允许用户将「扣子开发平台」MCP发布至「扣子空间」。

coze空间可以用户自己添加各种MCP服务,然后提交任务,coze空间会调用各种mcp服务完成复杂任务(manus是官方默认给定的tool和工作流)
coze空间功能:
-
从回答问题,到解决问题,让 Agent 帮你完成更多的工作:
-
自动分析需求,拆解为多个子任务
-
自主调用工具(浏览器、代码编辑器等),执行任务
-
输出完整的结果报告,例如网页、PPT 、飞书文档等

想获取一线AI实战和内幕信息,🔍👇🏻,拉你进👗👗

OpenAI发布了新的o3和o4-mini推理模型
o3在编码、数学、科学和多模态领域推动了最先进的性能,而o4-mini则提供了快速且高效的性能。
两者都具备代理工具访问权限,并能够“通过图像进行思考”。
看这个实测案例
确实现在独一档的存在,特别是它的推理能力



谷歌推出Gemini 2.5 Flash
Gemini 2.5 Flash 是性价比之王,大杀器 🤯
构建应用程序、游戏,提升生产力,只需几分钱。
Gemini 2.5 Flash 在基准测试中摧毁了Claude 3.7 Sonnet,且价格低至20倍

谷歌升级Gemini Live
谷歌正在扩展Gemini Live的Project Astra功能——面向所有安卓用户!
这将使用户能够通过手机摄像头或屏幕共享与实时视觉AI互动,并进行多语言对话,讨论所看到和听到的内容。
模型可以和你的手机互动


微软升级Edge浏览器
微软还开始在其Edge浏览器中推出Copilot Vision
它将读取屏幕上的内容并朗读总结,充当浏览互联网时的实时协作者。
最棒的是:它是免费的——并且是可选择加入的(默认不启用)!

更多AI内容👇🏻👇🏻
OpenAI这次要颠覆什么?实测案例来啦!新一代AI“小专家”来了!能看图、写代码、自主决策
通俗易懂讲AI:5分钟搞懂小模型/大模型/多模态!使用效果翻倍!
🔍:ai_service,点关注,不迷路,更多AI内幕等着你
更多推荐


所有评论(0)