阿里发布了Qwen3.5-Omni,这可能是林俊旸离职后的首个重量级发布了,看来通义团队确实顶住了压力,而且节奏非常紧凑。

这个版本在音频、语音、视频 215项SOTA,属于行业第一。在音频理解上超过了gemini3.1 pro,视频理解上和它差不多。

阿里出的这个版本主要是针对“实时语音交互”这个赛道,估计是为以后的千问AI眼镜、各种AI耳机、汽车智能座驾铺路。

 

Logo

欢迎加入DeepSeek 技术社区。在这里,你可以找到志同道合的朋友,共同探索AI技术的奥秘。

更多推荐