阿里巴巴通义千问团队发布可控制电脑和手机的AI模型

阿里巴巴发布多模态AI模型Qwen2.5-VL,支持文本、图像、视频分析及PC控制,性能超越GPT-4o等主流模型。该模型在图表解析、发票数据提取、长视频理解等任务中表现优异,并具备IP识别能力。Qwen2.5-VL还展示了与移动和桌面应用的交互能力,但操作系统控制性能仍有提升空间。模型系列中较小版本开源,旗舰版需商业授权。该发布凸显了中国AI在多模态技术领域的快速进展及商业化潜力。

来源:TechCrunch AI

Back to top button