阿里云发布多模态大模型Qwen-VL-Max版本

来源：互联网· 2024-01-26 14:17:27

阿里云公布了多模态大模型的最新研究成果，继Plus版本之后，再次推出Max版本。

Qwen-VL-Max模型在视觉推理方面展现出卓越的能力，可以理解并分析复杂的图片信息，包括识人、答题、创作和写代码等任务。此外，该模型还具备视觉定位功能，可根据画面指定区域进行问答。

在基础能力方面，Qwen-VL-Max能够准确描述和识别图片信息，并根据图片进行信息推理和扩展创作。这一特性使得该模型在多个权威测评中表现出色，整体性能堪比GPT-4V和Gemini Ultra。

微信截图_20240126110056.png

在文档分析（DocVQA）、中文图像相关(MM-Bench-CN)等任务上，Qwen-VL-Max同样超越了GPT-4V，达到了世界最佳水平。

此外，Qwen-VL-Max在图像文本处理方面也取得了显著进步，中英文文本识别能力显著提高。该模型支持百万像素以上的高清分辨率图和极端宽高比的图像，不仅能完整复现密集文本，还能从表格和文档中提取信息。

目前，Qwen-VL-Plus和Qwen-VL-Max限时免费向用户开放。用户可以在通义千问官网、通义千问APP直接体验Max版本模型的能力，也可以通过阿里云灵积平台（DashScope）调用模型API。

您可能关注: 大模型阿里巴巴阿里云

文章来源: https://www.cy211.cn/aizixun/2072.html Chat AI人工智能机器人在线使用

[免责声明]如需转载请注明原创来源;本站部分文章和图片来源网络编辑，如存在版权问题请发送邮件至398879136@qq.com，我们会在3个工作日内处理。非原创标注的文章，观点仅代表作者本人，不代表本站立场。

下一篇 OpenAI 首席执行官将会见三星电子和 SK 海力士高管

相关推荐

AI创业之家