阿里云百炼上线通义千问百万长文本模型Qwen2.5-Turbo

来源：AIbase基地· 2024-11-21 09:01:59

阿里云百炼平台近日宣布上线了Qwen2.5-Turbo百万长文本模型，Qwen2.5-Turbo模型由通义千问团队开发，支持处理高达100万tokens的超长上下文，相当于100万个英文单词或150万个汉字。

这一新版本的模型在长文本检索任务中的准确率达到100%，并在长文本评测集RULER上获得93.1分，超越了GPT-4。在LV-ｅｖａｌ、LongBench-Chat等接近真实场景的长文本任务中，Qwen2.5-Turbo在多数维度上超越了GPT-4o-mini。在短文本基准测试中，Qwen2.5-Turbo的表现也非常出色，显著超越了之前上下文长度为1M tokens的开源模型。

微信截图_20241121082702.png

Qwen2.5-Turbo模型的应用场景广泛，包括长篇小说深入理解、大规模代码助手、多篇论文阅读等，能够一次性处理10本长篇小说、150小时的演讲稿或3万行代码。在推理速度方面，通义千问团队通过稀疏注意力机制将计算量压缩了约12.5倍，将处理1M tokens上下文的首字返回时间从4.9分钟降低到68秒，实现了4.3倍的速度提升。

阿里云百炼平台为所有用户提供了直接调用Qwen2.5-Turbo API的能力，并限时赠送1000万tokens额度。后续使用百万tokens的成本仅为0.3元。

目前，阿里云百炼平台已上线包括Qwen、Llama、ChatGLM在内的超200款国内外主流开源和闭源大模型，支持用户直接调用、训练微调或打造RAG应用。

您可能关注: 通义千问阿里云

专业AI论文写作一键生成万字论文只需5分钟

文章来源: https://cy211.cn/aizixun/4539.html Chat AI人工智能机器人在线使用

[免责声明]如需转载请注明原创来源;本站部分文章和图片来源网络编辑，如存在版权问题请发送邮件至398879136@qq.com，我们会在3个工作日内处理。非原创标注的文章，观点仅代表作者本人，不代表本站立场。

上一篇阿里通义开源推出SmartVscode插件支持自然语言控制

下一篇全球最大AI Agent生态系统来了，适配超1800个模型

相关推荐