近日,北京月之暗面科技有限公司宣布其旗下智能助手 Kimi 迎来了重大技术升级,推出了全新的 k1.5多模态思考模型。这一模型在多模态推理和通用推理能力上达到了行业领先水平,标志着 Kimi 在人工智能领域的又一次突破性进展。
k1.5多模态思考模型是 Kimi 在短短三个月内第三次对其 k 系列强化学习模型进行重磅升级。继去年11月发布的 k0-math 数学模型和12月发布的 k1视觉思考模型之后,k1.5模型在基准测试中表现卓越。在 short-CoT 模式下,k1.5的数学、代码、视觉多模态和通用能力大幅超越了全球范围内短思考 SOTA 模型 GPT-4o 和 Claude3.5Sonnet 的水平,领先幅度高达550%。而在 long-CoT 模式下,k1.5的数学、代码和多模态推理能力也达到了长思考 SOTA 模型 OpenAI o1正式版的水平,这在全球范围内是 OpenAI 之外的公司首次实现 o1正式版的多模态推理性能。
此次升级的背后是 Kimi 技术团队的不懈努力和创新。团队首次公开了详细的模型训练技术报告《Kimi k1.5:借助大语言模型实现强化学习的 Scaling》,记录了新技术范式下的模型训练探索之路。
报告指出,k1.5模型的关键创新包括长上下文扩展,通过部分展开技术提高训练效率,同时观察到上下文长度的增加能够持续提升模型性能。此外,改进的策略优化方法和简洁的框架设计也为模型的强大性能提供了支持。值得注意的是,k1.5模型在文本和视觉数据上进行了联合训练,具备了联合推理两种模态的能力,尤其在数学能力方面表现出色,尽管在处理部分依赖图形理解的几何图形题时仍存在挑战。
为了进一步提升短链思维推理能力,团队还提出了有效的 long2short 方法,利用 Long-CoT 技术改进 Short-CoT 模型,在 AIME、MATH500和 LiveCodeBench 等测试中取得了显著成绩,大幅超越了现有的短链思维模型,如 GPT-4和 Claude Sonnet3.5。
k1.5多模态思考模型的预览版将陆续灰度上线 Kimi.com 网站和最新版本的 Kimi 智能助手 app。用户在使用过程中如果发现模型切换按钮,即可体验这一全新升级的模型。k1.5模型擅长深度推理,能够帮助用户解决复杂的代码问题、数学问题和工作难题。
月之暗面科技有限公司表示,2025年将继续沿着既定路线图加速升级 k 系列强化学习模型,带来更多模态、更多领域的能力和更强的通用能力,为用户解锁更多可能性。
[免责声明]如需转载请注明原创来源;本站部分文章和图片来源网络编辑,如存在版权问题请发送邮件至398879136@qq.com,我们会在3个工作日内处理。非原创标注的文章,观点仅代表作者本人,不代表本站立场。