马斯克的xAI正努力实现Grok多模态化将支持上传照片获得文本回复

来源：互联网· 2024-05-22 13:10:27

埃隆・马斯克的人工智能公司 xAI 正在努力为其 Grok 聊天机器人增加多模态输入功能。

根据公开的开发者文件，埃隆·马斯克（Elon Musk）的人工智能公司xAI在向其Grok聊天机器人添加多模态输入方面取得了进展。这意味着，很快，用户就可以将照片上传到 Grok 并接收基于文本的答案。

xAI上个月在一篇博客文章中首次调侃了这一点，该博客称Grok-1.5V将提供“多个领域的多模态模型”。开发人员文档的最新更新似乎显示了新模型的发布进度。

在开发者文档中，一个 Python 脚本示范了开发人员如何使用 xAI 软件开发工具包库来生成基于文本和图像的回应。这个脚本读取图像文件，设置一个文本提示，并使用 xAI SDK 生成回应。

对于 xAI 而言，这是 Grok 的一项重大更新。Grok 最早于2023年11月发布，目前仅供购买 X 高级会员订阅的用户使用。最后一次更新是在今年3月的 Grok1.5版本，带来了改进的推理能力。

据 xAI 的一篇博文介，该模型是 “基于来自互联网公开来源直至2023年第三季度以及由人类审核员审查和整理的各种文本数据” 进行训练的。该博文补充说，Grok-1并未经过 xAI 的训练（包括 xAI 的公开帖子）。然而，Grok 确实拥有 “对世界的实时知识”，包括 xAI 上的帖子。

由埃隆・马斯克于2023年3月创立的 xAI 在人工智能领域相对较新，并落后于竞争对手，如 OpenAI 的 ChatGPT。然而，根据 xAI 的一篇博文，他们的 Grok1.5模型在各种基准测试中正在缩小与 GPT-4的差距，这些测试涵盖了从小学到高中各种竞赛题目的广泛范围。值得注意的是，大型语言模型的基准测试经常受到批评，因为如果这些基准测试包含在它们的训练数据中，这些模型就可以在基准测试上表现良好。

您可能关注: 马斯克 Grok xAI

专业AI论文写作一键生成万字论文只需5分钟

文章来源: https://www.cy211.cn/aizixun/3049.html Chat AI人工智能机器人在线使用

[免责声明]如需转载请注明原创来源;本站部分文章和图片来源网络编辑，如存在版权问题请发送邮件至398879136@qq.com，我们会在3个工作日内处理。非原创标注的文章，观点仅代表作者本人，不代表本站立场。

上一篇大模型数据标注平台Scale AI融资10亿美元，估值达13

下一篇微软发布Phi-3 Vision等最新大模型系列

相关推荐