AI创业之家

首页

立即注册

免费试用

首页 > AI资讯 > 热点聚焦

今日推荐

热门搜索

全球和国产十大AI芯片算力排名，你知道几个？国内龙头人工智能芯片公司前30名单及介绍国产算力芯片排行榜前十名及股票全球十大人工智能上市公司排名 sora概念股有哪些？A股中AI视频概念的公司名单国内人工智能大模型公司排名果粉们开始大批退货vision pro 称不值3500美元国内AI人工智能软件排行榜前十名国内人工智能大模型排名前十的公司有哪些?中国A股芯片算力板块10家龙头股一览 iPhone16将配备8GBRAM iPhone标准版配置大升级国内人工智能做得最好的企业有哪些大模型商业化落地成焦点，办公场景应用“尝鲜”如何应对ChatGPT带来的机遇和挑战?豆包AI网页版怎么使用

标准化CRM

AI原创论文写作

毕业论文、学术论文写作

大型CRM

AI长篇写作

写小说、写论文等

CRM定制开发

AI生成思维导图

一键快速生成思维导图

轻创AI用户注册

免费获取体验账号

GPT-4o 级别！VITA-1.5：实时视觉与语音交互， 1.5秒互动延迟

来源：互联网· 2025-01-07 09:35:23

近日，VITA-MLLM 团队宣布推出 VITA-1.5，这是该团队在 VITA-1.0基础上推出的升级版本，致力于提升多模态交互的实时性与准确性。VITA-1.5不仅支持英语和中文，还在多项性能指标上实现了显著提升，为用户提供了更流畅的交互体验。

在 VITA-1.5中，互动延迟大幅降低，从原来的4秒缩短至仅1.5秒，用户在进行语音交互时几乎感受不到延迟。此外，该版本在多模态性能方面也有显著提高，经过评估，VITA-1.5在 MME、MMBench 和 MathVista 等多个基准测试中的平均性能从59.8提升至70.8，展现了出色的能力。

VITA-1.5在语音处理能力上也进行了深度优化。其自动语音识别（ASR）系统的错误率显著降低，从18.4降至7.5，这使得语音指令的理解和响应更加准确。同时，VITA-1.5引入了一个端到端的文本转语音(TTS)模块，该模块能够直接接受大型语言模型(LLM)的嵌入作为输入，从而提高语音合成的自然度和连贯性。

为了确保多模态能力的平衡，VITA-1.5采用了渐进式训练策略，使得新增的语音处理模块对视觉 - 语言的表现影响最小，图像理解性能从71.3轻微下降至70.8。团队通过这些技术创新，进一步推动了实时视觉与语音交互的界限，为未来的智能交互应用奠定了基础。

在 VITA-1.5的使用方面，开发者可以通过简单的命令行操作进行快速入门，并且提供了基础和实时互动演示。用户需要准备一些必要的模块，例如语音活动检测（VAD）模块，以提升实时交互体验。此外，VITA-1.5还将开源其代码，方便广大开发者参与和贡献。

VITA-1.5的推出标志着交互式多模态大语言模型领域的又一重要进展，展现了该团队在技术创新和用户体验上的不懈追求。

专业AI论文写作一键生成万字论文只需5分钟

文章来源: https://www.cy211.cn/aizixun/5424.html Chat AI人工智能机器人在线使用

[免责声明]如需转载请注明原创来源;本站部分文章和图片来源网络编辑，如存在版权问题请发送邮件至398879136@qq.com，我们会在3个工作日内处理。非原创标注的文章，观点仅代表作者本人，不代表本站立场。

上一篇 DeepMind天才科学家去世，AI圈无比惋惜

下一篇人工智能初创公司Anthropic估值已接近600亿美元

相关推荐

特斯拉上海急聘AI科学家，FSD入华匹配本土算力中心

特斯拉上海急聘AI科学家，FSD入华匹配本土算力中心

　“特斯拉在中国自建了算力中心，FSD在中国训练”。这是特斯拉副总裁陶琳近期在群访中，对“FSD入华”相关问题的最新回应。她在采访中并没有明确FSD正式入华的时间 ...

马斯克称中国有望在AI和制造业领域“完全占据主导地位”

马斯克称中国有望在AI和制造业领域“完全占据主导地位”

　　　据《环球时报》英文版报道，特斯拉(411.11, 13.90, 3.50%)CEO埃隆·马斯克近日表示，人工智能的计算能力和能源供应将成为技术发展的最大挑战 ...

法律行业因 Anthropic AI 插件发布而引发恐慌

法律行业因 Anthropic AI 插件发布而引发恐慌

　2月4日晚，阿里巴巴创始人马云惊喜现身杭州阿里全球总部，慰问通义千问春节项目组。据现场员工透露，马云当日身着便装、头戴帽子，神态轻松，在园区内被多名员工偶遇并 ...

马斯克：xAI 欲在三年内登顶，AGI 时代最快明年开启

马斯克：xAI 欲在三年内登顶，AGI 时代最快明年开启

　近日，埃隆·马斯克在其人工智能公司xAI旧金山总部召开的全员大会上，向员工展示了极为宏大的愿景。马斯克明确表示，只要公司能在未来两到三年的关键窗口期内稳步发展， ...

芯片生态大变局:谷歌联手 Meta 优化 PyTorch 适配，挑战英伟达 GPU 统治力

芯片生态大变局:谷歌联手 Meta 优化 PyTorch 适配，挑战英伟达 GPU 统治力

　为了撼动英伟达在 AI 芯片领域的统治地位，Alphabet（谷歌母公司）正在推进一项名为“TorchTPU”的战略计划。该计划旨在显著提升其张量处理单元（TP ...

AI芯片攻坚国产替代中方拒购次级芯片

AI芯片攻坚国产替代中方拒购次级芯片

　在科技竞争的赛道上，芯片如同产业升级的核心引擎。牵动着全球供应链的神经。中美之间围绕芯片技术的博弈已持续数年，从高端芯片禁售到技术封锁，层层加码的限制并未阻挡中 ...

AI智能对话

智能聊天对话，AI秒回答
AI模型创作

它无所不知，无所不能
AI绘画

只需一句话，生成精美画作
轻创AI咨询热线

13826579603

行业解决方案 AI论文生成网站地图 AI创作网 AI资讯 AI智能对话系统 AI创业之家 AI论文写作网站介绍

©2023专业AI智能生成工具支持私有化支持定制

地址：深圳市龙华区民治牛栏前大厦微信:398879136 网站备案号：粤ICP备08036815号-3Copyright © 2024 深圳市星远创业科技有限公司版权所有