AI创业之家

首页

立即注册

文章发布

首页 > AI资讯 > 公司动态

今日推荐

热门搜索

苹果上架近500元龙年手机壳支持全iPhone15系列华为英伟达合作的算力龙头股盘点10大AI算力龙头股百度网盘推出AI创意生成工具“超能画布”雷军：小米汽车性能堪比两百万油车并且售价不会低英伟达营收增长265%，英伟达概念股暴涨百度百家号打击自媒体利用AI传播违规内容华为Pura 70 AI修图逆天！10秒抹除人物背景自然丝滑小米1亿台产品下线小米集团奖励引热议一图看懂华为鸿蒙OS 4.2核心亮点：全新支持AI消除什么是 Gemini？谷歌Gemini与GPT-4等其他AI模型有何不同清华创业团队推AI影视创作工具Dream Factory ：想法秒变微电腾讯元宝与腾讯文档打通：支持一键上传和导出为腾讯文档英伟达概念股英伟达概念股龙头一览量子AI初创公司SandboxAQ融资3亿美元，估值达56亿美元京东APP上线AI智能导购助手提供购物相关建议

标准化CRM

GEO优化

抢占AI搜索流量入口

大型CRM

AI长篇写作

写小说、写论文等

CRM定制开发

AI生成思维导图

一键快速生成思维导图

轻创AI用户注册

免费获取体验账号

阿里通义实验室语音生成大模型CosyVoice升级2.0版本

来源：互联网· 2024-12-16 12:46:14

阿里巴巴通义实验室语音团队宣布，其开源的语音生成大模型CosyVoice已升级至2.0版本，这一升级标志着语音生成技术在准确性、稳定性和自然体验方面的显著进步。CosyVoice2.0通过采用离线和流式一体化建模的语音生成大模型技术，实现了双向流式语音合成，首包合成延迟可达到150ms，显著提升了语音合成的响应速度。

微信截图_20241216105354.png

在发音准确性方面，CosyVoice2.0相比于前一版本错误率下降了30%至50%，在Seed-TTS测试集的hard测试集上取得了当前最低的字错误率，尤其在合成绕口令、多音字、生僻字方面表现出色。此外，2.0版本在零样本语音生成和跨语言语音合成上保持了音色一致性，特别是跨语言语音合成能力相较于1.0版本有了明显提升。

CosyVoice2.0在合成音频的韵律、音质、情感匹配方面也有所增强，MOS评测分从5.4提升至5.53，接近某商业化语音合成大模型的评分。同时，2.0版本支持更多细粒度的情感控制和方言口音控制，为用户提供了更丰富的语言选择，包括粤语、四川话、郑州话、天津话和长沙话等主要方言，以及角色扮演功能，如模仿机器人、小猪佩奇的风格讲话等。

CosyVoice2.0的升级，不仅提升了语音合成的技术和体验，也进一步推动了开源社区的发展，鼓励更多的开发者参与到语音处理技术的创新和应用中来。

GitHub仓库:CosyVoice（https://github.com/FunAudioLLM/CosyVoice）查阅最新更新的CosyVoice2

专业AI论文写作一键生成万字论文只需5分钟

文章来源: https://cy211.cn/aizixun/5029.html Chat AI人工智能机器人在线使用

[免责声明]如需转载请注明原创来源;本站部分文章和图片来源网络编辑，如存在版权问题请发送邮件至398879136@qq.com，我们会在3个工作日内处理。非原创标注的文章，观点仅代表作者本人，不代表本站立场。

上一篇 “豆包”概念股狂飙！字节跳动大模型生态链引爆 AI 赛道，多

下一篇苹果AR智能眼镜仍在研发中，预计需时3-5年才能面世

相关推荐

腾讯混元发布 HyOCR-1.5：仅 1B 参数推理提速 6.37 倍

腾讯混元发布 HyOCR-1.5：仅 1B 参数推理提速 6.37 倍

　近日，轻量化端到端 OCR 专家模型 HyOCR-1.5正式发布，通过一系列技术革新，在保持轻量化架构的同时，实现了性能与效率的显著跃升。作为该领域的首个全栈开 ...

从英伟达千亿营收看2026年AI创业新逻辑：算力格局大变

从英伟达千亿营收看2026年AI创业新逻辑：算力格局大变

　大家好，我是黄新伟，深圳市星远创业科技有限公司创始人、AI创业之家主理人，深耕全域网络营销20年，长期陪伴实体老板、单人AI创业者、中小企业踩准每一轮数字红利。 ...

哈啰试水AI校园社交，推出精准交友产品“Match”

哈啰试水AI校园社交，推出精准交友产品“Match”

　据读佳消息，7月13日，哈啰在高校社交赛道祭出新动作，推出一款专为大学生打造的AI精准交友产品“Match”。该产品目前已在上海多所高校试点冷启动一个多月，吸引 ...

字节跳动 Seedance2.5模型将于7月16日全量开放 API

字节跳动 Seedance2.5模型将于7月16日全量开放 API

　字节跳动旗下最新视频生成模型 Seedance2.5将于7月16日正式全量开放 API，这标志着该模型从灰度测试走向全面商用，有望进一步降低高品质视频生成的门槛 ...

MiniMax完成160亿港元新一轮融资，创始人闫俊杰宣布零薪酬直至实现AGI

MiniMax完成160亿港元新一轮融资，创始人闫俊杰宣布零薪酬直至实现AGI

　MiniMax正式宣布完成新一轮160亿港元融资。根据公告，公司拟将募集资金净额的80%投入AI基础设施及模型研究与开发，进一步夯实技术底座。同日，MiniMa ...

Kimi联合美国运通与农业银行正式发行首张AI原生信用卡

Kimi联合美国运通与农业银行正式发行首张AI原生信用卡

　据每日经济新闻报道，7月10日，全球首张AI原生信用卡——“Kimi信用卡”正式对外发行。该项目由Kimi、美国运通与中国农业银行联合打造，自今年4月开始筹备， ...

AI智能对话

智能聊天对话，秒回答
AI模型创作

它无所不知，无所不能
GEO优化

抢占AI搜索榜首
服务热线

13826579603

行业解决方案 GEO优化网站地图 AI创作网 AI资讯 AI智能对话系统 AI创业之家 AI论文写作网站介绍

地址：深圳市龙华区民治牛栏前大厦微信:398879136 网站备案号：粤ICP备08036815号-3Copyright © 2024 深圳市星远创业科技有限公司版权所有

AI创业之家

转人工 ×