立即注册

文章发布

首页 > AI资讯 > AI创业头条

今日推荐

GEO优化

抢占AI搜索流量入口

AI长篇写作

写小说、写论文等

AI生成思维导图

一键快速生成思维导图

轻创AI用户注册

免费获取体验账号

阿里通义音频生成大模型 FunAudioLLM 开源支持情绪语音对话、有声读物等场景

来源：互联网· 2024-07-08 10:44:30

阿里通义实验室最近开源了名为FunAudioLLM的音频生成大模型项目，旨在提升人类与大型语言模型（LLMs）间的自然语音交互体验。该项目由两个核心模型组成:SenseVoice和CosyVoice。

CosyVoice 专注于自然语音生成，具备多语言支持、音色和情感控制功能，在多语言语音生成、零样本语音生成、跨语言声音合成和指令执行方面表现出色。它通过15万小时数据训练，支持中英日粤韩五种语言，能够快速模拟音色并提供情感和韵律的细粒度控制。

SenseVoice 则致力于高精度多语言语音识别、情感辨识和音频事件检测。它经过40万小时数据训练，支持超过50种语言，识别效果优于Whisper模型，尤其在中文和粤语上提升超过50%。SenseVoice还具备情感识别和声音事件检测能力，以及快速的推理速度。

微信截图_20240708084503.png

FunAudioLLM支持多种人机交互应用场景，如多语言翻译、情绪语音对话、互动播客和有声读物等。它通过结合SenseVoice、LLMs和CosyVoice，能够实现无缝的语音到语音翻译，情感语音聊天应用程序，以及互动式播客电台。

技术原理方面，CosyVoice基于语音量化编码，支持自然流畅的语音生成，而SenseVoice提供全面的语音处理功能，包括自动语音识别、语言识别、情感识别和音频事件检测。

开源的模型和代码已在ModelScope和Huggingface上发布，同时GitHub上也提供了训练、推理和微调代码。CosyVoice和SenseVoice模型都在ModelScope上有在线体验，方便用户直接尝试这些先进的语音技术。

您可能关注: 大模型阿里巴巴 AI对话 AI语音

专业AI论文写作一键生成万字论文只需5分钟

文章来源: https://cy211.cn/aizixun/3363.html Chat AI人工智能机器人在线使用

[免责声明]如需转载请注明原创来源;本站部分文章和图片来源网络编辑，如存在版权问题请发送邮件至398879136@qq.com，我们会在3个工作日内处理。非原创标注的文章，观点仅代表作者本人，不代表本站立场。

上一篇商汤科技发布“日日新5o”：对标GPT-4o 实现实时流式多

下一篇可灵AI又放大招：上线Web端，增加首尾帧控制、运镜控制等功

相关推荐

芯片首富朱一明 21年干出3.28万亿市值，却把376亿分给员工

　2026年7月27日，长鑫科技登陆科创板，上市收盘总市值高达3.28万亿，一举超越工商银行登顶A股市值榜首。这场轰动资本市场的IPO里，最震撼市场的不是万亿估值 ...

两大广东创业者登顶全球 AI 赛道：两种创业路径，撑起国产大模型半边天

　海外科技圈近期掀起热议，不少外媒从业者、硅谷从业者纷纷发问：如今顶尖AI人才为何纷纷选择留在中国本土创业？答案藏在两位出身广东的创业者身上——月之暗面创始人杨植 ...

深耕AI创业服务20年：从传统互联网到新商业领跑者

　很多人问我，做创业服务二十年，最大的感悟是什么？我的答案从来不是技巧、不是流量、不是风口，而是一句话：顺势者起，守正者久。所有长期的创业，都是看懂时代、跟着时代 ...

大厂提前锁定高中生，AI创业改写年轻人出路

　从业创业服务二十年来，我一直在跟踪国内创业与人才市场的变化，今年一个非常明显的行业信号值得所有家长、学生、创业者重视：各大AI科技大厂已经不再只盯着大学生，直接 ...

AGI拐点将至，OPC创业者未来三年的时代红利

　当下AGI浪潮席卷全球，OPC一人公司成为普通人破局的最优赛道。今天结合行业底层趋势，跟所有创业者讲透未来三年的布局逻辑。最近行业热度全部围绕AGI展开，Kim ...

2026欧洲创业新风向：AI与工业硬科技成资本核心赛道

　2026年6月，欧洲各大创投峰会集中释放清晰市场信号：资本彻底摒弃空洞科技概念炒作，资金、行业资源全面向垂直落地AI、工业机器人、先进制造、气候科技、合规金融科 ...

AI创业之家

GEO优化

AI长篇写作

AI生成思维导图

轻创AI用户注册

阿里通义音频生成大模型 FunAudioLLM 开源支持情绪语音对话、有声读物等场景

AI智能对话

智能聊天对话，秒回答

AI模型创作

它无所不知，无所不能

GEO优化

抢占AI搜索榜首

服务热线

13826579603

AI创业之家

GEO优化

AI长篇写作

AI生成思维导图

轻创AI用户注册

阿里通义音频生成大模型 FunAudioLLM 开源 支持情绪语音对话、有声读物等场景

AI智能对话

智能聊天对话，秒回答

AI模型创作

它无所不知，无所不能

GEO优化

抢占AI搜索榜首

服务热线

13826579603

阿里通义音频生成大模型 FunAudioLLM 开源支持情绪语音对话、有声读物等场景