阿里通义实验室开源语音处理技术ClearerVoice-Studio 去除背景噪声

来源：互联网· 2024-12-06 13:44:35

阿里巴巴达摩院的通义实验室近期宣布开源一项名为ClearerVoice-Studio的语音处理技术，旨在提升语音质量和可懂度。随着语音技术的广泛应用，语音质量受到越来越多人的关注，尤其是在环境噪声、混响和设备拾音等情况下，语音处理技术的需求日益迫切。

ClearerVoice-Studio集成了语音增强、语音分离和音视频说话人提取等功能，通过融合复数域深度学习算法，大幅提升了语音降噪和分离的性能。该技术能够最大限度地消除背景噪声，保留语音清晰度，同时保持语音失真最小化。

ClearerVoice-Studio的核心模型与算法包括在2022年IEEE/INTER Speech DNS Challenge中获得整体第二的FRCRN模型，以及在语音分离任务中表现卓越的MossFormer系列模型。基于MossFormer2的48kHz语音增强模型在有效抑制噪声的同时，大幅降低了语音失真。

阿里巴巴通义实验室希望通过ClearerVoice-Studio平台，为开发者、研究者和企业提供强大的语音处理工具，助力创新应用落地。用户可以通过在线体验Demo，准备一段包含噪声的语音文件，上传至指定页面，一键处理后在线试听或下载处理结果，即刻获得清晰的音质和卓越的降噪效果。

专业AI论文写作一键生成万字论文只需5分钟

文章来源: https://cy211.cn/aizixun/4854.html Chat AI人工智能机器人在线使用

[免责声明]如需转载请注明原创来源;本站部分文章和图片来源网络编辑，如存在版权问题请发送邮件至398879136@qq.com，我们会在3个工作日内处理。非原创标注的文章，观点仅代表作者本人，不代表本站立场。

上一篇苹果iOS 18.2 RC版更新：Siri接入ChatGPT

下一篇消息称阿里大模型核心人物跳槽字节，年薪高达八位数

相关推荐