最近,Meta 公司推出了一款名为 NotebookLlama 的新工具,它可以说是谷歌的 NotebookLM 中备受欢迎的生成播客功能的开源版。
NotebookLlama 依托于 Meta 自家的 Llama 模型来处理文本,能够将用户上传的文件转化为互动式的播客风格摘要,听起来非常酷。
具体来说,NotebookLlama 首先会把上传的文件,比如说 PDF 格式的新闻文章或博客帖子,转换成文本稿件。接下来,它会在文本中加入一些戏剧化的元素和对话的插入,然后再通过开放的文本转语音模型来进行朗读。虽然这个过程听上去很有趣,但根据我听到的一些示例,生成的声音依然带有明显的机械感,偶尔还会出现声音重叠的情况,听上去有些不太自然。
不过,NotebookLlama 的研究团队表示,他们相信随着更强大模型的开发,语音质量会有所提升。他们在项目的 GitHub 页面上提到:“文本转语音模型是声音自然度的一个限制因素。” 此外,团队还提出一种新的构思,即通过让两个角色围绕一个主题进行辩论来撰写播客大纲,而目前的做法是使用一个单一模型来完成这个任务。
值得注意的是,NotebookLlama 并不是第一个试图复制 NotebookLM 播客功能的项目,之前也有一些类似的尝试,但效果各有不同。即便如此,目前没有一个项目,包括 NotebookLM 本身,能够完全解决 AI 生成内容中的 “幻觉” 问题,也就是说,这些播客内容中仍然可能出现一些虚假的信息。
NotebookLlama 的推出为开源的播客生成提供了新的可能性,虽然现在还存在一些技术上的挑战,但未来的发展空间依然很大。
[免责声明]如需转载请注明原创来源;本站部分文章和图片来源网络编辑,如存在版权问题请发送邮件至398879136@qq.com,我们会在3个工作日内处理。非原创标注的文章,观点仅代表作者本人,不代表本站立场。