小程序
传感搜
传感圈

Meta 开源 AI 语言模型 MusicGen,可将文本和旋律转化为完整乐曲

2023-06-13
关注

   meta近日在Github上开源了其AI语言模型MusicGen,该模型基于谷歌2017年推出的Transformer模型。如同模型名称所示,MusicGen主要用于音乐生成,它可以将文本和已有的旋律转化为完整乐曲。

  研发团队表示:“我们使用了20000小时的授权音乐来对训练该模型,并采用meta的EnCodec编码器将音频数据分解为更小的单元进行并行处理,进而让MusicGen的运算效率和生成速度都比同类型AI模型更为出色。”

 

  除此之外,MusicGen还支持文本与旋律的组合输入,例如你可以提出生成“一首轻快的曲目”并同时要求“将它与贝多芬的《欢乐颂》结合起来”。

 

  研发团队还对MusicGen的实际表现进行了测试。结果显示,与谷歌的MusicLM以及Riffusion、Mousai、Noise2Music等其他音乐模型相比,MusicGen在测试音乐与文本提示的匹配度以及作曲的可信度等指标上表现更好,总体而言略高于谷歌MusicLM的水平。

 

  meta已允许该模型的商业使用,并在Huggingface上发布了一个供演示用的网页应用

您觉得本篇内容如何
评分

评论

您需要登录才可以回复|注册

提交评论

提取码
复制提取码
点击跳转至百度网盘