Meta 开源 AI 语言模【mó】型 MusicGen,可将【jiāng】文本【běn】和旋【xuán】律转化为完整乐曲

2024-9-21 14:12:13来源:品玩


【资料图】

品玩 6 月【yuè】 12 日讯,Meta 近【jìn】日在 Github 上开源了其 AI 语言模型 MusicGen,该模型基于谷歌 2017 年推出的 Transformer 模型。如同模型名称所示,MusicGen 主要用于音乐生【shēng】成【chéng】,它可【kě】以【yǐ】将【jiāng】文本和已有的旋律【lǜ】转化为完【wán】整乐【lè】曲。

研发团队表示:" 我们使用了 20000 小时的【de】授权音【yīn】乐来对训【xùn】练该模型,并【bìng】采用 Meta 的 EnCodec 编码器将音频【pín】数据【jù】分解【jiě】为【wéi】更小的单元进行并【bìng】行【háng】处理,进而让 MusicGen 的运算【suàn】效【xiào】率和生【shēng】成速度都比同类型 AI 模【mó】型更为出色。"

除此之外,MusicGen 还支持文本与旋律的组合输入,例如你可【kě】以提出生成 " 一首轻快的曲目 " 并【bìng】同时要求【qiú】 " 将【jiāng】它与贝多芬的《欢乐颂【sòng】》结合起来【lái】 "。

研发【fā】团队还对 MusicGen 的实际表现进行了测试。结果显【xiǎn】示,与谷【gǔ】歌的 MusicLM 以及 Riffusion、Mousai、Noise2Music 等其他【tā】音【yīn】乐模型相比,MusicGen 在【zài】测试【shì】音乐与文本【běn】提示的匹配度以【yǐ】及作曲的可信度等指【zhǐ】标上表现更好,总体而言【yán】略高于【yú】谷歌 MusicLM 的水平。

最新资讯

股票软件