文字生成音乐!Meta发布了“开源的”“音乐界的ChatGPT”!

sxkk20082年前智能百科230
随着聊天机器人ChatGPT的兴起,人们早已尝试将生成式人工智能(AI)技术应用于包括音乐在内的多个领域。年初,谷歌曾推出音乐生成大模型 MusicLM,并于5月向上月向所有用户开放,其效果非常不错。 除了谷歌的MusicLM外,目前较为常见的音乐模型还有Riffusion、Mousai和Noise2Music等。而近日,Meta在Github上推出了允许商业使用的名为MusicGen的开源AI模型,引发了外界的广泛关注。

随着聊天机器人ChatGPT的兴起,人们早已尝试将生成式人工智能(AI)技术应用于包括音乐在内的多个领域。年初,谷歌曾推出音乐生成大模型 MusicLM,并于5月向上月向所有用户开放,其效果非常不错。


文字生成音乐!Meta发布了“开源的”“音乐界的ChatGPT”!

除了谷歌的MusicLM外,目前较为常见的音乐模型还有Riffusion、Mousai和Noise2Music等。而近日,Meta在Github上推出了允许商业使用的名为MusicGen的开源AI模型,引发了外界的广泛关注。


这种开源的AI模型MusicGen,顾名思义其实就是一种深度学习语言模型,该模型基于谷歌2017年推出的Transformer模型,并采用Meta的EnCodec编译器将音频数据分解为小单元处理,让用户可直接根据文本提示和旋律提示创作音乐。


前段时间,Meta人工智能研究工程师Felix Kreuk还曾在Twitter上向大众展示了MusicGen的功能。


文字生成音乐!Meta发布了“开源的”“音乐界的ChatGPT”!

据了解,Meta的介绍,由Synnaeve领导的团队曾使用了2万小时的授权音乐对MusicGen进行训练,其中包括来自内部数据集的来自媒体内容服务商ShutterStock和Pond5 10000首“高质量”授权音乐和390000首纯音乐。


与此同时,Meta自己还将MusicGen与市面上已有的音乐创作软件MusicLM(谷歌旗下)、Riffusion以及Mousai作了比较。


据Meta表示,无不管是在与文本的匹配度上,还是在作曲的可信度上,MusicGen的表现似乎更加惊艳,都更胜一筹。


目前,Meta尚未提供用于训练模型的代码,但提供了预训练模型。用户如果想要亲身感受,可以通过Hugging Face上的API体验MusicGen,除了文本提示外,还可搭配音频一同作为生成音乐的条件。


文字生成音乐!Meta发布了“开源的”“音乐界的ChatGPT”!

在确定提示信息后,便可让MusicGen生成一段12秒的音频但生成音乐。不过可能需要一些时间,其具体等待时长将取决于同时在线的用户数量和用户所设置的提示信息。


从AI孙燕姿到MusicGen,从演唱到创作,AI已经全面入侵音乐领域。然而,MusicGen 能否能够成为一款优秀的音乐生成模型,可能还待更多用户的验证。

相关文章

AI:插件, 在Chrome任何网站上使用AI聊天

AI:插件, 在Chrome任何网站上使用AI聊天

AI:插件无需 AI 聊天帐户,可在 Chrome 浏览器任何网站上使用 AI 聊天、 Bard 、 Bing 和 Claude,无需复制粘贴,支持一键编写、重写、总结、翻译、解释或回复任何文本。AI...

涂鸦智能携手星环科技、思码光,重塑全屋智能影音新体验

涂鸦智能携手星环科技、思码光,重塑全屋智能影音新体验

近日,全球化云开发者平台涂鸦智能(NYSE: TUYA,HKEX: 2391)与国内知名影音品牌星环科技、智能照明行业领先品牌思码光达成合作,共同打造了“星光绘梦&rdqu...

谷歌聊天机器人 Bard 即将引入 Google Maps 等插件

谷歌聊天机器人 Bard 即将引入 Google Maps 等插件

在与OpenAI激烈竞争的过程中,谷歌正在努力提升其聊天机器人Bard的能力。在与OpenAI激烈竞争的过程中,谷歌正在努力提升其聊天机器人Bard的能力。最近,谷歌对AI聊天机器人Bard进行了版本...

Stability AI 推出素描转图像工具 Stable Doodle,让你的涂鸦变成艺术品

Stability AI 推出素描转图像工具 Stable Doodle,让你的涂鸦变成艺术品

最近,Stability AI 发布了一项名为"稳定素描"的全新服务,利用稳定扩散模型将素描转换为艺术视觉作品,为用户带来愉悦的视觉体验。最近,Stability AI 发布了一项...

国产AI大模型“曹植”发布:擅长文档写作、支持中英法日等数十种语言

在 2023 世界人工智能大会期间,达观数据“曹植”大模型正式发布,并对外开放公测。在 2023 世界人工智能大会(WAIC)上,达观数据引领国产大预言模型的新潮流,正式发布了其垂直专用的大语言模型—...

Enhanced AIChat插件,增强Chrome浏览器AI聊天对话体验

Enhanced AIChat插件,增强Chrome浏览器AI聊天对话体验

Enhanced AIChat 插件是一款增强 Chrome 浏览器 AI 聊天对话体验的实用工具,该插件可直接访问增强 AIChat 体验的新功能,例如能够将当前聊天导出到 Markdown 文件,...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。