品玩1月29日讯,据澎湃新闻消息,当地时间1月27日,谷歌公司发布了对AI模型MusicLM的研究,该系统可以从文本描述中生成任何类型的高保真音乐。但因担心风险,谷歌没有立即发布它的计划。“我们强调,需要在未来开展更多工作来应对这些与音乐生成相关的风险——我们目前没有发布模型的计划。”谷歌发布的论文写道。
据了解,谷歌自己的AudioML和人工智能研究机构OpenAI的Jukebox等项目也都可以从文字生成音乐。然而,MusicLM的模型和庞大的训练数据库(280000小时的音乐)使其能制作出作曲特别复杂或保真度特别高的歌曲。MusicLM不仅可以结合流派和乐器,还可以使用计算机通常难以掌握的抽象概念来编写曲目。比如“一种舞曲和雷鬼音乐的混合体,其曲调空旷、超凡脱俗,能唤起惊奇和敬畏之感”,MusicLM就可以实现。
谷歌研究人员表明,该系统可以建立在现有旋律的基础上,无论是哼唱、演唱、吹口哨还是在乐器基础上演奏。此外,MusicLM有一个“故事模式”来编程特定时间的风格、氛围和节奏的转变,比如可以采用几个按顺序编写的描述“冥想时间”、“醒来时间”、“跑步时间”来创建一种“故事”叙事旋律。