本文最后更新于564 天前,其中的信息可能已经过时,如有错误请发送邮件到zhangzihao60102@gmail.com
text-to-music 通常依赖于全局文本条件来指导音乐生成过程。然而,在描述音乐特征的同时,文本会引入一定程度的歧义和冗长(ambiguity and verboseness)。全局文本描述固有的模糊性,对于生成音乐精确控制时间特征提出了巨大的挑战,例如:melody、chords and rhythm。因此增强chord and rhythm,来捕捉音乐元素的更大范围,这是本文的一个工作重点。






