时间太有限了 刚刚其实我想聊我自己的一个感受来着 但是没上发言位!!我自己虽然没有玩很多ai创作音乐的软件,就是偶尔玩一下,但是我对里面的音乐风格这件事有强烈的兴奋和怀疑。
我其实一直对 AI 匹配的各种音乐风格很感兴趣,好奇它到底是用什么方式去构建这些风格的。在体验过程中我发现,当我选择不同风格并让它生成多个版本的音乐时,听感上确实能感觉到极强的风格性。但令我困惑的是:
1. 这种风格性的来源完全无从得知。
2. 这些风格性很强的作品,反而陷入了一种非常同质化的倾向。
虽然我们是通过风格来对音乐进行分类的,但 AI 越是强调某种风格,出来的效果反而同质化越严重。(ps: Typeless 好好用,把我语音说的话总结得好好)
因为AI 里的风格并不是像音乐史里那样,从一个具体创作者、乐队、场景、地域、还有各种实践里生长出来的。它更多是模型把海量音乐中的可重复特征压缩之后,形成的一组可调用统计模式。所以说AI 的风格不是谱系性的,它有点类似于原型性的感觉。模型往往会倾向于学习到训练数据里占比高、标注充分、商业上更常见,网上更容易获得的风格,而当风格变成这种相对固定的东西的时候,AI到底有没有可能产出风格的变形呢?
而且还有一点就是我们不能用人类逻辑去想象AI的思考过程,AI总得来说是基于分类和预测的,它其实并不真的像人类那样理解风格,因为现在大语言模型大部分是以自监督预训练为主,很多时候虽然经过人类的微调,但是我们实际上没有真的知道ai到底怎么学会的,即使我们知道训练目标、知道大体机制、但对大型模型内部如何形成高层的表征状态,其实只有部分理解。人类理解风格,通常会把它放进历史场景、作者经验、技术条件、审美立场里面去理解,当我们说某种音乐风格的时候,会想到它来自什么年代、什么群体、用了什么器材等,但是模型学到的其实是哪些词、哪些声音特征、哪些音乐结构模式经常一起出现,然后在生成时把这些相关性重新组合出来,它能表现出很强的风格符合度,但是并不意味着它拥有和人一样的风格观念。