第94章 难题(下) (第1/2页)
魏宏思从电脑上打开沈晴发来的那个音频文件,听了十来秒就关掉了。
没办法,实在是听不下去。这种感觉就像是翻开一本书,看到的全是“%*¥#T@”之类的东西,听了也是白听。
之前看冯洧煦说得头头是道,或许让他听听,还能品评个一二。
但这首歌是沈晴正在创作中的半成品,和同门们讨论一下“爵士风的流行乐”倒不打紧,却不能把曲目泄露出去。
还真是个难题啊!
魏宏思挠了挠头,起身到冰箱里取了瓶矿泉水。回来坐下喝了几口,想起给慕杰做梦境解译的思路,不由萌生出一个想法。
他是听不懂音乐,但把音乐转换成能够看懂的方式,问题不就解决了?
所以不妨把这个音频文件当成一段脑认知刺激信号来处理,无须去管歌曲本身。
想到这,他打开“万六”群,见大家聊起了别的话题,便没去插话,单独给冯洧煦发了条消息:“你有没有音频信号的波形图&频谱图的分析脚本?”
就看冯洧煦对爵士乐的那番分析,魏宏思觉得他大概率写过这种脚本。没有的话也不打紧,随手写一个也用不了太长时间。
很快冯洧煦回复:“有啊。”随即把脚本程序发了过来。
魏宏思将其复制到自己的电脑上,先打开熟悉了一下。
本以为还要改改参数、做些调整,没想到这个脚本竟然直接就能用。冯洧煦自称是群内最懂爵士乐的,果然不是吹牛,他是真的研究过。
然后就把沈晴的音频文件导入,进行特征提取与量化分析。
过了不长时间,这段音频的时域波形图被绘制出来。
这个图形的横轴表示时间,显示音频的持续过程;纵轴表示振幅,即声音在某一时刻的瞬时强度。它反映的是声音强度随时间的直接变化。
通过这个图形,就可以直观地看到信号是平稳的、周期性的,还是突发的、杂乱的,但是它无法反映信号的频率构成与频域能量分布。
随后程序又绘制出了对应的频谱图。
这个图形的横轴为声音频率,纵轴为声音强度,亮度表示该频率成分的能量大小。它是通过对波形图进行傅里叶变换得到的,将时域信号转换成了频域表示。
通过频谱图就可以看到,在每个时节点上,声音由哪些频率组成,哪个频率最突出。
在这些图形数据的基础上,脚本又进一步计算了自相关系数和信号熵值。前者用来评估旋律与节奏的可预测性,后者对应认知负荷的大小。
简单地说,就是这歌有多“流行”或有多“爵士”。
至此,沈晴的这首歌就变成了魏宏思能够看懂的内容。
不过他是第一次“看”歌,没有什么经验,自然说不上好还是不好。但不要紧,好与坏是比较出来的。
他在网上搜了一下,找到沈晴最受欢迎的三首歌,下载后放入脚本进行分析。
把这三首歌的数据与沈晴的新作放在一起对比,结论就很明显了。
(本章未完,请点击下一页继续阅读)