CN115547280A

CN115547280A - 一种乐器演奏评测方法和系统

Info

Publication number: CN115547280A
Application number: CN202211227512.2A
Authority: CN
Inventors: 任时弘; 贺思原; 于阳; 姚禹; 李莹; 白心玉
Original assignee: Shanghai Tianxia Zaiwang Information Technology Co ltd
Current assignee: Shanghai Tianxia Zaiwang Information Technology Co ltd
Priority date: 2022-10-09
Filing date: 2022-10-09
Publication date: 2022-12-30

Abstract

本发明提供一种乐器演奏评测方法和系统，对演奏音频信号进行快速傅里叶变换得到该演奏音频信号的频域信号；把乐谱信息与该演奏音频信号的频域信号进行相似性比对，得到演奏失误音符集和演奏音频特征集；通过同一乐曲多种不同演奏的演奏失误音符集和演奏音频特征集以及与其对应的评分信息集构建训练样本数据集，使用训练样本数据集训练回归模型。本发明对乐曲多种不同演奏的演奏音频信号进行量化分析，再通过演奏失误音符集、演奏音频特征集以及与其对应的评分信息集构建训练样本数据集，训练回归模型后对实际乐曲演奏进行评测，能够实现在乐器演奏场景下的自动化评测，省时省力，很大程度上提升了乐器演奏评测的便利性。

Description

一种乐器演奏评测方法和系统

技术领域

本发明涉及音乐评测技术领域，特别是涉及一种乐器演奏评测方法和系统。

背景技术

音乐是由不同的音符通过有组织有规律的组合创造出来的艺术，以演唱或演奏的形式表达人们的思想感情，人们的日常生活中离不开音乐。随着科技的迅速发展，人们希望在乐器演奏过程中能通过计算机来进行自动化的识别评测。然而，在当下的乐器考级、乐器考试以及一些乐器比赛过程中，依然还是通过评委人工进行评测打分，费时费力。此外，如果不具备在现场演奏评分的条件下，就无法完成乐器考级以及乐器比赛的评测。

发明内容

鉴于以上所述现有技术的缺点，本发明的目的在于提供一种乐器演奏评测方法和系统，用于解决现有技术中对乐器考级以及乐器比赛通过人工进行评测的问题。

为解决上述技术问题，本发明是按如下方式实现的：一种乐器演奏评测方法，所述方法包括以下步骤：

步骤1，获取乐曲多种不同演奏的演奏音频信号，对演奏音频信号分别进行快速傅里叶变换得到该演奏音频信号的频域信号；

步骤2，获取所述乐曲对应的乐谱信息，所述乐谱信息与该演奏音频信号的频域信号进行相似性比对，得到演奏失误音符集和演奏音频特征集；

步骤3，通过多种不同演奏的演奏失误音符集和演奏音频特征集以及与其对应的评分信息集构建训练样本数据集，使用所述训练样本数据集训练回归模型；

步骤4，通过已经训练完成的模型对实际乐曲演奏进行评测。

为了进一步解决本发明所要解决的技术问题，本发明提供的一种乐器演奏评测方法中，所述步骤1中，对演奏音频信号以PCM格式编码，在编码后使用窗函数。

为了进一步解决本发明所要解决的技术问题，本发明提供的一种乐器演奏评测方法中，所述乐谱信息与该演奏音频信号的频域信号通过DTW算法进行相似性比对。

为了进一步解决本发明所要解决的技术问题，本发明提供的一种乐器演奏评测方法中，所述演奏失误音符集包括多演奏的音符集、少演奏的音符集、演奏错的音符集。

为了进一步解决本发明所要解决的技术问题，本发明提供的一种乐器演奏评测方法中，所述演奏音频特征集包括音符起音间隔偏离度、音符力度偏离度和音符音色偏离度。

为了进一步解决本发明所要解决的技术问题，本发明提供的一种乐器演奏评测方法中，所述音符起音间隔偏离度的计算公式为：

其中，

为演奏时的音符起音间隔偏离度，

为前一个音符演奏的起奏点属性，

为后一个音符演奏的起奏点属性，

为与

路径对齐的乐谱音符的起奏点属性，

为与

路径对齐的乐谱音符的起奏点属性。

为了进一步解决本发明所要解决的技术问题，本发明提供的一种乐器演奏评测方法中，所述音符力度偏离度的计算公式为：

其中，

为演奏时的音符力度偏离度，

为演奏音符的力度属性，

为与

路径对齐到的乐谱音符的力度属性。

为了进一步解决本发明所要解决的技术问题，本发明提供的一种乐器演奏评测方法中，所述音符音色偏离度的计算公式为：

其中，

为演奏时的音符音色偏离度，

为演奏时的音符音色属性。

为了进一步解决本发明所要解决的技术问题，本发明提供的一种乐器演奏评测方法中，计算得到演奏时的音符音色属性包括以下步骤：

步骤2.1，计算每帧的频谱重心，所述频谱重心的计算公式为：

其中，SC_f为频谱重心，F_f[k]为演奏音频信号的频域信号；

步骤2.2，计算每帧的频谱分散度，所述频谱分散度的计算公式为：

其中，SS_f为频谱分散度，SC_f为频谱重心，F_f[k]为演奏音频信号的频域信号；

步骤2.3，计算每帧的频谱尖削度，所述频谱尖削度的计算公式为：

其中，SK_f为频谱尖削度，SS_f为频谱分散度，SC_f为频谱重心，F_f[k]为演奏音频信号的频域信号；

步骤2.4，通过所述频谱尖削度以及归一化处理计算演奏时的音符音色属性，演奏时的音色音色属性的计算公式为：

其中，x_timbre为演奏时的音符音色属性，SK_f为频谱尖削度，f₀为从频域信号中得到相对应帧的起始帧，f₁为从频域信号中得到相对应帧的结束帧。

为了进一步解决本发明所要解决的技术问题，本发明还提供一种乐器演奏评测系统，包括：

演奏音频信号采集模块，用于获取乐曲多种不同演奏的演奏音频信号；

演奏音频信号处理模块，用于对演奏音频信号分别进行快速傅里叶变换得到该演奏音频信号的频域信号；

乐谱信息采集模块，用于获取所述乐曲对应的乐谱信息；

相似度比对模块，用于所述乐谱信息与演奏音频信号的频域信号进行相似度比对；

训练样本数据集构建模块，用于通过多种不同演奏的演奏失误音符集和演奏音频特征集以及与其对应的评分信息集构建训练样本数据集；

样本训练模块，用于通过所述训练样本数据集训练回归模型；

乐曲演奏评测模块，用于通过已经训练完成的模型对实际乐曲演奏进行评测。

如上所述，本发明的一种乐器演奏评测方法和系统，通过巧妙的设计，对乐曲多种不同演奏的演奏音频信号进行量化分析，再通过演奏失误音符集、演奏音频特征集以及与其对应的评分信息集构建训练样本数据集，训练回归模型后对实际乐曲演奏进行评测，能够实现在乐器演奏场景下的自动化评测，省时省力，很大程度上提升了乐器演奏评测的便利性。

附图说明

图1显示为本发明实施例中一种乐器演奏评测方法的流程图；

图2显示为本发明实施例中一种乐器演奏评测方法的演奏音频信号的示意图；

图3显示为本发明实施例中一种乐器演奏评测方法的演奏频域信号的示意图。

具体实施方式

以下通过特定的具体实例说明本发明的实施方式，本领域技术人员可由本说明书所揭露的内容轻易地了解本发明的其他优点与功效。本发明还可以通过另外不同的具体实施方式加以实施或应用，本说明书中的各项细节也可以基于不同观点与应用，在没有背离本发明的精神下进行各种修饰或改变。需说明的是，在不冲突的情况下，以下实施例及实施例中的特征可以相互组合。

需要说明的是，以下实施例中所提供的图示仅以示意方式说明本发明的基本构想，遂图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制，其实际实施时各组件的型态、数量及比例可为一种随意的改变，且其组件布局型态也可能更为复杂。

请参阅图1，本发明提供一种乐器演奏评测方法，方法包括以下步骤：

步骤1，如图2所示，获取乐曲多种不同演奏的演奏音频信号S，对演奏音频信号以PCM格式编码，单声道，采样率为44,100Hz，位深度为16bit。在编码后使用窗函数窗大小N＝1024，50％重叠，如图3所示，对演奏音频信号分别进行快速傅里叶变换得到该演奏音频信号的频域信号，包含frames个FFT帧频域信号F：

步骤2，获取乐曲对应的乐谱信息，乐谱信息通过乐曲的MIDI文件中解码获取。MIDI是Musical Instrument Digital Interface的简称，意为音乐设备数字接口。它是一种电子乐器之间以及电子乐器与电脑之间的统一交流协议。

MIDI文件是一种描述性的音乐语言，将所要演奏的乐曲信息用字节进行描述。譬如在某一时刻使用什么乐器，以什么音符开始，以什么音调结束，加以什么伴奏等，也就说MIDI文件本身并不包含波形数据，所以MIDI文件非常小巧。MIDI文件并不是一段录制好的声音，而是记录声音的信息，然后在告诉声卡如何再现音乐的一组指令。这样一个MIDI文件每存1分钟的音乐只用大约5～10KB。今天，MID文件主要用于原始乐器作品，流行歌曲的业余表演，游戏音轨以及电子贺卡等。MIDI文件重放的效果完全依赖声卡的档次。

MIDI文件可以用作曲软件写出，也可以通过声卡的MIDI口把外接音序器演奏的乐曲输入电脑里，制成.mid文件。MIDI软件有多种类型，有MIDI播放软件、演奏软件和创作软件几类。

解码后包括以下信息：音高y_pitch，以Hz为单位，对于MIDI文件中的音高信息pitch,0≤pitch≤127，转换为Hz单位的音高信息：

力度y_velocity，对于MIDI文件中的音符力度信息vel,0≤vel≤127，均分为5档后归一化：

起奏点y_onset，以毫秒为单位；时值y_duration，以毫秒为单位；当前速度y_tempo，以每分钟节拍数(BPM)为单位，将速度变化的各个时间点设为T_bpm∶＝(t₁,t₂,…,t_n)。

将上述这些事件设为Y＝(y₁,y₂,…,y_n)，其中，n为乐曲的总音符数。

例如,乐谱信息为：

y₁{onset＝0,duration＝0.5,vel＝1.0,tempo＝120.0},

y₂{onset＝0.5,duration＝0.5,vel＝0.6,tempo＝120.0},

y₃{onset＝1.0,duration＝0.5,vel＝0.4,tempo＝120.0},

y₄{onset＝1.5,duration＝0.5,vel＝0.4,tempo＝120.0},

y₅{onset＝2.0,duration＝0.5,vel＝0.4,tempo＝120.0},

y₆{onset＝2.5,duration＝0.5,vel＝0.6,tempo＝120.0},

y₇{onset＝3.0,duration＝0.5,vel＝0.8,tempo＝120.0},

y₈{onset＝3.5,duration＝0.5,vel＝1.0,tempo＝120.0}。

对照上述事件，乐谱信息与该演奏音频信号的频域信号通过DTW算法进行相似性比对，得到演奏失误音符集和演奏音频特征集。演奏失误音符集包括多演奏的音符集、少演奏的音符集、演奏错的音符集。演奏音频特征集包括音符起音间隔偏离度、音符力度偏离度和音符音色偏离度。

使用DTW(Dynamic Time Warping)算法对演奏音频信号S作音频-乐谱比对(Audio-to-Score Alignment,A2SA)，得到实际演奏的事件列表X＝(x₁,x₂,…,x_m)，其中m是乐曲的总音符数。算法得到X和Y的对齐路径P＝(p₁,p₂,…,p_l)，p＝(x_i,y_j),i≤m,j≤n。同时，检出相比乐谱多演奏的音符集W_a、少演奏的音符集W_b、演奏错误的音符集W_c。

W_c＝|{p_i}|,p_i＝(x,y),x_pitch≠y_pitch。

例如，演奏信息如下：

x1{onset＝0.0,dur＝0.416,vel＝0.8,tempo＝120.0},

x2{onset＝0.416,dur＝0.5013333333333334,vel＝0.8,tempo＝83.26530612244898},

x3{onset＝0.9173333333333333,dur＝0.5066666666666666,vel＝1.0,tempo＝120.0},

x4{onset＝1.424,dur＝0.5226666666666668,vel＝0.8,tempo＝120.0},

x5{onset＝1.9466666666666668,dur＝0.3893333333333331,vel＝1.0,tempo＝120.0},

x6{onset＝2.336,dur＝0.16533333333333333,vel＝0.8,tempo＝71.0204081632653},

x7{onset＝2.501333333333333,dur＝0.5013333333333336,vel＝0.8,tempo＝19.591836734693878},

x8{onset＝3.002666666666667,dur＝0.976,vel＝0.6,tempo＝120.0}。

DTW算法给出演奏的起奏点属性x_onset。将路径P中包含的各个事件p重新与演奏音频信号S比对，对事件对应的音频片段S_p进行时域频域分析，得到音符音高x_pitch、音符力度x_velocity、音符时值x_duration。

音符起音间隔偏离度的计算公式为：

其中，

为演奏时的音符起音间隔偏离度，

为前一个音符演奏的起奏点属性，

为后一个音符演奏的起奏点属性，

为与

路径对齐的乐谱音符的起奏点属性，

为与

路径对齐的乐谱音符的起奏点属性。

音符起音间隔偏离度曲线如下：

[1,0.832,1.0026666666666668,1.0133333333333332,1.0453333333333337,0.7786666666666662,0.33066666666666666,1.0026666666666673]。

音符力度偏离度的计算公式为：

其中，

为演奏时的音符力度偏离度，

为演奏音符的力度属性，

为与

路径对齐到的乐谱音符的力度属性。

音符力度偏离度曲线如下：

[0.8,1.3333333333333335,2.5,2.0,2.5,1.3333333333333335,1.0,0.6]。

音符音色偏离度的计算公式为：

其中，

为演奏时的音符音色偏离度，

为演奏时的音符音色属性。

音符音色偏离度曲线如下：

[1.3186490139846225,1.048354625632218,1.034196241406035,0.928835522226516,1.1452800482543692,0.6767212762159915,1.0962650332611479,0.7516982390190999]。

计算得到演奏时的音符音色属性

包括以下步骤：

步骤2.1，计算每帧的频谱重心，频谱重心的计算公式为：

其中，SC_f为频谱重心，F_f[k]为演奏音频信号的频域信号；

步骤2.2，计算每帧的频谱分散度，频谱分散度的计算公式为：

步骤2.3，计算每帧的频谱尖削度，频谱尖削度的计算公式为：

步骤2.4，通过频谱尖削度以及归一化处理计算演奏时的音符音色属性，演奏时的音色音色属性的计算公式为：

可根据实际需求还可以对于路径P中的每个演奏事件的各偏离度属性进行滤波、偏移、缩放等调整，以忽略演奏中持续的且前后一致的速度和力度偏差。

步骤3，通过多种不同演奏的演奏失误音符集和演奏音频特征集以及与其对应的评分信息集构建训练样本数据集，使用训练样本数据集训练回归模型。评分信息集是通过各音符的音准、节奏、力度和音色评判的，对于每个演奏的各个音符都有考官事先打分记录，创建这个数据集作为特征数据输入。

对于每一首需要评测的乐曲，准备一组用于训练和测试的数据集。训练样本数据集占到90％，测试集占全部数据的10％。

训练样本数据集输入到向量向量x⁽ⁱ⁾由以下特征组成：多演奏的音符集W_a、少演奏的音符集W_b、演奏错误的音符集W_c。对于Y中的每个音符y，如y存在于路径P中，将对应的x_ioid、x_veld、x_tbrd填入，否则将这三个值取0。

该数据集的输出y⁽ⁱ⁾为评分，0≤y⁽ⁱ⁾≤1。对于预测结果

使用一种评估方法，如均方根误差(RMSE)或平均绝对误差(MAE)对模型进行评估：

例如有四个演奏的实际分数为[65,90,50,80]，而预测结果为[62,84,30,80]，对上述四个演奏，RMSE约为10.5475，MAE约为7.25。

使用一种回归模型，如支持向量机(Support-Vector Machine)或随机森林回归(Random Forest Regression)模型，使用训练样本数据集训对其进行训练。

步骤4，通过已经训练完成的模型对实际乐曲演奏进行评测。训练得到的模型可用于该乐曲演奏的实际评测，将输出层的结果作为评分。

例如，对应x⁽ⁱ⁾有一组演奏数据输入：

[0,(W_a)

0,(W_b)

0,(W_c)

1,

0.8,

1.3186490139846225,

0.832,

1.3333333333333335,

1.048354625632218,

1.0026666666666668,

2.5,

1.034196241406035,

1.0133333333333332,

2.0,

0.928835522226516,

1.0453333333333337,

2.5,

1.1452800482543692,

0.7786666666666662,

1.3333333333333335,

0.6767212762159915,

0.33066666666666666,

1.0,

1.0962650332611479,

1.0026666666666673,

0.6,

0.7516982390190999]。

输出得分为65。

本发明还提供一种乐器演奏评测系统，包括演奏音频信号采集模块、演奏音频信号处理模块、演奏音频信号处理模块、乐谱信息采集模块、相似度比对模块、训练样本数据集构建模块、样本训练模块和乐曲演奏评测模块。演奏音频信号采集模块用于获取乐曲多种不同演奏的演奏音频信号，演奏音频信号处理模块用于对演奏音频信号分别进行快速傅里叶变换得到该演奏音频信号的频域信号，乐谱信息采集模块用于获取乐曲对应的乐谱信息，相似度比对模块用于乐谱信息与演奏音频信号的频域信号进行相似度比对，训练样本数据集构建模块用于通过多种不同演奏的演奏失误音符集和演奏音频特征集以及与其对应的评分信息集构建训练样本数据集，样本训练模块用于通过训练样本数据集训练回归模型，乐曲演奏评测模块用于通过已经训练完成的模型对实际乐曲演奏进行评测。

综上所述，本发明的一种乐器演奏评测方法和系统，通过巧妙的设计，对乐曲多种不同演奏的演奏音频信号进行量化分析，再通过演奏失误音符集、演奏音频特征集以及与其对应的评分信息集构建训练样本数据集，训练回归模型后对实际乐曲演奏进行评测，能够实现在乐器演奏场景下的自动化评测，省时省力，很大程度上提升了乐器演奏评测的便利性。所以，本发明有效克服了现有技术中的种种缺点而达到更好的实用效果。

上述实施例仅例示性说明本发明的原理及其功效，而非用于限制本发明。任何熟悉此技术的人士皆可在不违背本发明的精神及范畴下，对上述实施例进行修饰或改变。因此，举凡所属技术领域中具有通常知识者在未脱离本发明所揭示的精神与技术思想下所完成的一切等效修饰或改变，仍应由本发明的权利要求所涵盖。