CN107818796A

CN107818796A - 一种音乐考试评定方法及系统

Info

Publication number: CN107818796A
Application number: CN201711138157.0A
Authority: CN
Inventors: 凌娜
Original assignee: Chongqing Normal University
Current assignee: Chongqing Normal University
Priority date: 2017-11-16
Filing date: 2017-11-16
Publication date: 2018-03-20

Abstract

本发明公开了一种音乐考试评定方法及系统，包括构建音强模型、音长模型、音色模型和音高模型；获取演奏者的录音数据，对录音数据切分为每间隔10‑20毫秒一段的数据段，将切分的每个数据段的模拟信号录音根据音强序列、音长序列、音色序列和音高序列数据进行提取并模拟信号数字化；将数字化的音强序列、音长序列、音色序列和音高序列数据与构建的音强模型、音长模型、音色模型和音高模型进行对比判定，根据标准度分别得出音强得分、音长得分、音色得分和音高得分，将音强得分、音长得分、音色得分和音高得分加权平均得到考试综合评分。本发明能够克服现有技术中的演奏评分系统对演奏质量的评价因素比较片面，导致评分的可信度不高的问题。

Description

一种音乐考试评定方法及系统

技术领域

本发明涉及考试评定系统技术领域，尤其涉及一种音乐考试评定方法及系统。

背景技术

就目前而言，在音乐考试科目的考试中，对考生的音乐演奏水平评定一般是通过考评老师作为听众，根据考生演奏的音强、音长和节奏等因素对考生的演奏水平进行评分，但是这种传统的考试方式存在主观性较强，并且易受考试环境和考评老师欣赏水平的差异和心情的影响，不能对考生的真实演奏水平做出更客观的评定。

目前，在市场上也有许多关于音乐演奏水平的评分系统，比如申请号为CN201210120560.1的专利，该专利包括：接收用户的连续语音信号；确定所述连续语音信号中每个音符的边界位置，以切分出每个音符；选择切分出的每个音符对应的音调模型，音调模型是预先以离线方式训练得到的；提取所述音符的音调特征；根据所述音符的音调特征、以及与音符相对应的音调模型计算所述音符的标准度；根据所述音符的标准度确定唱歌评测得分。还比如申请号为CN201510306859.X的专利《一种歌曲演奏的评价方法、系统及终端》，其中方法包括：数字点播终端获取评价时长；根据对应的评价标准，计算每段歌曲演奏后的对应时长，并累加所述时长，获得阶段累计时长，并记录到存储模块；若判断所述阶段累计时长大于或等于第一预设阈值，则显示所述阶段累计时长；计算所述阶段累计时长之和；若在所述评价时长内，判断所述阶段累计时长之和是否大于第二预设阈值，则显示对应的标识。

根据李重光先生撰写的《音乐理论基础》中所述，决定音乐质量的特征主要有4个要素：音强、音长、音色、音高，其中音强，指人耳对听到的声音大小强弱的主观感受，由振动幅度决定；音高，指各种不同高低的声音，即音的高度，由振动频率决定，两者成正比关系；音长，音长是指声音的长短，由声音持续时间决定；音色，是声音从感觉特性上的表述，由于不同发声体的材料、结构等特性不同，发出声音就具有不同的音色，音色的特性，即使在相同音高，相同音强的条件下，是否由不同乐器或人发出也可被区分；目前的这些音乐评价系统一般用于手机端或者KTV的PC端，它们仅仅只根据演奏者的音调或者音长与模型进行对比，它们虽然能够起到一定的评定作用，但是目前的演奏评分系统还是娱乐性较强，只能对音乐质量的一个或者两个要素进行评价，如果作为音乐考试的评定系统，还不够全面，不能对考生的音乐演奏质量做全面的评价。

发明内容

有鉴于此，本发明的目的是提供一种音乐考试评定方法及系统，能够克服现有技术中的演奏评分系统对演奏质量的评价因素比较片面，导致评分的可信度不高的问题，为考生提供一种更加公平公正的评价方式，可作为现有音乐考试评价方式的一种补充。

本发明通过以下技术手段解决上述技术问题：

一种音乐考试评定方法，包括

a、构建音强模型、音长模型、音色模型和音高模型，并将模拟信号数字化；

b、获取演奏者的录音数据，对录音数据切分为每间隔10-20毫秒一段的数据段，将切分的每个数据段的模拟信号录音根据音强序列、音长序列、音色序列和音高序列数据进行提取并模拟信号数字化；

c、将数字化的音强序列、音长序列、音色序列和音高序列数据与构建的音强模型、音长模型、音色模型和音高模型进行对比判定，根据标准度分别得出音强得分、音长得分、音色得分和音高得分，将音强得分、音长得分、音色得分和音高得分加权平均得到考试综合评分。

进一步，所述音长序列提取时，对每个录音数据每间隔15毫秒，切割成一个数据段，得到音长序列。声音信号是一种时变信号，它的波形是连续变化的，但是如果在很小一段时间里面观察声音信号，可以发现其波形的变化是微弱的，这个则称为音频信号的短时稳定性，利用该特性可以对声音信号做短时的抽样，通过分帧的方法可以对音强、音高和音色等特征参数进行提取。

进一步，所述音高序列提取时，使用wave文件进行音高提取，通过对语音信号加窗分帧，并通过自相关函数计算，然后使用100-800HZ的带通滤波器，去掉过高或者过低的峰值，并利用semitone＝12*log₂(frequency/440)+69计算极值点，提取出基音周期，得到音高序列。使用自相关函数进行音高序列提取时，语音信号的自相关函数值在基音周期的整数倍位置上出现峰值，检测峰值的位置就可以提取出基音周期，基音周期提取成功后，利用semitone＝12*log₂(frequency/440)+69转化为音高序列。因为在实际的考试时，考生演奏时的换气声音和环境噪音也难免会被录进去，由于这些信号的能量较弱，这时可以找到那些音量值低于最大音量1/5的帧，通过将其音高数据赋值为nan的方法来消除干扰。

进一步，所述音强序列提取时，先对每个语音数据段的语音信号加窗分帧，读取每帧信号的平均幅值作为此帧的音强值，设定的声音信号采样率为6-8kHz采样点数为256，每帧长为12-15ms，帧移为0，对每个数据段的每个音符提取音强特征。音强表示声音的大小，由声音信号的幅度决定，假设每帧信号Sn(m)表示，N为总帧数，M为音框的大小，N＝0,1,2……N-1；m＝0,1,2……M-1，音强曲线定义为

进一步，所述音色序列提取时，将每个录音数据段分解为每个音符，对每个音符使用FM算法，包括使用合成矩阵ID、各种震荡器的波形ID、ADSR的参数来定义音色的各种信息，并将音色转换为数字系统码。声音是由发音器官各部分协同动作所产生的，例如声带颤动而产生的声带音是通过喉腔、咽腔、口腔、唇腔和鼻腔这5个共振腔才传到人的耳朵里；空气流经过声带时，如果声带是绷紧的，则声带将产生张弛振动，即声带将周期性地开启和闭合；声带开启时，空气流从声门喷射出来，形成一个脉冲，声带闭合时相应于脉冲序列的间隙期。因此，在这种情况下，声门处产生一个准周期脉冲状的空气流，该空气流经过声道后最终从嘴唇辐射出声波，这个准周期脉冲的周期即为基音周期。基音频率是由声带张开闭合的周期所决定的。男性的基音频率一般为50～250Hz，女性的基音频率为100～500Hz。说话人的个性化音色就是和基音频率和共振峰频率的分布有关；使用FM算法，包括使用合成矩阵ID、各种震荡器的波形ID、ADSR的参数来定义音色的各种信息，能够将基音频率和共振峰频率转换为数字系统码，可以与音色模型进行对比。

进一步，在对比评判时包括音强对比、音长对比、音色对比和音高对比，以音强模型、音长模型、音色模型和音高模型作为基准，将演奏者的音强序列、音长序列、音色序列和音高序列的算术平均值规整到与音强模型、音长模型、音色模型和音高模型的算术平均值同一水平线上，利用余弦相似度公式计算在二维空间向量中两组数据的趋势，根据相似度的比例a％，以a值作为判定得分。

一种音乐考试评定系统，包括参考模型组件和实时评价组件，所述参考模型组件包括数据库操作单元、第一网络通信单元，所述数据库操作单元包括曲库查询模块、音强模型模块、音长模型模块、音色模型模块和音高模型模块；所述第一网络通信单元包括通讯线程调度模块、请求解析模块、数据分发模块和请求回复模块；所述实时评价组件包括第二网络通信单元、资源下载单元、评分业务单元、评分计算单元；所述第二网络通信单元包括连接状态管理模块、数据请求收发模块、回复信息解析模块；所述资源下载单元包括FTP协议解析模块、数据有效性验证模块；所述评分业务单元包括播放控制模块、音频播放模块、歌谱文件解析模块、录音缓存模块、音乐考试界面绘制模块；所述评分计算单元包括基频提取模块、音高AD转换模块、音强AD转换模块、音长AD转换模块、音色AD转换模块、相似度对比模块和得分计算模块。数据库操作单元：主要实现对SQL数据库的数据操作；其中包括曲库查询模块、音强模型模块、音长模型模块、音色模型模块和音高模型模块；第一网络通信单元：主要实现客户端连接管理，以及请求响应功能。由于可能同时由多个客户端向服务端发起请求，而请求连接时间不定且通信时间较短，因此，在网络通信模块中设计了线程池来管理各个连接请求，这样避免不断创建、销毁线程，提高系统并发性能，该单元主要实现功能包括：通信线程调度、请求解析、数据分发和请求回复网络通信模块，主要实现与服务端的网络连接及请求收发。第二网络通信单元包括连接状态管理模块、数据请求收发模块和回复信息解析模块；资源下载单元：主要实现音频文件和歌谱文件等资源的下载，其核心为FTP文件远程服务客户端的实现，由于FTP协议已有成熟的开源软件库，该模块的实现就较为简单，主要实现功能包括：FTP协议解析和数据有效性验证；评分业务单元为系统核心单元，主要实现评分业务的播控和演奏过程表现功能，作为主控模块根据需要调度其他模块协调工作，主要实现功能包括：播放控制、音频播放、歌谱解析、录音缓存和演奏界面绘制等；评分计算单元：该单元是系统基础模块，主要负责语音信息处理以及得分计算，其主要实现功能包括：语音基频提取、音高AD转换、音强AD转换、音长AD转换、音色AD转换、相似度对比和得分计算等功能。

进一步，所述相似度对比模块包括边界对齐模块、字音对齐模块。边界对齐模块用于根据演奏者所演奏的旋律对于的乐谱确定语音信号片段中每个音符的边界位置，字音对齐模块用于将连续语音信号及其对应的歌词进行字音对齐，得到歌词中每个旋律对用的语音信号片段。

进一步，所述得分计算模块包括音高得分计算模块、音长得分计算模块、音强得分计算模块、音色得分计算模块和加权计算模块。音高计算模块用于计算音高得分，音长计算模块用于计算音长得分，音强计算模块用于计算音强得分，音色计算模块用于计算音色得分，最后使用加权计算模块根据每项所占权重，得到最终的考试综合得分。

进一步，所述音乐评定系统还包括反馈组件，所述反馈组件包括开闭模块、音强反馈模块、音高反馈模块、音长反馈模块和音色反馈模块。反馈组件可以对演奏者在演奏过程中音强、音高、音长和音色出现的问题，对演奏者提出改进建议，反馈组件也可以通过开闭模块关闭，在考试时，为避免反馈组件干扰考试，可以关闭反馈组件，本系统也可以用于演奏者的练习，练习时打开反馈组件的开闭模块，音强反馈模块、音高反馈模块、音长反馈模块和音色反馈模块对演奏者提出修正建议。

本发明的有益效果：

(1)、本发明在对演奏者的演奏质量进行评定时，通过音强、音长、音色和音高四个因素进行评定，评定时，以音强模型、音长模型、音色模型和音高模型作为基准，将演奏者的音强序列、音长序列、音色序列和音高序列的算术平均值规整到与音强模型、音长模型、音色模型和音高模型的算术平均值同一水平线上，利用余弦相似度公式计算在二维空间向量中两组数据的趋势，根据相似度得到评定分数，评定的因素多，比较全面，能够对演奏者的演奏真实质量进行客观的评分，可信度高；

(2)、本发明反馈模块可以对演奏者在演奏过程中出现的问题，对演奏者提出改进建议，反馈模块也可以关闭，在考试时，为避免反馈模块干扰考试，可以关闭反馈模块，本系统也可以用于演奏者的练习，练习时打开反馈模块，对演奏者提出修正建议。

附图说明

图1是本发明一种音乐考试评定系统的架构示意图；

图2是图1中数据库操作单元的示意图；

图3是图1中第一网络通信单元的示意图；

图4是图1中第二网络通信单元的示意图；

图5是图1中资源下载单元的示意图；

图6是图1中评分业务单元的示意图；

图7是图1中评分计算单元的示意图。

具体实施方式

以下将结合附图对本发明进行详细说明：

如图1-图7所示：

一种音乐考试评定方法，包括：

b、获取演奏者的录音数据，对录音数据切分为每间隔10-20毫秒一段的数据段，将切分的每个数据段的模拟信号录音根据音强序列、音长序列、音色序列和音高序列数据进行提取并模拟信号数字化；音长序列提取时，对每个录音数据每间隔15毫秒，切割成一个数据段，得到音长序列；音高序列提取时，使用wave文件进行音高提取，通过对语音信号加窗分帧，并通过自相关函数计算，然后使用100-800HZ的带通滤波器，去掉过高或者过低的峰值，并利用semitone＝12*log₂(frequency/440)+69计算极值点，提取出基音周期，得到音高序列；所述音强序列提取时，先对每个语音数据段的语音信号加窗分帧，读取每帧信号的平均幅值作为此帧的音强值，设定的声音信号采样率为6-8kHz采样点数为256，每帧长为12-15ms，帧移为0，对每个数据段的每个音符提取音强特征；所述音色序列提取时，将每个录音数据段分解为每个音符，对每个音符使用FM算法，包括使用合成矩阵ID、各种震荡器的波形ID、ADSR的参数来定义音色的各种信息，并将音色转换为数字系统码。

c、将数字化的音强序列、音长序列、音色序列和音高序列数据与构建的音强模型、音长模型、音色模型和音高模型进行对比判定，根据标准度分别得出音强得分、音长得分、音色得分和音高得分，将音强得分、音长得分、音色得分和音高得分加权平均得到考试综合评分。在对比评判时包括音强对比、音长对比、音色对比和音高对比，以音强模型、音长模型、音色模型和音高模型作为基准，将演奏者的音强序列、音长序列、音色序列和音高序列的算术平均值规整到与音强模型、音长模型、音色模型和音高模型的算术平均值同一水平线上，利用余弦相似度公式计算在二维空间向量中两组数据的趋势，根据相似度的比例a％，以a值作为判定得分。

声音信号是一种时变信号，它的波形是连续变化的，但是如果在很小一段时间里面观察声音信号，可以发现其波形的变化是微弱的，这个则称为音频信号的短时稳定性，利用该特性可以对声音信号做短时的抽样，通过分帧的方法可以对音强、音高和音色等特征参数进行提取。使用自相关函数进行音高序列提取时，语音信号的自相关函数值在基音周期的整数倍位置上出现峰值，检测峰值的位置就可以提取出基音周期，基音周期提取成功后，利用semitone＝12*log₂(frequency/440)+69转化为音高序列。因为在实际的考试时，考生演奏时的换气声音和环境噪音也难免会被录进去，由于这些信号的能量较弱，这时可以找到那些音量值低于最大音量1/5的帧，通过将其音高数据赋值为nan的方法来消除干扰。音强表示声音的大小，由声音信号的幅度决定，假设每帧信号Sn(m)表示，N为总帧数，M为音框的大小，N＝0,1,2……N-1；m＝0,1,2……M-1，音强曲线定义为

声音是由发音器官各部分协同动作所产生的，例如声带颤动而产生的声带音是通过喉腔、咽腔、口腔、唇腔和鼻腔这5个共振腔才传到人的耳朵里；空气流经过声带时，如果声带是绷紧的，则声带将产生张弛振动，即声带将周期性地开启和闭合；声带开启时，空气流从声门喷射出来，形成一个脉冲，声带闭合时相应于脉冲序列的间隙期。因此，在这种情况下，声门处产生一个准周期脉冲状的空气流，该空气流经过声道后最终从嘴唇辐射出声波，这个准周期脉冲的周期即为基音周期。基音频率是由声带张开闭合的周期所决定的。男性的基音频率一般为50～250Hz，女性的基音频率为100～500Hz。说话人的个性化音色就是和基音频率和共振峰频率的分布有关；使用FM算法，包括使用合成矩阵ID、各种震荡器的波形ID、ADSR的参数来定义音色的各种信息，能够将基音频率和共振峰频率转换为数字系统码，可以与音色模型进行对比。

一种音乐考试评定系统，如图1-图7所示，包括参考模型组件和实时评价组件，参考模型组件包括数据库操作单元、第一网络通信单元，数据库操作单元包括曲库查询模块、音强模型模块、音长模型模块、音色模型模块和音高模型模块；第一网络通信单元包括通讯线程调度模块、请求解析模块、数据分发模块和请求回复模块；实时评价组件包括第二网络通信单元、资源下载单元、评分业务单元、评分计算单元；第二网络通信单元包括连接状态管理模块、数据请求收发模块、回复信息解析模块；资源下载单元包括FTP协议解析模块、数据有效性验证模块；评分业务单元包括播放控制模块、音频播放模块、歌谱文件解析模块、录音缓存模块、音乐考试界面绘制模块；评分计算单元包括基频提取模块、音高AD转换模块、音强AD转换模块、音长AD转换模块、音色AD转换模块、相似度对比模块和得分计算模块；相似度对比模块包括边界对齐模块、字音对齐模块；得分计算模块包括音高得分计算模块、音长得分计算模块、音强得分计算模块、音色得分计算模块和加权计算模块；音乐评定系统还包括反馈组件，反馈组件包括开闭模块、音强反馈模块、音高反馈模块、音长反馈模块和音色反馈模块。

下面是对本方法和系统进行音乐考试模拟试验，分别选取10名志愿者，其中志愿者年龄20-50岁不等，分别使用钢琴和二胡进行考评实验，进行音乐模拟考试试验，使用本方法和系统对这10名志愿者的演奏水平进行打分，在使用本方法和系统进行打分的同时，分别选取5名音乐专家评委进行人工打分，并取五位专家的打分平均值，所选曲目为《歌唱祖国》、《松花江上》和《二泉映月》，最终得到的评分如下表所示：

由上述的评分对比，可以看出，本方法和系统的评分结果与5个评委评分结果的平均值基本相同，因此，本方法和系统在对演奏者的演奏质量进行评定时，通过音强、音长、音色和音高四个因素进行评定，评定时，以音强模型、音长模型、音色模型和音高模型作为基准，将演奏者的音强序列、音长序列、音色序列和音高序列的算术平均值规整到与音强模型、音长模型、音色模型和音高模型的算术平均值同一水平线上，利用余弦相似度公式计算在二维空间向量中两组数据的趋势，根据相似度得到评定分数，评定的因素多，比较全面，能够对演奏者的演奏真实质量进行客观的评分，可信度高。

以上实施例仅用以说明本发明的技术方案而非限制，尽管参照较佳实施例对本发明进行了详细说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或者等同替换，而不脱离本发明技术方案的宗旨和范围，其均应涵盖在本发明的权利要求范围当中。本发明未详细描述的技术、形状、构造部分均为公知技术。

Claims

1.一种音乐考试评定方法，其特征在于：包括

2.根据权利要求1所述的一种音乐考试评定方法，其特征在于：所述音长序列提取时，对每个录音数据每间隔15毫秒，切割成一个数据段，得到音长序列。

3.根据权利要求2所述的一种音乐考试评定方法，其特征在于：所述音高序列提取时，使用wave文件进行音高提取，通过对语音信号加窗分帧，并通过自相关函数计算，然后使用100-800HZ的带通滤波器，去掉过高或者过低的峰值，并利用semitone＝12*log₂(frequency/440)+69计算极值点，提取出基音周期，得到音高序列。

4.根据权利要求3所述的一种音乐考试评定方法，其特征在于：所述音强序列提取时，先对每个语音数据段的语音信号加窗分帧，读取每帧信号的平均幅值作为此帧的音强值，设定的声音信号采样率为6-8kHz采样点数为256，每帧长为12-15ms，帧移为0，对每个数据段的每个音符提取音强特征。

5.根据权利要求4所述的一种音乐考试评定方法，其特征在于：所述音色序列提取时，将每个录音数据段分解为每个音符，对每个音符使用FM算法，包括使用合成矩阵ID、各种震荡器的波形ID、ADSR的参数来定义音色的各种信息，并将音色转换为数字系统码。

6.根据权利要求5所述的一种音乐考试评定方法，其特征在于：在对比评判时包括音强对比、音长对比、音色对比和音高对比，以音强模型、音长模型、音色模型和音高模型作为基准，将演奏者的音强序列、音长序列、音色序列和音高序列的算术平均值规整到与音强模型、音长模型、音色模型和音高模型的算术平均值同一水平线上，利用余弦相似度公式计算在二维空间向量中两组数据的趋势，根据相似度的比例a％，以a值作为判定得分。

7.一种音乐考试评定系统，其特征在于：包括参考模型组件和实时评价组件，所述参考模型组件包括数据库操作单元、第一网络通信单元，所述数据库操作单元包括曲库查询模块、音强模型模块、音长模型模块、音色模型模块和音高模型模块；所述第一网络通信单元包括通讯线程调度模块、请求解析模块、数据分发模块和请求回复模块；所述实时评价组件包括第二网络通信单元、资源下载单元、评分业务单元、评分计算单元；所述第二网络通信单元包括连接状态管理模块、数据请求收发模块、回复信息解析模块；所述资源下载单元包括FTP协议解析模块、数据有效性验证模块；所述评分业务单元包括播放控制模块、音频播放模块、歌谱文件解析模块、录音缓存模块、音乐考试界面绘制模块；所述评分计算单元包括基频提取模块、音高AD转换模块、音强AD转换模块、音长AD转换模块、音色AD转换模块、相似度对比模块和得分计算模块。

8.根据权利要求7所述的一种音乐考试评定系统，其特征在于：所述相似度对比模块包括边界对齐模块、字音对齐模块。

9.根据权利要求8所述的一种音乐考试评定系统，其特征在于：所述得分计算模块包括音高得分计算模块、音长得分计算模块、音强得分计算模块、音色得分计算模块和加权计算模块。

10.根据权利要求9所述的一种音乐考试评定系统，其特征在于：所述音乐评定系统还包括反馈组件，所述反馈组件包括开闭模块、音强反馈模块、音高反馈模块、音长反馈模块和音色反馈模块。