CN107818796A - 一种音乐考试评定方法及系统 - Google Patents
一种音乐考试评定方法及系统 Download PDFInfo
- Publication number
- CN107818796A CN107818796A CN201711138157.0A CN201711138157A CN107818796A CN 107818796 A CN107818796 A CN 107818796A CN 201711138157 A CN201711138157 A CN 201711138157A CN 107818796 A CN107818796 A CN 107818796A
- Authority
- CN
- China
- Prior art keywords
- sound
- module
- model
- loudness
- pitch
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 35
- 238000011156 evaluation Methods 0.000 claims abstract description 23
- 239000000284 extract Substances 0.000 claims abstract description 8
- 238000000605 extraction Methods 0.000 claims description 22
- 238000004891 communication Methods 0.000 claims description 20
- 238000006243 chemical reaction Methods 0.000 claims description 17
- 238000004364 calculation method Methods 0.000 claims description 11
- 238000004458 analytical method Methods 0.000 claims description 9
- 238000009432 framing Methods 0.000 claims description 8
- 238000005311 autocorrelation function Methods 0.000 claims description 7
- 239000011159 matrix material Substances 0.000 claims description 5
- 238000005070 sampling Methods 0.000 claims description 5
- 238000012546 transfer Methods 0.000 claims description 5
- 230000015572 biosynthetic process Effects 0.000 claims description 4
- 239000002131 composite material Substances 0.000 claims description 4
- 238000003786 synthesis reaction Methods 0.000 claims description 4
- 238000010200 validation analysis Methods 0.000 claims description 4
- 230000003321 amplification Effects 0.000 claims 1
- 238000003199 nucleic acid amplification method Methods 0.000 claims 1
- 210000001260 vocal cord Anatomy 0.000 description 17
- 238000010586 diagram Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 210000004704 glottis Anatomy 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 230000001755 vocal effect Effects 0.000 description 3
- 230000007613 environmental effect Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 210000000214 mouth Anatomy 0.000 description 2
- 210000003928 nasal cavity Anatomy 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 238000009423 ventilation Methods 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000005553 drilling Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000036651 mood Effects 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 238000005316 response function Methods 0.000 description 1
- 230000033764 rhythmic process Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/60—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
- G06Q50/205—Education administration or guidance
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Educational Administration (AREA)
- Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Tourism & Hospitality (AREA)
- Economics (AREA)
- Multimedia (AREA)
- General Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Marketing (AREA)
- Entrepreneurship & Innovation (AREA)
- Development Economics (AREA)
- Educational Technology (AREA)
- Operations Research (AREA)
- Game Theory and Decision Science (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Auxiliary Devices For Music (AREA)
Abstract
本发明公开了一种音乐考试评定方法及系统,包括构建音强模型、音长模型、音色模型和音高模型;获取演奏者的录音数据,对录音数据切分为每间隔10‑20毫秒一段的数据段,将切分的每个数据段的模拟信号录音根据音强序列、音长序列、音色序列和音高序列数据进行提取并模拟信号数字化;将数字化的音强序列、音长序列、音色序列和音高序列数据与构建的音强模型、音长模型、音色模型和音高模型进行对比判定,根据标准度分别得出音强得分、音长得分、音色得分和音高得分,将音强得分、音长得分、音色得分和音高得分加权平均得到考试综合评分。本发明能够克服现有技术中的演奏评分系统对演奏质量的评价因素比较片面,导致评分的可信度不高的问题。
Description
技术领域
本发明涉及考试评定系统技术领域,尤其涉及一种音乐考试评定方法及系统。
背景技术
就目前而言,在音乐考试科目的考试中,对考生的音乐演奏水平评定一般是通过考评老师作为听众,根据考生演奏的音强、音长和节奏等因素对考生的演奏水平进行评分,但是这种传统的考试方式存在主观性较强,并且易受考试环境和考评老师欣赏水平的差异和心情的影响,不能对考生的真实演奏水平做出更客观的评定。
目前,在市场上也有许多关于音乐演奏水平的评分系统,比如申请号为CN201210120560.1的专利,该专利包括:接收用户的连续语音信号;确定所述连续语音信号中每个音符的边界位置,以切分出每个音符;选择切分出的每个音符对应的音调模型,音调模型是预先以离线方式训练得到的;提取所述音符的音调特征;根据所述音符的音调特征、以及与音符相对应的音调模型计算所述音符的标准度;根据所述音符的标准度确定唱歌评测得分。还比如申请号为CN201510306859.X的专利《一种歌曲演奏的评价方法、系统及终端》,其中方法包括:数字点播终端获取评价时长;根据对应的评价标准,计算每段歌曲演奏后的对应时长,并累加所述时长,获得阶段累计时长,并记录到存储模块;若判断所述阶段累计时长大于或等于第一预设阈值,则显示所述阶段累计时长;计算所述阶段累计时长之和;若在所述评价时长内,判断所述阶段累计时长之和是否大于第二预设阈值,则显示对应的标识。
根据李重光先生撰写的《音乐理论基础》中所述,决定音乐质量的特征主要有4个要素:音强、音长、音色、音高,其中音强,指人耳对听到的声音大小强弱的主观感受,由振动幅度决定;音高,指各种不同高低的声音,即音的高度,由振动频率决定,两者成正比关系;音长,音长是指声音的长短,由声音持续时间决定;音色,是声音从感觉特性上的表述,由于不同发声体的材料、结构等特性不同,发出声音就具有不同的音色,音色的特性,即使在相同音高,相同音强的条件下,是否由不同乐器或人发出也可被区分;目前的这些音乐评价系统一般用于手机端或者KTV的PC端,它们仅仅只根据演奏者的音调或者音长与模型进行对比,它们虽然能够起到一定的评定作用,但是目前的演奏评分系统还是娱乐性较强,只能对音乐质量的一个或者两个要素进行评价,如果作为音乐考试的评定系统,还不够全面,不能对考生的音乐演奏质量做全面的评价。
发明内容
有鉴于此,本发明的目的是提供一种音乐考试评定方法及系统,能够克服现有技术中的演奏评分系统对演奏质量的评价因素比较片面,导致评分的可信度不高的问题,为考生提供一种更加公平公正的评价方式,可作为现有音乐考试评价方式的一种补充。
本发明通过以下技术手段解决上述技术问题:
一种音乐考试评定方法,包括
a、构建音强模型、音长模型、音色模型和音高模型,并将模拟信号数字化;
b、获取演奏者的录音数据,对录音数据切分为每间隔10-20毫秒一段的数据段,将切分的每个数据段的模拟信号录音根据音强序列、音长序列、音色序列和音高序列数据进行提取并模拟信号数字化;
c、将数字化的音强序列、音长序列、音色序列和音高序列数据与构建的音强模型、音长模型、音色模型和音高模型进行对比判定,根据标准度分别得出音强得分、音长得分、音色得分和音高得分,将音强得分、音长得分、音色得分和音高得分加权平均得到考试综合评分。
进一步,所述音长序列提取时,对每个录音数据每间隔15毫秒,切割成一个数据段,得到音长序列。声音信号是一种时变信号,它的波形是连续变化的,但是如果在很小一段时间里面观察声音信号,可以发现其波形的变化是微弱的,这个则称为音频信号的短时稳定性,利用该特性可以对声音信号做短时的抽样,通过分帧的方法可以对音强、音高和音色等特征参数进行提取。
进一步,所述音高序列提取时,使用wave文件进行音高提取,通过对语音信号加窗分帧,并通过自相关函数计算,然后使用100-800HZ的带通滤波器,去掉过高或者过低的峰值,并利用semitone=12*log2(frequency/440)+69计算极值点,提取出基音周期,得到音高序列。使用自相关函数进行音高序列提取时,语音信号的自相关函数值在基音周期的整数倍位置上出现峰值,检测峰值的位置就可以提取出基音周期,基音周期提取成功后,利用semitone=12*log2(frequency/440)+69转化为音高序列。因为在实际的考试时,考生演奏时的换气声音和环境噪音也难免会被录进去,由于这些信号的能量较弱,这时可以找到那些音量值低于最大音量1/5的帧,通过将其音高数据赋值为nan的方法来消除干扰。
进一步,所述音强序列提取时,先对每个语音数据段的语音信号加窗分帧,读取每帧信号的平均幅值作为此帧的音强值,设定的声音信号采样率为6-8kHz采样点数为256,每帧长为12-15ms,帧移为0,对每个数据段的每个音符提取音强特征。音强表示声音的大小,由声音信号的幅度决定,假设每帧信号Sn(m)表示,N为总帧数,M为音框的大小,N=0,1,2……N-1;m=0,1,2……M-1,音强曲线定义为
进一步,所述音色序列提取时,将每个录音数据段分解为每个音符,对每个音符使用FM算法,包括使用合成矩阵ID、各种震荡器的波形ID、ADSR的参数来定义音色的各种信息,并将音色转换为数字系统码。声音是由发音器官各部分协同动作所产生的,例如声带颤动而产生的声带音是通过喉腔、咽腔、口腔、唇腔和鼻腔这5个共振腔才传到人的耳朵里;空气流经过声带时,如果声带是绷紧的,则声带将产生张弛振动,即声带将周期性地开启和闭合;声带开启时,空气流从声门喷射出来,形成一个脉冲,声带闭合时相应于脉冲序列的间隙期。因此,在这种情况下,声门处产生一个准周期脉冲状的空气流,该空气流经过声道后最终从嘴唇辐射出声波,这个准周期脉冲的周期即为基音周期。基音频率是由声带张开闭合的周期所决定的。男性的基音频率一般为50~250Hz,女性的基音频率为100~500Hz。说话人的个性化音色就是和基音频率和共振峰频率的分布有关;使用FM算法,包括使用合成矩阵ID、各种震荡器的波形ID、ADSR的参数来定义音色的各种信息,能够将基音频率和共振峰频率转换为数字系统码,可以与音色模型进行对比。
进一步,在对比评判时包括音强对比、音长对比、音色对比和音高对比,以音强模型、音长模型、音色模型和音高模型作为基准,将演奏者的音强序列、音长序列、音色序列和音高序列的算术平均值规整到与音强模型、音长模型、音色模型和音高模型的算术平均值同一水平线上,利用余弦相似度公式计算在二维空间向量中两组数据的趋势,根据相似度的比例a%,以a值作为判定得分。
一种音乐考试评定系统,包括参考模型组件和实时评价组件,所述参考模型组件包括数据库操作单元、第一网络通信单元,所述数据库操作单元包括曲库查询模块、音强模型模块、音长模型模块、音色模型模块和音高模型模块;所述第一网络通信单元包括通讯线程调度模块、请求解析模块、数据分发模块和请求回复模块;所述实时评价组件包括第二网络通信单元、资源下载单元、评分业务单元、评分计算单元;所述第二网络通信单元包括连接状态管理模块、数据请求收发模块、回复信息解析模块;所述资源下载单元包括FTP协议解析模块、数据有效性验证模块;所述评分业务单元包括播放控制模块、音频播放模块、歌谱文件解析模块、录音缓存模块、音乐考试界面绘制模块;所述评分计算单元包括基频提取模块、音高AD转换模块、音强AD转换模块、音长AD转换模块、音色AD转换模块、相似度对比模块和得分计算模块。数据库操作单元:主要实现对SQL数据库的数据操作;其中包括曲库查询模块、音强模型模块、音长模型模块、音色模型模块和音高模型模块;第一网络通信单元:主要实现客户端连接管理,以及请求响应功能。由于可能同时由多个客户端向服务端发起请求,而请求连接时间不定且通信时间较短,因此,在网络通信模块中设计了线程池来管理各个连接请求,这样避免不断创建、销毁线程,提高系统并发性能,该单元主要实现功能包括:通信线程调度、请求解析、数据分发和请求回复网络通信模块,主要实现与服务端的网络连接及请求收发。第二网络通信单元包括连接状态管理模块、数据请求收发模块和回复信息解析模块;资源下载单元:主要实现音频文件和歌谱文件等资源的下载,其核心为FTP文件远程服务客户端的实现,由于FTP协议已有成熟的开源软件库,该模块的实现就较为简单,主要实现功能包括:FTP协议解析和数据有效性验证;评分业务单元为系统核心单元,主要实现评分业务的播控和演奏过程表现功能,作为主控模块根据需要调度其他模块协调工作,主要实现功能包括:播放控制、音频播放、歌谱解析、录音缓存和演奏界面绘制等;评分计算单元:该单元是系统基础模块,主要负责语音信息处理以及得分计算,其主要实现功能包括:语音基频提取、音高AD转换、音强AD转换、音长AD转换、音色AD转换、相似度对比和得分计算等功能。
进一步,所述相似度对比模块包括边界对齐模块、字音对齐模块。边界对齐模块用于根据演奏者所演奏的旋律对于的乐谱确定语音信号片段中每个音符的边界位置,字音对齐模块用于将连续语音信号及其对应的歌词进行字音对齐,得到歌词中每个旋律对用的语音信号片段。
进一步,所述得分计算模块包括音高得分计算模块、音长得分计算模块、音强得分计算模块、音色得分计算模块和加权计算模块。音高计算模块用于计算音高得分,音长计算模块用于计算音长得分,音强计算模块用于计算音强得分,音色计算模块用于计算音色得分,最后使用加权计算模块根据每项所占权重,得到最终的考试综合得分。
进一步,所述音乐评定系统还包括反馈组件,所述反馈组件包括开闭模块、音强反馈模块、音高反馈模块、音长反馈模块和音色反馈模块。反馈组件可以对演奏者在演奏过程中音强、音高、音长和音色出现的问题,对演奏者提出改进建议,反馈组件也可以通过开闭模块关闭,在考试时,为避免反馈组件干扰考试,可以关闭反馈组件,本系统也可以用于演奏者的练习,练习时打开反馈组件的开闭模块,音强反馈模块、音高反馈模块、音长反馈模块和音色反馈模块对演奏者提出修正建议。
本发明的有益效果:
(1)、本发明在对演奏者的演奏质量进行评定时,通过音强、音长、音色和音高四个因素进行评定,评定时,以音强模型、音长模型、音色模型和音高模型作为基准,将演奏者的音强序列、音长序列、音色序列和音高序列的算术平均值规整到与音强模型、音长模型、音色模型和音高模型的算术平均值同一水平线上,利用余弦相似度公式计算在二维空间向量中两组数据的趋势,根据相似度得到评定分数,评定的因素多,比较全面,能够对演奏者的演奏真实质量进行客观的评分,可信度高;
(2)、本发明反馈模块可以对演奏者在演奏过程中出现的问题,对演奏者提出改进建议,反馈模块也可以关闭,在考试时,为避免反馈模块干扰考试,可以关闭反馈模块,本系统也可以用于演奏者的练习,练习时打开反馈模块,对演奏者提出修正建议。
附图说明
图1是本发明一种音乐考试评定系统的架构示意图;
图2是图1中数据库操作单元的示意图;
图3是图1中第一网络通信单元的示意图;
图4是图1中第二网络通信单元的示意图;
图5是图1中资源下载单元的示意图;
图6是图1中评分业务单元的示意图;
图7是图1中评分计算单元的示意图。
具体实施方式
以下将结合附图对本发明进行详细说明:
如图1-图7所示:
一种音乐考试评定方法,包括:
a、构建音强模型、音长模型、音色模型和音高模型,并将模拟信号数字化;
b、获取演奏者的录音数据,对录音数据切分为每间隔10-20毫秒一段的数据段,将切分的每个数据段的模拟信号录音根据音强序列、音长序列、音色序列和音高序列数据进行提取并模拟信号数字化;音长序列提取时,对每个录音数据每间隔15毫秒,切割成一个数据段,得到音长序列;音高序列提取时,使用wave文件进行音高提取,通过对语音信号加窗分帧,并通过自相关函数 计算,然后使用100-800HZ的带通滤波器,去掉过高或者过低的峰值,并利用semitone=12*log2(frequency/440)+69计算极值点,提取出基音周期,得到音高序列;所述音强序列提取时,先对每个语音数据段的语音信号加窗分帧,读取每帧信号的平均幅值作为此帧的音强值,设定的声音信号采样率为6-8kHz采样点数为256,每帧长为12-15ms,帧移为0,对每个数据段的每个音符提取音强特征;所述音色序列提取时,将每个录音数据段分解为每个音符,对每个音符使用FM算法,包括使用合成矩阵ID、各种震荡器的波形ID、ADSR的参数来定义音色的各种信息,并将音色转换为数字系统码。
c、将数字化的音强序列、音长序列、音色序列和音高序列数据与构建的音强模型、音长模型、音色模型和音高模型进行对比判定,根据标准度分别得出音强得分、音长得分、音色得分和音高得分,将音强得分、音长得分、音色得分和音高得分加权平均得到考试综合评分。在对比评判时包括音强对比、音长对比、音色对比和音高对比,以音强模型、音长模型、音色模型和音高模型作为基准,将演奏者的音强序列、音长序列、音色序列和音高序列的算术平均值规整到与音强模型、音长模型、音色模型和音高模型的算术平均值同一水平线上,利用余弦相似度公式计算在二维空间向量中两组数据的趋势,根据相似度的比例a%,以a值作为判定得分。
声音信号是一种时变信号,它的波形是连续变化的,但是如果在很小一段时间里面观察声音信号,可以发现其波形的变化是微弱的,这个则称为音频信号的短时稳定性,利用该特性可以对声音信号做短时的抽样,通过分帧的方法可以对音强、音高和音色等特征参数进行提取。使用自相关函数进行音高序列提取时,语音信号的自相关函数值在基音周期的整数倍位置上出现峰值,检测峰值的位置就可以提取出基音周期,基音周期提取成功后,利用semitone=12*log2(frequency/440)+69转化为音高序列。因为在实际的考试时,考生演奏时的换气声音和环境噪音也难免会被录进去,由于这些信号的能量较弱,这时可以找到那些音量值低于最大音量1/5的帧,通过将其音高数据赋值为nan的方法来消除干扰。音强表示声音的大小,由声音信号的幅度决定,假设每帧信号Sn(m)表示,N为总帧数,M为音框的大小,N=0,1,2……N-1;m=0,1,2……M-1,音强曲线定义为
声音是由发音器官各部分协同动作所产生的,例如声带颤动而产生的声带音是通过喉腔、咽腔、口腔、唇腔和鼻腔这5个共振腔才传到人的耳朵里;空气流经过声带时,如果声带是绷紧的,则声带将产生张弛振动,即声带将周期性地开启和闭合;声带开启时,空气流从声门喷射出来,形成一个脉冲,声带闭合时相应于脉冲序列的间隙期。因此,在这种情况下,声门处产生一个准周期脉冲状的空气流,该空气流经过声道后最终从嘴唇辐射出声波,这个准周期脉冲的周期即为基音周期。基音频率是由声带张开闭合的周期所决定的。男性的基音频率一般为50~250Hz,女性的基音频率为100~500Hz。说话人的个性化音色就是和基音频率和共振峰频率的分布有关;使用FM算法,包括使用合成矩阵ID、各种震荡器的波形ID、ADSR的参数来定义音色的各种信息,能够将基音频率和共振峰频率转换为数字系统码,可以与音色模型进行对比。
一种音乐考试评定系统,如图1-图7所示,包括参考模型组件和实时评价组件,参考模型组件包括数据库操作单元、第一网络通信单元,数据库操作单元包括曲库查询模块、音强模型模块、音长模型模块、音色模型模块和音高模型模块;第一网络通信单元包括通讯线程调度模块、请求解析模块、数据分发模块和请求回复模块;实时评价组件包括第二网络通信单元、资源下载单元、评分业务单元、评分计算单元;第二网络通信单元包括连接状态管理模块、数据请求收发模块、回复信息解析模块;资源下载单元包括FTP协议解析模块、数据有效性验证模块;评分业务单元包括播放控制模块、音频播放模块、歌谱文件解析模块、录音缓存模块、音乐考试界面绘制模块;评分计算单元包括基频提取模块、音高AD转换模块、音强AD转换模块、音长AD转换模块、音色AD转换模块、相似度对比模块和得分计算模块;相似度对比模块包括边界对齐模块、字音对齐模块;得分计算模块包括音高得分计算模块、音长得分计算模块、音强得分计算模块、音色得分计算模块和加权计算模块;音乐评定系统还包括反馈组件,反馈组件包括开闭模块、音强反馈模块、音高反馈模块、音长反馈模块和音色反馈模块。
下面是对本方法和系统进行音乐考试模拟试验,分别选取10名志愿者,其中志愿者年龄20-50岁不等,分别使用钢琴和二胡进行考评实验,进行音乐模拟考试试验,使用本方法和系统对这10名志愿者的演奏水平进行打分,在使用本方法和系统进行打分的同时,分别选取5名音乐专家评委进行人工打分,并取五位专家的打分平均值,所选曲目为《歌唱祖国》、《松花江上》和《二泉映月》,最终得到的评分如下表所示:
由上述的评分对比,可以看出,本方法和系统的评分结果与5个评委评分结果的平均值基本相同,因此,本方法和系统在对演奏者的演奏质量进行评定时,通过音强、音长、音色和音高四个因素进行评定,评定时,以音强模型、音长模型、音色模型和音高模型作为基准,将演奏者的音强序列、音长序列、音色序列和音高序列的算术平均值规整到与音强模型、音长模型、音色模型和音高模型的算术平均值同一水平线上,利用余弦相似度公式计算在二维空间向量中两组数据的趋势,根据相似度得到评定分数,评定的因素多,比较全面,能够对演奏者的演奏真实质量进行客观的评分,可信度高。
以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的宗旨和范围,其均应涵盖在本发明的权利要求范围当中。本发明未详细描述的技术、形状、构造部分均为公知技术。
Claims (10)
1.一种音乐考试评定方法,其特征在于:包括
a、构建音强模型、音长模型、音色模型和音高模型,并将模拟信号数字化;
b、获取演奏者的录音数据,对录音数据切分为每间隔10-20毫秒一段的数据段,将切分的每个数据段的模拟信号录音根据音强序列、音长序列、音色序列和音高序列数据进行提取并模拟信号数字化;
c、将数字化的音强序列、音长序列、音色序列和音高序列数据与构建的音强模型、音长模型、音色模型和音高模型进行对比判定,根据标准度分别得出音强得分、音长得分、音色得分和音高得分,将音强得分、音长得分、音色得分和音高得分加权平均得到考试综合评分。
2.根据权利要求1所述的一种音乐考试评定方法,其特征在于:所述音长序列提取时,对每个录音数据每间隔15毫秒,切割成一个数据段,得到音长序列。
3.根据权利要求2所述的一种音乐考试评定方法,其特征在于:所述音高序列提取时,使用wave文件进行音高提取,通过对语音信号加窗分帧,并通过自相关函数计算,然后使用100-800HZ的带通滤波器,去掉过高或者过低的峰值,并利用semitone=12*log2(frequency/440)+69计算极值点,提取出基音周期,得到音高序列。
4.根据权利要求3所述的一种音乐考试评定方法,其特征在于:所述音强序列提取时,先对每个语音数据段的语音信号加窗分帧,读取每帧信号的平均幅值作为此帧的音强值,设定的声音信号采样率为6-8kHz采样点数为256,每帧长为12-15ms,帧移为0,对每个数据段的每个音符提取音强特征。
5.根据权利要求4所述的一种音乐考试评定方法,其特征在于:所述音色序列提取时,将每个录音数据段分解为每个音符,对每个音符使用FM算法,包括使用合成矩阵ID、各种震荡器的波形ID、ADSR的参数来定义音色的各种信息,并将音色转换为数字系统码。
6.根据权利要求5所述的一种音乐考试评定方法,其特征在于:在对比评判时包括音强对比、音长对比、音色对比和音高对比,以音强模型、音长模型、音色模型和音高模型作为基准,将演奏者的音强序列、音长序列、音色序列和音高序列的算术平均值规整到与音强模型、音长模型、音色模型和音高模型的算术平均值同一水平线上,利用余弦相似度公式计算在二维空间向量中两组数据的趋势,根据相似度的比例a%,以a值作为判定得分。
7.一种音乐考试评定系统,其特征在于:包括参考模型组件和实时评价组件,所述参考模型组件包括数据库操作单元、第一网络通信单元,所述数据库操作单元包括曲库查询模块、音强模型模块、音长模型模块、音色模型模块和音高模型模块;所述第一网络通信单元包括通讯线程调度模块、请求解析模块、数据分发模块和请求回复模块;所述实时评价组件包括第二网络通信单元、资源下载单元、评分业务单元、评分计算单元;所述第二网络通信单元包括连接状态管理模块、数据请求收发模块、回复信息解析模块;所述资源下载单元包括FTP协议解析模块、数据有效性验证模块;所述评分业务单元包括播放控制模块、音频播放模块、歌谱文件解析模块、录音缓存模块、音乐考试界面绘制模块;所述评分计算单元包括基频提取模块、音高AD转换模块、音强AD转换模块、音长AD转换模块、音色AD转换模块、相似度对比模块和得分计算模块。
8.根据权利要求7所述的一种音乐考试评定系统,其特征在于:所述相似度对比模块包括边界对齐模块、字音对齐模块。
9.根据权利要求8所述的一种音乐考试评定系统,其特征在于:所述得分计算模块包括音高得分计算模块、音长得分计算模块、音强得分计算模块、音色得分计算模块和加权计算模块。
10.根据权利要求9所述的一种音乐考试评定系统,其特征在于:所述音乐评定系统还包括反馈组件,所述反馈组件包括开闭模块、音强反馈模块、音高反馈模块、音长反馈模块和音色反馈模块。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711138157.0A CN107818796A (zh) | 2017-11-16 | 2017-11-16 | 一种音乐考试评定方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711138157.0A CN107818796A (zh) | 2017-11-16 | 2017-11-16 | 一种音乐考试评定方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107818796A true CN107818796A (zh) | 2018-03-20 |
Family
ID=61609798
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711138157.0A Pending CN107818796A (zh) | 2017-11-16 | 2017-11-16 | 一种音乐考试评定方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107818796A (zh) |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108364528A (zh) * | 2018-04-17 | 2018-08-03 | 南通理工学院 | 钢琴弹奏音符矫正系统及方法 |
CN108630179A (zh) * | 2018-05-09 | 2018-10-09 | 京东方科技集团股份有限公司 | 一种基于生物信号的音乐生成方法及系统 |
CN109036352A (zh) * | 2018-06-29 | 2018-12-18 | 广州视源电子科技股份有限公司 | 翻谱方法、翻谱器、移动终端及存储介质 |
CN109273025A (zh) * | 2018-11-02 | 2019-01-25 | 中国地质大学(武汉) | 一种中国民族五声调式情感识别方法及系统 |
CN109300485A (zh) * | 2018-11-19 | 2019-02-01 | 北京达佳互联信息技术有限公司 | 音频信号的评分方法、装置、电子设备及计算机存储介质 |
CN109360583A (zh) * | 2018-11-13 | 2019-02-19 | 无锡冰河计算机科技发展有限公司 | 一种音色评定方法和装置 |
CN109410971A (zh) * | 2018-11-13 | 2019-03-01 | 无锡冰河计算机科技发展有限公司 | 一种美化声音的方法和装置 |
CN109710798A (zh) * | 2018-12-28 | 2019-05-03 | 北京金山安全软件有限公司 | 曲目演奏考评方法和装置 |
CN109754818A (zh) * | 2019-03-15 | 2019-05-14 | 林超 | 一种发声检测和发声练习方法 |
CN110277106A (zh) * | 2019-06-21 | 2019-09-24 | 北京达佳互联信息技术有限公司 | 音频质量确定方法、装置、设备及存储介质 |
CN110364180A (zh) * | 2019-06-06 | 2019-10-22 | 北京容联易通信息技术有限公司 | 一种基于音视频处理的考试系统及方法 |
CN110600057A (zh) * | 2019-09-02 | 2019-12-20 | 深圳市平均律科技有限公司 | 演奏声音信息和曲谱信息比对方法及比对系统 |
CN110853675A (zh) * | 2019-10-24 | 2020-02-28 | 广州大学 | 一种音乐联觉绘画的装置及其实现方法 |
CN112201100A (zh) * | 2020-10-27 | 2021-01-08 | 暨南大学 | 一种中小学艺术素质测评中音乐演唱评分系统和方法 |
CN112837698A (zh) * | 2020-12-30 | 2021-05-25 | 福建星网视易信息系统有限公司 | 一种演唱或演奏评价方法、装置和计算机可读存储介质 |
CN115860591A (zh) * | 2023-03-03 | 2023-03-28 | 济南大学 | 一种实验操作ai考试评分方法及系统 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1619642A (zh) * | 2004-11-24 | 2005-05-25 | 王逸驰 | 合成器中的多维矢量合成技术 |
CN1677486A (zh) * | 2004-04-01 | 2005-10-05 | 凌阳科技股份有限公司 | 自动音源评分方法及装置 |
CN1758329A (zh) * | 2005-11-11 | 2006-04-12 | 常乐 | 多功能电子乐谱播放器 |
CN101645268A (zh) * | 2009-08-19 | 2010-02-10 | 李宋 | 一种演唱和演奏的计算机实时分析系统 |
CN101894552A (zh) * | 2010-07-16 | 2010-11-24 | 安徽科大讯飞信息科技股份有限公司 | 基于语谱切分的唱歌评测系统 |
CN102053998A (zh) * | 2009-11-04 | 2011-05-11 | 周明全 | 一种利用声音方式检索歌曲的方法及系统装置 |
CN102664017A (zh) * | 2012-04-25 | 2012-09-12 | 武汉大学 | 一种3d音频质量客观评价方法 |
CN103366784A (zh) * | 2013-07-16 | 2013-10-23 | 湖南大学 | 具有语音控制和哼唱检索功能的多媒体播放方法及装置 |
CN103854644A (zh) * | 2012-12-05 | 2014-06-11 | 中国传媒大学 | 单声道多音音乐信号的自动转录方法及装置 |
CN104282316A (zh) * | 2013-07-01 | 2015-01-14 | 亿览在线网络技术(北京)有限公司 | 一种基于语音匹配的k歌计分方法和装置 |
-
2017
- 2017-11-16 CN CN201711138157.0A patent/CN107818796A/zh active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1677486A (zh) * | 2004-04-01 | 2005-10-05 | 凌阳科技股份有限公司 | 自动音源评分方法及装置 |
CN1619642A (zh) * | 2004-11-24 | 2005-05-25 | 王逸驰 | 合成器中的多维矢量合成技术 |
CN1758329A (zh) * | 2005-11-11 | 2006-04-12 | 常乐 | 多功能电子乐谱播放器 |
CN101645268A (zh) * | 2009-08-19 | 2010-02-10 | 李宋 | 一种演唱和演奏的计算机实时分析系统 |
CN102053998A (zh) * | 2009-11-04 | 2011-05-11 | 周明全 | 一种利用声音方式检索歌曲的方法及系统装置 |
CN101894552A (zh) * | 2010-07-16 | 2010-11-24 | 安徽科大讯飞信息科技股份有限公司 | 基于语谱切分的唱歌评测系统 |
CN102664017A (zh) * | 2012-04-25 | 2012-09-12 | 武汉大学 | 一种3d音频质量客观评价方法 |
CN103854644A (zh) * | 2012-12-05 | 2014-06-11 | 中国传媒大学 | 单声道多音音乐信号的自动转录方法及装置 |
CN104282316A (zh) * | 2013-07-01 | 2015-01-14 | 亿览在线网络技术(北京)有限公司 | 一种基于语音匹配的k歌计分方法和装置 |
CN103366784A (zh) * | 2013-07-16 | 2013-10-23 | 湖南大学 | 具有语音控制和哼唱检索功能的多媒体播放方法及装置 |
Non-Patent Citations (1)
Title |
---|
刘宇翔: ""基于内容的音乐分析研究"", 《中国博士学位论文全文数据库信息科技辑》 * |
Cited By (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108364528A (zh) * | 2018-04-17 | 2018-08-03 | 南通理工学院 | 钢琴弹奏音符矫正系统及方法 |
CN108630179A (zh) * | 2018-05-09 | 2018-10-09 | 京东方科技集团股份有限公司 | 一种基于生物信号的音乐生成方法及系统 |
CN109036352A (zh) * | 2018-06-29 | 2018-12-18 | 广州视源电子科技股份有限公司 | 翻谱方法、翻谱器、移动终端及存储介质 |
CN109273025A (zh) * | 2018-11-02 | 2019-01-25 | 中国地质大学(武汉) | 一种中国民族五声调式情感识别方法及系统 |
CN109410971B (zh) * | 2018-11-13 | 2021-08-31 | 无锡冰河计算机科技发展有限公司 | 一种美化声音的方法和装置 |
CN109410971A (zh) * | 2018-11-13 | 2019-03-01 | 无锡冰河计算机科技发展有限公司 | 一种美化声音的方法和装置 |
CN109360583A (zh) * | 2018-11-13 | 2019-02-19 | 无锡冰河计算机科技发展有限公司 | 一种音色评定方法和装置 |
CN109360583B (zh) * | 2018-11-13 | 2021-10-26 | 无锡冰河计算机科技发展有限公司 | 一种音色评定方法和装置 |
CN109300485A (zh) * | 2018-11-19 | 2019-02-01 | 北京达佳互联信息技术有限公司 | 音频信号的评分方法、装置、电子设备及计算机存储介质 |
CN109300485B (zh) * | 2018-11-19 | 2022-06-10 | 北京达佳互联信息技术有限公司 | 音频信号的评分方法、装置、电子设备及计算机存储介质 |
CN109710798A (zh) * | 2018-12-28 | 2019-05-03 | 北京金山安全软件有限公司 | 曲目演奏考评方法和装置 |
CN109754818A (zh) * | 2019-03-15 | 2019-05-14 | 林超 | 一种发声检测和发声练习方法 |
CN109754818B (zh) * | 2019-03-15 | 2021-11-26 | 林超 | 一种发声检测和发声练习方法 |
CN110364180A (zh) * | 2019-06-06 | 2019-10-22 | 北京容联易通信息技术有限公司 | 一种基于音视频处理的考试系统及方法 |
CN110364180B (zh) * | 2019-06-06 | 2021-10-22 | 北京容联易通信息技术有限公司 | 一种基于音视频处理的考试系统及方法 |
CN110277106A (zh) * | 2019-06-21 | 2019-09-24 | 北京达佳互联信息技术有限公司 | 音频质量确定方法、装置、设备及存储介质 |
CN110277106B (zh) * | 2019-06-21 | 2021-10-22 | 北京达佳互联信息技术有限公司 | 音频质量确定方法、装置、设备及存储介质 |
CN110600057B (zh) * | 2019-09-02 | 2021-12-10 | 深圳市平均律科技有限公司 | 演奏声音信息和曲谱信息比对方法及比对系统 |
CN110600057A (zh) * | 2019-09-02 | 2019-12-20 | 深圳市平均律科技有限公司 | 演奏声音信息和曲谱信息比对方法及比对系统 |
CN110853675A (zh) * | 2019-10-24 | 2020-02-28 | 广州大学 | 一种音乐联觉绘画的装置及其实现方法 |
CN112201100A (zh) * | 2020-10-27 | 2021-01-08 | 暨南大学 | 一种中小学艺术素质测评中音乐演唱评分系统和方法 |
CN112837698A (zh) * | 2020-12-30 | 2021-05-25 | 福建星网视易信息系统有限公司 | 一种演唱或演奏评价方法、装置和计算机可读存储介质 |
CN115860591A (zh) * | 2023-03-03 | 2023-03-28 | 济南大学 | 一种实验操作ai考试评分方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107818796A (zh) | 一种音乐考试评定方法及系统 | |
CN107967827A (zh) | 一种音乐教育练习系统及其方法 | |
Beament | How we hear music: The relationship between music and the hearing mechanism | |
JPH06102877A (ja) | 音響構成装置 | |
JPH11513820A (ja) | 音声合成のための制御構造 | |
CN101441865A (zh) | 演唱类游戏的评分方法及系统 | |
JP6420345B2 (ja) | 音源評価方法、これに使用される演奏情報分析方法及び記録媒体並びにこれを利用した音源の評価装置 | |
CN112289300B (zh) | 音频处理方法、装置及电子设备和计算机可读存储介质 | |
CN106997765A (zh) | 人声音色的定量表征方法 | |
Schneider | Pitch and pitch perception | |
Wise | Yodel species: a typology of falsetto effects in popular music vocal styles | |
Shen et al. | Solfeggio Teaching Method Based on MIDI Technology in the Background of Digital Music Teaching | |
Liu et al. | Research on the Correlation Between the Timbre Attributes of Musical Sound and Visual Color | |
Mazzola et al. | Basic Music Technology | |
KR102118189B1 (ko) | 미디어 컨텐츠 서비스 시스템 | |
King et al. | Vocal matching of frequency modulation in synthesized vowels | |
Cazden | The systemic reference of musical consonance response | |
Gu | Recognition algorithm of piano playing music in intelligent background | |
Shiliang | The research on the singing voice Timbre of the eastern Yugur traditional folk songs | |
DE60022343T2 (de) | Durch sprache gesteuertes elektronisches musikinstrument | |
Liu et al. | Comparison and Analysis of Timbre Fusion for Chinese and Western Musical Instruments | |
CN109754818B (zh) | 一种发声检测和发声练习方法 | |
CN203165441U (zh) | 交响乐器 | |
Wang et al. | Beijing opera synthesis based on straight algorithm and deep learning | |
Kehrakos et al. | A reliable singing voice-driven MIDI controller using electroglottographic signal |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20180320 |
|
RJ01 | Rejection of invention patent application after publication |