CN110120216B - 用于演唱评价的音频数据处理方法及装置 - Google Patents
用于演唱评价的音频数据处理方法及装置 Download PDFInfo
- Publication number
- CN110120216B CN110120216B CN201910357284.2A CN201910357284A CN110120216B CN 110120216 B CN110120216 B CN 110120216B CN 201910357284 A CN201910357284 A CN 201910357284A CN 110120216 B CN110120216 B CN 110120216B
- Authority
- CN
- China
- Prior art keywords
- singer
- singing
- audio data
- evaluation
- stability
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000011156 evaluation Methods 0.000 title claims abstract description 220
- 238000003672 processing method Methods 0.000 title claims abstract description 29
- 230000001419 dependent effect Effects 0.000 claims description 6
- 238000000034 method Methods 0.000 abstract description 26
- 230000004069 differentiation Effects 0.000 description 7
- 230000000694 effects Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000003252 repetitive effect Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 1
- 238000012854 evaluation process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000004148 unit process Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/01—Assessment or evaluation of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/10—Speech classification or search using distance or distortion measures between unknown speech and reference templates
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Reverberation, Karaoke And Other Acoustics (AREA)
Abstract
本申请公开了一种用于演唱评价的音频数据处理方法及装置。该方法包括获取演唱者的音频数据;根据所述音频数据,对演唱者在每一个音符内的音频特征进行处理;得到演唱者的演唱稳定性评价结果。本申请解决了对于演唱评价缺乏客观性的技术问题。通过本申请可以对演唱稳定性进行客观、快速评价。此外,本申请适用于唱歌类的手机应用。
Description
技术领域
本申请涉及音频数据处理领域,具体而言,涉及一种用于演唱评价的音频数据处理方法及装置。
背景技术
在歌曲演唱评价系统中,通常会对于演唱的稳定性进行评价。
发明人发现,对于演唱评价,存在评价结果主观性强,效率低的缺点。进一步,也无法适用于唱歌类的手机应用。
针对相关技术中对于演唱评价缺乏客观性的问题,目前尚未提出有效的解决方案。
发明内容
本申请的主要目的在于提供一种用于演唱评价的音频数据处理方法及装置,以解决对于演唱评价缺乏客观性的问题。
为了实现上述目的,根据本申请的第一方面,提供了一种用于演唱评价的音频数据处理方法。
根据本申请的用于演唱评价的音频数据处理方法包括:获取演唱者的音频数据;根据所述音频数据,对演唱者在每一个音符内的音频特征进行处理;得到演唱者的演唱稳定性评价结果。
进一步地,根据所述音频数据,对演唱者在每一个音符内的音频特征进行处理包括:根据所述音频数据,对演唱者在每一个音符内的音高特征进行处理;得到演唱者的演唱稳定性评价结果包括:得到演唱者的音高稳定性评价结果。
进一步地,根据所述音频数据,对演唱者在每一个音符内的音频特征进行处理包括:根据所述音频数据,对演唱者在每一个音符内的音量特征进行处理;
得到演唱者的演唱稳定性评价结果包括:得到演唱者的音量稳定性评价结果。
进一步地,根据所述音频数据,对演唱者在每一个音符内的音频特征进行处理包括:根据所述音频数据,对演唱者在每一个音符内的音量平滑度进行处理;得到演唱者的演唱稳定性评价结果包括:得到演唱者的音量平滑度评价结果。
进一步地,根据所述音频数据,对演唱者在每一个音符内的音频特征进行处理包括:根据所述音频数据,对演唱者在不同时刻演唱同一音符时的重复内容进行处理;得到演唱者的演唱稳定性评价结果包括:得到演唱者的重复稳定性评价结果。
进一步地,得到演唱者的演唱稳定性评价结果包括:获取所有满足演唱稳定性评价指标的音符,并结合所述音频数据中所有音符进行打分;根据所述打分结果,对演唱稳定程度进行量化。
进一步地,获取演唱者的音频数据之后,还包括:获取与所述演唱者的音频数据相同的第二演唱者的歌曲音频数据;将所述第二演唱者的歌曲音频数据配置为评价模板;根据所述评价模板与所述演唱者的音频数据中的音频特征差异化程度,得到演唱者的演唱稳定性评价结果。
为了实现上述目的,根据本申请的第二方面,提供了一种用于演唱评价的音频数据处理装置。
根据本申请的用于演唱评价的音频数据处理装置包括:获取模块,用于获取演唱者的音频数据;处理模块,用于根据所述音频数据,对演唱者在每一个音符内的音频特征进行处理;评价模块,用于得到演唱者的演唱稳定性评价结果。
进一步地,所述处理模块,包括:第一特征单元,第二特征单元,第三特征单元,第四特征单元,所述评价模块包括:第一评价单元,第二评价单元,第三评价单元,第四评价单元,在所述第一特征单元根据所述音频数据,对演唱者在每一个音符内的音高特征进行处理,在所述第一评价单元得到演唱者的音高稳定性评价结果;在所述第二特征单元根据所述音频数据,对演唱者在每一个音符内的音量特征进行处理,在所述第二评价单元得到演唱者的音量稳定性评价结果;在所述第三特征单元根据所述音频数据,对演唱者在每一个音符内的音量平滑度进行处理,在所述第三评价单元得到演唱者的音量平滑度评价结果;在所述第四特征单元根据所述音频数据,对演唱者在不同时刻演唱同一音符时的重复内容进行处理;在所述第四评价单元得到演唱者的重复稳定性评价结果。
进一步地,所述装置还包括:第二评价模块,所述第二评价模块包括:获取单元,用于获取与所述演唱者的音频数据相同的第二演唱者的歌曲音频数据;模板配置单元,用于将所述第二演唱者的歌曲音频数据配置为评价模板;模板评价单元,用于根据所述评价模板与所述演唱者的音频数据中的音频特征差异化程度,得到演唱者的演唱稳定性评价结果。
为了实现上述目的,根据本申请的第三方面,本申请提供一种用于演唱评价的音频数据处理的设备,该设备包括处理器、显示器、存储器、网络接口和总线系统,其中,处理器、显示器、存储器、网络接口通过总线系统相互连接。该存储器用于存储指令,该处理器用于执行该存储器存储的指令,当该指令被执行时,该处理器通过该网络接口执行第一方面或第一方面的任意可能的实现方式中的方法。
为了实现上述目的,根据本申请的第四方面,本申请提供一种计算机可读介质,用于存储计算机程序,该计算机程序包括用于执行用于演唱评价的音频数据处理方法的指令。
在本申请实施例中用于演唱评价的音频数据处理方法及装置,采用获取演唱者的音频数据的方式,通过根据所述音频数据,对演唱者在每一个音符内的音频特征进行处理,达到了得到演唱者的演唱稳定性评价结果的目的,从而实现了对于演唱稳定性进行客观、快速评价的技术效果,进而解决了对于演唱评价缺乏客观性的技术问题。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请第一实施例中的用于演唱评价的音频数据处理方法流程示意图;
图2是根据本申请第二实施例中的用于演唱评价的音频数据处理方法流程示意图;
图3是根据本申请第三实施例中的用于演唱评价的音频数据处理方法流程示意图;
图4是根据本申请第四实施例中的用于演唱评价的音频数据处理方法流程示意图;
图5是根据本申请第五实施例中的用于演唱评价的音频数据处理方法流程示意图;
图6是根据本申请第六实施例中的用于演唱评价的音频数据处理方法流程示意图;
图7是根据本申请第一实施例中的用于演唱评价的音频数据处理装置结构示意图;
图8是根据本申请第二实施例中的用于演唱评价的音频数据处理装置结构示意图;
图9是根据本申请第三实施例中的用于演唱评价的音频数据处理装置结构示意图;
图10是音高稳定性示意图;
图11是音量稳定性示意图;
图12是音量平滑度示意图;
图13是重复稳定性示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
本申请中的用于演唱评价的音频数据处理方法中演唱稳定性评价结果中的指标既都单独体现了演唱稳定性的一个方面,即可以单独作为稳定性的评价指标。又可以通过组合获取更全面的评价指标,且所有评价指标的设定只依赖演唱者自身的演唱音频信息而不需要其他演唱者的演唱音频信息。与现有演唱评价系统相比,在本申请中提出了对于演唱者演唱稳定性的评价指标和与之对应的评价方法,且在评价过程中只需要演唱者自身的演唱音频信息。本申请具有评价速度快,结果一致性强的技术效果。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
如图1所示,该方法包括如下的步骤S102至步骤S106:
步骤S102,获取演唱者的音频数据;
获取演唱者的音频数据时可以通过本地直接获取或者通过实时录制获取。
需要注意的是,所述音频数据可以是一个演唱者或两个以上的演唱者的音频数据,只要能够满足音频数据要求即可,在本申请中并不进行限定。
具体地,演唱者通过唱歌类的手机应用进行演唱时,获取得到当前演唱者在演唱整首歌曲的音频数据信息。
步骤S104,根据所述音频数据,对演唱者在每一个音符内的音频特征进行处理;
根据所述音频数据,对于当前所述演唱者在所述音频数据的每一个音符内的特定的音频特征进行处理。可以理解,所述音频数据即是通过所述多个音符构成的。在对每一个音符内的音频特征进行处理之后,可以汇总得到处理结果。
步骤S106,得到演唱者的演唱稳定性评价结果。
通过对于不同音频特征维度的评价指标,可以得到所述演唱者的演唱稳定性评价结果。在本申请的实施例中所述演唱稳定性按照多个不同维度的评价指标和对应的预设评价方法进行计算后,最后输出可体现演唱稳定性的一个方面的评价结果。
需要注意的是,所述演唱者的演唱稳定性评价结果可以单一音频特征的演唱稳定性评价结果,也可以是组合的音频特征的演唱稳定性评价结果,在本申请的实施例中并不进行具体限定,只要能够满足评价要求即可。
从以上的描述中,可以看出,本申请实现了如下技术效果:
在本申请实施例中采用获取演唱者的音频数据的方式,通过根据所述音频数据,对演唱者在每一个音符内的音频特征进行处理,达到了得到演唱者的演唱稳定性评价结果的目的,从而实现了对于演唱稳定性进行客观、快速评价的技术效果,进而解决了对于演唱评价缺乏客观性的技术问题。
根据本申请实施例,作为本实施例中的优选,如图2所示,根据所述音频数据,对演唱者在每一个音符内的音频特征进行处理包括:
步骤S202,根据所述音频数据,对演唱者在每一个音符内的音高特征进行处理;
得到演唱者的演唱稳定性评价结果包括:
步骤S204,得到演唱者的音高稳定性评价结果。
所述音高稳定性是指演唱者在演唱时(过程中)应该完整且稳定地唱出每一个音符所对应的音高,通过计算演唱者演唱的音频数据信息中每一个音符内音高的若干统计量比如,均值、标准差等,并通过设定的评价规则,判定演唱者演唱的每一个音符在音高这个维度上是否稳定。
具体地,如图10所示,在一个音符中与频率均值的差异超过标准差的频率点即图10中不稳定的点的个数占频率点总数的比例大于所设定的阈值时,判定演唱者A演唱的这个音符在音高上不稳定。在图10中,在一个音符内共有8个频率点即图10中的空心圆点,上方有2个频率点和均值的差异超过了标准差,作为不稳定的点。故,在所述音符中,不稳定的点占频率点总数的比例为25%,如果先验设定的阈值为50%,则判断这该音符在音高上是稳定的。
即通过不稳定点的个数占所有频率点中的个数,判断在所述音符中音高是否稳定。
本申请实施例中的方法,对于演唱稳定性的评价是基于演唱者自身的演唱音频信息进行的,不依赖于其他任何演唱者的演唱音频信息。
根据本申请实施例,作为本实施例中的优选,如图3所示,根据所述音频数据,对演唱者在每一个音符内的音频特征进行处理包括:
步骤S302,根据所述音频数据,对演唱者在每一个音符内的音量特征进行处理;
得到演唱者的演唱稳定性评价结果包括:
步骤S304,得到演唱者的音量稳定性评价结果。
所述音量稳定性是指演唱者在演唱时应该完整且稳定地唱出每一个音符所对应的音量。通过将演唱者演唱音频信息中每一个音符分为前、中、后三段,再计算每一段内音量的若干统计量比如,均值、标准差等,并设定的评价规则,判定演唱者演唱的每一个音符在音量这个维度上是否稳定。
需要注意的,本领域技术人员可以根据实际使用情况对评价规则进行配置,在本申请的实施例中并不进行限定。
具体地,如图11所示,如果在一个音符中的前、中、后三段的音量在均值上的变化幅度大于所设定的阈值,就判定演唱者A演唱的这个音符在音量上不稳定。在图11中,在前、中、后三段的均值分别为0.3、0.9和0.5,则前、后两段与中段段音量比值分别为1/3和5/9。如果先验设定的阈值为0.5,则变化幅度在阈值范围内,认为这个音符在音量上是稳定的。
本申请实施例中的方法,对于演唱稳定性的评价是基于演唱者自身的演唱音频信息进行的,不依赖于其他任何演唱者的演唱音频信息。
根据本申请实施例,作为本实施例中的优选,如图4所示,根据所述音频数据,对演唱者在每一个音符内的音频特征进行处理包括:
步骤S402,根据所述音频数据,对演唱者在每一个音符内的音量平滑度进行处理;
得到演唱者的演唱稳定性评价结果包括:
步骤S404,得到演唱者的音量平滑度评价结果。
所述音量平滑度是指演唱者在演唱时应该平稳且圆润地唱出每一个音符,通过计算演唱者演唱音频信息中每一个音符内音量的波动曲线,检测其中包含的频率成分,并依照所设定的阈值滤除一定的高频成分,得到一个新的波动曲线,通过计算与原波动曲线之间的差异,判定演唱者演唱的每一个音符的音量是否平滑。
需要注意的,本领域技术人员可以根据实际使用情况对相关阈值进行判断,在本申请的实施例中并不进行限定。
具体地,在图12中给出了原波动曲线和滤除高频后的波动曲线,由图可知,在滤除高频之后,波动曲线变得更平滑了。如果逐点计算两条曲线之间的距离并取平均值之后,可以得到两条曲线之间的差异。假如在图12中两条曲线的平均距离为0.02,同时设定阈值为0.05,则该音符在音量上是平滑的。如果大于设定阈值,则是非平滑的。
本申请实施例中的方法,对于演唱稳定性的评价是基于演唱者自身的演唱音频信息进行的,不依赖于其他任何演唱者的演唱音频信息。
根据本申请实施例,作为本实施例中的优选,如图5所示,根据所述音频数据,对演唱者在每一个音符内的音频特征进行处理包括:
步骤S502,根据所述音频数据,对演唱者在不同时刻演唱同一音符时的重复内容进行处理;
得到演唱者的演唱稳定性评价结果包括:
步骤S504,得到演唱者的重复稳定性评价结果。
所述重复稳定性是指演唱者在演唱时应该像大多数乐器一样稳定,对于同样的音符在不同场景下的演唱结果应该保持一致,通过计算演唱者演唱音频信息中存在的重复内容之间的差异,设定相应的判定规则,判定演唱者在演唱时的重复稳定性。
需要注意的,本领域技术人员可以根据实际使用情况对相关判定规则进行配置,在本申请的实施例中并不进行限定。
具体地,在图13中上下为两个相同的音符在不同时刻由同一位演唱者B进行的两次演唱,如图所示在第二个点的坐标一个为0.6,另一个为0.5,则两点之间的差异为0.1,计算两个音符中所有点差异的平均值。在图13中,假设这个差异是0.08,设定的阈值为0.1,那么重复内容间的差异小于设定的阈值,这两个重复的音符是稳定的。反之,重复稳定性则是不稳定的。
本申请实施例中的方法,对于演唱稳定性的评价是基于演唱者自身的演唱音频信息进行的,不依赖于其他任何演唱者的演唱音频信息。
根据本申请实施例,作为本实施例中的优选,得到演唱者的演唱稳定性评价结果包括:获取所有满足演唱稳定性评价指标的音符,并结合所述音频数据中所有音符进行打分;根据所述打分结果,对演唱稳定程度进行量化。
对所述演唱稳定程度进行量化可以是,音高稳定性、音量稳定性、音量平滑度、重复稳定性。
具体地,通过打分结果得到的每个评价规则得到的符合要求的音符对应相应的分数。从而可以通过分数去刻画稳定的程度。比如,音频数据中一共有100个音符,如果有90个音符稳定,则打分分数为90分。从而根据所述打分结果,实现对演唱稳定程度的量化。
根据本申请实施例,作为本实施例中的优选,如图6所示,获取演唱者的音频数据之后,还包括:
步骤S602,获取与所述演唱者的音频数据相同的第二演唱者的歌曲音频数据;
所述第二演唱者是指某些歌曲的原唱或者特定的演唱者。
步骤S604,将所述第二演唱者的歌曲音频数据配置为评价模板;
通过将所述第二演唱者的歌曲音频数据配置为评价模板后可以对与所述演唱者的演唱稳定性进行评价。
步骤S606,根据所述评价模板与所述演唱者的音频数据中的音频特征差异化程度,得到演唱者的演唱稳定性评价结果。
所述演唱者的演唱稳定性评价结果为综合评价指标,可以包括多个音频特征的差异化程度的评估结果。
具体地,如果对于对特定的歌曲,可以使用某个歌手的演唱音频信息作为模板,通过计算待评价演唱者与模板的音频特征差异大小,从而来判定待评价演唱者的演唱稳定性。
优选地,本申请实施例的用于演唱评价的音频数据处理方法,包括:
获取演唱者的音频数据;
根据所述音频数据,对演唱者在每一个音符内的音频特征进行处理;
得到演唱者的演唱稳定性评价结果。
根据所述音频数据,对演唱者在每一个音符内的音频特征进行处理包括:
根据所述音频数据,对演唱者在每一个音符内的音高特征进行处理;
得到演唱者的演唱稳定性评价结果包括:
得到演唱者的音高稳定性评价结果。
根据所述音频数据,对演唱者在每一个音符内的音频特征进行处理包括:
根据所述音频数据,对演唱者在每一个音符内的音量特征进行处理;
得到演唱者的演唱稳定性评价结果包括:
得到演唱者的音量稳定性评价结果。
根据所述音频数据,对演唱者在每一个音符内的音频特征进行处理包括:
根据所述音频数据,对演唱者在每一个音符内的音量平滑度进行处理;
得到演唱者的演唱稳定性评价结果包括:
得到演唱者的音量平滑度评价结果。
根据所述音频数据,对演唱者在每一个音符内的音频特征进行处理包括:
根据所述音频数据,对演唱者在不同时刻演唱同一音符时的重复内容进行处理;
得到演唱者的演唱稳定性评价结果包括:
得到演唱者的重复稳定性评价结果。
优选地,本申请实施例的用于演唱评价的音频数据处理方法,包括:
获取演唱者的音频数据;
根据所述音频数据,对演唱者在每一个音符内的音频特征进行处理;
得到演唱者的演唱稳定性评价结果。
根据所述音频数据,对演唱者在每一个音符内的音频特征进行处理包括:
根据所述音频数据,对演唱者在每一个音符内的音高特征进行处理;
得到演唱者的演唱稳定性评价结果包括:
得到演唱者的音高稳定性评价结果。
根据所述音频数据,对演唱者在每一个音符内的音频特征进行处理包括:
根据所述音频数据,对演唱者在每一个音符内的音量特征进行处理;
得到演唱者的演唱稳定性评价结果包括:
得到演唱者的音量稳定性评价结果。
优选地,本申请实施例的用于演唱评价的音频数据处理方法,包括:
获取演唱者的音频数据;
根据所述音频数据,对演唱者在每一个音符内的音频特征进行处理;
得到演唱者的演唱稳定性评价结果。
根据所述音频数据,对演唱者在每一个音符内的音频特征进行处理包括:
根据所述音频数据,对演唱者在每一个音符内的音量特征进行处理;
得到演唱者的演唱稳定性评价结果包括:
得到演唱者的音量稳定性评价结果。
根据所述音频数据,对演唱者在每一个音符内的音频特征进行处理包括:
根据所述音频数据,对演唱者在每一个音符内的音量平滑度进行处理;
得到演唱者的演唱稳定性评价结果包括:
得到演唱者的音量平滑度评价结果。
优选地,本申请实施例的用于演唱评价的音频数据处理方法,包括:
获取演唱者的音频数据;
根据所述音频数据,对演唱者在每一个音符内的音频特征进行处理;
得到演唱者的演唱稳定性评价结果。
根据所述音频数据,对演唱者在每一个音符内的音频特征进行处理包括:
根据所述音频数据,对演唱者在不同时刻演唱同一音符时的重复内容进行处理;
得到演唱者的演唱稳定性评价结果包括:
得到演唱者的重复稳定性评价结果。
获取演唱者的音频数据之后,还包括:
获取与所述演唱者的音频数据相同的第二演唱者的歌曲音频数据;
将所述第二演唱者的歌曲音频数据配置为评价模板;
根据所述评价模板与所述演唱者的音频数据中的音频特征差异化程度,得到演唱者的演唱稳定性评价结果。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
根据本申请实施例,还提供了一种用于实施上述方法的用于演唱评价的音频数据处理装置,如图7所示,该装置包括:获取模块10,用于获取演唱者的音频数据;处理模块20,用于根据所述音频数据,对演唱者在每一个音符内的音频特征进行处理;评价模块30,用于得到演唱者的演唱稳定性评价结果。
本申请实施例的获取模块10中获取演唱者的音频数据时可以通过本地直接获取或者通过实时录制获取。
需要注意的是,所述音频数据可以是一个演唱者或两个以上的演唱者的音频数据,只要能够满足音频数据要求即可,在本申请中并不进行限定。
具体地,演唱者通过唱歌类的手机应用进行演唱时,获取得到当前演唱者在演唱整首歌曲的音频数据信息。
本申请实施例的处理模块20中根据所述音频数据,对于当前所述演唱者在所述音频数据的每一个音符内的特定的音频特征进行处理。可以理解,所述音频数据即是通过所述多个音符构成的。在对每一个音符内的音频特征进行处理之后,可以汇总得到处理结果。
本申请实施例的评价模块30中通过对于不同音频特征维度的评价指标,可以得到所述演唱者的演唱稳定性评价结果。在本申请的实施例中所述演唱稳定性按照多个不同维度的评价指标和对应的预设评价方法进行计算后,最后输出可体现演唱稳定性的一个方面的评价结果。
需要注意的是,所述演唱者的演唱稳定性评价结果可以单一音频特征的演唱稳定性评价结果,也可以是组合的音频特征的演唱稳定性评价结果,在本申请的实施例中并不进行具体限定,只要能够满足评价要求即可。
根据本申请实施例,作为本实施例中的优选,所述处理模块,包括:第一特征单元201,第二特征单元202,第三特征单元203,第四特征单元204,所述评价模块包括:第一评价单元301,第二评价单元302,第三评价单元303,第四评价单元304,在所述第一特征单元根据所述音频数据,对演唱者在每一个音符内的音高特征进行处理,在所述第一评价单元得到演唱者的音高稳定性评价结果;在所述第二特征单元根据所述音频数据,对演唱者在每一个音符内的音量特征进行处理,在所述第二评价单元得到演唱者的音量稳定性评价结果;在所述第三特征单元根据所述音频数据,对演唱者在每一个音符内的音量平滑度进行处理,在所述第三评价单元得到演唱者的音量平滑度评价结果;在所述第四特征单元根据所述音频数据,对演唱者在不同时刻演唱同一音符时的重复内容进行处理;在所述第四评价单元得到演唱者的重复稳定性评价结果。
本申请实施例的所述第一特征单元201,所述第二评价单元301中所述音高稳定性是指演唱者在演唱时(过程中)应该完整且稳定地唱出每一个音符所对应的音高,通过计算演唱者演唱的音频数据信息中每一个音符内音高的若干统计量比如,均值、标准差等,并通过设定的评价规则,判定演唱者演唱的每一个音符在音高这个维度上是否稳定。
具体地,如图10所示,在一个音符中与频率均值的差异超过标准差的频率点即图10中不稳定的点的个数占频率点总数的比例大于所设定的阈值时,判定演唱者A演唱的这个音符在音高上不稳定。在图10中,在一个音符内共有8个频率点即图10中的空心圆点,上方有2个频率点和均值的差异超过了标准差,作为不稳定的点。故,在所述音符中,不稳定的点占频率点总数的比例为25%,如果先验设定的阈值为50%,则判断这该音符在音高上是稳定的。
即通过不稳定点的个数占所有频率点中的个数,判断在所述音符中音高是否稳定。
本申请实施例中的单元,对于演唱稳定性的评价是基于演唱者自身的演唱音频信息进行的,不依赖于其他任何演唱者的演唱音频信息。
本申请实施例的所述第一特征单元202,所述第二评价单元302中所述音量稳定性是指演唱者在演唱时应该完整且稳定地唱出每一个音符所对应的音量。通过将演唱者演唱音频信息中每一个音符分为前、中、后三段,再计算每一段内音量的若干统计量比如,均值、标准差等,并设定的评价规则,判定演唱者演唱的每一个音符在音量这个维度上是否稳定。
需要注意的,本领域技术人员可以根据实际使用情况对评价规则进行配置,在本申请的实施例中并不进行限定。
具体地,如图11所示,如果在一个音符中的前、中、后三段的音量在均值上的变化幅度大于所设定的阈值,就判定演唱者A演唱的这个音符在音量上不稳定。在图11中,在前、中、后三段的均值分别为0.3、0.9和0.5,则前、后两段与中段段音量比值分别为1/3和5/9。如果先验设定的阈值为0.5,则变化幅度在阈值范围内,认为这个音符在音量上是稳定的。
本申请实施例中的单元,对于演唱稳定性的评价是基于演唱者自身的演唱音频信息进行的,不依赖于其他任何演唱者的演唱音频信息。
本申请实施例的所述第一特征单元203,所述第二评价单元303中所述音量平滑度是指演唱者在演唱时应该平稳且圆润地唱出每一个音符,通过计算演唱者演唱音频信息中每一个音符内音量的波动曲线,检测其中包含的频率成分,并依照所设定的阈值滤除一定的高频成分,得到一个新的波动曲线,通过计算与原波动曲线之间的差异,判定演唱者演唱的每一个音符的音量是否平滑。
需要注意的,本领域技术人员可以根据实际使用情况对相关阈值进行判断,在本申请的实施例中并不进行限定。
具体地,在图12中给出了原波动曲线和滤除高频后的波动曲线,由图可知,在滤除高频之后,波动曲线变得更平滑了。如果逐点计算两条曲线之间的距离并取平均值之后,可以得到两条曲线之间的差异。假如在图12中两条曲线的平均距离为0.02,同时设定阈值为0.05,则该音符在音量上是平滑的。如果大于设定阈值,则是非平滑的。
本申请实施例中的单元,对于演唱稳定性的评价是基于演唱者自身的演唱音频信息进行的,不依赖于其他任何演唱者的演唱音频信息。
本申请实施例的所述第一特征单元204,所述第二评价单元304中所述重复稳定性是指演唱者在演唱时应该像大多数乐器一样稳定,对于同样的音符在不同场景下的演唱结果应该保持一致,通过计算演唱者演唱音频信息中存在的重复内容之间的差异,设定相应的判定规则,判定演唱者在演唱时的重复稳定性。
需要注意的,本领域技术人员可以根据实际使用情况对相关判定规则进行配置,在本申请的实施例中并不进行限定。
具体地,在图13中上下为两个相同的音符在不同时刻由同一位演唱者B进行的两次演唱,如图所示在第二个点的坐标一个为0.6,另一个为0.5,则两点之间的差异为0.1,计算两个音符中所有点差异的平均值。在图13中,假设这个差异是0.08,设定的阈值为0.1,那么重复内容间的差异小于设定的阈值,这两个重复的音符是稳定的。反之,重复稳定性则是不稳定的。
本申请实施例中的单元,对于演唱稳定性的评价是基于演唱者自身的演唱音频信息进行的,不依赖于其他任何演唱者的演唱音频信息。
根据本申请实施例,作为本实施例中的优选,如图9所述,所述装置还包括:第二评价模块40,所述第二评价模块40包括:获取单元401,用于获取与所述演唱者的音频数据相同的第二演唱者的歌曲音频数据;模板配置单元402,用于将所述第二演唱者的歌曲音频数据配置为评价模板;模板评价单元403,用于根据所述评价模板与所述演唱者的音频数据中的音频特征差异化程度,得到演唱者的演唱稳定性评价结果。
本申请实施例的获取单元401中所述第二演唱者是指某些歌曲的原唱或者特定的演唱者。
本申请实施例的模板配置单元402中通过将所述第二演唱者的歌曲音频数据配置为评价模板后可以对与所述演唱者的演唱稳定性进行评价。
本申请实施例的模板评价单元403中所述演唱者的演唱稳定性评价结果为综合评价指标,可以包括多个音频特征的差异化程度的评估结果。
具体地,如果对于对特定的歌曲,可以使用某个歌手的演唱音频信息作为模板,通过计算待评价演唱者与模板的音频特征差异大小,从而来判定待评价演唱者的演唱稳定性。
在本申请的另一实施例中,还提供过了本申请提供一种用于演唱评价的音频数据处理的设备,该设备包括处理器、显示器、存储器、网络接口和总线系统,其中,处理器、显示器、存储器、网络接口通过总线系统相互连接。该存储器用于存储指令,该处理器用于执行该存储器存储的指令,当该指令被执行时,该处理器通过该网络接口执行用于演唱评价的音频数据处理方法或用于演唱评价的音频数据处理方法的任意可能的实现方式中的方法。
在本申请的另一实施例中,本申请提供一种计算机可读介质,用于存储计算机程序,该计算机程序包括用于执行用于演唱评价的音频数据处理方法的指令。
显然,本领域的技术人员应该明白,上述的本申请的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本申请不限制于任何特定的硬件和软件结合。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (8)
1.一种用于演唱评价的音频数据处理方法,其特征在于,包括:
获取演唱者的音频数据;
根据所述音频数据,对演唱者在每一个音符内的音频特征进行处理;
得到演唱者的演唱稳定性评价结果,其中,所述演唱稳定性评价结果至少包括如下之一:音高稳定性评价结果、音量稳定性评价结果、音量平滑度评价结果、重复稳定性评价结果,对于所述演唱稳定性的评价是基于演唱者自身的演唱音频信息进行的,不依赖于其他任何演唱者的演唱音频信息。
2.根据权利要求1所述的音频数据处理方法,其特征在于,
根据所述音频数据,对演唱者在每一个音符内的音频特征进行处理包括:
根据所述音频数据,对演唱者在每一个音符内的音高特征进行处理;
得到演唱者的演唱稳定性评价结果包括:
得到演唱者的音高稳定性评价结果。
3.根据权利要求1所述的音频数据处理方法,其特征在于,
根据所述音频数据,对演唱者在每一个音符内的音频特征进行处理包括:
根据所述音频数据,对演唱者在每一个音符内的音量特征进行处理;
得到演唱者的演唱稳定性评价结果包括:
得到演唱者的音量稳定性评价结果。
4.根据权利要求1所述的音频数据处理方法,其特征在于,
根据所述音频数据,对演唱者在每一个音符内的音频特征进行处理包括:
根据所述音频数据,对演唱者在每一个音符内的音量平滑度进行处理;
得到演唱者的演唱稳定性评价结果包括:
得到演唱者的音量平滑度评价结果。
5.根据权利要求1所述的音频数据处理方法,其特征在于,
根据所述音频数据,对演唱者在每一个音符内的音频特征进行处理包括:
根据所述音频数据,对演唱者在不同时刻演唱同一音符时的重复内容进行处理;
得到演唱者的演唱稳定性评价结果包括:
得到演唱者的重复稳定性评价结果。
6.根据权利要求1所述的音频数据处理方法,其特征在于,得到演唱者的演唱稳定性评价结果包括:
获取所有满足演唱稳定性评价指标的音符,并结合所述音频数据中所有音符进行打分;
根据所述打分结果,对演唱稳定程度进行量化。
7.一种用于演唱评价的音频数据处理装置,其特征在于,包括:
获取模块,用于获取演唱者的音频数据;
处理模块,用于根据所述音频数据,对演唱者在每一个音符内的音频特征进行处理;
评价模块,用于得到演唱者的演唱稳定性评价结果,其中,所述演唱稳定性评价结果至少包括如下之一:音高稳定性评价结果、音量稳定性评价结果、音量平滑度评价结果、重复稳定性评价结果,对于所述演唱稳定性的评价是基于演唱者自身的演唱音频信息进行的,不依赖于其他任何演唱者的演唱音频信息。
8.根据权利要求7所述的音频数据处理装置,其特征在于,所述处理模块,包括:第一特征单元,第二特征单元,第三特征单元,第四特征单元,所述评价模块包括:第一评价单元,第二评价单元,第三评价单元,第四评价单元,
在所述第一特征单元根据所述音频数据,对演唱者在每一个音符内的音高特征进行处理,在所述第一评价单元得到演唱者的音高稳定性评价结果;
在所述第二特征单元根据所述音频数据,对演唱者在每一个音符内的音量特征进行处理,在所述第二评价单元得到演唱者的音量稳定性评价结果;
在所述第三特征单元根据所述音频数据,对演唱者在每一个音符内的音量平滑度进行处理,在所述第三评价单元得到演唱者的音量平滑度评价结果;
在所述第四特征单元根据所述音频数据,对演唱者在不同时刻演唱同一音符时的重复内容进行处理;在所述第四评价单元得到演唱者的重复稳定性评价结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910357284.2A CN110120216B (zh) | 2019-04-29 | 2019-04-29 | 用于演唱评价的音频数据处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910357284.2A CN110120216B (zh) | 2019-04-29 | 2019-04-29 | 用于演唱评价的音频数据处理方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110120216A CN110120216A (zh) | 2019-08-13 |
CN110120216B true CN110120216B (zh) | 2021-11-12 |
Family
ID=67521657
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910357284.2A Active CN110120216B (zh) | 2019-04-29 | 2019-04-29 | 用于演唱评价的音频数据处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110120216B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113314141A (zh) * | 2021-05-21 | 2021-08-27 | 江苏第二师范学院 | 一种声乐演唱音量和音高的量化方法及量化设备 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101430876A (zh) * | 2007-11-08 | 2009-05-13 | 中国科学院声学研究所 | 一种演唱的评分系统和方法 |
US20100126331A1 (en) * | 2008-11-21 | 2010-05-27 | Samsung Electronics Co., Ltd | Method of evaluating vocal performance of singer and karaoke apparatus using the same |
US20140066724A1 (en) * | 2011-02-18 | 2014-03-06 | Matias Zanartu | System and Methods for Evaluating Vocal Function Using an Impedance-Based Inverse Filtering of Neck Surface Acceleration |
CN103971674A (zh) * | 2014-05-22 | 2014-08-06 | 天格科技(杭州)有限公司 | 一种评分准确、用户体验好的演唱实时评分方法 |
CN104966144A (zh) * | 2015-04-20 | 2015-10-07 | 北京中艺润泽文化传媒有限公司 | 真实艺术水平检测系统 |
CN106157976A (zh) * | 2015-04-10 | 2016-11-23 | 科大讯飞股份有限公司 | 一种唱歌评测方法及系统 |
CN108206026A (zh) * | 2017-12-05 | 2018-06-26 | 北京小唱科技有限公司 | 确定音频内容音高偏差的方法及装置 |
CN109448754A (zh) * | 2018-09-07 | 2019-03-08 | 南京光辉互动网络科技股份有限公司 | 一种多维度演唱评分系统 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5958041B2 (ja) * | 2012-04-18 | 2016-07-27 | ヤマハ株式会社 | 表情演奏リファレンスデータ生成装置、演奏評価装置、カラオケ装置及び装置 |
US9123353B2 (en) * | 2012-12-21 | 2015-09-01 | Harman International Industries, Inc. | Dynamically adapted pitch correction based on audio input |
JP6759560B2 (ja) * | 2015-11-10 | 2020-09-23 | ヤマハ株式会社 | 調律推定装置及び調律推定方法 |
-
2019
- 2019-04-29 CN CN201910357284.2A patent/CN110120216B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101430876A (zh) * | 2007-11-08 | 2009-05-13 | 中国科学院声学研究所 | 一种演唱的评分系统和方法 |
US20100126331A1 (en) * | 2008-11-21 | 2010-05-27 | Samsung Electronics Co., Ltd | Method of evaluating vocal performance of singer and karaoke apparatus using the same |
US20140066724A1 (en) * | 2011-02-18 | 2014-03-06 | Matias Zanartu | System and Methods for Evaluating Vocal Function Using an Impedance-Based Inverse Filtering of Neck Surface Acceleration |
CN103971674A (zh) * | 2014-05-22 | 2014-08-06 | 天格科技(杭州)有限公司 | 一种评分准确、用户体验好的演唱实时评分方法 |
CN106157976A (zh) * | 2015-04-10 | 2016-11-23 | 科大讯飞股份有限公司 | 一种唱歌评测方法及系统 |
CN104966144A (zh) * | 2015-04-20 | 2015-10-07 | 北京中艺润泽文化传媒有限公司 | 真实艺术水平检测系统 |
CN108206026A (zh) * | 2017-12-05 | 2018-06-26 | 北京小唱科技有限公司 | 确定音频内容音高偏差的方法及装置 |
CN109448754A (zh) * | 2018-09-07 | 2019-03-08 | 南京光辉互动网络科技股份有限公司 | 一种多维度演唱评分系统 |
Also Published As
Publication number | Publication date |
---|---|
CN110120216A (zh) | 2019-08-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108206026B (zh) | 确定音频内容音高偏差的方法及装置 | |
CN105161116B (zh) | 多媒体文件高潮片段的确定方法及装置 | |
CN106157979B (zh) | 一种获取人声音高数据的方法和装置 | |
CN106469557B (zh) | 伴奏音乐的提供方法和装置 | |
CN104050974A (zh) | 声音信号分析设备以及声音信号分析方法和程序 | |
CN109214446A (zh) | 潜力绩优人员类型识别方法、系统、终端及计算机可读存储介质 | |
CN111785238A (zh) | 音频校准方法、装置及存储介质 | |
CN110120216B (zh) | 用于演唱评价的音频数据处理方法及装置 | |
CN110019838A (zh) | 智能问答系统及智能终端 | |
CN105718486B (zh) | 在线哼唱检索方法及系统 | |
CN108766451A (zh) | 一种音频文件处理方法、装置和存储介质 | |
CN110019729A (zh) | 智能问答方法及存储介质、终端 | |
CN112232011A (zh) | 一种集成电路的宽频段电磁响应自适应确定方法及系统 | |
CN110222447B (zh) | 一种基于八叉树的自适应网格划分方法及系统 | |
CN108022604A (zh) | 补录音频内容的方法和装置 | |
WO2020078120A1 (zh) | 音频识别方法、装置及存储介质 | |
CN113822768B (zh) | 社区网络的处理方法、装置、设备及存储介质 | |
CN107133643A (zh) | 基于多特征融合及特征选择的乐音信号分类方法 | |
CN116882306B (zh) | 一种基于火焰面模型的多维查找方法、装置、设备及介质 | |
CN108932262B (zh) | 一种歌曲推荐方法及装置 | |
CN106503181B (zh) | 一种音频数据处理方法及装置 | |
CN105575400A (zh) | 一种获取歌曲信息的方法、终端、服务器和系统 | |
CN117275513A (zh) | 声品质评估方法、装置、电子设备及存储介质 | |
CN103092854B (zh) | 一种音乐数据分类方法 | |
CN110570854B (zh) | 一种智能语音输出方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |