CN109979485B - 音频评价方法和装置 - Google Patents

音频评价方法和装置 Download PDF

Info

Publication number
CN109979485B
CN109979485B CN201910356296.3A CN201910356296A CN109979485B CN 109979485 B CN109979485 B CN 109979485B CN 201910356296 A CN201910356296 A CN 201910356296A CN 109979485 B CN109979485 B CN 109979485B
Authority
CN
China
Prior art keywords
evaluation index
singing
frequency
audio information
skill
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910356296.3A
Other languages
English (en)
Other versions
CN109979485A (zh
Inventor
魏耀都
王国腾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xiaochang Technology Co ltd
Original Assignee
Beijing Xiaochang Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Xiaochang Technology Co ltd filed Critical Beijing Xiaochang Technology Co ltd
Priority to CN201910356296.3A priority Critical patent/CN109979485B/zh
Publication of CN109979485A publication Critical patent/CN109979485A/zh
Application granted granted Critical
Publication of CN109979485B publication Critical patent/CN109979485B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/36Accompaniment arrangements
    • G10H1/361Recording/reproducing of accompaniment for use with an external source, e.g. karaoke systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)

Abstract

本申请公开了一种音频评价方法和装置。该方法包括获取用户的音频信息;根据音频信息匹配出指定的至少一个演唱技巧评价指标;对于每个演唱技巧评价指标,基于该演唱技巧评价指标对音频信息进行评价,得到该演唱技巧评价指标对应的评价指标信息;对至少一个演唱技巧评价指标包括的每个演唱技巧评价指标对应的评价指标信息进行合并,得到评价结果信息。本申请可以解决了相关技术中无法客观地对演唱技巧进行评价的技术问题。

Description

音频评价方法和装置
技术领域
本申请涉及音频数据处理技术领域,具体而言,涉及一种音频评价方法和装置。
背景技术
在演唱技巧的评价问题上,目前大部分情况还是依赖于人工进行评价,需要依赖具有丰富演唱知识的专业人员进行,使得评价结果主观性强,无法客观地对演唱技巧进行评价。
针对相关技术中无法客观地对演唱技巧进行评价的问题,目前尚未提出有效的解决方案。
发明内容
本申请的主要目的在于提供一种音频评价方法和装置,以解决相关技术中无法客观地对演唱技巧进行评价的问题。
为了实现上述目的,第一方面,本申请提供了一种音频评价方法,该方法应用于演唱技巧评价系统中,该方法包括:
获取用户的音频信息;
根据音频信息匹配出指定的至少一个演唱技巧评价指标;
对于每个演唱技巧评价指标,基于该演唱技巧评价指标对音频信息进行评价,得到该演唱技巧评价指标对应的评价指标信息;
对至少一个演唱技巧评价指标包括的每个演唱技巧评价指标对应的评价指标信息进行合并,得到评价结果信息。
可选地,演唱技巧评价指标包括滑音评价指标,基于该演唱技巧评价指标对音频信息进行评价,包括:
基于滑音评价指标获取音频信息中任意相邻的两个音符之间的演唱频率点序列以及两个音符之间的滑音模板序列;
对演唱频率点序列和滑音模板序列之间的相关性进行计算,得到相关度;
比较相关度与指定滑音阈值的大小;
当相关度不小于滑音阈值时,在两个音符之间标记出滑音技巧标签,其中,评价指标信息包括滑音技巧标签。
可选地,演唱技巧评价指标包括颤音评价指标,基于该演唱技巧评价指标对音频信息进行评价,包括:
基于颤音评价指标获取音频信息中每个音符的音调起伏变化信息;
对于每个音符,确定该音符的音调起伏变化信息是否存在周期变化信息;
当音符的音调起伏变化信息存在周期变化信息时,对该音符标记出颤音技巧标签,其中,评价指标信息包括颤音技巧标签。
可选地,演唱技巧评价指标包括音量起伏评价指标,基于该演唱技巧评价指标对音频信息进行评价,包括:
基于音量起伏评价指标计算出音频信息包括的每个字的音量;
计算出音频信息包括的按时间排序相邻的任意两个字之间的音量差值;
根据音量差值与指定期望值确定是否对时间排序靠前的字
出音量起伏技巧标签,其中,评价指标信息包括音量起伏技巧标签。
可选地,演唱技巧评价指标包括长音评价指标,基于该演唱技巧评价指标对音频信息进行评价,包括:
基于长音评价指标检测音频信息包括的每个检索元素的演唱时长;
比较每个检索元素的演唱时长与长音阈值的大小;
当检索元素的演唱时长不小于长音阈值时,对检索元素标记出长音技巧标签,其中,评价指标信息包括长音技巧标签。
可选地,基于该演唱技巧评价指标对音频信息进行评价,还包括:
当检索元素的演唱时长不小于长音阈值时,记录该检索元素的演唱时长,其中,评价指标信息包括该检索元素的演唱时长。
可选地,演唱技巧评价指标包括破音评价指标,基于该演唱技巧评价指标对音频信息进行评价,包括:
基于破音评价指标获取音频信息中每个音符内演唱频率;
确定每个音符内演唱频率中是否存在异常突变;
当音符内演唱频率否存在异常突变时,对音符标记出破音标签,其中,评价指标信息包括破音标签。
第二方面,本申请实施例还提供了一种音频评价装置,该装置应用于演唱技巧评价系统中,该装置包括:
获取模块,获取用户的音频信息;
匹配模块,用于根据音频信息匹配出指定的至少一个演唱技巧评价指标;
评价模块,用于对于每个演唱技巧评价指标,基于该演唱技巧评价指标对音频信息进行评价,得到该演唱技巧评价指标对应的评价指标信息;
处理模块,用于对至少一个演唱技巧评价指标包括的每个演唱技巧评价指标对应的评价指标信息进行合并,得到评价结果信息。
第三方面,本申请实施例还提供了一种计算机设备,该计算机设备包括:
一个或多个处理器;
存储器,用于存储一个或多个计算机程序;
当一个或多个计算机程序被一个或多个处理器执行时,使得一个或多个处理器实现如上述的音频评价方法。
第三方面,本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机代码,当计算机代码被执行时,上述的音频评价方法被执行。
在本申请提供的音频评价方法中,通过获取用户的音频信息;根据音频信息匹配出指定的至少一个演唱技巧评价指标;对于每个演唱技巧评价指标,基于该演唱技巧评价指标对音频信息进行评价,得到该演唱技巧评价指标对应的评价指标信息;对至少一个演唱技巧评价指标包括的每个演唱技巧评价指标对应的评价指标信息进行合并,得到评价结果信息。这样,基于用户的音频信息,再基于音频信息匹配出用户需要的演唱技巧评价指标,再根据每个演唱技巧评价指标独立对音频信息进行评价,之后,再将各评价指标信息进行合并,输出最终的评价结果信息,从而实现了基于演唱技巧评价客观地对用户的演唱技巧进行评价的目的,进而解决了相关技术中无法客观地对演唱技巧的技术问题。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是本申请实施例提供的一种音频评价方法的流程示意图;
图2是本申请实施例提供的一种步骤300的流程示意图;
图3是本申请实施例提供的一种滑音评价的相关性示意图;
图4是本申请实施例提供的另一种步骤300的流程示意图;
图5是本申请实施例提供的另一种步骤300的流程示意图;
图6是本申请实施例提供的另一种步骤300的流程示意图;
图7是本申请实施例提供的另一种音频评价装置的结构示意图;
图8是本申请实施例提供的一种音频评价装置的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
其中,“多个”包含两个以及两个以上。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
本申请提供了一种音频评价方法,该方法应用于演唱技巧评价系统中,图1是本申请实施例提供的一种音频评价方法的流程示意图,如图1所示,该方法包括如下步骤100至步骤400:
100,获取用户的音频信息。
其中,音频信息可以包括用户通过语音的方式录入的歌曲等音频,还可以是视频中包括的歌曲等音频。
具体的,获取用户的音频信息的方式,可以是在本地存储器中读取该音频信息,也可以是接收其他智能终端或云端服务器发送的音频信息,还是可以在用户演唱现场实时录入的音频信息。
200,根据音频信息匹配出指定的至少一个演唱技巧评价指标。
其中,演唱技巧评价指标可以是演唱技巧中包括的滑音、颤音、音量起伏、长音等良好的技巧,也可以包括有问题的演唱方式,例如,破音。
具体的,可以基于用户(歌者)自身演唱的音频信息设计技巧水平或者不同场景合理地调整需要选用指定的演唱技巧评价指标,例如,在某些场景下,仅需要一个关于长音的演唱技巧评价指标;因此,可以根据音频信息匹配出用户指定的至少一个演唱技巧评价指标。
300,对于每个演唱技巧评价指标,基于该演唱技巧评价指标对音频信息进行评价,得到该演唱技巧评价指标对应的评价指标信息。
其中,评价指标信息可以是直接标注在音频信息中各处的标签,还可以独立于音频信息且对音频信息独立进行评价的信息。
具体的,当在步骤200中匹配出仅一个演唱技巧评价指标时,根据该演唱技巧评价指标对音频信息进行评价,可以得到一个评价指标信息;而当步骤200中匹配出至少两个演唱技巧评价指标时,根据每个演唱技巧评价指标分别对音频信息进行评价,从而得到与演唱技巧评价指标数量相同的评价指标信息。
400,对至少一个演唱技巧评价指标包括的每个演唱技巧评价指标对应的评价指标信息进行合并,得到评价结果信息。
具体的,当得到每个演唱技巧评价指标对应的评价指标信息,可以将多个评价指标信息进行合并,得到合并项信息,当仅存在一个评价指标信息,直接将该评价指标信息作为合并项信息,此时,可以直接将该合并项信息作为评价结果信息,还可以对该合并项信息进行权重评分处理,即每个演唱技巧评价指标均对应一个权重,例如,颤音和滑音分别对应的0.25和0.2的权重,从而得到了该合并项信息的权重评分,之后,将该权重评分作为评价结果信息进行输出。这样,将本音频评价方法应用于演唱技巧评价系统中,可以避免人为因素,客观地且高效地对用户的演唱技巧进行统一评价。
在一个可行的实施方式中,演唱技巧评价指标包括滑音评价指标,图2是本申请实施例提供的一种步骤300的流程示意图,如图2所示,步骤300,基于该演唱技巧评价指标对音频信息进行评价,包括如下步骤301至步骤304:
301,基于滑音评价指标获取音频信息中任意相邻的两个音符之间的演唱频率点序列以及两个音符之间的滑音模板序列;
302,对演唱频率点序列和滑音模板序列之间的相关性进行计算,得到相关度;
303,比较相关度与指定滑音阈值的大小;
304,当相关度不小于滑音阈值时,在两个音符之间标记出滑音技巧标签,其中,评价指标信息包括滑音技巧标签。
其中,滑音指连续两个音符的音调从较高/低的频率持续而平滑的变化到较低/高的频率,而通过滑音评价指标可以对音频信息进行评价,确定出音频信息中滑音的出现位置;滑音模板序列可以是两个音符之间一个频率均匀变化序列,该频率均匀变化序列为连续两个音符之间一个按时间均匀变化的频率序列;演唱频率点序列为音频信息包括的相邻的两个音符之间歌者演唱的频率点序列;滑音技巧标签即为音频信息中滑音出现位置对应的标签。
具体的,先获取音频信息中任意相邻的两个音符之间的演唱频率点序列以及两个音符之间的滑音模板序列,进而计算演唱频率点序列与滑音模板序列之间的相关性,确定出相关度,当相关度不小于滑音阈值时,在两个音符之间标记出滑音技巧标签,例如,图3是本申请实施例提供的一种滑音评价的相关性示意图,如图3所示,这是一个200Hz的音符和240Hz的音符过渡的区域,“x”为歌者演唱的频率点序列,“o”为给定的滑音模板序列,该滑音模板序列为频率均匀变化序列,即按时间均匀变化的频率序列,两个序列的相关度为0.91,给定的指定滑音阈值为0.9,那么这个区域就是一个滑音的演唱技巧。
在一个可行的实施方式中,演唱技巧评价指标包括颤音评价指标,图4是本申请实施例提供的另一种步骤300的流程示意图,如图4所示,步骤300,基于该演唱技巧评价指标对音频信息进行评价,包括如下步骤305至步骤307:
305,基于颤音评价指标获取音频信息中每个音符的音调起伏变化信息;
306,对于每个音符,确定该音符的音调起伏变化信息是否存在周期变化信息;
307,当音符的音调起伏变化信息存在周期变化信息时,对该音符标记出颤音技巧标签,其中,评价指标信息包括颤音技巧标签。
其中,颤音指在一个音符中将音调进行接近余弦状的起伏变化,颤音出现时会被评价指标捕捉到。判断颤音的成立条件为:音符颤抖频率在一秒钟N次以内,并且频率变化幅度要足够明显。颤音技巧标签即为音频信息中颤音出现位置对应的标签。周期变化信息可以是类余弦状信息或周期性方波状信息。
具体的,首先对音频信息中每个音符进行频率检测,得到每个音符的频率序列(即音调起伏变化信息),对频率序列再按照频率的连续性对频率做切分,得到多个切分频率序列,之后,对于每个切分频率序列进行判断,确定切分频率序列中频率变化范围是否超过指定赫兹,当超过该指定赫兹时,再对该切分频率序列做傅立叶变换,根据傅立叶变换的结果中确定是否存在极大值,当存在极大值时,判断极大值所处位置脚标是否小于loc(loc根据傅立叶变换的点数以及频率分辨率决定),当小于loc时,确定傅立叶变换结果的信噪比snr是否大于alpha(alpha是一个常数),当信噪比snr大于alpha时,确定音符内频率颤动的次数np是否小于(beta-snr/A),beta和A均是一个常数,当音符内频率颤动的次数np小于(beta-snr/A)时,确定音符的音调起伏变化信息中存在周期变化信息。
在一个可行的实施方式中,演唱技巧评价指标包括音量起伏评价指标,图5是本申请实施例提供的另一种步骤300的流程示意图,如图5所示,步骤300,基于该演唱技巧评价指标对音频信息进行评价,包括如下步骤308至步骤310:
308,基于音量起伏评价指标计算出音频信息包括的每个字的音量;
309,计算出音频信息包括的按时间排序相邻的任意两个字之间的音量差值;
310,对音量差值与指定期望值确定是否对时间排序靠前的字标记出音量起伏技巧标签,其中,评价指标信息包括音量起伏技巧标签。
其中,音量起伏指演唱过程中相邻的字在音量上存在符合要求的起伏。音量起伏技巧标签即为音频信息中音量起伏出现位置对应的标签。另外,步骤310,对音量差值与指定期望值确定是否对时间排序靠前的字标记出音量起伏技巧标签,可以包括:对音量差值与时间排序靠前的字的音量之比进行计算,得到该字对应的音量比值;比较字对应的音量比值与指定期望值的大小;当字的音量比值不小于指定期望值时,对字标记出音量起伏技巧标签。
具体的,先将音频信息切分为若干句,将每一句再次切分为若干个字,计算每一个字的音量,计算出相邻的任意两个字之间的音量差值,可以直接根据音量差值与指定期望值之间的关系,确定是否对时间排序靠前的字标记出音量起伏技巧标签,还可以对音量差值与时间排序靠前的字的音量之比进行计算,得到该字对应的音量比值,当字的音量比值不小于指定期望值时,对字标记出音量起伏技巧标签。
举例说明,相邻的两个字的音量分别为0.1和0.4,则音量差值为0.3,音量比值为0.3/0.1=3,而给定的音量起伏阈值为1.5,那么,第一个字的音量比值大于音量起伏阈值,因此,第一个字存在着音量起伏,对第一字标记出音量起伏技巧标签。
在一个可行的实施方式中,演唱技巧评价指标包括长音评价指标,图6是本申请实施例提供的另一种步骤300的流程示意图,如图6所示,步骤300,基于该演唱技巧评价指标对音频信息进行评价,包括如下步骤313至步骤315:
313,基于长音评价指标检测音频信息包括的每个检索元素的演唱时长;
314,比较每个检索元素的演唱时长与长音阈值的大小;
315,当检索元素的演唱时长不小于长音阈值时,对检索元素标记出长音技巧标签,其中,评价指标信息包括长音技巧标签。
其中,检索元素可以是音频信息中包括的字、音符或音素中的一种。长音是指在演唱过程中持续发声至某一个时间长度的技巧,当某个检索元素演唱的持续时间超过门限时,长音会被捕捉到并且记录该长音的持续时间。长音技巧标签即为音频信息中长音出现位置对应的标签。
具体的,先检测出音频信息包括的每个检索元素的演唱时长,当一个检索元素的演唱时长不小于长音阈值时,对该检索元素标记出长音技巧标签。可选地,基于该演唱技巧评价指标对音频信息进行评价,还包括:
当检索元素的演唱时长不小于长音阈值时,记录该检索元素的演唱时长,其中,评价指标信息包括该检索元素的演唱时长。
举例说明,用户在演唱的音频信息中包括“我爱你中国”这一句,其中,“我爱你中国”的结尾,用户从“国”字为检索元素,其中,“国”字发声开始持续了8秒,假如设定的长音阈值为5秒,那么这个“国”字被标记为一个长音,并记录8秒这个长音的演唱时长。
可选地,演唱技巧评价指标包括破音评价指标,图7是本申请实施例提供的另一种步骤300的流程示意图,如图7所示,步骤300,基于该演唱技巧评价指标对音频信息进行评价,包括如下步骤316至步骤318:
316,基于破音评价指标获取音频信息中每个音符内演唱频率;
317,确定每个音符内演唱频率中是否存在异常突变;
318,当音符内演唱频率否存在异常突变时,对音符标记出破音标签,其中,评价指标信息包括破音标签。
其中,破音指在演唱时由于发音方式不合理造成的声音特征突变,比如音调、音色的突变,常见于强行上高音时。当破音出现时会被指标捕捉到。判断破音的成立条件为:单个音符内演唱频率是否有阶跃变化。破音标签即为音频信息中破音出现位置对应的标签。异常突变可以是演唱频率中的阶跃。
具体的,先获取音频信息中每个音符内演唱频率,之后,确定每个音符内演唱频率中是否存在阶跃,当音符内演唱频率否存在阶跃时,对音符标记出破音标签。确定每个音符内演唱频率中是否存在阶跃,具体为:对单个音符内演唱频率进行按照频率的连续性进行切分,得到切分频率序列,对切分频率序列做傅立叶变换,如果傅立叶变换得到的能量分布很均匀,没有呈现出峰值,则判断为单个音符内演唱频率内存在阶跃(即异常突变),即该音符中存在破音。
在本申请提供的音频评价方法中,通过获取用户的音频信息;根据音频信息匹配出指定的至少一个演唱技巧评价指标;对于每个演唱技巧评价指标,基于该演唱技巧评价指标对音频信息进行评价,得到该演唱技巧评价指标对应的评价指标信息;对至少一个演唱技巧评价指标包括的每个演唱技巧评价指标对应的评价指标信息进行合并,得到评价结果信息。这样,基于用户的音频信息,再基于音频信息匹配出用户需要的演唱技巧评价指标,再根据每个演唱技巧评价指标独立对音频信息进行评价,之后,再将各评价指标信息进行合并,输出最终的评价结果信息,从而实现了基于演唱技巧评价客观地对用户的演唱技巧进行评价的目的,进而解决了相关技术中无法客观地对演唱技巧的技术问题。
第二方面,本申请实施例还提供了一种音频评价装置,该装置应用于演唱技巧评价系统中,图8是本申请实施例提供的一种音频评价装置的结构示意图,如图8所示,该装置包括:
获取模块10,获取用户的音频信息;
匹配模块20,用于根据音频信息匹配出指定的至少一个演唱技巧评价指标;
评价模块30,用于对于每个演唱技巧评价指标,基于该演唱技巧评价指标对音频信息进行评价,得到该演唱技巧评价指标对应的评价指标信息;
处理模块40,用于对至少一个演唱技巧评价指标包括的每个演唱技巧评价指标对应的评价指标信息进行合并,得到评价结果信息。
具体的,本申请实施例的装置中各模块实现其功能的具体过程可参见方法实施例中的相关描述,此处不再赘述。
可选地,演唱技巧评价指标包括滑音评价指标,评价模块30,用于:
基于滑音评价指标获取音频信息中任意相邻的两个音符之间的演唱频率点序列以及两个音符之间的频率均匀变化序列;
对演唱频率点序列和频率均匀变化序列之间的相关性进行计算,得到相关度;
比较相关度与指定滑音阈值的大小;
当相关度不小于滑音阈值时,在两个音符之间标记出滑音技巧标签,其中,评价指标信息包括滑音技巧标签。
可选地,演唱技巧评价指标包括颤音评价指标,评价模块30,用于:
基于颤音评价指标获取音频信息中每个音符的音调起伏变化信息;
对于每个音符,确定该音符的音调起伏变化信息是否存在周期变化信息;
当音符的音调起伏变化信息存在周期变化信息时,对该音符标记出颤音技巧标签,其中,评价指标信息包括颤音技巧标签。
可选地,演唱技巧评价指标包括音量起伏评价指标,评价模块30,用于:
基于音量起伏评价指标计算出音频信息包括的每个字的音量;
计算出音频信息包括的按时间排序相邻的任意两个字之间的音量差值;
根据音量差值与指定期望值确定对时间排序靠前的字
标记出音量起伏技巧标签,其中,评价指标信息包括音量起伏技巧标签。
可选地,演唱技巧评价指标包括长音评价指标,评价模块30,用于:
基于长音评价指标检测音频信息包括的每个检索元素的演唱时长;
比较每个检索元素的演唱时长与长音阈值的大小;
当检索元素的演唱时长不小于长音阈值时,对检索元素标记出长音技巧标签,其中,评价指标信息包括长音技巧标签。
可选地,评价模块30,还用于:
当检索元素的演唱时长不小于长音阈值时,记录该检索元素的演唱时长,其中,评价指标信息包括该检索元素的演唱时长。
可选地,演唱技巧评价指标包括破音评价指标,评价模块30,用于:
基于破音评价指标获取音频信息中每个音符内演唱频率;
确定每个音符内演唱频率中是否存在异常突变;
当音符内演唱频率否存在异常突变时,对音符标记出破音标签,其中,评价指标信息包括破音标签。
在本申请提供的音频评价装置中,通过设置:获取模块10,获取用户的音频信息;匹配模块20,用于根据音频信息匹配出指定的至少一个演唱技巧评价指标;评价模块30,用于对于每个演唱技巧评价指标,基于该演唱技巧评价指标对音频信息进行评价,得到该演唱技巧评价指标对应的评价指标信息;处理模块40,用于对至少一个演唱技巧评价指标包括的每个演唱技巧评价指标对应的评价指标信息进行合并,得到评价结果信息。从而解决了相关技术中无法客观地对演唱技巧的技术问题。
基于相同的技术构思,本申请实施例还提供了一种计算机设备,该计算机设备包括:
一个或多个处理器;
存储器,用于存储一个或多个计算机程序;
当一个或多个计算机程序被一个或多个处理器执行时,使得一个或多个处理器实现如上述的音频评价方法。
基于相同的技术构思,本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机代码,当计算机代码被执行时,上述的音频评价方法被执行。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
本申请所涉及的计算机程序可以存储于计算机可读存储介质中,所述计算机可读存储介质可以包括:能够携带计算机程序代码的任何实体装置、虚拟装置、优盘、移动硬盘、磁碟、光盘、计算机存储器、只读计算机存储器(Read-Only Memory,ROM)、随机存取计算机存储器(Random Access Memory,RAM)、电载波信号、电信信号以及其他软件分发介质等。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (7)

1.一种音频评价方法,其特征在于,该方法应用于演唱技巧评价系统中,该方法包括:
获取用户的音频信息;
根据所述音频信息匹配出指定的至少一个演唱技巧评价指标;
对于每个所述演唱技巧评价指标,基于该演唱技巧评价指标对音频信息进行评价,得到该演唱技巧评价指标对应的评价指标信息;
对所述至少一个演唱技巧评价指标包括的每个演唱技巧评价指标对应的评价指标信息进行合并,得到评价结果信息;
所述演唱技巧评价指标包括滑音评价指标,所述基于该演唱技巧评价指标对音频信息进行评价,包括:
基于所述滑音评价指标获取所述音频信息中任意相邻的两个音符之间的演唱频率点序列以及所述两个音符之间的滑音模板序列;
对所述演唱频率点序列和滑音模板序列之间的相关性进行计算,得到相关度;
比较所述相关度与指定滑音阈值的大小;
当所述相关度不小于所述滑音阈值时,在所述两个音符之间标记出滑音技巧标签,其中,所述评价指标信息包括所述滑音技巧标签;
其中,滑音指连续两个音符的音调从较高/低的频率持续而平滑的变化到较低/高的频率,而通过滑音评价指标可以对音频信息进行评价,确定出音频信息中滑音的出现位置;滑音模板序列可以是两个音符之间一个频率均匀变化序列,该频率均匀变化序列为连续两个音符之间一个按时间均匀变化的频率序列;演唱频率点序列为音频信息包括的相邻的两个音符之间歌者演唱的频率点序列;滑音技巧标签即为音频信息中滑音出现位置对应的标签
其中所述演唱技巧评价指标包括颤音评价指标,所述基于该演唱技巧评价指标对音频信息进行评价,包括:
基于所述颤音评价指标获取所述音频信息中每个音符的音调起伏变化信息;对于每个音符,确定该音符的音调起伏变化信息是否存在周期变化信息;
当所述音符的音调起伏变化信息存在周期变化信息时,对该音符标记出颤音技巧标签,其中,所述评价指标信息包括颤音技巧标签;包括:首先对音频信息中每个音符进行频率检测,得到每个音符的频率序列,即音调起伏变化信息,对频率序列再按照频率的连续性对频率做切分,得到多个切分频率序列,之后,对于每个切分频率序列进行判断,确定切分频率序列中频率变化范围是否超过指定赫兹,当超过该指定赫兹时,再对该切分频率序列做傅立叶变换,根据傅立叶变换的结果中确定是否存在极大值,当存在极大值时,判断极大值所处位置脚标是否小于loc,当小于loc时,确定傅立叶变换结果的信噪比snr是否大于alpha,当信噪比snr大于alpha时,确定音符内频率颤动的次数np是否小于beta-snr/A的值,beta和A均是一个常数,当音符内频率颤动的次数np小于beta-snr/A的值时,确定音符的音调起伏变化信息中存在周期变化信息;其中,所述loc根据傅立叶变换的点数以及频率分辨率决定;所述alpha是一个常数;
所述演唱技巧评价指标包括长音评价指标,所述基于该演唱技巧评价指标对音频信息进行评价,包括:
基于长音评价指标检测所述音频信息包括的每个检索元素的演唱时长;
比较所述每个检索元素的演唱时长与长音阈值的大小;
当所述检索元素的演唱时长不小于所述长音阈值时,对所述检索元素标记出长音技巧标签,其中,所述评价指标信息包括所述长音技巧标签;
其中,检索元素是音频信息中包括的字、音符或者音素中的一种。
2.根据权利要求1所述的音频评价方法,其特征在于,所述演唱技巧评价指标包括音量起伏评价指标,所述基于该演唱技巧评价指标对音频信息进行评价,包括:
基于所述音量起伏评价指标计算出所述音频信息包括的每个字的音量;
计算出所述音频信息包括的按时间排序相邻的任意两个字之间的音量差值;
根据所述音量差值与指定期望值确定是否对时间排序靠前的所述字
标记出音量起伏技巧标签,其中,所述评价指标信息包括所述音量起伏技巧标签。
3.根据权利要求1所述的音频评价方法,其特征在于,所述基于该演唱技巧评价指标对音频信息进行评价,还包括:
当所述检索元素的演唱时长不小于所述长音阈值时,记录该检索元素的演唱时长,其中,所述评价指标信息包括该检索元素的演唱时长。
4.根据权利要求1所述的音频评价方法,其特征在于,所述演唱技巧评价指标包括破音评价指标,所述基于该演唱技巧评价指标对音频信息进行评价,包括:
基于破音评价指标获取所述音频信息中每个音符内演唱频率;
确定每个所述音符内演唱频率中是否存在异常突变;
当所述音符内演唱频率存在异常突变时,对所述音符标记出破音标签,其中,所述评价指标信息包括所述破音标签。
5.一种音频评价装置,其特征在于,该装置应用于演唱技巧评价系统中,该装置包括:
获取模块,获取用户的音频信息;
匹配模块,用于根据所述音频信息匹配出指定的至少一个演唱技巧评价指标;
评价模块,用于对于每个所述演唱技巧评价指标,基于该演唱技巧评价指标对音频信息进行评价,得到该演唱技巧评价指标对应的评价指标信息;
处理模块,用于对所述至少一个演唱技巧评价指标包括的每个演唱技巧评价指标对应的评价指标信息进行合并,得到评价结果信息;
所述演唱技巧评价指标包括滑音评价指标,所述基于该演唱技巧评价指标对音频信息进行评价,包括:
基于所述滑音评价指标获取所述音频信息中任意相邻的两个音符之间的演唱频率点序列以及所述两个音符之间的滑音模板序列;
对所述演唱频率点序列和滑音模板序列之间的相关性进行计算,得到相关度;
比较所述相关度与指定滑音阈值的大小;
当所述相关度不小于所述滑音阈值时,在所述两个音符之间标记出滑音技巧标签,其中,所述评价指标信息包括所述滑音技巧标签;
其中,滑音指连续两个音符的音调从较高/低的频率持续而平滑的变化到较低/高的频率,而通过滑音评价指标可以对音频信息进行评价,确定出音频信息中滑音的出现位置;滑音模板序列可以是两个音符之间一个频率均匀变化序列,该频率均匀变化序列为连续两个音符之间一个按时间均匀变化的频率序列;演唱频率点序列为音频信息包括的相邻的两个音符之间歌者演唱的频率点序列;滑音技巧标签即为音频信息中滑音出现位置对应的标签
其中所述演唱技巧评价指标包括颤音评价指标,所述基于该演唱技巧评价指标对音频信息进行评价,包括:
基于所述颤音评价指标获取所述音频信息中每个音符的音调起伏变化信息;对于每个音符,确定该音符的音调起伏变化信息是否存在周期变化信息;当所述音符的音调起伏变化信息存在周期变化信息时,对该音符标记出颤音技巧标签,其中,所述评价指标信息包括颤音技巧标签;包括:首先对音频信息中每个音符进行频率检测,得到每个音符的频率序列,即音调起伏变化信息,对频率序列再按照频率的连续性对频率做切分,得到多个切分频率序列,之后,对于每个切分频率序列进行判断,确定切分频率序列中频率变化范围是否超过指定赫兹,当超过该指定赫兹时,再对该切分频率序列做傅立叶变换,根据傅立叶变换的结果中确定是否存在极大值,当存在极大值时,判断极大值所处位置脚标是否小于loc,当小于loc时,确定傅立叶变换结果的信噪比snr是否大于alpha,当信噪比snr大于alpha时,确定音符内频率颤动的次数np是否小于beta-snr/A的值,beta和A均是一个常数,当音符内频率颤动的次数np小于beta-snr/A的值时,确定音符的音调起伏变化信息中存在周期变化信息;其中,所述loc根据傅立叶变换的点数以及频率分辨率决定;所述alpha是一个常数;
所述演唱技巧评价指标包括长音评价指标,所述基于该演唱技巧评价指标对音频信息进行评价,包括:
基于长音评价指标检测所述音频信息包括的每个检索元素的演唱时长;
比较所述每个检索元素的演唱时长与长音阈值的大小;
当所述检索元素的演唱时长不小于所述长音阈值时,对所述检索元素标记出长音技巧标签,其中,所述评价指标信息包括所述长音技巧标签;
其中,检索元素是音频信息中包括的字、音符或者音素中的一种。
6.一种计算机设备,该计算机设备包括:
一个或多个处理器;
存储器,用于存储一个或多个计算机程序;
当所述一个或多个计算机程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1-4任一项所述的音频评价方法。
7.一种计算机可读存储介质,该计算机可读存储介质存储有计算机代码,当计算机代码被执行时,如权利要求1-4任一项所述的音频评价方法被执行。
CN201910356296.3A 2019-04-29 2019-04-29 音频评价方法和装置 Active CN109979485B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910356296.3A CN109979485B (zh) 2019-04-29 2019-04-29 音频评价方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910356296.3A CN109979485B (zh) 2019-04-29 2019-04-29 音频评价方法和装置

Publications (2)

Publication Number Publication Date
CN109979485A CN109979485A (zh) 2019-07-05
CN109979485B true CN109979485B (zh) 2023-05-23

Family

ID=67087184

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910356296.3A Active CN109979485B (zh) 2019-04-29 2019-04-29 音频评价方法和装置

Country Status (1)

Country Link
CN (1) CN109979485B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110867194B (zh) * 2019-11-05 2022-05-17 腾讯音乐娱乐科技(深圳)有限公司 音频的评分方法、装置、设备及存储介质
CN110853678B (zh) * 2019-11-20 2022-09-06 北京雷石天地电子技术有限公司 颤音识别评分方法、装置、终端和非临时性计算机可读存储介质
CN111369975A (zh) * 2020-03-17 2020-07-03 郑州工程技术学院 基于人工智能的大学音乐评分方法、装置、设备及存储介质
CN111782868A (zh) * 2020-07-06 2020-10-16 腾讯音乐娱乐科技(深圳)有限公司 一种音频处理方法、装置、设备及介质
CN112837698A (zh) * 2020-12-30 2021-05-25 福建星网视易信息系统有限公司 一种演唱或演奏评价方法、装置和计算机可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016136204A (ja) * 2015-01-23 2016-07-28 株式会社第一興商 反復再生機能を備えるカラオケ装置
CN106971704A (zh) * 2017-04-27 2017-07-21 维沃移动通信有限公司 一种音频处理方法及移动终端
CN106997769A (zh) * 2017-03-25 2017-08-01 腾讯音乐娱乐(深圳)有限公司 颤音识别方法及装置
CN107978322A (zh) * 2017-11-27 2018-05-01 北京酷我科技有限公司 一种k歌打分算法
CN108415942A (zh) * 2018-01-30 2018-08-17 福建星网视易信息系统有限公司 个性化教唱和演唱评分二维码生成方法、装置和系统
CN109448754A (zh) * 2018-09-07 2019-03-08 南京光辉互动网络科技股份有限公司 一种多维度演唱评分系统

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016136204A (ja) * 2015-01-23 2016-07-28 株式会社第一興商 反復再生機能を備えるカラオケ装置
CN106997769A (zh) * 2017-03-25 2017-08-01 腾讯音乐娱乐(深圳)有限公司 颤音识别方法及装置
CN106971704A (zh) * 2017-04-27 2017-07-21 维沃移动通信有限公司 一种音频处理方法及移动终端
CN107978322A (zh) * 2017-11-27 2018-05-01 北京酷我科技有限公司 一种k歌打分算法
CN108415942A (zh) * 2018-01-30 2018-08-17 福建星网视易信息系统有限公司 个性化教唱和演唱评分二维码生成方法、装置和系统
CN109448754A (zh) * 2018-09-07 2019-03-08 南京光辉互动网络科技股份有限公司 一种多维度演唱评分系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于内容的音乐分析研究;刘宇翔;《中国博士学位论文全文数据库》;20121115(第11期);正文第3章第47页、53页 *

Also Published As

Publication number Publication date
CN109979485A (zh) 2019-07-05

Similar Documents

Publication Publication Date Title
CN109979485B (zh) 音频评价方法和装置
EP2159717A2 (en) Hybrid audio-visual categorization system and method
Hung et al. Frame-level instrument recognition by timbre and pitch
CN111081272B (zh) 歌曲高潮片段识别方法及装置
CN105161116B (zh) 多媒体文件高潮片段的确定方法及装置
CN103823867A (zh) 一种基于音符建模的哼唱式音乐检索方法及系统
Zhang Music style classification algorithm based on music feature extraction and deep neural network
CN102486920A (zh) 音频事件检测方法和装置
McLeod et al. HMM-based voice separation of MIDI performance
CN108766451B (zh) 一种音频文件处理方法、装置和存储介质
CN106302987A (zh) 一种音频推荐方法及设备
CN110010159B (zh) 声音相似度确定方法及装置
Kirchhoff et al. Evaluation of features for audio-to-audio alignment
Shen et al. Effective music tagging through advanced statistical modeling
Zhang et al. System and method for automatic singer identification
CN113268630B (zh) 一种音频检索方法、设备及介质
CN106997340B (zh) 词库的生成以及利用词库的文档分类方法及装置
Singhi et al. Can song lyrics predict hits
CN105575400A (zh) 一种获取歌曲信息的方法、终端、服务器和系统
Dhall et al. Music genre classification with convolutional neural networks and comparison with f, q, and mel spectrogram-based images
KR20100000265A (ko) 특징 벡터 선택 방법 및 장치, 그리고 이를 이용한 음악장르 분류 방법 및 장치
CN111460215A (zh) 音频数据处理方法、装置、计算机设备以及存储介质
CN115329125A (zh) 一种歌曲串烧拼接方法和装置
CN115359785A (zh) 音频识别方法、装置、计算机设备及计算机可读存储介质
Varewyck et al. Musical meter classification with beat synchronous acoustic features, DFT-based metrical features and support vector machines

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant