CN107564534B - 音频品质鉴定方法和装置 - Google Patents
音频品质鉴定方法和装置 Download PDFInfo
- Publication number
- CN107564534B CN107564534B CN201710717509.1A CN201710717509A CN107564534B CN 107564534 B CN107564534 B CN 107564534B CN 201710717509 A CN201710717509 A CN 201710717509A CN 107564534 B CN107564534 B CN 107564534B
- Authority
- CN
- China
- Prior art keywords
- audio
- frequency
- cut
- preset
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Signal Processing For Digital Recording And Reproducing (AREA)
Abstract
本公开是关于一种音频品质鉴定方法和装置,属于电子技术领域。所述方法包括:当检测到针对目标音频的品质鉴定触发操作后,对所述目标音频在频域上进行分析,得到所述目标音频中各音频帧的截止频率;判断所述各音频帧的截止频率是否满足预设的高截止频率条件;若所述各音频帧的截止频率满足预设的高截止频率条件,则确定所述目标音频为高品质音频。本实施例提供的方法是从根本上对目标音频进行分析,并基于音频的基本特性判断目标音频是不是高品质音频。通过本实施例提供的方法可以鉴定出高品质音频的真伪。
Description
技术领域
本公开是关于电子技术领域,尤其是关于一种音频品质鉴定方法和装置。
背景技术
在日常生活中,人们通常使用服务商提供的音乐播放应用程序来欣赏各种各样的音乐。某些用户为了获得更高端的听觉体验,常常会购买服务商提供的需要付费的高品质音频。
在服务商的曲库中,会预先存储大量的高品质音频。服务商是从不同的唱片公司购入的高品质音频,他们无法直接确保从这些唱片公司购入的高品质音频都是真的高品质音频。如果用户购买到伪高品质音频,会极大地降低用户对服务商的满意度。
在相关技术中,服务商会对购入的音频进行品质鉴定。具体做法是,通过人工进行鉴定,或者通过计算机根据音频的格式、音频的描述信息中的码率进行鉴定。例如,如果音频的格式为FLAC(Free Lossless Audio Codec,无损音频压缩编码),则该音频就可以被确定为高品质音频,或者,如果音频的码率为现有技术中可实现的最高的码率320k,则该音频就可以被确定为高品质音频。
在实际应用中,仅仅通过上述方法对音频进行鉴定通常是不够的。如果通过人工进行鉴定,则面对曲库中数以百万千万计算的音频,人工鉴定的力量是薄弱的。此外,如果通过计算机进行鉴定,则面对唱片公司将低码率音频重新编码成高码率音频的情况,或者面对将低码率、有损音频压缩编码格式的音频进行播放并重新录制成高码率、无损音频压缩编码格式的音频的情况,通过现有的鉴定方法是鉴定不出伪高品质音频的。
发明内容
为了克服相关技术中存在的问题,本公开提供了以下技术方案:
根据本公开实施例的第一方面,提供一种音频品质鉴定方法,所述方法包括:
当检测到针对目标音频的品质鉴定触发操作后,对所述目标音频在频域上进行分析,得到所述目标音频中各音频帧的截止频率;
判断所述各音频帧的截止频率是否满足预设的高截止频率条件;
若所述各音频帧的截止频率满足预设的高截止频率条件,则确定所述目标音频为高品质音频。
可选地,对所述目标音频在频域上进行分析,得到所述目标音频中各音频帧的截止频率,包括:
基于窗函数,对所述目标音频进行加窗操作,基于加窗操作的结果,将所述目标音频切分成各音频帧;
将所述各音频帧的初始时域特性转换为频域特性;
基于所述频域特性,确定所述目标音频中各音频帧的截止频率。
可选地,基于所述频域特性,确定所述目标音频中各音频帧的截止频率,包括:
对于每个音频帧,基于所述频域特性,确定所述音频帧中每个频点对应的幅值,基于每个幅值的出现次数,确定所述音频帧的截止频率。
可选地,判断所述各音频帧的截止频率是否满足预设的高截止频率条件,包括:
根据所述各音频帧的截止频率,分别判断所述每个音频帧是否是高品质音频帧;
确定高品质音频帧的数量;
判断所述高品质音频帧的数量占所述目标音频的音频帧的总量的比例是否大于预设比例阈值;
所述若所述各音频帧的截止频率满足预设的高截止频率条件,则确定所述目标音频为高品质音频,包括:
若所述高品质音频帧的数量占所述目标音频的音频帧的总量的比例大于预设比例阈值,则确定所述目标音频为高品质音频。
可选地,根据所述各音频帧的截止频率,分别判断所述每个音频帧是否是高品质音频帧,包括:
分别判断所述每个音频帧的截止频率是否大于预设频率阈值,确定截止频率大于预设频率阈值的音频帧为高品质音频帧。
根据本公开实施例的第二方面,提供一种音频品质鉴定装置,所述装置包括:
分析模块,用于当检测到针对目标音频的品质鉴定触发操作后,对所述目标音频在频域上进行分析,得到所述目标音频中各音频帧的截止频率;
判断模块,用于判断所述各音频帧的截止频率是否满足预设的高截止频率条件;
确定模块,用于当所述各音频帧的截止频率满足预设的高截止频率条件,确定所述目标音频为高品质音频。
可选地,所述分析模块包括:
加窗单元,用于基于窗函数,对所述目标音频进行加窗操作,基于加窗操作的结果,将所述目标音频切分成各音频帧;
转换单元,用于将所述各音频帧的初始时域特性转换为频域特性;
第一确定单元,用于基于所述频域特性,确定所述目标音频中各音频帧的截止频率。
可选地,所述第一确定单元用于对于每个音频帧,基于所述频域特性,确定所述音频帧中每个频点对应的幅值,基于每个幅值的出现次数,确定所述音频帧的截止频率。
可选地,所述判断模块包括:
第一判断单元,用于根据所述各音频帧的截止频率,分别判断所述每个音频帧是否是高品质音频帧;
第二确定单元,用于确定高品质音频帧的数量;
第二判断单元,判断所述高品质音频帧的数量占所述目标音频的音频帧的总量的比例是否大于预设比例阈值;
所述确定模块用于当所述高品质音频帧的数量占所述目标音频的音频帧的总量的比例大于预设比例阈值,确定所述目标音频为高品质音频。
可选地,所述第一判断单元用于分别判断所述每个音频帧的截止频率是否大于预设频率阈值,确定截止频率大于预设频率阈值的音频帧为高品质音频帧。
根据本公开实施例的第三方面,提供一种终端,所述终端包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现上述音频品质鉴定方法。
根据本公开实施例的第四方面,提供一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现上述音频品质鉴定方法。
本公开的实施例提供的技术方案可以包括以下有益效果:
根据本实施例提供的方法,对目标音频在频域上进行分析,得到目标音频中各音频帧的截止频率。基于截止频率对目标音频进行品质的鉴定。本实施例提供的方法是从根本上对目标音频进行分析,并基于音频的基本特性判断目标音频是不是高品质音频。面对唱片公司将低码率音频重新编码成高码率音频的情况,或者面对将低码率、有损音频压缩编码格式的音频进行播放并重新录制成高码率、无损音频压缩编码格式的音频的情况,通过本实施例提供的方法可以鉴定出高品质音频的真伪。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。在附图中:
图1是根据一示例性实施例示出的一种音频品质鉴定方法的流程图;
图2是根据一示例性实施例示出的一种音频品质鉴定方法的流程图;
图3是根据一示例性实施例示出的目标音频在傅里叶变换后的状态图;
图4是根据一示例性实施例示出的一种音频品质鉴定装置的示意图;
图5是根据一示例性实施例示出的一种音频品质鉴定装置的示意图;
图6是根据一示例性实施例示出的一种音频品质鉴定装置的示意图;
图7是根据一示例性实施例示出的一种终端的结构示意图。
通过上述附图,已示出本公开明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本公开的概念。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
本发明实施例提供了一种音频品质鉴定方法,该方法可以由终端实现。其中,终端可以是平板电脑、台式计算机、笔记本计算机等。终端可以包括处理器、存储器等部件。处理器,可以为CPU(Central Processing Unit,中央处理单元)等,可以用于对目标音频在频域上进行分析,得到目标音频中各音频帧的截止频率,等处理。存储器,可以为RAM(RandomAccess Memory,随机存取存储器),Flash(闪存)等,可以用于存储数据、处理过程所需的数据、处理过程中生成的数据等,如音频等。
终端还可以包括收发器、输入部件、显示部件、音频输出部件等。收发器,可以用于与服务器进行数据传输,收发器可以包括蓝牙部件、WiFi(Wireless-Fidelity,无线高保真技术)部件、天线、匹配电路、调制解调器等。输入部件可以是触摸屏、键盘、鼠标等。音频输出部件可以是音箱、耳机等。
本公开一示例性实施例提供了一种音频品质鉴定方法,如图1所示,该方法的处理流程可以包括如下的步骤:
步骤S110,当检测到针对目标音频的品质鉴定触发操作后,对目标音频在频域上进行分析,得到目标音频中各音频帧的截止频率。
其中,音频帧的截止频率的大小是根据音频的高音部分的决定的。高音越高,则其截止频率越大。
在实施中,对于低品质音频,通常其产生的原因是对原音频的过大压缩。而在压缩的过程中,首先要压缩的就是高音部分的音频。因此,如果一段音频的高音部分消失了,那么该音频对应的截止频率就会相应变低。故而,在本实施例中,采用基于音频帧的截止频率判断目标音频是否是高品质音频。
可选地,一般的音频在10ms至30ms之间,可以被认为是平稳的。为了在频域上分析目标音频,需要对目标音频加窗,将目标音频切分成各音频帧。各音频帧的时长一般为10ms至30ms之间的数值。相应地,如图2所示,步骤S110包括:步骤S210,基于窗函数,对目标音频进行加窗操作,基于加窗操作的结果,将目标音频切分成各音频帧;步骤S220,将各音频帧的初始时域特性转换为频域特性;步骤S230,基于频域特性,确定目标音频中各音频帧的截止频率。
需要说明的是,在频域上对目标音频进行分析,采用的方法是将各音频帧的初始时域特性转换为频域特性。具体在转换过程中,可以通过离散傅里叶变换DFT或快速傅里叶变换FFT等方式将各音频帧的初始时域特性转换为频域特性。然而,FFT的使用方式是每次只能对在时域上的有限长度的具有周期性的数据进行变换,因此,在本实施例中需要对在时域上的目标音频进行切分。在切分的过程中,如果切分的时间长度不是周期的整数倍,那么,截取后的信号将会存在频谱泄漏。因此,需要使用窗函数对目标音频进行周期截断。加窗操作的主要目的是为了使在时域上的音频更好地满足FFT对周期性的要求,并减少频谱泄漏。
其中,窗函数的种类有很多,包括矩形窗、汉明窗和布莱克曼窗等。在本实施例中可以选择汉明窗。对于汉明窗,如果需要处理的信号有多个频率分量,频谱表现的十分复杂,在这种情况下需要选择一个主瓣够窄的窗函数,而汉明窗正好能满足这个需求。
汉明窗的有两种表达式来表达,分别如下述公式1、公式2:
或
其中,N为采样点数,为了方便后续进行FFT,N优选地满足长度为2的幂。加窗操作的实质是用一个窗函数与目标音频的函数作乘积的过程。基于窗函数,对目标音频进行加窗操作,得到xw(n)为进行加窗操作后的第i帧音频帧的函数。如果设w(n)为窗函数,则加窗操作可以用公式3来表达:
xw(n)=w(n)×x(n) (公式3)
将各音频帧的初始时域特性转换为频域特性。
可选地,步骤S230可以包括:对于每个音频帧,基于频域特性,确定音频帧中每个频点对应的幅值,基于每个幅值的出现次数,确定音频帧的截止频率。
在实施中,在将各音频帧的初始时域特性转换为频域特性之后,对于每个音频帧,可以进行取模操作,以确定音频帧中每个频点对应的幅值。如果在上面的步骤中应用的窗函数的采样点数为N,则进行取模操作后,会相应地得到N组幅值。具体对音频帧xw(n)的取模操作的公式如公式4所示:
XW(n)=abs(FFT(xw(n))) (公式4)
其中,abs()代表取模操作。在取模操作后,得到XW(n),XW(n)为一个数组,包括N组幅值数据,对应着不同频点。接着,为了方便计算,可以以分贝的形式对XW(n)的大小进行表达。具体将XW(n)转换为分贝的形式的表达式可以如公式5:
FDB(n)=10log(XW(n)) (公式5)
一般地,FDB(n)是一组对称的幅值数据,FDB(n)的一半幅值数据对应的频点是负数,没有实际意义不做研究,另外的一半幅值数据对应的频点是正数,只取这一半幅值数据去研究。取FDB(n)的N/2个幅值数据进行处理,得到HDB(n),HDB(n)也是一个数组,包含N/2个幅值数据。
因为FDB(n)是将XW(n)以分贝的形式进行表达的,一般地,FDB(n)含有负数的幅值数据,HDB(n)也含有负数的幅值数据。但是在后续终端对HDB(n)处理时,需要HDB(n)是正数才能进行后续的处理操作。因此,可以通过下述方式将HDB(n)转换为正数。
首先,取HDB(n)中的最小值,此最小值在很大可能上是个负数。接着,通过公式6将HDB(n)变为正数。
HDB'(n)=HDB(n)-min(HDB(n)) (公式6)
需要说明的是,通过公式6相当于对HDB(n)中的每个幅值数据都加了一个min(HDB(n))的绝对值,得到的HDB’(n)为正数。虽然HDB’(n)与HDB(n)不相等,但是HDB’(n)中的所有幅值数据间的差值与HDB(n)相等。只要幅值数据之间的差值对应不变,则不影响后续处理过程。
在确定HDB’(n)之后,确定HDB’(n)中每个幅值数据出现次数。将HDB’(n)中每个数据幅值作为横轴,将其出现次数作为纵轴,确定各音频帧的直方图,并进一步确定直方图矩阵his。例如,HDB’(4)={110,22,0,0},则幅值数据110出现的次数为1次,幅值数据22出现的次数为1次,幅值数据0出现的次数为2次。在直方图矩阵his中,his[0]=2,his[22]=1,his[110]=1。将直方图的横轴设置为0至110,在0至110之间的每个整数点上,对应纵轴补零。对于直方图在横轴上从0点开始向右侧寻找第一个谷底。谷底的判断方式是,在直方图矩阵his中,如果his[k-1]大于等于his[k],同时his[k+1]大于his[k],或his[k-1]大于等于his[k],同时his[k+1]大于等于his[k],则his[k]为谷底。在确定his[k]为谷底后,取得k的值。在上述例子中,由于在0至110之间的每个整数点上,对应纵轴补零,因此his[1]至his[21]都为0。由于his[0]=2,his[22]=1,则his[1]至his[21]都满足谷底的判断条件,它们都比处于两边的his[0]=2与his[22]=1小。因此,在his[1]至his[21]之间选取谷底。由于对于直方图是在横轴上从0点开始向右侧寻找第一个谷底的,因此第一个谷底是his[1],上述k则为1。
在确定k值之后,再在HDB’(n)中从后往前寻找满足大于或等于k的HDB’(n)的幅值数据,并确定该幅值数据在HDB’(n)中的位置数idx1。需要说明的是,HDB’(n)中的位置数是从0开始计算的。例如,HDB’(4)={110,22,0,0},k为1,则在HDB’(4)中按照110、22、0、0的顺序从后往前寻找大于或等于1的幅值数据为22。幅值数据为22在HDB’(4)中处于第2个,其对应的位置数idx1为1。接着,再在HDB’(n)中从后往前寻找满足大于或等于T的HDB’(n)的幅值数据,并确定该幅值数据在HDB’(n)中的位置数idx2。其中,T为预设的一个经验值,优选地设置T为10。最后,将位置数idx1与位置数idx2进行比较,选取二者中最大的位置数idx。
在确定位置数idx后,需要将位置数idx换算成对应的频率值即为音频帧的截止频率。具体换算公式见公式7:
fz(i)=idx/N×fs (公式7)
其中,fz(i)为第i个音频帧的截止频率。N为窗函数的采样点数,fs为采样频率。对于一个音频帧在FFT后的截止频率,可以见图3中箭头所指的地方就是音频帧中幅值急剧下降的地方,也就是该音频帧的截止频率,即16.8kHz。需要说明的是,在该图中,采样点数是无穷的,因此图中的频率对应的幅值是连续的。
步骤S120,判断各音频帧的截止频率是否满足预设的高截止频率条件。
步骤S130,若各音频帧的截止频率满足预设的高截止频率条件,则确定目标音频为高品质音频。
相应地,若各音频帧的截止频率不满足预设的高截止频率条件,则确定目标音频为低品质音频
可选地,步骤S120可以包括:根据各音频帧的截止频率,分别判断每个音频帧是否是高品质音频帧;确定高品质音频帧的数量;判断高品质音频帧的数量占目标音频的音频帧的总量的比例是否大于预设比例阈值。步骤S130可以包括:若高品质音频帧的数量占目标音频的音频帧的总量的比例大于预设比例阈值,则确定目标音频为高品质音频。
可选地,根据各音频帧的截止频率,分别判断每个音频帧是否是高品质音频帧的步骤包括:分别判断每个音频帧的截止频率是否大于预设频率阈值,确定截止频率大于预设频率阈值的音频帧为高品质音频帧。
例如,将目标音频中的所有音频帧的截止频率fz(i)都确定之后,首先,可以确定目标音频的音频帧的总量M。接着,可以分别判断每个音频帧的截止频率是否大于预设频率阈值。在本实施例中,可以设置两个预设频率阈值,分别为fh1和fh2。其中,fh1优选地选择为20k,fh2优选地选择为18k。先将fz(i)与fh1进行比较,若fz(i)大于fh1,则将p的计数加一,并且终止对该音频帧的后续比较操作。若fz(i)小于fh1,则将fz(i)与fh2进行比较,若fz(i)大于fh2,则将q的计数加一。需要说明的是,p、q的初始值都为0。最后,当比较完目标音频中的所有音频帧之后,将p、q的值分别除以音频帧的总量M,得到trate a和trate b。分别将trate a和trate b与预设比例阈值trate 1和trate 2进行比较。当trate a大于trate1,且trate b大于trate 2时,目标音频被确认为是高品质音频。其中,trate 1和trate 2为经验值,优选地trate 1为0.5,trate 2为0.8。
根据本实施例提供的方法,对目标音频在频域上进行分析,得到目标音频中各音频帧的截止频率。基于截止频率对目标音频进行品质的鉴定。本实施例提供的方法是从根本上对目标音频进行分析,并基于音频的基本特性判断目标音频是不是高品质音频。面对唱片公司将低码率音频重新编码成高码率音频的情况,或者面对将低码率、有损音频压缩编码格式的音频进行播放并重新录制成高码率、无损音频压缩编码格式的音频的情况,通过本实施例提供的方法可以鉴定出高品质音频的真伪。
本公开又一示例性实施例提供了一种音频品质鉴定装置,如图4所示,该装置包括:
分析模块610,用于当检测到针对目标音频的品质鉴定触发操作后,对所述目标音频在频域上进行分析,得到所述目标音频中各音频帧的截止频率;
判断模块620,用于判断所述各音频帧的截止频率是否满足预设的高截止频率条件;
确定模块630,用于当所述各音频帧的截止频率满足预设的高截止频率条件,确定所述目标音频为高品质音频。
可选地,如图5所示,所述分析模块610包括:
加窗单元711,用于基于窗函数,对所述目标音频进行加窗操作,基于加窗操作的结果,将所述目标音频切分成各音频帧;
转换单元712,用于将所述各音频帧的初始时域特性转换为频域特性;
第一确定单元713,用于基于所述频域特性,确定所述目标音频中各音频帧的截止频率。
可选地,所述第一确定单元713用于对于每个音频帧,基于所述频域特性,确定所述音频帧中每个频点对应的幅值,基于每个幅值的出现次数,确定所述音频帧的截止频率。
可选地,如图6所示,所述判断模块620包括:
第一判断单元821,用于根据所述各音频帧的截止频率,分别判断所述每个音频帧是否是高品质音频帧;
第二确定单元822,用于确定高品质音频帧的数量;
第二判断单元823,判断所述高品质音频帧的数量占所述目标音频的音频帧的总量的比例是否大于预设比例阈值;
所述确定模块630用于当所述高品质音频帧的数量占所述目标音频的音频帧的总量的比例大于预设比例阈值,确定所述目标音频为高品质音频。
可选地,所述第一判断单元821用于分别判断所述每个音频帧的截止频率是否大于预设频率阈值,确定截止频率大于预设频率阈值的音频帧为高品质音频帧。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
根据本实施例提供的装置,对目标音频在频域上进行分析,得到目标音频中各音频帧的截止频率。基于截止频率对目标音频进行品质的鉴定。本实施例提供的方法是从根本上对目标音频进行分析,并基于音频的基本特性判断目标音频是不是高品质音频。面对唱片公司将低码率音频重新编码成高码率音频的情况,或者面对将低码率、有损音频压缩编码格式的音频进行播放并重新录制成高码率、无损音频压缩编码格式的音频的情况,通过本实施例提供的方法可以鉴定出高品质音频的真伪。
需要说明的是:上述实施例提供的音频品质鉴定装置在进行音频品质鉴定时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将终端的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的音频品质鉴定装置与音频品质鉴定方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
本公开再一示例性实施例示出了一种终端的结构示意图。
参照图7,终端900可以包括以下一个或多个组件:处理组件902,存储器904,电源组件906,多媒体组件908,音频组件910,输入/输出(I/O)的接口912,传感器组件914,以及通信组件916。
处理组件902通常控制终端900的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理元件902可以包括一个或多个处理器920来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件902可以包括一个或多个模块,便于处理组件902和其他组件之间的交互。例如,处理部件902可以包括多媒体模块,以方便多媒体组件908和处理组件902之间的交互。
存储器904被配置为存储各种类型的数据以支持在终端900的操作。这些数据的示例包括用于在终端900上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器904可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。
电力组件906为终端900的各种组件提供电力。电力组件906可以包括电源管理系统,一个或多个电源,及其他与为音频输出设备900生成、管理和分配电力相关联的组件。
多媒体组件908包括在所述终端900和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件908包括一个前置摄像头和/或后置摄像头。当终端900处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件910被配置为输出和/或输入音频信号。例如,音频组件910包括一个麦克风(MIC),当音频输出设备900处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器904或经由通信组件916发送。
I/O接口912为处理组件902和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
传感器组件914包括一个或多个传感器,用于为终端900提供各个方面的状态评估。例如,传感器组件914可以检测到终端900的打开/关闭状态,组件的相对定位,例如所述组件为终端900的显示器和小键盘,传感器组件914还可以检测终端900或终端900一个组件的位置改变,用户与终端900接触的存在或不存在,终端900方位或加速/减速和终端900的温度变化。传感器组件914可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件914还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件914还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。
通信组件916被配置为便于终端900和其他设备之间有线或无线方式的通信。终端900可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信部件916经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信部件916还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。
在示例性实施例中,终端900可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的计算机可读存储介质,例如包括指令的存储器904,上述指令可由终端900的处理器920执行以完成上述方法。例如,所述计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本公开的又一实施例提供了一种计算机可读存储介质,当所述存储介质中的指令由终端的处理器执行时,使得终端能够执行:
当检测到针对目标音频的品质鉴定触发操作后,对所述目标音频在频域上进行分析,得到所述目标音频中各音频帧的截止频率;
判断所述各音频帧的截止频率是否满足预设的高截止频率条件;
若所述各音频帧的截止频率满足预设的高截止频率条件,则确定所述目标音频为高品质音频。
可选地,对所述目标音频在频域上进行分析,得到所述目标音频中各音频帧的截止频率,包括:
基于窗函数,对所述目标音频进行加窗操作,基于加窗操作的结果,将所述目标音频切分成各音频帧;
将所述各音频帧的初始时域特性转换为频域特性;
基于所述频域特性,确定所述目标音频中各音频帧的截止频率。
可选地,基于所述频域特性,确定所述目标音频中各音频帧的截止频率,包括:
对于每个音频帧,基于所述频域特性,确定所述音频帧中每个频点对应的幅值,基于每个幅值的出现次数,确定所述音频帧的截止频率。
可选地,判断所述各音频帧的截止频率是否满足预设的高截止频率条件,包括:
根据所述各音频帧的截止频率,分别判断所述每个音频帧是否是高品质音频帧;
确定高品质音频帧的数量;
判断所述高品质音频帧的数量占所述目标音频的音频帧的总量的比例是否大于预设比例阈值;
所述若所述各音频帧的截止频率满足预设的高截止频率条件,则确定所述目标音频为高品质音频,包括:
若所述高品质音频帧的数量占所述目标音频的音频帧的总量的比例大于预设比例阈值,则确定所述目标音频为高品质音频。
可选地,根据所述各音频帧的截止频率,分别判断所述每个音频帧是否是高品质音频帧,包括:
分别判断所述每个音频帧的截止频率是否大于预设频率阈值,确定截止频率大于预设频率阈值的音频帧为高品质音频帧。
本领域技术人员在考虑说明书及实践这里公开的公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (8)
1.一种音频品质鉴定方法,其特征在于,所述方法包括:
当检测到针对目标音频的品质鉴定触发操作后,对所述目标音频在频域上进行分析,得到所述目标音频中各音频帧的截止频率;
判断所述各音频帧的截止频率是否满足预设的高截止频率条件;
若所述各音频帧的截止频率满足预设的高截止频率条件,则确定所述目标音频为高品质音频;
所述判断所述各音频帧的截止频率是否满足预设的高截止频率条件,包括:
确定截止频率大于第一预设频率阈值的音频帧的数目和截止频率小于第一预设频率阈值且大于第二预设频率阈值的音频帧的数目,并确定所述截止频率大于第一预设频率阈值的音频帧的数目占所述目标音频总数目的第一比例和所述截止频率小于第一预设频率阈值且大于第二预设频率阈值的音频帧的数目占所述目标音频总数目的第二比例;
所述若所述各音频帧的截止频率满足预设的高截止频率条件,则确定所述目标音频为高品质音频,包括:
若所述第一比例大于第一预设比例,且所述第二比例大于第二预设比例,确定所述目标音频为高品质音频。
2.根据权利要求1所述的方法,其特征在于,所述对所述目标音频在频域上进行分析,得到所述目标音频中各音频帧的截止频率,包括:
基于窗函数,对所述目标音频进行加窗操作,基于加窗操作的结果,将所述目标音频切分成各音频帧;
将所述各音频帧的初始时域特性转换为频域特性;
基于所述频域特性,确定所述目标音频中各音频帧的截止频率。
3.根据权利要求2所述的方法,其特征在于,所述基于所述频域特性,确定所述目标音频中各音频帧的截止频率,包括:
对于每个音频帧,基于所述频域特性,确定所述音频帧中每个频点对应的幅值,基于每个幅值的出现次数,确定所述音频帧的截止频率。
4.一种音频品质鉴定装置,其特征在于,所述装置包括:
分析模块,用于当检测到针对目标音频的品质鉴定触发操作后,对所述目标音频在频域上进行分析,得到所述目标音频中各音频帧的截止频率;
判断模块,用于判断所述各音频帧的截止频率是否满足预设的高截止频率条件;
确定模块,用于当所述各音频帧的截止频率满足预设的高截止频率条件,确定所述目标音频为高品质音频;
判断模块,还用于确定截止频率大于第一预设频率阈值的音频帧的数目和截止频率小于第一预设频率阈值且大于第二预设频率阈值的音频帧的数目,并确定所述截止频率大于第一预设频率阈值的音频帧的数目占所述目标音频总数目的第一比例和所述截止频率小于第一预设频率阈值且大于第二预设频率阈值的音频帧的数目占所述目标音频总数目的第二比例;
确定模块,还用于若所述第一比例大于第一预设比例,且所述第二比例大于第二预设比例,确定所述目标音频为高品质音频。
5.根据权利要求4所述的装置,其特征在于,所述分析模块包括:
加窗单元,用于基于窗函数,对所述目标音频进行加窗操作,基于加窗操作的结果,将所述目标音频切分成各音频帧;
转换单元,用于将所述各音频帧的初始时域特性转换为频域特性;
第一确定单元,用于基于所述频域特性,确定所述目标音频中各音频帧的截止频率。
6.根据权利要求5所述的装置,其特征在于,所述第一确定单元用于对于每个音频帧,基于所述频域特性,确定所述音频帧中每个频点对应的幅值,基于每个幅值的出现次数,确定所述音频帧的截止频率。
7.一种终端,其特征在于,所述终端包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1-4任一所述的音频品质鉴定方法。
8.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1-4任一所述的音频品质鉴定方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710717509.1A CN107564534B (zh) | 2017-08-21 | 2017-08-21 | 音频品质鉴定方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710717509.1A CN107564534B (zh) | 2017-08-21 | 2017-08-21 | 音频品质鉴定方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107564534A CN107564534A (zh) | 2018-01-09 |
CN107564534B true CN107564534B (zh) | 2021-12-31 |
Family
ID=60976489
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710717509.1A Active CN107564534B (zh) | 2017-08-21 | 2017-08-21 | 音频品质鉴定方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107564534B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111312290B (zh) * | 2020-02-19 | 2023-04-25 | 腾讯音乐娱乐科技(深圳)有限公司 | 音频数据音质检测方法及装置 |
CN115547299B (zh) * | 2022-11-22 | 2023-08-01 | 中国民用航空飞行学院 | 一种面向管制语音品质划分的量化评价及分类方法和装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102568470A (zh) * | 2012-01-11 | 2012-07-11 | 广州酷狗计算机科技有限公司 | 一种音频文件音质识别方法及其系统 |
CN104091601A (zh) * | 2014-07-10 | 2014-10-08 | 腾讯科技(深圳)有限公司 | 音乐品质检测方法和装置 |
CN104103279A (zh) * | 2014-07-16 | 2014-10-15 | 腾讯科技(深圳)有限公司 | 音乐真实品质判断方法和系统 |
CN105788612A (zh) * | 2016-03-31 | 2016-07-20 | 广州酷狗计算机科技有限公司 | 一种检测音质的方法和装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9397683B2 (en) * | 2014-08-05 | 2016-07-19 | Intel Corporation | Reduced digital audio sampling rates in digital audio processing chain |
-
2017
- 2017-08-21 CN CN201710717509.1A patent/CN107564534B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102568470A (zh) * | 2012-01-11 | 2012-07-11 | 广州酷狗计算机科技有限公司 | 一种音频文件音质识别方法及其系统 |
CN104091601A (zh) * | 2014-07-10 | 2014-10-08 | 腾讯科技(深圳)有限公司 | 音乐品质检测方法和装置 |
CN104103279A (zh) * | 2014-07-16 | 2014-10-15 | 腾讯科技(深圳)有限公司 | 音乐真实品质判断方法和系统 |
CN105788612A (zh) * | 2016-03-31 | 2016-07-20 | 广州酷狗计算机科技有限公司 | 一种检测音质的方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN107564534A (zh) | 2018-01-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111968662B (zh) | 音频信号的处理方法及装置、存储介质 | |
CN107360326B (zh) | 终端音量调节处理方法及音量调节终端 | |
CN107833579B (zh) | 噪声消除方法、装置及计算机可读存储介质 | |
CN107994879B (zh) | 响度控制方法及装置 | |
CN107147957B (zh) | 视频播放方法和装置 | |
CN108845787B (zh) | 音频调节的方法、装置、终端及存储介质 | |
CN111429933B (zh) | 音频信号的处理方法及装置、存储介质 | |
CN111107421A (zh) | 视频处理方法、装置、终端设备及存储介质 | |
CN110033784B (zh) | 一种音频质量的检测方法、装置、电子设备及存储介质 | |
US10339974B1 (en) | Audio controller device and method of operation thereof | |
CN111862995A (zh) | 一种码率确定模型训练方法、码率确定方法及装置 | |
CN111883164A (zh) | 模型训练方法、装置、电子设备及存储介质 | |
CN107564534B (zh) | 音频品质鉴定方法和装置 | |
US20220343931A1 (en) | Information processing method, electronic equipment, and storage medium | |
CN109729382B (zh) | 音视频数据的音量处理方法、装置及服务器、电子设备 | |
CN112201267B (zh) | 一种音频处理方法、装置、电子设备及存储介质 | |
CN112489653B (zh) | 语音识别的方法、装置及存储介质 | |
CN106020766A (zh) | 音乐播放的方法及装置 | |
CN106293607B (zh) | 自动切换音频输出模式的方法及系统 | |
CN108491180B (zh) | 音频播放方法及装置 | |
CN111694539B (zh) | 在听筒和扬声器之间切换的方法、装置及介质 | |
CN111524505B (zh) | 一种语音处理方法、装置和电子设备 | |
CN107481734B (zh) | 语音质量评价方法及装置 | |
CN112951262A (zh) | 音频录制方法及装置、电子设备及存储介质 | |
CN107340990B (zh) | 播放方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |