CN101645272B - 生成量化控制参数的方法、装置及音频编码设备 - Google Patents

生成量化控制参数的方法、装置及音频编码设备 Download PDF

Info

Publication number
CN101645272B
CN101645272B CN2009101695350A CN200910169535A CN101645272B CN 101645272 B CN101645272 B CN 101645272B CN 2009101695350 A CN2009101695350 A CN 2009101695350A CN 200910169535 A CN200910169535 A CN 200910169535A CN 101645272 B CN101645272 B CN 101645272B
Authority
CN
China
Prior art keywords
frequency
region signal
masking value
subregion
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2009101695350A
Other languages
English (en)
Other versions
CN101645272A (zh
Inventor
詹五洲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Device Co Ltd
Huawei Device Shenzhen Co Ltd
Original Assignee
Huawei Device Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Device Co Ltd filed Critical Huawei Device Co Ltd
Priority to CN2009101695350A priority Critical patent/CN101645272B/zh
Publication of CN101645272A publication Critical patent/CN101645272A/zh
Application granted granted Critical
Publication of CN101645272B publication Critical patent/CN101645272B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明实施例提供了一种生成量化控制参数的方法、装置及音频编码设备。所述方法具体包括:首先计算频域信号的能量;然后根据所述频域信号的能量,计算出所述频域信号至少一个频率点总的掩蔽值;再根据所获得的频率点总的掩蔽值,获得用于控制量化步长的量化控制参数。这样就可以不再计算频域信号的噪声和音调掩蔽特性,而只需统一计算频率点的掩蔽效应,从而在保证音质的情况下,减少了心理声学模型的计算量和复杂度,进而降低了音频编码器的工作负担。

Description

生成量化控制参数的方法、装置及音频编码设备
技术领域
本发明涉及音频编解码领域,尤其涉及一种音频编码过程中生成量化控制参数的方法、装置及音频编码设备。
背景技术
目前,一般常见的音频编码器的结构包括时频变换、心理声学模型、量化编码等模块,如图1所示为现有技术中音频编码器的结构示意图,在图1中:音频时域信号经过时频变换模块的处理后,转换成频域信号;心理声学模型再利用人耳的听觉掩蔽效应对时域信号和频域信号进行处理,生成用于控制量化步长的量化控制参数;量化编码模块再基于该量化控制参数对所述频域信号进行量化和熵编码处理,生成音频比特流。
上述的心理声学模型中涉及到音调掩蔽、噪声掩蔽、临界频带(用bark来表示)、信号掩蔽比(SMR)和信号噪声比(SNR)等概念。在现有技术中,音频编码器的心理声学模型部分中通常需要计算音调掩蔽和噪声掩蔽特性,例如在高级音频编码(AAC,Advanced Audio Coding)中,将频域信号划分成若干个区,然后分别计算各个区的音调属性,并用0至1之间的一个值来表示,值越大,则音调成分越强;反之,则噪声成分越强。在计算出所述音调属性值之后,再根据音调属性值的大小,对各个分区分配不同的信号掩蔽比;音调属性值大的分区,所分配的信号掩蔽比就更大。而各个分区信号掩蔽比的大小,就可以决定可允许的信号噪声比,信号掩蔽比越大,则所要求的信号噪声比就越大,也就是要求量化噪声越小,那么分配给该分区的量化步长也就越小。
由上可以看出:现有的音频编码器中,心理声学模型需要计算噪声掩蔽和音调掩蔽特性才能生成用于控制量化步长的量化控制参数,这样会导致心理声学模型的计算量很大,增大了音频编码器的工作负担。
发明内容
鉴于此,本发明实施例提供了一种音频编码过程中量化控制参数的生成方法及设备。能够在保证音质的情况下,减少心理声学模型的计算量和复杂度,从而降低音频编码器的工作负担。
本发明实施例提供了一种音频编码过程中生成量化控制参数的方法,所述方法包括:
接收频域信号;
根据所述频域信号获得所述频域信号的能量;
根据所述频域信号的能量获得至少一个频率点总的掩蔽值;
根据所述至少一个频率点总的掩蔽值获得量化控制参数。
本发明实施例还提供了一种音频编码方法,所述方法包括:
接收时域信号;
经过时频变换,将所述时域信号转换成频域信号;
根据所述频域信号获得所述频域信号的能量;
根据所述频域信号的能量获得至少一个频率点总的掩蔽值;
根据所述至少一个频率点总的掩蔽值获得量化控制参数;
基于所述量化控制参数对所述频域信号进行量化和熵编码,生成音频比特流。
本发明实施例还提供了一种心理声学装置,所述装置包括:
频域信号接收单元,用于接收频域信号;
能量获取单元,用于根据所述频域信号获得所述频域信号的能量;
掩蔽值获取单元,根据所述频域信号的能量获得至少一个频率点总的掩蔽值;
量化控制参数获取单元,用于根据所述至少一个频率点总的掩蔽值获得量化控制参数。
本发明实施例还提供了一种音频编码设备,所述音频编码设备包括:
时域信号接收单元,用于接收时域信号;
时频转换单元,用于通过时频变换,将所述时域信号转换成频域信号;
心理声学装置,用于根据所述频域信号获得所述频域信号的能量,并根据所述频域信号的能量获得至少一个频率点总的掩蔽值,再根据所述至少一个频率点总的掩蔽值获得量化控制参数;
音频编码单元,用于基于所述量化控制参数对所述频域信号进行量化和熵编码,生成音频比特流。
由上述所提供的技术方案可以看出,首先计算频域信号的能量;然后根据所述频域信号的能量,计算出所述频域信号至少一个频率点总的掩蔽值;再根据所获得的频率点总的掩蔽值,获得用于控制量化步长的量化控制参数。这样就可以不再计算频域信号的噪声和音调掩蔽特性,而只需统一计算频率点的掩蔽效应,从而在保证音质的情况下,减少了心理声学模型的计算量和复杂度,进而降低了音频编码器的工作负担。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为现有技术中音频编码器的结构示意图;
图2为本发明实施例1所提供音频编码过程中生成量化控制参数的方法流程示意图;
图3为本发明实施例2所提供另一音频编码过程中生成量化控制参数的方法流程示意图;
图4为本发明实施例3所提供另一音频编码过程中生成量化控制参数的方法流程示意图;
图5为本发明实施例3所举例中某频率点附近的掩蔽特性示意图;
图6为本发明实施例4所提供音频编码方法的流程示意图;
图7为本发明实施例5所提供心理声学装置的结构示意图;
图8为本发明实施例5所提供另一心理声学装置的结构示意图;
图9为本发明实施例6所提供音频编码设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本实用新型实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本实用新型一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供了一种音频编码过程中生成量化控制参数的方法及装置。在现有的音频编解码器中,心理声学模型需要计算噪声和音调掩蔽特性,导致心理声学模型的计算量很大;本发明所提供的实施例不再计算频域信号的噪声和音调掩蔽特性,而只需统一计算频率点的掩蔽效应,从而在保证音质的情况下,减少了心理声学模型的计算量和复杂度,进而降低了音频编码器的工作负担。
实施例1:
本发明实施例1提供了一种音频编码过程中生成量化控制参数的方法,如图2所示为本实施例1所提供方法的流程示意图,所述方法包括:
步骤200:接收频域信号。
步骤201:根据该频域信号,获得该频域信号的能量。
在具体实现过程中,可以根据频域信号的幅度值,来计算得到该频域信号的能量。例如,可以通过计算频域信号幅度值的平方来得到频域信号的能量。当然,本发明实施例中包括但不限于采用上述方法来获得频域信号的能量。
步骤202:根据频域信号的能量获得至少一个频率点总的掩蔽值。
在具体实现过程中,在计算得到该频域信号的能量之后,就可以根据该频域信号的能量计算出所述频域信号至少一个频率点总的掩蔽值,这里所述的至少一个频率点可以是一个或多个频率点。
具体的计算过程可以是该至少一个频率点附近的频率在该至少一个频率点的总的掩蔽值。例如,可以先计算出所述频域信号的至少一个频率点附近的频率在该频率点的掩蔽值;然后通过求和来得到该至少一个频率点的总的掩蔽值。这里,该至少一个频率点附近的频率可以是:对该至少一个频率点的掩蔽效应大于指定比值范围内的频率点,所述指定比值范围可以限定成0.1~1的范围,当然在本实施例中,不限定对其他频率点的选定;同时,本发明实施例中包括但不限于采用上述方法来获得至少一个频率点的总的掩蔽值。
步骤203:根据至少一个频率点总的掩蔽值获得量化控制参数。
通过以上技术方案的实施,这样就可以不再计算频域信号的噪声和音调掩蔽特性,而只需统一计算频率点的掩蔽效应,从而在保证音质的情况下,减少了心理声学模型的计算量和复杂度,进而降低了音频编码器的工作负担。
实施例2:
本发明实施例2提供了另一种音频编码过程中生成量化控制参数的方法,如图3所示,该方法包括:
步骤300、接收频域信号;
步骤301、根据该频域信号确定一区域;
在具体实现过程中,这里确定的区域可以是该频域信号中任一区域,也可以是一个或多个区域。
步骤302、获得该区域内频域信号的能量;
在具体实现过程中,可以根据该区域内频域信号的幅度值,来计算得到该区域内频域信号的能量。例如,可以通过计算该区域内频域信号幅度值的平方来得到该区域内频域信号的能量。当然,本发明实施例中包括但不限于采用上述方法来获得区域内频域信号的能量。
步骤303、根据该区域内频域信号的能量获得该区域内频域信号的其他频率点对其中至少一个频率点总的掩蔽值。
在具体实现过程中,可以先计算出该区域内频域信号的至少一个频率点附近的频率在该频率点的掩蔽值;然后通过求和来得到该至少一个频率点的总的掩蔽值。这里,该至少一个频率点附近的频率可以是:对该至少一个频率点的掩蔽效应大于指定比值范围内的频率点,所述指定比值范围可以限定成0.1~1的范围,当然在本实施例中,不限定对其他频率点的选定。
步骤304:根据至少一个频率点总的掩蔽值获得量化控制参数。
具体来说,可以将该区域内频域信号划分成若干个组,对每一组中各个频率点的掩蔽值进行线性拟合处理,得到若干组折线的端点值;再将所述若干组折线的端点值作为控制量化步长的量化控制参数。上述进行线性拟合的方法是一种公知的数学方法,在此不再详述。
通过以上技术方案的实施,这样就可以不再计算频域信号的噪声和音调掩蔽特性,而只需统一计算频率点的掩蔽效应,从而在保证音质的情况下,减少了心理声学模型的计算量和复杂度,进而降低了音频编码器的工作负担。
实施例3:
本发明实施例3提供了另一种音频编码过程中生成量化控制参数的方法,如图4所示,该方法包括:
步骤400、接收频域信号;
步骤401、将所述频域信号的频谱分成N个分区,N为自然数;
在具体实现过程中,如果逐个计算频域信号中每个频率点的掩蔽值,那么计算量会较大;因此可以将整个频域信号划分成若干个小的分区,如本实施例3所述的N个分区;然后只计算各分区中心频率点的掩蔽值,而该分区中其他频率点的掩蔽值可以以该分区中心频率点的掩蔽值来替代,这样可以进一步减少了心理声学模型的计算量和复杂度。
这里为了保证后续和扩展函数卷积的精确度,分区应划分的足够小,一般所划分出的分区的宽度远小于一个临界频带,例如不超过0.2bark。
步骤402、根据所述N个分区中的频域信号获得所述各分区的能量。
这里,各个分区的上下边界实际上可以看成是频率点的扩展,当上下边界重合时,各个分区就成了频域信号中的各个频率点。
步骤403、获得所述各分区中的中心频率点对其中一个分区中的中心频率点总的掩蔽值。
步骤404、将所述一个分区中的中心频率点总的掩蔽值乘以所述一个分区的宽度,获得所述一个分区总的掩蔽值;
步骤405、将所述一个分区总的掩蔽值除以所述一个分区的谱线,获得所述一个分区中单根谱线总的掩蔽值;
在具体实现过程中,在获得该各分区中单根谱线总的掩蔽值之后,还可以根据各分区的能量,对该各分区上单根谱线总的掩蔽值进行调整。具体来说,若所述各分区的能量超过预设的阈值,则可以减小所述各分区上单根谱线总的掩蔽值,上述预设的阈值可以在进行音频编码过程中,根据实际需求进行设置;另外,若所述各分区的能量太低,小于预设的最低阈值时,还可以增加所述各分区上单根谱线总的掩蔽值。
步骤406、将所述N个分区分为M个组,其中M为小于N的自然数,对所述每组中分区的单根谱线总的掩蔽值进行线性拟合,获得多组折线的端点值;
在具体实现过程中,在所述得到多组折线的端点值之后,将所述多组折线的端点值和设定的绝对掩蔽值进行比较,若低于所述绝对掩蔽值,则将低于所述绝对掩蔽值的端点值设定为所述绝对掩蔽值,从而保证所得到的值是大于或等于绝对掩蔽值。
步骤407、将所述多组折线的端点值作为控制量化步长的量化控制参数。
举例来说,在进行步骤401划分出了N个分区之后,可以通过如下的公式来获得每一个分区的能量e(b):
e ( b ) = Σ w = w _ low w _ high X ( w ) 2
上式中,w_low和w_high分别表示每一个分区的谱线的上下边界;X(w)表示频域信号的幅度值,该值由频域信号来决定。
然后再计算各分区中心频率点的掩蔽值,每一个分区中心频率点的掩蔽值ecb(b)就可以按照如下公式计算:
ecb ( b ) = Σ bb = bb low bb hi e ( bb ) * mask ( bval ( bb ) , bval ( b ) )
上式中,b是表示所计算分区的索引值;bb表示该计算分区相邻分区的索引值;bblow表示相邻分区的下限,bbhi表示相邻分区的上限;bval(b)表示b分区中心频率点的临界频带Bark值,bval(bb)表示相邻bb分区中心频率点的bark值。
而上述的函数mask(bval(bb),bval(b))表示如图5所示的掩蔽特性,在图5中:横坐标表示频域信号的Bark值,纵坐标表示归一化为1的掩蔽特性;图中所示的曲线是频率点10附近的频率对该频率点的掩蔽效应;从中可以看出,距离该频率点10越远,则掩蔽效应越低,在本实施例中可以限定为对该频率点的掩蔽效应大于指定比值范围内的频率点,这里所述指定比值范围可以限定成0.1~1的范围。该图5中的掩蔽特性就可以用函数mask(bval(bb),bval(b))来表示。
然后再计算各分区总的掩蔽值,根据上一步所计算出来的各分区中心频率点的掩蔽值,再乘以各分区在bark阈的宽度,具体通过如下的公式来获得各分区总的掩蔽值en(b):
en(b)=ecb(b)*width(b)
上式中,ecb(b)为各分区中心频率点的掩蔽值;width(b)为各分区在bark阈的宽度。
在实际应用中,若将频域信号划分成了若干个分区,则可以将各分区总的掩蔽值除以该分区的谱线,来获得该各分区上单根谱线的掩蔽值;然后再根据各分区上单根谱线的掩蔽值,获得用于控制量化步长的量化控制参数;上述的谱线可以看成是在频谱上离散的各个点。
举例来说,首先计算各分区上单根谱线的掩蔽值,具体可以采用如下的公式来获得各分区单根谱线的掩蔽值eno(b):
eno(b)=en(b)/(w_high(b)-w_low(b)+1)
上式中,en(b)为b分区总的掩蔽值;w_high(b)和w_low(b)分别表示b分区谱线的上下边界。
然后,可以将分区划分成M个组(M为根据需要设定的常数值),每一组中包括有若干个分区;然后对每一组中若干个分区中单根谱线的掩蔽值eno(b)进行线性拟合,则可求得直线两端点的值:epB(m)和epE(m),其中m是组的索引值(m=1,2,...,M-1)。
其中,epB(m+1)和epE(m)所在的分区相同,但值不一定相同,可以采用下面的方式来取值:
令ep(0)=epB(0);
ep(m)=epE(m-1)和epB(m)的最小值(m=1,2,...,M-1);
ep(M)=epE(M-1)。
通过上述的取值方式,就可以得到M+1个ep值,并形成首尾相连的M个折线;然后就可以将这M+1个ep值作为量化控制参数,输送给量化控制模块,用于控制量化步长。
另外,在对掩蔽值进行线性拟合的过程中,还可以计算每一组中eno(b)和直线之间的偏移值,然后对ep(m)进行适应性的调整,以使线性拟合结果更加的准确。
值得注意的是,上述所举出的分区的例子中,各个分区的上下边界可以看成是频率点的扩展,当上下边界重合时,各个分区就成了频域信号中的各个频率点,但具体获得量化控制参数的过程两者是类似的。
通过以上技术方案的实施,就可以不再计算频域信号的噪声和音调掩蔽特性,而只需统一计算频率点的掩蔽效应,从而在保证音质的情况下,减少了心理声学模型的计算量和复杂度,进而降低了音频编码器的工作负担。
实施例4:
本发明实施例4提供了一种音频编码方法,如图6所示,该方法包括:
步骤600、接收时域信号;
步骤601、经过时频变换,将所述时域信号转换成频域信号;
步骤602、根据所述频域信号获得所述频域信号的能量;
获得频域信号能量的方法可以采用上述实施例中的方式,本发明实施例包括但不限于采取上述方式来获得频域信号的能量。
步骤603、根据所述频域信号的能量获得至少一个频率点总的掩蔽值;
获得至少一个频率点总的掩蔽值的方法可以采用上述实施例中的方式,本发明实施例包括但不限于采取上述方式来获得至少一个频率点总的掩蔽值。
步骤604、根据所述至少一个频率点总的掩蔽值获得量化控制参数。
获得量化控制参数的方法可以采用上述实施例中的方式,本发明实施例包括但不限于采取上述方式来获得量化控制参数。
步骤605、基于所述量化控制参数对所述频域信号进行量化和熵编码,生成音频比特流。
通过以上技术方案的实施,在进行心理声学处理时,就可以不再计算频域信号的噪声和音调掩蔽特性,而只需统一计算频率点的掩蔽效应,从而在保证音质的情况下,减少了心理声学模型的计算量和复杂度,进而降低了音频编码器的工作负担。
实施例5:
本发明实施例5提供一种心理声学装置,如图7所示,该装置包括:
频域信号接收单元,用于接收频域信号;
能量获取单元,用于根据所述频域信号获得所述频域信号的能量;具体获得频域信号的能量的方式见以上方法实施例中所述。
掩蔽值获取单元,根据所述频域信号的能量获得至少一个频率点总的掩蔽值;具体获得总的掩蔽值的方式见以上方法实施例中所述。
量化控制参数获取单元,用于根据所述至少一个频率点总的掩蔽值获得量化控制参数;具体获得量化控制参数的方式见以上方法实施例中所述。
另外,在具体实现过程中,本发明实施例5还提供了另一种心理声学装置,如图8所示,图8中,所述能量获取单元包括:
区域确定模块,用于根据所述频域信号确定一区域;
区域能量获取模块,用于获得所确定区域内频域信号的能量。
另外,所述能量获取单元还可包括:
分区划分模块,用于将所述频域信号的频谱分成N个分区,N为自然数;
分区能量获取模块,用于根据所述N个分区中的频域信号获得所述各分区的能量。
在将频域信号的频谱分成N个分区时,该掩蔽值获取单元还可用于获得所述各分区中的中心频率点对其中一个分区中的中心频率点总的掩蔽值。
进一步的,所述量化控制参数获取单元还可包括:
单根谱线掩蔽值获取模块,用于将所述掩蔽值获取单元所获取的所述一个分区中的中心频率点总的掩蔽值乘以所述一个分区的宽度,获得所述一个分区总的掩蔽值;并将所述一个分区总的掩蔽值除以所述一个分区的谱线,获得所述一个分区中单根谱线总的掩蔽值;
线性拟合处理模块,用于将所述N个分区分为M个组,其中M为小于N的自然数,对所述每组中分区的单根谱线总的掩蔽值进行线性拟合,获得多组折线的端点值,将所述多组折线的端点值作为控制量化步长的量化控制参数。
更进一步的,所述量化控制参数获取单元中还可包括:
端点值比较模块,用于将所述多组折线的端点值和设定的绝对掩蔽值进行比较,若低于所述绝对掩蔽值,则将低于所述绝对掩蔽值的端点值设定为所述绝对掩蔽值。
更进一步的,所述量化控制参数获取单元中还可包括:
掩蔽值调整模块,用于根据所述各分区的能量,对该各分区上单根谱线的掩蔽值进行调整;其中,若所述各分区的能量超过预设的阈值,则减小所述各分区上单根谱线的掩蔽值。
通过以上技术方案的实施,就可以不再计算频域信号的噪声和音调掩蔽特性,而只需统一计算频率点的掩蔽效应,从而在保证音质的情况下,减少了心理声学模型的计算量和复杂度,进而降低了音频编码器的工作负担。
实施例6:
本发明实施例6提供了一种音频编码设备,如图9所示为本实施例6所提供音频编码设备的结构示意图,该设备包括:
时域信号接收单元,用于接收时域信号;
时频转换单元,用于通过时频变换,将所述时域信号转换成频域信号;
心理声学装置,用于根据所述频域信号获得所述频域信号的能量,并根据所述频域信号的能量获得至少一个频率点总的掩蔽值,再根据所述至少一个频率点总的掩蔽值获得量化控制参数;
音频编码单元,用于基于所述量化控制参数对所述频域信号进行量化和熵编码,生成音频比特流。
另外,以上所述的心理声学装置可以为上述实施例5中所描述的心理声学装置。
值得注意的是,上述装置和设备实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
另外,本领域普通技术人员可以理解实现上述方法实施例中的全部或部分步骤是可以通过程序来指令相关的硬件完成,相应的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器、磁盘或光盘等。
综上所述,本发明实施例可以不再计算频域信号的噪声和音调掩蔽特性,而只需统一计算各个频率点的掩蔽效应,从而在保证音质的情况下,减少了心理声学模型的计算量和复杂度,进而降低了音频编码器的工作负担。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明实施例揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (16)

1.一种音频编码过程中生成量化控制参数的方法,其特征在于,所述方法包括:
接收音频频域信号;
根据所述音频频域信号获得所述音频频域信号的能量;
根据所述音频频域信号的能量获得至少一个频率点总的掩蔽值;所述获得至少一个频率点总的掩蔽值具体包括:计算出区域内音频频域信号的至少一个频率点附近的频率在该频率点的掩蔽值;再通过求和来得到该至少一个频率点总的掩蔽值;
根据所述至少一个频率点总的掩蔽值获得用于控制量化步长的量化控制参数。
2.根据权利要求1所述的方法,其特征在于,根据所述音频频域信号获得所述音频频域信号的能量,包括:
根据所述音频频域信号确定一区域;
获得所确定区域内音频频域信号的能量。
3.根据权利要求2所述的方法,其特征在于,所述根据所述音频频域信号的能量获得所述音频频域信号至少一个频率点总的掩蔽值,为:
根据所述区域内音频频域信号的能量获得所述区域内音频频域信号的其他频率点对其中至少一个频率点总的掩蔽值;
其中,所述其他频率点为:对所述至少一个频率点的掩蔽效应大于指定比值范围内的频率点。
4.根据权利要求1所述的方法,其特征在于,根据所述音频频域信号获得所述音频频域信号的能量,包括:
将所述音频频域信号的频谱分成N个分区,N为自然数;
根据所述N个分区中的音频频域信号获得所述各分区的能量。
5.根据权利要求4所述的方法,其特征在于,根据所述音频频域信号的能量获得至少一个频率点总的掩蔽值,包括:
获得所述各分区的中心频率点对其中一个分区的中心频率点总的掩蔽值。
6.根据权利要求5所述的方法,其特征在于,根据所述至少一个频率点总的掩蔽值获得量化控制参数,包括:
将所述一个分区中中心频率点总的掩蔽值乘以所述一个分区的宽度,获得所述一个分区总的掩蔽值;
将所述一个分区总的掩蔽值除以所述一个分区的谱线,获得所述一个分区中单根谱线总的掩蔽值;
将所述N个分区分为M个组,其中M为小于N的自然数,并对所述每组中分区的单根谱线总的掩蔽值进行线性拟合,获得多组折线的端点值;
将所获得的多组折线的端点值作为控制量化步长的量化控制参数。
7.一种音频编码方法,其特征在于,所述方法包括:
接收时域信号;
经过时频变换,将所述时域信号转换成音频频域信号;
根据所述音频频域信号获得所述音频频域信号的能量;
根据所述音频频域信号的能量获得至少一个频率点总的掩蔽值;所述获得至少一个频率点总的掩蔽值具体包括:计算出区域内音频频域信号的至少一个频率点附近的频率在该频率点的掩蔽值;再通过求和来得到该至少一个频率点总的掩蔽值;
根据所述至少一个频率点总的掩蔽值获得用于控制量化步长的量化控制参数;
基于所述量化控制参数对所述音频频域信号进行量化和熵编码,生成音频比特流。
8.一种音频编码过程中生成量化控制参数的装置,其特征在于,所述装置包括:
频域信号接收单元,用于接收音频频域信号;
能量获取单元,用于根据所述音频频域信号获得所述音频频域信号的能量;
掩蔽值获取单元,根据所述音频频域信号的能量获得至少一个频率点总的掩蔽值;所述获得至少一个频率点总的掩蔽值具体包括:计算出区域内音频频域信号的至少一个频率点附近的频率在该频率点的掩蔽值;再通过求和来得到该至少一个频率点总的掩蔽值;
量化控制参数获取单元,用于根据所述至少一个频率点总的掩蔽值获得用于控制量化步长的量化控制参数。
9.根据权利要求8所述的装置,其特征在于,所述能量获取单元包括:
区域确定模块,用于根据所述音频频域信号确定一区域;
区域能量获取模块,用于获得所确定区域内音频频域信号的能量。
10.根据权利要求8所述的装置,其特征在于,所述能量获取单元包括:
分区划分模块,用于将所述音频频域信号的频谱分成N个分区,N为自然数;
分区能量获取模块,用于根据所述N个分区中的音频频域信号获得所述各分区的能量。
11.根据权利要求10所述的装置,其特征在于,
所述掩蔽值获取单元还用于获得所述各分区中的中心频率点对其中一个分区中的中心频率点总的掩蔽值。
12.根据权利要求11所述的装置,其特征在于,所述量化控制参数获取单元包括:
单根谱线掩蔽值获取模块,用于将所述掩蔽值获取单元所获取的所述一个分区中的中心频率点总的掩蔽值乘以所述一个分区的宽度,获得所述一个分区总的掩蔽值;并将所述一个分区总的掩蔽值除以所述一个分区的谱线,获得所述一个分区中单根谱线总的掩蔽值;
线性拟合处理模块,用于将所述N个分区分为M个组,其中M为小于N的自然数,对所述每组中分区的单根谱线总的掩蔽值进行线性拟合,获得多组折线的端点值,将所述多组折线的端点值作为控制量化步长的量化控制参数。
13.如权利要求12所述的装置,其特征在于,所述量化控制参数获取单元中还包括:
端点值比较模块,用于将所述多组折线的端点值和设定的绝对掩蔽值进行比较,若低于所述绝对掩蔽值,则将低于所述绝对掩蔽值的端点值设定为所述绝对掩蔽值。
14.如权利要求12所述的装置,其特征在于,所述量化控制参数获取单元还包括:
掩蔽值调整模块,用于根据所述各分区的能量,对该各分区上单根谱线的掩蔽值进行调整;其中,若所述各分区的能量超过预设的阈值,则减小所述各分区上单根谱线的掩蔽值。
15.一种音频编码设备,其特征在于,所述音频编码设备包括:
时域信号接收单元,用于接收时域信号;
时频转换单元,用于通过时频变换,将所述时域信号转换成音频频域信号;
心理声学装置,用于根据所述音频频域信号获得所述音频频域信号的能量,并根据所述音频频域信号的能量获得至少一个频率点总的掩蔽值,再根据所述至少一个频率点总的掩蔽值获得用于控制量化步长的量化控制参数;所述获得至少一个频率点总的掩蔽值具体包括:计算出区域内音频频域信号的至少一个频率点附近的频率在该频率点的掩蔽值;再通过求和来得到该至少一个频率点总的掩蔽值;
音频编码单元,用于基于所述量化控制参数对所述音频频域信号进行量化和熵编码,生成音频比特流。
16.根据权利要求15所述的音频编码设备,其特征在于,所述心理声学装置为权利要求8至14任一项所述的音频编码过程中生成量化控制参数的装置。
CN2009101695350A 2009-09-08 2009-09-08 生成量化控制参数的方法、装置及音频编码设备 Active CN101645272B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2009101695350A CN101645272B (zh) 2009-09-08 2009-09-08 生成量化控制参数的方法、装置及音频编码设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2009101695350A CN101645272B (zh) 2009-09-08 2009-09-08 生成量化控制参数的方法、装置及音频编码设备

Publications (2)

Publication Number Publication Date
CN101645272A CN101645272A (zh) 2010-02-10
CN101645272B true CN101645272B (zh) 2012-01-25

Family

ID=41657125

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009101695350A Active CN101645272B (zh) 2009-09-08 2009-09-08 生成量化控制参数的方法、装置及音频编码设备

Country Status (1)

Country Link
CN (1) CN101645272B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102169694B (zh) * 2010-02-26 2012-10-17 华为技术有限公司 生成心理声学模型的方法及装置
CN104703093B (zh) * 2013-12-09 2018-07-17 中国移动通信集团公司 一种音频输出方法及装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6456968B1 (en) * 1999-07-26 2002-09-24 Matsushita Electric Industrial Co., Ltd. Subband encoding and decoding system
CN101046962A (zh) * 2006-03-28 2007-10-03 索尼株式会社 音频信号编码方法、程序及记录介质和音频信号编码装置
EP1887564A1 (en) * 2006-08-08 2008-02-13 STMicroelectronics Asia Pacific Pte Ltd. Estimating rate controlling parameters in perceptual audio encoders
CN101223576A (zh) * 2005-07-15 2008-07-16 三星电子株式会社 从音频信号提取重要频谱分量的方法和设备以及使用其的低比特率音频信号编码和/或解码方法和设备
CN101425293A (zh) * 2008-09-24 2009-05-06 天津大学 一种高效感知音频比特分配方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6456968B1 (en) * 1999-07-26 2002-09-24 Matsushita Electric Industrial Co., Ltd. Subband encoding and decoding system
CN101223576A (zh) * 2005-07-15 2008-07-16 三星电子株式会社 从音频信号提取重要频谱分量的方法和设备以及使用其的低比特率音频信号编码和/或解码方法和设备
CN101046962A (zh) * 2006-03-28 2007-10-03 索尼株式会社 音频信号编码方法、程序及记录介质和音频信号编码装置
EP1887564A1 (en) * 2006-08-08 2008-02-13 STMicroelectronics Asia Pacific Pte Ltd. Estimating rate controlling parameters in perceptual audio encoders
CN101425293A (zh) * 2008-09-24 2009-05-06 天津大学 一种高效感知音频比特分配方法

Also Published As

Publication number Publication date
CN101645272A (zh) 2010-02-10

Similar Documents

Publication Publication Date Title
US20210110836A1 (en) Adaptive transition frequency between noise fill and bandwidth extension
DE69732619T2 (de) Verfahren zum Codieren von digitalen Audiosignalen
CN100395817C (zh) 编码设备、解码设备和解码方法
US9111532B2 (en) Methods and systems for perceptual spectral decoding
RU2494477C2 (ru) Устройство и способ генерирования выходных данных расширения полосы пропускания
EP2022043B1 (de) Informationssignalcodierung
US8543385B2 (en) Enhancing perceptual performance of SBR and related HFR coding methods by adaptive noise-floor addition and noise substitution limiting
CN101662288B (zh) 音频编码、解码方法及装置、系统
JP4168976B2 (ja) オーディオ信号符号化装置及び方法
CA2489441A1 (en) Audio coding system using spectral hole filling
KR20030076576A (ko) 고주파 복원 방법을 이용하는 코딩 시스템의 성능 향상방법 및 시스템
CN101336451A (zh) 音频信号编码的方法和装置
WO1988004117A1 (en) Process for transmitting digital audio-signals
CN101783141A (zh) 编码装置和译码装置
CN101645272B (zh) 生成量化控制参数的方法、装置及音频编码设备
CN101377925B (zh) 提高g.711的感知质量的自适应调整方法
CN105261373B (zh) 用于带宽扩展编码的自适应栅格构造方法和装置
CN2929904Y (zh) 一种信号编解码设备
Sinha et al. A fractal self-similarity model for the spectral representation of audio signals
JP2003271199A (ja) オーディオ信号の符号化方法及び符号化装置
KR101170466B1 (ko) Mdct 영역에서의 후처리 방법, 및 장치
JP2001184091A (ja) オーディオ信号符号化方法
JP2002116799A (ja) オーディオ信号符号化装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 518129 Building 2, B District, Bantian HUAWEI base, Longgang District, Shenzhen, Guangdong.

Patentee after: Huawei terminal (Shenzhen) Co.,Ltd.

Address before: 518129 Building 2, B District, Bantian HUAWEI base, Longgang District, Shenzhen, Guangdong.

Patentee before: HUAWEI DEVICE Co.,Ltd.

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20181224

Address after: 523808 Southern Factory Building (Phase I) Project B2 Production Plant-5, New Town Avenue, Songshan Lake High-tech Industrial Development Zone, Dongguan City, Guangdong Province

Patentee after: HUAWEI DEVICE Co.,Ltd.

Address before: 518129 Building 2, B District, Bantian HUAWEI base, Longgang District, Shenzhen, Guangdong.

Patentee before: Huawei terminal (Shenzhen) Co.,Ltd.