CN107545900B - 带宽扩展编码和解码中高频弦信号生成的方法和装置 - Google Patents

带宽扩展编码和解码中高频弦信号生成的方法和装置 Download PDF

Info

Publication number
CN107545900B
CN107545900B CN201710699719.2A CN201710699719A CN107545900B CN 107545900 B CN107545900 B CN 107545900B CN 201710699719 A CN201710699719 A CN 201710699719A CN 107545900 B CN107545900 B CN 107545900B
Authority
CN
China
Prior art keywords
frequency
chord
band
sub
string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710699719.2A
Other languages
English (en)
Other versions
CN107545900A (zh
Inventor
王磊
闫建新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Digital Rise Technology Co Ltd
Original Assignee
Digital Rise Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Digital Rise Technology Co Ltd filed Critical Digital Rise Technology Co Ltd
Priority to CN201710699719.2A priority Critical patent/CN107545900B/zh
Publication of CN107545900A publication Critical patent/CN107545900A/zh
Application granted granted Critical
Publication of CN107545900B publication Critical patent/CN107545900B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明涉及带宽扩展编码和解码中高频弦信号生成的方法和装置。所述带宽扩展编码中高频弦信号生成的方法,包括:S1、对输入音频信号进行CQMF分析,得到多个等带宽的子带;S2、判断多个子带中的高频子带是否需要加弦,获得高频加弦子带的序号;S3、计算高频加弦子带加弦的频率和相位;S4、确定加弦起始块以及弦的平均幅度;S5、复用编码参数,输出编码码流,所述编码参数包括高频加弦子带的序号、高频加弦子带加弦的频率和相位以及加弦起始块和平均幅度。本发明能够反映每个高频子带弦的真实频率和相位,且加弦的频率更加准确,不会带来频率漂移。

Description

带宽扩展编码和解码中高频弦信号生成的方法和装置
技术领域
本发明涉及数字音频编解码技术,更具体地说,涉及一种带宽扩展编码和解码中高频生成的方法和装置。
背景技术
数字音频信号的带宽扩展(BandWidth Extension,简称BWE)编码技术有很多,性能也参差不齐,例如ISO/IEC 14496-3MPEG-4中描述的频谱带复制(Spectral BandwidthReplication,简称SBR)编码和3GPP AMR-WB+编码方法中的带宽扩展技术BWE等。
已经公开且用于国际标准中的带宽扩展编码技术主要是SBR编码算法。图1示出了SBR编码的具体原理框图。SBR是频域处理的算法,其编码原理为:每帧信号通过64子带的正交镜像滤波器组(Quadrature Mirror Filter,简称QMF)获得64个均匀的子频带,每个子频带包含32个样点,根据当前信号的瞬态特性划分一个合理的时频栅格,每个栅格计算一个能量信息并进行huffman编码。该算法同时包括音调性检查并传输个别的单个正弦信号参数信息。图2示出了SBR解码的具体原理框图。SBR解码原理为:经过核心解码器(AAC)输出的解码脉冲编码调制(Pulse Code Modulation,简称PCM)信号通过32子带的QMF获得32个均匀的子频带,每个子频带包含32个样点,根据SBR解复用输出的控制参数进行高频生成,然后根据控制参数以及包络数据对高频进行调整,然后将低频32子带QMF的输出以及经调整后高频子带QMF的输出一起进入到64带QMF合成,最后输出全频带PCM音频信号。
SBR技术中高频弦生成如图3所示,其中实线对应实部高频弦生成,虚线对应虚部高频弦生成。在SBR中,高频弦生成的公式为:
Figure BDA0001380038820000011
Figure BDA0001380038820000021
其中,
Figure BDA0001380038820000022
和fIndexSine(i)定义如下:
Figure BDA0001380038820000023
fIndexSine(i)=(index+i)mod(4)
其中,Index是上一帧中最后的fIndexSine值。
由此可知,SBR技术在高频生成时存在以下主要问题:(1)所有子带生成的弦频率是固定的,不能真实地反映每个子带弦的频率;(2)所有子带的相位都是固定的,不能真实地反映每个子带弦的相位;(3)SBR每个尺度因子带加一个弦,如果一个尺度因子带有3个QMF带,则把弦加在中间那个QMF带上,如果真实的弦是在上边或者下边的QMF带上,则这种方法会带来频率漂移。
发明内容
本发明要解决的技术问题在于,针对现有技术的上述缺陷,提供一种带宽扩展编码和解码中高频弦信号生成的方法和装置,能够反映每个高频子带弦真实的频率和相位。
本发明为解决其技术问题在第一方面提出一种带宽扩展编码中高频弦信号生成的方法,包括如下步骤:
S1、对输入音频信号进行复正交镜像滤波分析,得到多个等带宽的子带;
S2、判断所述多个子带中的高频子带是否需要加弦,获得高频加弦子带的序号;
S3、计算所述高频加弦子带加弦的频率和相位;
S4、判断所述高频加弦子带是否为第一帧,若是则进一步判断所述高频加弦子带均分的多个块中的哪一个块是加弦起始块并计算所述加弦起始块之前所有块的平均幅度以及所述加弦起始块及其后所有块的平均幅度,若否则计算所述高频加弦子带所有块的平均幅度;
S5、复用编码参数,输出编码码流,所述编码参数包括高频加弦子带的序号、高频加弦子带加弦的频率和相位以及加弦起始块和平均幅度。
根据本发明第一方面的一个实施例中,所述步骤S2中判断所述多个子带中的高频子带是否需要加弦具体包括:
当所述多个子带中的低频子带和高频子带都具有很强的弦信号时,所述高频子带不需要加弦;
当所述多个子带中的低频子带没有弦信号而高频子带有很强的弦信号时,所述高频子带需要加弦。
根据本发明第一方面的一个实施例中,所述步骤S3具体包括:
S31、对所述高频加弦子带的实部和虚部分别进行加窗处理;
S32、对加窗后的实部和虚部分别进行快速傅里叶变换;
S33、对快速傅里叶变换后的实部和虚部分别计算功率谱密度;
S34、对实部和虚部的功率谱密度分别取对数并相加,得到功率谱密度和;
S35、查找所述功率谱密度和的最大值,并记录所述最大值的位置即为所述高频加弦子带加弦的频率。
根据本发明第一方面的一个实施例中,所述步骤S3还包括:
S36、利用所述步骤S32中得到的实部和虚部的快速傅里叶变换值,分别计算所述步骤S35中找到的最大值的位置对应的实部和虚部相位,即为所述高频加弦子带加弦的相位。
本发明为解决其技术问题在第二方面提出一种带宽扩展解码中高频弦信号生成的方法,包括如下步骤:
S1、对输入的编码码流解复用,获得编码参数,所述编码参数包括高频加弦子带的序号、高频加弦子带加弦的频率和相位以及加弦起始块和平均幅度;
S2、基于所述高频加弦子带加弦的频率和相位计算得到高频加弦子带的实部和虚部的单位幅度弦信号;
S3、基于所述加弦起始块和平均幅度对实部和虚部的单位幅度弦信号进行幅度调制,得到高频加弦子带的弦信号。
根据本发明第二方面的一个实施例中,所述步骤S3具体包括:
当所述高频加弦子带为第一帧且加弦起始块不是第一块时,利用所述加弦起始块之前所有块的平均幅度对所述加弦起始块之前所有块的实部和虚部的单位幅度弦信号进行幅度调制,利用所述加弦起始块及其后所有块的平均幅度对所述加弦起始块及其后所有块的实部和虚部的单位幅度弦信号进行幅度调制;
当所述高频加弦子带为第一帧且加弦起始块为第一块时,利用所述高频加弦子带所有块的平均幅度对实部和虚部的单位幅度弦信号进行幅度调制。
根据本发明第二方面的一个实施例中,所述步骤S3具体包括:
当所述高频加弦子带为后续帧时,利用高频加弦子带所有块的平均幅度对实部和虚部的单位幅度弦信号进行幅度调制,并将当前帧的幅度调制后的实部弦信号和虚部弦信号分别与上一帧的幅度调制后的实部弦信号和虚部弦信号进行加窗相加,得到高频加弦子带的弦信号。
本发明为解决其技术问题在第三方面提出一种带宽扩展编码中高频弦信号生成的装置,包括:
复正交镜像滤波分析模块,用于对输入音频信号进行复正交镜像滤波分析,得到多个等带宽的子带;
加弦分析模块,用于判断所述多个子带中的高频子带是否需要加弦,获得高频加弦子带的序号;
第一计算模块,用于计算所述高频加弦子带加弦的频率和相位;
第二计算模块,用于判断所述高频加弦子带是否为第一帧,若是则进一步判断所述高频加弦子带均分的多个块中的哪一个块是加弦起始块并计算所述加弦起始块之前所有块的平均幅度以及所述加弦起始块及其后所有块的平均幅度,若否则计算所述高频加弦子带所有块的平均幅度;
参数复用模块,用于复用编码参数,输出编码码流,所述编码参数包括高频加弦子带的序号、高频加弦子带加弦的频率和相位以及加弦起始块和平均幅度。
根据本发明第三方面的一个实施例中,所述第一计算模块具体包括:
加窗单元,用于对所述高频加弦子带的实部和虚部分别进行加窗处理;
快速傅里叶变换单元,用于对加窗后的实部和虚部分别进行快速傅里叶变换;
功率谱密度计算单元,用于对快速傅里叶变换后的实部和虚部分别计算功率谱密度;
求和单元,用于对实部和虚部的功率谱密度分别取对数并相加,得到功率谱密度和;
查找单元,用于查找所述功率谱密度和的最大值,并记录所述最大值的位置即为所述高频加弦子带加弦的频率;
相位计算单元,利用所述快速傅里叶变换单元计算得到的实部和虚部的快速傅里叶变换值,分别计算所述查找单元找到的最大值的位置对应的实部和虚部相位,即为所述高频加弦子带加弦的相位。
本发明为解决其技术问题在第四方面提出一种带宽扩展解码中高频弦信号生成的装置,包括:
参数解复用模块,用于对输入的编码码流解复用,获得编码参数,所述编码参数包括高频加弦子带的序号、高频加弦子带加弦的频率和相位以及加弦起始块和平均幅度;
单位幅度弦信号计算模块,用于基于所述高频加弦子带加弦的频率和相位计算得到高频加弦子带的实部和虚部的单位幅度弦信号;
幅度调制模块,用于基于所述加弦起始块和平均幅度对实部和虚部的单位幅度弦信号进行幅度调制,得到高频加弦子带的弦信号。
根据本发明的带宽扩展编码和解码中高频弦信号生成的方法和装置具有如下技术效果:
(1)传输每个子带弦的频率,从而反映每个子带弦真实的频率;
(2)传输每个子带弦的相位,从而反映每个子带弦真实的相位;
(3)当前帧如果判断有加弦的子带,则自适应的将尺度因子带划分为最高分辨率,即每个QMF带为一个尺度因子带,保证将弦加在正确的QMF带上,加弦的频率更加准确,不会带来频率漂移。
附图说明
下面将结合附图及实施例对本发明作进一步说明,附图中:
图1是现有的SBR编码方法的原理框图;
图2是现有的SBR解码方法的原理框图;
图3是现有的SBR编码方法中高频弦生成的简要示意图;
图4是本发明一个实施例的带宽扩展编码中高频弦信号生成的方法的流程图;
图5是本发明一个实施例的带宽扩展解码中高频弦信号生成的方法的流程图;
图6是本发明一个实施例中利用低频子带生成高频子带的简要示意图;
图7是本发明一个实施例的带宽扩展编码中高频弦信号生成时的加窗处理的示意图;
图8是本发明一个实施例的带宽扩展解码中高频弦信号生成时的加窗处理的示意图;
图9是本发明一个实施例的带宽扩展编码中高频弦信号生成的装置的逻辑框图;
图10是本发明一个实施例的带宽扩展解码中高频弦信号生成的装置的逻辑框图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
图4示出了根据本发明一个实施例的带宽扩展编码中高频弦信号生成的方法100的流程图。如图4所示,该带宽扩展编码中高频弦信号生成的方法100包括如下步骤:
步骤S110中,对输入音频信号进行CQMF(Complex Quadrature Mirror Filter,复正交镜像滤波器组)分析,即对输入音频信号利用复正交镜像滤波器组进行复正交分析滤波,得到多个等带宽的子带信号。
然后步骤S120中,判断所述多个子带中的高频子带是否需要加弦,获得高频加弦子带的序号。具体来说,当所述多个子带中的低频子带和高频子带都具有很强的弦信号时,所述高频子带不需要加弦;当所述多个子带中的低频子带没有弦信号而高频子带有很强的弦信号时,所述高频子带需要加弦。
然后步骤S130中,计算所述高频加弦子带加弦的频率和相位。此步骤在后续将结合具体示例给出详细说明。
然后步骤S140中,判断所述高频加弦子带是否为第一帧。若是第一帧,则进一步将高频加弦子带均分为多个块,并判断所述多个块中的哪一个块是加弦起始块。如果所述加弦起始块不是第一块,则计算所述加弦起始块之前所有块的平均幅度以及所述加弦起始块及其后所有块的平均幅度,如果所述加弦起始块是第一块,则计算所有块的平均幅度。同样地,若所述高频加弦子带并非第一帧而是后续帧,则计算整个高频加弦子带的平均幅度。
然后步骤S150中,复用编码参数,输出编码码流,所述编码参数包括前述步骤中获得的高频加弦子带的序号、高频加弦子带加弦的频率和相位以及加弦起始块和平均幅度。
本发明上述的带宽扩展编码中高频弦信号生成的方法100将每个高频加弦子带弦的频率和相位传送至解码端,从而能够反映每个高频子带弦的真实频率和相位,且加弦的频率更加准确,不会带来频率漂移。
基于以上的带宽扩展编码中高频弦信号生成的方法,本发明还提出一种带宽扩展解码中高频弦信号生成的方法。图5示出了根据本发明一个实施例的带宽扩展解码中高频弦信号生成的方法200的流程图。如图5所示,该带宽扩展解码中高频弦信号生成的方法200包括如下步骤:
步骤S210中,对输入的编码码流解复用,获得编码参数,所述编码参数包括高频加弦子带的序号、高频加弦子带加弦的频率和相位以及加弦起始块和平均幅度。
然后步骤S220中,基于所述高频加弦子带加弦的频率和相位计算得到高频加弦子带的实部和虚部的单位幅度弦信号。
然后步骤S230中,基于所述加弦起始块和平均幅度对实部和虚部的单位幅度弦信号进行幅度调制,得到高频加弦子带的弦信号。其中,当所述高频加弦子带为第一帧且加弦起始块不是第一块时,利用所述加弦起始块之前所有块的平均幅度对所述加弦起始块之前所有块的实部和虚部的单位幅度弦信号进行幅度调制,利用所述加弦起始块及其后所有块的平均幅度对所述加弦起始块及其后所有块的实部和虚部的单位幅度弦信号进行幅度调制;当所述高频加弦子带为第一帧且加弦起始块为第一块时,利用所述高频加弦子带所有块的平均幅度对实部和虚部的单位幅度弦信号进行幅度调制;当所述高频加弦子带为后续帧时,利用高频加弦子带所有块的平均幅度对实部和虚部的单位幅度弦信号进行幅度调制,并将当前帧的幅度调制后的实部弦信号和虚部弦信号分别与上一帧的幅度调制后的实部弦信号和虚部弦信号进行加窗相加,得到高频加弦子带的弦信号。
下面以32子带CQMF分析为例,给出本发明带宽扩展编码中高频弦生成的方法和带宽扩展解码中高频弦生成的方法的具体实现过程。需要说明的是,本发明对于SBR中所采用的64带QMF、NELA-BWE中所采用的自适应CQMF滤波器也同样适用。同时,以下虽然给出的是在复数域的一个实施例,须知实数域只是复数域的一种特殊情况,所以,本发明在实数域同样适用。
基于本示例的带宽扩展编码中高频弦信号生成的方法的具体实现过程如下:
第一步,CQMF分析。
2048个PCM样本点输入到32子带CQMF分析滤波器组中,得到32个子带,每个子带有64个CQMF样本点,每个样本点均为复数,分成实部Re和虚部Im分别表示为:
Re[k][n] k=0,1,...,31 n=0,1,...,63
Im[k][n] k=0,1,...,31 n=0,1,...,63
第二步,判断高频子带m是否需要加弦。
本发明中用低频子带k生成高频子带m如图6所示。当低频子带k和高频子带m都有很强的弦信号时,高频子带m不需要加弦;当低频子带k没有弦信号而高频子带m有很强的弦信号时,高频子带m需要加弦。该高频加弦子带的序号m被传送到解码端。
第三步,计算高频加弦子带m加弦的频率和相位,具体计算过程如下:
步骤31,对高频加弦子带m的实部和虚部分别进行重叠加窗处理,如图7所示。其中,每帧有64个样本点重叠。也即,窗长为128个CQMF样本点,包括前一帧重叠的64个CQMF样本点和当前帧的64个CQMF样本点。
Wre[m][n]=Re[m][n]·win[n] n=0,1...,127
Wim[m][n]=Im[m][n]·win[n] n=0,1...,127
其中,Wre[m][n]表示加窗后的实部,Wim[m][n]表示加窗后的虚部,win[n]优选为正弦窗。
步骤32,对高频加弦子带m的加窗后的实部和虚部分别进行FFT(Fast FourierTransformation,快速傅里叶变换)计算,如下:
Figure BDA0001380038820000091
Figure BDA0001380038820000092
其中,Xre[m][k]和Xim[m][k]均为复数,k=0,1...,127,n=0,1...,127。
步骤33,对高频加弦子带m的FFT处理后的实部和虚部分别进行PSD(PowerSpectral Density,功率谱密度)计算,如下:
Pre[m][k]=|Xre[m][k]·Xre*[m][k]|
Pim[m][k]=|Xim[m][k]·Xim*[m][k]|
其中,*代表共轭。因为功率谱是偶对称的,所以只需要前面的64点即可,即k=0,1,…,63。
步骤34,对高频加弦子带m的实部和虚部的PSD值分别取对数,并相加,得到功率谱密度和(和PSD),如下:
S[m][k]=10·log10Pre[m][k]+10·log10Pim[m][k]
其中,k=0,1,…,63。
步骤35,查找和PSD的最大值,并记录该最大值的位置l,0≤l<63。该位置l即为高频加弦子带m加弦的频率,被传送到解码端。
步骤36,利用步骤32中得到的实部和虚部的FFT值,分别计算步骤35中找到的最大值的位置l对应的实部和虚部相位,如下:
Figure BDA0001380038820000101
Figure BDA0001380038820000102
其中,Im(X)表示取复数X的虚部,Re(X)表示取复数X的实部。该实部和虚部相位进行量化后被传送到解码端。
第四步,确定加弦起始块和平均幅度。
如果加弦的是第一帧,则需要判断加弦的起始块。将高频加弦子带m的64个CQMF样本点均匀分成四块,分别是第0、1、2、3块,然后判断加弦起始块是第几块。如果加弦起始块不是第0块,则需要计算加弦起始块前所有块的平均幅度sineLevel0以及加弦块及其后所有块的平均幅度sineLevel1。如果加弦起始块是第0块,则计算所有块的平均幅度sineLevel。如果加弦的不是第一帧而是后续帧,亦计算整个高频加弦子带m的平均幅度sineLevel。最后将平均幅度量化后与加弦起始块一起传输到解码端。
基于以上示例的带宽扩展解码中高频弦信号生成的方法的具体实现过程如下:
第一步,解复用编码码流,得到需要加弦的高频子带序号m以及该高频子带加弦的频率l、实部相位phaseReal、虚部相位phaseImag和加弦起始块以及弦的平均幅度。
第二步,计算得到实部和虚部的单位幅度弦信号,如下:
qmfHarmReal[n]=cos(2.0*PI*n*l/128+phaseReal)
qmfHarmImag[n]=cos(2.0*PI*n*l/128+phaseImag)
其中,PI是圆周率,l是加弦的频率,phaseReal是加弦实部相位、phaseImag是加弦虚部相位,n=0,1,2,…,127。
第三步,对实部和虚部的单位幅度弦信号进行幅度调制。具体来说,分三种情况。
第一种情况:当加弦的是第一帧且加弦起始块不是第0块时,则得到加弦起始块前的平均幅度sineLevel0和加弦起始块后的平均幅度sineLevel1,对实部和虚部的单位幅度弦信号进行幅度调制,如下
加弦起始块前:
realPart[n]=sineLevel0*qmfHarmReal[n]
imagPart[n]=sineLevel0*qmfHarmImag[n]
加弦起始块后:
realPart[n]=sineLevel1*qmfHarmReal[n]
imagPart[n]=sineLevel1*qmfHarmImag[n]
n=0,1,2,…,63
第二种情况:当加弦的是第一帧且加弦起始块是第0块,则得到所有块的平均幅度sineLevel,对实部和虚部的单位幅度弦信号进行幅度调制,如下:
realPart[n]=sineLevel*qmfHarmReal[n]
imagPart[n]=sineLevel*qmfHarmImag[n]
n=0,1,2,…,63
第三种情况:当加弦的为后续帧时,为了加弦的平滑性,需要对当前帧及其上一帧进行加窗相加,如图8所示。
realPart[n]=sineLevel-1*qmfHarmReal-1[n+64]*sin(PI/128*(n+64+0.5))+sineLevel*qmfHarmReal[n]*sin(PI/128*(n+0.5))
imagPart[n]=sineLevel-1*qmfHarmImag-1[n+64]*sin(PI/128*(n+64+0.5))+sineLevel*qmfHarmImag[n]*sin(PI/128*(n+0.5))
其中,上标-1指的是上一帧的数据,PI是圆周率,n=0,1,2,…,63。
基于以上介绍的带宽扩展编码中高频弦信号生成的方法,本发明还提出一种带宽扩展编码中高频弦信号生成的装置。图9示出了根据本发明一个实施例的带宽扩展编码中高频弦信号生成的装置300的逻辑框图。如图9所示,该装置300包括复正交镜像滤波分析模块310、加弦分析模块320、第一计算模块330、第二计算模块340和参数复用模块350。其中,复正交镜像滤波分析模块310用于对输入音频信号进行复正交镜像滤波分析,得到多个等带宽的子带。加弦分析模块320用于判断所述多个子带中的高频子带是否需要加弦,获得高频加弦子带的序号。具体来说,当所述多个子带中的低频子带和高频子带都具有很强的弦信号时,所述高频子带不需要加弦;当所述多个子带中的低频子带没有弦信号而高频子带有很强的弦信号时,所述高频子带需要加弦。第一计算模块330用于计算所述高频加弦子带加弦的频率和相位。第二计算模块340用于判断所述高频加弦子带是否为第一帧,若是则进一步判断所述高频加弦子带均分的多个块中的哪一个块是加弦起始块并计算所述加弦起始块之前所有块的平均幅度以及所述加弦起始块及其后所有块的平均幅度,若否则计算所述高频加弦子带所有块的平均幅度。参数复用模块350用于复用前述获得的编码参数,输出编码码流,所述编码参数包括高频加弦子带的序号、高频加弦子带加弦的频率和相位以及加弦起始块和平均幅度。
根据本发明的具体实施例中,第一计算模块进一步包括加窗单元、FFT单元、PSD计算单元、求和单元、查找单元和相位计算单元。加窗单元用于对所述高频加弦子带的实部和虚部分别进行加窗处理。FFT单元用于对加窗后的实部和虚部分别进行快速傅里叶变换。PSD计算单元用于对快速傅里叶变换后的实部和虚部分别计算功率谱密度PSD值。求和单元用于对实部和虚部的功率谱密度PSD值分别取对数并相加,得到功率谱密度和(即和PSD)。查找单元用于查找和PSD的最大值,并记录所述最大值的位置即为所述高频加弦子带加弦的频率。相位计算单元利用FFT单元计算得到的实部和虚部的FFT值,分别计算查找单元找到的最大值的位置对应的实部和虚部相位,即为所述高频加弦子带加弦的相位。
有关装置300中各模块的具体实现,可参见前述对带宽扩展编码中高频弦信号生成的方法100及其示例的相关描述。
基于以上介绍的带宽扩展解码中高频弦信号生成的方法,本发明还提出一种带宽扩展解码中高频弦信号生成的装置。图10示出了根据本发明一个实施例的带宽扩展解码中高频弦信号生成的装置400的逻辑框图。如图4所示,该装置400包括参数解复用模块410、单位幅度弦信号计算模块420和幅度调制模块430。参数解复用模块410用于对输入的编码码流解复用,获得编码参数,所述编码参数包括高频加弦子带的序号、高频加弦子带加弦的频率和相位以及加弦起始块和平均幅度。单位幅度弦信号计算模块420用于基于所述高频加弦子带加弦的频率和相位计算得到高频加弦子带的实部和虚部的单位幅度弦信号。幅度调制模块430用于基于所述加弦起始块和平均幅度对实部和虚部的单位幅度弦信号进行幅度调制,得到高频加弦子带的弦信号。有关装置400中各模块的具体实现,可参见前述对带宽扩展解码中高频弦信号生成的方法200及其示例的相关描述。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种带宽扩展编码中高频弦信号生成的方法,其特征在于,包括如下步骤:
S1、对输入音频信号进行复正交镜像滤波分析,得到多个等带宽的子带;
S2、判断所述多个子带中的高频子带是否需要加弦,获得高频加弦子带的序号;
S3、计算所述高频加弦子带加弦的频率和相位;
S4、判断所述高频加弦子带是否为第一帧,若是则进一步判断所述高频加弦子带均分的多个块中的哪一个块是加弦起始块并计算所述加弦起始块之前所有块的平均幅度以及所述加弦起始块及其后所有块的平均幅度,若否则计算所述高频加弦子带所有块的平均幅度;
S5、复用编码参数,输出编码码流,所述编码参数包括高频加弦子带的序号、高频加弦子带加弦的频率和相位以及加弦起始块和平均幅度。
2.根据权利要求1所述的方法,其特征在于,所述步骤S2中判断所述多个子带中的高频子带是否需要加弦具体包括:
当所述多个子带中的低频子带和高频子带都具有很强的弦信号时,所述高频子带不需要加弦;
当所述多个子带中的低频子带没有弦信号而高频子带有很强的弦信号时,所述高频子带需要加弦。
3.根据权利要求1所述的方法,其特征在于,所述步骤S3具体包括:
S31、对所述高频加弦子带的实部和虚部分别进行加窗处理;
S32、对加窗后的实部和虚部分别进行快速傅里叶变换;
S33、对快速傅里叶变换后的实部和虚部分别计算功率谱密度;
S34、对实部和虚部的功率谱密度分别取对数并相加,得到功率谱密度和;
S35、查找所述功率谱密度和的最大值,并记录所述最大值的位置即为所述高频加弦子带加弦的频率。
4.根据权利要求3所述的方法,其特征在于,所述步骤S3还包括:
S36、利用所述步骤S32中得到的实部和虚部的快速傅里叶变换值,分别计算所述步骤S35中找到的最大值的位置对应的实部和虚部相位,即为所述高频加弦子带加弦的相位。
5.一种带宽扩展解码中高频弦信号生成的方法,其特征在于,包括如下步骤:
S1、对输入的编码码流解复用,获得编码参数,所述编码参数包括高频加弦子带的序号、高频加弦子带加弦的频率和相位以及加弦起始块和平均幅度;
S2、基于所述高频加弦子带加弦的频率和相位计算得到高频加弦子带的实部和虚部的单位幅度弦信号;
S3、基于所述加弦起始块和平均幅度对实部和虚部的单位幅度弦信号进行幅度调制,得到高频加弦子带的弦信号。
6.根据权利要求5所述的方法,其特征在于,所述步骤S3具体包括:
当所述高频加弦子带为第一帧且加弦起始块不是第一块时,利用所述加弦起始块之前所有块的平均幅度对所述加弦起始块之前所有块的实部和虚部的单位幅度弦信号进行幅度调制,利用所述加弦起始块及其后所有块的平均幅度对所述加弦起始块及其后所有块的实部和虚部的单位幅度弦信号进行幅度调制;
当所述高频加弦子带为第一帧且加弦起始块为第一块时,利用所述高频加弦子带所有块的平均幅度对实部和虚部的单位幅度弦信号进行幅度调制。
7.根据权利要求5所述的方法,其特征在于,所述步骤S3具体包括:
当所述高频加弦子带为后续帧时,利用高频加弦子带所有块的平均幅度对实部和虚部的单位幅度弦信号进行幅度调制,并将当前帧的幅度调制后的实部弦信号和虚部弦信号分别与上一帧的幅度调制后的实部弦信号和虚部弦信号进行加窗相加,得到高频加弦子带的弦信号。
8.一种带宽扩展编码中高频弦信号生成的装置,其特征在于,包括:
复正交镜像滤波分析模块,用于对输入音频信号进行复正交镜像滤波分析,得到多个等带宽的子带;
加弦分析模块,用于判断所述多个子带中的高频子带是否需要加弦,获得高频加弦子带的序号;
第一计算模块,用于计算所述高频加弦子带加弦的频率和相位;
第二计算模块,用于判断所述高频加弦子带是否为第一帧,若是则进一步判断所述高频加弦子带均分的多个块中的哪一个块是加弦起始块并计算所述加弦起始块之前所有块的平均幅度以及所述加弦起始块及其后所有块的平均幅度,若否则计算所述高频加弦子带所有块的平均幅度;
参数复用模块,用于复用编码参数,输出编码码流,所述编码参数包括高频加弦子带的序号、高频加弦子带加弦的频率和相位以及加弦起始块和平均幅度。
9.根据权利要求8所述的装置,其特征在于,所述第一计算模块具体包括:
加窗单元,用于对所述高频加弦子带的实部和虚部分别进行加窗处理;
快速傅里叶变换单元,用于对加窗后的实部和虚部分别进行快速傅里叶变换;
功率谱密度计算单元,用于对快速傅里叶变换后的实部和虚部分别计算功率谱密度;
求和单元,用于对实部和虚部的功率谱密度分别取对数并相加,得到功率谱密度和;
查找单元,用于查找所述功率谱密度和的最大值,并记录所述最大值的位置即为所述高频加弦子带加弦的频率;
相位计算单元,利用所述快速傅里叶变换单元计算得到的实部和虚部的快速傅里叶变换值,分别计算所述查找单元找到的最大值的位置对应的实部和虚部相位,即为所述高频加弦子带加弦的相位。
10.一种带宽扩展解码中高频弦信号生成的装置,其特征在于,包括:
参数解复用模块,用于对输入的编码码流解复用,获得编码参数,所述编码参数包括高频加弦子带的序号、高频加弦子带加弦的频率和相位以及加弦起始块和平均幅度;
单位幅度弦信号计算模块,用于基于所述高频加弦子带加弦的频率和相位计算得到高频加弦子带的实部和虚部的单位幅度弦信号;
幅度调制模块,用于基于所述加弦起始块和平均幅度对实部和虚部的单位幅度弦信号进行幅度调制,得到高频加弦子带的弦信号。
CN201710699719.2A 2017-08-16 2017-08-16 带宽扩展编码和解码中高频弦信号生成的方法和装置 Active CN107545900B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710699719.2A CN107545900B (zh) 2017-08-16 2017-08-16 带宽扩展编码和解码中高频弦信号生成的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710699719.2A CN107545900B (zh) 2017-08-16 2017-08-16 带宽扩展编码和解码中高频弦信号生成的方法和装置

Publications (2)

Publication Number Publication Date
CN107545900A CN107545900A (zh) 2018-01-05
CN107545900B true CN107545900B (zh) 2020-12-01

Family

ID=60971337

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710699719.2A Active CN107545900B (zh) 2017-08-16 2017-08-16 带宽扩展编码和解码中高频弦信号生成的方法和装置

Country Status (1)

Country Link
CN (1) CN107545900B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1585972A (zh) * 2002-08-01 2005-02-23 松下电器产业株式会社 音频解码装置和音频解码方法
CN101089951A (zh) * 2006-06-16 2007-12-19 徐光锁 频带扩展编码方法及装置和解码方法及装置
CN101458930A (zh) * 2007-12-12 2009-06-17 华为技术有限公司 带宽扩展中激励信号的生成及信号重建方法和装置
CN101625866A (zh) * 1999-01-27 2010-01-13 编码技术股份公司 增强信源解码器的设备和增强信源解码方法的方法
CN101727906A (zh) * 2008-10-29 2010-06-09 华为技术有限公司 高频带信号的编解码方法及装置
CN105280189A (zh) * 2015-09-16 2016-01-27 深圳广晟信源技术有限公司 带宽扩展编码和解码中高频生成的方法和装置
CN106228992A (zh) * 2010-12-29 2016-12-14 三星电子株式会社 用于针对高频带宽扩展进行编码/解码的设备和方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030187663A1 (en) * 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
CN104541327B (zh) * 2012-02-23 2018-01-12 杜比国际公司 用于高频音频内容的有效恢复的方法及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101625866A (zh) * 1999-01-27 2010-01-13 编码技术股份公司 增强信源解码器的设备和增强信源解码方法的方法
CN1585972A (zh) * 2002-08-01 2005-02-23 松下电器产业株式会社 音频解码装置和音频解码方法
CN101089951A (zh) * 2006-06-16 2007-12-19 徐光锁 频带扩展编码方法及装置和解码方法及装置
CN101458930A (zh) * 2007-12-12 2009-06-17 华为技术有限公司 带宽扩展中激励信号的生成及信号重建方法和装置
CN101727906A (zh) * 2008-10-29 2010-06-09 华为技术有限公司 高频带信号的编解码方法及装置
CN106228992A (zh) * 2010-12-29 2016-12-14 三星电子株式会社 用于针对高频带宽扩展进行编码/解码的设备和方法
CN105280189A (zh) * 2015-09-16 2016-01-27 深圳广晟信源技术有限公司 带宽扩展编码和解码中高频生成的方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Spectral Band Replication (SBR) compression technology: Survey of the unified efficient low-cost implementations of complex exponential- and cosine-modulated QMF banks;Vladimir Britanak;《Sigal Processing》;20151031;第115卷;第49-65页 *
人工语音带宽扩展算法研究;隋经纬;《中国优秀硕士学位论文全文数据库 信息科技辑》;20150715(第07期);I136-141 *

Also Published As

Publication number Publication date
CN107545900A (zh) 2018-01-05

Similar Documents

Publication Publication Date Title
US10580425B2 (en) Determining weighting functions for line spectral frequency coefficients
EP3164873B1 (en) Audio processor and method for processing an audio signal using phase correction
EP2212884B1 (en) An encoder
US8639500B2 (en) Method, medium, and apparatus with bandwidth extension encoding and/or decoding
US8321229B2 (en) Apparatus, medium and method to encode and decode high frequency signal
CN104969290A (zh) 用于对音频帧丢失隐藏进行控制的方法和设备
CN101568959B (zh) 用带宽扩展进行编码和/或解码的方法
US9858941B2 (en) Selective phase compensation in high band coding of an audio signal
CA2944927C (en) Apparatus and method for generating a plurality of spectral patterns
BRPI0520729B1 (pt) Método para a codificação e decodificação de sinais de áudio, codificador para codificação e decodificador para decodificar sinais de áudio e sistema para compressão de áudio digital.
CN103366749B (zh) 一种声音编解码装置及其方法
US20080281604A1 (en) Method and apparatus to encode and decode an audio signal
EP3550563B1 (en) Encoder, decoder, encoding method, decoding method, and associated programs
CN111105807B (zh) 对线性预测编码系数进行量化的加权函数确定装置和方法
US11670311B2 (en) Time domain spectral bandwidth replication
CN107545900B (zh) 带宽扩展编码和解码中高频弦信号生成的方法和装置
US10950251B2 (en) Coding of harmonic signals in transform-based audio codecs
Ramprashad Embedded coding using a mixed speech and audio coding paradigm
CN105556602A (zh) 用于高频重构算法的频带表设计
CN114258569A (zh) 用于音频编码的多滞后格式
Eric et al. Robust multiband excitation coding of speech based on variable analysis frame sizes
BR112015017866B1 (pt) Aparelho e método para gerar um sinal melhorado da frequência utilizando a formação do sinal de melhoria

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant