CN102714041B - 改进的激励信号带宽扩展 - Google Patents
改进的激励信号带宽扩展 Download PDFInfo
- Publication number
- CN102714041B CN102714041B CN201080061883.7A CN201080061883A CN102714041B CN 102714041 B CN102714041 B CN 102714041B CN 201080061883 A CN201080061883 A CN 201080061883A CN 102714041 B CN102714041 B CN 102714041B
- Authority
- CN
- China
- Prior art keywords
- frequency
- codebook vector
- adaptive codebook
- low
- sampling
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000005284 excitation Effects 0.000 title claims abstract description 48
- 239000013598 vector Substances 0.000 claims abstract description 87
- 238000005070 sampling Methods 0.000 claims abstract description 53
- 230000003044 adaptive effect Effects 0.000 claims abstract description 52
- 230000005236 sound signal Effects 0.000 claims abstract description 29
- 238000005086 pumping Methods 0.000 claims description 67
- 238000000034 method Methods 0.000 claims description 44
- 238000001914 filtration Methods 0.000 claims description 36
- 238000005259 measurement Methods 0.000 claims description 34
- 239000004606 Fillers/Extenders Substances 0.000 claims description 23
- 239000003638 chemical reducing agent Substances 0.000 claims description 7
- 230000015572 biosynthetic process Effects 0.000 claims 1
- 230000006835 compression Effects 0.000 abstract description 11
- 238000007906 compression Methods 0.000 abstract description 11
- 230000002238 attenuated effect Effects 0.000 abstract 2
- 238000010586 diagram Methods 0.000 description 20
- 230000008569 process Effects 0.000 description 19
- 230000006870 function Effects 0.000 description 18
- 238000001228 spectrum Methods 0.000 description 17
- 238000012546 transfer Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 230000008447 perception Effects 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000005452 bending Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000008672 reprogramming Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
生成由表示CELP编码音频信号的参数来定义的低频带激励信号(eLB)的高频带扩展的装置包括以下单元:上采样器(20)被配置为将低频带固定码本矢量(uFCB)和低频带自适应码本矢量(uACB)上采样到预定的采样频率。频率偏移估计器(22)被配置为根据表示音频信号的基频(Ω)的估计测量来确定调制频率(F0)。调制器(24)被配置为利用所确定的调制频率来调制上采样的低频带自适应码本矢量(uACB↑),以形成频率偏移的自适应码本矢量。压缩因子估计器(28)被配置为估计压缩因子。压缩器(34)被配置为基于所估计的压缩因子来减小频率偏移的自适应码本矢量和上采样的固定码本矢量(uFCB↑)。合并器(40)被配置为形成已减小的频率偏移自适应码本矢量和已减小的上采样固定码本矢量的高通滤波之和。
Description
技术领域
本发明总体涉及语音或话音解码,具体地,涉及在解码过程中使用的激励信号的带宽扩展(BWE)。
背景技术
在很多类型的编解码中,输入波形被分割为频谱包络和激励信号(也称为残留),频谱包络和激励信号被独立编码和发送。在解码器处,根据接收到的包络和激励信息合成波形。
参数化频谱包络的有效方式是通过线性预测(LP)系数a(j)。分隔为频谱包络和激励信号e(k)的过程由两个主要步骤组成:1)估计LP系数,以及2)通过全零滤波器
来对波形x(k)滤波,以产生激励信号e(k),其中,针对以8kHz采样的输入信号,通常将模型阶数(model order)J设置为10,以及针对以16kHz采样的输入信号,设置为16。图1中示意了该过程。
为了最小化传输负载,常常对音频信号进行低通滤波,并仅编码和发送低频带(LB)。在接收机段,可以从可用LB信号特征恢复高频带(HB)。通过BWE方案来执行根据特定的LB信号特征重构HB信号特征的过程。
直接的重构方法基于频谱折叠,其中,将激励信号的LB部分的频谱关于LB的频率上限折叠(镜像)。这种直接频谱折叠的问题在于,不能将离散频率分量放置在音频信号的基频的整数倍处。这导致在根据可用的LB激励重构激励信号e(k)的HB部分时的“金属”声和感知降级。
避免该问题的一种方式是将HB激励重构为白噪声序列[1-2]。然而,将实际的残留(HB激励)替换为白噪声导致了感知降级,因为在话音信号的特定部分中,周期在HB中继续。
参考文献[3]描述了基于复杂话音产生模型的重构方法,该复杂话音产生模型用于生成激励信号的HB扩展。
发明内容
本发明的目标是改进低频带激励信号的高频带扩展的生成。
根据所附的权利要求来实现该目标。
根据本发明的第一方面,涉及生成低频带激励信号的高频带扩展的方法,所述低频带激励信号是由表示CELP编码音频信号的参数来定义的。该方法包括以下步骤。将低频带固定码本矢量和低频带自适应码本矢量上采样至预定采样频率。根据表示音频信号的基频的估计测量来确定调制频率。利用所确定的调制频率来调制已上采样的低频带自适应码本矢量,以形成频移偏移的自适应码本矢量。估计压缩因子。基于所估计的压缩因子,减小频率偏移的自适应码本矢量和上采样的固定码本矢量。然后,形成已减小的频率偏移自适应码本矢量和已减小的上采样固定码本矢量的高通滤波之和。
根据本发明的第二方面,涉及生成低频带激励信号的高频带扩展的方法,所述低频带激励信号通过对音频信号进行基于源滤波器模型的编码所获得。该方法包括以下步骤。将低频带激励信号上采样到预定的采样频率。根据表示音频信号的基频的估计测量来确定调制频率。利用所确定的调制频率来调制上采样的低频带激励信号,以形成频率偏移激励信号。对频率偏移激励信号进行高通滤波。估计压缩因子。基于所估计的压缩因子来减小已高通滤波的频率偏移激励信号。
根据本发明的第三方面,涉及生成低频带激励信号的高频带扩展的装置,所述低频带激励信号是由表示CELP编码音频信号的参数来定义的。上采样器被配置为将低频带固定码本矢量和低频带自适应码本矢量上采样为预定的采样频率。频率偏移估计器被配置为根据表示音频信号的基频的估计测量来确定调制频率。调制器被配置为利用所确定的调制频率来调制已上采样的低频带自适应码本矢量,以形成频率偏移的自适应码本矢量。压缩因子估计器被配置为估计压缩因子。压缩器被配置为基于所估计的压缩因子来减小已频率偏移的自适应码本矢量和上采样的固定码本矢量。合并器被配置为形成已减小的频率偏移自适应码本矢量和已减小的上采样固定码本矢量的高通滤波之和。
根据本发明的第四方面,涉及生成低频带激励信号的高频带扩展的装置,所述低频带激励信号通过对音频信号进行基于源滤波器模型的编码所获得。上采样器被配置为将低频带激励信号上采样到预定采样频率。频率偏移估计器被配置为根据表示音频信号的基频的估计测量来确定调制频率。调制器被配置为利用所确定的调制频率来调制已上采样的低频带激励信号,以形成频率偏移激励信号。高通滤波器被配置为对频率偏移激励信号进行高通滤波。压缩因子估计器被配置为估计压缩因子。压缩器被配置为基于所估计的压缩因子来减小已高通滤波的频率偏移激励信号。
根据本发明的第五方面,涉及包括根据第三或第四方面的装置的激励信号带宽扩展器。
根据本发明的第六方面,涉及包括根据第五方面的激励信号带宽扩展器的话音解码器。
根据本发明的第7方面,涉及包括根据第六方面的话音解码器的网络节点。
本发明的优点在与结果是改进的主观质量。质量改进是由于音调分量的正确偏移,以及激励的音调和随机部分之间的正确比率。
本发明的另一优点是与[3]相比,由于没有基于复杂的话音产生模型这一事实,提高了计算效率。代之,根据LB激励的特征直接推导出HB扩展。
附图说明
通过结合附图来参考以下的描述,本发明及其进一步的目标和优势可被最好地理解,在附图中:
图1是示出基于源滤波器模型的音频信号编码的一般性原理的简单框图;
图2是示出基于源滤波器模型的音频信号解码的一般性原理的简单框图;
图3是示出利用对要编码的音频信号进行低通滤波来编码的简单框图;
图4是示出根据本发明的话音解码器的示例实施例的简单框图,该话音解码器包括根据本发明的激励信号带宽扩展器;
图5A-C是示出音频信号的带宽扩展的图;
图6是示出根据本发明的方法的示例实施例的流程图;
图7是示出激励信号带宽扩展器的框图,该激励信号带宽扩展器包括根据本发明的装置的示例实施例;
图8是示出根据本发明的方法的另一示例实施例的流程图;
图9是示出激励信号带宽扩展器的框图,该激励信号带宽扩展器包括根据本发明的装置的另一示例实施例;
图10是示出网络节点的示例实施例的框图,该网络节点包括根据本发明的话音解码器;以及
图11是示出根据本发明的话音解码器的示例实施例的框图。
具体实施方式
在图中,将向具有相同或相似功能的单元提供相同的引用标记。
在详细描述本发明的多个示例实施例之前,将参考图1-5简要描述将会促进本描述的一些概念。
图1是示出基于源滤波器模型的音频信号编码的一般性原理的简单框图。通过全零滤波器110对波形x(k)滤波来计算激励信号e(k),全零滤波器110具有由滤波器系数a(j)定义的转移函数A(z)。在方框12中,由线性预测(LP)分析来确定滤波器系数a(j)。在这种类型的编码中,由激励信号e(k)和滤波器系数a(j)来表示信号x(k)的输入波形,激励信号e(k)和滤波器系数a(j)被发送到解码器。
图2是示出基于源滤波器模型的音频信号解码的一般性原理的简单框图。解码器从编码器接收激励信号e(k)和滤波器系数a(j),并重构原始波形x(k)的近似这是通过全极点滤波器14对接收到的激励信号e(k)滤波来进行的,全极点滤波器14具有由接收到的滤波器系数a(j)定义的转移函数1/A(z)。
图3是示出利用对要编码的音频信号进行低通滤波来编码的简单框图。如上所述,为了最小化传输负载,常常对音频信号进行低通滤波,并仅编码和发送低频带。这通过在要编码的宽带信号x(k)和全零滤波器10之间插入低通滤波器16示出。由于输入信号x(k)在编码之前已进行了低通滤波,所产生的激励信号eLB(k)将仅包括在解码器处重构x(k)所需的完整激励信号的低频带组成。类似地,滤波器10现在将具有由低频带滤波器系数aLB(j)定义的低频带转移函数ALB(z)。此外,编码器可以包括长期预测器17,长期预测器17估计对输入信号的基频F0进行表示的测量(通常称为“基音滞后(pitch lag)”或“基音周期(pitch period)”,或者简单地称为x(k)的“基音”)。这可以在已低通滤波的输入信号上进行(如图3中示出的),或在原始的输入信号x(k)上进行。另一备选是根据激励信号eLB(k)估计表示基频F0的测量。向解码器发送表示参数eLB(k)、aLB(j)和F0的信息。如果要根据激励信号eLB(k)估计表示基频F0的测量,实际上还可以在解码侧执行该估计,在这种情况下,不是必须发送表示基频F0的信息。
图4是示出根据本发明的话音解码器的示例实施例的简单框图,该话音解码器包括根据本发明的激励信号带宽扩展器。可以使用该话音解码器来解码已经根据参考图3描述的原理编码的信号。解码器从编码器接收激励信号eLB(k)和滤波器系数aLB(j)以及表示基频F0的测量(如果由编码器发送,否则,在解码侧估计),并重构原始(宽带)波形x(k)的近似这是通过根据本发明,向激励信号带宽扩展器18转发激励信号eLB(k)和基频测量F0来进行的(将在下面详细描述)。激励信号带宽扩展器18产生(宽带)激励信号e(k),并通过全极点滤波器14来对其进行滤波,以重构(宽带)近似然而,这要求滤波器14具有由对应的滤波器系数aWB(j)所定义的宽带转移函数1/AWB(z)。因为该原因,解码器包括将接收到的滤波器系数aLB(j)转换为aWB(j)的滤波器参数带宽扩展器19。在例如[3]中对这种类型的转换进行了描述,并在此将不作进一步描述。代之,将假设滤波器转移函数1/AWB(z)是解码器已知的。从而,以下的描述将集中于生成带宽扩展激励信号e(k)的原理。
图5A-C是示出音频信号的带宽扩展的图。图5A示意性地示出了音频信号的功率谱。该谱由两部分组成,即,带宽为WLB的低频带部分(实线),以及带宽为WHB的高频带部分(虚线)。解码器的任务是在仅有低频带组成的特征可用时,生成高频带扩展。
图5A中的功率谱可以仅表示白噪声。在图5B-C中示出了更实际的功率谱。在此,谱具有音调(尖峰)和随机分量(矩形)的不同混合。重新生成高频的谐波结构的方法必须处理以下事实:HB残留没有与LB残留展示出一样强的音调分量。如果没有正确的减小,HB残留将引入烦人的感知假象。本发明关注于通过以下方式产生激励信号e(k)的高频带扩展:表示基频F0的谐波的虚线的尖峰在已扩展的功率谱中具有正确位置,且所扩展的功率谱的音调和随机部分之间的比率是正确的。现在将参考图6-11来描述如何可以对其进行实现。
图6是示出根据本发明的方法的示例实施例的流程图。步骤S1对低频带激励信号eLB进行上采样,以匹配所需的输出采样频率fS。输入(接收)和输出采样频率fS的典型示例是4kHz至8kHz,或者12.8kHz至16kHz.。步骤S2根据表示音频信号的基频F0的估计测量来确定调制频率Ω。在优选实施例中,这是根据以下来进行的
其中n被定义为
其中
floor将其自变量取整为最接近的较小的整数,
ceil将其自变量取整为最接近的较大的整数,
WLB是低频带激励信号eLB的带宽,以及
WHB是高频带扩展eHB的带宽。
存在着计算调制频率Ω的很多备选方式。替代列出的很多等式,将描述等式[3]的不同部分的目的。量n旨在给出适合于高频带WHB的基频F0倍数的数目。它们将从自WLB-WHB扩展至WLB的频带偏移。该频带(比WLB窄)将被称为WS。从而,我们需要找到与频带WS相适合的谐波(图5A-C中的尖峰)的数目。等式[3]的第一部分将找到与从0到WLB的整个低频带相适合的谐波的数目。等式[3]的第二部分将找到与从0到WLB-WHB的频带相适合的谐波的数目。与频带WS相适合的谐波的数目基于这些部分之间的差。然而,由于我们想要找到频率小于等于WS的谐波的最大数目,我们需要向下取整,因此,我们对第一部分使用“floor”函数,以及对第二部分使用“ceil”函数(因为其被减去)。
估计调制频率Ω给出了用于填充WHB的基频F0倍数的正确数目。
作为备选,可以通过对等式的对应的简单改写,在[2]和[3]中使用由基频F0取倒来形成并表示基频的周期的基音滞后。这两个参数都被称为表示基频的测量。
在步骤S3中,利用所确定的调制频率Ω来调制上采样的低频带激励信号eLB↑,以形成频率偏移激励信号。在优选实施例中,这是根据以下来进行的
A·cos(l·Ω) (4)
其中
A是预定的常数,以及
l是采样索引。
与现有技术的频谱折叠(对应于镜像)相反,该时域调制对应于频域的平移或偏移。
增益A控制输出信号的功率。优选值A=2使得功率不改变。余弦函数的调制的备选是正弦和指数函数。
步骤S4对频率偏移激励信号进行高频滤波,以移除假信号(aliasing)。
由于HB激励信号eHB通常比LB激励信号eLB包含更少的周期分量,必须基于压缩因子λ来进一步减小频率偏移LB激励信号中的这些音调分量。步骤S5估计该压缩因子λ。作为对音调分量的量的测量的示例,可以使用已修改的峰度(Kurtosis)。
其中
e(l)是在其上执行测量的信号,以及
L是话音帧长度。
估计压缩因子λ的优选方法是基于查找表。可以通过以下过程来离线创建查找表。
1)在话音数据库上,逐帧地计算等式(5)中的LB和HB峰度(由eLB(l)和eHB(l)来分别替代e(l))。
2)找到最优压缩因子λ为以下的压缩因子λ:可以将重构的HB激励信号压缩为与真实的HB峰度尽可能好地匹配。
更详细地,在优选的实施例1)中,针对数据库中的话音信号的LB部分和HB部分,分别计算根据(5)的峰度。在2)中,再次计算HB部分的根据(5)的峰度,然而这次是通过仅使用数据库中的信号的LB部分并执行步骤S1-S4以及将已高通滤波的频率偏移激励信号e(l)减小为如下定义的减小信号来进行的
其中
l是采样索引,以及
Cmax是与最大允许激励幅度相对应的预定常数。
可以将该查找表视为将LB的峰度映射到最优压缩因子λ≥1中的离散函数。将意识到,由于仅存在有限数目的λ的值,在实际的表查询之前,将每个已计算的峰度分类(“量化”)为属于对应的峰度间隔。
音调分量的量的测量(5)的备选是
利用如上所述的过程,将测量(5)替换为测量(7)来估计压缩因子λ。
返回图6,在生成高频带扩展的方法的示例实施例中,通过匹配当前话音段的LB峰度,从这种预存储的查找表中获得针对HB激励信号的最优压缩因子λ。然后,步骤S6基于所估计的压缩因子λ来减小已高通滤波的频率偏移激励信号。在示例实施例中,根据(6)进行减小。作为一个选项,这种类型的压缩可以在高通滤波步骤之前,以避免引入频域假象(artifact)。
作为另一选项,压缩可以是频率选择性的,其中,在较高的频率处应用较大的压缩。这可以通过在频域中处理激励信号,或者通过时域中的适当滤波来实现。
图7是示出激励信号带宽扩展器18的框图,该激励信号带宽扩展器包括根据本发明的装置的示例实施例。该装置包括上采样器20,上采样器20被配置为将低频带激励信号eLB上采样到预定的采样频率fS。频率偏移估计器22被配置为根据表示基频F0的估计测量来确定调制频率Ω,例如,根据(2)-(3)。调制器24被配置为利用所确定的调制频率Ω来调制上采样的低频带激励信号eLB↑,以形成频率偏移激励信号。高通滤波器26被配置为对频率偏移激励信号进行高通滤波。压缩因子估计器28被配置为例如根据上述的预存储的查找表来估计压缩因子λ。在具体的示例中,压缩因子估计器28包括连接到查找表32的修改峰度计算器30。压缩器34被配置为例如根据(6),基于所估计的压缩因子λ来减小已高通滤波的频率偏移激励信号。在带宽扩展器18中,还向延迟补偿器36转发上采样的LB激励信号eLB↑,延迟补偿器36对上采样的LB激励信号eLB↑进行延迟,以补偿由HB扩展的生成而导致的延迟。在加法器38中将产生的已延迟的LB组成加至HB扩展以形成带宽扩展的激励信号e。作为一个选项,可以在补偿器34和加法器38之间插入高通滤波器,以避免引入频域假象。
图8是示出根据本发明的方法的另一示例实施例的流程图。该实施例基于码激励线性预测(CELP)编码,例如,代数码激励线性预测(ACELP)编码。在CELP编码中,由固定码本矢量(随机分量)和自适应的码本矢量(周期性分量)的线性组合来形成激励信号,其中,将组合的系数称为增益。在ACELP中,固定码本不需要矢量的实际的“本”或表。代之,通过使脉冲置于由“代数”过程确定的矢量位置处来形成固定码本矢量。以下描述将参考ACELP来描述本发明的本实施例。然而,应该意识到,也可以将相同的原理应用于CELP。
由于在ACELP方案中,容易将LB激励矢量分割为周期性分量和随机分量:
eLB=GACB·uACB+GFCB·uFCB (8)
可以直接处理这些分量,并考虑备选的测量来控制HB处的压缩等级。输入分别是LB自适应和固定码本矢量uACB和uFCB及其对应的增益GACB和GFCB,以及还有表示基频F0的测量(如上所述,从编码器接收到的,或者在解码器处确定的)。
在本示例实施例中,步骤S11上采样LB自适应和固定码本矢量uACB和uFCB,以匹配所期望的输出采样频率fS。步骤S12根据表示音频信号的基频F0的估计测量来确定调制频率Ω。在优选实施例中,这是根据(2)-(3)来进行的。步骤S13利用所确定的调制频率来调制上采样的低频带自适应码本矢量uACB↑(包含残留的音调部分),以形成频率偏移自适应码本矢量。在本实施例中,仅上采样固定码本矢量uFCB就足够,因为其是类噪声信号。步骤S14估计压缩因子λ。如参考图6和图7描述的实施例中一样,可以从查找表中获得最优压缩因子λ,但利用了测量
在另一示例中,给出测量K为
如[2]中描述的,又一可能性是将度量或测量K实现为低阶预测方差和高阶预测方差之比。在本实施例中,将测量K定义为低阶LP残留方差和高阶LP残留方差之比。
还可以在频域中计算控制压缩量的度量或测量K。其可以是频谱平坦度的形式,或者是超过特定阈值的频率分量(频谱波峰)的量。
步骤S15基于所估计的压缩因子λ来减小频率偏移自适应码本矢量和上采样固定码本矢量uFCB↑。本实施例的适合的减小的示例是
在基于(9)从查找表中选择压缩因子λ的实施例中,压缩因子λ可以例如属于集合{0.2,0.4,0.6,0.8}。
图8中的步骤S16形成已减小的频率偏移自适应码本矢量和已减小的上采样固定码本矢量的高通滤波之和。这可以通过首先对已减小的频率偏移自适应码本矢量和已减小的上采样固定码本矢量进行高通滤波,并在滤波后形成和,或者代之以通过首先形成已减小的频率偏移自适应码本矢量和已减小的上采样固定码本矢量的和,并对和进行高通滤波来实现。
图9是示出激励信号带宽扩展器的框图,该激励信号带宽扩展器包括根据本发明的装置的另一示例实施例。上采样器20被配置为将低频带固定码本矢量uFCB和低频带自适应码本矢量uACB上采样到预定的采样频率fS。频率偏移估计器22被配置为根据表示音频信号的基频F0的估计测量来确定调制频率Ω,例如,根据(2)-(3)。调制器24被配置为利用所确定的调制频率Ω来调制上采样的低频带自适应码本矢量uACB↑,以形成频率偏移的自适应码本矢量。压缩因子估计器28被配置为估计压缩因子λ,例如,通过使用基于(9)、(10)或(11)的查找表。压缩器34被配置为基于所估计的压缩因子λ来减小频率偏移的自适应码本矢量和上采样的固定码本矢量uFCB↑。在具体示例中,基于等式(12),压缩器34将频率偏移的自适应码本矢量与由定义的自适应码本增益相乘,将上采样的固定码本矢量与由定义的固定码本增益相乘。合并器40被配置为形成已减小的频率偏移自适应码本矢量和已减小的上采样固定码本矢量的高通滤波之和eHB。在示例中,这是通过在高通滤波器42和44中分别对已减小的频率偏移自适应码本矢量和已减小的上采样固定码本矢量进行高通滤波,并在滤波之后在加法器46中形成和来进行的。备选是:首先将已减小的频率偏移自适应码本矢量和已减小的上采样固定码本矢量相加,并对和进行高通滤波。
在图9中的带宽扩展器18中,在上采样器20中上采样LB激励信号eLB。向延迟补偿器36转发上采样的LB激励信号eLB↑,延迟补偿器36对上采样的LB激励信号eLB↑进行延迟,以补偿由HB扩展eHB的生成而导致的延迟。在加法器38中将产生的LB组成加至HB扩展eHB,以形成带宽扩展的激励信号e。
图10是示出网络节点的示例实施例的框图,该网络节点包括根据本发明的话音解码器。本实施例示出了无线终端,然而其他的网络节点也是可行的。例如,如果在网络中使用语音IP(互联网协议),节点可以包括计算机。
在图10中的网络节点中,天线接收已编码的话音信号。解调器和信道解码器50将该信号变换为低频带话音参数,将其向话音解码器52转发。在这些话音参数中,向根据本发明的激励信号带宽扩展器18转发低频带激励信号参数(例如,uACB、uFCB、GACB、GFCB)和表示基频的测量(F0)。向滤波器参数带宽扩展器19转发表示滤波器参数aLB(j)的话音参数。向全极点滤波器14转发带宽扩展激励信号和滤波器系数aWB(j),以产生解码的话音信号
上面描述的步骤、功能、过程和/或块可以使用任何传统技术在硬件中实现,所述传统技术例如是分立电路或集成电路技术,包括通用电路和专用电路。
备选地,此处描述的步骤、功能、过程和/或块中的至少一些可以在供合适的处理装置执行的软件中实现,所述处理装置例如是微处理器、数字信号处理器(DSP)、和/或任何合适的可编程逻辑器件,如现场可编程门阵列(FPGA)器件。
还应该理解,重复使用网络节点的通用处理能力是可能的。例如,这可以通过对现有软件重新编程或者通过添加新的软件组件来实现。
作为实现示例,图11是示出根据本发明的话音解码器52的示例实施例的框图。本实施例基于处理器100(例如,微处理器),处理器100执行用于生成高频带扩展的软件组件110,用于生成宽带激励的软件组件120,用于生成滤波器参数的软件组件130以及用于从宽带激励和滤波器参数生成话音信号的软件组件140。该软件存储在存储器150中。处理器100在系统总线上与存储器通信。由处理器100和存储器150连接到的控制I/O总线的输入/输出(I/O)控制器160接收低频带话音参数。在本实施例中,将I/O控制器160接收到的话音参数存储在存储器150中,在其中,由软件组件来处理话音参数。软件组件110可以实现图7的实施例中的方框20、22、24、26、28、34或者图9的实施例中的方框20、22、24、28、34、40的功能。软件组件120可以实现图7的实施例中的方框36、38或图9的实施例中的方框20、36、38的功能。软件组件110和120一起实现激励带宽扩展器18的功能。滤波器参数带宽扩展器19的功能由软件组件130来实现。由I/O控制器160在I/O总线上从存储器150输出从软件组件140获得的话音信号
在图11的实施例中,由I/O控制器160来接收话音参数,以及假设在进行接收的网络节点中的其他位置处处理其他任务,例如无线终端中的解调和信道解码。然而,备选是:让存储器150中的其他软件组件也处理用于从接收信号提取话音参数的全部或部分数字信号处理。在这种实施例中,可以直接从存储器150检索话音参数。
在进行接收的网络节点是接收语音IP分组的计算机的情况下,通常向I/O控制器160转发IP分组,以及由存储器150中的其他软件组件来提取话音参数。
上述的软件组件中的一些或全部可以在计算机可读介质(例如,CD、DVD或者硬盘)上携带,并在由处理器执行时加载到存储器中。
本领域技术人员将要理解,在不背离其范围的情况下,可以对本发明进行修改和改变,本发明的范围定义在所附权利要求中。
缩写
ACELP 代数码激励线性预测
BWE 带宽扩展
CELP 码激励线性预测
DSP 数字信号处理器
FPGA 现场可编程门阵列
HB 高频带
I/O 输入/输出
IP 互联网协议
LB 低频带
LP 线性预测
IP 互联网协议
参考文献
[1]3GPP TS 26.190,“Adaptive Multi-Rate-Wideband(AMR-WB)speech codec;Transcoding functions,”2008.
[2]ITU-T Rec..G.718,“Frame error robust narrowband andwideband embedded variable bit-rate coding of speech and audio from8-32kbit/s,”2008.
[3]ITU-T Rec..G.729.1,“G.729-based embedded variable bit-ratecoder:An 8-32kbit/s scalable wideband coder bitstream interoperablewith G.729,”2006.
Claims (22)
1.一种生成低频带激励信号(eLB)的高频带扩展的方法,所述低频带激励信号(eLB)是由表示CELP编码音频信号的参数来定义的,所述方法包括步骤:
将低频带固定码本矢量(uFCB)和低频带自适应码本矢量(uACB)上采样(S11)至预定的采样频率(fS);
根据表示音频信号的基频(F0)的估计测量来确定(S12)调制频率(Ω);
利用所确定的调制频率来调制(S13)上采样的低频带自适应码本矢量(uACB↑),以形成频率偏移的自适应码本矢量;
估计(S14)压缩因子(λ);
基于所估计的压缩因子,减小(S15)频率偏移的自适应码本矢量和上采样的固定码本矢量(uFCB↑);
形成(S16)已减小的频率偏移自适应码本矢量和已减小的上采样固定码本矢量的高通滤波之和(eHB)。
2.根据权利要求1所述的方法,其中,根据下式来确定调制频率Ω
其中
F0为表示基频的估计测量,
fS为采样频率,以及
n被定义为
其中
floor将其自变量取整为最接近的较小的整数,
ceil将其自变量取整为最接近的较大的整数,
WLB为低频带激励信号(eLB)的带宽,以及
WHB为高频带扩展的带宽。
3.根据权利要求1或2所述的方法,其中,通过以下项对上采样的低频带激励信号(eLB↑)进行调制
A·cos(l·Ω)
其中
A为预定常数,
l为采样索引,以及
Ω为调制频率。
4.根据权利要求1或2所述的方法,其中,通过以下方式来估计压缩因子(λ):
估计针对低频带激励信号(eLB)中音调分量的量的测量(K);
从预存储的具有测量(K)与给出与所述测量(K)的最佳匹配的压缩因子(λ)的对应关系的查找表中选择相应的压缩因子(λ)。
5.根据权利要求4所述的方法,其中,通过下式给出针对低频带激励信号(eLB)中音调分量的量的测量K:
其中
GACB为自适应码本增益,
uACB为低频带自适应码本矢量,
GFCB为固定码本增益,以及
uFCB为低频带固定码本矢量。
6.根据权利要求1或2所述的方法,其中,形成步骤(S16)包括步骤:
对已减小的频率偏移自适应码本矢量和已减小的上采样固定码本矢量进行高通滤波;
对已高通滤波的矢量求和。
8.根据权利要求1或2所述的方法,其中,通过表示ACELP编码音频信号的参数来定义低频带激励信号。
9.根据权利要求4所述的方法,其中,通过下式给出针对低频带激励信号(eLB)中音调分量的量的测量K:
其中,L为话音帧长度。
10.一种用于生成低频带激励信号(eLB)的高频带扩展的装置,所述低频带激励信号(eLB)是由表示CELP编码音频信号的参数来定义的,所述装置包括:
上采样器(20),被配置为将低频带固定码本矢量(uFCB)和低频带自适应码本矢量(uACB)上采样至预定的采样频率(fS);
频率偏移估计器(22),被配置为根据表示音频信号的基频(E0)的估计测量来确定调制频率(Ω);
调制器(24),被配置为利用所确定的调制频率来调制上采样的低频带自适应码本矢量(uACB↑),以形成频率偏移的自适应码本矢量;
压缩因子估计器(28),被配置为估计压缩因子(λ);
压缩器(34),被配置为基于所估计的压缩因子来减小频率偏移的自适应码本矢量和上采样的固定码本矢量(uFCB↑);
合并器(40),被配置为形成已减小的频率偏移自适应码本矢量和已减小的上采样固定码本矢量的高通滤波之和(eHB)。
11.根据权利要求10所述的装置,其中,频率偏移估计器(22)被配置为根据下式来确定调制频率Ω
其中
F0为表示基频的估计测量,
fS为采样频率,以及
n被定义为
其中
floor将其自变量取整为最接近的较小的整数,
ceil将其自变量取整为最接近的较大的整数,
WLB为低频带激励信号(eLB)的带宽,以及
WHB为高频带扩展的带宽。
12.根据权利要求10或11所述的装置,其中调制器(24)被配置为对上采样的低频带激励信号(eLB↑)进行调制
A·cos(l·Ω)
其中
A为预定常数,
l为采样索引,以及
Ω为调制频率。
13.根据权利要求10或11所述的装置,其中,压缩因子估计器(28)被配置为通过以下方式来估计压缩因子(λ):
估计针对低频带激励信号(eLB)中音调分量的量的测量(K);
从预存储的具有测量(K)与给出与所述测量(K)的最佳匹配的压缩因子(λ)的对应关系的查找表中选择相应的压缩因子(λ)。
14.根据权利要求13所述的装置,其中,压缩因子估计器(28)被配置为根据下式估计针对低频带激励信号(eLB)中音调分量的量的测量K:
其中
GACB为自适应码本增益,
uACB为低频带自适应码本矢量,
GFCB为固定码本增益,以及
uFCB为低频带固定码本矢量。
15.根据权利要求10或11所述的装置,其中,合并器(40)包括:
高通滤波器(42、44),被配置为对已减小的频率偏移自适应码本矢量和已减小的上采样固定码本矢量进行高通滤波;
求和单元(46),被配置为对已高通滤波的矢量求和。
17.根据权利要求10或11所述的装置,其中,通过表示ACELP编码音频信号的参数来定义低频带激励信号。
18.根据权利要求13所述的装置,其中,压缩因子估计器(28)被配置为根据下式估计针对低频带激励信号(eLB)中音调分量的量的测量K:
其中,L为话音帧长度。
19.一种激励信号带宽扩展器(18),包括根据权利要求10-18中任一项所述的装置。
20.一种话音编码器(52),包括根据权利要求19所述的激励信号带宽扩展器。
21.一种网络节点,包括根据权利要求20所述的话音编码器。
22.根据权利要求21所述的网络节点,其中,网络节点是无线终端。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US26271709P | 2009-11-19 | 2009-11-19 | |
US61/262,717 | 2009-11-19 | ||
PCT/SE2010/050772 WO2011062536A1 (en) | 2009-11-19 | 2010-07-05 | Improved excitation signal bandwidth extension |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102714041A CN102714041A (zh) | 2012-10-03 |
CN102714041B true CN102714041B (zh) | 2014-04-16 |
Family
ID=44059834
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201080061883.7A Expired - Fee Related CN102714041B (zh) | 2009-11-19 | 2010-07-05 | 改进的激励信号带宽扩展 |
Country Status (6)
Country | Link |
---|---|
US (1) | US8856011B2 (zh) |
EP (1) | EP2502230B1 (zh) |
JP (1) | JP5619176B2 (zh) |
CN (1) | CN102714041B (zh) |
CA (1) | CA2780971A1 (zh) |
WO (1) | WO2011062536A1 (zh) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9947340B2 (en) * | 2008-12-10 | 2018-04-17 | Skype | Regeneration of wideband speech |
US8924200B2 (en) * | 2010-10-15 | 2014-12-30 | Motorola Mobility Llc | Audio signal bandwidth extension in CELP-based speech coder |
EP2791937B1 (en) * | 2011-11-02 | 2016-06-08 | Telefonaktiebolaget LM Ericsson (publ) | Generation of a high band extension of a bandwidth extended audio signal |
PL2831875T3 (pl) | 2012-03-29 | 2016-05-31 | Ericsson Telefon Ab L M | Rozszerzenie pasma harmonicznego sygnału audio |
US9129600B2 (en) * | 2012-09-26 | 2015-09-08 | Google Technology Holdings LLC | Method and apparatus for encoding an audio signal |
EP2950308B1 (en) * | 2013-01-22 | 2020-02-19 | Panasonic Corporation | Bandwidth expansion parameter-generator, encoder, decoder, bandwidth expansion parameter-generating method, encoding method, and decoding method |
CN104217727B (zh) | 2013-05-31 | 2017-07-21 | 华为技术有限公司 | 信号解码方法及设备 |
FR3007563A1 (fr) * | 2013-06-25 | 2014-12-26 | France Telecom | Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences |
CN103413557B (zh) * | 2013-07-08 | 2017-03-15 | 深圳Tcl新技术有限公司 | 语音信号带宽扩展的方法和装置 |
EP2830064A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection |
CN104517610B (zh) * | 2013-09-26 | 2018-03-06 | 华为技术有限公司 | 频带扩展的方法及装置 |
US20150170655A1 (en) | 2013-12-15 | 2015-06-18 | Qualcomm Incorporated | Systems and methods of blind bandwidth extension |
EP2963649A1 (en) * | 2014-07-01 | 2016-01-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio processor and method for processing an audio signal using horizontal phase correction |
EP3182411A1 (en) | 2015-12-14 | 2017-06-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing an encoded audio signal |
EP3396670B1 (en) * | 2017-04-28 | 2020-11-25 | Nxp B.V. | Speech signal processing |
US20190051286A1 (en) * | 2017-08-14 | 2019-02-14 | Microsoft Technology Licensing, Llc | Normalization of high band signals in network telephony communications |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1300833A2 (en) * | 2001-10-04 | 2003-04-09 | AT&T Corp. | A method of bandwidth extension for narrow-band speech |
KR20070008211A (ko) * | 2005-07-13 | 2007-01-17 | 삼성전자주식회사 | 스케일러블 대역 확장 음성 부호화/복호화 방법 및 장치 |
US20070067163A1 (en) * | 2005-09-02 | 2007-03-22 | Nortel Networks Limited | Method and apparatus for extending the bandwidth of a speech signal |
CN101336449A (zh) * | 2006-01-31 | 2008-12-31 | 西门子企业通讯有限责任两合公司 | 用于音频信号编码的方法和装置 |
CN101458930A (zh) * | 2007-12-12 | 2009-06-17 | 华为技术有限公司 | 带宽扩展中激励信号的生成及信号重建方法和装置 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0223195A (ja) * | 1988-07-13 | 1990-01-25 | Mitsubishi Electric Corp | 乗客コンベアの櫛 |
US5455888A (en) * | 1992-12-04 | 1995-10-03 | Northern Telecom Limited | Speech bandwidth extension method and apparatus |
JPH0923195A (ja) * | 1995-07-05 | 1997-01-21 | Hitachi Denshi Ltd | 音声信号帯域圧縮伸長装置並びに音声信号の帯域圧縮伝送方式及び再生方式 |
SE512719C2 (sv) | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
US6889182B2 (en) * | 2001-01-12 | 2005-05-03 | Telefonaktiebolaget L M Ericsson (Publ) | Speech bandwidth extension |
US6895375B2 (en) * | 2001-10-04 | 2005-05-17 | At&T Corp. | System for bandwidth extension of Narrow-band speech |
CN100395817C (zh) * | 2001-11-14 | 2008-06-18 | 松下电器产业株式会社 | 编码设备、解码设备和解码方法 |
EP1864281A1 (en) * | 2005-04-01 | 2007-12-12 | QUALCOMM Incorporated | Systems, methods, and apparatus for highband burst suppression |
WO2009081315A1 (en) | 2007-12-18 | 2009-07-02 | Koninklijke Philips Electronics N.V. | Encoding and decoding audio or speech |
WO2009084221A1 (ja) * | 2007-12-27 | 2009-07-09 | Panasonic Corporation | 符号化装置、復号装置およびこれらの方法 |
-
2010
- 2010-07-05 WO PCT/SE2010/050772 patent/WO2011062536A1/en active Application Filing
- 2010-07-05 US US13/509,849 patent/US8856011B2/en active Active
- 2010-07-05 EP EP10831865.0A patent/EP2502230B1/en active Active
- 2010-07-05 CA CA2780971A patent/CA2780971A1/en not_active Abandoned
- 2010-07-05 CN CN201080061883.7A patent/CN102714041B/zh not_active Expired - Fee Related
- 2010-07-05 JP JP2012539848A patent/JP5619176B2/ja not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1300833A2 (en) * | 2001-10-04 | 2003-04-09 | AT&T Corp. | A method of bandwidth extension for narrow-band speech |
KR20070008211A (ko) * | 2005-07-13 | 2007-01-17 | 삼성전자주식회사 | 스케일러블 대역 확장 음성 부호화/복호화 방법 및 장치 |
US20070067163A1 (en) * | 2005-09-02 | 2007-03-22 | Nortel Networks Limited | Method and apparatus for extending the bandwidth of a speech signal |
CN101336449A (zh) * | 2006-01-31 | 2008-12-31 | 西门子企业通讯有限责任两合公司 | 用于音频信号编码的方法和装置 |
CN101458930A (zh) * | 2007-12-12 | 2009-06-17 | 华为技术有限公司 | 带宽扩展中激励信号的生成及信号重建方法和装置 |
Non-Patent Citations (2)
Title |
---|
Jax,P,Vary P.On artificial bandwidth extension of telephone speech.《SIGNAL PROCESSING>.2003,1710. |
On artificial bandwidth extension of telephone speech;Jax,P,Vary P;《SIGNAL PROCESSING>;20030801;1710 * |
Also Published As
Publication number | Publication date |
---|---|
US8856011B2 (en) | 2014-10-07 |
CA2780971A1 (en) | 2011-05-26 |
EP2502230A4 (en) | 2013-05-15 |
CN102714041A (zh) | 2012-10-03 |
EP2502230A1 (en) | 2012-09-26 |
EP2502230B1 (en) | 2014-05-21 |
JP2013511742A (ja) | 2013-04-04 |
JP5619176B2 (ja) | 2014-11-05 |
WO2011062536A1 (en) | 2011-05-26 |
US20120239388A1 (en) | 2012-09-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102714041B (zh) | 改进的激励信号带宽扩展 | |
JP6173288B2 (ja) | マルチモードオーディオコーデックおよびそれに適応されるcelp符号化 | |
AU2021215252B2 (en) | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal | |
AU2009328247B2 (en) | Audio encoder and bandwidth extension decoder | |
KR101733326B1 (ko) | 개선된 확률 분포 추정을 이용한 선형 예측 기반 오디오 코딩 | |
KR101484426B1 (ko) | Celp 기반 음성 코더에서의 오디오 신호 대역폭 확장 | |
TWI698859B (zh) | 編碼及解碼音訊信號之技術 | |
JP2016508618A (ja) | 周波数領域におけるlpc系符号化のための低周波数エンファシス | |
CN103620674A (zh) | 用于对音频信号的时间段进行编码和解码的变换音频编解码器和方法 | |
CN102194458A (zh) | 频带复制方法、装置及音频解码方法、系统 | |
RU2523035C2 (ru) | Аудио кодер и декодер, увеличивающий полосу частот | |
JP6663996B2 (ja) | 符号化されたオーディオ信号を処理するための装置および方法 | |
US8595017B2 (en) | Audio encoding method and device | |
AU2015203736C1 (en) | Audio encoder and bandwidth extension decoder | |
JP2005114814A (ja) | 音声符号化・復号化方法、音声符号化・復号化装置、音声符号化・復号化プログラム、及びこれを記録した記録媒体 | |
EP4120253A1 (en) | Integral band-wise parametric coder |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20140416 |