CN102714041B - 改进的激励信号带宽扩展 - Google Patents

改进的激励信号带宽扩展 Download PDF

Info

Publication number
CN102714041B
CN102714041B CN201080061883.7A CN201080061883A CN102714041B CN 102714041 B CN102714041 B CN 102714041B CN 201080061883 A CN201080061883 A CN 201080061883A CN 102714041 B CN102714041 B CN 102714041B
Authority
CN
China
Prior art keywords
frequency
codebook vector
adaptive codebook
low
sampling
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201080061883.7A
Other languages
English (en)
Other versions
CN102714041A (zh
Inventor
西格德尔·斯维里森
斯特凡·布鲁恩
沃洛佳·格兰恰诺夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telefonaktiebolaget LM Ericsson AB
Original Assignee
Telefonaktiebolaget LM Ericsson AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Telefonaktiebolaget LM Ericsson AB filed Critical Telefonaktiebolaget LM Ericsson AB
Publication of CN102714041A publication Critical patent/CN102714041A/zh
Application granted granted Critical
Publication of CN102714041B publication Critical patent/CN102714041B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

生成由表示CELP编码音频信号的参数来定义的低频带激励信号(eLB)的高频带扩展的装置包括以下单元:上采样器(20)被配置为将低频带固定码本矢量(uFCB)和低频带自适应码本矢量(uACB)上采样到预定的采样频率。频率偏移估计器(22)被配置为根据表示音频信号的基频(Ω)的估计测量来确定调制频率(F0)。调制器(24)被配置为利用所确定的调制频率来调制上采样的低频带自适应码本矢量(uACB↑),以形成频率偏移的自适应码本矢量。压缩因子估计器(28)被配置为估计压缩因子。压缩器(34)被配置为基于所估计的压缩因子来减小频率偏移的自适应码本矢量和上采样的固定码本矢量(uFCB↑)。合并器(40)被配置为形成已减小的频率偏移自适应码本矢量和已减小的上采样固定码本矢量的高通滤波之和。

Description

改进的激励信号带宽扩展
技术领域
本发明总体涉及语音或话音解码,具体地,涉及在解码过程中使用的激励信号的带宽扩展(BWE)。
背景技术
在很多类型的编解码中,输入波形被分割为频谱包络和激励信号(也称为残留),频谱包络和激励信号被独立编码和发送。在解码器处,根据接收到的包络和激励信息合成波形。
参数化频谱包络的有效方式是通过线性预测(LP)系数a(j)。分隔为频谱包络和激励信号e(k)的过程由两个主要步骤组成:1)估计LP系数,以及2)通过全零滤波器
A ( z ) = 1 - Σ j = 1 J a ( j ) z - j - - - ( 1 )
来对波形x(k)滤波,以产生激励信号e(k),其中,针对以8kHz采样的输入信号,通常将模型阶数(model order)J设置为10,以及针对以16kHz采样的输入信号,设置为16。图1中示意了该过程。
为了最小化传输负载,常常对音频信号进行低通滤波,并仅编码和发送低频带(LB)。在接收机段,可以从可用LB信号特征恢复高频带(HB)。通过BWE方案来执行根据特定的LB信号特征重构HB信号特征的过程。
直接的重构方法基于频谱折叠,其中,将激励信号的LB部分的频谱关于LB的频率上限折叠(镜像)。这种直接频谱折叠的问题在于,不能将离散频率分量放置在音频信号的基频的整数倍处。这导致在根据可用的LB激励重构激励信号e(k)的HB部分时的“金属”声和感知降级。
避免该问题的一种方式是将HB激励重构为白噪声序列[1-2]。然而,将实际的残留(HB激励)替换为白噪声导致了感知降级,因为在话音信号的特定部分中,周期在HB中继续。
参考文献[3]描述了基于复杂话音产生模型的重构方法,该复杂话音产生模型用于生成激励信号的HB扩展。
发明内容
本发明的目标是改进低频带激励信号的高频带扩展的生成。
根据所附的权利要求来实现该目标。
根据本发明的第一方面,涉及生成低频带激励信号的高频带扩展的方法,所述低频带激励信号是由表示CELP编码音频信号的参数来定义的。该方法包括以下步骤。将低频带固定码本矢量和低频带自适应码本矢量上采样至预定采样频率。根据表示音频信号的基频的估计测量来确定调制频率。利用所确定的调制频率来调制已上采样的低频带自适应码本矢量,以形成频移偏移的自适应码本矢量。估计压缩因子。基于所估计的压缩因子,减小频率偏移的自适应码本矢量和上采样的固定码本矢量。然后,形成已减小的频率偏移自适应码本矢量和已减小的上采样固定码本矢量的高通滤波之和。
根据本发明的第二方面,涉及生成低频带激励信号的高频带扩展的方法,所述低频带激励信号通过对音频信号进行基于源滤波器模型的编码所获得。该方法包括以下步骤。将低频带激励信号上采样到预定的采样频率。根据表示音频信号的基频的估计测量来确定调制频率。利用所确定的调制频率来调制上采样的低频带激励信号,以形成频率偏移激励信号。对频率偏移激励信号进行高通滤波。估计压缩因子。基于所估计的压缩因子来减小已高通滤波的频率偏移激励信号。
根据本发明的第三方面,涉及生成低频带激励信号的高频带扩展的装置,所述低频带激励信号是由表示CELP编码音频信号的参数来定义的。上采样器被配置为将低频带固定码本矢量和低频带自适应码本矢量上采样为预定的采样频率。频率偏移估计器被配置为根据表示音频信号的基频的估计测量来确定调制频率。调制器被配置为利用所确定的调制频率来调制已上采样的低频带自适应码本矢量,以形成频率偏移的自适应码本矢量。压缩因子估计器被配置为估计压缩因子。压缩器被配置为基于所估计的压缩因子来减小已频率偏移的自适应码本矢量和上采样的固定码本矢量。合并器被配置为形成已减小的频率偏移自适应码本矢量和已减小的上采样固定码本矢量的高通滤波之和。
根据本发明的第四方面,涉及生成低频带激励信号的高频带扩展的装置,所述低频带激励信号通过对音频信号进行基于源滤波器模型的编码所获得。上采样器被配置为将低频带激励信号上采样到预定采样频率。频率偏移估计器被配置为根据表示音频信号的基频的估计测量来确定调制频率。调制器被配置为利用所确定的调制频率来调制已上采样的低频带激励信号,以形成频率偏移激励信号。高通滤波器被配置为对频率偏移激励信号进行高通滤波。压缩因子估计器被配置为估计压缩因子。压缩器被配置为基于所估计的压缩因子来减小已高通滤波的频率偏移激励信号。
根据本发明的第五方面,涉及包括根据第三或第四方面的装置的激励信号带宽扩展器。
根据本发明的第六方面,涉及包括根据第五方面的激励信号带宽扩展器的话音解码器。
根据本发明的第7方面,涉及包括根据第六方面的话音解码器的网络节点。
本发明的优点在与结果是改进的主观质量。质量改进是由于音调分量的正确偏移,以及激励的音调和随机部分之间的正确比率。
本发明的另一优点是与[3]相比,由于没有基于复杂的话音产生模型这一事实,提高了计算效率。代之,根据LB激励的特征直接推导出HB扩展。
附图说明
通过结合附图来参考以下的描述,本发明及其进一步的目标和优势可被最好地理解,在附图中:
图1是示出基于源滤波器模型的音频信号编码的一般性原理的简单框图;
图2是示出基于源滤波器模型的音频信号解码的一般性原理的简单框图;
图3是示出利用对要编码的音频信号进行低通滤波来编码的简单框图;
图4是示出根据本发明的话音解码器的示例实施例的简单框图,该话音解码器包括根据本发明的激励信号带宽扩展器;
图5A-C是示出音频信号的带宽扩展的图;
图6是示出根据本发明的方法的示例实施例的流程图;
图7是示出激励信号带宽扩展器的框图,该激励信号带宽扩展器包括根据本发明的装置的示例实施例;
图8是示出根据本发明的方法的另一示例实施例的流程图;
图9是示出激励信号带宽扩展器的框图,该激励信号带宽扩展器包括根据本发明的装置的另一示例实施例;
图10是示出网络节点的示例实施例的框图,该网络节点包括根据本发明的话音解码器;以及
图11是示出根据本发明的话音解码器的示例实施例的框图。
具体实施方式
在图中,将向具有相同或相似功能的单元提供相同的引用标记。
在详细描述本发明的多个示例实施例之前,将参考图1-5简要描述将会促进本描述的一些概念。
图1是示出基于源滤波器模型的音频信号编码的一般性原理的简单框图。通过全零滤波器110对波形x(k)滤波来计算激励信号e(k),全零滤波器110具有由滤波器系数a(j)定义的转移函数A(z)。在方框12中,由线性预测(LP)分析来确定滤波器系数a(j)。在这种类型的编码中,由激励信号e(k)和滤波器系数a(j)来表示信号x(k)的输入波形,激励信号e(k)和滤波器系数a(j)被发送到解码器。
图2是示出基于源滤波器模型的音频信号解码的一般性原理的简单框图。解码器从编码器接收激励信号e(k)和滤波器系数a(j),并重构原始波形x(k)的近似
Figure BDA00001907203400041
这是通过全极点滤波器14对接收到的激励信号e(k)滤波来进行的,全极点滤波器14具有由接收到的滤波器系数a(j)定义的转移函数1/A(z)。
图3是示出利用对要编码的音频信号进行低通滤波来编码的简单框图。如上所述,为了最小化传输负载,常常对音频信号进行低通滤波,并仅编码和发送低频带。这通过在要编码的宽带信号x(k)和全零滤波器10之间插入低通滤波器16示出。由于输入信号x(k)在编码之前已进行了低通滤波,所产生的激励信号eLB(k)将仅包括在解码器处重构x(k)所需的完整激励信号的低频带组成。类似地,滤波器10现在将具有由低频带滤波器系数aLB(j)定义的低频带转移函数ALB(z)。此外,编码器可以包括长期预测器17,长期预测器17估计对输入信号的基频F0进行表示的测量(通常称为“基音滞后(pitch lag)”或“基音周期(pitch period)”,或者简单地称为x(k)的“基音”)。这可以在已低通滤波的输入信号上进行(如图3中示出的),或在原始的输入信号x(k)上进行。另一备选是根据激励信号eLB(k)估计表示基频F0的测量。向解码器发送表示参数eLB(k)、aLB(j)和F0的信息。如果要根据激励信号eLB(k)估计表示基频F0的测量,实际上还可以在解码侧执行该估计,在这种情况下,不是必须发送表示基频F0的信息。
图4是示出根据本发明的话音解码器的示例实施例的简单框图,该话音解码器包括根据本发明的激励信号带宽扩展器。可以使用该话音解码器来解码已经根据参考图3描述的原理编码的信号。解码器从编码器接收激励信号eLB(k)和滤波器系数aLB(j)以及表示基频F0的测量(如果由编码器发送,否则,在解码侧估计),并重构原始(宽带)波形x(k)的近似
Figure BDA00001907203400051
这是通过根据本发明,向激励信号带宽扩展器18转发激励信号eLB(k)和基频测量F0来进行的(将在下面详细描述)。激励信号带宽扩展器18产生(宽带)激励信号e(k),并通过全极点滤波器14来对其进行滤波,以重构(宽带)近似
Figure BDA00001907203400052
然而,这要求滤波器14具有由对应的滤波器系数aWB(j)所定义的宽带转移函数1/AWB(z)。因为该原因,解码器包括将接收到的滤波器系数aLB(j)转换为aWB(j)的滤波器参数带宽扩展器19。在例如[3]中对这种类型的转换进行了描述,并在此将不作进一步描述。代之,将假设滤波器转移函数1/AWB(z)是解码器已知的。从而,以下的描述将集中于生成带宽扩展激励信号e(k)的原理。
图5A-C是示出音频信号的带宽扩展的图。图5A示意性地示出了音频信号的功率谱。该谱由两部分组成,即,带宽为WLB的低频带部分(实线),以及带宽为WHB的高频带部分(虚线)。解码器的任务是在仅有低频带组成的特征可用时,生成高频带扩展。
图5A中的功率谱可以仅表示白噪声。在图5B-C中示出了更实际的功率谱。在此,谱具有音调(尖峰)和随机分量(矩形)的不同混合。重新生成高频的谐波结构的方法必须处理以下事实:HB残留没有与LB残留展示出一样强的音调分量。如果没有正确的减小,HB残留将引入烦人的感知假象。本发明关注于通过以下方式产生激励信号e(k)的高频带扩展:表示基频F0的谐波的虚线的尖峰在已扩展的功率谱中具有正确位置,且所扩展的功率谱的音调和随机部分之间的比率是正确的。现在将参考图6-11来描述如何可以对其进行实现。
图6是示出根据本发明的方法的示例实施例的流程图。步骤S1对低频带激励信号eLB进行上采样,以匹配所需的输出采样频率fS。输入(接收)和输出采样频率fS的典型示例是4kHz至8kHz,或者12.8kHz至16kHz.。步骤S2根据表示音频信号的基频F0的估计测量来确定调制频率Ω。在优选实施例中,这是根据以下来进行的
Ω = n · 2 π F 0 f S - - - ( 2 )
其中n被定义为
n = floor ( W LB F 0 ) - ceil ( W LB - W HB F 0 ) - - - ( 3 )
其中
floor将其自变量取整为最接近的较小的整数,
ceil将其自变量取整为最接近的较大的整数,
WLB是低频带激励信号eLB的带宽,以及
WHB是高频带扩展eHB的带宽。
存在着计算调制频率Ω的很多备选方式。替代列出的很多等式,将描述等式[3]的不同部分的目的。量n旨在给出适合于高频带WHB的基频F0倍数的数目。它们将从自WLB-WHB扩展至WLB的频带偏移。该频带(比WLB窄)将被称为WS。从而,我们需要找到与频带WS相适合的谐波(图5A-C中的尖峰)的数目。等式[3]的第一部分将找到与从0到WLB的整个低频带相适合的谐波的数目。等式[3]的第二部分将找到与从0到WLB-WHB的频带相适合的谐波的数目。与频带WS相适合的谐波的数目基于这些部分之间的差。然而,由于我们想要找到频率小于等于WS的谐波的最大数目,我们需要向下取整,因此,我们对第一部分使用“floor”函数,以及对第二部分使用“ceil”函数(因为其被减去)。
估计调制频率Ω给出了用于填充WHB的基频F0倍数的正确数目。
作为备选,可以通过对等式的对应的简单改写,在[2]和[3]中使用由基频F0取倒来形成并表示基频的周期的基音滞后。这两个参数都被称为表示基频的测量。
在步骤S3中,利用所确定的调制频率Ω来调制上采样的低频带激励信号eLB↑,以形成频率偏移激励信号。在优选实施例中,这是根据以下来进行的
A·cos(l·Ω)                (4)
其中
A是预定的常数,以及
l是采样索引。
与现有技术的频谱折叠(对应于镜像)相反,该时域调制对应于频域的平移或偏移。
增益A控制输出信号的功率。优选值A=2使得功率不改变。余弦函数的调制的备选是正弦和指数函数。
步骤S4对频率偏移激励信号进行高频滤波,以移除假信号(aliasing)。
由于HB激励信号eHB通常比LB激励信号eLB包含更少的周期分量,必须基于压缩因子λ来进一步减小频率偏移LB激励信号中的这些音调分量。步骤S5估计该压缩因子λ。作为对音调分量的量的测量的示例,可以使用已修改的峰度(Kurtosis)。
K = 1 L Σ l = 1 L e 4 ( l ) ( 1 L Σ l = 1 L e 2 ( l ) ) 2 - - ( 5 )
其中
e(l)是在其上执行测量的信号,以及
L是话音帧长度。
估计压缩因子λ的优选方法是基于查找表。可以通过以下过程来离线创建查找表。
1)在话音数据库上,逐帧地计算等式(5)中的LB和HB峰度(由eLB(l)和eHB(l)来分别替代e(l))。
2)找到最优压缩因子λ为以下的压缩因子λ:可以将重构的HB激励信号压缩为与真实的HB峰度尽可能好地匹配。
更详细地,在优选的实施例1)中,针对数据库中的话音信号的LB部分和HB部分,分别计算根据(5)的峰度。在2)中,再次计算HB部分的根据(5)的峰度,然而这次是通过仅使用数据库中的信号的LB部分并执行步骤S1-S4以及将已高通滤波的频率偏移激励信号e(l)减小为如下定义的减小信号
Figure BDA00001907203400082
来进行的
e ~ ( l ) = C max · sign ( e ( l ) ) · | e ( l ) C max | λ - - - ( 6 )
其中
l是采样索引,以及
Cmax是与最大允许激励幅度相对应的预定常数。
利用不同的λ选择,针对减小信号
Figure BDA00001907203400084
来计算根据(5)的峰度,以及,将λ的值与针对eLB(l)的对应峰度相关联,该λ的值给出了与基于eHB(l)的确切的峰度的最佳匹配。该过程创建了以下的查找表:
Figure BDA00001907203400085
Figure BDA00001907203400091
可以将该查找表视为将LB的峰度映射到最优压缩因子λ≥1中的离散函数。将意识到,由于仅存在有限数目的λ的值,在实际的表查询之前,将每个已计算的峰度分类(“量化”)为属于对应的峰度间隔。
音调分量的量的测量(5)的备选是
K = exp ( 1 L Σ l = 1 L log ( e 2 ( l ) ) ) ( 1 L Σ l = 1 L e 2 ( l ) ) 2 - - - ( 7 )
利用如上所述的过程,将测量(5)替换为测量(7)来估计压缩因子λ。
返回图6,在生成高频带扩展的方法的示例实施例中,通过匹配当前话音段的LB峰度,从这种预存储的查找表中获得针对HB激励信号的最优压缩因子λ。然后,步骤S6基于所估计的压缩因子λ来减小已高通滤波的频率偏移激励信号。在示例实施例中,根据(6)进行减小。作为一个选项,这种类型的压缩可以在高通滤波步骤之前,以避免引入频域假象(artifact)。
作为另一选项,压缩可以是频率选择性的,其中,在较高的频率处应用较大的压缩。这可以通过在频域中处理激励信号,或者通过时域中的适当滤波来实现。
图7是示出激励信号带宽扩展器18的框图,该激励信号带宽扩展器包括根据本发明的装置的示例实施例。该装置包括上采样器20,上采样器20被配置为将低频带激励信号eLB上采样到预定的采样频率fS。频率偏移估计器22被配置为根据表示基频F0的估计测量来确定调制频率Ω,例如,根据(2)-(3)。调制器24被配置为利用所确定的调制频率Ω来调制上采样的低频带激励信号eLB↑,以形成频率偏移激励信号。高通滤波器26被配置为对频率偏移激励信号进行高通滤波。压缩因子估计器28被配置为例如根据上述的预存储的查找表来估计压缩因子λ。在具体的示例中,压缩因子估计器28包括连接到查找表32的修改峰度计算器30。压缩器34被配置为例如根据(6),基于所估计的压缩因子λ来减小已高通滤波的频率偏移激励信号。在带宽扩展器18中,还向延迟补偿器36转发上采样的LB激励信号eLB↑,延迟补偿器36对上采样的LB激励信号eLB↑进行延迟,以补偿由HB扩展
Figure BDA00001907203400101
的生成而导致的延迟。在加法器38中将产生的已延迟的LB组成加至HB扩展
Figure BDA00001907203400102
以形成带宽扩展的激励信号e。作为一个选项,可以在补偿器34和加法器38之间插入高通滤波器,以避免引入频域假象。
图8是示出根据本发明的方法的另一示例实施例的流程图。该实施例基于码激励线性预测(CELP)编码,例如,代数码激励线性预测(ACELP)编码。在CELP编码中,由固定码本矢量(随机分量)和自适应的码本矢量(周期性分量)的线性组合来形成激励信号,其中,将组合的系数称为增益。在ACELP中,固定码本不需要矢量的实际的“本”或表。代之,通过使脉冲置于由“代数”过程确定的矢量位置处来形成固定码本矢量。以下描述将参考ACELP来描述本发明的本实施例。然而,应该意识到,也可以将相同的原理应用于CELP。
由于在ACELP方案中,容易将LB激励矢量分割为周期性分量和随机分量:
eLB=GACB·uACB+GFCB·uFCB            (8)
可以直接处理这些分量,并考虑备选的测量来控制HB处的压缩等级。输入分别是LB自适应和固定码本矢量uACB和uFCB及其对应的增益GACB和GFCB,以及还有表示基频F0的测量(如上所述,从编码器接收到的,或者在解码器处确定的)。
在本示例实施例中,步骤S11上采样LB自适应和固定码本矢量uACB和uFCB,以匹配所期望的输出采样频率fS。步骤S12根据表示音频信号的基频F0的估计测量来确定调制频率Ω。在优选实施例中,这是根据(2)-(3)来进行的。步骤S13利用所确定的调制频率来调制上采样的低频带自适应码本矢量uACB↑(包含残留的音调部分),以形成频率偏移自适应码本矢量。在本实施例中,仅上采样固定码本矢量uFCB就足够,因为其是类噪声信号。步骤S14估计压缩因子λ。如参考图6和图7描述的实施例中一样,可以从查找表中获得最优压缩因子λ,但利用了测量
K = G ACB 2 · Σu ACB 2 ( l ) G FCB 2 · Σ u FCB 2 ( l ) - - - ( 9 )
在另一示例中,给出测量K为
K = G ACB 2 · Σu ACB 2 ( l ) - G FCB 2 · Σu FCB 2 ( l ) Σ e LB 2 ( l ) - - - ( 10 )
如[2]中描述的,又一可能性是将度量或测量K实现为低阶预测方差和高阶预测方差之比。在本实施例中,将测量K定义为低阶LP残留方差和高阶LP残留方差之比。
K = σ e , 2 2 σ e , 16 2 - - - ( 11 )
其中,
Figure BDA00001907203400114
Figure BDA00001907203400115
分别表示二阶和16阶LP滤波器的LP残留方差。LP残留方差作为Levinson-Durbin过程的副产物容易获得。
还可以在频域中计算控制压缩量的度量或测量K。其可以是频谱平坦度的形式,或者是超过特定阈值的频率分量(频谱波峰)的量。
步骤S15基于所估计的压缩因子λ来减小频率偏移自适应码本矢量和上采样固定码本矢量uFCB↑。本实施例的适合的减小的示例是
G ~ ACB = λ · G ACB G ~ FCB = 1 - G ~ ACB 2 - - - ( 12 )
在基于(9)从查找表中选择压缩因子λ的实施例中,压缩因子λ可以例如属于集合{0.2,0.4,0.6,0.8}。
图8中的步骤S16形成已减小的频率偏移自适应码本矢量和已减小的上采样固定码本矢量的高通滤波之和。这可以通过首先对已减小的频率偏移自适应码本矢量和已减小的上采样固定码本矢量进行高通滤波,并在滤波后形成和,或者代之以通过首先形成已减小的频率偏移自适应码本矢量和已减小的上采样固定码本矢量的和,并对和进行高通滤波来实现。
图9是示出激励信号带宽扩展器的框图,该激励信号带宽扩展器包括根据本发明的装置的另一示例实施例。上采样器20被配置为将低频带固定码本矢量uFCB和低频带自适应码本矢量uACB上采样到预定的采样频率fS。频率偏移估计器22被配置为根据表示音频信号的基频F0的估计测量来确定调制频率Ω,例如,根据(2)-(3)。调制器24被配置为利用所确定的调制频率Ω来调制上采样的低频带自适应码本矢量uACB↑,以形成频率偏移的自适应码本矢量。压缩因子估计器28被配置为估计压缩因子λ,例如,通过使用基于(9)、(10)或(11)的查找表。压缩器34被配置为基于所估计的压缩因子λ来减小频率偏移的自适应码本矢量和上采样的固定码本矢量uFCB↑。在具体示例中,基于等式(12),压缩器34将频率偏移的自适应码本矢量与由
Figure BDA00001907203400121
定义的自适应码本增益相乘,将上采样的固定码本矢量与由
Figure BDA00001907203400122
定义的固定码本增益相乘。合并器40被配置为形成已减小的频率偏移自适应码本矢量和已减小的上采样固定码本矢量的高通滤波之和eHB。在示例中,这是通过在高通滤波器42和44中分别对已减小的频率偏移自适应码本矢量和已减小的上采样固定码本矢量进行高通滤波,并在滤波之后在加法器46中形成和来进行的。备选是:首先将已减小的频率偏移自适应码本矢量和已减小的上采样固定码本矢量相加,并对和进行高通滤波。
在图9中的带宽扩展器18中,在上采样器20中上采样LB激励信号eLB。向延迟补偿器36转发上采样的LB激励信号eLB↑,延迟补偿器36对上采样的LB激励信号eLB↑进行延迟,以补偿由HB扩展eHB的生成而导致的延迟。在加法器38中将产生的LB组成加至HB扩展eHB,以形成带宽扩展的激励信号e。
图10是示出网络节点的示例实施例的框图,该网络节点包括根据本发明的话音解码器。本实施例示出了无线终端,然而其他的网络节点也是可行的。例如,如果在网络中使用语音IP(互联网协议),节点可以包括计算机。
在图10中的网络节点中,天线接收已编码的话音信号。解调器和信道解码器50将该信号变换为低频带话音参数,将其向话音解码器52转发。在这些话音参数中,向根据本发明的激励信号带宽扩展器18转发低频带激励信号参数(例如,uACB、uFCB、GACB、GFCB)和表示基频的测量(F0)。向滤波器参数带宽扩展器19转发表示滤波器参数aLB(j)的话音参数。向全极点滤波器14转发带宽扩展激励信号和滤波器系数aWB(j),以产生解码的话音信号
Figure BDA00001907203400131
上面描述的步骤、功能、过程和/或块可以使用任何传统技术在硬件中实现,所述传统技术例如是分立电路或集成电路技术,包括通用电路和专用电路。
备选地,此处描述的步骤、功能、过程和/或块中的至少一些可以在供合适的处理装置执行的软件中实现,所述处理装置例如是微处理器、数字信号处理器(DSP)、和/或任何合适的可编程逻辑器件,如现场可编程门阵列(FPGA)器件。
还应该理解,重复使用网络节点的通用处理能力是可能的。例如,这可以通过对现有软件重新编程或者通过添加新的软件组件来实现。
作为实现示例,图11是示出根据本发明的话音解码器52的示例实施例的框图。本实施例基于处理器100(例如,微处理器),处理器100执行用于生成高频带扩展的软件组件110,用于生成宽带激励的软件组件120,用于生成滤波器参数的软件组件130以及用于从宽带激励和滤波器参数生成话音信号的软件组件140。该软件存储在存储器150中。处理器100在系统总线上与存储器通信。由处理器100和存储器150连接到的控制I/O总线的输入/输出(I/O)控制器160接收低频带话音参数。在本实施例中,将I/O控制器160接收到的话音参数存储在存储器150中,在其中,由软件组件来处理话音参数。软件组件110可以实现图7的实施例中的方框20、22、24、26、28、34或者图9的实施例中的方框20、22、24、28、34、40的功能。软件组件120可以实现图7的实施例中的方框36、38或图9的实施例中的方框20、36、38的功能。软件组件110和120一起实现激励带宽扩展器18的功能。滤波器参数带宽扩展器19的功能由软件组件130来实现。由I/O控制器160在I/O总线上从存储器150输出从软件组件140获得的话音信号
在图11的实施例中,由I/O控制器160来接收话音参数,以及假设在进行接收的网络节点中的其他位置处处理其他任务,例如无线终端中的解调和信道解码。然而,备选是:让存储器150中的其他软件组件也处理用于从接收信号提取话音参数的全部或部分数字信号处理。在这种实施例中,可以直接从存储器150检索话音参数。
在进行接收的网络节点是接收语音IP分组的计算机的情况下,通常向I/O控制器160转发IP分组,以及由存储器150中的其他软件组件来提取话音参数。
上述的软件组件中的一些或全部可以在计算机可读介质(例如,CD、DVD或者硬盘)上携带,并在由处理器执行时加载到存储器中。
本领域技术人员将要理解,在不背离其范围的情况下,可以对本发明进行修改和改变,本发明的范围定义在所附权利要求中。
缩写
ACELP    代数码激励线性预测
BWE      带宽扩展
CELP     码激励线性预测
DSP      数字信号处理器
FPGA     现场可编程门阵列
HB       高频带
I/O      输入/输出
IP       互联网协议
LB       低频带
LP       线性预测
IP       互联网协议
参考文献
[1]3GPP TS 26.190,“Adaptive Multi-Rate-Wideband(AMR-WB)speech codec;Transcoding functions,”2008.
[2]ITU-T Rec..G.718,“Frame error robust narrowband andwideband embedded variable bit-rate coding of speech and audio from8-32kbit/s,”2008.
[3]ITU-T Rec..G.729.1,“G.729-based embedded variable bit-ratecoder:An 8-32kbit/s scalable wideband coder bitstream interoperablewith G.729,”2006.

Claims (22)

1.一种生成低频带激励信号(eLB)的高频带扩展的方法,所述低频带激励信号(eLB)是由表示CELP编码音频信号的参数来定义的,所述方法包括步骤:
将低频带固定码本矢量(uFCB)和低频带自适应码本矢量(uACB)上采样(S11)至预定的采样频率(fS);
根据表示音频信号的基频(F0)的估计测量来确定(S12)调制频率(Ω);
利用所确定的调制频率来调制(S13)上采样的低频带自适应码本矢量(uACB↑),以形成频率偏移的自适应码本矢量;
估计(S14)压缩因子(λ);
基于所估计的压缩因子,减小(S15)频率偏移的自适应码本矢量和上采样的固定码本矢量(uFCB↑);
形成(S16)已减小的频率偏移自适应码本矢量和已减小的上采样固定码本矢量的高通滤波之和(eHB)。
2.根据权利要求1所述的方法,其中,根据下式来确定调制频率Ω
Ω = n · 2 π F 0 f S
其中
F0为表示基频的估计测量,
fS为采样频率,以及
n被定义为
n = floor ( W LB F 0 ) - ceil ( W LB - W HB F 0 )
其中
floor将其自变量取整为最接近的较小的整数,
ceil将其自变量取整为最接近的较大的整数,
WLB为低频带激励信号(eLB)的带宽,以及
WHB为高频带扩展的带宽。
3.根据权利要求1或2所述的方法,其中,通过以下项对上采样的低频带激励信号(eLB↑)进行调制
                           A·cos(l·Ω)
其中
A为预定常数,
l为采样索引,以及
Ω为调制频率。
4.根据权利要求1或2所述的方法,其中,通过以下方式来估计压缩因子(λ):
估计针对低频带激励信号(eLB)中音调分量的量的测量(K);
从预存储的具有测量(K)与给出与所述测量(K)的最佳匹配的压缩因子(λ)的对应关系的查找表中选择相应的压缩因子(λ)。
5.根据权利要求4所述的方法,其中,通过下式给出针对低频带激励信号(eLB)中音调分量的量的测量K:
K = G ACB 2 · Σ u ACB 2 ( l ) G FCB 2 · Σ u FCB 2 ( l )
其中
GACB为自适应码本增益,
uACB为低频带自适应码本矢量,
GFCB为固定码本增益,以及
uFCB为低频带固定码本矢量。
6.根据权利要求1或2所述的方法,其中,形成步骤(S16)包括步骤:
对已减小的频率偏移自适应码本矢量和已减小的上采样固定码本矢量进行高通滤波;
对已高通滤波的矢量求和。
7.根据权利要求1或2所述的方法,其中,减小步骤(S15)包括:
将频率偏移的自适应码本矢量与由
Figure FDA0000383267810000022
定义的自适应码本增益相乘;以及
将上采样的固定码本矢量与由
Figure FDA0000383267810000023
定义的固定码本增益相乘,其中,λ是所估计的压缩因子。
8.根据权利要求1或2所述的方法,其中,通过表示ACELP编码音频信号的参数来定义低频带激励信号。
9.根据权利要求4所述的方法,其中,通过下式给出针对低频带激励信号(eLB)中音调分量的量的测量K:
K = 1 L Σ l = 1 L e LB 4 ( l ) ( 1 L Σ l = 1 L e LB 2 ( l ) ) 2
其中,L为话音帧长度。
10.一种用于生成低频带激励信号(eLB)的高频带扩展的装置,所述低频带激励信号(eLB)是由表示CELP编码音频信号的参数来定义的,所述装置包括:
上采样器(20),被配置为将低频带固定码本矢量(uFCB)和低频带自适应码本矢量(uACB)上采样至预定的采样频率(fS);
频率偏移估计器(22),被配置为根据表示音频信号的基频(E0)的估计测量来确定调制频率(Ω);
调制器(24),被配置为利用所确定的调制频率来调制上采样的低频带自适应码本矢量(uACB↑),以形成频率偏移的自适应码本矢量;
压缩因子估计器(28),被配置为估计压缩因子(λ);
压缩器(34),被配置为基于所估计的压缩因子来减小频率偏移的自适应码本矢量和上采样的固定码本矢量(uFCB↑);
合并器(40),被配置为形成已减小的频率偏移自适应码本矢量和已减小的上采样固定码本矢量的高通滤波之和(eHB)。
11.根据权利要求10所述的装置,其中,频率偏移估计器(22)被配置为根据下式来确定调制频率Ω
Ω = n · 2 π F 0 f S
其中
F0为表示基频的估计测量,
fS为采样频率,以及
n被定义为
n = floor ( W LB F 0 ) - ceil ( W LB - W HB F 0 )
其中
floor将其自变量取整为最接近的较小的整数,
ceil将其自变量取整为最接近的较大的整数,
WLB为低频带激励信号(eLB)的带宽,以及
WHB为高频带扩展的带宽。
12.根据权利要求10或11所述的装置,其中调制器(24)被配置为对上采样的低频带激励信号(eLB↑)进行调制
                           A·cos(l·Ω)
其中
A为预定常数,
l为采样索引,以及
Ω为调制频率。
13.根据权利要求10或11所述的装置,其中,压缩因子估计器(28)被配置为通过以下方式来估计压缩因子(λ):
估计针对低频带激励信号(eLB)中音调分量的量的测量(K);
从预存储的具有测量(K)与给出与所述测量(K)的最佳匹配的压缩因子(λ)的对应关系的查找表中选择相应的压缩因子(λ)。
14.根据权利要求13所述的装置,其中,压缩因子估计器(28)被配置为根据下式估计针对低频带激励信号(eLB)中音调分量的量的测量K:
K = G ACB 2 · Σ u ACB 2 ( l ) G FCB 2 · Σ u FCB 2 ( l )
其中
GACB为自适应码本增益,
uACB为低频带自适应码本矢量,
GFCB为固定码本增益,以及
uFCB为低频带固定码本矢量。
15.根据权利要求10或11所述的装置,其中,合并器(40)包括:
高通滤波器(42、44),被配置为对已减小的频率偏移自适应码本矢量和已减小的上采样固定码本矢量进行高通滤波;
求和单元(46),被配置为对已高通滤波的矢量求和。
16.根据权利要求10或11所述的装置,其中,压缩器(34)被配置为:
将频率偏移的自适应码本矢量与由
Figure FDA0000383267810000051
定义的自适应码本增益相乘;以及
将上采样的固定码本矢量与由
Figure FDA0000383267810000052
定义的固定码本增益相乘,其中,λ是所估计的压缩因子。
17.根据权利要求10或11所述的装置,其中,通过表示ACELP编码音频信号的参数来定义低频带激励信号。
18.根据权利要求13所述的装置,其中,压缩因子估计器(28)被配置为根据下式估计针对低频带激励信号(eLB)中音调分量的量的测量K:
K = 1 L Σ l = 1 L e LB 4 ( l ) ( 1 L Σ l = 1 L e LB 2 ( l ) ) 2
其中,L为话音帧长度。
19.一种激励信号带宽扩展器(18),包括根据权利要求10-18中任一项所述的装置。
20.一种话音编码器(52),包括根据权利要求19所述的激励信号带宽扩展器。
21.一种网络节点,包括根据权利要求20所述的话音编码器。
22.根据权利要求21所述的网络节点,其中,网络节点是无线终端。
CN201080061883.7A 2009-11-19 2010-07-05 改进的激励信号带宽扩展 Expired - Fee Related CN102714041B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US26271709P 2009-11-19 2009-11-19
US61/262,717 2009-11-19
PCT/SE2010/050772 WO2011062536A1 (en) 2009-11-19 2010-07-05 Improved excitation signal bandwidth extension

Publications (2)

Publication Number Publication Date
CN102714041A CN102714041A (zh) 2012-10-03
CN102714041B true CN102714041B (zh) 2014-04-16

Family

ID=44059834

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201080061883.7A Expired - Fee Related CN102714041B (zh) 2009-11-19 2010-07-05 改进的激励信号带宽扩展

Country Status (6)

Country Link
US (1) US8856011B2 (zh)
EP (1) EP2502230B1 (zh)
JP (1) JP5619176B2 (zh)
CN (1) CN102714041B (zh)
CA (1) CA2780971A1 (zh)
WO (1) WO2011062536A1 (zh)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9947340B2 (en) * 2008-12-10 2018-04-17 Skype Regeneration of wideband speech
US8924200B2 (en) * 2010-10-15 2014-12-30 Motorola Mobility Llc Audio signal bandwidth extension in CELP-based speech coder
EP2791937B1 (en) * 2011-11-02 2016-06-08 Telefonaktiebolaget LM Ericsson (publ) Generation of a high band extension of a bandwidth extended audio signal
PL2831875T3 (pl) 2012-03-29 2016-05-31 Ericsson Telefon Ab L M Rozszerzenie pasma harmonicznego sygnału audio
US9129600B2 (en) * 2012-09-26 2015-09-08 Google Technology Holdings LLC Method and apparatus for encoding an audio signal
EP2950308B1 (en) * 2013-01-22 2020-02-19 Panasonic Corporation Bandwidth expansion parameter-generator, encoder, decoder, bandwidth expansion parameter-generating method, encoding method, and decoding method
CN104217727B (zh) 2013-05-31 2017-07-21 华为技术有限公司 信号解码方法及设备
FR3007563A1 (fr) * 2013-06-25 2014-12-26 France Telecom Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences
CN103413557B (zh) * 2013-07-08 2017-03-15 深圳Tcl新技术有限公司 语音信号带宽扩展的方法和装置
EP2830064A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection
CN104517610B (zh) * 2013-09-26 2018-03-06 华为技术有限公司 频带扩展的方法及装置
US20150170655A1 (en) 2013-12-15 2015-06-18 Qualcomm Incorporated Systems and methods of blind bandwidth extension
EP2963649A1 (en) * 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio processor and method for processing an audio signal using horizontal phase correction
EP3182411A1 (en) 2015-12-14 2017-06-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an encoded audio signal
EP3396670B1 (en) * 2017-04-28 2020-11-25 Nxp B.V. Speech signal processing
US20190051286A1 (en) * 2017-08-14 2019-02-14 Microsoft Technology Licensing, Llc Normalization of high band signals in network telephony communications

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1300833A2 (en) * 2001-10-04 2003-04-09 AT&T Corp. A method of bandwidth extension for narrow-band speech
KR20070008211A (ko) * 2005-07-13 2007-01-17 삼성전자주식회사 스케일러블 대역 확장 음성 부호화/복호화 방법 및 장치
US20070067163A1 (en) * 2005-09-02 2007-03-22 Nortel Networks Limited Method and apparatus for extending the bandwidth of a speech signal
CN101336449A (zh) * 2006-01-31 2008-12-31 西门子企业通讯有限责任两合公司 用于音频信号编码的方法和装置
CN101458930A (zh) * 2007-12-12 2009-06-17 华为技术有限公司 带宽扩展中激励信号的生成及信号重建方法和装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0223195A (ja) * 1988-07-13 1990-01-25 Mitsubishi Electric Corp 乗客コンベアの櫛
US5455888A (en) * 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
JPH0923195A (ja) * 1995-07-05 1997-01-21 Hitachi Denshi Ltd 音声信号帯域圧縮伸長装置並びに音声信号の帯域圧縮伝送方式及び再生方式
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US6889182B2 (en) * 2001-01-12 2005-05-03 Telefonaktiebolaget L M Ericsson (Publ) Speech bandwidth extension
US6895375B2 (en) * 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech
CN100395817C (zh) * 2001-11-14 2008-06-18 松下电器产业株式会社 编码设备、解码设备和解码方法
EP1864281A1 (en) * 2005-04-01 2007-12-12 QUALCOMM Incorporated Systems, methods, and apparatus for highband burst suppression
WO2009081315A1 (en) 2007-12-18 2009-07-02 Koninklijke Philips Electronics N.V. Encoding and decoding audio or speech
WO2009084221A1 (ja) * 2007-12-27 2009-07-09 Panasonic Corporation 符号化装置、復号装置およびこれらの方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1300833A2 (en) * 2001-10-04 2003-04-09 AT&T Corp. A method of bandwidth extension for narrow-band speech
KR20070008211A (ko) * 2005-07-13 2007-01-17 삼성전자주식회사 스케일러블 대역 확장 음성 부호화/복호화 방법 및 장치
US20070067163A1 (en) * 2005-09-02 2007-03-22 Nortel Networks Limited Method and apparatus for extending the bandwidth of a speech signal
CN101336449A (zh) * 2006-01-31 2008-12-31 西门子企业通讯有限责任两合公司 用于音频信号编码的方法和装置
CN101458930A (zh) * 2007-12-12 2009-06-17 华为技术有限公司 带宽扩展中激励信号的生成及信号重建方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Jax,P,Vary P.On artificial bandwidth extension of telephone speech.《SIGNAL PROCESSING>.2003,1710.
On artificial bandwidth extension of telephone speech;Jax,P,Vary P;《SIGNAL PROCESSING>;20030801;1710 *

Also Published As

Publication number Publication date
US8856011B2 (en) 2014-10-07
CA2780971A1 (en) 2011-05-26
EP2502230A4 (en) 2013-05-15
CN102714041A (zh) 2012-10-03
EP2502230A1 (en) 2012-09-26
EP2502230B1 (en) 2014-05-21
JP2013511742A (ja) 2013-04-04
JP5619176B2 (ja) 2014-11-05
WO2011062536A1 (en) 2011-05-26
US20120239388A1 (en) 2012-09-20

Similar Documents

Publication Publication Date Title
CN102714041B (zh) 改进的激励信号带宽扩展
JP6173288B2 (ja) マルチモードオーディオコーデックおよびそれに適応されるcelp符号化
AU2021215252B2 (en) Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
AU2009328247B2 (en) Audio encoder and bandwidth extension decoder
KR101733326B1 (ko) 개선된 확률 분포 추정을 이용한 선형 예측 기반 오디오 코딩
KR101484426B1 (ko) Celp 기반 음성 코더에서의 오디오 신호 대역폭 확장
TWI698859B (zh) 編碼及解碼音訊信號之技術
JP2016508618A (ja) 周波数領域におけるlpc系符号化のための低周波数エンファシス
CN103620674A (zh) 用于对音频信号的时间段进行编码和解码的变换音频编解码器和方法
CN102194458A (zh) 频带复制方法、装置及音频解码方法、系统
RU2523035C2 (ru) Аудио кодер и декодер, увеличивающий полосу частот
JP6663996B2 (ja) 符号化されたオーディオ信号を処理するための装置および方法
US8595017B2 (en) Audio encoding method and device
AU2015203736C1 (en) Audio encoder and bandwidth extension decoder
JP2005114814A (ja) 音声符号化・復号化方法、音声符号化・復号化装置、音声符号化・復号化プログラム、及びこれを記録した記録媒体
EP4120253A1 (en) Integral band-wise parametric coder

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20140416