CN1312658C

CN1312658C - 在感知上改善的声音信号编码方法和设备

Info

Publication number: CN1312658C
Application number: CNB018173799A
Authority: CN
Inventors: S·布鲁恩; S·安德森
Original assignee: Telefonaktiebolaget LM Ericsson AB
Current assignee: Telefonaktiebolaget LM Ericsson AB
Priority date: 2000-10-20
Filing date: 2001-09-07
Publication date: 2007-04-25
Anticipated expiration: 2021-09-07
Also published as: EP1328923A1; ES2296791T3; DE60131766T2; US20020049584A1; PT1328923E; KR100832144B1; WO2002033692A1; ATE380378T1; CA2424373C; EP1328923B1; JP2004515801A; DE60131766D1; AU2001284606B2; CA2424373A1; EP1199812A1; KR20030048061A; JP5222452B2; US6611798B2; AU8460601A; CN1470048A

Abstract

本发明涉及对声源信号(X)进行编码，这样根据编码信息重构的对应信号(z)具有在感知上高的声音品质。声源信号(x)由发射机(300)中的编码装置编码为至少一个基本编码信号(P)。所述至少一个基本编码信号(P)由此表示声信号(X)在感知上重要的特征。发射机(300)中的编码装置可包括至少一个频谱平滑单元(305a)，该单元接收至少一个信号分量，而基本编码信号P基于信号分量，并响应于此产生对应的平滑信号分量。随后从未显示的相应平滑信号分量产生至少一个增强编码信号P_(E)。

Description

在感知上改善的声音信号编码方法和设备

技术领域

本发明一般涉及声源信号的编码，这样，与已知的编码方案相比，基于编码信息而重构的相应信号具有更高的可感知声音品质。更具体地说，本发明涉及声音信号编码产生编码信息，以通过传输媒体进行传输，以及对已通过传输媒体传输的编码信息进行解码。本发明还涉及通信系统、计算机程序以及计算机可读媒体。

背景技术

语音编解码器(编解码器＝编码器和解码器)有许多不同的应用。编码和解码方案用于在固定和移动通信系统以及视频会议系统中的高效比特率的声音信号传输。语音编解码器也可以用于安全电话和话音存储器。

固定和移动电话以及视频会议的发展趋势便是改善重构声音信号的品质。这种趋势也反映出用户期望这些系统所提供的声音品质达到或超过现有固定电话网络的品质。实现这种期望的一个办法便是增宽声音信号的频带，并因此向接收机传送更多源信号中所包括的信息。事实上，语音信号的大部分能量的频谱分布于0kHz至4kHz之间(即当前技术水平编解码器典型的带宽)。然而，还有大量能量分布在4kHz至8kHz的频带中。此频带中的频率分量所表示的信息可由收听人感觉为音质“清晰”，如同说话人就在收听人“眼前”。

随着频率的增加，人类听觉的频率分辨率会相应降低。因此，只需相对较少的比特便可模拟分布于4kHz至8kHz之间的频率分量，并具有足够的精度。尽管如此，至今仍未出现一种具有比特率有效的宽带编解码器，可以提供具有令人满意感知品质的重构声音信号。现有的ITU-TG.722宽带编码标准以48、56和64kbps的比特率运行，与采用的比特率相比，它仅能提供无法令人满意的品质(ITU-T＝国际电信联盟，标准化部分)。

美国专利5956686描述了一种自适应变换编码/解码装置，在该装置中，包络的频谱被分成若干频带，以便在各个频带的包络上应用不同的编码方法。这样就有可能在频谱包络的频带间利用不同的冗余。同时也调节频谱包络以适应编码和/或传输方法，从而补偿各频带中的时间波动。

美国专利5526464描述了一种编码激发线性预测编码方法，其中将残余信号分成若干频带。为每个频带提供特定的码本，码本的大小随着频带的增加而减少。采样率随着频率的减少而降低，以便降低码本搜索的复杂性。

因此，在本领域存在所应用的编码方案考虑到不同频带的变化属性的例示。然而，不同的属性只用于获取源信号的比特效率编码。现在还未有任何用于在使用为第一频带优化的编码方案对第二频带中的信号进行编码时，补偿所应用的编码中固有的不足的特殊方法的讲授。

现在，大多数的语音编码模型均设计用于窄带信号(一般在0-4kHz)。如果这些语音编码模型应用于对具有诸如0-8kHz等更大带宽的声音信号进行编码，则只有相关频带部分、即较低频部分的编码是优化的。

这种现象的一个原因是编码参数的量化一般涉及时域中目标信号和再现信号的相关性。由于与低频率分量相比，语音信号较高的频率分量具有低功率密度，因此，此类相关性将主要基于低频区域中的信号匹配。因此，高频分量在接收机端的再现较差。

不幸地是，人类听力的缺陷或者话音信号的特征均不能原谅这种较差的再现。声音产生时，声道就好像是滤波器，对肺部产生的气流进行滤波。所谓的共振峰对应于此滤波器的共振频率。在话音信号的较低频带中，目标信号具有明显的共振峰。然而，对于较高的频率，共振峰更加分散。由于所采用的语音模型的局限性，通过传统的窄带编码器进行编码的具有相对较大带宽的声音信号将被再现为在其上部频带中也具有明显频谱结构(即波峰与波谷)的信号。一般具有这种特征的声音信号会让收听人觉得是一种不自然的金属声。

有时会将第二解码器应用于第一解码器的输出信号，或者与第一解码器同时应用，以便进一步改善重构信号的品质。如果在使用传统窄带编码器对宽带源信号进行编码时采取了此措施，则高端频带中的频谱结构有时会更加明显。虽然对于窄带声音信号而言，这可以较理想地改善声音品质，但是，对于宽带声音信号，效果可能相反。

发明内容

因此，本发明的目的是提供一种改善的声音信号编码方案以缓和上述问题。

根据本发明的一个方面，通过本说明书开始所述的方法实现本发明的目的，对声源信号进行编码，以产生代表声音信号的编码信息，从而通过传输媒体进行传输，其特征在于主编码信号和目标信号分别包括多个系数，每个系数表示一个频率分量。产生至少一个平滑信号，它对应于主编码信号和目标信号，该平滑信号是主编码信号和目标信号的选择性修改形式，其中减少了表示超出阈值的频率信息的系数值中的变化。

根据本发明的另一方面，通过一种计算机程序实现所述目的，该计算机程序可直接载入计算机内部存储器，它包括当在计算机上运行所述程序时，用于控制上段中所述方法的软件。

根据本发明的又一方面，通过其上记录了程序的计算机可读媒体可实现所述目的，其中程序使计算机控制上面倒数笫二段所述的方法。

根据本发明的再一方面，通过如本说明书开始所述解码声源信号估计量的方法实现所述目的，其特征在于平滑主解码频谱包括多个系数，每个系数表示一个频率分量。平滑主解码频谱是至少一个主解码频谱之一的选择性修改形式，其中减少了表示超出阈值的频率信息的系数值中的变化。

根据本发明的另一方面，通过一种计算机程序实现所述目的，该计算机程序可直接载入计算机内部存储器，它包括当在计算机上运行所述程序时，用于控制上段所述方法的软件。

根据本发明的又一方面，通过其上记录了程序的计算机可读媒体可实现所述目的，其中程序使计算机控制上面倒数第二段所述的方法。

根据本发明的再一方面，通过如本说明书开始所述的发射机实现所述目的，其特征在于设计至少一个频谱平滑单元，通过选择性地修改主编码信号，从主编码信号中产生平滑输出信号，从而减少其表示超出阈值的频率信息的系数值中的变化。

根据本发明的另一方面，通过本说明书开始所述的接收机实现所述目的，其特征在于平滑主解码频谱包括多个系数，每个系数表示一个频谱分量。接收机中的频谱平滑单元设计为通过选择性地修改至少一个主解码频谱，产生平滑主解码频谱，从而减少表示超出阈值的频率信息的系数值中的变化。

根据本发明的又一方面，通过将声源信号从第一节点传输到第二节点的通信系统实现所述目的。在第一节点中，通信系统包括提议的发射机，用于对声源信号进行编码以产生编码信息。在第二节点中，通信系统包括提议的接收机，用于接收发射机所产生的编码信息，以及用于将编码信息的估计量解码为声源信息的估计量。传输媒体用于从发射机向接收机传送至少一个增强编码信号。

所提议的在将由接收机重构声音信号所依据的一个或多个信号中，减少了表示超出阈值的频率信息的系数值中的变化，这改善了诸如声音或音乐等典型声音信号在感觉上的自然度。具体地说，先有编码技术产生的金属音可以大幅度减轻。这是极需的一种效果，因为感知的声音品质是将来宽带应用成功的一个关键因素。

附图说明

现在将通过示例，并参照附图以优选实施例对本发明作出更为详尽的解释。

图1A显示一个频率图，其中具有主解码频谱的系数，每个系数表示声源信号的一个频率分量；

图1B显示如何计算图1A中表示超出阈值频率的频带中的频率分量的系数的平均系数值；

图1C显示如何用图1B中的平均系数值替换超出阈值频率的频带中的频率分量的原系数值；

图2A显示用于在重叠频带中添加系数值的窗函数的第一示例；

图2B显示了用于在重叠频带中添加系数植的窗函数的第二示例；

图3显示根据本发明的发射机-接收机对的方框图；

图4显示根据本发明第一实施例的频谱平滑单元的方框图；

图5显示根据本发明第二实施例的频谱平滑单元的方框图；

图6A显示根据本发明第二实施例，将由频谱平滑单元进一步编码的主解码频谱的中间系数的频率图；

图6B在频率图中显示根据本发明第二实施例得到的平滑解码频谱的系数；

图7显示根据本发明实施例的通信系统方框图；

图8以流程图的形式说明根据本发明编码声音信号的一般方法；以及

图9以流程图的形式说明了根据本发明将编码信息解码为声音信号估计量的一般方法。

具体实施方式

附图1A在频率图中显示了沿x轴的主解码频谱的系数K_Y。每个系数K_Y表示声源信号中频率分量的幅度，该声源信号已根据任意编码方案进行编码，通过传输媒体发送并根据适当的解码方案进行解码。因此，主解码频谱表示声音信号x在感知上的重要特征。

图1B显示如何将超出阈值频率f_T由系数K_Y表示的主解码频谱

分成频带i、ii和iii。第一频带i包括了阈值频率f_T与第一边缘频率f_i之间的频率分量，第二频带ii包括了第一边缘频率f_i与第二边缘频率f_ii之间的频率分量，第三频带iii包括了第二边缘频率f_ii与第三边缘频率f_iii之间的频率分量。在各频带i、ii和iii中的各个虚线表示所述频带的算术平均系数值。在本发明的备选实施例中，确定的是中值系数而不是算术平均值。

平滑主解码频谱生成为主解码频谱的选择性修改形式，其中减少了表示超出阈值f_T的频率信息的系数值K_YE中的变化。在图1C所示的例示中，图1B中的平均系数值K_i、K_ii和K_iii替换了超出阈值频率f_T的频带i、ii和iii中频率分量的原系数值，并由此实现了系数值K_YE中变化的减小。

图1B和1C显示了本发明的实施例，其中频带i、ii和iii并未重叠且具有不同的带宽。由于人听觉分辨率大体上是随着频率的提高而呈对数关系下降，因此，从感知角度来说，根据对数频标划分频带i、ii和iii是合乎情理的。例如，Bark刻度通过以下边缘频率划分频谱：0kHz、0.1kHz、0.2kHz、0.3kHz、0.4kHz、0.51kHz、0.63kHz、0.77kHz、0.92kHz、1.08kHz、1.27kHz、1.48kHz、1.72kHz、2kHz、2.32kHz、2.7kHz、3.15kHz、3.7kHz、4.4kHz、5.3kHz、6.4kHz、7.7kHz、9.5kHz、12kHz和15.5kHz。Mel倒谱刻度定义了另一组频带，旨在模仿人类听觉的临界频带。感知线性预测方法(PLP)还提供了另一种方式，可获取表示感知所推动的频谱定标和压缩的一组频带。

当然，频带也可以是等距的，或者可以只有一个单频带覆盖超出阈值频率f_T的整个频谱。

此外，不考虑频带的相关带宽，相邻的频带可以至少部分彼此重叠。如果这样，则在可以通过将相关系数值加在一起以得到频带间重叠区域中结果系数值之前，各频带内的系数必须乘以窗函数。

图2A显示这种窗函数W₁的第一例示，该函数具有梯形形状，定义在下边频f₁和上边频f_u之间。窗函数W₁在非重叠频率区域中具有恒定幅度，例如1，并且其幅度在相邻频带重叠的下部过渡区域和对应的上部过渡区域中逐渐降低。窗函数W₁在各过渡区的中点最好等于恒定幅度的一半(如0.5)。当然，中点当然必须相对于所用的任一非线性频率刻度定义。

图2B显示窗函数W₂的另一例示，用于在重叠频带中添加系数值，该函数具有非梯形形状，其它与上面参照图2A所述的窗函数W₁特征相同。在过渡区域中具有非线性形状(如正弦或余弦波的第一个四分之一部分)的窗函数对于某些应用在频率属性上有优势。

图3显示了根据本发明的发射机-接收机对方框图。发射机300将声源信号x编码成编码表示P_(E)，然后通过传输媒体306发送到接收机310。

发射机300包括编码装置，用于产生至少一个基本编码信号P，该信号表示声音信号x在感知上的重要特征。接收机310有可能直接从基本编码信号P的估计量重构声源信号x的估计量然而，根据本发明的优选实施例，发射机300也包括第一频谱平滑单元305a，它接收至少一个信号分量，而基本编码信号P基于信号分量并响应于此而生成对应的平滑信号分量。从未显示的对应平滑信号分量产生增强编码信号P_(E)。增强的编码信号P_(E)构成声源信号x的改善表示，接收机310可以从中重构在感知上改善的声源信号x的估计量通过选择性地修改信号分量的频谱，第一频谱单元305a从基本编码信号P中的至少一个信号分量产生对应的平滑信号，从而减少表示超出阈值的频率信息的频谱系数值中的变化。第一频谱平滑单元305a因而以一种与上面参照图1A-1C所述修改主解码频谱相同方式，修改信号分量的频谱。

增强的编码信号P_(E)经传输媒体306发送，并以发送的增强编码信号形式由接收机310作为增强编码信号P_(E)的估计量接收。接收机310利用发送的增强编码信号

通过第二频谱平滑单元305b重构在感知上改善的声源信号x估计量通过对从发送的增强编码信号

中解码的主频谱

进行选择性修改，第二频谱平滑单元305b产生在感知上改善的声源信号x的估计量从而减少了表示超出阈值的频率信息的平滑主解码频谱

的系数值中的变化。

图4显示根据本发明第一实施例设计的图3所示频谱平滑单元305a和305b的方框图。然而，为简单起见，此处只涉及第二频谱平滑单元305b中的变化。频谱平滑单元305b包括第一缓冲存储器401，该存储器中存储主解码频谱

的系数K_Y，其中每个系数表示一个频率分量。处理单元402从对应于超出阈值f_T的频率分量的第一缓存存储器401接收系数k_Y ⁿ⁺¹-k_Y ^m，并计算至少一个频带i、ii、iii中的各频带的这些系数k_Y ⁿ⁺¹-k_Y ^m的平均系数值K_i、K_ii、K_iii。各个算得的平均系数值K_i、K_ii、K_iii随后会反复存储到第二缓冲存储器403，存储次数等于特定频带i、ii、iii中主解码频谱

的系数K_Y的数量。这种存储的目的是使得用相关平均系数值K_i、K_ii、K_iii迅速替换主解码频谱的系数K_Y成为可能。通过读出单元404从第一缓冲存储器401读出达到阈值f_T的系数k_Y ¹-k_Y ⁿ以及从第二缓冲存储器403读出超出阈值f_T的平滑系数k_Y ⁿ⁺¹-k_Y ^m，可以实现系数替换。这些系数k_Y ¹-k_Y ⁿ、K_i、K_ii、和K_iii随后一起构成平滑主解码频谱

的系数K_YE，在读出单元404的输出端上提供。

图5显示根据本发明第二实施例设计的图3所示频谱平滑单元305a和305b的方框图。同样，为简单起见，此处只涉及第二频谱平滑单元305b中的变化。

频谱平滑单元305b包括第一变换器501，用于通过输入端接收主频谱第一变换器501在第一输出端上产生一个对应的角频谱Y_s ^arg，并在第二输出端上产生一个对应的幅度频谱|Y_s|。幅度频谱|Y_s|由系数值k_Y ¹，...k_Y ^m表示。可选地是，频谱平滑单元305b包括对数变换器502，该变换器接收表示超出阈值频率f_T的频率分量的幅度频谱|Y_s|的那些系数k_Y ⁿ⁺¹...k_Y ^m，而将表示较低频率分量的幅度频谱|Y_s|的系数k_Y ¹-k_Y ⁿ转发到组合器507。对数变换器502在输入端上接收表示超出阈值频率f_T的频率分量的幅度频谱|Y_s|的系数k_Y ⁿ⁺¹...k_Y ^m，并响应于此在输出端上提供对数变换。第一逆变换器503在输入端上接收此变换部分的幅度频谱，并响应于此在输出端上提供倒谱编码信号，该倒谱编码信号具有一组倒谱系数，其中每个系数表示倒谱域中的一个分量。如果未包括对数变换器502，则幅度频谱|Y_s|的系数k_Y ⁿ⁺¹...k_Y ^m将直接从第一变换器501馈送到第一逆变换器503。随后的删除单元504将删除倒谱编码信号中n阶及更高阶的倒谱系数，用零值系数替换这些删除的系数并将信号再传送到第二变换器505以产生对应的频谱信号。

如果对数变换器502已在较早时候执行了相应的对数变换，则此倒谱信号将在随后的逆对数变换器506中进行逆对数变换。逆对数变换器506产生对数平滑系数k_Y ⁿ⁺¹...k_Y ^m。因此，将来自第二变换器505的平滑系数k_Y ⁿ⁺¹...k_Y ^m或来自逆对数变换器506的对数平滑系数k_Y ⁿ⁺¹...k_Y ^m，以及表示小于阈值频率f_T的频率分量的幅度频谱|Y_s|的系数k_Y ¹-k_Y ⁿ，转发给组合器507。组合器响应于系数k_Y ¹-k_Y ⁿ和平滑系数k_Y ⁿ⁺¹...k_Y ^m，提供平滑幅度频谱|Y_SE|。第二逆变换器508在第一输入端上接收角频谱Y_s ^arg，同时在笫二输入端上接收平滑幅度频谱|Y_SE|，并响应于此在输出端上产生增强编码信号

图6A在(对数)幅度频谱图中显示了主解码频谱的频谱系数K_s的例示。在图中可以看到，在相邻系数K_s之间，主解码频谱包含的系数具有较大的变化。因为在表示声信息的频带的更高端中不希望出现这种变化，所以如参照图5所述，在频谱平滑单元305b中减小了此变化。频谱平滑单元305b接收主解码频谱并因此提供平滑主解码频谱

在该频谱中，减少了表示超出阈值f_T的频率信息的系数值K_YE中的变化。换句话说，由于删除单元504的变量n选择该值，因此，在表示超出阈值f_T的频率信息(对应于频谱指数k_Y ⁿ)的平滑主解码频谱中，系数值K_YE的变化将减小。

图6B在频率图中显示了经由频谱平滑单元305b修改为表示对应的平滑主解码频谱的系数值K_YE之后，图6A中的主解码频谱的幅度频谱系数K_s。

作为倒谱变换以及倒谱编码信号中随后的删除高阶系数的一种替代方法，频谱平滑可通过对表示主频谱

的频谱系数进行线性低通滤波来实现，或者通过对表示超出阈值f_T的频率分量的主频谱进行中滤波频谱系数来实现。

图7显示根据本发明实施例的通信系统方框图，通过通信系统，声源信号x可作为低比特率编码信号从第一节点发送到第二节点，并在第二节点中重构为声源信号x的估计量系统包括发射机300、传输媒体306和接收机310。

发射机300又包括信号编码器702，该编码器具有输入端和输出端，输入端用于接收声源信号x，输出端用于提供表示声音信号x在感知上重要特征的基本编码信号P₁。信号编码器702也提供目标信号r和主编码信号y，目标信号r表示声源信号x的滤波(普通意义上)形式，而主编码信号y表示基于基本编码信号P₁的重构信号。根据上述方法，可以作以下选择：目标信号r和主编码信号y在频谱平滑单元305a与305c中均不进行频谱平滑处理，或者对其中之一进行频谱平滑处理，或者对两个信号都进行频谱平滑处理。

根据本发明的优选实施例，第一频谱平滑单元305a接收主编码信号y，并响应于此产生平滑主编码信号y_E。然而，发射机中也可包括额外的频谱平滑单元305c以接收目标信号r，并相应地产生平滑目标信号r_E。根据本发明的另一优选实施例，只包括了改善目标信号r的频谱平滑单元305c(而不包括改善主编码信号y的频谱平滑单元305a)。本发明的这些不同实施例在图7中以虚线和虚线框表示。

频谱平滑单元305a和305c都根据本发明上述方法运行，以便通过减少在表示超出阈值f_T的频率信息的信号频谱系数值中的变化，产生平滑主编码信号y_E(并有可能产生平滑目标信号r_E)。

发射机300中的均衡编码器703接收平滑主编码信号y_E和目标信号r_(E)(可能已进行平滑处理)。均衡编码器703将目标信号r_(E)(可能已进行平滑处理)和平滑主编码信号y_E变换到频域，并计算所变换的信号的频谱之间的比率频谱(ratio spectrum)C，以表示目标信号r_(E)(可能已进行平滑处理)和平滑主编码信号y_E之间的对数频谱差。比率频谱C的幅度因此表明第一编码信号P₁描述声音信号x的适当程度。

在均衡编码器703的输出端上提供比率频谱C，并将其转发到量化器704，该量化器将响应于比率信号C在其输出端上提供第二编码信号P_C。第二编码信号P_C表示包含一组系数的离散和量化信号。

最后，发射机300包括一个输出单元(未显示)，用于将第一编码信号P₁及第二编码信号P_C传送到传输媒体306。如果至少发射机300和接收机310之一是移动装置，则通常情况下，传输媒体306至少部分由一个或多个无线电资源构成。当然，根据本发明，固定或移动通信适用的任何其它传输媒体类型也同样很适用。

接收机310随后接收信号P₁、P_C的估计量，作为表示第一编码信号P₁的第一发送信号

及表示第二编码信号P_C的第二发送信号

接收机310利用第一发送信号和第二发送信号

来重构在感知上改善的声源信号x的估计量为此，接收机310包括均衡解码器707、重构单元708、频谱平滑单元305b及均衡器709。

重构单元708通过输入端接收第一发送信号

并响应于此在其输出端上生成主解码频谱

表示声源信号x的频谱估计量。主解码频谱

被转发到频谱平滑单元305b。此单元305b根据所提议的方法产生平滑主解码频谱

均衡解码器707接收第二发送信号并响应于此在其输出端上提供估计的均衡频谱估计均衡频谱与平滑主解码频谱被转发到均衡器709。均衡器709将估计均衡频谱

与平滑主解码频谱相乘。然后，均衡器709产生相乘结果的逆变换，以在时域中形成信号。此信号构成源信号x的改善估计量并且在均衡器709的输出端上发送。

改善的估计量也可构成源信号x的间接表示。例如，在线性预测编码器的情况下，改善的估计量

将改为激励信号，从该信号可通过合成滤波器产生源信号x的估计量。

由于许多编码系统中的编解码器(如GSM EFR编码器和AMR编码器)在分段成帧或子帧的语音信号上以块方式操作，因此，最好在块方式中应用对应于语音信号分段的均衡算子C(由估计的均衡频谱

近似)(GSM＝全球移动通信系统；EFR＝增强型全速率；AMR＝自适应多速率)。当然，这同样适用于表示源信号x的估计平滑频谱的频率变换Y_E。

图8以流程图方式说明了根据本发明编码声音信号的一般方法。第一步骤801接收声音信号x。在随后的步骤802中，生成表示声音信号x在感知上的重要特征的基本编码信号P。在接着的步骤803中，减小至少一个信号分量的系数值中的变化，其中基本编码信号P基于这些信号分量，并响应于此生成对应的平滑信号分量。从未显示的对应平滑信号分量产生增强的基本编码信号P_(E)。最后，在步骤804中，将增强编码信号P传送到传输媒体以便传输到接收机。

图9以流程图方式说明了根据本发明将编码信息解码成声音信号的估计量的一般方法。第一步骤901从传输媒体接收至少一个发送(可能已增强)的编码信号

随后，在步骤902中从所述至少一个发送(可能已增强)的编码信号

生成主解码频谱

接着，在步骤903中从主解码频谱形成平滑主解码频谱

最后，步骤904至少依据平滑主解码频谱

生成源信号的估计量估计量

对收听人而言具有感知上的高声音品质。

以上本发明提议的实施例全部涉及在频域的操作。然而，根据本发明的优选实施例，可在时域采取对应的操作，即通过子带滤波器将表示声源信号的信号分成至少两个不同的信号分量。信号分量随后可分别进行功率调整以获得所需的平滑。接着，将调整了功率的信号分量组合成单个平滑基本编码信号，因而构成声源信号的表示，在该表示中，减小了超出阈值频率的信号分量的频率变化。

在本说明书中使用的术语“包括”是用于指定所述功能、整数、步骤或组件的存在。然而，该术语并未排除一个或一个以上的其它功能、整数、步骤或组件或由它们构成的组的存在或添加。

本发明并不局限于附图中所述的实施例，而是可以在权利要求书所述范围内自由变化。

Claims

1.一种对声源信号进行编码以产生代表声源信号的编码信息，以便通过传输媒体进行传输的方法，它包括：

响应于所述声源信号产生

基本编码信号，它表示所述声源信号在感知上的重要特征；

目标信号，它是通过对所述声源信号进行滤波以产生代表所述声源信号的经滤波的形式；以及

主编码信号，它表示根据所述基本编码信号重构的信号；

至少响应于所述主编码信号和所述目标信号之一产生相应的平滑信号，所述平滑信号构成所述主编码信号和所述目标信号在感知上改善了的表示；以及

根据以下组合之一产生第二编码信号：

所述平滑主编码信号和所述目标信号；或

所述主编码信号和所述平滑目标信号；或

所述平滑主编码信号和所述平滑目标信号；

其特征在于，

所述主编码信号包括多个系数，其中每个系数表示一个频率分量；

所述目标信号包括多个系数，其中每个系数表示一个频率分量；以及

所述平滑主编码信号是所述主编码信号的选择性修改形式，其中减小了表示超出阈值的频率信息的系数值中的变化，并且所述平滑目标信号是所述目标信号的选择性修改形式，其中减小了表示超出阈值的频率信息的系数值中的变化。

2.如权利要求1所述的方法，其特征在于，通过以下方式从所述主编码信号获得平滑主编码信号：

将表示超出所述阈值的频率分量的所述主编码信号的所述系数分成多个频带；

在所述各个频带内计算所述系数的平均系数值；以及

将各频带中的所述系数替换为所述各个平均系数值。

3.如权利要求2所述的方法，其特征在于，所述频带是等距的。

4.如权利要求2或3所述的方法，其特征在于，所述频带部分重叠。

5.如权利要求4所述的方法，其特征在于，通过以下步骤获得所述频带的重叠区域中的结果系数值：

将各频带与窗函数相乘以获得对应的加窗频带；以及

在各重叠区域中添加相邻加窗频带的系数值。

6.如权利要求5所述的方法，其特征在于，所述窗函数在非重叠频率区域具有恒定的幅度，并且在相邻频带重叠的上部和下部过渡区域中幅度逐渐降低。

7.如权利要求1所述的方法，其特征在于，所述主编码信号的所述选择性修改涉及：

产生具有一组倒谱系数的倒谱编码信号，每个倒谱系数表示倒谱域中的一个分量；以及

删除所述倒谱编码信号中预定阶和更高阶的倒谱系数。

8.如权利要求7所述的方法，其特征在于，这样选择所述预定阶，使得表示超出所述阈值的频率信息的所述平滑主编码信号的系数值中的变化减少。

9.如权利要求1所述的方法，其特征在于，所述第二编码信号表示所述基本编码信号描述所述声源信号的合适程度。

10.如权利要求9所述的方法，其特征在于，所述第二编码信号与所述组合形式相对应，表示目标信号和所述平滑主编码信号之间的频谱比率、或者平滑目标信号和所述主编码信号之间的频谱比率、或者平滑目标信号和平滑主编码信号之间的频谱比率。

11.如权利要求9所述的方法，其特征在于，所述第二编码信号与所述组合形式相对应，表示目标信号和所述平滑主编码信号之间的对数频谱差、或者平滑目标信号和所述主编码信号之间的对数频谱差、或者平滑目标信号和平滑主编码信号之间的对数频谱差。

12.如权利要求10所述的方法，其特征在于，通过以下方式获得所述第二编码信号：

响应于所述声源信号产生频率变换的目标信号；

响应于所述声源信号产生频率变换的主编码信号；

产生介于所述频率变换目标信号与所述频率变换主编码信号之间的比率频谱；以及

根据所述比率频谱形成所述第二编码信号。

13.一种从通过传输媒体发送的编码信息解码出声源信号的表示的估计量的方法，它包括：

接收表示所述至少一个编码信号的估计量的至少一个已发送编码信号；

从所述至少一个已发送编码信号解码出至少一个主解码频谱；

从所述至少一个主解码频谱产生平滑主解码频谱；以及

至少根据所述平滑主解码频谱产生所述声源信号的所述估计量；其特征在于，：

所述平滑主解码频谱包括多个系数，其中每个系数表示一个频率分量，所述平滑主解码频谱是所述至少一个主解码频谱之一的选择性修改形式，其中减少了表示超出阈值的频率信息的所述系数值中的变化。

14.如权利要求13所述的方法，其特征在于，所述声源信号的所述表示构成所述声源信号本身。

15.如权利要求13所述的方法，其特征在于，所述声源信号的所述表示构成激励信号，所述声源信号可以从该激励信号获得。

16.如权利要求13至15中任何一项所述的方法，其特征在于，通过以下步骤从所述至少一个主解码频谱获得所述平滑主解码信号

将表示超出所述阈值的频率分量的所述至少一个主解码频谱之一的所述系数分成多个频带；

计算所述各个频带内所述系数的平均系数值；以及

将各频带内的所述系数替换为所述各个平均系数值。

17.如权利要求16所述的方法，其特征在于，所述频带是等距的。

18.如权利要求16所述的方法，其特征在于，所述频带部分重叠。

19.如权利要求18所述的方法，其特征在于，通过以下步骤获得所述频带的重叠区域中的结果系数值：

将各频带乘以窗函数以获得相应的加窗频带；以及

在各重叠区域中添加相邻加窗频带的系数值。

20.如权利要求19所述的方法，其特征在于，所述窗函数在非重叠频率区域具有恒定的幅度，并且在相邻频带重叠的上部和下部过渡区域中幅度逐渐降低。

21.如权利要求13至15中任何一项所述的方法，其特征在于，所述至少一个主解码频谱的所述选择性修改涉及：

删除所述倒谱编码信号中预定阶和更高阶的倒谱系数。

22.如权利要求21所述的方法，其特征在于，这样选择所述预定阶，使得表示超出所述阈值的频率信息的所述平滑主解码频谱的系数值中的变化减少。

23.如权利要求13所述的方法，其特征在于，所述至少一个已发送编码信号包括：

第一编码信号的第一估计量，构成所述声源信号的编码表示；以及

第二编码信号的第二估计量，表示所述第一编码信号描述所述声源信号的合适程度。

24.如权利要求23所述的方法，其特征在于，所述第二编码信号与所述组合形式相对应，表示目标信号和所述平滑主编码信号之间的频谱比率、或者平滑目标信号和所述主编码信号之间的频谱比率、或者平滑目标信号和平滑主编码信号之间的频谱比率。

25.如权利要求23所述的方法，其特征在于，所述第二编码信号与所述组合形式相对应，表示目标信号和所述平滑主编码信号之间的对数频谱差、或者平滑目标信号和所述主编码信号之间的对数频谱差、或者平滑目标信号和平滑主编码信号之间的对数频谱差。

26.如权利要求23所述的方法，其特征在于，通过以下步骤获得所述声源信号的估计量：

响应于所述第一估计量产生所述至少一个主解码频谱；

响应于所述至少一个主解码频谱产生所述平滑主解码频谱；

响应于所述第二估计量产生均衡频谱；以及

响应于所述均衡频谱和所述平滑主解码频谱产生所述声源信号的所述估计量。

27.一种发射机，用于对声源信号进行编码以产生根据所述声源信号的编码信息，从而通过传输媒体进行传输，所述发射机包括：

主编码器，它具有：输入端，用于接收所述声源信号；以及第一输出端，用于提供表示所述声源信号在感知上的重要特征的基本编码信号，可从中重构所述声源信号的估计量；第二输出端，用于提供表示所述声源信号的滤波形式的目标信号；第三输出端，用于根据所述基本编码信号提供表示重构信号的主编码信号；

至少一个频谱平滑单元，用于响应于所述主编码信号产生平滑主编码信号，该信号构成所述主编码信号在感知上改善了的表示；

量化器，用于根据所述平滑主编码信号和所述目标信号产生第二编码信号，

其特征在于，至少一个频谱平滑单元被设计为通过选择性地修改所述主编码信号，从所述主编码信号产生平滑输出信号，从而减少其表示超出阈值的频率信息的系数值中的变化。

28.如权利要求27所述的发射机，其特征在于，所述至少一个频谱平滑单元包括：

第一缓冲存储器，用于存储所述输入信号的系数，每个系数表示一个频率分量；

处理单元，将超出所述阈值的频率分量所对应的系数分成多个频带，并且为至少一个频带中的各个频带计算存储在所述第一缓冲存储器中的所述系数的平均系数值；

第二缓冲存储器，用于反复存储所述各频带的所述各个平均系数值，存储次数与所述特定频带中所述至少一个基本编码信号的对应系数的数量相同；以及

读出单元，用于从所述第一缓冲存储器读出不大于所述阈值的系数，以及从所述第二缓冲存储器读出超出所述阈值的系数，以形成所述输出信号的所述系数。

29.如权利要求28所述的发射机，其特征在于，所述频带是等距的。

30.如权利要求28或29所述的发射机，其特征在于，所述频带至少部分重叠。

31.如权利要求30所述的发射机，其特征在于，它包括系数组合器，用于通过以下步骤在所述频带的重叠区域中得到结果系数值：

将各频带与窗函数相乘以获得对应的加窗频带；以及

在各重叠区域中添加相邻加窗频带的系数值。

32.如权利要求31所述的发射机，其特征在于，所述窗函数在非重叠频率区域具有恒定的幅度，并且在相邻频带重叠的上部和下部过渡区域中幅度逐渐降低。

33.一种接收机，用于从接收自传输媒体的编码信息解码出声源信号的表示的估计量，它包括频谱平滑单元，该单元具有接收从所述接收的编码信息得到的主解码频谱的输入端，以及提供平滑主解码频谱的输出端；其特征在于，所述平滑主解码频谱包括多个系数，其中每个系数表示一个频率分量，所述频谱平滑单元被设计为通过选择性修改所述主解码频谱，产生所述平滑主解码频谱，从而减少表示超出阈值的频率信息的系数值中的变化；

所述接收机还包括：

重构单元，具有接收所述编码信息中第一发送信号的输入端；以及提供所述主解码频谱的输出端；

均衡解码器，具有接收所述编码信息中第二发送信号的输入端和提供估计的均衡频谱的输出端；以及

均衡器，具有接收所述平滑主解码频谱的第一输入端、接收所述估计均衡频谱的第二输入端以及提供所述声源信号的所述估计量的输出端。

34.如权利要求33所述的接收机，其特征在于，所述频谱平滑单元包括：

第一缓冲存储器，用于存储所述主解码频谱的系数，其中每个系数表示一个频率分量；

读出单元，用于从所述第一缓冲存储器读出不大于所述阈值的系数，以及从所述第二缓冲存储器读出超出所述阈值的系数，以形成所述平滑主解码频谱的所述系数。

35.如权利要求34所述的接收机，其特征在于，所述频带是等距的。

36.如权利要求34或35所述的接收机，其特征在于，所述频带至少部分重叠。

37.如权利要求36所述的接收机，其特征在于，它包括系数组合器，用于通过以下步骤在所述频带的重叠区域中得到结果系数值：

将各频带与窗函数相乘以获得对应的加窗频带；以及

在各重叠区域中添加相邻加窗频带的系数值。

38.如权利要求37所述的接收机，其特征在于，所述窗函数在非重叠频率区域具有恒定的幅度，并且在相邻频带重叠的上部和下部过渡区域中幅度逐渐降低。

39.一种通信系统，用于将声源信号从第一节点传输到第二节点，它包括：

如权利要求27-32中任何一项所述的发射机，用于对所述声源信号进行编码以产生编码信息；

如权利要求33-38中任何一项所述的接收机，它具有接收由所述发射机产生的编码信息的输入端，并将所述编码信息解码成所述声源信号的估计量；以及

传输媒体，用于将所述发射机产生的编码信息从所述发射机传送到所述接收机。