CN1134581A

CN1134581A - 音响信号的误差隐匿方法及其装置

Info

Publication number: CN1134581A
Application number: CN95113141A
Authority: CN
Inventors: 金炳宇; 郑济昌
Original assignee: Samsung Electronics Co Ltd
Current assignee: Samsung Electronics Co Ltd
Priority date: 1994-12-21
Filing date: 1995-12-21
Publication date: 1996-10-30
Also published as: US5673363A; JPH08286698A; KR970011728B1; KR960027375A; EP0718982A3; EP0718982A2

Abstract

音响信号误差隐匿方法及装置，在压缩音响信号特定帧因误差消失时，用其相邻帧音响信号进行隐匿。为以纠错的帧为单位隐匿频分编码/变换编码的数字音响信号的误差发生帧，装置包括输入代表编码音响信号的频率系数在各帧检测误差是否发生的误差检测装置；输入频率系数在音响信号频率区域各子频带对频率系数译码和译码装置；存储译码装置译码的频率系数的缓冲器；频率系数复原装置，按与编码相同顺序变换成时域音响信号的合成滤波器组。

Description

音响信号的误差隐匿方法及其装置

本发明涉及一种对压缩的音响信号进行译码的数字音频接收装置，特别是涉及在因误差使压缩的音响信号的特定帧消失的情况下可使用与其相邻的1帧或多帧的音响信号来进行隐匿的音响信号的误差隐匿方法及其装置。

通常，为了音响信号的压缩扩展处理而使用频分编码和变换编码。图1简要地表示出使用频分编码的现有数字音响信号编码/译码装置。

在图1中，编码器1中的分析滤波器数据库1A把输入音响信号分割成K个频带。下取样单元1B把分割了频带的信号按照输入信号具有的取样频率的1/K倍进行下取样或十取一取样。量化单元1C把取样信号进行量化。量化信号以帧为单位被传送到接收侧。这样一来，接收侧的译码器2通过由编码器1所进行的信号处理的逆过程来再生原来的音响信号。

图1这种装置以帧为单位处理音响信号。帧是在压缩音响信号传送时可以从该音响信号检测误差发生的最小单位。在音响信号的1帧取样数为N时，分析滤波器数据库1A把1帧的取样分割成K个子频带，各个下取样单元1B把各子频带的信号按1/K倍的取样频率进行下取样(或十取一取样)，因而对一个子频带而言，每帧总共有m(＝N/K)个取样(或频率系数)。如果把同一视觉的全部频率系数集合定义为″区段″，则1帧由m个区段S₁～S_m所构成，各区段的频率系数为K个，图2表示出对应于连续的3帧F₁、F₂、F₃的区段S₁～S_m。

各区段的频率系数在经过译码器2的逆量化单元2A和把各子频带信号按K倍的取样频率进行上取样的上取样单元2B之后，输入合成滤波器数据库2C。合成滤波器数据库2C把输入的频率系数逆变换成时域信号之后，同所提供的窗函数进行相乘运算。由此，在任意时刻由从该时刻的全部区段逆变换的信号和窗函数相乘值的总和求出复原的时域音响信号。其中，为了减小连续帧的边缘间的不连续性而使用窗函数。图2表示出窗函数的一个例子。通过使用该窗函数而复原的1帧的音响信号受到以前帧和以后帧的各区段频率成分系数的影响。

图3表示出现有的用于在任意1帧中产生误差而使信号消失时的误差隐匿装置。图3的装置对由频分编码器或变换编码器所压缩的音响信号进行误差隐匿。根据图4A～图4C来说明图3装置的工作。

译码器20对所接收的压缩音响信号进行译码，误差检测部10以帧为单位进行误差检测。译码器20与上述图1的译码器2相同，由逆量化、上取样和合成滤波器数据库所构成。从该译码器20所输出的音响信号施加给开关30，在帧缓冲器40中所存储的以前帧的音响信号也施加给开关30，开关30根据来自误差检测部10的控制信号选择来自译码器20或帧缓冲器40的信号以提供给帧缓冲器40。在未检测到误差帧的情况下，误差检测部10控制开关30把信号从译码器20施加给帧缓冲器40。另一方面，在检测到误差的情况下，误差检测部10控制开关30把从帧缓冲器40反馈的信号提供给帧缓冲器40。例如，在图4A所示的三个帧F₁、F₂、F₃中的帧F₂的没有正确复原的情况下，误差检测部10控制开关30把从帧缓冲器40反馈的音响信号再次施加给帧缓冲器40。从帧缓冲器40所输出的音响信号由D/A变换器50变换成模拟信号。

图4B表示出：在误差发生的情况下和误差未发生的情况下，由图3的误差隐匿装置最终再生的信号。通过使用图4C所示的窗函数而在相邻的帧之间保持连续性，因而在帧F₂正常复原的情况下，在图4B的帧F₂和F₃中，由虚线表示的信号为最终再生的信号。另一方面，在帧F₂因误差而没有正常复原的情况下，帧F₂由图4B所示的以前帧F₁的音响信号所替代。在帧F₂中最终决定的信号由图4B的实线表示。在由图4可知，即使在帧F₃中误差未发生，该音响信号也受到发生了误差的帧F₂的影响。这是因为：译码器20在发生了误差的帧F₂的音响信号中使用用于由图4C的虚线表示的帧F₂的窗函数，来处理帧F₃的压缩音响信号以保持由该方式译码的帧F₂的音响信号和下一帧F₃的音响信号之间的连续性。这样，帧F₃的再生音响信号为图4B中实线表示的信号。该信号显示出同由虚线表示的波形即在帧F₂中误差未发生情况下的帧F₃的再生信号显著不同。这样，仅由以前帧F₂来复制和使用因误差发生没有复原的帧F₂的信号是不合适的。而且，当帧F₂的音响信号变化成与帧F₁大不相同时，帧全部的信号复制也是不合适的。

为了解决上述问题，本发明的目的是提供一种音响信号的误差隐匿方法，可以把发生误差的帧的频率成分系数用相邻的帧或多帧的频率成分系数有效地复原。

本发明的另一个目的是提供一种实现上述方法的装置。

为了实现上述本发明的目的，用于以能纠错的帧为单位隐匿经频分编码/变换编码的数字信号发生了误差的1帧或多帧的方法，包括：输入代表编码数字音响信号的频率系数(步骤a)；对所输入的频率系数检测每帧中误差是否发生(步骤b)；对于所输入的频率系数，在构成全部音响信号频域的各子频带中把频率系数进行译码(步骤c)；存储由上述步骤(c)所译码的频率系数(步骤d)；根据由上述步骤(b)所得到的误差检测结果用已设定的加权值和与发生了误差的帧相邻接的帧或多帧的频率系数复原发生了误差的一帧或多帧的频率系数(步骤e)；用由上述步骤(e)所复原的频率系数来代替由上述译码步骤(c)所译码并由上述步骤(d)所存储的误差发生帧的频率系数(步骤f)；把由上述步骤(f)的结果所得到的频率系数以与在上述步骤(c)中进行译码的顺序相同的顺序变换成时域音响信号(步骤g)。

为了实现上述的本发明的另一个目的，数字音响信号的误差隐匿装置，即用于以能纠错的帧为单位隐匿被频分编码/变换编码的数字音响信号误差发生的帧的装置，包括：误差检测装置，该装置输入代表编码数字音响信号的频率系数，检测每帧中误差是否发生；译码装置，该装置输入上述频率系数，在构成全部音响信号频域的各子频域中对频率系数进行译码；存储由上述译码装置译码的频率系数的缓冲器；频率系数复原装置，该装置根据由上述误差检测装置所得到的误差检测结果用已设定的加权值和存储在上述缓冲器中并属于同误差发生的帧相邻的帧的频率系数中的，同误差发生的帧相邻的各子频域的频率系数来复原发生误差的帧的频率系数，用所复原的频率系数来更新由上述译码装置译码并存储在上述缓冲器中的误差发生帧的频率系数；施加存储在上述缓冲器中的频率系数，并以与进行译码的顺序相同的顺序变换成时域音响信号的合成滤波器组。

图1是简要表示使用频分编码的现有数字音响编码/译码装置的图；

图2是用于说明数字音响信号的图；

图3是表示用于数字音响信号的现有误差隐匿装置的构成图；

图4A～图4C是用于说明图3装置的误差隐匿的信号波形图；

图5是表示由本发明所推荐的一个实施例的数字音响信号的误差隐匿装置的构成图；

图6A～图6B是用于说明按照本发明的误差隐匿方法得到的频率系数复原部的信号处理的示意图；

图7是表示同频率系数相乘的加权值α1的一个例子的曲线图；

图8A～图8B是用于说明按照本发明的另一个误差隐匿方法得到的频率系数复原部的信号处理的示意图。

下面根据附图5至8B来更详细地描述实现本发明的实施例。

图5的装置复原由用于数字音响信号的图1编码器这类装置所压缩的音响信号。压缩的音响信号被加到误差检测器10和译码器100上。误差检测器10对所输入的压缩音响信号的每帧检测误差是否发生，产生表示因误差而未复原的帧的误差帧显示信号。译码器100按频域对压缩的音响信号进行译码。对于由图1的编码器1所压缩的音响信号，输入译码器100的信号为各子频带的频率系数。在此情况下，译码器100产生被逆量化的频率系数。译码器100的输出信号提供给缓冲器70。缓冲器70存储频率系数。通过与图6A～6B和图8A～8B相关连而描述的方法中任一个误差隐匿方法来设计图5的装置，据此决定缓冲器70的数据存储容量。频率系数复原部60根据来自误差检测器10的误差帧显示信号来读出存储在缓冲器70中的信号，由下述方法来复原误差发生帧的频率系数。由此，误差发生帧的频率系数由频率系数复原部60复原。复原的频率系数被加到缓冲器70，在缓冲器70内用由频率系数复原部60所复原的对应频率系数来代替由译码器100所译码的误差发生帧的频率系数。把缓冲器70存储的频率系数按帧的顺序依次输出给合成滤波器组80。合成滤波器组80把窗函数同由缓冲器70所供给的各帧频率系数相乘，把其结果变换成时域信号。D/A变换器90把由合成滤波器数据库80所施加的信号变换成模拟信号。这样，D/A变换器的输出信号为隐匿了所发生的误差的再生音响信号。

根据图6A～图6B来说明按照本发明的方法得到的频率系数复原部60的工作。

图6A～图6B表示的误差隐匿方法是用以前帧的最后区段的频率系数来复原误差发生帧的各区段的频率系数。对于被频分编码的音响信号，频率系数复原部60在各子频带中复原误差发生帧的频率系数。图6A是一帧F₂因误差而未被译码的情况。此时，该帧F₂的第一帧S₁的频率系数值为加权值α₁同帧F₁的最后区段的第M区段S_m的系数值相乘的值。第二区段S₂的系数是用加权值α₂乘以第一区段S₁的系数而求出的。用相同的方式处理第三区段以后的区段S₃～S_m。这样，属于误差发生帧F₂的全部区段S₁～S_m的频率系数被复原了。其中，加权值α₁、 α₂…α_m是一般的小于或等于1的正数，使用者可任意决定。作为它的一个例子，如果α₁＝α₂＝、…、α_m＝α＜1.0，则以帧F₂内的各区段S₁～S_m的系数值求出如下：

系数(S₁、F₂)←α×(S_m、F₁)

系数(S₂、F₂)←α₂×(S_m、F₁)



系数(S_m、F₂)←α^m×(S_m、F₁)

其中，系数(S_j、F_i)表示属于第i帧的第j区段的频率系数。此时，由于加权值为小于1的值，1帧内位于后侧的各区段的系数值急剧变小。图7表示出其一个例子。

如图6B所示，在以相邻的多帧EF₁、…EF_n连续并发生误差的情况下，为了使位于其后的误差发生的全部帧EF₁、…、EF_n的频率系数复原，而使用误差未发生的帧F₁的最后区段的频率系数。为了使帧EF₁、…、EF_n的频率系数复原，使用与图6A相关而说明的方法相类似的方法。其结果，最后的误差帧EF_n的第m区段S_m的频率系数为把全部误差帧以前的加权值全部相乘的值。最好，在此情况下，在各个误差发生帧EF₁～EF_n使用不同的加权值。下面列出其例子：

EF₁←α₁＝0.9、α₂…＝α_m＝1

EF₂←α₁＝0.8、α₂…＝α_m＝1

EF₃←α₁＝0.6、α₂…＝α_m＝1

… … … …

EF_(n－1)←α₁＝0.1、α₂……＝α_m＝1

EF_n←α₁＝α₂＝…＝α_m＝0

在用相应的式提供加权值的情况下，把加权值α₁(＝0.9)同以前帧F₁的第m区段S_m的系数值相乘而求出图6B所示的第一误差帧EF₁的第一区段S₁的频率系数。同样，把加权值α₂同第一系数值相乘而求出第一误差帧EF₁的第二区段S₂的频率系数值。由此，直到第(n－1)误差帧EF₁～EF_(n－1)，使用以前帧的复原频率成分系数来形成再生信号。但是，由于第n误差帧EF_n的加权值全部为0，则该区间为声音消去状态。即，如果用相应式适当地调节加权值，就可以从任意帧实现声音消去。

虽然上述的本发明方法为了易于描述而使用误差发生之前帧的最后区段来使误差复原，但也可以使用位于以前帧或以后帧的最后区段附近的其他区段的系数。

图8A～图8B是用于说明从图6A～图6B所述的误差隐匿方法变形的新的误差隐匿方法。

与图8A～图8B相对应的误差隐匿方法，通过使用误差发生帧的以前帧的频率系数和误差发生帧的以后帧的频率系数的插入，来算出误差发生帧的频率系数。下面描述计算误差发生帧F₂的频率系数的方法。

在图8A的情况下，把加权值β₁乘以第一帧F₁的第m区段S_m的系数值所得到的值同加权值1-β₁乘以第三帧F₃的第1区段S₁的系数值所得到的值相加而求出帧F₂的第一区段S₁的频率系数。下面表示出对应于属于帧F₂的全部区域的一般状态。

系数(S_i、F₂)←β₁×系数(S_m、F₁)＋(1－β_i)×系数(S₁、F₃)

图8B表示出在相邻的多帧中发生误差的情况下适用于图8A的方法的例子。由于图8B所示方法是本领域普通技术人员能够通过上述内容和图8B理解，则省略具体说明。

通过计算而求出图6A～图6B和图8A～图8B涉及的加权值{α_i}和{β_i}，可以在预先存储到查找表中之后来使用。

如上述那样，本发明的误差隐匿方法及装置使用与其相邻的帧或多帧的频率系数来使误差发生帧的频率系数复原，由此误差发生帧可以使波及其后帧的影响最小。

Claims

1.数字音响信号的误差隐匿装置，用于以能纠错的帧为单位隐匿被频分编码/变换编码的数字音响信号的误差发生的一帧或多帧，其特征在于，包括：

输入代表编码数字音响信号的频率系数，检测在每帧中误差是否发生的误差检测装置；

输入上述频率系数，在构成全部音响信号的频率区域的各子频带中对频率系数进行译码的译码装置；

存储由上述译码装置译码的频率系数的缓冲器；

频率系数复原装置，该装置根据由上述误差检测装置所得到的误差检测结果用已设定的加权值和存储在上述缓冲器中并属于同误差发生的一帧或多帧相邻的帧的频率系数中的，同误差发生帧相邻的各子频带的频率系数来复原发生误差的一帧或多帧的频率系数，用所复原的频率系数来更新由上述译码装置译码并存储在上述缓冲器中的误差发生帧的频率系数；

施加存储在上述缓冲器中的频率系数，以与进行译码的顺序相同的顺序变换成时间区域的音响信号的滤波器组。

2.根据权利要求1所述的数字音响信号的误差隐匿装置，其特征在于，上述频率系数复原装置为了使误差发生帧的各子频带的频率系数复原而使用存在误差发生帧之前的帧中并同误差发生帧相邻的各子频带的频率系数。

3.根据权利要求2所述的数字音响信号的误差隐匿装置，其特征在于，在复原中所使用的属于相邻帧的上述频率系数属于位于误差发生帧之前的帧的最后区段。

4.根据权利要求2所述的数字音响信号的误差隐匿装置，其特征在于，上述频率系数复原装置把预先设定的加权值同属于各子频带中的上述之前帧并与误差发生帧相邻的频率系数相乘，来计算出对应于误差发生帧的各子频带的全部频率系数。

5.根据权利要求4所述的数字音响信号的误差隐匿装置，其特征在于，上述已设定的加权值具有″1″以下的值。

6.根据权利要求1所述的数字音响信号的误差隐匿装置，其特征在于，上述频率系数复原装置为了使误差发生帧的各子频带的频率系数复原，而使用存在误差发生帧之前的帧和之后的帧中并同误差发生帧相邻的频率系数。

7.根据权利要求6所述的数字音响信号的误差隐匿装置，其特征在于，在复原中所使用的属于相邻帧的上述频率系数属于位于误差发生帧之前的帧的最后区段和位于误差发生帧之后的帧的第一区段。

8.根据权利要求6所述的数字音响信号的误差隐匿装置，其特征在于，上述频率系数复原装置，把已设定的第一加权值同属于各子频带中的上述之前帧并与误差发生帧相邻的频率系数相乘，把已设定的第二加权值同属于上述之后帧并与误差发生帧相邻的频率系数相乘，把两个相乘的结果相加来计算出对应于误差发生帧的各子频带的全部频率系数。

9.根据权利要求8所述的数字音响信号的误差隐匿装置，其特征在于，上述第一和第二加权值具有″1″以下的值。

10.数字音响信号的误差隐匿方法，用于以能纠错的帧为单位隐匿被频分编码/变换编码的数字音响信号的误差发生的1。帧或多帧，其特征在于，包括：

输入代表编码数字音响信号的频率系数的步骤(a)；

对所输入的频率系数检测每帧中误差是否发生的步骤(b)；

对于所输入的频率系数，在构成全部音响信号频域的各子频带中把频率系数进行译码的步骤(c)；

把由上述步骤(c)所译码的频率系数进行存储的步骤(d)；

根据由上述步骤(b)所得到的误差检测结果用已设定的加权值和属于与误差发生帧相邻帧的频率系数中与误差发生帧相邻的各子频带的频率系数来复原误差发生的1帧或多帧频率系数的步骤(e)；

用由上述步骤(e)所复原的频率系数来代替由上述译码步骤(c)所译码并由上述步骤(d)所存储的误差发生帧的频率系数的步骤(f)；

把由上述步骤(f)的结果所得到的频率系数以与上述步骤(c)中进行译码的顺序相同的顺序变换成时域音响信号的步骤(g)。

11.根据权利要求10所述的数字音响信号的误差隐匿方法，其特征在于，上述步骤(e)为了使误差发生帧的各子频带的频率系数复原而使用存在误差发生帧之前的帧中并同误差发生帧相邻的各子频带的频率系数。

12.根据权利要求11所述的数字音响信号的信号隐匿方法，其特征在于，在复原中使用的属于相邻帧的上述频率系数属于位于误差发生帧之前的帧的最后区段。

13.根据权利要求11所述的数字音响信号的误差隐匿方法，其特征在于，上述步骤(e)把已设定的加权值同各子频带中属于上述之前帧并与误差发生帧相邻的频率系数相乘，来计算出对应于误差发生帧的各子频带的全部频率系数。

14.根据权利要求13所述的数字音响信号的误差隐匿方法，其特征在于，上述预先设定的加权值具有″1″以下的值。

15.根据权利要求10所述的数字音响信号的误差隐匿方法，其特征在于，上述步骤(e)为了使误差发生帧的各子频带的频率系数复原而使用存在误差发生帧之前帧和之后帧中并同误差发生帧相邻的各子频带的频率系数。

16.根据权利要求15所述的数字音响信号的误差隐匿方法，其特征在于，在复原中使用的属于相邻帧的上述频率系数属于位于误差发生帧之前的帧的最后区段和位于误差发生帧之后的帧的第一区段。

17.根据权利要求15所述的数字音响信号的误差隐匿方法，其特征在于，上述步骤(e)把预先设定的第1加权值同各子频带属于上述之前帧并与频率发生帧相邻的频率系数相乘，把预先设定的第2加权值同属于上述之后帧并与误差发生帧相邻的频率系数相乘，把两个相乘结果相加而计算出对应于误差发生帧的各子频带的全部频率系数。

18.根据权利要求17所述的数字音响信号的误差隐匿方法，其特征在于，上述第1和第2加权值具有″1″以下的值。

19.根据权利要求10所述的数字音响信号的误差隐匿方法，其特征在于，上述步骤(e)中，如果误差发生帧的连续个数为预定个数以上，则为了声音消去而用″0″值来代替上述预先设定的加权值。