CN1573929A - 音频解码器以及音频解码方法 - Google Patents
音频解码器以及音频解码方法 Download PDFInfo
- Publication number
- CN1573929A CN1573929A CNA2004100485085A CN200410048508A CN1573929A CN 1573929 A CN1573929 A CN 1573929A CN A2004100485085 A CNA2004100485085 A CN A2004100485085A CN 200410048508 A CN200410048508 A CN 200410048508A CN 1573929 A CN1573929 A CN 1573929A
- Authority
- CN
- China
- Prior art keywords
- error
- audio
- audio frame
- mistake
- output
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 182
- 230000008569 process Effects 0.000 claims description 77
- 230000005540 biological transmission Effects 0.000 claims description 15
- 238000011084 recovery Methods 0.000 claims 3
- 238000012545 processing Methods 0.000 abstract description 7
- 238000001514 detection method Methods 0.000 abstract 2
- 238000010586 diagram Methods 0.000 description 12
- 238000005070 sampling Methods 0.000 description 11
- 230000007774 longterm Effects 0.000 description 9
- 238000013459 approach Methods 0.000 description 6
- 230000006866 deterioration Effects 0.000 description 4
- 239000000284 extract Substances 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000007812 deficiency Effects 0.000 description 2
- 230000001771 impaired effect Effects 0.000 description 2
- 235000014676 Phragmites communis Nutrition 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 230000002045 lasting effect Effects 0.000 description 1
- 238000002620 method output Methods 0.000 description 1
- 238000011112 process operation Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Detection And Prevention Of Errors In Transmission (AREA)
Abstract
一种用于解码已编码音频数据的音频解码器,包括:错误检测装置,用于检测已编码音频数据的错误;错误隐藏方法确定装置,用于根据由所述错误检测装置所检测到的错误信息,确定音频帧和用于隐藏错误的窗函数的权重;频率时间转换器,用于将频率分量的音频数据转换为时间分量音频帧;音频帧缓冲器,用于存储由所述频率时间转换器所输出的时间分量音频帧;以及加窗处理装置,用于根据由所述错误隐藏方法确定装置所确定的窗函数的权重,对由所述频率时间转换器输出的时间分量音频帧和/或在所述音频帧缓冲器中存储的音频帧进行加权。
Description
技术领域
本发明涉及音频解码器以及音频解码方法,用于通过解码已编码音频数据来获得音频数据。具体地,涉及一种音频解码器和一种音频解码方法,当在解码处理中解码已编码音频数据时,能够在发生错误时实现声音质量的提高。
背景技术
在近年来越来越大众化的压缩音频数据中(MP3、AAC、杜比数字、ATRAC等),使用了例如熵编码、窗函数以及正交变换等方法的结合来压缩数据,从而实现了比线性PCM更高的编码效率。可以通过在解码器中进行解码来回放这种所压缩的音频数据,但是在记录介质或传输路径中存在发生错误的情况。特别地,在无线电传输及类似中错误出现的频率较高。因此,有必要采取措施,以便能够忽略这些错误,通常,诸如CRC码之类的错误检测码包含在要发送的音频数据中,从而可以检测传输错误。
传统上,当通过上述错误检测码检测到错误时,作为对付错误的措施,减弱或跳过所检测到的音频帧,直到到达能够正确解码的音频帧。此外,还可以使用其中将零插入输入窗函数信号来平滑衰减声音的方法,从而减小了噪声(例如,见日本待审专利公开2002-073091)。
作为用于进行忽略错误的另一种方法,通常使用其中在存储器中存储之前正确地解码音频数据的方法,并且重复输出,直到接收到能够正确解码的数据。
但是,如下所述,在上述用于克服错误的传统措施中存在缺点。
缺点的第一方面如下。当将相邻的解码音频数据用于填充以隐藏音频数据的错误时,在音频帧之间的声音变得不连续,这引起了噪声。
缺点的第二方面如下。通过只使用已编码音频数据内的错误信息来执行错误隐藏处理,因此只存在用于确定错误隐藏方法的较少选择因素。因此,很难采取充分的措施用于克服错误。
缺点的第三方面如下。通过只使用与当前被解码的音频数据相邻的音频数据的错误信息来执行错误隐藏处理,因此不可能采取通过预测未来的条件来克服错误的措施。
发明内容
本发明的第一目的是通过使用了错误隐藏处理的较少操作量来减少令人不快的噪声。
本发明的第二目的是通过增加用于采取用于克服错误的措施的标识(index),在错误发生时实现较好的声音质量。
本发明的第三目的是通过在错误发生时预测未来错误发生的状态来执行更适当的错误隐藏,以实现具有较好声音质量的音频再现。
为了实现前述目的,本发明的音频解码器包括:错误检测设备,用于检测已编码音频数据的错误;错误隐藏方法确定设备,用于根据由所述错误检测设备所检测到的错误信息,确定音频帧和用于隐藏错误的窗函数的权重;频率帧转换器,用于将频率分量的音频数据转换为时间分量音频帧;音频帧缓冲器,用于累积由所述频率时间转换器所输出的时间分量音频帧;以及加窗处理设备,用于根据由所述错误隐藏方法确定设备所确定的窗函数的权重,对由频率时间转换器输出的时间分量音频帧和/或在音频帧缓冲器中所累积的音频帧进行加权。
在此结构中,错误检测设备检测音频数据中的错误,并将信息发送到错误隐藏方法确定设备。通过频率时间转换器,将频域的音频数据转换为时间分量音频帧,并存储在音频帧缓冲器中。根据由错误隐藏方法确定设备所确定的权重,对时间分量音频帧和音频帧缓冲器中的旧音频帧执行加窗处理(windowing process)。因此,能够获得具有较少噪声的再现声音(音频帧)。
此外,为了增加检测错误的机会,本发明的音频解码器具有以下结构:错误检测设备包括于声道解码器中,所述声道解码器具有对其执行了传输线路编码的数据进行解码的功能;以及错误检测设备包括于解复用器中,所述解复用器具有解复用由多路复用音频数据所获得的数据流的功能。
利用这种结构,可以检测并隐藏在传输路径上出现的已编码音频信号的错误,并检测并隐藏在多路复用的数据流中出现的错误。
此外,为了提高使用以往的出错率来隐藏错误的效果,本发明的音频解码器包括错误历史存储器,用于记录由错误检测设备所检测到的错误信息的历史。错误隐藏方法确定设备具有根据由错误检测设备所检测到的错误信息以及存储在错误历史存储器中的错误信息的历史来确定窗函数权重的功能。
在此结构中,将包括旧信息的错误信息存储在错误历史存储器中,并且错误隐藏方法确定设备也考虑到旧错误信息来预测未来错误发生的状态。通过根据所预测的值执行错误隐藏处理,能够获得具有优异声音质量的输出。
附图说明
图1是示出了本发明第一实施例的框图;
图2是示出了错误隐藏方法确定设备102的内容的第一示例的图;
图3是示出了错误隐藏方法确定设备102的内容的第二示例的图;
图4是示出了错误隐藏方法确定设备102的内容的第三示例的图;
图5是示出了当解码已编码音频数据时,错误隐藏方法确定单元102的处理示例的流程图;
图6是当解码已编码音频数据时,错误隐藏方法确定单元102的处理示例的流程图;
图7是示出了本发明第二实施例的框图;
图8是示出了本发明第二实施例的另一个框图;
图9是示出了本发明第三实施例的框图;
图10是示出了错误隐藏方法确定单元402的内容的第一示例;
图11是示出了错误隐藏方法确定单元402的内容的第三示例;以及
图12是用于说明加权的图。
具体实施方式
接下来,将参考附图,对本发明的实施例进行说明。
第一实施例
图1是示出了本发明第一实施例的框图。该实施例用于当在已编码音频数据中检测到错误时,避免由于不连续声音的产生而引起的噪声。本实施例包括错误检测单元101、错误隐藏方法确定单元102、频率时间转换器103、加窗处理单元104以及音频帧缓冲器105。
错误检测单元101具有将已编码音频数据的错误信息发送到错误隐藏方法确定单元102的功能。对于通过错误检测单元101来检测错误的方法,可以使用任意方法。示例是通过错误码的错误检查,例如CRC、对音频数据执行的伽马校正、音频数据的输入缓冲器的下溢检查等。
错误隐藏方法确定单元102具有根据由错误检测单元101所输出的音频数据的错误信息来确定音频帧以及权重的功能,该权重用于在加窗处理单元104中所执行的加窗操作。对于用于确定音频帧和用于加窗操作的权重的特定方法,例如,可以使用以下三种方法。
在第一种方法中,如图2所示,当在正确地解码音频帧之后,在帧中连续地检测到错误时,随着时间的变化,通过重复已经正确解码的上一个音频帧来减小加窗处理的权重。当错误检测单元101在解码音频数据时检测到连续的错误时,针对受损部分复制能够被正确解码的上一个音频数据帧并且逐渐衰减帧之间的加窗处理的权重。因此,所输出的音频帧中不存在不连续,所以能够忽略由于错误引起的噪声。
在第二种方法中,如图3所示,当正确地解码了紧随检测到错误的音频数据之后的音频帧时,逐渐地增大加窗处理的权重,以使其回到正常权重。当错误检测单元101检测到在解码视频帧时恢复了错误出现并且能够实现正常解码时,从已经从要返回的错误恢复的第一音频帧开始到最终的正常权重,逐渐增大加窗处理的权重。因此,所输出的音频帧中不存在不连续,所以能够忽略由于错误引起的噪声。
在第三种方法中,如图4所示,当只在能够正确解码的音频数据的一部分存在错误时,通过添加权重,从紧邻在检测到错误的数据之前的正确解码的数据到检测到错误的音频数据之后的正确解码数据来执行平滑的过渡。当错误检测单元101检测到部分音频数据中存在错误时,复制受损音频帧外围的正确解码的音频数据,并执行加窗处理,而不改变加窗处理的权重。因此,所输出的音频帧中不存在不连续,所以能够忽略由于错误引起的噪声。
频率时间转换器103具有将频域的音频数据(频率分量)转换到时域(时间分量)音频帧的功能。对于使用频率时间转换器1-3的转换方法,可以使用在多种音频解码方法中使用的正交转换等,例如IMDCT(逆改进的离散余弦逆变换)。
音频帧缓冲器105具有存储已被转换到时间分量的音频帧的功能。例如,通过存储器、硬盘驱动器等能够实现具有这种功能的音频帧缓冲器105。
加窗处理单元104具有以下功能:从频率时间转换器103和/或音频帧缓冲器105中提取由错误隐藏方法确定单元102所选择的音频帧;根据由错误隐藏方法确定单元102所确定的加窗权重来添加权重;以及输出声音(音频帧)。例如,具有这种功能的加窗处理单元104执行如图2、3和4所示的处理。换句话说,加窗处理单元104提取由错误隐藏方法确定单元102所指定的当前帧以及从音频帧缓冲器105和/或频率时间转换器103到其执行加窗处理的帧。然后,通过根据指定的加窗权重而添加权重来输出音频帧。
现在,参考图12对权重进行说明。作为执行IMDCT的结果,例如,能够获得分别由2048个采样组成的音频帧1,2,3…。音频帧1和音频帧2彼此重叠1024个采样。按照相同的方式,音频帧2和音频帧3彼此重叠1024个采样。在加权中,将音频帧1的后一半1024个采样的加权结果与音频帧2的前一半1024个采样的加权结果逐个采样地相加,从而获得了由1024个采样构成的音频帧A。按照相同的方式,将音频帧2的后一半1024个采样的加权结果与音频帧3的前一半1024个采样的加权结果逐个采样地相加,从而获得了由1024个采样构成的音频帧B。在图2、3和4中,为了方便的缘故,没有彼此重叠地示出音频帧1,2,3…。但是在实际中,如图12所示,它们彼此重叠。
图5、6是示出了当解码音频数据时错误隐藏方法确定单元102的处理示例的流程图。在下文中,参考每一个附图,对实施例的操作进行说明。
首先,对提取已经输入的已编码音频数据的操作进行说明。错误检测单元101检查已经输入的解码音频数据的语法、错误码以及缓冲器的不足,以便查明是否存在任何错误并将结果发送到错误隐藏方法确定单元102。同时,将已编码音频数据输入到频率时间转换器103,以转换为时间分量音频帧,并且将其输出到加窗处理单元104。此外,在音频帧缓冲器105中存储音频帧。
接下来,将对当已编码音频数据中不存在错误时的错误隐藏方法的确定操作进行说明。当根据从错误检测单元101接收到的错误信息判断出当前帧的附近没有错误出现(步骤S1,否)时,错误隐藏方法确定单元102选择之前紧邻的帧作为用于执行加窗处理的对象,并向加窗处理单元104发送命令以执行常规的加窗处理(步骤S2)。当在当前音频帧上添加加窗权重以及在其它音频帧上加权时,这里用于加窗处理的对象指其它音频帧。
接下来,将对当在已编码音频帧中出现长期的连续错误时的错误隐藏方法的确定操作进行说明。当根据从错误检测单元101接收到的错误信息判断出当前帧的附近存在错误(步骤S1,是)以及在当前帧之后存在长期连续错误(步骤S3,是)时,错误隐藏方法确定单元102判断在当前要输出的帧中是否存在错误(步骤S8)。
例如,如图2所示,在当前要被输出的帧是音频帧3的情况下,当判定当前要被输出的帧中不存在错误时(步骤8,否),错误隐藏方法确定单元102向加窗处理单元104发送命令以选择之前紧邻的帧作为执行加窗处理的对象并执行常规的加窗处理(步骤S9)。
例如,如图2所示,在当前要被输出的帧是音频帧4到6的情况下,当判定当前要被输出的帧中存在错误时(步骤8,是),错误隐藏方法确定单元102使用最相邻、已经被正确解码的帧作为当前帧(步骤S10),并向加窗处理单元104发送命令以选择之前紧邻的帧作为执行加窗处理的对象,并通过逐渐地衰减权重来执行加窗处理(步骤S11)。当下一个处理从步骤S1开始时,将在步骤S10中用作当前帧的帧作为步骤S11中的之前紧邻的帧进行处理。此外,通过使用当错误连续时增加1以及当不存在错误时复位为零的计数器,当长期连续错误持续时,可以在步骤S11中每次逐渐地衰减加窗权重。
接下来,将对当从长期连续错误中恢复已编码音频数据时的错误隐藏方法确定单元102的操作进行说明。当错误隐藏方法确定单元102根据从错误检测单元101接收到的错误信息判断出当前帧的附近存在错误出现(步骤S1,是)、判断出在当前帧之后的帧中不存在长期连续错误(步骤S3,否)以及从长期连续错误中已经恢复了(步骤S4,是)时,错误隐藏方法确定单元102判断在当前要输出的帧中是否存在错误(步骤S5)。
例如,如图3所示,在当前要被输出的帧是音频帧3到6的情况下,当判定当前要被输出的帧中不存在错误时(步骤5,否),错误隐藏方法确定单元102向加窗处理单元104发送命令以选择之前紧邻的帧作为执行加窗处理的对象,并使用逐渐增加以返回到正常权重的加窗权重来执行加窗处理(步骤S6)。
例如,如图3所示,在当前要被输出的帧是音频帧2的情况下,当判定当前要被输出的帧中存在错误时(步骤5,是),错误隐藏方法确定单元102向加窗处理单元104发送命令以输出没有声音的作为静音数据的当前帧,而不执行加窗处理。此外,通过使用当无错误连续的无错状态时增加1以及当存在错误时复位为零的计数器,当从长期连续错误中恢复时,每次执行步骤S6可以逐渐增加加窗权重。
接下来,将对错误隐藏方法确定单元102的没有归入上述描述情况下的确定操作进行说明,即在短期错误存在于已编码音频数据中及在出现错误后即被恢复的情况。当错误隐藏方法确定单元102根据从错误检测单元101接收的错误信息判断当前帧的附近存在错误时(步骤1,是),判断当前帧之后的帧中无长期连续错误(步骤3,否),并且没有从长期连续错误中被恢复(步骤4,否),则错误隐藏方法确定单元102判断当前帧中是否存在错误(步骤12)。
例如,如图4所示,当当前要输出的帧是音频帧2或5的情况下,当要输出的当前帧中无错误时(步骤12,否),错误隐藏方法确定单元102将命令发送到加窗处理单元104,以选择当前帧之前的紧邻帧作为加窗处理对象,并执行常规加窗处理(步骤13)。在图4中的音频帧5情况下,似乎没有当前帧之前的紧邻帧,正如后面所述,当处理音频帧4时音频帧5被看作当前帧,当按照如上所述的情况处理音频帧5时,在处理音频帧4时被看作当前帧的帧就被看作当前帧之前的紧邻帧。这样,如图4所示,当目前将被输出的帧是音频帧5时,音频帧5被看作当前帧和当前帧之前的紧邻帧。
例如,当在目前要输出的帧为图4中所示的音频帧3和4情况下,当判断目前要输出的帧中存在错误(步骤12,是)时,错误隐藏确定单元102判断是否目前要输出的帧与正确解码的最近的帧的距离(过去的距离)小于目前要输出的帧与将被正确解码的最近的帧的距离(将来的距离)(步骤14)。
例如,如图4所示,当在目前要输出的帧为音频帧3的情况下,当过去的距离小于将来的距离时(步骤14,是),数据隐藏方法确定单元102用已正确解码的最近的帧作为当前帧(步骤15),并发送命令给加窗处理单元104来选择所述帧之前的紧邻帧为加窗处理的对象并执行常规的加窗处理(步骤16)。
例如,如图4中所示,当在目前要输出的帧为音频帧4时,当将来的距离小于过去的距离或距离相等(步骤14,否)时,数据隐藏方法确定单元102将正确解码的最近的帧作为当前帧(步骤17),并将命令发送到加窗处理单元104以选择所述帧之前的紧邻帧为加窗处理对象和执行常规的加窗处理(步骤18)。所述帧之前的紧邻帧就是在以前处理中当作当前帧的帧。这样,当目前要输出的帧是图4中的音频帧4时,所述帧之前的紧邻帧是音频帧2。
当过去的距离和将来的距离相等时,进行到步骤15而不是步骤17。
如上所述,按照实施例,可以处理不连续的输出音频数据,并且即使在已编码音频数据存在错误情况下也可以输出带有较少不愉快噪音的声音。
第二实施例
接下来,将对本发明的第二实施例进行说明。该实施例中,在错误出现时,通过不仅减少有错误的音频数据的噪音而且增加标识来采取措施克服错误的手段来执行更精确的错误隐藏处理可以得到较好音质的声音。
图7是示出了本发明第二实施例的框图。第二实施例与图1所示的第一实施例不同在于,在第二实施例中,增加了信道解码器201并设置了错误检测单元201a,而不是错误检测单元101。与图1中的相同的数字码表示相同的单元。
当已编码音频数据在传输路径传输时,信道解码器201具有解码信道已编码数据的功能。具体地,该功能可通过使用里德一所罗门码的解码器来实现,例如,用于数字电视广播的传输。
错误检测单元201a具有下列功能:当解码信道解码传输数据时,在数据被损坏到不能被校正的程度时,检测该错误,并将错误信息发送到错误隐藏方法确定单元102。
接下来,将对实施例的操作进行说明。信道解码器201接收信道已解码传输数据,解码信道编码,并提取已编码音频数据。这时,错误检测单元201a检查解码信道码是否失败,并将错误信息发送到错误隐藏方法确定单元102。错误隐藏方法确定单元102,频率时间转换器103,加窗处理单元104和音频帧缓冲器105按照与在本发明第一实施例中所述的相同方式进行操作。
图8是示出了本发明第二实施例的另一个框图。与图1所示框图的不同之处在于,增加了信道解码器301并设置了错误检测单元301a,而不是错误检测单元101。与图1中的相同的数字码表示相同的单元。
当利用其它音频数据和/或视频数据来多路复用已编码音频数据以传输时,解复用器301具有解复用目标音频数据的功能。具体地,通过MPEG2之类系统中的传送流解复用器可以实现解复用器301。
错误检测单元301a具有以下功能:当解复用其中多路复用不同数据的多路复用数据时,检查传输错误标识符和目标音频数据所属的数据序列数;当传输错误标识符显示错误存在或序列数不连续时检测错误;以及将错误信息到发送错误隐藏方法确定单元102。
接下来,将对实施例的操作进行说明。解复用器301接收由不同数据被多路复用的多路复用数据,解复用多路复用数据并取出目标已编码音频数据。这时,错误检测单元301a通过检查传输错误标识符和在多路复用信息中的序列数目来检验目标音频数据中错误的出现,并将数据中错误的出现发送到错误隐藏方法确定单元102。错误隐藏方法确定单元102、频率时间转换器103、加窗处理单元104以及音频帧缓冲器105按照与本发明第一实施例中所述的相同方式进行操作。
如上所述,根据该实施例,即使在已编码音频数据中没有错误校正码,或在其中不能检测语法错误的结构的情况下,通过检测出现在传输路径上的错误以及多路复用数据中的错误能够输出错误被隐藏的数据。
第三实施例
图9是示出了本发明第三实施例的框图。第三实施例与图1所示的第一实施例的不同之处在于,增加了错误历史存储器406,并设置了错误检测单元401而不是错误检测单元101,以及设置了错误隐藏方法确定单元402而不是错误隐藏方法确定单元102。与图1中的相同的数字码表示相同的单元。
错误检测单元401具有将已编码音频数据的错误信息发送到错误隐藏方法确定单元402和错误历史存储器406的功能。关于通过错误检测单元401检测错误的方法,可以使用任何方法。如通过错误码如CRC的错误检测,在音频数据中执行的语法检查,音频数据的输入缓冲器的下溢检查等等。
错误隐藏方法确定单元402可以根据由错误检测单元401输出的音频数据的错误信息和过去某特定时间段存储在错误历史存储器406中的错误信息来确定音频帧和用于由加窗处理单元104执行的加窗处理中的权重。具体地,作为确定音频帧和用于执行加窗操作的权重的方法,例如,可以采用下面三种方法。
在第一种方法中,当在如图10所示的正确解码帧之后的帧中连续检测错误时,根据过去某特定时间段的错误信息来预测将来的数据出错率。当预测的出错率为高时,通过与图2中相同的方法立即衰减输出音频帧,而当预测出错率为低时,根据从错误中立即恢复数据的假设,缓慢地进行衰减。当按照这种方式恢复数据时,对恢复的数据执行加窗处理以便将声音的恶化抑制到最小。当数据没有恢复时,衰减权重,直到数据输出而没有声音。
在第二种方法中,当错误在正确解码的帧之后的帧中如在第一个方法情况下那样连续被检测时,基于过去的错误信息计算数据错误持续的长度预测值。当连续错误长度的预测值较大时,输出音频帧立即衰减,当连续错误长度的预测值较小时,假设从错误中立即恢复数据来缓慢地衰减。当按照这种方式恢复数据时,利用所恢复的数据执行加窗处理,以便将声音的恶化抑制到最小。当数据没有恢复时,权重衰减,直到数据输出没有声音。
在第三种方法中,当从连续错误中恢复音频数据时,基于过去的错误信息来预测将来数据出错率。如图11所示,当预测的出错率为高时,首先输出静音数据,如图3所示,当预测出错率减少到一定范围内(图11中20%)时,通过逐渐增加加窗处理权重使权重返回到常规值。因此,通过避免由于错误出现的数目而引起的断续声音来减少令人不快的声音输出。
错误历史存储器406具有存储过去某特定时间段从错误检测单元401输入的错误信息并在接收到来自错误隐藏确定单元402的请求时输出错误信息历史的功能。例如,通过使用存储器和硬盘驱动器等可以实现具有这些功能的错误历史存储器406。
接下来,将对实施例的操作进行说明。首先,将对提取已输入的已编码音频数据时的操作进行说明。错误检测单元401检查有关已输入的已编码音频数据的语法、错误码、缓冲器的不足等并将错误信息发送到错误历史存储器406。同时,将已编码数据输入到频率时间转换器103,以将其转换为时间分量音频帧并将其输出到加窗处理单元104。此外,在音频帧缓冲器105中存储音频帧。
现在,将对在已编码音频数据中出现连续错误时错误隐藏方法确定单元402的确定操作进行说明。根据从错误检测单元401接收的错误信息和在错误历史存储器406中存储的过去错误信息,错误隐藏方法确定单元402计算将来出错率的预测值。例如,关于计算的特定方法可以使用以下表达式。(预测出错率)=(在过去的1秒钟内错误的音频帧数)/(在过去的1秒钟内处理的音频帧数)
当预测出错率较高时,判定没有从错误中立即恢复数据,并且按照与在图2中所示相同的方式发送命令到加窗处理单元104,减少加窗权重以立即衰减输出声音。另一方面,当预测出错率较低时,判定立即从错误中恢复数据并且缓慢减少加窗权重。当数据被恢复时,使用如图10所示的方法,对紧邻其后的正常音频帧执行加窗处理,以便将声音的恶化抑制到最小。当没有从错误中恢复数据时,缓慢减少加窗权重并且持续处理,直到变为无声。
当连续错误出现在已编码音频数据中时,将对另一种错误隐藏方法的确定操作进行说明。根据从错误检测单元401接收的错误信息和在错误历史存储器406中存储的过去错误信息,错误隐藏方法确定单元402计算连续错误长度的预测值。例如,关于计算的特定方法可以使用以下表达式。
(连续错误长度的预测值)=(过去10次的错误长度平均值)
当连续错误长度的预测值较高时,判定没有从错误中立即恢复数据,并且按照与如图2所示相同的方式将命令发送到加窗处理单元104,减少加窗处理以立即衰减输出声音。另一方面,当连续错误长度的预测值较低时,判定从错误中立即恢复数据并且减少加窗权重的速度放缓。当数据被恢复时,按照如图10所示的方式对紧邻之后的正常音频帧执行加窗处理,以便将声音的恶化抑制到最小。当数据没有从错误中恢复时,缓慢减少加窗权重及持续处理直到变为无声。
当从连续错误中恢复已编码数据时,将对错误隐藏方法的确定操作进行说明。根据从错误检测单元401接收的错误信息和在错误历史存储器406中存储的过去错误信息,错误隐藏方法确定单元402计算将来出错率的预测值。例如关于计算的特定方法可使用上述的表达式。当预测出错率为高时,判定数据再次处于错误状态及发送命令到加窗处理单元104来维持加窗权重为零以继续输出无声。另一方面,当预测出错率为低时,判断为从错误恢复数据及以与如图3所示的相同的方法发送命令到加窗处理单元104来缓慢返回到常规加窗权重。
现在,将对加窗处理操作进行说明。加窗处理单元104从频率时间转换器103取出当前帧以及由错误隐藏方法确定单元402指示的用于加窗处理的对象帧,并按照指示的加窗权重增加权重,并输出音频帧。
如上所述,根据实施例,即使错误出现在已编码音频数据的情况下,也可以通过预测将来错误状态而隐藏错误。这样,能够进一步减少令人不悦的声音输出。
如上所述,即使在错误出现在音频数据的情况下,本发明的音频解码器通过使用其它帧代替有错误帧来调整加窗处理的权重,也能够避免断续。这样,用少量的操作可有效地减少令人不悦的噪音输出。
此外,本发明的音频解码器能根据信道编码和多路复用来使用错误信息,因此可实现带有极少错误的错误隐藏处理。
此外,本发明的音频解码器能够根据错误出现时的过去错误信息来预测将来错误出现状态来执行更准确的错误隐藏处理。
Claims (20)
1.一种用于解码已编码音频数据的音频解码器,包括:
错误检测装置,用于检测已编码音频数据的错误;
错误隐藏方法确定装置,用于根据由所述错误检测装置检测到的错误信息,确定音频帧和用于隐藏错误的窗函数的权重;
频率时间转换器,用于将频率分量的音频数据转换为时间分量音频帧;
音频帧缓冲器,用于存储由所述频率时间转换器所输出的时间分量音频帧;以及
加窗处理装置,用于根据由所述错误隐藏方法确定装置所确定的窗函数的权重,对由所述频率时间转换器输出的时间分量音频帧和/或在所述音频帧缓冲器中存储的音频帧进行加权。
2.根据权利要求1所述的音频解码器,其特征在于当存在连续错误时,所述加窗处理装置连续输出连续错误出现之前的音频帧,同时衰减幅度。
3.根据权利要求1所述的音频解码器,其特征在于当从连续错误恢复时,所述加窗处理装置输出恢复的音频帧,同时增加幅度。
4.根据权利要求1所述的音频解码器,其特征在于当出现短期错误时,所述加窗处理装置在短期错误前一半内输出一个在短期错误出现之前的音频帧,以及在短期错误后一半内输出一个在短期错误出现之后的音频帧。
5.根据权利要求1所述的音频解码器,其特征在于所述错误检测装置包括于信道解码器中,所述信道解码器具有对执行了传输线路编码数据进行解码的功能。
6.根据权利要求1所述的音频解码器,其特征在于所述错误检测装置包括于解复用器中,所述解复用器具有解复用由多路复用音频数据所获得的数据流的功能。
7.根据权利要求1所述的音频解码器,其特征在于所述错误检测装置还包括错误历史存储器,用于存储由错误检测装置所检测到的错误信息的历史,以及错误隐藏方法确定装置根据由错误检测装置所检测到的错误信息以及存储在错误历史存储器中的错误信息的历史来确定音频帧和用于隐藏错误的窗函数权重。
8.根据权利要求7所述的音频解码器,其特征在于所述错误隐藏方法确定装置根据存储在错误历史存储器中的过去的错误出现率以及由错误检测装置所检测到的错误信息来确定处理方法。
9.根据权利要求7所述的音频解码器,其特征在于所述错误隐藏方法确定装置根据存储在错误历史存储器中的在过去出现的连续错误数据数目以及由错误检测装置所检测到的错误信息来确定处理方法。
10.根据权利要求7所述的音频解码器,其特征在于当错误出现时,在出错率为第一出错率的情况下,所述加窗处理装置连续输出错误出现之前的音频帧,同时使用第一衰减率衰减幅度,以及在出错率为低于第一出错率的第二出错率的情况下,连续输出错误出现之前的音频帧,同时使用低于第一衰减率的第二衰减率衰减幅度。
11.根据权利要求7所述的音频解码器,其特征在于,当从连续错误恢复时,当预测出错率高于阈值时,所述加窗处理装置执行无声的输出,并且当预测出错率低于阈值时,输出音频帧,同时增加幅度。
12.一种音频解码方法,包括:
错误检测步骤,用于检测已编码音频数据的错误;
错误隐藏方法确定步骤,用于根据由所述错误检测步骤所检测到的错误信息,确定音频帧和用于隐藏错误的窗函数的权重;
频率时间转换步骤,用于将频率分量的音频数据转换为时间分量音频帧;
音频帧缓冲步骤,用于存储由所述频率时间转换步骤输出的时间分量音频帧;以及
加窗处理步骤,用于根据由所述错误隐藏确定装置确定的窗函数的权重,对由所述频率时间转换步骤输出的时间分量音频帧和/或在所述音频帧缓冲器中存储的音频帧进行加权。
13.根据权利要求12所述的音频解码方法,其特征在于,在加窗处理步骤中,当存在连续错误时,连续输出连续错误出现之前的音频帧,同时衰减幅度。
14.根据权利要求12所述的音频解码方法,其特征在于在加窗处理步骤中,当从错误恢复时,输出恢复的音频帧,同时增加幅度。
15.根据权利要求12所述的音频解码方法,其特征在于当出现短期错误时,在加窗处理步骤中,在短期错误前一半内输出一个在短期错误出现之前的音频帧及在短期错误后一半内输出一个在短期错误出现之后的音频帧。
16.根据权利要求12所述的音频解码方法,其特征在于所述错误检测步骤还包括错误历史存储步骤,用于存储由错误检测步骤所检测到的错误信息的历史,在错误隐藏方法确定步骤中,根据由错误检测步骤所检测到的错误信息以及在错误历史存储步骤中存储的错误信息的历史确定音频帧和用于隐藏错误的窗函数权重。
17.根据权利要求16所述的音频解码方法,其特征在于在所述错误隐藏方法确定步骤中,根据在错误历史存储步骤中存储的过去的错误出现率以及由错误检测步骤所检测到的错误信息来确定处理方法。
18.根据权利要求16所述的音频解码方法,其特征在于在所述错误隐藏方法确定步骤中,根据在错误历史存储步骤中存储的过去出现的连续错误数据的数目以及由错误检测步骤所检测到的错误信息来确定处理方法。
19.根据权利要求16所述的音频解码方法,其中当错误出现时,在所述加窗处理步骤,在出错率为第一出错率情况下,连续输出错误出现之前的音频帧的同时用第一衰减率衰减幅度,和在出错率为低于第一出错率的第二出错率情况下,连续输出错误出现之前的音频帧的同时用低于第一衰减率的第二衰减率衰减幅度。
20.根据权利要求16所述的音频解码方法,其特征在于,当从连续错误恢复时,在加窗处理步骤中,当预测出错率高于阈值时执行无声输出,以及当预测出错率低于阈值时输出音频帧,同时增加幅度。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003160903 | 2003-06-05 | ||
JP2003160903A JP2004361731A (ja) | 2003-06-05 | 2003-06-05 | オーディオ復号装置及びオーディオ復号方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1573929A true CN1573929A (zh) | 2005-02-02 |
CN1326114C CN1326114C (zh) | 2007-07-11 |
Family
ID=33157203
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2004100485085A Expired - Fee Related CN1326114C (zh) | 2003-06-05 | 2004-06-07 | 音频解码器以及音频解码方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US7225380B2 (zh) |
EP (1) | EP1484746B1 (zh) |
JP (1) | JP2004361731A (zh) |
CN (1) | CN1326114C (zh) |
DE (1) | DE602004003862T2 (zh) |
HK (1) | HK1073915A1 (zh) |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008154852A1 (en) * | 2007-06-15 | 2008-12-24 | Huawei Technologies Co., Ltd. | A method and device for lost frame concealment |
CN101221765B (zh) * | 2008-01-29 | 2011-02-02 | 北京理工大学 | 一种基于语音前向包络预测的差错隐藏方法 |
CN101046964B (zh) * | 2007-04-13 | 2011-09-14 | 清华大学 | 基于重叠变换压缩编码的错误隐藏帧重建方法 |
CN102568483A (zh) * | 2010-11-26 | 2012-07-11 | 索尼公司 | 解码装置、解码方法和程序 |
CN101802906B (zh) * | 2007-09-21 | 2013-01-02 | 法国电信公司 | 传送误差隐藏的方法和装置、以及数字信号解码器 |
CN102893329A (zh) * | 2010-03-11 | 2013-01-23 | 弗兰霍菲尔运输应用研究公司 | 信号处理器、窗口提供器、编码的媒体信号、用于处理信号的方法以及用于提供窗口的方法 |
CN102148985B (zh) * | 2010-02-05 | 2013-06-12 | 宏碁股份有限公司 | 视讯译码装置 |
CN103384154A (zh) * | 2012-05-03 | 2013-11-06 | 现代摩比斯株式会社 | 气爆噪声去除方法 |
CN110168639A (zh) * | 2016-12-09 | 2019-08-23 | 思睿逻辑国际半导体有限公司 | 数据编码检测 |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7831421B2 (en) * | 2005-05-31 | 2010-11-09 | Microsoft Corporation | Robust decoder |
JP4137130B2 (ja) * | 2006-02-03 | 2008-08-20 | キヤノン株式会社 | 伝送システム及び伝送チャネル割当方法 |
US8798172B2 (en) * | 2006-05-16 | 2014-08-05 | Samsung Electronics Co., Ltd. | Method and apparatus to conceal error in decoded audio signal |
KR101261528B1 (ko) | 2006-05-16 | 2013-05-07 | 삼성전자주식회사 | 복호화된 오디오 신호의 오류 은폐 방법 및 장치 |
KR100862662B1 (ko) | 2006-11-28 | 2008-10-10 | 삼성전자주식회사 | 프레임 오류 은닉 방법 및 장치, 이를 이용한 오디오 신호복호화 방법 및 장치 |
JP5254983B2 (ja) | 2007-02-14 | 2013-08-07 | エルジー エレクトロニクス インコーポレイティド | オブジェクトベースオーディオ信号の符号化及び復号化方法並びにその装置 |
JP5012897B2 (ja) * | 2007-07-09 | 2012-08-29 | 日本電気株式会社 | 音声パケット受信装置、音声パケット受信方法、およびプログラム |
CN100524462C (zh) | 2007-09-15 | 2009-08-05 | 华为技术有限公司 | 对高带信号进行帧错误隐藏的方法及装置 |
US8879643B2 (en) | 2008-04-15 | 2014-11-04 | Qualcomm Incorporated | Data substitution scheme for oversampled data |
CN101588341B (zh) * | 2008-05-22 | 2012-07-04 | 华为技术有限公司 | 一种丢帧隐藏的方法及装置 |
JP5635502B2 (ja) * | 2008-10-01 | 2014-12-03 | ジーブイビービー ホールディングス エス.エイ.アール.エル. | 復号装置、復号方法、符号化装置、符号化方法、及び編集装置 |
JP2011239036A (ja) * | 2010-05-06 | 2011-11-24 | Sharp Corp | 音声信号変換装置、方法、プログラム、及び記録媒体 |
TWI610296B (zh) | 2011-10-21 | 2018-01-01 | 三星電子股份有限公司 | 訊框錯誤修補裝置及音訊解碼裝置 |
KR102132326B1 (ko) * | 2013-07-30 | 2020-07-09 | 삼성전자 주식회사 | 통신 시스템에서 오류 은닉 방법 및 장치 |
SG10201609218XA (en) | 2013-10-31 | 2016-12-29 | Fraunhofer Ges Forschung | Audio Decoder And Method For Providing A Decoded Audio Information Using An Error Concealment Modifying A Time Domain Excitation Signal |
PL3285254T3 (pl) | 2013-10-31 | 2019-09-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Dekoder audio i sposób dostarczania zdekodowanej informacji audio z wykorzystaniem ukrywania błędów na bazie sygnału wzbudzenia w dziedzinie czasu |
ES2897478T3 (es) * | 2014-06-13 | 2022-03-01 | Ericsson Telefon Ab L M | Gestión de errores de trama de ráfaga |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5918205A (en) * | 1996-01-30 | 1999-06-29 | Lsi Logic Corporation | Audio decoder employing error concealment technique |
FI963870A (fi) | 1996-09-27 | 1998-03-28 | Nokia Oy Ab | Virheiden piilottaminen digitaalisessa audiovastaanottimessa |
US5907822A (en) | 1997-04-04 | 1999-05-25 | Lincom Corporation | Loss tolerant speech decoder for telecommunications |
JP3190853B2 (ja) * | 1997-05-23 | 2001-07-23 | エヌイーシーマイクロシステム株式会社 | 誤り訂正処理方法及びその装置 |
US6810377B1 (en) | 1998-06-19 | 2004-10-26 | Comsat Corporation | Lost frame recovery techniques for parametric, LPC-based speech coding systems |
US6549886B1 (en) | 1999-11-03 | 2003-04-15 | Nokia Ip Inc. | System for lost packet recovery in voice over internet protocol based on time domain interpolation |
JP2001339368A (ja) | 2000-03-22 | 2001-12-07 | Toshiba Corp | 誤り補償回路及び誤り補償機能を備えた復号装置 |
JP2002073091A (ja) | 2000-08-31 | 2002-03-12 | Matsushita Electric Ind Co Ltd | 復号装置 |
JP4613412B2 (ja) | 2000-10-27 | 2011-01-19 | ソニー株式会社 | 受信装置及びディジタルデータ復号方法 |
JP4300740B2 (ja) * | 2001-03-21 | 2009-07-22 | セイコーエプソン株式会社 | 強誘電体メモリ素子及びそれを備えた電子機器 |
-
2003
- 2003-06-05 JP JP2003160903A patent/JP2004361731A/ja active Pending
-
2004
- 2004-06-04 US US10/860,160 patent/US7225380B2/en active Active
- 2004-06-07 CN CNB2004100485085A patent/CN1326114C/zh not_active Expired - Fee Related
- 2004-06-07 DE DE602004003862T patent/DE602004003862T2/de not_active Expired - Lifetime
- 2004-06-07 EP EP04013345A patent/EP1484746B1/en not_active Expired - Lifetime
-
2005
- 2005-07-26 HK HK05106383A patent/HK1073915A1/xx not_active IP Right Cessation
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101046964B (zh) * | 2007-04-13 | 2011-09-14 | 清华大学 | 基于重叠变换压缩编码的错误隐藏帧重建方法 |
US8355911B2 (en) | 2007-06-15 | 2013-01-15 | Huawei Technologies Co., Ltd. | Method of lost frame concealment and device |
WO2008154852A1 (en) * | 2007-06-15 | 2008-12-24 | Huawei Technologies Co., Ltd. | A method and device for lost frame concealment |
CN101802906B (zh) * | 2007-09-21 | 2013-01-02 | 法国电信公司 | 传送误差隐藏的方法和装置、以及数字信号解码器 |
CN101221765B (zh) * | 2008-01-29 | 2011-02-02 | 北京理工大学 | 一种基于语音前向包络预测的差错隐藏方法 |
CN102148985B (zh) * | 2010-02-05 | 2013-06-12 | 宏碁股份有限公司 | 视讯译码装置 |
CN102893329A (zh) * | 2010-03-11 | 2013-01-23 | 弗兰霍菲尔运输应用研究公司 | 信号处理器、窗口提供器、编码的媒体信号、用于处理信号的方法以及用于提供窗口的方法 |
US8907822B2 (en) | 2010-03-11 | 2014-12-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Signal processor, window provider, encoded media signal, method for processing a signal and method for providing a window |
CN102893329B (zh) * | 2010-03-11 | 2015-04-08 | 弗兰霍菲尔运输应用研究公司 | 信号处理器、窗口提供器、用于处理信号的方法以及用于提供窗口的方法 |
US9252803B2 (en) | 2010-03-11 | 2016-02-02 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Signal processor, window provider, encoded media signal, method for processing a signal and method for providing a window |
CN102568483B (zh) * | 2010-11-26 | 2016-01-20 | 索尼公司 | 解码装置、解码方法和程序 |
CN102568483A (zh) * | 2010-11-26 | 2012-07-11 | 索尼公司 | 解码装置、解码方法和程序 |
CN103384154A (zh) * | 2012-05-03 | 2013-11-06 | 现代摩比斯株式会社 | 气爆噪声去除方法 |
CN103384154B (zh) * | 2012-05-03 | 2015-12-23 | 现代摩比斯株式会社 | 气爆噪声去除方法 |
US9210501B2 (en) | 2012-05-03 | 2015-12-08 | Hyundai Mobis Co., Ltd. | Pop-noise removing method |
CN110168639A (zh) * | 2016-12-09 | 2019-08-23 | 思睿逻辑国际半导体有限公司 | 数据编码检测 |
CN110168639B (zh) * | 2016-12-09 | 2023-09-15 | 思睿逻辑国际半导体有限公司 | 数据编码检测 |
Also Published As
Publication number | Publication date |
---|---|
CN1326114C (zh) | 2007-07-11 |
EP1484746B1 (en) | 2006-12-27 |
US20040250195A1 (en) | 2004-12-09 |
DE602004003862T2 (de) | 2007-05-10 |
JP2004361731A (ja) | 2004-12-24 |
DE602004003862D1 (de) | 2007-02-08 |
HK1073915A1 (en) | 2005-10-21 |
EP1484746A1 (en) | 2004-12-08 |
US7225380B2 (en) | 2007-05-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1573929A (zh) | 音频解码器以及音频解码方法 | |
CN1153399C (zh) | 用于提高当前语音帧质量的方法和无线系统 | |
AU2009294359B2 (en) | Iterative decoding of blocks with cyclic redundancy checks | |
CN1589468A (zh) | 确定数据帧是否包含已编码附加数据的方法和设备 | |
EP1790110B1 (en) | A method of formatting and encoding uplink short length data in a wireless communication system | |
CN1732512A (zh) | 用于隐蔽压缩域分组丢失的方法和装置 | |
US6295319B1 (en) | Decoding device | |
CN1878008A (zh) | 突发噪声抑制装置 | |
US20100058152A1 (en) | Decoding apparatus and method | |
CN1589550A (zh) | 错误隐蔽装置和方法 | |
EP2805325A1 (en) | Devices for redundant frame coding and decoding | |
CN1575491A (zh) | 用于解码帧中所设置的编码数字音频信号的方法和设备 | |
JP4875204B2 (ja) | 符号化オーディオデータを処理するための装置及び方法 | |
WO2009017345A3 (en) | Digital broadcasting system and method of processing data in digital broadcasting system | |
KR101427647B1 (ko) | 패킷 생성과 처리에 관한 방법 및 그 장치 | |
JP4989723B2 (ja) | 不連続伝送(dtx)検出を使用するブラインド・トランスポート・フォーマット検出のための方法および装置 | |
CN1364287A (zh) | 降低语音编码所需处理容量的方法以及网络单元 | |
CN1270467C (zh) | 检测被破坏信号参数的错误隐蔽方法 | |
CN1774883A (zh) | 介质编码数据的发送方法、设备和程序 | |
US20060179389A1 (en) | Method and apparatus for automatically controlling audio volume | |
US7080006B1 (en) | Method for decoding digital audio with error recognition | |
CN1774756A (zh) | 数据存储系统 | |
JP2002501328A (ja) | 情報を、ソース制御チャネルデコーディングを使用してコーディング、デコーディングおよび伝送するための方法および装置 | |
CN1784716A (zh) | 代码转换方法和设备 | |
CN1366659A (zh) | 具有音调变化检测的纠错方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1073915 Country of ref document: HK |
|
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20070711 Termination date: 20170607 |