CN1326114C - 音频解码器以及音频解码方法 - Google Patents

音频解码器以及音频解码方法 Download PDF

Info

Publication number
CN1326114C
CN1326114C CNB2004100485085A CN200410048508A CN1326114C CN 1326114 C CN1326114 C CN 1326114C CN B2004100485085 A CNB2004100485085 A CN B2004100485085A CN 200410048508 A CN200410048508 A CN 200410048508A CN 1326114 C CN1326114 C CN 1326114C
Authority
CN
China
Prior art keywords
error
audio frame
audio
mistake
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB2004100485085A
Other languages
English (en)
Other versions
CN1573929A (zh
Inventor
鸟海豪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of CN1573929A publication Critical patent/CN1573929A/zh
Application granted granted Critical
Publication of CN1326114C publication Critical patent/CN1326114C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm

Abstract

一种用于解码已编码音频数据的音频解码器,包括:错误检测装置,用于检测已编码音频数据的错误;错误隐藏方法确定装置,用于根据由所述错误检测装置所检测到的错误信息,确定音频帧和用于隐藏错误的窗函数的权重;频率时间转换器,用于将频率分量的音频数据转换为时间分量音频帧;音频帧缓冲器,用于存储由所述频率时间转换器所输出的时间分量音频帧;以及加窗处理装置,用于根据由所述错误隐藏方法确定装置所确定的窗函数的权重,对由所述频率时间转换器输出的时间分量音频帧和/或在所述音频帧缓冲器中存储的音频帧进行加权。

Description

音频解码器以及音频解码方法
技术领域
本发明涉及音频解码器以及音频解码方法,用于通过解码已编码音频数据来获得音频数据。具体地,涉及一种音频解码器和一种音频解码方法,当在解码处理中解码已编码音频数据时,能够在发生错误时实现声音质量的提高。
背景技术
在近年来越来越大众化的压缩音频数据中(MP3、AAC、杜比数字、ATRAC等),使用了例如熵编码、窗函数以及正交变换等方法的结合来压缩数据,从而实现了比线性PCM更高的编码效率。可以通过在解码器中进行解码来回放这种所压缩的音频数据,但是在记录介质或传输路径中存在发生错误的情况。特别地,在无线电传输及类似中错误出现的频率较高。因此,有必要采取措施,以便能够忽略这些错误,通常,诸如CRC码之类的错误检测码包含在要发送的音频数据中,从而可以检测传输错误。
传统上,当通过上述错误检测码检测到错误时,作为对付错误的措施,减弱或跳过所检测到的音频帧,直到到达能够正确解码的音频帧。此外,还可以使用其中将零插入输入窗函数信号来平滑衰减声音的方法,从而减小了噪声(例如,见日本待审专利公开2002-073091)。
作为用于进行忽略错误的另一种方法,通常使用其中在存储器中存储之前正确地解码音频数据的方法,并且重复输出,直到接收到能够正确解码的数据。
但是,如下所述,在上述用于克服错误的传统措施中存在缺点。
缺点的第一方面如下。当将相邻的解码音频数据用于填充以隐藏音频数据的错误时,在音频帧之间的声音变得不连续,这引起了噪声。
缺点的第二方面如下。通过只使用已编码音频数据内的错误信息来执行错误隐藏处理,因此只存在用于确定错误隐藏方法的较少选择因素。因此,很难采取充分的措施用于克服错误。
缺点的第三方面如下。通过只使用与当前被解码的音频数据相邻的音频数据的错误信息来执行错误隐藏处理,因此不可能采取通过预测未来的条件来克服错误的措施。
发明内容
本发明的第一目的是通过使用了错误隐藏处理的较少操作量来减少令人不快的噪声。
本发明的第二目的是通过增加用于采取用于克服错误的措施的标识(index),在错误发生时实现较好的声音质量。
本发明的第三目的是通过在错误发生时预测未来错误发生的状态来执行更适当的错误隐藏,以实现具有较好声音质量的音频再现。
根据本发明,提出了一种用于解码已编码音频数据的音频解码器,包括:错误检测装置,用于检测已编码音频数据的错误;错误隐藏方法确定装置,用于根据由所述错误检测装置检测到的错误信息,确定用于隐藏错误的音频帧和窗函数的权重;频率时间转换器,用于将频率分量的音频数据转换为时间分量音频帧,使得由预定数目的采样N组成的两个相邻的时间分量音频帧在N/2采样上相互重叠;音频帧缓冲器,用于存储由所述频率时间转换器所输出的时间分量音频帧;以及加窗处理装置,用于从频率时间转换器输出的和/或音频帧缓冲器中存储的音频帧中提取预定的时间分量音频帧,在第一预定音频帧的重叠的N/2采样的幅度上加上确定的权重,在第一预定音频帧之后的第二预定音频帧的重叠的N/2采样的幅度上加上确定的权重;并对第一预定音频帧的加权的N/2幅度和第二预定音频帧的加权的N/2幅度逐采样的相加,从而获得由N/2采样组成的音频帧。
为了实现前述目的,本发明的音频解码器包括:错误检测设备,用于检测已编码音频数据的错误;错误隐藏方法确定设备,用于根据由所述错误检测设备所检测到的错误信息,确定音频帧和用于隐藏错误的窗函数的权重;频率帧转换器,用于将频率分量的音频数据转换为时间分量音频帧;音频帧缓冲器,用于累积由所述频率时间转换器所输出的时间分量音频帧;以及加窗处理设备,用于根据由所述错误隐藏方法确定设备所确定的窗函数的权重,对由频率时间转换器输出的时间分量音频帧和/或在音频帧缓冲器中所累积的音频帧进行加权。
在此结构中,错误检测设备检测音频数据中的错误,并将信息发送到错误隐藏方法确定设备。通过频率时间转换器,将频域的音频数据转换为时间分量音频帧,并存储在音频帧缓冲器中。根据由错误隐藏方法确定设备所确定的权重,对时间分量音频帧和音频帧缓冲器中的旧音频帧执行加窗处理(windowing process)。因此,能够获得具有较少噪声的再现声音(音频帧)。
此外,为了增加检测错误的机会,本发明的音频解码器具有以下结构:错误检测设备包括于声道解码器中,所述声道解码器具有对其执行了传输线路编码的数据进行解码的功能;以及错误检测设备包括于解复用器中,所述解复用器具有解复用由多路复用音频数据所获得的数据流的功能。
利用这种结构,可以检测并隐藏在传输路径上出现的已编码音频信号的错误,并检测并隐藏在多路复用的数据流中出现的错误。
此外,为了提高使用以往的出错率来隐藏错误的效果,本发明的音频解码器包括错误历史存储器,用于记录由错误检测设备所检测到的错误信息的历史。错误隐藏方法确定设备具有根据由错误检测设备所检测到的错误信息以及存储在错误历史存储器中的错误信息的历史来确定窗函数权重的功能。
在此结构中,将包括旧信息的错误信息存储在错误历史存储器中,并且错误隐藏方法确定设备也考虑到旧错误信息来预测未来错误发生的状态。通过根据所预测的值执行错误隐藏处理,能够获得具有优异声音质量的输出。
附图说明
图1是示出了本发明第一实施例的框图;
图2是示出了错误隐藏方法确定设备102的内容的第一示例的图;
图3是示出了错误隐藏方法确定设备102的内容的第二示例的图;
图4是示出了错误隐藏方法确定设备102的内容的第三示例的图;
图5是示出了当解码已编码音频数据时,错误隐藏方法确定单元102的处理示例的流程图;
图6是当解码已编码音频数据时,错误隐藏方法确定单元102的处理示例的流程图;
图7是示出了本发明第二实施例的框图;
图8是示出了本发明第二实施例的另一个框图;
图9是示出了本发明第三实施例的框图;
图10是示出了错误隐藏方法确定单元402的内容的第一示例;
图11是示出了错误隐藏方法确定单元402的内容的第三示例;以及
图12是用于说明加权的图。
具体实施方式
接下来,将参考附图,对本发明的实施例进行说明。
第一实施例
图1是示出了本发明第一实施例的框图。该实施例用于当在已编码音频数据中检测到错误时,避免由于不连续声音的产生而引起的噪声。本实施例包括错误检测单元101、错误隐藏方法确定单元102、频率时间转换器103、加窗处理单元104以及音频帧缓冲器105。
错误检测单元101具有将已编码音频数据的错误信息发送到错误隐藏方法确定单元102的功能。对于通过错误检测单元101来检测错误的方法,可以使用任意方法。示例是通过错误码的错误检查,例如CRC、对音频数据执行的伽马校正、音频数据的输入缓冲器的下溢检查等。
错误隐藏方法确定单元102具有根据由错误检测单元101所输出的音频数据的错误信息来确定音频帧以及权重的功能,该权重用于在加窗处理单元104中所执行的加窗操作。对于用于确定音频帧和用于加窗操作的权重的特定方法,例如,可以使用以下三种方法。
在第一种方法中,如图2所示,当在正确地解码音频帧之后,在帧中连续地检测到错误时,随着时间的变化,通过重复已经正确解码的上一个音频帧来减小加窗处理的权重。当错误检测单元101在解码音频数据时检测到连续的错误时,针对受损部分复制能够被正确解码的上一个音频数据帧并且逐渐衰减帧之间的加窗处理的权重。因此,所输出的音频帧中不存在不连续,所以能够忽略由于错误引起的噪声。
在第二种方法中,如图3所示,当正确地解码了紧随检测到错误的音频数据之后的音频帧时,逐渐地增大加窗处理的权重,以使其回到正常权重。当错误检测单元101检测到在解码视频帧时恢复了错误出现并且能够实现正常解码时,从已经从要返回的错误恢复的第一音频帧开始到最终的正常权重,逐渐增大加窗处理的权重。因此,所输出的音频帧中不存在不连续,所以能够忽略由于错误引起的噪声。
在第三种方法中,如图4所示,当只在能够正确解码的音频数据的一部分存在错误时,通过添加权重,从紧邻在检测到错误的数据之前的正确解码的数据到检测到错误的音频数据之后的正确解码数据来执行平滑的过渡。当错误检测单元101检测到部分音频数据中存在错误时,复制受损音频帧外围的正确解码的音频数据,并执行加窗处理,而不改变加窗处理的权重。因此,所输出的音频帧中不存在不连续,所以能够忽略由于错误引起的噪声。
频率时间转换器103具有将频域的音频数据(频率分量)转换到时域(时间分量)音频帧的功能。对于使用频率时间转换器1-3的转换方法,可以使用在多种音频解码方法中使用的正交转换等,例如IMDCT(逆改进的离散余弦逆变换)。
音频帧缓冲器105具有存储已被转换到时间分量的音频帧的功能。例如,通过存储器、硬盘驱动器等能够实现具有这种功能的音频帧缓冲器105。
加窗处理单元104具有以下功能:从频率时间转换器103和/或音频帧缓冲器105中提取由错误隐藏方法确定单元102所选择的音频帧;根据由错误隐藏方法确定单元102所确定的加窗权重来添加权重;以及输出声音(音频帧)。例如,具有这种功能的加窗处理单元104执行如图2、3和4所示的处理。换句话说,加窗处理单元104提取由错误隐藏方法确定单元102所指定的当前帧以及从音频帧缓冲器105和/或频率时间转换器103到其执行加窗处理的帧。然后,通过根据指定的加窗权重而添加权重来输出音频帧。
现在,参考图12对权重进行说明。作为执行IMDCT的结果,例如,能够获得分别由2048个采样组成的音频帧1,2,3...。音频帧1和音频帧2彼此重叠1024个采样。按照相同的方式,音频帧2和音频帧3彼此重叠1024个采样。在加权中,将音频帧1的后一半1024个采样的加权结果与音频帧2的前一半1024个采样的加权结果逐个采样地相加,从而获得了由1024个采样构成的音频帧A。按照相同的方式,将音频帧2的后一半1024个采样的加权结果与音频帧3的前一半1024个采样的加权结果逐个采样地相加,从而获得了由1024个采样构成的音频帧B。在图2、3和4中,为了方便的缘故,没有彼此重叠地示出音频帧1,2,3...。但是在实际中,如图12所示,它们彼此重叠。
图5、6是示出了当解码音频数据时错误隐藏方法确定单元102的处理示例的流程图。在下文中,参考每一个附图,对实施例的操作进行说明。
首先,对提取已经输入的已编码音频数据的操作进行说明。错误检测单元101检查已经输入的解码音频数据的语法、错误码以及缓冲器的不足,以便查明是否存在任何错误并将结果发送到错误隐藏方法确定单元102。同时,将已编码音频数据输入到频率时间转换器103,以转换为时间分量音频帧,并且将其输出到加窗处理单元104。此外,在音频帧缓冲器105中存储音频帧。
接下来,将对当已编码音频数据中不存在错误时的错误隐藏方法的确定操作进行说明。当根据从错误检测单元101接收到的错误信息判断出当前帧的附近没有错误出现(步骤S1,否)时,错误隐藏方法确定单元102选择之前紧邻的帧作为用于执行加窗处理的对象,并向加窗处理单元104发送命令以执行常规的加窗处理(步骤S2)。当在当前音频帧上添加加窗权重以及在其它音频帧上加权时,这里用于加窗处理的对象指其它音频帧。
接下来,将对当在已编码音频帧中出现长期的连续错误时的错误隐藏方法的确定操作进行说明。当根据从错误检测单元101接收到的错误信息判断出当前帧的附近存在错误(步骤S1,是)以及在当前帧之后存在长期连续错误(步骤S3,是)时,错误隐藏方法确定单元102判断在当前要输出的帧中是否存在错误(步骤S8)。
例如,如图2所示,在当前要被输出的帧是音频帧3的情况下,当判定当前要被输出的帧中不存在错误时(步骤8,否),错误隐藏方法确定单元102向加窗处理单元104发送命令以选择之前紧邻的帧作为执行加窗处理的对象并执行常规的加窗处理(步骤S9)。
例如,如图2所示,在当前要被输出的帧是音频帧4到6的情况下,当判定当前要被输出的帧中存在错误时(步骤8,是),错误隐藏方法确定单元102使用最相邻、已经被正确解码的帧作为当前帧(步骤S10),并向加窗处理单元104发送命令以选择之前紧邻的帧作为执行加窗处理的对象,并通过逐渐地衰减权重来执行加窗处理(步骤S11)。当下一个处理从步骤S1开始时,将在步骤S10中用作当前帧的帧作为步骤S11中的之前紧邻的帧进行处理。此外,通过使用当错误连续时增加1以及当不存在错误时复位为零的计数器,当长期连续错误持续时,可以在步骤S11中每次逐渐地衰减加窗权重。
接下来,将对当从长期连续错误中恢复已编码音频数据时的错误隐藏方法确定单元102的操作进行说明。当错误隐藏方法确定单元102根据从错误检测单元101接收到的错误信息判断出当前帧的附近存在错误出现(步骤S1,是)、判断出在当前帧之后的帧中不存在长期连续错误(步骤S3,否)以及从长期连续错误中已经恢复了(步骤S4,是)时,错误隐藏方法确定单元102判断在当前要输出的帧中是否存在错误(步骤S5)。
例如,如图3所示,在当前要被输出的帧是音频帧3到6的情况下,当判定当前要被输出的帧中不存在错误时(步骤5,否),错误隐藏方法确定单元102向加窗处理单元104发送命令以选择之前紧邻的帧作为执行加窗处理的对象,并使用逐渐增加以返回到正常权重的加窗权重来执行加窗处理(步骤S6)。
例如,如图3所示,在当前要被输出的帧是音频帧2的情况下,当判定当前要被输出的帧中存在错误时(步骤5,是),错误隐藏方法确定单元102向加窗处理单元104发送命令以输出没有声音的作为静音数据的当前帧,而不执行加窗处理。此外,通过使用当无错误连续的无错状态时增加1以及当存在错误时复位为零的计数器,当从长期连续错误中恢复时,每次执行步骤S6可以逐渐增加加窗权重。
接下来,将对错误隐藏方法确定单元102的没有归入上述描述情况下的确定操作进行说明,即在短期错误存在于已编码音频数据中及在出现错误后即被恢复的情况。当错误隐藏方法确定单元102根据从错误检测单元101接收的错误信息判断当前帧的附近存在错误时(步骤1,是),判断当前帧之后的帧中无长期连续错误(步骤3,否),并且没有从长期连续错误中被恢复(步骤4,否),则错误隐藏方法确定单元102判断当前帧中是否存在错误(步骤12)。
例如,如图4所示,当当前要输出的帧是音频帧2或5的情况下,当要输出的当前帧中无错误时(步骤12,否),错误隐藏方法确定单元102将命令发送到加窗处理单元104,以选择当前帧之前的紧邻帧作为加窗处理对象,并执行常规加窗处理(步骤13)。在图4中的音频帧5情况下,似乎没有当前帧之前的紧邻帧,正如后面所述,当处理音频帧4时音频帧5被看作当前帧,当按照如上所述的情况处理音频帧5时,在处理音频帧4时被看作当前帧的帧就被看作当前帧之前的紧邻帧。这样,如图4所示,当目前将被输出的帧是音频帧5时,音频帧5被看作当前帧和当前帧之前的紧邻帧。
例如,当在目前要输出的帧为图4中所示的音频帧3和4情况下,当判断目前要输出的帧中存在错误(步骤12,是)时,错误隐藏确定单元102判断是否目前要输出的帧与正确解码的最近的帧的距离(过去的距离)小于目前要输出的帧与将被正确解码的最近的帧的距离(将来的距离)(步骤14)。
例如,如图4所示,当在目前要输出的帧为音频帧3的情况下,当过去的距离小于将来的距离时(步骤14,是),数据隐藏方法确定单元102用已正确解码的最近的帧作为当前帧(步骤15),并发送命令给加窗处理单元104来选择所述帧之前的紧邻帧为加窗处理的对象并执行常规的加窗处理(步骤16)。
例如,如图4中所示,当在目前要输出的帧为音频帧4时,当将来的距离小于过去的距离或距离相等(步骤14,否)时,数据隐藏方法确定单元102将正确解码的最近的帧作为当前帧(步骤17),并将命令发送到加窗处理单元104以选择所述帧之前的紧邻帧为加窗处理对象和执行常规的加窗处理(步骤18)。所述帧之前的紧邻帧就是在以前处理中当作当前帧的帧。这样,当目前要输出的帧是图4中的音频帧4时,所述帧之前的紧邻帧是音频帧2。
当过去的距离和将来的距离相等时,进行到步骤15而不是步骤17。
如上所述,按照实施例,可以处理不连续的输出音频数据,并且即使在已编码音频数据存在错误情况下也可以输出带有较少不愉快噪音的声音。
第二实施例
接下来,将对本发明的第二实施例进行说明。该实施例中,在错误出现时,通过不仅减少有错误的音频数据的噪音而且增加标识来采取措施克服错误的手段来执行更精确的错误隐藏处理可以得到较好音质的声音。
图7是示出了本发明第二实施例的框图。第二实施例与图1所示的第一实施例不同在于,在第二实施例中,增加了信道解码器201并设置了错误检测单元201a,而不是错误检测单元101。与图1中的相同的数字码表示相同的单元。
当已编码音频数据在传输路径传输时,信道解码器201具有解码信道已编码数据的功能。具体地,该功能可通过使用里德一所罗门码的解码器来实现,例如,用于数字电视广播的传输。
错误检测单元201a具有下列功能:当解码信道解码传输数据时,在数据被损坏到不能被校正的程度时,检测该错误,并将错误信息发送到错误隐藏方法确定单元102。
接下来,将对实施例的操作进行说明。信道解码器201接收信道已解码传输数据,解码信道编码,并提取已编码音频数据。这时,错误检测单元201a检查解码信道码是否失败,并将错误信息发送到错误隐藏方法确定单元102。错误隐藏方法确定单元102,频率时间转换器103,加窗处理单元104和音频帧缓冲器105按照与在本发明第一实施例中所述的相同方式进行操作。
图8是示出了本发明第二实施例的另一个框图。与图1所示框图的不同之处在于,增加了信道解码器301并设置了错误检测单元301a,而不是错误检测单元101。与图1中的相同的数字码表示相同的单元。
当利用其它音频数据和/或视频数据来多路复用已编码音频数据以传输时,解复用器301具有解复用目标音频数据的功能。具体地,通过MPEG 2之类系统中的传送流解复用器可以实现解复用器301。
错误检测单元301a具有以下功能:当解复用其中多路复用不同数据的多路复用数据时,检查传输错误标识符和目标音频数据所属的数据序列数;当传输错误标识符显示错误存在或序列数不连续时检测错误;以及将错误信息到发送错误隐藏方法确定单元102。
接下来,将对实施例的操作进行说明。解复用器301接收由不同数据被多路复用的多路复用数据,解复用多路复用数据并取出目标已编码音频数据。这时,错误检测单元301a通过检查传输错误标识符和在多路复用信息中的序列数目来检验目标音频数据中错误的出现,并将数据中错误的出现发送到错误隐藏方法确定单元102。错误隐藏方法确定单元102、频率时间转换器103、加窗处理单元104以及音频帧缓冲器105按照与本发明第一实施例中所述的相同方式进行操作。
如上所述,根据该实施例,即使在已编码音频数据中没有错误校正码,或在其中不能检测语法错误的结构的情况下,通过检测出现在传输路径上的错误以及多路复用数据中的错误能够输出错误被隐藏的数据。
第三实施例
图9是示出了本发明第三实施例的框图。第三实施例与图1所示的第一实施例的不同之处在于,增加了错误历史存储器406,并设置了错误检测单元401而不是错误检测单元101,以及设置了错误隐藏方法确定单元402而不是错误隐藏方法确定单元102。与图1中的相同的数字码表示相同的单元。
错误检测单元401具有将已编码音频数据的错误信息发送到错误隐藏方法确定单元402和错误历史存储器406的功能。关于通过错误检测单元401检测错误的方法,可以使用任何方法。如通过错误码如CRC的错误检测,在音频数据中执行的语法检查,音频数据的输入缓冲器的下溢检查等等。
错误隐藏方法确定单元402可以根据由错误检测单元401输出的音频数据的错误信息和过去某特定时间段存储在错误历史存储器406中的错误信息来确定音频帧和用于由加窗处理单元104执行的加窗处理中的权重。具体地,作为确定音频帧和用于执行加窗操作的权重的方法,例如,可以采用下面三种方法。
在第一种方法中,当在如图10所示的正确解码帧之后的帧中连续检测错误时,根据过去某特定时间段的错误信息来预测将来的数据出错率。当预测的出错率为高时,通过与图2中相同的方法立即衰减输出音频帧,而当预测出错率为低时,根据从错误中立即恢复数据的假设,缓慢地进行衰减。当按照这种方式恢复数据时,对恢复的数据执行加窗处理以便将声音的恶化抑制到最小。当数据没有恢复时,衰减权重,直到数据输出而没有声音。
在第二种方法中,当错误在正确解码的帧之后的帧中如在第一个方法情况下那样连续被检测时,基于过去的错误信息计算数据错误持续的长度预测值。当连续错误长度的预测值较大时,输出音频帧立即衰减,当连续错误长度的预测值较小时,假设从错误中立即恢复数据来缓慢地衰减。当按照这种方式恢复数据时,利用所恢复的数据执行加窗处理,以便将声音的恶化抑制到最小。当数据没有恢复时,权重衰减,直到数据输出没有声音。
在第三种方法中,当从连续错误中恢复音频数据时,基于过去的错误信息来预测将来数据出错率。如图11所示,当预测的出错率为高时,首先输出静音数据,如图3所示,当预测出错率减少到一定范围内(图11中20%)时,通过逐渐增加加窗处理权重使权重返回到常规值。因此,通过避免由于错误出现的数目而引起的断续声音来减少令人不快的声音输出。
错误历史存储器406具有存储过去某特定时间段从错误检测单元401输入的错误信息并在接收到来自错误隐藏确定单元402的请求时输出错误信息历史的功能。例如,通过使用存储器和硬盘驱动器等可以实现具有这些功能的错误历史存储器406。
接下来,将对实施例的操作进行说明。首先,将对提取已输入的已编码音频数据时的操作进行说明。错误检测单元401检查有关已输入的已编码音频数据的语法、错误码、缓冲器的不足等并将错误信息发送到错误历史存储器406。同时,将已编码数据输入到频率时间转换器103,以将其转换为时间分量音频帧并将其输出到加窗处理单元104。此外,在音频帧缓冲器105中存储音频帧。
现在,将对在已编码音频数据中出现连续错误时错误隐藏方法确定单元402的确定操作进行说明。根据从错误检测单元401接收的错误信息和在错误历史存储器406中存储的过去错误信息,错误隐藏方法确定单元402计算将来出错率的预测值。例如,关于计算的特定方法可以使用以下表达式。
(预测出错率)=(在过去的1秒钟内错误的音频帧数)/(在过去的1秒钟内处理的音频帧数)
当预测出错率较高时,判定没有从错误中立即恢复数据,并且按照与在图2中所示相同的方式发送命令到加窗处理单元104,减少加窗权重以立即衰减输出声音。另一方面,当预测出错率较低时,判定立即从错误中恢复数据并且缓慢减少加窗权重。当数据被恢复时,使用如图10所示的方法,对紧邻其后的正常音频帧执行加窗处理,以便将声音的恶化抑制到最小。当没有从错误中恢复数据时,缓慢减少加窗权重并且持续处理,直到变为无声。
当连续错误出现在已编码音频数据中时,将对另一种错误隐藏方法的确定操作进行说明。根据从错误检测单元401接收的错误信息和在错误历史存储器406中存储的过去错误信息,错误隐藏方法确定单元402计算连续错误长度的预测值。例如,关于计算的特定方法可以使用以下表达式。
(连续错误长度的预测值)=(过去10次的错误长度平均值)
当连续错误长度的预测值较高时,判定没有从错误中立即恢复数据,并且按照与如图2所示相同的方式将命令发送到加窗处理单元104,减少加窗处理以立即衰减输出声音。另一方面,当连续错误长度的预测值较低时,判定从错误中立即恢复数据并且减少加窗权重的速度放缓。当数据被恢复时,按照如图10所示的方式对紧邻之后的正常音频帧执行加窗处理,以便将声音的恶化抑制到最小。当数据没有从错误中恢复时,缓慢减少加窗权重及持续处理直到变为无声。
当从连续错误中恢复已编码数据时,将对错误隐藏方法的确定操作进行说明。根据从错误检测单元401接收的错误信息和在错误历史存储器406中存储的过去错误信息,错误隐藏方法确定单元402计算将来出错率的预测值。例如关于计算的特定方法可使用上述的表达式。当预测出错率为高时,判定数据再次处于错误状态及发送命令到加窗处理单元104来维持加窗权重为零以继续输出无声。另一方面,当预测出错率为低时,判断为从错误恢复数据及以与如图3所示的相同的方法发送命令到加窗处理单元104来缓慢返回到常规加窗权重。
现在,将对加窗处理操作进行说明。加窗处理单元104从频率时间转换器103取出当前帧以及由错误隐藏方法确定单元402指示的用于加窗处理的对象帧,并按照指示的加窗权重增加权重,并输出音频帧。
如上所述,根据实施例,即使错误出现在已编码音频数据的情况下,也可以通过预测将来错误状态而隐藏错误。这样,能够进一步减少令人不悦的声音输出。
如上所述,即使在错误出现在音频数据的情况下,本发明的音频解码器通过使用其它帧代替有错误帧来调整加窗处理的权重,也能够避免断续。这样,用少量的操作可有效地减少令人不悦的噪音输出。
此外,本发明的音频解码器能根据信道编码和多路复用来使用错误信息,因此可实现带有极少错误的错误隐藏处理。
此外,本发明的音频解码器能够根据错误出现时的过去错误信息来预测将来错误出现状态来执行更准确的错误隐藏处理。

Claims (20)

1.一种用于解码已编码音频数据的音频解码器,包括:
错误检测装置,用于检测已编码音频数据的错误;
错误隐藏方法确定装置,用于根据由所述错误检测装置检测到的错误信息,确定用于隐藏错误的音频帧和窗函数的权重;
频率时间转换器,用于将频率分量的音频数据转换为时间分量音频帧,使得由预定数目的采样N组成的两个相邻的时间分量音频帧在N/2采样上相互重叠;
音频帧缓冲器,用于存储由所述频率时间转换器所输出的时间分量音频帧;以及
加窗处理装置,用于从频率时间转换器输出的和/或音频帧缓冲器中存储的音频帧中提取预定的时间分量音频帧,在第一预定音频帧的重叠的N/2采样的幅度上加上确定的权重,在第一预定音频帧之后的第二预定音频帧的重叠的N/2采样的幅度上加上确定的权重;并对第一预定音频帧的加权的N/2幅度和第二预定音频帧的加权的N/2幅度逐采样的相加,从而获得由N/2采样组成的音频帧。
2.根据权利要求1所述的音频解码器,其特征在于当存在连续错误时,所述加窗处理装置连续输出连续错误出现之前的音频帧,同时衰减幅度。
3.根据权利要求1所述的音频解码器,其特征在于当从连续错误恢复时,所述加窗处理装置输出恢复的音频帧,同时增加幅度。
4.根据权利要求1所述的音频解码器,其特征在于当出现短期错误时,所述加窗处理装置在短期错误前一半内输出一个在短期错误出现之前的音频帧,以及在短期错误后一半内输出一个在短期错误出现之后的音频帧。
5.根据权利要求1所述的音频解码器,其特征在于所述错误检测装置包括于信道解码器中,所述信道解码器具有对执行了传输线路编码的数据进行解码的功能。
6.根据权利要求1所述的音频解码器,其特征在于所述错误检测装置包括于解复用器中,所述解复用器具有解复用由多路复用音频数据所获得的数据流的功能。
7.根据权利要求1所述的音频解码器,其特征在于所述错误检测装置还包括错误历史存储器,用于存储由错误检测装置所检测到的错误信息的历史,以及错误隐藏方法确定装置根据由错误检测装置所检测到的错误信息以及存储在错误历史存储器中的错误信息的历史来确定音频帧和用于隐藏错误的窗函数权重。
8.根据权利要求7所述的音频解码器,其特征在于所述错误隐藏方法确定装置根据存储在错误历史存储器中的过去的错误出现率以及由错误检测装置所检测到的错误信息来确定处理方法。
9.根据权利要求7所述的音频解码器,其特征在于所述错误隐藏方法确定装置根据存储在错误历史存储器中的在过去出现的连续错误数据数目以及由错误检测装置所检测到的错误信息来确定处理方法。
10.根据权利要求7所述的音频解码器,其特征在于当错误出现时,在出错率为第一出错率的情况下,所述加窗处理装置连续输出错误出现之前的音频帧,同时使用第一衰减率衰减幅度,以及在出错率为低于第一出错率的第二出错率的情况下,连续输出错误出现之前的音频帧,同时使用低于第一衰减率的第二衰减率衰减幅度。
11.根据权利要求7所述的音频解码器,其特征在于,当从连续错误恢复时,当预测出错率高于阈值时,所述加窗处理装置执行无声的输出,并且当预测出错率低于阈值时,输出恢复的音频帧,同时增加幅度。
12.一种音频解码方法,包括:
错误检测步骤,用于检测已编码音频数据的错误;
错误隐藏方法确定步骤,用于根据由所述错误检测步骤所检测到的错误信息,确定用于隐藏错误的音频帧和窗函数的权重;
频率时间转换步骤,用于将频率分量的音频数据转换为时间分量音频帧,从而由预定数目的采样N组成的两个相邻的时间分量音频帧在N/2采样上相互重叠;
音频帧缓冲步骤,用于存储由所述频率时间转换步骤输出的时间分量音频帧;以及
加窗处理步骤,用于从频率时间转换步骤中获得的音频帧和/或音频帧缓冲步骤中存储的音频帧中提取预定的时间分量音频帧;在第一预定音频帧的重叠的N/2采样的幅度上加上确定的权重,在第一预定音频帧之后的第二预定音频帧的重叠的N/2采样的幅度上加上确定的权重;并对第一预定音频帧的加权的N/2幅度和第二预定音频帧的加权的N/2幅度逐采样的相加,从而获得由N/2采样组成的音频帧。
13.根据权利要求12所述的音频解码方法,其特征在于,在加窗处理步骤中,当存在连续错误时,连续输出连续错误出现之前的音频帧,同时衰减幅度。
14.根据权利要求12所述的音频解码方法,其特征在于在加窗处理步骤中,当从错误恢复时,输出恢复的音频帧,同时增加幅度。
15.根据权利要求12所述的音频解码方法,其特征在于当出现短期错误时,在加窗处理步骤中,在短期错误前一半内输出一个在短期错误出现之前的音频帧及在短期错误后一半内输出一个在短期错误出现之后的音频帧。
16.根据权利要求12所述的音频解码方法,其特征在于所述错误检测步骤还包括错误历史存储步骤,用于存储由错误检测步骤所检测到的错误信息的历史,在错误隐藏方法确定步骤中,根据由错误检测步骤所检测到的错误信息以及在错误历史存储步骤中存储的错误信息的历史确定音频帧和用于隐藏错误的窗函数权重。
17.根据权利要求16所述的音频解码方法,其特征在于在所述错误隐藏方法确定步骤中,根据在错误历史存储步骤中存储的过去的错误出现率以及由错误检测步骤所检测到的错误信息来确定处理方法。
18.根据权利要求16所述的音频解码方法,其特征在于在所述错误隐藏方法确定步骤中,根据在错误历史存储步骤中存储的过去出现的连续错误数据的数目以及由错误检测步骤所检测到的错误信息来确定处理方法。
19.根据权利要求16所述的音频解码方法,其中当错误出现时,在所述加窗处理步骤,在出错率为第一出错率情况下,连续输出错误出现之前的音频帧的同时用第一衰减率衰减幅度,和在出错率为低于第一出错率的第二出错率情况下,连续输出错误出现之前的音频帧的同时用低于第一衰减率的第二衰减率衰减幅度。
20.根据权利要求16所述的音频解码方法,其特征在于,当从连续错误恢复时,在加窗处理步骤中,当预测出错率高于阈值时执行无声输出,以及当预测出错率低于阈值时输出恢复的音频帧,同时增加幅度。
CNB2004100485085A 2003-06-05 2004-06-07 音频解码器以及音频解码方法 Expired - Fee Related CN1326114C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2003160903 2003-06-05
JP2003160903A JP2004361731A (ja) 2003-06-05 2003-06-05 オーディオ復号装置及びオーディオ復号方法

Publications (2)

Publication Number Publication Date
CN1573929A CN1573929A (zh) 2005-02-02
CN1326114C true CN1326114C (zh) 2007-07-11

Family

ID=33157203

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2004100485085A Expired - Fee Related CN1326114C (zh) 2003-06-05 2004-06-07 音频解码器以及音频解码方法

Country Status (6)

Country Link
US (1) US7225380B2 (zh)
EP (1) EP1484746B1 (zh)
JP (1) JP2004361731A (zh)
CN (1) CN1326114C (zh)
DE (1) DE602004003862T2 (zh)
HK (1) HK1073915A1 (zh)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7831421B2 (en) * 2005-05-31 2010-11-09 Microsoft Corporation Robust decoder
JP4137130B2 (ja) * 2006-02-03 2008-08-20 キヤノン株式会社 伝送システム及び伝送チャネル割当方法
KR101261528B1 (ko) 2006-05-16 2013-05-07 삼성전자주식회사 복호화된 오디오 신호의 오류 은폐 방법 및 장치
US8798172B2 (en) * 2006-05-16 2014-08-05 Samsung Electronics Co., Ltd. Method and apparatus to conceal error in decoded audio signal
KR100862662B1 (ko) 2006-11-28 2008-10-10 삼성전자주식회사 프레임 오류 은닉 방법 및 장치, 이를 이용한 오디오 신호복호화 방법 및 장치
BRPI0802614A2 (pt) 2007-02-14 2011-08-30 Lg Electronics Inc métodos e aparelhos para codificação e decodificação de sinais de áudio baseados em objeto
CN101046964B (zh) * 2007-04-13 2011-09-14 清华大学 基于重叠变换压缩编码的错误隐藏帧重建方法
CN101325537B (zh) * 2007-06-15 2012-04-04 华为技术有限公司 一种丢帧隐藏的方法和设备
US20100195490A1 (en) * 2007-07-09 2010-08-05 Tatsuya Nakazawa Audio packet receiver, audio packet receiving method and program
CN100524462C (zh) 2007-09-15 2009-08-05 华为技术有限公司 对高带信号进行帧错误隐藏的方法及装置
EP2203915B1 (fr) * 2007-09-21 2012-07-11 France Telecom Dissimulation d'erreur de transmission dans un signal numerique avec repartition de la complexite
CN101221765B (zh) * 2008-01-29 2011-02-02 北京理工大学 一种基于语音前向包络预测的差错隐藏方法
US8879643B2 (en) 2008-04-15 2014-11-04 Qualcomm Incorporated Data substitution scheme for oversampled data
CN101588341B (zh) * 2008-05-22 2012-07-04 华为技术有限公司 一种丢帧隐藏的方法及装置
CN102227769A (zh) 2008-10-01 2011-10-26 Gvbb控股股份有限公司 解码装置、解码方法、编码装置、编码方法和编辑装置
CN102148985B (zh) * 2010-02-05 2013-06-12 宏碁股份有限公司 视讯译码装置
EP2372703A1 (en) 2010-03-11 2011-10-05 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Signal processor, window provider, encoded media signal, method for processing a signal and method for providing a window
JP2011239036A (ja) * 2010-05-06 2011-11-24 Sharp Corp 音声信号変換装置、方法、プログラム、及び記録媒体
JP5637379B2 (ja) * 2010-11-26 2014-12-10 ソニー株式会社 復号装置、復号方法、およびプログラム
KR102070430B1 (ko) * 2011-10-21 2020-01-28 삼성전자주식회사 프레임 에러 은닉방법 및 장치와 오디오 복호화방법 및 장치
KR20130123713A (ko) * 2012-05-03 2013-11-13 현대모비스 주식회사 팝 노이즈 제거 방법
KR102132326B1 (ko) * 2013-07-30 2020-07-09 삼성전자 주식회사 통신 시스템에서 오류 은닉 방법 및 장치
KR101984117B1 (ko) 2013-10-31 2019-05-31 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. 시간 도메인 여기 신호를 변형하는 오류 은닉을 사용하여 디코딩된 오디오 정보를 제공하기 위한 오디오 디코더 및 방법
ES2805744T3 (es) 2013-10-31 2021-02-15 Fraunhofer Ges Forschung Decodificador de audio y método para proporcionar una información de audio decodificada usando un ocultamiento de errores en base a una señal de excitación de dominio de tiempo
US10074378B2 (en) * 2016-12-09 2018-09-11 Cirrus Logic, Inc. Data encoding detection

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1200509A (zh) * 1997-05-23 1998-12-02 日本电气株式会社 以小存储器容量进行纠错处理的方法和装置
US5907822A (en) * 1997-04-04 1999-05-25 Lincom Corporation Loss tolerant speech decoder for telecommunications
WO1999066494A1 (en) * 1998-06-19 1999-12-23 Comsat Corporation Improved lost frame recovery techniques for parametric, lpc-based speech coding systems
WO2001033788A1 (en) * 1999-11-03 2001-05-10 Nokia Inc. System for lost packet recovery in voice over internet protocol based on time domain interpolation
US6510074B2 (en) * 2001-03-21 2003-01-21 Seiko Epson Corporation Ferroelectric memory having a BaTiO3 recording layer oriented in a <111> direction

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5918205A (en) * 1996-01-30 1999-06-29 Lsi Logic Corporation Audio decoder employing error concealment technique
FI963870A (fi) 1996-09-27 1998-03-28 Nokia Oy Ab Virheiden piilottaminen digitaalisessa audiovastaanottimessa
JP2001339368A (ja) 2000-03-22 2001-12-07 Toshiba Corp 誤り補償回路及び誤り補償機能を備えた復号装置
JP2002073091A (ja) 2000-08-31 2002-03-12 Matsushita Electric Ind Co Ltd 復号装置
JP4613412B2 (ja) 2000-10-27 2011-01-19 ソニー株式会社 受信装置及びディジタルデータ復号方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5907822A (en) * 1997-04-04 1999-05-25 Lincom Corporation Loss tolerant speech decoder for telecommunications
CN1200509A (zh) * 1997-05-23 1998-12-02 日本电气株式会社 以小存储器容量进行纠错处理的方法和装置
WO1999066494A1 (en) * 1998-06-19 1999-12-23 Comsat Corporation Improved lost frame recovery techniques for parametric, lpc-based speech coding systems
WO2001033788A1 (en) * 1999-11-03 2001-05-10 Nokia Inc. System for lost packet recovery in voice over internet protocol based on time domain interpolation
US6510074B2 (en) * 2001-03-21 2003-01-21 Seiko Epson Corporation Ferroelectric memory having a BaTiO3 recording layer oriented in a <111> direction

Also Published As

Publication number Publication date
EP1484746A1 (en) 2004-12-08
DE602004003862T2 (de) 2007-05-10
JP2004361731A (ja) 2004-12-24
US7225380B2 (en) 2007-05-29
US20040250195A1 (en) 2004-12-09
HK1073915A1 (en) 2005-10-21
CN1573929A (zh) 2005-02-02
EP1484746B1 (en) 2006-12-27
DE602004003862D1 (de) 2007-02-08

Similar Documents

Publication Publication Date Title
CN1326114C (zh) 音频解码器以及音频解码方法
JP3943127B2 (ja) Tdma無線システムにおけるソフト誤り補正
US6885988B2 (en) Bit error concealment methods for speech coding
US7936785B2 (en) Apparatus for generating and interpreting a data stream modified in accordance with the importance of the data
US6687670B2 (en) Error concealment in digital audio receiver
US6295319B1 (en) Decoding device
US7809018B2 (en) Apparatus for generating and interpreting a data stream with segments having specified entry points
JP4053424B2 (ja) ロバスト・チェックサム
JP4221537B2 (ja) 音声検出方法及び装置とその記録媒体
US20020065648A1 (en) Voice encoding apparatus and method therefor
CN1825969A (zh) 使数据处理系统同步于数据流的装置及方法
CN1774883B (zh) 介质编码数据的发送方法、设备和程序
US6959411B2 (en) Intelligent error checking method and mechanism
US20040098257A1 (en) Method and apparatus for removing noise from audio frame data
CN101098486A (zh) 利用封包取代机制以处理错误封包的接收系统和相关方法
KR101261528B1 (ko) 복호화된 오디오 신호의 오류 은폐 방법 및 장치
JPH0715353A (ja) 音声復号化装置
US7080006B1 (en) Method for decoding digital audio with error recognition
TW201230011A (en) Encoder and method for predictively encoding, decoder and method for decoding, system and method for predictively encoding and decoding and predictively encoded information signal
JP2002297193A (ja) デジタルオーディオデータ出力装置
CN1366659A (zh) 具有音调变化检测的纠错方法
US20020035468A1 (en) Audio transmission system having a pitch period estimator for bad frame handling
JP4067997B2 (ja) 情報受信装置及び情報受信方法及びプログラム
EP1979905A1 (en) Method and apparatus to reproduce data with an improved data error correction capability
JP2001339466A (ja) 可変レート符号受信装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1073915

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20070711

Termination date: 20170607