CN105453172A - 应用加权噪音的帧丢失的校正 - Google Patents

应用加权噪音的帧丢失的校正 Download PDF

Info

Publication number
CN105453172A
CN105453172A CN201480034261.3A CN201480034261A CN105453172A CN 105453172 A CN105453172 A CN 105453172A CN 201480034261 A CN201480034261 A CN 201480034261A CN 105453172 A CN105453172 A CN 105453172A
Authority
CN
China
Prior art keywords
signal
block
injection
blocks
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201480034261.3A
Other languages
English (en)
Other versions
CN105453172B (zh
Inventor
杰罗米·丹尼尔
朱利恩·福雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Orange SA
Original Assignee
France Telecom SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by France Telecom SA filed Critical France Telecom SA
Publication of CN105453172A publication Critical patent/CN105453172A/zh
Application granted granted Critical
Publication of CN105453172B publication Critical patent/CN105453172B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M13/00Coding, decoding or code conversion, for error detection or error correction; Coding theory basic assumptions; Coding bounds; Error probability evaluation methods; Channel models; Simulation or testing of codes

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Probability & Statistics with Applications (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Noise Elimination (AREA)
  • Detection And Prevention Of Errors In Transmission (AREA)
  • Error Detection And Correction (AREA)

Abstract

本发明涉及一种用于处理数字信号的方法,它适用于在解码信号的过程中执行以便取代在解码过程中所丢失的一系列样本,该方法包括如下步骤:生成用于取代所丢失系列信号的结构,该结构包括根据在一系列丢失样本之前在解码过程中接收到的有效样本所确定的频谱组分;生成包括接收的有效样本的对解码器有用的数字信号和由频谱组分所生成的信号之间的残差;以及从该残差中提取块,所述方法其中使用重叠相加方式将窗口加权块注入该结构中,该注入的块在时间上部分重叠。

Description

应用加权噪音的帧丢失的校正
本发明涉及信号校正,尤其是解码器在其所接收到的信号中存在着帧丢失时。
信号是一系列样本的形式,并将其分割为连续的帧,其中术语“帧”是指由至少一个样本所组成的信号片段(使得帧包含单个样本且可简单地对应于采用一系列样本形式的信号)。
本发明涉及数字信号处理的领域,尤其但并不仅限于编码/解码音频信号的领域。帧丢失常常发生于使用编码器和解码器的通信(实时发送或存储用于后续发送)由于信道状况(由于无线电问题、网络拥塞等)所中断时。
在这种情况下,解码器使用数据包丢失校正机制(或者“遮掩”)试图使用重建的信号来代替丢失的信号,期间使用了一些解码器的有效信息(例如,已经解码的信号或在之前的帧所接收的参数)。该技术允许在即使信道性能下降的情况下保持高质量的服务。
帧丢失校正技术常常高度依赖于所使用的编码类型。
在基于CELP("CodeExcitedLinearPrediction",“代码激励线性预测”)技术编码语音信号的情况下,帧丢失校正应用CELP模型。例如,当根据推荐的G722.2进行编码时,取代丢失帧(或“数据包”)的方案是通过衰减长期预测(LTP)增益来延长它的使用,同时延长每个ISF(“导谱频率”)参数的使用,通过将它们演变成它们的各自平均值。语音信号的音高周期(指定为“LTP-Lag”)可以同样重复。此外,解码器可提供特征化“创新”的参数的随机值(CELP编码中的激励)。
应当注意的是,应用此类适用于变换编码或适用于PCM(“脉冲编码调制”)编码的方法都需要在解码器中进行CELP编码,这就会引入了额外的复杂度。
在适用于波形编码器的ITU-T推荐的G.711中,帧丢失校正的处理(在该推荐的附录I中的例示)找到已经解码的语音信号中的音高周期并通过已解码的信号和被重复信号之间的重叠相加来重复最后的音高周期。这一处理“消除”了音频的人工痕迹,但需要在解码器中的额外时间(对应于重叠时长的时间)。
在变换编码中最常用于校正帧丢失的技术包括重复在所接收到的最后帧中解码的频谱。举例来说,在根据推荐的G.722.1编码的情况下,MLT(“调制重叠变换”)等效于具有50%重叠和正弦曲线窗口的修正离散余弦变换(MDCT),它确保了转换(在最后帧丢失和重复帧之间的)能充分足够的慢,以便消除由于帧的简单重复的人工痕迹。
有利的是,该技术并不需要任何额外的时间,因为它利用了MTL变换的时空混叠来创建与重建信号的重叠相加。这在资源方面是非常廉价的技术。
然而,它存在与在帧丢失之前的信号和重复的信号之间时空不一致有关的缺点。这会导致音频信号相位不连续,只要在两个帧之间的重叠很小(例如在使用“低延迟”MDCT窗口的情况下),它就会产生明显的音频人工痕迹。在低延迟MLT变换的情况下,具有短重叠的这一状况如图1B所示,可用于与图1A的通常情况作对比,在图1A所示的情况下,根据推荐G.722.1使用了长正弦窗口(然后提供长重叠周期ZRA并使用非常渐进的调制)。很显然,通过短延迟窗口的调制会产生由于短重叠区域ZRB所引起的听觉可察觉的相位偏移,如图1B所示。
在这种情况下,即使当执行将音高检测(在根据推荐G.711附录1编码的情况下)和由MDCT变换的窗口所产生的重叠相加的组合方案时,也不足以充分消除与相位偏移相关的音频人工痕迹。
另一帧丢失校正技术为根据从音高周期所提取到的信号结构来生成合成信号。音高周期被理解为是指基本周期,尤其是在有声语音信号的情况下(该信号的基本频率的倒数)。然而,该信号还可来自音乐信号,例如,所具有的整体音调与可对应于所述重复周期的基本频率和基本周期相关联。
然而,合成信号的物理属性并不匹配与原始信号(一些帧已经丢失)的物理属性是不相匹配的并且是令人不快的听觉缺陷的成因。这与原始信号相比会引入额外的误差。此外,正确接收的信号的能量和根据上述结构重建的信号的能量可能是明显不同的。这些不同导致“噪音猛增”的听感,其中噪音水平发生突发改变。例如,对于其中噪音信号等同于背景噪音的信号,听众就会听到该背景噪音的突然增大。
更一般而言,值得我们注意的是,在本领域的现有技术中,生成合成信号来填充取代丢失帧的帧就会引入一种周期性,在诸如音乐的复杂信号中,该周期性并不适合所要被替代的所有信号组分的范围。
例如,参考图1C,信号S0在窗口F1至F7中被重复7次。由于窗口的时间特性(窗口起始时间v1至v7以及窗口持续时间L0至L7)相同,就会引入周期性。
该系统性的和不适当的周期性导致各个丢失的帧会有“金属色”和人造的声音(因此令听众不快)。因此,必须改进现有的复制方法,包括但不限于使用重叠相加的解码内容。
本发明旨在改进该状况。
为此,本发明提出了一种处理数字信号的方法,在解码该信号的时候执行,以便在解码过程中取代所丢失的一系列样本,该方法包括以下步骤:
生成用于取代丢失系列的信号结构,该结构包括根据在解码过程中所接收到的并一系列丢失样本之前的有效样本所确定的频谱组分,
生成在包括解码器所有效接收到的有效样本的数字信号和根据频谱组分所生成的信号之间的残差,
从残差中提取块。
尤其是,使用重叠相加方法将窗口加权的块注入结构中,所注入的块在时间上至少部分重叠。
因此,块的注入有可能在没有察觉到信号能量丢失的情况下填充所丢失的帧。块的注入使得信号能量平滑,将频谱密度人工地恢复至恒定的水平。注入的块的集合对应于例如注入至取代信号中的噪音信号。尤其是,重叠相加使之有可能平滑在转换区中的噪音信号的能量转换。
此外,本发明提出了重新注入各种各样的提取块且没有任何明显的周期性,从而避免了与残差的简单重复相关的可听力察觉的“金属色”效果。尤其是,块的部分重叠可减少周期性效果,因为平滑了在两个连续块之间的噪音信号的转换。这种重叠使得更难区别出从一个阶段至另一阶段的转换,从而限制了周期性效果。
术语“取代信号的结构”可理解为是指对取代信号来说特定的特性集合,举例来说,诸如该信号的频谱组分、与这些频谱组分关联的幅值、与这些组分关联的相位等。
块重叠至少是部分重叠的,因为一个块可以是例如由两个相邻块以相互互补的方式完全重叠。在另一示例中,第一块被第二块的开头完全重叠。
在一个特定实施例中,取代信号的结构可包括根据在解码过程中所接收到的并在一系列丢失样本之前的有效样本所确定的频谱组分。因此,取代信号可简单地重新生成,尤其是对于时间周期不同于由该频谱组分所确定的时间周期的取代信号。
此外,残差可根据包括所接收到的有效样本的数字信号的一部分和根据上述频谱组分所生成的信号之间的残差来产生。于是,从该残差所提取的块可用于作为要重建的信号,其中将所丢失的能量组分注入到取代信号中。确实,注入的块的频谱组分正好对应于根据上述取代信号结构所生成信号中所丢失的频谱组分。因此,其中注入块的信号的频谱密度正好对应于帧已经被正确接收的先前信号的频谱密度。于是,该信号能量有利地被调和(在正确接收的信号部分和重建的部分之间)。
在另一实施例中,由于块是由所提取的块起始时间和块持续时间所定义的,该提取的块起始时间和块持续时间中的至少一个参数可在至少两个提取的块之间改变。
作为替换的,块是使用在至少两个注入块之间可变的至少一个参数来注入的,该可变参数为下面两个参数之一:
注入块的写入起始时间,以及,
在两个连续注入块之间的重叠率。
例如,不一致性被引入取代丢失样本的信号中。上文提到的参数的可变性消除了信号的周期性。如果这些参数改变,该信号就不再在恒定时间间隔后作相同的重复。因此可消除由于噪音信号的重复所引起金属色声音的效果。根据伪随机所预定规则或具有至少一个条件的伪随机所预定规则的确定可以是例如这些参数的此种可变性的原因。
在另一替代选择中,对于至少一个注入块来说,上述参数中的至少一个参数可伪随机地发生改变。
术语“伪随机”可理解为是指统计上接近完美随机性的一系列数字。借助用于生成它的算法过程以及所使用的资源,该系列并不被认为是完全随机的。条件还可与至少一个参数的伪随机确定一起考虑。例如,可固定所有确定参数的平均值。在这种情况下,举例来说,可区分出伪随机所导出的参数和具有创建预定间隔的平均值效果的参数。参数可变性(伪随机、具有条件的伪随机、预设规则等)的选择自身可满足诸如在解码过程中所丢失的样本数量、用户所期望的信号质量水平、用于重建计算可用的资源等条件。
因此,所生成的,上文提到的参数在噪音信号中引入不一致性致使难以察觉注入噪音的人工特性。伪随机生成的参数的引入意味着这将非常不同于耳朵对噪音信号中重复序列所习惯的任何现象。在不同加权窗口之不呈现任何逻辑关系。听众将因此不受噪音信号(例如,背景噪音)中的重复效果所干扰。
在另一实施例中,可提前固定上述用于提取块和/或注入块的参数。因此,可使用预先定义的块,这就不仅简化了计算并减少了处理时间同时还减少了用于这些计算的一个或多个处理器上的负荷。
在一个实施例中,应用于两个连续注入块的加权窗口的总和对于这两个块之间的重叠部分来说等于1。因此,取代信号的幅值是恒定的并且在两个块之间不存在转换人工痕迹而破坏信号。
在另一实施例中,应用于两个连续注入块的加权窗口的平方和对于这两个块之间的重叠部分来说等于1。因此,取代信号的能量是恒定的并且信号的能量也是恒定的而不会随着时间发生改变。
在一个实施例中,可改变至少一个注入块的符号。例如,可采用伪随机地、具有至少一个条件(例如,修改窗口的最大数量)的伪随机地或者通过预定规则(每个其他窗口、确定长度的所有窗口等)的方式来选择所要反转的块。因此,会将额外的不一致性添加至噪音信号。而且,不一致性的这一次添加发生在不增加用于生成取代信号的步骤的复杂度的情况下。噪音信号的逆变换不需要显著的计算资源并且这不仅可减少处理时间同时还可减小用于这些计算的一个或多个处理器上的负荷。
在一个变型实施例中,至少一个注入块进行时间反转。
术语“时间反转”可理解为是指公式b(t)=b(FF+DF-t)的应用,块块b取决于加权窗口[DF;FF]中的时间t。新的不一致性因此被引入取代信号。
在另一实施例中,首先将块注入中间噪音信号中,一旦所有块已经都被注入中间噪音信号,则随后将该中间噪音信号自身注入结构中。因此,要被注入取代信号的噪音信号在被注入之前就已经全部生成。这就使之有可能为中间声音信号在它被注入取代信号之前建立认证机制。
作为可替换的,块可以实时注入而无需等待生成整个中间噪音信号。“实时”注入则可理解为是指块的注入具有适合信号的时间演化的速度。在这种情况下,在由解码器所接收的信号和递送至听众耳朵的信号之间的时间延迟就会尽可能得小。例如,取代信号结构在解码中丢失的一系列样本的起始位置开始生成,然后块随着时间作为信号行进而注入,并在没有生成中间噪音信号的全部就随后注入取代信号中。
本发明还提供了一种计算机程序,它包括用于执行上述方法的指令。例如,图5至8的一个或多个可为这一计算机程序的一般算法。
本发明可由用于解码包括分割为连续帧的一系列样本的信号的设备来实现,该设备包括用于取代至少一个丢失信号帧的装置,包括装置用于:
生成用于取代丢失系列信号的结构,该结构包括根据在解码过程中所接收到的和在该一系列丢失样本之前的有效样本所确定的频谱组分,
生成包括接收到的有效样本的对解码器有效的数字信号和根据该频谱组分所生成的信号之间的残差,
从该残差中提取块,
将块注入该结构中,
其中注入装置在重叠相加方法中使用窗口加权块,该注入的块在时间上至少部分重叠。
这一设备可采取物理的形式,举例来说,典型的是在通信终端中的处理器和可能的工作存储器的形式。
通过阅读对本发明一些实施例的下述详细说明以及通过参阅附图,本发明的其它特征及优点将变得更加清晰,附图包括:
图1A图示说明了在MLT变换中与传统窗口的重叠;
图1B图示说明了与低延迟窗口的重叠,用于与图1A所示的说明内容作对比;
图1C示出了噪音信号的周期性重复;图2示出了可实施本发明的技术框架的示例;
图3示意性示出了包括用于实现根据本发明方法的装置的设备;
图4示出了本发明一般处理的示例;
图5示意性例示了本发明方法在一个实施例中的步骤;
图6示意性例示了本发明方法
图7示意地例示了另一实施例中本发明方法的步骤,
图8示意性例示了本发明方法在另一实施例中的步骤;
图9A示出了根据一个实施例所确定的本发明针对恒定覆盖率的连续加权窗口;图9B示出了根据一个实施例所确定的本发明针对恒定覆盖率的连续加权窗口;
图9C示出了根据一个实施例所确定的本发明针对恒定覆盖率的连续加权窗口;图10示出了根据一个实施例所确定的本发明针对伪随机覆盖率的连续加权窗口;以及,
图11示出了根据一个实施例所确定的本发明的连续加权窗口。
我们现在将参考图2描述用于实现本发明的有利的且可选的具体内容。这涉及用于接收信号的解码器所实现的处理。该解码器可为任意类型,所实现的处理总的来说一般不依赖于编码/解码的类型。在所描述的示例中,该处理被应用于所接收到的音频信号。然而,它可更一般地应用于通过时间窗口和变换进行分析的任意类型的信号,其中在使用重叠相加方法的合成过程中使用一个或多个取代帧来实现调谐。
术语“帧”可理解为是指至少一个样本的块。在大多数编解码器中,这些帧可包括多个样本。然而,在诸如PCM(脉冲编码调制)的某些编解码器中,例如根据推荐G.711,信号简单地包括一系列样本(本发明意义中的“帧”则仅仅只包括一个样本)。于是,本发明还可应用至此类编解码器。
举例来说,有效信号可包括在帧丢失之前所接收到的最后有效帧。还有可能使用在丢失帧之后所接收到的一个或多个后续有效帧(虽然这一实施例会导致解码的延迟)。由有效信号所使用的样本都可直接构成那些帧,并有可能在使用MDCT或MLT重叠的变换解码的情况下就是那些对应于变换的存储器和典型包括失真的帧。
在图2所示处理的第一步骤S1中,N个音频样本被连续存储于缓存中(诸如FIFO缓存)。这些样本对应于已经解码的样本并因此在处理帧丢失时是可以存取的。如果所要合成的第一样本是(一个或多个连续丢失帧的)时间索引为N的样本,则该音频缓存b(n)对应于时间索引0至N-1的N个先前样本。
在滤波步骤S2中,音频缓存b(n)然后被分离为两个频带,低频带BB和高频带BH,其中分离频率以下表述为Fc,例如Fc=4kHz。
步骤S3,应用于低频带,包括之后搜索环回点和使用频率Fc重新取样的对应于缓存b(n)中的基本周期的长度为P的片段。该基本周期对应于诸如话音语音信号的情况下的音高周期(该信号的基本频率的倒数)。然而,该信号还可源于例如音乐信号,它具有与基本频率和可对应于所述重复周期的基本周期相关联的全部音调。
在下文中,假设仅仅一个长度为P基本周期被用于信号的合成,但应当注意的是,该处理的原理同样可以很好地应用于扩展超过多个基本周期的片段。该结果在多个基本周期的情况下甚至是更好的,尤其是在FFT的精确度和获取的频谱组分的价值方面。
下一步骤S4包括将片段p(n)分解成多个正弦之和。
在图2所示的步骤S5中,可以选择正弦曲线组分,从而仅仅只保持最重要的组分。
下一步骤S6是正弦曲线合成。在一个示例性实施例中,它包括生成长度至少等于丢失帧(T)的大小的片段S(n)。在一个特定实施例中,生成等于2个帧的长度(诸如40ms),以便能够实现在合成的信号(具有丢失帧校正)和当下一有效帧被再次正确接收时在这一帧中解码的信号之间作出渐入渐出类型的音频混合(作为转换)。
为了预测帧的重新采样(样本的长度表示为LF),所要合成的样本数可提高至重新采样滤波器尺寸的一半(LF)。合成的信号可以所选择的正弦曲线组分之和来计算:
式中k为步骤S5所选择的K个组分的索引。有多种可能的传统方法可用于执行该正弦曲线的合成。
图2所示的步骤S7包括注入噪音以补偿由于遗漏低频带中某些频率组分的能量损失。
已经可参考图5描述了本发明一个简单的实施例。它包括在步骤P5中根据步骤S4所作出的正弦曲线分析来计算对应于步骤P1所提取的音高的信号块p(n)和在步骤P3所生成的合成信号s(n)之间的残差r(n)=p(n)-s(n),其中n∈[0;P-1].。
在步骤P6中,变换该残差,使得它的大小达到成为步骤P7中的信号b(n)。
然后,在步骤P8中,将信号b(n)注入步骤P2所生成的信号s(n)中,所持续时间N对应于所要取代信号的持续时间长度。
在步骤P9中,将该取代信号f(n)然后与有效信号混合。该混合可以是例如包括在重叠时间间隔RO内的重叠相加RECOV。
在一个实施例中,该残差信号可以复制一次或多次(取决于所要填充的时间部分)并在副本之间重叠相加。
在另一实施例中,多种变换可在每次复制时以伪随机的方式应用于残差信号的块:因此就有可能对信号的符号取反和/或执行时间反转。
我们现在将参考图4描述根据本发明一个实施例的用于生成所要注入取代信号的结构中的噪音信号的方法。
在步骤S601中,由步骤S6(也可参考图2)的正弦曲线合成来生成信号s(n),整个时间周期对应于在步骤S602所提取的块p(n)的时间周期。
通过从信号p(n)中减去SUB信号s(n)可获得残差r(n)。这在步骤S603中获得r(n),使得r(n)=p(n)-s(n)。
在步骤S604中,计数器变量k初始化为0并且使得信号b(n,k)初始化为b(n,0)=0。
在步骤S605中,从信号r(n)中提取块r(n,k)。在一个实施例中,该提取的时空特性(块的起始时间ik和块的持续时间Lk)可伪随机地确定。在另一实施例中,可为该提取强加多个条件。举例来说,块起始时间的值和持续时间的值之和必须小于对应于步骤S602所提取的块p(n)的持续时间的持续数值。
在步骤S606中,将提取的块r(n,k)的持续时间Lk发送至窗口配置步骤S608。
在步骤S607中,有效地设置加权窗口,以便在步骤S608中配置加权窗口。举例来说,提取存储在存储器中的加权窗口并将其传输至工作存储器。
在步骤S608中,选择和配置加权窗口,使之可在步骤MULT中与块r(n,k)相乘。该窗口的参数包括适合于块r(n,k)的持续时间Lk
块wk.r(n,k)然后重叠地与信号b(n,k-1)相加,它对应于已经相加的(k-1)个块,使得b(n,k)=wk.r(n,k)+b(n,k-1)。在一个实施例中,使用固定重叠率50%来执行该重叠相加。
测试T609验证已经生成的信号b(n,k)的长度不大于对应于所要取代信号的持续时间的数值N。
如果是这样,截短信号b(n,k),使得b(n,k)的持续时间等于对应于步骤S612所要取代信号的持续时间的数值N,所截短的值表示为TQ。在步骤S613中,要注入用于丢失帧的取代信号中的噪音信号Y被设置为TQ并在步骤S7中注入(在图2中也进行了引用)。
如果不是这样,将b(n,k)的数值存储在工作存储器MEM中(参考图3),以便接下来要与下一块r(n,k+1)相加。在步骤S611中,计数器变量k作递增并且将该过程返回步骤S605。
我们现在将参考图6描述根据本发明另一实施例用于生成所要注入取代信号的结构中的噪音信号的方法。
在该实施例中,将残差信号注入并连续迭代(编号为k)由残差r(n)所获得的重叠相加信号块。
在迭代k,所读取的块由块起始索引ik和块长度Lk确定,并且注入该残差部分至目标时间槽的方式通过确定可选变换Tk、写入索引jk(复制所要填充的时间槽中的块的起始)和重叠相加窗口wk(n)来定义。
我们将互补信号表示为将根据该残差生成的大小为N个样本的b(n)。用于生成该噪音信号的过程被描述如下。
初始化:
b(n)=0,0≤n<N
k=0
jα=0
迭代,直到jk+Lk=N:
1)选择ik和Lk,使得ik+Lk≤P和jk+Lk≤N,并且提取块P(k),
2)选择变换Tk,以便获得对应于r′k(n)=Tk(rk(ik+n))的S(k)。这一变换在下文描述为,
3)如果jk+Lk<N,为了准备下一迭代的重叠,选择jk+1≤jk+Lk(并且优选jk+1≥jk-1+Lk-1),以限制最多对两个块的同步重叠,例如S(k)和S(k+1)),以及提取块P(k+1),
4)基于与相邻块的任何重叠来确定加权窗口wk(n),
5)粘合由窗口wk(n)加权的r′k(n):b(jk+n)=b(jk+n)+r′k(n).wk(n),0≤n<Lk,以及,
6)递增k=k+1。
在该实施例中,描述的过程增加了写入索引jk。其它任意进展(减少、非单调等等)的选择同样是有可能的。
在另一实施例中,将Lk选择为与可用的保留P相比相对较大,以便能够在拷贝中有显著进展,并避免相对低频组分的失真。例如,参考图11,L0可选择为相当大,从而仅仅只应用一次重叠相加。
在另一实施例中,减小重叠区域的大小jk+Lk-jk+1,以便限制所需相加和相乘的数量。也可配置重叠率(对应于重叠区域的大小jk+Lk-jk+1)的调整,使得在质量(消除人工痕迹)和消耗的处理之间的比率可适应于解码器的计划使用。
在一个优选实施例中,参考图7,定义加权窗口,以便确保粘合的部分之间的平滑转换以及所获得的信号在信号能量方面的连续性。典型的是,计划在任意点重叠的两个块都具有最大值。让我们考虑块S(k)和S(k+1)之间的重叠。框ZP表示图所示画框区域ZM的放大。
在重叠区域中,也就是n∈[0;lk],其中ik=jk+Lk-jk+1,,所获得的信号为:
b(jk+1+n)=r′k(jk+1-jk+n),wk(jk+1-jk+n)+r′k+1(n),wk+1(n)
在一个实施例中,根据称作为“保留幅值”的标准,wk的末尾和w(k+1)的开头被组合:
wk(jk+1-jk+n)+wk+1(n)=1
wk(jk+1-jk+n)+wk+1(n)=1
因此,足以选择渐入渐出函数典型的是递增并由0和1作为边界,并由此对于n∈[0;lk]进行推导:
w k ( j k + 1 - j k + n ) = f o u t ( n ) = 1 - f l k ( n ) , 以及
w k + 1 ( n ) = f i n ( n ) = f l k ( n ) .
例如,该渐入渐出函数可以细化并定义为:
在另一实施例中,如图7所示函数fin(n)所表示的,渐入渐出函数可以正弦曲线化并定义为:
在另一实施例中,可选择称作为“能量保留”的准则,其中在不考虑相位一致的情况下可组合所粘合的信号,并被定义为:
(wk(jk+1-jk+n))2+(wk+1(n))2=1
根据上文提出的渐入渐出函数fk(n),则可推断出对于n∈[0;lk]:
w k ( j k + 1 - j k + n ) = f o u t ( n ) = 1 + f l k ( n ) , 以及
w k + 1 ( n ) = f i n ( n ) = f l k ( n ) .
各个加权窗口典型地包括三部分,从左至右为:
增加部分(与在前窗口的减少部分互补),
恒定和保留部分(增益为1),以及,
减少部分。
在一个实施例中,这些部分的至少一个对于至少一个加权窗口来说长度为0。举例来说,应用于第一注入块的加权窗口仅包括减少部分,只要该第一块完全与下一注入块的开头相重叠。
在另一实施例中,两个块的渐入渐出效果在它们的重叠区域上可同时管理。这涉及简单地拆散上述步骤并将它们进行不同的重新整合。
每次迭代则包括:
在不重叠并因此不加窗的情况下粘合的阶段(通过wk(n)=1取消相乘),和/或,
旧块的末尾和新块的开头的渐入渐出粘合的阶段,使用上文描述的渐入渐出函数fout(n)和fin(n)。
这将通过下述过程更具体地进行描述,被称作为“具有同时渐入渐出”。
初始化:
●b(n)=0,0≤n<N
●k=0
●f0=0
●l-1=0
●选择i0和L0,使得i0+L0≤P并且jo+L0≤N
●选择j1≥j0其中j1≤j0+L0,由此重叠的大小被推导为:
l0=j0+L0-j1
●选择变换T0和T1
●计算r′0=T0(r0(i0+n))
迭代,直到jk+Lk=N:
1)如果jk+1>jk+lk-1,在不重叠或不加窗的情况下粘合:
(jk+n)=r′k(n),lk-1≤n<Lk-lk
2)在重叠区域中渐入渐出地粘合:
b(jk+1+n)=r′k(Lk-lk+n).fout(n)+r′k十1(n).fin(n),0≤n<lk
3)如果需要另一迭代(尤其是如果jk+Lk<N),
a)选择jk+1≤jk+Lk其中jk+1≥jk-1+Lk-1(用于限制最多同时重叠至两个块)
b)选择ik+1和Lk+1,使得ik+1+Lk+1≤P并且jk+1+Lk+1≤N
c)选择变换Tk+1以便获得T′k+1(n)=Tk+1k+1(lk+1+π))(参见下文具体细节)
4)递增k=k|1
在一个变型实施例中,在新粘合块和在重叠部分中已经生成的信号之间应用渐入渐出的原则:
b(jk+1+n)=b(jk+1+n)fout(n)+r′k+1(n).fin(n)。
这一实施例的优点为在不增加计算复杂度的情况下可同时管理多于两个块的同时重叠。
因此,参数ik、jk、Lk和T中的至少一个从一次迭代到另一次迭代发生改变,以便避免周期性效果和相关听觉的人工痕迹(金属色,人工声音)。
可推导出一个粘合的块相对于另一个的索引ik,ik+1,jk和jk+1的延迟信息dk,k+1,在所要填充的时间槽中:
dk,k+1=(jk+1-ik+1)-(jk-ik)。
在一个优选但不限制的方式中,设置dk,k+1,使之从一次迭代k到下一次迭代k+1是不同的。
在一个实施例中,为了提升对于人工痕迹的消除,简单的或复杂的变换(上文表示为Tk)都可在迭代的过程中以可变的方式进行引入,提供了引入在注入的信号部分之间去相关性的这种形式的优点。
一种可能且简单的变换Tk包括改变信号的符号:r′k(n)=Tk(rk(ik+n))=σkrk(jk+n),其中σk=±1取决于迭代。
一种可能的变换,它可与先前的那个进行组合并且可伪随机地应用,包括时间反转,意味着以次序颠倒的方式来读取或写入残差:
r′k(n)=Tk(rk(ik+n))=σkrk(ik+Lk-1-n),0≤n<Lk
计算代价更复杂的其它变换也是有可能的,诸如移相滤波器。移相滤波器还称作为全通滤波器,对于所使用的整个频段提供相同的增益,但是组成该信号的频率的相对相位随着频率而发生改变。
虽然这里引入中间变量r′k(n)以便于描述,讨论中的变换Tk可作为特定模式来实现,以便在从r(n)读取和写至b(n)之间无需中间存储在缓存中的情况下读取数字样本。
在另一实施例中,注入的第k个信号部分可从已经生成的互补信号b(n),0≤n<jk-1+Lk-1中获取,并且不再仅仅只从残差r(n)中获取。
现在参考图8作为一个示例给出了一个变型实施例,提供了包括上述使用同时渐入渐出”的过程,它包含在数字音频解码器中。
初始化:
●j1=jn=0:在填充起始瞬间应用两个块的渐入渐出
●i0=P/2
●L0=P/2
在每次迭代中:
读取索引ik(其中k>0)指向计算的残差部分r(n)的起始:ik=0。
渐入渐出函数是正弦曲线:
f o u t ( n ) = 1 - f l k ( n )
f i n ( n ) = f l k ( n )
其中 f l k ( n ) = ( sin ( n + 0.5 l k . π 2 ) ) 2
存在两个块的同时重叠,因此:其中k>0
各个粘合的块的完整大小对应于两个接合的重叠区域之和:Lk=lk-1+lk,并且然后为在每次迭代中确定的重叠区域的大小lk,由此推导出Lk以及jk+1。这一参数lk被计算为与可用残差的大小的一半P/2成正比,使得:
其中k′=mod(k+cnt_bfi),其中cntbfi是丢失帧数量的计数器并且α=[10.80.60.9]。
变换Tk基本上包括符号的偶尔改变(没有时间反转),由系数表示。
上述方法的第一步如下列表格所示,参考图8。步骤INIT对应于该方法的初始化并且步骤ST(0)、ST(1)以及ST(2)对应于本发明的第一次递增。
一旦对于所期望的时间部分生成了互补信号b(n),则将它增加至通过正弦曲线合成s(n)所生成的信号,n>0。
在优选实施例中,该块的至少一个参数可伪随机地生成,以便将不一致性引入取代信号中并因此限制导致令人听觉不快的周期性现象。加权窗口的参数可为例如提取的块起始时间、块的持续时间(与上述参数Lk相似)以及两个连续块的重叠率。
在一个示例性的实施例中,参考图9A,示出了一旦所有块被注入时注入取代信号中的噪音信号,使用恒定的重叠率伪随机地确定用于写入注入块的起始时间。在图9A至11中,箭头指示伪随机所确定的参数。由于前两个参数(块起始时间和重叠率)是固定的,根据这前两个参数可推导出块的持续时间。其它条件也可开始起作用。例如,各个块的长度的总和可以固定,使得该块不超过对应于所要取代的信号持续时间的时长N。这一条件可以不同方式来表达,可通过考虑最后块的起始索引加上最后块的长度之和来设置,使得它比持续时间时长N小。实际上,在用于通过连续迭代生成噪音的方法中,这些条件可在每次重叠相加时进行检查。
例如,对于所要取代的丢失数据的10个帧,噪音信号通过20个加权窗口进行加权。
如上文所述,术语“伪随机”在算数和计算科学中用以指定统计意义上近似完美随机的一系列数字。借助用于生成它的算法过程以及使用的资源,该系列并不认为完全随机。当然,该参数可被伪随机地生成但仍符合某些条件,例如,与所要取代的信号的长度相关联的条件。
在另一实施例中,参考图9B,使用恒定的重叠率伪随机地确定块的持续时间时长(L0-L5)。由于前两个参数是固定的,用于写入块的起始索引可从这两个参数中导出。在这一示例中,最后块的参数都不是伪随机确定的,因此从所有块的重叠所获得的信号的持续时间并不大于对应于所要取代的信号的持续时间的时长N。
在另一实施例中,参考图9C,使用恒定的重叠率对于偶数窗口索引伪随机地确定块的持续时间和用于写入注入块的起始索引的数值。因此,j0、L0、j2、L2、j4和L4都伪随机地确定并且j1、L1、j3、L3、j5和L5可根据伪随机确定的参数和根据该重叠率推导出。一些条件可附加至这些参数,使得根据重叠所有块所获得的信号的持续时间并不超过对应于所要取代的信号的持续时间的时长N。
在另一实施例中,参考图10,所有参数都可以伪随机地确定。然而,一些条件可在这些参数上设置,使得根据重叠注入块所获得的信号的持续时间并不超过对应于所要取代的信号的持续时间的时长N。在这一配置中,更具体的说,两个连续加权窗口之和对于这两个窗口之间的重叠片段来说并不等于1以及两个连续加权窗口的平方和对于这两个窗口之间的重叠片段来说并不等于1。
接着,回到图2的步骤S8,可选择地继续通过处理步骤S3至S7所未涉及的高频带来构建取代信号,简单地通过在该高频带中重复该信号。
在步骤S9中,可通过在步骤S7中以其原始频率Fc重新采样低频带的信号和在步骤8中将它增加至高频带中重复的信号来合成信号。
在步骤S10中,执行重叠相加,它确保了在帧丢失之前的信号和所合成的信号之间以及在合成的信号和帧丢失之后的信号之间的连续性。
当然,本发明并不限于上文所述的实施例,它扩展至各种其它变型。
例如,在步骤S2中分离为高频带和低频带是可选的。在替换实施例中,来自缓存的信号(步骤S1)并不分离为两个子带并且在步骤S3至S10保持与上文所描述相同的那些部分。然而,低频中的频谱组分的处理有利地允许限制复杂度。
本发明可实现在会话式解码器中以应对帧丢失的情况。物理上,它可实现在用于解码的电路中,典型的是在电话终端中。为此,这一电路CIR可包括或连接着处理器PROC,如图3中所示,也可包括工作存储器MEM,使用根据本发明执行上述方法的计算机程序指令进行编程。举例来说,本发明可通过实时变换实现在解码器中。
更具体的说,上文已经描述了基于用于根据已知信号和合成信号之间的残差来生成噪音的方法的实施例。当然,还可能在频域中计算残差(将选择的频谱组分从原始频谱中消除)并通过逆变换来获取背景噪音。
上文已经描述了基于包括根据在解码过程中所接收到的和在一系列丢失样本之前的有效样本来确定频谱组分的结构的实施例。当然,这些频谱组分还可根据在该系列丢失样本之后所接收到的样本来确定。这些频谱组分还可根据在该系列丢失样本之前或之后所接收到的样本来确定。这些频谱组分也可为常量。

Claims (13)

1.一种处理数字信号的方法,适用于在解码所述信号期间执行以便取代在解码过程中所丢失的一系列样本,该方法包括以下步骤:
生成(S6)用于取代丢失系列信号的结构,所述结构包括根据在解码(S1)过程中所接收到的和在所述一系列丢失的样本之前的有效样本来确定频谱组分,
生成包括所接收的有效样本的对解码器可用的数字信号(S602)和根据所述频谱组分生成的信号(S601)之间的残差(S603),
从所述残差中提取(S605)块,
其中根据加权窗口(S608)使用重叠相加(ADD)方法将所述块注入所述结构中,所述注入的块在时间上至少部分重叠。
2.根据权利要求1所述的方法,其特征在于,所述块由提取的块起始时间(ik)和块持续时间(Lk)定义,所述提取的块起始时间和所述块持续时间中的至少一个参数在至少两个提取的块之间是可变的。
3.根据前述权利要求中任一项所述的方法,其特征在于,所述块由提取的块起始时间(ik)和块持续时间(Lk)定义,所述提取的块起始时间和所述块持续时间中的至少一个参数是针对至少一个提取的块进行伪随机确定的。
4.根据前述权利要求中任一项所述的方法,其特征在于,所述块使用在至少两个注入块之间至少一个可变的参数来注入,该可变参数为下面两个参数之一:
注入块(jk)的写入起始时间,以及,
在两个连续注入块之间的重叠率。
5.根据权利要求4所述的方法,其特征在于,所述参数针对至少一个注入块进行伪随机地改变。
6.根据前述权利要求中任一项所述的方法,其特征在于,所述应用于两个连续注入块的加权窗口之和对于这两个块之间的重叠部分(lk)来说等于1。
7.根据权利要求1至5中任一项所述的方法,其特征在于,所述应用于两个连续注入块的加权窗口之平方和对于这两个块之间的重叠部分(lk)来说等于1。
8.根据前述权利要求中任一项所述的方法,其特征在于,所述至少一个注入块的符号可改变。
9.根据前述权利要求中任一项所述的方法,其特征在于,所述至少一个注入块可时间反转。
10.根据前述权利要求中任一项所述的方法,其特征在于,所述块可首先注入中间噪音信号中,所述中间噪音信号随后被注入所述结构中。
11.根据权利要求1至9中任一项所述的方法,其特征在于,所述所述块可实时注入所述结构中。
12.一种计算机程序,它包括用于执行根据权利要求1至11中任一项所述方法的指令,当这些指令由处理器执行时。
13.一种用于解码包括分割为连续帧的一系列样本的信号的设备,该设备包括用于取代至少一个丢失信号帧的装置(MEM,PROC),包括装置用于:
生成(S6)用于取代该丢失系列的信号的结构,所述结构包括根据在解码(S1)过程中所接收到的和在所述一系列丢失的样本之前的有效样本来确定的频谱组分,
生成包括所接收到的有效样本的对解码器可用的数字信号(S602)和根据所述频谱组分所生成的信号(S601)之间的残差(S603),
从所述残差中提取(S605)块,
将所述块注入所述结构中,
其特征在于,所述注入装置在重叠相加方法中使用窗口加权块,所述注入的块在时间上至少部分重叠。
CN201480034261.3A 2013-04-18 2014-04-17 应用加权噪音的帧丢失的校正 Active CN105453172B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR1353551A FR3004876A1 (fr) 2013-04-18 2013-04-18 Correction de perte de trame par injection de bruit pondere.
FR1353551 2013-04-18
PCT/FR2014/050945 WO2014170617A1 (fr) 2013-04-18 2014-04-17 Correction de perte de trame par injection de bruit pondéré

Publications (2)

Publication Number Publication Date
CN105453172A true CN105453172A (zh) 2016-03-30
CN105453172B CN105453172B (zh) 2020-03-10

Family

ID=49322459

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201480034261.3A Active CN105453172B (zh) 2013-04-18 2014-04-17 应用加权噪音的帧丢失的校正

Country Status (12)

Country Link
US (1) US9761230B2 (zh)
EP (1) EP2987165B1 (zh)
JP (1) JP6469079B2 (zh)
KR (1) KR102184654B1 (zh)
CN (1) CN105453172B (zh)
BR (1) BR112015026153B1 (zh)
CA (1) CA2909401C (zh)
ES (1) ES2704901T3 (zh)
FR (1) FR3004876A1 (zh)
MX (1) MX350721B (zh)
RU (1) RU2647634C2 (zh)
WO (1) WO2014170617A1 (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9817728B2 (en) 2013-02-01 2017-11-14 Symbolic Io Corporation Fast system state cloning
US10133636B2 (en) 2013-03-12 2018-11-20 Formulus Black Corporation Data storage and retrieval mediation system and methods for using same
US9304703B1 (en) * 2015-04-15 2016-04-05 Symbolic Io Corporation Method and apparatus for dense hyper IO digital retention
JP6201043B2 (ja) 2013-06-21 2017-09-20 フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. エラー封じ込め中の切替音声符号化システムについての向上した信号フェードアウトのための装置及び方法
EP2980791A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Processor, method and computer program for processing an audio signal using truncated analysis or synthesis window overlap portions
US10061514B2 (en) 2015-04-15 2018-08-28 Formulus Black Corporation Method and apparatus for dense hyper IO digital retention
US10462063B2 (en) * 2016-01-22 2019-10-29 Samsung Electronics Co., Ltd. Method and apparatus for detecting packet
US10572186B2 (en) 2017-12-18 2020-02-25 Formulus Black Corporation Random access memory (RAM)-based computer systems, devices, and methods
US10725853B2 (en) 2019-01-02 2020-07-28 Formulus Black Corporation Systems and methods for memory failure prevention, management, and mitigation
MX2021009635A (es) * 2019-02-21 2021-09-08 Ericsson Telefon Ab L M Estimacion de la forma espectral a partir de coeficientes de mdct.
BR112021021928A2 (pt) * 2019-06-13 2021-12-21 Ericsson Telefon Ab L M Método para gerar um subquadro de áudio de ocultação, dispositivo decodificador, programa de computador, e, produto de programa de computador
US11244079B2 (en) 2019-09-18 2022-02-08 International Business Machines Corporation Data detection mitigation in printed circuit boards

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000060576A1 (en) * 1999-04-05 2000-10-12 Hughes Electronics Corporation Spectral phase modeling of the prototype waveform components for a frequency domain interpolative speech codec system
US20080294428A1 (en) * 2007-05-24 2008-11-27 Mark Raifel Packet loss concealment
CN101325631A (zh) * 2007-06-14 2008-12-17 华为技术有限公司 一种实现丢包隐藏的方法和装置
CN101573751A (zh) * 2006-10-20 2009-11-04 法国电信 过浊音度的衰减,特别对于信息缺失时解码器激励的产生
CN102158783A (zh) * 2010-01-29 2011-08-17 宝利通公司 通过变换插值进行音频分组丢失隐藏

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3343965B2 (ja) * 1992-10-31 2002-11-11 ソニー株式会社 音声符号化方法及び復号化方法
US6351730B2 (en) * 1998-03-30 2002-02-26 Lucent Technologies Inc. Low-complexity, low-delay, scalable and embedded speech and audio coding with adaptive frame loss concealment
US6952668B1 (en) * 1999-04-19 2005-10-04 At&T Corp. Method and apparatus for performing packet loss or frame erasure concealment
WO2000063885A1 (en) * 1999-04-19 2000-10-26 At & T Corp. Method and apparatus for performing packet loss or frame erasure concealment
US7089181B2 (en) * 2001-05-30 2006-08-08 Intel Corporation Enhancing the intelligibility of received speech in a noisy environment
FR2813722B1 (fr) * 2000-09-05 2003-01-24 France Telecom Procede et dispositif de dissimulation d'erreurs et systeme de transmission comportant un tel dispositif
US20070055498A1 (en) * 2000-11-15 2007-03-08 Kapilow David A Method and apparatus for performing packet loss or frame erasure concealment
US20030135374A1 (en) * 2002-01-16 2003-07-17 Hardwick John C. Speech synthesizer
GB2416467B (en) * 2003-05-14 2006-08-30 Oki Electric Ind Co Ltd Apparatus and method for concealing erased periodic signal data
US6987591B2 (en) * 2003-07-17 2006-01-17 Her Majesty The Queen In Right Of Canada, As Represented By The Minister Of Industry Through The Communications Research Centre Canada Volume hologram
US7596488B2 (en) * 2003-09-15 2009-09-29 Microsoft Corporation System and method for real-time jitter control and packet-loss concealment in an audio signal
JP4419748B2 (ja) * 2004-08-12 2010-02-24 沖電気工業株式会社 消失補償装置、消失補償方法、および消失補償プログラム
WO2006079348A1 (en) * 2005-01-31 2006-08-03 Sonorit Aps Method for generating concealment frames in communication system
US7831421B2 (en) * 2005-05-31 2010-11-09 Microsoft Corporation Robust decoder
KR100723409B1 (ko) * 2005-07-27 2007-05-30 삼성전자주식회사 프레임 소거 은닉장치 및 방법, 및 이를 이용한 음성복호화 방법 및 장치
US8255207B2 (en) * 2005-12-28 2012-08-28 Voiceage Corporation Method and device for efficient frame erasure concealment in speech codecs
CN1983909B (zh) * 2006-06-08 2010-07-28 华为技术有限公司 一种丢帧隐藏装置和方法
US8015000B2 (en) * 2006-08-03 2011-09-06 Broadcom Corporation Classification-based frame loss concealment for audio signals
EP2054876B1 (en) * 2006-08-15 2011-10-26 Broadcom Corporation Packet loss concealment for sub-band predictive coding based on extrapolation of full-band audio waveform
JP2008058667A (ja) * 2006-08-31 2008-03-13 Sony Corp 信号処理装置および方法、記録媒体、並びにプログラム
US8126707B2 (en) * 2007-04-05 2012-02-28 Texas Instruments Incorporated Method and system for speech compression
JP2008261904A (ja) * 2007-04-10 2008-10-30 Matsushita Electric Ind Co Ltd 符号化装置、復号化装置、符号化方法および復号化方法
RU2343563C1 (ru) * 2007-05-21 2009-01-10 Федеральное государственное унитарное предприятие "ПЕНЗЕНСКИЙ НАУЧНО-ИССЛЕДОВАТЕЛЬСКИЙ ЭЛЕКТРОТЕХНИЧЕСКИЙ ИНСТИТУТ" (ФГУП "ПНИЭИ") Способ передачи и приема закодированной речи
JP5618826B2 (ja) * 2007-06-14 2014-11-05 ヴォイスエイジ・コーポレーション Itu.t勧告g.711と相互運用可能なpcmコーデックにおいてフレーム消失を補償する装置および方法
US8185388B2 (en) * 2007-07-30 2012-05-22 Huawei Technologies Co., Ltd. Apparatus for improving packet loss, frame erasure, or jitter concealment
KR101228165B1 (ko) * 2008-06-13 2013-01-30 노키아 코포레이션 프레임 에러 은폐 방법, 장치 및 컴퓨터 판독가능한 저장 매체
US8428938B2 (en) * 2009-06-04 2013-04-23 Qualcomm Incorporated Systems and methods for reconstructing an erased speech frame
EP2362385A1 (en) * 2010-02-26 2011-08-31 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Watermark signal provision and watermark embedding
US9263049B2 (en) * 2010-10-25 2016-02-16 Polycom, Inc. Artifact reduction in packet loss concealment
US9177570B2 (en) * 2011-04-15 2015-11-03 St-Ericsson Sa Time scaling of audio frames to adapt audio processing to communications network timing

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000060576A1 (en) * 1999-04-05 2000-10-12 Hughes Electronics Corporation Spectral phase modeling of the prototype waveform components for a frequency domain interpolative speech codec system
CN101573751A (zh) * 2006-10-20 2009-11-04 法国电信 过浊音度的衰减,特别对于信息缺失时解码器激励的产生
US20080294428A1 (en) * 2007-05-24 2008-11-27 Mark Raifel Packet loss concealment
CN101325631A (zh) * 2007-06-14 2008-12-17 华为技术有限公司 一种实现丢包隐藏的方法和装置
CN102158783A (zh) * 2010-01-29 2011-08-17 宝利通公司 通过变换插值进行音频分组丢失隐藏

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JONAS LINDBLOM ET AL: "Packet Loss Concealment Based on Sinusoidal Extrapolation", 《2002 IEEE INTERNATIONAL CONFERENCE ON ACOUSICS,SPEECHS,AND SIGNAL PROCESSING》 *

Also Published As

Publication number Publication date
MX2015014650A (es) 2016-06-23
WO2014170617A1 (fr) 2014-10-23
FR3004876A1 (fr) 2014-10-24
RU2647634C2 (ru) 2018-03-16
CA2909401C (fr) 2023-05-23
KR102184654B1 (ko) 2020-11-30
US9761230B2 (en) 2017-09-12
BR112015026153B1 (pt) 2022-02-22
CN105453172B (zh) 2020-03-10
JP6469079B2 (ja) 2019-02-13
MX350721B (es) 2017-09-14
US20160055852A1 (en) 2016-02-25
CA2909401A1 (fr) 2014-10-23
BR112015026153A2 (pt) 2017-07-25
EP2987165B1 (fr) 2018-10-10
KR20160002920A (ko) 2016-01-08
EP2987165A1 (fr) 2016-02-24
ES2704901T3 (es) 2019-03-20
RU2015149384A (ru) 2017-05-24
JP2016515725A (ja) 2016-05-30

Similar Documents

Publication Publication Date Title
CN105453172A (zh) 应用加权噪音的帧丢失的校正
RU2680195C1 (ru) Аудиокодер для кодирования многоканального сигнала и аудиодекодер для декодирования кодированного аудиосигнала
TWI571864B (zh) 用以使用修改時域激勵信號之錯誤隱藏提供解碼音訊資訊之音訊解碼器及方法
CN102834862B (zh) 用于包括通用音频和语音帧的音频信号的编码器
JP5978227B2 (ja) 予測符号化と変換符号化を繰り返す低遅延音響符号化
JP6306175B2 (ja) 時間ドメイン励振信号に基づくエラーコンシールメントを用いて、復号化されたオーディオ情報を提供するオーディオデコーダおよび復号化されたオーディオ情報を提供する方法
CN102834863B (zh) 用于包括通用音频和语音帧的音频信号的解码器
US9728195B2 (en) Noise signal processing method, noise signal generation method, encoder, decoder, and encoding and decoding system
JP2017526950A (ja) 低遅延符号化/復号のための補間による音声信号のリサンプリング
RU2604994C2 (ru) Оптимизированное по задержке преобразование наложения, взвешивающие окна кодирования/декодирования
CN101573751B (zh) 一种合成用连续的采样块表示的数字音频信号的方法和装置
US20180182408A1 (en) Determining a budget for lpd/fd transition frame encoding
KR20170003596A (ko) 음성 정보를 갖는 개선된 프레임 손실 보정
CN106463122A (zh) 突发帧错误处理
US9620139B2 (en) Adaptive linear predictive coding/decoding
Gournay et al. Performance analysis of a decoder-based time scaling algorithm for variable jitter buffering of speech over packet networks
WO2021077023A1 (en) Methods and system for waveform coding of audio signals with a generative model

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant