CN111566731B - 编码和解码音频信号 - Google Patents

编码和解码音频信号 Download PDF

Info

Publication number
CN111566731B
CN111566731B CN201880085705.4A CN201880085705A CN111566731B CN 111566731 B CN111566731 B CN 111566731B CN 201880085705 A CN201880085705 A CN 201880085705A CN 111566731 B CN111566731 B CN 111566731B
Authority
CN
China
Prior art keywords
frame
information
pitch
control data
data item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201880085705.4A
Other languages
English (en)
Other versions
CN111566731A (zh
Inventor
伊曼纽尔·拉维利
阿德里安·托马塞克
曼福莱特·卢次克
康拉德·本多尔夫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Publication of CN111566731A publication Critical patent/CN111566731A/zh
Application granted granted Critical
Publication of CN111566731B publication Critical patent/CN111566731B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

提供用于对音频信号信息进行编码/解码的方法和装置以及非暂时性存储单元。编码器侧可以确定信号帧是否对长期后滤波(LTPF)和/或封包丢失隐藏(PLC)有用,并且可以根据确定结果对信息进行编码。解码器侧可以根据从编码器获得的信息应用LTPF和/或PLC。

Description

编码和解码音频信号
1.技术领域
示例涉及用于编码/解码音频信号信息的方法和装置。
2.现有技术
现有技术包括以下公开内容:
[1]3GPP TS 26.445;Codec for Enhanced Voice Services(EVS);Detailedalgorithmic description.
[2]ISO/IEC 23008-3:2015;Information technology--High efficiencycoding and media delivery in heterogeneous environments--Part 3:3D audio.
[3]Ravelli等,"Apparatus and method for processing an audio signalusing a harmonic post-filter.",美国专利申请号2017/0140769 A1,2017年5月18日.
[4]Markovic等,"Harmonicity-dependent controlling of a harmonic filtertool.",美国专利申请号2017/0133029 A1,2017年5月11日.
[5]ITU-T G.718:Frame error robust narrow-band and wideband embeddedvariable bit-rate coding of speech and audio from 8-32kbit/s.
[6]ITU-T G.711附录I:A high quality low-complexity algorithm forpacket loss concealment with G.711.
[7]3GPP TS 26.447:Codec for Enhanced Voice Services(EVS);Errorconcealment of lost packets.
基于变换的音频编解码器通常在处理谐波音频信号时引入间谐波噪声,特别是在低延迟和低比特率的情况下。通常,这种间谐波噪声被感知为是非常令人讨厌的伪声,当主观评估高音调音频材料时明显降低基于变换的音频编解码器的性能。
长期后滤波(Long Term Post Filtering,LTPF)是用于基于变换的音频编码的工具,其帮助减少这种间谐波噪声。它依赖于在变换解码之后的应用于时域信号的后滤波器。该后滤波器基本上是具有由诸如音高信息(例如,音高滞后)的参数控制的梳状频率响应的无限脉冲响应(infinite impulse response,IIR)滤波器。
为了获得更好的鲁棒性,例如在增益为非零时,在编码器侧估计后滤波器参数(音高滞后以及在某些示例中每帧的增益),并在比特流中进行编码。在示例中,增益为零的情况以一个比特发信号通知,并且对应于非主动后滤波器,在信号不包含谐波部分时使用。
首先在3GPP EVS标准[1]中介绍LTPF,且随后将LTPF整合到MPEG-H 3D音频标准[2]中。相应的专利是[3]和[4]。
在现有技术中,在解码器处的其他功能可以利用音高信息。示例是封包丢失隐藏(packet loss concealment,PLC)或错误隐藏。在音频编解码器中使用PLC以在从编码器到解码器的传输期间隐藏丢失或损坏的封包。在现有技术中,可以在解码器侧执行PLC,并在变换域或时域中外推解码信号。理想情况下,隐藏信号应该是无伪声的,并且应具有与缺失信号相同的频谱特性。该目标在待隐藏的信号包含谐波结构时特别难以实现。
在这种情况下,基于音高的PLC技术可能会产生可接受的结果。这些方法假定信号是局部稳定的,并通过使用外推音高周期合成周期信号而恢复丢失信号。这些技术可以用于基于CELP的语音编码中(例如参见ITU-T G.718[5])。它们也可以用于PCM编码(ITU-TG.711[6])。最近,它们被应用于基于MDCT的音频编码,最好的示例是在3GPP EVS标准中的TCX时域隐藏(TCX TD-PLC)[7]。
音高信息(可能是音高滞后)是在基于音高的PLC中使用的主要参数。该参数可以在编码器侧估计并被编码到比特流中。在这种情况下,最后良好帧的音高滞后被用来隐藏当前丢失帧(像在[5]和[7]中)。如果比特流中没有音高滞后,则可以通过对解码信号运行音高检测算法以在解码器侧估计(像在例如[6]中)。
在3GPP EVS标准(参见[1]和[7])中,LTPF和基于音高的PLC均被用于相同的基于MDCT的TCX音频编解码器中。两种工具共享相同的音高滞后参数。LTPF编码器估计并编码音高滞后参数。当增益不为零时,该音高滞后存在于比特流中。在解码器侧,解码器使用该信息对解码信号进行滤波。在封包丢失的情况下,当最后良好帧的LTPF增益高于某个阈值且满足其他条件时(详见[7]),使用基于音高的PLC。在这种情况下,音高滞后存在在比特流中,并且可以由PLC模块直接使用。
现有技术的比特流语法由以下给出:
Figure BDA0002573131420000021
但是,可能会出现一些问题。
音高滞后参数并非针对每个帧被编码在比特流中。当在帧中增益为零(LTPF非活跃)时,比特流中不存在音高滞后信息。当信号的谐波内容不占主导地位和/或不够稳定时,可能会发生这种情况。
因此,通过基于增益区分音高滞后的编码,其他功能(例如,PLC)不能获得音高滞后。
例如,在信号略有谐波、对LTPF不够但对于使用基于音高的PLC却足够的情况下存在帧。在那种情况下,音高滞后参数即使不存在于比特流中但在解码器侧也将会被需要。
一种解决方案是在解码器侧添加第二音高检测器,但这将增加大量的复杂性,这对于以低功率设备为目标的音频编解码器来说是个问题。
3.本发明
根据示例,提供了一种用于解码与被划分为帧序列的音频信号相关联的音频信号信息的装置,包括:
比特流读取器,被配置为读取经编码的音频信号信息,经编码的音频信号信息具有:
针对第一帧和第二帧的音频信号的编码表示;
针对第一帧的第一音高信息和具有第一值的第一控制数据项;以及
针对第二帧的第二音高信息和具有不同于第一值的第二值的第二控制数据项;以及
控制器,被配置为控制长期后滤波器LTPF以:
当第二控制数据项具有第二值时,使用第二音高信息对第二帧中的音频信号的解码表示进行滤波;以及
当第一控制数据项具有第一值时,针对第一帧去激活LTPF。
因此,装置有可能在适合于LTPF的帧和不适合于LTPF的帧之间进行区分,同时即使LTPF将会不合适也使用帧用于错误隐藏。例如,在较高调和性的情况下,装置可以利用音高信息(例如,音高滞后)用于LTPF。在较低调和性的情况下,装置可以避免将音高信息用于LTPF,但是可以利用音高信息用于其他功能(例如,隐藏)。
根据示例,比特流读取器被配置为读取第三帧,第三帧具有指示第一音高信息和/或第二音高信息的存在或不存在的控制数据项。
根据示例,第三帧具有缺少第一音高信息、第一控制数据项、第二音高信息和第二控制数据项的格式。
根据示例,第三控制数据项以一个单一比特编码,单一比特具有区别第三帧与第一帧和第二帧的值。
根据示例,在经编码的音频信号信息中,针对第一帧,为第一控制数据项保留一个单一比特,并且为第一音高信息保留固定数据字段。
根据示例,在经编码的音频信号信息中,针对第二帧,为第二控制数据项保留一个单一比特,并且为第二音高信息保留固定数据字段。
根据示例,第一控制数据项和第二控制数据项被编码在经编码的音频信号信息中的相同部分或数据字段中。
根据示例,经编码的音频信号信息包括对第三控制数据项进行编码的一个第一信令比特;以及在第三控制数据项(18e)的值指示存在第一音高信息(16b)和/或第二音高信息(17b)的情况下,第二信令比特对第一控制数据项(16c)和第二控制数据项(17c)进行编码。
根据示例,装置还可以包括隐藏单元,被配置为使用第一音高信息和/或第二音高信息以隐藏后续未适当解码的音频帧。
根据示例,隐藏单元可以被配置为:在确定无效帧的解码的情况下,检查是否存储了与先前正确解码的帧有关的音高信息,以便利用使用存储的音高信息获得的帧隐藏无效解码的帧。
因此,每当音频信号符合隐藏时以及不仅在音频信号符合LTPF时,都可能获得良好的隐藏。当获得音高信息时,不需要估计音高滞后,因此降低了复杂性。
根据示例,提供了一种用于对音频信号进行编码的装置,包括:
音高估计器,被配置为获得与音频信号的音高相关联的音高信息;
信号分析器,被配置为获得与音频信号的调和性相关的调和性信息;以及
比特流形成器,被配置为准备对帧进行编码的经编码的音频信号信息,以便在比特流中包括:
针对第一帧、第二帧和第三帧的音频信号的编码表示;
针对第一帧的第一音高信息和具有第一值的第一控制数据项;
针对第二帧的第二音高信息和具有不同于第一值的第二值的第二控制数据项;以及
针对第一帧、第二帧和第三帧的第三控制数据项,
其中第一值和第二值取决于与调和性信息相关联的第二准则,以及
第一值指示针对第一帧中的音频信号的调和性的第二准则未满足,以及
第二值指示针对第二帧中的音频信号的调和性的第二准则满足,
其中第二准则至少包括当至少一个第二调和性测量大于至少一个第二阈值时满足的条件,
将第三控制数据项以一个单一比特编码,单一比特具有区别第三帧与第一帧和第二帧的值,第三帧在第一准则未满足的情况下被编码,以及第一帧和第二帧在第一准则满足的情况下被编码,其中第一准则至少包括当至少一个第一调和性测量大于至少一个第一阈值时满足的条件,
其中在比特流中,针对第一帧,为第一控制数据项保留一个单一比特,并且为第一音高信息保留固定数据字段,
其中在比特流中,针对第二帧,为第二控制数据项保留一个单一比特,并且为第二音高信息保留固定数据字段,以及
其中在比特流中,针对第三帧,不为固定数据字段和/或第一控制项和第二控制项保留比特。
因此,解码器有可能在对LTPF有用的帧、仅对PLC有用的帧以及对LTPF和PLC两者均无用的帧之间进行区分。
根据示例,第二准则包括当先前帧的至少一个调和性测量大于至少一个第二阈值时满足的附加条件。
根据示例,信号分析器被配置为,确定信号在两个连续帧之间是否稳定作为第二准则的条件。
因此,解码器有可能在例如稳定信号和不稳定信号之间进行区分。在不稳定信号的情况下,解码器可以避免将音高信息用于LTPF,但是可以利用音高信息用于其他功能(例如,隐藏)。
根据示例,第一调和性测量和第二调和性测量以不同的采样率获得。
根据示例,音高信息包括音高滞后信息或其经处理版本。
根据示例,调和性信息包括自相关值和/或归一化自相关值和/或其经处理版本中的至少一个。
根据示例,提供了一种用于解码与被划分为帧序列的音频信号相关联的音频信号信息的方法,包括:
读取经编码的音频信号信息,经编码的音频信号信息包括:
针对第一帧和第二帧的音频信号的编码表示;
针对第一帧的第一音高信息和具有第一值的第一控制数据项(16c);
针对第二帧的第二音高信息和具有不同于第一值的第二值的第二控制数据项;
在确定第一控制数据项具有第一值时,使用第一音高信息用于长期后滤波器LTPF,以及
在确定第二控制数据项(17c)的第二值时,去激活LTPF。
根据示例,方法还包括,在确定第一控制数据项或第二控制数据项具有第一值或第二值时,使用第一音高信息或第二音高信息用于错误隐藏功能。
根据示例,提供了一种编码与被划分为帧的信号相关联的音频信号信息的方法,包括:
从音频信号获得测量;
验证第二准则的满足,第二准则基于测量并且包括当至少一个第二调和性测量大于第二阈值时满足的至少一个条件;
形成具有帧的经编码的音频信号信息,包括:
针对第一帧和第二帧的音频信号的编码表示以及第三帧;
针对第一帧的第一音高信息和具有第一值的第一控制数据项以及第三控制数据项;
针对第二帧的第二音高信息和具有不同于第一值的第二值的第二控制数据项以及第三控制数据项,
其中第一值和第二值取决于第二准则,并且第一值指示基于第一帧中的音频信号的调和性的第二准则未满足,以及第二值指示基于第二帧中的音频信号的调和性的第二准则满足,
第三控制数据项是具有区别第三帧与第一帧和第二帧的值的一个单一比特,第一帧和第二帧与满足第一准则相关联,以便当第三控制数据项指示基于当至少一个第一调和性测量高于至少一个第一阈值时满足的至少一个条件的第一准则未满足时识别第三帧,
其中形成经编码的音频信号信息,使得针对第一帧,为第一控制数据项保留一个单一比特,并且为第一音高信息保留固定数据字段,以及
其中形成经编码的音频信号信息,使得针对第二帧,为第二控制数据项保留一个单一比特,并且为第二音高信息保留固定数据字段,以及
其中形成经编码的音频信号信息,使得针对第三帧,不为固定数据字段保留比特,并且不为第一控制数据项和第二控制数据项保留比特。
根据示例,提供了一种方法,包括:
对音频信号进行编码;
将经编码的音频信号信息发送到解码器或存储经编码的音频信号信息;
对音频信号信息进行解码。
根据示例,提供了一种用于对音频信号进行编码/解码的方法,包括:
在编码器处,对音频信号进行编码并且得出调和性信息和/或音高信息;
在编码器处,确定调和性信息和/或音高信息是否至少适合于LTPF和/或错误隐藏功能;
将比特流从解码器发送到编码器和/或在存储器中存储比特流,比特流包括音频信号的数字表示和与调和性相关联的信息,并且发信号通知音高信息是否适于LTPF和/或错误隐藏;
在解码器处,对音频信号的数字表示进行解码,并且根据来自编码器的信令将音高信息用于LTPF和/或错误隐藏。
在示例中,编码器是根据以上或以下示例中的任何示例,和/或解码器是根据以上或以下示例中的任何示例,和/或编码是根据以上或以下示例,和/或解码根据以上或以下示例。
根据示例,提供了一种存储指令的非暂时性存储单元,指令在由处理器执行时执行如以上或以下方法。
因此,编码器可以确定信号帧是否对长期后滤波(LTPF)和/或封包丢失隐藏(PLC)是有用的,并且可以根据确定结果编码信息。解码器可以根据从编码器获得的信息应用LTPF和/或PLC。
4.附图说明
图1和图2示出用于对音频信号信息进行编码的装置。
图3-图5示出可以由图1或图2的装置编码的经编码的信号信息的格式。
图6a和图6b示出用于对音频信号信息进行编码的方法。
图7示出用于对音频信号信息进行解码的装置。
图8a和图8b示出经编码的音频信号信息的格式。
图9示出用于对音频信号信息进行解码的装置。
图10示出用于对音频信号信息进行解码的方法。
图11和图12示出用于对音频信号信息进行编码/解码的系统。
图13示出编码/解码的方法。
5.编码器侧
图1示出装置10。装置10可以用于对信号进行编码(编码器)。例如,装置10可以对音频信号11进行编码以生成经编码的音频信号信息(例如,信息12,12',12”',用以下使用的术语)。
装置10可以包括组件(未示出)以获得(例如,通过对原始音频信号进行采样)音频信号的数字表示以便以数字形式对其进行处理。音频信号可以被划分为帧(例如,对应于时间间隔序列)或子帧(其可以是帧的细分)。例如,每个间隔可以是20ms长(子帧可以是10ms长)。每个帧可以包括时域(TD)中的有限数量的样本(例如,针对20ms帧为1024或2048个样本)。在示例中,可以将帧或其副本或经处理版本(部分或全部地)转换为频域(FD)表示。经编码的音频信号信息可以是例如代码激励线性预测(CELP)或代数CELP(ACELP)类型和/或TCX类型的。在示例中,装置10可以包括降采样器(未示出)以减少每帧的样本数量。在示例中,装置10可以包括重采样器(其可以是升采样器、低通滤波器和升采样器类型的)。
在示例中,装置10可以将经编码的音频信号信息提供给通信单元。通信单元可以包括硬件(例如,至少具有天线),以与其他设备通信(例如,将经编码的音频信号信息发送到其他设备)。通信单元可以根据特定协议执行通信。该通信可以是无线的。可以执行蓝牙标准下的传输。在示例中,装置10可以包括(或将经编码的音频信号信息存储到)存储设备。
装置10可以包括音高估计器13,音高估计器13可以在帧中(例如,在时间间隔期间)针对音频信号11估计并提供输出音高信息13a。音高信息13a可以包括音高滞后或其经处理版本。例如,可以通过计算音频信号11的自相关获得音高信息13a。音高信息13a可以表示在二进制数据字段中(在此用“ltpf_pitch_lag”表示),二进制数据字段在示例中可以用包括在7-11之间的比特数(例如9个比特)表示。
装置10可以包括信号分析器14,信号分析器14可以针对帧(例如,在时间间隔期间)分析音频信号11。信号分析器14可以例如获得与音频信号11相关联的调和性信息14a。调和性信息可以包括或基于例如相关信息(例如,自相关信息)、增益信息(例如,后滤波器增益信息)、周期性信息、可预测性信息等中的至少一个或组合。例如,这些值中的至少一个可以被归一化或处理。
在示例中,调和性信息14a可以包括可以以一个比特(在此用“ltpf_active”表示)编码的信息。调和性信息14a可以携带信号的调和性的信息。调和性信息14a可以基于信号满足的准则(“第二准则”)。调和性信息14a可以例如在第二准则的满足(其可以与较高周期性和/或较高可预测性和/或信号的稳定性相关联)和第二准则的不满足(其可以与较低调和性和/或较低可预测性和/或信号不稳定性相关联)之间进行区分。较低调和性通常与噪声相关联。调和性信息14a中的数据中的至少一个可以基于第二准则的验证和/或由第二准则建立的(一个或多个)条件中的至少一个的验证。例如,第二准则可以包括至少一个调和性有关测量(例如,自相关、调和性、增益、可预测性、周期性等中的一个或组合,其也可以被归一化和/或处理)或其经处理版本与至少一个阈值的比较。例如,阈值可以是“第二阈值”(多于一个阈值是可能的)。在一些示例中,第二准则包括对先前帧(例如,紧接当前帧之前的帧)上条件的验证。在一些示例中,调和性信息14a可以以一个比特编码。在一些其他示例中,以比特序列(例如,一个比特用于“ltpf_active”和例如一些其他比特用于对增益信息或其他调和性信息进行编码)编码。
如选择器26所指示的,输出调和性信息21a可以控制音高信息13a的实际编码。例如,在极低调和性的情况下,可以防止音高信息13a被编码在比特流中。
如选择器25所指示的,输出调和性信息21a的值(“ltpf_pitch_lag_present”)可以控制调和性信息14a的实际编码。因此,在检测到极低调和性(例如,基于与第二准则不同的准则)的情况下,可以防止调和性信息14a被编码在比特流中。
装置10可以包括比特流形成器15。比特流形成器15可以提供音频信号11(例如,在时间间隔中)的经编码的音频信号信息(以12,12'或12”表示)。特别地,比特流形成器15可以形成至少包含音频信号11的数字版本、音高信息13a(例如,“ltpf_pitch_lag”)和调和性信息14a(例如“ltpf_active”)的比特流。经编码的音频信号信息可以被提供给解码器。经编码的音频信号信息可以是比特流,其可以例如被存储和/或发送到接收器(接收器又可以解码由装置10编码的音频信息)。
经编码的音频信号信息中的音高信息13a可以在解码器侧用于长期后滤波器(LTPF)。LTPF可以在TD中操作。在示例中,当调和性信息14a指示较高调和性时,LTPF将在解码器侧被激活(例如,使用音高信息13a)。当调和性信息14a指示较低(中间)调和性(或无论如何不适合于LTPF的调和性)时,LTPF将在解码器侧被去激活或减弱(例如,不使用音高信息13a,即使音高信息仍然被编码在比特流中)。当调和性信息14a包括字段“ltpf_active”(其可以以一个比特编码)时,ltpf_active=0可以意味着“在解码器处不使用LTPF”,而ltpf_active=1可以意味着“在解码器处使用LTPF”)。例如,ltpf_active=0可以与低于与ltpf_active=1相关联的调和性的调和性相关联,例如在将调和性测量与第二阈值进行比较之后。虽然根据本文中的惯例,ltpf_active=0指的是低于与ltpf_active=1相关联的调和性的调和性,但是可以提供不同的惯例(例如,基于二进制值的不同含义)。附加或替代的准则和/或条件可以用于确定ltpf_active的值。例如,为了声明ltpf_active=1,还可以检查信号是否稳定(例如,通过还检查与先前帧相关联的调和性测量)。
除了LTPF功能外,音高信息13a还可以用来例如在解码器处执行封包丢失隐藏(PLC)操作。在示例中,无论调和性信息14a为何(例如,即使ltpf_active=0),将仍然实施PLC。因此,在示例中,虽然音高信息13a将始终由解码器的PLC功能使用,但是相同的音高信息13a仅将仅在由调和性信息14a设置的条件下由解码器处的LTPF功能使用。
还有可能验证“第一准则”(其可以不同于第二准则)的满足或未满足,例如用于确定调和性信息13a的传输对于解码器是否是有价值的信息。
在示例中,当信号分析器14检测到调和性(例如,特定地,调和性测量)未满足第一准则(例如,第一准则在调和性,并且特别是调和性测量,高于特定的“第一阈值”的条件上被满足),则编码无音高信息13a的选择可以由装置10采取。在那种情况下,例如,解码器将既不针对LTPF功能也不针对PLC功能使用编码帧中的数据(至少在一些示例中,解码器将不基于音高信息使用隐藏策略,而是使用不同的隐藏技术,诸如基于解码器的估计、FD隐藏技术或其他技术)。
在一些示例中,可以选择以上讨论的第一阈值和第二阈值,使得:
-第一阈值和/或第一准则在适合于PLC的音频信号和不适合于PLC的音频信号之间进行区分;以及
-第二阈值和/或第二准则在适合于LTPF的音频信号和不适合于LTPF的音频信号之间进行区分。
在示例中,可以选择第一阈值和第二阈值,使得假定与第一阈值和第二阈值比较的调和性测量具有介于0和1之间的值(其中0意味着:非谐波信号;而1意味着:完美谐波信号),则第一阈值的值低于第二阈值的值(例如,与第一阈值相关联的调和性低于与第二阈值相关联的调和性)。
在针对第二准则设置的条件当中,还有可能检查音频信号11的时间演进是否使得可能将信号用于LTPF。例如,可以检查针对先前帧是否已经达到相似(或相同)的阈值。在示例中,可以将调和性测量(或其经处理版本)的组合(或加权组合)与一个或多个阈值进行比较。可以使用不同的调和性测量(例如,以不同的采样率获得)。
图5示出可以由装置10准备的经编码的音频信号信息的帧12”(或帧的一部分)的示例。帧12”可以在第一帧16”、第二帧17”和第三帧18”之间被区别。在音频信号11的时间演进中,第一帧16”可以由第二帧17”和/或第三帧替换,反之亦然,例如,根据特定时间间隔中音频信号的特征(例如,调和性)(例如,基于信号满足或不满足第一准则和/或第二准则、和/或调和性大于或小于第一阈值和/或第二阈值)。
第一帧16”可以是与被保持适合于PLC、但不一定适合于LTPF(满足第一准则、未满足第二准则)的调和性相关联的帧。例如,调和性测量可能低于第二阈值或不满足其他条件(例如,信号在先前帧和当前帧之间尚未稳定)。第一帧16”可以包括音频信号11的编码表示16a。第一帧16”可以包括第一音高信息16b(例如,“ltpf_pitch_lag”)。第一音高信息16b可以编码或基于例如由音高估计器13获得的音高信息13a。第一帧16”可以包括第一控制数据项16c(例如,根据本惯例,值为“0”的“ltpf_active”),第一控制数据项16c可以包括或基于例如由信号分析器14获得的调和性信息14a。该第一帧16”可以(在字段16a中)包含足够的信息,以用于在解码器侧对音频信号进行解码,并且此外在必要的情况下,使用音高信息13a(编码在16b中)用于PLC。在示例中,由于调和性不满足第二准则(例如,信号的低调和性测量和/或两个连续帧之间的不稳定信号),解码器将不会使用音高信息13a用于LTPF。
第二帧17”可以是与保持足够用于LTPF的调和性(例如,其满足第二准则,例如根据测量,调和性高于第二阈值和/或先前帧也大于至少特定阈值)相关联的帧。第二帧17”可以包括音频信号11的编码表示17a。第二帧17”可以包括第二音高信息17b(例如,“ltpf_pitch_lag”)。第二音高信息17b可以编码或基于例如由音高估计器13获得的音高信息13a。第二帧17”可以包括第二控制数据项17c(例如,根据本惯例,值为“1”的“ltpf_active”),第二控制数据项17c可以包括或基于例如由信号分析器14获得的调和性信息14a。该第二帧17”可以包含足够的信息,使得在解码器侧,音频信号11被解码,并且此外在必要的情况下,音高信息17b(来自音高估计器的输出13a)可以用于PLC。进一步地,由于满足第二准则,特别是基于信号的高调和性(如根据本惯例由ltpf_active=1指示的)的第二准则,解码器将使用音高信息17b(13a)用于LTPF。
在示例中,第一帧16”和第二帧17”由控制数据项16c和17c的值(例如,由“ltpf_active”的二进制值)识别。
在示例中,当被编码在比特流中时,针对第一音高信息和第二音高信息(16b,17b)以及针对第一控制数据项和第二控制数据项(16c,17c),第一帧和第二帧呈现格式,使得:
-为对第一控制数据项16c和第二控制数据项17c进行编码保留一个单一比特;以及
-为第一音高信息16b和第二音高信息17b中的每个音高信息保留固定数据字段。
因此,可以通过帧中的特定(例如,固定)部分中比特的值将一个单一第一数据项16c与一个单一第二数据项17c区别开。同样,第一音高信息和第二音高信息也可以在保留位置(例如,固定位置)中插入一个固定比特数。
在示例(例如,图4和/或图5中所示)中,调和性信息14a在第二准则的满足和不满足之间不进行简单区分,例如在较高调和性和较低调和性之间不进行简单区别。在一些情况下,调和性信息可以包括附加调和性信息(诸如增益信息,例如后滤波器增益)、和/或相关信息(自相关,归一化相关)、和/或其经处理版本。在一些情况下,此处所引用的增益或其他调和性信息可以以1到4个比特(例如2个比特)编码,并且可以指的是由信号分析器14获得的后滤波器增益。
在其中附加调和性信息被编码的示例中,通过识别ltpf_active=1(例如,第二帧17'或17”),解码器可以了解第二帧17'或17”的后续字段对附加调和性信息17d进行编码。相反,通过识别ltpf_active=0(例如,第一帧16'或16”),解码器可以了解没有附加调和性信息字段17d被编码在帧17'或17”中。
在示例(例如,图5)中,第三帧18”可以被编码在比特流中。第三帧18”可以被定义,以便具有缺少音高信息和调和性信息的格式。其数据结构不提供用于编码数据16b、16c、17b、17c的比特。然而,第三帧18”仍可以包括音频信号的编码表示18a和/或对编码器有用的其他控制数据。
在示例中,通过第三控制数据18e(“ltpf_pitch_lag_present”)将第三帧18”与第一帧和第二帧区别开,第三控制数据18e可以在第三帧中具有不同于第一帧16”和第二帧17”中的值的值。例如,第三控制数据项18e可以是“0”用于识别第三帧18”,以及可以是“1”用于识别第一帧16”和第二帧17”。
在示例中,当信息信号对LTPF和PLC将不会是有用的时(例如,由于非常低的调和性,举例来说,例如当噪声占上风时),可以编码第三帧18”。因此,控制数据项18e(“ltpf_pitch_lag_present”)可以是“0”,以发信号通知解码器,在音高滞后中将不会有有价值的信息,并因此对其进行编码是没有意义的。这可以是基于第一准则的验证过程的结果。
根据本惯例,当第三控制数据项18e为“0”时,调和性测量可以低于与低调和性相关联的第一阈值(这可以是用于验证满足第一准则的一种技术)。
图3和图4示出第一帧16,16'和第二帧17,17'的示例,对于第一帧16,16'和第二帧17,17'没有提供第三控制项18e(第二帧17'对附加调和性信息进行编码,附加调和性信息在一些示例中可以是可选的)。在一些示例中,不使用这些帧。然而,值得注意的是,在一些示例中,除了缺少第三控制项18e之外,帧16,16',17,17'具有与图5的帧16”和17”相同的字段。
图2示出装置10'的示例,装置10'可以是装置10的特定实现方式。因此,在此不重复装置10的特性(信号的特征、代码、传输/存储特征、蓝牙实现方式等)。装置10'可以准备音频信号11的经编码的音频信号信息(例如,帧12,12',12”)。装置10'可以包括音高估计器13、信号分析器14和比特流形成器15,其可以如(或非常相似于)装置10的那些。装置10'还可以包括如装置10的用于采样、重采样和滤波的组件。
音高估计器13可以输出音高信息13a(例如,音高滞后,诸如“ltpf_pitch_lag”)。
信号分析器14可以输出调和性信息24c(14a),调和性信息在一些示例中可以由多个值形成(例如,由多重值组成的矢量)。信号分析器14可以包括调和性测量器24,调和性测量器可以输出调和性测量24a。调和性测量24a可以包括归一化或非归一化的相关/自相关信息、增益(例如,后滤波增益)信息、周期性信息、可预测性信息、与信号的稳定性和/或演进有关的信息、其经处理版本等。附图标记24a可以指多个值,然而其至少一些(或全部),可以是相同或可以是不同的,和/或相同值的经处理版本,和/或以不同的采样率获得。
在示例中,调和性测量24a可以包括第一调和性测量24a'(其可以以例如6.4KHz的第一采样率测量)和第二调和性测量24a”(其可以以例如12.8KHz的第二采样率测量)。在其他示例中,可以使用相同的测量。
在框21处,验证调和性测量24a(例如,第一调和性测量24a')是否满足第一准则,例如它们是否超过第一阈值,第一阈值可以被存储在存储器元件23中。
例如,可以将至少一个调和性测量24a(例如,第一调和性测量24a')与第一阈值进行比较。第一阈值可以例如存储在存储器元件23(例如,非暂时性存储器元件)中。框21(其可以被看作是第一调和性测量24a'与第一阈值的比较器)可以输出调和性信息21a,其指示音频信号11的调和性是否超过第一阈值(并且特别是,第一调和性测量24a'是否超过第一阈值)。
在示例中,ltpf_pitch_present可以是例如,
Figure BDA0002573131420000131
其中,x6.4是采样率为6.4kHz的音频信号,N6.4是当前帧的长度,且T6.4是针对当前帧由音高估计器获得的音高滞后,以及normcorr(x,L,T)是长度为L的信号x在滞后T处的归一化相关,
Figure BDA0002573131420000132
在一些示例中,可以使用其他采样率或其他相关。在示例中,第一阈值可以是0.6。实际上已经注意到,对于超过0.6的调和性测量,可以可靠地执行PLC。然而即使对于略高于0.6的值,并不总是保证可以可靠地执行LTPF。
因此,来自框21的输出21a可以是二进制值(例如“ltpf_pitch_lag_present”),如果调和性超过第一阈值(例如,如果第一调和性测量24a'超过第一阈值),则该二进制值可以为“1”,以及如果调和性低于第一阈值,则该二进制值可以为“0”。调和性信息21a(例如“ltpf_pitch_lag_present”)可以控制输出13a的实际编码:如果(例如,如上所示的第一测量24a')调和性低于第一阈值(ltpf_pitch_lag_present=0),或者如果不满足该第一准则,则没有音高信息13a被编码;如果调和性超过第一阈值(ltpf_pitch_lag_present=1)或满足第一准则,则实际上对音高信息进行编码。输出21a(“ltpf_pitch_lag_present”)可以被编码。因此,输出21a可以被编码为第三控制项18e(例如,当输出21a为“0”时用于对第三帧18”编码,而当输出21a为“1”时用于对第二帧或第三帧编码)。
调和性测量器24可以可选地输出调和性测量24b,其可以是例如增益信息(例如,“ltpf_gain”),该增益信息可以由比特流形成器15编码在经编码的音频信号信息12,12',12”中。可以提供其他参数。在一些示例中,可以在解码器侧使用其他调和性信息24b用于LTPF。
如框22所示,可以基于至少一个调和性测量24a(例如,第二调和性测量24a”)执行对第二准则的满足的验证。
第二准则所基于的一个条件可以是至少一个调和性测量24a(例如,第二调和性测量24a”)与第二阈值的比较。第二阈值可以例如存储在存储器元件23中(例如,与存储第一阈值的存储器位置不同的存储器位置)。
第二准则也可以基于其他条件(例如,同时满足两个不同条件)。一个附加条件可以例如是基于先前帧。例如,可以将至少一个调和性测量24a(例如,第二调和性测量24a”)与阈值进行比较。
因此,框22可以输出调和性信息22a,其可以基于至少一个条件或多个条件(例如,当前帧上的一个条件和先前帧上的一个条件)。
框22可以输出(例如,作为第二准则的验证过程的结果)调和性信息22a,调和性信息22a指示音频信号11(针对当前帧和/或针对先前帧)的调和性是否超过第二阈值(以及例如第二调和性测量24a”是否超过第二阈值)。调和性信息22a可以是二进制值(例如,“ltpf_active”),如果调和性超过第二阈值(例如,第二调和性测量24a”超过第二阈值),则二进制值可以为“1”,以及如果(当前帧和/或先前帧的)调和性低于第二阈值(例如,第二调和性测量24a”低于第二阈值),则二进制值可以为“0”。
调和性信息22a(例如,“ltpf_active”)可以控制(在提供的情况下)值24b的实际编码(在实际提供了值24b的示例中):如果调和性(例如,第二调和性测量24a”)不满足第二准则(例如,如果调和性低于第二阈值以及ltpf_active=0),则没有其他调和性信息24b(例如,没有附加调和性信息)被编码;如果调和性(例如,第二调和性测量24a”)满足第二准则(例如,调和性超过第二阈值并且ltpf_active=1),则附加调和性信息24b实际上被编码。
值得注意地,第二准则可以基于不同和/或附加条件。例如,可以验证信号在时间上是否稳定(例如,归一化相关在两个连续帧中是否具有相似特性)。
(一个或多个)第二阈值可以被定义,以便与谐波内容相关联,该谐波内容超过与第一阈值相关联的谐波内容。在示例中,可以选择第一阈值和第二阈值,使得假设与第一阈值和第二阈值比较的调和性测量具有介于0和1之间的值(其中0意味着:非谐波信号;而1意味着:完美谐波信号),则第一阈值的值低于第二阈值的值(例如,与第一阈值相关联的调和性低于与第二阈值相关联的调和性)。
值22a(例如,“ltpf_active”)可以被编码,例如,以成为第一控制数据项16c或第二控制数据项17c(图4)。值22a的实际编码可以由值21a(例如,使用选择器25)控制:例如,仅在ltpf_pitch_lag_present=1的情况下,可以编码“ltpf_active”,而当ltpf_pitch_lag_present=0时不提供“ltpf_active”给比特流形成器15(以对第三帧18”编码)。在那种情况下,没有必要提供音高信息给解码器:调和性可能非常低,以至于解码器将既不针对PLC或也不针对LTPF使用音高信息。同样在那种情况下,诸如“ltpf_active”的调和性信息也可能是无用的:因为没有将音高信息提供给解码器,不存在解码器将尝试执行LTPF的可能性。
在此提供用于获得ltpf_active值(16c,17c,22a)的示例。可以执行其他替代策略。
首先可以如下地计算归一化相关:
Figure BDA0002573131420000151
其中pitch_int是音高滞后的整数部分,pitch_fr是音高滞后的小数部分,以及
Figure BDA0002573131420000152
其中x12.8是在(例如)12.8kHz下的重采样输入信号,以及hi是FIR低通滤波器的脉冲响应,由下式给出:
Figure BDA0002573131420000161
其中tab_ltpf_interp_x12k8例如从以下值中选择:
Figure BDA0002573131420000162
然后可以根据以下程序获得LTPF激活比特(“ltpf_active”):
Figure BDA0002573131420000163
其中mem_ltpf_active是先前帧中ltpf_active的值(如果先前帧中ltpf_pitch_present=0则mem_ltpf_active为0),mem_nc是先前帧中nc的值(如果先前帧中ltpf_pitch_present=0则mem_nc为0),pit=pitch_int+pitch_fr/4以及mem_pit是先前帧中pit的值(如果先前帧中ltpf_pitch_present=0则mem_pit为0)。该程序例如在图6b中示出(也参见下文)。
重要的是要注意,图2的图示纯粹是指示性的。代替框21、22和选择器,可以使用不同的硬件和/或软件单元。在示例中,诸如框21和22的组件、音高估计器、信号分析器和/或调和性测量器和/或比特流形成器中的至少两个可以被实现为一个单一元件。
基于执行的测量,有可能区别以下状态:
-第三状态,其中:
ο不满足第一准则;
ο框21和框22的输出21a和22a均为“0”;
ο输出13a(例如“ltpf_pitch_lag”)、24b(例如,附加调和性信息,可选的)和22a(例如,“ltpf_active”)未被编码;
ο仅输出21a(例如,“ltpf_pitch_lag_present”)的值“0”被编码;
ο第三帧18”被编码有第三控制项“0”(例如,来自“ltpf_pitch_lag_present”)和音频信号的信号表示,但没有对音高信息和/或第一控制项和第二控制项进行编码的任何比特;
ο因此,解码器将了解没有音高信息和调和性信息可以用于LTPF和PLC(例如,由于极低调和性);
-第一状态,其中:
ο满足第一准则且未满足第二准则;
ο框21的输出21a为“1”(例如由于满足第一准则,例如由于第一测量24a'大于第一阈值),而框22的输出22a为“0”(例如由于不满足第二准则,例如由于对于当前帧或先前帧第二测量24a”低于第二阈值);
ο输出21a(例如,“ltpf_pitch_lag_present”)的值“1”被编码在18e中;
ο输出13a(例如,“ltpf_pitch_lag”)被编码在16b中;
ο输出22a(例如“ltpf_active”)的值“0”被编码在16c中;
ο可选择的输出24b(例如,附加调和性信息)未被编码;
ο第一帧16”被编码有等于“1”的第三控制数据项(例如,来自“ltpf_pitch_lag_present”18e)、对等于“0”的第一控制数据项(例如,来自“ltpf_active”16c)进行编码的一个单一比特、以及对第一音高信息16b(例如,取自“ltpf_pitch_lag”)进行编码的固定量的比特(例如,在固定位置中);
ο因此,解码器将了解将利用音高信息13a(例如,被编码在16b中的音高滞后)仅用于PLC,而没有音高信息或调和性信息将被用于LTPF。
-第二状态,其中:
ο满足第一准则和第二准则;
ο框21和框22的输出21a和22a均为“1”(例如,由于满足第一准则,例如由于第一测量24a'大于第二阈值,并且第二测量24a”满足第二准则,例如在当前帧或先前帧中,第二测量24a”大于第二阈值);
ο输出21a(例如ltpf_pitch_lag_present)的值“1”被编码;
ο输出13a(例如“ltpf_pitch_lag”)被编码;
ο输出22a(例如“ltpf_active”)的值“1”被编码;
ο第二帧17被编码有等于1的第三控制数据项(例如,来自18e中的“ltpf_pitch_lag_present”)、对等于“1”的第二控制数据项(例如,来自17c中的“ltpf_active”)进行编码的一个单一比特、17b中的对第二音高信息(例如,取自“ltpf_pitch_lag”)进行编码的固定量的比特(例如,在固定位置中)、以及可选地17d中的附加信息(例如,附加调和性信息);
ο因此,解码器将利用音高信息13a(例如音高滞后)用于PLC,并且还将利用音高信息和(在某些情况下)附加调和性信息用于LTPF(例如,假设调和性足够用于LTPF和PLC两者)。
因此,参考图5,示出可以由例如装置10'中的比特流形成器15提供的帧12”。特别地,可以如下地编码:
-在第三状态的情况下,第三帧18”具有以下字段:
ο具有值“0”的第三控制数据项18e(例如,从21a获得的“ltpf_pitch_lag_present”);以及
ο音频信号11的编码表示18a;
-在第一状态的情况下,第一帧16”具有以下字段:
ο具有值“1”的第三控制数据项18e(例如,从21a获得的“ltpf_pitch_lag_present”);
ο音频信号11的编码表示16a;
ο在第一帧16”的固定数据字段中的第一音高信息16b(例如,从13a获得的“ltpf_pitch_lag”);
ο具有值“0”的第一控制数据项16c(例如,从22a获得的“ltpf_active”);以及
-在第二状态的情况下,第二帧17”具有以下字段:
ο具有值“1”的第三控制数据项18e(例如,从21a获得的“ltpf_pitch_lag_present”);
ο音频信号11的编码表示17a;
ο第二帧17”中的第二音高信息17b(例如,从13a获得的“ltpf_pitch_lag”);
ο值为“1”的第二控制数据项17c(例如,从22a获得的“ltpf_active”);以及
ο在提供的情况下,(可选的)调和性信息17d(例如,从24b获得)。
在示例中,第三帧18”不呈现用于第一音高信息或第二音高信息的固定数据字段,以及不呈现对第一控制数据项和第二控制数据项进行编码的任何比特。
从第三控制数据项18e以及第一控制数据项16c和第二控制数据项17c,解码器将了解是否:
-在第三状态的情况下,解码器将不会使用音高信息和调和性信息实现LTPF和PLC,
-在第一状态的情况下,解码器将不会实现LTPF、但将会仅使用音高信息实现PLC,以及
-在第二状态的情况下,解码器将使用音高信息执行LTPF以及使用音高信息执行PLC两者。
从图5可以看出,在一些示例中:
-第三帧18可以具有缺少第一音高信息16b、第一控制数据项16c、第二音高信息17b和第二控制数据项17c的格式;
-第三控制数据项18e可以以一个单一比特编码,单一比特具有将第三帧18”与第一帧16”和第二帧17”区别开的值;和/或
-在经编码的音频信号信息中,针对第一帧16”,可以为第一控制数据项16c保留一个单一比特,并且可以为第一音高信息保留固定数据字段16b;和/或
-在经编码的音频信号信息中,针对第二帧17”,可以为第二控制数据项17c保留一个单一比特,并且可以为第二音高信息保留固定数据字段17b;和/或
-第一控制数据项16c和第二控制数据项17c可以被在经编码的音频信号信息中的相同部分或数据字段中;和/或
-经编码的音频信号信息可以包括对第三控制数据项18e进行编码的一个第一信令比特;和/或在第三控制数据项的值指示存在第一音高信息和/或第二音高信息的情况下,包括对第一控制数据项和第二控制数据项进行编码的第二信令比特。
图6a示出根据示例的方法60。方法可以例如使用装置10或10'来操作。例如,方法可以如上所解释的对帧16”,17”,18”进行编码。
方法60可以包括步骤S60,步骤S60例如使用信号分析器14以及特别是使用调和性测量器24从音频信号11(以特定的时间间隔)获得(一个或多个)调和性测量(例如24a)。调和性测量(调和性信息)可以包括或基于例如应用于音频信号11(例如,针对时间间隔)的相关信息(例如,自相关信息)、增益信息(例如,后滤波器增益信息)、周期性信息、可预测性信息中的至少一个或组合。在示例中,可以获得第一调和性测量24a'(例如,以6.4KHz)以及可以获得第二调和性测量24a”(例如,以12.8KHz)。在不同的示例中,可以使用相同的调和性测量。
方法可以包括例如使用框21验证第一准则的满足。例如,可以执行调和性测量与第一阈值的比较。如果在S61处第一准则未满足(例如,调和性低于第一阈值,例如当第一测量24a'低于第一阈值时),则在S62处可以编码第三帧18”,第三帧18”指示第三控制数据项18e中的“0”值(例如“ltpf_pitch_lag_present”),例如,不保留用于编码诸如音高信息和附加调和性信息的值的任何比特。因此,解码器将不会基于由编码器提供的音高信息和调和性信息执行LTPF或PLC。
如果在S61处确定满足第一准则(例如,调和性大于第一阈值并且因此不处于较低的调和性水平),则在步骤S63和S65处检查是否满足第二准则。第二准则可以包括例如当前帧的调和性测量与至少一个阈值的比较。
例如,在步骤S63处,将调和性(例如,第二调和性测量24a”)与第二阈值(在一些示例中,将第二阈值设置为使得其与大于与第一阈值相关联的调和性内容的调和性内容相关联,例如,在调和性测量介于与完全非谐波信号相关联的0值和与完美谐波信号相关联的1值之间的假设下)进行比较。
如果在S63处确定调和性不大于第二阈值(例如,在某些情况下可能与调和性的中间水平相关联),则在S64处编码第一帧16,16',16”。第一帧(指示中间调和性)可以被编码为包括可以是“1”的第三控制数据项18e(例如“ltpf_pitch_lag_present”)、可以是“0”的第一控制数据项16b(例如“ltpf_active”)以及诸如音高滞后(“ltpf_pitch_lag”)的第一音高信息16b的值。因此,在接收到第一帧16,16',16”时,解码器将使用第一音高信息16b用于PLC,但将不会使用第一音高信息16b用于LTPF。
值得注意地,在S61和S62处执行的比较可以基于不同的调和性测量,调和性测量可以例如以不同的采样率获得。
如果在S63处确定调和性大于第二阈值(例如,第二调和性测量超过第二阈值),则在步骤S65处,可以检查音频信号是否为瞬态信号,例如,音频信号11的时间结构是否已经改变(或者先前帧上的另一个条件是否满足)。例如,可以检查先前帧是否也满足超过第二阈值的条件。如果先前帧上的条件也成立(非瞬态),则认为该信号是稳定的且可以触发步骤S66。否则,该方法继续进行到步骤S64以编码第一帧16,16'或16”(参见上文)。
在步骤S66处,可以对第二帧17,17',17”进行编码。第二帧17”可以包括值为“1”的第三控制数据项18e(例如“ltpf_pitch_lag_present”)和可以为“1”的第二控制数据项17c(例如“ltpf_active”)。因此,可以对音高信息17b(诸如“pitch_lag”以及可选地还有附加调和性信息17d)进行编码。解码器将了解可以使用利用音高信息的PLC和利用音高信息的LTPF(以及可选地还有调和性信息)两者。
在S67处,可以将编码帧发送到解码器(例如,经由蓝牙连接),存储在存储器上或以其他方式使用。
在步骤S63和S64处,归一化相关测量nc(第二测量24a”)可以是以12.8KHz获得的归一化相关测量nc(也参见上文和下文)。在步骤S61中,归一化相关(第一测量24a')可以是以6.4KHz的归一化相关(也参见上文和下文)。
图6b示出也可以使用的方法60b。图6b明确示出可以用于确定ltpf_active的值的第二准则600的示例。
可以看出,步骤S60、S61和S62与方法60一样并因此不再重复。
在步骤S610处,可以检查是否:
-针对先前帧,已经获得了ltpf_active=0(由mem_ltpf_active=0表示);以及
-针对先前帧,归一化相关测量nc(24a”)大于第三阈值(例如,介于0.92和0.96之间的值,诸如0.94);以及
-针对当前帧,归一化相关测量nc(24a”)大于第三阈值(例如,在0.92和0.96之间的值,诸如0.94)。
如果结果是肯定的,则在S614处将ltpf_active设置为1,并且触发步骤S66(对第二帧17,17',17”进行编码)和S67(发送或存储编码帧)。
如果在步骤S610处没有验证设置的条件,则在步骤S611处可以检查:
-针对先前帧,已经获得ltpf_active=1(由mem_ltpf_active=1表示);
-针对当前帧,归一化相关测量nc(24a”)大于第四阈值(例如,介于0.85和0.95之间的值,例如0.9)。
如果结果是肯定的,则在S614处将ltpf_active设置为1,并且触发步骤S66(对第二帧17,17',17'进行编码)和S67(发送或存储编码帧)。
如果在步骤S611处未验证设置的条件,则可以在步骤S612处检查是否:
-针对先前帧,已经获得ltpf_active=0(由mem_ltpf_active=0表示);
-针对当前帧,当前音高和先前音高之间的距离小于第五阈值(例如,介于1.8和2.2之间的值,诸如2);以及
-当前帧的归一化相关测量nc(24a”)与先前帧的归一化相关测量mem_nc之间的差大于第六阈值(例如,介于-0.15至-0.05之间的值,诸如-0.1);以及
-针对当前帧,归一化相关测量nc(24a”)大于第七阈值(例如,介于0.82和0.86之间的值,诸如0.84)。
(在步骤S610-S612的一些示例中,可以避免以上条件中的一些条件,同时可以保持一些条件)。
如果在S612处的检查结果为肯定的,则在S614处将ltpf_active设置为1,并触发步骤S66(对第二帧17,17',17'进行编码)和S67(发送或存储编码帧)。
否则,如果在S610-S612处的检查都没有被验证,则在S613处针对当前帧将ltpf_active设置为0,并且触发步骤S64,以便对第一帧16,16',16”进行编码。
在步骤S610-S612中,归一化相关测量nc(第二测量24a”)可以是以12.8KHz获得的归一化相关测量(参见上文)。在步骤S61中,归一化相关(第一测量24a')可以是以6.4KHz的归一化相关(参见上文)。
可以看出,可以考虑与当前帧和/或先前帧有关的若干度量。因此,可以通过检查若干测量(例如,与当前帧和/或先前帧相关联)是否分别超过或低于若干阈值(例如,步骤S610-S612的第三阈值到第七阈值中的至少一些阈值)来验证第二准则的满足。
此处提供了有关如何在编码器侧获得用于LTPF的参数的一些示例。
此处讨论重采样技术的示例(可以使用其他技术)。
采样率为fs的输入信号被重新采样为12.8kHz的固定采样率。使用升采样+低通滤波+降采样方法执行重采样,其可以被公式化为如下:
Figure BDA0002573131420000221
针对n=0..127
其中x(n)是输入信号,x12.8(n)是12.8kHz的重采样信号,
Figure BDA0002573131420000222
是升采样因子,且h6.4是FIR低通滤波器的脉冲响应,由下式给出:
Figure BDA0002573131420000223
此处提供tab_resamp_filter的示例:
Figure BDA0002573131420000224
Figure BDA0002573131420000231
Figure BDA0002573131420000241
此处讨论高通滤波器技术的示例(可以使用其他技术)。
重采样信号可以使用2阶IIR滤波器进行高通滤波,2阶IIR滤波器的传递函数可以由下式给出:
Figure BDA0002573131420000242
此处讨论音高检测技术的示例(可以使用其他技术)。
信号x12.8(n)可以使用下式通过因子2降采样:
Figure BDA0002573131420000243
针对n=0..63
其中h2={0.1236796411180537,0.2353512128364889,0.2819382920909148,0.2353512128364889,0.1236796411180537}。
x6.4(n)的自相关可以通过下式计算:
Figure BDA0002573131420000244
针对k=kmin..kmax
其中kmin=17以及kmax=114是最小滞后和最大滞后。
可以使用以下对自相关进行加权:
Figure BDA0002573131420000251
针对k=kmin..kmax
其中w(k)被定义为如下:
Figure BDA0002573131420000252
针对k=kmin..kmax
音高滞后的第一估计T1可以是最大化加权自相关的滞后:
Figure BDA0002573131420000253
音高滞后的第二估计T2可以是最大化在先前帧中估计的音高滞后附近的非加权自相关的滞后:
Figure BDA0002573131420000254
其中k′min=max(kmin,Tprev-4)、k′max=min(kmax,Tprev+4)和Tprev是在先前帧中估计的最终音高滞后。
然后,当前帧中音高滞后的最终估计可以由下式给出:
Figure BDA0002573131420000255
其中normcorr(x,L,T)是在滞后T处的长度为L的信号x的归一化相关:
Figure BDA0002573131420000256
归一化相关可以是由信号分析器14和/或调和性测量器24获得的调和性测量中的至少一个。这是可以用于例如与第一阈值比较的调和性测量中的一个。
此处讨论获得LTPF比特流技术的示例(可以使用其他技术)。
LTPF比特流的第一比特发信号通知比特流中存在音高滞后参数。它是由下式获得:
Figure BDA0002573131420000257
如果ltpf_pitch_present为0,则不再对比特编码,从而导致LTPF比特流仅有一个比特(参见第三帧18”)。
如果ltpf_pitch_present为1,则编码另外两个参数,一个音高滞后参数(例如,以9个比特编码)以及发信号通知激活LTPF的一个比特(参见帧16”和17”)。在那种情况下,LTPF比特流(帧)可以由11个比特组成。
Figure BDA0002573131420000258
如以下各节所述,获得音高滞后参数和激活比特。
这些数据可以根据以上讨论的形式被编码在帧12,12',12”中。
此处讨论获得LTPF音高滞后参数的示例(可以使用其他技术)。
LTPF音高滞后参数的整数部分可以由下式给出:
Figure BDA0002573131420000261
其中
Figure BDA0002573131420000262
以及k″min=max(32,2Tcurr-4)、k″max=min(228,2Tcurr+4)。
然后,音高滞后参数的小数部分可以由下式给出:
Figure BDA0002573131420000263
其中
Figure BDA0002573131420000264
以及h4是FIR低通滤波器的脉冲响应,由下式给出:
Figure BDA0002573131420000265
tab_ltpf_interp_R的值可以是,例如:
Figure BDA0002573131420000266
如果pitch_fr<0则根据下式修改pitch_int和pitch_fr两者:
pitch_int=pitch_int-1
pitch_fr=pitch_fr+4
最后,音高滞后参数索引可以由下式给出:
Figure BDA0002573131420000271
首先归一化相关可以如下地进行计算:
Figure BDA0002573131420000272
其中
Figure BDA0002573131420000273
以及hi是FIR低通滤波器的脉冲响应,由下式给出:
Figure BDA0002573131420000274
其中tab_ltpf_interp_x12k8例如从以下值中选择:
Figure BDA0002573131420000275
然后,可以根据以下程序设置LTPF激活比特(“ltpf_active”):
Figure BDA0002573131420000276
其中mem_ltpf_active是先前帧中ltpf_active的值(如果先前帧中pitch_present=0则mem_ltpf_active为0),mem_nc是先前帧中nc的值(如果先前帧中的pitch_present=0则mem_nc为0),pit=pitch_int+pitch_fr/4和mem_pit是先前帧中的pit的值(如果先前帧中pitch_present=0则mem_pit为0)。
6.解码器侧
图7示出装置70。装置70可以是解码器。装置70可以获得诸如经编码的音频信号信息12,12',12”的数据。装置70可以执行上文和/或下文描述的操作。经编码的音频信号信息12,12',12”可以例如通过诸如装置10或10”的编码器或通过实现方法60生成。在示例中,经编码的音频信号信息12,12',12”可能已经例如由不同于装置10或10'或未实现方法60的编码器生成。装置70可以生成滤波后的经解码的音频信号信息76。
装置70可以包括通信单元(或从其接收数据)(例如使用天线)用于获得经编码的音频信号信息。可以执行蓝牙通信。装置70可以包括存储单元(或从其接收数据)(例如使用存储器)用于获得经编码的音频信号信息。装置70可以包括在TD和/或FD中操作的设备。
装置70可以包括可以对经编码的音频信号信息12,12',12”进行解码的比特流读取器71(或“比特流分析器”或“比特流去格式化器”或“比特流解析器”')。比特流读取器71可以包括例如解释以比特流形式获得的数据的状态机。比特流读取器71可以输出音频信号11的解码表示71a。
解码表示71a可以历经比特流读取器下游的一种或多种处理技术(在此处为了简化未示出)。
装置70可以包括LTPF 73,LTPF 73又可以提供滤波后的经解码的音频信号信息73'。
装置70可以包括滤波器控制器72,滤波器控制器可以控制LTPF 73。
特别地,当由比特流读取器71提供时(特别是当存在于帧17'或17”中的字段17d“ltpf_gain”中时),LTPF 73可以由附加调和性信息(例如,增益信息)控制。
另外或替代地,LTPF 73可以由音高信息(例如,音高滞后)控制。音高信息可以存在于帧16,16',16”的字段16b中或帧17,17',17”的字段17b中。然而,如选择器78所示,音高信息并不总是用于控制LTPF:当控制数据项16c(“ltpf_active”)为“0”时,则音高信息不被用于LTPF(由于调和性对于LTPF太低)。
装置70可以包括用于执行PLC功能以提供音频信息76的隐藏单元75。当存在于解码帧中时,音高信息可以用于PLC。
在以下段落中讨论装置70处的LTPF的示例。
图8a和图8b示出可以使用针对帧的语法的示例。还指示了不同的字段。
如图8a所示,比特流读取器71可以在正被编码的帧(在该帧是图5的帧16”,17”和18中的一个的假设下)的特定位置(字段)中搜索第一值。该特定位置可以被解释为例如与帧18”中的第三控制项18e(例如,“ltpf_pitch_lag_present”)相关联的位置。
如果“ltpf_pitch_lag_present”18e的值是“0”,则比特流读取器71了解到没有用于LTPF和PLC的其他信息(例如,没有“ltpf_active”、“ltpf_pitch_lag”、“ltpf_gain”)。
如果“ltpf_pitch_lag_present”18e的值是“1”,则读取器71可以搜索包含控制数据16c或17c(例如,“ltpf_active”)的字段(例如,1比特字段),其指示调和性信息(例如,14a、22a)。例如,如果“ltpf_active”为“0”,则了解到该帧为第一帧16”,指示对于LTPF不具有价值但可用于PLC的调和性。如果“ltpf_active”为“1”,则了解到该帧是第二帧17”,可以携带用于LTPF和PLC两者的有价值信息。
读取器71还搜索包含音高信息16b或17b(例如“ltpf_pitch_lag”)的字段(例如,9比特字段)。该音高信息可以被提供给隐藏单元75(用于PLC)。该音高信息可以被提供给滤波器控制器72/LTPF 73,但是仅在“ltpf_active”为“1”时(例如,较高调和性),如图7中的选择器78所示。
在图8b的示例中执行类似的操作,其中附加地,可以可选地对增益17d进行编码。
7.解码器侧的LTPF的示例
可以使用IIR滤波器在时域中对MDCT(改进离散余弦变换)合成、MDST(改进离散正弦变换)合成或基于另一个变换的合成后的解码信号进行后滤波,IIR滤波器的参数可以取决于LTPF比特流数据“pitch_index”和“ltpf_active”。为了避免当参数从一帧到下一帧改变时的不连续性,可以在当前帧的前1/4上应用过渡机制。
在示例中,LTPF IIR滤波器可以使用下式实现:
Figure BDA0002573131420000291
其中
Figure BDA0002573131420000292
是滤波器输入信号(即MDCT合成后的解码信号),以及
Figure BDA0002573131420000293
是滤波器输出信号。
LTPF音高滞后的整数部分pint和小数部分pfr可以如下地计算。首先以12.8kHz的音高滞后使用下式恢复:
Figure BDA0002573131420000301
Figure BDA0002573131420000302
Figure BDA0002573131420000303
音高滞后然后可以使用下式被缩放到输出采样率fs并被转换为整数和小数部分:
Figure BDA0002573131420000304
Figure BDA0002573131420000305
Figure BDA0002573131420000306
pfr=pup-4*pint
其中fs是采样率。
滤波器系数cnum(k)和cden(k,pfr)可以如下地进行计算:
cnum(k)=0.85*gain_ltpf*tab_ltpf_num_fs[gain_ind][k] 对于k=0..Lnum
cden(k,pfr)=gain_ltpf*tab_ltpf_den_fs[pfr][k] 对于k=0..Lden
其中
Figure BDA0002573131420000307
Lnum=Lden-2
以及gain_ltpf和gain_ind可以根据以下程序获得:
Figure BDA0002573131420000308
Figure BDA0002573131420000311
以及表tab_ltpf_num_fs[gain_ind][k]和ab_ltpf_den_fs[pfr][k]为预先确定的。
在此提供tab_ltpf_num_fs[gain_ind][k]的示例(代替“fs”,采样率被表示):
Figure BDA0002573131420000312
Figure BDA0002573131420000321
在此提供tab_ltpf_den_fs[pfr][k]的示例(代替“fs”,采样率被表示):
Figure BDA0002573131420000322
Figure BDA0002573131420000331
参考过渡处理,考虑五个不同情况。
第一种情况:ltpf_active=0且mem_ltpf_active=0
Figure BDA0002573131420000332
对于
Figure BDA0002573131420000333
第二种情况:ltpf_active=1且mem_ltpf_active=0
Figure BDA0002573131420000341
对于
Figure BDA0002573131420000342
第三种情况:ltpf_active=0且mem_ltpf_active=1
Figure BDA0002573131420000343
对于
Figure BDA0002573131420000344
其中
Figure BDA0002573131420000345
Figure BDA0002573131420000346
是先前帧中计算出的滤波器参数。
第四种情况:ltpf_active=1和mem_ltpf_active=1以及
Figure BDA0002573131420000347
Figure BDA0002573131420000348
Figure BDA0002573131420000349
对于
Figure BDA00025731314200003410
第五种情况:ltpf_active=1且mem_ltpf_active=1以及(
Figure BDA00025731314200003411
Figure BDA00025731314200003412
)
Figure BDA00025731314200003413
对于
Figure BDA00025731314200003414
Figure BDA00025731314200003415
对于
Figure BDA00025731314200003416
8.封包丢失隐藏
此处提供封包丢失隐藏(PLC)或错误隐藏的示例。
8.1一般信息
损坏的帧不能提供正确可听输出,且应将其丢弃。
对于每个解码帧,可以验证其有效性。例如,每个帧可以具有携带循环冗余码(cyclical redundancy code,CRC)的字段,循环冗余码通过执行由预定算法提供的预定操作而验证。读取器71(或另一个逻辑组件,例如隐藏单元75)可以重复该算法,并验证计算结果是否对应于CRC字段上的值。如果帧尚未被适当解码,则假设某些错误已影响到它。因此,如果验证提供了不正确解码的结果,则该帧将保持未适当解码(无效、损坏)。
当帧被确定为未适当解码时,可以使用隐藏策略来提供可听输出:否则,可能会听到类似烦人的可听孔洞。因此,有必要找到某种形式的帧,其“填充间隙”,该间隙被未适当解码的帧保持打开。帧丢失隐藏程序的目的是隐藏任何不可用或损坏的帧对解码的影响。
帧丢失隐藏程序可以包括各种信号类型的隐藏方法。通过选择最合适的方法,可以在具有帧丢失的容易出错情况下获得最佳可能编解码器性能。封包丢失隐藏方法中的一种可以是例如TCX时域隐藏。
8.2T CX时域隐藏
TCX时域隐藏方法是在时域中操作的基于音高的PLC技术。它最适合于具有主谐波结构的信号。该程序的示例如下:如第8.2.1节中所述,最后的解码帧的合成信号用LP滤波器进行逆滤波,以获得第8.2.2节中所述的周期信号。在第8.2.3节中,随机信号由具有大致均匀分布的随机发生器生成。将两个激励信号相加,以形成第8.2.4节中所述的总激励信号,然后以第8.2.6节中所述的衰减因子进行自适应淡出并最后用LP滤波器滤波以获得合成的隐藏时间信号。如果LTPF在最后良好帧中处于活跃状态,则如第8.3节中所述LTPF还将应用于合成的隐藏时间信号。为了得到与在丢失帧后的第一良好帧的适当重叠,在第8.2.5节中生成时域混叠消除信号(time domain alias cancelation signal)。
8.2.1 LPC参数计算
TCX时域隐藏方法在激励域中操作。可以在80个等距频域带上计算自相关函数。能量通过固定的预加重因子μ来预加重
Figure BDA0002573131420000351
Figure BDA0002573131420000361
在使用逆均匀堆叠DFT将自相关函数转换到时域之前,使用以下窗口对自相关函数进行滞后窗口化:
Figure BDA0002573131420000362
对于i=1…16
最后,可以使用Levinson Durbin运算获得针对隐藏帧的LP滤波器ac(k)。以下提供了示例:
Figure BDA0002573131420000363
LP滤波器仅在良好帧后的第一丢失帧中计算并在后续丢失帧中保持。
8.2.2激励的周期部分的构建
首先使用以下滤波器用来自第8.2.1节的预加重因子预加重最后
Figure BDA0002573131420000364
个解码的时间样本:
Hpre-emph(z)=1-μz-1
以获得信号xpre(k),其中,Tc是音高滞后值pitch_int,或如果pitch_fr>0,则Tc是pitch_int+1。值pitch_int和pitch_fr是在比特流中发送的音高滞后值。
进一步用计算出的逆LP滤波器对预加重信号xpre(k)滤波,以获得先前激励信号exc′p(k)。为了构建针对当前丢失帧的激励信号excp(k),如下重复地用Tc复制exc′p(k):
excp(k)=exc′p(E-Tc+k),针对k=0…N-1
其中E对应于exc′p(k)中的最后样本。如果稳定性因子θ小于1,则首先用下表中所述的11分接头线性相位有限脉冲响应(finite impulse response,FIR)滤波器对exc′p(k)的第一音高循环进行低通滤波。
Figure BDA0002573131420000371
音高增益g′p如下地进行计算:
Figure BDA0002573131420000372
如果pitch_fr=0则gp=g′p。否则,第二音高增益g″p如下地进行计算:
Figure BDA0002573131420000373
以及gp=max(g′p,g″p)。如果g″p>g′p,则Tc减少1用于进行进一步处理。
最后,gp由0≤gp≤1界定。
形成的周期激励excp(k),以1开始并以衰减因子α结束在整个帧中逐样本地衰减,以获得
Figure BDA0002573131420000374
音高增益仅在良好帧后的第一丢失帧中计算,并针对其他连续帧丢失设置为α。
8.2.3.激励的随机部分的构建
激励的随机部分可以用具有大致均匀分布的随机发生器生成,如下:
excn,FB(k)=extract(excn,FB(k-1)·12821+16831),对于k=0…N-1
其中针对用此方法进行隐藏的该第一帧,以24607初始化excn,FB(-1),并且extract()提取值的16LSB。针对其他帧,excn,FB(N-1)被存储并且被用作下一个excn,FB(-1)。
为了将噪声移位到更高频率,用下表中所述的11分接头线性相位FIR滤波器对激励信号进行高通滤波以得到excn,HP(k)。
Figure BDA0002573131420000381
为了确保噪声可以以取决于衰减因子α的渐衰速度渐衰到全频带噪声,激励的随机部分excn(k)是在全频带excn,FB(k)和高通滤波版本excn,HP(k)之间经由线性内插来组成的,如下:
excn(k)=(1-β)·excn,FB(k)+β·excn,HP(k),对于k=0…N-1
其中针对良好帧后的第一丢失帧,β=1,并且
β=β-1·α
针对第二及其他连续帧丢失,其中β-1是先前隐藏帧的β。
为了调整噪声级,噪声增益g′n如下地进行计算:
Figure BDA0002573131420000382
如果第8.2.2节后的Tc=pitch_int,则gn=g′n。否则,第二噪声增益g″n如上述等式计算,但以Tc为pitch_int。接着,gn=min(g′n,g″n)。
为了进一步处理,首先归一化gn,然后乘以(1.1-0.75gp)得到
Figure BDA0002573131420000383
形成的随机激励excn(k)从第一样本到样本五以
Figure BDA0002573131420000384
均匀衰减,以及接着以
Figure BDA0002573131420000385
开始并以
Figure BDA0002573131420000386
Figure BDA0002573131420000387
结束在整个帧中逐样本地衰减以获得
Figure BDA0002573131420000388
噪声增益gn仅在良好帧后的第一丢失帧中计算并且针对其他连续帧丢失设置为gn·α。
8.2.4总激励、合成和后处理的构建
随机激励
Figure BDA0002573131420000389
被添加到周期激励
Figure BDA00025731314200003810
中,以形成总激励信号exct(k)。通过使用来自第8.2.1节的LP滤波器对总激励进行滤波得到针对隐藏帧的最终合成信号并使用去加重滤波器对其进行后处理。
8.2.5时域混叠消除
为了在下一帧为良好帧的情况下获得适当的重叠相加,可以生成时域混叠消除部分xTDAC(k)。为此,如同上述创建N-Z个附加样本以获得针对k=0…2N-Z的信号x(k)。对此,时域混叠消除部分通过以下步骤创建:
Figure BDA0002573131420000391
以MDCT窗口wN(k)对
Figure BDA0002573131420000392
窗口化
Figure BDA0002573131420000393
从2N重整形到N
Figure BDA0002573131420000394
从N重整形到2N
Figure BDA0002573131420000395
以翻转的MDCT窗口wN(k)窗口化
Figure BDA0002573131420000396
Figure BDA0002573131420000397
8.2.6多个帧丢失的处理
构建的信号淡出为零。淡出速度由衰减因子α控制,衰减因子α取决于先前的衰减因子α-1、在最后正确接收的帧上计算出的音高增益gp、连续擦除帧的数量nbLostCmpt和稳定度θ。以下程序可以用于计算衰减因子α:
Figure BDA0002573131420000398
Figure BDA0002573131420000401
可以获得因子θ(最后两个相邻缩放因子矢量scf-2(k)和scf-1(k)的稳定度),例如:
Figure BDA0002573131420000402
其中scf-2(k)和scf-1(k)是最后两个相邻帧的缩放因子矢量。因子θ由0≤θ≤1界定,其中较大值的θ对应于更稳定的信号。这限制了能量及频谱包络的波动。如果不存在两个相邻缩放因子矢量,则将因子θ设置为0.8。
为了防止快速高能量增加,用Xs(0)=Xs(0)·0.2和Xs(1)=Xs(1)·0.5对频谱进行低通滤波。
8.3与LTFP相关的隐藏操作
如果隐藏帧中mem_ltpf_active=1,则在隐藏方法是利用符号加扰的MDCT帧重复或TCX时域隐藏时将ltpf_active设置为1。因此,如第5节所述,将长期后滤波器应用于合成的时域信号,但其中
gain_ltpf=gain_ltpf_past·α
其中gain_ltpf_past是先前帧的LTPF增益,而α是衰减因子。从最后一帧重新使用用于LTPF的音高值pitch_int和pitch_fr。
9.图9的解码器
图9示出根据示例的音频解码器300(其可以例如是装置70的实现方式)的示意框图。
音频解码器300可以被配置为接收经编码的音频信号信息310(其可以是例如经编码的音频信号信息12,12',12”),并在其基础上提供经解码的音频信息312。
音频解码器300可以包括比特流分析器320(其也可以被称为“比特流去格式化器”或“比特流解析器”),比特流分析器可以对应于比特流读取器71。比特流分析器320可以接收经编码的音频信号信息310,并在其基础上提供频域表示322和控制信息324。
控制信息324可以包括音高信息16b,17b(例如,“ltpf_pitch_lag”)、和附加调和性信息(诸如附加调和性信息或增益信息(例如“ltpf_gain”))、以及与音频信号11在解码器处的调和性相关联的控制数据项(诸如16c,17c,18c)。
控制信息324还可以包括数据控制项(例如16c,17c)。选择器325(例如,对应于图7的选择器78)示出在控制项的控制下将音高信息提供给LTPF组件376(控制项又由在编码器处获得的调和性信息控制):如果经编码的音频信号信息310的调和性太低(例如,低于上述第二阈值),则LTPF组件376不接收音高信息。
频域表示322可以例如包括经编码频谱值326、经编码缩放因子328以及可选地包括附加旁侧信息330(其可以例如控制特定处理步骤,像例如噪声填充、中间处理或后处理)。音频解码器300还可以包括频谱值解码组件340,频谱值解码组件340可以被配置为接收经编码频谱值326并在其基础上提供一组经解码频谱值342。音频解码器300还可以包括缩放因子解码组件350,缩放因子解码组件350可以被配置为接收经编码缩放因子328并在其基础上提供一组经解码缩放因子352。
替代缩放因子解码,例如在经编码的音频信息包括经编码LPC信息而不是缩放因子信息的情况下,可以使用LPC-缩放因子转换组件354。然而在某些编码模式下(例如,在USAC音频解码器或EVS音频解码器中的TCX解码模式),可以使用一组LPC系数以在音频解码器侧得出一组缩放因子。LPC-缩放因子转换组件354可以实现此功能。
音频解码器300还可以包括用于执行可选信号处理(诸如,例如噪声填充;和/或时间噪声整形;TNS等)的可选处理框366,可选处理框366可以被应用于经解码频谱值342。经解码频谱值342的经处理版本366'可以由处理框366输出。
音频解码器300还可以包括缩放器360,缩放器360可以被配置为将该组缩放因子352应用于该组频谱值342(或其经处理版本366'),从而获得一组缩放值362。例如,可以使用第一缩放因子缩放包括多个经解码频谱值342(或其经处理版本366')的第一频带,以及可以使用第二缩放因子缩放包括多个经解码频谱值342的第二频带。因此,获得一组缩放值362。
音频解码器300还可以包括频域到时域变换370,频域到时域变换可以被配置为接收缩放值362,并提供与一组缩放值362相关联的时域表示372。例如,频域到时域变换370可以提供时域表示372,时域表示与音频内容的帧或子帧相关联。例如,频域到时域变换可以接收一组MDCT(或MDST)系数(可以认为是缩放的经解码频谱值),并在其基础上提供可以形成时域表示372的时域采样样本框。
音频解码器300还包括LTPF组件376,LTPF组件可以对应于滤波器控制器72和LTPF73。LTPF组件376可以接收时域表示372,并在某种程度上修改时域表示372,从而获得时域表示372的后处理版本378。
音频解码器300还可以包括错误隐藏组件380,错误隐藏组件380可以例如对应于隐藏单元75(以执行PLC功能)。错误隐藏组件380可以例如从频域到时域变换370接收时域表示372,并且错误隐藏组件380可以例如为一个或多个丢失音频帧提供错误隐藏音频信息382。换句话说,如果音频帧丢失,使得例如没有经编码频谱值326可用于所述音频帧(或音频子帧),则错误隐藏组件380可以基于与丢失音频帧之前的一个或多个音频帧相关联的时域表示372提供错误隐藏音频信息。错误隐藏音频信息通常可以是音频内容的时域表示。
关于错误隐藏,应当注意的是,错误隐藏不在帧解码的同时发生。例如,如果帧n良好,则进行正常解码,并且最后保存在必须隐藏下一个帧的情况下将会有帮助的一些变量,然后如果n+1丢失,则调用给出来自先前良好帧的变量的隐藏函数。还将更新一些变量,以对于下一帧丢失或恢复到下一良好帧有所帮助。
因此,错误隐藏组件380可以连接到存储组件327,在存储组件上实时存储值16b,17b,17d以供将来使用。仅当后续帧将被识别为未纯粹解码时,才可以使用它们。否则,将使用新值16b,17b,17d实时更新存储在存储组件327上的值。
在示例中,错误隐藏组件380可以执行利用信号加扰的MDCT(或MDST)帧分辨率重复、和/或TCX时域隐藏和/或相位ECU。在示例中,可以在运行中主动识别优选的技术并使用它。
音频解码器300还可以包括信号组合组件390,信号组合组件可以被配置为接收经滤波(后处理)的时域表示378。信号组合390可以接收错误隐藏音频信息382,错误隐藏音频信息382也可以是为丢失音频帧所提供的错误隐藏音频信号的时域表示。信号组合390可以例如组合与后续音频帧相关联的时域表示。在有后续适当解码的音频帧的情况下,信号组合390可以组合(例如,重叠相加)与这些后续适当解码的音频帧相关联的时域表示。然而,如果音频帧丢失,则信号组合390可以组合(例如,重叠相加)与丢失音频帧之前的适当解码的音频帧相关联的时域表示以及与丢失音频帧相关联的错误隐藏音频信息,从而在适当接收的音频帧和丢失音频帧之间具有平滑过渡。类似地,信号组合390可以被配置为组合(例如,重叠相加)与丢失音频帧相关联的错误隐藏音频信息以及与丢失音频帧之后的另一个适当解码的音频帧相关联的时域表示(或在丢失多个连续音频帧的情况下与另一个丢失音频帧相关联的另一个错误隐藏音频信息)。
因此,信号组合390可以提供经解码的音频信息312,使得为适当解码的音频帧提供时域表示372或其后处理版本378,以及使得为丢失音频帧提供错误隐藏音频信息382,其中可以在后续音频帧的音频信息(无论是否由频域到时域变换370还是由错误隐藏组件380提供)之间执行重叠相加操作。由于某些编解码器在重叠相加部分上具有需要取消的一些混叠,可选地可以在为了执行该重叠相加而创建的半帧上创建一些人造混叠。
值得注意地,隐藏组件380可以在输入中接收音高信息和/或增益信息(16b,17b,17d),即使后者未被提供给LTPF组件:这是因为隐藏组件380可以以低于LTPF组件370应操作的调和性的调和性操作。如上所解释的,在调和性超过第一阈值但低于第二阈值的情况下,即使LTPF功能被去激活或减小,隐藏功能也可以是活跃的。
值得注意地,可以选择其他实现方式。特别地,可以使用与组件340、350、354、360和370不同的组件。
值得注意地,在提供可以使用第三帧18”(例如,没有字段16b,17b,16c,17c)的示例中,当获得第三帧18”时,没有来自第三帧18”的信息用于LTPF组件376和错误隐藏组件380。
10.图10的方法
在图10中示出方法100。在步骤S101处,可以由读取器(71、320)对帧(12,12',12”)进行解码。在示例中,该帧可以被接收(例如,经由蓝牙连接)和/或从存储单元获得。
在步骤S102处,检查帧的有效性(例如,使用CRC、奇偶校验等)。如果帧的无效性被确认,则执行隐藏(参见下文)。
否则,如果该帧保持有效,则在步骤S103处检查音高信息是否被编码在该帧中。例如,检查帧12”中的字段18e的值(“ltpf_pitch_lag_present”)。在示例中,仅在调和性已经被确认为超过第一阈值(例如,由框21和/或在步骤S61处)的情况下对音高信息编码。然而解码器不执行比较。
如果在S103处确认音高信息已经被实际编码(例如,在本惯例下,ltpf_pitch_lag_present=1),然后在步骤S104处将音高信息解码(例如,从对音高信息16b或17b进行编码的字段“ltpf_pitch_lag”)并进行存储。否则,循环结束,并且可以在S101处解码新帧。
后续在步骤S105处,检查是否启用LTPF,即是否有可能使用音高信息用于LTPF。可以通过检查各自的控制项(例如16c,17c,“ltpf_active”)执行该验证。这可以意味着调和性超过了第二阈值(例如,如由框22和/或在步骤S63处所识别),和/或时间演进不是极其复杂(信号在时间间隔中足够平坦)。然而,解码器不实施(一个或多个)比较。
如果验证了LTPF是活跃的,则在步骤S106处执行LTPF。否则,将跳过LTPF。循环结束。在S101处可以解码新帧。
参考隐藏,可以将后者细分为步骤。在步骤S107处,验证先前帧的音高信息(或先前帧中的一个的音高信息)是否存储在存储器中(即,可自由处理)。
如果验证存储了搜索到的音高信息,则在步骤S108处可以执行错误隐藏(例如,由组件75或380)。可以执行利用信号加扰的MDCT(或MDST)帧分辨率重复、和/或TCX时域隐藏、和/或相位ECU。
否则,如果在S107处验证没有存储新的音高信息(结果,先前帧与极低调和性或极高的信号变化相关联),可以在步骤S109处使用本身已知的并且不暗示使用由编码器提供的音高信息的不同隐藏技术。这些技术中的一些可以基于在解码器处估计音高信息和/或其他调和性信息。在一些示例中,在这种情况下,无隐藏技术可执行。
在执行隐藏之后,循环结束并且可以在S101处解码新帧。
11.解决方案的讨论
所提出的解决方案可以看作是,在编码器侧仅保留一个音高检测器,以及无论何时LTPF或PLC需要此信息时发送音高滞后参数。使用一个比特来发信号通知在比特流中是否存在音高信息。使用一个附加比特来发信号通知LTPF是否处于活跃状态。
通过使用两个信令比特而不是一个信令比特,即使在基于音高的PLC是活跃的而LTPF不是活跃的情况下,所提出的解决方案也能够将音高滞后信息直接提供给两个模块而没有任何附加复杂性。
因此,可以获得LTPF和基于音高的PLC的低复杂性的组合。
11.1编码器
a.使用音高检测算法每帧估计一个音高滞后。这可以分3个步骤完成,以减少复杂性并提高准确性。使用“开回路音高分析”、以减小的采样率粗略地估计第一音高滞后(例如,参见[1]或[5])。然后,通过以较大的采样率最大化相关函数精炼音高滞后的整数部分。第三步骤是通过例如最大化内插相关函数而估计音高滞后的小数部分。
b.作出是否对比特流中的音高滞后进行编码的决策。可以使用信号的调和性的测量,诸如,例如归一化相关。如果信号调和性高于阈值,则将比特ltpf_pitch_lag_present设置为1,否则设置为0。如果ltpf_pitch_lag_present为1,则将音高滞后ltpf_pltch_lag编码在比特流中。
c.在ltpf_pitch_lag_present为1的情况下,作出是否激活当前帧中的LTPF工具的第二决策。该决策还可以基于信号调和性,诸如,例如归一化相关,但利用较高的阈值以及附加地磁滞机制(hysteresis mechanism),以提供稳定的决策。该决策设置比特ltpf_active。
d.(可选的)在ltpf_active为1的情况下,LTPF增益被估计并且被编码在比特流中。可以使用基于相关的函数估计LTPF增益,并使用均匀量化进行量化。
11.2比特流
根据示例,比特流语法如图8a和图8b所示。
11.3解码器
如果解码器正确接收到未损坏的帧:
a.从比特流解码LTPF数据。
b.如果ltpf_pitch_lag_present为0或ltpf_active为0,则用为0的LTPF增益调用LTPF解码器(在这种情况下,不存在音高滞后)。
c.如果ltpf_pitch_lag_present为1且ltpf_active为1,则使用解码的音高滞后和解码的增益调用LTPF解码器。
如果解码器接收到损坏的帧或如果该帧丢失:
a.作出是否使用基于音高的PLC用于隐藏丢失/损坏的帧的决策。该决策基于最后良好帧的LTPF数据加上可能的其他信息。
b.如果最后良好帧的ltpf_pitch_lag_present为0,则不使用基于音高的PLC。在这种情况下,使用另一种PLC方法,诸如例如利用符号加扰的帧重复(参见[7])。
c.如果最后良好帧的ltpf_pitch_lag_present为1并且可能满足其他条件,则使用基于音高的PLC以隐藏丢失/损坏的帧。PLC模块使用从最后良好帧的比特流解码的音高滞后ltpf_pitch_lag。
12.其他示例
图11示出可以实现编码装置10或10'和/或执行方法60的系统110。系统110可以包括处理器11和存储指令的非暂时性存储单元112,指令在由处理器111执行时可以使处理器111执行音高估计113(例如,以实现音高估计器13)、信号分析114(例如,以实现信号分析器14和/或调和性测量器24)以及比特流形成115(例如,以实现比特流形成器15和/或步骤S62、S64和/或S66)。系统110可以包括输入单元116,输入单元可以获得音频信号(例如,音频信号11)。因此,处理器111可以执行处理以获得音频信号的编码表示(例如,以帧12,12',12”的格式)。可以使用输出单元117将该编码表示提供给外部单元。输出单元117可以包括例如与外部设备(例如,使用诸如蓝牙的无线通信)和/或外部存储空间通信的通信单元。处理器111可以将音频信号的编码表示保存在本地存储空间118中。
图12示出可以实现解码装置70或300和/或执行方法100的系统120。系统120可以包括处理器121和存储指令的非暂时性存储单元122,指令当由处理器121执行时可以使处理器121执行比特流读取123(例如,以实现音高读取器71和/或320、和/或步骤S101单元75或380、和/或步骤S107-S109)、滤波器控制124(例如,以实现LTPF 73或376和/或步骤S106)以及隐藏125(例如,以实现隐藏)。系统120可以包括输入单元126,输入单元可以获得音频信号的解码表示(例如,以帧12,12',12”的形式)。因此,处理器121可以执行处理以获得音频信号的解码表示。可以使用输出单元127将该解码表示提供给外部单元。输出单元127可以包括例如与外部设备(例如,使用诸如蓝牙的无线通信)和/或外部存储空间通信的通信单元。处理器121可以将音频信号的解码表示保存在本地存储空间128中。
在示例中,系统110和120可以是同一设备。
图13示出根据示例的方法1300。在编码器侧,该方法在步骤S130处可以提供对音频信号进行编码(例如,根据以上方法中的任一种或使用以上讨论的设备中的至少一些),并得出调和性信息和/或音高信息。
在编码器侧,该方法在步骤S131处可以提供,确定(例如,基于诸如调和性测量的调和性信息)音高信息是否适合于在解码器侧操作的至少LTPF和/或错误隐藏功能。
在编码器侧,该方法在步骤S132处可以提供,从编码器(例如,无线地,例如使用蓝牙)发送比特流和/或将比特流存储在存储器中,比特流包括音频信号的数字表示和与调和性相关联的信息。该步骤还可以提供向解码器发信号通知音高信息是否适于LTPF和/或错误隐藏。例如,第三控制项18e(“ltpf_pitch_lag_present”)可以根据第三控制项18e中编码的值发信号通知音高信息(在比特流中编码的)至少适于或不适于错误隐藏。例如,第一控制项16a(ltpf_active=0)可以发信号通知音高信息(在比特流中被编码为“ltpf_pitch_lag”)适于错误隐藏,但是不适于LTPF(例如,由于其中间调和性)。例如,第二控制项17a(ltpf_active=1)可以发信号通知音高信息(在比特流中被编码为“ltpf_pitch_lag”)适于错误隐藏和LTPF(例如,由于其较高调和性)两者。
在解码器侧,该方法可以在步骤S134处提供,根据来自编码器的信令对音频信号的数字表示进行解码并将音高信息用于LTPF和/或错误隐藏。
取决于某些实现要求,示例可以以硬件实现。可以使用数字存储介质执行该实现,例如,软盘、数字多功能光盘(DVD)、蓝光光盘、光盘(CD)、只读存储器(ROM)、可编程只读存储器(PROM)、可擦可编程只读存储器(EPROM)、电可擦可编程只读存储器(EEPROM)或闪存,其上存储有电子可读控制信号,这些信号可以与可编程计算机系统协作(或能够协作)以执行相应的方法。因此,数字存储介质可以是计算机可读的。
通常,示例可以被实现为具有程序指令的计算机程序产品,当计算机程序产品在计算机上运行时,程序指令可操作用于执行方法中的一种。程序指令可以例如存储在机器可读介质上。
其他示例包括存储在机器可读载体上的、用于执行本文所述方法中的一种的计算机程序。换句话说,因此,方法的示例是具有程序指令的计算机程序,程序指令在计算机程序在计算机上运行时用于执行本文所述方法中的一种。
因此,该方法的另一个示例是数据载体介质(或数字存储介质或计算机可读介质),其包括记录在其上的用于执行本文所述方法中的一种的计算机程序。数据载体介质、数字存储介质或记录介质是有形的和/或非暂时性的,而不是无形的和暂时性的信号。
其他示例包括处理单元,例如执行本文所述方法中的一种的计算机或可编程逻辑器件。
其他示例包括其上安装有用于执行本文所述方法中的一种的计算机程序的计算机。
其他示例包括将用于执行本文所述方法中的一种的计算机程序(例如,电子地或光学地)传送到接收器的装置或系统。接收器可以是例如计算机、移动设备、存储器设备等。装置或系统可以例如包括用于将计算机程序传送到接收器的文件服务器。
在一些示例中,可编程逻辑器件(例如,现场可编程门阵列)可以用于执行本文所述方法的功能中的一些或全部。在一些示例中,现场可编程门阵列可以与微处理器协作以便执行本文所述方法中的一种。通常,这些方法可以由任何适当的硬件装置执行。
上述示例针对以上讨论的原理是说明性的。应当理解的是,本文所述的布置和细节的修改和变化将是显而易见的,因此,其意图是由未决的专利权利要求书的范围限制,而不是由通过本文示例的描述和说明呈现的具体细节限制。

Claims (13)

1.一种用于解码与被划分为帧序列的音频信号相关联的音频信号信息(12,12',12”)的装置(70,300),帧序列的每个帧为第一帧(16,16',16”)、第二帧(17,17',17”)和第三帧(18”)中的一个,装置包括:
比特流读取器(71,320),被配置为读取经编码的音频信号信息(12,12',12”,310),经编码的音频信号信息具有:
针对第一帧(16,16',16”)、第二帧(17,17',17”)和第三帧(18”)的音频信号(11)的编码表示(16a,17a,18a,310);
针对第一帧(16,16',16”)的第一音高信息(16b)和具有第一值的第一控制数据项(16c);以及
针对第二帧(17,17',17”)的第二音高信息(17b)和具有不同于第一值的第二值的第二控制数据项(17c),其中第一控制数据项(16c)和第二控制数据项(17c)位于相同的字段;以及
针对第一帧(16,16',16”)、第二帧(17,17',17”)以及第三帧(18”)的第三控制数据项(18e),第三控制数据项(18e)指示第一音高信息(16b)和/或第二音高信息(17b)的存在或不存在,第三控制数据项(18e)以一个单一比特编码,单一比特具有区别第三帧(18”)与第一帧和第二帧(16”,17”)的值,第三帧(18”)具有缺少第一音高信息(16b)、第一控制数据项(16c)、第二音高信息(17b)和第二控制数据项(17c)的格式;
控制器(72),被配置为控制长期后滤波器LTPF(73,376),以:
检查(S103)第三控制数据项(18e)以验证帧是否为第三帧(18”),以及在验证帧不是第三帧(18”)的情况下,检查(S105)第一控制数据项和第二控制数据项以验证帧是否为第一帧(16,16',16”)或第二帧(17,17',17”)以:
在验证第二控制数据项(17c)具有第二值的情况下,使用第二音高信息(17b)对第二帧(17,17',17”)中的音频信号的解码表示(71a,372)进行滤波,以及存储(S104)第二音高信息以隐藏后续未适当解码的音频帧;
在验证第一控制数据项(16c)具有第一值的情况下,针对第一帧(16,16',16”)去激活LTPF(73,376),但存储(S104)第一音高信息以隐藏后续未适当解码的音频帧;以及
在从第三控制数据项(18e)验证帧是第三帧的情况下,去激活LTPF(73,376)和用以隐藏后续未适当解码的音频帧的音高信息的存储。
2.根据权利要求1所述的装置,其中:
在经编码的音频信号信息中,针对第一帧(16”),为第一控制数据项(16c)保留一个单一比特,并且为第一音高信息保留固定数据字段(16b)。
3.根据权利要求1所述的装置,其中:
在经编码的音频信号信息中,针对第二帧(17”),为第二控制数据项(17c)保留一个单一比特,并且为第二音高信息保留固定数据字段(17b)。
4.根据权利要求1所述的装置,还包括:
隐藏单元(75,380),被配置为使用第一音高信息和/或第二音高信息(16b,17b)隐藏后续未适当解码的音频帧。
5.根据权利要求4所述的装置,隐藏单元(75,380)被配置为:
在确定无效帧的解码的情况下(S102),检查是否与先前正确解码的帧有关的音高信息被存储(S107),
以便用使用存储的音高信息获得的帧隐藏无效解码的帧(S108)。
6.一种用于对音频信号(11)进行编码的装置(10,10'),包括:
音高估计器(13),被配置为获得与音频信号(11)的音高相关联的音高信息(13a);
信号分析器(14),被配置为获得与音频信号(11)的调和性相关联的调和性信息(14a,24a,24c);以及
比特流形成器(15),被配置为准备对帧(16”,17”,18”)进行编码的经编码的音频信号信息(12”),以便在比特流中包括:
针对第一帧(16”)、第二帧(17”)和第三帧(18”)的音频信号(11)的编码表示(16a,17a,18a);
针对第一帧(16”)的第一音高信息(16b)和具有第一值的第一控制数据项(16c);
针对第二帧(17”)的第二音高信息(17b)和具有不同于第一值的第二值的第二控制数据项(17c);以及
针对第一帧、第二帧和第三帧的第三控制数据项(18e),
其中第一值(16c)和第二值(17c)取决于与调和性信息(14a,24a,24c)相关联的第二准则(600),以及
第一值(16c)指示针对第一帧(16”)中的音频信号(11)的调和性的第二准则(600)未满足,以及
第二值(17c)指示针对第二帧(17”)中的音频信号(11)的调和性的第二准则(600)满足,
其中第二准则(600)至少包括当至少一个第二调和性测量(24a”)大于至少一个第二阈值时满足的条件(S63),
将第三控制数据项(18e)以一个单一比特编码,单一比特具有区别第三帧(18”)与第一帧和第二帧(16”,17”)的值,第三帧(18”)在第一准则(S61)未满足的情况下被编码,以及第一帧和第二帧(16”,17”)在第一准则(S61)满足的情况下被编码,其中第一准则(S61)至少包括当至少一个第一调和性测量(24a')大于至少一个第一阈值时满足的条件,其中在比特流中,针对第一帧(16”),为第一控制数据项(16c)保留一个单一比特,并且为第一音高信息保留固定数据字段(16b),
其中在比特流中,针对第二帧(17”),为第二控制数据项(17c)保留一个单一比特,并且为第二音高信息保留固定数据字段(17b),以及
其中在比特流中,针对第三帧(18”),不为固定数据字段和/或第一控制项和第二控制项保留比特。
7.根据权利要求6所述的装置,其中第二准则(600)至少包括当先前帧的至少一个调和性测量大于至少一个附加阈值时满足的附加条件。
8.根据权利要求6所述的装置,其中第一调和性测量和第二调和性测量以不同的采样率获得。
9.根据权利要求6所述的装置,其中:
音高信息(13a)包括音高滞后信息或其经处理版本。
10.根据权利要求6所述的装置,其中:
调和性信息(14a,24a,24a',24a”,24c)包括自相关值和/或归一化自相关值和/或其经处理版本中的至少一个。
11.一种用于解码与被划分为帧序列的音频信号相关联的音频信号信息的方法(100),其中每个帧为第一帧、第二帧和第三帧中的一个,方法包括:
读取(S101)经编码的音频信号信息(12”),经编码的音频信号信息(12”)包括:
针对第一帧(16”)和第二帧(17”)的音频信号(11)的编码表示(16a,17a);
针对第一帧(16”)的第一音高信息(16b)和具有第一值的第一控制数据项(16c);
针对第二帧(17”)的第二音高信息(17b)和具有不同于第一值的第二值的第二控制数据项(17c,其中第一控制数据项(16c)和第二控制数据项(17c)位于相同的字段);
针对第一帧(16,16',16”)、第二帧(17,17',17”)以及第三帧(18”)的第三控制数据项(18e),第三控制数据项(18e)指示第一音高信息(16b)和/或第二音高信息(17b)的存在或不存在,第三控制数据项(18e)以一个单一比特编码,单一比特具有区别第三帧(18”)与第一帧和第二帧(16”,17”)的值,第三帧(18”)具有缺少第一音高信息(16b)、第一控制数据项(16c)、第二音高信息(17b)和第二控制数据项(17c)的格式;
在确定第一控制数据项(16c)具有第一值时,使用第一音高信息(16b)用于长期后滤波器LTPF,以及用于错误隐藏功能;
在确定第二控制数据项(17c)的第二值时,去激活LTPF,但使用第二音高信息(17b)用于错误隐藏功能;以及
在确定帧是第三帧时,去激活LTPF,以及去激活使用音频信号(11)的编码表示(16a,17a,18a,310)用于错误隐藏功能。
12.一种用于编码与被划分为帧的信号相关联的音频信号信息的方法(60),包括:
从音频信号获得(S60)测量(24a,24a',24a”);
验证(S63,S610-S612)第二准则(600)的满足,第二准则(600)基于测量(24a,24a',24a”)并且包括当至少一个第二调和性测量(24a')大于第二阈值时满足的至少一个条件;
形成(S64)具有帧(16”,17”,18”)的经编码的音频信号信息(12,12',12”),经编码的音频信号信息(12,12',12”)包括:
针对第一帧(16”)和第二帧(17”)的音频信号(11)的编码表示(16a,17a)以及第三帧(18”);
针对第一帧(16”)的第一音高信息(16b)和具有第一值的第一控制数据项(16c)以及第三控制数据项(18e);
针对第二帧(17”)的第二音高信息(17b)和具有不同于第一值的第二值的第二控制数据项(17c)以及第三控制数据项(18e),
其中第一值(16c)和第二值(17c)取决于第二准则(600),并且第一值(16c)指示基于第一帧(16”)中的音频信号(11)的调和性的第二准则(600)未满足,以及第二值(17c)指示基于第二帧(17”)中的音频信号(11)的调和性的第二准则(600)满足,
第三控制数据项(18e)是具有区别第三帧(18”)与第一帧和第二帧(16”,17”)的值的一个单一比特,第一帧和第二帧(16”,17”)与满足第一准则(S61)相关联,以便当第三控制数据项(18e)指示基于当至少一个第一调和性测量(24a')高于至少一个第一阈值时满足的至少一个条件的第一准则(S61)未满足时识别第三帧(18”),
其中形成经编码的音频信号信息,使得针对第一帧(16”),为第一控制数据项(16c)保留一个单一比特,并且为第一音高信息(16b)保留固定数据字段,以及
其中形成经编码的音频信号信息,使得针对第二帧(17”),为第二控制数据项(17c)保留一个单一比特,并且为第二音高信息(17b)保留固定数据字段,以及
其中形成经编码的音频信号信息,使得针对第三帧(18”),不为固定数据字段保留比特,并且不为第一控制数据项(16c)和第二控制数据项(17c)保留比特。
13.一种存储指令的非暂时性存储单元,指令在由处理器执行时执行根据权利要求11或12所述的方法。
CN201880085705.4A 2017-11-10 2018-11-06 编码和解码音频信号 Active CN111566731B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP17201099.3 2017-11-10
EP17201099.3A EP3483883A1 (en) 2017-11-10 2017-11-10 Audio coding and decoding with selective postfiltering
PCT/EP2018/080350 WO2019091980A1 (en) 2017-11-10 2018-11-06 Encoding and decoding audio signals

Publications (2)

Publication Number Publication Date
CN111566731A CN111566731A (zh) 2020-08-21
CN111566731B true CN111566731B (zh) 2023-04-04

Family

ID=60301910

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880085705.4A Active CN111566731B (zh) 2017-11-10 2018-11-06 编码和解码音频信号

Country Status (17)

Country Link
US (1) US11217261B2 (zh)
EP (2) EP3483883A1 (zh)
JP (1) JP7004474B2 (zh)
KR (1) KR102460233B1 (zh)
CN (1) CN111566731B (zh)
AR (1) AR113481A1 (zh)
AU (1) AU2018363701B2 (zh)
BR (1) BR112020009184A2 (zh)
CA (1) CA3082274C (zh)
ES (1) ES2968821T3 (zh)
MX (1) MX2020004776A (zh)
PL (1) PL3707714T3 (zh)
RU (1) RU2741518C1 (zh)
SG (1) SG11202004228VA (zh)
TW (1) TWI698859B (zh)
WO (1) WO2019091980A1 (zh)
ZA (1) ZA202002524B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5981408B2 (ja) * 2013-10-29 2016-08-31 株式会社Nttドコモ 音声信号処理装置、音声信号処理方法、及び音声信号処理プログラム
EP2980798A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Harmonicity-dependent controlling of a harmonic filter tool
KR102664768B1 (ko) * 2019-01-13 2024-05-17 후아웨이 테크놀러지 컴퍼니 리미티드 고해상도 오디오 코딩
CN112289328B (zh) * 2020-10-28 2024-06-21 北京百瑞互联技术股份有限公司 一种确定音频编码码率的方法及系统
CN113096685B (zh) * 2021-04-02 2024-05-07 北京猿力未来科技有限公司 音频处理方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012000882A1 (en) * 2010-07-02 2012-01-05 Dolby International Ab Selective bass post filter
CN103886863A (zh) * 2012-12-20 2014-06-25 杜比实验室特许公司 音频处理设备及音频处理方法
WO2014202535A1 (en) * 2013-06-21 2014-12-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for improved concealment of the adaptive codebook in acelp-like concealment employing improved pulse resynchronization
CN105765651A (zh) * 2013-10-31 2016-07-13 弗朗霍夫应用科学研究促进协会 用于使用基于时域激励信号的错误隐藏提供经解码的音频信息的音频解码器及方法

Family Cites Families (154)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3639753A1 (de) 1986-11-21 1988-06-01 Inst Rundfunktechnik Gmbh Verfahren zum uebertragen digitalisierter tonsignale
US5012517A (en) 1989-04-18 1991-04-30 Pacific Communication Science, Inc. Adaptive transform coder having long term predictor
US5233660A (en) 1991-09-10 1993-08-03 At&T Bell Laboratories Method and apparatus for low-delay celp speech coding and decoding
JPH05281996A (ja) 1992-03-31 1993-10-29 Sony Corp ピッチ抽出装置
IT1270438B (it) 1993-06-10 1997-05-05 Sip Procedimento e dispositivo per la determinazione del periodo del tono fondamentale e la classificazione del segnale vocale in codificatori numerici della voce
US5581653A (en) 1993-08-31 1996-12-03 Dolby Laboratories Licensing Corporation Low bit-rate high-resolution spectral envelope coding for audio encoder and decoder
JP3402748B2 (ja) 1994-05-23 2003-05-06 三洋電機株式会社 音声信号のピッチ周期抽出装置
JPH0811644A (ja) 1994-06-27 1996-01-16 Nissan Motor Co Ltd ルーフモール取付構造
US6167093A (en) 1994-08-16 2000-12-26 Sony Corporation Method and apparatus for encoding the information, method and apparatus for decoding the information and method for information transmission
DE69619284T3 (de) 1995-03-13 2006-04-27 Matsushita Electric Industrial Co., Ltd., Kadoma Vorrichtung zur Erweiterung der Sprachbandbreite
US5781888A (en) 1996-01-16 1998-07-14 Lucent Technologies Inc. Perceptual noise shaping in the time domain via LPC prediction in the frequency domain
WO1997027578A1 (en) 1996-01-26 1997-07-31 Motorola Inc. Very low bit rate time domain speech analyzer for voice messaging
US5812971A (en) 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
JPH1091194A (ja) 1996-09-18 1998-04-10 Sony Corp 音声復号化方法及び装置
US6570991B1 (en) 1996-12-18 2003-05-27 Interval Research Corporation Multi-feature speech/music discrimination system
KR100261253B1 (ko) 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치
GB2326572A (en) 1997-06-19 1998-12-23 Softsound Limited Low bit rate audio coder and decoder
US6507814B1 (en) 1998-08-24 2003-01-14 Conexant Systems, Inc. Pitch determination using speech classification and prior pitch estimation
US7272556B1 (en) 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
US6735561B1 (en) 2000-03-29 2004-05-11 At&T Corp. Effective deployment of temporal noise shaping (TNS) filters
US7099830B1 (en) 2000-03-29 2006-08-29 At&T Corp. Effective deployment of temporal noise shaping (TNS) filters
US6665638B1 (en) 2000-04-17 2003-12-16 At&T Corp. Adaptive short-term post-filters for speech coders
US7395209B1 (en) 2000-05-12 2008-07-01 Cirrus Logic, Inc. Fixed point audio decoding system and method
US7512535B2 (en) 2001-10-03 2009-03-31 Broadcom Corporation Adaptive postfiltering methods and systems for decoding speech
US6785645B2 (en) 2001-11-29 2004-08-31 Microsoft Corporation Real-time speech and music classifier
US20030187663A1 (en) 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
US7447631B2 (en) 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
US7433824B2 (en) 2002-09-04 2008-10-07 Microsoft Corporation Entropy coding by adapting coding between level and run-length/level modes
US7502743B2 (en) 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
JP4287637B2 (ja) 2002-10-17 2009-07-01 パナソニック株式会社 音声符号化装置、音声符号化方法及びプログラム
JP4431568B2 (ja) 2003-02-11 2010-03-17 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声符号化
KR20030031936A (ko) 2003-02-13 2003-04-23 배명진 피치변경법을 이용한 단일 음성 다중 목소리 합성기
ATE503246T1 (de) 2003-06-17 2011-04-15 Panasonic Corp Empfangsvorrichtung, sendevorrichtung und übertragungssystem
US7983909B2 (en) 2003-09-15 2011-07-19 Intel Corporation Method and apparatus for encoding audio data
US7009533B1 (en) 2004-02-13 2006-03-07 Samplify Systems Llc Adaptive compression and decompression of bandlimited signals
EP1914722B1 (en) 2004-03-01 2009-04-29 Dolby Laboratories Licensing Corporation Multichannel audio decoding
DE102004009954B4 (de) 2004-03-01 2005-12-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verarbeiten eines Multikanalsignals
DE102004009949B4 (de) 2004-03-01 2006-03-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Ermitteln eines Schätzwertes
JP4744438B2 (ja) 2004-03-05 2011-08-10 パナソニック株式会社 エラー隠蔽装置およびエラー隠蔽方法
EP1864281A1 (en) 2005-04-01 2007-12-12 QUALCOMM Incorporated Systems, methods, and apparatus for highband burst suppression
US7539612B2 (en) 2005-07-15 2009-05-26 Microsoft Corporation Coding and decoding scale factor information
US7546240B2 (en) * 2005-07-15 2009-06-09 Microsoft Corporation Coding with improved time resolution for selected segments via adaptive block transformation of a group of samples from a subband decomposition
KR100888474B1 (ko) 2005-11-21 2009-03-12 삼성전자주식회사 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법
US7805297B2 (en) 2005-11-23 2010-09-28 Broadcom Corporation Classification-based frame loss concealment for audio signals
US9123350B2 (en) 2005-12-14 2015-09-01 Panasonic Intellectual Property Management Co., Ltd. Method and system for extracting audio features from an encoded bitstream for audio classification
US8255207B2 (en) 2005-12-28 2012-08-28 Voiceage Corporation Method and device for efficient frame erasure concealment in speech codecs
WO2007102782A2 (en) 2006-03-07 2007-09-13 Telefonaktiebolaget Lm Ericsson (Publ) Methods and arrangements for audio coding and decoding
US8150065B2 (en) 2006-05-25 2012-04-03 Audience, Inc. System and method for processing an audio signal
EP2030199B1 (en) 2006-05-30 2009-10-28 Koninklijke Philips Electronics N.V. Linear predictive coding of an audio signal
CN1983909B (zh) 2006-06-08 2010-07-28 华为技术有限公司 一种丢帧隐藏装置和方法
US8015000B2 (en) 2006-08-03 2011-09-06 Broadcom Corporation Classification-based frame loss concealment for audio signals
ATE496365T1 (de) 2006-08-15 2011-02-15 Dolby Lab Licensing Corp Arbiträre formung einer temporären rauschhüllkurve ohne nebeninformation
FR2905510B1 (fr) 2006-09-01 2009-04-10 Voxler Soc Par Actions Simplif Procede d'analyse en temps reel de la voix pour le controle en temps reel d'un organe numerique et dispositif associe
CN101140759B (zh) 2006-09-08 2010-05-12 华为技术有限公司 语音或音频信号的带宽扩展方法及系统
DE102006049154B4 (de) 2006-10-18 2009-07-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Kodierung eines Informationssignals
KR101292771B1 (ko) 2006-11-24 2013-08-16 삼성전자주식회사 오디오 신호의 오류은폐방법 및 장치
EP2099026A4 (en) 2006-12-13 2011-02-23 Panasonic Corp POST-FILTER AND FILTERING METHOD
FR2912249A1 (fr) 2007-02-02 2008-08-08 France Telecom Codage/decodage perfectionnes de signaux audionumeriques.
JP4871894B2 (ja) 2007-03-02 2012-02-08 パナソニック株式会社 符号化装置、復号装置、符号化方法および復号方法
JP5618826B2 (ja) 2007-06-14 2014-11-05 ヴォイスエイジ・コーポレーション Itu.t勧告g.711と相互運用可能なpcmコーデックにおいてフレーム消失を補償する装置および方法
EP2015293A1 (en) * 2007-06-14 2009-01-14 Deutsche Thomson OHG Method and apparatus for encoding and decoding an audio signal using adaptively switched temporal resolution in the spectral domain
CN101325537B (zh) * 2007-06-15 2012-04-04 华为技术有限公司 一种丢帧隐藏的方法和设备
JP4928366B2 (ja) 2007-06-25 2012-05-09 日本電信電話株式会社 ピッチ探索装置、パケット消失補償装置、それらの方法、プログラム及びその記録媒体
JP4572218B2 (ja) 2007-06-27 2010-11-04 日本電信電話株式会社 音楽区間検出方法、音楽区間検出装置、音楽区間検出プログラム及び記録媒体
WO2009027606A1 (fr) 2007-08-24 2009-03-05 France Telecom Codage/decodage par plans de symboles, avec calcul dynamique de tables de probabilites
WO2009029035A1 (en) 2007-08-27 2009-03-05 Telefonaktiebolaget Lm Ericsson (Publ) Improved transform coding of speech and audio signals
CN100524462C (zh) 2007-09-15 2009-08-05 华为技术有限公司 对高带信号进行帧错误隐藏的方法及装置
KR101290622B1 (ko) 2007-11-02 2013-07-29 후아웨이 테크놀러지 컴퍼니 리미티드 오디오 복호화 방법 및 장치
WO2009066869A1 (en) 2007-11-21 2009-05-28 Electronics And Telecommunications Research Institute Frequency band determining method for quantization noise shaping and transient noise shaping method using the same
WO2009084918A1 (en) 2007-12-31 2009-07-09 Lg Electronics Inc. A method and an apparatus for processing an audio signal
AU2009256551B2 (en) 2008-06-13 2015-08-13 Nokia Technologies Oy Method and apparatus for error concealment of encoded audio data
PL2346030T3 (pl) 2008-07-11 2015-03-31 Fraunhofer Ges Forschung Koder audio, sposób kodowania sygnału audio oraz program komputerowy
EP2144231A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme with common preprocessing
WO2010003663A1 (en) 2008-07-11 2010-01-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder for encoding frames of sampled audio signals
EP2144230A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
US8577673B2 (en) 2008-09-15 2013-11-05 Huawei Technologies Co., Ltd. CELP post-processing for music signals
EP2345030A2 (en) 2008-10-08 2011-07-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Multi-resolution switched audio encoding/decoding scheme
GB2466673B (en) 2009-01-06 2012-11-07 Skype Quantization
ES2567129T3 (es) 2009-01-28 2016-04-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificador de audio, decodificador de audio, información de audio codificada, métodos para la codificación y decodificación de una señal de audio y programa de ordenador
JP4945586B2 (ja) 2009-02-02 2012-06-06 株式会社東芝 信号帯域拡張装置
JP4932917B2 (ja) 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
FR2944664A1 (fr) 2009-04-21 2010-10-22 Thomson Licensing Dispositif et procede de traitement d'images
US8352252B2 (en) 2009-06-04 2013-01-08 Qualcomm Incorporated Systems and methods for preventing the loss of information within a speech frame
US8428938B2 (en) 2009-06-04 2013-04-23 Qualcomm Incorporated Systems and methods for reconstructing an erased speech frame
KR20100136890A (ko) 2009-06-19 2010-12-29 삼성전자주식회사 컨텍스트 기반의 산술 부호화 장치 및 방법과 산술 복호화 장치 및 방법
CN101958119B (zh) 2009-07-16 2012-02-29 中兴通讯股份有限公司 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法
EP3693963B1 (en) 2009-10-15 2021-07-21 VoiceAge Corporation Simultaneous time-domain and frequency-domain noise shaping for tdac transforms
PL2473995T3 (pl) 2009-10-20 2015-06-30 Fraunhofer Ges Forschung Koder sygnału audio, dekoder sygnału audio, sposób dostarczania zakodowanej reprezentacji treści audio, sposób dostarczania dekodowanej reprezentacji treści audio oraz program komputerowy do wykorzystania w zastosowaniach z małym opóźnieniem
CN102667923B (zh) 2009-10-20 2014-11-05 弗兰霍菲尔运输应用研究公司 音频编码器、音频解码器、用于将音频信息编码的方法、用于将音频信息解码的方法
US8207875B2 (en) 2009-10-28 2012-06-26 Motorola Mobility, Inc. Encoder that optimizes bit allocation for information sub-parts
US7978101B2 (en) 2009-10-28 2011-07-12 Motorola Mobility, Inc. Encoder and decoder using arithmetic stage to compress code space that is not fully utilized
KR101761629B1 (ko) 2009-11-24 2017-07-26 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
CA2786944C (en) 2010-01-12 2016-03-15 Fraunhofer Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding and audio information, method for decoding an audio information and computer program using a hash table describing both significant state values and interval boundaries
US20110196673A1 (en) 2010-02-11 2011-08-11 Qualcomm Incorporated Concealing lost packets in a sub-band coding decoder
EP2375409A1 (en) 2010-04-09 2011-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction
FR2961980A1 (fr) 2010-06-24 2011-12-30 France Telecom Controle d'une boucle de retroaction de mise en forme de bruit dans un codeur de signal audionumerique
JP5600805B2 (ja) 2010-07-20 2014-10-01 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 最適化されたハッシュテーブルを用いるオーディオエンコーダ、オーディオデコーダ、オーディオ情報を符号化するための方法、オーディオ情報を復号化するための方法およびコンピュータプログラム
US9082416B2 (en) 2010-09-16 2015-07-14 Qualcomm Incorporated Estimating a pitch lag
US8738385B2 (en) 2010-10-20 2014-05-27 Broadcom Corporation Pitch-based pre-filtering and post-filtering for compression of audio signals
MY165853A (en) 2011-02-14 2018-05-18 Fraunhofer Ges Forschung Linear prediction based coding scheme using spectral domain noise shaping
US9270807B2 (en) 2011-02-23 2016-02-23 Digimarc Corporation Audio localization using audio signal encoding and recognition
AR085445A1 (es) * 2011-03-18 2013-10-02 Fraunhofer Ges Forschung Codificador y decodificador que tiene funcionalidad de configuracion flexible
US8977543B2 (en) 2011-04-21 2015-03-10 Samsung Electronics Co., Ltd. Apparatus for quantizing linear predictive coding coefficients, sound encoding apparatus, apparatus for de-quantizing linear predictive coding coefficients, sound decoding apparatus, and electronic device therefore
US8891775B2 (en) 2011-05-09 2014-11-18 Dolby International Ab Method and encoder for processing a digital stereo audio signal
FR2977439A1 (fr) 2011-06-28 2013-01-04 France Telecom Fenetres de ponderation en codage/decodage par transformee avec recouvrement, optimisees en retard.
FR2977969A1 (fr) 2011-07-12 2013-01-18 France Telecom Adaptation de fenetres de ponderation d'analyse ou de synthese pour un codage ou decodage par transformee
CN103493130B (zh) 2012-01-20 2016-05-18 弗劳恩霍夫应用研究促进协会 用以利用正弦代换进行音频编码及译码的装置和方法
CN103460283B (zh) 2012-04-05 2015-04-29 华为技术有限公司 确定多信道音频信号的编码参数的方法及多信道音频编码器
US20130282373A1 (en) 2012-04-23 2013-10-24 Qualcomm Incorporated Systems and methods for audio signal processing
US9026451B1 (en) 2012-05-09 2015-05-05 Google Inc. Pitch post-filter
JP6088644B2 (ja) 2012-06-08 2017-03-01 サムスン エレクトロニクス カンパニー リミテッド フレームエラー隠匿方法及びその装置、並びにオーディオ復号化方法及びその装置
GB201210373D0 (en) 2012-06-12 2012-07-25 Meridian Audio Ltd Doubly compatible lossless audio sandwidth extension
FR2992766A1 (fr) 2012-06-29 2014-01-03 France Telecom Attenuation efficace de pre-echos dans un signal audionumerique
CN102779526B (zh) 2012-08-07 2014-04-16 无锡成电科大科技发展有限公司 语音信号中基音提取及修正方法
US9406307B2 (en) 2012-08-19 2016-08-02 The Regents Of The University Of California Method and apparatus for polyphonic audio signal prediction in coding and networking systems
US9293146B2 (en) 2012-09-04 2016-03-22 Apple Inc. Intensity stereo coding in advanced audio coding
TWI553628B (zh) 2012-09-24 2016-10-11 三星電子股份有限公司 訊框錯誤隱藏方法
US9401153B2 (en) 2012-10-15 2016-07-26 Digimarc Corporation Multi-mode audio recognition and auxiliary data encoding and decoding
FR3001593A1 (fr) 2013-01-31 2014-08-01 France Telecom Correction perfectionnee de perte de trame au decodage d'un signal.
JP6069526B2 (ja) 2013-02-05 2017-02-01 テレフオンアクチーボラゲット エルエム エリクソン(パブル) オーディオフレーム損失のコンシールメントを制御する方法及び装置
TWI530941B (zh) * 2013-04-03 2016-04-21 杜比實驗室特許公司 用於基於物件音頻之互動成像的方法與系統
EP2830055A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Context-based entropy coding of sample values of a spectral envelope
EP2830064A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection
RU2638734C2 (ru) 2013-10-18 2017-12-15 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Кодирование спектральных коэффициентов спектра аудиосигнала
US9906858B2 (en) 2013-10-22 2018-02-27 Bongiovi Acoustics Llc System and method for digital signal processing
PL3336840T3 (pl) 2013-10-31 2020-04-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dekoder audio i sposób dostarczania zdekodowanej informacji audio z wykorzystaniem maskowania błędów modyfikującego sygnał pobudzenia w dziedzinie czasu
JP6396459B2 (ja) 2013-10-31 2018-09-26 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 周波数領域における時間的予備整形雑音の挿入によるオーディオ帯域幅拡張
ES2716652T3 (es) 2013-11-13 2019-06-13 Fraunhofer Ges Forschung Codificador para la codificación de una señal de audio, sistema de transmisión de audio y procedimiento para la determinación de valores de corrección
GB2524333A (en) 2014-03-21 2015-09-23 Nokia Technologies Oy Audio signal payload
US9396733B2 (en) 2014-05-06 2016-07-19 University Of Macau Reversible audio data hiding
NO2780522T3 (zh) 2014-05-15 2018-06-09
EP2963649A1 (en) 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio processor and method for processing an audio signal using horizontal phase correction
US9685166B2 (en) 2014-07-26 2017-06-20 Huawei Technologies Co., Ltd. Classification between time-domain coding and frequency domain coding
EP2980796A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for processing an audio signal, audio decoder, and audio encoder
CN107112022B (zh) 2014-07-28 2020-11-10 三星电子株式会社 用于时域数据包丢失隐藏的方法
AU2015258241B2 (en) 2014-07-28 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for selecting one of a first encoding algorithm and a second encoding algorithm using harmonics reduction
EP2980799A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an audio signal using a harmonic post-filter
EP2980798A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Harmonicity-dependent controlling of a harmonic filter tool
EP2988300A1 (en) 2014-08-18 2016-02-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Switching of sampling rates at audio processing devices
WO2016142002A1 (en) 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
EP3067887A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
US9886963B2 (en) 2015-04-05 2018-02-06 Qualcomm Incorporated Encoder selection
US10049684B2 (en) 2015-04-05 2018-08-14 Qualcomm Incorporated Audio bandwidth selection
JP6422813B2 (ja) 2015-04-13 2018-11-14 日本電信電話株式会社 符号化装置、復号装置、これらの方法及びプログラム
US9978400B2 (en) 2015-06-11 2018-05-22 Zte Corporation Method and apparatus for frame loss concealment in transform domain
US10847170B2 (en) 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
US9837089B2 (en) 2015-06-18 2017-12-05 Qualcomm Incorporated High-band signal generation
KR20170000933A (ko) 2015-06-25 2017-01-04 한국전기연구원 시간 지연 추정을 이용한 풍력 터빈의 피치 제어 시스템
US9830921B2 (en) 2015-08-17 2017-11-28 Qualcomm Incorporated High-band target signal control
KR20180040716A (ko) 2015-09-04 2018-04-20 삼성전자주식회사 음질 향상을 위한 신호 처리방법 및 장치
US9978381B2 (en) 2016-02-12 2018-05-22 Qualcomm Incorporated Encoding of multiple audio signals
US10219147B2 (en) 2016-04-07 2019-02-26 Mediatek Inc. Enhanced codec control
US10283143B2 (en) 2016-04-08 2019-05-07 Friday Harbor Llc Estimating pitch of harmonic signals
CN107103908B (zh) 2017-05-02 2019-12-24 大连民族大学 复调音乐多音高估计方法及伪双谱在多音高估计中的应用

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012000882A1 (en) * 2010-07-02 2012-01-05 Dolby International Ab Selective bass post filter
KR20130019004A (ko) * 2010-07-02 2013-02-25 돌비 인터네셔널 에이비 선택적인 베이스 포스트 필터
CN103886863A (zh) * 2012-12-20 2014-06-25 杜比实验室特许公司 音频处理设备及音频处理方法
WO2014202535A1 (en) * 2013-06-21 2014-12-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for improved concealment of the adaptive codebook in acelp-like concealment employing improved pulse resynchronization
CN105765651A (zh) * 2013-10-31 2016-07-13 弗朗霍夫应用科学研究促进协会 用于使用基于时域激励信号的错误隐藏提供经解码的音频信息的音频解码器及方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
A hybrid concealment algorithm for non-predictive wideband audio coders;R Lefebvre等;《Audio Engineering Society Convention 120》;20061231;全文 *
基于AMR-WB编解码器的VoLTE应用级丢包优化;刘宝光;《中国优秀硕士学位论文全文数据库》;20150715(第07期);全文 *

Also Published As

Publication number Publication date
WO2019091980A1 (en) 2019-05-16
KR102460233B1 (ko) 2022-10-28
SG11202004228VA (en) 2020-06-29
MX2020004776A (es) 2020-08-13
TWI698859B (zh) 2020-07-11
ZA202002524B (en) 2021-08-25
KR20200081467A (ko) 2020-07-07
CA3082274A1 (en) 2019-05-16
CN111566731A (zh) 2020-08-21
US11217261B2 (en) 2022-01-04
EP3483883A1 (en) 2019-05-15
ES2968821T3 (es) 2024-05-14
BR112020009184A2 (pt) 2020-11-03
AU2018363701B2 (en) 2021-05-13
AU2018363701A1 (en) 2020-05-21
JP2021502605A (ja) 2021-01-28
CA3082274C (en) 2023-03-07
JP7004474B2 (ja) 2022-01-21
RU2741518C1 (ru) 2021-01-26
EP3707714B1 (en) 2023-11-29
PL3707714T3 (pl) 2024-05-20
TW201923746A (zh) 2019-06-16
EP3707714A1 (en) 2020-09-16
AR113481A1 (es) 2020-05-06
US20200265855A1 (en) 2020-08-20
EP3707714C0 (en) 2023-11-29

Similar Documents

Publication Publication Date Title
CN111566731B (zh) 编码和解码音频信号
RU2630390C2 (ru) Устройство и способ для маскирования ошибок при стандартизированном кодировании речи и аудио с низкой задержкой (usac)
EP3175455B1 (en) Harmonicity-dependent controlling of a harmonic filter tool
KR101792712B1 (ko) 주파수 도메인 내의 선형 예측 코딩 기반 코딩을 위한 저주파수 강조
EP1527441A2 (en) Audio coding
US20100268542A1 (en) Apparatus and method of audio encoding and decoding based on variable bit rate
CN105264596B (zh) 用于码激励线性预测类编码器的无边信息的噪声填充
US11380341B2 (en) Selecting pitch lag
US20220180884A1 (en) Methods and devices for detecting an attack in a sound signal to be coded and for coding the detected attack
JP7073492B2 (ja) 異なる損失隠蔽ツールのセットをサポートするオーディオデコーダ

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant