CN110709925A - 音频编码 - Google Patents

音频编码 Download PDF

Info

Publication number
CN110709925A
CN110709925A CN201780091280.3A CN201780091280A CN110709925A CN 110709925 A CN110709925 A CN 110709925A CN 201780091280 A CN201780091280 A CN 201780091280A CN 110709925 A CN110709925 A CN 110709925A
Authority
CN
China
Prior art keywords
filter coefficients
audio signal
channel
predefined
quantized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201780091280.3A
Other languages
English (en)
Other versions
CN110709925B (zh
Inventor
A·瓦西拉凯
A·拉莫
L·拉克索宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Technologies Oy
Original Assignee
Nokia Technologies Oy
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Technologies Oy filed Critical Nokia Technologies Oy
Publication of CN110709925A publication Critical patent/CN110709925A/zh
Application granted granted Critical
Publication of CN110709925B publication Critical patent/CN110709925B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

根据示例性实施例提供了一种用于音频编码的技术,该技术包括:获得表示从多通道输入音频信号中导出的第一通道中的音频信号的频谱包络的第一线性预测LP滤波器系数组;获得表示从多通道输入音频信号中导出的第二通道中的音频信号的频谱包络的第二LP滤波器系组;使用预定义的第一量化器量化第一LP滤波器系数组;以及基于量化的第一LP滤波器系数组,量化第二LP滤波器系数组,第二LP滤波器系数组的量化包括:通过使用预定义的预测器,基于量化的第一LP滤波器系数组,导出预测的LP滤波器系数组以估计第二通道中的音频信号的频谱包络;将预测误差计算为第二LP滤波器系数组和预测的LP滤波器系数组中的相应LP系数之间的差;以及使用预定义的第二量化器量化预测误差。

Description

音频编码
技术领域
本发明的示例和非限制性实施例涉及多通道或立体声音频信号的编码和/或解码。
背景技术
在许多应用中,对诸如语音或音乐的音频信号进行编码,例如以使得能够有效地传输或存储音频信号。在这方面,音频编码器和音频解码器(也称为音频编解码器)用于表示基于音频的信号,诸如音乐和环境声音。这些类型的编码器通常没有假定音频输入具有某些特性并且例如不会在编码过程中使用语音模型,而是使用适合于表示包括语音的所有类型的音频信号的处理。相反,可以认为语音编码器和语音解码器(也称为语音编解码器)是在编码解码过程中经由语音产生模型的使用针对语音信号而优化的音频编解码器。对于语音信号,与音频编解码器可实现的相比,依赖于语音产生模型实现了可感知声音质量的更低比特率,或者与音频编解码器相比,实现了改善的可感知声音质量。另一方面,由于例如音乐和环境声音通常与语音产生模型匹配很差,因此,对于语音编解码器,这种信号通常表示背景噪声。音频编解码器或语音编解码器可以以固定或可变的比特率工作。
音频编码器和解码器通常被设计为低复杂度的源编码器。换句话说,它们能够执行音频信号的编码和解码而无需大量的计算资源。这尤其对于针对实时服务而使用的音频编码器和解码器是至关重要的特性,实时服务诸如音频内容和/或用于在移动设备(或其它设备)上工作的音频编码器和解码器的电话或实时流传输,移动设备(或其它设备)具有可用于处理音频编码器和解码器的计算资源的有限能力。
对于语音编解码器,典型的语音产生模型建立在线性预测编码(LPC)之上,这使得能够对输入音频信号115尤其是对于包括周期性或准周期性信号分量的输入音频信号115的频谱包络进行精确建模。语音编码器中LPC编码的结果是可以在语音解码器中用于语音合成的线性预测(LP)系数组。为了使得能够将LP滤波器系数从语音编码器传送到语音解码器,对LP滤波器系数进行编码(例如,量化)并将其以编码格式传输到语音解码器,在语音解码器中对所接收的编码的LP滤波器系数进行解码(例如,去量化)并将其用作LP合成滤波器的系数。
LP滤波器系数的量化通常会导致量化误差,其可能导致从语音解码器中的LP合成滤波获得的重构语音的失真。虽然量化误差通常随语音编码器中当前语音输入的特性而变化,但是平均量化误差尤其取决于量化器设计和可用于量化LP滤波器系数的比特数。因此,尤其是在低比特率的情况下,重要的是找到一种量化器设计,该设计能够实现足够低的平均量化误差,同时又不消耗过多的比特数用于量化LP滤波器系数。
发明内容
根据示例性实施例提供了一种方法,其包括:获得表示从多通道输入音频信号中导出的第一通道中的音频信号的频谱包络的第一线性预测LP滤波器系数组;获得表示从多通道输入音频信号中导出的第二通道中的音频信号的频谱包络的第二LP滤波器系数组;使用预定义的第一量化器量化第一LP滤波器系数组;以及基于量化的第一LP滤波器系数组,量化第二LP滤波器系数组,第二LP滤波器系数组的量化包括:通过使用预定义的预测器,基于量化的第一LP滤波器系数组,导出预测的LP滤波器系数组以估计第二通道中的音频信号的频谱包络;将预测误差计算为第二LP滤波器系数组和预测的LP滤波器系数组中的相应LP系数之间的差;以及使用预定义的第二量化器量化预测误差。
根据另一个示例性实施例提供了一种方法,其包括:获得重构的第一线性预测LP滤波器系数组,其表示从多通道输入音频信号中导出的第一通道中的音频信号的频谱包络;以及重构表示从多通道输入音频信号中导出的第二通道中的音频信号的频谱包络的第二LP滤波器系数组,所述重构包括:通过使用预定义的预测器,基于量化的第一LP滤波器系数组,导出预测的LP滤波器系数组以估计所述第二通道中的音频信号的频谱包络;通过使用预定义的量化器,基于一个或多个所接收的码字,重构预测误差;以及将重构的第二LP滤波器系数组导出为预测的LP滤波器系数组和重构的预测误差的组合。
根据另一个示例性实施例提供了一种装置,其被配置为:获得表示从多通道输入音频信号中导出的第一通道中的音频信号的频谱包络的第一线性预测LP滤波器系数组;获得表示从多通道输入音频信号中导出的第二通道中的音频信号的频谱包络的第二LP滤波器系数组;使用预定义的第一量化器量化第一LP滤波器系数组;以及基于量化的第一LP滤波器系数组,量化第二LP滤波器系数组,第二LP滤波器系数组的量化包括:通过使用预定义的预测器,基于量化的第一LP滤波器系数组,导出预测的LP滤波器系数组以估计第二通道中的音频信号的频谱包络;将预测误差计算为第二LP滤波器系数组和预测的LP滤波器系数组中的相应LP系数之间的差;以及使用预定义的第二量化器量化预测误差。
根据另一个示例性实施例提供了一种装置,其被配置为:获得重构的第一线性预测LP滤波器系数组,其表示从多通道输入音频信号中导出的第一通道中的音频信号的频谱包络;以及重构表示从多通道输入音频信号中导出的第二通道中的音频信号的频谱包络的第二LP滤波器系数组,所述重构包括:通过使用预定义的预测器,基于量化的第一LP滤波器系数组,导出预测的LP滤波器系数组以估计所述第二通道中的音频信号的频谱包络;通过使用预定义的量化器,基于一个或多个所接收的码字,重构预测误差;以及将重构的第二LP滤波器系数组导出为预测的LP滤波器系数组和重构的预测误差的组合。
根据另一个示例性实施例提供了一种装置,其包括:用于获得表示从多通道输入音频信号中导出的第一通道中的音频信号的频谱包络的第一线性预测LP滤波器系数组的装置;用于获得表示从多通道输入音频信号中导出的第二通道中的音频信号的频谱包络的第二LP滤波器系数组的装置;用于使用预定义的第一量化器量化第一LP滤波器系数组的装置;以及用于基于量化的第一LP滤波器系数组,量化第二LP滤波器系数组的装置,用于量化第二LP滤波器系数组的装置被配置为:通过使用预定义的预测器,基于量化的第一LP滤波器系数组,导出预测的LP滤波器系数组以估计第二通道中的音频信号的频谱包络;将预测误差计算为第二LP滤波器系数组和预测的LP滤波器系数组中的相应LP系数之间的差;以及使用预定义的第二量化器量化预测误差。
根据另一个示例性实施例提供了一种装置,其包括:用于获得重构的第一线性预测LP滤波器系数组的装置,其中第一线性预测LP滤波器系数组表示从多通道输入音频信号中导出的第一通道中的音频信号的频谱包络;以及用于重构表示从多通道输入音频信号中导出的第二通道中的音频信号的频谱包络的第二LP滤波器系数组的装置,用于重构的装置被配置为:通过使用预定义的预测器,基于量化的第一LP滤波器系数组,导出预测的LP滤波器系数组以估计所述第二通道中的音频信号的频谱包络;通过使用预定义的量化器,基于一个或多个所接收的码字,重构预测误差;以及将重构的第二LP滤波器系数组导出为预测的LP滤波器系数组和重构的预测误差的组合。
根据另一个示例性实施例提供了一种装置,其中,该装置包括至少一个处理器;以及包括计算机程序代码的至少一个存储器,计算机程序代码在由至少一个处理器执行时使得该装置:获得表示从多通道输入音频信号中导出的第一通道中的音频信号的频谱包络的第一线性预测LP滤波器系数组;获得表示从多通道输入音频信号中导出的第二通道中的音频信号的频谱包络的第二LP滤波器系数组;使用预定义的第一量化器量化第一LP滤波器系数组;以及基于量化的第一LP滤波器系数组,量化第二LP滤波器系数组,第二LP滤波器系数组的量化包括:通过使用预定义的预测器,基于量化的第一LP滤波器系数组,导出预测的LP滤波器系数组以估计第二通道中的音频信号的频谱包络;将预测误差计算为第二LP滤波器系数组和预测的LP滤波器系数组中的相应LP系数之间的差;以及使用预定义的第二量化器量化预测误差。
根据另一个示例性实施例提供了一种装置,其中,该装置包括至少一个处理器;以及包括计算机程序代码的至少一个存储器,计算机程序代码在由至少一个处理器执行时使得该装置:获得重构的第一线性预测LP滤波器系数组,其表示从多通道输入音频信号中导出的第一通道中的音频信号的频谱包络;以及重构表示从多通道输入音频信号中导出的第二通道中的音频信号的频谱包络的第二LP滤波器系数组,所述重构包括:通过使用预定义的预测器,基于量化的第一LP滤波器系数组,导出预测的LP滤波器系数组以估计所述第二通道中的音频信号的频谱包络;通过使用预定义的量化器,基于一个或多个所接收的码字,重构预测误差;以及将重构的第二LP滤波器系数组导出为预测的LP滤波器系数组和重构的预测误差的组合。
根据另一个示例性实施例,提供了一种计算机程序,该计算机程序包括计算机可读程序代码,其被配置为当在计算设备上执行所述程序代码时使得至少执行根据前述示例性实施例的方法。
根据示例性实施例的计算机程序可以具体化在易失性或非易失性计算机可读记录介质上,例如,作为包括至少一个在其上存储有程序代码的计算机可读非暂时性介质的计算机程序产品,所述程序在由装置执行时使得该装置至少执行以上针对计算机程序而描述的根据本发明的示例性实施例的操作。
在该专利申请中提出的本发明的示例性实施例不应被解释为对所附权利要求的适用性构成限制。在本专利申请中使用的动词“包括”及其派生词是开放式限制,其不排除尚未叙述的特征的存在。除非另有明确说明,否则下文所描述的特征可以相互任意组合。
在所附的权利要求中阐述了本发明的一些特征。然而,当结合附图阅读时,从以下一些示例性实施例的描述中,将最好地理解本发明与其构造和其操作方法有关的各方面及其附加的目的和优点。
附图说明
在所附附图中,通过示例而非限制的方式示出了本发明的实施例,其中:
图1示出根据示例的音频处理系统的一些组件和/或实体的框图;
图2示出根据示例的音频编码器的一些组件和/或实体的框图;
图3示出根据示例的LPC编码器的一些组件和/或实体的框图;
图4示出根据示例的方法;
图5示出根据示例的方法;
图6示出根据示例的方法;
图7示出根据示例的音频解码器的一些组件和/或实体的框图;
图8示出根据示例的LPC解码器的一些组件和/或实体的框图;
图9示出根据示例的方法;
图10示出根据示例的装置的一些组件和/或实体的框图。
具体实施方式
图1示出了音频处理系统100的一些组件和/或实体的框图,音频处理系统100可以用作在本公开中描述的音频编码技术的各种实施例的框架。音频处理系统100包括:音频捕获实体110,其用于记录表示至少一个声音的输入音频信号115;音频编码实体120,其用于将输入音频信号115编码成编码音频信号125;音频解码实体130,其用于将从音频编码实体获得的编码音频信号125解码成重构音频信号135;以及音频再现实体140,其用于播放重构音频信号135。
音频捕获实体110用于产生输入音频信号115作为两通道立体声音频信号。就此而言,音频捕获实体110包括麦克风部件,其可以包括立体声麦克风,两个麦克风或麦克风阵列的设置。音频捕获实体110还可以包括处理装置,其用于记录表示由麦克风部件捕获声音的一对声音信号并且构成被提供为立体声音频信号的输入音频信号115的左和右通道的一对数字音频信号。音频捕获实体110将如此获得的输入音频信号115提供给音频编码实体120和/或存储在存储装置中以供后续使用。
音频编码实体120使用在本文中称为音频编码器的音频编码算法将输入音频信号115处理成编码音频信号125。就此而言,可以认为音频编码器实现了从信号域(输入音频信号115)到压缩域(编码音频信号125)的转换。音频编码实体120还可以包括预处理实体,其用于将输入音频信号115从它从音频捕获实体110被接收的格式转换为适合于音频编码器的格式。该预处理例如可以包括输入音频信号115的电平控制和/或输入音频信号115的频率特性的修改(例如,低通、高通或带通滤波)。可以将预处理提供为与音频编码器分离的预处理实体,音频编码器的子实体,或者其功能在单独的预处理与音频编码器之间共享的处理实体。
音频解码实体130使用在本文中称为音频解码器的音频解码算法将编码音频信号125处理成重构音频信号135。可以认为音频解码器实现了从编码域(编码音频信号125)返回到信号域(重构音频信号135)的转换。音频解码实体130还可以包括后处理实体,其用于将重构音频信号115从它从音频解码器被接收的格式转换为适合于音频再现实体140的格式。该后处理例如可以包括重构音频信号135的电平控制和/或重构音频信号135的频率特性的修改(例如低通、高通或带通滤波)。可以将后处理提供为与音频解码器分离的后处理实体,音频解码器的子实体,或者其功能在单独的后处理与音频解码器之间共享的处理实体。
音频再现实体140例如可以包括耳机、头戴式耳机、扬声器或一个或多个扬声器的设置。
代替音频编码实体120(直接)从音频捕获实体110接收输入音频信号115的设置,音频处理系统100可以包括用于存储预先捕获或预先创建的音频信号的存储装置,其中可以选择用于提供给音频编码实体120的音频输入信号115。
代替音频解码实体130(直接)将重构音频信号135提供给音频再现实体140的设置,音频处理系统100可以包括用于存储由音频解码实体130提供的重构音频信号135的存储装置,以用于后续分析、处理、播放和/或传输到另一个实体。
图1中的垂直虚线用于表示通常音频编码实体120和音频解码实体130可被提供在可以经由网络或经由传输通道彼此连接的单独设备中。网络/通道可以在音频编码实体120与音频解码实体130之间提供无线连接、有线连接或两者的组合。就此而言,作为示例,音频编码实体120还可以包括(第一)网络接口,其用于将编码音频信号125封装为协议数据单元(PDU)序列,以用于通过网络/通道传输到解码实体130,而音频解码实体130还可以包括用于解封装来自通过网络/通道从音频编码实体120接收的PDU序列的编码音频信号125。
在下文中,在示例性音频编码器220的框架中描述了LPC编码和LP参数量化技术的一些方面。就此而言,图2示出了音频编码器220的一些组件和/或实体的框图。例如,音频编码器220可被提供为音频编码实体120或其一部分。
音频编码器220将输入音频信号115编码成编码音频信号125。换句话说,音频编码器220实现了从信号域(例如,时域)到编码域的转换。如前所述,输入音频信号115包括两个数字音频信号,在音频编码器220处被接收为左通道115-1和右通道115-2。音频编码器220可被设置为处理被设置为输入帧序列的输入音频信号115,每个输入帧包括左通道115-1和右通道115-2的数字音频信号的相应段,其以预定义的采样频率被提供为相应的一系列在时间上的输入样本。
通常,音频编码器220使用固定的预定义的帧长。在其它示例中,帧长可以是可以从多个预定义的帧长中选择的可选帧长,或者帧长可以是可以从预定义的帧长范围中选择的可调帧长。可以将帧长定义为针对左通道115-1和右通道115-2中的每一个在帧中包括的数量样本L,其以预定义的采样频率映射到对应的时长。作为这方面的示例,音频编码器220可以使用20毫秒(ms)的固定帧长,其在8、16、32或48kHz的采样频率下分别产生每通道L=160、L=320、L=640和L=960个样本的帧。然而,这些值作为非限制性示例,并且例如根据所期望的音频带宽、根据所期望的成帧延迟和/或根据可用的处理能力,可以替代地使用与这些示例不同的帧长和/或采样频率。
音频编码器220通过通道分解器222在输入音频信号115的左通道115-1和右通道115-2中进行处理,通道分解器222用于将输入音频信号115分解为通过LPC编码器224处理的第一通道223-1和第二通道223,LPC编码器224至少在概念上包括第一LPC编码器224-1和第二LPC编码器224-2。第一通道223-1通过第一LPC编码器224-1和第一残差编码器228-1进行处理,而第二通道223-2通过第二LPC编码器224-2和第二残差编码器228-2进行处理。在通过第一LPC编码器224-1和第一残差编码器228-1的第一信号路径和通过第二LPC编码器224-2和第二残差编码器228-2的第二信号路径中,信号被逐帧处理。
通道分解器222用于将输入音频信号115的帧分解成第一通道223-1和第二通道223-2的对应帧。分解过程可以是预定义的分解过程,或者分解可以根据输入音频信号115的帧的一个或多个特性来执行。
作为预定义的分解的示例,可以使用经典的中间/侧面分解,例如,以使得导出为左通道115-1和右通道115-2中的信号的和信号的中间信号被提供为第一通道223-1信号,而导出为左通道115-1和右通道115-2中的信号之间的差信号的侧信号被提供为第二通道223-2信号。在这种分解的变形中,在被提供为第一通道223-1和第二通道223-2的相应信号之前,可以用第一预定义的比例因子来缩放和信号,并且可以使用第二预定义的比例因子来缩放差信号,例如,使得第一和第二缩放因子的值都是0.5。在另一个示例中,左通道115-1和右通道115-2中预定义的通道可被提供为第一通道223-1信号,而另一个通道被提供为第二通道223-2信号。
作为根据输入音频信号115的一个或多个特性的分解的示例,可以基于左通道115-1信号和右通道115-中具有更高能量的一个来导出第一通道223-1的信号,而可以基于左通道115-1和右通道115-2信号中的另一个来导出第二通道223-2的信号。导出例如可以包括左通道115-1和右通道115-2信号中相应一个的预定义或自适应缩放和/或滤波。在该示例的变形中,左通道115-1和右通道115-2信号中能量更高的一个可被提供为诸如第一通道223-1信号,而另一个被提供为诸如第二通道223-2信号。
在这方面的另一个示例中,第一通道223-1信号被提供为左通道115-1和右通道115-2中的信号的和信号,第二通道223-2信号被提供为左通道115-1和右通道115-2中的信号之间的差信号,其中,和信号和差信号分别通过第一和第二缩放因子缩放,第一和第二缩放因子优选地根据左通道115-1中和/或右通道115-2的信号能量而自适应地选择,以使得第一和第二缩放因子的和基本上是1。如果应用了根据输入音频信号115的一个或多个特性的分解,则将左通道115-1和右通道115-2分解为第一通道223-1和第二通道223-2所使用的方法的指示可被提供给比特流格式器229以包括在编码音频信号125中。
鉴于前述示例,通道分解器222用于将输入音频信号115的帧分解成第一通道223-1和第二通道223-2的对应帧,其中,与第二通道223-2相比,第一通道223-1传送由输入音频信号115的通道115-1、115-2携带的能量的更大部分。因此,第一通道223-1可被称为主通道,而第二通道223-2可被称为辅助通道。
一般地,LPC编码是本领域公知的编码技术,并且其使用通道223-1、223-2中相应一个的信号中的短期冗余以导出LP滤波器系数组,这些系数描述了相应通道223-1、223-2的信号的频谱包络。作为简要概述,LPC编码可涉及LP分析以导出LP滤波器系数组,LP分析滤波使用所导出的LP滤波器系数组将相应通道223-1、223-2中的信号处理成对应的残差信号,并且对所导出的LP滤波器系数进行编码以传输到LPC解码器以在其中实现LP合成。
LPC编码器224,例如,第一LPC编码器224-1,执行LPC编码过程以将第一通道223-1中的信号帧处理成第一残差信号225-1的对应帧,其被提供为第一残差编码器228-1的输入以在其中进行残差编码。作为LPC编码过程的一部分,第一LPC编码器224-1应用LP分析以导出第一LP滤波器系数组,第一LP滤波器系数组描述了第一通道223-1中的信号帧的频谱包络。第一LPC编码器224-1对所导出的第一LP滤波器系数进行量化和编码,并且还将编码的第一LP滤波器系数作为编码的LPC参数的一部分提供给比特流格式器229以包括在编码音频信号125中,从而包括在编码的LPC参数信息中,编码的LPC参数信息在音频解码器中可用于重构第一LP滤波器系数以在其中进行LP合成滤波。
LPC编码器224,例如,第二LPC编码器224-2,执行LPC编码过程以将第二通道223-2中的信号帧处理成第二残差信号225-2的对应帧,其被提供为第二残差编码器228-1的输入以在其中进行残差编码。作为LPC编码过程的一部分,第二LPC编码器224-2应用LP分析以导出第二LP滤波器系数组,第二LP滤波器系数组描述了第二通道223-2中的信号帧的频谱包络。第二LPC编码器224-2对所导出的第二LP滤波器系数进行量化和编码,并且还将编码的第二LP滤波器系数作为编码的LPC参数的一部分提供给比特流格式器229以包括在编码音频信号125中,从而包括在编码的LPC参数信息中,编码的LPC参数信息在音频解码器中可用于重构第二LP滤波器系数以在其中进行LP合成滤波。
作为LPC编码器224的示例,图3示出了LPC编码器320的一些组件和/或实体的框图,LPC编码器320例如可以在图2的框架中被用作LPC编码器224或其一部分。
在LPC编码器320中,第一LP分析器331-1基于第一通道223-1的帧来执行LP分析,从而提供第一LP滤波器系数组,而第二LP分析器331-2基于第二通道223-2的帧来执行LP分析,从而提供第二LP滤波器系数组。在LP分析中,例如通过分别最小化第一通道223-1的误差项e1(t)和第二通道223-2的误差项e2(t),第一LP分析器331-1和第二LP分析器331-2中的相应一个可以确定相应的第一和第二LP滤波器系数组:
Figure BDA0002290488580000121
其中,a1,i,i=0:M,a1,0=1表示第一LP滤波器系数组,a2,i,i=0:M,a2,0=1表示第二LP滤波器系数组,Nlpc表示分析窗口长度(以样本数量为单位),x1(t),t=t-NLPC:t表示第一通道223-1信号,x2(t),t=t-NLPC:t表示第二通道223-2信号,符号‖·‖表示所应用的范数,例如,欧几里得范数。所得到的第一LP滤波器系数组a1,i和第二LP滤波器系数组a2,i被传递给LP量化器332以在其中进行LP量化和编码。
在示例中,第一和第二LP分析器331-1、331-2使用预定义的LP分析窗口长度Nlpc,这意味着LP分析是基于相应通道223-1、223-中的信号的Nlpc个连续样本。通常,这意味着基于包括当前帧的L个样本的相应通道223-1、223-2中的信号的Nlpc个最新样本来执行LP分析。除了当前帧的L个样本之外,LP分析窗口还可以覆盖在时间上在当前帧之前和/或在时间上在当前帧之后的样本(其中后者通常称为向前参考头部(look-ahead))。作为非限制性示例,LP分析窗口可以覆盖25ms,包括刚好在当前帧之前的6.25ms的过去信号、当前帧(10ms)和8.75ms的参考头部(look-head)。LP分析窗口具有预定义的形状,这可以按照所期望的LP分析特性来进行选择。若干适合的LP分析窗口在本领域中是已知的,例如,(修改的)汉明窗口和(修改的)汉宁窗口,以及混合窗口,诸如在ITU-T提议G.728(章节3.3)中规定的窗口。
LPC编码器320使用被表示为M的预定义的LP模型阶数,从而得到第一LP滤波器系数组和第二LP滤波器系数组中的每一个中的M个LP滤波器系数。通常,更高的LP模型阶数M使得能够对频谱包络进行更精确的建模,而另一方面,更高的模型阶数需要更高的比特数来对量化的LP滤波器系数进行编码并且会产生更高的计算负荷。因此,为给定使用实例选择最适合的LP模型阶数M可涉及在对频谱包络进行建模的期望精度、可用比特数和可用计算资源之间进行权衡。作为非限制性示例,可以将LP模型阶数M选择为10至20之间的值,例如,选择为M=16。
LP量化器332从第一LP分析器331-1和第二LP分析器332-2接收相应的第一LP滤波器系数组a1,i和第二LP滤波器系数组a2,i,并进行操作以导出量化的第一LP滤波器系数
Figure BDA0002290488580000131
和量化的第二LP滤波器系数
Figure BDA0002290488580000132
及其相应的编码版本。下面提供量化过程的示例。
由LP量化器332进行的LP量化过程的示例通过图4的流程图示出,其表示用于量化第一LP滤波器系数a1,i和第二LP滤波器系数a2,i的方法400的步骤。如框402中所示,根据该示例的LP量化过程开始于通过使用(第一)预定义的量化器来量化第一LP滤波器系数组a1,i。该量化器可被称为第一通道量化器。在示例中,第一LP滤波器系数a1,i的量化涉及将第一LP滤波器系数a1,i转换成第一线频谱频率(LSF),在本文中被表示为f1,i,i=0:M-1。LP滤波器系数的LSF表示在本领域中是已知的,并且在此方面,本领域中已知的任何LP到LSF的转换技术均适用。
用于量化第一LSF f1,i的第一通道量化器可以包括任何适合的量化器,例如,一种被设计为量化均值去除向量f′1,i,i=0:M-1的非预测性或预测性向量量化器,其中,均值去除LSF f′1,i向量例如可通过将第一LSF f1,i设置成一个向量并从中减去预定义的平均LSF值向量fM,i,i=0:M-1来获得。在预测量化的情况下,预测可涉及基于针对相同通道而导出的量化的LP滤波器系数的一个或多个过去值的预测,并且预测可以通过使用移动平均(MA)预测向量量化器或自回归(AR)预测向量量化器来执行,移动平均(MA)预测向量量化器操作以量化MA预测误差向量,自回归(AR)预测向量量化器操作以量化AR预测误差向量。这种预测量化器在本领域中是已知的,并且通常在语音和/或音频编码的上下文中应用于诸如LSF的频谱参数的量化。
无论应用于第一LSF f1,i的量化技术的细节如何,量化都会使得导出量化的第一LSF
Figure BDA0002290488580000133
并提供一个或多个用作编码的量化第一LP滤波器系数的量化码字。LP量化器332进一步将量化的第一LSF
Figure BDA0002290488580000134
转换为LP滤波器系数表示,从而获得量化的第一LP滤波器系数
Figure BDA0002290488580000135
以提供给第一LP分析滤波器334-1,以使得能够在其中进行LP分析滤波。
方法400进行到基于量化的第一LP滤波器系数来量化第二LP滤波器系数组a2,i。就此而言,如框408中所示,方法400包括通过使用(第一)预定义的预测器,基于量化的第一LP滤波器系数,导出预测的第二LP滤波器系数。该预测器可被称为第一到第二通道预测器。由于第一通道223-1和第二通道223-2中的相应信号是基于相同的输入音频信号115(可以包括立体声音频信号)的通道而导出的,因此,很可能它们在某些程度上展示出频谱相似性,从而使得表示第一通道223-1信号的频谱包络的(量化的)第一LP滤波器系数用作估计表示第二通道223-1信号的频谱包络的第二LP系数的合理基础。
在示例中,使用第一到第二通道预测器来导出预测的第二LP滤波器系数(框408)涉及使用预定义的预测器矩阵P,以基于量化的第一LSF来计算预测的第二LSF
Figure BDA0002290488580000143
例如,通过:
Figure BDA0002290488580000144
其中,
Figure BDA0002290488580000145
表示被设置成M维向量的预测的第二LSF
Figure BDA0002290488580000147
Figure BDA0002290488580000146
表示被设置成M维向量的量化的第一LSF
Figure BDA0002290488580000148
并且预定义的预测器矩阵P是预测器系数pi,j的M x M矩阵。在下面描述适用的预测器矩阵P的示例。
方法400进行到将第一到第二通道预测误差e1,i,i=0:M-1计算为第二LP滤波器系数组a2,i与预测的第二LP滤波器系数之间的差,如框410中所示。在下文中,为了说明的简洁和明晰起见,第一到第二通道预测误差e1,i被简称为第一预测误差。在示例中,该计算涉及将第二LP滤波器系数组a2,i转换成第二LSF,在本文中被表示为f2,i,i=0:M-1,并通过以下下公式来计算第一预测误差e1,i,i=0:M-1:
Figure BDA0002290488580000141
其中,e表示被设置成M维向量的第一预测误差e1,i,i=0:M-1,并且其中,f2表示被设置成M维向量的第二LSF f2,i,i=0:M-1。
方法400进一步进行到通过使用(第二)预定义的量化器来量化第一预测误差e1,i,i=0:M-1,如框412中所示,从而获得量化的第一预测误差
Figure BDA0002290488580000152
(第二)预定义的量化器可被称为第一到第二通道量化器。LP量化器332获得量化的第二LSF
Figure BDA0002290488580000153
为预测的第二LSF和量化的第一预测误差
Figure BDA0002290488580000155
的组合,例如,通过:
其中,
Figure BDA0002290488580000156
表示被设置成M维向量的量化的第二LSF f2,i,i=0:M-1。
LP量化器332进一步将量化的第二LSF
Figure BDA0002290488580000157
转换成LP滤波器系数表示,从而获得量化的第二LP滤波器系数
Figure BDA0002290488580000158
以提供给第二LP分析滤波器334-2,以使得能够在其中进行LP分析滤波。
LP量化器332进一步对量化的第一预测误差
Figure BDA0002290488580000159
进行编码,并将标识编码的第一预测误差的信息(例如,一个或多个码字)作为编码的LPC参数的一部分提供给比特流格式器229以包括在编码音频信号125中。第一预测误差e1,i,i=0:M-1的量化可使用本领域已知的任何适合的向量量化器来进行,例如,多级向量量化器(MSVQ)或多级格型向量量化器(MSLVQ)。无论用于量化第一预测误差e1,i,i=0:M-1的量化技术的细节如何,量化都会使得导出一个或多个码字,这些码字用于表示编码的量化第二LP滤波器系数
Figure BDA00022904885800001510
图5的流程图示出了由LP量化器332进行的LP量化过程的另一个示例,其表示用于量化第一LP滤波器系数a1,i和第二LP滤波器系数a2,i的方法500的步骤。根据该示例的LP量化过程开始于通过使用(第一)预定义的量化器来量化第一LP滤波器系数组a1,i,如框402中所示并且在上文中在方法400的上下文中所描述的。
方法500进行到使用量化的第一LP滤波器系数
Figure BDA00022904885800001511
对第二通道223-2的帧应用LP分析滤波,如框404中所示。由于第一通道223-1和第二通道223-2是基于相同的音频输入信号115而导出的,因此,很可能它们在某种程度上表现出频谱相似性,从而使得表示第一通道223-1信号的频谱包络的量化的第一LP系数得以提供表示第二通道223-1信号的频谱包络的第二LP系数的合理估计。
例如,可以根据以下公式来提供框404的LP分析滤波:
Figure BDA0002290488580000161
其中,
Figure BDA0002290488580000162
表示量化的第一LP滤波器系数,L表示帧长(以样本数量为单位),x2(t),t=t+1:t+L表示第二通道223-2中的信号的帧(即,一系列在时间上的第二通道样本),r(t),t=t+1:t+L表示所得到的残差信号。
如果在框406中的评估表明残差信号r(t)的能量高于预定义的阈值,则量化的第一LP滤波器系数被认为与第二通道223-2中的信号匹配很差,并且方法500进行到执行与在上文中所述的框408到412有关的操作。相反,如果残差信号r(t)的能量不高于预定义的阈值,则第一LP滤波器系数
Figure BDA0002290488580000164
被认为与第二通道223-2中的信号充分匹配,并且如框416中所示,它们也被选择用作量化的第二LP滤波器系数
在方法500的示例性变形中,框406的评估涉及将第二通道223-2中的信号帧的能量与第二阈值进行比较:如果该能量高于第二阈值,则第二通道223-1中的信号的频谱包络被认为传送了大量信息,并且方法500的该变形进行到执行与在上文中所述的框408到414有关的操作。相反,如果该能量不高于第二阈值,则第二通道223-1中的信号的频谱包络被认为传送较少量的信息,并且第一LP滤波器系数
Figure BDA0002290488580000166
被假定为与第二通道滤波器223-2充分匹配,并且它们也被选择用作量化的第二LP滤波器系数
Figure BDA0002290488580000167
(框416)。
在方法500的另一个示例性变形中,框406的评估涉及将第二通道223-2中的信号帧的能量与残差信号r(t)的能量之间的差与第三阈值进行比较:如果该差高于第三阈值,则第一LP滤波器系数
Figure BDA0002290488580000168
被认为与第二通道223-2中的信号充分匹配,并且它们也被选择用作量化的第二LP滤波器系数
Figure BDA0002290488580000169
(框416),而如果该差不高于第三阈值,则量化的第一LP滤波器系数
Figure BDA0002290488580000171
被认为与第二通道223-2中的信号匹配很差,并且方法500进行到执行与在上文中所述的框408到414有关的操作。
如果选择第一LP滤波器系数
Figure BDA0002290488580000172
也用作量化的第二LP滤波器系数
Figure BDA0002290488580000173
可针对所述的方法500的框406的评估而导出的残差信号r(t)可被用作当前帧的第二残差信号225-2(即,一系列在时间上的第二残差样本)。
图6的流程图示出了由LP量化器332进行的LP量化过程的另一个示例,其表示用于量化第一LP滤波器系数a1,i和第二LP滤波器系数a2,i的方法700。根据方法700的LP量化过程基于方法400的LP量化构建以提供开关模式量化。就此而言,除了方法400的框402到410之外,方法700还涉及通过使用(第三)预定义的量化器来量化第二LP滤波器系数组a2,i,(第三)预定义的量化器可以包括任何适合的预测量化器,这些预测量化器的预测基于针对相同通道(在这种情况下是第二通道223-2)而导出的量化LP滤波器系数的一个或多个过去值,例如,在上文中在(第一)预定义的量化器的上下文中提及的MA预测向量量化器或AR预测向量量化器(框402)。(第三)预定义的量化器可被称为第二通道量化器。
就此而言,方法700通过使用(第二)预定义的预测器,基于针对第二通道223-2而导出的第二LP滤波器系数的一个或多个过去值来导出进一步预测的第二LP滤波器系数,如框416中所示。(第二)预定义的预测器可被称为第二通道预测器,并且它可被操作为第二通道量化器的一部分。方法700还包括将第二通道预测误差e2,i,i=0:M-1确定为第二LP滤波器系数组a2,i与进一步预测的第二LP滤波器之间的差,如框418中所示。为了说明的简洁和明晰起见,在下文中将第二通道预测误差e2,i简称为第二预测误差。方法700进行到将第二通道预测误差e2,i,i=0:M-1的能量与第一预测误差e1,i,i=0:M-1的能量进行比较(框420):如果第二预测误差的能量小于第一预测误差的能量,则方法700进行到量化第二预测误差e2,i,i=0:M-1(框422)并使用(和编码)量化的第二预测误差以表示量化的第二LP滤波器系数
Figure BDA0002290488580000174
而如果第二预测误差的能量不小于第一预测误差的能量,则方法700进行到量化第一预测误差e1,i,i=0:M-1(框414)并使用(和编码)量化的第一预测误差以表示量化的第二LP滤波器系数
Figure BDA0002290488580000181
除了用作编码的量化第一或第二预测误差的信息之外,还将所选择的第一和第二预测误差中的一个的指示作为编码的LPC参数的一部分提供给比特流格式器229以包括在编码音频信号125中,以使得能够在其中重构量化的第二LP滤波器系数
Figure BDA0002290488580000182
作为框416到422的操作的示例,可以提供第二预测的第二LP滤波器系数作为进一步预测的第二LSF
Figure BDA0002290488580000183
其是基于针对第二通道223-2中的一个或多个过去帧(例如,最近的先前帧)而导出的量化的第二LSF
Figure BDA0002290488580000184
而预测的(框416),而第二预测误差可被导出为第二LSF f2,i,i=0:M-1与进一步预测的第二LSF
Figure BDA0002290488580000186
之间的差(框418)。
可以基于包括第一通道LSF和第二通道LSF的集合的训练数据库来导出预测器矩阵P。例如,可以通过经由通道分解器222以及第一和第二LP分析器331-1、331-2将所期望的音频信号作为输入音频信号115逐帧地进行处理,以获得针对每个处理帧的相应一对第一和第二LSF,从而得到用作训练数据库的第一通道LSF和第二通道LSF的集合,来计算用于训练数据库的第一和第二通道LSF。就此而言,第一通道LSF集合可被提供为矩阵Ω1,其中,第一通道LSF被设置为作为矩阵Ω1的列而提供的向量,而对应的第二通道LSF集合可被提供为矩阵Ω2,其中,第二通道LSF被设置为作为矩阵Ω2的列而提供的向量。
在示例中,预测器矩阵P可被提供为M x M矩阵PM,被导出为
Figure BDA0002290488580000187
其中,表示Ω1的伪逆,从而得到具有M x M个非零预测器系数pi,j的矩阵PM
在另一个示例中,预测器矩阵P可被提供为三对角M x M矩阵P3,其只在主对角线、主对角线下方的第一对角线和主对角线上方的第一对角线上具有非零元素。在这种矩阵中,除了第一个和最后一个之外的行和列只包括三个非零元素,而第一列和最后一列只包括两个非零元素。因此,使用三对角矩阵P3代替矩阵PM作为预测器矩阵P使得能够节省数据存储需求,因为只需要存储非零预测器系数pi,j(其中,|i-j|≤1),而预测性能仍然足够。如下所述,可以基于在Ω1和Ω2中提供的训练数据库来导出三对角矩阵P3
可以根据以下公式求解三对角矩阵P3的第j行的非零预测器系数pi,j
Figure BDA0002290488580000191
其中,
Figure BDA0002290488580000192
其中,N表示训练数据库的矩阵Ω1和Ω2中的第一和第二LSF对的数量。
在另一个示例中,预测器矩阵P可被提供为对角线M x M矩阵P1,即,被提供为其中只主对角线的元素是非零的矩阵。因此,使用对角矩阵P1作为预测器矩阵P使得能够进一步节省数据存储需求,因为至需要存储非零预测器系数pi,j(其中,i=j),而这可能会导致预测性能略有下降。对角矩阵P1的非零预测器系数pi,j可以基于在Ω1和Ω2中提供的训练数据库来导出,例如,根据以下公式:
Figure BDA0002290488580000193
其中,项XjYj
Figure BDA0002290488580000194
是在上文中在定义三对角矩阵P3的上下文中定义的。
在又一个示例中,预测器矩阵P可被提供为M x M矩阵P2,其中,在矩阵的每一行中只提供两个非零元素。这种矩阵可被称为稀疏三对角矩阵。因此,使用矩阵P2作为预测器矩阵P实现了介于通过将三对角矩阵P3或对角矩阵P1用作预测器矩阵P所提供的存储需求和预测性能之间的存储需求和预测性能。可以例如通过使用公式(6)和(7)首先导出三对角矩阵P3并针对所得的三对角矩阵P3的每一行j选择对角元素pj,j的位置和元素pj,j-1和pj,j+1中较大的一个的位置,基于在Ω1和Ω2中提供的训练数据库来导出矩阵P2的非零预测器系数pi,j。一旦已被选择,矩阵P2的非零预测器系数就可以使用具有以下修改的公式(6)和(7)来导出:当导出了第j行的非零预测器系数时:
-如果针对第j行选择了pj,j-1的位置,则在公式(6)中只考虑左上角的2x 2子矩阵以及向量的头两个元素;
-如果针对第j行选择了pj,j+1的位置,则在公式(6)中只考虑右下角的2x 2子矩阵以及向量的最后两个元素。
作为关于预测器矩阵P的另一个示例,下表提供了M=16的三对角矩阵P3内的非零预测器系数pj,j-1、pj,j和pj,j+1的示例:
Figure BDA0002290488580000201
Figure BDA0002290488580000211
LP量化器332分别向第一LP分析滤波器334-1和第二LP分析滤波器提供量化的第一和第二LP滤波器系数
Figure BDA0002290488580000214
第一LP分析滤波器334-1使用量化的第一LP滤波器系数
Figure BDA0002290488580000215
将第一通道223-1的帧处理成第一残差信号225-1的对应帧,例如,根据以下公式:
其中,
Figure BDA0002290488580000216
表示量化的第一LP滤波器系数,L表示帧长(以样本数为单位),x1(t),t=t+1:t+L表示第一通道223-1中的信号的帧(即,一系列在时间上的第一通道样本),r1(t),t=t+1:t+L表示第一残差信号225-1的对应帧(即,一系列在时间上的第一残差样本)。
第二LP分析滤波器334-2使用量化的第二LP滤波器系数
Figure BDA0002290488580000217
将第二通道223-2的帧处理成第二残差信号225-2的对应帧,例如,根据以下公式:
Figure BDA0002290488580000213
其中,
Figure BDA0002290488580000218
表示量化的第二LP滤波器系数,x2(t),t=t+1:t+L表示第二通道223-2中的信号的帧(即,一系列在时间上的第二通道样本),r2(t),t=t+1:t+L表示第二残差信号225-2的对应帧(即,一系列在时间上的第二残差样本)。
第一残差编码器228-1操作以处理第一残差信号225-1的帧,以导出和编码描述了第一残差信号225-1的帧的一个或多个第一残差参数。第一残差编码器228-1中的残差编码可涉及适用的残差编码技术或本领域已知的两个或更多个残差编码技术的组合。作为这方面的非限制性示例,残差编码可以包括长期预测(LTP)编码以处理第一残差信号225-1的帧以提取一个或多个第一LTP参数(例如,LTP滞后和LTP增益),并使用所提取的第一LTP参数将第一残差信号225-1的帧缩减为中间残差信号的对应帧,其进一步例如根据代数码激励线性预测(ACELP)模型经受激励编码以导出一个或多个第一激励参数。第一残差编码器228-1进一步对第一LTP参数和第一激励参数进行编码,并将编码的第一LTP参数和激励参数作为编码的第一残差参数提供给比特流格式器229以包括在编码音频信号125中,从而提供在音频解码器中可用于重构第一残差信号225-1的信息,以用作在其中用于LP合成滤波的激励信号。
遵循类似的原则,第二残差编码器228-2操作以处理第二残差信号225-2的帧,以导出并编码描述了第二残差信号225-2的帧的一个或多个第二残差信号参数。第二残差编码器228-2中的残差编码可以包括适用的残差编码技术或本领域已知的两个或更多个残差编码技术的组合。作为这方面的非限制性示例,残差编码可以包括LTP编码以处理第二残差信号225-2的帧以提取一个或多个第二LTP参数(例如,LTP滞后和LTP增益),并使用所提取的第二LTP参数将第二残差信号225-2的帧缩减为中间残差信号的对应帧,其进一步例如根据ACELP模型经受激励编码以导出一个或多个第二激励参数。第二残差编码器228-2进一步对第二LTP参数和第二激励参数进行编码,并将编码的第二LTP参数和激励参数作为编码的第二残差参数提供给比特流格式器229以包括在编码音频信号125中,从而提供在音频解码器中可用于重构第二残差信号225-2的信息,以用作在其中用于LP合成滤波的激励信号。
对于输入音频信号的每个处理帧,比特流格式器229从LCP编码器224接收编码的LPC参数,从第一残差编码器228-1接收编码的第一残差参数,从第二残差编码器228-2接收编码的第二残差参数,并将这些编码的参数设置成一个或多个PDU以通过网络/通道传输到解码实体130,而音频解码实体130可以进一步包括。
在下文中,在示例性音频解码器230的框架中描述了LPC解码和LP参数去量化技术的一些方面。就此而言,图7示出了音频解码器320的一些组件和/或实体的框图。音频解码器320例如可被提供为音频编码实体130或其一部分。
音频解码器230执行编码的音频信号125的解码以将其解码成重构音频信号135。换句话说,音频解码器230实现了从编码域到信号域(例如时域)的转换,并且它处理作为编码帧序列被接收的编码音频信号125,每个编码帧表现将被解码成构成重构音频信号135的重构左通道信号135-1和重构右通道信号135-2的音频信号段。
比特流读取器239从携带用于帧的编码参数的一个或多个PDU中提取编码的第一残差参数、编码的第二残差参数和编码的LPC参数,并将它们提供给第一残差解码器238-1、第二残差解码器238-2和LPC解码器234。
第一残差解码器238-1执行残差解码以基于编码的第一残差参数生成重构的第一残差信号235-1的帧。作为非限制性示例,第一残差解码器238-1中的残差解码可涉及基于在编码的第一残差参数中接收到的一个或多个第一激励参数来导出重构的第一残差信号的第一分量(例如,根据ACELP模型),基于在编码的第一残差参数中接收到的第一LTP参数(例如,LTP滞后和LTP增益)来导出重构的第一残差信号的第二分量,并将重构的第一残差信号235-2的帧导出为第一和第二分量的组合。
遵循类似的原则,第二残差解码器238-2执行残差解码以基于编码的第二残差参数生成重构的第二残差信号235-2的帧。作为非限制性示例,第二残差解码器238-2中的残差解码可涉及基于在编码的第二残差参数中接收到的一个或多个第二激励参数来导出重构的第二残差信号的第一分量(例如,根据ACELP模型),基于在编码的第二残差参数中接收到的第二LTP参数(例如,LTP滞后和LTP增益)来导出重构的第二残差信号的第二分量,并将重构的第二残差信号235-2的帧导出为第一和第二分量的组合。
LPC解码器234用于基于重构的第一残差信号235-1生成第一通道信号233-1,基于重构的第二残差信号235-2生成第二通道信号233-2。LPC解码器234至少在概念上包括第一LPC解码器234-1和第二LPC解码器234-2。
LPC解码器234,例如,第一LPC解码器234-1,执行LPC解码过程以将重构的第一残差信号235-1的帧处理成重构的第一通道信号233-1的对应帧。由第一LPC解码器234-1进行的LPC解码过程可涉及:重构量化的第一LP滤波器系数;以及应用重构的量化第一LP滤波器系数以执行LP合成滤波,以基于重构的第一残差信号235-1的帧来导出重构的第一通道信号233-1的帧。LPC解码器234还向通道合成器232提供重构的第一通道信号233-1的帧以在其中导出重构音频信号135。
LPC解码器234,例如,第二LPC解码器234-2,执行LPC解码过程以将重构的第二残差信号235-2的帧处理成重构的第二通道信号233-2的对应帧。由第二LPC解码器234-2进行的LPC解码过程可涉及:重构量化的第二LP滤波器系数;以及应用重构的量化第二LP滤波器系数以进行LP合成滤波,以基于重构的第二残差信号235-2的帧来导出重构的第二通道信号233-3的帧。LPC解码器234还向通道合成器232提供重构的第二通道信号233-2的帧以在其中导出重构音频信号135。
作为LPC解码器234的示例,图8示出了LPC解码器330的一些组件和/或实体的框图,LPC解码器330例如可以在图7的框架中用作LPC解码器234或其一部分。
在LPC解码器330中,LP去量化器342操作以基于在编码的LPC参数中接收到的信息来重构量化的第一LP滤波器系数和量化的第二LP滤波器系数
Figure BDA0002290488580000242
量化的第一LP滤波器系数
Figure BDA0002290488580000243
被提供给第一LP合成滤波器344-1,第一LP合成滤波器344-1使用量化的第一LP滤波器系数
Figure BDA0002290488580000244
将重构的第一残差信号235-1的帧处理成第一通道信号233-1的对应帧。量化的第二LP滤波器系数
Figure BDA0002290488580000245
被提供给第二LP合成滤波器344-2,第二LP合成滤波器344-2使用量化的第二LP滤波器系数
Figure BDA0002290488580000246
将重构的第二残差信号235-2的帧处理成第二通道信号233-2的对应帧。
作为示例,LP去量化器342操作以通过基于在编码的LPC参数中接收到的一个或多个量化码字来重构量化的第一LSF
Figure BDA0002290488580000247
来重构量化的第一LP滤波器系数
Figure BDA0002290488580000248
就此而言,LP去量化器342逆转由LP量化器332执行的操作。遵循针对LP量化器332所述的原则,该操作可以使用任何适合的非预测或预测的量化器。LP去量化器342可以进一步将量化的第一LSF
Figure BDA0002290488580000249
转换成LP滤波器系数表示,从而获得量化的第一LP滤波器系数以提供给第一LP合成滤波器344-1以在其中进行LP合成滤波。
LP去量化器342可以进一步操作以根据由图9的流程图所示的示例性重构过程来重构量化的第二LP滤波器系数,图9的流程图表示用于基于重构的第一量化的第一LP滤波器系数
Figure BDA0002290488580000252
来重构量化的第二LP滤波器系数
Figure BDA0002290488580000253
的方法800的步骤。方法800基本上用于基于在上文中所述的方法400,基于编码的LPC参数来重构量化的第二LP滤波器系数
Figure BDA0002290488580000254
在下面通过使用LP滤波器系数的LSF表示作为非限制性示例来概述方法800。
如框802中所示,方法800开始于获得量化的第一LSF
Figure BDA0002290488580000255
Figure BDA0002290488580000256
其表示第一通道信号233-1的帧的频谱包络。如框804中所示,方法800进行到通过使用预测器,基于量化的第一LSF导出预测的第二LSF
Figure BDA0002290488580000258
预定义的预测器是与在LP量化器332中应用的预测器相同的预测器,并且与框804有关的操作与在上文中在框408的上下文中所描述的那些操作相似。
方法800还包括通过使用第一到第二通道量化器(在上文中在框412的上下文中所描述的)来重构量化的第一到第二通道预测误差 (即,简称为第一预测误差),如框806中所示。可以根据在编码的LPC参数中接收到的标识编码的第一预测误差的信息(例如,一个或多个码字)来执行重构。方法800进一步进行到将量化的第二LSF
Figure BDA00022904885800002511
重构为预测的第二LSF
Figure BDA00022904885800002512
和量化的第一预测误差
Figure BDA00022904885800002513
的组合(例如,和),例如,根据公式(4)。
LP去量化器342进一步将量化的第二LSF
Figure BDA00022904885800002514
转换成LP滤波器系数表示,从而获得量化的第二LP滤波器系数
Figure BDA00022904885800002515
以提供给第二LP合成滤波器344-2以在其中进行LP合成滤波。
第一LP合成滤波器344-1接收量化的第一LP滤波器系数
Figure BDA00022904885800002516
并使用它们将重构的第一残差信号235-1的帧处理成重构的第一通道信号233-1的对应帧,例如,根据以下公式:
Figure BDA0002290488580000261
其中,
Figure BDA0002290488580000263
表示量化的第一LP滤波器系数,L表示帧长(以样本数量为单位),表示重构的第一通道信号233-1的帧(即,一系列在时间上的重构的第一通道样本),
Figure BDA0002290488580000265
表示重构的第一残差信号235-1的对应帧(即,一系列在时间上的重构的第一残差样本)。
第二LP合成滤波器344-2接收量化的第二LP滤波器系数并使用它们将重构的第二残差信号235-1的帧处理成重构的第一通道信号233-1的对应帧,例如,根据以下公式:
Figure BDA0002290488580000262
其中,
Figure BDA0002290488580000267
表示量化的第二LP滤波器系数,L表示帧长(以样本数量为单位),
Figure BDA0002290488580000268
表示重构的第二通道信号233-2的帧(即,一系列在时间上的重构的第二通道样本),
Figure BDA0002290488580000269
表示重构的第二残差信号235-2的对应帧(即,一系列在时间上的重构的第二残差样本)。
通道合成器232接收重构的第一通道信号233-1和重构的第二通道信号233-2,并将它们转换成构成重构音频信号135的重构的左通道信号135-1和重构的右通道信号135-2。通常,通道合成器232操作以反转在通道分解器222中提供的分解过程。例如,在经典的中间/侧面分解的情况下,可以将重构的左通道信号135-1导出为重构的第一和第二通道233-1、233-2的和除以二,并且可以将重构的右通道信号135-2导出为第一和第二通道信号233-1、233-2的差除于二。
在上文中的描述将LP滤波器系数的LSF表示用于量化(例如,框402)和预测(例如,框408)。然而,LSF表示用作非限制性示例,并且可以替代地使用LP滤波器系数的不同表示。作为这方面的示例,方法400、500、700和800(及其任何变形)可以替代地使用LP滤波器系数的阻抗频谱频率(ISF)表示,从而操作LP量化器332以将第一和第二LP滤波器系数a1,i、a2,i转换成相应的第一和第二ISF,并基于第一和第二ISF执行量化过程。
在上文中的描述将立体声音频信号用作输入音频信号115。然而,这用作非限制性示例,并且音频处理系统100及其包括音频编码器220和音频解码器230的组件可被设置为处理多于两个通道的多通道信号。作为这种场景的示例,通道分解器222可以接收输入音频信号115的通道115-j,并且可以将第一通道223-1的信号导出为跨输入通道115-k的信号的和(或者为平均值或加权和),而第二通道可被导出为一对通道115-j之间的差或者两个或更多个通道115-j的另一个线性组合。
图10示出了示例性装置600的一些组件的框图。装置600可以包括在图10中未描绘的其它组件、元件或部件。装置600例如可用于实现LPC编码器320或其组件(例如,LP量化器332),或者音频编码器220的一部分,或者不同的音频编码器的一部分,或者与音频编码器分离的实体,或者用于实现LPC解码器330或其组件(例如,LP去量化器342),或者音频解码器230的一部分,或者不同的音频解码器的一部分,或者与音频解码器分离的实体。
装置600包括处理器616和用于存储数据和计算机程序代码617的存储器615。存储器615和存储在其中的计算机程序代码617的一部分可以进一步被设置为与处理器616一起实现在上文中在LPC编码器320(或其组件)的上下文中和/或在LPC解码器330(或其组件)的上下文中描述的功能。
装置600包括用于与其它设备进行通信的通信部件612。通信部件612包括至少一个能够与其它装置进行有线或无线通信的通信装置。通信部件612的通信装置也可被称为相应的通信装置。
装置600还可以包括用户I/O(输入/输出)组件618,其可被设置为可与处理器616和计算机程序代码617的一部分一起提供用于接收来自装置600的用户的输入的用户接口,和/或向装置600的用户提供输出以控制由装置600实现的LPC编码器320(或其组件)和/或LPC解码器330(或其组件)的操作的至少某些方面。用户I/O组件618可以包括硬件组件,诸如显示器、触摸屏、触摸板、鼠标、键盘和/或一个或多个键或按钮的设置等。用户I/O组件618也可被称为外围设备。例如根据计算机程序代码617的一部分并且可能还根据经由用户I/O组件618接收的用户输入和/或根据经由通信部件612接收的信息,处理器616可被设置为控制装置600的操作。
虽然处理器616被示出为单个组件,但是它可被实现为一个或多个单独的处理组件。类似地,虽然存储器615被示出为单个组件,但是它可被实现为一个或多个单独的组件,其中一些或全部可被集成/可移动和/或可以提供永久/半永久/动态/缓存的存储。
存储在存储器615中的计算机程序代码617可以包括计算机可执行指令,其在被加载到处理器616中时控制装置600的操作的一个或多个方面。作为示例,可以将计算机可执行指令提供为一个或多个指令的一个或多个序列。处理器616能够通过从存储器615读取其中包括的一个或多个指令的一个或多个序列来加载和执行计算机程序代码617。一个或多个指令的一个或多个序列可被配置为在由处理器616执行时使得装置600执行在上文中在LPC编码器320(或其组件)的上下文中和/或在LPC解码器330(或其组件)的上下文中描述的操作、过程和/或功能。
因此,装置600可以包括至少一个处理器616和至少一个存储器615,至少一个存储器615包括用于一个或多个程序的计算机程序代码617,至少一个存储器615和计算机程序代码617被配置为与至少一个处理器616一起使得装置600执行在上文中在LPC编码器320(或其组件)的上下文中和/或在LPC解码器330(或其组件)的上下文中描述的操作、过程和/或功能。
例如,可以将存储在存储器615中的计算机程序提供为包括至少一个其上存储有计算机程序代码617的计算机可读非暂时性介质的相应的计算机程序产品,计算机程序代码在由装置600执行时使得装置600至少执行在上文中在LPC编码器320(或其组件)的上下文中和/或在LPC解码器330(或其组件)的上下文中描述的操作。计算机可读非暂时性介质可以包括存储设备或记录介质,诸如CD-ROM、DVD、蓝光光盘或有形地具体化计算机程序的其它制品。作为另一个示例,计算机程序可被提供为被配置为可靠地传送计算机程序的信号。
不应将对处理器的引用理解为仅包括可编程处理器,而是还包括专用电路,诸如现场可编程门阵列(FPGA)、专用集成电路(ASIC)、信号处理器等。
除了明确描述的组合之外,可以以组合的方式使用在先前描述中描述的特征。
虽然已经参考某些特征描述了一些功能,但是那些功能可由其它特征来执行,无论是否进行描述。虽然已经参考某些实施例描述了一些特征,但是那些特征也可以存在于其它实施例中,无论是否进行描述。

Claims (46)

1.一种方法,包括:
获得表示从多通道输入音频信号中导出的第一通道中的音频信号的频谱包络的第一线性预测LP滤波器系数组;
获得表示从所述多通道输入音频信号中导出的第二通道中的音频信号的频谱包络的第二LP滤波器系数组;
使用预定义的第一量化器量化所述第一LP滤波器系数组;以及
基于量化的第一LP滤波器系数组,量化所述第二LP滤波器系数组,所述第二LP滤波器系数组的量化包括:
通过使用预定义的预测器,基于所述量化的第一LP滤波器系数组,导出预测的LP滤波器系数组以估计所述第二通道中的所述音频信号的所述频谱包络;
将预测误差计算为所述第二LP滤波器系数组和所述预测的LP滤波器系数组中的相应LP系数之间的差;以及
使用预定义的第二量化器量化所述预测误差。
2.根据权利要求1所述的方法,其中,所述第一LP滤波器系数组、所述第二LP滤波器系数组和所述预测的LP滤波器系数组中的每一个包括相应的一组以下中的一个:
线频谱频率LSF;
阻抗频谱频率ISF。
3.根据权利要求1或2所述的方法,其中,导出所述预测的LP滤波器系数组包括计算
Figure FDA0002290488570000011
其中,表示按向量设置的所述预测的LP滤波器系数组,表示按向量设置的所述量化的第一LP滤波器系数组,P表示预测器系数的预定义的预测器矩阵。
4.根据权利要求3所述的方法,其中,所述预定义的预测器矩阵包括只在主对角线、所述主对角线下方的第一对角线和所述主对角线上方的第一对角线上具有非零预测器系数的矩阵。
5.根据权利要求4所述的方法,其中,所述预定义的预测器矩阵包括三对角矩阵,其中,所述主对角线、所述主对角线下方的所述第一对角线和所述主对角线上方的所述第一对角线上的所有元素是非零元素。
6.根据权利要求4所述的方法,其中,所述预定义的预测器矩阵包括稀疏三对角矩阵,其中,所述矩阵的每一行恰好包括两个非零元素。
7.根据权利要求3所述的方法,其中,所述预定义的预测器矩阵包括只在主对角线上具有非零预测器系数的对角线矩阵。
8.根据权利要求1至7中任一项所述的方法,包括:
识别所述多通道输入音频信号的两个通道中传送具有更高能量的信号的一个通道;
基于在所述两个通道中识别的通道中的信号,导出用于所述第一通道的所述音频信号;以及
基于在所述两个通道中的另一个通道中的信号,导出用于所述第二通道的所述音频信号。
9.根据权利要求1至7中任一项所述的方法,包括:
将所述第一通道的所述音频信号导出为所述多通道输入音频信号的两个通道中的相应信号的和;以及
将所述第二通道的所述音频信号导出为所述多通道输入音频信号的两个通道中的相应信号的差。
10.根据权利要求1至9中任一项所述的方法,包括:
对所述量化的第一LP滤波器系数组和量化的预测误差进行编码。
11.根据权利要求1至10中任一项所述的方法,还包括:
通过使用所述量化的第一LP滤波器系数组对所述第二通道中的所述音频信号进行滤波以导出残差信号;
响应于所述残差信号的能量超过阈值,继续进行基于所述量化的第一LP滤波器系数组来量化所述第二LP滤波器系数组;以及
响应于所述残差信号的能量未超过阈值,使用所述量化的第一LP滤波器系数组表示所述第二通道中的所述音频信号的所述频谱包络。
12.一种方法,包括:
获得重构的第一线性预测LP滤波器系数组,其表示从多通道输入音频信号中导出的第一通道中的音频信号的频谱包络;以及
重构表示从所述多通道输入音频信号中导出的第二通道中的音频信号的频谱包络的第二LP滤波器系数组,所述重构包括:
通过使用预定义的预测器,基于量化的第一LP滤波器系数组,导出预测的LP滤波器系数组以估计所述第二通道中的所述音频信号的所述频谱包络;
通过使用预定义的量化器,基于一个或多个所接收的码字,重构预测误差;以及
将重构的第二LP滤波器系数组导出为所述预测的LP滤波器系数组和重构的预测误差的组合。
13.根据权利要求12所述的方法,其中,所述第一LP滤波器系数组、所述第二LP滤波器系数组和所述预测的LP滤波器系数组中的每一个包括相应的一组以下中的一个:
线频谱频率LSF;
阻抗频谱频率ISF。
14.根据权利要求12或13所述的方法,其中,导出所述预测的LP滤波器系数组包括计算
Figure FDA0002290488570000031
其中,
Figure FDA0002290488570000032
表示按向量设置的所述预测的LP滤波器系数组,
Figure FDA0002290488570000033
表示按向量设置的所述量化的第一LP滤波器系数组,P表示预测器系数的预定义的预测器矩阵。
15.根据权利要求14所述的方法,其中,所述预定义的预测器矩阵包括只在主对角线、所述主对角线下方的第一对角线和所述主对角线上方的第一对角线上具有非零预测器系数的矩阵。
16.根据权利要求15所述的方法,其中,所述预定义的预测器矩阵包括三对角矩阵,其中,所述主对角线、所述主对角线下方的所述第一对角线和所述主对角线上方的所述第一对角线上的所有元素是非零元素。
17.根据权利要求15所述的方法,其中,所述预定义的预测器矩阵包括稀疏三对角矩阵,其中,所述矩阵的每一行恰好包括两个非零元素。
18.根据权利要求14所述的方法,其中,所述预定义的预测器矩阵包括只在主对角线上具有非零预测器系数的对角线矩阵。
19.根据权利要求12至18中任一项所述的方法,其中,所述第一通道传送基于在所述多通道输入音频信号的两个通道中传送更高能量的一个通道上的信号而导出的音频信号,并且其中,所述第二通道传送基于在所述多通道输入音频信号的所述两个通道中的另一个通道上的信号而导出的音频信号。
20.根据权利要求12至18中任一项所述的方法,其中,所述第一通道传送被导出为所述多通道输入音频信号的两个通道的和的音频信号,并且其中,所述第二通道传送被导出为所述多通道输入音频信号的两个通道的差的音频信号。
21.一种装置,被配置为:
获得表示从多通道输入音频信号中导出的第一通道中的音频信号的频谱包络的第一线性预测LP滤波器系数组;
获得表示从所述多通道输入音频信号中导出的第二通道中的音频信号的频谱包络的第二LP滤波器系数组;
使用预定义的第一量化器量化所述第一LP滤波器系数组;以及
基于量化的第一LP滤波器系数组,量化所述第二LP滤波器系数组,所述第二LP滤波器系数组的量化包括:
通过使用预定义的预测器,基于所述量化的第一LP滤波器系数组,导出预测的LP滤波器系数组以估计所述第二通道中的所述音频信号的所述频谱包络;
将预测误差计算为所述第二LP滤波器系数组和所述预测的LP滤波器系数组中的相应LP系数之间的差;以及
使用预定义的第二量化器量化所述预测误差。
22.根据权利要求21所述的装置,其中,所述第一LP滤波器系数组、所述第二LP滤波器系数组和所述预测的LP滤波器系数组中的每一个包括相应的一组以下中的一个:
线频谱频率LSF;
阻抗频谱频率ISF。
23.根据权利要求21或22所述的装置,被配置为通过计算以下公式来导出所述预测的LP滤波器系数组:
Figure FDA0002290488570000051
其中,
Figure FDA0002290488570000052
表示按向量设置的所述预测的LP滤波器系数组,表示按向量设置的所述量化的第一LP滤波器系数组,P表示预测器系数的预定义的预测器矩阵。
24.根据权利要求23所述的装置,其中,所述预定义的预测器矩阵包括只在主对角线、所述主对角线下方的第一对角线和所述主对角线上方的第一对角线上具有非零预测器系数的矩阵。
25.根据权利要求24所述的装置,其中,所述预定义的预测器矩阵包括三对角矩阵,其中,所述主对角线、所述主对角线下方的所述第一对角线和所述主对角线上方的所述第一对角线上的所有元素是非零元素。
26.根据权利要求24所述的装置,其中,所述预定义的预测器矩阵包括稀疏三对角矩阵,其中,所述矩阵的每一行恰好包括两个非零元素。
27.根据权利要求23所述的装置,其中,所述预定义的预测器矩阵包括只在主对角线上具有非零预测器系数的对角线矩阵。
28.根据权利要求21至27中任一项所述的装置,被配置为:
识别所述多通道输入音频信号的两个通道中传送具有更高能量的信号的一个通道;
基于在所述两个通道中识别的通道中的信号,导出用于所述第一通道的所述音频信号;以及
基于在所述两个通道中的另一个通道中的信号,导出用于所述第二通道的所述音频信号。
29.根据权利要求21至27中任一项所述的装置,被配置为:
将所述第一通道的所述音频信号导出为所述多通道输入音频信号的两个通道中的相应信号的和;以及
将所述第二通道的所述音频信号导出为所述多通道输入音频信号的两个通道中的相应信号的差。
30.根据权利要求21至29中任一项所述的装置,被配置为:
对所述量化的第一LP滤波器系数组和量化的预测误差进行编码。
31.根据权利要求21至29中任一项所述的装置,被配置为:
通过使用所述量化的第一LP滤波器系数组对所述第二通道中的所述音频信号进行滤波以导出残差信号;
响应于所述残差信号的能量超过阈值,继续进行基于所述量化的第一LP滤波器系数组来量化所述第二LP滤波器系数组;以及
响应于所述残差信号的能量未超过阈值,使用所述量化的第一LP滤波器系数组表示所述第二通道中的所述音频信号的所述频谱包络。
32.一种装置,被配置为:
获得重构的第一线性预测LP滤波器系数组,其表示从多通道输入音频信号中导出的第一通道中的音频信号的频谱包络;以及
重构表示从所述多通道输入音频信号中导出的第二通道中的音频信号的频谱包络的第二LP滤波器系数组,所述重构包括:
通过使用预定义的预测器,基于量化的第一LP滤波器系数组,导出预测的LP滤波器系数组以估计所述第二通道中的所述音频信号的所述频谱包络;
通过使用预定义的量化器,基于一个或多个所接收的码字,重构预测误差;以及
将重构的第二LP滤波器系数组导出为所述预测的LP滤波器系数组和重构的预测误差的组合。
33.根据权利要求32所述的装置,其中,所述第一LP滤波器系数组、所述第二LP滤波器系数组和所述预测的LP滤波器系数组中的每一个包括相应的一组以下中的一个:
线频谱频率LSF;
阻抗频谱频率ISF。
34.根据权利要求32或33所述的装置,被配置为通过计算以下公式来导出所述预测的LP滤波器系数组:
Figure FDA0002290488570000071
其中,表示按向量设置的所述预测的LP滤波器系数组,
Figure FDA0002290488570000073
表示按向量设置的所述量化的第一LP滤波器系数组,P表示预测器系数的预定义的预测器矩阵。
35.根据权利要求34所述的装置,其中,所述预定义的预测器矩阵包括只在主对角线、所述主对角线下方的第一对角线和所述主对角线上方的第一对角线上具有非零预测器系数的矩阵。
36.根据权利要求35所述的装置,其中,所述预定义的预测器矩阵包括三对角矩阵,其中,所述主对角线、所述主对角线下方的所述第一对角线和所述主对角线上方的所述第一对角线上的所有元素是非零元素。
37.根据权利要求35所述的装置,其中,所述预定义的预测器矩阵包括稀疏三对角矩阵,其中,所述矩阵的每一行恰好包括两个非零元素。
38.根据权利要求34所述的装置,其中,所述预定义的预测器矩阵包括只在主对角线上具有非零预测器系数的对角线矩阵。
39.根据权利要求32至38中任一项所述的装置,其中,所述第一通道传送基于在所述多通道输入音频信号的两个通道中传送更高能量的一个通道上的信号而导出的音频信号,并且其中,所述第二通道传送基于在所述多通道输入音频信号的所述两个通道中的另一个通道上的信号而导出的音频信号。
40.根据权利要求32至39中任一项所述的装置,其中,所述第一通道传送被导出为所述多通道输入音频信号的两个通道的和的音频信号,并且其中,所述第二通道传送被导出为所述多通道输入音频信号的两个通道的差的音频信号。
41.一种装置,包括:
用于获得表示从多通道输入音频信号中导出的第一通道中的音频信号的频谱包络的第一线性预测LP滤波器系数组的装置;
用于获得表示从所述多通道输入音频信号中导出的第二通道中的音频信号的频谱包络的第二LP滤波器系数组的装置;
用于使用预定义的第一量化器量化所述第一LP滤波器系数组的装置;以及
用于基于量化的第一LP滤波器系数组,量化所述第二LP滤波器系数组的装置,所述用于量化所述第二LP滤波器系数组的装置被配置为:
通过使用预定义的预测器,基于所述量化的第一LP滤波器系数组,导出预测的LP滤波器系数组以估计所述第二通道中的所述音频信号的所述频谱包络;
将预测误差计算为所述第二LP滤波器系数组和所述预测的LP滤波器系数组中的相应LP系数之间的差;以及
使用预定义的第二量化器量化所述预测误差。
42.一种装置,包括:
用于获得重构的第一线性预测LP滤波器系数组的装置,所述第一线性预测LP滤波器系数组表示从多通道输入音频信号中导出的第一通道中的音频信号的频谱包络;以及
用于重构表示从所述多通道输入音频信号中导出的第二通道中的音频信号的频谱包络的第二LP滤波器系数组的装置,所述用于重构的装置被配置为:
通过使用预定义的预测器,基于量化的第一LP滤波器系数组,导出预测的LP滤波器系数组以估计所述第二通道中的所述音频信号的所述频谱包络;
通过使用预定义的量化器,基于一个或多个所接收的码字,重构预测误差;以及
将重构的第二LP滤波器系数组导出为所述预测的LP滤波器系数组和重构的预测误差的组合。
43.一种装置,包括至少一个处理器;以及包括计算机程序代码的至少一个存储器,所述计算机程序代码在由所述至少一个处理器执行时使得所述装置:
获得表示从多通道输入音频信号中导出的第一通道中的音频信号的频谱包络的第一线性预测LP滤波器系数组;
获得表示从所述多通道输入音频信号中导出的第二通道中的音频信号的频谱包络的第二LP滤波器系数组;
使用预定义的第一量化器量化所述第一LP滤波器系数组;以及
基于量化的第一LP滤波器系数组,量化所述第二LP滤波器系数组,所述第二LP滤波器系数组的量化包括:
通过使用预定义的预测器,基于所述量化的第一LP滤波器系数组,导出预测的LP滤波器系数组以估计所述第二通道中的所述音频信号的所述频谱包络;
将预测误差计算为所述第二LP滤波器系数组和所述预测的LP滤波器系数组中的相应LP系数之间的差;以及
使用预定义的第二量化器量化所述预测误差。
44.一种装置,包括至少一个处理器;以及包括计算机程序代码的至少一个存储器,所述计算机程序代码在由所述至少一个处理器执行时使得所述装置:
获得重构的第一线性预测LP滤波器系数组,其表示从多通道输入音频信号中导出的第一通道中的音频信号的频谱包络;以及
重构表示从所述多通道输入音频信号中导出的第二通道中的音频信号的频谱包络的第二LP滤波器系数组,所述重构包括:
通过使用预定义的预测器,基于量化的第一LP滤波器系数组,导出预测的LP滤波器系数组以估计所述第二通道中的所述音频信号的所述频谱包络;
通过使用预定义的量化器,基于一个或多个所接收的码字,重构预测误差;以及
将重构的第二LP滤波器系数组导出为所述预测的LP滤波器系数组和重构的预测误差的组合。
45.一种计算机程序,包括计算机可读程序代码,所述计算机可读程序代码被配置为当在计算装置上运行时使得执行根据权利要求1至20中任一项所述的方法。
46.一种计算机程序产品,包括有形地具体化在非暂时性计算机可读介质上的计算机可读程序代码,所述程序代码被配置为当在计算装置上运行时使得执行根据权利要求1至20中任一项所述的方法。
CN201780091280.3A 2017-04-10 2017-04-10 用于音频编码或解码的方法及装置 Active CN110709925B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/FI2017/050256 WO2018189414A1 (en) 2017-04-10 2017-04-10 Audio coding

Publications (2)

Publication Number Publication Date
CN110709925A true CN110709925A (zh) 2020-01-17
CN110709925B CN110709925B (zh) 2023-09-29

Family

ID=58632430

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780091280.3A Active CN110709925B (zh) 2017-04-10 2017-04-10 用于音频编码或解码的方法及装置

Country Status (5)

Country Link
US (1) US11176954B2 (zh)
EP (1) EP3610481B1 (zh)
CN (1) CN110709925B (zh)
ES (1) ES2911515T3 (zh)
WO (1) WO2018189414A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112289327A (zh) * 2020-10-29 2021-01-29 北京百瑞互联技术有限公司 一种lc3音频编码器后置残差优化方法、装置和介质
WO2021218229A1 (zh) * 2020-04-28 2021-11-04 华为技术有限公司 一种线性预测编码参数的编码方法和编码装置

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1458646A (zh) * 2003-04-21 2003-11-26 北京阜国数字技术有限公司 一种滤波参数矢量量化和结合量化模型预测的音频编码方法
CN1973319A (zh) * 2004-06-21 2007-05-30 皇家飞利浦电子股份有限公司 编码和解码多通道音频信号的方法和设备
CN101147191A (zh) * 2005-03-25 2008-03-19 松下电器产业株式会社 语音编码装置和语音编码方法
US20100322429A1 (en) * 2007-09-19 2010-12-23 Erik Norvell Joint Enhancement of Multi-Channel Audio
CN102341848A (zh) * 2009-01-06 2012-02-01 斯凯普有限公司 语音编码
CN102648494A (zh) * 2009-10-08 2012-08-22 弗兰霍菲尔运输应用研究公司 多模式音频信号解码器、多模式音频信号编码器、使用基于线性预测编码的噪声塑形的方法与计算机程序
CN106415716A (zh) * 2014-03-14 2017-02-15 弗劳恩霍夫应用研究促进协会 编码器、解码器以及用于编码和解码的方法
WO2017050972A1 (en) * 2015-09-25 2017-03-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder and method for encoding an audio signal with reduced background noise using linear predictive coding

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070056081A (ko) * 2004-08-31 2007-05-31 마츠시타 덴끼 산교 가부시키가이샤 스테레오 신호 생성 장치 및 스테레오 신호 생성 방법
BRPI0516201A (pt) * 2004-09-28 2008-08-26 Matsushita Electric Ind Co Ltd aparelho de codificação escalonável e método de codificação escalonável
EP1818911B1 (en) * 2004-12-27 2012-02-08 Panasonic Corporation Sound coding device and sound coding method
WO2006126115A2 (en) * 2005-05-25 2006-11-30 Koninklijke Philips Electronics N.V. Predictive encoding of a multi channel signal
WO2008126382A1 (ja) * 2007-03-30 2008-10-23 Panasonic Corporation 符号化装置および符号化方法
WO2008132826A1 (ja) * 2007-04-20 2008-11-06 Panasonic Corporation ステレオ音声符号化装置およびステレオ音声符号化方法
EP3353778B1 (en) * 2015-09-25 2023-07-05 VoiceAge Corporation Method and system using a long-term correlation difference between left and right channels for time domain down mixing a stereo sound signal into primary and secondary channels

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1458646A (zh) * 2003-04-21 2003-11-26 北京阜国数字技术有限公司 一种滤波参数矢量量化和结合量化模型预测的音频编码方法
CN1973319A (zh) * 2004-06-21 2007-05-30 皇家飞利浦电子股份有限公司 编码和解码多通道音频信号的方法和设备
CN101147191A (zh) * 2005-03-25 2008-03-19 松下电器产业株式会社 语音编码装置和语音编码方法
US8768691B2 (en) * 2005-03-25 2014-07-01 Panasonic Corporation Sound encoding device and sound encoding method
US20100322429A1 (en) * 2007-09-19 2010-12-23 Erik Norvell Joint Enhancement of Multi-Channel Audio
CN102341848A (zh) * 2009-01-06 2012-02-01 斯凯普有限公司 语音编码
CN102648494A (zh) * 2009-10-08 2012-08-22 弗兰霍菲尔运输应用研究公司 多模式音频信号解码器、多模式音频信号编码器、使用基于线性预测编码的噪声塑形的方法与计算机程序
CN106415716A (zh) * 2014-03-14 2017-02-15 弗劳恩霍夫应用研究促进协会 编码器、解码器以及用于编码和解码的方法
WO2017050972A1 (en) * 2015-09-25 2017-03-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder and method for encoding an audio signal with reduced background noise using linear predictive coding

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
HENDRIK FUCHS: "Improving joint stereo audio coding by adaptive inter-channel prediction", 《PROCEEDINGS OF IEEE WORKSHOP ON APPLICATIONS OF SIGNAL PROCESSING TO AUDIO AND ACOUSTICS》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021218229A1 (zh) * 2020-04-28 2021-11-04 华为技术有限公司 一种线性预测编码参数的编码方法和编码装置
CN112289327A (zh) * 2020-10-29 2021-01-29 北京百瑞互联技术有限公司 一种lc3音频编码器后置残差优化方法、装置和介质

Also Published As

Publication number Publication date
EP3610481B1 (en) 2022-03-16
WO2018189414A1 (en) 2018-10-18
ES2911515T3 (es) 2022-05-19
CN110709925B (zh) 2023-09-29
EP3610481A1 (en) 2020-02-19
US11176954B2 (en) 2021-11-16
US20200126575A1 (en) 2020-04-23

Similar Documents

Publication Publication Date Title
JP4963963B2 (ja) スケーラブル符号化装置、スケーラブル復号装置、スケーラブル符号化方法およびスケーラブル復号方法
KR101344174B1 (ko) 오디오 신호 처리 방법 및 오디오 디코더 장치
JP4934020B2 (ja) 可逆マルチチャネル・オーディオ・コーデック
JP5186054B2 (ja) マルチステージコードブックおよび冗長コーディング技術フィールドを有するサブバンド音声コーデック
JP5608660B2 (ja) エネルギ保存型マルチチャネルオーディオ符号化
KR100859881B1 (ko) 음성 신호 코딩
EP2272062B1 (en) An audio signal classifier
KR101162275B1 (ko) 오디오 신호 처리 방법 및 장치
JP5267362B2 (ja) オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラムならびに映像伝送装置
JP6368029B2 (ja) 雑音信号処理方法、雑音信号生成方法、符号化器、復号化器、並びに符号化および復号化システム
JP2010020346A (ja) 音声信号および音楽信号を符号化する方法
EP3776548A1 (en) Truncateable predictive coding
JP6113278B2 (ja) 改良された確率分布推定を使用する線形予測に基づくオーディオ符号化
KR20060135699A (ko) 신호 복호화 장치 및 신호 복호화 방법
JP2009512895A (ja) スペクトル・ダイナミックスに基づく信号コーディング及びデコーディング
CN110709925B (zh) 用于音频编码或解码的方法及装置
JPH0341500A (ja) 低遅延低ビツトレート音声コーダ
KR102380642B1 (ko) 스테레오 신호 인코딩 방법 및 인코딩 장치
WO2000063878A1 (fr) Codeur de parole, processeur de parole et procede de traitement de la parole
KR102353050B1 (ko) 스테레오 신호 인코딩에서의 신호 재구성 방법 및 디바이스
EP3252763A1 (en) Low-delay audio coding
JP5774490B2 (ja) 符号化装置、復号装置およびこれらの方法
JP4195598B2 (ja) 符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、復号化プログラム
JP6856644B2 (ja) ビデオ情報を用いたオーディオエンコーディング
WO2018073486A1 (en) Low-delay audio coding

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant