CN101611550A - 音频量化 - Google Patents

音频量化 Download PDF

Info

Publication number
CN101611550A
CN101611550A CNA2008800035681A CN200880003568A CN101611550A CN 101611550 A CN101611550 A CN 101611550A CN A2008800035681 A CNA2008800035681 A CN A2008800035681A CN 200880003568 A CN200880003568 A CN 200880003568A CN 101611550 A CN101611550 A CN 101611550A
Authority
CN
China
Prior art keywords
audio signal
error
quantizes
nonanticipating
fragment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2008800035681A
Other languages
English (en)
Other versions
CN101611550B (zh
Inventor
A·拉莫
L·拉克索宁
A·瓦西拉凯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Technologies Oy
Original Assignee
Nokia Oyj
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Oyj filed Critical Nokia Oyj
Publication of CN101611550A publication Critical patent/CN101611550A/zh
Application granted granted Critical
Publication of CN101611550B publication Critical patent/CN101611550B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Stereophonic System (AREA)
  • Diaphragms For Electromechanical Transducers (AREA)
  • Traffic Control Systems (AREA)

Abstract

为了在音频信号编码的范围内支持预测或非预测量化的选择,确定音频信号片段的非预测量化产生的误差是否在预定的阈值之下。至少在确定音频信号片段的非预测量化产生的误差在预定阈值之下的情况下,提供用非预测量化进行量化的音频信号片段作为已编码音频信号的一部分。否则,提供用预测量化进行量化的音频信号片段作为已编码音频信号的一部分。

Description

音频量化
技术领域
本发明一般涉及音频编码领域,特别涉及音频量化领域。
背景技术
音频编码器和解码器(编解码器)用于通信、多媒体和存储系统中的多种应用。音频编码器用于对例如语音等音频信号进行编码,特别是用于使得音频信号的高效传输或存储成为可能,而音频解码器基于所接收到的编码信号构建合成信号。
在实施编解码器时,因此,在保持合成信号的高质量的同时节省传输与存储容量成为目标。另外,关于传输误差的鲁棒性也是重要的,特别是基于互联网协议的语音(VoIP)与移动应用。另一方面,编解码器的复杂性受到应用平台的处理功率的限制。
在典型的语音编码器中,输入语音信号以片段(segment)——其被称为帧——为单位受到处理。通常,帧的长度为10-30ms。另外,后续帧的5-15ms的超前(lookahead)片段可能是可用的。帧可被进一步分为多个子帧。对于每个帧,编码器确定输入信号的参数表达。参数被量化并通过通信信道传输,或以数字形式存储在存储介质中。在接收端,解码器基于所接收的参数构建合成信号。
参数的构建和量化通常基于码本(codebook),码本包含对于量化工作最优的代码矢量。在许多情况下,较高的压缩比需要高度最优化的码本。通过使用来自之前帧的预测,常常能对给定的压缩比改进量化器的性能。这样的量化在下文中将被称为预测量化,与此形成对比的是非预测量化,其不依赖于任何来自前面的帧的信息。预测量化利用当前音频帧与至少一个相邻音频帧之间的相关性以便获得对于当前帧的预测,使得例如仅需对这种预测的偏差进行编码,其也需要专用的码本。
然而,在传输或存储中存在错误的情况下,预测量化可能产生问题。对于预测量化,如果预测所基于的至少一个先前帧错误,则即使在正确接收时,也不能完美地对新的帧进行解码。因此,可以偶尔使用非预测量化,以便防止长时间的错误传播。对于这样的偶发非预测量化——其也被称为“安全网(safety-net)”量化,可使用码本选择器以便在预测和非预测码本之间进行选择。
发明内容
在存储或传输存在以及不存在误差的情况下,尽管安全网量化在整体性能方面是对纯预测量化的改进,但是仍然存在由于量化的预测特性导致的重要问题。通常,对于差不多70-80%的帧使用预测。因此在帧擦除(frameerasure)的情况下,常常丢失多至五个帧,因为在行中仍有许多连续的预测帧。
可以相对于预测量化的使用增加非预测量化的使用。例如,这可通过基于计数器的非预测量化的强制选择来实现,这仅允许例如三个连续帧被基于预测进行量化。另一种选择可以是使用较少的预测,例如通过使用预测器矩阵中较小的系数。又一种选择可为是对于量化选择器使用优选增益。也就是说,在预测量化被选择之前,可要求其在量化误差方面比非预测量化好1.3倍,因此减少预测量化的使用。所有这些选择都适合增大在存储或传输误差方面的鲁棒性,但在清洁信道的情况下降低了量化性能。
描述了一种方法,其包括确定音频信号片段的非预测量化导致的误差是否在预定阈值之下。该方法进一步包括,至少在确定音频信号片段的非预测量化导致的误差在预定阈值之下的情况下,提供用非预测量化进行量化的音频信号片段作为已编码音频信号的一部分。该方法进一步包括,否则,提供用预测量化进行量化的音频信号片段作为已编码音频信号的一部分。
另外,描述了一种设备,其包括处理部件,该部件被配置为确定音频信号片段的非预测量化导致的误差是否在预定阈值之下。该设备进一步包括处理部件,该部件被配置为至少在确定音频信号片段的非预测量化导致的误差在预定阈值之下的情况下,提供用非预测量化进行量化的音频信号片段作为已编码音频信号的一部分。该设备进一步包括处理部件,该部件被配置为否则提供用预测量化进行量化的音频信号片段作为已编码音频信号的一部分。
所描述的设备的处理部件可以为不同的部件或是单个部件。处理部件可进一步在硬件和/或软件中实现。例如,它们可由执行用于实现所需功能的计算机程序代码的处理器来实现。或者,例如它们可由被设计为实现所需功能的硬件电路来实现,例如在芯片组或芯片中实现,如集成电路。所描述的设备例如可以与所包含的处理部件相同,或者,其还可包含另外的部件。
此外,描述了一种电子设备,该设备包括所描述的设备和音频输入部件。这样的电子设备可以是需要对音频数据进行编码的任何设备,例如移动电话、记录设备、个人计算机或膝上型电脑等等。
此外,描述了一种系统,其包括所描述的设备,另外还包括进一步的设备,所述进一步的设备包括处理部件,该部件被配置为对由所描述的设备提供的已编码音频信号进行解码。
最后,提出了一种计算机程序产品,其中,在计算机可读介质中存储程序代码。程序代码在由处理器执行时实现所提出的方法。
计算机程序产品可以是例如单独的存储设备,或要被集成在电子设备中的存储器。
本发明被理解为覆盖还独立于计算机程序产品以及计算机可读介质的计算机程序代码。
本发明由这样的考虑出发:低于特定阈值,已编码音频信号片段中的量化误差可以忽略。因此提出:每当被考虑的误差不超过预定阈值时,允许选择非预测量化。在其余时间中,可选择预测量化,或者,可对预测与非预测量化之间的选择评估进一步的准则。
本发明因此提供了在信道误差的情况下提高编码性能的可能。在目标平均量化误差增大时,阈值可被设为低到足以使误差难以听见或根本听不见。
在本发明一实施例中,预定阈值因此是这样的阈值:低于该阈值,误差被认为是听不见的。
例如,可以假设,如果由于量化引起的谱失真低于1db,则失真不能被听见。因此,如果非预测量化产生0.9dB的谱失真,则从人类听觉的观点来看已经足够了,不必用预测量化对特定音频信号片段进行量化以获得例如0.5dB的极低的谱失真。尽管对于个体音频信号片段来说绝对误差较大,但是量化误差在这种情况下不能被听见。如果在此音频信号片段之前存在音频信号分段擦除,则预测量化可能较差地进行,但非预测量化产生的参数可被完美解码。因此,改进仅仅对于具有误差的音频信号片段变得能听见,而对于清洁的信道,不存在能听见的劣化。
由上述可见,可与预定阈值进行比较的合适的误差因此可以和在原始音频信号片段与非预测量化产生的音频信号片段之间的频率范围上的谱失真有关。例如,对于属于音频信号片段的线谱频率(LSF)参数或导抗谱频率(ISF)参数,在该频率范围上的谱失真方面的计算误差也是合适的。
相应的音频信号片段的谱失真SD可用下面的公式表示:
SD = 1 π ∫ 0 π [ log S ( ω ) - log S ^ ( ω ) ] 2 dω
其中,
Figure G2008800035681D00042
与S(ω)分别为具有和不具有量化的情况下语音帧的频谱。而该频谱失真例如可是线性预测编码(LPC)参数的量化选择和码本的特别精确的测量,可通过使用较为简单的方法来减少确定这种谱失真的计算量。
例如,通过合并原始音频信号片段的相应分量和非预测量化产生的音频信号片段的对应分量之间的加权误差,也可获得所考虑的误差。例如,误差可通过合并加权均方误差来获得,且误差的加权可以是例如心理听觉意义的加权。表述“心理听觉意义加权矢量”意味着,加权矢量着重于与不会被人耳明显辨认的音频信号相比可由人耳辨认的音频信号中的谱分量。加权矢量可用几种方式计算。
这样的心理听觉意义误差例如可以是ISF或LSF矢量值之间的加权均方误差。
通常,可以理解所考虑的误差可基于整个已量化音频信号片段或基于部分量化的音频信号片段来确定,例如基于所选择的量化参数。
所提出的基于阈值的准则也可与多种其它类型的准则结合使用。
在使用这样的附加准则的一个实施例中,还确定音频信号片段的非预测量化产生的误差是否小于音频信号片段的预测量化产生的误差。于是,在音频信号片段的非预测量化产生的误差小于音频信号片段的预测量化产生的误差的情况下,可额外地提供通过非预测量化进行量化的音频信号片段。结果,即使在没有传输或存储误差的情况下,对其余音频信号片段实现了误差的绝对最小化。
在此实施例中,在确定音频信号片段的非预测量化产生的误差是否小于音频信号片段的预测量化产生的误差之前,非预测量化和预测量化产生的误差中的至少一个可被进一步加权。这样的加权允许对于预测量化优选非预测量化。
在使用这样的附加准则的另一实施例中,还确定最新提供的量化音频信号片段是否属于用预测量化进行量化的音频信号片段序列,在该序列中,片段的数量超过预定的数量。在确定已经提供在序列中的通过预测量化进行量化的音频信号片段的数量超过预定数量的情况下,可额外地提供用非预测量化进行量化的音频信号片段。
将理解,所有提出的示例性实施例还可以以任何合适的组合来使用。
还将理解,可通过任何类型的音频编解码器来应用所描述的方法、设备、设备、系统和程序代码。
所介绍的发明的任何实施例例如可在变比特率-嵌入式变速率语音编解码器(VBR-EV)的核心层上使用。这样的编解码器可以是支持50-7000Hz的频率范围的宽带编解码器,比特率从8到32kbps。编解码器核心可工作在8kbps,而具有相当小的间隔尺寸的其它层可提高观测到的语音和音频质量。例如,由同一嵌入比特流,可能有可用的8/12/16/24以及32kbps至少五种比特率。
结合附图阅读下面的详细描述,本发明的其它目的和特征将变得明显。然而,将理解,附图仅仅出于说明目的而被设计,不是对本发明进行的限定,本发明的限制应当参照所附权利要求。还应理解,附图不是按比例绘制的,仅仅用于概念性地示出这里所描述的结构和过程。
附图说明
图1为根据本发明一实施例的系统的示意框图;
图2是示例性示出图1的系统中预测或非预测量化的选择的图;以及
图3是根据本发明一实施例的装置的示意框图。
具体实施方式
图1是示例性系统的示意框图,其中,可实现根据本发明一实施例的预测或非预测量化的选择。术语非预测量化和安全网量化将同义地使用。
该系统包括第一电子装置100和第二电子装置150。第一电子装置100被配置为编码音频数据用于宽带传输,第二电子装置150被配置为对已编码音频数据进行解码。
电子装置100包括音频输入部件111,其经由芯片120连接到传输部件(TX)112。
音频输入部件111可以是例如麦克风或到提供音频数据的另一装置的接口。
芯片120可以是例如包含用于音频编码器121的电路的集成电路(IC),示意性地示出了其选择功能块。它们包括参数化部件124和量化部件125。
传输部件112被配置为实现到另一装置的数据传输,例如经由有线或无线链路到电子装置150。
将理解,所示出的连接可经由多种未示出的部件来实现。
编码器121或芯片120可被看作根据本发明的示例性设备,量化部件可被看作表示对应的处理部件。
电子装置150包含接收部件162,其经由芯片170被连接到音频输出部件161。
接收部件162被配置为实现对来自另一装置的数据的接收,例如经由有线或无线链路来自电子装置100。
芯片170可以是例如包含用于音频解码器171的电路的集成电路,其合成部件174被示出。
音频输出部件161可以是例如扬声器或到已解码音频数据将被转发到的另一装置的接口。
将理解,所示出的连接可经由多种未示出的部件来实现。
现在将参照图2更为详细地介绍图1的系统中的操作。图2是示例性示出音频编码器121中的操作的流程图。
当音频信号被输入到电子装置100时,例如经由音频输入部件111,其可被提供给音频编码器121进行编码。在音频信号被提供给音频编码器121之前,其可经过某种预处理。例如,在输入音频信号为模拟音频信号的情况下,可首先经过模数转换等。
音频编码器121例如以20ms的帧使用10ms的超前对音频信号进行处理。每个帧构成音频信号片段。
量化部件124首先将当前音频帧转换为参数表达(步骤201)。在当前实例中,参数包括ISF矢量的值以及LSF矢量的值。
量化部件125一方面使用非预测码本进行音频帧的参数的非预测量化(步骤211)。量化部件125可在此阶段仅仅进行所选参数的量化。在当前实例中,在步骤211中,量化部件125至少对ISF矢量的值应用非预测量化。
另外,量化部件125确定对于当前帧i的加权误差Es-net(步骤212):
E s - net i = Σ p = 0 N - 1 W p i ( QIsf s p i - Is f p i ) 2
其中,N为被量化矢量的长度,其中,QIsfsp i为对于帧i的安全网量化最优ISF矢量值p,其中,Isfp i为对于帧i的原始未量化ISF矢量值p,且其中,Wp i为对于帧i的心理听觉相关的加权矢量值p。
对于全球移动通信系统(GSM),已经规定,例如在另一背景下,对于每个矢量值p的加权Wp可使用下面的公式基于对当前帧i的LSF参数来确定:
W p = 3.347 - 1.547 450 d p 对于dp<450Hz
= 1.8 - 0.8 1050 ( 450 - d p ) 否则,
其中,对于LSF0=0Hz且LSF11=4000Hz,dp=LSFp+1-LSFp-1,LSF为线谱频率。本实施例支持的用于宽带传输编码的加权可以例如使用以合适方式修改的公式基于ISF参数而不是LSF参数来确定。加权Wp可被概括为加权矢量W。
量化部件125另一方面使用预测码本进行音频帧的参数的预测量化(步骤221)。量化部件125可在此阶段再次仅仅进行所选参数的量化。在当前实例中,在步骤221中,量化部件125至少对ISF矢量的值应用预测量化。
另外,量化部件125确定对于当前帧i的加权误差Epred(步骤222):
E pred i = Σ p = 0 N - 1 W p i ( QIsf p p i - Is f p i ) 2
其中,N再度为被量化矢量的长度,其中,QIsfpp i是对于帧i的预测量化最优ISF矢量值p,其中Isfp i再度为对于帧i的原始未量化ISF矢量值p,且其中,Wp i再度为对于帧i的心理听觉相关的加权矢量值p。
接着,基于所确定的误差Es-net和Epred,量化部件125对当前帧选择预测量化或非预测量化。
为此,量化部件125首先确定计数PredCount是否超过预定的限制PredLimit(步骤202)。计数PredCount表示基于预测量化且从上一次非预测量化选择以来已被提供的帧的数量。限制PredLimit可被设置为例如三,但可同等地设置为任何其他希望的值。
如果计数PredCount超过所设置的限制PredLimit,量化部件125提供使用非预测量化在步骤211中已经被量化的已量化音频帧,以便经由发送器112传输(步骤213)。如果在步骤211中仅所选参数被量化,则量化部件125现在使用非预测量化对音频帧的所有参数进行量化,并提供它们用于传输。
另外,对计数PredCount进行计数的计数器被复位到零(步骤214)。
如果计数PredCount没有超过所设置的限制,相反地,量化部件另外检查所确定的误差Es-net是否超过预定的阈值EThresh。阈值EThresh被设置为这样的值:低于该值,误差Es-net被认为是听不见的(步骤203)。
合适的阈值对于不同的加权函数和编解码器参数是不同的,且其必须通过离线试错法(trial-and-error)来计算。但是,一旦已经找到适当的阈值,编码器处的计算复杂性增大是极小的。在当前实例中,其可接近于0.9dB。
如果确定误差Es-net不超过预定的阈值EThresh,则量化部件125再次提供已经使用非预测量化进行量化的已量化音频帧,以便经由发送器122传输(步骤213)。另外,对计数PredCount进行计数的计数器被复位到零(步骤214)。
相反,如果确定误差Es-net超过预定阈值EThresh,则量化部件125额外地检查在步骤222中确定并用加权因子Wpsel加权的误差Epred是否超过在步骤212中确定的误差Es-net(步骤204)。使用加权因子Wpsel,以便对于预测码本的使用优选安全网码本的使用。
如果确定加权误差Epred超过所确定的误差Es-net,则量化部件125再次提供已经使用非预测量化进行量化的量化音频帧,以便经由发送器112传输(步骤213)。另外,对计数PredCount进行计数的计数器被复位到零(步骤214)。
相反,如果确定加权误差Epred不超过所确定的误差Es-net,则量化部件125最后提供已经使用预测量化在步骤221中量化的已量化音频帧,以便经由发送器112传输(步骤223)。如果在步骤221中仅仅所选参数已被量化,则量化部件125现在使用预测量化对音频帧的所有参数进行量化,并提供它们用于发送。
量化选择因此可用下面的伪代码总结:
If ( ( W psel * E pred i > E s - net i ) or ( E s - net i < E Thres )
                   or(PredCount>PredLimit))
    Use safety-net quantizer
    PredCount=0
Else
    Use predictive quantizer
    PredCount=PredCount+1
End
因此,在没有音频质量的显著劣化的情况下,非预测量化被尽可能频繁地选择,另外,非预测量化被选择用于中断长序列的预测量化帧,只要这样的序列仍然出现。
在这种代码以及上面介绍的过程中,加权因子Wpsel也可被省略。也就是说,不要求对于预测量化非预测量化是优选的。另外,准则(PredCount>PredLimit)也是可选的。
所提供的量化音频帧作为比特流中编码音频数据的一部分与其它的信息一起由发送器112发送,例如与所使用的量化的指示一起和/或与增强层数据一起等等。
在电子装置150处,比特流被接收部件162接收并被提供给解码器171。在解码器171中,合成部件174基于所接收的比特流中的已量化参数构建合成信号。重新构建的音频信号于是可能在某些进一步的处理(例如数模转换)之后提供给音频输出部件161。
图2的框也可被理解为示意性示出的、量化部件125的单独的处理块。
图3是示例性电子装置300的示意框图,其中,以软件实现根据本发明一实施例的预测或非预测量化的选择。
电子装置300可以是例如移动电话。其包括处理器330以及连接到此处理器330的音频输入部件311、音频输出部件361、收发器(RX/TX)312以及存储器340。将理解,所示出的连接可经由多种未示出的其它元件来实现。
音频输入部件311可以是例如麦克风或到某些音频源的接口。音频输出部件361可以是例如扬声器。存储器340包括用于存储计算机程序代码的部分341和用于存储数据的部分342。所存储的计算机程序代码包括用于使用可选量化对音频信号进行编码的代码以及用于对音频信号进行解码的代码。处理器330被配置为执行可用的计算机程序代码。就存储在存储器340中的可用代码而言,每当需要时,处理器330可为此从存储器340的部分341取回代码。将理解,各种其它计算机程序代码也可用于执行,例如操作程序代码和用于多种应用的程序代码。
所存储的编码代码或与存储器340结合的处理器330也可被看作根据本发明的示例性设备。存储器340可被看作根据本发明的示例性计算机程序产品。
当用户选择需要对输入音频信号进行编码的电子装置300的功能时,提供此功能的应用使得处理器330从存储器340取回编码代码。
经由音频输入部件311接收的音频信号于是被提供给处理器330,在所接收的模拟音频信号在转换为数字音频信号等等之后的情况下。
处理器330执行所取回的编码代码,以便对数字音频信号进行编码。编码可对应于上面参照图2对于图1介绍的编码。
被编码的音频信号或者存储在存储器340的数据存储部分342以便用于后来的使用,或者由收发器312发送到另一电子装置。
处理器330可进一步从存储器340取回解码代码并执行它,以便对或者经由收发器312接收的或者从存储器340的数据存储部分342取回的已编码音频信号进行解码。解码可对应于上面对于图1介绍的解码。
已解码的数字音频信号于是可被提供给音频输出部件361。在音频输出部件361包括扬声器的情况下,已解码音频信号例如可在转换为模拟音频信号后经由扬声器呈现给用户。可选地,已解码数字音频信号可被存储在存储器340的数据存储部分342中。
图1的量化部件125所示出的功能或执行图3的程序代码341的处理器330所示出的功能也可被看作:用于确定音频信号片段的非预测量化产生的误差是否在预定阈值之下的装置;用于至少在确定音频信号片段的非预测量化产生的误差在预定阈值之下的情况下,提供用非预测量化进行量化的音频信号片段作为已编码音频信号的一部分的装置;用于否则提供用预测量化进行量化的音频信号片段作为已编码音频信号的一部分的装置。
程序代码341也可被看作包括功能模块或代码部件形式的此类装置。
尽管已经示出、介绍和指出了适用于本发明优选实施例的本发明的基础的新颖特征,但是将理解,在不脱离本发明的精神的情况下,本领域技术人员可对所介绍的装置和方法的形式和细节作出多种省略、替代和改变。例如,以实质上相同的方式执行实质上相同的功能以便达到相同结果的那些元件和/或方法步骤的所有组合属于本发明的范围。而且,应当认识到,联系本发明的任何所公开的形式或实施例介绍和/或示出的结构和/或元件和/或方法步骤可以以任何其它所公开或介绍或建议的形式或实施方式并入设计选择的一般问题。因此,仅由这里所附权利要求的范围来限制。另外,在权利要求中,装置加功能的句子旨在覆盖这里所介绍的执行所述功能的结构,不仅仅是结构的等同,还有等同的结构。

Claims (30)

1.一种方法,包括:
确定音频信号片段的非预测量化导致的误差是否在预定阈值之下;
至少在确定所述音频信号片段的所述非预测量化导致的所述误差在预定阈值之下的情况下,提供用所述非预测量化进行量化的音频信号片段作为已编码音频信号的一部分;
否则,提供用预测量化进行量化的音频信号片段作为已编码音频信号的一部分。
2.根据权利要求1的方法,其中,所述预定阈值为这样的阈值:低于该阈值,所述误差被认为是听不见的。
3.根据权利要求1的方法,其中,所述误差是所述原始音频信号片段和所述非预测量化产生的音频信号片段之间频率范围上的谱失真。
4.根据权利要求1的方法,其中,通过对所述音频信号片段的相应分量和所述非预测量化产生的所述音频信号片段的对应分量之间的加权误差进行合并,来获得所述误差。
5.根据权利要求4的方法,其中,通过合并加权均方误差来获得所述误差。
6.根据权利要求4的方法,其中,误差的所述加权是心理听觉意义的加权。
7.根据权利要求1的方法,进一步包括确定所述音频信号片段的所述非预测量化产生的误差是否小于所述音频信号片段的所述预测量化所产生的误差,其中,在所述音频信号片段的所述非预测量化产生的所述误差小于所述音频信号片段的所述预测量化所产生的所述误差的情况下,额外地提供用所述非预测量化进行量化的音频信号片段。
8.根据权利要求7的方法,其中,在确定所述音频信号片段的所述非预测量化产生的所述误差是否小于所述音频信号片段的所述预测量化产生的所述误差之前,用所述非预测量化以及用所述预测量化产生的所述误差中的至少一个被加权。
9.根据权利要求1的方法,进一步包括确定最新提供的已量化音频信号片段是否属于用所述预测量化进行量化的音频信号片段序列,所述片段的数量超过预定的数量,其中,在确定已经在序列中提供的用所述预测量化进行量化的片段的所述数量超过所述预定数量的情况下,额外地提供用所述非预测量化进行量化的音频信号片段。
10.一种设备,其包含:
被配置为确定音频信号片段的非预测量化导致的误差是否在预定阈值之下的处理部件;
被配置为至少在确定所述音频信号片段的所述非预测量化导致的所述误差在预定阈值之下的情况下,提供用所述非预测量化进行量化的音频信号片段作为已编码音频信号的一部分的处理部件;
被配置为否则提供用预测量化进行量化的音频信号片段作为已编码音频信号的一部分的处理部件。
11.根据权利要求10的设备,其中,所述预定阈值为这样的阈值:低于该阈值,所述误差被认为是听不见的。
12.根据权利要求10的设备,进一步包括被配置为将所述误差计算为所述原始音频信号片段和所述非预测量化产生的音频信号片段之间频率范围上的谱失真的处理部件。
13.根据权利要求10的设备,进一步包括被配置为通过对所述音频信号片段的相应分量和所述非预测量化产生的所述音频信号片段的对应分量之间的加权误差进行合并,计算所述误差的处理部件。
14.根据权利要求13的设备,其中,通过合并加权均方误差来获得所述误差。
15.根据权利要求13的设备,其中,误差的所述加权是心理听觉意义的加权。
16.根据权利要求10的设备,进一步包括被配置为确定所述音频信号片段的所述非预测量化产生的误差是否小于所述音频信号片段的所述预测量化所产生的误差的处理部件,其中,在所述音频信号片段的所述非预测量化产生的所述误差小于所述音频信号片段的所述预测量化所产生的所述误差的情况下,额外地提供用所述非预测量化进行量化的音频信号片段。
17.根据权利要求16的设备,其中,在确定所述音频信号片段的所述非预测量化产生的所述误差是否小于所述音频信号片段的所述预测量化产生的所述误差之前,用所述非预测量化以及用所述预测量化产生的所述误差中的至少一个被加权。
18.根据权利要求10的设备,进一步包括被配置为确定最新提供的已量化音频信号片段是否属于用所述预测量化进行量化的音频信号片段序列的处理部件,所述片段的数量超过预定的数量,其中,在确定已经在序列中提供的用所述预测量化进行量化的片段的所述数量超过所述预定数量的情况下,额外地提供用所述非预测量化进行量化的音频信号片段。
19.一种电子装置,包括:
根据权利要求10的设备;以及
音频输入部件。
20.一种系统,包括:
根据权利要求10的设备;以及
包含被配置为对由根据权利要求10的所述设备提供的已编码音频信号进行解码的处理部件的设备。
21.一种计算机程序产品,其中,程序代码被存储在计算机可读介质中,所述程序代码在由处理器执行时实现:
确定音频信号片段的非预测量化导致的误差是否在预定阈值之下;
至少在确定所述音频信号片段的所述非预测量化导致的所述误差在预定阈值之下的情况下,提供用所述非预测量化进行量化的音频信号片段作为已编码音频信号的一部分;
否则,提供用预测量化进行量化的音频信号片段作为已编码音频信号的一部分。
22.根据权利要求21的计算机程序代码,其中,所述预定阈值是这样的阈值:低于该阈值,所述误差被认为是听不见的。
23.根据权利要求21的计算机程序代码,其中,所述误差是所述原始音频信号片段和所述非预测量化产生的音频信号片段之间频率范围上的谱失真。
24.根据权利要求21的计算机程序代码,其中,通过对所述原始音频信号片段的相应分量和所述非预测量化产生的所述音频信号片段的对应分量之间的加权误差进行合并,来获得所述误差。
25.根据权利要求24的计算机程序代码,其中,通过合并加权均方误差来获得所述误差。
26.根据权利要求24的计算机程序代码,其中,误差的所述加权是心理听觉意义的加权。
27.根据权利要求21的计算机程序代码,所述程序代码进一步实现:
确定所述音频信号片段的所述非预测量化产生的误差是否小于所述音频信号片段的所述预测量化所产生的误差,其中,在所述音频信号片段的所述非预测量化产生的所述误差小于所述音频信号片段的所述预测量化所产生的所述误差的情况下,额外地提供用所述非预测量化进行量化的音频信号片段。
28.根据权利要求27的计算机程序代码,其中,在确定所述音频信号片段的所述非预测量化产生的所述误差是否小于所述音频信号片段的所述预测量化产生的所述误差之前,用所述非预测量化以及用所述预测量化产生的所述误差中的至少一个被加权。
29.根据权利要求21的计算机程序代码,所述程序代码进一步实现:
确定最新提供的已量化音频信号片段是否属于用所述预测量化进行量化的音频信号片段序列,所述片段的数量超过预定的数量,其中,在确定已经在序列中提供的用所述预测量化进行量化的音频信号片段的所述数量超过所述预定数量的情况下,额外地提供用所述非预测量化进行量化的音频信号片段。
30.一种设备,包括:
用于确定音频信号片段的非预测量化导致的误差是否在预定阈值之下的装置;
用于至少在确定所述音频信号片段的所述非预测量化导致的所述误差在预定阈值之下的情况下,提供用所述非预测量化进行量化的音频信号片段作为已编码音频信号的一部分的装置;
用于否则提供用预测量化进行量化的音频信号片段作为已编码音频信号的一部分的装置。
CN200880003568.1A 2007-01-30 2008-01-10 一种用于音频量化的方法、设备和系统 Active CN101611550B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/700,732 2007-01-30
US11/700,732 US7813922B2 (en) 2007-01-30 2007-01-30 Audio quantization
PCT/EP2008/050217 WO2008092719A1 (en) 2007-01-30 2008-01-10 Audio quantization

Publications (2)

Publication Number Publication Date
CN101611550A true CN101611550A (zh) 2009-12-23
CN101611550B CN101611550B (zh) 2016-05-04

Family

ID=39469436

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200880003568.1A Active CN101611550B (zh) 2007-01-30 2008-01-10 一种用于音频量化的方法、设备和系统

Country Status (11)

Country Link
US (1) US7813922B2 (zh)
EP (1) EP2127088B1 (zh)
JP (1) JP2010517065A (zh)
KR (1) KR101100280B1 (zh)
CN (1) CN101611550B (zh)
AT (1) ATE540479T1 (zh)
CA (1) CA2673745C (zh)
HK (1) HK1135523A1 (zh)
MX (1) MX2009007383A (zh)
UA (1) UA98952C2 (zh)
WO (1) WO2008092719A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104756187A (zh) * 2012-10-30 2015-07-01 诺基亚技术有限公司 用于能复原的矢量量化的方法和装置
CN107077856A (zh) * 2014-08-28 2017-08-18 诺基亚技术有限公司 音频参数量化

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101755455A (zh) * 2007-07-30 2010-06-23 日本电气株式会社 通信终端、分配系统、变换方法以及程序
TWI672691B (zh) 2011-04-21 2019-09-21 南韓商三星電子股份有限公司 解碼方法
MX2013012301A (es) * 2011-04-21 2013-12-06 Samsung Electronics Co Ltd Aparato para cuantificar coeficientes de codificacion predictiva lineal, aparato de codificacion de sonido, aparato para decuantificar coeficientes de codificacion predictiva lineal, aparato de decodificacion de sonido y dispositivo electronico para los mismos.
PL3139382T3 (pl) * 2014-05-01 2019-11-29 Nippon Telegraph & Telephone Urządzenie kodujące sygnał dźwiękowy, sposób kodowania sygnału dźwiękowego, program i nośnik rejestrujący
CN106126162B (zh) * 2016-06-16 2019-07-19 Oppo广东移动通信有限公司 一种防止音效突变的方法及终端

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1402869A (zh) * 1999-10-28 2003-03-12 高通股份有限公司 使用编码方案选择模型以减少对帧差错敏感性的预测语音编码器
WO2005081231A1 (en) * 2004-02-23 2005-09-01 Nokia Corporation Coding model selection

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07109990B2 (ja) 1989-04-27 1995-11-22 日本ビクター株式会社 適応型フレーム間予測符号化方法及び復号方法
US6691092B1 (en) 1999-04-05 2004-02-10 Hughes Electronics Corporation Voicing measure as an estimate of signal periodicity for a frequency domain interpolative speech codec system
US6671669B1 (en) * 2000-07-18 2003-12-30 Qualcomm Incorporated combined engine system and method for voice recognition
US7003454B2 (en) * 2001-05-16 2006-02-21 Nokia Corporation Method and system for line spectral frequency vector quantization in speech codec
US7523032B2 (en) * 2003-12-19 2009-04-21 Nokia Corporation Speech coding method, device, coding module, system and software program product for pre-processing the phase structure of a to be encoded speech signal to match the phase structure of the decoded signal
US7587314B2 (en) * 2005-08-29 2009-09-08 Nokia Corporation Single-codebook vector quantization for multiple-rate applications

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1402869A (zh) * 1999-10-28 2003-03-12 高通股份有限公司 使用编码方案选择模型以减少对帧差错敏感性的预测语音编码器
WO2005081231A1 (en) * 2004-02-23 2005-09-01 Nokia Corporation Coding model selection

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104756187A (zh) * 2012-10-30 2015-07-01 诺基亚技术有限公司 用于能复原的矢量量化的方法和装置
US10109287B2 (en) 2012-10-30 2018-10-23 Nokia Technologies Oy Method and apparatus for resilient vector quantization
CN107077856A (zh) * 2014-08-28 2017-08-18 诺基亚技术有限公司 音频参数量化

Also Published As

Publication number Publication date
EP2127088B1 (en) 2012-01-04
CN101611550B (zh) 2016-05-04
UA98952C2 (en) 2012-07-10
CA2673745A1 (en) 2008-08-07
US7813922B2 (en) 2010-10-12
WO2008092719A1 (en) 2008-08-07
JP2010517065A (ja) 2010-05-20
MX2009007383A (es) 2009-08-13
EP2127088A1 (en) 2009-12-02
US20080180307A1 (en) 2008-07-31
HK1135523A1 (zh) 2010-06-04
CA2673745C (en) 2010-11-23
KR101100280B1 (ko) 2011-12-28
KR20090101932A (ko) 2009-09-29
ATE540479T1 (de) 2012-01-15

Similar Documents

Publication Publication Date Title
CN1922660B (zh) 通信装置和通信方法
CN1158647C (zh) 话音编码设备的频谱幅度量化
EP1587062B1 (en) Method for improving the coding efficiency of an audio signal
CN101611550B (zh) 一种用于音频量化的方法、设备和系统
US20080208575A1 (en) Split-band encoding and decoding of an audio signal
US8909521B2 (en) Coding method, coding apparatus, coding program, and recording medium therefor
CN101080767A (zh) 用于低比特率语音编码的方法和装置
US20190180765A1 (en) Signal codec device and method in communication system
KR20020033737A (ko) 음성 코더에서 선스펙트럼 정보 양자화법을 인터리빙하는방법및 장치
de Marca An LSF quantizer for the North-American half-rate speech coder
US20190348055A1 (en) Audio paramenter quantization
US20080243489A1 (en) Multiple stream decoder
US20050102136A1 (en) Speech codecs
JP2982637B2 (ja) スペクトルパラメータを用いた音声信号伝送システムおよびそれに用いられる音声パラメータ符号化装置および復号化装置
US20060041426A1 (en) Noise detection for audio encoding
Noll Speech coding for communications.
JP3350340B2 (ja) 音声符号化方法および音声復号化方法
JPH0749700A (ja) Celp型音声復号器
CA2303711C (en) Method for noise weighting filtering

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1135523

Country of ref document: HK

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20151222

Address after: Espoo, Finland

Applicant after: Technology Co., Ltd. of Nokia

Address before: Espoo, Finland

Applicant before: Nokia Oyj

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1135523

Country of ref document: HK