CN1240978A - 音频信号编码装置、解码装置及音频信号编码、解码装置 - Google Patents

音频信号编码装置、解码装置及音频信号编码、解码装置 Download PDF

Info

Publication number
CN1240978A
CN1240978A CN99108017A CN99108017A CN1240978A CN 1240978 A CN1240978 A CN 1240978A CN 99108017 A CN99108017 A CN 99108017A CN 99108017 A CN99108017 A CN 99108017A CN 1240978 A CN1240978 A CN 1240978A
Authority
CN
China
Prior art keywords
audio signal
frequency band
frequency
scrambler
coding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN99108017A
Other languages
English (en)
Other versions
CN1131507C (zh
Inventor
石川智一
津岛峰生
则松武志
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Publication of CN1240978A publication Critical patent/CN1240978A/zh
Application granted granted Critical
Publication of CN1131507C publication Critical patent/CN1131507C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明提供了一种在对各种各样的音频信号进行编码时,可以充分发挥性能地进行适应可缩放编码的音频信号编码、解码装置。其解决方案为不再采用固定可缩放编码方式,而是采用可以根据原音频信号的性质、分布的变化而改变编码用的频域的适应可缩放编码装置。

Description

音频信号编码装置、解码装置 及音频信号编码·解码装置
本发明涉及音频信号编码装置、音频信号解码装置以及音频信号编码·解码装置,特别涉及高效率编码装置,该装置使用通过正交变换等方式将由诸如声音信号和音乐信号等音频信号获得的特征量特别是音频信号由时域变换至频域所获得的信号,并且将该变换后的信号与原音频信号相比较以使用尽可能少的代码串表示该音频信号,还特别涉及使用作为编码后信号的全部编码代码串或只使用其中一部分编码代码串解码出高质量宽频带的音频信号的解码装置。
目前已经有了许多种对音频信号进行高效率编码和解码用的技术解决方案。在对诸如音乐信号等、频带为20kHz以上的音频信号进行压缩编码的方式中,包括MPEG音频处理方式和Twin VQ(TC-WVQ)处理方式等。以MPEG方式为代表的编码方式是一种采用余弦变换等正交变换,将时间轴的数字音频信号变换为频率轴的数据并利用人类听觉敏感度特性对听觉重要的信息进行编码的方式,而对听觉不重要的信息和冗余的信息不进行编码的方式。另一方面,Twin VQ(TC-WVQ)方式是一种拟通过矢量量化方式使用相对于原音频信号的信息量相当少的信息量表示的编码方式。关于MPEG音频处理方式和Twin VQ(TC-WVQ)方式的具体技术内容可分别参见ISO/IEC标准IS-11172-3,以及T.Moriya,H.Suga:An 8 Kbits transform coder fornoisy channels,Proc.ICASSP 89,pp196-199。
下面参考图10,对一般性的Twin VQ方式进行概要性的说明。
将原音频信号101输入至解析长度判定器102,并计算出解析长度。与此同时,解析长度判定器102对解析长度112量化,并输出解析长度代码串111。然后时间频率变换器103根据这一解析长度112,将原音频信号101变换为频域中的原音频信号104。频域中的原音频信号104由正规化处理器(平整处理器)106进行正规化处理(平整处理),以获得正规化处理后的音频信号108。这种正规化处理可以通过由频域中的原音频信号104中计算出频率概形信号105,并使用所求出的频率概形信号105去除原音频信号104进行。而且正规化处理器106还对正规化处理时使用的频率概形信号量化,并输出正规化代码串107。然后由矢量量化器109对正规化处理后的音频信号108量化,获得代码串110。
近年来,出现了具有即使使用输入至解码器的代码串的一部分也能再生音频信号的结构。把所述的这种结构称为标量型结构,把为了实现这种标量结构而进行的编码,称为可缩放编码(スケ-ラブルコ-ディ)。
图11为表示采用Twin VQ方式的固定型可缩放编码的一个实例的图。
根据由解析长度判定器1303从原音频信号1301判断出的解析长度1314,利用时间频率变换器1302便可以获得频域中的原音频信号1304。然后在将频域中的原音频信号1304输入至低频频带编码器1305时,由低频频带编码器1305输出量化误差1306和低频频带代码串1311。再将这一量化误差1306输入至中频频带编码器1307,由后者输出量化误差1308和中频频带代码串1312。当这一量化误差1308被输入至高频频带编码器1309时,高频频带编码器1309又将输出量化误差1310和高频频带代码串1313。在此,所述低频频带编码器、中频频带编码器、高频频带编码器,均具有正规化处理器和矢量量化器,它们的输出分别为低频频带编码代码串、中频频带编码代码串、高频频带编码代码串,而且其中包含有量化误差和由正规化处理器和由矢量量化器输出的各代码串。
原有方式中的固定可缩放编码如图11所示,因为低频频带、中频频带、高频频带等各频带量化器均是按固定方式设置的,所以如图12所示,难以按相对于原音频信号的分布而使量化误差尽可能少的方式进行编码。因此存在有在对于具有各种各样性质和分布的音频信号进行编码时,不能发挥出良好的性能,从而难以实现高音质、高效率的可缩放编码的问题。
本发明就是为了解决上述问题而提出的,本发明在对各种各样的音频信号进行编码时,如图13所示,通过采用与各种各样的音频信号相对应的可缩放编码的方式,从而提供出一种可以高效率、低比特率和高质量地进行编码的音频信号编码装置、相应的音频信号解码装置和音频信号编码·解码装置。
为了解决上述问题,根据本发明构造的音频信号编码装置、音频信号解码装置以及音频信号编码·解码装置,是不用固定的可缩放编码方式的装置,而是进行根据原音频信号的性质、分布使编码的频率范围变化的适应的可缩放编码装置。
根据本发明第一方面的音频信号编码装置,是一种接收频率变换后的音频信号对所述音频信号进行编码并输出音频信号的编码装置,该音频信号编码装置的特征在于具有:对所述频率变换后的音频信号进行量化的初级编码器;对作为前级编码器输出的量化误差进行量化的第二级以后的编码器;判定所述频率变换后的音频信号的特征并确定所述多个各级的各编码器的量化音频信号的频带的特性判定器;以及将所述特性判定器确定的频带和经过所述频率变换后的音频信号作为输入并确定所述多个各级的各编码器的连接顺序,以便将编码器的量化频带和连接顺序变换为代码串的编码频带控制器。从而可以根据输入音频信号的特性,确定若干个各编码器的量化频带和各编码器的连接顺序,通过进行适应纯可缩放编码,便可以进行高质量、高效率的适应可缩放编码。
根据本发明第二方面的音频信号编码装置,是如第一方面所述的音频信号编码装置,所述多个各级的各编码器具有:根据所述频率变换后的音频信号计算用于进行正规化处理的正规化系数串、并利用矢量量化方法对该正规化系数串量化、并且输出对所述频率变换后的音频信号进行过正规化处理后的正规化信号用的正规化处理器;和对于通过所述正规化处理器进行过正规化处理的信号量化和至少一级以上矢量量化器。借此,通过在各编码器对频率变换后的音频信号进行正规化处理后进行至少一级以上的矢量量化处理,进行高质量、高效率的适应可缩放编码。
根据本发明第三方面的音频信号编码装置,是如本发明第一或二方面所述的音频信号编码装置,所述编码频带控制器选出量化误差能量相加的和比规定值大的频带作为上述各编码器量化的音频信号频带。借此可以通过对量化误差的能量相加值比较大的频带进行选择的量化处理,实现高质量、高效率的适应可缩放编码。
根据本发明第四方面的音频信号编码装置,是如本发明第一或二方面所述的音频信号编码装置,所述编码频带控制器考虑人类心理特性选出在规定的频带上附加大的权值的量化误差能量相加的和比规定值大的频带作为上述各编码器量化的音频信号频带,借此便可以通过对在考虑到人类听觉心理特性在规定频带附加大的权值的量化误差的能量相加的和大的频带进行选择的量化处理,实现高质量、高效率的适应可缩放编码。
根据本发明第五方面的音频信号编码装置,是如第一或二方面所述的音频信号编码装置,所述编码频带控制器至少对所输入的音频信号的整个频带进行一次控制。借此,可以通过采用对于输入的音频信号的整个频带进行至少一次的量化处理,实现高质量、高效率的适应可缩放编码。
根据本发明第六方面的音频信号编码装置,所述矢量量化器通过使用编码表的矢量量化方法计算矢量量化的量化误差并以代码串的方式输出作为该矢量量化结果。借此便可以通过采用该量化处理中的编码表的矢量量化,实现高质量、高效率的适应可缩放编码。
根据本发明第七方面的音频信号编码装置,是如第六方面的所述的音频信号编码装置,所述矢量量化器为在搜索矢量量化中的最优化的编码时,使用矢量代码全部或部分反演后的编码矢量。借此便可以通过采用反演后的编码矢量,实现高质量、高效率的适应可缩放编码。
根据本发明第八方面的音频信号编码装置,是如第六方面的音频信号编码装置,所述矢量量化器为在计算搜索矢量量化中最优化的编码时需要使用的距离时,抽取由所述正规化处理器计算出的输入信号的正规化代码串作为权值系数,出赋予最小距离的编码。借此便可以通过采用在搜索矢量量化中的最优化的编码中使用距离计算时,把输入信号的正规化代码串作为权值使用,并抽取出赋予最小距离的编码,实现高质量、高效率的适应可缩放编码。
根据本发明第九方面的音频信号编码装置,是如第六方面所述的音频信号编码装置,所述矢量量化器为在计算搜索矢量量化中最优化的编码时使用的距离时,抽取由所述正规化处理器计算出的正规化代码串和考虑到人类听觉心理特性的值作为权值系数,并抽取出赋予最小距离的编码。借此便可以通过采用在搜索矢量量化中的最优化的编码中使用距离计算时,使用输入信号的正规化代码串和考虑到人类听觉心理特性用的值作为权值,并抽取出赋予最小距离的编码,从而实现高质量、高效率的适应可缩放编码。
根据本发明第十方面的音频信号编码装置,是一种对由如第一方面所述的音频信号编码装置输出的编码音频信号进行解码并输出音频信号的音频信号解码装置,其特征在于包括:从输入的音频信号串再生频率变换后的音频输入信号的系数串的一级或多级逆量化器组成的逆量化装置,将作为所述逆量化装置输出信号的频率变换后的输入音频信号的系数串变换为与初始输入音频信号相当的信号的逆频率变换器,根据在所述音频信号的编码装置的所述特性判定器和由编码的频带控制器确定的上述多个各级编码器的量化频带和连接顺序再生所述频率变换后的音频信号的逆量化器,将作为该逆量化器的输出的频率变换后的音频输入信号代码串变换成相应于原音频信号的信号的逆频率变换器,借此可以获得一种可以对由如第一方面所述的编码装置输出的编码代码串进行解码的解码装置。
根据本发明第十一方面的音频信号编码装置,是如第十方面所述的音频信号解码装置,其特征在于:所述一级或多级的逆量化器构成的逆量化装置把由如第一方面所述的音频信号编码装置的各频带的编码器输出的编码代码串作为输入,并且依据所输入的音频信号编码代码串再生出频率变换后的输入音频信号编码代码串;该逆量化装置具有把作为该逆量化装置的输出的频率变换后的输入音频信号编码代码串和由所述音频信号编码装置的各频带中的编码器输出的正规化代码串作为输入以获得与所述频率变换后的输入音频信号相对应的信号的逆正规化装置;所述逆频率变换器将所述逆正规化器输出的信号变换为与初始输入音频信号相应的信号。借此可以获得一种可以对如第十方面所述的编码装置输出的编码代码串进行解码的解码装置。
根据本发明第十二方面的音频信号编码装置,是如第十或十一方面所述的音频信号解码装置,其特征在于所述逆量化装置只使用由所述音频信号编码装置的若干个编码器中的某一个编码器输出的编码信号进行逆量化。借此可以在相应于音频信号的特性改变若干个编码器的量化频带以及连接顺序并进行编码时,仅使用位于解码侧的各编码器中输出的信号的一部分进行高质量解码的结构简单的解码装置。
根据本发明第十三方面的音频信号编码装置,是如第一方面所述的音频信号编码装置,所述特征判断器根据由低通滤波器处理过的信号,适当的选择出对输入至该特征判断器频率变换后的音频信号量化的频带。借此可以根据低通滤波器的特性,更容易地收听低频频带信号,从而可以实现高质量、高效率的适应可缩放编码。
根据本发明第十四方面的音频信号编码装置,是如第一方面所述的音频信号编码装置,所述特征判断器根据通过包含对数计算的处理的信号,适当的选择出量化输入至该特征判断器的频率变换后的音频信号量化的频带。借此可以通过包含有对数计算的处理,获得与人类的听觉特性相吻合的和高质量、高效率的适应可缩放编码。
根据本发明第十五方面的音频信号编码装置,是如第三方面所述的音频信号编码装置,所述特征判断器根据由高通滤波器处理过的信号,适当的选择出量化输入至该特征判断器的频率变换后的音频信号的频带。借此可以根据高通滤波器的特性,更容易地收听高频频带信号,实现高质量、高效率的适应可缩放编码。
根据本发明第十六方面的音频信号编码装置,是如第一方面所述的音频信号编码装置,所述特征判断器根据由带通滤波器或带阻滤波器处理过的信号,适当的选择出量化输入至该特征判断器量化频率变换后的音频信号的频带。借此可以根据带通滤波器或带阻滤波器的特性,更容易地收听特定频带频率内的频率信号,或是抑制特定频带频率的信号,实现高质量、高效率的适应可缩放编码。
根据本发明第十七方面的音频信号编码装置,是如第一方面所述的音频信号编码装置,用所述特征判断器判定音频信号的特征,并根据该判定结果适当的选择出使所述的多个各级的各编码器量化的频带。借此可以相应于音频信号的特性,适当选择出各编码器量化的频带,实现高质量、高效率的适应可缩放编码。
根据本发明第十八方面的音频信号编码装置,是如第十七方面所述的音频信号编码装置,用所述特征判断器判定音频信号的特征,并根据该判定结果限定所述的各编码器量化的频带。借此可以相应于音频信号的特性,对各编码器量化的频带进行限制,从而可以实现高质量、高效率的适应可缩放编码。
根据本发明第十九方面的音频信号编码装置,是如第十八方面所述的音频信号编码装置,所述各编码器量化的频带划分为低频频带、中频频带和高频频带,在对所述各编码器量化的频带进行限制的情况下,如果所述输入音频信号具有急剧变化的特征时,则限制上述各编码器量化的频带,使高频带比其它频带选的更多。借此可以在所述输入音频信号具有急剧变化的特征时,通过限制量化的频带,以便选择更多的高频带,借此更容易地收听变化急剧的高频带中的信号,从而可以实现高质量、高效率的适应可缩放编码。
根据本发明第二十方面的音频信号编码装置,是如第十八方面所述的音频信号编码装置,所述各编码器量化的频带被划分为低频带、中频带、高频带,在更多地选择在高频带作为所述各编码器量化的频带的场合,在由那一时刻至一定时间之内,按对所述各编码器量化的频带更多地选择在高频带的方式控制。借此可以在相应于所输入的音频信号的特性选择高频带作为更多的量化频带的场合,通过在由那一时刻至一定时间之内更多地选择高频域作为量化的频带,可以防止容易收听高频带状态在瞬时变化为与此不同的状态。
根据本发明第二十一方面的音频信号编码装置,是如第十八方面所述的音频信号编码装置,所述各编码器量化的频带被划分为低频频带、中频频带、高频频带,对所述原输入音频信号的特性进行判定,并且根据这一判定结果进行控制使所述各编码器量化的频带固定。借此可以根据输入音频信号的特性,固定各编码器量化的频带,实现高效率的固定型可缩放编码。
根据本发明第二十二方面的音频信号编码装置,是如第一方面所述的音频信号编码装置,所述各特性判别器把上述频率变换后的音频信号的频率数概形与通过上述正规化处理器计算的正规化系数串的任何一方或两方的值作为确定上述多个各级的各编码器量化频带的权值。借此可以通过把用由频率变换后的音频信号的频率概形和/或由正规化处理器计算出的正规化系数串作为在确定各编码器的量化频带时的权值使用,实现高质量、高效率的适应可缩放编码。
根据本发明第二十三方面的音频信号编码装置,是如第一方面所述的音频信号编码装置,它的进一步特征在于具有:判定所述的若干级编码器的量化的音频信号的听觉和物理特性,并且确定该各编码器量化的编码频带的配置的特性判定器和根据由所述特性判定器确定的编码频带配置信息控制对所述的多个各级的各编码器,量化的编码频带的配置编码频带控制器;并使所述多个各级的各编码器、所述特性判定器以及所述编码频带控制器的动作重复进行到满足预定的编码条件为止。借此可以根据对音频信号的听觉、物理特性的判定结果,确定出各编码器量化的编码频带的配置,并且通过采用在满足编码条件之前一直对各编码器量化的编码频带的配置进行调整和控制,实现高质量、高效率的适应可缩放编码。
根据本发明第二十四方面的音频信号编码装置,是如第二十三方面所述的音频信号编码装置,所述特性判定器具有:把预定的编码条件作为输入,计算出与所述的若干级编码器的编码频带有关的编码频带信息的编码频带计算器;把对所述编码频带信息和所述频率范围的音频信号或差分频谱中的任何一个进行预定滤波时的滤波器的输出作为输入,并且输出所述编码频带信息的编码频带的表示听觉重要程度的听觉权值用的听觉心理模式计算器;输入该听觉权值和作为解析长度判定器输出信号的解析长度,确定所述编码器的配置方式并输出所述编码器的频带序号的配置确定器;把所述编码频带信息和频带序号作为输入并根据预定的编码条件输出编码频带配置信息用的编码频带配置信息生成装置。借此可以通过进行确定考虑到表示人类听觉重要程度的听觉权值的各编码器的编码频带的配置进行确定,实现高质量、高效率的适应可缩放编码。
根据本发明第二十五方面的音频信号编码装置,是如第二十三方面所述的音频信号编码装置,所述编码频带控制器具有:所述频率变换后的输入音频信号的频谱和所述编码频带配置信息作为输入,并且使所述输入音频信号的频谱在指定的频带进行偏移用的频谱偏移装置;对于该频谱偏移装置的输出进行编码并输出编码代码串的编码器;对于所输入的该编码代码串进行解码并输出解码频谱的解码频带控制器;计算所输入的音频信号的频谱与所述解码频谱之间的差的差分计算装置;一直到该解码频带控制器的下一动作周期,保持由所述差分计算装置输出的差分信息的差分频谱的保持装置。借此可以利用编码频带配置信息,使原音频信号矢量在指定的频带进行偏移,并进行编码,再计算对其解码所得到的解码矢量与所述原音频信号的矢量之间的差,并且根据这个与前一差分值的过去值相对应地确定所述原音频信号的矢量的偏移量,对编码的频带进行各种偏移的各编码的差分值使这时的量化误差最小,借此可以控制下次的各编码器的连接状态,从而实现高质量、高效率的适应可缩放编码。
根据本发明第二十六方面的音频信号编码装置,是如第二十五方面所述的音频信号编码装置,所述解码频带控制器具有:对于所输入的编码代码串进行解码并输出合成频谱用的解码器;根据所述编码代码串中的编码频带配置信息,使所述合成频谱在预定的频带进行偏移的频谱偏移装置;直到该解码频带控制器的下一动作周期,保持由所述解码器输出的合成频谱并对过去的合成频谱与当前的合成频谱进行加法运算的解码频谱计算器。借此可以根据过去各编码器应量化处理的频带的配置和连接状态,对当前各编码器应量化的频带的配置和连接状态进行控制,从而实现高质量、高效率的适应可缩放编码。
根据本发明第二十七方面构造的音频信号编码装置,是一种对由如第二十六方面所述的音频信号编码装置输出的编码音频信号进行解码并输出音频信号的音频信号解码装置,它还具有与所述音频信号编码装置的所述解码频带控制器具有同一构成的解码频带控制器。借此可以根据过去各编码器应量化的频带的配置以及连接状态,对当前各编码器应量化的频带的配置和连接状态进行控制,从而可以获得进行高质量、高效率的适应可缩放编码用的编码表输出进行解码的音频信号解码装置。
根据本发明第二十八方面构造的音频信号编码·解码装置,是一种由如第二十六方面所述的音频信号编码装置和对由该音频信号编码装置输出的编码音频信号进行解码并输出音频信号的音频信号解码装置构成;而且所述音频信号解码装置具有与所述音频信号编码装置的所述解码频带控制器结构相同的解码频带控制器。借此可以根据过去各编码器应量化的频带的配置和连接状态,对当前各编码器应量化的频带配置和连接状态进行控制,并且可以获得由可以进行高质量、高效率的适应可缩放编码的音频信号编码装置,以及对其编码输出的信号进行解码的音频信号解码装置构成的音频信号编码·解码装置。
根据本发明第二十九方面的音频信号编码装置,是如第二十七方面所述的音频信号解码装置,所述音频信号编码装置的所述频谱偏移装置输入所述音频信号频谱和所述编码频带配置信息,并且输出所述编码频带信息和偏移后的频谱。借此可以进行高质量、高效率的适应可缩放编码。
根据本发明第三十方面的音频信号编码装置,是如第二十四方面所述的音频信号解码装置,所述配置确定器在所述输入音频信号具有变化急剧的特性和所述解析长度比较小的场合,把上述多个各级的各编码器的编码频带配置为高频带比其它频带更多地被选择的方式。借此可以在输入音频信号具有变化急剧的特性的场合,更容易地收听变化急剧的高频频带部分的信号,从而可以进行高质量、高效率的适应可缩放编码。
根据本发明第三十一方面的音频信号编码装置,是如第二十四方面所述的音频信号编码装置,所述配置确定器在所述输入音频信号具有变化急剧的特性和所述解析长度比较小的场合,在由那一时刻至一定时间之内,把上述各编码器的编码频带配置为高频带比其它频带更多地被选择的配置。借此可以在输入音频信号具有变化急剧的特性的场合,在由那一时刻至一定时间之内,防止由容易地收听高频频带信号的状态变化为在瞬时难以收听高频频带信号状态的出现,从而可以进行高质量、高效率的适应可缩放编码。
根据本发明第三十二方面的音频信号编码装置,是如第二十四方面所述的音频信号编码装置,所述编码频带计算器中,在作为输出信号的编码频带配置信息与作为输入信号的编码条件中的比特率、或输入音频信号的取样频率之间具有使用多项式函数或对数函数或它们的组合的函数关系。借此可以根据所述编码条件,进行高质量、高效率的适应可缩放编码。
根据本发明第三十三方面的音频信号编码装置,是如第三十二方面所述的音频信号编码装置,所述编码条件中的所述编码器总数为三个以上时,取按频率变高的顺序为第三个的编码器的编码频带的上限为原音频信号频带的1/2。借此可以通过采用至少配置有三个编码器实现高质量、高效率的适应可缩放编码。
根据本发明第三十四方面的音频信号编码装置,是如第三十二方面所述的音频信号编码装置,所述编码频带计算器把建立所述函数关系的函数作为附加考虑Bark率、Mel系数等的人类听觉特性的加权。借此可以通过对人类听觉特性加以考虑实现高质量、高效率的适应可缩放编码。
根据本发明第三十五方面的音频信号编码装置,是如第二十四方面所述的音频信号编码装置,所述配置确定器确定所述的多个各级的各编码器的编码频带的配置;通过预先准备所述各编码器配置的模式,为了提高编码效率而切换这些模式。借此可以通过简单的结构构成,进行高质量、高效率的适应可缩放编码。
根据本发明第三十六方面的音频信号编码装置,是如第二十四方面所述的音频信号编码装置,所述配置确定器对于所述输入音频信号具有变化不急剧保持稳定的特性,而所述的解析长度比较大的场合,作为所述的多个各级的各编码器的编码频带的最大值具有较小值。借此可以在输入音频信号具有变化不急剧的保持正常的特性的场合下,可以更容易地收听变化不急剧的低频频带音频信号的实现高质量、高效率的适应可缩放编码。
根据本发明第三十七方面的音频信号编码装置,是如第二十四方面所述的音频信号编码装置,与所述各级编码的前级相连接的滤波器为低通滤波器、高频通滤波器、带通滤波器、或带阻滤波器(Band Rejection Filter)中的一种,或为两种以上的组合。借此可以考虑相应的频带适合地进行高质量、高效率的适应可缩放编码。
根据本发明第三十八方面的音频信号编码装置,是如第二十七方面所述的音频信号编码装置,所述逆量化装置只使用由所述音频信号编码装置输出的一部分代码进行逆量化处理。借此可以构成对由进行高质量、高效率的适应可缩放编码的音频信号编码装置给出的编码输出进行解码的音频信号解码装置。
图1为根据本发明第一实施方式的音频信号编码装置的适应可缩放编码装置的方框图。
图2为表示所述第一实施方式的编码装置的时间频率变换器的图。
图3为表示所述第一实施方式的编码装置的编码器的图。
图4为表示所述第一实施方式的编码装置的正规化装置的图。
图5为表示所述第一实施方式的编码装置的频率概形正规化装置的图。
图6为表示所述第一实施方式的编码装置的特性判定器的图。
图7为表示所述第一实施方式的编码装置的编码频带控制器的图。
图8为表示所述笫一实施方式的编码装置的量化器的图。
图9为表示所述第一实施方式的编码装置的解码器的图。
图10为简要表示一般性的Twin VQ方式的图。
图11为表示一般性的Twin VQ可缩放编码的方式的图。
图12为表示一般的固定可缩放编码的缺点的图。
图13为表示一般的适应可缩放编码的优点的图。
图14为表示与根据本发明第二实施方式的音频信号编码装置的适应可缩放编码装置的方框图。
图15为表示所述笫二实施方式的编码装置的编码器的图。
图16为表示所述第二实施方式的编码装置的特性判定器的图。
图17为表示所述第二实施方式的编码装置的编码频带控制器的图。
图18为表示所述第二实施方式的编码装置的解码器的图。
图19为表示所述第二实施方式的编码装置的解码频带控制器的图。
图20为表示所述第二实施方式的编码装置的频谱偏移装置的图。
附图中代号的含义为:
1  编码装置
2  解码装置
501  原音频信号
502  解析长度判定器
503  时间频率变换器
504  解析长度
505  原音频信号频谱
506  特性判定器
507  编码频带控制器
508  频带控制代码串510  解析长度代码串511  低频频带编码器512  中频频带编码器513  高频频带编码器511b  第二级低频频带编码器518、519、520、518b  量化误差521  低频频带代码串522  中频频带代码串523  高频频带代码串521b  第二级低频频带代码串701  滤波器5  频率时间变换器6  加窗器7  帧叠加器8  解码信号9  频带合成器1201  解码频带控制器1202  低频频带解码器1203  中频频带解码器1204  高频频带解码器1202b  第二级低频频带解码器201  帧分割器202  加窗器203  MDCT器3  编码器301  正规化装置302  量化器303  正规化代码串304  代码串401  频率概形正规化器402  频带振幅正规化器403  频带表601  线型预测分析器602  形状量化器603  包络特性正规化器803  频谱幂指数计算器804  位置配置确定器517  频带控制权值516  编码频带配置信息901  频带宽度计算器902  量化顺序确定器903  编码器数目确定器1001  量化器的量化频带中的MDCT1002  同一量化频带中的正规化成分1003  音源子矢量1004  权值子矢量1005  矢量量化器1006  距离计算装置1007  编码确定装置1008  残差生成装置1009  编码表1010  残差子矢量1011  某量化器的量化频带的MDCT残差101  原音频信号102  解析长度判定器103  时间频率变换器104  频域中的原音频信号105  频率概形信号106  正规化处理器107  正规化代码串108  正规化处理后的当前音频信号109  矢量量化器110  代码串111  解析长度代码串1301  原音频信号1302  时间频率变换器1303  解析长度判定器1304  频域中的原音频信号1305  低频频带编码器1306  量化误差1307  中频频带编码器1308  量化误差1309  高频频带编码器1310  量化误差1311  低频频带代码串1312  中频频带代码串1313  高频频带代码串1314  解析长度代码串2001  编码装置2002  解码装置200105  编码条件200107  特性判定器200108  差分频谱200109  编码频带配置信息200110  编码频带控制器200111  编码代码串200112  传送编码代码串合成器200150  传送编码代码串分解器200151  编码代码串200152  解析长度编码代码串200153  解码频带控制器200154  解码频谱2003  编码器
200305  编码频带信息
200601  编码频带计算器
200602  听觉心理模式计算器
200603  配置确定器
200604  编码频带配置信息生成装置
200605  听觉权值
200701  频谱偏移装置
200702  编码频带信息
200703  差分计算装置
200704  差分频谱保持装置
2004  解码器
200901  逆量化器
200902  逆正规化器
2001001  合成频谱
2001002  偏移后的合成频谱
2001003  解码频谱计算器
2001101  原频谱
2001102  偏移后的频谱
下面参考附图1至附图9说明本发明的第一实施方式,并参考附图14至20说明本发明的第二实施方式。
(第一实施方式)
图1为表示按照本发明第一实施方式进行适应可缩放编码的音频信号编码装置的方框图。
在图1中,1001是对原音频信号501进行编码的编码装置。在该编码装置中,502是对所述原音频信号501进行解析时判断解析长度504的解析长度判定器,503是以所述解析长度504为单位,将原音频信号501从时间轴变换到频率轴上的时间频率变换器,504是由解析长度判定器502判定的解析长度,505是原音频信号频谱,701是输入原音频信号频谱505的滤波器,506是判定原音频信号频谱505的特性并确定所述编码装置1001的若干级的各编码器511、512、513、511b等的量化音频信号的频带的特性判定器,507是编码频带控制器,该控制器把由特性判定器506确定的各编码器的频带和进行过所述频率变换的音频信号作为输入,确定若干级的各编码器511、512、513、511b等的连接顺序,以便将若干级的量化频带和连接顺序变换为代码串用的编码频带;508是作为由该编码频带控制器507输出的所述代码串的频带控制代码串,510是将由所述解析长度判定器502输出的所述解析长度504作为代码串的解析长度代码串,511、512、513分别是对低频频带、中频频带、高频频带中的信号进行编码的低频频带编码器、中频频带编码器、高频频带编码器,511b是对第一级低频频带编码器511的量化误差518进行编码的第二级低频频带编码器,521、522、523是作为由各编码器511、512、513输出的编码信号的低频频带代码串、中频频带代码串、高频频带代码串,521b是作为第二级低频频带编码器511b的编码输出的第二级低频频带代码串,518、519、520是作为由所述各编码器511、512、513输出的编码前的信号与所述各编码信号之间的差的量化误差,518b是作为第二级低频频带编码器511b的量化误差的第二级量化误差。
另外,1002是对由所述编码装置1001编码过的编码代码串解码的解码装置。在这一解码装置1002中,5是对所述编码装置1001中的时间频率变换器503进行逆变换的频率时间变换器,6是在时间轴上乘上窗口函数进行窗口设置的窗口设置器,7是帧叠加器,8是解码信号,9是频带合成器,1201是解码频带控制器,1202、1203、1204分别是与所述低频频带编码器511、中频频带编码器512、高频频带编码器513相对应进行解码的低频频带解码器、中频频带解码器、高频频带解码器,1202b是对第一级低频频带解码器1202的输出进行解码的第二级低频频带解码器。
在此,第二级之后的编码器、解码器也可以使用在其它频带中,而且还可以根据需要,多级设置以提高编码和解码的精度。
下面首先对编码装置1001的动作进行说明。
假设编码的原音频信号501是一种在时间上连续的数字化信号串。例如,假设这种音频信号是一种按48kHz的取样频率量化为16比特的数字化信号。
将所述的原音频信号501输入至解析长度判定器502。所述解析长度判定器502对所输入的原音频信号501的特性进行判断,确定其解析长度504,并将这一结果作为解析长度代码串510而送入至解码装置1002。作为解析长度504例如可以取为256、1204、4096等。作为包含在原音频信号501中的高频频带频率成分超过预定值的场合,解析长度504可取为256,在低频频带频率成分超过预定值、且高频频带频率成分小于预定值的场合,解析长度504可取为4096,对于除此之外的场合,解析长度504均可取为1024。
这样确定的解析长度504可以利用时间频率变换器503计算出原音频信号501的频谱505。
图2为本发明第一实施方式的音频信号编码装置的时间频率变换器503的方框图。
所述的原音频信号501在其取样值达到预定的取样数之前,由帧分割器201进行累积,当所累积的取样数达到由所述解析长度判定器502确定的解析长度504时进行输出。帧分割器201是一种可按某一偏移长度进行输出的装置,比如解析长度504设定为4096个取样时,如果将其设定为解析长度504的取样长度的一半,则每当解析长度504达到与2048个取样相当的时间时,就输出最新的4096个取样。当然该解析长度504也可以随取样频率的变化而变化,同样也可以将偏移长度设定为解析长度504的一半。
帧分割器201的输出被输入至后级加窗器202。加窗器202将帧分割器201的输出乘以时间轴上的窗口函数,并由加窗器202处输出。这种状态例如可以用数学公式(1)所示。【数学公式1】
hxi-hi *xi  i-1,2,…,N h i = sin { π N ( i + 0.5 ) }
其中,xi为帧分割器201的输出,hi为窗口函数,hxi为加窗器202的输出信号。而且i为时间下标。由数学公式1所示的窗口函数hi仅仅为一个例子,窗口函数不一定是数学公式1。
窗口函数的选择取决于输入至加窗器202的信号的特征、帧分割器201中的解析长度504以及在时间上位于前后位置处的帧中的窗口函数的形状。例如,对于作为输入至加窗器202的信号特征的、帧分割器201中的解析长度504为N的场合,则计算每输入N/4的信号平均功率,而在这一平均功率变动非常大的场合,也可以选择使解析长度504比N更短、由数学公式1所示的运算。而且最好是使前一时刻的帧窗口函数的形状和后一时刻的帧窗口函数的形状相对应,以便使当前时刻的帧窗口函数的形状不会产生变形,这样的选择是可取的。
然后将加窗器202的输出输入至MDCT器203,在MDCT器203中进行变形离散余弦变换,并输出MDCT系数。这种变形离散余弦变换的一般表达式可用数学公式2表示。
【数学公式2】 y k = Σ n = 0 N - 1 hx n * cos { 2 π ( k + 1 2 ) ( n + n 0 ) N } n 0 = N 4 + 1 2 ( k = 0,1 , · · · , N 2 - 1 )
在此,当作为由MDCT器203输出的MDCT系数由数学公式2中的yk表示时,MDCT器203的输出表示频率特性,yk中的变量k越接近于0,低频频率成分就越远离0而增大至N/2-1附近,而高频频率成分成分将与线形相对应。按这种方式计算出的MDCT系数即为原音频信号的频谱505。
然后将所述的原音频信号频谱505输入至滤波器701。当这一滤波器701的输入为x701(i),输出为y701(i)时,则采用例如由数学公式3表示的滤波器。
【数学公式3】
      y701(i)=w701(i)*{x701(i)+x701(i+l)}
      i=0,1,…,fs-2
在此,fs为解析长度504。
虽然由数学公式3表示的滤波器701是一种移动平均滤波器,但是并不仅限于采用移动平均滤波器,也可以采用其它的、诸如高通滤波器等滤波器,还可以采用频阻滤波器等。
将滤波器701的输出和由解析长度判定器502计算出的解析长度504输入至特性判定器506。图6详细地示出特性判定器506的图。特性判定器506确定原音频信号501和原音频信号频谱505的有关听觉的物理特性。所谓原音频信号501和原音频信号频谱505的有关听觉的物理特性与声音信号或音乐信号特性有所不同。在信号为声音信号的场合,大部分频率成分位于低于6kHz的低频区域中。
下面参考图6,对特性判定器506的动作进行说明。
如果设输入至特性判定器506的原音频信号频谱505通过滤波器701滤波后所形成的滤波信号为x506(i),则根据这一信号x506(i),利用数学公式4由频谱功率计算器803计算出频谱功率p506(i)。
【数学公式4】
        p506(i)=x506(i)2
将频谱功率p506(i)作为编码频带控制器507输入信号之一并作为各编码器的频带控制权值517。
在解析长度504为小的场合,比如对于解析长度504为256的场合,则为了按固定方式配置各编码器,由配置确定器804确定,编码频带配置信息516作为固定配置输入至编码频带控制器507。
对于解析长度504不小的场合,比如说对于解析长度504为4096或1024的场合,为了把各编码器按动态方式配置,由位置配置确定器804确定,编码频带配置信息516作为动态配置输入至编码频带控制器507。
下面参考图7,对编码频带控制器507的动作进行说明。
输入至编码频带控制器507的信号包括作为特性判定器506输出的频带控制权值517,由滤波器701对编码频带配置信息516和对原音频信号频谱505滤波后获得的滤波信号,以及由各编码器输出的量化误差518、519或520。而且根据这些输入信号,各编码器511、512、513、511b和编码频带控制器507进行回归操作,而且为了能消除编码频带控制器507的初次动作中的量化误差,还需要进行消除量化误差用的三次输入操作。
如上所述,在解析长度504较小和编码频带配置信息516呈固定配置的场合,可以根据预先定义的频带的固定配置,顺次由低频频带向中频频带、高频频带进行编码,使用量化顺序确定器902、编码器数目确定器903和频带宽度计算器901确定出编码器的量化频带、个数、连接顺序,并且进行编码。换句话说,这时的频带控制代码串508中把编码器的频带信息、编码器个数和它们的连接顺序均作为信息编码。
例如,可以通过把各编码器的编码频带和编码器个数分别配置为在0Hz~4kHz时为一个、在0Hz~8kHz时为一个、在4kHz~12kHz时为一个、在8kHz~16kHz时为两个、在16kHz~24kHz时为三个来进行编码。
下面对编码频带控制器507在编码频带配置信息516呈动态配置信息时的动作进行说明。
编码频带控制器507由确定各编码器的量化频带的频带宽度计算器901、确定各编码器的量化顺序的量化顺序确定器902和确定各频带中的编码器个数用的编码器数目确定器903等三个装置构成。根据输入至编码频带控制器507的信号,便可以在确定各编码器的频带宽度时,使位于诸如0Hz~4kHz、0Hz~8kHz、4kHz~12kHz、8kHz~16kHz、16kHz~24kHz等各预定频带的频带控制权值517,与由各编码器进行编码后的量化误差相乘,并计算出该乘积的平均值。在此,频带控制权值517为weight517(i),设量化误差为err507(i),则可以利用数学公式5计算平均值。
【数学公式5】 Ave 901 ( j ) = 1 f upper ( j ) - f lower ( j ) Σ i = f upper ( j ) f lower ( j ) weight 517 ( i ) * err 507 ( i ) 2
在此,j为各频带的下标,Ave901(j)为频带j的平均值,fupper(j)和flower(j)分别为频带j的上限频率和下限频率。检索出这种方式获得的平均值Ave901(j)为最大时的j,并将其作为编码器编码的频带。这一检索出的j值还被输出至编码器数目确定器903,按照使与j相对应的频带的编码器个数增加一的方式,存储在确定的编码频带中是否存在任何编码器,并且将所储存的编码器个数相加,在达到预先确定的编码器总数之前,重复进行编码。最后将编码器的频带和编码器的个数作为频带控制代码串508输出至解码器。
下面参考图3对编码器3的动作方式进行说明。
编码器3包括有正规化装置301和量化器302。
正规化装置301输入作为帧分割器201输出信号的时间轴信号和由MDCT部203输出的MDCT系数,并且利用任何一个参数对MDCT系数进行正规化处理。这里的对MDCT系数进行正规化处理,意味着对低频频带成分和高频频带成分具有相当大的不同的MDCT系数的大小进行抑制。例如,对于低频频带频率成分比高频频带频率成分大许多的场合,可以通过按使低频频带频率成分为比较大的值,高频频带频率成分为比较小的值的方式选择参数,并通过用其对所述MDCT系数进行除法运算的方式,对MDCT系数的大小进行抑制。正规化装置301还可以将表示进行正规化处理用的参数的下标作为正规化代码串303编码处理。
量化器302由正规化装置301输入正规化后的MDCT系数,并且对MDCT系数量化。这时,该量化器302按照使该量化处理后的值与作为编码表中的编码下标相对应的各量化输出之间的差为最小的方式输出相对应的编码下标。对于这种场合,由所述量化器302进行过量化后的值和与量化器302输出的编码下标相对应的值之间的差为量化误差。
下面参考图4对所述正规化装置301的一个实例进行详细的说明。
在图4中,401是接收帧分割器201和MDCT部203的输出的频率概形正规化装置,402是接收所述频率概形正规化装置401的输出的、并参考频带表403进行正规化的频带振幅正规化装置。
下面对其动作方式进行说明。
频率概形正规化装置401可利用由帧分割器201输出的时间轴上的数据计算出作为比较大频率概形的频率概形,并将其除以由MDCT器203输出的MDCT系数。在表示频率概形上用的参数作为正规化代码串303而进行编码。频带振幅正规化装置402把由频带振幅正规化装置402的输入输出信号作为输入,并对每个由频带表403所示的频带进行正规化。例如,当作为频带表403输出的MDCT系数为dct(i)(i=0~2047),频带表403如表1所示时,则利用数学公式6等计算出各频带的振幅平均值。
【表1】频带带域k      flower(k)        fupper(k)      频带带域k      flower(k)       fupper(k)
    0     0     10
    1     11     22
    2     23     33
    3     34     45
    4     46     56
    5     57     68
    6     69     80
    7     81     92
    8     93     104
    9     105     116
    10     117     128
    11     129     141
    12     142     153
    13     154     166
    14     167     179
    15     180     192
    16     193     205
    17     206     219
    18     220     233
    19     234     247
    20     248     261
    21     262     276
    22     277     291
    23     292     307
    24     308     323
    25     324     339
    26     340     356
    27     357     374
    28     375     392
    29     393     410
    30     411     430
    31     431     450
    32     451     470
    33     471     492
    34     493     515
    35     516     538
    36     539     563
    37     564     587
    38     589     615
    39     616     643
    40     645     673
    41     674     705
    42     706     737
    43     738     772
    44     773     809
    45     810     848
    46     849     889
    47     890     932
    48     933     978
    49     979     1027
    50     1028     1079
    51     1080     1135
    52     1136     1193
    53     1194     1255
    54     1256     1320
    55     1321     1389
    56     1390     1462
    57     1463     1538
    58     1539     1617
    59     1618     1699
    60     1700     1783
    61     1784     1870
    62     1871     1958
    63     1959     2048
【数学公式6】 sum j = Σ i = bjlow bjhigh dct ( i ) p ave j = ( sum j bjhigh - bjlow + 1 ) - p bjlow ≤ i ≤ bjhigh
在此,bjlow、bjhigh分别表示由频带表403所示的第j个频带中所属的dct(i)的最低频带下标i,最高频带下标i。而且p为距离计算使用的标准,并且最好取为2等数字。avej为序号为j的各频带中的振幅平均值。频带振幅正规化装置402可通过对avej进行量化,计算出qavej,并可以利用例如数学公式7等进行正规化。
【数学公式7】
n_dct(i)=dct(i)/gavej    bjlow≤i≤bjhigh
对avej的量化处理可以为标量量化,也可以用编码表的矢量量化处理。频带振幅正规化装置402将表示qavej用的参数中的下标作为正规化代码串303而进行编码。
编码器中的正规化装置301可以由如图4所示的频率概形正规化装置401、频带振幅正规化装置402这两个部件构成,也可以仅由频率概形正规化装置401构成,或是仅由频带振幅正规化装置402构成。而且对于由MDCT部203输出的MDCT系数中的低频频带频率成分并不比高频频带频率成分大许多的场合,还可以不采用如上所述这两个构成,而是将由MDCT部203输出的信号直接输入至量化器302。
下面参考图5对如图4所示的频率概形正规化装置401进行详细的说明。
在图5中,601是接收帧分割器201的输出的线型预测分析器,602是接收线型预测分析部601的输出的形状量化器,603是接收MDCT器203输出的包络特性正规化装置。
下面参考图5,对所述频率概形正规化装置401的动作进行说明。
所述线型预测分析部601把由帧分割器201给出的时间轴上的音频信号作为输入进行线型预测分析(Linear Predictive Coding)。线型预测分析用的线型预测系数(LPC系数)可以通过计算设置加权平均窗口等的信号的自相关函数,并且求解正规化方程式等。将计算出的线型预测系数变换为线型频谱对系数(LSP(Line Spectrum Pair)系数),并由形状量化器602量化。作为这种量化方式可以用标量量化,也可以采用代码图表的矢量量化。而且表示由概形量化器602进行过量化的参数的频率传递特性,由概形量化器602计算出,并且通过将其除以由MDCT部203输出的MDCT系数进行正规化处理。例如,设与由形状量化器602量化处理后的参数相等价的线性预测系数为qlpc(i),则由包络特性正规化装置603计算出的所述频率传递特性可以由数学公式8表示。
【数学公式8】 env ( i ) = 1 fft ( li )
在此,ORDER最好为10~40。fft(1i)代表快速傅立叶变换。利用所计算出的频率传递特性env(i),由包络特性正规化装置603使用下述的数学公式9进行正规化。
【数学公式9】 fdct ( i ) = mdct ( i ) env ( i )
在此,mdct(i)为由MDCT部203输出的输出信号,fdct(i)为由进行正规化处理后的包络特性正规化装置603输出的输出信号。
下面参考图8对所述编码装置1的量化器302中的量化进行详细说明。
输入给量化器302的MDCT系数1001可以由该MDCT系数中取出几个构成为音频子矢量1003。同样,在正规化装置301中在把用作为正规化装置301输出的MDCT系数去除作为正规化装置301输入的MDCT系数后所获得的系数串作为正规化成分1002时,该正规化成分1002也可以按与从MDCT系数1001中抽取音源子矢量1003相同的规则进行从正规化成分1002中抽取子矢量,并构成权值子矢量1004。由MDCT系数1001和正规化成分1002中抽取音频子矢量1003和权值子矢量1004用的规则,例如可以用数学公式10所示的方法。
【数学公式10】
在此,第i个音频子矢量中的第j个元素为subvectori(j),MDCT1001系数为vector(),MDCT系数1001的总元素数为TOTAL,音频子矢量1003的元素数为CR,VTOTAL为与TOTAL相等或比后者更大的值,并且将VTOTAL/CR设定为正值。例如,在TOTAL为2048的条件下,如果CR为19,则VTOTAL为2052,如果CR为23,则VTOTAL为2070,如果CR为21,则VTOTAL为2079。权值子矢量1004可以按数学公式10的顺序抽取。矢量量化器1005可从编码表1009的编码矢量中取出与音频子矢量1003之间的距离,由权值子矢量1004进行权值运算后为最小的值,并且输出与施加在该最小距离上的编码矢量与输入音频子矢量1003间的量化误差相应的残差子矢量1010。
下面按照矢量量化器1005由距离计算装置1006、编码确定装置1007、残差生成装置1008三个元素构成的实例,对实际计算顺序进行说明。
例如,距离计算装置1006用例如数学公式11,计算第i个音频子矢量1003与编码表1009中的第k个编码矢量间的距离。
【数学公式11】 dik = Σ j = 0 CR - 1 w j R ( subvecto r i ( j ) - C k ( j ) ) S
在此,wj为权值子矢量中的第j个元素,Ck(j)为第k个编码矢量中的笫j个元素,R、S为距离计算用的标准,而且R、S的值最好取为1、1.5、2等。标准R、S没有必要为相同的值。dik为相对于第i个音频子矢量的第k个编码矢量的距离。编码确定装置1007用于由数学公式11计算出的距离中选择出最小的编码矢量,并将它的下标作为代码串304编码。例如,在若干个所述dik中的diu为最小值的场合,与第i个子矢量相对应的编码下标为u。残差生成装置1008利用由编码确定装置1007选择的编码矢量,通过数学公式12生成出残差子矢量1010。
【数学公式12】
      resi(j)=subvectori(j)-Cu(j)
在此,第i个残差子矢量1010中的第j个元素为resi(j),把由编码确定装置1007选择的编码矢量的第j个元素作为Cu(j)。利用所述的残差子矢量1010对数学公式10进行逆运算求出矢量,把该矢量与作为该编码器中的各编码对象的矢量间的差作为其后各个编码器的量化对象的MDCT系数保存。但对于某一频带的编码不对后面的编码器产生影响的频带进行编码的场合,即对于后面的编码器不进行编码的场合,并没有必要由残差生成装置1008生成残差子矢量1010、MDCT1011。虽然编码表1009中所具有的编码矢量的个数可根据需要设定,但从储存器容量、计算时间等等的角度考虑,最好取为64左右。
所述矢量量化器1005的另一个例子也可以采用如下所述的构成。即由距离计算装置1006利用数学公式13计算出距离。
【数学公式13】
Figure A9910801700341
在此,K为编码表1009进行编码检索时使用的编码矢量的总数。
编码确定装置1007选择出使通过数学公式13计算出的距离dik为最小值的k,并对它的下标编码。在此,k为由0至2K-1中的值。残差生成装置1008用数学公式14生成出残差子矢量1010。
【数学公式14】
Figure A9910801700342
在此,虽然编码表1009中的编码矢量的个数可根据需要设定,但从储存器容量、计算时间等的角度考虑,最好取为64左右。
如上所述,虽然就仅由正规化成分1002生成权值子矢量1004的结构进行了描述,然而也可以通过在权值子矢量1004上乘以根据人类听觉特性设定的权值生成出该权值子矢量1004。
如上所述,可以动态地设定若干级的各编码器的频带宽度、编码器的个数以及连接顺序。而且可根据按这样确定的各编码器的信息进行量化。
另外,解码装置1002使用作为各频带中的编码器输出的正规化代码串、由与该正规化代码串相对应的量化器输出的代码串、以及作为编码装置的编码频带控制器输出信号的频带控制代码串或作为解析长度判定器输出信号的解析长度代码串,进行解码。
图9示出了解码器1202、1203、…的构成。各解码器由再生成正规化后的MDCT系数的逆量化器1101,对正规化系数进行解码使所述再生的正规化MDCT系数和正规化系数相乘的逆正规化装置1102构成。
逆正规化装置1102根据来自各编码器的正规化装置301的正规化代码串303对由编码装置1在正规化处理时使用的参数进行复原,并将逆量化器1101的输出与该参数相乘复原MDCT系数。
解码频带控制器1201利用作为编码频带控制器507输出信号的频带控制代码串508,复原编码装置使用的编码器的配置和编码器的个数等信息,并根据这些信息将各解码器1202、1203、1204、1202b配置在各频带中,频带合成部9通过按编码装置的各编码器511、512、513、511b的编码顺序和逆顺序合成频带的频带合成器9获得MDCT系数。频率时间变换器5输入所获得的该MDCT系数,进行逆MDCT处理,并由频域的信号复原为时域信号。例如,所述这种逆MDCT系数的计算由例如数学公式15所示。
【数学公式15】 xx ( n ) = 2 N Σ k = 0 N - 1 yy k cos { 2 π ( k + 1 / 2 ) ( n + n 0 ) N } n 0 = N 4 + 1 2
在此,yyk为由频带合成部9复原后的MDCT系数,xx(n)为逆MDCT系数,把这两个系数作为频率时间变换器5输出。
加窗器6利用由频率时间变换器5输出xx(i)进行窗口相关处理。例如,窗口相关处理可以使用编码装置1中的时间频率变换器503的加窗器202中所使用的窗口进行由例如数学公式16所示的处理。
【数学公式16】
       z(i)=xx(i)*hj
在此,z(i)为加窗器6的输出信号。
帧叠加器7利用加窗器6的输出信号再生音频信号。因为由加窗器6输出的信号是具有时间周期的信号,所以帧叠加器7可以利用数学公式17,把该输出作为解码装置1002的输出信号。
【数学公式17】
          outm(i)=zm(i)+zm-1(i+SHIFT)
在此,zm(i)为第m时刻的帧中第i个加窗器6的输出信号z(i),zm-1(i)为第m-1时刻的帧中第i个加窗器6的输出信号,SHIFT为与编码装置的解析长度504相当的取样数,outm(i)为帧叠加器7在第m时刻的帧中的解码装置1002的输出信号。
而且在第一实施方式中,有时也如下述那样,在所述编码频带控制器507中,由解析长度504限制由频带宽度计算器901计算的可量化的频域。
例如,对于解析长度504为256的场合,各编码器的、可量化的频域的下限为4kHz,上限为24kHz。对于解析长度为1024或2048的场合,下限为0kHz,上限为16kHz。而且当解析长度504再次为256时,在此后的一定时间里,比如在为20毫秒左右的时间里,为了固定各量化器的可量化的频域和量化器的配置,也可以由量化顺序确定器902进行控制。通过这样的处理,可以使经过时的量化器的配置一定,因而可以抑制有关听觉的频带的出入感发生(例如在某一瞬间高频频带为中心的声音突然又变为以低频频带为中心的声音,从而使人有声音频带似乎上下存放的感觉)。
按照第一实施方式的音频信号编码装置和解码装置具有:确定若干级的编码器的量化音频信号频带的特性判定器,以及把由该特性判定器确定的频带和经过频率变换后的初始音频信号作为输入确定所述的若干级编码器的连接顺序,再将编码器的量化频带和连接顺序变换为代码串用的编码频带控制器,通过这样的适应可缩放编码的构成,即使在对各种各样的音频信号进行编码时,也可以获得发挥出高质量、高效率等良好性能的适应可缩放编码的音频信号编码装置和对其进行解码的解码装置。
(第二实施方式)
下面参考附图14至附图20,对如图14所示的本发明第二实施方式进行说明。
图14为根据本发明第二实施方式进行适应可缩放编码的编码装置2001和解码装置2002的方框图。在如图所示的编码装置2001中,200105是有关编码器的个数、比特率、输入音频信号的取样频率、各编码器的编码频带信息等的编码条件,200107是确定若干级编码器的量化音频信号的频带的特性判断器,200109是编码频带配置信息,200110是输入由特性判定器200107确定的频带和频率变换后的音频输入信号,将所述的若干级的编码器的量化频带和连接顺序变换为代码串的编码频带控制器,200111是编码代码串,200112是传送编码代码串合成器。
在解码装置2002中,200150是传送编码代码串分解器,200151是编码代码串,200153b是输入编码代码串200151并且在对其进行解码的过程中对各解码器的解码频带进行控制用的解码频带控制器,200154b是解码频谱。
虽然按照本发明第二实施方式的编码装置2001与如上所述的第一实施方式相类似,是进行适应可缩放编码的装置,但是和第一实施方式相比,其不同点在于在编码装置2001中还设置有包含有解码频带控制器200153的编码频带控制器200110,在解码装置2002中还增加有进行与所述解码频带控制器200153相同处理的解码频带控制器200153b,而且在第二实施方式中的特性判定器200107中用设置如图16所示的听觉心理模式计算器200602代替设置第一实施方式中的特性判定器506的频谱功率计算器803,,而且在特性判定器200107内还设置有可根据编码条件200105由编码频带计算器200601计算的编码频带信息200702,由配置确定器200603输出的频带序号200606生成出编码频带配置信息200109的编码频带配置信息生成装置200604。
在解码装置2002中,200150是传送编码代码串分解器,200151是编码代码串,200153b是把编码代码串200151作为输入并且对对其解码的各解码器的解码频带进行控制用的解码频带控制器,200154b是解码频谱。
下面对第二实施方式的动作进行说明。
在第二实施方式中,要进行编码的原音频信号501与上述的第一实施方式相类似,也是时间连续的数字化信号序列。
而且通过与上述的第一实施方式相同的处理,也可以获得原音频信号频谱505。在第二实施方式中,相对于编码装置2001将例如包含编码器个数、比特率、输入音频信号的取样频率、各编码器的编码频带信息等的编码条件200105,均输入至该编码装置2001的特性判定器200107中。特性判定器200107输出包含有若干级编码器的量化频带、个数以及连接顺序的信息的编码频带配置信息200109,并将它们输入至编码频带控制器200110。这一编码频带控制器200110如图17所示,除了输入有编码频带配置信息200109之外,还输入原音频信号频谱505,并输出由编码频带控制器200110控制的各编码器根据这些信息进行编码的编码代码串200111,并将它们输入至传送编码代码串合成器200112合成,合成后的输出信号输入至解码装置2002。
解码装置2002通过传送代码串分解器200150接收编码装置2001的传送编码代码串合成器200112的输出并分解编码串200151和解析长度编码串200152。编码代码串200151输入至解码频带控制器200153b,获得由该解码频带控制器控制的各解码器进行过解码的解码频谱200154b。并且与所述第一实施方式相类似,通过频率时间变换器5、加窗器6和帧叠加器7由这种解码频谱200154b和由所述传送编码代码串分解器200150输出的解析长度编码代码串200152获得解码信号8。
下面参考附图15至附图20,对特性判定器200107的动作方式进行说明。
该特性判定器200107包括:利用编码条件200105计算编码频带信息200702的编码频带计算器200601;从原音频信号频谱505和差分频谱200108等频谱信息和编码频带信息200702中,根据人类的听觉心理模式计算出听觉权值200605的听觉心理模式计算器200602;参照解析长度504并在响应听觉权值200605上加权值后确定各编码器的频带配置并输出频带序号200606的配置确定器200603;以及利用编码条件200105,由编码频带计算器200601计算出的编码频带信息200702和由配置确定器200603输出的频带序号200606生成出编码频带配置信息200109的编码频带配置信息生成装置200604。
编码频带计算器200601使用在编码装置2001开始动作之前设定的编码条件200105,计算出对图15所示的编码器2003编码的编码频带的上限fpu(k)、下限fpl(k),并将其作为编码频带信息200702输出至编码频带配置信息生成装置200604。在此,k为用于抽取编码频带的数目,随着k由0变为预先设定的最大数pmax时,表示频率比较大的频带。作为pmax的一个实例为4,在表2中示出编码频带计算器200601动作的一个实例。
【表2】
编码条件:取样频率为48KHz,总计比特率为24kbps时
频带K fpu(K) fpl(K)
 0  221  0
 1  318  222
 2  415  319
 3  512  416
编码条件:取样频率为48KHz,总计比特率为24kbps时
频带K  fpu(K) fpl(K)
 0  443  0
 1  637  444
 2  831  638
 3  1024  832
听觉心理模式计算器200602由滤波器701的输出信号、作为编码频带控制器200110输出信号的差分频谱200108等频谱信号、以及作为编码频带计算器200601输出信号的编码频带信息200702,根据人类听觉心理模式计算出听觉权值200605。该听觉权值200605在听觉上比较重要的频带为比较大的值,在听觉上不太重要的频带为比较小的值。作为听觉心理模式计算器200602的一个实例为使用计算输入频谱的幂指数的方法的装置。设输入的频谱为x602(i)时,听觉权值wpsy(k)为:
【数学公式18】 w psy ( k ) = Σ i = f pl ( k ) f pu ( k ) { × 602 ( i ) 2 * 1 f pu ( k ) - f pl ( k ) }
按照这种方式计算出的听觉权值200605输入至配置确定器200603,在该配置确定器200603中边参考解析长度504,边在解析长度504比较小例如为128时,频带序号200606变大,例如该频带中的序号为4时的听觉权值200605变大,以便使这一频带序号的权值为频带序号为4时的听觉权值的两倍;在解析长度504比较小时,使听觉权值200605保持不变,计算出使该听觉权值200605为最大的频带,并且将这一频带序号200606送入至编码频带配置信息生成装置200604中。
编码频带配置信息生成装置200604输入所述的编码频带信息200702、频带序号200606以及编码条件200105,并且输出编码频带配置信息200109。即该编码频带配置信息生成装置200604边经常参考编码条件200105,边从这一编码条件上看编码频带配置信息200109达到必要的间隔时,就输出连接所述编码频带信息200702和频带序号200606用的编码频带配置信息200109,而在不需要时就停止这一输出动作。即在达到由编码条件200105指定的编码器个数之前,一直输出频带序号200606。所述配置确定器200603在解析长度504比较小时,也可以处于所输出的频带序号200606为固定的场合。
下面参考图17对编码频带控制器200110的动作进行说明。
编码频带控制器200110把作为所述特性判定器200107输出信号的编码频带配置信息200109和原音频信号频谱505作为输入,并且分别输出编码代码串200111和差分频谱200108。在编码频带控制器200110的内部包括:接收编码频带配置信息200109;使原音频信号频谱505以及过去的原音频信号频谱505与对该原音频信号频谱505编码和解码所获得的频谱200705之间的差分频谱200108在频带序号200606的频带进行偏移的频谱偏移装置200701;编码器2003;获得所述原音频信号频谱505与解码频谱200705间的差分的差分计算装置200703;差分频谱保持装置200704;以及对于解码频带控制器200153,该控制器由解码器2004解码编码代码串200111获得的合成频谱2001001根据编码频带信息200702偏移获得按顺序合成得到的合成频谱,并计算出解码频谱200705。频谱偏移装置200701的结构构成如图20所示,它使用偏移后的元频谱2001101、编码频带配置信息200109作为输入。在编码频带控制器200110中的频谱偏移装置200701的输入中,偏移后的元频谱2001101为原音频信号频谱505或为差分频谱200108,使它们在频带序号200606的频带中偏移,并且输出偏移后的偏移后的频谱2001102、编码频带配置信息200109中的编码频带信息200702。与频带序号200606相对应的频带可以由编码频带信息200702中的fpl(k)、fpu(k)求出。偏移的程序是要使所述fpl(k)和fpu(k)之间的频谱一直移动至由编码器2003能处理的频带处。
这样,输入有进行偏移后的频谱2001102的编码器2003如图15所示,
这样,输入有进行偏移后的频谱2001102的编码器2003如图15所示,当输出正规化代码串303、残差代码串304时,对作为频谱偏移装置200701输出信号的编码频带信息200702进行叠加,并作为代码串200111输出至传送编码代码串合成器200112和解码频带控制器200153中。
作为所述编码器2003输出信号的所述编码代码串200111输入至该编码频带控制器200110的解码频带控制器200153。该解码频带控制器200153与设置在解码装置2002的类似装置(即解码频带控制器200153b)的动作相类似。
设置在解码装置2002内的解码频带控制器200153b的结构构成如图19所示。
解码频带控制器200153b把由传送编码代码串分解器200150输出的编码代码串200111作为输入,输出解码频谱200705b,借此在其内部配置有解码器2004、频谱偏移装置200701和解码频谱计算器2001003。
上述的解码器2004的结构构成如图18所示。
解码器2004由逆量化器1101和逆正规化装置1102构成,逆量化器1101输入编码代码串200111中的残差代码串304,并且将这一残差代码串304变换为编码矢量,参考编码器2003中使用的编码表而生出该编码。再生的编码信号送入至逆正规化装置1102,与由编码代码串200111内的正规化代码串303再生出的正规化代码串303a相乘,获得合成频谱2001001。该合成频谱2001001输入至频谱偏移装置200701。
虽然由编码频带控制器200110内的解码频带控制器200153输出的输出变成解码频谱200705,但该输出与作为解码装置2002内的解码频带控制器200153b的输出解码频谱200705b相类似。
由解码器2004合成出的合成频谱2001001经频谱偏移装置200701偏移,并获得偏移后的合成频谱2001002,并将其输出至解码频谱计算器2001003。
在解码频谱保存在解码频谱计算器2001003的内部,预先保存输入合成频谱,并进行与所保存的频谱与最新的合成频谱相加后作为解码频谱200705b输出。
配置在编码频带控制器200110内部的差分计算装置200703计算出原音频信号频谱505与解码频谱200705之间的差分,并输出该差分频谱200108,将其反馈给特性判定器200107。与此同时,由差分频谱保持装置200704保存的所述差分频谱200108被送入至频谱偏移装置200701,并且输入下一编码频带配置信息200109。特性判定器200107参考这一编码条件,在满足该编码条件时就一直输出编码频带配置信息200109,在不满足时就停止编码频带控制器200110的动作。所述编码频带控制器200110为了计算差分频谱200108,而具有差分频谱保持装置200704。这就是在为了保持差分频谱所必要的储存区域内可存储2048个数那样的配置。
如上所述,为了满足编码条件200105,重复进行利用特性判定器200107和与其相连接的编码频带控制器200110的处理,并依次输出编码代码串200111,这一编码代码串200111输出至传送编码代码串合成器200112,与解析长度代码串510一并合成为传送编码代码串,并输出至解码装置2002。
解码装置2002将编码装置2001给出的传送编码代码串,利用传送编码代码串分解器200150分解成编码代码串200151和解析长度编码代码串200152。该编码代码串200151、解析长度编码代码串200152与编码装置2001内的编码代码串200111、解析长度代码串510相类似。
分解后的编码代码串200151由解码频带控制器200153b变换为解码频谱200154b,该解码频谱200154b利用解析长度编码代码串200152的信息,通过频率时间变换器5、加窗器6和帧叠加器7变换为时域中的信号,并将其变成解码信号8。
按照第二实施方式的音频信号编码装置和解码装置,如第一实施方式那样,也具有确定若干级的编码器的量化音频信号频带用的特性判定器,和编码频带控制器,该控制器把由该特性判定器确定出的频带经过频率变换后的原音频信号作为输入,并确定所述的若干级的编码器的连接顺序,将编码器的量化频带和连接顺序变换为代码串,在进行适应可缩放编码的结构构成中,在编码装置中设置包含有解码频带控制器的编码频带控制器,在解码装置中设置解码频带控制器,并且把在特性判定器中的频谱幂指数计算器作为听觉心理模式计算器,在特性判定器中还配置有编码频带配置信息生成装置,借此通过将特性判定器中的频谱幂指数计算器替换为听觉心理模式计算器,可以高精度地判断有关听觉的重要部分,并选择出相应的频带。作为本发明对象的音频信号编码装置和解码装置在确定编码器配置状态的运算时,如果满足编码条件,则判定编码正常,不输出编码频带配置信息,用于在确定该编码器配置方式的运算中,在上述第一实施方式中选择配置编码器时的频带时的各频带宽度和各频带的权值是固定的,而在第二实施方式中作为输入还把输入信号的取样频率和压缩率即编码的比特率作为输入,与其相应地改变选择所述各编码器的频带配置时的各频带相对应的权值大小,用的压缩率条件作为特性判定器判定条件,在压缩率比较高时,即在比特率比较低时使选择所述各编码器的频带配置时的各频带相对应的权值程度不发生大变化,而当压缩率比较低高时,即在比特率比较高时,为了获得更高的效率,还可以使选择所述各编码器的频带配置时的各频带相对应的权值程度在听觉上作为重要参数强调,从而可以通过这种方式获得压缩率和品质均为良好的基频频带。采用这种方式,便可以获得在对各种各样的音频信号编码时,都可以发挥出高质量、高效率等优点的进行适应可缩放编码的音频信号编码·解码装置。
如上所述,按照本发明提供的音频信号编码装置、音频信号解码装置以及音频信号编码·解码装置,由于它们具有确定若干级的编码器的量化音频信号频带的特性判定器,编码频带控制器,该控制器把由该特性判定器确定出的频带和经过频率变换后的各音频信号作为输入确定所述的若干级的编码器的连接顺序,并将编码器的量化频带和连接顺序变换为代码串,通过进行适应可缩放编码,对各种各样的音频信号编码,可以获得高质量、高效率的适应可缩放编码的效果。

Claims (38)

1.一种音频信号编码装置,用于接收频率变换后的音频信号对所述音频信号进行编码并输出,
其特征在于具有:
对所述频率变换后的音频信号进行量化的初级编码器;
对作为前级编码器输出的量化误差进行量化的第二级以后的编码器;
判定所述频率变换后的音频信号的特征并确定上述多个各级的各编码器的量化音频信号的频带的特性判定器;以及,
将所述特性判定器确定的频带和经过所述频率变换后的音频信号作为输入并确定所述的多个各级的各编码器的连接顺序,并将编码器的量化频带和连接顺序变换为代码串的编码频带控制器。
2.如权利要求1所述的音频信号编码装置,其特征在于:
所述的若干级编码器具有:
根据所述频率变换后的音频信号计算用于进行正规化处理的正规化系数串,并利用矢量量化器对该正规化系数串量化,并且输出对所述频率变换后的音频信号进行正规化处理后的正规化信号的正规化处理器;和
对于通过所述正规化处理器进行过正规化处理的信号进行量化的至少一级以上矢量量化器。
3.如权利要求1或2所述的音频信号编码装置,其特征在于:
所述编码频带控制器选出量化误差能量相加的和比规定值大的频带作为上述各编码器量化的音频信号频带。
4.如权利要求1或2所述的音频信号编码装置,其特征在于:
所述编码频带控制器考虑人类心理特性选出在规定的频带上附加大的权值的量化误差能量相加的和比规定值大的频带作为上述各编码器量化的音频信号频带。
5.如权利要求1或2所述的音频信号编码装置,其特征在于:
所述编码频带控制器至少对所输入的音频信号的整个频带进行一次控制。
6.如权利要求2所述的音频信号编码装置,其特征在于:
所述矢量量化器通过使用编码表的矢量量化方法计算矢量量化的量化误差,并以代码串的方式输出该矢量量化结果。
7.如权利要求6所述的音频信号编码装置,其特征在于:
所述矢量量化器在搜索矢量量化中的最优化的编码时,使用矢量代码全部或部分反演后的编码矢量。
8.如权利要求6所述的音频信号编码装置,其特征在于:
所述矢量量化器在计算搜索矢量量化中最优化的编码时所使用的距离时,将由所述正规化处理器计算出的输入信号的正规化代码串作为权值系数,抽取出赋予最小距离的编码。
9.如权利要求6所述的音频信号编码装置,其特征在于:
所述矢量量化器在计算搜索矢量量化中最优化的编码时使用的距离时,将所述正规化处理器计算出的正规化代码串和考虑到人类听觉心理特性的值作为权值系数,并抽取出赋予最小距离的编码。
10.一种对由如权利要求1所述的音频信号编码装置输出的编码音频信号进行解码并输出音频信号的音频信号解码装置,其特征在于包括:
根据由所述音频信号编码装置的所述特性判定器及编码频带控制部决定的上述多个的各编码器的量化频带及连接顺序,从输入的音频信号串再生频率变换后的音频输入信号的系数串的一级或多级逆量化器细成的逆量化装置;
将作为该逆量化器的输出的频率变换后的音频输入信号代码串变换成相应于原音频信号的信号的逆频率变换器。
11.如权利要求10所述的音频信号解码装置,其特征在于:
所述一级或多级的逆量化器构成的逆量化装置把由如权利要求2所述的音频信号编码装置的各频带的编码器输出的编码代码串作为输入,并且依据所输入的音频信号编码代码串再生出频率变换后的音频输入信号编码代码串;该逆量化装置具有把作为该逆量化装置的输出的频率变换后的音频输入信号编码代码串和由所述音频信号编码装置的各频带中的编码器输出的正规化代码串作为输入以获得与所述频率变换后的输入音频信号相对应的信号的逆正规化装置;
所述逆频率变换器将所述逆正规化器输出的信号变换为与初始输入音频信号相应的信号。
12.如权利要求10或11所述的音频信号解码装置,其特征在于:
所述逆量化装置只使用由所述音频信号编码装置的若干个编码器中的某一个编码器输出的编码信号进行逆量化。
13.如权利要求1所述的音频信号编码装置,其特征在于:
所述特征判断器根据由低通滤波器处理过的信号,适当的选择出对输入至该特征判断器频率变换后的音频信号量化的频带。
14.如权利要求1所述的音频信号编码装置,其特征在于:
所述特征判断器根据通过包含对数计算的处理的信号,适当的选择出量化输入至该特征判断器的频率变换后的音频信号量化的频带。
15.如权利要求1所述的音频信号编码装置,其特征在于:
所述特征判断器根据由高通滤波器处理过的信号,适当的选择出量化输入至该特征判断器的频率变换后的音频信号的频带。
16.如权利更求1所述的音频信号编码装置,其特征在于:
所述特征判断器根据由带通滤波器或带阻滤波器处理过的信号,适当的选择出量化输入至该特征判断器的频率变换后的音频信号的频带。
17.如权利要求1所述的音频信号编码装置,其特征在于:
用所述特征判断器判定音频信号的特征,并根据该判定结果适当的选择所述的多个各级的各编码器量化的频带。
18.如权利要求17所述的音频信号编码装置,其特征在于:
用所述特征判断器判定音频信号的特征,并根据该判定结果限定所述的多个各级的各编码器量化的频带。
19.如权利要求18所述的音频信号编码装置,其特征在于:
所述各编码器量化的频带划分为低频频带、中频频带和高频频带,在对所述各编码器量化的频带进行限制的情况下,如果所述输入音频信号具有急剧变化的特征时,则限制上述各编码器量化的频带,使高频带比其它频带选的更多。
20.如权利要求18所述的音频信号编码装置,其特征在于:
所述各编码器量化的频带被划分为低频带、中频带、高频带,在更多地选择高频带作为所述各编码器量化的频带的场合,在由那一时刻至一定时间之内,按所述各编码器量化的频带更多地选择在高频带的方式控制。
21.如权利要求18所述的音频信号编码装置,其特征在于:
所述各编码器量化的频带被划分为低频频带、中频频带、高频频带,对所述原输入音频信号的特性进行判定,并且根据这一判定结果进行控制使所述各编码器量化的频带固定。
22.如权利要求1所述的音频信号编码装置,其特征在于:
所述各特性判别器把上述频率变换后的音频信号的频率数概形与通过上述正规化处理器计算的正规化系数串的任何一方或两方的值作为确定上述多个各级的各编码器量化频带的权值。
23.如权利要求1所述的音频信号编码装置,其特征在于:
具有:
判定所述的各级的各编码器的量化的音频信号的听觉和物理特性,并且确定该各编码器量化的编码频带的配置的特性判定器;
根据由所述特性判定器确定的编码频带配置信息控制所述的多个各级的各编码器量化频带配置的编码频带控制器;
并使所述多个各级的各编码器、所述特性判定器以及所述编码频带控制器的动作重复进行到满足预定的编码条件为止。
24.如权利要求23所述的音频信号编码装置,其特征在于:
所述特性判定器具有:
把预定的编码条件作为输入,计算出与所述的多个各级的各编码器的编码频带有关的编码频带信息的编码频带计算器;
把对所述编码频带信息和所述频率范围的音频信号或差分频谱中的任何一个进行预定滤波时的滤波器的输出作为输入,并且输出所述编码频带信息的编码频带的表示听觉重要程度的听觉权值用的听觉心理模式计算器;
输入该听觉权值和作为解析长度判定器输出的解析长度,确定所述编码器的配置方式并输出所述编码器的频带序号的配置确定器;
把所述编码频带信息和频带序号作为输入并根据预定的编码条件输出编码频带配置信息用的编码频带配置信息生成装置。
25.如权利要求23所述的音频信号编码装置,其特征在于:
所述编码频带控制器具有:
所述频率变换后的输入音频信号的频谱和所述编码频带配置信息作为输入,并且使所述输入音频信号的频谱在指定的频带进行偏移用的频谱偏移装置;
对于该频谱偏移装置的输出进行编码并输出编码代码串的编码器;
对于所输入的该编码代码串进行解码并输出解码频谱的解码频带控制器;
计算所输入的音频信号的频谱与所述解码频谱之间的差的差分计算装置;
一直到该解码频带控制器的下一动作周期,保持由所述差分计算装置输出的差分信息的差分频谱的保持装置。
26.如权利要求25所述的音频信号编码装置,其特征在于:
所述解码频带控制器具有:
对于所输入的编码代码串进行解码并输出合成频谱用的解码器;
根据所述编码代码串中的编码频带配置信息,使所述合成频谱在预定的频带进行偏移的频谱偏移装置;
在该解码频带控制器的下一动作周期内,保持由所述解码器输出的合成频谱并对过去的合成频谱与当前的合成频谱进行加法运算的解码频谱计算器。
27.一种对由如权利要求26所述的音频信号编码装置输出的编码音频信号进行解码并输出音频信号的音频信号解码装置,其特征在于:
还具有与所述音频信号编码装置的所述解码频带控制器具有同一构成的解码频带控制器。
28.一种音频信号编码·解码装置,该装置由如权利要求26所述的音频信号编码装置和对由该音频信号编码装置输出的编码音频信号进行解码并输出音频信号的音频信号解码装置构成,其特征在于:
所述音频信号解码装置具有与所述音频信号编码装置的所述解码频带控制器结构相同的解码频带控制器。
29.如权利要求27所述的音频信号解码装置,其特征在于:所述音频信号编码装置的所述频谱偏移装置输入所述音频信号频谱和所述编码频带配置信息,并且输出所述编码频带信息和偏移后的频谱。
30.如权利要求24所述的音频信号解码装置,其特征在于:
所述配置确定器在所述输入音频信号具有变化急剧的特性和所述解析长度比较小的场合,把上述多个各级的各编码器的编码频带配置为高频带比其它频带更多地被选择的方式。
31.如权利要求24所述的音频信号编码装置,其特征在于:
所述配置确定器在所述输入音频信号具有变化急剧的特性和所述解析长度比较小的场合,在由那一时刻至一定时间之内,把上述各编码器的编码频带配置为高频带比其它频带更多地被选择的方式。
32.如权利要求24所述的音频信号编码装置,其特征在于:
所述编码频带计算器中,在作为输出信号的编码频带信息与作为上述输入的编码条件中的比特率、或输入音频信号的取样频率之间具有使用多项式函数或对数函数或它们的组合的函数关系。
33.如权利要求32所述的音频信号编码装置,其特征在于:
所述编码条件中的所述编码器总数为三个以上时,取按频率变高的顺序为第三个的编码器的编码频带的上限为原音频信号频带的1/2。
34.如权利要求32所述的音频信号编码装置,其特征在于:
所述编码频带计算器把建立所述函数关系的函数作为附加考虑Bark率、Mel系数等的人类听觉特性的权值。
35.如权利要求24所述的音频信号编码装置,其特征在于:
所述配置确定器确定所述的多个各级的各编码器的编码频带的配置;通过预先准备所述各编码器配置的模式,为了提高编码效率而切换这些模式。
36.如权利要求24所述的音频信号编码装置,其特征在于:
所述配置确定器对于所述输入音频信号具有变化不急剧且保持稳定的特性,而所述的解析长度比较大的场合,作为所述的多个各级的各编码器的编码频带的最大值具有较小值。
37.如权利要求24所述的音频信号编码装置,其特征在于:
与所述各级编码的前级相连接的滤波器为低通滤波器、高通滤波器、带通滤波器、或带阻滤波器(Band Rejection Filter)中的一种,或为两种以上的组合。
38.如权利要求27所述的音频信号编码装置,其特征在于:
所述逆量化装置只使用由所述音频信号编码装置输出的一部分代码进行逆量化处理。
CN99108017A 1998-03-11 1999-03-11 音频信号编码装置、解码装置及音频信号编码·解码装置 Expired - Fee Related CN1131507C (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP059403/1998 1998-03-11
JP5940398 1998-03-11
JP059403/98 1998-03-11

Publications (2)

Publication Number Publication Date
CN1240978A true CN1240978A (zh) 2000-01-12
CN1131507C CN1131507C (zh) 2003-12-17

Family

ID=13112289

Family Applications (1)

Application Number Title Priority Date Filing Date
CN99108017A Expired - Fee Related CN1131507C (zh) 1998-03-11 1999-03-11 音频信号编码装置、解码装置及音频信号编码·解码装置

Country Status (6)

Country Link
US (1) US6871106B1 (zh)
EP (1) EP0942411B1 (zh)
KR (1) KR100304092B1 (zh)
CN (1) CN1131507C (zh)
DE (1) DE69915400T2 (zh)
ES (1) ES2216367T3 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101406064B (zh) * 2006-04-03 2011-10-26 三星电子株式会社 量化和反量化输入信号的方法和设备以及对输入信号编码和解码的方法和设备
US8924208B2 (en) 2010-01-13 2014-12-30 Panasonic Intellectual Property Corporation Of America Encoding device and encoding method
CN105745704A (zh) * 2013-10-18 2016-07-06 弗朗霍夫应用科学研究促进协会 音频解码器、用于生成经编码的音频输出数据的装置以及允许将解码器初始化的方法
CN106448630A (zh) * 2016-09-09 2017-02-22 腾讯科技(深圳)有限公司 歌曲的数字乐谱文件的生成方法和装置

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2791167B1 (fr) * 1999-03-17 2003-01-10 Matra Nortel Communications Procedes de codage, de decodage et de transcodage audio
KR100347752B1 (ko) * 2000-01-25 2002-08-09 주식회사 하이닉스반도체 이동통신 시스템에서 객관적 음질 평가 장치 및 그 방법
KR100708092B1 (ko) * 2000-06-15 2007-04-16 삼성전자주식회사 가변 샘플링 레이트를 이용한 녹음 및/또는 재생 장치 및그 방법
US8605911B2 (en) 2001-07-10 2013-12-10 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
ES2237706T3 (es) 2001-11-29 2005-08-01 Coding Technologies Ab Reconstruccion de componentes de alta frecuencia.
CN100346392C (zh) * 2002-04-26 2007-10-31 松下电器产业株式会社 编码设备、解码设备、编码方法和解码方法
JP3881943B2 (ja) 2002-09-06 2007-02-14 松下電器産業株式会社 音響符号化装置及び音響符号化方法
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
KR100513729B1 (ko) * 2003-07-03 2005-09-08 삼성전자주식회사 계층적인 대역폭 구조를 갖는 음성 압축 및 복원 장치와그 방법
JP4603485B2 (ja) 2003-12-26 2010-12-22 パナソニック株式会社 音声・楽音符号化装置及び音声・楽音符号化方法
US7994946B2 (en) * 2004-06-07 2011-08-09 Agency For Science, Technology And Research Systems and methods for scalably encoding and decoding data
JP2008519991A (ja) * 2004-11-09 2008-06-12 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声の符号化及び復号化
JP4635709B2 (ja) * 2005-05-10 2011-02-23 ソニー株式会社 音声符号化装置及び方法、並びに音声復号装置及び方法
WO2007105586A1 (ja) * 2006-03-10 2007-09-20 Matsushita Electric Industrial Co., Ltd. 符号化装置および符号化方法
DE602007003023D1 (de) * 2006-05-30 2009-12-10 Koninkl Philips Electronics Nv Linear-prädiktive codierung eines audiosignals
KR100827458B1 (ko) * 2006-07-21 2008-05-06 엘지전자 주식회사 오디오 부호화 방법
JP2008076776A (ja) * 2006-09-21 2008-04-03 Sony Corp データ記録装置、データ記録方法及びデータ記録プログラム
CN101179278B (zh) * 2006-11-07 2010-09-08 扬智科技股份有限公司 音响系统及其声音讯号编码的方法
JP4871894B2 (ja) * 2007-03-02 2012-02-08 パナソニック株式会社 符号化装置、復号装置、符号化方法および復号方法
JP4708446B2 (ja) * 2007-03-02 2011-06-22 パナソニック株式会社 符号化装置、復号装置およびそれらの方法
RU2459283C2 (ru) * 2007-03-02 2012-08-20 Панасоник Корпорэйшн Кодирующее устройство, декодирующее устройство и способ
JP5045295B2 (ja) * 2007-07-30 2012-10-10 ソニー株式会社 信号処理装置及び方法、並びにプログラム
KR101235830B1 (ko) * 2007-12-06 2013-02-21 한국전자통신연구원 음성코덱의 품질향상장치 및 그 방법
WO2010092568A1 (en) * 2009-02-09 2010-08-19 Waves Audio Ltd. Multiple microphone based directional sound filter
CN101847412B (zh) * 2009-03-27 2012-02-15 华为技术有限公司 音频信号的分类方法及装置
WO2012026741A2 (ko) 2010-08-24 2012-03-01 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
WO2012144128A1 (ja) * 2011-04-20 2012-10-26 パナソニック株式会社 音声音響符号化装置、音声音響復号装置、およびこれらの方法
CN110706715B (zh) 2012-03-29 2022-05-24 华为技术有限公司 信号编码和解码的方法和设备
WO2014009775A1 (en) * 2012-07-12 2014-01-16 Nokia Corporation Vector quantization
CN104217726A (zh) * 2014-09-01 2014-12-17 东莞中山大学研究院 一种无损音频压缩编码方法及其解码方法
CN115579013B (zh) * 2022-12-09 2023-03-10 深圳市锦锐科技股份有限公司 一种低功耗音频解码器

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU653582B2 (en) * 1991-01-08 1994-10-06 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
JP3277679B2 (ja) * 1994-04-15 2002-04-22 ソニー株式会社 高能率符号化方法と高能率符号化装置及び高能率復号化方法と高能率復号化装置
TW321810B (zh) 1995-10-26 1997-12-01 Sony Co Ltd
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5781888A (en) * 1996-01-16 1998-07-14 Lucent Technologies Inc. Perceptual noise shaping in the time domain via LPC prediction in the frequency domain
JP3189660B2 (ja) * 1996-01-30 2001-07-16 ソニー株式会社 信号符号化方法
US5913191A (en) * 1997-10-17 1999-06-15 Dolby Laboratories Licensing Corporation Frame-based audio coding with additional filterbank to suppress aliasing artifacts at frame boundaries

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101406064B (zh) * 2006-04-03 2011-10-26 三星电子株式会社 量化和反量化输入信号的方法和设备以及对输入信号编码和解码的方法和设备
US8924208B2 (en) 2010-01-13 2014-12-30 Panasonic Intellectual Property Corporation Of America Encoding device and encoding method
CN105745704A (zh) * 2013-10-18 2016-07-06 弗朗霍夫应用科学研究促进协会 音频解码器、用于生成经编码的音频输出数据的装置以及允许将解码器初始化的方法
CN105745704B (zh) * 2013-10-18 2019-08-23 弗朗霍夫应用科学研究促进协会 用于编码和解码音频数据的装置以及方法
US10614824B2 (en) 2013-10-18 2020-04-07 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, apparatus for generating encoded audio output data and methods permitting initializing a decoder
US11423919B2 (en) 2013-10-18 2022-08-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, apparatus for generating encoded audio output data and methods permitting initializing a decoder
US11670314B2 (en) 2013-10-18 2023-06-06 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, apparatus for generating encoded audio output data and methods permitting initializing a decoder
CN106448630A (zh) * 2016-09-09 2017-02-22 腾讯科技(深圳)有限公司 歌曲的数字乐谱文件的生成方法和装置
CN106448630B (zh) * 2016-09-09 2020-08-04 腾讯科技(深圳)有限公司 歌曲的数字乐谱文件的生成方法和装置
US10923089B2 (en) 2016-09-09 2021-02-16 Tencent Technology (Shenzhen) Company Limited Method and apparatus for generating digital score file of song, and storage medium

Also Published As

Publication number Publication date
EP0942411A3 (en) 2002-01-30
DE69915400T2 (de) 2004-08-05
US6871106B1 (en) 2005-03-22
KR19990077753A (ko) 1999-10-25
CN1131507C (zh) 2003-12-17
DE69915400D1 (de) 2004-04-15
ES2216367T3 (es) 2004-10-16
EP0942411A2 (en) 1999-09-15
KR100304092B1 (ko) 2001-09-26
EP0942411B1 (en) 2004-03-10

Similar Documents

Publication Publication Date Title
CN1240978A (zh) 音频信号编码装置、解码装置及音频信号编码、解码装置
CN1096148C (zh) 信号编码方法和装置
CN1200403C (zh) 线性预测编码参数的矢量量化装置
CN1161751C (zh) 语音分析方法和语音编码方法及其装置
CN1264138C (zh) 复制语音信号、解码语音、合成语音的方法和装置
CN1172292C (zh) 在编码宽带信号中用于适应性带宽音调搜寻的方法与设备
CN1324558C (zh) 编码设备,解码设备以及音频数据分配系统
CN1158648C (zh) 语音可变速率编码方法与设备
CN1156872A (zh) 语音编码的方法和装置
CN1689069A (zh) 声音编码设备和声音编码方法
CN1202514C (zh) 编码和解码语音及其参数的方法、编码器、解码器
CN1155725A (zh) 语音编码方法和装置
CN1236420C (zh) 量化线谱对参数特征提取器及其特征提取方法
CN1146203C (zh) 用于音频编码的动态位分配装置和方法
CN1187735C (zh) 多模式话音编码装置和解码装置
CN1145512A (zh) 再现语音信号的方法和装置以及传输该信号的方法
CN1097396C (zh) 声音编码装置和方法
CN101057275A (zh) 矢量变换装置以及矢量变换方法
CN1274456A (zh) 语音编码器
CN101076853A (zh) 宽带编码装置、宽带线谱对预测装置、频带可扩展编码装置以及宽带编码方法
CN1238514A (zh) 相位量化方法和装置
CN1947174A (zh) 可扩展编码装置、可扩展解码装置、可扩展编码方法以及可扩展解码方法
CN1871501A (zh) 频谱编码装置、频谱解码装置、音响信号发送装置、音响信号接收装置及其使用方法
CN1795495A (zh) 音频编码设备、音频解码设备、音频编码方法和音频解码方法
CN1677493A (zh) 一种增强音频编解码装置及方法

Legal Events

Date Code Title Description
C10 Entry into substantive examination
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20031217

Termination date: 20180311