CN1065381C - 数字音频信号编码和/或译码方法 - Google Patents

数字音频信号编码和/或译码方法 Download PDF

Info

Publication number
CN1065381C
CN1065381C CN95113120A CN95113120A CN1065381C CN 1065381 C CN1065381 C CN 1065381C CN 95113120 A CN95113120 A CN 95113120A CN 95113120 A CN95113120 A CN 95113120A CN 1065381 C CN1065381 C CN 1065381C
Authority
CN
China
Prior art keywords
frequency spectrum
data block
information
composition
coded data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CN95113120A
Other languages
English (en)
Other versions
CN1136235A (zh
Inventor
筒井京弥
及川芳明
下吉修
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of CN1136235A publication Critical patent/CN1136235A/zh
Application granted granted Critical
Publication of CN1065381C publication Critical patent/CN1065381C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/667Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using a division in frequency subbands
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00007Time or data compression or expansion

Abstract

对音频信号进行高效编码的方法和装置,其装置包括将输入信号转换成频率成分的电路和将频率成分分离成音调和噪声成分的电路,以及音调成分和噪声成分编码电路。音调成分由规定频带的信号构成,用规定频带的信息编码。噪声成分用预置编码单元规格化和量化,并用量化精度信息编码。若高范围比低范围侧用更少的位数,对噪声成分量化阶梯数量的信息编码。用本发明可改善主要信息和辅助信息编码效率,并可保证自由度从而实现满意的编码。

Description

数字音频信号编码和/或译码方法
本发明涉及到一种用于对诸如数字音频信号的数字信号进行高效编码的高效方法和装置,一种用于对这些编码后的信号进行译码的高效译码装置以及用于记录这些编码及信号的记录介质。
已经知道了多种用于对音频或语音信号进行高效编码的方法。其中的一个例子就是变换编码。在这种编码中,在时间轴上表示一个音频信号的数字信号帧被利用正交变换转换成在频率轴上表示该音频信号的频谱系数数据块。另一个例子是副带编码,在这种编码中,利用一个滤波器组将音频信号的频带分成多个副带,而不用在进行编码之前沿时间轴将所述信号构成多个帧。
另外还知道了副带编码和变换编码的结合,它是首先利用副带编码将表示音频信号的数字信号分成多个频率范围,然后再对所述频率范围中的每一个进行编码。
用于将频谱分成多个等宽频率范围的一个滤波器包括在55.Bell Syst Tech J.No.8(1976)由R.E.Crochiere等人在“利用副带进行的语音数字编码”一文中所讨论的正交镜象滤波器(QMF)。利用QMF滤波器,可以将信号的频谱分成两个等宽的频带。当利用这种划分所导致的频带相互连续结合时,不会产生混淆。
由Joseph H.Rothweiler.ICASSP 83.Boston公开的一种新的副带编码技术:多相正交滤波器也示出了将一个信号的频谱分成等宽频带的技术。利用这种多个QMF,所述信号的频谱可以同时被分成多个等宽的频带。
一种正交变换技术包括把数字输入音频信号分成多个具有预定时间宽度的帧,然后使用离散付里叶变换(DFT),离散余弦变换(DCT)和经修改的DCT(MDCT)对所产生的帧进行处理,以把所述信号从时间轴转换到频率轴。关于MDCT的讨论可以在J.P.Princen和A.B.Bradley的文章″在时间域混淆消除的基础上使用滤波器组进行副带变换编码″(ICASSP.1987)中看到。
通过对已经被分成频带的信号进行量化,可以对这些容易产生量化噪音的频带进行控制。特别是,通过使用音质的“屏蔽效应”,可以实现更加有效的音质编码。另外,如果使用信号成份绝对值的最大值逐个频带地对所述信号成份进行规格化,就可以对信号进行更加有效地编码。
一种公知技术使用多个副带以运用人类听觉系统音质特征。特别是,在频率轴上表示一个音频信号的频谱系数被分成多个(例如25个)临界频带。这些临界频带的宽度随着频率的增加而增加。使用预置位分配或自适应位分配对带基数据进行编码。
下面来讨论两种公知的位分配技术。第一种是在IEEETransactions of Acoustics,Speech,and Signal Processing,Vol.ASSP-25,No.4 August 1977由R.Zelinsli and P.Noll发表的“语音信号的自适应变换编码”中所讨论的,它根据那个频带内最后一个信号处的幅值将多个位指定给每一个频带。使用这种方法导致了平滑的量化噪声并使噪声能量最小化。但是,由于这种技术不能有效地发挥音质屏蔽效应,所以,监听者所感觉到的噪声电平并不是最佳的。
第二种位分配技术是在ICASSP 1980由M.A.Krassner在“听觉系统感性要求数字编码-临界频带编码器”一文中所讨论的,它使用音质屏蔽机构去确定一个固定的位分配,从而产生与每一个临界频带相关的所需信噪。但是,如果使用很强音调信号(如1KHZ的正弦波)对所述系统的信噪比进行测量,由于在临紧频带中多个位是固定分配的,其结果也不是最佳的。
为了克服这些问题,建议了一种高效编码装置,在这种装置中,一个位分配可以获得的位的总数在为每一个小数据块预置的固定位分配模式和以数据块为基础的信号幅值从属位分配模式之间进行分配。特定的分配分割与输入信号相关,信号频谱愈平滑,与固定位分配模式相关的分割比就愈高。
利用这种技术,如果象在正弦波输入的情况那样能量被集中在一个特定的频谱成份之中,那么,大量的位就要被分配给包含有那个特定频谱成份的数据块,这就有效地改善了信噪比。由于人类听觉系统对于高音频谱成份具有很高的感知能力,所以,这种技术不仅可以改善测量信号的信噪比,而且可以改善监听者可感觉到的声音的质量。
除了上述技术以外,还建议了各种其它的技术,并制出了模仿人类听觉系统的模型,因此,若在性能上对所述的编码设备进行改进,就可以实现高效的按照人类听觉系统的编码。
在受让人已经在国际专利申请No.94/28633(相当于美国未公开专利申请SN 08/74518和欧洲专利0653846中作出如下建议的方法,即将听觉的关键音调成份和频谱信号分离开来,并对这些与剩余频谱成份无关的关键音调成份进行编码。这使得可以利用高压缩比对音频信号进行编码,而从听觉上不会感到音频信号变坏。
如果将DFT或DCT用作将波形信号变换成频谱信号的方法,并且使用由M个取样组成的时间数据块来执行这种变换,那么就要产生M个独立实数取样。由于一个给定的数据块通常与来自两个相邻数据块的所有M1个取样相互重叠以减少两个时间数据块之间的连接失真,所以M个实数数据被量化并在DFT或DCT中被编码以用于(M-M1)个取样。
另一方面,如果利用MDCT将波形信号变换成频谱信号,由于M个独立实数数据是由与来自两个相邻数据块的所有M个取样相互重叠的2M个取样数据块产生的,所以,M个实数数据被量化并在MDCT中被编码以用于M个取样。在译码设备中,在每个数据块处对来自MDCT的编码数据进行反向变换以产生波形元素,并将其综合起来的重新构成所述的波形信号。
如果增加用于变换的时间数据块的长度,频率的分辨率也会增加,这样,能量就会集中在规定的频谱成份内。由于这个原因,通过使用其中是利用由与两个相邻数据块相互重叠一半而导致的长数据块长度执行所述变换且与原来时间取样的数量相比所产生频谱信号的数量没有增加的MDCT,就可以能够比使用DFT或DCT更高效地实现编码。通过使相邻数据块与长重叠长度重叠可以减少波形信号的数据块之间的失真。
为了构成一个实际的代码串,首先利用与每个希望被规格化和量化的频带相关的予置数量的位对量化精度信息和规格化用数信息进行编码,然后对规格化和量化后的频谱信号进行编码就足够了。
在国际标准ISO/IEC 11172-3∶1993(E),a 993(MPEG-audiostandard)第16和47页中公开了一种高效编码方法,在这个方法中,表示量化阶梯信息的位的数量各个频带是不相同的。就是说,当频率增加时,使用较少的位来表示量化精度信息。
另外,还公知了一种在译码器中(根据规格化因数信息)确定量化精度信息而不是直接对量化精度信息进行编码的方法。但是,使用这种方法,由于规格化精度信息和量化精度信息之间的关系是预先确定的,所以,它不可能根据更加先进的人类听觉感知仿真模型在以后去控制量化精度。假如在压缩化中实现了某些宽度,那么,当压缩化发生变化时,就必须重新设置规格化精度信息数量化阶梯信息之间的关系。
为了进一步提高压缩化,不仅需要提高由规格化和再量化频率成份组成的“主信息”的编码效率,而且还需要提高包括有量化精度信息在内的“辅助信息”的编码效率。
然而,由于为抑制与人类听觉感知相关的信号恶化所需的量化阶梯取决于输入信号的频率成份分布,可以必须具有足够的摆动级的设置量化阶梯。另外,还需要足够的自由度(freedom)级去表示具有各种压缩比和相应音调的量化精度信息。
就编码方法而言,在所产生代码满足MDEG-音频标准的情况下,可以使用任一选择的编码方法。但是,希望能够使用相应的编码方法实现高效的编码。
本发明提供一种对信号高效编码的方法和装置,用于不仅提高对主要信息,而且对辅助信息的编码效率,并且还能够以保证足够的自由度以实现最佳编码的方式表示辅助信息。
本发明还提供了一种能够进行高效编码的方法和装置,借此使所产生的代码满足MPEG-音频标准并实现高的编码效率。
本发明的再一个目的就是要提供一种用于对由所述编码方法和装置进行编码的信号进行译码的方法和装置,并提供一种用于传送由所述编码方法和装置产生的编码串的传送介质。
利用本发明的高效编码方法和装置,(可以是数字形式的)信号被变换成频率成份。所述频率成份被分隔成仅由规定频带信号成份组成并与用于规定所述频带的信息一起编码的第一频谱成份和由一个预定编码单元进行规格化和量化并与量化精度信息一起编码的第二频谱成份。所述第二频谱成份的量化精度信息使用比低范围侧数量更少的用于高范围侧的位数进行编码。
利用本发明的高效编码方法和装置,输出信号被变换成频率成份,并且部份或全部的频率成份被规格化和数量化以用于每个预置的编码数据块。为了进行量化,通过从重新设置量化精度信息中选择一个相关量化精度信息代码对量化精度信息进行编码,所述重新设置量化精度信息用于选择由多个与用于每组相连编码数据块的多个量化精度信息代码相关的量化精度信息数据组成的分支。用于规定多组相连编码数据块边界的边界信息也被编码。
第一频谱成份是规定频率显示信号能量浓度中的音调成份,以编码数据块为基础的规格化和量化是在规定频率显示信号能量浓度中与音调成份相隔开的其余频率成份上执行的。
量化精度信息代码是从由多个与用于每组相连编码数据块的多个量化精度信息代码相关的量化精度信息数据所组成的预置量化精度信息选择分支中选择出来的。用于规定多个相连编码数据块组边界的边界信息也被编码。用于规定量化精度信息选择分支的信息也被编码。对于所述较高范围侧,包含在量化精度信息选择分支中的量化精度信息数据较少。通过包括正交变换的处理将其变换成频率成份。输入信号是音频信号。
本发明的高效译码装置对和频带规定信息一起编码的仅由规定范围频率成份组成的第一频谱成份进行译码,且量化精度信息代码,即对于较高范围比对于较低范围使用较少数量位进行编码的相应量化精度信息被译码。根据从量化精度信息代码译码的量化精度信息,由通过对每一个预置编码数据块进行规格化和量化并将其进行编码所获得的频率成份组成的第二频谱成份被译码,然后,被译码的第一和第二频谱成份被合成到一起。
本发明的高效译码装置对用于规定多组预置相连编码数据块边界的编码边界信息进行译码,并从由多个与用于每组相连编码数据块的多个量化精度信息代码相关的量化精度信息数据组成的预置量化精度信息选择分支中选择一个相关的量化精度信息数据,以用于根据量化精度信息进行编码的量化精度信息进行译码,并用于根据从编码之前的量化精度信息代码中译码的量化精度信息对由通过规格化和量化每一编码数据块而获得的频率成份组成的信号进行译码。
第一频谱成份是规定频率显示信号能量浓度的音调成份。以编码数据块为基础的规格化和量化是在规定频率显示信号能量浓度中与音调成份相隔开的其余频率成份上执行。
本发明的高效译码装置对用于规定多组预置相连编码数据块边界的编码边界信息进行译码,并且,为了对量化精度信息代码进行译码,本装置还要从由多个与多个量化精度信息代码相关的量化精度信息数据组成的预置量化精度信息选择分支中选择与该量化精度信息代码相关的量化精度信息。所述择码装置对用于为每组相连编码数据块规定量化精度信息选择分支的编码信息进行译码,并根据译码的规定信息为每组相连编码数据块规定量化精度信息选择分支。对于高范围侧来讲,包含在量化精度信息选择分支中的量化精度信息数据的数量较少。
利用反向正交变换对由译码后频率成份组成的信号进行处理。输入信号是音频信号。
本发明的记录介质一般包括一个传送介质,其上记录有利用本发明的上述高效编码方法和装置编码的信号。
根据本发明,作为听觉关键成份的音调成份是与所述频谱相互隔开的,并且不依赖于其它的频谱成份而进行编码。对于编码,表示高范围侧量化精度信息的位的数量被设置得少于表示低范围侧量化精度信息的位的数量,借此以增加编码效率。
根据本发明,表示量化精度信息的位的数量逐个频带是可随机变化的,并且对用于规定位数量变换边界的边界信息进行编码,以利用符合输入信号特征的较宽的自由度级实现有效的编码。
图1的方框电路图示出了根据本发明的高效编码器的基本配置;
图2的电路方框图示出了图1编码器中变换电路的示意性配置;
图3的电路方框图示出了根据本发明一个实施例的所述图1中一个信息成份编码电路的基本配置;
图4的方框电路图示出了根据本发明的一个高效译码器的基本配置;
图5的方框电路图示出了图4译码器中一个反向变换电路的示意性配置;
图6示出了根据本发明的一个代码串的结构;
图7示出了根据本发明的一个代码串结构的例子;
图8示出了根据本发明的一个代码串的结构的另一个例子;
图9示出根据本发明的编码方法;
图10更详细地示出了根据本发明的编码方法;
图11的电路方框图示出了根据本发明的高效编码器的第一和第二实施例的示意性配置;
图12用于解释根据第一实施例用于构成一个代码串的方法;
图13示出了在第一和第二实施例中信号成份分离的处理流程;
图14的电路方框图示出了根据本发明的高效译码器的第一和第二实施例的示意性配置;
图15示出了本发明第二实施例中代码串结构的第一示意例;
图16示出了根据第二实施例一个代码串结构的第二示意图例;
图17示出了在第二实施例中,用于在量化阶梯信息表中决定一个边界的处理流程;
图18示出了在第二实施例中,在音调和噪声成份相互分离的情况下的一个编码串结构的例子。
下面参考附图详细描述本发明。
图1是一个根据本发明一个实施例的高效编码器的基本配置的电路方框图。在图1的编码器中,通过输入端10将波形信号(即声音信号)提供给编码器。变换电路11将波形信号转换成频谱成份并将其提供给信号成份编码电路12以进行编码。信号成份编码电路12的输出被提供给代码串产生电路以产生代码串。编码器所产生的代码串由输出端14输出。代码串从输出端14被提供给一个误差校正电路或调制电路(未示出),以用于将其传送或记录到记录介质15上,该记录介质可以是一个光盘。
图2简要的示出了变换电路11的电路方框图。参看图2,进入输入端20的输入信号被频带分离滤波器21分离成两个频带。两个频带的带宽分别各自是提供给输入端20的波形信号带宽的一半。两个频带的信号被分别提供给各自的正向正交变换电路22和23。所述的正交变换电路使用诸如MDCT的处理对所述频带信号进行正交变换。从正交变换电路22和23产生的频谱成份分别被提供给相应输出端24和25,以作为来自图1变换电路11的频谱成份。该频谱成份被提供给(图1中的)信号成份编码电路12。在图1中,提供了来自正向变换电路22和23的两个频带的频谱成份以用作变换电路11的信号输出。
在图1变换电路的另一个实施例中,可以利用MDCT将输入信号直接变换成频谱信号。在再一个实施例中,可以利用DFT或DCT对输入信号进行变换。在还有的另一个实施例中,可以单独使用一个频带分离滤波器把输入信号分离成频带成份。但是由于当编码信号显示能量浓度处于规定频率内时本发明的高效编码方法的优点更加突出,所以,能够使用相对少量的处理操作而能产生大量频率成份的图2所示实施例是用于把波形信号变换成频率成份的最佳方案中的一个。
图3简要示出了图1所示信号成份编码电路12的配置。参看图3,利用规格化电路31将来自变换电路11通过输入端30提供的频谱成份逐个频带地进行规格化。规格化以后的频谱成份被提供量化电路33。频谱成份还从输入端30提供给量化阶梯判定电路32。量化阶梯判定电路32根据频谱成份计算在量化电路33中量化阶梯的数量(即量化精度)。量化电路33根据由量化阶梯判定电路32计算的量化阶梯数量对规格化后的频谱成份信号进行量化。除了被量化的规格化后频谱成份信号以外,量化电路33还输出量化因数信息和量化精度信息代码给端34。规格化因数信息包括在规格化电路31中使用的一定数量的规格化因数的编码数据,量化精度信息代码包括由量化阶梯判定电路32计算的一定数量量化阶梯的编码数据(量化精度方面的信息)。由输出端34输出的信号传送给图1的代码串产生电路13。
图4示出了一个用于从图1所示编码电路产生的代码串中再现信号的高效译码器基本配置的电路方框图。参看图4,由图1编码器产生的(被传送或记录在记录介质上的)代码串被提供给输入端40。所述代码串被提供给代码串分辨电路41,在该电路中,分离并抽取各频谱成份的编码后代码,即量化阶梯信息和规格化因数信息。被分离并抽取的编码后频谱成份,即量化精度信息和规格化因数信息被提供给信号成份译码电路42。信号成份译码电路42对编码后的量化精度信息和规格化因数信息进行译码,并利用译码后的量化精度信息和规格化因数信息对编码的频谱成份进行译码的重新存贮原来的频谱成份。这些原来的频谱成份被提供给反相变换电路43,该电路将所述原来的频谱成份变换成波形信号。该波形信号通过输出端44被提供给下游侧的一个电路,以继续对所述波形信号进行处理。
记录介质例如可以是磁带记录介质、光盘、光磁盘、磁盘、半导体存贮器或IC卡。传送介质例如可以是电缆、光缆或通过空气的电磁幅射。
图5示出了图4中反向正交变换电路43的配置方框图,该电路执行与由图2变换电路执行的变换操作相反的反向正交变换操作。
参看图5,(已经利用图4所示信号成份译码电路42重新存贮的)重新存贮原始频谱成份通过输入端50、51被分别提供给反向变换电路52、53以进行反向变换。已经被反向变换电路52、53进行了反向变换的各频带信号被传送给频带合成滤波器54,在这里,它们被进行频带合成。然后,频带合成后的信号被提供给输出端55。
上面描述了高效编码器(图1-3)和译码器(图4-5)的基本实施例,下面描述依据本发明的高效编码方法和高效译码方法。首先利用比较来描述传统的高效编码方法。
图6示出了一个通过对输入信号进行变换(即通过图2所示变换电路11)而获得的频谱成份SP的例子。在图6中,通过MDCT获得的频谱成份绝对值的能级术语分贝(dB)表示。特别是,通过利用图2的频带分离滤波器21对输入信号的一次数据块进行频带分离,变换电路11对两个频带的信号进行变换,并利用图2的变换电路22,23将频带分离后的信号变换成例如64个频谱成份SP。
频谱成份SP被从变换电路11提供给图3的信号成份编码电路12。信号成份编码电路12将用于由变换电路11提供的两个频带中每一个的64个频谱成份编组成如图6所示的较窄带宽U1到U8的16个副带(或“编码数据块”),利用图3的规格化电路使用分别与编码数据块U1到U8相关的规格化因数NL1到NL8对各编码数据块的频谱成份SP进行规格化。然后利用量化电路33对各编码数据块规格化以后的频谱成份SP进行量化。量化阶梯的数量(即量化精度)从一个编码数据块到另一个编码数据块是利用量化阶梯判定电路32根据在各编码数据块中频率成份的分布方式加以改变的。这样,在允许听觉有效编码的同时,可以使音质的变坏为最小。利用信号成份编码电路12可以选择在各数据块中的各编码数据块的带宽朝向低频范围方向为较窄,而朝着高频范围方向为较宽。这就使得可以对量化噪声的产生进行控制,以保持人类听觉感知的音质特征。
下面借助表1来解释量化阶梯的数量,即量化阶梯信息和由代码串产生电路13产生的量化信息代码之间的关系:
表一
量化精度信息的位数 量化阶梯信息代码 量化阶梯的数量
3 000001100001100101110111 137153163127255
2 00011011 137255
1 01 13
表1示出了从级1到级255变化的量化阶梯数是可利用3位、2位或1位来表示的,参看表1,若量化阶梯信息码是以三个位(从“000”到“111”)表示的,那么每一个都对应于8个量化阶梯级号1、3、7、15、31、63、127和225中的一个。另一方面,若量化阶梯信息代码是以两个位从“00”到“11”)表示的,那么其中的第一个都对应于4个量化阶梯级号1、3、7和255中的一个。
最后,若量化阶梯精度信息代码仅由一个位(“0”和“1”)来表示,那么其中的每一个对应于量化阶梯级号1和3中的一个。具有量化阶梯级号1的一个特定编码数据块的量化意味着在那个编码数据块中的频谱成份SP全都具有零值。
通常,以相同的位数来表示用于对U8进行编码的量化阶梯的数量。例如,图7示出了使用传统技术通过使用3位量化阶梯信息码对编码数据块U1到U8(分别是量化阶梯信息数据q1到q8)的量化阶梯数进行编码而获得的一个代码串。另一方面,根据本发明,用于对U1到U8中每一个编码数据块进行编码的量化阶梯的数量可以不等的位数表示,编码分辨率要求-较低的地方使用较少的位。图8示出了一个使用了位量化阶梯信息码对两个低范围编码数据块U1和U2(量化阶梯信息数据q1和q2)的量化阶梯数进行编码并使用2位量化阶梯信息码对其余编码数据块(量化阶梯信息数据q2到q8)的量化阶梯数进行编码所获得的一个代码串。
在图7和图8的代码串中,在量化精度信息区(在图7的代码串中是101,在图8代码串中是111)输入量化阶梯信息代码,同时分别在规格化因数信息区(在图7代码串中是102,在图8代码串中是112)和规格化和量化后频率成份串区(在图7代码串中是103,在图8代码串中是113)中输入编码后的规格化因数信息数据和规格化后的量化频谱成份。
通常,已经知道人类的听觉感知能力对于高频信号成份要低于低频范围信号成份。另外,在大多数情况下,信号能量被集中在低频范围。这样,量化阶梯的数量(量化精度)对于低频范围就不需要对于高频范围那样高。就是说,利用具有较少位数的量化阶梯信息数据对高范围频谱成份进行编码对于听者后来听到的声音不会产生有害影响。
这样,就高范围频谱成份而言,就可以使用由较少位数(例如使用与低频范围频谱成份的3位比较是2位)表示的信息精度信息码对量化精度信息进行编码,从而改善了编码效率,如图8所示。
然而,参看图9,有这种情况,即在诸如编码数据块U6和U7的相对高范围编码数据块中存在有A和B处所示出的具有集中能量的音调成份。这些音调成份是决定性声音成份,所以,必须使用足够的量化精度进行编码。
使用其中用于高范围频率的所有量化阶梯信息代码都是以两位表示的如图8所示的量化阶梯数,使用由量化阶梯信息码“11”(表1)所规定的最大台阶数(级255),可以构成用于对包括具有集中能量的这些音调成份的数据块进行编码的量化。但是,由于使用比所需要高的量化精度对在同一数据块中的频谱成份进行量化,所以降低了编码效率。
考虑到这一点,使用本发明第一实施例的高效编码方法确定为保证音质哪一个频谱成份是需要高量化精度的音调成份。在对用于其它“非音调”成份的一定数量的量化阶梯(量化精度信息)进行编码过程中,利用较少位数所表示的量化精度信息码对一定数量的量化阶梯进行编码。
参看图10来讨论哪些频谱成份是需要高量化精度的“音调成份”,哪些是“非音调成份”(即噪声成份)。
音调成份是那些表现出集中能量分布的频谱成份。在本实施例中,表现出最高集中能量分布的3到8频率成份被分离成音调成份。
参看图10,在编码数据块U6中的频谱成份A1,A2和A3(用虚线表示)和在编码数据块U7中的B1、B2和B3(也用虚线表示)是音调成份。如图10中可以很明显地看出,若用虚线所表示的音调成份被分离出来,那么在包含有音调成份的编码数据块中剩余频谱成份的绝对值就较小,所以,规格化因数就可以减小。若在规格化以后使用了较低的量化精度,那么,随它而产生的量化噪声电平将与使用足够量化精度时所产生的量化噪声电平相同(图9)。
另外,对于含有音调成份的数据块进行编码和对于相邻数据块,音调成份的屏蔽效应如下:即使是由用于这些编码数据块的量化阶梯数被置成1从而使得除音调成份以外的所有频谱成份的幅值被置为0,由听者最后收听到的音质也仅有很少的变劣。
这样,通过把音调成份分离出来并对剩余的非音调成份进行量化和编码,可以在位于包含有音调成份的编码数据块附近的编码数据块中保持较低的量化精度(较小的量化阶梯数)。这样,对于这些编码数据块而言,较少的位数足以表示量化精度(量化阶梯数)。换言之,就可以使用能够用较少位数表示的量化精度信息码。
在大多数情况下,音调成份是基波成份和高次谐波成份,在较高频率处,高次谐波成份被衰减。因此,对于这些具有高信号电平的高范围音调成份而言,基波成份的频率通常高得足以使得高频范围音调成份能够与在频率轴上的其它成份相互分离。
因此,在高频端处从非音调成份中分离音调成份要比在低频端处从非音调成份中分离音调成份要容易。另外,考虑到人类听觉感知的音质特征,根据临界带宽,编码数据块的宽度被选择得在高频范围侧较宽。这样,就可以更加有效地去分离高频范围侧上的音调成份,从而增加了编码效率。
下面结合图11来解释用于执行本发明高效编码方法的具有图1所示基本配置的高效编码器。
参看图11,在输入端60处提供诸如是模拟声音信号的波形信号。利用类似于图1和图2所示变换电路的变换电路61将这些声音信号变换成频谱成份。这些频谱成份被提供给位于图1所示信号成份编码电路12之中的信号成份分离电路62。
信号成份分离电路62将频谱成份分离成显示出急剧升降的频谱分布的音调成份和作为噪声而显示出平滑频谱分布的其它频谱成份。即:信号成份分离电路62将提供给它的频谱成份分离成由显示出集中能量分布的预置较少数量(例如3到8)的频谱成份构成的音调成份和剩余的噪声成份。所述的音调成份和噪声成份被分别传送给音调成份编码电路63和噪声成份编码电路64。
音调成份编码电路63和噪声成份编码电路64具有图3所示相应电路的同样基本结构,并且它们对分别提供给它们的音调成份和噪声成份执行上述的规格化和量化处理。但是,音调成份编码电路63只对音调成份进行处理,而噪声成份编码电路64只对分离出音调成份以后噪声成份进行处理。由于在包含音调成份以后噪声成份进行处理。由于在包含有音调成份的编码数据块中其余频谱成份的绝对值比起音调成份本身的绝对值相对要小,所以,对于这些编码数据块可以使用较小值的规格化因数。
应当理解,所述的术语“噪声成份”是一个频谱成份,它可以或不可以用“噪声”来表示,但最好它们单独由较低能量的频谱成份组成。
另一方面,如果对每个编码数据块使用规格化后的低量化精度(即使用较小的量化阶梯数),那么,随后产生的量化噪声电平可以保持得与当音调成份没有被分离出去但使用较高量化精度时的电平。这样,噪声成份编码电路64对每个编码数据块使用规格化以后的粗量化精度。
另外,在与含有音调成份的编码数据块相邻的编码数据块中,音调成份的屏蔽效果如下,即听者几乎感觉不到所述信号有任何变坏,这样,噪声成份编码电路64将这些相邻编码数据块的量化阶梯数设置为1,而将这些噪声成份的幅值设定为0。
因此,在图11所示的第一实施例的高效编码方法和装置中,由于音调成份被分离且除了分离的音调成份以外的其余频谱成份(即噪声成份)被逐个编码数据块的量化和编码,所以就可以在位于含有音调成份的编码数据块附近的编码数据块中保持粗量化精度,并因此而使用由较小位数表示的量化精度信息码。在保持用以表示量化精度信息的位数″相对较低的同时,可以保持控制量化精度方面的高自由度级并实现高效编码。
音调成份编码电路63和噪声成份编码电路64除了要将各自的量化后频谱成份提供给代码串产生电路65以外,还要向代码串产生电路65提供编码的规格化因数信息和量化精度信息数据。所述的代码串产生电路65与图1所示的代码串产生电路13相同或类似。
代码串产生电路65根据上述提供给它的信号产生如图2所示的代码串。即:代码串产生电路65在每个数据块的导引端处安排了通过对分离的音调成份进行编码而获得的音调成份信息121和用于规定音调成份频带的信息。接着安排对其余噪声成份进行编码所获的噪声成份信息。特别是,编码的噪声成份信息包括用于每个编码数据块的量化阶梯信息码122(q1到q8)、用于每个编码数据块的规格化因数信息123(n1到n8)和被规格化和量化了的频谱成份的串124。
在图12的例子中,分别用于图20低范围编码数据块U1和U2的量化阶梯信息码q1和q2中的每一个都用3位来表示。分别用于图10其余编码数据块U3到U8的量化阶梯信息码q3到q8中的每一个用一位表示。
音调成份信息121包括用于规定从哪一个频带获得音调成份的频带规定信息以及具有音调成份的频带的数量。对于每一个具有音调成份的频带来讲,音调成份信息121包括编码的量化阶梯信息和规格化因数信息。对于该频带内每一相应音调成份而言,音调信息成份121包括当对音调成份进行规格化和量化时所获得的规格化和量化后的频率成份。
以图10为例,由于在编码数据块U6和U7的每一个当中至少有一个音调信号,所以音调成份信息数据的数量为2。归属于编码数据块U6的量化阶梯信息qA,规格化因数信息nA和频带规定信息1A跟随音调成份信息数据的数量,然后跟随用于在编码数据块U6作为音调成份的三个频谱成份A1、A2和A3中每一个的规格化和量化了的频率成份信息数据SA1,SA2和SA3。
类似的,对于编码数据块U7而言,音调成份信息121包括归属于编码数据块U7的量化阶梯信息qB,规格化因数信息nB和频带规定信息1B。然后跟随用于在编码数据块U7中作为音调成份的三个频谱成份B1、B2和B3中每一个的规格化和量化了的频率成份信息SB1、SB2和SB3。
频带规定信息可以例如是最小的频谱成份数。
下面参照图13来解释利用信号成份分离电路62(图11)从频谱成份中分离音调成份的处理。在图13中,I表示特定频谱成份的“号”,该号可以例如是为从低频侧开始计数时与每一个频率成份相关的分离序列号。N表示频谱成份的总数,P和R表示预置因数。
通常,音调成份是满足下列条件的频谱成份。首先,频谱成份的绝对值局部地大于编码数据块中其余的频谱成份。其次,所述频谱成份大于编码数据块中最大频谱成份绝对值的预置部份。第三,所述频谱成份和相邻成份(即与其相邻的两个频谱成份)的能量之和大于编码数据块中能量的预置部份。另外,相邻的频谱成份也被认为是音调成份。
被用作能量分布定额比较基础的每一个预置频带(例如编码数据块)对于低频范围可以选择得较窄,而对于较高频范围可以选择得较宽。这种选择通常与前述临界频带的带宽相一致。即,如上所讨论可以根据人类听觉感知的音质特性来确定特殊的编码频带。
参看图13,在步骤S1,称作最大频谱绝对值的时间数据块内的频谱成份的最大绝对值被设定为A0。值A0是个预置参数。在步骤S2,频谱成份的号I被初始化为1。
在下一个步S3,变量A被设定成第I个频谱成份I的绝对值。在步骤S4,通过和编码数据块另一频谱成份的绝对值相比较确定频谱绝对值A是否是局部最大绝对频谱值。若在S4确定的结果是“否”(即若它确定频谱绝对值A不是局部最大绝对频谱值),那么程序转到步骤S10。若在S4中确定的的结果是“是”,那么程序进行到步骤S5。
在步骤S5,确定A/A0是否大于P。利用预置值P确定频谱绝对值A是否大于编码数据块中频谱成份的最大绝对值。若在S5的确定结果是“否”,那么程序转到步骤S10,若在S5的确定结果是“是”,那么程序进行到步骤S6。
在步骤S6,获得与所述频谱成份(被确定具局部最大绝对频谱值)相邻的谱频成份的能量和并指定为变量x。这个能量和被称作相邻频谱能量值。
在步骤S7,确定在包含有频谱成份I和相邻频谱成份的编码数据块中的总能量并指定给所述变量。这个总的能量值Y被称作预置频带的能量值。
在下一步S8,确定是否X/Y>R,即与局部最大绝对频谱值和相邻频谱值相对应的频谱成份的能量和X是否大于包含有这些频率成份的预置频带(编码数据块)的总能量乘以预置比值R。若在S8的确定结果是“否”,那么程序转向步骤S10。若在S8的确定结果是“是”,程序进行到步骤S9。
在步骤S9,频谱成份I和相邻的频谱成份被寄存成音调成份。
在下一步骤S10,确定是否已经通过确定频谱成份的序列号I是否等于频谱成份总数N对编码数据块的所有频谱成份进行了检查。若在S10确定的结果是“否”,序列号I加1,然后程序返回到步骤S3。另一方面,若在S10确定的结果是“是”、结束对编码数据块中音调成份的处理。然后,程序执行对下一个编码数据块中音调成份的处理。
图14更加详细地示出了图4高效译码器的特定实施例。图14的高效译码器执行与图11高效编码器所执行的编码相反的译码。
参看图14,由图11的高效编码器产生并传送或记录在记录介质上的图12所示代码串被提供输入端70。代码串分解电路71将代码串分解成编码的音调成份信息和其它的噪声成份信息。编码的音调成份信息和其它的噪声成份信息被从代码串分下电路71分别提供给音调成份译码电路72和噪声成份译码电路73。
音调信息译码电路72和噪声成份译码电路73对相应提供的编码信息的编码量化精度部份和规格化因数部份进行译码。使用译码后的量化精度信息和规格化因数信息,通过执行与图11编码器所执行的编码操作相反的译码操作,译码电路72、73对所提供信息的规格化和量化了的频率部份进行处理。音调成份译码电路72和噪声成份译码电路73中都包含有与表1(量化阶梯信息选择分支)相对应的表,从而可以通过从所述表中选择与量化阶梯信息码相关的量化阶梯信息数确定所述的量化阶梯信息数。译码后的音调成份和噪声成份被供给合成电路74。在该电路中,利用与由图11信号成份分离电路62执行的分离操作相反的合成操作将译码后的音调成份和噪声成份合成到一起。即:合成电路74合成译码后的音调成份和噪声成份,从而把它们重新结构成被信号分离电路62分离以前的编码数据块的频谱成份(图10)。
再一次参看图14,合成电路74的合成输出被提供给与图4和5反向变换电路类似的反向变换电路75以把合成输出反向变换成波形信号。该波形信号被提供给输出端76。
虽然在图14中示出了本发明这样一个实施例,即在该实施例中利用合成电路74将音调成份和噪声成份合成到一起,然后利用反向变换电路75进行反向变换,但是还可以首先对音调和噪声成份进行反向变换,然后再把经过反向变换的音调和噪声成份合成到一起。反向变换和合成处理也可以同步执行而不是分开执行两个操作。
下面讨论根据本发明第二实施例的高效编码方法。根据本发明第二实施例的高效编码方法,除量化阶梯的数量(精化精度信息)编码成量化精度信息码的方法如表2所示:
表 2
量化阶梯信息表选择码 量化阶梯信息位数 量化阶梯信息码 量化阶梯数
00 3 000001010011100101110111 137153163127255
01 2 00011011 137255
10 1 01 13
在表2中,与表1类似,由量化精度信息表选择码所指出的,量化精度信息码由3位,2位或1位来表示。
利用第二实施例,通过改变量化阶梯信息码的多个位数传送边界可以有效地对输入信息进行编码。
图15简要地示出了根据第二实施例的高效编码方法产生的一个代码串的例子。如参看表2所看到的,用于低频范围编码数据块从“000”到“111”的量化阶梯信息码与表2的量化阶梯信息表选择码“00”相关。用于高频范围编码数据块从“00”到“11”的量化阶梯信息码与表2的量化阶梯信息表选择码“01”有关。
参考图15,量化阶梯信息表边界信息151被安排在图15所示表的导引端。这个信息用于规定量化阶梯信息码位数的传送边界。
就是说,在图15所示的第二实施例中,3位和2位可以作为量化阶梯信息码以分别用于低范围编码数据块和高范围编码数据块。所述的传送最好是从3位(用于低范围)和2位(用于高范围)开始的。由于这个原因,低范围编码数据块和高范围编码数据块之间的边界是由量化阶梯信息表边界信息151规定的。虽然可以设想将各量化阶梯信息数据152设定的诸如是3位的固定长度,以代替使用边界信息,但对于8个编码数据块来讲需要6个冗余位。相反,若使用量化阶梯信息表边界信息151,只需要3个位。这样,在具有大量编码数据块的实际应用中,差异就更加明显了。
因此,使用第二实施例,可以对图6所示具有足够音质的频谱成份进行编码,并使在量化阶梯信息码中表示量化精度(量化阶梯数)的辅助信息的数量最小化。
这样,利用第二实施例,足以把图15所示量化阶梯信息表边界信息151的值设定为7而不是2(量化阶梯精度表边界信息=7),并且足以从与表2中“00”的量化阶梯信息选择码相关的量化阶梯信息表中选择量化精度信息码。这提供了用于图9的U6和U7编码数据块被选择的必须而足够的量化精度。
图16示出了由第二实施例高效编码方法产生的第二例的代码串。
利用图16示例的代码串,被设置成“01”的量化阶梯信息表选择码162被安排在量化阶梯信息表边界信息161之后。通常,可以选择表2的相关量化阶梯信息表(00到11)。
低范围侧量化阶梯信息表选择码“00”可以安排在量化阶梯信息表边界信息161的前面,以允许选择表2的量化阶梯信息表(000到111)。
虽然在图15和图16所示实施例中仅提供了一个量化阶梯信息表边界(在量化阶梯信息位数变换频率域中的边界),但是可以提供两个或更多的边界信息数据,且该数据可以是逐个编码数据块变化的。若所述的边界信息数据是逐个编码数据块变化的,对边界信息数据进行编码并将其安排在与每个编码数据块相关的代码串的导引端就足够了。
下面结合图17来解释依据本发明第二实施例的高频编码方法,图17示出了一个用于确定量化精度信息表边界M的处理流程。
量化阶梯信息表边界位置M是特别参照下述原理确定的,即若通过分离出音调成份(如第一实施例所示)而使编码数据块的能量较低,那么,只需较少数量的位去表示特定编码数据块的量化阶梯信息。图17的处理确定低范围编码数据块的范围,利用这个范围,可以使用量化精度信息表。
参看图17,在步骤S101,量化阶梯信息表边界的位置M被初始化为与高范围侧编码数据块相对应的8。在下一步骤S102,确定其号数与位置M相对应的编码数据块的能量值,并把这个值给预EQ(M)。在步骤S103,确定在其号数与位置M相对应的编码数据块中音调成份的能量值,并把该值给予E1(M)。
在步骤S104,把(E1(M)/E0(M)和一个预置因数T进行比较(E1(M)/E0(M)>T?)。若在S104的比较结果是“是”,则程序转到S105。
在步骤105,M减1。然后程序转向步骤S106。若在步骤S106 M等于0,程序结束,若M不等于零,程序回到S102。
若在S104的判断结果是“否”或若在S106的判断结果是“是”,则程序结束,然后对下一个时间数据块进行处理。
图18示出了由第二实施例的高效编码方法所产生的处于其音调成份已被分离状态的第三例代码串。
利用图18的代码串,音调成份信息181类似于图12的音调信息121。对于每个数据块而言,通过对分离的音调成份进行编码获得的音调成份信息181被首先安排。音调成份信息181之后跟随有量化精度信息表边界信息182和通过对噪声成份进行编码所获得的噪声成份信息183和184。这些信息仍然与图12的噪声成份信息122和123相似。对于低频侧,通过利用一定数量的与从和表2量化阶梯信息表选择码“00”相对应的部份量化精度信息表中选择的量化阶梯信息码相对应的量化阶梯量化通过对噪声成份编码获得的噪声成份信息以用于每个编码数据块。对于高范围侧,通过利用一定数量的与从和表2量化阶梯信息表选择码“10”相对应的部份量化精度信息表中选择的量化阶梯信息码相对应的量化阶梯量化噪声成份。
如果利用可以保证编码器可靠性的方法执行编码,利用上述第二实施例的高效编码方法可以以适于相应情况的方式实现有效地编码,实际上,在实现有效编码的过程中,分离音调成份以后进行编码是有利的。但是,利用当前第二实施例,处理量要大于没有预先分离音调成份而进行编码的情况。这样,利用具有有限处理能力的编码器,在整个范围内在分离音调成份之后再进行编码是很困难的。在这种情况下,只要把与每个编码数据块相关的量化阶梯信息码的位数设定成高达相对高频率范围或整个频率范围的一个较大值,以保证被选择来用于每个编码数据块的量化阶梯数量的选择具有较宽的宽度就足够了。
另一方面,若使用具有高处理能力的编码器执行编码,就可以从比较宽的范围,例如是从整个频率范围抽取音调成份,并因此可以在高频范围内的大部份编码数据块中成少量化阶梯的数量,这样就可以把表示量化阶梯数量的量化精度信息码的位数设置的较小。
根据第二实施例的高效编码器与根据第一实施例的图11编码器基本类似。分离音调成份所使用的方法与图13所示流程相同、表2被存贮在图11的噪声成份编码电路64中。利用噪声成份编码电路64中的量化阶梯判定电路33(图3)提供量化精度信息表边界信息和量化阶梯表选择码。
对应的译码器与图14所示译码器基本一样。就是说,第二实施例的高效译码器首先要对编码的量化阶梯信息和编码的规格化因数信息进行译码。然后,译码器使用译码后的量化精度信息和规格化因数信息对规格化和量化了的频率成份信息进行处理。第二实施例的噪声成份译码电路73其中存贮有一个与表2(量化阶梯精度选择分支)相对应的表,并通过选择与量化阶梯信息码相关的量化精度信息对量化阶梯信息码进行译码。
从前述可以看出,使用第二实施例的高效编码方法和装置,用于特定编码数据块的量化精度(量化阶梯数)是根据输入信号的频率分布和处理设备的能力加以选择的,因此能够对输入信号进行高效编码。
利用上述本发明的第一和第二实施例,在由图1和图11的变换电路的MDCT进行正交变换之前,利用一个频带分离滤波器对编码的信号进行滤波,并在利用频带合成滤波器进行滤波之前,利用一个反相MDCT(IMDCT)电路的译码的信号进行反向正交变换。但是可以在不使用频带分离滤波器或频带合成滤波器的情况下直接执行MDCT或IMDCT,也可以使用DFT或DCT代替上述的MDCT。
另外,还可以分别单独使用频带分离滤波器和频带合成滤波器来执行频带的分离和合成而不必借助正交变换。编码数据块可以是一个使用频带分离器分离的单独频带,或是通过把一系列频带组合到一起所获得的单个频带或多个频带中的多个取样所构成。但为更有效地应用本发明,最好是使用MDCT执行正交变换,并在把输入信号转换成大量的频谱成份(频谱信号)以后再构成编码数据块。
在上面的描述中,是在把频谱成份分离成音调成份和其它成份(噪声成份)以后执行编码的。但是,即使是分离和编码后的成份不是信号能量被集中在特定频率范围内的音调成份,也可以应用本发明。但是,由于它是量化精度所必须的音调成份,所以分离音调成份能最有效地应用本发明。
虽然上述仅涉及到了声音信号的编码,本发明还可应用于其它信号,例如表示形状频谱分布的图形信号。由于这些信号通常都具有形状频谱分布,所以,声音信号是最需要以高精度进行编码的。声音信号高范围侧成份相对于低范围成份来讲不需要高量化精度,通过在编码之前分离音调成份可以实现声音的有效编码。
本发明的方法还可以应用于将要被发射而不是记录在记录介质上的信号。
通过上述可以看出,利用本发明的编码方法和装置,可以在把表示量化阶梯信息的位数保持在相当低水平的同时,使用于控制量化精度的自由度级被保持,从而保证了高效编码。但是,利用本发明的编码器的能力对量化阶梯信息进行有效地编码,从而实现了输入信号的高效编码。
因此,利用本发明的编码方法和装置,在有效利用传送的传送能力或记录介质的记录能力的同时,可以产生最佳的编码信号。

Claims (20)

1.一种用于对数字信号编码进行压缩的编码方法,其特征在于包括如下步骤:
将数字信号变换成频谱成份(11);
将所述频谱成份分成编码数据块,其中每一数据块具有至少两个频谱成份(12);
对所述编码数据块中的至少一个,将所述被分成编码数据块的频谱成份分成由规定取样构成的第一频谱成份和除该第一频谱成份以外的第二频谱成份(62);
对至少一个从中获得所述第一频谱成份的编码数据块,规格化(31)并以量化精度量化(32)至少所述第二频谱成份;
对规格化和量化了的第二频谱成份进行编码;
确定用以对表示量化精度的信息进行编码的多个位;以及
以所确定的多个位对表示量化精度的信息进行编码,其中
在较高频率范围编码数据块内的第二频谱成份量化所使用的量化精度低于在较低频率范围编码数据块内的第二频谱成份量化所使用的量化精度。
2.如权利要求1的编码方法,其特征在于,所述表示量化精度的信息表示将被选择用于每个编码数据块的多个量化精度值中的一个。
3.如权利要求1的编码方法,其特征在于,还包括如下步骤:
产生用于表示至少一个量化精度信息边界的边界信息。
4.如权利要求3的编码方法,其特征在于,所述边界信息用于规定使用相同的量化精度值将要被量化的低频范围编码数据块的数量。
5.如权利要求1的编码方法,其特征在于,所述第一频谱成份是由其能级高于所述编码数据块内所有频谱成份的平均能级的一组频谱成份构成的音调成份。
6.一种用于对数字信号编码进行压缩的编码装置,其特征在于包括:
用于将数字信号变换成频谱成份的装置(11);
用于将所述频谱成份分成编码数据块的装置(12),其中每一数据块具有至少两个频谱成份;
用于对所述编码数据块中的至少一个,将所述被分成编码数据块的频谱成份分成由规定取样构成的第一频谱成份和除该第一频谱成份以外的第二频谱成份的装置(62);
用于对至少一个从中获得所述第一频谱成份的编码数据块,规格化并以量化精度量化至少所述第二频谱成份的装置(31,32);
用于对规格化和量化了的第二频谱成份进行编码的装置;
用于确定用以对表示量化精度的信息进行编码的多个位的装置;以及
用于以确定的多个位对表示量化精度的信息进行编码的装置,其中,
用所述进行规格化和量化的装置对在较高频率范围编码数据块内的第二频谱成份量化所使用的量化精度低于用所述进行规格化和量化的装置对在较低频率范围编码数据块内的第二频谱成分量化所使用的量化精度。
7.如权利要求6的装置,其特征在于,所述表示量化精度的信息表示多个量化精度值将要被选择来对编码数据块进行量化的一个。
8.如权利要求6的编码装置,其特征在于,还包括用于产生表示至少一个量化精度信息边界的边界信息的装置。
9.如权利要求8的编码装置,其特征在于,所述边界信息用于规定将要由与规格化和量化相关的装置使用相同的量化精度值去量化低频范围编码数据块的数量。
10.如权利要求6的编码装置,其特征在于,所述第一频谱成份是由一组其能级高于所述编码数据块内所有频谱成份平均能级的频谱成份构成的音调成份。
11.一种用于对编码的数字信号进行译码的译码方法,其中编码的第一频谱成份和编码的第二频谱成份得自于同一编码数据块,其特征在于该方法包括:
译码所述编码的第一频谱成份(72);
译码所述编码的第二频谱成份(73);和
合成译码后的第一和第二频谱成份(74);其中,
所述编码的第二频谱成份是根据表示编码的第二频谱成份的量化精度的信息被译码的,所述信息表示用以表明从一个编码数据块到另一个编码数据块的多个量化精度值中一个的量化精度,且表示量化精度的信息是以对于高频范围编码数据块比对于低频范围编码数据块更少的位数规定的。
12.如权利要求11的译码方法,其特征在于,还包括如下步骤:
检测用于表示量化精度值边界的信息,且利用检测到的边界信息对编码的第二频谱成份进行译码。
13.如权利12的译码方法,其特征在于,所述边界信息规定具有相同量化精度值的低频范围的一个数。
14.如权利要求11的译码方法,其特征在于,所述第一频谱成份是由一组其能级高于所述编码数据块中所有频谱成份平均能级的频谱成份构成的音调成份。
15.如权利要求11的译码方法,其特征在于,还包括如下步骤:
根据表示量化精度的信息,选择多个量化精度值中的一个。
16.一种用于对编码的数字信号进行译码的译码装置,其中,编码的第一频谱成份和编码的第二频谱成份得自于同一个编码数据块,其特征在于该装置包括:
第一译码装置(72),用于对编码的第一频谱成份进行译码;
第二译码装置(73),用于对编码的第二频谱成份进行译码;和
用于对译码后的第一和第二频谱成份进行合成的装置(74);其中,
所述第二译码装置(73)根据表示编码的第二频谱成份的量化精度的信息对编码的第二频谱成份进行译码,所述信息表示用以表明从一个编码数据块到另一编码数据块的多个量化精度值中一个的量化精度,且表示量化精度的信息是以对于高频范围编码数据块比对于低频范围编码数据块更少的位数规定的。
17.如权利要求16的编码装置,其特征在于还包括:
用于检测表示量化精度值边界的边界信息的装置,所述第二译码装置还包括利用所检测的边界信息的装置。
18.如权利要求17的译码装置,其特征在于,所述边界信息将具有相同量化精度值的一定数量的低频范围数据块规定给第二译码装置。
19.如权利要求16的译码装置,其特征在于,所述第一频谱成份是由一组其能级高于所述编码数据块内所有频谱成份平均能级的频谱成份构成的音调成份。
20.如权利要求16的译码装置,其特征在于还包括:
用于根据表示量化精度的信息,从多个量化精度值中选择一个的装置。
CN95113120A 1994-12-28 1995-12-28 数字音频信号编码和/或译码方法 Expired - Lifetime CN1065381C (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP32838394A JP3371590B2 (ja) 1994-12-28 1994-12-28 高能率符号化方法及び高能率復号化方法
JP328383/1994 1994-12-28
JP328383/94 1994-12-28

Publications (2)

Publication Number Publication Date
CN1136235A CN1136235A (zh) 1996-11-20
CN1065381C true CN1065381C (zh) 2001-05-02

Family

ID=18209639

Family Applications (1)

Application Number Title Priority Date Filing Date
CN95113120A Expired - Lifetime CN1065381C (zh) 1994-12-28 1995-12-28 数字音频信号编码和/或译码方法

Country Status (8)

Country Link
US (1) US5825979A (zh)
EP (1) EP0720307B1 (zh)
JP (1) JP3371590B2 (zh)
KR (1) KR100420891B1 (zh)
CN (1) CN1065381C (zh)
DE (1) DE69533577T2 (zh)
SG (1) SG74538A1 (zh)
TW (1) TW360860B (zh)

Families Citing this family (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6167093A (en) * 1994-08-16 2000-12-26 Sony Corporation Method and apparatus for encoding the information, method and apparatus for decoding the information and method for information transmission
JP2820096B2 (ja) * 1996-01-10 1998-11-05 日本電気株式会社 符号化方式および復号方式
JPH1084284A (ja) * 1996-09-06 1998-03-31 Sony Corp 信号再生方法および装置
JP3496411B2 (ja) * 1996-10-30 2004-02-09 ソニー株式会社 情報符号化方法及び復号化装置
TW429700B (en) * 1997-02-26 2001-04-11 Sony Corp Information encoding method and apparatus, information decoding method and apparatus and information recording medium
US7110662B1 (en) 1997-03-25 2006-09-19 Samsung Electronics Co., Ltd. Apparatus and method for recording data on a DVD-audio disk
US6741796B1 (en) 1997-03-25 2004-05-25 Samsung Electronics, Co., Ltd. DVD-Audio disk, and apparatus and method for playing the same
TW384434B (en) * 1997-03-31 2000-03-11 Sony Corp Encoding method, device therefor, decoding method, device therefor and recording medium
DE19730129C2 (de) * 1997-07-14 2002-03-07 Fraunhofer Ges Forschung Verfahren zum Signalisieren einer Rauschsubstitution beim Codieren eines Audiosignals
KR100251453B1 (ko) 1997-08-26 2000-04-15 윤종용 고음질 오디오 부호화/복호화장치들 및 디지털다기능디스크
EP0978948B1 (en) 1998-02-26 2009-05-27 Sony Corporation Coding device and coding method, decoding device and decoding method, program recording medium, and data recording medium
JP2002006896A (ja) * 2000-06-22 2002-01-11 Matsushita Electric Ind Co Ltd 音響信号符号化装置、方法およびプログラムを記録した記録媒体、並びに音楽配信システム
JP4470304B2 (ja) * 2000-09-14 2010-06-02 ソニー株式会社 圧縮データ記録装置、記録方法、圧縮データ記録再生装置、記録再生方法および記録媒体
US6934678B1 (en) * 2000-09-25 2005-08-23 Koninklijke Philips Electronics N.V. Device and method for coding speech to be recognized (STBR) at a near end
KR100844810B1 (ko) 2000-12-22 2008-07-09 소니 가부시끼 가이샤 부호화 장치 및 복호 장치
AU2001276588A1 (en) * 2001-01-11 2002-07-24 K. P. P. Kalyan Chakravarthy Adaptive-block-length audio coder
US7023936B2 (en) * 2001-10-29 2006-04-04 Intel Corporation Method and apparatus for decoding lattice codes and multilevel coset codes
JP2003347940A (ja) * 2002-05-28 2003-12-05 Fujitsu Ltd 音声を高能率符号化するシステムに音声帯域のデータ信号を透過させるための符号化と伝送の方法と装置
US8228849B2 (en) * 2002-07-15 2012-07-24 Broadcom Corporation Communication gateway supporting WLAN communications in multiple communication protocols and in multiple frequency bands
DK1400954T3 (da) 2002-09-04 2008-03-31 Microsoft Corp Entropi-kodning ved tilpasning af kodning mellem niveau- og runlængde/niveau-moduser
US7433824B2 (en) * 2002-09-04 2008-10-07 Microsoft Corporation Entropy coding by adapting coding between level and run-length/level modes
US7724827B2 (en) * 2003-09-07 2010-05-25 Microsoft Corporation Multi-layer run level encoding and decoding
EP1569200A1 (en) * 2004-02-26 2005-08-31 Sony International (Europe) GmbH Identification of the presence of speech in digital audio data
JP4192900B2 (ja) * 2005-02-08 2008-12-10 ソニー株式会社 量子化精度再生方法、量子化精度再生装置、撮像装置、情報処理装置及びプログラム
EP1899960A2 (en) 2005-05-26 2008-03-19 LG Electronics Inc. Method of encoding and decoding an audio signal
EP1913576A2 (en) 2005-06-30 2008-04-23 LG Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
JP5227794B2 (ja) 2005-06-30 2013-07-03 エルジー エレクトロニクス インコーポレイティド オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
WO2007004833A2 (en) 2005-06-30 2007-01-11 Lg Electronics Inc. Method and apparatus for encoding and decoding an audio signal
US7693709B2 (en) * 2005-07-15 2010-04-06 Microsoft Corporation Reordering coefficients for waveform coding or decoding
US7684981B2 (en) 2005-07-15 2010-03-23 Microsoft Corporation Prediction of spectral coefficients in waveform coding and decoding
US7599840B2 (en) 2005-07-15 2009-10-06 Microsoft Corporation Selectively using multiple entropy models in adaptive coding and decoding
US7933337B2 (en) * 2005-08-12 2011-04-26 Microsoft Corporation Prediction of transform coefficients for image compression
US7565018B2 (en) * 2005-08-12 2009-07-21 Microsoft Corporation Adaptive coding and decoding of wide-range coefficients
US7788107B2 (en) 2005-08-30 2010-08-31 Lg Electronics Inc. Method for decoding an audio signal
WO2007055464A1 (en) 2005-08-30 2007-05-18 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
MX2008002760A (es) 2005-08-30 2008-04-07 Lg Electronics Inc Metodo para decodificar una senal de audio.
US8577483B2 (en) 2005-08-30 2013-11-05 Lg Electronics, Inc. Method for decoding an audio signal
FR2891100B1 (fr) * 2005-09-22 2008-10-10 Georges Samake Codec audio utilisant la transformation de fourier rapide, le recouvrement partiel et une decomposition en deux plans basee sur l'energie.
US8090587B2 (en) * 2005-09-27 2012-01-03 Lg Electronics Inc. Method and apparatus for encoding/decoding multi-channel audio signal
US7696907B2 (en) 2005-10-05 2010-04-13 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
WO2007040349A1 (en) 2005-10-05 2007-04-12 Lg Electronics Inc. Method and apparatus for signal processing
KR100857121B1 (ko) 2005-10-05 2008-09-05 엘지전자 주식회사 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치
US8068569B2 (en) 2005-10-05 2011-11-29 Lg Electronics, Inc. Method and apparatus for signal processing and encoding and decoding
US7672379B2 (en) 2005-10-05 2010-03-02 Lg Electronics Inc. Audio signal processing, encoding, and decoding
US7646319B2 (en) 2005-10-05 2010-01-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7751485B2 (en) 2005-10-05 2010-07-06 Lg Electronics Inc. Signal processing using pilot based coding
US7761289B2 (en) 2005-10-24 2010-07-20 Lg Electronics Inc. Removing time delays in signal paths
US8082071B2 (en) * 2006-09-11 2011-12-20 General Electric Company System and method of multi-generation positive train control system
US8184710B2 (en) 2007-02-21 2012-05-22 Microsoft Corporation Adaptive truncation of transform coefficient data in a transform-based digital media codec
KR101411900B1 (ko) * 2007-05-08 2014-06-26 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 장치
US8179974B2 (en) 2008-05-02 2012-05-15 Microsoft Corporation Multi-level representation of reordered transform coefficients
US8406307B2 (en) 2008-08-22 2013-03-26 Microsoft Corporation Entropy coding/decoding of hierarchically organized data
JP6021498B2 (ja) 2012-08-01 2016-11-09 任天堂株式会社 データ圧縮装置、データ圧縮プログラム、データ圧縮システム、データ圧縮方法、データ伸張装置、データ圧縮伸張システム、および圧縮データのデータ構造

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5375189A (en) * 1991-09-30 1994-12-20 Sony Corporation Apparatus and method for audio data compression and expansion with reduced block floating overhead

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3973081A (en) * 1975-09-12 1976-08-03 Trw Inc. Feedback residue compression for digital speech systems
US4184049A (en) * 1978-08-25 1980-01-15 Bell Telephone Laboratories, Incorporated Transform speech signal coding with pitch controlled adaptive quantizing
US4455649A (en) * 1982-01-15 1984-06-19 International Business Machines Corporation Method and apparatus for efficient statistical multiplexing of voice and data signals
US4535472A (en) * 1982-11-05 1985-08-13 At&T Bell Laboratories Adaptive bit allocator
JPS59223032A (ja) * 1983-06-01 1984-12-14 Sony Corp ディジタル信号伝送装置
US4748579A (en) * 1985-08-14 1988-05-31 Gte Laboratories Incorporated Method and circuit for performing discrete transforms
JPH0734291B2 (ja) * 1986-07-28 1995-04-12 株式会社日立製作所 デイジタル信号記録再生システム
JPH061916B2 (ja) * 1986-10-28 1994-01-05 日本電気株式会社 帯域分割符号化復号化装置
DE3688980T2 (de) * 1986-10-30 1994-04-21 Ibm Verfahren zur Multigeschwindigkeitskodierung von Signalen und Einrichtung zur Durchführung dieses Verfahrens.
DE3639753A1 (de) * 1986-11-21 1988-06-01 Inst Rundfunktechnik Gmbh Verfahren zum uebertragen digitalisierter tonsignale
JP2751201B2 (ja) * 1988-04-19 1998-05-18 ソニー株式会社 データ伝送装置及び受信装置
NL8700985A (nl) * 1987-04-27 1988-11-16 Philips Nv Systeem voor sub-band codering van een digitaal audiosignaal.
US4827336A (en) * 1987-12-18 1989-05-02 General Electric Company Symbol code generation processing from interframe DPCM of TDM'd spatial-frequency analyses of video signals
JP2638091B2 (ja) * 1988-06-24 1997-08-06 ソニー株式会社 データ伝送方法
US5142656A (en) * 1989-01-27 1992-08-25 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5222189A (en) * 1989-01-27 1993-06-22 Dolby Laboratories Licensing Corporation Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio
US5109417A (en) * 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US4932062A (en) * 1989-05-15 1990-06-05 Dialogic Corporation Method and apparatus for frequency analysis of telephone signals
DE69031517T2 (de) * 1989-06-30 1998-02-26 Nec Corp Variable Blocklängenkodierung für unterschiedliche Charakteristiken der Eingangsabtastwerte
JP2844695B2 (ja) * 1989-07-19 1999-01-06 ソニー株式会社 信号符号化装置
US5185800A (en) * 1989-10-13 1993-02-09 Centre National D'etudes Des Telecommunications Bit allocation device for transformed digital audio broadcasting signals with adaptive quantization based on psychoauditive criterion
JPH03132228A (ja) * 1989-10-18 1991-06-05 Victor Co Of Japan Ltd 直交変換信号符号化復号化方式
US5040217A (en) * 1989-10-18 1991-08-13 At&T Bell Laboratories Perceptual coding of audio signals
DE69028176T2 (de) * 1989-11-14 1997-01-23 Nec Corp Adaptive Transformationskodierung durch optimale Blocklängenselektion in Abhängigkeit von Unterschieden zwischen aufeinanderfolgenden Blöcken
JP2861238B2 (ja) * 1990-04-20 1999-02-24 ソニー株式会社 ディジタル信号符号化方法
US5367608A (en) * 1990-05-14 1994-11-22 U.S. Philips Corporation Transmitter, encoding system and method employing use of a bit allocation unit for subband coding a digital signal
JP3141241B2 (ja) * 1990-08-24 2001-03-05 ソニー株式会社 ディスク記録装置及びディスク再生装置
US5244705A (en) * 1990-08-24 1993-09-14 Sony Corporation Disc-shaped recording medium
US5049992A (en) * 1990-08-27 1991-09-17 Zenith Electronics Corporation HDTV system with receivers operable at different levels of resolution
US5134475A (en) * 1990-12-11 1992-07-28 At&T Bell Laboratories Adaptive leak hdtv encoder
JP2853717B2 (ja) * 1991-03-08 1999-02-03 日本電気株式会社 可変ビット型adpcmトランスコーダ
EP0506394A2 (en) * 1991-03-29 1992-09-30 Sony Corporation Coding apparatus for digital signals
DK0531538T3 (da) * 1991-03-29 1998-10-19 Sony Corp Fremgangsmåde til indkodning af digitale signaler
JP3395192B2 (ja) * 1991-05-25 2003-04-07 ソニー株式会社 ディジタルオーディオ信号再生装置、ディスクプレーヤの再生ポーズ回路及びディスク再生装置の再生制御回路
KR100268623B1 (ko) * 1991-06-28 2000-10-16 이데이 노부유끼 압축 데이타 기록 재생 장치 및 신호 처리 방법
ATE210347T1 (de) * 1991-08-02 2001-12-15 Sony Corp Digitaler kodierer mit dynamischer quantisierungsbitverteilung
GB2258372B (en) * 1991-08-02 1995-05-31 Sony Corp Apparatus for and methods of recording and/or reproducing digital data
JP3178026B2 (ja) * 1991-08-23 2001-06-18 ソニー株式会社 ディジタル信号符号化装置及び復号化装置
JP3134455B2 (ja) * 1992-01-29 2001-02-13 ソニー株式会社 高能率符号化装置及び方法
KR0150955B1 (ko) * 1992-05-27 1998-10-15 강진구 비트고정을 위한 영상압축방법과 신장방법 및 그 장치
JPH0629934A (ja) * 1992-07-10 1994-02-04 Nippon Hoso Kyokai <Nhk> 適応差分符号化伝送方法
DE4229372C2 (de) * 1992-09-03 1997-07-03 Inst Rundfunktechnik Gmbh Verfahren zum Übertragen oder Speichern der Quantisierungsinformation bei einer bitratenreduzierenden Quellcodierung
JP3508146B2 (ja) * 1992-09-11 2004-03-22 ソニー株式会社 ディジタル信号符号化復号化装置、ディジタル信号符号化装置及びディジタル信号復号化装置
JP3343962B2 (ja) * 1992-11-11 2002-11-11 ソニー株式会社 高能率符号化方法及び装置
EP0653846B1 (en) * 1993-05-31 2001-12-19 Sony Corporation Apparatus and method for coding or decoding signals, and recording medium

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5375189A (en) * 1991-09-30 1994-12-20 Sony Corporation Apparatus and method for audio data compression and expansion with reduced block floating overhead

Also Published As

Publication number Publication date
JP3371590B2 (ja) 2003-01-27
DE69533577D1 (de) 2004-11-04
EP0720307B1 (en) 2004-09-29
EP0720307A3 (en) 2000-05-31
KR960025618A (ko) 1996-07-20
SG74538A1 (en) 2000-08-22
US5825979A (en) 1998-10-20
JPH08186500A (ja) 1996-07-16
CN1136235A (zh) 1996-11-20
EP0720307A2 (en) 1996-07-03
TW360860B (en) 1999-06-11
KR100420891B1 (ko) 2004-06-09
DE69533577T2 (de) 2005-10-06

Similar Documents

Publication Publication Date Title
CN1065381C (zh) 数字音频信号编码和/或译码方法
CN1038089C (zh) 信号编码或译码装置及信号编码或译码方法
CN1217502C (zh) 音频信号的编码装置、解码装置及编码方法和解码方法
CN1154087C (zh) 提高低比特率音频编码系统音质的方法、编码器和译码器
CN1030129C (zh) 高效数字数据编码和译码装置
CN1103141C (zh) 信息编码方法和设备、信息解码方法和设备、信息传输方法
CN1144179C (zh) 声音信号解码方法和装置、声音信号编码方法和装置
CN1183685C (zh) 用于熵编码信号量化变换系数的系统和方法
CN1117674A (zh) 信号编码或解码设备以及记录媒介
US7428489B2 (en) Encoding method and apparatus, and decoding method and apparatus
CN1675683A (zh) 用于可扩缩编码的设备及方法和用于可扩缩解码的设备及方法
CN1662958A (zh) 使用频谱孔填充的音频编码系统
CN101199121A (zh) 可缩放压缩音频位流和使用分级滤波器组和多通道联合编码的编码/译码器
CN100355210C (zh) 编码方法和装置以及解码方法和装置
Wiese et al. Bitrate reduction of high quality audio signals by modeling the ears masking thresholds
JPH09106299A (ja) 音響信号変換符号化方法および復号化方法
CN1285658A (zh) 编码、解码装置及方法,记录、再现装置及方法,记录媒体
JPH09135176A (ja) 情報符号化装置および方法、情報復号化装置および方法、並びに情報記録媒体
JPH07168593A (ja) 信号符号化方法及び装置、信号復号化方法及び装置、並びに信号記録媒体
JP3465697B2 (ja) 信号記録媒体
Sablatash et al. Compression of high-quality audio signals, including recent methods using wavelet packets
JP3465698B2 (ja) 信号復号化方法及び装置
Paraskevas et al. Results of a Differential Perceptual Audio Coding Technique
JPH1130995A (ja) 復号化方法および装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CX01 Expiry of patent term

Granted publication date: 20010502

EXPY Termination of patent right or utility model