CN1030129C - 高效数字数据编码和译码装置 - Google Patents

高效数字数据编码和译码装置 Download PDF

Info

Publication number
CN1030129C
CN1030129C CN92102961A CN92102961A CN1030129C CN 1030129 C CN1030129 C CN 1030129C CN 92102961 A CN92102961 A CN 92102961A CN 92102961 A CN92102961 A CN 92102961A CN 1030129 C CN1030129 C CN 1030129C
Authority
CN
China
Prior art keywords
circuit
frequency
digital data
data
place
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN92102961A
Other languages
English (en)
Other versions
CN1068689A (zh
Inventor
筒井京弥
下吉修
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP03091183A external-priority patent/JP3089690B2/ja
Priority claimed from JP03091185A external-priority patent/JP3089691B2/ja
Application filed by Sony Corp filed Critical Sony Corp
Publication of CN1068689A publication Critical patent/CN1068689A/zh
Application granted granted Critical
Publication of CN1030129C publication Critical patent/CN1030129C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00007Time or data compression or expansion
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/665Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect

Abstract

一种高效数字数据编码装置用于对输入数字数据进行高效编码,在该装置中,通过多次采样将输入数字数据排列成块,在每一块中进行正交变换以产生系数数据,该系数数据按照位的自适应数目编码。该装置包括对输入数字数据按照不同的块长度进行正交变换的多个正交变换装置。根据正交变换装置的输出只选择正交变换装置的输出中的一个。在高效数字数据编码装置中,输入数字数据被分割成多个频段,在每一个频段中形成由多个采样值组成的块,并且在每一个频段的每一个块中进行正交变换以产生系数数据,对该系数数据编码。

Description

本发明涉及一种通过所谓的高效编码对输入数字数据进行编码的高效数字数据编码和译码装置。
迄今已有许多种声音信号或话音信号的高效编码技术,比如,举例来说,将声音信号等在时间轴上分割成许多个频段进行编码的次波段编码(SBC)技术,通过正交变换将时间轴上的信号变换成频率轴上的信号并分割成许多个频段以对每一个频段进行编码的变换编码(ATC)技术,以及一种将次波段编码(SBC)技术与自适应预报编码(APC)技术相结合的自适应位分配(APC-AB)技术,它将时间轴上的信号分割成许多个波段,将波段信号变换成基带信号并产生许多个线性预报分析顺序以进行预报编码。
在次波段编码中,例如,在信号被分割成许多个波段后,通过正交变换每一个波段的信号被变换成频率轴上的信号,然后对每一个波段进行编码。在实行正交变换时,输入声音信号可以在一个预定的单位时间(帧)间隔分组成块并对每一块进行离散余弦变换以将时间轴信号变换成频率轴信号。在进行多个波段分割时,可以考虑人的听觉的某些特征。于是声音信号可以被分割成许多个,例如,25个,波段,以使得频带宽度变得朝向被称作临界频段的较高频段更宽。在次波段编码中,位的数目随每一个波段动态地或自适应地变化,以提高压缩效率,同时保持每单位时间块的位数恒定不变。
例如,当对通过位分配由离散余弦变换(DCT)处理操作产生的DCT系数数据进行编码时,对每一块的由DCT处理操作产生的每一个波段的DCT系数数据用动态分配的位数进行编码。
在高效编码中,一种高效编码技术被普遍地采用,它利用了考虑了人的听觉的某些特征的所谓的屏蔽效应。屏蔽效应意味着这样一种现象,即某些信号被另外一些信号屏蔽并且变成听不见的了。于是低于屏蔽位的噪声是可以容许的。考虑屏蔽效应以使得低于容许噪声位的信号成分的被分配的位数被减少,从而降低了位速率。
如果,借助于上述编码技术将输入声音信号分割成许多个波段,并且对每一个波段进行正交变换,例如离散余弦变换(DCT),也就是如果对每一个波段进行频率分析,那么每一个波段的信号就在一个预定的时间单位间隔,即,在逐帧的基础上被分割成块,并且对每一个波段的每一块进行正交变换。
另一方面,对由正交变换产生的系数数据(DCT系数数据)编码并且在编码期间被分配的位数在逐帧的基础上分配给每一块。
同时,输入声音信号电平无需是基本上无波动的稳定信号以使得信号电平可以有各种各样的变化。例如,信号可以是瞬时变化信号,如其峰值在一帧内有明显变化的信号。例如,如果信号是来自一个打击乐器的打击声的声音信号,则打击声的信 号就要变成瞬时变化的信号。
如果声音信号的性质从稳态变化到瞬态或反之从瞬态变到稳态,并且如果这样的声音信号在逐帧的基础上对每一块用正交变换进行一致的处理,并且将被变换的数据编码,那么不能说该编码是适合于信号性质的,因此不能认为译码后的音质对听觉来说是最佳的。
当编码是利用了容许噪声电平进行时,用于编码的被分配的位数是根据每一块中的能量的比率(或能量差)以及与由该块中的能量求得的屏蔽数量相一致的容许噪声电平来确定的。
然而,在声音信号中存在包含音调特征的信号(具有高音调的信号)。如果信号具有高音调、则基于逐块能量的位分配就不能够精确地计算。也就是说,当每一块中的数据具有高音调时,在一个给定块中的能量可能同其它情况时的这个能量是相同的。在这种情况下,不希望出现的情况是,尽管块与块之间数据的特征不同但都基于同一能量来进行位分配的计算。尤其是,对于高音调信号不能进行精确的位分配,会导致声音音质的变坏。也就是说,尽管高音调信号需要大量的位数,但是如果位数是根据上述能量进行计算的话,所需的位数就不能分配给这些信号,会导致信号音质的畸变。
鉴于现有技术的上述状况,本发明的一个目的是提供一种高效数字数据编码装置,它可以获得更加适于输入声音信号的特性或特征的高效压缩编码,并且可以产生更适合于人的听觉的译码信号。
本发明的另一个目的是提供一种高效数字数据编码和译码装置,它甚至对于高音调信号也可以获得满意的位分配以改善声音音质。
根据本发明,提供了一种高效数字数据编码装置,通过多次采样,输入数字数据被排列成块,在每一块中实行正交变换以产生系数数据,系数数据按照位的自适应数目进行编码,编码装置包括对具有不同块长度的输入数字数据进行正交变换的多个正交变换装置,其特征在于根据所说正交变换装置的输出只有来自所说正交变换装置的输出中的一个被选择。
根据本发明也提供了一种高效数字数据编码装置,该输入数字数据被分割成多个波段,在每一个波段形成每一块由多个采样值组成的多个块,在波段的每一块中实行正交变换以产生系数数据,对系数数据编码,编码装置包括一个块长度决定电路,以在每一个波段的正交变换之前根据块数据的特征确定用于每一个波段的正交变换的块的长度,每一个波段的所说正交变换按照由所说块长度决定电路确定的块长度进行。
提供给每一个正交变换装置的输入数字数据可以是用于每一个临界波段的数据。正交变换可以,例如,是离散余弦变换(DCT)或快速傅立叶变换(FFT)。在这种情况下,正是对这种系数数据进行编码。
在选择输出或设定块长度时,是这样进行处理的,即只有使得用于对来自这些正交变换装置的输出进行编码所需的位分配的数目最小的(即用于实现一个预定的声音音质所需的位数)这个正交变换装置的输出才被选择。可以注意到,在经过正交变换的数据已经编码之后,由这些正交变换装置输出的位的逐帧数目是一个预定数值。然而,由于自适应位分配是在编码期间获得的,因而用于编码所需的位数可以不同于预定的位的逐帧数目。
因此,如果用于编码所需的位数少于预定的位数,可以用剩余的位进行更加满意的编码,因此,通过选择正交变换装置的输出(该输出给出了位的最少数目),产生一个最优的编码输出。此外,即使用于编码所需的位数目变得大于预定的位的逐帧数目,通过选择正交变换装置的输出(该输出给出了位的最少数目)可以获得由于编码而产生的具有最小畸变的编码输出。
根据本发明也提供了一种高效数字数据编码装置,它包括对输入数字数据进行频率分析的频率分析装置,用以求得由多个所说频率分析装置的输出数据组成的每一块的能量并用于根据逐块的能量来设定容许噪声电平的噪声电平设定装置,用于根据由多个所说频率分析装置的输出数据组成的每一块的最大值数据进行浮动系数计算的浮动系数计算装置,对所说频率分析装置的输出进行编码的编码装置,以及一个用于根据所说噪声电平设定装置的一个输出和所说浮动系数计算装置的一个输出通过所说编码装置在编码期间求得被分配的位的数目的分配位数决定电路。
在正交变换之前的块数据或帧的特征或特性中,存在有在一帧内的信号的瞬态或稳态特征。根据正交变换之前的在一帧内的采样值的上限的 瞬时变化的计算数值或在该帧内的采样数值的计算数值,或根据在一帧内的能量的瞬时变化的计算数值,来检验信号的瞬态或稳态特征。因此,对于本发明的装置,在每一范围或波段内的正交变换的块的长度是随着根据稳态或瞬态信号获得的数值而变化的。波段分割可以按照所谓的临界波段来进行。
在正交变换技术中,存在将输入数字数据通过正交变换转换成频谱数据的离散余弦变换(DCT)或快速傅立叶变换(FFT)。
在噪声电平设定装置中,最好分割频率以使得频带宽度变得在朝向较高的频率更宽些,以对每一个波段由数据形成块并根据逐块能量求得容许噪声电平,从而即考虑了所谓的屏蔽效应。这里的屏蔽效应意味着既沿时间轴的屏蔽效应又沿频率轴的屏蔽效应。
在浮动系数计算装置中,可以用根据由频率分析装置的多个输出数据组成的块的最大值数据的比例因子作为浮动系数。另外,可用该最大值数据本身作为块浮动系数的一个适当值。于是,在分配位数决定装置中,根据块浮动系数和考虑屏蔽效应对每一个临界波段求得的容许噪声电平就可以求得位分配的数目。在这种情况下,在浮动系数计算装置中的一个块中的数据的数目就和在噪声电平设定装置中的一个块中的数据的数目相适应或者相等。
为此,高效数字数据编码装置包括对输入数字数据进行频率分析的频率分析装置以将所说输入数字数据变换成一个幅度信息和一个相位信息,和对所说幅度信息和所说相位信息进行编码的编码装置。在由编码装置进行编码期间,分配给相位信息的位数被减少到一个相对于频率分析装置的输出的一个预定范围或波段而言比分配给幅度信息的位数还要小的值。
根据本发明,输入数字数据按照多个块长度的正交变换处理并且根据这些正交变换装置的输出选择这些正交变换装置的输出中的一个。通过选择具有进行编码所需的最少的位数的输出可以获得一个最优的编码输出。
按照本发明,根据在每一个波段的正交变换之前的块数据或帧的特征来设定每一个波段的正交变换的块长度,以便可以获得具有一个适合于信号特征的块长度的正交变换并因此可以用适合于信号特征的位数来实现压缩编码。
根据本发明,不仅利用容许噪声电平,而且还利用根据在每一块中的最大值数据的浮动系数来设定位分配数目,以便一个足够大的位数可以分配给甚至在块中的能量相同的高音调信号。
根据本发明,由于当设定了和分配给相位信息位数有关的信息从而使其小于分配给幅度信息的位数信息时并不会对人的听觉产生有害的效应,因而通过减少分配给相位信息的位数信息可以增加位压缩因子。
根据本发明,由于分配给相位信息的位数信息被设置成小于分配给幅度信息的位数信息的波段是较高的范围或较高的波段,因而可以减少音质的畸变。
根据本发明,如果相位信息相对于幅度信息的位数减少的数目是预先设定的,那么这足以与相位信息和幅度信息的编码数据一起同时传送一个幅度信息和相位信息,以使得用于传送位分配数目的信息所需的位数可以进一步减少。
根据本发明,由于利用根据由每一个波段的幅度信息的能量求得的所谓的屏蔽数量的容许噪声电平来设定用于每一个波段的位分配的数目,因而可以获得对音质有较少畸变的位的减少。
图1是显示根据本发明的第一个实施例的高效数字数据编码装置的一个示意结构的一个电路方框图。
图2是显示一个说明性的编码器的示意结构的一个方框图。
图3是显示当每一个波段的块长度相同时一个DCT处理块的一个示意图。
图4是显示当高频段的块长度是帧长度的一半时的一个DCT处理块的一个示意图。
图5是显示当高频段的块长度是帧长度的四分之一并且中频段的块长度是帧长度的一半时的一个DCT处理块的一个示意图。
图6是显示当高频段的块长度是帧长度的四分之一并且中频段的块长度是帧长度的四分之一时的一个DCT处理块的一个图表示意图。
图7是表示第一级位分配数目的决定和位数目的校正的一个流程图。
图8是表示根据本发明的第二个实施例的一个高效数字数据编码的一个示意结构的一个电路方框图。
图9A是显示典型的瞬态信号的一个曲线图。
图9B是显示典型的稳态信号的一个曲线图。
图10是显示在DCT处理中的一个典型的块的示意图。
图11是显示作为对应于高效编码装置的一个译码装置的一个示意结构的一个方框图。
图12是显示根据本发明的第三个实施例的一个高效数字数据编码装置的一个电路方框图。
图13是用于解释块浮动系统和每个数据的容许噪声电平的一个示意图。
图14是显示用于设定一个容许噪声电平的一个详细结构的一个电路方框图。
图15是显示一个布尔克(Burke)频谱的一个曲线图。
图16是显示一个屏蔽频谱的一个曲线图。
图17是显示最小可听度曲线和一个屏蔽频谱的合成的一个曲线图。参照附图,详细地说明本发明的某些优选实施例。
图1显示了一个高效数字数据编码装置,它将输入数字数据,例如声音数据,分割成许多个波段以使得频带宽度在增加频率方向上更宽,对于每一个波段形成每一块由多个采样值组成的多个块,对每一个波段的每一块通过例如离散余弦变换进行正交变换以产生系数数据(DCT系数数据)并按照位的自适应分配的数目进行系数数据的编码。对于本发明的高效编码装置,提供多个编码器,例如四个编码器2至5,每一个编码器具有对每一个波段的输入数字数据按照各波段之间相互不同的块长度进行正交变换的正交变换装置,并且编码器2至5的输出中的一个,即,正交变换装置的输出中的一个,根据编码器2至5的正交变换装置的输出进行选择。换句话说,用于每一个波段的DCT处理块的块长度对于各个编码器相互不同,并且只有编码器2至5的输出中的一个通过一个选择电路6根据编码器2至5的输出被选择。也就是说,转换开关7的状态根据用于选择编码器2至5的输出中唯一一个的选择电路6的选择信号进行转换。
可以注意到选择电路6是这样进行选择操作的,即只有具有由编码器完成编码操作所需的位数最少的那个编码器的输出才被选择。也就是说,尽管用于由编码器2至5输出的每一帧的位数是某个预定数,但对一个给定的帧进行编码实际上所需的位数是由随后将要描述的考虑了屏蔽效应的一种自适应位分配方法确定的。上述的选择是这样进行的,即只有具有在编码操作中实际所需的位数最少的那个编码器的输出被选择。
于是,如果用于编码所需的位数少于基于逐帧的预定的位数,那么剩余的位就可以用于进行更为满意的编码。另一方面,通过选择具有最少位数的编码器输出,可以产生最满意的编码输出。如果编码器2至5所需的位数多于基于逐帧的预定的数目,那么通过选择具有进行编码所需的最少的位数的编码器2至5的输出,就可以产生一个由于编码而产生的最小畸变的编码输出。
也就是说,在这个高效数字数据编码装置的每一个编码器2至5中,如图2所示的,输入数字数据,例如声音或话音数据,通过一个输入端1输入,该输入数字数据由正交镜象滤波器41和42按频率分割成大致三个频段,以使得频带宽度根据对所谓的临界频段的频段分割在增加频率的方向上变得更宽。在DCT电路43、44和45中,对于由分割产生的每一个波段形成每一个由多个采样值组成的块,对每一块进行正交变换(从时间轴变换到频率轴)以产生系数数据(DCT系数数据)。同时,根据临界频段DCT电路43、44和45的输出分别相应于例如两个高频段、三个中频段和例如20个低频段。来自DCT电路43至45的相应频段的DCT系数数据由编码电路46、47和48按照位分配的自适应数目进行编码。也就是说,本实施例的编码电路46、47和48中的三个频段的DCT系数数据的编码是根据人的听觉的某些特征按照位分配的自适应数目进行的。
为了进行上述的频段分割,将模拟声音信号等采样成1024个采样值获得的数字数据(0…22.1KHz)输送给每一个编码器2至5的一个输入端1。这些数字数据由正交镜象滤波器(QMF)41和42分割成大致三个频段(0…5.5KHz,5.5KHz至11.0KHz和11.0至22.1KHz),以使得频带宽度朝较高的频率变得更宽。在正交镜象滤波器QMF41中,0至22.1KHz的数字数据被分割成两部分以产生分别输送给DCT电路43和正交镜象滤波器QMF42的一个11.0KHz至22.1KHz的输出和一个0至11.0KHz的输出。输送给正交镜象滤波器QMF42的0至11.0KHz的输出由正交镜 象滤波器QMF42进一步分割成两部分以产生分别输送给DCT电路44和45的一个5.5KHz至11.0KHz的输出和一个0至5.5KHz的输出。
在每一个DCT电路43、44和45中,所输送的频段数据的许多个,例如1024个采样值构成一帧B,对由帧B形成的每一块进行傅立叶变换以产生DCT系数数据。可以注意到,在每一个DCT电路43、44和45中的DCT处理块长度都具有一个对于编码器2至5的每一个来说是不同的值。
例如,对于编码器2,如图3所示,DCT处理块长度是相同的。也就是说,对于编码器2,在与11.0KHz至22.1KHz的较高频段相关的DCT电路43中的DCT处理块长度bH,在与5.5KHz至11.0KHz的中频段相关的DCT电路44中的DCT处理块长度bM,以及在与0至5.5KHz的较低频段相关的DCT电路45中的DCT处理块长度bL,都被选择得等于具有上述的预定单位时间间隔的帧B。
对于编码器3,如图4所示,DCT处理块长度被选择得在高频段较短。也就是说,对于编码器3,在高频段DCT电路43的块长度是在低频段DCT电路45的块长度bL和在中频段DCT电路44的块长度bM之和的一半。在本例中,高频段块被划分成块bH1、bH2
在编码器4中,如图5所示,DCT处理块长度被选择得在中频段和高频段较短。也就是说,对于低频段的块长度bL来说,中频段具有等于低频段块长度一半的块长度bM1、bM2,高频段具有等于低频段块长度四分之一或中频段块长度二分之一的块长度bH1、bH2、bM2和bH4
在编码器5中,如图6所示,DCT处理块长度被选择得在高频段和中频段较短而在低频段较长。也就是说,相对于低频段的块长度bL来说,高频段具有等于低频段块长度四分之一的块长度bH1、bH2、bH3和bH4。而中频段具有例如等于低频段块长度四分之一的块长度bM1、bM2、bM3和bM4
正如上述结合图4至图6讨论的高频段和中频段的块长度选择得比低频段的块长度短,是基于以下原因。即,人的听觉的频率分辨能力在高频段不太高,而在低频段高,因此必须保持低频段的频率分辨能力并因此用于DCT处理的块长度在低频段不能过分地减少。由于这个原因,在低频段选择较长的块长度。另一方面,由于对于低频段信号的稳态过程比对于高频段信号的稳态过程长,因而缩短高频段和中频段的块长度(即提高瞬时分辨率)是有效的。基于这种考虑,在本实施例中高频段和中频段的块长度选择得较短而低频段的块长度选择得较长。
于是,在本实施例中,为了同时满足鉴于人的听觉在频率轴的分辨率的需要以及在时间轴的分辨率的需要,为提高频率分辨能力对低频段(0至5.5KHz)增加采样数量,同时提高在高频段(11.0至22.1KHz)的瞬时分辨率并偶尔提高在中频段(5.5至11.0KHz)的瞬时分辨率。
鉴于输入声音信号的特征,缩短对于高频段和中频段的DCT处理块长度是有效的。
也就是说,DCT处理块长度可以随输入声音信号是瞬态信号还是稳态信号而得以有效的改变。在稳态信号情况下,如图3所示,将相应频段的块长度设置成相同的长度是有效的,而,在瞬态信号情况下,如图6所示,将高频段和中频段的块长度设置成较短的长度是有效的。通过以这种方式减少用于瞬态信号的DCT处理块长度,在编码期间更多的位可以分配给在帧B中具有高峰值(瞬态信号部分)的块,同时减少其它块的位数。按照这种方式,这些位能够被分配给在帧B的每一个频段真正需要这些位的那些块以跟踪频谱的瞬时变化。另一方面,在稳态信号的情况下可以避免对在帧B的每一个块中有相似频谱的信号进行多余的编码。
同时,对于相应频段的DCT处理的块长度并不局限于图3至图6中所示的例子。于是可以想象出多种多样的块长度方案,例如在高频段进一步减小块长度或同时减小低频段的块长度。
在每一个编码器2至5中,DCT处理在图2中的每一个DCT电路43至45中进行,以对每一个频段提供不同的块长度以产生输送给编码电路46至48的DCT系数数据。
同时,每一个编码器2至5由具有以下结构的编码电路46至48按照自适应位分配进行编码。
也就是说,每一个编码器2至5具有一个初始位分配数目决定电路60,用以确定对来自DCT电 路43、44和45的帧B内的DCT系数数据进行编码实际所需的位数,即实现一个预定的音质所需的位数,和一个位数校正电路61,用以进行位分配或位减少以调整由电路60确定的位的初始数目使其成为预先设置在帧B内的最终的位数。于是对在每一个编码电路46至48中的DCT系数数据进行编码是通过由位数校正电路61校正最初的位数而获得的位数目(即,上述的最终位数目)实现的。
同时,初始位数目是在考虑了所谓的屏蔽效应由初始位分配位数决定电路60确定的,现在将对屏蔽效应进行解释。
屏蔽是与人的听觉的某些特征相关的。也就是说,在对声音的人的听觉特征中,有一种被称作屏蔽效应的特征,它又分成为一种瞬时屏蔽效应和一种并行屏蔽效应。并行屏蔽效应意味着这样一种效应,即一个小的声音或噪声被一个同时产生的更大的声音屏蔽并因此变得听不见了。瞬时屏蔽效应是这样一种效应,即一个小的声音或噪声被在该小噪声之前瞬时产生的一个更大的声音屏蔽(前向屏蔽),或被在该小噪声之后瞬时产生的一个更大的声音屏蔽(后向屏蔽),并因此变得听不见了。由于人的听觉的特征,前向屏蔽效应持续的时间长,例如,大约100毫秒,而后向屏蔽效应持续的时间较短,大约4毫秒数量级。屏蔽效应电平(屏蔽数量)对于前向屏蔽和后向屏蔽分别是20分贝和30分贝数量级。
因此,如果在帧B的位分配期间考虑屏蔽效应,就可以获得最佳的位分配。也就是说,由于可以减少用于被屏蔽信号部分的位数而不会对听觉产生任何不利影响,因而可以减少用于被屏蔽的信号部分的位数以用较少数目的位来实现有效的编码。屏蔽电平或掩蔽数量可以根据相应的临界频段的能量之和求得。为了求得屏蔽数量,一个给定临界频段的信号的屏蔽的屏蔽数量也可以由其它临界频段求得。根据屏蔽数量可以确定每一个频段的容许噪声电平并且基于每一个频段的容许噪声电平可以求得用于编码的位分配数目。
由初始位分配数目决定电路60这样确定的初始位数传送给位数校正电路61,电路61进行位分配或位减少以将由电路60确定的初始位数与在帧B中预先设定的最终位数相一致。
由电路60确定初始位数的操作和由电路61进行位分配或减少的操作程序如图7的流程图所示。
参看这个流程图,在步骤S1,由初级位分配数目决定电路60确定的初始位分配数目,亦即根据屏蔽数量的计算求得的在编码电路46、47和48中进行编码实际所需的初始位数,用一个变量nsumo表示。在步骤S2,这个变量nsumo传送给位数校正电路61,然后电路61将变量nsumo代入变量nsum。
在步骤S3,检验是否变量nsum小于或不小于一个表示帧B中预先设定的最终位数的数目nlimit。如果变量nsum小于数值nlimit,则程序继续进行到步骤S4,如果变量nsum不小于数值nlimit,则程序继续进行到步骤S5。
如果变量nsum小于表示最终位数的数值nlimit,说明位的数目是过剩的。于是,在步骤S4,剩余的位数目(相当于变量nsum与数值nlimit之间的差值的位数)被进一步在帧B中分配。剩余的位被分配给为了进一步改善声音音质的频段或块。然后将位分配后的位数返回步骤S3。
在步骤S5,检验是否变量nsum大于或不大于表示最终位数的数值nlimit。如果变量nsum不大于数值mlimit,鉴于步骤S3变量nsum就等于数值nlimit,则结束处理。如果变量nsum大于数值nlimit,则程序继续进行到步骤S6。
如果变量nsum大于数值nlimit,则位数是缺少的。于是,在步骤S6,缺少的位数从和变量nsum对应的位数中减去。位减少是从不影响声音音质的频段或块中抽取的。将位减少后的位数返回步骤S5。
经过如图7所示的流程图的操作程序,位数被校正,并且根据像这样被校正的位数在编码电路46至48中进行编码。
来自编码电路46至48的被编码数据被传送给一个合成电路50。由初始位分配数目决定电路60确定的关于初始位数的信息(表示实现一个预定的声音音质所需的位数的信息)还传送给合成电路50。在合成电路50中将相应频段的数据组合,并且在这些被组合的数据之中,被编码的数据在输出端52输出,而关于初始位数的信息在输出端53输出。
在图2中输出端52和53的输出就是图1中所示的编码器2至5的输出。来自编码器2至5的被编码数据送到转换开关7,而关于初始位数的信息送到选择电路6。
在选择电路6中,正如前面所述的,根据关于由编码器2至5送出的相应的初始位数的信息,只选择编码器2至5中的对于编码所需的位数(即实现预定的声音音质所需的位数)被减至最少的那个编码器的输出,并且将这样选择的信号传送给转换开关7。于是转换开关7依据上述的选择信号进行一个转换操作,只输出由编码器2至5提供的被编码输出中的一个。以这种方式,只有这样选择的编码输出才从输出端8输出出去。
根据上述关于初始位分配的信息,由一个译码器(图中未示出)对被编码的输出进行译码,产生的声音具有最佳的声音音质。
正如以上描述的,对于高效数字数据编码装置,产生被编码数据的编码器2至5的输出中只有最优的编码器输出被选择,被编码的数据可以被译码并转换成产生最佳声音音质的声音。另外,由于选择了实际被编码的输出,被选择用于DCT处理的块具有一个最优的块长度,而块长度的选择也是容易的。本实施例的装置可以适用于将数据录制在一个封装介质,例如一个小型唱片(CD)中的编码装置。由于在这种情况下只有一个译码器(唱机)需要由使用者自己拥有,因而编码装置可以具有任何希望的体积大小。
在上述的实施例中,具有不同处理块的DCT电路43至45被设置在每一个编码器2至5中。另一方面,可以只提供一个编码器,并且可提供一个DCT电路,该DCT电路具有用不同DCT处理块长度完成DCT处理操作的功能并且用于DCT处理。在这种情况下,只有与相应的频段关联的多个DCT电路中具有用于编码所需的位数最少的那个DCT电路的输出被选择。
在这样的高效编码装置中,只设置有一个编码器来代替如图1情况下的多个编码器。与图2所示结构的编码器的结构相比较,DCT电路43至45(DCT电路)并不是象图2中以一对一的关系相关联,而是设置多个相当于图3至图6中的相应频段的块长度数目的DCT电路。例如,设置具有不同块长度的三个DCT电路用于高频段,设置具有三个不同块长度的三个DCT电路用于中频段,并且设置一个唯一的DCT电路用于低频段。换句话说,设置三个DCT电路用于高频段,以相当于图3中的块长度bH、图4中的块长度bH1和bM2以及图5和图6中的块长度bH1、bH2、bH3和BH4的三种块长度进行高频段数据的DCT处理。以类似的方式,设置三个DCT电路用于中频段,以相当于图3和图4中的块长度bM1、图5中的块长度bM1和bM2以及图6中的块长度bM1、bM2、bM3和bM4的三种块长度进行中频段数据的DCT处理,同时设置一个DCT电路用于低频段,以相当个图3至图6中的块长度bL的一个唯一块长度进行低频段数据的DCT处理。通过将DCT电路的输出传送给选择电路6,并通过对每一个频段选择唯一一个DCT电路的输出,可以获得类似于图1中的结构所获得的处理。以这种方式,可以获得类似于图1中的结构所获得的效果,但结构却简化了。
一种根据改进的实施例的高效数字数据编码装置如图8所示。该装置包括根据每一个频段的正交变换之前的块数据(在一个预定时间内的逐帧数据)的特征(例如瞬态的或稳态的)用于确定每一个波段的正交变换的块长度的块长度决定电路49、50和51。正交变换操作由这些电路49至51根据针对相应的频段所确定的块长度进行。同时,一个用于改变块大小的装置被包含在电路46至48中。
参看图8,输出也传送给块长度决定电路49至51。在这些电路中,检验输入的声音数据的在帧4中的数据是否是瞬态信号或是稳态信号,根据检测的结果,输出一个块长度决定信号。块长度决定信号反映了在DCT电路43至45中变化的DCT处理块长度。
在与这些频段相关的块长度决定电路49至51中,通过将帧B的长度划分成四个部分得到块b1、b2、b3和b4,对这每一个块求得每一个采样的峰值,并对这些块b1、b2、b3和b4求得采样峰值的瞬时变化。例如,从块b1、b2、b3和b4的峰值PK1、PK2、PK3和PK4求得一个最大峰值Maxpk和一个最小峰值Minpk,将比值Maxpk/Minpk与在一个参考频段内的一个数值相比较,如果这个比值大于这个参考数值,则在帧B内的信号被确定是一个瞬态信号,而,如果这个 比值小于这个参考数值,则在帧B内的信号被确定是一个稳态信号。如果这个比值是在参考范围之内,则这个信号被确定是介于瞬态信号与稳态信号之间的一个中间信号。图9A和图9B分别显示了瞬态信号和稳态信号的例子。
电路49至51也可以设计成根据块b1、b2、b3和b4中的信号能量进行块长度的确定。在这种情况下,求得相应块中的能量,求出最大能量与最小能量的比值并通过如上所述的检验操作将该比值与信号能量的参考范围进行比较。
上述的检验操作在块长度决定电路49至51中进行,其中与检测结果一致的块长度被确定。根据在块长度决定电路49至51中这样确定的块长度在DCT处理电路43至45中进行DCT处理。
如果该信号由电路49至51断定是稳态信号,设定每一个波段的块长度,使得它们具有相同的长度,例如等于帧B的长度。于是,块长度被设置为bH、bM和bL,它们分别对应于高频段11.0至22.1KHz,中频段5.5至11.0KHz和低频段0至5.5KHz。
相反地,如果信号被断定是一个瞬态信号,则块长度的设置要使得块长度对于高频段和中频段较短而对于低频段较长,如图6所示。也就是说,对于和帧B相对应的低频段的块长度bL,对于高频段和低频段的块长度被设定为块长度bL的四分之一。在图6的例子中,高频段块的块长度为bH1、bH2、bH3和bH4,而中频段块的块长度为bM1、bM2、bM3和bM4
如果信号是介于稳态和瞬态信号之间,则块长度是这样的,相对于低频段的块长度bL,对于中频段的块长度或是等于低频段的块长度BM或是等于低频段的块长度的二分之一的bM1或bM2,而对于高频段的块长度是等于低频段的块长度的二分之一或四分之一的bH1、bH2、bH3和bH4
尽管在图3至图6中的实施例中的低频段的块长度bL恒定不变,但低频段的块长度也可以随信号而有所变化。低频段的块长度可以再分割成帧B的长度的二分之一或四分之一。
在帧B内的对于相应频段的由多个采样值组成的数据,由DCT电路43至45按照根据来自电路49至51的块长度决定信号的块长度进行DCT处理。也就是说,对于每一个波段的DCT处理是按照与帧B内的信号特征相符合的块长度进行的。
同时,由DCT电路43至45进行的DCT处理中的帧长度被选择等于1024个采样减去一个重叠段OL,如图10所示,它显示了与图5关联的介于瞬态信号与稳态信号之间的信号。正交变换除了DCT之外也可以是离散余弦变换。
块长度决定电路49至51的输出也传送给编码电路46至48,编码电路46至48适合于对来自DCT电路43至45的DCT系数数据进行编码。
如果在帧B内的数据是作为一个瞬态信号被检测并且DCT处理块长度在DCT电路43至45中被缩短,则DCT系数数据的编码可以按照在帧B内的自适应位分配在DCT电路43至45的信号流之后的编码电路46至48中进行。在图9A的例子中,更多的位分配给在块b1、b2、b3和b4中具有最大峰值的块b3,同时减少了分配给剩余块b1、b2和b4的位的数目。以这种方式,更多的位可以分配给真正需要位的块,在这里是块b3,以跟踪随瞬时的频谱变化。在这种情况下的位分配可以在考虑屏蔽效应的过程中实现。
如果在帧内的数据是作为稳态信号检测到的,并且DCT处理块长度在DCT电路43至45中被选择得更长,则编码电路46至48中的编码按照帧B的长度作为一个单位长度进行。在图9B的例子中,编码是在帧的基础上进行的而不是分割成四个块b1、b2、b3和b4。这样就免去了用帧B内类似的频谱对信号进行重叠的编码。
除此之外,在稳态信号的情况下,在DCT电路43至45中的频谱分析的精确性可以得到改善。屏蔽计算(如果进行的话)的精确性也可以得到改善,因此减少了在编码电路46至48中用于编码的位数。
这些编码电路46至48的输出由输出端52、54和56供给。块长度决定电路49至51的输出也由输出端53、55和57作为子数据供给。同时,在稳态信号的情况下,用于子数据的位数可能少于瞬态信号的情形。在瞬态信号的情况下,四个块相关的子数据由这些输出端53、55和57输出。在稳态信号的情况下,由于子数据可以是基于帧B的子数据,则可减少用于子数据的位数。
对于以上描述的高效数字数据编码装置,由于 用于相应频段的正交变换的块长度是由决定电路49至51根据正交变换之前的相应频段的帧数据的特征(例如瞬态或稳态)确定的,并且相应频段的DCT处理是由DCT电路43至45按照逐频段确定的块长度进行的,因而进行的编码可能符合信号特征(例如瞬态或稳态)。
图11显示了对应于本实施例的高效编码装置的一个译码装置的一个示意方框图。参看图11,编码装置的输出端52、54和56上的被编码数据输送给输入端152、154和156,而来自编码装置的输出端53、55和57的子数据输送给输入端153、155和157。被编码数据和子数据输送给译码电路146、147和148,译码电路146、147和148适合于根据子数据对被编码数据进行译码。被译码数据输送给IDCT电路143、144和145,IDCT电路143、144和145适合于进行一种与DCT电路43至45的处理相反的操作(反向离散余弦变换)。以上的子数据也输送给IDCT电路143至145以使得由这些电路进行的处理是根据这些子数据实现的。IDCT电路143的输出输送给一个IQMF电路141,IQMT电路141适合于进行一种与QMF电路41进行的操作相反的滤波操作。IDCT电路144和145的输出输送给一个IQMF电路142,IQMF电路142适合于进行一种与由QMF电路42进行的操作相反的滤波操作。由于IQMF电路142的一个输出输送给IQMF电路141,因而由IQMF电路141可以获得一个数字声音信号,它是分割成相应频段的信号的一个组合。这个声音信号在一个输出端140输出。
一个位分配的实施例参照图12进行解释。
在图12中所示的装置包括一个用于对输入数字数据进行频率分析的频率分析电路102,一个能量计算电路104和一个屏蔽计算电路105,屏蔽计算电路105作为噪声电平设定装置根据来自频率分析电路102的输出数据的逐块能量来设定逐块的容许噪声电平,一个块浮动计算电路107用于根据来自频率分析电路102的输出数据的多个块中的最大值数据来计算块浮动系数,一个编码电路103用于对频率分析电路102的输出进行编码,以及一个分配位数决定电路106,用以根据噪声电平设定装置的输出和块浮动系数计算电路107的输出由编码电路103在编码期间求得位分配数目。
频率分析电路102可以是一个单独的电路或可以与图2的DCT电路同时使用。编码电路103对应于图2的编码电路46至48。
在图12所示的本编码装置中,将输入数据,例如声音信号,输送给一个输入端100。这些输入声音数据输送给频率分析电路102用以分析声音数据。在频率分析电路102中,通过正交变换(例如DCT)将多个采样的声音数字数据变换成频谱数据(DCT系数数据)。
电路102的输出数据输送给编码电路103,在编码电路103中这些数据在由输出端108输出之前按照自适应位分配进行编码。
下面的结构用于按照自适应分配的位数由编码电路103进行编码。
于是,将来自频率分析电路102的频谱数据传送给作为噪声电平设定装置的能量计算电路104并且传送给块浮动计算电路107。
在能量计算电路104中,形成多个块,每一块由来自分析电路102的多个频谱数据构成。在本实施例中,频率范围被分割成例如25个频段,因此使得根据考虑了人的听觉的某些特征在内的临界频段的频带宽度变得朝较高的频率更宽些。求出从一个临界频段到另一个临界频段的能量,亦即求出了从一个频段到另一个频段的频谱数据的能量和。
能量计算电路104和其信号流之后的各电路的细节将参照图14顺序地进行解释。
来自能量计算电路104的相应频段的能量数据传送给一个屏蔽计算电路105,屏蔽计算电路105根据相应频段的能量数据来计算考虑了屏蔽效应的屏蔽数量。同时,如图14所示,可以与屏蔽计算一起同时求得考虑了人的听觉特征的所谓的等响度曲线的容许噪声电平。
正如上面描述的,将根据相应临界频段的能量来考虑人的听觉的某些特征的所谓的屏蔽效应的相应频段的关于容许噪声电平的信息传送给分配位数决定电路106。块浮动计算电路的输出也输送给分配位数决定电路106。
在块浮动计算电路107中,对来自频率分析电路102的多个频谱数据组成的每一个块进行所谓的块浮动。在块浮动操作中,在每一个块的频谱数据中选择一个最大值数据,并且一个比例因子或者和最大值数据相对应的它的近似值是作为一个块 比例因子而得到的。关于块浮动系数的信息传送给分配位数目决定电路106,作为块浮动系数的近似值,最大值数据本身也可以传送给分配位数决定电路106。
分配位数决定电路106根据关于来自屏蔽计算电路105的每一个频段的容许噪声电平的信息和块浮动系数的信息决定位分配数目。
分配位数决定电路106按照每一个频段的数据的数目(即在每一个频段内的频谱数据的数目)分割来自屏蔽计算电路105的每一个频段的容许噪声电平,求得每一个频段中的每个频谱数据的容许噪声电平。电路106还根据每个数据的容许噪声电平和每一块的块浮动系数求得关于分配位数的信息。
同时,当确定位分配数时,在块浮动计算电路107中计算浮动系数期间,频谱数据的数目是与在能量计算电路104中和在作为噪声电平设定装置的屏蔽计算电路105中计算容许噪声电平期间频谱数据的数目相适应的。换句话说,当决定位分配数时,在块浮动计算电路107中处理单元或块的数目与在噪声电平设定装置中的一个处理单元或频段相适应以匹配于频谱数据的数目,或者用于计算容许噪声电平的处理单元或频段的数目是与用于计算块浮动系数的一个处理单元或块相适应的。上述操作鉴于以下原因必须完成:因为临界频段的频带宽度朝向较高的频率变得更宽,逐个频段的数据数目互不相同,使得求得分配位数的计算,只有在计算块浮动系数的数据的数目是匹配于频段数据的数目的条件下才能实际使用。
在本发明的分配位数电路106中,求得一个电平AD(E2-E3),如图13所示,其中E3是通过将块b(其数据数目已经按上述进行了匹配的块)中的多个频谱数据S的总能量电平E0除以块b中的数据数目而求得的每个频谱数据的容许噪声电平,E2是如图13所示的相当于块b中的频谱数据S中的最大值数据Smax的比例因子或块浮动系数的电平。图13中所示的电平是用6个位表示的,并且从(E2-E3)求得的按分贝表示的电平是按照位[(E2-E3])/6.0位计算的。结果数据用作表示与块b的位分配数目有关的信息。
同时,通常的作法是求出一个电平ad(E0-E1),其中E0表示在块b中的总的能量电平,E1是根据总能量电平E0求得的,并且从(E2-E3)求得的以分贝为单位电平是按照位[(E2-E3)/6.0位]进行计算的,以使用该计算结果表示块b的分配位数目的信息。
以上述方式求得的分配位数目信息输送给根据分配位数目信息进行编码的编码电路103。
在上述实施例中,在每一个块或频段中的噪声电平可以被压缩在容许噪声电平之内,并且即使信号具有高音调,也可以求得该位数以匹配于信号的特征。
来自位分配数目决定电路106的关于位分配数目的信息从输出端109输出,以用于信号流下侧的译码单元(图中未示出)进行被编码数据的译码。块浮动计算电路107的块浮动系数信息从输出端110输出,以用于译码单元中的译码。
参看图14,下面将说明考虑了临界频段和在能量计算电路104中的屏蔽效应的用于设定容许噪声电平的结构和信号流下侧的电路。
图14中显示的结构由用于根据每一个临界频段的能量(峰值或平均值)设定每一个频段的容许噪声电平的噪声电平设定装置的各个电路组成。
在图14中,将输送给输入端100的时间轴数字声音数据传送给一个频率分析电路102的一个DCT电路111,频率分析电路102还具有一个幅度相位产生电路112。在DCT电路111中,在时间轴上的声音数据在一个单位时间间隔或一个单位块间隔变换成频率轴上的数据,以产生一个由一个实数分量Re和一个虚数分量Im组成的DCT系数数据。这些DCT系数数据传送给幅度相位信息产生电路112,其中一个幅度信息Am和一个相位信息Ph由分量Re和Im产生并被输出。
在幅度信息Am和相位信息Ph中,幅度信息Am传送给分配位数决定电路106并用于在一个幅度信息编码电路160和一个相位信息编码电路170中求得一个自适应位数目分配信息。由于一般来说人的听觉对该频率范围的幅度或能量是灵敏的,而对相位极端不灵敏,因而在本实施例中只使用幅度信息来求得分配位数目信息。
来自频率分析电路102的幅度信息Am传送给用于编码的幅度信息编码电路160,而相位信息Ph输送给类似用于编码的相位信息编码电路170。在由编码电路160、170的编码中,对于频 率分析器102的输出的一个预定的频段而言,分配给相位信息Ph的位数被减少以使得它少于分配给用于编码的幅度信息Am的位数,下面对此进行解释。幅度信息还输送给分配位数决定电路106。分配位数决定电路106由块浮动系数和每个数据的容许噪声电平来决定分配位数目信息,对此将接着进行解释。分配位数决定电路106还根据幅度信息Am决定用于编码幅度信息Am的分配位数目信息和用于编码相位信息Ph的分配位数目信息(对此将接着进行解释),用于传送给相应的编码电路160、170。
可以注意到,在分配位数决定电路106中,根据考虑了人的听觉特征的临界频段可以分割幅度信息Am,并且从相应频段的幅度信息的能量可以求得屏蔽数量,以使得用于编码每一个频段的幅度信息Am的位分配数目和用于编码每一个频段的相位信息Ph的位分配数目可以根据屏蔽数量利用容许噪声电平来确定。在确定每一个频段的位分配数目中,选择用于相位信息Ph的位分配数目少于用于幅度信息Am的位分配数目以考虑人的听觉特征。通过以这种方式减少分配给相位信息Ph的位的数目,可以减少从相位信息编码电路170输出的相位信息的被编码数据中的位数。即使分配给相位信息Ph的位数被减少,但这种减少不会使人的耳朵感觉到声音音质的畸变。
在图14中,来自频率分析电路102的幅度信息的数字数据传送给将数字数据分割成临界频段的一个频段分割电路113。对于临界频段,考虑了人的听觉或频率分析能力的某些特征。例如,将频率范围分割成25个频段以使得频带宽度朝向较高的频率变得更宽。也就是说,人的听觉具有了类似于一个带通滤波器的特征。被相应的滤波器分割的相应频段称作临界频段。
被频段分割电路113分割的相应频段的数字数据传送给一个总和检测电路114,在该检测电路中通过累积每一个频段中的相应的频谱数据的强度的总和而求得每一个频段的能量(在每一个频段的频谱强度)。总和检测电路114的一个输出,即每一个频段的频谱和,被称为布尔克(Burke)频谱。每一个频段中的布尔克(Burke)频谱SB例如由图15中所示。在这个图中,选择临界频段的数目等于12(B1至B12)。
为了考虑Burke频谱SB对于所谓的屏蔽的效应,在Burke频谱上对一个预定的加权函数求卷积。为了这个目的,将总和检测电路114的输出,即Burke频谱SB的值,传送给一个滤波器电路115。滤波器电路115包括用于顺序延迟输入数据的多个延迟装置,用于将延迟装置的输出乘以滤波器系数(加权函数)的多个放大器,例如与频段相关的25个放大器,以及一个用于累加放大器的输出的求和装置。Burke频谱SB的卷积是通过将滤波器系数1、0.15、0.0019、0.0000086、0.4、0.06和0.007分别乘以因数M、M-1、M-2、M-3、M+1、M+2、M+3(其中M是一个任意的整数)在滤波器电路115中进行的。通过这个卷积,计算了图15中由虚线所示的面积的总和。
滤波器电路115的输出输送给一个减法器116,减法器116适宜于求得一个相当于在卷积区域内的容许噪声电平的电平a。相当于容许噪声电平的电平α是这样一个电平,它通过反卷积给出了每一个临界频段的一个容许噪声电平,对此将接着进行解释。一个用于求得电平α的容许函数(表示屏蔽电平上的函数)输送给减法器116。通过增加或减小容许函数来控制电平α。容许函数由一个函数发生器129提供,对此将在后面描述。
如果从低频段朝向较高频段的临界频段的数目是i,则相当于容许噪声电平的电平α由以下公式求得:
α=S-(n-ai)
其中n和a是常数,且a>0,S是被卷积的Burke频谱的一个强度,在上述公式中的(n-ai)是容许函数。在图14的例子中,n=38且a=1,在这种情况下可以获得最优的编码而不会破坏声音音质。
以这种方式求得了电平a并且把相应的数据传送给一个适宜于对在卷积区域中的电平a进行反卷积的除法器117。于是,通过反卷积,可以由电平a求得屏蔽频谱。也就是说,屏蔽频谱变成了容许噪声电平。尽管反卷积需要进行复杂处理。但在图14的例子中反卷积是由一个简化的除法器117完成的。
屏蔽频谱经过一个合成电路118传送给一个减法器119,总和检测电路114的一个输出,即来自上述总和检测电路114的Burke频谱SB,经过 一个延时电路121输送给减法器119。通过由减法器119对屏蔽频谱与Burke频谱SB之间做减法,Burke频谱SB中的低于屏蔽电平MS的部分被屏蔽掉,如图16所示。
在由合成电路118进行的合成中,表示显示人的听觉特征的来自一个最小可听度曲线发生器122的一个所谓的最小可听度曲线RC(如图17所示)的数据可以与上述的屏蔽频谱相组合。在最小可听度曲线中,如果一个噪声的绝对电平值低于最小可听度曲线,那么它就是听不见的。最小可听度曲线变得与例如重放音量的差别不同,尽管它们的编码是相同的。然而,在一个实际的数字系统中,由于16位动态范围的音乐没有明显的差别,如果最适合于人耳的4KHz左右的频率范围内的量化噪声是听不见的,那么在其它频率范围内的低于最小可听度曲线的量化噪声也被认为是听不见的。因此,如果假设系统用于这样一种方式,使得系统的字的长度的约为4KHz的噪声听不见,并且通过合成最小可听度曲线RC和屏蔽频谱MS获得了容许噪声电平,那么在这种情况下可以取最高为图17中点划线的噪声电平。同时,在图14的例子中,最小可听度曲线的4KHz的电平是和相当于例如20位的最小电平相一致的。在图17中,也显示了信号频谱SS。
可以注意到,在一个容许噪声电平校正电路120中,根据所谓的等响度曲线的信息校正来自减法器119的容许噪声电平。来自一个校正值决定电路128的一个输出也输送给容许噪声电平校正电路120。
校正值决定电路128输出校正值数据,用于根据预先设定的等响度曲线的信息数据校正来自减法器119的容许噪声电平。来自减法器119的容许噪声电平用传送给容许噪声电平校正电路120的校正值校正。
同时,等响度曲线是与人的听觉的某些特征相关的,并且是通过综合听起来与1KHz的纯音的大小相同的相应频率的声音的压力求得的。等响度曲线基本上具有与图17中所示的最小可听度曲线相同的轮廓。在等响度曲线中,一个比1KHz的声音压力低8至10分贝的4KHz附近的声音听起来与一个1KHz的声音一样响,而,一个50KHz附近的声音不可能听见,除非该声音的压力高于1KHz的声音压力大约15分贝。鉴于这种考虑可以明白,考虑了等响度曲线的容许噪声电平的校正是适合于人的听觉特征的。
将以这种方式确定的关于容许噪声电平的信息传送给一个ROM130,在ROM130中存贮有用于编码幅度信息Am和相位信息Ph的多个分配位数目数据。符合于减法电路119的输出(每一个频段的能量与噪声电平设定装置的输出之差的电平)的分配位数数据可以由ROM130输出。如上所述,分配给相位信息的位数少于分配给幅度信息的位数。ROM130的输出输送给幅度信息编码电路160和相位信息编码电路170。在电路160中,经过延迟电路123输送来的幅度信息Am按照来自ROM130的位分配数目编码,而在电路170中,对经过延迟电路124输送来的相位信息进行编码。换句话说,在这些电路160、170中,这些频段的组分按照根据临界频段的能量与容许噪声电平之差的电平进行分配位的数目进行编码,以使得分配给相位信息Ph的位数少于分配给幅度信息Am的位数。同时,考虑到合成电路118的信号流前侧的电路造成的延迟,设置延迟电路121来延迟来自总和检测电路114的Burke频谱SB,并且考虑到延迟电路123、124或ROM130的信号流前侧的电路造成的延迟设置延迟电路121还用来延迟幅度信息Am或相位信息Ph。
尽管分配给相位信息Ph的位数信息和分配给幅度信息Am的位数信息可以由决定电路106直接输送给译码电路,但是分配位数目信息的位数在本实施例中被压缩了。
也就是说,在决定电路106中,相对于幅度信息的相位信息的位被减少的数目是预先确定的。例如,分配给相位信息和幅度信息的位数是预先设定的以使得对于高频段(例如10KHz或更高)分配给相位信息Ph的位数比分配给幅度信息的位数少一位。以这样的方式,只有一个用于相位信息的分配位信息或用于幅度信息的分配位信息和相位信息Ph和幅度信息Am的被编码数据一起传送出去。
也就是说,如果通知信号流下游侧的编码器关于位减少的预定条件,则该编码器就可以从剩余的位数信息求得其它被分配位数目信息。于是,不需要传送后者的信息以使得用于被分配位数目信息的 位数减少。同时如果作为被分配位数目信息的传送信息是用于相位信息Ph的信息,则与传送用于幅度信息Am的被分配位数目的情形相比,传送的位数可以减少。
来自幅度信息编码电路160的幅度信息Am的被编码数据通过输出端161输出,而来自相位信息Ph的被编码数据通过输出端171输出。决定电路106的被分配位数目信息由输出端151输出。来自幅度信息Am的被编码数据和来自相位信息Ph的被编码数据通过利用被分配位数目信息译码。
对于上述的装置,通过频率分析将输入数字数据变换成幅度信息Am和相位信息Ph,并且在编码相位信息Ph和幅度信息Am期间,分配给相位信息Ph的位数被减少以致少于分配给幅度信息Am的位数,以使得减少编码数据成为可能。
除此之外,如果与幅度信息Am相比,用于相位信息Ph的被减少的位的数目对于每一个频段是预定的,则只有一个用于幅度信息Am或用于相位信息Ph的被分配位数目数据需要传送,以使得用于传送被分配的位信息的位数可以进一步减少。此外,由于分配给相应频段的位数是利用根据由相应频段的幅度信息的能量求得的屏蔽数量的容许噪声电平来设定的,因而可以以一种就听觉感受而论受到较少的畸变的方式获得位的压缩。
同时,在下述情况下可以省去上述的最小可听度曲线的合成:省去最小可听度曲线发生器122以及合成电路118,并且在由除法器117进行反卷积之后将减法器116的输出直接传送给减法器119。
本发明不仅可以适用于如图12的实施例所示的通过正交变换处理输入数字信号的自适应变换编码,而且也可以适用于适宜于通过带通滤波器等将信号分割成多个波段以确定分配给每一个波段的位数从而进行分波段编码(SBC)的装置。
对于本发明的高效数字数据编码装置,由于对相应的频段进行正交变换的块长度是根据在每一个频段的正交变换之前的块数据的特征(瞬态或稳态等)在块长度决定电路中确定的,并且对于每一个频段的正交变换是按照这样确定的块长度进行的,因而可以根据信号的特征(例如瞬态或稳态)进行编码,而且也可以进行位的压缩。
对于本发明的高效数字数据编码装置,由于根据多个正交变换装置的输出只选择来自相应正交变换装置的输出中的一个输出,因而根据输入数字数据的特征和人的听觉特征通过选择在编码期间具有最小被分配位的数目的那个正交变换装置的输出就可以获得最优的编码输出,以使得可以通过译码并通过将被编码的输出变换成声音产生最佳的声音音质。
除此之外,对于本发明的高效数字数据编码装置,由于在编码期间被分配位的数目是根据浮动系数和容许噪声电平确定的,而浮动系数是根据通过输入数字数据的频率分析而得到的数据组成的块中的最大值数据而求得的,容许噪声电平是根据逐块能量求得的,因而即使信号是高音调信号也可以获得最优的位分配。
此外,对于本发明的高效数字数据编码装置,当通过频谱分析将输入数字数据转变成幅度信息和相位信息,并且对幅度信息和相位信息进行编码时,对于一个预定的频段分配给相位信息的位数被减少以致少于分配给幅度信息的位数,从而可以提高位压缩比并且可以降低传送位速率。
此外,对于本发明的高效数字数据编码装置,由于分配给相位信息Ph的位数被减少的频段是考虑了人的听觉特征的高临界频段,因而就听觉而论可降低声音音质的畸变。
本发明的装置可以有效地应用到在一个封装介质(例如一个所谓的小型唱片)上进行录制的一个数据编码装置。

Claims (17)

1、一种高效数字数据编码装置,在该装置中,通过多次采样,输入数字数据被排列成块,在每一个块中进行正交交换以产生系数数据,该系数数据按照一种自适应的位数进行编码,该装置的特征在于包括:
多个编码器,每一个编码器具有正交变换装置,通过正交镜滤波器对每一个波段的输入数字数据按照各波段之间相互不同的块长度进行正交变换并由初始位分配数目决定电路和校正电路确定各编码器所需位数;
一选择电路,为实现预定的声音音质所需的位数,从这些正交变换装置的输出选择出进行编码所需的位数最少的这个正交变换装置的输出,并输出一选择信号;和
转换电路,接收所述选择信号,进行转换操作,只输出来自所说编码器提供的被编码输出中的一个。
2、一种根据权利要求1所述的高效数字数据编码装置,其特征在于,所说块长度通过再分割在朝向较高的频率方向更短些。
3、一种高效数字数据编码装置,在该装置中,输入数字数据被分割成多个频段,在每一个频段中形成由多个采样值组成的块,并且在每一个频段的每一个块中进行正交变换以产生系数数据,以系数数据编码,该装置特征在于,它包括:
正交镜象滤波器,将输入信号分割成几个临界频段;
块长度决定电路,根据在每一个频段的正交变换之前的块数据的特征用于确定每一个频段的正交变换的块长度。
正交变换电路,根据块长度进行正交变换操作;和
编码电路,接收所说块长度决定电路输出,将来自所说DCT电路的系数数据进行编码。
4、一种根据权利要求3所述的高效数字数据编码装置,其特征在于,每一个频段的频带宽度在朝向较高的频率被选择得更宽。
5、一种根据权利要求4所述的高效数字数据编码装置,其特征在于,所说块长度通过再分割在朝向较高的频率更短。
6、一种根据权利要求4所述的高效数字数据编码装置,其特征在于,所说块长度对于中频段和高频段是不同的。
7、一种根据权利要求1、2、3、4、5或6的任何一个权利要求所述的高效数字数据编码装置,其特征在于,该正交变换是离散余弦变换(DCT)。
8、一种根据权利要求1、2、3、4、5或6的任何一个权利要求所述的高效数字数据编码装置,其特征在于,所说正交变换是快速傅立叶变换(FFT)。
9、一种高效数字数据编码装置,其特征在于,它包括:
频率分析装置,用于对输入数字数据进行频率分析,
噪声电平设定装置,用于对来自所说频率分析装置的多个输出数据组成的每一个块求得能量并用于根据块的能量设定容许噪声电平,
浮动系数计算装置,用于根据在来自所说频率分析装置的多个输出数据组成的每一个块中的最大值数据计算工浮动系数,
编码装置,用于对所说频率分析装置的输出进行编码,
分配位数决定电路,用于根据所说噪声电平设定装置的一个输出和所说浮动系数计算装置的一个输出由该编码装置在编码期间求得被分配的位数。
10、一种根据权利要求9的高效数字数据编码装置,其特征在于,所说噪声电平设定装置由每一个块中的能量计算一个屏蔽数量以便根据所说屏蔽数量设定该噪声电平。
11、一种根据权利要求10的高效数字数据编码装置,其特征在于,所说噪声电平设定装置通过考虑人的听觉特征方面的一个响度曲线来计算所说屏蔽数量。
12、一种根据权利要求9、10或11的任何一个权利要求所述的高效数字数据编码装置,其特征在于,该正交变换是离散余弦变换(DCT),
13、一种根据权利要求9、10或11的任何一个权利要求所述的高效数字数据编码装置,其特征在于,该正交变换是快速傅立叶变换(FFT)。
14、一种高效数字数据编码装置,其特征在于它包括:
频率分析装置,包括DCT电路和幅度/相位信息发生电路,用于对输入数字数据进行频率分析以将所说输入数字数据变换成一个幅度信息和一个相位信息;
总和检测电路,通过累积每一频段中的相应的频谱数据的强度的总和求得每一个频段的能量;
分配位数决定电路,对于所说频率分析器的输出的预定频段,决定分配给相位信息的位数少于分配给用于编码的幅度信息的位数;以及
编码装置,对所说幅度信息和相信信息进行编码。
15、一种根据权利要求14的高效数字数据编码装置,其特征在于,在编码中便、使得分配给所说相位信息的位数少于分配给所说幅度信息的位数,该位数只是在一个预定的频率范围内被减少。
16、一种数字数据译码装置,用于对作为许多个被编码数据和辅助信息而被传送或被录制的数字数据进行译码,所说被编码的数据和所说辅助信息是这样产生的,即通过多次采样排列输入数字数据,并在每一个块中按照不同的块长度进行正交变换以产生系数数据,该系数数据按照位的自适应数目编码。
其特征在于包括:
多个译码电路,将所说被编码数据和所说辅助信息。
一个反正变换电路,将所说被编码数据和所说辅助信息处理一个时间轴信息,和
反正交镜象滤波器(反QMF)电路,将所说时间轴信息合成以产生数字声音信号。
17、一种根据权利要求16所述的高效数字译码装置,其特征在于,所说反正变换电路是一个反离散余弦变换(反DCT)电路。
CN92102961A 1991-03-29 1992-03-28 高效数字数据编码和译码装置 Expired - Fee Related CN1030129C (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP91185/91 1991-03-29
JP91183/91 1991-03-29
JP03091183A JP3089690B2 (ja) 1991-03-29 1991-03-29 ディジタルデータの高能率符号化方法
JP03091185A JP3089691B2 (ja) 1991-03-29 1991-03-29 ディジタルデータの高能率符号化方法

Publications (2)

Publication Number Publication Date
CN1068689A CN1068689A (zh) 1993-02-03
CN1030129C true CN1030129C (zh) 1995-10-18

Family

ID=26432643

Family Applications (1)

Application Number Title Priority Date Filing Date
CN92102961A Expired - Fee Related CN1030129C (zh) 1991-03-29 1992-03-28 高效数字数据编码和译码装置

Country Status (18)

Country Link
US (1) US5414795A (zh)
EP (1) EP0537361B1 (zh)
KR (1) KR100293855B1 (zh)
CN (1) CN1030129C (zh)
AT (1) ATE153165T1 (zh)
AU (2) AU648656B2 (zh)
BR (1) BR9204820A (zh)
CA (1) CA2083713C (zh)
DE (1) DE69219718T2 (zh)
DK (1) DK0537361T3 (zh)
EG (1) EG20351A (zh)
FI (1) FI112979B (zh)
HU (1) HU213963B (zh)
NO (1) NO306007B1 (zh)
PT (1) PT100309B (zh)
TR (1) TR25961A (zh)
WO (1) WO1992017884A1 (zh)
ZA (1) ZA921988B (zh)

Families Citing this family (62)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5115240A (en) * 1989-09-26 1992-05-19 Sony Corporation Method and apparatus for encoding voice signals divided into a plurality of frequency bands
ATE173366T1 (de) * 1991-09-30 1998-11-15 Sony Corp Verfahren und anordnung zur audiodatenkompression
US5765127A (en) * 1992-03-18 1998-06-09 Sony Corp High efficiency encoding method
JP3153933B2 (ja) * 1992-06-16 2001-04-09 ソニー株式会社 データ符号化装置及び方法並びにデータ復号化装置及び方法
JP3186292B2 (ja) * 1993-02-02 2001-07-11 ソニー株式会社 高能率符号化方法及び装置
JP3088580B2 (ja) * 1993-02-19 2000-09-18 松下電器産業株式会社 変換符号化装置のブロックサイズ決定法
JP3188013B2 (ja) 1993-02-19 2001-07-16 松下電器産業株式会社 変換符号化装置のビット配分方法
JP3186307B2 (ja) * 1993-03-09 2001-07-11 ソニー株式会社 圧縮データ記録装置及び方法
JP3123290B2 (ja) * 1993-03-09 2001-01-09 ソニー株式会社 圧縮データ記録装置及び方法、圧縮データ再生方法、記録媒体
JP3531177B2 (ja) * 1993-03-11 2004-05-24 ソニー株式会社 圧縮データ記録装置及び方法、圧縮データ再生方法
TW232116B (en) * 1993-04-14 1994-10-11 Sony Corp Method or device and recording media for signal conversion
US5581654A (en) * 1993-05-25 1996-12-03 Sony Corporation Method and apparatus for information encoding and decoding
CN1064773C (zh) * 1993-06-30 2001-04-18 索尼公司 数字信号的编码方法和解码方法
US5632003A (en) * 1993-07-16 1997-05-20 Dolby Laboratories Licensing Corporation Computationally efficient adaptive bit allocation for coding method and apparatus
US5415979A (en) * 1993-07-28 1995-05-16 Konica Corporation Stabilizer composition for processing silver halide photographic light-sensitive material and a method of processing silver halide light-sensitive material using the same
US5451954A (en) * 1993-08-04 1995-09-19 Dolby Laboratories Licensing Corporation Quantization noise suppression for encoder/decoder system
TW327223B (en) * 1993-09-28 1998-02-21 Sony Co Ltd Methods and apparatus for encoding an input signal broken into frequency components, methods and apparatus for decoding such encoded signal
AU689506B2 (en) * 1993-11-04 1998-04-02 Sony Corporation Signal encoder, signal decoder, recording medium and signal encoding method
JP3125543B2 (ja) * 1993-11-29 2001-01-22 ソニー株式会社 信号符号化方法及び装置、信号復号化方法及び装置、並びに記録媒体
JPH07205496A (ja) * 1994-01-14 1995-08-08 Oki Electric Ind Co Ltd ページプリンタ及びデータ圧縮方法
US5608713A (en) * 1994-02-09 1997-03-04 Sony Corporation Bit allocation of digital audio signal blocks by non-linear processing
DE4405659C1 (de) * 1994-02-22 1995-04-06 Fraunhofer Ges Forschung Verfahren zum kaskadierten Codieren und Decodieren von Audiodaten
JP3186412B2 (ja) * 1994-04-01 2001-07-11 ソニー株式会社 情報符号化方法、情報復号化方法、及び情報伝送方法
JP3277682B2 (ja) * 1994-04-22 2002-04-22 ソニー株式会社 情報符号化方法及び装置、情報復号化方法及び装置、並びに情報記録媒体及び情報伝送方法
JP3277699B2 (ja) * 1994-06-13 2002-04-22 ソニー株式会社 信号符号化方法及び装置並びに信号復号化方法及び装置
JP3277705B2 (ja) 1994-07-27 2002-04-22 ソニー株式会社 情報符号化装置及び方法、並びに情報復号化装置及び方法
JP3341474B2 (ja) * 1994-07-28 2002-11-05 ソニー株式会社 情報符号化方法及び復号化方法、情報符号化装置及び復号化装置、並びに情報記録媒体
JPH09506478A (ja) * 1994-10-06 1997-06-24 フィリップス エレクトロニクス ネムローゼ フェンノートシャップ 光放射半導体ダイオード及びこのようなダイオードの製造方法
US5765136A (en) * 1994-10-28 1998-06-09 Nippon Steel Corporation Encoded data decoding apparatus adapted to be used for expanding compressed data and image audio multiplexed data decoding apparatus using the same
JP3557674B2 (ja) * 1994-12-15 2004-08-25 ソニー株式会社 高能率符号化方法及び装置
JPH08190764A (ja) * 1995-01-05 1996-07-23 Sony Corp ディジタル信号処理方法、ディジタル信号処理装置及び記録媒体
EP0721257B1 (en) * 1995-01-09 2005-03-30 Daewoo Electronics Corporation Bit allocation for multichannel audio coder based on perceptual entropy
CN1110955C (zh) * 1995-02-13 2003-06-04 大宇电子株式会社 自适应地编码来自多条通道的输入数字音频信号的装置
JP2842276B2 (ja) * 1995-02-24 1998-12-24 日本電気株式会社 広帯域信号符号化装置
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
JP2778567B2 (ja) * 1995-12-23 1998-07-23 日本電気株式会社 信号符号化装置及び方法
JP3189660B2 (ja) * 1996-01-30 2001-07-16 ソニー株式会社 信号符号化方法
KR100223169B1 (ko) * 1996-06-14 1999-10-15 윤종용 펄스부호변조된 디지털 오디오신호의 기록 및 재생을 위한 시스템
US5892746A (en) * 1996-06-15 1999-04-06 Samsung Electronics Co., Ltd. System for recording and/or reproducing a pulse code modulation digital audio signal
JP3318825B2 (ja) * 1996-08-20 2002-08-26 ソニー株式会社 デジタル信号符号化処理方法、デジタル信号符号化処理装置、デジタル信号記録方法、デジタル信号記録装置、記録媒体、デジタル信号伝送方法及びデジタル信号伝送装置
JPH1083623A (ja) * 1996-09-10 1998-03-31 Sony Corp 信号記録方法、信号記録装置、記録媒体および信号処理方法
JP3496411B2 (ja) * 1996-10-30 2004-02-09 ソニー株式会社 情報符号化方法及び復号化装置
DE19736669C1 (de) * 1997-08-22 1998-10-22 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Erfassen eines Anschlags in einem zeitdiskreten Audiosignal sowie Vorrichtung und Verfahren zum Codieren eines Audiosignals
US5903872A (en) * 1997-10-17 1999-05-11 Dolby Laboratories Licensing Corporation Frame-based audio coding with additional filterbank to attenuate spectral splatter at frame boundaries
US6654189B1 (en) * 1998-04-16 2003-11-25 Sony Corporation Digital-signal processing apparatus capable of adjusting the amplitude of a digital signal
US6353584B1 (en) * 1998-05-14 2002-03-05 Sony Corporation Reproducing and recording apparatus, decoding apparatus, recording apparatus, reproducing and recording method, decoding method and recording method
US6353807B1 (en) * 1998-05-15 2002-03-05 Sony Corporation Information coding method and apparatus, code transform method and apparatus, code transform control method and apparatus, information recording method and apparatus, and program providing medium
GB2349054A (en) * 1999-04-16 2000-10-18 Nds Ltd Digital audio signal encoders
US6868377B1 (en) * 1999-11-23 2005-03-15 Creative Technology Ltd. Multiband phase-vocoder for the modification of audio or speech signals
US7023789B2 (en) 1999-12-21 2006-04-04 Robert Bosch Gmbh Playback device and storage medium for selective storage of data as a function of data compression method
EP1279167B1 (en) * 2000-04-24 2007-05-30 QUALCOMM Incorporated Method and apparatus for predictively quantizing voiced speech
US6963975B1 (en) * 2000-08-11 2005-11-08 Microsoft Corporation System and method for audio fingerprinting
US7035873B2 (en) * 2001-08-20 2006-04-25 Microsoft Corporation System and methods for providing adaptive media property classification
KR101037931B1 (ko) * 2004-05-13 2011-05-30 삼성전자주식회사 2차원 데이터 처리를 이용한 음성 신호 압축 및 복원장치와 그 방법
JP5100124B2 (ja) * 2004-10-26 2012-12-19 パナソニック株式会社 音声符号化装置および音声符号化方法
KR20100079121A (ko) * 2008-12-30 2010-07-08 주식회사 동부하이텍 이미지 인코더 및 이미지 인코딩 방법
US8386266B2 (en) * 2010-07-01 2013-02-26 Polycom, Inc. Full-band scalable audio codec
US8428381B2 (en) * 2010-06-04 2013-04-23 Altek Corporation Image compression method with variable quantization parameter
WO2011156905A2 (en) * 2010-06-17 2011-12-22 Voiceage Corporation Multi-rate algebraic vector quantization with supplemental coding of missing spectrum sub-bands
KR101468458B1 (ko) 2010-11-12 2014-12-03 폴리콤 인코포레이티드 멀티 포인트 환경에서의 스케일러블 오디오
EP2879131A1 (en) 2013-11-27 2015-06-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoder, encoder and method for informed loudness estimation in object-based audio coding systems
US10699721B2 (en) * 2017-04-25 2020-06-30 Dts, Inc. Encoding and decoding of digital audio signals using difference data

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4184049A (en) * 1978-08-25 1980-01-15 Bell Telephone Laboratories, Incorporated Transform speech signal coding with pitch controlled adaptive quantizing
CA1292071C (en) * 1985-06-28 1991-11-12 Tomohiko Taniguchi Coding transmission equipment for carrying out coding with adaptive quantization
NL8700985A (nl) * 1987-04-27 1988-11-16 Philips Nv Systeem voor sub-band codering van een digitaal audiosignaal.
US4815068A (en) * 1987-08-07 1989-03-21 Dolby Ray Milton Audio encoder for use with more than one decoder each having different characteristics
JPH01276980A (ja) * 1988-04-28 1989-11-07 Sharp Corp 画像データ直交変換符号化方式
JPH0783315B2 (ja) * 1988-09-26 1995-09-06 富士通株式会社 可変レート音声信号符号化方式
EP0370277A3 (de) * 1988-11-24 1991-09-18 Siemens Aktiengesellschaft Subband-Übertragungssystem
CA2140678C (en) * 1989-01-27 2001-05-01 Louis Dunn Fielder Coder and decoder for high-quality audio
US5109417A (en) * 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
JPH0366228A (ja) * 1989-08-04 1991-03-20 Matsushita Electric Ind Co Ltd ブロック符号化装置と復号化装置
US4932062A (en) * 1989-05-15 1990-06-05 Dialogic Corporation Method and apparatus for frequency analysis of telephone signals
US5115240A (en) * 1989-09-26 1992-05-19 Sony Corporation Method and apparatus for encoding voice signals divided into a plurality of frequency bands
JPH03117919A (ja) * 1989-09-30 1991-05-20 Sony Corp ディジタル信号符号化装置
JP2913731B2 (ja) * 1990-03-07 1999-06-28 ソニー株式会社 ディジタルデータの高能率符号化方法
JP2861238B2 (ja) * 1990-04-20 1999-02-24 ソニー株式会社 ディジタル信号符号化方法
JP2751564B2 (ja) * 1990-05-25 1998-05-18 ソニー株式会社 ディジタル信号符号化装置

Also Published As

Publication number Publication date
FI925401A0 (fi) 1992-11-27
HU213963B (en) 1997-11-28
CA2083713A1 (en) 1992-09-30
WO1992017884A1 (en) 1992-10-15
NO306007B1 (no) 1999-08-30
DE69219718T2 (de) 1997-10-02
HU9203758D0 (en) 1993-04-28
DK0537361T3 (da) 1997-06-09
HUT63269A (en) 1993-07-28
KR100293855B1 (ko) 2001-09-17
CA2083713C (en) 2003-08-19
EG20351A (en) 1999-01-31
PT100309B (pt) 1999-04-30
AU5516894A (en) 1994-04-28
DE69219718D1 (de) 1997-06-19
ATE153165T1 (de) 1997-05-15
EP0537361A1 (en) 1993-04-21
PT100309A (pt) 1994-04-29
BR9204820A (pt) 1993-07-13
US5414795A (en) 1995-05-09
FI112979B (fi) 2004-02-13
KR930700945A (ko) 1993-03-16
NO924551L (no) 1993-01-25
CN1068689A (zh) 1993-02-03
EP0537361B1 (en) 1997-05-14
NO924551D0 (no) 1992-11-25
ZA921988B (en) 1993-02-24
AU648656B2 (en) 1994-04-28
FI925401A (fi) 1992-11-27
TR25961A (tr) 1993-11-01
AU1448992A (en) 1992-11-02
AU670655B2 (en) 1996-07-25

Similar Documents

Publication Publication Date Title
CN1030129C (zh) 高效数字数据编码和译码装置
CN1065381C (zh) 数字音频信号编码和/或译码方法
CN1153191C (zh) 高质量音频的可缩放编码方法
CN1146203C (zh) 用于音频编码的动态位分配装置和方法
CN1154087C (zh) 提高低比特率音频编码系统音质的方法、编码器和译码器
CN1111959C (zh) 量化装置、量化方法、高效率编码装置、高效率编码方法、解码装置和高效率解码装置
CN1183685C (zh) 用于熵编码信号量化变换系数的系统和方法
CN1816847A (zh) 保真度优化的可变帧长编码
CN1139842A (zh) 数字信号处理方法及装置,数字信号解码方法及装置,数字信号传输方法及记录介质
CN1092420C (zh) 音频数据解码装置及音频数据编码解码系统
US9275649B2 (en) Method and system for encoding audio data with adaptive low frequency compensation
CN1119902A (zh) 用于压缩的方法和装置,用于传输的方法以及用于扩展被压缩多声道声音信号的方法和装置,和用于被压缩多声道声音信号的记录媒体
CN1669074A (zh) 话音增强装置
CN1221528A (zh) Btsc编码器
JPH05304479A (ja) オーディオ信号の高能率符号化装置
CN1065565A (zh) 数字音频信号的编码方法
US20090106030A1 (en) Method of signal encoding
CN1822508A (zh) 对数字信号进行编码和解码的方法和设备
JP2001343997A (ja) デジタル音響信号符号化装置、方法及び記録媒体
US6240379B1 (en) System and method for preventing artifacts in an audio data encoder device
JPH09261064A (ja) 符号器及び復号器
JP2003140692A (ja) 符号化装置及び復号化装置
CN1969318A (zh) 音频编码装置、解码装置、方法、以及程序
CN1139805A (zh) 数据记录方法
US6678653B1 (en) Apparatus and method for coding audio data at high speed using precision information

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C15 Extension of patent right duration from 15 to 20 years for appl. with date before 31.12.1992 and still valid on 11.12.2001 (patent law change 1993)
OR01 Other related matters
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee