CN1144178C - 音频信号编码装置和译码装置以及音频信号编码和译码方法 - Google Patents
音频信号编码装置和译码装置以及音频信号编码和译码方法 Download PDFInfo
- Publication number
- CN1144178C CN1144178C CNB988005271A CN98800527A CN1144178C CN 1144178 C CN1144178 C CN 1144178C CN B988005271 A CNB988005271 A CN B988005271A CN 98800527 A CN98800527 A CN 98800527A CN 1144178 C CN1144178 C CN 1144178C
- Authority
- CN
- China
- Prior art keywords
- mentioned
- quantization
- vector quantizer
- frequency band
- frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 230
- 238000000034 method Methods 0.000 title claims description 59
- 238000013139 quantization Methods 0.000 claims abstract description 529
- 239000013598 vector Substances 0.000 claims description 347
- 238000010606 normalization Methods 0.000 claims description 284
- 238000011002 quantification Methods 0.000 claims description 253
- 239000000203 mixture Substances 0.000 claims description 71
- 238000012545 processing Methods 0.000 claims description 47
- 230000008929 regeneration Effects 0.000 claims description 27
- 238000011069 regeneration method Methods 0.000 claims description 27
- 230000009466 transformation Effects 0.000 claims description 23
- 238000004364 calculation method Methods 0.000 claims description 17
- 230000008676 import Effects 0.000 claims description 16
- 239000000284 extract Substances 0.000 claims description 10
- 230000008569 process Effects 0.000 claims description 10
- 230000015572 biosynthetic process Effects 0.000 claims description 6
- 238000000638 solvent extraction Methods 0.000 claims description 5
- 230000001172 regenerating effect Effects 0.000 claims description 4
- 239000000470 constituent Substances 0.000 claims description 2
- 230000009471 action Effects 0.000 description 16
- 230000006870 function Effects 0.000 description 11
- 101001107782 Homo sapiens Iron-sulfur protein NUBPL Proteins 0.000 description 9
- 102100021998 Iron-sulfur protein NUBPL Human genes 0.000 description 9
- 230000008859 change Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 8
- 230000003044 adaptive effect Effects 0.000 description 7
- 230000000694 effects Effects 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 5
- 238000005070 sampling Methods 0.000 description 5
- 230000006835 compression Effects 0.000 description 4
- 238000007906 compression Methods 0.000 description 4
- 238000006073 displacement reaction Methods 0.000 description 3
- 230000000873 masking effect Effects 0.000 description 3
- 238000011084 recovery Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000005311 autocorrelation function Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000010224 classification analysis Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
- G10L19/038—Vector quantisation, e.g. TwinVQ audio
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
- H03M7/3082—Vector coding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
一种音频信号编码装置和译码装置以及音频信号编码和译码方法,提高在译码装置中即使不使用编码装置的全部信息也可以进行音频信号的再生的编码装置和与其对应的译码装置。将构成编码装置(1)的量化部采用具有由低频、中频、高频的小量化部构成的第1小量化部(501)、进而将第1小量化部(501)的量化误差进行量化处理的第2小量化部(502)和进而将由第1小量化部(501)和第2小量化部(502)进行处理后的量化误差进行量化处理的第3小量化部。
Description
技术领域
本发明涉及将声音信号及音乐信号等音频信号编码的音频信号编码装置。特别是使用正交变换等方法,将音频信号从时间区域变换到频率区域,并且可以比源音频信号用尽可能少的代码串表现的将该变换后的信号有效地进行编码的装置,和使用编码后的信号这样的全部代码串或其一部分代码串,可以将高品质和宽频带的音频信号译码的译码装置以及该音频信号的编码及译码方法。
背景技术
将音频信号有效地进行编码及译码的方法提案了各种各样的方案。音乐信号等具有20KHz以上的频带的音频信号,特别是近年来有MPEG音频方式等。以MPEG方式为代表的编码方式,是使用余弦变换等正交变换将时间轴上的数字音频信号变换为频率轴上的数据,并利用人的听觉上的敏感特性将该频率轴上的信息对听觉上重要的信息进行编码的方式,对听觉上不重要的信息和冗长的信息不进行编码的方式。对于源数字信号的信息量,想用很少的信息量表现时,有使用矢量量化的方法的TC-WVQ等编码方式。MPEG音频和TC-WVQ分别在ISO/IEC标准IS-11172-3和T.Moriya,H.Suga:An 8 Kbitstransform coder for noisy channels,Proc.ICASSP 89,pp196-199等中已作了介绍。下面,使用图24说明先有的音频信号编码装置的结构。
在图24中,1601是将输入信号进行频率变换的FFT部,1602是计算用以将经过频率变换的输入信号中的特定的频带进行编码的最小可听限和利用掩蔽特性计算进行自适应位分配的计算的自适应位分配计算部,1603是将输入信号分割为多个频带的子频带分割部,1604是使用比例因子将分割为多个频带的各成份进行归一化的比例因子归一化部,1605是根据上述自适应位分配计算部1602的位分配将比例因子归一化部1604的归一化输出进行标量量化处理的标量量化部。
下面,说明其动作。输入信号输入FFT部1601和子频带分割部1603。在FFT部1601中,将输入信号进行频率变换,并将其输出输入自适应位分配部1602。在自适应位分配部1602中,根据按人的听觉特性定义的最小可听限和掩蔽特性对某一频带成份计算应供给多少信息量,并将各频带的信息量分配编码为索引(index)。
另一方面,在子频带分割部1603中,将输入信号分割为例如32个频带而输出。并且,在比例因子归一化部1604中,对由上述子频带分割部1603分割的各频带成份以某一代表值进行归一化处理。该归一化的值量化为索引IND1。在标量量化部1605中,根据由上述自适应位分配计算部1602计算的位分配将比例因子归一化部1604的输出进行标量量化处理,并将该量化值编码为索引IND2。
先有的音频信号编码装置按上述方式构成,MPEG音频方式是对每1信道用64000位/秒以上的信息量进行编码所使用的方法,但是,通常在该信息量以下,有时可再生的频带宽度及所译码的音频信号的主观的品质将显著地变坏。其原因在于,如图24所示的例子那样,编码的信息大致由自适应位分配部1602的位分配、比例因子归一化部1604的频带代表值和标量量化部1605的量化值3部分构成,在高压缩率的情况下,信息量未充分地分配给量化值输出。另外,在先有的音频信号编码装置中,通常是采用使编码的信息量和译码的信息量相同来构成编码装置和译码装置的方法。例如,在每秒钟编码为128000位的信息量的方法中,其译码装置就将128000位的信息量译码。
但是,根据上述情况,在先有的音频信号编码装置和译码装置中,为了得到良好的音质,必须用固定的信息量进行编码和译码,这就不能用高压缩率得到高品质的音质。
发明内容
本发明就是为了解决上述问题而提案的,目的旨在提供即使用很少的信息量进行编码和译码也可以得到高品质和宽的再生频带并且可以使编码和译码时的信息量不是固定的值而是可以改变的音频信号编码装置和译码装置以及音频信号编码和译码方法。
此外,本发明的目的还在于提供可以进一步大大提高量化效率的音频信号编码装置和译码装置以及音频信号编码和译码方法。
为了解决上述问题,本发明的技术方案1所述的发明的特征在于:在对将输入音频信号进行频率变换而得到的频率特性信号序列进行矢量量化处理并将音频信号进行编码的音频信号编码装置中,具备至少具有将上述频率特性信号序列或其一部分进行矢量量化处理的第1级矢量量化器和将上述第1级矢量量化器的量化器误差成份进行矢量量化处理的第2级矢量量化器的多级量化单元,上述多级量化单元的各级量化单元具有对将上述频率特性信号序列利用各级的分割方式分割为至少2个以上的在多个级间可以具有重复的部分的频带的多个频带的某一个频带的系数串进行矢量量化处理的至少1个以上的分割化矢量量化器。
本发明的技术方案2所述的发明的特征在于:在技术方案1所述的音频信号编码装置中具有将上述频率特性信号序列进行归一化处理并将其输出供给上述多级量化单元的归一化单元。
本发明的技术方案3所述的发明的特征在于:在技术方案1或2所述的音频信号编码装置中,上述各级量化单元适当地选择量化误差的能量之和大的频带作为应进行量化处理的上述频率特性信号序列的分割的频带进行量化处理。
本发明的技术方案4所述的发明在特征在于:在技术方案1或2所述的音频信号编码装置中,上述各级的量化单元,根据人的听觉上的性质即听觉敏感,特性适当地选择对其重要性高的频带加上大的权重值的量化误差的能量之和大的频带作为应进行量化处理的上述频率特性信号序列的分割的频带,进行量化处理。
本发明的技术方案5所述的发明的特征在于:在技术方案1~4的任一权项所述的音频信号编码装置中,在构成上述多级量化单元的第1级矢量量化器和第2级矢量量化器之间具有第1量化频带选择部,在上述第2级矢量量化器和上述第3级矢量量化器之间具有第2量化频带选择部,上述第1量化频带选择部将上述第1级矢量量化器的量化误差的输出作为其输入,选择应由上述第2级矢量量化器进行量化处理的频带;上述第2量化频带选择部将上述第2级矢量量化器的量化误差的输出作为其输入,选择应由上述第3级矢量量化器进行量化处理的频带。
本发明的技术方案6所述的发明的特征在于:在技术方案5所述的音频信号编码装置中,上述多级量化单元具有,将上述频率特性信号序列的上述分割的各频带的各系数串,由第I级分割的矢量量化器独立地进行量化处理的多个第I级的分割矢量量化器,和作为至少一次将应进行量化处理的输入信号的各频带全部进行量化处理的全频带量化部的第J级矢量量化器。
本发明的技术方案7所述的发明的特征在于:在技术方案1所述的音频信号编码装置中,上述多级量化单元使用前级矢量量化器使用代码薄的矢量量化方法,计算矢量量化中的量化误差,后级矢量量化器对该计算出的量化误差进一步进行矢量量化处理。
本发明的技术方案8所述的发明的特征在于:在技术方案2所述的音频信号编码装置中,上述多级量化单元使用前级矢量量化器使用代码薄的矢量量化方法,计算矢量量化中的量化误差,后级矢量量化器对该计算出的量化误差进一步进行矢量量化处理。
本发明的技术方案9所述的发明的特征在于:在技术方案8所述的音频信号编码装置中,上述多级量化单元的矢量量化器在检索矢量量化处理中的上述代码薄内的最佳代码时使用的代码间的距离的计算中,使用从上述归一化单元输出的输入信号的归一化成份作为权重计算该距离,抽出给定最小距离的代码。
本发明的技术方案10所述的发明的特征在于:在技术方案9所述的音频信号编码装置中,上述多级量化单元的矢量量化器将从上述归一化单元输出的频率特性信号序列的归一化成份和考虑了人的听觉上的性质即听觉敏感特性的值两者作为权重计算上述距离,抽出给定最小距离的代码。
本发明的技术方案11所述的发明的特征在于:在技术方案2和8~10中的任一权项所述的音频信号编码装置中,上述归一化单元具有将上述频率特性信号序列的概形大致地进行归一化处理的频率概形归一化部。
本发明的技术方案12所述的发明的特征在于:在技术方案2和8~10中的任一权项所述的音频信号编码装置中,上述归一化单元具有将上述频率特性信号序列分为多个连续的单位频带的各成份,并通过用1个值除各单位频带的系数串而进行归一化的频带振幅归一化部。
本发明的技术方案13所述的发明的特征在于:在技术方案1所述的音频信号编码装置中,上述多级量化单元具有,将上述频率特性信号序列的上述分割的各频带的各系数串,利用分割化矢量量化器独立地进行量化处理的矢量量化器,和作为至少一次将应进行量化处理的输入信号的各频带全部进行量化处理的全频带量化部的矢量量化器。
本发明的技术方案14所述的发明的特征在于:在技术方案13所述的音频信号编码装置中,上述多级量化单元具有由低频区的分割化矢量量化器、中频区的分割化矢量量化器和高频区的分割化矢量量化器构成的第1矢量量化器,与其后级连接的第2矢量量化器和与其后级连接的第3矢量量化器,将输入该多级量化单元的频率特性信号序列分割为3个频带,由上述低频区的分割化矢量量化器独立地将该3个频带中的低频带成份的频率特性信号序列进行量化处理,由上述中频区的分割化矢量量化器独立地将上述3个频带中的中频的频带成份的频率特性信号序列进行量化处理,由上述高频区的分割化矢量量化器独立地将上述3个频带中的高频带成份的频率特性信号序列进行量化处理,由构成上述第1矢量量化器的各分割化矢量量化器计算对频率特性信号序列的量化误差,将其作为向后级的上述第2矢量量化器的输入,在上述第2矢量量化器中对该第2矢量量化器量化的频带宽度进行量化处理,计算对该第2矢量量化器的输入的量化误差,将其作为向上述第3矢量量化器的输入,在上述第3矢量量化器中,对该第3矢量量化器量化的频带宽度进行量化处理。
本发明的技术方案15所述的发明的特征在于:在技术方案14所述的音频信号编码装置中,在构成上述多级量化单元的第1矢量量化器和第2矢量量化器之间设置第1量化频带选择部,同时,在上述第2矢量量化器和上述第3矢量量化器之间设置第2量化频带选择部,上述第1量化频带选择部将上述第1矢量量化器的输出作为其输入,选择应由上述第2矢量量化器进行量化处理的频带,上述第2矢量量化器对于由上述第1量化选择部选择的频带的由上述3个矢量量化器构成的第1矢量量化器的量化误差,对该第2矢量量化器量化的频带宽度进行量化处理,计算对该第2矢量量化器的输入的量化误差,并将其作为向上述第2量化频带选择部的输入;上述第2量化频带选择部将上述第2矢量量化器的量化误差作为输入,选择应由上述第3矢量量化器进行量化处理的频带,上述第3矢量量化器对于上述第2量化频带选择部选择的频带的上述第2矢量量化器的量化误差,对该第2矢量量化器量化的频带宽度进行量化处理。
本发明的技术方案16所述的发明的特征在于:在技术方案14所述的音频信号编码装置中,使用上述低频区的分割化矢量量化器、中频区的分割化矢量量化器和高频区的分割化矢量量化器构成上述第2矢量量化器或第3矢量量化器,取代上述第1矢量量化器。
本发明的技术方案17所述的发明是一种将技术方案1所述的音频信号编码装置输出的代码作为其输入并将其译码从而输出与原来的输入音频信号相当的信号的音频信号译码装置,其特征在于:具有使用上述音频信号编码装置的量化单元输出的代码的至少一部分进行逆量化处理的逆量化部,和使用作为该逆量化部的输出的频率特性信号序列将频率特性信号序列变换为与原来的音频输入信号相当的信号的逆频率变换部。
本发明的技术方案18所述的发明是一种将技术方案2所述的音频信号编码装置输出的代码作为其输入并将其译码从而输出与原来的输入音频信号相当的信号的音频信号译码装置,其特征在于:具有再生频率特性信号序列的逆量化部及使用作为该逆量化部的输出的频率特性信号序列,根据作为上述音频信号编码装置的输出的代码再生归一化成份,并将上述频率特性信号序列与归一化成份相乘而输出的逆归一化部,和接收该逆归一化的输出并将频率特性信号序列变换为与原来的音频信号相当的信号的逆频率变换部。
本发明的技术方案19所述的发明是一种将技术方案13所述的音频信号编码装置输出的代码作为其输入并将其译码从而输出与原来的输入音频信号相当的信号的音频信号译码装置,其特征在于:具有不论构成上述音频信号编码装置的量化单元的全部还是一部分矢量量化器输出代码时都使用输出的代码进行逆量化处理的逆量化部。
本发明的技术方案20所述的发明的特征在于:在技术方案19所述的音频信号译码装置中,上述逆量化部在某一级的指定频带的量化代码的逆量化之后,交替地进行该指定频带的下一级的量化代码的逆量化处理和与该某一级的该指定频带不同的频带的量化代码的逆量化处理,在不存在该指定频带的下一级的量化代码时,接着就进行不同的频带的量化代码的逆量化处理;在不存在与上述指定的频带不同的频带的量化代码时,接着就进行下一级的量化代码的逆量化处理。
本发明的技术方案21所述的发明是一种将技术方案14所述的音频信号编码装置输出的代码作为其输入并将其译码从而输出与原来的输入音频信号相当的信号的音频信号译码装置,其特征在于:具有不论从构成上述音频信号编码装置的第1矢量量化器的3个分割化矢量量化器全部还是一部分输出代码时都只使用构成上述第1矢量量化器的低频区的分割化矢量量化器的代码进行逆量化处理的逆量化部。
本发明的技术方案22所述的发明的特征在于:在技术方案21所述的音频信号译码装置中,上述逆量化部除了使用构成上述第1矢量量化器的低频区的分割化矢量量化器的代码外,还使用上述第2矢量量化器的代码进行逆量化处理。
本发明的技术方案23所述的发明的特征在于:在技术方案22所述的音频信号译码装置中,上述逆量化部除了使用构成上述第1矢量量化器的低频区的分割化矢量量化器的代码和上述第2矢量量化器的代码外,还使用构成上述第1矢量量化器的中频区的分割化矢量量化器的代码进行逆量化处理。
本发明的技术方案24所述的发明的特征在于:在技术方案23所述的音频信号译码装置中,上述逆量化部除了使用构成上述第1矢量量化器的低频区的分割化矢量量化器的代码、上述第2矢量量化器的代码和构成上述第1矢量量化器的中频区的分割化矢量量化器的代码外,还使用上述第3矢量量化器的代码进行逆量化处理。
本发明的技术方案25所述的发明的特征在于:在技术方案24所述的音频信号译码装置中,上述逆量化部除了使用构成上述第1矢量量化器的低频区的分割化矢量量化器的代码、上述第2矢量量化器的代码、构成上述第1矢量量化器的中频区的分割化矢量量化器的代码和上述第3矢量量化器的代码外,还使用构成上述第1矢量量化器的高频区的分割化矢量量化器的代码进行逆量化处理。
本发明的技术方案26所述的发明是一种接收将输入音频信号进行频率变换而得到的频率特性信号序列、将其编码而输出并将该输出的代码信号作为输入将其译码从而再生与原来的输入音频信号相当的信号的音频信号编码和译码方法,其特征在于:将上述频率特性信号序列分为与至少分割为2个以上的频带的频带相当的系数串,分别独立地进行量化处理而输出,根据接收的已量化的信号,对与上述分割的频带相当的任意的频带的数据进行逆量化处理,再生与原来的音频输入信号相当的信号。
本发明的技术方案27所述的发明的特征在于:在技术方案26所述的音频信号编码和译码方法中,上述量化处理分阶段进行,从而将计算出的量化误差进一步进行量化处理;上述逆量化处理反复交替地进行向扩展频带方向的逆量化处理和向上述量化处理时量化阶段加深的方向的逆量化处理。
本发明的技术方案28所述的发明的特征在于:在技术方案27所述的音频信号编码和译码方法中,向扩展上述频带方向的逆量化处理按考虑了人的听觉心理特性的顺序扩展频带而进行。
本发明的技术方案29所述的发明的特征在于:在技术方案26~28中的任一权项所述的音频信号编码和译码方法中,在编码侧,将上述频率特性信号序列归一化后,将该频率特性信号序列分为与至少分割为2个以上的频带的频带相当的系数串,进行分别独立地量化而输出的处理;在译码侧,使用关于上述编码侧的归一化的代码,将上述编码侧的代码进行逆归一化处理后,对该逆归一化处理后的代码,通过对与上述分割的频带相当的任意的频带的数据进行逆量化处理,再生与原来的音频输入信号相当的信号。
本发明的技术方案30所述的发明是一种对将输入音频信号进行频率变换而得到的频率特性信号序列进行归一化和矢量量化处理并将音频信号进行编码的音频信号编码装置,其特征在于:具备至少具有将上述频率特性信号序列或其一部分进行归一化和矢量量化处理的第1级归一化及矢量量化器,和将上述第1级归一化及矢量量化器的量化误差进行归一化及矢量量化处理的第2级归一化及矢量量化器的多级量化单元,上述多级量化单元的各级量化单元具有至少1个以上的分割化的归一化及矢量量化器,该分割化的归一化及矢量量化器将利用各级的分割方式将上述频率特性信号序列分割为至少2个以上的在多个级间可以具有叠加的部分的频带的多个频带中的某个频带的系数串进行归一化及矢量量化处理。
本发明的技术方案31所述的发明的特征在于:在技术方案30所述的音频信号编码装置中,在构成上述多级量化单元的第1级归一化及矢量量化器和第2级归一化及矢量量化器之间具有第1量化频带选择部,在上述第2级归一化及矢量量化器和上述第3级归一化及矢量量化器之间具有第2量化频带选择部,上述第1量化频带选择部将上述第1级归一化及矢量量化器的量化误差的输出作为其输入,选择应由上述第2级归一化及矢量量化器进行量化处理的频带,并将该选择的频带的量化误差的输出向上述第2级归一化及矢量量化器输出;上述第2量化频带选择部将上述第2级归一化及矢量量化器的量化误差的输出作为其输入,选择应由上述第3归一化及矢量量化器进行量化处理的频带,并将该选择的频带的量化误差的输出向上述第3级归一化及矢量量化器输出。
本发明的技术方案32所述的发明的特征在于:在技术方案31所述的音频信号编码装置中,上述多级量化单元的第2级以后的各级归一化及矢量量化器,适当地选择应进行归一化及量化处理的上述频率特性信号序列的分割的频带中前级的归一化及矢量量化器的输出即量化误差的能量之和大的频带,进行归一化及量化处理。
本发明的技术方案33所述的发明的特征在于:在技术方案31所述的音频信号编码装置中,上述多级量化单元的第2级以后的各级归一化及矢量量化器,在应进行归一化及量化处理的上述频率特性信号序列的分割的频带中,根据人的听觉的性质即听觉敏感特性,适当地选择对其重要性高的频带加权大的值的前级的归一化及矢量量化器的输出即量化误差的能量之和大的频带进行归一化及量化处理。
本发明的技术方案34所述的发明是一种将作为技术方案30~33中的任一权项所述的音频信号编码装置的输出的代码作为其输入并将其译码从而输出与原来的输入音频信号相当的信号的音频信号译码装置,其特征在于:具有接收上述音频信号编码装置的量化部的各量化器的信号并再生与上述频率特性信号序列分割为多个频带的各频带的系数串相当的信号的逆量化部,设置在该多个逆量化部中将作为其输出的频率特性信号序列的系数串,根据关于作为上述音频信号编码装置的输出的归一化的代码而再生的归一化成份相乘,从而输出与编码前的频率特性信号序列的各系数串相当的信号的多个逆归一化部,和接收该多个逆归一化部的输出并将它们变换为与原来的音频信号相当的信号的逆频率变换部。
本发明的技术方案35所述的发明是一种接收将输入音频信号进行频率变换而得到的频率特性信号序列并将其进行编码后输出、将该输出的代码信号作为输入并将其译码从而再生与原来的输入音频信号相当的信号的音频信号编码和译码方法,其特征在于:将上述频率特性信号序列分为与分割为至少2个以上的频带的频带相当的系数串,分别独立地进行归一化及量化处理后输出,从接收的已量化的信号中使用关于编码侧的归一化的代码,通过对与上述分割的频带相当的任意的频带的数据进行逆归一化及逆量化处理,再生与原来的音频输入信号相当的信号。
本发明的技术方案36所述的发明的特征在于:在技术方案35所述的音频信号编码和译码方法中,上述归一化及量化处理分阶段进行,从而对计算出的量化误差进一步进行归一化及量化处理;上述逆归一化及逆量化处理,反复交替地进行向扩展频带的方向的逆归一化及逆量化处理和向上述量化处理时的量化阶段深入的方向的逆归一化及逆量化处理。
本发明的技术方案37所述的发明的特征在于:在技术方案36所述的音频信号编码和译码方法中,向扩展上述频带的方向的逆归一化及逆量化处理,按照考虑了人的听觉心理特性的顺序扩展频带而进行。
本发明的技术方案38所述的发明是一种对将输入音频信号进行频率变换而得到的频率特性信号序列进行矢量量化处理并对音频信号进行编码的音频信号编码装置,其特征在于:具有具备至少具有对上述频率特性信号序列进行矢量量化处理的第1级矢量量化器和对上述第1级矢量量化器的量化误差成份进行矢量量化处理的第2级矢量量化器的多级量化单元,上述多级量化单元的各级量化单元由将上述频率特性信号序列或前级的量化单元的量化误差成份全部进行矢量量化处理的全频带矢量量化器构成。
如上所述,按照本发明的音频信号编码装置和译码装置或者编码和译码方法,量化处理使用矢量量化的方法等,具有在高信息压缩率中也可以进行量化处理的结构,同时,采用将量化处理时的信息量的分配交替地分配对再生频带的扩展有用的信息量和对提高品质有用的信息量的结构,首先,在编码装置中,作为第1阶段,将输入的音频信号变换为频率区域的信号,并将变换后的频率信号的一部分进行编码,作为第2阶段,将未编码的频率信号的一部分和第1阶段的量化误差信号进行编码,并附加到第1阶段的代码上,在第3阶段,进而对未编码的频率信号的一部分和第1阶段及第2阶段的量化误差信号进行编码并附加到第1阶段和第2阶段的代码上,同样,进而继续向下一阶段推进,进行编码;另一方面,在译码装置中,也可以先只使用第1阶段编码的代码进行译码,然后使用第1阶段和第2阶段编码的代码进行译码,进而使用从第1阶段到第3阶段以上的阶段编码的代码进行译码,采用译码的顺序为交替地将对频带扩展有用的代码和对品质提高有用的代码进行译码的结构,所以,即使不使用固定的信息量进行编码和译码,也可以得到良好的音质,另外,还可以用高的压缩率得到高品质的声音。
另外,按照本发明的音频信号编码装置和译码装置或编码还译码方法,在用量化单元进行量化处理之前,设置归一化单元,在对输入音频信号进行归一化处理后进行量化处理,所以,可以进行归一化单元和量化单元完全地发挥各自的能力的编码,不会损失源音频信号所具有的信息量,可以进行量化误差小、量化效率高的量化处理,从而可以根据音频信号的种类而充分发挥其效果。另外,如上所述,通过采用将量化处理时的信息量的分配交替地分配对再生频带的扩展有用的信息量和对品质提高有用的信息量的结构,在限定受信侧的信息量时,就只能在频带窄而浅的区域进行逆量化处理,但是,通过顺序将该逆量化处理交替地向扩展频带的方向和加深逆量化处理的深度的方向扩展,增大受信侧的信息量,则不论从编码装置发信来的信息量如何,都可以将已编码的音频信号的所希望的信息量进行译码,这样,通过根据受信侧的通信环境等改变进行译码的信息量,例如,即使在利用通常的公用电话网时,也可以稳定地得到高品位的音质。
另外,按照本发明的音频信号编码装置和译码装置或编码和译码方法,在进行多级量化处理的量化单元的前级分别设置归一化单元,对分割的各频带并且在各级的量化处理前进行归一化处理后进行量化处理,所以,利用各频带的归一化处理,进行与各频带的音频信号所具有的信息量相应的适当的编码,即进行归一化单元和量化单元可以完全地发挥各自的能力的编码,不会损失源音频信号所具有的信息量,因此,可以进行量化误差小、量化效率高的量化处理,从而可以根据音频信号的种类而充分发挥其效果。另外,如果将译码侧的逆归一化和逆量化处理交替地向扩展量化的频带的方向和加深量化的深度的方向进行,和上述一样,不论从编码装置发信来的信息量如何,都可以将已编码的音频信号的所希望的信息量进行译码,即,可以根据受信侧的通信环境等改变进行译码的信息量,例如,即使利用通常的公用电话网时,也可以稳定地得到高品位的音质。
附图说明
图1是表示本发明的音频信号编码装置和译码装置的总体结构的图。
图2是表示构成上述音频信号编码装置的归一化部的一例的结构图。
图3是表示构成上述音频信号编码装置的频率概形归一化部的一例的结构图。
图4是表示构成上述音频信号编码装置的量化部的实施例1的结构图。
图5是表示构成上述音频信号编码装置的量化部的实施例2的结构图。
图6是表示构成上述音频信号编码装置的量化部的实施例3的结构图。
图7是表示构成上述音频信号译码装置的逆量化部的实施例4的结构图。
图8是表示构成上述音频信号译码装置的逆量化部的实施例4的一例的结构图。
图9是表示构成上述音频信号译码装置的逆量化部的实施例4的其他例的结构图。
图10是表示构成上述音频信号译码装置的逆量化部的实施例4的另一例的结构图。
图11是表示构成上述音频信号译码装置的逆量化部的实施例4的另一例的结构图。
图12是表示逆归一化部的一个实施例的结构图。
图13是用于说明上述编码装置的量化部的详细的动作的图。
图14是用于说明上述译码装置的逆量化部的信息的动作的图。
图15是用于说明上述实施例4的逆量化部的逆量化处理顺序的动作的图。
图16是表示频率概形逆归一化部的一个实施例的结构图。
图17是用于说明先有的和本发明的音频信号编码装置的量化处理的方法的图。
图18是表示本发明的实施例5的音频信号编码装置的量化部的结构图。
图19是用于说明本发明的实施例5的音频信号编码装置的动作全体的波形图。
图20是表示本发明的实施例1~3(图(A))和实施例5(图(B),(C))的音频信号编码装置的概略结构的图。
图21是用于说明本发明的实施例5的音频信号编码装置的动作全体的波形图。
图22是用于说明本发明的实施例5的音频信号编码装置的第1级~第3级归一化及量化单元的归一化和量化处理的方法的一例的图。
图23是用于说明与本发明的实施例5的音频信号编码装置对应的音频信号译码装置的结构的图。
图24是表示先有的音频信号编码装置的结构的图。
具体实施方式
下面,参照附图说明本发明的实施例。
(实施例1)
图1是表示本发明的实施例1的音频信号编码装置和译码装置的总体结构的图。在图1中,1是编码装置,2是译码装置。在编码装置1中,101是将输入信号分割为指定的帧值的帧分割部,102是在时间轴上将输入信号与窗函数相乘的加窗部,103是进行改进离散余弦变换(Modified discrete cosine transform)的MDCT部,104是将帧分割部101的输出即时间轴的信号和MDCT部103的输出即MDCT系数作为输入并将该MDCT系数进行归一化处理的归一化部,105是将已归一化的MDCT系数作为输入进行量化处理的量化部。这里,对作为时间频率变换使用MDCT的情况进行说明,但是,也可以使用离散付利叶变换(DFT:Discrete Fourier Transform)。
在译码装置2中,106是接收从编码装置1输出的信号(索引IND2)并将其进行逆量化处理的逆量化部,107是使用编码装置1的归一化部104的索引IND1将逆量化部106的输出进行逆归一化处理的逆归一化部,108是将逆归一化部107的输出进行改进离散余弦变换的逆MDCT部,109是对逆MDCT部108的输出进行加窗的加窗部,110是对加窗部109的输出进行帧叠加的帧叠加部。
下面,说明按上述方式构成的音频信号编码装置和译码装置的动作。
输入编码装置1的信号,假定是在时间上连续的数字信号序列。例如,假定是将声音信号用采样频率48KHZ量化为16位的数字信号。该输入信号在达到某一一定的采样数之前由帧分割部101进行存储,存储的采样数达到规定的帧长度时,就进行输出。这里,帧分割部101的帧长度是例如128、256、512、1024、2048、4096采样等。在帧分割部101中,也可以根据输入信号的特征改变帧长度而输出。另外,帧分割部101是每隔某一移位长度进行输出的结构,例如,在将帧长度采用4096采样时,如果设定帧长度的一半的移位长度,帧长度具有每隔与达到2048采样相当的时间而输出最新的4096采样等的结构。当然,即使改变帧长度或采样频率,同样也可以具有将移位长度设定为帧长度的一半的结构。
并且,该帧分割部101的输出分别输入后级的加窗部102和归一化部104。在加窗部102中,对上述帧分割部101的输出信号在时间轴上乘以窗函数,作为加窗部102的输出。其形式可以用例如(1)式表示。
hxi=hi·xi i=1,2,…,N
其中,XI是帧分割部101的输出,HI是窗函数,HXI是加窗部102的输出。另外,I是时间的下标。在(1)式中所示的窗函数HI是一例,窗函数不一定必须是(1)式所示的那样。窗函数的选择,依赖于输入加窗部102的信号的特征、帧分割部101的帧长度和在时间上前后帧的窗函数的形状。例如,作为输入加窗部102的信号的特征,设帧分割部101的帧长度为N时,计算每隔N/4输入的信号的平均功率,该平均功率发生非常大的变化时,就选择使帧长度比N短而进行(1)式所示的运算等。另外,最好根据前一时刻的帧的窗函数的形状和后面的帧的窗函数的形状适当地选择使当前时刻的帧的窗函数的形状没有畸变。
其次,加窗部102的输出,输入MDCT部103。在此进行改进离散余弦变换,并输出MDCT系数。改进离散余弦变换的一般式可以用(2)式表示。
n0=N/4+1/2 (k=0,1,…,N/2-1)
这样,假设作为MDCT部103的输出的MDCT系数用(2)式的YK表示,则MDCT部103的输出就表示频率特性,YK的变量K越接近0,低频成份越与从0增大到接近N/2-1的高频成份线性地对应。在归一化部104中,将作为帧分割部101的输出的时间轴上的信号XI和作为MDCT部103的输出的MDCT系数YK作为输入,使用其几个参量将MDCT系数进行归一化处理。这里,所谓MDCT系数的归一化,就是要抑制在低频成份和高频成份部分的大小有非常大的差别的MDCT系数的大小的偏差,例如,相对于高频成份,低频成份非常大时,就选择在低频成份中成为大的值,在高频成份中成为小的值的参量,通过用此参量除上述MDCT系数,来抑制MDCT系数的大小的偏差。另外,在归一化部104中,将表现归一化所使用的参量的索引IND1进行编码。
在量化部105中,就将由归一化部104进行归一化处理后的MDCT系数作为输入,进行MDCT系数的量化处理。这时,该量化部105输出使该量化处理后的值与和位于代码薄中的多个代码索引对应的各量化输出之间的差别为最小的代码索引。这时,由上述量化部105进行量化处理后的值与和从该量化部105输出的代码索引对应的值之差就是量化误差。
另一方面,在译码装置2中,使用编码装置1的归一化部104的索引IND1和量化部105的索引IND2进行译码。在逆量化部106中,使用量化部105的索引IND2再生在上述编码装置1中进行归一化处理时刻的MDCT系数。在逆量化部106中,既可以使用全部索引也可以使用一部分索引进行MDCT系数的再生。当然,归一化部104的输出和逆量化部106的输出伴有量化部105进行量化处理时的量化误差,所以,与进行量化处理前的状态不一定一致。
在逆归一化部107中,根据编码装置1的归一化部104的索引IND1对在编码装置1中进行归一化处理所使用的参量进行复原,将逆量化部106的输出与该参量相乘,进行MDCT系数的复原。在逆MDCT部108中,根据作为逆归一化部107的输出的MDCT系数进行逆MDCT处理,从而进行从频率区域的信号向时间区域的信号的复原。上述逆MDCT计算,可以用例如(3)式表示。
n0=N/4+1/2
其中,YYK是由逆归一化部107所复原的MDCT系数,XX(N)是逆MDCT系数,将其作为逆MDCT部108的输出。
在加窗部109中,使用逆MDCT部108的输出XX(N)进行加窗处理。加窗处理是使用在编码装置1的加窗部102中使用的窗函数进行例如由(4)式所示的处理。
Z(I)=XX(I)·HI (4)
其中,Z(I)是加窗部109的输出。
在帧叠加部110中,使用加窗部109的输出再生音频信号。由于加窗部109的输出成为在时间上重复的信号,所以,在帧叠加部110中,使用例如(5)式作为译码装置2的输出信号。
out(i)=zm(i)+zm-1(i+SHIFT) (5)
其中,ZM(I)是第M时刻的帧的第I个加窗部109的输出信号,ZM-1(I)是第M-1时刻的帧的第I个加窗部109的输出信号,SHIFT是与编码装置的帧长度相当的采样数,OUT(I)是在帧叠加部110的第M时刻的帧的译码装置2的输出信号。
下面,使用图2说明上述归一化部104的详细的一例。在图2中,201是接收帧分割部101和MDCT部103的输出的频率概形归一化部,202是接收频率概形归一化部201的输出并参照频带表203进行归一化处理的频带振幅归一化部。
下面,说明其动作。在频率概形归一化部201中,使用帧分割部101的时间轴上的数据输出计算作为大致的频率的概形的频率概形,并用其除作为MDCT部103的输出的MDCT系数。表现频率概形所使用的参量,编码为索引IND1。在频带振幅归一化部202中,将频率概形归一化部201的输出信号作为输入,对在频带表203中所示的各频带进行归一化处理。例如,设作为频率概形归一化部201的输出的MDCT系数为DCT(I)(I=0~2047)、频带表203为例如(表1)所示的那样,就使用(6)式等计算各频带的振幅的平均值。
(表1)
其中,bjlow,bjhigh分别表示频带表203所示的第J频带的DCT(I)所属的最低频的索引I和最高频的索引I。另外,P是进行距离计算中的范数,最好为2等数值。
avej是各频带号码J的振幅的平均值。在频带振幅归一化部202中,将avej进行量化处理,计算qavej,使用例如(7)式进行归一化处理。n_dct(i)=dct(i)/qavej bjlow≤i≤bjhigh (7)
avej的量化,既可以使用标量量化,也可以使用代码薄进行矢量量化处理。在频带振幅归一化部202中,将表现qavej所使用的参量的索引IND1进行编码。
编码装置1的归一化部104的结构,此处表示了使用图2的频率概形归一化部201和频带振幅归一化部202的结构,但是,也可以是只使用频率概形归一化部201的结构,或只使用频带振幅归一化部202的结构。此外,当在MDCT部103输出的MDCT系数的低频成份和高频成份中没有大的偏差时,也可以采用不使用两者的结构而将MDCT部103的输出信号直接输入量化部105的结构。
下面,使用图3说明图2的频率概形归一化部201的详细情况。在图3中,301是接收帧分割部101的输出的线性预测分析部,302是接收线性预测分析部301的输出的概形量化部,303是接收MDCT部103的输出的包络特性归一化部。
下面,说明上述频率概形归一化部201的动作。在上述线性预测分析部301中,将帧分割部101的时间轴上的音频信号作为输入,进行线性预测分析。线性预测分析的线性预测系数,通常可以通过计算加重平均窗等的加窗的信号的自相关函数并求解标准方程等而计算。计算出的线性预测系数变换为线频谱对系数(LSP(Line Spectrum Pair)系数)等,由概形量化部302进行量化处理。作为量化方法,既可以使用矢量量化,也可以使用标量量化。并且,由包络特性归一化部303计算由概形量化部302进行量化处理的参量所表现的频率传递特性,并通过用其除作为MDCT部103的输出的MDCT系数进行归一化处理。作为具体的计算例子,假定与由概形量化部302进行量化处理的参量等价的线性预测系数为qlpc(i),则由包络特性归一化部303计算的上述频率传递特性可以用例如(8)式表示。
env(i)=1/fft(li)
其中,ORDER最好为10~40。fftO表示高速傅利叶变换。在包络特性归一化部303中,使用计算出的频率传递特性env(i)利用例如以下所示的(9)式进行归一化处理。
fdct(i)=mdct(i)/env(i) (9)
其中,mdct(i)是MDCT部103的输出信号,fdct(i)是进行归一化处理的包络特性归一化部303的输出信号。
下面,使用图4说明编码装置1的量化部105的详细情况。在图4中,401是第1小量化部,402是接收第1小量化部401的输出的第2小量化部,403是接收第2小量化部402的输出的第3小量化部。
下面,说明上述量化部105的动作。输入上述第1小量化部401的信号是编码装置的归一化部104的输出,是进行了归一化处理的MDCT系数。但是,在不具有归一化部104的结构中,就成为MDCT部103的输出。在第1小量化部401中,将输入的MDCT系数进行标量量化处理或矢量量化处理后,将表现量化处理时所使用的参量的索引进行编码。另外,计算量化处理引起的对MDCT系数的量化误差,并将其向第2小量化部402输出。这里,在第1小量化部401中,可以将全部MDCT系数进行量化处理,也可以只将一部分进行量化处理。当然,只将一部分进行量化处理时,未由第1小量化部401进行量化处理的频带的量化误差就是未进行量化处理的频带的输入MDCT系数本身。
其次,在第2小量化部402中,将第1小量化部401的MDCT系数的量化误差作为输入,并进而将其进行量化处理。这时的量化也和第1小量化部401一样,可以使用标量量化处理,也可以使用矢量量化处理。并且,在第2小量化部402中,对表现量化处理所使用的参量的索引进行编码。另外,计算量化处理所引起的量化误差,并将其向第3小量化部403输出。该第3小量化部403的结构和上述第2小量化部相同。这里,上述第1小量化部401、第2小量化部402、第3小量化部403进行量化处理的MDCT系数的个数即频带宽度不一定必须是均匀的,另外,进行量化处理的频带也不必相同。这时,最好考虑人的听觉特性,第2小量化部402和第3小量化部403都设定为将表示低频成份的MDCT系数的频带进行量化处理。
这样,按照本实施例1的音频信号编码装置,进行量化处理时,按层次设置量化部即构成多级量化部,通过改变前级和后级的量化部进行量化处理的频带宽度,将输入MDCT系数中与任意的频带例如对人说来在听觉上重要的低频成份相当的系数重点地进行量化处理,所以,即使以低位速率即高的压缩率将音频信号进行编码时,在受信侧也可以进行高品位的声音的再生。
(实施例2)
下面,使用图5说明本发明的实施例2的音频信号编码装置。在本实施例2中,由于只有编码装置1的量化部105的结构与上述实施例1不同,所以,这里只说明量化部的结构。在图5中,501是第1小量化部,502是第2小量化部,503是第3小量化部。和上述实施例1结构不同的地方,是第1小量化部501将输入MDCT系数分割为3个频带(高频、中频、低频)独立地进行量化处理,构成该第1小量化部501的各频带的量化部与所谓的“分割化矢量量化器”相当。通常,在使用矢量量化的方法进行量化处理时,可以从输入MDCT系数中抽出几个要素构成矢量,进行矢量量化处理。在本实施例2的第1小量化部501中,从输入MDCT系数中抽出几个要素构成矢量时,就成为低频的量化只使用低频的要素进行矢量量化处理、中频的量化只使用中频的要素进行矢量量化处理、高频的量化只使用高频的要素进行矢量量化处理的结构。
在本实施例2中,以进行量化处理时分割为低频、中频、高频的3个频带的方法作为一例进行说明的,但是,分割的频带的数也可以是3以外的数。另外,对于第2小量化部502、第3小量化部503也和第1小量化部501一样,可以采用将频带分割为几个进行量化处理的结构。
这样,按照本实施例2,在多级量化单元中,首先,在第1级中,将输入MDCT系数分割为3个频带独立地进行量化处理,所以,在进行第1次的量化处理时可以进行优先将听觉上重要的频带进行量化处理等的处理,在后级的量化部502、503中,进而通过分阶段进行该听觉上重要的频带的MDCT系数的量化处理,可以进一步减小量化误差,从而在受信侧可以再现更高品位的音质。
(实施例3)
下面,使用图6说明本实施例3的音频信号编码装置。在本实施例3中,由于只有编码装置1的量化部105的结构与上述实施例1不同,所以,这里只说明量化部的结构。在图6中,601是第1小量化部,602是第1量化频带选择部,603是第2小量化部,604是第2量化频带选择部,605是第3小量化部。和上述实施例2结构不同的是,增加了第1量化频带选择部602和第2量化频带选择部604。
下面,说明其动作。在上述第1量化频带选择部602中,使用作为第1小量化部601的量化误差的输出计算应由第2小量化部602将哪个频带的MDCT系数进行量化处理。例如,计算使由(10)式给定的esum(j)为最大的J,可以将从J*OFFSET到J*OFFSET+BANDWIDTH的频带进行量化处理。
其中,OFFSET是常数,BANDWIDTH是与第2小量化部603进行量化处理的频带宽度相当的总采样。在第1量化频带选择部602中,例如,将(10)式中给定esum(j)的最大值的J等进行编码后,作为索引IND2。在第2小量化部603中,接收该索引IND2,将由第1量化频带选择部602选择的频带进行量化处理。第2量化频带选择部604将第2小量化部603的量化误差的输出作为其输入,并将该第2量化频带选择部604所选择的频带输入上述第3小量化部605与其相除,可以采用和上述第1量化频带选择部602相同的结构而实现。
以上,说明了在第1量化频带选择部602和第2量化频带选择部604中使用(10)式选择下一个量化部应进行量化处理的频带的结构,但是,也可以使用将(11)式的在归一化部104中进行归一化处理所使用的值与考虑了与人的频率对应的相对的听觉敏感特性的值相乘的值计算应进行量化处理的频带。
其中,env(i)是用归一化部104的输出与MDCT部103的输出相除后的值,zxc(i)是考虑了与人的频率对应的相对的听觉敏感特性的表,将其一例示于(表2)。另外,在(11)式中,也可以是将zxc(i)全部作为1而未考虑在内的结构。
此外,量化频带选择部可以采用不一定必须设置多个而只使用第1量化频带选择部602的结构或只使用第2量化频带选择部604的结构。
这样,在本实施例3中,在由多级量化单元分进行多级量化处理时,通过在前级的量化部和后级的量化部之间设置量化频带选择部,改变并适当地选择进行量化处理的频带,可以根据输入信号适当地改变进行量化处理的频带,并可提高量化的完全度,从而可以重点地将需要量化的部分进行量化处理,大大提高量化效率。
下面,使用图1~图13说明上述实施例1~3的编码装置1的量化部106的量化方法的详细的动作。输入各小量化部的MDCT系数1401,从该MDCT系数1401中抽出几个构成声源子矢量1403。同样,在归一化部104中,将用作为归一化部104的输出的MDCT系数除作为归一化部104的输入的MDCT系数后的系数串作为归一化成份1402时,对于该归一化成份1402,也可以按照和从MDCT系数1401中抽出声源子矢量1403相同的规则从该归一化成份1402中抽出,构成加权子矢量1404。这样,从MDCT系数1401和归一化成份1402中分别抽出声源子矢量1403和加权子矢量1404的规则,有例如由(14)式所示的方法等。
其中,第I个声源子矢量的第J个要素为subvector(j),MDCT系数1401是vectorO,MDCT系数1401的总要素数为TOTAL,声源子矢量1403的要素数为CR,VTOTAL是与TOTAL相同的值或大于TOTAL的值,VTOTAL/CR设定为整数值。例如,TOTAL为2048时,CR为19、VTOTAL为2052、CR为23、VTOTAL为2070、CR为21、VTOTAL为2079等。对于加权子矢量1404,也可以按(14)式的顺序抽出。
在矢量量化器1405中,从代码薄1409中的代码矢量中检索与声源子矢量1403的距离由加权子矢量1404进行加权而成为最小的代码矢量,并输出给定该最小距离的代码矢量的索引IND2和与给定最小距离的代码矢量与输入声源子矢量1403的量化误差相当的残差子矢量1410。作为实际的计算顺序例子,说明该矢量量化器1405具有距离计算单元1406、代码决定单元1407和残差生成单元1408等3个结构要素的情况。在距离计算单元1406中,使用例如(15)式计算第I个声源子矢量1403与代码薄1409的第K个代码矢量的距离。
其中,wj是加权子矢量的第J个要素,ck(j)是第K个代码矢量的第J个要素,R、S是距离计算的范数,作为R、S的值,最好为1、1.5、2等值。该距离计算的范数R和S不必是相同的数值。dik表示第K个代码矢量与第I个声源子矢量的距离。在代码决定单元1407中,选出按(15)式等计算的距离中最小的代码矢量,并将其索引进行编码(IND2)。例如,diu为最小值时,对第I个子矢量编码的索引为U。在残差生成单元1408中,使用由代码决定单元1407选出的代码矢量,用(16)式生成残差子矢量1410。
resi(j)=subvectori(j)-cu(j) (16)其中,第I个残差子矢量1410的第J个要素是resi(j),将由代码决定单元1407选出的第U个代码矢量的第J个要素作为cu(j)。残差子矢量1410通过进行(14)式的逆过程等,作为其以后的小量化部的量化对象的MDCT系数而进行保持。但是,在某一频带的量化进行对其以后的小量化部没有影响的频带的量化处理时,即以后的小量化部不进行量化处理时,残差生成单元1408就不必生成残差子矢量1410和MDCT系数1411。另外,代码薄1409具有的代码矢量的个数为几个都可以,若考虑存储容量和计算时间等因素时,则最好约为64个。
作为上述矢量量化器1405的其他实施例,也可以采用以下的结构。即,在距离计算单元1406中,使用(17)式计算距离。
其中,K是代码薄1409的代码检索所使用的代码矢量的总数。
在代码决定单元1407中,选出给定由(17)式计算的距离dik的最小值的k,并将其索引进行编码(IND2)。但是,k是从0到2K-1的值。在残差生成单元1408中,使用(18)式生成残差子矢量1410。
代码薄1409具有的代码矢量为几个都可以,但是,若考虑存储器的容量和计算时间等因素,最好采用约64个。
另外,作为加权子矢量1404,只说明了根据归一化成份1402而生成该加权子矢量的结构,但是,进而将考虑了人的听觉特性的权重乘以加权子矢量1404,也可以生成加权子矢量。
按照上述本实施例3,在第1小量化部和第2小量化部之间设置第1量化频带选择部,在第2小量化部和第3小量化部之间设置第2量化频带选择部,改变并适当地选择由上述第2小量化部和第3小量化部进行量化处理的频带,所以,可以根据输入信号适当地改变进行量化处理的频带,提高量化的完全度,从而可以重点地将需要量化的部分进行量化处理,大大提高量化效率。
此外,在上述实施例1~3中,在对输入音频信号进行频率变换而得到的频率特性信号序列进行矢量量化处理并对音频信号进行编码的音频信号编码装置中,可以采用至少具有将上述频率特性信号序列或其一部分进行矢量量化处理的第1级矢量量化器和将上述第1级矢量量化器的量化误差成份进行矢量量化处理的第2级矢量量化器的多级量化单元的结构,同时该多级量化单元的各级的量化单元可以采用具有对将上述频率特性信号序列利用各级的分割方式分割为至少2个以上的在多个级间可以具有重复的部分的频带的多个频带中的某一个频带的系数串进行矢量量化处理的至少1个以上的分割化矢量量化器的结构。利用这样的结构,对输入MDCT系数中与任意的频带例如对人说来听觉上重要的低频成份相当的系数重点地量化处理到所希望的深度,另一方面,在译码侧,可以使用多个阶段的已编码的代码进行译码,另外,可以采用译码的顺序为交替地对频带扩展有用的代码和对品质提高有用的代码进行译码的结构,这样,即使是以低位速率即高的压缩率进行音频信号编码的情况,以及即使不是按固定的信息量进行编码和译码,在受信侧也可以进行高品位的声音的再生。
(实施例4)
下面,使用图1、图7~图11说明本发明的实施例4的音频信号译码装置。作为编码装置1的输出的索引,大致分为归一化部104输出的索引IND1和量化部105输出的索引IND2。
归一化部104输出的索引IND1由逆归一化部107进行译码,量化部105输出的索引IND2由逆量化部106进行译码。这里,在逆量化部106中,可以只使用量化部105输出的索引IND2的一部分进行译码。
即,下面,说明将编码装置1的量化部105的结构采用图5所示的结构时在译码装置2中使用具有图7的结构的逆量化部进行逆量化处理的情况。在图7中,701是第1低频成份的逆量化部。在该第1低频成份的逆量化部701中,只使用第1小量化部501的低频成份的索引IND21进行译码。
通过这样处理,在第1低频成份的逆量化部701中,通过只使用第1小量化部501的低频成份的索引进行译码,不论从编码装置1发信来的信息量如何,都可以将已编码的音频信号的所希望的信息量进行译码。即,即使在受信侧进行译码的信息量有限制的情况下,也可以使编码的信息量和译码的信息量为不同的值而只对所希望的信息量进行译码。因此,可以根据在受信侧的通信环境等改变译码的信息量,例如,即使在利用通常的公用电话网的情况下,也可以稳定地得到高品位的音质。
图8是表示按2阶段进行逆量化处理时的音频信号译码装置的逆量化部的结构的图,在图8中,704是第2逆量化部。在该第2逆量化部704中,使用第2小量化部502的索引IND3进行译码。因此,将第1低频成份的逆量化部701的输出IND21’与第2逆量化部704的输出IND3’之和作为逆量化部106的输出信号而输出。但是,这里的两者之和是对与在量化处理时各小量化部所量化处理的频带相同的频带进行相加而计算的。
这样,利用第1低频成份的逆量化部701将第1小量化部(低频)的索引IND21进行译码同时将第2小量化部的索引IND3进行逆量化处理时,通过将上述第1低频成份的逆量化部701的输出IND21’与该逆量化处理的对象相加后进行逆量化处理,便可按2阶段进行逆量化处理,以及可以正确地将按多阶段量化的音频信号进行译码,从而可以得到更高品质的音质。
另外,图9是表示按2阶段进行逆量化处理时将作为对象的频带扩大而进行的音频信号译码装置的逆量化部的结构的图,在图9中,702是第1中频成份的逆量化部。在该第1中频成份的逆量化部702中,使用第1小量化部501的中频成份的索引IND22进行译码。因此,第1低频成份的逆量化部701的输出IND21’、第2逆量化部704的输出IND3’和第1中频成份的逆量化部702的输出IND22’之和就作为逆量化部106的输出信号而输出。但是,这里的三者之和是对与量化处理时各小量化部所量化处理的频带相同的频带进行相加而计算的。通过这样处理,便可扩大再生的声音的频带,从而可以进行更高品质的音频信号的再生。
另外,图10是表示在具有图9的结构的逆量化部中按3阶段进行逆量化处理的级数时的音频信号译码装置的逆量化部的结构的图,在图10中,705是第3逆量化部。在第3逆量化部705中,使用第3小量化部503的索引进行译码。因此,第1低频成份的逆量化部701的输出IND21’、第2逆量化部704的输出IND3’、第1中频成份的逆量化部702的输出IND22’与第3逆量化部705的输出IND4’之和就作为逆量化部106的输出信号而输出。但是,这里的四者之和是对与量化处理时各小量化部所量化处理的频带相同的频带进行相加而计算的。
此外,图11是表示在具有图10的结构的逆量化部中按3阶段进行逆量化处理时将作为对象的频带扩大而进行的音频信号译码装置的逆量化部的结构的图,在图11中,703是第1高频成份的逆量化部。在第1高频成份的逆量化部703中,使用第1小量化部501的高频成份的索引进行译码。因此,第1低频成份的逆量化部701的输出IND21’、第2逆量化部704的输出IND3’、第1中频成份的逆量化部702的输出IND22’、第3逆量化部705的输出IND4’与第1高频成份的逆量化部703的输出IND23’之和就作为逆量化部106的输出信号而输出。但是,这里的五者之和是对与量化处理时各小量化部所量化处理的频带相同的频带进行相加而计算的。
在本实施例4中,以逆量化部106将由具有图6的结构的量化部105所量化的信息进行逆量化处理的情况为例进行了说明,但是,量化部105的结构为图4或图5所示的结构时也同样可以进行。
另外,作为量化部,使用上述图5所示的结构的量化部进行编码、作为其逆量化部使用具有图11所示的结构的逆量化部进行译码时,如图15所示,将第1小量化部的低频的索引进行逆量化处理后,将下一级的第2小量化部502的索引进行逆量化处理,然后再次将第1小量化部的中频的索引进行逆量化处理,就这样反复交替地进行用于扩大频带的逆量化处理和用于减小量化误差的逆量化处理,使用具有图11所示的结构的逆量化部将由图4所示的结构的量化部所编码的信号进行译码时,在图4的结构中,由于没有分割的频带,所以,顺序进行将由下级的量化部所量化的系数进行译码的处理。
下面,使用图1和图14说明构成上述译码装置2的逆量化部106的详细的动作。逆量化部106具有例如图7所示的逆量化部时,由第1低频的逆量化部701构成,具有图8所示的逆量化部时,由第1低频的逆量化部701和第2逆量化部704这2个逆量化部构成。
矢量逆量化器1501使用矢量量化器105的索引IND2进行MDCT系数的再生。小量化部具有图7所示的结构时的逆量化处理,根据索引IND21将索引号码进行译码,并从代码薄1502中选出该号码的代码矢量。假定代码薄1502的内容和编码装置1的代码薄相同。从该选出的代码矢量中可以得到再生子矢量1503,这就是按(14)式的逆过程进行了逆量化处理的MDCT系数(I,J)1504。
另外,小量化部具有图8所示的结构时的逆量化处理,根据索引IND21和索引IND3将索引号码K进行译码,从代码薄1502中选出按(19)式计算的号码U的代码矢量。
再生子矢量使用(20)式生成。
其中,假定第I个再生子矢量的第J个要素为resi(j)。
下面,使用图1和图12说明构成音频信号译码装置的逆归一化部107的详细的结构。在图12中,1201是频率概形逆归一化部,1202是频带振幅逆归一化部,1203是频带表。频率概形归一化部1201将频率概形归一化部201的索引IND11作为输入,再生频率概形,并将上述频率概形与逆量化部106的输出相乘而输出。在频带振幅逆归一化部1202中,将频带振幅归一化部202的索引IND12作为输入,并与频带表1203所示的各频带的振幅值相乘而复原。假定使用频带振幅归一化部202的索引IND12所复原的各频带的值为qavej,则频带振幅逆归一化部1202的运算由(12)式给出。
dct(i)=n_dct(i)·qavej bjlow≤i≤bjhigh (12)
其中,设频率概形逆归一化部1201的输出为n_dct(i),频带振幅逆归一化部1202的输出为dct(i)。另外,频带表1203和图2的频带表203一样。
下面,使用图16说明构成译码装置2的频率概形逆归一化部1201的详细的结构。在图16中,1301是概形逆量化部,1302是包络特性逆归一化部。在概形逆量化部1301中,使用编码装置1的概形量化部301的索引IND13将表示频率概形的参量例如线性预测系数等复原。如果所复原的系数是线性预测系数,则通过进行与例如(8)式同样的计算,复原所量化的包络特性E13。所复原的系数不是线性预测系数时,例如是LSP系数等时,就将其变换为频率特性,后,复原包络特性E13。在包络特性逆量化部1302中,如(13)式所示的那样,将复原的包络特性E13与逆量化部106的输出IND16相乘而输出,并输入频带振幅逆归一化部1201。
mdct(i)=fdct(i)·env(i) (13)
按照这样的本实施例4,在由量化单元进行量化处理之前,设置归一化单元,在进行输入音频信号的归一化处理后进行量化处理,所以,可以进行归一化单元和量化单元完全地发挥各自的能力的编码,从而可以进行不会损失源音频信号所具有的信息量、量化误差小、量化效率高的量化处理。另外,在受信侧的信息量已限定时,只能在频带窄而浅的区域进行逆量化处理,但是,通过将该逆量化处理顺序交替地向扩展频带的方向和加深逆量化处理的深度的方向扩展,增大受信侧的信息量,不论从编码装置1发信来的信息量如何,都可以将已编码的音频信号的所希望的信息量进行译码。因此,通过根据受信侧的通信环境等改变进行译码的信息量,即使在例如利用通常的公用电话网的情况下,也可以稳定地得到高品位的音质。
(实施例5)
下面,使用图18说明本发明的实施例5的音频信号编码装置。在本实施例5中,只有编码装置1的量化部105的结构与上述实施例不同,所以,这里只说明量化部的结构,对其他结构则省略其说明。
在图18中,1801是第1归一化部,1802是第1小量化部,1803是第1量化频带选择部,1804是第2归一化部,1805是第2小量化部,1806是第2量化频带选择部,1807是第3归一化部,1808是第3小量化部,1809是第3量化频带选择部。
和实施例3结构不同的地方是,附加了第2和第3归一化部1804和1807。
下面,说明本实施例5的各结构要素。第1、第2、第3归一化部1801、1804、1807可以利用和实施例1的归一化部104相同的结构实现。另外,第1、第2、第3小量化部1802、1805、1808可以利用和实施例3的第1小量化部601相同的结构实现。另外,第1、第2、第3量化频带选择部1803、1806、1809可以利用和实施例3的第1量化频带选择部602相同的结构实现。在本实施例5中,说明具有3组由归一化部、小量化部和量化频带选择部这三者构成的组合的情况,但是,该组合也可以不是3组,可以是4组以上,也可以是2组。另外,最后一级的1组的量化频带选择部有时不一定需要,可以省略。
下面,说明图18的本实施例5的编码装置的动作。
在图18中,输入本实施例5的输入音频信号的MDCT系数首先由第1归一化部1801进行归一化处理,并输出归一化后的MDCT系数。在第1小量化部1802中,将作为第1归一化部1801的输出信号的已归一化的MDCT系数进行量化处理。在第1小量化部1802中,将量化处理所使用的参量作为索引,进而将在这时的量化处理中产生的量化误差向下一级的量化频带选择部1803输出。在第1量化频带选择部1803中,使用第1小量化部1802的输出计算在第2小量化部1805中应将哪个频带的MDCT系数进行量化处理。
在第2归一化部1804中,根据第1量化频带选择部1803的频带选择结果,对该选择的频带将作为第1小量化部1802的输出的MDCT系数进行归一化处理。在第2小量化部1805中,将第2归一化部1804的输出进行量化处理,并将这时的量化处理所使用的参量作为索引而输出,同时也输出在这时的量化处理中产生的量化误差。在第2量化频带选择部1806中,使用第2小量化部1805的输出计算在第3小量化部1808中应将哪个频带的MDCT系数进行量化处理。
在第3归一化部1807中,根据第2量化频带选择部1806的频带选择结果,对该选择的频带将作为第2小量化部1805的输出的MDCT系数进行归一化处理。在第3小量化部1808中,将第3归一化部1807的输出进行量化处理,并将这时的量化处理所使用的参量作为索引而输出,同时也输出在这时的量化处理中产生的量化误差。
图中所示的第3量化频带选择部1809是在后级进而存在第4小量化部(图中未示出)时所需要的要素。如果存在第4小量化部,该第3量化频带选择部1809就使用第3小量化部1808的输出计算在第4小量化部中应将哪个频带的MDCT系数进行量化处理。第1、第2、第3归一化部1801、1804、1807都和实施例1的归一化部105一样,将归一化处理所使用的参量作为索引而输出。
下面,通过与上述实施例1~3的编码装置进行比较而说明本实施例5的编码装置的动作和作用的特征。
在具有上述实施例1~3的音频信号编码装置的归一化单元的结构中,如图19(A)所示,将时间轴上的声音信号波形利用MDCT和FFT变换为频率轴上的波形,如图20(A)所示,对该频率轴上的波形的全频率范围利用归一化单元进行该归一化A即概形抽出与由该抽出的概形的振幅值的除法运算,然后,对该归一化输出按将上述全频率范围分割的例如3个频率区域即低频区域、中频区域、高频区域进行量化处理X,Y,Z,这样,便可得到量化输出=A(X+Y+Z)。
与此相反,如图20(B)所示,本实施例5在上述分割化的各量化单元的前级分别具有归一化单元α、β、γ,首先,如图19(D)所示的那样,将频率轴上的波形分割为多个频带后,对各分割的频带分别进行归一化和量化处理,所以,结果便是得到量化输出=αX+βY+γZ。其全体的情况进而示于图21。
通常,在音频信号的频率特性中有非常偏倚的情况时,例如,像声音信息那样是集中在低频区域的信号时,就总体地将其大致地进行归一化处理了,从而不能重点地将有上述低频区域的特征的地方进行归一化和量化处理。即,总体的大致的归一化,在信号变化的细微的地方不能获得信号的包络线,从而将损失该信号变化的细微处的信息。因此,在进行这样的归一化处理之后进行量化处理,即使量化器完全地发挥自己的能力,对于未扩展的信号变化的细微处的信息也已进行了量化处理,也就是进行了没有太大意义的量化处理。换言之,就是进行了难于使归一化和量化一致的量化处理。即,如果设置归一化单元,就可以使归一化单元和量化单元完全地发挥各自的能力,相反,在非常粗略的信号时,即使单纯将其全体大致地进行归一化处理,结果也几乎是不变化的。
这里,图20(A)是表示具有图1所示的归一化部104的上述实施例1~3的音频信号编码装置的归一化单元与各量化单元的关系的图,对于归一化单元A将输入音频信号的频率特性信号序列全体进行归一化处理的结构,如上所述,在输入音频信号有例如集中在低频区域那样的在频率上偏倚的信号时,可以认为就是归一化单元和量化单元不能完全地发挥各自的能力的结构。
与此相反,如图20(B)所示的那样,在各量化单元X、Y、Z分别在其前级具有归一化单元α、β、γ的本实施例5的结构中,对于各量化单元要进行量化处理的各对象的信号进行归一化处理,所以,各归一化单元可以进行使考虑了要进行量化处理的各量化单元的负荷的最佳的归一化即各应进行量化处理的信号的电平具有各量化单元可以完全地发挥其能力的电平的归一化处理,从而可以获得将归一化单元与量化单元组合的最大的效果。
即,本实施例5的编码装置的归一化部和量化部的结构如图20(B)所示的那样,是对于将输入音频信号进行频率变换而得到的频率特性信号序列或分割该频率特性信号序列的频带的某一频带A的系数串,首先由第1级的归一化单元α和量化单元X进行归一化和量化处理,并且,由第2级的归一化单元β和量化单元Y对与上述第1级的频带A的系数串相邻的频带B的系数串进行归一化和量化处理,此外,由第3级的归一化单元γ和量化单元Z对与上述第2级的频带B的系数串相邻的频带C的系数串进行归一化和量化处理的结构。
或者,如图20(C)所示的那样,是第2级的归一化单元β和量化单元Y在与上述第1级的频带A具有一部分叠加而相邻的频带B中,在该叠加部分对作为第1级的输出的量化误差进行归一化和量化处理、在其他部分对上述频率特性信号序列的该频带B的系数串进行归一化和量化处理,由第3级的归一化单元γ和量化单元Z在与上述第2级的频带B的系数串具有一部分叠加而相邻的频带C中,在该叠加部分对作为第2级的输出的量化误差进行归一化和量化处理、在其他部分对上述频率特性信号序列的该频带C的系数串进行归一化和量化处理的结构。
在上述图20(B)、(C)所示的结构中,通过对各量化单元的量化进行归一化处理,各归一化单元进行考虑了各量化单元的负荷的归一化处理,这样,便可进行各归一化单元和量化单元完全地发挥各自的能力的量化处理,从而可以大大提高量化效率。
图20(B)、(C)的各级的归一化单元和量化单元处理的频带和量化的深度不限于上述例子,可以任意地进行调整。
下面,使用图18和图22说明第1级~第3级的归一化单元和量化单元的归一化和量化处理的方法的一例。
在本实施例5中,作为第1、第2、第3各归一化单元1801、1804、1807,可以用和上述实施例1的归一化单元104相同的结构实现,作为归一化的参量计算方法,也可以使用其他方法来实现,例如,根据输入各归一化部的MDCT系数直接计算LPC系数和LSP系数等,也可以将它们作为归一化的参量构成归一化部。在图22中,T1、T2、T3是各级的归一化单元α、β、γ分别使用的用于归一化的表,它们可以用以下的方法求出。
即,对于有可能作为输入音频信号而输入的各种声源信号的MDCT系数,进行LPC(Linear Predictive Coding)分析,求出LSP(LineSpectrum Pair)系数。并且,对各声源反复进行该动作,对所有的帧进行求LSP系数的处理,将所有的这些系数集中在一起,进行分类分析,求出典型的多个包络线参量,将它们作为第1级的归一化单元α的归一化表T1。
使用这样得到的多个包络线参量进行第1级的归一化和量化处理,并对其输出进行和上述相同的LPC分析的处理,和上述一样,求出多个包络线参量,将它们作为第2级的归一化单元β的归一化表T2。
以下,按照同样的处理,可以求出第3级的归一化单元γ的归一化表T3。
这样,作为第1级~第3级的各量化单元的量化处理,由于考虑了各量化单元的负荷,可以进行完全地发挥归一化和量化单元的各自的能力的最佳的量化处理,所以,可以得到归一化单元的归一化表T1、T2、T3。
在这样的结构的音频信号编码装置中,可以认为由多个种类的各种声源信号构成的输入音频信号输入主装置时,如从图19(A)到(B)所示的那样,该输入音频信号由MDCT和FFT从时间轴上的数据变换为频率轴上的数据。并且,该变换为频率轴上的数据的信号,如从图19(B)到(C)所示的那样,进行其概形抽出。这时的概形抽出使用第1级的归一化单元α的归一化表T1进行,结果,所得到的概形是由例如20位的LSP的多项式构成。并且,通过用所得到的概形来除变换为上述频率轴上的数据的信号,进行归一化α处理。另外,在进行该归一化处理后,由量化单元X将其进行量化处理,则第1级的归一化和量化处理即告结束。这样,便可进行考虑了上述多个种类的各种声源信号的特征的高效率的量化处理。
其次,由第2级的归一化和量化单元使用上述第2级的归一化表T2,对与在第1级作为量化处理的对象的分割频率特性信号序列的某一频带A的系数串不同的频带B的系数串或作为上述第1级的归一化和量化处理的结果的量化误差的输出进行第2级的归一化和量化处理。这样,仍然可以以考虑了上述多个种类的各种声源信号的特征的所需要的频带为重点或以所需要的频带部分的量化的深度为重点进行高效率的量化处理。
此外,由第2级的归一化和量化单元使用第3级的归一化表T3,对与在第1级、第2级作为量化处理的对象的分割频率特性信号序列的各频带的系数串不同的频带B的系数串或作为上述第2级的归一化和量化处理的结果的量化误差的输出进行第3级的归一化和量化处理。这样,仍然可以以考虑了上述多个种类的各种声源信号的特征的所需要的频带为重点或以所需要的频带部分的量化的深度为重点进行高效率的量化处理。
这样,通过使用按以上说明的方法作成的归一化表T1、T2、T3进行各级的归一化α、量化X、归一化β、量化Y、归一化γ、量化Z,便可根据作为应进行量化处理的对象的信号的性质等进行减轻量化处理的过度的分担的归一化处理,从而可以大大改善量化效率,大大提高在再生侧的品质。
另外,如图23(B)、(C)所示,与本实施例5的编码装置对应的译码装置,与图20(B)、(C)所示的编码装置侧的结构对应,具有接收上述音频信号编码装置的量化部的各量化器的信号并再生与上述频率特性信号序列分割为多个频带的各频带的系数串相当的信号的逆量化部X’、Y’、Z’、设置在该多个各逆量化部中将作为其输出的频率特性信号序列的系数串与根据关于作为上述音频信号编码装置的输出的归一化的代码而再生的归一化成份相乘并输出与编码前的频率特性信号序列的各系数串相当的信号的多个逆归一化部α’、β’、γ’和接收该多个各逆归一化部的输出并输出与原来的音频信号相当的信号的逆频率变换部(图中未示出)。
另外,如果将该译码装置的逆归一化和逆量化处理交替地向扩展量化处理的频带的方向和加深量化的深度的方向进行,就和在上述实施例4中说明的一样,不论从编码装置发信来的信息量如何,都可以将已编码的音频信号的所希望的信息量进行译码。即,可以根据受信侧的通信环境等改变译码的信息量,例如,即使在利用通常的公众电话网的情况下,也可以稳定地得到高品位的音质。
在上述实施例5中,第1、第2、第3量化频带选择部1803、1806、1809的结构,也可以作为输出各预先设定的应进行量化处理的频带的结构而实现。这时,在第1、第2、第3量化频带选择部1803、1806、1809中,不进行计算应进行量化处理的频带的计算而输出各预先设定的应进行量化处理的频带,从而可以使结构更简化。
另外,上述实施例5的第1、第2、第3量化频带选择部1803、1806、1809的结构也可以构成为为了根据人的听觉特性作为输出而得到应进行量化处理的频带使用寂静时的最小可听特性和难于根据某一输入频率成份而听到其附近的频率成份的声音的掩蔽特性进行频带的选择。
按照这样的本实施例5的音频信号编码装置,在进行多级量化处理的量化单元的前级设置各归一化单元,对分割的各频带及各级的量化在进行归一化处理后进行量化处理,所以,通过各频带的归一化处理,进行与各频带的音频信号所具有的信息量对应的适当的编码,即,进行归一化单元和量化单元可以完全地发挥各自的能力的编码,并可进行不会损失原来的音频信号所具有的信息量从而量化误差小、量化效率高的量化处理,从而可以稳定地得到高品位的音质。
在上述实施例1~5中,上述多级量化单元至少具有将上述频率特性信号序列或其一部分进行矢量量化处理的第1级矢量量化器和将上述第1级的矢量量化器的量化误差成份进行矢量量化处理的第2级矢量量化器,同时,该多级量化单元的各级量化单元对利用各级的分割的方式将上述频率特性信号序列分割为至少2个以上的在多个级间具有重复的部分的频带的多个频带中的某个频带的系数串进行矢量量化处理的至少1个以上的分割化矢量量化器,但是,该多级量化单元的各级的量化单元也可以是由将上述频率特性信号序列或前级的量化单元的量化误差成份全部进行矢量量化处理的全频带矢量量化器构成,这样,分多级进行量化处理,即使和上述一样按低位速率即高的压缩率将音频信号进行编码时,另外,即使不以固定的信息量进行编码和译码,在受信侧也可以进行高品位的声音的再生。
如上所述,按照本发明的音频信号编码装置和译码装置或编码及译码方法,具有在进行量化处理时可以使用矢量量化的方法等在高的信息压缩率下进行量化处理的结构,同时,采用对量化处理时的信息量的分配进行交替地分配对再生频带的扩展有用的信息量和对品质提高有用的信息量的结构,首先,在编码装置中,作为第1阶段,将输入的音频信号变换为频率区域的信号,并将变换后的频率信号的一部分进行编码;在第2阶段,将未编码的频率信号的一部分和第1阶段的量化误差信号进行编码,并附加到第1阶段的代码上;在第3阶段,进而将未编码的频率信号的一部分和第1阶段及第2阶段的量化误差信号进行编码,并附加到第1阶段和第2阶段的代码上;按照同样的方式,进而将阶段叠加地进行编码,另一方面,在译码装置中,可以只使用第1阶段的已编码的代码进行译码,使用第1阶段和第2阶段已译码的代码进行译码,使用从第1阶段到第3阶段以上的阶段已译码的代码进行译码,译码的顺序采用交替地将对频带扩展有用的代码和对品质提高有用的代码进行译码的结构,所以,即使不以固定的信息量进行编码和译码,也可以得到良好的音质,另外,还可以在高的压缩率下得到高品质的声音。
另外,按照本发明的音频信号编码装置和译码装置或编码及译码方法,在由量化单元进行量化处理之前,设置归一化单元,在进行输入音频信号的归一化处理后再进行量化处理,所以,可以进行归一化单元还量化单元完全地发挥各自的能力的编码,从而可以进行不会损失原来的音频信号所具有的信息量、量化误差小、量化效率高的量化处理,根据音频信号的种类不同可以发挥更大的效果。另外,如上所述,通过采用对量化处理时的信息量的分配交替地分配对再生频带的扩展有用的信息量还对品质提高有用的信息量的结构,在受信侧的信息量已限定时,就只能在频带窄而浅的区域进行逆量化处理,但是,通过交替地将该逆量化处理向扩展频带的方向和加深逆量化处理的深度的方向扩展,增大受信侧的信息量,不论从编码装置发信来的信息量如何,都可以将已编码的音频信号的所希望的信息量进行译码,这样,通过根据受信侧的通信环境等改变译码的信息量,即使在例如利用通常的公众电话网的情况下,也可以稳定地得到高品位的音质。
另外,按照本发明的音频信号编码装置和译码装置或编码及译码方法,在进行多级量化处理的量化单元的前级分别设置归一化单元,在对分割的各频带以及各级的量化进行归一化处理后进行量化处理,所以,通过各频带的归一化处理进行与各频带的音频信号所具有的信息量对应的适当的编码即进行归一化单元和量化单元完全地发挥各自的能力的编码,便可进行不会损失原来的音频信号所具有的信息量从而量化误差小、量化效率高的量化处理,根据音频信号的种类不同可以发挥更大的效果。另外,如果将译码侧的逆归一化和逆量化处理交替地向扩展量化的频带的方向和加深量化的深度的方向进行,和上述一样,不论从编码装置发信来的信息量如何,都可以将已编码的音频信号的所希望的信息量进行译码,即,可以根据受信侧的通信环境等改变译码的信息量,即使在例如利用通常的公众电话网的情况下,也可以稳定地得到高品位的音质。
如上所述,按照本发明的音频信号编码装置和译码装置或编码及译码方法,即使不以固定的信息量进行编码和译码,也可以得到良好的音质,另外,可以在高的压缩率下得到高品质的声音。
另外,通过利用各频带的归一化处理进行与各频带的音频信号所具有的信息量对应的适当的量化处理,进行归一化单元和量化单元完全地发挥各自的能力的编码,便可进行不会损失原来的音频信号所具有的信息量、量化误差小、量化效率高的量化处理,可以根据音频信号的种类不同发挥更大的效果,从而,通过根据受信侧的通信环境等改变译码的信息量,即使在例如利用通常的公众电话网的情况下,也可以稳定地得到高品位的音质。
Claims (38)
1.一种对将输入音频信号进行频率变换而得到的频率特性信号序列进行矢量量化处理并将音频信号进行编码的音频信号编码装置,其特征在于:具备至少具有将上述频率特性信号序列或其一部分进行矢量量化处理的第1级矢量量化器和将上述第1级矢量量化器的量化器误差成份进行矢量量化处理的第2级矢量量化器的多级量化单元,上述多级量化单元的各级量化单元具有至少1个以上的分割化矢量量化器,用于对将上述频率特性信号序列利用各级的分割方式分割为至少2个以上的在多个级间可以具有重复的部分的频带的多个频带的某一个频带的系数串进行矢量量化处理。
2.按权利要求1所述的音频信号编码装置,其特征在于:具有将上述频率特性信号序列进行归一化处理并将其输出供给上述多级量化单元的归一化单元。
3.按权利要求1或2所述的音频信号编码装置,其特征在于:上述各级量化单元适当地选择量化误差的能量之和大的频带作为应进行量化处理的上述频率特性信号序列的分割的频带进行量化处理。
4.按权利要求1或2所述的音频信号编码装置,其特征在于:上述各级的量化单元,根据人的听觉上的性质即听觉敏感特性,适当地选择对其重要性高的频带加上大的权重值的量化误差的能量之和大的频带作为应进行量化处理的上述频率特性信号序列的分割的频带,进行量化处理。
5.按权利要求1或2所述的音频信号编码装置,其特征在于:在构成上述多级量化单元的第1级矢量量化器和第2级矢量量化器之间具有第1量化频带选择部,在上述第2级矢量量化器和上述第3级矢量量化器之间具有第2量化频带选择部,上述第1量化频带选择部将上述第1级矢量量化器的量化误差的输出作为其输入,选择应由上述第2级矢量量化器进行量化处理的频带;上述第2量化频带选择部将上述第2级矢量量化器的量化误差的输出作为其输入,选择应由上述第3级矢量量化器进行量化处理的频带。
6.按权利要求5所述的音频信号编码装置,其特征在于:上述多级量化单元具有,将上述频率特性信号序列的上述分割的各频带的各系数串,由第I级分割的矢量量化器独立地进行量化处理的多个第I级的分割矢量量化器,和作为至少一次将应进行量化处理的输入信号的各频带全部进行量化处理的全频带量化部的第J级矢量量化器。
7.按权利要求1所述的音频信号编码装置,其特征在于:上述多级量化单元使用前级矢量量化器使用代码薄的矢量量化方法,计算矢量量化中的量化误差,后级矢量量化器对该计算出的量化误差进一步进行矢量量化处理。
8.按权利要求2所述的音频信号编码装置,其特征在于:上述多级量化单元使用前级矢量量化器使用代码薄的矢量量化方法,计算矢量量化中的量化误差,后级矢量量化器对该计算出的量化误差进一步进行矢量量化处理。
9.按权利要求8所述的音频信号编码装置,其特征在于:上述多级量化单元的矢量量化器在检索矢量量化处理中的上述代码薄内的最佳代码时使用的代码间的距离的计算中,使用从上述归一化单元输出的输入信号的归一化成份作为权重计算该距离,抽出给定最小距离的代码。
10.按权利要求9所述的音频信号编码装置,其特征在于:上述多级量化单元的矢量量化器将从上述归一化单元输出的频率特性信号序列的归一化成份和考虑了人的听觉上的性质即听觉敏感特性的值两者作为权重计算上述距离,抽出给定最小距离的代码。
11.按权利要求2和8~10中的任一权项所述的音频信号编码装置,其特征在于:上述归一化单元具有将上述频率特性信号序列的概形大致地进行归一化处理的频率概形归一化部。
12.按权利要求2和8~10中的任一权项所述的音频信号编码装置,其特征在于:上述归一化单元具有将上述频率特性信号序列分为多个连续的单位频带的各成份,并通过用1个值除各单位频带的系数串而进行归一化的频带振幅归一化部。
13.按权利要求1所述的音频信号编码装置,其特征在于:上述多级量化单元具有,将上述频率特性信号序列的上述分割的各频带的各系数串,利用分割化矢量量化器独立地进行量化处理的矢量量化器,和作为至少一次将应进行量化处理的输入信号的各频带全部进行量化处理的全频带量化部的矢量量化器。
14.按权利要求13所述的音频信号编码装置,其特征在于:上述多级量化单元具有由低频区的分割化矢量量化器、中频区的分割化矢量量化器和高频区的分割化矢量量化器构成的第1矢量量化器,与其后级连接的第2矢量量化器和与其后级连接的第3矢量量化器,将输入该多级量化单元的频率特性信号序列分割为3个频带,由上述低频区的分割化矢量量化器独立地将该3个频带中的低频带成份的频率特性信号序列进行量化处理,由上述中频区的分割化矢量量化器独立地将上述3个频带中的中频的频带成份的频率特性信号序列进行量化处理,由上述高频区的分割化矢量量化器独立地将上述3个频带中的高频带成份的频率特性信号序列进行量化处理,由构成上述第1矢量量化器的各分割化矢量量化器计算对频率特性信号序列的量化误差,将其作为向后级的上述第2矢量量化器的输入,在上述第2矢量量化器中对该第2矢量量化器量化的频带宽度进行量化处理,计算对该第2矢量量化器的输入的量化误差,将其作为向上述第3矢量量化器的输入,在上述第3矢量量化器中,对该第3矢量量化器量化的频带宽度进行量化处理。
15.按权利要求14所述的音频信号编码装置,其特征在于:在构成上述多级量化单元的第1矢量量化器和第2矢量量化器之间设置第1量化频带选择部,同时,在上述第2矢量量化器和上述第3矢量量化器之间设置第2量化频带选择部,上述第1量化频带选择部将上述第1矢量量化器的输出作为其输入,选择应由上述第2矢量量化器进行量化处理的频带,上述第2矢量量化器对于由上述第1量化选择部选择的频带的由上述3个矢量量化器构成的第1矢量量化器的量化误差,对该第2矢量量化器量化的频带宽度进行量化处理,计算对该第2矢量量化器的输入的量化误差,并将其作为向上述第2量化频带选择部的输入;上述第2量化频带选择部将上述第2矢量量化器的量化误差作为输入,选择应由上述第3矢量量化器进行量化处理的频带,上述第3矢量量化器对于上述第2量化频带选择部选择的频带的上述第2矢量量化器的量化误差,对该第2矢量量化器量化的频带宽度进行量化处理。
16.按权利要求14所述的音频信号编码装置,其特征在于:使用上述低频区的分割化矢量量化器、中频区的分割化矢量量化器和高频区的分割化矢量量化器构成上述第2矢量量化器或第3矢量量化器,取代上述第1矢量量化器。
17.一种将权利要求1所述的音频信号编码装置输出的代码作为其输入并将其译码从而输出与原来的输入音频信号相当的信号的音频信号译码装置,其特征在于:具有使用上述音频信号编码装置的量化单元输出的代码的至少一部分进行逆量化处理的逆量化部,和使用作为该逆量化部的输出的频率特性信号序列将频率特性信号序列变换为与原来的音频输入信号相当的信号的逆频率变换部。
18.一种将权利要求2所述的音频信号编码装置输出的代码作为其输入并将其译码从而输出与原来的输入音频信号相当的信号的音频信号译码装置,其特征在于:具有再生频率特性信号序列的逆量化部,及使用作为该逆量化部的输出的频率特性信号序列根据作为上述音频信号编码装置的输出的代码再生归一化成份并将上述频率特性信号序列与归一化成份相乘而输出的逆归一化部,和接收该逆归一化的输出并将频率特性信号序列变换为与原来的音频信号相当的信号的逆频率变换部。
19.一种将权利要求13所述的音频信号编码装置的输出这样的代码作为其输入并将其译码从而输出与原来的输入音频信号相当的信号的音频信号译码装置,其特征在于:具有不论构成上述音频信号编码装置的量化单元的全部还是一部分矢量量化器输出代码时都使用输出的代码进行逆量化处理的逆量化部。
20.按权利要求19所述的音频信号译码装置,其特征在于:上述逆量化部在某一级的指定频带的量化代码的逆量化之后,交替地进行该指定频带的下一级的量化代码的逆量化处理和与该某一级的该指定频带不同的频带的量化代码的逆量化处理,在不存在该指定频带的下一级的量化代码时,接着就进行不同的频带的量化代码的逆量化处理;在不存在与上述指定的频带不同的频带的量化代码时,接着就进行下一级的量化代码的逆量化处理。
21.一种将权利要求14所述的音频信号编码装置输出的代码作为其输入并将其译码从而输出与原来的输入音频信号相当的信号的音频信号译码装置,其特征在于:具有不论从构成上述音频信号编码装置的第1矢量量化器的3个分割化矢量量化器全部还是一部分输出代码时都只使用构成上述第1矢量量化器的低频区的分割化矢量量化器的代码进行逆量化处理的逆量化部。
22.按权利要求21所述的音频信号译码装置,其特征在于:上述逆量化部除了使用来自构成上述第1矢量量化器的低频区的分割化矢量量化器的代码外,还使用上述第2矢量量化器的代码进行逆量化处理。
23.按权利要求22所述的音频信号译码装置,其特征在于:上述逆量化部除了使用来自构成上述第1矢量量化器的低频区的分割化矢量量化器的代码和上述第2矢量量化器的代码外,还使用来自构成上述第1矢量量化器的中频区的分割化矢量量化器的代码进行逆量化处理。
24.按权利要求23所述的音频信号译码装置,其特征在于:上述逆量化部除了使用来自构成上述第1矢量量化器的低频区的分割化矢量量化器的代码、来自上述第2矢量量化器的代码和来自构成上述第1矢量量化器的中频区的分割化矢量量化器的代码外,还使用来自上述第3矢量量化器的代码进行逆量化处理。
25.按权利要求24所述的音频信号编码装置,其特征在于:上述逆量化部除了使用来自构成上述第1矢量量化器的低频区的分割化矢量量化器的代码、来自上述第2矢量量化器的代码、来自构成上述第1矢量量化器的中频区的分割化矢量量化器的代码和来自上述第3矢量量化器的代码外,还使用来自构成上述第1矢量量化器的高频区的分割化矢量量化器的代码进行逆量化处理。
26.一种接收将输入音频信号进行频率变换而得到的频率特性信号序列、将其编码而输出并将该输出的代码信号作为输入将其译码从而再生与原来的输入音频信号相当的信号的音频信号编码和译码方法,其特征在于:将上述频率特性信号序列分为与至少分割为2个以上的频带的频带相当的系数串,分别独立地进行量化处理而输出,根据接收的已量化的信号,通过对与上述分割的频带相当的任意的频带的数据进行逆量化处理,再生与原来的音频输入信号相当的信号。
27.按权利要求26所述的音频信号编码和译码方法,其特征在于:上述量化处理分阶段进行,从而将计算出的量化误差进一步进行量化处理;上述逆量化处理反复交替地进行向扩展频带方向的逆量化处理和向上述量化处理时量化阶段加深的方向的逆量化处理。
28.按权利要求27所述的音频信号编码和译码方法,其特征在于:向扩展上述频带方向的逆量化处理按考虑了人的听觉心理特性的顺序扩展频带而进行。
29.按权利要求26~28中的任一权项所述的音频信号编码和译码方法,其特征在于:在编码侧,将上述频率特性信号序列归一化后,将该频率特性信号序列分为与至少分割为2个以上的频带的频带相当的系数串,进行分别独立地量化而输出的处理;在译码侧,使用关于上述编码侧的归一化的代码,将上述编码侧的代码进行逆归一化处理后,对该逆归一化处理后的代码,通过对与上述分割的频带相当的任意的频带的数据进行逆量化处理,再生与原来的音频输入信号相当的信号。
30.一种对将输入音频信号进行频率变换而得到的频率特性信号序列进行归一化和矢量量化处理并将音频信号进行编码的音频信号编码装置,其特征在于:具备至少具有将上述频率特性信号序列或其一部分进行归一化和矢量量化处理的第1级归一化及矢量量化器、和将上述第1级归一化及矢量量化器的量化误差进行归一化及矢量量化处理的第2级归一化及矢量量化器的多级量化单元,上述多级量化单元的各级量化单元具有至少1个以上的分割化的归一化及矢量量化器,该分割化的归一化及矢量量化器将利用各级的分割方式将上述频率特性信号序列分割为至少2个以上的在多个级间具有叠加的部分的频带的多个频带中的某个频带的系数串进行归一化及矢量量化处理。
31.按权利要求30所述的音频信号编码装置,其特征在于:在构成上述多级量化单元的第1级归一化及矢量量化器和第2级归一化及矢量量化器之间具有第1量化频带选择部,在上述第2级归一化及矢量量化器和上述第3级归一化及矢量量化器之间具有第2量化频带选择部,上述第1量化频带选择部将上述第1级归一化及矢量量化器的量化误差的输出作为其输入,选择应由上述第2级归一化及矢量量化器进行量化处理的频带,并将该选择的频带的量化误差的输出向上述第2级归一化及矢量量化器输出;上述第2量化频带选择部将上述第2级归一化及矢量量化器的量化误差的输出作为其输入,选择应由上述第3归一化及矢量量化器进行量化处理的频带,并将该选择的频带的量化误差的输出向上述第3级归一化及矢量量化器输出。
32.按权利要求31所述的音频信号编码装置,其特征在于:上述多级量化单元的第2级以后的各级归一化及矢量量化器,适当地选择应进行归一化及量化处理的上述频率特性信号序列的分割的频带中前级的归一化及矢量量化器的输出即量化误差的能量之和大的频带,进行归一化及量化处理。
33.按权利要求31所述的音频信号编码装置,其特征在于:上述多级量化单元的第2级以后的各级归一化及矢量量化器,在应进行归一化及量化处理的上述频率特性信号序列的分割的频带中,根据人的听觉的性质即听觉灵敏特性,适当地选择对其重要性高的频带加权大的值的前级的归一化及矢量量化器的输出即量化误差的能量之和大的频带进行归一化及量化处理。
34.一种将作为权利要求30~33中的任一权项所述的音频信号编码装置的输出的代码作为其输入并将其译码从而输出与原来的输入音频信号相当的信号的音频信号译码装置,其特征在于:具有接收上述音频信号编码装置的量化部的各量化器的信号,并再生与上述频率特性信号序列分割为多个频带的各频带的系数串相当的信号的逆量化部,设置在该多个逆量化部中,将作为其输出的频率特性信号序列的系数串,与根据关于作为上述音频信号编码装置的输出的归一化的代码而再生的归一化成份相乘,从而输出与编码前的频率特性信号序列的各系数串相当的信号的多个逆归一化部,和接收该多个逆归一化部的输出并将它们变换为与原来的音频信号相当的信号的逆频率变换部。
35.一种接收将输入音频信号进行频率变换而得到的频率特性信号序列并将其进行编码后输出、将该输出的代码信号作为输入并将其译码从而再生与原来的输入音频信号相当的信号的音频信号编码和译码方法,其特征在于:将上述频率特性信号序列分为与分割为至少2个以上的频带的频带相当的系数串,分别独立地进行归一化及量化处理后输出,从接收的已量化的信号中使用关于编码侧的归一化的代码,通过对与上述分割的频带相当的任意的频带的数据进行逆归一化及逆量化处理,再生与原来的音频输入信号相当的信号。
36.按权利要求35所述的音频信号编码和译码方法,其特征在于:上述归一化及量化处理分阶段进行,从而对计算出的量化误差进一步进行归一化及量化处理;上述逆归一化及逆量化处理,反复交替地进行向扩展频带的方向的逆归一化及逆量化处理和向上述量化处理时的量化阶段深入的方向的逆归一化及逆量化处理。
37.按权利要求36所述的音频信号编码和译码方法,其特征在于:向扩展上述频带的方向的逆归一化及逆量化处理,按照考虑了人的听觉心理特性的顺序扩展频带而进行。
38.一种对将输入音频信号进行频率变换而得到的频率特性信号序列进行矢量量化处理并对音频信号进行编码的音频信号编码装置,其特征在于:具有具备至少具有对上述频率特性信号序列进行矢量量化处理的第1级矢量量化器和对上述第1级矢量量化器的量化误差成份进行矢量量化处理的第2级矢量量化器的多级量化单元,上述多级量化单元的各级量化单元由将上述频率特性信号序列或前级的量化单元的量化误差成份全部进行矢量量化处理的全频带矢量量化器构成。
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP125844/1997 | 1997-05-15 | ||
JP125844/97 | 1997-05-15 | ||
JP12584497 | 1997-05-15 | ||
JP62413/98 | 1998-03-13 | ||
JP06241398A JP3344944B2 (ja) | 1997-05-15 | 1998-03-13 | オーディオ信号符号化装置,オーディオ信号復号化装置,オーディオ信号符号化方法,及びオーディオ信号復号化方法 |
JP62413/1998 | 1998-03-13 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1224523A CN1224523A (zh) | 1999-07-28 |
CN1144178C true CN1144178C (zh) | 2004-03-31 |
Family
ID=26403462
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB988005271A Expired - Lifetime CN1144178C (zh) | 1997-05-15 | 1998-05-14 | 音频信号编码装置和译码装置以及音频信号编码和译码方法 |
Country Status (5)
Country | Link |
---|---|
EP (1) | EP0919989A4 (zh) |
JP (1) | JP3344944B2 (zh) |
KR (1) | KR100309727B1 (zh) |
CN (1) | CN1144178C (zh) |
WO (1) | WO1998052188A1 (zh) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6446037B1 (en) | 1999-08-09 | 2002-09-03 | Dolby Laboratories Licensing Corporation | Scalable coding method for high quality audio |
US7016502B2 (en) | 2000-12-22 | 2006-03-21 | Sony Corporation | Encoder and decoder |
DE10102159C2 (de) * | 2001-01-18 | 2002-12-12 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Erzeugen bzw. Decodieren eines skalierbaren Datenstroms unter Berücksichtigung einer Bitsparkasse, Codierer und skalierbarer Codierer |
EP1440433B1 (en) | 2001-11-02 | 2005-05-04 | Matsushita Electric Industrial Co., Ltd. | Audio encoding and decoding device |
AU2003276754A1 (en) * | 2002-11-07 | 2004-06-07 | Samsung Electronics Co., Ltd. | Mpeg audio encoding method and apparatus |
FR2852172A1 (fr) * | 2003-03-04 | 2004-09-10 | France Telecom | Procede et dispositif de reconstruction spectrale d'un signal audio |
CN1839426A (zh) * | 2003-09-17 | 2006-09-27 | 北京阜国数字技术有限公司 | 多分辨率矢量量化的音频编解码方法及装置 |
JP5224017B2 (ja) * | 2005-01-11 | 2013-07-03 | 日本電気株式会社 | オーディオ符号化装置、オーディオ符号化方法およびオーディオ符号化プログラム |
US20090299738A1 (en) * | 2006-03-31 | 2009-12-03 | Matsushita Electric Industrial Co., Ltd. | Vector quantizing device, vector dequantizing device, vector quantizing method, and vector dequantizing method |
CN101325059B (zh) * | 2007-06-15 | 2011-12-21 | 华为技术有限公司 | 语音编解码收发方法及装置 |
CN101350197B (zh) * | 2007-07-16 | 2011-05-11 | 华为技术有限公司 | 立体声音频编/解码方法及编/解码器 |
EP2610866B1 (en) | 2010-08-24 | 2015-04-22 | LG Electronics Inc. | Method and device for processing audio signals |
WO2015162500A2 (ko) * | 2014-03-24 | 2015-10-29 | 삼성전자 주식회사 | 고대역 부호화방법 및 장치와 고대역 복호화 방법 및 장치 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03228433A (ja) * | 1990-02-02 | 1991-10-09 | Fujitsu Ltd | 多段ベクトル量子化方式 |
JP3114197B2 (ja) * | 1990-11-02 | 2000-12-04 | 日本電気株式会社 | 音声パラメータ符号化方法 |
JP3088163B2 (ja) * | 1991-12-18 | 2000-09-18 | 沖電気工業株式会社 | Lsp係数の量子化方法 |
JPH0677840A (ja) * | 1992-08-28 | 1994-03-18 | Fujitsu Ltd | ベクトル量子化装置 |
JP3239488B2 (ja) * | 1992-11-30 | 2001-12-17 | 三菱電機株式会社 | 画像帯域分割符号化装置および画像帯域分割符号化方法 |
JP3537008B2 (ja) * | 1995-07-17 | 2004-06-14 | 株式会社日立国際電気 | 音声符号化通信方式とその送受信装置 |
JPH09127987A (ja) * | 1995-10-26 | 1997-05-16 | Sony Corp | 信号符号化方法及び装置 |
JP3159012B2 (ja) * | 1995-10-26 | 2001-04-23 | 日本ビクター株式会社 | 音響信号の符号化装置及び復号化装置 |
JPH09281995A (ja) * | 1996-04-12 | 1997-10-31 | Nec Corp | 信号符号化装置及び方法 |
JP3246715B2 (ja) * | 1996-07-01 | 2002-01-15 | 松下電器産業株式会社 | オーディオ信号圧縮方法,およびオーディオ信号圧縮装置 |
-
1998
- 1998-03-13 JP JP06241398A patent/JP3344944B2/ja not_active Expired - Lifetime
- 1998-05-14 WO PCT/JP1998/002135 patent/WO1998052188A1/ja not_active Application Discontinuation
- 1998-05-14 EP EP98919600A patent/EP0919989A4/en not_active Withdrawn
- 1998-05-14 CN CNB988005271A patent/CN1144178C/zh not_active Expired - Lifetime
-
1999
- 1999-01-15 KR KR1019997001099A patent/KR100309727B1/ko not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
JPH1130998A (ja) | 1999-02-02 |
EP0919989A4 (en) | 2003-02-26 |
CN1224523A (zh) | 1999-07-28 |
KR20000023852A (ko) | 2000-04-25 |
EP0919989A1 (en) | 1999-06-02 |
JP3344944B2 (ja) | 2002-11-18 |
KR100309727B1 (ko) | 2001-09-29 |
WO1998052188A1 (fr) | 1998-11-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1096148C (zh) | 信号编码方法和装置 | |
CN1156822C (zh) | 音频信号编码方法、解码方法,及音频信号编码装置、解码装置 | |
CN1220178C (zh) | 在码本中进行搜索以对声音信号编码的方法和设备 | |
CN1240978A (zh) | 音频信号编码装置、解码装置及音频信号编码、解码装置 | |
CN1288622C (zh) | 编码设备和解码设备 | |
CN1165891C (zh) | 对过采样合成宽带信号进行高频分量恢复的方法与设备 | |
CN1115781C (zh) | 编码器 | |
CN1144178C (zh) | 音频信号编码装置和译码装置以及音频信号编码和译码方法 | |
CN1702974A (zh) | 用于对数字信号编码/解码的方法和设备 | |
CN1156872A (zh) | 语音编码的方法和装置 | |
CN1248195C (zh) | 语音编码转换方法和装置 | |
CN1161751C (zh) | 语音分析方法和语音编码方法及其装置 | |
CN1689069A (zh) | 声音编码设备和声音编码方法 | |
CN1871501A (zh) | 频谱编码装置、频谱解码装置、音响信号发送装置、音响信号接收装置及其使用方法 | |
CN1910657A (zh) | 声频信号编码方法、声频信号解码方法、发送器、接收器和无线传声系统 | |
CN1218339A (zh) | 可缩放的音频编码/解码方法和装置 | |
CN1310431C (zh) | 用于编码音频信号的设备和方法 | |
CN1767395A (zh) | 整数数据的无损自适应编码与解码 | |
CN1957399A (zh) | 语音/音频解码装置以及语音/音频解码方法 | |
CN1496007A (zh) | 音频译码装置 | |
CN1750406A (zh) | 用于从音频数据码流中解码重建多声道音频信号的解码器 | |
CN1151491C (zh) | 音频编码装置和音频编码译码装置 | |
CN1677493A (zh) | 一种增强音频编解码装置及方法 | |
CN1437169A (zh) | 对于语音代码进行数据嵌入/抽取方法、装置以及系统 | |
CN1677492A (zh) | 一种增强音频编解码装置及方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CX01 | Expiry of patent term |
Granted publication date: 20040331 |
|
CX01 | Expiry of patent term |