CN100440758C - 语音编码装置、语音解码装置以及语音编码/解码方法 - Google Patents
语音编码装置、语音解码装置以及语音编码/解码方法 Download PDFInfo
- Publication number
- CN100440758C CN100440758C CNB021504466A CN02150446A CN100440758C CN 100440758 C CN100440758 C CN 100440758C CN B021504466 A CNB021504466 A CN B021504466A CN 02150446 A CN02150446 A CN 02150446A CN 100440758 C CN100440758 C CN 100440758C
- Authority
- CN
- China
- Prior art keywords
- quantization
- bits
- bit number
- core
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 15
- 230000003044 adaptive effect Effects 0.000 claims abstract description 16
- 238000013139 quantization Methods 0.000 claims description 131
- 239000000284 extract Substances 0.000 claims description 18
- 239000002131 composite material Substances 0.000 claims description 12
- 238000000605 extraction Methods 0.000 claims description 6
- 238000010586 diagram Methods 0.000 description 14
- 238000001914 filtration Methods 0.000 description 4
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
一种提高音质的语音编码装置和语音解码装置。在解量化部分(135)中得到的解量化值每隔预定帧数,诸如以倾斜周期为基础,就输入到自适应比特分配器(140)。自适应比特分配器(140)计算从各个ADPCM量化器(130a到130d)输出的解量化值的能量,即,即作为样本的解量化值的平方和,并且,基于所计算的解量化值的能量,来确定分配给各个ADPCM量化器(130a到130d)中量化的每个残留信号的比特数。
Description
技术领域
本发明涉及一种在子带ADPCM(自适应性差分脉冲编码调制)中的语音编码装置、语音解码装置以及语音编码/解码方法。
背景技术
通常,在子带ADPCM中使用的语音编码装置和语音解码装置,是遵照ITU-T(国际电信联盟电信部分)建议书G.722的装置。
图1图示了建议书G.722中描述的两个子带的ADPCM中使用的语音编码装置300和语音解码装置400的结构的方框图。
语音编码装置300是由24抽头分裂滤波器组(bank)310、ADPCM量化器320a和320b以及复用器330组成。所述的分裂滤波器组310将输入信号的频带分裂成两个子带并且输出子带信号。所述的ADPCM量化器320a和320b分别对两个分裂的子带信号进行量化。所述的复用器330将ADPCM量化器320a和330b中量化的码字进行复用以生成比特流。
同时,语音解码装置400由解复用器410、ADPCM解量化器420a和420b以及24抽头合成滤波器组430组成。所述的解复用器410输出用于从发送的数据流获取的每个子带的码字。所述的ADPCM解量化器420a和420b分别将来自解复用器410的用于每个子带的码字进行解量化,以便输出子带信号。所述的24抽头合成滤波器组430在子带信号上执行合成滤波。
下面将描述以上提到的分别图示的语音编码装置300和语音解码装置400的操作。
在分裂滤波器组310中,输入信号的频带被分裂成两个子带并且生成了两个子带信号。每个子带信号被分配预定数量的比特并且分别在ADPCM量化器320a和320b中被量化。量化得到的码字在复用器330中被复用成为比特流。
同时,在语音解码装置400中,带有多个被复用的码字的比特流在解复用器410中被解复用成为用于每个子带的码字。通过解复用得到的用于每个子带的码字在ADPCM解量化器420a和420b中被解量化成为子带信号。子带信号在合成滤波器组430中被合成成为解码信号。
然而,在以上描述的传统的语音编码装置和语音解码装置中,由于分配给语音编码装置中ADPCM量化器中的每个子带信号的量化比特的数量是固定的,特别地,当输入信号的采样频率变高时,就存在比特分配不佳的危险,并且解码信号的音质(audio quality)会在语音解码装置中恶化。
发明内容
本发明的目的就是为了提高音质。
本发明的一个主题是,在子带ADPCM编码中,通过从上一帧来计算下一帧的预测值的处理过程来判断分配给每个残留信号的下一帧的量化比特数,从而自适应性地改变比特的分配,其中,在用于从输入信号分裂的每个频带的多个子带信号与各自的预测值之间的残留信号都被量化,并且,每个量化的输出都被解量化,以计算子带信号的下一帧的预测值。
按照本发明的一方面,提供了一种语音编码装置,用于以子带ADPCM方案对语音信号进行编码,该语音编码装置具有生成部分和判决部分,所述的生成部分用以根据分配的比特数对给定的子带信号进行量化以便生成码字,所述的判决部分用于确定生成部分使用的最佳的分配比特数。
按照本发明的另一方面,提供了一种语音解码装置,用于以子带ADPCM方案对语音信号进行解码,该语音解码装置具有生成部分和判决部分,所述的生成部分用以根据分配的比特数对给定的码字进行解量化以便生成解码的子带信号,所述的判决部分用于确定生成部分使用的最佳的分配比特数。
按照本发明的再一方面,提供了一种语音编码/解码方法,用于以子带ADPCM方案对语音信号进行编码和解码,该语音编码/解码方法包括判决步骤、量化步骤、获取步骤以及解量化步骤,其中,所述的判决步骤用于判断分配比特的最佳数值来对给定子带信号进行量化,所述的量化步骤用于根据已确定的分配比特的最佳数值生成码字,所述的获取步骤用于根据码字来获取分配比特的最佳数值,所述的解量化步骤用于根据获取的分配比特的最佳数值来对码字进行解量化,从而生成解码的子带信号。
附图说明
随着接下来结合附图的详细描述,本发明的以上以及其它目的和特征将变得更清晰。在这些附图中都以举例方式对各个实例加以描述,附图中:
图1是描述在两个子带ADPCM中使用的传统的语音编码装置和语音解码装置的方框图;
图2是描述按照本发明的第一和第二实施例的语音编码装置的结构的方框图;
图3是描述按照本发明的第一实施例的语音编码装置和主要结构的方框图;
图4图示了按照本发明的第一实施例的对分配的比特数进行量化的例子;
图5是描述按照本发明的第一和第二实施例的语音解码装置的结构的方框图;
图6是描述按照本发明的第一实施例的语音解码装置的结构的方框图;
图7是描述按照本发明的第二实施例的语音编码装置的主要结构的方框图;
图8是描述按照本发明的第二实施例的语音解码装置的主要结构的方框图。
具体实施方式
接下来将参照附图详细描述本发明的实施例。
(第一实施例)
图2是描述按照本发明的第一实施例的语音编码装置的结构的方框图。在图2中,分裂滤波器组100将输入信号的频带分裂成四个具相同带宽的子带,并且执行了变窄过程,该变窄过程利用分裂的数量“4”作为其变窄系数。分裂滤波器组100中的频带分裂有限脉冲响应滤波器110a到110d对用于预定频带的输入信号执行分裂滤波。分裂滤波器组100是一个余弦调制滤波器组,频带分裂有限脉冲响应(FIR)滤波器110a到110d都是基本(basic)滤波器,但其脉冲响应并不对称。
而且,分裂滤波器组100中向下采样器120a到120d对频带分裂有限脉冲响应滤波器110a到110d的各个输出分别执行变窄过程,为了有效编码,使用了与分裂滤波器组100中分裂的数量相同的“4”作为其变窄的系数,并且输出相应的子带信号。
每个ADPCM量化器130a到130d分别对相应的子带信号与根据子带信号的上一帧计算得出的预定值之间的残留信号进行量化,并且输出比例可变的(scalable)码字。而且,每个ADPCM量化器130a到130d根据残留信号来计算解量化值以及比例因子。
自适应性比特分配器140基于ADPCM量化器130a到130d中相应的一个量化器计算出的解量化值的能量值,来判断分配给每个残留信号的量化比特的数量。
复用器150对ADPCM量化器130a到130d输出的码字进行复用,并生成复用信号的比特流。
图3是描述按照本发明的第一实施例的语音编码装置的主要结构的方框图。尽管图3描述了ADPCM量化器130a和自适应性比特分配器140的结构,其它ADPCM量化器130b到130d与量化器130a具有相同的结构,并且都与自适应性比特分配器140相连。
在图3中,加法器131计算输入到ADPCM量化器130a到130d中相应的一个量化器的子带信号与预定值之差并且生成残留信号。量化部分132利用比例因子对生成的残留信号进行量化,并输出码字,该码字带有自适应性比特分配器140中确定的量化比特数。核心比特(core bit)提取部分133从量化部分132输出的码字中删除最低有效的比特(下文中称为“LSB”)以便提取核心比特。比例因子调整部分134从提取的核心比特来计算比例因子。解量化部分135对提取的核心比特进行解量化,并且输出解量化值到预测部分136、加法器137以及自适应性比特分配器140。预测部分136利用解量化值以及预测部分136的输出执行零点预测和极点预测,并且计算出子带信号的下一帧的预测值。加法器137计算解量化值与预测部分136中计算得出的预测值之和。
接下来将描述以上提到的语音编码装置的操作。
输入到语音编码装置的语音信号在分裂滤波器组100中被分裂成四个子带信号。由于分裂滤波器组100是一个余弦调制滤波器组并且频带分裂有限脉冲滤波器110a到110d的脉冲输出是非对称的,发生在滤波器中的群时延(group delay)得到下降,因而有可能减少大量的计算。分裂的子带信号分别输入到ACDCM量化器130a到130d。
加法器131计算输入到每个ADPCM量化器130a到130d的子带信号与在预测部分136中从上一帧计算出的预定值之间的残留信号,并将计算出的残留信号输入到量化部分132。残留信号在量化部分132被量化成码字,该码字带有自适应性比特分配器140分配的量化比特数。在比例因子调整部分134中,利用计算的比例因子对残留信号进行量化。在量化部分132中量化的码字输出到解复用器150以及核心比特提取部分133,该核心比特提取部分133删除LSB,以便提取核心比特。提取的比特输入到用于计算比例因子的比例因子自适应性部分134,并且输入到解量化部分135。其中,在量化部分132中量化码字变为可调整的,以便保持比例因子的一致性。
解量化部分135利用比例因子调整部分134计算的比例因子对核心比特进行解量化。通过对核心比特进行解量化得到的解量化值被输入预测部份136。该输入值称为零点预测输入值。解量化值在加法器137中与预测部分136输出的上一帧的预测值相加,然后再次输入到预测部分136。该输入值称为极点预测输入值。利用零点预测输入值和极点预测输入值,预测部分136计算子带信号的下一帧的预测值。
解量化值诸如以音节周期(pitch period)为基础,每隔预定数量的帧输入到自适应性比特分配器140。自适应性比特分配器140计算从每个ADPCM量化器130a到130d输出的解量化值的能量,即将量化值的平方和作为样本值,并且基于计算的解量化值的能量来确定分配给ADPCM量化器130a到130d中相应的一个量化器中量化的残留信号的比特数。
确定的量化比特数量输出到相应的ADPCM量化器130a到130d中的相应量化部分132。正如以上所描述的那样,每个量化部分132利用比例因子对下一帧的残留信号进行量化,并且输出带有分配比特数量的码字。在ADPCM量化器130a到130d中量化的码字在复用器150中被复用,成为复用信号的比特流。
图4描述了量化比特数量分配的示例。在图4中,用斜线显示的比特表示每个频带中的核心比特。在第一频带中,核心比特的数量是五个,在第二频带中是四个,在第三频带中三个,在第四频带中两个。每个频带中的核心比特总是定值,自适应比特分配器140自适应地分配的比特是两个,在图4中以白色显示。这两个比特相应于解量化值的能量被自适应地分配到每个频带。
按照第一实施例的语音解码装置将在下文中描述。
图5是描述按照本发明的第一实施例的语音解码装置的结构的方框图。在图5中,解复用器200每隔一定数量的由下面提到的自适应比特分配器220分配的比特数将输入比特流分解,从而将比特流分裂成用于每个子带的码字。每个ADPCM解量化器210a到210d输出解码的残留信号之和来作为解码的子带信号,所述的残留信号是通过对各个码字以及由上一帧的码字计算的预测值进行量化所得到的。而且,每个ADPCM解量化器210a到210d仅计算那些从码字删除LSB而得到的核心比特的解量化值以及比例因子。基于每个ADPCM解量化器210a到210d中计算的核心比特的解量化值的能量,自适应性比特分配器220计算分配给语音编码装置中各个残留信号的量化比特数量。
合成滤波器组230将ADPCM解量化器210a到210d输出的子带信号组合从而得到解码信号。合成滤波器组230中的向上采样器240a到240d对变窄的子带信号分别执行内插。合成滤波器组230中的频带合成有限脉冲滤波器组250a到250d对相应的内插解码的子带信号进行合成滤波。合成滤波器组230是一个余弦调制过滤器组,作为基本滤波器的频带合成有限脉冲滤波器组250a到250d的脉冲响应是非对称的。
图6是描述按照本发明的第一实施例的语音解码装置的主要结构的方框图。尽管图6中描述了ADPCM解量化器210a和自适应性比特分配器220的结构,其它ADPCM解量化器210b到210d具有与解量化器210a相同的结构,并且连接到自适应性比特分配器220上。
在图6中,核心比特提取部分211从输入到相应ADPCM解量化器210a到210d的码字中删除LSB以便提取核心比特。解量化部分212对提取的核心比特解量化,并且将解量化的值输出到加法器214、预测部分215以及自适应性比特分配器220。比例因子调整部分213从提取的核心比特计算比例因子。加法器214计算解量化值与在预测部分215中计算的预测值的和。预测部分215利用解量化值和预测部分215的输出来执行零点预测和极点预测,并且计算解码子带信号的下一帧的预测值。解量化部分216利用比例因子每隔一定数量的、在自适应性比特分配器220中计算的量化比特对输入码字进行解量化,并且输出解码的残留信号。加法器217计算解量化部分216输出的解码残留信号与预测值之和,以生成解码子带信号。
以上提到的语音解码装置的操作将在下文中描述。
输入到语音解码装置的比特流每隔一定数量的、由比特分配器220分配的量化比特被分解,从而分裂成每四个子带的码字。分裂的码字输入到相应的解量化器210a到210d。
相应于由自适应性比特分配器220分配的量化比特数,输入到每个ADPCM解量化器210a到210d的码字在解量化部分216中被解量化并作为解码的残留信号输出。从ADPCM解量化器210a到210d中相应的一个量化器的码字输入中删除LSB,从而在核心比特提取部分211提取到核心比特。提取的核心比特输入到比例因子调整部分213用于计算比例因子,并且也输入到解量化部分212。在解量化部分212,使用在比例因子调整部分213中计算出的比例因子对核心比特解量化。对核心比特进行解量化得到的解量化值输入到预测部分215。该输入值称为零预测输入值。解量化值在加法器214中与从预测部分215输出的上一帧的预测值相加,并且被再次输入到预测部分215。该输入值称为极点预测输入值。利用零点预测输入值和极点预测输入值,预测部分215计算解码的子带信号的下一帧的预测值。
解量化值诸如以音节周期为基础,每隔预定数量的帧输入到自适应性比特分配器220。自适应比特分配器220计算从每个ADPCM量化器210a到210d输出的解量化值的能量,即以解量化值的平方和为样本值,并且基于计算的解量化值的能量,来计算分配给语音编码装置中在各个ADPCM量化器130a到130d中量化的各个残留信号的量化比特数。
正如以上所述,计算的量化比特数输出到各个ADPCM解量化器210a到210d中的解量化部分216,解量化部分216利用相应于自适应性比特分配器220中分配的比特数的比例因子对下一帧的码字进行解量化,并输出解码的残留信号。输出的解码的残留信号在加法器217中与从预测部分215输出的预测值相加成为解码的子带信号,解码的子带信号从每个ADPCM解量化器210a到210d中输出。
在ADPCM解量化器210a到210d中解量化的解码的子带信号在合成滤波器230中的向上采样器240a到240d中进行内插,并且在频带合成有限脉冲响应滤波器250a到250d中合成滤波。频带合成有限脉冲响应滤波器250a到250d的各个输出在加法器260a到260c中相加成为解码信号。其中,由于合成滤波器组230是一个余弦调制滤波器组,并且作为基本滤波器的频带合成有限脉冲响应滤波器250a到250d的脉冲响应是非对称的,因而发生在滤波器中的群时延得以下降,从而有可能减少大量的计算。
因此,按照本实施例的语音编码装置和语音解码装置,在语音编码装置中,每个频带的子带信号与预测值之间的残留信号被量化后输出码字,输出的码字被解量化以便计算解量化值的能量,并且基于计算的能量来确定在对每个残留信号的下一帧进行量化过程中分配的量化比特数。在语音解码装置中,与语音编码装置中解量化码字相同的码字被解量化,以便计算解量化值的能量,并且基于计算的能量,来计算在语音编码装置中确定的量化比特数,并分配给每个残留信号的下一帧。结果,语音编码装置能够自适应地分配给每个残留信号的量化比特数,甚至当语音编码装置改变分配的量化比特数时,语音解码装置能够进行与语音编码装置中比特分配变化同步的解量化而不必得知改变的比特分配的信息。相应地,由于语音编码装置不需通知语音解码装置改变的比特分配信息以便同步,这就有可能提高音质而不降低语音信息的传输效率。
(第二实施例)
按照本发明的第二实施例,语音编码装置和语音解码装置的特征是利用比例因子来确定量化比特数量的最佳值。另外,按照本发明的第二实施例,语音编码装置和语音解码装置的结构分别与第一实施例图2和图5中描述的语音编码装置和语音解码装置的结构相同,因而其描述在此省略。
图7是描述按照本发明的第二实施例的语音编码装置的主要结构的方框图。尽管图7中示出了ADPCM量化器130a和自适应比特分配器140a的结构,其它ADPCM量化器130b到130d与量化器130a的结构相同,并且都连接到比特分配器140a上。而且,与图3中相同的部分分配相同的参数,因此也在些省略描述。
在图7中,比例因子调整部分134a从核心比特提取部分133提取的核心比特计算比例因子,以将其输出到自适应比例分配器140a。解量化部分135a对核心比特提取部分133提取的核心比特进行解量化,并且输出解量化值到预测部分136和加法器137。自适应比特分配器140a基于各个ADPCM量化器130a到130d中计算的比例因子来确定分配给每个残留信号的量化比特数。
以上描述的语音编码装置的操作将在下文中描述。
分裂滤波器组100中分裂的子带信号分别输入到ADPCM量化器130a到130d。加法器131计算输入到各个ADPCM量化器130a到130d的子带信号与在预测部分136中计算的上一帧的预测值之间的残留信号,并且将计算的残留信号输入到量化部分132。残留信号在量化部分132中量化成带有由自适应比特分配器140a分配的量化比特数的码字。在比例因子调整部分134a中,利用计算的比例因子对残留信号进行量化。量化部分132中量化的码字输出到复用器150,也输出到核心比特提取部分133。该部分133删除LSB以提取核心比特。提取的核心比特输入到比例因子调整部分134a用以计算比例因子,同时输入到解量化部分135a。在这里,量化部分132中量化后的码字变得比例可变,以便保持比例因子的一致性。
解量化部分135a利用比例因子调整部分134a中计算的比例因子对核心比特进行解量化。根据通过对关键比例进行解量化得到的解量化值,预测部分136预测子带信号的下一帧的预测值。
比例因子诸如以音节周期为基础,每隔预定数量的帧输入到自适应性比特分配器140a。自适应性比特分配器140a以ADPCM量化器130a到130d输出的比例因子的平均值作为能量,并且如第一实施例中那样,确定分配给在各个ADPCM量化器130a到130d中量化的每个残留信号的量化比特数。
确定的量化比特数输出到ADPCM量化器130a到130d中各个量化部分132。正如以上描述的那样,每个量化部分132利用比例因子对下一帧的残留信号进行量化,并且输出带有分配比特数的码字。在ADPCM量化器130到130d中量化的码字在复用器150中复用成为复用信号的比特流。
按照本发明的第二实施例的语音解码装置将在下面描述。按照本发明的第二实施例的语音解码装置的结构与第一实施例的图5中描述的语音解码装置的结构相同,因而其描述在些略去。
图8是描述按照本发明的第二实施例的语音解码装置的主要结构的方框图。尽管图8示出了ADPCM解量化器210a和自适应性比特分配器220a的结构,其它ADPCM解量化器210b到210d具有与解量化器210a相同的结构,并且都连接到自适应比特分配器220a。
在图8中,核心比特提取部分211从输入到各个ADPCM解量化器210a到210d的码字中删除LSB以便提取核心比特。解量化部分212a对提取的核心比特进行解量化,并且将解量化值输出到加法器214和预测部分215。比例因子调整部分213a从提取的核心比特计算比例因子以便输出自适应比特分配器220a。加法器214计算解量化值与在预测部分215中计算的预测值之和。预测部分215利用解量化值和预测部分215的输出进行零点预测和极点预测,并且计算解码的子带信号的下一帧的预测值。解量化部分216利用比例因子每隔一定数量的、在自适应性比特分配器220a中计算的量化比特对输入码字进行解量化,并且输出解码的残留信号。加法器217计算从解量化部分216输出的解码残留信号与预测值之和,并且生成解码的子带信号。自适应性比特分配器220a基于各个ADPCM解量化器210a到210d中计算的比例因子,确定分配给每个残留信号的量化比特数。
以上描述的语音解码装置的操作将在下文中描述。
在解复用器200中分裂的码字输入到各个ADPCM解量化器210a到210d中。输入到各个ADPCM解量化器210a到210d的码字在解量化部分216中相应于自适应比特分配器220a所分配的量化比特数被解量化,并且输出解码的残留信号。在核心比特提取部分211中,从输入到各个ADPCM解量化器210a到210d的码字中删除LSB从而提取核心比特。提取的核心比特输入到比例因子调整部分213a以用于计算比例因子,同时也输入到解量化部分212a。在解量化部分212a中,利用在比例因子调整部分213a中计算的比例因子对核心比特进行解量化。通过对核心比特进行解量化得到的解量化值输入到预测部分215。预测部分215利用输入的解量化值计算解码的子带信号的下一帧的预测值。
比例因子诸如以音节周期为基础,每隔预定数量的帧输入到自适应性比特分配器220a。自适应性比特分配器220a以ADPCM解量化器210a到210d输出的比例因子的平均值作为能量,并且如第一实施例中那样,计算分配给在各个ADPCM量化器130a到130d中量化的每个残留信号的量化比特数。
计算的量化比特数输出到各个ADPCM量化器210a到210d中的解量化部分216。正如以上描述的那样,解量化部分216利用相应于在自适应比特分配器220a中分配的比特数的比例因子,对下一帧的码字进行解量化,并且输出解码的残留信号。输出的解码的残留信号在加法器217中与预测部分215输出的预测值相加成为解码的子带信号,解码的子带信号从每个ADPCM解量化器210a到210d输出。解码的子带信号在各个ADPCM解量化器210a到210d中解量化,并且在合成滤波器组230中合成成为解码的信号。
因此,按照本实施例的语音编码装置和语音解码装置,在语音编码装置中,每个频带的子带信号与预测值之间的残留信号被量化以输出码字,从输出的码字的核心比特计算得出了比例因子,并且基于该计算出的比例因子来确定每个残留信号的下一帧进行量化所分配的量化比特数。在语音解码装置中,利用与在语音编码装置中进行解量化时相同的码字计算出比例因子,并且基于计算出的比例因子,计算出在语音编码装置中确定的分配给每个残留信号的下一帧的量化比特数。结果,语音编码装置能够自适应地分配给每个残留信号的量化比特数,甚至当语音编码装置改变分配的量化比特数时,语音解码装置也能够同步于语音编码装置中比特分配的变化执行解量化而不必得到变化比特分配的信息。因此,就有可能提高音质而不降低语音信息发送的有效性。
另外,尽管以上提到的各个实施例描述的情况是,输入信号在分裂滤波器组中被分裂成四个子带信号,但本发明并不仅限于此,并且仅要求将输入信号分裂成相应于频带的多于两个的信号。另外,分裂数量的增加会提供信号被量化的平滑性,并且提高以后的比例因子的特性。而且,当分裂滤波器组是余弦调制滤波器组时,分裂数量的增加也会增加基本滤波器抽头的数量,并且抑制了时延的增加。
正如以上所述,按照本发明,就有可能提供改善音质的语音编码装置、语音解码装置以及语音编码/解码方法。
本发明并不局限于以上描述的实施例,在不偏离本发明精神的情况下可以进行各种变化和修改。
该申请是基于2001年11月13日提交的日本专利申请号2001-347408,其全部内容在本文中被合并参考。
Claims (17)
1、一种语音编码装置,用于在子带自适应性差分脉冲编码调制ADPCM方案中执行对语音信号的编码,所述装置包括:
量化部分(132),用于按照分配的比特数对给定的子带信号进行量化以生成码字;
提取部分(133),用于从生成的码字中提取核心比特;以及
确定部分,用于基于与提取的核心比特相对应的能量,确定量化部分(132)中使用的分配比特数的最佳值。
2、按照权利要求1所述的语音编码装置,其中所述确定部分包括用于对提取的核心比特进行解量化的解量化部分(135),并且
基于解量化部分(135)输出的解量化信号的能量,来确定分配比特数的最佳值。
3、按照权利要求2所述的语音编码装置,其中,对于从解量化部分输出的解量化信号的每个音节周期,所述确定部分基于解量化信号的能量确定分配比特数的最佳值。
4、按照权利要求1所述的语音编码装置,其中所述确定部分包括用于从提取的核心比特获取比例因子的比例因子获取部分,并且
基于被视作与提取的比例因子相对应的能量的获取的比例因子,确定分配比特数的最佳值。
5、按照权利要求4所述的语音编码装置,其中,所述确定部分还包括用于对提取的核心比特进行解量化的解量化部分(135),并且
对于从解量化部分(135)输出的解量化信号的每个音节周期,确定分配比特数的最佳值。
6、按照权利要求1所述的语音编码装置,其中,所述量化部分(132)生成比例可变化的码字。
7、按照权利要求1所述的语音编码装置,还包括:
分裂部分,用于将输入信号分裂成不同频带的多个信号,以便生成子带信号,
其中所述分裂部分具有余弦调制滤波器组,并且所述余弦调制滤波器组具有基本滤波器,因而其脉冲响应是非对称的。
8、一种语音解码装置,用于在子带自适应性差分脉冲编码调制ADPCM方案中执行对语音信号的解码,所述装置包括:
第一解量化部分(216),用于按照分配的比特数对给定码字进行解量化,以生成解码的子带信号;
提取部分(211),用于从给定的码字提供核心比特;以及
确定部分,用于基于与提取的核心比特相对应的能量,确定第一解量化部分(216)中使用的分配比特数的最佳值。
9、按照权利要求8所述的语音解码装置,其中所述确定部分包括用于对提取的核心比特进行解量化的第二解量化部分(212),并且
基于第二解量化部分(212)输出的解量化信号的能量来确定分配比特数的最佳值。
10、按照权利要求9所述的语音解码装置,其中,对于从第二解量化部分(212)输出的解量化信号的每个音节周期,所述确定部分确定分配比特数的最佳值。
11、按照权利要求8所述的语音解码装置,其中所述确定部分包括用于从提取的核心比特获取比例因子的比例因子获取部分(213),并且
基于被视作与提取的比例因子相对应的能量的获取的比例因子来确定分配比特数的最佳值。
12、按照权利要求11所述的语音解码装置,其中所述确定部分还包括用于对提取的核心比特进行解量化的第二解量化部分(212),并且
对于从第二解量化部分(212)输出的解量化信号的每个音节周期,确定分配比特数的最佳值。
13、按照权利要求8所述的语音解码装置,还包括:
合成部分,用于执行对第一解量化部分中生成的解码的子带信号的合成,
其中,合成部分具有一个余弦调制滤波器组,并且该余弦调制滤波器组具有基本滤波器,因而其脉冲响应是非对称的。
14、一种语音编码方法,用于在子带自适应性差分脉冲编码调制ADPCM方案对语音信号执行编码和解码,包括:
量化步骤,用于按照分配比特数的最佳值对给定的子带信号进行量化以生成码字;
提取步骤,用于从生成的码字提取核心比特;
获取步骤,用于基于与提取的核心比特相对应的能量获取分配比特数的最佳值;以及
量化步骤,用于按照获取的分配比特数的最佳值,对另一个给定子带信号进行量化以生成另一个码字。
15、一种语音解码方法,用于在子带自适应性差分脉冲编码调制ADPCM方案中执行对语音信号的解码,包括:
解量化步骤,用于按照分配比特数的最佳值,对给定码字进行解量化以生成解码的子带信号;
提取步骤,用于从给定的码字提取核心比特;
获取步骤,用于基于与提取的核心比特相对应的能量获取分配比特数的最佳值;以及
解量化步骤,用于按照获取的分配比特数的最佳值,对另一个码字进行解量化以生成另一个子带信号。
16、按照权利要求15所述的语音解码方法,其中,
在所述获取步骤中,与在编码中确定分配比特数的最佳值时所使用的码字相同的码字被解量化,并且,基于输出的解量化信号的能量,获取分配比特数的最佳值。
17、按照权利要求15所述的语音解码方法,其中,
在所述获取步骤中,与在编码中所使用的码字的核心比特相同的核心比特被提取,并从提取的核心比特中计算出比例因子,并且,基于计算的比例因子,确定分配比特数的最佳值。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP347408/01 | 2001-11-13 | ||
JP2001347408A JP4245288B2 (ja) | 2001-11-13 | 2001-11-13 | 音声符号化装置および音声復号化装置 |
JP347408/2001 | 2001-11-13 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1419349A CN1419349A (zh) | 2003-05-21 |
CN100440758C true CN100440758C (zh) | 2008-12-03 |
Family
ID=19160417
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB021504466A Expired - Fee Related CN100440758C (zh) | 2001-11-13 | 2002-11-12 | 语音编码装置、语音解码装置以及语音编码/解码方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US7155384B2 (zh) |
EP (1) | EP1310943B1 (zh) |
JP (1) | JP4245288B2 (zh) |
CN (1) | CN100440758C (zh) |
DE (1) | DE60217612T2 (zh) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1296888C (zh) * | 1999-08-23 | 2007-01-24 | 松下电器产业株式会社 | 音频编码装置以及音频编码方法 |
KR100956877B1 (ko) | 2005-04-01 | 2010-05-11 | 콸콤 인코포레이티드 | 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 방법 및장치 |
PT1875463T (pt) * | 2005-04-22 | 2019-01-24 | Qualcomm Inc | Sistemas, métodos e aparelho para nivelamento de fator de ganho |
JPWO2007129726A1 (ja) * | 2006-05-10 | 2009-09-17 | パナソニック株式会社 | 音声符号化装置及び音声符号化方法 |
US8812306B2 (en) | 2006-07-12 | 2014-08-19 | Panasonic Intellectual Property Corporation Of America | Speech decoding and encoding apparatus for lost frame concealment using predetermined number of waveform samples peripheral to the lost frame |
CN101325059B (zh) * | 2007-06-15 | 2011-12-21 | 华为技术有限公司 | 语音编解码收发方法及装置 |
KR101441897B1 (ko) | 2008-01-31 | 2014-09-23 | 삼성전자주식회사 | 잔차 신호 부호화 방법 및 장치와 잔차 신호 복호화 방법및 장치 |
JP5269195B2 (ja) * | 2009-05-29 | 2013-08-21 | 日本電信電話株式会社 | 符号化装置、復号装置、符号化方法、復号方法及びそのプログラム |
CN101989428B (zh) * | 2009-07-31 | 2012-07-04 | 华为技术有限公司 | 比特分配方法、编码方法、解码方法、编码器及解码器 |
CN102280107B (zh) | 2010-06-10 | 2013-01-23 | 华为技术有限公司 | 边带残差信号生成方法及装置 |
CN106409300B (zh) * | 2014-03-19 | 2019-12-24 | 华为技术有限公司 | 用于信号处理的方法和装置 |
CN110556117B (zh) * | 2018-05-31 | 2022-04-22 | 华为技术有限公司 | 立体声信号的编码方法和装置 |
CN111294147B (zh) * | 2019-04-25 | 2023-01-31 | 北京紫光展锐通信技术有限公司 | Dmr系统的编码方法及装置、存储介质、数字对讲机 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0433015B1 (en) * | 1989-12-11 | 1995-12-06 | Kabushiki Kaisha Toshiba | Variable bit rate coding system |
CN1208489A (zh) * | 1995-12-01 | 1999-02-17 | 数字剧场系统股份有限公司 | 采用心理声学自适应位分配方式的多通道预测子带编码器 |
Family Cites Families (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02264520A (ja) | 1989-04-04 | 1990-10-29 | Nec Corp | 帯域分割符号化復号方式並びに帯域分割符号化器及び帯域分割復号器 |
JP3111459B2 (ja) | 1990-06-11 | 2000-11-20 | ソニー株式会社 | 音声データの高能率符号化方法 |
CA2046369C (en) * | 1990-07-05 | 1997-04-15 | Naoji Fujino | High performance digitally multiplexed transmission system |
JPH05181497A (ja) | 1991-12-27 | 1993-07-23 | Toshiba Corp | ピッチ変換装置 |
JPH05183523A (ja) | 1992-01-06 | 1993-07-23 | Oki Electric Ind Co Ltd | 音声・楽音符号化装置 |
JPH0669811A (ja) | 1992-08-21 | 1994-03-11 | Oki Electric Ind Co Ltd | 符号化回路及び復号化回路 |
US5517511A (en) * | 1992-11-30 | 1996-05-14 | Digital Voice Systems, Inc. | Digital transmission of acoustic signals over a noisy communication channel |
US5493647A (en) | 1993-06-01 | 1996-02-20 | Matsushita Electric Industrial Co., Ltd. | Digital signal recording apparatus and a digital signal reproducing apparatus |
JP2888129B2 (ja) | 1994-03-15 | 1999-05-10 | 松下電器産業株式会社 | デジタル信号記録装置 |
JP3398457B2 (ja) | 1994-03-10 | 2003-04-21 | 沖電気工業株式会社 | 量子化スケールファクタ生成方法、逆量子化スケールファクタ生成方法、適応量子化回路、適応逆量子化回路、符号化装置及び復号化装置 |
IT1281001B1 (it) * | 1995-10-27 | 1998-02-11 | Cselt Centro Studi Lab Telecom | Procedimento e apparecchiatura per codificare, manipolare e decodificare segnali audio. |
JP3519859B2 (ja) | 1996-03-26 | 2004-04-19 | 三菱電機株式会社 | 符号器及び復号器 |
JP3263347B2 (ja) * | 1997-09-20 | 2002-03-04 | 松下電送システム株式会社 | 音声符号化装置及び音声符号化におけるピッチ予測方法 |
JPH11224099A (ja) * | 1998-02-06 | 1999-08-17 | Sony Corp | 位相量子化装置及び方法 |
JP2001007769A (ja) | 1999-04-22 | 2001-01-12 | Matsushita Electric Ind Co Ltd | 低遅延サブバンド分割/合成装置 |
US6226616B1 (en) | 1999-06-21 | 2001-05-01 | Digital Theater Systems, Inc. | Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility |
EP1104101A3 (en) | 1999-11-26 | 2005-02-02 | Matsushita Electric Industrial Co., Ltd. | Digital signal sub-band separating / combining apparatus achieving band-separation and band-combining filtering processing with reduced amount of group delay |
WO2001050458A1 (en) | 1999-12-31 | 2001-07-12 | Thomson Licensing S.A. | Subband adpcm voice encoding and decoding |
-
2001
- 2001-11-13 JP JP2001347408A patent/JP4245288B2/ja not_active Expired - Fee Related
-
2002
- 2002-10-23 US US10/277,827 patent/US7155384B2/en not_active Expired - Fee Related
- 2002-11-12 CN CNB021504466A patent/CN100440758C/zh not_active Expired - Fee Related
- 2002-11-12 EP EP02025094A patent/EP1310943B1/en not_active Expired - Fee Related
- 2002-11-12 DE DE60217612T patent/DE60217612T2/de not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0433015B1 (en) * | 1989-12-11 | 1995-12-06 | Kabushiki Kaisha Toshiba | Variable bit rate coding system |
CN1208489A (zh) * | 1995-12-01 | 1999-02-17 | 数字剧场系统股份有限公司 | 采用心理声学自适应位分配方式的多通道预测子带编码器 |
Also Published As
Publication number | Publication date |
---|---|
CN1419349A (zh) | 2003-05-21 |
EP1310943A2 (en) | 2003-05-14 |
US7155384B2 (en) | 2006-12-26 |
EP1310943B1 (en) | 2007-01-17 |
DE60217612T2 (de) | 2007-05-16 |
JP2003150198A (ja) | 2003-05-23 |
EP1310943A3 (en) | 2004-02-11 |
JP4245288B2 (ja) | 2009-03-25 |
US20030093266A1 (en) | 2003-05-15 |
DE60217612D1 (de) | 2007-03-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE60024123T2 (de) | Lpc-harmonischer sprachkodierer mit überrahmenformat | |
US6807526B2 (en) | Method of and apparatus for processing at least one coded binary audio flux organized into frames | |
US4677671A (en) | Method and device for coding a voice signal | |
EP0966793B1 (en) | Audio coding method and apparatus | |
US6625574B1 (en) | Method and apparatus for sub-band coding and decoding | |
CN100440758C (zh) | 语音编码装置、语音解码装置以及语音编码/解码方法 | |
KR100721537B1 (ko) | 광대역 음성 부호화기의 고대역 음성 부호화 장치 및 그방법 | |
US8396706B2 (en) | Speech coding | |
BRPI0709450A2 (pt) | codificação de sinal de informação | |
EP1498874B1 (en) | Wide-band speech signal compression and decompression apparatus, and method thereof | |
US20100161322A1 (en) | Encoding and decoding apparatuses for improving sound quality of g.711 codec | |
KR100912828B1 (ko) | G.711 코덱의 음질 향상을 위한 향상 계층 부호화 및 복호화 장치와 그 방법 | |
KR100262206B1 (ko) | 오디오신호에대한인코딩시스템및디코딩시스템 | |
JPH07334198A (ja) | 音声符号化装置 | |
Jbira et al. | Low delay coding of wideband audio (20 Hz-15 kHz) at 64 kbps | |
JP2581050B2 (ja) | 音声分析合成装置 | |
JPH0944194A (ja) | 音声符号化通信方式 | |
JPH0470800A (ja) | 音声情報圧縮装置 | |
JPH0744500B2 (ja) | 可変レート伝送に適した符号化復号方式及び装置 | |
Verdun | DIGITAL CODING OF SPEECH SIGNALS | |
JPH10233691A (ja) | 符号化方式および復号方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20081203 Termination date: 20091214 |