CN1419349A - 语音编码装置、语音解码装置以及语音编码/解码方法 - Google Patents

语音编码装置、语音解码装置以及语音编码/解码方法 Download PDF

Info

Publication number
CN1419349A
CN1419349A CN02150446A CN02150446A CN1419349A CN 1419349 A CN1419349 A CN 1419349A CN 02150446 A CN02150446 A CN 02150446A CN 02150446 A CN02150446 A CN 02150446A CN 1419349 A CN1419349 A CN 1419349A
Authority
CN
China
Prior art keywords
quantization
bits
core
signal
bit number
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN02150446A
Other languages
English (en)
Other versions
CN100440758C (zh
Inventor
番场裕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Publication of CN1419349A publication Critical patent/CN1419349A/zh
Application granted granted Critical
Publication of CN100440758C publication Critical patent/CN100440758C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

一种提高音质的语音编码装置和语音解码装置。在解量化部分(135)中得到的解量化值每隔预定帧数,诸如以倾斜周期为基础,就输入到自适应比特分配器(140)。自适应比特分配器(140)计算从各个ADPCM量化器(130a到130d)输出的解量化值的能量,即,即作为样本的解量化值的平方和,并且,基于所计算的解量化值的能量,来确定分配给各个ADPCM量化器(130a到130d)中量化的每个残留信号的比特数。

Description

语音编码装置、语音解码装置 以及语音编码/解码方法
技术领域
本发明涉及一种在子带ADPCM(自适应性差分脉冲编码调制)中的语音编码装置、语音解码装置以及语音编码/解码方法。
背景技术
通常,在子带ADPCM中使用的语音编码装置和语音解码装置,是遵照ITU-T(国际电信联盟电信部分)建议书G.722的装置。
图1图示了建议书G.722中描述的两个子带的ADPCM中使用的语音编码装置300和语音解码装置400的结构的方框图。
语音编码装置300是由24抽头分裂滤波器组(bank)310、ADPCM量化器320a和320b以及复用器330组成。所述的分裂滤波器组310将输入信号的频带分裂成两个子带并且输出子带信号。所述的ADPCM量化器320a和320b分别对两个分裂的子带信号进行量化。所述的复用器330将ADPCM量化器320a和330b中量化的码字进行复用以生成比特流。
同时,语音解码装置400由解复用器410、ADPCM解量化器420a和420b以及24抽头合成滤波器组430组成。所述的解复用器410输出用于从发送的数据流获取的每个子带的码字。所述的ADPCM解量化器420a和420b分别将来自解复用器410的用于每个子带的码字进行解量化,以便输出子带信号。所述的24抽头合成滤波器组430在子带信号上执行合成滤波。
下面将描述以上提到的分别图示的语音编码装置300和语音解码装置400的操作。
在分裂滤波器组310中,输入信号的频带被分裂成两个子带并且生成了两个子带信号。每个子带信号被分配预定数量的比特并且分别在ADPCM量化器320a和320b中被量化。量化得到的码字在复用器330中被复用成为比特流。
同时,在语音解码装置400中,带有多个被复用的码字的比特流在解复用器410中被解复用成为用于每个子带的码字。通过解复用得到的用于每个子带的码字在ADPCM解量化器420a和420b中被解量化成为子带信号。子带信号在合成滤波器组430中被合成成为解码信号。
然而,在以上描述的传统的语音编码装置和语音解码装置中,由于分配给语音编码装置中ADPCM量化器中的每个子带信号的量化比特的数量是固定的,特别地,当输入信号的采样频率变高时,就存在比特分配不佳的危险,并且解码信号的音质(audio quality)会在语音解码装置中恶化。
发明内容
本发明的目的就是为了提高音质。
本发明的一个主题是,在子带ADPCM编码中,通过从上一帧来计算下一帧的预测值的处理过程来判断分配给每个残留信号的下一帧的量化比特数,从而自适应性地改变比特的分配,其中,在用于从输入信号分裂的每个频带的多个子带信号与各自的预测值之间的残留信号都被量化,并且,每个量化的输出都被解量化,以计算子带信号的下一帧的预测值。
按照本发明的一方面,提供了一种语音编码装置,用于以子带ADPCM方案对语音信号进行编码,该语音编码装置具有生成部分和判决部分,所述的生成部分用以根据分配的比特数对给定的子带信号进行量化以便生成码字,所述的判决部分用于确定生成部分使用的最佳的分配比特数。
按照本发明的另一方面,提供了一种语音解码装置,用于以子带ADPCM方案对语音信号进行解码,该语音解码装置具有生成部分和判决部分,所述的生成部分用以根据分配的比特数对给定的码字进行解量化以便生成解码的子带信号,所述的判决部分用于确定生成部分使用的最佳的分配比特数。
按照本发明的再一方面,提供了一种语音编码/解码方法,用于以子带ADPCM方案对语音信号进行编码和解码,该语音编码/解码方法包括判决步骤、量化步骤、获取步骤以及解量化步骤,其中,所述的判决步骤用于判断分配比特的最佳数值来对给定子带信号进行量化,所述的量化步骤用于根据已确定的分配比特的最佳数值生成码字,所述的获取步骤用于根据码字来获取分配比特的最佳数值,所述的解量化步骤用于根据获取的分配比特的最佳数值来对码字进行解量化,从而生成解码的子带信号。
附图说明
随着接下来结合附图的详细描述,本发明的以上以及其它目的和特征将变得更清晰。在这些附图中都以举例方式对各个实例加以描述,附图中:
图1是描述在两个子带ADPCM中使用的传统的语音编码装置和语音解码装置的方框图;
图2是描述按照本发明的第一和第二实施例的语音编码装置的结构的方框图;
图3是描述按照本发明的第一实施例的语音编码装置和主要结构的方框图;
图4图示了按照本发明的第一实施例的对分配的比特数进行量化的例子;
图5是描述按照本发明的第一和第二实施例的语音解码装置的结构的方框图;
图6是描述按照本发明的第一实施例的语音解码装置的结构的方框图;
图7是描述按照本发明的第二实施例的语音编码装置的主要结构的方框图;
图8是描述按照本发明的第二实施例的语音解码装置的主要结构的方框图。
具体实施方式
接下来将参照附图详细描述本发明的实施例。
(第一实施例)
图2是描述按照本发明的第一实施例的语音编码装置的结构的方框图。在图2中,分裂滤波器组100将输入信号的频带分裂成四个具相同带宽的子带,并且执行了变窄过程,该变窄过程利用分裂的数量“4”作为其变窄系数。分裂滤波器组100中的频带分裂有限脉冲响应滤波器110a到110d对用于预定频带的输入信号执行分裂滤波。分裂滤波器组100是一个余弦调制滤波器组,频带分裂有限脉冲响应(FIR)滤波器110a到110d都是基本(basic)滤波器,但其脉冲响应并不对称。
而且,分裂滤波器组100中向下采样器120a到120d对频带分裂有限脉冲响应滤波器110a到110d的各个输出分别执行变窄过程,为了有效编码,使用了与分裂滤波器组100中分裂的数量相同的“4”作为其变窄的系数,并且输出相应的子带信号。
每个ADPCM量化器130a到130d分别对相应的子带信号与根据子带信号的上一帧计算得出的预定值之间的残留信号进行量化,并且输出比例可变的(scalable)码字。而且,每个ADPCM量化器130a到130d根据残留信号来计算解量化值以及比例因子。
自适应性比特分配器140基于ADPCM量化器130a到130d中相应的一个量化器计算出的解量化值的能量值,来判断分配给每个残留信号的量化比特的数量。
复用器150对ADPCM量化器130a到130d输出的码字进行复用,并生成复用信号的比特流。
图3是描述按照本发明的第一实施例的语音编码装置的主要结构的方框图。尽管图3描述了ADPCM量化器130a和自适应性比特分配器140的结构,其它ADPCM量化器130b到130d与量化器130a具有相同的结构,并且都与自适应性比特分配器140相连。
在图3中,加法器131计算输入到ADPCM量化器130a到130d中相应的一个量化器的子带信号与预定值之差并且生成残留信号。量化部分132利用比例因子对生成的残留信号进行量化,并输出码字,该码字带有自适应性比特分配器140中确定的量化比特数。核心比特(core bit)提取部分133从量化部分132输出的码字中删除最低有效的比特(下文中称为“LSB”)以便提取核心比特。比例因子调整部分134从提取的核心比特来计算比例因子。解量化部分135对提取的核心比特进行解量化,并且输出解量化值到预测部分136、加法器137以及自适应性比特分配器140。预测部分136利用解量化值以及预测部分136的输出执行零点预测和极点预测,并且计算出子带信号的下一帧的预测值。加法器137计算解量化值与预测部分136中计算得出的预测值之和。
接下来将描述以上提到的语音编码装置的操作。
输入到语音编码装置的语音信号在分裂滤波器组100中被分裂成四个子带信号。由于分裂滤波器组100是一个余弦调制滤波器组并且频带分裂有限脉冲滤波器110a到110d的脉冲输出是不均匀的,发生在滤波器中的群时延(group delay)得到下降,因而有可能减少大量的计算。分裂的子带信号分别输入到ACDCM量化器130a到130d。
加法器131计算输入到每个ADPCM量化器130a到130d的子带信号与在预测部分136中从上一帧计算出的预定值之间的残留信号,并将计算出的残留信号输入到量化部分132。残留信号在量化部分132被量化成码字,该码字带有自适应性比特分配器140分配的量化比特数。在比例因子调整部分134中,利用计算的比例因子对残留信号进行量化。在量化部分132中量化的码字输出到解复用器150以及核心比特提取部分133,该核心比特提取部分133删除LSB,以便提取核心比特。提取的比特输入到用于计算比例因子的比例因子自适应性部分134,并且输入到解量化部分135。其中,在量化部分132中量化码字变为可调整的,以便保持比例因子的一致性。
解量化部分135利用比例因子调整部分134计算的比例因子对核心比特进行解量化。通过对核心比特进行解量化得到的解量化值被输入预测部份136。该输入值称为零点预测输入值。解量化值在加法器137中与预测部分136输出的上一帧的预测值相加,然后再次输入到预测部分136。该输入值称为极点预测输入值。利用零点预测输入值和极点预测输入值,预测部分136计算子带信号的下一帧的预测值。
解量化值诸如以音节周期(pitch period)为基础,每隔预定数量的帧输入到自适应性比特分配器140。自适应性比特分配器140计算从每个ADPCM量化器130a到130d输出的解量化值的能量,即将量化值的平方和作为样本值,并且基于计算的解量化值的能量来确定分配给ADPCM量化器130a到130d中相应的一个量化器中量化的残留信号的比特数。
确定的量化比特数量输出到相应的ADPCM量化器130a到130d中的相应量化部分132。正如以上所描述的那样,每个量化部分132利用比例因子对下一帧的残留信号进行量化,并且输出带有分配比特数量的码字。在ADPCM量化器130a到130d中量化的码字在复用器150中被复用,成为复用信号的比特流。
图4描述了量化比特数量分配的示例。在图4中,用斜线显示的比特表示每个频带中的核心比特。在第一频带中,核心比特的数量是五个,在第二频带中是四个,在第三频带中三个,在第四频带中两个。每个频带中的核心比特总是定值,自适应比特分配器140自适应地分配的比特是两个,在图4中以白色显示。这两个比特相应于解量化值的能量被自适应地分配到每个频带。
按照第一实施例的语音解码装置将在下文中描述。
图5是描述按照本发明的第一实施例的语音解码装置的结构的方框图。在图5中,解复用器200每隔一定数量的由下面提到的自适应比特分配器220分配的比特数将输入比特流分解,从而将比特流分裂成用于每个子带的码字。每个ADPCM解量化器210a到210d输出解码的残留信号之和来作为解码的子带信号,所述的残留信号是通过对各个码字以及由上一帧的码字计算的预测值进行量化所得到的。而且,每个ADPCM解量化器210a到210d仅计算那些从码字删除LSB而得到的核心比特的解量化值以及比例因子。基于每个ADPCM解量化器210a到210d中计算的核心比特的解量化值的能量,自适应性比特分配器220计算分配给语音编码装置中各个残留信号的量化比特数量。
合成滤波器组230将ADPCM解量化器210a到210d输出的子带信号组合从而得到解码信号。合成滤波器组230中的向上采样器240a到240d对变窄的子带信号分别执行内插。合成滤波器组230中的频带合成有限脉冲滤波器组250a到250d对相应的内插解码的子带信号进行合成滤波。合成滤波器组230是一个余弦调制过滤器组,作为基本滤波器的频带合成有限脉冲滤波器组250a到250d的脉冲响应是不均匀的。
图6是描述按照本发明的第一实施例的语音解码装置的主要结构的方框图。尽管图6中描述了ADPCM解量化器210a和自适应性比特分配器220的结构,其它ADPCM解量化器210b到210d具有与解量化器210a相同的结构,并且连接到自适应性比特分配器220上。
在图6中,核心比特提取部分211从输入到相应ADPCM解量化器210a到210d的码字中删除LSB以便提取核心比特。解量化部分212对提取的核心比特解量化,并且将解量化的值输出到加法器214、预测部分215以及自适应性比特分配器220。比例因子调整部分213从提取的核心比特计算比例因子。加法器214计算解量化值与在预测部分215中计算的预测值的和。预测部分215利用解量化值和预测部分215的输出来执行零点预测和极点预测,并且计算解码子带信号的下一帧的预测值。解量化部分216利用比例因子每隔一定数量的、在自适应性比特分配器220中计算的量化比特对输入码字进行解量化,并且输出解码的残留信号。加法器217计算解量化部分216输出的解码残留信号与预测值之和,以生成解码子带信号。
以上提到的语音解码装置的操作将在下文中描述。
输入到语音解码装置的比特流每隔一定数量的、由比特分配器220分配的量化比特被分解,从而分裂成每四个子带的码字。分裂的码字输入到相应的解量化器210a到210d。
相应于由自适应性比特分配器220分配的量化比特数,输入到每个ADPCM解量化器210a到210d的码字在解量化部分216中被解量化并作为解码的残留信号输出。从ADPCM解量化器210a到210d中相应的一个量化器的码字输入中删除LSB,从而在核心比特提取部分211提取到核心比特。提取的核心比特输入到比例因子调整部分213用于计算比例因子,并且也输入到解量化部分212。在解量化部分212,使用在比例因子调整部分213中计算出的比例因子对核心比特解量化。对核心比特进行解量化得到的解量化值输入到预测部分215。该输入值称为零预测输入值。解量化值在加法器214中与从预测部分215输出的上一帧的预测值相加,并且被再次输入到预测部分215。该输入值称为极点预测输入值。利用零点预测输入值和极点预测输入值,预测部分215计算解码的子带信号的下一帧的预测值。
解量化值诸如以音节周期为基础,每隔预定数量的帧输入到自适应性比特分配器220。自适应比特分配器220计算从每个ADPCM量化器210a到210d输出的解量化值的能量,即以解量化值的平方和为样本值,并且基于计算的解量化值的能量,来计算分配给语音编码装置中在各个ADPCM量化器130a到130d中量化的各个残留信号的量化比特数。
正如以上所述,计算的量化比特数输出到各个ADPCM解量化器210a到210d中的解量化部分216,解量化部分216利用相应于自适应性比特分配器220中分配的比特数的比例因子对下一帧的码字进行解量化,并输出解码的残留信号。输出的解码的残留信号在加法器217中与从预测部分215输出的预测值相加成为解码的子带信号,解码的子带信号从每个ADPCM解量化器210a到210d中输出。
在ADPCM解量化器210a到210d中解量化的解码的子带信号在合成滤波器230中的向上采样器240a到240d中进行内插,并且在频带合成有限脉冲响应滤波器250a到250d中合成滤波。频带合成有限脉冲响应滤波器250a到250d的各个输出在加法器260a到260c中相加成为解码信号。其中,由于合成滤波器组230是一个余弦调制滤波器组,并且作为基本滤波器的频带合成有限脉冲响应滤波器250a到250d的脉冲响应是不均匀的,因而发生在滤波器中的群时延得以下降,从而有可能减少大量的计算。
因此,按照本实施例的语音编码装置和语音解码装置,在语音编码装置中,每个频带的子带信号与预测值之间的残留信号被量化后输出码字,输出的码字被解量化以便计算解量化值的能量,并且基于计算的能量来确定在对每个残留信号的下一帧进行量化过程中分配的量化比特数。在语音解码装置中,与语音编码装置中解量化码字相同的码字被解量化,以便计算解量化值的能量,并且基于计算的能量,来计算在语音编码装置中确定的量化比特数,并分配给每个残留信号的下一帧。结果,语音编码装置能够自适应地分配给每个残留信号的量化比特数,甚至当语音编码装置改变分配的量化比特数时,语音解码装置能够进行与语音编码装置中比特分配变化同步的解量化而不必得知改变的比特分配的信息。相应地,由于语音编码装置不需通知语音解码装置改变的比特分配信息以便同步,这就有可能提高音质而不降低语音信息的传输效率。
(第二实施例)
按照本发明的第二实施例,语音编码装置和语音解码装置的特征是利用比例因子来确定量化比特数量的最佳值。另外,按照本发明的第二实施例,语音编码装置和语音解码装置的结构分别与第一实施例图2和图5中描述的语音编码装置和语音解码装置的结构相同,因而其描述在此省略。
图7是描述按照本发明的第二实施例的语音编码装置的主要结构的方框图。尽管图7中示出了ADPCM量化器130a和自适应比特分配器140a的结构,其它ADPCM量化器130b到130d与量化器130a的结构相同,并且都连接到比特分配器140a上。而且,与图3中相同的部分分配相同的参数,因此也在些省略描述。
在图7中,比例因子调整部分134a从核心比特提取部分133提取的核心比特计算比例因子,以将其输出到自适应比例分配器140a。解量化部分135a对核心比特提取部分133提取的核心比特进行解量化,并且输出解量化值到预测部分136和加法器137。自适应比特分配器140a基于各个ADPCM量化器130a到130d中计算的比例因子来确定分配给每个残留信号的量化比特数。
以上描述的语音编码装置的操作将在下文中描述。
分裂滤波器组100中分裂的子带信号分别输入到ADPCM量化器130a到130d。加法器131计算输入到各个ADPCM量化器130a到130d的子带信号与在预测部分136中计算的上一帧的预测值之间的残留信号,并且将计算的残留信号输入到量化部分132。残留信号在量化部分132中量化成带有由自适应比特分配器140a分配的量化比特数的码字。在比例因子调整部分134a中,利用计算的比例因子对残留信号进行量化。量化部分132中量化的码字输出到复用器150,也输出到核心比特提取部分133。该部分133删除LSB以提取核心比特。提取的核心比特输入到比例因子调整部分134a用以计算比例因子,同时输入到解量化部分135a。在这里,量化部分132中量化后的码字变得比例可变,以便保持比例因子的一致性。
解量化部分135a利用比例因子调整部分134a中计算的比例因子对核心比特进行解量化。根据通过对关键比例进行解量化得到的解量化值,预测部分136预测子带信号的下一帧的预测值。
比例因子诸如以音节周期为基础,每隔预定数量的帧输入到自适应性比特分配器140a。自适应性比特分配器140a以ADPCM量化器130a到130d输出的比例因子的平均值作为能量,并且如第一实施例中那样,确定分配给在各个ADPCM量化器130a到130d中量化的每个残留信号的量化比特数。
确定的量化比特数输出到ADPCM量化器130a到130d中各个量化部分132。正如以上描述的那样,每个量化部分132利用比例因子对下一帧的残留信号进行量化,并且输出带有分配比特数的码字。在ADPCM量化器130到130d中量化的码字在复用器150中复用成为复用信号的比特流。
按照本发明的第二实施例的语音解码装置将在下面描述。按照本发明的第二实施例的语音解码装置的结构与第一实施例的图5中描述的语音解码装置的结构相同,因而其描述在些略去。
图8是描述按照本发明的第二实施例的语音解码装置的主要结构的方框图。尽管图8示出了ADPCM解量化器210a和自适应性比特分配器220a的结构,其它ADPCM解量化器210b到210d具有与解量化器210a相同的结构,并且都连接到自适应比特分配器220a。
在图8中,核心比特提取部分211从输入到各个ADPCM解量化器210a到210d的码字中删除LSB以便提取核心比特。解量化部分212a对提取的核心比特进行解量化,并且将解量化值输出到加法器214和预测部分215。比例因子调整部分213a从提取的核心比特计算比例因子以便输出自适应比特分配器220a。加法器214计算解量化值与在预测部分215中计算的预测值之和。预测部分215利用解量化值和预测部分215的输出进行零点预测和极点预测,并且计算解码的子带信号的下一帧的预测值。解量化部分216利用比例因子每隔一定数量的、在自适应性比特分配器220a中计算的量化比特对输入码字进行解量化,并且输出解码的残留信号。加法器217计算从解量化部分216输出的解码残留信号与预测值之和,并且生成解码的子带信号。自适应性比特分配器220a基于各个ADPCM解量化器210a到210d中计算的比例因子,确定分配给每个残留信号的量化比特数。
以上描述的语音解码装置的操作将在下文中描述。
在解复用器200中分裂的码字输入到各个ADPCM解量化器210a到210d中。输入到各个ADPCM解量化器210a到210d的码字在解量化部分216中相应于自适应比特分配器220a所分配的量化比特数被解量化,并且输出解码的残留信号。在核心比特提取部分211中,从输入到各个ADPCM解量化器210a到210d的码字中删除LSB从而提取核心比特。提取的核心比特输入到比例因子调整部分213a以用于计算比例因子,同时也输入到解量化部分212a。在解量化部分212a中,利用在比例因子调整部分213a中计算的比例因子对核心比特进行解量化。通过对核心比特进行解量化得到的解量化值输入到预测部分215。预测部分215利用输入的解量化值计算解码的子带信号的下一帧的预测值。
比例因子诸如以音节周期为基础,每隔预定数量的帧输入到自适应性比特分配器220a。自适应性比特分配器220a以ADPCM解量化器210a到210d输出的比例因子的平均值作为能量,并且如第一实施例中那样,计算分配给在各个ADPCM量化器130a到130d中量化的每个残留信号的量化比特数。
计算的量化比特数输出到各个ADPCM量化器210a到210d中的解量化部分216。正如以上描述的那样,解量化部分216利用相应于在自适应比特分配器220a中分配的比特数的比例因子,对下一帧的码字进行解量化,并且输出解码的残留信号。输出的解码的残留信号在加法器217中与预测部分215输出的预测值相加成为解码的子带信号,解码的子带信号从每个ADPCM解量化器210a到210d输出。解码的子带信号在各个ADPCM解量化器210a到210d中解量化,并且在合成滤波器组230中合成成为解码的信号。
因此,按照本实施例的语音编码装置和语音解码装置,在语音编码装置中,每个频带的子带信号与预测值之间的残留信号被量化以输出码字,从输出的码字的核心比特计算得出了比例因子,并且基于该计算出的比例因子来确定每个残留信号的下一帧进行量化所分配的量化比特数。在语音解码装置中,利用与在语音编码装置中进行解量化时相同的码字计算出比例因子,并且基于计算出的比例因子,计算出在语音编码装置中确定的分配给每个残留信号的下一帧的量化比特数。结果,语音编码装置能够自适应地分配给每个残留信号的量化比特数,甚至当语音编码装置改变分配的量化比特数时,语音解码装置也能够同步于语音编码装置中比特分配的变化执行解量化而不必得到变化比特分配的信息。因此,就有可能提高音质而不降低语音信息发送的有效性。
另外,尽管以上提到的各个实施例描述的情况是,输入信号在分裂滤波器组中被分裂成四个子带信号,但本发明并不仅限于此,并且仅要求将输入信号分裂成相应于频带的多于两个的信号。另外,分裂数量的增加会提供信号被量化的平滑性,并且提高以后的比例因子的特性。而且,当分裂滤波器组是余弦调制滤波器组时,分裂数量的增加也会增加基本滤波器抽头的数量,并且抑制了时延的增加。
正如以上所述,按照本发明,就有可能提供改善音质的语音编码装置、语音解码装置以及语音编码/解码方法。
本发明并不局限于以上描述的实施例,在不偏离本发明精神的情况下可以进行各种变化和修改。
该申请是基于2001年11月13日提交的日本专利申请号2001-347408,其全部内容在本文中被合并参考。

Claims (18)

1、一种语音编码装置,用于在子带ADPCM方案中执行对语音信号的编码,所述装置包括:
生成部分,用于按照分配的比特对给定的子带信号进行量化以生成码字;及
判决部分,用于判断生成部分中使用的分配比特数的最佳值。
2、按照权利要求1所述的语音编码装置,其中所述的判断部分包括:
核心比特提取部分,用于从生成部分生成的码字中提取核心比特;及
解量化部分,用于对提取的核心比特进行解量化,并且
基于解量化部分输出的解量化信号的能量,来确定生成部分中使用的分配比特数的最佳值。
3、按照权利要求2所述的语音编码装置,其中,对于从解量化部分输出的解量化信号的每个音节周期,判决部分基于解量化信号的能量判断分配比特数的最佳值。
4、按照权利要求1所述的语音编码装置,其中判决部分包括:
核心比特提取部分,用于从生成部分生成的码字提取核心比特;及
比例因子获取部分,用于从提取的核心比特获得比例因子,并且
基于比例因子获取部分获取的比例因子来确定生成部分使用的分配比特数的最佳值。
5、按照权利要求4所述的语音编码装置,其中,所述的判决部分还包括解量化部分,用于对核心比特提取部分中提取的核心比特进行解量化,并且,对于从解量化部分输出的解量化信号的每个音节周期,判决部分基于比例因子来判断分配比特数的最佳值。
6、按照权利要求1所述的语音编码装置,其中,生成部分生成比例可变化的码字。
7、按照权利要求1所述的语音编码装置,还包括:
分裂部分,用于将输入信号分裂成不同频带的多个信号,以便生成子带信号,其中所述的分裂部分具有余弦调制滤波器组,并且所述的余弦调制滤波器组具有基本滤波器,其脉冲响应不均匀。
8、一种语音解码装置,用于在子带ADPCM方案中执行对语音信号的解码,所述装置包括:
生成部分,用于按照分配的比特数对给定码字解量化,并且生成解码的子带信号;及
判决部分,用于判断生成部分中使用的分配比特数的最佳值。
9、按照权利要求8所述的语音解码装置,其中所述的判决部分包括:
核心比特提取部分,用于从给定的码字提取核心比特;及
解量化部分,用于对提取的核心比特进行解量化,并且基于解量化部分输出的解量化信号的能量来判断生成部分使用的分配比特数的最佳值。
10、按照权利要求9所述的语音解码装置,其中,对于从解量化部分输出的解量化信号的每个音节周期,判决部分基于解量化信号的能量判断分配比特数的最佳值。
11、按照权利要求8所述的语音解码装置,其中所述的判决部分包括:
核心比特提取部分,用于从给定的码字中提取核心比特;及
比例因子获到部分,用于从提取的核心比特中获取比例因子,并且基于比例因子获取部分中获取的比例因子来判断生成部分使用的分配比特数的最佳值。
12、按照权利要求11所述的语音解码装置,其中所述的判决部分还包括解量化部分,用于对核心比特提取部分中提取的核心比特进行解量化,并且,对于从解量化部分输出的解量化信号的每个音节周期,判决部分基于比例因子来判断分配比特数的最佳值。
13、按照权利要求8所述的语音解码装置,还包括:
合成部分,用于执行对生成部分中生成的解码的子带信号的合成,
其中,合成部分具有一个余弦调制滤波器组,并且该余弦调制滤波器组具有一个基本滤波器,因而其脉冲响应是不均匀的。
14、一种数字无线麦克风发送系统,具有按照权利要求1所述的语音编码装置发送。
15、一种数字无线麦克风接收系统,具有按照权利要求1所述的语音解码装置。
16、一种语音编码/解码方法,用于以子带ADPCM方案对语音信号执行编码和解码,包括:
判决步骤,用于判断对给定子带信号进行量化的分配比特数的最佳值;
量化步骤,用于按照确定的分配比特数的最佳值对子带信号进行量化以生成码字;
获取步骤,用于获取基于码字的分配比特数的最佳值;及
解量化步骤,用于按照获取的分配比特数的最佳值,对码字进行解量化以生成解码的子带信号。
17、按照权利要求16所述的语音编码/解码方法,其中,在所述的判决步骤中,通过对给定子带信号的上一帧的子带信号进行量化得到的码字被解量化,并且基于输出的解量化信号的能量,判断出分配比特数的最佳值,以及
在所述的获取步骤中,与判决步骤中使用的相同的码字被解量化,并且,基于输出的解量化信号的能量,获得分配比特数的最佳值。
18、按照权利要求16所述的语音编码/解码方法,其中,在所述的判决步骤中,核心比特是从通过对给定子带信号的上一帧的子带信号进行量化所得到的码字提取的,比例因子从提取的核心比特中计算,并且基于计算的比例因子,确定分配比特数的最佳值,以及
在所述的获取步骤中,与判决部分使用相同的核心比特被提取,并从提取的核心比特中计算出比例因子,并且,基于计算的比例因子,确定分配比特数的最佳值。
CNB021504466A 2001-11-13 2002-11-12 语音编码装置、语音解码装置以及语音编码/解码方法 Expired - Fee Related CN100440758C (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP347408/01 2001-11-13
JP2001347408A JP4245288B2 (ja) 2001-11-13 2001-11-13 音声符号化装置および音声復号化装置
JP347408/2001 2001-11-13

Publications (2)

Publication Number Publication Date
CN1419349A true CN1419349A (zh) 2003-05-21
CN100440758C CN100440758C (zh) 2008-12-03

Family

ID=19160417

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB021504466A Expired - Fee Related CN100440758C (zh) 2001-11-13 2002-11-12 语音编码装置、语音解码装置以及语音编码/解码方法

Country Status (5)

Country Link
US (1) US7155384B2 (zh)
EP (1) EP1310943B1 (zh)
JP (1) JP4245288B2 (zh)
CN (1) CN100440758C (zh)
DE (1) DE60217612T2 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011153913A1 (zh) * 2010-06-10 2011-12-15 华为技术有限公司 边带残差信号生成方法及装置
CN101325059B (zh) * 2007-06-15 2011-12-21 华为技术有限公司 语音编解码收发方法及装置
CN102414990A (zh) * 2009-05-29 2012-04-11 日本电信电话株式会社 编码装置、解码装置、编码方法、解码方法及其程序
CN101989428B (zh) * 2009-07-31 2012-07-04 华为技术有限公司 比特分配方法、编码方法、解码方法、编码器及解码器
CN104934034A (zh) * 2014-03-19 2015-09-23 华为技术有限公司 用于信号处理的方法和装置
CN111294147A (zh) * 2019-04-25 2020-06-16 北京展讯高科通信技术有限公司 Dmr系统的编码方法及装置、存储介质、数字对讲机

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1296888C (zh) * 1999-08-23 2007-01-24 松下电器产业株式会社 音频编码装置以及音频编码方法
KR100956877B1 (ko) 2005-04-01 2010-05-11 콸콤 인코포레이티드 스펙트럼 엔벨로프 표현의 벡터 양자화를 위한 방법 및장치
PT1875463T (pt) * 2005-04-22 2019-01-24 Qualcomm Inc Sistemas, métodos e aparelho para nivelamento de fator de ganho
JPWO2007129726A1 (ja) * 2006-05-10 2009-09-17 パナソニック株式会社 音声符号化装置及び音声符号化方法
US8812306B2 (en) 2006-07-12 2014-08-19 Panasonic Intellectual Property Corporation Of America Speech decoding and encoding apparatus for lost frame concealment using predetermined number of waveform samples peripheral to the lost frame
KR101441897B1 (ko) 2008-01-31 2014-09-23 삼성전자주식회사 잔차 신호 부호화 방법 및 장치와 잔차 신호 복호화 방법및 장치
CN110556117B (zh) * 2018-05-31 2022-04-22 华为技术有限公司 立体声信号的编码方法和装置

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02264520A (ja) 1989-04-04 1990-10-29 Nec Corp 帯域分割符号化復号方式並びに帯域分割符号化器及び帯域分割復号器
JPH03181232A (ja) 1989-12-11 1991-08-07 Toshiba Corp 可変レート符号化方式
JP3111459B2 (ja) 1990-06-11 2000-11-20 ソニー株式会社 音声データの高能率符号化方法
CA2046369C (en) * 1990-07-05 1997-04-15 Naoji Fujino High performance digitally multiplexed transmission system
JPH05181497A (ja) 1991-12-27 1993-07-23 Toshiba Corp ピッチ変換装置
JPH05183523A (ja) 1992-01-06 1993-07-23 Oki Electric Ind Co Ltd 音声・楽音符号化装置
JPH0669811A (ja) 1992-08-21 1994-03-11 Oki Electric Ind Co Ltd 符号化回路及び復号化回路
US5517511A (en) * 1992-11-30 1996-05-14 Digital Voice Systems, Inc. Digital transmission of acoustic signals over a noisy communication channel
US5493647A (en) 1993-06-01 1996-02-20 Matsushita Electric Industrial Co., Ltd. Digital signal recording apparatus and a digital signal reproducing apparatus
JP2888129B2 (ja) 1994-03-15 1999-05-10 松下電器産業株式会社 デジタル信号記録装置
JP3398457B2 (ja) 1994-03-10 2003-04-21 沖電気工業株式会社 量子化スケールファクタ生成方法、逆量子化スケールファクタ生成方法、適応量子化回路、適応逆量子化回路、符号化装置及び復号化装置
IT1281001B1 (it) * 1995-10-27 1998-02-11 Cselt Centro Studi Lab Telecom Procedimento e apparecchiatura per codificare, manipolare e decodificare segnali audio.
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
JP3519859B2 (ja) 1996-03-26 2004-04-19 三菱電機株式会社 符号器及び復号器
JP3263347B2 (ja) * 1997-09-20 2002-03-04 松下電送システム株式会社 音声符号化装置及び音声符号化におけるピッチ予測方法
JPH11224099A (ja) * 1998-02-06 1999-08-17 Sony Corp 位相量子化装置及び方法
JP2001007769A (ja) 1999-04-22 2001-01-12 Matsushita Electric Ind Co Ltd 低遅延サブバンド分割/合成装置
US6226616B1 (en) 1999-06-21 2001-05-01 Digital Theater Systems, Inc. Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility
EP1104101A3 (en) 1999-11-26 2005-02-02 Matsushita Electric Industrial Co., Ltd. Digital signal sub-band separating / combining apparatus achieving band-separation and band-combining filtering processing with reduced amount of group delay
WO2001050458A1 (en) 1999-12-31 2001-07-12 Thomson Licensing S.A. Subband adpcm voice encoding and decoding

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101325059B (zh) * 2007-06-15 2011-12-21 华为技术有限公司 语音编解码收发方法及装置
CN102414990A (zh) * 2009-05-29 2012-04-11 日本电信电话株式会社 编码装置、解码装置、编码方法、解码方法及其程序
CN101989428B (zh) * 2009-07-31 2012-07-04 华为技术有限公司 比特分配方法、编码方法、解码方法、编码器及解码器
WO2011153913A1 (zh) * 2010-06-10 2011-12-15 华为技术有限公司 边带残差信号生成方法及装置
US9123329B2 (en) 2010-06-10 2015-09-01 Huawei Technologies Co., Ltd. Method and apparatus for generating sideband residual signal
CN104934034A (zh) * 2014-03-19 2015-09-23 华为技术有限公司 用于信号处理的方法和装置
WO2015139477A1 (zh) * 2014-03-19 2015-09-24 华为技术有限公司 用于信号处理的方法和装置
CN104934034B (zh) * 2014-03-19 2016-11-16 华为技术有限公司 用于信号处理的方法和装置
US10134402B2 (en) 2014-03-19 2018-11-20 Huawei Technologies Co., Ltd. Signal processing method and apparatus
US10832688B2 (en) 2014-03-19 2020-11-10 Huawei Technologies Co., Ltd. Audio signal encoding method, apparatus and computer readable medium
CN111294147A (zh) * 2019-04-25 2020-06-16 北京展讯高科通信技术有限公司 Dmr系统的编码方法及装置、存储介质、数字对讲机
CN111294147B (zh) * 2019-04-25 2023-01-31 北京紫光展锐通信技术有限公司 Dmr系统的编码方法及装置、存储介质、数字对讲机

Also Published As

Publication number Publication date
EP1310943A2 (en) 2003-05-14
US7155384B2 (en) 2006-12-26
CN100440758C (zh) 2008-12-03
EP1310943B1 (en) 2007-01-17
DE60217612T2 (de) 2007-05-16
JP2003150198A (ja) 2003-05-23
EP1310943A3 (en) 2004-02-11
JP4245288B2 (ja) 2009-03-25
US20030093266A1 (en) 2003-05-15
DE60217612D1 (de) 2007-03-08

Similar Documents

Publication Publication Date Title
CN1135721C (zh) 音频信号编码方法及其有关设备
CN1210873C (zh) 实施不同编码法则的发送系统
DE60024123T2 (de) Lpc-harmonischer sprachkodierer mit überrahmenformat
CN1244904C (zh) 声频信号编码方法和设备
US6625574B1 (en) Method and apparatus for sub-band coding and decoding
CN1419349A (zh) 语音编码装置、语音解码装置以及语音编码/解码方法
CN1795495A (zh) 音频编码设备、音频解码设备、音频编码方法和音频解码方法
CN101061535A (zh) 用于人工扩展语音信号的带宽的方法和装置
GB2466674A (en) Speech coding
JPH0140537B2 (zh)
KR20110107295A (ko) 오디오 신호 인코딩 및 디코딩을 위한 마스킹 레벨들을 결정하는데 사용되는 여기 패턴들을 인코딩 및 디코딩하는 방법 및 장치
JP5226852B2 (ja) 向上階層の符号化装置並びに復号化装置及びその方法
US7536302B2 (en) Method, process and device for coding audio signals
CN1124588C (zh) 信号编码方法及设备
CN1485849A (zh) 数字音频编码器及解码方法
CN1641749A (zh) 用于转换音频数据的方法和装置
CN1132157C (zh) 线性预测分析合成的编码方法和编码器
JP2003233397A (ja) オーディオ符号化装置、オーディオ符号化プログラム及びオーディオ符号化データ伝送装置
JP4796583B2 (ja) 量子化雑音を低減する方法
CN1290078C (zh) 采用带宽扩展技术编码和/或解码音频数据的方法和装置
AU718561B2 (en) Encoding system and decoding system for audio signals including pulse quantization
JP2633318B2 (ja) 音声符号化装置
CN1173330C (zh) 语音合成的位配置方法及装置
KR20130047630A (ko) 통신 시스템에서 신호 부호화 장치 및 방법
JPH10233691A (ja) 符号化方式および復号方式

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20081203

Termination date: 20091214