CN1460247A - 有特殊步长适应的自适应差分脉码调制语音编码系统 - Google Patents

有特殊步长适应的自适应差分脉码调制语音编码系统 Download PDF

Info

Publication number
CN1460247A
CN1460247A CN02801105A CN02801105A CN1460247A CN 1460247 A CN1460247 A CN 1460247A CN 02801105 A CN02801105 A CN 02801105A CN 02801105 A CN02801105 A CN 02801105A CN 1460247 A CN1460247 A CN 1460247A
Authority
CN
China
Prior art keywords
adpcm
quantizer
size adaptation
correction factor
decoder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN02801105A
Other languages
English (en)
Other versions
CN1229774C (zh
Inventor
E·F·吉吉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NXP BV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of CN1460247A publication Critical patent/CN1460247A/zh
Application granted granted Critical
Publication of CN1229774C publication Critical patent/CN1229774C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B14/00Transmission systems not characterised by the medium used for transmission
    • H04B14/02Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation
    • H04B14/06Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation using differential modulation, e.g. delta modulation
    • H04B14/066Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation using differential modulation, e.g. delta modulation using differential modulation with several bits [NDPCM]
    • H04B14/068Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation using differential modulation, e.g. delta modulation using differential modulation with several bits [NDPCM] with adaptive feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Machine Translation (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

在具有一个编码器和一个与所述编码器合作的解码器的语音编码系统中,语音编码器包括一个预处理器和一个具有一个量化器和一个步长适应装置的ADPCM编码器,而语音解码器包括一个具有向ADPCM编码器那样的类似步长适应装置的ADPCM解码器和一个后处理器。量化器被装备有存储装置,其含有步长?(n)的校正因子α(c(n))值,所述校正因子依赖于量化器输出信号c(n)。步长适应根据一个关系式而进行。

Description

有特殊步长适应的自适应差分脉码调制语音编码系统
本发明涉及有语音编码器以及与所述语音编码器合作的语音解码器的语音编码系统,语音编码器包括预处理器以及有量化器和步长适应装置的ADPCM(自适应差分脉码调制)编码器并且语音解码器包括有和ADPCM编码器中类似的步长适应装置以及有一个解码器的ADPCM解码器,和一个后处理器,量化器装备有包括步长Δ(n)的校正因子α(c(n))值的存储装置,所述校正因子依靠量化器输出信号c(n)。
语音编码器产生能被存储或通过信道发送的一个比特流。劣质存储装置或坏的传输信道可能不能保存这个信息;以比特变化形式的误码可能出现。而且,当声音信号在标准P2CM音频编码系统编码器中,也就是,处理的ADPCM编码器和解码器中被处理时,可以出现这样的误码。当误码率高于1%时,能听到非自然信号。大多数这些非自然信号以突然增加或降低音量标记。编码器的闭合检查揭示对于误码编码系统最薄弱的部分是自适应步长Δ(n)装置。适应依靠产生的编码等级。当这些编码等级由于误码而变化时,ADPCM编码器和ADPCM解码器的步长不再相同。因此,已推荐提供有包括步长Δ(n)校正因子α(c(n))值的存储装置的量化器。例如,步长随后可以根据关系式修改:A是一个常数(A<1)。按比例递降的步长[Δ(n)+b]。如果未超出允许的最大步长Δmax则A依据因子α(c(n))(≥1)按比例增大。校正因子值α(c(n))的选择是这样的以致于对属于较高量化等级的编码做出更快的适应以允许当输入信号等级突然增加时编码系统更快的适应,然而,在量化器输入中出现小的能量变化的情况下,以已知的校正表适应校正因子α(c(n))是不充分的。
本发明的目的是在语音编码器和解码器的量化器中提供一个改进的步长适应。
因此,根据本发明,如公开段中描述的语音编码系统的特征为步长适应根据以下关系式出现:其中b,A和Δmax是常数。
特别如ID604963中描述的,当预处理器装备有相位涂抹(phase-smearing)滤波器装置以及此外后处理器装备有反向滤波器装置时,输入到ADPCM编码器的能量更逐渐增加,允许更好地选择α(c(n))。因此,所述专利申请的内容被认为是本发明描述的一部分。没有这样的相位涂抹滤波器装置,随着出现在闭合扩音器记录中的类似脉冲输入信号可能出现问题。
参考附图和以下描述的实施方案,这些以及本发明的其它方面将是明显的并被说明。在附图中:
图1显示根据本发明的P2CM编码系统的框图。
图2A-2F显示有ADPCM编码器量化和比例因子的现有技术表。
图3A-3F显示根据本发明在预处理器中有相位涂抹滤波器以及在后处理器中有反向相位涂抹滤波器的ADPCM编码器的量化和比例因子表。
图1中的P2CM音频编码系统由编码器1和解码器2构成。编码器1包括预处理器3和ADPCM编码器4,同时解码器2装备有ADPCM解码器5和后处理器6。ADPCM编码器包括量化器块7,步长适应块8,解码器块9和预测器块10。ADPCM解码器包括步长适应块12,解码器块13和预测器块14。预处理器包括在量化器输入中消除快速高能量变化影响的相位涂抹滤波器以及在编码前修改信号频谱的频谱幅度弯曲装置,同时后处理器包括取消预处理器中弯曲影响的装置和一个反向滤波器。在一个优选实施方案中,相位涂抹滤波弯曲以及反向滤波解除弯曲(unwarp)在频域中实现。因此,预处理器和后处理器都装备有装置如FFT单元,把时域音频信号转换到频域,以及装置如反向FFT,把被处理用于滤波和弯曲或反向滤波和不弯曲的信号分别从频域转换到时域。如ID604963中描述的,在一个特殊的实施方案中,相位涂抹滤波器具有在0和奈奎斯特之间充分地线性增加频率的特性和恒定幅度的特性。
ADPCM编码器4输入的是一个由预处理器3提供的采样音频信号。当采样n具有数值s(n)时,对于每个输入值s(n)在这个值和估算(预测)值s(n1)之间的差被认为是一个随后给出输出编码c(n)的量化器块7量化和编码的错误信号e(n)。输出编码c(n)构成由ADPCM解码器5发送或传输和接收的比特流。在图1中,这个由虚线11指示。输出编码c(n)通过块8和解码器块9还被用于量化器步长Δn的适应以得到量化的错误信号e’(n)。量化的错误信号e’(n)被附加到预测值s(n-1),从而得到量化的输入数值s’(n)。这个数值s’(n)被预测器块10用于修改它的预测系数。ADPCM解码器5正好是编码器4的一个子设备;它读取从比特流接收的量化编码c(n)并且用和编码器4一样的方式更新它的内部变量。解码器块13输出的是量化的错误信号e’(n),它在被附加到预测值s(n-1)后,给出量化的音频信号s(n)。后面的信号构成后处理器6的输入信号。作为已提及的构成本发明专利申请一部分的预处理器和后处理器以及ADPCM解码器和编码器在ID604963中被描述。
ADPCM编码器4另外的输入信号由编解码器模式信号构成,它被用码字发送或传输到ADPCM解码器5。这个编解码器模式信号决定ADPCM编码器4和ADPCM解码器5的比特流输出中码字的比特分配。依靠选择的编解码器模式,作为结果的比特流具有比特率如12.8,16,19.2,21.6,24或32千比特/秒。
在量化器中做下面的计算:
首先根据以下关系式做出量化:
Figure A0280110500051
其中
Figure A0280110500052
表示截断操作。
量化信号q(n)限定在0和cmax之间,这意味着:c(n)=max[0,min(cmax,q(n))]。Cmax值依靠编解码器模式以及因此依靠比特率。例如,对应上述比特率,cmax可以依次是2,3,4,5,7和15。随后,根据以下关系式计算新的步长:
Figure A0280110500061
其中,在一个特别的实施方案中,b,A和Δmax被分别设置为16,0.996和8192。而且量化器块装备有存储装置,它包括依靠c(n)的α(c(n))表。特别在一个相位涂抹被应用的实施方案中,这些校正因子允许对所有编码的步长Δ(n)的更逐渐的适应,带来改进的误码容限。尤其高比特率模式从这里获利。误码能被参数A控制;当误码率变得高于1%时,看来数值0.75是在误码稳健性和总语音质量之间的一个好的折衷。
在现有技术中,根据说明书导言部分中提及的公式(P)的步长适应,在图2A-2F的表中给出了α(c(n))值。这些表中的每一个依靠量化器输出信号c(n)索引号或与此对应的量化等级e(n)/Δn给出比例因子α(c(n))。对于这些表,cmax分别是2,3,4,5,7和15。特别从图2F,作为最长的表,可以看到结合公式(P)尤其是较高编码带来快得多的步长适应。更高的比例因子对于当量化器输入信号等级突然增加时允许步长更快是重要的。对于较低的编码,α=1;这个实例中步长将逐渐减少。然而,更快的步长适应意味着更大的误码危险。
根据公式在步长适应中,在图3A-3F表中给出了α(c(n))值。再者,这些表的每一个依据量化器输出信号c(n)的索引号或与此对应的量化等级e(n)/Δn索引号给出比例因子α(c(n))。而且对于这些表,cmax分别是2,3,4,5,7和15。在量化器输入中快速高能变化不出现的实例中,根据图3A-3F的表选择比例因子是可能的。这对于声音被已发生录音的房间中的回声涂抹的长距离录音或有如ID604963中描述的相位涂抹滤波器的编码系统是可能的。图3A-3F中比例因子供给更慢的步长适应,但是有降低误码危险的有利结果。
通过可以以能够在P2CM音频编码器和解码器中的信号处理装置上运行的计算机程序的形式的算法实现上面描述的实施方案。在迄今为止的图表的部分中显示执行某些可编程的功能的单元,这些单元必须被认为是计算机程序的子部分。
本发明所描述的并不局限于已描述的实施方案。其中可能修改。特别应该注意在所描述的实施方案中提及的以及图表中所示的数值和表仅仅是作为例子给出的,其它的数值和表也是可能的。

Claims (3)

1.有语音编码器以及与所述语音编码器合作的语音解码器的语音编码系统,语音编码器包括预处理器以及有量化器和步长适应装置的ADPCM(自适应差分脉码调制)编码器,并且语音解码器包括有和ADPCM编码器中类似的步长适应装置以及有一个解码器的ADPCM解码器,和一个后处理器,量化器装备有包括步长Δ(n)的校正因子α(c(n))值的存储装置,所述校正因子取决于量化器输出信号c(n),
其特征在于步长适应根据以下关系式出现:其中b,A和Δmax是常数。
2.根据权利要求1的语音编码系统,其特征在于量化器中的存储装置包括根据图3A-3F的任何一个中的表的校正因子α(c(n))值。
3.根据权利要求1或2的语音编码系统,其特征在于使校正因子α(c(n))适合于编码系统,其中在预处理器中应用相位涂抹滤波器装置以及在后处理器中应用反向相位涂抹滤波器装置。
CNB028011058A 2001-04-09 2002-03-25 有特殊步长适应的自适应差分脉码调制语音编码系统 Expired - Lifetime CN1229774C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP01201300 2001-04-09
EP01201300.9 2001-04-09

Publications (2)

Publication Number Publication Date
CN1460247A true CN1460247A (zh) 2003-12-03
CN1229774C CN1229774C (zh) 2005-11-30

Family

ID=8180122

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB028011058A Expired - Lifetime CN1229774C (zh) 2001-04-09 2002-03-25 有特殊步长适应的自适应差分脉码调制语音编码系统

Country Status (7)

Country Link
US (1) US7050967B2 (zh)
EP (1) EP1386308B1 (zh)
JP (1) JP3972000B2 (zh)
CN (1) CN1229774C (zh)
AT (1) ATE323316T1 (zh)
DE (1) DE60210597T2 (zh)
WO (1) WO2002082425A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1922656B (zh) * 2004-03-01 2010-04-14 弗劳恩霍夫应用研究促进协会 用于确定量化器步长的设备和方法
CN101443842B (zh) * 2006-05-12 2012-05-23 弗劳恩霍夫应用研究促进协会 信息信号编码

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100754439B1 (ko) * 2003-01-09 2007-08-31 와이더댄 주식회사 이동 전화상의 체감 음질을 향상시키기 위한 디지털오디오 신호의 전처리 방법
DE102004007185B3 (de) * 2004-02-13 2005-06-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Prädiktives Codierungsschema
US20080205328A1 (en) * 2007-02-28 2008-08-28 Lucent Technologies Inc. Method of scaling soft symbols of an uplink enhanced dedicated transport channel (E-DCH) and method for enabling use of a log-map turbo decoding algorithm for processing the E-DCH
KR101022675B1 (ko) * 2008-06-04 2011-03-22 주식회사 하이닉스반도체 반도체 소자

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5558612A (en) * 1978-10-26 1980-05-01 Kokusai Denshin Denwa Co Ltd <Kdd> Delay circuit
JPS587935A (ja) * 1981-07-07 1983-01-17 Kokusai Denshin Denwa Co Ltd <Kdd> トランスバーサル形スミアデスミアフイルタ
NL8700075A (nl) * 1987-01-14 1988-08-01 Philips Nv Datatransmissiestelsel voorzien van versmeringsfilters.
US5231484A (en) * 1991-11-08 1993-07-27 International Business Machines Corporation Motion video compression system with adaptive bit allocation and quantization
US5511095A (en) * 1992-04-15 1996-04-23 Sanyo Electric Co., Ltd. Audio signal coding and decoding device
US5754974A (en) * 1995-02-22 1998-05-19 Digital Voice Systems, Inc Spectral magnitude representation for multi-band excitation speech coders
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
AU3372199A (en) * 1998-03-30 1999-10-18 Voxware, Inc. Low-complexity, low-delay, scalable and embedded speech and audio coding with adaptive frame loss concealment

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1922656B (zh) * 2004-03-01 2010-04-14 弗劳恩霍夫应用研究促进协会 用于确定量化器步长的设备和方法
CN101443842B (zh) * 2006-05-12 2012-05-23 弗劳恩霍夫应用研究促进协会 信息信号编码

Also Published As

Publication number Publication date
WO2002082425A1 (en) 2002-10-17
DE60210597T2 (de) 2007-01-25
CN1229774C (zh) 2005-11-30
US7050967B2 (en) 2006-05-23
EP1386308B1 (en) 2006-04-12
ATE323316T1 (de) 2006-04-15
DE60210597D1 (de) 2006-05-24
JP2004519735A (ja) 2004-07-02
EP1386308A1 (en) 2004-02-04
JP3972000B2 (ja) 2007-09-05
US20020184005A1 (en) 2002-12-05

Similar Documents

Publication Publication Date Title
CN101305423B (zh) 自适应的基于时间/频率的音频编码和解码设备和方法
US5819215A (en) Method and apparatus for wavelet based data compression having adaptive bit rate control for compression of digital audio or other sensory data
KR101295729B1 (ko) 비트 레이트­규모 가변적 및 대역폭­규모 가변적 오디오디코딩에서 비트 레이트 스위칭 방법
Herre Temporal noise shaping, qualtization and coding methods in perceptual audio coding: A tutorial introduction
KR101703810B1 (ko) 디지털 오디오 신호들의 계층적 코딩/디코딩을 개선하기 위한 향상 코딩/ 디코딩에서의 비트들의 할당
AU761771B2 (en) Method for improving the coding efficiency of an audio signal
CN101501761B (zh) 无需边信息对时域噪声包络的任意整形
JP6970789B2 (ja) 高位周波数帯域における検出されたピークスペクトル領域を考慮してオーディオ信号を符号化するオーディオ符号器、オーディオ信号を符号化する方法、及びコンピュータプログラム
CA2492647C (en) Low bit-rate audio coding
KR101061404B1 (ko) 가변 레이트로 오디오를 인코딩 및 디코딩하는 방법
JP2016505168A (ja) 音声信号復号化または符号化の時間領域レベル調整
US20080140393A1 (en) Speech coding apparatus and method
EP1735776A1 (en) Coding of audio signals
CN102576536A (zh) 数字音频信号的增强的编码/解码
CN1344072A (zh) 采用不同编码原理的传送系统
WO2002091588A1 (fr) Procede et dispositif de codage/ modulation differentielle par impulsions et codage adaptatifs en sous-bandes, systeme de transmission sans fil, procede et dispositif de decodage/ modulation differentielle par impulsions et codage adaptatifs en sous-bandes et systeme de reception sans fil
CN1229774C (zh) 有特殊步长适应的自适应差分脉码调制语音编码系统
EP2352230B1 (en) Signal encoding method and signal encoding device for a speech or audio signal
EP0810584A3 (en) Signal coder
CN111344784B (zh) 控制编码器和/或解码器中的带宽
CN105957533B (zh) 语音压缩方法、语音解压方法及音频编码器、音频解码器
Vaseghi Finite state CELP for variable rate speech coding
Malvar Enhancing the performance of subband audio coders for speech signals
JP2000151413A (ja) オーディオ符号化における適応ダイナミック可変ビット割り当て方法
Mazor et al. Adaptive subbands excited transform (ASET) coding

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: NXP CO., LTD.

Free format text: FORMER OWNER: ROYAL PHILIPS ELECTRONICS CO., LTD.

Effective date: 20070907

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20070907

Address after: Holland Ian Deho Finn

Patentee after: Koninkl Philips Electronics NV

Address before: Holland Ian Deho Finn

Patentee before: Koninklike Philips Electronics N. V.

ASS Succession or assignment of patent right

Owner name: CALLAHA XILE CO., LTD.

Free format text: FORMER OWNER: KONINKL PHILIPS ELECTRONICS NV

Effective date: 20120109

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20120109

Address after: American Delaware

Patentee after: NXP BV

Address before: Holland Ian Deho Finn

Patentee before: Koninkl Philips Electronics NV

CX01 Expiry of patent term

Granted publication date: 20051130

CX01 Expiry of patent term