CN102257565B - 用于可缩放地改善信号编码方法的质量的方法和装置 - Google Patents

用于可缩放地改善信号编码方法的质量的方法和装置 Download PDF

Info

Publication number
CN102257565B
CN102257565B CN2009801510367A CN200980151036A CN102257565B CN 102257565 B CN102257565 B CN 102257565B CN 2009801510367 A CN2009801510367 A CN 2009801510367A CN 200980151036 A CN200980151036 A CN 200980151036A CN 102257565 B CN102257565 B CN 102257565B
Authority
CN
China
Prior art keywords
signal
reference signal
error
pulse
error signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2009801510367A
Other languages
English (en)
Other versions
CN102257565A (zh
Inventor
S.尚德尔
P.塞蒂亚万
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Unify GmbH and Co KG
Original Assignee
Siemens Enterprise Communications GmbH and Co KG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens Enterprise Communications GmbH and Co KG filed Critical Siemens Enterprise Communications GmbH and Co KG
Publication of CN102257565A publication Critical patent/CN102257565A/zh
Application granted granted Critical
Publication of CN102257565B publication Critical patent/CN102257565B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Abstract

本发明涉及一种用于可缩放地改善根据IT-U推荐G.722的编码方法的质量的方法,具有以下步骤:—在具有取决于扩展范围的重复步骤数量的迭代过程中,逐区段地比较由要编码的输入信号和预测信号确定的数字误差信号(E)与
Figure DEST_PATH_IMAGE002
个不同的参考信号并且由此确定在预给定的误差标准方面具有最小误差信号的参考信号;—分别由等距Dirac脉冲
Figure DEST_PATH_IMAGE004
根据(I)建立参考信号,其中
Figure DEST_PATH_IMAGE006
说明第一脉冲与零时刻的间距,
Figure DEST_PATH_IMAGE008
说明幅度值,
Figure DEST_PATH_IMAGE010
说明单个脉冲之间的间距,
Figure DEST_PATH_IMAGE012
说明脉冲的数量以及L说明不同电平的数量;—传输关于具有最小误差信号的参考信号的信息。(I)。

Description

用于可缩放地改善信号编码方法的质量的方法和装置
技术领域
本发明涉及一种用于可缩放地改善信号编码方法的质量的方法。
背景技术
在数字通信系统中,为了降低所需的数据速率,借助于编码方法对要传输的音频信号进行压缩并且在传输后对其进行解压缩。
例如从ITU-T推荐G.729中已知一种这样的被设置用于在300至3400 Hz频率范围内以8 kbit/s的数据速率传输语音信号的编码方法。
对于具有更高质量的传输,已知50 Hz至7000 Hz的扩展频率范围的传输。例如在ITU-T推荐G.722.EV中描述了为此设置的、所谓的宽带语音编解码器。
该方法使用所谓的Subband-Adaptive Differential Pulse Code Modulation(SB-ADPCM,子带自适应差分脉冲编码调制)来进行语音信号的编码。
为了进一步提高所传输的语音信号的质量需要可缩放的编码方法。
可缩放性一方面允许在接收机侧与传统解码方法的向下兼容性并且另一方面提供了简单的可行性:如果传输信道中的数据传输容量有限,则对数据速率和所传输的数据帧的大小进行发射机侧和接收机侧的匹配。
发明内容
本发明所基于的任务在于,说明一种用于可缩放地改善根据子带自适应差分脉冲编码原理的编码方法的质量的方法。
根据本发明,该任务通过一种用于可缩放地改善根据IT-U推荐G.722的编码方法的质量的方法解决,所述方法具有以下步骤:
在具有取决于扩展范围的重复步骤数量的迭代过程中,逐区段地比较由要编码的输入信号和预测信号确定的数字误差信号与                                                
Figure 2009801510367100002DEST_PATH_IMAGE001
个不同的参考信号并且由此确定在预给定的误差标准方面具有最小误差信号的参考信号,
分别由等距Dirac脉冲
Figure 2009801510367100002DEST_PATH_IMAGE002
根据
Figure 2009801510367100002DEST_PATH_IMAGE003
建立参考信号
Figure 2009801510367100002DEST_PATH_IMAGE004
,其中
Figure 2009801510367100002DEST_PATH_IMAGE005
说明第一脉冲与比较区段的开始的间距,
Figure 2009801510367100002DEST_PATH_IMAGE006
说明幅度值,
Figure 2009801510367100002DEST_PATH_IMAGE007
说明两个单个脉冲之间的间距,
Figure 2009801510367100002DEST_PATH_IMAGE008
说明脉冲的数量以及L说明不同电平的数量;
传输关于具有最小误差信号的参考信号的信息。
在此有利的是,作为误差标准根据
Figure 2009801510367100002DEST_PATH_IMAGE010
确定扩展的误差信号
Figure 2009801510367100002DEST_PATH_IMAGE011
以及在比较区段的时间段上根据
Figure DEST_PATH_IMAGE013
确定误差数值并且将该误差数值用于确定最小误差信号。
一种用于实施根据本发明的方法的装置也是有利的,其中除了根据IT-U推荐G.722根据子带自适应差分脉冲编码原理的传统编码器(ADPCM)以外还设置有用于创建参考信号的装置,该装置对于扩展的每一级分别具有用于产生参考信号的信号发生器
Figure 2009801510367100002DEST_PATH_IMAGE014
和控制单元
Figure 2009801510367100002DEST_PATH_IMAGE015
附图说明
以下根据附图解释根据本发明的方法的实施方式。
图1示例性地示出根据本发明的参考信号的构造,
图2示例性地示出根据本发明的编解码器的结构,和
图3示例性地示出根据本发明的解码器的结构。
具体实施方式
根据图1的参考信号包括N个Dirac脉冲
Figure 6965DEST_PATH_IMAGE002
。各个脉冲之间的间距分别是M个采样周期,第一脉冲
Figure 2009801510367100002DEST_PATH_IMAGE016
与比较区段的开始的间距为
Figure 849019DEST_PATH_IMAGE005
个采样周期。Dirac脉冲可以具有预给定数量L个幅度值。
参考信号的数学定义如下:
现在,通过参数——具有L个不同的值的幅度值
Figure DEST_PATH_IMAGE017
和偏移量
Figure 370185DEST_PATH_IMAGE005
——的变化,产生具有个不同参考信号的组。
根据图2和3更详细地解释如此获得的参考信号
Figure 68014DEST_PATH_IMAGE004
的根据本发明的比较。图2示出根据本发明的编码器的结构性构造,该编码器除了根据IT-U推荐G.722根据子带自适应差分脉冲编码原理的传统编码器ADPCM以外还包括用于创建参考信号的装置,该装置对于扩展的每一级分别具有用于产生参考信号
Figure 397364DEST_PATH_IMAGE004
的信号发生器
Figure 596264DEST_PATH_IMAGE014
和控制单元
Figure 379325DEST_PATH_IMAGE015
根据本发明,在一个预给定的时间区段上,即在一个所谓的帧上,比较参考信号
Figure 372688DEST_PATH_IMAGE004
与数字误差信号
Figure DEST_PATH_IMAGE019
,该数字误差信号在根据IT-U推荐G.722的传统编码方法中从要编码的输入信号和预测信号中确定。
由此,根据
Figure 392597DEST_PATH_IMAGE010
得出扩展的误差信号
Figure 129609DEST_PATH_IMAGE011
,对此在比较区段的时间段上根据
Figure 466043DEST_PATH_IMAGE013
确定误差数值。
现在,借助于控制单元
Figure 895888DEST_PATH_IMAGE015
确定具有最小误差数值
Figure DEST_PATH_IMAGE020
的参考信号
Figure 199830DEST_PATH_IMAGE004
并且传输关于该信号的信息作为附加信息
Figure DEST_PATH_IMAGE021
并且在接收机中使用该信息以解码有用信号。
在此,以下参数已经在实践中证实对于参考信号的构造而言是有价值的。
出发点是8kHz的采样率和因此125μsec的采样间隔持续时间。比较区段的持续时间是5msec,Dirac脉冲的可能的幅度值的数量L为2。一个比较区段中Dirac脉冲自身的数量为
Figure DEST_PATH_IMAGE022
。各2个Dirac脉冲之间的间距为个采样间隔。
现在,根据所选择的缩放迭代地多次重复参考信号
Figure 289064DEST_PATH_IMAGE004
与数字误差信号
Figure 624230DEST_PATH_IMAGE019
的上述比较过程,这在图2中针对第S次重复过程通过具有信号发生器
Figure DEST_PATH_IMAGE024
、控制单元
Figure DEST_PATH_IMAGE025
和附加的信息信号
Figure DEST_PATH_IMAGE026
的功能框示出。
也就是说,对于第一重复步骤而言,比较参考信号
Figure 431780DEST_PATH_IMAGE004
与扩展的第一误差信号
Figure DEST_PATH_IMAGE027
比较并且由此生成扩展的第二误差信号
Figure DEST_PATH_IMAGE028
。该过程典型地重复四次。
图3示出根据本发明的解码器的结构,在该解码器中从接收到的信号
Figure DEST_PATH_IMAGE029
获得音频信号。接收到的信号除了传统解码器ADPCM的输出信号
Figure DEST_PATH_IMAGE030
以外还包括利用本发明所获得的、根据在发射机中选择的扩展级的数量的附加信息
在此重要的优点在于,实际上也不必分析接收到的信号中存在的所有信息。因此可能的是,接收机利用仅仅一个传统解码器——核心解码器——来接收也包含附加信息
Figure 697545DEST_PATH_IMAGE031
的信号,但是不将这些附加信息用于音频信号的获取。
该可行性称为向下兼容性。
相反,在包括用于对附加信息
Figure 195523DEST_PATH_IMAGE031
解码的根据本发明的扩展级
Figure DEST_PATH_IMAGE032
的接收机中,只要没有出于其他原因提出限制则对信号以全质量进行解码。

Claims (3)

1.一种用于可缩放地改善根据IT-U推荐G.722的编码方法的质量的方法,具有以下步骤:
—在具有取决于扩展范围的重复步骤数量的迭代过程中,逐区段地比较由要编码的输入信号和预测信号确定的数字误差信号                                                
Figure 2009801510367100001DEST_PATH_IMAGE001
Figure 2009801510367100001DEST_PATH_IMAGE002
个不同的参考信号
Figure 2009801510367100001DEST_PATH_IMAGE003
并且由此确定在预给定的误差标准方面具有最小误差信号的参考信号;
—分别由等距Dirac脉冲根据
Figure 2009801510367100001DEST_PATH_IMAGE005
建立所述参考信号
Figure 582440DEST_PATH_IMAGE003
,其中
Figure 2009801510367100001DEST_PATH_IMAGE006
说明第一脉冲与比较区段的开始的间距,说明幅度值,
Figure DEST_PATH_IMAGE008
说明两个单个脉冲之间的间距,
Figure DEST_PATH_IMAGE009
说明脉冲的数量以及L说明不同幅度值
Figure DEST_PATH_IMAGE010
的数量;
—传输关于具有最小误差信号的参考信号的信息。
2.根据权利要求1所述的方法,其特征是,作为误差标准根据
Figure DEST_PATH_IMAGE011
确定扩展的误差信号
Figure DEST_PATH_IMAGE012
以及在比较区段的时间段上根据
确定误差数值并且将该误差数值用于确定所述最小误差信号。
3.一种用于执行根据权利1或2之一所述的方法的装置,其特征是,除了根据IT-U推荐G.722根据子带自适应差分脉冲编码原理的传统编码器(ADPCM)以外还设置有用于创建参考信号的装置,该装置对于扩展的每一级分别具有用于产生参考信号
Figure 748848DEST_PATH_IMAGE003
的信号发生器和控制单元
Figure DEST_PATH_IMAGE016
CN2009801510367A 2008-12-19 2009-12-10 用于可缩放地改善信号编码方法的质量的方法和装置 Expired - Fee Related CN102257565B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
ATA1982/2008A AT509439B1 (de) 2008-12-19 2008-12-19 Verfahren und mittel zur skalierbaren verbesserung der qualität eines signalcodierverfahrens
ATA1982/2008 2008-12-19
PCT/EP2009/008853 WO2010069513A1 (de) 2008-12-19 2009-12-10 Verfahren und mittel zur skalierbaren verbesserung der qualität eines signalcodierverfahrens

Publications (2)

Publication Number Publication Date
CN102257565A CN102257565A (zh) 2011-11-23
CN102257565B true CN102257565B (zh) 2013-05-29

Family

ID=41812891

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009801510367A Expired - Fee Related CN102257565B (zh) 2008-12-19 2009-12-10 用于可缩放地改善信号编码方法的质量的方法和装置

Country Status (6)

Country Link
US (1) US8774312B2 (zh)
EP (1) EP2380169B1 (zh)
CN (1) CN102257565B (zh)
AT (1) AT509439B1 (zh)
BR (1) BRPI0922993A2 (zh)
WO (1) WO2010069513A1 (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1623185A (zh) * 2002-03-12 2005-06-01 诺基亚有限公司 可伸缩音频编码的有效改进
CN1848242A (zh) * 1995-12-01 2006-10-18 数字剧场系统股份有限公司 多通道音频编码器

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2481026B1 (zh) * 1980-04-21 1984-06-15 France Etat
JP2598159B2 (ja) * 1990-08-28 1997-04-09 三菱電機株式会社 音声信号処理装置
KR100467326B1 (ko) 2002-12-09 2005-01-24 학교법인연세대학교 추가 비트 할당 기법을 이용한 음성 부호화 및 복호화를위한 송수신기

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1848242A (zh) * 1995-12-01 2006-10-18 数字剧场系统股份有限公司 多通道音频编码器
CN1623185A (zh) * 2002-03-12 2005-06-01 诺基亚有限公司 可伸缩音频编码的有效改进

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
T.V. Sreenivas,et al..Reduced Rate Ultra Low Delay Audio Coder using Multistage Vector Quantization.《Signals, Systems and Computers, 2007. ACSSC 2007. Conference Record of the Forty-First Asilomar Conference on》.2007,2080-2084. *

Also Published As

Publication number Publication date
US20120014474A1 (en) 2012-01-19
BRPI0922993A2 (pt) 2016-01-26
US8774312B2 (en) 2014-07-08
EP2380169A1 (de) 2011-10-26
AT509439A1 (de) 2011-08-15
WO2010069513A1 (de) 2010-06-24
AT509439B1 (de) 2013-05-15
EP2380169B1 (de) 2015-12-09
CN102257565A (zh) 2011-11-23

Similar Documents

Publication Publication Date Title
JP4426483B2 (ja) オーディオ信号の符号化効率を向上させる方法
US8412519B2 (en) Steganography in digital signal encoders
CN1878001B (zh) 对音频数据编码及解码的设备及方法
US4330689A (en) Multirate digital voice communication processor
CN102834863B (zh) 用于包括通用音频和语音帧的音频信号的解码器
CN102577132B (zh) 用于阶乘脉冲编码器的算术编码
US20200334542A1 (en) Channel modelling in a data transmission system
US8392176B2 (en) Processing of excitation in audio coding and decoding
EP1498873B1 (en) Improved excitation for higher band coding in a codec utilizing frequency band split coding methods
CN103229234B (zh) 音频编码装置、方法以及音频解码装置、方法
CN101488344B (zh) 一种量化噪声泄漏控制方法及装置
GB2508811A (en) Packet loss concealment in decoded signals
CN104217727A (zh) 信号解码方法及设备
CN1193347C (zh) 正弦编码
CN101393743A (zh) 一种可配置参数的立体声编码装置及其编码方法
US6369722B1 (en) Coding, decoding and transcoding methods
CA2293165A1 (en) Method for transmitting data in wireless speech channels
CN102257565B (zh) 用于可缩放地改善信号编码方法的质量的方法和装置
CN103975387A (zh) 用于信号的组合代码化的装置和方法
CN101740030B (zh) 语音信号的发送及接收方法、及其装置
US20120123788A1 (en) Coding method, decoding method, and device and program using the methods
CN103109319A (zh) 确定音调循环能量及按比例缩放激励信号
RU2297099C2 (ru) Способ передачи дополнительной информации при кодировании речевых сообщений
CN1127563A (zh) 准周期信号的传输系统
KR102229893B1 (ko) RoIP 선형 예측 부호화 및 비선형 양자화 융합 압축 송신 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130529

Termination date: 20211210

CF01 Termination of patent right due to non-payment of annual fee