CN100403401C - 根据窄带语音信号估测宽带语音信号的语音扩展器和方法 - Google Patents

根据窄带语音信号估测宽带语音信号的语音扩展器和方法 Download PDF

Info

Publication number
CN100403401C
CN100403401C CNB018236731A CN01823673A CN100403401C CN 100403401 C CN100403401 C CN 100403401C CN B018236731 A CNB018236731 A CN B018236731A CN 01823673 A CN01823673 A CN 01823673A CN 100403401 C CN100403401 C CN 100403401C
Authority
CN
China
Prior art keywords
speech
extender
broadband
voice
parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB018236731A
Other languages
English (en)
Other versions
CN1630896A (zh
Inventor
S·A·克林克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia Solutions and Networks GmbH and Co KG
Original Assignee
Nokia Siemens Networks GmbH and Co KG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Siemens Networks GmbH and Co KG filed Critical Nokia Siemens Networks GmbH and Co KG
Publication of CN1630896A publication Critical patent/CN1630896A/zh
Application granted granted Critical
Publication of CN100403401C publication Critical patent/CN100403401C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Abstract

本发明涉及一种语音扩展器,该语音扩展器如此构成,以便它根据窄带语音信号估测宽带语音信号。此外,该语音扩展器是自适应的,以便它在编码时与通信终端装置和/或与通话者相匹配。

Description

根据窄带语音信号估测宽带语音信号的语音扩展器和方法
技术领域
本发明涉及一种语音扩展器并涉及一种根据窄带语音信号估测宽带语音信号的方法。
背景技术
为压缩语音信号的数据传输率,使用了语音编码器也称之为语音编译码器。这种语音编译码器首先用在移动无线系统中。在GSM移动无线系统(全球移动通信系统)中使用了按照线性预测编码(LPC)的方法进行工作的语音编码器。在此,与信号波形编码相反,在人的持续通话(Sprecktrackt)中不是复制语音信号本身,而是复制其形成过程。在8kHz语音信号的取样速率中,当分辨率为13比特时得到的数据率为104KBit/s。在GSM中,借助LPC就可将这个数据率降到恒定的13KBit/s(所谓的代码速率)。对此,在GSM中譬如使用了全速率(全速率编译码)或改进的全速率编译码(增强型全速率编译码)。采用半速率编译码,在语音质量相应降低的情况下,还会大大降低比特率,也即降到5.6KBit/s。
在未来的通信系统、譬如UMTS(通用移动电信系统)中,将使用可以用可变比特率对语音信号进行编码的语音编码器。这种类型的语音编码器譬如是用不同比特率进行编码的自适应多速率(AMR)语音编码器。它被设计用于GSM移动无线系统,但也应作为标准的语音编码器用于UMTS移动无线系统。
在这种类型的语音编码器中,比特率与传输已编码语音信号所提供的带宽相匹配。如果提供进行传输的足够带宽,则语音信号可用高比特率编码。这也称之为宽带编码。否则,也即在带宽窄时,可用低比特率编码(窄带编码)。
在传输语音信号期间可实现比特率的匹配。对此,以现有的比特率的形式连续地测量传输信道的带宽。如果在传输语音信号期间可供使用的比特率低于给定的阈值,则变换编码,以便语音信号用窄带编码。
譬如可规定具有相当不同的比特率的两种不同的编码。譬如一种宽带编码在取样频率约为16kHz时实现,而一种窄带编码可在取样频率为8kHz时实现。在第一种情况中,覆盖语音频段达8kHz,在第二种情况中,则达4kHz。但是,由于比特率变换所引起的信号质量的起伏和由此所带来的通信线路的质量起伏是成问题的。通过所规定的阈值实现这种变换是比较突然的,以致于在通话期间会突然降低通信连接的质量。
通过使用所谓的宽带语音扩展器或简称语音扩展器,可以不改变通信协议,也在窄带编码时获得明显改进的语音质量,和减少突然变换所带来的质量降低的效应。这样一种宽带语音扩展器譬如从文献WO/0156021中得知。对此,宽带语音扩展器为此根据窄带信号通过合成高于4kHz的语音频率部分估测宽带信号。由此,为了编码在进行比特率变换时可避免出现太大的质量降低。为适应语音信号的比特率,由宽带语音扩展器提供的方法对几乎所有的通话者来说工作得相当好,特别是提供了完全可接受的语音质量。
发明内容
用本发明可进一步改进语音扩展器的语音质量、特别是宽带语音扩展器的语音质量。此外,还给出了一种根据窄带语音信号估测宽带语音信号的方法,使语音质量得到改进。
通过以下技术方案的语音扩展器可达到这种改进。此外,用以下技术方案的方法,在估测宽带语音信号时还可获得明显地改进。根据窄带语音信号估测宽带语音信号的语音扩展器和方法的优选的实施方案由相应的从属权利要求给出。
本发明的核心是在语音信号传输期间与通信终端设备相适配和/或与通话者相适应。借此,与已知的方法和语音扩展器相比还会再次改进语音质量。
本发明具体地涉及一种语音扩展器,该语音扩展器是如此构成的,使它根据窄带语音信号估测宽带语音信号。此外,它是自适应的,它在编码时与通信终端设备相匹配和/或与通话者相适应。在语音传输期间首先实现这种匹配适应。由此,语音扩展器可连续地适应远程用户。
语音扩展器可分析和存储至少一个语音参数并且可用该语音参数进行匹配。所述的至少一个语音参数首先系指在语音传输期间出现的一个宽带语音参数。特别是,所述的至少一个语音参数是专用于通话者和/或通信终端设备的。譬如可把语音扩展器用在不同的移动电话中,并且与其声音特征匹配。此外,它还可适应不同的用户、也即适应其声音特征如不同的语音频谱。因此,作为语音参数首先引入通信终端设备和/或通话者独特的声音特征、譬如频率分布、确定的频率或频段的衰减以及通话者声调频谱。这种类型的语音参数特别可在语音传输期间通过测量获得。
优选语音扩展器进行估测,方式是通过它分析评价至少一个已存储的语音参数。如上已述,为达到适应可引用不同的语音参数。在其测定后存储这些不同的语音参数,并且由此随时为实现适应提供这些不同的参数。不断地更新已存储的语音参数,以总是最佳地与当前的声音条件匹配,也是可能的。
最后,语音扩展器可用在移动站和/或基站的语音编码器中,这些移动站和/或基站都是或是为第三代移动无线系统构建的。第三代移动无线系统特别系指UMTS。
如果移动站是一个移动无线终端设备、优选移动电话,则语音扩展器优选在硬件中、特别在集成电路中、和/或软件中实现。在硬件中实现,优点在于语音扩展器与移动无线终端设备的其它主要的电路元件一起可集成在一块芯片上。譬如,芯片制造商可为移动无线终端设备的生产商提供这种类型的语音扩展器。相反,在软件上实现,优点在于容易更换语音扩展器、首先是事后更换、特别是当语音扩展器的软件存储在可擦存储器和可重复写入的存储器譬如EEPROM中时更是如此。
此外,本发明涉及根据窄带语音信号估测宽带语音信号的一种方法。按照这种方法,在估测时与通信终端设备匹配和/或与通话者匹配。
在该方法的优选的实施方案中,分析和存储至少一个语音参数和使用该语音参数进行匹配。优选至少一个语音参数是在语音传输期间出现的一个宽带语音参数。该至少一个语音参数特别是专用于通话者和/或通信终端设备的。
所述的方法有利地应用在移动站和/或基站的语音编码器中,该移动站和/或基站都是或是为第三代移动无线系统、特别是UMTS系统构建的。在优选的实施方案中,移动站是一个移动无线终端设备,并且所述的方法在硬件中实现,特别在集成电路中实现、和/或至少部分地在软件上实现。
具体实施方式
下面将就实施例说明本发明。
譬如首先应说明宽带语音扩展器的功能方式,以便更好地理解本发明的应用。
为产生高于所确定的频率的语音频率部分,在语音编码器中需要一个宽带激励信号和供合成滤波器用的宽带滤波器系数。由于通常只知道窄带激励信号和窄带滤波器系数,所以,必须进行“窄带”到“宽带”的转换。这种转换可借助宽带语音扩展器实现。譬如通过一个非线性信号处理可扩大激励信号。另一种可能就是激励信号与白噪声叠加。
通过使用两种代码簿可估测滤波器系数。代码簿的项表示滤波器系数的可能的数组。在训练阶段要训练窄带和宽带代码簿。因为它们同时用相同的激励信号(一次为窄带和一次为宽带)进行训练,所以,在两种代码簿的项之间的关系是已知的。譬如窄带代码簿的项1与宽带代码簿的项2对应。
在宽带语音扩展器的应用阶段按照如下方式使用两种代码簿:
1、从窄带语音信号计算窄带滤波器系数。
2、这些滤波器系数与窄带代码簿的项比较。
3、选出最合适的项。由于代码簿之间的关系是已知的,所以可同时找出最佳宽带滤波器系数。
根据所找出的宽带滤波器系数和扩展的激励信号合成语音信号段。
这样,在语音扩展期间可计算窄带语音的窄带滤波器系数。这些系数与具有窄带滤波器系数的窄带代码簿的项比较,并且选出最合适项。由于(如上已提到的)代码簿之间的关系是已知的,所以用这种方式可估测宽带语音扩展器的语音合成滤波器的最佳滤波器系数。
所述的方法也可自适应地譬如用下列步骤实现:
1、在宽带语音传输期间可计算“真正的”滤波器系数(FK),并且寻找出具有宽带语音系数的代码簿的最合适的项。
2、重新计算代码簿的项。
CB-向量(新的)=c*FK+(1-c)*CB-向量(旧的)
3、在窄带语音传输期间,根据修正的代码簿估算宽带滤波器系数。
替代方案可用下列步骤实现:
1、在宽带语音传输期间计算“真正的”滤波器系数(FK)。
2、从宽带语音信号计算窄带语音信号并求出窄带滤波器系数。
3、为窄带滤波器系数寻找出具有窄带系数的代码簿的最合适的项。
4、借助代码簿之间已知的关系寻找出具有宽带系数的代码簿的最佳项。
5、重新计算这个代码簿的项。
CB-向量(新的)=c*FK+(1-c)*CB-向量(旧的)
6、在窄带语音传输期间,根据修正的代码簿估算宽带滤波器系数。
通过本发明所述的语音扩展器可获得进一步地改进语音质量。该语音扩展器特别优选用在所有的通信系统中,譬如在UTSM中,在这些通信系统中都使用具有可变比特率的语音编码器,这些语音编码器不仅可用窄带而且可用宽带编码。

Claims (12)

1.语音扩展器,该语音扩展器如此构成,以致于它根据窄带语音信号估测宽带语音信号,其特征在于,
它是自适应地与通信终端设备和/或与通话者相匹配,并具有装置,用该装置所述语音扩展器可分析、存储至少一个在语音传输期间出现的宽带语音参数,并用所述宽带语音参数进行匹配。
2.按照权利要求1所述的语音扩展器,其特征在于,所述至少一个语音参数是专用于通话者和/或通信终端设备的。
3.按照权利要求2所述的语音扩展器,其特征在于,它在分析评估至少一个所存储的语音参数的情况下进行估测。
4.按照上述权利要求之一所述的语音扩展器,其特征在于,所述语音扩展器应用在移动站和/或基站的语音编码器中,所述移动站和/或基站是为第三代移动无线系统构建的。
5.按照权利要求4所述的语音扩展器,其特征在于,所述移动站是一个移动无线终端设备,并且语音扩展器用硬件和/或至少部分地用软件实现。
6.按照权利要求5所述的语音扩展器,其特征在于,所述硬件是集成电路。
7.根据窄带语音信号估测宽带语音信号的方法,其特征在于,在估测时实施与通信终端设备和/或与通话者相匹配,并且分析、存储至少一个在语音传输期间出现的宽带语音参数和用所述宽带语音参数进行匹配。
8.按照权利要求7所述的方法,其特征在于,至少一个语音参数是专用于通话者和/或通信终端设备的。
9.按照权利要求8所述的方法,其特征在于,在分析评估至少一个所存储的语音参数的情况下进行估测。
10.按照权利要求7-9之一所述的方法,其特征在于,所述方法应用在移动站和/或基站的语音编码器中,所述移动站和/或基站是为第三代移动无线系统构建的。
11.按照权利要求10所述的方法,其特征在于,所述移动站是一个移动无线终端设备,并且所述方法用硬件和/或至少部分地用软件实现。
12.按照权利要求11所述的方法,其特征在于,所述硬件是集成电路。
CNB018236731A 2001-09-28 2001-09-28 根据窄带语音信号估测宽带语音信号的语音扩展器和方法 Expired - Fee Related CN100403401C (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/DE2001/003729 WO2003036623A1 (de) 2001-09-28 2001-09-28 Sprachextender und verfahren zum schätzen eines breitbandigen sprachsignals anhand eines schmalbandigen sprachsignals

Publications (2)

Publication Number Publication Date
CN1630896A CN1630896A (zh) 2005-06-22
CN100403401C true CN100403401C (zh) 2008-07-16

Family

ID=5648296

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB018236731A Expired - Fee Related CN100403401C (zh) 2001-09-28 2001-09-28 根据窄带语音信号估测宽带语音信号的语音扩展器和方法

Country Status (5)

Country Link
US (1) US20040243400A1 (zh)
EP (1) EP1433166B8 (zh)
CN (1) CN100403401C (zh)
DE (1) DE50113277D1 (zh)
WO (1) WO2003036623A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2004090870A1 (ja) * 2003-04-04 2004-10-21 Kabushiki Kaisha Toshiba 広帯域音声を符号化または復号化するための方法及び装置
US8818797B2 (en) * 2010-12-23 2014-08-26 Microsoft Corporation Dual-band speech encoding
KR102244612B1 (ko) * 2014-04-21 2021-04-26 삼성전자주식회사 무선 통신 시스템에서 음성 데이터를 송신 및 수신하기 위한 장치 및 방법
US10847170B2 (en) 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
US9837089B2 (en) * 2015-06-18 2017-12-05 Qualcomm Incorporated High-band signal generation

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0945852A1 (en) * 1998-03-25 1999-09-29 BRITISH TELECOMMUNICATIONS public limited company Speech synthesis
GB2357682A (en) * 1999-12-23 2001-06-27 Motorola Ltd Audio circuit and method for wideband to narrowband transition in a communication device
WO2001056021A1 (en) * 2000-01-28 2001-08-02 Telefonaktiebolaget Lm Ericsson (Publ) System and method for modifying speech signals

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4311877A (en) * 1979-12-19 1982-01-19 Kahn Leonard R Method and means for improving the reliability of systems that transmit relatively wideband signals over two or more relatively narrowband transmission circuits
US4330689A (en) * 1980-01-28 1982-05-18 The United States Of America As Represented By The Secretary Of The Navy Multirate digital voice communication processor
ES2080302T3 (es) * 1990-03-08 1996-02-01 Ericsson Telefon Ab L M Asignacion dinamica del sistema de numeros de ruta de deambulantes y antecedentes del metodo de la invencion.
JP2779886B2 (ja) * 1992-10-05 1998-07-23 日本電信電話株式会社 広帯域音声信号復元方法
US5455888A (en) * 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
WO1995002288A1 (en) * 1993-07-07 1995-01-19 Picturetel Corporation Reduction of background noise for speech enhancement
US5668837A (en) * 1993-10-14 1997-09-16 Ericsson Inc. Dual-mode radio receiver for receiving narrowband and wideband signals
EP0732687B2 (en) * 1995-03-13 2005-10-12 Matsushita Electric Industrial Co., Ltd. Apparatus for expanding speech bandwidth
US5706335A (en) * 1995-04-10 1998-01-06 Corporate Computer Systems Method and appartus for transmitting coded audio signals through a transmission channel with limited bandwidth
US5806025A (en) * 1996-08-07 1998-09-08 U S West, Inc. Method and system for adaptive filtering of speech signals using signal-to-noise ratio to choose subband filter bank
US5901145A (en) * 1997-02-28 1999-05-04 Telefonaktiebolaget L M Ericsson (Publ) Mobile station handoff between a spread spectrum communications system and a frequency division communications system
DE19804581C2 (de) * 1998-02-05 2000-08-17 Siemens Ag Verfahren und Funk-Kommunikationssystem zur Übertragung von Sprachinformation
US7174135B2 (en) * 2001-06-28 2007-02-06 Koninklijke Philips Electronics N. V. Wideband signal transmission system

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0945852A1 (en) * 1998-03-25 1999-09-29 BRITISH TELECOMMUNICATIONS public limited company Speech synthesis
GB2357682A (en) * 1999-12-23 2001-06-27 Motorola Ltd Audio circuit and method for wideband to narrowband transition in a communication device
WO2001056021A1 (en) * 2000-01-28 2001-08-02 Telefonaktiebolaget Lm Ericsson (Publ) System and method for modifying speech signals

Also Published As

Publication number Publication date
EP1433166B1 (de) 2007-11-14
WO2003036623A1 (de) 2003-05-01
CN1630896A (zh) 2005-06-22
EP1433166B8 (de) 2008-01-02
DE50113277D1 (de) 2007-12-27
EP1433166A1 (de) 2004-06-30
US20040243400A1 (en) 2004-12-02

Similar Documents

Publication Publication Date Title
CA2378435C (en) Method for improving the coding efficiency of an audio signal
KR100923891B1 (ko) 음성 비활동 동안에 보이스 송신 시스템들 사이에상호운용성을 제공하는 방법 및 장치
KR101061404B1 (ko) 가변 레이트로 오디오를 인코딩 및 디코딩하는 방법
CN1129263C (zh) 分组编码信号的方法和装置
JP5543405B2 (ja) フレームエラーに対する感度を低減する符号化体系パターンを使用する予測音声コーダ
KR101160218B1 (ko) 일련의 데이터 패킷들을 전송하기 위한 장치와 방법, 디코더, 및 일련의 데이터 패킷들을 디코딩하기 위한 장치
EP3664085B1 (en) Signal coding and decoding methods and devices
US8055499B2 (en) Transmitter and receiver for speech coding and decoding by using additional bit allocation method
KR100614496B1 (ko) 가변 비트율의 광대역 음성 및 오디오 부호화 장치 및방법
US20120029914A1 (en) Method and apparatus for transmitting wideband speech signals
CA2494956A1 (en) Bandwidth-adaptive quantization
US20050143979A1 (en) Variable-frame speech coding/decoding apparatus and method
JP2002544551A (ja) 遷移音声フレームのマルチパルス補間的符号化
CN100403401C (zh) 根据窄带语音信号估测宽带语音信号的语音扩展器和方法
US8060362B2 (en) Noise detection for audio encoding by mean and variance energy ratio
AU6533799A (en) Method for transmitting data in wireless speech channels
WO2000030075A1 (en) Closed-loop variable-rate multimode predictive speech coder
CN1460247A (zh) 有特殊步长适应的自适应差分脉码调制语音编码系统
Bhatt et al. Proposed Modifications in ETSI GSM Full Rate Speech Codec in line with bitrates of GSM EFR Speech Codec and its Objective Evaluation of Performance using MATLAB
KR20050059572A (ko) 음성 레벨 변경 장치 및 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: NOKIA SIEMENS COMMUNICATION CO., LTD.

Free format text: FORMER OWNER: SIEMENS AG

Effective date: 20071214

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20071214

Address after: Munich, Germany

Applicant after: Nokia Siemens Networks GmbH

Address before: Munich, Germany

Applicant before: Siemens AG

C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20080716

Termination date: 20091028