JP4089347B2 - 音声復号装置 - Google Patents

音声復号装置 Download PDF

Info

Publication number
JP4089347B2
JP4089347B2 JP2002240327A JP2002240327A JP4089347B2 JP 4089347 B2 JP4089347 B2 JP 4089347B2 JP 2002240327 A JP2002240327 A JP 2002240327A JP 2002240327 A JP2002240327 A JP 2002240327A JP 4089347 B2 JP4089347 B2 JP 4089347B2
Authority
JP
Japan
Prior art keywords
background noise
noise level
packet
decoded
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2002240327A
Other languages
English (en)
Other versions
JP2004077961A (ja
Inventor
弘美 青柳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2002240327A priority Critical patent/JP4089347B2/ja
Publication of JP2004077961A publication Critical patent/JP2004077961A/ja
Application granted granted Critical
Publication of JP4089347B2 publication Critical patent/JP4089347B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、音声信号情報のパケット伝送における音声通信装置に関するものである。
【0002】
【従来の技術】
現在、インターネット等のネットワークを利用した音声通信が盛んに行われている。これは音声符号化情報をパケット化してネットワークを通じて伝送するものであり、ネットワークの輻輳による音声符号化パケット欠落が発生した場合、受信側では補完パケット等で代替えして音声復号装置を動作させている。
【0003】
【発明が解決しようとする課題】
しかしながら、上述のような音声復号装置では、補完パケットが復号された場合に復号音声信号レベルは極めて小さくなり、前後の復号音声信号の背景雑音レベルが高い場合には、聴感的な違和感により品質が劣化するという欠点があった。
【0004】
本発明は、このような従来の構成が有していた問題を解決するものであり、聴感的違和感を解消し、品質劣化を抑えるようにしたものである。
【0005】
【課題を解決するための手段】
かかる課題を解決するため、本発明による音声復号装置は、伝送路を介して入力される符号化パケットから復号音声信号を生成し、符号化パケットが未入力のとき補完パケットを用いて復号音声信号を生成する音声復号手段と、符号化パケットから生成された復号音声信号のパワーを用いて背景雑音レベルを算出する背景雑音レベル推定手段と、背景雑音レベル推定手段は背景雑音レベルから雑音利得を算出し、雑音利得を乗算した雑音信号を出力する雑音発生手段と、補完パケットから生成された復号音声信号に、雑音信号を加算して合成音声信号を出力する加算手段とを備え、背景雑音レベル推定手段は符号化パケットから復号音声信号が生成されたときのみ、該復号音声信号のパワーを用いて背景雑音レベルを更新して記憶し、該背景雑音レベルから雑音利得を算出し、背景雑音レベルを更新するときに、最新の背景雑音レベルを所定倍したものと最新の背景雑音レベルに所定値を加算したもののうち、大きいほうの値を選択し、該大きいほうの値と符号化パケットから生成された復号音声信号のパワーのうち、小さいほうの値を背景雑音レベルとして更新することを特徴とする。
【0006】
【発明の実施の形態】
以下、本発明による音声復号装置の実施形態は、図1、図2を用いて説明される。
【0007】
図1は実施形態の音声復号装置を示す動作ブロック図である。また図2は実施形態のレベル調整雑音重畳を示す図である。図1に示すように、本発明の音声復号装置は、音声復号器101、符号化パケット入力判定器102、補完パケット生成器103、背景雑音レベル推定回路104、雑音発生器105、乗算器106、加算器107から構成される。
【0008】
音声復号器101はネットワーク上の伝送路から入力される音声符号化情報である符号化パケットCを用いて、10msのフレーム毎に復号音声信号Sdを生成する。また音声復号器101は符号化パケットCが入力されなかった場合、補完パケットを用いて、10msのフレーム毎に復号音声信号Sdを生成する。
【0009】
符号化パケット入力判定器102は、音声復号器101に伝送路から符号化パケットCが入力されたか未入力であるかを判定し、音声復号器101に符号化パケットCが入力された場合、補完パケット使用フラグPをP=0として補完パケット生成器103及び背景雑音レベル推定回路104に出力する。また符号化パケット入力判定器102は、符号化パケットCの欠落等により音声復号器101に伝送路から符号化パケットCが入力されず復号音声信号Sdが生成されなかった場合、補完パケット使用フラグPをP=1として補完パケット生成器103及び背景雑音レベル推定回路104に出力する。
【0010】
補完パケット生成器103は、補完パケット使用フラグP=0が入力された場合、音声復号器101に補完パケットを出力しない。また補完パケット生成器103は、補完パケット使用フラグP=1が入力された場合、補完パケットを生成し、音声復号器101に補完パケットを出力する。例えば、補完パケットは復号音声が無音となるような情報をもつパケットであり、その復号音声レベルは有音と比べ極めて小さいものとする。
【0011】
背景雑音レベル推定回路104は、補完パケット使用フラグP=0が入力された場合、10msのフレーム毎に、雑音利得g=0として出力する。また背景雑音レベル推定回路104は、補完パケット使用フラグP=1が入力された場合、10msのフレーム毎に、雑音利得gを推定される背景雑音レベルBから(1)式のように算出し、出力する。背景雑音レベルBは後述の(2)式のように算出されるが、背景雑音レベルBの初期値は0である。またNは10ms当たりの音声サンプル数とする。
g=(√B)/N …(1)
【0012】
更に、背景雑音レベル推定回路104は補完パケット使用フラグP=0が入力された場合、合成音声信号S出力時のフレームパワーRを算出し、雑音利得gを算出するための情報である背景雑音レベルBを(2)式のように算出し、更新して記憶する。(2)式において、Bn+1は算出される背景雑音レベルBを示し、Bは背景雑音レベル推定回路104に記憶されている背景雑音レベルBを示す。またDは予め設定された定数である。
n+1=min(R,max(B×D,B+1))…(2)
【0013】
ここで、(2)式について説明する。例えばB=min(x,y)であれば、xとyのうちで値の小さいほうをBの値とし、B=max(x,y)であれば、xとyのうちで値の大きいほうをBの値とする。
【0014】
まず(2)式におけるB+1を考慮せずに、(2)式を次の(3)式のように変形して説明する。
n+1=min(R,B×D)…(3)
(3)式において、Rは合成音声信号S出力時のフレームパワーであり、B×Dは背景雑音レベル推定回路104に記憶されている背景雑音レベルBを予め定められた定数D倍したものである。Dは合成音声信号が有音状態のとき、B×DがRより大きくならないように設定されるほうがよい。
【0015】
例えば、時間の変化により無音状態の背景雑音レベルも変化することがある。よって、無音状態の背景雑音レベルの変化を考慮し、推測される背景雑音レベルは、記憶されている背景雑音レベルBにDが乗算され、B×Dとして算出される。(3)式において、RとB×Dが比較され、B×Dの値のほうが小さければB×Dが背景雑音レベルBn+1として算出され、Rの値のほうが小さければRが背景雑音レベルBn+1として算出される。
【0016】
しかし(3)式においてフレームパワーRが0である場合、算出される背景雑音レベルBn+1は常に0となることが考えられる。そこで(2)式のmax(B×D,B+1)の算出が必要になる。つまりB+1とは、記憶されている背景雑音レベルBが0である場合でも、算出される背景雑音レベルBn+1が0とならないように補償するものである。(2)式では、算出される背景雑音レベルBn+1が0にならないために、B+1のようにBに1が加算されているが、最低限の背景雑音レベルを補償できるような所定の値をαとして、B+1部分はBにαが加算されるようにB+αと設定されればよい。
【0017】
また背景雑音レベル推定回路104は、補完パケット使用フラグP=1が入力された場合、背景雑音レベルBは更新されない。
【0018】
雑音発生器105は予め定められたレベルの白色雑音を発生し、雑音信号Szを出力する。
【0019】
乗算器106は、レベル調整雑音として雑音信号Szに雑音利得gを乗算して出力する。
【0020】
加算器107は復号音声信号Sdに、レベル調整雑音(g×Sz)を加算して合成音声信号Sとして出力する。
【0021】
次に図1及び図2を用いて、以上の構成による音声復号装置の動作を説明する。
【0022】
図2に示される送信側入力音声▲1▼は、符号化パケットCとしてネットワークに伝送される入力音声の状態を表わす。図2に示されるネットワーク伝送▲2▼において、欠落とはパケット欠落であり、ネットワークの輻輳により、パケット欠落が発生したことを表わす。図2に示される復号音声▲3▼は音声復号器101が出力する復号音声信号Sdの状態を表わす。図2に示されるレベル調整雑音重畳後の合成音声▲4▼は、符号化パケットCが欠落して補完パケットを用いて生成された復号音声信号に対して、レベル調整雑音を加算した後の合成音声信号Sの状態を表わす。
【0023】
図1に示される音声復号器101に伝送路から符号化パケットCが入力されると、符号化パケット入力判定器102は補完パケット使用フラグP=0を補完パケット生成器103及び背景雑音レベル推定回路104に出力する。補完パケット使用フラグP=0が入力された補完パケット生成器103は補完パケットを音声復号器101に出力しない。
【0024】
音声復号器101は入力された符号化パケットCを用いて、10msのフレーム毎に復号音声信号を生成する。
【0025】
補完パケット使用フラグP=0が入力された背景雑音レベル推定回路104は雑音利得g=0として乗算器106に出力する。雑音発生器105は雑音信号を乗算器106に出力するが、乗算器106は雑音信号に雑音利得g=0を乗算して出力するので、加算器107は復号音声信号Sdを合成音声信号Sとして出力する。また背景雑音レベル推定回路104は、この合成音声信号Sから(2)式のように背景雑音レベルBを算出し、更新して記憶する。
【0026】
音声復号器101に符号化パケットCが入力されなかった場合、符号化パケット入力判定器102は補完パケット使用フラグP=1を補完パケット生成器103及び背景雑音レベル推定回路104に出力する。補完パケット使用フラグP=1が入力された補完パケット生成器103は補完パケットを音声復号器101に出力する。補完パケットが入力された音声復号器101は補完パケットを用いて復号音声信号を生成する。よって、図2に示されるように、送信側入力音声▲1▼に対して、復号音声▲3▼のようになる。例えば、復号音声▲3▼において、欠落部11、欠落部12、欠落部13が、パケット欠落が発生し、補完パケットを用いて復号した部分である。
【0027】
補完パケット使用フラグP=が入力された背景雑音レベル推定回路104は、記憶されている背景雑音レベルBから雑音利得gを算出し、乗算器106に出力する。乗算器106は、雑音発生器105から出力される雑音信号Szに背景雑音レベル推定回路104から出力される雑音利得gを乗算して出力する。加算器107は、復号音声信号Sdに乗算器106の出力信号を加算し、合成音声信号Sとして出力する。
【0028】
以上のようにレベル調整雑音重畳が行われ、図2に示されるレベル調整雑音重畳後の合成音声▲4▼のように、復号音声▲3▼において符号化パケットCが欠落し、補完パケットを用いて復号音声信号Sdが生成された信号部分に、レベル調整のされた雑音信号Szが加算される。例えば図2において、復号音声▲3▼の欠落部11に対し、レベル調整雑音重畳後の合成音声▲4▼の重畳部21のように、レベル調整雑音が加算される。また同様に、欠落部12及び欠落部13に対しても、それぞれ重畳部22及び重畳部23のようにレベル調整雑音が加算される。
【0029】
本実施形態では、背景雑音レベル推定回路104に補完パケット使用フラグP=0が入力された場合、雑音利得g=0を出力することによって、復号音声信号Sdを合成音声信号Sとして出力させるが、乗算器106と加算器107の間に切替スイッチを設け、入力判定器102が未入力を検出した場合に、切替スイッチをオフ状態とすることにより復号音声信号Sdを合成音声信号Sとして出力させる構成でもよい。
【0030】
また本実施形態では、背景雑音レベル推定回路104は、雑音利得gを算出するための情報として背景雑音レベルBを更新して記憶するが、背景雑音レベルから算出した雑音利得gも同時に更新して記憶しておき、補完パケット使用フラグP=1が入力された場合、雑音利得gを出力させてもよい。
【0031】
【発明の効果】
以上のように、本発明の音声復号装置によれば、符号化パケットの欠落等により、補完パケットを用いて復号音声信号が生成された場合でも、前後の復号音声信号の背景雑音レベルが高い場合に感じる聴感的違和感を解消し、品質劣化を抑えることができる。
【図面の簡単な説明】
【図1】本発明の実施形態を示す音声復号装置を示すの動作ブロック図
【図2】本発明の実施形態のレベル調整雑音重畳を示す図
【符号の説明】
101…音声復号器、102…符号化パケット入力判定器、103…補完パケット生成器、104…背景雑音レベル推定回路、105…雑音発生器、106…乗算器、107…加算器。

Claims (1)

  1. 伝送路を介して入力される符号化パケットから復号音声信号を生成し、前記符号化パケットが未入力のとき補完パケットを用いて前記復号音声信号を生成する音声復号手段と、
    前記符号化パケットから生成された前記復号音声信号のパワーを用いて背景雑音レベルを算出する背景雑音レベル推定手段と、
    前記背景雑音レベル推定手段は前記背景雑音レベルから雑音利得を算出し、前記雑音利得を乗算した雑音信号を出力する雑音発生手段と、
    前記補完パケットから生成された前記復号音声信号に、前記雑音信号を加算して出力する加算手段とを備え、
    前記背景雑音レベル推定手段は前記符号化パケットから前記復号音声信号が生成されたときのみ、該復号音声信号のパワーを用いて前記背景雑音レベルを更新して記憶し、該背景雑音レベルから前記雑音利得を算出し、前記背景雑音レベルを更新するときに、最新の背景雑音レベルを所定倍したものと最新の背景雑音レベルに所定値を加算したもののうち、大きいほうの値を選択し、該大きいほうの値と前記符号化パケットから生成された前記復号音声信号のパワーのうち、小さいほうの値を前記背景雑音レベルとして更新すること
    を特徴とする音声復号装置。
JP2002240327A 2002-08-21 2002-08-21 音声復号装置 Expired - Fee Related JP4089347B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002240327A JP4089347B2 (ja) 2002-08-21 2002-08-21 音声復号装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002240327A JP4089347B2 (ja) 2002-08-21 2002-08-21 音声復号装置

Publications (2)

Publication Number Publication Date
JP2004077961A JP2004077961A (ja) 2004-03-11
JP4089347B2 true JP4089347B2 (ja) 2008-05-28

Family

ID=32023151

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002240327A Expired - Fee Related JP4089347B2 (ja) 2002-08-21 2002-08-21 音声復号装置

Country Status (1)

Country Link
JP (1) JP4089347B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2006208529B2 (en) 2005-01-31 2010-10-28 Microsoft Technology Licensing, Llc Method for weighted overlap-add
JP2009063928A (ja) * 2007-09-07 2009-03-26 Fujitsu Ltd 補間方法、情報処理装置
CN101483495B (zh) 2008-03-20 2012-02-15 华为技术有限公司 一种背景噪声生成方法以及噪声处理装置
BR112015014217B1 (pt) * 2012-12-21 2021-11-03 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V Adição de ruído de conforto para modelagem do ruído de fundo em baixas taxas de bits
FR3020732A1 (fr) * 2014-04-30 2015-11-06 Orange Correction de perte de trame perfectionnee avec information de voisement

Also Published As

Publication number Publication date
JP2004077961A (ja) 2004-03-11

Similar Documents

Publication Publication Date Title
JP4579273B2 (ja) ステレオ音響信号の処理方法と装置
JP2008529423A (ja) 音声通信におけるフレーム消失キャンセル
JPH0962299A (ja) コード励振線形予測符号化装置
JP4089347B2 (ja) 音声復号装置
EP1515307B1 (en) Method and apparatus for audio coding with noise suppression
JP4471086B2 (ja) オーディオ再生装置、オーディオデータ配信サーバ、オーディオデータ配信システム、その方法及びプログラム
JP4365653B2 (ja) 音声信号送信装置、音声信号伝送システム及び音声信号送信方法
US8918325B2 (en) Signal processing device for processing stereo signals
JP4437052B2 (ja) 音声復号化装置および音声復号化方法
JP3649854B2 (ja) 音声符号化装置
JP4108396B2 (ja) 多地点制御装置の音声符号化伝送システム
JP4065383B2 (ja) 音声信号送信装置、音声信号受信装置及び音声信号伝送システム
JP3316945B2 (ja) 伝送誤り補償装置
JP3073283B2 (ja) 励振コードベクトル出力回路
JPH0954600A (ja) 音声符号化通信装置
JPH09319397A (ja) ディジタル信号処理装置
JPH0946268A (ja) ディジタル音声通信装置
JP3593183B2 (ja) 音声復号装置
JP3113455B2 (ja) 音声復号装置
JP2000081898A (ja) ホワイトノイズの生成方法、ホワイトノイズの振幅制御方法およびデジタル電話装置
JP2002229595A (ja) 音声通信端末並びに音声通信システム
JP2640598B2 (ja) 音声復号装置
JP3207927B2 (ja) 無音処理装置
JP3179687B2 (ja) 音声復号装置
JP2002196795A (ja) 音声復号装置及び音声符号化・復号装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041220

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060923

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20060929

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20061013

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20061101

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20061121

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070119

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071120

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080111

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080205

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080218

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110307

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110307

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120307

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130307

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140307

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees