JP2003177770A

JP2003177770A - 音声不在確率計算装置及び方法と、この装置及び方法を用いた雑音除去装置及び方法

Info

Publication number: JP2003177770A
Application number: JP2002299846A
Authority: JP
Inventors: Chang-Yong Son; 昌用孫; Vladimir Shin; ウラジミール・シン; Sang-Ryong Kim; 尚龍金
Original assignee: Samsung Electronics Co Ltd
Current assignee: Samsung Electronics Co Ltd
Priority date: 2001-10-15
Filing date: 2002-10-15
Publication date: 2003-06-27
Also published as: EP1304681A3; KR20030031660A; DE60211826T2; KR100400226B1; US7080007B2; DE60211826D1; US20030101055A1; EP1304681B1; EP1304681A2

Abstract

(57)【要約】（修正有）【課題】音声不在確率計算装置及び方法、これを用い
た雑音除去装置、方法の提供。【解決手段】音声信号の第ｍ番目のフレームに対して計
算された第１〜第Ｎｃアポステリオリ信号対雑音比及び
第ｍ番目のフレームに対して予測された第１〜第Ｎｃ予
測信号対雑音比から第ｍ番目のフレームに音声不在確率
を出すこの装置は、第１〜第Ｎｃアポステリオリ信号対
雑音比及び第１〜第Ｎｃ予測信号対雑音比から第１〜第
Ｎｃ尤度比を生成し出力する第１〜第Ｎｃ尤度比生成部
と、第１〜第Ｎｃ尤度比を所定のアプリオリ確率に各々
乗算、乗算された結果を出力する第１乗算部、第１乗算
部から入力された乗算結果各々に所定値を加算、加算さ
れた結果を出力する加算部、加算部から入力された加算
結果を乗算、乗算された結果を出力する第２乗算部、第
２乗算部から入力された前記乗算結果の逆数を計算、計
算された逆数を音声不在確率として出力する逆数計算部
を備える。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は音声信号処理に係
り、特に、音声不在確率（SAP: Speech Absence Probab
ility）を計算する装置及び方法と、この装置及び方法
を用いて音声に存在する雑音を除去する装置及び方法に
関する。

【０００２】

【従来の技術】音声不在確率は与えられた音声区間に音
声が存在しない確率であり、この確率に基づきその区間
における音声の存否が判断できる。ここで、音声が存在
しないと判断された区間は雑音のみ存在するとみなさ
れ、雑音のみ存在するとみなされた区間で雑音の分散が
更新される。ここで、雑音の分散は雑音除去装置の性能
に大きい影響を及ぼすので、音声不在確率をより正確に
計算することによって雑音を効率良く除去できる。

【０００３】音声向上とは、音声通信システムの入力ま
たは出力信号が雑音により汚染されている時に、システ
ムの性能を向上させること、すなわち、システムの性能
に及ぼす雑音の影響を最小化させることを意味する。音
声向上は、人と人との通信や人と機械との通信における
様々な状況下で、例えば、通信チャンネル上で雑音の影
響を受ける時や受信端で雑音が混ざる時に必要とされ
る。特に、雑音に汚染された入力音声信号を音声コーデ
ィングする時、音声認識システムの性能を向上させなけ
ればならない時、全般的に音質を向上させる必要がある
時、音声向上が必要となる。一般に、音声向上とは、音
声不在が不確実であるような雑音音声環境下で、雑音の
ないきれいな音声信号を推定することを意味する。雑音
音声スペクトルの各周波数チャンネルに存在する「音声
不在の不確実性を活用するというコンセプト」は多くの
人々により音声向上システムの性能改善に適用されてき
た（ここで、「音声不在の不確実性を活用するというコ
ンセプト」については、非特許文献１参照。）。

【０００４】過去の研究では、ほとんどの場合、音声不
在確率を計算する従来の方式は、他の周波数チャンネル
と関係なく各々の周波数チャンネルに対してのみ局所的
に音声不在確率を計算するものであった。しかし、この
ような従来の方式は、利用するデータが十分ではないた
め、音声向上を実現する時に統計的な信頼性が保証され
ないという問題点を有する。

【０００５】上述の問題を解決するために開発された従
来の他の方式として、グローバルソフト決定（GSD: glo
bal soft decision）方式がある（例えば、非特許文献
２参照。）。ここに開示されている従来のＧＳＤ方式は
ＩＳ−１２７標準で使われる方法よりも優れているとい
うことが検証されている。このＧＳＤ方式はあらゆる周
波数チャンネルのデータを使って与えられた時間フレー
ムが音声不在フレームであるか否かを全域的に判断し、
しかも十分な量のデータを使用するので、前記従来の方
法に比べて,統計的な信頼性を向上させられる。さら
に、従来のＧＳＤ方式は従来の他のいかなる音声不在確
率計算方法とも異なって、音声不在フレームだけではな
く音声存在フレームにおいても雑音音声から雑音電力ス
ペクトルを推定するので、音声不在確率計算がより正確
に行えるとともに、スペクトル利得及び雑音スペクトル
推定方法に強じん性を与える（このような従来のＧＳＤ
方式の一例として、大韓民国特許出願第９９−３６１１
５号「音声向上方法」に記載がある。特許文献１参
照。）。しかし、前述の如き従来のＧＳＤ方式は、各周
波数チャンネルにおいてスペクトル成分が独立している
という正確ではない仮定に基づくために音声不在確率を
正確に計算できず、しかも雑音環境下で雑音を効率良く
除去できないという問題点を有する。

【０００６】その他、関連する先行技術文献として、非
特許文献３、非特許文献４、非特許文献５がある。

【０００７】

【非特許文献１】ヤリフ・エフライム（Yariv Ephrai
m），ダヴィド・マラー（David Malah）共著，「スピー
チ・エンハンスメント・ユージング・ア・ミニマム・ミ
ーンスクエア・エラー・ショートタイム・スペクトラル
・アンプリチュード・エスティメータ（Speech Enhance
ment using a Minimum Mean-Square Error Short-Time
Spectral Amplitude Estimator）」，アイトリプリー・
トランザクションズ・オン・アコースティクス・スピー
チ・アンド・シグナル・プロセッシング（IEEE Transac
tions on Acoustics, Speech, and Signal Processin
g），アメリカ合衆国，インスティチュート・オブ・エ
レクトリカル・アンド・エレクトロニクス・エンジニア
ーズ・インコーポレイテッド（Institute of Electrica
l and Electronics Engineers, Inc.），１９８４年，
第ＡＳＳＰ−３２巻，第６号，ｐ．１１０９−１１２１

【非特許文献２】Ｎ・キム（N. Kim），Ｊ・チャン（J.
Chang）共著，「スペクトラル・エンハンスメント・ベ
イスト・オン・グローバル・ソフト・デシジョン（Spec
tral enhancement based on global soft decisio
n）」，アイトリプリー・シグナル・プロセッシング・
レターズ（IEEE Signal Processing Letters），アメリ
カ合衆国，インスティチュート・オブ・エレクトリカル
・アンド・エレクトロニクス・エンジニアーズ・インコ
ーポレイテッド（Institute of Electrical and Electr
onics Engineers, Inc.），２０００年，第７巻，ｐ．
１０８−１１０

【非特許文献３】Ｒ・Ｊ・マコーレイ（R. J. McAula
y），Ｌ・マルパス（Malpass）共著，「スピーチ・エン
ハンスメント・ユージング・ア・ソフトデシジョン・ノ
イズ・サプレッション・フィルタ（Speech enhancement
using a soft-decision noise suppression filte
r）」，アイトリプリー・トランザクションズ・オン・
アコースティクス・スピーチ・アンド・シグナル・プロ
セッシング（IEEE Transactionson Acoustics, Speech,
and Signal Processing），アメリカ合衆国，インステ
ィチュート・オブ・エレクトリカル・アンド・エレクト
ロニクス・エンジニアーズ・インコーポレイテッド（In
stitute of Electrical and Electronics Engineers, I
nc.），１９８０年４月，第ＡＳＳＰ−２８巻，ｐ．１
３７−１４５

【非特許文献４】Ｊ．Ｓ．リム（J. S. Lim），Ａ．
Ｖ．オッペンハイム（A. V. Oppenheim）共著，「エン
ハンスメント・アンド・バンドウィドス・コンプレッシ
ョン・オブ・ノイズ・スピーチ（Enhancement and band
width compression of noise speech）」，プロシーデ
ィングズ・オブ・ジ・アイトリプリー（Proceedings of
the IEEE），アメリカ合衆国，インスティチュート・
オブ・エレクトリカル・アンド・エレクトロニクス・エ
ンジニアーズ・インコーポレイテッド（Institute of E
lectrical and Electronics Engineers, Inc.），１９
７９年，第６７巻，ｐ．１５８６−１６０４

【非特許文献５】Ｏ・カッペ（O. Cappe）著，「エリミ
ネーション・オブ・ミュージカル・ノイズ・フェノメノ
ン・ウィズ・ジ・エフライム・アンド・マラー・ノイズ
・サプレッサ（Elimination of musical noise phenome
non with the Ephraim and Malahnoise suppresso
r）」，アイトリプリー・トランザクションズ・オン・
スピーチ・アンド・オーディオ・プロセッシング（IEEE
Transactions on Speech andAudio Processing），ア
メリカ合衆国，インスティチュート・オブ・エレクトリ
カル・アンド・エレクトロニクス・エンジニアーズ・イ
ンコーポレイテッド（Institute of Electrical and El
ectronics Engineers, Inc.）」，１９９４年４月，第
２巻，ｐ．３４５−３４９

【特許文献１】大韓民国特許出願公開第２００１−１９
６０３号明細書

【０００８】

【発明が解決しようとする課題】本発明が解決しようと
する第１の技術的課題は、各周波数帯域において雑音区
間を効率良く検出するために使われて、音声が存在しな
い確率を示す音声不在確率を正確に計算できる音声不在
確率計算装置を提供することである。

【０００９】本発明が解決しようとする第２の技術的課
題は、各周波数帯域において雑音区間を効果的に検出す
るために使われ、音声が不在する確率を表わす音声不在
確率を正確に計算できる音声不在確率計算方法を提供す
ることである。

【００１０】本発明が解決しようとする第３の技術的課
題は、音声が不在する確率を表わす音声不在確率に基づ
き音声に含まれた雑音を効率良く除去できる雑音除去装
置を提供することである。

【００１１】本発明が解決しようとする第４の技術的課
題は、前記雑音除去装置において雑音を除去する雑音除
去方法を提供することである。

【００１２】

【課題を解決するための手段】前記第１の課題を達成す
るために、音声信号の第ｍ番目のフレームに対して計算
された第１〜第Ｎｃ（ここで、Ｎｃはチャンネルの総
数）アポステリオリ信号対雑音比（SNR: Signal to Noi
se Ratio）及び前記第ｍ番目のフレームに対して予測さ
れた第１〜第Ｎｃ予測ＳＮＲから前記第ｍ番目のフレー
ムに音声が存在しない確率である音声不在確率を計算す
る音声不在確率計算装置は、前記第１〜第Ｎｃアポステ
リオリＳＮＲ及び前記第１〜第Ｎｃ予測ＳＮＲから第１
〜第Ｎｃ尤度比を生成して出力する第１〜第Ｎｃ尤度比
生成部と、前記第１〜第Ｎｃ尤度比を所定のアプリオリ
確率に各々乗算し、乗算された結果を出力する第１乗算
部と、前記第１乗算部から入力された前記乗算結果各々
に所定値を加算し、加算された結果を出力する加算部
と、前記加算部から入力された前記加算結果を乗算し、
乗算された結果を出力する第２乗算部と、前記第２乗算
部から入力された前記乗算結果の逆数を計算し、計算さ
れた逆数を前記音声不在確率として出力する逆数計算部
とを備えることを特徴とする。

【００１３】前記第２の課題を達成するために、音声信
号の第ｍ番目のフレームに対して計算された第１〜第Ｎ
ｃ（ここで、Ｎｃはチャンネルの総数）アポステリオリ
信号対雑音比及び前記第ｍ番目のフレームに対して予測
された第１〜第Ｎｃ予測信号対雑音比から前記第ｍ番目
のフレームに音声が不在する確率である音声不在確率を
計算する音声不在確率計算方法は、前記第１〜第Ｎｃア
ポステリオリＳＮＲ及び前記第１〜第Ｎｃ予測ＳＮＲか
ら前記第１〜第Ｎｃ尤度比を生成する（ａ）段階と、前
記第１〜第Ｎｃ尤度比を所定のアプリオリ確率に各々乗
算する（ｂ）段階と、前記乗算された結果各々を前記所
定値に加算する（ｃ）段階と、前記加算された結果を乗
算する（ｄ）段階と、前記（ｄ）段階で乗算された結果
の逆数を計算し、計算された逆数を前記音声不在確率と
して決定する（ｅ）段階とを備えることを特徴とする。

【００１４】前記第３の課題を達成するために、前記音
声不在確率に基づき前記音声信号から雑音を除去する本
発明に係る雑音除去装置は、時間領域において前処理さ
れた後に周波数領域に変換され、雑音を含みうる前記音
声信号の前記アポステリオリＳＮＲをフレーム単位に計
算するアポステリオリＳＮＲ計算部と、前記音声不在確
率、前記アポステリオリＳＮＲ及び以前のＳＮＲからア
プリオリＳＮＲ及び前記アポステリオリＳＮＲを修正
し、修正されたアプリオリＳＮＲ及び修正されたアポス
テリオリＳＮＲを出力するＳＮＲ修正部と、前記修正さ
れたアプリオリＳＮＲ及び前記修正されたアポステリオ
リＳＮＲから各周波数チャンネルに適用される利得を計
算し、計算された利得を出力する利得計算部と、前記音
声信号及び前記利得を乗算し、乗算された結果を前記音
声信号から前記雑音が除去された結果として出力する第
３乗算部と、雑音電力の推定値及び前記第３乗算部から
入力された前記乗算結果から前記以前のＳＮＲを計算
し、計算された前記以前のＳＮＲを前記ＳＮＲ修正部に
出力する以前ＳＮＲ計算部と、前記音声信号、前記音声
不在確率及び前記予測ＳＮＲから前記雑音電力の推定値
及び音声電力の推定値を計算する音声／雑音電力更新部
と、前記音声電力の推定値及び前記雑音電力の推定値か
ら前記予測ＳＮＲを計算し、計算された前記予測ＳＮＲ
を前記音声／雑音電力更新部に各々出力するＳＮＲ予測
部とを備えることを特徴とする。

【００１５】前記第４の課題を達成するために、音声信
号の第ｍ番目のフレームに対して計算されたアポステリ
オリ信号対雑音比及び前記第ｍ番目のフレームに対して
予測された予測信号対雑音比から計算され、前記第ｍ番
目のフレームに音声が不在する確率を表わす前記音声不
在確率に基づき前記音声信号から雑音を除去する雑音除
去方法は、前記音声信号の前記アポステリオリＳＮＲを
フレーム単位に求める（ｆ）段階と、前記音声不在確
率、前記アポステリオリＳＮＲ及び以前のＳＮＲに基づ
きアプリオリＳＮＲ及び前記アポステリオリＳＮＲを修
正し、修正された結果を前記修正されたアプリオリＳＮ
Ｒ及び前記修正されたアポステリオリＳＮＲとして各々
決定する（ｇ）段階と、前記修正されたアプリオリＳＮ
Ｒ及び前記修正されたアポステリオリＳＮＲに基づき各
周波数チャンネルに適用される利得を求める（ｈ）段階
と、前記音声信号及び前記利得を乗算する（ｉ）段階
と、雑音電力の推定値及び前記（ｉ）段階で乗算された
結果に基づき前記以前のＳＮＲを求める（ｊ）段階と、
前記音声信号と前記音声不在確率及び前記予測ＳＮＲに
基づき前記雑音電力の推定値及び音声電力の推定値を求
める（ｋ）段階と、前記音声電力の推定値及び前記雑音
電力の推定値に基づき前記予測ＳＮＲを求める（ｌ）段
階とを備えることを特徴とする。

【００１６】

【発明の実施の形態】以下、添付した図面に基づき、本
発明に係る音声不在確率計算装置の構成及び動作（作
用）とその装置で行われる本発明に係る音声不在確率計
算方法を、好ましい実施の形態として、詳細説明する。

【００１７】図１は、本発明に係る音声不在確率計算装
置のブロック図である。本発明に係る音声不在確率計算
装置は、第１〜第Ｎｃ尤度比生成部１０，１２，．．．
及び１４と、第１乗算部２０と、加算部３０と、第２乗
算部４０及び逆数計算部５０を含む。

【００１８】図２は、図１に示す装置において行われる
本発明に係る音声不在確率計算方法を説明するためのフ
ローチャートである。音声不在確率計算方法は、生成さ
れた尤度比各々及びアプリオリ確率を乗算する段階（第
６０段階及び第６２段階）と、乗算された結果に所定値
を加算し、その結果を互いに乗算した後に逆数を取る段
階（第６４段階〜第６８段階）とを含む。

【００１９】まず、第ｍ番目のフレームに対して計算さ
れた第１〜第Ｎｃ（ここで、Ｎｃは各フレームに含まれ
たチャンネルの総数）アポステリオリＳＮＲ及び第ｍ番
目のフレームに対して予測された第１〜第Ｎｃ予測ＳＮ
Ｒから第１〜第Ｎｃ尤度比を生成する（第６０段階）。
このために、図１に示された第１，第２，．．．及び第
Ｎｃ尤度比生成部１０，１２，．．．及び１４は入力端
子ＩＮ１を介して入力された第１〜第Ｎｃアポステリオ
リＳＮＲ及び入力端子ＩＮ２を介して入力された第１〜
第Ｎｃ予測ＳＮＲから第１〜第Ｎｃ尤度比を生成し、生
成された第１〜第Ｎｃ尤度比を第１乗算部２０に出力す
る。例えば、第ｉ（ここで、１≦ｉ≦Ｎｃ）尤度比生成
部１０，１２，．．．または１４は入力端子ＩＮ１及び
ＩＮ２を介して各々入力された後、に基づき、を計算する。

【００２０】

【数１】

【００２１】ここで、, G_m(i)は第ｍ番目のフレームの
第ｉ番目のチャンネルにある信号のスペクトルを表わ
し、S_m(i)及びN_m(i)は音声及び雑音スペクトルを各々表
わし、は第ｍ番目のフレームの第ｉ番目のチャンネルにおける
雑音電力の推定値を表わす。

【００２２】

【数２】

【００２３】ここで、は第ｍ番目のフレームの第ｉ番目のチャンネルにおける
音声電力の推定値を表わす。

【００２４】

【数３】

【００２５】第６０段階後に、第１乗算部２０は、第１
〜第Ｎｃ尤度比生成部達１０，１２，．．．，及び１４
から入力された第１〜第Ｎｃ尤度比各々を下記式４のよ
うに表わされる所定のアプリオリ確率ｑに乗算し、乗算
された結果を加算部３０に出力する（第６２段階）。

【００２６】

【数４】

【００２７】ここで、 p(H₁)は雑音及び音声が共存する
確率を表わし、p(H₀)は雑音のみ存在する確率を表わ
す。第６２段階を行うために、第１乗算部２０はＮｃ個
の乗算器２２，２４，．．．及び２６を含む。第ｉ乗算
器２２，２４，．．．または２６は、第ｉ尤度比生成部
１０，１２，．．．または１４から入力された及びアプリオリ確率ｑを乗算し、乗算された結果を加算
部３０に出力する。

【００２８】第６２段階後に、加算部３０は第１乗算部
２０から入力された乗算結果各々を入力端子ＩＮ３を介して入力された所定値、例え
ば‘１’に加算し、加算された結果を第２乗算部４０に
出力する（第６４段階）。このために、加算部３０は第
１〜第Ｎｃ加算器３２，３４，．．．及び３６を含む。
ここで、第ｉ加算器３２，３４，．．．または３６は第
ｉ乗算器２２，２４，．．．または２６から入力された
乗算結果に‘１’を加算し、加算された結果を第２乗算部４０に
出力する。

【００２９】第６４段階後に、第２乗算部４０は加算部
３０から入力された加算結果を乗算し、乗算された結果
を逆数計算部５０に出力する（第６６段階）。第６６段
階後に、逆数計算部５０は第２乗算部４０から入力され
た乗算結果の逆数を計算し、計算された逆数を第ｍ番目
のフレームに音声が存在しない確率であるとして出力端子ＯＵＴ１を介して出力する（第６８段
階）。

【００３０】結局、従来の方式により計算されたはが互いに独立的であるという仮定、すなわち、各周波数
チャンネルにおけるスペクトル成分が互いに独立的であ
るという仮定下で下記式５のように求められる。

【００３１】

【数５】

【００３２】ここで、Ｇ（ｍ）は第ｍ番目のフレームの
スペクトル成分を表わすベクトルであって、下記式６の
ように表わされ、は下記式７のように表わされる。

【００３３】

【数６】

【００３４】

【数７】

【００３５】ここで、は各々第ｍ番目のフレームの第ｉ番目のチャンネルの雑
音及び音声の電力を表わす。

【００３６】これに対し、本発明により計算されたは音声の在否を第ｍ番目のフレームにおいて各チャンネ
ル別に独立的に考慮できるので、下記式８のように求め
られる。

【００３７】

【数８】

【００３８】以下、添付した図面に基づき、前記音声不
在確率計算装置及び方法を用いる本発明に係る雑音除去
装置の構成及び動作とその雑音除去装置において行われ
る本発明に係る雑音除去方法を下記の通り説明する。

【００３９】図３は、図１に示された音声不在確率計算
装置を用いる本発明に係る雑音除去装置のブロック図で
あって、アポステリオリＳＮＲ計算部８０と、音声不在
確率計算装置８２と、ＳＮＲ修正部８４と、利得計算部
８６と、第３乗算部８８と、以前ＳＮＲ計算部９０と、
音声／雑音電力更新部９２及びＳＮＲ予測部９４を含ん
でなる。

【００４０】図４は、図３に示された雑音除去装置にお
いて行われる本発明に係る雑音除去方法を説明するため
のフローチャートであって、アポステリオリＳＮＲ及び
予測ＳＮＲに基づき音声不在確率を求める段階（第１１
０段階及び第１１２段階）と、修正されたアプリオリＳ
ＮＲ及び修正されたアポステリオリＳＮＲに基づき利得
を求める段階（第１１４段階及び第１１６段階）と、音
声信号及び利得を乗算して以前のＳＮＲを求める段階
（第１１８段階及び第１２０段階）及び音声と雑音電力
の推定値及び予測ＳＮＲを求める段階（第１２２段階及
び第１２４段階）を含んでなる。

【００４１】まず、時間領域において前処理された後に
周波数領域に変換され、雑音を含みうる音声信号のアポ
ステリオリＳＮＲをフレーム単位に求めて第６０段階へ
戻る（第１１０段階）。このために、図３に示されたア
ポステリオリＳＮＲ計算部８０は雑音を有することがで
き、入力端子ＩＮ４を介して前処理部（図示せず）から
入力される音声信号の各フレームにおいてＮｃ個のアポ
ステリオリＳＮＲを計算し、計算されたアポステリオリ
ＳＮＲを音声不在確率計算装置８２に出力する。ここ
で、前処理部（図示せず）は雑音が混ざった音声信号を
プレエンファシスし、Ｍ−ポイント高速フーリエ変換を
行う。例えば、アポステリオリＳＮＲ計算部８０は、第
ｍ番目のフレームに対する第１〜第Ｎｃアポステリオリ
ＳＮＲの一つであるを下記式９のように求める。

【００４２】

【数９】

【００４３】ここで、は音声信号のフレーム間の相関性を考慮する時に平滑化
した音声信号の電力であって、下記式１０のように表わ
され、は使用者により前もって決定されるアポステリオリＳＮ
Ｒの最低値を表わす。

【００４４】

【数１０】

【００４５】ここで、は平滑化パラメータを表わす。

【００４６】第１１０段階後に、音声不在確率計算装置
８２は、Ｎｃ個のアポステリオリＳＮＲ及びＮｃ個の予
測ＳＮＲに基づき音声不在確率を前述の如き求める（第
１１２段階）。図３に示された音声不在確率計算装置８
２は図１に示された音声不在確率装置に当たり、同じ構
成を有して同じ機能を行う。また、図４に示された第１
１２段階は図２に示された音声不在確率計算方法と同一
なため、音声不在確率計算装置８２及び第１１２段階に
ついての詳細な説明は省く。

【００４７】第１１２段階後に、ＳＮＲ修正部８４は、
図１または図３に示された音声不在確率計算装置８２か
ら入力されたアポステリオリＳＮＲ計算部８０から入力された及び以前のフレームに対して以前ＳＮＲ計算部９０で計
算されて入力されるに基づきを修正し、下記式１１のように表わされるを利得計算部８６に出力する（第１１４段階）。

【００４８】

【数１１】

【００４９】ここで、は決定進行（DD: Decision-Directed）方式により下記
式１２のように求められる。

【００５０】

【数１２】

【００５１】ここで、は下記式１３のように表わされる。

【００５２】

【数１３】

【００５３】ここで、は第ｍ−１番目のフレームにおける音声電力の推定値を
表わす。

【００５４】第１１４段階後に、利得計算部８６は、Ｓ
ＮＲ修正部８４から入力されたからを下記式１４のように計算し、を第３乗算部８８に出力する（第１１８段階）。

【００５５】

【数１４】

【００５６】ここで、は下記式１５のように表わされ、は０次の修正されたベッセル関数を表わし、は１次の修正されたベッセル関数を表わす。

【００５７】

【数１５】

【００５８】第１１６段階後に、第３乗算部８８は、入
力端子ＩＮ４を介して入力されたを乗算し、を出力端子ＯＵＴ２を介して雑音が除去された音声信
号、すなわち、改善された音声信号として後処理部（図
示せず）に出力する（第１１８段階）。ここで、後処理
部（図示せず）は改善された音声信号を逆高速フーリエ
変換（ＩＦＦＴ）した後にデエンファシスする。

【００５９】第１１８段階後に、以前ＳＮＲ計算部９０
は第ｍ番目のフレームに対するに基づき下記式１３のように表わされたを計算し、をＳＮＲ修正部８４に出力する（第１２０段階）。

【００６０】第１２０段階後に、音声／雑音電力更新部
９２は、入力端子ＩＮ４を介して入力された音声不在確率計算部８２から入力された音声不在確率及
びＳＮＲ予測部９４から入力された予測ＳＮＲから雑音
電力の推定値及び音声電力の推定値を計算する（第１２
２段階）。例えば、音声／雑音電力更新部９２は第ｍ＋
１番目のフレームに対する雑音電力のを下記式１６のように求める。

【００６１】

【数１６】

【００６２】ここで、ＧＳＤ方式により下記式１７のように求められる。

【００６３】

【数１７】

【００６４】ここで、

【００６５】

【数１８】

【００６６】この時、音声／雑音電力更新部９２は、第
ｍ＋１番目のフレームに対するを下記式１９のように求める。

【００６７】

【数１９】

【００６８】ここで、ＧＳＤ方式により下記式２０のように表わされる。

【００６９】

【数２０】

【００７０】ここで、

【００７１】

【数２１】

【００７２】前式１８及び２１から分かるように、音声
／雑音電力更新部９２は、第ｍ＋１番目のフレームの音
声電力の推定値及び第ｍ＋１番目のフレームの雑音電力
の推定値を求めるために、第ｍ番目のフレームの音声及
び雑音電力の推定値を貯蔵する。

【００７３】第１２２段階後に、ＳＮＲ予測部９４は、
音声／雑音電力更新部９２から入力された音声電力の推
定値及び雑音電力の推定値から予測ＳＮＲを計算し、計
算された予測ＳＮＲを音声不在確率計算装置８２及び音
声／雑音電力更新部９２に各々出力する（第１２４段
階）。例えば、ＳＮＲ予測部９４は、第ｍ＋１番目のフ
レームに対する第ｉ番目の第ｍ＋１番目のフレームに対する第ｉ番目のに基づき、第ｍ＋１番目のフレームに対する第ｉ番目の
チャンネルのを下記式２２のように求める。

【００７４】

【数２２】

【００７５】以下、本発明により求めた音声不在確率に
基づき雑音を除去した結果と従来のＧＳＤ方式により雑
音を除去した結果とを下記の通り比較する。

【００７６】ＩＴＵ−Ｔから提供する韓国語音声データ
ベースを用い、４名の女子及び４名の男子に対して音質
に対する客観的及び主観的な評価を行った。この時、客
観的な評価基準として分割ＳＮＲを用いる場合、本発明
により雑音が除去された結果が従来の方式により雑音が
除去された結果よりも高いＳＮＲを提供する。また、フ
レームの大きさが８０サンプルであり、周波数チャンネ
ルの総数Ｎｃが１６であり、ｑが０．００４であり、サンプリングレートが８ｋＨｚ
であると仮定すると、主観的な評価により行われた聞き
取り実験（MOS: Mean Opinion Score）の結果は下記表
１の通りである。

【００７７】

【表１】

【００７８】ここで、右側の３列に記載された数字は聞
取り者が本人の主観的な基準に従い音質を評価したもの
であって、１から５までの数字として示される。数字が
大きいほど平均的に音質が良い。１０ｄＢのバブル雑音
を除いたホワイトガウス雑音、２０ｄＢのバブル雑音及
びカー雑音において、本発明に係る装置及び方法により
雑音が除去される時に一層良好な音質が提供されるとい
うことが分かる。これより、本発明に係る音声不在確率
計算装置及び方法が従来のＧＳＤ方式よりも一層正確に
音声不在確率を計算するということが分かる。

【００７９】

【発明の効果】以上述べたように、本発明に係る音声不
在確率計算装置及び方法と、この装置及び方法を用いた
雑音除去装置及び方法は、音声符号化、音楽符号化、音
声向上のように音響信号の質に関する信号処理前分野の
全体に亘って適用される時、一層正確に音声不在確率を
計算するので、雑音が含まれた音声信号から雑音を効率
良く除去して向上された音質を有する改善された音声信
号を提供できる。

【図面の簡単な説明】

【図１】本発明に係る音声不在確率計算装置のブロック
図である。

【図２】図１に示す音声不在確率計算装置において行わ
れる本発明に係る音声不在確率計算方法を説明するため
のフローチャートである。

【図３】図１に示す音声不在確率計算装置を用いる本発
明に係る雑音除去装置のブロック図である。

【図４】図３に示す雑音除去装置において行われる本発
明に係る雑音除去方法を説明するためのフローチャート
である。

【符号の説明】

２０第１乗算部３０加算部４０第２乗算部ＩＮ１〜ＩＮ３入力端子ＯＵＴ１出力端子ｑアプリオリ確率

───────────────────────────────────────────────────── フロントページの続き (72)発明者金尚龍大韓民国京畿道龍仁市水枝邑上▲ 硯▼里 30番地盛原アパート 118棟 1204号Ｆターム(参考） 5D015 EE05

Claims

【特許請求の範囲】

【請求項１】音声信号の第ｍ番目のフレームに対して
計算された第１〜第Ｎｃ（ここで、Ｎｃはチャンネルの
総数）アポステリオリ信号対雑音比及び前記第ｍ番目の
フレームに対して予測された第１〜第Ｎｃ予測信号対雑
音比から前記第ｍ番目のフレームに音声が存在しない確
率である音声不在確率を計算する音声不在確率計算装置
において、前記第１〜第Ｎｃアポステリオリ信号対雑音比及び前記
第１〜第Ｎｃ予測信号対雑音比から第１〜第Ｎｃ尤度比
を生成して出力する第１〜第Ｎｃ尤度比生成部と、前記第１〜第Ｎｃ尤度比を所定のアプリオリ確率に各々
乗算し、乗算された結果を出力する第１乗算部と、前記第１乗算部から入力された前記乗算結果各々に所定
値を加算し、加算された結果を出力する加算部と、前記加算部から入力された前記加算結果を乗算し、乗算
された結果を出力する第２乗算部と、前記第２乗算部から入力された前記乗算結果の逆数を計
算し、計算された逆数を前記音声不在確率として出力す
る逆数計算部とを備えることを特徴とする音声不在確率
計算装置。
【請求項２】音声信号の第ｍ番目のフレームに対して
計算された第１〜第Ｎｃ（ここで、Ｎｃはチャンネルの
総数）アポステリオリ信号対雑音比及び前記第ｍ番目の
フレームに対して予測された第１〜第Ｎｃ予測信号対雑
音比から前記第ｍ番目のフレームに音声が不在する確率
である音声不在確率を計算する音声不在確率計算方法に
おいて、（ａ）前記第１〜第Ｎｃアポステリオリ信号対雑音比及
び前記第１〜第Ｎｃ予測信号対雑音比から前記第１〜第
Ｎｃ尤度比を生成する段階と、（ｂ）前記第１〜第Ｎｃ尤度比を所定のアプリオリ確率
に各々乗算する段階と、（ｃ）前記乗算された結果各々を前記所定値に加算する
段階と、（ｄ）前記加算された結果を乗算する段階と、（ｅ）前記（ｄ）段階で乗算された結果の逆数を計算
し、計算された逆数を前記音声不在確率として決定する
段階とを備えることを特徴とする音声不在確率計算方
法。
【請求項３】音声信号の第ｍ番目のフレームに対して
計算されたアポステリオリ信号対雑音比及び前記第ｍ番
目のフレームに対して予測された予測信号対雑音比から
計算され、前記第ｍ番目のフレームに音声が不在する確
率を表わす前記音声不在確率に基づき前記音声信号から
雑音を除去する雑音除去装置において、時間領域において前処理された後に周波数領域に変換さ
れ、雑音を含みうる前記音声信号の前記アポステリオリ
信号対雑音比をフレーム単位に計算するアポステリオリ
信号対雑音比計算部と、前記音声不在確率、前記アポステリオリ信号対雑音比及
び以前の信号対雑音比からアプリオリ信号対雑音比及び
前記アポステリオリ信号対雑音比を修正し、修正された
アプリオリ信号対雑音比及び修正されたアポステリオリ
信号対雑音比を出力する信号対雑音比修正部と、前記修正されたアプリオリ信号対雑音比及び前記修正さ
れたアポステリオリ信号対雑音比から各周波数チャンネ
ルに適用される利得を計算し、計算された利得を出力す
る利得計算部と、前記音声信号及び前記利得を乗算し、乗算された結果を
前記音声信号から前記雑音が除去された結果として出力
する第３乗算部と、雑音電力の推定値及び前記第３乗算部から入力された前
記乗算結果から前記以前の信号対雑音比を計算し、計算
された前記以前の信号対雑音比を前記信号対雑音比修正
部に出力する以前信号対雑音比計算部と、前記音声信号、前記音声不在確率及び前記予測信号対雑
音比から前記雑音電力の推定値及び音声電力の推定値を
計算する音声／雑音電力更新部と、前記音声電力の推定値及び前記雑音電力の推定値から前
記予測信号対雑音比を計算し、計算された前記予測信号
対雑音比を前記音声／雑音電力更新部に各々出力する信
号対雑音比予測部とを備えることを特徴とする前記音声
不在確率計算装置を利用する雑音除去装置。
【請求項４】音声信号の第ｍ番目のフレームに対して
計算されたアポステリオリ信号対雑音比及び前記第ｍ番
目のフレームに対して予測された予測信号対雑音比から
計算され、前記第ｍ番目のフレームに音声が不在する確
率を表わす前記音声不在確率に基づき前記音声信号から
雑音を除去する雑音除去方法において、（ｆ）前記音声信号の前記アポステリオリ信号対雑音比
をフレーム単位に求める段階と、（ｇ）前記音声不在確率、前記アポステリオリ信号対雑
音比及び以前の信号対雑音比に基づきアプリオリ信号対
雑音比及び前記アポステリオリ信号対雑音比を修正し、
修正された結果を前記修正されたアプリオリ信号対雑音
比及び前記修正されたアポステリオリ信号対雑音比とし
て各々決定する段階と、（ｈ）前記修正されたアプリオリ信号対雑音比及び前記
修正されたアポステリオリ信号対雑音比に基づき各周波
数チャンネルに適用される利得を求める段階と、（ｉ）前記音声信号及び前記利得を乗算する段階と、（ｊ）雑音電力の推定値及び前記（ｉ）段階で乗算され
た結果に基づき前記以前の信号対雑音比を求める段階
と、（ｋ）前記音声信号と前記音声不在確率及び前記予測信
号対雑音比に基づき前記雑音電力の推定値及び音声電力
の推定値を求める段階と、（ｌ）前記音声電力の推定値及び前記雑音電力の推定値
に基づき前記予測信号対雑音比を求める段階とを備える
ことを特徴とする雑音除去方法。