JP2005062890A - クリーン信号確率変数の推定値を識別する方法 - Google Patents
クリーン信号確率変数の推定値を識別する方法 Download PDFInfo
- Publication number
- JP2005062890A JP2005062890A JP2004239994A JP2004239994A JP2005062890A JP 2005062890 A JP2005062890 A JP 2005062890A JP 2004239994 A JP2004239994 A JP 2004239994A JP 2004239994 A JP2004239994 A JP 2004239994A JP 2005062890 A JP2005062890 A JP 2005062890A
- Authority
- JP
- Japan
- Prior art keywords
- random variable
- noise
- signal
- computer
- clean signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
Abstract
【解決手段】 本方法およびシステムは、少なくともクリーン信号確率変数および雑音確率変数の関数として、マッピング確率変数を定義する。次いで、マッピング確率変数の値の分布の少なくとも1つのアスペクトを記述するモデルパラメータを判定する。モデルパラメータに基づいて、クリーン信号確率変数の推定値を判定する。本発明の多くの態様では、マッピング確率変数は信号対雑音比変数であり、本方法およびシステムは、モデルパラメータから信号対雑音比変数の値を推定する。
【選択図】 図4
Description
y=ln(ex+en)+ε 式1
上式で、yは雑音の多い音声であり、xはクリーン音声であり、nは雑音であり、εは残余である。xとnが一定であり同位相である場合、εが0になるのが理想的である。しかし、εが0の期待値を有することができるとしても、実データでは、εは0でない値を有する。したがって、εは分散を有する。
本発明は、このような状況に鑑みてなされたもので、その目的とするところは、最適な推定のための主要量として瞬時の信号対雑音比を使用して雑音を低減する、クリーン信号確率変数の推定値を識別する方法を提供することにある。
x=ln(ey−en) 式2
上式で、xはクリーン音声の特徴ベクトルであり、yは雑音の多い音声の特徴ベクトルであり、nは雑音の特徴ベクトルである。nがxよりもずっと大きい場合、nとyはほぼ等しい。これが生じたとき、xはnの変化の影響を受けやすくなる。さらに、対数内の項が負にならないように、nに対して制約を課さなければならない。
r=x−n 式3
x=y−ln(er+1)+r 式4
n=y−ln(er+1) 式5
p(y,r,x,n,s)=p(y|x,n)p(r|x,n)p(x,s)p(n) 式6
上式で、sは音素などの音声状態であり、p(y|x,n)は、所与のクリーン音声特徴ベクトルxおよび雑音特徴ベクトルnの場合の、雑音の多い音声の特徴ベクトルyの確率を表す観測確率であり、p(r|x,n)は、所与のクリーン音声特徴ベクトルおよび雑音特徴ベクトルの場合の、信号対雑音比特徴ベクトルrの確率を表す信号対雑音確率であり、p(x,s)は、クリーン音声特徴ベクトルと音声状態の同時確率であり、p(n)は、雑音特徴ベクトルの事前確率である。
p(y|x,n)=δ(ln(ex+en)−y) 式7
p(r|x,n)=δ(x−n−r) 式8
上式で、
p(y,r,s)=p(r|y,s)p(y|s)p(s) 式19
上式で、
402 加法性雑音
404 マイクロホン
408 フレームコンストラクタ
410 特徴抽出器
412 雑音推定
414 雑音モデルトレーナ
416 雑音低減パラメータ記憶
418 雑音低減
422 クリーン音声特徴ベクトルの推定値
500 トレーナ
502 トレーニングテキスト
504 音響モデル
506 デコーダ
508 レキシコン
510 言語モデル
512 信頼度測定モジュール
514 出力モジュール
Claims (11)
- 雑音の多い信号の中にみられるクリーン信号の一部を表すクリーン信号確率変数の推定値を識別する方法であって、
少なくとも前記クリーン信号確率変数および雑音確率変数の関数として、マッピング確率変数を定義するステップと、
前記マッピング確率変数の値の分布の少なくとも1つのアスペクトを記述する分布パラメータを判定するステップと、
前記分布パラメータを使用して、実測値から前記クリーン信号確率変数の推定値を判定するステップと
を備えることを特徴とする方法。 - 少なくとも前記クリーン信号確率変数および前記雑音確率変数の関数として前記マッピング確率変数を定義するステップは、前記クリーン信号確率変数と前記雑音確率変数との比として前記マッピング変数を定義するステップを含む
ことを特徴とする請求項1に記載の方法。 - 前記分布パラメータを使用して前記マッピング確率変数の推定値を判定するステップ
をさらに備えることを特徴とする請求項1に記載の方法。 - コンピュータ実行可能命令を有するコンピュータ読み取り可能な記録媒体であって、前記コンピュータ実行可能命令は、
信号対雑音比変数の関数として確率変数を定義するステップと、
前記定義した関数に基づいて前記信号対雑音比についての分布パラメータを判定するステップと、
前記分布パラメータを使用して前記信号対雑音比の推定値を判定するステップと
を実施する命令であることを特徴とするコンピュータ読み取り可能な記録媒体。 - 前記確率変数は、クリーン信号の一部を表すクリーン信号確率変数を含む
ことを特徴とする請求項4に記載のコンピュータ読み取り可能な記録媒体。 - 前記確率変数は、観測された信号中の雑音を表す雑音信号確率変数を含む
ことを特徴とする請求項4に記載のコンピュータ読み取り可能な記録媒体。 - 確率変数を定義するステップは、前記確率変数を実測値の関数として定義するステップをさらに含む
ことを特徴とする請求項4に記載のコンピュータ読み取り可能な記録媒体。 - 分布パラメータを判定するステップは、テイラー級数展開を使用して関数を近似するステップを含む
ことを特徴とする請求項2に記載の方法。 - 反復を実施するステップをさらに備え、該ステップは、
テイラー級数展開を使用して平均を計算するステップと、
前記テイラー級数展開のための新しい展開点を前記平均に等しく設定するステップと、
前記新しい展開点を使用して前記反復ステップを繰り返すステップとを含む
ことを特徴とする請求項8に記載の方法。 - 前記クリーン信号確率変数の値の分布の少なくとも1つのアスペクトを記述するクリーン信号モデルパラメータを判定するステップと、
前記クリーン信号モデルパラメータを使用して前記クリーン信号確率変数の推定値を判定するステップと
をさらに備えることを特徴とする請求項1に記載の方法。 - 前記雑音確率変数の値の分布の少なくとも1つのアスペクトを記述する雑音モデルパラメータを判定するステップと、
前記雑音モデルパラメータを使用して前記クリーン信号確率変数の推定値を判定するステップと
をさらに備えることを特徴とする請求項10に記載の方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10/643,370 US7363221B2 (en) | 2003-08-19 | 2003-08-19 | Method of noise reduction using instantaneous signal-to-noise ratio as the principal quantity for optimal estimation |
US10/643,370 | 2003-08-19 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011090398A Division JP2011158918A (ja) | 2003-08-19 | 2011-04-14 | クリーン信号確率変数の推定値を識別する方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005062890A true JP2005062890A (ja) | 2005-03-10 |
JP4855661B2 JP4855661B2 (ja) | 2012-01-18 |
Family
ID=34063458
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004239994A Expired - Fee Related JP4855661B2 (ja) | 2003-08-19 | 2004-08-19 | クリーン信号確率変数の推定値を識別する方法 |
JP2011090398A Pending JP2011158918A (ja) | 2003-08-19 | 2011-04-14 | クリーン信号確率変数の推定値を識別する方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011090398A Pending JP2011158918A (ja) | 2003-08-19 | 2011-04-14 | クリーン信号確率変数の推定値を識別する方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US7363221B2 (ja) |
EP (1) | EP1508893B1 (ja) |
JP (2) | JP4855661B2 (ja) |
KR (2) | KR101117940B1 (ja) |
CN (1) | CN1584984B (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012504250A (ja) * | 2008-09-29 | 2012-02-16 | 株式会社東芝 | 音声認識方法 |
WO2016009654A1 (ja) * | 2014-07-16 | 2016-01-21 | 日本電気株式会社 | 雑音抑圧システムと雑音抑圧方法及びプログラムを格納した記録媒体 |
Families Citing this family (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7107210B2 (en) * | 2002-05-20 | 2006-09-12 | Microsoft Corporation | Method of noise reduction based on dynamic aspects of speech |
US7103540B2 (en) * | 2002-05-20 | 2006-09-05 | Microsoft Corporation | Method of pattern recognition using noise reduction uncertainty |
DE102004002546A1 (de) * | 2004-01-17 | 2005-08-04 | Abb Patent Gmbh | Verfahren zum Betrieb eines Durchflussmesssystems |
US8175877B2 (en) * | 2005-02-02 | 2012-05-08 | At&T Intellectual Property Ii, L.P. | Method and apparatus for predicting word accuracy in automatic speech recognition systems |
US7844453B2 (en) * | 2006-05-12 | 2010-11-30 | Qnx Software Systems Co. | Robust noise estimation |
US8831111B2 (en) * | 2006-05-19 | 2014-09-09 | The Hong Kong University Of Science And Technology | Decoding with embedded denoising |
US8369417B2 (en) * | 2006-05-19 | 2013-02-05 | The Hong Kong University Of Science And Technology | Optimal denoising for video coding |
ES2394515T3 (es) * | 2007-03-02 | 2013-02-01 | Telefonaktiebolaget Lm Ericsson (Publ) | Métodos y adaptaciones en una red de telecomunicaciones |
EP2210427B1 (en) | 2007-09-26 | 2015-05-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for extracting an ambient signal |
JP5642339B2 (ja) * | 2008-03-11 | 2014-12-17 | トヨタ自動車株式会社 | 信号分離装置及び信号分離方法 |
MY154452A (en) | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
ATE539433T1 (de) | 2008-07-11 | 2012-01-15 | Fraunhofer Ges Forschung | Bereitstellen eines zeitverzerrungsaktivierungssignals und codierung eines audiosignals damit |
US20100262423A1 (en) * | 2009-04-13 | 2010-10-14 | Microsoft Corporation | Feature compensation approach to robust speech recognition |
CN101894563B (zh) * | 2010-07-15 | 2013-03-20 | 瑞声声学科技(深圳)有限公司 | 语音增强的方法 |
US8731923B2 (en) * | 2010-08-20 | 2014-05-20 | Adacel Systems, Inc. | System and method for merging audio data streams for use in speech recognition applications |
US20120143604A1 (en) * | 2010-12-07 | 2012-06-07 | Rita Singh | Method for Restoring Spectral Components in Denoised Speech Signals |
CN102571230A (zh) * | 2011-12-22 | 2012-07-11 | 中国人民解放军总参谋部第六十三研究所 | 基于高阶统计量与信噪比盲估计的分布式协同信号识别方法 |
US20150287406A1 (en) * | 2012-03-23 | 2015-10-08 | Google Inc. | Estimating Speech in the Presence of Noise |
CN103280215B (zh) * | 2013-05-28 | 2016-03-23 | 北京百度网讯科技有限公司 | 一种音频特征库建立方法及装置 |
CN105448303B (zh) * | 2015-11-27 | 2020-02-04 | 百度在线网络技术(北京)有限公司 | 语音信号的处理方法和装置 |
CN107797000A (zh) * | 2017-10-25 | 2018-03-13 | 成都西井科技有限公司 | 基于模型的分析的微波信号检测方法 |
CN112307422A (zh) * | 2020-10-30 | 2021-02-02 | 天津光电通信技术有限公司 | 一种低信噪比下信号时频分析方法、装置及设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06289891A (ja) * | 1993-04-02 | 1994-10-18 | Mitsubishi Electric Corp | 音声認識装置 |
JPH09258768A (ja) * | 1996-03-25 | 1997-10-03 | Mitsubishi Electric Corp | 騒音下音声認識装置及び騒音下音声認識方法 |
JPH10254499A (ja) * | 1997-03-14 | 1998-09-25 | Nippon Telegr & Teleph Corp <Ntt> | 帯域分割型雑音低減方法及び装置 |
JPH11345000A (ja) * | 1998-06-03 | 1999-12-14 | Nec Corp | 雑音消去方法及び雑音消去装置 |
US20020002455A1 (en) * | 1998-01-09 | 2002-01-03 | At&T Corporation | Core estimator and adaptive gains from signal to noise ratio in a hybrid speech enhancement system |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4897878A (en) * | 1985-08-26 | 1990-01-30 | Itt Corporation | Noise compensation in speech recognition apparatus |
US5704007A (en) * | 1994-03-11 | 1997-12-30 | Apple Computer, Inc. | Utilization of multiple voice sources in a speech synthesizer |
JP3484757B2 (ja) * | 1994-05-13 | 2004-01-06 | ソニー株式会社 | 音声信号の雑音低減方法及び雑音区間検出方法 |
US5864812A (en) * | 1994-12-06 | 1999-01-26 | Matsushita Electric Industrial Co., Ltd. | Speech synthesizing method and apparatus for combining natural speech segments and synthesized speech segments |
US5850629A (en) * | 1996-09-09 | 1998-12-15 | Matsushita Electric Industrial Co., Ltd. | User interface controller for text-to-speech synthesizer |
CA2296330C (en) * | 1997-07-31 | 2009-07-21 | British Telecommunications Public Limited Company | Generation of voice messages |
KR100304666B1 (ko) * | 1999-08-28 | 2001-11-01 | 윤종용 | 음성 향상 방법 |
US6879957B1 (en) * | 1999-10-04 | 2005-04-12 | William H. Pechter | Method for producing a speech rendition of text from diphone sounds |
US20030158734A1 (en) * | 1999-12-16 | 2003-08-21 | Brian Cruickshank | Text to speech conversion using word concatenation |
JP2002366186A (ja) * | 2001-06-11 | 2002-12-20 | Hitachi Ltd | 音声合成方法及びそれを実施する音声合成装置 |
US7010488B2 (en) * | 2002-05-09 | 2006-03-07 | Oregon Health & Science University | System and method for compressing concatenative acoustic inventories for speech synthesis |
-
2003
- 2003-08-19 US US10/643,370 patent/US7363221B2/en not_active Expired - Fee Related
-
2004
- 2004-07-22 EP EP04103502.3A patent/EP1508893B1/en not_active Not-in-force
- 2004-08-18 KR KR1020040064968A patent/KR101117940B1/ko active IP Right Grant
- 2004-08-19 JP JP2004239994A patent/JP4855661B2/ja not_active Expired - Fee Related
- 2004-08-19 CN CN2004100642175A patent/CN1584984B/zh not_active Expired - Fee Related
-
2011
- 2011-04-14 JP JP2011090398A patent/JP2011158918A/ja active Pending
- 2011-10-20 KR KR1020110107639A patent/KR101201146B1/ko active IP Right Grant
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH06289891A (ja) * | 1993-04-02 | 1994-10-18 | Mitsubishi Electric Corp | 音声認識装置 |
JPH09258768A (ja) * | 1996-03-25 | 1997-10-03 | Mitsubishi Electric Corp | 騒音下音声認識装置及び騒音下音声認識方法 |
JPH10254499A (ja) * | 1997-03-14 | 1998-09-25 | Nippon Telegr & Teleph Corp <Ntt> | 帯域分割型雑音低減方法及び装置 |
US20020002455A1 (en) * | 1998-01-09 | 2002-01-03 | At&T Corporation | Core estimator and adaptive gains from signal to noise ratio in a hybrid speech enhancement system |
JPH11345000A (ja) * | 1998-06-03 | 1999-12-14 | Nec Corp | 雑音消去方法及び雑音消去装置 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012504250A (ja) * | 2008-09-29 | 2012-02-16 | 株式会社東芝 | 音声認識方法 |
US8417522B2 (en) | 2008-09-29 | 2013-04-09 | Kabushiki Kaisha Toshiba | Speech recognition method |
WO2016009654A1 (ja) * | 2014-07-16 | 2016-01-21 | 日本電気株式会社 | 雑音抑圧システムと雑音抑圧方法及びプログラムを格納した記録媒体 |
US10748551B2 (en) | 2014-07-16 | 2020-08-18 | Nec Corporation | Noise suppression system, noise suppression method, and recording medium storing program |
Also Published As
Publication number | Publication date |
---|---|
US20050043945A1 (en) | 2005-02-24 |
JP2011158918A (ja) | 2011-08-18 |
EP1508893A3 (en) | 2007-09-05 |
KR20110131147A (ko) | 2011-12-06 |
EP1508893A2 (en) | 2005-02-23 |
KR101201146B1 (ko) | 2012-11-13 |
KR101117940B1 (ko) | 2012-02-29 |
JP4855661B2 (ja) | 2012-01-18 |
CN1584984A (zh) | 2005-02-23 |
US7363221B2 (en) | 2008-04-22 |
CN1584984B (zh) | 2010-05-26 |
EP1508893B1 (en) | 2013-05-22 |
KR20050020949A (ko) | 2005-03-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4855661B2 (ja) | クリーン信号確率変数の推定値を識別する方法 | |
JP4219774B2 (ja) | 劣化信号から雑音を除去する非線形観測モデル | |
JP4491210B2 (ja) | 再帰的構成における反復ノイズ推定法 | |
JP4824286B2 (ja) | 漸進的ベイズ学習を使用する雑音推定の方法 | |
US7617098B2 (en) | Method of noise reduction based on dynamic aspects of speech | |
US7460992B2 (en) | Method of pattern recognition using noise reduction uncertainty | |
JP2005527002A (ja) | ノイズの低減に関連する不確実性を判定する方法 | |
JP4731855B2 (ja) | 調波モデルに基づくフロントエンドを使用する頑強な音声認識のための方法およびコンピュータ可読記録媒体 | |
US7254536B2 (en) | Method of noise reduction using correction and scaling vectors with partitioning of the acoustic space in the domain of noisy speech | |
JP2006087082A (ja) | 多感覚音声強調のための方法および装置 | |
JP2005157354A (ja) | 複数感知の音声強調のための方法および機器 | |
US6944590B2 (en) | Method of iterative noise estimation in a recursive framework | |
JP2004310098A (ja) | スイッチング状態空間型モデルによる変分推論を用いた音声認識の方法 | |
US7475012B2 (en) | Signal detection using maximum a posteriori likelihood and noise spectral difference |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070820 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100827 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101125 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20101214 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110414 |
|
RD13 | Notification of appointment of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7433 Effective date: 20110415 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20110415 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20110512 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110708 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110914 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111021 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111027 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141104 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4855661 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R371 | Transfer withdrawn |
Free format text: JAPANESE INTERMEDIATE CODE: R371 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R360 | Written notification for declining of transfer of rights |
Free format text: JAPANESE INTERMEDIATE CODE: R360 |
|
R360 | Written notification for declining of transfer of rights |
Free format text: JAPANESE INTERMEDIATE CODE: R360 |
|
R371 | Transfer withdrawn |
Free format text: JAPANESE INTERMEDIATE CODE: R371 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |