JP2013541023A - 試験音声信号の雑音を除去する結果として試験雑音除去音声信号内で減衰したスペクトル成分を復元するための方法 - Google Patents
試験音声信号の雑音を除去する結果として試験雑音除去音声信号内で減衰したスペクトル成分を復元するための方法 Download PDFInfo
- Publication number
- JP2013541023A JP2013541023A JP2013513311A JP2013513311A JP2013541023A JP 2013541023 A JP2013541023 A JP 2013541023A JP 2013513311 A JP2013513311 A JP 2013513311A JP 2013513311 A JP2013513311 A JP 2013513311A JP 2013541023 A JP2013541023 A JP 2013541023A
- Authority
- JP
- Japan
- Prior art keywords
- component
- training
- signal
- undistorted
- test
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000003595 spectral effect Effects 0.000 title claims abstract description 35
- 238000012360 testing method Methods 0.000 title claims abstract description 31
- 230000002238 attenuated effect Effects 0.000 title claims abstract description 13
- 238000000034 method Methods 0.000 title claims description 48
- 238000012549 training Methods 0.000 claims abstract description 46
- 230000005236 sound signal Effects 0.000 claims abstract description 13
- 239000002131 composite material Substances 0.000 claims abstract description 10
- 238000001228 spectrum Methods 0.000 claims description 23
- 239000013598 vector Substances 0.000 claims description 15
- 230000008569 process Effects 0.000 claims description 9
- 239000000654 additive Substances 0.000 claims description 8
- 230000000996 additive effect Effects 0.000 claims description 8
- 239000011159 matrix material Substances 0.000 claims description 7
- 238000004458 analytical method Methods 0.000 claims description 6
- 239000000203 mixture Substances 0.000 claims description 3
- 238000009472 formulation Methods 0.000 claims description 2
- 238000013016 damping Methods 0.000 claims 1
- 230000003362 replicative effect Effects 0.000 claims 1
- 230000002194 synthesizing effect Effects 0.000 claims 1
- 230000001131 transforming effect Effects 0.000 claims 1
- 230000006870 function Effects 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000011143 downstream manufacturing Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
Abstract
Description
図1に示されるように、本発明の実施の形態は、雑音含有音声Sのスペクトル成分を不適切に減衰させる有損失雑音除去プロセスG()100を、いかなる音声スペクトル成分も減衰させることなく信号内の雑音を減衰させる無損失雑音除去機構F()110と、無損失雑音除去信号Xを変更して有損失信号Yを生成する歪関数D()120との組み合わせとしてモデル化する。
図2は、試験雑音除去音声信号203内のスペクトル成分を復元するための方法200のステップを示す。トレーニング無歪音声信号201が、トレーニング無歪基本成分211の合成成分として表される(210)。トレーニング雑音除去音声202が、トレーニング有歪基本成分221の合成成分として表される(220)。トレーニング有歪基本成分221の合成成分に従って試験雑音除去音声信号203を分解すること(230)によって、対応する試験無歪音声信号204をトレーニング無歪基本成分211の合成成分として推定することができ(240)、その合成成分は、トレーニング有歪基本成分221の合成成分と同一である。上記の方法のステップは、当該技術分野において既知であるような、メモリおよび入力/出力インターフェースに接続されたプロセッサにおいて実行することができる。
図1において説明および図示されたモデルは、本来スペクトルモデルである。そのモデルは、無相関信号の合成成分の特性を評価し、無相関信号の電力スペクトルは、加法的であるので、そのモデルは、全ての信号のスペクトルの特性を評価する。それゆえ、全ての音声信号は、信号の短時間フーリエ変換(STFT:Short−Time Fourier Transform)を求め、その成分の振幅を計算することによって得られる振幅スペクトログラムとして表される。理論的には、それは、加法的である電力スペクトルである。しかしながら、経験的には、振幅スペクトルの場合の方が、良好に加法性が成り立つ。
復元のために、トレーニング段階において、トレーニングデータ、すなわち、トレーニング無歪音声信号201およびトレーニング雑音除去音声信号202から、信号Xのための無損失基本成分Bi211および信号Yのための対応する有損失基本成分Bi distorted221が得られる。トレーニング後、その方法の動作中に、これらの基本成分を用いて、雑音除去信号Xを推定する。
歪関数D()120は、未知であるので、成分BiおよびBi distortedは、信号Xおよび対応する信号Yの共同記録を解析することから一緒に得られる。それゆえ、トレーニング段階において、トレーニング信号XおよびYの共同記録が必要とされる。しかしながら、信号Xは、直接入手できず、代わりに、以下の近似が用いられる。
試験雑音除去信号Y203内のスペクトル成分を復元するための方法は、Yの各スペクトルベクトルY(t)が有歪基本成分によっていかに構成されるかを決定する。上記のように、Y(t)=Σiwi(t)Bi distortedが成り立つ。
任意のY(t)に対して重みW(t)=[w1(t)w2(t)...]Tが決定された後に、式2によって、対応する無損失スペクトルX(t)を、X(t)=Σiwi(t)Biとして推定することができる。その推定手順は、繰返し行われるので、式3における厳密な等式は、決して達成されない。代わりに、行列
多くの場合に、記録され、雑音除去された音声信号は、縮小された帯域幅を有し、例えば、その音声が電話によって取り込まれた場合には、その音声は、4kHzまでの低い周波数のみを含むことができ、4kHzよりも高い周波数は失われる。これらの場合に、その方法を拡張して、信号の中に高い周波数スペクトル成分を復元することができる。これは、信号の了解度を改善することも予想される。帯域幅を拡張するために、帯域幅再構成手順を用いることができる。引用することにより本明細書の一部をなす、2010年4月13日にRamakrishnan他に対して発行された「Constructing broad−band acoustic signals from lower−band acoustic signals」という名称の米国特許第7,698,143号を参照されたい。その手順は,低い帯域の音響信号から広帯域の音響信号を構成することにのみ関係し、本明細書の場合のような、雑音除去音声信号には、関係しない。
Claims (18)
- 試験音声信号の雑音を除去する結果として試験雑音除去音声信号内で減衰したスペクトル成分を復元するための方法であって、
トレーニング無歪音声信号をトレーニング無歪基本成分の合成成分として表すことと、
トレーニング雑音除去音声信号をトレーニング有歪基本成分の合成成分として表すことと、
前記試験雑音除去信号を前記トレーニング有歪基本成分の合成成分として分解することと、
前記無歪試験音声信号を前記トレーニング無歪基本成分の前記合成成分として推定することであって、前記合成成分は、前記トレーニング有歪基本成分の前記合成成分と同一である、推定することとを含む、
試験音声信号の雑音を除去する結果として試験雑音除去音声信号内で減衰したスペクトル成分を復元するための方法。 - 前記試験雑音除去音声信号を生成するためのプロセスは、未知であり、
理想的な無損失雑音除去関数によって前記プロセスをモデル化することであって、仮想的に無損失である雑音除去信号を生成する、モデル化することと、前記雑音除去信号を、前記スペクトル成分を減衰させる歪関数に通すこととを更に含む、
請求項1に記載の方法。 - 前記基本成分は、全て加法的であり、各基本成分は、重みに関連付けられる、
請求項1に記載の方法。 - 前記歪関数は、他の基本成分から独立して任意の基本成分を変換する、
請求項2に記載の方法。 - 全ての音声信号を振幅スペクトログラムとして表すことを更に含み、前記振幅スペクトログラムは、前記音声信号の短時間フーリエ変換(STFT)の振幅を求めることによって得られる、
請求項1に記載の方法。 - 前記トレーニング無歪基本成分および前記トレーニング有歪基本成分は、トレーニングデータの振幅スペクトログラムの共同解析によって求められ、前記トレーニングデータは、記録のペアを含み、各ペアは、明瞭な音声信号と、該明瞭な音声信号を人為的に劣化させたバージョンとを含み、前記人為的に劣化させたバージョンは、雑音を付加し、その後、前記人為的に劣化させたバージョンから雑音を除去することによって劣化している、
請求項1に記載の方法。 - 前記明瞭な音声信号のサンプル、および前記明瞭な音声信号を人為的に劣化させて雑音を除去した前記バージョンのサンプルを時間的に整合させる、
請求項6に記載の方法。 - 前記無歪トレーニング基本成分および前記有歪トレーニング基本成分は、前記記録の前記ペアの共同解析によって求められる、
請求項7に記載の方法。 - 前記トレーニング無歪基本成分および前記トレーニング有歪基本成分は、事例ベースモデルを用いて求められ、前記トレーニング無歪基本成分および前記トレーニング有歪基本成分は、前記トレーニング無歪基本成分および前記トレーニング有歪基本成分のための振幅スペクトルベクトルの中からランダムに選択される、
請求項1に記載の方法。 - 前記重みは、非負である、
請求項3に記載の方法。 - 前記重みは、非負行列因子分解(NMF)によって求められる、
請求項3に記載の方法。 - 前記試験無歪音声信号の帯域幅を拡張することを更に含む、
請求項1に記載の方法。 - 前記トレーニング無歪基本成分は、最大帯域幅の明瞭な音声信号から得られ、前記トレーニング有歪基本成分は、縮小された帯域幅を有し、雑音で人為的に劣化させ、雑音を除去した音声信号から得られる、
請求項6または12に記載の方法。 - 前記推定された試験無歪音声信号は、非負行列因子分解(NMF)によって求められた重みを用いて前記トレーニング無歪基本成分を合成することによって得られる、
請求項1に記載の方法。 - 前記試験無歪音声信号の推定振幅短時間フーリエ変換(STFT)を構成する最後の振幅スペクトルは、推定された無歪スペクトルにウィーナーフィルター定式化を用いることを適用することによって得られる、
請求項1に記載の方法。 - 前記推定された試験無歪音声信号は、逆変換された推定振幅STFTと前記試験雑音除去音声信号のSTFTから得られた位相とを合成し、結果として生成された複素STFTを逆変換することによって得られる、
請求項15に記載の方法。 - 前記推定された試験無歪音声信号の前記STFTの4kHzよりも高い周波数成分は、前記トレーニング無歪基本成分の前記合成成分から直接得られる、
請求項15に記載の方法。 - 前記STFTの4kHzよりも高い周波数成分のための位相は、前記推定された試験無歪音声信号の前記STFTの4kHz未満の低周波成分の位相を複製することによって得られる、
請求項16または17に記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/962,036 US20120143604A1 (en) | 2010-12-07 | 2010-12-07 | Method for Restoring Spectral Components in Denoised Speech Signals |
US12/962,036 | 2010-12-07 | ||
PCT/JP2011/076125 WO2012077462A1 (en) | 2010-12-07 | 2011-11-08 | Method for restoring spectral components attenuated in test denoised speech signal as a result of denoising test speech signal |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013541023A true JP2013541023A (ja) | 2013-11-07 |
JP5665977B2 JP5665977B2 (ja) | 2015-02-04 |
Family
ID=45003020
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013513311A Active JP5665977B2 (ja) | 2010-12-07 | 2011-11-08 | 試験音声信号の雑音を除去する結果として試験雑音除去音声信号内で減衰したスペクトル成分を復元するための方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20120143604A1 (ja) |
EP (1) | EP2649615A1 (ja) |
JP (1) | JP5665977B2 (ja) |
CN (1) | CN103238181B (ja) |
WO (1) | WO2012077462A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017506767A (ja) * | 2014-02-27 | 2017-03-09 | クアルコム,インコーポレイテッド | 話者辞書に基づく発話モデル化のためのシステムおよび方法 |
WO2021074973A1 (ja) * | 2019-10-15 | 2021-04-22 | 日本電気株式会社 | モデル生成方法、モデル生成装置、プログラム |
Families Citing this family (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9812150B2 (en) * | 2013-08-28 | 2017-11-07 | Accusonus, Inc. | Methods and systems for improved signal decomposition |
US9684087B2 (en) | 2013-09-12 | 2017-06-20 | Saudi Arabian Oil Company | Dynamic threshold methods for filtering noise and restoring attenuated high-frequency components of acoustic signals |
US9324338B2 (en) * | 2013-10-22 | 2016-04-26 | Mitsubishi Electric Research Laboratories, Inc. | Denoising noisy speech signals using probabilistic model |
US10468036B2 (en) | 2014-04-30 | 2019-11-05 | Accusonus, Inc. | Methods and systems for processing and mixing signals using signal decomposition |
US20150264505A1 (en) | 2014-03-13 | 2015-09-17 | Accusonus S.A. | Wireless exchange of data between devices in live events |
US9679559B2 (en) * | 2014-05-29 | 2017-06-13 | Mitsubishi Electric Research Laboratories, Inc. | Source signal separation by discriminatively-trained non-negative matrix factorization |
US9858922B2 (en) | 2014-06-23 | 2018-01-02 | Google Inc. | Caching speech recognition scores |
EP3010017A1 (en) * | 2014-10-14 | 2016-04-20 | Thomson Licensing | Method and apparatus for separating speech data from background data in audio communication |
US9299347B1 (en) | 2014-10-22 | 2016-03-29 | Google Inc. | Speech recognition using associative mapping |
US10605941B2 (en) | 2014-12-18 | 2020-03-31 | Conocophillips Company | Methods for simultaneous source separation |
CN105023580B (zh) * | 2015-06-25 | 2018-11-13 | 中国人民解放军理工大学 | 基于可分离深度自动编码技术的无监督噪声估计和语音增强方法 |
US9786270B2 (en) | 2015-07-09 | 2017-10-10 | Google Inc. | Generating acoustic models |
CA2999920A1 (en) | 2015-09-28 | 2017-04-06 | Conocophillips Company | 3d seismic acquisition |
US9930466B2 (en) | 2015-12-21 | 2018-03-27 | Thomson Licensing | Method and apparatus for processing audio content |
US10229672B1 (en) | 2015-12-31 | 2019-03-12 | Google Llc | Training acoustic models using connectionist temporal classification |
US20180018973A1 (en) | 2016-07-15 | 2018-01-18 | Google Inc. | Speaker verification |
US10667069B2 (en) | 2016-08-31 | 2020-05-26 | Dolby Laboratories Licensing Corporation | Source separation for reverberant environment |
US10809402B2 (en) | 2017-05-16 | 2020-10-20 | Conocophillips Company | Non-uniform optimal survey design principles |
US10706840B2 (en) | 2017-08-18 | 2020-07-07 | Google Llc | Encoder-decoder models for sequence to sequence mapping |
CN108922518B (zh) * | 2018-07-18 | 2020-10-23 | 苏州思必驰信息科技有限公司 | 语音数据扩增方法和系统 |
US11481677B2 (en) | 2018-09-30 | 2022-10-25 | Shearwater Geoservices Software Inc. | Machine learning based signal recovery |
WO2022197296A1 (en) * | 2021-03-17 | 2022-09-22 | Innopeak Technology, Inc. | Systems, methods, and devices for audio-visual speech purification using residual neural networks |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US1000A (en) * | 1838-11-03 | Spring foe | ||
US6026A (en) * | 1849-01-09 | Cast-iron car-wheel | ||
US7005A (en) * | 1850-01-08 | Improvement in coating iron with copper or its alloy | ||
US8001A (en) * | 1851-03-25 | Machine for preparing clay for making brick | ||
US9013A (en) * | 1852-06-15 | Improvement in mills for crushing quartz | ||
JP2001175299A (ja) * | 1999-12-16 | 2001-06-29 | Matsushita Electric Ind Co Ltd | 雑音除去装置 |
JP2005257817A (ja) * | 2004-03-09 | 2005-09-22 | Internatl Business Mach Corp <Ibm> | 雑音除去装置、方法、及びプログラム |
JP2009128906A (ja) * | 2007-11-19 | 2009-06-11 | Mitsubishi Electric Research Laboratories Inc | 音響信号と雑音信号とを含む混成信号の雑音を除去するための方法およびシステム |
Family Cites Families (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4720802A (en) * | 1983-07-26 | 1988-01-19 | Lear Siegler | Noise compensation arrangement |
GB8608289D0 (en) * | 1986-04-04 | 1986-05-08 | Pa Consulting Services | Noise compensation in speech recognition |
US5148489A (en) * | 1990-02-28 | 1992-09-15 | Sri International | Method for spectral estimation to improve noise robustness for speech recognition |
WO1993018505A1 (en) * | 1992-03-02 | 1993-09-16 | The Walt Disney Company | Voice transformation system |
US5251263A (en) * | 1992-05-22 | 1993-10-05 | Andrea Electronics Corporation | Adaptive noise cancellation and speech enhancement system and apparatus therefor |
IN184794B (ja) * | 1993-09-14 | 2000-09-30 | British Telecomm | |
US6122403A (en) * | 1995-07-27 | 2000-09-19 | Digimarc Corporation | Computer system linked by using information in data objects |
JPH08506434A (ja) * | 1993-11-30 | 1996-07-09 | エイ・ティ・アンド・ティ・コーポレーション | 通信システムにおける伝送ノイズ低減 |
TW416044B (en) * | 1996-06-19 | 2000-12-21 | Texas Instruments Inc | Adaptive filter and filtering method for low bit rate coding |
EP0878790A1 (en) * | 1997-05-15 | 1998-11-18 | Hewlett-Packard Company | Voice coding system and method |
US6381569B1 (en) * | 1998-02-04 | 2002-04-30 | Qualcomm Incorporated | Noise-compensated speech recognition templates |
AU721270B2 (en) * | 1998-03-30 | 2000-06-29 | Mitsubishi Denki Kabushiki Kaisha | Noise reduction apparatus and noise reduction method |
US6910011B1 (en) * | 1999-08-16 | 2005-06-21 | Haman Becker Automotive Systems - Wavemakers, Inc. | Noisy acoustic signal enhancement |
US7089182B2 (en) * | 2000-04-18 | 2006-08-08 | Matsushita Electric Industrial Co., Ltd. | Method and apparatus for feature domain joint channel and additive noise compensation |
DE10041512B4 (de) * | 2000-08-24 | 2005-05-04 | Infineon Technologies Ag | Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen |
US6738481B2 (en) * | 2001-01-10 | 2004-05-18 | Ericsson Inc. | Noise reduction apparatus and method |
US20030028386A1 (en) * | 2001-04-02 | 2003-02-06 | Zinser Richard L. | Compressed domain universal transcoder |
GB2380644A (en) * | 2001-06-07 | 2003-04-09 | Canon Kk | Speech detection |
US7240001B2 (en) * | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US7050954B2 (en) * | 2002-11-13 | 2006-05-23 | Mitsubishi Electric Research Laboratories, Inc. | Tracking noise via dynamic systems with a continuum of states |
US7363221B2 (en) * | 2003-08-19 | 2008-04-22 | Microsoft Corporation | Method of noise reduction using instantaneous signal-to-noise ratio as the principal quantity for optimal estimation |
SG120121A1 (en) * | 2003-09-26 | 2006-03-28 | St Microelectronics Asia | Pitch detection of speech signals |
US7236930B2 (en) * | 2004-04-12 | 2007-06-26 | Texas Instruments Incorporated | Method to extend operating range of joint additive and convolutive compensating algorithms |
US7492889B2 (en) * | 2004-04-23 | 2009-02-17 | Acoustic Technologies, Inc. | Noise suppression based on bark band wiener filtering and modified doblinger noise estimate |
EP1681670A1 (en) * | 2005-01-14 | 2006-07-19 | Dialog Semiconductor GmbH | Voice activation |
US7706992B2 (en) * | 2005-02-23 | 2010-04-27 | Digital Intelligence, L.L.C. | System and method for signal decomposition, analysis and reconstruction |
US7729908B2 (en) * | 2005-03-04 | 2010-06-01 | Panasonic Corporation | Joint signal and model based noise matching noise robustness method for automatic speech recognition |
US20060227968A1 (en) * | 2005-04-08 | 2006-10-12 | Chen Oscal T | Speech watermark system |
US7698143B2 (en) * | 2005-05-17 | 2010-04-13 | Mitsubishi Electric Research Laboratories, Inc. | Constructing broad-band acoustic signals from lower-band acoustic signals |
US7596231B2 (en) * | 2005-05-23 | 2009-09-29 | Hewlett-Packard Development Company, L.P. | Reducing noise in an audio signal |
US20070033027A1 (en) * | 2005-08-03 | 2007-02-08 | Texas Instruments, Incorporated | Systems and methods employing stochastic bias compensation and bayesian joint additive/convolutive compensation in automatic speech recognition |
DK1760696T3 (en) * | 2005-09-03 | 2016-05-02 | Gn Resound As | Method and apparatus for improved estimation of non-stationary noise to highlight speech |
EP1772855B1 (en) * | 2005-10-07 | 2013-09-18 | Nuance Communications, Inc. | Method for extending the spectral bandwidth of a speech signal |
US7809559B2 (en) * | 2006-07-24 | 2010-10-05 | Motorola, Inc. | Method and apparatus for removing from an audio signal periodic noise pulses representable as signals combined by convolution |
WO2009134482A2 (en) * | 2008-01-31 | 2009-11-05 | The Board Of Trustees Of The University Of Illinois | Recognition via high-dimensional data classification |
US9293130B2 (en) * | 2008-05-02 | 2016-03-22 | Nuance Communications, Inc. | Method and system for robust pattern matching in continuous speech for spotting a keyword of interest using orthogonal matching pursuit |
US8180635B2 (en) * | 2008-12-31 | 2012-05-15 | Texas Instruments Incorporated | Weighted sequential variance adaptation with prior knowledge for noise robust speech recognition |
EP2394270A1 (en) * | 2009-02-03 | 2011-12-14 | University Of Ottawa | Method and system for a multi-microphone noise reduction |
CN101599274B (zh) * | 2009-06-26 | 2012-03-28 | 瑞声声学科技(深圳)有限公司 | 语音增强的方法 |
WO2011135411A1 (en) * | 2010-04-30 | 2011-11-03 | Indian Institute Of Science | Improved speech enhancement |
US8606572B2 (en) * | 2010-10-04 | 2013-12-10 | LI Creative Technologies, Inc. | Noise cancellation device for communications in high noise environments |
-
2010
- 2010-12-07 US US12/962,036 patent/US20120143604A1/en not_active Abandoned
-
2011
- 2011-11-08 EP EP11785801.9A patent/EP2649615A1/en not_active Withdrawn
- 2011-11-08 CN CN201180057912.7A patent/CN103238181B/zh active Active
- 2011-11-08 JP JP2013513311A patent/JP5665977B2/ja active Active
- 2011-11-08 WO PCT/JP2011/076125 patent/WO2012077462A1/en active Application Filing
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US1000A (en) * | 1838-11-03 | Spring foe | ||
US6026A (en) * | 1849-01-09 | Cast-iron car-wheel | ||
US7005A (en) * | 1850-01-08 | Improvement in coating iron with copper or its alloy | ||
US8001A (en) * | 1851-03-25 | Machine for preparing clay for making brick | ||
US9013A (en) * | 1852-06-15 | Improvement in mills for crushing quartz | ||
JP2001175299A (ja) * | 1999-12-16 | 2001-06-29 | Matsushita Electric Ind Co Ltd | 雑音除去装置 |
JP2005257817A (ja) * | 2004-03-09 | 2005-09-22 | Internatl Business Mach Corp <Ibm> | 雑音除去装置、方法、及びプログラム |
JP2009128906A (ja) * | 2007-11-19 | 2009-06-11 | Mitsubishi Electric Research Laboratories Inc | 音響信号と雑音信号とを含む混成信号の雑音を除去するための方法およびシステム |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017506767A (ja) * | 2014-02-27 | 2017-03-09 | クアルコム,インコーポレイテッド | 話者辞書に基づく発話モデル化のためのシステムおよび方法 |
WO2021074973A1 (ja) * | 2019-10-15 | 2021-04-22 | 日本電気株式会社 | モデル生成方法、モデル生成装置、プログラム |
JPWO2021074973A1 (ja) * | 2019-10-15 | 2021-04-22 | ||
JP7420144B2 (ja) | 2019-10-15 | 2024-01-23 | 日本電気株式会社 | モデル生成方法、モデル生成装置、プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5665977B2 (ja) | 2015-02-04 |
WO2012077462A1 (en) | 2012-06-14 |
US20120143604A1 (en) | 2012-06-07 |
CN103238181B (zh) | 2015-06-10 |
EP2649615A1 (en) | 2013-10-16 |
CN103238181A (zh) | 2013-08-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5665977B2 (ja) | 試験音声信号の雑音を除去する結果として試験雑音除去音声信号内で減衰したスペクトル成分を復元するための方法 | |
Soon et al. | Noisy speech enhancement using discrete cosine transform | |
EP1891624B1 (en) | Multi-sensory speech enhancement using a speech-state model | |
US9536538B2 (en) | Method and device for reconstructing a target signal from a noisy input signal | |
CN108198566B (zh) | 信息处理方法及装置、电子设备及存储介质 | |
Liu et al. | Voicefixer: A unified framework for high-fidelity speech restoration | |
US20070055519A1 (en) | Robust bandwith extension of narrowband signals | |
CN114566176A (zh) | 基于深度神经网络的残余回声消除方法及系统 | |
Vanjari et al. | Comparative Analysis of Speech Enhancement Techniques in Perceptive of Hearing Aid Design | |
Garg | Speech enhancement using long short term memory with trained speech features and adaptive wiener filter | |
CN112185405A (zh) | 一种基于差分运算和联合字典学习的骨导语音增强方法 | |
Yoshioka et al. | Dereverberation by using time-variant nature of speech production system | |
EP3270378A1 (en) | Method for projected regularization of audio data | |
Jinachitra et al. | Joint estimation of glottal source and vocal tract for vocal synthesis using Kalman smoothing and EM algorithm | |
JP6849978B2 (ja) | 音声明瞭度計算方法、音声明瞭度計算装置及び音声明瞭度計算プログラム | |
Issaoui et al. | Comparison between soft and hard thresholding on selected intrinsic mode selection | |
Khan et al. | Iterative noise power subtraction technique for improved speech quality | |
Wei et al. | A novel prewhitening subspace method for enhancing speech corrupted by colored noise | |
JP6827908B2 (ja) | 音源強調装置、音源強調学習装置、音源強調方法、プログラム | |
CN111968627A (zh) | 一种基于联合字典学习和稀疏表示的骨导语音增强方法 | |
Le Roux et al. | Computational auditory induction by missing-data non-negative matrix factorization. | |
Roy | Single channel speech enhancement using Kalman filter | |
Nuzman | Audio restoration: An investigation of digital methods for click removal and hiss reduction | |
Singh | Compensating for denoising artifacts | |
Anushiravani | Example-based audio editing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140114 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140414 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141111 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141209 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5665977 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |