JP6645322B2 - 雑音抑圧装置、音声認識装置、雑音抑圧方法、及び雑音抑圧プログラム - Google Patents
雑音抑圧装置、音声認識装置、雑音抑圧方法、及び雑音抑圧プログラム Download PDFInfo
- Publication number
- JP6645322B2 JP6645322B2 JP2016071021A JP2016071021A JP6645322B2 JP 6645322 B2 JP6645322 B2 JP 6645322B2 JP 2016071021 A JP2016071021 A JP 2016071021A JP 2016071021 A JP2016071021 A JP 2016071021A JP 6645322 B2 JP6645322 B2 JP 6645322B2
- Authority
- JP
- Japan
- Prior art keywords
- sound
- arrival rate
- difference
- noise suppression
- phase difference
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000001629 suppression Effects 0.000 title claims description 224
- 238000000034 method Methods 0.000 title claims description 47
- 238000001228 spectrum Methods 0.000 claims description 122
- 230000005236 sound signal Effects 0.000 claims description 73
- 238000010586 diagram Methods 0.000 description 21
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 16
- 238000004891 communication Methods 0.000 description 12
- 238000006243 chemical reaction Methods 0.000 description 11
- 238000009499 grossing Methods 0.000 description 10
- 230000001755 vocal effect Effects 0.000 description 10
- 230000006870 function Effects 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 230000003111 delayed effect Effects 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
- G10L21/028—Voice signal separating using properties of sound source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02165—Two microphones, one receiving mainly the noise signal and the other one mainly the speech signal
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/87—Detection of discrete points within a voice signal
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2201/00—Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
- H04R2201/40—Details of arrangements for obtaining desired directional characteristic by combining a number of identical transducers covered by H04R1/40 but not provided for in any of its subgroups
- H04R2201/403—Linear arrays of transducers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/03—Synergistic effects of band splitting and sub-band processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2430/00—Signal processing covered by H04R, not provided for in its groups
- H04R2430/20—Processing of the output signals of the acoustic transducers of an array for obtaining a desired directivity characteristic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2499/00—Aspects covered by H04R or H04S not otherwise provided for in their subgroups
- H04R2499/10—General applications
- H04R2499/13—Acoustic transducers and sound field adaptation in vehicles
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Circuit For Audible Band Transducer (AREA)
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
Description
図1は、第1の実施形態に係る雑音抑圧装置の機能的構成を示す図である。
本実施形態に係る雑音抑圧装置は、第1の音声入力信号及び第2の音声入力信号における同時刻のフレームの組に対し、図3の雑音抑圧処理を順次行う。
図11の(a)は、第1の位相差領域PA1の例を示すグラフである。図11の(a)のグラフには、第1の位相差領域PA1の例として、目的音声の音源の方向θ1が0度の場合の位相差領域を示している。このグラフでは、目的音声に周波数帯域fの成分が含まれる場合、周波数帯域fの位相スペクトル差は、DP2以上、DP4以下の範囲のいずれかになることを想定している。
図12は、第2の実施形態に係る雑音抑圧装置の機能的構成を示す図である。
図15は、第3の実施形態に係る音声認識装置の機能的構成を示す図である。
次に、第1の実施形態及び第2の実施形態に係る雑音抑圧装置1、並びに第3の実施形態に係る音声認識装置の適用例を説明する。
図16Aには、上述した雑音抑圧装置1(及び音声認識装置10)の第1の適用例として、車両11に搭載した例を示している。車両11に搭載した雑音抑圧装置1及び音声認識装置10は、例えば、カーナビゲーションシステムの音声入力や、ハンズフリー通話等に利用可能である。雑音抑圧装置1又は音声認識装置10に接続されたマイクアレイ2は、例えば、車両11のダッシュボード1101における車両左右方向の略中心部分に設置される。マイクアレイ2、雑音抑圧装置1、音声認識装置10等は、例えば、カーナビゲーションシステムの筐体、或いは携帯電話端末等の通信装置に内蔵されていてもよい。
図16Bには、上述した雑音抑圧装置1の第2の適用例として、電話会議システムに適用した例を示している。電話会議システムにおいては、例えば、第1の雑音抑圧装置1Aと、第2の雑音抑圧装置1Bとが、インターネットや電話網等の通信ネットワーク15を介して接続される。また、第1の雑音抑圧装置1A及び第2の雑音抑圧装置1Bは、それぞれ、他方の雑音抑圧装置から受信した音声信号に対して所定の処理を行って出力する、図示しない音声処理装置及び出力装置3(例えば、スピーカ)が接続されている。
図16Cには、上述した雑音抑圧装置1の第3の適用例として、遠隔地から所定空間を観察するシステムに適用した例を示している。この種のシステムにおいては、例えば、観察対象となる空間(室内)に設置されたベッド16の近傍にある家具17に雑音抑圧装置1と、マイクアレイ2とを配設してある。マイクアレイ2は、例えば、マイクアレイ2の正面方向にベッド16の上の利用者12の頭部が位置するように設置する。また、雑音抑圧装置1は、インターネット等の通信ネットワーク15に接続されている。そのため、第3の適用例においては、例えば、遠隔地にいる観察者が所有する携帯型端末18と、雑音抑圧装置1とを、通信ネットワーク15を介して接続することができる。また、雑音抑圧装置1は、例えば、携帯型端末18から受信した音声信号に対して所定の処理を行って出力する、図示しない音声処理装置及び出力装置3(例えば、スピーカ)が接続されている。
図17に示すように、コンピュータ20は、プロセッサ2001と、主記憶装置2002と、補助記憶装置2003と、入力装置2004と、表示装置2005と、を備える。また、コンピュータ20は、入出力インタフェース2006と、媒体駆動装置2007と、通信制御装置2008と、を備える。コンピュータ20におけるこれらの要素2001〜2008は、バス2010により相互に接続されており、要素間でのデータの受け渡しが可能になっている。
(付記1)
マイクロフォンアレイで収音目的の音声を収音して得られた第1の音声信号及び第2の音声信号の周波数スペクトルに基づいて、位相スペクトル差を算出する位相差算出部と、
前記マイクロフォンアレイに到来する前記収音目的の音声の到来方向に基づいて設定された第1の位相差領域と、前記位相スペクトル差とに基づいて、第1の音声到来率を算出するとともに、前記第1の位相差領域とは異なる第2の位相差領域と、前記位相スペクトル差とに基づいて、第2の音声到来率を算出する音声到来率算出部と、
前記第1の音声到来率と前記第2の音声到来率との相違の度合いを表す相違度を算出する相違度算出部と、
前記相違度に基づいて、前記第1の音声信号に前記収音目的の音声が含まれるか否かを判定する判定部と、
前記収音目的の音声が含まれるか否かの判定結果と、前記位相スペクトル差とに基づいて、前記第1の音声信号についての前記周波数スペクトルに適用する抑圧係数を決定する抑圧係数決定部と、
を備えることを特徴とする雑音抑圧装置。
(付記2)
前記雑音抑圧装置は、前記第2の位相差領域を設定する設定部、
を更に備えることを特徴とする付記1に記載の雑音抑圧装置。
(付記3)
前記設定部は、前記第1の位相差領域と隣接した前記第2の位相差領域を設定する、
ことを特徴とする付記2に記載の雑音抑圧装置。
(付記4)
前記設定部は、前記第1の位相差領域から離間した前記第2の位相差領域を設定する、
ことを特徴とする付記2に記載の雑音抑圧装置。
(付記5)
前記設定部は、一部の領域が前記第1の位相差領域と重複する前記第2の位相差領域を設定する、
ことを特徴とする付記2に記載の雑音抑圧装置。
(付記6)
前記設定部は、前記第1の位相差領域に内包される前記第2の位相差領域を設定する、
ことを特徴とする付記2に記載の雑音抑圧装置。
(付記7)
前記相違度算出部は、前記第1の音声到来率を前記第2の音声到来率で除した値を算出する、
ことを特徴とする付記1に記載の雑音抑圧装置。
(付記8)
前記相違度算出部は、前記第1の音声到来率から前記第2の音声到来率を減じた値を算出する、
ことを特徴とする付記1に記載の雑音抑圧装置。
(付記9)
前記抑圧係数決定部は、
前記第1の音声信号に前記収音目的の音声が含まれる場合には、前記位相スペクトル差に基づいて前記抑圧係数を算出し、前記第1の音声信号に前記収音目的の音声が含まれない場合には、前記位相スペクトル差に基づいて算出される前記抑圧係数の最小値に決定する、
ことを特徴とする付記1に記載の雑音抑圧装置。
(付記10)
前記雑音抑圧装置は、前記判定部の判定結果を記憶させる記憶部、を更に備え、
前記判定部は、
現在の処理対象である前記第1の音声信号よりも時間的に前である前記第1の音声信号に前記収音目的の音声が含まれない場合には、前記相違度に基づいて、前記現在の処理対象である前記第1の音声信号に前記収音目的の音声が含まれるか否かを判定し、
前記現在の処理対象である前記第1の音声信号よりも時間的に前である前記第1の音声信号に前記収音目的の音声が含まれる場合には、前記第1の音声到来率に基づいて、前記現在の処理対象である前記第1の音声信号に前記収音目的の音声が含まれるか否かを判定する、
ことを特徴とする付記1に記載の雑音抑圧装置。
(付記11)
付記1〜10のいずれか1項に記載の雑音抑圧装置と、
前記雑音抑圧装置により雑音を抑圧した音声信号に対する音声認識処理を行う音声認識処理部と、
を備えることを特徴とする音声認識装置。
(付記12)
コンピュータが、
マイクロフォンアレイで収音目的の音声を収音して得られた第1の音声信号及び第2の音声信号の周波数スペクトルに基づいて、位相スペクトル差を算出し、
前記マイクロフォンアレイに到来する前記収音目的の音声の到来方向に基づいて設定された第1の位相差領域と、前記位相スペクトル差とに基づいて、第1の音声到来率を算出するとともに、前記第1の位相差領域とは異なる第2の位相差領域と、前記位相スペクトル差とに基づいて、第2の音声到来率を算出し、
前記第1の音声到来率と前記第2の音声到来率との相違の度合いを表す相違度を算出し、
前記相違度に基づいて、前記第1の音声信号に前記収音目的の音声が含まれるか否かを判定し、
前記収音目的の音声が含まれるか否かの判定結果と、前記位相スペクトル差とに基づいて、前記第1の音声信号についての前記周波数スペクトルに適用する抑圧係数を決定する、
処理を実行することを特徴とする雑音抑圧方法。
(付記13)
マイクロフォンアレイで収音目的の音声を収音して得られた第1の音声信号及び第2の音声信号の周波数スペクトルに基づいて、位相スペクトル差を算出し、
前記マイクロフォンアレイに到来する前記収音目的の音声の到来方向に基づいて設定された第1の位相差領域と、前記位相スペクトル差とに基づいて、第1の音声到来率を算出するとともに、前記第1の位相差領域とは異なる第2の位相差領域と、前記位相スペクトル差とに基づいて、第2の音声到来率を算出し、
前記第1の音声到来率と前記第2の音声到来率との相違の度合いを表す相違度を算出し、
前記相違度に基づいて、前記第1の音声信号に前記収音目的の音声が含まれるか否かを判定し、
前記収音目的の音声が含まれるか否かの判定結果と、前記位相スペクトル差とに基づいて、前記第1の音声信号についての前記周波数スペクトルに適用する抑圧係数を決定する、
処理をコンピュータに実行させる雑音抑圧プログラム。
10 音声認識装置
101 信号受付部
102 信号変換部
103 位相差算出部
104 音声到来率算出部
104A 第1の到来率算出部
104B 第2の到来率算出部
105 相違度算出部
106 発声判定部
107 抑圧係数決定部
108 出力信号生成部
109 位相差領域設定部
110 音声認識処理部
120 位相差領域記憶部
121 発声情報記憶部
122 単語辞書記憶部
2,2A,2B マイクアレイ(マイクロフォンアレイ)
201 第1のマイク(マイクロフォン)
202 第2のマイク(マイクロフォン)
3 出力装置
40,41 音源
11 車両
1101 ダッシュボード
1102 運転席
1103 助手席
12,12A,12B 利用者
14A,14B テーブル
15 通信ネットワーク
16 ベッド
17 家具
18 携帯型端末
20 コンピュータ
2001 プロセッサ
2002 主記憶装置
2003 補助記憶装置
2004 入力装置
2005 表示装置
2006 入出力インタフェース
2007 媒体駆動装置
2008 通信制御装置
2010 バス
21 可搬型記録媒体
Claims (9)
- マイクロフォンアレイで収音目的の音声を収音して得られた第1の音声信号及び第2の音声信号の周波数スペクトルに基づいて、位相スペクトル差を算出する位相差算出部と、
前記マイクロフォンアレイに到来する前記収音目的の音声の到来方向に基づいて設定された第1の位相差領域と、前記位相スペクトル差とに基づいて、第1の音声到来率を算出するとともに、前記第1の位相差領域とは異なる第2の位相差領域と、前記位相スペクトル差とに基づいて、第2の音声到来率を算出する音声到来率算出部と、
前記第1の音声到来率と前記第2の音声到来率との相違の度合いを表す相違度を算出する相違度算出部と、
前記相違度に基づいて、前記第1の音声信号に前記収音目的の音声が含まれるか否かを判定する判定部と、
前記収音目的の音声が含まれるか否かの判定結果と、前記位相スペクトル差とに基づいて、前記第1の音声信号についての前記周波数スペクトルに適用する抑圧係数を決定する抑圧係数決定部と、
を備えることを特徴とする雑音抑圧装置。 - 前記雑音抑圧装置は、前記第2の位相差領域を設定する設定部、
を更に備えることを特徴とする請求項1に記載の雑音抑圧装置。 - 前記設定部は、一部の領域が前記第1の位相差領域と重複する前記第2の位相差領域を設定する、
ことを特徴とする請求項2に記載の雑音抑圧装置。 - 前記相違度算出部は、前記第1の音声到来率を前記第2の音声到来率で除した値を前記相違度として算出する、
ことを特徴とする請求項1に記載の雑音抑圧装置。 - 前記抑圧係数決定部は、
前記第1の音声信号に前記収音目的の音声が含まれる場合には、前記位相スペクトル差に基づいて前記抑圧係数を算出し、前記第1の音声信号に前記収音目的の音声が含まれない場合には、前記位相スペクトル差に基づいて算出される前記抑圧係数の最小値に決定する、
ことを特徴とする請求項1に記載の雑音抑圧装置。 - 前記雑音抑圧装置は、前記判定部の判定結果を記憶させる記憶部、を更に備え、
前記判定部は、
現在の処理対象である前記第1の音声信号よりも時間的に前である前記第1の音声信号に前記収音目的の音声が含まれない場合には、前記相違度に基づいて、前記現在の処理対象である前記第1の音声信号に前記収音目的の音声が含まれるか否かを判定し、
前記現在の処理対象である前記第1の音声信号よりも時間的に前である前記第1の音声信号に前記収音目的の音声が含まれる場合には、前記第1の音声到来率に基づいて、前記現在の処理対象である前記第1の音声信号に前記収音目的の音声が含まれるか否かを判定する、
ことを特徴とする請求項1に記載の雑音抑圧装置。 - 請求項1〜6のいずれか1項に記載の雑音抑圧装置と、
前記雑音抑圧装置により雑音を抑圧した音声信号に対する音声認識処理を行う音声認識処理部と、
を備えることを特徴とする音声認識装置。 - コンピュータが、
マイクロフォンアレイで収音目的の音声を収音して得られた第1の音声信号及び第2の音声信号の周波数スペクトルに基づいて、位相スペクトル差を算出し、
前記マイクロフォンアレイに到来する前記収音目的の音声の到来方向に基づいて設定された第1の位相差領域と、前記位相スペクトル差とに基づいて、第1の音声到来率を算出するとともに、前記第1の位相差領域とは異なる第2の位相差領域と、前記位相スペクトル差とに基づいて、第2の音声到来率を算出し、
前記第1の音声到来率と前記第2の音声到来率との相違の度合いを表す相違度を算出し、
前記相違度に基づいて、前記第1の音声信号に前記収音目的の音声が含まれるか否かを判定し、
前記収音目的の音声が含まれるか否かの判定結果と、前記位相スペクトル差とに基づいて、前記第1の音声信号についての前記周波数スペクトルに適用する抑圧係数を決定する、
処理を実行することを特徴とする雑音抑圧方法。 - マイクロフォンアレイで収音目的の音声を収音して得られた第1の音声信号及び第2の音声信号の周波数スペクトルに基づいて、位相スペクトル差を算出し、
前記マイクロフォンアレイに到来する前記収音目的の音声の到来方向に基づいて設定された第1の位相差領域と、前記位相スペクトル差とに基づいて、第1の音声到来率を算出するとともに、前記第1の位相差領域とは異なる第2の位相差領域と、前記位相スペクトル差とに基づいて、第2の音声到来率を算出し、
前記第1の音声到来率と前記第2の音声到来率との相違の度合いを表す相違度を算出し、
前記相違度に基づいて、前記第1の音声信号に前記収音目的の音声が含まれるか否かを判定し、
前記収音目的の音声が含まれるか否かの判定結果と、前記位相スペクトル差とに基づいて、前記第1の音声信号についての前記周波数スペクトルに適用する抑圧係数を決定する、
処理をコンピュータに実行させる雑音抑圧プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016071021A JP6645322B2 (ja) | 2016-03-31 | 2016-03-31 | 雑音抑圧装置、音声認識装置、雑音抑圧方法、及び雑音抑圧プログラム |
US15/468,373 US9911428B2 (en) | 2016-03-31 | 2017-03-24 | Noise suppressing apparatus, speech recognition apparatus, and noise suppressing method |
EP17163024.7A EP3226244A1 (en) | 2016-03-31 | 2017-03-27 | Noise suppressing apparatus, speech recognition apparatus, and noise suppressing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016071021A JP6645322B2 (ja) | 2016-03-31 | 2016-03-31 | 雑音抑圧装置、音声認識装置、雑音抑圧方法、及び雑音抑圧プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017181899A JP2017181899A (ja) | 2017-10-05 |
JP6645322B2 true JP6645322B2 (ja) | 2020-02-14 |
Family
ID=58428174
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016071021A Active JP6645322B2 (ja) | 2016-03-31 | 2016-03-31 | 雑音抑圧装置、音声認識装置、雑音抑圧方法、及び雑音抑圧プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US9911428B2 (ja) |
EP (1) | EP3226244A1 (ja) |
JP (1) | JP6645322B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10524051B2 (en) * | 2018-03-29 | 2019-12-31 | Panasonic Corporation | Sound source direction estimation device, sound source direction estimation method, and recording medium therefor |
US11180158B1 (en) * | 2018-07-31 | 2021-11-23 | United Services Automobile Association (Usaa) | Routing or driving systems and methods based on sleep pattern information |
CN108806711A (zh) * | 2018-08-07 | 2018-11-13 | 吴思 | 一种提取方法及装置 |
US10937418B1 (en) * | 2019-01-04 | 2021-03-02 | Amazon Technologies, Inc. | Echo cancellation by acoustic playback estimation |
CN113077803B (zh) * | 2021-03-16 | 2024-01-23 | 联想(北京)有限公司 | 一种语音处理方法、装置、可读存储介质及电子设备 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4854533B2 (ja) | 2007-01-30 | 2012-01-18 | 富士通株式会社 | 音響判定方法、音響判定装置及びコンピュータプログラム |
JP2008294690A (ja) | 2007-05-24 | 2008-12-04 | Yamaha Corp | 音声会議装置および音声会議システム |
US8724829B2 (en) * | 2008-10-24 | 2014-05-13 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for coherence detection |
JP5668553B2 (ja) | 2011-03-18 | 2015-02-12 | 富士通株式会社 | 音声誤検出判別装置、音声誤検出判別方法、およびプログラム |
US9443532B2 (en) * | 2012-07-23 | 2016-09-13 | Qsound Labs, Inc. | Noise reduction using direction-of-arrival information |
JP5482854B2 (ja) | 2012-09-28 | 2014-05-07 | 沖電気工業株式会社 | 収音装置及びプログラム |
JP6156012B2 (ja) * | 2013-09-20 | 2017-07-05 | 富士通株式会社 | 音声処理装置及び音声処理用コンピュータプログラム |
JP7074285B2 (ja) * | 2014-11-10 | 2022-05-24 | 日本電気株式会社 | 信号処理装置、信号処理方法および信号処理プログラム |
-
2016
- 2016-03-31 JP JP2016071021A patent/JP6645322B2/ja active Active
-
2017
- 2017-03-24 US US15/468,373 patent/US9911428B2/en active Active
- 2017-03-27 EP EP17163024.7A patent/EP3226244A1/en not_active Ceased
Also Published As
Publication number | Publication date |
---|---|
JP2017181899A (ja) | 2017-10-05 |
US20170287501A1 (en) | 2017-10-05 |
EP3226244A1 (en) | 2017-10-04 |
US9911428B2 (en) | 2018-03-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6645322B2 (ja) | 雑音抑圧装置、音声認識装置、雑音抑圧方法、及び雑音抑圧プログラム | |
JP4283212B2 (ja) | 雑音除去装置、雑音除去プログラム、及び雑音除去方法 | |
JP6279181B2 (ja) | 音響信号強調装置 | |
US20170140771A1 (en) | Information processing apparatus, information processing method, and computer program product | |
US9854358B2 (en) | System and method for mitigating audio feedback | |
KR20170035504A (ko) | 전자 장치 및 전자 장치의 오디오 처리 방법 | |
WO2015086895A1 (en) | Spatial audio processing apparatus | |
US8639499B2 (en) | Formant aided noise cancellation using multiple microphones | |
JP2021511755A (ja) | 音声認識オーディオシステムおよび方法 | |
JP4457221B2 (ja) | 音源分離方法およびそのシステム、並びに音声認識方法およびそのシステム | |
JP4448464B2 (ja) | 雑音低減方法、装置、プログラム及び記録媒体 | |
JP2007047427A (ja) | 音声処理装置 | |
US10951978B2 (en) | Output control of sounds from sources respectively positioned in priority and nonpriority directions | |
JP2020144204A (ja) | 信号処理装置及び信号処理方法 | |
JP4612468B2 (ja) | 信号抽出装置 | |
CN111226278B (zh) | 低复杂度的浊音语音检测和基音估计 | |
JP6361360B2 (ja) | 残響判定装置及びプログラム | |
JP6956929B2 (ja) | 情報処理装置、制御方法、及び制御プログラム | |
JP2020024310A (ja) | 音声処理システム及び音声処理方法 | |
KR20130127597A (ko) | 잡음 제거 장치 및 방법 | |
Ngoc et al. | Real-time hardware feature extraction with embedded signal enhancement for automatic speech recognition | |
US11600273B2 (en) | Speech processing apparatus, method, and program | |
US20230298612A1 (en) | Microphone Array Configuration Invariant, Streaming, Multichannel Neural Enhancement Frontend for Automatic Speech Recognition | |
JP2018045195A (ja) | 音声信号処理プログラム、音声信号処理方法及び音声信号処理装置 | |
Wuth et al. | A unified beamforming and source separation model for static and dynamic human-robot interaction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190115 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20191111 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191210 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191223 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6645322 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |