JP2003195882A - 信号処理システムおよび方法 - Google Patents
信号処理システムおよび方法Info
- Publication number
- JP2003195882A JP2003195882A JP2001390189A JP2001390189A JP2003195882A JP 2003195882 A JP2003195882 A JP 2003195882A JP 2001390189 A JP2001390189 A JP 2001390189A JP 2001390189 A JP2001390189 A JP 2001390189A JP 2003195882 A JP2003195882 A JP 2003195882A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- signal section
- noise
- candidate
- section
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L2021/02161—Number of inputs available containing the signal or the noise to be suppressed
- G10L2021/02166—Microphone arrays; Beamforming
Abstract
る雑音信号区間に分類し、更に、雑音信号区間を定常雑
音信号区間と非定常雑音信号区間に分類する。 【解決手段】 入力部10から入力信号を入力する。検
出アルゴリズムが異なる複数の信号区間候補検出部20
は入力信号から検出対象となる目的信号区間候補と雑音
信号区間候補を検出する。信号区間分類部30は各信号
区間候補検出部20から検出結果の通知を受け、当該検
出結果の組み合わせにより各信号区間候補を分類する。
信号区間分類部30は信号区間候補検出部20のすべて
において目的信号区間候補と検出された信号区間候補を
目的信号区間とし、すべてにおいて雑音信号区間候補と
検出された信号区間候補を定常雑音信号区間とし、いず
れかにおいて目的信号区間候補と検出され、いずれかに
おいて雑音信号区間候補と検出された信号区間候補を非
定常雑音信号区間として分類する。
Description
超音波、電磁波などに代表される媒質中を伝搬する波動
信号から検出対象となる目的信号区間と雑音信号区間と
を検出する信号処理システムおよび方法に関する。ここ
で言う「媒質」とは、波動が伝搬する媒体、空間、場の
全てを包含する概念とする。
受信して得た入力信号には、目的信号以外の雑音信号が
混入していることが多い。雑音のレベルが大きいと目的
信号の処理精度を劣化させる。特に、音声認識を用いる
アプリケーションでは、雑音のレベルが大きいと目的信
号である音声信号が正しく認識できない。そこで、従来
から音声信号処理において目的信号区間と目的信号区間
以外の雑音信号区間とを検出して切り分ける処理が重要
とされている。
号区間の切り分け処理として、入力音声信号のパワーの
変化に注目した切り分け処理が多く用いられている。そ
の基本原理は、入力された音声信号のパワーを調べ、そ
のパワーがある閾値を超えた時に目的信号区間とみなし
て切り分けるというものである。
け処理として、入力信号の到来方向を検出し、目的信号
を発している波源があると想定している方向と当該入力
信号の到来方向が一致していれば、当該入力信号を目的
信号区間とみなして切り分けるというものである。波源
があると想定している方向以外の方向から到来する入力
信号は全て雑音信号とみなす。従来技術において、入力
信号の到来方向を検出する方法としては、相互相関法を
用いた遅延時間検出処理などが知られている。
的信号区間と雑音信号区間の検出処理だけでなく、聞き
やすさや音声認識率を向上させるため、雑音抑制処理を
付加することも多い。従来技術における雑音抑制処理と
しては、スペクトルサブトラクション処理が広く知られ
ている。スペクトルサブトラクション処理とは、入力信
号をフーリエ変換で周波数領域上のスペクトルに変換し
た後、雑音信号区間で雑音スペクトルモデルを推定し、
推定した雑音スペクトルを目的信号区間で入力信号のス
ペクトルから減算して雑音信号を除き、逆フーリエ変換
により再び時間領域上の信号へ戻す処理である。
的信号区間と雑音信号区間の検出処理には以下の問題が
ある。
に注目した目的信号区間と雑音信号区間の検出処理で
は、雑音信号のレベルが目的信号に近い場合、正確に目
的信号と雑音信号を検出することが困難であるという問
題がある。
く信号区間検出処理とスペクトルサブトラクションによ
る雑音抑制処理によって雑音を抑制するシステムを説明
する図である。特に、扱う信号が音声信号の場合を説明
する。
パワー信号区間検出部であり、従来の入力信号のパワー
と所定の閾値を比較して目的信号区間と雑音信号区間を
切り分けて検出する処理を実行する部分である。530
はスペクトルサブトラクション部であり、従来のスペク
トルサブトラクションによる雑音信号の抑制処理を行な
う部分である。
者の音声信号501と、雑音信号502とする。雑音信
号502は定常雑音信号に非定常雑音信号が混入してい
るものとする。マイクロフォンへの入力信号503はこ
れら音声信号501と雑音信号502が重畳加算された
ものであり、定常雑音信号区間である信号区間
と、非定常雑音信号区間である信号区間と、音声信
号区間である信号区間からなる。
信号を受け、入力信号のパワーに基づく信号区間検出処
理を実行し、信号区間検出結果504を得る。パワー信
号区間検出部520は、閾値を下回る信号区間を
雑音信号区間と判定し、閾値を超える信号区間は
全て音声区間と判定する。
音信号区間であり、信号区間検出に失敗していることが
分かる。
く信号区間検出では、音声信号と同等レベルの非定常な
雑音信号区間を音声信号区間と誤判定することがあり、
正確な信号区間検出が実行できない場合がある。また、
雑音源が他者音声である場合、相関関数などパワー以外
の特徴量を用いても、雑音である他者音声を目的音声と
誤判定してしまう恐れがある。
0による雑音抑制結果505を見ると、定常雑音信号区
間であると音声信号区間では定常雑音の除去に
より、正しくかつ効果的に雑音信号成分が抑制されてい
るが、非定常雑音信号区間では、信号区間検出結果
504において音声信号区間と誤判定されているため、
定常的な雑音信号成分しか除去されておらず、大部分の
非定常雑音信号成分が消えずに残っている。
づく信号区間検出処理では、非定常な雑音信号区間を音
声信号区間と誤って検出する場合があるため、正確な信
号区間検出処理を行なうことができず、さらに、雑音信
号の抑制に関しても、非定常な雑音信号成分の抑制がで
きない。
に基づく目的信号区間と雑音信号区間の切り分け処理で
は、目的音を発する波源と同じ方向に雑音源がある場
合、正確に目的信号と雑音信号を切り分けることが困難
であるという問題がある。つまり、目的信号区間と検出
した信号区間において、実際には雑音信号区間であるも
のが混入している可能性がある。
関しては、当該信号区間が定常雑音信号区間であるの
か、非定常雑音信号区間であるのかを区別することはで
きないという問題がある。
づく信号区間検出処理とスペクトルサブトラクションに
よる雑音抑制処理によって雑音を抑制するシステムを説
明する図である。
ブトラクション部520は、図13と同様のものであ
る。
の到来方向の検出し、到来方向に基づいて目的信号区間
と雑音信号区間を切り分ける処理を実行する部分であ
る。到来方向検出処理は、相互相関法による遅延時間検
出により行なうものとする。
13と同様、音声信号501と、雑音信号502とす
る。雑音信号502は定常雑音に非定常な雑音が混入し
ているものとする。マイクロフォンへの入力信号503
はこれら音声信号501と雑音信号502が重畳加算さ
れたものであり、定常雑音信号区間である信号区間
と、非定常雑音信号区間である信号区間と、音声
信号区間である信号区間からなる。
受け、入力信号の到来方向に基づく信号区間検出処理を
実行し、信号区間検出結果506に示す結果を得る。到
来方向検出部530では、予め設定しておいた目的音の
到来方向(話者方向)と入力音の到来方向が一致する区
間のみを音声区間と判定し、それ以外の区間
を雑音信号区間と判定する。
雑音信号区間が、定常雑音信号区間であるの
か、非定常雑音信号区間であるのかを区別することはで
きない。
る雑音抑制は、スペクトルサブトラクションは本来定常
的な雑音のみを推定し抑制する手法である。到来方向に
基づく区間検出処理を用いた場合、検出された雑音信号
区間が定常雑音信号区間であるか非定常雑音信号区間で
あるかは区別されていないため、各々の雑音信号区間
に基づいて雑音モデルの推定を行なうこととな
る。そのため、音声信号区間の直前にある非定常雑音
信号区間においても雑音モデルを推定してしまう。そ
の結果、実際には音声信号区間に存在していない雑音
成分を重畳した雑音モデルに基づいて推定した雑音スペ
クトルを入力スペクトルから減じてしまうこととなり、
音声信号区間の信号が歪んでしまう。
力信号を目的信号区間と雑音信号区間に分類するだけで
なく、雑音信号区間を複数の性質の異なる区間に分類
し、更に、検出した各信号区間の性質に応じた雑音抑制
処理を適用することを目的とする。特に、定常雑音と非
定常雑音が混在する入力環境において、両者を正しく区
別し、定常雑音に対する適切な雑音抑制処理および非定
常雑音に対する適切な雑音抑制処理を実行することを目
的とする。
め、本発明の信号処理システムは、入力信号を入力する
入力部と、前記入力信号から検出対象となる目的信号が
記録されている信号区間の候補である目的信号区間候補
と当該目的信号区間候補以外の雑音信号区間候補を検出
する複数の信号区間候補検出部であって、それぞれが用
いる目的信号区間候補および雑音信号区間候補の検出ア
ルゴリズムが異なる信号区間候補検出部と、前記複数の
信号区間候補検出部から各信号区間候補に対する各々の
検出結果の通知を受け、当該検出結果の組み合わせによ
り、各信号区間候補を分類する信号区間分類部を備えた
ことを特徴とする。
おいて、前記複数の信号区間候補検出部のすべてにおい
て目的信号区間候補と検出された信号区間候補を目的信
号区間とし、前記複数の信号区間候補検出部のすべてに
おいて雑音信号区間候補と検出された信号区間候補を第
1種雑音信号区間とし、前記複数の信号区間候補検出部
のいずれかにおいて目的信号区間候補と検出され、か
つ、いずれかにおいて雑音信号区間候補と検出された信
号区間候補を第2種雑音信号区間として分類することが
好ましい。
と雑音信号区間に分類するだけでなく、雑音信号区間を
複数の性質の異なる雑音信号区間に分類することができ
る。
第1種雑音信号区間を定常雑音のみが現れている定常雑
音信号区間と分類し、前記第2種雑音信号区間を定常雑
音と非定常雑音が重畳して現れている非定常雑音信号区
間と分類すれば、雑音信号区間を適切に定常雑音信号区
間と非定常雑音信号区間に分類することができる。
少なくとも一つが、前記入力された信号のパワーの変化
に基づいて前記目的信号区間候補と前記雑音信号区間候
補とを検出するアルゴリズムを用いるものであるとし、
また、前記信号区間候補検出部のうち、少なくとも一つ
が、前記入力された信号の到来方向を検出し、当該到来
方向に基づいて前記目的信号区間候補と前記雑音信号区
間候補とを検出するアルゴリズムを用いるものであると
すると、適切に雑音信号区間候補を複数の性質の異なる
雑音信号区間候補に分類することができる。
検出処理および到来方向に基づく信号区間候補検出処理
を実行するため、本発明の信号処理システムにおいて、
入力部を介して入力される信号が、少なくとも2箇所の
観測地点から得た複数の入力信号であり、前記複数の入
力信号から任意に選んだ2つの入力信号の相互相関関数
に基づいて遅延時間を求める遅延時間検出部と、前記遅
延時間検出部が検出した遅延時間に基づいて、前記任意
に選んだ2つの入力信号の入力地点に対する、前記入力
信号の到来方向を検出する方向検出部を備えている。
候補検出処理を簡便に実行する工夫とし、本発明の信号
処理システムは、前記入力部を介して入力される信号
が、少なくとも2箇所の観測地点から得た複数の入力信
号であり、前記複数の入力信号から任意に選んだ2つの
入力信号の差分信号を演算する差分信号演算部と、前記
任意に選んだ2つの入力信号のうちの1つの入力信号の
微分信号を演算する微分信号演算部と、前記差分信号を
前記微分信号で除算した除算信号を演算する除算信号演
算部と、前記除算信号を前記任意に選んだ2つの入力信
号間の遅延時間とする遅延時間検出部と、前記遅延時間
検出部が検出した遅延時間に基づいて、前記任意に選ん
だ2つの入力信号の観測地点に対する、前記入力信号の
到来方向を検出する方向検出部を備えるものとする。
多いアルゴリズムに基づく処理に変え、各1回の差分演
算、微分演算、除算演算のみで近似的に遅延時間および
到来方向を得ることが可能となる。
システムは、前記目的信号区間候補および前記雑音信号
区間候補のすべてに対して同一の雑音抑制処理を適用す
る、または、前記信号区間分類部による分類結果に応じ
て適用する雑音抑制処理を選択して適用する雑音抑制部
を備える。また、前記目的信号区間の信号に対して雑音
抑制処理を行なわず、前記定常雑音信号区間の信号およ
び前記非定常雑音信号区間の信号に対して、1より小さ
い重み付けの雑音抑制処理を行なう雑音抑制部を備える
ものでも良い。さらに、前記定常雑音信号区間と分類さ
れた信号区間においてのみ定常雑音モデルの推定処理を
実行し、前記目的信号区間および非定常雑音信号区間と
分類された信号区間において雑音モデルの推定処理を停
止する雑音モデル推定部を備え、前記雑音抑制部は、前
記雑音モデル推定部が推定した雑音モデルに基づき、雑
音抑制を行うものでも良い。
雑音抑制処理および非定常雑音に対する適切な雑音抑制
処理を実行することができる。
声認識を行う音声認識部を備えれば、精度の高い音声認
識処理が可能となる。
れば、本発明の波動信号処理をコンピュータ上で実行す
ることができる。
の信号処理システムおよび信号処理方法の実施形態を説
明する。
の信号処理システムを説明する。
号から検出対象となる目的信号が記録されている信号区
間の候補である目的信号区間候補と雑音信号区間候補を
検出する複数の信号区間候補検出部と、前記複数の信号
区間候補検出部から各信号区間候補に対する各々の検出
結果の通知を受け、当該検出結果の組み合わせにより、
各信号区間候補を分類する信号区間分類部を備える構成
のものである。
目的信号区間候補と雑音信号区間候補を検出するだけで
なく、検出された雑音信号区間候補を複数の性質の異な
る雑音信号区間候補に区別する情報を得るため、異なる
アルゴリズムにより入力信号から検出対象となる目的信
号区間候補と雑音信号区間候補とを検出する複数の信号
区間候補検出部を用いるものである。
テムの構成を示す図である。
区間候補検出部、30は信号区間分類部である。
例えば、マイクロフォン、光センサなど、入力対象とな
る波動信号を受信する各種入力デバイスである。また、
外部で採取され、記録された信号を入力するデータ入力
デバイスであっても良い。
介して入力された信号から、検出対象となる目的信号区
間候補と当該目的信号区間候補以外の雑音信号区間候補
とを検出する複数の信号区間候補検出処理を実行するも
のである。図1には、第1の信号区間候補検出から第N
の信号区間候補検出部までが示されている。ここでNは
2以上の整数である。以下の信号区間候補検出処理の説
明では便宜上、3つの信号区間候補検出部20a〜20
cについて説明する。
〜20cはそれぞれ異なったアルゴリズムにより、信号
から検出対象となる目的信号区間候補と当該目的信号区
間候補以外の雑音信号区間候補とを検出するものであ
る。
は、異なったアルゴリズムにより信号区間候補を検出す
るので、雑音信号区間候補を複数の性質の異なる雑音信
号区間候補に分類する情報を得ることができる。
補検出部20から各信号区間候補に対する各々の検出結
果の通知を受け、当該検出結果の組み合わせにより、各
信号区間候補を分類する部分である。
30の当該分類処理は、以下の第1から第3の基準によ
り行われる。
20のすべてにおいて目的信号区間候補と検出された信
号区間候補を目的信号区間と分類する基準である。
20のすべてにおいて雑音信号区間候補と検出された信
号区間候補を第1種雑音信号区間と分類する基準であ
る。
20のいずれかにおいて目的信号区間候補と検出され、
かつ、いずれかにおいて雑音信号区間候補と検出された
信号区間候補を第2種雑音信号区間として分類する基準
である。
検出部20のすべてにおいて目的信号区間候補と検出さ
れた信号区間候補を目的信号区間と分類するものであ
る。当該第1の基準により分類された信号区間候補は、
すべての信号区間候補検出部20(この例では20aか
ら20c)のすべてのアルゴリズムによって目的信号区
間候補と検出された信号区間候補であり、目的信号区間
と想定されるすべての条件を満たす信号区間候補となっ
ている。
候補検出部20のすべてにおいて雑音信号区間候補と検
出された信号区間候補を第1種雑音信号区間と分類する
ものである。当該第2の基準により分類された信号区間
候補は、すべての信号区間候補検出部20(この例では
20aから20c)のすべてのアルゴリズムによって雑
音信号区間候補と検出された信号区間候補であり、雑音
信号区間と想定されるすべての条件を満たす信号区間候
補となっている。
候補検出部20のいずれかにおいて目的信号区間候補と
検出され、かつ、いずれかにおいて雑音信号区間候補と
検出された信号区間候補を第2種雑音信号区間として分
類するものである。当該第3の基準により分類された信
号区間候補は、それぞれの信号区間候補検出部20(こ
の例では20aから20c)において、検出結果が異な
っている信号区間候補である。いずれかのアルゴリズム
によって雑音信号区間候補であると検出されているの
で、当該信号区間候補を雑音信号区間候補と扱われる一
方、当該信号区間候補は他のアルゴリズムでは目的信号
区間候補と検出されており、目的信号区間候補となる条
件を満たす側面を有しているものであり、上記の第1種
雑音信号区間候補のようにすべてのアルゴリズムにおい
て雑音信号区間としての条件を満たすものではない。そ
こで、第2種雑音信号区間とする。
部分における信号処理結果を追いつつ、本発明の信号処
理システムの処理の流れを説明する。
の各部分における信号を示す図である。この例でも、信
号区間候補検出部20は、第1の信号区間候補検出部2
0aから第3の信号区間候補検出部20cの3つの信号
区間候補検出部を用いた構成とする。
力された入力信号、110が第1の信号区間候補検出部
20aによる信号区間候補の検出結果を示すグラフ、1
20が第2の信号区間候補検出部20bによる信号区間
候補の検出結果を示すグラフ、130が第3の信号区間
候補検出部20cによる信号区間候補の検出結果を示す
グラフ、140が信号区間分類部30による信号区間候
補の分類結果を示すグラフである。
グラフ130において、横軸は時間を表わしている。
区間101、第2の信号区間102、第3の信号区間1
03、第4の信号区間104の4つの信号区間が並んだ
信号となっている。
は、第1の信号区間候補検出部20aにより、第1の信
号区間101は雑音信号区間候補、第2の信号区間10
2は雑音信号区間候補、第3の信号区間103は雑音信
号区間候補、第4の信号区間104は目的信号区間候補
と検出されている。
2の信号区間候補検出部20bにより、第1の信号区間
101は雑音信号区間候補、第2の信号区間102は雑
音信号区間候補、第3の信号区間103は目的信号区間
候補、第4の信号区間104は目的信号区間候補と検出
されている。
3の信号区間候補検出部20cにより、第1の信号区間
101は雑音信号区間候補、第2の信号区間102は目
的信号区間候補、第3の信号区間103は目的信号区間
候補、第4の信号区間104は目的信号区間候補と検出
されている。
補検出部20a〜第3の信号区間候補検出部20cから
信号区間候補の検出結果の通知を受け、上記第1から第
3の基準により各信号区間候補を分類する。
第1種雑音信号区間と分類される。
第2種雑音信号区間と分類される。
により第2種雑音信号区間と分類される。
目的信号区間と分類される。
第3の信号区間103ともに、第2種雑音信号区間と分
類されるが、さらに細かく分類することができる。なぜ
ならば、第2の信号区間102は、第2の信号区間候補
検出部20bが用いるアルゴリズムにより雑音信号区間
候補と検出されるものであり、一方、第3の信号区間1
03は第2の信号区間候補検出部20bが用いるアルゴ
リズムにより目的信号区間候補と検出されるものであ
り、その性質が異なるものであるからである。
区間をさらに細かく分類し、第2の信号区間102を第
1の第2種雑音信号区間と分類し、第3の信号区間10
3を第2の第2種雑音信号区間と分類することもでき
る。
れば、入力信号を目的信号区間と雑音信号区間に分類す
るだけでなく、雑音信号区間を複数の性質の異なる雑音
信号区間に分類することができる。また、このように分
類された雑音信号区間に対して後述する実施形態5から
7の雑音抑制処理を実行したり、分類された目的信号区
間に対して実施形態8の音声認識処理などを実行するこ
とが可能となる。
ら検出した雑音信号区間候補を、定常雑音信号区間と非
定常雑音信号区間に分類する信号処理システムである。
幅や周波数スペクトルの時間変動が少なく安定している
雑音信号である。例えば、入力信号の入力環境において
一定の回転数で作動しているファンから発せられる機械
音などである。
波数スペクトルの時間変動が大きく、非定常的に存在す
る雑音源や非定常的に雑音を発する雑音源から入力され
る雑音信号である。例えば、入力信号の入力環境内を通
過する車から発せられる雑音信号や、入力信号の入力環
境内に存在する時計が時報として発する点鐘音の雑音信
号などである。
1と同様で良いので図示は省略する。
に、複数の信号区間候補検出部20から各信号区間候補
に対する各々の検出結果の通知を受け、当該検出結果の
組み合わせにより、各信号区間候補を分類する部分であ
り、実施形態1と同様、実施形態1で説明した第1から
第3の基準により行われるが、実施形態2の信号処理シ
ステムでは、第2の基準により分類された第1種雑音信
号区間を定常雑音のみが現れている定常雑音信号区間と
分類し、第3の基準により分類された第2種雑音信号区
間を定常雑音と非定常雑音が重畳して現れている非定常
雑音信号区間と分類する。
ずに安定している雑音信号であるので、信号区間候補検
出部20が用いるアルゴリズムが適切なものであれば、
いずれのアルゴリズムによっても雑音信号区間候補と検
出されると想定できるからである。一方、非定常雑音
は、その音響的性質が時間的に変化する雑音信号であ
り、いずれかのアルゴリズムによって雑音信号区間候補
と検出されるが、他のいずれかのアルゴリズムによって
目的信号区間候補と検出されると想定できるからであ
る。
各部分における信号処理結果を追いつつ処理の流れを説
明する。
び信号処理システムの各部分における信号を示す図であ
る。この例は、信号区間候補検出部20は、第1の信号
区間候補検出部20aと第2の信号区間候補検出部20
bの2つの信号区間候補検出部を用いた構成とする。
力された入力信号、210が第1の信号区間候補検出部
20aによる信号区間候補の検出結果を示すグラフ、2
20が第2の信号区間候補検出部20bによる信号区間
候補の検出結果を示すグラフ、230が信号区間分類部
30による信号区間候補の分類結果を示すグラフであ
る。
に、第1の信号区間201、第2の信号区間202、第
3の信号区間203、第4の信号区間204の4つの信
号区間が並んだ信号となっている。
は、第1の信号区間候補検出部20aにより、第1の信
号区間201は雑音信号区間候補、第2の信号区間20
2は目的信号区間候補、第3の信号区間203は雑音信
号区間候補、第4の信号区間204は目的信号区間候補
と検出されている。
2の信号区間候補検出部20bにより、第1の信号区間
201は雑音信号区間候補、第2の信号区間202は雑
音信号区間候補、第3の信号区間203は目的信号区間
候補、第4の信号区間204は目的信号区間候補と検出
されている。
補検出部20aおよび第2の信号区間候補検出部20b
から信号区間候補の検出結果の通知を受け、第1から第
3の基準により各信号区間候補を分類する。
第1種雑音信号区間と分類される。
第2種雑音信号区間と分類される。
第2種雑音信号区間と分類される。
目的信号区間と分類される。
部30は、第1の信号区間201を定常雑音信号区間と
分類し、第2の信号区間202を非定常雑音信号区間と
分類し、第3の信号区間203を非定常雑音信号区間と
分類し、第4の信号区間204を目的信号区間と分類す
る。
れば、入力信号から検出した雑音信号区間候補を、定常
雑音信号区間と非定常雑音信号区間に分類することがで
きる。また、このように分類された雑音信号区間に対し
て後述する実施形態5から7の雑音抑制処理を実行した
り、分類された目的信号区間に対して実施形態8の音声
認識処理などを実行することが可能となる。
テムは、信号区間候補検出部が用いるアルゴリズムを、
入力信号のパワーの変化に基づいて目的信号区間候補と
雑音信号区間候補とを検出するアルゴリズムと、入力信
号の到来方向に基づいて目的信号区間候補と雑音信号区
間候補とを検出するアルゴリズムとの組み合わせとした
例である。
構成を示す図である。図4において、入力部10、信号
区間分類部30は図1と同様である。
ワー計算部21を備えており、入力信号のパワーの変化
に基づいて目的信号区間候補と雑音信号区間候補とを検
出するアルゴリズムを用いるものである。
る信号であり、その入力環境において当該目的信号のレ
ベルが大きくなるように設定されているので、目的信号
のパワーは大きいと想定される。そこで、当該パワーの
変化に基づくアルゴリズムは、信号区間候補においてパ
ワー変動が所定値以上であるものを目的信号区間候補と
検出し、パワー変動が所定値に満たないものを雑音信号
区間候補と検出するものである。
計算する。パワー計算処理の一例を以下に示す。入力音
をf(t)としてある時間区間TのパワーP(t)を以
下の(数1)により計算する。
ワー計算部21で得たパワーの時間的変動を示す微分値
P’(t)を監視し、当該変動量がある閾値Ath以上
である場合に目的信号区間候補と判定し、閾値Athを
下回っている場合には雑音信号区間候補と判定する。閾
値Athはあらかじめ与えていても良く、また、入力音
P’(t)の移動平均をとるなどして決めても良い。
来方向検知部22を備え、入力信号の到来方向に基づい
て目的信号区間候補と雑音信号区間候補とを検出するア
ルゴリズムを用いるものである。なお、入力部10を介
して入力される信号が、少なくとも2箇所の観測地点か
ら得た複数の入力信号とする。
る信号であり、その入力環境において当該目的信号の到
来方向を所定方向、例えば正面方向と設定して入力する
ので、目的信号の到来方向が想定される。そこで、到来
方向に基づくアルゴリズムは、信号区間候補において入
力信号の到来方向が所定方向であるものを目的信号区間
候補と検出し、到来方向がが所定方向でないものを雑音
信号区間候補と検出するものである。
して、次の2つの構成を説明する。
5(a)に示すように、複数の入力信号から任意に選ん
だ2つの入力信号の相互相関関数に基づいて遅延時間を
求める遅延時間計算部23aを備えている。
意に選んだ第1および第2の入力信号f(t)、g
(t)の相互相関関数R(τ)を(数2)により計算す
る。
R(τ)を最大にするτを第1の入力信号と第2の入力
信号間の遅延時間Δτとみなす。
は、複数の入力信号から任意に選んだ2つの入力信号の
差分値を、2つの入力信号の一方の微分値で除算した値
に基づいて近似遅延時間を求める遅延時間計算部23b
を備えている。
んだ2つの入力信号の差分値を、2つの入力信号の一方
の微分値で除算した値に基づいて近似遅延時間を求める
原理を説明する。
の遅延時間を説明する図である。
が、距離d離れて配置されているとする。いま、波源か
ら、波動信号が、センサ1とセンサ2に対して角度θの
方向から到来したとする。波動信号をそれぞれW1とW
2とする。センサ1とセンサ2はそれぞれ検知した波動
信号を電気信号に変換し、2つの受信信号を得る。ここ
では、便宜上、第1の受信信号f1(t)と第2の受信
信号f2(t)とする。
係から、図6に示すように、波動信号W1がセンサ1に
到達するまでの伝搬行路と、波動信号W2がセンサ2に
到達するまでの伝搬行路には行路差Lが存在する。この
行路差Lのために、第1の受信信号f1(t)と第2の
受信信号f2(t)の間には遅延時間Δtが生じる。こ
こで、両者の波形は同じであるので、第1の受信信号f
1(t)と第2の受信信号f2(t)は、時間軸を揃え
て表現すると、f(t)とf(t+Δt)と表現でき、
図6のような関係にある。
注目すると、第2の受信信号f(t+Δt)は(数3)
のようにテーラー展開することが可能である。
ンサ2の間が十分小さいものであれば、遅延時間Δtは
極めて小さい値であるので、Δtの高次項、つまり、
(数3)の第3項以降を無視して(数4)のように近似
しても、(数3)の値の精度は高く保たれる。
間を表わしている。
る。
+Δt)−f(t)をf’(t)で除算したもの、つま
り、第1の受信信号と第2の受信信号の差分信号を、第
1の受信信号の微分信号で除算したものとなる。つま
り、書き換えれば(数6)のように表現できる。
号(Δtの遅延がある受信信号)を第2の受信信号とし
たが、遅延受信信号(Δtの遅延がある受信信号)を第
1の受信信号としても良い。さらに、微分信号を第1の
受信信号の微分演算により求めたが、第2の受信信号の
微分演算により求めても良い。
算によれば、演算処理が、第1の受信信号および第2の
受信信号間の1回の差分演算と、第1の受信信号の1回
の微分演算と、差分演算結果を微分演算結果で除算する
1回の除算演算のみとなるので、従来の相互相関法を用
いた場合の演算処理に比べると、演算量が少なくて済む
ので高速処理が可能となることが分かる。
似遅延時間を求める。
すように、複数の入力信号から任意に選んだ2つの入力
信号の差分信号を演算する差分信号演算部24と、任意
に選んだ2つの入力信号のうちの1つの入力信号の微分
信号を演算する微分信号演算部25と、差分信号を微分
信号で除算した除算信号を演算する除算信号演算部26
を備え、除算信号を前記任意に選んだ2つの入力信号間
の遅延時間とする。到来方向検知部22は、遅延時間検
出部23bが検出した遅延時間に基づいて、任意に選ん
だ2つの入力信号の観測地点に対する、入力信号の到来
方向を検出するものである。
ら任意に選んだ第1および第2の入力信号f(t)、g
(t)の差分演算を(数7)により求める。
入力信号の微分値を演算するものであり、ここでは、例
えば、第1の入力信号の微分値を(数8)により求め
る。
差分信号演算部24で得た差分値を微分信号演算部25
で得た微分値で除算して遅延時間Δτを求める。
3bが検出した遅延時間Δτと、遅延時間計算の対象と
なった2つのセンサ間の距離dから任意に選んだ2つの
入力信号の入力地点に対する入力信号の到来方向θを計
算する。その原理を図6を用いて説明する。
の到来方向θ、信号源から2つのマイクへの行路差L、
遅延時間Δτの間には、信号の伝播速度をvとおくと
(数10)の関係がある。
のように計算できる。
来方向検知部22で得た到来方向θと、予め設定した目
的信号の到来方向θ0との差の絶対値がΔθ以内の場合
は目的音区間候補と判定し、差の絶対値がΔθより大き
い場合は雑音区間候補と判定する。
信号区間候補検出部20において、入力信号のパワーの
変化に基づいて目的信号区間候補と雑音信号区間候補と
を検出するアルゴリズムと、入力信号の到来方向に基づ
いて目的信号区間候補と雑音信号区間候補とを検出する
アルゴリズムにより目的信号区間候補と雑音信号区間候
補を検出する。
したこれら目的信号区間候補と雑音信号区間候補の分類
処理は、実施形態1または実施形態2と同様の処理によ
り実行する。
テムは、信号区間候補検出部が用いるアルゴリズムとし
て、入力信号のパワーの変化に基づいて目的信号区間候
補と雑音信号区間候補とを検出するアルゴリズムと、入
力信号のパワー比に基づいて入力信号の到来方向を検出
し、到来方向に基づいて目的信号区間候補と雑音信号区
間候補とを検出するアルゴリズムとの組み合わせとした
例である。
構成を示す図である。図7において、入力部10、信号
区間分類部30は図1と同様である。
パワー比計算部27を備えており、入力信号のパワー比
に基づいて入力信号の到来方向を検出し、到来方向に基
づいて目的信号区間候補と雑音信号区間候補とを検出す
るアルゴリズムを用いるものである。
入力信号のパワー比を計算する。到来方向検知部22a
は、パワー比計算部27で得たパワー比から入力信号の
到来方向を計算する。つまり、両信号のパワー比が等し
い場合、2つの入力センサに正対した方向から信号が到
来しており、パワー比が最大であれば、2つの入力セン
サに対して平行の方向から信号が到来していることが分
かる。このようにパワー比を解析することにより入力信
号の到来方向を検知することができる。
などに比べて、少ない計算量で求めることができ、信号
処理システムのリソースの負荷を小さくすることが可能
となる。
b’’において、入力信号のパワー比に基づいて入力信
号の到来方向を検出し、到来方向に基づいて目的信号区
間候補と雑音信号区間候補とを検出するアルゴリズムを
採用する点以外は、実施形態3で説明した処理と同様で
あるので、それら処理に関する説明は省略する。
テムは、目的信号区間および雑音信号区間検出ととも
に、雑音信号抑制処理を実行するものである。
構成を示す図である。
号区間分類部30は、実施形態1で示した図1と同様の
もので良く、ここでの詳しい説明は省略する。なお、信
号区間候補検出部20は、実施形態1で示したものに限
られず、実施形態3で示した図4の第1の信号区間候補
検出部20a’または第2の信号区間候補検出部20
b’、実施形態4で示した図7の第2の信号区間候補検
出部20b’’と同様のものとしても良い。
制部40を備えている。
とも1つの入力信号を処理対象として入力し、信号区間
分類部30によって分類された各信号区間の性質に応じ
て、抑制量を変化させながら入力信号のレベルを抑制す
る。例えば、雑音抑制部40は、雑音信号区間に対して
重みづけを行って信号レベルを低下させる。
数、2値係数など自由に用いることができる。以下に、
実施形態2で説明した定常雑音信号区間と非定常雑音信
号区間に対する重み係数の一例を示す。
a、非定常雑音信号区間に対する重み係数をWb、目的
信号区間の重み係数をWcとし、定常雑音信号区間の平
均パワーをPs、非定常雑音信号区間の平均パワーをP
nsとし、各重み係数を各信号区間の信号パワーに応じ
て(数12)に従って設定する。
信号f(t)に乗じることにより、定常雑音信号区間と
非定常雑音信号区間の雑音レベルを同様に抑制すること
ができ、定常雑音信号を除去するとともに、非定常雑音
信号の低減も可能となる。
テムは、実施形態5と同様、目的信号区間および雑音信
号区間検出とともに、雑音信号抑制処理を実行するもの
である。
デルを用いて雑音信号抑制処理を実行する。
信号区間候補を定常雑音信号区間と非定常雑音信号区間
に分類し、定常雑音信号区間と分類された信号区間にお
いて雑音モデル推定を実行し、目的信号区間および非定
常雑音信号区間と分類された信号区間において雑音モデ
ル推定を実行せずに、雑音モデルを推定する雑音モデル
推定部と、雑音モデル推定部が推定した雑音モデルに基
づき、雑音抑制を行う雑音抑制部を備えた構成としてい
る。
構成を示す図である。
号区間分類部30は、実施形態5で示した図8と同様の
もので良く、ここでの説明は省略する。
1を備え、雑音モデル推定部41が推定した雑音モデル
に基づき、雑音抑制を行う。
音信号区間と分類された信号区間において雑音モデル推
定を実行し、目的信号区間および非定常雑音信号区間と
分類された信号区間において雑音モデル推定を実行せず
に、雑音モデルを推定する。
音信号区間のみで実行することにより雑音抑制性能を高
く維持することができる。その理由は以下のように説明
できる。つまり、本実施形態6の信号処理システムで
は、定常雑音信号区間のみで雑音モデル推定を実行する
ので、雑音モデルは定常雑音信号のみに対するものとな
る。もし、非定常雑音信号区間において雑音モデルの推
定を実行する構成とすると、当該非定常雑音信号区間の
みに有効な非定常雑音信号成分が繰り込まれてしまい、
定常雑音信号区間や他の非定常雑音信号区間に対応しな
い非定常雑音信号成分を抑制することとなり、かえって
雑音抑制性能を劣化させる結果を招くからである。
テムは、実施形態5と同様、目的信号区間および雑音信
号区間検出とともに、雑音信号抑制処理を実行するもの
である。
音信号区間には、スペクトルサブトラクションによる雑
音抑制処理を適用し、非定常雑音信号区間には非定常雑
音信号区間の性質に応じた雑音抑制処理を適用するもの
である。
の構成を示す図である。
号区間分類部30は、実施形態5で示した図8と同様の
もので良く、ここでの説明は省略する。
ーリエ変換部42、雑音モデル推定部43、雑音スペク
トル抑制部44、逆フーリエ変換部45を備えている。
なくとも1つの入力信号を入力し、当該入力信号に対し
て窓関数により窓掛け処理を施した後、フーリエ変換に
より入力スペクトル信号を求める部分である。
間と分類された信号区間の信号を入力し、そのスペクト
ルを計算し、定常雑音信号区間の雑音スペクトル信号を
推定する部分である。
換部42から入力スペクトル信号を入力し、また、雑音
モデル推定部43から雑音スペクトル信号を入力し、当
該入力スペクトル信号から当該雑音スペクトル信号を差
分演算し、雑音スペクトル信号成分を除去する部分であ
る。
スペクトル信号を逆フーリエ変換により時間領域上の信
号に戻す部分である。
定常雑音信号区間に対して、スペクトルサブトラクショ
ンによる雑音抑制処理を適用することができる。
信号区間の性質に応じた雑音抑制方式を適用することに
より、適切に非定常雑音信号区間の非定常雑音信号また
は定常雑音信号と非定常雑音信号との重畳信号成分を取
り除くことができるため、雑音抑制処理を効果的に実行
できる。
テムは、処理対象の信号を音声信号とし、入力信号であ
る音声信号に対する目的信号区間検出処理、雑音信号区
間検出処理、雑音信号抑制処理とともに、当該目的信号
の音声認識処理を実行するものである。
の構成を示す図である。
号区間分類部30、雑音抑制部40は、実施形態5で示
したものと同様のもので良く、ここでの詳しい説明は省
略する。
したものに限られず、実施形態6で示した雑音抑制部4
0a、または、実施形態7で示した雑音抑制部40bと
同様のものとしても良い。
識部50を備えている。
音抑制処理後の入力信号を入力し、目的信号区間の信号
に対して音声認識処理を行う部分である。
理アルゴリズムは、従来技術におけるもので良い。例え
ば、目的信号を音素単位に分け、各音素ごと音声モデル
とのパターンマッチングにより音声を認識する。
よれば、非定常雑音が存在する入力環境下で得られた入
力信号に対して本発明の雑音抑圧処理を前処理として実
行し、音声認識処理を実行することにより音声認識精度
を向上することができる。
上記に説明した処理を実現するステップを記述したプロ
グラムとして記述することができ、当該プログラムをコ
ンピュータに読み取らせることにより、本発明の波動信
号処理を実行することができる。本発明の信号処理シス
テムを実現する処理ステップを備えたプログラムは、図
12に図示した例のように、CD−ROM1002やフ
レキシブルディスク1003等の可搬型記録媒体100
1だけでなく、ネットワーク上にある記録装置内の記録
媒体1000や、コンピュータのハードディスクやRA
M等の記録媒体1005に格納して提供することがで
き、ネットワークからダウンロードすることもできる。
プログラム実行時には、プログラムはコンピュータ10
04上にローディングされ、主メモリ上で実行される。
た、目的信号区間検出処理、雑音信号区間検出処理、雑
音抑制処理、音声認識処理は、適宜組み合わせて用いて
も良い。
いて、さらに以下の項を開示する。
と、前記入力信号から検出対象となる目的信号が記録さ
れている信号区間の候補である目的信号区間候補と当該
目的信号区間候補以外の雑音信号区間候補を検出する複
数の信号区間候補検出部であって、それぞれが用いる目
的信号区間候補および雑音信号区間候補の検出アルゴリ
ズムが異なる信号区間候補検出部と、前記複数の信号区
間候補検出部から各信号区間候補に対する各々の検出結
果の通知を受け、当該検出結果の組み合わせにより、各
信号区間候補を分類する信号区間分類部を備えたことを
特徴とする信号処理システム(1)。
複数の信号区間候補検出部のすべてにおいて目的信号区
間候補と検出された信号区間候補を目的信号区間とし、
前記複数の信号区間候補検出部のすべてにおいて雑音信
号区間候補と検出された信号区間候補を第1種雑音信号
区間とし、前記複数の信号区間候補検出部のいずれかに
おいて目的信号区間候補と検出され、かつ、いずれかに
おいて雑音信号区間候補と検出された信号区間候補を第
2種雑音信号区間として分類する付記1に記載の信号処
理システム(2)。
理において、前記第1種雑音信号区間を定常雑音のみが
現れている定常雑音信号区間と分類し、前記第2種雑音
信号区間を定常雑音と非定常雑音が重畳して現れている
非定常雑音信号区間と分類する付記2に記載の信号処理
システム(3)。
部のうち、少なくとも一つが、前記入力された信号のパ
ワーの変化に基づいて前記目的信号区間候補と前記雑音
信号区間候補とを検出するアルゴリズムを用いるもので
あり、少なくとも他の一つが、前記入力された信号の到
来方向を検出し、当該到来方向に基づいて前記目的信号
区間候補と前記雑音信号区間候補とを検出するアルゴリ
ズムを用いるものである付記1に記載の信号処理システ
ム(4)。
前記雑音信号区間候補のすべてに対して同一の雑音抑制
処理を適用する、または、前記信号区間分類部による分
類結果に応じて適用する雑音抑制処理を選択して適用す
る雑音抑制部を備えた付記1に記載の信号処理システム
(5)。
して雑音抑制処理を行なわず、前記定常雑音信号区間の
信号および前記非定常雑音信号区間の信号に対して、1
より小さい重み付けの雑音抑制処理を行なう雑音抑制部
を備えた付記3に記載の信号処理システム(6)。
された信号区間においてのみ定常雑音モデルの推定処理
を実行し、前記目的信号区間および非定常雑音信号区間
と分類された信号区間において雑音モデルの推定処理を
停止する雑音モデル推定部を備え、前記雑音抑制部は、
前記雑音モデル推定部が推定した雑音モデルに基づき、
雑音抑制を行う付記5または6に記載の信号処理システ
ム(7)。
された信号区間においてのみ定常雑音モデルの推定処理
を実行し、前記目的信号区間および非定常雑音信号区間
と分類された信号区間において雑音モデルの推定処理を
停止する雑音モデル推定部を備え、前記雑音抑制部は、
前記雑音モデル推定部が推定した雑音モデルに基づき、
雑音抑制処理を行い、さらに、当該雑音抑制処理後の非
定常雑音信号区間の信号レベルを当該雑音抑制処理後の
定常雑音信号区間の平均信号レベルまで抑制する雑音抑
制処理を行なう付記5または6に記載の信号処理システ
ム。
る信号が、少なくとも2箇所の観測地点から得た複数の
入力信号であり、前記到来方向に基づいて前記目的信号
区間候補と前記雑音信号区間候補とを検出するアルゴリ
ズムを用いる信号区間候補検出部が、前記複数の入力信
号から任意に選んだ2つの入力信号の相互相関関数に基
づいて遅延時間を求める遅延時間検出部と、前記遅延時
間検出部が検出した遅延時間に基づいて、前記任意に選
んだ2つの入力信号の入力地点に対する、前記入力信号
の到来方向を検出する方向検出部を備えた付記4に記載
の信号処理システム。
れる信号が、少なくとも2箇所の観測地点から得た複数
の入力信号であり、前記到来方向に基づいて前記目的信
号区間候補と前記雑音信号区間候補とを検出するアルゴ
リズムを用いる信号区間候補検出部が、前記複数の入力
信号から任意に選んだ2つの入力信号の差分信号を演算
する差分信号演算部と、前記任意に選んだ2つの入力信
号のうちの1つの入力信号の微分信号を演算する微分信
号演算部と、前記差分信号を前記微分信号で除算した除
算信号を演算する除算信号演算部と、前記除算信号を前
記任意に選んだ2つの入力信号間の遅延時間とする遅延
時間検出部と、前記遅延時間検出部が検出した遅延時間
に基づいて、前記任意に選んだ2つの入力信号の観測地
点に対する、前記入力信号の到来方向を検出する方向検
出部を備えた付記4に記載の信号処理システム。
あり、前記目的信号区間の音声信号に対する音声認識を
行う音声認識部を備えた付記1〜10のいずれかに記載
の信号処理システム(8)。
力信号から検出対象となる目的信号が記録されている信
号区間の候補である目的信号区間候補と当該目的信号区
間候補以外の雑音信号区間候補を検出する複数の信号区
間候補検出処理であって、それぞれが用いる目的信号区
間候補および雑音信号区間候補の検出アルゴリズムが異
なるものを用いて、目的信号区間候補および雑音信号区
間候補を検出し、前記複数の信号区間候補検出処理から
各信号区間候補に対する各々の検出結果の通知を受け、
当該検出結果の組み合わせにより、各信号区間候補を分
類することを特徴とする信号処理方法(9)。
理において前記複数の信号区間候補検出処理のすべてに
おいて目的信号区間候補と検出された信号区間候補を目
的信号区間とし、前記複数の信号区間候補検出処理のす
べてにおいて雑音信号区間候補と検出された信号区間候
補を第1種雑音信号区間とし、前記複数の信号区間候補
検出処理のいずれかにおいて目的信号区間候補と検出さ
れ、かつ、いずれかにおいて雑音信号区間候補と検出さ
れた信号区間候補を第2種雑音信号区間として分類する
付記12に記載の信号処理方法。
るコンピュータで実行可能なプログラムであって、入力
信号を入力する入力ステップと、前記入力信号から検出
対象となる目的信号が記録されている信号区間の候補で
ある目的信号区間候補と当該目的信号区間候補以外の雑
音信号区間候補を検出する複数の信号区間候補検出処理
ステップであって、それぞれが用いる目的信号区間候補
および雑音信号区間候補の検出アルゴリズムが異なるも
のを用いて、目的信号区間候補および雑音信号区間候補
を検出するステップと、前記複数の信号区間候補検出処
理ステップから各信号区間候補に対する各々の検出結果
の通知を受け、当該検出結果の組み合わせにより、各信
号区間候補を分類する処理ステップを備えたことを特徴
とするプログラム(10)。
るコンピュータで実行可能なプログラムであって、前記
信号区間候補の分類処理ステップにおいて、前記複数の
信号区間候補検出処理ステップのすべてにおいて目的信
号区間候補と検出された信号区間候補を目的信号区間と
し、前記複数の信号区間候補検出処理ステップのすべて
において雑音信号区間候補と検出された信号区間候補を
第1種雑音信号区間とし、前記複数の信号区間候補検出
処理ステップのいずれかにおいて目的信号区間候補と検
出され、かつ、いずれかにおいて雑音信号区間候補と検
出された信号区間候補を第2種雑音信号区間として分類
する付記14に記載のプログラム。
力信号を目的信号区間と雑音信号区間に分類するだけで
なく、雑音信号区間を複数の性質の異なる雑音信号区間
に分類することができる。
ば、すべてのアルゴリズムにおいて雑音信号区間候補と
検出された雑音信号区間候補を、第1種雑音信号区間
と、いずれかのアルゴリズムにおいて雑音信号区間候補
とされ、いずれかのアルゴリズムにおいて雑音信号区間
候補とされた第2種雑音信号区間に分類することがで
き、さらに、当該第1種雑音信号区間を定常雑音のみが
現れている定常雑音信号区間と分類し、当該第2種雑音
信号区間を定常雑音と非定常雑音が重畳して現れている
非定常雑音信号区間と分類し、雑音信号区間を適切に定
常雑音信号区間と非定常雑音信号区間に分類することが
できる。
のように分類された雑音信号区間に対して雑音抑制処理
を実行することが可能となる。また、雑音抑制処理に関
して、定常雑音信号区間と非定常雑音信号区間それぞれ
の信号区間に対する適切な雑音抑制処理を実行すること
ができる。
された目的信号区間に対して音声認識処理などを実行す
ることができる。なお、上記雑音抑制処理後の信号に対
して音声認識を行えば、さらに高い認識精度を得ること
ができる。
ムの構成を示す図
信号処理システムの各部分における信号を示す図
信号処理システムの各部分における信号を示す図
成を示す図
す図
を説明する図
成を示す図
成を示す図
成を示す図
構成を示す図
構成を示す図
ステムを実現する処理ステップを記録した記録媒体の例
を示す図
検出処理とスペクトルサブトラクションによる雑音抑制
処理によって雑音を抑制するシステムを説明する図
間検出処理とスペクトルサブトラクションによる雑音抑
制処理によって雑音を抑制するシステムを説明する図
搬型記録媒体 1002 CD−ROM 1003 フレキシブルディスク 1004 コンピュータ 1005 コンピュータ上のRAM/ハードディスク等
の記録媒体
Claims (10)
- 【請求項1】 入力信号を入力する入力部と、 前記入力信号から検出対象となる目的信号が記録されて
いる信号区間の候補である目的信号区間候補と当該目的
信号区間候補以外の雑音信号区間候補を検出する複数の
信号区間候補検出部であって、それぞれが用いる目的信
号区間候補および雑音信号区間候補の検出アルゴリズム
が異なる信号区間候補検出部と、 前記複数の信号区間候補検出部から各信号区間候補に対
する各々の検出結果の通知を受け、当該検出結果の組み
合わせにより、各信号区間候補を分類する信号区間分類
部を備えたことを特徴とする信号処理システム。 - 【請求項2】 前記信号区間分類部は、 前記複数の信号区間候補検出部のすべてにおいて目的信
号区間候補と検出された信号区間候補を目的信号区間と
し、 前記複数の信号区間候補検出部のすべてにおいて雑音信
号区間候補と検出された信号区間候補を第1種雑音信号
区間とし、 前記複数の信号区間候補検出部のいずれかにおいて目的
信号区間候補と検出され、かつ、いずれかにおいて雑音
信号区間候補と検出された信号区間候補を第2種雑音信
号区間として分類する請求項1に記載の信号処理システ
ム。 - 【請求項3】 前記信号区間分類部の分類処理におい
て、前記第1種雑音信号区間を定常雑音のみが現れてい
る定常雑音信号区間と分類し、前記第2種雑音信号区間
を定常雑音と非定常雑音が重畳して現れている非定常雑
音信号区間と分類する請求項2に記載の信号処理システ
ム。 - 【請求項4】 前記複数の信号区間候補検出部のうち、
少なくとも一つが、前記入力された信号のパワーの変化
に基づいて前記目的信号区間候補と前記雑音信号区間候
補とを検出するアルゴリズムを用いるものであり、少な
くとも他の一つが、前記入力された信号の到来方向を検
出し、当該到来方向に基づいて前記目的信号区間候補と
前記雑音信号区間候補とを検出するアルゴリズムを用い
るものである請求項1に記載の信号処理システム。 - 【請求項5】 前記目的信号区間候補および前記雑音信
号区間候補のすべてに対して同一の雑音抑制処理を適用
する、または、前記信号区間分類部による分類結果に応
じて適用する雑音抑制処理を選択して適用する雑音抑制
部を備えた請求項1に記載の信号処理システム。 - 【請求項6】 前記目的信号区間の信号に対して雑音抑
制処理を行なわず、前記定常雑音信号区間の信号および
前記非定常雑音信号区間の信号に対して、1より小さい
重み付けの雑音抑制処理を行なう雑音抑制部を備えた請
求項3に記載の信号処理システム。 - 【請求項7】 前記定常雑音信号区間と分類された信号
区間においてのみ定常雑音モデルの推定処理を実行し、
前記目的信号区間および非定常雑音信号区間と分類され
た信号区間において雑音モデルの推定処理を停止する雑
音モデル推定部を備え、 前記雑音抑制部は、前記雑音モデル推定部が推定した雑
音モデルに基づき、雑音抑制を行う請求項5または6に
記載の信号処理システム。 - 【請求項8】 前記入力信号が音声信号であり、 前記目的信号区間の音声信号に対する音声認識を行う音
声認識部を備えた請求項1〜7のいずれかに記載の信号
処理システム。 - 【請求項9】 入力信号を入力し、 前記入力信号から検出対象となる目的信号が記録されて
いる信号区間の候補である目的信号区間候補と当該目的
信号区間候補以外の雑音信号区間候補を検出する複数の
信号区間候補検出処理であって、それぞれが用いる目的
信号区間候補および雑音信号区間候補の検出アルゴリズ
ムが異なるものを用いて、目的信号区間候補および雑音
信号区間候補を検出し、 前記複数の信号区間候補検出処理から各信号区間候補に
対する各々の検出結果の通知を受け、当該検出結果の組
み合わせにより、各信号区間候補を分類することを特徴
とする信号処理方法。 - 【請求項10】 信号区間検出処理を実行するコンピュ
ータで実行可能なプログラムであって、 入力信号を入力する入力ステップと、 前記入力信号から検出対象となる目的信号が記録されて
いる信号区間の候補である目的信号区間候補と当該目的
信号区間候補以外の雑音信号区間候補を検出する複数の
信号区間候補検出処理ステップであって、それぞれが用
いる目的信号区間候補および雑音信号区間候補の検出ア
ルゴリズムが異なるものを用いて、目的信号区間候補お
よび雑音信号区間候補を検出するステップと、 前記複数の信号区間候補検出処理ステップから各信号区
間候補に対する各々の検出結果の通知を受け、当該検出
結果の組み合わせにより、各信号区間候補を分類する処
理ステップを備えたことを特徴とするプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001390189A JP3812887B2 (ja) | 2001-12-21 | 2001-12-21 | 信号処理システムおよび方法 |
US10/283,238 US7203640B2 (en) | 2001-12-21 | 2002-10-30 | System and method for determining an intended signal section candidate and a type of noise section candidate |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001390189A JP3812887B2 (ja) | 2001-12-21 | 2001-12-21 | 信号処理システムおよび方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003195882A true JP2003195882A (ja) | 2003-07-09 |
JP3812887B2 JP3812887B2 (ja) | 2006-08-23 |
Family
ID=19188348
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001390189A Expired - Fee Related JP3812887B2 (ja) | 2001-12-21 | 2001-12-21 | 信号処理システムおよび方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US7203640B2 (ja) |
JP (1) | JP3812887B2 (ja) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006304125A (ja) * | 2005-04-25 | 2006-11-02 | V-Cube Inc | 音声信号補正装置および音声信号補正方法 |
JP2008054071A (ja) * | 2006-08-25 | 2008-03-06 | Hitachi Communication Technologies Ltd | 紙擦れ音除去装置 |
US7706550B2 (en) | 2004-01-08 | 2010-04-27 | Kabushiki Kaisha Toshiba | Noise suppression apparatus and method |
JP2011186384A (ja) * | 2010-03-11 | 2011-09-22 | Fujitsu Ltd | 雑音推定装置、雑音低減システム、雑音推定方法、及びプログラム |
JP2013511750A (ja) * | 2009-12-28 | 2013-04-04 | 歌尓声学股▲ふん▼有限公司 | マイクロホンアレイノイズ低減制御方法及び装置 |
JP2013524267A (ja) * | 2010-03-29 | 2013-06-17 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 空間オーディオプロセッサおよび音響入力信号に基づいて空間パラメータを提供する方法 |
JP2013125035A (ja) * | 2011-12-15 | 2013-06-24 | Tektronix Inc | 試験測定装置及び試験測定装置における方法 |
WO2014112023A1 (ja) * | 2013-01-17 | 2014-07-24 | 日本電気株式会社 | 雑音除去システム、音声検出システム、音声認識システム、雑音除去方法および雑音除去プログラム |
JP2014523003A (ja) * | 2011-07-05 | 2014-09-08 | マイクロソフト コーポレーション | オーディオ信号処理 |
JP2017067862A (ja) * | 2015-09-28 | 2017-04-06 | 富士通株式会社 | 音声信号処理装置、音声信号処理方法及びプログラム |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4000095B2 (ja) * | 2003-07-30 | 2007-10-31 | 株式会社東芝 | 音声認識方法、装置及びプログラム |
JP4873913B2 (ja) * | 2004-12-17 | 2012-02-08 | 学校法人早稲田大学 | 音源分離システムおよび音源分離方法、並びに音響信号取得装置 |
US8849231B1 (en) | 2007-08-08 | 2014-09-30 | Audience, Inc. | System and method for adaptive power control |
US20090027648A1 (en) * | 2007-07-25 | 2009-01-29 | Asml Netherlands B.V. | Method of reducing noise in an original signal, and signal processing device therefor |
US8468019B2 (en) * | 2008-01-31 | 2013-06-18 | Qnx Software Systems Limited | Adaptive noise modeling speech recognition system |
US8798289B1 (en) * | 2008-08-05 | 2014-08-05 | Audience, Inc. | Adaptive power saving for an audio device |
US20100083134A1 (en) * | 2008-09-29 | 2010-04-01 | International Business Machines Corporation | Delegation of calendar functions |
US9064499B2 (en) * | 2009-02-13 | 2015-06-23 | Nec Corporation | Method for processing multichannel acoustic signal, system therefor, and program |
WO2010092913A1 (ja) * | 2009-02-13 | 2010-08-19 | 日本電気株式会社 | 多チャンネル音響信号処理方法、そのシステム及びプログラム |
KR101737824B1 (ko) * | 2009-12-16 | 2017-05-19 | 삼성전자주식회사 | 잡음 환경의 입력신호로부터 잡음을 제거하는 방법 및 그 장치 |
US10218327B2 (en) * | 2011-01-10 | 2019-02-26 | Zhinian Jing | Dynamic enhancement of audio (DAE) in headset systems |
JP5929154B2 (ja) * | 2011-12-15 | 2016-06-01 | 富士通株式会社 | 信号処理装置、信号処理方法および信号処理プログラム |
US9263040B2 (en) | 2012-01-17 | 2016-02-16 | GM Global Technology Operations LLC | Method and system for using sound related vehicle information to enhance speech recognition |
JP6158006B2 (ja) * | 2013-09-17 | 2017-07-05 | 株式会社東芝 | 音声処理装置、方法、及びプログラム |
US10292629B2 (en) * | 2014-03-19 | 2019-05-21 | University Of Houston System | Method for measuring physiological parameters of physical activity |
US10564256B2 (en) * | 2016-04-01 | 2020-02-18 | Rockwell Collins, Inc. | Beam sharpening radar system and method |
US11011182B2 (en) * | 2019-03-25 | 2021-05-18 | Nxp B.V. | Audio processing system for speech enhancement |
EP4060662A4 (en) * | 2019-12-13 | 2023-03-08 | Mitsubishi Electric Corporation | INFORMATION PROCESSING DEVICE, DETECTION METHOD AND DETECTION PROGRAM |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4277645A (en) * | 1980-01-25 | 1981-07-07 | Bell Telephone Laboratories, Incorporated | Multiple variable threshold speech detector |
JP3074952B2 (ja) | 1992-08-18 | 2000-08-07 | 日本電気株式会社 | 雑音除去装置 |
JPH06332492A (ja) * | 1993-05-19 | 1994-12-02 | Matsushita Electric Ind Co Ltd | 音声検出方法および検出装置 |
SE501305C2 (sv) * | 1993-05-26 | 1995-01-09 | Ericsson Telefon Ab L M | Förfarande och anordning för diskriminering mellan stationära och icke stationära signaler |
US5828997A (en) * | 1995-06-07 | 1998-10-27 | Sensimetrics Corporation | Content analyzer mixing inverse-direction-probability-weighted noise to input signal |
JP3677143B2 (ja) | 1997-07-31 | 2005-07-27 | 株式会社東芝 | 音声処理方法および装置 |
US20020138254A1 (en) * | 1997-07-18 | 2002-09-26 | Takehiko Isaka | Method and apparatus for processing speech signals |
JP3499113B2 (ja) | 1997-09-26 | 2004-02-23 | シャープ株式会社 | 雑音除去装置 |
JP2000163099A (ja) | 1998-11-25 | 2000-06-16 | Brother Ind Ltd | 雑音除去装置、音声認識装置および記憶媒体 |
JP2000322074A (ja) | 1999-05-13 | 2000-11-24 | Denso Corp | 音声入力区間判定装置,音声データ抽出装置,音声認識装置,車両用ナビゲーション装置及び入力用マイク |
US6424960B1 (en) * | 1999-10-14 | 2002-07-23 | The Salk Institute For Biological Studies | Unsupervised adaptation and classification of multiple classes and sources in blind signal separation |
US6889187B2 (en) * | 2000-12-28 | 2005-05-03 | Nortel Networks Limited | Method and apparatus for improved voice activity detection in a packet voice network |
US6937980B2 (en) * | 2001-10-02 | 2005-08-30 | Telefonaktiebolaget Lm Ericsson (Publ) | Speech recognition using microphone antenna array |
-
2001
- 2001-12-21 JP JP2001390189A patent/JP3812887B2/ja not_active Expired - Fee Related
-
2002
- 2002-10-30 US US10/283,238 patent/US7203640B2/en not_active Expired - Fee Related
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7706550B2 (en) | 2004-01-08 | 2010-04-27 | Kabushiki Kaisha Toshiba | Noise suppression apparatus and method |
JP2006304125A (ja) * | 2005-04-25 | 2006-11-02 | V-Cube Inc | 音声信号補正装置および音声信号補正方法 |
JP2008054071A (ja) * | 2006-08-25 | 2008-03-06 | Hitachi Communication Technologies Ltd | 紙擦れ音除去装置 |
JP2013511750A (ja) * | 2009-12-28 | 2013-04-04 | 歌尓声学股▲ふん▼有限公司 | マイクロホンアレイノイズ低減制御方法及び装置 |
JP2011186384A (ja) * | 2010-03-11 | 2011-09-22 | Fujitsu Ltd | 雑音推定装置、雑音低減システム、雑音推定方法、及びプログラム |
US9626974B2 (en) | 2010-03-29 | 2017-04-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Spatial audio processor and a method for providing spatial parameters based on an acoustic input signal |
JP2013524267A (ja) * | 2010-03-29 | 2013-06-17 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 空間オーディオプロセッサおよび音響入力信号に基づいて空間パラメータを提供する方法 |
US10327088B2 (en) | 2010-03-29 | 2019-06-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Spatial audio processor and a method for providing spatial parameters based on an acoustic input signal |
JP2014523003A (ja) * | 2011-07-05 | 2014-09-08 | マイクロソフト コーポレーション | オーディオ信号処理 |
JP2013125035A (ja) * | 2011-12-15 | 2013-06-24 | Tektronix Inc | 試験測定装置及び試験測定装置における方法 |
JPWO2014112023A1 (ja) * | 2013-01-17 | 2017-01-19 | 日本電気株式会社 | 雑音除去システム、音声検出システム、音声認識システム、雑音除去方法および雑音除去プログラム |
US9449616B2 (en) | 2013-01-17 | 2016-09-20 | Nec Corporation | Noise reduction system, speech detection system, speech recognition system, noise reduction method, and noise reduction program |
WO2014112023A1 (ja) * | 2013-01-17 | 2014-07-24 | 日本電気株式会社 | 雑音除去システム、音声検出システム、音声認識システム、雑音除去方法および雑音除去プログラム |
JP2017067862A (ja) * | 2015-09-28 | 2017-04-06 | 富士通株式会社 | 音声信号処理装置、音声信号処理方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP3812887B2 (ja) | 2006-08-23 |
US20030120485A1 (en) | 2003-06-26 |
US7203640B2 (en) | 2007-04-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2003195882A (ja) | 信号処理システムおよび方法 | |
US7246058B2 (en) | Detecting voiced and unvoiced speech using both acoustic and nonacoustic sensors | |
JP4906908B2 (ja) | 目的音声抽出方法、目的音声抽出装置、及び目的音声抽出プログラム | |
JP4177452B2 (ja) | 音源位置検知装置 | |
US20070233479A1 (en) | Detecting voiced and unvoiced speech using both acoustic and nonacoustic sensors | |
KR100486736B1 (ko) | 두개의 센서를 이용한 목적원별 신호 분리방법 및 장치 | |
CN113380272A (zh) | 基于音频的紧急车辆检测与追踪 | |
US9818428B2 (en) | Extraction of target speeches | |
US20120183149A1 (en) | Sound signal processing apparatus, sound signal processing method, and program | |
KR20120080409A (ko) | 잡음 구간 판별에 의한 잡음 추정 장치 및 방법 | |
JP4875656B2 (ja) | 信号区間推定装置とその方法と、プログラムとその記録媒体 | |
JP2003337594A (ja) | 音声認識装置、その音声認識方法及びプログラム | |
CN112534800B (zh) | 一种回波检测的方法和系统 | |
WO2015129760A1 (ja) | 信号処理装置、方法及びプログラム | |
WO2002098169A1 (en) | Detecting voiced and unvoiced speech using both acoustic and nonacoustic sensors | |
KR100992656B1 (ko) | 음향 및 비음향 센서를 이용한 유성음 및 무성음 감지시스템 및 방법 | |
JP2007093635A (ja) | 既知雑音除去装置 | |
US20070160241A1 (en) | Determination of the adequate measurement window for sound source localization in echoic environments | |
Rudzyn et al. | Real time robot audition system incorporating both 3D sound source localisation and voice characterisation | |
JP6106618B2 (ja) | 音声区間検出装置、音声認識装置、その方法、及びプログラム | |
WO2019178802A1 (en) | Method and device for estimating direction of arrival and electronics apparatus | |
EP3852099B1 (en) | Keyword detection apparatus, keyword detection method, and program | |
US11600273B2 (en) | Speech processing apparatus, method, and program | |
JP6125953B2 (ja) | 音声区間検出装置、その方法、及びプログラム | |
WO2023228785A1 (ja) | 音響信号処理装置、音響信号処理方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040115 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20051202 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20051213 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060213 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060307 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060502 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060525 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060526 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100609 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110609 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120609 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120609 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130609 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140609 Year of fee payment: 8 |
|
LAPS | Cancellation because of no payment of annual fees |