JP7211419B2

JP7211419B2 - パターン認識装置、パターン認識方法及びパターン認識プログラム

Info

Publication number: JP7211419B2
Application number: JP2020518850A
Authority: JP
Inventors: 達也小松; 玲史近藤
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2018-05-15
Filing date: 2018-05-15
Publication date: 2023-01-24
Anticipated expiration: 2038-05-15
Also published as: JPWO2019220532A1; WO2019220532A1; US20210074268A1; US11620985B2

Description

本発明は、パターン認識装置、パターン認識方法及びパターン認識プログラムに関する。

非特許文献１には、受音した音響信号をあらかじめ定義した複数の音響イベントパターンへ分類するためのパターン認識装置とその認識器の学習方法について記載されている。

また、特許文献１には、音響信号の種類を精度よく識別することができるという音響識別装置が開示されている。同文献によると、この音響識別装置の音響信号分析部２００は、信号線１０１からの音響信号における音声成分および音楽成分の有する周波数スペクトルの時間特性に基づく特徴量を抽出する。また、この音響信号分析部２００は、音響信号の周波数スペクトルを時系列に生成して、その時系列に生成された周波数スペクトルにおける周波数ごとの差分値を算出する。そして、音響信号分析部２００は、その算出された差分値に基づく度数分布の偏り度合いを示す分散を音響信号の特徴量として抽出する。そして、音響信号識別部１１０は、音響信号の種類が音楽と、音楽および音声の重畳と、音声とのいずれであるかを、その特徴量に基づいて識別する。最後に、この音響信号識別部１１０は、音声成分および音楽成分が重畳する音響信号に対応する特徴量よりも小さい音楽閾値を基準として、音響信号の種類が音楽であるか否かを識別する。

また、特許文献２には、様々なノイズが含まれた環境下でパターン認識を行うパターン認識装置に用いて好適な耐性の高い認識モデルを学習し、当該パターン認識装置におけるパターン認識率を向上させることができるという認識モデル学習装置が開示されている。同文献によると、この認識モデル学習装置のパターン認識モデル格納部６０６には、パターン認識装置におけるパターン認識処理に用いられるパターン認識モデルが格納されている。そして、情報入力部６０２から学習用情報が入力され、情報特徴量計算部６０３で情報の特徴量が計算される。ここで、パラメータ変動部６０４でパラメータが変動され、パターン認識モデル学習部６０５において、変動させたパラメータで計算された特徴量を用いてパターン認識モデルが学習される。

特開２０１１－８５８２４号公報特開２００５－３１２５８号公報

Komatsu, Tatsuya, et al. "Acoustic event detection method using semi-supervised non-negative matrix factorization with a mixture of local dictionaries." Proceedings of the Detection and Classification of Acoustic Scenes and Events 2016 Workshop (DCASE2016). 2016.

以下の分析は、本発明によって与えられたものである。非特許文献１に記載の技術では、音源から受音点までの伝達パスによって受信点で得られる信号の周波数特性が大きく変わる場合があり、パターン認識性能が劣化する問題がある。この点は、特許文献１、２も同様であり、音源から受音点までの伝達パスによって受信点で得られる信号の周波数特性が大きく変わるという点の考慮は一切なされていない。

上記音源から受音点までの伝達パスによって受信点で得られる信号の周波数特性が大きく変わるのは、音響信号に限られず、振動センサから得られる時系列振動信号など、空間中を伝播し伝わり、その伝達パスにより特性が変化するような信号に共通する。

本発明は、上記した信号の伝達パスによる影響に頑健で、より高い精度でのパターン認識の実現に貢献できるパターン認識装置、パターン認識方法及びパターン認識プログラムを提供することを目的とする。

第１の視点によれば、学習用信号に加えて、該学習用信号の伝達パスの違いを示す伝達パス情報を用いて作成されたモデルを記憶するモデル記憶部と、前記モデルを用いて、入力信号と、該入力信号の伝達パスの違いを示す伝達パス情報とを入力として、入力信号のパターン認識を行うパターン認識部と、を含むパターン認識装置が提供される。
前記第１の視点の変形として、学習用信号に加えて、該学習用信号の伝達パスの違いを示す伝達パス情報を用いて作成されたモデルを記憶するモデル記憶部と、前記モデルを用いて、入力信号と、該入力信号の伝達パスの違いを示す伝達パス情報とを入力として、入力信号のパターン認識を行うパターン認識部と、入力信号の特徴量から伝達パスを識別する伝達パス識別部と、前記パターン認識部の出力と、前記伝達パス識別部の出力とを統合して、認識結果を出力する情報統合部と、を含むパターン認識装置が提供される。

第２の視点によれば、学習用信号に加えて、該学習用信号の伝達パスの違いを示す伝達パス情報を用いて作成されたモデルを記憶するモデル記憶部を備えるコンピュータが、入力信号と、該入力信号の伝達パスの違いを示す伝達パス情報とを入力するステップと、前記モデルを用いて、前記入力信号と、前記伝達パス情報とを入力として、入力信号のパターン認識を行うステップと、を含むパターン認識方法が提供される。本方法は、学習用信号を用いて作成されたモデルを用いてパターン認識を行うコンピュータという、特定の機械に結びつけられている。
前記第２の視点の変形として、学習用信号に加えて、該学習用信号の伝達パスの違いを示す伝達パス情報を用いて作成されたモデルを記憶するモデル記憶部を備えるコンピュータが、入力信号と、該入力信号の伝達パスの違いを示す伝達パス情報とを入力するステップと、前記モデルを用いて、前記入力信号と、前記伝達パス情報とを入力として、入力信号のパターン認識を行うステップと、入力信号の特徴量から伝達パスを識別するステップと、前記入力信号のパターン認識を行った認識結果と、前記伝達パスを識別した識別結果とを統合して情報を出力するステップと、を含むパターン認識方法が提供される。

第３の視点によれば、上記したコンピュータの機能を実現するためのプログラムが提供される。なお、このプログラムは、コンピュータが読み取り可能な（非トランジトリーな）記憶媒体に記録することができる。即ち、本発明は、コンピュータプログラム製品として具現することも可能である。

本発明によれば、信号の伝達パスによる影響に頑健で、より高い精度でのパターン認識を実施することが可能となる。

本発明の一実施形態の構成を示す図である。本発明の第１の実施形態のパターン認識装置の構成を示す図である。本発明の第１の実施形態のパターン認識装置の伝達パス識別部の構成例を示す図である。本発明の第２の実施形態のパターン認識装置の構成を示す図である。本発明の第３の実施形態のパターン認識装置の構成を示す図である。本発明の第４の実施形態のパターン認識装置の構成を示す図である。本発明の第５の実施形態のパターン認識装置の構成を示す図である。本発明の第６の実施形態のパターン認識装置の構成を示す図である。本発明の第７の実施形態のパターン認識装置の変形構成を示す図である。本発明の第８の実施形態のパターン認識装置の伝達パス識別部の構成例を示す図である。本発明の第８の実施形態において、空気中が伝搬経路となる音源との関係を表す図である。本発明の第８の実施形態において、固体中が伝搬経路となる音源との関係を表す図である。本発明の第８の実施形態において、空気中が伝搬経路となる音源から、センサ１に到達する音の経路を説明する図である。本発明の第８の実施形態において、空気中が伝搬経路となる音源から、センサ２に到達する音の経路を説明する図である。本発明の第８の実施形態において、固体中が伝搬経路となる音源から、センサ１に到達する音の経路を説明する図である。本発明の第８の実施形態において、固体中が伝搬経路となる音源から、センサ２に到達する音の経路を説明する図である。本発明の第９の実施形態を実施するための形態を示すブロック図である。本発明の９の実施形態の動作を説明する図である。本発明のパターン認識装置を構成するコンピュータの構成を示す図である。

はじめに本発明の一実施形態の概要について図面を参照して説明する。なお、この概要に付記した図面参照符号は、理解を助けるための一例として各要素に便宜上付記したものであり、本発明を図示の態様に限定することを意図するものではない。また、以降の説明で参照する図面等のブロック間の接続線は、双方向及び単方向の双方を含む。一方向矢印については、主たる信号（データ）の流れを模式的に示すものであり、双方向性を排除するものではない。また、図中の各ブロックの入出力の接続点には、ポート乃至インタフェースがあるが図示省略する。

本発明は、その一実施形態において、図１に示すように、モデル記憶部９０１と、このモデルを用いて、パターン認識を行うパターン認識部９０２と、を含むパターン認識装置９００にて実現できる。

より具体的には、モデル記憶部９０１は、学習用信号に加えて、該学習用信号の伝達パスの違いを示す伝達パス情報を用いて作成されたモデルを記憶する。

パターン認識部９０２は、前記モデルを用いて、入力信号と、該入力信号の伝達パスの違いを示す伝達パス情報とを入力として、入力信号のパターン認識を行う。

上記のパターン認識装置９００によれば、入力信号の伝達パスの違いを示す伝達パス情報を加味したパターン認識が行われる。これにより、信号の伝達パスによる影響に頑健で、より高い精度でのパターン認識実施することが可能となる。

［第１の実施形態］
以下の実施形態では、入力信号が音響信号である例を挙げて説明する。はじめに、音源信号と受音点における音響信号の関係を、伝達パスによる信号の周波数特性変化の観点から説明する。

以降では、音源信号ｓ（ｔ）、受音点における音響信号をｘ（ｔ）として説明する。ここで、ｓ（ｔ）、ｘ（ｔ）はマイクロフォン等の音響センサで収録したアナログ音響信号をＡＤ変換（ＡｎａｌｏｇｔｏＤｉｇｉｔａｌＣｏｎｖｅｒｓｉｏｎ）して得られるデジタル信号系列である。ｔは時間を表すインデックスであり、所定の時間（たとえば装置やセンサを起動した時間）を、原点ｔ＝０として順次入力される音響信号の時間インデックスである。サンプリング周波数をＦｓとすると、隣り合う時間インデックスｔとｔ＋１の時間差、つまり時間分解能は１／Ｆｓとなる。

音源信号ｓ（ｔ）は、空気中、もしくは壁や建造物などの固体中、水や油などの液体中において、音波として伝播し受音点へ到達、音響信号ｘ（ｔ）として観測される。音波は媒質間の境界や音響インピーダンスの高低差などの影響により、反射や回折、透過などを起こしながら媒質中を伝播する。本発明ではこの伝播によるｓ（ｔ）に生じた遅延や周波数特性の変化を定量化したものを伝達パス（伝搬パス）と呼ぶ。

ｓ（ｔ）とｘ（ｔ）との関係は、伝達パスをある関数ｆ（・）を用いて、次の［数１］のように表現できる。
［数１］

音響デジタル信号処理分野において、関数ｆ（・）は、時不変ＦＩＲフィルタによって近似するのが一般的であり、つまりフィルタ長がＴであるＦＩＲフィルタｈ（ｔ）を用いて、［数１］の右辺は、［数２］のようにｈ（ｔ）とｓ（ｔ）の畳み込みとして表現できる。
［数２］

また、伝達パスによる音源信号の周波数特性変化は、ｈ（ｔ）の周波数応答として表現できる。本発明では、フィルタｈ（ｔ）が伝達パスを特徴づけるベクトルであるとみなし、伝達パス特徴ベクトルｈとして用いる。

ｈの推定において、一般に音源信号ｓ（ｔ）は未知であり、受音点における観測信号ｘ（ｔ）のみしか得られない場合が多い。その場合、ｘ（ｔ）に対する線形予測分析を行う方法などが用いられる。本発明はｈの推定方法については限定しておらず、任意の推定方法を用いてよい。

続いて、本発明の第１実施形態のパターン認識装置１００について、図２を用いて説明する。図２を参照すると、伝達パス識別部１０２と、モデル学習部１０３と、モデル記憶部１０４とを含む学習信号からパターン認識用のモデルを作成する構成と、このモデルを用いてパターン認識を行うパターン認識装置１００（破線内参照）とを含む構成が示されている。以下、伝達パス識別部１０２と、モデル学習部１０３と、モデル記憶部１０４とを含む学習信号からパターン認識用のモデルを作成する構成を「学習部」ともいう。

パターン認識装置１００は、伝達パス識別部１１２と、モデル切替部１１３と、パターン認識部１１４と、モデル記憶部１０４とを含んで構成されている。

学習信号１０１は、後段のパターン認識用のモデルを作成するための音響信号である。学習信号１０１は、ｘ＿ｔｒａｉｎ（ｔ，ｎ）と表すことができる。ここで、ｔは時間を表すインデックスであり、ｎはｘ＿ｔｒａｉｎ（ｔ，ｎ）が音響信号の種別を表すラベルである。例えば、入力の音響信号を「音声」と「音楽」に識別するパターン認識装置を考える場合、ｎ＝｛音声、音楽｝となる。なお、以下、数式中の下付きの添え字ｘを「＿ｘ」と記す。

伝達パス識別部１０２は、学習信号ｘ＿ｔｒａｉｎ（ｔ，ｎ）の伝達パスを識別し、学習信号ｘ＿ｔｒａｉｎ（ｔ，ｎ）の伝達パスラベルｃを出力する。例えば、伝達パス識別部１０２が識別する伝達パスが「空気」ｏｒ「木材」であった場合、伝達パス識別部１０２は、学習信号ｘ＿ｔｒａｉｎ（ｔ，ｎ）の伝達パスを識別して、ｃ＝空気、もしくはｃ＝木材を出力する。なお、伝達パス識別部１０２における伝達パスの識別方法については後に詳説する。

モデル学習部１０３は、学習信号ｘ＿ｔｒａｉｎ（ｔ，ｎ）に加えて伝達パスラベルｃを用いてパターン認識用のモデルＰを作成する。ここで、モデルＰは、学習信号ｘ＿ｔｒａｉｎ（ｔ，ｎ）の種別を出力するよう作成される、つまり前述の例でいうと、学習信号ｘ＿ｔｒａｉｎ（ｔ，ｎ）の種別に応じて、「音声」もしくは「音楽」と識別するモデルが作成される。このモデルの作成には、「音声」又は「音楽」のいずれかの音響信号を用いた教師付きの学習信号を用いてもよい。ここで、本実施形態では、学習信号ｘ＿ｔｒａｉｎ（ｔ，ｎ）の伝達パスラベルｃに応じて別のモデルを作成する。つまり、伝達パスラベルｃが｛空気、木材｝の２種である場合、入力のｃに応じて、Ｐ＝｛Ｐ＿空気、Ｐ＿木材｝の２種類のモデルが作成される。

モデル記憶部１０４は、モデル学習部１０３が作成したモデルＰを記憶する。以上が、図２のモデルを作成するための学習部の構成となる。

続いて、上記したモデルを用いてパターン認識を行うパターン認識装置の各部の動作について説明する。受音信号１１１は、伝達パス識別部１１２とパターン認識部１１４に入力される。以下、この受音信号１１１をｘ（ｔ）と表す。

伝達パス識別部１１２は、受音信号ｘ（ｔ）の伝達パスラベルｄを算出し、モデル切替部１１３に出力する。なお、伝達パス識別部１１２は、上記伝達パス識別部１０２と同等の構成となる。

モデル切替部１１３は、伝達パスラベルｄに応じて後段のパターン認識部１１４で用いるモデルを切り替え、伝達パスラベルｄに対応するモデルＰ＿ｄのみを出力する。例えばｄ＝木材の場合、モデル切替部１１３は、モデル記憶部１０４に格納のモデルＰ＝｛Ｐ＿空気、Ｐ＿木材｝のうち、Ｐ＿木材のみを出力する。

パターン認識部１１４では、モデル切替部１１３出力のモデルＰ＿ｄを用いて受音信号ｘ（ｔ）に関するパターン認識を行い結果を出力する。本実施形態では、入力の音響信号を「音声」と「音楽」に識別するパターン認識を行うため、パターン認識部１１４は、「音声」、「音楽」、識別不能といった出力を行うことになる。

ここで、上記伝達パス識別部１０２及び伝達パス識別部１１２における伝達パスを識別する構成について説明する。図３は、本発明の第１の実施形態のパターン認識装置１００の伝達パス識別部１０２／１１２の構成例を示す図である。

図３を参照すると、伝達パス特徴抽出部００２と、パス識別モデル記憶部００３と、パス識別部００４と、を含む伝達パス識別部１０２／１１２の構成が示されている。

伝達パス特徴抽出部００２は、受音信号００１を入力とし伝達パス特徴を算出し出力する。

パス識別部００４は、伝達パス特徴抽出部００２によって出力された伝達パス特徴に基づいて、パス識別モデル記憶部００３格納のパス識別モデルに基づき伝達パスを識別する。

図３の下段は、上記パス識別モデルを作成する識別モデル学習部０１０の構成を示している。伝達パス特徴抽出部００２は、パス学習用信号とそのラベルの組０１１、即ち、教師付き学習信号を入力とし、伝達パスの特徴を算出し出力する。

パス識別モデル学習部０１３は、伝達パス特徴抽出部０１２出力の伝達パス特徴に基づいて、パス識別モデルを学習する。

上記伝達パス識別部１０２／１１２及び識別モデル学習部０１０の動作は次のとおりとなる。まず、パス学習用信号とそのラベルｃの組０１１は、伝達パス特徴抽出部０１２へ入力される。このパス学習用信号とそのラベルｃの組は、ｙ＿ｔｒａｉｎ（ｔ，ｃ）と表すことができる。

ここでラベルｃとは、ｙ＿ｔｒａｉｎ（ｔ，ｃ）の伝達パスを識別するためのラベルである。例えば、空気伝播した音響信号の伝達パスをｃ＝空気、木材を伝播した伝達パスをｃ＝木材、金属を伝播した伝達パスをｃ＝金属、とすることができる。このとき、パス学習用信号とそのラベルｃの組ｙ＿ｔｒａｉｎ（ｔ，木材）は、伝達パスが木材である場合の受音信号である。そして、パス学習用信号とそのラベルｃの組ｙ＿ｔｒａｉｎ（ｔ，木材）から算出した伝達パス特徴は、木材の伝達パスの特徴を表しているといえる。

伝達パス特徴抽出部０１２は、上記ｙ＿ｔｒａｉｎ（ｔ，ｃ）からｈ＿ｔｒａｉｎ（ｃ）を算出し、パス識別モデル学習部０１３へ出力する。このｈ＿ｔｒａｉｎ（ｃ）が、前述の伝達パス特徴ベクトルである。

パス識別モデル学習部０１３は、伝達パス特徴ベクトルｈ＿ｔｒａｉｎ（ｃ）を入力とし、伝達パスの識別モデルＭを作成する。この識別モデルＭは、伝達パス特徴ベクトルを入力とし、ラベルｃを出力とする多クラス分類器として機能する。なお、識別モデルＭは、混合ガウス分布やサポートベクトルマシン、ニューラルネットなど任意のモデルを用いることができる。

伝達パス識別部１０２／１１２の各部は、次のように動作する。
受音信号００１は伝達パス特徴抽出部００２に入力される。ここで、受音信号をｘ（ｔ）と記す。

伝達パス特徴抽出部００２は、受音信号ｘ（ｔ）から伝達パス特徴ベクトルｈを算出しパス識別部００４へ出力する。

パス識別部００４は、パス識別モデル記憶部００３格納のパス識別モデルに基づき、伝達パスを識別し、伝達パスの識別結果を出力する。この識別結果が前述の伝達パスラベルｄとなる。

以上説明したように、本実施形態のパターン認識装置１００は、音響信号の伝達パスを識別し、パターン認識に用いるモデルを切り替える。そのため、異なる伝達パスが含まれるような環境においても頑健にパターン認識が可能となる。つまり、伝達パスの影響に頑健で、より高い精度でのパターン認識精度を実現できる。

なお、上記した説明では、パターン認識装置１００には、伝達パス識別部１０２やモデル学習部１０３は含まれないものとして説明したが、パターン認識装置１００が、伝達パス識別部１０２やモデル学習部１０３を備えていてもよい。このような構成を採ることで、パターン認識装置１００の検出結果をさらに、学習データとして学習を行い、モデルを更新することが可能となる。

［第２の実施形態］
次に、上記第１の実施形態におけるモデルの切替を省略可能とした本発明の第２実施形態に係るパターン認識装置２００について、図４を用いて説明する。

図４は、本発明の第２の実施形態のパターン認識装置の構成を示す図である。図４を参照すると、伝達パス特徴抽出部２０２と、モデル学習部２０３と、モデル記憶部２０４とを含む学習信号からパターン認識用のモデルを作成する構成と、このモデルを用いてパターン認識を行うパターン認識装置２００（破線内参照）とを含む構成が示されている。以下、伝達パス特徴抽出部２０２と、モデル学習部２０３と、モデル記憶部２０４とを含む学習信号からパターン認識用のモデルを作成する構成を「学習部」ともいう。

パターン認識装置２００は、伝達パス特徴抽出部２１２と、パターン認識部２１３と、モデル記憶部２０４とを含んで構成されている。

学習信号２０１は、パターン認識用のモデルを作成するための音響信号であり、伝達パス特徴抽出部２０２と、モデル学習部２０３とにそれぞれ入力される。学習信号１０１は、ｘ＿ｔｒａｉｎ（ｔ，ｎ）と表すことができる。

伝達パス特徴抽出部２０２は、学習信号ｘ＿ｔｒａｉｎ（ｔ，ｎ）の伝達パス特徴ベクトルｈ＿ｔｒａｉｎを算出し、モデル学習部２０３に出力する。

モデル学習部２０３は、学習信号ｘ＿ｔｒａｉｎ（ｔ，ｎ）に加えてｈ＿ｔｒａｉｎを用いてパターン認識用のモデルＰを作成する。

モデル学習部２０３は、ｘ＿ｔｒａｉｎ（ｔ，ｎ）のみでなく、伝達パス特徴ベクトルｈ＿ｔｒａｉｎをパターン認識用のモデルの作成のための特徴量として用いるため、ｘ＿ｔｒａｉｎ（ｔ，ｎ）の伝達パスの情報も考慮したモデルを作成することができる。モデル記憶部２０４は、モデル学習部２０３が作成したモデルＰを作成する。

第２の実施形態におけるｈ＿ｔｒａｉｎを用いたモデルＰは、次のように作成できる。例えば、学習信号ｘ＿ｔｒａｉｎ（ｔ，ｎ）から得られた特徴ベクトルｇに対して、連結したベクトル［ｇ，ｈ］を新たな特徴ベクトルとしてモデルＰを作成することで、伝達パス特徴ベクトルｈ＿ｔｒａｉｎを考慮したモデルを作成することができる。また、上記の方法に代えて、伝達パス特徴ベクトルｈ＿ｔｒａｉｎを学習信号ｘ＿ｔｒａｉｎの事前分布や条件付き分布パラメータとしてモデルＰを作成してもよい。

続いて、上記したモデルを用いてパターン認識を行うパターン認識装置２００の各部の動作について説明する。

受音信号２１１は、伝達パス特徴抽出部２１２とパターン認識部２１３にそれぞれ入力される。以下、受音信号２１１をｘ（ｔ）とも記す。

伝達パス特徴抽出部２１２は、伝達パス特徴抽出部ｘ（ｔ）の伝達パス特徴ベクトルｈを算出し、パターン認識部２１３に出力する。

パターン認識部２１３は、受音信号ｘ（ｔ）と伝達パス特徴ベクトルｈを入力としてｘ（ｔ）に関するパターン認識を行い結果を出力する。

以上のとおり、本実施形態では、音響信号の伝達パス特徴ベクトルを補助特徴量として用い、パターン認識用のモデルを作成する。そのため、異なる伝達パスが含まれるような環境においても頑健にパターン認識が可能となる。つまり、伝達パスの影響に頑健で、より高い精度でのパターン認識精度を実現できる。

［第３の実施形態］
次に、伝達パス特徴ベクトルｈをモデルの補正に用いるように構成した本発明の第３の実施形態のパターン認識装置３００について、図５を用いて説明する。

図５は、本発明の第３の実施形態のパターン認識装置の構成を示す図である。図５を参照すると、モデル記憶部３０３と、伝達パス特徴抽出部３０２と、モデル補正部３０４と、補正後のモデルを用いてパターン認識を行うパターン認識部３０５とを備えたパターン認識装置３００が示されている。なお、図５では、第１、第２の実施形態における学習部に相当する構成は、省略しているが、学習信号を入力として、モデル記憶部３０３に記憶するモデルを作成するモデル学習部が備えられていてもよい。

受音信号３０１は、伝達パス特徴抽出部３０２と、パターン認識部３０５に入力される。以下、受音信号３０１をｘ（ｔ）とも記す。

伝達パス特徴抽出部３０２は、受音信号ｘ（ｔ）の伝達パス特徴ベクトルｈを算出し、モデル補正部３０４に入力する。

モデル補正部３０４は、モデル記憶部３０３に記憶されているモデルＰを、伝達パス特徴ベクトルｈに基づき補正し、補正したモデルＰ＿ｎｅｗを出力する。伝達パス特徴ベクトルｈは、伝達パスによる信号の周波数特性変化を表す特徴である。
受音信号ｘ（ｔ）のパターン認識を行う場合、受音信号ｘ（ｔ）には伝達パスの影響が含まれる。換言すると、受音信号ｘ（ｔ）は、パターン認識時に特徴量空間上にて伝達パス特徴ベクトルｈに相当するズレが生じている。そのため、モデル補正部３０４ではモデルＰをそのズレの分だけ補正する。以下、モデルＰで用いるｘ（ｔ）に関する音響特徴量が周波数スペクトルである場合を例としてその原理を説明する。

受音信号ｘ（ｔ）のフーリエ変換をＦ（ｘ（ｔ））とすると、下記［数２］（再掲）は、フーリエ変換の定義より、［数３］のように書き換えられる。
［数２］

［数３］

つまり、特徴量空間において、受音信号ｘ（ｔ）は、Ｆ（ｈ）分だけズレが生じているといえる。そのため、モデルＰのパラメータに対してＦ（ｈ）分の線形変換を加えることで、モデルＰを補正し、ズレを除去したモデルＰ＿ｎｅｗを得ることができる。

パターン認識部３０５は、受音信号ｘ（ｔ）を入力として、補正後のモデルＰ＿ｎｅｗに基づきｘ（ｔ）に関するパターン認識を行い、結果を出力する。

ここで、モデル記憶部３０３が格納するモデルＰは、伝達特性ｈの影響がないような学習信号を用いて、つまり音源信号ｓ（ｔ）を用いて学習されたものである。ここで、モデルＰの作成に用いた学習信号にすでに何らかの伝達パス特性ｈ２が加わっている場合には、伝達パス特性ｈ２の特性とｈの特性の差分、つまりＦ（ｈ）－Ｆ（ｈ２）を用いてモデルＰを補正することで新たなモデルＰ＿ｎｅｗを得る。

以上のとおり、本実施形態では、音響信号の伝達パス特徴ベクトルｈを用いて、モデルＰを補正する。そのため、異なる伝達パスが含まれるような環境においても頑健にパターン認識が可能となる。つまり、伝達パスの影響に頑健で、より高い精度でのパターン認識精度を実現できる。

［第４の実施形態］
次に、伝達パス特徴ベクトルｈを用いて入力信号を補正するように構成した本発明の第４の実施形態のパターン認識装置４００について、図６を用いて説明する。

図６は、本発明の第４の実施形態のパターン認識装置の構成を示す図である。図６を参照すると、伝達パス特徴抽出部４０２と、入力信号補正部４０３と、モデル学習部４０４と、モデル記憶部４０５とを含む学習信号からパターン認識用のモデルを作成する構成と、このモデルを用いてパターン認識を行うパターン認識装置４００（破線内参照）とを含む構成が示されている。以下、伝達パス特徴抽出部４０２と、入力信号補正部４０３と、モデル学習部４０４と、モデル記憶部４０５とを含む学習信号からパターン認識用のモデルを作成する構成を「学習部」ともいう。

パターン認識装置４００は、伝達パス特徴抽出部４１２と、入力信号補正部４０３と、パターン認識部４１４と、モデル記憶部４０５とを含んで構成されている。

学習信号４０１は、後段のパターン認識用のモデルを作成するための音響信号である。以下、学習信号４０１を、ｘ＿ｔｒａｉｎ（ｔ，ｎ）とも記す。

伝達パス特徴抽出部４０２は、学習信号ｘ＿ｔｒａｉｎ（ｔ，ｎ）の伝達パス特徴ベクトルｈ＿ｔｒａｉｎを算出し、入力信号補正部４０３に出力する。

入力信号補正部４０３は、学習信号ｘ＿ｔｒａｉｎ（ｔ，ｎ）を伝達パス特徴ベクトルｈ＿ｔｒａｉｎに基づき補正し、新たな信号ｘ＿ｔｒａｉｎ＿ｎｅｗ（ｔ，ｎ）を出力する。前述の受音信号ｘ（ｔ）と同様に、学習信号ｘ＿ｔｒａｉｎ（ｔ，ｎ）は、次式［数４］で表され、ｈ＿ｔｒａｉｎによって周波数特性の変化が生じている。
［数４］

そのため、学習信号ｘ＿ｔｒａｉｎ（ｔ，ｎ）に対して、伝達パス特徴ベクトルｈ＿ｔｒａｉｎと逆の特性となるような逆フィルタを乗算することにより、その変化を打ち消すことができる。ＦＩＲフィルタの逆フィルタについては、任意の方法を用いてよい。また補正は、周波数領域で表してもよく、畳み込み項は積として、下記［数５］により表される。

［数５］

ここで、伝達パス特徴ベクトルｈ＿ｔｒａｉｎの逆の逆フィルタを（ｈ＿ｔｒａｉｎ）^－１、Ｆ（ｈ＿ｔｒａｉｎ）の逆特性をＦ（ｈ＿ｔｒａｉｎ）^－１として表現すると、［数５］は［数６］のように書き換えられる。

［数６］

補正後の学習信号である上記［数６］のｘ＿ｔｒａｉｎ＿ｎｅｗ（ｔ，ｎ）は、モデル学習部４０４に出力される。

モデル学習部４０４は、補正後の学習信号ｘ＿ｔｒａｉｎ＿ｎｅｗ（ｔ，ｎ）を用いてモデルＰを作成する。モデル学習部４０４は、学習信号ｘ＿ｔｒａｉｎ（ｔ，ｎ）の伝達パス特徴ベクトルｈ＿ｔｒａｉｎによる周波数特性変化を打ち消した信号であるｘ＿ｔｒａｉｎ＿ｎｅｗを用いてモデルを作成する。このため、伝達パスの影響に左右されずにモデルを作成することができる。

モデル記憶部４０５は、モデル学習部４０４が出力したモデルＰを記憶する。このモデルＰｈａ，音響信号の伝達パス特徴ベクトルｈ＿ｔｒａｉｎを用いて補正した学習信号を用いて作成されてい。このため、異なる伝達パスが含まれるような学習信号を用いても伝達パスの影響に左右されないモデルを作成できる。

続いて、上記したモデルを用いてパターン認識を行うパターン認識装置４００の各部の動作について説明する。受音信号４１１は、伝達パス特徴抽出部４１２と入力信号補正部４１３にそれぞれ入力される。以下、受音信号４１１をｘ（ｔ）とも記す。

伝達パス特徴抽出部４１２及び入力信号補正部４１３は、伝達パス特徴抽出部４０２、入力信号補正部４０３と同様にして、受音信号ｘ（ｔ）を補正し、パターン認識部４１４に補正後の受音信号ｘ＿ｎｅｗ（ｔ）を出力する。パターン認識部４１４は、補正後の受音信号ｘ＿ｎｅｗ（ｔ）を入力としてｘ＿ｎｅｗ（ｔ）に関するパターン認識を行い、結果を出力する。上記パターン認識部４１４では、上記モデルの作成過程と同様に、音響信号の伝達パス特徴ベクトルを用いて補正した信号に対してパターン認識処理を行う。このため、異なる伝達パスが含まれるような信号に対しても伝達パスの影響に左右されずパターン認識ができる。

前述したとおり、本実施形態では、本実施形態では、パターン認識用のモデルの作成過程においても、音響信号の伝達パス特徴ベクトルを用いて補正した学習信号を用いてモデルを学習する。このため、異なる伝達パスが含まれるような学習信号を用いても伝達パスの影響に左右されないパターン認識を実施できる。

また、音響信号の伝達パス特徴ベクトルを用いて補正した信号に対してパターン認識処理を行うため、異なる伝達パスが含まれるような信号に対しても伝達パスの影響に左右されずパターン認識ができる。

つまり、本実施形態の構成もまた、伝達パスの影響に頑健で、より高い精度でのパターン認識精度を実現できるものとなっている。

［第５の実施形態］
次に、本発明の第５の実施形態のパターン認識装置５００について、図７を用いて説明する。

図７は、本発明の第５の実施形態のパターン認識装置の構成を示す図である。図７を参照すると、伝達パス特徴抽出部５０２と、入力信号補正部５０３と、モデル学習部５０４と、モデル記憶部５０５とを含む学習信号からパターン認識用のモデルを作成する構成と、このモデルを用いてパターン認識を行うパターン認識装置５００（破線内参照）とを含む構成が示されている。以下、伝達パス特徴抽出部５０２と、入力信号補正部５０３と、モデル学習部５０４と、モデル記憶部５０５とを含む学習信号からパターン認識用のモデルを作成する構成を「学習部」ともいう。

この第５の実施形態は、上記第１～第４の実施形態の構成をすべて組み合わせたものである。具体的には、学習部では、伝達パス特徴ベクトルを用いた入力信号の補正と、モデルの補正が行われる。また、このモデルは、伝達パス特徴ベクトルから把握される伝達パスによって伝達パスごとに作成され、それぞれが伝達パス特徴ベクトルを特徴量として含んでいる。

パターン認識装置５００の動作も上記を組み合わせたものであり、パターン認識装置５００は、伝達パス特徴ベクトルから把握される伝達パスによって伝達パスに対応するモデルを選択する。そして、パターン認識装置５００は、伝達パス特徴ベクトルを用いた受音信号の補正と、モデルの補正が行った後で、伝達パス特徴ベクトルを含んだパターン認識を行う。

以上のような第１～第４を任意に組み合わせた構成を採ることで、より頑健なパターン認識を実施することが可能となる。なお、上記した第５の実施形態の説明では、上記第１～第４の実施形態の構成をすべて組み合わせるものとして説明したが、これらのすべてを組み合わせる必要はない。例えば、第１の実施形態と、第２～第４の実施形態のいずれか１～２つを組み合わせてもよい。同様に、第２の実施形態と、第３～第４の実施形態のいずれか１～２つを組み合わせてもよい。第３、第４の実施形態についても同様に、他の実施形態の１～３つを組み合わせることが可能である。

［第６の実施形態］
次に、本発明の第６実施形態の統合型のパターン認識装置６００について、図８を用いて説明する。

図８は、本発明の第６の実施形態のパターン認識装置の構成を示す図である。図８を参照すると、パターン認識装置６０２と並列に第２の伝達パス識別部６０３を配置し、それぞれの出力が情報統合部６０４に入力される構成が示されている。

受音信号６０１は、パターン認識装置６０２、第２の伝達パス識別部６０３に入力される。以下、受音信号６０１をｘ（ｔ）とも記す。

パターン認識装置６０２としては、上記第１から第５の実施形態を含む任意のパターン認識装置を用いることができる。従って、パターン認識装置６０２は、受音信号ｘ（ｔ）に関するパターン認識を行い、認識結果ｎを出力する。認識結果ｎは例えば「音声」や「音楽」など音響信号のパターンを表す。

第２の伝達パス識別部６０３は受音信号ｘ（ｔ）の伝達パスを識別し、識別結果（ラベル）ｃを出力する。この識別結果ｃは例えば「木材」や「金属」などｘ（ｔ）がどのような伝達パスを通って受音されたかを示す。なお、パターン認識装置６０２側に、モデル切替用のための伝達パス識別部が備えられている場合、その伝達パス識別部を第２の伝達パス識別部６０３として用いることができる。

情報統合部６０４では、上記認識結果ｎと識別結果ｃとを入力とし、統合した情報を出力する。たとえば「空気中を伝播した音声」や、「木材を伝播した音楽」などである。

ここで、情報統合した結果により、後段においてさらに処理を加えてもよい。例えば木材の壁で遮られた２つの部屋Ａ、Ｂを想定し、部屋Ａにおいて動作している音声検出装置の前段として統合型パターン認識装置６００を配置することを考える。この場合、統合型パターン認識装置６００はｎ＝｛音声、その他｝、ｃ＝｛空気、木材｝というパターン認識を行うことになる。その場合、情報統合部６０４の出力は、「空気中を伝播した音声」、「木材を伝播した音声」、などがあり得る。ここで、部屋Ａに設置された統合型パターン認識装置６００の設置目的が、部屋Ａ内部の人間の音声検出であった場合、部屋の仕切りを構成する木材や金属を介して伝わる部屋Ｂ内部の人間の音声は検出の対象から外れる情報となる。そうした場合、受音信号ｘ（ｔ）が音声であったとしても、情報統合部６０４の出力結果を利用して、その伝達パスによりパターン認識の対象から外したり、逆に、部屋Ａで検出された音声についてパターン認識を行うなどのより細かい粒度によるパターン識別が可能となる。

以上、説明したとおり、本実施形態では、音響信号の伝達パスを識別した結果を、音響信号のパターン認識結果と統合することにより、より細かい粒度のパターン識別を実現できる。

［第７の実施形態］
また、この第６の実施形態の構成に、図３にて説明した識別モデル学習部に相当する構成を追加することも可能である。図９は、本発明の第６の実施形態のパターン認識装置の変形構成を示す図である。図９を参照すると、上段の学習部に相当する部分及び情報統合部７１８が組み込まれたパターン認識装置７００の下段に、識別モデル学習部を構成する、伝達パス特徴抽出部７２２、パス識別モデル学習部７２３及びパス識別モデル記憶部７２４が追加されている。これらは、第１の実施形態の説明したものと同様であるもので、説明を省略する。

パターン認識装置７００の方は、図７に示した第５の実施形態の構成に、伝達パス特徴抽出部７１４及び（第２の）伝達パス識別部７１５を追加し、その後段に情報統合部７１８を配置した構成となっている。この構成は、パターン認識部７１７からの出力と、伝達パス識別部７１５からの出力とが情報統合部７１８に入力され、情報統合部７１８が統合した判断を行う第６の実施形態に相当するものである。従って、図９の構成は、第６の実施形態の構成に、別途、モデル学習部を構成する、伝達パス特徴抽出部７２２、パス識別モデル学習部７２３及びパス識別モデル記憶部７２４を追加したものとなる。これらの要素は、上記した核実施形態で説明済みであるので、説明を省略する。

［第８の実施形態］
続いて上記第１、第５、第６、第７の実施形態の伝達パス識別部においてモデルを用いずに伝達パスを特定できるようにした第８の実施形態を説明する。図１０は、本発明の第８の実施形態の伝達パス識別部の構成を示すブロック図である。図１０を参照すると、本発明の第８の実施形態の伝達パス識別部８００は、複数のセンサ８１０１と８１０２（以降、センサ１、センサ２とも記す）と、特徴量算出部８２０１と、伝達パス判断部８２０２とを含む。

これらの手段はそれぞれ概略つぎのように動作する。複数のセンサ８１０１と８１０２は、一定の間隔をあけて固定され、それぞれ受信した信号の情報を得る。固定の方法の一例は、図１１に示すように壁に沿ってセンサ８１０１、８１０２を配置するものである。本実施形態では、センサ８１０１、８１０２の出力はデジタル量の時系列信号として扱うことができるものとする。

特徴量算出部８２０１は、センサ８１０１、８１０２で受信した信号から、一定時間周期ごとに、信号の到来、伝達に要した空間パスを表現する特徴量を算出する。

伝達パス判断部８２０２は、前記特徴量を用いて、センサ８１０１、８１０２に入力されている信号が、空気中を伝搬してきたものか、あるいは固体中を伝搬してきたものかを判定し、判断結果８４０１を出力する。

次に、図１０～１６を参照して、本実施形態の全体の動作について詳細に説明する。はじめに、本実施形態の伝達パス識別部が識別する対象とする２つの事象、空気中を伝搬する音と固体中を伝搬する音について、図１１から図１６を用いて説明する。空気中を伝播してくる音とは、図１１に示すように、音源８３００とセンサ８１０１およびセンサ８１０２の間に空気が介在して伝わるものである。この場合、図１３に示すように、音源８３００からセンサ１８１０１に到達する音響パスとしては直接音である音響パス１－１の他に、反射音である音響パス１－２、音響パス１－３、音響パス１－４など複数の音響パスが存在する。この場合、受信点となるセンサ１ではこれらの音響パスを通った音が混じった形で観測されることが通例である。同様に、図１４に示すように、音源８３００からセンサ２８１０２に到達する音響パスも、同様に観測される。

これに対して、固体を伝播してくる音とは、図１２に示すように固体、この場合は壁を例としているが、この固体に接して音源８３００が存在する。この場合、図１５に示すように、音源８３００からセンサ１８１０１に到達する音響パスとしては直接音である音響パスだけが存在し、反射音は存在しない。同様に、図１６に示すように、音源８３００からセンサ２８１０２に到達する音響パスも、同様に観測される。

ここではセンサ１８１０１とセンサ２８１０２には、マイクロフォンを用いる。特徴量算出部８２０１は、センサ８１０１とセンサ８１０２から入力される信号のクロススペクトルを逐次計算する。すなわち、センサ８１０１の信号系列ｘ１（ｔ）とセンサ８１０２の信号系列ｘ２（ｔ）について、それぞれのフーリエ変換をＸ１（ｆ），Ｘ２（ｆ）と置き、Ｘ２（ｆ）の複素共役をＸ２＊（ｆ）とすれば、ある時刻におけるクロススペクトルＷ（ｆ）は、Ｗ（ｆ）＝（Ｘ１（ｆ）Ｘ２＊（ｆ））として計算することができる。

このクロススペクトルそのもの、あるいはクロススペクトルの形状を適切な形状のフィルタで切り出したものが、音源８３００からセンサ１８１０１へのパスとセンサ２８１０２へのパスの伝達関数の類似度の逆、すなわち差異を表す。

ここでクロススペクトルを計算する際にノルム正規化を行うことにより、音の大きさへの依存性を除去することも可能である。

この差異を逆フーリエ変換することで、複数のセンサ８１０１、８１０２の間の相互相関関数を得る。ここでは、この相互相関関数を特徴量として出力する。

次に、伝達パス判断部８２０２の動作について説明する。もしも特徴量算出部８２０１が生成した相互相関関数が単一のピークを持つ場合は、複数のセンサ８１０１、８１０２の間に時間遅れの関係しか存在しないことは明らかである。この場合、反射波による影響は存在しないので、伝達パス判断部８２０２は固体中を伝搬してきた音であると判断し、判断結果８４０１として出力する。

一方、特徴量算出部８２０１が生成した相互相関関数が複数のピークを持つ場合は、複数のセンサ８１０１、８１０２の間に時間遅れ以外の関係が存在することから、反射波による影響が存在するので、伝達パス判断部８２０２は空気中を伝搬してきた音であると判断し、判断結果８４０１として出力する。

ここではセンサ数を２であるとして説明したが、センサ数を３以上とし、それぞれの間で判断を行い、多数決または論理和あるいは論理積を取って判断を行っても良く、それによって推定精度を高めることが可能である。

また、受信した信号がある一定以上のパワーを持っている時だけ、伝達パス判断部８２０２が動作しても良い。それによってパワーの小さい信号ひいてはＳ／Ｎ比の小さい条件下で発生する誤りを低減することも可能となる。

なお、上記した実施形態では典型的に伝達経路を空気中と固体中としたが、空気中は反射の存在する典型的な経路であり、固体中は反射の無い典型的な経路である範囲で、他の媒質としてもかまわない。例えば、空気中は、窒素などの気体、水などの液体で代えることができる。また固体中は、十分に粘性の高いゲル状の物体などで代えることができる。

次に、本実施形態の効果について説明する。本実施形態によれば、複数のセンサを用いて信号の伝達パスを推定するため、受信点だけの情報があれば伝達パスの推定が可能であり、送信側あるいは伝達経路に関する情報を用いたモデルは必要ではない。換言すると、本実施形態は、特別な空間内キャリブレーションを必要とせず通常の運用で範囲が計算できるため、設置コストを低減することができるという利点もある。

［第９の実施形態］
続いて、上記伝達パスの判定精度をより向上できるようにした第９の実施形態について図面を参照して詳細に説明する。図１７は、本発明の第９の実施形態の構成を示すブロック図である。図１７を参照すると、本発明の第９の実施形態の伝達パス識別部８１００Ａは、第８の実施形態の構成に加えて、蓄積部８２０３、範囲決定部８２０４及び判断モデル８２０５を有する。その他の構成は第１の実施形態と同様であるので、以下、その相違点を中心に説明する。

蓄積部８２０３は、特徴量算出部８２０１が過去において算出した特徴量を一定期間蓄積する。蓄積部８２０３における特徴量の蓄積期間は、例えば複数のセンサ８１０１、８１０２を設置して以来といった長期間のものでも良いが、典型的には例えば過去１日間の特徴量を蓄積するものでもよい。以下、本実施形態では、蓄積部８２０３は、１フレームの長さを１秒間とし、重なりの無い１日分の８６４００フレームを蓄積するものとして説明する。

範囲決定部８２０４は、蓄積部８２０３が蓄積した全フレームの特徴量を、特徴量空間にマップする。図１８は、範囲決定部８２０４による特徴量のマッピングの例を示す。図１８の例では、４４フレームのみを記載しているが、蓄積されたフレーム数が変わっても同様である。

ここで、図１８は、該当特徴量に幾つのフレームが該当するかを数値で表現した、２つの相互相関関数を変数とした２次元ヒストグラム（ヒートマップとも言う。）である。図１８の例では、３７フレームがほぼ同一の特徴量を持ち、残るフレームはそれぞれ異なる特徴量を持つ。ここで、多数のフレームが同一の特徴量を持つということは、特徴量の分散が小さく遅延項のみで構成されていることであるから、図１８で点線の円で示した範囲を、固体中を伝搬経路とする特徴量の範囲であると決定することができる。一方、その他の領域は特徴量の分散が大きいということであるから、それ以外の範囲を、空気中を伝搬経路とする特徴量の範囲であると決定することができる。ここで多数のフレームである条件としては、予め定められた閾値Ｄを超えた点全てを取るという条件を採用することができる。もちろん、閾値Ｄを超えたという条件の代わりに最大値を取る特徴量としても良い。また範囲の円の半径εは、雑音により影響を受ける範囲を想定して小さな値を予め決めることができる。

判断モデル８２０５は、このようにして得られた範囲の情報を判断モデルとして保存したものである。従って、上記した範囲決定部８２０４は、判断モデル作成部と言い換えることもできる。

なお、上記した蓄積部８２０３は、伝達パス識別部を構成するコンピュータの記憶装置を用いて構成することができる。同様に、判断モデル８２０５も、伝達パス識別部を構成するコンピュータの記憶装置に保存させることができる。

伝達パス判断部８２０２は、特徴量算出部８２０１が出力した特徴量の値を、前記判断モデル（パス識別モデル）８２０５に保存された範囲の情報と比較して、該当特徴量が空気中の伝搬経路であるか固体中の伝搬経路であるかを決定し、該当判断結果８４０１を判断出力として出力する。

次に、本実施形態の効果について説明する。本実施形態では、過去の情報を用いて判断を行うことができるため、設置した環境に応じて最適な判定を行い、その精度を向上させることが可能である。なお、上記した実施形態では、過去１日間の特徴量を蓄積し、判断モデル（パス識別モデル）８２０５を作成するものとして説明したが、蓄積した特徴量をさまざまな観点で層別し、複数の判断モデル（パス識別モデル）を作成してもよい。例えば、伝達パス識別部が設置される環境が時刻や季節によって環境が変わるというような場合には、当該時刻を含む時間帯、該当する季節に得られた特徴量を用いて判断モデルを作成し、その判断モデルを用いて判定を行うこともできる。

上記した第８、第９の実施形態の伝達パス識別部を用いることにより、空気中伝播と固体中伝播の２種類の伝播方法を従来よりも精度高く識別できるようになる。このような伝達パス識別部を採用することにより、第１、第５、第６の実施形態において、空気中、固体中といった性質の異なる伝達パスの違いを判定することが可能となり、より頑健なパターン認識を実施することが可能となる。

以上、本発明の各実施形態を説明したが、本発明は、上記した実施形態に限定されるものではなく、本発明の基本的技術的思想を逸脱しない範囲で、更なる変形・置換・調整を加えることができる。例えば、各図面に示した装置構成、各要素の構成は、本発明の理解を助けるための一例であり、これらの図面に示した構成に限定されるものではない。また、以下の説明において、「Ａ及び／又はＢ」は、Ａ及びＢの少なくともいずれかという意味で用いる。

たとえば、上記した実施形態では、主として入力信号が音響信号であることを想定して説明したが、入力信号の例はこれに限られない。例えば、振動センサから得られる時系列振動信号など、空間中を伝播し伝わり、その伝達パスにより特性が変化するような信号にも本発明を適用することが可能である．当然に、系列データには等間隔の系列データのみでなく不等間隔の系列データも含まれる．

本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。また、それぞれの実施形態に含まれる別々の特徴を如何様に組み合わせたシステムまたは装置も、本発明の範疇に含まれる。

また、本発明は、複数の機器から構成されるシステムに適用されてもよいし、単体の装置に適用されてもよい。さらに、本発明は、実施形態の機能を実現する情報処理プログラムが、システムあるいは装置に直接あるいは遠隔から供給される場合にも適用可能である。したがって、本発明の機能をコンピュータで実現するために、コンピュータにインストールされるプログラム、あるいはそのプログラムを格納した媒体、そのプログラムをダウンロードさせるＷＷＷ（ＷｏｒｌｄＷｉｄｅＷｅｂ）サーバも、本発明の範疇に含まれる。特に、少なくとも、上述した実施形態に含まれる処理ステップをコンピュータに実行させるプログラムを格納した非一時的コンピュータ可読媒体（ｎｏｎ－ｔｒａｎｓｉｔｏｒｙｃｏｍｐｕｔｅｒｒｅａｄａｂｌｅｍｅｄｉｕｍ）は本発明の範疇に含まれる。

また、上記した第１～第９の実施形態に示した手順は、パターン認識装置や伝達パス識別部として機能するコンピュータ（図１９の９０００）に、これらの装置としての機能を実現させるプログラムにより実現可能である。このようなコンピュータは、図１９のＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）９０１０、通信インタフェース９０２０、メモリ９０３０、補助記憶装置９０４０を備える構成に例示される。すなわち、図１９のＣＰＵ９０１０にて、パターン認識プログラムや伝達パス特徴抽出プログラムを実行し、その補助記憶装置９０４０等に保持された各計算パラメータの更新処理を実施させればよい。

即ち、上記した第１～第９の実施形態に示したパターン認識装置や伝達パス識別部の各部（処理手段、機能）は、これらの装置に搭載されたプロセッサに、そのハードウェアを用いて、上記した各処理を実行させるコンピュータプログラムにより実現することができる。

最後に、本発明の好ましい形態を要約する。

［第１の形態］
（上記第１の視点によるパターン認識装置参照）

［第２の形態］
上記したパターン認識装置において、前記モデルは、少なくとも２以上の異なる伝達パス毎に、前記伝達パスを介して観測された信号を用いて作成される複数のモデルであり、
さらに、
入力信号の特徴量から伝達パスを識別する伝達パス識別部を含み、
前記パターン認識部は、
前記複数のモデルから前記識別した伝達パスに対応するモデルを選択して入力信号のパターン認識を行う構成を採ることができる。

［第３の形態］
前記モデルは、学習用信号の伝達パスの特徴を表す伝達パス特徴ベクトルを含む、前記学習用信号を用いて作成されたモデルであり、
上記したパターン認識装置は、さらに、
入力信号の伝達パスの特徴を表す伝達パス特徴ベクトルを計算する伝達パス特徴ベクトル抽出部を含み、
前記パターン認識部は、前記モデルを用いて、入力信号の特徴に加え、前記入力信号から計算した伝達パス特徴ベクトルを用いて、入力信号のパターン認識を行う構成を採ることができる。

［第４の形態］
上記したパターン認識装置は、さらに、
入力信号の伝達パスの特徴を表す伝達パス特徴ベクトルを計算する伝達パス特徴ベクトル抽出部と、
前記伝達パス特徴ベクトルを用いて、前記モデルを補正するモデル補正部とを含み、
前記パターン認識部は、前記補正後のモデルを用いて、入力信号のパターン認識を行う構成を採ることができる。

［第５の形態］
上記したパターン認識装置は、さらに、
前記伝達パス特徴ベクトルを用いて、前記入力信号を補正する入力信号補正部とを含み、
前記パターン認識部は、前記補正後の入力信号を用いて、パターン認識を行う構成を採ることができる。

［第６の形態］
上記したパターン認識装置は、さらに、
入力信号の特徴量から伝達パスを識別する第２の伝達パス識別部と、
前記パターン認識部の出力と、前記第２の伝達パス識別部の出力とを統合して、認識結果を出力する情報統合部と、を含む構成を採ることができる。

［第７の形態］
上記したパターン認識装置に入力される入力信号が音響信号であり、少なくとも前記伝達パスが空気中か固体中かを識別してパターン認識を行う構成を採ることができる。

［第８の形態］
上記したパターン認識装置において、
前記伝達パス識別部及び前記第２のパス識別部の少なくとも一方が、
複数のセンサのセンサ出力信号から特徴量を計算する特徴量算出部と、
該当特徴量に対応して伝搬パスを判断する伝搬パス判断部と、
を含んで構成されている構成を採ることができる。

［第９の形態］
（上記第２の視点によるパターン認識方法参照）

［第１０の形態］
（上記第３の視点によるプログラム参照）
なお、上記第９～第１０の形態は、第１の形態と同様に、第２～第８の形態に展開することが可能である。

なお、上記の特許文献および非特許文献の各開示を、本書に引用をもって繰り込むものとする。本発明の全開示（請求の範囲を含む）の枠内において、さらにその基本的技術思想に基づいて、実施形態ないし実施例の変更・調整が可能である。また、本発明の開示の枠内において種々の開示要素（各請求項の各要素、各実施形態ないし実施例の各要素、各図面の各要素等を含む）の多様な組み合わせ、ないし選択（又は削除）が可能である。すなわち、本発明は、請求の範囲を含む全開示、技術的思想にしたがって当業者であればなし得るであろう各種変形、修正を含むことは勿論である。特に、本書に記載した数値範囲については、当該範囲内に含まれる任意の数値ないし小範囲が、別段の記載のない場合でも具体的に記載されているものと解釈されるべきである。

００１、１１１、２１１、３０１、４１１、５１１、６０１、７１１受音信号
００２、０１２、２０２、２１２、３０２、４０２、４１２，５０２、５１２、７０２、７１２、７１４、７２２伝達パス特徴抽出部
００３、７２４パス識別モデル記憶部
００４パス識別部
０１１パス学習用信号とそのラベルの組
０１３、７２３パス識別モデル学習部
１００、２００、３００、４００、５００、６０２、９００パターン認識装置
１０１、２０１、４０１、５０１、７０１学習信号
００４、１０２、１１２、６０３、７１５、８００、８１００Ａ伝達パス識別部
１０３、２０３、４０４、５０４、７０４モデル学習部
１０４、２０４、３０３、４０５、５０５、７０５、９０１モデル記憶部
１１３モデル切替部
１１４、２１４、３０５、４１４、５１５、７１７、９０２パターン認識部
３０４モデル補正部
４０３、４１３、５０３、５１３、７０３、７１３入力信号補正部
５１４、７１６モデル補正・切替部
６００統合型パターン認識装置
６０４、７１８情報統合部
７２１パス学習信号
８１０１、８１０２センサ
８２０１特徴量算出部
８２０２伝達パス判断部
８２０３蓄積部
８２０４範囲決定部
８２０５判断モデル
８３００音源
８３０１壁
８４０１判断結果
９０００コンピュータ
９０１０ＣＰＵ
９０２０通信インタフェース
９０３０メモリ
９０４０補助記憶装置

Claims

学習用信号に加えて、該学習用信号の伝達パスの違いを示す伝達パス情報を用いて作成されたモデルを記憶するモデル記憶部と、
前記モデルを用いて、入力信号と、該入力信号の伝達パスの違いを示す伝達パス情報とを入力として、入力信号のパターン認識を行うパターン認識部と、
入力信号の特徴量から伝達パスを識別する伝達パス識別部と、
前記パターン認識部の出力と、前記伝達パス識別部の出力とを統合して、認識結果を出力する情報統合部と、
を含むパターン認識装置。
前記モデルは、少なくとも２以上の異なる伝達パス毎に、前記伝達パスを介して観測された信号を用いて作成される複数のモデルであり、
さらに、
入力信号の特徴量から伝達パスを識別する第２の伝達パス識別部を含み、
前記パターン認識部は、
前記複数のモデルから前記第２の伝達パス識別部で識別した伝達パスに対応するモデルを選択して入力信号のパターン認識を行う請求項１のパターン認識装置。
前記モデルは、学習用信号の伝達パスの特徴を表す伝達パス特徴ベクトルを含む、前記学習用信号を用いて作成されたモデルであり、
さらに、
入力信号の伝達パスの特徴を表す伝達パス特徴ベクトルを計算する伝達パス特徴ベクトル抽出部を含み、
前記パターン認識部は、前記モデルを用いて、入力信号の特徴に加え、前記入力信号から計算した伝達パス特徴ベクトルを用いて、入力信号のパターン認識を行う請求項１又は２のパターン認識装置。
さらに、
入力信号の伝達パスの特徴を表す伝達パス特徴ベクトルを計算する伝達パス特徴ベクトル抽出部と、
前記伝達パス特徴ベクトルを用いて、前記モデルを補正するモデル補正部とを含み、
前記パターン認識部は、前記補正後のモデルを用いて、入力信号のパターン認識を行う請求項１又は２のパターン認識装置。
さらに、
前記伝達パス特徴ベクトルを用いて、前記入力信号を補正する入力信号補正部とを含み、
前記パターン認識部は、前記補正後の入力信号を用いて、パターン認識を行う請求項４のパターン認識装置。
さらに、
入力信号の伝達パスの特徴を表す伝達パス特徴ベクトルを計算する伝達パス特徴ベクトル抽出部と、
前記伝達パス特徴ベクトルを用いて、前記入力信号を補正する入力信号補正部とを含み、
前記パターン認識部は、前記補正後の入力信号を用いて、パターン認識を行う請求項１又は２のパターン認識装置。
前記入力信号が音響信号であり、少なくとも前記伝達パスが空気中か固体中かを識別してパターン認識を行う請求項１から６いずれか一のパターン認識装置。
前記伝達パス識別部及び前記第２の伝達パス識別部の少なくとも一方が、
複数のセンサのセンサ出力信号から特徴量を計算する特徴量算出部と、
当該特徴量に対応して伝達パスを判断する伝達パス判断部と、
を含んで構成されている請求項２のパターン認識装置。
学習用信号に加えて、該学習用信号の伝達パスの違いを示す伝達パス情報を用いて作成されたモデルを記憶するモデル記憶部を備えるコンピュータがパターンを認識するパターン認識方法であって、
入力信号と、該入力信号の伝達パスの違いを示す伝達パス情報とを入力するステップと、
前記モデルを用いて、前記入力信号と、前記伝達パス情報とを入力として、入力信号のパターン認識を行うステップと、
入力信号の特徴量から伝達パスを識別するステップと、
前記入力信号のパターン認識を行った認識結果と、前記伝達パスを識別した識別結果とを統合して情報を出力するステップと、
を含むパターン認識方法。