WO2019171580A1

WO2019171580A1 - 信号源識別装置、信号源識別方法、プログラム

Info

Publication number: WO2019171580A1
Application number: PCT/JP2018/009234
Authority: WO
Inventors: 玲史近藤; 裕三仙田
Original assignee: 日本電気株式会社
Priority date: 2018-03-09
Filing date: 2018-03-09
Publication date: 2019-09-12
Also published as: JPWO2019171580A1; JP7075064B2; US20200395002A1; US11626102B2

Abstract

信号源識別装置は、複数のセンサにより受信した信号に基づいて、信号の発生源からの当該信号が伝達する経路に応じた特徴量を算出する特徴量算出部と、前記特徴量算出部が算出した特徴量に基づいて予め決定される、所定の信号源からの信号に基づく特徴量が属する範囲である識別範囲を用いて、前記特徴量算出部が算出した特徴量が前記所定の信号源からの信号であるか否かを識別する識別部と、を有する。

Description

信号源識別装置、信号源識別方法、プログラム

　本発明は、信号源識別装置、信号源識別方法、イベント検知装置、イベント検知方法、音声認識装置、音声認識方法、プログラムに関する。

　音波や電波などの各種波動・振動などによる信号を受信した際に、信号発生の原因となるイベントを識別するための検知技術が知られている。

　このような技術の一つとして、非特許文献１がある。非特許文献１には、発音された音源の音に基づいて、音源の原因となる音響イベントを識別する音響イベント検知技術が記載されている。具体的には、非特許文献１には、音響イベントに対応する音をあらかじめ学習しておき、検知時に入力信号の統計的な特性が学習済みの特性と一致することで識別を行う、という技術が記載されている。

　また、非特許文献１に記載されている技術に関連する技術として、例えば、特許文献１がある。特許文献１には、音源の位置を推定する音響信号処理装置が記載されている。特許文献１によると、音響信号処理装置は、算出手段と、推定手段と、を有している。例えば、算出手段は、受音した受音信号に基づいて、特徴量を算出する。また、推定手段は、算出手段が算出した特徴量と予め定められた代表値との距離に基づいて特徴量モデルを選択する。そして、推定手段は、選択した特徴量モデルに対応する位置候補を音源の位置として推定する。また、特許文献１には、音源位置の推定を統計的な手法に基づいて行う方法が記載されている。

特開２００８－７９２５６号公報

T. Komatsu, Y. Senda and R. Kondo, "Acoustic event detection based on non-negative matrix factorization with mixtures of local dictionaries and activation aggregation," 2016 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), Shanghai, 2016, pp. 2259-2263.

　受信した信号に基づいて算出される特徴量は、信号の周波数特性に応じて広がりを有している。一方、特許文献１や非特許文献１に記載の技術の場合、周波数特性に応じた広がりをうまく考慮することが出来ないおそれがあった。その結果、例えば、予め定められた信号源からの出力を判別したい場合に、望ましい検出結果を得ることが出来ないおそれがあった。

　以上のように、受信した信号が予め定められた信号源から出力された信号であるか否か判別することが難しい、という課題が生じていた。

　そこで、本発明の目的は、予め定められた信号源から出力された信号であるか否か判別することが難しい、という課題を解決する信号源識別装置、信号源識別方法、イベント検知装置、イベント検知方法、音声認識装置、音声認識方法、プログラムを提供することにある。

　かかる目的を達成するため本発明の一形態である信号源識別装置は、
　複数のセンサにより受信した信号に基づいて、信号の発生源からの当該信号が伝達する経路に応じた特徴量を算出する特徴量算出部と、
　前記特徴量算出部が算出した特徴量に基づいて予め決定される、所定の信号源からの信号に基づく特徴量が属する範囲である識別範囲を用いて、前記特徴量算出部が算出した特徴量が前記所定の信号源からの信号であるか否かを識別する識別部と、
　を有する
　という構成をとる。

　また、本発明の他の形態である信号源識別方法は、
　信号源識別装置が、
　複数のセンサにより受信した信号に基づいて、信号の発生源からの当該信号が伝達する経路に応じた特徴量を算出し、
　算出した特徴量に基づいて予め決定される、所定の信号源からの信号に基づく特徴量が属する範囲である識別範囲を用いて、算出した特徴量が前記所定の信号源からの信号であるか否かを識別する
　という構成をとる。

　また、本発明の他の形態であるプログラムは、
　信号源識別装置に、
　複数のセンサにより受信した信号に基づいて、信号の発生源からの当該信号が伝達する経路に応じた特徴量を算出する特徴量算出部と、
　前記特徴量算出部が算出した特徴量に基づいて予め決定される、所定の信号源からの信号に基づく特徴量が属する範囲である識別範囲を用いて、前記特徴量算出部が算出した特徴量が前記所定の信号源からの信号であるか否かを識別する識別部と、
　を実現させるためのプログラムである。

　また、本発明の他の形態であるイベント検知装置は、
　複数のセンサにより受信した信号に基づいて、信号の発生源からの当該信号が伝達する経路に応じた特徴量を算出する特徴量算出部と、
　前記特徴量算出部が算出した特徴量に基づいて予め決定される、所定の信号源からの信号に基づく特徴量が属する範囲である識別範囲を用いて、前記特徴量算出部が算出した特徴量が前記所定の信号源からの信号であるか否かを識別する識別部と、
　センサにより受信した信号に基づいて、イベントを検知するイベント検知部と、
　前記イベント検知部による検知結果を前記信号源識別装置による識別結果に基づいて修正する修正部と、
　を有する
　という構成をとる。

　また、本発明の他の形態であるイベント検知装置は、
　複数のセンサにより受信した信号に基づいて、信号の発生源からの当該信号が伝達する経路に応じた特徴量を算出する特徴量算出部と、
　前記特徴量算出部が算出した特徴量に基づいて予め決定される、所定の信号源からの信号に基づく特徴量が属する範囲である識別範囲を用いて、前記特徴量算出部が算出した特徴量が前記所定の信号源からの信号であるか否かを識別する識別部と、
　センサにより受信した信号に基づいて、イベントを検知するイベント検知部と、
　を有し、
　前記イベント検知部は、前記信号源識別装置による識別結果に基づいて、前記イベントを検知する際に用いる閾値を変更する
　という構成をとる。

　また、本発明の他の形態であるイベント検知方法は、
　イベント検知装置が、
　複数のセンサにより受信した信号に基づいて、信号の発生源からの当該信号が伝達する経路に応じた特徴量を算出し、
　算出した特徴量に基づいて予め決定される、所定の信号源からの信号に基づく特徴量が属する範囲である識別範囲を用いて、算出した特徴量が前記所定の信号源からの信号であるか否かを識別し、
　センサにより受信した信号に基づいて、イベントを検知し、
　前記イベントの検知結果を前記識別の結果に基づいて修正する、
　という構成をとる。

　また、本発明の他の形態であるプログラムは、
　イベント検知装置に、
　複数のセンサにより受信した信号に基づいて、信号の発生源からの当該信号が伝達する経路に応じた特徴量を算出する特徴量算出部と、
　前記特徴量算出部が算出した特徴量に基づいて予め決定される、所定の信号源からの信号に基づく特徴量が属する範囲である識別範囲を用いて、前記特徴量算出部が算出した特徴量が前記所定の信号源からの信号であるか否かを識別する識別部と、
　センサにより受信した信号に基づいて、イベントを検知するイベント検知部と、
　前記イベント検知部による検知結果を前記識別部による識別結果に基づいて修正する修正部と、
　を実現するためのプログラムである。

　また、本発明の他の形態である音声認識装置は、
　複数のセンサにより受信した信号に基づいて、信号の発生源からの当該信号が伝達する経路に応じた特徴量を算出する特徴量算出部と、
　前記特徴量算出部が算出した特徴量に基づいて予め決定される、所定の信号源からの信号に基づく特徴量が属する範囲である識別範囲を用いて、前記特徴量算出部が算出した特徴量が前記所定の信号源からの信号であるか否かを識別する識別部と、
　センサであるマイクロフォンにより受信した音響信号に基づいて、音声認識を行う音声認識部と、
　前記音声認識部による認識結果を前記信号源識別装置による識別結果に基づいて修正する修正部と、
　を有する
　という構成をとる。

　また、本発明の他の形態である音声認識方法は、
　音声認識装置が、
　複数のセンサにより受信した信号に基づいて、信号の発生源からの当該信号が伝達する経路に応じた特徴量を算出し、
　算出した特徴量に基づいて予め決定される、所定の信号源からの信号に基づく特徴量が属する範囲である識別範囲を用いて、算出した特徴量が前記所定の信号源からの信号であるか否かを識別し、
　センサであるマイクロフォンにより受信した音響信号に基づいて、音声認識を行い、
　音声認識の結果を前記識別の結果に基づいて修正する
　という構成をとる。

　また、本発明の他の形態であるプログラムは、
　音声認識装置に、
　複数のセンサにより受信した信号に基づいて、信号の発生源からの当該信号が伝達する経路に応じた特徴量を算出する特徴量算出部と、
　前記特徴量算出部が算出した特徴量に基づいて予め決定される、所定の信号源からの信号に基づく特徴量が属する範囲である識別範囲を用いて、前記特徴量算出部が算出した特徴量が前記所定の信号源からの信号であるか否かを識別する識別部と、
　センサであるマイクロフォンにより受信した音響信号に基づいて、音声認識を行う音声認識部と、
　前記音声認識部による認識結果を前記識別部による識別結果に基づいて修正する修正部と、
　を実現するためのプログラムである。

　本発明は、以上のように構成されることにより、予め固定された信号源から出力された信号であるか否か判別することが難しい、という課題を解決する信号源識別装置、信号源識別方法、イベント検知装置、イベント検知方法、音声認識装置、音声認識方法、プログラムを提供することが可能となる。

本発明の第１の実施形態にかかる固定信号源識別装置の構成の一例を示す図である。固定信号源とセンサとの関係の一例を示す図である。固定信号源と別のセンサとの関係の一例を示す図である。移動信号源とセンサとの関係の一例を示す図である。特徴量空間内にマップされた、特徴量ストアに記録された集合の要素の存在分布の一例を示す図である。固定信号源出力範囲決定部が決定する識別範囲の一例を示す図である。固定信号源出力信号識別部の動作を説明するための図である。固定信号源識別装置のうちの学習部に相当する各構成の動作の一例を示すフローチャートである。固定信号源識別装置のうちの識別部に相当する各構成の動作の一例を示すフローチャートである。本発明の第２の実施形態にかかる固定スピーカー識別装置の構成の一例を示す図である。固定スピーカーとマイクロフォンとの関係の一例を示す図である。固定スピーカーと別のマイクロフォンとの関係の一例を示す図である。音響イベントとマイクロフォンとの関係の一例を示す図である。特徴量空間内にマップされた、特徴量ストアに記録された集合の要素の存在分布の一例を示す図である。固定スピーカー発音範囲決定部が決定する識別範囲の一例を示す図である。固定スピーカー発音識別部の動作を説明するための図である。固定スピーカー識別装置のうちの発音範囲学習部に相当する各構成の動作の一例を示すフローチャートである。固定スピーカー識別装置のうちの発音識別部に相当する各構成の動作の一例を示すフローチャートである。本発明の第３の実施形態にかかる固定スピーカー識別装置の構成の一例を示す図である。本発明の第４の実施形態にかかる固定スピーカー識別装置の構成の一例を示す図である。本発明の第５の実施形態にかかる固定スピーカー識別装置の構成の一例を示す図である。本発明の第６の実施形態にかかる音響イベント検知装置の構成の一例を示す図である。本発明の第７の実施形態にかかる音響イベント検知装置の構成の一例を示す図である。本発明の第８の実施形態にかかる音響イベント検知装置の構成の一例を示す図である。本発明の第９の実施形態にかかる音声認識装置の構成の一例を示す図である。本発明の第１０の実施形態にかかる信号源識別装置の構成の一例を示す図である。本発明の第１０の実施形態にかかるイベント検知装置の構成の一例を示す図である。本発明の第１０の実施形態にかかる音声認識装置の構成の一例を示す図である。

［第１の実施形態］
　本発明の第１の実施形態を図１から図９までを参照して説明する。図１は、固定信号源識別装置０００の構成の一例を示す図である。図２は、固定信号源０２１とセンサ００１との関係の一例を示す図である。図３は、固定信号源０２１とセンサ００２との関係の一例を示す図である。図４は、移動信号源０２２とセンサ００１との関係の一例を示す図である。図５は、特徴量空間内にマップされた、特徴量ストア００４に記録された集合の要素の存在分布の一例を示す図である。図６は、固定信号源出力範囲決定部００６が決定する識別範囲の一例を示す図である。図７は、固定信号源出力信号識別部００８の動作を説明するための図である。図８は、固定信号源識別装置０００のうちの学習部に相当する各構成の動作の一例を示すフローチャートである。図９は、固定信号源識別装置０００のうちの識別部に相当する各構成の動作の一例を示すフローチャートである。

　第１の実施形態では、受信した信号が固定信号源０２１からの信号であるか否かを識別する固定信号源識別装置０００について説明する。後述するように、固定信号源識別装置０００は、複数のセンサ（センサ００１、センサ００２）を用いて、信号の伝達する経路の異なりに依存する識別範囲を学習する。また、固定信号源識別装置０００は、受信した信号に基づいて算出する特徴量が、学習した識別範囲内に属するか否か確認する。そして、固定信号源識別装置０００は、確認の結果に基づいて、受信した出力が固定信号源０２１からの出力であるか否かを識別する。

　固定信号源識別装置０００は、受信した信号が固定信号源０２１からの信号であるか否かを識別する情報処理装置である。固定信号源識別装置０００は、ある程度の時間、設置位置が固定された固定信号源０２１（例えば、テレビや放送用スピーカーなど）からの信号を受信するともに、固定信号源０２１以外の移動信号源０２２からの信号を受信する。そして、固定信号源識別装置０００は、受信した信号が固定信号源０２１からの信号であるか否かを識別する。

　図１は、固定信号源識別装置０００の構成の一例を示している。図１を参照すると、固定信号源識別装置０００は、センサ００１と、センサ００２と、特徴量算出部００３と、特徴量ストア００４と、教師ラベル生成部００５と、固定信号源出力範囲決定部００６と、判別範囲ＤＢ（DataBase）００７と、固定信号源出力信号識別部００８と、を有している。

　固定信号源識別装置０００は、例えば、図示しないＣＰＵなどの演算装置と、記憶装置と、を有している。例えば、固定信号源識別装置０００は、図示しない記憶装置に格納されたプログラムを演算装置が実行することで、上述した各処理部を実現する。

　なお、固定信号源識別装置０００が有する各構成のうち、センサ００１と、センサ００２と、特徴量算出部００３と、特徴量ストア００４と、教師ラベル生成部００５と、固定信号源出力範囲決定部００６と、判別範囲ＤＢ００７とは、学習部を構成している。学習部は、固定信号源０２１が出力した信号である固定信号源出力信号の範囲（識別範囲）を決定する。以降において、まず、固定信号源識別装置０００が有する各構成のうち、学習部に含まれる構成について説明する。

　センサ００１、センサ００２は、一定の間隔をあけて、固定信号源識別装置０００、又は、固定信号源識別装置０００の周辺に固定されている。センサ００１、センサ００２は、固定信号源０２１が出力する信号を受信可能なよう構成されており、それぞれ受信した信号の情報を得る。なお、固定信号源０２１が出力する信号とは、例えば、音波、電波、振動、などがある。本実施例では、センサ００１、センサ００２からの出力はディジタル量の時系列信号として扱うことができるものとする。上記出力の扱いは、例えば、Ａ／Ｄ（Analog/Digital）変換を行うことなどにより実現できる。

　センサ００１、センサ００２は、上述したように、一定の間隔をあけて固定されている。そのため、固定信号源０２１から出力された信号のセンサ００１に到達するまでの経路と、固定信号源０２１から出力された信号のセンサ００２に到達するまでの経路と、は異なるものとなる。

　図２、図３は、信号が直進または鏡面反射する空間における信号の経路の一例を示している。具体的には、図２は、固定信号源０２１とセンサ００１との関係の一例を示しており、図３は、固定信号源０２１とセンサ００２との関係の一例を示している。図２を参照すると、固定信号源０２１から出力された信号は、複数の経路を通ってセンサ００１に到達する。そのため、センサ００１で観測できる信号は、固定信号源０２１の出力する信号に該当空間における経路に依存した伝達関数を畳み込んだものとして表現できる。また、図３で示すように、センサ００２についても同様に、固定信号源０２１から出力された信号は、複数の経路を通ってセンサ００２に到達する。なお、上述したように、センサ００１とセンサ００２とは、一定の間隔をもって設置されている。そのため、図２、図３で示すように、固定信号源０２１からセンサ００１までの信号の経路と、固定信号源０２１からセンサ００２までの信号の経路とには、それぞれの設置位置に応じた異なりが生じる。

　特徴量算出部００３は、センサ００１、センサ００２で受信した信号に基づいて、一定時間周期ごとに信号の到来伝達に要した空間経路を表現する特徴量を算出する。

　例えば、特徴量算出部００３は、センサ００１とセンサ００２のクロススペクトルを計算する。すなわち、センサ００１の信号系列x1(t)とセンサ００２の信号系列x2(t)について、それぞれのフーリエ変換をX1(f), X2(f)と置き、X2(f)の複素共役をX2*(f)とすれば、ある時刻におけるクロススペクトルW(f)はW(f)=X1(f) X2*(f))として計算することができる。換言すると、特徴量算出部００３は、クロススペクトルW(f)=X1(f) X2*(f))を計算することで、センサ００１とセンサ００２のクロススペクトルを算出する。特徴量算出部００３による算出結果であるクロススペクトルそのもの、あるいはクロススペクトルの形状を適切な形状のフィルタで切り出したものが、固定信号源０２１からセンサ００１への経路とセンサ００２への経路の伝達関数の類似度の逆、すなわち差異を表すことになる。

　特徴量算出部００３が上記のように特徴量を算出した場合、上述したように、特徴量は信号の到来伝達に要した空間経路を表現する。ここで、図４で示すように、固定信号源０２１とは異なる位置に存在する移動信号源０２２を考える。この場合、移動信号源０２２からセンサ００１までの信号の経路は、固定信号源０２１からセンサ００１までの信号経路と異なるものとなる。また、移動信号源０２２からセンサ００２までの信号の経路も同様に、固定信号源０２１からセンサ００２までの信号経路と異なるものとなる。従って、特徴量算出部００３が算出するクロススペクトルの形状も、固定信号源０２１から受信した信号に基づいて算出した値と、移動信号源０２２から受信した信号に基づいて算出した値と、で異なるものとなる。

　なお、特徴量算出部００３は、クロススペクトルを計算する際にノルム正規化を行うことが出来る。ノルム正規化を行うことで、特徴量算出部００３は、信号の大きさへの依存性を除去することが出来る。

　特徴量ストア００４は、メモリやディスク装置などの記憶装置である。特徴量ストア００４は、特徴量算出部００３が算出した特徴量を記録する。また、特徴量ストア００４は、後述する教師ラベル生成部００５の出力するラベルを、該当する特徴量と結び付けて記録する。換言すると、特徴量ストア００４は、特徴量算出部００３が算出した特徴量と、教師ラベル生成部００５が生成した特徴量のラベルと、を関連付けて集合として記録する。

　教師ラベル生成部００５は、特徴量に該当する時刻において、固定信号源０２１からの出力があったか否かを示すラベルを生成する。教師ラベル生成部００５によるラベルの生成は、手動で行っても構わないし、自動で行っても構わない。本実施形態の場合、教師ラベル生成部００５は、例えば、手動の入力に応じてラベルを生成する。

　固定信号源出力範囲決定部００６は、特徴量ストア００４に記録された特徴量ならびにラベルの集合から、固定信号源０２１から出力された信号を判別するための識別範囲を示す識別範囲情報を決定する。

　例えば、固定信号源出力範囲決定部００６は、特徴量ストア００４に記録された特徴量とラベルの集合を入力として、集合の各要素を特徴量空間内にマップする。この様子を二次元で模式図として表現したものが図５である。そして、固定信号源出力範囲決定部００６は、識別器を学習して、図６に点線で示すように識別範囲を決定する。固定信号源出力範囲決定部００６は、例えば、固定信号源０２１からの出力があった旨を示すラベルと対応する要素（特徴量）が識別範囲の中に入る一方で、固定信号源０２１以外からの出力があった旨を示すラベルと対応する要素（特徴量）が識別範囲の中に入らないように、識別範囲を決定する。図６の場合、点線で囲われる斜めのハッチで示す範囲が、固定信号源０２１から出力された信号であると識別する範囲である識別範囲となる。ここで、識別器としてはＧＭＭ（Gaussian Mixture Model）（ガウシアン混合モデル）、ＤＮＮ（Deep Neural Network）（ディープニューラルネットワーク）、ＳＶＭ（support vector machine）（サポートベクターマシン）など一般的な識別器を用いることが出来る。例えば、固定信号源出力範囲決定部００６は、識別器としてＳＶＭを用いる。

　なお、固定信号源出力範囲決定部００６が決定する識別範囲の数は、一つに限定されない。固定信号源出力範囲決定部００６は、一つの識別範囲を決定しても構わないし、複数の識別範囲を決定しても構わない。

　判別範囲ＤＢ００７は、固定信号源出力範囲決定部００６が決定した識別範囲を記録する。上述したように、固定信号源出力範囲決定部００６が決定する識別範囲の数は、一つに限定されない。判別範囲ＤＢ００７は、固定信号源出力範囲決定部００６の決定に応じた数の識別範囲を記録する。

　以上が、学習部に含まれる構成の一例である。

　また、固定信号源識別装置０００が有する各構成のうち、センサ００１と、センサ００２と、特徴量算出部００３と、判別範囲ＤＢ００７と、固定信号源出力信号識別部００８とは、識別部を構成している。識別部は、学習部が決定した識別範囲を用いて、受信した出力が固定信号源０２１からの出力であるか否かを識別する。続いて、固定信号源識別装置０００が有する各構成のうち、識別部に含まれる構成について説明する。

　センサ００１、センサ００２、特徴量算出部００３、判別範囲ＤＢ００７の構成は、上述した学習部において既に説明した。そのため、詳細な説明は省略する。

　固定信号源出力信号識別部００８は、判別範囲ＤＢ００７に記録された識別範囲を用いて、特徴量算出部００３が算出した特徴量に対応する信号が固定信号源０２１の出力した信号であるか否かを識別する。そして、固定信号源出力信号識別部００８は、識別した結果である識別結果を出力する。固定信号源出力信号識別部００８による出力は、例えば、外部装置への送信であっても構わないし、表示装置に対する識別結果の表示であっても構わない。固定信号源出力信号識別部００８は、上記例示した以外の方法により出力を行っても構わない。

　例えば、固定信号源出力信号識別部００８は、特徴量算出部００３が算出した特徴量が判別範囲ＤＢ００７に格納された識別範囲に該当するか否かを検定する。例えば、図７です示す例において、特徴量空間上で▲印で示される特徴量が入力されたとする。▲印で示される特徴量は、図７で示すように、識別範囲内に属している。そのため、固定信号源出力信号識別部００８は、特徴量に対応する信号は固定信号源出力信号であると識別する。つまり、固定信号源出力信号識別部００８による該当時刻の識別結果は、固定信号源出力信号である、となる。また、例えば、図７です示す例において、特徴量空間上で■印で示される特徴量が入力されたとする。■印で示される特徴量は、図７で示すように、識別範囲内に属していない。そのため、固定信号源出力信号識別部００８は、特徴量に対応する信号は固定信号源出力信号でないと識別する。つまり、固定信号源出力信号識別部００８による該当時刻の識別結果は、固定信号源出力信号でない、となる。

　以上が、識別部に含まれる構成の一例である。

　固定信号源識別装置０００は、上述した学習部と識別部に相当する構成を有している。固定信号源識別装置０００は、学習部により学習した識別範囲を用いて、識別部により信号の識別を行うことになる。なお、固定信号源識別装置０００は、１つの情報処理装置により構成されても構わないし、複数の情報処理装置により構成されても構わない。固定信号源識別装置０００は、例えば、学習部に相当する構成を有する装置と、識別部に相当する構成を有する装置と、の２つの装置により構成されても構わない。

　続いて、図８、図９を参照して、固定信号源識別装置０００の動作の一例について説明する。まず、図８を参照して、固定信号源識別装置０００のうちの学習部に相当する各構成の動作の一例について説明する。なお、学習部による学習は、例えば、識別部による識別に先立ってあらかじめ行われる。

　図８を参照すると、特徴量算出部００３は、センサ００１、センサ００２が受信した信号に基づいて、特徴量を算出する（ステップＳ１０１）。例えば、特徴量算出部００３は、特徴量として、センサ００１とセンサ００２のクロススペクトルを算出する。なお、特徴量算出部００３は、クロススペクトルを計算する際にノルム正規化を行っても構わない。

　特徴量ストア００４は、特徴量算出部００３が算出した特徴量と、教師ラベル生成部００５が生成した特徴量のラベルと、を関連付けて集合として記録する（ステップＳ１０２）。教師ラベル生成部００５によるラベルの生成は、例えば、手動により行われる。

　固定信号源出力範囲決定部００６は、特徴量ストア００４に記録された特徴量とラベルの集合を入力として、集合の各要素を特徴量空間内にマップする。そして、固定信号源出力範囲決定部００６は、識別器を学習して、図６に点線で示すように識別範囲を決定する（ステップＳ１０３）。

　判別範囲ＤＢ００７は、固定信号源出力範囲決定部００６により決定された識別範囲を記録する（ステップＳ１０４）。判別範囲ＤＢ００７が記録する識別範囲は、一つだけでなく、複数でも構わない。

　以上が、固定信号源識別装置０００のうちの学習部に相当する各構成の動作の一例である。続いて、図９を参照して、固定信号源識別装置０００のうちの識別部に相当する各構成の動作の一例について説明する。図９で示す例では、判別範囲ＤＢ００７には学習部においてあらかじめ学習した結果である識別範囲が格納されているものとする。

　図９を参照すると、特徴量算出部００３は、センサ００１、センサ００２が受信した信号に基づいて、特徴量を算出する（ステップＳ２０１）。例えば、特徴量算出部００３は、特徴量として、センサ００１とセンサ００２のクロススペクトルを算出する。なお、特徴量算出部００３は、クロススペクトルを計算する際にノルム正規化を行っても構わない。

　固定信号源出力信号識別部００８は、特徴量算出部００３が算出した特徴量が判別範囲ＤＢ００７に格納された識別範囲に該当するか否かを検定する（ステップＳ２０２）。

　特徴量算出部００３が算出した特徴量が判別範囲ＤＢ００７に格納された識別範囲内である場合（ステップＳ２０２、Ｙｅｓ）、固定信号源出力信号識別部００８は、特徴量に対応する信号は固定信号源出力信号であると識別する（ステップＳ２０３）。一方、特徴量算出部００３が算出した特徴量が判別範囲ＤＢ００７に格納された識別範囲内でない場合（ステップＳ２０２、Ｎｏ）、固定信号源出力信号識別部００８は、特徴量に対応する信号は固定信号源出力信号でないと識別する（ステップＳ２０４）。

　固定信号源出力信号識別部００８は、識別した結果である識別結果を出力する（ステップＳ２０５）。例えば、固定信号源出力信号識別部００８は、時系列の識別結果を出力する。

　このように、本実施形態における固定信号源識別装置０００は、固定信号源出力範囲決定部００６を含む学習部と、識別部と、を有している。このような構成により、学習部の固定信号源出力範囲決定部００６は、固定信号源０２１から出力された信号を判別する際に用いる識別範囲を決定することが出来る。そして、識別部は、決定した識別範囲を用いて、受信した信号が、固定信号源０２１が出力したものであるか否か識別することが出来る。つまり、本実施形態における固定信号源識別装置０００によると、複数のセンサ（センサ００１、センサ００２）を用いて信号の伝達する経路の異なりに依存する識別範囲を学習することが出来る。これにより、信号の周波数特性に依存せず、安定して固定信号源０２１から出力された信号であるか否かを検知することが可能となる。換言すると、予め固定された信号源である固定信号源０２１から出力された信号であることを容易に検知することが可能となる。特に、本実施形態における固定信号源識別装置０００によると、特別な空間内キャリブレーションを必要とせず通常の運用で識別範囲が計算できる。そのため、設置コストが低減できる。

　なお、本実施形態においては、識別部による識別処理に先立ってあらかじめ学習部による学習処理（識別範囲の決定）を行うとした。より具体的には、学習部はあらかじめ学習を行うが、学習部による学習は固定信号源出力信号識別部００８による識別時点よりも未来でなければよい。換言すると、固定信号源出力信号識別部００８による識別を行う際に、判別範囲ＤＢ００７に識別範囲が格納されていればよい。そのため、学習部と識別部を常に同時に動かしながら、現在（例えば、固定信号源出力信号識別部００８による識別時点）よりも過去の時間範囲Ｌを対象に学習し、判別範囲ＤＢ００７を常に更新し続ける運用も可能である。

　なお、あらかじめ決められた時間範囲Ｌは、例えば１日間とすることができる。時間範囲Ｌを長くとることで、検出の安定性が向上する。一方、時間範囲Ｌを短くすることで固定信号源０２１や信号が反射する反射体の移動への追従性が向上する。同様の理由で、時間範囲Ｌの間のデータを全て用いるのではなく、忘却係数τを導入して最近のデータほど大きな重みをかけて計算することも可能である。例えば、特徴量に時間に応じた重み付けを行うことで、より直近の特徴量が識別範囲の決定により影響するよう構成することが出来る。

　また、本実施形態においては、入力として、センサ００１、センサ００２の二つを用いるとした。しかしながら、固定信号源識別装置０００が有するセンサの数は、２つに限定されない。固定信号源識別装置０００は複数のセンサを有することが出来る。例えば、固定信号源識別装置０００は、４個のセンサを用いて取り合える６個の組み合わせのそれぞれの相互相関関数を並べたスーパーベクトルとして、６倍の次元数を持つ特徴量ベクトルとして扱うことが可能である。特に、センサは、空間センサアレイのように三次元的に配置することで、方向に依存した誤差をより小さくすることが可能となる。なお、センサは、具体的には信号の種類に応じたものとなる。センサは、例えば、マイクロフォン、ハイドロフォン、振動センサ、温度センサなどである。

［第２の実施形態］
　次に、本発明の第２の実施形態を図１０から図１８までを参照して説明する。図１０は、固定スピーカー識別装置１００の構成の一例を示す図である。図１１は、固定スピーカー１２１とマイクロフォン１０１との関係の一例を示す図である。図１２は、固定スピーカー１２１とマイクロフォン１０２との関係の一例を示す図である。図１３は、音響イベント１２２とマイクロフォン１０１との関係の一例を示す図である。図１４は、特徴量空間内にマップされた、特徴量ストア１０４に記録された集合の要素の存在分布の一例を示す図である。図１５は、固定スピーカー発音範囲決定部１０６が決定する識別範囲の一例を示す図である。図１６は、固定スピーカー発音識別部１０８の動作を説明するための図である。図１７は、固定スピーカー識別装置１００のうちの発音範囲学習部に相当する各構成の動作の一例を示すフローチャートである。図１８は、固定スピーカー識別装置１００のうちの発音識別部に相当する各構成の動作の一例を示すフローチャートである。

　第２の実施形態では、受信した音響信号が固定スピーカー１２１からの音響信号であるか否かを識別する固定スピーカー識別装置１００について説明する。つまり、本実施形態においては、第１の実施形態で説明した固定信号源識別装置０００を具体的に音響信号に適用する場合の一例について説明する。

　固定スピーカー識別装置１００は、受信した音響信号が固定スピーカー１２１からの音響信号であるか否かを識別する情報処理装置である。固定スピーカー識別装置１００は、設置位置が固定された固定スピーカー１２１からの音響信号を受信するともに、固定スピーカー１２１以外の音響イベント１２２からの音響信号を受信する。そして、固定スピーカー識別装置１００は、受信した音響信号が固定スピーカー１２１からの音響信号であるか否かを識別する。

　図１０は、固定スピーカー識別装置１００の構成の一例を示している。図１０を参照すると、固定スピーカー識別装置１００は、マイクロフォン１０１と、マイクロフォン１０２と、特徴量算出部１０３と、特徴量ストア１０４と、教師ラベル生成部１０５と、固定スピーカー発音範囲決定部１０６と、判別範囲ＤＢ１０７と、固定スピーカー発音識別部１０８と、を有している。

　固定スピーカー識別装置１００は、例えば、図示しないＣＰＵなどの演算装置と、記憶装置と、を有している。例えば、固定スピーカー識別装置１００は、図示しない記憶装置に格納されたプログラムを演算装置が実行することで、上述した各処理部を実現する。

　なお、固定スピーカー識別装置１００が有する各構成のうち、マイクロフォン１０１と、マイクロフォン１０２と、特徴量算出部１０３と、特徴量ストア１０４と、教師ラベル生成部１０５と、固定スピーカー発音範囲決定部１０６と、判別範囲ＤＢ１０７とは、発音範囲学習部を構成している。発音範囲学習部は、固定スピーカー１２１が出力した信号である固定スピーカー発音の範囲（識別範囲）を決定する。以降において、まず、固定スピーカー識別装置１００が有する各構成のうち、発音範囲学習部に含まれる構成について説明する。

　マイクロフォン１０１、マイクロフォン１０２は、一定の間隔をあけて、固定スピーカー識別装置１００、又は、固定スピーカー識別装置１００の周辺に固定されている、センサである。マイクロフォン１０１、マイクロフォン１０２は、それぞれ受信した音の振幅情報を信号に変換する。本実施例では、マイクロフォン１０１、マイクロフォン１０２は、Ａ／Ｄ変換する機能を包含し、出力はディジタル量の時系列信号として扱うことができるものとする。

　マイクロフォン１０１、マイクロフォン１０２は、上述したように、一定の間隔をあけて固定されている。そのため、例えば、固定スピーカー１２１から出力された音響信号のマイクロフォン１０１に到達するまでの経路と、固定スピーカー１２１から出力された信号のマイクロフォン１０２に到達するまでの経路と、は異なるものとなる。

　図１１、図１２は、音響信号の経路の一例を示している。具体的には、図１１は、固定スピーカー１２１とマイクロフォン１０１との関係の一例を示しており、図１２は、固定スピーカー１２１とマイクロフォン１０２との関係の一例を示している。図１１を参照すると、固定スピーカー１２１から出力された信号は、複数の経路を通ってマイクロフォン１０１に到達する。そのため、マイクロフォン１０１で観測できる音の信号は、固定スピーカー１２１の出力する音響信号に経路に依存した伝達関数を畳み込んだものとして表現できる。音響信号の伝達には回折、屈折、拡散反射などもあるが、これらも含めてパスの合成として表現することが可能である。また、図１２で示すように、マイクロフォン１０２についても同様である。なお、上述したように、マイクロフォン１０１とマイクロフォン１０２とは、一定の間隔をもって設置されている。そのため、図１１、図１２で示すように、固定スピーカー１２１からマイクロフォン１０１までの音響信号の経路と、固定スピーカー１２１からマイクロフォン１０２までの音響信号の経路とには、それぞれの設置位置に応じた異なりが生じる。

　特徴量算出部１０３は、マイクロフォン１０１、マイクロフォン１０２で受信した音響信号に基づいて、一定時間周期ごとに音の到来に要した空間経路を表現する特徴量を算出する。

　例えば、特徴量算出部１０３は、マイクロフォン１０１とマイクロフォン１０２のクロススペクトルを計算する。特徴量算出部１０３は、例えば、第１の実施形態で説明した特徴量算出部００３と同様の方法により、クロススペクトルを算出する。なお、固定スピーカー１２１からマイクロフォン１０１への経路とマイクロフォン１０２への経路の伝達関数の類似度すなわち差異がクロススペクトルの形となるのは、第１の実施形態と同様である。

　なお、発音しているものが固定スピーカー１２１とは別の音響イベント１２２である場合、図１３に示すように、図１１、図１２の場合とは全く異なる経路を通って、音響信号はマイクロフォン１０１とマイクロフォン１０２に到達する。そのため、クロススペクトルの形状も異なるものとなる。これも、第１の実施形態と同様である。

　なお、特徴量算出部１０３は、第１の実施形態で説明した特徴量算出部００３と同様に、クロススペクトルを計算する際にノルム正規化を行うことが出来る。ノルム正規化を行うことで、特徴量算出部１０３は、音の大きさへの依存性を除去することが出来る。

　特徴量ストア１０４は、メモリやディスク装置などの記憶装置である。特徴量ストア１０４は、特徴量算出部１０３が算出した特徴量を記録する。また、特徴量ストア１０４は、後述する教師ラベル生成部１０５の出力するラベルを、該当する特徴量と結び付けて記録する。換言すると、特徴量ストア１０４は、特徴量算出部１０３が算出した特徴量と、教師ラベル生成部１０５が生成した特徴量のラベルと、を関連付けて集合として記録する。

　教師ラベル生成部１０５は、特徴量に該当する時刻において、固定スピーカー１２１からの発音があったか否かを示すラベルを生成する。教師ラベル生成部１０５によるラベルの生成は、手動で行っても構わないし、自動で行っても構わない。本実施形態の場合、教師ラベル生成部１０５は、例えば、手動の入力に応じてラベルを生成する。

　固定スピーカー発音範囲決定部１０６は、特徴量ストア１０４に記録された特徴量ならびにラベルの集合から、固定スピーカー１２１から出力された信号を判別するための識別範囲を示す識別範囲情報を決定する。

　例えば、固定スピーカー発音範囲決定部１０６は、特徴量ストア１０４に記録された特徴量とラベルの集合を入力として、集合の各要素を特徴量空間内にマップする。この様子を二次元で模式図として表現したものが図１４である。そして、固定スピーカー発音範囲決定部１０６は、識別器を学習して、図１５に点線で示すように識別範囲を決定する。固定スピーカー発音範囲決定部１０６は、例えば、固定スピーカー１２１からの出力があった旨を示すラベルと対応する要素（特徴量）が識別範囲の中に入る一方で、固定スピーカー１２１以外からの出力があった旨を示すラベルと対応する要素（特徴量）が識別範囲の中に入らないように、識別範囲を決定する。図１５の場合、点線で囲われる斜めのハッチで示す範囲が、固定スピーカー１２１から出力された信号であると識別する範囲である識別範囲となる。ここで、本実施形態においては、識別器としてＳＶＭを用いる。しかしながら、固定スピーカー発音範囲決定部１０６は、第１の実施形態で示した他の識別器を用いても構わない。

　なお、第１の実施形態で説明した固定信号源出力範囲決定部００６と同様に、固定スピーカー発音範囲決定部１０６は、一つの識別範囲を決定しても構わないし、複数の識別範囲を決定しても構わない。

　判別範囲ＤＢ１０７は、固定スピーカー発音範囲決定部１０６が決定した識別範囲を記録する。判別範囲ＤＢ１０７が記録する識別範囲は、一つでも構わないし、複数でも構わない。

　以上が、発音範囲学習部に含まれる構成の一例である。

　また、固定スピーカー識別装置１００が有する各構成のうち、マイクロフォン１０１と、マイクロフォン１０２と、特徴量算出部１０３と、判別範囲ＤＢ１０７と、固定スピーカー発音識別部１０８とは、発音識別部を構成している。発音識別部は、発音範囲学習部が決定した識別範囲を用いて、受信した音響信号が固定スピーカー１２１からの出力であるか否かを識別する。続いて、固定スピーカー識別装置１００が有する各構成のうち、発音識別部に含まれる構成について説明する。

　マイクロフォン１０１、マイクロフォン１０２、特徴量算出部１０３、判別範囲ＤＢ１０７の構成は、上述した発音範囲学習部において既に説明した。そのため、詳細な説明は省略する。

　固定スピーカー発音識別部１０８は、判別範囲ＤＢ１０７に記録された識別範囲を用いて、特徴量算出部１０３が算出した特徴量に対応する音響信号が固定スピーカー１２１の発音であるか否かを識別する。そして、固定スピーカー発音識別部１０８は、識別した結果である識別結果を出力する。固定スピーカー発音識別部１０８による出力は、例えば、外部装置への送信であっても構わないし、表示装置に対する識別結果の表示であっても構わない。固定スピーカー発音識別部１０８は、上記例示した以外の方法により出力を行っても構わない。

　例えば、固定スピーカー発音識別部１０８は、特徴量算出部１０３が算出した特徴量が判別範囲ＤＢ１０７に格納された識別範囲に該当するか否かを検定する。例えば、図１６で示す例において、特徴量空間上で▲印で示される特徴量が入力されたとする。▲印で示される特徴量は、図１６で示すように、識別範囲内に属している。そのため、固定スピーカー発音識別部１０８は、特徴量に対応する信号は固定信号源出力信号であると識別する。つまり、固定スピーカー発音識別部１０８による該当時刻の識別結果は、固定スピーカー発音である、となる。また、例えば、図１６です示す例において、特徴量空間上で■印で示される特徴量が入力されたとする。■印で示される特徴量は、図１６で示すように、識別範囲内に属していない。そのため、固定スピーカー発音識別部１０８は、特徴量に対応する信号は固定信号源出力信号でないと識別する。つまり、固定スピーカー発音識別部１０８による該当時刻の識別結果は、固定スピーカー発音でない、となる。

　以上が、発音識別部に含まれる構成の一例である。

　固定スピーカー識別装置１００は、上述した発音範囲学習部と発音識別部に相当する構成を有している。固定スピーカー識別装置１００は、発音範囲学習部により学習した識別範囲を用いて、発音識別部により音響信号の識別を行うことになる。なお、固定スピーカー識別装置１００は、１つの情報処理装置により構成されても構わないし、複数の情報処理装置により構成されても構わない。固定スピーカー識別装置１００は、例えば、発音範囲学習部に相当する構成を有する装置と、発音識別部に相当する構成を有する装置と、の２つの装置により構成されても構わない。

　続いて、図１７、図１８を参照して、固定スピーカー識別装置１００の動作の一例について説明する。まず、図１７を参照して、固定スピーカー識別装置１００のうちの発音範囲学習部に相当する各構成の動作の一例について説明する。なお、発音範囲学習部による学習は、例えば、発音識別部による識別に先立ってあらかじめ行われる。

　図１７を参照すると、特徴量算出部１０３は、マイクロフォン１０１、マイクロフォン１０２が受信した音響信号に基づいて、特徴量を算出する（ステップＳ３０１）。例えば、特徴量算出部１０３は、特徴量として、マイクロフォン１０１とマイクロフォン１０２のクロススペクトルを算出する。なお、特徴量算出部１０３は、クロススペクトルを計算する際にノルム正規化を行っても構わない。

　特徴量ストア１０４は、特徴量算出部１０３が算出した特徴量と、教師ラベル生成部１０５が生成した特徴量のラベルと、を関連付けて集合として記録する（ステップＳ３０２）。なお、教師ラベル生成部１０５によるラベルの生成は、例えば、手動により行われる。

　固定スピーカー発音範囲決定部１０６は、特徴量ストア１０４に記録された特徴量とラベルの集合を入力として、集合の各要素を特徴量空間内にマップする。そして、固定スピーカー発音範囲決定部１０６は、識別器を学習して、図１５に点線で示すように識別範囲を決定する（ステップＳ３０３）。

　判別範囲ＤＢ１０７は、固定スピーカー発音範囲決定部１０６により決定された識別範囲を記録する（ステップＳ３０４）。判別範囲ＤＢ１０７が記録する識別範囲は、一つだけでなく、複数でも構わない。

　以上が、固定スピーカー識別装置１００のうちの発音範囲学習部に相当する各構成の動作の一例である。続いて、図１８を参照して、固定スピーカー識別装置１００のうちの発音識別部に相当する各構成の動作の一例について説明する。なお、判別範囲ＤＢ１０７には、発音範囲学習部においてあらかじめ学習した結果である識別範囲が格納されているものとする。

　図１８を参照すると、特徴量算出部１０３は、マイクロフォン１０１、マイクロフォン１０２が受信した信号に基づいて、特徴量を算出する（ステップＳ４０１）。例えば、特徴量算出部１０３は、特徴量として、マイクロフォン１０１とマイクロフォン１０２のクロススペクトルを算出する。なお、特徴量算出部１０３は、クロススペクトルを計算する際にノルム正規化を行っても構わない。

　固定スピーカー発音識別部１０８は、特徴量算出部１０３が算出した特徴量が判別範囲ＤＢ００７に格納された識別範囲に該当するか否かを検定する（ステップＳ４０２）。

　特徴量算出部１０３が算出した特徴量が判別範囲ＤＢ１０７に格納された識別範囲内である場合（ステップＳ４０２、Ｙｅｓ）、固定スピーカー発音識別部１０８は、特徴量に対応する音響信号は固定スピーカーからの発音であると識別する（ステップＳ４０３）。一方、特徴量算出部１０３が算出した特徴量が判別範囲ＤＢ１０７に格納された識別範囲内でない場合（ステップＳ４０２、Ｎｏ）、固定スピーカー発音識別部１０８は、特徴量に対応する音響信号は固定スピーカーからの発音でないと識別する（ステップＳ４０４）。

　固定スピーカー発音識別部１０８は、識別した結果である識別結果を出力する（ステップＳ４０５）。例えば、固定スピーカー発音識別部１０８は、時系列の識別結果を出力する。

　このように、本実施形態における固定スピーカー識別装置１００は、固定スピーカー発音範囲決定部１０６を含む発音範囲学習部と、発音識別部と、を有している。このような構成により、発音範囲学習部の固定スピーカー発音範囲決定部１０６は、固定スピーカー１２１から出力された音響信号を判別する際に用いる識別範囲を決定することが出来る。そして、発音識別部は、決定した識別範囲を用いて、受信した音響信号が、固定スピーカー１２１が発音したものであるか否か識別することが出来る。つまり、本実施形態における固定スピーカー識別装置１００によると、複数のマイクロフォン（マイクロフォン１０１、マイクロフォン１０２）を用いて信号の伝達する経路の異なりに依存する識別範囲を学習することが出来る。これにより、信号の周波数特性に依存せず、安定して固定スピーカー１２１から出力された信号であるか否かを検知することが可能となる。特に、本実施形態における固定スピーカー識別装置１００によると、特別な空間内キャリブレーションを必要とせず通常の運用で識別範囲が計算できる。そのため、設置コストが低減できる。

　なお、本実施形態においては、発音識別部による識別処理に先立ってあらかじめ発音範囲学習部による学習処理（識別範囲の決定）を行うとした。より具体的には、発音範囲学習部はあらかじめ学習を行うが、発音範囲学習部による学習は固定スピーカー発音識別部１０８による識別時点よりも未来でなければよい。換言すると、固定スピーカー発音識別部１０８による識別を行う際に、判別範囲ＤＢ１０７に識別範囲が格納されていればよい。そのため、発音範囲学習部も常に同時に動かしながら、現在（例えば、固定スピーカー発音識別部１０８による識別時点）よりも過去の時間範囲Ｌを対象に学習し、判別範囲ＤＢ１０７を常に更新し続ける運用も可能である。

　なお、あらかじめ決められた時間範囲Ｌは、例えば１日間とすることができる。時間範囲Ｌを長くとることで、検出の安定性が向上する。一方、時間範囲Ｌを短くすることで固定信号源０２１や反射体の移動への追従性が向上する。同様の理由で、時間範囲Ｌの間のデータを全て用いるのではなく、忘却係数τを導入して最近のデータほど大きな重みをかけて計算することも可能である。

　また、本実施形態においては、入力として、マイクロフォン１０１、マイクロフォン１０２の二つを用いるとした。しかしながら、固定スピーカー識別装置１００が有するマイクロフォンの数は、２つに限定されない。固定スピーカー識別装置１００は複数のマイクロフォンを有することが出来る。例えば、固定スピーカー識別装置１００は、４個のセンサを用いて取り合える６個の組み合わせのそれぞれの相互相関関数を並べたスーパーベクトルとして、６倍の次元数を持つ特徴量ベクトルとして扱うことが可能である。特に、マイクロフォンは、空間マイクロフォンアレイのように三次元的に配置することで、方向に依存した誤差をより小さくすることが可能となる。なお、本実施形態においては、入力となるセンサとしてマイクロフォンを用いた。しかしながら、例えば、ハイドロフォン、振動センサ、温度センサなどにも同じ手段で拡張が可能である。

［第３の実施形態］
　次に、本発明の第３の実施形態について図１９を参照して説明する。図１９は、固定スピーカー識別装置２００の構成の一例を示す図である。

　第３の実施形態では、第２の実施形態において説明した固定スピーカー識別装置１００の変形例である固定スピーカー識別装置２００について説明する。固定スピーカー識別装置２００は、固定スピーカー識別装置１００と比較して、発音範囲学習部に相当する部分に変更点を有している。一方、固定スピーカー識別装置２００が有する構成のうち、発音識別部に相当する各構成は、固定スピーカー識別装置１００と同様である。

　図１９は、固定スピーカー識別装置２００の構成の一例を示している。図１９を参照すると、固定スピーカー識別装置２００は、マイクロフォン１０１と、マイクロフォン１０２と、特徴量算出部１０３と、特徴量ストア１０４と、教師ラベル生成部２０５と、固定スピーカー発音範囲決定部１０６と、判別範囲ＤＢ１０７と、固定スピーカー発音識別部１０８と、を有している。なお、図１９では、固定スピーカー識別装置１００と同様の構成については、同じ符号を付している。

　以上のように、固定スピーカー識別装置２００は、固定スピーカー識別装置１００が有する教師ラベル生成部１０５の代わりに教師ラベル生成部２０５を有している。以下、本実施形態に特徴的な構成である教師ラベル生成部２０５について説明する。

　教師ラベル生成部２０５は、入力された情報に基づいて、自動でラベルを生成する。例えば、教師ラベル生成部２０５には、図１９で示すように、マイクロフォン１０１、マイクロフォン１０２からの音響信号と、特徴量算出部１０３が算出した特徴量と、が入力される。教師ラベル生成部２０５は、入力された音響信号と特徴量とに基づいて、ラベルを生成する。

　例えば、教師ラベル生成部２０５は、マイクロフォン１０１およびマイクロフォン１０２から得られる音響信号のパワー（大きさ）を計算する。そして、教師ラベル生成部２０５は、計算した音響信号のパワーがあらかじめ決められた閾値Ａ（任意の値で構わない）よりも大きい場合、当該音響信号を有音信号とする。また、教師ラベル生成部２０５は、あらかじめ決められた時間範囲Ｌ２に含まれる有音信号の特徴量の平均値μと分散σを計算する。そして、教師ラベル生成部２０５は、特徴量が該当平均値から分散の範囲までのずれに収まっている時刻（特徴量）に対して、固定スピーカー発音であるとラベルを付与する。一方、教師ラベル生成部２０５は、該当時刻の特徴量が該当平均値から分散の範囲までのずれに収まっていない場合、固定スピーカー発音でないとラベルを付与する。なお、時間範囲Ｌ２は、任意の値で構わない。時間範囲Ｌ２は、時間範囲Ｌと同じであっても構わないし、異なっても構わない。

　以上のように、教師ラベル生成部２０５は、例えば、音の大きさ位に基づいて受信した音響信号の一部を抽出する。また、教師ラベル生成部２０５は、抽出した音響信号から算出される特徴量の平均値μと分散σを計算する。そして、教師ラベル生成部２０５は、算出した特徴量の平均値μと分散σとに基づいてラベルを付与する。

　なお、上述した教師ラベル生成部２０５を含む固定スピーカー識別装置２００は、例えば、固定スピーカー１２１であるテレビ受像器がつけっぱなしにされる一般家庭で使用することが想定される。上記のような環境の場合、マイクロフォン１０１およびマイクロフォン１０２から入力される音響信号のうち、音の鳴っている区間はほとんどがテレビの音であり、まれに居住者の発する音や、それ以外の機器の発する音が入力されるにとどまることが想定される。そのため、上述したように教師ラベル生成部２０５を構成することで、適切にラベルを付与することが出来る。なお、上記運用例はあくまで一例である。

　このように、本実施形態における固定スピーカー識別装置２００が有する教師ラベル生成部２０５には、マイクロフォン１０１、マイクロフォン１０２からの音響信号と、特徴量算出部１０３が算出した特徴量と、が入力されるよう構成されている。このような構成により、教師ラベル生成部２０５は、入力された音響信号と特徴量とに基づいて、ラベルを生成することが出来る。これにより、マイクロフォン１０１、マイクロフォン１０２から得られる情報を用いて、手動の作業に頼ることなく、固定スピーカー発音であることのラベルを付与することが可能となる。

　なお、本実施形態では、教師ラベル生成部２０５は、平均値μと分散σとに基づいてラベルを付与するとした。しかしながら、教師ラベル生成部２０５がラベルを付与する方法は、上記例示した場合に限定されない。教師ラベル生成部２０５は、例えば、あらかじめ決められた時間範囲Ｌ２に含まれる特徴量のうち、一番狭い範囲に集中する一定範囲、例えば９５％区間を計算することによって、そこに含まれるか否かでラベルを付与してもよい。また、本実施形態においても、忘却係数τを導入した重み付けを行っても構わない。

［第４の実施形態］
　次に、本発明の第４の実施形態について図２０を参照して説明する。図２０は、固定スピーカー識別装置３００の構成の一例を示す図である。

　第４の実施形態では、第２の実施形態で説明した固定スピーカー識別装置１００、第３の実施形態で説明した固定スピーカー識別装置２００、の変形例である固定スピーカー識別装置３００について説明する。固定スピーカー識別装置３００は、固定スピーカー識別装置１００や固定スピーカー識別装置２００と比較して、発音範囲学習部に相当する部分に変更点を有している。一方、固定スピーカー識別装置３００が有する構成のうち、発音識別部に相当する各構成は、固定スピーカー識別装置１００や固定スピーカー識別装置２００と同様である。

　図２０は、固定スピーカー識別装置３００の構成の一例を示している。図２０を参照すると、固定スピーカー識別装置３００は、マイクロフォン１０１と、マイクロフォン１０２と、特徴量算出部１０３と、特徴量ストア１０４と、教師ラベル生成部３０５と、固定スピーカー発音範囲決定部１０６と、判別範囲ＤＢ１０７と、固定スピーカー発音識別部１０８と、スケジューラ３０９と、を有している。なお、図２０では、固定スピーカー識別装置１００や固定スピーカー識別装置２００と同様の構成については、同じ符号を付している。

　以上のように、固定スピーカー識別装置３００は、固定スピーカー識別装置１００が有する教師ラベル生成部１０５、固定スピーカー識別装置２００が有する教師ラベル生成部２０５、の代わりに教師ラベル生成部３０５を有している。また、固定スピーカー識別装置３００は、スケジューラ３０９を有している。以下、本実施形態に特徴的な構成である教師ラベル生成部３０５とスケジューラ３０９について説明する。

　スケジューラ３０９は、内蔵時計を具備している。また、スケジューラ３０９は、固定スピーカー１２１の利用状況を示すスケジュールをあらかじめ記録している。そして、スケジューラ３０９は、スケジュールに応じた情報を教師ラベル生成部３０５に出力する。例えば、スケジューラ３０９が記録するスケジュールによると、固定スピーカー１２１が毎日午前１０時と午後３時から５分間の定時放送を行うとする。すると、スケジューラ３０９は、定時放送を行う時間の間、定時放送を行うスケジュールに該当する時間であることを、教師ラベル生成部３０５に出力する。

　教師ラベル生成部３０５は、スケジューラ３０９からの出力に基づいて、固定スピーカー発音が行われる時間であることを知る。すると、教師ラベル生成部３０５は、固定スピーカー発音が行われる時間である間、算出された特徴量に対して固定スピーカー発音であるとラベルを付与する。一方、教師ラベル生成部３０５は、固定スピーカー発音が行われる時間でない場合、算出された特徴量に対して固定スピーカー発音でないとラベルを付与する。このように、教師ラベル生成部３０５は、スケジューラ３０９からの出力に基づいてラベルを付与する。

　なお、教師ラベル生成部３０５は、ラベルを付与する際に、マイクロフォン１０１およびマイクロフォン１０２から得られる音響信号のパワーを併用しても構わない。例えば、教師ラベル生成部３０５は、音響信号のパワーと閾値Ａとの比較結果により判断される有音信号であるか否かと、スケジューラ３０９からの入力に応じた値と、の論理積をとるよう構成しても構わない。論理積をとる場合、例えば、教師ラベル生成部３０５は、音響信号のパワーが閾値Ａよりも大きな値であり、かつ、スケジューラ３０９からの出力に基づいて固定スピーカー発音が行われる時間であると判断することが出来る場合に、固定スピーカー発音であるとラベルを付与する。一方、教師ラベル生成部３０５は、音響信号のパワーが閾値Ａ以下である場合や、スケジューラ３０９からの出力に基づいて固定スピーカー発音が行われる時間でないと判断することが出来る場合、固定スピーカー発音でないとラベルを付与する。

　このように、固定スピーカー識別装置３００は、教師ラベル生成部３０５と、スケジューラ３０９と、を有している。このような構成により、教師ラベル生成部３０５は、スケジューラ３０９が記録するスケジュールに基づいて、ラベルを生成することが出来る。これにより、固定スピーカー１２１の利用パターンが明確な場合において、より確度の高い教師ラベルを付与することが可能となる。ひいては、判別範囲ＤＢの精度を向上することが可能となる。

　なお、固定スピーカー識別装置３００は、スケジューラ３０９からの情報に基づいたラベルの生成と、第２の実施形態や第３の実施形態で説明したラベルの生成方法とを併用しても構わない。例えば、固定スピーカー識別装置３００は、スケジューラ３０９からの出力に基づいて、固定スピーカー発音が行われる時間でないと判断される場合に、特徴量の平均値μと分散σに基づくラベル付与を行うよう構成することも出来る。

［第５の実施形態］
　次に、本発明の第５の実施形態について図２１を参照して説明する。図２１は、固定スピーカー識別装置４００の構成の一例を示す図である。

　第５の実施形態では、第２の実施形態で説明した固定スピーカー識別装置１００、第３の実施形態で説明した固定スピーカー識別装置２００、第４の実施形態で説明した固定スピーカー識別装置３００、の変形例である固定スピーカー識別装置４００について説明する。固定スピーカー識別装置４００は、固定スピーカー識別装置１００、固定スピーカー識別装置２００、固定スピーカー識別装置３００、と比較して、発音範囲学習部に相当する部分に変更点を有している。一方、固定スピーカー識別装置４００が有する構成のうち、発音識別部に相当する各構成は、固定スピーカー識別装置１００、固定スピーカー識別装置２００、固定スピーカー識別装置３００と同様である。

　図２１は、固定スピーカー識別装置４００の構成の一例を示している。図２１を参照すると、固定スピーカー識別装置４００は、マイクロフォン１０１と、マイクロフォン１０２と、特徴量算出部１０３と、特徴量ストア１０４と、教師ラベル生成部４０５と、固定スピーカー発音範囲決定部１０６と、判別範囲ＤＢ１０７と、固定スピーカー発音識別部１０８と、を有している。なお、図２１では、固定スピーカー識別装置１００、固定スピーカー識別装置２００、固定スピーカー識別装置３００と同様の構成については、同じ符号を付している。

　以上のように、固定スピーカー識別装置４００は、固定スピーカー識別装置１００が有する教師ラベル生成部１０５、固定スピーカー識別装置２００が有する教師ラベル生成部２０５、固定スピーカー識別装置３００が有する教師ラベル生成部３０５、の代わりに教師ラベル生成部４０５を有している。以下、本実施形態に特徴的な構成である教師ラベル生成部４０５について説明する。

　教師ラベル生成部４０５には、例えば、外部装置などから、固定スピーカー利用状況入力が入力される。教師ラベル生成部４０５は、ラベルを生成する際に、入力された固定スピーカー利用状況入力を参照する。

　ここで、固定スピーカー利用状況入力は、固定スピーカー１２１の利用状況に応じて、固定スピーカー１２１や固定スピーカー１２１を監視する装置などが生成する情報である。例えば、固定スピーカー１２１がアナウンス放送設備の固定スピーカーであるとすると、放送設備の電源スイッチあるいはPush to Talkスイッチと連動して、固定スピーカー利用状況入力が生成される。また、例えば、固定スピーカー１２１がテレビ受像機であるとすると、電源スイッチ、ミュートボタンの状況、カメラあるいは明るさセンサなどと連動して固定スピーカー利用状況入力が生成される。このように、固定スピーカー利用状況入力は、固定スピーカーの利用状況に応じて生成される。

　教師ラベル生成部４０５は、固定スピーカー利用状況入力の入力状況に基づいて、ラベルを生成する。例えば、教師ラベル生成部４０５は、固定スピーカー利用状況入力が入力された場合に、固定スピーカー発音であるとのラベルを付与する。一方、教師ラベル生成部４０５は、固定スピーカー利用状況入力が入力されていない場合、固定スピーカー発音でないとのラベルを付与する。

　なお、教師ラベル生成部４０５は、第４の実施形態で説明した場合と同様、ラベルを付与する際に、マイクロフォン１０１およびマイクロフォン１０２から得られる音響信号のパワーを併用しても構わない。例えば、教師ラベル生成部４０５は、音響信号のパワーと閾値Ａとの比較結果により判断される有音信号であるか否かと、固定スピーカー利用状況入力の有無と、の論理積をとるよう構成しても構わない。論理積をとる場合、例えば、教師ラベル生成部４０５は、音響信号のパワーが閾値Ａよりも大きな値であり、かつ、固定スピーカー利用状況入力が入力されている場合に、固定スピーカー発音であるとラベルを付与する。一方、教師ラベル生成部４０５は、音響信号のパワーが閾値Ａ以下である場合や、固定スピーカー利用状況入力の入力がない場合、固定スピーカー発音でないとラベルを付与する。

　このように、本実施形態における固定スピーカー識別装置４００が有する教師ラベル生成部４０５には、固定スピーカー利用状況入力が入力されるよう構成されている。このような構成により、教師ラベル生成部４０５は、入力された固定スピーカー利用状況入力に基づいて、ラベルを生成することが出来る。これにより、より正確な固定スピーカー１２１の利用状況を得ることが可能となり、判別範囲ＤＢ１０７の精度を向上することが可能となる。

　なお、固定スピーカー１２１が外部入力を持つ場合、キャリブレーション用の信号発生機を接続して該当固定スピーカー１２１から音を出すことができる。この場合、音を出す時間幅を正確に制御することができるので、固定スピーカー利用状況入力の信号をより正確に生成することが可能である。

　また、固定スピーカー識別装置４００は、固定スピーカー利用状況入力に基づいたラベルの生成と、第２の実施形態、第３の実施形態、第４の実施形態で説明したラベルの生成方法と、を併用しても構わない。

［第６の実施形態］
　次に、本発明の第６の実施形態について図２２を参照して説明する。図２２は、音響イベント検知装置５００の構成の一例を示す図である。

　第６の実施形態では、音響イベント１２２を検知する音響イベント検知装置５００について説明する。本実施形態で説明する音響イベント検知装置５００は、第２の実施形態を用いて説明した発音識別部に相当する構成を有している。また、音響イベント検知装置５００は、上記構成に加えて、音響イベント１２２を検知するための構成を有している。後述するように、音響イベント検知装置５００は、音響イベント１２２の検知結果と、発音識別部による識別結果と、に基づいて、最終的な検知結果を判断する。

　図２２は、音響イベント検知装置５００の構成の一例を示している。図２２を参照すると、音響イベント検知装置５００は、発音識別部５０１と、マイクロフォン５０２と、音響イベント検知部５０３と、検知結果修正部５０４と、を有している。音響イベント検知装置５００は、例えば、図示しないＣＰＵなどの演算装置と、記憶装置と、を有している。例えば、音響イベント検知装置５００は、図示しない記憶装置に格納されたプログラムを演算装置が実行することで、上述した各処理部を実現する。

　発音識別部５０１は、独自の複数のマイクロフォンを有しており、受信した音響信号が固定スピーカー１２１からの音響信号であるか否かを識別する。発音識別部５０１の構成は、例えば、第２の実施形態で説明した固定スピーカー識別装置１００が有する発音識別部の構成と同様である。そのため、発音識別部５０１の構成の詳細な説明は省略する。

　マイクロフォン５０２は、周囲の音データを信号に変換する。マイクロフォン５０２は、例えば、発音識別部５０１が有するマイクロフォンとは別に設けられている。

　音響イベント検知部５０３は、マイクロフォン５０２で得られた音の情報の時系列から、あらかじめ指定された音響イベント１２２が発生したか否かを検知する。例えば、音響イベント検知部５０３は、マイクロフォン５０２で得られた音響信号のパワー（大きさ）があらかじめ決められた閾値Ｂ（任意の値で構わない）よりも大きい場合、音響イベント１２２を検知する。そして、音響イベント検知部５０３は、検知した結果を出力する。なお、音響イベント検知部５０３は、上記例示した方法以外の方法を用いて音響イベント１２２を検知しても構わない。

　検知結果修正部５０４は、音響イベント検知部５０３が音響イベント１２２を検知したと出力した場合に、該当時刻の発音識別部５０１の出力を参照する。そして、検知結果修正部５０４は、発音識別部５０１の出力に基づいて、音響イベント検知部５０３による検知結果を修正する。例えば、検知結果修正部５０４は、該当時刻の発音識別部５０１による識別結果が固定スピーカー発音であった場合、音響イベント検知部５０３による検知結果を削除する。また、検知結果修正部５０４は、該当時刻の発音識別部５０１による識別結果が固定スピーカー発音でない場合、音響イベント検知部５０３による検知結果を修正しない。このように、検知結果修正部５０４は、音響イベント検知部５０３の出力に対して、独立したマイクロフォンを持つ発音識別部５０１の結果を用いて、検知結果を修正する。

　なお、検知結果修正部５０４の構成は、上記場合に限定されない。例えば、検知結果修正部５０４は、発音識別部５０１の出力が固定スピーカー発音であった場合、音響イベント１２２の検知を抑圧（削除）する代わりに、固定スピーカー発音であると識別した旨を示すフラグを音響イベント検知部５０３による検知結果に付与しても構わない。これにより、検知結果を利用する側に識別結果を伝えることが出来る。また、検知結果修正部５０４は、発音識別部５０１が固定スピーカー発音であると識別した場合には検知結果を修正せず、固定スピーカー発音でないと識別した場合に検知結果を削除する修正を行うように構成することもできる。

　このように、音響イベント検知装置５００は、発音識別部５０１と、音響イベント検知部５０３と、検知結果修正部５０４と、を有している。このような構成により、検知結果修正部５０４は、音響イベント検知部５０３による検知結果を発音識別部５０１による識別結果に基づいて修正することが出来る。これにより、音響イベント検知装置５００は、検知した音響イベントが固定スピーカー１２１から発音されたものか否かを識別することが可能となり、固定スピーカー１２１から出力されていないものだけを音響イベント１２２として検知することが可能となる。その結果、例えば、固定スピーカー１２１であるテレビで流れているドラマ中の悲鳴など、検知したい音響イベント１２２と紛らわしいものを検知しないことが可能となり、誤検知を低減することが可能となる。なお、固定スピーカー発音でないと識別した場合に検知結果を削除する構成は、スピーカーに限らず固定の目標から発する音響イベント１２２を検知する場合に好適である。このような構成は、例えば、遊園地の固定遊具の異常音監視や、工場内に設置された機器異常音検知に用いることが可能である。

　なお、音響イベント検知装置５００は、固定スピーカー識別装置１００が有する構成のうちの発音範囲学習部に相当する構成を有しても構わないし、有さなくても構わない。音響イベント検知装置５００が発音範囲学習部を有する場合、発音範囲学習部は、固定スピーカー識別装置２００、固定スピーカー識別装置３００、固定スピーカー識別装置４００、のいずれかが有する変形例であっても構わない。また、音響イベント検知装置５００が発音範囲学習部を有さない場合、発音識別部５０１に含まれる判別範囲ＤＢには、発音範囲学習部に相当する構成を有する外部装置から識別範囲を示す情報が格納されるものとする。

［第７の実施形態］
　次に、本発明の第７の実施形態について図２３を参照して説明する。図２３は、音響イベント検知装置６００の構成の一例を示す図である。

　第７の実施形態では、第６の実施形態で説明した音響イベント検知装置５００の変形例である音響イベント検知装置６００について説明する。後述するように、音響イベント検知装置６００の場合、発音識別部５０１による識別結果が音響イベント検知部６０３に入力される。音響イベント検知装置６００は、発音識別部５０１による識別結果に基づいて、音響イベントを検知する際に用いる閾値Ｂを変更する。

　図２３は、音響イベント検知装置６００の構成の一例を示している。図２３を参照すると、音響イベント検知装置６００は、発音識別部５０１と、マイクロフォン５０２と、音響イベント検知部６０３と、を有している。

　以上のように、音響イベント検知装置６００は、音響イベント検知装置５００が有する音響イベント検知部５０３の代わりに音響イベント検知部６０３を有している。また、音響イベント検知装置６００は、検知結果修正部５０４に相当する構成を有しておらず、発音識別部５０１による識別結果を音響イベント検知部６０３に入力するよう構成されている。以下、本実施形態に特徴的な構成である音響イベント検知部６０３について説明する。

　音響イベント検知部６０３は、マイクロフォン５０２で得られた音の情報の時系列から、あらかじめ指定された音響イベント１２２が発生したか否かを検知する。例えば、音響イベント検知部６０３は、マイクロフォン５０２で得られた音響信号のパワー（大きさ）があらかじめ決められた閾値Ｂ（任意の値で構わない）よりも大きい場合、音響イベント１２２を検知する。そして、音響イベント検知部６０３は、検知した結果を出力する。

　また、音響イベント検知部６０３は、発音識別部５０１からの入力に基づいて、閾値Ｂを変更する。例えば、音響イベント検知部６０３は、発音識別部５０１による識別結果が固定スピーカー発音であった場合、閾値Ｂを上げる。これにより、音響イベント検知部６０３は、発音識別部５０１による識別結果が固定スピーカー発音である間、検知感度を下げることになる。

　このように、音響イベント検知装置６００は、発音識別部５０１による識別結果を音響イベント検知部６０３に入力するよう構成されている。このような構成により、音響イベント検知部６０３は、発音識別部５０１による識別結果に基づいて、閾値Ｂを変更する（検知感度を変更する）ことが可能となる。これにより、固定スピーカー１２１からの発音を音響イベント１２２であると検知する可能性を低減させるとともに、大声による叫び声や故障音など非常に明確な音響イベント１２２を検知することが可能となる。その結果、例えば、音響イベント検知装置５００と比較して、音響イベント１２２の誤棄却を減らすことが可能となる。

　なお、音響イベント検知装置６００は、音響イベント検知装置５００と同様に、発音範囲学習部に相当する構成を有しても構わないし、有さなくても構わない。

［第８の実施形態］
　次に、本発明の第８の実施形態について図２４を参照して説明する。図２４は、音響イベント検知装置７００の構成の一例を示す図である。

　第８の実施形態では、第６の実施形態で説明した音響イベント検知装置５００の変形例である音響イベント検知装置７００について説明する。後述するように、音響イベント検知装置７００の場合、発音識別部７０１内に帯域制限部７０２を有している。発音識別部７０１は、音響イベント検知部５０３が検知した音響イベント１２２を構成する中心的な周波数帯域だけに帯域を制限した上で、固定スピーカー１２１からの音響信号であるか否かを識別する。

　図２４は、音響イベント検知装置７００の構成の一例を示している。図２４を参照すると、音響イベント検知装置７００は、発音識別部７０１と、マイクロフォン５０２と、音響イベント検知部５０３と、検知結果修正部５０４と、を有している。

　以上のように、音響イベント検知装置７００は、音響イベント検知装置５００が有する発音識別部５０１の代わりに発音識別部７０１を有している。以下、本実施形態に特徴的な構成である発音識別部７０１について説明する。

　発音識別部７０１は、独自の複数のマイクロフォンを有しており、受信した音響信号が固定スピーカー１２１からの音響信号であるか否かを識別する。発音識別部７０１は、第２の実施形態で説明した固定スピーカー識別装置１００が有する発音識別部の構成に加えて、帯域制限部７０２を有している。具体的には、発音識別部７０１の場合、マイクロフォン１０１、マイクロフォン１０２で受信した音響信号は、帯域制限部７０２を介して特徴量算出部１０３に入力するよう構成されている。

　帯域制限部７０２には、音響イベント検知部４０２から、当該音響イベント検知部４０２が検知した音響イベントを構成する中心的な周波数帯域を示す情報が入力される。帯域制限部７０２は、入力された情報に基づいて、帯域制限を行う。換言すると、帯域制限部７０２は、マイクロフォン１０１、マイクロフォン１０２が受信した音響信号のうち、音響イベント検知部４０２が検知した音響イベントを構成する中心的な周波数帯域のみを特徴量算出部１０３に出力する。帯域制限部７０２が帯域制限を行うことで、発音識別部７０１の固定スピーカー発音識別部１０８は、音響イベントを構成する中心的な周波数帯域だけに帯域を制限した上で固定スピーカー発音か否かを識別することが出来る。

　このように、音響イベント検知装置７００は、帯域制限部７０２を有する発音識別部７０１を有している。また、帯域制限部７０２には、音響イベント検知部４０２が検知した音響イベントを構成する中心的な周波数帯域を示す情報が入力されるよう構成されている。このような構成により、音響イベント検知装置７００は、音響イベントを構成する中心的な周波数帯域だけに帯域を制限した上で固定スピーカー発音か否かを判別することが出来る。これにより、複数の音響イベントが混在する場合や雑音の多い環境でも識別の正確性を向上することが可能となる。

［第９の実施形態］
　次に、本発明の第９の実施形態について図２５を参照して説明する。図２５は、音声認識装置８００の構成の一例を示す図である。

　第９の実施形態では、音声認識を行う音声認識装置８００について説明する。本実施形態で説明する音声認識装置８００は、第２の実施形態を用いて説明した発音識別部に相当する構成を有している。また、音声認識装置８００は、上記構成に加えて、音声認識を行うための構成を有している。後述するように、音声認識装置８００は、音声認識の結果と、発音識別部による識別結果と、に基づいて、最終的な検知結果を判断する。

　図２５は、音声認識装置８００の構成の一例を示している。図２５を参照すると、音声認識装置８００は、発音識別部８０１と、マイクロフォン８０２と、音声認識部８０３と、認識結果修正部８０４と、を有している。音声認識装置８００は、例えば、図示しないＣＰＵなどの演算装置と、記憶装置と、を有している。例えば、音声認識装置８００は、図示しない記憶装置に格納されたプログラムを演算装置が実行することで、上述した各処理部を実現する。

　発音識別部８０１は、独自の複数のマイクロフォンを有しており、受信した音響信号が固定スピーカー１２１からの音響信号であるか否かを識別する。発音識別部８０１の構成は、例えば、第２の実施形態で説明した固定スピーカー識別装置１００が有する発音識別部の構成と同様である。そのため、発音識別部８０１の構成の詳細な説明は省略する。

　マイクロフォン８０２は、周囲の音データを信号に変換する。マイクロフォン８０２は、例えば、発音識別部８０１が有するマイクロフォンとは別に設けられている。

　音声認識部８０３は、マイクロフォン８０２で得られた音の情報の時系列から、音声認識を行う。そして、音声認識部８０３は、音声の認識結果を出力する。音声認識結果は、例えば、単語IDやテキストの形態がある。

　なお、本実施形態においては、音声認識部８０３の具体的な構成については特に限定しない。音声認識部８０３は、例えば、マイクロフォン８０２で得られた音の情報の時系列から、所定の単語を抽出するワードスポッティングを行うなど、一般的な音声認識処理を行うよう構成することが出来る。

　認識結果修正部８０４は、音声認識部８０３がワードスポッティングにより特定の音声認識を行った場合に、該当時刻の発音識別部８０１の出力を参照する。そして、認識結果修正部８０４は、該当時刻の結果が固定スピーカー発音であった場合には、該当する認識結果を削除する。一方、該当時刻の結果が固定スピーカー発音でない場合、認識結果修正部８０４は、音声認識部８０３の出力をそのまま認識結果として出力する。

　このように、音声認識装置８００は、発音識別部８０１と、音声認識部８０３と、認識結果修正部８０４と、を有している。このような構成により、認識結果修正部８０４は、音声認識部８０３による認識結果を発音識別部８０１による識別結果に基づいて修正することが出来る。これにより、音声認識を行った際に該当音声が固定スピーカー１２１から発音されたものか否かを識別して、該当固定スピーカー１２１から出力されていないものだけを音声認識することが可能となる。その結果、たとえば音声認識用コマンドワードが固定スピーカー１２１であるテレビで流れた場合など、認識対象音声と紛らわしいものを音声認識しないことで、誤検知を低減することが可能となる。

　なお、音声認識装置８００は、図２５で示すように、第６の実施形態で説明した音響イベント検知装置５００に類似する構成を有している。音声認識装置８００には、第６、第７、第８の実施形態で説明した、音響イベント検知に向けた工夫を同様に適用することが可能である。

［第１０の実施形態］
　次に、本発明の第１０の実施形態について図２６から図２８を参照して説明する。図２６は、信号源識別装置９００の構成の一例を示す図である。図２７は、イベント検知装置９１０の構成の一例を示す図である。図２８は、音声認識装置９２０の構成の一例を示す図である。

　本発明の第１０の実施形態では、信号源識別装置９００、イベント検知装置９１０、音声認識装置９２０の構成について説明する。

　図２６は、信号源識別装置９００の一例を示している。図２６を参照すると、信号源識別装置９００は、特徴量算出部９０１と、識別部９０２と、を有している。信号源識別装置９００は、例えば、図示しないＣＰＵなどの演算装置と、記憶装置と、を有している。例えば、信号源識別装置９００は、図示しない記憶装置に格納されたプログラムを演算装置が実行することで、上述した各処理部を実現する。

　特徴量算出部９０１は、複数のセンサにより受信した信号に基づいて、信号の発生源からの伝達する経路に応じた特徴量を算出する。

　識別部９０２は、特徴量算出部９０１が算出した特徴量に基づいて決定される、所定の信号源からの信号に基づく特徴量が属する範囲である識別範囲を用いて、特徴量算出部９０１が算出した特徴量が所定の信号源からの信号であるか否かを識別する。

　このように、信号源識別装置９００は、特徴量算出部９０１と、識別部９０２と、を有している。このような構成により、信号源識別装置９００の識別部９０２は、識別範囲を用いて、特徴量算出部９０１が算出した特徴量が所定の信号源からの信号であるか否かを識別することが出来る。このように識別範囲に基づいて識別することで、信号の周波数特性に依存せず、安定して所定の信号源から出力された信号であるか否かを検知することが可能となる。換言すると、所定の信号源から出力された信号であることを容易に検知することが可能となる。

　また、上述した信号源識別装置９００は、当該信号源識別装置９００に所定のプログラムが組み込まれることで実現できる。具体的に、本発明の他の形態であるプログラムは、信号源識別装置９００に、複数のセンサにより受信した信号に基づいて、信号の発生源からの当該信号が伝達する経路に応じた特徴量を算出する特徴量算出部９０１と、特徴量算出部９０１が算出した特徴量に基づいて予め決定される、所定の信号源からの信号に基づく特徴量が属する範囲である識別範囲を用いて、特徴量算出部９０１が算出した特徴量が所定の信号源からの信号であるか否かを識別する識別部９０２と、を実現させるためのプログラムである。

　また、上述した信号源識別装置９００により実行される信号源識別方法は、信号源識別装置９００が、複数のセンサにより受信した信号に基づいて、信号の発生源からの当該信号が伝達する経路に応じた特徴量を算出し、算出した特徴量に基づいて予め決定される、所定の信号源からの信号に基づく特徴量が属する範囲である識別範囲を用いて、算出した特徴量が所定の信号源からの信号であるか否かを識別する、という方法である。

　上述した構成を有する、プログラム、又は、信号源識別方法、の発明であっても、上記信号源識別装置９００と同様の作用を有するために、上述した本発明の目的を達成することが出来る。

　また、上記信号源識別装置９００を用いた装置としては、イベント検知装置９１０と音声認識装置９２０とがある。図２７は、イベント検知装置９１０の構成の一例を示している。また、図２８は、音声認識装置９２０の構成の一例を示している。

　図２７を参照すると、イベント検知装置９１０は、特徴量算出部９０１と、識別部９０２と、イベント検知部９１３と、修正部９１４と、を有している。イベント検知装置９１０は、例えば、図示しないＣＰＵなどの演算装置と、記憶装置と、を有している。例えば、イベント検知装置９１０は、図示しない記憶装置に格納されたプログラムを演算装置が実行することで、上述した各処理部を実現する。

　なお、上記構成のうち、特徴量算出部９０１と識別部９０２とは、信号源識別装置９００が有する構成と同様である。そのため、イベント検知装置９１０は、信号源識別装置９００が有する構成と、イベント検知部９１３と、修正部９１４と、を有する、ということも出来る。

　イベント検知部９１３は、センサにより受信した信号に基づいて、イベントを検知する。また、修正部９１４は、イベント検知部９１３による検知結果を信号源識別装置が有する識別部９０２による識別結果に基づいて修正する。

　また、上述したイベント検知装置９１０は、当該イベント検知装置９１０に所定のプログラムが組み込まれることで実現できる。具体的に、本発明の他の形態であるプログラムは、イベント検知装置９１０に、複数のセンサにより受信した信号に基づいて、信号の発生源からの当該信号が伝達する経路に応じた特徴量を算出する特徴量算出部９０１と、特徴量算出部９０１が算出した特徴量に基づいて予め決定される、所定の信号源からの信号に基づく特徴量が属する範囲である識別範囲を用いて、特徴量算出部９０１が算出した特徴量が前記所定の信号源からの信号であるか否かを識別する識別部と、センサにより受信した信号に基づいて、イベントを検知するイベント検知部９１３と、イベント検知部９１３による検知結果を識別部９０２による識別結果に基づいて修正する修正部９１４と、を実現させるためのプログラムである。

　また、上述したイベント検知装置９１０により実行されるイベント検知方法は、イベント検知装置９１０が、複数のセンサにより受信した信号に基づいて、信号の発生源からの当該信号が伝達する経路に応じた特徴量を算出し、算出した特徴量に基づいて予め決定される、所定の信号源からの信号に基づく特徴量が属する範囲である識別範囲を用いて、算出した特徴量が前記所定の信号源からの信号であるか否かを識別し、センサにより受信した信号に基づいて、イベントを検知し、イベントの検知結果を前記識別の結果に基づいて修正する、という方法である。

　上述した構成を有する、イベント検知装置、プログラム、イベント検知方法、の発明によると、所定の信号源からの信号であるか否かの識別結果に基づいて、イベントの検知結果を修正出来る。これにより、例えば、所定の信号源からの信号をイベントによる信号と誤検知する可能性を低減することが可能となる。

　また、図２８を参照すると、音声認識装置９２０は、特徴量算出部９０１と、識別部９０２と、音声認識部９２３と、修正部９２４と、を有している。音声認識装置９２０、例えば、図示しないＣＰＵなどの演算装置と、記憶装置と、を有している。例えば、音声認識装置９２０は、図示しない記憶装置に格納されたプログラムを演算装置が実行することで、上述した各処理部を実現する。

　なお、上記構成のうち、特徴量算出部９０１と識別部９０２とは、信号源識別装置９００が有する構成と同様である。そのため、イベント検知装置９１０は、信号源識別装置９００が有する構成と、音声認識部９２３と、修正部９２４と、を有する、ということも出来る。

　音声認識部９２３は、センサであるマイクロフォンにより受信した音響信号に基づいて、音声認識を行う。また、修正部９２４は、音声認識部９２３による認識結果を信号源識別装置による識別結果に基づいて修正する。

　また、上述した音声認識装置９２０は、当該音声認識装置９２０に所定のプログラムが組み込まれることで実現できる。具体的に、本発明の他の形態であるプログラムは、音声認識装置９２０に、複数のセンサにより受信した信号に基づいて、信号の発生源からの当該信号が伝達する経路に応じた特徴量を算出する特徴量算出部９０１と、特徴量算出部９０１が算出した特徴量に基づいて予め決定される、所定の信号源からの信号に基づく特徴量が属する範囲である識別範囲を用いて、特徴量算出部９０１が算出した特徴量が所定の信号源からの信号であるか否かを識別する識別部９０２と、センサであるマイクロフォンにより受信した音響信号に基づいて、音声認識を行う音声認識部９０３と、音声認識部９０３による認識結果を識別部９０２による識別結果に基づいて修正する修正部と、を実現するためのプログラムである。

　また、上述した音声認識装置９２０により実行される音声認識方法は、音声認識装置９２０が、複数のセンサにより受信した信号に基づいて、信号の発生源からの当該信号が伝達する経路に応じた特徴量を算出し、算出した特徴量に基づいて予め決定される、所定の信号源からの信号に基づく特徴量が属する範囲である識別範囲を用いて、算出した特徴量が前記所定の信号源からの信号であるか否かを識別し、センサであるマイクロフォンにより受信した音響信号に基づいて、音声認識を行い、音声認識の結果を前記識別の結果に基づいて修正する、という方法である。

　上述した構成を有する、音声認識装置、プログラム、音声認識方法、の発明によると、所定の信号源からの信号であるか否かの識別結果に基づいて、音声認識の結果を修正出来る。これにより、例えば、所定の信号源からの信号に基づく音声認識を誤って行ってしまうことを抑制することが可能となる。

　＜付記＞
　上記実施形態の一部又は全部は、以下の付記のようにも記載されうる。以下、本発明における信号源識別装置などの概略を説明する。但し、本発明は、以下の構成に限定されない。

（付記１）
　複数のセンサにより受信した信号に基づいて、信号の発生源からの当該信号が伝達する経路に応じた特徴量を算出する特徴量算出部と、
　前記特徴量算出部が算出した特徴量に基づいて予め決定される、所定の信号源からの信号に基づく特徴量が属する範囲である識別範囲を用いて、前記特徴量算出部が算出した特徴量が前記所定の信号源からの信号であるか否かを識別する識別部と、
　を有する信号源識別装置。
（付記２）
　付記１に記載の信号源識別装置であって、
　前記識別部は、前記特徴量算出部が算出した特徴量が前記識別範囲内に属する場合、前記所定の信号源からの信号であると識別する
　信号源識別装置。
（付記３）
　付記１又は付記２に記載の信号源識別装置であって、
　前記識別部は、前記特徴量算出部が算出した特徴量が前記識別範囲内に属さない場合、前記所定の信号源からの信号でないと識別する
　信号源識別装置。
（付記４）
　付記１から付記３までのいずれか１項に記載の信号源識別装置であって、
　前記所定の信号源からの信号であるか否かを示すラベルを生成するラベル生成部と、
　前記特徴量算出部が算出した特徴量と、前記ラベル生成部が生成したラベルと、に基づいて、前記識別範囲を決定する識別範囲決定部と、
　を有する
　信号源識別装置。
（付記５）
　付記４に記載の信号源識別装置であって、
　前記ラベル生成部は、複数の前記センサにより受信した信号の大きさと、前記特徴量算出部が算出した特徴量と、に基づいて、前記ラベルを生成する
　信号源識別装置。
（付記６）
　付記４又は付記５に記載の信号源識別装置であって、
　前記ラベル生成部は、複数の前記センサにより受信した信号の大きさに基づいて、一部の信号を抽出し、抽出した一部の信号に基づいて算出される特徴量の平均値と分散とに基づいて、ラベルを生成する
　信号源識別装置。
（付記７）
　付記４又は付記５に記載の信号源識別装置であって、
　前記ラベル生成部は、前記特徴量算出部が算出した特徴量が集中する範囲に基づいて、ラベルを生成する
　信号源識別装置。
（付記８）
　付記４から付記７までのいずれか１項に記載の信号識別装置であって、
　前記ラベル生成部は、前記特徴量算出部が算出した特徴量に時間に応じた重み付けを行ってラベルを生成する
　信号源識別装置。
（付記９）
　付記４から付記８までのいずれか１項に記載の信号源識別装置であって、
　前記所定の信号源の利用状況を示すスケジュールを記録するスケジューラを有し、
　前記ラベル生成部は、前記スケジューラからの出力に基づいて、ラベルを生成する
　信号源識別装置。
（付記１０）
　付記４から付記９までのいずれか１項に記載に信号源識別装置であって、
　前記ラベル生成部は、外部から入力された、前記所定の信号源の利用状況に応じた情報である利用状況情報に基づいて、ラベルを生成する
　信号源識別装置。
（付記１１）
　信号源識別装置が、
　複数のセンサにより受信した信号に基づいて、信号の発生源からの当該信号が伝達する経路に応じた特徴量を算出し、
　算出した特徴量に基づいて予め決定される、所定の信号源からの信号に基づく特徴量が属する範囲である識別範囲を用いて、算出した特徴量が前記所定の信号源からの信号であるか否かを識別する
　信号源識別方法。
（付記１２）
　信号源識別装置に、
　複数のセンサにより受信した信号に基づいて、信号の発生源からの当該信号が伝達する経路に応じた特徴量を算出する特徴量算出部と、
　前記特徴量算出部が算出した特徴量に基づいて予め決定される、所定の信号源からの信号に基づく特徴量が属する範囲である識別範囲を用いて、前記特徴量算出部が算出した特徴量が前記所定の信号源からの信号であるか否かを識別する識別部と、
　を実現させるためのプログラム。
（付記１２－１）
　信号源識別装置に、
　複数のセンサにより受信した信号に基づいて、信号の発生源からの当該信号が伝達する経路に応じた特徴量を算出する特徴量算出部と、
　前記特徴量算出部が算出した特徴量に基づいて予め決定される、所定の信号源からの信号に基づく特徴量が属する範囲である識別範囲を用いて、前記特徴量算出部が算出した特徴量が前記所定の信号源からの信号であるか否かを識別する識別部と、
　を実現させるためのプログラムを記録した、コンピュータが読み取り可能な記録媒体。
（付記１３）
　複数のセンサにより受信した信号に基づいて、信号の発生源からの当該信号が伝達する経路に応じた特徴量を算出する特徴量算出部と、
　前記特徴量算出部が算出した特徴量に基づいて予め決定される、所定の信号源からの信号に基づく特徴量が属する範囲である識別範囲を用いて、前記特徴量算出部が算出した特徴量が前記所定の信号源からの信号であるか否かを識別する識別部と、
　センサにより受信した信号に基づいて、イベントを検知するイベント検知部と、
　前記イベント検知部による検知結果を前記信号源識別装置による識別結果に基づいて修正する修正部と、
　を有する
　イベント検知装置。
（付記１４）
　付記１３に記載のイベント検知装置であって、
　前記信号源識別装置は、前記イベント検知部による検知結果に基づいて帯域の制限を行う帯域制限部を含む
　イベント検知装置。
（付記１５）
　複数のセンサにより受信した信号に基づいて、信号の発生源からの当該信号が伝達する経路に応じた特徴量を算出する特徴量算出部と、
　前記特徴量算出部が算出した特徴量に基づいて予め決定される、所定の信号源からの信号に基づく特徴量が属する範囲である識別範囲を用いて、前記特徴量算出部が算出した特徴量が前記所定の信号源からの信号であるか否かを識別する識別部と、
　センサにより受信した信号に基づいて、イベントを検知するイベント検知部と、
　を有し、
　前記イベント検知部は、前記信号源識別装置による識別結果に基づいて、前記イベントを検知する際に用いる閾値を変更する
　イベント検知装置。
（付記１６）
　イベント検知装置が、
　複数のセンサにより受信した信号に基づいて、信号の発生源からの当該信号が伝達する経路に応じた特徴量を算出し、
　算出した特徴量に基づいて予め決定される、所定の信号源からの信号に基づく特徴量が属する範囲である識別範囲を用いて、算出した特徴量が前記所定の信号源からの信号であるか否かを識別し、
　センサにより受信した信号に基づいて、イベントを検知し、
　前記イベントの検知結果を前記識別の結果に基づいて修正する、
　イベント検知方法。
（付記１７）
　イベント検知装置に、
　複数のセンサにより受信した信号に基づいて、信号の発生源からの当該信号が伝達する経路に応じた特徴量を算出する特徴量算出部と、
　前記特徴量算出部が算出した特徴量に基づいて予め決定される、所定の信号源からの信号に基づく特徴量が属する範囲である識別範囲を用いて、前記特徴量算出部が算出した特徴量が前記所定の信号源からの信号であるか否かを識別する識別部と、
　センサにより受信した信号に基づいて、イベントを検知するイベント検知部と、
　前記イベント検知部による検知結果を前記識別部による識別結果に基づいて修正する修正部と、
　を実現するためのプログラム。
（付記１７－１）
　イベント検知装置に、
　複数のセンサにより受信した信号に基づいて、信号の発生源からの当該信号が伝達する経路に応じた特徴量を算出する特徴量算出部と、
　前記特徴量算出部が算出した特徴量に基づいて予め決定される、所定の信号源からの信号に基づく特徴量が属する範囲である識別範囲を用いて、前記特徴量算出部が算出した特徴量が前記所定の信号源からの信号であるか否かを識別する識別部と、
　センサにより受信した信号に基づいて、イベントを検知するイベント検知部と、
　前記イベント検知部による検知結果を前記識別部による識別結果に基づいて修正する修正部と、
　を実現するためのプログラムを記録した、コンピュータが読み取り可能な記録媒体。
（付記１８）
　複数のセンサにより受信した信号に基づいて、信号の発生源からの当該信号が伝達する経路に応じた特徴量を算出する特徴量算出部と、
　前記特徴量算出部が算出した特徴量に基づいて予め決定される、所定の信号源からの信号に基づく特徴量が属する範囲である識別範囲を用いて、前記特徴量算出部が算出した特徴量が前記所定の信号源からの信号であるか否かを識別する識別部と、
　センサであるマイクロフォンにより受信した音響信号に基づいて、音声認識を行う音声認識部と、
　前記音声認識部による認識結果を前記信号源識別装置による識別結果に基づいて修正する修正部と、
　を有する
　音声認識装置。
（付記１９）
　音声認識装置が、
　複数のセンサにより受信した信号に基づいて、信号の発生源からの当該信号が伝達する経路に応じた特徴量を算出し、
　算出した特徴量に基づいて予め決定される、所定の信号源からの信号に基づく特徴量が属する範囲である識別範囲を用いて、算出した特徴量が前記所定の信号源からの信号であるか否かを識別し、
　センサであるマイクロフォンにより受信した音響信号に基づいて、音声認識を行い、
　音声認識の結果を前記識別の結果に基づいて修正する
　音声認識方法。
（付記２０）
　音声認識装置に、
　複数のセンサにより受信した信号に基づいて、信号の発生源からの当該信号が伝達する経路に応じた特徴量を算出する特徴量算出部と、
　前記特徴量算出部が算出した特徴量に基づいて予め決定される、所定の信号源からの信号に基づく特徴量が属する範囲である識別範囲を用いて、前記特徴量算出部が算出した特徴量が前記所定の信号源からの信号であるか否かを識別する識別部と、
　センサであるマイクロフォンにより受信した音響信号に基づいて、音声認識を行う音声認識部と、
　前記音声認識部による認識結果を前記識別部による識別結果に基づいて修正する修正部と、
　を実現するためのプログラム。
（付記２０－１）
　音声認識装置に、
　複数のセンサにより受信した信号に基づいて、信号の発生源からの当該信号が伝達する経路に応じた特徴量を算出する特徴量算出部と、
　前記特徴量算出部が算出した特徴量に基づいて予め決定される、所定の信号源からの信号に基づく特徴量が属する範囲である識別範囲を用いて、前記特徴量算出部が算出した特徴量が前記所定の信号源からの信号であるか否かを識別する識別部と、
　センサであるマイクロフォンにより受信した音響信号に基づいて、音声認識を行う音声認識部と、
　前記音声認識部による認識結果を前記識別部による識別結果に基づいて修正する修正部と、
　を実現するためのプログラムを記録した、コンピュータが読み取り可能な記録媒体。

　なお、上記各実施形態及び付記において記載したプログラムは、記憶装置に記憶されていたり、コンピュータが読み取り可能な記録媒体に記録されていたりする。例えば、記録媒体は、フレキシブルディスク、光ディスク、光磁気ディスク、及び、半導体メモリ等の可搬性を有する媒体である。

　以上、上記各実施形態を参照して本願発明を説明したが、本願発明は、上述した実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明の範囲内で当業者が理解しうる様々な変更をすることが出来る。

０００　固定信号源識別装置
００１、００２　センサ
００３　特徴量算出部
００４　特徴量ストア
００５　教師ラベル生成部
００６　固定信号源出力範囲決定部
００７　判別範囲ＤＢ
００８　固定信号源出力信号識別部
０２１　固定信号源
０２２　移動信号源
１００　固定スピーカー識別装置
１０１、１０２　マイクロフォン
１０３　特徴量算出部
１０４　特徴量ストア
１０５　教師ラベル生成部
１０６　固定スピーカー発音範囲決定部
１０７　判別範囲ＤＢ
１０８　固定スピーカー発音識別部
１２１　固定スピーカー
１２２　音響イベント
２００　固定スピーカー識別装置
２０５　教師ラベル生成部
３００　固定スピーカー識別装置
３０５　教師ラベル生成部
３０９　スケジューラ
４００　固定スピーカー識別装置
４０５　教師ラベル生成部
５００　音響イベント検知装置
５０１　発音識別部
５０２　マイクロフォン
５０３　音響イベント検知部
５０４　検知結果修正部
６００　音響イベント検知装置
６０３　音響イベント検知部
７００　音響イベント検知装置
７０１　発音識別部
７０２　帯域制限部
８００　音声認識装置
８０１　発音識別部
８０２　マイクロフォン
８０３　音声認識部
８０４　認識結果修正部
９００　信号源識別装置
９０１　特徴量算出部
９０２　識別部
９１０　イベント検知装置
９１３　イベント検知部
９１４　修正部
９２０　音声認識装置
９２３　音声認識部
９２４　修正部

Claims

　複数のセンサにより受信した信号に基づいて、信号の発生源からの当該信号が伝達する経路に応じた特徴量を算出する特徴量算出部と、
　前記特徴量算出部が算出した特徴量に基づいて予め決定される、所定の信号源からの信号に基づく特徴量が属する範囲である識別範囲を用いて、前記特徴量算出部が算出した特徴量が前記所定の信号源からの信号であるか否かを識別する識別部と、
　を有する信号源識別装置。
　請求項１に記載の信号源識別装置であって、
　前記識別部は、前記特徴量算出部が算出した特徴量が前記識別範囲内に属する場合、前記所定の信号源からの信号であると識別する
　信号源識別装置。
　請求項１又は請求項２に記載の信号源識別装置であって、
　前記識別部は、前記特徴量算出部が算出した特徴量が前記識別範囲内に属さない場合、前記所定の信号源からの信号でないと識別する
　信号源識別装置。
　請求項１から請求項３までのいずれか１項に記載の信号源識別装置であって、
　前記所定の信号源からの信号であるか否かを示すラベルを生成するラベル生成部と、
　前記特徴量算出部が算出した特徴量と、前記ラベル生成部が生成したラベルと、に基づいて、前記識別範囲を決定する識別範囲決定部と、
　を有する
　信号源識別装置。
　請求項４に記載の信号源識別装置であって、
　前記ラベル生成部は、複数の前記センサにより受信した信号の大きさと、前記特徴量算出部が算出した特徴量と、に基づいて、前記ラベルを生成する
　信号源識別装置。
　請求項４又は請求項５に記載の信号源識別装置であって、
　前記ラベル生成部は、複数の前記センサにより受信した信号の大きさに基づいて、一部の信号を抽出し、抽出した一部の信号に基づいて算出される特徴量の平均値と分散とに基づいて、ラベルを生成する
　信号源識別装置。
　請求項４又は請求項５に記載の信号源識別装置であって、
　前記ラベル生成部は、前記特徴量算出部が算出した特徴量が集中する範囲に基づいて、ラベルを生成する
　信号源識別装置。
請求項４から請求項７までのいずれか１項に記載の信号識別装置であって、
　前記ラベル生成部は、前記特徴量算出部が算出した特徴量に時間に応じた重み付けを行ってラベルを生成する
　信号源識別装置。
　請求項４から請求項８までのいずれか１項に記載の信号源識別装置であって、
　前記所定の信号源の利用状況を示すスケジュールを記録するスケジューラを有し、
　前記ラベル生成部は、前記スケジューラからの出力に基づいて、ラベルを生成する
　信号源識別装置。
　請求項４から請求項９までのいずれか１項に記載に信号源識別装置であって、
　前記ラベル生成部は、外部から入力された、前記所定の信号源の利用状況に応じた情報である利用状況情報に基づいて、ラベルを生成する
　信号源識別装置。
　信号源識別装置が、
　複数のセンサにより受信した信号に基づいて、信号の発生源からの当該信号が伝達する経路に応じた特徴量を算出し、
　算出した特徴量に基づいて予め決定される、所定の信号源からの信号に基づく特徴量が属する範囲である識別範囲を用いて、算出した特徴量が前記所定の信号源からの信号であるか否かを識別する
　信号源識別方法。
　信号源識別装置に、
　複数のセンサにより受信した信号に基づいて、信号の発生源からの当該信号が伝達する経路に応じた特徴量を算出する特徴量算出部と、
　前記特徴量算出部が算出した特徴量に基づいて予め決定される、所定の信号源からの信号に基づく特徴量が属する範囲である識別範囲を用いて、前記特徴量算出部が算出した特徴量が前記所定の信号源からの信号であるか否かを識別する識別部と、
　を実現させるためのプログラムを記録した、コンピュータが読み取り可能な記録媒体。
　複数のセンサにより受信した信号に基づいて、信号の発生源からの当該信号が伝達する経路に応じた特徴量を算出する特徴量算出部と、
　前記特徴量算出部が算出した特徴量に基づいて予め決定される、所定の信号源からの信号に基づく特徴量が属する範囲である識別範囲を用いて、前記特徴量算出部が算出した特徴量が前記所定の信号源からの信号であるか否かを識別する識別部と、
　センサにより受信した信号に基づいて、イベントを検知するイベント検知部と、
　前記イベント検知部による検知結果を前記信号源識別装置による識別結果に基づいて修正する修正部と、
　を有する
　イベント検知装置。
　請求項１３に記載のイベント検知装置であって、
　前記信号源識別装置は、前記イベント検知部による検知結果に基づいて帯域の制限を行う帯域制限部を含む
　イベント検知装置。
　複数のセンサにより受信した信号に基づいて、信号の発生源からの当該信号が伝達する経路に応じた特徴量を算出する特徴量算出部と、
　前記特徴量算出部が算出した特徴量に基づいて予め決定される、所定の信号源からの信号に基づく特徴量が属する範囲である識別範囲を用いて、前記特徴量算出部が算出した特徴量が前記所定の信号源からの信号であるか否かを識別する識別部と、
　センサにより受信した信号に基づいて、イベントを検知するイベント検知部と、
　を有し、
　前記イベント検知部は、前記信号源識別装置による識別結果に基づいて、前記イベントを検知する際に用いる閾値を変更する
　イベント検知装置。
　イベント検知装置が、
　複数のセンサにより受信した信号に基づいて、信号の発生源からの当該信号が伝達する経路に応じた特徴量を算出し、
　算出した特徴量に基づいて予め決定される、所定の信号源からの信号に基づく特徴量が属する範囲である識別範囲を用いて、算出した特徴量が前記所定の信号源からの信号であるか否かを識別し、
　センサにより受信した信号に基づいて、イベントを検知し、
　前記イベントの検知結果を前記識別の結果に基づいて修正する、
　イベント検知方法。
　イベント検知装置に、
　複数のセンサにより受信した信号に基づいて、信号の発生源からの当該信号が伝達する経路に応じた特徴量を算出する特徴量算出部と、
　前記特徴量算出部が算出した特徴量に基づいて予め決定される、所定の信号源からの信号に基づく特徴量が属する範囲である識別範囲を用いて、前記特徴量算出部が算出した特徴量が前記所定の信号源からの信号であるか否かを識別する識別部と、
　センサにより受信した信号に基づいて、イベントを検知するイベント検知部と、
　前記イベント検知部による検知結果を前記識別部による識別結果に基づいて修正する修正部と、
　を実現するためのプログラムを記録した、コンピュータが読み取り可能な記録媒体。
　複数のセンサにより受信した信号に基づいて、信号の発生源からの当該信号が伝達する経路に応じた特徴量を算出する特徴量算出部と、
　前記特徴量算出部が算出した特徴量に基づいて予め決定される、所定の信号源からの信号に基づく特徴量が属する範囲である識別範囲を用いて、前記特徴量算出部が算出した特徴量が前記所定の信号源からの信号であるか否かを識別する識別部と、
　センサであるマイクロフォンにより受信した音響信号に基づいて、音声認識を行う音声認識部と、
　前記音声認識部による認識結果を前記信号源識別装置による識別結果に基づいて修正する修正部と、
　を有する
　音声認識装置。
　音声認識装置が、
　複数のセンサにより受信した信号に基づいて、信号の発生源からの当該信号が伝達する経路に応じた特徴量を算出し、
　算出した特徴量に基づいて予め決定される、所定の信号源からの信号に基づく特徴量が属する範囲である識別範囲を用いて、算出した特徴量が前記所定の信号源からの信号であるか否かを識別し、
　センサであるマイクロフォンにより受信した音響信号に基づいて、音声認識を行い、
　音声認識の結果を前記識別の結果に基づいて修正する
　音声認識方法。
　音声認識装置に、
　複数のセンサにより受信した信号に基づいて、信号の発生源からの当該信号が伝達する経路に応じた特徴量を算出する特徴量算出部と、
　前記特徴量算出部が算出した特徴量に基づいて予め決定される、所定の信号源からの信号に基づく特徴量が属する範囲である識別範囲を用いて、前記特徴量算出部が算出した特徴量が前記所定の信号源からの信号であるか否かを識別する識別部と、
　センサであるマイクロフォンにより受信した音響信号に基づいて、音声認識を行う音声認識部と、
　前記音声認識部による認識結果を前記識別部による識別結果に基づいて修正する修正部と、
　を実現するためのプログラムを記録した、コンピュータが読み取り可能な記録媒体。