JP6048025B2 - 分類装置及びプログラム - Google Patents

分類装置及びプログラム Download PDF

Info

Publication number
JP6048025B2
JP6048025B2 JP2012204944A JP2012204944A JP6048025B2 JP 6048025 B2 JP6048025 B2 JP 6048025B2 JP 2012204944 A JP2012204944 A JP 2012204944A JP 2012204944 A JP2012204944 A JP 2012204944A JP 6048025 B2 JP6048025 B2 JP 6048025B2
Authority
JP
Japan
Prior art keywords
feature
spectrogram
fourier transform
dimensional fourier
periodic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012204944A
Other languages
English (en)
Other versions
JP2014059483A (ja
Inventor
タプリヤ ローシャン
タプリヤ ローシャン
布施 透
透 布施
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2012204944A priority Critical patent/JP6048025B2/ja
Priority to US13/790,377 priority patent/US9218540B2/en
Priority to SG2013027776A priority patent/SG2013027776A/en
Priority to AU2013204156A priority patent/AU2013204156B2/en
Publication of JP2014059483A publication Critical patent/JP2014059483A/ja
Application granted granted Critical
Publication of JP6048025B2 publication Critical patent/JP6048025B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/12Classification; Matching

Description

本発明は、分類装置及びプログラムに関する。
特許文献1に開示される見守りシステムでは、家(生活空間)の中に音センサデバイスを設置する。音センサデバイスのマイクロコントローラは、音センサの音信を処理することによって、時間および周波数の両方向において簡略化したスペクトログラムを生成する。このスペクトログラムはホームゲートウェイからネットワークを通して見守りサーバに伝送される。見守りサーバでは、簡略化したスペクトログラムに対して複数のフィルタを掛け、それによるスコア値を算出し、各フィルタのスコア値から、生活空間および/または対象者の状況を認識する。
すなわち、このシステムは、個人のプライバシーへの配慮のために、生活音をスペクトログラムで表現する。そして、このスペクトログラムからフィルタ処理によりいくつかの特徴量(スコア値)を算出する。これら特徴量を、事前に抽出した各シーン(状況)の特徴量と比較することで、その生活音が表すシーンを特定する。
非特許文献1には、音圧のスペクトログラムの特徴と、音のドップラシフトのスペクトログラムの特徴から、人がいるのか否かを判別するシステムが開示されている。
特許文献1及び非特許文献1は、いずれも、スペクトログラムから特徴量を求め、その特徴量に基づく状況を判別している。
特許文献2には、バイナリデータの0,1の並びを画像として取り扱い、複数の異なるデータが表す画像同士の光学的な相関をとることで、データ同士の一致を判定することが開示されている。
特許文献3には、「インストログラム」を用いた楽器音認識方法が示されている。インストログラム(Instrogram)とは、スペクトログラムに似た楽器存在確率の視覚表現の一つであり、解析対象となる楽器ごとに1つ生成される。楽器存在確率p(ω;t,f)は、ある時刻tにおいて周波数fを基本周波数F0とする楽器ωの音が存在する確率を示すものである。したがって、対象楽器をΩ={ω1,…,ωm}とすると、インストログラムは、各ω∈Ωに対して、上述の楽器存在確率p(ω;t,f)を可視化したもの、つまり、横軸を時刻、縦軸を周波数で表し、時間t−周波数f平面上にこれを表せばそれが即ちインストログラムとなる。特許文献3には、2つの楽曲のインストログラムの画像同士を画像類似判定システムで判定することにより、両者の楽器構成が類似しているかどうかを判定することが開示されている。
特開2011−237865号公報 特表2003−501755号公報 特開2007−240552号公報
James M. Sabatier, et. al,. "Ultrasonic Methods for Human Motion Detection", The University of Mississippi, 2006
本発明は、分類対象の時間変化信号を、スペクトログラムの特徴量を用いる場合よりも少ない計算量で、対応する事象に分類できるようにすることを目的とする。
請求項1に係る発明は、1以上の事象の各々について、その事象に関して検出された時間変化信号のスペクトログラムの二次元フーリエ変換が持つ周期性の特徴を、テンプレート特徴として記憶する特徴記憶手段と、センサにより求められた分類対象の時間変化信号を処理して、当該分類対象の時間変化信号のスペクトログラムを生成するスペクトログラム生成手段と、前記スペクトログラム生成手段が生成したスペクトログラムの二次元フーリエ変換を計算する二次元フーリエ変換計算手段と、前記二次元フーリエ変換計算手段が求めた前記二次元フーリエ変換の画像から周期性の特徴を検出する特徴検出手段と、前記特徴記憶手段に記憶された前記テンプレート特徴の中から、前記特徴検出手段が検出した前記周期性の特徴に類似するものを特定する特定手段と、前記特徴検出手段が検出した前記周期性の特徴に類似するテンプレート特徴が前記特定手段により特定された場合には、前記分類対象の時間変化信号を、前記特定手段により特定されたテンプレート特徴に該当する事象に対応すると判定する判定手段と、を有する分類装置である。
請求項に係る発明は、コンピュータを、1以上の事象の各々について、その事象に関して検出された時間変化信号のスペクトログラムの二次元フーリエ変換が持つ周期性の特徴を、テンプレート特徴として記憶する特徴記憶手段、センサにより求められた分類対象の時間変化信号を処理して、当該分類対象の時間変化信号のスペクトログラムを生成するスペクトログラム生成手段、前記スペクトログラム生成手段が生成したスペクトログラムの二次元フーリエ変換を計算する二次元フーリエ変換計算手段、前記二次元フーリエ変換計算手段が求めた前記二次元フーリエ変換の画像から周期性の特徴を検出する特徴検出手段、前記特徴記憶手段に記憶された前記テンプレート特徴の中から、前記特徴検出手段が検出した前記周期性の特徴に類似するものを特定する特定手段、前記特徴検出手段が検出した前記周期性の特徴に類似するテンプレート特徴が前記特定手段により特定された場合には、前記分類対象の時間変化信号を、前記特定手段により特定されたテンプレート特徴に該当する事象に対応すると判定する判定手段、として機能させるためのプログラムである。
請求項1又はに係る発明によれば、分類対象の時間変化信号を、スペクトログラムの特徴量を用いる場合よりも少ない計算量で、対応する事象に分類できる。
様々な状況で検出された音声信号から生成されたスペクトログラムの例を示す図である。 スペクトログラムと、このスペクトログラムの二次元フーリエ変換の例を示す図である。 実施形態の装置構成の一例を示す図である。 画像ベース分類部の処理手順の一例を示す図である。
本実施形態の分類装置は、時間的に変化する信号(「時間変化信号」と呼ぶ)を入力とし、この入力信号を解析することで、この入力信号が表す事象が、あらかじめ登録された事象のいずれに該当するかを判定(すなわち入力信号をいずれかの登録事象に分類)する。
分類の対象となる時間変化信号は、例えば、センサがある時間に渡って出力した時系列的な信号である。例えば、マイクが検出する音声信号、加速度センサが検出する加速度信号、速度センサが取得する速度信号、圧力センサが検出する圧力信号等がその一例である。
分類先である事象は、時間変化信号の解析により特定可能なものであればどのようなものであってもよい。例えば、人が携帯するスマートフォンのマイクが拾った音声信号を解析することで、その人が歩行している、駅のホームで電車を待っている、電車に乗っている、等というように、その人がそのときどのような状況にいるかを解析することが考えられる。この例における各種の「状況」が分類先の事象の一例である。
この分類のために、本実施形態では、入力された時間変化信号のスペクトログラムの二次元フーリエ変換を求め、スペクトログラムの周波数成分の分布を示す画像を生成する。一方、事前に、各種の事象のそれぞれについて、その事象において生じる時間変化信号を取得し、その時間変化信号のスペクトログラムの周波数成分の分布を示す画像を作成し、これをその事象に対応するテンプレート画像としてデータベース化しておく。そして、入力信号のスペクトログラムの周波数成分の分布を示す画像が、データベース内の各事象のテンプレート画像のどれに類似しているかに応じて、その入力信号がどの事象を表しているのかを判定する。
ここで、スペクトログラムとは、周知のように、信号のスペクトル密度が時間に応じてどのように変化するかを表す、時間変化するスペクトル表現である。スペクトログラムは、一般的には、横軸に時間、縦軸に周波数をとり、各点の明るさや色である時点のある周波数の信号強度(振幅)を表すグラフ(画像)として表される。本実施形態では、このスペクトログラムに対して二次元フーリエ変換を施したものを分類に用いる。
図1に、人が携帯するスマートフォンのマイクで拾った音声信号から作成したスペクトログラムの例を示す。(a)は、その人が駅のプラットフォームで電車を待っている状況の音声信号のスペクトログラムであり、(b)は、その人が待っているプラットフォームに対して電車が近づいてきたときの音声信号のスペクトログラムである。また、(c)はその人が野外を走る電車に乗っているときの音声信号のスペクトログラムであり、(d)はその人がトンネル内(或いは地下)を走る電車に乗っているときの音声信号のスペクトログラムである。
図2には、(a)人が歩いているときにスマートフォンのマイクにより取得された音声信号から生成したスペクトログラムと、(b)そのスペクトログラムの二次元フーリエ変換と、を示す。本実施形態では、例えば、(b)に例示したスペクトログラムの二次元フーリエ変換を、テンプレート画像として、「人が歩いている」という状況(事象)と対応づけて、データベースに蓄積する。
また、上述したテンプレート画像を用いた分類を、スペクトログラムの二次元フーリエ変換の画像が持つ周期的な特徴を用いた分類と組み合わせることも考えられる。
例えば、図2に示したスペクトログラム(a)の二次元フーリエ変換(b)の画像には、画像を上下に二分する横軸上に、周囲に比べて目立って輝度が高い点(「白点」と呼ぶ)が一定の間隔で周期的に並んでいる。この例における隣り合う白点同士の間隔が、二次元フーリエ変換(b)の画像が含む周期性を示す特徴である。例えば、人が歩いているときと走っているときでは、その間隔が異なることが発明者の実験で分かっている。したがって、信号のスペクトログラムを二次元フーリエ変換した結果の中に、(b)に示すような周期性を持つ特徴が見られる場合には、そのような周期性の特徴を用いて分類を行うこともできる。例えば、状況(例えば歩いている/走っている)ごとに、その状況に対応する二次元フーリエ変換(b)の画像の横軸上の白点の間隔を、その状況に対応する周期性特徴としてデータベース化しておき、入力信号のスペクトログラムの二次元フーリエ変換から求められる周期性特徴に類似した周期性特徴をデータベースから検索し、検索した周期性特徴に対応する状況を、入力信号の示す状況と判定する。
ただし、そのような周期性は、全ての事象(状況)について見られるものではない。そこで、本実施形態では、入力信号のスペクトログラムの二次元フーリエ変換から周期性特徴を見いだせた場合は、その特徴に基づいて分類を行う。一方、周期性特徴を見いだせなかった場合は、テンプレート画像との比較に基づいて分類を行う。
図3に、本実施形態の分類装置の機能構成の一例を示す。
図3の例では、テンプレート画像DB(データベース)30には、分類したい事象(例えばスマートフォンを携帯しているユーザが居る場の状況)ごとに、その事象の識別情報に対応づけて、その事象に関してセンサが検出した時間変化信号のスペクトログラムを二次元フーリエ変換して得られる画像が、テンプレート画像として登録されている。すなわち、事前に実験を行って、各種の事象についてのセンサの検出信号を収集し、収集した信号からテンプレート画像を生成し、これをテンプレート画像DB30に登録しておく。登録されるテンプレート画像は、図3の分類装置のスペクトログラム生成部12、前処理部14、及び二次元フーリエ変換部22(又はこれと同じ機能を持つ装置)を用いて生成したものである。
また、周期性特徴DB34には、テンプレート画像に周期性特徴が見られる事象のみについて、その事象の識別情報に対応づけて、その周期性特徴が登録されている。例えば、テンプレート画像DB30を構築する際に作成した各事象のテンプレート画像を解析して周期性特徴を探し、周期性特徴が見つかれば、これを周期性特徴DB34に登録すればよい。周期性特徴としては、例えば、図2に例示したように、テンプレート画像(図2の(b)がその一例)の中央を通る横軸上に等間隔に存在する白点同士の間隔を用いればよい。この場合、事象ごとに、その事象に対応するテンプレート画像の中央を通る横軸上の画素値分布を求め、この画素値分布を二値化する等により白点を抽出し、抽出された白点群の中の隣り合う白点同士の間隔をそれぞれ求め、求めた間隔同士があらかじめ定めた許容誤差以内で等しい場合に、そのテンプレート画像は周期性を持つと判定する。そして、それら複数の間隔の統計的な代表値(例えば平均値)を、その事象の周期性特徴として周期性特徴DB34に登録する。なお、テンプレート画像の横軸上に並ぶ白点の周期性に着目したり、それら白点同士の間隔を周期性特徴として用いたりするというのはあくまで一例に過ぎない。周期性特徴DB34に登録する特徴を求める際の周期性特徴の検出方式は、後述する周期性特徴検出部26で用いられるものと同じものである。
図3の装置の信号入力部10には、分類対象の時間変化信号が入力される。例えば、スマートフォンにインストールされたアプリケーションが、スマートフォンのマイクが一定期間ごとに、その一定期間にピックアップした音声信号のデータを、インターネットを介して本実施形態の分類装置に送信し、そのデータを信号入力部10が受け取る。
スペクトログラム生成部12は、信号入力部10が受け取った時間変化信号のスペクトログラムを生成する。スペクトログラムの生成には、従来用いられている方法を用いればよい。生成されるスペクトログラムは、一種の画像として取り扱うことができる。
生成されたスペクトログラムは、前処理部14に入力され、二次元フーリエ変換のための前処理をうける。前処理部14は、バンドパスフィルタ16、非線形変換部18及び二値化部20を有する。
バンドパスフィルタ16は、入力されたスペクトログラム(例えば横軸が時間、縦軸が周波数を示す)のなかから、あらかじめ定めた周波数帯域の部分を抽出する。これは、スペクトログラムから、後の解析にとって意味がない(ノイズにしかならない)周波数帯域を取り除く処理である。抽出する周波数帯域は、分類装置が分類しようとする信号の特性等に応じてあらかじめ定めておけばよい。
非線形変換部18は、バンドパスフィルタ16の出力(すなわちスペクトログラムのうち抽出された部分)に対して、非線形の増幅を行う。これは、画像信号を表示する際のガンマ補正と同様の考え方で、低強度(輝度が低い)の信号成分を増幅して強度を上げることで、信号対ノイズ比を改善するためのものである。
二値化部20は、非線形変換部18の出力に対して二値化処理を施す。この二値化により、スペクトログラムの特徴が強調される。この二値化部20の出力が、二次元フーリエ変換部22に入力される。
二次元フーリエ変換部22は、入力された二値化結果(すなわち入力信号のスペクトログラムを前処理して得られた二値化画像)に対して、公知の二次元フーリエ変換を施す。これにより、そのスペクトログラムの二値化画像の周波数成分の分布を示す画像が得られる。この画像(二値化結果)は、分類処理部24に入力される。
分類処理部24は、入力された二次元フーリエ変換結果の画像を用いて、分類対象の時間変化信号が表す事象が、データベース(テンプレート画像DB30及び周期性特徴DB34)に登録された事象のいずれに該当するかを判定する。分類処理部24は、周期性特徴検出部26、画像ベース分類部28、及び特徴ベース分類部32を有する。
周期性特徴検出部26は、入力された二次元フーリエ変換結果の画像から、周期性特徴を検出する。検出方法は、前述した周期性特徴DB34に登録する特徴の求め方と同様でよい。
周期性特徴検出部26により周期性特徴が検出された場合、分類処理部24は、特徴ベース分類部32を用いて分類を行う。すなわち、特徴ベース分類部32は、周期性特徴DB34に登録された各事象の周期性特徴の中から、周期性特徴検出部26により検出された周期性特徴に近いものを探す。この探索では、例えば、検出された周期性特徴と周期性特徴DB34の周期性特徴との距離を求め、その距離があらかじめ定めた閾値以下であれば、両者が「近い」と判定すればよい。例えば、図2の例のように隣り合う白点同士の間隔を周期性特徴とする場合、分類対象の信号から生成した二次元フーリエ変換の画像におけるその間隔と、周期性特徴DB34に登録された各事象に対応する間隔と、の差を求め、その差が閾値以下であれば、両者の間隔同士が「近い」ということになる。周期性特徴が複数の成分を含む場合には、周期性特徴をそれら各成分からなるベクトルとみなし、ベクトル同士の距離が閾値以下であるかどうかを判定すればよい。そして、そのような「近い」周期性特徴が見つかれば、見つかった周期性特徴に対応する事象を、分類対象の時間変化信号の分類先と判定する。検出された周期性特徴に「近い」周期性特徴が周期性特徴DB34から複数見つかった場合の取扱は、別途定めておけばよい。1つの例では、それら複数の「近い」周期性特徴のうち最も「近い」ものを分類先と判定する。別の例では、それら複数の「近い」周期性特徴の全てを分類先と判定する。
周期性特徴検出部26により周期性特徴が検出されなかった場合、又は特徴ベース分類部32で分類先が見つからなかった場合には、画像ベース分類部28が分類を行う。画像ベース分類部28は、入力された二次元フーリエ変換結果の画像と、テンプレート画像DB30に登録されている各テンプレート画像とを比較し、その比較の結果に基づいて分類を行う。
画像ベース分類部28の処理手順の一例を図4に示す。この手順は、テンプレート画像DB30に登録された事象(及びこれに対応するテンプレート画像)ごとに実行される。
この手順では、まず処理対象の事象に対応するテンプレート画像をテンプレート画像DB30から読み出し、読み出したテンプレート画像に対して、複素共役を求めるための共役フィルタ処理を施す(S10)。これにより、共役テンプレート画像を求められる。なお、テンプレート画像DB30に対して共役テンプレート画像を登録しておく場合には、S10は不要である。次に、二次元フーリエ変換部22から入力された二次元フーリエ変換結果の画像と、共役テンプレート画像とを乗算する(S12)。次に、その乗算結果に対して逆フーリエ変換を施す(S14)。この逆フーリエ変換は、二次元フーリエ変換と同じ演算でよい。フーリエ変換と相互相関関数との関係から、逆フーリエ変換の結果は、それら2つの二次元フーリエ変換(分類対象とテンプレート画像)の変換前のスペクトログラム同士の相関係数を表している。この相関係数をあらかじめ定めた閾値と比較する(S16)。この比較の結果、相関係数が閾値以上(すなわち相関が十分強い)であれば、分類対象はそのテンプレート画像に対応する事象に該当すると判定する(すなわちその事象を分類先に決定する)(S18)。相関係数が閾値未満であれば、分類対象はそのテンプレート画像に対応する事象に該当しない(すなわちその事象は分類先ではない)と判定する(S20)。
図4の例では、相関係数が閾値以上となる事象は全て分類先と判定されるが、この代わりに、相関係数が閾値以上となる事象のうち相関係数が最大となる事象のみを分類先と判定するようにしてもよい。
以上に説明したように、本実施形態の分類装置は、分類対象の時間変化信号のスペクトログラムの二次元フーリエ変換を、各事象についての信号から生成したスペクトログラムの二次元フーリエ変換(テンプレート画像)と比較することで、分類対象の分類先を決定する。このような構成によれば、その二次元フーリエ変換から明確な周期性特徴が検出できない場合でも、分類が可能となる。また、二次元フーリエ変換から明確な周期性特徴が検出できる場合には、画像同士の比較(相関演算)という比較的負荷の高い処理を省略し、その周期性特徴に基づいて分類を行うことで、計算負荷が軽減される。スペクトログラムの生成から二次元フーリエ変換までの処理系は、画像比較に基づく分類と周期性特徴に基づく分類とで共用されるので、簡潔なシステム構成となっている。
このような分類装置は、例えば、時間変化信号を生成するセンサが搭載されたデバイス(例えばスマートフォン)の周囲の状況(この状況を時間変化信号が表している)が、あらかじめ規定された状況(事象)のどれに該当するかを分析することができる。この分析結果に応じてそのデバイスを制御したり、その分析結果を蓄積して傾向を分析する等によりそのデバイスへのサービスを改善したりする等の応用も考えられる。
以上に例示した分類装置は、例えば、汎用のコンピュータに上述の各機能モジュールの処理を表すプログラムを実行させることにより実現してもよい。ここで、コンピュータは、例えば、ハードウエアとして、CPU等のマイクロプロセッサ、ランダムアクセスメモリ(RAM)およびリードオンリメモリ(ROM)等のメモリ(一次記憶)、HDD(ハードディスクドライブ)を制御するHDDコントローラ、各種I/O(入出力)インタフェース、ローカル・エリア・ネットワークなどのネットワークとの接続のための制御を行うネットワークインタフェース等が、たとえばバスを介して接続された回路構成を有する。また、そのバスに対し、例えばI/Oインタフェース経由で、CDやDVDなどの可搬型ディスク記録媒体に対する読み取り及び/又は書き込みのためのディスクドライブ、フラッシュメモリなどの各種規格の可搬型の不揮発性記録媒体に対する読み取り及び/又は書き込みのためのメモリリーダライタ、などが接続されてもよい。上に例示した各機能モジュールの処理内容が記述されたプログラムがCDやDVD等の記録媒体を経由して、又はネットワーク等の通信手段経由で、ハードディスクドライブ等の固定記憶装置に保存され、コンピュータにインストールされる。固定記憶装置に記憶されたプログラムがRAMに読み出されCPU等のマイクロプロセッサにより実行されることにより、上に例示した機能モジュール群が実現される。また、分類装置を構成する機能モジュールのうちの1つ以上を、ハードウエア回路として構成してもよい。
10 信号入力部、12 スペクトログラム生成部、14 前処理部、16 バンドパスフィルタ、18 非線形変換部、20 二値化部、22 二次元フーリエ変換部、24 分類処理部、26 周期性特徴検出部、28 画像ベース分類部、30 テンプレート画像DB、32 特徴ベース分類部、34 周期性特徴DB。

Claims (2)

  1. 1以上の事象の各々について、その事象に関して検出された時間変化信号のスペクトログラムの二次元フーリエ変換が持つ周期性の特徴を、テンプレート特徴として記憶する特徴記憶手段と、
    センサにより求められた分類対象の時間変化信号を処理して、当該分類対象の時間変化信号のスペクトログラムを生成するスペクトログラム生成手段と、
    前記スペクトログラム生成手段が生成したスペクトログラムの二次元フーリエ変換を計算する二次元フーリエ変換計算手段と、
    前記二次元フーリエ変換計算手段が求めた前記二次元フーリエ変換の画像から周期性の特徴を検出する特徴検出手段と、
    前記特徴記憶手段に記憶された前記テンプレート特徴の中から、前記特徴検出手段が検出した前記周期性の特徴に類似するものを特定する特定手段と、
    前記特徴検出手段が検出した前記周期性の特徴に類似するテンプレート特徴が前記特定手段により特定された場合には、前記分類対象の時間変化信号を、前記特定手段により特定されたテンプレート特徴に該当する事象に対応すると判定する判定手段と、
    を有する分類装置。
  2. コンピュータを、
    1以上の事象の各々について、その事象に関して検出された時間変化信号のスペクトログラムの二次元フーリエ変換が持つ周期性の特徴を、テンプレート特徴として記憶する特徴記憶手段、
    センサにより求められた分類対象の時間変化信号を処理して、当該分類対象の時間変化信号のスペクトログラムを生成するスペクトログラム生成手段、
    前記スペクトログラム生成手段が生成したスペクトログラムの二次元フーリエ変換を計算する二次元フーリエ変換計算手段、
    前記二次元フーリエ変換計算手段が求めた前記二次元フーリエ変換の画像から周期性の特徴を検出する特徴検出手段、
    前記特徴記憶手段に記憶された前記テンプレート特徴の中から、前記特徴検出手段が検出した前記周期性の特徴に類似するものを特定する特定手段、
    前記特徴検出手段が検出した前記周期性の特徴に類似するテンプレート特徴が前記特定手段により特定された場合には、前記分類対象の時間変化信号を、前記特定手段により特定されたテンプレート特徴に該当する事象に対応すると判定する判定手段、
    として機能させるためのプログラム。
JP2012204944A 2012-09-18 2012-09-18 分類装置及びプログラム Expired - Fee Related JP6048025B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2012204944A JP6048025B2 (ja) 2012-09-18 2012-09-18 分類装置及びプログラム
US13/790,377 US9218540B2 (en) 2012-09-18 2013-03-08 Apparatus and computer readable medium for signal classification using spectrogram and templates
SG2013027776A SG2013027776A (en) 2012-09-18 2013-04-12 Classification apparatus and program
AU2013204156A AU2013204156B2 (en) 2012-09-18 2013-04-12 Classification apparatus and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012204944A JP6048025B2 (ja) 2012-09-18 2012-09-18 分類装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2014059483A JP2014059483A (ja) 2014-04-03
JP6048025B2 true JP6048025B2 (ja) 2016-12-21

Family

ID=50274538

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012204944A Expired - Fee Related JP6048025B2 (ja) 2012-09-18 2012-09-18 分類装置及びプログラム

Country Status (4)

Country Link
US (1) US9218540B2 (ja)
JP (1) JP6048025B2 (ja)
AU (1) AU2013204156B2 (ja)
SG (1) SG2013027776A (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10713296B2 (en) 2016-09-09 2020-07-14 Gracenote, Inc. Audio identification based on data structure
US10803119B2 (en) 2017-01-02 2020-10-13 Gracenote, Inc. Automated cover song identification
US11003848B2 (en) * 2018-10-24 2021-05-11 Kyocera Document Solutions Inc. Variable data template management by template shape
WO2021044595A1 (ja) * 2019-09-05 2021-03-11 日本電気株式会社 マスク生成装置、マスク生成方法、および記録媒体
CN111723714B (zh) * 2020-06-10 2023-11-03 上海商汤智能科技有限公司 识别人脸图像真伪的方法、装置及介质
US11762954B2 (en) * 2020-07-14 2023-09-19 The Government Of The United States, As Represented By The Secretary Of The Army Unknown object classification through signal transform set
CN112651452A (zh) * 2020-12-30 2021-04-13 福州数据技术研究院有限公司 一种风机叶片异常检测方法及存储介质

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020122595A1 (en) 1999-06-04 2002-09-05 Rikk Crill Apparatus and method for radial and angular or rotational analysis of images for shape content and matching
US6678411B1 (en) 1999-06-04 2004-01-13 Look Dynamics, Inc. Apparatus and method for characterizing, encoding, storing, and searching images by shape
US6445822B1 (en) 1999-06-04 2002-09-03 Look Dynamics, Inc. Search method and apparatus for locating digitally stored content, such as visual images, music and sounds, text, or software, in storage devices on a computer network
US7117149B1 (en) * 1999-08-30 2006-10-03 Harman Becker Automotive Systems-Wavemakers, Inc. Sound source classification
US7103223B2 (en) 2000-03-27 2006-09-05 Look Dynamics, Inc. Apparatus and method for radial and angular or rotational analysis or images for shape content and matching
JP2002108393A (ja) * 2000-09-29 2002-04-10 Casio Comput Co Ltd 音声認証装置、音声認証方法、及び音声認証処理プログラムを記憶した記憶媒体
JP2002197437A (ja) * 2000-12-27 2002-07-12 Sony Corp 歩行検出システム、歩行検出装置、デバイス、歩行検出方法
JP2007240552A (ja) * 2006-03-03 2007-09-20 Kyoto Univ 楽器音認識方法、楽器アノテーション方法、及び楽曲検索方法
JP5294300B2 (ja) * 2008-03-05 2013-09-18 国立大学法人 東京大学 音信号の分離方法
GB0808586D0 (en) * 2008-05-12 2008-06-18 Qinetiq Ltd Method and apparatus for vehicle classification
JP2011237865A (ja) * 2010-05-06 2011-11-24 Advanced Telecommunication Research Institute International 生活空間の見守りシステム

Also Published As

Publication number Publication date
JP2014059483A (ja) 2014-04-03
US20140079323A1 (en) 2014-03-20
AU2013204156A1 (en) 2014-04-03
AU2013204156B2 (en) 2015-04-09
US9218540B2 (en) 2015-12-22
SG2013027776A (en) 2014-04-28

Similar Documents

Publication Publication Date Title
JP6048025B2 (ja) 分類装置及びプログラム
Meenpal et al. Facial mask detection using semantic segmentation
US11527055B2 (en) Feature density object classification, systems and methods
US10540988B2 (en) Method and apparatus for sound event detection robust to frequency change
Valada et al. Deep spatiotemporal models for robust proprioceptive terrain classification
US10706327B2 (en) Information processing apparatus, information processing method, and storage medium
US10424314B2 (en) Techniques for spatial filtering of speech
KR20170082025A (ko) 기계 학습 기반 얼굴 인식을 이용한 저작권을 가진 동영상 식별 장치 및 방법
Alhabib et al. Exploiting wavelet transform, principal component analysis, support vector machine, and k-nearest neighbors for partial face recognition
JP2008009728A (ja) 表情認識方法及び表情認識装置
Barkana et al. Environmental noise classifier using a new set of feature parameters based on pitch range
Sharan et al. Pseudo-color cochleagram image feature and sequential feature selection for robust acoustic event recognition
CN114708578A (zh) 唇部动作检测方法、装置、可读存储介质和电子设备
KR101743169B1 (ko) 얼굴 정보를 이용한 실종 가족 찾기 시스템 및 방법 그리고 이를 구현하는 프로그램을 기록한 기록 매체
US11830272B2 (en) Method and apparatus for identifying animal species
Krithika et al. MAFONN-EP: A minimal angular feature oriented neural network based emotion prediction system in image processing
Shah et al. Speech recognition using spectrogram-based visual features
Sunu et al. Dimensionality reduction for acoustic vehicle classification with spectral embedding
Uzkent et al. Pitch-range based feature extraction for audio surveillance systems
Kwak et al. Human action classification and unusual action recognition algorithm for intelligent surveillance system
JP6594278B2 (ja) 音響モデル学習装置、音声認識装置、これらの方法及びプログラム
Parineh et al. Detecting emergency vehicles With 1D-CNN using fourier processed audio signals
Sattar et al. A new event detection method for noisy hydrophone data
US11763805B2 (en) Speaker recognition method and apparatus
Oo et al. Acoustic scene classification by using combination of MODWPT and spectral features

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150306

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160315

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160509

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20161025

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20161107

R150 Certificate of patent or registration of utility model

Ref document number: 6048025

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees