JP6932898B1 - 信号判定装置及びプログラム - Google Patents

信号判定装置及びプログラム Download PDF

Info

Publication number
JP6932898B1
JP6932898B1 JP2020091724A JP2020091724A JP6932898B1 JP 6932898 B1 JP6932898 B1 JP 6932898B1 JP 2020091724 A JP2020091724 A JP 2020091724A JP 2020091724 A JP2020091724 A JP 2020091724A JP 6932898 B1 JP6932898 B1 JP 6932898B1
Authority
JP
Japan
Prior art keywords
signal
determination
detected
data
correlation coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020091724A
Other languages
English (en)
Other versions
JP2021189228A (ja
Inventor
臼井 誠
誠 臼井
光浩 松尾
光浩 松尾
宣男 真下
宣男 真下
Original Assignee
株式会社アートクリフ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社アートクリフ filed Critical 株式会社アートクリフ
Priority to JP2020091724A priority Critical patent/JP6932898B1/ja
Application granted granted Critical
Publication of JP6932898B1 publication Critical patent/JP6932898B1/ja
Publication of JP2021189228A publication Critical patent/JP2021189228A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Analysis (AREA)

Abstract

【課題】被検出信号を基準信号の中から検出する用途において、低負荷で高精度な検出判定が可能な信号判定装置及びプログラムを提供する。【解決手段】信号判定装置1は、特徴量抽出部100と、相関係数算出部50と、指数加重移動平均算出部60と、移動標準偏差算出部70と、判定部80と、を備えている。特徴量抽出部100では、基準信号と被検出信号がサンプリングされ、それぞれの信号の特徴量が数値化される。相関係数算出部50では、基準信号と被検出信号の特徴量を照合し、データの合致度合いを示す相関係数が算出される。当該相関係数から指数加重平均と、移動標準偏差と、が算出される。判定部80は相関係数と、指数加重移動平均と、移動標準偏差と、に基づいて基準信号の中から被検出信号を検出し、マッチング判定を行う。【選択図】図1

Description

本発明は、信号判定装置及びプログラムに関する。
波動信号の特徴を数値化し、その特徴量を対比する技術を用いたものとして、例えば、音声を機械やコンピュータに自動的に認識させる音声認識技術が挙げられる。当該技術では、入力した音声と予め用意された標準モデルとを比較し、音声照合を行っており、実行される当該音声照合は、入力した音声から特徴量を抽出し、標準モデルとの類似度を計算する技術である(例えば、特許文献1参照)。
ところで、このとき使用される音声照合手法では、入力した音声と、標準モデルとの類似度を算出する、HMM(Hidden Markov Model)、DPマッチング(Dynamic Program Matching)、ビタビアルゴリズム(Viterbi algorithm)等の手法がよく用いられている。
特開2002−91486号公報
しかしながら、HMM及びビタビアルゴリズムを用いた音声照合では、演算量が非常に増大するという課題があった。また、DPマッチングでは、2次元のモデル化の制限が課題となっている。そのため、例えば、2時間近い映画などの音声信号の中から被検出信号と同じ信号を検出する用途には、上記した類似度算出手法を適用することができないといった課題があった。
そこで、本発明は、上述の課題に鑑みてなされたものであり、被検出信号と同じ信号を検出する用途において、低負荷で高精度な検出判定が可能な信号判定装置及びプログラムを提供することを目的の一つとする。
形態1;本発明の1またはそれ以上の実施形態は、基準信号と被検出信号とを照合し、前記基準信号の中から前記被検出信号を検出しマッチング判定を行う信号判定装置であって、前記基準信号と前記被検出信号とをサンプリングし、信号の特徴量を示す次元データを抽出する特徴量抽出部と、前記基準信号と前記被検出信号との合致度合い示す相関係数を前記次元データに基づいて算出する相関係数算出部と、前記相関係数の指数加重移動平均を算出する指数加重移動平均算出部と、前記相関係数の移動標準偏差を算出する移動標準偏差算出部と、前記相関係数と、前記指数加重移動平均と、前記移動標準偏差と、に基づいて前記基準信号の中から前記被検出信号を検出し、マッチング判定を行う判定部と、を備えることを特徴とする信号判定装置を提案している。
形態2;本発明の1またはそれ以上の実施形態は、前記特徴量抽出部は、前記基準信号をサンプリングする場合、すべての前記基準信号をサンプリングし、当該サンプリングされたデータ毎に基準フレーム番号を付与し、前記被検出信号をサンプリングする場合、前記判定部で行われる判定の周期毎に、前記被検出信号の一部を判定用データとして間欠的にサンプリングし、当該サンプリングされたデータ毎に判定用フレーム番号を付与することを特徴とする信号判定装置を提案している。
形態3;本発明の1またはそれ以上の実施形態は、前記相関係数算出部は次元毎に算出された前記相関係数のうち、最小値又は最大値の少なくとも一方の値を除いて前記相関係数を算出することを特徴とする信号判定装置を提案している。
形態4;本発明の1またはそれ以上の実施形態は、前記判定部は1つの前記判定用データが前記基準信号の中から複数回検出されたとき、前記基準信号の中に前記被検出信号とマッチングする信号はないと判定することを特徴とする信号判定装置を提案している。
形態5;本発明の1またはそれ以上の実施形態は、前記判定部は、前記基準信号の中から前記被検出信号である第1の判定用データと第2の判定用データとが検出されたとき、前記第1の判定用データが検出された前記基準フレーム番号と前記第2の判定用データが検出された前記基準フレーム番号との差から算出された時間間隔と、前記第1の判定用データの前記判定用フレーム番号と前記第2の判定用データの前記判定用フレーム番号との差から算出された時間間隔と、が同等であれば、前記基準信号の中から前記第1の判定用データから前記第2の判定用データの間の前記被検出信号がマッチングしたと判定することを特徴とする信号判定装置を提案している。
形態6;本発明の1またはそれ以上の実施形態は、前記判定部は、前記基準信号の中から前記被検出信号が検出されたとき、当該検出された前記基準フレーム番号及び当該基準フレーム番号の前後のフレーム番号のデータから算出された前記相関係数に基づいて、前記基準信号の中から前記被検出信号が検出された位置を補正することを特徴とする信号判定装置を提案している。
形態7;本発明の1またはそれ以上の実施形態は、特徴量抽出部と、相関係数算出部と、指数加重移動平均算出部と、移動標準偏差算出部と、判定部と、を備え、基準信号と被検出信号とを照合し、前記基準信号の中から前記被検出信号を検出しマッチング判定を行う信号判定装置における信号判定をコンピュータに実行させるためのプログラムであって、前記特徴量抽出部が、前記基準信号と前記被検出信号とをサンプリングし、信号の特徴量を示す次元データを抽出する第1の工程と、前記相関係数算出部が、前記基準信号と前記被検出信号との合致度合い示す相関係数を前記次元データに基づいて算出する第2の工程と、前記指数加重移動平均算出部が、前記相関係数の指数加重移動平均を算出する第3の工程と、前記移動標準偏差算出部が、前記相関係数の移動標準偏差を算出する第4の工程と、前記判定部が、前記相関係数と、前記指数加重移動平均と、前記移動標準偏差と、に基づいて前記基準信号の中から前記被検出信号を検出しマッチング判定を行う第5の工程と、をコンピュータに実行させるためのプログラムを提案している。
本発明の1またはそれ以上の実施形態によれば、低負荷かつ高精度な照合が可能な信号判定装置及びプログラムを提供することができる。
本発明の第1の実施形態に係る信号判定装置1の構成を例示した図である。 本発明の第1の実施形態に係る信号判定装置1の基準信号取り込み処理フローである。 本発明の第1の実施形態に係る信号判定装置1の被検出信号判定処理フローである。 本発明の第1の実施形態に係る信号判定装置1における基準信号のデータサンプリングを例示した図である。 本発明の第1の実施形態に係る信号判定装置1における被検出信号のデータサンプリングを例示した図である。 本発明の第1の実施形態に係る信号判定装置1の相関係数算出部50で実行される処理を例示した図である。 本発明の第1の実施形態に係る信号判定装置1の指数加重移動平均算出部60で実行される処理を例示した図である。 本発明の第1の実施形態に係る信号判定装置1の判定部80で算出された評価値Vについて例示した図である。 本発明の第1の実施形態に係る信号判定装置1の検出位置精度向上の処理を例示した図である。 本発明の第1の実施形態に係る信号判定装置1の応用例を例示した図である。 本発明の第1の実施形態に係る信号判定装置1の応用例を例示した図である。
<第1の実施形態>
本発明は、予め格納された光や音などの波動信号の中から、被検出信号が検出されるかを判定する装置である。以下、本実施形態では、波動信号の一例として音声信号を判定する装置を例示して、説明する。
本実施形態に係る信号判定装置1は、基準信号の中から被検出信号を検出しマッチング判定する装置である。また、被検出信号が基準信号の中から検出されたとき、基準信号のどの位置で検出されたかを合わせて提示することができる装置である。
<信号判定装置1の構成>
図1に示すように、本実施形態に係る信号判定装置1は、特徴量抽出部100と、基準信号データ格納部30と、被検出信号データ格納部40と、相関係数算出部50と、指数加重移動平均算出部60と、移動標準偏差算出部70と、判定部80と、を含んで構成されている。
さらに、特徴量抽出部100は、サンプリング部10と、データ抽出部20と、を含んで構成されている。
サンプリング部10は、入力された音声信号をサンプリングする。ここで、当該サンプリングされた音声データは、データ抽出部20に転送される。
データ抽出部20は、入力された音声データの特徴量であるMFCCを算出し、データ照合に必要となる次元データを抽出する。基準信号がサンプリング部10に入力された場合は、データ抽出部20で抽出されたデータは基準信号データ格納部30に転送される。また、被検出信号がサンプリング部10に入力された場合は、データ抽出部20で抽出されたデータは被検出信号データ格納部40に転送される。
相関係数算出部50は、基準信号データ格納部30及び被検出信号データ格納部40に格納されているデータを読み出し、基準信号と被検出信号との合致度合いを示す相関係数を算出する。そして、算出された当該相関係数は、指数加重移動平均算出部60、移動標準偏差算出部70及び判定部80に転送される。
指数加重移動平均算出部60は、相関係数算出部50により算出された相関係数に基づいて、指数加重移動平均値を算出する。そして、算出された当該指数加重移動平均値は、判定部80に転送される。
移動標準偏差算出部70は、相関係数算出部50により算出された指数加重移動平均値に基づいて、移動標準偏差値を算出する。そして、算出された当該移動標準偏差値は、判定部80に転送される。
判定部80は、転送された相関係数、指数加重移動平均値及び移動標準偏差値に基づいて、評価値Vを算出し、被検出信号と基準信号とが合致したか否かの判断を行う。
<信号判定装置1の信号判定処理>
図2及び図3を用いて、本実施形態に係る信号判定装置1において実行される処理フローを詳細に説明する。
(基準信号サンプリング処理フロー)
図2を用いて、サンプリング部10における基準信号データの取り込み処理について説明する。
まず、サンプリング部10は、入力された基準信号をすべてサンプリングし、当該サンプリングされた基準信号データを10ms毎の音声データに分割する(ステップS1)。
そして、データ抽出部20は、ステップS1において分割された音声データ毎に、MFCCを抽出する。そして、当該抽出されたMFCC次元データに基準フレーム番号を付与し、基準信号データ格納部30に格納する(ステップS2)。
ここで、当該フレームとは、MFCCを抽出する処理を実行するために音声データを分割した単位であり、本実施形態に係る信号判定装置1では、10ms毎に音声データが分割され、MFCCが抽出される。従って、上記した10msというフレームサイズは変更可能であり、検出する信号や検出精度に合わせ、変更してもよい。
上記した基準信号サンプリング処理フローにより、入力された基準信号は特徴量に変換され、当該特徴量は基準信号データ格納部30に格納される。
(被検出信号の判定処理フロー)
図3を用いて、基準信号の中から被検出信号が検出されるか否かの判定を行う処理フローについて説明する。
まず、信号判定装置1はタイマーをゼロにリセットし、カウントアップを開始する(ステップS10)。
次に、サンプリング部10に入力された被検出信号を1500ms間サンプリングし、当該サンプリングした被検出信号を10ms毎に分割する(ステップS11)。
そして、データ抽出部20は、分割された被検出信号データ毎に信号の特徴を示すMFCCを抽出する。さらに、抽出されたデータ毎に判定用フレーム番号を付与し、被検出信号データ格納部40に格納する(ステップS12)。
ここで、当該フレームは上記した基準信号サンプリングのフレームと同様に、MFCCを抽出する処理を実行するために音声データを分割した単位である。フレームサイズは基準信号サンプリングで設定されたフレームサイズと同じに設定される。
次に、相関係数算出部50は、基準信号データ格納部30及び被検出信号データ格納部40に格納されているデータから相関係数を算出する(ステップS13)。
そして、指数加重移動平均算出部60は、ステップS13にて算出された相関係数に基づき、指数加重移動平均を算出する(ステップS14)。
次に移動標準偏差算出部70は、ステップS13にて算出された相関係数に基づき、移動標準偏差を算出する。(ステップS15)。
そして、判定部80は、ステップS13〜ステップS15において算出されたデータに基づいて、基準信号の中から被検出信号が検出されたか否かを判定する(ステップS16)。
次に、タイマーを確認し2000ms経過したか否かを確認する(ステップS17)。2000ms経過していない場合(ステップS17の「No」)は、2000ms経過するまでステップを進めず、待機状態となる。2000ms経過した場合は(ステップS17の「Yes」)は、処理をステップS18に進める。
そして、信号判定処理を継続するか否かを判定する(ステップS18)。信号判定処理を継続しない場合(ステップS18の「No」)は、すべての処理を終了する。信号判定処理を継続する場合(ステップS18の「Yes」)は、処理をステップS10に戻し、判定処理を継続する。
ここで、上記した処理フローで挙げた、サンプリング部10、データ抽出部20、相関係数算出部50、指数加重移動平均算出部60、移動標準偏差算出部70及び判定部80における処理に関しては、さらに詳細に説明する。
(サンプリング部10における信号処理)
図4〜図5を用いて、本実施形態に係る信号判定装置1のサンプリング部10の信号処理について詳細に説明する。
入力された音声信号は、デジタル信号に変換される。音声信号を対象とする場合は、例えば入力された音声信号は、サンプリング周波数16KHzの2byteのデータにサンプリングされる。
ここで、デジタル信号への変換に関しては、入力される音声信号の種類によって、サンプリング周波数及び分解能を変更してもよい。
次に、デジタル変換されたデータは、図4に示すように、MFCC抽出のためのフレームサイズである10ms毎の音声データに変換される。
基準信号がサンプリング部10に入力された場合、すべての基準信号が、図4に示すような10ms毎の音声データに変換され、当該変換された音声データ毎に基準フレーム番号が順番に付与される。これにより、基準信号の中から被検出信号が検出されたときに、基準フレーム番号が特定されれば、基準信号のどの位置(時間)で検出されたかを容易に算出することができる。
被検出信号がサンプリング部10に入力された場合には、図4と同様に10ms毎の音声データに変換されるが、当該変換されたデータの一部を判定用データとして取得する。図5に示すように、判定部80において行われる判定の周期毎に被検出信号の一部が判定用データとして間欠的にデータ取得される。本実施形態では、判定周期の2000ms毎に被検出信号の1500msの音声データが間欠的に取得される。また、基準フレーム番号と同様に、被検出信号から取得された1500msのデータには、判定用フレーム番号が付与される。
判定部80は、上記した間欠的に取得された1500msの音声データとすべての基準信号の音声データとの照合を行い、2000msに1回マッチング判定を行う。
ここで、上記したサンプリング部10における基準信号及び被検出信号のサンプリングに関連する設定時間は一例であり、被検出信号の種類や装置の処理能力などに合わせ適宜、変更してもよい。
(データ抽出部20における信号処理)
本実施形態に係る信号判定装置1は、音声信号の特徴量を表すために、MFCC(Mel-Frequency Cepstrum Coefficients)を用いて、音声信号の特徴量を数値化している。
信号の特徴量の取得方法は、判定する信号が音声以外の信号であれば、当該信号の特性により変更してもよい。
まず、データ抽出部20は、サンプリング部10において変換されたフレーム毎の音声データに対してFFT(Fast Fourier transform)解析を実行し、振幅スペクトルを求める。例えば、この時のFFT次元数は2048次元である。
そして、当該振幅スペクトルに、人間の聴覚特性を適用(例えば、メルフィルターバンクを適用)し、MFCCデータを算出する。ここで算出されたMFCC次元数は20次元であるが、信号判定装置1では、例えば、このうちの9次元分を抽出し、信号判定している。
ここで、抽出する次元数は、人の発話だけの照合であれば、さらに抽出する次元数を少なくすることが可能である。すなわち、信号判定装置1は被検出信号を精度よく検出できればよく、検出する信号により抽出する次元数を変更してもよい。また、抽出する次元数は検出対象となる音源に含まれる周波数によって次元数を変更してもよい。
データ抽出部20において抽出されたデータには、フレーム番号が付与され、基準信号は基準信号データ格納部30に格納され、被検出信号は被検出信号データ格納部40に格納される。なお、図5に示した番号の付与方法は一例であり、当該方法に限定されるわけではない。
(相関係数算出部50における処理)
相関係数算出部50は、基準信号データ格納部30に格納された基準信号のMFCC抽出データと、被検出信号データ格納部40に格納された被検出信号のMFCC抽出データとを比較し、信号間の合致度を示す、相関係数を算出する。
図6を用いて、相関係数算出部50において行われる相関係数算出処理について詳細な説明をする。
図6(a)は基準信号データ格納部30に格納されているデータ構成を例示した図である。基準信号データには、基準フレーム番号が付与され、フレーム毎にデータが格納されている。なお、上記においては、本実施形態の信号判定装置1が、9次元のデータを抽出するとしたが、図6では6次元とした場合を例示し説明する。
従って、基準信号データは、1フレーム〜mフレームで構成され、各フレームは基準データ1〜6で構成されている。
図6(b)は、被検出信号データ格納部40に格納されているデータ構成を同様に例示した図である。被検出信号データには、判定用フレーム番号が付与され、フレーム毎にデータが格納されている。
前述したように、本実施形態の信号判定装置1は被検出信号の一部をサンプリングしている。本実施形態においては、1500msの音声データを用いて、2000msに1回音声が合致したかを判定するため、判定用フレーム番号は1〜150まで付与されている(10ms×150=1500ms)。なお、上記においては、信号判定装置1の被検出信号データが9次元のデータを抽出するとしたが、図6では基準信号と同数である6次元として説明する。
従って、被検出信号データは、1フレーム〜150フレームで構成され、各フレームは検出データ1〜6で構成されている。
相関係数算出部50は、基準信号データと被検出信号データと、に基づいて、次元毎の相関係数を算出する。
具体的には、150フレーム(1500ms)分の被検出信号データを基準フレーム番号の先頭フレームから1フレームずつずらしていき、最終フレームに至るまで1フレーム毎に次元毎の相関係数を算出する。
図6(e)に例示するように、まず図6(b)の被検出信号データが図6(a)の基準信号データと照合され、次元毎の相関係数が算出される。
図6(c)に例示するように、まず、基準フレーム番号1を先頭データとし、当該データと被検出信号データとを照合し、次元毎の相関係数を算出する。次に、被検出信号データを1フレームずらし、基準フレーム番号2を先頭データとし、当該データと被検出信号データとが照合される。このように、被検出信号データを1フレームずつずらしながら、基準フレーム番号1〜mまで、次元毎の相関係数を算出する。
ここで、例えば算出される次元毎の相関係数R11は以下に示す数1により算出することができる。
Figure 0006932898
基準信号データX11〜X1501と、被検出信号データY11〜Y1501と、の合致度合いを示す次元毎の相関係数R11は、数1に各数値を代入することで、算出することができる。
次に、被検出信号データを1フレームずらした相関係数R21を算出するときは、基準信号データX21〜X1511と、被検出信号データY11〜Y1501と、を数1に代入することで相関係数R21を算出することができる。
このように基準フレーム毎及び次元データ毎に相関係数を算出することによって、図6(e)に示すような次元毎の相関係数を算出することができる。
次に、相関係数算出部50は算出された次元毎の相関係数から、基準フレーム毎の相関係数Rを算出する。
本実施形態の信号判定装置1では、フレーム毎、次元毎に算出された相関係数のうち、一番小さい数値のデータを破棄し、当該データを除いた相関係数の平均値を相関係数Rとしている。
例えば、図6(e)の次元毎の相関係数R11〜R16の比較において、例えば相関係数R13が最小値であるとき、相関係数R13を除いた、相関係数R11、R12、R14、R15、R16の数値の平均値を算出し、当該平均値を相関係数R1としている。同様に相関係数R21〜R26の比較を行い、相関係数R2を算出することができる。
ここで、相関係数の最小値を取り除くことで、音声データにおける特定の周波数に発生している信号のノイズを除去し、誤検出の発生を抑制し、検出精度を向上することができる。
また、本実施形態の信号判定装置1では最小値のみを取り除いたが、当該算出方法は一例であり、被検出信号の種類や特性によって、最大値を削除する、または、最小値から2つのデータを削除するなどの計算手法に代えてもよい。
(指数加重移動平均算出部60における処理)
指数加重移動平均算出部60は、上述の相関係数算出部50の算出結果に基づき、指数加重移動平均を算出する。
基準フレーム番号kにおける指数加重移動平均Eは以下の数2、数3により算出することができる。
Figure 0006932898
Figure 0006932898
ここで、nは基準信号と比較する被検出信号のフレーム数であり、本実施形態ではn=150である。
上記数式のとおり、指数加重移動平均Eは基準フレーム番号kより以前のフレーム番号の相関係数を含めて算出される。そのため、相関係数Rの変化は、基準フレーム番号kより以降のフレーム番号で算出された指数加重移動平均に変化が現れる。
すなわち、算出した指数加重移動平均Eの変化と相関係数Rの変化がずれることになる。
そのため、判定装置に求められる判定精度や検出する信号の種類などによっては、上記した変化のずれを補正するために、ずれが生じているフレーム数だけ算出結果をずらし、当該ずらした値を指数加重移動平均としてもよい。
そして、指数加重移動平均算出部60は、基準フレーム番号1〜mまで、基準フレーム番号毎に指数加重移動平均を算出する。
ここで、本実施形態の信号判定装置1では、計算対象となる基準フレーム番号の前後150フレームを用いて指数加重移動平均を算出したが、フレーム数は一例であり、信号の種類や検出精度に合わせて変更してもよい。
(移動標準偏差算出部70における処理)
移動標準偏差算出部70は、上述の相関係数算出部50の算出結果に基づき、移動標準偏差を算出する。
図7を用いて、移動標準偏差の算出方法を説明する。
基準フレーム番号jにおける移動標準偏差Sは、算出対象の基準フレーム番号の前後150フレーム分の相関係数から算出され、例えば、図7に示すような、R(j−150)〜R(j+150)の相関係数の値から移動標準偏差Sが算出される。
以下に示す数4により、移動標準偏差Sは求められる。
Figure 0006932898
そして、移動標準偏差算出部70は、基準フレーム番号1〜mまで、基準フレーム番号毎に移動標準偏差を算出する。
ここで、本実施形態の信号判定装置1では、計算対象となる基準フレーム番号の前後150フレームを用いて移動標準偏差を算出したが、フレーム数は一例であり、信号の種類や検出精度に合わせて変更してもよい。
(判定部80における処理)
判定部80は、相関係数算出部50、指数加重移動平均算出部60及び移動標準偏差算出部70において算出された数値に基づき、評価値Vを算出し、信号のマッチング判定を行う。
評価値Vは、フレーム毎に算出された相関係数R、指数加重移動平均E、移動標準偏差Sを以下の式に代入することで、算出することができる。
Figure 0006932898
また、上記数5内の係数は、以下の数6で算出することができる。
Figure 0006932898
評価値Vは、マッチングが検出される基準フレーム番号における相関係数の指数加重移動平均と当該フレーム番号近傍の相関係数の指数加重移動平均との差が正規分布であると仮定し、当該フレーム番号近傍の標準偏差と比較している。従って、上式で算出された評価値Vの値からマッチングの判定をすることができる。
図8には、相関係数R、指数加重移動平均E及び移動標準偏差Sから算出される評価値Vの計算結果を例示する。
例えば、本実施形態における信号判定装置1では、評価値V≧1.0の場合に、マッチングするフレームが有ると判断し、当該評価値Vの最大値の基準フレーム番号を検出位置としている。
図8では、評価値Vが1.0以上のフレームは基準フレーム番号13である。このとき、信号判定装置1は、基準信号の中に被検出信号を検出したと判定し、さらに、検出位置が基準フレーム番号13であると判定する。
ここで、判定部80では、相関係数R、指数加重移動平均E及び移動標準偏差Sから評価値Vが算出できればよく、上記した数式に限定されない。また、上記した係数に関しても、検出する信号の種類や装置に求められる検出精度によって、変更してもよい。
また、信号判定装置1の判定部80の判定では、誤検出や誤判定を抑制するために、評価値Vの値が1.0以上となるフレームが2つ以上存在した場合は、マッチングする信号はないと判断している。
また、信号判定装置1では、誤検出や誤判定を抑制するために、1つの評価用データのマッチングだけでマッチング判定するのではなく、マッチング検出された、2つの評価用データにてマッチング判定を行う方法を提案している。
具体的には、図5に示す判定用データ1及び判定用データ3において、判定部80においてマッチング判定が行われ、それぞれのマッチング判定された基準フレーム番号をA及びBと仮定する。
判定用データ1及び判定用データ3は2000ms毎にサンプリングされた1500msのデータである。従って、この判定用データ1と判定用データ3との時間間隔は4000msであることが算出できる。
また、基準フレーム番号A及び基準フレーム番号Bの間にはB−Aのフレーム数が存在する。そのため、基準フレーム番号Aと基準フレーム番号Bとの時間間隔は、(B−A)×10msにより算出することができる。
すなわち、信号判定装置1は判定用データから算出された時間間隔と基準フレーム番号から算出された時間間隔とが同等のとき、基準信号の中に被検出信号を検出したと判定している。上記した時間間隔が同等とは、それぞれの時間間隔が10%以内のズレであれば、判定部80はマッチングしていると判定する。
ここで上記した時間間隔が同等と判定するズレの許容値は、10%以内に限定されるわけではなく、検出する信号の種類や検出精度に合わせて許容値を変更してもよい。
さらに、判定部80は、被検出信号が検出された基準信号の位置をさらに精度よく特定する処理を実行する。
上記したように、基準信号の中から被検出信号が検出されたとき、当該検出された被検出信号の位置は、基準フレーム番号により提示することができる。
しかしながら、基準フレーム番号の1フレーム分には10msの時間幅があるため、それ以上の精度で検出位置を特定することは難しい。そこで、判定部80では、相関係数算出部50の算出結果をさらに反映することで、検出位置の精度を上げることを実現している。
判定部80は、被検出信号のマッチングが検出された基準フレーム番号とその前後の基準フレーム番号とにおける相関係数を用いることで検出位置精度を上げている。
図9は、基準フレーム番号と相関係数Rとの関係を表した図である。
基準フレーム番号Aは、判定部80においてマッチング判定された基準フレーム位置である。また、基準フレーム番号B及び基準フレーム番号Cは基準フレーム番号Aのそれぞれ前後のフレーム番号である。そして、基準フレーム番号A〜基準フレーム番号Cにおける相関係数Rの値がそれぞれ、α、β、γである。
まず、マッチングした基準フレーム番号の前後のフレームの相関係数β及びγの大小関係を確認する。
仮に、図9に示すように、β<γの場合には、補正係数Fは以下の数7で算出される。
Figure 0006932898
そして、この補正係数を検出された基準フレーム番号Aに反映して、補正した検出位置を以下の数8により算出する。
Figure 0006932898
Figure 0006932898
そして、この補正係数を検出された基準フレーム番号Aに反映して、補正した検出位置を以下の数10により算出する。
Figure 0006932898
このように、マッチング検出された基準フレームと前後のフレームにおける相関係数を用いることで、マッチング検出されたフレーム位置が精度よく検出することができる。
ここで、上記では、前後の1フレームを使用した算出方法であったが、前後の1フレームだけに限定するものではなく、前後数フレームの相関係数を加えて算出してもよい。
<作用・効果>
以上、説明したように、本実施形態に係る信号判定装置1は、基準信号と被検出信号とを照合し、基準信号の中から被検出信号を検出しマッチング判定を行う信号判定装置1であって、基準信号と被検出信号とをサンプリングし、信号の特徴量を示す次元データを抽出する特徴量抽出部100と、基準信号と被検出信号との合致度合い示す相関係数を次元データに基づいて算出する相関係数算出部50と、相関係数の指数加重移動平均を算出する指数加重移動平均算出部60と、相関係数の移動標準偏差を算出する移動標準偏差算出部70と、相関係数と、指数加重移動平均と、移動標準偏差と、に基づいて基準信号の中から被検出信号を検出し、マッチング判定を行う判定部80と、を備えている。
本実施形態に係る信号判定装置1は、特徴量抽出部100と、相関係数算出部50と、指数加重移動平均算出部60と、移動標準偏差算出部70と、判定部80と、を備えている。特徴量抽出部100では、基準信号と被検出信号がサンプリングされ、それぞれの信号の特徴量が数値化される。相関係数算出部では、基準信号と被検出信号の特徴量を照合し、データの合致度合いを示す相関係数が算出される。判定部80は相関係数算と、指数加重移動平均と、移動標準偏差と、に基づいて基準信号の中から被検出信号を検出し、マッチング判定を行う。
この構成によれば、判定部80は相関係数と、指数加重移動平均と、移動標準偏差と、に基づいて基準信号の中から被検出信号を検出する。そのため、高精度な信号検出判定をすることができる。
本実施形態に係る信号判定装置1の特徴量抽出部100は、基準信号をサンプリングする場合、すべての基準信号をサンプリングし、当該サンプリングされたデータ毎に基準フレーム番号を付与し、被検出信号をサンプリングする場合、判定部80で行われる判定の周期毎に、被検出信号の一部を判定用データとして間欠的にサンプリングし、サンプリングされたデータ毎に判定用フレーム番号を付与する。
特徴量抽出部100では、基準信号はすべての信号をサンプリングするが、被検出信号は判定部80で判定が実行される周期毎に被検出信号の一部をサンプリングする。また、それぞれサンプリングされたデータにはデータ毎に番号が付与される。
この構成によれば、被検出信号の一部をサンプリングし信号検出を行う。そのため、低負荷な検出処理となり、検出とサンプリングをリアルタイムに行うことができる。また、サンプリングされたデータ毎に番号が付与されているため、マッチング検出された信号の位置を容易に特定することができる。
本実施形態に係る信号判定装置1の相関係数算出部50は次元毎に算出された相関係数のうち、最小値又は最大値の少なくとも一方の値を除いて相関係数を算出する。
相関係数算出部50では、被検出信号のノイズなどで相関係数に影響が出ることを考慮し、次元毎に算出された相関係数の最大値と最小値との少なくとも一方を相関係数の算出に使用しない。
この構成によれば、被検出信号のノイズの影響を除去できる。そのため、誤判定を抑制することができ、高精度な信号検出判定をすることができる。
本実施形態に係る信号判定装置1の判定部80は、1つの判定用データが基準信号の中から複数回検出されたとき、基準信号の中に被検出信号とマッチングする信号はないと判定する。
この構成によれば、1つの判定用データが基準信号の中から複数回検出されたとき、基準信号の中に被検出信号とマッチングする信号はないと判定する。そのため、誤検知を抑制することができる。
本実施形態に係る信号判定装置1の判定部80は、基準信号の中から被検出信号である第1の判定用データと第2の判定用データとが検出されたとき、第1の判定用データが検出された基準フレーム番号と第2の判定用データが検出された基準フレーム番号との差から算出された時間間隔と、第1の判定用データの判定用フレーム番号と第2の判定用データの判定用フレーム番号との差から算出された時間間隔と、が同等であれば、基準信号の中から第1の判定用データから第2の判定用データの間の被検出信号がマッチングしたと判定する。
信号判定装置1の判定部80は、基準信号の中から被検出信号である第1の判定用データと第2の判定用データとが検出されたとき、基準信号の中から第1の判定用データと第2の判定用データとが検出された基準フレーム番号から2つの判定用データの時間間隔を算出する。また、被検出信号の中から判定用データと第2の判定用データとに付与された判定用フレーム番号から2つの判定用データの時間間隔を算出する。上記した2つの時間間隔が同等のとき、第1の判定用データから第2の判定用データの間のデータが、基準信号から検出されたと判断する。
この構成によれば、判定部80は、2つの判定用データと、2つの判定用データの時間情報と、を使用し、基準信号の中から被検出信号を検出する。そのため、誤判定を抑制し、高精度な信号検出判定をすることができる。
本実施形態に係る信号判定装置1の判定部80は、基準信号の中から被検出信号が検出されたとき、当該検出された基準フレーム番号及び当該基準フレーム番号の前後のフレーム番号のデータから算出された相関係数に基づいて、基準信号の中から被検出信号が検出された位置を補正する。
この構成によれば、基準信号の中から被検出信号が検出されたとき、再度相関係数に基づいて、基準信号の中の検出位置を補正する。そのため、高精度な信号検出判定をすることができる。
また、本実施形態に係る信号判定プログラムは、特徴量抽出部100と、相関係数算出部50と、指数加重移動平均算出部60と、移動標準偏差算出部70と、判定部80と、を備え、基準信号と被検出信号とを照合し、基準信号の中から被検出信号を検出しマッチング判定を行う信号判定装置1における信号判定をコンピュータに実行させるためのプログラムであって、特徴量抽出部100が、基準信号と被検出信号とをサンプリングし、信号の特徴量を示す次元データを抽出する第1の工程と、相関係数算出部50が、基準信号と被検出信号との合致度合い示す相関係数を次元データに基づいて算出する第2の工程と、指数加重移動平均算出部60が、相関係数の指数加重移動平均を算出する第3の工程と、移動標準偏差算出部70が、相関係数の移動標準偏差を算出する第4の工程と、判定部80が、相関係数と、指数加重移動平均と、移動標準偏差と、に基づいて基準信号の中から被検出信号を検出し、マッチング判定を行う第5の工程と、をコンピュータに実行させるためのプログラムである。
このプログラムによれば、判定部80は相関係数と、指数加重移動平均と、移動標準偏差と、に基づいて基準信号の中から被検出信号を検出する。そのため、高精度な信号検出判定ができるプログラムをコンピュータに実行させることができる。
[その他の実施の形態]
本発明は、上記実施形態に限定されるものではなく、要旨を逸脱しない範囲において、種々変形可能である。
(応用例1)
応用例1は、信号判定装置1で実行される演算処理の負荷をさらに低減させる例を示したものである。
図6(c)に例示するように信号判定装置1では、まず、基準フレーム番号1を先頭データとし、当該データと被検出信号データとを照合し、マッチング判定が行われる。次に、被検出信号データを1フレームずらし、基準フレーム番号2を先頭データとしたデータと被検出信号データとが照合される。このように、被検出信号データを1フレームずつずらしながら、基準フレーム番号1〜mまで、マッチング判定が行われる。
例えば、基準信号の長さが60分であった場合、基準信号データは基準フレーム番号1〜360000のデータで構成される(10ms×360000=60分)。従って、被検出信号とのデータ照合処理は360000回実行される。
例えば、図10に示すように、判定用データGと基準信号データとが照合され、マッチングが検出されたとき、次に照合される判定用データHの照合は、判定用データGにおいてマッチング検出された基準フレーム番号の前後一定区間とのみと照合され、マッチング検出が行われる。このように、一つ前の判定用データでマッチングが検出された場合、基準信号の照合範囲を限定することで、演算数を減らすことができる。
仮に、判定用データGとの照合において、基準フレーム番号10000の位置でマッチングが検出されたとき、判定用データHとのデータ照合は、基準フレーム番号5000〜15000(マッチング検出された基準フレーム番号±5000フレーム)のデータと照合される。従来は、毎回360000回の照合を実施していたが、当該処理を行うことで、10000回の照合で処理を終了することができ、信号判定装置の演算負荷を低減することができる。基準信号の長さは、映画であれば数時間となる場合もあるため、当該処理を実行することで、大幅に演算負荷を低減することができる。
ここで、マッチングが検出された以降に実行されるデータ照合のフレーム数は上記した5000フレームに限定されるわけではなく、信号の検出精度や信号判定装置の処理能力などによってフレーム数を変更してもよい。
(応用例2)
第1の実施形態に係る信号判定装置1では、波動信号の一つである音声信号を例に説明したが、動画にも適用することも可能である。
動画を検出する場合は、まず動画信号をフレーム毎に時分割する。例えば、30Fpsや60Fpsのフレームレートで時分割された画像を抽出する。
そして、図11に示すように、当該画像は格子状に分割され、当該分割された画像毎にRGB値からグレイレベルを算出する。図11では、画像を16分割しているが、検出する画像や検出精度に合わせて、画面の分割数を変更してもよい。
次に、当該算出されたグレイレベルに対してDCT変換(discrete cosine transform)を実行し、空間周波数成分を算出する。
そして、空間周波数成分の算出結果に基づいて画像の特徴量を抽出し、相関係数、指数加重移動平均、移動標準偏差を算出することで、基準動画の中から被検出動画を検出することができる。
上記した画像データ処理方法は一例である。つまり、当該処理では画像の特徴量が抽出できればよく、画像データ処理方法を変更してもよい。
1;信号判定装置
10;サンプリング部
20;データ抽出部
30:基準信号データ格納部
40;被検出信号データ格納部
50;相関係数算出部
60;指数加重移動平均算出部
70;移動標準偏差算出部
80;判定部
100;特徴量抽出部

Claims (7)

  1. 基準信号と被検出信号とを照合し、前記基準信号の中から前記被検出信号を検出しマッチング判定を行う信号判定装置であって、
    前記基準信号と前記被検出信号とをサンプリングし、信号の特徴量を示す次元データを抽出する特徴量抽出部と、
    前記基準信号と前記被検出信号との合致度合い示す相関係数を前記次元データに基づいて算出する相関係数算出部と、
    前記相関係数の指数加重移動平均を算出する指数加重移動平均算出部と、
    前記相関係数の移動標準偏差を算出する移動標準偏差算出部と、
    前記相関係数と、前記指数加重移動平均と、前記移動標準偏差と、に基づいて前記基準信号の中から前記被検出信号を検出し、マッチング判定を行う判定部と、
    を備えることを特徴とする信号判定装置。
  2. 前記特徴量抽出部は、前記基準信号をサンプリングする場合、すべての前記基準信号をサンプリングし、当該サンプリングされたデータ毎に基準フレーム番号を付与し、
    前記被検出信号をサンプリングする場合、前記判定部で行われる判定の周期毎に、前記被検出信号の一部を判定用データとして間欠的にサンプリングし、当該サンプリングされたデータ毎に判定用フレーム番号を付与することを特徴とする請求項1に記載の信号判定装置。
  3. 前記相関係数算出部は次元毎に算出された前記相関係数のうち、最小値又は最大値の少なくとも一方の値を除いて前記相関係数を算出することを特徴とする請求項2に記載の信号判定装置。
  4. 前記判定部は1つの前記判定用データが前記基準信号の中から複数回検出されたとき、前記基準信号の中に前記被検出信号とマッチングする信号はないと判定することを特徴とする請求項2又は3に記載の信号判定装置。
  5. 前記判定部は、前記基準信号の中から前記被検出信号である第1の判定用データと第2の判定用データとが検出されたとき、
    前記第1の判定用データが検出された前記基準フレーム番号と前記第2の判定用データが検出された前記基準フレーム番号との差から算出された時間間隔と、
    前記第1の判定用データの前記判定用フレーム番号と前記第2の判定用データの前記判定用フレーム番号との差から算出された時間間隔と、
    が同等であれば、前記基準信号の中から前記第1の判定用データから前記第2の判定用データの間の前記被検出信号がマッチングしたと判定することを特徴とする請求項2〜4のいずれか1項に記載の信号判定装置。
  6. 前記判定部は、前記基準信号の中から前記被検出信号が検出されたとき、当該検出された前記基準フレーム番号及び当該基準フレーム番号の前後のフレーム番号のデータから算出された前記相関係数に基づいて、前記基準信号の中から前記被検出信号が検出された位置を補正することを特徴とする請求項2〜5のいずれか1項に記載の信号判定装置。
  7. 特徴量抽出部と、相関係数算出部と、指数加重移動平均算出部と、移動標準偏差算出部と、判定部と、を備え、基準信号と被検出信号とを照合し、基準信号の中から被検出信号を検出しマッチング判定を行う信号判定装置における信号判定をコンピュータに実行させるためのプログラムであって、
    前記特徴量抽出部が、前記基準信号と前記被検出信号とをサンプリングし、信号の特徴量を示す次元データを抽出する第1の工程と、
    前記相関係数算出部が、前記基準信号と前記被検出信号との合致度合い示す相関係数を前記次元データに基づいて算出する第2の工程と、
    前記指数加重移動平均算出部が、前記相関係数の指数加重移動平均を算出する第3の工程と、
    前記移動標準偏差算出部が、前記相関係数の移動標準偏差を算出する第4の工程と、
    前記判定部が、前記相関係数と、前記指数加重移動平均と、前記移動標準偏差と、に基づいて前記基準信号の中から前記被検出信号を検出しマッチング判定を行う第5の工程と、をコンピュータに実行させるためのプログラム。
JP2020091724A 2020-05-26 2020-05-26 信号判定装置及びプログラム Active JP6932898B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020091724A JP6932898B1 (ja) 2020-05-26 2020-05-26 信号判定装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020091724A JP6932898B1 (ja) 2020-05-26 2020-05-26 信号判定装置及びプログラム

Publications (2)

Publication Number Publication Date
JP6932898B1 true JP6932898B1 (ja) 2021-09-08
JP2021189228A JP2021189228A (ja) 2021-12-13

Family

ID=77549958

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020091724A Active JP6932898B1 (ja) 2020-05-26 2020-05-26 信号判定装置及びプログラム

Country Status (1)

Country Link
JP (1) JP6932898B1 (ja)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB201220907D0 (en) * 2012-11-21 2013-01-02 Secr Defence Method for determining whether a measured signal matches a model signal
JP5684321B2 (ja) * 2013-04-24 2015-03-11 日本電信電話株式会社 部分映像検出装置、部分映像検出方法、及び部分映像検出プログラム
JP2015055835A (ja) * 2013-09-13 2015-03-23 綜合警備保障株式会社 話者認識装置、話者認識方法及び話者認識プログラム
JP6413741B2 (ja) * 2014-12-16 2018-10-31 日本電気株式会社 振動発生源推定装置、方法およびプログラム

Also Published As

Publication number Publication date
JP2021189228A (ja) 2021-12-13

Similar Documents

Publication Publication Date Title
EP3566225B1 (en) Methods and apparatus for cough detection in background noise environments
KR101988222B1 (ko) 대어휘 연속 음성 인식 장치 및 방법
JP2009151299A (ja) 音声スペクトルピーク検出方法及び装置、音声認識方法およびシステム
US8050910B2 (en) Pitch extraction with inhibition of harmonics and sub-harmonics of the fundamental frequency
CN112927694B (zh) 一种基于融合声纹特征的语音指令合法性判别方法
CN111508480B (zh) 音频识别模型的训练方法、音频识别方法、装置及设备
CN112530407B (zh) 一种语种识别方法及系统
KR20070034881A (ko) 음성 구간 검출 장치 및 방법
CN110634490B (zh) 一种声纹鉴定方法、装置和设备
JP2018159788A5 (ja) 情報処理装置、感情認識方法、及び、プログラム
CN110044375B (zh) 一种基于加速度计的新型计步方法
JP6023311B2 (ja) ピッチ周期の正確性を検出するための方法および装置
CN110890087A (zh) 一种基于余弦相似度的语音识别方法和装置
JP7160095B2 (ja) 属性識別装置、属性識別方法、およびプログラム
JP6932898B1 (ja) 信号判定装置及びプログラム
CN117076941A (zh) 一种光缆鸟害监测方法、系统、电子设备及可读存储介质
CN113939871A (zh) 讲话区间检测装置、讲话区间检测方法及讲话区间检测程序
JP2019049829A (ja) 目的区間判別装置、モデル学習装置、及びプログラム
CN107993666B (zh) 语音识别方法、装置、计算机设备及可读存储介质
CN111862991A (zh) 一种婴儿哭声的识别方法及系统
CN113051975B (zh) 人流量统计方法及相关产品
JP2001318687A (ja) 音声認識装置
CN113113051A (zh) 音频指纹提取方法、装置、计算机设备和存储介质
JP2011039434A (ja) 音声認識装置およびその特徴量正規化方法
JP2007244478A (ja) 脈波計及び脈波検出方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200528

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210713

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210730

R150 Certificate of patent or registration of utility model

Ref document number: 6932898

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150