JP4762871B2 - 信号箇所・変動パラメータ検出方法、信号箇所・変動パラメータ検出装置ならびにそのプログラムと記録媒体 - Google Patents

信号箇所・変動パラメータ検出方法、信号箇所・変動パラメータ検出装置ならびにそのプログラムと記録媒体 Download PDF

Info

Publication number
JP4762871B2
JP4762871B2 JP2006329444A JP2006329444A JP4762871B2 JP 4762871 B2 JP4762871 B2 JP 4762871B2 JP 2006329444 A JP2006329444 A JP 2006329444A JP 2006329444 A JP2006329444 A JP 2006329444A JP 4762871 B2 JP4762871 B2 JP 4762871B2
Authority
JP
Japan
Prior art keywords
feature
basic
target
signal
degenerate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006329444A
Other languages
English (en)
Other versions
JP2008145505A (ja
Inventor
隆行 黒住
昭悟 木村
秀尚 永野
邦夫 柏野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2006329444A priority Critical patent/JP4762871B2/ja
Publication of JP2008145505A publication Critical patent/JP2008145505A/ja
Application granted granted Critical
Publication of JP4762871B2 publication Critical patent/JP4762871B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、音響信号検出や映像信号検出、例えば、FM放送の音響信号やテレビの映像信号に含まれるCMや番組、楽曲の信号の断片をキーとして、膨大な音や映像のデータベースの中から同一の信号を高速に検出し、信号の箇所と変動パラメータを取得し、コンテンツの利用状況の確認を行う処理のように、蓄積信号の中から目的信号と類似した信号箇所と変動パラメータを探し出す信号箇所・変動パラメータ検出方法、信号箇所・変動パラメータ検出装置ならびにそのプログラムと記録媒体に関する。
従来、信号箇所及び変動パラメータ検出方法に関しては、特許文献1の「高速信号検出法、装置およびその記録媒体」のように、ヒストグラムの類似度から照合の必要のない区間をスキップしながら高速に照合を行う信号検出方法が知られている。
また特許文献2の「信号検出方法及び装置、プログラムならびに記録媒体」のように、信号を部分空間に射影してから信号検出を行う方法が知られている。
また特許文献3の「音響信号検出システム,音響信号検出サーバ,映像信号探索装置,映像信号探索方法,映像信号探索プログラムと記録媒体,信号探索装置,信号探索方法,及び,信号探索プログラムと記録媒体」のように、信号の特徴的な箇所のみを照合して信号検出を行う方法が知られている。
特許第3065314号公報 特許第3746690号公報 国際公開番号第2006/006528号パンフレット
しかしながら特許文献1の技術では、ヒストグラムを作成するためにクラスタリングに基づいてベクトル量子化を行なうため、量子化範囲に収まらないほどの変動のあった信号を照合するには向いていないという欠点があった
また特許文献2の技術では、定常的な加法性雑音や乗法性ひずみを吸収することができるが,突発的な雑音,信号の伸縮,ピッチ変動には対応できないという欠点があった。
また特許文献3の技術では、突発的な雑音に強いが、信号の伸縮やピッチ変動には対応できないという欠点があった。
そこでこの発明は、蓄積信号の中から目的信号と類似した信号箇所と変動パラメータを探し出すにあたり、量子化範囲に収まらないほどの変動のあった目的信号の蓄積信号からの照合に適しており、また目的信号に突発的な雑音、信号の伸縮、ピッチ変動があったとしても蓄積信号からの照合ができる信号箇所・変動パラメータ検出方法、信号箇所・変動パラメータ検出装置ならびにそのプログラムと記録媒体を提供することを目的としている。
上記目的を達成するために、本発明は、蓄積信号の中から、目的信号と類似した信号箇所と変動パラメータを探索する信号箇所・変動パラメータ検出装置の信号箇所・変動パラメータ検出方法であって、蓄積信号から抽出された、ベクトルからなる蓄積基本特徴と、当該蓄積基本特徴の中から一つまたは複数の特徴を選び出し該基本特徴同士の関係から計算された蓄積縮退特徴と、を記憶し、目的信号からベクトルからなる目的基本特徴を抽出する目的基本特徴抽出過程と、前記目的基本特徴の中から一つまたは複数の特徴を選び出し該基本特徴同士の関係から縮退特徴を計算することで目的縮退特徴を抽出する目的縮退特徴抽出過程と、前記目的縮退特徴と同一または類似の前記蓄積縮退特徴に対応する基本特徴同士の入力を受け付けて、当該基本特徴同士の関係から目的基本特徴と蓄積基本特徴との間の変動パラメータを計算する変動パラメータ抽出過程と、前記変動パラメータ抽出過程により導かれた前記変動パラメータを用いて、前記目的基本特徴から前記蓄積基本特徴に対応する目的生成特徴を生成する、または、前記蓄積基本特徴から前記目的基本特徴に対応する蓄積生成特徴を生成する生成特徴生成過程と、前記生成特徴生成過程により生成された前記目的生成特徴と前記蓄積基本特徴との類似度、または、前記目的基本特徴と前記蓄積生成特徴との類似度を計算する類似度計算過程と、を有し、目的信号と類似する蓄積信号の当該箇所と変動パラメータを計算することを特徴とする信号箇所・変動パラメータ検出方法である。
また本発明は上述の信号箇所・変動パラメータ検出方法の、前記蓄積基本特徴抽出過程及び前記目的基本特徴抽出過程において、前記目的基本特徴及び前記蓄積基本特徴に、時系列信号の時刻または周波数またはパワーのうち少なくともいずれか一つを用いることを特徴とする。
また本発明は上述の信号箇所・変動パラメータ検出方法において、前記目的縮退特徴及び前記蓄積縮退特徴に、基本特徴間の時刻の比または基本特徴間の周波数の比またはパワーのうち少なくともいずれか一つを用いることを特徴とする。
また本発明は上述の信号箇所・変動パラメータ検出方法の前記蓄積基本特徴抽出過程及び前記目的基本特徴抽出過程において、前記目的基本特徴及び前記蓄積基本特徴に、画像の座標または画素値のうち少なくともいずれか一つを用いることを特徴とする。
また本発明は上述の信号箇所・変動パラメータ検出方法において、前記目的縮退特徴及び前記蓄積縮退特徴に、画像の基本特徴間の距離の比または角度の比または画素値のうち少なくともいずれか一つを用いることを特徴とする。
また本発明は上述の信号箇所・変動パラメータ検出方法の前記蓄積基本特徴抽出過程及び前記目的基本特徴抽出過程において、前記目的基本特徴及び前記蓄積基本特徴に、動画像の座標または時刻または画素値のうちいずれか一つを用いることを特徴とする。
また本発明は上述の信号箇所・変動パラメータ検出方法の前記目的縮退特徴及び前記蓄積縮退特徴に、動画像の基本特徴間の距離の比または角度の比または時刻の比または画素値のうち少なくともいずれか一つを用いることを特徴とする。
また本発明は上述の信号箇所・変動パラメータ検出方法の前記蓄積基本特徴抽出過程及び前記目的基本特徴抽出過程において、前記目的基本特徴及び前記蓄積基本特徴の特徴として、周辺に比べて統計量が最大または上位の箇所のみを利用することを特徴とする。
また本発明は上述の信号箇所・変動パラメータ検出方法の前記蓄積縮退特徴抽出過程において、前記蓄積縮退特徴をハッシュキーとしてハッシュ表に蓄積することを特徴とする。
また本発明は上述の信号箇所・変動パラメータ検出方法の前記類似度計算過程において、前記目的縮退特徴と同一の前記蓄積縮退特徴の該当する蓄積基本特徴の箇所を示す値の配列が蓄積されており、前記値を元に前記蓄積縮退特徴を探索する。
また本発明は上述の信号箇所・変動パラメータ検出方法の前記変動パラメータ抽出過程及び前記生成特徴生成過程及び前記類似度計算過程において、前記幾何学的変動パラメータを前記目的生成特徴と前記蓄積基本特徴または前記目的基本特徴と前記蓄積生成特徴の一致または類似があるたびに該当箇所の関係から変動パラメータを再計算することを特徴とする。
また本発明は、蓄積信号の中から、目的信号と類似した信号箇所と変動パラメータを探索する信号箇所・変動パラメータ検出装置であって、蓄積信号から抽出された、ベクトルからなる蓄積基本特徴と、当該蓄積基本特徴の中から一つまたは複数の特徴を選び出し該基本特徴同士の関係から計算された蓄積縮退特徴と、を記憶する蓄積信号記憶手段と、目的信号からベクトルからなる目的基本特徴を抽出する目的基本特徴抽出手段と、前記目的基本特徴の中から一つまたは複数の特徴を選び出し該基本特徴同士の関係から縮退特徴を計算することで目的縮退特徴を抽出する目的縮退特徴抽出手段と、前記目的縮退特徴と同一または類似の前記蓄積縮退特徴に対応する基本特徴同士の入力を受け付けて、当該基本特徴同士の関係から目的基本特徴と蓄積基本特徴との間の変動パラメータを計算する変動パラメータ抽出手段と、前記変動パラメータ抽出手段により導かれた前記変動パラメータを用いて、前記目的基本特徴から前記蓄積基本特徴に対応する目的生成特徴を生成する、または、前記蓄積基本特徴から前記目的基本特徴に対応する蓄積生成特徴を生成する生成特徴生成手段と、前記生成特徴生成手段により生成された前記目的生成特徴と前記蓄積基本特徴との類似度、または、前記目的基本特徴と前記蓄積生成特徴との類似度を計算する類似度計算手段と、を有し、目的信号と類似する蓄積信号の当該箇所と変動パラメータを計算することを特徴とする信号箇所・変動パラメータ検出装置である。
また本発明は、蓄積信号から抽出された、ベクトルからなる蓄積基本特徴と、当該蓄積基本特徴の中から一つまたは複数の特徴を選び出し該基本特徴同士の関係から計算された蓄積縮退特徴と、を記憶する蓄積信号記憶手段とを備え、蓄積信号の中から、目的信号と類似した信号箇所と変動パラメータを探索する信号箇所・変動パラメータ検出装置のコンピュータに実行させるプログラムであって、目的信号からベクトルからなる目的基本特徴を抽出する目的基本特徴抽出処理と、前記目的基本特徴の中から一つまたは複数の特徴を選び出し該基本特徴同士の関係から縮退特徴を計算することで目的縮退特徴を抽出する目的縮退特徴抽出処理と、前記目的縮退特徴と同一または類似の前記蓄積縮退特徴に対応する基本特徴同士の入力を受け付けて、当該基本特徴同士の関係から目的基本特徴と蓄積基本特徴との間の変動パラメータを計算する変動パラメータ抽出処理と、前記変動パラメータ抽出処理により導かれた前記変動パラメータを用いて、前記目的基本特徴から前記蓄積基本特徴に対応する目的生成特徴を生成する、または、前記蓄積基本特徴から前記目的基本特徴に対応する蓄積生成特徴を生成する生成特徴生成処理と、前記生成特徴生成処理により生成された前記目的生成特徴と前記蓄積基本特徴との類似度、または、前記目的基本特徴と前記蓄積生成特徴との類似度を計算する類似度計算処理と、を行い、目的信号と類似する蓄積信号の当該箇所と変動パラメータを計算することを特徴とするプログラムである。
また本発明は、上述のプログラムを記録したコンピュータ読み取り可能な記録媒体である。
本発明によれば、目的信号と蓄積信号の幾何学的変動を考慮することにより、高精度に目的信号と類似した箇所の検出を可能にすることによって、公知の方法と比較してより頑健に信号の検出を行うことができる。
以下、本発明の一実施形態による信号箇所・変動パラメータ検出装置を図面を参照して説明する。図1は同実施形態による信号箇所・変動パラメータ検出装置の機能構成を示す第1の図である。この図において、符号1は信号箇所・変動パラメータ検出装置である。そして、信号箇所・変動パラメータ検出装置1は、少なくとも、目的基本特徴抽出部11と、目的縮退特徴抽出部12と、変動パラメータ抽出部13と、生成特徴生成部14と、類似度計算部15とを備えており、目的信号すなわち探索したい信号と、蓄積信号すなわち探索される信号の入力を受け付けて、目的信号との類似した信号の箇所を蓄積信号中から検出して出力する処理を行う。
図2は信号箇所・変動パラメータ検出装置の機能構成を示す第2の図である。
この図が示すように信号箇所・変動パラメータ検出装置は蓄積基本特徴抽出部16と、蓄積縮退特徴抽出部17と、蓄積信号データベース18とを備えているようにしても良い。そして、蓄積基本特徴抽出部16は、蓄積信号からベクトルからなる蓄積基本特徴を抽出する。また蓄積縮退特徴抽出部17は、前記蓄積基本特徴の中から一つまたは複数の特徴を選び出し該基本特徴同士の関係から縮退特徴を計算することで蓄積縮退特徴を抽出する。そして蓄積基本特徴のデータや蓄積縮退特徴のデータが蓄積信号データベース18へ蓄積される。この蓄積信号データベース18へ蓄積された信号は、その後、変動パラメータ抽出部13に読み込まれることとなる。なお、信号箇所・変動パラメータ検出装置が蓄積信号データベース18を備えていない場合には、蓄積縮退特徴抽出部17は、後述する処理の中で、生成した蓄積縮退特徴の情報を直接変動パラメータ抽出部13に転送するようにしてもよい。
また目的基本特徴抽出部11は、目的信号からベクトルからなる目的基本特徴を抽出する。また目的縮退特徴抽出手段12は、目的基本特徴の中から一つまたは複数の特徴を選び出し該基本特徴同士の関係から縮退特徴を計算することで目的縮退特徴を抽出する。また、変動パラメータ抽出部13は、目的縮退特徴と同一または類似の蓄積縮退特徴に対応する基本特徴同士の関係から目的基本特徴と蓄積基本特徴との間の変動パラメータを計算する。また生成特徴生成部14は、変動パラメータ抽出部13により導かれた変動パラメータを用いて、目的基本特徴から蓄積基本特徴に対応する目的生成特徴を生成する。または、生成特徴生成部14は、蓄積基本特徴から目的基本特徴に対応する蓄積生成特徴を生成する。そして、類似度計算部15は、生成特徴生成部14により生成された目的生成特徴と蓄積基本特徴との類似度、または、目的基本特徴と蓄積生成特徴との類似度を計算する。
図3は信号箇所・変動パラメータ検出装置の処理フローを示す図である。
次に、図3を用いて信号箇所・変動パラメータ検出装置の処理フローを順を追って説明する。なお、本実施例では、目的信号が音響信号であるものとする。
まず、信号箇所・変動パラメータ検出装置の蓄積基本特徴抽出部16は、蓄積信号を読み込み(ステップS1)、当該蓄積信号から蓄積基本特徴を抽出する(ステップS2)。ここでは,周波数FHzで標本化した音響信号のPポイントをフーリエ変換し、F’min〜F’maxHzのP’個に分割し各帯域でのパワーからなるP’次元の特徴ベクトルを抽出する。また、前記特徴ベクトルをS秒毎に抽出する。本実施形態においては、フーリエ変換をFFT(高速フーリエ変換)により求め、Fを8000、Pを8192、F’minを0、F’maxを4000、P’を4096、Sを0.1とした。
なお本実施形態とは別に、目的基本特徴として、静止画または動画像の縮小画像を用いることもできる。例えば、静止画から部分画像を探したい場合やテレビの放送信号から15秒程度の動画像を探索したい場合、特徴抽出の設定を次のようにすることができる.例えば、画像を横にX分割、縦にY等分割し、合計X×Y個の領域を設け、各領域内でRGBそれぞれについて画素値を平均する。すなわち、各領域のRGBそれぞれの平均画素値からなる3×X×Y個の値を特徴ベクトルとして抽出する。動画像であれば、この特徴ベクトルが1フレームに対応する特徴ベクトルとなり、この特徴ベクトルをフレーム毎に抽出した時系列特徴ベクトルを利用することもできる。または目的基本特徴として、静止画または動画像の座標を用いるようにしてもよい。
次に蓄積基本特徴抽出部16は、抽出された特徴ベクトルの要素毎についての、ある一定時間の平均値と標準偏差を求める。例えば、特徴ベクトルの前後1秒間の特徴ベクトルに対して、要素毎独立に平均値と標準偏差を求める。次に蓄積基本特徴抽出部16は、該特徴ベクトルから該平均値を差し引き、該標準偏差で割って正規化する。すなわち、
Figure 0004762871
で得られる値を局所正規化値とする。ただし、x(i,k)は、時刻i、周波数kのパワーを表す。また、
Figure 0004762871
Figure 0004762871
は、それぞれ、平均値と標準偏差を表し、Mは平均と標準偏差を求めるための時間区間の長さ、[]で囲まれた数値は切り下げを表している。
次に、特徴変動の影響を受けにくい箇所を統計量に基づいて選択する。特徴的な箇所をある時間区間の時間平均に対して大きく変動している箇所と仮定し、
Figure 0004762871
で得られる値の大きい(または最大の)箇所を選択する。
図4は特徴変動の影響を受けにくい箇所を選択する際の処理概要を示す図である。
図4に示すように、特徴変動の影響を受けにくい箇所の選択の方法は、注目箇所(i,k)に対してi−oからi+pの時刻の範囲、k−uからk+vの周波数の範囲に含まれる全ての時系列に並んだ特徴ベクトルの要素の中から式(4)の値が大きいもの上位N個を選択し、z(i,k)が選択された中に属しているかどうかを判定し、属していればその要素を採用する。ただし、時刻の選択範囲を決めるための正の整数o,p,u,vおよび、選択個数Nは予め決められており、記録している。
続いて蓄積基本特徴抽出部16は、選択された要素の値を量子化する。量子化は、局所正規化値y(i,k)に基づいて行う。量子化の方法は非線形量子化やベクトク量子化などが考えられるが、ここでは、単純に線形スカラー量子化を行う。上記式(1)により得られる局所正規化値を次式によって等間隔にQレベルに量子化して得られる値
Figure 0004762871
を基本特徴とする。ただしγは、線形に量子化する範囲を決めるための値であり、また[]で囲まれた数値は切り下げを表している。
次に蓄積縮退特徴抽出部17は、縮退特徴を上記の基本特徴を複数利用して導く。例えば、第一の基本特徴y’(t,f)と第二の基本特徴y’(t,f)から縮退特徴を計算する場合、
Figure 0004762871
で計算される周波数の比を縮退特徴として利用する。ただしt≦tとし、この縮退特徴の対応する基本特徴の箇所も対応付けて蓄積信号データベース18に蓄積しておく。また、縮退特徴に利用する基本特徴は、抽出された全ての基本特徴を第一の基本特徴とし、その第一の基本特徴に対して、時間周波数領域のある領域内に存在する全ての基本特徴、もしくは式(4)の値の大きい基本特徴において上位N’個選び出された基本特徴を第二の基本特徴として利用する。
図5は第二の基本特徴の選択処理の概要を示す図である。
この図で示すように、第二の基本特徴の選択のための領域は必ずしも一つの領域である必要はなく複数設けることができる。特に、第一の基本特徴の周波数を避けて第二の基本特徴を選ぶと、第一の基本特徴の残響音を避けることができ、冗長性を無くすことができるという効果がある。
そして本実施形態における蓄積縮退特徴は、式(6)をさらに量子化した値に、第一の基本特徴の量子化値と、第二の基本特徴の量子化値を組み合わせた値を用いる。具体的には、縮退特徴として、
Figure 0004762871
という整数値を要素に持つベクトルである。これにより、蓄積縮退特徴抽出部17は蓄積縮退特徴を抽出する(ステップS3)。ただし、Rは量子化レベルを決めるための値である。本実施形態による処理とは別に、縮退特徴として、時刻の比を利用することもできる。この場合、第三の特徴も利用することとなり、
Figure 0004762871
となる。また、周波数の比、時刻の比、量子化値を組み合わせると、分解能の高い縮退特徴を導き出すことができる。ただし、分解能の高い縮退特徴を利用すると誤認識は減るが、認識洩れが増える傾向があるため、縮退特徴のために組み合わせる値の選択には注意が必要である。
また、静止画の場合も、蓄積基本特徴、蓄積縮退特徴を抽出することができる。例えば、
Figure 0004762871
Figure 0004762871
Figure 0004762871
のように画像平面に関して局所正規化値をとる。選択のための統計量は、
Figure 0004762871
とし、音の場合と同様に周辺に比べて統計量の大きい(または最大の)箇所を選択する。そして、選択された箇所について局所正規化値を量子化しそれを基本特徴とする。縮退特徴としては、例えば、3つの基本特徴から計算される距離の比を用いる。
Figure 0004762871
また、角度を利用した特徴を利用することもでき、例えば、
Figure 0004762871
を用いる。動画の場合は、基本特徴として、画像平面と時刻についての局所正規化値から計算される量子化値を用い、縮退特徴として、距離の比、角度の比、時刻の比、量子化値の組み合わせを利用することができる。以上の処理は、探索に先だって事前に行っておく処理である。そして、蓄積基本特徴抽出部16と蓄積縮退特徴抽出部17によって導かれた情報(蓄積基本特徴や蓄積縮退特徴)は、蓄積信号データベース18に記録される。なお信号箇所・変動パラメータ検出装置1が蓄積基本特徴抽出部16と蓄積縮退特徴抽出部17の機能を備えない場合には、それら機能による上記処理で導かれた情報が、予め蓄積信号データベース18に格納されているようにしても良い。また蓄積基本特徴抽出部16と蓄積縮退特徴抽出部17の機能を備えている場合に、蓄積縮退特徴抽出部17の算出結果がそのまま変動パラメータ抽出部13へ出力されるようにしてもよい。
なお、上述の蓄積基本特徴抽出の過程において、蓄積基本特徴に、時系列信号の時刻または周波数またはパワーのうち少なくともいずれか一つを用いればよい。このとき、蓄積縮退特徴に、基本特徴間の時刻の比または基本特徴間の周波数の比またはパワーのうち少なくともいずれか一つを用いればよい。
また、上述の蓄積基本特徴抽出の過程において、蓄積基本特徴に、画像の座標または画素値のうち少なくともいずれか一つを用いればよい。このとき、蓄積縮退特徴に、画像の基本特徴間の距離の比または角度の比または画素値のうち少なくともいずれか一つを用いればよい。
また、上述の蓄積基本特徴抽出の過程において、蓄積基本特徴に、動画像の座標または時刻または画素値のうちいずれか一つを用いればよい。このとき、蓄積縮退特徴に、動画像の基本特徴間の距離の比または角度の比または時刻の比または画素値のうち少なくともいずれか一つを用いればよい。
次に信号箇所・変動パラメータ検出装置においける探索の問い合わせがあった際の処理について説明する。
まず、目的基本特徴抽出部11では、目的信号を読み込み(ステップS4)、蓄積基本特徴抽出部16と同様の方法で目的信号から目的基本特徴を抽出する(ステップS5)。また目的縮退特徴抽出部12では、蓄積縮退特徴抽出部17と同様の方法で目的基本特徴から目的縮退特徴を抽出する(ステップS6)。
なお、目的基本特徴抽出の過程において、目的基本特徴に、時系列信号の時刻または周波数またはパワーのうち少なくともいずれか一つを用いればよい。このとき、目的縮退特徴に、基本特徴間の時刻の比または基本特徴間の周波数の比またはパワーのうち少なくともいずれか一つを用いればよい。
また目的基本特徴抽出の過程において、目的基本特徴に、画像の座標または画素値のうち少なくともいずれか一つを用いればよい。このとき、目的縮退特徴に、画像の基本特徴間の距離の比または角度の比または画素値のうち少なくともいずれか一つを用いればよい。
また目的基本特徴抽出の過程において、目的基本特徴に、動画像の座標または時刻または画素値のうちいずれか一つを用いればよい。このとき、目的縮退特徴に、動画像の基本特徴間の距離の比または角度の比または時刻の比または画素値のうち少なくともいずれか一つを用いればよい。
そして、変動パラメータ抽出部13では、変動パラメータを抽出する。
図6は目的縮退特徴と蓄積縮退特徴との関係を示す図である。この変動パラメータの抽出処理においては、まず、目的縮退特徴を算出した式と同一の式(7)によって求められたベクトルを持つ蓄積縮退特徴とそれと、当該蓄積縮退特徴に対応する蓄積基本特徴を、例えば蓄積信号データベース18から読み取る(図6)。
次に、目的縮退特徴の第一の基本特徴の周波数f1qと、選び出された該目的縮退特徴と同一の蓄積縮退特徴の第一の周波数f1s、目的縮退特徴の第一の基本特徴と第二の基本特徴の時間差分t2q−t1q、蓄積縮退特徴の第一の基本特徴と第二の基本特徴の時間差分をt2s−t1sとすると、蓄積信号に対する目的信号の周波数の比は、
Figure 0004762871
蓄積信号に対する目的信号の時間伸縮の比は,
Figure 0004762871
となる。これら式(15)と式(16)が、蓄積信号から目的信号へ変動したと仮定した場合の変動パラメータである。なおここで、同一の蓄積縮退特徴を探索するためにハッシュ探索を用いると効果的である。例えば、式(7)で与えられる縮退特徴のベクトルについて、各要素をインライン展開して得られるスカラー値をハッシュキーとして蓄積しておく。すなわち、式(7)の各要素をD,D,Dレベルで量子化、ベクトルの各要素の値がd,d,dであるとすると、ハッシュキーKは、
Figure 0004762871
となる。ハッシュ値をV、ハッシュ関数をHとすると、
Figure 0004762871
により、ハッシュキーKからハッシュ値Vを得る。ハッシュ関数としては様々なものが考えられるが、本実施形態においては、
Figure 0004762871
を用いた。ただし、modは剰余演算子であり、Sはハッシュサイズを表す。
図7は蓄積縮退特徴を探索する際の処理概要を示す図である。
この図のように、ハッシュ値と、縮退特徴とそれに対応する基本特徴を組としたデータを対応付けて、例えばメモリにおけるハッシュ表のバケットに蓄積(つまり目的縮退特徴と同一の蓄積縮退特徴に該当する蓄積基本特徴の箇所を示す値が蓄積されている)しておくと、目的縮退特徴と同一の蓄積縮退特徴を探索するときに高速に探索することができる。つまり上述の処理においては、変動パラメータ抽出部は、まず探索を開始すると、蓄積信号データベース18に記録されている蓄積信号を読み取る(ステップS7)。すると、蓄積縮退特徴が存在するか否かを判定し(ステップS8)、また目的縮退特徴と同一の蓄積縮退特徴が存在するか否かを判定し(ステップS9)、存在する場合には変動パラメータを抽出する(ステップS10)。
そして、生成特徴生成部14では、変動パラメータ抽出部13で得られた変動パラメータに基づいて、蓄積信号を目的信号に合わせて変形する。蓄積縮退特徴の第一の基本特徴の該当箇所をt1s,f1sとし、蓄積縮退特徴の周辺の蓄積基本特徴の箇所t,fを変換し、生成特徴の箇所t’,f’を得る。すなわち、
Figure 0004762871
Figure 0004762871
を計算する。ただしlは、蓄積信号中で選択された基本特徴の番号を表す。この変換により蓄積基本特徴を目的信号に合わせて変動パラメータを利用して変換し、生成特徴を生成する(ステップS11)。
また次に、類似度計算部15では類似度を計算する。ここでは式(6)で得られる量子化値の一致度を用いる。すなわち、蓄積基本特徴y(t,f)を変換することで得られる蓄積生成特徴の量子化値y’(t’,f’)が目的基本特徴中の時刻t’,周期f’に同一の量子化値で存在するかどうかを判定し、全てのlにおいて一致する特徴の数をカウントする。そして類似時計算部15は、得られたカウント数を類似度とし、その値があらかじめ定められた閾値θよりも大きいか否かを判定し(ステップS12)、類似度が閾値θよりも大きい場合、探索結果として出力する(ステップS13)。
なお、ここでは全てのlについて、同一の変動パラメータを用いて変換したが、縮退特徴の第一の基本特徴との時間周波数空間における周波数が大きくなればなるほど、もしくは、時間的な距離が遠くなればなるほど、計算により求められる生成特徴の周波数と時刻の誤差が大きくなる。そこで、生成特徴生成部14で得られる生成特徴と目的基本特徴が一致し、さらに、周波数が縮退特徴の第一の基本特徴、または、第二の基本特徴よりも大きかった場合、一致した箇所の基本特徴で周波数比を計算しなおすことで、周波数の計算精度を上げることができる。
同様に、時間比についても、生成特徴生成部14で得られる生成特徴と目的基本特徴が一致し、さらに,第一の基本特徴と第二の基本特徴との間隔よりも大きい時間間隔で基本特徴と生成特徴が一致した場合、一致した箇所の基本特徴と縮退特徴の第一の基本特徴から時間比を計算しなおすことで、時刻の計算精度を上げることができる。なお、本実施形態においては、目的信号に合わせて蓄積信号を変換したが、蓄積信号に合わせて目的信号を変換することも可能である。
なお、変動パラメータ抽出の過程、生成特徴生成の過程、類似度計算の過程において、幾何学的変動パラメータを目的生成特徴と蓄積基本特徴または目的基本特徴と蓄積生成特徴の一致または類似があるたびに該当箇所の関係から変動パラメータを再計算する。
図8は信号箇所・変動パラメータ検出装置の動作実験例を示す図である。
この実験例においては、40曲の楽曲の音響信号を蓄積信号とし、それとは別の蓄積信号に含まれる同一の音楽を加工して得られた信号から無作為に選択した100個の目的信号(15秒間)に対して探索を行い、本発明の精度を測定した。ここで蓄積信号としては高品質な音響信号を、また目的信号としては蓄積信号と同一のオリジナルの音響信号,当該音響信号をピッチ不変時間変動したもの,当該音響信号を時間不変ピッチ変動したもの,当該音響信号を時間伸縮したものを用いた。図8で示すように、動作実験例の結果は、音響信号を各変動したものに対応できることが確認できる。つまり、本発明によれば、目的信号と蓄積信号の幾何学的変動を考慮することにより、高精度に目的信号と類似した箇所の検出を可能にすることによって、公知の方法と比較して、より頑健に信号の検出を行うことができるという利点がある。
なお上述の信号箇所・変動パラメータ検出装置は内部に、コンピュータシステムを有している。そして、上述した処理の過程は、プログラムの形式でコンピュータ読み取り可能な記録媒体に記憶されており、このプログラムをコンピュータが読み出して実行することによって、上記処理が行われる。ここでコンピュータ読み取り可能な記録媒体とは、磁気ディスク、光磁気ディスク、CD−ROM、DVD−ROM、半導体メモリ等をいう。また、このコンピュータプログラムを通信回線によってコンピュータに配信し、この配信を受けたコンピュータが当該プログラムを実行するようにしても良い。
また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
信号箇所・変動パラメータ検出装置の機能構成を示す第1の図である。 信号箇所・変動パラメータ検出装置の機能構成を示す第2の図である。 信号箇所・変動パラメータ検出装置の処理フローを示す図である。 特徴変動の影響を受けにくい箇所を選択する際の処理概要を示す図である。 第二の基本特徴の選択処理の概要を示す図である。 目的縮退特徴と蓄積縮退特徴との関係を示す図である。 蓄積縮退特徴を探索する際の処理概要を示す図である。 信号箇所・変動パラメータ検出装置の動作実験例を示す図である。
符号の説明
1・・・信号箇所・変動パラメータ検出装置
11・・・目的基本特徴抽出部
12・・・目的縮退特徴抽出部
13・・・変動パラメータ抽出部
14・・・生成特徴抽出部
15・・・類似度計算部
16・・・蓄積基本特徴抽出部
17・・・蓄積縮退特徴抽出部
18・・・蓄積信号データベース

Claims (14)

  1. 蓄積信号の中から、目的信号と類似した信号箇所と変動パラメータを探索する信号箇所・変動パラメータ検出装置の信号箇所・変動パラメータ検出方法であって、
    蓄積信号から抽出された、複数の特徴量からなる蓄積基本特徴と、前記蓄積基本特徴の各特徴量を第一の蓄積基本特徴とし、前記第一の蓄積基本特徴のそれぞれについて、当該第一の蓄積基本特徴と当該第一の蓄積基本特徴とは異なる前記蓄積基本特徴の特徴量である一つ以上の第二の蓄積基本特徴との関係から計算された蓄積縮退特徴と、を記憶し、
    目的信号から、複数の特徴量からなる目的基本特徴を抽出する目的基本特徴抽出過程と、
    前記目的基本特徴の各特徴量を第一の目的基本特徴とし、前記第一の目的基本特徴のそれぞれについて、当該第一の目的基本特徴と当該第一の目的基本特徴とは異なる前記目的基本特徴の特徴量である一つ以上の第二の目的基本特徴との関係から計算される目的縮退特徴を抽出する目的縮退特徴抽出過程と、
    前記目的縮退特徴のそれぞれについて、当該目的縮退特徴の計算に用いられた第一の目的基本特徴と、当該目的縮退特徴と同一または類似の前記蓄積縮退特徴の計算に用いられた第一の蓄積基本特徴と、の関係、もしくは、当該目的縮退特徴の計算に用いられた第一の目的基本特徴及び第二の目的基本特徴と、当該目的縮退特徴と同一または類似の前記蓄積縮退特徴の計算に用いられた第一の蓄積基本特徴及び第二の蓄積基本特徴との関係から目的基本特徴と蓄積基本特徴との間の変動パラメータを計算する変動パラメータ抽出過程と、
    前記変動パラメータ抽出過程により導かれた前記変動パラメータを用いて、前記目的基本特徴から前記蓄積基本特徴に対応する目的生成特徴を生成する、または、前記蓄積基本特徴から前記目的基本特徴に対応する蓄積生成特徴を生成する生成特徴生成過程と、
    前記生成特徴生成過程により生成された前記目的生成特徴と前記蓄積基本特徴との類似度、または、前記目的基本特徴と前記蓄積生成特徴との類似度を計算する類似度計算過程と、を有し、
    目的信号と類似する蓄積信号の当該箇所と変動パラメータを計算する
    ことを特徴とする信号箇所・変動パラメータ検出方法。
  2. 前記蓄積基本特徴抽出過程及び前記目的基本特徴抽出過程において、前記目的基本特徴及び前記蓄積基本特徴に、時系列信号の時刻または周波数またはパワーのうち少なくともいずれか一つを用いる
    ことを特徴とする請求項1に記載の信号箇所・変動パラメータ検出方法。
  3. 前記目的縮退特徴及び前記蓄積縮退特徴に、基本特徴間の時刻の比または基本特徴間の周波数の比または基本特徴間のパワーの比のうち少なくともいずれか一つを用いる
    ことを特徴とする請求項2に記載の信号箇所・変動パラメータ検出方法。
  4. 前記蓄積基本特徴抽出過程及び前記目的基本特徴抽出過程において、前記目的基本特徴及び前記蓄積基本特徴に、画像の座標または画素値のうち少なくともいずれか一つを用いる
    ことを特徴とする請求項1に記載の信号箇所・変動パラメータ検出方法。
  5. 前記目的縮退特徴及び前記蓄積縮退特徴に、画像の基本特徴間の距離の比または角度の比または画素値の比のうち少なくともいずれか一つを用いる
    ことを特徴とする請求項4に記載の信号箇所・変動パラメータ検出方法。
  6. 前記蓄積基本特徴抽出過程及び前記目的基本特徴抽出過程において、前記目的基本特徴及び前記蓄積基本特徴に、動画像の座標または時刻または画素値のうちいずれか一つを用いる
    ことを特徴とする請求項1に記載の信号箇所・変動パラメータ検出方法。
  7. 前記目的縮退特徴及び前記蓄積縮退特徴に、動画像の基本特徴間の距離の比または角度の比または時刻の比または画素値の比のうち少なくともいずれか一つを用いる
    ことを特徴とする請求項6に記載の信号箇所・変動パラメータ検出方法。
  8. 前記蓄積基本特徴抽出過程及び前記目的基本特徴抽出過程において、前記目的基本特徴及び前記蓄積基本特徴の特徴として、周辺に比べて統計量が最大または上位の箇所のみを利用する
    ことを特徴とする請求項1に記載の信号箇所・変動パラメータ検出方法。
  9. 前記蓄積縮退特徴抽出過程において、前記蓄積縮退特徴をハッシュキーとしてハッシュ表に蓄積する
    ことを特徴とする請求項1に記載の信号箇所・変動パラメータ検出方法。
  10. 前記類似度計算過程において、前記目的縮退特徴と同一の前記蓄積縮退特徴の該当する蓄積基本特徴の箇所を示す値の配列が蓄積されており、前記値を元に前記蓄積縮退特徴を探索する
    ことを特徴とする請求項1に記載の信号箇所・変動パラメータ検出方法。
  11. 前記変動パラメータ抽出過程及び前記生成特徴生成過程及び前記類似度計算過程において、前記変動パラメータを前記目的生成特徴と前記蓄積基本特徴または前記目的基本特徴と前記蓄積生成特徴の一致または類似があるたびに該当箇所の関係から変動パラメータを再計算する
    ことを特徴とする請求項1に記載の信号箇所・変動パラメータ検出方法。
  12. 蓄積信号の中から、目的信号と類似した信号箇所と変動パラメータを探索する信号箇所・変動パラメータ検出装置であって、
    蓄積信号から抽出された、複数の特徴量からなる蓄積基本特徴と、前記蓄積基本特徴の各特徴量を第一の蓄積基本特徴とし、前記第一の蓄積基本特徴のそれぞれについて、当該第一の蓄積基本特徴と当該第一の蓄積基本特徴とは異なる前記蓄積基本特徴の特徴量である一つ以上の第二の蓄積基本特徴との関係から計算された蓄積縮退特徴と、を記憶する蓄積信号記憶手段と、
    目的信号から、複数の特徴量ベクトルからなる目的基本特徴を抽出する目的基本特徴抽出手段と、
    前記目的基本特徴の各特徴量を第一の目的基本特徴とし、前記第一の目的基本特徴のそれぞれについて、当該第一の目的基本特徴と当該第一の目的基本特徴とは異なる前記目的基本特徴の特徴量である一つ以上の第二の目的基本特徴との関係から計算される目的縮退特徴を抽出する目的縮退特徴抽出手段と、
    前記目的縮退特徴のそれぞれについて、当該目的縮退特徴の計算に用いられた第一の目的基本特徴と、当該目的縮退特徴と同一または類似の前記蓄積縮退特徴の計算に用いられた第一の蓄積基本特徴と、の関係、もしくは、当該目的縮退特徴の計算に用いられた第一の目的基本特徴及び第二の目的基本特徴と、当該目的縮退特徴と同一または類似の前記蓄積縮退特徴の計算に用いられた第一の蓄積基本特徴及び第二の蓄積基本特徴との関係から目的基本特徴と蓄積基本特徴との間の変動パラメータを計算する変動パラメータ抽出手段と、
    前記変動パラメータ抽出手段により導かれた前記変動パラメータを用いて、前記目的基本特徴から前記蓄積基本特徴に対応する目的生成特徴を生成する、または、前記蓄積基本特徴から前記目的基本特徴に対応する蓄積生成特徴を生成する生成特徴生成手段と、
    前記生成特徴生成手段により生成された前記目的生成特徴と前記蓄積基本特徴との類似度、または、前記目的基本特徴と前記蓄積生成特徴との類似度を計算する類似度計算手段と、を有し、
    目的信号と類似する蓄積信号の当該箇所と変動パラメータを計算する
    ことを特徴とする信号箇所・変動パラメータ検出装置。
  13. 蓄積信号から抽出された、複数の特徴量からなる蓄積基本特徴と、前記蓄積基本特徴の各特徴量を第一の蓄積基本特徴とし、前記第一の蓄積基本特徴のそれぞれについて、当該第一の蓄積基本特徴と当該第一の蓄積基本特徴とは異なる前記蓄積基本特徴の特徴量である一つ以上の第二の蓄積基本特徴との関係から計算された蓄積縮退特徴と、を記憶する蓄積信号記憶手段とを備え、
    蓄積信号の中から、目的信号と類似した信号箇所と変動パラメータを探索する信号箇所・変動パラメータ検出装置のコンピュータに実行させるプログラムであって、
    目的信号から、複数の特徴量からなる目的基本特徴を抽出する目的基本特徴抽出処理と、
    前記目的基本特徴の各特徴量を第一の目的基本特徴とし、前記第一の目的基本特徴のそれぞれについて、当該第一の目的基本特徴と当該第一の目的基本特徴とは異なる前記目的基本特徴の特徴量である一つ以上の第二の目的基本特徴との関係から計算される目的縮退特徴を抽出する目的縮退特徴抽出処理と、
    前記目的縮退特徴のそれぞれについて、当該目的縮退特徴の計算に用いられた第一の目的基本特徴と、当該目的縮退特徴と同一または類似の前記蓄積縮退特徴の計算に用いられた第一の蓄積基本特徴と、の関係、もしくは、当該目的縮退特徴の計算に用いられた第一の目的基本特徴及び第二の目的基本特徴と、当該目的縮退特徴と同一または類似の前記蓄積縮退特徴の計算に用いられた第一の蓄積基本特徴及び第二の蓄積基本特徴との関係から目的基本特徴と蓄積基本特徴との間の変動パラメータを計算する変動パラメータ抽出処理と、
    前記変動パラメータ抽出処理により導かれた前記変動パラメータを用いて、前記目的基本特徴から前記蓄積基本特徴に対応する目的生成特徴を生成する、または、前記蓄積基本特徴から前記目的基本特徴に対応する蓄積生成特徴を生成する生成特徴生成処理と、
    前記生成特徴生成処理により生成された前記目的生成特徴と前記蓄積基本特徴との類似度、または、前記目的基本特徴と前記蓄積生成特徴との類似度を計算する類似度計算処理と、を行い、
    目的信号と類似する蓄積信号の当該箇所と変動パラメータを計算する
    ことを特徴とするプログラム。
  14. 請求項13に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
JP2006329444A 2006-12-06 2006-12-06 信号箇所・変動パラメータ検出方法、信号箇所・変動パラメータ検出装置ならびにそのプログラムと記録媒体 Expired - Fee Related JP4762871B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006329444A JP4762871B2 (ja) 2006-12-06 2006-12-06 信号箇所・変動パラメータ検出方法、信号箇所・変動パラメータ検出装置ならびにそのプログラムと記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006329444A JP4762871B2 (ja) 2006-12-06 2006-12-06 信号箇所・変動パラメータ検出方法、信号箇所・変動パラメータ検出装置ならびにそのプログラムと記録媒体

Publications (2)

Publication Number Publication Date
JP2008145505A JP2008145505A (ja) 2008-06-26
JP4762871B2 true JP4762871B2 (ja) 2011-08-31

Family

ID=39605791

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006329444A Expired - Fee Related JP4762871B2 (ja) 2006-12-06 2006-12-06 信号箇所・変動パラメータ検出方法、信号箇所・変動パラメータ検出装置ならびにそのプログラムと記録媒体

Country Status (1)

Country Link
JP (1) JP4762871B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9215350B2 (en) 2011-07-14 2015-12-15 Nec Corporation Sound processing method, sound processing system, video processing method, video processing system, sound processing device, and method and program for controlling same

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IT1298504B1 (it) * 1998-01-28 2000-01-12 Roland Europ Spa Metodo ed apparecchiatura elettronica per la catalogazione e la ricerca automatica di brani musicali mediante tecnica musicale
JPH11272274A (ja) * 1998-03-19 1999-10-08 Tomoya Sonoda 歌声による曲検索法
EP1768102B1 (en) * 2004-07-09 2011-03-02 Nippon Telegraph And Telephone Corporation Sound signal detection system and image signal detection system
JP4495606B2 (ja) * 2005-01-19 2010-07-07 日本放送協会 色識別装置及び色識別プログラム

Also Published As

Publication number Publication date
JP2008145505A (ja) 2008-06-26

Similar Documents

Publication Publication Date Title
US8830331B2 (en) Method and apparatus for detecting near-duplicate videos using perceptual video signatures
KR101578279B1 (ko) 데이터 스트림 내 콘텐트를 식별하는 방법 및 시스템
TWI480855B (zh) 聲音訊號之特徵指紋擷取與匹配
EP3023882B1 (en) Method and apparatus for generating fingerprint of an audio signal
KR101517750B1 (ko) 비디오들을 비교하기 위한 방법들 및 장치
US8589171B2 (en) System and method for custom marking a media file for file matching
US20120103166A1 (en) Signal Processing Device, Signal Processing Method, and Program
Saracoglu et al. Content based copy detection with coarse audio-visual fingerprints
Sonnleitner et al. Quad-Based Audio Fingerprinting Robust to Time and Frequency Scaling.
AU2013204156B2 (en) Classification apparatus and program
JP2008503134A (ja) ウォーターマーク検出のためのスケーリングファクターの探索方法及び装置
JP2008252667A (ja) 動画イベント検出装置
KR20170140188A (ko) 오디오 컨텐츠 인식 방법 및 장치
KR101634395B1 (ko) 시퀀스 간의 비교 방법, 그 장치, 및 컴퓨터 프로그램 제품
Guzman-Zavaleta et al. A robust and low-cost video fingerprint extraction method for copy detection
CN106663102B (zh) 用于生成信息信号的指纹的方法和装置
JP4762871B2 (ja) 信号箇所・変動パラメータ検出方法、信号箇所・変動パラメータ検出装置ならびにそのプログラムと記録媒体
JP4447602B2 (ja) 信号検出方法,信号検出システム,信号検出処理プログラム及びそのプログラムを記録した記録媒体
JP5600040B2 (ja) 映像要約装置,映像要約方法および映像要約プログラム
US9251794B2 (en) Signal processing apparatus, signal processing method, program, electronic device, signal processing system and signal processing method thereof
JP3408800B2 (ja) 信号検出方法、装置及びそのプログラム、記録媒体
JP4394083B2 (ja) 信号検出装置、信号検出方法、信号検出プログラム及び記録媒体
US9215350B2 (en) Sound processing method, sound processing system, video processing method, video processing system, sound processing device, and method and program for controlling same
KR102386186B1 (ko) 오디오 데이터 처리 장치 및 방법
Froitzheim A Short Introduction to Audio Fingerprinting with a Focus on Shazam

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090123

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100810

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100922

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110531

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110608

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140617

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 4762871

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140617

Year of fee payment: 3

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees