JP4762871B2 - 信号箇所・変動パラメータ検出方法、信号箇所・変動パラメータ検出装置ならびにそのプログラムと記録媒体 - Google Patents
信号箇所・変動パラメータ検出方法、信号箇所・変動パラメータ検出装置ならびにそのプログラムと記録媒体 Download PDFInfo
- Publication number
- JP4762871B2 JP4762871B2 JP2006329444A JP2006329444A JP4762871B2 JP 4762871 B2 JP4762871 B2 JP 4762871B2 JP 2006329444 A JP2006329444 A JP 2006329444A JP 2006329444 A JP2006329444 A JP 2006329444A JP 4762871 B2 JP4762871 B2 JP 4762871B2
- Authority
- JP
- Japan
- Prior art keywords
- feature
- basic
- target
- signal
- degenerate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
また特許文献2の「信号検出方法及び装置、プログラムならびに記録媒体」のように、信号を部分空間に射影してから信号検出を行う方法が知られている。
また特許文献3の「音響信号検出システム,音響信号検出サーバ,映像信号探索装置,映像信号探索方法,映像信号探索プログラムと記録媒体,信号探索装置,信号探索方法,及び,信号探索プログラムと記録媒体」のように、信号の特徴的な箇所のみを照合して信号検出を行う方法が知られている。
また特許文献2の技術では、定常的な加法性雑音や乗法性ひずみを吸収することができるが,突発的な雑音,信号の伸縮,ピッチ変動には対応できないという欠点があった。
また特許文献3の技術では、突発的な雑音に強いが、信号の伸縮やピッチ変動には対応できないという欠点があった。
この図が示すように信号箇所・変動パラメータ検出装置は蓄積基本特徴抽出部16と、蓄積縮退特徴抽出部17と、蓄積信号データベース18とを備えているようにしても良い。そして、蓄積基本特徴抽出部16は、蓄積信号からベクトルからなる蓄積基本特徴を抽出する。また蓄積縮退特徴抽出部17は、前記蓄積基本特徴の中から一つまたは複数の特徴を選び出し該基本特徴同士の関係から縮退特徴を計算することで蓄積縮退特徴を抽出する。そして蓄積基本特徴のデータや蓄積縮退特徴のデータが蓄積信号データベース18へ蓄積される。この蓄積信号データベース18へ蓄積された信号は、その後、変動パラメータ抽出部13に読み込まれることとなる。なお、信号箇所・変動パラメータ検出装置が蓄積信号データベース18を備えていない場合には、蓄積縮退特徴抽出部17は、後述する処理の中で、生成した蓄積縮退特徴の情報を直接変動パラメータ抽出部13に転送するようにしてもよい。
次に、図3を用いて信号箇所・変動パラメータ検出装置の処理フローを順を追って説明する。なお、本実施例では、目的信号が音響信号であるものとする。
まず、信号箇所・変動パラメータ検出装置の蓄積基本特徴抽出部16は、蓄積信号を読み込み(ステップS1)、当該蓄積信号から蓄積基本特徴を抽出する(ステップS2)。ここでは,周波数FHzで標本化した音響信号のPポイントをフーリエ変換し、F’min〜F’maxHzのP’個に分割し各帯域でのパワーからなるP’次元の特徴ベクトルを抽出する。また、前記特徴ベクトルをS秒毎に抽出する。本実施形態においては、フーリエ変換をFFT(高速フーリエ変換)により求め、Fを8000、Pを8192、F’minを0、F’maxを4000、P’を4096、Sを0.1とした。
図4に示すように、特徴変動の影響を受けにくい箇所の選択の方法は、注目箇所(i,k)に対してi−oからi+pの時刻の範囲、k−uからk+vの周波数の範囲に含まれる全ての時系列に並んだ特徴ベクトルの要素の中から式(4)の値が大きいもの上位N個を選択し、z(i,k)が選択された中に属しているかどうかを判定し、属していればその要素を採用する。ただし、時刻の選択範囲を決めるための正の整数o,p,u,vおよび、選択個数Nは予め決められており、記録している。
この図で示すように、第二の基本特徴の選択のための領域は必ずしも一つの領域である必要はなく複数設けることができる。特に、第一の基本特徴の周波数を避けて第二の基本特徴を選ぶと、第一の基本特徴の残響音を避けることができ、冗長性を無くすことができるという効果がある。
まず、目的基本特徴抽出部11では、目的信号を読み込み(ステップS4)、蓄積基本特徴抽出部16と同様の方法で目的信号から目的基本特徴を抽出する(ステップS5)。また目的縮退特徴抽出部12では、蓄積縮退特徴抽出部17と同様の方法で目的基本特徴から目的縮退特徴を抽出する(ステップS6)。
図6は目的縮退特徴と蓄積縮退特徴との関係を示す図である。この変動パラメータの抽出処理においては、まず、目的縮退特徴を算出した式と同一の式(7)によって求められたベクトルを持つ蓄積縮退特徴とそれと、当該蓄積縮退特徴に対応する蓄積基本特徴を、例えば蓄積信号データベース18から読み取る(図6)。
この図のように、ハッシュ値と、縮退特徴とそれに対応する基本特徴を組としたデータを対応付けて、例えばメモリにおけるハッシュ表のバケットに蓄積(つまり目的縮退特徴と同一の蓄積縮退特徴に該当する蓄積基本特徴の箇所を示す値が蓄積されている)しておくと、目的縮退特徴と同一の蓄積縮退特徴を探索するときに高速に探索することができる。つまり上述の処理においては、変動パラメータ抽出部は、まず探索を開始すると、蓄積信号データベース18に記録されている蓄積信号を読み取る(ステップS7)。すると、蓄積縮退特徴が存在するか否かを判定し(ステップS8)、また目的縮退特徴と同一の蓄積縮退特徴が存在するか否かを判定し(ステップS9)、存在する場合には変動パラメータを抽出する(ステップS10)。
この実験例においては、40曲の楽曲の音響信号を蓄積信号とし、それとは別の蓄積信号に含まれる同一の音楽を加工して得られた信号から無作為に選択した100個の目的信号(15秒間)に対して探索を行い、本発明の精度を測定した。ここで蓄積信号としては高品質な音響信号を、また目的信号としては蓄積信号と同一のオリジナルの音響信号,当該音響信号をピッチ不変時間変動したもの,当該音響信号を時間不変ピッチ変動したもの,当該音響信号を時間伸縮したものを用いた。図8で示すように、動作実験例の結果は、音響信号を各変動したものに対応できることが確認できる。つまり、本発明によれば、目的信号と蓄積信号の幾何学的変動を考慮することにより、高精度に目的信号と類似した箇所の検出を可能にすることによって、公知の方法と比較して、より頑健に信号の検出を行うことができるという利点がある。
11・・・目的基本特徴抽出部
12・・・目的縮退特徴抽出部
13・・・変動パラメータ抽出部
14・・・生成特徴抽出部
15・・・類似度計算部
16・・・蓄積基本特徴抽出部
17・・・蓄積縮退特徴抽出部
18・・・蓄積信号データベース
Claims (14)
- 蓄積信号の中から、目的信号と類似した信号箇所と変動パラメータを探索する信号箇所・変動パラメータ検出装置の信号箇所・変動パラメータ検出方法であって、
蓄積信号から抽出された、複数の特徴量からなる蓄積基本特徴と、前記蓄積基本特徴の各特徴量を第一の蓄積基本特徴とし、前記第一の蓄積基本特徴のそれぞれについて、当該第一の蓄積基本特徴と当該第一の蓄積基本特徴とは異なる前記蓄積基本特徴の特徴量である一つ以上の第二の蓄積基本特徴との関係から計算された蓄積縮退特徴と、を記憶し、
目的信号から、複数の特徴量からなる目的基本特徴を抽出する目的基本特徴抽出過程と、
前記目的基本特徴の各特徴量を第一の目的基本特徴とし、前記第一の目的基本特徴のそれぞれについて、当該第一の目的基本特徴と当該第一の目的基本特徴とは異なる前記目的基本特徴の特徴量である一つ以上の第二の目的基本特徴との関係から計算される目的縮退特徴を抽出する目的縮退特徴抽出過程と、
前記目的縮退特徴のそれぞれについて、当該目的縮退特徴の計算に用いられた第一の目的基本特徴と、当該目的縮退特徴と同一または類似の前記蓄積縮退特徴の計算に用いられた第一の蓄積基本特徴と、の関係、もしくは、当該目的縮退特徴の計算に用いられた第一の目的基本特徴及び第二の目的基本特徴と、当該目的縮退特徴と同一または類似の前記蓄積縮退特徴の計算に用いられた第一の蓄積基本特徴及び第二の蓄積基本特徴との関係から目的基本特徴と蓄積基本特徴との間の変動パラメータを計算する変動パラメータ抽出過程と、
前記変動パラメータ抽出過程により導かれた前記変動パラメータを用いて、前記目的基本特徴から前記蓄積基本特徴に対応する目的生成特徴を生成する、または、前記蓄積基本特徴から前記目的基本特徴に対応する蓄積生成特徴を生成する生成特徴生成過程と、
前記生成特徴生成過程により生成された前記目的生成特徴と前記蓄積基本特徴との類似度、または、前記目的基本特徴と前記蓄積生成特徴との類似度を計算する類似度計算過程と、を有し、
目的信号と類似する蓄積信号の当該箇所と変動パラメータを計算する
ことを特徴とする信号箇所・変動パラメータ検出方法。 - 前記蓄積基本特徴抽出過程及び前記目的基本特徴抽出過程において、前記目的基本特徴及び前記蓄積基本特徴に、時系列信号の時刻または周波数またはパワーのうち少なくともいずれか一つを用いる
ことを特徴とする請求項1に記載の信号箇所・変動パラメータ検出方法。 - 前記目的縮退特徴及び前記蓄積縮退特徴に、基本特徴間の時刻の比または基本特徴間の周波数の比または基本特徴間のパワーの比のうち少なくともいずれか一つを用いる
ことを特徴とする請求項2に記載の信号箇所・変動パラメータ検出方法。 - 前記蓄積基本特徴抽出過程及び前記目的基本特徴抽出過程において、前記目的基本特徴及び前記蓄積基本特徴に、画像の座標または画素値のうち少なくともいずれか一つを用いる
ことを特徴とする請求項1に記載の信号箇所・変動パラメータ検出方法。 - 前記目的縮退特徴及び前記蓄積縮退特徴に、画像の基本特徴間の距離の比または角度の比または画素値の比のうち少なくともいずれか一つを用いる
ことを特徴とする請求項4に記載の信号箇所・変動パラメータ検出方法。 - 前記蓄積基本特徴抽出過程及び前記目的基本特徴抽出過程において、前記目的基本特徴及び前記蓄積基本特徴に、動画像の座標または時刻または画素値のうちいずれか一つを用いる
ことを特徴とする請求項1に記載の信号箇所・変動パラメータ検出方法。 - 前記目的縮退特徴及び前記蓄積縮退特徴に、動画像の基本特徴間の距離の比または角度の比または時刻の比または画素値の比のうち少なくともいずれか一つを用いる
ことを特徴とする請求項6に記載の信号箇所・変動パラメータ検出方法。 - 前記蓄積基本特徴抽出過程及び前記目的基本特徴抽出過程において、前記目的基本特徴及び前記蓄積基本特徴の特徴として、周辺に比べて統計量が最大または上位の箇所のみを利用する
ことを特徴とする請求項1に記載の信号箇所・変動パラメータ検出方法。 - 前記蓄積縮退特徴抽出過程において、前記蓄積縮退特徴をハッシュキーとしてハッシュ表に蓄積する
ことを特徴とする請求項1に記載の信号箇所・変動パラメータ検出方法。 - 前記類似度計算過程において、前記目的縮退特徴と同一の前記蓄積縮退特徴の該当する蓄積基本特徴の箇所を示す値の配列が蓄積されており、前記値を元に前記蓄積縮退特徴を探索する
ことを特徴とする請求項1に記載の信号箇所・変動パラメータ検出方法。 - 前記変動パラメータ抽出過程及び前記生成特徴生成過程及び前記類似度計算過程において、前記変動パラメータを前記目的生成特徴と前記蓄積基本特徴または前記目的基本特徴と前記蓄積生成特徴の一致または類似があるたびに該当箇所の関係から変動パラメータを再計算する
ことを特徴とする請求項1に記載の信号箇所・変動パラメータ検出方法。 - 蓄積信号の中から、目的信号と類似した信号箇所と変動パラメータを探索する信号箇所・変動パラメータ検出装置であって、
蓄積信号から抽出された、複数の特徴量からなる蓄積基本特徴と、前記蓄積基本特徴の各特徴量を第一の蓄積基本特徴とし、前記第一の蓄積基本特徴のそれぞれについて、当該第一の蓄積基本特徴と当該第一の蓄積基本特徴とは異なる前記蓄積基本特徴の特徴量である一つ以上の第二の蓄積基本特徴との関係から計算された蓄積縮退特徴と、を記憶する蓄積信号記憶手段と、
目的信号から、複数の特徴量ベクトルからなる目的基本特徴を抽出する目的基本特徴抽出手段と、
前記目的基本特徴の各特徴量を第一の目的基本特徴とし、前記第一の目的基本特徴のそれぞれについて、当該第一の目的基本特徴と当該第一の目的基本特徴とは異なる前記目的基本特徴の特徴量である一つ以上の第二の目的基本特徴との関係から計算される目的縮退特徴を抽出する目的縮退特徴抽出手段と、
前記目的縮退特徴のそれぞれについて、当該目的縮退特徴の計算に用いられた第一の目的基本特徴と、当該目的縮退特徴と同一または類似の前記蓄積縮退特徴の計算に用いられた第一の蓄積基本特徴と、の関係、もしくは、当該目的縮退特徴の計算に用いられた第一の目的基本特徴及び第二の目的基本特徴と、当該目的縮退特徴と同一または類似の前記蓄積縮退特徴の計算に用いられた第一の蓄積基本特徴及び第二の蓄積基本特徴との関係から目的基本特徴と蓄積基本特徴との間の変動パラメータを計算する変動パラメータ抽出手段と、
前記変動パラメータ抽出手段により導かれた前記変動パラメータを用いて、前記目的基本特徴から前記蓄積基本特徴に対応する目的生成特徴を生成する、または、前記蓄積基本特徴から前記目的基本特徴に対応する蓄積生成特徴を生成する生成特徴生成手段と、
前記生成特徴生成手段により生成された前記目的生成特徴と前記蓄積基本特徴との類似度、または、前記目的基本特徴と前記蓄積生成特徴との類似度を計算する類似度計算手段と、を有し、
目的信号と類似する蓄積信号の当該箇所と変動パラメータを計算する
ことを特徴とする信号箇所・変動パラメータ検出装置。 - 蓄積信号から抽出された、複数の特徴量からなる蓄積基本特徴と、前記蓄積基本特徴の各特徴量を第一の蓄積基本特徴とし、前記第一の蓄積基本特徴のそれぞれについて、当該第一の蓄積基本特徴と当該第一の蓄積基本特徴とは異なる前記蓄積基本特徴の特徴量である一つ以上の第二の蓄積基本特徴との関係から計算された蓄積縮退特徴と、を記憶する蓄積信号記憶手段とを備え、
蓄積信号の中から、目的信号と類似した信号箇所と変動パラメータを探索する信号箇所・変動パラメータ検出装置のコンピュータに実行させるプログラムであって、
目的信号から、複数の特徴量からなる目的基本特徴を抽出する目的基本特徴抽出処理と、
前記目的基本特徴の各特徴量を第一の目的基本特徴とし、前記第一の目的基本特徴のそれぞれについて、当該第一の目的基本特徴と当該第一の目的基本特徴とは異なる前記目的基本特徴の特徴量である一つ以上の第二の目的基本特徴との関係から計算される目的縮退特徴を抽出する目的縮退特徴抽出処理と、
前記目的縮退特徴のそれぞれについて、当該目的縮退特徴の計算に用いられた第一の目的基本特徴と、当該目的縮退特徴と同一または類似の前記蓄積縮退特徴の計算に用いられた第一の蓄積基本特徴と、の関係、もしくは、当該目的縮退特徴の計算に用いられた第一の目的基本特徴及び第二の目的基本特徴と、当該目的縮退特徴と同一または類似の前記蓄積縮退特徴の計算に用いられた第一の蓄積基本特徴及び第二の蓄積基本特徴との関係から目的基本特徴と蓄積基本特徴との間の変動パラメータを計算する変動パラメータ抽出処理と、
前記変動パラメータ抽出処理により導かれた前記変動パラメータを用いて、前記目的基本特徴から前記蓄積基本特徴に対応する目的生成特徴を生成する、または、前記蓄積基本特徴から前記目的基本特徴に対応する蓄積生成特徴を生成する生成特徴生成処理と、
前記生成特徴生成処理により生成された前記目的生成特徴と前記蓄積基本特徴との類似度、または、前記目的基本特徴と前記蓄積生成特徴との類似度を計算する類似度計算処理と、を行い、
目的信号と類似する蓄積信号の当該箇所と変動パラメータを計算する
ことを特徴とするプログラム。 - 請求項13に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006329444A JP4762871B2 (ja) | 2006-12-06 | 2006-12-06 | 信号箇所・変動パラメータ検出方法、信号箇所・変動パラメータ検出装置ならびにそのプログラムと記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006329444A JP4762871B2 (ja) | 2006-12-06 | 2006-12-06 | 信号箇所・変動パラメータ検出方法、信号箇所・変動パラメータ検出装置ならびにそのプログラムと記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008145505A JP2008145505A (ja) | 2008-06-26 |
JP4762871B2 true JP4762871B2 (ja) | 2011-08-31 |
Family
ID=39605791
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006329444A Expired - Fee Related JP4762871B2 (ja) | 2006-12-06 | 2006-12-06 | 信号箇所・変動パラメータ検出方法、信号箇所・変動パラメータ検出装置ならびにそのプログラムと記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4762871B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9215350B2 (en) | 2011-07-14 | 2015-12-15 | Nec Corporation | Sound processing method, sound processing system, video processing method, video processing system, sound processing device, and method and program for controlling same |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
IT1298504B1 (it) * | 1998-01-28 | 2000-01-12 | Roland Europ Spa | Metodo ed apparecchiatura elettronica per la catalogazione e la ricerca automatica di brani musicali mediante tecnica musicale |
JPH11272274A (ja) * | 1998-03-19 | 1999-10-08 | Tomoya Sonoda | 歌声による曲検索法 |
EP1768102B1 (en) * | 2004-07-09 | 2011-03-02 | Nippon Telegraph And Telephone Corporation | Sound signal detection system and image signal detection system |
JP4495606B2 (ja) * | 2005-01-19 | 2010-07-07 | 日本放送協会 | 色識別装置及び色識別プログラム |
-
2006
- 2006-12-06 JP JP2006329444A patent/JP4762871B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2008145505A (ja) | 2008-06-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8830331B2 (en) | Method and apparatus for detecting near-duplicate videos using perceptual video signatures | |
KR101578279B1 (ko) | 데이터 스트림 내 콘텐트를 식별하는 방법 및 시스템 | |
TWI480855B (zh) | 聲音訊號之特徵指紋擷取與匹配 | |
EP3023882B1 (en) | Method and apparatus for generating fingerprint of an audio signal | |
KR101517750B1 (ko) | 비디오들을 비교하기 위한 방법들 및 장치 | |
US8589171B2 (en) | System and method for custom marking a media file for file matching | |
US20120103166A1 (en) | Signal Processing Device, Signal Processing Method, and Program | |
Saracoglu et al. | Content based copy detection with coarse audio-visual fingerprints | |
Sonnleitner et al. | Quad-Based Audio Fingerprinting Robust to Time and Frequency Scaling. | |
AU2013204156B2 (en) | Classification apparatus and program | |
JP2008503134A (ja) | ウォーターマーク検出のためのスケーリングファクターの探索方法及び装置 | |
JP2008252667A (ja) | 動画イベント検出装置 | |
KR20170140188A (ko) | 오디오 컨텐츠 인식 방법 및 장치 | |
KR101634395B1 (ko) | 시퀀스 간의 비교 방법, 그 장치, 및 컴퓨터 프로그램 제품 | |
Guzman-Zavaleta et al. | A robust and low-cost video fingerprint extraction method for copy detection | |
CN106663102B (zh) | 用于生成信息信号的指纹的方法和装置 | |
JP4762871B2 (ja) | 信号箇所・変動パラメータ検出方法、信号箇所・変動パラメータ検出装置ならびにそのプログラムと記録媒体 | |
JP4447602B2 (ja) | 信号検出方法,信号検出システム,信号検出処理プログラム及びそのプログラムを記録した記録媒体 | |
JP5600040B2 (ja) | 映像要約装置,映像要約方法および映像要約プログラム | |
US9251794B2 (en) | Signal processing apparatus, signal processing method, program, electronic device, signal processing system and signal processing method thereof | |
JP3408800B2 (ja) | 信号検出方法、装置及びそのプログラム、記録媒体 | |
JP4394083B2 (ja) | 信号検出装置、信号検出方法、信号検出プログラム及び記録媒体 | |
US9215350B2 (en) | Sound processing method, sound processing system, video processing method, video processing system, sound processing device, and method and program for controlling same | |
KR102386186B1 (ko) | 오디오 데이터 처리 장치 및 방법 | |
Froitzheim | A Short Introduction to Audio Fingerprinting with a Focus on Shazam |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090123 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100810 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100922 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110531 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110608 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140617 Year of fee payment: 3 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 4762871 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140617 Year of fee payment: 3 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |