JP2006505821A - 指紋情報付マルチメディアコンテンツ - Google Patents

指紋情報付マルチメディアコンテンツ Download PDF

Info

Publication number
JP2006505821A
JP2006505821A JP2004550891A JP2004550891A JP2006505821A JP 2006505821 A JP2006505821 A JP 2006505821A JP 2004550891 A JP2004550891 A JP 2004550891A JP 2004550891 A JP2004550891 A JP 2004550891A JP 2006505821 A JP2006505821 A JP 2006505821A
Authority
JP
Japan
Prior art keywords
fingerprint information
fourier
transform
extracting
features
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004550891A
Other languages
English (en)
Inventor
ジン エス セオ
ヤープ エイ ハイツマ
アントニウス エイ シー エム カルケル
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of JP2006505821A publication Critical patent/JP2006505821A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/005Reproducing at a different information rate from the information rate of recording
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2218/00Aspects of pattern recognition specially adapted for signal processing
    • G06F2218/08Feature extraction
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00086Circuits for prevention of unauthorised reproduction or copying, e.g. piracy
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00086Circuits for prevention of unauthorised reproduction or copying, e.g. piracy
    • G11B20/00094Circuits for prevention of unauthorised reproduction or copying, e.g. piracy involving measures which result in a restriction to authorised record carriers
    • G11B20/00123Circuits for prevention of unauthorised reproduction or copying, e.g. piracy involving measures which result in a restriction to authorised record carriers the record carrier being identified by recognising some of its unique characteristics, e.g. a unique defect pattern serving as a physical signature of the record carrier
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/10537Audio or video recording
    • G11B2020/10546Audio or video recording specifically adapted for audio data

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Image Processing (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

マルチメディア信号、特に音声信号から指数情報を取り出す方法及び装置であって当該音声信号の速度変化に無関係なものが開示されている。このため、本方法は、マルチメディア信号、例えば音声信号のパワースペクトルから強力な知覚的特徴のセットを抽出すること(12,13)を含む。フーリエ・メリン変換(15)によって、そのパワースペクトルを、音声再生速度が変化した場合にのみ位相変化を受けるフーリエ係数に変換する。これらの大きさ又は位相差(16)は、速度変化に不変な指紋情報を構成する。閾値動作(19)によって、指紋情報を少数ビットによって表すことができる。

Description

本発明は、マルチメディア信号から指紋情報(又は埋め込まれた透かし情報)を取り出す方法及び装置に関する。
ハッシュ又はシグネチャと呼ばれることのある文献における指紋情報は、マルチメディアコンテンツから取り出された2進シーケンスであり、当該コンテンツを認識するために用いることができる。データファイルの暗号法のハッシュ(データファイルの単一ビットが変化するとすぐに変化するもの)とは異なり、マルチメディアコンテンツ(音声、画像、ビデオ)の指紋情報は、圧縮やD/A及びA/D変換のような処理に対してある程度不変なものである。これは一般に、当該コンテンツの知覚的に必須な特徴から指紋情報を取り出すことによって達成される。
マルチメディア信号から指紋情報を抽出する従来の方法は、国際特許出願WO02/065782に開示されている。この方法は、マルチメディア信号から強固な知覚的特徴のセットを抽出するステップと、当該特徴のセットを指紋情報に変換するステップとを有する。音声信号の場合、当該知覚的特徴は、選択されたサブバンドにおける音声成分のエネルギである。画像信号の場合、知覚的特徴は、当該画像が分割された結果としての各ブロックの平均輝度である。2進シーケンスへの変換は、閾値処理、例えばその隣接のものと各特徴サンプルを比較する処理によって行われる。
指紋情報処理の注目すべき用途は、コンテンツ認証である。音楽の曲又はビデオクリップのアーチスト及びタイトルは、当該未知のマテリアルの抄録又は抜粋から指紋情報を抽出してそれを当該情報が記憶された指紋情報の大規模データベースに送ることによって認証可能である。
実験により、音声信号から指紋情報を抽出する従来の方法は、MP3圧縮及び伸長、等化、再サンプリング、ノイズ付加並びにD/A及びA/D変換などの一般的に使用されている殆ど全ての音声処理動作に対して非常に強固であることが判明されている。
ラジオ局によって数パーセント音声を高速化することは極めて普通である。ラジオ局は恐らく2つの理由のためにこれを行っている。1つは曲の持続期間が短くなるので、ラジオ局がより多くのコマーシャルを放送することが可能となる点である。2つ目には、曲のビートが速く聴取者がこれを好んでいると考えられる点である。速度の変更は、通常は0ないし4パーセントである。
音声マテリアルの速度変更は、時間及び周波数領域双方における配置ミスをもたらす。従来技術の指紋情報抽出方法は、時間領域における誤配置を受けない。何故なら指数情報は、重なる音声フレームから抽出される小さな副指紋情報の連続であるからである。約2%の速度変化は、対応するオリジナルの抜粋の255番目の副指紋情報の位置において250番目の副指紋情報の抜粋が抽出されるに過ぎない。
周波数領域における配置の誤りは、他の周波数へのスペクトルエネルギのシフトにより生じる。上記例の2%高速化によって全ての音声周波数が2%上昇する。従来技術の音声指紋情報抽出方法においては、これにより、選択されたサブバンドにおけるエネルギ(及びその指紋情報)が変化してしまう。その結果、異なる速度のバージョンに対応する複数の指紋情報が曲毎にデータベースに記憶されていない限り、指紋情報はもはやデータベースにおいて見つからなくなる。
同様の考察は、画像及びビデオマテリアルにも、また指紋情報の抽出のために用いられる他の種類の知覚的特徴にも当てはまる。
本発明の目的は、マルチメディアコンテンツから指紋情報を抽出するための改善された方法及び装置を提供することである。本発明の特定の目的は、音声信号から指紋情報を抽出する方法及び装置であって当該音声信号の速度変化に対して実質的に不変なものを提供することである。
このため、マルチメディア信号から指紋情報を抽出する本発明による方法は、前記マルチメディア信号から強固な知覚的特徴のセットを抽出するステップと、当該抽出されたセットの特徴をフーリエ・メリン変換にかけるステップと、当該変換されたセットの特徴を指紋情報を構成するシーケンスに変換するステップと、を有する。
本発明は、フーリエ・メリン変換(Fourier-Mellin transform)がログマッピング及びフーリエ変換からなるという見識を利用するものである。このログマッピングは、シフトにおける速度変化のためにエネルギスペクトルのスケーリングを変換する。後のフーリエ変換は、当該シフトを全てのフーリエ係数にとって同じ位相変化に変換する。フーリエ係数の大きさは、速度変化の影響を受けない。したがって、当該大きさ又はフーリエ係数の位相の導関数から得られる指紋情報は、速度変化に対して不変である。
以下、本発明を、音声信号から指紋情報を抽出する装置について説明する。図1は、本発明による当該装置を概略的に示している。
この装置は、フレーミング回路11を有し、この回路は、当該音声信号を概して0.4秒でオーバラップ(重なり)係数が31/32の重なりフレームに分割する。このオーバラップは、後のフレームの副指紋情報の一方と他方との間の高い相関性が得られるように選定される。フレームに分割する前では、音声信号は概して300Hz〜3kHzの周波数範囲に限定されダウンサンプルされているので(図示せず)、各フレームは2048サンプルを有する。
フーリエ変換回路12は、毎フレームのスペクトル内容を計算する。次のブロック13において、音声フレームのパワースペクトルが、例えば(複素)フーリエ係数の大きさを2乗することによって計算される。2048個の音声信号サンプルの各フレームについて、パワースペクトルは、1024サンプルにより表される(正及び対応する負の周波数は同じ大きさを有する)。このパワースペクトルのサンプルは、強固な知覚的特徴のセットを構成する。このスペクトルは、D/A及びA/D変換又はMP3圧縮などの動作には殆ど影響を受けない。
パワースペクトルの計算の後、オプションとしての正規化回路14は、当該パワースペクトルに対して局部的正規化を施す。かかる正規化(これは逆畳み込み及びフィルタリング処理を含む)は、パワースペクトルのより決定的で強固な内容を得るので性能が向上する。局部的正規更は、当該スペクトルの重要な特性を保持するものであり、等化処理などの音声スペクトルの局部的変更を含む音声処理の全種類に対して強固なものである。最も有望なアプローチは、スペクトルの音色の部分を局部的な平均値で正規化することにより強調することである。数学的には、次のように、正規化スペクトルN(ω)は、スペクトルA(ω)をその局部平均Lm(ω)で割ることによって得られる。
Figure 2006505821
この局部平均は、種々の方法によって計算可能であり、例えば、次のようなものなどがある。
Figure 2006505821
Figure 2006505821
正規化されたスペクトルは等化に対して不変のままである。さらに、音色情報は、人間の聴覚に直接関係し、殆どの音声処理の後に十分に残存させられる。音色情報の重要性は広く認められており、音声認識や音声圧縮のビットアロケーションに用いられている。局部正規化は多くの利点を有するが、ω−δとω+δとの間の音色成分がない場合、圧縮後に不一致となる。この効果を軽減するために、Lm(ω)に時間積分とトータルエネルギ期間が付加される。そして次のように、変更された局部平均Lm′(ω)が求められる。
Figure 2006505821
ここでΔ及びαは定数であり、これらは実験によって決定される。時間積分によって、正規化はより正確となり、トータルエネルギ期間は、正規化後の小さい非音色成分の増加を制限する。
本発明は、速度変化回復を達成するためにパワースペクトルへフーリエ・メリン変換15を適用するところにある。フーリエ・メリン変換は、ログマッピング処理151及びフーリエ変換(又は逆フーリエ変換)からなる。
図2及び図3は、ログマッピング動作を示している。図2において、参照符号21は、音声信号が通常速度で再生されている場合にフーリエ変換12によって供給されるような音声フレームのパワースペクトルのサンプルを指している。便宜上、300〜3000Hzの範囲における滑らかなパワースペクトルを示している。実際には、このスペクトルは、凹凸の外形を呈するのが普通である。図2における参照符号22は、音声信号が高速で再生されている場合における同じ音声フレームのパワースペクトルを指している。この図から分かるように、速度変化によってパワースペクトルは伸縮される。
図3は、ログマッピング回路151によって計算されるような対応するパワースペクトルを示している。このパワースペクトルは、ここで対数的に間隔をおいた選択された数の連続的なサブバンドにおける音声フレームのエネルギを表す。参照符号31は、通常速度で再生されている音声信号のログマッピングされたパワースペクトルを指す。参照符号32は、高速で再生されている音声信号のログマッピングされたパワースペクトルを指す。
ログマッピングの処理は、幾つかの方法によって実行可能である。図3に示される実施例においては、入力スペクトルは内挿され対数的に間隔をおいたインターバルで再サンプルされる。他の実施例(図示せず)においては、入力パワースペクトルの対数的に間隔をおいた(仕分けされた)サブバンド内のサンプルは、ログマップ化されたパワースペクトルのそれぞれのサンプルを得るように累積される。
ログマップ化されたパワースペクトルを呈するサンプルの数は、後の動作が十分な精度で実行されることが可能なように選択される。実用的実施例では、ログマップ化されたパワースペクトルは512個のサンプルによって表される。図3の観察から分かるのは、ログマッピング動作によって、速度変化によるパワースペクトルのスケーリング(21→22)がシフト(31→32)へ変換されることである。フレーム期間内で音声信号の再生速度が変わらない限り(これは実用上理にかなった前提である)、当該シフトは全ての係数について同じである。
その後のフーリエ変換152によって、当該シフトが複素フーリエ係数の位相の変化に変換される。この位相変化は、全ての係数について同じである。したがって、音声信号の速度が変化した場合、フーリエ変換回路152によって計算された全てのフーリエ係数の位相は、同じ量だけ変化する。すなわち、各係数の大きさもそれらの位相差も速度変化に対して不変である。これらは、計算回路16において計算される。当該大きさ及び位相差は正及び負の周波数に対して同じなので、特異値の数は256である。
音声フレームのログマップ化されたパワースペクトルを呈する256個の大きさ又は位相差のベクトルは、以下、F(k,n)と称し、k=1...256とし、nは音声フレーム番号とする。実際、このベクトルは、速度変化に不変な指紋情報を構成する。但し、値の個数は多く、各値はディジタル指紋情報システムにおいて多ビット表示を必要とする。指紋情報を表すためのビットの数は、最も低い次数の値だけを選択することによって減らすことができる。これは、選択回路(Select)17によって行うことができる。32個の最も低い値(最も重要な係数)は、ログマップ化されたパワースペクトルの十分に正確な表示を呈する。
ビット数は、選択された大きさ又は値に対する位相差を閾値処理にかけることによってさらに減らすことができる。簡単な実施例においては、閾値処理段(Threshold)19は、各特徴サンプルに対して1つのビットを発生する。例えば、値F(k,n)が閾値を上回る場合には「1」を、当該閾値以下の場合には「0」を発生する。或いは、対応する特徴サンプルF(k,n)がその隣接のものよりも大きい場合には値「1」を、そうでない場合には「0」を指紋情報ビットに付与する。このために、特徴サンプルF(k,n)は、一次元時間フィルタ((2DFilter)18において先ずフィルタ処理される。本実施例は、後者の代替のものの改良されたバージョンを用いる。この好適実施例においては、特徴サンプルF(k,n)がその隣のものよりも大きいとき及び前のフレームにおいてもそのような場合であったときに、指紋情報ビット「1」が発生される。そうでないときは、指紋情報ビットは「0」とされる。この実施例において、フィルタ18は2次フィルタである。数学的に表記すると、
Figure 2006505821
である。閾値処理が用いられると、音声フレームから抽出されている各副指紋情報は32ビットを有する。
本発明を音声の指紋情報について説明してきたが、画像及び動画ビデオのような他のマルチメディア信号に本発明を適用することも可能である。速度変化は音声信号にしばしば適用されるが、シフト、スケーリング及び回転などのアフィン変換は画像やビデオにもしばしば適用される。本発明による方法は、かかるアフィン変換に対しての強固さを向上するために用いることができる。2次信号の場合、ログマッピング処理151は、回転に対してもスケーリング(アスペクト比保持)に対しても不変となるように複素対数極座標変換(log-polar mapping)に変更される。ログ・ログマッピング(log-log mapping)により当該アスペクト比の変化が不変なものとされる。フーリエ・メリン変換(ここでは2D変換)の大きさ及び周波数軸に沿うその位相の二重微分は、所望のアフィン不変特性を有する。
開示しているのは、マルチメディア信号(特に音声信号)から指紋情報を抽出するための方法及び装置であって音声信号の速度変化に不変なものである。このために、本方法は、マルチメディア信号、例えば音声信号のパワースペクトルから強固な知覚的特徴のセットを抽出すること(12,13)を含んでいる。フーリエ・メリン変換(15)は、パワースペクトルを音声再生速度が変化した場合にのみ位相変化を受けるフーリエ係数に変換する。これらの大きさ又は位相差(16)は、速度変化に不変な指紋情報を構成する。閾値処理(19)によって、指紋情報は少ないビット数によって表すことが可能となる。
マルチメディア信号から指紋情報を抽出する装置、すなわち本発明により当該指紋情報を抽出する方法の対応する各ステップを概略的に示す図。 図1に示されるログマッピング回路の動作を示す図。 図1に示されるログマッピング回路の動作を示す図。

Claims (8)

  1. マルチメディア信号から指紋情報を抽出する方法であって、
    ・前記マルチメディア信号から強固な知覚的特徴のセットを抽出するステップと、
    ・当該抽出されたセットの特徴をフーリエ・メリン変換にかけるステップと、
    ・当該変換されたセットの特徴を指紋情報を構成するシーケンスに変換するステップと、
    を有する、
    方法。
  2. 請求項1に記載の方法であって、前記変換するステップは、フーリエ・メリン変換の大きさを変換することを含む、方法。
  3. 請求項1に記載の方法であって、前記変換するステップは、前記フーリエ・メリン変換の位相の導関数を変換することを含む、方法。
  4. 請求項1に記載の方法であって、前記マルチメディア信号は、音声信号であり、前記フーリエ・メリン変換は、前記知覚的特徴のセットに適用される1次ログマッピング処理を含む、方法。
  5. 請求項1に記載の方法であって、前記マルチメディア信号は、画像又はビデオ信号であり、前記フーリエ・メリン変換は、前記知覚的特徴のセットに適用される2次複素対数座標変換処理を含む、方法。
  6. 請求項1に記載の方法であって、前記マルチメディア信号は、画像又はビデオ信号であり、前記フーリエ・メリン変換は、前記知覚的特徴のセットに適用される2次ログ・ログマッピング処理を含む、方法。
  7. 請求項1に記載の方法であって、前記抽出するステップは、前記知覚的特徴のセットの正規化を含む、方法。
  8. マルチメディア信号から指紋情報を抽出する装置であって、
    ・前記マルチメディア信号から強固な知覚的特徴のセットを抽出する手段と、
    ・当該抽出されたセットの特徴をフーリエ・メリン変換にかける手段と、
    ・当該変換されたセットの特徴を前記指紋情報を構成するシーケンスに変換する手段と、
    を有する、
    装置。
JP2004550891A 2002-11-12 2003-10-31 指紋情報付マルチメディアコンテンツ Pending JP2006505821A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP02079720 2002-11-12
PCT/IB2003/004894 WO2004044820A1 (en) 2002-11-12 2003-10-31 Fingerprinting multimedia contents

Publications (1)

Publication Number Publication Date
JP2006505821A true JP2006505821A (ja) 2006-02-16

Family

ID=32309430

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004550891A Pending JP2006505821A (ja) 2002-11-12 2003-10-31 指紋情報付マルチメディアコンテンツ

Country Status (7)

Country Link
US (1) US20060075237A1 (ja)
EP (1) EP1567965A1 (ja)
JP (1) JP2006505821A (ja)
KR (1) KR20050086470A (ja)
CN (1) CN1711531A (ja)
AU (1) AU2003274545A1 (ja)
WO (1) WO2004044820A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007065659A (ja) * 2005-09-01 2007-03-15 Seet Internet Ventures Inc オーディオ信号からの特徴的な指紋の抽出とマッチング
JP2021536596A (ja) * 2018-09-07 2021-12-27 グレースノート インコーポレイテッド 正規化を介して音響信号をフィンガープリンティングするための方法及び装置
US11798577B2 (en) 2021-03-04 2023-10-24 Gracenote, Inc. Methods and apparatus to fingerprint an audio signal

Families Citing this family (79)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7930546B2 (en) * 1996-05-16 2011-04-19 Digimarc Corporation Methods, systems, and sub-combinations useful in media identification
US6834308B1 (en) 2000-02-17 2004-12-21 Audible Magic Corporation Method and apparatus for identifying media content presented on a media playing device
BR0107127A (pt) 2000-08-23 2002-07-02 Koninkl Philips Electronics Nv Método para aperfeiçoar a renderização de um item de conteúdo, sistema cliente configurado para aperfeiçoar a renderização de um item de conteúdo, e, sistema servidor configurado para facilitar uma renderização aperfeiçoada de um item de conteúdo
US7890374B1 (en) 2000-10-24 2011-02-15 Rovi Technologies Corporation System and method for presenting music to consumers
US7277766B1 (en) 2000-10-24 2007-10-02 Moodlogic, Inc. Method and system for analyzing digital audio files
US7562012B1 (en) 2000-11-03 2009-07-14 Audible Magic Corporation Method and apparatus for creating a unique audio signature
DE60228202D1 (de) 2001-02-12 2008-09-25 Gracenote Inc Verfahren zum erzeugen einer identifikations hash vom inhalt einer multimedia datei
EP1490767B1 (en) 2001-04-05 2014-06-11 Audible Magic Corporation Copyright detection and protection system and method
US7529659B2 (en) 2005-09-28 2009-05-05 Audible Magic Corporation Method and apparatus for identifying an unknown work
US8972481B2 (en) 2001-07-20 2015-03-03 Audible Magic, Inc. Playlist generation method and apparatus
US7877438B2 (en) 2001-07-20 2011-01-25 Audible Magic Corporation Method and apparatus for identifying new media content
US7020304B2 (en) * 2002-01-22 2006-03-28 Digimarc Corporation Digital watermarking and fingerprinting including synchronization, layering, version control, and compressed embedding
CN1628302A (zh) 2002-02-05 2005-06-15 皇家飞利浦电子股份有限公司 指纹的有效存储器
KR20050046815A (ko) * 2002-09-30 2005-05-18 코닌클리케 필립스 일렉트로닉스 엔.브이. 지문 추출
GB2394611A (en) * 2002-10-21 2004-04-28 Sony Uk Ltd Metadata generation providing a quasi-unique reference value
CN1708758A (zh) * 2002-11-01 2005-12-14 皇家飞利浦电子股份有限公司 改进的音频数据指纹搜索
US8332326B2 (en) 2003-02-01 2012-12-11 Audible Magic Corporation Method and apparatus to identify a work received by a processing system
US20150051967A1 (en) 2004-05-27 2015-02-19 Anonymous Media Research, Llc Media usage monitoring and measurment system and method
US8130746B2 (en) 2004-07-28 2012-03-06 Audible Magic Corporation System for distributing decoy content in a peer to peer network
EP1667106B1 (en) * 2004-12-06 2009-11-25 Sony Deutschland GmbH Method for generating an audio signature
US7567899B2 (en) 2004-12-30 2009-07-28 All Media Guide, Llc Methods and apparatus for audio recognition
WO2007015228A1 (en) * 2005-08-02 2007-02-08 Mobixell Networks Content distribution and tracking
US20070106405A1 (en) * 2005-08-19 2007-05-10 Gracenote, Inc. Method and system to provide reference data for identification of digital content
KR100803206B1 (ko) 2005-11-11 2008-02-14 삼성전자주식회사 오디오 지문 생성과 오디오 데이터 검색 장치 및 방법
US20070162761A1 (en) * 2005-12-23 2007-07-12 Davis Bruce L Methods and Systems to Help Detect Identity Fraud
US8224018B2 (en) 2006-01-23 2012-07-17 Digimarc Corporation Sensing data from physical objects
US20070211920A1 (en) 2006-01-23 2007-09-13 Rhoads Geoffrey B Methods and Cards Employing Optical Phenomena
WO2007091243A2 (en) * 2006-02-07 2007-08-16 Mobixell Networks Ltd. Matching of modified visual and audio media
US20080086311A1 (en) * 2006-04-11 2008-04-10 Conwell William Y Speech Recognition, and Related Systems
US8010511B2 (en) 2006-08-29 2011-08-30 Attributor Corporation Content monitoring and compliance enforcement
US8707459B2 (en) 2007-01-19 2014-04-22 Digimarc Corporation Determination of originality of content
US8738749B2 (en) 2006-08-29 2014-05-27 Digimarc Corporation Content monitoring and host compliance evaluation
US9179200B2 (en) 2007-03-14 2015-11-03 Digimarc Corporation Method and system for determining content treatment
US10242415B2 (en) 2006-12-20 2019-03-26 Digimarc Corporation Method and system for determining content treatment
US20100118190A1 (en) * 2007-02-06 2010-05-13 Mobixell Networks Converting images to moving picture format
GB2460773B (en) 2007-02-20 2010-10-27 Nielsen Co Methods and apparatus for characterizing media
US20080274687A1 (en) * 2007-05-02 2008-11-06 Roberts Dale T Dynamic mixed media package
WO2008137385A2 (en) * 2007-05-02 2008-11-13 Nielsen Media Research, Inc. Methods and apparatus for generating signatures
KR100896335B1 (ko) * 2007-05-15 2009-05-07 주식회사 코난테크놀로지 오디오 기반의 동영상 파일 중복 검사와 관리를 위한 시스템 및 방법
US20090017827A1 (en) * 2007-06-21 2009-01-15 Mobixell Networks Ltd. Convenient user response to wireless content messages
US8006314B2 (en) 2007-07-27 2011-08-23 Audible Magic Corporation System for identifying content of digital data
CA2858944C (en) 2007-11-12 2017-08-22 The Nielsen Company (Us), Llc Methods and apparatus to perform audio watermarking and watermark detection and extraction
US8457951B2 (en) 2008-01-29 2013-06-04 The Nielsen Company (Us), Llc Methods and apparatus for performing variable black length watermarking of media
CA2717723C (en) * 2008-03-05 2016-10-18 The Nielsen Company (Us), Llc Methods and apparatus for generating signatures
WO2010006334A1 (en) 2008-07-11 2010-01-14 Videosurf, Inc. Apparatus and software system for and method of performing a visual-relevance-rank subsequent search
US8655826B1 (en) 2008-08-01 2014-02-18 Motion Picture Laboratories, Inc. Processing and acting on rules for content recognition systems
US8700194B2 (en) 2008-08-26 2014-04-15 Dolby Laboratories Licensing Corporation Robust media fingerprints
US10880340B2 (en) 2008-11-26 2020-12-29 Free Stream Media Corp. Relevancy improvement through targeting of information based on data gathered from a networked device associated with a security sandbox of a client device
US9519772B2 (en) 2008-11-26 2016-12-13 Free Stream Media Corp. Relevancy improvement through targeting of information based on data gathered from a networked device associated with a security sandbox of a client device
US8180891B1 (en) 2008-11-26 2012-05-15 Free Stream Media Corp. Discovery, access control, and communication with networked services from within a security sandbox
US10977693B2 (en) 2008-11-26 2021-04-13 Free Stream Media Corp. Association of content identifier of audio-visual data with additional data through capture infrastructure
US10334324B2 (en) 2008-11-26 2019-06-25 Free Stream Media Corp. Relevant advertisement generation based on a user operating a client device communicatively coupled with a networked media device
US10567823B2 (en) 2008-11-26 2020-02-18 Free Stream Media Corp. Relevant advertisement generation based on a user operating a client device communicatively coupled with a networked media device
US9154942B2 (en) 2008-11-26 2015-10-06 Free Stream Media Corp. Zero configuration communication between a browser and a networked media device
US10631068B2 (en) 2008-11-26 2020-04-21 Free Stream Media Corp. Content exposure attribution based on renderings of related content across multiple devices
US9986279B2 (en) 2008-11-26 2018-05-29 Free Stream Media Corp. Discovery, access control, and communication with networked services
US10419541B2 (en) 2008-11-26 2019-09-17 Free Stream Media Corp. Remotely control devices over a network without authentication or registration
US9961388B2 (en) 2008-11-26 2018-05-01 David Harrison Exposure of public internet protocol addresses in an advertising exchange server to improve relevancy of advertisements
US8199651B1 (en) 2009-03-16 2012-06-12 Audible Magic Corporation Method and system for modifying communication flows at a port level
US8620967B2 (en) 2009-06-11 2013-12-31 Rovi Technologies Corporation Managing metadata for occurrences of a recording
US10102352B2 (en) 2009-08-10 2018-10-16 Arm Limited Content usage monitor
US8677400B2 (en) 2009-09-30 2014-03-18 United Video Properties, Inc. Systems and methods for identifying audio content using an interactive media guidance application
US8161071B2 (en) 2009-09-30 2012-04-17 United Video Properties, Inc. Systems and methods for audio asset storage and management
US8860883B2 (en) * 2009-11-30 2014-10-14 Miranda Technologies Partnership Method and apparatus for providing signatures of audio/video signals and for making use thereof
US8886531B2 (en) * 2010-01-13 2014-11-11 Rovi Technologies Corporation Apparatus and method for generating an audio fingerprint and using a two-stage query
US9413477B2 (en) 2010-05-10 2016-08-09 Microsoft Technology Licensing, Llc Screen detector
US9508011B2 (en) * 2010-05-10 2016-11-29 Videosurf, Inc. Video visual and audio query
US9311708B2 (en) 2014-04-23 2016-04-12 Microsoft Technology Licensing, Llc Collaborative alignment of images
US10515523B2 (en) 2010-07-21 2019-12-24 D-Box Technologies Inc. Media recognition and synchronization to a motion signal
CA2841802C (en) 2010-07-21 2018-08-28 D-Box Technologies Inc. Media recognition and synchronisation to a motion signal
CN102096895A (zh) * 2011-01-21 2011-06-15 上海交通大学 基于游程编码和一维离散傅里叶变换的视频数字指纹方法
US9093120B2 (en) 2011-02-10 2015-07-28 Yahoo! Inc. Audio fingerprint extraction by scaling in time and resampling
CN103918247B (zh) 2011-09-23 2016-08-24 数字标记公司 基于背景环境的智能手机传感器逻辑
US9081778B2 (en) 2012-09-25 2015-07-14 Audible Magic Corporation Using digital fingerprints to associate data with a work
US10971191B2 (en) * 2012-12-12 2021-04-06 Smule, Inc. Coordinated audiovisual montage from selected crowd-sourced content with alignment to audio baseline
US10594689B1 (en) 2015-12-04 2020-03-17 Digimarc Corporation Robust encoding of machine readable information in host objects and biometrics, and associated decoding and authentication
US10650241B2 (en) 2016-06-27 2020-05-12 Facebook, Inc. Systems and methods for identifying matching content
US10089994B1 (en) 2018-01-15 2018-10-02 Alex Radzishevsky Acoustic fingerprint extraction and matching
US11922532B2 (en) 2020-01-15 2024-03-05 Digimarc Corporation System for mitigating the problem of deepfake media content using watermarking

Family Cites Families (83)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4030119A (en) * 1975-10-01 1977-06-14 General Electric Company Video window control
US4677466A (en) * 1985-07-29 1987-06-30 A. C. Nielsen Company Broadcast program identification method and apparatus
US5019899A (en) * 1988-11-01 1991-05-28 Control Data Corporation Electronic data encoding and recognition system
JP2637816B2 (ja) * 1989-02-13 1997-08-06 パイオニア株式会社 情報再生装置
CA2085887A1 (en) * 1990-06-21 1991-12-22 Kentyn Reynolds Method and apparatus for wave analysis and event recognition
US5436653A (en) * 1992-04-30 1995-07-25 The Arbitron Company Method and system for recognition of broadcast segments
US5703795A (en) * 1992-06-22 1997-12-30 Mankovitz; Roy J. Apparatus and methods for accessing information relating to radio and television programs
US5822436A (en) * 1996-04-25 1998-10-13 Digimarc Corporation Photographic products and methods employing embedded information
US6546112B1 (en) * 1993-11-18 2003-04-08 Digimarc Corporation Security document with steganographically-encoded authentication data
US6408082B1 (en) * 1996-04-25 2002-06-18 Digimarc Corporation Watermark detection using a fourier mellin transform
US7171016B1 (en) * 1993-11-18 2007-01-30 Digimarc Corporation Method for monitoring internet dissemination of image, video and/or audio files
US5499294A (en) * 1993-11-24 1996-03-12 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Digital camera with apparatus for authentication of images produced from an image file
US6560349B1 (en) * 1994-10-21 2003-05-06 Digimarc Corporation Audio monitoring using steganographic information
US5790793A (en) * 1995-04-04 1998-08-04 Higley; Thomas Method and system to create, transmit, receive and process information, including an address to further information
US5616876A (en) * 1995-04-19 1997-04-01 Microsoft Corporation System and methods for selecting music on the basis of subjective content
US5751672A (en) * 1995-07-26 1998-05-12 Sony Corporation Compact disc changer utilizing disc database
US6411725B1 (en) * 1995-07-27 2002-06-25 Digimarc Corporation Watermark enabled video objects
US6408331B1 (en) * 1995-07-27 2002-06-18 Digimarc Corporation Computer linking methods using encoded graphics
US6505160B1 (en) * 1995-07-27 2003-01-07 Digimarc Corporation Connected audio and other media objects
US7711564B2 (en) * 1995-07-27 2010-05-04 Digimarc Corporation Connected audio and other media objects
US6829368B2 (en) * 2000-01-26 2004-12-07 Digimarc Corporation Establishing and interacting with on-line media collections using identifiers in media signals
US7562392B1 (en) * 1999-05-19 2009-07-14 Digimarc Corporation Methods of interacting with audio and ambient music
JPH0991434A (ja) * 1995-09-28 1997-04-04 Hamamatsu Photonics Kk 人物照合装置
US5767893A (en) * 1995-10-11 1998-06-16 International Business Machines Corporation Method and apparatus for content based downloading of video programs
US5893910A (en) * 1996-01-04 1999-04-13 Softguard Enterprises Inc. Method and apparatus for establishing the legitimacy of use of a block of digitally represented information
US5918223A (en) * 1996-07-22 1999-06-29 Muscle Fish Method and article of manufacture for content-based analysis, storage, retrieval, and segmentation of audio information
US6034925A (en) * 1996-12-02 2000-03-07 Thomson Consumer Electronics, Inc. Accessing control method for identifying a recording medium in a jukebox
US5925843A (en) * 1997-02-12 1999-07-20 Virtual Music Entertainment, Inc. Song identification and synchronization
US5987525A (en) * 1997-04-15 1999-11-16 Cddb, Inc. Network delivery of interactive entertainment synchronized to playback of audio recordings
US5960081A (en) * 1997-06-05 1999-09-28 Cray Research, Inc. Embedding a digital signature in a video sequence
US6076104A (en) * 1997-09-04 2000-06-13 Netscape Communications Corp. Video data integration system using image data and associated hypertext links
US6076111A (en) * 1997-10-24 2000-06-13 Pictra, Inc. Methods and apparatuses for transferring data between data processing systems which transfer a representation of the data before transferring the data
US6195693B1 (en) * 1997-11-18 2001-02-27 International Business Machines Corporation Method and system for network delivery of content associated with physical audio media
US6201176B1 (en) * 1998-05-07 2001-03-13 Canon Kabushiki Kaisha System and method for querying a music database
US6226618B1 (en) * 1998-08-13 2001-05-01 International Business Machines Corporation Electronic content delivery system
US6266429B1 (en) * 1998-09-23 2001-07-24 Philips Electronics North America Corporation Method for confirming the integrity of an image transmitted with a loss
US8332478B2 (en) * 1998-10-01 2012-12-11 Digimarc Corporation Context sensitive connected content
US6665417B1 (en) * 1998-12-02 2003-12-16 Hitachi, Ltd. Method of judging digital watermark information
US6748533B1 (en) * 1998-12-23 2004-06-08 Kent Ridge Digital Labs Method and apparatus for protecting the legitimacy of an article
US7302574B2 (en) * 1999-05-19 2007-11-27 Digimarc Corporation Content identifiers triggering corresponding responses through collaborative processing
US6952774B1 (en) * 1999-05-22 2005-10-04 Microsoft Corporation Audio watermarking with dual watermarks
GB2351405B (en) * 1999-06-21 2003-09-24 Motorola Ltd Watermarked digital images
US7174293B2 (en) * 1999-09-21 2007-02-06 Iceberg Industries Llc Audio identification system and method
US6941275B1 (en) * 1999-10-07 2005-09-06 Remi Swierczek Music identification system
US8355525B2 (en) * 2000-02-14 2013-01-15 Digimarc Corporation Parallel processing of digital watermarking operations
US6737957B1 (en) * 2000-02-16 2004-05-18 Verance Corporation Remote control signaling using audio watermarks
JP2001275115A (ja) * 2000-03-23 2001-10-05 Nec Corp 電子すかしデータ挿入装置および検出装置
US6970886B1 (en) * 2000-05-25 2005-11-29 Digimarc Corporation Consumer driven methods for associating content indentifiers with related web addresses
US7043048B1 (en) * 2000-06-01 2006-05-09 Digimarc Corporation Capturing and encoding unique user attributes in media signals
US6963975B1 (en) * 2000-08-11 2005-11-08 Microsoft Corporation System and method for audio fingerprinting
US6990453B2 (en) * 2000-07-31 2006-01-24 Landmark Digital Services Llc System and methods for recognizing sound and music signals in high noise and distortion
JP2002049631A (ja) * 2000-08-01 2002-02-15 Sony Corp 情報提供装置および方法、並びに記録媒体
BR0107127A (pt) * 2000-08-23 2002-07-02 Koninkl Philips Electronics Nv Método para aperfeiçoar a renderização de um item de conteúdo, sistema cliente configurado para aperfeiçoar a renderização de um item de conteúdo, e, sistema servidor configurado para facilitar uma renderização aperfeiçoada de um item de conteúdo
US6674876B1 (en) * 2000-09-14 2004-01-06 Digimarc Corporation Watermarking in the time-frequency domain
US6748360B2 (en) * 2000-11-03 2004-06-08 International Business Machines Corporation System for selling a product utilizing audio content identification
EP1352340A2 (en) * 2000-12-05 2003-10-15 Openglobe Inc. Automatic identification of dvd title using internet technologies and fuzzy matching techniques
KR100375822B1 (ko) * 2000-12-18 2003-03-15 한국전자통신연구원 디지털 오디오의 워터마크 삽입/추출 장치 및 방법
DE60228202D1 (de) * 2001-02-12 2008-09-25 Gracenote Inc Verfahren zum erzeugen einer identifikations hash vom inhalt einer multimedia datei
US7958359B2 (en) * 2001-04-30 2011-06-07 Digimarc Corporation Access control systems
US7024018B2 (en) * 2001-05-11 2006-04-04 Verance Corporation Watermark position modulation
US6968337B2 (en) * 2001-07-10 2005-11-22 Audible Magic Corporation Method and apparatus for identifying an unknown work
DE10133333C1 (de) * 2001-07-10 2002-12-05 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Erzeugen eines Fingerabdrucks und Verfahren und Vorrichtung zum Identifizieren eines Audiosignals
AU2002346116A1 (en) * 2001-07-20 2003-03-03 Gracenote, Inc. Automatic identification of sound recordings
US7877438B2 (en) * 2001-07-20 2011-01-25 Audible Magic Corporation Method and apparatus for identifying new media content
US20030028796A1 (en) * 2001-07-31 2003-02-06 Gracenote, Inc. Multiple step identification of recordings
US6941003B2 (en) * 2001-08-07 2005-09-06 Lockheed Martin Corporation Method of fast fingerprint search space partitioning and prescreening
US7523312B2 (en) * 2001-11-16 2009-04-21 Koninklijke Philips Electronics N.V. Fingerprint database updating method, client and server
KR100828348B1 (ko) * 2001-12-01 2008-05-08 삼성전자주식회사 디스크 드라이브의 트레이 로킹장치
CN1628302A (zh) * 2002-02-05 2005-06-15 皇家飞利浦电子股份有限公司 指纹的有效存储器
US6782116B1 (en) * 2002-11-04 2004-08-24 Mediasec Technologies, Gmbh Apparatus and methods for improving detection of watermarks in content that has undergone a lossy transformation
US7082394B2 (en) * 2002-06-25 2006-07-25 Microsoft Corporation Noise-robust feature extraction using multi-layer principal component analysis
US7188248B2 (en) * 2002-07-09 2007-03-06 Kaleidescope, Inc. Recovering from de-synchronization attacks against watermarking and fingerprinting
US7110338B2 (en) * 2002-08-06 2006-09-19 Matsushita Electric Industrial Co., Ltd. Apparatus and method for fingerprinting digital media
US7152021B2 (en) * 2002-08-15 2006-12-19 Digimarc Corporation Computing distortion of media signals embedded data with repetitive structure and log-polar mapping
KR20050046815A (ko) * 2002-09-30 2005-05-18 코닌클리케 필립스 일렉트로닉스 엔.브이. 지문 추출
JP2006519452A (ja) * 2003-02-26 2006-08-24 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ オ―ディオフィンガプリンティングにおけるデジタルサイレンスの処理
EP1457889A1 (en) * 2003-03-13 2004-09-15 Koninklijke Philips Electronics N.V. Improved fingerprint matching method and system
US20040260682A1 (en) * 2003-06-19 2004-12-23 Microsoft Corporation System and method for identifying content and managing information corresponding to objects in a signal
EP1647144A1 (en) * 2003-07-11 2006-04-19 Koninklijke Philips Electronics N.V. Method and device for generating and detecting a fingerprint functioning as a trigger marker in a multimedia signal
EP1687806A1 (en) * 2003-11-18 2006-08-09 Koninklijke Philips Electronics N.V. Matching data objects by matching derived fingerprints
DE102004036154B3 (de) * 2004-07-26 2005-12-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zur robusten Klassifizierung von Audiosignalen sowie Verfahren zu Einrichtung und Betrieb einer Audiosignal-Datenbank sowie Computer-Programm
US7562228B2 (en) * 2005-03-15 2009-07-14 Microsoft Corporation Forensic for fingerprint detection in multimedia
US20070106405A1 (en) * 2005-08-19 2007-05-10 Gracenote, Inc. Method and system to provide reference data for identification of digital content

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007065659A (ja) * 2005-09-01 2007-03-15 Seet Internet Ventures Inc オーディオ信号からの特徴的な指紋の抽出とマッチング
US8396705B2 (en) 2005-09-01 2013-03-12 Yahoo! Inc. Extraction and matching of characteristic fingerprints from audio signals
JP2021536596A (ja) * 2018-09-07 2021-12-27 グレースノート インコーポレイテッド 正規化を介して音響信号をフィンガープリンティングするための方法及び装置
JP7346552B2 (ja) 2018-09-07 2023-09-19 グレースノート インコーポレイテッド 正規化を介して音響信号をフィンガープリンティングするための方法、記憶媒体及び装置
US11798577B2 (en) 2021-03-04 2023-10-24 Gracenote, Inc. Methods and apparatus to fingerprint an audio signal

Also Published As

Publication number Publication date
KR20050086470A (ko) 2005-08-30
WO2004044820A1 (en) 2004-05-27
EP1567965A1 (en) 2005-08-31
CN1711531A (zh) 2005-12-21
US20060075237A1 (en) 2006-04-06
AU2003274545A1 (en) 2004-06-03

Similar Documents

Publication Publication Date Title
JP2006505821A (ja) 指紋情報付マルチメディアコンテンツ
JP2006501498A (ja) 指紋抽出
US10210884B2 (en) Systems and methods facilitating selective removal of content from a mixed audio recording
KR100896737B1 (ko) 오디오 신호의 견고한 분류를 위한 장치 및 방법, 오디오신호 데이터베이스를 설정 및 운영하는 방법, 및 컴퓨터프로그램
JP5826291B2 (ja) 音声信号からの特徴フィンガープリントの抽出及びマッチング方法
JP2006048043A (ja) オーディオデータの高周波数の復元方法及びその装置
JP2006506659A (ja) フィンガープリントのサーチおよびその改良
JP2000101439A (ja) 情報処理装置および方法、情報記録装置および方法、記録媒体、並びに提供媒体
JP2004519015A (ja) マルチメディア・コンテンツのハッシュの生成および突合せ
KR20070045993A (ko) 오디오 처리
WO2007049056A1 (en) Audio processing
JP2004525430A (ja) 電子透かしの生成及び検出
EP1446797A1 (en) Method of transmission of wideband audio signals on a transmission channel with reduced bandwidth
US20130266147A1 (en) System and method for identification of highly-variable vocalizations
Lalitha et al. DWT—Arnold Transform based audio watermarking
US7546467B2 (en) Time domain watermarking of multimedia signals
JP6462111B2 (ja) 情報信号の指紋を生成するための方法及び装置
Doets et al. On the comparison of audio fingerprints for extracting quality parameters of compressed audio
US10424310B2 (en) Digital watermark embedding device, digital watermark detecting device, digital watermark embedding method, digital watermark detecting method, computer-readable recording medium containing digital watermark embedding program, and computer-readable recording medium containing digital watermark detecting program
JP2003131685A (ja) 信号処理方法及び装置、信号処理プログラム、並びに記録媒体
US7489798B2 (en) Method and apparatus for detecting a watermark in a signal
Wang et al. Audio fingerprint based on spectral flux for audio retrieval
Kim et al. Robust audio fingerprinting method using prominent peak pair based on modulated complex lapped transform
CN108665905B (zh) 一种基于频带带宽不一致性的数字语音重采样检测方法
Li et al. Spread-spectrum audio watermark robust against pitch-scale modification

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20060502