JP2006501498A - 指紋抽出 - Google Patents
指紋抽出 Download PDFInfo
- Publication number
- JP2006501498A JP2006501498A JP2004539277A JP2004539277A JP2006501498A JP 2006501498 A JP2006501498 A JP 2006501498A JP 2004539277 A JP2004539277 A JP 2004539277A JP 2004539277 A JP2004539277 A JP 2004539277A JP 2006501498 A JP2006501498 A JP 2006501498A
- Authority
- JP
- Japan
- Prior art keywords
- sequence
- fingerprint
- autocorrelation
- media signal
- characteristic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
- G10H1/0033—Recording/reproducing or transmission of music for electrophonic musical instruments
- G10H1/0041—Recording/reproducing or transmission of music for electrophonic musical instruments in coded form
- G10H1/0058—Transmission between separate instruments or between individual components of a musical system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/32—Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/32—Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
- H04N1/32101—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
- H04N1/32106—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title separate from the image data, e.g. in a different computer file
- H04N1/32122—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title separate from the image data, e.g. in a different computer file in a separate device, e.g. in a memory or on a display separate from image data
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2250/00—Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
- G10H2250/131—Mathematical functions for musical analysis, processing, synthesis or composition
- G10H2250/135—Autocorrelation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2250/00—Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
- G10H2250/131—Mathematical functions for musical analysis, processing, synthesis or composition
- G10H2250/161—Logarithmic functions, scaling or conversion, e.g. to reflect human auditory perception of loudness or frequency
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2250/00—Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
- G10H2250/131—Mathematical functions for musical analysis, processing, synthesis or composition
- G10H2250/215—Transforms, i.e. mathematical transforms into domains appropriate for musical signal processing, coding or compression
- G10H2250/235—Fourier transform; Discrete Fourier Transform [DFT]; Fast Fourier Transform [FFT]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/018—Audio watermarking, i.e. embedding inaudible data in the audio signal
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N2201/00—Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
- H04N2201/32—Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
- H04N2201/3201—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
- H04N2201/3225—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document
- H04N2201/3233—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document of authentication information, e.g. digital signature, watermark
- H04N2201/3235—Checking or certification of the authentication information, e.g. by comparison with data stored independently
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N2201/00—Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
- H04N2201/32—Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
- H04N2201/3201—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
- H04N2201/3225—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document
- H04N2201/3233—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document of authentication information, e.g. digital signature, watermark
- H04N2201/3236—Details of authentication information generation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N2201/00—Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
- H04N2201/32—Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
- H04N2201/3201—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
- H04N2201/3274—Storage or retrieval of prestored additional information
Abstract
指紋は、媒体信号(例えば、オーディオ又はビデオクリップ)を識別するようその媒体信号から抽出されるビットストリングである。一般的に、指紋は、例えば、オーディオフラグメントのスペクトルエネルギー分布又はビデオ画像の輝度分布といった媒体信号の知覚的特性から得られる。本願には、知覚的特性のシフトに対してロバストである、指紋抽出の方法及び構成を開示する。このようなシフトは、特に、指紋が、オーディオ信号の対数的にマッピングされたスペクトルエネルギー分布から得られ、そのオーディオ信号が速度変化を受ける場合に、発生する。本発明では、指紋は、知覚的特性自体から得られるのではなく、その自己相関関数から得られる。
Description
本発明は、媒体信号から指紋を抽出する方法及び装置に係る。
署名又はハッシュともしばしば称される指紋は、例えば、オーディオ曲、画像、ビデオクリップ等のマルチメディアコンテンツから得られるビットシーケンスである。マルチメディア指紋は、特に、受信コンテンツがオリジナルであるか否かを検証する、又は、コンテンツが改ざんされたか否かを検出するために用いることが好適である認証の分野において用いられる。指紋は、メディアコンテンツを識別するためにも用いられる。近い将来非常に人気となり得るサービスは、オーディオ識別である。未知の音楽から得られる指紋がデータベースに送られ、このデータベースにおいて、タイトル、アーティスト、及び他のメタデータが調べられ、消費者に戻される。
媒体信号から指紋を抽出する公知の方法は、出願人の国際特許出願WO02/065782に開示される。この従来技術の方法の概略図を図1に示す。媒体信号(ここではオーディオ曲)は、重なりフレームに分割される(101)。各フレームのスペクトル表現が、高速フーリエ変換を行うことにより得られる(102)。次に、33の対数的に間隔が置かれたサブバンドにおけるオーディオ信号のエネルギーが計算される(103)。バンドは、300乃至2000Hzの範囲にあり、これは知覚的に最も適切な範囲である。33のエネルギーレベルは、各オーディオ信号フレームの一連の知覚的特性サンプルを構成する。オーディオ信号の絶対音量に対し不変であるよう、また、主要な1つのオーディオ周波数が連続フレームに対し同一のシーケンスを生成しないよう単純な2次元フィルタ(104)を、32の差異特性サンプルを得る前にスペクトログラムに適用する。シーケンスは、次に、適切な閾値演算によりビットストリングに変換される(105)。より具体的には、特定のフレームにおけるサブバンドは、その隣接サブバンドとのエネルギー差が、前のフレームにおけるその隣接サブバンドとのエネルギー差より大きい場合は、ビット「1」が割当てられる。大きくない場合は、指紋ビットは、「0」である。
公知の方法は、各オーディオフレームに対し32ビットのストリング(約0.4秒)を生成する。フレームは、ビットストリングが時間と共にゆっくりと変化するよう重なっている(例えば、31/32倍で)ことが好適である。これは、指紋抽出を時間シフト及びフレーム境界位置付けに対し不変であるようにする。一般的に、256の重なりフレームのブロック、即ち、256×32=8192ビット(オーディオの約3秒)を用いて曲を識別している。
従来技術の指紋抽出方法は、MP3符号化、サンプルレート変換、D/A及びA/D変換、均等化といったほとんど全ての一般的に用いられるオーディオ処理段階に対し非常にロバストであることが分っている。しかし、従来技術の方法は、速度変化に対してはあまりロバストではない。無線局が、オーディオを、数パーセント加速することはかなり一般的である。無線局は、2つの理由からこのことを行うと考えられる。第1に、その場合、曲の継続時間が短くなり、従って、より多くの宣伝を放送することが可能となる。第2に、曲のビートが速くなり、リスナはこれを好むようである。速度変化は、一般的に、ゼロと4パーセントの間である。
本発明は、媒体信号から指紋を抽出する改良された方法及び装置を提供することを目的とする。
このために、本発明の方法は、媒体信号から、その媒体信号の所与の知覚的特性のサンプルのシーケンスを得る段階と、自己相関値のシーケンスを得るよう特性サンプルのシーケンスに自己相関関数をかける段階と、自己相関値を、各閾値と比較する段階と、比較の結果を、指紋の各ビットにより表す段階とを有する。
本発明の方法は、指紋ビットが、媒体信号の知覚的特性自体から得られるのではなく、その知覚的特性の自己相関から得られるという点で、従来技術の方法とは異なる。本発明は、オーディオ信号の速度変化は、サブバンドにおけるエネルギーレベルを1つのサブバンドから別のサブバンドにシフトさせるという認識に基づいており、また、自己相関関数はシフトに対し不変であるという見識を利用する。
自己相関関数は、連続(時間)領域においては周知である。しかし、ここでは、特性値(例えば、エネルギーレベル)の有限シーケンスを取り扱う。従って、本発明の方法の実用的な実施例では、所望の自己相関は、特性サンプルのサブシーケンスを、特性サンプルの完全なシーケンスと相関させることにより近似される。
自己相関関数は、統計的に有意な数の特性サンプルから計算されることが好適であり、この数は、指紋ビットの所望数より大きい。計算された自己相関関数のダウンサンプリングが、自己相関値の所望数を得るために与えられる。
オーディオ信号の速度変化は、時間領域及び周波数領域の両方における不一致(misalignment)をもたらす。時間的な不一致を考慮するに、例えば、2%の速度変化を受けるオーディオ抜粋は、この抜粋の250番目の指紋が、元の抜粋の255番目の指紋の位置において抽出されることをもたらす。好都合に、シフト不変であるためには、指紋は、時間軸に沿って相関関係を有するよう構成される。従って、元の抜粋と、速度変化を有する同じ抜粋とのBER(ビット誤り率)は、時間的な不一致によって劇的に増加するわけではない。
従って、大きい速度変化により引き起こされる主な問題は、周波数の不一致である。図1に示す従来技術の構成では、2%の加速は、フーリエ変換で得られるスペクトラムの周波数軸のスケーリング(scaling)をもたらす。例えば、500Hzのトーンは、結果として510Hzのトーンとなり、1000Hzのトーンは、結果として1020Hzのトーンとなる。スペクトラムを計算した後、対数的に間隔が置かれたバンドにおけるエネルギーが決定される。バンドは、対数的に間隔が置かれるので、速度変化は、1つのバンドから次のバンドへのエネルギーのシフトを結果としてもたらす。1つのバンドから次のバンドへシフトするエネルギーが多いほど、抽出された指紋ビットが誤りとなる確率が大きくなる。これは、指紋ビットは、隣接バンドのエネルギー差により決定されるという事実による。
総当たり攻撃(brute force)アプローチを使用して、大きい速度変化を有するオーディオを識別することが提案されている。総当たり攻撃アプローチは、データベース内に、複数の速度で抽出された指紋を格納することか、又は、複数の速度で抽出された指紋を用いてデータベースにクエリすることにより構成される。この方法の不利点は、検索速度及び/又は格納要件は、N倍で増加することであり、Nは、特定のアプリケーションに必要な様々な速度の数である。
図2は、本発明によるオーディオ信号から指紋を抽出する構成を示す図である。図2では、図1を参照して既に説明した段階と同一又は同様の機能には同じ参照番号を用いる。より具体的には、オーディオ信号は、重なりフレームに分割され(101)、各フレームのスペクトラムが計算される(102)。
自己相関段階(202)は、より良好な速度変化耐性を達成するための基本的な段階である。速度変化により、計算されたエネルギーベクトルがシフトする。自己相関は、シフト不変である特性を有する。一般的に知られるように、連続関数f(t)の自己相関ρ(x)は、
しかし、ここでは、無限の連続関数f(t)を取り扱うのではなく、特性サンプル(エネルギー)の有限のシーケンスである。統計的に有意な数の特性サンプルから自己相関を計算するために、33ではなく、512のサブバンドのエネルギーが計算される(201)。バンドは依然として対数的であり、また、依然として300乃至2000Hzの範囲内にある。従って、バンドは、より小さい幅を有する。自己相関は、エネルギーのサブシーケンスを完全なシーケンスと相関させることにより近似される。より具体的には、自己相関ρ[x]は、以下のように、サブバンドエネルギーサンプルE(j)から計算される。
方法と構成の実施例は、オーディオ指紋抽出を参照して説明したが、本発明はこれに制限されるものではない。前出の出願人の国際特許出願WO02/065782は、ビデオ指紋が、各画像が分割される画像ブロックの平均輝度値から得られるビデオ指紋抽出方法を開示する。本発明では、各画像は、より大きい数のブロックに分割され、そのブロックのサブセット(「スーパーブロック」)は、そのスーパーブロックの幾つかの位置に対し、全画像と相関される。得られた自己相関値のシーケンスは、ビデオ画像のシフトに対し不変である。このシーケンスは、任意選択的に低域通過フィルタリングされ、その後、ダウンサンプリングされる。
本発明は、以下のように要約することができる。指紋は、媒体信号(例えば、オーディオ又はビデオクリップ)を識別するためにその媒体信号から抽出されるビットストリングである。一般的に、指紋は、例えば、オーディオフラグメントのスペクトルエネルギー分布又はビデオ画像の輝度分布といった媒体信号の知覚的特性から得られる。本願には、知覚的特性のシフトに対してロバストである、指紋抽出の方法及び構成を開示する。このようなシフトは、特に、指紋が、オーディオ信号の対数的にマッピングされたスペクトルエネルギー分布から得られ、そのオーディオ信号が速度変化を受ける場合に、発生する。本発明では、指紋は、知覚的特性自体から得られるのではなく、その自己相関関数から得られる。
Claims (7)
- 媒体信号から指紋を抽出する方法において、
前記媒体信号から、前記媒体信号の所与の知覚的特性のサンプルのシーケンスを抽出する段階と、
前記シーケンスから、前記指紋を構成する2値シーケンスを得る段階と、
を有する方法であって、前記方法は更に、
自己相関値のシーケンスを得るよう前記特性サンプルのシーケンスに自己相関関数をかける段階と、
前記自己相関値を、各閾値と比較する段階と、
前記比較の結果を、前記指紋の各ビットにより表す段階と、
を有することを特徴とする方法。 - 前記特性サンプルのシーケンスに自己相関関数をかける段階は、
特性サンプルのサブシーケンスを、特性サンプルの完全なシーケンスと相関させる段階を有する請求項1記載の方法。 - 前記特性サンプルのシーケンスに自己相関関数をかける段階は、
所望数の自己相関値を得るよう前記自己相関値のシーケンスをダウンサンプリングする段階を更に有する請求項1記載の方法。 - 前記媒体信号から、知覚的特性値シーケンスを得る前記段階は、
オーディオ信号をサブバンドに分割する段階と、
前記オーディオサブバンドのエネルギーを計算する段階と、
を有する請求項1記載の方法。 - 前記媒体信号から、知覚特性のシーケンスを得る前記段階は、
画像をブロックに分割する段階と、
前記画像ブロックの輝度を計算する段階と、
を有する請求項1記載の方法。 - 媒体信号から指紋を抽出する装置において、
前記媒体信号から、前記媒体信号の所与の知覚的特性のサンプルのシーケンスを得る手段と、
前記シーケンスから、前記指紋を構成する2値シーケンスを得る手段と、
を有する装置であって、前記装置は更に、
自己相関値のシーケンスを得るよう前記特性サンプルのシーケンスに自己相関関数をかける手段と、
前記自己相関値を、各閾値と比較する手段と、
前記比較の結果を、前記指紋の各ビットにより表す手段と、
を有することを特徴とする装置。 - 受信した媒体信号から、該媒体信号の所与の知覚的特性のサンプルのシーケンスを得る段階と、
自己相関値のシーケンスを得るよう前記特性サンプルのシーケンスに自己相関関数をかける段階と、
前記自己相関値を、各閾値と比較する段階と、
前記比較の結果を、指紋の各ビットにより表す段階と、
を、プログラマブル装置に行わせる命令を有するコンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP02079072 | 2002-09-30 | ||
PCT/IB2003/003658 WO2004030341A1 (en) | 2002-09-30 | 2003-08-11 | Fingerprint extraction |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006501498A true JP2006501498A (ja) | 2006-01-12 |
Family
ID=32039182
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004539277A Withdrawn JP2006501498A (ja) | 2002-09-30 | 2003-08-11 | 指紋抽出 |
Country Status (9)
Country | Link |
---|---|
US (1) | US20060041753A1 (ja) |
EP (1) | EP1550297B1 (ja) |
JP (1) | JP2006501498A (ja) |
KR (1) | KR20050046815A (ja) |
CN (1) | CN1685703A (ja) |
AT (1) | ATE426297T1 (ja) |
AU (1) | AU2003259400A1 (ja) |
DE (1) | DE60326743D1 (ja) |
WO (1) | WO2004030341A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019133685A (ja) * | 2013-09-06 | 2019-08-08 | イマージョン コーポレーションImmersion Corporation | 音声信号の遷移に関係付けられる触覚効果を生成するためのシステム及び方法 |
Families Citing this family (54)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7362775B1 (en) * | 1996-07-02 | 2008-04-22 | Wistaria Trading, Inc. | Exchange mechanisms for digital information packages with bandwidth securitization, multichannel digital watermarks, and key management |
US5613004A (en) | 1995-06-07 | 1997-03-18 | The Dice Company | Steganographic method and device |
US7664263B2 (en) | 1998-03-24 | 2010-02-16 | Moskowitz Scott A | Method for combining transfer functions with predetermined key creation |
US6205249B1 (en) * | 1998-04-02 | 2001-03-20 | Scott A. Moskowitz | Multiple transform utilization and applications for secure digital watermarking |
US7159116B2 (en) | 1999-12-07 | 2007-01-02 | Blue Spike, Inc. | Systems, methods and devices for trusted transactions |
US7457962B2 (en) | 1996-07-02 | 2008-11-25 | Wistaria Trading, Inc | Optimization methods for the insertion, protection, and detection of digital watermarks in digitized data |
US7095874B2 (en) * | 1996-07-02 | 2006-08-22 | Wistaria Trading, Inc. | Optimization methods for the insertion, protection, and detection of digital watermarks in digitized data |
US5889868A (en) * | 1996-07-02 | 1999-03-30 | The Dice Company | Optimization methods for the insertion, protection, and detection of digital watermarks in digitized data |
US7177429B2 (en) | 2000-12-07 | 2007-02-13 | Blue Spike, Inc. | System and methods for permitting open access to data objects and for securing data within the data objects |
US7346472B1 (en) * | 2000-09-07 | 2008-03-18 | Blue Spike, Inc. | Method and device for monitoring and analyzing signals |
US7730317B2 (en) | 1996-12-20 | 2010-06-01 | Wistaria Trading, Inc. | Linear predictive coding implementation of digital watermarks |
US7664264B2 (en) | 1999-03-24 | 2010-02-16 | Blue Spike, Inc. | Utilizing data reduction in steganographic and cryptographic systems |
US7475246B1 (en) | 1999-08-04 | 2009-01-06 | Blue Spike, Inc. | Secure personal content server |
EP2136306B1 (en) | 2000-08-23 | 2013-03-20 | Gracenote, Inc. | Method and system for obtaining information |
US7127615B2 (en) | 2000-09-20 | 2006-10-24 | Blue Spike, Inc. | Security based on subliminal and supraliminal channels for data objects |
DE60228202D1 (de) * | 2001-02-12 | 2008-09-25 | Gracenote Inc | Verfahren zum erzeugen einer identifikations hash vom inhalt einer multimedia datei |
US7020304B2 (en) * | 2002-01-22 | 2006-03-28 | Digimarc Corporation | Digital watermarking and fingerprinting including synchronization, layering, version control, and compressed embedding |
KR20040086350A (ko) | 2002-02-05 | 2004-10-08 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 핑거프린트의 효율적 저장 |
US7287275B2 (en) | 2002-04-17 | 2007-10-23 | Moskowitz Scott A | Methods, systems and devices for packet watermarking and efficient provisioning of bandwidth |
CN1708758A (zh) * | 2002-11-01 | 2005-12-14 | 皇家飞利浦电子股份有限公司 | 改进的音频数据指纹搜索 |
AU2003274545A1 (en) * | 2002-11-12 | 2004-06-03 | Koninklijke Philips Electronics N.V. | Fingerprinting multimedia contents |
US20150051967A1 (en) | 2004-05-27 | 2015-02-19 | Anonymous Media Research, Llc | Media usage monitoring and measurment system and method |
US20070106405A1 (en) * | 2005-08-19 | 2007-05-10 | Gracenote, Inc. | Method and system to provide reference data for identification of digital content |
WO2007053112A1 (en) * | 2005-11-07 | 2007-05-10 | Agency For Science, Technology And Research | Repeat clip identification in video data |
US20080274687A1 (en) | 2007-05-02 | 2008-11-06 | Roberts Dale T | Dynamic mixed media package |
US9154942B2 (en) | 2008-11-26 | 2015-10-06 | Free Stream Media Corp. | Zero configuration communication between a browser and a networked media device |
US9519772B2 (en) | 2008-11-26 | 2016-12-13 | Free Stream Media Corp. | Relevancy improvement through targeting of information based on data gathered from a networked device associated with a security sandbox of a client device |
US10977693B2 (en) | 2008-11-26 | 2021-04-13 | Free Stream Media Corp. | Association of content identifier of audio-visual data with additional data through capture infrastructure |
US10334324B2 (en) | 2008-11-26 | 2019-06-25 | Free Stream Media Corp. | Relevant advertisement generation based on a user operating a client device communicatively coupled with a networked media device |
US10419541B2 (en) | 2008-11-26 | 2019-09-17 | Free Stream Media Corp. | Remotely control devices over a network without authentication or registration |
US8180891B1 (en) | 2008-11-26 | 2012-05-15 | Free Stream Media Corp. | Discovery, access control, and communication with networked services from within a security sandbox |
US10880340B2 (en) | 2008-11-26 | 2020-12-29 | Free Stream Media Corp. | Relevancy improvement through targeting of information based on data gathered from a networked device associated with a security sandbox of a client device |
US9986279B2 (en) | 2008-11-26 | 2018-05-29 | Free Stream Media Corp. | Discovery, access control, and communication with networked services |
US9961388B2 (en) | 2008-11-26 | 2018-05-01 | David Harrison | Exposure of public internet protocol addresses in an advertising exchange server to improve relevancy of advertisements |
US10631068B2 (en) | 2008-11-26 | 2020-04-21 | Free Stream Media Corp. | Content exposure attribution based on renderings of related content across multiple devices |
US10567823B2 (en) | 2008-11-26 | 2020-02-18 | Free Stream Media Corp. | Relevant advertisement generation based on a user operating a client device communicatively coupled with a networked media device |
WO2010135623A1 (en) * | 2009-05-21 | 2010-11-25 | Digimarc Corporation | Robust signatures derived from local nonlinear filters |
KR101884483B1 (ko) | 2010-07-21 | 2018-08-01 | 디-박스 테크놀러지스 인코포레이트 | 미디어 인식 및 움직임 신호와의 동기화 |
US10515523B2 (en) | 2010-07-21 | 2019-12-24 | D-Box Technologies Inc. | Media recognition and synchronization to a motion signal |
CN102783034B (zh) * | 2011-02-01 | 2014-12-17 | 华为技术有限公司 | 用于提供信号处理系数的方法和设备 |
US9196028B2 (en) | 2011-09-23 | 2015-11-24 | Digimarc Corporation | Context-based smartphone sensor logic |
US8995708B2 (en) * | 2011-09-08 | 2015-03-31 | Samsung Electronics Co., Ltd. | Apparatus and method for robust low-complexity video fingerprinting |
CN103179430A (zh) * | 2011-12-20 | 2013-06-26 | 中国电信股份有限公司 | 基于云计算的音视频内容转码方法、装置和服务器 |
US8989376B2 (en) * | 2012-03-29 | 2015-03-24 | Alcatel Lucent | Method and apparatus for authenticating video content |
US8886635B2 (en) * | 2012-05-23 | 2014-11-11 | Enswers Co., Ltd. | Apparatus and method for recognizing content using audio signal |
CN103455514A (zh) * | 2012-06-01 | 2013-12-18 | 腾讯科技(深圳)有限公司 | 音频文件更新方法及更新装置 |
US9153239B1 (en) * | 2013-03-14 | 2015-10-06 | Google Inc. | Differentiating between near identical versions of a song |
US9652945B2 (en) | 2013-09-06 | 2017-05-16 | Immersion Corporation | Method and system for providing haptic effects based on information complementary to multimedia content |
US9576445B2 (en) | 2013-09-06 | 2017-02-21 | Immersion Corp. | Systems and methods for generating haptic effects associated with an envelope in audio signals |
US9619980B2 (en) | 2013-09-06 | 2017-04-11 | Immersion Corporation | Systems and methods for generating haptic effects associated with audio signals |
CN103501449A (zh) * | 2013-10-08 | 2014-01-08 | 十分(北京)信息科技有限公司 | 与电视节目关联的视频源推荐方法及推荐装置 |
NL2012567B1 (en) * | 2014-04-04 | 2016-03-08 | Teletrax B V | Method and device for generating improved fingerprints. |
US20160005410A1 (en) * | 2014-07-07 | 2016-01-07 | Serguei Parilov | System, apparatus, and method for audio fingerprinting and database searching for audio identification |
CN110322886A (zh) * | 2018-03-29 | 2019-10-11 | 北京字节跳动网络技术有限公司 | 一种音频指纹提取方法及装置 |
Family Cites Families (68)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4677466A (en) * | 1985-07-29 | 1987-06-30 | A. C. Nielsen Company | Broadcast program identification method and apparatus |
US5019899A (en) * | 1988-11-01 | 1991-05-28 | Control Data Corporation | Electronic data encoding and recognition system |
JP2637816B2 (ja) * | 1989-02-13 | 1997-08-06 | パイオニア株式会社 | 情報再生装置 |
JPH05509409A (ja) * | 1990-06-21 | 1993-12-22 | レイノルズ ソフトウエア,インコーポレイティド | 波動分析・事象認識方法およびその装置 |
US5436653A (en) * | 1992-04-30 | 1995-07-25 | The Arbitron Company | Method and system for recognition of broadcast segments |
US5703795A (en) * | 1992-06-22 | 1997-12-30 | Mankovitz; Roy J. | Apparatus and methods for accessing information relating to radio and television programs |
US7171016B1 (en) * | 1993-11-18 | 2007-01-30 | Digimarc Corporation | Method for monitoring internet dissemination of image, video and/or audio files |
US6546112B1 (en) * | 1993-11-18 | 2003-04-08 | Digimarc Corporation | Security document with steganographically-encoded authentication data |
US5822436A (en) * | 1996-04-25 | 1998-10-13 | Digimarc Corporation | Photographic products and methods employing embedded information |
US6408082B1 (en) * | 1996-04-25 | 2002-06-18 | Digimarc Corporation | Watermark detection using a fourier mellin transform |
US5499294A (en) * | 1993-11-24 | 1996-03-12 | The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration | Digital camera with apparatus for authentication of images produced from an image file |
US5790793A (en) * | 1995-04-04 | 1998-08-04 | Higley; Thomas | Method and system to create, transmit, receive and process information, including an address to further information |
US5616876A (en) * | 1995-04-19 | 1997-04-01 | Microsoft Corporation | System and methods for selecting music on the basis of subjective content |
US5751672A (en) * | 1995-07-26 | 1998-05-12 | Sony Corporation | Compact disc changer utilizing disc database |
US6829368B2 (en) * | 2000-01-26 | 2004-12-07 | Digimarc Corporation | Establishing and interacting with on-line media collections using identifiers in media signals |
US6505160B1 (en) * | 1995-07-27 | 2003-01-07 | Digimarc Corporation | Connected audio and other media objects |
JPH0991434A (ja) * | 1995-09-28 | 1997-04-04 | Hamamatsu Photonics Kk | 人物照合装置 |
US5767893A (en) * | 1995-10-11 | 1998-06-16 | International Business Machines Corporation | Method and apparatus for content based downloading of video programs |
US5893910A (en) * | 1996-01-04 | 1999-04-13 | Softguard Enterprises Inc. | Method and apparatus for establishing the legitimacy of use of a block of digitally represented information |
US6034925A (en) * | 1996-12-02 | 2000-03-07 | Thomson Consumer Electronics, Inc. | Accessing control method for identifying a recording medium in a jukebox |
US5925843A (en) * | 1997-02-12 | 1999-07-20 | Virtual Music Entertainment, Inc. | Song identification and synchronization |
US5987525A (en) * | 1997-04-15 | 1999-11-16 | Cddb, Inc. | Network delivery of interactive entertainment synchronized to playback of audio recordings |
US5960081A (en) * | 1997-06-05 | 1999-09-28 | Cray Research, Inc. | Embedding a digital signature in a video sequence |
US6076104A (en) * | 1997-09-04 | 2000-06-13 | Netscape Communications Corp. | Video data integration system using image data and associated hypertext links |
US6076111A (en) * | 1997-10-24 | 2000-06-13 | Pictra, Inc. | Methods and apparatuses for transferring data between data processing systems which transfer a representation of the data before transferring the data |
US6195693B1 (en) * | 1997-11-18 | 2001-02-27 | International Business Machines Corporation | Method and system for network delivery of content associated with physical audio media |
US6201176B1 (en) * | 1998-05-07 | 2001-03-13 | Canon Kabushiki Kaisha | System and method for querying a music database |
US6226618B1 (en) * | 1998-08-13 | 2001-05-01 | International Business Machines Corporation | Electronic content delivery system |
US6266429B1 (en) * | 1998-09-23 | 2001-07-24 | Philips Electronics North America Corporation | Method for confirming the integrity of an image transmitted with a loss |
US8332478B2 (en) * | 1998-10-01 | 2012-12-11 | Digimarc Corporation | Context sensitive connected content |
US6665417B1 (en) * | 1998-12-02 | 2003-12-16 | Hitachi, Ltd. | Method of judging digital watermark information |
US6748533B1 (en) * | 1998-12-23 | 2004-06-08 | Kent Ridge Digital Labs | Method and apparatus for protecting the legitimacy of an article |
US6952774B1 (en) * | 1999-05-22 | 2005-10-04 | Microsoft Corporation | Audio watermarking with dual watermarks |
GB2351405B (en) * | 1999-06-21 | 2003-09-24 | Motorola Ltd | Watermarked digital images |
US7174293B2 (en) * | 1999-09-21 | 2007-02-06 | Iceberg Industries Llc | Audio identification system and method |
US6941275B1 (en) * | 1999-10-07 | 2005-09-06 | Remi Swierczek | Music identification system |
US6737957B1 (en) * | 2000-02-16 | 2004-05-18 | Verance Corporation | Remote control signaling using audio watermarks |
JP2001275115A (ja) * | 2000-03-23 | 2001-10-05 | Nec Corp | 電子すかしデータ挿入装置および検出装置 |
US6963975B1 (en) * | 2000-08-11 | 2005-11-08 | Microsoft Corporation | System and method for audio fingerprinting |
US6990453B2 (en) * | 2000-07-31 | 2006-01-24 | Landmark Digital Services Llc | System and methods for recognizing sound and music signals in high noise and distortion |
JP2002049631A (ja) * | 2000-08-01 | 2002-02-15 | Sony Corp | 情報提供装置および方法、並びに記録媒体 |
EP2136306B1 (en) * | 2000-08-23 | 2013-03-20 | Gracenote, Inc. | Method and system for obtaining information |
US6674876B1 (en) * | 2000-09-14 | 2004-01-06 | Digimarc Corporation | Watermarking in the time-frequency domain |
US6748360B2 (en) * | 2000-11-03 | 2004-06-08 | International Business Machines Corporation | System for selling a product utilizing audio content identification |
US6983289B2 (en) * | 2000-12-05 | 2006-01-03 | Digital Networks North America, Inc. | Automatic identification of DVD title using internet technologies and fuzzy matching techniques |
KR100375822B1 (ko) * | 2000-12-18 | 2003-03-15 | 한국전자통신연구원 | 디지털 오디오의 워터마크 삽입/추출 장치 및 방법 |
DE60228202D1 (de) * | 2001-02-12 | 2008-09-25 | Gracenote Inc | Verfahren zum erzeugen einer identifikations hash vom inhalt einer multimedia datei |
US7958359B2 (en) * | 2001-04-30 | 2011-06-07 | Digimarc Corporation | Access control systems |
US7024018B2 (en) * | 2001-05-11 | 2006-04-04 | Verance Corporation | Watermark position modulation |
DE10133333C1 (de) * | 2001-07-10 | 2002-12-05 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Erzeugen eines Fingerabdrucks und Verfahren und Vorrichtung zum Identifizieren eines Audiosignals |
US6968337B2 (en) * | 2001-07-10 | 2005-11-22 | Audible Magic Corporation | Method and apparatus for identifying an unknown work |
EP1410380B1 (en) * | 2001-07-20 | 2010-04-28 | Gracenote, Inc. | Automatic identification of sound recordings |
US7877438B2 (en) * | 2001-07-20 | 2011-01-25 | Audible Magic Corporation | Method and apparatus for identifying new media content |
JP4398242B2 (ja) * | 2001-07-31 | 2010-01-13 | グレースノート インコーポレイテッド | 録音の多段階識別方法 |
US6941003B2 (en) * | 2001-08-07 | 2005-09-06 | Lockheed Martin Corporation | Method of fast fingerprint search space partitioning and prescreening |
US7523312B2 (en) * | 2001-11-16 | 2009-04-21 | Koninklijke Philips Electronics N.V. | Fingerprint database updating method, client and server |
KR20040086350A (ko) * | 2002-02-05 | 2004-10-08 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 핑거프린트의 효율적 저장 |
US6983275B2 (en) * | 2002-04-16 | 2006-01-03 | International Business Machines Corporation | Optimizing database query by generating, determining the type of derived predicate based on monotonicity of the column generating expression for each remaining inequality predicate in the list of unexamined predicates |
US6782116B1 (en) * | 2002-11-04 | 2004-08-24 | Mediasec Technologies, Gmbh | Apparatus and methods for improving detection of watermarks in content that has undergone a lossy transformation |
US7082394B2 (en) * | 2002-06-25 | 2006-07-25 | Microsoft Corporation | Noise-robust feature extraction using multi-layer principal component analysis |
US7036024B2 (en) * | 2002-07-09 | 2006-04-25 | Kaleidescape, Inc. | Detecting collusion among multiple recipients of fingerprinted information |
US7110338B2 (en) * | 2002-08-06 | 2006-09-19 | Matsushita Electric Industrial Co., Ltd. | Apparatus and method for fingerprinting digital media |
US7152021B2 (en) * | 2002-08-15 | 2006-12-19 | Digimarc Corporation | Computing distortion of media signals embedded data with repetitive structure and log-polar mapping |
AU2003274545A1 (en) * | 2002-11-12 | 2004-06-03 | Koninklijke Philips Electronics N.V. | Fingerprinting multimedia contents |
KR20050113614A (ko) * | 2003-02-26 | 2005-12-02 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 오디오 핑거프린팅에서 디지털 사일런스의 핸들링 |
EP1457889A1 (en) * | 2003-03-13 | 2004-09-15 | Koninklijke Philips Electronics N.V. | Improved fingerprint matching method and system |
CN1882984A (zh) * | 2003-11-18 | 2006-12-20 | 皇家飞利浦电子股份有限公司 | 通过匹配取得的指纹来匹配数据对象 |
US20070106405A1 (en) * | 2005-08-19 | 2007-05-10 | Gracenote, Inc. | Method and system to provide reference data for identification of digital content |
-
2003
- 2003-08-11 AT AT03798257T patent/ATE426297T1/de not_active IP Right Cessation
- 2003-08-11 KR KR1020057005509A patent/KR20050046815A/ko not_active Application Discontinuation
- 2003-08-11 CN CNA038233924A patent/CN1685703A/zh active Pending
- 2003-08-11 WO PCT/IB2003/003658 patent/WO2004030341A1/en active Application Filing
- 2003-08-11 EP EP03798257A patent/EP1550297B1/en not_active Expired - Lifetime
- 2003-08-11 US US10/529,360 patent/US20060041753A1/en not_active Abandoned
- 2003-08-11 AU AU2003259400A patent/AU2003259400A1/en not_active Abandoned
- 2003-08-11 JP JP2004539277A patent/JP2006501498A/ja not_active Withdrawn
- 2003-08-11 DE DE60326743T patent/DE60326743D1/de not_active Expired - Lifetime
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019133685A (ja) * | 2013-09-06 | 2019-08-08 | イマージョン コーポレーションImmersion Corporation | 音声信号の遷移に関係付けられる触覚効果を生成するためのシステム及び方法 |
Also Published As
Publication number | Publication date |
---|---|
US20060041753A1 (en) | 2006-02-23 |
EP1550297B1 (en) | 2009-03-18 |
CN1685703A (zh) | 2005-10-19 |
AU2003259400A1 (en) | 2004-04-19 |
EP1550297A1 (en) | 2005-07-06 |
ATE426297T1 (de) | 2009-04-15 |
KR20050046815A (ko) | 2005-05-18 |
DE60326743D1 (de) | 2009-04-30 |
WO2004030341A1 (en) | 2004-04-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2006501498A (ja) | 指紋抽出 | |
US20060075237A1 (en) | Fingerprinting multimedia contents | |
TWI484473B (zh) | 用於從編碼位元串流擷取音訊訊號之節奏資訊、及估算音訊訊號之知覺顯著節奏的方法及系統 | |
TWI480855B (zh) | 聲音訊號之特徵指紋擷取與匹配 | |
US9317561B2 (en) | Scene change detection around a set of seed points in media data | |
US20060013451A1 (en) | Audio data fingerprint searching | |
US20020143530A1 (en) | Feature-based audio content identification | |
JP2004519015A (ja) | マルチメディア・コンテンツのハッシュの生成および突合せ | |
US20140330556A1 (en) | Low complexity repetition detection in media data | |
Haitsma et al. | Speed-change resistant audio fingerprinting using auto-correlation | |
Kim et al. | Robust audio fingerprinting using peak-pair-based hash of non-repeating foreground audio in a real environment | |
WO2003088534A1 (en) | Feature-based audio content identification | |
JP6462111B2 (ja) | 情報信号の指紋を生成するための方法及び装置 | |
Li et al. | An audio watermarking technique that is robust against random cropping | |
US10424310B2 (en) | Digital watermark embedding device, digital watermark detecting device, digital watermark embedding method, digital watermark detecting method, computer-readable recording medium containing digital watermark embedding program, and computer-readable recording medium containing digital watermark detecting program | |
Wei et al. | Controlling bitrate steganography on AAC audio | |
Wang et al. | Audio fingerprint based on spectral flux for audio retrieval | |
US20070286450A1 (en) | Method and apparatus for detecting a watermark in a signal | |
Kim et al. | Robust audio fingerprinting method using prominent peak pair based on modulated complex lapped transform | |
Htun | Analytical approach to MFCC based space-saving audio fingerprinting system | |
Kusuma et al. | Audio Fingerprint Application for the Media Industry | |
Garlapati et al. | A symbol based watermarking approach for spread spectrum audio watermarking methods | |
Quiñonez-Carbajal et al. | Speech signal authentication and self-recovery based on DTWT and ADPCM | |
Bellettini et al. | On audio recognition performance via robust hashing | |
Tanwar et al. | Audio Watermarking Using Beat Detection and Pitch Estimation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20060803 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060809 |
|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20070516 |