JP2014519660A - データストリームのコンテンツを識別する方法及びシステム - Google Patents

データストリームのコンテンツを識別する方法及びシステム Download PDF

Info

Publication number
JP2014519660A
JP2014519660A JP2014514526A JP2014514526A JP2014519660A JP 2014519660 A JP2014519660 A JP 2014519660A JP 2014514526 A JP2014514526 A JP 2014514526A JP 2014514526 A JP2014514526 A JP 2014514526A JP 2014519660 A JP2014519660 A JP 2014519660A
Authority
JP
Japan
Prior art keywords
content
client device
data stream
media
identification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014514526A
Other languages
English (en)
Other versions
JP5833235B2 (ja
Inventor
アヴェリー, リ−チュン ワン,
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shazam Entertainment Ltd
Original Assignee
Shazam Entertainment Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shazam Entertainment Ltd filed Critical Shazam Entertainment Ltd
Publication of JP2014519660A publication Critical patent/JP2014519660A/ja
Application granted granted Critical
Publication of JP5833235B2 publication Critical patent/JP5833235B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/35Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users
    • H04H60/37Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users for identifying segments of broadcast information, e.g. scenes or extracting programme ID

Abstract

データストリームのコンテンツを識別する方法及びシステムが提供される。一例において、クライアント装置は、連続したデータストリームを受信し、クライアント装置に格納されたコンテンツパターンに基づいてデータストリームのコンテンツのコンテンツ識別をほぼ連続して実行する。クライアント装置に格納されたコンテンツパターンは、メディアファイルの抽出された特徴又はメディアファイルを記述する特徴の時間的にマッピングされた集合と関連付けられた情報を含む。クライアント装置は、連続したデータストリームがメディアコンテンツを含むかを判定し、その判定に基づいてクライアント装置においてデータストリームのコンテンツのコンテンツ識別を連続して実行する。クライアント装置は、命令を受信することに基づいてデータストリームのコンテンツの同一性を判定するためにサーバをクエリする。

Description

本発明は、データストリームのコンテンツを識別することに関する。例えば本発明は、クライアント装置に格納されたコンテンツパターンに基づいてデータストリームのコンテンツのコンテンツ識別を連続して実行し、いくつかの例においてデータストリームのコンテンツの同一性を判定するためにサーバをクエリするクライアント装置に関する。
オーディオ又はビデオ等の種々のデータの種類に対するコンテンツ識別システムは多くの種々の方法を使用する。クライアント装置は、メディアストリーム(ラジオ等)のメディアサンプル記録を取り込み、そのメディアストリームを識別するために、一致を見つけるためのメディア記録(メディアトラックとしても知られている。)のデータベースの検索を行うようサーバに要求することができる。例えばサンプル記録は、コンテンツ識別サーバモジュールに渡され、コンテンツ識別サーバモジュールは、サンプルのコンテンツ識別を実行し、クライアント装置に識別の結果を返すことができる。認識結果は、クライアント装置上でユーザに対して表示され、あるいは関連情報の購入又は参照等の種々の後続サービスに使用されうる。コンテンツ識別の他の応用例は、例えば放送モニタリング又はコンテンツ依存の広告を含む。
既存のコンテンツ識別システムは、コンテンツ識別要求を開始するためにユーザ対話を要求する可能性がある。多くの場合、ユーザは、曲が終了した後に要求を開始し、例えば曲を識別する機会を逃すであろう。
更にコンテンツ識別システム内において、中央サーバは、クライアント装置からコンテンツ識別要求を受信し、サンプルのコンテンツを識別するために計算集約的な手順を実行する。認識を行うのに使用可能なサーバの数に限りがあるため、多くの要求はクライアント装置に結果を提供する時に遅延を引き起こす可能性がある。
一例において、データストリームのコンテンツを識別する方法が提供される。方法は、クライアント装置において連続したデータストリームを受信するステップと、クライアント装置においてクライアント装置に格納されたコンテンツパターンに基づいてデータストリームのコンテンツのコンテンツ識別をほぼ連続して実行するステップとを有する。コンテンツパターンは、複数のコンテンツを識別するための情報を含みうる。方法は、命令を受信したことに基づいて、クライアント装置がデータストリームのコンテンツの同一性を判定するためにサーバをクエリするステップを更に有する。
別の例において、コンピュータ装置に機能を実行させるためにコンピュータ装置により実行可能な命令を格納する非一時的なコンピュータ読み取り可能な記憶媒体が提供される。機能は、コンピュータ装置において連続したデータストリームを受信することと、コンピュータ装置においてコンピュータ装置に格納されたコンテンツパターンに基づいてデータストリームのコンテンツのコンテンツ識別を連続して実行することとを含む。コンテンツパターンは、複数のコンテンツを識別するための情報を含んでもよい。機能は、命令を受信することに基づいて、コンピュータ装置がデータストリームのコンテンツの同一性を判定するためにサーバをクエリすることを更に含む。
更に別の例において、データストリームのコンテンツを識別するシステムが提供され、プロセッサと、コンピュータ装置において連続したデータストリームを受信する機能及びコンピュータ装置に格納されたコンテンツパターンに基づいてデータストリームのコンテンツのコンテンツ識別を連続して実行する機能を実行するためにプロセッサにより実行可能な命令を格納するデータ記憶装置とを備える。コンテンツパターンは、複数のコンテンツを識別するための情報を含んでもよい。機能は、命令を受信することに基づいて、コンピュータ装置がデータストリームのコンテンツの同一性を判定するためにサーバをクエリすることを更に含む。
更に別の例において、データストリームのコンテンツを識別するシステムが提供され、認識サーバ及び要求サーバを備える。認識サーバは、コンテンツの同一性を判定するためにクエリをクライアント装置から受信するように構成されてもよく、クエリはコンテンツのサンプルを含んでもよい。要求サーバは、クライアント装置に対して連続識別モードで動作するように命令するように構成されてもよく、クライアント装置は、連続識別モードでクライアント装置において受信したデータストリーム内のコンテンツのコンテンツ識別を連続して実行してもよい。
上記の発明の概要は単なる例示であり、限定することを意図しない。上述した例示的な態様、実施形態及び特徴に加えて、更なる態様、実施形態及び特徴が図面及び以下の詳細な説明を参照することにより明らかとなるだろう。
データストリーム内のコンテンツを識別するシステムの一例を示す図。 コンテンツ識別方法の一例を示す図。 データストリームのコンテンツを識別する方法の一例を示すフローチャート。 データストリームのコンテンツを識別するシステムの一例を示す図。
以下の詳細な説明において、説明の一部を形成する添付の図面を参照する。図中、特に指示のない限り、同一の記号は一般に同一の構成要素を識別する。詳細な説明において説明する例示的な実施形態、図面及び特許請求の範囲は、限定することを意図しない。本明細書で提示される発明の主旨の範囲から逸脱することなく他の実施形態が利用可能であるし、他の変更が行われうる。本明細書で一般に説明され図面に示されるように、本発明の態様は、本明細書で明示的に考慮される広範囲の種々の構成において構成され、置換され、組み合わされ、分離され、設計されることが容易に理解されるであろう。
本発明は、特に、データストリームのコンテンツを識別する方法及びシステムを説明する。一例において、クライアント装置は、連続したデータストリームを受信し、クライアント装置に格納されたコンテンツパターンに基づいてデータストリームのコンテンツのコンテンツ識別をほぼ連続して実行する。クライアント装置に格納されたコンテンツパターンは、メディアファイルの抽出された特徴又はメディアファイルを記述する特徴の時間的にマッピングされた集合と関連付けられた情報を含む。クライアント装置は、連続したデータストリームがメディアコンテンツを含むかを判定し、その判定に基づいてクライアント装置においてデータストリームのコンテンツのコンテンツ識別を連続して実行する。クライアント装置は、命令を受信することに基づいてデータストリームのコンテンツの同一性を判定するためにサーバにクエリする。
次に図面を参照すると、図1は、データストリーム内のコンテンツを識別するシステムの一例を示す。図1は所定の構成を有するシステムを示すが、システム内の構成要素は他の方法で構成されてもよい。システムは、いずれかの公知の方法でデータストリームからのデータコンテンツを再生及び提示するメディア/データ情報源102を含む。データストリームは、メディア情報源102に格納されてもよく、あるいはアナログ又はデジタルブロードキャストのように外部ソースから受信されてもよい。一例において、メディア情報源102は、メディアストリーム(例えば、オーディオ及び/又はビデオ)及び/又は他の情報をブロードキャストするラジオ局又はテレビコンテンツプロバイダであってもよい。メディア情報源102は、記録形式又はライブ形式のオーディオ又はビデオメディアを再生するあらゆる種類の装置であってもよい。別の例において、メディア情報源102は、例えばオーディオのソース及び/又はビデオのソースとして生演奏を含んでもよい。
メディア情報源102は、例えばグラフィックディスプレイ、オーディオスピーカ、MIDI楽器、アニマトロニクス人形等、あるいはメディア情報源102により提供される他のあらゆる種類のプレゼンテーションを介してメディアストリームを再生又は提示してもよい。
クライアント装置104は、入力インタフェース106を介してメディア情報源102からメディアストリームの再生を受信する。一例において、入力インタフェース106はアンテナを含んでもよく、この場合、メディア情報源102はメディアストリームをクライアント装置104に無線でブロードキャストしてもよい。しかし、メディアストリームの形式によって、メディア情報源102は、無線又は有線通信技術を使用してメディアを再生してもよい。他の例において、入力インタフェース106は、マイクロホン、ビデオカメラ、振動センサ、無線受信機、ネットワークインタフェース等のうちいずれも含むことができる。特定の一例として、メディア情報源102は音楽を再生してもよく、入力インタフェース106は音楽のサンプルを受信するマイクロホンを含んでもよい。
例において、クライアント装置104は、メディアストリームの再生を受信する以外、メディア情報源102に動作可能に結合されなくてもよい。このように、クライアント装置104は、メディア情報源102により制御されなくてもよく、メディア情報源102の必須の一部分でなくてもよい。図1に示す例において、クライアント装置104はメディア情報源102とは別個のエンティティである。
入力インタフェース106は、再生されたメディアストリームのメディアサンプルを取り込むように構成される。入力インタフェース106は、受信した全てのオーディオを記録しその記録をバッファ108に格納する等、ユーザの介入なしで連続してメディアサンプルを取り込むように事前にプログラムされてもよい。バッファ108は、多くの記録を格納してもよく、あるいは例えばクライアント装置104が所定の間隔で記録しその記録を格納してもよいように制限された時間の間の記録を格納してもよい。他の例において、メディアサンプルの取り込みは、ユーザがボタンを作動させることにより又はサンプルの取り込みをトリガする他のアプリケーションにより影響を受ける可能性がある。例えばクライアント装置104のユーザは、ボタンを押下して、マイクロホンを介してオーディオの10秒のデジタルサンプルを記録し、あるいはカメラを使用して静止画又はビデオシーケンスを取り込むことができる。
クライアント装置104は、携帯電話、無線携帯電話、パーソナルデータアシスタント(PDA)、パーソナルメディアプレーヤ装置、無線ウェブウォッチ装置、パーソナルヘッドセット装置、特定用途向け装置又は上記機能のいずれかを含むハイブリッド装置等の小さいフォームファクタのポータブル(又はモバイル)電子装置の一部として実現可能である。更にクライアント装置104は、ラップトップコンピュータ構成及び非ラップトップコンピュータ構成の双方を含むパーソナルコンピュータとして実現可能である。クライアント装置104は、より大きい装置又はシステムの構成要素であってよい。
クライアント装置は、位置識別モジュール110及びコンテンツ識別モジュール112を更に含む。位置識別モジュール110は、バッファ108からメディアサンプルを受信し且つその瞬間に取り込まれているメディアサンプルに基づいて再生されるメディアストリームにおけるメディアサンプルの時間オフセットを示す対応する推定時間位置(T)を識別するように構成される。いくつかの例において、時間位置(T)は、メディアストリームの開始からの経過時間であってもよい。
コンテンツ識別モジュール112は、バッファ108からメディアサンプルを受信し受信したメディアサンプルに対してコンテンツ識別を実行するように構成される。コンテンツ識別は、メディアストリームを識別するか、あるいはメディアサンプルに関する情報又はそれに関連する情報を識別する。コンテンツ識別モジュール112は、例えば、英国ロンドンのShazam社(Shazam Entertainment)、カリフォルニア州エメリービルのグレースノート社(Gracenote)又はカリフォルニア州サンノゼのMelodis社(Melodis)により提供されるようなあらゆるメディアサンプル情報検索サービスの例において使用されてもよく又は組み込まれてもよい。これらのサービスは、環境オーディオのサンプルを受信し、オーディオサンプルの音楽コンテンツを識別し、トラック名、アーティスト、アルバム、アートワーク、バイオグラフィ、ディスコグラフィ、コンサートチケット等を含む音楽に関する情報をユーザに提供するように動作する。
この点に関して、コンテンツ識別モジュール112は、メディア検索エンジン114を含み、例えば受信したメディアサンプル内のトラックを識別するように受信したメディアサンプルと格納情報とを比較するために基準メディアストリームに索引をつけるデータベース116を含むか又はそれに結合されてもよい。メディアストリーム内のトラックが識別されると、トラックの同一性又は他の情報はクライアント装置104のディスプレイに表示されうる。
データベース116は、複数のコンテンツを識別するための情報を含むコンテンツパターンを格納する。コンテンツパターンはメディア記録を含んでもよく、各記録は一意の識別子(例えば、sound_ID)により識別されうる。あるいは、sound_IDが他のいずれかの場所からオーディオファイルを検索するために使用可能であるため、データベース116は、各記録に対してオーディオ又はビデオファイルを必ずしも格納しなくてもよい。コンテンツパターンは、メディア記録のタイムラインに対応する時間次元を有するメディア記録のコンテンツを記述する特徴の時間的にマッピングされた集合を含む基準シグネチャファイル等の他の情報を含んでもよく、各特徴は、マッピングされた時点に近いコンテンツの記述であってもよい。コンテンツパターンは、メディアファイルの抽出された特徴と関連付けられた情報を更に含んでもよい。データベース116は、多くのコンテンツパターンを含み、クライアント装置104がローカルに格納されたコンテンツパターンに一致するコンテンツのコンテンツ識別を実行できるようにしてもよい。
データベース116は、アーティスト名、曲の長さ、曲の歌詞、歌詞の行又は単語に対する時間インデックス、アルバムアートワーク、あるいはファイルに対するあらゆる他の識別又は関連情報のようなコンテンツパターンに関する情報を示すメタデータ等の格納された各コンテンツパターンに対する情報を更に含んでもよい。
図1のシステムは、クライアント装置104が無線又は有線リンクを介して結合されてもよいネットワーク120を更に含む。サーバ122は、ネットワーク120に結合されて提供され、サーバ122は、位置識別モジュール124及びコンテンツ識別モジュール126を含む。図1は、位置識別モジュール124及びコンテンツ識別モジュール126の双方を含むようにサーバ122を示すが、例えば位置識別モジュール124及び/又はコンテンツ識別モジュール126のいずれもサーバ122とは別個のエンティティであってもよい。更に位置識別モジュール124及び/又はコンテンツ識別モジュール126は、例えばネットワーク120を介してサーバ122に接続されたリモートサーバ上にあってもよい。
いくつかの例において、クライアント装置104は、メディアサンプルを取り込んでもよく、メディアサンプルのコンテンツの同一性を判定するためにネットワーク120を介してサーバ122にメディアサンプルを送出してもよい。サーバ122の位置識別モジュール124及びコンテンツ識別モジュール126は、クライアント装置104の位置識別モジュール110及びコンテンツ識別モジュール112と同様に動作するように構成される。この点に関して、コンテンツ識別モジュール126は、メディア検索エンジン128を含み、例えば受信したメディアサンプル内のトラックを識別するように受信したメディアサンプルと格納情報とを比較するために基準メディアストリームに索引をつけるデータベース130を含むか又はそれに結合されてもよい。メディアストリーム内のトラックが識別されると、トラックの同一性又は他の情報がクライアント装置104に返される。
他の例において、クライアント装置104は、メディア情報源102からメディアストリームのサンプルを取り込み、メディアサンプルのフィンガープリント(fingerprint)を作成するようにサンプルに対して初期処理を実行することができる。クライアント装置104は、フィンガープリント情報をサーバ122の位置識別モジュール124及び/又はコンテンツ識別モジュール126に送出し、それらモジュールは、フィンガープリント情報にのみ基づいてサンプルに関する情報を識別することができる。このように、更なる計算又は識別処理は、例えばサーバ122ではなくクライアント装置104において実行されうる。
クライアント装置104は、まず受信したメディアサンプルのコンテンツ識別を試み、成功した場合、クライアント装置104は、データストリームのコンテンツの同一性を判定するようサーバ122にクエリする。他の例において、クライアント装置104は、それを行う命令をユーザから受信したことに基づいてサーバ122にクエリしてもよい。
メディアトラックのデータベースを使用してメディアサンプル及びメディアサンプルの特徴の計算によるコンテンツ識別を実行する技術において、種々のコンテンツ識別技術が公知である。以下の米国特許及び出願、すなわちKenyon他の米国特許第4,843,562号「Broadcast Information Classification System and Method」、Kenyonの米国特許第4,450,531号「Broadcast Signal Recognition System and Method」、Haitsma他の米国特許出願公開第2008/0263360号「Generating and Matching Hashes of Multimedia Content」、Wang及びCulbertの米国特許第7,627,477号「Robust and Invariant Audio Pattern Matching」、Wang、Averyの米国特許出願第2007/0143777号「Method and Apparatus for Identification of Broadcast Source」、Wang及びSmithの米国特許第6,990,453号「System and Methods for Recognizing Sound and Music Signals in High Noise and Distortion」、並びにBlum他の米国特許第5,918,223号「Method and Article of Manufacture for Content−Based Analysis,Storage,Retrieval,and Segmentation of Audio Information」は、メディア認識技術の可能な例を説明している。この引用により、これらの内容は本明細書に組み込まれる。
簡単に説明すると、(クライアント装置104又はサーバ122内の)コンテンツ識別モジュールは、メディア記録を受信し、メディア記録をサンプリングするように構成される。このメディア記録と、デジタル化された正規化基準信号セグメントとの相関がとられ、結果として得られる相関セグメント毎に相関関数のピークを取得し、相関関数のピーク間の間隔が所定の限度内である場合に認識信号を提供する。米国特許第4,450,531号(この引用により全ての内容が本明細書に組み込まれる。)で示されるように、相関関数のピークと一致するRMSパワー値のパターンは、デジタル化された基準信号セグメントからのRMSパワー値のパターンの所定限度内で一致しうる。このように、一致するメディアコンテンツが識別されうる。更にメディアコンテンツ中のメディア記録の一致位置は、例えば一致相関セグメントの位置及び相関ピークのオフセットにより与えられる。
図2は、コンテンツ識別方法の別の例を示す。一般にメディアコンテンツは、メディアサンプルの特徴又はフィンガープリントを識別又は計算し、そのフィンガープリントを基準メディアファイルの先に識別されたフィンガープリントと比較することにより識別可能である。フィンガープリントが計算されるサンプル内の特定の場所は、サンプル中の再現可能な点に依存する。そのような再現可能に計算できる場所は、「ランドマーク(landmarks)」と呼ばれる。ランドマークのサンプル内の場所は、サンプル自体により判定可能である。すなわち、その場所は、サンプルの品質に依存し且つ再現可能である。同一又は同様のランドマークは、処理が繰り返される度に同一の信号に対して計算されうる。ランドマーキング方式は、録音の1秒毎に約5〜約10個のランドマークに印をつける。しかし、ランドマーキング密度は、メディア記録内の動作量に依存する。パワーノルム(Power Norm)として公知である1つのランドマーキング技術は、記録中の多くの時点における瞬時パワーを算出し極大値を選択する。これを行う1つの方法は、波形を直接整流しフィルタリングすることによりエンベロープを算出することである。別の方法は、信号のヒルベルト変換(直交位相)を算出し、ヒルベルト変換及び元の信号の2乗和を使用することである。ランドマークを算出する他の方法が使用されてもよい。
図2は、サンプルのdB(マグニチュード)対時間の一例を示すグラフである。グラフは、多くの識別されたランドマークの位置(L〜L)を示す。ランドマークが判定されると、フィンガープリントは記録中の各ランドマーク時点又はそれに近い時点で計算される。ランドマークに対する特徴の近さは、使用されるフィンガープリンティング法により規定される。いくつかの例において、特徴が明らかにランドマークに対応し、先行又は後続するランドマークには対応しない場合、特徴はそのランドマークに近接すると考えられる。他の例において、特徴は複数の隣接するランドマークに対応する。一般にフィンガープリントは、ランドマーク時点又はそれに近い時点において記録の特徴の集合を集約する値又は値の集合である。一例において、各フィンガープリントは複数の特徴のハッシュ関数である単一の数値である。フィンガープリントの他の例は、スペクトルスライスフィンガープリント、マルチスライスフィンガープリント、LPC係数、ケプストラム係数及びスペクトログラムピークの周波数成分を含む。
フィンガープリントは、あらゆる種類のデジタル信号処理又は信号の周波数分析により計算できる。一例において、スペクトルスライスフィンガープリントを生成するために、周波数分析が各ランドマーク時点の近傍で実行され、上位のいくつかのスペクトルピークを抽出する。フィンガープリントの値は、最も強いスペクトルピークの単一の周波数値であってもよい。オーディオサンプルの特徴又はフィンガープリントを算出することに関する更なる情報については、Wang及びSmithの米国特許第6,990,453号「System and Methods for Recognizing Sound and Music Signals in High Noise and Distortion」を参照されたい。この引用により、上記文献の全ての内容が本明細書に組み込まれる。
従って、図1に戻ると、クライアント装置104又はサーバ122は、記録(例えば、メディア/データサンプル)を受信し、記録のフィンガープリントを計算することができる。一例において、記録に関する情報を識別するために、クライアント装置104のコンテンツ識別モジュール112は、データベース116にアクセスして、線形的に関連した対応関係を最も多く有するファイル又は特徴的なフィンガープリントの相対的な場所が記録の同一のフィンガープリントの相対的な場所と最も一致するファイルの場所を特定するためにデータベース116中のファイルと同等なフィンガープリントとの間の対応関係を生成することにより、記録のフィンガープリントと、既知のオーディオトラックのフィンガープリントと記録のフィンガープリントとのマッチングをとることができる。
図2を参照すると、フィンガープリントが一致する(又はほぼ一致する)基準ファイル及びサンプルのランドマークの散布図が示される。サンプルは、多くの基準ファイルと比較され、多くの散布図を生成してもよい。散布図を生成した後、ランドマーク対の間の線形的な対応関係が識別され、集合は線形的に関連する対の数に従ってスコアをつけることができる。線形的な対応関係は、例えば統計的に有意な数の対応するサンプルの場所及び基準ファイルの場所が許容値内でほぼ同一の一次方程式により記述される場合に起こる可能性がある。最も高い統計的に有意なスコアを有する集合のファイル、すなわち線形的に関連した対応関係を最も多く有する集合のファイルがウィニングファイルであり、一致メディアファイルと考えられる。
一例において、ファイルに対するスコアを生成するためにオフセット値のヒストグラムが生成される。オフセット値は、フィンガープリントが一致する基準ファイルとサンプルとの間のランドマーク時間位置の差分であってもよい。図2は、オフセット値のヒストグラムの一例を示す。基準ファイルは、ヒストグラムのピークと等しいスコアを与えられうる(例えば、図2においてスコア=28)。各基準ファイルは、スコアを生成するためにこのように処理可能であり、最も高いスコアを有する基準ファイルが、サンプルに対する一致と判定されうる。
メディアストリーム内のコンテンツを識別する技術の更に別の例として、メディアサンプルは局所マッチング技術を使用してそのコンテンツを識別するために分析されうる。例えば、一般に2つのメディア記録間の関係は、それぞれのサンプルから導出される最初に一致する特定のフィンガープリントオブジェクトによって特徴付けられる。それぞれが特定の場所で発生するフィンガープリントオブジェクトの集合が、各メディアサンプルに対して生成される。各場所は、それぞれのメディアサンプルのコンテンツによって判定され、各フィンガープリントオブジェクトはそれぞれの特定の場所又はその近傍で1つ以上の局所的な特徴を特徴付ける。次に、一致したフィンガープリントオブジェクトの対毎に相対値が判定される。その後、相対値のヒストグラムが生成される。統計的に有意なピークが見つけられる場合、2つのメディアサンプルはほぼ一致すると特徴付けられる。更に、オーディオサンプルが元のオーディオトラック/基準オーディオトラックと比較してどの程度スピードアップ又はスローダウンしたかを示す時間伸張比が判定されうる。この方法の更に詳細な説明は、Wang及びCulbertの米国特許第7,627,477号「Robust and Invariant Audio Pattern Matching」を参照されたい。この引用により、同文献のすべての内容が本明細書に組み込まれる。
更に上記出願において説明されるシステム及び方法は、メディアサンプルの同一性より多くのものを返してもよい。例えばWang及びSmithの米国特許第6,990,453号で説明される方法を使用すると、識別されたオーディオトラックに関連付けられたメタデータに加えて、識別されたサンプルの開始からのメディアサンプルの相対時間オフセット(RTO)を返してもよい。記録の相対時間オフセットを判定するために、サンプルのフィンガープリントは、フィンガープリントが一致する元のファイルのフィンガープリントと比較されうる。各フィンガープリントは所定の時間に発生するため、サンプルを識別するためにフィンガープリントを一致させた後、第1のフィンガープリント(サンプルの一致するフィンガープリントの)と格納された元のファイルの第1のフィンガープリントとの間の時間の差分は、例えば曲における時間であるサンプルの時間オフセットとなる。従って、サンプルが得られた相対時間オフセット(例えば、曲における67秒)が判定されうる。RTOを判定するために、他の情報が使用されてもよい。例えばヒストグラムのピークの場所は、基準記録の開始からサンプル記録の開始までの時間オフセットと考えられてもよい。
メディアサンプルの種類によって、コンテンツ識別の他の形態が実行されてもよい。例えばビデオストリーム(例えば、映画)内の位置を識別するために、ビデオ識別アルゴリズムが使用されてもよい。ビデオ識別アルゴリズムの一例は、Oostveen,J.他の「Feature Extraction and a Database Strategy for Video Fingerprinting」、Lecture Notes in Computer Science、2314、(2002年3月11日)、117〜128ページにおいて説明される。この引用により、同文献のすべての内容が本明細書に組み込まれる。例えばビデオにおけるビデオサンプルの位置は、識別されたビデオフレームを判定することにより導出されうる。ビデオフレームを識別するために、メディアサンプルのフレームは行及び列から成る格子に分割され、格子のブロック毎に、画素の輝度値の平均が計算される。空間フィルタは、計算された平均輝度値に適用され、格子のブロック毎にフィンガープリントビットを導出できる。フィンガープリントビットは、フレームを一意に識別するために使用可能であり、既知のメディアを含むデータベースのフィンガープリントビットと比較可能であるか又はマッチングが可能である。フレームから抽出されたフィンガープリントビットは、サブフィンガープリントと呼ばれ、フィンガープリントブロックは、連続フレームからの固定数のサブフィンガープリントである。サブフィンガープリント及びフィンガープリントブロックを使用して、ビデオサンプルの識別が実行されうる。メディアサンプルが含まれるフレームに基づいて、ビデオにおける位置(例えば、時間オフセット)が判定されうる。
更にコンテンツ識別の他の形態は、ウォーターマーキング法を使用するなどして実行されてもよい。ウォーターマーキング法は、メディアストリームがある間隔で埋め込みウォーターマークを有するように時間オフセットを判定するためにクライアント装置104の位置識別モジュール110(及び同様にサーバ122の位置識別モジュール124)により使用可能であり、例えば各ウォーターマークは、直接又はデータベースルックアップを介して間接的にウォーターマークの時間又は位置を指定できる。
コンテンツ識別モジュール112の機能を実現するコンテンツ識別方法の上記例の一部において、識別処理の副産物は、メディアストリーム内のメディアサンプルの時間オフセットであってもよい。従って、そのような例において、位置識別モジュール110はコンテンツ識別モジュール112と同一であってもよく、あるいは位置識別モジュール110の機能はコンテンツ識別モジュール112により実行されてもよい。
いくつかの例において、クライアント装置104又はサーバ122は、ネットワーク120を介してメディアストリーム・ライブラリ・データベース132に更にアクセスしてサンプリングされたメディアに対応するメディアストリームを選択してもよく、そのメディアストリームは、クライアント装置104に返され、クライアント装置104により再生されてもよい。メディアストリーム・ライブラリ・データベース132中の情報又はメディアストリーム・ライブラリ・データベース132自体は、データベース116内に含まれてもよい。
メディアサンプルに対応するメディアストリームは、例えばクライアント装置104のユーザによりマニュアルで選択されてもよいし、クライアント装置104によりプログラムにより選択されてもよいし、あるいはメディアサンプルの同一性に基づいてサーバ122により選択されてもよい。選択されたメディアストリームは、メディアサンプルとは異なる種類のメディアであってもよく、メディア情報源102により再生されているメディアに同期されてもよい。例えば、メディアサンプルは音楽であってもよく、選択されたメディアストリームは、音楽に同期可能な歌詞、楽譜、ギタータブラチュア、伴奏、ビデオ、アニマトロニクス人形のダンス、アニメーションシーケンス等であってもよい。クライアント装置104は、メディアサンプルに対応する選択されたメディアストリームを受信してもよく、メディア情報源102により再生されているメディアと同期して選択されたメディアストリームを再生してもよい。
メディア情報源102により再生されているメディアの推定時間位置は、位置識別モジュール110により判定され、選択されたメディアストリームを再生する選択されたメディアストリーム内の対応位置を判定するために使用される。クライアント装置104がメディアサンプルを取り込むようにトリガされる場合、タイムスタンプ(T)はクライアント装置104の基準クロックから記録される。いずれかの時間tにおいて、推定リアルタイムメディアストリーム位置T(t)は、推定識別メディアストリーム位置T+タイムスタンプの時間からの経過時間から判定される。
Figure 2014519660
(t)は、メディアストリームの開始から現在再生されているメディアストリームのリアルタイム位置までの経過時間である。従って、T(すなわち、記録されたサンプルに基づくメディアストリームの開始からメディアストリームの位置までの推定経過時間)を使用して、T(t)が算出されうる。T(t)は、メディア情報源102により再生されているメディアと同期して選択されたメディアストリームを提示するためにクライアント装置104により使用される。例えばクライアント装置104は、メディア情報源102により再生されているメディアと同期して選択されたメディアストリームを再生及び提示するように、時間位置T(t)又は時間T(t)が経過した位置において選択されたメディアストリームの再生を開始してもよい。
いくつかの実施形態において、選択されたメディアストリームがメディア情報源102により再生されているメディアと同期しなくなることを緩和又は防止するため、推定位置T(t)は速度調整比Rに従って調整されうる。例えば米国特許第7,627,477号「Robust and invariant audio pattern matching」(この引用により、同文献のすべての内容が本明細書に組み込まれる。)において説明される方法は、メディアサンプル、推定識別メディアストリーム位置T及び速度比Rを識別するために実行されうる。速度比Rを推定するために、一致するフィンガープリントの可変部分のクロス周波数比が算出され、周波数が時間に反比例するため、クロス時間比はクロス周波数比の逆数である。クロス速度比Rはクロス周波数比(例えば、クロス時間比の逆数)である。
特に、上述した方法を使用して、2つのオーディオサンプル間の関係は、サンプルの時間周波数スペクトログラムを生成し(例えば、各フレームにおいて周波数ビンを生成するためにフーリエ変換を計算し)、スペクトログラムの局所的なエネルギーピークを識別することにより特徴付けられる。局所的なエネルギーピークに関連した情報は抽出され、各々が場所フィールド、可変の構成要素及び不変の構成要素をオプションとして含むフィンガープリントオブジェクトのリストに集約される。それぞれのオーディオサンプルのスペクトログラムから導出された特定のフィンガープリントオブジェクトは一致されうる。相対値は、一致したフィンガープリントオブジェクトの対毎に判定され、例えばそれぞれのオーディオサンプルのパラメータ値の対数の差分又は商であってもよい。
一例において、スペクトルピークの局所的な対はメディアサンプルのスペクトログラムから選択され、局所的な対の各々はフィンガープリントを含む。同様に、スペクトルピークの局所的な対は、既知のメディアストリームのスペクトログラムから選択され、局所的な対の各々はフィンガープリントを含む。サンプルと既知のメディアストリームとの間の一致するフィンガープリントが判定され、サンプル及びメディアストリームの各々に対するスペクトルピーク間の時間差分が算出されうる。例えば、サンプルの2つのピーク間の時間差分は判定され、既知のメディアストリームの2つのピーク間の時間差分と比較される。これらの2つの時間差分の比は比較され、そのような比の多くを含むヒストグラムが生成されうる(例えば、一致するフィンガープリントの対から抽出されうる)。ヒストグラムのピークは、実際の速度比(例えば、メディア情報源102がメディアを再生している時の速度とメディアが基準メディアファイルで再生される時の速度との差分)であると判定されてもよい。従って、速度比Rの推定値は、例えばヒストグラムのピークが相対的なピッチとして又は線形的な伸張の場合は相対的な再生速度として2つのオーディオサンプル間の関係を特徴付けるようなヒストグラムのピークを見つけることにより取得できる。
グローバルな相対値(例えば、速度比R)は、2つのオーディオサンプルからの対応する可変構成要素を使用して一致したフィンガープリントオブジェクトから算出されうる。可変構成要素は、各フィンガープリントオブジェクトの場所に近接する局所的な特徴から判定される周波数値であってもよい。速度比Rは、デルタ時間又は周波数の比、あるいは2つのオーディオサンプル間のマッピングを記述するために使用されるグローバルパラメータの推定値を結果として与える他の関数であってよい。速度比Rは、例えば相対的な再生速度の推定値と考えられてもよい。
速度比Rは、他の方法を使用しても推定可能である。例えば、メディアの複数のサンプルが取り込み可能であり、コンテンツ識別は各サンプルに対して実行され、k番目のサンプルに対して基準クロック時間T(k)における複数の推定メディアストリーム位置T(k)を取得できる。Rは以下のように推定できる。
Figure 2014519660
時間変動としてRを表すために、以下の式が使用されてもよい。
Figure 2014519660
従って、速度比Rは、ある時間範囲にわたる推定時間位置Tを使用して算出され、メディアがメディア情報源102により再生されている時の速度を判定できる。
速度比Rを使用して、リアルタイムメディアストリーム位置の推定値が以下のように算出できる。
Figure 2014519660
リアルタイムメディアストリーム位置は、メディアサンプルの時間の位置を示す。例えばメディアサンプルが4分の長さの曲から得られ、T(t)が1分である場合、曲の1分が経過したことを示す。
図3は、データストリームのコンテンツを識別する一例の方法300を示すフローチャートである。本明細書で開示する処理及び方法並びに他の処理及び方法に対して、フローチャートは本実施形態の1つの可能な実現例の機能性及び動作を示すことが理解されるべきである。この点に関して、各ブロックは、処理の特定の論理機能又はステップを実現するためにプロセッサにより実行可能な1つ以上の命令を含むモジュール、セグメント又はプログラムコードの一部を表してもよい。プログラムコードは、例えばディスク又はハードドライブを含む記憶装置等のあらゆる種類のコンピュータ読み取り可能な記憶媒体又はデータ記憶装置に格納されてもよい。コンピュータ読み取り可能な記憶媒体は、例えばレジスタメモリ、プロセッサキャッシュ及びランダムアクセスメモリ(RAM)のようなデータを短期間格納するコンピュータ可読媒体等の非一時的なコンピュータ可読媒体を含んでもよい。コンピュータ読み取り可能な記憶媒体は、例えば読み出し専用メモリ(ROM)、光ディスク、磁気ディスク、コンパクトディスク読み出し専用メモリ(CD−ROM)のような二次記憶装置又は永続的な長期記憶装置等の非一時的な媒体を更に含んでもよい。コンピュータ可読媒体は、他のあらゆる揮発性又は不揮発性記憶システムであってもよい。コンピュータ読み取り可能な記憶媒体は、例えば有形のコンピュータ可読記憶媒体と考えられてもよい。
更に、図3の各ブロックは、処理の特定の論理機能を実行するために配線される回路網を表してもよい。当業者には当然理解されるように、機能が関係する機能性に依存して図示されるか又は説明される順番とは異なる順番、例えばほぼ同時又は逆の順番で実行されてもよい別の実現例は、本発明の実施形態の例の範囲内に含まれる。
方法300は、ブロック302においてクライアント装置で連続したデータストリームを受信することを含む。連続したデータストリームは、ラジオ放送、テレビのオーディオ/ビデオ又は再生されているあらゆるオーディオ等のあらゆする種類のデータ又はメディアを含んでもよい。データストリームはソースにより連続して再生されてもよく、従って、クライアント装置はデータストリームを連続して受信してもよい。いくつかの例において、クライアント装置は、再生されるデータストリームの実質的な部分を受信するように又はほぼ常にデータストリームを受信するように、ほぼ連続したデータストリームを受信してもよい。
方法300は、ブロック304において連続したデータストリームがメディアコンテンツを含むかを判定することを含む。一例において、クライアント装置は、データストリームの特徴の変動を判定するためにデータストリームを処理してもよく、この処理は、データストリームがメディアコンテンツを含むかを判定するために、音声の有声成分及び無声成分の変化を区別し且つメディアコンテンツの既知の特徴とデータストリームとを比較することを含む。一例において、クライアント装置は、本明細書に参考として全ての内容が取り入れられている米国特許第6,570,991号公報で説明される方法を使用して、データストリームが曲を含むオーディオ等のメディアコンテンツを含むかを判定してもよい。他の例において、クライアント装置は、Sheirer及びSlaneyの「Construction and Evaluation of a Robust Multifeature Speech/Music Discriminator」Proceeding ICASSP 1997、第2巻において説明される方法(この引用により、同文献のすべての内容が本明細書に組み込まれる。)を使用して、データストリームが曲を含むオーディオ等のメディアコンテンツを含むかを判定してもよい。
方法300は、ブロック306において、クライアント装置においてクライアント装置に格納されたコンテンツパターンに基づいてデータストリームのコンテンツのコンテンツ識別をほぼ連続して実行することを含む。コンテンツパターンは、複数のコンテンツを識別するための情報を含んでもよく、例えばメディアファイルの抽出された特徴又はメディアファイルを記述する特徴の時間的にマッピングされた集合と関連付けられた情報等のあらゆる種類の情報を含んでもよい。各コンテンツパターンは、例えば所定の基準ファイルのランドマーク−フィンガープリント対を更に含んでもよい。
クライアント装置は、連続したデータストリームを受信し、コンテンツ識別を連続して実行してもよい。このように、クライアント装置は、受信される全てのコンテンツを識別しようとしてもよい。コンテンツ識別は、例えばクライアント装置が動作している間又はコンテンツ識別機能を含むアプリケーションが実行している間に常に又はほぼ常に実行されるように、ほぼ連続して実行されてもよい。
いくつかの例において、データストリームを受信するとコンテンツ識別が実行可能であるため、データストリームが受信されない場合はコンテンツ識別が実行されなくてもよい。クライアント装置は、マイクロホンからデータストリームを連続して受信するように(例えば、周囲オーディオを常に取り込むように)構成されてもよい。一例において、データストリームがメディアコンテンツを含むかの判定(ブロック304)に基づいて、クライアント装置は、データストリームがメディアデータを含む時(及びデータストリームがランダムな周囲ノイズを含む時以外)にコンテンツ識別を実行するように、クライアント装置においてデータストリームのコンテンツのコンテンツ識別を連続して実行してもよい。
クライアント装置は、ユーザ入力なしで(例えば、ユーザがクライアント装置をトリガしてコンテンツ識別を実行させる必要はない)コンテンツ識別を実行するようにコンテンツ識別を連続して実行するように構成されてもよい。クライアント装置のユーザは、コンテンツ識別を連続して実行するアプリケーションを開始してもよく、あるいはクライアント装置がコンテンツ識別を連続して実行するようにクライアント装置の設定を構成してもよい。
方法300は、ブロック308において、命令を受信することに基づいてクライアント装置がデータストリームのコンテンツの同一性を判定するためにサーバをクエリすることを含む。クライアント装置は、クライアント装置にローカルに格納されたコンテンツパターンに基づいてコンテンツ識別を実行してもよい。クライアント装置は限られた数のコンテンツパターンを含む可能性があるため、クライアント装置のコンテンツ識別能力は制限される可能性がある。一例において、ユーザはコンテンツの同一性を判定するためにサーバをクエリする命令を提供してもよい。ユーザは、例えばローカルに格納したコンテンツパターンがデータストリーム内のいずれのコンテンツとも一致しない場合等、クライアント装置がコンテンツを識別できない場合にその命令を提供してもよい。
別の例として、データストリームのコンテンツがメディアコンテンツを含み且つクライアント装置において識別されない場合、クライアント装置はユーザに通知を提供してもよく、ユーザは、データストリームのコンテンツの同一性を判定するためのサーバに対するクエリをクライアント装置に行わせる通知の選択を提供してもよい。
クライアント装置は、クライアント装置により実行されるコンテンツの識別を検証するユーザリクエストに基づいて又はコンテンツ識別が正確である確率が低い(例えば、一致するフィンガープリントの数が所定の閾値未満である)場合に、クライアント装置により実行されるコンテンツの識別を検証するためにサーバを更にクエリしてもよい。
図3の方法300を使用して、特徴となるコンテンツは、クライアント装置によりローカルで識別されてもよく(ローカルに格納されたコンテンツパターンに基づいて)、クライアント装置により識別されていないあらゆるコンテンツはサーバにより識別されうる。方法300は、全てのコンテンツ識別処理がクライアント装置において実行されることを可能にする(例えば、サンプルの特徴の抽出、電話に格納された限定されたコンテンツパターンの集合の検索等)。一例において、特徴となるコンテンツがクライアント装置により取り込まれる場合、クライアント装置は、コンテンツ識別を実行でき、認識を示す通知(例えば、ポップアップウィンドウ)を提供できる。方法300は、特徴となるコンテンツが識別される時期をユーザに通知するためにユーザに対してゼロクリックタグ付け体験を提供してもよい。
クライアント装置にアップロードされ且つ格納されるコンテンツパターンは、メディアソースにより再生される可能性がより高いと判定されるメディアファイルと関連付けられてもよい。従って、クライアント装置がまずローカルコンテンツ識別を実行することを試みることができ、実行できなかった場合にユーザがサーバをクエリするようにクライアント装置に命令してもよいように、人気のコンテンツ又は特徴となるコンテンツのコンテンツパターンはクライアント装置に格納されうる。
クライアント装置は、例えば識別されたコンテンツに関連した広告を表示したり又は識別されたコンテンツに関連した同期されたメディアを表示したりする等、データストリームのコンテンツを識別した後に多くの機能を実行してもよい。別の例として、コンテンツを識別した後、クライアント装置は、コンテンツに関連するか又は関連しないウェブサイト、ビデオ等にユーザを誘導してもよい。
図4は、データストリームのコンテンツを識別する一例のシステム400を示す。図4におけるシステムの説明される機能又は構成要素のうちの1つ以上が追加の機能構成要素又は物理構成要素に分割されてもよく、あるいはより少ない機能構成要素又は物理構成要素に組み合わされてもよい。更なるいくつかの例において、追加の機能構成要素及び/又は物理構成要素は、図4に示す例に追加されてもよい。
システム400は、認識サーバ402及び要求サーバ404を含む。認識サーバ402は、コンテンツの同一性を判定するためのクエリをクライアント装置から受信するように構成されてもよく、クエリはコンテンツのサンプルを含んでもよい。認識サーバ402は、位置識別モジュール406とメディア検索エンジン410を含むコンテンツ識別モジュール408とを含み、データベース412及びメディアストリーム・ライブラリ・データベース414に結合される。認識サーバ404は、例えば図1のサーバ122と同様に動作するように構成されてもよい。
要求サーバ404は、クライアント装置が連続識別モードでクライアント装置において受信したデータストリーム内のコンテンツのコンテンツ識別を連続して実行するように(コンテンツを識別するためにクエリを認識サーバ402に送出するのではなく又は送出することに加えて)、連続識別モードで動作するようにクライアント装置に命令するように構成されてもよい。要求サーバ404はコンテンツパターンを含むデータベース416に結合されてもよく、要求サーバ404はデータベース416にアクセスしてコンテンツパターンを検索しコンテンツパターンをクライアント装置に送信してもよい。
一例において、要求サーバ404は、1つ以上のコンテンツパターン及びクライアント装置においてデータストリームのコンテンツのコンテンツ識別を連続して実行する命令をクライアント装置に送信してもよい。クライアント装置は、連続モードで応答可能に動作してもよい。認識サーバ402が大量のコンテンツ識別要求を受けている間に要求サーバ404はクライアント装置に命令を送出してもよいため、要求サーバ402はコンテンツ識別をローカルで実行するようにいくつかのクライアント装置に命令することにより負荷平衡を実行する。大量の要求が受信される可能性のある時期の例は、多くの視聴者がテレビを観ている間に曲を含む広告がそのテレビで流れている時を含む。そのような例において、要求サーバ404は事前に計画し、広告の間に再生される曲と一致するコンテンツパターンをクライアント装置に提供し且つクライアント装置がコンテンツ識別をローカルで実行する命令を含むことができる。命令は、クライアント装置がローカルコンテンツ識別を実行すべき時期の指示、例えば未来のある時間又はある期間にそれを行うように命令することを含んでもよい。いくつかの例において、宣伝のために、コンテンツパターンはパターン(例えば、約100〜500個のコンテンツパターン)のローカルキャッシュを有するようにクライアント装置に提供され、命令は宣伝が行われる限りコンテンツ識別をローカルで実行するようにクライアント装置に指示できる。
クライアント装置に提供されるコンテンツパターンは、多くの基準に基づいて要求サーバ404により選択されうる。例えば要求サーバ404は、ユーザのプロファイルに関連した情報を受信してもよく、ユーザのプロファイルに相関されるクライアント装置に提供されるコンテンツパターンを選択してもよい。特にユーザは、特定のジャンルの音楽、アーティスト、音楽の種類、音楽のソース等に対する好みを指示してもよく、要求サーバ404は、これらの好みに相関されるメディアに対するコンテンツパターンを提供してもよい。
別の例として、要求サーバ404は、クライアント装置の場所(過去又は現在)に関連した情報を受信してもよく、クライアント装置の場所と関連付けられるクライアント装置に提供されるコンテンツパターンを選択してもよい。特に要求サーバ404は、クライアント装置がコンサートにいることを示す情報を受信してもよく、クライアント装置に提供されるコンサートにおける音楽のジャンル又はアーティストと関連付けられたコンテンツパターンを選択してもよい。
別の例として、要求サーバ404は、クライアント装置に格納されたメディアコンテンツに関連した情報を受信してもよく、クライアント装置に格納されたメディアコンテンツに関連するクライアント装置に提供されるコンテンツパターンを選択してもよい。コンテンツパターンは、アーティスト、ジャンル、種類、年、テンポ等の多くの方法で関連付けられてもよい。
別の例として、要求サーバ404は、クライアント装置により先に識別されたメディアコンテンツに関連した情報を受信してもよく、クライアント装置又は認識サーバ402により先に識別されたコンテンツに関連するクラインと装置に提供されるコンテンツパターンを選択してもよい。この例において、要求サーバ404は、識別されたコンテンツに関連したコンテンツパターンを選択及び提供するために、クライアント装置又は認識サーバ402により識別されたコンテンツのリストを格納してもよい。
別の例として、要求サーバ404は、第三者により受信された情報に基づいてクライアント装置に提供されるコンテンツパターンを選択してもよい。第三者は、クライアント装置に提供されるコンテンツパターンを選択するように選択を要求サーバ404に提供してもよい。一例において、第三者の広告主は、ラジオ又はテレビ広告内で流される今後の広告内に含まれるコンテンツに基づいてコンテンツパターンを選択してもよい。
別の例として、要求サーバ404は、コンテンツ識別の履歴に関する複数のコンテンツの人気を示す統計プロファイルに基づくクライアント装置に提供されるコンテンツパターンを選択してもよい。この例において、要求サーバ404は、認識サーバ402により識別されたメディアコンテンツのリストを維持してもよく、各メディアコンテンツに対する多くのコンテンツ識別要求に基づいてメディアコンテンツの人気をランク付けしてもよい。閾値(例えば、所定期間内に1000個の要求)を上回る多くのコンテンツ識別要求を受信したメディアコンテンツに対して、要求サーバ404は、メディアコンテンツのコンテンツパターンを選択し、コンテンツパターンをクライアント装置に提供してもよい。このように、クライアント装置は、コンテンツパターンのローカルコピーを有し、コンテンツ識別をローカルで実行してもよい。
更なる例において、要求サーバ404は、例えばクライアント装置の場所及び第三者(例えば、第三者はクライアント装置の場所に基づいてクライアント装置に提供される多くのコンテンツパターンを識別する)から受信した選択されたコンテンツパターン等、基準のあらゆる組み合わせに基づくクライアント装置に提供されるコンテンツパターンを選択してもよい。
一般にいくつかの例において、要求サーバ404は、クライアント装置(又はクライアント装置のユーザ)が選択したコンテンツのコンテンツ識別を要求する確率に基づいてクライアント装置に提供されるコンテンツパターンを選択する。例えばリリースされた新しい曲又は人気の曲、あるいは認識サーバ402の受信するコンテンツ認識要求が過去に急激に上昇したことがある曲に対して、要求サーバ404は、クライアント装置が認識サーバ402と通信する必要なくローカルコンテンツ識別を実行できるようにそれらの曲のコンテンツパターンをクライアント装置に提供してもよい。これは、認識サーバ402のトラフィックの負担を軽減し、クライアント装置においてコンテンツ識別をローカルで実行することによりコンテンツ識別がより迅速に実行されることを可能にするであろう。
本明細書において説明した方法の例を使用して、全てのコンテンツ識別処理は限定されたコンテンツの集合に対してクライアント装置において実行されうる。例えば宣伝のために、宣伝のコンテンツに関連したコンテンツパターンはクライアント装置に提供可能であり、クライアント装置は、連続認識モードで動作し、この限定されたコンテンツの集合を識別できるように構成されてもよい。
本明細書において種々の態様及び実施形態が開示されたが、他の態様及び実施形態が当業者には明らかとなるであろう。本明細書で開示した種々の態様及び実施形態は、例示することが目的であって、限定することを意図したものではなく、実際発明の主旨の範囲は以下の特許請求の範囲により示される。多くの変更や変形がその主旨の範囲から逸脱せずに行えることは、当業者には明らかであろう。本明細書で列挙した方法及び装置に加えて、本発明の範囲内の機能的に同等な方法及び装置が当業者には上記説明から明らかとなるであろう。そのような変更及び変形は、添付の特許請求の範囲の範囲内に入ることを意図する。
多くの詳細の変更、変形及び修正が説明した例に対して行えるため、上記説明及び添付の図面に示した全ての事項は例示として解釈され、限定する意味はないことが意図される。

Claims (32)

  1. データストリームのコンテンツを識別する方法であって、
    クライアント装置において連続したデータストリームを受信するステップと、
    前記クライアント装置において、前記クライアント装置に格納され、複数のコンテンツを識別するための情報を含むコンテンツパターンに基づいて、前記データストリームのコンテンツのコンテンツ識別をほぼ連続して実行するステップと、
    命令を受信したことに基づいて、前記クライアント装置が前記データストリームのコンテンツの同一性を判定するためにサーバをクエリするステップと、
    を有することを特徴とする方法。
  2. 前記連続したデータストリームがメディアコンテンツを含むかを判定するステップと、
    前記判定に基づいて、前記クライアント装置において前記データストリームのコンテンツの前記コンテンツ識別を連続して実行するステップと、
    を更に有することを特徴とする請求項1に記載の方法。
  3. 前記データストリームのコンテンツがメディアコンテンツを含み、かつ、前記クライアント装置において識別されない場合に、前記クライアント装置が通知を提供するステップと、
    前記データストリームのコンテンツの前記同一性を判定するための前記サーバに対するクエリを前記クライアント装置に行わせる前記通知のユーザ選択を受信するステップと、
    を更に有することを特徴とする請求項2に記載の方法。
  4. 前記データストリームのコンテンツが前記クライアント装置に格納された前記コンテンツパターンのいずれかに一致するかを判定するステップを更に有することを特徴とする請求項1に記載の方法。
  5. 前記データストリームのコンテンツの前記コンテンツ識別を連続して実行するステップは、ユーザ命令なしで前記コンテンツ識別を実行することを特徴とする請求項1に記載の方法。
  6. 前記クライアント装置において1つ以上のコンテンツパターンを受信するステップと、
    前記クライアント装置において前記データストリームのコンテンツの前記コンテンツ識別を連続して実行する命令を前記サーバから応答可能に受信するステップと、 を更に有することを特徴とする請求項1に記載の方法。
  7. 前記クライアント装置においてユーザのプロファイルと相関をとられるコンテンツの1つ以上のコンテンツパターンを受信するステップを更に有することを特徴とする請求項1に記載の方法。
  8. 前記クライアント装置において前記クライアント装置の場所と関連付けられる1つ以上のコンテンツパターンを受信するステップを更に有することを特徴とする請求項1に記載の方法。
  9. 前記クライアント装置において、前記クライアント装置又は前記サーバにより先に識別されたコンテンツと関連付けられる1つ以上のコンテンツパターンを受信するステップを更に有することを特徴とする請求項1に記載の方法。
  10. 前記クライアント装置において前記クライアント装置に格納されたメディアコンテンツに関連付けられる1つ以上のコンテンツパターンを受信するステップを更に有することを特徴とする請求項1に記載の方法。
  11. 前記クライアント装置において、コンテンツ識別の履歴に関する複数のコンテンツの人気を示す統計プロファイルに基づいて選択される1つ以上のコンテンツパターンを受信するステップを更に有することを特徴とする請求項1に記載の方法。
  12. 前記クライアント装置において、第三者により選択される1つ以上のコンテンツパターンを受信するステップを更に有することを特徴とする請求項1に記載の方法。
  13. 前記クライアント装置が前記データストリームのコンテンツを識別するステップと、
    前記識別されたコンテンツに基づいて前記クライアント装置が前記識別されたコンテンツに関連した広告を表示するステップと、
    を更に有することを特徴とする請求項1に記載の方法。
  14. 前記クライアント装置が前記データストリームのコンテンツを識別するステップと、
    前記識別されたコンテンツに基づいて前記クライアント装置が前記識別されたコンテンツに関連した同期されたメディアを表示するステップと、
    を更に有することを特徴とする請求項1に記載の方法。
  15. 前記クライアント装置が前記データストリームのコンテンツを識別するステップと、
    前記クライアント装置が前記識別を検証するために前記サーバをクエリするステップと、
    を更に有することを特徴とする請求項1に記載の方法。
  16. 前記クライアント装置に格納された前記コンテンツパターンは、メディアファイルの抽出された特徴と関連付けられた情報を含むことを特徴とする請求項1に記載の方法。
  17. 前記クライアント装置に格納された前記コンテンツパターンは、メディアファイルを記述する特徴の時間的にマッピングされた集合を含むことを特徴とする請求項1に記載の方法。
  18. コンピュータ装置において連続したデータストリームを受信する機能と、
    前記コンピュータ装置において、前記コンピュータ装置に格納され、複数のコンテンツを識別するための情報を含むコンテンツパターンに基づいて、前記データストリームのコンテンツのコンテンツ識別を連続して実行する機能と、
    命令を受信したことに基づいて、前記コンピュータ装置が前記データストリームのコンテンツの同一性を判定するためにサーバをクエリする機能と、
    を前記コンピュータ装置に実行させるために前記コンピュータ装置により実行可能な命令を格納したコンピュータ読み取り可能な記憶媒体。
  19. 前記命令は、
    前記連続したデータストリームがメディアコンテンツを含むかを判定する機能と、
    前記判定に基づいて、前記コンピュータ装置において前記データストリームのコンテンツの前記コンテンツ識別を連続して実行する機能と、
    を更に実行するために実行可能であることを特徴とする請求項18に記載のコンピュータ読み取り可能な記憶媒体。
  20. 前記命令は、
    前記コンピュータ装置において、ユーザのプロファイルと相関がとられるコンテンツパターン、前記コンピュータ装置の場所と関連付けられるコンテンツパターン、前記コンピュータ装置又は前記サーバにより先に識別されたコンテンツに関連したコンテンツパターン、前記コンピュータ装置に格納されたメディアコンテンツに関連したコンテンツパターン、及び、前記コンテンツ識別に関する複数のコンテンツの人気を示す統計プロファイルに基づいて選択されたコンテンツパターンからなるグループから選択される1つ以上のコンテンツパターンを受信する機能を更に実行するために実行可能であることを特徴とする請求項18に記載のコンピュータ読み取り可能な記憶媒体。
  21. 前記命令は、
    前記コンピュータ装置が前記データストリームのコンテンツを識別する機能と、
    前記識別されたコンテンツに基づいて、前記コンピュータ装置が前記識別されたコンテンツに関連した広告を表示する機能と、
    を更に実行するために実行可能であることを特徴とする請求項18に記載のコンピュータ読み取り可能な記憶媒体。
  22. データストリームのコンテンツを識別するシステムであって、
    プロセッサと、
    データ記憶装置と、
    を備え、前記データ記憶装置は、
    コンピュータ装置において連続したデータストリームを受信する機能と、
    前記コンピュータ装置に格納され、複数のコンテンツを識別するための情報を含むコンテンツパターンに基づいて、前記データストリームのコンテンツのコンテンツ識別を連続して実行する機能と、
    命令を受信したことに基づいて、前記コンピュータ装置が前記データストリームのコンテンツの同一性を判定するためにサーバをクエリする機能と、
    を実行するために前記プロセッサにより実行可能な命令を格納したことを特徴とするシステム。
  23. 前記命令は、
    前記連続したデータストリームがメディアコンテンツを含むかを判定する機能と、
    前記判定に基づいて、前記コンピュータ装置において前記データストリームのコンテンツの前記コンテンツ識別を連続して実行する機能と、
    を更に実行するために実行可能であることを特徴とする請求項22に記載のシステム。
  24. 前記命令は、
    前記コンピュータ装置において、ユーザのプロファイルと相関がとられるコンテンツパターン、前記コンピュータ装置の場所と関連付けられるコンテンツパターン、前記コンピュータ装置又は前記サーバにより先に識別されたコンテンツに関連したコンテンツパターン、前記コンピュータ装置に格納されたメディアコンテンツに関連したコンテンツパターン、及び、前記コンテンツ識別に関する複数のコンテンツの人気を示す統計プロファイルに基づいて選択されたコンテンツパターンからなるグループから選択されるコンテンツの1つ以上のコンテンツパターンを受信する機能を更に実行するために実行可能であることを特徴とする請求項22に記載のシステム。
  25. 前記命令は、
    前記コンピュータ装置が前記データストリームのコンテンツを識別する機能と、
    前記識別されたコンテンツに基づいて、前記コンピュータ装置が前記識別されたコンテンツに関連した広告を表示する機能と、
    を更に実行するために実行可能であることを特徴とする請求項22に記載のシステム。
  26. データストリームのコンテンツを識別するシステムであって、
    コンテンツの同一性を判定するために前記コンテンツのサンプルを含むクエリをクライアント装置から受信するように構成される認識サーバと、
    連続識別モードで前記クライアント装置において受信したデータストリーム内のコンテンツのコンテンツ識別を連続して実行する前記クライアント装置に対して前記連続識別モードで動作するように命令するように構成される要求サーバと、
    を含むことを特徴とするシステム。
  27. 前記要求サーバは、複数のコンテンツを識別するための情報を含む1つ以上のコンテンツパターンを前記クライアント装置に提供することを特徴とする請求項26に記載のシステム。
  28. 前記要求サーバは、ユーザのプロファイルに基づいて前記1つ以上のコンテンツパターンを選択することを特徴とする請求項27に記載のシステム。
  29. 前記要求サーバは、前記クライアント装置の場所に基づいて前記1つ以上のコンテンツパターンを選択することを特徴とする請求項27に記載のシステム。
  30. 前記要求サーバは、先のクエリのコンテンツのサンプルに基づいて前記1つ以上のコンテンツパターンを選択することを特徴とする請求項27に記載のシステム。
  31. 前記要求サーバは、前記クライアント装置に格納されたメディアコンテンツに基づいて前記1つ以上のコンテンツパターンを選択することを特徴とする請求項27に記載のシステム。
  32. 前記要求サーバは、前記コンテンツ識別に関する複数のコンテンツの人気を示す統計プロファイルに基づいて前記1つ以上のコンテンツパターンを選択することを特徴とする請求項27に記載のシステム。
JP2014514526A 2011-06-10 2012-06-04 データストリームのコンテンツを識別する方法及びシステム Active JP5833235B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161495571P 2011-06-10 2011-06-10
US61/495,571 2011-06-10
PCT/US2012/040754 WO2012170353A1 (en) 2011-06-10 2012-06-04 Methods and systems for identifying content in a data stream

Publications (2)

Publication Number Publication Date
JP2014519660A true JP2014519660A (ja) 2014-08-14
JP5833235B2 JP5833235B2 (ja) 2015-12-16

Family

ID=46246272

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014514526A Active JP5833235B2 (ja) 2011-06-10 2012-06-04 データストリームのコンテンツを識別する方法及びシステム

Country Status (9)

Country Link
US (1) US9256673B2 (ja)
EP (1) EP2718849A1 (ja)
JP (1) JP5833235B2 (ja)
KR (1) KR101578279B1 (ja)
CN (1) CN103797483B (ja)
BR (1) BR112013031574A2 (ja)
CA (1) CA2837725C (ja)
MX (1) MX336061B (ja)
WO (1) WO2012170353A1 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016157086A (ja) * 2015-02-26 2016-09-01 パイオニア株式会社 歌詞音声出力装置、歌詞音声出力方法、及び、プログラム
WO2020059008A1 (ja) 2018-09-18 2020-03-26 Pioneer DJ株式会社 楽曲データ照合装置、楽曲解析データ配信サーバ、楽曲データ照合プログラム、および楽曲解析データ配信プログラム
JP2020533918A (ja) * 2017-09-13 2020-11-19 ザ ニールセン カンパニー ユーエス リミテッド ライアビリティ カンパニー 自動コンテンツ認識によるコールドマッチング
JP2020536455A (ja) * 2017-12-07 2020-12-10 ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド ビデオ推奨方法、ビデオ推奨装置、コンピュータ機器及び記憶媒体
JP2020205594A (ja) * 2016-03-16 2020-12-24 ザ ニールセン カンパニー ユーエス リミテッド ライアビリティ カンパニー コンテンツフィンガープリンティングのためのフィンガープリントレイアウト
JP2021064960A (ja) * 2015-04-23 2021-04-22 ザ ニールセン カンパニー ユーエス リミテッド ライアビリティ カンパニー 自動コンテンツ認識フィンガープリントシーケンス照合

Families Citing this family (61)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7490775B2 (en) 2004-12-30 2009-02-17 Aol Llc, A Deleware Limited Liability Company Intelligent identification of multimedia content for synchronization
US7937422B1 (en) 2005-11-03 2011-05-03 Aol Inc. Digital asset hosting and distribution
US8595781B2 (en) 2009-05-29 2013-11-26 Cognitive Media Networks, Inc. Methods for identifying video segments and displaying contextual targeted content on a connected television
US10116972B2 (en) 2009-05-29 2018-10-30 Inscape Data, Inc. Methods for identifying video segments and displaying option to view from an alternative source and/or on an alternative device
US10375451B2 (en) 2009-05-29 2019-08-06 Inscape Data, Inc. Detection of common media segments
US10949458B2 (en) 2009-05-29 2021-03-16 Inscape Data, Inc. System and method for improving work load management in ACR television monitoring system
US9094714B2 (en) 2009-05-29 2015-07-28 Cognitive Networks, Inc. Systems and methods for on-screen graphics detection
US9449090B2 (en) 2009-05-29 2016-09-20 Vizio Inscape Technologies, Llc Systems and methods for addressing a media database using distance associative hashing
US10192138B2 (en) 2010-05-27 2019-01-29 Inscape Data, Inc. Systems and methods for reducing data density in large datasets
US9838753B2 (en) 2013-12-23 2017-12-05 Inscape Data, Inc. Monitoring individual viewing of television events using tracking pixels and cookies
US8433577B2 (en) * 2011-09-27 2013-04-30 Google Inc. Detection of creative works on broadcast media
US8893168B2 (en) 2012-02-07 2014-11-18 Turner Broadcasting System, Inc. Method and system for synchronization of dial testing and audience response utilizing automatic content recognition
US20140129571A1 (en) * 2012-05-04 2014-05-08 Axwave Inc. Electronic media signature based applications
RU2630261C2 (ru) * 2012-07-12 2017-09-06 Сони Корпорейшн Передающее устройство, способ обработки информации, программа, приемное устройство и система взаимодействия приложения
US9596386B2 (en) * 2012-07-24 2017-03-14 Oladas, Inc. Media synchronization
US20140095333A1 (en) * 2012-09-28 2014-04-03 Stubhub, Inc. System and Method for Purchasing a Playlist Linked to an Event
US9027048B2 (en) * 2012-11-14 2015-05-05 Bank Of America Corporation Automatic deal or promotion offering based on audio cues
US10366419B2 (en) 2012-11-27 2019-07-30 Roland Storti Enhanced digital media platform with user control of application data thereon
US10339936B2 (en) 2012-11-27 2019-07-02 Roland Storti Method, device and system of encoding a digital interactive response action in an analog broadcasting message
US9154841B2 (en) 2012-12-28 2015-10-06 Turner Broadcasting System, Inc. Method and system for detecting and resolving conflicts in an automatic content recognition based system
US9451048B2 (en) 2013-03-12 2016-09-20 Shazam Investments Ltd. Methods and systems for identifying information of a broadcast station and information of broadcasted content
US9384754B2 (en) 2013-03-12 2016-07-05 Comcast Cable Communications, Llc Removal of audio noise
US20150012840A1 (en) * 2013-07-02 2015-01-08 International Business Machines Corporation Identification and Sharing of Selections within Streaming Content
US9955192B2 (en) 2013-12-23 2018-04-24 Inscape Data, Inc. Monitoring individual viewing of television events using tracking pixels and cookies
CN106030542A (zh) 2014-02-19 2016-10-12 第三雷沃通讯有限责任公司 代理服务器故障转移和负载集群
US10178346B2 (en) 2014-03-17 2019-01-08 Microsoft Technology Licensing, Llc Highlighting unread messages
US9888207B2 (en) 2014-03-17 2018-02-06 Microsoft Technology Licensing, Llc Automatic camera selection
US9749585B2 (en) 2014-03-17 2017-08-29 Microsoft Technology Licensing, Llc Highlighting unread messages
US10284813B2 (en) 2014-03-17 2019-05-07 Microsoft Technology Licensing, Llc Automatic camera selection
US20150264309A1 (en) * 2014-03-17 2015-09-17 Microsoft Corporation Playback of Interconnected Videos
US20150301718A1 (en) * 2014-04-18 2015-10-22 Google Inc. Methods, systems, and media for presenting music items relating to media content
CN104142993B (zh) * 2014-07-30 2017-08-29 东软集团股份有限公司 基于深度特征的复杂snort规则分类方法及系统
US10762533B2 (en) * 2014-09-29 2020-09-01 Bellevue Investments Gmbh & Co. Kgaa System and method for effective monetization of product marketing in software applications via audio monitoring
AU2015355209B2 (en) 2014-12-01 2019-08-29 Inscape Data, Inc. System and method for continuous media segment identification
BR112017016123A2 (pt) 2015-01-30 2018-04-17 Inscape Data Inc servidor de correspondência para identificação de conteúdo de vídeo que é exibido por um sistema de televisão, método executado por computador, e produto de programa informático concretamente incorporado a um meio de armazenamento de leitura por máquina permanente de um dispositivo de informática
CN107949849B (zh) 2015-04-17 2021-10-08 构造数据有限责任公司 缩减大数据集中数据密度的系统和方法
AU2016291674B2 (en) 2015-07-16 2021-08-26 Inscape Data, Inc. Systems and methods for partitioning search indexes for improved efficiency in identifying media segments
US10080062B2 (en) 2015-07-16 2018-09-18 Inscape Data, Inc. Optimizing media fingerprint retention to improve system resource utilization
AU2016291690B2 (en) 2015-07-16 2020-08-27 Inscape Data, Inc. Prediction of future views of video segments to optimize system resource utilization
EP3323245B1 (en) 2015-07-16 2021-08-25 Inscape Data, Inc. Detection of common media segments
US9848235B1 (en) * 2016-02-22 2017-12-19 Sorenson Media, Inc Video fingerprinting based on fourier transform of histogram
US20170255387A1 (en) * 2016-03-04 2017-09-07 Intel Corporation Techniques to Cause a Content Pattern to be Stored to Memory Cells of a Memory Device
CN113726518B (zh) 2016-11-24 2023-06-30 创新先进技术有限公司 在网络中发布作品的方法和装置
US10701438B2 (en) 2016-12-31 2020-06-30 Turner Broadcasting System, Inc. Automatic content recognition and verification in a broadcast chain
US10922720B2 (en) 2017-01-11 2021-02-16 Adobe Inc. Managing content delivery via audio cues
EP3349394B1 (en) * 2017-01-16 2021-11-10 Vertigo Media, Inc. System, method, and application for exchanging content in a social network environment
BR112019019430A2 (pt) 2017-04-06 2020-04-14 Inscape Data Inc sistema, método e produto de programa de computador
US10264297B1 (en) * 2017-09-13 2019-04-16 Perfect Sense, Inc. Time-based content synchronization
US11132396B2 (en) 2017-12-15 2021-09-28 Google Llc Methods, systems, and media for determining and presenting information related to embedded sound recordings
DE102018128214A1 (de) 2018-11-12 2020-05-14 Sennheiser Electronic Gmbh & Co. Kg Verfahren und Vorrichtung zur Auswahl eines Audiodatenstroms
US10868620B2 (en) * 2018-12-26 2020-12-15 The Nielsen Company (Us), Llc Methods and apparatus for optimizing station reference fingerprint loading using reference watermarks
US11234049B2 (en) * 2019-06-24 2022-01-25 The Nielsen Company (Us), Llc Use of steganographically-encoded time information as basis to control implementation of dynamic content modification
US11212560B2 (en) * 2019-06-24 2021-12-28 The Nielsen Company (Us), Llc Use of steganographically-encoded time information as basis to establish a time offset, to facilitate taking content-related action
CN112995759A (zh) * 2019-12-13 2021-06-18 腾讯科技(北京)有限公司 互动业务处理方法、系统、装置、设备及存储介质
US11356720B2 (en) 2020-01-30 2022-06-07 Snap Inc. Video generation system to render frames on demand
US11036781B1 (en) 2020-01-30 2021-06-15 Snap Inc. Video generation system to render frames on demand using a fleet of servers
US11284144B2 (en) * 2020-01-30 2022-03-22 Snap Inc. Video generation system to render frames on demand using a fleet of GPUs
EP4096798A1 (en) 2020-01-30 2022-12-07 Snap Inc. System for generating media content items on demand
GB2597334A (en) 2020-07-17 2022-01-26 Playrcart Ltd A media player
KR102380540B1 (ko) * 2020-09-14 2022-04-01 네이버 주식회사 음원을 검출하기 위한 전자 장치 및 그의 동작 방법
CN116437256A (zh) * 2020-09-23 2023-07-14 华为技术有限公司 音频处理方法、计算机可读存储介质、及电子设备

Family Cites Families (64)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4450531A (en) 1982-09-10 1984-05-22 Ensco, Inc. Broadcast signal recognition system and method
US4843562A (en) 1987-06-24 1989-06-27 Broadcast Data Systems Limited Partnership Broadcast information classification system and method
US5134719A (en) 1991-02-19 1992-07-28 Mankovitz Roy J Apparatus and methods for identifying broadcast audio program selections in an FM stereo broadcast system
US5333275A (en) 1992-06-23 1994-07-26 Wheatley Barbara J System and method for time aligning speech
US5437050A (en) 1992-11-09 1995-07-25 Lamb; Robert G. Method and apparatus for recognizing broadcast information using multi-frequency magnitude detection
US5465240A (en) 1993-01-05 1995-11-07 Mankovitz; Roy J. Apparatus and methods for displaying text in conjunction with recorded audio programs
WO1994018218A1 (en) 1993-02-01 1994-08-18 Seq, Ltd. Methods and apparatus for dna sequencing
JP2986345B2 (ja) 1993-10-18 1999-12-06 インターナショナル・ビジネス・マシーンズ・コーポレイション 音声記録指標化装置及び方法
US5740230A (en) 1996-05-31 1998-04-14 Octel Communications Corporation Directory management system and method
US5918223A (en) 1996-07-22 1999-06-29 Muscle Fish Method and article of manufacture for content-based analysis, storage, retrieval, and segmentation of audio information
US5952597A (en) 1996-10-25 1999-09-14 Timewarp Technologies, Ltd. Method and apparatus for real-time correlation of a performance to a musical score
US6570991B1 (en) 1996-12-18 2003-05-27 Interval Research Corporation Multi-feature speech/music discrimination system
US6166314A (en) 1997-06-19 2000-12-26 Time Warp Technologies, Ltd. Method and apparatus for real-time correlation of a performance to a musical score
JPH1155201A (ja) 1997-07-29 1999-02-26 Sony Corp 情報処理装置および方法、情報処理システム、並びに伝送媒体
WO2000004676A1 (fr) 1998-07-14 2000-01-27 Sony Corporation Procede de gestion de la transmission de donnees, procede de transmission de donnees, et emetteur et recepteur de donnees
JP3925586B2 (ja) 1998-07-17 2007-06-06 ソニー株式会社 データ受信装置および方法ならびにデータ送受信システムおよび方法
US6735633B1 (en) * 1999-06-01 2004-05-11 Fast Forward Networks System for bandwidth allocation in a computer network
US6735634B1 (en) * 1999-06-10 2004-05-11 Blue Coat Systems Method for real time protocol media recording
TW495735B (en) 1999-07-28 2002-07-21 Yamaha Corp Audio controller and the portable terminal and system using the same
US7174293B2 (en) 1999-09-21 2007-02-06 Iceberg Industries Llc Audio identification system and method
US7194752B1 (en) 1999-10-19 2007-03-20 Iceberg Industries, Llc Method and apparatus for automatically recognizing input audio and/or video streams
US7444353B1 (en) * 2000-01-31 2008-10-28 Chen Alexander C Apparatus for delivering music and information
US6834308B1 (en) 2000-02-17 2004-12-21 Audible Magic Corporation Method and apparatus for identifying media content presented on a media playing device
US7853664B1 (en) 2000-07-31 2010-12-14 Landmark Digital Services Llc Method and system for purchasing pre-recorded music
US6990453B2 (en) 2000-07-31 2006-01-24 Landmark Digital Services Llc System and methods for recognizing sound and music signals in high noise and distortion
FI20002161A (fi) 2000-09-29 2002-03-30 Nokia Mobile Phones Ltd Menetelmä ja järjestelmä melodian tunnistamiseksi
US7277766B1 (en) 2000-10-24 2007-10-02 Moodlogic, Inc. Method and system for analyzing digital audio files
US20020072982A1 (en) 2000-12-12 2002-06-13 Shazam Entertainment Ltd. Method and system for interacting with a user in an experiential environment
US20020087702A1 (en) * 2000-12-29 2002-07-04 Koichi Mori Remote contents displaying method with adaptive remote font
CN1235408C (zh) 2001-02-12 2006-01-04 皇家菲利浦电子有限公司 生成和匹配多媒体内容的散列
US7359889B2 (en) 2001-03-02 2008-04-15 Landmark Digital Services Llc Method and apparatus for automatically creating database for use in automated media recognition system
KR100820385B1 (ko) 2002-04-25 2008-04-10 랜드마크 디지털 서비시즈 엘엘씨 확실하고 불변적인 오디오 패턴 매칭방법
US20040266337A1 (en) 2003-06-25 2004-12-30 Microsoft Corporation Method and apparatus for synchronizing lyrics
US20050147256A1 (en) 2003-12-30 2005-07-07 Peters Geoffrey W. Automated presentation of entertainment content in response to received ambient audio
US7986913B2 (en) 2004-02-19 2011-07-26 Landmark Digital Services, Llc Method and apparatus for identificaton of broadcast source
JP2005274992A (ja) * 2004-03-25 2005-10-06 Sony Corp 楽曲識別用情報検索システム、楽曲購入システム、楽曲識別用情報取得方法、楽曲購入方法、オーディオ信号処理装置およびサーバ装置
US8688248B2 (en) 2004-04-19 2014-04-01 Shazam Investments Limited Method and system for content sampling and identification
EP1774348B1 (en) 2004-06-24 2018-08-08 Shazam Investments Limited Method of characterizing the overlap of two media segments
US7574451B2 (en) * 2004-11-02 2009-08-11 Microsoft Corporation System and method for speeding up database lookups for multiple synchronized data streams
US20060112812A1 (en) 2004-11-30 2006-06-01 Anand Venkataraman Method and apparatus for adapting original musical tracks for karaoke use
US8090579B2 (en) 2005-02-08 2012-01-03 Landmark Digital Services Automatic identification of repeated material in audio signals
CN1845591A (zh) * 2005-04-06 2006-10-11 上海渐华科技发展有限公司 卡拉ok接收装置
US20070166683A1 (en) * 2006-01-05 2007-07-19 Apple Computer, Inc. Dynamic lyrics display for portable media devices
JP2008015595A (ja) * 2006-07-03 2008-01-24 Sony Corp コンテンツ選択推薦方法、サーバ、コンテンツ再生装置、コンテンツ記録装置およびコンテンツ選択推薦用プログラム
EP2070231B1 (en) 2006-10-03 2013-07-03 Shazam Entertainment, Ltd. Method for high throughput of identification of distributed broadcast content
US8005666B2 (en) 2006-10-24 2011-08-23 National Institute Of Advanced Industrial Science And Technology Automatic system for temporal alignment of music audio signal with lyrics
TWI330795B (en) 2006-11-17 2010-09-21 Via Tech Inc Playing systems and methods with integrated music, lyrics and song information
US20080196575A1 (en) 2007-02-16 2008-08-21 Recordare Llc Process for creating and viewing digital sheet music on a media device
US20090083281A1 (en) 2007-08-22 2009-03-26 Amnon Sarig System and method for real time local music playback and remote server lyric timing synchronization utilizing social networks and wiki technology
US8400961B1 (en) * 2007-08-27 2013-03-19 Qurio Holdings, Inc. Wireless multimedia brokerage service for real time content provisioning
US8645993B2 (en) * 2008-05-07 2014-02-04 Qualcomm Incorporated Methods and apparatuses for directing recipients of video content items to interesting video content items
US8452586B2 (en) 2008-12-02 2013-05-28 Soundhound, Inc. Identifying music from peaks of a reference sound fingerprint
US8869184B2 (en) * 2008-12-19 2014-10-21 At&T Intellectual Property I, Lp Sharing behavioral patterns between devices
GB2467324B (en) 2009-01-28 2014-03-26 Norwell Sa Device, system and method for measurement of media consumption in digital media terminals
US8291328B2 (en) 2009-03-24 2012-10-16 Disney Enterprises, Inc. System and method for synchronizing a real-time performance with a virtual object
US8548613B2 (en) 2009-04-20 2013-10-01 Disney Enterprises, Inc. System and method for an interactive device for use with a media device
US8311950B1 (en) * 2009-10-01 2012-11-13 Google Inc. Detecting content on a social network using browsing patterns
US20110203006A1 (en) * 2010-02-15 2011-08-18 Openwave Systems Inc. Method and system for delivering closed-audience content to a closed mobile audience
WO2011140269A1 (en) 2010-05-04 2011-11-10 Shazam Entertainment Ltd. Methods and systems for processing a sample of a media stream
US9280598B2 (en) 2010-05-04 2016-03-08 Soundhound, Inc. Systems and methods for sound recognition
CA2798072C (en) 2010-05-04 2017-02-14 Shazam Entertainment Ltd. Methods and systems for synchronizing media
US9159338B2 (en) 2010-05-04 2015-10-13 Shazam Entertainment Ltd. Systems and methods of rendering a textual animation
US8543395B2 (en) 2010-05-18 2013-09-24 Shazam Entertainment Ltd. Methods and systems for performing synchronization of audio with corresponding textual transcriptions and determining confidence values of the synchronization
MX341124B (es) * 2011-06-08 2016-08-09 Shazam Entertainment Ltd Métodos y sistemas para realizar comparaciones de datos recibidos y proporcionar un servicio de seguimiento con base en las comparaciones.

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
CSNH200800004012; 筒井 秀樹: 'デジタルメディア処理先端技術 (映像コンテンツを介したコミュニケーション支援システム "コミュテンツ"' 東芝レビュー 第62巻 第12号, 20071201, 62-65ページ, 株式会社東芝 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016157086A (ja) * 2015-02-26 2016-09-01 パイオニア株式会社 歌詞音声出力装置、歌詞音声出力方法、及び、プログラム
JP2021064960A (ja) * 2015-04-23 2021-04-22 ザ ニールセン カンパニー ユーエス リミテッド ライアビリティ カンパニー 自動コンテンツ認識フィンガープリントシーケンス照合
JP7128255B2 (ja) 2015-04-23 2022-08-30 ロク インコーポレイテッド 自動コンテンツ認識フィンガープリントシーケンス照合
JP2020205594A (ja) * 2016-03-16 2020-12-24 ザ ニールセン カンパニー ユーエス リミテッド ライアビリティ カンパニー コンテンツフィンガープリンティングのためのフィンガープリントレイアウト
JP7059327B2 (ja) 2016-03-16 2022-04-25 ロク インコーポレイテッド コンテンツフィンガープリンティングのためのフィンガープリントレイアウト
JP2020533918A (ja) * 2017-09-13 2020-11-19 ザ ニールセン カンパニー ユーエス リミテッド ライアビリティ カンパニー 自動コンテンツ認識によるコールドマッチング
JP7116786B2 (ja) 2017-09-13 2022-08-10 ロク インコーポレイテッド 自動コンテンツ認識によるコールドマッチング
JP2020536455A (ja) * 2017-12-07 2020-12-10 ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッド ビデオ推奨方法、ビデオ推奨装置、コンピュータ機器及び記憶媒体
WO2020059008A1 (ja) 2018-09-18 2020-03-26 Pioneer DJ株式会社 楽曲データ照合装置、楽曲解析データ配信サーバ、楽曲データ照合プログラム、および楽曲解析データ配信プログラム

Also Published As

Publication number Publication date
KR20140024433A (ko) 2014-02-28
KR101578279B1 (ko) 2015-12-28
US20120317240A1 (en) 2012-12-13
CA2837725A1 (en) 2012-12-13
WO2012170353A1 (en) 2012-12-13
CN103797483A (zh) 2014-05-14
JP5833235B2 (ja) 2015-12-16
CN103797483B (zh) 2017-02-22
US9256673B2 (en) 2016-02-09
MX2013014476A (es) 2014-08-01
CA2837725C (en) 2017-07-11
BR112013031574A2 (pt) 2018-04-24
EP2718849A1 (en) 2014-04-16
MX336061B (es) 2016-01-07

Similar Documents

Publication Publication Date Title
JP5833235B2 (ja) データストリームのコンテンツを識別する方法及びシステム
JP6060155B2 (ja) 受信データの比較を実行しその比較に基づいて後続サービスを提供する方法及びシステム
US10003664B2 (en) Methods and systems for processing a sample of a media stream
US9251796B2 (en) Methods and systems for disambiguation of an identification of a sample of a media stream
US20120191231A1 (en) Methods and Systems for Identifying Content in Data Stream by a Client Device
WO2012112573A1 (en) Methods and systems for identifying content in a data stream by a client device

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20141219

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150106

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150402

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151005

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151028

R150 Certificate of patent or registration of utility model

Ref document number: 5833235

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: R3D02

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250