JP2006527425A - 改良されたデータ検索方法およびシステム - Google Patents

改良されたデータ検索方法およびシステム Download PDF

Info

Publication number
JP2006527425A
JP2006527425A JP2006506672A JP2006506672A JP2006527425A JP 2006527425 A JP2006527425 A JP 2006527425A JP 2006506672 A JP2006506672 A JP 2006506672A JP 2006506672 A JP2006506672 A JP 2006506672A JP 2006527425 A JP2006527425 A JP 2006527425A
Authority
JP
Japan
Prior art keywords
content item
identifier
database
content
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2006506672A
Other languages
English (en)
Other versions
JP2006527425A5 (ja
Inventor
ルエイテル ヘンドリクス エイ エイ エム デ
ヤープ エイ ハイツマ
アルノルダス ジェイ エル エム マーンドンクス
Original Assignee
グレイスノート インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by グレイスノート インコーポレイテッド filed Critical グレイスノート インコーポレイテッド
Publication of JP2006527425A publication Critical patent/JP2006527425A/ja
Publication of JP2006527425A5 publication Critical patent/JP2006527425A5/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/632Query formulation
    • G06F16/634Query by example, e.g. query by humming
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H20/00Arrangements for broadcast or for distribution combined with broadcast
    • H04H20/12Arrangements for observation, testing or troubleshooting
    • H04H20/14Arrangements for observation, testing or troubleshooting for monitoring programmes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H2201/00Aspects of broadcast communication
    • H04H2201/90Aspects of broadcast communication characterised by the use of signatures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Multimedia (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Signal Processing (AREA)
  • Mathematical Physics (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

コンテンツアイテムに関連するデータを得る方法であって、この方法が、コンテンツアイテムの識別子を得るステップ(32)、データを得るために識別子を用いてデータベースルックアップを実行するステップ(33)、およびデータベースルックアップがデータを得ることができない場合、人間(200)によって処理するために出力部(210)にコンテンツアイテムを送るステップ(37)、を有し、この方法は、コンテンツアイテムを多数のクラスのうちの一つに自動的に分類するステップ(35)により特徴付けられ、且つコンテンツアイテムの分類に基づくことを条件に、識別子を得るステップ、データベースルックアップを実行するステップ、およびコンテンツアイテムを送るステップのうちの少なくとも1つを実行することにより特徴付けられる。一実施例では、データベースルックアップがデータを得ることができず、コンテンツアイテムが多数の所定のクラスのうちの一つに分類されたときのみ(36)、コンテンツアイテムを出力部に送る。この発明を実行するサーバ(300)およびコンピュータプログラムプロダクトも備えられる。

Description

本発明は、コンテンツアイテムに関連するデータを得る方法であって、上記コンテンツアイテムの識別子を得るステップ、上記データを得るために上記識別子を用いてデータベースルックアップを実行するステップ、および上記データベースルックアップがデータを得ることができない場合、人間によって処理するために出力部に上記コンテンツアイテムを送るステップ、を有する方法に関する。
本発明は、更に、コンテンツアイテムに関連するデータを得るシステムであって、上記コンテンツアイテムの識別子を得る手段、上記データを得るために上記識別子を用いてデータベースルックアップを実行する手段、および上記データベースルックアップが上記データを得ることができない場合、人間によって処理するために出力部に上記コンテンツアイテムを送る手段、を有するシステムに関する。
本発明は、更にコンピュータープログラムプロダクトに関する。
ますます多くのコンテンツが利用可能になっているにしたがって、自動ブロードキャストモニタリング、即ち、ラジオ局又はテレビ局のプレイリストの自動生成が、ますます重要になる。自動コンテンツ識別の既知の技術は、多くはウォータマーク又はフィンガープリントに基づいている。ウォータマークに基づくシステムは、コンテンツアイテムに埋め込まれるウォータマークのペイロードから、コンテンツアイテムの識別子を取り出す。フィンガープリントに基づくシステムは、アイテムの最も関連する知覚的特徴の表現を計算し、それを識別子として使用する。関連するデータ(例えば、タイトル、アーティスト、ジャンルなど)とともに多くのコンテンツアイテムの識別子が、データベースに記憶される。特定のコンテンツアイテムのデータは、その識別子を得て、その識別子をルックアップキー又はクエリーパラメータとして用いてデータベースでルックアップ又はクエリーを実行することによって、検索される。次いで、ルックアップは、識別子に関連するデータを返す。
斯かるシステムは、データベースに識別子が存在している歌、ビデオクリップ、映画、又は他のコンテンツがブロードキャストされているときは、自動的に識別する。しかし、データベースがどんなに大きくても、データベースに識別子が存在していないブロードキャストコンテンツが常に存在するだろう。例えば、データベースに識別子がまだ加えられていない新しくリリースされた歌は、識別できない。更に、システムのコストはデータベースのサイズとともに直線的に増加するので、極端に大きいデータベースを有することは、あまり経済的でもない。更に、1つの国のラジオ局によりブロードキャストされる歌の98%は、小規模な歌の集合(典型的には20.000乃至30.000)だけに存在している。
現在、ブロードキャストモニタリングプロバイダは、それらプロバイダがブロードキャストされるあらゆるコンテンツアイテムを識別したいとすると、識別されなかった全てのコンテンツを人間に聞かせる又は見させる。これは手作業であるので、プロバイダは大きなコストを負う。
オーディオフィンガープリンティングの応用例は、顧客が自分の携帯電話を使用して顧客が知らないタイトルの歌を識別するサービスである。最大の顧客満足のため、顧客が識別したい歌のフィンガープリントがデータベースに存在している確率が、重大である。したがって、フィンガープリントサービスへの全ての電話はオーディオファイルに記録され、例えば、週に一度、それらファイルの全て(又は、或る部分)が手作業で識別される。これは、フィンガープリントデータベースのコンテンツを最適化するために行われ、したがって、顧客が識別したい歌のフィンガープリントがデータベースに存在している確率を最大にしている。同じようなビデオ用の応用例も可能である。
米国特許5,862,223号は、ユーザのリクエストが専門家によって答えられるようにリクエストが専門家に割り当てられる専門家照合方法および装置を開示している。リクエストが受け取られると、データベースは、専門家による仕事の重複を避けるために、同様のリクエストをサーチする。同様のリクエストが発見されない場合、リクエストの中に発見されるキーワード又は内容の指示子(designator)を用いて、リクエストの分類に基づき、適切な専門家のサーチが実行される。
米国特許出願2003/0037010号は、デジタル作品の不法な伝送を検出する方法を開示している。興味のある作品は、MP3、AVI、ASF又はOGGのような、興味のあるファイルタイプによって認識され識別される。データベースは、問題としている作品がデータベースのコンテンツと一致するかどうかを決定するために問い合わせを受ける。コンテンツアイテムのメタデータは、データベースルックアップによって得られる。データベースルックアップがうまくいかない場合、メタデータを手作業で与えることができる。データベースは、作品の識別子を使用してサーチされる。その作品は著作権で保護されるものとして識別されることがデータベースサーチで明らかになれば、適切な動作(伝送を阻止する等)が取られる。
本発明の目的は、プリアンブルによる方法であって、先行技術で必要とされる手作業を削減する方法を提供することにある。
この目的は、本発明によれば、上記コンテンツアイテムを複数のクラスのうちの一つに自動的に分類するステップにより特徴付けられ、且つ上記コンテンツアイテムの分類に基づくことを条件に他のステップのうちの少なくとも1つを実行することにより特徴付けられる方法によって達成される。自動分類技術をコンテンツ識別技術と組み合わせることによって、失敗したデータベースのルックアップを手作業で処理しなければならないコストは、かなり削減される。本発明は、データベースルックアップおよび/又はコンテンツアイテムを人間に送ることが有用な目的にかなうのかどうかを十分な情報を得た上で決定することを、自動分類ステップが可能にするという洞察に基づく。
上記の先行技術の文献には、この洞察は開示又は示唆されていない。米国特許5,862,223号では、データベースサーチも専門家によるサーチも、分類を条件に実行されていない。つまり、両方のステップとも、リクエストが分類されたクラスにかかわらず、実行される。クラスはサーチを容易にするために使用されるが、サーチが必要ではないことを決定するためには使用されない。米国特許出願2003/0037010号では、コンテンツをMP3又はAVIとして認識するステップが、適切なコンテンツ識別子モジュールを選択するためにのみ使用されるが、データベースルックアップが必要ではないことを決定するためには使用されない。メタデータデータベース又は登録されたコンテンツを有するデータベースに問い合わせることは、コンテンツのMP3又はAVIとしての認識を条件とするものではない。
これらのシステムは、処理されるべき全てのコンテンツを認識できるという絶対的な前提に基づいて構成される。したがって、データベースルックアップを飛ばすことはできず、データルックアップが失敗した場合、これは手動識別のためにコンテンツを常に送ることを意味する。したがって、これらのシステムは、問題のコンテンツが識別できない単なるランダムノイズであっても、常にデータベースルックアップを実行し、手動識別のためにコンテンツを送る。
本発明の第1の態様では、その方法は、上記コンテンツアイテムが複数の所定のクラスのうちの一つに分類されたとき、且つそのときに限り、上記データベースルックアップを実行するステップを有する。この方法により、ルックアップがうまくいかないことが回避される。例えば、コンテンツアイテムがクラス「音楽」に分類される場合、音楽でのデータベースのルックアップは成功するであろうが、「ノイズ」として分類されたコンテンツアイテムは発見できず、したがって除外できる。
本発明の第2の態様では、その方法は、上記データベースルックアップが上記データを得ることができず、上記コンテンツアイテムが複数の所定のクラスのうちの一つに分類されたとき、且つそのときに限り、上記コンテンツアイテムを上記出力部に送るステップを有する。これは、人間オペレータが聞かなければならない又は見なければならないコンテンツの量を削減する。例えば、ブロードキャストオーディオモニタリングの場合、「音楽」と「音楽以外」とを区別する簡単な二クラス分類器を使用することができる。この場合、フィンガープリンティングによって識別されず「音楽」として分類されなかったオーディオを、手作業で識別しなければならないだけである。識別されなかったオーディオの大部分はスピーチからなるので、手作業をかなり削減することが達成できる。
それは、人間オペレータに知らされるデータの量を最小限にするという利点を提供する。サーバによって認識されない全てのコンテンツは、人間オペレータがそれらのコンテンツを聞く又は見ることができる端末に送られなければならない。これは、潜在的に大量のオーディオコンテンツ又はビデオコンテンツをオペレータに送らなければならないことを意味する。オペレータが物理的に遠い場所に位置している場合、必要な帯域幅は費用がかかるだろう。本発明によれば、認識できないものとして分類されるコンテンツを送る必要はなく、これは必要な帯域幅を削減する。
他の実施例では、その方法は、上記コンテンツアイテムが分類されたクラスに基づいて、上記出力部を複数の出力部から選択するステップを有する。識別されなかったコンテンツを特定のジャンル(ポップ、クラシック等)に分類できるさらに高性能の分類器は、識別されなかったコンテンツを、対応するジャンルの専門知識を有する適切な人に自動的に配信できる特別の可能性を加えたものである。
他の実施例では、その方法は、上記コンテンツアイテムのフィンガープリントを算出することによって上記識別子を得るステップを有する。オーディオクリップ又はビデオクリップのようなコンテンツアイテムのフィンガープリントは、問題のアイテムの最も関連がある知覚的特徴の表現である。斯かるフィンガープリントは時には「(強い(robust))ハッシュ」としても知られる。
他の実施例では、その方法は、上記コンテンツアイテムに埋められるウォータマークのペイロードから上記識別子を抽出することによって上記識別子を得るステップを有する。ウォータマーク検出は、特にビデオウォータマーク検出の場合、かなりの処理量を必要とするだろう。
本発明の第3の態様によれば、識別子がフィンガープリント算出又はウォータマークペイロード抽出によって得られるものである場合、コンテンツアイテムを複数の所定のクラスのうちの1つに分類したとき、且つそのときに限り、これらの動作を実行することが有利である。
ウォータマークの場合、ウォータマークを含んでいないものとして認識されるコンテンツを分類および無視することによって、必要な処理量が削減される。ウォータマークが存在していることを示さないクラスに分類することができるコンテンツ(例えばコマーシャル又はランダムノイズ)は、ウォータマーク検出を受ける必要がない。
フィンガープリント算出の場合、幾つかの構成では、フィンガープリント算出は、データベースルックアップが実行される場所から物理的に離れた位置で行われる。斯かる構成では、スピーチ若しくはノイズのような認識できないコンテンツ、又はコマーシャルブレーク若しくはニュースのような識別される必要がないコンテンツに対しても、フィンガープリントが算出される。斯かる認識できないコンテンツを「排除する」ために分類器を適用することにより、データベースルックアップ部分に送られる必要があるフィンガープリントの量が削減される。
本発明の別の目的は、プリアンブルによるシステムであって、従来技術で必要な手作業を削減するシステムを提供することである。
この目的は、本発明によれば、上記識別子を得る手段、上記データベースルックアップを実行する手段、および上記コンテンツアイテムを送る手段のうちの少なくとも1つが、上記コンテンツアイテムを複数のクラスのうちの一つに分類する手段の出力に依存して動作することを特徴とするシステムによって、達成される。
一実施例では、人間によって処理するためにコンテンツアイテムを送る手段は、上記データベースルックアップを実行する手段が上記データを得ることができず、且つ上記分類する手段が上記コンテンツアイテムを複数の所定のクラスのうちの一つに分類することを条件に、上記コンテンツアイテムを送る。
本発明のこれらおよび他の態様は、図面に示される実施例から明らかであり、その実施例を基準にして説明されるだろう。
図を通じて、同じ符号は、同様の又は対応する特徴を示す。図面に示される特徴の幾つかは、典型的にはソフトウェア、およびソフトウェアエンティティを表すようなもの(例えば、ソフトウェアモジュール又はソフトウェアオブジェクト)で実現される。
図1は、クライアント101、サーバ300、およびフィンガープリントデータベース310を概略的に示す。クライアント101は、ラジオのようなオーディオ設備、又はテレビ受信機のような映像信号のソースとすることができる。クライアント101は、携帯電話とすることもできるだろう。クライアント101は、通常、レンダーするコンテンツアイテムを別のソースから得る。例えば、ラジオは、空中から又はケーブル接続から、ブロードキャスト伝送を受け取り、そこから可聴信号を発生/レンダーするだろう。電話は、その内蔵マイクロホンを使用して音声を、又はその内蔵カメラを使用して映像を、受け取ることができる。
簡潔にするために、図1の実施例は、オーディオクリップを基準にして説明されているが、本発明はビデオクリップも等しく十分に扱うことができる。
サーバ300は、ここでは、入力モジュール301、フィンガープリントモジュール302、データベースマネージメントシステム(DBMS)バックエンドモジュール303、およびレスポンスモジュール304を有する。クライアント101により届けられるオーディオクリップに関連するデータを得ることが、サーバ300のタスクである。通常、このデータは、オーディオクリップのタイトル又はアーティストのようなメタデータであるが、オーディオクリップにおいて広告される製品を購入することができるインターネット上のサイトのようなデータとすることもできるだろう。
入力モジュール301は、クライアント101からオーディオクリップを受け取る。次いで、このオーディオクリップは、フィンガープリントモジュール302に供給される。フィンガープリントモジュール302は、受け取ったオーディオクリップからフィンガープリントを算出する。強い(robust)フィンガープリントを算出する1つの方法が、国際特許出願WO02/065782号(代理人整理番号PHNL010110)に記載されているが、もちろん、フィンガープリントを算出する如何なる方法も使用することができる。次いで、フィンガープリントモジュール302は、算出されたフィンガープリントを、識別子としてDBMSバックエンドモジュール303に供給する。
DBMSバックエンドモジュール303は、データベース310から、受け取った識別子に関連するメタデータの集合を検索するためにデータベース310に問合せをする。図1に示すように、データベース310はフィンガープリントFP1、FP2、FP3、FP4、およびFP5の形式の識別子と、それぞれに関連するメタデータの集合MDS1、MDS2、MDS3、MDS4、およびMDS5とを有する。上記の国際特許出願WO02/065782号は、未知の信号を識別するために、未知の信号を表すフィンガープリントを、データベースに記憶されている識別信号の複数のフィンガープリントと照合する効率的な方法も記載している。
データベース310を種々の方法で編成してクエリー時間および/又はデータ編成を最適化することができる。フィンガープリンティングモジュール302の出力は、データベース310のテーブルを設計するとき、考慮されるべきである。図1に示される実施例では、データベース310は、対応するフィンガープリントとメタデータの集合とを有するエントリ(レコード)を持つ単一テーブルを有する。
データベース310を実現する別の方法は、幾つかのテーブルをセットアップすることである。第1のテーブルは複数の固有の識別子(主キー)を有しており、この固有の識別子の各々は、対応するメタデータの集合に関連する。斯かるテーブルは種々の音楽識別ソースから得ることができる。アーティスト、タイトル、およびリリースの年の組合せは、固有の識別子を形成するために組み合わせることができるが、この識別子は固有のものである保証はなく、そのため、好ましくは実際に世界的に固有の値が使用される。
第2のテーブルは、エントリが各コンテンツアイテムについてフィンガープリントと第1のテーブルからの固有の識別子とを有するように、セットアップされる。この方法により、メタデータを複製しなくても、複数のフィンガープリントを1つのメタデータの集合に関連させることができる。1つのコンテンツアイテムに対して複数のフィンガープリントが可能である場合、これら全てのフィンガープリントは第2のテーブルに記憶され、全てのフィンガープリントはその1つのコンテンツアイテムのための唯一の識別子に関連している。
DBMSバックエンドモジュール303は、受け取ったフィンガープリントを第2のテーブルの中のフィンガープリントと照合し、識別子を得、メタデータを得るためにその識別子を第1のテーブルと照合する。データベース310がSQLデータベースである場合、2つのテーブルをその識別子で結合することができるだろう。DBMSバックエンドモジュール303はクエリーの結果をレスポンスモジュール304に供給し、モジュール304はその発見されたメタデータをクライアント101に送り返す。
クライアント101が携帯電話である場合、メタデータを、例えばSMSメッセージ又は電子メールメッセージとして伝送することができるだろう。入力モジュール301で受け取られるオーディオクリップが携帯電話で送られた場合、CallerID又は自動番号識別又は同様の手段により電話番号を得ることができる。次いで、入力モジュール301は発信者番号をレスポンスモジュール304に供給し、このためSMSメッセージをその同じ番号に送ることができる。
あるいは、入力モジュール301は、サーバ300にコンタクトするときにユーザにより提供されるユーザネーム又は電子メールアドレスのようなユーザを識別する別の手段を受け取ることができるだろう。このサービスを使用するために登録を必要とすることができ、ユーザの登録を、例えば、ユーザにより提供されるユーザネームに基づいて詳細にチェックすることによって、宛先アドレスを得ることができる。
さらには、発見されたメタデータを、好ましくはクライアント101の識別子とエントリが記録されたタイムスタンプと一緒に、ログファイルに記録することができる。この方法により、ログファイルは処理されたコンテンツアイテムの正確なレポートを含む。このログファイルは、例えば特定のチャネルに何がブロードキャストされたのかについての証拠として役立せることが可能である。このログファイルは、American Society of Composers, Authors and
Publishers(ASCAP)又はDutch BUMA/Stemra等の著作権クリヤリングハウスにより使用され、どれくらいのロイヤリティが特定の著作権者に与えられるべきであるのかを決めることができる。斯かるロイヤリティは、多くの場合、特定の歌がブロードキャストされる回数の評価に基づいており、このリストは公平な第三者によって正確な評価を提供する。放送局は、特定のコンテンツアイテムをブロードキャストする回数を少なく又は多く見積もることができ、又は十分な詳細を供給するのを好まないとすることができる。
もちろん、このリストは、他の多くの目的にも価値があるものとなり得る。このようにして識別されるコンテンツアイテムが広告又は販売促進メッセージを有する場合、リストを使用して、特定の広告又はメッセージが特定の時刻にブロードキャストされたということを証明する(又は、反証する)ことができる。この方法により、放送局は、広告主に対する契約義務を満たしたことを示すことができる。
他の拡張について、国際特許出願シリアル番号PCT/IB03/00260(代理人整理番号PHNL020101)に記載されている。この文献によれば、サーバ300はクライアント101からのリクエストの処理に加えて、一つ以上のブロードキャストチャネルをモニターしなければならない。これらのチャネルのコンテンツに関連するメタデータは、二次データベースにコピーされなければならない。二次データベースは、少数のエントリを含む。したがって、二次データベースとの照合は、第1のデータベースとの照合よりも速い。二次データベースにおいて一致が見つからないときだけ、一次データベースでの照合が実行される。モニターされた伝送チャネル上で伝送されるコンテンツアイテムに対して多くのリクエストが到着することが予期されるので、より小さく且つ速い二次データベースのみを使用して多くのリクエストに答えることができることになる。概して、フィンガープリントを照合するのに必要な時間が削減される。
図2は、図1のシステムの変形例であって、フィンガープリントモジュール302がウォータマーク抽出モジュール322に置き換えられたものを概略的に示す。受信モジュール301により受け取られるクリップは、クリップの中のウォータマークされたデータを検出し抽出することを試みるウォータマーク抽出モジュール322に渡される。次いで、抽出されたデータは、データベースルックアップを実行して識別子に関連するメタデータを得るDBMSバックエンドモジュール303に渡すことができる識別子として使用される。
図2に示すように、データベース320は識別子ID1、ID2、ID3、ID4、およびID5と、それぞれに関連するメタデータの集合MDS1、MDS2、MDS3、MDS4、およびMDS5とを有する。サーバ300の残りの動作は、図1を基準にして上に記載されたのと同じである。
サーバ300では、フィンガープリント技術を用いて動作するか、ウォータマーク技術を用いて動作するか、又は他のタイプの識別手法を用いて動作するかによって、特定の識別子をデータベース310、320内に発見できないことが起こり得る。斯かる場合、問題となっているコンテンツアイテムは、人間オペレータ200が手作業でコンテンツアイテムを調査し、手動認識を試みることができるように、出力部に送ることができる。出力部は、例えば、端末、音声スピーカ、表示画面、又はネットワークへの接続部とすることができる。データベースで発見することができないコンテンツは、電子メールで、又は他の手段によって、遠隔位置に送ることができるだろう。次いで、遠隔位置のオペレータは、コンテンツを手作業で調査することができる。
図1および図2において、コンテンツアイテムは、斯かる場合において、スピーカを用いて端末210で再生され、人間オペレータ200はそのアイテムを聞いてメタデータを入力又は選択するだろう。次いで、このメタデータは、クライアント101に送る又はログファイルに記録する又は他の方法で使用できるように、レスポンスモジュール304に供給される。オペレータ200がメタデータをリアルタイムで入力しない、又はコンテンツアイテムを識別できない場合、レスポンスモジュール304によってクライアント101に適切なメッセージが送られるだろう。
本発明は、サーバ300が、コンテンツアイテムを多数のクラスのうちの一つに分類する自動分類技術の使用によって利益を得るという洞察に基づく。上記のステップのうちの少なくとも1つがコンテンツアイテムの分類を条件に実行される場合、サーバ300の動作が向上する。
この目的のために、サーバ300は自動分類器309を備えている。本明細書の終わりに、多数の自動分類方法が述べられている。自動分類の典型的システムは、特徴抽出ステージで構成され、この特徴抽出ステージの次には、特徴を1つ以上のコンテンツのクラスにマッピングする分類ステージが続いている。
分類器309は、コンテンツアイテムを分析し、コンテンツアイテムを多数のクラスのうちの一つに分類する。分類は、例えば、「音楽」および「音楽以外」(例えば、「スピーチ」若しくは「ノイズ」)又は「映画」対「コマーシャルブレーク」のように簡単にすることができるだろう。ジャンル分類、特定のコンテンツハイライトの自動検出、および自動話者認識などの、更に詳細な分類も利用できる。斯かる分類方法は、オーディオを、「クラシック」、「ロック」、「スピーチ」、「ジャズ」、「ラップ」等のクラスに分類すること、又はビデオを「映画」、「コマーシャルブレーク」、「ニュース」等のクラスに分類することを可能にする。
本発明の一態様によれば、データベースルックアップがデータを得ることができず、コンテンツアイテムが多数の所定のクラスのうちの一つに分類された場合、コンテンツアイテムは人間によって処理するために送られる。例えば、ブロードキャストモニタリングの場合、簡単な二つのクラス分類器(「音楽」と「音楽以外」とを区別する)を使用することができる。この場合、自動的に識別されなかったオーディオであって、「音楽」として分類されるオーディオを、手作業で識別する必要があるだけである。識別されなかったオーディオの大部分はスピーチから成るので、大幅な手作業の削減を達成することができる。
一実施例では、処理するためにコンテンツアイテムが送られる人の出力部は、コンテンツアイテムが分類されたクラスに基づいて、複数の出力部から選択される。多重クラス分類器が使用される場合、フィンガープリントデータベースのコンテンツをさらに高い水準で管理することもできる。識別されなかった音楽を特定のジャンル(ポップ、クラシック等)に分類できるさらに高性能の分類器は、識別されなかったオーディオを、対応するジャンルの専門知識を有する適切な人に自動的に配信できる特別の可能性を加えたものである。
このために、サーバ300はコンテンツアイテムを複数の出力部のうちの一つに送るようにプログラムされる。各出力部は、1つの特定のクラスに関係している。例えば、人間オペレータが特定の端末でログインするときこの関係を手作業で又は自動で作れるだろう。人間オペレータはこの情報を入力することができ、又はこの情報を、サーバ300がこの情報を自動的に知るように、データベース又はこのオペレータのユーザプロファイルに登録できるだろう。サーバ300は、コンテンツアイテムを、コンテンツが分類されたクラスに関連する特定の端末に送る。
斯かる高度な分類は、データベース310、320のコンテンツを調整することも可能にする。例えば、手動識別のために送られるコンテンツアイテムの大部分がジャズとして分類される場合、もっと多くのジャズミュージックがデータベース310、320に加えられるべきである。なぜならば、これは、多くのメタデータのリクエストがジャズミュージックに関係し、データベースは現在十分なジャズミュージックを含んでいないことを明らかに示すものだからである。
本発明の別の態様によれば、コンテンツアイテムが多数の所定のクラスのうちの一つに分類された場合、データベースルックアップが実行される。例えば、データベース310、320が音楽又は広告のみを含む場合、コンテンツアイテムが「音楽」又は「広告」として分類される場合のみデータベースルックアップを実行することができるだろう。この方法により、ルックアップがうまくいかないことが回避される。
携帯電話サービスの場合、全ての記録され識別されなかったオーディオクリップのかなりの部分が、ノイズのみからなる。これは、通常、携帯電話が音源から遠すぎるときに生じる。二クラス分類器が使用される場合、「音楽以外」又は「ノイズ」として分類される全ての録音を無視することができる。したがって、人間オペレータ200は「音楽」として分類される録音を聞き、識別するだけである。したがって、識別されなかったオーディオクリップの識別をより効率的に行うことができる。
しかし、本実施例では、非常に低いフォールスネガティブレートを有する分類技術を選択することが重要である。すなわち、エラーにより所定のクラスのうちの一つに分類されないアイテムの数を非常に少なくすべきである。発明者は、実際に、典型的な二クラス分類器が短いオーディオクリップ(5秒から10秒)に対して約90%の分類性能を有することができることを発見した。これは、音楽の10%が音楽以外として分類されることを意味する。したがって、組合型の分類/識別システムの全体的な性能は、90%よりも下がるであろうし、これは明らかに望ましくない。
さらに別の態様(図示せず)では、フィンガープリントモジュール302又はウォータマーク抽出モジュール322は、分類器309によりコンテンツアイテムが多数のクラスのうちの一つのクラスに分類されることを条件に動作するように構成される。本実施例において、「ノイズ」又は「音楽以外」等のクラスに分類されるコンテンツは、ウォータマークペイロード抽出又はフィンガープリント算出を受ける必要はない。
上記の実施例を組み合わせることが可能である点に注意すべきである。例えば、フィンガープリント算出は分類を条件にして行うことができ、識別されなかったコンテンツを送るためにどの出力部を選択するかということを分類に基づいて自動的に行うこともできる。または、識別子を得ることに意味があるかどうかを決定するために二クラス分類器を使用することができ、コンテンツを出力部に送るかどうかを決定するために、又はコンテンツがどの出力部に送られるべきかを決定するために、多クラス分類器を使用することができる。
図3は、本発明による方法の実施例を図示するフローチャートを示す。この方法は、ステップ30から始まる。ステップ31では、コンテンツアイテム(例えばオーディオクリップ又はビデオクリップ)が受け取られる。ステップ32において、例えば、コンテンツアイテムに埋められるウォータマークのペイロードから識別子を抽出することによって、又はコンテンツアイテムのフィンガープリントを算出することによって、コンテンツアイテムの識別子が得られる。
ステップ33では、識別子に関連するデータを検索するためにデータベースルックアップが実行される。ステップ34において、ルックアップが成功したと判断された場合、リクエストされたデータが得られ、この方法はステップ39で終了する。ルックアップが失敗した場合、方法はステップ35に進む。
ステップ35では、コンテンツアイテムは、例えば「音楽」又は「ノイズ」のどちらかとして、多数のクラスのうちの一つに分類される。次いで、ステップ36において、分類に基づいてコンテンツアイテムを人間オペレータ200に送るかどうかの決定が行われる。例えば、コンテンツが「音楽」として分類される場合、コンテンツアイテムはオペレータ200に送られる。
決定がコンテンツアイテムを送ることである場合、ステップ37において、オペレータ200が入力した又はデータベースから選択したデータが受け取られる。そのとき、この方法もステップ39において終了する。コンテンツアイテムが送られる必要がない場合、この方法は直にステップ39において終了する。この場合、幾つかの種類のエラーメッセージがクライアント101に与えられるべきである。
図4は、本発明による方法の別の実施例を図示するフローチャートを示す。図3のステップと同一のステップは、ここでは繰り返して説明しない。
ステップ44において、ステップ35から得られた分類に基づいて、識別子に関連するデータを検索するためにデータベースルックアップを実行するかどうかの決定が行われる。例えば、コンテンツアイテムが「ノイズ」として分類される場合、データベースルックアップは適合の検索をすることはなく、したがってルックアップをスキップできる。データベースルックアップが望まれる場合、この方法はステップ39に進み、望まれていなければステップ39において終了する。ステップ46においてステップ33のルックアップが失敗したと決定されると、この方法はステップ37に進み、失敗しなければ、ステップ39において、この方法は終了する。
図5は、本発明による方法の更に別の実施例を例示するフローチャートを示す。図3又は図4のステップと同一のステップは、ここでは繰り返して説明しない。
ステップ54において、ステップ35から得られた分類に基づいて、コンテンツアイテムの識別子を得るかどうかの決定が行われる。例えば、コンテンツアイテムが「ノイズ」として分類される場合、検出されるウォータマークは存在せず、ノイズのフィンガープリントを算出することもコンテンツアイテムの意味のある識別子をもたらさないだろう。それ故に、斯かる場合には、この方法を直ちに終了することができる。他の場合には、この方法は、識別子を得るためにステップ32に進み、データベースルックアップを実行するためにステップ33に進む。それ以降は、ステップは図4と同一である。
当業者が本発明にしたがってサーバを構成することができるように、既存の分類技術の幾つかの参考文献が以下に与えられている。本発明が1つの特定の分類技術に依存していない点に注意すべきである。使用する特定の技術の選択は、環境(例えば、二クラス分類器又は多クラス分類器が必要であるかどうか、人間は「音楽」および「ノイズ」のみがサーバ等に備えられることを期待しているかどうか)に依存する。
幾つかの二クラス分類技術は、以下の通りである。
・ E. Scheirer and M. Slaney. Construction and
evaluation of a robust multifeature speech/music discriminator. In Proc.
ICASSP, pages 1331-1334, Munich, Germany, 1997.
・ G. Lu and T. Hankinson. A technique towards
automatic audio classification and retrieval. In 4th int. conference on signal
processing, Beijing, 1998.
・ R. Jarina, N. Murphy, N. O’connor, and S. Marlow.
Speech-music discrimination from MPEG-1 bitstream. In WSES International
Conference on Speech, Signal and Image Processing, Malta, 2001.
幾つかの多クラス分類技術は、以下の通りである。
・ M. Zhang, K. Tan, and M. H. Er. Three-dimensional
sound synthesis based on headrelated transfer functions. J. Audio. Eng. Soc.,
146:836-844, 1998.
・ T. Zhang and C. C. J. Kuo. Audio content analysis
for online audiovisual data segmentation and classification. IEEE Transactions
on speech and audio processing, 9:441-457, 2001.
・ J. Foote. A similarity measure for automatic audio
classification. In Proc. AAAI 1997 Spring Symposium on Intelligent Integration and
Use of Text, Image, Video, and Audio Corpora, 1997.
・ M. S. Spina and V. W. Zue. Automatic transcription
of general audio data: Effect of environment segmentation on phonetic
recognition. In Proceedings of Eurospeech, Rhodes, Greece, 1997.
・ G. Tzanetakis, G. Essl, and P. Cook. Automatic
musical genre classification of audio signals. In Proceedings International
Symposium for Audio Information Retrieval (ISMIR), Princeton, NJ.
・ D. Pye. Content-based methods for the management of
digital music. In ICASSP 2000, Vol IV, pp 2437-2440, 2000.
・ D. N. Jiang, H. J. Zhang, J. H. Tao, and L. H. Cai.
Music type classification by spectral contrast feature. In Proceedings of ICME:
2002 IEEE international conference on multimedia and expo, Lausanne,
Switzerland, 2002.
上記の実施例は本発明を限定するものではなく、当業者は添付請求項の範囲を逸脱すること無く、多くの代替実施例を設計できることに注意すべきである。
例えば、パソコンに接続されるマイクロホンをクライアント101として使用することができるだろう。コンピュータはマイクロホンから音を録音し、その録音を例えばインターネットを通じて電子メールメッセージとして、又はFTP、HTTPファイルアップロード若しくは同様のメカニズムを用いて、サーバ300に送る。斯かる録音を行うために、記録手段を有するポータブル装置を使用することもできるだろう。ポータブル装置は、電話回線又はネットワーク接続を通じて、サーバに接続することができる。インターネットラジオ等の他の伝送チャネルは、コンテンツアイテムの直接記録および直接伝送が可能である。なぜならば、そのアイテムはデジタルフォーマットで伝送されるからである。
用語「有する」は、請求項に挙げられている以外の要素又はステップの存在を排除するものではない。要素が単数であることは、斯かる要素の複数の存在を排除するものではない。
本発明は、幾つかの別個の要素を有するハードウェアによって、および適切にプログラムされたコンピュータによって、実現することができる。幾つかの手段を列挙している装置請求項において、これらの手段の幾つかは、同じ1つのハードウェアによって実現できる。特定の手段が相互に異なる独立項に挙げられているという単なる事実は、これらの手段の組合せを有利に使用できないことを示すものではない。
フィンガープリントを識別子として使用してコンテンツアイテムに関連するデータを得るシステムを概略的に示す。 ウォータマークのペイロードから取り出される識別子を使用してコンテンツアイテムに関連するデータを得るシステムを概略的に示す。 本発明による方法の実施例を例示するフローチャートを示す。 本発明による方法の別の実施例を例示するフローチャートを示す。 本発明による方法の更に別の実施例を例示するフローチャートを示す。

Claims (10)

  1. コンテンツアイテムに関連するデータを得る方法であって、前記方法が、
    前記コンテンツアイテムの識別子を得るステップ、
    前記データを得るために前記識別子を用いてデータベースルックアップを実行するステップ、および
    前記データベースルックアップが前記データを得ることができない場合、人間によって処理するために出力部に前記コンテンツアイテムを送るステップ、を有し、
    前記方法は、前記コンテンツアイテムを複数のクラスのうちの一つに自動的に分類するステップを有し、前記コンテンツアイテムの分類に基づくことを条件に、前記識別子を得るステップ、前記データベースルックアップを実行するステップ、および前記コンテンツアイテムを送るステップのうちの少なくとも1つを実行する、方法。
  2. 前記コンテンツアイテムが複数の所定のクラスのうちの一つに分類されたとき、且つそのときに限り、前記データベースルックアップを実行するステップを有する、請求項1の方法。
  3. 前記データベースルックアップが前記データを得ることができず、前記コンテンツアイテムが複数の所定のクラスのうちの一つに分類されたとき、且つそのときに限り、前記コンテンツアイテムを前記出力部に送るステップを有する、請求項1の方法。
  4. 前記コンテンツアイテムが分類されたクラスに基づいて、前記出力部を複数の出力部から選択するステップを有する、請求項1、2、又は3に方法。
  5. 前記コンテンツアイテムのフィンガープリントを算出することによって前記識別子を得るステップを有する、請求項1の方法。
  6. 前記コンテンツアイテムに埋められるウォータマークのペイロードから前記識別子を抽出することによって前記識別子を得るステップを有する、請求項1の方法。
  7. 前記コンテンツアイテムが複数の所定のクラスのうちの一つに分類されたとき且つそのときに限り前記識別子を得るステップを有する、請求項5又は6の方法。
  8. コンテンツアイテムに関連するデータを得るシステムであって、前記システムが、
    前記コンテンツアイテムの識別子を得る手段、
    前記データを得るために前記識別子を用いて前記コンテンツアイテムに対しデータベースルックアップを実行する手段、および
    前記データベースルックアップが前記データを得ることができない場合、人間によって処理するために出力部に前記コンテンツアイテムを送る手段、を有し、
    前記識別子を得る手段、前記データベースルックアップを実行する手段、および前記コンテンツアイテムを送る手段のうちの少なくとも1つが、前記コンテンツアイテムを複数のクラスのうちの一つに分類する手段の出力に依存して動作する、システム。
  9. 前記コンテンツアイテムを送る手段は、前記データベースルックアップを実行する手段が前記データを得ることができず、且つ前記分類する手段が前記コンテンツアイテムを複数の所定のクラスのうちの一つに分類することを条件に、前記コンテンツアイテムを送る、請求項8のシステム。
  10. プロセッサに請求項1の方法を実行させるコンピュータプログラム。
JP2006506672A 2003-03-13 2004-03-03 改良されたデータ検索方法およびシステム Withdrawn JP2006527425A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP03100639A EP1457889A1 (en) 2003-03-13 2003-03-13 Improved fingerprint matching method and system
PCT/IB2004/050195 WO2004081817A1 (en) 2003-03-13 2004-03-03 Improved data retrieval method and system

Publications (2)

Publication Number Publication Date
JP2006527425A true JP2006527425A (ja) 2006-11-30
JP2006527425A5 JP2006527425A5 (ja) 2007-04-26

Family

ID=32748960

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006506672A Withdrawn JP2006527425A (ja) 2003-03-13 2004-03-03 改良されたデータ検索方法およびシステム

Country Status (8)

Country Link
US (1) US20060218126A1 (ja)
EP (2) EP1457889A1 (ja)
JP (1) JP2006527425A (ja)
KR (1) KR20050117558A (ja)
CN (1) CN1759396A (ja)
AU (1) AU2004219418A1 (ja)
BR (1) BRPI0408288A (ja)
WO (1) WO2004081817A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010539608A (ja) * 2007-09-14 2010-12-16 オーディテュード.コム,インク. オンラインでシェアされる放送番組のクリップの番組情報を回復するための技術
WO2013073250A1 (ja) * 2011-11-16 2013-05-23 ソニー株式会社 情報処理装置及び情報処理方法、情報提供装置、並びに、情報提供システム
JP2016513816A (ja) * 2013-03-06 2016-05-16 クゥアルコム・インコーポレイテッドQualcomm Incorporated コンテンツベースのノイズ抑制

Families Citing this family (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2136306B1 (en) * 2000-08-23 2013-03-20 Gracenote, Inc. Method and system for obtaining information
US7890374B1 (en) 2000-10-24 2011-02-15 Rovi Technologies Corporation System and method for presenting music to consumers
US7277766B1 (en) 2000-10-24 2007-10-02 Moodlogic, Inc. Method and system for analyzing digital audio files
ATE405101T1 (de) * 2001-02-12 2008-08-15 Gracenote Inc Verfahren zum erzeugen einer identifikations hash vom inhalt einer multimedia datei
EP1474761A2 (en) * 2002-02-05 2004-11-10 Koninklijke Philips Electronics N.V. Efficient storage of fingerprints
AU2003259400A1 (en) * 2002-09-30 2004-04-19 Koninklijke Philips Electronics N.V. Fingerprint extraction
CN1708758A (zh) * 2002-11-01 2005-12-14 皇家飞利浦电子股份有限公司 改进的音频数据指纹搜索
US20060075237A1 (en) * 2002-11-12 2006-04-06 Koninklijke Philips Electronics N.V. Fingerprinting multimedia contents
JP2005351994A (ja) * 2004-06-08 2005-12-22 Sony Corp コンテンツ配信サーバ,コンテンツ配信方法,プログラム
US7567899B2 (en) 2004-12-30 2009-07-28 All Media Guide, Llc Methods and apparatus for audio recognition
US20070106405A1 (en) * 2005-08-19 2007-05-10 Gracenote, Inc. Method and system to provide reference data for identification of digital content
US20080147557A1 (en) * 2005-10-03 2008-06-19 Sheehy Dennis G Display based purchase opportunity originating from in-store identification of sound recordings
KR100803206B1 (ko) * 2005-11-11 2008-02-14 삼성전자주식회사 오디오 지문 생성과 오디오 데이터 검색 장치 및 방법
US20070162761A1 (en) 2005-12-23 2007-07-12 Davis Bruce L Methods and Systems to Help Detect Identity Fraud
US7761293B2 (en) * 2006-03-06 2010-07-20 Tran Bao Q Spoken mobile engine
US7519619B2 (en) * 2006-08-21 2009-04-14 Microsoft Corporation Facilitating document classification using branch associations
US8707459B2 (en) 2007-01-19 2014-04-22 Digimarc Corporation Determination of originality of content
US9654447B2 (en) 2006-08-29 2017-05-16 Digimarc Corporation Customized handling of copied content based on owner-specified similarity thresholds
US8010511B2 (en) 2006-08-29 2011-08-30 Attributor Corporation Content monitoring and compliance enforcement
US8738749B2 (en) 2006-08-29 2014-05-27 Digimarc Corporation Content monitoring and host compliance evaluation
US20100250537A1 (en) * 2006-11-14 2010-09-30 Koninklijke Philips Electronics N.V. Method and apparatus for classifying a content item
US10885543B1 (en) 2006-12-29 2021-01-05 The Nielsen Company (Us), Llc Systems and methods to pre-scale media content to facilitate audience measurement
US20080274687A1 (en) 2007-05-02 2008-11-06 Roberts Dale T Dynamic mixed media package
CN101359992A (zh) * 2007-07-31 2009-02-04 华为技术有限公司 内容类别请求方法、确定方法、交互方法及装置
US20090076950A1 (en) * 2007-09-18 2009-03-19 Ujin Chang Universal Network-Based Deposit Management Service
TWI413910B (zh) * 2008-01-25 2013-11-01 Univ Nat Taiwan 數值資料範圍區間查詢方法及系統
WO2009124004A1 (en) * 2008-03-31 2009-10-08 Dolby Laboratories Licensing Corporation Associating information with media content using objects recognized therein
CN102132574B (zh) 2008-08-22 2014-04-02 杜比实验室特许公司 内容识别和质量监测
US10419541B2 (en) 2008-11-26 2019-09-17 Free Stream Media Corp. Remotely control devices over a network without authentication or registration
US9961388B2 (en) 2008-11-26 2018-05-01 David Harrison Exposure of public internet protocol addresses in an advertising exchange server to improve relevancy of advertisements
US10567823B2 (en) 2008-11-26 2020-02-18 Free Stream Media Corp. Relevant advertisement generation based on a user operating a client device communicatively coupled with a networked media device
US9986279B2 (en) 2008-11-26 2018-05-29 Free Stream Media Corp. Discovery, access control, and communication with networked services
US10880340B2 (en) 2008-11-26 2020-12-29 Free Stream Media Corp. Relevancy improvement through targeting of information based on data gathered from a networked device associated with a security sandbox of a client device
US9519772B2 (en) 2008-11-26 2016-12-13 Free Stream Media Corp. Relevancy improvement through targeting of information based on data gathered from a networked device associated with a security sandbox of a client device
US10977693B2 (en) 2008-11-26 2021-04-13 Free Stream Media Corp. Association of content identifier of audio-visual data with additional data through capture infrastructure
US8180891B1 (en) 2008-11-26 2012-05-15 Free Stream Media Corp. Discovery, access control, and communication with networked services from within a security sandbox
US10631068B2 (en) 2008-11-26 2020-04-21 Free Stream Media Corp. Content exposure attribution based on renderings of related content across multiple devices
US9154942B2 (en) 2008-11-26 2015-10-06 Free Stream Media Corp. Zero configuration communication between a browser and a networked media device
US10334324B2 (en) 2008-11-26 2019-06-25 Free Stream Media Corp. Relevant advertisement generation based on a user operating a client device communicatively coupled with a networked media device
US8620967B2 (en) 2009-06-11 2013-12-31 Rovi Technologies Corporation Managing metadata for occurrences of a recording
US8161071B2 (en) 2009-09-30 2012-04-17 United Video Properties, Inc. Systems and methods for audio asset storage and management
US8677400B2 (en) 2009-09-30 2014-03-18 United Video Properties, Inc. Systems and methods for identifying audio content using an interactive media guidance application
US8886531B2 (en) 2010-01-13 2014-11-11 Rovi Technologies Corporation Apparatus and method for generating an audio fingerprint and using a two-stage query
WO2013001159A1 (en) * 2011-06-30 2013-01-03 Nokia Corporation Method and apparatus for providing audio-based item sharing
US9538040B2 (en) * 2011-12-16 2017-01-03 University Of Maryland, College Park Active sensing for dynamic spectrum access
CN107783834B (zh) * 2016-08-30 2021-05-07 伊姆西公司 用于处理数据的方法和系统
US10554684B2 (en) 2017-03-29 2020-02-04 Juniper Networks, Inc. Content-based optimization and pre-fetching mechanism for security analysis on a network device
US10958807B1 (en) 2018-02-08 2021-03-23 Digimarc Corporation Methods and arrangements for configuring retail scanning systems
US11995511B2 (en) * 2018-02-08 2024-05-28 Digimarc Corporation Methods and arrangements for localizing machine-readable indicia

Family Cites Families (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4677466A (en) * 1985-07-29 1987-06-30 A. C. Nielsen Company Broadcast program identification method and apparatus
US4870568A (en) * 1986-06-25 1989-09-26 Thinking Machines Corporation Method for searching a database system including parallel processors
US5206949A (en) * 1986-09-19 1993-04-27 Nancy P. Cochran Database search and record retrieval system which continuously displays category names during scrolling and selection of individually displayed search terms
US5019899A (en) * 1988-11-01 1991-05-28 Control Data Corporation Electronic data encoding and recognition system
JP2849161B2 (ja) * 1989-10-14 1999-01-20 三菱電機株式会社 情報再生装置
KR920006298B1 (ko) * 1990-04-30 1992-08-03 삼성전자 주식회사 인덱스 서취장치
DE4021707A1 (de) * 1990-07-07 1992-01-09 Nsm Ag Muenzbetaetigter musikautomat
US5488725A (en) * 1991-10-08 1996-01-30 West Publishing Company System of document representation retrieval by successive iterated probability sampling
US5446891A (en) * 1992-02-26 1995-08-29 International Business Machines Corporation System for adjusting hypertext links with weighed user goals and activities
US5388259A (en) * 1992-05-15 1995-02-07 Bell Communications Research, Inc. System for accessing a database with an iterated fuzzy query notified by retrieval response
US5337347A (en) * 1992-06-25 1994-08-09 International Business Machines Corporation Method and system for progressive database search termination and dynamic information presentation utilizing telephone keypad input
US5475835A (en) * 1993-03-02 1995-12-12 Research Design & Marketing Inc. Audio-visual inventory and play-back control system
US5679911A (en) * 1993-05-26 1997-10-21 Pioneer Electronic Corporation Karaoke reproducing apparatus which utilizes data stored on a recording medium to make the apparatus more user friendly
US5642337A (en) * 1995-03-14 1997-06-24 Sony Corporation Network with optical mass storage devices
US5616876A (en) * 1995-04-19 1997-04-01 Microsoft Corporation System and methods for selecting music on the basis of subjective content
US5659732A (en) * 1995-05-17 1997-08-19 Infoseek Corporation Document retrieval over networks wherein ranking and relevance scores are computed at the client for multiple database documents
US5740549A (en) * 1995-06-12 1998-04-14 Pointcast, Inc. Information and advertising distribution system and method
US5751672A (en) * 1995-07-26 1998-05-12 Sony Corporation Compact disc changer utilizing disc database
US5781897A (en) * 1996-04-18 1998-07-14 International Business Machines Corporation Method and system for performing record searches in a database within a computer peripheral storage device
US5727129A (en) * 1996-06-04 1998-03-10 International Business Machines Corporation Network system for profiling and actively facilitating user activities
US5903816A (en) * 1996-07-01 1999-05-11 Thomson Consumer Electronics, Inc. Interactive television system and method for displaying web-like stills with hyperlinks
US5918223A (en) * 1996-07-22 1999-06-29 Muscle Fish Method and article of manufacture for content-based analysis, storage, retrieval, and segmentation of audio information
US5862223A (en) * 1996-07-24 1999-01-19 Walker Asset Management Limited Partnership Method and apparatus for a cryptographically-assisted commercial network system designed to facilitate and support expert-based commerce
US5721827A (en) * 1996-10-02 1998-02-24 James Logan System for electrically distributing personalized information
US6005565A (en) * 1997-03-25 1999-12-21 Sony Corporation Integrated search of electronic program guide, internet and other information resources
US5959945A (en) * 1997-04-04 1999-09-28 Advanced Technology Research Sa Cv System for selectively distributing music to a plurality of jukeboxes
US7308485B2 (en) * 1997-04-15 2007-12-11 Gracenote, Inc. Method and system for accessing web pages based on playback of recordings
US5987525A (en) * 1997-04-15 1999-11-16 Cddb, Inc. Network delivery of interactive entertainment synchronized to playback of audio recordings
US7167857B2 (en) * 1997-04-15 2007-01-23 Gracenote, Inc. Method and system for finding approximate matches in database
US6175857B1 (en) * 1997-04-30 2001-01-16 Sony Corporation Method and apparatus for processing attached e-mail data and storage medium for processing program for attached data
US5987454A (en) * 1997-06-09 1999-11-16 Hobbs; Allen Method and apparatus for selectively augmenting retrieved text, numbers, maps, charts, still pictures and/or graphics, moving pictures and/or graphics and audio information from a network resource
US6112240A (en) * 1997-09-03 2000-08-29 International Business Machines Corporation Web site client information tracker
JPH11306022A (ja) * 1998-04-16 1999-11-05 Matsushita Electric Ind Co Ltd エージェント知識利用方法及び装置
US6201176B1 (en) * 1998-05-07 2001-03-13 Canon Kabushiki Kaisha System and method for querying a music database
US8332478B2 (en) * 1998-10-01 2012-12-11 Digimarc Corporation Context sensitive connected content
US6304523B1 (en) * 1999-01-05 2001-10-16 Openglobe, Inc. Playback device having text display and communication with remote database of titles
US6654735B1 (en) * 1999-01-08 2003-11-25 International Business Machines Corporation Outbound information analysis for generating user interest profiles and improving user productivity
US6941325B1 (en) * 1999-02-01 2005-09-06 The Trustees Of Columbia University Multimedia archive description scheme
US6657117B2 (en) * 2000-07-14 2003-12-02 Microsoft Corporation System and methods for providing automatic classification of media entities according to tempo properties
US6963975B1 (en) * 2000-08-11 2005-11-08 Microsoft Corporation System and method for audio fingerprinting
US7085613B2 (en) * 2000-11-03 2006-08-01 International Business Machines Corporation System for monitoring audio content in a video broadcast
US6983289B2 (en) * 2000-12-05 2006-01-03 Digital Networks North America, Inc. Automatic identification of DVD title using internet technologies and fuzzy matching techniques
JP2002222302A (ja) * 2000-12-15 2002-08-09 Buzzhits Inc 需要刺激に対する消費者の反応に、オンデマンドで対応するためのシステム及び方法
ATE405101T1 (de) * 2001-02-12 2008-08-15 Gracenote Inc Verfahren zum erzeugen einer identifikations hash vom inhalt einer multimedia datei
EP1490767B1 (en) * 2001-04-05 2014-06-11 Audible Magic Corporation Copyright detection and protection system and method
US6968337B2 (en) * 2001-07-10 2005-11-22 Audible Magic Corporation Method and apparatus for identifying an unknown work
US7203692B2 (en) * 2001-07-16 2007-04-10 Sony Corporation Transcoding between content data and description data
DE60236161D1 (de) * 2001-07-20 2010-06-10 Gracenote Inc Automatische identifizierung von klangaufzeichnungen
US7877438B2 (en) * 2001-07-20 2011-01-25 Audible Magic Corporation Method and apparatus for identifying new media content
US20030028796A1 (en) * 2001-07-31 2003-02-06 Gracenote, Inc. Multiple step identification of recordings
US7117200B2 (en) * 2002-01-11 2006-10-03 International Business Machines Corporation Synthesizing information-bearing content from multiple channels
US6766523B2 (en) * 2002-05-31 2004-07-20 Microsoft Corporation System and method for identifying and segmenting repeating media objects embedded in a stream
US20040034441A1 (en) * 2002-08-16 2004-02-19 Malcolm Eaton System and method for creating an index of audio tracks
US20070106405A1 (en) * 2005-08-19 2007-05-10 Gracenote, Inc. Method and system to provide reference data for identification of digital content

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010539608A (ja) * 2007-09-14 2010-12-16 オーディテュード.コム,インク. オンラインでシェアされる放送番組のクリップの番組情報を回復するための技術
JP2014029709A (ja) * 2007-09-14 2014-02-13 Yahoo Inc オンラインでシェアされる放送番組のクリップの番組情報を回復するための技術
US9036717B2 (en) 2007-09-14 2015-05-19 Yahoo! Inc. Restoring program information for clips of broadcast programs shared online
WO2013073250A1 (ja) * 2011-11-16 2013-05-23 ソニー株式会社 情報処理装置及び情報処理方法、情報提供装置、並びに、情報提供システム
JP2013105146A (ja) * 2011-11-16 2013-05-30 Sony Corp 情報処理装置及び情報処理方法、情報提供装置、並びに、情報提供システム
US10477267B2 (en) 2011-11-16 2019-11-12 Saturn Licensing Llc Information processing device, information processing method, information provision device, and information provision system
JP2016513816A (ja) * 2013-03-06 2016-05-16 クゥアルコム・インコーポレイテッドQualcomm Incorporated コンテンツベースのノイズ抑制

Also Published As

Publication number Publication date
AU2004219418A1 (en) 2004-09-23
EP1606733A1 (en) 2005-12-21
CN1759396A (zh) 2006-04-12
WO2004081817A1 (en) 2004-09-23
US20060218126A1 (en) 2006-09-28
BRPI0408288A (pt) 2006-03-07
EP1457889A1 (en) 2004-09-15
KR20050117558A (ko) 2005-12-14

Similar Documents

Publication Publication Date Title
JP2006527425A (ja) 改良されたデータ検索方法およびシステム
EP1474760B1 (en) Fast hash-based multimedia object metadata retrieval
Haitsma et al. A highly robust audio fingerprinting system with an efficient search strategy
US8972481B2 (en) Playlist generation method and apparatus
US7877438B2 (en) Method and apparatus for identifying new media content
Haitsma et al. A highly robust audio fingerprinting system.
US20100023328A1 (en) Audio Recognition System
Cano et al. Robust sound modeling for song detection in broadcast audio
JP4945877B2 (ja) 高い雑音、歪み環境下でサウンド・楽音信号を認識するシステムおよび方法
US7328153B2 (en) Automatic identification of sound recordings
TWI390924B (zh) 用於加速各多重同步資料流之資料庫檢視的系統以及方法
CN105190618B (zh) 用于自动文件检测的对来自基于文件的媒体的特有信息的获取、恢复和匹配
JP2005509229A (ja) 情報アラートのための方法及びシステム
US20100146009A1 (en) Method of DJ commentary analysis for indexing and search
KR101002732B1 (ko) 온라인을 통한 디지털 컨텐츠 관리 시스템
Selvakumar et al. Content recognition using audio finger printing
Hossain et al. A Quick Video Searching Approach from a Continuous Stream using Audio Fingerprint
Gao et al. Octave-dependent probabilistic latent semantic analysis to chorus detection of popular song
Haitsma Audio Fingerprinting
Haitsma et al. A New Technology To Identify Music
WOODHEAD et al. Patent 2965360 Summary
TW200901745A (en) Communication system and information providing method
Gatos HHkk B. Schrempp, Saratoga, CA US PATENT D ()(" UMENTS
Rehatschek et al. Mediacampaign—A multimodal semantic analysis system for advertisement campaign detection

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070305

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070305

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20080806

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080806

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20090827