JP2006511894A - メディア指紋の再順序付け検索方法及び装置 - Google Patents
メディア指紋の再順序付け検索方法及び装置 Download PDFInfo
- Publication number
- JP2006511894A JP2006511894A JP2005502602A JP2005502602A JP2006511894A JP 2006511894 A JP2006511894 A JP 2006511894A JP 2005502602 A JP2005502602 A JP 2005502602A JP 2005502602 A JP2005502602 A JP 2005502602A JP 2006511894 A JP2006511894 A JP 2006511894A
- Authority
- JP
- Japan
- Prior art keywords
- signature
- database
- order
- search
- data units
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/41—Indexing; Data structures therefor; Storage structures
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
データベースにおける要素を識別する複数バイト識別子の従来のバイト順序の再順序付け(130)に基づいて大きいデータベース(190)の検索を効果的に実行する方法及びシステムを提供する。再順序付け(130)は、データベースにおける識別子の非常に均一な分布を与えるように選択される。データベースは、データベースにおける要素の識別子を生成する再順序付けされたバイトに基づいて構成及び/又はソーティング(140,340)される。不均一に分布した識別子の再順序付けされたバイトの順序の検索を効果的に実行する(150,350)ことにより、より速く検出されるミスマッチの尤度が殆どの場合に増加することが見込まれ、それ故、マッチングを見つける速度が改善され、又はデータベースの検索を実行し尽くすことができる。
Description
本発明は、消費者向け電子機器の分野に関し、特に、電子指紋の効率的な検索を容易にする方法及びシステムに関する。
Geoffrey B.Rhoads及びKenneth L.Levyにより2001年5月14日に出願された、“CONTENT IDENTIFIERS TRIGGERING CORRESPONDING RESPONSES”と題された、米国特許出願公開第2002/0032864A1号明細書において、音声又は映像ファイルのようなデータセットのコンテンツに基づいて1つ又はそれ以上の“指紋”を生成するために一般に使用される種々の技術について紹介しており、この文献の援用により本発明の説明を一部代替する。データセットの指紋は、データセットのタイトル、演奏アーチスト、作曲者、監督等の識別のような、データセットに関連する補助的情報にアクセスするために、通常、使用される。更に、データセットの指紋は、そのようなアクセスに関連するデータセットへのアクセス権及び/又はアクセス料金を確認するために使用されることが可能である。データセットのコンテンツに基づく、データセットの識別子の他の使用は、当該技術分野において一般的である。
音声及び映像記録のようなエンターテインメント素材に関連する一般使用の指紋は、記録を一意に識別することが意図されており、それ故、実質的な長さを有する。例えば、専門家向け/一般消費者向け音声記録の署名のための128バイトのフォーマットは一般的である。膨大な数のそのような署名のデータベースは、消費者向け音声記録を一意に識別するために用いることが期待されており、大量のデータベースにおける大量の識別子に対する高効率な検索技術が要望されている。
指紋検索のタスクを更に複雑にしていることには、指紋とデータセットとの間の一対一対応が存在しないことがあり得る。指紋は、データセットのいずれかのコンテンツに基づいており、データセットの1つ又はそれ以上の選択されたセグメントに基づいている可能性がある。指紋はデータセットのコンテンツに基づいているため、指紋を得るためのデータセットのサンプリングは、同じデータセットに対する異なる指紋を生成し得る。現在、決定された指紋との適合性を理解するための指紋のデータベースの検索は、データセットの代替のサンプルに基づいて、データベースを通しての複数の検索及び/又は同じデータベースに対して複数の指紋を有するデータベースを通しての検索をしばしば必要とする。
例えば、楽曲のデータベースと、同じ楽曲に対して10個の異なる指紋の平均を与える署名生成スキームとについて考察する。データベースは、各々の楽曲に対して10個の最も高頻度で現れる指紋を含むように構成されることができる、又は、そのデータベースは、1つの最も可能性のある指紋を含むように構成されることが可能である。“検索”署名を生成するために、尚も未知のデータベースがサンプリングされるとき、その特定の楽曲がデータベースに含まれているか又は、その楽曲はデータベースに含まれているが、特定の検索署名はその楽曲に対するデータベースにおける署名の1つではないかのどちらかのために、その署名はデータベースにおける署名にマッチングし得、又はマッチングし得ない。マッチングが見つけられたとき、代表的には、新しいサンプルが得られ、新しい検索署名が生成される場合、この新しい署名が、マッチングに対してデータベースを検索するために用いられる。データベースにおいて記憶されている楽曲に対する10個の最も頻度高く現れる指紋を得ることにより、即座に見つけられるマッチングの尤度は増加するが、又、記憶されている多くの署名のように10回まで検索署名を比較する必要がある。楽曲当たり1つの署名のみを記憶することにより、各々の検索署名に対して検索時間とデータベースのサイズを減少させることができるが、取得された異なる署名を用いて複数の検索を実行する必要があるという尤度は増加する。
同じ楽曲に対応する複数の署名の尤度のために、高効率の検索技術に対する要請が、比較的小さいサイズのデータベースに対してさえ存在し、大きいサイズのデータベースに対して特に重要である。
本発明の目的は、データベースにおける要素の大量の識別子を有する大きいサイズのデータベースにおける高効率な検索を容易にする方法及びシステムを提供することである。更に、本発明の目的は、データベースを高効率に検索するためにデータベースにおける要素の大量の識別子を有する大きいサイズのデータベースを構成する方法及びシステムを提供することである。
それらの目的及び他の目的は、データベースにおける要素を識別する複数バイトの識別子の従来のバイトオーダーの記録に基づく、大きいサイズのデータベースの検索の効果を発揮する方法及びシステムを提供することにより達成される。データベースにおける要素の識別子を構成する記録されたバイトに基づいて、データベースは構成及び/又は記憶される。均一に分布されている識別子の記録されたバイトオーダーの検索の効果を発揮することにより、ミスマッチングをより速く検出する尤度を、殆どの状態で増加させることが見込まれ、それ故、マッチングを見つける速度及びデータベースの無駄な検索が改善される。
本発明は、データベースのコンテンツから導き出される典型的な大きい署名は署名のバイト間のデータ値の均一な分布を示さないという観測を前提としている。一般に、例えば、大きい署名の値は“クラスター化”を示し、特定の“タイプ”のデータベースは小さい署名を示し、大きい署名の値は、データベースの各々の“タイプ”の署名値に関してクラスター化される。楽曲のデータベースにおいては、例えば、ロマンチックなバラードは、一般に、ヘビーメタルの演奏とは実質的に異なる、より小さい署名を有し、ヘビーメタルの演奏は、ワルツより小さい署名とは実質的に異なる小さい署名を示す、等等である。更に、データベースにおいて同じ要素に対して複数の署名を与えるシステムにおいては、同じ要素に対する異なる署名は、類似する署名に関して、しばしば緻密にクラスター化される。
データベースにおける要素の比較的小さいサイズを有するデータベースを検索する検索システムにおいては、しかしながら、検索効率は、識別子の値の分布により影響を受ける。下に詳細に説明するように、大きいサイズの識別子を有するデータベースの検索効率は、特に、識別子のクラスター化された分布により、そして、特に、データベースに記憶された順序でそれらのクラスター化された識別子が記憶されている場合に影響を受ける。
データベースにおける要素を識別するために128バイトの署名を用いるデータベースの検索について考察することにし、要素の識別子を昇順化又は降順化することにより、データベースにおけるそれらの要素を従来の方式で記憶することを仮定する。従来、128バイトの検索署名の最も重要なバイト又はワードは、データベースにおける選択署名の対応する最も重要なバイトと比較される。バイナリサーチにおいて、選択署名は、典型的には、データベースの中央の署名である。
参照を簡略化するために、以下、用語‘バイト’は、‘データユニット’に対するパラダイムとして用いる。当業者は、用語‘バイト’、‘ワード’、‘ダブルワード’等は単に便宜的なことばであり、特定のデータユニットを形成するビット数の同一性がないことが分かっているであろう。1つのコンテキストにおける32ビットの‘ダブルワード’は、他のコンテキストにおいては、32ビットの‘ワード’であることは、まさに、1つのコンテキストにおける16ビットのバイトが他のコンテキストにおける16ビットのワードと同等であることと同様である。
それらのバイトがマッチング値を有する場合、検索署名の2番目に重要なバイトとデータベースにおける第1署名とが比較され、次いで、3番目に重要なバイト、等、が順次比較される。最も重要なバイト(MSB)から最も重要でないバイト(LSB)への進行が、下で説明するように、比較のためにデータベースにおいて次に選択される署名を決定するためにMSBからLSBまでの進行における第1ミスマッチが用いられるため、署名が昇順又は降順に記憶されているかどうかに拘らず、実行される。
対応するバイトがマッチングしない場合、バイト値の匹敵する大きさが、検索署名との比較に対して、データベースにおいて次に選択される署名を決定するために用いられる。例えば、昇順のデータベースのバイナリサーチを用いて、ミスマッチ検索のバイト又はワードが選択された署名における対応するバイト又はワードより大きい場合、データベースにおいて次に選択される署名は、現在の選択署名の半分上に位置している署名であり、ここで、“半分”はデータベースにおける有効な選択署名の前の領域の半分として定義している。降順のデータベースにおいては、次に選択された署名は、現在の選択署名の半分下である署名である。
新しい選択署名が与えられる場合、上記のバイト毎の比較が、他のミスマッチが検出されるまで、又は、検索署名のバイト全てが選択署名のバイト全てとマッチングするまで、実行される。ミスマッチが検出される場合、有効な選択署名の領域が0であって、その0のポイントにおいて検索署名に対してデータベースにおいてマッチングが存在しない0に減少されるまで、上記の処理が継続される。
データベースにおける各々の選択署名に対して、検索署名とのバイト毎の比較はが、ミスマッチが検索されるまで、又は、全てのバイトがマッチングするまで、実行される。それ故、各々の選択署名における平均“ドウェル時間”は、
(ミスマッチを検出する平均バイト数)*(1−P(マッチング))+(全バイト数)*P(マッチング)
に比例し、ここで、P(マッチング)は、検索署名が選択署名とマッチングする尤度である。
(ミスマッチを検出する平均バイト数)*(1−P(マッチング))+(全バイト数)*P(マッチング)
に比例し、ここで、P(マッチング)は、検索署名が選択署名とマッチングする尤度である。
署名の十分に分布されたポピュレーションにおいて、ミスマッチを検出するための平均バイト数は検索署名の値とは関係していない。しかしながら、クラスター化分布によりパラメータがどのように影響を与えられるかについて考察する。定義によれば、類似する値の署名の“クラスター”は、同様の最も重要なバイト値を有する署名を有する。‘非常に密’なクラスターは、例えば、最も重要でないバイトの値のみだけ異なる署名を有することが可能である。‘広い’クラスターは、比較的少ない、最も重要でないバイトの値のみだけ異なる署名を有することが可能である。代替として考えるに、署名のクラスター化分布においては、最も重要なバイトにおいて異なる署名は異なるクラスターにある。
検索署名がランダムに分布した値である場合、マッチングがクラスター化分布のデータベースに存在するか否かを決定するための時間は、検索署名がクラスターの1つの中にあるかどうかに依存する。
署名がクラスター内にある場合、この検索署名の最も重要なバイトはいずれのクラスターの最も重要なバイトとマッチングする可能性がないため、データベースにおける各々の選択署名とのミスマッチは‘速く’示され、ミスマッチを検出するための平均バイト数は比較的小さい。
他方、署名がクラスター内にある場合、ミスマッチが存在することを決定するための時間は増加することが見込まれ、それは、検索署名が同じクラスターにおいて署名を選択するために比較されるとき、クラスターを検出する、マッチングする最も重要なバイトの数に対応して、ミスマッチを検出するための平均バイト数は比較的大きくなるためである。上記の例の128バイトの音声素材の署名において、ロマンチックなバラードが、署名の同じ上位の60バイトを示し(各々のロマンチックなバラード間を区別するために残り68バイト、又は25668の異なる値を残す)、検索署名がロマンチックなバラードから導き出される場合、ロマンチックなバラードのクラスターにおける各々の選択署名に対するミスマッチを検出するための平均バイト数は60バイトより大きくなる。同様の方法で、同じ楽曲に対応する複数の署名が最下位のオーダーの2バイトの値のみだけ異なる場合、ミスマッチを検出するための平均バイト数は126バイトより大きい。
従って、検索署名がランダム値である場合、その検索署名は、その値がクラスター内にないとき、ときどき比較的短い検索時間を示し、そして、その値がクラスター内にあるとき、ときどき比較的長い検索時間を示す。しかしながら、殆どの場合、検索署名は、データベースを作成するために用いられる同じポピュレーションから取り出されることに留意されたい。即ち、検索署名は、一般に、データベースにおける署名のクラスター内にある。音声エンターテインメントにおいては、非常に稀な場合を除いて、知られていない楽曲の署名は、楽曲のデータベースにおける他の楽曲全てと非常に異なっている。更に、典型的な環境においては、ユーザは、ユーザが興味をもっている楽曲に基づいて、楽曲のデータベースが増加するように作成することが可能である。そのようなデータベースはクラスター化された署名を有する可能性が非常に高く、そして、ユーザの音楽における趣味が変化し、新しいクラスターが形成されるまで、そのデータベースへのクエリは類似する特徴を示す楽曲に基づく可能性が高い。
本発明に従って、大きいサイズの署名の比較が、署名のクラスターに実質的に依存しない順序で実行される。好適な実施形態においては、大きいサイズの署名のデータベースは、署名の値のより均一な分布を効果的にするバイトオーダーで構成される。例の構造においては、データベースは最も重要でないバイトに基づいて記憶され、次に、2番目に重要でないバイトが記憶され、等等、繰り返される。逆バイトオーダー等に基づく順序付けは、降順の値に基づく順序付けと同等ではない。各々の数字がバイト値に対応している、3つの署名123、654及び271が与えられる場合、逆バイトオーダーの昇順にソートされた順序は、最も重要でない数字の各々は昇順にあるため、271、123、654になる。
この例のデータベースによる検索は、データベースにおける各々の選択署名に対する検索署名の、最も重要でないバイトの最も重要なバイトに対する比較に基づいて効果を発揮する。例えば、検索署名が723であり、上記の例から、選択署名が123である場合、両方の署名において最も重要でない数字‘3’が第1に比較され、続いて、両方の署名において次に重要でない数字‘2’が第2に比較され、続いて、検索署名において3番目に重要でない数字‘7’が、そして選択署名における‘1’が最後に比較される。‘7’と‘1’との間の非マッチングと、‘7’が‘1’より大きいこと以外に何もないこととを検出するとき、上記の例における比較に対する次の選択署名は654であり、検索署名及び選択署名の最も重要でない数字、即ち‘3’及び‘4’から開始する。
大きいサイズの署名の最も重要でないバイトが不均一に分布している場合、ミスマッチを検出するための平均バイト数は検索署名の値に依存せず、データベースにおける署名のいずれの従来通りに規定されたクラスター化にも依存しないことに留意されたい。又、検索署名が、最も重要なバイトに対する最も重要でない署名の順序に関して署名の同じポピュレーションから取り出される場合、従来通りに規定されたクラスターにおける検索署名の位置は、この逆バイト順序のデータベースにおけるミスマッチを検出するために必要な平均バイト数に影響しないことに留意されたい。
最も重要でないバイトから最も重要なバイトまでの順序付けは実行することが最も容易であることが見込まれ、署名の均一な分布を生成する可能性が最も高いようにみえるが、当業者は、従来の、最も重要でないバイトに対する最も重要なバイトの順序付けより均一な分布を与える、いずれの他の順序付けを用いることができることを認識しているであろう。例えば、特定の署名作成スキームが最も重要でないバイトの値の不均一分布を生成することと、署名の中央バイトにおける上位から下位への循環順序付けの開始に基づく順序付けがより均一な分布を生成するために用いられることが可能であることとが分かる。同様に、第3のバイト値全てに基づく順序付け、上位順序のバイトと下位順序のバイトを交互にすることに基づく順序付け等のような、他の従来の順序付けスキームを用いることが可能である。
図1は、コンテンツ素材110を識別するための署名生成器120により生成される署名の、従来のMSBからLSBへの順序と異なる順序130に基づいて、署名の検索の効果を発揮させる検索システム100の例示としてのブロック図を示している。順序130は、データベース190における署名をソーティングする140ために用いられる。署名123、654及び271と、従来のMSBからLSBへの順序に対するシンボルa−b−cとを用いる場合であって、ここで、aはMSBである場合、c−b−aの順序130は署名271、123、654のソーティングを与え、b−c−aの順序130は123、654、271のソーティングを与え、等等である。
順序130は又、署名生成器120により生成される検索署名とのマッチングのための検索の効果を発揮させるために用いられ、検索署名はデータベース110のコンテンツに
基づいている。
基づいている。
図2は、署名を生成するバイトの特定の順序に基づいて、署名に対する検索の効果を実行するための例示としてのフロー図を示している。参照番号210において、検索署名が受信され、マッチングが見つけられるまで又は検索を実行し尽くすまで、ループ220乃至280が繰り返される。参照番号230において、従来の技術を用いて、選択署名が識別される。例えば、バイナリサーチを用いて、現在の検索領域の中央における署名は選択署名である。ループ220乃至280の開始時において、検索領域は全体のデータベースであり、ループの各々の実行は半分の領域に限定される。順序付け検索においてサンプルを選択するための他の技術は当該技術分野においては一般的である。同様に、バイナリサーチ以外の順序付け検索又はその変形としては、例えば、Bツリー検索法等があり、一般的である。それについては、例えば、文献、”The Art of Computer Programmming,Vol.3:Sorting and Searching”,D.Knuth,Addison−Wesley Publishing Co.(1973)を参照されたい。
参照番号240において、マッチングパラメータが、データベースから現在の選択署名を識別するために設定され、ループ250乃至260が、検索署名のバイト全てが選択署名のバイト全てとマッチングするかどうかの判定を実行する。ループ250乃至260がミスマッチを伴わずに実行しつくされる場合、そのループは、選択署名の識別子に等しいマッチングパラメータを有することにより終了する。ループ250乃至260は、所定の順序で、検索署名のバイトと選択署名のバイトとを比較する。参照番号255においては、検索署名の現在の識別されたバイトは、所定の順序で、選択署名における対応するバイトと比較される。例えば、上記のa−b−c表示の順序付けを用いて,その所定の順序が
b−a−cである場合、その署名の第2の数字(‘b’)が先ず、比較され、次いで、第1の数字(‘a’)が比較され、次いで、最後の数字(‘c’)が比較される。対応するバイトが、参照番号255においてマッチングしない場合、マッチングパラメータは、参照番号270において、0のような、データベースにおける署名の識別子に対応しない値に設定され、そしてループ250乃至260は終了する。参照番号280において、マッチングパラメータが0である場合、データベースの検索が実行しつくされる場合以外、ループ220乃至280が繰り返される。
b−a−cである場合、その署名の第2の数字(‘b’)が先ず、比較され、次いで、第1の数字(‘a’)が比較され、次いで、最後の数字(‘c’)が比較される。対応するバイトが、参照番号255においてマッチングしない場合、マッチングパラメータは、参照番号270において、0のような、データベースにおける署名の識別子に対応しない値に設定され、そしてループ250乃至260は終了する。参照番号280において、マッチングパラメータが0である場合、データベースの検索が実行しつくされる場合以外、ループ220乃至280が繰り返される。
参照番号290においては、検索署名にマッチングするデータベースにおける選択署名の識別子か又は、上記の例示としての0のような、データベースにおける署名を識別しない値のどちらかとして、マッチングパラメータは戻される。図示していないが、マッチングパラメータが、検索署名に対してマッチングが見つからなかったことを示す場合、ユーさは、データベースに検索署名を付加するオプションを与えられる。好適な実施形態においては、first−in−first−out(FIFO)方法が、検索署名及び補助的情報を付加するために、必要に応じて、データベースに空間を与えるために用いられる。
上記のように、所定の順序が、従来のMSBからLSBへの順序と比べて、データベースにおける署名のより均一な分布をもたらす場合、参照番号255においてミスマッチがみつけられる前に、ループ250乃至260において比較される平均バイト数が従来のMSBからLSBへの検索より小さいことが、特に、署名が従来のクラスター化分布を表す場合に、見込まれる。
上記のアルゴリズムは、上記の非従来型のバイト順序付け法を用いて、従来のデータベースにおけるマルチバイト署名を記憶することにより効果を発揮することができることに留意されたい。図3は、代替としての検索システム300の例示としてのブロック図を示しており、ここでは、各々の署名のバイトは所定の順序130に基づいて再順序化される。例えば、その所定の順序がc−b−aである場合、例示としての署名123、654、271は、各々の署名の数字の順序を逆にすることにより、再順序付け署名321,456、172に再構成される。データベース390における署名のバイトを再順序付けする360ことにより、従来のMSBからLSBへのソーティング340及び検索350は、検索署名は又、再順序付け処理360により同様に再順序付けされる条件で、効率的な検索を効果的に実行するために用いられる。
この例300における従来のMSBからLSBへのソータ340は、再順序付けされたバイトの順序に対して、昇順(又は、降順)で再順序付けバイト署名を位置付ける。例示としての上記のc−b−a順序付けにおいては、オリジナルの123、654、271の署名は、データベースにおいて、172、321、456として記憶される。検索署名(上記の例における723)は又、バイト再順序付けされた検索署名327を生成するために、c−b−aとバイト再順序付けされる。記憶されたバイト再順序付け署名に対するバイト再順序付け検索署名についての従来のバイナリサーチは、327の321との従来のMSBからLSBへの比較を、次いで、LSBからMSBへの順序付け及び検索を実行する上記の技術に対応する、327の456とのMSBからLSBへの比較を、効果的に実行する。
上記内容は、本発明の原理を単に示したものである。従って、当業者は、本発明の趣旨及び範囲から逸脱することなく、本発明の原理を具現化する種々の構成を考案することができることを理解するであろう。尚、それらについては、ここでは、明示的に記述及び図示していない。例えば、コンテンツ素材からの署名の生成は適切ではないため、上記のように、署名の幾つかのビットがマッチングしないときでさえ、検索シナリオを“マッチング”を示すように構造化することができる。当業者は、図2のブロック255を、関連マッチング基準に対応するように修正することができることを認識しているであろう。このような関連基準は、例えば、マッチングしないバイトのビット数、マッチングしない署名における累積ビット数又はマッチングしない署名における累積バイト数に基づくことができる。そのような関連基準は、最小ビット数差に基づいてマッチングをみつけるところの実行し尽す検索より速いマッチングの決定に繋がる可能性がある。しかしながら、ソーティング検索における関連基準を用いる非マッチングの決定は必ずしも完結的ではなく、続く、実行し尽す検索が、真の非マッチングを確認するために用いられることが可能である。上記の及び他のシステム構成及び最適化の特徴は、本明細書の観点から当業者には明らかであろう。そして、それらについては、同時提出の特許請求の範囲に記載している。
Claims (25)
- データベースにおいて要素を識別するために複数のデータユニットの署名を用いる該データベースを検索する方法であって:
複数のデータユニットを有する検索署名を生成する段階であって、複数のデータユニットは最も重要なデータユニットから最も重要でないデータユニットまでの第1順序を有する、段階;
前記の複数のデータユニットの署名の選択署名を決定する段階;並びに
差が検索されるまで又は前記複数のデータユニットのデータユニット全てが比較されるまで、シーケンシャルなデータユニットの第2順序を用いて、前記検索署名の複数のデータユニットの各々のデータユニットを対応する前記選択署名のデータユニットとシーケンシャルに比較する段階;
を有する方法であり、
前記第2順序は前記第1順序とは異なる;
ことを特徴とする方法。 - 請求項1に記載の方法であって、前記データベースは前記第2順序に基づいてソーティングされる、ことを特徴とする方法。
- 請求項1に記載の方法であって:
前記第2順序に基づいて前記データベースをソーティングする段階;
を更に有する、ことを特徴とする方法。 - 請求項1に記載の方法であって、前記第2順序は前記第1順序の逆に対応する、ことを特徴とする方法。
- 請求項1に記載の方法であって、前記検索署名は、コンテンツであって:
音声データベース;及び
映像データベース;
のコンテンツの少なくとも1つに基づいている、ことを特徴とする方法。 - 請求項1に記載の方法であって、前記データベースは、前記の複数のデータユニットの署名により識別される前記要素に関連する補助的情報を又、有し、前記補助的情報は:
前記要素のタイトル;
前記要素の作者;
前記要素の実行者;
前記要素の監督;及び
前記要素のプロデューサ;
の少なくとも1つを有する、ことを特徴とする方法。 - データベースにおいて要素を識別するために複数のデータユニットの署名を用いる該データベースを検索する方法であって:
複数のデータユニットを有する検索署名を生成する段階であって、複数のデータユニットは最も重要なデータユニットから最も重要でないデータユニットまでの第1順序を有する、段階;
前記第1順序とは異なる第2順序に基づく前記検索署名を再順序付けする段階;
前記の複数のデータユニットの署名の選択署名を決定する段階;並びに
差が検索されるまで又は前記複数のデータユニットのデータユニット全てが比較されるまで、シーケンシャルなデータユニットの前記第1順序を用いて、前記検索署名の複数のデータユニットの各々のデータユニットを対応する前記選択署名のデータユニットとシーケンシャルに比較する段階;
を有することを特徴とする方法。 - 請求項7に記載の方法であって:
前記の複数のデータユニットの署名は前記第2順序に基づいて再順序付けされ;
前記データベースは前記第1順序に基づいてソーティングされる;
ことを特徴とする方法。 - 請求項7に記載の方法であって:
前記第2順序に基づいて前記の複数のデータユニットの署名のデータユニットを再順序付けする段階;及び
前記第1順序に基づいて前記データベースをソーティングする段階;
を更に有する、ことを特徴とする方法。 - 請求項7に記載の方法であって、前記第2順序は前記第1順序の逆に対応する、ことを特徴とする方法。
- 請求項7に記載の方法であって、前記検索署名は、コンテンツであって:
音声データベース;及び
映像データベース;
のコンテンツの少なくとも1つに基づいている、ことを特徴とする方法。 - 請求項7に記載の方法であって、前記データベースは、前記の複数のデータユニットの署名により識別される前記要素に関連する補助的情報を又、有し、前記補助的情報は:
前記要素のタイトル;
前記要素の作者;
前記要素の実行者;
前記要素の監督;及び
前記要素のプロデューサ;
の少なくとも1つを有する、ことを特徴とする方法。 - 請求項7に記載の方法であって:
first−infirst−out法を用いて前記データベースにおいて前記検索署名をソーティングする段階;
を更に有する、ことを特徴とする方法。 - 検索システムであって:
最も重要なデータユニットから最も重要でないデータユニットへの順序に対応するデータユニットの第1順序を有する検索署名を生成する署名生成器;並びに
前記検索署名に対応する選択署名のためのデータベースを検索する検索エンジン;
を有する検索システムであり、
前記検索エンジンは、前記第1順序とは異なるデータユニットの第2順序に基づいて、前記選択署名の対応するデータユニットと前記検索署名の各々のデータユニットをシーケンシャルに比較する;
ことを特徴とする検索システム。 - 請求項14に記載の検索システムであって、前記データベースは前記第2順序に基づいてソーティングされる、ことを特徴とする検索システム。
- 請求項14に記載の検索システムであって:
前記第2順序に基づいて前記データベースをソーティングするソータ;
を更に有する、ことを特徴とする検索システム。 - 請求項14に記載の検索システムであって、前記第2順序は前記第1順序の逆に対応する、ことを特徴とする検索システム。
- 請求項14に記載の検索システムであって、前記検索署名は、コンテンツであって:
音声データベース;及び
映像データベース;
のコンテンツの少なくとも1つに基づいている、ことを特徴とする検索システム。 - 請求項14に記載の検索システムであって、前記データベースは、前記の複数のデータユニットの署名により識別される前記要素に関連する補助的情報を又、有し、前記補助的情報は:
前記要素のタイトル;
前記要素の作者;
前記要素の実行者;
前記要素の監督;及び
前記要素のプロデューサ;
の少なくとも1つを有する、ことを特徴とする検索システム。 - 検索システムであって:
最も重要なデータユニットから最も重要でないデータユニットへの順序に対応するデータユニットの第1順序を有する検索署名を生成する署名生成器;
前記第1順序とは異なるデータユニットの第2順序に基づいて、前記選択署名を再順序付けするデータユニット順序付け器;並びに
前記検索署名に対応する選択署名のためのデータベースを検索する検索エンジン;
を有する検索システムであり、
前記検索エンジンは、前記第1順序に基づいて、対応するデータユニットと前記検索署名の各々のデータユニットをシーケンシャルに比較する;
ことを特徴とする検索システム。 - 請求項20に記載の検索システムであって:
前記選択署名のデータユニットは前記第2順序に基づいて再順序付けされ;
前記データベースは前記第1第2順序に基づいてソーティングされる;
ことを特徴とする検索システム。 - 請求項20に記載の検索システムであって:
前記データユニットは、前記第2順序に基づいて前記データベースにおける署名のデータユニットを更に再順序付けし;そして
該システムは、前記第1順序に基づいて前記データベースをソーティングするソータを
を更に有する;
ことを特徴とする検索システム。 - 請求項20に記載の検索システムであって、前記第2順序は前記第1順序の逆に対応する、ことを特徴とする検索システム。
- 請求項20に記載の検索システムであって、前記検索署名は、コンテンツであって:
音声データベース;及び
映像データベース;
のコンテンツの少なくとも1つに基づいている、ことを特徴とする検索システム。 - 請求項20に記載の検索システムであって、前記データベースは、前記の複数のデータユニットの署名により識別される前記要素に関連する補助的情報を又、有し、前記補助的情報は:
前記要素のタイトル;
前記要素の作者;
前記要素の実行者;
前記要素の監督;及び
前記要素のプロデューサ;
の少なくとも1つを有する、ことを特徴とする検索システム。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US43457402P | 2002-12-19 | 2002-12-19 | |
US46743603P | 2003-05-02 | 2003-05-02 | |
PCT/IB2003/005799 WO2004057497A2 (en) | 2002-12-19 | 2003-12-05 | Reordered search of media fingerprints |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2006511894A true JP2006511894A (ja) | 2006-04-06 |
Family
ID=32685320
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005502602A Withdrawn JP2006511894A (ja) | 2002-12-19 | 2003-12-05 | メディア指紋の再順序付け検索方法及び装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20060288002A1 (ja) |
EP (1) | EP1576499A2 (ja) |
JP (1) | JP2006511894A (ja) |
KR (1) | KR20050085707A (ja) |
AU (1) | AU2003283748A1 (ja) |
WO (1) | WO2004057497A2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014086891A (ja) * | 2012-10-24 | 2014-05-12 | Nec Corp | 通信中継装置、仮想マシンサーバ、帯域制御システム、帯域制御方法およびプログラム |
Families Citing this family (57)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8818916B2 (en) | 2005-10-26 | 2014-08-26 | Cortica, Ltd. | System and method for linking multimedia data elements to web pages |
US10387914B2 (en) | 2005-10-26 | 2019-08-20 | Cortica, Ltd. | Method for identification of multimedia content elements and adding advertising content respective thereof |
US10621988B2 (en) | 2005-10-26 | 2020-04-14 | Cortica Ltd | System and method for speech to text translation using cores of a natural liquid architecture system |
US11216498B2 (en) | 2005-10-26 | 2022-01-04 | Cortica, Ltd. | System and method for generating signatures to three-dimensional multimedia data elements |
US10380623B2 (en) | 2005-10-26 | 2019-08-13 | Cortica, Ltd. | System and method for generating an advertisement effectiveness performance score |
US11403336B2 (en) | 2005-10-26 | 2022-08-02 | Cortica Ltd. | System and method for removing contextually identical multimedia content elements |
US11032017B2 (en) | 2005-10-26 | 2021-06-08 | Cortica, Ltd. | System and method for identifying the context of multimedia content elements |
US10372746B2 (en) | 2005-10-26 | 2019-08-06 | Cortica, Ltd. | System and method for searching applications using multimedia content elements |
US10614626B2 (en) | 2005-10-26 | 2020-04-07 | Cortica Ltd. | System and method for providing augmented reality challenges |
US10607355B2 (en) | 2005-10-26 | 2020-03-31 | Cortica, Ltd. | Method and system for determining the dimensions of an object shown in a multimedia content item |
US10848590B2 (en) | 2005-10-26 | 2020-11-24 | Cortica Ltd | System and method for determining a contextual insight and providing recommendations based thereon |
US10742340B2 (en) | 2005-10-26 | 2020-08-11 | Cortica Ltd. | System and method for identifying the context of multimedia content elements displayed in a web-page and providing contextual filters respective thereto |
US20160321253A1 (en) | 2005-10-26 | 2016-11-03 | Cortica, Ltd. | System and method for providing recommendations based on user profiles |
US11361014B2 (en) | 2005-10-26 | 2022-06-14 | Cortica Ltd. | System and method for completing a user profile |
US11019161B2 (en) | 2005-10-26 | 2021-05-25 | Cortica, Ltd. | System and method for profiling users interest based on multimedia content analysis |
US8326775B2 (en) | 2005-10-26 | 2012-12-04 | Cortica Ltd. | Signature generation for multimedia deep-content-classification by a large-scale matching system and method thereof |
US11003706B2 (en) | 2005-10-26 | 2021-05-11 | Cortica Ltd | System and methods for determining access permissions on personalized clusters of multimedia content elements |
US9646005B2 (en) | 2005-10-26 | 2017-05-09 | Cortica, Ltd. | System and method for creating a database of multimedia content elements assigned to users |
US10776585B2 (en) | 2005-10-26 | 2020-09-15 | Cortica, Ltd. | System and method for recognizing characters in multimedia content |
US9384196B2 (en) | 2005-10-26 | 2016-07-05 | Cortica, Ltd. | Signature generation for multimedia deep-content-classification by a large-scale matching system and method thereof |
US10193990B2 (en) | 2005-10-26 | 2019-01-29 | Cortica Ltd. | System and method for creating user profiles based on multimedia content |
US11604847B2 (en) | 2005-10-26 | 2023-03-14 | Cortica Ltd. | System and method for overlaying content on a multimedia content element based on user interest |
US10585934B2 (en) | 2005-10-26 | 2020-03-10 | Cortica Ltd. | Method and system for populating a concept database with respect to user identifiers |
US10691642B2 (en) | 2005-10-26 | 2020-06-23 | Cortica Ltd | System and method for enriching a concept database with homogenous concepts |
AU2006202063B2 (en) * | 2006-05-16 | 2009-03-12 | Canon Kabushiki Kaisha | Method for navigating large image sets using sort orders |
US9002744B2 (en) * | 2006-07-28 | 2015-04-07 | Sony Corporation | Methods, systems and computer program products for determining usage rights for digital content based on characterizing information thereof and related devices |
GB2456743A (en) * | 2007-07-16 | 2009-07-29 | Thorn Security | Searching identity space for devices connected to a bus using masks and increasing mask length when replies collide |
CN101382885B (zh) * | 2007-09-06 | 2012-05-09 | 联想(北京)有限公司 | 一种数据文件的多版本控制方法及装置 |
CN102214218B (zh) * | 2011-06-07 | 2012-12-26 | 盛乐信息技术(上海)有限公司 | 音视频内容检索系统及其方法 |
WO2017105641A1 (en) | 2015-12-15 | 2017-06-22 | Cortica, Ltd. | Identification of key points in multimedia data elements |
US11195043B2 (en) | 2015-12-15 | 2021-12-07 | Cortica, Ltd. | System and method for determining common patterns in multimedia content elements based on key points |
US11760387B2 (en) | 2017-07-05 | 2023-09-19 | AutoBrains Technologies Ltd. | Driving policies determination |
US11899707B2 (en) | 2017-07-09 | 2024-02-13 | Cortica Ltd. | Driving policies determination |
US10846544B2 (en) | 2018-07-16 | 2020-11-24 | Cartica Ai Ltd. | Transportation prediction system and method |
CN109101603B (zh) * | 2018-08-01 | 2021-06-04 | 上海达梦数据库有限公司 | 一种数据比对方法、装置、设备及存储介质 |
US10839694B2 (en) | 2018-10-18 | 2020-11-17 | Cartica Ai Ltd | Blind spot alert |
US11181911B2 (en) | 2018-10-18 | 2021-11-23 | Cartica Ai Ltd | Control transfer of a vehicle |
US20200133308A1 (en) | 2018-10-18 | 2020-04-30 | Cartica Ai Ltd | Vehicle to vehicle (v2v) communication less truck platooning |
US11126870B2 (en) | 2018-10-18 | 2021-09-21 | Cartica Ai Ltd. | Method and system for obstacle detection |
US11126869B2 (en) | 2018-10-26 | 2021-09-21 | Cartica Ai Ltd. | Tracking after objects |
US10789535B2 (en) | 2018-11-26 | 2020-09-29 | Cartica Ai Ltd | Detection of road elements |
US11643005B2 (en) | 2019-02-27 | 2023-05-09 | Autobrains Technologies Ltd | Adjusting adjustable headlights of a vehicle |
US11285963B2 (en) | 2019-03-10 | 2022-03-29 | Cartica Ai Ltd. | Driver-based prediction of dangerous events |
US11694088B2 (en) | 2019-03-13 | 2023-07-04 | Cortica Ltd. | Method for object detection using knowledge distillation |
US11132548B2 (en) | 2019-03-20 | 2021-09-28 | Cortica Ltd. | Determining object information that does not explicitly appear in a media unit signature |
US12055408B2 (en) | 2019-03-28 | 2024-08-06 | Autobrains Technologies Ltd | Estimating a movement of a hybrid-behavior vehicle |
US10776669B1 (en) | 2019-03-31 | 2020-09-15 | Cortica Ltd. | Signature generation and object detection that refer to rare scenes |
US10796444B1 (en) | 2019-03-31 | 2020-10-06 | Cortica Ltd | Configuring spanning elements of a signature generator |
US10789527B1 (en) | 2019-03-31 | 2020-09-29 | Cortica Ltd. | Method for object detection using shallow neural networks |
US11488290B2 (en) | 2019-03-31 | 2022-11-01 | Cortica Ltd. | Hybrid representation of a media unit |
US11222069B2 (en) | 2019-03-31 | 2022-01-11 | Cortica Ltd. | Low-power calculation of a signature of a media unit |
US10748022B1 (en) | 2019-12-12 | 2020-08-18 | Cartica Ai Ltd | Crowd separation |
US11593662B2 (en) | 2019-12-12 | 2023-02-28 | Autobrains Technologies Ltd | Unsupervised cluster generation |
US11590988B2 (en) | 2020-03-19 | 2023-02-28 | Autobrains Technologies Ltd | Predictive turning assistant |
US11827215B2 (en) | 2020-03-31 | 2023-11-28 | AutoBrains Technologies Ltd. | Method for training a driving related object detector |
US11756424B2 (en) | 2020-07-24 | 2023-09-12 | AutoBrains Technologies Ltd. | Parking assist |
US12049116B2 (en) | 2020-09-30 | 2024-07-30 | Autobrains Technologies Ltd | Configuring an active suspension |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6311214B1 (en) * | 1995-07-27 | 2001-10-30 | Digimarc Corporation | Linking of computers based on optical sensing of digital data |
US5870754A (en) * | 1996-04-25 | 1999-02-09 | Philips Electronics North America Corporation | Video retrieval of MPEG compressed sequences using DC and motion signatures |
US6532468B2 (en) * | 1997-12-25 | 2003-03-11 | Kawasaki Microelectronics, Inc. | Binary data search method for selecting from among candidate data, and apparatus therefor |
US6400764B1 (en) * | 1999-04-06 | 2002-06-04 | Koninklijke Philips Electronics N. V. | Motion estimation method featuring orthogonal-sum concurrent multi matching |
US7185201B2 (en) * | 1999-05-19 | 2007-02-27 | Digimarc Corporation | Content identifiers triggering corresponding responses |
US6678680B1 (en) * | 2000-01-06 | 2004-01-13 | Mark Woo | Music search engine |
US6564211B1 (en) * | 2000-10-04 | 2003-05-13 | Lsi Logic Corporation | Fast flexible search engine for longest prefix match |
US6574594B2 (en) * | 2000-11-03 | 2003-06-03 | International Business Machines Corporation | System for monitoring broadcast audio content |
-
2003
- 2003-12-05 EP EP03775729A patent/EP1576499A2/en not_active Withdrawn
- 2003-12-05 JP JP2005502602A patent/JP2006511894A/ja not_active Withdrawn
- 2003-12-05 KR KR1020057011115A patent/KR20050085707A/ko not_active Application Discontinuation
- 2003-12-05 WO PCT/IB2003/005799 patent/WO2004057497A2/en active Application Filing
- 2003-12-05 AU AU2003283748A patent/AU2003283748A1/en not_active Abandoned
- 2003-12-05 US US10/555,836 patent/US20060288002A1/en not_active Abandoned
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014086891A (ja) * | 2012-10-24 | 2014-05-12 | Nec Corp | 通信中継装置、仮想マシンサーバ、帯域制御システム、帯域制御方法およびプログラム |
Also Published As
Publication number | Publication date |
---|---|
EP1576499A2 (en) | 2005-09-21 |
WO2004057497A3 (en) | 2005-01-13 |
KR20050085707A (ko) | 2005-08-29 |
WO2004057497A2 (en) | 2004-07-08 |
US20060288002A1 (en) | 2006-12-21 |
AU2003283748A1 (en) | 2004-07-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2006511894A (ja) | メディア指紋の再順序付け検索方法及び装置 | |
US7769708B2 (en) | Efficient fuzzy matching of a test item to items in a database | |
US8838551B2 (en) | Multi-level database compression | |
EP1537579B1 (en) | Portable playlist | |
JP2007511809A (ja) | メディア指紋の検索及び記憶 | |
US7196258B2 (en) | Auto playlist generation with multiple seed songs | |
JP4621782B2 (ja) | ディスプレイを使用することなしにオーディオコンテンツのメニューを作成及びアクセスするための方法 | |
US7756847B2 (en) | Method and arrangement for searching for strings | |
US20070106405A1 (en) | Method and system to provide reference data for identification of digital content | |
AU2005255348B2 (en) | Data collection cataloguing and searching method and system | |
CN111801665A (zh) | 用于大数据应用的分层局部敏感哈希(lsh)分区索引 | |
US7962530B1 (en) | Method for locating information in a musical database using a fragment of a melody | |
CN109388729A (zh) | 音频子指纹的检索方法、装置以及音频查询系统 | |
CN111796758A (zh) | 数据记录与分析系统 | |
Casey | Audio tools for music discovery | |
Yao et al. | A sampling and counting method for big audio retrieval | |
TW200406670A (en) | Method and system for performing inserts and lookups in memory | |
CN115269909A (zh) | 音频分类方法、音频搜索方法、计算机设备和程序产品 | |
CN114945913A (zh) | 使用音频数据的频谱图峰和自适应哈希进行有效音频搜索 | |
WO2008117232A2 (en) | Apparatus for creating a multimedia file list | |
Tiple et al. | Finding Similarity between Ragas using K-Means Clustering | |
JP2008261975A (ja) | 周波数情報を用いた楽曲選曲方法、装置、プログラム及び媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20061204 |
|
A761 | Written withdrawal of application |
Free format text: JAPANESE INTERMEDIATE CODE: A761 Effective date: 20080624 |