JP2012516510A - 階層型信頼度に基づく構成でのデータの構造化および検索 - Google Patents

階層型信頼度に基づく構成でのデータの構造化および検索 Download PDF

Info

Publication number
JP2012516510A
JP2012516510A JP2011548229A JP2011548229A JP2012516510A JP 2012516510 A JP2012516510 A JP 2012516510A JP 2011548229 A JP2011548229 A JP 2011548229A JP 2011548229 A JP2011548229 A JP 2011548229A JP 2012516510 A JP2012516510 A JP 2012516510A
Authority
JP
Japan
Prior art keywords
data
quality layer
reliability quality
layer
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2011548229A
Other languages
English (en)
Inventor
ウェスリング,イェンス,ニコラス
カールバウム,ロバート,デニス
ウィリアムズ,ダスティン,ジェームズ
Original Assignee
ロヴィ テクノロジーズ コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ロヴィ テクノロジーズ コーポレイション filed Critical ロヴィ テクノロジーズ コーポレイション
Publication of JP2012516510A publication Critical patent/JP2012516510A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/02Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/217Database tuning

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】階層型信頼度に基づく構成においてデータの構造化および検索を行う方法およびシステムを提供する。
【解決手段】一例では、本システムは、データを受信し、このデータに信頼度品質層を割り当てる。信頼度品質層の範囲は、最高信頼度品質層から最低信頼度品質層に及ぶ(最高信頼度品質層および最低信頼度品質層を含む)。特定の信頼度品質層のデータが、比較的低信頼度品質層のデータより先に検索されるように構成される。本システムはさらに、信頼度品質層に応じて、サーバシステムの選択されたサーバにおいて、データを編成する。選択されたサーバの範囲は、最高信頼度品質層から最低信頼度品質層に及ぶ(最高信頼度品質層および最低信頼度品質層を含む)。
【選択図】図1

Description

発明の分野
[01]本発明は、サーバシステムおよび/またはデータベースシステムにおけるデータの構造化に関する。特に、本発明は、階層型信頼度に基づく構成においてデータの構造化および検索を行うことに関する。
背景
[02]サーバのデータを検索することは、クライアントコンピュータがインターネットなどのネットワークを介して起動可能な動作の1つである。データは、クライアントコンピュータがクエリを送信する先のサーバにおいて、何らかの様式で編成されている。デジタル媒体(たとえば、オーディオ、ビデオ、およびメタデータ)の登場により、データの実サイズは莫大なものになった。クライアントコンピュータがサーバにクエリを送信すると、サーバは、そのクエリの結果を与えるために、莫大な量のデータをくまなく検索しなければならない。従来のデータ検索方法は、効率が低下しつつある。これは、データセットの巨大化にデータセットの検索方法の進化が追いついていないためである。
概要
[03]従来型サーバでは、データは、高信頼度品質データから低信頼度品質データまで多岐にわたる場合がある。高信頼度品質データは、比較的手厚い既知の保護および既知の管理(known care and known control)の下で入力されるデータである。低信頼度品質データは、比較的手薄な既知保護および既知管理の下で入力されるデータである。高信頼度品質データの一例は、サーバを所有する会社の編集スタッフによってサーバに入力されるデータである。低信頼度品質データの一例は、サーバの、外部の一般ユーザによってサーバに入力されるデータである。
[04]残念なことに、従来型サーバ上のデータは、典型的には、データの信頼度品質に従って編成されていない。したがって、検索を求めるクエリが従来型サーバに送信された場合、従来型サーバは、高信頼度品質データと低信頼度品質データとを区別しない。このため、検索は非効率的になりがちである。これは、従来型のサーバが、最初に最高信頼度品質データに注目せずに、すべてのデータを検索するからである。
[05]必要とされるのは、上述の問題に対処する特徴、ならびに未だ議論されていない新規な特徴を有する、改良された方法である。大まかに言って、本明細書に記載の、本発明の実施形態は、階層型信頼度に基づく構成でデータの構造化および検索を行う方法およびシステムを提供することにより、上述の要求を満たすものである。以下で、本発明の実施形態について説明する。
[06]一実施形態では、階層型信頼度に基づく構成においてデータの構造化を行う方法を提供する。本方法は、データを受信することと、このデータに信頼度品質層を割り当てることと、を含む。信頼度品質層の範囲は、最高信頼度品質層から最低信頼度品質層に及ぶ(最高信頼度品質層および最低信頼度品質層を含む)。特定の信頼度品質層のデータが、好ましくは比較的低信頼度品質層のデータより先に検索されるように構成される。本方法はさらに、信頼度品質層に応じて、サーバシステムの選択されたサーバにおいて、データを編成することを含む。選択されたサーバの範囲は、最高信頼度品質層から最低信頼度品質層に及ぶ(最高信頼度品質層および最低信頼度品質層を含む)。
[07]第2の実施形態では、階層型信頼度に基づく構成においてデータの検索を行う方法を提供し、本方法は、サーバシステムがクエリを受信することを含む。サーバシステム内のデータは、最高信頼度品質層から最低信頼度品質層へと編成される。特定の信頼度品質層のデータが、好ましくは比較的低信頼度品質層のデータより先に検索されるように構成される。本方法はさらに、クエリに応えるべく、最高信頼度品質層のデータを検索することを含む。最高信頼度品質層のデータを検索することは、より低信頼度品質層のデータを検索するより先に実行される。
[08]第3の実施形態では、階層型信頼度に基づく構成においてデータの構造化を行うシステムを提供する。本システムは、データを受信することと、このデータに信頼度品質層を割り当てることと、を行うように構成される。信頼度品質層の範囲は、最高信頼度品質層から最低信頼度品質層に及ぶ(最高信頼度品質層および最低信頼度品質層を含む)。特定の信頼度品質層のデータが、好ましくは比較的低信頼度品質層のデータより先に検索されるように構成される。本方法はさらに、信頼度品質層に応じて、サーバシステムの選択されたサーバにおいて、データを編成することを行うように構成される。選択されたサーバの範囲は、最高信頼度品質層から最低信頼度品質層に及ぶ(最高信頼度品質層および最低信頼度品質層を含む)。
[09]第4の実施形態では、階層型信頼度に基づく構成においてデータの検索を行うシステムを提供する。本システムは、サーバシステムがクエリを受信することを行うように構成される。サーバシステム内のデータは、最高信頼度品質層から最低信頼度品質層へと編成される。特定の信頼度品質層のデータが、好ましくは比較的低信頼度品質層のデータより先に検索されるように構成される。本システムはさらに、クエリに応えるべく、最高信頼度品質層のデータを検索することを行うように構成される。最高信頼度品質層のデータを検索することは、より低信頼度品質層のデータを検索するより先に実行される。
[10]コンピュータ可読媒体が、データの構造化を行うための1つ以上の命令を含む。この1つ以上の命令は、1つ以上のプロセッサによって実行されると、データを受信するステップと、このデータに信頼度品質層を割り当てるステップと、信頼度品質層に応じて、サーバシステムの選択されたサーバにおいて、このデータを編成するステップと、をこの1つ以上のプロセッサに行わせ、データに信頼度品質層を割り当てる上記ステップでは、信頼度品質層の範囲は、最高信頼度品質層から最低信頼度品質層に及び(最高信頼度品質層および最低信頼度品質層を含む)、特定の信頼度品質層のデータが、比較的低信頼度品質層のデータより先に検索されるように構成されており、データを編成する上記ステップでは、選択されたサーバの範囲は、最高信頼度品質層から最低信頼度品質層に及ぶ(最高信頼度品質層および最低信頼度品質層を含む)。
[11]本発明は、上述のように構成されて他の特徴および代替手段を有する他の実施形態を包含する。これらの実施形態は、方法、処理、装置、システム、またはデバイスとしての実装を含む、様々な形で実装することが可能であることを理解されたい。
[12]本発明の実施形態は、以下の詳細説明ならびに添付図面により、容易に理解されるであろう。この説明を容易にするために、同様な参照符号は、同様な構造要素を表す。
[13]いくつかの実施形態による、階層型信頼度に基づく構成においてデータの構造化および検索を行うシステムのブロック図である。 [14]いくつかの実施形態による、階層型信頼度に基づく構成においてデータの構造化および検索を行う図1のシステムの概略図である。 [15]いくつかの実施形態による、階層型信頼度に基づく構成においてデータの構造化および検索を行う別のシステムのブロック図である。 [16]いくつかの実施形態による、階層型信頼度に基づく構成においてデータの構造化および検索を行う図3のシステムの概略図である。 [17]いくつかの実施形態による、階層型信頼度に基づく構成においてデータの構造化を行う方法のフローチャートである。 [18]いくつかの実施形態による、階層型信頼度に基づく構成においてデータの検索を行う方法のフローチャートである。
詳細な説明
[19]本発明の開示は、階層型信頼度に基づく構成でデータの構造化および検索を行う方法およびシステムに関して行う。様々な実施形態について十分な理解が得られるように、多くの具体的な詳細を説明する。しかしながら、当業者であれば理解されるように、これらの実施形態は、他の具体的な詳細によっても実践可能である。
定義
[20]以下では、明確さのために、いくつかの用語を定義する。これらの用語は、これらの定義に厳格に限定されるものではない。これらの用語および他の用語は、本明細書の文脈での使用によって定義することも可能である。
[21]「コンピュータ」(たとえば、「クライアントコンピュータ」または「クライアント」または「サーバ」)は、単一コンピュータを意味する場合と、相互に作用している複数のコンピュータからなるシステムを意味する場合とがある。コンピュータは、ハードウェアシステムと、ソフトウェアオペレーティングシステムと、おそらくは1つ以上のソフトウェアアプリケーションプログラムとを組み合わせたものである。コンピュータの、限定ではない例として、ラップトップコンピュータ、パームトップコンピュータ、スマートフォン、セル式携帯電話、移動電話、mp3プレーヤ、デジタルオーディオレコーダ、デジタルビデオレコーダ、CDプレーヤ、DVDプレーヤ、Microsoft Windows(登録商標)のようなオペレーティングシステムを搭載したIBM型パーソナルコンピュータ(PC)、MAC-OSのようなオペレーティングシステムを搭載したApple(登録商標)コンピュータ、JAVA(登録商標)-OSオペレーティングシステムを搭載したハードウェア、UNIX(登録商標)オペレーティングシステムを搭載したSun Microsystems Workstationなどがある。
[22]「信頼度品質」は、データをサーバおよび/またはデータベースに入力する際に用いられた既知保護および既知管理の最低限の量を意味する。高信頼度品質データの一例は、サーバを所有する会社の編集スタッフによって手動でサーバに入力されるデータである。たとえば、Macrovision(登録商標)は、このような会社であろう。低信頼度品質データの一例は、サーバの、外部の一般ユーザによってサーバに入力されるデータである。
[23]「信頼度品質層」(たとえば、「層」)は、特定の信頼度品質のデータに関連付けられた信頼度品質レベルを意味する。サーバおよび/またはデータベースは、関連付けられたデータが特定の信頼度品質を有する場合には、特定の信頼度品質層内にあるものとしてよい。
[24]「データベース」は、コンピュータプログラムがデータの所望部分を迅速に選択できるような様式で編成されたデータの集合体である。データベースは、電子ファイリングシステムの1つである。「データベース」という用語は、「データベース管理システム」の略として用いられることもある。
[25]「デバイス」は、ハードウェア、ソフトウェア、またはこれらの組み合わせを意味する。デバイスは、装置と呼ばれることもある。各デバイスは、階層型信頼度に基づく構成においてデータの構造化および検索を行う方法の1つ以上のステップを実行するように構成される。
[26]「フィンガープリント」(たとえば、「オーディオフィンガープリント」または「音響フィンガープリント」)は、オーディオ信号から確定的に生成される特定の音響特性のデジタル尺度であり、これを用いて、オーディオサンプルを識別すること、および/またはオーディオデータベース内で同様のアイテムを迅速に見つけることが可能である。「フィンガープリンティング」は、フィンガープリントを生成するプロセスである。オーディオフィンガープリンティングの実際の用途としては、歌、レコード、メロディー、曲、または広告の識別、無線ブロードキャストおよびピアツーピアネットワーク監視、音響効果ライブラリの管理、ビデオファイルの識別などがあり、さらに多くの用途がある。フィンガープリントは、データのうちの、メタデータの影響を受けない独立した部分である。Macrovision(登録商標)社が有するデータベースは、様々なオーディオサンプルに関する、2500万個を超える一意のフィンガープリントを格納している。参照により本明細書に組み込まれている米国特許第7277766号(’766特許)(件名「Method and System for Analyzing Digital Audio Files」)は、オーディオ波形のフィンガープリントを生成する装置の一例を示している。参照により本明細書に組み込まれている米国特許第7451078号(’078特許)(件名「Methods and Apparatus for Identifying Media Objects」)は、オーディオ記録のオーディオフィンガープリントを生成する装置の一例を示している。
[27]「ファジー検索」(たとえば、「ファジー文字列検索」または「近似文字列検索」)は、所与の文字列パターンと近似的または実質的に一致する文字列を検索することを意味する。ファジー検索は、近似マッチングまたは不正確マッチングと呼ばれることもある。ファジー検索の実行中に、正確な一致が見つかる場合がある。
[28]「メタデータ」は、一般に、データを説明するデータを意味する。より具体的には、メタデータは、デジタルオーディオ記録の内容を説明するデータを意味する。このようなメタデータとしては、たとえば、曲名、アーティスト情報(たとえば、名前、誕生日、ディスコグラフィなど)、アルバム情報(たとえば、アルバムタイトル、レビュー、トラックリスト、音声サンプルなど)、関連情報(たとえば、類似のアーティストおよびアルバム、ジャンルなど)、および他のタイプの補足情報がある。従来型の光ディスク(たとえば、CD、DVD、およびブルーレイディスク)は、典型的には、メタデータを収容しない。メタデータは、デジタル記録(たとえば、歌、アルバム、映画、またはビデオ)を光ディスクからリッピングし、別のデジタルオーディオ形式に変換してハードディスクに格納してから、そのデジタル記録に添付することが可能である。
[29]「ネットワーク」は、データ送信を可能にする、任意の2つ以上のコンピュータの間の接続を意味する。ネットワークは、限定ではなく、インターネット、ローカルエリアネットワーク、ワイドエリアネットワーク、無線ネットワーク、セルラーネットワークなどを含む、複数のネットワークの任意の組み合わせであってよい。
[30]「サーバ」は、同じコンピュータまたは別のコンピュータにある他のコンピュータプログラム(およびそれらのユーザ)にサービスを提供するソフトウェアアプリケーションを意味する。サーバはまた、特定のサーバアプリケーションを実行するために確保されている物理コンピュータを意味することもある。たとえば、会社のWebサイト用のWebサーバとしてApache HTTP Serverというソフトウェアを用いる場合は、Apacheを実行するコンピュータもWebサーバと呼ばれる。サーバアプリケーションは、作業負荷に応じて、超遠距離にわたる複数のサーバコンピュータの間で分割可能である。
[31]「目次」(TOC)は、トラック(またはチャプタ)のリスト、すなわち、ブルーレイディスク、CD、DVDなどの光ディスクにおけるトラック(またはチャプタ)の開始時刻および終了時刻のリストを意味する。ディスクにおけるトラック開始時刻は、典型的には、6桁の16進値で表され、参照により本明細書に組み込まれている米国特許第7359900号(’900特許)(件名「Digital Audio Track Set Recognition System」)は、TOCデータを用いてCDまたはDVDを識別する方法の一例を示している。’900特許はまた、ディスクの識別情報を用いてデータベース内のメタデータをルックアップし、そのメタデータをエンドユーザに送信する方法も示している。
[32]「トラック」は、CDなどの光ディスクにおけるオーディオデータブロックを意味する。トラックには、オーディオ記録の少なくとも一部分が格納される。
[33]「Webブラウザ」は、WebサイトのWebページにあるテキスト、グラフィックス、またはその両方を表示することが可能な、任意のソフトウェアアプリケーションを意味する。Webブラウザの限定でない例として、Mozilla Firefox(登録商標)、Microsoft Internet Explorer(登録商標)などがある。
[34]「Webページ」は、1つの特定のインターネットアドレスを介して到達可能であるか、1つの特定のWebサイトにあって、限定ではなく、HTML(ハイパーテキストマークアップ言語)またはVRML(仮想現実モデリング言語)、動的HTML、XML(拡張マークアップ言語)、またはこれらに関連するコンピュータ言語を含むマークアップ言語で書かれた任意の文書、ならびにこのような文書の任意の集合体、あるいは、特定のURL(ユニフォームリソースロケータ)を介して取得可能な任意の文書を意味する。
[35]「Webサーバ」は、少なくとも1つのWebページをWebブラウザに提供することが可能なアプリケーション、コンピュータ、または他の電子デバイスを意味する。Webサーバの一例として、Apache Webサーバがある。
[36]「Webサイト」は、少なくとも1つのWebページを意味し、より一般的には、仮想接続されて首尾一貫したグループを形成する複数のWebページを意味する。
[37]本システムを実装するために、実質的に任意の好適なプログラミング言語でソフトウェアアプリケーションを書くことが可能であり、このようなプログラミング言語の選択は、当業者にとっては容易に可能なことである。選択されるプログラミング言語は、そのソフトウェアアプリケーションを実行するコンピュータ(特に、そのコンピュータのオペレーティングシステム)に適合するものでなければならない。好適なプログラミング言語の限定でない例として、Object Pascal、C、C++、Java(登録商標)、JavaScriptなどがある。さらに、いくつかの実施形態の機能は、方法を一連のステップとして記述する場合には、プロセッサによって操作される一連のソフトウェア命令として実装可能であり、この場合、それらの実施形態は、ソフトウェア、ハードウェア、またはこれらの組み合わせとして実装可能である。コンピュータ可読媒体については、後述の別セクションで詳細に説明する。
サーバシステムにおけるデータの構造化および検索
[38]図1は、いくつかの実施形態による、階層型信頼度に基づく構成においてデータの構造化および検索を行うシステム100のブロック図である。ネットワーク105が、クライアントコンピュータ110とサーバシステム115とを結合している。ネットワーク105はまた、他のクライアントコンピュータ(図示せず)とも結合可能である。サーバシステム115は、データベースシステム130と結合されている(もしくは、データベースシステム130を含んでいる)。
[39]サーバシステム115は、層1サーバから層nサーバに至る、複数のサーバを含んでいる。サーバシステム115のすべてのサーバを、まとめてデータベースシステム130と結合することが可能である。代替として、サーバシステム115の各サーバを、それぞれ個別の専用データベースと結合することが可能である。サーバシステム115は、1つ以上のクライアントコンピュータ110から収集および/または生成されたデジタル媒体データを格納したり、かつ/またはこれにアクセスしたりすることが可能である。たとえば、サーバシステム115は、フィンガープリントおよび関連するメタデータを格納したり、かつ/またはこれにアクセスしたりすることが可能である。
[40]サーバシステム115は、構造化デバイス120および検索デバイス125を含んでいる。構造化デバイス120および検索デバイス125は、システム100の、より重要な操作を実行する。サーバシステム115の各構成要素同士は、サーバシステム115がクライアントコンピュータ110に代わってデータを構造化し、検索を実行することを可能にするように接続されている。
[41]図1のクライアントコンピュータ110は、サーバシステム115と通信してサーバシステム115の、階層型信頼度に基づく構成を検索するように構成されたハードウェアおよび/またはソフトウェアを含んでいる。たとえば、クライアントコンピュータ110は、インターネットにアクセスするためのグラフィカルユーザインタフェース(GUI)を含むオペレーティングシステムを有することが可能であり、Web上のHTTP(ハイパーテキスト転送プロトコル)サーバとの間でHTML(ハイパーテキストマークアップ言語)フォームの読み出しおよび送信を行うように動作可能な、Mozilla Firefox(登録商標)のようなWeb(ワールドワイドウェブ)ブラウザソフトウェアを装備することが好ましい。スタンドアロンディスクプレーヤ(たとえば、CDプレーヤ、DVDプレーヤ、またはブルーレイディスクプレーヤ)が、直接または別のコンピュータを介してネットワーク105を介してサーバシステム115と通信することが可能になるインタフェースを内蔵することが可能である。たとえば、CDプレーヤが、ネットワーク105と結合されているラップトップコンピュータとの間でデータの送受信を行うことが可能になるデータインタフェース(たとえば、IDEインタフェースまたはUSBインタフェース)を有することが可能である。
[42]同様に、サーバシステム115は、クライアントコンピュータ110と通信するためのハードウェアおよび/またはソフトウェアを含んでいる。たとえば、サーバシステム115は、ネットワーク105を介してクライアントコンピュータ110とインタフェースするための、HTTP規格準拠ソフトウェア、オペレーティングシステム、および共通ゲートウェイインターフェース(CGI)ソフトウェアを有することが可能である。代替として、サーバシステム115およびクライアントコンピュータ110は、ネットワーク105を介して互いに通信することを可能にする独自ソフトウェアを実行することが可能である。
[43]容易に理解されるように、図1のブロック図の構成は、説明を目的としたものであって、様々な変形形態が可能である。たとえば、サーバシステム115は、ネットワーク105と結合可能なローカルエリアネットワーク(LAN)と結合可能である。別の例では、サーバシステム115は、複数のWebサーバと結合可能である。システム100はまた、図示したデータベースシステム130とは異なる構成で配列されたデータベースシステムを含むことも可能である。例として、次のセクションでは、図1〜4を参照しながら、混成構成について説明する。
[44]図2は、いくつかの実施形態による、階層型信頼度に基づく構成においてデータの構造化および検索を行う図1のシステム100の概略図である。システム100は、クライアントコンピュータ110から起動されるファジー検索を最適化するように構造化されている。ファジー検索は、所与のパターン文字列と近似的または実質的に一致する文字列を検索することを意味する。
[45]検索の開始前に、図1の構造化デバイス120は、サーバシステム115内のデータを信頼度品質に基づいて分類するように構成されている。信頼度品質は、データをサーバおよび/またはデータベースに格納する際に適用された既知保護および既知管理の最低限の量を意味する。最高信頼度品質データは、クエリに対して最高信頼度の結果を提供する。最低信頼度品質データは、クエリに対して最低信頼度の結果を提供する。
[46]構造化デバイス120は、データを細分化し、このデータを、最高信頼度品質から最低信頼度品質までの複数のサーバに分配するように構成されている。構造化デバイス120は、データを、層1サーバから層nサーバまでの階層化された複数のサーバに構造化する(nは正の整数)。たとえば、層1データは、1つ以上の層1サーバに収容される。層2データは、1つ以上の層2サーバに収容される(以降も同様)。
[47]データは、必要に応じて、n層のサーバに階層化される。層1データは、最高信頼度品質データである。層1データの一例は、サーバシステム115を所有する会社の編集スタッフが手動でサーバシステム115に入力する編集データである。たとえば、Macrovision(登録商標)は、このような会社であろう。層2データは、次に高い信頼度品質のデータである。層2データの一例は、サーバシステム115を所有する会社の取引先からサブミットされるデータである。データの層は、必要に応じて、信頼度品質がより低くなる方向に続いていく。より低い信頼度品質のデータとしては、たとえば、サーバシステム115の、外部の一般ユーザを調査して得られたデータ、および/またはサーバシステム115の、外部の一般ユーザによって入力されたデータがある。
[48]図1の検索デバイス125は、最初に層1データを検索するように構成されている。検索デバイス125は、層1データを検索することによってクエリに応えようとする。層1サーバがクエリの結果を返した場合、検索デバイス125は、サーバシステム115のすべてのサーバからのすべての結果を集計する必要はない。一方、層1サーバがクエリの結果を返さない場合、検索デバイス125は、次のステップに進み、好ましくは層2データを次に検索する。層2サーバは、層2データにより、クエリに応えようとする。層2サーバがクエリの結果を返した場合、検索デバイス125は、サーバシステム115のすべてのサーバからのすべての結果を集計する必要はない。この処理は、必要に応じて、1つ以上の層nサーバにある層nデータまで続く。
[49]重要なこととして、構造化デバイス120は、クエリとの一致が見つかる可能性に関係なくデータを編成するように構成されていることに注意されたい。多くの検索では、クエリとの一致が最も見つかりにくいソースが層1データである可能性がある。それにもかかわらず、この信頼度に基づくアプローチは、少なくとも2つの面で検索効率を向上させることが可能である。第1に、検索デバイス125は、結果をただちに見つけることが可能であり、すべてのデータをくまなく見る必要がない。第2に、最初に最高信頼度品質データを見つけて返すことにより、結果を、クライアントコンピュータ110に返す前に優先度でソートする必要がない。データは、検索の実行前に既に信頼度品質でソートされている。したがって、結果を見つけてから優先度でソートすることが不要である。
[50]このようにして、クライアントコンピュータ110は、ネットワーク105を介して、サーバシステム115にアクセスすることが可能である。たとえば、クライアントコンピュータ110は、サーバシステム115内の認識された一意識別子に関連付けられたメタデータに関するクエリを送信することが可能である。サーバシステム115内の各一意識別子は、たとえば、CDの目次(TOC)から生成されたものであってよい。代替として、各一意識別子は、たとえば、トラックから生成されたフィンガープリントであってよい。フィンガープリントは、オーディオ信号から確定的に生成される特定の音響特性のデジタル尺度であり、これを用いて、オーディオサンプルを識別すること、および/またはデータベース内で同様のアイテムを迅速に見つけることが可能である。別の実施形態では、クライアントコンピュータ110は、Webブラウザを用いて文字列クエリをサーバシステム115に発行することが可能である。他の検索構成例も同様に存在する。
データベースシステムにおけるデータの構造化および検索
[51]図3は、いくつかの実施形態による、階層型信頼度に基づく構成においてデータの構造化および検索を行う別のシステム300のブロック図である。図3のシステム300は、図1のシステム100と実質的に同じである。しかしながら、図3のシステム300では、データベースシステム330は、複数の層に編成されており、サーバシステム315は、好ましくは1つのサーバを含んでいる。ネットワーク105が、クライアントコンピュータ110とサーバシステム315とを結合している。ネットワーク105はまた、他のクライアントコンピュータ(図示せず)とも結合可能である。サーバシステム115は、データベースシステム330と結合されている。
[52]データベースシステム330は、層1データベースから層nデータベースに至る、複数のデータベースを含んでいる。データベースシステム330のすべてのデータベースを、まとめてサーバシステム315と結合することが可能である。データベースシステム330は、1つ以上のクライアントコンピュータ310から収集および/または生成されたデジタル媒体データを格納することが可能である。たとえば、データベースシステム330は、フィンガープリントおよび関連するメタデータを格納することが可能である。
[53]サーバシステム315は、構造化デバイス320および検索デバイス325を含んでいる。構造化デバイス320および検索デバイス325は、システム300の、より重要な操作を実行する。サーバシステム315の各構成要素同士は、サーバシステム315がクライアントコンピュータ110に代わってデータを構造化し、検索を実行することを可能にするように接続されている。
[54]図3のクライアントコンピュータ110は、サーバシステム315と通信してデータベースシステム330の、階層型信頼度に基づく構成を検索するように構成されたハードウェアおよび/またはソフトウェアを含んでいる。たとえば、クライアントコンピュータ110は、インターネットにアクセスするためのグラフィカルユーザインタフェース(GUI)を含むオペレーティングシステムを有することが可能であり、Web上のHTTP(ハイパーテキスト転送プロトコル)サーバとの間でHTML(ハイパーテキストマークアップ言語)フォームの読み出しおよび送信を行うように動作可能な、Mozilla Firefox(登録商標)のようなWeb(ワールドワイドウェブ)ブラウザソフトウェアを装備することが好ましい。スタンドアロンディスクプレーヤ(たとえば、CDプレーヤ、DVDプレーヤ、またはブルーレイディスクプレーヤ)が、直接または別のコンピュータを介してネットワーク105を介してデータベースシステム330と通信することが可能になるインタフェースを内蔵することが可能である。たとえば、CDプレーヤが、ネットワーク105と結合されているラップトップコンピュータとの間でデータの送受信を行うことが可能になるデータインタフェース(たとえば、IDEインタフェースまたはUSBインタフェース)を有することが可能である。
[55]同様に、サーバシステム315は、クライアントコンピュータ110と通信するためのハードウェアおよび/またはソフトウェアを含んでいる。たとえば、サーバシステム315は、ネットワーク105を介してクライアントコンピュータ110とインタフェースするための、HTTP規格準拠ソフトウェア、オペレーティングシステム、および共通ゲートウェイインターフェース(CGI)ソフトウェアを有することが可能である。代替として、サーバシステム315およびクライアントコンピュータ110は、ネットワーク105を介して互いに通信することを可能にする独自ソフトウェアを実行することが可能である。
[56]容易に理解されるように、図3のブロック図の構成は、説明を目的としたものであって、様々な変形形態が可能である。たとえば、データベースシステム330は、ネットワーク105と結合可能なローカルエリアネットワーク(LAN)と結合可能である。別の例では、データベースシステム330は、複数のWebサーバと結合可能である。システム300はまた、図示したデータベースシステム330とは異なる構成で配列されたデータベースシステムを含むことも可能である。以下では、例として、図1〜4を参照しながら、混成構成について説明する。
[57]図4は、いくつかの実施形態による、階層型信頼度に基づく構成においてデータの構造化および検索を行う図3のシステム300の概略図である。一実施形態では、図4のシステム300は、図2のシステム100と実質的に同様であってよい。しかしながら、このシステム300では、データベースシステム330は、複数の層に編成されており、サーバシステム315は、好ましくは1つのサーバを有している。システム300は、クライアントコンピュータ110から起動されるファジー検索を最適化するように構造化されている。ファジー検索は、所与のパターン文字列と近似的または実質的に一致する文字列を検索することを意味する。
[58]検索の開始前に、図3の構造化デバイス320は、データベースシステム315内のデータを信頼度品質に基づいて分類するように構成されている。最高信頼度品質データは、クエリに対して最高信頼度の結果を提供する。最低信頼度品質データは、クエリに対して最低信頼度の結果を提供する。図1を参照して上述したように、信頼度品質は、データをサーバおよび/またはデータベースに格納する際に適用された既知保護および既知管理の最低限の量を意味する。
[59]構造化デバイス320は、データを細分化し、このデータを、最高信頼度品質から最低信頼度品質までの複数のデータベースに分配するように構成されている。構造化デバイス320は、データを、層1データベースから層nデータベースまでの階層化された複数のデータベースに構造化する(nは正の整数)。たとえば、層1データは、1つ以上の層1データベースに収容される。層2データは、1つ以上の層2データベースに収容される(以降も同様)。
[60]データは、必要に応じて、n層のデータベースに階層化される。層1データは、最高信頼度品質データである。層1データの一例は、データベースシステム315を所有する会社の編集スタッフが手動でデータベースシステム315に入力する編集データである。たとえば、Macrovision(登録商標)は、このような会社であろう。層2データは、次に高い信頼度品質のデータである。層2データの一例は、データベースシステム315を所有する会社の取引先からサブミットされるデータである。データの層は、必要に応じて、信頼度品質がより低くなる方向に続いていく。より低い信頼度品質のデータとしては、たとえば、データベースシステム315の、外部の一般ユーザを調査して得られたデータ、および/またはデータベースシステム315の、外部の一般ユーザによって入力されたデータがある。
[61]図3の検索デバイス325は、最初に層1データを検索するように構成されている。検索デバイス325は、層1データにより、クエリに応えようとする。層1データベースがクエリの結果を返した場合、検索デバイス325は、データベースシステム330のすべてのデータベースからのすべての結果を集計する必要はない。一方、層1データベースがクエリの結果を有しない場合、検索デバイス325は、次のステップに進み、好ましくは層2データを次に検索する。層2データベースは、層2データにより、クエリに応えることが可能である。層2データベースがクエリの結果を有する場合、検索デバイス325は、データベースシステム330のすべてのデータベースからのすべての結果を集計する必要はない。この処理は、必要に応じて、1つ以上の層nデータベースにある層nデータまで続く。
[62]重要なこととして、構造化デバイス320は、クエリとの一致が見つかる可能性に関係なくデータを編成するように構成されていることに注意されたい。多くの検索では、クエリとの一致が最も見つかりにくいソースが層1データである可能性がある。それにもかかわらず、この信頼度に基づくアプローチは、少なくとも2つの面で検索効率を向上させることが可能である。第1に、検索デバイス325は、結果をただちに見つけることが可能であり、すべてのデータをくまなく見る必要がない。第2に、最初に最高信頼度品質データを見つけて返すことにより、結果を、クライアントコンピュータ110に返す前に優先度でソートする必要がない。たとえば、データは、検索の実行前に既に信頼度品質でソートされている。したがって、結果を見つけてから優先度でソートすることが不要である。
[63]このようにして、クライアントコンピュータ110は、ネットワーク105を介して、データベースシステム330にアクセスすることが可能である。たとえば、クライアントコンピュータ110は、データベースシステム330内の認識された一意識別子に関連付けられたメタデータに関するクエリを送信することが可能である。データベースシステム330内の各一意識別子は、たとえば、CDの目次(TOC)から生成されたものであってよい。代替として、各一意識別子は、たとえば、トラックから生成されたフィンガープリントであってよい。フィンガープリントは、オーディオ信号から確定的に生成される特定の音響特性のデジタル尺度であり、これを用いて、オーディオサンプルを識別すること、および/またはデータベース内で同様のアイテムを迅速に見つけることが可能である。別の実施形態では、クライアントコンピュータ110は、Webブラウザを用いて文字列クエリをデータベースシステム330に発行することが可能である。他の検索構成例も同様に存在する。
[64]図1〜4を参照すると、いくつかの実施形態は、上述の実施形態の混成物を含んでよいことに注意されたい。たとえば、サーバシステムが複数のサーバを含み、このサーバシステム内の少なくとも1つのサーバが複数のデータベースと結合される、ということがあってよい。これらの複数のサーバおよび複数のデータベースは、信頼度品質階層に従う所定の様式で階層化されてよい。同様に、データは、複数のサーバおよび複数のデータベースにまたがる信頼度品質階層に従って構造化されてよい。他の変形形態も同様に存在する。
方法の概要
[65]図5は、いくつかの実施形態による、階層型信頼度に基づく構成においてデータの構造化を行う方法500のフローチャートである。いくつかの実装では、方法500の各ステップは、図1の構造化デバイス120によって実行可能である。
[66]方法500は、ステップ505から始まり、そこでは、本システムがデータを受信する。次に、方法500はステップ510に進み、そこでは、本システムがデータに信頼度品質層を割り当てる。信頼度品質層の範囲は、最高信頼度品質層から最低信頼度品質層に及ぶ(最高信頼度品質層および最低信頼度品質層を含む)。本システムは、サーバおよび/またはデータベース内のデータに対して、信頼度品質層をあらかじめ決定することが好ましい。たとえば、本システムは、最高信頼度品質層、最低信頼度品質層、および1つ以上の中間信頼度品質層を含むように信頼度品質層をあらかじめ決定することが可能である。特定の信頼度品質層のデータが、好ましくは比較的低信頼度品質層のデータより先に検索されるように構成される。したがって、ステップ515では、本システムは、信頼度品質層に応じて、選択されたサーバにおいてデータを編成する。選択されたサーバの範囲は、最高信頼度品質層から最低信頼度品質層に及ぶ(最高信頼度品質層および最低信頼度品質層を含む)。
[67]本方法は、次に判断操作520に進む。ここでは、本システムは、さらにデータを受信するかどうかを決定する。たとえば、サーバシステムの編集者が、さらなるデータを手動で入力することが可能である。さらなるデータを受信する場合、方法500は、ステップ505に戻り、そこで、本システムはデータを受信する。方法500は、そこから続行される。一方、判断操作520において、もうデータを受信しないと、本システムが決定した場合、方法500は、判断操作520の後に終了する。
[68]図6は、いくつかの実施形態による、階層型信頼度に基づく構成においてデータの検索を行う方法600のフローチャートである。いくつかの実装では、方法600の各ステップは、図1の検索デバイス125によって実行可能である。
[69]本方法は、ステップ605から始まり、そこでは、本システムがクライアントコンピュータからサーバシステムへのクエリを受信する。サーバシステム内のデータは、最高信頼度品質層から最低信頼度品質層へと編成されている(最高信頼度品質層および最低信頼度品質層を含む)。いくつかの実施形態では、図5の方法500を用いて、サーバおよび/またはデータベース内のデータを編成してから、検索を実行する。図5を参照して上述したように、本システムは、サーバおよび/またはデータベースに対して、信頼度品質層をあらかじめ決定することが好ましい。たとえば、本システムは、最高信頼度品質層、最低信頼度品質層、および1つ以上の中間信頼度品質層を含むように信頼度品質層をあらかじめ決定することが可能である。特定の信頼度品質層のデータが、好ましくは比較的低信頼度品質層のデータより先に検索されるように構成される。したがって、ステップ610では、本システムは、クエリに応えるべく、最高信頼度品質層のデータを検索することから、検索を開始する。
[70]次に、判断操作615では、本システムは、最高信頼度品質層にあるいずれかのデータによってクエリに応えられるかどうかを判定する。クエリに応えられる場合、方法600はステップ635に進む。そこでは、本システムはクエリ結果をクライアントコンピュータに返す。一方、判断操作615において、クエリに応えられない、と本システムが判定した場合、本方法はステップ620に進み、そこでは、本システムは、クエリに応えるべく、次の信頼度品質層のデータを検索する。このステップ620で検索されるデータは、先のステップ610で検索されたデータより信頼度品質が低いことが好ましい。
[71]次に、判断操作625では、本システムは、上述のステップ620で検索された信頼度品質層にあるいずれかのデータによってクエリに応えられるかどうかを判定する。クエリに応えられる場合、方法600はステップ635に進む。そこでは、本システムはクエリ結果をクライアントコンピュータに返す。一方、判断操作625において、クエリに応えられない、と本システムが判定した場合、本方法600は判断操作630に進む。
[72]判断操作630では、本システムは、最低信頼度品質層のデータが検索されたかどうかを判定する。最低信頼度品質層のデータが検索されていない場合、方法600はステップ620に戻り、そこでは、本システムは、次の信頼度品質層のデータを検索する。このステップ620で検索されるデータは、既に検索されたデータより信頼度品質が低いことが好ましい。方法600は、結果が見つかるか、すべての信頼度品質層が検索されるまで、ステップ620から続行される。
[73]判断操作630において、最低信頼度品質層のデータが検索された、と本システムが判定した場合、方法600はステップ635に進み、そこでは、本システムは、クエリを送信したクライアントコンピュータにクエリ結果を返す。ステップ635では、本システムがクエリに対する一致を見つけることができなかった、というクエリ結果になる可能性がある。ステップ635の後、方法600は終了する。
[74]なお、これらの方法は、本方法の概要において説明されていない他の詳細およびステップを含んでよい。他の詳細およびステップは、適宜図面を参照しながら既に説明されており、これらは、実施形態に応じて、本方法に含まれてよい。
コンピュータ可読媒体の実装
[75]コンピュータ技術分野の当業者には明らかなように、いくつかの実施形態の各部分は、本開示の教示に従ってプログラムされた、従来型の汎用あるいは専用のデジタルコンピュータまたはマイクロプロセッサを用いることにより、便利に実装可能である。熟練のプログラマであれば、本開示の教示に基づいて、適切なソフトウェアコーティングを容易に行うことが可能である。本発明の方法およびシステムはまた、特定用途向け集積回路を作製することや、従来部品の回路からなる適切なネットワークを相互接続することによっても実装可能である。
[76]実装は、実装における任意の処理を実行するようコンピュータを制御すること(または処理をコンピュータに実行させること)に用いることが可能な命令が格納された記憶媒体(媒体)であるコンピュータプログラム製品を含んでよい。記憶媒体としては、限定ではなく、フロッピー(登録商標)ディスク、ミニディスク(MD)、光ディスク、DVD、CD−ROM、マイクロドライブ、光磁気ディスクなどを含む任意のタイプのディスク、ROM、RAM、EPROM、EEPROM、DRAM、VRAM、フラッシュメモリデバイス(フラッシュカードを含む)、磁気カードまたは光学式カード、ナノシステム(分子メモリICを含む)、RAIDデバイス、リモートデータ記憶装置/アーカイブ/ウェアハウス、または任意のタイプの、命令および/またはデータの格納に適した媒体またはデバイスがある。
[77]いくつかの実装は、任意のいずれかのコンピュータ可読媒体に格納されて、汎用/専用のコンピュータまたはマイクロプロセッサのハードウェアを制御し、このコンピュータまたはマイクロプロセッサが、特定の実施形態の結果を利用する人間ユーザまたは他のメカニズムと対話することを可能にするためのソフトウェアを含む。このようなソフトウェアとしては、限定ではなく、デバイスドライバ、オペレーティングシステム、ユーザアプリケーションなどがある。最終的には、このようなコンピュータ可読媒体は、上述の、本発明の方法およびシステムの諸態様を実行するためのソフトウェアをさらに含む。
[78]汎用/専用コンピュータまたはマイクロプロセッサのプログラミング(ソフトウェア)には、上述の処理を実施するためのソフトウェアモジュールが含まれる。上述の処理は、限定ではなく、データを受信することと、データに信頼度品質層を割り当てることと、信頼度品質層に応じて、サーバシステムの選択されたサーバにおいて、このデータを編成することと、を含んでおり、データに信頼度品質層を割り当てることでは、信頼度品質層の範囲は、最高信頼度品質層から最低信頼度品質層に及び(最高信頼度品質層および最低信頼度品質層を含む)、特定の信頼度品質層のデータが、比較的低信頼度品質層のデータより先に検索されるように構成されており、データを編成することでは、選択されたサーバの範囲は、最高信頼度品質層から最低信頼度品質層に及ぶ(最高信頼度品質層および最低信頼度品質層を含む)。
効果
[79]本システムの実施形態は、データの信頼度品質に従ってサーバ上のデータの構造化および検索を行うことを可能にする。本システムは、複数のサーバにわたるデータを効率的に構造化することにより、応答性を向上させ、全体負荷を低減する。本システムは、少なくとも2つの面で、検索の効率を向上させる。第1に、本システムは、結果をただちに見つけることが可能であり、すべてのデータをくまなく見る必要がない。第2に、最初に最高信頼度品質データを見つけて返すことにより、結果を、クライアントコンピュータに返す前に優先度でソートする必要がない。データは、検索の実行前に既に信頼度品質でソートされている。したがって、結果を見つけてから優先度でソートすることが不要である。これらの改善点は、サーバ資源のコストを低減しながら、改良されたエクスペリエンスをユーザおよび顧客にもたらす。
[80]前述の明細書では、本発明を、その具体的な実施形態を参照しながら説明した。しかしながら、本発明のより広範な趣旨および範囲から逸脱することなく、それらの実施形態に様々な修正や変更を施すことが可能であることは明らかである。したがって、本明細書および図面は、制限的というよりは例示的であると見なすべきである。

Claims (21)

  1. データの構造化を行う方法であって、
    データを受信することと、
    前記データに信頼度品質層を割り当てることであって、前記信頼度品質層の範囲は、最高信頼度品質層から最低信頼度品質層に及び(前記最高信頼度品質層および前記最低信頼度品質層を含む)、特定の信頼度品質層のデータは、比較的低信頼度品質層のデータより先に検索されるように構成される、前記割り当てることと、
    前記信頼度品質層に応じて、サーバシステムの選択されたサーバにおいて、前記データを編成することであって、前記選択されたサーバの範囲は、前記最高信頼度品質層から前記最低信頼度品質層に及ぶ(前記最高信頼度品質層および前記最低信頼度品質層を含む)、前記編成することと、
    を含む方法。
  2. 信頼度品質層は、特定の信頼度品質のデータに関連付けられた、特定の信頼度品質レベルであり、信頼度品質は、データを前記サーバシステムのサーバに入力する際に用いられた既知の保護および既知の管理の最低限の量である、請求項1に記載の方法。
  3. 前記サーバに関連付けられたデータの信頼度品質層に応じて、前記サーバシステムのサーバを編成することと、
    前記サーバを層1サーバから層nサーバへと配列することであって、nは正の整数であり、前記層1サーバは、前記最高信頼度品質層にあり、前記層nサーバは、前記最低信頼度品質層にある、前記配列することと、
    のうちの少なくとも一方をさらに含む、請求項1に記載の方法。
  4. 前記データを編成することは、クエリとの一致が見つかる可能性に関係なく実行される、請求項1に記載の方法。
  5. 前記サーバシステムは、1つ以上のクライアントコンピュータから収集されたデジタル媒体データを格納するデータベースシステムに結合されるように構成される、請求項1に記載の方法。
  6. 前記サーバシステムは、ファジー検索用として構成され、ファジー検索は、所与の文字列パターンと実質的に一致する文字列を検索することであり、前記データを編成することにより、ファジー検索が最適化される、請求項1に記載の方法。
  7. データの検索を行う方法であって、
    サーバシステムがクエリを受信することであって、前記サーバシステム内のデータが最高信頼度品質層から最低信頼度品質層へと編成されており、特定の信頼度品質層のデータは、比較的低信頼度品質層のデータより先に検索されるように構成されている、クエリを受信することと、
    前記クエリに応えるべく、前記最高信頼度品質層のデータを検索することであって、より低信頼度品質層のデータを検索するより先に実行される、前記最高信頼度品質層の前記データを検索することと、
    を含む方法。
  8. 前記最高信頼度品質層において前記クエリとの実質的な一致を1つ以上見つけることと、
    前記1つ以上の実質的な一致を返すことと、
    のうちの少なくとも一方をさらに含む、請求項7に記載の方法。
  9. 前記最高信頼度品質層において前記クエリとの一致が見つからないことと、
    前記クエリに応えるべく、次の信頼度品質層のデータを検索することと、
    前記次の信頼度品質層において前記クエリとの実質的な一致を1つ以上見つけることと、
    前記1つ以上の実質的な一致を返すことと、
    のうちの少なくとも1つをさらに含む、請求項7に記載の方法。
  10. 前記最高信頼度品質層において前記クエリとの一致が見つからないことと、
    前記クエリに応えるべく、次の信頼度品質層のデータを検索することと、
    前記次の信頼度品質層において前記クエリとの実質的な一致が見つからないことと、
    前記最低信頼度品質層が検索されたと判定することと、
    前記クエリの結果を返すことと、
    のうちの少なくとも1つをさらに含む、請求項7に記載の方法。
  11. データの構造化を行うシステムであって、
    データを受信することと、
    前記データに信頼度品質層を割り当てることであって、前記信頼度品質層の範囲は、最高信頼度品質層から最低信頼度品質層に及び(前記最高信頼度品質層および前記最低信頼度品質層を含む)、特定の信頼度品質層のデータは、比較的低信頼度品質層のデータより先に検索されるように構成される、前記割り当てることと、
    前記信頼度品質層に応じて、サーバシステムの選択されたサーバにおいて、前記データを編成することであって、前記選択されたサーバの範囲は、前記最高信頼度品質層から前記最低信頼度品質層に及ぶ(前記最高信頼度品質層および前記最低信頼度品質層を含む)、前記データを編成することと、
    を行うように構成されたシステム。
  12. 信頼度品質層は、特定の信頼度品質のデータに関連付けられた、特定の信頼度品質レベルであり、信頼度品質は、データを前記サーバシステムのサーバに入力する際に用いられた既知保護および既知管理の最低限の量である、請求項11に記載のシステム。
  13. 前記サーバに関連付けられたデータの信頼度品質層に応じて、前記サーバシステムのサーバを編成することと、
    前記サーバを層1サーバから層nサーバへと配列することであって、nは正の整数であり、前記層1サーバは、前記最高信頼度品質層にあり、前記層nサーバは、前記最低信頼度品質層にある、前記配列することと、
    のうちの少なくとも一方を行うようにさらに構成された、請求項11に記載のシステム。
  14. 前記データを編成することは、クエリとの一致が見つかる可能性に関係なく実行される、請求項11に記載のシステム。
  15. 前記サーバシステムは、1つ以上のクライアントコンピュータから収集されたデジタル媒体データを格納するデータベースシステムに結合されるように構成される、請求項11に記載のシステム。
  16. 前記サーバシステムは、ファジー検索用として構成され、ファジー検索は、所与の文字列パターンと実質的に一致する文字列を検索することであり、前記データを編成することにより、ファジー検索が最適化される、請求項11に記載のシステム。
  17. データの検索を行うシステムであって、
    サーバシステムがクエリを受信することであって、前記サーバシステム内のデータが最高信頼度品質層から最低信頼度品質層へと編成されており、特定の信頼度品質層のデータは、比較的低信頼度品質層のデータより先に検索されるように構成されている、クエリを受信することと、
    前記クエリに応えるべく、前記最高信頼度品質層のデータを検索することであって、より低信頼度品質層のデータを検索するより先に実行される、前記最高信頼度品質層の前記データを検索することと、
    を行うように構成されたシステム。
  18. 前記最高信頼度品質層において前記クエリとの実質的な一致を1つ以上見つけることと、
    前記1つ以上の実質的な一致を返すことと、
    のうちの少なくとも一方を行うようにさらに構成された、請求項17に記載のシステム。
  19. 前記最高信頼度品質層において前記クエリとの一致が見つからないことと、
    前記クエリに応えるべく、次の信頼度品質層のデータを検索することと、
    前記次の信頼度品質層において前記クエリとの実質的な一致を1つ以上見つけることと、
    前記1つ以上の実質的な一致を返すことと、
    のうちの少なくとも1つを行うようにさらに構成された、請求項17に記載のシステム。
  20. 前記最高信頼度品質層において前記クエリとの一致が見つからないことと、
    前記クエリに応えるべく、次の信頼度品質層のデータを検索することと、
    前記次の信頼度品質層において前記クエリとの実質的な一致が見つからないことと、
    前記最低信頼度品質層が検索されたと判定することと、
    前記クエリの結果を返すことと、
    のうちの少なくとも1つを行うようにさらに構成された、請求項17に記載のシステム。
  21. データの構造化を行うための1つ以上の命令を保持するコンピュータ可読媒体であって、前記1つ以上の命令は、1つ以上のプロセッサによって実行されると、
    データを受信するステップと、
    前記データに信頼度品質層を割り当てるステップであって、前記信頼度品質層の範囲は、最高信頼度品質層から最低信頼度品質層に及び(前記最高信頼度品質層および前記最低信頼度品質層を含む)、特定の信頼度品質層のデータは、比較的低信頼度品質層のデータより先に検索されるように構成される、前記割り当てるステップと、
    前記信頼度品質層に応じて、サーバシステムの選択されたサーバにおいて、前記データを編成するステップであって、前記選択されたサーバの範囲は、前記最高信頼度品質層から前記最低信頼度品質層に及ぶ(前記最高信頼度品質層および前記最低信頼度品質層を含む)、前記編成するステップと、
    を前記1つ以上のプロセッサに行わせる、コンピュータ可読媒体。
JP2011548229A 2009-01-28 2010-01-26 階層型信頼度に基づく構成でのデータの構造化および検索 Pending JP2012516510A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US12/321,997 US8209313B2 (en) 2009-01-28 2009-01-28 Structuring and searching data in a hierarchical confidence-based configuration
US12/321,997 2009-01-28
PCT/US2010/022126 WO2010088216A2 (en) 2009-01-28 2010-01-26 Structuring and searching data in a hierarchical confidence-based configuration

Publications (1)

Publication Number Publication Date
JP2012516510A true JP2012516510A (ja) 2012-07-19

Family

ID=42354988

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011548229A Pending JP2012516510A (ja) 2009-01-28 2010-01-26 階層型信頼度に基づく構成でのデータの構造化および検索

Country Status (5)

Country Link
US (2) US8209313B2 (ja)
EP (1) EP2382565A4 (ja)
JP (1) JP2012516510A (ja)
CN (1) CN102365640A (ja)
WO (1) WO2010088216A2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2916254A1 (en) 2014-03-06 2015-09-09 Fujitsu Limited Biometric authentication apparatus and method

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8751494B2 (en) * 2008-12-15 2014-06-10 Rovi Technologies Corporation Constructing album data using discrete track data from multiple sources
US20100228736A1 (en) * 2009-02-20 2010-09-09 All Media Guide, Llc Recognizing a disc
US20110072117A1 (en) * 2009-09-23 2011-03-24 Rovi Technologies Corporation Generating a Synthetic Table of Contents for a Volume by Using Statistical Analysis
US8321394B2 (en) * 2009-11-10 2012-11-27 Rovi Technologies Corporation Matching a fingerprint
US8433719B1 (en) * 2011-12-29 2013-04-30 Google Inc. Accelerating find in page queries within a web browser
US9344759B2 (en) * 2013-03-05 2016-05-17 Google Inc. Associating audio tracks of an album with video content
US10133816B1 (en) * 2013-05-31 2018-11-20 Google Llc Using album art to improve audio matching quality
CN103366014B (zh) * 2013-07-30 2017-08-04 汉柏科技有限公司 基于集群的云计算网络数据处理系统及方法
US9542488B2 (en) 2013-08-02 2017-01-10 Google Inc. Associating audio tracks with video content
CN107748792B (zh) * 2017-11-01 2020-11-27 上海数据交易中心有限公司 数据检索方法及装置、终端
US11269709B2 (en) * 2018-10-05 2022-03-08 Sap Se Automated incident handling for software components
CN115706977A (zh) * 2021-08-03 2023-02-17 华为技术有限公司 一种数据传输方法及相关设备

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3469591B2 (ja) 1992-01-28 2003-11-25 ソニー株式会社 階層構造情報の表示方法
JPH06337899A (ja) 1993-05-28 1994-12-06 Sony Corp 情報検索方法とその装置
EP1049030A1 (en) * 1999-04-28 2000-11-02 SER Systeme AG Produkte und Anwendungen der Datenverarbeitung Classification method and apparatus
US7099898B1 (en) * 1999-08-12 2006-08-29 International Business Machines Corporation Data access system
US6785810B1 (en) * 1999-08-31 2004-08-31 Espoc, Inc. System and method for providing secure transmission, search, and storage of data
JP2001109767A (ja) 1999-10-08 2001-04-20 Nippon Telegr & Teleph Corp <Ntt> 階層的データベース管理方法、装置、および階層的データベース管理プログラムを記録した記録媒体
US7277766B1 (en) 2000-10-24 2007-10-02 Moodlogic, Inc. Method and system for analyzing digital audio files
JP2002182983A (ja) 2000-12-13 2002-06-28 Sharp Corp データベースへのアクセス制御方法、データベース装置、リソースへのアクセス制御方法、情報処理装置
US7296295B2 (en) * 2002-12-11 2007-11-13 Broadcom Corporation Media processing system supporting different media formats via server-based transcoding
US20040128355A1 (en) * 2002-12-25 2004-07-01 Kuo-Jen Chao Community-based message classification and self-amending system for a messaging system
US7359900B2 (en) 2003-07-29 2008-04-15 All Media Guide, Llc Digital audio track set recognition system
US7451078B2 (en) 2004-12-30 2008-11-11 All Media Guide, Llc Methods and apparatus for identifying media objects
US7908273B2 (en) 2006-03-09 2011-03-15 Gracenote, Inc. Method and system for media navigation
US7457814B2 (en) * 2006-05-30 2008-11-25 Microsoft Corporation Multi-dimensional data classification for user interface customizations
US7870398B2 (en) * 2007-01-25 2011-01-11 International Business Machines Corporation Integrity assurance of query result from database service provider
US7912852B1 (en) * 2008-05-02 2011-03-22 Amazon Technologies, Inc. Search-caching and threshold alerting for commerce sites

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2916254A1 (en) 2014-03-06 2015-09-09 Fujitsu Limited Biometric authentication apparatus and method
US9619635B2 (en) 2014-03-06 2017-04-11 Fujitsu Limited Biometric authentication apparatus and method

Also Published As

Publication number Publication date
US8527490B2 (en) 2013-09-03
EP2382565A2 (en) 2011-11-02
EP2382565A4 (en) 2013-10-02
US20100191739A1 (en) 2010-07-29
WO2010088216A2 (en) 2010-08-05
US8209313B2 (en) 2012-06-26
CN102365640A (zh) 2012-02-29
US20120239696A1 (en) 2012-09-20
WO2010088216A3 (en) 2010-10-21

Similar Documents

Publication Publication Date Title
JP2012516510A (ja) 階層型信頼度に基づく構成でのデータの構造化および検索
US8359315B2 (en) Generating a representative sub-signature of a cluster of signatures by using weighted sampling
US8620967B2 (en) Managing metadata for occurrences of a recording
US7653623B2 (en) Information searching apparatus and method with mechanism of refining search results
US20100124335A1 (en) Scoring a match of two audio tracks sets using track time probability distribution
US8239412B2 (en) Recommending a media item by using audio content from a seed media item
US7949649B2 (en) Automatically acquiring acoustic and cultural information about music
US8751494B2 (en) Constructing album data using discrete track data from multiple sources
US8321394B2 (en) Matching a fingerprint
US20070106405A1 (en) Method and system to provide reference data for identification of digital content
US20070162408A1 (en) Content Object Indexing Using Domain Knowledge
JP2007249899A (ja) 検索処理プログラム
Davison et al. Finding Relevant Website Queries.
KR20070057578A (ko) 인터넷 리소스에 태그 정보를 부가하여 공유 정보를제공하는 시스템, 장치, 방법 및 이를 구현할 수 있는컴퓨터로 읽을 수 있는 기록 매체
WO2009054611A1 (en) System and method for managing information map
US20110072117A1 (en) Generating a Synthetic Table of Contents for a Volume by Using Statistical Analysis
KR101267918B1 (ko) 인터넷 리소스에 연결된 태그 정보에 관한 검색 결과를제공하는 장치, 방법 및 이를 구현할 수 있는 컴퓨터로읽을 수 있는 기록 매체
US20110307492A1 (en) Multi-region cluster representation of tables of contents for a volume
KR100942902B1 (ko) 웹페이지 검색 방법 및 상기 방법을 컴퓨터에서 구현하는 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체
KR100775852B1 (ko) 응용 프로그램의 자원 검색 시스템 및 방법
CN107818126B (zh) 一种面向Mongo数据库的全文信息检索方法
KR20030065860A (ko) 엑스엠엘 계층구조를 이용한 비디오 검색 시스템 및 그 방법
KR20070057579A (ko) 인터넷 리소스에 연결된 태그 정보에 관한 개인 로그정보를 제공하는 장치, 방법 및 이를 구현할 수 있는컴퓨터로 읽을 수 있는 기록 매체
Zakrzewska et al. Data mining techniques for portal participants profiling
KR20100018841A (ko) 플레이리스트 정보를 이용한 키워드 생성장치 및 그 방법