JP5929902B2 - 情報処理装置 - Google Patents

情報処理装置 Download PDF

Info

Publication number
JP5929902B2
JP5929902B2 JP2013508736A JP2013508736A JP5929902B2 JP 5929902 B2 JP5929902 B2 JP 5929902B2 JP 2013508736 A JP2013508736 A JP 2013508736A JP 2013508736 A JP2013508736 A JP 2013508736A JP 5929902 B2 JP5929902 B2 JP 5929902B2
Authority
JP
Japan
Prior art keywords
information
data
index
reference point
point information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013508736A
Other languages
English (en)
Other versions
JPWO2012137422A1 (ja
Inventor
章嗣 小倉
章嗣 小倉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Publication of JPWO2012137422A1 publication Critical patent/JPWO2012137422A1/ja
Application granted granted Critical
Publication of JP5929902B2 publication Critical patent/JP5929902B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/41Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0803Configuration setting
    • H04L41/0823Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability
    • H04L41/0826Configuration setting characterised by the purposes of a change of settings, e.g. optimising configuration for enhancing reliability for reduction of network costs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1004Server selection for load balancing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1004Server selection for load balancing
    • H04L67/1012Server selection for load balancing based on compliance of requirements or conditions with available server resources
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1004Server selection for load balancing
    • H04L67/1023Server selection for load balancing based on a hash applied to IP addresses or costs

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Description

本発明は、情報処理装置にかかり、特に、検索対象データのメタデータが複数のサーバに分散記憶されている場合において、各メタデータのインデックスを作成する機能を有する情報処理装置に関する。
近年、画像データや音声データ等のメディアデータを扱うシステムが広く利用されている。計算機の処理能力向上や、解析技術の進展、および監視システム等での安全性に対する要求等、機能面、要件面からも需要が高まっている。そのようなメディアデータ解析システムでは、メディアデータから人のいる領域を抽出したり、音声データをテキストデータに変換したりするなどの処理が行われる。
メディアデータを扱うシステムで課題となる機能として、類似データの検索が挙げられる。メディアデータ解析システムでは、例えば類似画像の検索や、音声の類似性の判定等のユースケースにおいて、大量に蓄積されているデータから、クエリデータと類似しているデータを取り出す必要がある。ここでの類似データとは、個々のデータ種別によって定義され、判定方法や類似性のしきい値は様々である。
メディアデータのような高次元データに対する類似データの検索では、より低い次元でよく用いられるツリー構造のインデックスでは問題となることがある。多次元のインデックスとして、KD-Treeのようなツリー型のインデックス構造がよく用いられる。ツリー構造のインデックスでは、ログオーダで検索を行なうことができ、次元が大きくない場合には十分効果的である。しかし、高次元データに対してツリー構造のインデックスを用いた場合、その分割した領域がスパース(sparse)になり、効率的な検索を行なうことができないことが問題となる。この問題は、例えば非特許文献3にて指摘されている。
また、非特許文献1では、高次元データの類似検索のため、リング構造を持ったインデックスであるMLRインデックスを提案している。このMLRインデックスは、データ点と距離関数で定義される距離空間にて用いることができる。このインデックス構造を使うと、クエリ点に対して、ある確率で類似データを効率的に見つけることができる。
そして、上記MLRインデックスでは、各リング点が、距離に応じた階層的なリング構造を持つ。そのリング階層は、中心から離れるとそのリングの半径が指数的に増えていくように構成されている。リング中には、非特許文献1の図1のように(k+1)個のリング点を持つ。リング点のうち、k個のリング点は、比較/検索対象となるリファレンス点である。類似点を検索する際には、これらのリファレンス点との距離を比較するようにして検索が行なわれる。
一方、リファレンス点以外の1個のリング点は、スペア点である。スペア点は、リファレンス点とは異なり検索時に比較対象とはならないが、リング点からリファレンス点の選択を行なう際に、その候補となる点である。このような構造を持つことにより、クエリ点に対する類似点を検索する際に、ログオーダでの検索を可能としている。
このリング構造インデックスを用いた検索は、次のように行なわれる。まず、ランダムにデータ点が選択されて、そのデータ点が持つリング構造インデックスが選択される。次に、クエリ点とデータ点との距離が計算され、その距離から、クエリ点が含まれるリングを選択する。そして、クエリ点と、選択したリング内の各リファレンス点との距離を計算し、クエリ点に最も近いリファレンス点を最近傍リファレンス点として選択する。この時、最近傍リファレンス点とクエリ点との距離が、中心にあるデータ点とクエリ点との距離よりも大きい場合には、データ点を類似点として返却する。一方、リファレンス点とクエリ点の距離が一定以内であれば、そのリファレンス点を類似点として返却する。また、上記以外の場合には、最近傍のリファレンス点をデータ点として選択し、探索処理を続ける。距離は徐々に近づいていくので、データ点が有限である場合には収束することがわかる。
そして、この検索に用いるリング構造インデックスを作成するには、リングに含まれるk個のリファレンス点の選択方法が重要となる。例えば、リファレンス点の選択方法が悪くて、クエリ点に対して十分に近いリファレンス点が見つからない場合には、類似点が見つからないことになってしまう。そのため、任意のクエリ点に対して、最近傍のリファレンス点との距離が小さくなるように、(k+1)個のリング点から、k個のリファレンス点を選択する必要がある。これを実現するために、非特許文献2では、リファレンス点iとリファレンス点jの距離を「dij」としたときに、[di1,di2,...,dik]というk次元の点k個と、原点とからなるk次元多面体の体積を最大化するように、リファレンス点を選択する。なお、このインデックスの構造は、非特許文献2で用いられている構造を元にしており、インデックスの探索方法や構築方法は、非特許文献2にて詳しく述べられている。
一方、メディアデータは、近年、その対象とするデータ量が増え続けており、スケールアウトによるデータベースの拡張が必要となる。メディアデータは、単体でもデータ量が大きいため、サーバの能力を拡張させる、すなわちスケールアップによる大量データへの対応では、対応するサーバが無いか、もしくは対応するサーバがあったとしても、非常に高価なものとなってしまう。そのため、複数のサーバを並列に動作させる、すなわちスケールアウトによる大量データへの対応が必要である。
Rahul Malik, Sangkyum Kim, Xin Jin, Chandrasekar Ramachandran,Jiawei Han, Indranil Gupta, and Klara Nahrstedt、"MLR-index: An Index Structurefor Fast and Scalable Similarity Search in High Dimensions"、SSDBM 2009Proceedings of the 21st International Conference on Scientific and StatisticalDatabase Management、 Springer-Verlag Berlin, Heidelberg、June 2-4, 2009、pp167 - 184 Bernard Wong, Aleksandrs Slivkins, Emin Gun Sirer、"Meridian: ALightweight Network Location Service without Virtual Coordinates"、SIGCOMM '05Proceedings of the 2005 conference on Applications, technologies,architectures, and protocols for computer communications、ACM New York, NY,USA、August22-26, 2005、pp85-96 Kevin Beyer, Jonathan Goldstein, Raghu Ramakrishnan, Uri Shaft、"When isnearest neighbor meaningful?"、ICDT '99 Proceedings of the 7th International Conference on DatabaseTheory、Springer-Verlag London, UK、January 10-12, 1999、Lecture Notes in Computer Science, 1999, Volume 1540/1999、pp217-235
しかしながら、非特許文献3で提案されているインデックスをそのまま複数サーバに分散させた場合には、サーバ間の通信が増加し、データ検索時の効率が低下する、という問題が生じる。これは、そのままデータを分散させた場合に、リファレンス点が他のサーバに保持されていると、リファレンス点を辿る際に通信が発生し、通信コストが増えてしまうためである。
このため、本発明の目的は、上述した課題である、検索対象となるデータが複数サーバ間で分散させたシステムにおいて、データ検索の効率低下という問題を解決することができる情報処理装置を提供することにある。
本発明の一形態である情報処理装置は、
複数のサーバに分散されて記憶される各インデックスデータであり、検索対象データの特徴を表すメタデータを含むデータ点情報毎に、当該データ点情報に対する予め設定された基準に基づく距離が予め設定された範囲内に位置する他の前記データ点情報をリファレンス点情報として関連付けた前記各インデックスデータを生成するインデックス生成手段と、
前記各インデックスデータを記憶した前記サーバ毎に、当該サーバに対して通信する際にかかる予め設定されたコストを表す通信コスト情報を記憶した通信コスト記憶手段と、を備え、
前記インデックス生成手段は、前記リファレンス点情報に対応する前記インデックスデータが記憶された前記サーバの前記通信コスト情報に基づいて、特定の前記データ点情報に対して関連付けを行う前記リファレンス点情報の選択を行う、
という構成を取る。
また、本発明の他の形態であるプログラムは、
各インデックスデータを記憶したサーバ毎に、当該サーバに対して通信する際にかかる予め設定されたコストを表す通信コスト情報を記憶した通信コスト記憶手段を備えた情報処理装置に、
複数のサーバに分散されて記憶される各インデックスデータであり、検索対象データの特徴を表すメタデータを含むデータ点情報毎に、当該データ点情報に対する予め設定された基準に基づく距離が予め設定された範囲内に位置する他の前記データ点情報をリファレンス点情報として関連付けた前記各インデックスデータを生成するインデックス生成手段を実現させると共に、
前記インデックス生成手段は、前記リファレンス点情報に対応する前記インデックスデータが記憶された前記サーバの前記通信コスト情報に基づいて、特定の前記データ点情報に対して関連付けを行う前記リファレンス点情報の選択を行う、
ことを実現させるためのプログラムである。
また、本発明の他の形態である情報処理方法は、
各インデックスデータを記憶したサーバ毎に、当該サーバに対して通信する際にかかる予め設定されたコストを表す通信コスト情報を記憶した通信コスト記憶手段を備えた情報処理装置にて、
複数のサーバに分散されて記憶される各インデックスデータであり、検索対象データの特徴を表すメタデータを含むデータ点情報毎に、当該データ点情報に対する予め設定された基準に基づく距離が予め設定された範囲内に位置する他の前記データ点情報をリファレンス点情報として関連付けた前記各インデックスデータを生成する際に、前記リファレンス点情報に対応する前記インデックスデータが記憶された前記サーバの前記通信コスト情報に基づいて、特定の前記データ点情報に対して関連付けを行う前記リファレンス点情報の選択を行う、
という構成を取る。
本発明は、以上のように構成されることにより、検索対象となるデータが複数サーバ間で分散させたシステムにおいて、データ検索の効率の向上を図ることができる。
本発明における情報処理システムの全体構成を示すブロック図である。 図1に開示した検索クライアントとデータ保持サーバの構成を示す機能ブロック図である。 本発明で用いるインデックスの構成を示す模式図である。 図1に開示したデータ保持サーバによるインデックス構築処理の動作を示すフローチャートである。 図1に開示した検索クライアントによる検索処理の動作を示すフローチャートである。 図1に開示したデータ保持サーバによるインデックスを用いた検索処理の動作を示すフローチャートである。 インデックス作成処理の一例を説明するための図である。 リファレンス作成処理の一例を説明するための図である。
本発明の第1の実施形態を、図1乃至図6を参照して説明する。図1乃至図3は、情報処理システムの構成を説明するための図であり、図4乃至図6は、情報処理システムの動作を説明するための図である。
なお、本実施形態における情報処理システムは、画像データや音声データ等のメディアデータの類似検索を行うシステムであり、検索対象となるデータのインデックスが複数のサーバに分散して記憶されている構成のものを説明する。但し、本発明における情報処理システムは、メディアデータの類似検索を行うシステムであることに限定されず、いかなるデータの検索を行うシステムであってもよい。
[構成]
図1に示すように、本実施形態における情報処理システムは、プログラム制御により動作する検索クライアント(中央処理装置;プロセッサ;データ処理装置)100と、プログラム制御により動作する複数のデータ保持サーバ(中央処理装置;プロセッサ;データ処理装置)200と、その検索クライアント100と複数のデータ保持サーバ200との間で通信を行なうためのネットワーク300から構成される。
検索クライアント100は、ネットワーク300に接続された情報処理端末であり、図2に示すように、サーバ情報保持手段101と、サーバ選択手段102と、検索要求発行手段103とを備えている。これらの手段は、それぞれ概略次のように動作する。
上記サーバ情報保持手段101は、複数のデータ保持サーバ200のアドレスなどのデータである要求先データを保持する。サーバ情報所持手段101は、この保持している複数のデータ保持サーバ200の要求先データを、サーバ選択手段102からの要求に応じて渡す。
上記サーバ選択手段102は、サーバ情報保持手段101の持つ複数のデータ保持サーバ200の要求先データを受け取り、その中から適切なデータ保持サーバ200の要求先データを選択する。適切なデータ保持サーバ200の要求先データを選択する方法は、複数のデータ保持サーバ200に対して、均等に検索クライアントからの要求が届くようにすればよい。例えば、データ保持サーバ200の負荷状況によって、最も負荷が小さいデータ保持サーバ200を選択してもよいし、また例えば、ランダムにデータ保持サーバ200を選択するようにしてもよい。
上記検索要求発行手段103は、入力されたクエリとの類似データの検索要求を、サーバ選択手段102によって選択されたデータ保持サーバ200の要求先に対して発行する。この検索要求発行手段103から発行された検索要求に対しては、後述するデータ保持サーバ200から、検索して発見された類似データ、もしくは、検索失敗との結果、が返却されるため、その結果を入力元に返却する。
次に、データ保持サーバ200の構成について説明する。データ保持サーバ200は、演算装置と記憶装置とを備えた情報処理装置であり、図2に示すように、検索要求受付手段201と、検索手段202と、リング構造保持手段203と、データ保持手段204と、検索要求転送手段205と、リング構造計算手段206と、転送コスト保持手段207とから構成される。なお、データ保持サーバ200は、後述するように、データ保持手段204に検索対象となるデータ本体を記憶し、リング構造保持手段203に検索の際に用いるインデックスを記憶しているが、上記リング構造計算手段206や転送コスト保持手段207は、データ本体やインデックスが記憶されている同一の情報処理装置に装備されている必要はなく、他の情報処理装置に装備されていてもよい。
上記検索要求受付手段201は、検索クライアント100、または、他のデータ保持サーバ200から送信された検索要求を受け取り、類似データの検索を検索手段202に依頼する。また、検索要求受付手段201は、検索手段202から検索結果が得られた後に、検索要求の要求元である、検索クライアント100、または、他のデータ保持サーバ200に結果を返却する。
上記検索手段202は、検索要求受付手段201から受け取った類似データの検索要求に従い、類似データ検索を実行する。このとき、検索手段202は、リング構造保持手段203が保持する類似データ検索のためのインデックスを用いて類似データの検索を行い、例えば、予め設定された基準に従って、検索要求に含まれる条件と類似するデータの検索を行う。そして、リング構造保持手段203が保持する類似データ検索のためのインデックスを用いて類似データが見つかった場合には、データ保持手段204から対象となるデータを取得し、結果として返却する。なお、詳しい検索処理フローは、後の動作説明時に説明する。
上記リング構造保持手段203(インデックス記憶手段)は、類似検索のためのインデックスとしてリング構造インデックスを保持する。リング構造保持手段203が保持するリング構造インデックスは、リング構造計算手段206によって作成される。そして、リング構造保持手段203が保持するリング構造インデックスは、検索手段202によって、検索要求に対応する類似データを検索する際に利用される。
上記データ保持手段204は、リング構造保持手段203によって管理されるリング構造インデックスが指し示すデータ本体、つまり、リング構造インデックスの中心に位置する後述するデータ点が参照するデータ本体を保持する。ここで、上記リング構造保持手段203が管理しているインデックスは、あくまでメタデータであることが多く、求められているデータ本体とは異なることがある。そのため、データ保持手段204では、リング構造保持手段203によって管理されるインデックスが指し示すデータのデータ本体を保持し、検索手段202の要求に応じて、そのデータ本体を返却する。
上記検索要求転送手段205は、後述するように、検索要求に対応する類似データとなるリファレンス点を中心としたリング構造インデックスを、上記検索手段202にて検索処理を行った自己のサーバではない他のデータ保持サーバ200が持つ場合に、当該他のデータ保持サーバ200に検索要求を転送する。ここで、1つのデータ保持サーバ200のリング構造保持手段203が管理するインデックスは、全てのデータに対するインデックスを持っているわけではない。従って、他のデータ保持サーバ200が保持するデータのインデックスに関しては、その検索要求を転送し、類似検索の処理を他のデータ保持サーバ200で続行する必要がある。このとき、リング構造保持手段203が管理するインデックスには、他のデータ保持サーバ200が保持するデータについてどの他のデータ保持サーバ200が保持しているかという関係を表す情報を持っているため、その関係情報を用いて、検索要求を転送する。
上記リング構造計算手段206(インデックス生成手段)は、後述するように、検索対象データ毎にリング構造インデックスを作成し、リング構造保持手段203に渡す。このリング構造計算手段206は、類似検索のためのリング構造インデックスを、データ、データ間の距離を計算する距離関数、および、複数のデータ保持サーバ200間での処理の転送コスト、から計算する。ここで、リング構造インデックスを計算する対象となるデータは、自サーバ200のデータ保持手段204にて保持されているものであり、このデータのメタデータに対して予め設定された基準に基づく距離が予め設定された範囲内に位置する他のデータを関連付けたインデックスを計算する。また、データ間の距離を計算する距離関数は、ベクトル空間におけるユークリッド距離を用いてもよいし、データ種別によって変更するように構成しても構わない。この計算手順は、処理フローの説明にて述べる。
上記転送コスト保持手段207(通信コスト記憶手段)は、リング構造計算手段206が類似検索のためのリング構造インデックスを計算するために用いる、複数のデータ保持サーバ200間での処理の際に生じる予め設定された転送コストを表すコスト値を保持している。この複数のデータ保持サーバ200間での処理のコスト値は、定数値でも良いし、データ保持サーバ200のネットワーク接続構成を反映して個別のデータ保持サーバ200間毎に異なる値を定義してもよい。例えば、コスト値は、データ保持サーバ200間で通信した場合にかかる通信時間、ある基準値に対する遅延時間などである。このとき、通信時間や遅延時間は、各データ保持サーバ200間におけるネットワーク接続構成や処理能力差に応じた値であってもよい。
次に、図3には、類似検索のためのリング構造インデックスを示す。図3を参照すると、類似検索のためのリング構造インデックスは、中心にあって黒丸で表されるデータ点401と、周辺にあって斜線の点で表されるリファレンス点402と、周辺にあって白丸で表されるスペア点403と、データ点401を中心とした同心円状に描かれているリング411,412,413とからなる。なお、ここでは、二次元に各点の配置をマッピングしているが、図示する都合上の表現であり、必ずしも二次元データに限定する必要はない。
上記データ点401は、検索対象データに対応する点情報であり、当該検索対象データに対応するリング構造インデックスの中心に位置する。そして、データ点401は、対応する検索対象データの特徴を表す情報として距離空間におけるメタデータと、データ本体への参照データとを持つ。ここでは、データ本体への参照データ等については説明しない。
また、上記リファレンス点402とスペア点403は、上記データ点401とは異なる他の検索対象データに対応する点情報であり、上記同様に、その検索対象データの特徴を表すメタデータと、データ本体への参照データを持つ。そして、リファレンス点402とスペア点403は、データ点401との距離、つまり、データ点401に対するメタデータの距離に応じて、リング構造インデックス内にマッピングされている。例えば、データ点401に対して予め設定された基準に基づく距離が予め設定された範囲内に位置するリファレンス点402とスペア点403が、リング構造インデックス内にマッピングされ、中心に位置するデータ点401に関連付けられている。また、リファレンス点402とスペア点403は、自己の点を中心としたリング構造インデックスが記憶されているデータ保持サーバ200の情報を記憶しており、他の点との距離計算を行なうためのデータを保持している。なお、リファレンス点402とスペア点403を合わせて、リング点と呼ぶ。
上記リング411、リング412、リング413は、データ点401から一定の距離を持つ点の集合である。これらのリングは、データ点401に近いリングから数えた数を「i」とした場合、その距離がαs(i−1)となるように配置されている。すなわち、最もデータ点401に近いリングであるリング411のデータ点401からの距離はαであり、次にデータ点401に近いリングであるリング412のデータ点401からの距離はαsであり、そして、リング413のデータ点401からの距離はαsである。
なお、各リング411,412,413に挟まれたリファレンス点402の数は、予め設定された数である「k」個以内に制限される。例えば、「k」の数が「4」として設定されている場合、リング412とリング413に挟まれた領域内に含まれるリファレンス点402は、最大でも4個となる。そして、リファレンス点402は、リング構造インデックスを作成する際に、当該リング構造インデックスの中心となるデータ点401に対してリファレンス点として保持するべきかが判断され、リング構造インデックス内の各リング間の領域内で「k」個になるように調整される。また、各リング411,412,413に挟まれたスペア点403は、例えば、「1」個に制限される。これは、リング構造インデックスを作成する際に、リファレンス点として選択されなかった点をスペア点とし、また、その際に「1」個となるように調整される。
以上のようなリング構造インデックス(インデックスデータ)が、検索対象データ毎に当該検索対象データに対応するデータ点を中心としてそれぞれ生成される。そして、各リング構造インデックスは、対応する検索対象データのデータ本体と共に、各データ保持サーバ200に分散されて記憶されている。
[動作]
次に、図4及び図5のフローチャートを参照して、上述した情報処理システムの全体の動作について詳細に説明する。動作のフローは、図4が示すリング構造インデックスの計算フローと、図5A,5Bが示す類似データの検索フローからなる。各処理フローは独立しているため、個別に説明を行なう。
まず、リング構造計算手段206が、リング構造計算要求を受信する(ステップA101)。リング構造計算要求を受信したリング構造計算手段206は、保持しているデータに対して処理を開始する。この処理は、各データ点を中心した各リング構造インデックスが持つリファレンス点402の選択を行なう処理である。なお、以下では、一つのデータ点に対する処理のみを記述するが、以下の処理が、自己であるデータ保持サーバ200が記憶している検索対象データのメタデータ等を含むデータ点毎に行われ、各リング構造インデックスを生成して記憶保持する。
続いて、リング構造計算手段206は、データ点401を中心とした全てのリング間でリファレンス点402の選択処理を行ったかを確認する(ステップA102)。もし、このときに、全てのリング間で計算を行なってリファレンス点402を選択していた場合には、そのデータ点401に対するリング構造インデックス作成処理を終了する(ステップA110)。
一方、ステップA102で、対象となるデータ点401を中心とした全てのリング間でリファレンス点402の選択処理を完了していない場合には、未計算のリング間を選択し(ステップA103)、そのリングに含まれるリング点間の距離を全て計算する(ステップA104)。ここで、リファレンス点候補の数が「k」個に絞れている場合には、そのリファレンス点情報を保存して、ステップA102に戻る(ステップA105)。
ステップA105でリファレンス点候補が「k」個に絞れていない場合には、各リファレンス点候補間の距離から構成される多面体の体積が大きくなるよう、リファレンス点候補を選択する。具体的には、リファレンス点候補iとリファレンス点候補jとの距離を「dij」とし、リファレンス点候補の数をnとしたとき、そのn次元空間上の点piの座標を[di0,di1,di2,...,dij,...,din]とする。ここで、dii=0である。これにより、各リファレンス点候補iに対してpiを定義することができ、このpiと原点から構成されるn次元空間上の多面体の体積を、最大化することを考える。各リファレンス点の距離が小さくなると多面体の体積も小さくなるため、できるだけ大きな多面体を構成するようにリファレンス点を選択することで、リング間上のどこにクエリ点があったとしても、そのクエリ点に近いリファレンス点を見つけやすくなる。できるだけ大きな多面体の体積を構成するリファレンス点の候補集合を見つけるためには、全てのリファレンス点候補の組み合わせに対して、多面体の体積を計算する必要がある。但し、このように組み合わせを全て計算すると計算量が大きくなってしまうために、本実施形態では、以下のような単純化した方法を用いる。
まず、n個のリファレンス点候補の内、各リファレンス点候補を外した際の(n−1)次元空間上の多面体の体積をそれぞれ求める(ステップA105)。具体的には、1つのリファレンス点piを外した場合、(n−1)次元空間の点pjの座標は、[dj0,dj1,...,dj(i-1),dj(i+1),...,djn]となる。このような点から多面体を構成し、その体積を求めることとなる。ここで、リファレンス点候補iを外した際の多面体の体積を、「V(-i)」とする。
次に、各計算された多面体の体積に、リファレンス点候補から外したリング点に対応するコスト値を加算する(ステップA107)。ここで、コスト値は、リング点に対応するリング構造インデックスデータが記憶されたデータ保持サーバ200に応じて事前に設定され、上述したように転送コスト保持手段207に記憶されている値である。そして、リファレンス点候補iに対するコスト値を「ci」とすると、上記で求める値は「V(-i)+ci」である。このとき、コスト値「ci」として、データ点401に対応するデータ保持サーバ200とリファレンス点候補iに対応するデータ保持サーバ200との間における値が記憶されている場合には、かかる値を用いる。
そして、ステップA107の結果である「V(-i)+ci」の値が最も大きいリファレンス点候補iを、リファレンス候補から外す(ステップA108)。ここで外されるリファレンス点候補は、その点を外した際に多面体の体積に与える影響が少ない点であるか、その点に対するコストが高い点である、という性質を持つ。その結果として、参照コストが小さく、かつ任意のクエリ点と近い点がみつかりやすいような、リファレンス点の集合が選択され、リファレンス点候補の数が「k」個に絞れると(ステップA105)、そのリファレンス点情報を保存する(ステップA109)。
次に、図5A,5Bのフローチャートを参照して、類似データを検索する処理フローを示す。類似データを検索するフローは、検索クライアント100におけるフロー(図5A)と、データ保持サーバ200におけるフロー(図5B)から構成される。
まず、検索を始める際に、サーバ情報保持手段101からサーバリストを取得する(ステップB101)。そして、サーバ選択手段102が、ステップB101にて取得したサーバリストから、検索要求を発行するデータ保持サーバ200を選択する(ステップB102)。
次に、検索要求発行手段103は、ステップB102で選択されたデータ保持サーバ200に検索要求を発行する(ステップB103)。最後に、検索要求発行手段103は、発行した検索要求の結果を、データ保持サーバ200から受信する(ステップB104)。
次に、データ保持サーバ200における類似データ検索フローを、図5Bを参照して説明する。データ保持サーバ200が検索要求を受信すると(ステップC101)、リング構造保持手段203にて保持されているリング構造インデックスから、ランダムにデータ点を選択する(ステップC102)。
データ点が選択されると、選択されたデータ点とクエリ点との距離を計算する(ステップC103)。距離の計算方法は、事前に決まっているとする。この距離を「d」と置いたとき、「αs(i−1)<d≦αs」となるリングを選択する(ステップC104)。これは、クエリ点が含まれるリングを選択することである。
そして、選択中のリングに含まれるk個のリファレンス点を全て取得し、クエリ点とその選択中のリングに含まれるk個の全てのリファレンス点との距離を計算し、最もクエリ点と近いリファレンス点を選択する(ステップC105)。
ここで、クエリ点と選択されたリファレンス点の距離が、クエリ点とデータ点との距離よりも大きいかどうかを比較する(ステップC106)。もし、クエリ点と選択されたリファレンス点の距離が、クエリ点とデータ点との距離よりも大きい場合には、クエリ点は、リファレンス点よりもデータ点と近いということになり、データ点を類似データとして検索処理を終了する(ステップC109)。一方、クエリ点と選択されたリファレンス点の距離が、クエリ点とデータ点との距離以下の場合には、そのクエリ点と選択されたリファレンス点との距離がしきい値以下であるかを判断する(ステップC107)。その結果、しきい値以下であった場合には、選択中のリファレンス点を類似データとして検索処理を終了する(ステップC110)。一方、しきい値以下でなかった場合には、探索処理を継続する必要があり、その場合には、選択中のリファレンス点をデータ点として、再度処理を行なう。このとき、選択したデータ点は、別のデータ保持サーバ200に存在する可能性があるため、その場合には、その他のデータ保持サーバ200に処理要求を転送する(ステップC108)。
以上のように、本実施形態における情報処理装置では、リング構造インデックスを構築する際に、サーバ間の処理の転送コストを考慮してインデックスを構築するように処理を行なうため、検索処理を行なう際にサーバ間での処理の転送コストを減らすことができ、検索処理時間を短くすることができる。
[実施例]
次に、上述した情報処理システムを用いた具体的な実施例を説明する。なお、ここでは、リング構造インデックスの作成処理についてのみを説明することとする。
図6A,6Bには、本実施例で用いるデータ表現を示す。図6Aに示すデータ点E101は、n個のデータである。この例では、各データは、30次元のベクトルデータとして表されている。このベクトルデータに対し、ユークリッド距離を距離関数として用いるとする。また、k=3、l=4とする。
リング構造インデックスの作成時に、上述したステップA103でリングが選択されると、リング点間距離を算出する。ここで、リング点iとリング点jの距離を「dij」と置く。以降では、7個のリング点の中から、3個のリファレンス点を選択する処理を行なうこととする。
上述したステップA106では、各リング点の距離をその次元の値として持つ点から構成される多次元多面体の体積を求める。ここで、データ点1からデータ点7までがリファレンス候補のリング点として選択されているとき、図6BのE103では、データ点7を外した際の多面体を構成する原点以外の頂点を示している。例えば、点p1は、1次元目の値が「0」で、二次元目の値が「d1 2」であることを示している。このような点から構成される多面体の体積は、一般的に知られている多次元多面体の体積を求める方法で求める、あるいは、近似することができる。ここで、データ点iを除いた多次元多面体の体積を「V(-i)」と表わすこととする。例えば、データ点7を除いた多次元多面体の体積は、「V(-7)」となる。
次に、各データ点に対して、そのデータ点を除いた距離で定義される点を頂点とする多次元多面体の体積が求まった後、その体積とコスト値を足し合わせ、最大となるデータ点を選択する。図6AのE102には、その一般的な式を示す。かかる式に基づいてE102を満たすような「i」を選択し、ここではデータ点5が選択されたとすると、このデータ点5をリファレンス点の候補から外す。
続いて、データ点5をリファレンス点の候補から外すと、当初7個あったリファレンス点候補は6個となる。図6BのE104には、データ点5がリファレンス点の候補から外された後に、データ点7を外した際の多面体を構成する原点以外の頂点を示している。
以上のように処理を行ない、リファレンス点の候補を3個に絞ると、リファレンス点の選択処理が終わる。このような処理を全てのリング間、および全てのデータ点に対して行ない、リング構造インデックスを生成する
<付記>
上記実施形態の一部又は全部は、以下の付記のようにも記載されうる。以下、本発明における情報処理装置等の構成の概略を説明する。但し、本発明は、以下の構成に限定されない。
(付記1)
複数のサーバに分散されて記憶される各インデックスデータであり、検索対象データの特徴を表すメタデータを含むデータ点情報毎に、当該データ点情報に対する予め設定された基準に基づく距離が予め設定された範囲内に位置する他の前記データ点情報をリファレンス点情報として関連付けた前記各インデックスデータを生成するインデックス生成手段と、
前記各インデックスデータを記憶した前記サーバ毎に、当該サーバに対して通信する際にかかる予め設定されたコストを表す通信コスト情報を記憶した通信コスト記憶手段と、を備え、
前記インデックス生成手段は、前記リファレンス点情報に対応する前記インデックスデータが記憶された前記サーバの前記通信コスト情報に基づいて、特定の前記データ点情報に対して関連付けを行う前記リファレンス点情報の選択を行う、
情報処理装置。
(付記2)
付記1に記載の情報処理装置であって、
前記インデックス生成手段は、前記リファレンス点情報に対応する前記インデックスデータが記憶された前記サーバの前記通信コスト情報に基づいて、前記特定のデータ点情報に対して関連付ける予め設定された数の前記リファレンス点情報を選択する、
情報処理装置。
(付記3)
付記1又は2に記載の情報処理装置であって、
前記インデックス生成手段は、前記特定のデータ点情報に対して前記リファレンス点情報の候補となる前記他のデータ点情報であるリファレンス点候補情報のうち、一の前記リファレンス点候補情報を除き、残りの前記リファレンス点候補情報の1つを基準として他の前記リファレンス点候補情報との距離を座標とした座標点を算出すると共に、前記残りのリファレンス点候補情報のそれぞれを基準としたときに算出される各前記座標点を頂点とする多面体の体積を算出し、この算出した体積と、前記除かれた一のリファレンス点候補情報に対応する前記インデックスデータが記憶された前記サーバの前記通信コスト情報と、に基づいて、前記特定のデータ点情報に対して関連付けを行う前記リファレンス点情報の選択を行う、
情報処理装置。
(付記4)
付記3に記載の情報処理装置であって、
前記インデックス生成手段は、前記算出した体積に、前記除かれた一のリファレンス点候補情報に対応する前記インデックスデータが記憶された前記サーバの前記通信コスト情報を加算した値が、他の前記リファレンス点候補情報を除いたときの値と比較して最も大きい値である場合の前記除かれた一のリファレンス点候補情報を、前記特定のデータ点情報に対して関連付けを行う前記リファレンス点情報から除いて当該リファレンス情報の選択を行う、
情報処理装置。
(付記5)
付記1乃至4のいずれかに記載の情報処理装置であって、
前記通信コスト記憶手段は、前記各インデックスデータを記憶した前記サーバ毎における前記通信コスト情報として、各サーバ間において通信する際にかかる予め設定されたコストを表す通信コスト情報を記憶し、
前記インデックス生成手段は、前記特定のデータ点情報に対応する前記インデックスデータが記憶された前記サーバと、前記リファレンス点情報の候補となる前記他のデータ点情報に対応する前記インデックスデータが記憶された前記サーバと、の間における前記通信コスト情報に基づいて、前記特定のデータ点情報に対して関連付けを行う前記リファレンス点情報の選択を行う、
情報処理装置。
(付記6)
付記5に記載の情報処理装置であって、
前記通信コスト記憶手段は、前記各インデックスデータを記憶した前記サーバ毎における前記通信コスト情報として、各サーバ間における処理能力差に応じて生じる当該各サーバ間において通信する際にかかる予め設定されたコストを表す情報を記憶する、
情報処理装置。
(付記7)
付記1乃至6のいずれかに記載の情報処理装置であって、
所定の前記データ点情報に対応する前記インデックスデータを記憶するインデックス記憶手段と、
前記検索対象データに対する検索要求を受け付ける検索要求受付手段と、
前記インデックス記憶手段に記憶された前記インデックスデータ内から、予め設定された基準に従って前記検索要求受付手段にて受け付けた前記検索要求に対応する前記データ点情報を検索する検索手段と、
前記検索手段にて前記インデックス記憶手段に記憶された前記インデックスデータ内に、予め設定された基準に従って前記検索要求受付手段にて受け付けた前記検索要求に対応する前記データ点情報がない場合に、前記検索要求を他の情報処理装置に転送する検索要求転送手段と、
を備えた情報処理装置。
(付記8)
各インデックスデータを記憶したサーバ毎に、当該サーバに対して通信する際にかかる予め設定されたコストを表す通信コスト情報を記憶した通信コスト記憶手段を備えた情報処理装置に、
複数のサーバに分散されて記憶される各インデックスデータであり、検索対象データの特徴を表すメタデータを含むデータ点情報毎に、当該データ点情報に対する予め設定された基準に基づく距離が予め設定された範囲内に位置する他の前記データ点情報をリファレンス点情報として関連付けた前記各インデックスデータを生成するインデックス生成手段を実現させると共に、
前記インデックス生成手段は、前記リファレンス点情報に対応する前記インデックスデータが記憶された前記サーバの前記通信コスト情報に基づいて、特定の前記データ点情報に対して関連付けを行う前記リファレンス点情報の選択を行う、
ことを実現させるためのプログラム。
(付記9)
付記8に記載のプログラムであって、
前記インデックス生成手段は、前記特定のデータ点情報に対して前記リファレンス点情報の候補となる前記他のデータ点情報であるリファレンス点候補情報のうち、一の前記リファレンス点候補情報を除き、残りの前記リファレンス点候補情報の1つを基準として他の前記リファレンス点候補情報との距離を座標とした座標点を算出すると共に、前記残りのリファレンス点候補情報のそれぞれを基準としたときに算出される各前記座標点を頂点とする多面体の体積を算出し、この算出した体積と、前記除かれた一のリファレンス点候補情報に対応する前記インデックスデータが記憶された前記サーバの前記通信コスト情報と、に基づいて、前記特定のデータ点情報に対して関連付けを行う前記リファレンス点情報の選択を行う、
プログラム。
(付記10)
各インデックスデータを記憶したサーバ毎に、当該サーバに対して通信する際にかかる予め設定されたコストを表す通信コスト情報を記憶した通信コスト記憶手段を備えた情報処理装置にて、
複数のサーバに分散されて記憶される各インデックスデータであり、検索対象データの特徴を表すメタデータを含むデータ点情報毎に、当該データ点情報に対する予め設定された基準に基づく距離が予め設定された範囲内に位置する他の前記データ点情報をリファレンス点情報として関連付けた前記各インデックスデータを生成する際に、前記リファレンス点情報に対応する前記インデックスデータが記憶された前記サーバの前記通信コスト情報に基づいて、特定の前記データ点情報に対して関連付けを行う前記リファレンス点情報の選択を行う、
情報処理方法。
(付記11)
付記10に記載の情報処理方法であって、
前記各インデックスデータを生成する際に、前記特定のデータ点情報に対して前記リファレンス点情報の候補となる前記他のデータ点情報であるリファレンス点候補情報のうち、一の前記リファレンス点候補情報を除き、残りの前記リファレンス点候補情報の1つを基準として他の前記リファレンス点候補情報との距離を座標とした座標点を算出すると共に、前記残りのリファレンス点候補情報のそれぞれを基準としたときに算出される各前記座標点を頂点とする多面体の体積を算出し、この算出した体積と、前記除かれた一のリファレンス点候補情報に対応する前記インデックスデータが記憶された前記サーバの前記通信コスト情報と、に基づいて、前記特定のデータ点情報に対して関連付けを行う前記リファレンス点情報の選択を行う、
情報処理方法。
以上、上記各実施形態を参照して本願発明を説明したが、本願発明は、上述した実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明の範囲内で当業者が理解しうる様々な変更をすることができる。
なお、本発明は、日本国にて2011年4月5日に特許出願された特願2011−083386の特許出願に基づく優先権主張の利益を享受するものであり、当該特許出願に記載された内容は、全て本明細書に含まれるものとする。
100 検索クライアント
101 サーバ情報保持手段
102 サーバ選択手段
103 検索要求発行手段
200 データ保持サーバ
201 検索要求受付手段
202 検索手段
203 リング構造保持手段
204 データ保持手段
205 検索要求転送手段
206 リング構造計算手段
207 転送コスト保持手段
300 ネットワーク

Claims (10)

  1. 複数のサーバに分散されて記憶される各インデックスデータであり、検索対象データの特徴を表すメタデータを含むデータ点情報毎に、当該データ点情報に対する予め設定された基準に基づく距離が予め設定された範囲内に位置する他の前記データ点情報をリファレンス点情報として関連付けた前記各インデックスデータを生成するインデックス生成手段と、
    前記各インデックスデータを記憶した前記サーバ毎に、当該サーバに対して通信する際にかかる予め設定されたコストを表す通信コスト情報を記憶した通信コスト記憶手段と、を備え、
    前記インデックス生成手段は、前記リファレンス点情報に対応する前記インデックスデータが記憶された前記サーバの前記通信コスト情報に基づいて、特定の前記データ点情報に対して関連付けを行う前記リファレンス点情報の選択を行う、
    情報処理装置。
  2. 請求項1に記載の情報処理装置であって、
    前記インデックス生成手段は、前記リファレンス点情報に対応する前記インデックスデータが記憶された前記サーバの前記通信コスト情報に基づいて、前記特定のデータ点情報に対して関連付ける予め設定された数の前記リファレンス点情報を選択する、
    情報処理装置。
  3. 請求項1又は2に記載の情報処理装置であって、
    前記インデックス生成手段は、前記特定のデータ点情報に対して前記リファレンス点情報の候補となる前記他のデータ点情報であるリファレンス点候補情報のうち、一の前記リファレンス点候補情報を除き、残りの前記リファレンス点候補情報の1つを基準として他の前記リファレンス点候補情報との距離を座標とした座標点を算出すると共に、前記残りのリファレンス点候補情報のそれぞれを基準としたときに算出される各前記座標点を頂点とする多面体の体積を算出し、この算出した体積と、前記除かれた一のリファレンス点候補情報に対応する前記インデックスデータが記憶された前記サーバの前記通信コスト情報と、に基づいて、前記特定のデータ点情報に対して関連付けを行う前記リファレンス点情報の選択を行う、
    情報処理装置。
  4. 請求項3に記載の情報処理装置であって、
    前記インデックス生成手段は、前記算出した体積に、前記除かれた一のリファレンス点候補情報に対応する前記インデックスデータが記憶された前記サーバの前記通信コスト情報を加算した値が、他の前記リファレンス点候補情報を除いたときの値と比較して最も大きい値である場合の前記除かれた一のリファレンス点候補情報を、前記特定のデータ点情報に対して関連付けを行う前記リファレンス点情報から除いて当該リファレンス情報の選択を行う、
    情報処理装置。
  5. 請求項1乃至4のいずれかに記載の情報処理装置であって、
    前記通信コスト記憶手段は、前記各インデックスデータを記憶した前記サーバ毎における前記通信コスト情報として、各サーバ間において通信する際にかかる予め設定されたコストを表す通信コスト情報を記憶し、
    前記インデックス生成手段は、前記特定のデータ点情報に対応する前記インデックスデータが記憶された前記サーバと、前記リファレンス点情報の候補となる前記他のデータ点情報に対応する前記インデックスデータが記憶された前記サーバと、の間における前記通信コスト情報に基づいて、前記特定のデータ点情報に対して関連付けを行う前記リファレンス点情報の選択を行う、
    情報処理装置。
  6. 請求項5に記載の情報処理装置であって、
    前記通信コスト記憶手段は、前記各インデックスデータを記憶した前記サーバ毎における前記通信コスト情報として、各サーバ間における処理能力差に応じて生じる当該各サーバ間において通信する際にかかる予め設定されたコストを表す情報を記憶する、
    情報処理装置。
  7. 請求項1乃至6のいずれかに記載の情報処理装置であって、
    所定の前記データ点情報に対応する前記インデックスデータを記憶するインデックス記憶手段と、
    前記検索対象データに対する検索要求を受け付ける検索要求受付手段と、
    前記インデックス記憶手段に記憶された前記インデックスデータ内から、予め設定された基準に従って前記検索要求受付手段にて受け付けた前記検索要求に対応する前記データ点情報を検索する検索手段と、
    前記検索手段にて前記インデックス記憶手段に記憶された前記インデックスデータ内に、予め設定された基準に従って前記検索要求受付手段にて受け付けた前記検索要求に対応する前記データ点情報がない場合に、前記検索要求を他の情報処理装置に転送する検索要求転送手段と、
    を備えた情報処理装置。
  8. 各インデックスデータを記憶したサーバ毎に、当該サーバに対して通信する際にかかる予め設定されたコストを表す通信コスト情報を記憶した通信コスト記憶手段を備えた情報処理装置に、
    複数のサーバに分散されて記憶される各インデックスデータであり、検索対象データの特徴を表すメタデータを含むデータ点情報毎に、当該データ点情報に対する予め設定された基準に基づく距離が予め設定された範囲内に位置する他の前記データ点情報をリファレンス点情報として関連付けた前記各インデックスデータを生成するインデックス生成手段を実現させると共に、
    前記インデックス生成手段は、前記リファレンス点情報に対応する前記インデックスデータが記憶された前記サーバの前記通信コスト情報に基づいて、特定の前記データ点情報に対して関連付けを行う前記リファレンス点情報の選択を行う、
    ことを実現させるためのプログラム。
  9. 各インデックスデータを記憶したサーバ毎に、当該サーバに対して通信する際にかかる予め設定されたコストを表す通信コスト情報を記憶した通信コスト記憶手段及びインデックス生成手段を備えた情報処理装置にて、
    前記インデックス生成手段が、複数のサーバに分散されて記憶される各インデックスデータであり、検索対象データの特徴を表すメタデータを含むデータ点情報毎に、当該データ点情報に対する予め設定された基準に基づく距離が予め設定された範囲内に位置する他の前記データ点情報をリファレンス点情報として関連付けた前記各インデックスデータを生成すると共に、前記各インデックスデータを生成する際に、前記リファレンス点情報に対応する前記インデックスデータが記憶された前記サーバの前記通信コスト情報に基づいて、特定の前記データ点情報に対して関連付けを行う前記リファレンス点情報の選択を行う、
    情報処理方法。
  10. 請求項9に記載の情報処理方法であって、
    前記インデックス生成手段が、前記各インデックスデータを生成する際に、前記特定のデータ点情報に対して前記リファレンス点情報の候補となる前記他のデータ点情報であるリファレンス点候補情報のうち、一の前記リファレンス点候補情報を除き、残りの前記リファレンス点候補情報の1つを基準として他の前記リファレンス点候補情報との距離を座標とした座標点を算出すると共に、前記残りのリファレンス点候補情報のそれぞれを基準としたときに算出される各前記座標点を頂点とする多面体の体積を算出し、この算出した体積と、前記除かれた一のリファレンス点候補情報に対応する前記インデックスデータが記憶された前記サーバの前記通信コスト情報と、に基づいて、前記特定のデータ点情報に対して関連付けを行う前記リファレンス点情報の選択を行う、
    情報処理方法。
JP2013508736A 2011-04-05 2012-03-15 情報処理装置 Active JP5929902B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2011083386 2011-04-05
JP2011083386 2011-04-05
PCT/JP2012/001805 WO2012137422A1 (ja) 2011-04-05 2012-03-15 情報処理装置

Publications (2)

Publication Number Publication Date
JPWO2012137422A1 JPWO2012137422A1 (ja) 2014-07-28
JP5929902B2 true JP5929902B2 (ja) 2016-06-08

Family

ID=46968838

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013508736A Active JP5929902B2 (ja) 2011-04-05 2012-03-15 情報処理装置

Country Status (4)

Country Link
US (1) US9292555B2 (ja)
EP (1) EP2696298B1 (ja)
JP (1) JP5929902B2 (ja)
WO (1) WO2012137422A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170046626A1 (en) * 2015-08-10 2017-02-16 King Abdullah Petroleum Studies and Research Center System and method for ex post counterfactual simulation
CN107205034B (zh) * 2017-06-05 2020-09-18 上海联影医疗科技有限公司 一种数据共享设备及方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07221651A (ja) * 1994-01-28 1995-08-18 Sony Corp ベクトル量子化方法
JP2001117945A (ja) * 1999-10-22 2001-04-27 Hitachi Ltd データベース管理方法およびシステム
JP2001283141A (ja) * 2000-03-31 2001-10-12 Hitachi Software Eng Co Ltd 帳票データ保存管理システム
JP2002183206A (ja) * 2000-12-15 2002-06-28 Mitsubishi Electric Corp 類似オブジェクト検索方法及び類似オブジェクト検索装置
JP2006190191A (ja) * 2005-01-07 2006-07-20 Sony Corp 情報処理装置および方法、並びにプログラム

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5249137A (en) * 1990-03-23 1993-09-28 Xerox Corporation Computer-aided chemical illustration system
US5638462A (en) * 1993-12-24 1997-06-10 Nec Corporation Method and apparatus for recognizing graphic forms on the basis of elevation angle data associated with sequence of points constituting the graphic form
US5572634A (en) * 1994-10-26 1996-11-05 Silicon Engines, Inc. Method and apparatus for spatial simulation acceleration
JP3199231B2 (ja) * 1997-05-27 2001-08-13 日本アイ・ビー・エム株式会社 3次元形状モデルへの情報の埋め込み方法及びシステム
JP2000020745A (ja) * 1998-07-03 2000-01-21 Hitachi Ltd テンソルレンダリングによる三次元デジタルデータの表示方法及び装置
US20040085443A1 (en) * 2000-12-13 2004-05-06 Kallioniemi Olli P Method and system for processing regions of interest for objects comprising biological material
ATE375687T1 (de) * 2002-03-08 2007-10-15 Topcon Corp Vorrichtung und verfahren zur stereoskopischen bildwiedergabe
JP2003330943A (ja) 2002-05-17 2003-11-21 Fujitsu Ltd 多次元インデクス生成装置、多次元インデクス生成方法、近似情報作成装置、近似情報作成方法、及び検索装置
US7039054B2 (en) * 2002-11-19 2006-05-02 Intel Corporation Method and apparatus for header splitting/splicing and automating recovery of transmit resources on a per-transmit granularity
CN1894923A (zh) * 2003-10-08 2007-01-10 史蒂芬·J·英格博格 用改进保密性技术来建立通讯的方法和系统
JP4175280B2 (ja) * 2004-03-23 2008-11-05 日本電気株式会社 コンピュータネットワーク管理システム、コンピュータネットワーク管理方法およびプログラム
EP1610500A1 (en) * 2004-06-24 2005-12-28 STMicroelectronics S.A. On chip packet-switched communication system
US7098915B2 (en) * 2004-09-27 2006-08-29 Harris Corporation System and method for determining line-of-sight volume for a specified point
US8549180B2 (en) * 2004-10-22 2013-10-01 Microsoft Corporation Optimizing access to federation infrastructure-based resources
WO2007017970A1 (ja) * 2005-08-11 2007-02-15 Mitsubishi Denki Kabushiki Kaisha 映像記録装置、シーンチェンジ抽出方法、及び映像音声記録装置
DE602006008575D1 (de) 2006-03-31 2009-10-01 Ntt Docomo Inc Verfahren und Vorrichtung zur Verbreitung einer Abfrage
US8046363B2 (en) * 2006-04-13 2011-10-25 Lg Electronics Inc. System and method for clustering documents
EP2105859A1 (en) * 2007-02-15 2009-09-30 Sap Ag Distance-preserving anonymization of data
US8217953B2 (en) * 2008-04-25 2012-07-10 International Business Machines Corporation Anisotropic texture filtering with texture data prefetching
US8286172B2 (en) * 2008-10-02 2012-10-09 Nec Laboratories America, Inc. Systems and methods for implementing best-effort parallel computing frameworks
DE102009012992B4 (de) * 2009-03-13 2011-03-03 Technische Universität München Verfahren und System zum Bereitstellen von Medieninhalten für eine Mehrzahl von Knoten in einem Datennetz
JP2010277329A (ja) * 2009-05-28 2010-12-09 Toshiba Corp 近傍探索装置
JP5517862B2 (ja) * 2009-10-05 2014-06-11 キヤノン株式会社 画像形成装置
EP2643792A4 (en) * 2010-11-18 2015-09-02 Sky Trax Inc LOAD TRACKING WITH LOAD IDENTIFICATION MARKINGS AND SPATIAL DISTINCTION

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07221651A (ja) * 1994-01-28 1995-08-18 Sony Corp ベクトル量子化方法
JP2001117945A (ja) * 1999-10-22 2001-04-27 Hitachi Ltd データベース管理方法およびシステム
JP2001283141A (ja) * 2000-03-31 2001-10-12 Hitachi Software Eng Co Ltd 帳票データ保存管理システム
JP2002183206A (ja) * 2000-12-15 2002-06-28 Mitsubishi Electric Corp 類似オブジェクト検索方法及び類似オブジェクト検索装置
JP2006190191A (ja) * 2005-01-07 2006-07-20 Sony Corp 情報処理装置および方法、並びにプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JPN7016000019; Guohui Wang: 'Towards network triangle inequality violation aware distributed systems' Proceedings of the 7th ACM SIGCOMM conference on Internet , 20071024, 175-188ページ *

Also Published As

Publication number Publication date
EP2696298A1 (en) 2014-02-12
US20140129565A1 (en) 2014-05-08
EP2696298A4 (en) 2015-05-20
EP2696298B1 (en) 2017-07-12
US9292555B2 (en) 2016-03-22
WO2012137422A1 (ja) 2012-10-11
JPWO2012137422A1 (ja) 2014-07-28

Similar Documents

Publication Publication Date Title
CN106407311B (zh) 获取搜索结果的方法和装置
US20180276250A1 (en) Distributed Image Search
JP5265656B2 (ja) クラスタリング装置及びクラスタリング方法
US9449071B2 (en) Providing reconstructed data based on stored aggregate data in response to queries for unavailable data
WO2009094594A2 (en) Distributed indexing of file content
US20140244794A1 (en) Information System, Method and Program for Managing the Same, Method and Program for Processing Data, and Data Structure
RU2494450C2 (ru) Способ, устройство и компьютерный программный продукт для преобразования и использования данных на основе полиномов
JP7202558B1 (ja) ヒューマンサイバーフィジカル融合環境におけるデジタルオブジェクトアクセス方法及びシステム
US20120106853A1 (en) Image search
EP2530611B1 (en) Methods and apparatuses for a network based on hierarchical name structure
JP5929902B2 (ja) 情報処理装置
US20060209717A1 (en) Distributed storing of network position information for nodes
CN103605708B (zh) Kad网络中由关键词哈希值推测关键词的方法及系统
Rajkumar et al. Fuzzy-Dedup: A secure deduplication model using cosine based Fuzzy interference system in cloud application
CN105989078B (zh) 一种结构化对等网络构建索引的方法、检索方法、装置及系统
Zhang et al. A scalable approach for content-based image retrieval in peer-to-peer networks
Xu et al. A novel multilevel index model for distributed service repositories
Fujita Similarity search in interplanetary file system with the aid of locality sensitive hash
Niwa et al. MPSDataStore: A sensor data repository system for mobile participatory sensing
Zuo et al. Critical link-aware P2P search for internet videos in semantic overlay network
EP2654269B1 (en) Node and method for generating shortened name robust against change in hierarchical name in content-centric network (CCN)
Shao et al. Enhanced range search with objects outside query range
US11544317B1 (en) Identifying content items in response to a text-based request
CN112559170B (zh) 一种边缘计算环境下缓存数据的近似匹配方法
CN112749004B (zh) 基于节点访问热度的数据存储方法及装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150210

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160112

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160309

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160405

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160418

R150 Certificate of patent or registration of utility model

Ref document number: 5929902

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250