JP7388661B2

JP7388661B2 - 情報処理装置、情報処理方法、及び情報処理プログラム

Info

Publication number: JP7388661B2
Application number: JP2021133094A
Authority: JP
Inventors: 雅二郎岩崎
Original assignee: Individual
Current assignee: Individual
Priority date: 2021-08-18
Filing date: 2021-08-18
Publication date: 2023-11-29
Anticipated expiration: 2041-08-18
Also published as: JP2023027810A

Description

本発明は、情報処理装置、情報処理方法、及び情報処理プログラムに関する。

従来、種々の情報を探索（検索）する技術が提供されている。例えば、所定の対象に関する検索を行うために、検索対象に対応するノードがエッジにより連結されたグラフデータを生成する技術が提供されている。また、このような技術は、例えば画像検索等に用いられる。

特許第６２９３３３５号公報

しかしながら、上記の従来技術には、改善の余地がある。例えば、上記の従来技術では、元のグラフを利用するものの、それとは異なる新たなグラフを生成しており、元のグラフの構造を十分に活用することができず、新たなグラフの生成による処理負荷の増大を抑制すことは難しい。そのため、元のグラフの構造を利用しつつ、適切なグラフを生成することが望まれている。

本願は、上記に鑑みてなされたものであって、グラフにエッジを追加することによりグラフを適切に生成する情報処理装置、情報処理方法、及び情報処理プログラムを提供することを目的とする。

本願に係る情報処理装置は、検索対象となる複数のオブジェクトの各々に対応する複数のノードがエッジで連結されたグラフを取得する取得部と、前記複数のノードのうち一のノードを対象ノードとして、前記グラフを検索する検索処理により、前記対象ノードの近傍ノードとして抽出された第１ノードと、前記グラフにおいて前記対象ノードとの間がエッジで連結されたノードである第２ノードとに基づいて、前記第１ノードのうち、前記第２ノードに該当しないノードと、前記対象ノードとの間を連結するエッジを前記グラフに追加する精製処理を実行する生成部と、を備えたことを特徴とする。

実施形態の一態様によれば、グラフにエッジを追加することによりグラフを適切に生成することができるという効果を奏する。

図１は、実施形態に係る情報処理の一例を示す図である。図２は、実施形態に係る情報処理の一例を示す図である。図３は、処理結果の一例を示す図である。図４は、処理結果に応じた検索数の一例を示す図である。図５は、実施形態に係る情報処理システムの構成例を示す図である。図６は、実施形態に係る情報処理装置の構成例を示す図である。図７は、実施形態に係るオブジェクト情報記憶部の一例を示す図である。図８は、実施形態に係る条件情報記憶部の一例を示す図である。図９は、実施形態に係る第１グラフ情報記憶部の一例を示す図である。図１０は、実施形態に係る起点用情報記憶部の一例を示す図である。図１１は、実施形態に係る第２グラフ情報記憶部の一例を示す図である。図１２は、実施形態に係る情報処理の一例を示すフローチャートである。図１３は、実施形態に係る情報処理に用いる起点用情報の一例を示す図である。図１４は、グラフデータを用いた検索処理の一例を示すフローチャートである。図１５は、情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。

以下に、本願に係る情報処理装置、情報処理方法、及び情報処理プログラムを実施するための形態（以下、「実施形態」と呼ぶ）について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る情報処理装置、情報処理方法、及び情報処理プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。

（実施形態）
〔１．情報処理〕
図１及び図２を用いて、実施形態に係る情報処理の一例について説明する。図１及び図２は、実施形態に係る情報処理の一例を示す図である。まず、図１を用いて、後述する精製処理によりエッジを追加する対象となるグラフデータ（「第１グラフ」ともいう）の生成の一例を説明する。具体的には、図１では、情報処理装置１００（図６参照）がオブジェクトの追加に応じて、追加されたオブジェクトに対応するノード（以下「追加ノード」ともいう）を順次グラフデータ（グラフ情報）に追加し、グラフデータを生成する処理（「逐次登録処理」ともいう）を行う場合を示す。そして、図２では、図１で示す逐次登録処理により生成された第１グラフ中の各ノードを順次対象ノードとして精製処理を行い第１グラフにエッジを追加したグラフデータ（「第２グラフ」ともいう）を生成する場合を示す。なお、以下に示す例では、逐次登録処理により生成されたグラフ（第１グラフ）を対象として精製処理を実行しグラフ（第２グラフ）を生成する場合を示すが、第１グラフは、逐次登録処理により生成されたグラフに限らず、どのようなグラフであってもよい。

なお、ここでいう第１グラフ及び第２グラフは、精製処理によるエッジ追加前後のグラフを明示的に説明するための用語に過ぎず、第１グラフ及び第２グラフは、相対的な概念であって、生成した第２グラフが次のノード追加時には第１グラフになる。例えば、一のノードを対象ノードとして精製処理を行った後の第２グラフは、その次に新たなノードを対象ノードとして精製処理を行う際に第１グラフとして用いられる。このように、ある時点での精製処理により生成された第２グラフがその後の時点での精製処理における第１グラフとなる。すなわち、ここでいう第１グラフ及び第２グラフとは、ある精製処理前後のグラフを区別して表現可能にするための名称である。

また、図１及び図２では、対象とする情報（オブジェクト）がベクトル化され、ベクトル化されたオブジェクトを対象としてグラフ（グラフインデックス）を生成する場合を示す。すなわち、図１及び図２では、情報処理装置１００がベクトルをオブジェクトに対応するオブジェクト値として処理を行う場合を示す。

なお、情報処理装置１００が用いる情報は、ベクトルに限らず、各対象の類似性を表現可能な情報であれば、どのような形式の情報であってもよい。例えば、情報処理装置１００は、各対象に対応する所定のデータや値を用いてもよい。例えば、情報処理装置１００は、各対象から生成された所定の数値（例えば２進数の値や１６進数の値）を用いてもよい。例えば、情報処理装置１００は、ベクトルに限らず、データ間の距離（類似度）が定義されていれば任意の形態のデータを用いてもよい。また、以下では、画像情報をオブジェクトとした場合を一例として説明するが、オブジェクトは、動画情報や音声情報等の種々の対象であってもよい。

また、ここでいうオブジェクトの追加は、オブジェクトの登録と読み換えてもよい。情報処理装置１００が行うオブジェクトの追加とは、オブジェクトをオブジェクト情報記憶部１２１（図７参照）に登録（格納）することであってもよい。また、ここでいうノードの追加は、ノードの登録と読み換えてもよい。情報処理装置１００が行うノードの追加とは、ノードを第１グラフ情報記憶部１２３（図９参照）に登録（格納）することであってもよい。

図１及び図２では、情報処理装置１００が、データ検索の対象（オブジェクト）がベクトル化された各ベクトルに対応する情報（ノード）を対象としてグラフ情報を生成する場合を示す。すなわち、図１及び図２では、情報処理装置１００がベクトルをノードに対応するノード値として処理を行う場合を示す。各ノードは、各オブジェクトに対応する。例えば、画像から抽出された複数の局所特徴量のそれぞれがオブジェクトであってもよい。また、例えば、オブジェクト間の距離が定義された種々のデータがオブジェクトであってもよい。

情報処理装置１００は、例えば情報処理装置１００が処理可能な範囲で（例えば数百万～数十億等）の膨大な画像情報に対応するノードを対象にグラフの生成処理を行うが、図面においてはその一部のみを図示する。図１及び図２では、説明を簡単にするために、最大９個のノードを図示して処理の概要を説明する。図１では、情報処理装置１００は、何もない状態、すなわちノードが０個、エッジも０本である状態から、オブジェクトの追加に応じてノードＮ１等やエッジＥ１等を順次追加し、グラフＧＲ１１を生成する逐次登録処理を実行する。このように「ノードＮ＊（＊は任意の数値）」と記載した場合、そのノードはノードＩＤ「Ｎ＊」により識別されるノードであることを示す。例えば、「ノードＮ１」と記載した場合、そのノードはノードＩＤ「Ｎ１」により識別されるノードである。

また、上記のように「エッジＥ＊（＊は任意の数値）」と記載した場合、そのエッジはエッジＩＤ「Ｅ＊」により識別されるエッジであることを示す。例えば、「エッジＥ１」と記載した場合、そのエッジはエッジＩＤ「Ｅ１」により識別されるエッジである。図１及び図２では、情報処理装置１００は、ノードを無向エッジ（単に「エッジ」ともいう）により連結させることにより、グラフ情報を生成する。なお、ここでいう無向エッジとは、連結されたノード間を双方向にデータを辿ることができるエッジを意味する。例えば、ノードＮ１とノードＮ２とを連結するエッジＥ１により、ノードＮ１とノードＮ２との間を双方向に辿ることが可能となる。すなわち、エッジＥ１により、ノードＮ１からノードＮ２へ辿ることができ、かつエッジＥ１により、ノードＮ２からノードＮ１へ辿ることができる。

また、図１及び図２に示す空間情報ＶＳ１－１～ＶＳ１－７は、グラフデータの生成過程を模式的に示す図であり、空間情報ＶＳ１－１～ＶＳ１－７に示す空間は、同一の空間であってもよい。また、以下では、空間情報ＶＳ１－１～ＶＳ１－７について、特に区別なく説明する場合には、空間情報ＶＳ１と記載する。

また、図１及び図２中の空間情報ＶＳ１は、ユークリッド空間であってもよい。また、図１及び図２に示す空間情報ＶＳ１は、各ベクトル間の距離等の説明のための概念的な図であり、空間情報ＶＳ１は、多次元空間である。例えば、図１及び図２に示す空間情報ＶＳ１は、平面上に図示するため２次元の態様にて図示されるが、例えば１００次元や１０００次元等の多次元空間であるものとする。

また、図１及び図２に示すグラフＧＲ１１－１～ＧＲ１１－７は、グラフデータの生成過程を模式的に示す図であり、グラフＧＲ１１－１～ＧＲ１１－７は、情報処理により生成される同一のグラフデータである。また、以下では、グラフＧＲ１１－１～ＧＲ１１－７について、特に区別なく説明する場合には、グラフＧＲ１１と記載する。

また、図１及び図２に示す例においては、グラフＧＲ１１－１～ＧＲ１１－７においては、適宜「ノードＮ＊（＊は任意の数値）」の図示を省略し、取得した各ノードを「○」内に「ノードＮ＊」の「＊」の値を付すことにより表現する。すなわち、「ノードＮ＊」の部分の「＊」が一致するノードに対応する。例えば、空間情報ＶＳ１中の左下の「○」であって、内部に「５」が付された「○」は、ノードＩＤ「Ｎ５」により識別されるノード（ノードＮ５）に対応する。例えば、図１及び図２に示す例において、各ノードに対応するベクトルデータは、Ｎ次元の実数値ベクトルであってもよい。

本実施形態においては、空間情報ＶＳ１における各ノードの距離を対応する各オブジェクト間の類似度とする。例えば、各ノードに対応する対象（画像情報）の類似性が、空間情報ＶＳ１内におけるノード間の距離として写像されているものとする。例えば、各ノードに対応する概念間の類似度が各ノード間の距離に写像されているものとする。ここで、図１及び図２に示す例においては、空間情報ＶＳ１における各ノード間の距離が短いオブジェクト同士の類似度が高く、空間情報ＶＳ１における各ノード間の距離が長いオブジェクト同士の類似度が低い。例えば、図１及び図２中の空間情報ＶＳ１において、ノードＩＤ「Ｎ１」により識別されるノード（ノードＮ１）と、ノードＩＤ「Ｎ７２」により識別されるノード（ノードＮ７２）とは近接している、すなわち距離が短い。そのため、ノードＩＤ「Ｎ１」により識別されるノードに対応するオブジェクトと、ノードＩＤ「Ｎ７２」により識別されるノードに対応するオブジェクトとは類似度が高いことを示す。

また、例えば、図１及び図２中の空間情報ＶＳ１において、ノードＩＤ「Ｎ３」により識別されるノードと、ノードＩＤ「Ｎ５」により識別されるノードとは遠隔にある、すなわち距離が長い。そのため、ノードＩＤ「Ｎ３」により識別されるノードに対応するオブジェクトと、ノードＩＤ「Ｎ５」により識別されるノードに対応するオブジェクトとは類似度が低いことを示す。なお、類似度を示す指標としての距離は、ベクトル（Ｎ次元ベクトル）間の距離として適用可能であれば、どのような距離であってもよく、例えば、ユークリッド距離やマハラノビス距離やコサイン距離等の種々の距離が用いられてもよい。

また、図１では、情報処理装置１００は、逐次登録処理により、新規追加のノードをグラフＧＲ１１に追加し、ノードをエッジで連結することにより、グラフＧＲ１１を生成する。例えば、グラフＧＲ１１の生成時やグラフＧＲ１１を用いた検索時においては、グラフ構造型インデックスと同様の処理を行うが、開始位置（起点）は所定の起点用情報（以下「起点用インデックス」ともいう）を用いて決定したノード（以下「起点ノード」ともいう）からスタートしてもよい。また、例えば、情報処理装置１００が生成したグラフＧＲ１１を用いて検索を行う場合、予め決定された起点ノードを起点として検索を行ってもよい。例えば、生成時や検索時においては、起点ノードがノードＮ１である場合、ノードＮ１からエッジを辿ることにより、ノードＮ２～Ｎ８等を検索してもよい。なお、起点用インデックスや起点ノードを用いた処理についての例は、後述する。

〔１－１．逐次登録処理による生成〕
ここから、図１を用いて逐次登録処理によるグラフの生成の一例を説明する。なお、図１に示す各ステップは、グラフの生成を説明するための便宜的なステップであり、実際の処理はより詳細な処理ステップにより行われてもよい。なお、情報処理装置１００が行う情報処理は、図１中のグラフＧＲ１１－６に示すようなグラフＧＲ１１が生成されれば、どのような処理フローであってもよい。

また、図１では、追加ノードの追加時に、追加ノードに連結されるエッジ数が「２」である場合を示す。すなわち、図１では、情報処理装置１００は、追加された追加ノードについて、２つのノードとの間を連結するエッジを追加する連結処理により、追加ノードを含むグラフを生成する。例えば、情報処理装置１００は、追加ノードに連結するノードの数を示す検索数が「２」であり、その情報を基に追加ノードについて、検索処理を行って抽出した２つのノードと追加ノードとの間を連結するための２つのエッジを追加する。なお、検索数は「２」に限らず、「３」や「１０」等種々の値であってもよい。

情報処理装置１００は、逐次登録処理により生成中のグラフを用いて、追加ノードの近傍に位置するノード（「近傍ノード」ともいう）をグラフから抽出する処理（「検索処理」ともいう）を実行する。例えば、情報処理装置１００は、ｋ近傍検索を検索処理として行う。情報処理装置１００は、検索数ｋ個のノードを近傍ノードとして抽出する検索処理を行う。情報処理装置１００は、検索処理により抽出した近傍ノードと、追加ノードとの間をエッジで連結する処理（「連結処理」ともいう）により、グラフを生成（更新）する。

まず、情報処理装置１００は、ノードＮ１を新規追加する（ステップＳ１１）。例えば、情報処理装置１００は、ノードＮ１をグラフに追加する。図１では、情報処理装置１００は、ノードＮ１が最初のノードであるため、ノードＮ１を含むグラフＧＲ１１を新規に生成する。また、情報処理装置１００は、ステップＳ１１後においてグラフＧＲ１１には、ノードがノードＮ１の１個のみであるため、グラフＧＲ１１にエッジを追加しない。

例えば、情報処理装置１００は、検索対象として新たに追加されたオブジェクトを取得し、追加されたオブジェクトに対応するノードを新規追加する。例えば、情報処理装置１００は、新たに追加されたオブジェクトをオブジェクト情報記憶部１２１（図７参照）に記憶し、新たに追加されたオブジェクトに対応付けたノードを第１グラフ情報記憶部１２３に記憶する。情報処理装置１００は、オブジェクトＩＤ「ＯＢ１」により識別されるオブジェクト（図７参照）に対応するノードＮ１をグラフＧＲ１１に追加する。情報処理装置１００は、ノードＮ１がグラフＧＲ１１に追加された順序（「登録順」ともいう）が「１」であることを示す情報をノードＮ１に対応付けて第１グラフ情報記憶部１２３に記憶する。このように、情報処理装置１００は、各ノード（オブジェクト）がグラフに追加された順序を示す情報（「順序情報」ともいう）を第１グラフ情報記憶部１２３に記憶する。

そして、情報処理装置１００は、ノードＮ２を新規追加する（ステップＳ１２）。図１では、例えば、情報処理装置１００は、ノードＮ２をグラフＧＲ１１に追加する。情報処理装置１００は、オブジェクトＩＤ「ＯＢ２」により識別されるオブジェクト（図７参照）に対応するノードＮ２をグラフＧＲ１１に追加する。情報処理装置１００は、ノードＮ２がグラフＧＲ１１に追加された順番が「２」であることを示す情報をノードＮ２に対応付けて第１グラフ情報記憶部１２３に記憶する。

そして、情報処理装置１００は、グラフを生成する（ステップＳ１３）。情報処理装置１００は、検索数情報ＴＨＬ１に基づいて、追加したノードＮ２に２本のエッジが連結されるようにグラフを生成する。情報処理装置１００は、空間情報ＶＳ１－１に示すように追加したノードＮ２に連結するエッジを追加することにより、グラフＧＲ１１－１を生成する。図１では、情報処理装置１００は、グラフＧＲ１１中のノードＮ２以外にはノードＮ１のみしかないため、ノードＮ１とノードＮ２との間を連結するエッジＥ１を追加することにより、グラフＧＲ１１－１を生成する。そして、情報処理装置１００は、グラフＧＲ１１－１には、ノードＮ１以外に、ノードＮ２との間にエッジを接続するノードが無いため、ノードＮ２にエッジを連結する処理（連結処理）を終了する。なお、情報処理装置１００は、グラフＧＲ１１を探索し、ノードＮ２の近傍ノードとしてノードＮ１を選択し、ノードＮ１との間にエッジＥ１を追加することにより、グラフＧＲ１１－１を生成してもよい。

そして、情報処理装置１００は、ノードＮ３を新規追加する（ステップＳ１４－１）。図１では、例えば、情報処理装置１００は、追加されたオブジェクトに対応するノードＮ３をグラフＧＲ１１に追加する。情報処理装置１００は、ノードＮ３がグラフＧＲ１１に追加された順番が「３」であることを示す情報をノードＮ３に対応付けて第１グラフ情報記憶部１２３に記憶する。

そして、情報処理装置１００は、グラフを探索する（ステップＳ１４－２）。情報処理装置１００は、生成中のグラフＧＲ１１を用いて検索数ｋ個の近傍ノードを抽出する検索処理を行う。例えば、情報処理装置１００は、図１４に示すような処理手順により、追加ノードの近傍に位置するノード（近傍ノード）の探索（検索）を行う。例えば、情報処理装置１００は、図１４に示すような処理手順によりグラフを探索することにより、検索数「２」に対応する２つの近傍ノードを抽出する。例えば、情報処理装置１００は、「１００」個等の種々の値を検索数に決定してもよい。例えば、情報処理装置１００は、種々の情報を適宜用いて、検索数を決定してもよい。例えば、情報処理装置１００は、生成後のグラフの検索の性能に基づいて、検索数（近傍ノード数）を決定してもよい。

情報処理装置１００は、追加ノードであるノードＮ３をクエリとして、図１４に示すような処理手順によりグラフＧＲ１１－１を探索し、ノードＮ３の近傍ノードとして、検索数「２」に対応する２個のノードＮ１、Ｎ２を抽出する。

そして、情報処理装置１００は、近傍ノードと追加ノードとの間をエッジで連結する連結処理を行う（ステップＳ１４－３）。図１では、情報処理装置１００は、ノードＮ３と近傍ノードであるノードＮ１、Ｎ２との間を連結するエッジをグラフＧＲ１１－１に追加することによりグラフＧＲ１１－２を生成する。具体的には、情報処理装置１００は、空間情報ＶＳ１－２に示すように、追加ノードであるノードＮ３とノードＮ１との間をエッジＥ２により連結し、ノードＮ３とノードＮ２との間をエッジＥ３により連結することにより、グラフＧＲ１１－２を生成する。

そして、情報処理装置１００は、ノードＮ４を新規追加する（ステップＳ１５－１）。図１では、例えば、情報処理装置１００は、追加されたオブジェクトに対応するノードＮ４をグラフＧＲ１１に追加する。情報処理装置１００は、ノードＮ４がグラフＧＲ１１に追加された順番が「４」であることを示す情報をノードＮ４に対応付けて第１グラフ情報記憶部１２３に記憶する。

そして、情報処理装置１００は、グラフを探索する（ステップＳ１５－２）。情報処理装置１００は、生成中のグラフＧＲ１１を用いて検索数ｋ個の近傍ノードを抽出する検索処理を行う。例えば、情報処理装置１００は、追加ノードであるノードＮ４をクエリとして、図１４に示すような処理手順によりグラフＧＲ１１－２を探索し、ノードＮ４の近傍ノードとして、検索数「２」に対応する２個のノードＮ１、Ｎ３を抽出する。

そして、情報処理装置１００は、近傍ノードと追加ノードとの間をエッジで連結する連結処理を行う（ステップＳ１５－３）。図１では、情報処理装置１００は、ノードＮ４と近傍ノードであるノードＮ１、Ｎ３との間を連結するエッジをグラフＧＲ１１－２に追加することによりグラフＧＲ１１－３を生成する。具体的には、情報処理装置１００は、空間情報ＶＳ１－３に示すように、追加ノードであるノードＮ４とノードＮ１との間をエッジＥ４により連結し、ノードＮ４とノードＮ３との間をエッジＥ５により連結することにより、グラフＧＲ１１－３を生成する。

そして、情報処理装置１００は、ノードＮ５を新規追加する（ステップＳ１６－１）。図１では、例えば、情報処理装置１００は、追加されたオブジェクトに対応するノードＮ５をグラフＧＲ１１に追加する。情報処理装置１００は、ノードＮ５がグラフＧＲ１１に追加された順番が「５」であることを示す情報をノードＮ５に対応付けて第１グラフ情報記憶部１２３に記憶する。

そして、情報処理装置１００は、グラフを探索する（ステップＳ１６－２）。情報処理装置１００は、生成中のグラフＧＲ１１を用いて検索数ｋ個の近傍ノードを抽出する検索処理を行う。例えば、情報処理装置１００は、追加ノードであるノードＮ５をクエリとして、図１４に示すような処理手順によりグラフＧＲ１１－３を探索し、ノードＮ５の近傍ノードとして、検索数「２」に対応する２個のノードＮ１、Ｎ２を抽出する。

そして、情報処理装置１００は、近傍ノードと追加ノードとの間をエッジで連結する連結処理を行う（ステップＳ１６－３）。図１では、情報処理装置１００は、ノードＮ５と近傍ノードであるノードＮ１、Ｎ２との間を連結するエッジをグラフＧＲ１１－３に追加することによりグラフＧＲ１１－４を生成する。具体的には、情報処理装置１００は、空間情報ＶＳ１－４に示すように、追加ノードであるノードＮ５とノードＮ１との間をエッジＥ６により連結し、ノードＮ５とノードＮ２との間をエッジＥ７により連結することにより、グラフＧＲ１１－４を生成する。

そして、情報処理装置１００は、ノードＮ６を新規追加する（ステップＳ１７－１）。図１では、例えば、情報処理装置１００は、追加されたオブジェクトに対応するノードＮ６をグラフＧＲ１１に追加する。情報処理装置１００は、ノードＮ６がグラフＧＲ１１に追加された順番が「６」であることを示す情報をノードＮ６に対応付けて第１グラフ情報記憶部１２３に記憶する。

そして、情報処理装置１００は、グラフを探索する（ステップＳ１７－２）。情報処理装置１００は、生成中のグラフＧＲ１１を用いて検索数ｋ個の近傍ノードを抽出する検索処理を行う。例えば、情報処理装置１００は、追加ノードであるノードＮ６をクエリとして、図１４に示すような処理手順によりグラフＧＲ１１－４を探索し、ノードＮ６の近傍ノードとして、検索数「２」に対応する２個のノードＮ１、Ｎ５を抽出する。

そして、情報処理装置１００は、近傍ノードと追加ノードとの間をエッジで連結する連結処理を行う（ステップＳ１７－３）。図１では、情報処理装置１００は、ノードＮ６と近傍ノードであるノードＮ１、Ｎ５との間を連結するエッジをグラフＧＲ１１－４に追加することによりグラフＧＲ１１－５を生成する。具体的には、情報処理装置１００は、空間情報ＶＳ１－５に示すように、追加ノードであるノードＮ６とノードＮ１との間をエッジＥ８により連結し、ノードＮ６とノードＮ５との間をエッジＥ９により連結することにより、グラフＧＲ１１－５を生成する。

そして、情報処理装置１００は、逐次登録処理の実行を継続する（ステップＳ１８）。図１では、情報処理装置１００は、他のノードＮ７以降のノードについての順次追加して、エッジを連結することにより、空間情報ＶＳ１－６に示すようなグラフＧＲ１１－６を生成する。情報処理装置１００は、ノードＮ７以降の各ノードがグラフＧＲ１１に追加された順番を各ノードに対応付けて第１グラフ情報記憶部１２３に記憶する。

このように、情報処理装置１００は、追加されたノードを対象に順次処理を行う逐次登録処理によりグラフＧＲ１１－６のような第１グラフを生成する。また、情報処理装置１００は、各ノードが追加された順番（順序）を各ノードに対応付けて第１グラフ情報記憶部１２３に記憶することにより、グラフＧＲ１１についての順序情報を生成する。このように、情報処理装置１００は、逐次登録処理によりグラフＧＲ１１を生成し、その生成におけるノードの順序を示す情報（順序情報）を生成することにより、グラフＧＲ１１について適切な順序で精製処理を実行することができる。

なお、図１では、逐次登録処理によるグラフ生成について説明するために、情報処理装置１００が逐次登録処理を行い、グラフＧＲ１１を生成する場合を一例として説明したが、逐次登録処理によるグラフ生成は、情報処理装置１００以外の外部装置が行ってもよい。この場合、情報処理装置１００は、外部装置から逐次登録処理により生成されたグラフ、及びそのグラフの順序情報を受信し、受信したグラフを対象として図２に示す精製処理を実行してもよい。

〔１－２．精製処理による生成〕
ここから、図２を用いて精製処理によるグラフの生成（更新）の一例を説明する。まず、図２に示す精製処理の流れを説明する前に、精製処理を行う背景等について説明する。検索のインデックスに用いるグラフでは、通常、各ノードの近傍のノードにエッジにより接続される。接続されるべき近傍のノードに漏れがある場合、検索精度（性能）が低下する。

また、近傍ノードに接続されたグラフを生成するときに、短時間で生成することを重視する場合、近傍ノードへのエッジの接続漏れが発生し得る。また、上記のように逐次ノードを追加してグラフを生成する逐次登録処理を行う場合には、必然的に近傍ノードへのエッジが欠如し得る。

上述のように、逐次登録処理の場合、必然的に、登録初期のノードのエッジが多くなるが、その一方で、そのノードを登録した時には最終的にそのノードの近傍となるべきノードのほとんどは、まだ登録されていないので、接続されない。近傍ノードとなるべきノードが登録される時に、接続される可能性はあるが、例えば極めて密度変化の大きいデータセットの場合には、接続されない場合が頻出し得る。簡単な説明すると、一のノードの追加後に、その一のノードの近傍に位置する他のノードが追加される可能性があるが、他のノードには一のノードよりも近いノードが検索数（接続数）以上ある場合、一のノードと他のノードとの間にはエッジが接続されないケースが生じ得る。

そこで、情報処理システム１では、一旦グラフを生成した後に、その近傍ノードの漏れを減らすために以下の精製処理を行う。この精製処理は、グラフの精製（refine）するために実行される。以下、図２を参照して精製処理によるグラフの生成の一例を説明する。なお、図１と同様の点については、同様の符号を付すなどにより適宜説明を省略する。

情報処理装置１００は、逐次登録処理により生成されたグラフＧＲ１１を第１グラフとして第１グラフ情報記憶部１２３から取得する。情報処理装置１００は、グラフＧＲ１１の順序情報を参照して、グラフＧＲ１１への登録順に沿って一のノードを対象ノードとして選択し、選択した対象ノードについて順次精製処理を行う。図２では、グラフＧＲ１１への登録順が最初（すなわち「１」）であるノードＮ１を対象ノードとした精製処理によるグラフの変化を示すが、情報処理装置１００は、グラフＧＲ１１の順序情報を用いて、ノードＮ１を対象ノードとする精製処理を行う後、ノードＮ２、Ｎ３、Ｎ４…と登録順に精製処理を行う。

まず、情報処理装置１００は、グラフＧＲ１１の順序情報を参照して、ノードＮ１を対象ノードに選択する（ステップＳ２１－１）。情報処理装置１００は、グラフＧＲ１１の順序情報を参照して、グラフＧＲ１１への登録順が「１」であるノードＮ１を対象ノードに選択する。

そして、情報処理装置１００は、グラフを探索する（ステップＳ２１－２）。情報処理装置１００は、グラフＧＲ１１を用いて検索数ｋ個の近傍ノードを抽出する検索処理を行う。図２では、情報処理装置１００は、対象ノードであるノードＮ１をクエリとして、図１４に示すような処理手順によりグラフＧＲ１１－６を探索し、ノードＮ１の近傍ノードとして、検索数「２」に対応する２個のノードＮ７２、Ｎ４を抽出する。なお、情報処理装置１００は、ノードＮ１をシード（検索の起点）として、検索処理を行ってもよい。また、図２では、精製処理での検索処理での検索数ｋを、図１でのグラフ生成（第１グラフ生成）時の検索処理での検索数と同じ「２」とする場合を説明するが、検索数は第１グラフ生成時の検索数と異なってもよいが、この点については後述する。

情報処理装置１００は、検索処理の結果を用いてグラフＧＲ１１にエッジを追加する（ステップＳ２１－３）。情報処理装置１００は、検索処理により抽出した対象ノードの近傍ノード（「第１ノード」ともいう）と、グラフＧＲ１１において対象ノードからのエッジが連結（接続）されたノード（「第２ノード」ともいう）とに基づいて、エッジをグラフに追加する。例えば、情報処理装置１００は、対象ノードについて抽出された近傍ノード（抽出ノード）である第１ノードのうち、対象ノードからのエッジが接続されたノード（接続ノード）である第２ノードに該当しないノードと、対象ノードとの間を連結するエッジをグラフに追加する。

図２では、情報処理装置１００は、検索処理により抽出したノードＮ１の第１ノード（近傍ノード）と、グラフＧＲ１１においてノードＮ１からのエッジが連結（接続）された第２ノード（接続ノード）とに基づいて、グラフＧＲ１１にエッジをグラフに追加する。具体的には、情報処理装置１００は、ノードＮ１の第１ノードであるノードＮ７２、Ｎ４と、ノードＮ１の第２ノードであるノードＮ６、Ｎ４、Ｎ３、Ｎ５、Ｎ２とを比較し、ノードＮ１の第１ノードのうち、ノードＮ１の第２ノードに該当しないノードと、ノードＮ１との間を連結するエッジをグラフに追加する。

例えば、情報処理装置１００は、ノードＮ１との間の距離が短い方から順にノードＮ１の第１ノードを並べた第１ノード一覧ＲＳ１と、ノードＮ１との間の距離（エッジの長さ）が短い方から順にノードＮ１の第２ノードを並べた第２ノード一覧ＣＮ１を用いる。第１ノード一覧ＲＳ１は、ノードＮ１の第１ノードのうち、ノードＮ７２が最もノードＮ１からの距離が短く、ノードＮ４がノードＮ７２の次にノードＮ１からの距離が短いことを示す。また、第２ノード一覧ＣＮ１は、ノードＮ６、Ｎ４、Ｎ３、Ｎ５、Ｎ２の順でノードＮ１からの距離が短いことを示す。例えば、第２ノード一覧ＣＮ１は、ノードＮ１の第２ノードのうち、ノードＮ６が最もノードＮ１からの距離が短く、ノードＮ４がノードＮ６の次にノードＮ１からの距離が短いことを示す。

例えば、情報処理装置１００は、第１ノード一覧ＲＳ１及び第２ノード一覧ＣＮ１を生成し、生成した第１ノード一覧ＲＳ１及び第２ノード一覧ＣＮ１を用いて処理を行ってもよい。なお、情報処理装置１００は、第１ノード一覧ＲＳ１及び第２ノード一覧ＣＮ１を生成せずに、記憶部１２０中の第１ノード一覧ＲＳ１及び第２ノード一覧ＣＮ１に対応する情報を参照し、処理を行ってもよい。

情報処理装置１００は、第１ノード一覧ＲＳ１及び第２ノード一覧ＣＮ１の情報を参照し、ノードＮ１の第１ノードと、ノードＮ１の第２ノードとを比較し、比較結果を基に、グラフＧＲ１１にエッジを追加する。図２では、情報処理装置１００は、ノードＮ１の第１ノードのうちノードＮ７２がノードＮ１の第２ノードに含まれないため、ノードＮ７２をノードＮ１との間をエッジで接続する接続候補ノードに決定する。そして、情報処理装置１００は、ノードＮ１とノードＮ７２との間を連結するエッジをグラフＧＲ１１に追加すると決定する。そして、情報処理装置１００は、ノードＮ１とノードＮ７２との間を連結（接続）するエッジをグラフＧＲ１１－６に追加することによりグラフＧＲ１１－７を生成する。具体的には、情報処理装置１００は、空間情報ＶＳ１－７に示すように、対象ノードであるノードＮ１とノードＮ７２との間をエッジＥ１００により連結することにより、グラフＧＲ１１－７を生成する。情報処理装置１００は、グラフＧＲ１１－６にエッジＥ１００が追加されたグラフＧＲ１１－７を示す情報を第２グラフ情報記憶部１２５（図１１参照）に記憶する。

情報処理装置１００は、他のノードＮ２、Ｎ３等を対象ノードとして精製処理を行う（ステップＳ２２）。情報処理装置１００は、ノードＮ１を対象ノードとする精製処理を行った後、グラフＧＲ１１の順序情報を用いて、ノードＮ１の次の登録順であるノードＮ２、その次の登録順であるノードＮ３等、登録順に従って各ノードを対象ノードとして、上述した精製処理をする。これにより、情報処理装置１００は、各ノードを対象ノードとして、接続候補ノードを決定し、対象ノードと接続候補ノードとをエッジで連結することによりグラフＧ１１を生成（更新）する。

上述したように、情報処理装置１００は、精製処理を行うことにより、グラフにおいて近傍ノードへの接続が漏れていたエッジを追加することができる。例えば、図２に示す例のように、逐次登録処理で生成されたグラフＧＲ１１の場合、初期段階で追加（登録）されたノードＮ１については、近傍ノードであるノードＮ７２とのエッジが接続されないケースが生じている。そこで、情報処理装置１００は、ノードＮ１を対象ノードとして精製処理を行うことにより、逐次登録処理では追加されなかったノードＮ１の近傍ノードであるＮ７２とノードＮ１との間を接続するエッジＥ１００を追加することができる。このように、情報処理装置１００は、精製処理を行うことにより、グラフにエッジを追加することによりグラフを適切に生成することができる。

〔１－２－１．精製処理に要する時間の短縮〕
情報処理システム１では、上述のような精製処理を実行することにより、グラフが精製されグラフの検索精度（性能）を向上させることができる。そのため、精製処理は、グラフ中のすべてのノードを対象ノードとして精製処理を行い、近傍ノードを検索して漏れていたノードをエッジで接続することも考えられるが、すべてのノードを対象ノードとして精製処理を行い、検索処理を実行する場合は処理時間を要するという課題がある。例えば、グラフＧＲ１１中のすべてのノードの各々を対象ノードとして精製処理を行った場合、グラフＧＲ１１の検索精度（性能）を向上させることができるが、処理時間の増大を抑制することが難しい。

そこで、上記のような逐次登録処理では登録初期のノードほど近傍ノードへの接続漏れが多い傾向があることから、情報処理システム１では、検索パラメータの調整または処理の中断等を実行することにより時間短縮を行ってもよい。以下、この点についての例を説明する。

例えば、情報処理装置１００は、精製処理に要する時間の短縮するために、以下のような処理を実行する。以下の処理では、区間数及び区間精度合計を用いる。例えば、区間数は、一のノードが対象ノードとして精製処理が実行される度に「１」加算される変数である。区間数は、精製処理の繰り返しの回数を示す。また、以下の処理では、区間数の閾値である区間閾値を用いる。区間閾値は、１０００や１００００等の任意の値が設定される。例えば、区間閾値は、終了条件を満たすかを判定するまでに精製処理を繰り返す回数を示し、区間閾値が１０００に設定された場合、情報処理装置１００は、１０００個のノードを対象ノードとして精製処理を行うたびに、終了条件を満たすかを判定する。また、例えば、区間精度合計は、区間閾値に対応する数のノードを対象ノードとする処理の間の各対象ノードの精度の合計を示す。

例えば、情報処理装置１００は、区間数および区間精度合計を０に設定する。また、情報処理装置１００は、検索数ｋを設定値ｋ０に設定する。例えば、設定値ｋ０は、通常グラフ生成時に用いた検索数（通常検索数ともいう）であってもよいが、通常検索数に定数をかけた値であってもよい。

情報処理装置１００は、終了条件を満たして終了しない場合、グラフ中のすべてのノードを、登録順に順次対象ノード（以下「ノードＮ」とする）として、以下の処理を行う。

まず、情報処理装置１００は、ノードＮのオブジェクトを用いてｋ近傍検索を行う。例えば、ｋは検索結果である近傍ノード数である。情報処理装置１００は、検索のシードとなるノードとしてノードＮを用いてもよい。情報処理装置１００は、検索されたノード（第１ノード）のうち、ノードＮの接続ノード（第２ノード）に重複しないノードを無向エッジでノードＮに接続する。なお、この処理については、図２で説明した処理と同様であるため、詳細な説明は省略する。

そして、情報処理装置１００は、検索されたノード（第１ノード）に対して既にノードＮに接続されているノード（第２ノード）の割合（近傍ノード精度）を算出する。そして、情報処理装置１００は、区間精度合計に近傍ノード精度を加算し、区間数に１を加算する。情報処理装置１００は、登録順に順次対象ノード（ノードＮ）を変更して、上述した処理を繰り返す。

情報処理装置１００は、区間数が予め決められた数（区間閾値）を超えたら、区間平均精度を算出する。情報処理装置１００は、区間精度合計を区画数で除することにより、区間平均精度を算出する。情報処理装置１００は、式「区間精度合計／区間数」により区間平均精度を算出する。

そして、情報処理装置１００は、検索数ｋを式「ｋ＝ｋ０×（１．０－区間平均精度）」により算出される値に更新する。また、情報処理装置１００は、区間数および区間精度合計を０に更新（初期化）する。なお、情報処理装置１００は、検索数ｋを正の整数に調整する。例えば、情報処理装置１００は、算出した値が小数点を含む場合は、切り下げてもよいし、四捨五入してもよい。例えば、情報処理装置１００は、上記式により算出した値が小数点以下の値を含む場合、小数点以下の値の切り下げ（切り捨て）を行い、切り下げ後の値（整数）に検索数ｋを更新する。

情報処理装置１００は、終了判定を行う。例えば、情報処理装置１００は、検索数ｋが「０」になった場合、終了条件を満たすとして処理を終了する。例えば、情報処理装置１００は、上述した区画平均精度を用いて算出した検索数ｋが「０」になった場合、終了条件を満たすとして処理を終了する。なお、情報処理装置１００は、早期終了のために０より大きな閾値（例えば、１．１等）を用いてもよい。この場合、情報処理装置１００は、検索数ｋが閾値以下になった場合、終了条件を満たすとして処理を終了してもよい。

なお、情報処理装置１００は、検索数ｋに限らず、終了判定に様々な情報を用いてもよい。例えば、情報処理装置１００は、区間平均精度を用いて、終了判定を行ってもよい。例えば、情報処理装置１００は、区間平均精度が所定の閾値以上である場合、終了条件を満たすとして処理を終了してもよい。

また、情報処理装置１００は、検索数ｋを更新しなくてもよい。この場合、情報処理装置１００は、「ｋ０×（１．０－区間平均精度）」により算出される値（「終了判定用値」ともいう）を、検索数ｋの更新には用いずに、終了判定のみに用いてもよい。情報処理装置１００は、終了判定用値が０となった場合、終了条件を満たすとして処理を終了してもよい。この場合、情報処理装置１００は、常に設定値ｋ０で検索することになるのでエッジの精度を向上させることができる。

上述のように、情報処理装置１００は、対象ノードについて精製処理を行うごとに、その対象ノードについて精度を算出する。例えば、情報処理装置１００は、対象ノードの第１ノード（近傍ノード）と、対象ノードの第２ノード（接続ノード）とに基づいて、精度を算出する。例えば、情報処理装置１００は、第１ノードに対する第２ノードの割合を対象ノードの精度として算出してもよい。例えば、情報処理装置１００は、対象ノードの第１ノードのうち対象ノードの第２ノードに該当するノードの割合により対象ノードの精度を算出してもよい。なお、情報処理装置１００は、精度の最大値を「１」として対象ノードの精度を算出してもよい。例えば、情報処理装置１００は、第１ノードの全てが第２ノードに含まれる場合、精度を「１」として算出してもよい。なお、精度は上記に限らず種々の情報を適宜用いて算出してもよい。

情報処理装置１００は、算出した精度に応じた終了条件を満たすまで、対象ノードを対象とする精製処理を繰り返す。例えば、情報処理装置１００は、所定数（区間数）のノードを対象ノードとして精製処理を行うごとに終了条件を満たすかを判定してもよい。例えば、情報処理装置１００は、区間数のノードを対象ノードとして精製処理を行うごとに、その区間での精度の平均である平均精度（「区間平均精度」ともいう）を算出し、算出した区間平均精度を用いて終了条件を満たすかを判定してもよい。

〔１－２－２．検索数の算出の他の例〕
なお、上述した検索数の設定例は一例に過ぎず、情報処理装置１００は、様々な情報を適宜用いて検索数を算出してもよい。この点について図３及び図４を用いて説明する。図３は、処理結果の一例を示す図である。図４は、処理結果に応じた検索数の一例を示す図である。なお、上述した点と同様の点については適宜説明を省略する。

図３及び図４に示す棒グラフＢＧ１は、縦軸が正解確率（エッジが存在する確率）であり、横軸が検索結果の各ランクである。例えば、縦軸の正解確率は、正解の近傍ノードが既存の設定値k０以下のエッジ（で接続されたノード）のいずれかに一致する確率を示す。例えば、正解確率は、対象ノードの第１ノードが、対象ノードの第２ノードに一致する確率を示す。

また、例えば、横軸のランクは、対象ノードからの距離が近い順の検索結果のランクを示す。棒グラフＢＧ１では、ランク＃１～ランク＃８の８番目までのランクに対応する正解確率を示す。例えば、棒グラフＢＧ１中のランク＃１が対象ノードから一番近いランク（ノード）の正解確率を示す。また、例えば、棒グラフＢＧ１中のランク＃８が対象ノードから８番目に近いランク（ノード）の正解確率を示す。

このように、図３及び図４に示す棒グラフＢＧ１は、ランクごとの正解確率を示す。なお、棒グラフの総和は１ではなく、各棒グラフの最大値が１である。すなわち、縦軸の正解確率の最大値は１となる。

情報処理装置１００は、図３及び図４に示す棒グラフＢＧ１の情報を用いて、検索数を算出（決定）してもよい。例えば、情報処理装置１００は、期待精度を予め設定し、エッジの長い方（すなわち、ランクの下）から順に不正解率（＝１－正解確率）を加算し、それが「ｋ０×（１－期待精度）」により算出される値（算出値）を上回らない最大のランクを検索数としてもよい。

図４では、ｋ＝８、期待精度を「０．８０（８０％）」とした場合の一例を示す。このように、図４では、検索数ｋが８であり、期待精度が「０．８０（８０％）」であるため、取得したい許容され得る不正解数（「許容数」ともいう）は「１．６（＝８×（１－０．８０））」となる。そのため、情報処理装置１００は、算出処理ＲＶ１～ＲＶ４を順次行って、その算出値を基に検索数を決定する。具体的には、情報処理装置１００は、算出処理ＲＶ４における算出値「１．８」が許容数「１．６」を超えたため、算出処理ＲＶ４でのランク＃５の前のランク＃６、すなわち「６」を検索数ｋに決定する。

なお、情報処理装置１００は、上記に限らず、様々な情報を適宜用いて検索数を算出してもよい。

〔１－３．グラフデータ〕
なお、図１では、情報処理装置１００が最初（ノード数が０個の状態）からグラフＧＲ１１を生成する場合、すなわちグラフを新規に生成する場合を示したが、情報処理装置１００は、新規生成に限らず、種々のグラフを生成してもよい。例えば、情報処理装置１００は、ノードやエッジが含まれるグラフに、新たに追加されたオブジェクトに対応するノードを追加することにより、グラフを生成してもよい。例えば、情報処理装置１００は、エッジが調整され再構築されたグラフに、新たに追加されたオブジェクトに対応するノードを追加することにより、グラフを生成してもよい。

〔１－４．起点用情報〕
例えば、情報処理装置１００は、図１３に示すようなツリー構造（木構造）に関する起点用情報ＩＮＤ１１を起点用情報（起点用インデックス）として用いてもよい。図１３は、実施形態に係る情報処理に用いる起点用情報の一例を示す図である。例えば、起点用情報ＩＮＤ１１は、グラフＧＲ１１中のノードに到達可能なツリー構造を有するインデックスである。図１３では説明を簡単にするために、起点用情報ＩＮＤ１１は、ノードＮ１～Ｎ５の５個のノードに到達するルートのみを図示するが、多数（例えば５００や１０００等）の他のノードへ到達するルートが含まれてもよい。例えば、起点用情報ＩＮＤ１１は、グラフＧＲ１１中の全ノードに到達可能であってもよい。

なお、起点用情報ＩＮＤ１１のような起点用情報は、情報処理装置１００が生成してもよいし、情報処理装置１００は、起点用情報を情報提供装置５０等の他の外部装置から取得してもよい。例えば、情報処理装置１００は、起点用情報を生成する場合は、木構造に関する種々の従来技術を適宜用いて、グラフ（例えばグラフＧＲ１１）に含まれるノードをリーフとする木構造の起点用情報（例えば起点用情報ＩＮＤ１１）を生成する。また、情報処理装置１００は、新たなノードがグラフ（例えばグラフＧＲ１１）に追加された場合、新たに追加されたオブジェクトに対応するノード（「追加ノード」ともいう）をリーフとして木構造の起点用情報（例えば起点用情報ＩＮＤ１１）に追加する。これにより、情報処理装置１００は、新たなノードがグラフに追加された場合、起点用情報を更新する。すなわち、情報処理装置１００は、新たなノードがグラフに追加された場合、新たなノードをリーフとして追加した起点用情報を生成する。

上記のように、情報処理装置１００は、木構造に関する種々の従来技術を適宜用いて、起点用情報記憶部１２４（図１０参照）に記憶された起点用情報ＩＮＤ１１のような、起点用インデックスを生成する。例えば、情報処理装置１００は、新たにオブジェクトが追加された場合、新たに追加されたオブジェクトに対応するノードをリーフとして追加することにより、起点用情報ＩＮＤ１１を更新してもよい。図１及び図２では、情報処理装置１００は、ノードＮ３やノードＮ４等が追加される毎に、ノードＮ３やノードＮ４等をリーフとして追加することにより、起点用情報ＩＮＤ１１を更新してもよい。

また、情報処理装置１００は、他の外部装置から起点用情報を取得する場合は、他の外部装置へグラフを提供する。そして、情報処理装置１００は、グラフを受信した他の外部装置が生成した起点用情報を、他の外部装置から取得する。例えば、情報処理装置１００は、情報提供装置５０から起点用情報ＩＮＤ１１を取得する場合は、情報提供装置５０へグラフＧＲ１１を送信する。そして、情報処理装置１００は、グラフＧＲ１１を受信した情報提供装置５０が生成した起点用情報ＩＮＤ１１を、情報提供装置５０から取得する。例えば、情報処理装置１００は、起点用情報ＩＮＤ１１と追加ノードに関する情報とを情報提供装置５０へ提供することにより、情報提供装置５０から追加ノードにより更新された起点用情報ＩＮＤ１１を取得してもよい。なお、上記は一例であり、情報提供装置５０は、起点用情報ＩＮＤ１１を取得可能であれば、どのような手段により起点用情報ＩＮＤ１１を取得してもよい。

また、情報処理装置１００は、図１３中のインデックス情報群ＧＩＮＦ１１に示すような起点用情報ＩＮＤ１１を用いて起点ノードを決定してもよい。図１３では、情報処理装置１００は、起点用情報ＩＮＤ１１に基づいて、クエリＱＥ１に対応する起点ノードを決定する。クエリＱＥ１は、新たに追加するオブジェクトに対応するノードやグラフＧＲ１１を用いた検索を行う対象等であってもよい。すなわち、情報処理装置１００は、グラフ生成時や検索時において、起点用情報ＩＮＤ１１を用いて、起点ノードを決定する。

具体的には、情報処理装置１００は、起点用情報記憶部に記憶された起点用情報ＩＮＤ１１を用いて、起点ノードを決定する。図１３中の起点用情報ＩＮＤ１１は、図１０中の起点用情報記憶部１２４に示す階層構造を有する。例えば、起点用情報ＩＮＤ１１は、ルートＲＴの直下に位置する第１階層のノード（ベクトル）が、節点ＶＴ１、ＶＴ２、ＶＴ３等であることを示す。また、例えば、起点用情報ＩＮＤ１１は、節点ＶＴ２の直下の第２階層のノードが、節点ＶＴ２－１～ＶＴ２－４（図示せず）であることを示す。例えば、起点用情報ＩＮＤ１１は、節点ＶＴ２－１の直下の第３階層のノードが、ノードＮ２、Ｎ５、すなわちグラフＧＲ１１中のノード（ベクトル）であることを示す。また、起点用情報ＩＮＤ１１は、節点ＶＴ２－２の直下の第３階層のノードが、ノードＮ１、Ｎ３、Ｎ４、すなわちグラフＧＲ１１中のノード（ベクトル）であることを示す。

例えば、情報処理装置１００は、図１３中の起点用情報ＩＮＤ１１に示すような木構造型の起点用インデックス情報を用いて、グラフＧＲ１１における起点ノードを決定する。図１３では、情報処理装置１００は、クエリＱＥ１に基づいて、起点用情報ＩＮＤ１１を上（ルートＲＴ）から下へ辿ることにより、起点用情報ＩＮＤ１１の近傍候補となる起点ノードを決定（特定）する。これにより、情報処理装置１００は、効率的に検索クエリ（クエリＱＥ１）に対応する起点ノードを決定することができる。例えば、情報処理装置１００は、追加ノードであるクエリＱＥ１に対応する適切な起点ノードを高速に決定することができる。

なお、情報処理装置１００は、上記に限らず、種々の起点用インデックスを用いてもよい。すなわち、図１３の例に示す起点用情報（起点用インデックス）は一例であり、情報処理装置１００は、種々の起点用情報を用いて、グラフ情報を検索してもよい。情報処理装置１００は、検索時の起点ノードの決定に用いる起点用インデックスを生成してもよい。例えば、情報処理装置１００は、高次元ベクトルを高速に検索するための検索インデックス（起点用情報）を生成する。ここでいう高次元ベクトルとは、例えば、数百次元から数千次元のベクトルであってもよいし、それ以上の次元のベクトルであってもよい。

例えば、情報処理装置１００は、ｋｄ木（k-dimensional tree）に関する検索インデックスを起点用インデックスとして生成してもよい。例えば、情報処理装置１００は、ＶＰ木（Vantage-Point tree）に関する検索インデックスを起点用インデックスとして生成してもよい。

また、例えば、情報処理装置１００は、その他の木構造を有する起点用インデックスとして生成してもよい。例えば、情報処理装置１００は、木構造の起点用インデックスのリーフがグラフに接続する種々の起点用インデックスを生成してもよい。例えば、情報処理装置１００は、木構造の起点用インデックスのリーフがグラフ中のノードに対応する種々の起点用インデックスを生成してもよい。また、情報処理装置１００は、このような起点用インデックスを用いて検索を行う場合、起点用インデックスを辿って到達したリーフ（ノード）からグラフを探索してもよい。

なお、上述したような起点用インデックスは一例であり、情報処理装置１００は、グラフ中のクエリを高速に特定することが可能であれば、どのようなデータ構造の起点用インデックスを生成してもよい。例えば、情報処理装置１００は、クエリに対応するグラフ情報中のノードを高速に特定することが可能であれば、バイナリ空間分割に関する技術等の種々の従来技術を適宜用いて、起点用インデックスを生成してもよい。例えば、情報処理装置１００は、高次元ベクトルの検索に対応可能な起点用インデックスであれば、どのようなデータ構造の起点用インデックスを生成してもよい。情報処理装置１００は、上述のような起点用インデックスとグラフとを用いることにより、所定の対象に関してより効率的な検索を可能にすることができる。すなわち、情報処理装置１００は、上述のような起点用インデックスとグラフとを用いることにより、所定の対象に関する検索をより高速に実行可能にすることができる。

〔２．情報処理システムの構成〕
図５に示すように、情報処理システム１は、端末装置１０と、情報提供装置５０と、情報処理装置１００とが含まれる。端末装置１０と、情報提供装置５０と、情報処理装置１００とは所定のネットワークＮを介して、有線または無線により通信可能に接続される。図５は、実施形態に係る情報処理システムの構成例を示す図である。なお、図５に示した情報処理システム１には、複数台の端末装置１０や、複数台の情報提供装置５０や、複数台の情報処理装置１００が含まれてもよい。

端末装置１０は、ユーザによって利用される情報処理装置である。端末装置１０は、ユーザによる種々の操作を受け付ける。なお、以下では、端末装置１０をユーザと表記する場合がある。すなわち、以下では、ユーザを端末装置１０と読み替えることもできる。なお、上述した端末装置１０は、例えば、スマートフォンや、タブレット型端末や、ノート型ＰＣ（Personal Computer）や、デスクトップＰＣや、携帯電話機や、ＰＤＡ（Personal Digital Assistant）等により実現される。

情報提供装置５０は、ユーザ等に種々の情報提供を行うための情報が格納された情報処理装置である。例えば、情報提供装置５０は、ウェブサーバ等の種々の外部装置から収集した文字情報等に基づくオブジェクトＩＤが格納される。例えば、情報提供装置５０は、ユーザ等に画像検索サービスを提供する情報処理装置である。例えば、情報提供装置５０は、画像検索サービスを提供するための各情報が格納される。例えば、情報提供装置５０は、画像検索サービスの対象となる画像に対応するベクトル情報を情報処理装置１００に提供する。また、情報提供装置５０は、クエリを情報処理装置１００に送信することにより、情報処理装置１００からクエリに対応する画像を示すオブジェクトＩＤ等を受信する。

情報処理装置１００は、第１グラフにエッジを追加する精製処理により第２グラフを生成する情報処理装置である。例えば、情報処理装置１００は、対象ノードの第１ノードのうち、対象ノードの第２ノードに該当しないノードと、対象ノードとの間を連結するエッジを第１グラフに追加する精製処理により第２グラフを生成する。なお、精製処理は、グラフからエッジを削除する処理であってもよい。例えば、情報処理装置１００は、対象ノードに連結されたエッジを第１グラフから削除する精製処理により第２グラフを生成する。例えば、情報処理装置１００は、第１グラフにおいて所定数を超えるエッジが連結されたノード（エッジ過多ノード）がある場合、そのエッジ過多ノードに連結されたエッジが所定数になるまで、そのエッジ過多ノードに連結されたエッジを削除することにより第２グラフを生成してもよい。例えば、情報処理装置１００は、エッジ過多ノードに連結されたエッジが所定数になるまで、そのエッジ過多ノードに連結されたエッジのうち、距離が長い方から順にエッジを第１グラフから削除する精製処理により第２グラフを生成する。

例えば、情報処理装置１００は、端末装置からクエリ情報（以下、単に「クエリ」ともいう）を受信すると、クエリに類似する対象（ベクトル情報等）を検索し、検索結果を端末装置に提供する。また、例えば、情報処理装置１００が端末装置に提供するデータは、画像情報等のデータ自体であってもよいし、ＵＲＬ（Uniform Resource Locator）等の対応するデータを参照するための情報であってもよい。また、クエリや検索対象のデータは、画像、音声、テキストデータなど、如何なる種類のデータであってもよい。本実施形態において、情報処理装置１００が画像を検索する場合を一例として説明する。

〔３．情報処理装置の構成〕
次に、図６を用いて、実施形態に係る情報処理装置１００の構成について説明する。図６は、実施形態に係る情報処理装置１００の構成例を示す図である。図６に示すように、情報処理装置１００は、通信部１１０と、記憶部１２０と、制御部１３０とを有する。なお、情報処理装置１００は、情報処理装置１００の管理者等から各種操作を受け付ける入力部（例えば、キーボードやマウス等）や、各種情報を表示するための表示部（例えば、液晶ディスプレイ等）を有してもよい。

（通信部１１０）
通信部１１０は、例えば、ＮＩＣ（Network Interface Card）等によって実現される。そして、通信部１１０は、ネットワーク（例えば図５中のネットワークＮ）と有線または無線で接続され、端末装置１０や情報提供装置５０との間で情報の送受信を行う。

（記憶部１２０）
記憶部１２０は、例えば、ＲＡＭ（Random Access Memory）、フラッシュメモリ（Flash Memory）等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。実施形態に係る記憶部１２０は、図６に示すように、オブジェクト情報記憶部１２１と、条件情報記憶部１２２と、第１グラフ情報記憶部１２３と、起点用情報記憶部１２４と、第２グラフ情報記憶部１２５とを有する。なお、記憶部１２０は、様々な情報を記憶する。例えば、記憶部１２０は、各ノードがグラフに追加された順番を各ノード（オブジェクト）に対応付けて記憶する。記憶部１２０の第１グラフ情報記憶部１２３は、各ノードがグラフに追加された順番を各ノード（オブジェクト）に対応付けて記憶する。

（オブジェクト情報記憶部１２１）
実施形態に係るオブジェクト情報記憶部１２１は、オブジェクトに関する各種情報を記憶する。例えば、オブジェクト情報記憶部１２１は、オブジェクトＩＤやベクトルデータを記憶する。図７は、実施形態に係るオブジェクト情報記憶部の一例を示す図である。図７に示すオブジェクト情報記憶部１２１は、「オブジェクトＩＤ」、「ベクトル情報」といった項目が含まれる。

「オブジェクトＩＤ」は、オブジェクトを識別するための識別情報を示す。また、「ベクトル情報」は、オブジェクトＩＤにより識別されるオブジェクトに対応するベクトル情報を示す。すなわち、図７では、オブジェクトを識別するオブジェクトＩＤに対して、オブジェクトに対応するベクトルデータ（ベクトル情報）が対応付けられて登録されている。

例えば、図７では、ＩＤ「ＯＢ１」により識別されるオブジェクト（対象）は、「１０，２４，５１，２．．．」の多次元のベクトル情報が対応付けられることを示す。

なお、オブジェクト情報記憶部１２１は、上記に限らず、目的に応じて種々の情報を記憶してもよい。

（条件情報記憶部１２２）
実施形態に係る条件情報記憶部１２２は、処理の条件に関する各種情報を記憶する。図８は、実施形態に係る条件情報記憶部の一例を示す図である。図８に示す条件情報記憶部１２２は、「検索数」、「区間閾値」、「終了条件」といった項目が含まれる。

「検索数」は、対応する検索数の具体的な値を示す。例えば、「検索数」は、検索処理で選択するノードの数を示す。なお、図７では、検索数を「ＮＭ１」等と抽象的に示するが、検索数は、例えば「２」、「１００」等の具体的な数値である。

「区間閾値」は、区間の閾値を示す。例えば、「区間閾値」は、平均精度を算出するノードの数を示す。なお、図７では、区間閾値を「ＩＮ１」等と抽象的に示するが、区間閾値は、例えば「１０００」、「１００００」等の具体的な数値である。例えば、区間閾値が「１０００」である場合、１０００個のノードの精度の平均を算出することを示す。

「終了条件」は、処理の終了条件を示す。例えば、「終了条件」は、精製処理を終了する条件を示す。なお、図７では、終了条件を「ＴＣ１」等と抽象的に示するが、終了条件は、例えば「区間平均精度が１になること」、「区間平均精度が期待精度以上であること」等の具体的な条件である。例えば、終了条件が「区間平均精度が１になること」である場合、区間平均精度が１になった場合に、精製処理が終了することを示す。

図７では、検索数がＮＭ１であり、区間閾値がＩＮ１であり、区間閾値を「ＴＣ１であることを示す。

なお、条件情報記憶部１２２は、上記に限らず、目的に応じて種々の情報を記憶してもよい。

（第１グラフ情報記憶部１２３）
実施形態に係る第１グラフ情報記憶部１２３は、第１グラフ情報に関する各種情報を記憶する。例えば、第１グラフ情報記憶部１２３は、第１グラフ情報を記憶する。図９は、実施形態に係る第１グラフ情報記憶部の一例を示す図である。図９に示す第１グラフ情報記憶部１２３は、「ノードＩＤ」、「オブジェクトＩＤ」、および「エッジ情報」といった項目を有する。また、「エッジ情報」には、「エッジＩＤ」や「参照先」といった情報が含まれる。

「ノードＩＤ」は、グラフデータにおける各ノード（対象）を識別するための識別情報を示す。また、「オブジェクトＩＤ」は、オブジェクトを識別するための識別情報を示す。

また、「エッジ情報」は、対応するノードに接続されるエッジに関する情報を示す。図９では、「エッジ情報」は、対応するノードに連結されるエッジに関する情報を示す。また、「エッジＩＤ」は、ノード間を連結するエッジを識別するための識別情報を示す。また、「参照先」は、エッジにより連結された参照先（ノード）を示す情報を示す。すなわち、図９では、ノードを識別するノードＩＤに対して、そのノードに対応するオブジェクト（対象）を識別する情報やそのノードからのエッジが連結される参照先（ノード）が対応付けられて登録されている。

図９では、ノードＩＤ「Ｎ１」により識別されるノード（ノードＮ１）は、オブジェクトＩＤ「ＯＢ１」により識別されるオブジェクト（対象）に対応することを示す。また、ノードＮ１からは、エッジＩＤ「Ｅ１」により識別されるエッジ（エッジＥ１）が、ノードＩＤ「Ｎ２」により識別されるノード（ノードＮ２）に連結されることを示す。すなわち、図９では、グラフデータにおけるノードＮ１からはエッジＥ１によりノードＮ２へ辿ることができることを示す。また、ノードＮ１からは、エッジＩＤ「Ｅ４」により識別されるエッジ（エッジＥ４）が、ノードＩＤ「Ｎ４」により識別されるノード（ノードＮ４）に連結されることを示す。すなわち、図９では、グラフデータにおけるノードＮ１からはエッジＥ４によりノードＮ４へ辿ることができることを示す。

また、ノードＩＤ「Ｎ２」により識別されるノード（ノードＮ２）は、オブジェクトＩＤ「ＯＢ２」により識別されるオブジェクト（対象）に対応することを示す。また、ノードＮ２からは、エッジＩＤ「Ｅ１」により識別されるエッジ（エッジＥ１）が、ノードＩＤ「Ｎ１」により識別されるノード（ノードＮ１）に連結されることを示す。すなわち、図９では、グラフデータにおけるノードＮ２からはエッジＥ１によりノードＮ１へ辿ることができることを示す。図９に示す第１グラフ情報記憶部１２３は、グラフＧＲ１１－６に対応するグラフ情報を記憶する場合を示す。

なお、第１グラフ情報記憶部１２３は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、第１グラフ情報記憶部１２３は、各ノード（ベクトル）間を連結するエッジの長さが記憶されてもよい。すなわち、第１グラフ情報記憶部１２３は、各ノード（ベクトル）間の距離を示す情報が記憶されてもよい。また、例えば、第１グラフ情報記憶部１２３は、各ノードへの入力エッジの数を示す情報が記憶されてもよい。

また、グラフデータは、クエリを入力とし、グラフデータ中のエッジを辿ることによりノードを探索し、クエリに類似するノードを抽出し出力するプログラムモジュールを含んでもよい。すなわち、グラフデータは、グラフを用いて検索処理を行うプログラムモジュールとしての利用が想定されるものであってもよい。例えば、グラフデータＧＲ１１は、クエリとしてベクトルデータが入力された場合に、そのベクトルデータに類似するベクトルデータに対応するノードをグラフ中から抽出し、出力するプログラムであってもよい。例えば、グラフデータＧＲ１１は、クエリ画像に対応する類似画像を検索するプログラムモジュールとして利用されるデータであってもよい。例えば、グラフデータＧＲ１１は、入力されたクエリに基づいて、グラフにおいてそのクエリに類似するノードを抽出し、出力するよう、コンピュータを機能させる。

（起点用情報記憶部１２４）
実施形態に係る起点用情報記憶部１２４は、起点用情報に関する各種情報を記憶する。図１０は、実施形態に係る起点用情報記憶部の一例を示す図である。具体的には、図１０では、起点用情報記憶部１２４は、ツリー構造の起点用インデックス情報を示す。図１０では、起点用情報記憶部１２４は、「ルート階層」、「第１階層」、「第２階層」、「第３階層」等といった項目が含まれる。なお、「第１階層」～「第３階層」に限らず、インデックスの階層数に応じて、「第４階層」、「第５階層」、「第６階層」等が含まれてもよい。

「ルート階層」は、インデックスを用いた起点ノードの決定の開始点となるルート（最上位）の階層を示す。「第１階層」は、インデックスの第１階層に属するノード（節点またはグラフ情報中のベクトル）を識別（特定）する情報が格納される。「第１階層」に格納されるノードは、インデックスの根（ルート）に直接結ばれる階層に対応するノードとなる。

「第２階層」は、インデックスの第２階層に属するノード（節点またはグラフ情報中のベクトル）を識別（特定）する情報が格納される。「第２階層」に格納されるノードは、第１階層のノードに結ばれる直下の階層に対応するノードとなる。「第３階層」は、インデックスの第３階層に属するノード（節点またはグラフ情報中のベクトル）を識別（特定）する情報が格納される。「第３階層」に格納されるノードは、第２階層のノードに結ばれる直下の階層に対応するノードとなる。

図１０に示す例においては、起点用情報記憶部１２４には、図１中の起点用情報ＩＮＤ１１に対応する情報が記憶される。例えば、起点用情報記憶部１２４は、第１階層のノードが、節点ＶＴ１～ＶＴ３等であることを示す。また、各節点の下の括弧内の数値は、各節点に対応するベクトルの値を示す。

また、起点用情報記憶部１２４は、節点ＶＴ２の直下の第２階層のノードが、節点ＶＴ２－１～ＶＴ２－４であることを示す。また、起点用情報記憶部１２４は、節点ＶＴ２－１の直下の第３階層のノードが、ノードＮ２、ノードＮ５のグラフＧＲ１１中のノード（ベクトル）であることを示す。起点用情報記憶部１２４は、節点ＶＴ２－２の直下の第３階層のノードが、ノードＮ１、ノードＮ３、ノードＮ４のグラフＧＲ１１中のノード（ベクトル）であることを示す。

なお、起点用情報記憶部１２４は、上記に限らず、目的に応じて種々の情報を記憶してもよい。

（第２グラフ情報記憶部１２５）
実施形態に係る第２グラフ情報記憶部１２５は、第２グラフ情報に関する各種情報を記憶する。例えば、第２グラフ情報記憶部１２５は、第２グラフ情報を記憶する。図１１は、実施形態に係る第２グラフ情報記憶部の一例を示す図である。図１１に示す第２グラフ情報記憶部１２５は、「ノードＩＤ」、「オブジェクトＩＤ」、および「エッジ情報」といった項目を有する。また、「エッジ情報」には、「エッジＩＤ」や「参照先」といった情報が含まれる。

また、「エッジ情報」は、対応するノードに接続されるエッジに関する情報を示す。図１１では、「エッジ情報」は、対応するノードに連結されるエッジに関する情報を示す。また、「エッジＩＤ」は、ノード間を連結するエッジを識別するための識別情報を示す。また、「参照先」は、エッジにより連結された参照先（ノード）を示す情報を示す。すなわち、図１１では、ノードを識別するノードＩＤに対して、そのノードに対応するオブジェクト（対象）を識別する情報やそのノードからのエッジが連結される参照先（ノード）が対応付けられて登録されている。

図１１では、ノードＩＤ「Ｎ１」により識別されるノード（ノードＮ１）は、オブジェクトＩＤ「ＯＢ１」により識別されるオブジェクト（対象）に対応することを示す。また、ノードＮ１からは、エッジＩＤ「Ｅ１００」により識別されるエッジ（エッジＥ１００）が、ノードＩＤ「Ｎ７２」により識別されるノード（ノードＮ７２）に連結されることを示す。すなわち、図１１では、グラフデータにおけるノードＮ１からはエッジＥ１００によりノードＮ７２へ辿ることができることを示す。

このように、図１１に示す第２グラフ情報記憶部１２５は、グラフＧＲ１１－７に対応するグラフ情報を記憶する場合を示す。すなわち、図１１では、図９に示すグラフにエッジＥ１００が追加されたグラフの情報が記憶された状態を示す。図１１に示す第２グラフ情報記憶部１２５は、図９に対応するグラフＧＲ１１－６にエッジＥ１００が追加されたグラフＧＲ１１－７に対応するグラフ情報を記憶する場合を示す。

なお、第２グラフ情報記憶部１２５は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、第２グラフ情報記憶部１２５は、各ノード（ベクトル）間を連結するエッジの長さが記憶されてもよい。すなわち、第２グラフ情報記憶部１２５は、各ノード（ベクトル）間の距離を示す情報が記憶されてもよい。また、例えば、第２グラフ情報記憶部１２５は、各ノードへの入力エッジの数を示す情報が記憶されてもよい。

また、図１１では、精製処理後のグラフデータを示すために第２グラフ情報記憶部１２５に記憶する場合を図示するが、精製処理後のグラフデータは、第１グラフ情報記憶部１２３に記憶されてもよい。例えば、情報処理装置１００は、第２グラフ情報記憶部１２５に、精製処理中のグラフデータを記憶し、精製処理完了後において、精製処理完了後のグラフデータにより、第１グラフ情報記憶部１２３を更新する。例えば、情報処理装置１００は、精製処理完了後において、第２グラフ情報記憶部１２５に記憶されたグラフデータを、第１グラフ情報記憶部１２３に格納することにより、第１グラフ情報記憶部１２３を更新する。なお、上記は一例であり、第１グラフ情報記憶部１２３に精製処理後のグラフデータが記憶されれば、どのような方法により、第１グラフ情報記憶部１２３を更新してもよい。情報処理装置１００が第２グラフ情報記憶部１２５を用いることなく、第１グラフ情報記憶部１２３を更新する場合は、情報処理装置１００は、第２グラフ情報記憶部１２５を有しなくてもよい。

（制御部１３０）
図６の説明に戻って、制御部１３０は、コントローラ（controller）であり、例えば、ＣＰＵ（Central Processing Unit）やＭＰＵ（Micro Processing Unit）やＧＰＵ（Graphics Processing Unit）等によって、情報処理装置１００内部の記憶装置に記憶されている各種プログラム（情報処理プログラムの一例に相当）がＲＡＭを作業領域として実行されることにより実現される。また、制御部１３０は、コントローラであり、例えば、ＡＳＩＣ（Application Specific Integrated Circuit）やＦＰＧＡ（Field Programmable Gate Array）等の集積回路により実現される。

図６に示すように、制御部１３０は、取得部１３１と、抽出部１３２と、第１生成部１３３と、算出部１３４と、第２生成部１３５と、提供部１３６とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部１３０の内部構成は、図６に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。

（取得部１３１）
取得部１３１は、各種情報を取得する。例えば、取得部１３１は、記憶部１２０から各種情報を取得する。例えば、取得部１３１は、オブジェクト情報記憶部１２１や、条件情報記憶部１２２や、第１グラフ情報記憶部１２３や、起点用情報記憶部１２４や、第２グラフ情報記憶部１２５等から各種情報を取得する。また、取得部１３１は、各種情報を外部の情報処理装置から受信する。

取得部１３１は、検索対象となる複数のオブジェクトの各々に対応する複数のノードがエッジで連結されたグラフを第１グラフとして取得する。取得部１３１は、複数のノードを所定の順序で追加し、追加済みのノードを対象としてエッジを連結する逐次登録処理により生成されたグラフを取得する。取得部１３１は、第１生成部１３３が実行する逐次登録処理により生成されたグラフを第１グラフとして取得する。

取得部１３１は、複数のノードがエッジで連結された第１グラフと、追加ノードとを取得する。取得部１３１は、所定数の追加ノードを取得する。取得部１３１は、第１グラフに追加される一のノードである追加ノードを取得する。

取得部１３１は、データ検索の対象となる一のオブジェクトと、一のオブジェクトとは異なる他のオブジェクトの各々に対応する複数のノード、及びノード間を連結するエッジを含む第１グラフとを取得する。取得部１３１は、データ検索の対象となる一のオブジェクトに対応する一の追加ノードを取得する。

また、取得部１３１は、グラフデータを取得してもよい。例えば、情報処理装置１００は、図１中のグラフＧＲ１１－１を取得してもよい。例えば、情報処理装置１００は、情報提供装置５０等の外部装置からグラフデータを取得してもよい。

例えば、取得部１３１は、検索クエリに関する情報を取得する。例えば、取得部１３１は、画像検索に関する検索クエリを取得する。例えば、取得部１３１は、利用する端末装置１０からクエリを取得する。例えば、取得部１３１は、利用する端末装置１０からクエリを受け付けた情報提供装置５０からクエリを取得する。

（抽出部１３２）
抽出部１３２は、種々の情報を抽出する。抽出部１３２は、各種情報を検索する検索部として機能する。例えば、抽出部１３２は、オブジェクトに関する検索サービスを提供する検索部として機能する。抽出部１３２は、各種情報を探索する。抽出部１３２は、各種情報を検索する。例えば、抽出部１３２は、グラフデータを探索することにより、オブジェクトを検索する。例えば、抽出部１３２は、第１生成部１３３からの指示に応じて、グラフを検索する検索処理を実行する。例えば、抽出部１３２は、第２生成部１３５からの指示に応じて、グラフを検索する検索処理を実行する。例えば、抽出部１３２は、処理対象となるノードを示す情報が与えられた場合、図１４に示すような処理手順に基づいて、グラフを探索することにより、対象となるノード（オブジェクト）に類似するノード（オブジェクト）を抽出する。抽出部１３２は、複数のノードのうち一のノードを対象ノードとして、グラフを検索する検索処理により、対象ノードの近傍ノードを抽出する。

例えば、抽出部１３２は、オブジェクト情報記憶部１２１や、条件情報記憶部１２２や、第１グラフ情報記憶部１２３や、起点用情報記憶部１２４や、第２グラフ情報記憶部１２５等から各種情報を抽出する。例えば、抽出部１３２は、取得部１３１により取得された情報に基づいて、各種情報を抽出する。

抽出部１３２は、複数のノードから所定の数（例えば検索数等）のノードを近傍ノードとして抽出する。抽出部１３２は、第１グラフを探索することにより、近傍ノードを抽出する検索処理を行う。抽出部１３２は、複数のノードのうち、追加ノードとの関係に基づいて、所定の数のノードを近傍ノードとして抽出する検索処理を行う。抽出部１３２は、複数のノードの各々と、追加ノードとの間の距離に基づいて、所定の数のノードを近傍ノードとして抽出する検索処理を行う。

例えば、抽出部１３２は、取得部１３１により取得されたクエリが取得された場合、グラフデータを探索することにより、クエリに類似するオブジェクトを検索する。例えば、抽出部１３２は、グラフデータを探索することにより、クエリに類似するオブジェクトを抽出する。例えば、抽出部１３２は、図１４に示すような処理手順に基づいて、グラフデータを探索することにより、クエリに類似するオブジェクトを抽出する。

抽出部１３２は、第１グラフを探索することにより、近傍ノードを抽出する。抽出部１３２は、追加ノードをクエリとして、第１グラフを探索することにより、所定数（図１の場合２個）の近傍ノードを抽出する。抽出部１３２は、図１４に示すような検索処理により、第１グラフを探索することにより、近傍ノードを抽出する。

図１では、抽出部１３２は、生成中のグラフＧＲ１１を用いて、追加ノードの近傍ノードをグラフＧＲ１１から抽出する検索処理を実行する。抽出部１３２は、追加ノードであるノードＮ３をクエリとして、図１４に示すような処理手順によりグラフＧＲ１１－１を探索し、ノードＮ３の近傍ノードとして、検索数「２」に対応する２個のノードＮ１、Ｎ２を抽出する。抽出部１３２は、追加ノードであるノードＮ７をクエリとして、図１４に示すような処理手順によりグラフＧＲ１１－６を探索し、ノードＮ７の近傍ノードとして、検索数「２」に対応する２個のノードＮ１、Ｎ６を抽出する。

（第１生成部１３３）
第１生成部１３３は、各種情報を生成する。例えば、第１生成部１３３は、記憶部１２０に記憶された情報（データ）から各種情報（データ）を生成する。例えば、第１生成部１３３は、オブジェクト情報記憶部１２１や、条件情報記憶部１２２や、第１グラフ情報記憶部１２３や、起点用情報記憶部１２４や、第２グラフ情報記憶部１２５等から各種情報を生成する。

例えば、第１生成部１３３は、取得部１３１により取得された情報に基づいて、各種情報を生成する。第１生成部１３３は、抽出部１３２により抽出された情報に基づいて、各種情報を生成する。第１生成部１３３は、逐次登録処理によりグラフを生成する。第１生成部１３３は、図１に示すような逐次登録処理によりグラフ（第１グラフデータ等）を生成する。なお、情報処理装置１００は、第１グラフを外部装置から取得する場合、第１生成部１３３を有しなくてもよい。

（算出部１３４）
算出部１３４は、各種情報を算出する。算出部１３４は、各種情報を選択する。算出部１３４は、記憶部１２０に記憶された各種情報に基づいて、種々の情報を算出する。算出部１３４は、記憶部１２０に記憶された各種情報に基づいて、種々の情報を選択する。例えば、算出部１３４は、オブジェクト情報記憶部１２１や、条件情報記憶部１２２や、第１グラフ情報記憶部１２３や、起点用情報記憶部１２４や、第２グラフ情報記憶部１２５等から各種情報を算出する。算出部１３４は、精度を算出する。例えば、算出部１３４は、取得部１３１により取得された情報に基づいて、各種情報を算出する。算出部１３４は、抽出部１３２により抽出された情報に基づいて、各種情報を算出する。

算出部１３４は、複数のノードのうち一のノードを対象ノードとして、グラフを検索する検索処理により、対象ノードの近傍ノードとして抽出された第１ノードと、グラフにおいて対象ノードとの間がエッジで連結されたノードである第２ノードとに基づいて、グラフに関する精度を算出する。算出部１３４は、第１ノードに対する第２ノードの割合により精度を算出する。算出部１３４は、第１ノードのうち第２ノードに該当するノードの割合により精度を算出する。

算出部１３４は、複数のノードから順次選択される一のノードを対象ノードとして、精度を算出する。算出部１３４は、複数のノードのうち、所定数のノードの精度の平均である平均精度を算出する。算出部１３４は、複数のノードの処理順序に対応する一の区間に対応する所定数のノードの平均精度である区間平均精度を算出する。

算出部１３４は、一の区間の区間平均精度を基に終了条件を満たさない場合、一の区間の次の区間に対応する所定数のノードの区間平均精度を算出する。算出部１３４は、前の区間における区間平均精度に応じて決定される検索数による検索処理により抽出された第１ノードと、第２ノードとに基づいて、精度を算出する。算出部１３４は、期待精度を示す所定の値と、前の区間における検索結果に応じて決定される検索数による検索処理により抽出された第１ノードと、第２ノードとに基づいて、精度を算出する。

（第２生成部１３５）
第２生成部１３５は、各種情報を生成する。例えば、第２生成部１３５は、記憶部１２０に記憶された情報（データ）から各種情報（データ）を生成する。例えば、第２生成部１３５は、オブジェクト情報記憶部１２１や、条件情報記憶部１２２や、第１グラフ情報記憶部１２３や、起点用情報記憶部１２４や、第２グラフ情報記憶部１２５等から各種情報を生成する。例えば、第２生成部１３５は、精製処理により第１グラフに新たなエッジを追加した第２グラフを生成する。第２生成部１３５は、グラフの順序情報を用いて、対象ノードを選択し、選択した対象ノードについて精製処理を行う。第２生成部１３５は、グラフＧＲ１１の順序情報を用いて、ノードＮ１、Ｎ２、Ｎ３の順で各ノードを対象ノードを選択し、選択した対象ノードについて精製処理を行いグラフＧＲ１１を更新する。

例えば、第２生成部１３５は、取得部１３１により取得された情報に基づいて、各種情報を生成する。第２生成部１３５は、抽出部１３２により抽出された情報に基づいて、各種情報を生成する。第２生成部１３５は、第１生成部１３３により生成された情報に基づいて、各種情報を生成する。第２生成部１３５は、算出部１３４により算出された情報に基づいて、各種情報を生成する。第２生成部１３５は、エッジに対して削除処理を行うかどうかを決定する。第２生成部１３５は、エッジが削除処理を行う対象かどうかを判定する。

第２生成部１３５は、複数のノードのうち一のノードを対象ノードとして、グラフを検索する検索処理により、対象ノードの近傍ノードとして抽出された第１ノードと、グラフにおいて対象ノードとの間がエッジで連結されたノードである第２ノードとに基づいて、第１ノードのうち、第２ノードに該当しないノードと、対象ノードとの間を連結するエッジをグラフに追加する精製処理を実行する。第２生成部１３５は、抽出部１３２により抽出された第１ノードと、第２ノードとに基づいて、第１ノードのうち、第２ノードに該当しないノードと、対象ノードとの間を連結するエッジをグラフに追加する精製処理を実行する。

第２生成部１３５は、算出部１３４による処理結果に応じて、処理を実行する。第２生成部１３５は、逐次登録処理で追加された順序で選択される一のノードを対象ノードとする検索処理により抽出された第１ノードと、第２ノードとに基づいて、精製処理を実行する。第２生成部１３５は、対象ノードを起点とする検索処理により抽出された第１ノードと、第２ノードとに基づいて、対象ノードを対象とする精製処理を実行する。第２生成部１３５は、複数のノードから順次選択される一のノードを対象ノードとして、精製処理を繰り返す。

第２生成部１３５は、算出部１３４により算出される精度に応じた終了条件を満たすまで、対象ノードを対象とする精製処理を繰り返す。第２生成部１３５は、複数のノードの全てを対象ノードとして精製処理を行う前に、終了条件を満たす場合、複数のノードのうち一部を対象ノードとする精製処理を行わない。第２生成部１３５は、平均精度を基に終了条件を満たすかを判定する。第２生成部１３５は、区間平均精度を基に終了条件を満たすかを判定する。第２生成部１３５は、終了条件を満たすと判定した場合、精製処理を終了する。

（提供部１３６）
提供部１３６は、各種情報を提供する。例えば、提供部１３６は、端末装置１０や情報提供装置５０に各種情報を送信する。例えば、提供部１３６は、クエリに対応するオブジェクトＩＤを検索結果として提供する。例えば、提供部１３６は、抽出部１３２により検索されたオブジェクトＩＤを情報提供装置５０へ提供する。例えば、提供部１３６は、抽出部１３２が検索により抽出したオブジェクトＩＤを情報提供装置５０へ提供する。提供部１３６は、抽出部１３２により抽出されたオブジェクトＩＤをクエリに対応するベクトルを示す情報として情報提供装置５０に提供する。

また、提供部１３６は、第２生成部１３５により生成された第２グラフデータ（第２グラフ情報）を外部の情報処理装置へ提供してもよい。例えば、提供部１３６は、第２生成部１３５により生成されたグラフＧＲ１１を情報提供装置５０に送信してもよい。

〔４．情報処理のフロー〕
次に、図１２を用いて、実施形態に係る情報処理システム１による情報処理の手順について説明する。図１２は、実施形態に係る情報処理の一例を示すフローチャートである。

図１２に示すように、情報処理装置１００は、検索対象となる複数のオブジェクトの各々に対応する複数のノードがエッジで連結された第１グラフを取得する（ステップＳ１０１）。例えば、情報処理装置１００は、第１グラフ情報記憶部１２３（図９参照）に記憶されたグラフを第１グラフとして取得する。

そして、情報処理装置１００は、第１グラフ中の一のノードを対象ノードとして、第１グラフを検索する検索処理により、対象ノードの近傍ノードとして抽出された第１ノードと、第１グラフにおいて対象ノードとの間がエッジで連結されたノードである第２ノードとの比較に基づいて、第１ノードのうち、第２ノードに該当しないノードと、対象ノードとの間を連結するエッジを第１グラフに追加する追加処理により、第２グラフを生成
する（ステップＳ１０２）。例えば、情報処理装置１００は、第１ノードのうち、第２ノードに該当しないノードと、対象ノードとの間を連結するエッジを第１グラフに追加する追加処理により、第２グラフを生成することでグラフを更新する。

〔５．検索例〕
ここで、上述したグラフデータを用いた検索の一例を示す。なお、生成したグラフデータを用いた検索は下記に限らず、種々の手順により行われてもよい。この点について、図１４を一例として説明する。図１４は、グラフデータを用いた検索処理の一例を示すフローチャートである。以下に説明する検索処理は、情報処理装置１００の抽出部１３２によって行われる。また、以下でいうオブジェクトは、ノードと読み替えてもよい。なお、以下では、情報処理装置１００（の抽出部１３２等）が検索処理を行う。以下で説明する処理の検索クエリは、追加ノードや対象ノードやユーザが指定したオブジェクト等であってもよい。

ここでは、近傍オブジェクト集合Ｎ（Ｇ，ｙ）は、ノードｙに付与されているエッジにより関連付けられている近傍のオブジェクトの集合である。「Ｇ」は、所定のグラフデータ（例えば、第２グラフＧＲ１２等）であってもよい。例えば、情報処理装置１００は、ｋ近傍検索処理を実行する。

例えば、情報処理装置１００は、超球の半径ｒを∞（無限大）に設定し（ステップＳ３００）、既存のオブジェクト集合から部分集合Ｓを抽出する（ステップＳ３０１）。例えば、情報処理装置１００は、ルートノードとして選択されたオブジェクト（ノード）を部分集合Ｓとして抽出してもよい。また、例えば、超球とは、検索範囲を示す仮想的な球である。なお、ステップＳ３０１において抽出されたオブジェクト集合Ｓに含まれるオブジェクトは、同時に検索結果のオブジェクト集合Ｒの初期集合にも含められる。

次に、情報処理装置１００は、オブジェクト集合Ｓに含まれるオブジェクトの中で、検索クエリオブジェクトをｙとするとオブジェクトｙとの距離が最も短いオブジェクトを抽出し、オブジェクトｓとする（ステップＳ３０２）。例えば、情報処理装置１００は、ルートノードとして選択されたオブジェクト（ノード）のみがＳの要素の場合には、結果的にルートノードがオブジェクトｓとして抽出される。次に、情報処理装置１００は、オブジェクトｓをオブジェクト集合Ｓから除外する（ステップＳ３０３）。

次に、情報処理装置１００は、オブジェクトｓとオブジェクトｙとの距離ｄ（ｓ，ｙ）がｒ（１＋ε）を超えるか否かを判定する（ステップＳ３０４）。ここで、εは拡張要素であり、ｒ（１＋ε）は、探索範囲（この範囲内のノードのみを探索する。検索範囲よりも大きくすることで精度を高めることができる）の半径を示す値である。オブジェクトｓとオブジェクトｙとの距離ｄ（ｓ，ｙ）がｒ（１＋ε）を超える場合（ステップＳ３０４：Ｙｅｓ）、情報処理装置１００は、オブジェクト集合Ｒをオブジェクトｙの近傍オブジェクト集合として出力し（ステップＳ３０５）、処理を終了する。

オブジェクトｓと検索クエリオブジェクトｙとの距離ｄ（ｓ，ｙ）がｒ（１＋ε）を超えない場合（ステップＳ３０４：Ｎｏ）、情報処理装置１００は、オブジェクトｓの近傍オブジェクト集合Ｎ（Ｇ，ｓ）の要素であるオブジェクトの中からオブジェクト集合Ｃに含まれないオブジェクトを一つ選択し、選択したオブジェクトｕを、オブジェクト集合Ｃに格納する（ステップＳ３０６）。オブジェクト集合Ｃは、重複検索を回避するために便宜上設けられるものであり、処理開始時には空集合に設定される。

次に、情報処理装置１００は、オブジェクトｕとオブジェクトｙとの距離ｄ（ｕ，ｙ）がｒ（１＋ε）以下であるか否かを判定する（ステップＳ３０７）。オブジェクトｕとオブジェクトｙとの距離ｄ（ｕ，ｙ）がｒ（１＋ε）以下である場合（ステップＳ３０７：Ｙｅｓ）、情報処理装置１００は、オブジェクトｕをオブジェクト集合Ｓに追加する（ステップＳ３０８）。また、オブジェクトｕとオブジェクトｙとの距離ｄ（ｕ，ｙ）がｒ（１＋ε）以下ではない場合（ステップＳ３０７：Ｎｏ）、情報処理装置１００は、ステップＳ３０９の判定（処理）を行う。

次に、情報処理装置１００は、オブジェクトｕとオブジェクトｙとの距離ｄ（ｕ，ｙ）がｒ以下であるか否かを判定する（ステップＳ３０９）。オブジェクトｕとオブジェクトｙとの距離ｄ（ｕ，ｙ）がｒを超える場合、情報処理装置１００は、ステップＳ３１５の判定（処理）を行う。また、オブジェクトｕとオブジェクトｙとの距離ｄ（ｕ，ｙ）がｒ以下ではない場合（ステップＳ３０９：Ｎｏ）、情報処理装置１００は、ステップＳ３１５の判定（処理）を行う。

オブジェクトｕとオブジェクトｙとの距離ｄ（ｕ，ｙ）がｒ以下である場合（ステップＳ３０９：Ｙｅｓ）、情報処理装置１００は、オブジェクトｕをオブジェクト集合Ｒに追加する（ステップＳ３１０）。そして、情報処理装置１００は、オブジェクト集合Ｒに含まれるオブジェクト数がｋｓを超えるか否かを判定する（ステップＳ３１１）。所定数ｋｓは、任意に定められる自然数である。例えば、ｋｓは、検索数であってもよい。例えば、ｋｓ＝２であってもよい。オブジェクト集合Ｒに含まれるオブジェクト数がｋｓを超えない場合（ステップＳ３１１：Ｎｏ）、情報処理装置１００は、ステップＳ３１３の判定（処理）を行う。

オブジェクト集合Ｒに含まれるオブジェクト数がｋｓを超える場合（ステップＳ３１１：Ｙｅｓ）、情報処理装置１００は、オブジェクト集合Ｒに含まれるオブジェクトの中でオブジェクトｙとの距離が最も長い（遠い）オブジェクトを、オブジェクト集合Ｒから除外する（ステップＳ３１２）。

次に、情報処理装置１００は、オブジェクト集合Ｒに含まれるオブジェクト数がｋｓと一致するか否かを判定する（ステップＳ３１３）。オブジェクト集合Ｒに含まれるオブジェクト数がｋｓと一致しない場合（ステップＳ３１３：Ｎｏ）、情報処理装置１００は、ステップＳ３１５の判定（処理）を行う。また、オブジェクト集合Ｒに含まれるオブジェクト数がｋｓと一致する場合（ステップＳ３１３：Ｙｅｓ）、情報処理装置１００は、オブジェクト集合Ｒに含まれるオブジェクトの中でオブジェクトｙとの距離が最も長い（遠い）オブジェクトと、オブジェクトｙとの距離を、新たなｒに設定する（ステップＳ３１４）。

そして、情報処理装置１００は、オブジェクトｓの近傍オブジェクト集合Ｎ（Ｇ，ｓ）の要素であるオブジェクトから全てのオブジェクトを選択してオブジェクト集合Ｃに格納し終えたか否かを判定する（ステップＳ３１５）。オブジェクトｓの近傍オブジェクト集合Ｎ（Ｇ，ｓ）の要素であるオブジェクトから全てのオブジェクトを選択してオブジェクト集合Ｃに格納し終えていない場合（ステップＳ３１５：Ｎｏ）、情報処理装置１００は、ステップＳ３０６に戻って処理を繰り返す。

オブジェクトｓの近傍オブジェクト集合Ｎ（Ｇ，ｓ）の要素であるオブジェクトから全てのオブジェクトを選択してオブジェクト集合Ｃに格納し終えた場合（ステップＳ３１５：Ｙｅｓ）、情報処理装置１００は、オブジェクト集合Ｓが空集合であるか否かを判定する（ステップＳ３１６）。オブジェクト集合Ｓが空集合でない場合（ステップＳ３１６：Ｎｏ）、情報処理装置１００は、ステップＳ３０２に戻って処理を繰り返す。また、オブジェクト集合Ｓが空集合である場合（ステップＳ３１６：Ｙｅｓ）、情報処理装置１００は、オブジェクト集合Ｒを出力し、処理を終了する（ステップＳ３１７）。例えば、情報処理装置１００は、オブジェクト集合Ｒに含まれるオブジェクト（ノード）を追加ノード（入力オブジェクトｙ）に対応する近傍ノードとして選択してもよい。例えば、情報処理装置１００は、オブジェクト集合Ｒに含まれるオブジェクト（ノード）を対象ノード（入力オブジェクトｙ）に対応する近傍ノードとして選択してもよい。また、例えば、情報処理装置１００は、オブジェクト集合Ｒに含まれるオブジェクト（ノード）を検索クエリ（入力オブジェクトｙ）に対応する検索結果として、検索を行った端末装置等へ提供してもよい。

〔６．効果〕
上述してきたように、実施形態に係る情報処理装置（実施形態では「情報処理装置１００」に対応）は、取得部（実施形態では「取得部１３１」に対応）と、生成部（実施形態では「第２生成部１３５」に対応）とを有する。取得部は、検索対象となる複数のオブジェクトの各々に対応する複数のノードがエッジで連結されたグラフを取得する。生成部は、複数のノードのうち一のノードを対象ノードとして、グラフを検索する検索処理により、対象ノードの近傍ノードとして抽出された第１ノードと、グラフにおいて対象ノードとの間がエッジで連結されたノードである第２ノードとに基づいて、第１ノードのうち、第２ノードに該当しないノードと、対象ノードとの間を連結するエッジをグラフに追加する精製処理を実行する。

このように、実施形態に係る情報処理装置は、グラフを検索する検索処理により、対象ノードの近傍ノードとして抽出された第１ノードと、グラフにおいて対象ノードとの間がエッジで連結された第２ノードとに基づいて、第１ノードのうち、第２ノードに該当しないノードと、対象ノードとの間を連結するエッジをグラフに追加する精製処理を実行する。これにより、情報処理装置は、グラフにエッジを追加することによりグラフを適切に生成することができる。

また、実施形態に係る情報処理装置において、取得部は、複数のノードを所定の順序で追加し、追加済みのノードを対象としてエッジを連結する逐次登録処理により生成されたグラフを取得する。

これにより、実施形態に係る情報処理装置は、逐次登録処理により生成されたグラフを対象として、そのグラフにエッジを追加することができる。そのため、情報処理装置は、グラフにエッジを追加することによりグラフを適切に生成することができる。

また、実施形態に係る情報処理装置において、生成部は、逐次登録処理で追加された順序で選択される一のノードを対象ノードとする検索処理により抽出された第１ノードと、第２ノードとに基づいて、精製処理を実行する。

これにより、実施形態に係る情報処理装置は、逐次登録処理で追加されたノードの順序で精製処理を実行することにより、近傍ノードにエッジが接続されていない可能性が高いノードから順に対象として、グラフにエッジを追加することができる。そのため、情報処理装置は、グラフにエッジを追加することによりグラフを適切に生成することができる。

また、実施形態に係る情報処理装置において、生成部は、対象ノードを起点とする検索処理により抽出された第１ノードと、第２ノードとに基づいて、対象ノードを対象とする精製処理を実行する。

これにより、実施形態に係る情報処理装置は、対象ノードを起点として検索処理を行って第１ノードが抽出されることにより、効率的に抽出された第１ノードを用いて処理を行うことができる。そのため、情報処理装置は、グラフにエッジを追加することによりグラフを適切に生成することができる。

また、実施形態に係る情報処理装置は、算出部（実施形態では「算出部１３４」に対応）を有する。算出部は、第１ノードと、第２ノードとに基づいて、グラフに関する精度を算出する。

これにより、実施形態に係る情報処理装置は、算出した精度を用いた処理が可能となる。

また、実施形態に係る情報処理装置において、算出部は、第１ノードに対する第２ノードの割合により精度を算出する。

これにより、実施形態に係る情報処理装置は、第１ノードと第２ノードとの関係を基に算出した精度を用いた処理が可能となる。

また、実施形態に係る情報処理装置において、算出部は、第１ノードのうち第２ノードに該当するノードの割合により精度を算出する。

また、実施形態に係る情報処理装置において、算出部は、複数のノードから順次選択される一のノードを対象ノードとして、精度を算出する。生成部は、複数のノードから順次選択される一のノードを対象ノードとして、精製処理を繰り返す。

このように、実施形態に係る情報処理装置は、順次選択されたノードを対象として、精度の算出及び精製処理を行う。これにより、情報処理装置は、精度を用いた処理が可能となるとともに、グラフにエッジを追加することによりグラフを適切に生成することができる。

また、実施形態に係る情報処理装置において、生成部は、算出部により算出される精度に応じた終了条件を満たすまで、対象ノードを対象とする精製処理を繰り返す。

このように、実施形態に係る情報処理装置は、算出した精度に応じた終了条件を満たすまで、対象ノードを対象とする精製処理を繰り返すことにより、適切に精製処理を繰り返し実行することができる。そのため、情報処理装置は、グラフにエッジを追加することによりグラフを適切に生成することができる。

また、実施形態に係る情報処理装置において、生成部は、複数のノードの全てを対象ノードとして精製処理を行う前に、終了条件を満たす場合、複数のノードのうち一部を対象ノードとする精製処理を行わない。

このように、実施形態に係る情報処理装置は、全てのノードについて精製処理を実行する前に終了条件を満たした場合は、そこで処理を終了する。これにより、情報処理装置は、適切なタイミングで処理を終了することができる。

また、実施形態に係る情報処理装置において、算出部は、複数のノードのうち、所定数のノードの精度の平均である平均精度を算出する。生成部は、平均精度を基に終了条件を満たすかを判定する。

このように、実施形態に係る情報処理装置は、所定数のノードの平均精度を基に終了条件を満たすかを判定するすることにより、適切に終了を判定することができる。

また、実施形態に係る情報処理装置において、算出部は、複数のノードの処理順序に対応する一の区間に対応する所定数のノードの平均精度である区間平均精度を算出する。生成部は、区間平均精度を基に終了条件を満たすかを判定する。

このように、実施形態に係る情報処理装置は、複数のノードの処理順序に対応する一の区間に対応する区間平均精度を基に終了条件を満たすかを判定するすることにより、適切に終了を判定することができる。

また、実施形態に係る情報処理装置において、算出部は、一の区間の区間平均精度を基に終了条件を満たさない場合、一の区間の次の区間に対応する所定数のノードの区間平均精度を算出する。

このように、実施形態に係る情報処理装置は、一の区間の区間平均精度を基に終了条件を満たさず、処理を継続する場合、一の区間の次の区間に対応する所定数のノードの区間平均精度を算出する。これにより、情報処理装置は、終了条件を満たすか否かに応じて、適切に処理を行うことができる。

また、実施形態に係る情報処理装置において、算出部は、前の区間における区間平均精度に応じて決定される検索数による検索処理により抽出された第１ノードと、第２ノードとに基づいて、精度を算出する。

このように、実施形態に係る情報処理装置は、前の区間における区間平均精度に応じて決定される検索数を用いて抽出された第１ノードと、第２ノードとに基づいて、精度を算出することで、適切に算出された精度を用いることができる。

また、実施形態に係る情報処理装置において、算出部は、期待精度を示す所定の値と、前の区間における検索結果に応じて決定される検索数による検索処理により抽出された第１ノードと、第２ノードとに基づいて、精度を算出する。

このように、実施形態に係る情報処理装置は、期待精度を示す所定の値と、前の区間における検索結果に応じて決定される検索数を用いて抽出された第１ノードと、第２ノードとに基づいて、精度を算出することで、適切に算出された精度を用いることができる。

〔７．ハードウェア構成〕
上述してきた実施形態に係る情報処理装置１００は、例えば図１５に示すような構成のコンピュータ１０００によって実現される。図１５は、情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ１０００は、ＣＰＵ１１００、ＲＡＭ１２００、ＲＯＭ（Read Only Memory）１３００、ＨＤＤ（Hard Disk Drive）１４００、通信インターフェイス（Ｉ／Ｆ）１５００、入出力インターフェイス（Ｉ／Ｆ）１６００、及びメディアインターフェイス（Ｉ／Ｆ）１７００を有する。

ＣＰＵ１１００は、ＲＯＭ１３００またはＨＤＤ１４００に格納されたプログラムに基づいて動作し、各部の制御を行う。ＲＯＭ１３００は、コンピュータ１０００の起動時にＣＰＵ１１００によって実行されるブートプログラムや、コンピュータ１０００のハードウェアに依存するプログラム等を格納する。

ＨＤＤ１４００は、ＣＰＵ１１００によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を格納する。通信インターフェイス１５００は、ネットワークＮを介して他の機器からデータを受信してＣＰＵ１１００へ送り、ＣＰＵ１１００が生成したデータをネットワークＮを介して他の機器へ送信する。

ＣＰＵ１１００は、入出力インターフェイス１６００を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。ＣＰＵ１１００は、入出力インターフェイス１６００を介して、入力装置からデータを取得する。また、ＣＰＵ１１００は、生成したデータを入出力インターフェイス１６００を介して出力装置へ出力する。

メディアインターフェイス１７００は、記録媒体１８００に格納されたプログラムまたはデータを読み取り、ＲＡＭ１２００を介してＣＰＵ１１００に提供する。ＣＰＵ１１００は、かかるプログラムを、メディアインターフェイス１７００を介して記録媒体１８００からＲＡＭ１２００上にロードし、ロードしたプログラムを実行する。記録媒体１８００は、例えばＤＶＤ（Digital Versatile Disc）、ＰＤ（Phase change rewritable Disk）等の光学記録媒体、ＭＯ（Magneto-Optical disk）等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。

例えば、コンピュータ１０００が実施形態に係る情報処理装置１００として機能する場合、コンピュータ１０００のＣＰＵ１１００は、ＲＡＭ１２００上にロードされたプログラムを実行することにより、制御部１３０の機能を実現する。コンピュータ１０００のＣＰＵ１１００は、これらのプログラムを記録媒体１８００から読み取って実行するが、他の例として、他の装置からネットワークＮを介してこれらのプログラムを取得してもよい。

以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の行に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。

〔８．その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。

また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。

また、上述してきた各実施形態に記載された各処理は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。

また、上述してきた「部（section、module、unit）」は、「手段」や「回路」などに読み替えることができる。例えば、取得部は、取得手段や取得回路に読み替えることができる。

１情報処理システム
１００情報処理装置
１２１オブジェクト情報記憶部
１２２条件情報記憶部
１２３第１グラフ情報記憶部
１２４起点用情報記憶部
１２５第２グラフ情報記憶部
１３０制御部
１３１取得部
１３２抽出部
１３３第１生成部
１３４算出部
１３５第２生成部
１３６提供部
１０端末装置
５０情報提供装置
Ｎネットワーク

Claims

検索対象となる複数のオブジェクトの各々に対応する複数のノードがエッジで連結されたグラフを取得する取得部と、
前記複数のノードのうち一のノードを対象ノードとして、前記グラフを検索する検索処理を実行し、前記検索処理により、前記対象ノードの近傍ノードとして抽出された第１ノードと、前記グラフにおいて前記対象ノードとの間がエッジで連結されたノードである第２ノードとに基づいて、前記第１ノードのうち、前記第２ノードに該当しないノードと、前記対象ノードとの間を連結するエッジを前記グラフに追加する精製処理を実行する生成部と、
を備え、
前記取得部は、
前記複数のノードを所定の順序で追加し、追加済みのノードを対象としてエッジを連結する逐次登録処理により生成された前記グラフを取得する
ことを特徴とする情報処理装置。
前記生成部は、
前記逐次登録処理で追加された順序で選択される前記一のノードを前記対象ノードとする前記検索処理により抽出された前記第１ノードと、前記第２ノードとに基づいて、前記精製処理を実行する
ことを特徴とする請求項１に記載の情報処理装置。
前記生成部は、
前記対象ノードを起点とする前記検索処理により抽出された前記第１ノードと、前記第２ノードとに基づいて、前記対象ノードを対象とする前記精製処理を実行する
ことを特徴とする請求項１または請求項２に記載の情報処理装置。
前記第１ノードと、前記第２ノードとに基づいて、前記グラフに関する精度を算出する算出部、
をさらに備えることを特徴とする請求項１～３のいずれか１項に記載の情報処理装置。
前記算出部は、
前記第１ノードのうち前記第２ノードに該当するノードの割合により前記精度を算出する
ことを特徴とする請求項４に記載の情報処理装置。
前記算出部は、
前記複数のノードから順次選択される前記一のノードを前記対象ノードとして、前記精度を算出し、
前記生成部は、
前記複数のノードから順次選択される前記一のノードを前記対象ノードとして、前記精製処理を繰り返す
ことを特徴とする請求項４または請求項５に記載の情報処理装置。
前記生成部は、
前記算出部により算出される前記精度に応じた終了条件を満たすまで、前記対象ノードを対象とする前記精製処理を繰り返す
ことを特徴とする請求項６に記載の情報処理装置。
前記生成部は、
前記複数のノードの全てを前記対象ノードとして前記精製処理を行う前に、前記終了条件を満たす場合、前記複数のノードのうち一部を前記対象ノードとする前記精製処理を行わない
ことを特徴とする請求項７に記載の情報処理装置。
前記算出部は、
前記複数のノードのうち、所定数のノードの前記精度の平均である平均精度を算出し、
前記生成部は、
前記平均精度を基に前記終了条件を満たすかを判定する
ことを特徴とする請求項７または請求項８に記載の情報処理装置。
前記算出部は、
前記複数のノードの処理順序に対応する一の区間に対応する前記所定数のノードの前記平均精度である区間平均精度を算出し、
前記生成部は、
前記区間平均精度を基に前記終了条件を満たすかを判定する
ことを特徴とする請求項９に記載の情報処理装置。
前記算出部は、
前記一の区間の前記区間平均精度を基に前記終了条件を満たさない場合、前記一の区間の次の区間に対応する前記所定数のノードの前記区間平均精度を算出する
ことを特徴とする請求項１０に記載の情報処理装置。
前記算出部は、
前の区間における前記区間平均精度に応じて決定される検索数による前記検索処理により抽出された前記第１ノードと、前記第２ノードとに基づいて、前記精度を算出する
ことを特徴とする請求項１１に記載の情報処理装置。
前記算出部は、
期待精度を示す所定の値と、前の区間における検索結果に応じて決定される検索数による前記検索処理により抽出された前記第１ノードと、前記第２ノードとに基づいて、前記精度を算出する
ことを特徴とする請求項１１または請求項１２に記載の情報処理装置。
コンピュータが実行する情報処理方法であって、
検索対象となる複数のオブジェクトの各々に対応する複数のノードがエッジで連結されたグラフを取得する取得工程と、
前記複数のノードのうち一のノードを対象ノードとして、前記グラフを検索する検索処理を実行し、前記検索処理により、前記対象ノードの近傍ノードとして抽出された第１ノードと、前記グラフにおいて前記対象ノードとの間がエッジで連結されたノードである第２ノードとに基づいて、前記第１ノードのうち、前記第２ノードに該当しないノードと、前記対象ノードとの間を連結するエッジを前記グラフに追加する精製処理を実行する生成工程と、
を含み、
前記取得工程は、
前記複数のノードを所定の順序で追加し、追加済みのノードを対象としてエッジを連結する逐次登録処理により生成された前記グラフを取得する
ことを特徴とする情報処理方法。
検索対象となる複数のオブジェクトの各々に対応する複数のノードがエッジで連結されたグラフを取得する取得手順と、
前記複数のノードのうち一のノードを対象ノードとして、前記グラフを検索する検索処理を実行し、前記検索処理により、前記対象ノードの近傍ノードとして抽出された第１ノードと、前記グラフにおいて前記対象ノードとの間がエッジで連結されたノードである第２ノードとに基づいて、前記第１ノードのうち、前記第２ノードに該当しないノードと、前記対象ノードとの間を連結するエッジを前記グラフに追加する精製処理を実行する生成手順と、
をコンピュータに実行させ、
前記取得手順は、
前記複数のノードを所定の順序で追加し、追加済みのノードを対象としてエッジを連結する逐次登録処理により生成された前記グラフを取得する
ことを特徴とする情報処理プログラム。