JP7239433B2

JP7239433B2 - 情報処理装置、情報処理方法、及び情報処理プログラム

Info

Publication number: JP7239433B2
Application number: JP2019182491A
Authority: JP
Inventors: 雅二郎岩崎
Original assignee: Yahoo Japan Corp
Current assignee: Yahoo Japan Corp
Priority date: 2019-10-02
Filing date: 2019-10-02
Publication date: 2023-03-14
Anticipated expiration: 2039-10-02
Also published as: JP2021060635A

Description

特許法第３０条第２項適用公開日平成３０年１０月３日令和１年１０月２１日時点における本願に関連するソフトウェアを公開するページｈｔｔｐｓ：／／ｇｉｔｈｕｂ．ｃｏｍ／ｙａｈｏｏｊａｐａｎ／ＮＧＴｈｔｔｐｓ：／／ｇｉｔｈｕｂ．ｃｏｍ／ｙａｈｏｏｊａｐａｎ／ＮＧＴ／ｒｅｌｅａｓｅｓ／ｔａｇ／ｖ１．４．４

本発明は、情報処理装置、情報処理方法、及び情報処理プログラムに関する。

従来、種々の情報を検索する技術が提供されている。例えば、無向エッジや有向エッジ等のエッジによって生成されたグラフ（グラフ情報）を用いて検索を行う技術が提供されている。例えば、各ノードが近傍ノードにエッジで接続されている近傍グラフが近傍検索に利用されている。このような技術は、例えば画像検索等に用いられる。

特開２０１１－０９０３５１号公報特許第５２０８００１号公報特許第６２９３３３５号公報

しかしながら、上記の従来技術では、グラフの生成に用いるパラメータの値を適切に決定することが難しい場合がある。例えば、グラフの生成に用いるパラメータに静的な値（固定値）を設定した場合、制限時間などのグラフ生成の基準を満たさない場合が生じるといった課題がある。そのため、グラフの生成に用いるパラメータを適切に調整することが望まれている。

本願は、上記に鑑みてなされたものであって、グラフの生成に用いるパラメータの値を適切に決定する情報処理装置、情報処理方法、及び情報処理プログラムを提供することを目的とする。

本願に係る情報処理装置は、グラフの生成対象となる複数のオブジェクトと、前記複数のオブジェクトの各々に対応するノードが近傍ノードにエッジで連結される前記グラフの生成における基準を示す基準値とを取得する取得部と、前記複数のオブジェクトを対象とし、生成中の前記グラフを用いた検索処理を含む前記グラフの生成処理時において、前記基準値に基づき前記グラフの生成に用いるパラメータの値を調整する調整処理により、前記パラメータの値を決定する決定部と、を備えたことを特徴とする。

実施形態の一態様によれば、グラフの生成に用いるパラメータの値を適切に決定することができるという効果を奏する。

図１は、実施形態に係る情報処理の一例を示す図である。図２は、実施形態に係る処理時間の推定の一例を示す図である。図３は、実施形態に係る処理時間の推定の他の一例を示す図である。図４は、実施形態に係る情報処理に用いるツリーの一例を示す図である。図５は、実施形態に係る情報処理システムの構成例を示す図である。図６は、実施形態に係る情報処理装置の構成例を示す図である。図７は、実施形態に係るオブジェクト情報記憶部の一例を示す図である。図８は、実施形態に係るツリー情報記憶部の一例を示す図である。図９は、実施形態に係るグラフ情報記憶部の一例を示す図である。図１０は、実施形態に係るパラメータ情報記憶部の一例を示す図である。図１１は、実施形態に係る基準値情報記憶部の一例を示す図である。図１２は、実施形態に係る調整関連情報記憶部の一例を示す図である。図１３は、実施形態に係る情報処理の一例を示すフローチャートである。図１４は、実施形態に係る情報処理の一例を示すフローチャートである。図１５は、実施形態に係る情報処理の一例を示すフローチャートである。図１６は、情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。

以下に、本願に係る情報処理装置、情報処理方法、及び情報処理プログラムを実施するための形態（以下、「実施形態」と呼ぶ）について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る情報処理装置、情報処理方法、及び情報処理プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。

（実施形態）
〔１．情報処理〕
図１を用いて、実施形態に係る情報処理の一例について説明する。図１は、実施形態に係る情報処理の一例を示す図である。図１では、情報処理装置１００（図６参照）が複数のオブジェクト（以下「データセット」ともいう）を対象としたグラフ型インデックス（単に「グラフ」ともいう）の生成の際に用いるパラメータの値を調整する処理（以下「調整処理」ともいう）について説明する。図１では、情報処理装置１００がデータセットを対象にグラフを生成する処理（以下「生成処理」ともいう）における基準を示す基準値として、制限時間を用いる場合を示す。なお、基準値は、制限時間に限らず、生成処理における基準となるものであればどのような情報であってもよく、検索精度や検索速度等の種々の基準値であってもよい。

図１の例では、情報処理装置１００は、オブジェクトＯＢ１、ＯＢ２、ＯＢ３、ＯＢ１０１等の複数のオブジェクトを含むデータセットＤＳ１を対象としてグラフの生成を行う。データセットＤＳ１中の各オブジェクトは、ベクトル化され、ベクトル化されたオブジェクト（ベクトル情報）を対象として、後述する検索処理などの各種処理を行う。なお、データセットＤＳ１に含まれグラフの生成対象となる情報（オブジェクト）は、ベクトルとして表現可能であれば、どのような情報であってもよい。なお、以下では、画像情報を対象としたベクトル情報について説明するが、ベクトル情報の対象は、動画情報や音声情報等の他の対象であってもよい。

また、情報処理装置１００が用いる情報は、ベクトルに限らず、各対象の類似性を表現可能な情報であれば、どのような形式の情報であってもよい。例えば、情報処理装置１００は、各対象に対応する所定のデータや値を用いて対象をグラフ構造化したグラフ情報を用いてもよい。例えば、情報処理装置１００は、各対象から生成された所定の数値（例えば２進数の値や１６進数の値）を用いて対象をグラフ構造化したグラフ情報を用いてもよい。例えば、ベクトルに代えて、データ間の距離（類似度）が定義されていれば任意の形態のデータであっても良い。

〔１－１．生成処理〕
ここから、データセットＤＳ１を対象としたグラフの生成処理を一例として具体的な処理を説明する。例えば、情報処理装置１００は、オブジェクト情報記憶部１２１（図７参照）からデータセットＤＳ１を取得する。データセットＤＳ１は、１００万のオブジェクトを含むものとする。図１の例では、情報処理装置１００は、データセットＤＳ１内の１００万のオブジェクトを対象とするグラフＧＲ１１の生成処理を、基準値情報ＣＲ１に示す制限時間「ＴＬ１」以内に完了するように行うために、パラメータを調整する。情報処理装置１００は、グラフの生成処理に要する処理時間（以下「実測処理時間」ともいう）を計時する。

また、情報処理装置１００は、グラフＧＲ１１の生成が完了すると推定される時間（以下「推定処理時間」ともいう）と、基準値である制限時間「ＴＬ１」との比較を基に、グラフＧＲ１１の生成に用いる２つのパラメータの値を調整する。具体的には、情報処理装置１００は、ノードに連結するエッジの数を指定するパラメータ「Ｋ」と、検索範囲を指定するパラメータ「ε」との２つのパラメータの値を調整する。例えば、パラメータ「Ｋ」は、一のノードを対象とし、他のノードにエッジを連結する処理（以下「連結処理」ともいう）において連結するエッジの数を指定するパラメータである。また、パラメータ「ε」は、詳細は後述するが、検索処理中に算出される検索範囲ｒの拡大係数である。例えば、パラメータ「ε」は、クエリを対象としてグラフを探索し、そのクエリに対応する近傍ノードを抽出する処理（以下「検索処理」ともいう）において探索範囲を指定するパラメータである。

ここで、グラフ型インデックス（グラフ）では通常各ノードに付与するエッジ数を増やしたり、パラメータ「ε」を大きくしたりすることで、検索時の性能（検索時間や精度）を向上させることができる。一方で、ノードに付与するエッジ数を増やしたり、パラメータ「ε」を大きくしたりすると、生成時間が増加する。また、実用時にはグラフの生成時間等の種々の制限（基準）が設けられる場合がある。このような場合、制限時間等の制限（基準）を満たしつつグラフを生成し、制限の範囲内で最大の性能を引き出すグラフ型インデックス（グラフ）を生成しなくてはならない。図１の例では、グラフ生成の制限（基準）を示す基準値の一例として、制限時間「ＴＬ１」が設定された場合を示す。情報処理装置１００は、上記のようなパラメータ「Ｋ」の値及びパラメータ「ε」の値を調整することにより、制限時間「ＴＬ１」以内にデータセットＤＳ１を対象とするグラフＧＲ１１の生成処理を完了させる。

また、図１に示す設定値情報ＰＬ１－１、ＰＬ１－２は、グラフの生成処理の過程における各パラメータの設置値を示す。例えば、設定値情報ＰＬ１－１は、各パラメータの初期値を示す。設定値情報ＰＬ１－２は、設定値情報ＰＬ１－１に示すパラメータの値が更新された後の各パラメータの設置値を示す。以下、設定値情報ＰＬ１－１、ＰＬ１－２について、特に区別なく説明する場合には、設定値情報ＰＬ１と記載する。図１の例では、情報処理装置１００は、設定値情報ＰＬ１－１に示すように、連結エッジ数「Ｋ」の初期値は「１２０」であり、検索範囲係数「ε」の初期値は「０．１」を取得する。例えば、各パラメータの初期値はパラメータ情報記憶部１２４（図１０参照）に記憶され、情報処理装置１００は、記憶部１２０から各パラメータの初期値を取得する。

まず、情報処理装置１００は、オブジェクトを選択する（ステップＳ１）。情報処理装置１００は、与えられたデータセットのうち、未選択のオブジェクトを、グラフに追加（登録）するオブジェクトとして選択する。例えば、情報処理装置１００は、複数のオブジェクトのうち一部のオブジェクトをノードとして追加済みの生成中のグラフの情報を取得し、グラフに追加済みのオブジェクト以外の一のオブジェクトを選択する。例えば、情報処理装置１００は、データセットＤＳ１から、未選択のオブジェクトＯＢ１を選択する。なお、情報処理装置１００は、選択済みのオブジェクトを識別するための情報（フラグ）を記憶部１２０に記憶してもよい。例えば、情報処理装置１００は、オブジェクト情報記憶部１２１（図７参照）中のオブジェクトＩＤのうち、選択したオブジェクトに対応するオブジェクトＩＤに選択済みのフラグを付与してもよい。

そして、情報処理装置１００は、グラフを生成する（ステップＳ２）。情報処理装置１００は、選択したオブジェクトに対応するノードをグラフに新たに追加することにより、グラフを更新する。情報処理装置１００は、選択したオブジェクトＯＢ１に対応するノードＮ１をグラフに追加する。図１の例では、情報処理装置１００は、ノードＮ１が最初のノードであるため、ノードＮ１を含むグラフＧＲ１１を新規に生成する。また、情報処理装置１００は、グラフＧＲ１１には、ノードがノードＮ１の１個のみであるため、グラフＧＲ１１にエッジを追加しない。例えば、情報処理装置１００は、グラフＧＲ１１の更新に応じて、グラフ情報記憶部１２３（図９参照）を更新する。

そして、情報処理装置１００は、グラフの生成が完了したかを判定する（ステップＳ３）。例えば、情報処理装置１００は、データセットＤＳ１に未選択のオブジェクトが無い場合、グラフの生成が完了したと判定する。情報処理装置１００は、グラフの生成が完了したと判定した場合（ステップＳ３：Ｙｅｓ）、生成処理を終了する。

また、例えば、情報処理装置１００は、データセットＤＳ１に未選択のオブジェクトが有る場合、グラフの生成が完了していないと判定する。図１の例では、情報処理装置１００は、オブジェクトＯＢ１の選択後において、データセットＤＳ１にはオブジェクトＯＢ２等の未選択のオブジェクトが有るため、グラフの生成が完了していないと判定する。

そして、情報処理装置１００は、グラフの生成が完了していないと判定した場合（ステップＳ３：Ｎｏ）、グラフの生成処理が所定の条件を満たすかを判定する（ステップＳ４）。情報処理装置１００は、グラフに追加されたノードの数が所定の条件を満たすかを判定する。図１の例では、情報処理装置１００は、グラフのノード数が１０万、２０万、３０万…９０万など、新たに１０万のノードが追加されたことを所定の条件とする。例えば、情報処理装置１００は、前に条件を満たしてからグラフに新たに追加されたノードの数が１０万に達した場合、条件を満たすと判定する。なお、情報処理装置１００は、１０万ごとのように一定の間隔に条件に限らず、種々の条件を用いてもよい。

情報処理装置１００は、グラフの生成処理が所定の条件を満たしていないと判定した場合（ステップＳ４：Ｎｏ）、ステップＳ１に戻って処理を繰り返す。図１の例では、情報処理装置１００は、ノードＮ１が最初のノードであり、グラフＧＲ１１中のノード数が１個であるため、グラフの生成処理が所定の条件を満たしていないと判定し、ステップＳ１に戻って処理を繰り返す。

そして、情報処理装置１００は、与えられたデータセットのうち、未選択のオブジェクトを、グラフに追加するオブジェクトとして選択する。例えば、情報処理装置１００は、データセットＤＳ１から、選択済みのオブジェクトＯＢ１以外のオブジェクトを選択する。情報処理装置１００は、選択したオブジェクトに対応するノードをグラフＧＲ１１中に新たに追加することにより、グラフＧＲ１１を更新する。例えば、情報処理装置１００は、グラフＧＲ１１中に新たに追加するノード（新規追加ノード）をクエリとして、グラフＧＲ１１を探索することにより、新規追加ノードの近傍に位置するノード（近傍ノード）を抽出し、抽出した近傍ノードと、新規追加ノードとの間をエッジで連結することにより、グラフＧＲ１１を更新する。ここで、グラフＧＲ１１について説明する。

図１に示すグラフＧＲ１１は、データセットＤＳ１のうち、一部のオブジェクト（例えば１万個等）に対応するノードが追加され、各ノードとその近傍ノードとがエッジで連結されたグラフ情報を示す。なお、図１の例では、エッジが無向エッジ（双方向エッジ）である場合を示すが、有向エッジであってもよい。また、図１中のグラフＧＲ１１には、追加済みの多数のオブジェクト（ノード）が含まれるが、図面においてはその一部（ノードＮ１～Ｎ３、Ｎ４３、Ｎ５３）のみを図示する。

図１の例では、情報処理装置１００は、各オブジェクトに対応する各ノードから所定数以上のエッジが他のエッジに連結されるように、グラフＧＲ１１を生成する。情報処理装置１００は、グラフＧＲ１１における各ノードが、そのノードとの間の距離が近い方から所定数のノードへのエッジが連結されるようにグラフＧＲ１１を生成する。図１の例では、情報処理装置１００は、パラメータ「Ｋ」が初期値「１２０」である場合、１２０個のノードへのエッジが連結されるようにグラフＧＲ１１を生成する。なお、類似度を示す指標としての距離は、ベクトル（Ｎ次元ベクトル）間の距離として適用可能であれば、どのような距離であってもよく、例えば、ユークリッド距離やマハラノビス距離等の種々の距離が用いられてもよい。例えば、距離は、２つのオブジェクト間の類似度を反映するものであれば、どのような情報であってもよく、例えばコサイン類似度等の角度に関する情報であってもよい。

また、このように「ノードＮ＊（＊は任意の数値）」と記載した場合、そのノードはノードＩＤ「Ｎ＊」により識別されるノードであることを示す。例えば、「ノードＮ１」と記載した場合、そのノードはノードＩＤ「Ｎ１」により識別されるノードである。

また、図１中のグラフＧＲ１１では、ノードＮ１は、ノードＮ５３との間に無向エッジ（双方向エッジ）であるエッジＥ２が連結される。すなわち、ノードＮ１は、ノードＮ５３とエッジＥ２により連結される。このように「エッジＥ＊（＊は任意の数値）」と記載した場合、そのエッジはエッジＩＤ「Ｅ＊」により識別されるエッジであることを示す。例えば、「エッジＥ３１」と記載した場合、そのエッジはエッジＩＤ「Ｅ３１」により識別されるエッジである。例えば、ノードＮ１とノードＮ２とを連結するエッジＥ１により、ノードＮ１とノードＮ２との間を双方向に辿ることが可能となる。すなわち、エッジＥ１により、ノードＮ１からノードＮ２へ辿ることができ、かつエッジＥ１により、ノードＮ２からノードＮ１へ辿ることができる。

また、図１中のグラフＧＲ１１は、ユークリッド空間であってもよい。また、図１に示すグラフＧＲ１１は、各ベクトル間の距離等の説明のための概念的な図であり、グラフＧＲ１１は、多次元空間である。例えば、図１に示すグラフＧＲ１１は、平面上に図示するため２次元の態様にて図示されるが、例えば１００次元や１０００次元等の多次元空間であるものとする。なお、各ノードに対応するベクトルデータは、Ｎ次元の実数値ベクトルであってもよい。

また、図１の例では、グラフＧＲ１１においては、適宜「ノードＮ＊（＊は任意の数値）」の図示を省略し、各ノードに対応する「○」内に「ノードＮ＊」の「＊」の値を付すことにより表現する。すなわち、「ノードＮ＊」の部分の「＊」が一致するノードに対応する。例えば、グラフＧＲ１１中の左上の「○」であって、内部に「４３」が付された「○」は、ノードＩＤ「Ｎ４３」により識別されるノード（ノードＮ４３）に対応する。

ここで、各ノード間の距離は、ノード（画像情報）の類似性を示し、距離が近いほど類似している。本実施形態においては、グラフＧＲ１１における各ノードの距離を対応する各オブジェクト間の類似度とする。例えば、各ノードに対応する画像情報の類似性が、グラフＧＲ１１内におけるノード間の距離として写像されているものとする。例えば、各ノードに対応する概念間の類似度が各ノード間の距離に写像されているものとする。ここで、図１の例では、グラフＧＲ１１における各ノード間の距離が短いオブジェクト同士の類似度が高く、グラフＧＲ１１における各ノード間の距離が長いオブジェクト同士の類似度が低い。

例えば、図１中のグラフＧＲ１１において、ノードＮ４３とノードＮ２とは近接している、すなわち距離が短い（近い）。そのため、ノードＮ４３に対応するオブジェクトと、ノードＮ２に対応するオブジェクトとは類似度が高いことを示す。また、図１中のグラフＧＲ１１において、ノードＮ４３とノードＮ５３とは遠隔にある、すなわち距離が長い（遠い）。そのため、ノードＮ４３に対応するオブジェクトと、ノードＮ５３に対応するオブジェクトとは類似度が低いことを示す。

上述のように、情報処理装置１００は、新規追加ノードをクエリ（「クエリＱＥ１」とする）として、生成中のグラフＧＲ１１を探索することにより、新規追加ノードに連結する近傍ノードを抽出する。例えば、情報処理装置１００は、図１５に示すような処理により、クエリＱＥ１を対象とする検索処理により新規追加ノードに対応するＫ個の近傍ノードを抽出する。情報処理装置１００は、その時点での検索範囲係数「ε」の設定値を用いて、図１５に示すような処理をグラフＧＲ１１を用いて行うことにより、クエリＱＥ１に対応するＫ個の近傍ノードを抽出する。情報処理装置１００は、検索範囲係数「ε」が初初期値「０．１」である場合、検索範囲係数「ε」を「０．１」として、クエリＱＥ１に対応するＫ個の近傍ノードを抽出する。

ここで、検索範囲係数「ε」の概念について簡単に説明する。図１中のグラフＧＲ１１－１は、グラフＧＲ１１であり、「○」内に「Ｑ」を記載したクエリＱＥ１に対応する範囲ＡＲ１及び範囲ＡＲ２を図示するために、ノードのみを図示し、エッジの図示を省略したものである。情報処理装置１００は、クエリＱＥ１を中心とする半径ｒ内の範囲ＡＲ１と、クエリＱＥ１を中心とする半径ｒ（１＋ε）内の範囲ＡＲ２とを用いて、グラフＧＲ１１を検索し、近傍ノードを抽出する。このように、情報処理装置１００は、検索範囲係数「ε」を適用した処理により、近傍ノードを抽出する処理を行うが、検索範囲係数「ε」を用いた処理の詳細は図１５において説明する。

例えば、情報処理装置１００は、オブジェクトＯＢ１の次に追加したオブジェクト（例えばオブジェクトＯＢ２）に対応するノードと、追加済みのオブジェクトＯＢ１に対応するノードとの間をエッジで連結する。例えば、情報処理装置１００は、オブジェクトＯＢ１に対応するノードＮ１と、オブジェクトＯＢ２に対応するノードＮ２との間をエッジＥ１で連結する。情報処理装置１００は、設定値情報ＰＬ１－１に示すように連結エッジ数「Ｋ」が「１２０」であるため、グラフＧＲ１１中のノード数がＫ個（例えば１２０個）を超えるまで、新たに追加したノード（新規追加ノード）と、グラフＧＲ１１中に追加済みの全ノードとの間にエッジを連結する。また、情報処理装置１００は、Ｋ個（例えば１２０個）を超えた場合、新たに追加したノードと、グラフＧＲ１１中に追加済みの全ノードのうち、その新規追加ノードに近接するＫ個の近傍ノードとの間をエッジで連結する。そのため、情報処理装置１００は、グラフＧＲ１１中のノード数がＫ個を超えるまで、グラフＧＲ１１の検索処理を行うことなく、新たに追加したノードと、グラフＧＲ１１中に追加済みの全ノードとの間にエッジを連結してもよい。

情報処理装置１００は、上述したようなステップＳ１、Ｓ２の処理を、全オブジェクトがグラフＧＲ１１に追加されるまで繰り返し実行する。

上述のような処理において、情報処理装置１００は、グラフの生成処理が所定の条件を満たすと判定した場合（ステップＳ４：Ｙｅｓ）、処理時間を推定する（ステップＳ５）。図１の例では、情報処理装置１００は、グラフのノード数が１０万に達した場合、グラフの生成処理が所定の条件を満たすと判定し、推定処理時間（推定総登録時間）を推定する。例えば、情報処理装置１００は、グラフＧＲ１１へ新規に追加したオブジェクトの数が１０万に達した場合、グラフの生成処理が所定の条件を満たすと判定し、推定処理時間を推定する。例えば、情報処理装置１００は、推定時点までの実測処理時間等の情報を用いて、推定処理時間（推定総登録時間）を推定するが詳細は後述する。

そして、情報処理装置１００は、推定処理時間が制限時間と所定の関係を満たすかを判定する（ステップＳ６）。例えば、情報処理装置１００は、推定処理時間が制限時間を超えることを所定の関係を満たすと判定する。この場合、情報処理装置１００は、推定処理時間が制限時間「ＴＬ１」を超える場合、推定処理時間が制限時間と所定の関係を満たすと判定する。また、情報処理装置１００は、推定処理時間が制限時間「ＴＬ１」を超えない場合、推定処理時間が制限時間と所定の関係を満たさないと判定する。

情報処理装置１００は、推定処理時間が制限時間と所定の関係を満たさないと判定した場合（ステップＳ６：Ｎｏ）、ステップＳ１に戻って処理を繰り返す。図１の例では、情報処理装置１００は、グラフのノード数が１０万に達した時点で推定した推定処理時間が制限時間「ＴＬ１」を超えないものとする。そのため、情報処理装置１００は、グラフのノード数が１０万に達した時点で推定した推定処理時間が制限時間「ＴＬ１」を超えないため、推定処理時間が制限時間と所定の関係を満たさないと判定し、ステップＳ１に戻って処理を繰り返す。

一方で、情報処理装置１００は、推定処理時間が制限時間と所定の関係を満たすと判定した場合（ステップＳ６：Ｙｅｓ）、調整処理を実行する（ステップＳ７）。図１の例では、情報処理装置１００は、推定情報ＥＳ１に示すように、グラフのノード数が５０万に達した時点における推定処理時間を「ＥＴ１」と推定する。情報処理装置１００は、グラフのノード数が５０万に達した時点における推定処理時間を「ＥＴ１」と推定する。例えば、情報処理装置１００は、グラフのノード数が５０万に達するまでの実測処理時間を用いて、グラフのノード数が５０万に達した時点における推定処理時間を「ＥＴ１」と推定する。

また、図１の例では、推定処理時間「ＥＴ１」が制限時間「ＴＬ１」を超えるものとする。そのため、情報処理装置１００は、グラフのノード数が５０万に達した時点で推定した推定処理時間「ＥＴ１」が制限時間「ＴＬ１」を超えるため、推定処理時間が制限時間と所定の関係を満たすと判定し、調整処理を実行する。情報処理装置１００は、調整関連情報記憶部１２６（図１２参照）を用いて、調整処理を実行する。情報処理装置１００は、判定条件「推定処理時間＞ＴＬ１」を満たすため、処理時間が短くなるようにパラメータを調整する。このように、情報処理装置１００は、推定処理時間（推定総登録時間）が制限時間を超える場合には、エッジ数に対応するパラメータ「Ｋ」の値や検索範囲係数に対応するパラメータ「ε」の値を小さくする。

図１の例では、情報処理装置１００は、設定値情報ＰＬ１－２に示すように、パラメータ「Ｋ」の値を５だけ減少させる。これにより、情報処理装置１００は、パラメータ「Ｋ」の値を「１２０」から「１１５」に減少させる。情報処理装置１００は、パラメータ「Ｋ」の値を「１１５」に決定する。なお、図１の例では、パラメータ「Ｋ」の値を５だけ減少させる場合を一例として示すが、パラメータの変動は種々の態様であってもよい。例えば、情報処理装置１００は、図１の例のように、変動（減少）させる幅（変動幅）を所定の値（図１の場合「５」）に決定してもよいし、動的に変動幅を決定してもよい。例えば、情報処理装置１００は、推定値と基準値との乖離（差）が大きい程、変動幅を大きくしてもよい。情報処理装置１００は、推定処理時間（推定総登録時間）と制限時間との差が大きい程、パラメータ「Ｋ」やパラメータ「ε」の変動幅を大きくしてもよい。また、例えば、情報処理装置１００は、グラフに追加する残りのオブジェクト（登録前オブジェクト）の数、すなわち未追加のノード数が少ない程、変動幅を大きくしてもよい。例えば、情報処理装置１００は、推定処理時間（推定総登録時間）が制限時間を超え、かつ登録前オブジェクトが少ない程、パラメータ「Ｋ」やパラメータ「ε」の変動幅を大きくしてもよい。

そして、情報処理装置１００は、ステップＳ１に戻り、調整したパラメータを用いて処理を繰り返す。図１の例では、情報処理装置１００は、グラフのノード数が６０万、７０万、８０万、９０万の各々に達した場合、グラフの生成処理が所定の条件を満たすと判定し、推定処理時間を推定する。そして、情報処理装置１００は、グラフのノード数が６０万、７０万、８０万、９０万の各々に達した段階で、推定した推定処理時間が制限時間「ＴＬ１」を超える場合、推定処理時間が制限時間と所定の関係を満たすと判定し、調整処理を実行する。

上述のように、情報処理装置１００は、推定処理時間が制限時間と所定の関係を満たすと判定した場合に、パラメータの値を増減させることにより、グラフの生成に用いるパラメータの値を適切に決定することができる。また、情報処理装置１００は、パラメータを調整することにより、制限（基準）を満たして、グラフを生成することができる。

上述したように、情報処理装置１００は、グラフ生成時にはノードを１つずつグラフに追加する。情報処理装置１００は、ノードの追加時に新規追加ノードのＫ個の近傍ノードと新規追加ノードとの間をエッジで接続することでグラフを更新する。情報処理装置１００は、新規追加ノードのＫ個の近傍ノードを、生成中のグラフをインデックスとして利用することで検索して抽出（取得）する。情報処理装置１００は、このような処理によってグラフを生成する。この方法の場合、インデックス（グラフ）の生成時間のほとんどがグラフの検索時間となる。また、検索時間に影響するパラメータは、例えば、検索結果数に対応するパラメータ「Ｋ」と検索範囲係数に対応するパラメータ「ε」である。そのため、情報処理装置１００は、グラフの生成中において、パラメータ「Ｋ」やパラメータ「ε」を調整することにより、グラフ生成の制限時間等の制限（基準）を満たしつつ、適切にグラフを生成することができる。

〔１－１－１．パラメータの調整〕
なお、パラメータの調整は、上記に限らず、種々の態様により行われてもよい。例えば、情報処理装置１００は、連続して推定処理時間が制限時間を超えると判定した場合に、パラメータを増減させる幅（変動幅）を大きくしてもよい。パラメータの変動幅を大きくすることを示す情報は、調整関連情報記憶部１２６（図１２参照）に記憶されてもよい。例えば、情報処理装置１００は、連続して推定処理時間が制限時間を超えると判定した場合、調整関連情報記憶部１２６（図１２参照）を参照し、パラメータ「Ｋ」やパラメータ「ε」の変動幅を決定してもよい。

図１の例では、情報処理装置１００は、グラフのノード数が６０万に達した時点で推定した推定処理時間が制限時間「ＴＬ１」を超える場合、ノード数が５０万に達した時点での判定と連続して、推定処理時間が制限時間を超えるため、パラメータを増減させる幅（変動幅）を大きくしてもよい。例えば、情報処理装置１００は、ノード数が５０万に達した時点のパラメータ「Ｋ」の減少幅「５」を２倍した１０だけパラメータ「Ｋ」を減少させる。この場合、情報処理装置１００は、パラメータ「Ｋ」の値を「１１５」から「１０５」に減少させる。このように、情報処理装置１００は、制限時間を超えた場合に連結エッジ数や検索範囲係数に対応するパラメータを調整したにもかかわらず、次の区間においても制限時間を超える場合に減少幅を大きくする。これにより、情報処理装置１００は、より適切にパラメータの値を決定することができる。

また、図１の例では、情報処理装置１００は、パラメータ「Ｋ」やパラメータ「ε」を範囲情報ＬＧ１に示すような範囲内で変動させる。情報処理装置１００は、範囲情報ＬＧ１をパラメータ情報記憶部１２４（図１０参照）から取得する。図１の例では、範囲情報ＬＧ１に示すように、パラメータ「Ｋ」は、５以上２００以下の間で値が設定可能であることを示す。図１の例では、範囲情報ＬＧ１に示すように、パラメータ「ε」は、上限値がなく、－１より大きい値が設定可能であることを示す。なお、各パラメータの範囲情報には、上限値及び下限値が含まれるか否かを示す情報が含まれる。

例えば、情報処理装置１００は、エッジ数に対応するパラメータ「Ｋ」の値を減らし、パラメータ「Ｋ」が下限値（例えば５等）に到達した場合にはパラメータ「ε」の値を小さくする。図１の例では、情報処理装置１００は、パラメータ「Ｋ」を先に変動させ、パラメータ「Ｋ」が上限や下限に達し、変動できない場合にパラメータ「ε」を変動させる。情報処理装置１００は、各パラメータの優先順位を示す情報（優先度情報）を記憶部１２０に記憶し、記憶部１２０に記憶された優先度情報を用いて、値を変更するパラメータを決定してもよい。

〔１－１－２．判定条件及びパラメータの変動方向〕
また、図１の例では、情報処理装置１００は、推定処理時間が制限時間「ＴＬ１」を超えることを判定条件として、その判定条件を満たす場合、パラメータの値を減少させる場合を一例として説明したが、判定条件やパラメータの変動方向は種々の対象であってもよい。例えば、情報処理装置１００は、パラメータの値を減少させる場合に限らず、パラメータの値を増加させてもよい。これらの点について、以下説明する。

例えば、判定条件は、図１２中の調整関連情報記憶部１２６に示すように、「推定処理時間がＴＬ１より所定値以上小さい」等の推定処理時間が制限時間「ＴＬ１」よりも小さい、すなわち生成処理が制限時間よりも早く終わることであってもよい。

このように生成処理が制限時間よりも早く終わる場合、情報処理装置１００は、処理時間を増加させて、生成されるグラフの精度が高くなるようにパラメータを調整してもよい。例えば、情報処理装置１００は、推定処理時間が制限時間を下回る場合、グラフの検索精度が高くなるようにパラメータの値を調整してもよい。情報処理装置１００は、図１２中の調整関連情報記憶部１２６に示すように、「推定処理時間がＴＬ１より所定値以上小さい」場合、パラメータ「Ｋ」の値やパラメータ「ε」の値を増加させる。具体的には、情報処理装置１００は、「推定処理時間がＴＬ１より所定値以上小さい」場合、パラメータ「Ｋ」の値を５だけ増加したり、パラメータ「ε」の値を０．０５だけ増加したりすることにより、生成されるグラフの精度が高くなるようにパラメータを調整してもよい。

すなわち、情報処理装置１００は、推定処理時間が制限時間を超える場合に、推定処理時間が制限時間を超えないように、パラメータを調整することに限らず、推定処理時間が制限時間を超えない範囲でパラメータを調整する。上記のように、情報処理装置１００は、生成処理が制限時間よりも早く終わる場合、情報処理装置１００は、処理時間を増加させて、生成されるグラフの精度が高くなるようにパラメータを調整する。すなわち、情報処理装置１００は、推定処理時間が制限時間を超えない範囲で、推定処理時間が制限時間に近づくようにパラメータの値を調整する。これにより、情報処理装置１００は、制限時間を満たしつつ、できる限り高精度なグラフを生成することができる。

〔１－１－３．推定処理時間（推定総登録時間）〕
ここで、推定処理時間（推定総登録時間）の推定について説明する。図１の例では、情報処理装置１００は、一定登録数ｎ（図１では１０万）ごとに、その区間の登録時間（実測区間処理時間）を計測し、それまでの総既登録時間（実測総処理時間）を計測する。情報処理装置１００は、計測した実測区間処理時間や実測総処理時間を用いて、推定総登録時間を推定する。例えば、情報処理装置１００は、計測した実測区間処理時間や実測総処理時間を用いて、残りのオブジェクトの登録に要する処理時間（残登録時間）を推定してもよい。情報処理装置１００は、実測区間処理時間とその区間の登録数より１つのオブジェクトの登録時間（単一登録時間）を算出し、残登録数から残登録時間を算出してもよい。情報処理装置１００は、実測総処理時間とその区間の登録数より１つのオブジェクトの登録時間を算出し、残登録数から残登録時間を算出してもよい。情報処理装置１００は、単一登録時間に残登録数を乗算することにより、残登録時間を推定（算出）してもよい。

そして、情報処理装置１００は、推定した残登録時間を実測総処理時間に加算することにより、推定処理時間（推定総登録時間）を推定してもよい。この場合、情報処理装置１００は、実測値に予測値（推定値）を加算する「総既登録時間（実測総処理時間）＋残登録時間」により、推定処理時間（推定総登録時間）を推定する。

上述した点の具体例について、図２及び図３を用いて説明する。図２は、実施形態に係る処理時間の推定の一例を示す図である。図２は、実施形態に係る処理時間の推定の他の一例を示す図である。図２及び図３では、条件情報ＣＮ１に示すように、処理条件（区間）が１０万である場合を示す。すなわち、図２及び図３では、図１と同様に、グラフＧＲ１１に追加されるノード数「１０万」を１つの区間として処理をすることを示す。この場合、情報処理装置１００は、オブジェクトが１０万登録される度に、推定処理時間（推定総登録時間）を推定する。

また、図２及び図３では、グラフＧＲ１１に５０万のノードが追加された時点での処理を一例として説明する。まず、図２を用いて、それまでの処理時間の推移から、推定処理時間（推定総登録時間）を推定する場合について説明する。

図２中の関係図ＴＧ１は、縦軸が時間（総処理時間）に対応し、横軸が登録回数（追加回数）、すなわちグラフに登録（追加）されたノードの数に対応する。関係図ＴＧ１の縦軸は、対応する横軸の数のノードがグラフに登録（追加）された時点での全体の総処理時間を示す。例えば、横軸「５０万」に対応する縦軸「ＡＭ１」は、グラフに５０万個のノードが追加された時点での総処理時間を示す。

例えば、関係図ＴＧ１は、グラフＧＲ１１へのノードの追加（グラフＧＲ１１の生成）と、処理時間との関係を示す。関係図ＴＧ１中のポイントＰＴ１は、縦軸が制限時間「ＴＬ１」に対応し、横軸が、データセットＤＳ１のノード数「１００万」に対応する位置を示す。例えば、情報処理装置１００は、ポイントＰＴ１でグラフ生成の処理が完了するようにパラメータの値を調整する。

また、関係図ＴＧ１中の実線で示す実測線ＡＬ１が実際の計測による処理時間を示す。このように、図２では、グラフＧＲ１１に５０万のノードが追加された段階で、実測総処理時間が「ＡＭ１」であることを示す。

そして、関係図ＴＧ１中の２点鎖線で示す推定線ＥＬ１が、推定した処理時間を示す。情報処理装置１００は、実測線ＡＬ１に対応する情報などの種々の情報を用いて、推定線ＥＬ１に示すような処理時間を推定する。

このように、情報処理装置１００は、推定時点までのグラフＧＲ１１の生成に要した処理時間に基づいて、推定処理時間を推定する。情報処理装置１００は、グラフＧＲ１１に５０万のノードが追加された時点までのグラフＧＲ１１の生成に要した処理時間に基づいて、推定処理時間を推定する。

例えば、情報処理装置１００は、推定時点前の所定の期間におけるグラフＧＲ１１の生成に要した処理時間に基づいて、推定処理時間を推定する。情報処理装置１００は、推定時点前の所定の期間におけるグラフＧＲ１１の生成に要した処理時間に基づいて、推定処理時間を推定する。情報処理装置１００は、推定時点直前の期間におけるグラフＧＲ１１の生成に要した処理時間に基づいて、推定処理時間を推定する。

図２の例では、情報処理装置１００は、推定時点直前である４０万～５０万の区間（直前区間）におけるグラフＧＲ１１の生成に要した処理時間に基づいて、推定処理時間を推定する。すなわち、情報処理装置１００は、直前区間における４０万１個目のノードから５０万個目のノードまでのグラフＧＲ１１への追加に要した処理時間に基づいて、推定処理時間を推定する。

情報処理装置１００は、関数のフィッティングに関する種々の技術を適宜用いて、処理時間を推定する関数（以下「推定用関数ＥＦ」ともいう）を導出してもよい。情報処理装置１００が導出する推定用関数ＥＦは、線形関数であってもよいし、非線形関数であってもよい。例えば、情報処理装置１００は、実測された５０万より後のノード追加における処理時間の増加を直線で近似することにより、推定用関数ＥＦを生成してもよい。例えば、情報処理装置１００は、実測線ＡＬ１よりも後の線（図２では推定線ＥＬ１）を直線で近似することにより、推定用関数ＥＦを生成する。例えば、情報処理装置１００は、実測線ＡＬ１の処理時間に基づいて、推定用関数ＥＦを導出する。例えば、情報処理装置１００は、実測線ＡＬ１中の直前区間の形状に基づいて、推定用関数ＥＦを導出する。例えば、情報処理装置１００は、実測線ＡＬ１中の４０万から５０万の間の形状を基に直線を近似することにより、推定用関数ＥＦを生成する。例えば、情報処理装置１００は、実測線ＡＬ１中の４０万から５０万の間の処理時間の増加量から、実測線ＡＬ１中の４０万から５０万の間の傾き（変化の割合）を導出し、その傾きを５０万より後の傾きとして推定用関数ＥＦを生成してもよい。例えば、情報処理装置１００は、推定用関数ＥＦを用いて推定線ＥＬ１を生成する。

なお、上記は一例であり、情報処理装置１００は、種々の情報を適宜用いて推定用関数ＥＦを導出してもよい。また、情報処理装置１００は、直前区間のみに限らず、種々の期間に追加したノードのグラフＧＲ１１への追加に要した処理時間に基づいて、推定用関数ＥＦを導出してもよい。例えば、情報処理装置１００は、１個目のノードから推定時間のノードまでの全追加ノードのグラフＧＲ１１への追加に要した処理時間に基づいて、推定用関数ＥＦを導出してもよい。

そして、情報処理装置１００は、導出した推定用関数ＥＦを用いて、推定線ＥＬ１に示すような処理時間を推定する。図２の例では、情報処理装置１００は、推定線ＥＬ１に示すように、データセットＤＳ１のノード数「１００万」の追加が完了した時点を示すポイントＥＰ１に対応する総処理時間が「ＥＴ１」であると推定する。すなわち、情報処理装置１００は、グラフＧＲ１１の生成が完了した時点を示すポイントＥＰ１に対応する総処理時間が「ＥＴ１」であると推定する。このように、情報処理装置１００は、推定処理時間（推定総登録時間）が制限時間「ＴＬ１」を超える「ＥＰ１」であると推定する。

この場合、情報処理装置１００は、図１に示すように、処理時間が短くなるようにパラメータを調整する。

また、情報処理装置１００は、関数を導出することなく、推定処理時間（推定総登録時間）を推定してもよい。この点について図３を用いて説明する。

図３中の関係図ＴＧ２は、縦軸が時間（各処理時間）に対応し、横軸が登録回数（追加回数）、すなわちグラフに登録（追加）されたノードの数に対応する。関係図ＴＧ２の縦軸は、対応する横軸の数のノードがグラフに登録（追加）される場合の単一の処理時間を示す。例えば、横軸「１０万」に対応する縦軸の値は、グラフに１０万個目のノードが追加される際のその追加に要する処理時間を示す。

また、関係図ＴＧ２中の各線ＬＮ１～ＬＮ３の各々は、異なるパラメータの設定値の組合せに対応する。なお、図３の関係図ＴＧ２では、３つの線のみを示すが、多数の線が含まれてもよい。例えば、実線で示す線ＬＮ１は、パラメータ「Ｋ」の値が「１２０」であり、パラメータ「ε」の値が「０．１」である場合の処理時間を示す。例えば、一点鎖線で示す線ＬＮ２は、パラメータ「Ｋ」の値が「１５０」であり、パラメータ「ε」の値が「０．１」である場合の処理時間を示す。例えば、二点鎖線で示す線ＬＮ３は、パラメータ「Ｋ」の値が「１５０」であり、パラメータ「ε」の値が「０．１５」である場合の処理時間を示す。

例えば、情報処理装置１００は、過去のグラフ生成の処理履歴を基に関係図ＴＧ２に示すような情報を生成してもよい。なお、図２中の関係図ＴＧ２に示すような情報は、情報処理装置１００が生成する場合に限らず、情報処理装置１００は、図２中の関係図ＴＧ２に示すような情報を情報提供装置５０（図５参照）等の他の外部装置から取得してもよい。

例えば、情報処理装置１００は、パラメータ「Ｋ」の値が「１２０」であり、パラメータ「ε」の値が「０．１」である場合、線ＬＮ１の情報を用いて、残登録時間を推定（算出）してもよい。例えば、情報処理装置１００は、５０万１個目のノードから１００万個目のノードまでのグラフＧＲ１１への追加に要する処理時間を、線ＬＮ１の情報を用いて推定する。例えば、情報処理装置１００は、５０万１個目のノードから１００万個目のノードまで積分値を、５０万１個目のノードから１００万個目のノードまでのグラフＧＲ１１への追加に要する処理時間として推定（算出）してもよい。情報処理装置１００は、関係図ＴＧ２中の横軸、線ＬＮ１、５０万に対応する縦方向への点線、１００万に対応する縦方向への点線で囲まれた領域ＡＲ１の面積を、残登録時間として推定（算出）してもよい。

そして、情報処理装置１００は、推定（算出）した残登録時間を、それまでの実測総処理時間に加えることにより、推定処理時間（推定総登録時間）を推定してもよい。

なお、上記は一例であり、情報処理装置１００は、推定処理時間（推定総登録時間）が推定可能であれば、どのような処理により推定を行ってもよい。

また、情報処理装置１００は、上述した各区間（１区間）をさらに数分割して登録時間を計測し、その時間から関数のフィッティングを行い、その登録時間関数を推定した上で推定総登録時間を求めてもよい。これにより、情報処理装置１００は、さらに精度良く推定総登録時間を推定することができる。

〔１－２．ツリー情報〕
上述した例では、グラフ（グラフ情報）のみを生成する場合を示したが、情報処理装置１００は、生成したグラフに対応するツリー情報を生成してもよい。例えば、情報処理装置１００は、ツリーに関する種々の技術を適宜用いて、生成したグラフに対応するツリー情報を生成する。例えば、情報処理装置１００は、図４中の情報群ＧＩＮＦ１１に示すようなツリー情報ＩＮＤ１１を生成してもよい。そして、情報処理装置１００は、生成したツリー情報など、各種のインデックスを用いて、処理を高速化してもよい。例えば、情報処理装置１００は、図４中の情報群ＧＩＮＦ１１に示すようなツリー情報ＩＮＤ１１を用いて、検索の起点となるノード（以下「起点ノード」ともいう）を決定してもよい。図４は、実施形態に係る情報処理に用いるツリーの一例を示す図である。なお、ツリー情報ＩＮＤ１１は、情報処理装置１００が生成してもよいし、情報処理装置１００は、ツリー情報ＩＮＤ１１を情報提供装置５０等の他の外部装置から取得してもよい。

例えば、情報処理装置１００は、ツリー情報ＩＮＤ１１に基づいて、クエリＱＥ１に対応する起点ノードを決定してもよい。情報処理装置１００は、ツリー情報記憶部１２２（図８参照）に記憶されたツリー情報ＩＮＤ１１を用いて、起点ノードを決定する。例えば、ツリー情報ＩＮＤ１１は、グラフＧＲ１１中のいくつかのノードに到達可能なツリー構造を有するツリーである。図４の例では説明を簡単にするために、ツリー情報ＩＮＤ１１は、ノードＮ１～Ｎ５の５個のノードに到達するルートのみを図示するが、多数（例えば５００や１０００等）の他のノードへ到達するルートが含まれてもよい。

例えば、情報処理装置１００は、図４中のツリー情報ＩＮＤ１１に示すような木構造型のツリー情報を用いて、グラフＧＲ１１における起点ノードを決定する。図１の例では、情報処理装置１００は、クエリＱＥ１に基づいて、ツリー情報ＩＮＤ１１を上（ルートＲＴ）から下へ辿ることにより、ツリー情報ＩＮＤ１１の近傍候補となる起点ノードを決定（特定）する。これにより、情報処理装置１００は、効率的に検索クエリ（クエリＱＥ１）に対応する起点ノードを決定することができる。

例えば、情報処理装置１００は、ツリー情報ＩＮＤ１１をルートＲＴからリーフノード（グラフＧＲ１１中のノード）まで辿ることにより、クエリＱＥ１に対応する起点ノードを決定してもよい。例えば、情報処理装置１００は、木構造に関する種々の従来技術を適宜用いて、ツリー情報ＩＮＤ１１をルートＲＴからリーフノードまで辿ることにより、辿りついたリーフノードを起点ノードとして決定してもよい。例えば、情報処理装置１００は、クエリＱＥ１との類似度に基づいて、ツリー情報ＩＮＤ１１を下へ辿ることにより、起点ノードを決定してもよい。例えば、情報処理装置１００は、ルートＲＴから節点ＶＴ１、ＶＴ２等のいずれの節点に辿るかを、クエリＱＥ１と節点ＶＴ１、ＶＴ２との類似度に基づいて決定してもよい。例えば、情報処理装置１００は、ルートＲＴから節点ＶＴ１、ＶＴ２等のうち、クエリＱＥ１との類似度が最も高い節点ＶＴ２へ辿ると決定してもよい。また、例えば、情報処理装置１００は、節点ＶＴ２から節点ＶＴ２－１～ＶＴ２－４等のうち、クエリＱＥ１との類似度が最も高い節点ＶＴ２－２へ辿ると決定してもよい。

図４の例に示すツリー情報（ツリーデータ）は一例であり、情報処理装置１００は、種々のツリー情報を用いて、グラフ情報を検索してもよい。情報処理装置１００は、検索時の起点ノードの決定に用いるツリーを生成してもよい。なお、ツリーを用いることは一例であり、情報処理装置１００は、検索時の起点ノードの決定の高速化が可能であれば、ツリーに限らず種々の情報を用いてもよい。例えば、情報処理装置１００は、高次元ベクトルを高速に検索するための検索ツリー（ツリー情報）を生成する。ここでいう高次元ベクトルとは、例えば、数百次元から数千次元のベクトルであってもよいし、それ以上の次元のベクトルであってもよい。

例えば、情報処理装置１００は、図４に示すようなツリー構造（木構造）に関するツリー情報ＩＮＤ１１を生成してもよい。例えば、情報処理装置１００は、ｋｄ木（k-dimensional tree）に関する検索ツリーを生成してもよい。例えば、情報処理装置１００は、ＶＰ木（Vantage-Point tree）に関する検索ツリーを生成してもよい。

また、例えば、情報処理装置１００は、その他の木構造を有するツリーを生成してもよい。例えば、情報処理装置１００は、木構造のツリーのリーフがグラフに接続する種々のツリーを生成してもよい。例えば、情報処理装置１００は、木構造のツリーのリーフがグラフ中のノードに対応する種々のツリーを生成してもよい。また、情報処理装置１００は、このようなツリーを用いて検索を行う場合、ツリーを辿って到達したリーフ（ノード）からグラフを探索してもよい。

なお、上述したようなツリーは一例であり、情報処理装置１００は、グラフ中のクエリを高速に特定することが可能であれば、どのようなデータ構造のツリーを生成してもよい。例えば、情報処理装置１００は、クエリに対応するグラフ情報中のノードを高速に特定することが可能であれば、バイナリ空間分割に関する技術等の種々の従来技術を適宜用いて、ツリーを生成してもよい。例えば、情報処理装置１００は、高次元ベクトルの検索に対応可能なツリーであれば、どのようなデータ構造のツリーを生成してもよい。情報処理装置１００は、上述のようなツリーとグラフとを用いることにより、所定の対象に関してより効率的な検索を可能にすることができる。すなわち、情報処理装置１００は、上述のようなツリーとグラフとを用いることにより、所定の対象に関してより高速な検索を可能にすることができる。

〔２．情報処理システムの構成〕
次に、図５を用いて、実施形態に係る情報処理システム１の構成について説明する。図５は、実施形態に係る情報処理システムの構成例を示す図である。図５に示すように、情報処理システム１には、端末装置１０と、情報提供装置５０と、情報処理装置１００とが含まれる。端末装置１０と、情報提供装置５０と、情報処理装置１００とは所定のネットワークＮを介して、有線または無線により通信可能に接続される。なお、図５に示した情報処理システム１には、複数台の端末装置１０や、複数台の情報提供装置５０や、複数台の情報処理装置１００が含まれてもよい。

端末装置１０は、ユーザによって利用される情報処理装置である。端末装置１０は、ユーザによる種々の操作を受け付ける。なお、以下では、端末装置１０をユーザと表記する場合がある。すなわち、以下では、ユーザを端末装置１０と読み替えることもできる。なお、上述した端末装置１０は、例えば、スマートフォンや、タブレット型端末や、ノート型ＰＣ（Personal Computer）や、デスクトップＰＣや、携帯電話機や、ＰＤＡ（Personal Digital Assistant）等により実現される。

情報提供装置５０は、ユーザ等に種々の情報提供を行うための情報が格納された情報処理装置である。例えば、情報提供装置５０は、ウェブサーバ等の種々の外部装置から収集した文字情報等に基づくオブジェクトＩＤが格納される。例えば、情報提供装置５０は、ユーザ等に画像検索サービスを提供する情報処理装置である。例えば、情報提供装置５０は、画像検索サービスを提供するための各情報が格納される。例えば、情報提供装置５０は、画像検索サービスの対象となる画像に対応するベクトル情報を情報処理装置１００に提供する。また、情報提供装置５０は、クエリを情報処理装置１００に送信することにより、情報処理装置１００からクエリに対応する画像を示すオブジェクトＩＤ等を受信する。

情報処理装置１００は、複数のオブジェクトの各々に対応するノードが近傍ノードにエッジで連結されるグラフを生成する生成装置である。また、情報処理装置１００は、複数のオブジェクトを対象とし、生成中のグラフを用いた検索処理を含むグラフの生成処理時において、基準値に基づき前記グラフの生成に用いるパラメータの値を調整する調整処理により、パラメータの値を決定する決定装置である。

情報処理装置１００は、クエリに類似するオブジェクトを抽出する検索装置である。例えば、情報処理装置１００は、端末装置１０からクエリ情報（クエリ）を受信すると、クエリに類似する対象（ベクトル情報等）を検索し、検索結果を端末装置１０に提供する。また、例えば、情報処理装置１００が端末装置１０に提供するデータは、画像情報等のデータ自体であってもよいし、ＵＲＬ（Uniform Resource Locator）等の対応するデータを参照するための情報であってもよい。また、クエリや検索対象のデータは、画像、音声、テキストデータなど、如何なる種類のデータであってもよい。本実施形態において、情報処理装置１００が画像を検索する場合を一例として説明する。

〔３．情報処理装置の構成〕
次に、図６を用いて、実施形態に係る情報処理装置１００の構成について説明する。図６は、実施形態に係る情報処理装置１００の構成例を示す図である。図６に示すように、情報処理装置１００は、通信部１１０と、記憶部１２０と、制御部１３０とを有する。なお、情報処理装置１００は、情報処理装置１００の管理者等から各種操作を受け付ける入力部（例えば、キーボードやマウス等）や、各種情報を表示するための表示部（例えば、液晶ディスプレイ等）を有してもよい。

（通信部１１０）
通信部１１０は、例えば、ＮＩＣ（Network Interface Card）等によって実現される。そして、通信部１１０は、ネットワーク（例えば図５中のネットワークＮ）と有線または無線で接続され、端末装置１０や情報提供装置５０との間で情報の送受信を行う。

（記憶部１２０）
記憶部１２０は、例えば、ＲＡＭ（Random Access Memory）、フラッシュメモリ（Flash Memory）等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。実施形態に係る記憶部１２０は、図６に示すように、オブジェクト情報記憶部１２１と、ツリー情報記憶部１２２と、グラフ情報記憶部１２３と、パラメータ情報記憶部１２４と、基準値情報記憶部１２５と、調整関連情報記憶部１２６とを有する。

（オブジェクト情報記憶部１２１）
実施形態に係るオブジェクト情報記憶部１２１は、オブジェクトに関する各種情報を記憶する。例えば、オブジェクト情報記憶部１２１は、データセットごとにオブジェクトＩＤやベクトルデータを記憶する。図７は、実施形態に係るオブジェクト情報記憶部の一例を示す図である。図７に示すオブジェクト情報記憶部１２１には、「データセットＩＤ」、「オブジェクトＩＤ」、「ベクトル情報」といった項目が含まれる。

「データセットＩＤ」は、データセットを識別するための識別情報を示す。「オブジェクトＩＤ」は、オブジェクトを識別するための識別情報を示す。また、「ベクトル情報」は、オブジェクトＩＤにより識別されるオブジェクトに対応するベクトル情報を示す。すなわち、図７の例では、オブジェクトを識別するオブジェクトＩＤに対して、オブジェクトに対応するベクトルデータ（ベクトル情報）が対応付けられて登録されている。

図７の例では、データセットＩＤ「ＤＳ１」により識別されるデータセット（データセットＤＳ１）には、オブジェクトＩＤ「ＯＢ１」、「ＯＢ２」、「ＯＢ３」等により識別される複数のオブジェクト（対象）が含まれることを示す。オブジェクトＩＤ「ＯＢ１」により識別されるオブジェクト（オブジェクトＯＢ１）は、「１０，２４，５１，２．．．」の多次元のベクトル情報が対応付けられることを示す。また、オブジェクトＩＤ「ＯＢ２」により識別されるオブジェクト（オブジェクトＯＢ２）は、「３２，１，１２０，３１．．．」の多次元のベクトル情報が対応付けられることを示す。

なお、オブジェクト情報記憶部１２１は、上記に限らず、目的に応じて種々の情報を記憶してもよい。

（ツリー情報記憶部１２２）
実施形態に係るツリー情報記憶部１２２は、ツリーに関する各種情報を記憶する。図８は、実施形態に係るツリー情報記憶部の一例を示す図である。具体的には、図８の例では、ツリー情報記憶部１２２は、ツリー構造のツリー情報を示す。図８の例では、ツリー情報記憶部１２２には、「ルート階層」、「第１階層」、「第２階層」、「第３階層」等といった項目が含まれる。なお、「第１階層」～「第３階層」に限らず、ツリーの階層数に応じて、「第４階層」、「第５階層」、「第６階層」等が含まれてもよい。

「ルート階層」は、ツリーを用いた起点ノードの決定の開始点となるルート（最上位）の階層を示す。「第１階層」は、ツリーの第１階層に属するノード（節点またはグラフ情報中のベクトル）を識別（特定）する情報が格納される。「第１階層」に格納されるノードは、ツリーの根（ルート）に直接結ばれる階層に対応するノードとなる。

「第２階層」は、ツリーの第２階層に属するノード（節点またはグラフ情報中のベクトル）を識別（特定）する情報が格納される。「第２階層」に格納されるノードは、第１階層のノードに結ばれる直下の階層に対応するノードとなる。「第３階層」は、ツリーの第３階層に属するノード（節点またはグラフ情報中のベクトル）を識別（特定）する情報が格納される。「第３階層」に格納されるノードは、第２階層のノードに結ばれる直下の階層に対応するノードとなる。

図８に示す例においては、ツリー情報記憶部１２２には、図１中のツリー情報ＩＮＤ１１に対応する情報が記憶される。例えば、ツリー情報記憶部１２２は、第１階層のノードが、節点ＶＴ１～ＶＴ３等であることを示す。また、各節点の下の括弧内の数値は、各節点に対応するベクトルの値を示す。

また、ツリー情報記憶部１２２は、節点ＶＴ２の直下の第２階層のノードが、節点ＶＴ２－１～ＶＴ２－４であることを示す。また、ツリー情報記憶部１２２は、節点ＶＴ２－１の直下の第３階層のノードが、ノードＮ１、ノードＮ２のグラフＧＲ１１中のノード（ベクトル）であることを示す。ツリー情報記憶部１２２は、節点ＶＴ２－２の直下の第３階層のノードが、ノードＮ３、ノードＮ４、ノードＮ５のグラフＧＲ１１中のノード（ベクトル）であることを示す。

なお、ツリー情報記憶部１２２は、上記に限らず、目的に応じて種々の情報を記憶してもよい。

（グラフ情報記憶部１２３）
実施形態に係るグラフ情報記憶部１２３は、グラフに関する各種情報を記憶する。例えば、グラフ情報記憶部１２３は、検索処理等の情報処理に用いられるグラフ情報を記憶する。図９の例では、グラフ情報記憶部１２３は、近傍グラフデータを記憶する。図９は、実施形態に係るグラフ情報記憶部の一例を示す図である。図９に示すグラフ情報記憶部１２３は、「ノードＩＤ」、「オブジェクトＩＤ」、および「エッジ情報」といった項目を有する。また、「エッジ情報」には、「エッジＩＤ」や「参照先」といった情報が含まれる。

「ノードＩＤ」は、グラフデータにおける各ノード（対象）を識別するための識別情報を示す。また、「オブジェクトＩＤ」は、オブジェクトを識別するための識別情報を示す。

また、「エッジ情報」は、対応するノードに接続されるエッジに関する情報を示す。図９の例では、「エッジ情報」は、対応するノードに連結される無向エッジ（双方向エッジ）に関する情報を示す。また、「エッジＩＤ」は、ノード間を連結するエッジを識別するための識別情報を示す。また、「参照先」は、エッジにより連結された参照先（ノード）を示す情報を示す。すなわち、図９の例では、ノードを識別するノードＩＤに対して、そのノードに対応するオブジェクト（対象）を識別する情報やそのノードからのエッジが連結される参照先（ノード）が対応付けられて登録されている。

図９の例では、ノードＩＤ「Ｎ１」により識別されるノード（ノードＮ１）は、オブジェクトＩＤ「ＯＢ１」により識別されるオブジェクト（対象）に対応することを示す。また、ノードＮ１からは、エッジＩＤ「Ｅ１」により識別されるエッジ（エッジＥ１）が、ノードＩＤ「Ｎ２」により識別されるノード（ノードＮ２）に連結されることを示す。すなわち、図９の例では、グラフ情報におけるノードＮ１からはエッジＥ１によりノードＮ２へ辿ることができることを示す。また、ノードＮ１からは、エッジＩＤ「Ｅ２」により識別されるエッジ（エッジＥ２）が、ノードＩＤ「Ｎ５３」により識別されるノード（ノードＮ５３）に連結されることを示す。すなわち、図９の例では、グラフ情報におけるノードＮ１からはエッジＥ２によりノードＮ５３へ辿ることができることを示す。

また、図９の例では、ノードＩＤ「Ｎ２」により識別されるノード（ノードＮ２）は、オブジェクトＩＤ「ＯＢ２」により識別されるオブジェクト（対象）に対応することを示す。また、ノードＮ２からは、エッジＩＤ「Ｅ１」により識別されるエッジ（エッジＥ１）が、ノードＩＤ「Ｎ１」により識別されるノード（ノードＮ１）に連結されることを示す。すなわち、図９の例では、グラフ情報におけるノードＮ２からはエッジＥ１によりノードＮ１へ辿ることができることを示す。

なお、グラフ情報記憶部１２３は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、グラフ情報記憶部１２３は、各ノード（ベクトル）間を連結するエッジの長さが記憶されてもよい。すなわち、グラフ情報記憶部１２３は、各ノード（ベクトル）間の距離を示す情報が記憶されてもよい。グラフ情報記憶部１２３には、無向エッジにより連結されたグラフ情報に限らず、種々のグラフ情報が記憶されてもよい。グラフ情報記憶部１２３には、有向エッジにより連結されたグラフ情報が記憶されてもよい。

（パラメータ情報記憶部１２４）
実施形態に係るパラメータ情報記憶部１２４は、パラメータに関する各種情報を記憶する。パラメータ情報記憶部１２４は、グラフの生成に用いるパラメータに関するパラメータ情報を記憶する。図１０は、実施形態に係るパラメータ情報記憶部の一例を示す図である。図１０に示すパラメータ情報記憶部１２４は、「パラメータＩＤ」、「パラメータ」、「内容」、「値」、「範囲情報」といった項目を有する。また、「範囲情報」には、「上限値」や「下限値」といった項目が含まれる。

「パラメータＩＤ」は、パラメータを識別するための識別情報を示す。例えば、「パラメータＩＤ」は、グラフの生成に用いるパラメータを識別するための識別情報を示す。また、「パラメータ」は、対応するパラメータＩＤにより識別されるパラメータを示す。例えば、「パラメータ」は、パラメータの変数を示す。「内容」は、対応するパラメータＩＤにより識別されるパラメータの内容を示す。例えば、「内容」は、パラメータの用途を示す。

「値」は、対応するパラメータの値を示す。例えば、「値」は、対応するパラメータの最新の値（現在値）を示す。「範囲情報」は、対応するパラメータの値の範囲を示す情報が記憶される。「範囲情報」は、対応するパラメータがとり得る値の範囲を示す情報が記憶される。「上限値」は、対応するパラメータの上限値を示す。各近傍ノードの順位を示す。「下限値」は、対応するパラメータの下限値を示す。なお、「上限値」や「下限値」は、その値を含むか否かを示す情報を記憶する。

図１０の例では、パラメータＩＤ「ＰＭ１」により識別されるパラメータ（パラメータＰＭ１）は、パラメータ「Ｋ」であることを示す。パラメータ「Ｋ」は、内容が「連結エッジ数」であり、連結エッジ数を指定するパラメータである。例えば、パラメータ「Ｋ」は、ノードに連結されるエッジの数を示す。すなわち、パラメータ「Ｋ」は、ノードに近傍ノードとして連結されるノードの数を示す。

パラメータ「Ｋ」は、値が「１２０」であることを示す。すなわち、パラメータ「Ｋ」の現在値は、「１２０」であることを示す。パラメータ「Ｋ」は、上限値が「２００」であり、下限値が「５」であることを示す。すなわち、パラメータ「Ｋ」は、５以上２００以下の間で値が設定可能であることを示す。図１０の例では、パラメータ「Ｋ」の範囲には、上限値及び下限値が含まれることを示す情報が記憶される。

図１０の例では、パラメータＩＤ「ＰＭ２」により識別されるパラメータ（パラメータＰＭ２）は、パラメータ「ε」であることを示す。パラメータ「ε」は、内容が「検索範囲係数」であり、検索処理時に用いられるパラメータ（検索範囲係数）を示す。例えば、パラメータ「ε」は、検索処理時における探索範囲の決定に用いられる検索範囲係数の値を示す。

パラメータ「ε」は、値が「０．１」であることを示す。すなわち、パラメータ「ε」の現在値は、「０．１」であることを示す。パラメータ「ε」は、上限値が「－（設定なし）」であり、下限値が「－１」であることを示す。すなわち、パラメータ「ε」は、上限値がなく、－１より大きい値が設定可能であることを示す。図１０の例では、パラメータ「ε」の範囲には、下限値は含まないことを示す情報が記憶される。

なお、パラメータ情報記憶部１２４は、上記に限らず、目的に応じて種々の情報を記憶してもよい。パラメータ情報記憶部１２４は、複数のグラフ情報を使い分ける場合、パラメータに、そのパラメータが用いられるグラフ情報を対応付けて記憶してもよい。例えば、パラメータ情報記憶部１２４は、グラフＧＲ１１以外のグラフ情報が用いられる場合、各パラメータが用いられるグラフ情報と、対応するパラメータとを対応付けて記憶してもよい。

（基準値情報記憶部１２５）
実施形態に係る基準値情報記憶部１２５は、基準に関する各種情報を記憶する。図１１は、実施形態に係る基準値情報記憶部の一例を示す図である。図１１の例では、基準値情報記憶部１２５は、「基準値ＩＤ」、「対象」、「値」といった項目を有する。

「基準値ＩＤ」は、基準値を識別する情報を示す。「対象」は、基準値の対象を示す。「値」は、対応する基準値の具体的に数値を示す。

図１１の例では、基準値ＩＤ「ＲＶ１」により識別される基準値（基準値ＲＶ１）は、対象「制限時間」に関する基準値であることを示す。基準値ＲＶ１は、制限時間を示す基準値であることを示す。基準値ＲＶ１は、値が「ＴＬ１」であることを示す。なお、図１１に示す例では、値を「ＴＬ１」といった抽象的な符号を図示するが、例えば「３０分」や「５時間」や「１日」等、具体的な数値であるものとする。

なお、基準値情報記憶部１２５は、上記に限らず、目的に応じて種々の情報を記憶してもよい。

（調整関連情報記憶部１２６）
実施形態に係る調整関連情報記憶部１２６は、パラメータの調整に関する各種情報を記憶する。図１２は、実施形態に係る調整関連情報記憶部の一例を示す図である。図１２の例では、調整関連情報記憶部１２６は、「調整ＩＤ」、「対象データセット」、「基準値」、「処理条件（区間）」、「調整情報」といった項目を有する。また、「調整情報」には、「判定条件」、「調整＃１」、「調整＃２」といった項目が含まれる。なお、調整＃１」、「調整＃２」に限らず、調整対象となるパラメータの数に応じて、「調整＃３」、「調整＃４」等が含まれてもよい。

「調整ＩＤ」は、調整を識別するための識別情報を示す。「対象データセット」は、調整の対象とするデータセットを識別するための識別情報を示す。「基準値」は、対応するデータセットを対象とするグラフ生成において用いる基準値を示す。「処理条件（区間）」は、処理を行うための条件を示す。例えば、「処理条件（区間）」は、調整処理を行うかどうかの判定条件を示す。なお、図１２の例では、データの処理区間を「処理条件」とする場合を示すが、「処理条件」は、データの処理区間に限らず、例えば検索精度や検索速度等、種々の条件であってもよい。

「調整情報」は、調整に関する各種情報を示す。「判定条件」は、パラメータを調整するかどうかの判定条件を示す。「調整＃１」や「調整＃２」は、対応する判定条件を満たす場合に、調整されるパラメータ及びその調整内容を示す。「調整＃１」や「調整＃２」中の「対象」は、調整の対象となるパラメータを示す。「調整＃１」や「調整＃２」中の「変動幅」は、パラメータの値の変動幅を示す。

図１２の例では、「調整＃１」、「調整＃２」の順にパラメータの優先度が付されているものとする。すなわち、「判定条件」を満たす場合、まず「調整＃１」のパラメータが調整対象となる。そして、「調整＃１」のパラメータの値が上限や下限に達した事等により、調整できない場合、「調整＃２」のパラメータが調整対象となる。なお、パラメータの調整は、「調整＃１」、「調整＃２」の順に行う場合に限らず、「調整＃１」、「調整＃２」を同時に行ってもよいし、「調整＃１」、「調整＃２」を交互に行ってもよい。

図１２の例では、調整ＩＤ「ＡＤ１」により識別される調整（調整ＡＤ１）は、データセットＤＳ１を対象とした調整であることを示す。調整ＡＤ１は、１００万オブジェクトを含むデータセットＤＳ１を対象としたグラフの生成における調整であることを示す。調整ＡＤ１は、基準値ＩＤ「ＲＶ１」により識別される基準値が用いられることを示す。すなわち、調整ＡＤ１は、基準値として基準値ＩＤ「ＲＶ１」により識別される制限時間「ＴＬ１」が用いられることを示す。

また、調整ＡＤ１は、処理条件（区間）が「ＳＩＮＦ１」であることを示す。調整ＡＤ１は、処理条件（区間）が１０万ごとであることを示す。すなわち、調整ＡＤ１は、１０万のノードが追加される度に調整処理を行うかどうかの判定を行うことを示す。なお、処理条件（区間）は、１０万ごとなど、一定の間隔ではなく、例えば追加されたノード数が多くなるほど長くなったり、短くなったりする間隔、すなわち動的に変動する間隔であってもよい。

また、判定条件は「推定処理時間＞ＴＬ１」や「推定処理時間がＴＬ１より所定値以上小さい」であることを示す。判定条件「推定処理時間がＴＬ１より所定値以上小さい」の「所定値」は、「３０分」や「１時間」等、種々の値であってもよい。

例えば、判定条件「推定処理時間＞ＴＬ１」を満たした場合、パラメータＰＭ１であるパラメータ「Ｋ」の値が５だけ減算されることを示す。また、判定条件「推定処理時間＞ＴＬ１」を満たし、パラメータ「Ｋ」が下限に達している場合、パラメータＰＭ２であるパラメータ「ε」の値が０．０５だけ減算されることを示す。

例えば、判定条件「推定処理時間がＴＬ１より所定値以上小さい」を満たした場合、パラメータＰＭ１であるパラメータ「Ｋ」の値が５だけ加算されることを示す。また、判定条件「推定処理時間がＴＬ１より所定値以上小さい」を満たし、パラメータ「Ｋ」が上限に達している場合、パラメータＰＭ２であるパラメータ「ε」の値が０．０５だけ加算されることを示す。

なお、調整関連情報記憶部１２６は、上記に限らず、目的に応じて種々の情報を記憶してもよい。

（制御部１３０）
図６の説明に戻って、制御部１３０は、コントローラ（controller）であり、例えば、ＣＰＵ（Central Processing Unit）やＭＰＵ（Micro Processing Unit）等によって、情報処理装置１００内部の記憶装置に記憶されている各種プログラム（情報処理プログラムの一例に相当）がＲＡＭを作業領域として実行されることにより実現される。また、制御部１３０は、コントローラであり、例えば、ＡＳＩＣ（Application Specific Integrated Circuit）やＦＰＧＡ（Field Programmable Gate Array）等の集積回路により実現される。

図６に示すように、制御部１３０は、取得部１３１と、生成部１３２と、推定部１３３と、決定部１３４と、抽出部１３５と、提供部１３６とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部１３０の内部構成は、図６に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。

（取得部１３１）
取得部１３１は、各種情報を取得する。取得部１３１は、記憶部１２０から各種情報を取得する。取得部１３１は、オブジェクト情報記憶部１２１や、ツリー情報記憶部１２２や、グラフ情報記憶部１２３や、パラメータ情報記憶部１２４や、基準値情報記憶部１２５や、調整関連情報記憶部１２６等から各種情報を取得する。また、取得部１３１は、各種情報を外部の情報処理装置から取得する。取得部１３１は、端末装置１０等の外部装置から各種情報を取得する。取得部１３１は、グラフ情報記憶部１２３からグラフ情報を取得する。取得部１３１は、ツリー情報記憶部１２２からツリー情報を取得する。

取得部１３１は、グラフの生成対象となる複数のオブジェクトと、複数のオブジェクトの各々に対応するノードが近傍ノードにエッジで連結されるグラフの生成における基準を示す基準値とを取得する。取得部１３１は、複数のオブジェクトのうち一部のオブジェクトをノードとして追加済みのグラフを取得する。取得部１３１は、グラフの生成における制限時間を示す基準値を取得する。

取得部１３１は、検索クエリに関する情報を取得する。取得部１３１は、画像検索に関する検索クエリを取得する。取得部１３１は、ユーザが利用する端末装置１０からクエリを取得する。取得部１３１は、端末装置１０からクエリを受け付けた情報提供装置５０からクエリを取得してもよい。

図１の例では、取得部１３１は、グラフ情報記憶部１２３からグラフＧＲ１１を取得する。取得部１３１は、オブジェクト情報記憶部１２１（図７参照）からデータセットＤＳ１を取得する。取得部１３１は、ツリー情報記憶部１２２からツリー情報ＩＮＤ１１を取得する。

取得部１３１は、連結エッジ数「Ｋ」の初期値は「１２０」であり、検索範囲係数「ε」の初期値は「０．１」を取得する。取得部１３１は、パラメータ情報記憶部１２４から各パラメータの初期値を取得する。取得部１３１は、範囲情報ＬＧ１をパラメータ情報記憶部１２４から取得する。

（生成部１３２）
生成部１３２は、各種情報を生成する。生成部１３２は、記憶部１２０に記憶された各種情報に基づいて、種々の情報を生成する。生成部１３２は、オブジェクト情報記憶部１２１や、ツリー情報記憶部１２２や、グラフ情報記憶部１２３や、パラメータ情報記憶部１２４や、基準値情報記憶部１２５や、調整関連情報記憶部１２６等に基づいて、各種情報を生成する。

生成部１３２は、取得部１３１により取得された各種情報に基づいて、種々の情報を生成する。生成部１３２は、推定部１３３により推定された各種情報に基づいて、種々の情報を生成する。生成部１３２は、決定部１３４により決定された各種情報に基づいて、種々の情報を生成する。生成部１３２は、抽出部１３５により抽出された各種情報に基づいて、種々の情報を生成する。生成部１３２は、グラフ情報を生成してもよい。

生成部１３２は、決定部１３４により値が決定されたパラメータを用いて、グラフを生成する。生成部１３２は、複数のオブジェクトから選択された一のオブジェクトを一のノードとして、グラフに追加し、グラフに追加済みの他のノードを近傍ノードとして連結する連結処理により、グラフを更新する。生成部１３２は、一のノードをクエリとする検索処理によりグラフから抽出されたノードを一のノードの近傍ノードとして、一のノードに連結する連結処理により、グラフを更新する。生成部１３２は、複数のオブジェクトのうち、一部のオブジェクト以外の一のオブジェクトを選択し、連結処理を行うことにより、グラフを更新する。

図１の例では、生成部１３２は、ノードＮ１が最初のノードであるため、ノードＮ１を含むグラフＧＲ１１を新規に生成する。生成部１３２は、グラフＧＲ１１の更新に応じて、グラフ情報記憶部１２３を更新する。生成部１３２は、各オブジェクトに対応する各ノードから所定数以上のエッジが他のエッジに連結されるように、グラフＧＲ１１を生成する。生成部１３２は、パラメータ「Ｋ」が初期値「１２０」である場合、１２０個のノードへのエッジが連結されるようにグラフＧＲ１１を生成する。

（推定部１３３）
推定部１３３は、各種情報を推定する。推定部１３３は、記憶部１２０に記憶された各種情報に基づいて、種々の情報を推定する。推定部１３３は、各種情報を算出する。推定部１３３は、記憶部１２０に記憶された各種情報に基づいて、種々の情報を算出する。推定部１３３は、所定の推定値を算出する。推定部１３３は、記憶部１２０に記憶された各種情報に基づいて、所定の推定値を算出する。推定部１３３は、オブジェクト情報記憶部１２１や、ツリー情報記憶部１２２や、グラフ情報記憶部１２３や、パラメータ情報記憶部１２４や、基準値情報記憶部１２５や、調整関連情報記憶部１２６等に基づいて、各種情報を推定する。推定部１３３は、取得部１３１により取得された各種情報に基づいて、種々の情報を推定する。推定部１３３は、生成部１３２により生成された各種情報に基づいて、種々の情報を推定する。推定部１３３は、抽出部１３５により抽出された各種情報に基づいて、種々の情報を推定する。推定部１３３は、決定部１３４により決定された各種情報に基づいて、種々の情報を推定する。

推定部１３３は、グラフの生成の推定処理時間を推定する。推定部１３３は、推定時点までのグラフの生成に関する情報に基づいて、推定処理時間を推定する。推定部１３３は、推定時点までのグラフの生成に要した処理時間に基づいて、推定処理時間を推定する。推定部１３３は、推定時点前の所定の期間におけるグラフの生成に要した処理時間に基づいて、推定処理時間を推定する。推定部１３３は、推定時点直前の期間におけるグラフの生成に要した処理時間に基づいて、推定処理時間を推定する。

図１の例では、推定部１３３は、推定処理時間（推定総登録時間）を推定する。推定部１３３は、図２や図３に示すような処理により、推定処理時間（推定総登録時間）を推定する。推定部１３３は、グラフの生成処理が所定の条件を満たす場合、処理時間を推定する。推定部１３３は、グラフのノード数が１０万、２０万、３０万、４０万、５０万、６０万、７０万、８０万、９０万の各々に達した場合、グラフの生成処理が所定の条件を満たすと判定し、推定処理時間を推定する。推定部１３３は、推定情報ＥＳ１に示すように、グラフのノード数が５０万に達した時点における推定処理時間を「ＥＴ１」と推定する。

（決定部１３４）
決定部１３４は、各種情報を決定する。決定部１３４は、各種情報を判定する。決定部１３４は、各種情報を選択する。決定部１３４は、記憶部１２０に記憶された各種情報に基づいて、種々の情報を決定する。決定部１３４は、記憶部１２０に記憶された各種情報に基づいて、種々の情報を判定する。決定部１３４は、オブジェクト情報記憶部１２１や、ツリー情報記憶部１２２や、グラフ情報記憶部１２３や、パラメータ情報記憶部１２４や、基準値情報記憶部１２５や、調整関連情報記憶部１２６等に基づいて、各種情報を決定する。

決定部１３４は、取得部１３１により取得された各種情報に基づいて、種々の情報を決定する。決定部１３４は、取得部１３１により取得された各種情報に基づいて、種々の情報を判定する。決定部１３４は、推定部１３３により推定された各種情報に基づいて、種々の情報を決定する。決定部１３４は、推定部１３３により推定された各種情報に基づいて、種々の情報を判定する。決定部１３４は、抽出部１３５により抽出された各種情報に基づいて、種々の情報を決定する。決定部１３４は、抽出部１３５により抽出された各種情報に基づいて、種々の情報を判定する。決定部１３４は、抽出部１３５により抽出された各種情報に基づいて、種々の情報を選択する。決定部１３４は、検索処理における判定処理や決定処理や選択処理を行う。

決定部１３４は、複数のオブジェクトを対象とし、生成中のグラフを用いた検索処理を含むグラフの生成処理時において、基準値に基づきグラフの生成に用いるパラメータの値を調整する調整処理により、パラメータの値を決定する。決定部１３４は、グラフの生成の推定処理時間と、基準値との比較に基づく調整処理により、パラメータの値を決定する。決定部１３４は、推定部１３３により推定された推定処理時間と、基準値との比較に基づく調整処理により、パラメータの値を決定する。

決定部１３４は、推定処理時間が基準値に近づくようにパラメータの値を調整する調整処理により、パラメータの値を決定する。決定部１３４は、推定処理時間が基準値を超えないようにパラメータの値を調整する調整処理により、パラメータの値を決定する。決定部１３４は、推定処理時間が基準値を超える場合、処理時間が早くなるようにパラメータの値を調整する調整処理により、パラメータの値を決定する。決定部１３４は、推定処理時間が基準値を下回る場合、グラフの検索精度が高くなるようにパラメータの値を調整する調整処理により、パラメータの値を決定する。

決定部１３４は、ノードと近傍ノードとの間を連結するエッジ数を含むパラメータの値を調整する調整処理により、パラメータの値を決定する。決定部１３４は、検索処理時に用いられる検索時パラメータを含むパラメータの値を調整する調整処理により、パラメータの値を決定する。決定部１３４は、検索処理における探索範囲を決定するための係数である検索範囲係数を含むパラメータの値を調整する調整処理により、パラメータの値を決定する。

決定部１３４は、グラフの生成処理が所定の条件を満たす場合、調整処理を行う。決定部１３４は、グラフの生成処理において処理対象としたオブジェクトの数が所定の条件を満たす場合、調整処理を行う。決定部１３４は、グラフの生成処理において処理対象としたオブジェクトの数が所定の閾値に達した場合、調整処理を行う。

決定部１３４は、検索の起点となる起点ノード決定してもよい。決定部１３４は、所定のツリー情報を用いて、起点ノードを決定する。決定部１３４は、図４中の情報群ＧＩＮＦ１１に示すようなツリー情報ＩＮＤ１１を用いて起点ノードを決定する。決定部１３４は、ツリー情報ＩＮＤ１１に基づいて、クエリＱＥ１に対応する起点ノードを決定する。決定部１３４は、ツリー情報記憶部１２２（図８参照）に記憶されたツリー情報ＩＮＤ１１を用いて、起点ノードを決定する。

決定部１３４は、図４中のツリー情報ＩＮＤ１１に示すような木構造型のツリー情報を用いて、グラフＧＲ１１における起点ノードを決定する。決定部１３４は、クエリＱＥ１に基づいて、ツリー情報ＩＮＤ１１を上（ルートＲＴ）から下へ辿ることにより、ツリー情報ＩＮＤ１１の近傍候補となる起点ノードを特定する。決定部１３４は、２個のノードを起点ノードに決定する。

決定部１３４は、ツリー情報ＩＮＤ１１をルートＲＴからリーフノード（グラフＧＲ１１中のノード）まで辿ることにより、クエリＱＥ１に対応する起点ノードを決定してもよい。

図１の例では、決定部１３４は、調整関連情報記憶部１２６を用いて、調整処理を実行する。決定部１３４は、判定条件「推定処理時間＞ＴＬ１」を満たすため、処理時間が短くなるようにパラメータを調整する。決定部１３４は、設定値情報ＰＬ１－２に示すように、パラメータ「Ｋ」の値を５だけ減少させる。決定部１３４は、パラメータ「Ｋ」の値を「１２０」から「１１５」に減少させる。決定部１３４は、パラメータ「Ｋ」の値を「１１５」に決定する。

（抽出部１３５）
抽出部１３５は、各種情報を抽出する。抽出部１３５は、記憶部１２０に記憶された各種情報に基づいて、種々の情報を抽出する。抽出部１３５は、オブジェクト情報記憶部１２１や、ツリー情報記憶部１２２や、グラフ情報記憶部１２３や、パラメータ情報記憶部１２４や、基準値情報記憶部１２５や、調整関連情報記憶部１２６等に基づいて、各種情報を抽出する。抽出部１３５は、取得部１３１により取得された各種情報に基づいて、種々の情報を抽出する。抽出部１３５は、生成部１３２により生成された各種情報に基づいて、種々の情報を抽出する。抽出部１３５は、推定部１３３により推定された各種情報に基づいて、種々の情報を抽出する。抽出部１３５は、決定部１３４により決定された各種情報に基づいて、種々の情報を抽出する。抽出部１３５は、検索処理における抽出処理を行う。

抽出部１３５は、検索クエリに類似するノードである類似ノードを抽出する。抽出部１３５は、各種情報を検索する検索部であってもよい。抽出部１３５は、グラフ情報を探索することにより、オブジェクトを検索する。抽出部１３５は、取得部１３１により取得されたクエリが取得された場合、グラフ情報を探索することにより、クエリに類似するオブジェクトを検索する。抽出部１３５は、グラフデータを探索することにより、クエリに類似するオブジェクトを抽出する。抽出部１３５は、図１５に示すような処理手順に基づいて、グラフデータを探索することにより、クエリに類似するオブジェクトを抽出する。

図１の例では、抽出部１３５は、新規追加ノードをクエリ（クエリＱＥ１）として、生成中のグラフＧＲ１１を探索することにより、新規追加ノードに連結する近傍ノードを抽出する。例えば、抽出部１３５は、図１５に示すような処理により、クエリＱＥ１を対象とする検索処理により新規追加ノードに対応するＫ個の近傍ノードを抽出する。抽出部１３５は、その時点での検索範囲係数「ε」の設定値を用いて、図１５に示すような処理をグラフＧＲ１１を用いて行うことにより、クエリＱＥ１に対応するＫ個の近傍ノードを抽出する。抽出部１３５は、検索範囲係数「ε」が初初期値「０．１」である場合、検索範囲係数「ε」を「０．１」として、クエリＱＥ１に対応するＫ個の近傍ノードを抽出する。

（提供部１３６）
提供部１３６は、各種情報を提供する。提供部１３６は、端末装置１０や情報提供装置５０に各種情報を提供する。提供部１３６は、端末装置１０に各種情報を送信する。提供部１３６は、端末装置１０に各種情報を配信する。提供部１３６は、取得部１３１により取得された各種情報に基づいて、種々の情報を提供する。提供部１３６は、生成部１３２により生成された各種情報に基づいて、種々の情報を提供する。提供部１３６は、推定部１３３により推定された各種情報に基づいて、種々の情報を提供する。提供部１３６は、決定部１３４により決定された各種情報に基づいて、種々の情報を提供する。提供部１３６は、抽出部１３５により抽出された各種情報に基づいて、種々の情報を提供する。提供部１３６は、検索処理における提供処理を行う。

提供部１３６は、クエリに対応するオブジェクトＩＤを検索結果として提供する。提供部１３６は、決定部１３４により決定された類似ノードに関する情報を提供する。提供部１３６は、決定部１３４により決定された類似ノードを示すオブジェクトＩＤを端末装置１０や情報提供装置５０へ提供する。提供部１３６は、決定部１３４により決定されたオブジェクトＩＤをクエリに対応するベクトルを示す情報として、端末装置１０や情報提供装置５０に提供する。提供部１３６は、抽出部１３５により抽出（検索）されたオブジェクトＩＤを端末装置１０や情報提供装置５０へ提供する。提供部１３６は、抽出部１３５が検索により抽出したオブジェクトＩＤを情報提供装置５０へ提供する。提供部１３６は、抽出部１３５により抽出されたオブジェクトＩＤをクエリに対応するベクトルを示す情報として、端末装置１０や情報提供装置５０に提供する。

提供部１３６は、抽出部１３５により抽出された類似ノードに関する情報を提供する。提供部１３６は、類似ノードに関する情報を所定のユーザが利用する端末装置１０（図５参照）に提供する。提供部１３６は、クエリの送信元へ検索結果を提供する。

〔４．情報処理（決定処理、算出処理）のフロー〕
次に、図１３及び図１４を用いて、実施形態に係る情報処理システム１による情報処理の手順について説明する。

〔４－１．決定処理のフロー〕
まず、図１３について説明する。図１３は、実施形態に係る情報処理の一例を示すフローチャートである。具体的には、図１３は、実施形態に係る情報処理に含まれる決定処理の一例を示すフローチャートである。

図１３に示すように、情報処理装置１００は、グラフの生成対象となる複数のオブジェクトを取得する（ステップＳ１０１）。例えば、情報処理装置１００は、オブジェクト情報記憶部１２１（図７参照）から、データセットＤＳ１に含まれる複数のオブジェクトを取得する。

そして、情報処理装置１００は、グラフの生成における制限を示す基準値を取得する（ステップＳ１０２）。例えば、情報処理装置１００は、基準値情報記憶部（図１１参照）から、制限時間「ＴＬ１」を取得する。

そして、情報処理装置１００は、グラフの生成処理時において、基準値に基づきグラフの生成に用いるパラメータの値を調整する調整処理により、パラメータの値を決定する（ステップＳ１０３）。例えば、情報処理装置１００は、推定処理時間が制限時間「ＴＬ１」を超える場合、調整処理により、パラメータ「Ｋ」の値やパラメータ「ε」の値を変更して、パラメータの各々の値を決定する。

〔４－２．判定処理のフロー〕
次に、図１４について説明する。図１４は、実施形態に係る情報処理の一例を示すフローチャートである。具体的には、図１４は、実施形態に係る情報処理に含まれる判定処理の一例を示すフローチャートである。なお、図１４に示す判定処理は、図１３に示す調整処理内で行われてもよい。

図１４に示すように、情報処理装置１００は、グラフの生成処理が所定の条件を満たすかどうかを判定する（ステップＳ２０１）。例えば、情報処理装置１００は、グラフに追加したノードの数が所定の条件を満たすかどうかを判定する。

そして、情報処理装置１００は、グラフの生成処理が所定の条件を満たすと判定した場合（ステップＳ２０１：Ｙｅｓ）、調整処理を実行する（ステップＳ２０２）。例えば、情報処理装置１００は、グラフに追加したノードの数が所定の条件を満たす場合、調整処理を実行するかどうかの判定を行い、調整処理を実行すると判定した場合、調整処理を実行する。

また、情報処理装置１００は、グラフの生成処理が所定の条件を満たさないと判定した場合（ステップＳ２０１：Ｎｏ）、ステップＳ２０２の処理を実行せずに処理を終了する。

〔５．情報処理（検索処理）のフロー〕
次に、情報処理装置１００による検索処理のフローについて、図１５を一例として説明する。図１５は、実施形態に係る情報処理の一例を示すフローチャートである。具体的には、図１５は、グラフデータを用いた検索処理の一例を示すフローチャートである。なお、図１５に示す検索処理には、選択処理も含まれる。以下に説明する検索処理は、情報処理装置１００によって行われる。また、以下でいうオブジェクトは、ノードと読み替えてもよい。なお、情報処理装置１００によるグラフデータを用いた検索は下記に限らず、種々の手順により行われてもよい。

ここでは、近傍集合Ｎ（Ｇ，ｙ）は、ノードｙに付与されているエッジにより関連付けられている近傍のオブジェクトの集合である。例えば、近傍集合Ｎ（Ｇ，ｙ）は、ノードｙとの間にエッジが連結されたオブジェクト（ノード）の集合である。また、グラフのノード間が有向エッジで連結される場合、近傍集合Ｎ（Ｇ，ｙ）は、ノードｙからの出力エッジが連結されたオブジェクト（ノード）の集合である。「Ｇ」は、所定のグラフデータ（例えば、グラフＧＲ１１等）であってもよい。例えば、情報処理装置１００は、ｋ近傍検索処理を実行する。

例えば、情報処理装置１００は、超球の半径ｒを∞（無限大）に設定し（ステップＳ３００）、既存のオブジェクト集合から集合Ｓを抽出する（ステップＳ３０１）。例えば、情報処理装置１００は、起点ノードとして決定（選択）されたオブジェクト（ノード）を集合Ｓとして抽出してもよい。また、例えば、超球とは、検索範囲を示す仮想的な球である。なお、ステップＳ３０１において抽出された集合Ｓに含まれるオブジェクト（ノード）は、検索結果（抽出候補）の集合Ｒの初期集合にも含められる。また、ステップＳ３０１において抽出された集合Ｓに含まれるオブジェクト（ノード）は、集合Ｃに含められてもよい。集合Ｃは、重複検索を回避するために便宜上設けられるものであり、処理開始時には空集合に設定されてもよい。

次に、情報処理装置１００は、集合Ｓに含まれるオブジェクトの中で、検索クエリオブジェクトをｙとするとオブジェクトｙとの距離が最も短いオブジェクトを抽出し、オブジェクトｓとする（ステップＳ３０２）。例えば、図１の例では、情報処理装置１００は、オブジェクトｙであるクエリＱＥ１に対応する起点ノードであるノードＮ２等が含まれる集合Ｓから、一のノードをオブジェクトｓ（対象ノード）として抽出する。次に、情報処理装置１００は、オブジェクトｓを集合Ｓから除外する（ステップＳ３０３）。例えば、図１の例では、情報処理装置１００は、起点ノードであるノードＮ２を集合Ｓから除外する。

次に、情報処理装置１００は、オブジェクトｓとオブジェクトｙとの距離ｄ（ｓ，ｙ）がｒ（１＋ε）を超えるか否かを判定する（ステップＳ３０４）。ここで、εは拡張要素であり、ｒ（１＋ε）は、探索範囲（この範囲内のノードのみを探索する。検索範囲よりも大きくすることで精度を高めることができる）の半径を示す値である。オブジェクトｓとオブジェクトｙとの距離ｄ（ｓ，ｙ）がｒ（１＋ε）を超える場合（ステップＳ３０４：Ｙｅｓ）、情報処理装置１００は、集合Ｒをオブジェクトｙの近傍集合として出力し（ステップＳ３０５）、処理を終了する。

オブジェクトｓと検索クエリオブジェクトｙとの距離ｄ（ｓ，ｙ）がｒ（１＋ε）を超えない場合（ステップＳ３０４：Ｎｏ）、情報処理装置１００は、オブジェクトｓの近傍集合Ｎ（Ｇ，ｓ）の要素であるオブジェクトの中から集合Ｃに含まれないオブジェクトを、所定の基準に基づいて一つ選択し、選択したオブジェクトｕを、集合Ｃに格納する（ステップＳ３０６）。例えば、図１の例では、情報処理装置１００は、ノードＮ２の連結ノードであるノードＮ１、Ｎ４３等のうち、クエリＱＥ１と最も近いノード（例えばノードＮ４３）をオブジェクトｕとして選択する。

次に、情報処理装置１００は、オブジェクトｕとオブジェクトｙとの距離ｄ（ｕ，ｙ）がｒ（１＋ε）以下であるか否かを判定する（ステップＳ３０７）。オブジェクトｕとオブジェクトｙとの距離ｄ（ｕ，ｙ）がｒ（１＋ε）以下である場合（ステップＳ３０７：Ｙｅｓ）、情報処理装置１００は、オブジェクトｕを集合Ｓに追加する（ステップＳ３０８）。また、オブジェクトｕとオブジェクトｙとの距離ｄ（ｕ，ｙ）がｒ（１＋ε）以下ではない場合（ステップＳ３０７：Ｎｏ）、情報処理装置１００は、ステップＳ３０９の判定（処理）を行う。

次に、情報処理装置１００は、オブジェクトｕとオブジェクトｙとの距離ｄ（ｕ，ｙ）がｒ以下であるか否かを判定する（ステップＳ３０９）。オブジェクトｕとオブジェクトｙとの距離ｄ（ｕ，ｙ）がｒを超える場合、情報処理装置１００は、ステップＳ３１５の判定（処理）を行う。また、オブジェクトｕとオブジェクトｙとの距離ｄ（ｕ，ｙ）がｒ以下ではない場合（ステップＳ３０９：Ｎｏ）、情報処理装置１００は、ステップＳ３１５の判定（処理）を行う。

オブジェクトｕとオブジェクトｙとの距離ｄ（ｕ，ｙ）がｒ以下である場合（ステップＳ３０９：Ｙｅｓ）、情報処理装置１００は、オブジェクトｕを集合Ｒに追加する（ステップＳ３１０）。そして、情報処理装置１００は、集合Ｒに含まれるオブジェクト数がｋｓを超えるか否かを判定する（ステップＳ３１１）。所定数ｋｓは、任意に定められる自然数である。例えば、ｋｓは、検索における抽出数を示し、「３」や「２０」や「１００」等の任意の値であってもよい。集合Ｒに含まれるオブジェクト数がｋｓを超えない場合（ステップＳ３１１：Ｎｏ）、情報処理装置１００は、ステップＳ３１３の判定（処理）を行う。

集合Ｒに含まれるオブジェクト数がｋｓを超える場合（ステップＳ３１１：Ｙｅｓ）、情報処理装置１００は、集合Ｒに含まれるオブジェクトの中でオブジェクトｙとの距離が最も長い（遠い）オブジェクトを、集合Ｒから除外する（ステップＳ３１２）。

次に、情報処理装置１００は、集合Ｒに含まれるオブジェクト数がｋｓと一致するか否かを判定する（ステップＳ３１３）。集合Ｒに含まれるオブジェクト数がｋｓと一致しない場合（ステップＳ３１３：Ｎｏ）、情報処理装置１００は、ステップＳ３１５の判定（処理）を行う。また、集合Ｒに含まれるオブジェクト数がｋｓと一致する場合（ステップＳ３１３：Ｙｅｓ）、情報処理装置１００は、集合Ｒに含まれるオブジェクトの中でオブジェクトｙとの距離が最も長い（遠い）オブジェクトと、オブジェクトｙとの距離を、新たなｒに設定する（ステップＳ３１４）。

そして、情報処理装置１００は、オブジェクトｓの近傍集合Ｎ（Ｇ，ｓ）の要素であるオブジェクトから全てのオブジェクトを選択したか否かを判定する（ステップＳ３１５）。オブジェクトｓの近傍集合Ｎ（Ｇ，ｓ）の要素であるオブジェクトから全てのオブジェクトを選択していない場合（ステップＳ３１５：Ｎｏ）、情報処理装置１００は、ステップＳ３０６に戻って処理を繰り返す。なお、情報処理装置１００は、オブジェクトｓの近傍集合Ｎ（Ｇ，ｓ）の要素であるオブジェクトから全てを選択する場合に限らず、所定の閾値を設定し、その閾値に対応する個数までオブジェクトを選択してもよい。

オブジェクトｓの近傍集合Ｎ（Ｇ，ｓ）の要素であるオブジェクトから全てのオブジェクトを選択した場合（ステップＳ３１５：Ｙｅｓ）、情報処理装置１００は、集合Ｓが空集合であるか否かを判定する（ステップＳ３１６）。集合Ｓが空集合でない場合（ステップＳ３１６：Ｎｏ）、情報処理装置１００は、ステップＳ３０２に戻って処理を繰り返す。また、集合Ｓが空集合である場合（ステップＳ３１６：Ｙｅｓ）、情報処理装置１００は、集合Ｒを出力し、処理を終了する（ステップＳ３１７）。例えば、情報処理装置１００は、オブジェクト集合Ｒに含まれるオブジェクト（ノード）を対象ノード（入力オブジェクトｙ）に対応する近傍ノードとして選択してもよい。例えば、図１の例では、情報処理装置１００は、集合Ｒに含まれるノードＮ２、Ｎ４３、Ｎ１等をクエリＱＥ１（入力オブジェクトｙ）に対応する検索結果として出力する。また、例えば、情報処理装置１００は、集合Ｒに含まれるオブジェクト（ノード）を検索クエリ（入力オブジェクトｙ）に対応する検索結果として、検索を行った端末装置１０等へ提供してもよい。

〔６．効果〕
上述してきたように、実施形態に係る情報処理装置１００は、取得部１３１と、決定部１３４とを有する。取得部１３１は、グラフの生成対象となる複数のオブジェクトと、複数のオブジェクトの各々に対応するノードが近傍ノードにエッジで連結されるグラフの生成における基準を示す基準値とを取得する。決定部１３４は、複数のオブジェクトを対象とし、生成中のグラフを用いた検索処理を含むグラフの生成処理時において、基準値に基づきグラフの生成に用いるパラメータの値を調整する調整処理により、パラメータの値を決定する。

このように、実施形態に係る情報処理装置１００は、複数のオブジェクトを対象とし、生成中のグラフを用いた検索処理を含むグラフの生成処理時において、基準値に基づきグラフの生成に用いるパラメータの値を調整することにより、グラフの生成に用いるパラメータの値を適切に決定することができる。

また、実施形態に係る情報処理装置１００は、生成部１３２を有する。生成部１３２は、決定部１３４により値が決定されたパラメータを用いて、グラフを生成する。

このように、実施形態に係る情報処理装置１００は、値が決定したパラメータを用いて、グラフを生成することにより、適切にグラフを生成することができる。

また、実施形態に係る情報処理装置１００において、生成部１３２は、複数のオブジェクトから選択された一のオブジェクトを一のノードとして、グラフに追加し、グラフに追加済みの他のノードを近傍ノードとして連結する連結処理により、グラフを更新する。

このように、実施形態に係る情報処理装置１００は、複数のオブジェクトから選択された一のオブジェクトを一のノードとして、グラフに追加し、グラフに追加済みの他のノードを近傍ノードとして連結する連結処理により、グラフを更新することにより、適切にグラフを生成することができる。

また、実施形態に係る情報処理装置１００において、生成部１３２は、一のノードをクエリとする検索処理によりグラフから抽出されたノードを一のノードの近傍ノードとして、一のノードに連結する連結処理により、グラフを更新する。

このように、実施形態に係る情報処理装置１００は、一のノードをクエリとする検索処理によりグラフから抽出されたノードを一のノードの近傍ノードとして、一のノードに連結する連結処理により、グラフを更新することにより、適切にグラフを生成することができる。

また、実施形態に係る情報処理装置１００において、取得部１３１は、複数のオブジェクトのうち一部のオブジェクトをノードとして追加済みのグラフを取得する。生成部１３２は、複数のオブジェクトのうち、一部のオブジェクト以外の一のオブジェクトを選択し、連結処理を行うことにより、グラフを更新する。

このように、実施形態に係る情報処理装置１００は、複数のオブジェクトのうち一部のオブジェクトをノードとして追加済みのグラフを用いて、複数のオブジェクトのうち、一部のオブジェクト以外の一のオブジェクトを選択し、連結処理を行うことにより、グラフを更新することにより、適切にグラフを生成することができる。

また、実施形態に係る情報処理装置１００において、取得部１３１は、グラフの生成における制限時間を示す基準値を取得する。決定部１３４は、グラフの生成の推定処理時間と、基準値との比較に基づく調整処理により、パラメータの値を決定する。

このように、実施形態に係る情報処理装置１００は、グラフの生成の推定処理時間と、グラフの生成における制限時間を示す基準値との比較に基づく調整処理により、グラフの生成に用いるパラメータの値を適切に決定することができる。

また、実施形態に係る情報処理装置１００は、推定部１３３を有する。推定部１３３は、グラフの生成の推定処理時間を推定する。決定部１３４は、推定部１３３により推定された推定処理時間と、基準値との比較に基づく調整処理により、パラメータの値を決定する。

このように、実施形態に係る情報処理装置１００は、グラフの生成の推定処理時間を推定することにより、推定した推定処理時間を用いて基準を満たすかを判定可能となり、グラフの生成に用いるパラメータの値を適切に決定することができる。

また、実施形態に係る情報処理装置１００において、推定部１３３は、推定時点までのグラフの生成に関する情報に基づいて、推定処理時間を推定する。

このように、実施形態に係る情報処理装置１００は、推定時点までのグラフの生成に関する情報に基づいて、推定処理時間を推定することにより、推定した推定処理時間を用いて基準を満たすかを判定可能となり、グラフの生成に用いるパラメータの値を適切に決定することができる。

また、実施形態に係る情報処理装置１００において、推定部１３３は、推定時点までのグラフの生成に要した処理時間に基づいて、推定処理時間を推定する。

このように、実施形態に係る情報処理装置１００は、推定時点までのグラフの生成に要した処理時間に基づいて、推定処理時間を推定することにより、推定した推定処理時間を用いて基準を満たすかを判定可能となり、グラフの生成に用いるパラメータの値を適切に決定することができる。

また、実施形態に係る情報処理装置１００において、推定部１３３は、推定時点前の所定の期間におけるグラフの生成に要した処理時間に基づいて、推定処理時間を推定する。

このように、実施形態に係る情報処理装置１００は、推定時点前の所定の期間におけるグラフの生成に要した処理時間に基づいて、推定処理時間を推定することにより、推定した推定処理時間を用いて基準を満たすかを判定可能となり、グラフの生成に用いるパラメータの値を適切に決定することができる。

また、実施形態に係る情報処理装置１００において、推定部１３３は、推定時点直前の期間におけるグラフの生成に要した処理時間に基づいて、推定処理時間を推定する。

このように、実施形態に係る情報処理装置１００は、推定時点直前の期間におけるグラフの生成に要した処理時間に基づいて、推定処理時間を推定することにより、推定した推定処理時間を用いて基準を満たすかを判定可能となり、グラフの生成に用いるパラメータの値を適切に決定することができる。

また、実施形態に係る情報処理装置１００において、決定部１３４は、推定処理時間が基準値に近づくようにパラメータの値を調整する調整処理により、パラメータの値を決定する。

このように、実施形態に係る情報処理装置１００は、推定処理時間が基準値に近づくようにパラメータの値を調整することにより、グラフの生成に用いるパラメータの値を適切に決定することができる。

また、実施形態に係る情報処理装置１００において、決定部１３４は、推定処理時間が基準値を超えないようにパラメータの値を調整する調整処理により、パラメータの値を決定する。

このように、実施形態に係る情報処理装置１００は、推定処理時間が基準値を超えないようにパラメータの値を調整することにより、グラフの生成に用いるパラメータの値を適切に決定することができる。

また、実施形態に係る情報処理装置１００において、決定部１３４は、推定処理時間が基準値を超える場合、処理時間が早くなるようにパラメータの値を調整する調整処理により、パラメータの値を決定する。

このように、実施形態に係る情報処理装置１００は、推定処理時間が基準値を超える場合、処理時間が早くなるようにパラメータの値を調整することにより、グラフの生成に用いるパラメータの値を適切に決定することができる。

また、実施形態に係る情報処理装置１００において、決定部１３４は、推定処理時間が基準値を下回る場合、グラフの検索精度が高くなるようにパラメータの値を調整する調整処理により、パラメータの値を決定する。

このように、実施形態に係る情報処理装置１００は、推定処理時間が基準値を下回る場合、グラフの検索精度が高くなるようにパラメータの値を調整することにより、グラフの生成に用いるパラメータの値を適切に決定することができる。

また、実施形態に係る情報処理装置１００において、決定部１３４は、ノードと近傍ノードとの間を連結するエッジ数を含むパラメータの値を調整する調整処理により、パラメータの値を決定する。

このように、実施形態に係る情報処理装置１００は、ノードと近傍ノードとの間を連結するエッジ数を含むパラメータの値を調整することにより、グラフの生成に用いるパラメータの値を適切に決定することができる。

また、実施形態に係る情報処理装置１００において、決定部１３４は、検索処理時に用いられる検索時パラメータを含むパラメータの値を調整する調整処理により、パラメータの値を決定する。

このように、実施形態に係る情報処理装置１００は、検索処理時に用いられる検索時パラメータを含むパラメータの値を調整することにより、グラフの生成に用いるパラメータの値を適切に決定することができる。

また、実施形態に係る情報処理装置１００において、決定部１３４は、検索処理における探索範囲を決定するための係数である検索範囲係数を含むパラメータの値を調整する調整処理により、パラメータの値を決定する。

このように、実施形態に係る情報処理装置１００は、検索処理における探索範囲を決定するための係数である検索範囲係数を含むパラメータの値を調整することにより、グラフの生成に用いるパラメータの値を適切に決定することができる。

また、実施形態に係る情報処理装置１００において、決定部１３４は、グラフの生成処理が所定の条件を満たす場合、調整処理を行う。

このように、実施形態に係る情報処理装置１００は、グラフの生成処理が所定の条件を満たす場合、調整処理を行うことにより、適切なタイミングでグラフの生成に用いるパラメータの値を決定することができる。

また、実施形態に係る情報処理装置１００において、決定部１３４は、グラフの生成処理において処理対象としたオブジェクトの数が所定の条件を満たす場合、調整処理を行う。

このように、実施形態に係る情報処理装置１００は、グラフの生成処理において処理対象としたオブジェクトの数が所定の条件を満たす場合、調整処理を行うことにより、適切なタイミングでグラフの生成に用いるパラメータの値を決定することができる。

また、実施形態に係る情報処理装置１００において、決定部１３４は、グラフの生成処理において処理対象としたオブジェクトの数が所定の閾値に達した場合、調整処理を行う。

このように、実施形態に係る情報処理装置１００は、グラフの生成処理において処理対象としたオブジェクトの数が所定の閾値に達した場合、調整処理を行うことにより、適切なタイミングでグラフの生成に用いるパラメータの値を決定することができる。

〔７．ハードウェア構成〕
上述してきた実施形態に係る情報処理装置１００は、例えば図１６に示すような構成のコンピュータ１０００によって実現される。図１６は、情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ１０００は、ＣＰＵ１１００、ＲＡＭ１２００、ＲＯＭ（Read Only Memory）１３００、ＨＤＤ（Hard Disk Drive）１４００、通信インターフェイス（Ｉ／Ｆ）１５００、入出力インターフェイス（Ｉ／Ｆ）１６００、及びメディアインターフェイス（Ｉ／Ｆ）１７００を有する。

ＣＰＵ１１００は、ＲＯＭ１３００またはＨＤＤ１４００に格納されたプログラムに基づいて動作し、各部の制御を行う。ＲＯＭ１３００は、コンピュータ１０００の起動時にＣＰＵ１１００によって実行されるブートプログラムや、コンピュータ１０００のハードウェアに依存するプログラム等を格納する。

ＨＤＤ１４００は、ＣＰＵ１１００によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を格納する。通信インターフェイス１５００は、ネットワークＮを介して他の機器からデータを受信してＣＰＵ１１００へ送り、ＣＰＵ１１００が生成したデータをネットワークＮを介して他の機器へ送信する。

ＣＰＵ１１００は、入出力インターフェイス１６００を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。ＣＰＵ１１００は、入出力インターフェイス１６００を介して、入力装置からデータを取得する。また、ＣＰＵ１１００は、生成したデータを入出力インターフェイス１６００を介して出力装置へ出力する。

メディアインターフェイス１７００は、記録媒体１８００に格納されたプログラムまたはデータを読み取り、ＲＡＭ１２００を介してＣＰＵ１１００に提供する。ＣＰＵ１１００は、かかるプログラムを、メディアインターフェイス１７００を介して記録媒体１８００からＲＡＭ１２００上にロードし、ロードしたプログラムを実行する。記録媒体１８００は、例えばＤＶＤ（Digital Versatile Disc）、ＰＤ（Phase change rewritable Disk）等の光学記録媒体、ＭＯ（Magneto-Optical disk）等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。

例えば、コンピュータ１０００が実施形態に係る情報処理装置１００として機能する場合、コンピュータ１０００のＣＰＵ１１００は、ＲＡＭ１２００上にロードされたプログラムを実行することにより、制御部１３０の機能を実現する。コンピュータ１０００のＣＰＵ１１００は、これらのプログラムを記録媒体１８００から読み取って実行するが、他の例として、他の装置からネットワークＮを介してこれらのプログラムを取得してもよい。

以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の行に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。

〔８．その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。

また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。

また、上述してきた各実施形態に記載された各処理は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。

また、上述してきた「部（section、module、unit）」は、「手段」や「回路」などに読み替えることができる。例えば、取得部は、取得手段や取得回路に読み替えることができる。

１情報処理システム
１００情報処理装置
１２１オブジェクト情報記憶部
１２２ツリー情報記憶部
１２３グラフ情報記憶部
１２４パラメータ情報記憶部
１２５基準値情報記憶部
１２６調整関連情報記憶部
１３０制御部
１３１取得部
１３２生成部
１３３推定部
１３４決定部
１３５抽出部
１３６提供部
１０端末装置
５０情報提供装置
Ｎネットワーク

Claims

グラフの生成対象となる複数のオブジェクトと、前記複数のオブジェクトの各々に対応するノードが近傍ノードにエッジで連結される前記グラフの生成における基準を示す基準値とを取得する取得部と、
前記複数のオブジェクトを対象とし、生成中の前記グラフを用いた検索処理を含む前記グラフの生成処理時において、前記基準値に基づき前記グラフの生成に用いる検索範囲係数であって、前記検索処理における探索範囲を決定するための係数である検索範囲係数の値を調整する調整処理により、前記検索範囲係数の値を決定する決定部と、
を備えることを特徴とする情報処理装置。
前記決定部により値が決定された前記検索範囲係数を用いて、前記グラフを生成する生成部、
をさらに備えたことを特徴とする請求項１に記載の情報処理装置。
前記生成部は、
前記複数のオブジェクトから選択された一のオブジェクトを一のノードとして、前記グラフに追加し、前記グラフに追加済みの他のノードを前記近傍ノードとして連結する連結処理により、前記グラフを更新する
ことを特徴とする請求項２に記載の情報処理装置。
前記生成部は、
前記一のノードをクエリとする前記検索処理により前記グラフから抽出されたノードを前記一のノードの前記近傍ノードとして、前記一のノードに連結する連結処理により、前記グラフを更新する
ことを特徴とする請求項３に記載の情報処理装置。
前記取得部は、
前記複数のオブジェクトのうち一部のオブジェクトをノードとして追加済みの前記グラフを取得し、
前記生成部は、
前記複数のオブジェクトのうち、前記一部のオブジェクト以外の一のオブジェクトを選択し、前記連結処理を行うことにより、前記グラフを更新する
ことを特徴とする請求項３または請求項４に記載の情報処理装置。
前記取得部は、
前記グラフの生成における制限時間を示す前記基準値を取得し、
前記決定部は、
前記グラフの生成の推定処理時間と、前記基準値との比較に基づく前記調整処理により、前記検索範囲係数の値を決定する
ことを特徴とする請求項１～５のいずれか１項に記載の情報処理装置。
前記グラフの生成の推定処理時間を推定する推定部、
をさらに備え、
前記決定部は、
前記推定部により推定された前記推定処理時間と、前記基準値との比較に基づく前記調整処理により、前記検索範囲係数の値を決定する
ことを特徴とする請求項６に記載の情報処理装置。
前記推定部は、
推定時点までの前記グラフの生成に関する情報に基づいて、前記推定処理時間を推定する
ことを特徴とする請求項７に記載の情報処理装置。
前記推定部は、
推定時点までの前記グラフの生成に要した処理時間に基づいて、前記推定処理時間を推定する
ことを特徴とする請求項８に記載の情報処理装置。
前記推定部は、
推定時点前の所定の期間における前記グラフの生成に要した処理時間に基づいて、前記推定処理時間を推定する
ことを特徴とする請求項８または請求項９に記載の情報処理装置。
前記推定部は、
推定時点直前の期間における前記グラフの生成に要した処理時間に基づいて、前記推定処理時間を推定する
ことを特徴とする請求項８～１０のいずれか１項に記載の情報処理装置。
前記決定部は、
前記推定処理時間が前記基準値に近づくように前記検索範囲係数の値を調整する前記調整処理により、前記検索範囲係数の値を決定する
ことを特徴とする請求項６～１１のいずれか１項に記載の情報処理装置。
前記決定部は、
前記推定処理時間が前記基準値を超えないように前記検索範囲係数の値を調整する前記調整処理により、前記検索範囲係数の値を決定する
ことを特徴とする請求項６～１２のいずれか１項に記載の情報処理装置。
前記決定部は、
前記推定処理時間が前記基準値を超える場合、処理時間が早くなるように前記検索範囲係数の値を調整する前記調整処理により、前記検索範囲係数の値を決定する
ことを特徴とする請求項６～１３のいずれか１項に記載の情報処理装置。
前記決定部は、
前記推定処理時間が前記基準値を下回る場合、前記グラフの検索精度が高くなるように前記検索範囲係数の値を調整する前記調整処理により、前記検索範囲係数の値を決定する
ことを特徴とする請求項６～１４のいずれか１項に記載の情報処理装置。
前記決定部は、
前記グラフの生成処理が所定の条件を満たす場合、前記調整処理を行う
ことを特徴とする請求項１～１５のいずれか１項に記載の情報処理装置。
前記決定部は、
前記グラフの生成処理において処理対象としたオブジェクトの数が所定の条件を満たす場合、前記調整処理を行う
ことを特徴とする請求項１～１６のいずれか１項に記載の情報処理装置。
前記決定部は、
前記グラフの生成処理において処理対象としたオブジェクトの数が所定の閾値に達した場合、前記調整処理を行う
ことを特徴とする請求項１～１７のいずれか１項に記載の情報処理装置。
コンピュータが実行する情報処理方法であって、
グラフの生成対象となる複数のオブジェクトと、前記複数のオブジェクトの各々に対応するノードが近傍ノードにエッジで連結される前記グラフの生成における基準を示す基準値とを取得する取得工程と、
前記複数のオブジェクトを対象とし、生成中の前記グラフを用いた検索処理を含む前記グラフの生成処理時において、前記基準値に基づき前記グラフの生成に用いる検索範囲係数であって、前記検索処理における探索範囲を決定するための係数である検索範囲係数の値を調整する調整処理により、前記検索範囲係数の値を決定する決定工程と、
を含むことを特徴とする情報処理方法。
グラフの生成対象となる複数のオブジェクトと、前記複数のオブジェクトの各々に対応するノードが近傍ノードにエッジで連結される前記グラフの生成における基準を示す基準値とを取得する取得手順と、
前記複数のオブジェクトを対象とし、生成中の前記グラフを用いた検索処理を含む前記グラフの生成処理時において、前記基準値に基づき前記グラフの生成に用いる検索範囲係数であって、前記検索処理における探索範囲を決定するための係数である検索範囲係数の値を調整する調整処理により、前記検索範囲係数の値を決定する決定手順と、
をコンピュータに実行させることを特徴とする情報処理プログラム。