JP7121706B2

JP7121706B2 - 情報処理装置、情報処理方法、及び情報処理プログラム

Info

Publication number: JP7121706B2
Application number: JP2019144938A
Authority: JP
Inventors: 雅二郎岩崎
Original assignee: Yahoo Japan Corp
Current assignee: Yahoo Japan Corp
Priority date: 2019-08-06
Filing date: 2019-08-06
Publication date: 2022-08-18
Anticipated expiration: 2039-08-06
Also published as: JP2021026576A

Description

特許法第３０条第２項適用公開日平成３０年８月７日令和１年８月１３日時点における本願に関連するソフトウェアを公開するページｈｔｔｐｓ：／／ｇｉｔｈｕｂ．ｃｏｍ／ｙａｈｏｏｊａｐａｎ／ＮＧＴｈｔｔｐｓ：／／ｇｉｔｈｕｂ．ｃｏｍ／ｙａｈｏｏｊａｐａｎ／ＮＧＴ／ｒｅｌｅａｓｅｓ

本発明は、情報処理装置、情報処理方法、及び情報処理プログラムに関する。

従来、種々の情報を検索する技術が提供されている。例えば、有向エッジや無向エッジによって生成されたグラフ（グラフ情報）を用いて検索を行う技術が提供されている。例えば、各ノードが近傍ノードに有向エッジで接続されている近傍グラフが近傍検索に利用されている。このような技術は、例えば画像検索等に用いられる。

特開２０１１－０９０３５１号公報特許第５２０８００１号公報特許第６２９３３３５号公報

しかしながら、上記の従来技術では、グラフを用いた近傍検索等の検索処理に関連する評価指標を適切に算出することが難しい場合がある。例えば、グラフを用いた近傍検索の精度等の評価に用いる正解情報が近似の正解である場合、正解情報よりもクエリの近傍にある検索結果が抽出される可能性がある。このような場合、評価を適切に行うことが難しく、検索処理に関連する評価指標を適切に算出することが望まれている。

本願は、上記に鑑みてなされたものであって、検索処理に関連する評価指標を適切に算出する情報処理装置、情報処理方法、及び情報処理プログラムを提供することを目的とする。

本願に係る情報処理装置は、検索対象となる複数のオブジェクトを含むデータセットと、評価用クエリと、前記評価用クエリを用いた前記データセットの近傍検索の結果である近似正解検索結果とを取得する取得部と、前記データセットに対応する複数のノードがエッジにより連結された対象グラフと、前記評価用クエリとを用いた検索処理による検索結果のうち、前記近似正解検索結果に含まれない一のオブジェクトが、前記近似正解検索結果のうち、前記評価用クエリから最遠のオブジェクトである最遠オブジェクトよりも前記評価用クエリに近い場合、前記一のオブジェクトを正解とする所定の処理を行うことにより、前記検索処理に関連する評価指標を算出する算出部と、を備えたことを特徴とする。

実施形態の一態様によれば、検索処理に関連する評価指標を適切に算出することができるという効果を奏する。

図１は、実施形態に係る情報処理の一例を示す図である。図２は、実施形態に係る測定処理の一例を示す図である。図３は、実施形態に係る近似正解検索結果を用いた処理の一例を示す図である。図４は、実施形態に係る情報処理に用いるツリーの一例を示す図である。図５は、実施形態に係る情報処理システムの構成例を示す図である。図６は、実施形態に係る情報処理装置の構成例を示す図である。図７は、実施形態に係るオブジェクト情報記憶部の一例を示す図である。図８は、実施形態に係るツリー情報記憶部の一例を示す図である。図９は、実施形態に係るグラフ情報記憶部の一例を示す図である。図１０は、実施形態に係る近似正解検索結果情報記憶部の一例を示す図である。図１１は、実施形態に係る関数情報記憶部の一例を示す図である。図１２は、実施形態に係る調整関連情報記憶部の一例を示す図である。図１３は、実施形態に係る情報処理の一例を示すフローチャートである。図１４は、実施形態に係る情報処理の一例を示すフローチャートである。図１５は、実施形態に係る情報処理の一例を示すフローチャートである。図１６は、情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。

以下に、本願に係る情報処理装置、情報処理方法、及び情報処理プログラムを実施するための形態（以下、「実施形態」と呼ぶ）について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る情報処理装置、情報処理方法、及び情報処理プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。

（実施形態）
〔１．情報処理〕
図１を用いて、実施形態に係る情報処理の一例について説明する。図１は、実施形態に係る情報処理の一例を示す図である。情報処理装置１００（図６参照）が与えられたデータセットに対して実際に検索してパラメータを決定する処理について説明する。図１では、情報処理装置１００がデータセットの情報を用いて、閾値を算出する関数に含まれる複数のパラメータの各々の値を調整する処理（「調整処理」ともいう）により、複数のパラメータの各々の値を決定する場合を示す。詳細は後述するが、図１の例では、グラフの検索時に参照する参照エッジ数を示す閾値ＴＨ１を算出する関数ＦＣ１のパラメータ「ｅ_０」の値やパラメータ「ｗ_ｅ」の値を調整する場合を示す。以下では、パラメータ「ｅ_０」を「第１パラメータ」、パラメータ「ｅ_０」の値を「第１値」と記載し、パラメータ「ｗ_ｅ」を「第２パラメータ」、パラメータ「ｗ_ｅ」の値を「第２値」と記載する場合がある。なお、情報処理装置１００は、上記に限らず、種々の関数に含まれる複数のパラメータを対象に調整処理を行ってもよい。

図１の例では、情報処理装置１００は、オブジェクトＯＢ１、ＯＢ２、ＯＢ３、ＯＢ１０１等の複数のオブジェクトを含むデータセットＤＳ１を用いて、第１パラメータの第１値及び第２パラメータの第２値を調整する。データセットＤＳ１中の各オブジェクトは、ベクトル化され、ベクトル化されたオブジェクト（ベクトル情報）を対象として、後述する検索処理などの各種処理を行う。なお、データセットＤＳ１に含まれ検索対象となる情報（オブジェクト）は、ベクトルとして表現可能であれば、どのような情報であってもよい。なお、以下では、画像情報を対象としたベクトル情報について説明するが、ベクトル情報の対象は、動画情報や音声情報等の他の対象であってもよい。

また、情報処理装置１００が用いる情報は、ベクトルに限らず、各対象の類似性を表現可能な情報であれば、どのような形式の情報であってもよい。例えば、情報処理装置１００は、各対象に対応する所定のデータや値を用いて対象をグラフ構造化したグラフ情報を用いてもよい。例えば、情報処理装置１００は、各対象から生成された所定の数値（例えば２進数の値や１６進数の値）を用いて対象をグラフ構造化したグラフ情報を用いてもよい。例えば、ベクトルに代えて、データ間の距離（類似度）が定義されていれば任意の形態のデータであっても良い。例えば、情報処理装置１００は、オブジェクト情報記憶部１２１（図７参照）からデータセットＤＳ１を取得する。

〔１－１．調整処理〕
まず、情報処理装置１００は、評価用クエリを決定する（ステップＳ１）。情報処理装置１００は、与えられたデータセットからクエリオブジェクトセットを生成する。情報処理装置１００は、データセットからランダムに抽出したオブジェクト、または、ランダムに抽出した二つ以上のオブジェクトの平均値のオブジェクトを、クエリオブジェクト（評価用クエリ）に決定する。これにより、情報処理装置１００は、データセットに含まれないオブジェクトを評価用クエリとすることができる。

図１の例では、情報処理装置１００は、データセットＤＳ１から評価用クエリの生成に用いるオブジェクトを抽出する。例えば、情報処理装置１００は、データセットＤＳ１からランダムに二つ以上の所定数のオブジェクトを抽出オブジェクトとして抽出する。情報処理装置１００は、データセットＤＳ１からオブジェクトＯＢ５００とオブジェクトＯＢ１０００との２つのオブジェクトを抽出オブジェクトとして抽出する。そして、情報処理装置１００は、オブジェクトＯＢ５００とオブジェクトＯＢ１０００との平均である「７，３５，１３，９３．．．」の多次元のベクトル情報を生成する。このように、図１の例では、情報処理装置１００は、評価用クエリＲＱ１に示すように、オブジェクトＯＢ５００とオブジェクトＯＢ１０００とに基づいて、クエリＱＥ１を生成する。これにより、情報処理装置１００は、「７，３５，１３，９３．．．」の多次元のベクトル情報であるクエリＱＥ１を評価用クエリに決定する。

なお、上記は一例であり、情報処理装置１００は、種々の情報を適宜用いて、評価用クエリを決定してもよい。情報処理装置１００は、二つより多い、例えば三つのオブジェクトの平均値のオブジェクトを、クエリオブジェクト（評価用クエリ）に決定してもよい。平均値を求める複数のオブジェクトは、ランダムに選択した一つのオブジェクトと、そのオブジェクトに対して距離が近いオブジェクトを一つ以上選択したオブジェクトとしてもよい。また、例えば、情報処理装置１００は、後述するグラフ生成にデータセットのうち一部のオブジェクトが用いられる場合、データセットのうちグラフに含まれないオブジェクトを評価用クエリとして用いてもよい。

そして、情報処理装置１００は、グラフを生成する（ステップＳ２）。情報処理装置１００は、与えられたデータセットのすべて、または、一部のデータに対してインデックス（グラフやツリー）を作成する。なお、図１の例では、説明を簡単にするため、情報処理装置１００がインデックスとしてグラフを生成する場合を示すが、ツリーも生成してもよい。なお、ツリーについての詳細は後述する。

例えば、情報処理装置１００は、データセットＤＳ１中の全オブジェクトを用いて、グラフを生成してもよいし、データセットＤＳ１のうち一部のオブジェクトを用いて、グラフを生成してもよい。例えば、情報処理装置１００は、データセットＤＳ１のうち、オブジェクトＯＢ３等を除く、オブジェクトＯＢ１、ＯＢ２、ＯＢ１０１等の一部のオブジェクトを用いて、グラフを生成してもよい。この場合、情報処理装置１００は、オブジェクトＯＢ３を評価用クエリとして用いてもよい。

図１の例では、情報処理装置１００は、データセットＤＳ１中の全オブジェクトを用いて、グラフＧＲ１１を生成する。情報処理装置１００は、グラフ生成に関する種々の技術を適宜用いて、グラフＧＲ１１を生成する。ここで、グラフＧＲ１１について説明する。

図１に示すグラフＧＲ１１は、データセットＤＳ１に含まれる各オブジェクトに対応するノードが有向エッジで連結されたグラフ情報を示す。なお、図１中のグラフＧＲ１１に示すようなグラフ情報は、情報処理装置１００が生成する場合に限らず、情報処理装置１００は、図１中のグラフＧＲ１１に示すようなグラフ情報を情報提供装置５０（図５参照）等の他の外部装置から取得してもよい。

また、ここでいう、有向エッジとは、一方向にしかデータを辿れないエッジを意味する。以下では、エッジにより辿る元、すなわち始点となるノードを参照元とし、エッジにより辿る先、すなわち終点となるノードを参照先とする。例えば、所定のノード「Ａ」から所定のノード「Ｂ」に連結される有向エッジとは、参照元をノード「Ａ」とし、参照先をノード「Ｂ」とするエッジであることを示す。なお、各ノードを連結するエッジは、有向エッジに限らず、種々のエッジであってもよい。例えば、各ノードを連結するエッジは、ノードを連結する方向のないエッジであってもよい。例えば、各ノードを連結するエッジは、相互に参照可能なエッジであってもよい。例えば、各ノードを連結するエッジは、全て無向エッジ（双方向エッジ）であってもよい。

例えば、このようにノード「Ａ」を参照元とするエッジをノード「Ａ」の出力エッジという。また、例えば、このようにノード「Ｂ」を参照先とするエッジをノード「Ｂ」の入力エッジという。すなわち、ここでいう出力エッジ及び入力エッジとは、一の有向エッジをその有向エッジが連結する２個のノードのうち、いずれのノードを中心として捉えるかの相違であり、一の有向エッジが出力エッジ及び入力エッジになる。すなわち、出力エッジ及び入力エッジは、相対的な概念であって、一の有向エッジについて、参照元となるノードを中心として捉えた場合に出力エッジとなり、参照先となるノードを中心として捉えた場合に入力エッジとなる。なお、本実施形態においては、エッジについては、出力エッジや入力エッジ等の有向エッジを対象とするため、以下では、有向エッジを単に「エッジ」と記載する場合がある。また、ここでいう、各ノードは、各オブジェクトに対応する。例えば、画像から抽出された複数の局所特徴量のそれぞれがオブジェクトであってもよい。また、例えば、オブジェクト間の距離が定義された種々のデータがオブジェクトであってもよい。

また、図１中のグラフＧＲ１１には、データセットＤＳ１中の多数のオブジェクト（ノード）が含まれるが、図面においてはその一部のみを図示する。例えば、情報処理装置１００は、図１中のグラフＧＲ１１に示すように、ノードＮ１～Ｎ３、Ｎ４３、Ｎ５３等の複数のノード（ベクトル）を含むグラフ情報を生成する。図１の例では、説明を簡単にするために、５個のノードを図示して処理の概要を説明するが、グラフＧＲ１１にはデータセットＤＳ１中のオブジェクト数に対応する数のノードが含まれる。

図１の例では、例えば、情報処理装置１００は、各オブジェクトに対応する各ノードから所定数以上の出力エッジが他のエッジに連結されるように、グラフＧＲ１１を生成する。情報処理装置１００は、グラフＧＲ１１における各ノードが、そのノードとの間の距離が近い方から所定数のノードへのエッジ（出力エッジ）が連結されるようにグラフＧＲ１を生成する。例えば、所定数は、目的や用途等に応じて、２や５や１０や１００等の種々の値であってもよい。例えば、所定数が２である場合、ノードＮ１からは、ノードＮ１からの距離が最も近いノード及び２番目に距離が近い２個のノードに出力エッジが連結される。なお、類似度を示す指標としての距離は、ベクトル（Ｎ次元ベクトル）間の距離として適用可能であれば、どのような距離であってもよく、例えば、ユークリッド距離やマハラノビス距離等の種々の距離が用いられてもよい。例えば、距離は、２つのオブジェクト間の類似度を反映するものであれば、どのような情報であってもよく、例えばコサイン類似度等の角度に関する情報であってもよい。

また、このように「ノードＮ＊（＊は任意の数値）」と記載した場合、そのノードはノードＩＤ「Ｎ＊」により識別されるノードであることを示す。例えば、「ノードＮ１」と記載した場合、そのノードはノードＩＤ「Ｎ１」により識別されるノードである。

また、図１中のグラフＧＲ１１では、ノードＮ１は、ノードＮ５３へ向かう有向エッジであるエッジＥ２が連結される。すなわち、ノードＮ１は、ノードＮ５３とエッジＥ２により連結される。このように「エッジＥ＊（＊は任意の数値）」と記載した場合、そのエッジはエッジＩＤ「Ｅ＊」により識別されるエッジであることを示す。例えば、「エッジＥ３１」と記載した場合、そのエッジはエッジＩＤ「Ｅ３１」により識別されるエッジである。例えば、ノードＮ１を参照元とし、ノードＮ５３を参照先として連結されるエッジＥ２により、ノードＮ１からノードＮ５３に辿ることが可能となる。この場合、有向エッジであるエッジＥ２は、ノードＮ１を中心として識別される場合、出力エッジとなり、ノードＮ５３を中心として識別される場合、入力エッジとなる。

言い換えると、有向エッジであるエッジＥ２は、ノードＮ１側からの視点でとらえた場合、自身から他のエッジへ矢印が向いているエッジ、すなわち外向きエッジとなり、ノードＮ５３側からの視点でとらえた場合、自身の方に矢印が向いているエッジ、すなわち内向きエッジとなる。つまり、ここでいう出力エッジは、外向きエッジと読み替えることができ、入力エッジは、内向きエッジと読み替えることができる。また、図１では図示を省略するが、ノードＮ５３は、ノードＮ１へ向かう有向エッジ（エッジＥ５３１とする）が連結されてもよい。このように、ノードＮ５３からの出力エッジであるエッジＥ５３１がノードＮ１に連結されてもよい。この場合、ノードＮ１とノードＮ５３との間には、ノードＮ１からノードＮ５３へ向かう有向エッジであるエッジＥ２と、ノードＮ５３からノードＮ１へ向かう有向エッジであるエッジＥ５３１との２個のエッジが連結される。

また、図１中のグラフＧＲ１１は、ユークリッド空間であってもよい。また、図１に示すグラフＧＲ１１は、各ベクトル間の距離等の説明のための概念的な図であり、グラフＧＲ１１は、多次元空間である。例えば、図１に示すグラフＧＲ１１は、平面上に図示するため２次元の態様にて図示されるが、例えば１００次元や１０００次元等の多次元空間であるものとする。なお、各ノードに対応するベクトルデータは、Ｎ次元の実数値ベクトルであってもよい。

また、図１の例では、グラフＧＲ１１においては、適宜「ノードＮ＊（＊は任意の数値）」の図示を省略し、各ノードに対応する「○」内に「ノードＮ＊」の「＊」の値を付すことにより表現する。すなわち、「ノードＮ＊」の部分の「＊」が一致するノードに対応する。例えば、グラフＧＲ１１中の左上の「○」であって、内部に「４３」が付された「○」は、ノードＩＤ「Ｎ４３」により識別されるノード（ノードＮ４３）に対応する。

ここで、各ノード間の距離は、ノード（画像情報）の類似性を示し、距離が近いほど類似している。本実施形態においては、グラフＧＲ１１における各ノードの距離を対応する各オブジェクト間の類似度とする。例えば、各ノードに対応する画像情報の類似性が、グラフＧＲ１１内におけるノード間の距離として写像されているものとする。例えば、各ノードに対応する概念間の類似度が各ノード間の距離に写像されているものとする。ここで、図１の例では、グラフＧＲ１１における各ノード間の距離が短いオブジェクト同士の類似度が高く、グラフＧＲ１１における各ノード間の距離が長いオブジェクト同士の類似度が低い。

例えば、図１中のグラフＧＲ１１において、ノードＮ４３とノードＮ２とは近接している、すなわち距離が短い（近い）。そのため、ノードＮ４３に対応するオブジェクトと、ノードＮ２に対応するオブジェクトとは類似度が高いことを示す。また、図１中のグラフＧＲ１１において、ノードＮ４３とノードＮ５３とは遠隔にある、すなわち距離が長い（遠い）。そのため、ノードＮ４３に対応するオブジェクトと、ノードＮ５３に対応するオブジェクトとは類似度が低いことを示す。なお、上記は一例であり、情報処理装置１００は、種々の条件を用いて、グラフを生成してもよい。例えば、情報処理装置１００は、各オブジェクトに対応する各ノードから所定の数以上の入力エッジが他のエッジから連結されるように、グラフＧＲ１１を生成してもよい。

そして、情報処理装置１００は、近似正解検索結果を取得する（ステップＳ３）。情報処理装置１００は、クエリＱＥ１を対象とする近似正解検索結果を取得する。情報処理装置１００は、クエリＱＥ１を用いて、ｋ個（ｋは任意の数）のノードを近傍ノードとして抽出した結果を示す近似正解検索結果を取得する。情報処理装置１００は、近似正解検索結果情報記憶部１２４（図１０参照）からクエリＱＥ１に対応する近似正解検索結果を取得する。

ここで、精確な正解検索結果を生成するには、すべてのオブジェクトとの距離を計算する必要があり、大規模なデータセットの場合には現実的な時間でできない。そのため、情報処理装置１００が近似正解検索結果を生成する場合、評価用クエリに対して正解検索結果を得る代わりに、何らかの評価対象のインデックスを用いて近似検索結果を事前に取得する。例えば、情報処理装置１００は、近傍検索に関する種々の技術を適宜用いて、クエリＱＥ１に対応する近似正解検索結果を生成する。

例えば、情報処理装置１００は、図１５に示すような処理により、クエリＱＥ１に対応する近似正解検索結果を生成する。この場合、情報処理装置１００は、後述する検索範囲係数「ε」の値を所定値以上大きくして、図１５に示すような処理をグラフＧＲ１１を用いて行うことにより、クエリＱＥ１に対応する近似正解検索結果を生成する。これにより、情報処理装置１００は、すべてのオブジェクトとの距離を計算して正解情報を生成する場合に比べて、処理時間を短くすることができる。なお、上記は一例であり、すべてのオブジェクトとの距離を計算して正解情報を生成するよりも短い処理時間で、近似正解検索結果を生成することができれば、情報処理装置１００は、どのような処理により、近似正解検索結果を生成してもよい。

ここで、検索範囲係数「ε」の概念について簡単に説明する。図１中のグラフＧＲ１１－１は、グラフＧＲ１１であり、「○」内に「Ｑ」を記載したクエリＱＥ１に対応する範囲ＡＲ１及び範囲ＡＲ２を図示するために、ノードのみを図示し、エッジの図示を省略したものである。情報処理装置１００は、クエリＱＥ１を中心とする半径ｒ内の範囲ＡＲ１と、クエリＱＥ１を中心とする半径ｒ（１＋ε）内の範囲ＡＲ２とを用いて、グラフＧＲ１１を検索し、近傍ノードを抽出する。このように、情報処理装置１００は、検索範囲係数「ε」を適用した処理により、近傍ノードを抽出する処理を行うが、検索範囲係数「ε」を用いた処理の詳細は図１５において説明する。

図１の例では、情報処理装置１００は、クエリＱＥ１に対応する近似正解検索結果ＲＲ１を生成する。近似正解検索結果ＲＲ１に示すように、クエリＱＥ１に対応する近似正解情報は、Ｎｏが「１」である、すなわち最も近傍のノードがオブジェクトＯＢ１０１に対応するノードであることを示す。また、クエリＱＥ１に対応する近似正解情報は、Ｎｏが「ｋ」である、すなわち最も遠いノード（最遠オブジェクト）がオブジェクトＯＢ５５に対応するノードであることを示す。情報処理装置１００は、近似正解検索結果ＲＲ１を用いて、後述する精度算出等の処理を行う。

そして、情報処理装置１００は、ターゲット精度範囲を決定する（ステップＳ４）。情報処理装置１００は、下記の式（１）のような閾値を算出（導出）する関数に含まれる各パラメータ（変数）に対するターゲット精度範囲を決定する。

ここで、上記式（１）は図１中の関数ＦＣ１に対応する。上記式（１）の左辺中の「ｅ_ｐ」は、グラフの検索時に参照する参照エッジ数を示す閾値ＴＨ１に対応する。

また、上記式（１）の右辺中の「ｅ_０」は、定数項（第１パラメータ）を示す。また、上記式（１）の右辺中の「ε」は、検索範囲係数「ε」を示す。また、上記式（１）の右辺中の「ｗ_ｅ」は、検索範囲係数「ε」に掛け合わされる変数（第２パラメータ）を示す。例えば、「ε」が「０．１」であり、「ｗ_ｅ」が「１０」であり、「ｅ_０」が「５」である場合、上記の式（１）は、「ｅ_ｐ＝１０^{１０×０．１}＋５」となる。すなわち、「ｅ_ｐ」が「１５（＝１０^１＋５）」となり、閾値ＴＨ１が「１５」に決定される。この場合、情報処理装置１００は、検索処理において、各ノードを対象とする処理において、選択する参照先のノードの数を１５個までとする。例えば、情報処理装置１００は、あるノードを対象とした処理で、図１５に示すステップＳ３１５において閾値「１５」に達した場合、そのノードの繰り返し処理を終了する。

図１の例では、情報処理装置１００は、上記式（１）中の第１パラメータ「ｅ_０」と、第２パラメータ「ｗ_ｅ」との各々のターゲット精度範囲を決定する。情報処理装置１００は、種々の情報を適宜用いて、第１パラメータ「ｅ_０」と、第２パラメータ「ｗ_ｅ」との各々のターゲット精度範囲を決定する。図１の例では、情報処理装置１００は、ターゲット情報ＴＲ１に示すように、第１パラメータ「ｅ_０」と第２パラメータ「ｗ_ｅ」との各々について、ターゲット精度範囲の下限、上限及びマージンを決定する。

情報処理装置１００は、第１パラメータ「ｅ_０」のターゲット精度範囲（「第１ターゲット精度範囲」ともいう）の下限を「Ｒ１ａ」に、上限を「Ｒ１ｂ」に決定し、マージンを「ＭＧ１」に決定する。情報処理装置１００は、第２パラメータ「ｗ_ｅ」のターゲット精度範囲（「第２ターゲット精度範囲」ともいう）の下限を「Ｒ２ａ」に、上限を「Ｒ２ｂ」に決定し、マージンを「ＭＧ２」に決定する。このように、第１パラメータ「ｅ_０」の第１ターゲット精度範囲と、第２パラメータ「ｗ_ｅ」の第２ターゲット精度範囲とを各々個別に決定する。

例えば、情報処理装置１００は、情報処理装置１００の管理者等による指定値や、予め記憶部１２０（図６参照）に記憶された基準値等を用いて、第１パラメータ「ｅ_０」と、第２パラメータ「ｗ_ｅ」との各々のターゲット精度範囲を決定する。ここで、第１パラメータ「ｅ_０」は検索範囲係数「ε」が小さい（精度が低い）ときに効いてくるパラメータで、第２パラメータ「ｗ_ｅ」は検索範囲係数「ε」が大きいとき（精度が高い）ときに効いてくるパラメータである。そのため、第１パラメータ「ｅ_０」と、第２パラメータ「ｗ_ｅ」とは、独立して調整する。なお、以下では、第１パラメータ「ｅ_０」の第１値を調整する処理を「第１調整処理」と記載し、第２パラメータ「ｗ_ｅ」の第２値を調整する処理を「第２調整処理」と記載する場合がある。

上記のように、情報処理装置１００は、低い精度と高い精度についてそれぞれターゲット精度範囲を事前に決定する。例えば、情報処理装置１００は、第２パラメータ「ｗ_ｅ」の第２ターゲット精度範囲を第１パラメータ「ｅ_０」の第１ターゲット精度範囲よりも高く決定する。例えば、情報処理装置１００は、第２パラメータ「ｗ_ｅ」の第２ターゲット精度範囲の下限「Ｒ２ａ」を第１パラメータ「ｅ_０」の第１ターゲット精度範囲の下限「Ｒ１ａ」よりも高くする。例えば、情報処理装置１００は、第２パラメータ「ｗ_ｅ」の第２ターゲット精度範囲の上限「Ｒ２ｂ」を、第１パラメータ「ｅ_０」の第１ターゲット精度範囲の上限「Ｒ１ｂ」よりも高くする。このように、情報処理装置１００は、第２ターゲット精度範囲を第１ターゲット精度範囲よりも高いターゲット精度範囲に決定する。なお、情報処理装置１００は、１つのターゲット精度範囲を各パラメータに共通して用いてもよい。

そして、情報処理装置１００は、各パラメータの調整処理を実行する。ここで、図１の例では、情報処理装置１００は、評価指標情報ＥＩ１に示すように、評価指標として検索時間を用いる。なお、図１は一例であり、評価指標は、検索時間に限らず、距離計算回数やノードのアクセス数等、種々の指標が用いられてもよい。情報処理装置１００は、各パラメータの調整のために、特定の精度区間（ターゲット精度区間）における評価指標（例えば検索時間、オブジェクトアクセス数、距離計算回数等）を測定する。

また、図１の例では、情報処理装置１００は、精度情報ＰＲ１に示すように、精度として再現率を用いる。なお、図１は一例であり、精度は、再現率に限らず、検索処理の精度が測定できれば種々の情報であってもよい。

ここでいう再現率は、「（正解検索結果の中で実際に検索された結果）／（正解検索結果）」で得られる。すなわち、再現率は、精度測定対象となる検索処理における「正解検索結果の中で実際に検索された結果」を、「正解検索結果」で除算することにより算出される。情報処理装置１００は、後述する各試行において、評価用クエリを用いて検索処理を行い、その検索処理の時間を計測するとともに、抽出した検索結果を用いて、再現率を算出する。図１の例では、「正解検索結果」として、「近似正解検索結果」を用いるため、「近似正解検索結果」よりもよい結果（正解）が各個別の調整処理により抽出される可能性があるが、この点についての詳細は後述する。

まず、情報処理装置１００は、第１パラメータ「ｅ_０」を対象とした第１調整処理を実行する（ステップＳ５）。情報処理装置１００は、下限「Ｒ１ａ」、上限「Ｒ１ｂ」、マージン「ＭＧ１」である第１ターゲット精度範囲を用いて、第１調整処理を実行する。なお、初回の第１調整処理においては、情報処理装置１００は、第２パラメータ「ｗ_ｅ」の値（第２値）は、所定の初期値を用いる。また、２回目以降の第１調整処理においては、情報処理装置１００は、その前の第２調整処理で決定された第２パラメータ「ｗ_ｅ」の値（第２値）を用いる。このように、情報処理装置１００は、第１パラメータ「ｅ_０」を対象とした第１調整処理においては、第２パラメータを所定の固定値に固定し、第１パラメータの値を変動させることにより、第１パラメータの最適な第１値を探索する。このように、情報処理装置１００は、低いターゲット精度範囲における評価指標の算出を行い第１パラメータ「ｅ_０」の最適値を探索する。

図１の例では、情報処理装置１００は、第１パラメータ「ｅ_０」を任意の値（「測定対象値」ともいう）に設定し、評価指標を測定する。例えば、情報処理装置１００は、第１パラメータ「ｅ_０」を「２０」に設定し、評価指標を測定する処理（「測定処理」ともいう）を行う。情報処理装置１００は、図２に示すような処理により、第１パラメータ「ｅ_０」を任意の値に設定し、評価指標を測定する。図２は、実施形態に係る測定処理の一例を示す図である。

情報処理装置１００は、第１パラメータの値を測定対象値（例えば「２０」）に固定した状態で、検索範囲係数「ε」を変動させることにより、検索精度範囲をカバーする検索範囲係数「ε」の下限、上限を探索する。情報処理装置１００は、図２中の探索結果ＲＳ１に示すように、第１ターゲット精度範囲の上限「Ｒ１ｂ」と、上限「Ｒ１ｂ」にマージン「ＭＧ１」を加算した値（上限マージン「Ｒ１ｂ＋ＭＧ１」と記載する場合がある）との範囲内に位置する検索範囲係数「ε」を検索範囲係数「ε」の上限として探索する。また、情報処理装置１００は、第１ターゲット精度範囲の下限「Ｒ１ａ」と、下限「Ｒ１ａ」からマージン「ＭＧ１」を減算した値（下限マージン「Ｒ１ａ－ＭＧ１」と記載する場合がある）との範囲内に位置する検索範囲係数「ε」を検索範囲係数「ε」の下限として探索する。探索結果ＲＳ１は、横軸（Ｘ軸）を再現率とし、縦軸（Ｙ軸）を検索時間とする再現率と検索時間との関係を示す図を示す。

探索結果ＲＳ１中の試行結果Ｔ１～Ｔ６は、１回目～６回目の各々の試行結果を示す。例えば、試行結果Ｔ１は、１回目の試行結果を示す。例えば、情報処理装置１００は、各試行において、図１５に示すような処理により、クエリＱＥ１を用いてｋ個の近傍ノードを抽出する検索処理を実行する。この場合、情報処理装置１００は、各試行で設定した検索範囲係数「ε」や、関数ＦＣ１により算出された閾値ＴＨ１を用いてグラフＧＲ１１を探索することにより、クエリＱＥ１に対応するｋ個の近傍ノードを抽出する。

なお、情報処理装置１００は、各試行において、評価用クエリを用いて検索処理を行い、その検索処理の時間を計測するとともに、抽出した検索結果を用いて、再現率を算出する。図２の例では、情報処理装置１００は、クエリＱＥ１を用いてグラフＧＲ１１からｋ個の近傍ノードを抽出する検索処理を行い、その検索処理の時間を計測するとともに、抽出した検索結果と近似正解検索結果ＲＲ１とを用いて再現率を算出する。情報処理装置１００は、抽出した検索結果のうち近似正解検索結果ＲＲ１に含まれるオブジェクトの数を、近似正解検索結果ＲＲ１のオブジェクトの数で除することにより、再現率を算出する。このように、図１及び図２の例では、ｋが分母となり、０以上ｋ以下の値が分子となる。０～１の範囲、すなわち０以上１以下の値が再現率として算出される。

図２の例では、情報処理装置１００は、最初（１回目）の試行では、精度「再現率」が上限「Ｒ１ｂ」を超えるような大きな値を検索範囲係数「ε」に設定して、検索処理を実行する。このように、例えば、情報処理装置１００は、最初（１回目）の試行では、上限「Ｒ１ｂ」を超える精度を示す試行結果Ｔ１を得る。

また、情報処理装置１００は、２回目の試行では、精度「再現率」が下限「Ｒ１ａ」を下回るような小さな値を検索範囲係数「ε」に設定して、検索処理を実行する。このように、例えば、情報処理装置１００は、２回目の試行では、下限「Ｒ１ａ」を下回る精度を示す試行結果Ｔ２を得る。

そして、情報処理装置１００は、３回目以降の試行を繰り返すことにより、上限「Ｒ１ｂ」と上限マージン「Ｒ１ｂ＋ＭＧ１」との範囲内に位置する検索範囲係数「ε」を検索範囲係数「ε」の上限として探索する。例えば、情報処理装置１００は、３回目の試行では、試行結果Ｔ１における検索範囲係数「ε」の設定値と、試行結果Ｔ２における検索範囲係数「ε」の設定値との間の値を、検索範囲係数「ε」に設定する。例えば、情報処理装置１００は、３回目の試行では、試行結果Ｔ１における検索範囲係数「ε」の設定値と、試行結果Ｔ２における検索範囲係数「ε」の設定値との平均値を、検索範囲係数「ε」に設定する。そして、情報処理装置１００は、設定した検索範囲係数「ε」を用いて処理を実行し、試行結果Ｔ３を得る。

試行結果Ｔ３では、上限「Ｒ１ｂ」を下回る精度を得たため、情報処理装置１００は、４回目の試行では、試行結果Ｔ１における検索範囲係数「ε」の設定値と、試行結果Ｔ３における検索範囲係数「ε」の設定値との間の値を、検索範囲係数「ε」に設定する。例えば、情報処理装置１００は、４回目の試行では、試行結果Ｔ１における検索範囲係数「ε」の設定値と、試行結果Ｔ３における検索範囲係数「ε」の設定値との平均値を、検索範囲係数「ε」に設定する。そして、情報処理装置１００は、設定した検索範囲係数「ε」を用いて処理を実行し、試行結果Ｔ４を得る。

試行結果Ｔ４では、上限マージン「Ｒ１ｂ＋ＭＧ１」を超える精度を得たため、情報処理装置１００は、５回目の試行では、試行結果Ｔ３における検索範囲係数「ε」の設定値と、試行結果Ｔ４における検索範囲係数「ε」の設定値との間の値を、検索範囲係数「ε」に設定する。例えば、情報処理装置１００は、５回目の試行では、試行結果Ｔ３における検索範囲係数「ε」の設定値と、試行結果Ｔ４における検索範囲係数「ε」の設定値との平均値を、検索範囲係数「ε」に設定する。そして、情報処理装置１００は、設定した検索範囲係数「ε」を用いて処理を実行し、試行結果Ｔ５を得る。

このように、情報処理装置１００は、各試行結果の精度と、上限「Ｒ１ｂ」や上限マージン「Ｒ１ｂ＋ＭＧ１」の位置関係に応じて、検索範囲係数「ε」の設定値を変更し、試行結果の精度が、上限「Ｒ１ｂ」と上限マージン「Ｒ１ｂ＋ＭＧ１」との範囲内に位置するまで、処理を繰り返す。図２の例では、情報処理装置１００は、試行結果Ｔ６に示すように、６回目の試行により、検索範囲係数「ε」の設定値「０．１２」とした処理で、上限「Ｒ１ｂ」と上限マージン「Ｒ１ｂ＋ＭＧ１」との範囲内に位置する精度を得る。これにより、情報処理装置１００は、検索範囲係数「ε」の係数上限「０．１２」を得る。

そして、情報処理装置１００は、上記の試行結果Ｔ１～Ｔ６を利用して、下限「Ｒ１ａ」と下限マージン「Ｒ１ａ－ＭＧ１」との範囲内に位置する検索範囲係数「ε」を検索範囲係数「ε」の下限として探索する。図２の例では、下限「Ｒ１ａ」が試行結果Ｔ２と、試行結果Ｔ３との間に位置するため、情報処理装置１００は、７回目以降の試行では、まず、試行結果Ｔ２における検索範囲係数「ε」の設定値と、試行結果Ｔ３における検索範囲係数「ε」の設定値との間の値を、検索範囲係数「ε」に設定する。このように、情報処理装置１００は、下限「Ｒ１ａ」と下限マージン「Ｒ１ａ－ＭＧ１」との範囲内に位置するまで、処理を繰り返す。図２の例では、情報処理装置１００は、探索結果ＲＳ２中の試行結果Ｔ１１に示すように、検索範囲係数「ε」の設定値「０．０８」とした処理で、下限「Ｒ１ａ」と下限マージン「Ｒ１ａ－ＭＧ１」との範囲内に位置する精度を得る。これにより、情報処理装置１００は、検索範囲係数「ε」の係数下限「０．０８」を得る。ここでのεを探索する手順は二分探索を応用したものだが、εを探索する手順は上記に限らず、他の方法を用いても良い。

そして、情報処理装置１００は、検索範囲係数「ε」を下限から上限まで当分に分割して、それぞれの検索範囲係数「ε」での検索を行って評価指標を求める。図２の例では、情報処理装置１００は、係数下限「０．０８」から係数上限「０．１２」まで当分に６分割して、それぞれの検索範囲係数「ε」での検索を行って評価指標を求める。これにより、情報処理装置１００は、探索結果ＲＳ３中の算出用試行結果ＥＤ１～ＥＤ５に対応する処理により、各々に対応する評価指標を求める。

そして、情報処理装置１００は、台形近似により範囲における平均の評価指標を算出する。情報処理装置１００は、台形近似により範囲における平均の検索時間を評価指標として算出する。図２の例では、情報処理装置１００は、台形近似により探索結果ＲＳ４中のハッチング部分である範囲ＡＲ１１の平均の評価指標を算出する。例えば、生成装置１００は、台形公式等の種々の従来技術を適宜用いて、検索時間の平均を算出してもよい。情報処理装置１００は、探索結果ＲＳ４に示すように、横軸（Ｘ軸）、横軸（Ｘ軸）方向の両端（上限「Ｒ１ｂ」、下限「Ｒ１ａ」）の検索時間に対応する線、各検索時間を線で結んだ範囲ＡＲ１１を対象にその間の検索時間の平均を算出する。例えば、情報処理装置１００は、探索結果ＲＳ４に示すように隣り合う試行結果（検索時間の値）間を線で結んだ範囲ＡＲ１１を対象にその間の検索時間の平均を算出する。例えば、情報処理装置１００は、台形公式により範囲ＡＲ１１の面積を算出し、その面積を横軸方向（再現率）の範囲の値で除算することにより、範囲ＡＲ１１に対応する検索時間の平均を算出してもよい。情報処理装置１００は、係数下限「０．０８」と算出用試行結果ＥＤ１との間のうち、第１ターゲット精度範囲の下限「Ｒ１ａ」と算出用試行結果ＥＤ１との間のみを用いて、平均の評価指標を算出する。また、情報処理装置１００は、算出用試行結果ＥＤ５と係数上限「０．１２」との間のうち、算出用試行結果ＥＤ５と第１ターゲット精度範囲の上限「Ｒ１ｂ」との間のみを用いて、平均の評価指標を算出する。例えば、情報処理装置１００は、下限「Ｒ１ａ」と上限「Ｒ１ｂ」との間の範囲ＡＲ１１の面積を算出し、その面積を横軸方向（再現率）の上限「Ｒ１ｂ」と下限「Ｒ１ａ」との間の範囲の値で除算することにより、範囲ＡＲ１１に対応する検索時間の平均を算出してもよい。例えば、情報処理装置１００は、下限「Ｒ１ａ」と上限「Ｒ１ｂ」との間の範囲ＡＲ１１の面積を算出し、その面積を上限「Ｒ１ｂ」の再現率と下限「Ｒ１ａ」の再現率との差で除算することにより、範囲ＡＲ１１に対応する検索時間の平均を算出してもよい。これにより、情報処理装置１００は、第１ターゲット精度範囲内に対応する平均の評価指標を算出することができる。そして、情報処理装置１００は、平均の評価指標を、その測定処理で設定した第１パラメータ「ｅ_０」の設定値における評価指標に決定する。このように、情報処理装置１００は、探索結果ＲＳ４中の範囲ＡＲ１１に対応する範囲の平均の評価指標を算出することで、第１パラメータ「ｅ_０」を一の値に設定した測定処理を終了する。

そして、情報処理装置１００は、上述した第１パラメータ「ｅ_０」を一の値に設定した測定処理を、第１パラメータ「ｅ_０」の最適値が求まるまで繰り返す。例えば、情報処理装置１００は、最初の測定処理で「２０」に設定した第１パラメータ「ｅ_０」の値を変動させることにより、第１パラメータ「ｅ_０」の設定値と、各設定値の評価指標との関係を示す情報（グラフ）を生成し、生成した情報を基に第１パラメータ「ｅ_０」の最適値を決定してもよい。例えば、情報処理装置１００は、測定処理を所定の回数繰り返し、最も評価指標が良い設定値を第１パラメータ「ｅ_０」の第１値（最適値）に決定してもよい。第１パラメータ「ｅ_０」に対して評価指標は通常凸関数なので、例えば、山登り法といった探索方法を用いて、評価指標が最少値（最大値）になるような第１パラメータ「ｅ_０」を求めれば良い。

そして、情報処理装置１００は、決定した第１パラメータ「ｅ_０」の第１値が前回の第１調整処理で決定した第１パラメータ「ｅ_０」の第１値（「前回第１値」ともいう）と同じであるかを判定する（ステップＳ６）。情報処理装置１００は、決定した第１パラメータ「ｅ_０」の第１値が前回第１値と同じであると判定した場合（ステップＳ６：Ｙｅｓ）、調整処理を終了する。

一方で、情報処理装置１００は、決定した第１パラメータ「ｅ_０」の第１値が前回第１値と同じでないと判定した場合（ステップＳ６：Ｎｏ）、第２パラメータ「ｗ_ｅ」を対象とした第２調整処理を実行する（ステップＳ７）。また、情報処理装置１００は、初回の第１調整処理の場合、前回第１値が無いため、決定した第１パラメータ「ｅ_０」の第１値が前回第１値と同じではないと判定し（ステップＳ６：Ｎｏ）、第２調整処理を実行する。

上記のように、情報処理装置１００は、第１調整処理が初回の場合や第１調整処理で第１パラメータの第１値が変更された場合、第２パラメータ「ｗ_ｅ」を対象とした第２調整処理を実行する。情報処理装置１００は、下限「Ｒ２ａ」、上限「Ｒ２ｂ」、マージン「ＭＧ２」である第２ターゲット精度範囲を用いて、第２調整処理を実行する。第２調整処理においては、情報処理装置１００は、その前の第１調整処理で決定された第１パラメータ「ｅ_０」の値（第１値）を用いる。このように、情報処理装置１００は、第２パラメータ「ｗ_ｅ」を対象とした第２調整処理においては、第１パラメータを所定の固定値に固定し、第２パラメータの値を変動させることにより、第２パラメータの最適な第２値を探索する。このように、情報処理装置１００は、高いターゲット精度範囲における評価指標の算出を行い第２パラメータ「ｗ_ｅ」の最適値を探索する。

図１の例では、情報処理装置１００は、第２パラメータ「ｗ_ｅ」を任意の値（測定対象値）に設定し、評価指標を測定する。例えば、情報処理装置１００は、第２パラメータ「ｗ_ｅ」を「３０」に設定し、評価指標を測定する処理（測定処理）を行う。情報処理装置１００は、上述した第１パラメータに対する測定処理と同様に、図２に示すような処理により、第２パラメータ「ｗ_ｅ」を任意の値に設定し、評価指標を測定する。

情報処理装置１００は、第２パラメータの値を測定対象値（例えば「３０」）に固定した状態で、検索範囲係数「ε」を変動させることにより、検索精度範囲をカバーする検索範囲係数「ε」の下限、上限を探索する。情報処理装置１００は、第２ターゲット精度範囲の上限「Ｒ２ｂ」と、上限「Ｒ２ｂ」にマージン「ＭＧ２」を加算した値（上限マージン「Ｒ２ｂ＋ＭＧ２」と記載する場合がある）との範囲内に位置する検索範囲係数「ε」を検索範囲係数「ε」の上限として探索する。また、情報処理装置１００は、第２ターゲット精度範囲の下限「Ｒ２ａ」と、下限「Ｒ２ａ」からマージン「ＭＧ２」を減算した値（下限マージン「Ｒ２ａ－ＭＧ２」と記載する場合がある）との範囲内に位置する検索範囲係数「ε」を検索範囲係数「ε」の下限として探索する。

情報処理装置１００は、上述した第１パラメータに対する測定処理と同様に、各試行結果の精度と、上限「Ｒ２ｂ」や上限マージン「Ｒ２ｂ＋ＭＧ２」の位置関係に応じて、検索範囲係数「ε」の設定値を変更し、試行結果の精度が、上限「Ｒ２ｂ」と上限マージン「Ｒ２ｂ＋ＭＧ２」との範囲内に位置するまで、処理を繰り返す。また、情報処理装置１００は、検索範囲係数「ε」の設定値を変更し、試行結果の精度が、下限「Ｒ２ａ」と下限マージン「Ｒ２ａ－ＭＧ２」との範囲内に位置するまで、処理を繰り返す。

そして、情報処理装置１００は、検索範囲係数「ε」を下限から上限まで当分に分割して、それぞれの検索範囲係数「ε」での検索を行って評価指標を求める。そして、情報処理装置１００は、台形近似により範囲における平均の評価指標を算出する。情報処理装置１００は、台形近似により範囲における平均の検索時間を評価指標として算出する。情報処理装置１００は、上述した第１パラメータに対する測定処理と同様に、第２ターゲット精度範囲内に対応する平均の評価指標を算出することができる。そして、情報処理装置１００は、平均の評価指標を、その測定処理で設定した第２パラメータ「ｗ_ｅ」の設定値における評価指標に決定する。

そして、情報処理装置１００は、上述した第２パラメータ「ｗ_ｅ」を一の値に設定した測定処理を、第２パラメータ「ｗ_ｅ」の最適値が求まるまで繰り返す。例えば、情報処理装置１００は、最初の測定処理で「３０」に設定した第２パラメータ「ｗ_ｅ」の値を変動させることにより、第２パラメータ「ｗ_ｅ」の設定値と、各設定値の評価指標との関係を示す情報（グラフ）を生成し、生成した情報を基に第２パラメータ「ｗ_ｅ」の最適値を決定してもよい。例えば、情報処理装置１００は、測定処理を所定の回数繰り返し、最も評価指標が良い設定値を第２パラメータ「ｗ_ｅ」の第２値（最適値）に決定してもよい。

そして、情報処理装置１００は、決定した第２パラメータ「ｗ_ｅ」の第２値が前回の第２調整処理で決定した第２パラメータ「ｗ_ｅ」の第２値（「前回第２値」ともいう）と同じであるかを判定する（ステップＳ８）。情報処理装置１００は、決定した第２パラメータ「ｗ_ｅ」の第２値が前回第２値と同じであると判定した場合（ステップＳ８：Ｙｅｓ）、調整処理を終了する。

一方で、情報処理装置１００は、決定した第２パラメータ「ｗ_ｅ」の第２値が前回第２値と同じでないと判定した場合（ステップＳ８：Ｎｏ）、ステップＳ５に戻って処理を繰り返す。

上述のように、情報処理装置１００は、第１パラメータを調整する第１調整処理と第２パラメータを調整する第２調整処理とを繰り返すことにより、複数のパラメータの値を適切に決定することができる。図１及び図２の例では、情報処理装置１００は、第１パラメータ「ｅ_０」を調整する第１調整処理と、第２パラメータ「ｗ_ｅ」を調整する第２調整処理とを、独立して行う。具体的には、情報処理装置１００は、第２調整処理で調整された第２パラメータを用いて第１パラメータを調整する第１調整処理と、その結果の第１パラメータの第１値を用いて第２パラメータを調整する第２調整処理とを、独立して行う。このように、情報処理装置１００は、第１パラメータ「ｅ_０」と、第２パラメータ「ｗ_ｅ」とを、独立して調整することにより、複数のパラメータの値を適切に決定することができる。

例えば、上述した関数ＦＣ１内のパラメータはデータによって最適な値が異なる。そこで、情報処理装置１００は、与えられたデータセットを対象として、関数ＦＣ１内の複数のパラメータを調整することにより、最適なパラメータを決定することができる。例えば、情報処理装置１００は、データセットＤＳ１とは異なる別のデータセットＤＳＸを対象とする場合、そのデータセットＤＳＸのデータを用いて上述した調整処理を行うことにより、データセットＤＳＸを対象として調整されたパラメータを得ることができる。このように、情報処理装置１００は、対象とするデータセットに応じて、適切なパラメータの値を決定することができる。

〔１－２．近似正解検索結果を用いた場合の処理〕
上述のパラメータの調整においては、特定の精度区間における評価指標（例えば検索時間、オブジェクトアクセス数、距離計算回数）を測定することが必要となる。また、上述したように、精度である再現率は、正解検索結果を基に算出される。しかし、正確な正解検索結果を生成するにはすべてのオブジェクトとの距離を計算する必要があり、大規模なデータセットの場合には現実的な時間でできないという課題がある。

そのため、上述したように、図１の例では、「正解検索結果」として、「近似正解検索結果」を用いる。この場合、「近似正解検索結果」よりもよい結果（正解）が各個別の調整処理により抽出される可能性がある。そこで、情報処理装置１００は、「近似正解検索結果」よりもよい結果（正解オブジェクト）が抽出された場合、以下のような処理を実行する。

例えば、情報処理装置１００は、対象グラフを対象とする検索処理により、「近似正解検索結果」よりもよい正解オブジェクトが抽出された場合、その正解オブジェクトを正解として、精度を算出してもよい。例えば、情報処理装置１００は、対象グラフを対象とする検索処理により、「近似正解検索結果」よりもよい正解オブジェクトが抽出された場合、その正解オブジェクトを「近似正解検索結果」に追加する更新処理を行ってもよい。

以下、図３を用いて具体的に説明する。図３は、実施形態に係る近似正解検索結果を用いた処理の一例を示す図である。なお、図３では、図１及び図２中の調整処理において行われる場合を一例として説明する。図１及び図２と同様の点についての説明は省略する。例えば、図３に示す処理は、図２の例で情報処理装置１００がクエリＱＥ１を用いてグラフＧＲ１１からｋ個の近傍ノードを抽出する検索処理を行い、再現率を算出する際に実行される。

図３に示す近似正解検索結果ＲＲ１は、図１中の近似正解検索結果ＲＲ１に対応する。図３に示す測定用検索結果ＳＲ１は、情報処理装置１００がクエリＱＥ１を用いてグラフＧＲ１１からｋ個の近傍ノードを抽出した検索処理を示す。

まず、情報処理装置１００は、測定用検索結果ＳＲ１のうち、近似正解検索結果ＲＲ１に含まれないオブジェクトを非重複オブジェクトとして抽出する（ステップＳ２１）。図３の例では、情報処理装置１００は、非重複オブジェクト情報ＮＯＬ１に示すように、測定用検索結果ＳＲ１のうちオブジェクトＯＢ７７を、近似正解検索結果ＲＲ１に含まれない非重複オブジェクトとして抽出する。

そして、情報処理装置１００は、最遠オブジェクト情報ＦＯＬ１に示すように、近似正解検索結果ＲＲ１のうち、クエリＱＥ１から最遠のオブジェクトであるオブジェクトＯＢ５５と、オブジェクトＯＢ７７とを比較する（ステップＳ２２）。具体的には、情報処理装置１００は、最遠オブジェクトＯＢ５５及びクエリＱＥ１間の距離Ｄ５５と、非重複オブジェクトＯＢ７７及びクエリＱＥ１間の距離Ｄ７７とを比較する。情報処理装置１００は、距離Ｄ７７が距離Ｄ５５よりも短い場合、非重複オブジェクトを正解とする所定の処理を行う。このように、情報処理装置１００は、距離Ｄ７７が距離Ｄ５５よりも短い場合、「近似正解検索結果」よりもよい非重複オブジェクトが抽出されたとして、その非重複オブジェクトを正解とする所定の処理を実行する。

〔１－２－１．更新処理〕
図３の例では、情報処理装置１００は、距離Ｄ７７が距離Ｄ５５よりも短いため、非重複オブジェクトを正解とする所定の処理を行う。情報処理装置１００は、非重複オブジェクトＯＢ７７を正解として、近似正解検索結果に追加する更新処理を行う。この場合、情報処理装置１００は、最遠オブジェクトＯＢ５５を近似正解検索結果から除外してもよい。これにより、情報処理装置１００は、近似正解検索結果ＲＲ１を、オブジェクトＯＢ７７を正解として含む近似正解検索結果ＲＲ２に更新する（ステップＳ２３）。

そして、情報処理装置１００は、更新処理を行った場合、調整処理や測定処理を再度実行してもよい。例えば、上述のように新たな正解検索結果が見つかった場合には、近似正解検索結果を用いて指定された検索精度範囲をカバーする検索範囲係数「ε」の下限、上限を再度探索する。

このように、近似正解検索結果を用いて再現率を計算するときには、近似正解データに含まれない正解オブジェクトが検索される場合がある。そのため、情報処理装置１００は、検索結果のオブジェクトが近似正解検索結果の最遠の結果よりも近ければ正解として近似正解検索結果に追加する。これにより、情報処理装置１００は、検索処理に関連する評価指標を適切に算出することができる。

〔１－２－２．精度算出〕
なお、情報処理装置１００は、上述した更新処理に限らず、種々の処理を行ってもよい。図３の例では、例えば、情報処理装置１００は、非重複オブジェクトＯＢ７７を正解として、測定用検索結果ＳＲ１に対応する検索の再現率を算出してもよい。

このように、近似正解検索結果を用いて再現率を計算するときには、近似正解データに含まれない正解オブジェクトが検索される場合があるので、検索結果のオブジェクトが近似正解検索結果の最遠の結果よりも近ければ正解として精度を計算する。これにより、情報処理装置１００は、検索処理に関連する評価指標を適切に算出することができる。

〔１－３．ツリー情報〕
上述した例では、グラフ情報のみを用いる場合を示したが、情報処理装置１００は、ツリー情報など、各種のインデックスを用いて、処理を高速化してもよい。例えば、情報処理装置１００は、図４中の情報群ＧＩＮＦ１１に示すようなツリー情報ＩＮＤ１１を用いて、検索の起点となるノード（以下「起点ノード」ともいう）を決定してもよい。図４は、実施形態に係る情報処理に用いるツリーの一例を示す図である。なお、ツリー情報ＩＮＤ１１は、情報処理装置１００が生成してもよいし、情報処理装置１００は、ツリー情報ＩＮＤ１１を情報提供装置５０等の他の外部装置から取得してもよい。

例えば、情報処理装置１００は、ツリー情報ＩＮＤ１１に基づいて、クエリＱＥ１に対応する起点ノードを決定してもよい。情報処理装置１００は、ツリー情報記憶部１２２（図８参照）に記憶されたツリー情報ＩＮＤ１１を用いて、起点ノードを決定する。例えば、ツリー情報ＩＮＤ１１は、グラフＧＲ１１中のいくつかのノードに到達可能なツリー構造を有するツリーである。図４の例では説明を簡単にするために、ツリー情報ＩＮＤ１１は、ノードＮ１～Ｎ５の５個のノードに到達するルートのみを図示するが、多数（例えば５００や１０００等）の他のノードへ到達するルートが含まれてもよい。

例えば、情報処理装置１００は、図４中のツリー情報ＩＮＤ１１に示すような木構造型のツリー情報を用いて、グラフＧＲ１１における起点ノードを決定する。図１の例では、情報処理装置１００は、クエリＱＥ１に基づいて、ツリー情報ＩＮＤ１１を上（ルートＲＴ）から下へ辿ることにより、ツリー情報ＩＮＤ１１の近傍候補となる起点ノードを決定（特定）する。これにより、情報処理装置１００は、効率的に検索クエリ（クエリＱＥ１）に対応する起点ノードを決定することができる。

例えば、情報処理装置１００は、ツリー情報ＩＮＤ１１をルートＲＴからリーフノード（グラフＧＲ１１中のノード）まで辿ることにより、クエリＱＥ１に対応する起点ノードを決定してもよい。例えば、情報処理装置１００は、木構造に関する種々の従来技術を適宜用いて、ツリー情報ＩＮＤ１１をルートＲＴからリーフノードまで辿ることにより、辿りついたリーフノードを起点ノードとして決定してもよい。例えば、情報処理装置１００は、クエリＱＥ１との類似度に基づいて、ツリー情報ＩＮＤ１１を下へ辿ることにより、起点ノードを決定してもよい。例えば、情報処理装置１００は、ルートＲＴから節点ＶＴ１、ＶＴ２等のいずれの節点に辿るかを、クエリＱＥ１と節点ＶＴ１、ＶＴ２との類似度に基づいて決定してもよい。例えば、情報処理装置１００は、ルートＲＴから節点ＶＴ１、ＶＴ２等のうち、クエリＱＥ１との類似度が最も高い節点ＶＴ２へ辿ると決定してもよい。また、例えば、情報処理装置１００は、節点ＶＴ２から節点ＶＴ２－１～ＶＴ２－４等のうち、クエリＱＥ１との類似度が最も高い節点ＶＴ２－２へ辿ると決定してもよい。

図４の例に示すツリー情報（ツリーデータ）は一例であり、情報処理装置１００は、種々のツリー情報を用いて、グラフ情報を検索してもよい。情報処理装置１００は、検索時の起点ノードの決定に用いるツリーを生成してもよい。なお、ツリーを用いることは一例であり、情報処理装置１００は、検索時の起点ノードの決定の高速化が可能であれば、ツリーに限らず種々の情報を用いてもよい。例えば、情報処理装置１００は、高次元ベクトルを高速に検索するための検索ツリー（ツリー情報）を生成する。ここでいう高次元ベクトルとは、例えば、数百次元から数千次元のベクトルであってもよいし、それ以上の次元のベクトルであってもよい。

例えば、情報処理装置１００は、図４に示すようなツリー構造（木構造）に関するツリー情報ＩＮＤ１１を生成してもよい。例えば、情報処理装置１００は、ｋｄ木（k-dimensional tree）に関する検索ツリーを生成してもよい。例えば、情報処理装置１００は、ＶＰ木（Vantage-Point tree）に関する検索ツリーを生成してもよい。

また、例えば、情報処理装置１００は、その他の木構造を有するツリーとして生成してもよい。例えば、情報処理装置１００は、木構造のツリーのリーフがグラフに接続する種々のツリーを生成してもよい。例えば、情報処理装置１００は、木構造のツリーのリーフがグラフ中のノードに対応する種々のツリーを生成してもよい。また、情報処理装置１００は、このようなツリーを用いて検索を行う場合、ツリーを辿って到達したリーフ（ノード）からグラフを探索してもよい。

なお、上述したようなツリーは一例であり、情報処理装置１００は、グラフ中のクエリを高速に特定することが可能であれば、どのようなデータ構造のツリーを生成してもよい。例えば、情報処理装置１００は、クエリに対応するグラフ情報中のノードを高速に特定することが可能であれば、バイナリ空間分割に関する技術等の種々の従来技術を適宜用いて、ツリーを生成してもよい。例えば、情報処理装置１００は、高次元ベクトルの検索に対応可能なツリーであれば、どのようなデータ構造のツリーを生成してもよい。情報処理装置１００は、上述のようなツリーとグラフとを用いることにより、所定の対象に関してより効率的な検索を可能にすることができる。すなわち、情報処理装置１００は、上述のようなツリーとグラフとを用いることにより、所定の対象に関してより高速な検索を可能にすることができる。

〔２．情報処理システムの構成〕
図５に示すように、情報処理システム１には、端末装置１０と、情報提供装置５０と、情報処理装置１００とが含まれる。端末装置１０と、情報提供装置５０と、情報処理装置１００とは所定のネットワークＮを介して、有線または無線により通信可能に接続される。図５は、実施形態に係る情報処理システムの構成例を示す図である。なお、図５に示した情報処理システム１には、複数台の端末装置１０や、複数台の情報提供装置５０や、複数台の情報処理装置１００が含まれてもよい。

端末装置１０は、ユーザによって利用される情報処理装置である。端末装置１０は、ユーザによる種々の操作を受け付ける。なお、以下では、端末装置１０をユーザと表記する場合がある。すなわち、以下では、ユーザを端末装置１０と読み替えることもできる。なお、上述した端末装置１０は、例えば、スマートフォンや、タブレット型端末や、ノート型ＰＣ（Personal Computer）や、デスクトップＰＣや、携帯電話機や、ＰＤＡ（Personal Digital Assistant）等により実現される。

情報提供装置５０は、ユーザ等に種々の情報提供を行うための情報が格納された情報処理装置である。例えば、情報提供装置５０は、ウェブサーバ等の種々の外部装置から収集した文字情報等に基づくオブジェクトＩＤが格納される。例えば、情報提供装置５０は、ユーザ等に画像検索サービスを提供する情報処理装置である。例えば、情報提供装置５０は、画像検索サービスを提供するための各情報が格納される。例えば、情報提供装置５０は、画像検索サービスの対象となる画像に対応するベクトル情報を情報処理装置１００に提供する。また、情報提供装置５０は、クエリを情報処理装置１００に送信することにより、情報処理装置１００からクエリに対応する画像を示すオブジェクトＩＤ等を受信する。

情報処理装置１００は、検索処理において、所定のノードとエッジにより連結されたノードである連結ノードのうち、判定処理の処理対象数に関する基準に基づいて、判定処理の対象とするノードである判定対象ノードを選択するコンピュータである。例えば、情報処理装置１００は、選択した判定対象ノードに基づいてノードを抽出する抽出装置である。

情報処理装置１００は、クエリに類似するオブジェクトを抽出する検索装置である。例えば、情報処理装置１００は、端末装置からクエリ情報（クエリ）を受信すると、クエリに類似する対象（ベクトル情報等）を検索し、検索結果を端末装置に提供する。また、例えば、情報処理装置１００が端末装置に提供するデータは、画像情報等のデータ自体であってもよいし、ＵＲＬ（Uniform Resource Locator）等の対応するデータを参照するための情報であってもよい。また、クエリや検索対象のデータは、画像、音声、テキストデータなど、如何なる種類のデータであってもよい。本実施形態において、情報処理装置１００が画像を検索する場合を一例として説明する。

〔３．情報処理装置の構成〕
次に、図６を用いて、実施形態に係る情報処理装置１００の構成について説明する。図６は、実施形態に係る情報処理装置１００の構成例を示す図である。図６に示すように、情報処理装置１００は、通信部１１０と、記憶部１２０と、制御部１３０とを有する。なお、情報処理装置１００は、情報処理装置１００の管理者等から各種操作を受け付ける入力部（例えば、キーボードやマウス等）や、各種情報を表示するための表示部（例えば、液晶ディスプレイ等）を有してもよい。

（通信部１１０）
通信部１１０は、例えば、ＮＩＣ（Network Interface Card）等によって実現される。そして、通信部１１０は、ネットワーク（例えば図５中のネットワークＮ）と有線または無線で接続され、端末装置１０や情報提供装置５０との間で情報の送受信を行う。

（記憶部１２０）
記憶部１２０は、例えば、ＲＡＭ（Random Access Memory）、フラッシュメモリ（Flash Memory）等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。実施形態に係る記憶部１２０は、図６に示すように、オブジェクト情報記憶部１２１と、ツリー情報記憶部１２２と、グラフ情報記憶部１２３と、近似正解検索結果情報記憶部１２４と、関数情報記憶部１２５と、調整関連情報記憶部１２６とを有する。

（オブジェクト情報記憶部１２１）
実施形態に係るオブジェクト情報記憶部１２１は、オブジェクトに関する各種情報を記憶する。例えば、オブジェクト情報記憶部１２１は、データセットごとにオブジェクトＩＤやベクトルデータを記憶する。図７は、実施形態に係るオブジェクト情報記憶部の一例を示す図である。図７に示すオブジェクト情報記憶部１２１は、「データセットＩＤ」、「オブジェクトＩＤ」、「ベクトル情報」といった項目が含まれる。

「データセットＩＤ」は、データセットを識別するための識別情報を示す。「オブジェクトＩＤ」は、オブジェクトを識別するための識別情報を示す。また、「ベクトル情報」は、オブジェクトＩＤにより識別されるオブジェクトに対応するベクトル情報を示す。すなわち、図７の例では、オブジェクトを識別するオブジェクトＩＤに対して、オブジェクトに対応するベクトルデータ（ベクトル情報）が対応付けられて登録されている。

図７の例では、データセットＩＤ「ＤＳ１」により識別されるデータセット（データセットＤＳ１）には、オブジェクトＩＤ「ＯＢ１」、「ＯＢ２」、「ＯＢ３」等により識別される複数のオブジェクト（対象）が含まれることを示す。オブジェクトＩＤ「ＯＢ１」により識別されるオブジェクト（オブジェクトＯＢ１）は、「１０，２４，５１，２．．．」の多次元のベクトル情報が対応付けられることを示す。また、オブジェクトＩＤ「ＯＢ２」により識別されるオブジェクト（オブジェクトＯＢ２）は、「３２，１，１２０，３１．．．」の多次元のベクトル情報が対応付けられることを示す。

なお、オブジェクト情報記憶部１２１は、上記に限らず、目的に応じて種々の情報を記憶してもよい。

（ツリー情報記憶部１２２）
実施形態に係るツリー情報記憶部１２２は、ツリーに関する各種情報を記憶する。図８は、実施形態に係るツリー情報記憶部の一例を示す図である。具体的には、図８の例では、ツリー情報記憶部１２２は、ツリー構造のツリー情報を示す。図８の例では、ツリー情報記憶部１２２は、「ルート階層」、「第１階層」、「第２階層」、「第３階層」等といった項目が含まれる。なお、「第１階層」～「第３階層」に限らず、ツリーの階層数に応じて、「第４階層」、「第５階層」、「第６階層」等が含まれてもよい。

「ルート階層」は、ツリーを用いた起点ノードの決定の開始点となるルート（最上位）の階層を示す。「第１階層」は、ツリーの第１階層に属するノード（節点またはグラフ情報中のベクトル）を識別（特定）する情報が格納される。「第１階層」に格納されるノードは、ツリーの根（ルート）に直接結ばれる階層に対応するノードとなる。

「第２階層」は、ツリーの第２階層に属するノード（節点またはグラフ情報中のベクトル）を識別（特定）する情報が格納される。「第２階層」に格納されるノードは、第１階層のノードに結ばれる直下の階層に対応するノードとなる。「第３階層」は、ツリーの第３階層に属するノード（節点またはグラフ情報中のベクトル）を識別（特定）する情報が格納される。「第３階層」に格納されるノードは、第２階層のノードに結ばれる直下の階層に対応するノードとなる。

図８に示す例においては、ツリー情報記憶部１２２には、図１中のツリー情報ＩＮＤ１１に対応する情報が記憶される。例えば、ツリー情報記憶部１２２は、第１階層のノードが、節点ＶＴ１～ＶＴ３等であることを示す。また、各節点の下の括弧内の数値は、各節点に対応するベクトルの値を示す。

また、ツリー情報記憶部１２２は、節点ＶＴ２の直下の第２階層のノードが、節点ＶＴ２－１～ＶＴ２－４であることを示す。また、ツリー情報記憶部１２２は、節点ＶＴ２－１の直下の第３階層のノードが、ノードＮ１、ノードＮ２のグラフＧＲ１１中のノード（ベクトル）であることを示す。ツリー情報記憶部１２２は、節点ＶＴ２－２の直下の第３階層のノードが、ノードＮ３、ノードＮ４、ノードＮ５のグラフＧＲ１１中のノード（ベクトル）であることを示す。

なお、ツリー情報記憶部１２２は、上記に限らず、目的に応じて種々の情報を記憶してもよい。

（グラフ情報記憶部１２３）
実施形態に係るグラフ情報記憶部１２３は、グラフに関する各種情報を記憶する。例えば、グラフ情報記憶部１２３は、検索処理等の情報処理に用いられるグラフ情報を記憶する。図９の例は、グラフ情報記憶部１２３は、近傍グラフデータを記憶する。図９は、実施形態に係るグラフ情報記憶部の一例を示す図である。図９に示すグラフ情報記憶部１２３は、「ノードＩＤ」、「オブジェクトＩＤ」、および「有向エッジ情報」といった項目を有する。また、「有向エッジ情報」には、「エッジＩＤ」や「参照先」といった情報が含まれる。

「ノードＩＤ」は、グラフデータにおける各ノード（対象）を識別するための識別情報を示す。また、「オブジェクトＩＤ」は、オブジェクトを識別するための識別情報を示す。

また、「有向エッジ情報」は、対応するノードに接続されるエッジに関する情報を示す。図９の例では、「有向エッジ情報」は、対応するノードから出力される出力エッジに関する情報を示す。また、「エッジＩＤ」は、ノード間を連結するエッジを識別するための識別情報を示す。また、「参照先」は、エッジにより連結された参照先（ノード）を示す情報を示す。すなわち、図９の例では、ノードを識別するノードＩＤに対して、そのノードに対応するオブジェクト（対象）を識別する情報やそのノードからの有向エッジ（出力エッジ）が連結される参照先（ノード）が対応付けられて登録されている。

図９の例では、ノードＩＤ「Ｎ１」により識別されるノード（ノードＮ１）は、オブジェクトＩＤ「ＯＢ１」により識別されるオブジェクト（対象）に対応することを示す。また、ノードＮ１からは、エッジＩＤ「Ｅ１」により識別されるエッジ（エッジＥ１）が、ノードＩＤ「Ｎ２」により識別されるノード（ノードＮ２）に連結されることを示す。すなわち、図９の例では、グラフ情報におけるノードＮ１からはエッジＥ１によりノードＮ２へ辿ることができることを示す。

また、図９の例では、ノードＩＤ「Ｎ２」により識別されるノード（ノードＮ２）は、オブジェクトＩＤ「ＯＢ２」により識別されるオブジェクト（対象）に対応することを示す。また、ノードＮ２からは、エッジＩＤ「Ｅ２１」により識別されるエッジ（エッジＥ２１）が、ノードＩＤ「Ｎ１」により識別されるノード（ノードＮ１）に連結されることを示す。すなわち、図９の例では、グラフ情報におけるノードＮ２からはエッジＥ２１によりノードＮ１へ辿ることができることを示す。

なお、グラフ情報記憶部１２３は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、グラフ情報記憶部１２３は、各ノード（ベクトル）間を連結するエッジの長さが記憶されてもよい。すなわち、グラフ情報記憶部１２３は、各ノード（ベクトル）間の距離を示す情報が記憶されてもよい。グラフ情報記憶部１２３には、有向エッジにより連結されたグラフ情報に限らず、種々のグラフ情報が記憶されてもよい。グラフ情報記憶部１２３には、無向エッジにより連結されたグラフ情報が記憶されてもよい。

（近似正解検索結果情報記憶部１２４）
実施形態に係る近似正解検索結果情報記憶部１２４は、近似正解検索に関する各種情報を記憶する。近似正解検索結果情報記憶部１２４は、各クエリを用いた場合の検索処理の精度を測定するために用いる近似正解情報を記憶する。例えば、近似正解検索結果情報記憶部１２４は、各クエリに対応付けてそのクエリのｋ個の近傍ノードを近似正解検索結果として記憶する。図１０は、実施形態に係る閾値記憶部の一例を示す図である。図１０に示す近似正解検索結果情報記憶部１２４は、「クエリＩＤ」、「ベクトル情報」、「近似正解検索結果」といった項目を有する。また、「近似正解検索結果」には、「Ｎｏ」や「オブジェクト」といった項目が含まれる。

「クエリＩＤ」は、クエリを識別するための識別情報を示す。例えば、「クエリＩＤ」は、評価用クエリを識別するための識別情報を示す。また、「ベクトル情報」は、対応するクエリのベクトル情報を示す。「近似正解検索結果」は、対応するクエリの近似正解情報として用いる近似正解検索結果が記憶される。「Ｎｏ」は、対応するクエリの各近傍ノードの順位を示す。「オブジェクト」は、対応する順位の近傍ノード（オブジェクト）を示す。

図１０の例では、クエリＩＤ「ＱＥ１」により識別されるクエリ（クエリＱＥ１）は、「７，３５，１３，９３．．．」の多次元のベクトル情報であることを示す。クエリＱＥ１に対応する近似正解情報は、Ｎｏが「１」である、すなわち最も近傍のノードがオブジェクトＯＢ１０１に対応するノードであることを示す。また、クエリＱＥ１に対応する近似正解情報は、Ｎｏが「ｋ」である、すなわち最も遠いノード（最遠オブジェクト）がオブジェクトＯＢ５５に対応するノードであることを示す。

なお、近似正解検索結果情報記憶部１２４は、上記に限らず、目的に応じて種々の情報を記憶してもよい。近似正解検索結果情報記憶部１２４は、複数のグラフ情報を使い分ける場合、閾値に、その閾値が用いられるグラフ情報を対応付けて記憶してもよい。例えば、近似正解検索結果情報記憶部１２４は、グラフＧＲ１１以外のグラフ情報が用いられる場合、各閾値が用いられるグラフ情報と、対応する閾値とを対応付けて記憶してもよい。

（関数情報記憶部１２５）
実施形態に係る関数情報記憶部１２５は、関数に関する各種情報を記憶する。図１１は、実施形態に係る関数情報記憶部の一例を示す図である。図１１の例では、関数情報記憶部１２５は、「関数ＩＤ」、「算出対象」、「関数」、「パラメータ情報」といった項目を有する。また、「パラメータ情報」には、「第１パラメータ」や「第２パラメータ」といった情報が含まれる。なお、「パラメータ情報」には、「第１パラメータ」、「第２パラメータ」に限らず、関数に含まれるパラメータ数に応じて、「第３パラメータ」、「第４パラメータ」等が含まれてもよい。

「関数ＩＤ」は、関数を識別するための識別情報を示す。「算出対象」は、関数により算出される対象を示す。「関数」は、関数のデータを示す。図１１では「関数」に「ＦＩＮＦ１」といった概念的な情報が格納される例を示したが、実際には、対応する関数の種々の情報、または、その格納場所を示すファイルパス名などが格納される。

「パラメータ情報」には、対応する関数に含まれるパラメータ（変数）を示す。「第１パラメータ」は、対応する関数に含まれる１つのパラメータ（変数）を示す。また、「第２パラメータ」は、対応する関数に含まれる第１パラメータ以外の１つのパラメータ（変数）を示す。

図１１の例では、関数ＩＤ「ＦＣ１」により識別される関数（関数ＦＣ１）は、算出対象が「閾値ＴＨ１」であることを示す。関数ＦＣ１の関数のデータは、「ＦＩＮＦ１」であることを示す。関数ＦＣ１は、図１中の関数ＦＣ１に対応し、図１中に「ｅ_ｐ」で示す閾値ＴＨ１を算出する関数である。

また、関数ＦＣ１の第１パラメータは、「ｅ_０」であることを示す。第１パラメータは、関数ＦＣ１中の定数項「ｅ_０」であることを示す。

また、関数ＦＣ１の第２パラメータは、「ｗ_ｅ」であることを示す。第２パラメータは、関数ＦＣ１中の定数「１０」を底とする指数「ｗ_ｅε」中の「ｗ_ｅ」であることを示す。第２パラメータは、検索範囲係数「ε」との掛け合わされる「ｗ_ｅ」であることを示す。

なお、関数情報記憶部１２５は、上記に限らず、目的に応じて種々の情報を記憶してもよい。

（調整関連情報記憶部１２６）
実施形態に係る調整関連情報記憶部１２６は、パラメータの調整に関する各種情報を記憶する。図１２は、実施形態に係る調整関連情報記憶部の一例を示す図である。図１２の例では、調整関連情報記憶部１２６は、「調整ＩＤ」、「対象データセット」、「精度」、「評価指標」、「精度区間情報」といった項目を有する。また、「精度区間情報」には、「対象パラメータ」、「下限」、「上限」、「マージン」といった項目が含まれる。

「調整ＩＤ」は、調整を識別するための識別情報を示す。「対象データセット」は、調整の対象とするデータセットを識別するための識別情報を示す。「精度」は、精度として用いる対象を示す。「評価指標」は、評価指標として用いる対象を示す。

「精度区間情報」は、精度区間に関する各種情報を示す。「対象パラメータ」は、対応する精度区間を適用する対象となるパラメータを示す。「下限」は、精度区間の下限を示す。「上限」は、精度区間の上限を示す。「マージン」は、精度区間のマージンを示す。なお、図１２の例では、１つのマージンを用いる場合を示すが、マージンは上限と下限の各々に個別に設定されてもよい。

図１２の例では、調整ＩＤ「ＡＤ１」により識別される調整（調整ＡＤ１）は、データセットＤＳ１を対象とした調整であることを示す。調整ＡＤ１は、精度として「再現率」が用いられることを示す。なお、精度は、再現率（recall）に限らず、検索処理の精度が測定できれば、例えば適合率（precision）等どのようなものであってもよい。

また、調整ＡＤ１は、評価指標として「検索時間」が用いられることを示す。なお、評価指標は、検索時間に限らず、距離計算回数やノードのアクセス数等、種々の指標が用いられてもよい。

また、パラメータ「ｅ_０」を対象とする精度区間は、下限が「Ｒ１ａ」であり、上限が「Ｒ１ｂ」であり、マージンが「ＭＧ１」であることを示す。なお、図１２に示す例では、精度区間を示す値を「Ｒ１ａ」、「Ｒ１ｂ」、「ＭＧ１」といった抽象的な符号を図示するが、具体的な数値等であってもよい。

また、パラメータ「ｗ_ｅ」を対象とする精度区間は、下限が「Ｒ２ａ」であり、上限が「Ｒ２ｂ」であり、マージンが「ＭＧ２」であることを示す。なお、図１２に示す例では、精度区間を示す値を「Ｒ２ａ」、「Ｒ２ｂ」、「ＭＧ２」といった抽象的な符号を図示するが、具体的な数値等であってもよい。

なお、調整関連情報記憶部１２６は、上記に限らず、目的に応じて種々の情報を記憶してもよい。

（制御部１３０）
図６の説明に戻って、制御部１３０は、コントローラ（controller）であり、例えば、ＣＰＵ（Central Processing Unit）やＭＰＵ（Micro Processing Unit）等によって、情報処理装置１００内部の記憶装置に記憶されている各種プログラム（情報処理プログラムの一例に相当）がＲＡＭを作業領域として実行されることにより実現される。また、制御部１３０は、コントローラであり、例えば、ＡＳＩＣ（Application Specific Integrated Circuit）やＦＰＧＡ（Field Programmable Gate Array）等の集積回路により実現される。

図６に示すように、制御部１３０は、取得部１３１と、生成部１３２と、算出部１３３と、決定部１３４と、抽出部１３５と、提供部１３６とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部１３０の内部構成は、図６に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。

（取得部１３１）
取得部１３１は、各種情報を取得する。取得部１３１は、記憶部１２０から各種情報を取得する。取得部１３１は、オブジェクト情報記憶部１２１や、ツリー情報記憶部１２２や、グラフ情報記憶部１２３や、近似正解検索結果情報記憶部１２４や、関数情報記憶部１２５や、調整関連情報記憶部１２６等から各種情報を取得する。また、取得部１３１は、各種情報を外部の情報処理装置から取得する。取得部１３１は、端末装置１０等の外部装置から各種情報を取得する。取得部１３１は、グラフ情報記憶部１２３からグラフ情報を取得する。取得部１３１は、ツリー情報記憶部１２２からツリー情報を取得する。

取得部１３１は、検索対象となる複数のオブジェクトを含むデータセットと、データセットを対象とする検索に用いられる閾値を算出する関数とを取得する。取得部１３１は、グラフの検索時に用いられる閾値を算出する関数を取得する。取得部１３１は、対象グラフの検索時に参照する参照エッジ数を示す閾値を算出する関数を取得する。

取得部１３１は、複数のオブジェクトの各々に対応する複数のノードがエッジにより連結された対象グラフを取得する。取得部１３１は、データセットのうち、一部のオブジェクト群の各々に対応する複数のノードがエッジにより連結された対象グラフを取得する。

取得部１３１は、第１パラメータと第２パラメータとを含む関数を取得する。決定部１３４は、第１パラメータの第１値と、第２パラメータの第２値とを調整する調整処理により、第１値と第２値とを決定する。取得部１３１は、検索精度が高くなるほど、第１パラメータよりも影響が強くなる第２パラメータを含む関数を取得する。

取得部１３１は、第１パラメータに対してターゲットとする検索精度の範囲を示す第１精度範囲と、第２パラメータに対してターゲットとする検索精度の範囲を示す第２精度範囲とを取得する。取得部１３１は、再現率の範囲を示す第１精度範囲及び第２精度範囲を取得する。

取得部１３１は、定数項である第１パラメータと、所定の値を底とする指数に含まれる第２パラメータとを含む関数を取得する。取得部１３１は、検索処理における探索範囲を決定するための係数である検索範囲係数を含む関数を取得する。取得部１３１は、第２パラメータと検索範囲係数との掛け合わせを含む関数を取得する。

取得部１３１は、検索対象となる複数のオブジェクトを含むデータセットと、評価用クエリと、評価用クエリを用いたデータセットの近傍検索の結果である近似正解検索結果とを取得する。取得部１３１は、ターゲットとする検索精度の範囲を示す精度範囲を取得する。取得部１３１は、再現率の範囲を示す精度範囲を取得する。取得部１３１は、データセットを対象とする検索に用いられる閾値を算出する関数を取得する。

取得部１３１は、検索クエリに関する情報を取得する。取得部１３１は、画像検索に関する検索クエリを取得する。取得部１３１は、ユーザが利用する端末装置１０からクエリを取得する。取得部１３１は、端末装置１０からクエリを受け付けた情報提供装置５０からクエリを取得してもよい。図１の例では、取得部１３１は、クエリＱＥ１１をユーザが利用する端末装置１０から取得する。

図１の例では、取得部１３１は、グラフ情報記憶部１２３からグラフＧＲ１１を取得する。取得部１３１は、オブジェクト情報記憶部１２１（図７参照）からデータセットＤＳ１を取得する。取得部１３１は、ツリー情報記憶部１２２からツリー情報ＩＮＤ１１を取得する。

取得部１３１は、近似正解検索結果を取得する。取得部１３１は、クエリＱＥ１を対象とする近似正解検索結果を取得する。取得部１３１は、クエリＱＥ１を用いて、ｋ個（ｋは任意の数）のノードを近傍ノードとして抽出した結果を示す近似正解検索結果を取得する。取得部１３１は、近似正解検索結果情報記憶部１２４（図１０参照）からクエリＱＥ１に対応する近似正解検索結果を取得する。

（生成部１３２）
生成部１３２は、各種情報を生成する。生成部１３２は、記憶部１２０に記憶された各種情報に基づいて、種々の情報を生成する。生成部１３２は、オブジェクト情報記憶部１２１や、ツリー情報記憶部１２２や、グラフ情報記憶部１２３や、近似正解検索結果情報記憶部１２４や、関数情報記憶部１２５や、調整関連情報記憶部１２６等に基づいて、各種情報を生成する。

生成部１３２は、取得部１３１により取得された各種情報に基づいて、種々の情報を生成する。生成部１３２は、算出部１３３により算出された各種情報に基づいて、種々の情報を生成する。生成部１３２は、決定部１３４により決定された各種情報に基づいて、種々の情報を生成する。生成部１３２は、抽出部１３５により抽出された各種情報に基づいて、種々の情報を生成する。生成部１３２は、グラフ情報を生成してもよい。

図１の例では、生成部１３２は、与えられたデータセットからクエリオブジェクトセットを生成する。生成部１３２は、データセットからランダムに抽出したオブジェクト、または、ランダムに抽出した二つ以上のオブジェクトの平均値であるクエリオブジェクト（評価用クエリ）を生成する。生成部１３２は、オブジェクトＯＢ５００とオブジェクトＯＢ１０００との平均である「７，３５，１３，９３．．．」の多次元のベクトル情報を生成する。このように、図１の例では、生成部１３２は、評価用クエリＲＱ１に示すように、オブジェクトＯＢ５００とオブジェクトＯＢ１０００とに基づいて、クエリＱＥ１を生成する。

生成部１３２は、グラフを生成する。生成部１３２は、データセットＤＳ１中の全オブジェクトを用いて、グラフを生成してもよいし、データセットＤＳ１のうち一部のオブジェクトを用いて、グラフを生成してもよい。例えば。生成部１３２は、データセットＤＳ１のうち、オブジェクトＯＢ３等を除く、オブジェクトＯＢ１、ＯＢ２、ＯＢ１０１等の一部のオブジェクトを用いて、グラフを生成してもよい。生成部１３２は、データセットＤＳ１中の全オブジェクトを用いて、グラフＧＲ１１を生成する。生成部１３２は、グラフ生成に関する種々の技術を適宜用いて、グラフＧＲ１１を生成する。生成部１３２は、図１中のグラフＧＲ１１に示すように、ノードＮ１～Ｎ３、Ｎ４３、Ｎ５３等の複数のノード（ベクトル）を含むグラフ情報を生成する。

生成部１３２は、各オブジェクトに対応する各ノードから所定数以上の出力エッジが他のエッジに連結されるように、グラフＧＲ１１を生成する。生成部１３２は、グラフＧＲ１１における各ノードが、そのノードとの間の距離が近い方から所定数のノードへのエッジ（出力エッジ）が連結されるようにグラフＧＲ１を生成する。

生成部１３２は、近傍検索に関する種々の技術を適宜用いて、クエリＱＥ１に対応する近似正解検索結果を生成する。例えば、生成部１３２は、図１５に示すような処理により、クエリＱＥ１に対応する近似正解検索結果を生成する。この場合、生成部１３２は、後述する検索範囲係数「ε」の値を所定値以上大きくして、図１５に示すような処理をグラフＧＲ１１を用いて行うことにより、クエリＱＥ１に対応する近似正解検索結果を生成する。生成部１３２は、クエリＱＥ１に対応する近似正解検索結果ＲＲ１を生成する。

（算出部１３３）
算出部１３３は、各種情報を算出する。算出部１３３は、記憶部１２０に記憶された各種情報に基づいて、種々の情報を算出する。算出部１３３は、オブジェクト情報記憶部１２１や、ツリー情報記憶部１２２や、グラフ情報記憶部１２３や、近似正解検索結果情報記憶部１２４や、関数情報記憶部１２５や、調整関連情報記憶部１２６等に基づいて、各種情報を算出する。算出部１３３は、取得部１３１により取得された各種情報に基づいて、種々の情報を算出する。算出部１３３は、生成部１３２により生成された各種情報に基づいて、種々の情報を算出する。算出部１３３は、抽出部１３５により抽出された各種情報に基づいて、種々の情報を算出する。算出部１３３は、決定部１３４により決定された各種情報に基づいて、種々の情報を算出する。

算出部１３３は、データセットに対応する複数のノードがエッジにより連結された対象グラフと、評価用クエリとを用いた検索処理による検索結果のうち、近似正解検索結果に含まれない一のオブジェクトが、近似正解検索結果のうち、評価用クエリから最遠のオブジェクトである最遠オブジェクトよりも評価用クエリに近い場合、一のオブジェクトを正解とする所定の処理を行うことにより、検索処理に関連する評価指標を算出する。

算出部１３３は、対象グラフを対象とする検索処理による検索結果のうち、一のオブジェクトが、最遠オブジェクトよりも評価用クエリに近い場合、所定の処理を行うことにより、検索処理に関連する評価指標を算出する。算出部１３３は、対象グラフを対象とする検索処理による検索結果のうち、一のオブジェクトが、最遠オブジェクトよりも評価用クエリに近い場合、所定の処理を行うことにより、検索処理に関連する評価指標を算出する。

算出部１３３は、データセットから抽出された抽出オブジェクトに基づく評価用クエリを用いた検索処理による検索結果のうち、一のオブジェクトが、最遠オブジェクトよりも評価用クエリに近い場合、所定の処理を行うことにより、検索処理に関連する評価指標を算出する。算出部１３３は、データセットから抽出された複数の抽出オブジェクトから生成される評価用クエリを用いた検索処理による検索結果のうち、一のオブジェクトが、最遠オブジェクトよりも評価用クエリに近い場合、所定の処理を行うことにより、検索処理に関連する評価指標を算出する。算出部１３３は、複数の抽出オブジェクトの平均を評価用クエリとする検索処理による検索結果のうち、一のオブジェクトが、最遠オブジェクトよりも評価用クエリに近い場合、所定の処理を行うことにより、検索処理に関連する評価指標を算出する。

算出部１３３は、検索処理における検索時間、距離計算回数、及び対象グラフのノードのアクセス数のうち少なくとも１つを、評価指標として算出する。算出部１３３は、精度範囲を用いて評価指標を算出する。算出部１３３は、精度範囲における評価指標を算出する。算出部１３３は、検索処理における探索範囲を決定するための係数である検索範囲係数を変動させることにより、精度範囲における評価指標を算出する。

算出部１３３は、検索精度が精度範囲に含まれる複数の検索範囲係数の値の各々に対応する複数の個別評価指標を用いて、精度範囲における評価指標を算出する。算出部１３３は、精度範囲の下限以下の検索精度になる検索範囲係数の第１値と、精度範囲の上限以上の検索精度になる検索範囲係数の第２値とを用いて、精度範囲における評価指標を算出する。算出部１３３は、第１値と、第２値との間を等分した複数の検索範囲係数の値の各々に対応する複数の個別評価指標を用いて、精度範囲における評価指標を算出する。

算出部１３３は、台形近似により、精度範囲における評価指標を算出する。算出部１３３は、対象グラフを対象とする検索処理による検索結果のうち、一のオブジェクトが、最遠オブジェクトよりも評価用クエリに近い場合、一のオブジェクトを正解として、評価指標を算出する。算出部１３３は、対象グラフを対象とする検索処理による検索結果のうち、一のオブジェクトが、最遠オブジェクトよりも評価用クエリに近い場合、一のオブジェクトを正解として近似正解検索結果を更新する。算出部１３３は、対象グラフを対象とする検索処理による検索結果のうち、一のオブジェクトが、最遠オブジェクトよりも評価用クエリに近い場合、一のオブジェクトを近似正解検索結果に追加する更新処理を行い、評価指標を算出する。算出部１３３は、一のオブジェクトを近似正解検索結果に追加し、最遠オブジェクトを近似正解検索結果から除外する更新処理を行い、評価指標を算出する。算出部１３３は、更新処理を行った場合、評価指標を算出する処理を再度実行することにより、評価指標を算出する。

算出部１３３は、関数に含まれる複数のパラメータの各々の値を調整する調整処理における検索処理による検索結果のうち、一のオブジェクトが、最遠オブジェクトよりも評価用クエリに近い場合、所定の処理を行うことにより、評価指標を算出する。算出部１３３は、閾値が示す参照エッジ数による対象グラフの検索処理を含む調整処理により、複数のパラメータの各々の値を決定する。算出部１３３は、第１パラメータの第１値と、第２パラメータの第２値とを調整する調整処理における検索処理による検索結果のうち、一のオブジェクトが、最遠オブジェクトよりも評価用クエリに近い場合、所定の処理を行うことにより、評価指標を算出する。

算出部１３３は、検索精度が高くなるほど、第１パラメータよりも影響が強くなる第２パラメータを含む関数を対象に、評価指標を算出する。算出部１３３は、定数項である第１パラメータと、所定の値を底とする指数に含まれる第２パラメータとを含む関数を対象に、評価指標を算出する。算出部１３３は、検索処理における探索範囲を決定するための係数である検索範囲係数を含む関数を対象に、評価指標を算出する。算出部１３３は、第２パラメータと検索範囲係数との掛け合わせを含む関数を対象に、評価指標を算出する。

図１の例では、算出部１３３は、各パラメータの調整のために、特定の精度区間（ターゲット精度区間）における評価指標（例えば検索時間、オブジェクトアクセス数、距離計算回数等）を測定する。算出部１３３は、第１パラメータ「ｅ_０」を任意の値（測定対象値）に設定し、評価指標を測定する。例えば、算出部１３３は、第１パラメータ「ｅ_０」を「２０」に設定し、評価指標を測定する処理（測定処理）を行う。算出部１３３は、第２パラメータ「ｗ_ｅ」を任意の値（測定対象値）に設定し、評価指標を測定する。例えば、算出部１３３は、第２パラメータ「ｗ_ｅ」を「３０」に設定し、評価指標を測定する処理（測定処理）を行う。算出部１３３は、上述した第１パラメータに対する測定処理と同様に、図２に示すような処理により、第２パラメータ「ｗ_ｅ」を任意の値に設定し、評価指標を測定する。

算出部１３３は、各試行において、評価用クエリを用いて検索処理を行い、その検索処理の時間を計測するとともに、抽出した検索結果を用いて、再現率を算出する。図２の例では、算出部１３３は、クエリＱＥ１を用いてグラフＧＲ１１からｋ個の近傍ノードを抽出する検索処理を行い、その検索処理の時間を計測するとともに、抽出した検索結果と近似正解検索結果ＲＲ１とを用いて再現率を算出する。算出部１３３は、抽出した検索結果のうち近似正解検索結果ＲＲ１に含まれるオブジェクトの数を、近似正解検索結果ＲＲ１のオブジェクトの数で除することにより、再現率を算出する。

算出部１３３は、台形近似により範囲における平均の評価指標を算出する。算出部１３３は、台形近似により範囲における平均の検索時間を評価指標として算出する。図２の例では、算出部１３３は、台形近似により探索結果ＲＳ４中の範囲ＡＲ１１に対応する範囲の平均の評価指標を算出する。算出部１３３は、係数下限「０．０８」と算出用試行結果ＥＤ１との間のうち、第１ターゲット精度範囲の下限「Ｒ１ａ」と算出用試行結果ＥＤ１との間のみを用いて、平均の評価指標を算出する。また、算出部１３３は、算出用試行結果ＥＤ５と係数上限「０．１２」との間のうち、算出用試行結果ＥＤ５と第１ターゲット精度範囲の上限「Ｒ１ｂ」との間のみを用いて、平均の評価指標を算出する。

算出部１３３は、検索範囲係数「ε」を下限から上限まで当分に分割して、それぞれの検索範囲係数「ε」での検索を行って評価指標を求める。算出部１３３は、台形近似により範囲における平均の評価指標を算出する。算出部１３３は、台形近似により範囲における平均の検索時間を評価指標として算出する。

（決定部１３４）
決定部１３４は、各種情報を決定する。決定部１３４は、各種情報を判定する。決定部１３４は、各種情報を選択する。決定部１３４は、記憶部１２０に記憶された各種情報に基づいて、種々の情報を決定する。決定部１３４は、記憶部１２０に記憶された各種情報に基づいて、種々の情報を判定する。決定部１３４は、オブジェクト情報記憶部１２１や、ツリー情報記憶部１２２や、グラフ情報記憶部１２３や、近似正解検索結果情報記憶部１２４や、関数情報記憶部１２５や、調整関連情報記憶部１２６等に基づいて、各種情報を決定する。

決定部１３４は、取得部１３１により取得された各種情報に基づいて、種々の情報を決定する。決定部１３４は、取得部１３１により取得された各種情報に基づいて、種々の情報を判定する。決定部１３４は、算出部１３３により算出された各種情報に基づいて、種々の情報を決定する。決定部１３４は、算出部１３３により算出された各種情報に基づいて、種々の情報を判定する。決定部１３４は、抽出部１３５により抽出された各種情報に基づいて、種々の情報を決定する。決定部１３４は、抽出部１３５により抽出された各種情報に基づいて、種々の情報を判定する。決定部１３４は、抽出部１３５により抽出された各種情報に基づいて、種々の情報を選択する。決定部１３４は、検索処理における判定処理や決定処理や選択処理を行う。

決定部１３４は、データセットに対応する複数のノードがエッジにより連結された対象グラフと、閾値とを用いた検索処理を含み、関数に含まれる複数のパラメータの各々の値を調整する調整処理により、複数のパラメータの各々の値を決定する。決定部１３４は、閾値が示す参照エッジ数による対象グラフの検索処理を含む調整処理により、複数のパラメータの各々の値を決定する。決定部１３４は、対象グラフを対象とする検索処理を含む調整処理により、複数のパラメータの各々の値を決定する。決定部１３４は、対象グラフを対象とする検索処理を含む調整処理により、複数のパラメータの各々の値を決定する。

決定部１３４は、データセットから抽出された抽出オブジェクトに基づく評価用クエリを用いた検索処理を含む調整処理により、複数のパラメータの各々の値を決定する。決定部１３４は、データセットから抽出された複数の抽出オブジェクトから生成される評価用クエリを用いた検索処理を含む調整処理により、複数のパラメータの各々の値を決定する。

決定部１３４は、複数の抽出オブジェクトの平均を評価用クエリとする検索処理を含む調整処理により、複数のパラメータの各々の値を決定する。決定部１３４は、検索処理に関連する評価指標を用いた調整処理により、複数のパラメータの各々の値を決定する。決定部１３４は、検索処理における検索時間、距離計算回数、及び対象グラフのノードのアクセス数のうち少なくとも１つを、評価指標として用いた調整処理により、複数のパラメータの各々の値を決定する。

決定部１３４は、第１パラメータの第１値を調整する第１調整処理と、第２パラメータの第２値を調整する第２調整処理と含む調整処理により、第１値と第２値とを決定する。決定部１３４は、所定の条件を満たすまで第１調整処理と第２調整処理とを繰り返す調整処理により、第１値と第２値とを決定する。決定部１３４は、第１調整処理により調整された第１パラメータの第１値が、前回の第１調整処理により調整された第１パラメータの前回の第１値と同じ、または、第２調整処理により調整された第２パラメータの第２値が、前回の第２調整処理により調整された第２パラメータの前回の第２値と同じである場合、調整処理を終了する。

決定部１３４は、第２調整処理により調整された第２値を用いて、第１パラメータの第１値を調整する第１調整処理を行うことにより、第１値と第２値とを決定する。決定部１３４は、第１調整処理により調整された第１値を用いて、第２パラメータの第２値を調整する第２調整処理を行うことにより、第１値と第２値とを決定する。決定部１３４は、第１精度範囲を用いて第１調整処理を行い、第２精度範囲を用いて第２調整処理を行うことにより、第１値と第２値とを決定する。

決定部１３４は、第１精度範囲における検索処理に関連する評価指標を算出することにより、第１値を調整する第１調整処理と、第２精度範囲における評価指標を算出することにより、第２値を調整する第２調整処理とを行うことにより、第１値と第２値とを決定する。決定部１３４は、検索処理における探索範囲を決定するための係数である検索範囲係数を変動させることにより、第１精度範囲における評価指標を算出し、第１値を調整する第１調整処理と、検索範囲係数を変動させることにより、第２精度範囲における評価指標を算出し、第２値を調整する第２調整処理とを行うことにより、第１値と第２値とを決定する。

決定部１３４は、検索の起点となる起点ノード決定してもよい。決定部１３４は、所定のツリー情報を用いて、起点ノードを決定する。決定部１３４は、図４中の情報群ＧＩＮＦ１１に示すようなツリー情報ＩＮＤ１１を用いて起点ノードを決定する。決定部１３４は、ツリー情報ＩＮＤ１１に基づいて、クエリＱＥ１１に対応する起点ノードを決定する。決定部１３４は、ツリー情報記憶部１２２（図８参照）に記憶されたツリー情報ＩＮＤ１１を用いて、起点ノードを決定する。

決定部１３４は、図４中のツリー情報ＩＮＤ１１に示すような木構造型のツリー情報を用いて、グラフＧＲ１１における起点ノードを決定する。決定部１３４は、クエリＱＥ１１に基づいて、ツリー情報ＩＮＤ１１を上（ルートＲＴ）から下へ辿ることにより、ツリー情報ＩＮＤ１１の近傍候補となる起点ノードを特定する。決定部１３４は、２個のノードを起点ノードに決定する。

決定部１３４は、ツリー情報ＩＮＤ１１をルートＲＴからリーフノード（グラフＧＲ１１中のノード）まで辿ることにより、クエリＱＥ１１に対応する起点ノードを決定してもよい。

図１の例では、決定部１３４は、評価用クエリを決定する。決定部１３４は、データセットからランダムに抽出したオブジェクト、または、ランダムに抽出した二つ以上のオブジェクトの平均値のオブジェクトを、クエリオブジェクト（評価用クエリ）に決定する。決定部１３４は、「７，３５，１３，９３．．．」の多次元のベクトル情報であるクエリＱＥ１を評価用クエリに決定する。

決定部１３４は、ターゲット精度範囲を決定する。決定部１３４は、上記式（１）のような閾値を算出（導出）する関数に含まれる各パラメータ（変数）に対するターゲット精度範囲を決定する。

決定部１３４は、上記式（１）中の第１パラメータ「ｅ_０」と、第２パラメータ「ｗ_ｅ」との各々のターゲット精度範囲を決定する。決定部１３４は、種々の情報を適宜用いて、第１パラメータ「ｅ_０」と、第２パラメータ「ｗ_ｅ」との各々のターゲット精度範囲を決定する。決定部１３４は、ターゲット情報ＴＲ１に示すように、第１パラメータ「ｅ_０」と第２パラメータ「ｗ_ｅ」との各々について、ターゲット精度範囲の下限、上限及びマージンを決定する。

決定部１３４は、第１パラメータ「ｅ_０」のターゲット精度範囲（第１ターゲット精度範囲）の下限を「Ｒ１ａ」に、上限を「Ｒ１ｂ」に決定し、マージンを「ＭＧ１」に決定する。決定部１３４は、第２パラメータ「ｗ_ｅ」のターゲット精度範囲（第２ターゲット精度範囲）の下限を「Ｒ２ａ」に、上限を「Ｒ２ｂ」に決定し、マージンを「ＭＧ２」に決定する。このように、第１パラメータ「ｅ_０」の第１ターゲット精度範囲と、第２パラメータ「ｗ_ｅ」の第２ターゲット精度範囲とを各々個別に決定する。決定部１３４は、情報処理装置１００の管理者等による指定値や、予め記憶部１２０（図６参照）に記憶された基準値等を用いて、第１パラメータ「ｅ_０」と、第２パラメータ「ｗ_ｅ」との各々のターゲット精度範囲を決定する。

決定部１３４は、平均の評価指標を、その測定処理で設定した第１パラメータ「ｅ_０」の設定値における評価指標に決定する。決定部１３４は、測定処理を所定の回数繰り返し、最も評価指標が良い設定値を第１パラメータ「ｅ_０」の第１値（最適値）に決定する。決定部１３４は、決定した第１パラメータ「ｅ_０」の第１値が前回の第１調整処理で決定した第１パラメータ「ｅ_０」の第１値（前回第１値）と同じであるかを判定する。決定部１３４は、決定した第１パラメータ「ｅ_０」の第１値が前回第１値と同じであると判定した場合、調整処理を終了すると決定する。

決定部１３４は、決定した第１パラメータ「ｅ_０」の第１値が前回第１値と同じでないと判定した場合、第２パラメータ「ｗ_ｅ」を対象とした第２調整処理を実行すると決定する。決定部１３４は、初回の第１調整処理の場合、前回第１値が無いため、決定した第１パラメータ「ｅ_０」の第１値が前回第１値と同じではないと判定し、第２調整処理を実行すると決定する。

決定部１３４は、測定処理を所定の回数繰り返し、最も評価指標が良い設定値を第２パラメータ「ｗ_ｅ」の第２値（最適値）に決定。決定部１３４は、決定した第２パラメータ「ｗ_ｅ」の第２値が前回の第２調整処理で決定した第２パラメータ「ｗ_ｅ」の第１値（「前回第２値」ともいう）と同じであるかを判定する。決定部１３４は、決定した第２パラメータ「ｗ_ｅ」の第２値が前回第２値と同じであると判定した場合、調整処理を終了すると決定する。決定部１３４は、決定した第２パラメータ「ｗ_ｅ」の第２値が前回第２値と同じでないと判定した場合、第１調整処理を再度行う。

（抽出部１３５）
抽出部１３５は、各種情報を抽出する。抽出部１３５は、記憶部１２０に記憶された各種情報に基づいて、種々の情報を抽出する。抽出部１３５は、オブジェクト情報記憶部１２１や、ツリー情報記憶部１２２や、グラフ情報記憶部１２３や、近似正解検索結果情報記憶部１２４や、関数情報記憶部１２５や、調整関連情報記憶部１２６等に基づいて、各種情報を抽出する。抽出部１３５は、取得部１３１により取得された各種情報に基づいて、種々の情報を抽出する。抽出部１３５は、生成部１３２により生成された各種情報に基づいて、種々の情報を抽出する。抽出部１３５は、算出部１３３により算出された各種情報に基づいて、種々の情報を抽出する。抽出部１３５は、決定部１３４により決定された各種情報に基づいて、種々の情報を抽出する。抽出部１３５は、検索処理における抽出処理を行う。

抽出部１３５は、検索クエリに類似するノードである類似ノードを抽出する。抽出部１３５は、各種情報を検索する検索部であってもよい。抽出部１３５は、グラフ情報を探索することにより、オブジェクトを検索する。抽出部１３５は、取得部１３１により取得されたクエリが取得された場合、グラフ情報を探索することにより、クエリに類似するオブジェクトを検索する。抽出部１３５は、グラフデータを探索することにより、クエリに類似するオブジェクトを抽出する。抽出部１３５は、図１５に示すような処理手順に基づいて、グラフデータを探索することにより、クエリに類似するオブジェクトを抽出する。

図１の例では、抽出部１３５は、データセットＤＳ１から評価用クエリの生成に用いるオブジェクトを抽出する。抽出部１３５は、データセットＤＳ１からランダムに二つ以上の所定数のオブジェクトを抽出オブジェクトとして抽出する。抽出部１３５は、データセットＤＳ１からオブジェクトＯＢ５００とオブジェクトＯＢ１０００との２つのオブジェクトを抽出オブジェクトとして抽出する。

抽出部１３５は、クエリＱＥ１を中心とする半径ｒ内の範囲ＡＲ１と、クエリＱＥ１を中心とする半径ｒ（１＋ε）内の範囲ＡＲ２とを用いて、グラフＧＲ１１を検索し、近傍ノードを抽出する。

図３の例では、抽出部１３５は、測定用検索結果ＳＲ１のうち、近似正解検索結果ＲＲ１に含まれないオブジェクトを非重複オブジェクトとして抽出する。抽出部１３５は、非重複オブジェクト情報ＮＯＬ１に示すように、測定用検索結果ＳＲ１のうちオブジェクトＯＢ７７を、近似正解検索結果ＲＲ１に含まれない非重複オブジェクトとして抽出する。

（提供部１３６）
提供部１３６は、各種情報を提供する。提供部１３６は、端末装置１０や情報提供装置５０に各種情報を提供する。提供部１３６は、端末装置１０に各種情報を送信する。提供部１３６は、端末装置１０に各種情報を配信する。提供部１３６は、取得部１３１により取得された各種情報に基づいて、種々の情報を提供する。提供部１３６は、生成部１３２により生成された各種情報に基づいて、種々の情報を提供する。提供部１３６は、算出部１３３により算出された各種情報に基づいて、種々の情報を提供する。提供部１３６は、決定部１３４により決定された各種情報に基づいて、種々の情報を提供する。提供部１３６は、抽出部１３５により抽出された各種情報に基づいて、種々の情報を提供する。提供部１３６は、検索処理における提供処理を行う。

提供部１３６は、クエリに対応するオブジェクトＩＤを検索結果として提供する。提供部１３６は、決定部１３４により決定された類似ノードに関する情報を提供する。提供部１３６は、決定部１３４により決定された類似ノードを示すオブジェクトＩＤを端末装置１０や情報提供装置５０へ提供する。提供部１３６は、決定部１３４により決定されたオブジェクトＩＤをクエリに対応するベクトルを示す情報として、端末装置１０や情報提供装置５０に提供する。提供部１３６は、抽出部１３５により抽出（検索）されたオブジェクトＩＤを端末装置１０や情報提供装置５０へ提供する。提供部１３６は、抽出部１３５が検索により抽出したオブジェクトＩＤを情報提供装置５０へ提供する。提供部１３６は、抽出部１３５により抽出されたオブジェクトＩＤをクエリに対応するベクトルを示す情報として、端末装置１０や情報提供装置５０に提供する。

提供部１３６は、抽出部１３５により抽出された類似ノードに関する情報を提供する。提供部１３６は、類似ノードに関する情報を所定のユーザが利用する端末装置１０（図５参照）に提供する。提供部１３６は、クエリの送信元へ検索結果を提供する。図１の例では、提供部１３６は、ノードＮ６、Ｎ７、Ｎ５６を示す情報をクエリＱＥ１１の類似ノードとして、検索の要求元へ提供する。情報処理装置１００は、クエリＱＥ１１に基づく検索結果として、ノードＮ６、Ｎ７、Ｎ５６を示す情報を、検索の要求元へ提供する。提供部１３６は、クエリＱＥ１１の送信元であるユーザＵ１が利用する端末装置１０に検索結果を提供する。提供部１３６は、クエリＱＥ１１に類似するノードＮ６、Ｎ７、Ｎ５６を示す情報を検索結果として提供する。

〔４．情報処理（決定処理、算出処理）のフロー〕
次に、図１３及び図１４を用いて、実施形態に係る情報処理システム１による情報処理の手順について説明する。

〔４－１．決定処理のフロー〕
まず、図１３について説明する。図１３は、実施形態に係る情報処理の一例を示すフローチャートである。具体的には、図１３は、実施形態に係る情報処理に含まれる決定処理の一例を示すフローチャートである。

図１３に示すように、情報処理装置１００は、検索対象となる複数のオブジェクトを含むデータセットを取得する（ステップＳ１０１）。例えば、情報処理装置１００は、オブジェクト情報記憶部１２１（図７参照）から、データセットＤＳ１を取得する。

そして、情報処理装置１００は、データセットを対象とする検索に用いられる閾値を算出する関数を取得する（ステップＳ１０２）。例えば、情報処理装置１００は、関数情報記憶部（図１１参照）から、関数ＦＣ１を取得する。

そして、情報処理装置１００は、データセットに対応する複数のノードがエッジにより連結された対象グラフと、閾値とを用いた検索処理を含み、関数に含まれる複数のパラメータの各々の値を調整する調整処理により、複数のパラメータの各々の値を決定する（ステップＳ１０３）。情報処理装置１００は、データセットに対応する複数のノードがエッジにより連結された対象グラフと、閾値とを用いた検索処理を含む調整処理であって、関数に含まれる複数のパラメータの各々の値を調整する調整処理により、複数のパラメータの各々の値を決定する例えば、情報処理装置１００は、調整処理により、関数ＦＣ１の第１パラメータ「ｅ_０」と第２パラメータ「ｗ_ｅ」の各々の値を決定する。

〔４－２．算出処理のフロー〕
次に、図１４について説明する。図１４は、実施形態に係る情報処理の一例を示すフローチャートである。具体的には、図１４は、実施形態に係る情報処理に含まれる算出処理の一例を示すフローチャートである。なお、図１４に示す算出処理は、図１３に示す調整処理内で行われてもよい。

図１４に示すように、情報処理装置１００は、検索対象となる複数のオブジェクトを含むデータセットを取得する（ステップＳ２０１）。例えば、情報処理装置１００は、オブジェクト情報記憶部１２１（図７参照）から、データセットＤＳ１を取得する。

そして、情報処理装置１００は、評価用クエリを取得する（ステップＳ２０２）。例えば、情報処理装置１００は、評価用クエリであるクエリＱＥ１を取得する。

そして、情報処理装置１００は、評価用クエリを用いたデータセットの近傍検索の結果である近似正解検索結果を取得する（ステップＳ２０３）。例えば、情報処理装置１００は、近似正解検索結果情報記憶部１２４（図１０参照）からクエリＱＥ１に対応する近似正解検索結果を取得する。

そして、情報処理装置１００は、データセットに対応する複数のノードがエッジにより連結された対象グラフと、評価用クエリとを用いた検索処理を実行する（ステップＳ２０４）。例えば、情報処理装置１００は、グラフ情報記憶部１２３（図９参照）に記憶されたグラフＧＲ１１と、クエリＱＥ１とを用いた検索処理を実行する。

そして、情報処理装置１００は、検索結果のうち、近似正解検索結果に含まれない一のオブジェクトが、近似正解検索結果のうち、評価用クエリから最遠のオブジェクトである最遠オブジェクトよりも評価用クエリに近い場合、一のオブジェクトを正解とする所定の処理を実行する（ステップＳ２０５）。例えば、情報処理装置１００は、評価用クエリから最遠のオブジェクトである最遠オブジェクトよりも評価用クエリに近い場合、一のオブジェクトを正解として精度を算出する。また、例えば、情報処理装置１００は、評価用クエリから最遠のオブジェクトである最遠オブジェクトよりも評価用クエリに近い場合、一のオブジェクトを正解として近似正解検索結果を更新する。

そして、情報処理装置１００は、検索処理に関連する評価指標を算出する（ステップＳ２０６）。例えば、情報処理装置１００は、検索処理に関連する評価指標である検索時間を算出する。

〔５．情報処理（検索処理）のフロー〕
次に、情報処理装置１００による検索処理のフローについて、図１５を一例として説明する。図１５は、実施形態に係る情報処理の一例を示すフローチャートである。具体的には、図１５は、グラフデータを用いた検索処理の一例を示すフローチャートである。なお、図１５に示す検索処理には、選択処理も含まれる。以下に説明する検索処理は、情報処理装置１００によって行われる。また、以下でいうオブジェクトは、ノードと読み替えてもよい。なお、情報処理装置１００によるグラフデータを用いた検索は下記に限らず、種々の手順により行われてもよい。

ここでは、近傍集合Ｎ（Ｇ，ｙ）は、ノードｙに付与されているエッジにより関連付けられている近傍のオブジェクトの集合である。例えば、近傍集合Ｎ（Ｇ，ｙ）は、ノードｙからの出力エッジが連結されたオブジェクト（ノード）の集合である。「Ｇ」は、所定のグラフデータ（例えば、グラフＧＲ１１等）であってもよい。例えば、情報処理装置１００は、ｋ近傍検索処理を実行する。

例えば、情報処理装置１００は、超球の半径ｒを∞（無限大）に設定し（ステップＳ３００）、既存のオブジェクト集合から集合Ｓを抽出する（ステップＳ３０１）。例えば、情報処理装置１００は、起点ノードとして決定（選択）されたオブジェクト（ノード）を集合Ｓとして抽出してもよい。また、例えば、超球とは、検索範囲を示す仮想的な球である。なお、ステップＳ３０１において抽出された集合Ｓに含まれるオブジェクト（ノード）は、検索結果（抽出候補）の集合Ｒの初期集合にも含められる。また、ステップＳ３０１において抽出された集合Ｓに含まれるオブジェクト（ノード）は、集合Ｃに含められてもよい。集合Ｃは、重複検索を回避するために便宜上設けられるものであり、処理開始時には空集合に設定されてもよい。

次に、情報処理装置１００は、集合Ｓに含まれるオブジェクトの中で、検索クエリオブジェクトをｙとするとオブジェクトｙとの距離が最も短いオブジェクトを抽出し、オブジェクトｓとする（ステップＳ３０２）。例えば、図１の例では、情報処理装置１００は、オブジェクトｙであるクエリＱＥ１に対応する起点ノードであるノードＮ２等が含まれる集合Ｓから、一のノードをオブジェクトｓ（対象ノード）として抽出する。次に、情報処理装置１００は、オブジェクトｓを集合Ｓから除外する（ステップＳ３０３）。例えば、図１の例では、情報処理装置１００は、起点ノードであるノードＮ２を集合Ｓから除外する。

次に、情報処理装置１００は、オブジェクトｓとオブジェクトｙとの距離ｄ（ｓ，ｙ）がｒ（１＋ε）を超えるか否かを判定する（ステップＳ３０４）。ここで、εは拡張要素であり、ｒ（１＋ε）は、探索範囲（この範囲内のノードのみを探索する。検索範囲よりも大きくすることで精度を高めることができる）の半径を示す値である。オブジェクトｓとオブジェクトｙとの距離ｄ（ｓ，ｙ）がｒ（１＋ε）を超える場合（ステップＳ３０４：Ｙｅｓ）、情報処理装置１００は、集合Ｒをオブジェクトｙの近傍集合として出力し（ステップＳ３０５）、処理を終了する。

オブジェクトｓと検索クエリオブジェクトｙとの距離ｄ（ｓ，ｙ）がｒ（１＋ε）を超えない場合（ステップＳ３０４：Ｎｏ）、情報処理装置１００は、オブジェクトｓの近傍集合Ｎ（Ｇ，ｓ）の要素であるオブジェクトの中から集合Ｃに含まれないオブジェクトを、所定の基準に基づいて一つ選択し、選択したオブジェクトｕを、集合Ｃに格納する（ステップＳ３０６）。例えば、図１の例では、情報処理装置１００は、ノードＮ２の連結ノードであるノードＮ１、Ｎ４３等のうち、クエリＱＥ１１と最も近いノード（例えばノードＮ４３）をオブジェクトｕとして選択する。

次に、情報処理装置１００は、オブジェクトｕとオブジェクトｙとの距離ｄ（ｕ，ｙ）がｒ（１＋ε）以下であるか否かを判定する（ステップＳ３０７）。オブジェクトｕとオブジェクトｙとの距離ｄ（ｕ，ｙ）がｒ（１＋ε）以下である場合（ステップＳ３０７：Ｙｅｓ）、情報処理装置１００は、オブジェクトｕを集合Ｓに追加する（ステップＳ３０８）。また、オブジェクトｕとオブジェクトｙとの距離ｄ（ｕ，ｙ）がｒ（１＋ε）以下ではない場合（ステップＳ３０７：Ｎｏ）、情報処理装置１００は、ステップＳ３０９の判定（処理）を行う。

次に、情報処理装置１００は、オブジェクトｕとオブジェクトｙとの距離ｄ（ｕ，ｙ）がｒ以下であるか否かを判定する（ステップＳ３０９）。オブジェクトｕとオブジェクトｙとの距離ｄ（ｕ，ｙ）がｒを超える場合、情報処理装置１００は、ステップＳ３１５の判定（処理）を行う。また、オブジェクトｕとオブジェクトｙとの距離ｄ（ｕ，ｙ）がｒ以下ではない場合（ステップＳ３０９：Ｎｏ）、情報処理装置１００は、ステップＳ３１５の判定（処理）を行う。

オブジェクトｕとオブジェクトｙとの距離ｄ（ｕ，ｙ）がｒ以下である場合（ステップＳ３０９：Ｙｅｓ）、情報処理装置１００は、オブジェクトｕを集合Ｒに追加する（ステップＳ３１０）。そして、情報処理装置１００は、集合Ｒに含まれるオブジェクト数がｋｓを超えるか否かを判定する（ステップＳ３１１）。所定数ｋｓは、任意に定められる自然数である。例えば、ｋｓは、検索における抽出数を示し、「３」や「２０」や「１００」等の任意の値であってもよい。集合Ｒに含まれるオブジェクト数がｋｓを超えない場合（ステップＳ３１１：Ｎｏ）、情報処理装置１００は、ステップＳ３１３の判定（処理）を行う。

集合Ｒに含まれるオブジェクト数がｋｓを超える場合（ステップＳ３１１：Ｙｅｓ）、情報処理装置１００は、集合Ｒに含まれるオブジェクトの中でオブジェクトｙとの距離が最も長い（遠い）オブジェクトを、集合Ｒから除外する（ステップＳ３１２）。

次に、情報処理装置１００は、集合Ｒに含まれるオブジェクト数がｋｓと一致するか否かを判定する（ステップＳ３１３）。集合Ｒに含まれるオブジェクト数がｋｓと一致しない場合（ステップＳ３１３：Ｎｏ）、情報処理装置１００は、ステップＳ３１５の判定（処理）を行う。また、集合Ｒに含まれるオブジェクト数がｋｓと一致する場合（ステップＳ３１３：Ｙｅｓ）、情報処理装置１００は、集合Ｒに含まれるオブジェクトの中でオブジェクトｙとの距離が最も長い（遠い）オブジェクトと、オブジェクトｙとの距離を、新たなｒに設定する（ステップＳ３１４）。

そして、情報処理装置１００は、オブジェクトｓの近傍集合Ｎ（Ｇ，ｓ）の要素であるオブジェクトから閾値に対応する個数のオブジェクトを選択したか否かを判定する（ステップＳ３１５）。例えば、図１の例では、情報処理装置１００は、ノードＮ２の対象ノードとした繰り返し処理において、関数ＦＣ１の出力値「ｅ_ｐ」である閾値ＴＨ１に対応する数だけノード（判定対象ノード）を選択したかを判定する。オブジェクトｓの近傍集合Ｎ（Ｇ，ｓ）の要素であるオブジェクトから閾値に対応する個数のオブジェクトを選択していない場合（ステップＳ３１５：Ｎｏ）、情報処理装置１００は、ステップＳ３０６に戻って処理を繰り返す。

オブジェクトｓの近傍集合Ｎ（Ｇ，ｓ）の要素であるオブジェクトから閾値に対応する個数のオブジェクトを選択した場合（ステップＳ３１５：Ｙｅｓ）、情報処理装置１００は、集合Ｓが空集合であるか否かを判定する（ステップＳ３１６）。なお、情報処理装置１００は、オブジェクトｓの近傍集合Ｎ（Ｇ，ｓ）から閾値に対応する個数までオブジェクトを選択する前であっても、オブジェクトｓの近傍集合Ｎ（Ｇ，ｓ）中の全オブジェクトが選択済みである場合、ステップＳ３１６の処理を行ってもよい。すなわち、情報処理装置１００は、オブジェクトｓの近傍集合Ｎ（Ｇ，ｓ）中のオブジェクト数が閾値以下であり、近傍集合Ｎ（Ｇ，ｓ）中の全オブジェクトを選択した場合、ステップＳ３１５がＹｅｓである場合と同様に、ステップＳ３１６の処理を行ってもよい。集合Ｓが空集合でない場合（ステップＳ３１６：Ｎｏ）、情報処理装置１００は、ステップＳ３０２に戻って処理を繰り返す。また、集合Ｓが空集合である場合（ステップＳ３１６：Ｙｅｓ）、情報処理装置１００は、集合Ｒを出力し、処理を終了する（ステップＳ３１７）。例えば、図１の例では、情報処理装置１００は、集合Ｒに含まれるノードＮ２、Ｎ４３、Ｎ１等をクエリＱＥ１（入力オブジェクトｙ）に対応する検索結果として出力する。また、例えば、情報処理装置１００は、集合Ｒに含まれるオブジェクト（ノード）を検索クエリ（入力オブジェクトｙ）に対応する検索結果として、検索を行った端末装置１０等へ提供してもよい。

〔６．効果〕
上述してきたように、実施形態に係る情報処理装置１００は、取得部１３１と、算出部１３３とを有する。取得部１３１は、検索対象となる複数のオブジェクトを含むデータセットと、評価用クエリと、評価用クエリを用いたデータセットの近傍検索の結果である近似正解検索結果とを取得する。算出部１３３は、データセットに対応する複数のノードがエッジにより連結された対象グラフと、評価用クエリとを用いた検索処理による検索結果のうち、近似正解検索結果に含まれない一のオブジェクトが、近似正解検索結果のうち、評価用クエリから最遠のオブジェクトである最遠オブジェクトよりも評価用クエリに近い場合、一のオブジェクトを正解とする所定の処理を行うことにより、検索処理に関連する評価指標を算出する。

このように、実施形態に係る情報処理装置１００は、検索処理による検索結果に、近似正解検索結果よりもクエリに近似するオブジェクトが含まれる場合、そのオブジェクトを正解とする所定の処理を行い、検索処理に関連する評価指標を算出することで、検索処理に関連する評価指標を適切に算出することができる。

また、実施形態に係る情報処理装置１００において、取得部１３１は、複数のオブジェクトの各々に対応する複数のノードがエッジにより連結された対象グラフを取得する。算出部１３３は、対象グラフを対象とする検索処理による検索結果のうち、一のオブジェクトが、最遠オブジェクトよりも評価用クエリに近い場合、所定の処理を行うことにより、検索処理に関連する評価指標を算出する。

このように、実施形態に係る情報処理装置１００は、複数のオブジェクトの各々に対応する複数のノードがエッジにより連結された対象グラフを用いた検索処理を対象に、検索処理に関連する評価指標を算出することで、検索処理に関連する評価指標を適切に算出することができる。

また、実施形態に係る情報処理装置１００において、取得部１３１は、データセットのうち、一部のオブジェクト群の各々に対応する複数のノードがエッジにより連結された対象グラフを取得する。算出部１３３は、対象グラフを対象とする検索処理による検索結果のうち、一のオブジェクトが、最遠オブジェクトよりも評価用クエリに近い場合、所定の処理を行うことにより、検索処理に関連する評価指標を算出する。

このように、実施形態に係る情報処理装置１００は、データセットのうち、一部のオブジェクト群の各々に対応する複数のノードがエッジにより連結された対象グラフを用いた検索処理を対象に、検索処理に関連する評価指標を算出することで、検索処理に関連する評価指標を適切に算出することができる。

また、実施形態に係る情報処理装置１００において、算出部１３３は、データセットから抽出された抽出オブジェクトに基づく評価用クエリを用いた検索処理による検索結果のうち、一のオブジェクトが、最遠オブジェクトよりも評価用クエリに近い場合、所定の処理を行うことにより、検索処理に関連する評価指標を算出する。

このように、実施形態に係る情報処理装置１００は、データセットから抽出された抽出オブジェクトに基づく評価用クエリを用いて、検索処理に関連する評価指標を算出することで、検索処理に関連する評価指標を適切に算出することができる。

また、実施形態に係る情報処理装置１００において、算出部１３３は、データセットから抽出された複数の抽出オブジェクトから生成される評価用クエリを用いた検索処理による検索結果のうち、一のオブジェクトが、最遠オブジェクトよりも評価用クエリに近い場合、所定の処理を行うことにより、検索処理に関連する評価指標を算出する。

このように、実施形態に係る情報処理装置１００は、データセットから抽出された複数の抽出オブジェクトから生成される評価用クエリを用いて、検索処理に関連する評価指標を算出することで、検索処理に関連する評価指標を適切に算出することができる。

また、実施形態に係る情報処理装置１００において、算出部１３３は、複数の抽出オブジェクトの平均を評価用クエリとする検索処理による検索結果のうち、一のオブジェクトが、最遠オブジェクトよりも評価用クエリに近い場合、所定の処理を行うことにより、検索処理に関連する評価指標を算出する。

このように、実施形態に係る情報処理装置１００は、複数の抽出オブジェクトの平均を評価用クエリとして用いて、検索処理に関連する評価指標を算出することで、検索処理に関連する評価指標を適切に算出することができる。

また、実施形態に係る情報処理装置１００において、算出部１３３は、検索処理における検索時間、距離計算回数、及び対象グラフのノードのアクセス数のうち少なくとも１つを、評価指標として算出する。

このように、実施形態に係る情報処理装置１００は、検索処理における検索時間、距離計算回数、及び対象グラフのノードのアクセス数のうち少なくとも１つを、評価指標として算出することで、検索処理に関連する評価指標を適切に算出することができる。

また、実施形態に係る情報処理装置１００において、取得部１３１は、ターゲットとする検索精度の範囲を示す精度範囲を取得する。算出部１３３は、精度範囲を用いて評価指標を算出する。

このように、実施形態に係る情報処理装置１００は、ターゲットとする検索精度の範囲を示す精度範囲を用いて評価指標を算出することで、検索処理に関連する評価指標を適切に算出することができる。

また、実施形態に係る情報処理装置１００において、取得部１３１は、再現率の範囲を示す精度範囲を取得する。

このように、実施形態に係る情報処理装置１００は、再現率の範囲を示す精度範囲を用いて評価指標を算出することで、検索処理に関連する評価指標を適切に算出することができる。

また、実施形態に係る情報処理装置１００において、算出部１３３は、精度範囲における評価指標を算出する。

このように、実施形態に係る情報処理装置１００は、精度範囲における評価指標を算出することで、検索処理に関連する評価指標を適切に算出することができる。

また、実施形態に係る情報処理装置１００において、算出部１３３は、検索処理における探索範囲を決定するための係数である検索範囲係数を変動させることにより、精度範囲における評価指標を算出する。

このように、実施形態に係る情報処理装置１００は、検索処理における探索範囲を決定するための係数である検索範囲係数を変動させることにより、精度範囲における評価指標を算出することで、検索処理に関連する評価指標を適切に算出することができる。

また、実施形態に係る情報処理装置１００において、算出部１３３は、検索精度が精度範囲に含まれる複数の検索範囲係数の値の各々に対応する複数の個別評価指標を用いて、精度範囲における評価指標を算出する。

このように、実施形態に係る情報処理装置１００は、検索精度が精度範囲に含まれる複数の検索範囲係数の値の各々に対応する複数の個別評価指標を用いることで、検索処理に関連する評価指標を適切に算出することができる。

また、実施形態に係る情報処理装置１００において、算出部１３３は、精度範囲の下限以下の検索精度になる検索範囲係数の第１値と、精度範囲の上限以上の検索精度になる検索範囲係数の第２値とを用いて、精度範囲における評価指標を算出する。

このように、実施形態に係る情報処理装置１００は、精度範囲の下限以下の第１値や精度範囲の上限以上の第２値を用いることで、検索処理に関連する評価指標を適切に算出することができる。

また、実施形態に係る情報処理装置１００において、算出部１３３は、第１値と、第２値との間を等分した複数の検索範囲係数の値の各々に対応する複数の個別評価指標を用いて、精度範囲における評価指標を算出する。

このように、実施形態に係る情報処理装置１００は、第１値と、第２値との間を等分した複数の検索範囲係数の値の各々に対応する複数の個別評価指標を用いることで、検索処理に関連する評価指標を適切に算出することができる。

また、実施形態に係る情報処理装置１００において、算出部１３３は、台形近似により、精度範囲における評価指標を算出する。

このように、実施形態に係る情報処理装置１００は、台形近似により、精度範囲における評価指標を算出することで、検索処理に関連する評価指標を適切に算出することができる。

また、実施形態に係る情報処理装置１００において、算出部１３３は、対象グラフを対象とする検索処理による検索結果のうち、一のオブジェクトが、最遠オブジェクトよりも評価用クエリに近い場合、一のオブジェクトを正解として、評価指標を算出する。

このように、実施形態に係る情報処理装置１００は、検索処理による検索結果に、近似正解検索結果よりもクエリに近似するオブジェクトが含まれる場合、そのオブジェクトを正解として、評価指標を算出することで、検索処理に関連する評価指標を適切に算出することができる。

また、実施形態に係る情報処理装置１００において、算出部１３３は、対象グラフを対象とする検索処理による検索結果のうち、一のオブジェクトが、最遠オブジェクトよりも評価用クエリに近い場合、一のオブジェクトを近似正解検索結果に追加する更新処理を行い、評価指標を算出する。

このように、実施形態に係る情報処理装置１００は、検索処理による検索結果に、近似正解検索結果よりもクエリに近似するオブジェクトが含まれる場合、そのオブジェクトを近似正解検索結果に追加する更新処理を行うことで、検索処理に関連する評価指標を適切に算出することができる。

また、実施形態に係る情報処理装置１００において、算出部１３３は、一のオブジェクトを近似正解検索結果に追加し、最遠オブジェクトを近似正解検索結果から除外する更新処理を行い、評価指標を算出する。

このように、実施形態に係る情報処理装置１００は、検索処理による検索結果に、近似正解検索結果よりもクエリに近似するオブジェクトが含まれる場合、そのオブジェクトを近似正解検索結果に追加し、最遠オブジェクトを近似正解検索結果から除外することで、検索処理に関連する評価指標を適切に算出することができる。

また、実施形態に係る情報処理装置１００において、算出部１３３は、更新処理を行った場合、評価指標を算出する処理を再度実行することにより、評価指標を算出する。

このように、実施形態に係る情報処理装置１００は、更新処理を行った場合、評価指標を算出する処理を再度実行することにより、評価指標を算出することで、検索処理に関連する評価指標を適切に算出することができる。

また、実施形態に係る情報処理装置１００において、取得部１３１は、データセットを対象とする検索に用いられる閾値を算出する関数を取得する。算出部１３３は、関数に含まれる複数のパラメータの各々の値を調整する調整処理における検索処理による検索結果のうち、一のオブジェクトが、最遠オブジェクトよりも評価用クエリに近い場合、所定の処理を行うことにより、評価指標を算出する。

このように、実施形態に係る情報処理装置１００は、データセットを対象とする検索に用いられる閾値を算出する関数に含まれる複数のパラメータの各々の値を調整する調整処理において、検索処理に関連する評価指標を適切に算出することができる。

また、実施形態に係る情報処理装置１００において、取得部１３１は、グラフの検索時に用いられる閾値を算出する関数を取得する。

このように、実施形態に係る情報処理装置１００は、グラフの検索時に用いられる閾値を算出する関数を対象とする調整処理において、検索処理に関連する評価指標を適切に算出することができる。

また、実施形態に係る情報処理装置１００において、取得部１３１は、対象グラフの検索時に参照する参照エッジ数を示す閾値を算出する関数を取得する。算出部１３３は、閾値が示す参照エッジ数による対象グラフの検索処理を含む調整処理により、複数のパラメータの各々の値を決定する。

このように、実施形態に係る情報処理装置１００は、対象グラフの検索時に参照する参照エッジ数を示す閾値を算出する関数を対象とする調整処理において、検索処理に関連する評価指標を適切に算出することができる。

また、実施形態に係る情報処理装置１００において、取得部１３１は、第１パラメータと第２パラメータとを含む関数を取得する。算出部１３３は、第１パラメータの第１値と、第２パラメータの第２値とを調整する調整処理における検索処理による検索結果のうち、一のオブジェクトが、最遠オブジェクトよりも評価用クエリに近い場合、所定の処理を行うことにより、評価指標を算出する。

このように、実施形態に係る情報処理装置１００は、第１パラメータと第２パラメータとを含む関数を対象とする調整処理において、検索処理に関連する評価指標を適切に算出することができる。

また、実施形態に係る情報処理装置１００において、取得部１３１は、検索精度が高くなるほど、第１パラメータよりも影響が強くなる第２パラメータを含む関数を取得する。

このように、実施形態に係る情報処理装置１００は、検索精度が高くなるほど、第１パラメータよりも影響が強くなる第２パラメータを含む関数を対象とする調整処理において、検索処理に関連する評価指標を適切に算出することができる。

また、実施形態に係る情報処理装置１００において、取得部１３１は、定数項である第１パラメータと、所定の値を底とする指数に含まれる第２パラメータとを含む関数を取得する。

このように、実施形態に係る情報処理装置１００は、定数項である第１パラメータと、所定の値を底とする指数に含まれる第２パラメータとを含む関数を対象とする調整処理において、検索処理に関連する評価指標を適切に算出することができる。

また、実施形態に係る情報処理装置１００において、取得部１３１は、検索処理における探索範囲を決定するための係数である検索範囲係数を含む関数を取得する。

このように、実施形態に係る情報処理装置１００は、検索処理における探索範囲を決定するための係数である検索範囲係数を含む関数を対象とする調整処理において、検索処理に関連する評価指標を適切に算出することができる。

また、実施形態に係る情報処理装置１００において、取得部１３１は、第２パラメータと検索範囲係数との掛け合わせを含む関数を取得する。

このように、実施形態に係る情報処理装置１００は、第２パラメータと検索範囲係数との掛け合わせを含む関数を対象とする調整処理において、検索処理に関連する評価指標を適切に算出することができる。

〔７．ハードウェア構成〕
上述してきた実施形態に係る情報処理装置１００は、例えば図１６に示すような構成のコンピュータ１０００によって実現される。図１６は、情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ１０００は、ＣＰＵ１１００、ＲＡＭ１２００、ＲＯＭ（Read Only Memory）１３００、ＨＤＤ（Hard Disk Drive）１４００、通信インターフェイス（Ｉ／Ｆ）１５００、入出力インターフェイス（Ｉ／Ｆ）１６００、及びメディアインターフェイス（Ｉ／Ｆ）１７００を有する。

ＣＰＵ１１００は、ＲＯＭ１３００またはＨＤＤ１４００に格納されたプログラムに基づいて動作し、各部の制御を行う。ＲＯＭ１３００は、コンピュータ１０００の起動時にＣＰＵ１１００によって実行されるブートプログラムや、コンピュータ１０００のハードウェアに依存するプログラム等を格納する。

ＨＤＤ１４００は、ＣＰＵ１１００によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を格納する。通信インターフェイス１５００は、ネットワークＮを介して他の機器からデータを受信してＣＰＵ１１００へ送り、ＣＰＵ１１００が生成したデータをネットワークＮを介して他の機器へ送信する。

ＣＰＵ１１００は、入出力インターフェイス１６００を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。ＣＰＵ１１００は、入出力インターフェイス１６００を介して、入力装置からデータを取得する。また、ＣＰＵ１１００は、生成したデータを入出力インターフェイス１６００を介して出力装置へ出力する。

メディアインターフェイス１７００は、記録媒体１８００に格納されたプログラムまたはデータを読み取り、ＲＡＭ１２００を介してＣＰＵ１１００に提供する。ＣＰＵ１１００は、かかるプログラムを、メディアインターフェイス１７００を介して記録媒体１８００からＲＡＭ１２００上にロードし、ロードしたプログラムを実行する。記録媒体１８００は、例えばＤＶＤ（Digital Versatile Disc）、ＰＤ（Phase change rewritable Disk）等の光学記録媒体、ＭＯ（Magneto-Optical disk）等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。

例えば、コンピュータ１０００が実施形態に係る情報処理装置１００として機能する場合、コンピュータ１０００のＣＰＵ１１００は、ＲＡＭ１２００上にロードされたプログラムを実行することにより、制御部１３０の機能を実現する。コンピュータ１０００のＣＰＵ１１００は、これらのプログラムを記録媒体１８００から読み取って実行するが、他の例として、他の装置からネットワークＮを介してこれらのプログラムを取得してもよい。

以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の行に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。

〔８．その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。

また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。

また、上述してきた各実施形態に記載された各処理は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。

また、上述してきた「部（section、module、unit）」は、「手段」や「回路」などに読み替えることができる。例えば、取得部は、取得手段や取得回路に読み替えることができる。

１情報処理システム
１００情報処理装置
１２１オブジェクト情報記憶部
１２２ツリー情報記憶部
１２３グラフ情報記憶部
１２４近似正解検索結果情報記憶部
１２５関数情報記憶部
１２６調整関連情報記憶部
１３０制御部
１３１取得部
１３２生成部
１３３算出部
１３４決定部
１３５抽出部
１３６提供部
１０端末装置
５０情報提供装置
Ｎネットワーク

Claims

検索対象となる複数のオブジェクトを含むデータセットと、評価用クエリと、前記評価用クエリを用いた前記データセットの近傍検索の結果である近似正解検索結果とを取得する取得部と、
前記データセットに対応する複数のノードがエッジにより連結された対象グラフと、前記評価用クエリとを用いた検索処理による検索結果のうち、前記近似正解検索結果に含まれない一のオブジェクトが、前記近似正解検索結果のうち、前記評価用クエリから最遠のオブジェクトである最遠オブジェクトよりも前記評価用クエリに近い場合、前記一のオブジェクトを正解とする所定の処理を行うことにより、前記検索処理に関連する評価指標を算出する算出部と、
を備えることを特徴とする情報処理装置。
前記取得部は、
前記複数のオブジェクトの各々に対応する複数のノードがエッジにより連結された前記対象グラフを取得し、
前記算出部は、
前記対象グラフを対象とする前記検索処理による前記検索結果のうち、前記一のオブジェクトが、前記最遠オブジェクトよりも前記評価用クエリに近い場合、前記所定の処理を行うことにより、前記検索処理に関連する評価指標を算出する
ことを特徴とする請求項１に記載の情報処理装置。
前記取得部は、
前記データセットのうち、一部のオブジェクト群の各々に対応する複数のノードがエッジにより連結された前記対象グラフを取得し、
前記算出部は、
前記対象グラフを対象とする前記検索処理による前記検索結果のうち、前記一のオブジェクトが、前記最遠オブジェクトよりも前記評価用クエリに近い場合、前記所定の処理を行うことにより、前記検索処理に関連する評価指標を算出する
ことを特徴とする請求項１に記載の情報処理装置。
前記算出部は、
前記データセットから抽出された抽出オブジェクトに基づく評価用クエリを用いた前記検索処理による前記検索結果のうち、前記一のオブジェクトが、前記最遠オブジェクトよりも前記評価用クエリに近い場合、前記所定の処理を行うことにより、前記検索処理に関連する評価指標を算出する
ことを特徴とする請求項１～３のいずれか１項に記載の情報処理装置。
前記算出部は、
前記データセットから抽出された複数の抽出オブジェクトから生成される評価用クエリを用いた前記検索処理による前記検索結果のうち、前記一のオブジェクトが、前記最遠オブジェクトよりも前記評価用クエリに近い場合、前記所定の処理を行うことにより、前記検索処理に関連する評価指標を算出する
ことを特徴とする請求項１～３のいずれか１項に記載の情報処理装置。
前記算出部は、
前記複数の抽出オブジェクトの平均を前記評価用クエリとする前記検索処理による前記検索結果のうち、前記一のオブジェクトが、前記最遠オブジェクトよりも前記評価用クエリに近い場合、前記所定の処理を行うことにより、前記検索処理に関連する評価指標を算出する
ことを特徴とする請求項５に記載の情報処理装置。
前記算出部は、
前記検索処理における検索時間、距離計算回数、及び前記対象グラフのノードのアクセス数のうち少なくとも１つを、前記評価指標として算出する
ことを特徴とする請求項１～６のいずれか１項に記載の情報処理装置。
前記取得部は、
ターゲットとする検索精度の範囲を示す精度範囲を取得し、
前記算出部は、
前記精度範囲を用いて前記評価指標を算出する
ことを特徴とする請求項１～７のいずれか１項に記載の情報処理装置。
前記取得部は、
再現率の範囲を示す前記精度範囲を取得する
ことを特徴とする請求項８に記載の情報処理装置。
前記算出部は、
前記精度範囲における前記評価指標を算出する
ことを特徴とする請求項８または請求項９に記載の情報処理装置。
前記算出部は、
前記検索処理における探索範囲を決定するための係数である検索範囲係数を変動させることにより、前記精度範囲における前記評価指標を算出する
ことを特徴とする請求項８～１０のいずれか１項に記載の情報処理装置。
前記算出部は、
前記検索精度が前記精度範囲に含まれる複数の検索範囲係数の値の各々に対応する複数の個別評価指標を用いて、前記精度範囲における前記評価指標を算出する
ことを特徴とする請求項１１に記載の情報処理装置。
前記算出部は、
前記精度範囲の下限以下の前記検索精度になる検索範囲係数の第１値と、前記精度範囲の上限以上の前記検索精度になる検索範囲係数の第２値とを用いて、前記精度範囲における前記評価指標を算出する
ことを特徴とする請求項１１または請求項１２に記載の情報処理装置。
前記算出部は、
前記第１値と、前記第２値との間を等分した複数の検索範囲係数の値の各々に対応する複数の個別評価指標を用いて、前記精度範囲における前記評価指標を算出する
ことを特徴とする請求項１３に記載の情報処理装置。
前記算出部は、
台形近似により、前記精度範囲における前記評価指標を算出する
ことを特徴とする請求項８～１４のいずれか１項に記載の情報処理装置。
前記算出部は、
前記対象グラフを対象とする前記検索処理による前記検索結果のうち、前記一のオブジェクトが、前記最遠オブジェクトよりも前記評価用クエリに近い場合、前記一のオブジェクトを正解として、前記評価指標を算出する
ことを特徴とする請求項１～１５のいずれか１項に記載の情報処理装置。
前記算出部は、
前記対象グラフを対象とする前記検索処理による前記検索結果のうち、前記一のオブジェクトが、前記最遠オブジェクトよりも前記評価用クエリに近い場合、前記一のオブジェクトを前記近似正解検索結果に追加する更新処理を行い、前記評価指標を算出する
ことを特徴とする請求項１～１５のいずれか１項に記載の情報処理装置。
前記算出部は、
前記一のオブジェクトを前記近似正解検索結果に追加し、前記最遠オブジェクトを前記近似正解検索結果から除外する前記更新処理を行い、前記評価指標を算出する
ことを特徴とする請求項１７に記載の情報処理装置。
前記算出部は、
前記更新処理を行った場合、前記評価指標を算出する処理を再度実行することにより、前記評価指標を算出する
ことを特徴とする請求項１７または請求項１８に記載の情報処理装置。
前記取得部は、
前記データセットを対象とする検索に用いられる閾値を算出する関数を取得し、
前記算出部は、
前記関数に含まれる複数のパラメータの各々の値を調整する調整処理における前記検索処理による前記検索結果のうち、前記一のオブジェクトが、前記最遠オブジェクトよりも前記評価用クエリに近い場合、前記所定の処理を行うことにより、前記評価指標を算出する
ことを特徴とする請求項１～１９のいずれか１項に記載の情報処理装置。
前記取得部は、
グラフの検索時に用いられる前記閾値を算出する前記関数を取得する
ことを特徴とする請求項２０に記載の情報処理装置。
前記取得部は、
前記対象グラフの検索時に参照する参照エッジ数を示す前記閾値を算出する前記関数を取得し、
前記算出部は、
前記閾値が示す前記参照エッジ数による前記対象グラフの前記検索処理を含む前記調整処理により、前記複数のパラメータの各々の値を決定する
ことを特徴とする請求項２０または請求項２１に記載の情報処理装置。
前記取得部は、
第１パラメータと第２パラメータとを含む前記関数を取得し、
前記算出部は、
前記第１パラメータの第１値と、前記第２パラメータの第２値とを調整する前記調整処理における前記検索処理による前記検索結果のうち、前記一のオブジェクトが、前記最遠オブジェクトよりも前記評価用クエリに近い場合、前記所定の処理を行うことにより、前記評価指標を算出する
ことを特徴とする請求項２０～２２のいずれか１項に記載の情報処理装置。
前記取得部は、
検索精度が高くなるほど、前記第１パラメータよりも影響が強くなる前記第２パラメータを含む前記関数を取得する
ことを特徴とする請求項２３に記載の情報処理装置。
前記取得部は、
定数項である前記第１パラメータと、所定の値を底とする指数に含まれる前記第２パラメータとを含む前記関数を取得する
ことを特徴とする請求項２３または請求項２４に記載の情報処理装置。
前記取得部は、
前記検索処理における探索範囲を決定するための係数である検索範囲係数を含む前記関数を取得する
ことを特徴とする請求項２５に記載の情報処理装置。
前記取得部は、
前記第２パラメータと前記検索範囲係数との掛け合わせを含む前記関数を取得する
ことを特徴とする請求項２６に記載の情報処理装置。
コンピュータが実行する情報処理方法であって、
検索対象となる複数のオブジェクトを含むデータセットと、評価用クエリと、前記評価用クエリを用いた前記データセットの近傍検索の結果である近似正解検索結果とを取得する取得工程と、
前記データセットに対応する複数のノードがエッジにより連結された対象グラフと、前記評価用クエリとを用いた検索処理による検索結果のうち、前記近似正解検索結果に含まれない一のオブジェクトが、前記近似正解検索結果のうち、前記評価用クエリから最遠のオブジェクトである最遠オブジェクトよりも前記評価用クエリに近い場合、前記一のオブジェクトを正解とする所定の処理を行うことにより、前記検索処理に関連する評価指標を算出する算出工程と、
を含むことを特徴とする情報処理方法。
検索対象となる複数のオブジェクトを含むデータセットと、評価用クエリと、前記評価用クエリを用いた前記データセットの近傍検索の結果である近似正解検索結果とを取得する取得手順と、
前記データセットに対応する複数のノードがエッジにより連結された対象グラフと、前記評価用クエリとを用いた検索処理による検索結果のうち、前記近似正解検索結果に含まれない一のオブジェクトが、前記近似正解検索結果のうち、前記評価用クエリから最遠のオブジェクトである最遠オブジェクトよりも前記評価用クエリに近い場合、前記一のオブジェクトを正解とする所定の処理を行うことにより、前記検索処理に関連する評価指標を算出する算出手順と、
をコンピュータに実行させることを特徴とする情報処理プログラム。