以下に、本願に係る情報処理装置、情報処理方法、及び情報処理プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る情報処理装置、情報処理方法、及び情報処理プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
(実施形態)
〔1.情報処理〕
図1を用いて、実施形態に係る情報処理の一例について説明する。図1は、実施形態に係る情報処理の一例を示す図である。図1では、情報処理装置100がアイテムの一例として、所定の電子商取引サービスで販売される商品をグラフ構造化したグラフデータ(グラフ情報)を検索することにより、類似するアイテムである類似アイテムを対象アイテムとして抽出する場合を示す。なお、ここでいう商品には、所定の電子商取引サービスで販売可能であればどのような対象であってもよく、サービス等が含まれてもよい。また、図1では、情報処理装置100がグラフ情報の検索時に、後述する特別エッジが連結されたノードに到達した場合、当該ノードと特別エッジにより連結された他のノードを対象アイテムとして抽出する場合を示す。図1では、情報処理装置100は、各アイテムに対応するベクトルデータ(「ベクトル情報」や、単に「ベクトル」ともいう)を用いてアイテムをグラフ構造化したグラフ情報を用いる。なお、情報処理装置100が用いる情報は、ベクトルに限らず、各アイテムの類似性を表現可能な情報であれば、どのような形式の情報であってもよい。例えば、情報処理装置100は、各アイテムに対応する所定のデータや値を用いてアイテムをグラフ構造化したグラフ情報を用いてもよい。例えば、情報処理装置100は、各アイテムから生成された所定の数値(例えば2進数の値や16進数の値)を用いてアイテムをグラフ構造化したグラフ情報を用いてもよい。また、図1の例では、商品(商品情報)をアイテムの一例として示すが、アイテムは、商品(商品情報)に限らず、記事コンテンツや動画コンテンツ等の種々の対象であってもよい。すなわち、対象とするアイテム(オブジェクト)は、各アイテム間の類似性を表現可能であれば、どのようなアイテム(情報)であってもよい。
〔1−1.グラフ情報について〕
また、情報処理装置100は、図1中のグラフ情報GR11に示すように、各ベクトル(ノード)が有向エッジにより連結されたグラフデータを用いて情報処理を行う。なお、図1中のグラフ情報GR11に示すようなグラフ情報は、情報処理装置100が生成してもよいし、情報処理装置100は、図1中のグラフ情報GR11に示すようなグラフ情報を情報提供装置50(図2参照)等の他の外部装置から取得してもよい。
また、ここでいう、有向エッジとは、一方向にしかデータを辿れないエッジを意味する。以下では、エッジにより辿る元、すなわち始点となるノードを参照元とし、エッジにより辿る先、すなわち終点となるノードを参照先とする。例えば、所定のノード「A」から所定のノード「B」に連結される有向エッジとは、参照元をノード「A」とし、参照先をノード「B」とするエッジであることを示す。なお、各ノードを連結するエッジは、有向エッジに限らず、種々のエッジであってもよい。例えば、各ノードを連結するエッジは、ノードを連結する方向のないエッジであってもよい。例えば、各ノードを連結するエッジは、相互に参照可能なエッジであってもよい。例えば、各ノードを連結するエッジは、全て双方向エッジであってもよい。
例えば、このようにノード「A」を参照元とするエッジをノード「A」の出力エッジという。また、例えば、このようにノード「B」を参照先とするエッジをノード「B」の入力エッジという。すなわち、ここでいう出力エッジ及び入力エッジとは、一の有向エッジをその有向エッジが連結する2つのノードのうち、いずれのノードを中心として捉えるかの相違であり、一の有向エッジが出力エッジ及び入力エッジになる。すなわち、出力エッジ及び入力エッジは、相対的な概念であって、一の有向エッジについて、参照元となるノードを中心として捉えた場合に出力エッジとなり、参照先となるノードを中心として捉えた場合に入力エッジとなる。なお、本実施形態においては、エッジについては、出力エッジや入力エッジ等の有向エッジを対象とするため、以下では、有向エッジを単に「エッジ」と記載する場合がある。
例えば、情報処理装置100は、数百万〜数億等の単位の膨大なアイテムに対応するノードを対象に処理を行うが、図面においてはその一部のみを図示する。図1の例では、説明を簡単にするために、8個のノードを図示して処理の概要を説明する。例えば、情報処理装置100は、図1中のグラフ情報GR11に示すように、ノードN1、N2、N3等に示すような複数のノード(ベクトル)を含むグラフ情報を取得する。また、図1の例では、グラフ情報GR11における各ノードは、そのノードとの間の距離が近い方から所定数のノードへのエッジ(出力エッジ)が連結される。例えば、所定数は、目的や用途等に応じて、2や5や10や100等の種々の値であってもよい。例えば、所定数が2である場合、ノードN1からは、ノードN1からの距離が最も近いノード及び2番目に距離が近い2つのノードに出力エッジが連結される。なお、類似度を示す指標としての距離は、ベクトル(N次元ベクトル)間の距離として適用可能であれば、どのような距離であってもよく、例えば、ユークリッド距離やマハラノビス距離やコサイン距離等の種々の距離が用いられてもよい。
また、このように「ノードN*(*は任意の数値)」と記載した場合、そのノードはノードID「N*」により識別されるノードであることを示す。例えば、「ノードN1」と記載した場合、そのノードはノードID「N1」により識別されるノードである。
また、図1中のグラフ情報GR11では、ノードN10は、ノードN7へ向かう有向エッジであるエッジE7が連結される。すなわち、ノードN10は、ノードN7とエッジE7により連結される。このように「エッジE*(*は任意の数値)」と記載した場合、そのエッジはエッジID「E*」により識別されるエッジであることを示す。例えば、「エッジE11」と記載した場合、そのエッジはエッジID「E11」により識別されるエッジである。例えば、ノードN10を参照元とし、ノードN7を参照先として連結されるエッジE7により、ノードN10からノードN7に辿ることが可能となる。この場合、有向エッジであるエッジE7は、ノードN10を中心として識別される場合、出力エッジとなり、ノードN7を中心として識別される場合、入力エッジとなる。また、図1のグラフ情報GR11中の双方向矢印は、両方のノードから他方のノードへの有向エッジが連結されることを示す。例えば、グラフ情報GR11中のノードN2とノードN451との間の双方向矢印は、ノードN2からノードN451へ向かう有向エッジと、ノードN451からノードN2へ向かう有向エッジとの2つのエッジが連結されることを示す。
また、図1中のグラフ情報GR11は、ユークリッド空間であってもよい。また、図1に示すグラフ情報GR11は、各ベクトル間の距離等の説明のための概念的な図であり、グラフ情報GR11は、多次元空間である。例えば、図1に示すグラフ情報GR11は、平面上に図示するため2次元の態様にて図示されるが、例えば100次元や1000次元等の多次元空間であるものとする。
ここで、ベクトルデータ間の距離は、アイテムの類似性を示し、距離が近いほど類似している。本実施形態においては、グラフ情報GR11における各ノードの距離を対応する各オブジェクト間の類似度とする。例えば、各ノードに対応するアイテムの類似性が、グラフ情報GR11内におけるノード間の距離として写像されているものとする。例えば、各ノードに対応する概念間の類似度が各ノード間の距離に写像されているものとする。ここで、図1に示す例においては、グラフ情報GR11における各ノード間の距離が短いオブジェクト同士の類似度が高く、グラフ情報GR11における各ノード間の距離が長いオブジェクト同士の類似度が低い。例えば、図1中のグラフ情報GR11において、ノードID「N35」により識別されるノードと、ノードID「N693」により識別されるノードとは近接している、すなわち距離が短い。そのため、ノードID「N35」により識別されるノードに対応するオブジェクトと、ノードID「N693」により識別されるノードに対応するオブジェクトとは類似度が高いことを示す。
また、例えば、図1中のグラフ情報GR11において、ノードID「N7」により識別されるノードと、ノードID「N2」により識別されるノードとは遠隔にある、すなわち距離が長い。そのため、ノードID「N7」により識別されるノードに対応するオブジェクトと、ノードID「N2」により識別されるノードに対応するオブジェクトとは類似度が低いことを示す。
〔1−2.ベクトルの生成例〕
また、ここでいう、各ノード(ベクトル)は、各オブジェクト(アイテム)に対応する。アイテム情報が様々なアイテムの状態を示す数値データであれば、それをベクトルデータとして、そのまま扱うことも可能である。しかし、アイテム情報が、テキスト、画像、または、音声であったりする場合には、ベクトルデータへの変換が必要となる。そこで、図1の例では、各アイテムのアイテム情報から抽出された特徴量により生成された多次元(N次元)のベクトルがオブジェクトであってもよい。
例えば、情報処理装置100は、アイテム情報の特徴を抽出するモデルを用いて各アイテムのアイテム情報からN次元ベクトルを生成してもよい。図1の例では、情報処理装置100は、モデル情報記憶部124(図7参照)に示すように、モデルID「M1」により識別されるモデル(モデルM1)を用いて、各アイテムのアイテム情報からベクトルを生成する。上記のように、「モデルM*(*は任意の数値)」と記載した場合、そのモデルはモデルID「M*」により識別されるモデルであることを示す。例えば、「モデルM1」と記載した場合、そのモデルはモデルID「M1」により識別されるモデルである。また、モデル情報記憶部124に示すように、モデルM1は用途「特徴抽出(商品)」、すなわちアイテムのデータ(アイテム情報)からの特徴抽出のために用いられるモデルであり、その具体的なモデルデータが「モデルデータMDT1」であることを示す。
例えば、情報処理装置100は、モデルM1に任意のアイテムのアイテム情報を入力することにより、モデルM1中の各要素(ニューロン)の値を演算し、入力したアイテム情報と同様の情報を出力する。例えば、情報処理装置100は、中間層の各要素(ニューロン)の値を特徴量として抽出し、各アイテムに対応するN次元のベクトルデータを生成してもよい。
ここで、図11を用いて、各アイテムに対応するベクトルデータの生成の一例を示す。図11は、実施形態に係る特徴量の抽出の一例を示す図である。図11は、モデルM1の概念図である。なお、図11では、各要素(ニューロン)の各接続関係を示す線の図示を省略する。図11に示すように、モデルM1は、入力層ILと、中間層CLと、出力層OLとを含む。例えば、モデルM1の入力層ILは、アイテム情報が入力される層である。また、出力層OLは、入力層ILへの入力に応じて、入力されたアイテム情報と同様の情報を出力される層である。
また、例えば、中間層CLの中央部の最も圧縮された圧縮層RPは、入力されたアイテム情報の特徴を表現する層である。例えば、モデルM1の中間層CLにおいて、入力層ILから圧縮層RPまでの間は、エンコードの処理を行う部分に対応する。モデルM1の中間層CLにおいて、入力層ILから圧縮層RPまでの間は、入力されたアイテム情報の特徴を圧縮する処理を行う部分に対応する。例えば、モデルM1の中間層CLにおいて、圧縮層RPから出力層OLまでの間は、デコードの処理を行う部分に対応する。モデルM1の中間層CLにおいて、圧縮層RPから出力層OLまでの間は、圧縮されたアイテム情報を復元する処理を行う部分に対応する。
例えば、情報処理装置100は、圧縮層RPに含まれるニューロンNL1やニューロンNL2等の情報をベクトルに用いてもよい。例えば、情報処理装置100は、あるアイテムのアイテム情報が入力された場合に、算出されるニューロンNL1に対応する値VE1やニューロンNL2に対応する値VE2をベクトルの要素(一の次元の値)として抽出してもよい。例えば、情報処理装置100は、あるアイテムのアイテム情報が入力された場合に、算出されるニューロンNL1に対応する値VE1をそのアイテムのベクトルの1次元目の要素として抽出してもよい。また、例えば、情報処理装置100は、あるアイテムのアイテム情報が入力された場合に、算出されるニューロンNL2に対応する値VE2をそのアイテムのベクトルの2次元目の要素として抽出してもよい。このように、情報処理装置100は、各アイテムのアイテム情報をモデルM1に入力することにより、各アイテムに対応するベクトルを生成してもよい。なお、情報処理装置100は、各アイテムに対応するベクトルを情報提供装置50等の他の外部装置から取得してもよい。なお、情報処理装置100は、ベクトルの各要素として、各ニューロンに対応する値自体を用いてもよいし、各ニューロンに対応する値に所定の係数を乗算した値を用いてもよい。また、図1の例では説明を簡単にするために、ベクトルの各要素(値)が整数である場合を示すが、ベクトルの各要素(値)は、小数点以下の数値を含む実数であってもよい。
なお、情報処理装置100は、圧縮層RPの要素(ニューロン)に限らず、中間層CL中の他の要素(ニューロン)の情報をベクトルに用いてもよい。例えば、情報処理装置100は、エンコード部分のニューロンNL3やデコード部分のニューロンNL4等の情報をベクトルに用いてもよい。例えば、情報処理装置100は、あるアイテムのアイテム情報が入力された場合に、算出されるニューロンNL3に対応する値VE3やニューロンNL4に対応する値VE4をベクトルの要素(一の次元の値)として抽出してもよい。なお、上記は、一例であり、情報処理装置100は、オートエンコーダに限らず、種々のモデルを用いて、アイテム情報からの特徴抽出を行ってもよい。例えば、セール用等の所定の目的に適したアイテムと適さないアイテムを識別するように学習させたモデルを生成して、その中間層をベクトルデータとして抽出しても良い。また、例えば、トリプレットロス(triplet loss)といった類似性を学習する方法によりモデルを生成しても良い。また、情報処理装置100は、モデルを用いずに、特徴抽出を行ってもよい。例えば、情報処理装置100は、情報処理装置100の管理者等が設定して特徴(素性)に対応する情報をアイテム情報から抽出し、ベクトルを生成してもよい。例えば、情報処理装置100は、アイテムの商品カテゴリ、タイトル、説明文、画像情報、製造元、サイズ等の特徴(素性)に対応する情報をアイテム情報から抽出し、ベクトルを生成してもよい。
また、例えば、情報処理装置100は、情報提供装置50等の他の外部装置からモデルM1を取得してもよい。なお、情報処理装置100は、アイテム情報記憶部121(図4参照)に記憶された各アイテムのアイテム情報IDT1、IDT2、IDT451等を入力として、モデルM1を生成してもよい。例えば、情報処理装置100は、各アイテムのアイテム情報IDT1、IDT2、IDT451等を入力として、モデルM1を生成してもよい。例えば、アイテム情報IDT1、IDT2、IDT451等は、アイテムの商品カテゴリ、タイトル、説明文、画像情報、製造元、サイズ等を含んでもよい。例えば、商品等がアイテムである場合におけるアイテム情報(商品情報)は、商品カテゴリ、タイトル、説明文、画像情報、製造元、サイズ等に関する情報を含んでもよい。例えば、アイテム情報は、対応する商品の商品カテゴリが飲料水や酒類や調味料等のいずれであるかを示す情報を含んでもよい。例えば、アイテム情報は、対応する商品の商品カテゴリがビールやワインやケッチャプやソース等のいずれであるかを示す詳細な商品カテゴリを示す情報を含んでもよい。
また、例えば、アイテム情報は、対応する商品が撮像された画像情報を含んでもよい。例えば、アイテム情報は、対応する商品の製造元がどのメーカであるかを示す情報を含んでもよい。例えば、アイテム情報は、対応する商品の内容量等どのようなサイズであるかを示す情報を含んでもよい。例えば、アイテム情報は、対応する商品のターゲットとするユーザが20代であることを示す情報や対応する商品のターゲットとするユーザが女性であることを示す情報等の商品のターゲットを示す情報を含んでもよい。なお、上記は一例であり、アイテム情報には、どのような情報が含まれてもよい。例えば、アイテムが記事コンテンツである場合、アイテム情報は、記事のタイトルや本文や画像等の種々の情報が含まれてもよい。すなわち、情報処理装置100は、アイテムとなる対象に応じて、アイテム情報を適宜用いて、処理を行ってもよい。
情報処理装置100は、アイテムのアイテム情報が入力される入力層と、出力層と、入力層から出力層までのいずれかの層であって出力層以外の層に属する第1要素と、第1要素と第1要素の重みとに基づいて値が算出される第2要素と、を含み、入力層に入力されたアイテム情報に対し、出力層以外の各層に属する各要素を第1要素として、第1要素と第1要素の重みとに基づく演算を行うことにより、入力層に入力される情報と同様の情報を出力層から出力するモデルM1を生成してもよい。なお、情報処理装置100は、ベクトル生成に用いるモデルを情報提供装置50等の他の外部装置から取得してもよい。
〔1−3.処理例〕
ここから、グラフ情報を用いた処理について説明する。図1の例では、特別エッジの追加について説明した後、その特別エッジを含むグラフ情報を用いた情報処理について説明する。ここでいう特別エッジは、「エッジE*(*は任意の数値)」と記載されるエッジを連結する観点(基準)とは、異なる観点(基準)による所定の条件を満たすノード間を連結するエッジであってもよい。例えば、特別エッジは、アイテム情報の類似性とは異なる観点(基準)による所定の条件を満たすノード間を連結するエッジである。すなわち、特別エッジは、グラフ情報に通常とは異なる観点(基準)を導入し、グラフ情報を拡張するエッジ(拡張エッジ)である。
以下では、ステップS11〜S13の処理により、グラフ情報GR11に追加されるエッジをエッジ特別とし、それ以外のエッジを「通常エッジ」と記載する場合がある。エッジID「E*(*は任意の数値)」により識別されるエッジを「通常エッジ」と記載する場合がある。また、エッジID「SE*(*は任意の数値)」により識別されるエッジを「特別エッジ」と記載する場合がある。すなわち、「エッジE*(*は任意の数値)」と記載されるエッジは「通常エッジ」であり、「特別エッジSE*(*は任意の数値)」と記載されるエッジは「特別エッジ」である。
図1の例では、特別エッジの追加の一例として、商品であるアイテムがユーザに一緒に購入されている複数のアイテムが特別エッジで連結される場合を示す。すなわち、図1の例では、情報処理装置100は、ユーザの購買行動において、合わせ購入の対象となっている複数のアイテムを、アイテム間の類似性に関わらず特別エッジで連結する場合を一例として示す。
まず、情報処理装置100は、所定の履歴を示すログを取得する(ステップS11)。情報処理装置100は、所定の期間におけるユーザの行動を示す履歴情報を取得する。例えば、情報処理装置100は、履歴情報記憶部125(図8参照)から履歴情報を取得する。ここでいう所定の期間は、目的に応じて種々の時間が設定されてもよく、1時間や3日や2週間や1ヶ月等の種々の期間であってもよい。図1の例では、所定の期間は、日時#11〜#13等を含む1週間であるものとし、収集対象期間と記載する場合がある。
例えば、情報処理装置100は、ログ一覧LGT11に示すように、日時#11〜#13等を含む収集対象期間におけるユーザの行動履歴を取得する。図1の例では、図示を省略するが、情報処理装置100は、各行動を行ったユーザの情報を含む履歴情報を取得してもよい。
「日時」は、対応する行動が行われた日時を示す。なお、日時#11〜日時#13等は、対応する行動が行われた具体的な日時であるものとする。「対象アイテム#1(購入商品#1)」、「対象アイテム#2(購入商品#2)」等は、対応する行動において共通して対象となったアイテムを示す。図1の例では、「対象アイテム#1(購入商品#1)」、「対象アイテム#2(購入商品#2)」等は、対応する行動において併せて購入されたアイテム(商品)を示す。
図1に示す例において、収集対象期間内の日時#11においてアイテム#35とアイテム#831が合わせて購入されたことを示す。また、収集対象期間内の日時#11においてアイテム#1は単体で購入されたことを示す。また、収集対象期間内の日時#11においてアイテム#35とアイテム#831が合わせて購入されたことを示す。
そして、情報処理装置100は、ログ一覧LGT11に示すような履歴情報に基づいて、特別な関連性を有するアイテムを判定する(ステップS12)。例えば、情報処理装置100は、ログ一覧LGT11において、1つの行動における対象として一緒に含まれるようなアイテム同士を特別な関連性を有するアイテムと判定する。
例えば、情報処理装置100は、所定の期間におけるユーザ群の行動において、行動の対象として共起する回数が所定の閾値以上である複数のアイテムを特別な関連性を有するアイテムであると判定する。例えば、情報処理装置100は、所定の期間において併せて購入される回数が所定の閾値以上である複数の商品である複数のアイテムに各々対応する複数のノードを特別な関連性を有するアイテムであると判定する。なお、アイテム同士を特別な関連性は、上記に限らず、グラフ情報を生成した際の観点とは異なる観点であり、アイテム間の有意な関係であれば、どのような関係であってもよい。
例えば、情報処理装置100は、日時#11〜#13等を含む収集対象期間内において、所定の閾値(例えば、1000回等)以上合せて購入された複数のノードを、特別な関連性を有するアイテムであると判定する。図1の例では、情報処理装置100は、収集対象期間内において、アイテム#35とアイテム#831との2つのアイテム(商品)が所定の閾値以上合せて購入されたと判定する。そして、情報処理装置100は、アイテム#35とアイテム#831とを、特別な関連性を有するアイテムであると判定する。そのため、情報処理装置100は、アイテム#35とアイテム#831との間に特別エッジを追加すると判定する。
そして、情報処理装置100は、特別な関連性を有するアイテム間を連結する特別エッジを追加する。図1の例では、情報処理装置100は、特別エッジ一覧SEL11に示すような、特別エッジSE35や特別エッジSE831を追加する。
情報処理装置100は、ノードN35からノードN831に連結される特別エッジSE35を生成する。情報処理装置100は、ノードN35を参照元とし、ノードN831を参照先とする特別エッジSE35を生成する。情報処理装置100は、特別エッジSE35の情報をグラフ情報記憶部123(図6参照)に追加(登録)する。
また、情報処理装置100は、ノードN831からノードN35に連結される特別エッジSE831を生成する。情報処理装置100は、ノードN831を参照元とし、ノードN35を参照先とする特別エッジSE831を生成する。情報処理装置100は、特別エッジSE831の情報をグラフ情報記憶部123(図6参照)に追加(登録)する。
例えば、情報処理装置100は、図1中の情報群INF11に示すように、グラフ情報GR11に、点線で示す特別エッジSE35や特別エッジSE831(図示省略)を追加する。これにより、情報処理装置100は、特別な関連性を有するアイテム間を特別エッジで連結したグラフ情報を生成する。
ここから、特別エッジSE35が追加されたグラフ情報GR11を用いた情報提供を一例として説明する。情報処理装置100は、ユーザから一のアイテムのアイテム情報を取得し、一のアイテムに類似するアイテムに基づいてサービスを提供する場合を一例として説明する。図1の例では、端末装置10は、ユーザU1により利用されるスマートフォンであり、ユーザU1がアイテムである商品の商品情報を閲覧している場合を示す。
まず、端末装置10は、アイテムXのアイテム情報IDT11を情報処理装置100へ送信する。図1の例では、アイテム情報IDT11等は、アイテム(商品)の商品カテゴリ、タイトル、説明文、画像情報、製造元、サイズ等に関する情報を含む。なお、アイテム情報IDT11等は、アイテム(商品)の説明文(文字情報)のみであってもよい。
そして、情報処理装置100は、一のアイテムに関するアイテム情報を取得する(ステップS14)。図1の例では、情報処理装置100は、ユーザU1の端末装置10からアイテムXに関するアイテム情報IDT11を取得する。なお、情報処理装置100は、アイテムXが携帯する端末装置10(図2参照)からアイテムXに関するアイテム情報IDT11を取得する。
そして、情報処理装置100は、一のアイテムに対応するアイテム情報からグラフ情報の探索に用いるベクトルを生成する。図1の例では、情報処理装置100は、処理群PS11に示すような処理により、アイテムXに対応するベクトルを生成する。情報処理装置100は、アイテムXに関するアイテム情報IDT11をモデルM1に入力する(ステップS15)。具体的には、情報処理装置100は、アイテムXのアイテム情報IDT11をモデルM1に入力する。そして、情報処理装置100は、アイテム情報IDT11の入力後のモデルM1中の情報を用いて、ベクトルを生成する(ステップS16)。例えば、情報処理装置100は、アイテム情報IDT11が入力されたモデルM1中の各要素を用いて、ベクトルデータを生成する。
図1の例では、情報処理装置100は、アイテム情報IDT11が入力されたモデルM1中の各要素の値を用いて、ベクトルデータVD11(単に「ベクトルVD11」ともいう)を生成する。例えば、情報処理装置100は、アイテムXのアイテム情報IDT11が入力された場合における、モデルM1のニューロンNL1に対応する値VE1(図11参照)やニューロンNL2に対応する値VE2(図11参照)を用いて、ベクトルを生成する。例えば、情報処理装置100は、アイテムXのアイテム情報IDT11が入力された場合に、算出されるニューロンNL1に対応する値VE1をベクトルVD11の1次元目の要素として抽出してもよい。また、例えば、情報処理装置100は、あるアイテムのアイテム情報が入力された場合に、算出されるニューロンNL2に対応する値VE2をベクトルVD11の2次元目の要素として、ベクトルVD11を生成する。図1の例では、情報処理装置100は、1次元目の要素が「35」であり、2次元目の要素が「63」であるようなベクトルVD11を生成する。
そして、情報処理装置100は、対象アイテムを検索する(ステップS17)。例えば、情報処理装置100は、アイテムXに関する対象アイテムを検索する。例えば、情報処理装置100は、非特許文献1に開示されるような近傍検索の技術等の種々の従来技術を適宜用いて、アイテムXの対象アイテムを検索してもよい。例えば、情報処理装置100は、類似性が高いノード間がエッジで連結されたグラフ情報GR11を用いる。
図1の例では、情報処理装置100は、情報群INF11に示すように、グラフ情報GR11やインデックス情報IND11を用いてアイテムXの対象アイテムを検索する。例えば、情報処理装置100は、グラフ情報記憶部123(図6参照)からアイテムに関するグラフ情報GR11を取得する。また、例えば、情報処理装置100は、インデックス情報記憶部122(図5参照)から、グラフ情報GR11における検索の起点となるノード(以下、「起点ベクトル」ともいう)の決定に用いるインデックス情報IND11を取得する。なお、インデックス情報IND11は、情報処理装置100が生成してもよいし、情報処理装置100は、インデックス情報IND11を情報提供装置50等の他の外部装置から取得してもよい。
そして、情報処理装置100は、一のアイテム(クエリ)に対応する起点ベクトルを決定(特定)するために、インデックス情報IND11を用いる。図1の例では、情報処理装置100は、アイテムXのベクトルVD11に対応する起点ベクトルを決定(特定)するために、インデックス情報IND11を用いる。すなわち、情報処理装置100は、ベクトルVD11とインデックス情報IND11とを用いて、グラフ情報GR11における起点ベクトルを決定する。
図1中のインデックス情報IND11は、図5中のインデックス情報記憶部122に示す階層構造を有する。例えば、インデックス情報IND11は、ルートRTの直下に位置する第1階層のノード(ベクトル)が、節点VT1、VT2等であることを示す。また、例えば、インデックス情報IND11は、節点VT2の直下の第2階層のノードが、節点VT2−1〜VT2−4(図示せず)であることを示す。また、例えば、インデックス情報IND11は、節点VT2−2の直下の第3階層のノードが、ノードN35、ノードN451、ノードN693、すなわちグラフ情報GR11中のノード(ベクトル)であることを示す。
例えば、情報処理装置100は、図1中のインデックス情報IND11に示すような木構造型のインデックス情報を用いて、グラフ情報GR11における起点ベクトルを決定する(ステップS18)。図1の例では、情報処理装置100は、ベクトルVD11を生成した後、インデックス情報IND11を上から下へ辿ることにより、インデックス情報IND11の近傍候補となる起点ベクトルを特定することにより、効率的に検索クエリ(一のアイテム)に対応する起点ベクトルを決定することができる。
例えば、情報処理装置100は、インデックス情報IND11をルートRTからリーフノード(グラフ情報GR11中のノード(ベクトル))まで辿ることにより、ベクトルVD11に対応する起点ベクトルを決定してもよい。図1の例では、例えば、情報処理装置100は、インデックス情報IND11をルートRTからノードN451まで辿ることにより、ノードN451を起点ベクトルとして決定する。例えば、情報処理装置100は、木構造に関する種々の従来技術を適宜用いて、インデックス情報IND11をルートRTからリーフノードまで辿ることにより、辿りついたリーフノードを起点ベクトルとして決定してもよい。例えば、情報処理装置100は、ベクトルVD11との類似度に基づいて、インデックス情報IND11を下へ辿ることにより、起点ベクトルを決定してもよい。例えば、情報処理装置100は、ルートRTから節点VT1、VT2等のいずれの節点に辿るかを、ベクトルVD11と節点VT1、VT2との類似度に基づいて決定してもよい。例えば、情報処理装置100は、ルートRTから節点VT1、VT2等のうち、ベクトルVD11との類似度が最も高い節点VT2へ辿ると決定してもよい。また、例えば、情報処理装置100は、節点VT2から節点VT2−1〜VT2−4等のうち、ベクトルVD11との類似度が最も高い節点VT2−2へ辿ると決定してもよい。また、例えば、情報処理装置100は、節点VT2−2からノードN35、N451、N693等のうち、ベクトルVD11との類似度が最も高い節点ノードN451へ辿ると決定してもよい。なお、図1の例では、説明を簡単にするために、起点ベクトルを1つ決定する場合を示すが、情報処理装置100は、複数個の起点ベクトルを決定してもよい。例えば、情報処理装置100は、ノードN451、N35、N693、N2等の複数個のベクトル(ノード)を起点ベクトルとして決定してもよい。なお、インデックス情報IND11を用いずに、検索開始時にグラフ情報GR11からランダムに1つ以上のノードを選択し、それを起点ベクトルとしてもよいし、または、予め指定された1つ以上のノードを起点ベクトルとしても良い。
そして、情報処理装置100は、グラフ情報GR11を検索することにより、アイテムXの対象アイテムを抽出する(ステップS19)。例えば、情報処理装置100は、ノードN451の近傍に位置するノードを対象アイテムとして抽出する。例えば、情報処理装置100は、ノードN451からの距離が近いノードを対象アイテムとして抽出する。例えば、情報処理装置100は、ノードN451を起点として、エッジを辿ることにより、ノードN451から到達可能なノードを対象アイテムとして抽出する。例えば、情報処理装置100は、所定数(例えば、2個や10個等)のノードを対象アイテムとして抽出する。例えば、情報処理装置100は、図12に示すような検索処理により、アイテムXの対象アイテムを抽出してもよいが、詳細は後述する。図1の例では、情報処理装置100は、ノードN451を起点として、グラフ情報GR11を探索することにより、ノードN451やノードN35を対象アイテムとして抽出する。
ここで、ステップS19において、情報処理装置100は、グラフ情報GR11における特別エッジ以外のエッジ(通常エッジ)を辿ってノード(以下「通常抽出ノード」ともいう)を抽出した場合、その通常抽出ノードから特別エッジが他のエッジに連結されているかどうかを判定する。例えば、情報処理装置100は、通常抽出ノードを参照元として、通常抽出ノードと他のオブジェクトとを連結する特別エッジがあるかどうかを判定する。そして、情報処理装置100は、通常抽出ノードを参照元として、通常抽出ノードと他のオブジェクト(特別オブジェクト)とを連結する特別エッジがあると判定した場合、その特別オブジェクトを抽出すると決定する。
まず、情報処理装置100は、ノードN451を対象アイテムとして抽出した場合、ノードN451から特別エッジが他のエッジに連結されているかどうかを判定する。図1の例では、情報処理装置100は、起点ノードであるノードN451を抽出した場合、ノードN451から特別エッジが他のエッジに連結されているかどうかを判定する。例えば、情報処理装置100は、ノードN451からの特別エッジが0本、すなわちノードN451から他のエッジへの特別エッジはないと判定する。そして、情報処理装置100は、ノードN451に関する特別オブジェクトの抽出はないと判定し、通常エッジでの検索を行う。
次に、情報処理装置100は、ノードN35を対象アイテムとして抽出した場合、ノードN35から特別エッジが他のエッジに連結されているかどうかを判定する。図1の例では、情報処理装置100は、ノードN451から通常エッジを辿ることよりノードN35を抽出した場合、ノードN35から特別エッジが他のエッジに連結されているかどうかを判定する。例えば、情報処理装置100は、ノードN35からはノードN831への特別エッジSE35が連結されているため、ノードN35から他のエッジへの特別エッジがあると判定する。そのため、情報処理装置100は、ノードN35から特別エッジSE35が連結されたノードN831を対象アイテムとして抽出する。
なお、情報処理装置100は、特別オブジェクトを抽出したオブジェクトの数に加えなくてもよい。すなわち、情報処理装置100は、特別オブジェクトの数を所定数との比較に用いなくてもよい。この場合、情報処理装置100は、対象アイテムとして抽出したオブジェクトのうち、特別オブジェクトを除くオブジェクトの数を所定数との比較に用いてもよい。また、情報処理装置100は、特別エッジの連結により対象アイテムとして抽出されたノードから辿れるノードへの検索を行わなくてもよい。図1の例では、情報処理装置100は、特別エッジの連結により対象アイテムとして抽出されたノードN831から辿れるノードへの検索を行わない。この場合、情報処理装置100は、ノードN35から通常エッジを辿ることによる検索を行う。これにより、情報処理装置100は、アイテムXと関連性の低いノードが対象アイテムとして抽出されるのを抑制することができる。なお、情報処理装置100は、ノードN831から辿れるノードを対象アイテムとして抽出してもよい。
そして、抽出装置100は、抽出した対象アイテムに関する情報を提供する(ステップS20)。図1の例では、抽出装置100は、ノードN451に対応するアイテム#451や、ノードN35に対応するアイテム#35や、ノードN831に対応するアイテム#831を対象アイテムとしてユーザU1が利用する端末装置10に提供する。
上述したように、情報処理装置100は、グラフ情報GR11やインデックス情報IND11を用いて、ユーザU1から取得したアイテムXの対象アイテムを抽出する。例えば、情報処理装置100は、インデックス情報IND11を用いて、アイテムXの対象アイテムを抽出する際のグラフ情報GR11における起点ベクトルを決定する。そして、情報処理装置100は、決定した起点ベクトルを起点としてグラフ情報GR11を探索することにより、アイテムXの対象アイテムを抽出する。これにより、情報処理装置100は、アイテムを適切に抽出することができる。
また、情報処理装置100は、グラフ情報の検索時において特別エッジが連結されたノードに到達した場合、ノードと特別エッジにより連結された他のノードを対象アイテムとして抽出することにより、異なる観点での対象アイテムも抽出することができる。例えば、情報処理装置100は、グラフ情報の検索時において特別エッジが連結されたノードに到達した場合、ノードと特別エッジにより連結された他のノードを対象アイテムとして抽出することにより、異なる観点での対象アイテムも抽出することができる。
例えば、情報処理装置100は、アイテムXと類似するアイテム(類似アイテム)が、例えばアイテムXと一見関係が無いように見える場合であっても、グラフ情報を用いることで、アイテムXの類似アイテム(対象アイテム)として抽出でき、アイテムを適切に抽出することができる。例えば、ディープラーニングといった手法で、セール用アイテム等の所定の目的に適したアイテムを識別するという方法もあるが、所定の目的に適するかに影響する多種多様な要素が存在する場合においては、各要素の事例が少ないので、学習ができずに識別精度を向上させることが難しいという問題がある。例えば、ディープラーニングといった学習手法で生成したモデルを用いて、そのモデルにアイテムの情報を入力し、出力されたスコアからそのアイテムが所定の目的に適するかを識別するという方法もあるが、多種多様な要素が存在する場合においては、各要素の事例が少ないため、モデルの精度を向上させることが難しく、識別精度を向上させることが難しい。一方で、情報処理装置100は、各アイテムから抽出した特徴を基に生成した複数のベクトルのグラフ構造化したグラフ情報を用いて検索を行うことにより、アイテムを適切に抽出することができる。
〔1−4.グラフ情報の生成(特別エッジの追加)について〕
図1の例で説明したように、情報処理装置100は、所定の条件を満たすノード間を特別エッジで連結し、その連結を基にグラフを検索することにより、アイテムを適切に抽出することができる。ここで、従来からあるグラフベースインデックス(以下、「従来グラフ」とする)でも超大規模アイテムの検索や推薦(レコメンド)に有効である。一方で、従来グラフがある観点で構築された場合、その従来グラフを用いたアイテムレコメンドを行う際に、別観点の新しい情報を動的に(例えば期間限定で)考慮するのが困難であるという課題がある。
例えば、観点の新しい情報を動的に(例えば期間限定で)考慮する点については、以下のような例が挙げられる。例えば、アイテムのコンテンツ距離(類似性)で構築したグラフ情報(インデックス)があったときに、過去数時間で一緒に買われた頻度に関する距離を考慮したい場合がある。例えば、ユーザの行動履歴を用いることにより、雨が降っているとき、暑いとき、寒いとき、地震が発生したときなど、状況に応じて一緒に買われやすい傾向があるアイテムのクラスタを抽出し、その情報を反映させたい場合がある。しかしながら、状況が変化したときに従来グラフのグラフ情報を再構築するのは時間を要する。また、事前にすべての場合を想定して従来グラフのグラフ情報を個別に用意するのは困難であり、現実的ではない。
そこで、情報処理装置100は、別観点の情報(距離尺度等)によりヒューリスティックにグラフ情報を拡張する。例えば、情報処理装置100は、直近の過去数時間で一緒に買われた頻度に関する距離(類似度)を用いてグラフ情報を更新してもよい。例えば、情報処理装置100は、直近の過去数時間に合せて購入される回数が急増した商品Aと商品Bに拡張エッジ(特別エッジ)を追加する。例えば、情報処理装置100は、テレビで所定の有名人(アーティストA)が商品AAが好きだと言って話題になったときに、アーティストAの商品(例えばCD(Compact Disc)等の音楽コンテンツ)と商品AAをグラフ情報上において拡張エッジ(特別エッジ)で連結する。なお、情報処理装置100が自動で行ってもよいし、情報処理装置100の管理者等が手作業で行っても良い。
この場合、情報処理装置100は、グラフ情報全体の再構築は必要なく、瞬時に更新することができる。また、情報処理装置100は、更新後のグラフ情報を用いたサービス提供において、所望の効果がない場合は、追加したエッジを削除することにより、瞬時に元のグラフ情報に戻すことができる。
例えば、従来グラフで検索した候補の中から、別尺度で絞り込むといつ二段階での抽出方法も考えられる。しかしながら、この抽出方法では、所望の対象商品が抽出されない可能性があるため、効率的ではない。また、各尺度で別々に検索してマージする場合では、両方の尺度を考慮した検索(ノードの遷移)が考慮されないので潜在的な需要を見逃す可能性がある。
一方で、情報処理装置100は、取得したデータから適当な距離を算出できない場合であっても、過去の知見(経験知)から情報処理装置100の管理者等が強制的に、「これが好きな人はこれが好きなはず」等のノード間の特別な関連性を示す情報を埋め込むことができる。例えば、情報処理装置100は、単独観点では難しい、グラフ情報の商品A、Bの類似度のX倍といった相対的な指定もできる。例えば、情報処理装置100は、上記のように、アイテムの類似性以外の観点(尺度)により、特別エッジを追加することにより、種々の観点に基づく検索を可能にし、アイテムの適切な抽出を可能にする。
例えば、類似度を「各ユーザの閲覧ログにおいて一定時間内に共起した(一緒に閲覧された)ページの頻度」と定義(設定)した場合、リアルタイムで距離関数が変化するため、リアルタイムにグラフ情報に完全に反映するのは現状の技術では困難である。そのため、情報処理装置100は、ログから頻出パス(ショートカット)を別アルゴリズムで検出してエッジを追加すること等により、現状のグラフ情報をリアルタイムで(ヒューリスティックに)拡張して処理しつつ、所定の時間帯(深夜等)にバッチで全体のグラフ情報を更新してもよい。
〔1−4−1.特別エッジ〕
図1の例では、情報処理装置100が所定の期間におけるユーザの行動に基づいて、アイテム間を特別エッジで連結するかの判定を行う場合を示したが、情報処理装置100は、期間に限らず、種々の条件に基づいて、アイテム間を特別エッジで連結するかの判定を行ってもよい。例えば、情報処理装置100は、ユーザの位置情報などのコンテキストを用いてもよい。例えば、情報処理装置100は、ユーザのコンテキストが所定の条件を満たす場合のユーザの行動群を対象とし、その情報群に基づいて、アイテム間を特別エッジで連結するかの判定を行ってもよい。例えば、情報処理装置100は、所定のエリアに位置するユーザの行動群を対象とし、その情報群に基づいて、アイテム間を特別エッジで連結するかの判定を行ってもよい。例えば、情報処理装置100は、所定のエリアに位置するユーザの行動においてアイテム間に特別な関連性がある場合、そのアイテム間を特別エッジで連結すると判定してもよい。また、情報処理装置100は、所定のエリア(Xエリア)に基づいて追加された特別エッジ(特別エッジX)を、Xエリアに位置するユーザが情報提供先である場合に用いると決定してもよい。例えば、情報処理装置100は、Xエリアに位置するユーザが情報提供先である場合、検索時に特別エッジXを辿ることにより対象アイテムを抽出する。また、情報処理装置100は、Xエリア以外のエリアに位置するユーザが情報提供先である場合、検索時に特別エッジXを辿らずに対象アイテムを抽出する。なお、情報処理装置100は、特別エッジを用いるかどうかを種々の情報を基に決定してもよい。このように、情報処理装置100は、種々の情報を用いて特別エッジの利用可否を決定してもよい。情報処理装置100は、ユーザの位置情報などのコンテキストを用いて、特別エッジを用いて対象アイテムを抽出するかどうかを決定してもよい。情報処理装置100は、ユーザが所定のエリアに位置するかどうかに応じて、特別エッジを用いて対象アイテムを抽出するかどうかを決定してもよい。例えば、情報処理装置100は、特別エッジを用いて対象アイテムを抽出するかを、情報提供先となるユーザの属性情報に基づいて決定してもよい。
例えば、情報処理装置100は、特別エッジに対象とするユーザ属性を示す情報を対応付けて記憶してもよい。この場合、情報処理装置100は、特別エッジに対応付けられたユーザ属性と情報提供先のユーザのユーザ属性とを比較し、特別エッジに対応付けられたユーザ属性にユーザのユーザ属性が一致する場合、その特別エッジを用いると決定してもよい。
例えば、情報処理装置100は、20代男性を対象のユーザ属性とする特別エッジ(「特別エッジY」とする)がグラフ情報に含まれ、情報提供先のユーザが20代男性である場合、特別エッジYを用いて対象アイテムを抽出する。一方で、報処理装置100は、20代男性を対象のユーザ属性とする特別エッジYがグラフ情報に含まれる場合であっても、情報提供先のユーザが20代女性である場合、特別エッジYを用いずに、対象アイテムを抽出する。
また、例えば、情報処理装置100は、ユーザの購買情報に限らず、種々の情報を用いて、特別エッジの追加を判定してもよい。例えば、情報処理装置100は、ユーザが所定のサービスにおいて投稿した投稿情報を含むユーザの行動情報を用いて、特別エッジの追加を判定してもよい。例えば、情報処理装置100は、アイテム#22とアイテム#33がユーザの投稿情報において所定の閾値以上の回数で共起する場合、アイテム#22とアイテム#33との間に特別エッジを追加すると判定してもよい。
例えば、情報処理装置100は、SNSにおいてユーザが投稿した投稿情報を用いて、特別エッジの追加を判定してもよい。例えば、情報処理装置100は、Twitter(登録商標)やFacebook(登録商標)等においてユーザが投稿した投稿情報を用いて、特別エッジの追加を判定してもよい。例えば、情報処理装置100は、ユーザがTwitterにおいて投稿した文字情報を含むユーザの行動情報を用いて、特別エッジの追加を判定してもよい。例えば、情報処理装置100は、ユーザがメッセージサービスにおいて入力した情報を含むユーザの行動情報を用いて、特別エッジの追加を判定してもよい。例えば、情報処理装置100は、ユーザがLINE(登録商標)等のメッセージサービスにおいて入力した情報を含むユーザの行動情報を用いて、特別エッジの追加を判定してもよい。例えば、情報処理装置100は、電子メールにおいて入力した情報を含むユーザの行動情報を用いて、特別エッジの追加を判定してもよい。なお、情報処理装置100は、投稿情報に限らず、ユーザの種々の行動情報を用いて、特別エッジの追加を判定してもよい。
次に、図13を用いて、グラフ情報への特別エッジの追加についいて説明する。図13は、特別エッジの追加の一例を示す図である。まず、情報処理装置100は、所定の履歴を示すログを取得する(ステップS51)。情報処理装置100は、所定の期間におけるユーザの行動を示す履歴情報を取得する。例えば、情報処理装置100は、履歴情報記憶部125(図8参照)から履歴情報を取得する。図13の例では、所定の期間は、日時#51〜#53等を含む3ヶ月であるものとし、収集対象期間と記載する場合がある。
例えば、情報処理装置100は、ログ一覧LGT51に示すように、日時#51〜#53等を含む収集対象期間におけるユーザの行動履歴を取得する。図13の例では、図示を省略するが、情報処理装置100は、各行動を行ったユーザの情報を含む履歴情報を取得してもよい。
「日時」は、対応する行動が行われた日時を示す。なお、日時#51〜日時#53等は、対応する行動が行われた具体的な日時であるものとする。「対象アイテム#1」、「対象アイテム#2」等は、対応する行動において共通して対象となったアイテムを示す。図13の例では、「対象アイテム#1」、「対象アイテム#2」等は、対応する行動において併せて購入されたアイテム(商品)を示す。
図13に示す例において、収集対象期間内の日時#51においてアイテム#51とアイテム#555が合わせて購入されたことを示す。また、収集対象期間内の日時#51においてアイテム#51とアイテム#555が合わせて購入されたことを示す。また、収集対象期間内の日時#51においてアイテム#555とアイテム#51が合わせて購入されたことを示す。
そして、情報処理装置100は、ログ一覧LGT51に示すような履歴情報に基づいて、特別な関連性を有するアイテムを判定する(ステップS52)。例えば、情報処理装置100は、日時#51〜#53等を含む収集対象期間内において、所定の閾値(例えば、5000回等)以上合せて購入された複数のノードを、特別な関連性を有するアイテムであると判定する。図13の例では、情報処理装置100は、収集対象期間内において、アイテム#51とアイテム#555との2つのアイテム(商品)が所定の閾値以上合せて購入されたと判定する。そして、情報処理装置100は、アイテム#51とアイテム#555とを、特別な関連性を有するアイテムであると判定する。そのため、情報処理装置100は、アイテム#51とアイテム#555との間に特別エッジを追加すると判定する。
そして、情報処理装置100は、特別な関連性を有するアイテム間を連結する特別エッジを追加する。図13の例では、情報処理装置100は、特別エッジSE51や特別エッジSE555を追加する。
情報処理装置100は、ノードN51からノードN555に連結される特別エッジSE51を生成する。情報処理装置100は、ノードN51を参照元とし、ノードN555を参照先とする特別エッジSE51を生成する。例えば、情報処理装置100は、特別エッジSE51の情報をグラフ情報記憶部123(図6参照)に追加(登録)する。
また、情報処理装置100は、ノードN555からノードN51に連結される特別エッジSE555を生成する。情報処理装置100は、ノードN555を参照元とし、ノードN51を参照先とする特別エッジSE555を生成する。情報処理装置100は、特別エッジSE555の情報をグラフ情報記憶部123(図6参照)に追加(登録)する。
例えば、情報処理装置100は、図13中のグラフ情報GR21に、点線で示す特別エッジSE51や特別エッジSE555を追加する。これにより、情報処理装置100は、特別な関連性を有するアイテム間を特別エッジで連結したグラフ情報を生成する。なお、情報処理装置100は、特別エッジSE51や特別エッジSE555の追加から所定期間が経過した場合、特別エッジSE51や特別エッジSE555を、グラフ情報GR21から取り除いて良い。情報処理装置100は、特別エッジSE51や特別エッジSE555の追加から所定期間が経過した場合、グラフ情報記憶部123(図6参照)から特別エッジSE51や特別エッジSE555を削除して良い。
このように、情報処理装置100は、グラフ情報GR21に示すように、距離が遠いノード間、すなわちアイテム情報での類似性が低いアイテムであっても、ユーザの行動を基に特別な関連性を判定し、特別エッジで連結する。これにより、情報処理装置100は、ユーザの行動に適応的なグラフ情報を生成し、ユーザに適応的な情報提供を行うことができる。
〔1−5.インデックス情報〕
図1の例に示すインデックス情報(インデックスデータ)は一例であり、情報処理装置100は、種々のインデックス情報を用いて、グラフ情報を検索してもよい。また、例えば、情報処理装置100は、検索時に用いるインデックスデータを生成してもよい。例えば、情報処理装置100は、高次元ベクトルを検索する検索インデックスをインデックスデータとして生成する。ここでいう高次元ベクトルとは、例えば、数百次元から数千次元のベクトルであってもよいし、それ以上の次元のベクトルであってもよい。
例えば、情報処理装置100は、図1に示すようなツリー構造(木構造)に関する検索インデックスをインデックスデータとして生成してもよい。例えば、情報処理装置100は、kd木(k-dimensional tree)に関する検索インデックスをインデックスデータとして生成してもよい。例えば、情報処理装置100は、VP木(Vantage-Point tree)に関する検索インデックスをインデックスデータとして生成してもよい。
また、例えば、情報処理装置100は、その他の木構造を有するインデックスデータとして生成してもよい。例えば、情報処理装置100は、木構造のインデックスデータのリーフがグラフデータに接続する種々のインデックスデータを生成してもよい。例えば、情報処理装置100は、木構造のインデックスデータのリーフがグラフデータ中のノードに対応する種々のインデックスデータを生成してもよい。また、情報処理装置100は、このようなインデックスデータを用いて検索を行う場合、インデックスデータを辿って到達したリーフ(ノード)からグラフデータを探索してもよい。
なお、上述したようなインデックスデータは一例であり、情報処理装置100は、グラフデータ中のクエリを高速に特定することが可能であれば、どのようなデータ構造のインデックスデータを生成してもよい。例えば、情報処理装置100は、クエリに対応するグラフ情報中のノードを高速に特定することが可能であれば、バイナリ空間分割に関する技術等の種々の従来技術を適宜用いて、インデックスデータを生成してもよい。例えば、情報処理装置100は、高次元ベクトルの検索に対応可能なインデックスであれば、どのようなデータ構造のインデックスデータを生成してもよい。例えば、情報処理装置100は、非特許文献1に記載されるようなグラフ型の検索インデックスに関する情報をインデックス情報として用いてもよい。情報処理装置100は、上述のようなインデックスデータとグラフデータとを用いることにより、所定のアイテムに関するより効率的な検索を可能にすることができる。
〔2.情報処理システムの構成〕
図2に示すように、情報処理システム1は、端末装置10と、情報提供装置50と、情報処理装置100とが含まれる。端末装置10と、情報提供装置50と、情報処理装置100とは所定のネットワークNを介して、有線または無線により通信可能に接続される。図2は、実施形態に係る情報処理システムの構成例を示す図である。なお、図2に示した情報処理システム1には、複数台の端末装置10や、複数台の情報提供装置50や、複数台の情報処理装置100が含まれてもよい。
端末装置10は、ユーザによって利用される情報処理装置である。端末装置10は、ユーザによる種々の操作を受け付ける。なお、以下では、端末装置10をユーザと表記する場合がある。すなわち、以下では、ユーザを端末装置10と読み替えることもできる。なお、上述した端末装置10は、例えば、スマートフォンや、タブレット型端末や、ノート型PC(Personal Computer)や、デスクトップPCや、携帯電話機や、PDA(Personal Digital Assistant)等により実現される。例えば、端末装置10は、所定のサーバシステムを管理者が利用する情報処理装置であってもよい。例えば、端末装置10は、アイテム情報を収集し、アイテム情報を情報処理装置100へ送信する。
情報処理装置100は、種々の情報処理を行う情報処理装置である。情報処理装置100は、グラフ情報を検索することにより、複数のアイテムのうち、一のアイテムと類似するアイテムである類似アイテムを対象アイテムとして抽出する情報処理装置である。情報処理装置100は、グラフ情報の検索時において特別エッジが連結されたノードに到達した場合、当該ノードと特別エッジにより連結された他のノードを対象アイテムとして抽出する情報処理装置である。例えば、情報処理装置100は、一のアイテムに関するアイテム情報を取得し、アイテム情報と、グラフ情報の検索の起点となる起点ベクトルに関する情報とに基づいて、起点ベクトルを決定する。
情報処理装置100は、ユーザ等に種々の情報提供を行うための情報が格納された情報処理装置である。例えば、情報処理装置100は、端末装置10から一のアイテムのアイテム情報(以下、「クエリ情報」や「クエリ」ともいう)を取得すると、クエリに類似するアイテム(ベクトル情報等)を検索し、検索結果を端末装置10に提供する。図1の例では、情報処理装置100は、端末装置10から一のアイテムのアイテム情報を取得すると、一のアイテムに類似するアイテムを検索し、検索結果を類似のアイテムとして端末装置10に提供する。また、例えば、情報処理装置100が端末装置10に提供するデータは、アイテムの名称やアイテムのアイテム情報自体であってもよいし、URL(Uniform Resource Locator)等の対応するデータを参照するための情報であってもよい。
情報提供装置50は、情報処理装置100に種々の情報提供を行うための情報が格納された情報処理装置である。例えば、情報提供装置50は、ウェブサーバ等の種々の外部装置から収集したアイテム情報等が格納されてもよい。例えば、情報提供装置50は、グラフ情報やインデックス情報やモデル等の種々の情報を情報処理装置100に提供する情報処理装置である。
〔3.情報処理装置の構成〕
次に、図3を用いて、実施形態に係る情報処理装置100の構成について説明する。図3は、実施形態に係る情報処理装置の構成例を示す図である。図3に示すように、情報処理装置100は、通信部110と、記憶部120と、制御部130とを有する。なお、情報処理装置100は、情報処理装置100の管理者等から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を表示するための表示部(例えば、液晶ディスプレイ等)を有してもよい。
(通信部110)
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部110は、ネットワーク(例えば図2中のネットワークN)と有線または無線で接続され、端末装置10や情報提供装置50との間で情報の送受信を行う。
(記憶部120)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。実施形態に係る記憶部120は、図3に示すように、アイテム情報記憶部121と、インデックス情報記憶部122と、グラフ情報記憶部123と、モデル情報記憶部124と、履歴情報記憶部125を有する。
(アイテム情報記憶部121)
実施形態に係るアイテム情報記憶部121は、アイテム(オブジェクト)に関する各種情報を記憶する。例えば、アイテム情報記憶部121は、アイテムIDやベクトルデータを記憶する。図4の例では、アイテムに関するアイテム情報を記憶する。図4は、実施形態に係るアイテム情報記憶部の一例を示す図である。図4に示すアイテム情報記憶部121は、「アイテムID」、「アイテム」、「アイテム情報」、「ベクトル情報」といった項目が含まれる。
「アイテムID」は、アイテム(オブジェクト)を識別するための識別情報を示す。また、「アイテム」は、アイテムIDにより識別されるアイテムの具体的な名称や内容等を示す。なお、図4の例では、アイテムを「アイテム#1」といった抽象的な符号で示すが、括弧内の「A商品」等のように、アイテム(商品)を特定するための文字情報等が含まれてもよい。
「アイテム情報」は、アイテムIDにより識別されるアイテムに関する情報を示す。なお、図4の例では、アイテム情報を「IDT1」といった抽象的な符号で示すが、各アイテム情報は、アイテムIDにより識別されるアイテムの商品カテゴリ、タイトル、説明文、画像情報、製造元、サイズ等の種々のアイテムに関する情報を含んでもよい。「ベクトル情報」とは、アイテムIDにより識別されるアイテム(オブジェクト)に対応するベクトル情報を示す。すなわち、図4の例では、アイテム(オブジェクト)を識別するアイテムIDに対して、オブジェクトに対応するベクトルデータ(ベクトル情報)が対応付けられて登録されている。
例えば、図4の例では、アイテムID「IM1」により識別されるアイテム(オブジェクト)は、「10,24,54,2...」の多次元(N次元)のベクトル情報が対応付けられることを示す。例えば、アイテム#1については、モデルM1等により、アイテム#1の特徴を示す「10,24,54,2...」の多次元(N次元)のベクトル情報がアイテム情報IDT1から抽出されたことを示す。また、図4の例では、アイテム#1の指標値は、「VL1」であることを示す。
なお、アイテム情報記憶部121は、上記に限らず、目的に応じて種々の情報を記憶してもよい。
(インデックス情報記憶部122)
実施形態に係るインデックス情報記憶部122は、インデックスに関する各種情報を記憶する。図5は、実施形態に係るインデックス情報記憶部の一例を示す図である。具体的には、図5の例では、インデックス情報記憶部122は、ツリー構造のインデックス情報を示す。図5の例では、インデックス情報記憶部122は、「ルート階層」、「第1階層」、「第2階層」、「第3階層」等といった項目が含まれる。なお、「第1階層」〜「第3階層」に限らず、インデックスの階層数に応じて、「第4階層」、「第5階層」、「第6階層」等が含まれてもよい。
「ルート階層」は、インデックスを用いた起点ノードの決定の開始点となるルート(最上位)の階層を示す。「第1階層」は、インデックスの第1階層に属するノード(節点またはグラフ情報中のベクトル)を識別(特定)する情報が格納される。「第1階層」に格納されるノードは、インデックスの根(ルート)に直接結ばれる階層に対応するノードとなる。
「第2階層」は、インデックスの第2階層に属するノード(節点またはグラフ情報中のベクトル)を識別(特定)する情報が格納される。「第2階層」に格納されるノードは、第1階層のノードに結ばれる直下の階層に対応するノードとなる。「第3階層」は、インデックスの第3階層に属するノード(節点またはグラフ情報中のベクトル)を識別(特定)する情報が格納される。「第3階層」に格納されるノードは、第2階層のノードに結ばれる直下の階層に対応するノードとなる。
例えば、図5に示す例においては、インデックス情報記憶部122には、図1中のインデックス情報IND11に対応する情報が記憶される。例えば、インデックス情報記憶部122は、第1階層のノードが、節点VT1〜VT3等であることを示す。また、各節点の下の括弧内の数値は、各節点に対応するベクトルの値を示す。
また、例えば、インデックス情報記憶部122は、節点VT2の直下の第2階層のノードが、節点VT2−1〜VT2−4であることを示す。また、例えば、インデックス情報記憶部122は、節点VT2−2の直下の第3階層のノードが、ノードN35、ノードN451、ノードN693のグラフ情報GR11中のノード(ベクトル)であることを示す。
なお、インデックス情報記憶部122は、上記に限らず、目的に応じて種々の情報を記憶してもよい。
(グラフ情報記憶部123)
実施形態に係るグラフ情報記憶部123は、グラフ情報に関する各種情報を記憶する。図6は、実施形態に係るグラフ情報記憶部の一例を示す図である。図6の例では、グラフ情報記憶部123は、「ノードID」、「アイテムID」、「エッジ情報」、および「特別エッジ情報」といった項目を有する。また、「エッジ情報」や「特別エッジ情報」には、「エッジID」や「参照先」といった情報が含まれる。
「ノードID」は、グラフデータにおける各ノード(アイテム)を識別するための識別情報を示す。また、「アイテムID」は、アイテム(オブジェクト)を識別するための識別情報を示す。
また、「エッジ情報」は、対応するノードに接続されるエッジに関する情報を示す。「エッジ情報」は、複数のアイテムの類似性に応じてノードを連結するエッジに関する情報を示す。例えば、「エッジ情報」は、通常エッジに関する情報を示す。図6の例では、「エッジ情報」は、エッジが有向エッジである場合を示し、対応するノードから出力される出力エッジに関する情報を示す。また、「エッジID」は、ノード間を連結するエッジを識別するための識別情報を示す。また、「参照先」は、エッジにより連結された参照先(ノード)を示す情報を示す。すなわち、図6の例では、ノードを識別するノードIDに対して、そのノードに対応するオブジェクト(アイテム)を識別する情報やそのノードからの有向エッジ(出力エッジ)が連結される参照先(ノード)が対応付けられて登録されている。
また、「特別エッジ情報」は、対応するノードに接続される特別エッジに関する情報を示す。「特別エッジ情報」は、通常エッジを連結する観点とは異なる観点による所定の条件を満たすノードを連結するエッジ(特別エッジ)に関する情報を示す。図6の例では、「特別エッジ情報」は、特別エッジが有向エッジである場合を示し、対応するノードから出力される出力エッジに関する情報を示す。また、「エッジID」は、ノード間を連結する特別エッジを識別するための識別情報を示す。また、「参照先」は、特別エッジにより連結された参照先(ノード)を示す情報を示す。すなわち、図6の例では、ノードを識別するノードIDに対して、そのノードに対応するオブジェクト(アイテム)を識別する情報やそのノードからの有向エッジ(出力エッジ)が連結される参照先(ノード)が対応付けられて登録されている。
例えば、図6の例では、ノードID「N1」により識別されるノード(ベクトル)は、アイテムID「IM1」により識別されるアイテム(オブジェクト)に対応することを示す。
また、ノードID「N1」により識別されるノードからは、エッジID「E11」により識別されるエッジ(通常エッジ)が、ノードID「N25」により識別されるノード(ベクトル)に連結されることを示す。図6の例では、ノードID「N1」により識別されるノード(ベクトル)からはノードID「N25」により識別されるノード(ベクトル)に辿ることができることを示す。すなわち、ノードN1からは、通常エッジであるエッジE11によりノードN25に辿ることができることを示す。
また、ノードID「N1」により識別されるノードからは、特別エッジは他のノードへ接続されていないことを示す。図6の例では、ノードID「N1」により識別されるノード(ベクトル)を参照元とする特別エッジはないことを示す。すなわち、ノードN1からは、特別エッジにより辿ることができるノードはないことを示す。
また、ノードID「N35」により識別されるノードからは、エッジID「E351」により識別されるエッジ(通常エッジ)が、ノードID「N693」により識別されるノード(ベクトル)に連結されることを示す。図6の例では、ノードID「N35」により識別されるノード(ベクトル)からはノードID「N693」により識別されるノード(ベクトル)に辿ることができることを示す。すなわち、ノードN35からは、通常エッジであるエッジE351によりノードN693に辿ることができることを示す。
また、ノードID「N35」により識別されるノードからは、エッジID「SE35」により識別される特別エッジが、ノードID「N831」により識別されるノード(ベクトル)に連結されることを示す。図6の例では、ノードID「N35」により識別されるノード(ベクトル)からはノードID「N831」により識別されるノード(ベクトル)に辿ることができることを示す。すなわち、ノードN35からは、特別エッジSE35によりノードN831に辿ることができることを示す。
なお、グラフ情報記憶部123は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、グラフ情報記憶部123は、各ノード(ベクトル)間を連結するエッジの長さが記憶されてもよい。すなわち、グラフ情報記憶部123は、各ノード(ベクトル)間の距離を示す情報が記憶されてもよい。
(モデル情報記憶部124)
実施形態に係るモデル情報記憶部124は、モデルに関する情報を記憶する。例えば、モデル情報記憶部124は、生成処理により生成されたモデル情報(モデルデータ)を記憶する。図7は、実施形態に係るモデル情報記憶部の一例を示す図である。図7に示すモデル情報記憶部124は、「モデルID」、「用途」、「モデルデータ」といった項目が含まれる。なお、図7では、モデルM1、M2のみを図示するが、M21、M22等、各用途に応じて多数のモデル情報が記憶されてもよい。
「モデルID」は、モデルを識別するための識別情報を示す。例えば、モデルID「M1」により識別されるモデルは、図1の例に示したモデルM1に対応する。「用途」は、対応するモデルの用途を示す。また、「モデルデータ」は、対応付けられた対応するモデルのデータを示す。例えば、「モデルデータ」には、各層におけるノードと、各ノードが採用する関数と、ノードの接続関係と、ノード間の接続に対して設定される接続係数とを含む情報が含まれる。
例えば、図7に示す例において、モデルID「M1」により識別されるモデル(モデルM1)は、用途が「特徴抽出(商品)」であり、入力されたアイテム情報からの特徴の抽出に用いられることを示す。また、モデルM1のモデルデータは、モデルデータMDT1であることを示す。
モデルM1(モデルデータMDT1)は、アイテムのアイテム情報が入力される入力層と、出力層と、入力層から出力層までのいずれかの層であって出力層以外の層に属する第1要素と、第1要素と第1要素の重みとに基づいて値が算出される第2要素と、を含み、入力層に入力されたアイテム情報に対し、出力層以外の各層に属する各要素を第1要素として、第1要素と第1要素の重みとに基づく演算を行うことにより、入力層に入力される情報と同様の情報を出力層から出力するよう、コンピュータを機能させるためのモデルである。
また、モデルM1、M2等がDNN(Deep Neural Network)等、1つまたは複数の中間層を有するニューラルネットワークで実現されるとする。この場合、例えば、モデルM1、M2が含む第1要素は、入力層または中間層が有するいずれかのノードに対応する。また、第2要素は、第1要素と対応するノードから値が伝達されるノードである次段のノードに対応する。また、第1要素の重みは、第1要素と対応するノードから第2要素と対応するノードに伝達される値に対して考慮される重みである接続係数に対応する。
ここで、モデルM21、M22等が「y=a1*x1+a2*x2+・・・+ai*xi」で示す回帰モデルで実現されるとする。この場合、例えば、モデルM21、M22が含む第1要素は、x1やx2等といった入力データ(xi)に対応する。また、第1要素の重みは、xiに対応する係数aiに対応する。ここで、回帰モデルは、入力層と出力層とを有する単純パーセプトロンと見做すことができる。各モデルを単純パーセプトロンと見做した場合、第1要素は、入力層が有するいずれかのノードに対応し、第2要素は、出力層が有するノードと見做すことができる。
なお、モデル情報記憶部124は、上記に限らず、目的に応じて種々のモデル情報を記憶してもよい。
(履歴情報記憶部125)
実施形態に係る履歴情報記憶部125は、履歴に関する各種情報を記憶する。図8は、実施形態に係る履歴情報記憶部の一例を示す図である。履歴情報記憶部125は、複数のユーザ(ユーザ群)の各種行動の履歴を示す情報を記憶する。例えば、履歴情報記憶部125は、ユーザが行動を行った日時や対象となるアイテムを示す情報を記憶する。図8の例では、履歴情報記憶部125は、ユーザが商品の購入を行った日時や購入対象となった商品(購入商品)を記憶する。図8に示す履歴情報記憶部125には、「履歴ID」、「日時」、「ユーザ」、「対象アイテム#1(購入商品#1)」、「対象アイテム#2(購入商品#2)」といった項目を有する。
「対象アイテム#1(購入商品#1)」、「対象アイテム#2(購入商品#2)」は、行動の対象となったアイテムを示すが、「対象アイテム#1(購入商品#1)」、「対象アイテム#2(購入商品#2)」のみに限らず、対象アイテム数だけ記憶されてもよく、例えば「対象アイテム#3(購入商品#3)」、「対象アイテム#4(購入商品#4)」等が含まれてもよい。なお、図8では、説明を簡単にするために、ユーザの商品の購入に関する行動のみを図示するが、ユーザの行動は、商品の購入に限らず、アイテム情報(商品情報)の閲覧やアイテム(商品)の検索等の種々の行動が含まれるものとする。例えば、行動がアイテム情報の閲覧である場合、履歴情報記憶部125中の「対象アイテム#1」や「対象アイテム#2」には、閲覧されたアイテムを示す情報が記憶される。また、例えば、行動がアイテム情報の検索である場合、履歴情報記憶部125中の「対象アイテム#1」や「対象アイテム#2」には、その検索時に一緒に抽出されたアイテムを示す情報が記憶される。
「履歴ID」は、履歴を識別するための識別情報を示す。「日時」は、対応する行動が行われた日時を示す。なお、図8の例では、日時を「日時#11」といった抽象的な符号で示すが、「2018年3月13日20時45分38秒」等のように、対応する行動が行われた具体的な日時であってもよい。「ユーザ」は、対応する行動が行ったユーザを示す。
「対象アイテム#1(購入商品#1)」、「対象アイテム#2(購入商品#2)」等は、対応する行動において共通して対象となったアイテムを示す。図8の例では、「対象アイテム#1(購入商品#1)」、「対象アイテム#2(購入商品#2)」等は、対応する行動において併せて購入されたアイテム(商品)を示す。
図8に示す例において、履歴ID「LG11」により識別される履歴は、日時#11においてユーザU5が行った商品を購入する行動であることを示す。また、日時#11においてユーザU5は、アイテム#35とアイテム#831を合わせて購入したことを示す。
なお、履歴情報記憶部125は、上記に限らず、目的に応じて種々の情報を記憶してもよい。
(制御部130)
図3の説明に戻って、制御部130は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、情報処理装置100内部の記憶装置に記憶されている各種プログラム(情報処理プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部130は、コントローラであり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。制御部130は、モデル情報記憶部124に記憶されているモデルM1、M2等に従った情報処理により、アイテムのアイテム情報が入力される入力層と、出力層と、入力層から出力層までのいずれかの層であって出力層以外の層に属する第1要素と、第1要素と第1要素の重みとに基づいて値が算出される第2要素と、を含み、入力層に入力されたアイテム情報に対し、出力層以外の各層に属する各要素を第1要素として、第1要素と第1要素の重みとに基づく演算を行うことにより、入力層に入力される情報と同様の情報を出力層から出力する。
図3に示すように、制御部130は、取得部131と、生成部132と、決定部133と、検索部134と、提供部135とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部130の内部構成は、図3に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。
(取得部131)
取得部131は、各種情報を取得する。例えば、取得部131は、記憶部120から各種情報を取得する。例えば、取得部131は、アイテム情報記憶部121や、インデックス情報記憶部122や、グラフ情報記憶部123や、モデル情報記憶部124や、履歴情報記憶部125等から各種情報を取得する。また、取得部131は、各種情報を外部の情報処理装置から取得する。取得部131は、端末装置10や情報提供装置50から各種情報を取得する。
取得部131は、複数のアイテムの各々に対応する複数のノードが、複数のアイテムの類似性に応じてエッジにより連結されたグラフ情報であって、複数のノードのうち、類似性とは異なる観点による所定の条件を満たすノード間がエッジとは異なる特別エッジにより連結されたグラフ情報を取得する。取得部131は、一のアイテムに関するアイテム情報を取得する。取得部131は、複数のアイテムの各々に対応する複数のベクトルが、複数のアイテムの類似性に応じて連結されたグラフ情報と、一のアイテムに関するアイテム情報を取得する。取得部131は、複数のアイテムの各々の特徴を示す複数のベクトルが類似性に応じて連結されたグラフ情報を取得する。
取得部131は、所定のモデルを用いて複数のアイテムの各々から抽出された特徴量を要素とする複数のベクトルが、類似性に応じて連結されたグラフ情報を取得する。取得部131は、複数のアイテムに関する情報を所定のモデルに入力することにより、抽出される複数のアイテムの各々の特徴量を要素とする複数のベクトルが、類似性に応じて連結されたグラフ情報を取得する。
取得部131は、複数のアイテムのうち、ユーザ群の行動において所定の共通性を有するノード間が特別エッジにより連結されたグラフ情報を取得する。取得部131は、複数のアイテムのうち、ユーザ群の行動において所定の共通性を有するノード間が特別エッジにより連結されたグラフ情報を取得する。取得部131は、所定の期間において併せて購入される回数が所定の閾値以上である複数の商品である複数のアイテムに各々対応する複数のノード間が、特別エッジにより連結されたグラフ情報を取得する。取得部131は、複数のアイテムのうち、所定の閾値以上の検索時において共通して到達するノード間が特別エッジにより連結されたグラフ情報を取得する。
例えば、取得部131は、データ検索のアイテムとなる複数のノード(ベクトル)を取得する。例えば、取得部131は、複数のノードと、複数のノードの各々を連結する複数の有向エッジを含む有向エッジ群を取得する。
例えば、取得部131は、外部の情報処理装置からグラフ情報(グラフデータ)を取得する。例えば、取得部131は、グラフ情報記憶部123からグラフ情報を取得する。例えば、取得部131は、グラフ情報を取得する。図1の例では、取得部131は、グラフ情報GR11を取得する。
例えば、取得部131は、外部の情報処理装置からインデックス情報(インデックスデータ)を取得する。例えば、取得部131は、インデックス情報記憶部122からインデックス情報を取得する。例えば、取得部131は、木構造型のインデックス情報を取得する。図1の例では、取得部131は、インデックス情報IND11を取得する。
また、取得部131は、ユーザが利用する端末装置10から一のアイテムに関するアイテム情報を取得する。例えば、取得部131は、検索クエリとして、一のアイテムのアイテム情報を取得する。例えば、取得部131は、アイテムに関する検索クエリを取得する。取得部131は、ユーザU1が利用する端末装置10からアイテムXに関するアイテム情報IDT11を取得する。
例えば、取得部131は、一のアイテムに関するアイテム情報を取得する。例えば、取得部131は、端末装置10からアイテムXに関するアイテム情報IDT11を取得する。例えば、取得部131は、グラフ情報記憶部123からアイテムに関するグラフ情報GR11を取得する。また、例えば、取得部131は、インデックス情報記憶部122(図5参照)から、グラフ情報GR11における検索の起点となるノード(起点ベクトル)の決定に用いるインデックス情報IND11を取得する。
(生成部132)
生成部132は、各種情報を生成する。例えば、生成部132は、アイテム情報記憶部121に記憶された学習データ(アイテム情報)を用いて、モデル情報記憶部124に示すようなモデルを生成する。例えば、生成部132は、取得部131により取得された学習データに基づいて、入力したアイテム情報と同様の情報を出力するモデル(オートエンコーダ)を生成する。例えば、生成部132は、入力するアイテム情報自体を正解情報として、入力したアイテム情報と同様の情報を出力するモデル(オートエンコーダ)を生成する。
例えば、生成部132は、モデルM1等を生成し、生成したモデルM1等をモデル情報記憶部124に格納する。なお、生成部132は、いかなる学習アルゴリズムを用いてモデルM1を生成してもよい。例えば、生成部132は、ニューラルネットワーク(neural network)等の学習アルゴリズムを用いてモデルM1を生成する。一例として、生成部132がニューラルネットワークを用いてモデルM1等を生成する場合、モデルM1等は、一以上のニューロンを含む入力層と、一以上のニューロンを含む中間層と、一以上のニューロンを含む出力層とを有する。
生成部132は、アイテムのアイテム情報が入力される入力層と、出力層と、入力層から出力層までのいずれかの層であって出力層以外の層に属する第1要素と、第1要素と第1要素の重みとに基づいて値が算出される第2要素と、を含み、入力層に入力されたアイテム情報に対し、出力層以外の各層に属する各要素を第1要素として、第1要素と第1要素の重みとに基づく演算を行うことにより、入力層に入力される情報と同様の情報を出力層から出力するモデルを生成する。
例えば、生成部132は、学習データに基づいてモデルを生成する。例えば、生成部132は、アイテム情報記憶部121中のアイテム情報IDT1、IDT2等を学習データ(教師データ)として、学習を行なうことにより、モデルを生成する。
例えば、生成部132は、アイテム情報IDT1が入力された場合に、モデルM1がアイテム情報IDT1と同様の情報を出力するように、学習処理を行う。例えば、生成部132は、アイテム情報IDT2が入力された場合に、モデルM1がアイテム情報IDT2と同様の情報を出力するように、学習処理を行う。
なお、生成部132は、オートエンコーダとしてのモデルM1に限らず、種々の学習アルゴリズムを用いてアイテム(入館)に対応するモデルM21やアイテム(入国)に対応するモデルM22等を生成してもよい。例えば、生成部132は、ニューラルネットワーク(neural network)、サポートベクターマシン(SVM)、クラスタリング、強化学習等の学習アルゴリズムを用いてモデルM21、M22等を生成する。一例として、生成部132がニューラルネットワークを用いてモデルM21、M22等を生成する場合、モデルM21、M22等は、一以上のニューロンを含む入力層と、一以上のニューロンを含む中間層と、一以上のニューロンを含む出力層とを有する。なお、情報処理装置100は、情報提供装置50等の他の外部装置からモデルを取得する場合、生成部132を有しなくてもよい。
図1の例では、生成部132は、アイテム情報の特徴を抽出するモデルを用いて各アイテムのアイテム情報からN次元ベクトルを生成する。生成部132は、モデル情報記憶部124(図7)に示すモデルM1を用いて、各アイテムのアイテム情報からベクトルを生成する。
また、生成部132は、一のアイテムに対応するアイテム情報からグラフ情報の探索に用いるベクトルを生成する。図1の例では、生成部132は、処理群PS11に示すような処理により、アイテムXに対応するベクトルを生成する。生成部132は、アイテムXに関するアイテム情報IDT11をモデルM1に入力する。具体的には、生成部132は、アイテムXの商品カテゴリ、タイトル、説明文、画像情報、製造元、サイズ等の情報を含むアイテム情報IDT11をモデルM1に入力する。そして、生成部132は、アイテム情報IDT11の入力後のモデルM1中の情報を用いて、ベクトルを生成する。例えば、生成部132は、アイテム情報IDT11が入力されたモデルM1中の各要素を用いて、ベクトルデータを生成する。
図1の例では、生成部132は、アイテム情報IDT11が入力されたモデルM1中の各要素の値を用いて、ベクトルVD11を生成する。例えば、生成部132は、アイテムXのアイテム情報IDT11が入力された場合における、モデルM1のニューロンNL1に対応する値VE1(図11参照)やニューロンNL2に対応する値VE2(図11参照)を用いて、ベクトルを生成する。例えば、生成部132は、アイテムXのアイテム情報IDT11が入力された場合に、算出されるニューロンNL1に対応する値VE1をベクトルVD11の1次元目の要素として抽出してもよい。また、例えば、生成部132は、アイテムのアイテム情報が入力された場合に、算出されるニューロンNL2に対応する値VE2をベクトルVD11の2次元目の要素として、ベクトルVD11を生成する。図1の例では、生成部132は、1次元目の要素が「35」であり、2次元目の要素が「63」であるようなベクトルVD11を生成する。
(決定部133)
決定部133は、各種情報を決定する。決定部133は、起点ノードの決定に用いるインデックス情報に基づいて、起点ノードを決定する。例えば、決定部133は、取得部131により取得されたアイテム情報と、グラフ情報の検索の起点となる起点ベクトルに関する情報とに基づいて、起点ベクトルを決定する。例えば、決定部133は、アイテム情報と、グラフ情報の検索の起点ベクトルの決定の基準となる情報とに基づいて、起点ベクトルを決定する。また、決定部133は、起点ベクトルの決定に用いるインデックス情報に基づいて、起点ベクトルを決定する。また、決定部133は、木構造型のインデックス情報に基づいて、起点ベクトルを決定する。
図1の例では、決定部133は、一のアイテム(クエリ)に対応する起点ベクトルを決定(特定)するために、インデックス情報IND11を用いる。例えば、決定部133は、アイテムXのベクトルVD11に対応する起点ベクトルを決定(特定)するために、インデックス情報IND11を用いる。決定部133は、ベクトルVD11とインデックス情報IND11とを用いて、グラフ情報GR11における起点ベクトルを決定する。
例えば、決定部133は、図1中のインデックス情報IND11に示すような木構造型のインデックス情報を用いて、グラフ情報GR11における起点ベクトルを決定する。図1の例では、決定部133は、ベクトルVD11を生成した後、インデックス情報IND11を上から下へ辿ることにより、インデックス情報IND11の近傍候補となる起点ベクトルを特定することにより、効率的に検索クエリ(一のアイテム)に対応する起点ベクトルを決定する。
例えば、決定部133は、インデックス情報IND11をルートRTからリーフノード(グラフ情報GR11中のノード(ベクトル))まで辿ることにより、ベクトルVD11に対応する起点ベクトルを決定する。図1の例では、決定部133は、インデックス情報IND11をルートRTからノードN451まで辿ることにより、ノードN451を起点ベクトルとして決定する。
図1の例では、決定部133は、通常抽出ノードを参照元として、通常抽出ノードと他のオブジェクト(特別オブジェクト)とを連結する特別エッジがあると検索部134により判定された場合、その特別オブジェクトを抽出すると決定する。
(検索部134)
検索部134は、各種情報を検索する。例えば、検索部134は、取得部131により取得された情報を用いて、各種情報を検索する。例えば、検索部134は、各種情報を抽出する。例えば、検索部134は、取得部131により取得された情報を用いて、各種情報を抽出する。例えば、検索部134は、各種判定処理を行う。例えば、検索部134は、取得部131により取得された情報を用いて、各種情報を判定する。例えば、検索部134は、記憶部120に記憶された各種情報を検索する。例えば、取得部131は、アイテム情報記憶部121や、インデックス情報記憶部122や、グラフ情報記憶部123や、モデル情報記憶部124や履歴情報記憶部125等に記憶された各種情報を検索する。例えば、検索部134は、各種情報を用いて算出処理を行う。例えば、検索部134は、ベクトルに関する情報を用いて、ベクトル間の距離を算出する。例えば、検索部134は、グラフ情報記憶部123に記憶された各ノード(ベクトル)間を連結するエッジの長さ(距離)の情報を用いてもよいし、各ノードのベクトル情報から各ノード(ベクトル)間を連結するエッジの長さ(距離)の情報を算出し、算出した長さ(距離)の情報を用いてもよい。
検索部134は、取得部131により取得されたグラフ情報の複数のノードのうち、所定の基準に基づいて決定されたグラフ情報の検索の起点となる起点ノードを起点として、グラフ情報を検索することにより、複数のアイテムのうち、一のアイテムと類似するアイテムである対象アイテムを抽出する。検索部134は、決定部133により決定された起点ノードを起点として、対象アイテムを抽出する。検索部134は、グラフ情報の検索時において特別エッジが連結されたノードに到達した場合、当該ノードと特別エッジにより連結された他のノードを対象アイテムとして抽出する。
検索部134は、取得部131により取得されたグラフ情報の複数のベクトルのうち、所定の基準に基づいて決定されたグラフ情報の検索の起点となる起点ベクトルを起点としてグラフ情報を検索することにより、複数のアイテムのうち、一のアイテムに類似するアイテムである対象アイテムを抽出する。検索部134は、各種情報を抽出する。例えば、検索部134は、決定部133により決定された起点ベクトルを起点としてグラフ情報を検索することにより、複数のアイテムのうち、一のアイテムに類似するアイテムである類似アイテムを対象アイテムとして抽出する。
図1の例では、検索部134は、対象アイテムを検索する。例えば、検索部134は、アイテムXに関する対象アイテムを検索する。例えば、検索部134は、非特許文献1に開示されるような近傍検索の技術等の種々の従来技術を適宜用いて、アイテムXの対象アイテムを検索してもよい。例えば、検索部134は、類似性が高いノード間がエッジで連結されたグラフ情報GR11を用いる。
図1の例では、検索部134は、情報群INF11に示すように、グラフ情報GR11やインデックス情報IND11を用いてアイテムXの対象アイテムを検索する。検索部134は、ノードN451を起点として、グラフ情報GR11を探索することにより、ノードN451やノードN35を対象アイテムとして抽出する。
検索部134は、グラフ情報GR11における特別エッジ以外のエッジ(通常エッジ)を辿ってノード(通常抽出ノード)を抽出した場合、その通常抽出ノードから特別エッジが他のエッジに連結されているかどうかを判定する。例えば、検索部134は、通常抽出ノードを参照元として、通常抽出ノードと他のオブジェクトとを連結する特別エッジがあるかどうかを判定する。そして、検索部134は、通常抽出ノードを参照元として、通常抽出ノードと他のオブジェクト(特別オブジェクト)とを連結する特別エッジがあると判定した。
検索部134は、ノードN451を対象アイテムとして抽出した場合、ノードN451から特別エッジが他のエッジに連結されているかどうかを判定する。図1の例では、検索部134は、起点ノードであるノードN451を抽出した場合、ノードN451から特別エッジが他のエッジに連結されているかどうかを判定する。例えば、検索部134は、ノードN451からの特別エッジが0本、すなわちノードN451から他のエッジへの特別エッジはないと判定する。そして、検索部134は、ノードN451に関する特別オブジェクトの抽出はないと判定し、通常エッジでの検索を行う。
検索部134は、ノードN35を対象アイテムとして抽出した場合、ノードN35から特別エッジが他のエッジに連結されているかどうかを判定する。図1の例では、検索部134は、ノードN451から通常エッジを辿ることよりノードN35を抽出した場合、ノードN35から特別エッジが他のエッジに連結されているかどうかを判定する。例えば、検索部134は、ノードN35からはノードN831への特別エッジSE35が連結されているため、ノードN35から他のエッジへの特別エッジがあると判定する。そのため、検索部134は、ノードN35から特別エッジSE35が連結されたノードN831を対象アイテムとして抽出する。
また、検索部134は、特別エッジの連結により対象アイテムとして抽出されたノードから辿れるノードへの検索を行わなくてもよい。図1の例では、検索部134は、特別エッジの連結により対象アイテムとして抽出されたノードN831から辿れるノードへの検索を行わなくてもよい。この場合、検索部134は、ノードN35から通常エッジを辿ることによる検索を行う。なお、検索部134は、ノードN831から辿れるノードを対象アイテムとして抽出してもよい。
(提供部135)
提供部135は、各種情報を提供する。例えば、提供部135は、端末装置10や情報提供装置50に各種情報を送信する。例えば、提供部135は、端末装置10や情報提供装置50に各種情報を配信する。例えば、提供部135は、端末装置10や情報提供装置50に各種情報を提供する。提供部135は、検索部134により抽出された対象アイテムに基づいて、所定のサービスを提供する。また、提供部135は、対象アイテムに関する情報提供サービスを提供する。提供部135は、端末装置10に対象アイテムに関する情報を提供する。
提供部135は、検索部134により抽出された対象アイテムに基づいて、所定のサービスを提供する。提供部135は、端末装置10に所定のサービスを提供する。提供部135は、対象アイテムに関する情報提供サービスを提供する。
例えば、提供部135は、クエリに対応するオブジェクトIDを検索結果として提供する。例えば、提供部135は、検索部134により選択されたオブジェクトIDを情報提供装置50へ提供する。提供部135は、検索部134により選択されたオブジェクトIDをクエリに対応するベクトルを示す情報として情報提供装置50に提供する。また、提供部135は、生成部132により生成されたモデルを外部の情報処理装置へ提供してもよい。
図1の例では、提供部135は、ノードN451に対応するアイテム#451や、ノードN35に対応するアイテム#35や、ノードN831に対応するアイテム#831を対象アイテムとしてユーザU1が利用する端末装置10に提供する。
〔4.情報処理のフロー〕
次に、図9を用いて、実施形態に係る情報処理システム1による情報処理の手順について説明する。図9は、実施形態に係る情報処理の一例を示すフローチャートである。
図9に示すように、情報処理装置100は、一のアイテムに関するアイテム情報を取得する(ステップS101)。図1の例では、情報処理装置100は、端末装置10からアイテムXに関するアイテム情報IDT11を取得する。
情報処理装置100は、複数のアイテムに関するグラフ情報を取得する(ステップS102)。例えば、情報処理装置100は、グラフ情報記憶部123からアイテムに関するグラフ情報GR11を取得する。図1の例では、情報処理装置100は、グラフ情報記憶部123から特別エッジSE35を含むグラフ情報GR11を取得する。
そして、情報処理装置100は、モデルを用いて一のアイテムに関するアイテム情報からベクトルを生成する(ステップS103)。図1の例では、情報処理装置100は、モデル情報記憶部124に記憶されたモデルM1を用いて、アイテム情報IDT11からベクトルVD11を生成する。
そして、情報処理装置100は、生成したベクトルとインデックス情報を用いて起点ベクトルを決定する(ステップS104)。図1の例では、情報処理装置100は、ベクトルVD11と、インデックス情報記憶部122に記憶されたインデックス情報IND11とを用いて、起点ベクトルをノードN451に決定する。
そして、情報処理装置100は、グラフ情報を検索することにより、一のアイテムの類似アイテムを対象アイテムとして抽出し、グラフ情報の検索時において拡張エッジが連結されたノードに到達した場合、当該ノードと拡張エッジにより連結された他のノードを対象アイテムとして抽出する(ステップS105)。例えば、情報処理装置100は、グラフ情報を検索することにより、一のアイテムと類似するアイテムを対象アイテムとして抽出する。図1の例では、情報処理装置100は、ノードN35を抽出した場合、ノードN35を参照元とする特別エッジSE35の参照先であるノードN831を対象アイテムとして抽出する。
そして、情報処理装置100は、対象アイテムに基づいてサービスを提供する(ステップS106)。図1の例では、情報処理装置100は、対象アイテムとして抽出されたアイテム#451やアイテム#35やアイテム#831を示す情報をユーザU1が利用する端末装置10へ提供する。
〔5.生成処理のフロー〕
次に、図10を用いて、実施形態に係る情報処理システム1による生成処理の手順について説明する。図10は、実施形態に係る生成処理の一例を示すフローチャートである。
図10に示すように、情報処理装置100は、学習データを取得する(ステップS201)。例えば、情報処理装置100は、アイテム情報記憶部121から学習データを取得する。例えば、情報処理装置100は、アイテム情報記憶部121からアイテム情報IDT1、IDT2等を学習データとして取得する。
その後、情報処理装置100は、学習データに基づきモデルを生成する(ステップS202)。例えば、情報処理装置100は、アイテム情報記憶部121から学習データを用いてモデルM1を生成する。例えば、情報処理装置100は、入力層に入力される情報(アイテム情報)と同様の情報(アイテム情報)を出力層から出力するようにモデルM1を生成する。例えば、情報処理装置100は、アイテムのアイテム情報を入力とするオートエンコーダとしてのモデルM1を生成する。
〔6.検索例〕
ここで、上述したグラフ情報を用いた検索の一例を示す。なお、グラフ情報(グラフデータ)を用いた検索は下記に限らず、種々の手順により行われてもよい。この点について、図12を一例として説明する。図12は、グラフデータ(グラフ情報)を用いた検索処理の一例を示すフローチャートである。以下に説明する検索処理は、例えば情報処理装置100の検索部134によって行われる。また、以下でいうオブジェクトは、ベクトルやノードと読み替えてもよい。なお、以下では、情報処理装置100が検索処理を行うものとして説明するが、検索処理は他の装置により行われてもよい。例えば、情報処理装置100は、検索クエリとして、一のアイテムのアイテム情報から生成されたベクトルデータを用いる。例えば、情報処理装置100は、一のアイテムのアイテム情報から生成されたベクトルデータとインデックス情報とに基づいて決定された起点ベクトルを起点としてグラフデータを検索する。図1の例では、情報処理装置100は、アイテムXのベクトルVD11とインデックス情報IND11とに基づいて決定された起点ベクトルであるノードN451を起点としてグラフ情報GR11を検索する。
ここでは、近傍オブジェクト集合N(G,y)は、ノードyに付与されているエッジにより関連付けられている近傍のオブジェクトの集合である。「G」は、所定のグラフデータ(例えば、グラフ情報GR11等)であってもよい。例えば、情報処理装置100は、k近傍検索処理を実行する。
例えば、情報処理装置100は、超球の半径rを∞(無限大)に設定し(ステップS300)、既存のオブジェクト集合から部分集合Sを抽出する(ステップS301)。例えば、情報処理装置100は、ルートノード(起点ベクトル)として選択されたオブジェクト(ノード)を部分集合Sとして抽出してもよい。図1の例では、情報処理装置100は、起点ベクトルであるノードN451等を部分集合Sとして抽出してもよい。また、例えば、超球とは、検索範囲を示す仮想的な球である。なお、ステップS301において抽出されたオブジェクト集合Sに含まれるオブジェクトは、同時に検索結果のオブジェクト集合Rの初期集合にも含められる。
次に、情報処理装置100は、オブジェクト集合Sに含まれるオブジェクトの中で、検索クエリオブジェクトをyとするとオブジェクトyとの距離が最も短いオブジェクトを抽出し、オブジェクトsとする(ステップS302)。図1の例では、情報処理装置100は、オブジェクト集合Sに含まれるオブジェクトの中で、検索クエリオブジェクトであるベクトルVD11との距離が最も短いオブジェクトを抽出し、オブジェクトsとする。例えば、情報処理装置100は、オブジェクト集合Sに含まれるオブジェクトの中で、ベクトルVD11との距離が最も短いノードN451を抽出し、オブジェクトsとする。例えば、情報処理装置100は、ルートノード(起点ベクトル)として選択されたオブジェクト(ノード)のみがオブジェクト集合Sの要素の場合には、結果的にルートノード(起点ベクトル)がオブジェクトsとして抽出される。次に、情報処理装置100は、オブジェクトsをオブジェクト集合Sから除外する(ステップS303)。
次に、情報処理装置100は、オブジェクトsとオブジェクトyとの距離d(s,y)がr(1+ε)をこえる(超える)か否かを判定する(ステップS304)。ここで、εは拡張要素であり、r(1+ε)は、探索範囲(この範囲内のノードのみを探索する。検索範囲よりも大きくすることで精度を高めることができる)の半径を示す値である。オブジェクトsとオブジェクトyとの距離d(s,y)がr(1+ε)をこ超える場合(ステップS304:Yes)、情報処理装置100は、オブジェクト集合Rをオブジェクトyの近傍オブジェクト集合として出力し(ステップS305)、処理を終了する。
オブジェクトsと検索クエリオブジェクトyとの距離d(s,y)がr(1+ε)を超えない場合(ステップS304:No)、情報処理装置100は、オブジェクトsの近傍オブジェクト集合N(G,s)の要素であるオブジェクトの中からオブジェクト集合Cに含まれないオブジェクトを一つ選択し、選択したオブジェクトuを、オブジェクト集合Cに格納する(ステップS306)。オブジェクト集合Cは、重複検索を回避するために便宜上設けられるものであり、処理開始時には空集合に設定される。
次に、情報処理装置100は、オブジェクトuとオブジェクトyとの距離d(u,y)がr(1+ε)以下であるか否かを判定する(ステップS307)。オブジェクトuとオブジェクトyとの距離d(u,y)がr(1+ε)以下である場合(ステップS307:Yes)、情報処理装置100は、オブジェクトuをオブジェクト集合Sに追加する(ステップS308)。また、オブジェクトuとオブジェクトyとの距離d(u,y)がr(1+ε)以下ではない場合(ステップS307:No)、情報処理装置100は、ステップS309の判定(処理)を行う。
次に、情報処理装置100は、オブジェクトuとオブジェクトyとの距離d(u,y)がr以下であるか否かを判定する(ステップS309)。オブジェクトuとオブジェクトyとの距離d(u,y)がrをえる場合(ステップS309:No)、情報処理装置100は、ステップS315の判定(処理)を行う。また、オブジェクトuとオブジェクトyとの距離d(u,y)がr以下ではない場合(ステップS309:No)、情報処理装置100は、ステップS315の判定(処理)を行う。
オブジェクトuとオブジェクトyとの距離d(u,y)がr以下である場合(ステップS309:Yes)、情報処理装置100は、オブジェクトuをオブジェクト集合Rに追加する(ステップS310)。
ここで、ステップS310後において、情報処理装置100は、オブジェクトuを参照元として、オブジェクトuと他のオブジェクトとを連結する特別エッジがあるかどうかを判定する。情報処理装置100は、オブジェクトuを参照元として、オブジェクトuと他のオブジェクト(特別オブジェクト)とを連結する特別エッジがあると判定した場合、その特別オブジェクトを抽出すると決定する。なお、情報処理装置100は、特別オブジェクトをオブジェクト集合Rに追加してもよいし、オブジェクト集合Rとは個別に特別オブジェクトの情報を記憶してもよい。また、情報処理装置100は、特別オブジェクトの数を後述するksとの比較に用いなくてもよい。例えば、情報処理装置100は、特別オブジェクトを抽出した場合、特別オブジェクトの数をオブジェクト数に加えてもよいし、特別オブジェクトの数をオブジェクト数に加えなくてもよい。例えば、情報処理装置100は、ステップS311やステップS313でのksとの比較処理を、特別オブジェクトを除くオブジェクト集合Rに含まれる通常オブジェクトの数を対象に行ってもよい。
例えば、情報処理装置100は、特別オブジェクトをオブジェクト集合Rに追加する場合、特別オブジェクトに特定のフラグ等を付与することにより、他のオブジェクト(通常オブジェクト)と識別可能に特別オブジェクトを管理してもよい。この場合、情報処理装置100は、オブジェクト集合Rに含まれる特別オブジェクト以外のオブジェクト(通常オブジェクト)の数をオブジェクト集合Rに含まれるオブジェクトの数としてもよい。また、情報処理装置100は、オブジェクト集合Rに含まれる特別オブジェクトをステップS312やステップS314で対象となるオブジェクトに含めなくてもよい。例えば、情報処理装置100は、ステップS312やステップS314の処理を、特別オブジェクトを除くオブジェクト集合Rに含まれる通常オブジェクトのみを対象に行ってもよい。
また、情報処理装置100は、オブジェクト集合Rとは別の集合(特別集合)に特別オブジェクトを追加してもよい。この場合、情報処理装置100は、ステップS317においてオブジェクト集合Rに含まれるオブジェクトと特別集合に含まれるオブジェクト(特別オブジェクト)の両方を検索結果として出力してもよい。
情報処理装置100は、オブジェクト集合Rに含まれるオブジェクト数がksをこえるか否かを判定する(ステップS311)。所定数ksは、任意に定められる自然数である。例えば、ks=2やks=10等の種々の設定であってもよい。オブジェクト集合Rに含まれるオブジェクト数がksを超えない場合(ステップS311:No)、情報処理装置100は、ステップS313の判定(処理)を行う。
オブジェクト集合Rに含まれるオブジェクト数がksをこえる場合(ステップS311:Yes)、情報処理装置100は、オブジェクト集合Rに含まれるオブジェクトの中でオブジェクトyとの距離が最も長い(遠い)オブジェクトを、オブジェクト集合Rから除外する(ステップS312)。
次に、情報処理装置100は、オブジェクト集合Rに含まれるオブジェクト数がksと一致するか否かを判定する(ステップS313)。オブジェクト集合Rに含まれるオブジェクト数がksと一致しない場合(ステップS313:No)、情報処理装置100は、ステップS315の判定(処理)を行う。また、オブジェクト集合Rに含まれるオブジェクト数がksと一致する場合(ステップS313:Yes)、情報処理装置100は、オブジェクト集合Rに含まれるオブジェクトの中でオブジェクトyとの距離が最も長い(遠い)オブジェクトと、オブジェクトyとの距離を、新たなrに設定する(ステップS314)。
そして、情報処理装置100は、オブジェクトsの近傍オブジェクト集合N(G,s)の要素であるオブジェクトから全てのオブジェクトを選択してオブジェクト集合Cに格納し終えたか否かを判定する(ステップS315)。オブジェクトsの近傍オブジェクト集合N(G,s)の要素であるオブジェクトから全てのオブジェクトを選択してオブジェクト集合Cに格納し終えていない場合(ステップS315:No)、情報処理装置100は、ステップS306に戻って処理を繰り返す。
オブジェクトsの近傍オブジェクト集合N(G,s)の要素であるオブジェクトから全てのオブジェクトを選択してオブジェクト集合Cに格納し終えた場合(ステップS315:Yes)、情報処理装置100は、オブジェクト集合Sが空集合であるか否かを判定する(ステップS316)。オブジェクト集合Sが空集合でない場合(ステップS316:No)、情報処理装置100は、ステップS302に戻って処理を繰り返す。また、オブジェクト集合Sが空集合である場合(ステップS316:Yes)、情報処理装置100は、オブジェクト集合Rを出力し、処理を終了する(ステップS317)。例えば、情報処理装置100は、オブジェクト集合Rに含まれるオブジェクト(ノード)を検索クエリ(入力オブジェクトy)に対応する検索結果として、検索を行った端末装置10等へ提供してもよい。図1の例では、情報処理装置100は、オブジェクト集合Rに含まれるノードN451やノードN35を検索クエリ(アイテムXのベクトルVD11)に対応する検索結果として、検索を行った端末装置10等へ提供してもよい。例えば、情報処理装置100は、ノードN451に対応するアイテム#451や、ノードN35に対応するアイテム#35や、ノードN1に対応するアイテム#1を対象アイテムとしてユーザU1が利用する端末装置10に提供する。
〔7.効果〕
上述してきたように、実施形態に係る情報処理装置100は、取得部131と、検索部134とを有する。取得部131は、複数のアイテムの各々に対応する複数のノードが、複数のアイテムの類似性に応じてエッジにより連結されたグラフ情報であって、複数のノードのうち、類似性とは異なる観点による所定の条件を満たすノード間がエッジとは異なる特別エッジにより連結されたグラフ情報と、一のアイテムに関するアイテム情報を取得する。検索部134は、取得部131により取得されたグラフ情報の複数のノードのうち、所定の基準に基づいて決定されたグラフ情報の検索の起点となる起点ノードを起点として、グラフ情報を検索することにより、複数のアイテムのうち、一のアイテムと類似するアイテムである類似アイテムを対象アイテムとして抽出し、グラフ情報の検索時において特別エッジが連結されたノードに到達した場合、当該ノードと特別エッジにより連結された他のノードを対象アイテムとして抽出する。
このように、実施形態に係る情報処理装置100は、起点ベクトルを起点としてグラフ情報を検索することにより、複数のアイテムのうち、一のアイテムの類似アイテム等を含む対象アイテムを適切に抽出することができる。
また、実施形態に係る情報処理装置100は、決定部133を有する。決定部133は、起点ノードの決定に用いるインデックス情報に基づいて、起点ノードを決定する。検索部134は、決定部133により決定された起点ノードを起点として、対象アイテムを抽出する。
このように、実施形態に係る情報処理装置100は、起点ベクトルの決定に用いるインデックス情報に基づいて、起点ベクトルを決定することにより、アイテムを適切に抽出することができる。
また、実施形態に係る情報処理装置100において、決定部133は、木構造型のインデックス情報に基づいて、起点ベクトルを決定する。
このように、実施形態に係る情報処理装置100は、木構造型のインデックス情報に基づいて、起点ベクトルを決定することにより、アイテムを適切に抽出することができる。
また、実施形態に係る情報処理装置100において、取得部131は、複数のアイテムの各々の特徴を示す複数のベクトルが類似性に応じて連結されたグラフ情報を取得する。
このように、実施形態に係る情報処理装置100は、複数のアイテムの各々の特徴を示す複数のベクトルが類似性に応じて連結されたグラフ情報を取得することにより、アイテムを適切に抽出することができる。
また、実施形態に係る情報処理装置100において、取得部131は、所定のモデルを用いて複数のアイテムの各々から抽出された特徴量を要素とする複数のベクトルが、類似性に応じて連結されたグラフ情報を取得する。
このように、実施形態に係る情報処理装置100は、所定のモデルを用いて複数のアイテムの各々から抽出された特徴量を要素とする複数のベクトルが、類似性に応じて連結されたグラフ情報を取得することにより、アイテムを適切に抽出することができる。
また、実施形態に係る情報処理装置100において、取得部131は、複数のアイテムに関する情報を所定のモデルに入力することにより、抽出される複数のアイテムの各々の特徴量を要素とする複数のベクトルが、類似性に応じて連結されたグラフ情報を取得する。
このように、実施形態に係る情報処理装置100は、複数のアイテムに関する情報を所定のモデルに入力することにより、抽出される複数のアイテムの各々の特徴量を要素とする複数のベクトルが、類似性に応じて連結されたグラフ情報を取得することにより、アイテムを適切に抽出することができる。
また、実施形態に係る情報処理装置100において、取得部131は、複数のアイテムのうち、ユーザ群の行動において所定の共通性を有するノード間が特別エッジにより連結されたグラフ情報を取得する。
このように、実施形態に係る情報処理装置100は、複数のアイテムのうち、ユーザ群の行動において所定の共通性を有するノード間が特別エッジにより連結されたグラフ情報を取得することにより、アイテムを適切に抽出することができる。
また、実施形態に係る情報処理装置100において、取得部131は、複数のアイテムのうち、ユーザ群の行動において所定の共通性を有するノード間が特別エッジにより連結されたグラフ情報を取得する。
このように、実施形態に係る情報処理装置100は、複数のアイテムのうち、ユーザ群の行動において所定の共通性を有するノード間が特別エッジにより連結されたグラフ情報を取得することにより、アイテムを適切に抽出することができる。
また、実施形態に係る情報処理装置100において、取得部131は、所定の期間において併せて購入される回数が所定の閾値以上である複数の商品である複数のアイテムに各々対応する複数のノード間が、特別エッジにより連結されたグラフ情報を取得する。
このように、実施形態に係る情報処理装置100は、所定の期間において併せて購入される回数が所定の閾値以上である複数の商品である複数のアイテムに各々対応する複数のノード間が、特別エッジにより連結されたグラフ情報を取得することにより、アイテムを適切に抽出することができる。
また、実施形態に係る情報処理装置100は、提供部135を有する。提供部135は、検索部134により抽出された対象アイテムに基づいて、所定のサービスを提供する。
このように、実施形態に係る情報処理装置100は、抽出した対象アイテムに基づいて、所定のサービスを提供することにより、類似のアイテムに関する情報を用いたサービスを適切に提供することができる。
また、実施形態に係る情報処理装置100において、取得部131は、ユーザが利用する端末装置から一のアイテムに関するアイテム情報を取得する。提供部135は、端末装置10に所定のサービスを提供する。
このように、実施形態に係る情報処理装置100は、ユーザが利用する端末装置10から一のアイテムに関するアイテム情報を取得し、端末装置10に所定のサービスを提供することにより、類似のアイテムに関する情報を用いたサービスを適切に提供することができる。
また、実施形態に係る情報処理装置100において、提供部135は、対象アイテムに関する情報提供サービスを提供する。
このように、実施形態に係る情報処理装置100は、対象アイテムに関する情報提供サービスを提供することにより、類似のアイテムに関する情報を用いたサービスを適切に提供することができる。
〔8.ハードウェア構成〕
上述してきた実施形態に係る情報処理装置100は、例えば図14に示すような構成のコンピュータ1000によって実現される。図14は、情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM(Read Only Memory)1300、HDD(Hard Disk Drive)1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を有する。
CPU1100は、ROM1300またはHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。
HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を格納する。通信インターフェイス1500は、ネットワークNを介して他の機器からデータを受信してCPU1100へ送り、CPU1100が生成したデータをネットワークNを介して他の機器へ送信する。
CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、生成したデータを入出力インターフェイス1600を介して出力装置へ出力する。
メディアインターフェイス1700は、記録媒体1800に格納されたプログラムまたはデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
例えば、コンピュータ1000が実施形態に係る情報処理装置100として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムまたはデータ(例えば、モデルM1(モデルデータMDT1))を実行することにより、制御部130の機能を実現する。コンピュータ1000のCPU1100は、これらのプログラムまたはデータ(例えば、モデルM1(モデルデータMDT1))を記録媒体1800から読み取って実行するが、他の例として、他の装置からネットワークNを介してこれらのプログラムを取得してもよい。
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の行に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
〔9.その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
また、上述してきた各実施形態に記載された各処理は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、取得部は、取得手段や取得回路に読み替えることができる。