JP6852114B2

JP6852114B2 - 特定装置、特定方法及び特定プログラム

Info

Publication number: JP6852114B2
Application number: JP2019099738A
Authority: JP
Inventors: 泰介森; 高昌澁川; 知紘小川; 寺田　幸弘; 幸弘寺田; 朋美田畑; 將久田浦; 洋平新宅
Original assignee: Yahoo Japan Corp
Current assignee: Yahoo Japan Corp
Priority date: 2019-05-28
Filing date: 2019-05-28
Publication date: 2021-03-31
Anticipated expiration: 2039-05-28
Also published as: JP2021005117A

Description

本発明は、特定装置、特定方法及び特定プログラムに関する。

近年、インターネットの飛躍的な普及に伴い、例えば、インターネット上の種々の情報を用いた分析に関する技術が提供されている。例えば、ユーザが入力した検索クエリに基づいて、所定の事業者が提供する対象に対するニーズに関する情報を抽出する技術が提案されている。

特開２０１９−３２７７６号公報

しかしながら、上記の従来技術では、有用な情報を得ることができるとは限らない。例えば、上記の従来技術では、所定の事業者が提供する対象に対するニーズに関する情報を抽出しているに過ぎないので、対象を所望する利用者に提案する他の対象を適切に選択できるとは言えない。

本願は、上記に鑑みてなされたものであって、有用な情報を提供することができる特定装置、特定方法及び特定プログラムを提供することを目的とする。

本願に係る特定装置は、利用者が入力した検索クエリを取得する取得部と、前記取得部により取得された検索クエリを利用者が入力した際の検索意図と、他の検索クエリを利用者が入力した際の検索意図との類似性に基づいて、前記取得部により取得された検索クエリと所定の関連性を有する他の検索クエリを特定する特定部とを有することを特徴とする。

実施形態の一態様によれば、有用な情報を得ることができるといった効果を奏する。

図１は、実施形態に係る特定処理の一例を示す図である。図２は、実施形態に係る特定システムの構成例を示す図である。図３は、実施形態に係る特定装置の構成例を示す図である。図４は、実施形態に係る利用者情報記憶部の一例を示す図である。図５は、実施形態に係るモデル情報記憶部の一例を示す図である。図６は、実施形態に係る特定手順を示すフローチャートである。図７は、実施形態に係る第１モデルの生成処理の一例を示す図である。図８は、実施形態に係る第１モデルの生成処理の一例を示す図である。図９は、実施形態に係る生成装置の構成例を示す図である。図１０は、実施形態に係るクエリ情報記憶部の一例を示す図である。図１１は、実施形態に係るベクトル情報記憶部の一例を示す図である。図１２は、実施形態に係るモデル情報記憶部の一例を示す図である。図１３は、実施形態に係る第１モデルの一例を示す図である。図１４は、実施形態に係る第１モデルの生成処理手順を示すフローチャートである。図１５は、プログラムを実行するコンピュータのハードウェア構成の一例を示す図である。

以下に、本願に係る特定装置、特定方法及び特定プログラムを実施するための形態（以下、「実施形態」と呼ぶ）について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る特定装置、特定方法及び特定プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略する。

〔１．特定処理の一例〕
まず、図１を用いて、実施形態に係る特定処理の一例について説明する。図１は、実施形態に係る特定処理の一例を示す図である。実施形態に係る特定処理は、図１に示す特定装置１００によって行われる。図１に示す特定装置１００は、クライアント（企業等）に対して、検索クエリの分析サービスを提供するサーバ装置である。

図１の説明に先立って、図２を用いて、実施形態に係る特定システムの構成について説明する。図２は、実施形態に係る特定システムの構成例を示す図である。図２に示すように、特定システム１には、端末装置１０と、検索サーバ２０と、生成装置５０と、特定装置１００とが含まれる。端末装置１０と、検索サーバ２０と、生成装置５０と、特定装置１００とは所定のネットワークＮを介して、有線または無線により通信可能に接続される。なお、図２に示す特定システム１には、任意の数の端末装置１０と任意の数の検索サーバ２０と任意の数の生成装置５０と任意の数の特定装置１００とが含まれてもよい。

端末装置１０は、クライアント（企業等）の担当者である利用者によって使用される情報処理装置である。端末装置１０は、例えば、スマートフォンや、タブレット型端末や、ノート型ＰＣ（Personal Computer）や、携帯電話機や、ＰＤＡ（Personal Digital Assistant）等により実現される。図１に示す例では、端末装置１０はノート型ＰＣである。なお、以下では、端末装置１０を利用者と同一視する場合がある。すなわち、以下では、利用者を端末装置１０と読み替えることもできる。

端末装置１０は、クライアント（企業等）の担当者である利用者Ｕ１０の操作に従って、利用者Ｕ１０によって入力された検索クエリを特定装置１００に送信する。例えば、端末装置１０は、特定装置１００によって提供される検索クエリの分析サービスを利用するためのユーザーインターフェースを通じて、検索クエリを特定装置１００に送信する。

検索サーバ２０は、検索サービスを提供するサーバ装置である。例えば、検索サーバ２０が提供する検索サービスは、あらゆる情報を検索可能な総合検索サービスである。検索サーバ２０は、利用者によって入力された検索クエリに関する情報を記憶する。具体的には、検索サーバ２０は、利用者の検索履歴に関する情報を記憶する。また、検索サーバ２０は、生成装置５０の要求に応じて、利用者によって入力された検索クエリに関する情報を生成装置５０に送信する。また、検索サーバ２０は、特定装置１００の要求に応じて、利用者によって入力された検索クエリに関する情報を特定装置１００に送信する。

生成装置５０は、第１モデルＭ１を生成するサーバ装置である。生成装置５０は、後述する処理を実行することにより、第１モデルＭ１を生成する。第１モデルＭ１は、検索クエリを入力すると、検索クエリの分散表現を出力するモデルである。ここで、第１モデルＭ１から出力された検索クエリの分散表現には、検索クエリを入力した利用者の検索意図を示す特徴情報が含まれている。すなわち、第１モデルＭ１から出力された所定の検索クエリの分散表現と他の検索クエリの分散表現が類似することは、所定の検索クエリを入力した利用者の検索意図と他の検索クエリを入力した利用者の検索意図とが類似することを意味する。なお、生成装置５０による第１モデルの生成処理の詳細については後述する。

特定装置１００は、企業等であるクライアントに対して、クライアントが指定した分析対象を示すキーワード（文字情報）に関する一般利用者の検索動向を分析する検索クエリの分析サービスを提供するサーバ装置である。図１に示す例では、特定装置１００は、利用者が入力した検索クエリを取得する。また、特定装置１００は、取得した検索クエリを利用者が入力した際の検索意図と、他の検索クエリを利用者が入力した際の検索意図との類似性に基づいて、取得した検索クエリと所定の関連性を有する他の検索クエリを特定する。

一般的に、一の対象を示す検索クエリ（例えば、「お酒」）と比較して、複数の対象を示す検索クエリ（例えば、「お酒枝豆」）は、検索クエリを入力した利用者の検索意図が現れやすいと考えられる。例えば、対象「お酒」と対象「枝豆」の組を示す「お酒枝豆」という文字列の並びは、「「お酒」における「枝豆」」や「「お酒」と「枝豆」との関係」という意味を想起させる。そのため、検索クエリ「お酒枝豆」は、「「お酒」における「枝豆」」や「「お酒」と「枝豆」との関係」に関する情報を得たいという利用者の検索意図を想起させる。このように、対象の組を示す検索クエリは、第１対象を示す文字列と第２対象を示す文字列の並びを含む。そして、一般的に、（第１対象、第２対象）といった対象の組を示す検索クエリは、第１対象と第２対象との関係性に関する知識を得るという利用者の検索意図が現れやすいと考えられる。

そこで、本願発明に係る特定装置１００は、検索クエリを利用者が入力した際の検索意図と、他の検索クエリを利用者が入力した際の検索意図との類似性に基づいて、検索クエリと所定の関連性を有する他の検索クエリを特定する。例えば、本願発明に係る特定装置１００は、それぞれ異なる取引対象の組を示す検索クエリ（例えば、「お酒枝豆」）を利用者が入力した際の検索意図と、他の取引対象の組を示す他の検索クエリを利用者が入力した際の検索意図との類似性に基づいて、検索クエリ（例えば、「お酒枝豆」）と所定の関連性を有する他の検索クエリ（例えば、「ビール刺身」）を特定する。これにより、本願発明に係る特定装置１００は、特定した他の検索クエリ（例えば、「ビール刺身」）に基づいて、検索クエリ（例えば、「お酒枝豆」）が示す取引対象（例えば、「お酒」や「枝豆」）に関する新たな知見を得ることができる。例えば、本願発明に係る特定装置１００は、検索クエリ（例えば、「お酒枝豆」）が示す取引対象（例えば、「お酒」や「枝豆」）の代替品（例えば、「お酒」の代替品として「ビール」、「枝豆」の代替品として「刺身」）に関する情報を得ることができる。

ここから、図１を用いて、特定処理の流れについて説明する。図１では、特定装置１００は、利用者ＩＤ「Ｕ１０」で識別される利用者（利用者Ｕ１０）から、第１取引対象である「お酒」と第２取引対象である「枝豆」との組を示す検索クエリＱ１「お酒枝豆」を取得する（ステップＳ１）。なお、第１取引対象と第２取引対象は、それぞれ異なる取引対象の組を示す検索クエリに含まれる２つの取引対象を互いに区別して説明するために用いるものである。すなわち、組に含まれる２つの取引対象のうち、どちらの取引対象が第１取引対象であってもよく、どちらの取引対象が第２取引対象であってもよい。例えば、検索クエリＱ１「お酒枝豆」を例にとると、第１取引対象が「枝豆」であり、第２取引対象が「お酒」であってもよい。また、検索クエリが示す取引対象の組に含まれる２つの取引対象を示す文字列の語順は、入れ替わってもよい。例えば、図１では、第１取引対象を示す文字列「お酒」が前で第２取引対象を示す文字列「枝豆」が後に並ぶ検索クエリＱ１「お酒枝豆」の例について説明するが、第２取引対象を示す文字列「枝豆」が前で第１取引対象を示す文字列「お酒」が後に並ぶような検索クエリ「枝豆お酒」であってもよい。

特定装置１００は、検索クエリＱ１「お酒枝豆」を取得すると、検索クエリＱ１「お酒枝豆」とは異なる他の取引対象の組を示す他の検索クエリ（例えば、「ビール刺身」等）を検索サーバ２０から取得する（ステップＳ２）。

特定装置１００は、検索クエリＱ１「お酒枝豆」と他の検索クエリとを取得すると、検索クエリとして入力された際の検索意図が、検索クエリＱ１「お酒枝豆」と類似する他の検索クエリを関連クエリとして特定する。具体的には、特定装置１００は、検索クエリＱ１「お酒枝豆」と他の検索クエリとを取得すると、検索クエリＱ１「お酒枝豆」を利用者が入力した際の検索意図と、他の検索クエリを利用者が入力した際の検索意図との類似性を示すスコアを算出する（ステップＳ３）。

より具体的には、特定装置１００は、検索クエリＱ１「お酒枝豆」を取得すると、取得した検索クエリＱ１「お酒枝豆」を第１モデルＭ１に入力して、検索クエリＱ１「お酒枝豆」の分散表現を出力（生成）する。また、特定装置１００は、他の検索クエリを取得すると、取得した他の検索クエリを第１モデルＭ１に入力して、他の検索クエリの分散表現を出力（生成）する。続いて、特定装置１００は、検索クエリＱ１「お酒枝豆」の分散表現と他の検索クエリの分散表現とを生成すると、検索クエリＱ１「お酒枝豆」の分散表現と他の検索クエリの分散表現との類似度を算出する。

ここで、第１モデルＭ１から出力される検索クエリの分散表現には、検索クエリを入力した利用者の検索意図を示す特徴情報が含まれている。例えば、第１モデルＭ１から出力された検索クエリＱ１「お酒枝豆」の分散表現には、検索クエリＱ１「お酒枝豆」を入力した利用者の検索意図を示す特徴情報が含まれている。また、第１モデルＭ１から出力された他の検索クエリの分散表現には、他の検索クエリを入力した利用者の検索意図を示す特徴情報が含まれている。すなわち、第１モデルＭ１から出力された所定の検索クエリの分散表現と他の検索クエリの分散表現が類似することは、所定の検索クエリを入力した利用者の検索意図と他の検索クエリを入力した利用者の検索意図とが類似することを意味する。そこで、特定装置１００は、検索クエリＱ１「お酒枝豆」を利用者が入力した際の検索意図と、他の検索クエリを利用者が入力した際の検索意図との類似性を示すスコアとして、検索クエリＱ１「お酒枝豆」の分散表現と他の検索クエリの分散表現との類似度を算出する。

特定装置１００は、スコアを算出すると、算出したスコアが所定の閾値以上である他の検索クエリを関連クエリとして特定する。図１に、特定装置１００によって特定された関連クエリをスコアの高い方から順に並べた関連クエリの一覧である類似ランキングを示す。図１に示すように、特定装置１００は、検索クエリとして入力された際の検索意図が、検索クエリＱ１「お酒枝豆」が示す取引対象の組と類似する他の取引対象の組を示す関連クエリを特定する（ステップＳ４）。

例えば、特定装置１００は、取引対象「ビール」と取引対象「枝豆」の組を示す関連クエリＱ１１「ビール枝豆」を特定する（類似ランキング１位）。また、特定装置１００は、取引対象「ビール」と取引対象「刺身」の組を示す関連クエリＱ１２「ビール刺身」を特定する（類似ランキング８位）。また、特定装置１００は、取引対象「ビール」と取引対象「唐揚げ」の組を示す関連クエリＱ１３「ビール唐揚げ」を特定する（類似ランキング１２位）。また、特定装置１００は、取引対象「ビール」と取引対象「チーズ」の組を示す関連クエリＱ１４「ビールチーズ」を特定する（類似ランキング１４位）。

特定装置１００は、関連クエリを特定すると、関連クエリが示す組に含まれる取引対象の共通性に基づいて、検索クエリＱ１「お酒枝豆」が示す組に含まれる第１取引対象である「お酒」の代替品を特定する（ステップＳ５）。具体的には、特定装置１００は、特定した３０個の関連クエリのうち、取引対象「ビール」が４個の関連クエリＱ１１〜Ｑ１４に共通することから、取引対象「ビール」を第１取引対象である「お酒」と近い検索意図で検索されている可能性が高いという関連性を有する第１関連取引対象として特定する。続いて、特定装置１００は、第１関連取引対象として特定した「ビール」は第１取引対象である「お酒」と近い検索意図で検索されている可能性が高いので、第１関連取引対象として特定した取引対象「ビール」を第１取引対象である「お酒」の代替品として特定する。

特定装置１００は、第１取引対象である「お酒」の代替品を特定すると、検索クエリＱ１「お酒枝豆」が示す組に含まれる第２取引対象である「枝豆」の代替品を特定する（ステップＳ６）。具体的には、特定装置１００は、第１取引対象である「お酒」の代替品として特定した第１関連取引対象である「ビール」を含む組を示す関連クエリＱ１１〜Ｑ１４を特定する。続いて、特定装置１００は、特定した関連クエリＱ１１〜Ｑ１４が示す組に含まれる取引対象のうち、第１関連取引対象である「ビール」とは異なる取引対象を、第２取引対象である「枝豆」と近い検索意図で検索されている可能性が高いという関連性を有する第２関連取引対象として特定する。

例えば、特定装置１００は、特定した関連クエリＱ１２が示す組に含まれる取引対象のうち、第１関連取引対象である「ビール」とは異なる取引対象「刺身」を、第２取引対象である「枝豆」と近い検索意図で検索されている可能性が高いという関連性を有する第２関連取引対象として特定する。続いて、特定装置１００は、第２関連取引対象として特定した「刺身」は第２取引対象である「枝豆」と近い検索意図で検索されている可能性が高いので、第２関連取引対象として特定した取引対象「刺身」を第２取引対象である「枝豆」の代替品として特定する。

また、特定装置１００は、特定した関連クエリＱ１３が示す組に含まれる取引対象のうち、第１関連取引対象である「ビール」とは異なる取引対象「唐揚げ」を、第２取引対象である「枝豆」と近い検索意図で検索されている可能性が高いという関連性を有する第２関連取引対象として特定する。続いて、特定装置１００は、第２関連取引対象として特定した「唐揚げ」は第２取引対象である「枝豆」と近い検索意図で検索されている可能性が高いので、第２関連取引対象として特定した取引対象「唐揚げ」を第２取引対象である「枝豆」の代替品として特定する。

また、特定装置１００は、特定した関連クエリＱ１４が示す組に含まれる取引対象のうち、第１関連取引対象である「ビール」とは異なる取引対象「チーズ」を、第２取引対象である「枝豆」と近い検索意図で検索されている可能性が高いという関連性を有する第２関連取引対象として特定する。続いて、特定装置１００は、第２関連取引対象として特定した「チーズ」は第２取引対象である「枝豆」と近い検索意図で検索されている可能性が高いので、第２関連取引対象として特定した取引対象「チーズ」を第２取引対象である「枝豆」の代替品として特定する。

また、特定装置１００は、取得した検索クエリＱ１と特定した関連クエリとの比較に基づいて、検索クエリＱ１に関する情報を利用者Ｕ１０に対して提供する（ステップＳ７）。例えば、特定装置１００は、図１に示す検索クエリＱ１と類似する関連クエリをスコア順に並べた関連クエリの一覧である類似ランキングを利用者Ｕ１０に対して提供する。

また、特定装置１００は、検索クエリＱ１に含まれる第１取引対象「お酒」に関する所定の傾向に関する情報として、「ビール」は「お酒」に近い意図で検索されている可能性が高いという情報を提供する。

また、特定装置１００は、検索クエリＱ１に含まれる第２取引対象「枝豆」に関する所定の傾向に関する情報として、「刺身」と「唐揚げ」と「チーズ」は、「お酒」における「枝豆」に近い意図で検索されている可能性が高いという情報を提供する。

また、特定装置１００は、特定装置１００は、検索クエリＱ１に含まれる第１取引対象「お酒」の代替品として「ビール」が想定されるという代替情報を提供する。また、特定装置１００は、「お酒」の代替品として「ビール」が想定されるため、「お酒」に用いられているお酒つゆの商品を「ビール」にも使えるように商品開発を行うことを提案する提案情報を提供する。

また、特定装置１００は、検索クエリＱ１に含まれる「お酒」におけるおつまみである「枝豆」の代替品として「刺身」や「唐揚げ」や「チーズ」が想定されるという代替情報を提供する。

上述したように、特定装置１００は、利用者が入力した検索クエリを取得する。また、特定装置１００は、取得した検索クエリを利用者が入力した際の検索意図と、他の検索クエリを利用者が入力した際の検索意図との類似性に基づいて、取得した検索クエリと所定の関連性を有する他の検索クエリを特定する。これにより、特定装置１００は、検索クエリを利用者が入力した際の検索意図の類似性に基づいて、検索クエリが示す分析対象を所望する利用者に提案する他の対象を適切に選択することができる。したがって、特定装置１００は、有用な情報を得ることができる。

〔２．特定装置の構成〕
次に、図３を用いて、実施形態に係る特定装置１００の構成について説明する。図３は、実施形態に係る特定装置１００の構成例を示す図である。図３に示すように、特定装置１００は、通信部１１０と、記憶部１２０と、制御部１３０とを有する。なお、特定装置１００は、特定装置１００の管理者等から各種操作を受け付ける入力部（例えば、キーボードやマウス等）や、各種情報を表示させるための表示部（例えば、液晶ディスプレイ等）を有してもよい。

（通信部１１０）
通信部１１０は、例えば、ＮＩＣ（Network Interface Card）等によって実現される。そして、通信部１１０は、ネットワークと有線または無線で接続され、例えば、端末装置１０と検索サーバ２０と生成装置５０との間で情報の送受信を行う。

（記憶部１２０）
記憶部１２０は、例えば、ＲＡＭ（Random Access Memory)、フラッシュメモリ（Flash Memory）等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。記憶部１２０は、図３に示すように、利用者情報記憶部１２１とモデル情報記憶部１２２を有する。

（利用者情報記憶部１２１）
利用者情報記憶部１２１は、検索クエリの送信元である利用者に関する各種の情報を記憶する。図４に、実施形態に係る利用者情報記憶部の一例を示す。図４に示す例では、利用者情報記憶部１２１は、「利用者ＩＤ」、「日時」、「クエリＩＤ」、「クエリ」といった項目を有する。

「利用者ＩＤ」は、検索クエリの送信元である利用者を識別するための識別情報を示す。「日時」は、利用者から検索クエリを取得した日時を示す。「クエリＩＤ」は、利用者から取得した検索クエリを識別するための識別情報を示す。「クエリ」は、利用者から取得した検索クエリを示す。

図４の１レコード目に示す例では、利用者ＩＤ「Ｕ１０」で識別される利用者は図１に示す利用者Ｕ１０に対応する。また、日時「日時＃１」は、利用者Ｕ１０から検索クエリを取得した日時を示す。また、クエリＩＤ「Ｑ１」で識別されるクエリ「お酒枝豆」は、図１に示す利用者Ｕ１０から取得したクエリを示す。

（モデル情報記憶部１２２）
モデル情報記憶部１２２は、生成装置５０によって生成された学習モデルに関する各種の情報を記憶する。図５に、実施形態に係るモデル情報記憶部の一例を示す。図５に示す例では、モデル情報記憶部１２２は、「モデルＩＤ」、「モデルデータ」といった項目を有する。

「モデルＩＤ」は、生成装置５０によって生成された学習モデルを識別するための識別情報を示す。「モデルデータ」は、生成装置５０によって生成された学習モデルのモデルデータを示す。例えば、「モデルデータ」には、検索クエリを分散表現に変換するためのデータが格納される。

図５の１レコード目に示す例では、モデルＩＤ「Ｍ１」で識別される学習モデルは、図１に示した第１モデルＭ１に対応する。また、モデルデータ「ＭＤＴ１」は、生成装置５０によって生成された第１モデルＭ１のモデルデータ（モデルデータＭＤＴ１）を示す。

モデルデータＭＤＴ１は、検索クエリが入力される入力層と、出力層と、入力層から出力層までのいずれかの層であって出力層以外の層に属する第１要素と、第１要素と第１要素の重みとに基づいて値が算出される第２要素と、を含み、入力層に入力された検索クエリに応じて、入力層に入力された検索クエリの分散表現を出力層から出力するよう、生成装置５０を機能させてもよい。

ここで、モデルデータＭＤＴ１が「y=a1*x1+a2*x2+・・・+ai*xi」で示す回帰モデルで実現されるとする。この場合、モデルデータＭＤＴ１が含む第１要素は、x1やx2等といった入力データ（xi）に対応する。また、第１要素の重みは、xiに対応する係数aiに対応する。ここで、回帰モデルは、入力層と出力層とを有する単純パーセプトロンと見做すことができる。各モデルを単純パーセプトロンと見做した場合、第１要素は、入力層が有するいずれかのノードに対応し、第２要素は、出力層が有するノードと見做すことができる。

また、モデルデータＭＤＴ１がＤＮＮ（Deep Neural Network）等、１つまたは複数の中間層を有するニューラルネットワークで実現されるとする。この場合、モデルデータＭＤＴ１が含む第１要素は、入力層または中間層が有するいずれかのノードに対応する。また、第２要素は、第１要素と対応するノードから値が伝達されるノードである次段のノードに対応する。また、第１要素の重みは、第１要素と対応するノードから第２要素と対応するノードに伝達される値に対して考慮される重みである接続係数に対応する。

生成装置５０は、上述した回帰モデルやニューラルネットワーク等、任意の構造を有するモデルを用いて、分散表現の算出を行う。具体的には、モデルデータＭＤＴ１は、検索クエリが入力された場合に、分散表現を出力するように係数が設定される。生成装置５０は、このようなモデルデータＭＤＴ１を用いて、分散表現を算出する。

なお、上記例では、モデルデータＭＤＴ１が、検索クエリが入力された場合に、検索クエリの分散表現を出力するモデル（以下、モデルＸ１という。）である例を示した。しかし、実施形態に係るモデルデータＭＤＴ１は、モデルＸ１にデータの入出力を繰り返すことで得られる結果に基づいて生成されるモデルであってもよい。例えば、モデルデータＭＤＴ１は、検索クエリを入力とした際に、モデルＸ１が出力した分散表現を入力して学習されたモデル（以下、モデルＹ１という。）であってもよい。または、モデルデータＭＤＴ１は、検索クエリを入力とし、モデルＹ１の出力値を出力とするよう学習されたモデルであってもよい。

また、生成装置５０がＧＡＮ（Generative Adversarial Networks）を用いた推定処理を行う場合、モデルデータＭＤＴ１は、ＧＡＮの一部を構成するモデルであってもよい。

（制御部１３０）
図３の説明に戻って、制御部１３０は、コントローラ（controller）であり、例えば、ＣＰＵ（Central Processing Unit）やＭＰＵ（Micro Processing Unit）等によって、特定装置１００内部の記憶装置に記憶されている各種プログラム（情報処理プログラムの一例に相当）がＲＡＭを作業領域として実行されることにより実現される。また、制御部１３０は、コントローラであり、例えば、ＡＳＩＣ（Application Specific Integrated Circuit）やＦＰＧＡ（Field Programmable Gate Array）等の集積回路により実現される。

図３に示すように、制御部１３０は、取得部１３１と、算出部１３２と、特定部１３３と、提供部１３４とを有し、以下に説明する情報処理の作用を実現または実行する。なお、制御部１３０の内部構成は、図３に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。

（取得部１３１）
取得部１３１は、利用者が入力した検索クエリを取得する。具体的には、取得部１３１は、それぞれ異なる取引対象の組を示す検索クエリを取得する。より具体的には、取得部１３１は、特定装置１００によって提供される検索クエリの分析サービスを利用するためのユーザーインターフェースを通じて、利用者が入力した検索クエリを端末装置１０から取得する。図１に示す例では、取得部１３１は、利用者Ｕ１０から、第１取引対象である「お酒」と第２取引対象である「枝豆」との組を示す検索クエリＱ１「お酒枝豆」を取得する。また、取得部１３１は、検索クエリを取得すると、検索クエリの送信元である利用者の利用者ＩＤと検索クエリとを対応付けて利用者情報記憶部１２１に格納する。

また、取得部１３１は、利用者から検索クエリを取得すると、取得した検索クエリとは異なる他の検索クエリを検索サーバ２０から取得する。具体的には、取得部１３１は、検索クエリが示す取引対象の組とは異なる他の取引対象の組を示す他の検索クエリを取得する。図１に示す例では、取得部１３１は、検索クエリＱ１「お酒枝豆」を取得すると、検索クエリＱ１「お酒枝豆」とは異なる他の取引対象の組を示す他の検索クエリ（例えば、「ビール刺身」等）を検索サーバ２０から取得する。

また、取得部１３１は、生成装置５０から第１モデルＭ１を取得する。取得部１３１は、第１モデルＭ１を取得すると、取得した第１モデルＭ１をモデル情報記憶部１２２に格納する。

（算出部１３２）
算出部１３２は、取得部１３１により取得された検索クエリを利用者が入力した際の検索意図と、他の検索クエリを利用者が入力した際の検索意図との類似性を示すスコアを算出する。具体的には、算出部１３２は、検索クエリとして入力された文字情報に対応する分散表現と他の検索クエリとして入力された他の文字情報に対応する分散表現との類似度をスコアとして算出する。より具体的には、算出部１３２は、生成装置５０から取得した第１モデルＭ１を用いて、取得部１３１により取得された検索クエリを利用者が入力した際の検索意図と、他の検索クエリを利用者が入力した際の検索意図との類似性を示すスコアを算出する。

例えば、算出部１３２は、検索クエリとして入力された文字情報を生成装置５０から取得した第１モデルＭ１に入力する。算出部１３２は、検索クエリとして入力された文字情報を第１モデルＭ１に入力することにより、検索クエリとして入力された文字情報に対応する分散表現を出力する。また、算出部１３２は、他の検索クエリとして入力された他の文字情報を生成装置５０から取得した第１モデルＭ１に入力する。算出部１３２は、他の検索クエリとして入力された他の文字情報を第１モデルＭ１に入力することにより、他の検索クエリとして入力された他の文字情報に対応する分散表現を出力する。続いて、算出部１３２は、第１モデルＭ１から分散表現を出力すると、検索クエリとして入力された文字情報に対応する分散表現と他の検索クエリとして入力された他の文字情報に対応する分散表現との類似度をスコアとして算出する。例えば、算出部１３２は、検索クエリとして入力された文字情報に対応する分散表現と他の検索クエリとして入力された他の文字情報に対応する分散表現のコサイン類似度をスコアとして算出する。なお、算出部１３２は、コサイン類似度に限らず、ベクトル間の距離尺度として適用可能な指標であれば、どのような指標に基づいて分散表現の間の類似度を算出してもよい。例えば、算出部１３２は、分散表現同士のユークリッド距離や双曲空間等の非ユークリッド空間中での距離、マンハッタン距離、マハラノビス距離等といった所定の距離関数の値を算出してもよい。

図１に示す例では、算出部１３２は、取得部１３１によって検索クエリＱ１「お酒枝豆」と他の検索クエリとが取得されると、検索クエリＱ１「お酒枝豆」を利用者が入力した際の検索意図と、他の検索クエリを利用者が入力した際の検索意図との類似性を示すスコアを算出する。例えば、算出部１３２は、取得部１３１によって取得された検索クエリＱ１として入力された文字情報「お酒枝豆」を生成装置５０から取得した第１モデルＭ１に入力する。算出部１３２は、検索クエリＱ１として入力された文字情報「お酒枝豆」を第１モデルＭ１に入力することにより、検索クエリＱ１として入力された文字情報「お酒枝豆」に対応する分散表現を出力する。

また、算出部１３２は、取得部１３１によって取得された他の検索クエリとして入力された他の文字情報を生成装置５０から取得した第１モデルＭ１に入力する。算出部１３２は、他の検索クエリとして入力された他の文字情報を第１モデルＭ１に入力することにより、他の検索クエリとして入力された他の文字情報に対応する分散表現を出力する。

続いて、算出部１３２は、第１モデルＭ１から分散表現を出力すると、検索クエリＱ１として入力された文字情報「お酒枝豆」に対応する分散表現と他の検索クエリとして入力された他の文字情報に対応する分散表現のコサイン類似度をスコアとして算出する。

なお、算出部１３２は、検索クエリを利用者が入力した際の検索意図と、他の検索クエリを利用者が入力した際の検索意図との類似性を示すスコアを算出できるのであれば、どのようなモデルを用いてもよい。例えば、算出部１３２は、第１モデルＭ１の代わりに、検索クエリを利用者が入力した際の検索意図と、他の検索クエリを利用者が入力した際の検索意図との類似性を示すスコアを算出する他のモデルを用いてもよい。また、算出部１３２は、検索クエリを利用者が入力した際の検索意図と、他の検索クエリを利用者が入力した際の検索意図との類似性を示すスコアを算出できるのであれば、モデルの入力は検索クエリの分散表現でなくてもよい。例えば、モデルの入力として、検索クエリそのものを用いてもよい。

（特定部１３３）
特定部１３３は、取得部１３１により取得された検索クエリを利用者が入力した際の検索意図と、他の検索クエリを利用者が入力した際の検索意図との類似性に基づいて、取得部１３１により取得された検索クエリと所定の関連性を有する他の検索クエリを特定する。具体的には、特定部１３３は、検索クエリとして入力された際の検索意図が取得部１３１により取得された検索クエリが示す取引対象の組と類似する他の取引対象の組を示す他の検索クエリを特定する。より具体的には、特定部１３３は、算出部１３２によって算出されたスコアに基づいて、取得部１３１により取得された検索クエリと所定の関連性を有する他の検索クエリを特定する。例えば、特定部１３３は、算出部１３２によって算出されたスコアと所定の閾値との比較に基づいて、他の検索クエリを特定する。

図１に示す例では、特定部１３３は、算出部１３２によってスコアが算出されると、算出部１３２によって算出されたスコアが所定の閾値以上である他の検索クエリを関連クエリとして特定する。図１に、特定部１３３によって特定された関連クエリをスコアの高い方から順に並べた関連クエリの一覧である類似ランキングを示す。図１に示すように、特定部１３３は、検索クエリとして入力された際の検索意図が、検索クエリＱ１「お酒枝豆」が示す取引対象の組と類似する他の取引対象の組を示す関連クエリを特定する。

例えば、特定部１３３は、取引対象「ビール」と取引対象「枝豆」の組を示す関連クエリＱ１１「ビール枝豆」を特定する（類似ランキング１位）。また、特定部１３３は、取引対象「ビール」と取引対象「刺身」の組を示す関連クエリＱ１２「ビール刺身」を特定する（類似ランキング８位）。また、特定部１３３は、取引対象「ビール」と取引対象「唐揚げ」の組を示す関連クエリＱ１３「ビール唐揚げ」を特定する（類似ランキング１２位）。また、特定部１３３は、取引対象「ビール」と取引対象「チーズ」の組を示す関連クエリＱ１４「ビールチーズ」を特定する（類似ランキング１４位）。

また、特定部１３３は、検索クエリとして入力された際の検索意図が取得部１３１により取得された検索クエリが示す取引対象の組と類似する他の取引対象の組を示す他の検索クエリを特定し、特定した他の検索クエリが示す組に含まれる取引対象の共通性に基づいて、取得部１３１により取得された検索クエリが示す組に含まれる第１取引対象と所定の関連性を有する第１関連取引対象を特定する。具体的には、特定部１３３は、検索クエリとして入力された際の検索意図が取得部１３１により取得された検索クエリが示す取引対象の組と類似する他の取引対象の組を示す他の検索クエリを特定し、特定した他の検索クエリが示す組に含まれる数が所定の条件を満たす取引対象を取得部１３１により取得された検索クエリが示す組に含まれる第１取引対象と所定の関連性を有する第１関連取引対象として特定する。例えば、特定部１３３は、特定部は、第１関連取引対象を第１取引対象の代替品として特定する。

図１に示す例では、特定部１３３は、関連クエリを特定すると、関連クエリが示す組に含まれる取引対象の共通性に基づいて、検索クエリＱ１「お酒枝豆」が示す組に含まれる第１取引対象である「お酒」と所定の関連性を有する第１関連取引対象を特定する。具体的には、特定部１３３は、関連クエリを特定すると、関連クエリが示す組に含まれる数が所定の条件を満たす取引対象を取得部１３１により取得された検索クエリが示す組に含まれる第１取引対象と所定の関連性を有する第１関連取引対象として特定する。例えば、特定部１３３は、特定した３０個の関連クエリのうち、取引対象「ビール」が４個の関連クエリＱ１１〜Ｑ１４に共通することから、取引対象「ビール」を第１取引対象である「お酒」と近い検索意図で検索されている可能性が高いという関連性を有する第１関連取引対象として特定する。続いて、特定部１３３は、第１関連取引対象として特定した「ビール」は第１取引対象である「お酒」と近い検索意図で検索されている可能性が高いので、第１関連取引対象として特定した取引対象「ビール」を第１取引対象である「お酒」の代替品として特定する。

また、特定部１３３は、特定した第１関連取引対象を含む組を示す他の検索クエリを特定する。続いて、特定部１３３は、第１関連取引対象を含む組を示す他の検索クエリを特定し、特定した他の検索クエリが示す組に含まれる取引対象のうち、第１関連取引対象とは異なる取引対象を、取得部１３１により取得された検索クエリが示す組に含まれる取引対象のうち、第１取引対象とは異なる第２取引対象と所定の関連性を有する第２関連取引対象として特定する。例えば、特定部１３３は、第２関連取引対象を第２取引対象の代替品として特定する。

図１に示す例では、特定部１３３は、第１取引対象である「お酒」の代替品として特定した第１関連取引対象である「ビール」を含む組を示す関連クエリＱ１１〜Ｑ１４を特定する。続いて、特定部１３３は、特定した関連クエリＱ１１〜Ｑ１４が示す組に含まれる取引対象のうち、第１関連取引対象である「ビール」とは異なる取引対象を、第２取引対象である「枝豆」と近い検索意図で検索されている可能性が高いという関連性を有する第２関連取引対象として特定する。

例えば、特定部１３３は、特定した関連クエリＱ１２が示す組に含まれる取引対象のうち、第１関連取引対象である「ビール」とは異なる取引対象「刺身」を、第２取引対象である「枝豆」と近い検索意図で検索されている可能性が高いという関連性を有する第２関連取引対象として特定する。続いて、特定部１３３は、第２関連取引対象として特定した「刺身」は第２取引対象である「枝豆」と近い検索意図で検索されている可能性が高いので、第２関連取引対象として特定した取引対象「刺身」を第２取引対象である「枝豆」の代替品として特定する。

また、特定部１３３は、特定した関連クエリＱ１３が示す組に含まれる取引対象のうち、第１関連取引対象である「ビール」とは異なる取引対象「唐揚げ」を、第２取引対象である「枝豆」と近い検索意図で検索されている可能性が高いという関連性を有する第２関連取引対象として特定する。続いて、特定部１３３は、第２関連取引対象として特定した「唐揚げ」は第２取引対象である「枝豆」と近い検索意図で検索されている可能性が高いので、第２関連取引対象として特定した取引対象「唐揚げ」を第２取引対象である「枝豆」の代替品として特定する。

また、特定部１３３は、特定した関連クエリＱ１４が示す組に含まれる取引対象のうち、第１関連取引対象である「ビール」とは異なる取引対象「チーズ」を、第２取引対象である「枝豆」と近い検索意図で検索されている可能性が高いという関連性を有する第２関連取引対象として特定する。続いて、特定部１３３は、第２関連取引対象として特定した「チーズ」は第２取引対象である「枝豆」と近い検索意図で検索されている可能性が高いので、第２関連取引対象として特定した取引対象「チーズ」を第２取引対象である「枝豆」の代替品として特定する。

（提供部１３４）
提供部１３４は、取得部１３１により取得された検索クエリと特定部１３３によって特定された他の検索クエリとの比較に基づいて、取得部１３１により取得された検索クエリに関する情報を提供する。例えば、提供部１３４は、算出部１３２によって算出されたスコア順に並べられた他の検索クエリの一覧を提供する。図１に示す例では、提供部１３４は、図１に示す検索クエリＱ１と類似する関連クエリをスコア順に並べた関連クエリの一覧である類似ランキングを利用者Ｕ１０に対して提供する。

また、提供部１３４は、検索クエリに含まれる取引対象に関する所定の傾向に関する情報を提供する。例えば、提供部１３４は、それぞれ異なる取引対象の組を示す検索クエリに含まれる第１取引対象に関する所定の傾向に関する情報を提供する。図１に示す例では、提供部１３４は、検索クエリＱ１に含まれる第１取引対象「お酒」に関する所定の傾向に関する情報として、「ビール」は「お酒」に近い意図で検索されている可能性が高いという情報を提供する。

また、提供部１３４は、それぞれ異なる取引対象の組を示す検索クエリに含まれる第１取引対象と異なる第２取引対象に関する所定の傾向に関する情報を提供する。図１に示す例では、提供部１３４は、検索クエリＱ１に含まれる第２取引対象「枝豆」に関する所定の傾向に関する情報として、「刺身」と「唐揚げ」と「チーズ」は、「お酒」における「枝豆」に近い意図で検索されている可能性が高いという情報を提供する。

また、提供部１３４は、検索クエリに含まれる取引対象に関連する商品又はサービスに関する提案情報を提供する。例えば、提供部１３４は、それぞれ異なる取引対象の組を示す検索クエリに含まれる第１取引対象に関連する商品又はサービスに関する提案情報を提供する。図１に示す例では、提供部１３４は、検索クエリＱ１に含まれる第１取引対象「お酒」の代替品として「ビール」が想定されるという代替情報を利用者Ｕ１０に対して提供する。また、提供部１３４は、「お酒」の代替品として「ビール」が想定されるため、「お酒」に用いられているおつまみの商品を「ビール」に合うように商品開発を行うことを提案する提案情報を提供する。

また、提供部１３４は、それぞれ異なる取引対象の組を示す検索クエリに含まれる第１取引対象と異なる第２取引対象に関連する商品又はサービスに関する提案情報を提供する。図１に示す例では、提供部１３４は、検索クエリＱ１に含まれる「お酒」におけるおつまみである「枝豆」の代替品として「刺身」や「唐揚げ」や「チーズ」が想定されるという代替情報を提供する。

〔３．特定処理のフロー〕
次に、図６を用いて、実施形態に係る特定処理の手順について説明する。図６は、実施形態に係る特定処理手順を示すフローチャートである。図６に示す例では、特定装置１００は、それぞれ異なる取引対象の組を示す検索クエリを利用者から取得する（ステップＳ１０１）。

続いて、特定装置１００は、検索クエリを取得すると、検索クエリとして入力された際の検索意図が取得した検索クエリが示す取引対象の組と類似する他の取引対象の組を示す他の検索クエリを特定する（ステップＳ１０２）。

〔４．第１モデルの生成処理〕
次に、図７を用いて、第１モデルの生成処理の流れについて説明する。図７は、実施形態に係る第１モデルの生成処理の一例を示す図である。図７に示す例では、生成装置５０は、同一のユーザＵ１によって所定の時間内に連続して入力された「六本木パスタ」という検索クエリＱ１１と「六本木イタリアン」という検索クエリＱ１２とから成る一対の検索クエリを抽出する（ステップＳ１１）。

続いて、生成装置５０は、抽出した検索クエリＱ１１を第１モデルＭ１に入力して、検索クエリＱ１１の分散表現であるベクトルＢＱＶ１１を出力する。ここで、ベクトルＢＱＶ１１は、第１モデルＭ１の出力層から出力されたばかりの検索クエリＱ１１の分散表現であって、第１モデルＭ１にフィードバックをかける前（学習前）の分散表現を示す。また、生成装置５０は、抽出した検索クエリＱ１２を第１モデルＭ１に入力して、検索クエリＱ１２の分散表現であるベクトルＢＱＶ１２を出力する。ここで、ベクトルＢＱＶ１２は、第１モデルＭ１の出力層から出力されたばかりの検索クエリＱ１２の分散表現であって、第１モデルＭ１にフィードバックをかける前（学習前）の分散表現を示す。このようにして、生成装置５０は、検索クエリＱ１１の分散表現であるベクトルＢＱＶ１１と、検索クエリＱ１２の分散表現であるベクトルＢＱＶ１２とを出力する（ステップＳ１２）。

続いて、生成装置５０は、同一のユーザＵ１によって所定の時間内に連続して入力された検索クエリＱ１１（「六本木パスタ」）と検索クエリＱ１２（「六本木イタリアン」）とから成る一対の検索クエリは、所定の検索意図（例えば、「ある場所で飲食店を探す」という検索意図）で入力された検索クエリであると推定されるため、相互に類似する特徴を有するものとして、検索クエリＱ１１の分散表現（ベクトルＱＶ１１）と、検索クエリＱ１１と対となる検索クエリＱ１２の分散表現（ベクトルＱＶ１２）とが、分散表現空間上で類似するように第１モデルＭ１を学習させる。例えば、第１モデルＭ１にフィードバックをかける前（学習前）の検索クエリＱ１１の分散表現であるベクトルＢＱＶ１１と検索クエリＱ１２の分散表現であるベクトルＢＱＶ１２との唐揚げ角度の大きさをΘとする。また、第１モデルＭ１にフィードバックをかけた後（学習後）の検索クエリＱ１１の分散表現であるベクトルＱＶ１１と検索クエリＱ１２の分散表現であるベクトルＱＶ１２との唐揚げ角度の大きさをΦとする。この時、生成装置５０は、ΘよりもΦが小さくなるように、第１モデルＭ１を学習させる。例えば、生成装置５０は、ベクトルＢＱＶ１１とベクトルＢＱＶ１２のコサイン類似度の値を算出する。また、生成装置５０は、ベクトルＱＶ１１とベクトルＱＶ１２のコサイン類似度の値を算出する。続いて、生成装置５０は、ベクトルＢＱＶ１１とベクトルＢＱＶ１２のコサイン類似度の値よりも、ベクトルＱＶ１１とベクトルＱＶ１２のコサイン類似度の値が大きくなるように（値が１に近づくように）第１モデルＭ１を学習させる。このように、生成装置５０は、一対の検索クエリに対応する一対の分散表現である２つのベクトルが分散表現空間上で類似するように第１モデルＭ１を学習させることで、検索クエリから分散表現（ベクトル）を出力する第１モデルＭ１を生成する（ステップＳ１３）。なお、生成装置５０は、コサイン類似度に限らず、ベクトル間の距離尺度として適用可能な指標であれば、どのような指標に基づいて分散表現（ベクトル）の間の類似度を算出してもよい。また、生成装置５０は、ベクトル間の距離尺度として適用可能な指標であれば、どのような指標に基づいて第１モデルＭ１を学習させてもよい。例えば、生成装置５０は、分散表現（ベクトル）同士のユークリッド距離や双曲空間等の非ユークリッド空間中での距離、マンハッタン距離、マハラノビス距離等といった所定の距離関数の値を算出する。続いて、生成装置５０は、分散表現（ベクトル）同士の所定の距離関数の値（すなわち、分散表現空間における距離）が小さくなるように第１モデルＭ１を学習させてもよい。

次に、図８を用いて、第１モデルの生成処理の流れについてより詳しく説明する。なお、図８の説明では、図７の説明と重複する部分は、適宜省略する。図８は、実施形態に係る第１モデルの生成処理を示す図である。図８に示す例では、生成装置５０が生成した第１モデルＭ１によって出力された分散表現（ベクトル）が分散表現空間にマッピングされる様子が示されている。生成装置５０は、所定の検索クエリの分散表現と所定の検索クエリと対となる他の検索クエリの分散表現とが分散表現空間上で近くにマッピングされるように第１モデルＭ１のトレーニングを行う。

図８の上段に示す例では、生成装置５０は、同一のユーザＵ１によって所定の時間内に連続して入力された４個の検索クエリである検索クエリＱ１１（「六本木パスタ」）、検索クエリＱ１２（「六本木イタリアン」）、検索クエリＱ１３（「赤坂パスタ」）、検索クエリＱ１４（「麻布パスタ」）を抽出する。生成装置５０は、同一のユーザＵ１によって各検索クエリが入力された時間の間隔が所定の時間内である４個の検索クエリを抽出する。生成装置５０は、同一のユーザＵ１によって後述する各検索クエリのペアが入力された時間の間隔が所定の時間内である複数の検索クエリを抽出する。生成装置５０は、検索クエリが入力された順番に並べると、検索クエリＱ１１、検索クエリＱ１２、検索クエリＱ１３、検索クエリＱ１４の順番で入力された４個の検索クエリを抽出する。生成装置５０は、４個の検索クエリを抽出すると、時系列的に隣り合う２つの検索クエリを一対の検索クエリとして、３対の検索クエリのペアである（検索クエリＱ１１、検索クエリＱ１２）、（検索クエリＱ１２、検索クエリＱ１３）、（検索クエリＱ１３、検索クエリＱ１４）を抽出する（ステップＳ２１−１）。なお、生成装置５０は、同一のユーザＵ１によって全ての検索クエリが所定の時間内に入力された複数の検索クエリを抽出してもよい。そして、生成装置５０は、時系列的に隣り合うか否かに関わらず、抽出した複数の検索クエリの中から２つの検索クエリを選択して、選択した２つの検索クエリを一対の検索クエリとして抽出してもよい。

続いて、生成装置５０は、抽出した検索クエリＱ１ｋ（ｋ＝１、２、３、４）を第１モデルＭ１に入力して、検索クエリＱ１ｋ（ｋ＝１、２、３、４）の分散表現であるベクトルＢＱＶ１ｋ（ｋ＝１、２、３、４）を出力する。ここで、ベクトルＢＱＶ１ｋ（ｋ＝１、２、３、４）は、第１モデルＭ１の出力層から出力されたばかりの検索クエリＱ１ｋ（ｋ＝１、２、３、４）の分散表現であって、第１モデルＭ１にフィードバックをかける前（学習前）の分散表現を示す（ステップＳ２２−１）。

続いて、生成装置５０は、同一のユーザＵ１によって所定の時間内に連続して入力された一対の検索クエリは、所定の検索意図（例えば、「ある場所（東京都港区付近）で飲食店を探す」という検索意図）で入力された検索クエリであると推定されるため、相互に類似する特徴を有するものとして、検索クエリＱ１１の分散表現（ベクトルＱＶ１１）と、検索クエリＱ１１と対となる検索クエリＱ１２の分散表現（ベクトルＱＶ１２）とが、分散表現空間上で類似するように第１モデルＭ１を学習させる。また、生成装置５０は、検索クエリＱ１２の分散表現（ベクトルＱＶ１２）と、検索クエリＱ１２と対となる検索クエリＱ１３の分散表現（ベクトルＱＶ１３）とが、分散表現空間上で類似するように第１モデルＭ１を学習させる。また、生成装置５０は、検索クエリＱ１３の分散表現（ベクトルＱＶ１３）と、検索クエリＱ１３と対となる検索クエリＱ１４の分散表現（ベクトルＱＶ１４）とが、分散表現空間上で類似するように第１モデルＭ１を学習させる。このように、生成装置５０は、一対の検索クエリに対応する一対の分散表現である２つのベクトルが分散表現空間上で類似するように第１モデルＭ１を学習させることで、検索クエリから分散表現（ベクトル）を出力する第１モデルＭ１を生成する（ステップＳ２３−１）。

図８の上段に示す情報処理の結果として、検索クエリＱ１ｋ（ｋ＝１、２、３、４）の分散表現であるベクトルＱＶ１ｋ（ｋ＝１、２、３、４）が分散表現空間の近い位置にクラスタＣＬ１１としてマッピングされる様子が示されている。例えば、検索クエリＱ１ｋ（ｋ＝１、２、３、４）は、ユーザＵ１によって「ある場所（東京都港区付近）で飲食店を探す」という検索意図の下で検索された検索クエリの集合であると推定される。すなわち、検索クエリＱ１ｋ（ｋ＝１、２、３、４）は、「ある場所（東京都港区付近）で飲食店を探す」という検索意図の下で検索された検索クエリであるという点で、相互に類似する特徴を有する検索クエリであると推定される。ここで、生成装置５０は、「ある場所（東京都港区付近）で飲食店を探す」という検索意図で入力された所定の検索クエリが第１モデルに入力されると、クラスタＣＬ１１の位置にマッピングされるような分散表現を出力することができる。これにより、例えば、生成装置５０は、クラスタＣＬ１１の位置にマッピングされる分散表現に対応する検索クエリを抽出することにより、「ある場所（東京都港区付近）で飲食店を探す」という検索意図に応じた検索クエリを抽出することができる。したがって、生成装置５０は、検索クエリの意味を適切に解釈可能とすることができる。

図８の下段に示す例では、生成装置５０は、同一のユーザＵ２によって所定の時間内に連続して入力された３個の検索クエリである検索クエリＱ２１（「冷蔵庫４００Ｌ」）、検索クエリＱ２２（「冷蔵庫中型」）、検索クエリＱ２３（「冷蔵庫中型おすすめ」）を抽出する。生成装置５０は、検索クエリが入力された順番に並べると、検索クエリＱ２１、検索クエリＱ２２、検索クエリＱ２３の順番で入力された３個の検索クエリを抽出する。生成装置５０は、３個の検索クエリを抽出すると、時系列的に隣り合う２つの検索クエリを一対の検索クエリとして、２対の検索クエリのペアである（検索クエリＱ２１、検索クエリＱ２２）、（検索クエリＱ２２、検索クエリＱ２３）を抽出する（ステップＳ２１−２）。

続いて、生成装置５０は、抽出した検索クエリＱ２ｍ（ｍ＝１、２、３）を第１モデルＭ１に入力して、検索クエリＱ２ｍ（ｍ＝１、２、３）の分散表現であるベクトルＢＱＶ２ｍ（ｍ＝１、２、３）を出力する。ここで、ベクトルＢＱＶ２ｍ（ｍ＝１、２、３）は、第１モデルＭ１の出力層から出力されたばかりの検索クエリＱ２ｍ（ｍ＝１、２、３）の分散表現であって、第１モデルＭ１にフィードバックをかける前（学習前）の分散表現を示す（ステップＳ２２−２）。

続いて、生成装置５０は、同一のユーザＵ２によって所定の時間内に連続して入力された一対の検索クエリは、所定の検索意図（例えば、「中型の冷蔵庫を調べる」という検索意図）で入力された検索クエリであると推定されるため、相互に類似する特徴を有するものとして、検索クエリＱ２１の分散表現（ベクトルＱＶ２１）と、検索クエリＱ２１と対となる検索クエリＱ２２の分散表現（ベクトルＱＶ２２）とが、分散表現空間上で類似するように第１モデルＭ１を学習させる。また、生成装置５０は、検索クエリＱ２２の分散表現（ベクトルＱＶ２２）と、検索クエリＱ２２と対となる検索クエリＱ２３の分散表現（ベクトルＱＶ２３）とが、分散表現空間上で類似するように第１モデルＭ１を学習させる。このように、生成装置５０は、一対の検索クエリに対応する一対の分散表現である２つのベクトルが分散表現空間上で類似するように第１モデルＭ１を学習させることで、検索クエリから分散表現（ベクトル）を出力する第１モデルＭ１を生成する（ステップＳ２３−２）。

図８の下段に示す情報処理の結果として、検索クエリＱ２ｍ（ｍ＝１、２、３）の分散表現であるベクトルＱＶ２ｍ（ｍ＝１、２、３）が分散表現空間の近い位置にクラスタＣＬ２１としてマッピングされる様子が示されている。例えば、検索クエリＱ２ｍ（ｍ＝１、２、３）は、ユーザＵ２によって「中型の冷蔵庫を調べる」という検索意図の下で検索された検索クエリの集合であると推定される。すなわち、Ｑ２ｍ（ｍ＝１、２、３）は、「中型の冷蔵庫を調べる」という検索意図の下で検索された検索クエリであるという点で、相互に類似する特徴を有する検索クエリであると推定される。ここで、生成装置５０は、「中型の冷蔵庫を調べる」という検索意図で入力された所定の検索クエリが第１モデルに入力されると、クラスタＣＬ２１の位置にマッピングされるような分散表現を出力することができる。これにより、例えば、生成装置５０は、クラスタＣＬ２１の位置にマッピングされる分散表現に対応する検索クエリを抽出することにより、「中型の冷蔵庫を調べる」という検索意図に応じた検索クエリを抽出することができる。したがって、生成装置５０は、検索クエリの意味を適切に解釈可能とすることができる。

また、本願発明に係る生成装置５０は、ランダムに抽出された複数の検索クエリは、異なる検索意図の下で検索された検索クエリであるという点で、相互に相違する特徴を有する検索クエリであるとみなして第１モデルＭ１を学習させる。具体的には、生成装置５０は、所定の検索クエリの分散表現と、所定の検索クエリとは無関係にランダムに抽出された検索クエリの分散表現とが分散表現空間上で遠くにマッピングされるように第１モデルＭ１のトレーニングを行う。図８に示す例では、生成装置５０は、検索クエリＱ１１とは無関係にランダムに検索クエリを抽出したところ、検索クエリＱ２１が抽出されたとする。この場合、生成装置５０は、検索クエリＱ１１の分散表現（ベクトルＱＶ１１）と、検索クエリＱ１１とは無関係にランダムに抽出された検索クエリＱ２１の分散表現（ベクトルＱＶ２１）とが分散表現空間上で遠くにマッピングされるように第１モデルＭ１のトレーニングを行う。その結果として、「ある場所（東京都港区付近）で飲食店を探す」という検索意図の下で検索された検索クエリＱ１ｋ（ｋ＝１、２、３、４）の分散表現であるベクトルＱＶ１ｋ（ｋ＝１、２、３、４）を含むクラスタＣＬ１１と、「中型の冷蔵庫を調べる」という検索意図の下で検索された検索クエリＱ２ｍ（ｍ＝１、２、３）の分散表現であるベクトルＱＶ２ｍ（ｍ＝１、２、３）を含むクラスタＣＬ２１とは、分散表現空間上で遠くにマッピングされる。すなわち、本願発明に係る生成装置５０は、ランダムに抽出された複数の検索クエリの分散表現が相違するように第１モデルＭ１を学習させることにより、検索意図が異なる検索クエリの分散表現を分散表現空間上で遠い位置に出力可能とする。

なお、生成装置５０が生成した第１モデルＭ１によって出力された分散表現（ベクトル）が分散表現空間にマッピングされた結果として、上述したクラスタＣＬ１１とクラスタＣＬ２１の他にも、同一のユーザによって所定の時間内に入力された複数の検索クエリの分散表現（ベクトル）の集合であるクラスタＣＬ１２やクラスタＣＬ２２が生成される。

上述したように、生成装置５０は、ユーザによって入力された検索クエリを取得する。また、生成装置５０は、取得した検索クエリのうち、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして学習することで、所定の検索クエリから所定の検索クエリの特徴情報を予測する第１モデルを生成する。すなわち、本願発明に係る生成装置５０は、所定の時間内に連続して入力された複数の検索クエリは、所定の検索意図の下で検索された検索クエリであるという点で、相互に類似する特徴を有する検索クエリであるとみなして第１モデルを学習させる。具体的には、生成装置５０は、同一のユーザによって所定の時間内に入力された複数の検索クエリの分散表現が類似するように第１モデルを学習させることで、所定の検索クエリから所定の検索クエリの特徴情報を含む分散表現を出力する第１モデルを生成する。すなわち、本願発明に係る生成装置５０は、所定の時間内に連続して入力された複数の検索クエリの分散表現が類似するように第１モデルＭ１を学習させることにより、所定の検索意図の下で検索された検索クエリの分散表現を分散表現空間上で近い位置に出力可能とする。これにより、生成装置５０は、検索クエリを入力したユーザのコンテクストに応じて検索クエリの意味（検索意図）を出力（解釈）することを可能にする。したがって、生成装置５０は、検索クエリの意味を適切に解釈可能とすることができる。

また、生成装置５０は、所定の検索クエリの特徴情報を含む分散表現の近傍にマッピングされる分散表現に対応する検索クエリを抽出することにより、所定の検索クエリが検索された検索意図に応じた検索クエリを抽出することができる。すなわち、生成装置５０は、検索クエリを入力したユーザの検索意図やコンテクストを考慮して、ユーザの検索動向を分析することを可能にする。したがって、生成装置５０は、ユーザの検索動向の分析精度を高めることができる。また、生成装置５０が生成した第１モデルＭ１を検索システムの一部として機能させることもできる。あるいは、生成装置５０は、第１モデルＭ１によって予測された検索クエリの特徴情報を利用する他のシステム（例えば、検索エンジン）への入力情報として、第１モデルＭ１が出力した検索クエリの分散表現を提供することもできる。これにより、検索システムは、第１モデルＭ１によって予測された検索クエリの特徴情報に基づいて、検索結果として出力されるコンテンツを選択可能になる。すなわち、検索システムは、検索クエリを入力したユーザの検索意図やコンテクストを考慮して、検索結果として出力されるコンテンツを選択可能になる。さらに、検索システムは、第１モデルＭ１によって予測された検索クエリの特徴情報に基づいて、検索結果として出力されるコンテンツに含まれる文字情報の分散表現と検索クエリの分散表現との類似度を算出可能になる。そして、検索システムは、算出した類似度に基づいて、検索結果として出力されるコンテンツの表示順を決定可能になる。すなわち、検索システムは、検索クエリを入力したユーザの検索意図やコンテクストを考慮して、検索結果として出力されるコンテンツの表示順を決定可能になる。したがって、生成装置５０は、検索サービスにおけるユーザビリティを向上させることができる。

〔５．生成装置の構成〕
次に、図９を用いて、実施形態に係る生成装置５０の構成について説明する。図９は、実施形態に係る生成装置５０の構成例を示す図である。図９に示すように、生成装置５０は、通信部５１と、記憶部５３と、制御部５２とを有する。なお、生成装置５０は、生成装置５０の管理者等から各種操作を受け付ける入力部（例えば、キーボードやマウス等）や、各種情報を表示するための表示部（例えば、液晶ディスプレイ等）を有してもよい。

（通信部５１）
通信部５１は、例えば、ＮＩＣ（Network Interface Card）等によって実現される。そして、通信部５１は、ネットワークと有線または無線で接続され、例えば、端末装置１０と、検索サーバ２０との間で情報の送受信を行う。

（記憶部５３）
記憶部５３は、例えば、ＲＡＭ（Random Access Memory)、フラッシュメモリ（Flash Memory）等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。記憶部５３は、図９に示すように、クエリ情報記憶部５３１と、ベクトル情報記憶部５３２と、モデル情報記憶部５３３とを有する。

（クエリ情報記憶部５３１）
クエリ情報記憶部５３１は、ユーザによって入力された検索クエリに関する各種の情報を記憶する。図１０に、実施形態に係るクエリ情報記憶部の一例を示す。図１０に示す例では、クエリ情報記憶部５３１は、「ユーザＩＤ」、「日時」、「検索クエリ」、「検索クエリＩＤ」といった項目を有する。

「ユーザＩＤ」は、検索クエリを入力したユーザを識別するための識別情報を示す。「日時」は、検索サーバがユーザから検索クエリを受け付けた日時を示す。「検索クエリ」は、ユーザによって入力された検索クエリを示す。「検索クエリＩＤ」は、ユーザによって入力された検索クエリを識別するための識別情報を示す。

図１０の１レコード目に示す例では、検索クエリＩＤ「Ｑ１１」で識別される検索クエリ（検索クエリＱ１１）は、図１４に示した検索クエリＱ１１に対応する。また、ユーザＩＤ「Ｕ１」は、検索クエリＱ１１を入力したユーザがユーザＩＤ「Ｕ１」で識別されるユーザ（ユーザＵ１）であることを示す。また、日時「２０１８／９／１ＰＭ１７：００」は、検索サーバがユーザＵ１から検索クエリＱ１１を受け付けた日時が２０１８年９月１日の午後１７：００であることを示す。また、検索クエリ「六本木パスタ」は、ユーザＵ１によって入力された検索クエリＱ１１を示す。具体的には、検索クエリ「六本木パスタ」は、地名を示す「六本木」と食品の種類を示す「パスタ」の文字とが区切り文字であるスペースで区切られた文字情報であることを示す。

（ベクトル情報記憶部５３２）
ベクトル情報記憶部５３２は、検索クエリの分散表現であるベクトルに関する各種の情報を記憶する。図１１に、実施形態に係るベクトル情報記憶部の一例を示す。図１１に示す例では、ベクトル情報記憶部５３２は、「ベクトルＩＤ」、「検索クエリＩＤ」、「ベクトル情報」といった項目を有する。

「ベクトルＩＤ」は、検索クエリの分散表現であるベクトルを識別するための識別情報を示す。「検索クエリＩＤ」は、ベクトルに対応する検索クエリを識別するための識別情報を示す。「ベクトル情報」は、検索クエリの分散表現であるＮ次元のベクトルを示す。検索クエリの分散表現であるベクトルは、例えば、１２８次元のベクトルである。

図１１の１レコード目に示す例では、ベクトルＩＤ「ＱＶ１１」で識別されるベクトル（ベクトルＱＶ１１）は、図１４に示した検索クエリＱ１１の分散表現であるベクトルＱＶ１１に対応する。また、検索クエリＩＤ「Ｑ１１」で識別される検索クエリ（検索クエリＱ１１）は、ベクトルＱＶ１１に対応する検索クエリが検索クエリＱ１１であることを示す。また、ベクトル情報「ＱＶＤＴ１１」は、検索クエリＱ１１の分散表現であるＮ次元のベクトルを示す。

（モデル情報記憶部５３３）
モデル情報記憶部５３３は、生成装置５０によって生成された学習モデルに関する各種の情報を記憶する。図１２に、実施形態に係るモデル情報記憶部の一例を示す。図１２に示す例では、モデル情報記憶部５３３は、「モデルＩＤ」、「モデルデータ」といった項目を有する。

図１２の１レコード目に示す例では、モデルＩＤ「Ｍ１」で識別される学習モデルは、図１に示した第１モデルＭ１に対応する。また、モデルデータ「ＭＤＴ１」は、生成装置５０によって生成された第１モデルＭ１のモデルデータ（モデルデータＭＤＴ１）を示す。

（制御部５２）
図９の説明に戻って、制御部５２は、コントローラ（controller）であり、例えば、ＣＰＵ（Central Processing Unit）やＭＰＵ（Micro Processing Unit）等によって、生成装置５０内部の記憶装置に記憶されている各種プログラム（生成プログラムの一例に相当）がＲＡＭを作業領域として実行されることにより実現される。また、制御部５２は、コントローラであり、例えば、ＡＳＩＣ（Application Specific Integrated Circuit）やＦＰＧＡ（Field Programmable Gate Array）等の集積回路により実現される。

また、制御部５２は、モデル情報記憶部５３３に記憶されている第１モデルＭ１（モデルデータＭＤＴ１）に従った情報処理により、入力層に入力された検索クエリに対し、出力層以外の各層に属する各要素を第１要素として、第１要素と第１要素の重みとに基づく演算を行うことにより、分散表現を出力層から出力するよう、コンピュータを機能させる。

また、制御部５２は、モデル情報記憶部５３３に記憶されている第２モデルＭ２（モデルデータＭＤＴ２）に従った情報処理により、入力層に入力された検索クエリに対し、出力層以外の各層に属する各要素を第１要素として、第１要素と第１要素の重みとに基づく演算を行うことにより、検索クエリが各カテゴリに属する確率を出力層から出力するよう、コンピュータを機能させる。

図９に示すように、制御部５２は、取得部５２１と、抽出部５２２と、生成部５２３を有し、以下に説明する情報処理の作用を実現または実行する。なお、制御部５２の内部構成は、図９に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。

（取得部５２１）
取得部５２１は、種々の情報を取得する。具体的には、取得部５２１は、ユーザによって入力された検索クエリを検索サーバ２０から取得する。取得部５２１は、ユーザによって入力された検索クエリを取得すると、取得した検索クエリをクエリ情報記憶部５３１に格納する。

また、取得部５２１は、検索クエリの分散表現であるベクトルに関するベクトル情報を取得する。取得部５２１は、ベクトル情報を取得すると、取得したベクトル情報をベクトル情報記憶部５３２に格納する。

また、取得部５２１は、第１モデルに関する情報を取得する。具体的には、取得部５２１は、取得部５２１は、生成部５２３によって生成された第１モデルに関する情報を取得する。取得部５２１は、第１モデルに関する情報を取得すると、取得した第１モデルに関する情報をモデル情報記憶部５３３に格納する。

（抽出部５２２）
抽出部５２２は、種々の情報を抽出する。具体的には、抽出部５２２は、取得部５２１によって取得された検索クエリのうち、同一のユーザによって所定の時間内に入力された複数の検索クエリを抽出する。例えば、抽出部５２２は、同一のユーザによって各検索クエリが入力された時間の間隔が所定の時間内である複数の検索クエリを抽出する。続いて、抽出部５２２は、同一のユーザによって所定の時間内に入力された複数の検索クエリのうち、同一のユーザによって所定の時間内に連続して入力された一対の検索クエリを抽出する。例えば、抽出部５２２は、同一のユーザによって各検索クエリのペアが入力された時間の間隔が所定の時間内である複数の検索クエリを抽出する。例えば、抽出部５２２は、取得部５２１によって取得された検索クエリのうち、同一のユーザＵ１によって所定の時間内に連続して入力された４個の検索クエリである検索クエリＱ１１（「六本木パスタ」）、検索クエリＱ１２（「六本木イタリアン」）、検索クエリＱ１３（「赤坂パスタ」）、検索クエリＱ１４（「麻布パスタ」）を抽出する。抽出部５２２は、検索クエリが入力された順番に並べると、検索クエリＱ１１、検索クエリＱ１２、検索クエリＱ１３、検索クエリＱ１４の順番で入力された４個の検索クエリを抽出する。続いて、抽出部５２２は、４個の検索クエリを抽出すると、時系列的に隣り合う２つの検索クエリを一対の検索クエリとして、３対の検索クエリのペアである（検索クエリＱ１１、検索クエリＱ１２）、（検索クエリＱ１２、検索クエリＱ１３）、（検索クエリＱ１３、検索クエリＱ１４）を抽出する。なお、抽出部５２２は、同一のユーザによって全ての検索クエリが所定の時間内に入力された複数の検索クエリを抽出してもよい。そして、抽出部５２２は、時系列的に隣り合うか否かに関わらず、抽出した複数の検索クエリの中から２つの検索クエリを選択して、選択した２つの検索クエリを一対の検索クエリとして抽出してもよい。

また、抽出部５２２は、取得部５２１によって取得された検索クエリのうち、所定の検索クエリと所定の検索クエリに無関係な他の検索クエリとを抽出する。例えば、抽出部５２２は、取得部５２１によって取得された検索クエリの中から、所定の検索クエリを抽出する。続いて、抽出部５２２は、取得部５２１によって取得された検索クエリの中から、所定の検索クエリとは無関係にランダムに他の検索クエリを抽出する。

（生成部５２３）
生成部５２３は、種々の情報を生成する。具体的には、生成部５２３は、取得部５２１によって取得された検索クエリのうち、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして学習することで、所定の検索クエリから所定の検索クエリの特徴情報を予測する学習モデルを生成する。具体的には、生成部５２３は、同一のユーザによって所定の時間内に入力された複数の検索クエリの分散表現が類似するように学習モデルを学習させることで、所定の検索クエリから所定の検索クエリの特徴情報を予測する学習モデルを生成する。例えば、生成部５２３は、所定の時間内に続けて入力された一対の検索クエリの分散表現が類似するように学習することで、学習モデルを生成する。例えば、生成部５２３は、一対の検索クエリの学習前の分散表現（ベクトル）の類似度の値を算出する。また、生成部５２３は、一対の検索クエリの学習後の分散表現（ベクトル）の類似度の値を算出する。続いて、生成部５２３は、学習前の分散表現（ベクトル）の類似度の値よりも、学習後の分散表現（ベクトル）の類似度の値が大きくなるように学習モデルを学習させる。このように、生成部５２３は、一対の検索クエリに対応する一対の分散表現である２つのベクトルが分散表現空間上で類似するように学習モデルを学習させることで、検索クエリから分散表現（ベクトル）を出力する学習モデルを生成する。より具体的には、生成部５２３は、ＲＮＮの一種であるＬＳＴＭを分散表現生成に用いたＤＳＳＭの技術を用いて、検索クエリから分散表現（ベクトル）を出力する学習モデルを生成する。例えば、生成部５２３は、学習モデルの正解データとして、同一のユーザによって所定の時間内に入力された一対の検索クエリが類似する特徴を有するものとして、所定の検索クエリの分散表現（ベクトル）と、所定の検索クエリと対となる他の検索クエリの分散表現（ベクトル）とが、分散表現空間上で近くに存在するように学習する。また、生成部５２３は、第１モデルを生成すると、第１モデルを識別する識別情報と対応付けて、生成した第１モデル（モデルデータＭＤＴ１）をモデル情報記憶部５３３に格納する。

〔６．第１モデルの一例〕
次に、図１３を用いて生成装置５０が生成する第１モデルの一例について説明する。図１３は、実施形態に係る第１モデルの一例を示す図である。図１３に示す例では、生成装置５０が生成する第１モデルＭ１は、３層のＬＳＴＭＲＮＮで構成されている。図１３に示す例では、抽出部５２２は、同一のユーザＵ１によって所定の時間内に連続して入力された「六本木パスタ」という検索クエリＱ１１と「六本木イタリアン」という検索クエリＱ１２とから成る一対の検索クエリを抽出する。生成部５２３は、抽出部５２２によって抽出されたた検索クエリＱ１１を第１モデルＭ１の入力層に入力する（ステップＳ４１）。

続いて、生成部５２３は、第１モデルＭ１の出力層から検索クエリＱ１１の分散表現である２５６次元のベクトルＢＱＶ１１を出力する。また、生成部５２３は、抽出部５２２によって抽出された検索クエリＱ１２を第１モデルＭ１の入力層に入力する。続いて、生成部５２３は、第１モデルＭ１の出力層から検索クエリＱ１２の分散表現である２５６次元のベクトルＢＱＶ１２を出力する（ステップＳ４２）。

続いて、生成部５２３は、連続して入力された２つの検索クエリの分散表現（ベクトル）が類似するように学習することで、検索クエリから分散表現（ベクトル）を出力する第１モデルＭ１を生成する（ステップＳ４３）。例えば、第１モデルＭ１にフィードバックをかける前（学習前）の検索クエリＱ１１の分散表現であるベクトルＢＱＶ１１と検索クエリＱ１２の分散表現であるベクトルＢＱＶ１２との唐揚げ角度の大きさをΘとする。また、第１モデルＭ１にフィードバックをかけた後（学習後）の検索クエリＱ１１の分散表現であるベクトルＱＶ１１と検索クエリＱ１２の分散表現であるベクトルＱＶ１２との唐揚げ角度の大きさをΦとする。この時、生成部５２３は、ΘよりもΦが小さくなるように、第１モデルＭ１を学習させる。例えば、生成部５２３は、ベクトルＢＱＶ１１とベクトルＢＱＶ１２のコサイン類似度の値を算出する。また、生成部５２３は、ベクトルＱＶ１１とベクトルＱＶ１２のコサイン類似度の値を算出する。続いて、生成部５２３は、ベクトルＢＱＶ１１とベクトルＢＱＶ１２のコサイン類似度の値よりも、ベクトルＱＶ１１とベクトルＱＶ１２のコサイン類似度の値が大きくなるように（値が１に近づくように）学習モデルＭ１を学習させる。このように、生成部５２３は、一対の検索クエリに対応する一対の分散表現である２つのベクトルが分散表現空間上で類似するように第１モデルＭ１を学習させることで、検索クエリから分散表現（ベクトル）を出力する第１モデルＭ１を生成する。なお、生成部５２３は、コサイン類似度に限らず、ベクトル間の距離尺度として適用可能な指標であれば、どのような指標に基づいて分散表現（ベクトル）の間の類似度を算出してもよい。また、生成部５２３は、ベクトル間の距離尺度として適用可能な指標であれば、どのような指標に基づいて学習モデルＭ１を学習させてもよい。例えば、生成部５２３は、分散表現（ベクトル）同士のユークリッド距離や双曲空間等の非ユークリッド空間中での距離、マンハッタン距離、マハラノビス距離等といった所定の距離関数の値を算出する。続いて、生成部５２３は、分散表現（ベクトル）同士の所定の距離関数の値（すなわち、分散表現空間における距離）が小さくなるように学習モデルＭ１を学習させてもよい。

また、生成部５２３は、同一のユーザによって所定の時間内に入力された複数の検索クエリとして、所定の区切り文字で区切られた文字情報を含む複数の検索クエリが類似する特徴を有するものとして学習することで、第１モデルを生成する。例えば、生成部５２３は、地名を示す「六本木」と食品の種類を示す「パスタ」の文字とが区切り文字であるスペースで区切られた検索クエリ「六本木パスタ」と、地名を示す「六本木」と料理の種類を示す「イタリアン」の文字とが区切り文字であるスペースで区切られた検索クエリ「六本木イタリアン」とが類似する特徴を有するものとして学習することで、第１モデルを生成する。

また、生成部５２３は、取得部５２１によって取得された検索クエリのうち、ランダムに抽出された複数の検索クエリが相違する特徴を有するものとして学習することで、第１モデルを生成する。具体的には、生成部５２３は、取得部５２１によって取得された検索クエリのうち、ランダムに抽出された一対の検索クエリの分散表現が相違するように学習することで、第１モデルを生成する。例えば、生成部５２３は、抽出部５２２によって抽出された所定の検索クエリの分散表現と、所定の検索クエリとは無関係にランダムに抽出された検索クエリの分散表現とが分散表現空間上で遠くにマッピングされるように第１モデルＭ１のトレーニングを行う。

〔７．第１モデルの生成処理のフロー〕
次に、図１４を用いて、実施形態に係る第１モデルの生成処理の手順について説明する。図１４は、実施形態に係る第１モデルの生成処理手順を示すフローチャートである。

図１４に示す例では、生成装置５０は、ユーザによって入力された検索クエリを取得する（ステップＳ１００１）。

続いて、生成装置５０は、同一のユーザによって所定の時間内に入力された複数の検索クエリを抽出する（ステップＳ１００２）。

続いて、生成装置５０は、抽出した複数の検索クエリが類似する特徴を有するものとして学習することで、所定の検索クエリから所定の検索クエリの特徴情報を予測する第１モデルを生成する（ステップＳ１００３）。

〔８．効果〕
上述してきたように、実施形態に係る特定装置１００は、取得部１３１と特定部１３３を有する。取得部１３１は、利用者が入力した検索クエリを取得する。特定部１３３は、取得部１３１により取得された検索クエリを利用者が入力した際の検索意図と、他の検索クエリを利用者が入力した際の検索意図との類似性に基づいて、取得部１３１により取得された検索クエリと所定の関連性を有する他の検索クエリを特定する。

これにより、特定装置１００は、検索クエリを利用者が入力した際の検索意図の類似性に基づいて、検索クエリが示す分析対象を所望する利用者に提案する他の対象を適切に選択することができる。したがって、特定装置１００は、有用な情報を得ることができる。

また、取得部１３１は、それぞれ異なる取引対象の組を示す検索クエリを取得する。特定部１３３は、検索クエリとして入力された際の検索意図が取得部１３１により取得された検索クエリが示す取引対象の組と類似する他の取引対象の組を示す他の検索クエリを特定する。

これにより、特定装置１００は、それぞれ異なる取引対象の組を示す検索クエリが示す取引対象の組（例えば、「お酒枝豆」）に関する情報を所望する利用者に提案する他の取引対象の組（例えば、「ビール刺身」）に関する情報を適切に選択することができる。

また、特定部１３３は、検索クエリとして入力された際の検索意図が取得部１３１により取得された検索クエリが示す取引対象の組と類似する他の取引対象の組を示す他の検索クエリを特定し、特定した他の検索クエリが示す組に含まれる取引対象の共通性に基づいて、取得部１３１により取得された検索クエリが示す組に含まれる第１取引対象と所定の関連性を有する第１関連取引対象を特定する。また、特定部１３３は、検索クエリとして入力された際の検索意図が取得部１３１により取得された検索クエリが示す取引対象の組と類似する他の取引対象の組を示す他の検索クエリを特定し、特定した他の検索クエリが示す組に含まれる数が所定の条件を満たす取引対象を取得部１３１により取得された検索クエリが示す組に含まれる第１取引対象と所定の関連性を有する第１関連取引対象として特定する。また、特定部１３３は、特定部は、第１関連取引対象を第１取引対象の代替品として特定する。

これにより、特定装置１００は、検索クエリが示す取引対象の組（例えば、「お酒枝豆」）に含まれる第１取引対象（例えば、「お酒」）に関する情報を所望する利用者に提案する他の取引対象（例えば、「ビール」）に関する情報を適切に選択することができる。

また、特定部１３３は、特定した第１関連取引対象を含む組を示す他の検索クエリを特定する。また、特定部１３３は、第１関連取引対象を含む組を示す他の検索クエリを特定し、特定した他の検索クエリが示す組に含まれる取引対象のうち、第１関連取引対象とは異なる取引対象を、取得部１３１により取得された検索クエリが示す組に含まれる取引対象のうち、第１取引対象とは異なる第２取引対象と所定の関連性を有する第２関連取引対象として特定する。また、特定部１３３は、第２関連取引対象を第２取引対象の代替品として特定する。

これにより、特定装置１００は、検索クエリが示す取引対象の組（例えば、「お酒枝豆」）に含まれる第１取引対象（例えば、「お酒」）とは異なる第２取引対象（例えば、「枝豆」）に関する情報を所望する利用者に提案する他の取引対象（例えば、「刺身」）に関する情報を適切に選択することができる。

また、実施形態に係る特定装置１００は、算出部１３２をさらに有する。算出部１３２は、取得部１３１により取得された検索クエリを利用者が入力した際の検索意図と、他の検索クエリを利用者が入力した際の検索意図との類似性を示すスコアを算出する。特定部１３３は、算出部１３２によって算出されたスコアに基づいて、取得部１３１により取得された検索クエリと所定の関連性を有する他の検索クエリを特定する。また、算出部１３２は、検索クエリとして入力された文字情報に対応する分散表現と他の検索クエリとして入力された他の文字情報に対応する分散表現との類似度をスコアとして算出する。また、特定部１３３は、算出部１３２によって算出されたスコアと所定の閾値との比較に基づいて、他の検索クエリを特定する。

これにより、特定装置１００は、客観的な数値に基づいて、検索クエリが示す分析対象を所望する利用者に提案する他の対象を適切に選択することができる。

また、実施形態に係る特定装置１００は、提供部１３４をさらに有する。提供部１３４は、取得部１３１により取得された検索クエリと特定部１３３によって特定された他の検索クエリとの比較に基づいて、取得部１３１により取得された検索クエリに関する情報を提供する。また、提供部１３４は、検索クエリに含まれる取引対象に関する所定の傾向に関する情報を提供する。また、提供部１３４は、検索クエリに含まれる取引対象に関連する商品又はサービスに関する提案情報を提供する。

これにより、特定装置１００は、検索クエリを利用者が入力した際の検索意図の類似性に基づいて、検索クエリが示す分析対象を所望する利用者に提案する他の対象に関する情報や対象に関連する商品又はサービスに関する提案情報を適切に選択することができる。

〔９．ハードウェア構成〕
また、上述してきた実施形態に係る特定装置１００または生成装置５０は、例えば図１５に示すような構成のコンピュータ１０００によって実現される。図１５は、特定装置１００または生成装置５０の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ１０００は、ＣＰＵ１１００、ＲＡＭ１２００、ＲＯＭ１３００、ＨＤＤ１４００、通信インターフェイス（Ｉ／Ｆ）１５００、入出力インターフェイス（Ｉ／Ｆ）１６００、及びメディアインターフェイス（Ｉ／Ｆ）１７００を備える。

ＣＰＵ１１００は、ＲＯＭ１３００またはＨＤＤ１４００に格納されたプログラムに基づいて動作し、各部の制御を行う。ＲＯＭ１３００は、コンピュータ１０００の起動時にＣＰＵ１１００によって実行されるブートプログラムや、コンピュータ１０００のハードウェアに依存するプログラム等を格納する。

ＨＤＤ１４００は、ＣＰＵ１１００によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を格納する。通信インターフェイス１５００は、所定の通信網を介して他の機器からデータを受信してＣＰＵ１１００へ送り、ＣＰＵ１１００が生成したデータを所定の通信網を介して他の機器へ送信する。

ＣＰＵ１１００は、入出力インターフェイス１６００を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。ＣＰＵ１１００は、入出力インターフェイス１６００を介して、入力装置からデータを取得する。また、ＣＰＵ１１００は、生成したデータを入出力インターフェイス１６００を介して出力装置へ出力する。

メディアインターフェイス１７００は、記録媒体１８００に格納されたプログラムまたはデータを読み取り、ＲＡＭ１２００を介してＣＰＵ１１００に提供する。ＣＰＵ１１００は、かかるプログラムを、メディアインターフェイス１７００を介して記録媒体１８００からＲＡＭ１２００上にロードし、ロードしたプログラムを実行する。記録媒体１８００は、例えばＤＶＤ（Digital Versatile Disc）、ＰＤ（Phase change rewritable Disk）等の光学記録媒体、ＭＯ（Magneto-Optical disk）等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。

例えば、コンピュータ１０００が特定装置１００または生成装置５０として機能する場合、コンピュータ１０００のＣＰＵ１１００は、ＲＡＭ１２００上にロードされたプログラムを実行することにより、制御部１３０または制御部５２の機能を実現する。コンピュータ１０００のＣＰＵ１１００は、これらのプログラムを記録媒体１８００から読み取って実行するが、他の例として、他の装置から所定の通信網を介してこれらのプログラムを取得してもよい。

以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。

〔１０．その他〕
また、上記実施形態及び変形例において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。

また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。

また、上述してきた実施形態及び変形例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。

また、上述してきた「部（section、module、unit）」は、「手段」や「回路」などに読み替えることができる。例えば、特定部は、特定手段や特定回路に読み替えることができる。

１特定システム
１０端末装置
２０検索サーバ
５０生成装置
１００特定装置
１１０通信部
１２０記憶部
１２１利用者情報記憶部
１２２モデル情報記憶部
１３０制御部
１３１取得部
１３２算出部
１３３特定部
１３４提供部

Claims

利用者が検索クエリとして入力した文字情報であって、それぞれ異なる取引対象を示す複数の文字列と前記複数の文字列を区切る所定の区切り文字とを含む文字情報を取得する取得部と、
前記取得部により取得された文字情報に対応する分散表現と、他の検索クエリとして入力された他の文字情報であって、それぞれ異なる取引対象を示す複数の文字列と前記複数の文字列を区切る所定の区切り文字とを含む他の文字情報に対応する他の分散表現との類似性に基づいて、前記取得部により取得された文字情報と所定の関連性を有する他の文字情報を特定し、特定した当該他の文字情報が示す組に含まれる取引対象の共通性に基づいて、特定した当該他の文字情報が示す組に含まれる取引対象の中から、当該取得部により取得された文字情報が示す組に含まれる第１取引対象と所定の関連性を有する第１関連取引対象を特定する特定部と
を有することを特徴とする特定装置。
前記特定部は、
前記取得部により取得された文字情報に対応する分散表現と類似する他の分散表現に対応する他の文字情報を特定し、特定した当該他の文字情報が示す組に含まれる数が所定の条件を満たす取引対象を当該取得部により取得された文字情報が示す組に含まれる第１取引対象と所定の関連性を有する第１関連取引対象として特定する
ことを特徴とする請求項１に記載の特定装置。
前記特定部は、
前記第１関連取引対象を前記第１取引対象の代替品として特定する
ことを特徴とする請求項１または２に記載の特定装置。
前記特定部は、
前記第１関連取引対象を含む組を示す前記他の文字情報を特定し、特定した当該他の文字情報が示す組に含まれる取引対象のうち、当該第１関連取引対象とは異なる取引対象を、前記取得部により取得された文字情報が示す組に含まれる取引対象のうち、前記第１取引対象とは異なる第２取引対象と所定の関連性を有する第２関連取引対象として特定する
ことを特徴とする請求項１〜３のいずれか一つに記載の特定装置。
前記特定部は、
前記第２関連取引対象を前記第２取引対象の代替品として特定する
ことを特徴とする請求項４に記載の特定装置。
前記取得部により取得された文字情報に対応する分散表現と、前記他の文字情報に対応する他の分散表現との類似度を算出する算出部をさらに有し、
前記特定部は、
前記算出部によって算出された類似度に基づいて、前記取得部により取得された文字情報と所定の関連性を有する他の文字情報を特定する
ことを特徴とする請求項１〜５のいずれか一つに記載の特定装置。
前記特定部は、
前記算出部によって算出された類似度と所定の閾値との比較に基づいて、前記他の文字情報を特定する
ことを特徴とする請求項６に記載の特定装置。
前記取得部により取得された文字情報と前記特定部によって特定された他の文字情報との比較に基づいて、前記取得部により取得された文字情報に関する情報を提供する提供部
をさらに有することを特徴とする請求項１〜７のいずれか一つに記載の特定装置。
前記提供部は、
前記文字情報に含まれる取引対象に関する所定の傾向に関する情報を提供する
ことを特徴とする請求項８に記載の特定装置。
前記提供部は、
前記文字情報に含まれる取引対象に関連する商品又はサービスに関する提案情報を提供する
ことを特徴とする請求項８または９に記載の特定装置。
コンピュータが実行する特定方法であって、
利用者が検索クエリとして入力した文字情報であって、それぞれ異なる取引対象を示す複数の文字列と前記複数の文字列を区切る所定の区切り文字とを含む文字情報を取得する取得工程と、
前記取得工程により取得された文字情報に対応する分散表現と、他の検索クエリとして入力された他の文字情報であって、それぞれ異なる取引対象を示す複数の文字列と前記複数の文字列を区切る所定の区切り文字とを含む他の文字情報に対応する他の分散表現との類似性に基づいて、前記取得工程により取得された文字情報と所定の関連性を有する他の文字情報を特定し、特定した当該他の文字情報が示す組に含まれる取引対象の共通性に基づいて、特定した当該他の文字情報が示す組に含まれる取引対象の中から、当該取得工程により取得された文字情報が示す組に含まれる第１取引対象と所定の関連性を有する第１関連取引対象を特定する特定工程と
を含むことを特徴とする特定方法。
利用者が検索クエリとして入力した文字情報であって、それぞれ異なる取引対象を示す複数の文字列と前記複数の文字列を区切る所定の区切り文字とを含む文字情報を取得する取得手順と、
前記取得手順により取得された文字情報に対応する分散表現と、他の検索クエリとして入力された他の文字情報であって、それぞれ異なる取引対象を示す複数の文字列と前記複数の文字列を区切る所定の区切り文字とを含む他の文字情報に対応する他の分散表現との類似性に基づいて、前記取得手順により取得された文字情報と所定の関連性を有する他の文字情報を特定し、特定した当該他の文字情報が示す組に含まれる取引対象の共通性に基づいて、特定した当該他の文字情報が示す組に含まれる取引対象の中から、当該取得手順により取得された文字情報が示す組に含まれる第１取引対象と所定の関連性を有する第１関連取引対象を特定する特定手順と
をコンピュータに実行させることを特徴とする特定プログラム。