JP6938569B2 - Information processing equipment, information processing methods and information processing programs - Google Patents

Information processing equipment, information processing methods and information processing programs Download PDF

Info

Publication number
JP6938569B2
JP6938569B2 JP2019123237A JP2019123237A JP6938569B2 JP 6938569 B2 JP6938569 B2 JP 6938569B2 JP 2019123237 A JP2019123237 A JP 2019123237A JP 2019123237 A JP2019123237 A JP 2019123237A JP 6938569 B2 JP6938569 B2 JP 6938569B2
Authority
JP
Japan
Prior art keywords
query
information
queries
search
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019123237A
Other languages
Japanese (ja)
Other versions
JP2021009573A (en
Inventor
泰介 森
泰介 森
高昌 澁川
高昌 澁川
知紘 小川
知紘 小川
寺田 幸弘
幸弘 寺田
朋美 田畑
朋美 田畑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2019123237A priority Critical patent/JP6938569B2/en
Publication of JP2021009573A publication Critical patent/JP2021009573A/en
Application granted granted Critical
Publication of JP6938569B2 publication Critical patent/JP6938569B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、情報処理装置、情報処理方法及び情報処理プログラムに関する。 The present invention relates to an information processing device, an information processing method, and an information processing program.

近年、インターネットの飛躍的な普及に伴い、例えば、インターネット上の種々の情報を用いた分析に関する技術が提供されている。例えば、ユーザが入力した検索クエリに基づいて、所定の事業者が提供する対象に対するニーズに関する情報を抽出する技術が提案されている。 In recent years, with the rapid spread of the Internet, for example, techniques related to analysis using various information on the Internet have been provided. For example, a technique has been proposed in which information on needs for a target provided by a predetermined business operator is extracted based on a search query entered by a user.

特開2019−32776号公報JP-A-2019-32776

しかしながら、上記の従来技術では、有用な情報を得ることができるとは限らない。例えば、上記の従来技術では、所定の事業者が提供する対象に対するニーズに関する情報を抽出しているに過ぎないので、所定の事業者が提供する対象に対する潜在的なニーズに関する情報を抽出できるとは言えない。 However, it is not always possible to obtain useful information with the above-mentioned prior art. For example, in the above-mentioned prior art, since only the information regarding the needs for the target provided by the predetermined business operator is extracted, it is possible to extract the information regarding the potential needs for the target provided by the predetermined business operator. I can not say.

本願は、上記に鑑みてなされたものであって、有用な情報を提供することができる情報処理装置、情報処理方法及び情報処理プログラムを提供することを目的とする。 The present application has been made in view of the above, and an object of the present application is to provide an information processing device, an information processing method, and an information processing program capable of providing useful information.

本願に係る情報処理装置は、類似性の判定対象を示す複数の第1クエリと、前記類似性の判定基準を示す複数の第2クエリとを受け付ける受付部と、前記第2クエリごとに、各第1クエリが示す判定対象と、当該第2クエリが示す判定基準との類似性を示す類似情報を生成する生成部と、前記生成部によって生成された類似情報を出力する出力部と、を有することを特徴とする。 The information processing apparatus according to the present application has a reception unit that accepts a plurality of first queries indicating similarity determination targets and a plurality of second queries indicating the similarity determination criteria, and each of the second queries. It has a generation unit that generates similar information indicating similarity between the determination target indicated by the first query and the determination criterion indicated by the second query, and an output unit that outputs the similarity information generated by the generation unit. It is characterized by that.

実施形態の一態様によれば、有用な情報を得ることができるといった効果を奏する。 According to one aspect of the embodiment, there is an effect that useful information can be obtained.

図1は、実施形態に係る情報処理の一例を示す図である。FIG. 1 is a diagram showing an example of information processing according to an embodiment. 図2は、実施形態に係る情報処理システムの構成例を示す図である。FIG. 2 is a diagram showing a configuration example of an information processing system according to an embodiment. 図3は、実施形態に係る情報処理装置の構成例を示す図である。FIG. 3 is a diagram showing a configuration example of the information processing device according to the embodiment. 図4は、実施形態に係るクエリ情報記憶部の一例を示す図である。FIG. 4 is a diagram showing an example of the query information storage unit according to the embodiment. 図5は、実施形態に係るベクトル情報記憶部の一例を示す図である。FIG. 5 is a diagram showing an example of the vector information storage unit according to the embodiment. 図6は、実施形態に係る類似度情報記憶部の一例を示す図である。FIG. 6 is a diagram showing an example of the similarity information storage unit according to the embodiment. 図7は、実施形態に係るモデル情報記憶部の一例を示す図である。FIG. 7 is a diagram showing an example of a model information storage unit according to the embodiment. 図8は、実施形態に係る端末装置の構成例を示す図である。FIG. 8 is a diagram showing a configuration example of the terminal device according to the embodiment. 図9は、実施形態に係る情報処理手順を示すフローチャートである。FIG. 9 is a flowchart showing an information processing procedure according to the embodiment. 図10は、実施形態に係る第1モデルの生成処理の一例を示す図である。FIG. 10 is a diagram showing an example of the generation process of the first model according to the embodiment. 図11は、実施形態に係る第1モデルの生成処理の一例を示す図である。FIG. 11 is a diagram showing an example of the generation process of the first model according to the embodiment. 図12は、実施形態に係る生成装置の構成例を示す図である。FIG. 12 is a diagram showing a configuration example of the generator according to the embodiment. 図13は、実施形態に係るクエリ情報記憶部の一例を示す図である。FIG. 13 is a diagram showing an example of the query information storage unit according to the embodiment. 図14は、実施形態に係るベクトル情報記憶部の一例を示す図である。FIG. 14 is a diagram showing an example of the vector information storage unit according to the embodiment. 図15は、実施形態に係るモデル情報記憶部の一例を示す図である。FIG. 15 is a diagram showing an example of a model information storage unit according to the embodiment. 図16は、実施形態に係る第1モデルの一例を示す図である。FIG. 16 is a diagram showing an example of the first model according to the embodiment. 図17は、実施形態に係る第1モデルの生成処理手順を示すフローチャートである。FIG. 17 is a flowchart showing a generation processing procedure of the first model according to the embodiment. 図18は、プログラムを実行するコンピュータのハードウェア構成の一例を示す図である。FIG. 18 is a diagram showing an example of the hardware configuration of the computer that executes the program.

以下に、本願に係る情報処理装置、情報処理方法及び情報処理プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る情報処理装置、情報処理方法及び情報処理プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略する。 Hereinafter, the information processing apparatus, the information processing method, and the mode for carrying out the information processing program (hereinafter referred to as “the embodiment”) according to the present application will be described in detail with reference to the drawings. The information processing apparatus, information processing method, and information processing program according to the present application are not limited by this embodiment. Further, in each of the following embodiments, the same parts will be designated by the same reference numerals, and duplicate description will be omitted.

〔1.情報処理の一例〕
まず、図1を用いて、実施形態に係る情報処理の一例について説明する。図1は、実施形態に係る情報処理の一例を示す図である。実施形態に係る情報処理は、図1に示す情報処理装置100によって行われる。図1に示す情報処理装置100は、クライアント(企業等)に対して、クエリの分析サービスを提供するサーバ装置である。ここで、「クエリ」とは、データベースに対する問い合わせや要求を行うためにユーザによって用いられる語句(文字情報)を指す。例えば、「クエリ」には、ユーザによって検索に用いられる語句である検索クエリが含まれる。なお、本願発明における「クエリ」には、ユーザによってどのように用いられたかとは関係のない単なるキーワードやフレーズといった語句が含まれてもよいものとする。
[1. An example of information processing]
First, an example of information processing according to the embodiment will be described with reference to FIG. FIG. 1 is a diagram showing an example of information processing according to an embodiment. The information processing according to the embodiment is performed by the information processing device 100 shown in FIG. The information processing device 100 shown in FIG. 1 is a server device that provides a query analysis service to a client (company or the like). Here, the "query" refers to a phrase (character information) used by the user to make an inquiry or request to the database. For example, a "query" includes a search query, which is a phrase used by a user for a search. It should be noted that the "query" in the present invention may include words and phrases such as simple keywords and phrases that have nothing to do with how they are used by the user.

図1の説明に先立って、図2を用いて、実施形態に係る情報処理システムの構成について説明する。図2は、実施形態に係る情報処理システムの構成例を示す図である。図2に示すように、情報処理システム1には、端末装置10と、検索サーバ20と、生成装置50と、情報処理装置100とが含まれる。端末装置10と、検索サーバ20と、生成装置50と、情報処理装置100とは所定のネットワークNを介して、有線または無線により通信可能に接続される。なお、図2に示す情報処理システム1には、任意の数の端末装置10と任意の数の検索サーバ20と任意の数の生成装置50と任意の数の情報処理装置100とが含まれてもよい。 Prior to the description of FIG. 1, the configuration of the information processing system according to the embodiment will be described with reference to FIG. FIG. 2 is a diagram showing a configuration example of an information processing system according to an embodiment. As shown in FIG. 2, the information processing system 1 includes a terminal device 10, a search server 20, a generation device 50, and an information processing device 100. The terminal device 10, the search server 20, the generation device 50, and the information processing device 100 are connected to each other via a predetermined network N so as to be communicable by wire or wirelessly. The information processing system 1 shown in FIG. 2 includes an arbitrary number of terminal devices 10, an arbitrary number of search servers 20, an arbitrary number of generation devices 50, and an arbitrary number of information processing devices 100. May be good.

端末装置10は、クライアント(企業等)の担当者である利用者によって使用される情報処理装置である。端末装置10は、例えば、スマートフォンや、タブレット型端末や、ノート型PC(Personal Computer)や、携帯電話機や、PDA(Personal Digital Assistant)等により実現される。図1に示す例では、端末装置10はノート型PCである。なお、以下では、端末装置10を利用者と同一視する場合がある。すなわち、以下では、利用者を端末装置10と読み替えることもできる。 The terminal device 10 is an information processing device used by a user who is in charge of a client (company or the like). The terminal device 10 is realized by, for example, a smartphone, a tablet terminal, a notebook PC (Personal Computer), a mobile phone, a PDA (Personal Digital Assistant), or the like. In the example shown in FIG. 1, the terminal device 10 is a notebook PC. In the following, the terminal device 10 may be equated with the user. That is, in the following, the user can be read as the terminal device 10.

端末装置10は、クライアント(企業等)の担当者である利用者U11の操作に従って、類似性の判定対象を示す複数の第1クエリと、類似性の判定基準を示す複数の第2クエリとを情報処理装置100に送信する。また、端末装置10は、類似性の判定基準を示す第2クエリごとに、各第1クエリが示す判定対象と、第2クエリが示す判定基準との類似度の大きさを視認可能にした棒グラフに関する情報を情報処理装置100から受信する。端末装置10は、受信した棒グラフに関する情報を端末装置10の画面に表示する。 The terminal device 10 comprises a plurality of first queries indicating the similarity determination target and a plurality of second queries indicating the similarity determination criteria according to the operation of the user U11 who is in charge of the client (company or the like). It is transmitted to the information processing device 100. Further, the terminal device 10 makes it possible to visually recognize the magnitude of the degree of similarity between the determination target indicated by each first query and the determination criterion indicated by the second query for each second query indicating the similarity determination criterion. Information about the information processing device 100 is received from the information processing device 100. The terminal device 10 displays information about the received bar graph on the screen of the terminal device 10.

検索サーバ20は、検索サービスを提供するサーバ装置である。例えば、検索サーバ20が提供する検索サービスは、あらゆる情報を検索可能な総合検索サービスである。検索サーバ20は、利用者によって入力された検索クエリに関する情報を記憶する。具体的には、検索サーバ20は、利用者の検索履歴に関する情報を記憶する。また、検索サーバ20は、生成装置50の要求に応じて、利用者によって入力された検索クエリに関する情報を生成装置50に送信する。 The search server 20 is a server device that provides a search service. For example, the search service provided by the search server 20 is a comprehensive search service capable of searching for any information. The search server 20 stores information about the search query entered by the user. Specifically, the search server 20 stores information regarding the user's search history. Further, the search server 20 transmits information regarding the search query input by the user to the generation device 50 in response to the request of the generation device 50.

生成装置50は、第1モデルM1を生成するサーバ装置である。生成装置50は、後述する処理を実行することにより、第1モデルM1を生成する。第1モデルM1は、文字情報を入力すると、文字情報(例えば、検索クエリ)の分散表現を出力するモデルである。なお、分散表現は、ベクトルでもよい。ここで、第1モデルM1から出力される文字情報の分散表現には、その文字情報が検索クエリとして入力された際の利用者の検索意図を示す特徴情報が含まれている。すなわち、第1モデルM1から出力される所定の文字情報の分散表現と他の文字情報の分散表現が類似することは、所定の文字情報が検索クエリとして入力された際の利用者の検索意図と他の文字情報が検索クエリとして入力された際の利用者の検索意図とが類似することを意味する。なお、生成装置50による第1モデルの生成処理の詳細については後述する。 The generation device 50 is a server device that generates the first model M1. The generation device 50 generates the first model M1 by executing a process described later. The first model M1 is a model that outputs a distributed representation of character information (for example, a search query) when character information is input. The distributed representation may be a vector. Here, the distributed representation of the character information output from the first model M1 includes feature information indicating the user's search intention when the character information is input as a search query. That is, the similarity between the distributed representation of the predetermined character information output from the first model M1 and the distributed representation of other character information is the search intention of the user when the predetermined character information is input as a search query. It means that the search intention of the user when other character information is input as a search query is similar. The details of the generation process of the first model by the generation device 50 will be described later.

情報処理装置100は、企業等であるクライアントに対して、クライアントが市場分析を所望する分析対象を示すキーワード(文字情報)に関する一般利用者の検索動向を分析するクエリの分析サービスを提供するサーバ装置である。図1に示す例では、情報処理装置100は、類似性の判定対象を示す複数の第1クエリと、類似性の判定基準を示す複数の第2クエリとを端末装置10から受け付ける。また、情報処理装置100は、類似性の判定基準を示す第2クエリごとに、各第1クエリが示す判定対象と、第2クエリが示す判定基準との類似度の大きさを視認可能にした棒グラフに関する情報を生成する。そして、情報処理装置100は、生成した棒グラフに関する情報を端末装置10に送信する。 The information processing device 100 is a server device that provides a client such as a company with a query analysis service that analyzes a general user's search trend regarding a keyword (character information) indicating an analysis target that the client desires for market analysis. Is. In the example shown in FIG. 1, the information processing apparatus 100 receives a plurality of first queries indicating the similarity determination target and a plurality of second queries indicating the similarity determination criteria from the terminal device 10. Further, the information processing apparatus 100 makes it possible to visually recognize the magnitude of the degree of similarity between the determination target indicated by each first query and the determination criterion indicated by the second query for each second query indicating the similarity determination criterion. Generate information about bar charts. Then, the information processing device 100 transmits the information regarding the generated bar graph to the terminal device 10.

一般的に、クエリの分析サービスでは、企業等であるクライアントから、クライアントが市場分析を所望する分析対象を示すキーワード(文字情報)を受け付ける。そして、クエリの分析サービスは、膨大なクエリのデータベースの中から、指定されたキーワードと類似するクエリに関する情報を抽出し、抽出したクエリに関する情報をクライアントに対して提供する。例えば、クエリの分析サービスは、指定されたキーワードとクエリとの類似性を数値によって把握するため、クエリに対応する文字列やクライアントによって指定されたキーワードを分散表現に変換する。そして、クエリの分析サービスは、指定されたキーワードを変換した分散表現とクエリに対応する文字列を変換した分散表現との類似度を算出することで、指定されたキーワードと類似するクエリに関する情報を抽出する。 Generally, in a query analysis service, a keyword (character information) indicating an analysis target that the client wants to analyze the market is accepted from a client such as a company. Then, the query analysis service extracts information about a query similar to the specified keyword from a huge database of queries, and provides the client with information about the extracted query. For example, the query analysis service converts the character string corresponding to the query and the keyword specified by the client into a distributed expression in order to grasp the similarity between the specified keyword and the query numerically. Then, the query analysis service calculates the similarity between the distributed expression obtained by converting the specified keyword and the distributed expression obtained by converting the character string corresponding to the query, and obtains information about the query similar to the specified keyword. Extract.

ここで、クエリの分析サービスが保有するデータベースには、膨大な数のクエリが存在するため、クエリに対応する文字列を変換した分散表現の数も膨大な数になる。また、一般的に、文字列を変換した分散表現は、高次元のベクトル(例えば、何百次元や何千次元のベクトル)であることが一般的である。すなわち、クエリの分析サービスを提供する装置が指定されたキーワードと類似するクエリの分析結果に関する情報を単に抽出して提供するだけでは、分析結果に関する情報の提供を受けたクライアントが有用な情報を得ることは難しい。例えば、クライアントに対して提供される情報が、多数の高次元の分散表現を分散表現空間にマッピングした状態で提供された場合や、分散表現間の類似度を示す膨大な数のデータを羅列した状態で提供された場合には、情報量が多く、クライアントが分析結果を一見して把握することは難しい。そのため、提供された情報からクライアントが有用な情報を得ることは難しい。 Here, since the database owned by the query analysis service has a huge number of queries, the number of distributed expressions obtained by converting the character strings corresponding to the queries is also huge. Also, in general, the distributed representation obtained by converting a character string is generally a high-dimensional vector (for example, a vector having hundreds or thousands of dimensions). That is, if the device that provides the query analysis service simply extracts and provides the information on the analysis result of the query similar to the specified keyword, the client who receives the information on the analysis result obtains useful information. It's difficult. For example, when the information provided to the client is provided with a large number of high-dimensional distributed representations mapped to the distributed representation space, or a huge amount of data showing the similarity between the distributed representations is listed. When provided in a state, the amount of information is large and it is difficult for the client to grasp the analysis result at a glance. Therefore, it is difficult for the client to obtain useful information from the provided information.

そこで、本願発明に係る情報処理装置100は、類似性の判定対象を示す複数の第1クエリと、類似性の判定基準を示す複数の第2クエリとを受け付ける。また、情報処理装置100は、類似性の判定基準を示す第2クエリごとに、各第1クエリが示す判定対象と、第2クエリが示す判定基準との類似性を示す類似情報を生成する。そして、情報処理装置100は、生成した類似情報を出力する。これにより、本願発明に係る情報処理装置100は、多数の高次元の分散表現同士の類似度に関する分析結果を一見して把握しやすい状態で提供可能にする。したがって、本願発明に係る情報処理装置100は、有用な情報を得ることができる。 Therefore, the information processing apparatus 100 according to the present invention accepts a plurality of first queries indicating the similarity determination target and a plurality of second queries indicating the similarity determination criteria. Further, the information processing apparatus 100 generates similar information indicating the similarity between the determination target indicated by each first query and the determination criterion indicated by the second query for each second query indicating the similarity determination criterion. Then, the information processing device 100 outputs the generated similar information. As a result, the information processing apparatus 100 according to the present invention can provide an analysis result regarding the similarity between a large number of high-dimensional distributed expressions in a state in which it is easy to grasp at a glance. Therefore, the information processing apparatus 100 according to the present invention can obtain useful information.

ここから、図1を用いて、情報処理の流れについて説明する。図1では、情報処理装置100は、端末装置10の要求に応じて、コンテンツC1の部分コンテンツC11を端末装置10に送信する。具体的には、情報処理装置100は、複数の第1クエリを入力可能な入力フィールドF11と、複数の第2クエリを入力可能な入力フィールドF12と、入力フィールドに入力されたクエリを情報処理装置100に送信する送信ボタンB11とを含む部分コンテンツC11を端末装置10に送信する。 From here, the flow of information processing will be described with reference to FIG. In FIG. 1, the information processing device 100 transmits the partial content C11 of the content C1 to the terminal device 10 in response to the request of the terminal device 10. Specifically, the information processing device 100 inputs an input field F11 capable of inputting a plurality of first queries, an input field F12 capable of inputting a plurality of second queries, and a query input in the input fields. The partial content C11 including the transmission button B11 to be transmitted to 100 is transmitted to the terminal device 10.

端末装置10は、コンテンツC1の部分コンテンツC11を情報処理装置100から受信する。端末装置10は、部分コンテンツC11を受信すると、受信した部分コンテンツC11を端末装置10の画面に表示する。 The terminal device 10 receives the partial content C11 of the content C1 from the information processing device 100. When the terminal device 10 receives the partial content C11, the terminal device 10 displays the received partial content C11 on the screen of the terminal device 10.

端末装置10の利用者U11は、端末装置10の画面に表示された部分コンテンツC11に含まれる入力フィールドF11に類似性の判定対象を示す複数の第1クエリを入力する操作を行う。図1に示す例では、利用者U11は、9つの第1クエリQ1-1〜Q1-9を入力フィールドF11に入力する操作を行う。具体的には、利用者U11は、区切り文字で区切られた各文字列をそれぞれ一つの第1クエリとして入力フィールドF11に入力する操作を行う。例えば、自動車メーカー#1の担当者である利用者U11は、自社(自動車メーカー#1)の商品である3種類の自動車の名称を示す3つの第1クエリ「車種T11」(第1クエリQ1-1)、第1クエリ「車種T12」(第1クエリQ1-2)、第1クエリ「車種T13」(第1クエリQ1-3)を入力フィールドF11に入力する操作を行う。また、利用者U11は、競合他社である自動車メーカー#2の商品である3種類の自動車の名称を示す3つの第1クエリ「車種T21」(第1クエリQ1-4)、第1クエリ「車種T22」(第1クエリQ1-5)、第1クエリ「車種T23」(第1クエリQ1-6)を入力フィールドF11に入力する操作を行う。また、利用者U11は、競合他社である自動車メーカー#3の商品である3種類の自動車の名称を示す3つの第1クエリ「車種T31」(第1クエリQ1-7)、第1クエリ「車種T32」(第1クエリQ1-8)、「車種T33」(第1クエリQ1-9)を入力フィールドF11に入力する操作を行う操作を行う。 The user U11 of the terminal device 10 performs an operation of inputting a plurality of first queries indicating a similarity determination target in the input field F11 included in the partial content C11 displayed on the screen of the terminal device 10. In the example shown in FIG. 1, the user U11 performs an operation of inputting nine first queries Q1-1 to Q1-9 in the input field F11. Specifically, the user U11 performs an operation of inputting each character string separated by a delimiter into the input field F11 as one first query. For example, the user U11, who is in charge of the automobile manufacturer # 1, has three first queries "vehicle type T11" (first query Q1-) indicating the names of the three types of automobiles that are the products of the company (automobile manufacturer # 1). 1), the operation of inputting the first query "vehicle type T12" (first query Q1-2) and the first query "vehicle type T13" (first query Q1-3) into the input field F11 is performed. In addition, the user U11 has three first queries "vehicle type T21" (first query Q1-4) and a first query "vehicle type" indicating the names of three types of automobiles that are products of the automobile manufacturer # 2 which is a competitor. The operation of inputting "T22" (first query Q1-5) and the first query "vehicle type T23" (first query Q1-6) into the input field F11 is performed. In addition, the user U11 has three first queries "vehicle type T31" (first query Q1-7) and a first query "vehicle type" indicating the names of three types of automobiles that are products of the automobile manufacturer # 3 which is a competitor. The operation of inputting "T32" (first query Q1-8) and "vehicle type T33" (first query Q1-9) into the input field F11 is performed.

また、端末装置10の利用者U11は、端末装置10の画面に表示された部分コンテンツC11に含まれる入力フィールドF12に類似性の判定基準を示す複数の第2クエリを入力する操作を行う。利用者U11は、第1クエリを分析する際の分析の軸としたいキーワードを第2クエリとして入力する操作を行う。図1に示す例では、利用者U11は、3つの第1クエリQ2-1〜Q2-3を入力フィールドF12に入力する操作を行う。具体的には、利用者U11は、区切り文字で区切られた各文字列をそれぞれ一つの第2クエリとして入力フィールドF12に入力する操作を行う。例えば、利用者U11は、競合他社の商品と比べて、自社の商品が市場のどの分野で消費者に対する強み(又は弱み)があるかを把握するためのキーワードを第2クエリとして入力する。例えば、利用者U11は、3つの第2クエリ「キャンプ」(第2クエリQ2-1)、第2クエリ「SNS#1」(第2クエリQ2-2)、第2クエリ「夜景」(第2クエリQ2-3)を入力フィールドF12に入力する操作を行う。 Further, the user U11 of the terminal device 10 performs an operation of inputting a plurality of second queries indicating similarity determination criteria in the input field F12 included in the partial content C11 displayed on the screen of the terminal device 10. The user U11 performs an operation of inputting a keyword to be the axis of analysis when analyzing the first query as the second query. In the example shown in FIG. 1, the user U11 performs an operation of inputting three first queries Q2-1 to Q2-3 into the input field F12. Specifically, the user U11 performs an operation of inputting each character string separated by a delimiter into the input field F12 as one second query. For example, the user U11 inputs a keyword as a second query for grasping in which field of the market the company's product has strengths (or weaknesses) against consumers as compared with the products of competitors. For example, the user U11 has three second queries "camp" (second query Q2-1), second query "SNS # 1" (second query Q2-2), and second query "night view" (second query). Perform the operation of inputting the query Q2-3) into the input field F12.

続いて、端末装置10の利用者U11は、端末装置10の画面に表示された部分コンテンツC11に含まれる送信ボタンB11を選択する操作を行う。端末装置10は、利用者U11の操作に従って送信ボタンB11が選択されると、入力フィールドF11に入力された9つの第1クエリQ1-1〜Q1-9と、入力フィールドF12に入力された3つの第2クエリQ2-1〜Q2-3を情報処理装置100に送信する。 Subsequently, the user U11 of the terminal device 10 performs an operation of selecting the transmission button B11 included in the partial content C11 displayed on the screen of the terminal device 10. When the transmission button B11 is selected according to the operation of the user U11, the terminal device 10 has nine first queries Q1-1 to Q1-9 input in the input field F11 and three input in the input field F12. The second query Q2-1 to Q2-3 is transmitted to the information processing apparatus 100.

情報処理装置100は、9つの第1クエリQ1-1〜Q1-9と3つの第2クエリQ2-1〜Q2-3を利用者U11から受け付ける。具体的には、情報処理装置100は、9つの第1クエリQ1-1〜Q1-9と3つの第2クエリQ2-1〜Q2-3を端末装置10から受信する。 The information processing device 100 receives nine first queries Q1-1 to Q1-9 and three second queries Q2-1 to Q2-3 from the user U11. Specifically, the information processing apparatus 100 receives nine first queries Q1-1 to Q1-9 and three second queries Q2-1 to Q2-3 from the terminal apparatus 10.

情報処理装置100は、第1クエリQ1-1〜Q1-9と第2クエリQ2-1〜Q2-3を受け付けると、第2クエリごとに、各第1クエリが示す判定対象と、第2クエリが示す判定基準との類似度を算出する。具体的には、第1クエリQ1-1〜Q1-9と第2クエリQ2-1〜Q2-3を受け付けると、第1モデルM1を用いて生成された各第1クエリQ1-1〜Q1-9の分散表現QV1-1〜QV1-9(図5参照)と、各第2クエリQ2-1〜Q2-3の分散表現QV2-1〜QV2-3(図5参照)とを取得する。 When the information processing apparatus 100 receives the first query Q1-1 to Q1-9 and the second query Q2-1 to Q2-3, the information processing apparatus 100 receives the determination target indicated by each first query and the second query for each second query. Calculate the degree of similarity with the judgment criteria shown by. Specifically, when the first query Q1-1 to Q1-9 and the second query Q2-1 to Q2-3 are accepted, each of the first queries Q1-1 to Q1- generated by using the first model M1. The distributed representations QV1-1 to QV1-9 (see FIG. 5) of 9 and the distributed representations QV2-1 to QV2-3 (see FIG. 5) of each of the second queries Q2-1 to Q2-3 are acquired.

続いて、情報処理装置100は、分散表現QV1-1〜QV1-9との分散表現QV2-1〜QV2-3とを取得すると、第2クエリの分散表現ごとに、各第1クエリの分散表現と、第2クエリの分散表現との類似度を算出する。例えば、情報処理装置100は、各第1クエリの分散表現と、第2クエリの分散表現とのコサイン類似度を算出する。なお、情報処理装置100は、コサイン類似度に限らず、ベクトル間の距離尺度として適用可能な指標であれば、どのような指標に基づいて分散表現の間の類似度を算出してもよい。例えば、情報処理装置100は、分散表現同士のユークリッド距離や双曲空間等の非ユークリッド空間中での距離、マンハッタン距離、マハラノビス距離等といった所定の距離関数の値を算出してもよい。 Subsequently, when the information processing apparatus 100 acquires the distributed representations QV2-1 to QV1-9 and the distributed representations QV2-1 to QV2-3, the distributed representation of each first query is obtained for each of the distributed representations of the second query. And the degree of similarity with the distributed representation of the second query are calculated. For example, the information processing apparatus 100 calculates the cosine similarity between the distributed representation of each first query and the distributed representation of the second query. The information processing apparatus 100 is not limited to the cosine similarity, and may calculate the similarity between the distributed representations based on any index as long as it is an index applicable as a distance scale between vectors. For example, the information processing apparatus 100 may calculate the value of a predetermined distance function such as the Euclidean distance between distributed expressions, the distance in a non-Euclidean space such as a hyperbolic space, the Manhattan distance, the Mahalanobis distance, and the like.

例えば、情報処理装置100は、第2クエリQ2-1「キャンプ」の分散表現QV2-1と、各第1クエリQ1-1「車種T11」〜Q1-9「車種T33」の分散表現QV1-1〜QV1-9との類似度SC1-1〜SC1-9(図6参照)を算出する。 For example, the information processing apparatus 100 has a distributed expression QV2-1 of the second query Q2-1 "camp" and a distributed expression QV1-1 of each first query Q1-1 "vehicle type T11" to Q1-9 "vehicle type T33". -Similarity with QV1-9 SC1-1 to SC1-9 (see FIG. 6) is calculated.

例えば、情報処理装置100は、第2クエリQ2-1「キャンプ」の分散表現QV2-1と第1クエリQ1-1「車種T11」の分散表現QV1-1との類似度SC1-1を算出する。続いて、情報処理装置100は、第2クエリQ2-1「キャンプ」の分散表現QV2-1と第1クエリQ1-2「車種T12」の分散表現QV1-2との類似度SC1-2を算出する。続いて、情報処理装置100は、第2クエリQ2-1「キャンプ」の分散表現QV2-1と第1クエリQ1-3「車種T13」の分散表現とQV1-3の類似度SC1-3を算出する。同様にして、情報処理装置100は、第2クエリQ2-1「キャンプ」の分散表現QV2-1と、各第1クエリQ1-4「車種T21」〜Q1-9「車種T33」の分散表現QV1-4〜QV1-9との類似度SC1-4〜SC1-9を算出する。 For example, the information processing apparatus 100 calculates the similarity SC1-1 between the distributed expression QV2-1 of the second query Q2-1 "camp" and the distributed expression QV1-1 of the first query Q1-1 "vehicle type T11". .. Subsequently, the information processing apparatus 100 calculates the similarity SC1-2 between the distributed expression QV2-1 of the second query Q2-1 "camp" and the distributed expression QV1-2 of the first query Q1-2 "vehicle type T12". do. Subsequently, the information processing apparatus 100 calculates the distributed expression QV2-1 of the second query Q2-1 "camp" and the distributed expression of the first query Q1-3 "vehicle type T13" and the similarity SC1-3 of the QV1-3. do. Similarly, the information processing apparatus 100 has a distributed expression QV2-1 of the second query Q2-1 "camp" and a distributed expression QV1 of each first query Q1-4 "vehicle type T21" to Q1-9 "vehicle type T33". Calculate the similarity SC1-4 to SC1-9 with -4 to QV1-9.

続いて、情報処理装置100は、第2クエリQ2-1の分散表現QV2-1と、各第1クエリQ1-1〜Q1-9の分散表現QV1-1〜QV1-9との類似度SC1-1〜SC1-9を算出すると、算出した類似度SC1-1〜SC1-9の大きさを視認可能にした棒グラフG21に関する情報を生成する。具体的には、情報処理装置100は、図1の部分コンテンツC21の表示領域F21に示す情報を生成する。より具体的には、情報処理装置100は、第2クエリ第2クエリQ2-1を示す文字列である「キャンプ」が棒グラフG21の上方に配置して表示される情報を生成する。また、情報処理装置100は、算出した類似度SC1-1〜SC1-9の大きさを各棒グラフの長さで示す棒グラフG21に関する情報を生成する。 Subsequently, the information processing apparatus 100 has a similarity between the distributed representation QV2-1 of the second query Q2-1 and the distributed representation QV1-1 to QV1-9 of each of the first queries Q1-1 to Q1-9. When 1 to SC1-9 is calculated, information about the bar graph G21 that makes the calculated magnitudes of the similarity SC1-1 to SC1-9 visible is generated. Specifically, the information processing apparatus 100 generates the information shown in the display area F21 of the partial content C21 of FIG. More specifically, the information processing apparatus 100 generates information in which "camp", which is a character string indicating the second query and the second query Q2-1, is arranged above the bar graph G21 and displayed. Further, the information processing apparatus 100 generates information regarding the bar graph G21 which indicates the calculated magnitudes of the similarity SC1-1 to SC1-9 by the length of each bar graph.

また、情報処理装置100は、第1クエリが示す車種の自動車を取り扱う自動車メーカーに応じて異なる色によって、類似度の大きさを示す領域が色分けされたグラフを生成する。図1では、塗りつぶしのパターンの違いによって、色の違いを表現する。例えば、情報処理装置100は、自動車メーカー#1の商品名を示す第1クエリQ1-1〜Q1-3に対応する類似度SC1-1〜SC1-3の大きさを示す棒グラフの領域を赤色で塗りつぶした棒グラフG21に関する情報を生成する。また、情報処理装置100は、自動車メーカー#2の商品名を示す第1クエリQ1-4〜Q1-6に対応する類似度SC1-4〜SC1-6の大きさを示す棒グラフの領域を青色で塗りつぶした棒グラフG21に関する情報を生成する。また、情報処理装置100は、自動車メーカー#3の商品名を示す第1クエリQ1-7〜Q1-9に対応する類似度SC1-7〜SC1-9の大きさを示す棒グラフの領域を黄色で塗りつぶした棒グラフG21に関する情報を生成する。 In addition, the information processing device 100 generates a graph in which regions indicating the magnitude of similarity are color-coded by different colors depending on the automobile manufacturer handling the automobile of the vehicle type indicated by the first query. In FIG. 1, the difference in color is expressed by the difference in the filling pattern. For example, the information processing apparatus 100 displays the area of the bar graph indicating the magnitude of the similarity SC1-1 to SC1-3 corresponding to the first query Q1-1 to Q1-3 indicating the product name of the automobile manufacturer # 1 in red. Generates information about the filled bar graph G21. Further, the information processing apparatus 100 displays the area of the bar graph indicating the size of the similarity SC1-4 to SC1-6 corresponding to the first queries Q1-4 to Q1-6 indicating the product name of the automobile manufacturer # 2 in blue. Generates information about the filled bar graph G21. Further, the information processing apparatus 100 displays the area of the bar graph indicating the size of the similarity SC1-7 to SC1-9 corresponding to the first queries Q1-7 to Q1-9 indicating the product name of the automobile manufacturer # 3 in yellow. Generates information about the filled bar graph G21.

また、情報処理装置100は、第2クエリQ2-2「SNS#1」の分散表現QV2-2と、各第1クエリQ1-1「車種T11」〜Q1-9「車種T33」の分散表現QV1-1〜QV1-9との類似度SC2-1〜SC2-9(図6参照)を算出する。例えば、情報処理装置100は、第2クエリQ2-2「SNS#1」の分散表現QV2-2と第1クエリQ1-1「車種T11」の分散表現QV1-1との類似度SC2-1を算出する。続いて、情報処理装置100は、第2クエリQ2-2「SNS#1」の分散表現QV2-2と第1クエリQ1-2「車種T12」の分散表現QV1-2との類似度SC2-2を算出する。続いて、情報処理装置100は、第2クエリQ2-2「SNS#1」の分散表現QV2-2と第1クエリQ1-3「車種T13」の分散表現QV1-3との類似度SC2-3を算出する。同様にして、情報処理装置100は、第2クエリQ2-2「SNS#1」の分散表現QV2-2と、各第1クエリQ1-4「車種T21」〜Q1-9「車種T33」の分散表現とQV1-4〜QV1-9の類似度SC2-4〜SC2-9を算出する。 Further, the information processing apparatus 100 has a distributed expression QV2-2 of the second query Q2-2 "SNS # 1" and a distributed expression QV1 of each first query Q1-1 "vehicle type T11" to Q1-9 "vehicle type T33". The degree of similarity with -1 to QV1-9 SC2-1 to SC2-9 (see FIG. 6) is calculated. For example, the information processing apparatus 100 sets the degree of similarity SC2-1 between the distributed expression QV2-2 of the second query Q2-2 "SNS # 1" and the distributed expression QV1-1 of the first query Q1-1 "vehicle type T11". calculate. Subsequently, the information processing apparatus 100 has a similarity SC2-2 between the distributed expression QV2-2 of the second query Q2-2 "SNS # 1" and the distributed expression QV1-2 of the first query Q1-2 "vehicle type T12". Is calculated. Subsequently, the information processing apparatus 100 has a similarity SC2-3 between the distributed expression QV2-2 of the second query Q2-2 "SNS # 1" and the distributed expression QV1-3 of the first query Q1-3 "vehicle type T13". Is calculated. Similarly, the information processing apparatus 100 distributes the distributed expression QV2-2 of the second query Q2-2 "SNS # 1" and the distributed representations of the first queries Q1-4 "vehicle type T21" to Q1-9 "vehicle type T33". The similarity between the expression and QV1-4 to QV1-9 SC2-4 to SC2-9 is calculated.

続いて、情報処理装置100は、第2クエリQ2-2の分散表現QV2-2と、各第1クエリQ1-1〜Q1-9の分散表現QV1-1〜QV1-9との類似度SC2-1〜SC2-9を算出すると、算出した類似度SC2-1〜SC2-9の大きさを視認可能にした棒グラフG22に関する情報を生成する。具体的には、情報処理装置100は、図1の部分コンテンツC21の表示領域F22に示す情報を生成する。より具体的には、情報処理装置100は、第2クエリ第2クエリQ2-2を示す文字列である「SNS#1」が棒グラフG22の上方に配置して表示される情報を生成する。また、情報処理装置100は、算出した類似度SC2-1〜SC2-9の大きさを各棒グラフの長さで示す棒グラフG22に関する情報を生成する。 Subsequently, the information processing apparatus 100 has a similarity between the distributed representation QV2-2 of the second query Q2-2 and the distributed representation QV1-1 to QV1-9 of each of the first queries Q1-1 to Q1-9. When 1 to SC2-9 is calculated, information about the bar graph G22 that makes the calculated magnitudes of the similarity SC2-1 to SC2-9 visible is generated. Specifically, the information processing apparatus 100 generates the information shown in the display area F22 of the partial content C21 of FIG. More specifically, the information processing apparatus 100 generates information in which "SNS # 1", which is a character string indicating the second query and the second query Q2-2, is arranged above the bar graph G22 and displayed. Further, the information processing apparatus 100 generates information regarding the bar graph G22 which indicates the calculated magnitudes of the similarity SC2-1 to SC2-9 by the length of each bar graph.

また、情報処理装置100は、自動車メーカー#1の商品名を示す第1クエリQ1-1〜Q1-3に対応する類似度SC2-1〜SC2-3の大きさを示す棒グラフの領域を赤色で塗りつぶした棒グラフG22に関する情報を生成する。また、情報処理装置100は、自動車メーカー#2の商品名を示す第1クエリQ1-4〜Q1-6に対応する類似度SC2-4〜SC2-6の大きさを示す棒グラフの領域を青色で塗りつぶした棒グラフG22に関する情報を生成する。また、情報処理装置100は、自動車メーカー#3の商品名を示す第1クエリQ1-7〜Q1-9に対応する類似度SC2-7〜SC2-9の大きさを示す棒グラフの領域を黄色で塗りつぶした棒グラフG22に関する情報を生成する。 Further, the information processing apparatus 100 displays the area of the bar graph indicating the size of the similarity SC2-1 to SC2-3 corresponding to the first query Q1-1 to Q1-3 indicating the product name of the automobile manufacturer # 1 in red. Generate information about the filled bar graph G22. Further, the information processing apparatus 100 displays the area of the bar graph indicating the size of the similarity SC2-4 to SC2-6 corresponding to the first queries Q1-4 to Q1-6 indicating the product name of the automobile manufacturer # 2 in blue. Generate information about the filled bar graph G22. Further, the information processing apparatus 100 displays the area of the bar graph indicating the size of the similarity SC2-7 to SC2-9 corresponding to the first queries Q1-7 to Q1-9 indicating the product name of the automobile manufacturer # 3 in yellow. Generate information about the filled bar graph G22.

また、情報処理装置100は、第2クエリQ2-3「夜景」の分散表現QV2-3と、各第1クエリQ1-1「車種T11」〜Q1-9「車種T33」の分散表現QV1-1〜QV1-9との類似度SC3-1〜SC3-9(図6参照)を算出する。より具体的には、情報処理装置100は、第2クエリQ2-3「夜景」の分散表現QV2-3と第1クエリQ1-1「車種T11」の分散表現QV1-1との類似度SC3-1を算出する。続いて、情報処理装置100は、第2クエリQ2-3「夜景」の分散表現QV2-3と第1クエリQ1-2「車種T12」の分散表現QV1-2との類似度SC3-2を算出する。続いて、情報処理装置100は、第2クエリQ2-3「夜景」の分散表現QV2-3と第1クエリQ1-3「車種T13」の分散表現QV1-3との類似度SC3-3を算出する。同様にして、情報処理装置100は、第2クエリQ2-3「夜景」の分散表現QV2-3と、各第1クエリQ1-4「車種T21」〜Q1-9「車種T33」の分散表現QV1-4〜QV1-9との類似度SC3-4〜SC3-9を算出する。 Further, the information processing apparatus 100 has a distributed expression QV2-3 of the second query Q2-3 "night view" and a distributed expression QV1-1 of each first query Q1-1 "vehicle type T11" to Q1-9 "vehicle type T33". -Similarity with QV1-9 SC3-1 to SC3-9 (see FIG. 6) is calculated. More specifically, the information processing apparatus 100 has a similarity between the distributed expression QV2-3 of the second query Q2-3 "night view" and the distributed expression QV1-1 of the first query Q1-1 "vehicle type T11" SC3-. 1 is calculated. Subsequently, the information processing apparatus 100 calculates the similarity SC3-2 between the distributed expression QV2-3 of the second query Q2-3 "night view" and the distributed expression QV1-2 of the first query Q1-2 "vehicle type T12". do. Subsequently, the information processing apparatus 100 calculates the similarity SC3-3 between the distributed expression QV2-3 of the second query Q2-3 "night view" and the distributed expression QV1-3 of the first query Q1-3 "vehicle type T13". do. Similarly, the information processing apparatus 100 has a distributed expression QV2-3 of the second query Q2-3 "night view" and a distributed expression QV1 of each first query Q1-4 "vehicle type T21" to Q1-9 "vehicle type T33". Calculate the similarity SC3-4 to SC3-9 with -4 to QV1-9.

続いて、情報処理装置100は、第2クエリQ2-3の分散表現QV2-3と、各第1クエリQ1-1〜Q1-9の分散表現QV1-1〜QV1-9との類似度SC3-1〜SC3-9を算出すると、算出した類似度SC3-1〜SC3-9の大きさを視認可能にした棒グラフG23に関する情報を生成する。具体的には、情報処理装置100は、図1の部分コンテンツC21の表示領域F23に示す情報を生成する。より具体的には、情報処理装置100は、第2クエリ第2クエリQ2-3を示す文字列である「夜景」が棒グラフG23の上方に配置して表示される情報を生成する。また、情報処理装置100は、算出した類似度SC3-1〜SC3-9の大きさを各棒グラフの長さで示す棒グラフG23に関する情報を生成する。 Subsequently, the information processing apparatus 100 has a degree of similarity between the distributed representation QV2-3 of the second query Q2-3 and the distributed representation QV1-1 to QV1-9 of each of the first queries Q1-1 to Q1-9. When 1 to SC3-9 is calculated, information regarding the bar graph G23 that makes the calculated magnitudes of the similarity SC3-1 to SC3-9 visible is generated. Specifically, the information processing apparatus 100 generates the information shown in the display area F23 of the partial content C21 of FIG. More specifically, the information processing apparatus 100 generates information in which the "night view", which is a character string indicating the second query and the second query Q2-3, is arranged above the bar graph G23 and displayed. Further, the information processing apparatus 100 generates information regarding the bar graph G23 which indicates the calculated magnitudes of the similarity SC3-1 to SC3-9 by the length of each bar graph.

また、情報処理装置100は、自動車メーカー#1の商品名を示す第1クエリQ1-1〜Q1-3に対応する類似度SC3-1〜SC3-3の大きさを示す棒グラフの領域を赤色で塗りつぶした棒グラフG23に関する情報を生成する。また、情報処理装置100は、自動車メーカー#2の商品名を示す第1クエリQ1-4〜Q1-6に対応する類似度SC3-4〜SC3-6の大きさを示す棒グラフの領域を青色で塗りつぶした棒グラフG23に関する情報を生成する。また、情報処理装置100は、自動車メーカー#3の商品名を示す第1クエリQ1-7〜Q1-9に対応する類似度SC3-7〜SC3-9の大きさを示す棒グラフの領域を黄色で塗りつぶした棒グラフG23に関する情報を生成する。 Further, the information processing apparatus 100 displays the area of the bar graph indicating the size of the similarity SC3-1 to SC3-3 corresponding to the first query Q1-1 to Q1-3 indicating the product name of the automobile manufacturer # 1 in red. Generate information about the filled bar graph G23. Further, the information processing apparatus 100 displays the area of the bar graph indicating the size of the similarity SC3-4 to SC3-6 corresponding to the first queries Q1-4 to Q1-6 indicating the product name of the automobile manufacturer # 2 in blue. Generate information about the filled bar graph G23. Further, the information processing apparatus 100 displays the area of the bar graph indicating the size of the similarity SC3-7 to SC3-9 corresponding to the first queries Q1-7 to Q1-9 indicating the product name of the automobile manufacturer # 3 in yellow. Generate information about the filled bar graph G23.

続いて、情報処理装置100は、3つの棒グラフG21〜G23に関する情報を生成すると、生成した3つの棒グラフG21〜G23に関する情報を端末装置10に送信する。端末装置10は、3つの棒グラフG21〜G23に関する情報を取得すると、コンテンツC1の部分コンテンツC12に含まれる表示領域F21〜F23のそれぞれに棒グラフG21〜G23に関する情報が表示されるように表示部13の表示を制御する。 Subsequently, when the information processing apparatus 100 generates information regarding the three bar graphs G21 to G23, the information processing apparatus 100 transmits the information regarding the generated three bar graphs G21 to G23 to the terminal device 10. When the terminal device 10 acquires the information related to the three bar graphs G21 to G23, the display unit 13 displays the information related to the bar graphs G21 to G23 in each of the display areas F21 to F23 included in the partial content C12 of the content C1. Control the display.

上述したように、情報処理装置100は、類似性の判定対象を示す複数の第1クエリと、類似性の判定基準を示す複数の第2クエリとを受け付ける。また、情報処理装置100は、第2クエリごとに、各第1クエリが示す判定対象と、第2クエリが示す判定基準との類似性を示す類似情報を生成する。そして、情報処理装置100は、生成した類似情報を出力する。これにより、情報処理装置100は、多数の高次元の分散表現同士の類似度に関する分析結果を一見して把握しやすい状態で提供可能にする。したがって、情報処理装置100は、有用な情報を得ることができる。 As described above, the information processing apparatus 100 receives a plurality of first queries indicating the similarity determination target and a plurality of second queries indicating the similarity determination criteria. Further, the information processing apparatus 100 generates similar information indicating the similarity between the determination target indicated by each first query and the determination criterion indicated by the second query for each second query. Then, the information processing device 100 outputs the generated similar information. As a result, the information processing apparatus 100 can provide an analysis result regarding the similarity between a large number of high-dimensional distributed expressions in a state in which it is easy to grasp at a glance. Therefore, the information processing device 100 can obtain useful information.

〔2.情報処理装置の構成〕
次に、図3を用いて、実施形態に係る情報処理装置100の構成について説明する。図3は、実施形態に係る情報処理装置100の構成例を示す図である。図3に示すように、情報処理装置100は、通信部110と、記憶部120と、制御部130とを有する。なお、情報処理装置100は、情報処理装置100の管理者等から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を表示させるための表示部(例えば、液晶ディスプレイ等)を有してもよい。
[2. Information processing device configuration]
Next, the configuration of the information processing apparatus 100 according to the embodiment will be described with reference to FIG. FIG. 3 is a diagram showing a configuration example of the information processing device 100 according to the embodiment. As shown in FIG. 3, the information processing device 100 includes a communication unit 110, a storage unit 120, and a control unit 130. The information processing device 100 includes an input unit (for example, a keyboard, a mouse, etc.) that receives various operations from the administrator of the information processing device 100, and a display unit (for example, a liquid crystal display, etc.) for displaying various information. You may have.

(通信部110)
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部110は、ネットワークと有線または無線で接続され、例えば、端末装置10と検索サーバ20と生成装置50との間で情報の送受信を行う。
(Communication unit 110)
The communication unit 110 is realized by, for example, a NIC (Network Interface Card) or the like. Then, the communication unit 110 is connected to the network by wire or wirelessly, and transmits / receives information between the terminal device 10, the search server 20, and the generation device 50, for example.

(記憶部120)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。記憶部120は、図3に示すように、クエリ情報記憶部121とベクトル情報記憶部122と類似度情報記憶部123とモデル情報記憶部124を有する。
(Memory unit 120)
The storage unit 120 is realized by, for example, a semiconductor memory element such as a RAM (Random Access Memory) or a flash memory (Flash Memory), or a storage device such as a hard disk or an optical disk. As shown in FIG. 3, the storage unit 120 includes a query information storage unit 121, a vector information storage unit 122, a similarity information storage unit 123, and a model information storage unit 124.

(クエリ情報記憶部121)
クエリ情報記憶部121は、ユーザから受け付けたクエリに関する各種の情報を記憶する。図4に、実施形態に係るクエリ情報記憶部の一例を示す。図4に示す例では、クエリ情報記憶部121は、「ユーザID」、「日時」、「種別」、「クエリ」、「クエリID」といった項目を有する。
(Query information storage unit 121)
The query information storage unit 121 stores various information related to the query received from the user. FIG. 4 shows an example of the query information storage unit according to the embodiment. In the example shown in FIG. 4, the query information storage unit 121 has items such as "user ID", "date and time", "type", "query", and "query ID".

「ユーザID」は、ユーザを識別するための識別情報を示す。「日時」は、ユーザからクエリを受け付けた日時を示す。「種別」は、ユーザから受け付けたクエリの種別を示す。具体的には、種別「1」は、ユーザから受け付けたクエリが第1クエリであることを示す。また、日時を示す。「種別」は、ユーザから受け付けたクエリの種別を示す。具体的には、種別「2」は、ユーザから受け付けたクエリが第2クエリであることを示す。「クエリ」は、ユーザから受け付けたクエリを示す。具体的には、「クエリID」は、ユーザから受け付けたクエリを識別するための識別情報を示す。 The "user ID" indicates identification information for identifying a user. "Date and time" indicates the date and time when the query was received from the user. "Type" indicates the type of query received from the user. Specifically, the type "1" indicates that the query received from the user is the first query. It also indicates the date and time. "Type" indicates the type of query received from the user. Specifically, the type "2" indicates that the query received from the user is the second query. "Query" indicates a query received from a user. Specifically, the "query ID" indicates identification information for identifying a query received from a user.

図4の1レコード目に示す例では、クエリID「Q1-1」で識別されるクエリ(クエリQ1-1)は、図1に示す第1クエリ「車種T11」に対応する。また、図4の10レコード目に示す例では、クエリID「Q2-1」で識別されるクエリ(クエリQ2-1)は、図1に示す第2クエリ「キャンプ」に対応する。 In the example shown in the first record of FIG. 4, the query (query Q1-1) identified by the query ID "Q1-1" corresponds to the first query "vehicle type T11" shown in FIG. Further, in the example shown in the 10th record of FIG. 4, the query (query Q2-1) identified by the query ID “Q2-1” corresponds to the second query “camp” shown in FIG.

(ベクトル情報記憶部122)
ベクトル情報記憶部122は、クエリの分散表現であるベクトルに関する各種の情報を記憶する。図5に、実施形態に係るベクトル情報記憶部の一例を示す。図5に示す例では、ベクトル情報記憶部122は、「ベクトルID」、「クエリID」、「ベクトル情報」といった項目を有する。
(Vector information storage unit 122)
The vector information storage unit 122 stores various information related to the vector, which is a distributed representation of the query. FIG. 5 shows an example of the vector information storage unit according to the embodiment. In the example shown in FIG. 5, the vector information storage unit 122 has items such as “vector ID”, “query ID”, and “vector information”.

「ベクトルID」は、クエリの分散表現であるベクトルを識別するための識別情報を示す。「クエリID」は、ベクトルに対応するクエリを識別するための識別情報を示す。「ベクトル情報」は、クエリの分散表現であるN次元(例えば、128次元)のベクトルを示す。 “Vector ID” indicates identification information for identifying a vector which is a distributed representation of a query. The "query ID" indicates identification information for identifying the query corresponding to the vector. The "vector information" indicates an N-dimensional (for example, 128-dimensional) vector which is a distributed representation of the query.

図5の1レコード目に示す例では、ベクトルID「QV1-1」で識別されるベクトル(ベクトルQV1-1)は、図1に示したクエリQ1-1分散表現であるベクトルQV1-1に対応する。また、クエリID「Q1-1」で識別されるクエリ(クエリQ1-1)は、ベクトルQV1-1に対応するクエリがクエリQ1-1であることを示す。また、ベクトル情報「QVDT1-1」は、クエリQ1-1の分散表現であるN次元のベクトルを示す。 In the example shown in the first record of FIG. 5, the vector (vector QV1-1) identified by the vector ID “QV1-1” corresponds to the vector QV1-1 which is the query Q1-1 distributed representation shown in FIG. do. Further, the query (query Q1-1) identified by the query ID "Q1-1" indicates that the query corresponding to the vector QV1-1 is the query Q1-1. Further, the vector information "QVDT1-1" indicates an N-dimensional vector which is a distributed representation of the query Q1-1.

(類似度情報記憶部123)
類似度情報記憶部123は、第1クエリに対応する分散表現と第2クエリに対応する分散表現との類似度に関する各種の情報を記憶する。図6に、実施形態に係る類似度情報記憶部の一例を示す。図6に示す例では、類似度情報記憶部123は、ユーザから複数の第1クエリと複数の第2クエリとを受け付ける毎に生成される類似度情報毎にデータが格納される複数のデータテーブルから成る。図6に示す類似度情報記憶部123は、図1に示す第1クエリQ1-1〜Q1-9に対応する分散表現と第2クエリQ2-1〜Q2-3に対応する分散表現との類似度に関するデータテーブル123-1を有する。
(Similarity information storage unit 123)
The similarity information storage unit 123 stores various information regarding the similarity between the distributed representation corresponding to the first query and the distributed representation corresponding to the second query. FIG. 6 shows an example of the similarity information storage unit according to the embodiment. In the example shown in FIG. 6, the similarity information storage unit 123 stores a plurality of data tables for each similarity information generated each time a plurality of first queries and a plurality of second queries are received from the user. Consists of. The similarity information storage unit 123 shown in FIG. 6 is similar to the distributed representation corresponding to the first query Q1-1 to Q1-9 and the distributed representation corresponding to the second query Q2-1 to Q2-3 shown in FIG. It has a data table 123-1 regarding degrees.

データテーブル123-1は、図1に示す第1クエリQ1-1〜Q1-9に対応する分散表現と第2クエリQ2-1〜Q2-3に対応する分散表現との類似度をデータテーブルの各セルに格納する。図6に示す「SC1-1」は、図1に示す第1クエリQ1-1に対応する分散表現QV1-1と第2クエリQ2-1に対応する分散表現QV2-1との類似度を示す。なお、図6に示す例では、類似度を「SC1-1」のような概念で表すが、実際には、類似度を示す数値(例えば、「0.888…」や「0.5」といった数値)がデータテーブルの各セルに格納される。 The data table 123-1 shows the degree of similarity between the distributed representation corresponding to the first query Q1-1 to Q1-9 and the distributed representation corresponding to the second query Q2-1 to Q2-3 shown in FIG. Store in each cell. “SC1-1” shown in FIG. 6 indicates the degree of similarity between the distributed expression QV1-1 corresponding to the first query Q1-1 shown in FIG. 1 and the distributed expression QV2-1 corresponding to the second query Q2-1. .. In the example shown in FIG. 6, the similarity is represented by a concept such as "SC1-1", but in reality, a numerical value indicating the similarity (for example, "0.888 ..." or "0.5") is used. Numerical value) is stored in each cell of the data table.

(モデル情報記憶部124)
モデル情報記憶部124は、生成装置50によって生成された学習モデルに関する各種の情報を記憶する。図7に、実施形態に係るモデル情報記憶部の一例を示す。図7に示す例では、モデル情報記憶部124は、「モデルID」、「モデルデータ」といった項目を有する。
(Model information storage unit 124)
The model information storage unit 124 stores various information related to the learning model generated by the generation device 50. FIG. 7 shows an example of the model information storage unit according to the embodiment. In the example shown in FIG. 7, the model information storage unit 124 has items such as "model ID" and "model data".

「モデルID」は、生成装置50によって生成された学習モデルを識別するための識別情報を示す。「モデルデータ」は、生成装置50によって生成された学習モデルのモデルデータを示す。例えば、「モデルデータ」には、クエリを分散表現に変換するためのデータが格納される。 The "model ID" indicates identification information for identifying the learning model generated by the generation device 50. “Model data” indicates model data of the learning model generated by the generation device 50. For example, "model data" stores data for converting a query into a distributed representation.

図7の1レコード目に示す例では、モデルID「M1」で識別される学習モデルは、図1に示した第1モデルM1に対応する。また、モデルデータ「MDT1」は、生成装置50によって生成された第1モデルM1のモデルデータ(モデルデータMDT1)を示す。 In the example shown in the first record of FIG. 7, the learning model identified by the model ID “M1” corresponds to the first model M1 shown in FIG. Further, the model data "MDT1" indicates the model data (model data MDT1) of the first model M1 generated by the generation device 50.

モデルデータMDT1は、クエリが入力される入力層と、出力層と、入力層から出力層までのいずれかの層であって出力層以外の層に属する第1要素と、第1要素と第1要素の重みとに基づいて値が算出される第2要素と、を含み、入力層に入力されたクエリに応じて、入力層に入力されたクエリの分散表現を出力層から出力するよう、生成装置50を機能させてもよい。 The model data MDT1 includes an input layer into which a query is input, an output layer, a first element which is any layer from the input layer to the output layer and belongs to a layer other than the output layer, and the first element and the first element. Generated to output a distributed representation of the query input to the input layer from the output layer in response to the query input to the input layer, including the second element whose value is calculated based on the weight of the element. The device 50 may be made to function.

ここで、モデルデータMDT1が「y=a1*x1+a2*x2+・・・+ai*xi」で示す回帰モデルで実現されるとする。この場合、モデルデータMDT1が含む第1要素は、x1やx2等といった入力データ(xi)に対応する。また、第1要素の重みは、xiに対応する係数aiに対応する。ここで、回帰モデルは、入力層と出力層とを有する単純パーセプトロンと見做すことができる。各モデルを単純パーセプトロンと見做した場合、第1要素は、入力層が有するいずれかのノードに対応し、第2要素は、出力層が有するノードと見做すことができる。 Here, it is assumed that the model data MDT1 is realized by the regression model indicated by "y = a1 * x1 + a2 * x2 + ... + ai * xi". In this case, the first element included in the model data MDT1 corresponds to input data (xi) such as x1 and x2. Further, the weight of the first element corresponds to the coefficient ai corresponding to xi. Here, the regression model can be regarded as a simple perceptron having an input layer and an output layer. When each model is regarded as a simple perceptron, the first element corresponds to any node of the input layer, and the second element can be regarded as the node of the output layer.

また、モデルデータMDT1がDNN(Deep Neural Network)等、1つまたは複数の中間層を有するニューラルネットワークで実現されるとする。この場合、モデルデータMDT1が含む第1要素は、入力層または中間層が有するいずれかのノードに対応する。また、第2要素は、第1要素と対応するノードから値が伝達されるノードである次段のノードに対応する。また、第1要素の重みは、第1要素と対応するノードから第2要素と対応するノードに伝達される値に対して考慮される重みである接続係数に対応する。 Further, it is assumed that the model data MDT1 is realized by a neural network having one or a plurality of intermediate layers such as DNN (Deep Neural Network). In this case, the first element included in the model data MDT1 corresponds to either the node of the input layer or the intermediate layer. Further, the second element corresponds to a node in the next stage, which is a node to which a value is transmitted from a node corresponding to the first element. Further, the weight of the first element corresponds to a connection coefficient which is a weight considered for the value transmitted from the node corresponding to the first element to the node corresponding to the second element.

生成装置50は、上述した回帰モデルやニューラルネットワーク等、任意の構造を有するモデルを用いて、分散表現の算出を行う。具体的には、モデルデータMDT1は、クエリが入力された場合に、分散表現を出力するように係数が設定される。生成装置50は、このようなモデルデータMDT1を用いて、分散表現を算出する。 The generation device 50 calculates the distributed representation using a model having an arbitrary structure such as the regression model and the neural network described above. Specifically, the model data MDT1 is set with a coefficient so as to output a distributed representation when a query is input. The generation device 50 calculates the distributed representation using such model data MDT1.

なお、上記例では、モデルデータMDT1が、クエリが入力された場合に、クエリの分散表現を出力するモデル(以下、モデルX1という。)である例を示した。しかし、実施形態に係るモデルデータMDT1は、モデルX1にデータの入出力を繰り返すことで得られる結果に基づいて生成されるモデルであってもよい。例えば、モデルデータMDT1は、クエリを入力とした際に、モデルX1が出力した分散表現を入力して学習されたモデル(以下、モデルY1という。)であってもよい。または、モデルデータMDT1は、クエリを入力とし、モデルY1の出力値を出力とするよう学習されたモデルであってもよい。 In the above example, the model data MDT1 is a model (hereinafter referred to as model X1) that outputs a distributed representation of the query when a query is input. However, the model data MDT1 according to the embodiment may be a model generated based on the result obtained by repeating the input / output of data to the model X1. For example, the model data MDT1 may be a model (hereinafter, referred to as model Y1) learned by inputting the distributed representation output by the model X1 when the query is input. Alternatively, the model data MDT1 may be a model trained to take a query as an input and output a value of the model Y1 as an output.

また、生成装置50がGAN(Generative Adversarial Networks)を用いた推定処理を行う場合、モデルデータMDT1は、GANの一部を構成するモデルであってもよい。 Further, when the generation device 50 performs the estimation process using GAN (Generative Adversarial Networks), the model data MDT1 may be a model forming a part of GAN.

(制御部130)
図3の説明に戻って、制御部130は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、情報処理装置100内部の記憶装置に記憶されている各種プログラム(情報処理プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部130は、コントローラであり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
(Control unit 130)
Returning to the description of FIG. 3, the control unit 130 is a controller, and is stored in a storage device inside the information processing device 100 by, for example, a CPU (Central Processing Unit) or an MPU (Micro Processing Unit). It is realized by executing various programs (corresponding to an example of an information processing program) using the RAM as a work area. Further, the control unit 130 is a controller, and is realized by, for example, an integrated circuit such as an ASIC (Application Specific Integrated Circuit) or an FPGA (Field Programmable Gate Array).

図3に示すように、制御部130は、受付部131と、取得部132と、生成部133と、出力部134とを有し、以下に説明する情報処理の作用を実現または実行する。なお、制御部130の内部構成は、図3に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。 As shown in FIG. 3, the control unit 130 includes a reception unit 131, an acquisition unit 132, a generation unit 133, and an output unit 134, and realizes or executes the information processing operation described below. The internal configuration of the control unit 130 is not limited to the configuration shown in FIG. 3, and may be another configuration as long as it is a configuration for performing information processing described later.

(受付部131)
受付部131は、端末装置10からコンテンツC1の配信要求を受け付ける。受付部131は、端末装置10からコンテンツC1の部分コンテンツC11の配信要求を受け付ける。具体的には、受付部131は、複数の第1クエリを入力可能な入力フィールドF11と、複数の第2クエリを入力可能な入力フィールドF12と、入力フィールドに入力されたクエリを情報処理装置100に送信する送信ボタンB11とを含む部分コンテンツC11の配信要求を受け付ける。
(Reception Department 131)
The reception unit 131 receives a distribution request for the content C1 from the terminal device 10. The reception unit 131 receives a distribution request for the partial content C11 of the content C1 from the terminal device 10. Specifically, the reception unit 131 inputs an input field F11 capable of inputting a plurality of first queries, an input field F12 capable of inputting a plurality of second queries, and an information processing device 100 for queries input in the input fields. Accepts the distribution request of the partial content C11 including the transmission button B11 to be transmitted to.

続いて、受付部131は、コンテンツC1の配信要求を受け付けると、端末装置10にコンテンツC1を配信する。受付部131は、コンテンツC1の部分コンテンツC11の配信要求を受け付けると、端末装置10にコンテンツC1の部分コンテンツC11を配信する。具体的には、受付部131は、複数の第1クエリを入力可能な入力フィールドF11と、複数の第2クエリを入力可能な入力フィールドF12と、入力フィールドに入力されたクエリを情報処理装置100に送信する送信ボタンB11とを含む部分コンテンツC11を端末装置10に配信する。 Subsequently, when the reception unit 131 receives the distribution request for the content C1, the reception unit 131 distributes the content C1 to the terminal device 10. When the reception unit 131 receives the distribution request for the partial content C11 of the content C1, the reception unit 131 distributes the partial content C11 of the content C1 to the terminal device 10. Specifically, the reception unit 131 inputs an input field F11 capable of inputting a plurality of first queries, an input field F12 capable of inputting a plurality of second queries, and an information processing device 100 for queries input in the input fields. The partial content C11 including the transmission button B11 to be transmitted to the terminal device 10 is distributed to the terminal device 10.

また、受付部131は、類似性の判定対象を示す複数の第1クエリと、類似性の判定基準を示す複数の第2クエリとを受け付ける。具体的には、受付部131は、複数の第1クエリと複数の第2クエリとを端末装置10から受信する。続いて、受付部131は、複数の第1クエリと複数の第2クエリとを受信すると、受信した複数の第1クエリと複数の第2クエリとをクエリ情報記憶部121に格納する。例えば、受付部131は、第1クエリを受け付けると、受け付けた第1クエリをそのクエリが第1クエリであることを示す種別「1」と対応付けてクエリ情報記憶部121に格納する。また、受付部131は、第2クエリを受け付けると、受け付けた第2クエリをそのクエリが第2クエリであることを示す種別「2」と対応付けてクエリ情報記憶部121に格納する。 Further, the reception unit 131 accepts a plurality of first queries indicating the similarity determination target and a plurality of second queries indicating the similarity determination criteria. Specifically, the reception unit 131 receives a plurality of first queries and a plurality of second queries from the terminal device 10. Subsequently, when the reception unit 131 receives the plurality of first queries and the plurality of second queries, the reception unit 131 stores the received plurality of first queries and the plurality of second queries in the query information storage unit 121. For example, when the reception unit 131 receives the first query, the reception unit 131 stores the received first query in the query information storage unit 121 in association with the type "1" indicating that the query is the first query. Further, when the reception unit 131 receives the second query, the reception unit 131 stores the received second query in the query information storage unit 121 in association with the type "2" indicating that the query is the second query.

また、受付部131は、取引対象を示す複数の第1クエリを受け付ける。ここで、「取引対象」とは、商取引の対象となる物品(商品)又は商取引の対象となる役務(サービス)を指す。図1に示す例では、受付部131は、自動車メーカー#1の商品である3種類の自動車の名称を示す3つの第1クエリ「車種T11」(第1クエリQ1-1)、第1クエリ「車種T12」(第1クエリQ1-2)、第1クエリ「車種T13」(第1クエリQ1-3)を受け付ける。また、受付部131は、自動車メーカー#1と競合する自動車メーカー#2の商品である3種類の自動車の名称を示す3つの第1クエリ「車種T21」(第1クエリQ1-4)、第1クエリ「車種T22」(第1クエリQ1-5)、第1クエリ「車種T23」(第1クエリQ1-6)を受け付ける。また、受付部131は、自動車メーカー#1と競合する自動車メーカー#3の商品である3種類の自動車の名称を示す3つの第1クエリ「車種T31」(第1クエリQ1-7)、第1クエリ「車種T32」(第1クエリQ1-8)、「車種T33」(第1クエリQ1-9)を受け付ける。 In addition, the reception unit 131 receives a plurality of first queries indicating the transaction target. Here, the "transaction target" refers to an article (commodity) subject to a commercial transaction or a service (service) subject to a commercial transaction. In the example shown in FIG. 1, the reception unit 131 has three first queries "vehicle type T11" (first query Q1-1) and first queries "1" indicating the names of three types of automobiles that are products of automobile manufacturer # 1. Accepts the vehicle type T12 (first query Q1-2) and the first query "vehicle type T13" (first query Q1-3). In addition, the reception unit 131 has three first queries "vehicle type T21" (first query Q1-4) and first one indicating the names of three types of automobiles that are products of automobile manufacturer # 2 competing with automobile manufacturer # 1. The query "vehicle type T22" (first query Q1-5) and the first query "vehicle type T23" (first query Q1-6) are accepted. In addition, the reception unit 131 has three first queries "vehicle type T31" (first query Q1-7) and first ones indicating the names of three types of automobiles that are products of automobile manufacturer # 3 competing with automobile manufacturer # 1. The query "vehicle type T32" (first query Q1-8) and "vehicle type T33" (first query Q1-9) are accepted.

また、受付部131は、利用者にとって第1クエリを分析する際の分析の軸としたいキーワードを第2クエリとして受け付ける。図1に示す例では、受付部131は、利用者が担当する企業で取り扱う商品が市場のどの分野で消費者に対する強み(又は弱み)があるかを把握するためのキーワードを第2クエリとして受け付ける。例えば、受付部131は、利用者が分析の軸としたいキーワードである3つの第2クエリ「キャンプ」(第2クエリQ2-1)、第2クエリ「SNS#1」(第2クエリQ2-2)、「夜景」(第2クエリQ2-3)を受け付ける。 In addition, the reception unit 131 accepts a keyword that the user wants to be the axis of analysis when analyzing the first query as the second query. In the example shown in FIG. 1, the reception unit 131 accepts a keyword as a second query for grasping in which field of the market the product handled by the company in charge of the user has strengths (or weaknesses) against consumers. .. For example, the reception unit 131 has three second queries "camp" (second query Q2-1) and second query "SNS # 1" (second query Q2-2), which are keywords that the user wants to use as the axis of analysis. ), "Night view" (second query Q2-3) is accepted.

(取得部132)
取得部132は、各種情報を取得する。取得部132は、外部の情報処理装置から各種情報を取得する。取得部132は、生成装置50等の他の情報処理装置から各種情報を取得する。
(Acquisition unit 132)
The acquisition unit 132 acquires various types of information. The acquisition unit 132 acquires various information from an external information processing device. The acquisition unit 132 acquires various information from other information processing devices such as the generation device 50.

また、取得部132は、記憶部120から各種情報を取得する。取得部132は、クエリ情報記憶部121やベクトル情報記憶部122や類似度情報記憶部123やモデル情報記憶部124から各種情報を取得する。 Further, the acquisition unit 132 acquires various information from the storage unit 120. The acquisition unit 132 acquires various information from the query information storage unit 121, the vector information storage unit 122, the similarity information storage unit 123, and the model information storage unit 124.

具体的には、取得部132は、モデルを取得する。より具体的には、取得部132は、受付部131によって類似性の判定対象を示す複数の第1クエリと、類似性の判定基準を示す複数の第2クエリとが受け付けられると、生成装置50から第1モデルM1を取得する。取得部132は、生成装置50から第1モデルM1のモデルデータMDT1を取得する。続いて、取得部132は、第1モデルM1(モデルデータMDT1)を取得すると、取得した第1モデルM1(モデルデータMDT1)をモデル情報記憶部124に格納する。 Specifically, the acquisition unit 132 acquires the model. More specifically, when the receiving unit 131 receives a plurality of first queries indicating the similarity determination target and a plurality of second queries indicating the similarity determination criteria, the acquisition unit 132 receives the generation device 50. The first model M1 is acquired from. The acquisition unit 132 acquires the model data MDT1 of the first model M1 from the generation device 50. Subsequently, when the acquisition unit 132 acquires the first model M1 (model data MDT1), the acquisition unit 132 stores the acquired first model M1 (model data MDT1) in the model information storage unit 124.

また、取得部132は、受付部131によって類似性の判定対象を示す複数の第1クエリと、類似性の判定基準を示す複数の第2クエリとが受け付けられると、モデル情報記憶部124を参照して、第1モデルM1を取得する。また、取得部132は、受付部131によって類似性の判定対象を示す複数の第1クエリと、類似性の判定基準を示す複数の第2クエリとが受け付けられると、クエリ情報記憶部121を参照して、受付部131によって受け付けられた複数の第1クエリと複数の第2クエリとを取得する。図1に示す例では、取得部132は、受付部131によって受け付けられた第1クエリQ1-1〜Q1-9と第2クエリQ2-1〜Q2-3とを取得する。 Further, when the reception unit 131 receives a plurality of first queries indicating the similarity determination target and a plurality of second queries indicating the similarity determination criteria, the acquisition unit 132 refers to the model information storage unit 124. Then, the first model M1 is acquired. Further, when the reception unit 131 receives a plurality of first queries indicating the similarity determination target and a plurality of second queries indicating the similarity determination criteria, the acquisition unit 132 refers to the query information storage unit 121. Then, the plurality of first queries and the plurality of second queries received by the reception unit 131 are acquired. In the example shown in FIG. 1, the acquisition unit 132 acquires the first queries Q1-1 to Q1-9 and the second queries Q2-1 to Q2-3 received by the reception unit 131.

続いて、取得部132は、複数の第1クエリを取得すると、複数の第1クエリの中から一の第1クエリを取得する。図1に示す例では、取得部132は、第1クエリQ1-1〜Q1-9を取得すると、第1クエリQ1-1〜Q1-9の中から一の第1クエリQ1-1を取得する。続いて、取得部132は、第1モデルM1の入力情報として、取得した一の第1クエリを第1モデルM1に入力する。図1に示す例では、取得部132は、第1モデルM1の入力情報として、取得した一の第1クエリQ1-1を第1モデルM1に入力する。また、取得部132は、第1モデルM1の出力情報として、第1モデルM1に入力された第1クエリの分散表現を第1モデルM1から出力する。図1に示す例では、取得部132は、第1モデルM1の出力情報として、第1モデルM1に入力された第1クエリQ1-1の分散表現QV1-1を第1モデルM1から出力する。このようにして、取得部132は、第1クエリの分散表現を生成する。同様に、取得部132は、取得した第1クエリの全てについて、各第1クエリの分散表現を生成する。図1に示す例では、取得部132は、取得した第1クエリQ1-1〜Q1-9について、各第1クエリQ1-1〜Q1-9の分散表現QV1-1〜QV1-9を生成する。続いて、取得部132は、各第1クエリの分散表現を生成すると、生成した各第1クエリの分散表現を各第1クエリと対応付けてベクトル情報記憶部122に格納する。 Subsequently, when the acquisition unit 132 acquires a plurality of first queries, it acquires one first query from the plurality of first queries. In the example shown in FIG. 1, when the acquisition unit 132 acquires the first query Q1-1 to Q1-9, it acquires one of the first queries Q1-1 from the first queries Q1-1 to Q1-9. .. Subsequently, the acquisition unit 132 inputs the acquired first query to the first model M1 as the input information of the first model M1. In the example shown in FIG. 1, the acquisition unit 132 inputs the acquired first query Q1-1 to the first model M1 as the input information of the first model M1. Further, the acquisition unit 132 outputs the distributed representation of the first query input to the first model M1 as the output information of the first model M1 from the first model M1. In the example shown in FIG. 1, the acquisition unit 132 outputs the distributed representation QV1-1 of the first query Q1-1 input to the first model M1 as the output information of the first model M1 from the first model M1. In this way, the acquisition unit 132 generates the distributed representation of the first query. Similarly, the acquisition unit 132 generates a distributed representation of each first query for all of the acquired first queries. In the example shown in FIG. 1, the acquisition unit 132 generates the distributed representations QV1-1 to QV1-9 of each of the first queries Q1-1 to Q1-9 for the acquired first queries Q1-1 to Q1-9. .. Subsequently, when the acquisition unit 132 generates the distributed expression of each first query, the acquisition unit 132 stores the generated distributed expression of each first query in association with each first query in the vector information storage unit 122.

また、取得部132は、複数の第2クエリを取得すると、複数の第2クエリの中から一の第2クエリを取得する。図1に示す例では、取得部132は、第2クエリQ2-1〜Q2-3を取得すると、第2クエリQ2-1〜Q2-3の中から一の第2クエリQ2-1を取得する。続いて、取得部132は、第1モデルM1の入力情報として、取得した一の第2クエリを第1モデルM1に入力する。図1に示す例では、取得部132は、第1モデルM1の入力情報として、取得した一の第2クエリQ2-1を第1モデルM1に入力する。また、取得部132は、第1モデルM1の出力情報として、第1モデルM1に入力された第2クエリの分散表現を第1モデルM1から出力する。図1に示す例では、取得部132は、第1モデルM1の出力情報として、第1モデルM1に入力された第2クエリQ2-1の分散表現QV2-1を第1モデルM1から出力する。このようにして、取得部132は、第2クエリの分散表現を生成する。同様に、取得部132は、取得した第2クエリの全てについて、各第2クエリの分散表現を生成する。図1に示す例では、取得部132は、取得した第2クエリQ2-1〜Q2-3について、各第2クエリQ2-1〜Q2-3の分散表現QV2-1〜QV2-3を生成する。続いて、取得部132は、各第2クエリの分散表現を生成すると、生成した各第2クエリの分散表現を各第2クエリと対応付けてベクトル情報記憶部122に格納する。 Further, when the acquisition unit 132 acquires a plurality of second queries, it acquires one second query from the plurality of second queries. In the example shown in FIG. 1, when the acquisition unit 132 acquires the second query Q2-1 to Q2-3, the acquisition unit 132 acquires one second query Q2-1 from the second queries Q2-1 to Q2-3. .. Subsequently, the acquisition unit 132 inputs the acquired second query to the first model M1 as the input information of the first model M1. In the example shown in FIG. 1, the acquisition unit 132 inputs the acquired second query Q2-1 into the first model M1 as the input information of the first model M1. Further, the acquisition unit 132 outputs the distributed representation of the second query input to the first model M1 as the output information of the first model M1 from the first model M1. In the example shown in FIG. 1, the acquisition unit 132 outputs the distributed representation QV2-1 of the second query Q2-1 input to the first model M1 as the output information of the first model M1 from the first model M1. In this way, the acquisition unit 132 generates the distributed representation of the second query. Similarly, the acquisition unit 132 generates a distributed representation of each second query for all of the acquired second queries. In the example shown in FIG. 1, the acquisition unit 132 generates the distributed representations QV2-1 to QV2-3 of each of the second queries Q2-1 to Q2-3 for the acquired second queries Q2-1 to Q2-3. .. Subsequently, when the acquisition unit 132 generates the distributed expression of each second query, the acquisition unit 132 stores the generated distributed expression of each second query in association with each second query in the vector information storage unit 122.

また、取得部132は、受付部131によって類似性の判定対象を示す複数の第1クエリと、類似性の判定基準を示す複数の第2クエリとが受け付けられると、第1モデルM1を用いて生成された各第1クエリの分散表現と、第1モデルM1を用いて生成された各第2クエリの分散表現とを取得する。例えば、取得部132は、クエリ情報記憶部121とベクトル情報記憶部122とを参照して、受付部131によって受け付けられた各第1クエリの分散表現と各第2クエリの分散表現とを取得する。図1に示す例では、取得部132は、第1クエリQ1-1〜Q1-9の分散表現QV1-1〜QV1-9と、第2クエリQ2-1〜Q2-3の分散表現QV2-1〜QV2-3とを取得する。 Further, when the reception unit 131 receives a plurality of first queries indicating the similarity determination target and a plurality of second queries indicating the similarity determination criteria, the acquisition unit 132 uses the first model M1. The distributed representation of each generated first query and the distributed representation of each second query generated using the first model M1 are acquired. For example, the acquisition unit 132 refers to the query information storage unit 121 and the vector information storage unit 122 to acquire the distributed representation of each first query and the distributed representation of each second query received by the reception unit 131. .. In the example shown in FIG. 1, the acquisition unit 132 has the distributed representations QV1-1 to QV1-9 of the first queries Q1-1 to Q1-9 and the distributed representations QV2-1 of the second queries Q2-1 to Q2-3. ~ QV2-3 and are acquired.

(生成部133)
生成部133は、第2クエリごとに、各第1クエリが示す判定対象と、第2クエリが示す判定基準との類似性を示す類似情報を生成する。具体的には、生成部133は、判定対象を示す対象情報が第1クエリとして入力された際の検索意図と、判定基準を示す基準情報が第2クエリとして入力された際の検索意図との類似性を示すスコアに基づいて、類似情報を生成する。より具体的には、生成部133は、対象情報である文字情報に対応する分散表現と基準情報である文字情報に対応する分散表現との類似度であるスコアに基づいて、類似情報を生成する。
(Generator 133)
For each second query, the generation unit 133 generates similar information indicating the similarity between the determination target indicated by each first query and the determination criterion indicated by the second query. Specifically, the generation unit 133 has a search intention when the target information indicating the determination target is input as the first query and a search intention when the reference information indicating the determination criterion is input as the second query. Generate similar information based on scores that indicate similarity. More specifically, the generation unit 133 generates similar information based on the score which is the degree of similarity between the distributed expression corresponding to the character information which is the target information and the distributed expression corresponding to the character information which is the reference information. ..

例えば、生成部133は、取得部132によって第1モデルM1を用いて生成された各第1クエリの分散表現と各第2クエリの分散表現とが取得されると、第2クエリの分散表現ごとに、各第1クエリの分散表現と、第2クエリの分散表現との類似度を算出する。例えば、生成部133は、各第1クエリの分散表現と、第2クエリの分散表現とのコサイン類似度を算出する。なお、生成部133は、コサイン類似度に限らず、ベクトル間の距離尺度として適用可能な指標であれば、どのような指標に基づいて分散表現の間の類似度を算出してもよい。例えば、生成部133は、分散表現同士のユークリッド距離や双曲空間等の非ユークリッド空間中での距離、マンハッタン距離、マハラノビス距離等といった所定の距離関数の値を算出してもよい。 For example, when the generation unit 133 acquires the distributed representation of each first query and the distributed representation of each second query generated by the acquisition unit 132 using the first model M1, each of the distributed representations of the second query. In addition, the degree of similarity between the distributed representation of each first query and the distributed representation of the second query is calculated. For example, the generation unit 133 calculates the cosine similarity between the distributed representation of each first query and the distributed representation of the second query. The generation unit 133 may calculate the similarity between the distributed representations based on any index as long as it is an index applicable as a distance scale between vectors, not limited to the cosine similarity. For example, the generation unit 133 may calculate the value of a predetermined distance function such as the Euclidean distance between distributed expressions, the distance in a non-Euclidean space such as hyperbolic space, the Manhattan distance, the Mahalanobis distance, and the like.

図1に示す例では、生成部133は、第2クエリQ2-1「キャンプ」の分散表現QV2-1と、各第1クエリQ1-1「車種T11」〜Q1-9「車種T33」の分散表現QV1-1〜QV1-9との類似度SC1-1〜SC1-9を算出する。具体的には、生成部133は、取得部132によって取得された第2クエリQ2-1「キャンプ」の分散表現QV2-1と第1クエリQ1-1「車種T11」の分散表現QV1-1との類似度SC1-1を算出する。続いて、生成部133は、第2クエリQ2-1「キャンプ」の分散表現QV2-1と第1クエリQ1-2「車種T12」の分散表現QV1-2との類似度SC1-2を算出する。続いて、生成部133は、第2クエリQ2-1「キャンプ」の分散表現QV2-1と第1クエリQ1-3「車種T13」の分散表現とQV1-3の類似度SC1-3を算出する。同様にして、生成部133は、第2クエリQ2-1「キャンプ」の分散表現QV2-1と、各第1クエリQ1-4「車種T21」〜Q1-9「車種T33」の分散表現QV1-4〜QV1-9との類似度SC1-4〜SC1-9を算出する。 In the example shown in FIG. 1, the generation unit 133 distributes the distributed expression QV2-1 of the second query Q2-1 “camp” and the dispersion of the first queries Q1-1 “vehicle type T11” to Q1-9 “vehicle type T33”. The similarity SC1-1 to SC1-9 with the expressions QV1-1 to QV1-9 are calculated. Specifically, the generation unit 133 has the distributed expression QV2-1 of the second query Q2-1 "camp" acquired by the acquisition unit 132 and the distributed expression QV1-1 of the first query Q1-1 "vehicle type T11". The similarity SC1-1 of is calculated. Subsequently, the generation unit 133 calculates the similarity SC1-2 between the distributed expression QV2-1 of the second query Q2-1 "camp" and the distributed expression QV1-2 of the first query Q1-2 "vehicle type T12". .. Subsequently, the generation unit 133 calculates the distributed expression QV2-1 of the second query Q2-1 "camp", the distributed expression of the first query Q1-3 "vehicle type T13", and the similarity SC1-3 of the QV1-3. .. Similarly, the generation unit 133 has the distributed expression QV2-1 of the second query Q2-1 "camp" and the distributed expression QV1- of each first query Q1-4 "vehicle type T21" to Q1-9 "vehicle type T33". The similarity SC1-4 to SC1-9 with 4 to QV1-9 is calculated.

また、生成部133は、第2クエリQ2-2「SNS#1」の分散表現QV2-2と、各第1クエリQ1-1「車種T11」〜Q1-9「車種T33」の分散表現QV1-1〜QV1-9との類似度SC2-1〜SC2-9を算出する。例えば、生成部133は、第2クエリQ2-2「SNS#1」の分散表現QV2-2と第1クエリQ1-1「車種T11」の分散表現QV1-1との類似度SC2-1を算出する。続いて、生成部133は、第2クエリQ2-2「SNS#1」の分散表現QV2-2と第1クエリQ1-2「車種T12」の分散表現QV1-2との類似度SC2-2を算出する。続いて、生成部133は、第2クエリQ2-2「SNS#1」の分散表現QV2-2と第1クエリQ1-3「車種T13」の分散表現QV1-3との類似度SC2-3を算出する。同様にして、生成部133は、第2クエリQ2-2「SNS#1」の分散表現QV2-2と、各第1クエリQ1-4「車種T21」〜Q1-9「車種T33」の分散表現とQV1-4〜QV1-9の類似度SC2-4〜SC2-9を算出する。 In addition, the generation unit 133 has the distributed expression QV2-2 of the second query Q2-2 "SNS # 1" and the distributed expression QV1- of each first query Q1-1 "vehicle type T11" to Q1-9 "vehicle type T33". The degree of similarity with 1 to QV1-9 SC2-1 to SC2-9 is calculated. For example, the generation unit 133 calculates the similarity SC2-1 between the distributed expression QV2-2 of the second query Q2-2 "SNS # 1" and the distributed expression QV1-1 of the first query Q1-1 "vehicle type T11". do. Subsequently, the generation unit 133 determines the degree of similarity SC2-2 between the distributed expression QV2-2 of the second query Q2-2 "SNS # 1" and the distributed expression QV1-2 of the first query Q1-2 "vehicle type T12". calculate. Subsequently, the generation unit 133 determines the degree of similarity SC2-3 between the distributed expression QV2-2 of the second query Q2-2 "SNS # 1" and the distributed expression QV1-3 of the first query Q1-3 "vehicle type T13". calculate. Similarly, the generation unit 133 includes the distributed representation QV2-2 of the second query Q2-2 "SNS # 1" and the distributed representation of the first queries Q1-4 "vehicle type T21" to Q1-9 "vehicle type T33". And QV1-4 to QV1-9 have similarities SC2-4 to SC2-9.

また、生成部133は、第2クエリQ2-3「夜景」の分散表現QV2-3と、各第1クエリQ1-1「車種T11」〜Q1-9「車種T33」の分散表現QV1-1〜QV1-9との類似度SC3-1〜SC3-9を算出する。より具体的には、生成部133は、第2クエリQ2-3「夜景」の分散表現QV2-3と第1クエリQ1-1「車種T11」の分散表現QV1-1との類似度SC3-1を算出する。続いて、生成部133は、第2クエリQ2-3「夜景」の分散表現QV2-3と第1クエリQ1-2「車種T12」の分散表現QV1-2との類似度SC3-2を算出する。続いて、生成部133は、第2クエリQ2-3「夜景」の分散表現QV2-3と第1クエリQ1-3「車種T13」の分散表現QV1-3との類似度SC3-3を算出する。同様にして、生成部133は、第2クエリQ2-3「夜景」の分散表現QV2-3と、各第1クエリQ1-4「車種T21」〜Q1-9「車種T33」の分散表現QV1-4〜QV1-9との類似度SC3-4〜SC3-9を算出する。 In addition, the generation unit 133 has a distributed expression QV2-3 of the second query Q2-3 "night view" and a distributed expression QV1-1 to Q1-9 "vehicle type T33" of each first query Q1-1 "vehicle type T11" to Q1-9. The degree of similarity with QV1-9 SC3-1 to SC3-9 is calculated. More specifically, the generation unit 133 has a similarity SC3-1 between the distributed expression QV2-3 of the second query Q2-3 "night view" and the distributed expression QV1-1 of the first query Q1-1 "vehicle type T11". Is calculated. Subsequently, the generation unit 133 calculates the similarity SC3-2 between the distributed expression QV2-3 of the second query Q2-3 "night view" and the distributed expression QV1-2 of the first query Q1-2 "vehicle type T12". .. Subsequently, the generation unit 133 calculates the similarity SC3-3 between the distributed expression QV2-3 of the second query Q2-3 "night view" and the distributed expression QV1-3 of the first query Q1-3 "vehicle type T13". .. Similarly, the generation unit 133 has the distributed expression QV2-3 of the second query Q2-3 "night view" and the distributed expression QV1- of each first query Q1-4 "vehicle type T21" to Q1-9 "vehicle type T33". The similarity SC3-4 to SC3-9 with 4 to QV1-9 is calculated.

また、生成部133は、類似情報として、スコアの大きさを視認可能にしたグラフに関する情報を生成する。具体的には、生成部133は、第2クエリの分散表現ごとに、各第1クエリの分散表現と、第2クエリの分散表現との類似度を算出すると、算出した類似度の大きさを視認可能にしたグラフに関する情報を生成する。例えば、生成部133は、算出した類似度の大きさを棒グラフの長さで示すことによって視認可能にした棒グラフに関する情報を生成する。また、生成部133は、第2クエリごとに、類似情報と第2クエリとが対応付けて表示されるコンテンツを生成する。例えば、生成部133は、生成したグラフと第2クエリとが視覚的に対応付けて表示されるコンテンツを生成する。 In addition, the generation unit 133 generates information on the graph that makes the magnitude of the score visible as similar information. Specifically, when the generation unit 133 calculates the similarity between the distributed representation of each first query and the distributed representation of the second query for each distributed representation of the second query, the calculated degree of similarity is calculated. Generate information about the visible graph. For example, the generation unit 133 generates information about the bar graph made visible by indicating the calculated degree of similarity by the length of the bar graph. In addition, the generation unit 133 generates content in which similar information and the second query are displayed in association with each other for each second query. For example, the generation unit 133 generates content in which the generated graph and the second query are visually associated and displayed.

図1に示す例では、生成部133は、第2クエリQ2-1の分散表現QV2-1と、各第1クエリQ1-1〜Q1-9の分散表現QV1-1〜QV1-9との類似度SC1-1〜SC1-9を算出すると、算出した類似度SC1-1〜SC1-9の大きさを視認可能にした棒グラフG21に関する情報を生成する。具体的には、生成部133は、図1の部分コンテンツC21の表示領域F21に示す情報を生成する。生成部133は、生成した棒グラフG21と第2クエリQ2-1とが視覚的に対応付けて表示される部分コンテンツC21を生成する。例えば、生成部133は、第2クエリ第2クエリQ2-1を示す文字列である「キャンプ」が棒グラフG21の上方に配置して表示される情報を生成する。また、生成部133は、算出した類似度SC1-1〜SC1-9の大きさを各棒グラフの長さで示す棒グラフG21に関する情報を生成する。 In the example shown in FIG. 1, the generation unit 133 is similar to the distributed representation QV2-1 of the second query Q2-1 and the distributed representation QV1-1 to QV1-9 of each of the first queries Q1-1 to Q1-9. When the degrees SC1-1 to SC1-9 are calculated, information about the bar graph G21 that makes the calculated magnitudes of the similarity SC1-1 to SC1-9 visible is generated. Specifically, the generation unit 133 generates the information shown in the display area F21 of the partial content C21 of FIG. The generation unit 133 generates the partial content C21 in which the generated bar graph G21 and the second query Q2-1 are visually associated and displayed. For example, the generation unit 133 generates information in which "camp", which is a character string indicating the second query and the second query Q2-1, is arranged above the bar graph G21 and displayed. In addition, the generation unit 133 generates information regarding the bar graph G21 which indicates the calculated magnitudes of the similarity SC1-1 to SC1-9 by the length of each bar graph.

また、生成部133は、第2クエリQ2-2の分散表現QV2-2と、各第1クエリQ1-1〜Q1-9の分散表現QV1-1〜QV1-9との類似度SC2-1〜SC2-9を算出すると、算出した類似度SC2-1〜SC2-9の大きさを視認可能にした棒グラフG22に関する情報を生成する。具体的には、生成部133は、図1の部分コンテンツC21の表示領域F22に示す情報を生成する。生成部133は、生成した棒グラフG21と第2クエリQ2-2とが視覚的に対応付けて表示される部分コンテンツC21を生成する。例えば、生成部133は、第2クエリ第2クエリQ2-2を示す文字列である「SNS#1」が棒グラフG22の上方に配置して表示される情報を生成する。また、生成部133は、算出した類似度SC2-1〜SC2-9の大きさを各棒グラフの長さで示す棒グラフG22に関する情報を生成する。 Further, the generation unit 133 has a degree of similarity between the distributed representation QV2-2 of the second query Q2-2 and the distributed representation QV1-1 to QV1-9 of each of the first queries Q1-1 to Q1-9. When SC2-9 is calculated, information about the bar graph G22 that makes the calculated magnitudes of similarity SC2-1 to SC2-9 visible is generated. Specifically, the generation unit 133 generates the information shown in the display area F22 of the partial content C21 of FIG. The generation unit 133 generates the partial content C21 in which the generated bar graph G21 and the second query Q2-2 are visually associated and displayed. For example, the generation unit 133 generates information in which "SNS # 1", which is a character string indicating the second query and the second query Q2-2, is arranged above the bar graph G22 and displayed. Further, the generation unit 133 generates information regarding the bar graph G22 which indicates the calculated magnitudes of the similarity SC2-1 to SC2-9 by the length of each bar graph.

また、生成部133は、第2クエリQ2-3の分散表現QV2-3と、各第1クエリQ1-1〜Q1-9の分散表現QV1-1〜QV1-9との類似度SC3-1〜SC3-9を算出すると、算出した類似度SC3-1〜SC3-9の大きさを視認可能にした棒グラフG23に関する情報を生成する。具体的には、生成部133は、図1の部分コンテンツC21の表示領域F23に示す情報を生成する。生成部133は、生成した棒グラフG23と第2クエリQ2-3とが視覚的に対応付けて表示される部分コンテンツC21を生成する。例えば、生成部133は、第2クエリ第2クエリQ2-3を示す文字列である「夜景」が棒グラフG23の上方に配置して表示される情報を生成する。また、生成部133は、算出した類似度SC3-1〜SC3-9の大きさを各棒グラフの長さで示す棒グラフG23に関する情報を生成する。 Further, the generation unit 133 has a degree of similarity between the distributed representation QV2-3 of the second query Q2-3 and the distributed representation QV1-1 to QV1-9 of each of the first queries Q1-1 to Q1-9. When the SC3-9 is calculated, information about the bar graph G23 that makes the calculated magnitudes of the similarity SC3-1 to SC3-9 visible is generated. Specifically, the generation unit 133 generates the information shown in the display area F23 of the partial content C21 of FIG. The generation unit 133 generates the partial content C21 in which the generated bar graph G23 and the second query Q2-3 are visually associated and displayed. For example, the generation unit 133 generates information in which the “night view”, which is a character string indicating the second query and the second query Q2-3, is arranged above the bar graph G23 and displayed. In addition, the generation unit 133 generates information regarding the bar graph G23 which indicates the calculated magnitudes of the similarity SC3-1 to SC3-9 by the length of each bar graph.

また、生成部133は、類似情報として、取引対象を取り扱う事業者に応じて異なる色によって、スコアの大きさを示す領域が色分けされたグラフに関する情報を生成する。例えば、生成部133は、第1クエリが示す取引対象を取り扱う事業者に応じて異なる色によって、類似度の大きさを示す領域が色分けされたグラフに関する情報を生成する。 In addition, the generation unit 133 generates information on the graph in which the area indicating the size of the score is color-coded by different colors depending on the business operator handling the transaction target as similar information. For example, the generation unit 133 generates information on a graph in which a region indicating the magnitude of similarity is color-coded by different colors depending on the business operator handling the transaction target indicated by the first query.

図1に示す例では、生成部133は、第1クエリが示す車種の自動車を取り扱う自動車メーカーに応じて異なる色によって、類似度の大きさを示す領域が色分けされたグラフを生成する。例えば、生成部133は、自動車メーカー#1の商品名を示す第1クエリQ1-1〜Q1-3に対応する類似度SC1-1〜SC1-3の大きさを示す棒グラフの領域を赤色で塗りつぶした棒グラフG21に関する情報を生成する。また、生成部133は、自動車メーカー#2の商品名を示す第1クエリQ1-4〜Q1-6に対応する類似度SC1-4〜SC1-6の大きさを示す棒グラフの領域を青色で塗りつぶした棒グラフG21に関する情報を生成する。また、生成部133は、自動車メーカー#3の商品名を示す第1クエリQ1-7〜Q1-9に対応する類似度SC1-7〜SC1-9の大きさを示す棒グラフの領域を黄色で塗りつぶした棒グラフG21に関する情報を生成する。 In the example shown in FIG. 1, the generation unit 133 generates a graph in which regions indicating the magnitude of similarity are color-coded by different colors depending on the automobile manufacturer handling the automobile of the vehicle type indicated by the first query. For example, the generation unit 133 fills the area of the bar graph indicating the size of the similarity SC1-1 to SC1-3 corresponding to the first query Q1-1 to Q1-3 indicating the product name of the automobile manufacturer # 1 in red. Generates information about the bar graph G21. In addition, the generation unit 133 fills the area of the bar graph indicating the size of the similarity SC1-4 to SC1-6 corresponding to the first queries Q1-4 to Q1-6 indicating the product name of the automobile manufacturer # 2 in blue. Generates information about the bar graph G21. In addition, the generation unit 133 fills the area of the bar graph indicating the size of the similarity SC1-7 to SC1-9 corresponding to the first queries Q1-7 to Q1-9 indicating the product name of the automobile manufacturer # 3 in yellow. Generates information about the bar graph G21.

また、生成部133は、自動車メーカー#1の商品名を示す第1クエリQ1-1〜Q1-3に対応する類似度SC2-1〜SC2-3の大きさを示す棒グラフの領域を赤色で塗りつぶした棒グラフG22に関する情報を生成する。また、生成部133は、自動車メーカー#2の商品名を示す第1クエリQ1-4〜Q1-6に対応する類似度SC2-4〜SC2-6の大きさを示す棒グラフの領域を青色で塗りつぶした棒グラフG22に関する情報を生成する。また、生成部133は、自動車メーカー#3の商品名を示す第1クエリQ1-7〜Q1-9に対応する類似度SC2-7〜SC2-9の大きさを示す棒グラフの領域を黄色で塗りつぶした棒グラフG22に関する情報を生成する。 In addition, the generation unit 133 fills the area of the bar graph indicating the size of the similarity SC2-1 to SC2-3 corresponding to the first query Q1-1 to Q1-3 indicating the product name of the automobile manufacturer # 1 in red. Generates information about the bar graph G22. In addition, the generation unit 133 fills the area of the bar graph indicating the size of the similarity SC2-4 to SC2-6 corresponding to the first queries Q1-4 to Q1-6 indicating the product name of the automobile manufacturer # 2 in blue. Generates information about the bar graph G22. In addition, the generation unit 133 fills the area of the bar graph indicating the size of the similarity SC2-7 to SC2-9 corresponding to the first queries Q1-7 to Q1-9 indicating the product name of the automobile manufacturer # 3 in yellow. Generates information about the bar graph G22.

また、生成部133は、自動車メーカー#1の商品名を示す第1クエリQ1-1〜Q1-3に対応する類似度SC3-1〜SC3-3の大きさを示す棒グラフの領域を赤色で塗りつぶした棒グラフG23に関する情報を生成する。また、生成部133は、自動車メーカー#2の商品名を示す第1クエリQ1-4〜Q1-6に対応する類似度SC3-4〜SC3-6の大きさを示す棒グラフの領域を青色で塗りつぶした棒グラフG23に関する情報を生成する。また、生成部133は、自動車メーカー#3の商品名を示す第1クエリQ1-7〜Q1-9に対応する類似度SC3-7〜SC3-9の大きさを示す棒グラフの領域を黄色で塗りつぶした棒グラフG23に関する情報を生成する。 In addition, the generation unit 133 fills the area of the bar graph indicating the size of the similarity SC3-1 to SC3-3 corresponding to the first query Q1-1 to Q1-3 indicating the product name of the automobile manufacturer # 1 in red. Generates information about the bar graph G23. In addition, the generation unit 133 fills the area of the bar graph indicating the size of the similarity SC3-4 to SC3-6 corresponding to the first queries Q1-4 to Q1-6 indicating the product name of the automobile manufacturer # 2 in blue. Generates information about the bar graph G23. In addition, the generation unit 133 fills the area of the bar graph indicating the size of the similarity SC3-7 to SC3-9 corresponding to the first queries Q1-7 to Q1-9 indicating the product name of the automobile manufacturer # 3 in yellow. Generates information about the bar graph G23.

(出力部134)
出力部134は、生成部133によって生成された類似情報を出力する。具体的には、出力部134は、第2クエリごとに、生成部133によって生成されたグラフに関する情報を出力する。例えば、出力部134は、生成部133によってグラフに関する情報が生成されると、グラフに関する情報を端末装置10に送信する。
(Output unit 134)
The output unit 134 outputs similar information generated by the generation unit 133. Specifically, the output unit 134 outputs information about the graph generated by the generation unit 133 for each second query. For example, when the output unit 134 generates information about the graph by the generation unit 133, the output unit 134 transmits the information about the graph to the terminal device 10.

図1に示す例では、出力部134は、生成部133によって3つの棒グラフG21〜G23に関する情報が生成されると、生成された3つの棒グラフG21〜G23に関する情報を端末装置10に送信する。 In the example shown in FIG. 1, when the generation unit 133 generates information on the three bar graphs G21 to G23, the output unit 134 transmits the information on the generated three bar graphs G21 to G23 to the terminal device 10.

〔3.端末装置の構成〕
次に、図8を用いて、実施形態に係る端末装置10の構成について説明する。図8は、実施形態に係る端末装置10の構成例を示す図である。図8に示すように、端末装置10は、通信部11と、入力部12と、表示部13と、記憶部14と、制御部15とを有する。
[3. Terminal device configuration]
Next, the configuration of the terminal device 10 according to the embodiment will be described with reference to FIG. FIG. 8 is a diagram showing a configuration example of the terminal device 10 according to the embodiment. As shown in FIG. 8, the terminal device 10 includes a communication unit 11, an input unit 12, a display unit 13, a storage unit 14, and a control unit 15.

(通信部11)
通信部11は、例えば、NIC等によって実現される。そして、通信部11は、ネットワークNと有線または無線で接続され、情報処理装置100との間で情報の送受信を行う。
(Communication unit 11)
The communication unit 11 is realized by, for example, a NIC or the like. Then, the communication unit 11 is connected to the network N by wire or wirelessly, and transmits / receives information to / from the information processing device 100.

(入力部12、表示部13)
入力部12は、利用者から各種操作を受け付ける入力装置である。入力部12は、表示部13を介して各種情報が入力される。例えば、入力部12は、キーボードやマウスや操作キー等によって実現される。表示部13は、各種情報を表示するための表示装置であり、すなわち、画面である。例えば、表示部13は、液晶ディスプレイ等によって実現される。表示部13は、記憶部14に記憶された情報を表示する。表示部13は、受信部151によって受信された情報を表示する。表示部13は、表示制御部152による制御に応じて、各種情報を表示する。なお、端末装置10にタッチパネルが採用される場合には、入力部12と表示部13とは一体化される。また、以下の説明では、表示部13を画面と記載する場合がある。
(Input unit 12, display unit 13)
The input unit 12 is an input device that receives various operations from the user. Various information is input to the input unit 12 via the display unit 13. For example, the input unit 12 is realized by a keyboard, a mouse, operation keys, or the like. The display unit 13 is a display device for displaying various information, that is, a screen. For example, the display unit 13 is realized by a liquid crystal display or the like. The display unit 13 displays the information stored in the storage unit 14. The display unit 13 displays the information received by the reception unit 151. The display unit 13 displays various information according to the control by the display control unit 152. When a touch panel is adopted for the terminal device 10, the input unit 12 and the display unit 13 are integrated. Further, in the following description, the display unit 13 may be described as a screen.

図1の例では、表示部13は、受信部151によって受信されたコンテンツC1を表示する。表示部13は、受信部151によって受信されたコンテンツC1の部分コンテンツC11を表示する。具体的には、表示部13は、複数の第1クエリを入力可能な入力フィールドF11と、複数の第2クエリを入力可能な入力フィールドF12と、入力フィールドに入力されたクエリを情報処理装置100に送信する送信ボタンB11とを含む部分コンテンツC11を表示する。 In the example of FIG. 1, the display unit 13 displays the content C1 received by the reception unit 151. The display unit 13 displays the partial content C11 of the content C1 received by the reception unit 151. Specifically, the display unit 13 inputs the input field F11 capable of inputting a plurality of first queries, the input field F12 capable of inputting a plurality of second queries, and the information processing device 100 for the queries input in the input fields. The partial content C11 including the transmission button B11 to be transmitted to is displayed.

また、表示部13は、受信部151によって受信されたコンテンツC1の部分コンテンツC12を表示する。表示部13は、受信部151によって受信された棒グラフG21〜G23に関する情報を表示する。具体的には、表示部13は、受信部151によって受信されたコンテンツC1の部分コンテンツC12に含まれる表示領域F21〜F23のそれぞれに棒グラフG21〜G23に関する情報を表示する。 Further, the display unit 13 displays the partial content C12 of the content C1 received by the reception unit 151. The display unit 13 displays information about the bar graphs G21 to G23 received by the reception unit 151. Specifically, the display unit 13 displays information about the bar graphs G21 to G23 in each of the display areas F21 to F23 included in the partial content C12 of the content C1 received by the reception unit 151.

(記憶部14)
記憶部14は、例えば、RAM、フラッシュメモリ等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。記憶部14は、情報の表示に用いる各種情報を記憶する。記憶部14は、受信部151によって受信された情報を記憶する。図1に示す例では、記憶部14は、受信部151によって受信されたコンテンツC1を記憶する。また、記憶部14は、受信部151によって受信されたコンテンツC1の部分コンテンツC11を記憶する。また、記憶部14は、受信部151によって受信されたコンテンツC1の部分コンテンツC12を記憶する。また、記憶部14は、受信部151によって受信された棒グラフG21〜G23に関する情報を記憶する。
(Memory unit 14)
The storage unit 14 is realized by, for example, a semiconductor memory element such as a RAM or a flash memory, or a storage device such as a hard disk or an optical disk. The storage unit 14 stores various information used for displaying the information. The storage unit 14 stores the information received by the reception unit 151. In the example shown in FIG. 1, the storage unit 14 stores the content C1 received by the reception unit 151. Further, the storage unit 14 stores the partial content C11 of the content C1 received by the reception unit 151. Further, the storage unit 14 stores the partial content C12 of the content C1 received by the reception unit 151. Further, the storage unit 14 stores information regarding the bar graphs G21 to G23 received by the reception unit 151.

(制御部15)
制御部15は、CPUやMPU等によって、端末装置10内部の記憶装置に記憶されている各種プログラム(例えば、コンテンツC1等を画面に表示させる表示制御プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。例えば、この各種プログラムは、ウェブブラウザと呼ばれるアプリケーションプログラムに該当する。また、制御部15は、例えば、ASICやFPGA等の集積回路により実現される。
(Control unit 15)
In the control unit 15, various programs stored in the storage device inside the terminal device 10 by the CPU, MPU, or the like (for example, corresponding to an example of a display control program for displaying the content C1 or the like on the screen) use the RAM as a work area. It is realized by being executed. For example, these various programs correspond to application programs called web browsers. Further, the control unit 15 is realized by, for example, an integrated circuit such as an ASIC or FPGA.

図8に示すように、制御部15は、受信部151と、表示制御部152と、受付部153と、送信部154とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部15の内部構成は、図8に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。 As shown in FIG. 8, the control unit 15 includes a reception unit 151, a display control unit 152, a reception unit 153, and a transmission unit 154, and realizes or executes an information processing function or operation described below. do. The internal configuration of the control unit 15 is not limited to the configuration shown in FIG. 8, and may be another configuration as long as it is a configuration for performing information processing described later.

(受信部151)
受信部151は、各種情報を受信する。受信部151は、外部の情報処理装置から各種情報を受信する。受信部151は、情報処理装置100等の他の情報処理装置から各種情報を受信する。図1の例では、受信部151は、情報処理装置100からコンテンツC1を受信する。また、受信部151は、情報処理装置100からコンテンツC1の部分コンテンツC11を受信する。また、受信部151は、情報処理装置100からコンテンツC1の部分コンテンツC12を受信する。また、受信部151は、情報処理装置100から棒グラフG21〜G23に関する情報を受信する。
(Receiver 151)
The receiving unit 151 receives various information. The receiving unit 151 receives various information from an external information processing device. The receiving unit 151 receives various information from other information processing devices such as the information processing device 100. In the example of FIG. 1, the receiving unit 151 receives the content C1 from the information processing device 100. Further, the receiving unit 151 receives the partial content C11 of the content C1 from the information processing device 100. Further, the receiving unit 151 receives the partial content C12 of the content C1 from the information processing device 100. Further, the receiving unit 151 receives information about the bar graphs G21 to G23 from the information processing device 100.

(表示制御部152)
表示制御部152は、各種表示を制御する。表示制御部152は、表示部13の表示を制御する。表示制御部152は、受信部151による受信に応じて、表示部13の表示を制御する。表示制御部152は、受信部151により受信された情報に基づいて、表示部13の表示を制御する。表示制御部152は、受付部153により受け付けられた情報に基づいて、表示部13の表示を制御する。表示制御部152は、受付部153による受付けに応じて、表示部13の表示を制御する。表示制御部152は、表示部13にコンテンツが表示されるように表示部13の表示を制御する。
(Display control unit 152)
The display control unit 152 controls various displays. The display control unit 152 controls the display of the display unit 13. The display control unit 152 controls the display of the display unit 13 in response to the reception by the reception unit 151. The display control unit 152 controls the display of the display unit 13 based on the information received by the reception unit 151. The display control unit 152 controls the display of the display unit 13 based on the information received by the reception unit 153. The display control unit 152 controls the display of the display unit 13 in response to the reception by the reception unit 153. The display control unit 152 controls the display of the display unit 13 so that the content is displayed on the display unit 13.

図1の例では、表示制御部152は、コンテンツC1が表示されるように表示部13の表示を制御する。また、表示制御部152は、コンテンツC1の部分コンテンツC11が表示されるように表示部13の表示を制御する。また、表示制御部152は、コンテンツC1の部分コンテンツC12が表示されるように表示部13の表示を制御する。また、表示制御部152は、コンテンツC1の部分コンテンツC12に含まれる表示領域F21〜F23のそれぞれに棒グラフG21〜G23に関する情報が表示されるように表示部13の表示を制御する。 In the example of FIG. 1, the display control unit 152 controls the display of the display unit 13 so that the content C1 is displayed. Further, the display control unit 152 controls the display of the display unit 13 so that the partial content C11 of the content C1 is displayed. Further, the display control unit 152 controls the display of the display unit 13 so that the partial content C12 of the content C1 is displayed. Further, the display control unit 152 controls the display of the display unit 13 so that the information related to the bar graphs G21 to G23 is displayed in each of the display areas F21 to F23 included in the partial content C12 of the content C1.

(受付部153)
受付部153は、各種情報を受け付ける。例えば、受付部153は、入力部12を介してユーザによる入力を受け付ける。受付部153は、ユーザによる操作を受け付ける。受付部153は、表示部13により表示された情報に対するユーザの操作を受け付ける。受付部153は、ユーザによる文字入力を受け付ける。受付部153は、ユーザによる複数の第1クエリの入力を受け付ける。受付部153は、コンテンツC1の部分コンテンツC11に含まれる入力フィールドF11への文字入力により、第1クエリの入力を受け付ける。受付部153は、ユーザにより入力フィールドF11に入力された文字列を第1クエリとして受け付ける。また、受付部153は、区切り文字で区切られた各文字列を各第1クエリとして受け付ける。
(Reception Department 153)
The reception unit 153 receives various information. For example, the reception unit 153 receives an input by the user via the input unit 12. The reception unit 153 accepts operations by the user. The reception unit 153 accepts the user's operation on the information displayed by the display unit 13. The reception unit 153 accepts character input by the user. The reception unit 153 accepts the input of a plurality of first queries by the user. The reception unit 153 accepts the input of the first query by inputting characters into the input field F11 included in the partial content C11 of the content C1. The reception unit 153 accepts the character string input by the user in the input field F11 as the first query. Further, the reception unit 153 accepts each character string separated by a delimiter as each first query.

また、受付部153は、ユーザによる複数の第2クエリの入力を受け付ける。受付部153は、コンテンツC1の部分コンテンツC11に含まれる入力フィールドF12への文字入力により、第2クエリの入力を受け付ける。受付部153は、ユーザにより入力フィールドF12に入力された文字列を第2クエリとして受け付ける。また、受付部153は、区切り文字で区切られた各文字列を各第2クエリとして受け付ける。 In addition, the reception unit 153 accepts the input of a plurality of second queries by the user. The reception unit 153 accepts the input of the second query by inputting characters into the input field F12 included in the partial content C11 of the content C1. The reception unit 153 accepts the character string input by the user in the input field F12 as the second query. Further, the reception unit 153 accepts each character string separated by a delimiter as each second query.

また、受付部153は、ユーザによる送信ボタンB11の選択操作を受け付ける。受付部153は、入力部12によって受け付けられた送信ボタンB11の選択操作を受け付ける。 In addition, the reception unit 153 accepts the user's selection operation of the transmission button B11. The reception unit 153 accepts the selection operation of the transmission button B11 received by the input unit 12.

図1の例では、受付部153は、区切り文字で区切られた9つの文字列である9つの第1クエリQ1-1〜Q1-9の入力を受け付ける。受付部153は、コンテンツC1の部分コンテンツC11に含まれる入力フィールドF11への文字入力により、9つの第1クエリQ1-1〜Q1-9の入力を受け付ける。受付部153は、利用者U11により入力フィールドF11に入力された9つの文字列である9つの第1クエリ「車種T11」〜文字列「車種T33」の入力を受け付ける。 In the example of FIG. 1, the reception unit 153 accepts inputs of nine first queries Q1-1 to Q1-9, which are nine character strings separated by delimiters. The reception unit 153 accepts the inputs of the nine first queries Q1-1 to Q1-9 by inputting characters into the input field F11 included in the partial content C11 of the content C1. The reception unit 153 accepts the input of the nine first queries "vehicle type T11" to the character string "vehicle type T33", which are nine character strings input by the user U11 in the input field F11.

また、受付部153は、区切り文字で区切られた3つの文字列である3つの第2クエリQ2-1〜Q2-3の入力を受け付ける。受付部153は、コンテンツC1の部分コンテンツC11に含まれる入力フィールドF12への文字入力により、3つの第2クエリQ2-1〜Q2-3の入力を受け付ける。受付部153は、利用者U11により入力フィールドF12に入力された3つの文字列である3つの第2クエリ「キャンプ」〜文字列「夜景」の入力を受け付ける。 Further, the reception unit 153 accepts inputs of three second queries Q2-1 to Q2-3, which are three character strings separated by a delimiter. The reception unit 153 accepts the inputs of the three second queries Q2-1 to Q2-3 by inputting characters into the input field F12 included in the partial content C11 of the content C1. The reception unit 153 accepts the input of the three second queries "camp" to the character string "night view", which are the three character strings input to the input field F12 by the user U11.

また、受付部153は、利用者U11による送信ボタンB11の選択操作を受け付ける。受付部153は、入力部12によって受け付けられた送信ボタンB11の選択操作を受け付ける。受付部153は、表示部13を介して受け付けられた送信ボタンB11の選択操作を受け付ける。 In addition, the reception unit 153 accepts the selection operation of the transmission button B11 by the user U11. The reception unit 153 accepts the selection operation of the transmission button B11 received by the input unit 12. The reception unit 153 accepts the selection operation of the transmission button B11 received via the display unit 13.

(送信部154)
送信部154は、外部の情報処理装置へ各種情報を送信する。例えば、送信部154は、情報処理装置100等の他の情報処理装置へ各種情報を送信する。送信部154は、記憶部14に記憶された情報を送信する。また、送信部154は、情報処理装置100等の他の情報処理装置からの情報に基づいて、各種情報を送信する。送信部154は、記憶部14に記憶された情報に基づいて、各種情報を送信する。送信部154は、受付部153によって受け付けられた情報を送信する。
(Transmission unit 154)
The transmission unit 154 transmits various information to an external information processing device. For example, the transmission unit 154 transmits various information to another information processing device such as the information processing device 100. The transmission unit 154 transmits the information stored in the storage unit 14. Further, the transmission unit 154 transmits various information based on the information from other information processing devices such as the information processing device 100. The transmission unit 154 transmits various types of information based on the information stored in the storage unit 14. The transmission unit 154 transmits the information received by the reception unit 153.

送信部154は、受付部153によって受け付けられた複数の第1クエリと複数の第2クエリを情報処理装置100に送信する。具体的には、送信部154は、受付部153によって送信ボタンB11の選択操作が受け付けられると、受付部153によって受け付けられた複数の第1クエリと複数の第2クエリを情報処理装置100に送信する。 The transmission unit 154 transmits a plurality of first queries and a plurality of second queries received by the reception unit 153 to the information processing device 100. Specifically, when the reception unit 153 accepts the selection operation of the transmission button B11, the transmission unit 154 transmits a plurality of first queries and a plurality of second queries received by the reception unit 153 to the information processing device 100. do.

図1の例では、送信部154は、受付部153によって送信ボタンB11の選択操作が受け付けられると、受付部153によって受け付けられた9つの第1クエリQ1-1〜Q1-9を情報処理装置100に送信する。送信部154は、受付部153によって受け付けられた9つの文字列である9つの第1クエリQ1-1〜Q1-9を情報処理装置100に送信する。 In the example of FIG. 1, when the reception unit 153 accepts the selection operation of the transmission button B11, the transmission unit 154 processes the nine first queries Q1-1 to Q1-9 received by the reception unit 153 in the information processing device 100. Send to. The transmission unit 154 transmits nine first queries Q1-1 to Q1-9, which are nine character strings received by the reception unit 153, to the information processing device 100.

また、送信部154は、受付部153によって送信ボタンB11の選択操作が受け付けられると、受付部153によって受け付けられた3つの第2クエリQ2-1〜Q2-3を情報処理装置100に送信する。送信部154は、受付部153によって受け付けられた3つの文字列である3つの第2クエリQ2-1〜Q2-3を情報処理装置100に送信する。 Further, when the reception unit 153 accepts the selection operation of the transmission button B11, the transmission unit 154 transmits the three second queries Q2-1 to Q2-3 received by the reception unit 153 to the information processing device 100. The transmission unit 154 transmits three second queries Q2-1 to Q2-3, which are three character strings received by the reception unit 153, to the information processing device 100.

〔4.情報処理のフロー〕
次に、図9を用いて、実施形態に係る情報処理の手順について説明する。図9は、実施形態に係る情報処理手順を示すフローチャートである。図9に示す例では、情報処理装置100は、類似性の判定対象を示す複数の第1クエリと、類似性の判定基準を示す複数の第2クエリとを端末装置10から受け付けたか否かを判定する(ステップS101)。情報処理装置100は、複数の第1クエリと複数の第2クエリとを受け付けなかった場合(ステップS101;No)、複数の第1クエリと複数の第2クエリとを受け付けるまで待機する。
[4. Information processing flow]
Next, the procedure of information processing according to the embodiment will be described with reference to FIG. FIG. 9 is a flowchart showing an information processing procedure according to the embodiment. In the example shown in FIG. 9, the information processing apparatus 100 determines whether or not a plurality of first queries indicating the similarity determination target and a plurality of second queries indicating the similarity determination criteria have been received from the terminal device 10. Judgment (step S101). When the information processing apparatus 100 does not accept the plurality of first queries and the plurality of second queries (step S101; No), the information processing apparatus 100 waits until the plurality of first queries and the plurality of second queries are accepted.

続いて、情報処理装置100は、複数の第1クエリと複数の第2クエリとを受け付けた場合(ステップS101;Yes)、第2クエリごとに、各第1クエリが示す判定対象と第2クエリが示す判定基準との類似性を示す類似情報を生成する(ステップS102)。 Subsequently, when the information processing apparatus 100 receives a plurality of first queries and a plurality of second queries (step S101; Yes), the determination target and the second query indicated by each first query for each second query. Generates similar information indicating similarity to the determination criteria indicated by (step S102).

続いて、情報処理装置100は、類似情報を生成すると、生成した類似情報を端末装置10に出力する(ステップS103)。 Subsequently, when the information processing apparatus 100 generates the similar information, the information processing apparatus 100 outputs the generated similar information to the terminal apparatus 10 (step S103).

〔5.変形例〕
上述した実施形態に係る情報処理システム1は、上記実施形態以外にも種々の異なる形態にて実施されてよい。そこで、以下では、情報処理システム1の他の実施形態について説明する。なお、実施形態と同一部分には、同一符号を付して説明を省略する。
[5. Modification example]
The information processing system 1 according to the above-described embodiment may be implemented in various different forms other than the above-described embodiment. Therefore, another embodiment of the information processing system 1 will be described below. The same parts as those in the embodiment are designated by the same reference numerals, and the description thereof will be omitted.

〔5−1.取引対象の属性に応じて色分けされたグラフ〕
情報処理装置100は、類似情報として、取引対象の属性に応じて異なる色によって、スコアの大きさを示す領域が色分けされたグラフに関する情報を生成してもよい。具体的には、生成部133は、類似情報として、取引対象の属性に応じて異なる色によって、スコアの大きさを示す領域が色分けされたグラフに関する情報を生成する。より具体的には、生成部133は、受付部131によって受け付けられた複数の第1クエリが示す取引対象が複数の異なる属性に分類される場合には、それぞれの属性に応じて異なる色によって、スコアの大きさを示す領域が色分けされたグラフに関する情報を生成する。例えば、生成部133は、受付部131によって受け付けられた複数の第1クエリが示す取引対象の属性が「食品」と「衣料品」と「医薬品」の3つの異なる属性に分類される場合には、「食品」に対応する第1クエリに関するスコアの大きさを示す領域の色を赤色で塗りつぶした棒グラフに関する情報を生成する。また、生成部133は、「衣料品」に対応する第1クエリに関するスコアの大きさを示す領域の色を青色で塗りつぶした棒グラフに関する情報を生成する。また、生成部133は、「医薬品」に対応する第1クエリに関するスコアの大きさを示す領域の色を黄色で塗りつぶした棒グラフに関する情報を生成する。
[5-1. Color-coded graph according to the attributes of the transaction target]
As similar information, the information processing apparatus 100 may generate information on a graph in which a region indicating the size of the score is color-coded by different colors according to the attributes of the transaction target. Specifically, the generation unit 133 generates information on a graph in which a region indicating the size of the score is color-coded with different colors according to the attributes of the transaction target as similar information. More specifically, when the transaction target indicated by the plurality of first queries received by the reception unit 131 is classified into a plurality of different attributes, the generation unit 133 uses different colors according to the respective attributes. The area showing the magnitude of the score produces information about the color-coded graph. For example, in the generation unit 133, when the attributes of the transaction target indicated by the plurality of first queries received by the reception unit 131 are classified into three different attributes of "food", "clothing", and "pharmaceutical product". , Generates information about a bar graph in which the color of the area indicating the magnitude of the score for the first query corresponding to "food" is filled in red. In addition, the generation unit 133 generates information on a bar graph in which the color of the region indicating the size of the score for the first query corresponding to "clothing" is filled with blue. In addition, the generation unit 133 generates information on a bar graph in which the color of the region indicating the size of the score for the first query corresponding to the “pharmaceutical product” is filled with yellow.

〔6.第1モデルの生成処理〕
次に、図10を用いて、第1モデルの生成処理の流れについて説明する。図10は、実施形態に係る第1モデルの生成処理の一例を示す図である。図10に示す例では、生成装置50は、同一の利用者U1によって所定の時間内に連続して入力された「六本木 パスタ」という検索クエリQ11と「六本木 イタリアン」という検索クエリQ12とから成る一対の検索クエリを抽出する(ステップS11)。
[6. First model generation process]
Next, the flow of the generation process of the first model will be described with reference to FIG. FIG. 10 is a diagram showing an example of the generation process of the first model according to the embodiment. In the example shown in FIG. 10, the generator 50 is a pair consisting of a search query Q11 "Roppongi pasta" and a search query Q12 "Roppongi Italian" continuously input by the same user U1 within a predetermined time. Extract the search query of (step S11).

続いて、生成装置50は、抽出した検索クエリQ11を第1モデルM1に入力して、検索クエリQ11の分散表現であるベクトルBQV11を出力する。ここで、ベクトルBQV11は、第1モデルM1の出力層から出力されたばかりの検索クエリQ11の分散表現であって、第1モデルM1にフィードバックをかける前(学習前)の分散表現を示す。また、生成装置50は、抽出した検索クエリQ12を第1モデルM1に入力して、検索クエリQ12の分散表現であるベクトルBQV12を出力する。ここで、ベクトルBQV12は、第1モデルM1の出力層から出力されたばかりの検索クエリQ12の分散表現であって、第1モデルM1にフィードバックをかける前(学習前)の分散表現を示す。このようにして、生成装置50は、検索クエリQ11の分散表現であるベクトルBQV11と、検索クエリQ12の分散表現であるベクトルBQV12とを出力する(ステップS12)。 Subsequently, the generation device 50 inputs the extracted search query Q11 into the first model M1 and outputs a vector BQV11 which is a distributed representation of the search query Q11. Here, the vector BQV11 is a distributed representation of the search query Q11 just output from the output layer of the first model M1, and shows a distributed representation before giving feedback to the first model M1 (before learning). Further, the generation device 50 inputs the extracted search query Q12 into the first model M1 and outputs a vector BQV12 which is a distributed representation of the search query Q12. Here, the vector BQV12 is a distributed representation of the search query Q12 just output from the output layer of the first model M1, and shows a distributed representation before giving feedback to the first model M1 (before learning). In this way, the generation device 50 outputs the vector BQV11 which is the distributed representation of the search query Q11 and the vector BQV12 which is the distributed representation of the search query Q12 (step S12).

続いて、生成装置50は、同一の利用者U1によって所定の時間内に連続して入力された検索クエリQ11(「六本木 パスタ」)と検索クエリQ12(「六本木 イタリアン」)とから成る一対の検索クエリは、所定の検索意図(例えば、「ある場所で飲食店を探す」という検索意図)で入力された検索クエリであると推定されるため、相互に類似する特徴を有するものとして、検索クエリQ11の分散表現(ベクトルQV11)と、検索クエリQ11と対となる検索クエリQ12の分散表現(ベクトルQV12)とが、分散表現空間上で類似するように第1モデルM1を学習させる。例えば、第1モデルM1にフィードバックをかける前(学習前)の検索クエリQ11の分散表現であるベクトルBQV11と検索クエリQ12の分散表現であるベクトルBQV12とのなす角度の大きさをΘとする。また、第1モデルM1にフィードバックをかけた後(学習後)の検索クエリQ11の分散表現であるベクトルQV11と検索クエリQ12の分散表現であるベクトルQV12とのなす角度の大きさをΦとする。この時、生成装置50は、ΘよりもΦが小さくなるように、第1モデルM1を学習させる。例えば、生成装置50は、ベクトルBQV11とベクトルBQV12のコサイン類似度の値を算出する。また、生成装置50は、ベクトルQV11とベクトルQV12のコサイン類似度の値を算出する。続いて、生成装置50は、ベクトルBQV11とベクトルBQV12のコサイン類似度の値よりも、ベクトルQV11とベクトルQV12のコサイン類似度の値が大きくなるように(値が1に近づくように)第1モデルM1を学習させる。このように、生成装置50は、一対の検索クエリに対応する一対の分散表現である2つのベクトルが分散表現空間上で類似するように第1モデルM1を学習させることで、検索クエリから分散表現を出力する第1モデルM1を生成する(ステップS13)。なお、生成装置50は、コサイン類似度に限らず、ベクトル間の距離尺度として適用可能な指標であれば、どのような指標に基づいて分散表現の間の類似度を算出してもよい。また、生成装置50は、ベクトル間の距離尺度として適用可能な指標であれば、どのような指標に基づいて第1モデルM1を学習させてもよい。例えば、生成装置50は、分散表現同士のユークリッド距離や双曲空間等の非ユークリッド空間中での距離、マンハッタン距離、マハラノビス距離等といった所定の距離関数の値を算出する。続いて、生成装置50は、分散表現同士の所定の距離関数の値(すなわち、分散表現空間における距離)が小さくなるように第1モデルM1を学習させてもよい。 Subsequently, the generator 50 is a pair of searches including the search query Q11 (“Roppongi pasta”) and the search query Q12 (“Roppongi Italian”) that are continuously input by the same user U1 within a predetermined time. Since the query is presumed to be a search query input with a predetermined search intention (for example, a search intention of "searching for a restaurant in a certain place"), the search query Q11 is assumed to have similar characteristics to each other. The first model M1 is trained so that the distributed representation (vector QV11) of the above and the distributed representation (vector QV12) of the search query Q12 paired with the search query Q11 are similar in the distributed representation space. For example, let Θ be the magnitude of the angle formed by the vector BQV11 which is the distributed representation of the search query Q11 before giving feedback to the first model M1 (before learning) and the vector BQV12 which is the distributed representation of the search query Q12. Further, let Φ be the size of the angle formed by the vector QV11 which is the distributed expression of the search query Q11 after giving feedback to the first model M1 (after learning) and the vector QV12 which is the distributed expression of the search query Q12. At this time, the generator 50 trains the first model M1 so that Φ is smaller than Θ. For example, the generator 50 calculates the value of the cosine similarity between the vector BQV11 and the vector BQV12. Further, the generation device 50 calculates the value of the cosine similarity between the vector QV11 and the vector QV12. Subsequently, the generator 50 uses the first model so that the cosine similarity values of the vector QV11 and the vector QV12 are larger than the cosine similarity values of the vector BQV11 and the vector BQV12 (so that the values approach 1). Learn M1. In this way, the generation device 50 trains the first model M1 so that the two vectors, which are a pair of distributed representations corresponding to the pair of search queries, are similar in the distributed representation space, so that the distributed representation is expressed from the search query. Is generated (step S13). The generator 50 is not limited to the cosine similarity, and may calculate the similarity between the distributed representations based on any index as long as it is an index applicable as a distance scale between vectors. Further, the generation device 50 may train the first model M1 based on any index as long as it is an index applicable as a distance scale between vectors. For example, the generation device 50 calculates the value of a predetermined distance function such as the Euclidean distance between distributed expressions, the distance in a non-Euclidean space such as hyperbolic space, the Manhattan distance, the Mahalanobis distance, and the like. Subsequently, the generation device 50 may train the first model M1 so that the value of a predetermined distance function between the distributed representations (that is, the distance in the distributed representation space) becomes small.

次に、図11を用いて、第1モデルの生成処理の流れについてより詳しく説明する。なお、図11の説明では、図9の説明と重複する部分は、適宜省略する。図11は、実施形態に係る第1モデルの生成処理を示す図である。図11に示す例では、生成装置50が生成した第1モデルM1によって出力された分散表現が分散表現空間にマッピングされる様子が示されている。生成装置50は、所定の検索クエリの分散表現と所定の検索クエリと対となる他の検索クエリの分散表現とが分散表現空間上で近くにマッピングされるように第1モデルM1のトレーニングを行う。 Next, the flow of the generation process of the first model will be described in more detail with reference to FIG. In the description of FIG. 11, a part that overlaps with the description of FIG. 9 will be omitted as appropriate. FIG. 11 is a diagram showing a generation process of the first model according to the embodiment. In the example shown in FIG. 11, the distributed representation output by the first model M1 generated by the generation device 50 is mapped to the distributed representation space. The generation device 50 trains the first model M1 so that the distributed representation of a predetermined search query and the distributed representation of another search query paired with the predetermined search query are mapped close to each other in the distributed representation space. ..

図11の上段に示す例では、生成装置50は、同一の利用者U1によって所定の時間内に連続して入力された4個の検索クエリである検索クエリQ11(「六本木 パスタ」)、検索クエリQ12(「六本木 イタリアン」)、検索クエリQ13(「赤坂 パスタ」)、検索クエリQ14(「麻布 パスタ」)を抽出する。生成装置50は、同一の利用者U1によって各検索クエリが入力された時間の間隔が所定の時間内である4個の検索クエリを抽出する。生成装置50は、同一の利用者U1によって後述する各検索クエリのペアが入力された時間の間隔が所定の時間内である複数の検索クエリを抽出する。生成装置50は、検索クエリが入力された順番に並べると、検索クエリQ11、検索クエリQ12、検索クエリQ13、検索クエリQ14の順番で入力された4個の検索クエリを抽出する。生成装置50は、4個の検索クエリを抽出すると、時系列的に隣り合う2つの検索クエリを一対の検索クエリとして、3対の検索クエリのペアである(検索クエリQ11、検索クエリQ12)、(検索クエリQ12、検索クエリQ13)、(検索クエリQ13、検索クエリQ14)を抽出する(ステップS21−1)。なお、生成装置50は、同一の利用者U1によって全ての検索クエリが所定の時間内に入力された複数の検索クエリを抽出してもよい。そして、生成装置50は、時系列的に隣り合うか否かに関わらず、抽出した複数の検索クエリの中から2つの検索クエリを選択して、選択した2つの検索クエリを一対の検索クエリとして抽出してもよい。 In the example shown in the upper part of FIG. 11, the generator 50 is a search query Q11 (“Roppongi pasta”), which is four search queries continuously input by the same user U1 within a predetermined time, and a search query. Extract Q12 (“Roppongi Italian”), search query Q13 (“Akasaka pasta”), and search query Q14 (“Azabu pasta”). The generation device 50 extracts four search queries in which the time interval in which each search query is input by the same user U1 is within a predetermined time. The generation device 50 extracts a plurality of search queries in which the time interval in which each search query pair described later is input by the same user U1 is within a predetermined time. When the search queries are arranged in the order in which the search queries are input, the generation device 50 extracts four search queries input in the order of the search query Q11, the search query Q12, the search query Q13, and the search query Q14. When the generation device 50 extracts four search queries, it is a pair of three search queries (search query Q11, search query Q12), with two search queries adjacent in chronological order as a pair of search queries. (Search query Q12, search query Q13) and (search query Q13, search query Q14) are extracted (step S21-1). The generation device 50 may extract a plurality of search queries in which all the search queries are input within a predetermined time by the same user U1. Then, the generation device 50 selects two search queries from the extracted plurality of search queries regardless of whether they are adjacent to each other in chronological order, and uses the two selected search queries as a pair of search queries. It may be extracted.

続いて、生成装置50は、抽出した検索クエリQ1k(k=1、2、3、4)を第1モデルM1に入力して、検索クエリQ1k(k=1、2、3、4)の分散表現であるベクトルBQV1k(k=1、2、3、4)を出力する。ここで、ベクトルBQV1k(k=1、2、3、4)は、第1モデルM1の出力層から出力されたばかりの検索クエリQ1k(k=1、2、3、4)の分散表現であって、第1モデルM1にフィードバックをかける前(学習前)の分散表現を示す(ステップS22−1)。 Subsequently, the generation device 50 inputs the extracted search query Q1k (k = 1, 2, 3, 4) into the first model M1, and distributes the search query Q1k (k = 1, 2, 3, 4). The representation vector BQV1k (k = 1, 2, 3, 4) is output. Here, the vector BQV1k (k = 1, 2, 3, 4) is a distributed representation of the search query Q1k (k = 1, 2, 3, 4) just output from the output layer of the first model M1. , The distributed representation before giving feedback to the first model M1 (before learning) is shown (step S22-1).

続いて、生成装置50は、同一の利用者U1によって所定の時間内に連続して入力された一対の検索クエリは、所定の検索意図(例えば、「ある場所(東京都港区付近)で飲食店を探す」という検索意図)で入力された検索クエリであると推定されるため、相互に類似する特徴を有するものとして、検索クエリQ11の分散表現(ベクトルQV11)と、検索クエリQ11と対となる検索クエリQ12の分散表現(ベクトルQV12)とが、分散表現空間上で類似するように第1モデルM1を学習させる。また、生成装置50は、検索クエリQ12の分散表現(ベクトルQV12)と、検索クエリQ12と対となる検索クエリQ13の分散表現(ベクトルQV13)とが、分散表現空間上で類似するように第1モデルM1を学習させる。また、生成装置50は、検索クエリQ13の分散表現(ベクトルQV13)と、検索クエリQ13と対となる検索クエリQ14の分散表現(ベクトルQV14)とが、分散表現空間上で類似するように第1モデルM1を学習させる。このように、生成装置50は、一対の検索クエリに対応する一対の分散表現である2つのベクトルが分散表現空間上で類似するように第1モデルM1を学習させることで、検索クエリから分散表現を出力する第1モデルM1を生成する(ステップS23−1)。 Subsequently, in the generator 50, a pair of search queries continuously input by the same user U1 within a predetermined time is subjected to a predetermined search intention (for example, "eating and drinking at a certain place (near Minato-ku, Tokyo)). Since it is presumed that the search query was entered with the search intent of "finding a store"), the distributed representation of the search query Q11 (vector QV11) and the pair with the search query Q11 are assumed to have similar characteristics to each other. The first model M1 is trained so that the distributed representation (vector QV12) of the search query Q12 is similar on the distributed representation space. Further, in the generation device 50, the first distributed representation of the search query Q12 (vector QV12) and the distributed representation of the search query Q13 paired with the search query Q12 (vector QV13) are similar in the distributed representation space. Train model M1. Further, in the generation device 50, the first distributed representation of the search query Q13 (vector QV13) and the distributed representation of the search query Q14 paired with the search query Q13 (vector QV14) are similar in the distributed representation space. Train model M1. In this way, the generation device 50 trains the first model M1 so that the two vectors, which are a pair of distributed representations corresponding to the pair of search queries, are similar in the distributed representation space, so that the distributed representation is expressed from the search query. Is generated (step S23-1).

図11の上段に示す情報処理の結果として、検索クエリQ1k(k=1、2、3、4)の分散表現であるベクトルQV1k(k=1、2、3、4)が分散表現空間の近い位置にクラスタCL11としてマッピングされる様子が示されている。例えば、検索クエリQ1k(k=1、2、3、4)は、利用者U1によって「ある場所(東京都港区付近)で飲食店を探す」という検索意図の下で検索された検索クエリの集合であると推定される。すなわち、検索クエリQ1k(k=1、2、3、4)は、「ある場所(東京都港区付近)で飲食店を探す」という検索意図の下で検索された検索クエリであるという点で、相互に類似する特徴を有する検索クエリであると推定される。ここで、生成装置50は、「ある場所(東京都港区付近)で飲食店を探す」という検索意図で入力された所定の検索クエリが第1モデルに入力されると、クラスタCL11の位置にマッピングされるような分散表現を出力することができる。これにより、例えば、生成装置50は、クラスタCL11の位置にマッピングされる分散表現に対応する検索クエリを抽出することにより、「ある場所(東京都港区付近)で飲食店を探す」という検索意図に応じた検索クエリを抽出することができる。したがって、生成装置50は、検索クエリの意味を適切に解釈可能とすることができる。 As a result of the information processing shown in the upper part of FIG. 11, the vector QV1k (k = 1, 2, 3, 4), which is a distributed representation of the search query Q1k (k = 1, 2, 3, 4), is close to the distributed representation space. It is shown that the position is mapped as cluster CL11. For example, the search query Q1k (k = 1, 2, 3, 4) is a search query searched by the user U1 with the search intention of "searching for a restaurant in a certain place (near Minato-ku, Tokyo)". It is presumed to be a set. That is, the search query Q1k (k = 1, 2, 3, 4) is a search query searched with the search intention of "searching for a restaurant in a certain place (near Minato-ku, Tokyo)". , It is presumed that the search query has similar characteristics to each other. Here, when the predetermined search query input with the search intention of "searching for a restaurant in a certain place (near Minato-ku, Tokyo)" is input to the first model, the generator 50 is placed at the position of the cluster CL11. It is possible to output a distributed representation that is mapped. As a result, for example, the generator 50 has a search intention of "searching for a restaurant in a certain place (near Minato-ku, Tokyo)" by extracting a search query corresponding to the distributed representation mapped to the position of the cluster CL11. Search queries can be extracted according to. Therefore, the generation device 50 can appropriately interpret the meaning of the search query.

図11の下段に示す例では、生成装置50は、同一の利用者U2によって所定の時間内に連続して入力された3個の検索クエリである検索クエリQ21(「冷蔵庫 400L」)、検索クエリQ22(「冷蔵庫 中型」)、検索クエリQ23(「冷蔵庫 中型 おすすめ」)を抽出する。生成装置50は、検索クエリが入力された順番に並べると、検索クエリQ21、検索クエリQ22、検索クエリQ23の順番で入力された3個の検索クエリを抽出する。生成装置50は、3個の検索クエリを抽出すると、時系列的に隣り合う2つの検索クエリを一対の検索クエリとして、2対の検索クエリのペアである(検索クエリQ21、検索クエリQ22)、(検索クエリQ22、検索クエリQ23)を抽出する(ステップS21−2)。 In the example shown in the lower part of FIG. 11, the generator 50 is a search query Q21 (“refrigerator 400L”), which is three search queries continuously input by the same user U2 within a predetermined time, and a search query. Extract Q22 ("refrigerator medium size") and search query Q23 ("refrigerator medium size recommended"). When the generation device 50 arranges the search queries in the order in which they are input, the generation device 50 extracts three search queries input in the order of the search query Q21, the search query Q22, and the search query Q23. When the generation device 50 extracts three search queries, it is a pair of two search queries (search query Q21, search query Q22), with two search queries adjacent in chronological order as a pair of search queries. (Search query Q22, search query Q23) is extracted (step S21-2).

続いて、生成装置50は、抽出した検索クエリQ2m(m=1、2、3)を第1モデルM1に入力して、検索クエリQ2m(m=1、2、3)の分散表現であるベクトルBQV2m(m=1、2、3)を出力する。ここで、ベクトルBQV2m(m=1、2、3)は、第1モデルM1の出力層から出力されたばかりの検索クエリQ2m(m=1、2、3)の分散表現であって、第1モデルM1にフィードバックをかける前(学習前)の分散表現を示す(ステップS22−2)。 Subsequently, the generation device 50 inputs the extracted search query Q2m (m = 1, 2, 3) into the first model M1, and a vector that is a distributed representation of the search query Q2m (m = 1, 2, 3). BQV2m (m = 1, 2, 3) is output. Here, the vector BQV2m (m = 1, 2, 3) is a distributed representation of the search query Q2m (m = 1, 2, 3) just output from the output layer of the first model M1, and is the first model. The distributed expression before giving feedback to M1 (before learning) is shown (step S22-2).

続いて、生成装置50は、同一の利用者U2によって所定の時間内に連続して入力された一対の検索クエリは、所定の検索意図(例えば、「中型の冷蔵庫を調べる」という検索意図)で入力された検索クエリであると推定されるため、相互に類似する特徴を有するものとして、検索クエリQ21の分散表現(ベクトルQV21)と、検索クエリQ21と対となる検索クエリQ22の分散表現(ベクトルQV22)とが、分散表現空間上で類似するように第1モデルM1を学習させる。また、生成装置50は、検索クエリQ22の分散表現(ベクトルQV22)と、検索クエリQ22と対となる検索クエリQ23の分散表現(ベクトルQV23)とが、分散表現空間上で類似するように第1モデルM1を学習させる。このように、生成装置50は、一対の検索クエリに対応する一対の分散表現である2つのベクトルが分散表現空間上で類似するように第1モデルM1を学習させることで、検索クエリから分散表現を出力する第1モデルM1を生成する(ステップS23−2)。 Subsequently, the generation device 50 uses the same user U2 to continuously input a pair of search queries within a predetermined time with a predetermined search intention (for example, a search intention of "checking a medium-sized refrigerator"). Since it is presumed to be an input search query, the distributed representation of the search query Q21 (vector QV21) and the distributed representation of the search query Q22 paired with the search query Q21 (vector) are assumed to have similar characteristics to each other. QV22) and the first model M1 are trained so as to be similar in the distributed expression space. Further, in the generation device 50, the first distributed representation of the search query Q22 (vector QV22) and the distributed representation of the search query Q23 paired with the search query Q22 (vector QV23) are similar in the distributed representation space. Train model M1. In this way, the generation device 50 trains the first model M1 so that the two vectors, which are a pair of distributed representations corresponding to the pair of search queries, are similar in the distributed representation space, so that the distributed representation is expressed from the search query. Is generated (step S23-2).

図11の下段に示す情報処理の結果として、検索クエリQ2m(m=1、2、3)の分散表現であるベクトルQV2m(m=1、2、3)が分散表現空間の近い位置にクラスタCL21としてマッピングされる様子が示されている。例えば、検索クエリQ2m(m=1、2、3)は、利用者U2によって「中型の冷蔵庫を調べる」という検索意図の下で検索された検索クエリの集合であると推定される。すなわち、Q2m(m=1、2、3)は、「中型の冷蔵庫を調べる」という検索意図の下で検索された検索クエリであるという点で、相互に類似する特徴を有する検索クエリであると推定される。ここで、生成装置50は、「中型の冷蔵庫を調べる」という検索意図で入力された所定の検索クエリが第1モデルに入力されると、クラスタCL21の位置にマッピングされるような分散表現を出力することができる。これにより、例えば、生成装置50は、クラスタCL21の位置にマッピングされる分散表現に対応する検索クエリを抽出することにより、「中型の冷蔵庫を調べる」という検索意図に応じた検索クエリを抽出することができる。したがって、生成装置50は、検索クエリの意味を適切に解釈可能とすることができる。 As a result of the information processing shown in the lower part of FIG. 11, the vector QV2m (m = 1, 2, 3), which is a distributed representation of the search query Q2m (m = 1, 2, 3), is located near the distributed representation space of the cluster CL21. It is shown that it is mapped as. For example, the search query Q2m (m = 1, 2, 3) is presumed to be a set of search queries searched by the user U2 with the search intention of "checking a medium-sized refrigerator". That is, Q2m (m = 1, 2, 3) is a search query having characteristics similar to each other in that it is a search query searched with the search intention of "searching for a medium-sized refrigerator". Presumed. Here, the generator 50 outputs a distributed representation that is mapped to the position of the cluster CL21 when a predetermined search query input with the search intention of "checking a medium-sized refrigerator" is input to the first model. can do. As a result, for example, the generator 50 extracts the search query corresponding to the distributed representation mapped to the position of the cluster CL21, thereby extracting the search query according to the search intention of "checking the medium-sized refrigerator". Can be done. Therefore, the generation device 50 can appropriately interpret the meaning of the search query.

また、本願発明に係る生成装置50は、ランダムに抽出された複数の検索クエリは、異なる検索意図の下で検索された検索クエリであるという点で、相互に相違する特徴を有する検索クエリであるとみなして第1モデルM1を学習させる。具体的には、生成装置50は、所定の検索クエリの分散表現と、所定の検索クエリとは無関係にランダムに抽出された検索クエリの分散表現とが分散表現空間上で遠くにマッピングされるように第1モデルM1のトレーニングを行う。図11に示す例では、生成装置50は、検索クエリQ11とは無関係にランダムに検索クエリを抽出したところ、検索クエリQ21が抽出されたとする。この場合、生成装置50は、検索クエリQ11の分散表現(ベクトルQV11)と、検索クエリQ11とは無関係にランダムに抽出された検索クエリQ21の分散表現(ベクトルQV21)とが分散表現空間上で遠くにマッピングされるように第1モデルM1のトレーニングを行う。その結果として、「ある場所(東京都港区付近)で飲食店を探す」という検索意図の下で検索された検索クエリQ1k(k=1、2、3、4)の分散表現であるベクトルQV1k(k=1、2、3、4)を含むクラスタCL11と、「中型の冷蔵庫を調べる」という検索意図の下で検索された検索クエリQ2m(m=1、2、3)の分散表現であるベクトルQV2m(m=1、2、3)を含むクラスタCL21とは、分散表現空間上で遠くにマッピングされる。すなわち、本願発明に係る生成装置50は、ランダムに抽出された複数の検索クエリの分散表現が相違するように第1モデルM1を学習させることにより、検索意図が異なる検索クエリの分散表現を分散表現空間上で遠い位置に出力可能とする。 Further, the generation device 50 according to the present invention is a search query having different characteristics in that a plurality of randomly extracted search queries are search queries searched under different search intentions. Assuming that, the first model M1 is trained. Specifically, the generation device 50 maps the distributed representation of a predetermined search query and the distributed representation of a search query randomly extracted independently of the predetermined search query far away in the distributed representation space. The first model M1 is trained. In the example shown in FIG. 11, it is assumed that the generation device 50 randomly extracts the search query regardless of the search query Q11, and the search query Q21 is extracted. In this case, in the generation device 50, the distributed representation of the search query Q11 (vector QV11) and the distributed representation of the search query Q21 randomly extracted regardless of the search query Q11 (vector QV21) are far apart in the distributed representation space. The first model M1 is trained so as to be mapped to. As a result, the vector QV1k, which is a distributed expression of the search query Q1k (k = 1, 2, 3, 4) searched with the search intention of "searching for a restaurant in a certain place (near Minato-ku, Tokyo)". It is a distributed representation of the cluster CL11 including (k = 1, 2, 3, 4) and the search query Q2m (m = 1, 2, 3) searched with the search intention of "checking a medium-sized refrigerator". The cluster CL21 containing the vector QV2m (m = 1, 2, 3) is mapped far away on the distributed representation space. That is, the generator 50 according to the present invention trains the first model M1 so that the distributed expressions of a plurality of randomly extracted search queries are different, so that the distributed expressions of the search queries having different search intentions are distributed. It is possible to output to a distant position in space.

なお、生成装置50が生成した第1モデルM1によって出力された分散表現が分散表現空間にマッピングされた結果として、上述したクラスタCL11とクラスタCL21の他にも、同一のユーザによって所定の時間内に入力された複数の検索クエリの分散表現の集合であるクラスタCL12やクラスタCL22が生成される。 As a result of mapping the distributed representation output by the first model M1 generated by the generation device 50 to the distributed representation space, in addition to the cluster CL11 and the cluster CL21 described above, the same user can use the same user within a predetermined time. Cluster CL12 and cluster CL22, which are a set of distributed expressions of a plurality of input search queries, are generated.

上述したように、生成装置50は、ユーザによって入力された検索クエリを取得する。また、生成装置50は、取得した検索クエリのうち、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして学習することで、所定の検索クエリから所定の検索クエリの特徴情報を予測する第1モデルを生成する。すなわち、本願発明に係る生成装置50は、所定の時間内に連続して入力された複数の検索クエリは、所定の検索意図の下で検索された検索クエリであるという点で、相互に類似する特徴を有する検索クエリであるとみなして第1モデルを学習させる。具体的には、生成装置50は、同一のユーザによって所定の時間内に入力された複数の検索クエリの分散表現が類似するように第1モデルを学習させることで、所定の検索クエリから所定の検索クエリの特徴情報を含む分散表現を出力する第1モデルを生成する。すなわち、本願発明に係る生成装置50は、所定の時間内に連続して入力された複数の検索クエリの分散表現が類似するように第1モデルM1を学習させることにより、所定の検索意図の下で検索された検索クエリの分散表現を分散表現空間上で近い位置に出力可能とする。これにより、生成装置50は、検索クエリを入力したユーザのコンテクストに応じて検索クエリの意味(検索意図)を出力(解釈)することを可能にする。したがって、生成装置50は、検索クエリの意味を適切に解釈可能とすることができる。 As described above, the generator 50 acquires the search query entered by the user. Further, the generation device 50 learns from the acquired search queries that a plurality of search queries input by the same user within a predetermined time have similar characteristics, so that the generated search query can be used as a predetermined search query. Generate a first model that predicts the feature information of the search query. That is, the generation device 50 according to the present invention is similar to each other in that a plurality of search queries continuously input within a predetermined time are search queries searched under a predetermined search intention. The first model is trained by regarding it as a characteristic search query. Specifically, the generation device 50 trains the first model so that the distributed representations of a plurality of search queries input by the same user within a predetermined time are similar to each other, so that the first model is trained from the predetermined search query. Generate the first model that outputs the distributed representation including the feature information of the search query. That is, the generation device 50 according to the present invention trains the first model M1 so that the distributed representations of a plurality of search queries continuously input within a predetermined time are similar, so that the first model M1 is trained under a predetermined search intention. The distributed representation of the search query searched in is able to be output to a close position on the distributed representation space. As a result, the generation device 50 makes it possible to output (interpret) the meaning (search intention) of the search query according to the context of the user who input the search query. Therefore, the generation device 50 can appropriately interpret the meaning of the search query.

また、生成装置50は、所定の検索クエリの特徴情報を含む分散表現の近傍にマッピングされる分散表現に対応する検索クエリを抽出することにより、所定の検索クエリが検索された検索意図に応じた検索クエリを抽出することができる。すなわち、生成装置50は、検索クエリを入力したユーザの検索意図やコンテクストを考慮して、ユーザの検索動向を分析することを可能にする。したがって、生成装置50は、ユーザの検索動向の分析精度を高めることができる。また、生成装置50が生成した第1モデルM1を検索システムの一部として機能させることもできる。あるいは、生成装置50は、第1モデルM1によって予測された検索クエリの特徴情報を利用する他のシステム(例えば、検索エンジン)への入力情報として、第1モデルM1が出力した検索クエリの分散表現を提供することもできる。これにより、検索システムは、第1モデルM1によって予測された検索クエリの特徴情報に基づいて、検索結果として出力されるコンテンツを選択可能になる。すなわち、検索システムは、検索クエリを入力したユーザの検索意図やコンテクストを考慮して、検索結果として出力されるコンテンツを選択可能になる。さらに、検索システムは、第1モデルM1によって予測された検索クエリの特徴情報に基づいて、検索結果として出力されるコンテンツに含まれる文字情報の分散表現と検索クエリの分散表現との類似度を算出可能になる。そして、検索システムは、算出した類似度に基づいて、検索結果として出力されるコンテンツの表示順を決定可能になる。すなわち、検索システムは、検索クエリを入力したユーザの検索意図やコンテクストを考慮して、検索結果として出力されるコンテンツの表示順を決定可能になる。したがって、生成装置50は、検索サービスにおけるユーザビリティを向上させることができる。 Further, the generation device 50 extracts a search query corresponding to the distributed expression mapped in the vicinity of the distributed expression including the feature information of the predetermined search query, so that the predetermined search query corresponds to the searched intent. Search queries can be extracted. That is, the generation device 50 makes it possible to analyze the search trend of the user in consideration of the search intention and context of the user who has input the search query. Therefore, the generation device 50 can improve the analysis accuracy of the user's search trend. Further, the first model M1 generated by the generation device 50 can be made to function as a part of the search system. Alternatively, the generation device 50 is a distributed representation of the search query output by the first model M1 as input information to another system (for example, a search engine) that uses the feature information of the search query predicted by the first model M1. Can also be provided. As a result, the search system can select the content output as the search result based on the feature information of the search query predicted by the first model M1. That is, the search system can select the content output as the search result in consideration of the search intention and context of the user who entered the search query. Further, the search system calculates the similarity between the distributed representation of the character information included in the content output as the search result and the distributed representation of the search query based on the characteristic information of the search query predicted by the first model M1. It will be possible. Then, the search system can determine the display order of the contents output as the search result based on the calculated similarity. That is, the search system can determine the display order of the contents output as the search result in consideration of the search intention and context of the user who input the search query. Therefore, the generation device 50 can improve the usability in the search service.

〔7.生成装置の構成〕
次に、図12を用いて、実施形態に係る生成装置50の構成について説明する。図12は、実施形態に係る生成装置50の構成例を示す図である。図12に示すように、生成装置50は、通信部51と、記憶部53と、制御部52とを有する。なお、生成装置50は、生成装置50の管理者等から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を表示するための表示部(例えば、液晶ディスプレイ等)を有してもよい。
[7. Generator configuration]
Next, the configuration of the generation device 50 according to the embodiment will be described with reference to FIG. FIG. 12 is a diagram showing a configuration example of the generation device 50 according to the embodiment. As shown in FIG. 12, the generation device 50 includes a communication unit 51, a storage unit 53, and a control unit 52. The generation device 50 has an input unit (for example, a keyboard, a mouse, etc.) that receives various operations from the administrator of the generation device 50, and a display unit (for example, a liquid crystal display, etc.) for displaying various information. You may.

(通信部51)
通信部51は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部51は、ネットワークと有線または無線で接続され、例えば、端末装置10と、検索サーバ20との間で情報の送受信を行う。
(Communication unit 51)
The communication unit 51 is realized by, for example, a NIC (Network Interface Card) or the like. Then, the communication unit 51 is connected to the network by wire or wirelessly, and for example, information is transmitted / received between the terminal device 10 and the search server 20.

(記憶部53)
記憶部53は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。記憶部53は、図12に示すように、クエリ情報記憶部531と、ベクトル情報記憶部532と、モデル情報記憶部533とを有する。
(Memory unit 53)
The storage unit 53 is realized by, for example, a semiconductor memory element such as a RAM (Random Access Memory) or a flash memory (Flash Memory), or a storage device such as a hard disk or an optical disk. As shown in FIG. 12, the storage unit 53 includes a query information storage unit 531, a vector information storage unit 532, and a model information storage unit 533.

(クエリ情報記憶部531)
クエリ情報記憶部531は、ユーザによって入力された検索クエリに関する各種の情報を記憶する。図13に、実施形態に係るクエリ情報記憶部の一例を示す。図13に示す例では、クエリ情報記憶部531は、「ユーザID」、「日時」、「検索クエリ」、「検索クエリID」といった項目を有する。
(Query information storage unit 531)
The query information storage unit 531 stores various information related to the search query input by the user. FIG. 13 shows an example of the query information storage unit according to the embodiment. In the example shown in FIG. 13, the query information storage unit 531 has items such as "user ID", "date and time", "search query", and "search query ID".

「ユーザID」は、検索クエリを入力したユーザを識別するための識別情報を示す。「日時」は、検索サーバがユーザから検索クエリを受け付けた日時を示す。「検索クエリ」は、ユーザによって入力された検索クエリを示す。「検索クエリID」は、ユーザによって入力された検索クエリを識別するための識別情報を示す。 The "user ID" indicates identification information for identifying the user who entered the search query. "Date and time" indicates the date and time when the search server received the search query from the user. The "search query" indicates a search query entered by the user. The "search query ID" indicates identification information for identifying the search query entered by the user.

図13の1レコード目に示す例では、検索クエリID「Q11」で識別される検索クエリ(検索クエリQ11)は、図10に示した検索クエリQ11に対応する。また、ユーザID「U1」は、検索クエリQ11を入力したユーザがユーザID「U1」で識別されるユーザ(利用者U1)であることを示す。また、日時「2018/9/1 PM17:00」は、検索サーバが利用者U1から検索クエリQ11を受け付けた日時が2018年9月1日の午後17:00であることを示す。また、検索クエリ「六本木 パスタ」は、利用者U1によって入力された検索クエリQ11を示す。具体的には、検索クエリ「六本木 パスタ」は、地名を示す「六本木」と食品の種類を示す「パスタ」の文字とが区切り文字であるスペースで区切られた文字情報であることを示す。 In the example shown in the first record of FIG. 13, the search query (search query Q11) identified by the search query ID “Q11” corresponds to the search query Q11 shown in FIG. Further, the user ID "U1" indicates that the user who has input the search query Q11 is a user (user U1) identified by the user ID "U1". Further, the date and time "2018/9/1 PM 17:00" indicates that the date and time when the search server receives the search query Q11 from the user U1 is 17:00 pm on September 1, 2018. Further, the search query "Roppongi pasta" indicates the search query Q11 input by the user U1. Specifically, the search query "Roppongi pasta" indicates that the characters "Roppongi" indicating the place name and the characters "pasta" indicating the type of food are separated by a space which is a delimiter.

(ベクトル情報記憶部532)
ベクトル情報記憶部532は、検索クエリの分散表現であるベクトルに関する各種の情報を記憶する。図14に、実施形態に係るベクトル情報記憶部の一例を示す。図14に示す例では、ベクトル情報記憶部532は、「ベクトルID」、「検索クエリID」、「ベクトル情報」といった項目を有する。
(Vector information storage unit 532)
The vector information storage unit 532 stores various information related to the vector, which is a distributed representation of the search query. FIG. 14 shows an example of the vector information storage unit according to the embodiment. In the example shown in FIG. 14, the vector information storage unit 532 has items such as "vector ID", "search query ID", and "vector information".

「ベクトルID」は、検索クエリの分散表現であるベクトルを識別するための識別情報を示す。「検索クエリID」は、ベクトルに対応する検索クエリを識別するための識別情報を示す。「ベクトル情報」は、検索クエリの分散表現であるN次元のベクトルを示す。検索クエリの分散表現であるベクトルは、例えば、128次元のベクトルである。 “Vector ID” indicates identification information for identifying a vector which is a distributed representation of a search query. The "search query ID" indicates identification information for identifying the search query corresponding to the vector. "Vector information" indicates an N-dimensional vector which is a distributed representation of a search query. The vector, which is a distributed representation of the search query, is, for example, a 128-dimensional vector.

図14の1レコード目に示す例では、ベクトルID「QV11」で識別されるベクトル(ベクトルQV11)は、図10に示した検索クエリQ11の分散表現であるベクトルQV11に対応する。また、検索クエリID「Q11」で識別される検索クエリ(検索クエリQ11)は、ベクトルQV11に対応する検索クエリが検索クエリQ11であることを示す。また、ベクトル情報「QVDT11」は、検索クエリQ11の分散表現であるN次元のベクトルを示す。 In the example shown in the first record of FIG. 14, the vector (vector QV11) identified by the vector ID “QV11” corresponds to the vector QV11 which is a distributed representation of the search query Q11 shown in FIG. Further, the search query (search query Q11) identified by the search query ID "Q11" indicates that the search query corresponding to the vector QV11 is the search query Q11. Further, the vector information "QVDT11" indicates an N-dimensional vector which is a distributed representation of the search query Q11.

(モデル情報記憶部533)
モデル情報記憶部533は、生成装置50によって生成された学習モデルに関する各種の情報を記憶する。図15に、実施形態に係るモデル情報記憶部の一例を示す。図15に示す例では、モデル情報記憶部533は、「モデルID」、「モデルデータ」といった項目を有する。
(Model information storage unit 533)
The model information storage unit 533 stores various information related to the learning model generated by the generation device 50. FIG. 15 shows an example of the model information storage unit according to the embodiment. In the example shown in FIG. 15, the model information storage unit 533 has items such as "model ID" and "model data".

「モデルID」は、生成装置50によって生成された学習モデルを識別するための識別情報を示す。「モデルデータ」は、生成装置50によって生成された学習モデルのモデルデータを示す。例えば、「モデルデータ」には、検索クエリを分散表現に変換するためのデータが格納される。 The "model ID" indicates identification information for identifying the learning model generated by the generation device 50. “Model data” indicates model data of the learning model generated by the generation device 50. For example, "model data" stores data for converting a search query into a distributed representation.

図15の1レコード目に示す例では、モデルID「M1」で識別される学習モデルは、図1に示した第1モデルM1に対応する。また、モデルデータ「MDT1」は、生成装置50によって生成された第1モデルM1のモデルデータ(モデルデータMDT1)を示す。 In the example shown in the first record of FIG. 15, the learning model identified by the model ID “M1” corresponds to the first model M1 shown in FIG. Further, the model data "MDT1" indicates model data (model data MDT1) of the first model M1 generated by the generation device 50.

モデルデータMDT1は、検索クエリが入力される入力層と、出力層と、入力層から出力層までのいずれかの層であって出力層以外の層に属する第1要素と、第1要素と第1要素の重みとに基づいて値が算出される第2要素と、を含み、入力層に入力された検索クエリに応じて、入力層に入力された検索クエリの分散表現を出力層から出力するよう、生成装置50を機能させてもよい。 The model data MDT1 includes an input layer into which a search query is input, an output layer, a first element which is any layer from the input layer to the output layer and belongs to a layer other than the output layer, and the first element and the first element. The output layer outputs a distributed representation of the search query input to the input layer according to the search query input to the input layer, including the second element whose value is calculated based on the weight of one element. As such, the generator 50 may be made to function.

ここで、モデルデータMDT1が「y=a1*x1+a2*x2+・・・+ai*xi」で示す回帰モデルで実現されるとする。この場合、モデルデータMDT1が含む第1要素は、x1やx2等といった入力データ(xi)に対応する。また、第1要素の重みは、xiに対応する係数aiに対応する。ここで、回帰モデルは、入力層と出力層とを有する単純パーセプトロンと見做すことができる。各モデルを単純パーセプトロンと見做した場合、第1要素は、入力層が有するいずれかのノードに対応し、第2要素は、出力層が有するノードと見做すことができる。 Here, it is assumed that the model data MDT1 is realized by the regression model indicated by "y = a1 * x1 + a2 * x2 + ... + ai * xi". In this case, the first element included in the model data MDT1 corresponds to input data (xi) such as x1 and x2. Further, the weight of the first element corresponds to the coefficient ai corresponding to xi. Here, the regression model can be regarded as a simple perceptron having an input layer and an output layer. When each model is regarded as a simple perceptron, the first element corresponds to any node of the input layer, and the second element can be regarded as the node of the output layer.

また、モデルデータMDT1がDNN(Deep Neural Network)等、1つまたは複数の中間層を有するニューラルネットワークで実現されるとする。この場合、モデルデータMDT1が含む第1要素は、入力層または中間層が有するいずれかのノードに対応する。また、第2要素は、第1要素と対応するノードから値が伝達されるノードである次段のノードに対応する。また、第1要素の重みは、第1要素と対応するノードから第2要素と対応するノードに伝達される値に対して考慮される重みである接続係数に対応する。 Further, it is assumed that the model data MDT1 is realized by a neural network having one or a plurality of intermediate layers such as DNN (Deep Neural Network). In this case, the first element included in the model data MDT1 corresponds to either the node of the input layer or the intermediate layer. Further, the second element corresponds to a node in the next stage, which is a node to which a value is transmitted from a node corresponding to the first element. Further, the weight of the first element corresponds to a connection coefficient which is a weight considered for the value transmitted from the node corresponding to the first element to the node corresponding to the second element.

生成装置50は、上述した回帰モデルやニューラルネットワーク等、任意の構造を有するモデルを用いて、分散表現の算出を行う。具体的には、モデルデータMDT1は、検索クエリが入力された場合に、分散表現を出力するように係数が設定される。生成装置50は、このようなモデルデータMDT1を用いて、分散表現を算出する。 The generation device 50 calculates the distributed representation using a model having an arbitrary structure such as the regression model and the neural network described above. Specifically, the model data MDT1 is set with a coefficient so as to output a distributed representation when a search query is input. The generation device 50 calculates the distributed representation using such model data MDT1.

なお、上記例では、モデルデータMDT1が、検索クエリが入力された場合に、検索クエリの分散表現を出力するモデル(以下、モデルX1という。)である例を示した。しかし、実施形態に係るモデルデータMDT1は、モデルX1にデータの入出力を繰り返すことで得られる結果に基づいて生成されるモデルであってもよい。例えば、モデルデータMDT1は、検索クエリを入力とした際に、モデルX1が出力した分散表現を入力して学習されたモデル(以下、モデルY1という。)であってもよい。または、モデルデータMDT1は、検索クエリを入力とし、モデルY1の出力値を出力とするよう学習されたモデルであってもよい。 In the above example, the model data MDT1 is a model (hereinafter referred to as model X1) that outputs a distributed representation of the search query when the search query is input. However, the model data MDT1 according to the embodiment may be a model generated based on the result obtained by repeating the input / output of data to the model X1. For example, the model data MDT1 may be a model (hereinafter, referred to as model Y1) learned by inputting the distributed representation output by the model X1 when the search query is input. Alternatively, the model data MDT1 may be a model trained to input a search query and output the output value of the model Y1.

また、生成装置50がGAN(Generative Adversarial Networks)を用いた推定処理を行う場合、モデルデータMDT1は、GANの一部を構成するモデルであってもよい。 Further, when the generation device 50 performs the estimation process using GAN (Generative Adversarial Networks), the model data MDT1 may be a model forming a part of GAN.

(制御部52)
図12の説明に戻って、制御部52は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、生成装置50内部の記憶装置に記憶されている各種プログラム(生成プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部52は、コントローラであり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
(Control unit 52)
Returning to the description of FIG. 12, the control unit 52 is a controller, and is stored in a storage device inside the generation device 50 by, for example, a CPU (Central Processing Unit) or an MPU (Micro Processing Unit). It is realized by executing various programs (corresponding to an example of a generation program) using the RAM as a work area. Further, the control unit 52 is a controller, and is realized by, for example, an integrated circuit such as an ASIC (Application Specific Integrated Circuit) or an FPGA (Field Programmable Gate Array).

また、制御部52は、モデル情報記憶部533に記憶されている第1モデルM1(モデルデータMDT1)に従った情報処理により、入力層に入力された検索クエリに対し、出力層以外の各層に属する各要素を第1要素として、第1要素と第1要素の重みとに基づく演算を行うことにより、分散表現を出力層から出力するよう、コンピュータを機能させる。 Further, the control unit 52 sends the search query input to the input layer to each layer other than the output layer by information processing according to the first model M1 (model data MDT1) stored in the model information storage unit 533. The computer is made to function so as to output a distributed representation from the output layer by performing an operation based on the first element and the weight of the first element with each element to which it belongs as the first element.

また、制御部52は、モデル情報記憶部533に記憶されている第2モデルM2(モデルデータMDT2)に従った情報処理により、入力層に入力された検索クエリに対し、出力層以外の各層に属する各要素を第1要素として、第1要素と第1要素の重みとに基づく演算を行うことにより、検索クエリが各カテゴリに属する確率を出力層から出力するよう、コンピュータを機能させる。 Further, the control unit 52 sends the search query input to the input layer to each layer other than the output layer by information processing according to the second model M2 (model data MDT2) stored in the model information storage unit 533. By performing an operation based on the first element and the weight of the first element with each element to which it belongs as the first element, the computer is made to function so that the probability that the search query belongs to each category is output from the output layer.

図12に示すように、制御部52は、取得部521と、抽出部522と、生成部523を有し、以下に説明する情報処理の作用を実現または実行する。なお、制御部52の内部構成は、図12に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。 As shown in FIG. 12, the control unit 52 includes an acquisition unit 521, an extraction unit 522, and a generation unit 523, and realizes or executes the information processing operation described below. The internal configuration of the control unit 52 is not limited to the configuration shown in FIG. 12, and may be another configuration as long as it is a configuration for performing information processing described later.

(取得部521)
取得部521は、種々の情報を取得する。具体的には、取得部521は、ユーザによって入力された検索クエリを検索サーバ20から取得する。取得部521は、ユーザによって入力された検索クエリを取得すると、取得した検索クエリをクエリ情報記憶部531に格納する。
(Acquisition unit 521)
The acquisition unit 521 acquires various information. Specifically, the acquisition unit 521 acquires the search query input by the user from the search server 20. When the acquisition unit 521 acquires the search query input by the user, the acquisition unit 521 stores the acquired search query in the query information storage unit 531.

また、取得部521は、検索クエリの分散表現であるベクトルに関するベクトル情報を取得する。取得部521は、ベクトル情報を取得すると、取得したベクトル情報をベクトル情報記憶部532に格納する。 In addition, the acquisition unit 521 acquires vector information regarding a vector which is a distributed representation of the search query. When the acquisition unit 521 acquires the vector information, the acquisition unit 521 stores the acquired vector information in the vector information storage unit 532.

また、取得部521は、第1モデルに関する情報を取得する。具体的には、取得部521は、取得部521は、生成部523によって生成された第1モデルに関する情報を取得する。取得部521は、第1モデルに関する情報を取得すると、取得した第1モデルに関する情報をモデル情報記憶部533に格納する。 In addition, the acquisition unit 521 acquires information about the first model. Specifically, the acquisition unit 521 acquires information about the first model generated by the generation unit 523. When the acquisition unit 521 acquires the information regarding the first model, the acquisition unit 521 stores the acquired information regarding the first model in the model information storage unit 533.

(抽出部522)
抽出部522は、種々の情報を抽出する。具体的には、抽出部522は、取得部521によって取得された検索クエリのうち、同一のユーザによって所定の時間内に入力された複数の検索クエリを抽出する。例えば、抽出部522は、同一のユーザによって各検索クエリが入力された時間の間隔が所定の時間内である複数の検索クエリを抽出する。続いて、抽出部522は、同一のユーザによって所定の時間内に入力された複数の検索クエリのうち、同一のユーザによって所定の時間内に連続して入力された一対の検索クエリを抽出する。例えば、抽出部522は、同一のユーザによって各検索クエリのペアが入力された時間の間隔が所定の時間内である複数の検索クエリを抽出する。例えば、抽出部522は、取得部521によって取得された検索クエリのうち、同一の利用者U1によって所定の時間内に連続して入力された4個の検索クエリである検索クエリQ11(「六本木 パスタ」)、検索クエリQ12(「六本木 イタリアン」)、検索クエリQ13(「赤坂 パスタ」)、検索クエリQ14(「麻布 パスタ」)を抽出する。抽出部522は、検索クエリが入力された順番に並べると、検索クエリQ11、検索クエリQ12、検索クエリQ13、検索クエリQ14の順番で入力された4個の検索クエリを抽出する。続いて、抽出部522は、4個の検索クエリを抽出すると、時系列的に隣り合う2つの検索クエリを一対の検索クエリとして、3対の検索クエリのペアである(検索クエリQ11、検索クエリQ12)、(検索クエリQ12、検索クエリQ13)、(検索クエリQ13、検索クエリQ14)を抽出する。なお、抽出部522は、同一のユーザによって全ての検索クエリが所定の時間内に入力された複数の検索クエリを抽出してもよい。そして、抽出部522は、時系列的に隣り合うか否かに関わらず、抽出した複数の検索クエリの中から2つの検索クエリを選択して、選択した2つの検索クエリを一対の検索クエリとして抽出してもよい。
(Extractor 522)
The extraction unit 522 extracts various information. Specifically, the extraction unit 522 extracts a plurality of search queries input by the same user within a predetermined time from the search queries acquired by the acquisition unit 521. For example, the extraction unit 522 extracts a plurality of search queries in which the time interval in which each search query is input by the same user is within a predetermined time. Subsequently, the extraction unit 522 extracts a pair of search queries continuously input by the same user within a predetermined time from among a plurality of search queries input by the same user within a predetermined time. For example, the extraction unit 522 extracts a plurality of search queries in which the time interval in which each search query pair is input by the same user is within a predetermined time. For example, the extraction unit 522 is a search query Q11 (“Roppongi pasta”) which is four search queries continuously input by the same user U1 within a predetermined time among the search queries acquired by the acquisition unit 521. ”), Search query Q12 (“Roppongi Italian”), search query Q13 (“Akasaka pasta”), search query Q14 (“Azabu pasta”). When the search queries are arranged in the order in which they are input, the extraction unit 522 extracts four search queries input in the order of search query Q11, search query Q12, search query Q13, and search query Q14. Subsequently, when the extraction unit 522 extracts four search queries, it is a pair of three search queries (search query Q11, search query), with two search queries adjacent in chronological order as a pair of search queries. Q12), (search query Q12, search query Q13), (search query Q13, search query Q14) are extracted. The extraction unit 522 may extract a plurality of search queries in which all the search queries are input by the same user within a predetermined time. Then, the extraction unit 522 selects two search queries from the plurality of extracted search queries regardless of whether they are adjacent to each other in chronological order, and uses the two selected search queries as a pair of search queries. It may be extracted.

また、抽出部522は、取得部521によって取得された検索クエリのうち、所定の検索クエリと所定の検索クエリに無関係な他の検索クエリとを抽出する。例えば、抽出部522は、取得部521によって取得された検索クエリの中から、所定の検索クエリを抽出する。続いて、抽出部522は、取得部521によって取得された検索クエリの中から、所定の検索クエリとは無関係にランダムに他の検索クエリを抽出する。 Further, the extraction unit 522 extracts a predetermined search query and other search queries unrelated to the predetermined search query from the search queries acquired by the acquisition unit 521. For example, the extraction unit 522 extracts a predetermined search query from the search queries acquired by the acquisition unit 521. Subsequently, the extraction unit 522 randomly extracts another search query from the search queries acquired by the acquisition unit 521, regardless of the predetermined search query.

(生成部523)
生成部523は、種々の情報を生成する。具体的には、生成部523は、取得部521によって取得された検索クエリのうち、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして学習することで、所定の検索クエリから所定の検索クエリの特徴情報を予測する学習モデルを生成する。具体的には、生成部523は、同一のユーザによって所定の時間内に入力された複数の検索クエリの分散表現が類似するように学習モデルを学習させることで、所定の検索クエリから所定の検索クエリの特徴情報を予測する学習モデルを生成する。例えば、生成部523は、所定の時間内に続けて入力された一対の検索クエリの分散表現が類似するように学習することで、学習モデルを生成する。例えば、生成部523は、一対の検索クエリの学習前の分散表現の類似度の値を算出する。また、生成部523は、一対の検索クエリの学習後の分散表現の類似度の値を算出する。続いて、生成部523は、学習前の分散表現の類似度の値よりも、学習後の分散表現の類似度の値が大きくなるように学習モデルを学習させる。このように、生成部523は、一対の検索クエリに対応する一対の分散表現である2つのベクトルが分散表現空間上で類似するように学習モデルを学習させることで、検索クエリから分散表現を出力する学習モデルを生成する。より具体的には、生成部523は、RNNの一種であるLSTMを分散表現生成に用いたDSSMの技術を用いて、検索クエリから分散表現を出力する学習モデルを生成する。例えば、生成部523は、学習モデルの正解データとして、同一のユーザによって所定の時間内に入力された一対の検索クエリが類似する特徴を有するものとして、所定の検索クエリの分散表現と、所定の検索クエリと対となる他の検索クエリの分散表現とが、分散表現空間上で近くに存在するように学習する。また、生成部523は、第1モデルを生成すると、第1モデルを識別する識別情報と対応付けて、生成した第1モデル(モデルデータMDT1)をモデル情報記憶部533に格納する。
(Generation unit 523)
The generation unit 523 generates various information. Specifically, the generation unit 523 learns that among the search queries acquired by the acquisition unit 521, a plurality of search queries input by the same user within a predetermined time have similar characteristics. , Generate a learning model that predicts the feature information of a predetermined search query from a predetermined search query. Specifically, the generation unit 523 trains the learning model so that the distributed expressions of a plurality of search queries input by the same user within a predetermined time are similar, thereby performing a predetermined search from the predetermined search query. Generate a learning model that predicts query feature information. For example, the generation unit 523 generates a learning model by learning so that the distributed expressions of a pair of search queries input consecutively within a predetermined time are similar. For example, the generation unit 523 calculates the value of the similarity of the distributed representation before learning the pair of search queries. In addition, the generation unit 523 calculates the value of the similarity of the distributed representation after learning the pair of search queries. Subsequently, the generation unit 523 trains the learning model so that the value of the similarity of the distributed expression after learning is larger than the value of the similarity of the distributed expression before learning. In this way, the generation unit 523 outputs the distributed expression from the search query by training the learning model so that the two vectors, which are the pair of distributed expressions corresponding to the pair of search queries, are similar in the distributed expression space. Generate a learning model to do. More specifically, the generation unit 523 generates a learning model that outputs a distributed expression from a search query by using the DSSM technology that uses LSTM, which is a kind of RNN, for the distributed expression generation. For example, the generation unit 523 assumes that the pair of search queries input by the same user within a predetermined time have similar characteristics as the correct answer data of the learning model, and the distributed representation of the predetermined search query and the predetermined search query are predetermined. Learn so that the distributed representations of other search queries that are paired with the search query are close together in the distributed representation space. Further, when the first model is generated, the generation unit 523 stores the generated first model (model data MDT1) in the model information storage unit 533 in association with the identification information that identifies the first model.

〔8.第1モデルの一例〕
次に、図16を用いて生成装置50が生成する第1モデルの一例について説明する。図16は、実施形態に係る第1モデルの一例を示す図である。図16に示す例では、生成装置50が生成する第1モデルM1は、3層のLSTM RNNで構成されている。図16に示す例では、抽出部522は、同一の利用者U1によって所定の時間内に連続して入力された「六本木 パスタ」という検索クエリQ11と「六本木 イタリアン」という検索クエリQ12とから成る一対の検索クエリを抽出する。生成部523は、抽出部522によって抽出されたた検索クエリQ11を第1モデルM1の入力層に入力する(ステップS41)。
[8. Example of the first model]
Next, an example of the first model generated by the generation device 50 will be described with reference to FIG. FIG. 16 is a diagram showing an example of the first model according to the embodiment. In the example shown in FIG. 16, the first model M1 generated by the generation device 50 is composed of three layers of LSTM RNNs. In the example shown in FIG. 16, the extraction unit 522 is a pair consisting of a search query Q11 "Roppongi pasta" and a search query Q12 "Roppongi Italian" continuously input by the same user U1 within a predetermined time. Extract search queries for. The generation unit 523 inputs the search query Q11 extracted by the extraction unit 522 to the input layer of the first model M1 (step S41).

続いて、生成部523は、第1モデルM1の出力層から検索クエリQ11の分散表現である256次元のベクトルBQV11を出力する。また、生成部523は、抽出部522によって抽出された検索クエリQ12を第1モデルM1の入力層に入力する。続いて、生成部523は、第1モデルM1の出力層から検索クエリQ12の分散表現である256次元のベクトルBQV12を出力する(ステップS42)。 Subsequently, the generation unit 523 outputs a 256-dimensional vector BQV11 which is a distributed representation of the search query Q11 from the output layer of the first model M1. Further, the generation unit 523 inputs the search query Q12 extracted by the extraction unit 522 to the input layer of the first model M1. Subsequently, the generation unit 523 outputs a 256-dimensional vector BQV12 which is a distributed representation of the search query Q12 from the output layer of the first model M1 (step S42).

続いて、生成部523は、連続して入力された2つの検索クエリの分散表現が類似するように学習することで、検索クエリから分散表現を出力する第1モデルM1を生成する(ステップS43)。例えば、第1モデルM1にフィードバックをかける前(学習前)の検索クエリQ11の分散表現であるベクトルBQV11と検索クエリQ12の分散表現であるベクトルBQV12とのなす角度の大きさをΘとする。また、第1モデルM1にフィードバックをかけた後(学習後)の検索クエリQ11の分散表現であるベクトルQV11と検索クエリQ12の分散表現であるベクトルQV12とのなす角度の大きさをΦとする。この時、生成部523は、ΘよりもΦが小さくなるように、第1モデルM1を学習させる。例えば、生成部523は、ベクトルBQV11とベクトルBQV12のコサイン類似度の値を算出する。また、生成部523は、ベクトルQV11とベクトルQV12のコサイン類似度の値を算出する。続いて、生成部523は、ベクトルBQV11とベクトルBQV12のコサイン類似度の値よりも、ベクトルQV11とベクトルQV12のコサイン類似度の値が大きくなるように(値が1に近づくように)学習モデルM1を学習させる。このように、生成部523は、一対の検索クエリに対応する一対の分散表現である2つのベクトルが分散表現空間上で類似するように第1モデルM1を学習させることで、検索クエリから分散表現を出力する第1モデルM1を生成する。なお、生成部523は、コサイン類似度に限らず、ベクトル間の距離尺度として適用可能な指標であれば、どのような指標に基づいて分散表現の間の類似度を算出してもよい。また、生成部523は、ベクトル間の距離尺度として適用可能な指標であれば、どのような指標に基づいて学習モデルM1を学習させてもよい。例えば、生成部523は、分散表現同士のユークリッド距離や双曲空間等の非ユークリッド空間中での距離、マンハッタン距離、マハラノビス距離等といった所定の距離関数の値を算出する。続いて、生成部523は、分散表現同士の所定の距離関数の値(すなわち、分散表現空間における距離)が小さくなるように学習モデルM1を学習させてもよい。 Subsequently, the generation unit 523 generates the first model M1 that outputs the distributed expression from the search query by learning so that the distributed expressions of the two consecutively input search queries are similar (step S43). .. For example, let Θ be the magnitude of the angle formed by the vector BQV11 which is the distributed representation of the search query Q11 before giving feedback to the first model M1 (before learning) and the vector BQV12 which is the distributed representation of the search query Q12. Further, let Φ be the size of the angle formed by the vector QV11 which is the distributed expression of the search query Q11 after giving feedback to the first model M1 (after learning) and the vector QV12 which is the distributed expression of the search query Q12. At this time, the generation unit 523 trains the first model M1 so that Φ is smaller than Θ. For example, the generation unit 523 calculates the value of the cosine similarity between the vector BQV11 and the vector BQV12. Further, the generation unit 523 calculates the value of the cosine similarity between the vector QV11 and the vector QV12. Subsequently, the generation unit 523 prepares the learning model M1 so that the value of the cosine similarity between the vector QV11 and the vector QV12 is larger than the value of the cosine similarity between the vector BQV11 and the vector BQV12 (so that the value approaches 1). To learn. In this way, the generation unit 523 trains the first model M1 so that the two vectors, which are a pair of distributed representations corresponding to the pair of search queries, are similar in the distributed representation space, so that the distributed representation is expressed from the search query. Generates the first model M1 that outputs. The generation unit 523 may calculate the similarity between the distributed representations based on any index as long as it is an index applicable as a distance scale between vectors, not limited to the cosine similarity. Further, the generation unit 523 may train the learning model M1 based on any index as long as it is an index applicable as a distance scale between vectors. For example, the generation unit 523 calculates the value of a predetermined distance function such as the Euclidean distance between distributed expressions, the distance in a non-Euclidean space such as hyperbolic space, the Manhattan distance, and the Mahalanobis distance. Subsequently, the generation unit 523 may train the learning model M1 so that the value of a predetermined distance function between the distributed representations (that is, the distance in the distributed representation space) becomes small.

また、生成部523は、同一のユーザによって所定の時間内に入力された複数の検索クエリとして、所定の区切り文字で区切られた文字情報を含む複数の検索クエリが類似する特徴を有するものとして学習することで、第1モデルを生成する。例えば、生成部523は、地名を示す「六本木」と食品の種類を示す「パスタ」の文字とが区切り文字であるスペースで区切られた検索クエリ「六本木 パスタ」と、地名を示す「六本木」と料理の種類を示す「イタリアン」の文字とが区切り文字であるスペースで区切られた検索クエリ「六本木 イタリアン」とが類似する特徴を有するものとして学習することで、第1モデルを生成する。 Further, the generation unit 523 learns that, as a plurality of search queries input by the same user within a predetermined time, a plurality of search queries including character information separated by a predetermined delimiter have similar characteristics. By doing so, the first model is generated. For example, the generation unit 523 includes a search query "Roppongi pasta" in which the characters "Roppongi" indicating the place name and the characters "pasta" indicating the type of food are separated by a space, and "Roppongi" indicating the place name. The first model is generated by learning that the search query "Roppongi Italian", which is separated by a space delimiter from the character "Italian" indicating the type of food, has similar characteristics.

また、生成部523は、取得部521によって取得された検索クエリのうち、ランダムに抽出された複数の検索クエリが相違する特徴を有するものとして学習することで、第1モデルを生成する。具体的には、生成部523は、取得部521によって取得された検索クエリのうち、ランダムに抽出された一対の検索クエリの分散表現が相違するように学習することで、第1モデルを生成する。例えば、生成部523は、抽出部522によって抽出された所定の検索クエリの分散表現と、所定の検索クエリとは無関係にランダムに抽出された検索クエリの分散表現とが分散表現空間上で遠くにマッピングされるように第1モデルM1のトレーニングを行う。 Further, the generation unit 523 generates the first model by learning that a plurality of randomly extracted search queries among the search queries acquired by the acquisition unit 521 have different characteristics. Specifically, the generation unit 523 generates the first model by learning so that the distributed representations of a pair of randomly extracted search queries among the search queries acquired by the acquisition unit 521 are different. .. For example, in the generation unit 523, the distributed representation of the predetermined search query extracted by the extraction unit 522 and the distributed representation of the search query randomly extracted regardless of the predetermined search query are far apart in the distributed representation space. The first model M1 is trained so as to be mapped.

〔9.第1モデルの生成処理のフロー〕
次に、図17を用いて、実施形態に係る第1モデルの生成処理の手順について説明する。図17は、実施形態に係る第1モデルの生成処理手順を示すフローチャートである。
[9. Flow of generation processing of the first model]
Next, the procedure of the generation process of the first model according to the embodiment will be described with reference to FIG. FIG. 17 is a flowchart showing a generation processing procedure of the first model according to the embodiment.

図17に示す例では、生成装置50は、ユーザによって入力された検索クエリを取得する(ステップS1001)。 In the example shown in FIG. 17, the generation device 50 acquires the search query input by the user (step S1001).

続いて、生成装置50は、同一のユーザによって所定の時間内に入力された複数の検索クエリを抽出する(ステップS1002)。 Subsequently, the generation device 50 extracts a plurality of search queries input by the same user within a predetermined time (step S1002).

続いて、生成装置50は、抽出した複数の検索クエリが類似する特徴を有するものとして学習することで、所定の検索クエリから所定の検索クエリの特徴情報を予測する第1モデルを生成する(ステップS1003)。 Subsequently, the generation device 50 generates a first model that predicts the characteristic information of a predetermined search query from the predetermined search query by learning that the plurality of extracted search queries have similar characteristics (step). S1003).

〔10.効果〕
上述してきたように、実施形態に係る情報処理装置100は、受付部131と生成部133と出力部134を有する。受付部131は、類似性の判定対象を示す複数の第1クエリと、類似性の判定基準を示す複数の第2クエリとを受け付ける。生成部133は、第2クエリごとに、各第1クエリが示す判定対象と、第2クエリが示す判定基準との類似性を示す類似情報を生成する。出力部134は、生成部133によって生成された類似情報を出力する。
[10. effect〕
As described above, the information processing apparatus 100 according to the embodiment includes a reception unit 131, a generation unit 133, and an output unit 134. The reception unit 131 accepts a plurality of first queries indicating the similarity determination target and a plurality of second queries indicating the similarity determination criteria. For each second query, the generation unit 133 generates similar information indicating the similarity between the determination target indicated by each first query and the determination criterion indicated by the second query. The output unit 134 outputs similar information generated by the generation unit 133.

これにより、情報処理装置100は、多数の高次元の分散表現同士の類似度に関する分析結果を一見して把握しやすい状態で提供可能にする。したがって、情報処理装置100は、有用な情報を得ることができる。 As a result, the information processing apparatus 100 can provide an analysis result regarding the similarity between a large number of high-dimensional distributed expressions in a state in which it is easy to grasp at a glance. Therefore, the information processing device 100 can obtain useful information.

また、生成部133は、判定対象を示す対象情報が第1クエリとして入力された際の検索意図と、判定基準を示す基準情報が第2クエリとして入力された際の検索意図との類似性を示すスコアに基づいて、類似情報を生成する。 Further, the generation unit 133 determines the similarity between the search intention when the target information indicating the determination target is input as the first query and the search intention when the reference information indicating the determination criterion is input as the second query. Generate similar information based on the score shown.

これにより、情報処理装置100は、第1クエリと第2クエリとの検索意図の類似性に関する分析結果を提供可能とする。 As a result, the information processing apparatus 100 can provide an analysis result regarding the similarity of the search intention between the first query and the second query.

また、生成部133は、対象情報である文字情報に対応する分散表現と基準情報である文字情報に対応する分散表現との類似度であるスコアに基づいて、類似情報を生成する。 Further, the generation unit 133 generates similar information based on the score which is the degree of similarity between the distributed expression corresponding to the character information which is the target information and the distributed expression corresponding to the character information which is the reference information.

これにより、情報処理装置100は、第1クエリと第2クエリとの検索意図の類似性に関する分析結果を数値によって客観的に把握できる状態で提供可能とする。 As a result, the information processing apparatus 100 can provide the analysis result regarding the similarity of the search intention between the first query and the second query in a state where it can be objectively grasped numerically.

また、生成部133は、類似情報として、スコアの大きさを視認可能にしたグラフに関する情報を生成する。出力部134は、第2クエリごとに、生成部133によって生成されたグラフに関する情報を出力する。 In addition, the generation unit 133 generates information on the graph that makes the magnitude of the score visible as similar information. The output unit 134 outputs information about the graph generated by the generation unit 133 for each second query.

これにより、情報処理装置100は、多数の高次元の分散表現同士の類似度に関する分析結果を一見して把握しやすい状態で提供可能にする。 As a result, the information processing apparatus 100 can provide an analysis result regarding the similarity between a large number of high-dimensional distributed expressions in a state in which it is easy to grasp at a glance.

また、受付部131は、取引対象を示す複数の第1クエリを受け付ける。生成部133は、類似情報として、取引対象の属性に応じて異なる色によって、スコアの大きさを示す領域が色分けされたグラフに関する情報を生成する。 In addition, the reception unit 131 receives a plurality of first queries indicating the transaction target. As similar information, the generation unit 133 generates information on a graph in which the area indicating the size of the score is color-coded by different colors according to the attributes of the transaction target.

これにより、情報処理装置100は、取引対象の属性間で分析結果を一見して比較しやすい状態で提供可能にする。 As a result, the information processing apparatus 100 makes it possible to provide the analysis results between the attributes of the transaction target in a state where they can be easily compared at a glance.

また、受付部131は、取引対象を示す複数の第1クエリを受け付ける。生成部133は、類似情報として、取引対象を取り扱う事業者に応じて異なる色によって、スコアの大きさを示す領域が色分けされたグラフに関する情報を生成する。 In addition, the reception unit 131 receives a plurality of first queries indicating the transaction target. As similar information, the generation unit 133 generates information on a graph in which a region indicating the size of the score is color-coded with different colors depending on the business operator handling the transaction target.

これにより、情報処理装置100は、取引対象を取り扱う事業者間で分析結果を一見して比較しやすい状態で提供可能にする。 As a result, the information processing apparatus 100 makes it possible to provide the analysis results in a state in which it is easy to compare at a glance among the business operators handling the transaction target.

また、生成部133は、第2クエリごとに、類似情報と第2クエリとが対応付けて表示されるコンテンツを生成する。 In addition, the generation unit 133 generates content in which similar information and the second query are displayed in association with each other for each second query.

これにより、情報処理装置100は、異なる分析の軸ごとに複数の第1クエリの分析結果を一見して把握しやすい状態で提供可能とする。 As a result, the information processing apparatus 100 can provide the analysis results of the plurality of first queries for each of the different analysis axes in a state in which it is easy to grasp at a glance.

〔11.ハードウェア構成〕
また、上述してきた実施形態に係る情報処理装置100または生成装置50または端末装置10は、例えば図18に示すような構成のコンピュータ1000によって実現される。図18は、情報処理装置100または生成装置50または端末装置10の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を備える。
[11. Hardware configuration]
Further, the information processing device 100 or the generation device 50 or the terminal device 10 according to the above-described embodiment is realized by, for example, a computer 1000 having a configuration as shown in FIG. FIG. 18 is a hardware configuration diagram showing an example of a computer that realizes the functions of the information processing device 100, the generation device 50, or the terminal device 10. The computer 1000 includes a CPU 1100, a RAM 1200, a ROM 1300, an HDD 1400, a communication interface (I / F) 1500, an input / output interface (I / F) 1600, and a media interface (I / F) 1700.

CPU1100は、ROM1300またはHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。 The CPU 1100 operates based on a program stored in the ROM 1300 or the HDD 1400, and controls each part. The ROM 1300 stores a boot program executed by the CPU 1100 when the computer 1000 is started, a program depending on the hardware of the computer 1000, and the like.

HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を格納する。通信インターフェイス1500は、所定の通信網を介して他の機器からデータを受信してCPU1100へ送り、CPU1100が生成したデータを所定の通信網を介して他の機器へ送信する。 The HDD 1400 stores a program executed by the CPU 1100, data used by such a program, and the like. The communication interface 1500 receives data from another device via a predetermined communication network and sends it to the CPU 1100, and transmits the data generated by the CPU 1100 to the other device via the predetermined communication network.

CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、生成したデータを入出力インターフェイス1600を介して出力装置へ出力する。 The CPU 1100 controls an output device such as a display or a printer, and an input device such as a keyboard or a mouse via the input / output interface 1600. The CPU 1100 acquires data from the input device via the input / output interface 1600. Further, the CPU 1100 outputs the generated data to the output device via the input / output interface 1600.

メディアインターフェイス1700は、記録媒体1800に格納されたプログラムまたはデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。 The media interface 1700 reads a program or data stored in the recording medium 1800 and provides the program or data to the CPU 1100 via the RAM 1200. The CPU 1100 loads the program from the recording medium 1800 onto the RAM 1200 via the media interface 1700, and executes the loaded program. The recording medium 1800 is, for example, an optical recording medium such as a DVD (Digital Versatile Disc) or PD (Phase change rewritable disk), a magneto-optical recording medium such as an MO (Magneto-Optical disk), a tape medium, a magnetic recording medium, or a semiconductor memory. And so on.

例えば、コンピュータ1000が情報処理装置100または生成装置50または端末装置10として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部130または制御部52または制御部15の機能を実現する。コンピュータ1000のCPU1100は、これらのプログラムを記録媒体1800から読み取って実行するが、他の例として、他の装置から所定の通信網を介してこれらのプログラムを取得してもよい。 For example, when the computer 1000 functions as the information processing device 100, the generation device 50, or the terminal device 10, the CPU 1100 of the computer 1000 controls the control unit 130 or the control unit 52 or the control unit 52 by executing the program loaded on the RAM 1200. The function of the part 15 is realized. The CPU 1100 of the computer 1000 reads and executes these programs from the recording medium 1800, but as another example, these programs may be acquired from another device via a predetermined communication network.

以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。 Although some of the embodiments of the present application have been described in detail with reference to the drawings, these are examples, and various modifications are made based on the knowledge of those skilled in the art, including the embodiments described in the disclosure column of the invention. It is possible to practice the present invention in other improved forms.

〔12.その他〕
また、上記実施形態及び変形例において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
[12. others〕
Further, among the processes described in the above-described embodiments and modifications, all or part of the processes described as being automatically performed can be manually performed, or are described as being manually performed. It is also possible to automatically perform all or part of the processed processing by a known method. In addition, the processing procedure, specific name, and information including various data and parameters shown in the above document and drawings can be arbitrarily changed unless otherwise specified. For example, the various information shown in each figure is not limited to the illustrated information.

また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。 Further, each component of each of the illustrated devices is a functional concept, and does not necessarily have to be physically configured as shown in the figure. That is, the specific form of distribution / integration of each device is not limited to the one shown in the figure, and all or part of the device is functionally or physically dispersed / physically distributed in any unit according to various loads and usage conditions. Can be integrated and configured.

また、上述してきた実施形態及び変形例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。 Further, the above-described embodiments and modifications can be appropriately combined as long as the processing contents do not contradict each other.

また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、生成部は、生成手段や生成回路に読み替えることができる。 Further, the above-mentioned "section, module, unit" can be read as "means" or "circuit". For example, the generation unit can be read as a generation means or a generation circuit.

1 情報処理システム
10 端末装置
20 検索サーバ
50 生成装置
100 情報処理装置
110 通信部
120 記憶部
121 クエリ情報記憶部
122 ベクトル情報記憶部
123 類似度情報記憶部
124 モデル情報記憶部
130 制御部
131 受付部
132 取得部
133 生成部
134 出力部
1 Information processing system 10 Terminal device 20 Search server 50 Generation device 100 Information processing device 110 Communication unit 120 Storage unit 121 Query information storage unit 122 Vector information storage unit 123 Similarity information storage unit 124 Model information storage unit 130 Control unit 131 Reception unit 132 Acquisition unit 133 Generation unit 134 Output unit

Claims (8)

類似性の判定対象を示す複数の第1クエリと、前記類似性の判定基準を示す複数の第2クエリとを受け付ける受付部と、
前記第2クエリごとに、各第1クエリが示す判定対象を示す対象情報が当該第1クエリとして入力された際の検索意図と、当該第2クエリが示す判定基準を示す基準情報が当該第2クエリとして入力された際の検索意図との類似性を示すスコアに基づいて、前記判定対象と前記判定基準との類似性を示す類似情報を生成する生成部と、
前記生成部によって生成された類似情報を出力する出力部と、
を備え
前記受付部は、
取引対象を示す複数の第1クエリを受け付け、
前記生成部は、
前記類似情報として、前記取引対象に関する情報に応じて異なる色によって、前記スコアの大きさを示す領域が色分けされたグラフに関する情報を生成する
ことを特徴とする情報処理装置。
A reception unit that accepts a plurality of first queries indicating similarity determination targets and a plurality of second queries indicating the similarity determination criteria.
For each of the second queries, the search intention when the target information indicating the determination target indicated by each first query is input as the first query and the reference information indicating the determination criteria indicated by the second query are the second. A generation unit that generates similar information indicating the similarity between the determination target and the determination criterion based on the score indicating the similarity with the search intention when input as a query.
An output unit that outputs similar information generated by the generation unit,
Equipped with a,
The reception department
Accepts multiple first queries that indicate the transaction target,
The generator
As the similar information, the information processing apparatus is characterized in that it generates information on a graph in which a region indicating the size of the score is color-coded with different colors depending on the information on the transaction target.
前記生成部は、
前記対象情報である文字情報に対応する分散表現と前記基準情報である文字情報に対応する分散表現との類似度である前記スコアに基づいて、前記類似情報を生成する
ことを特徴とする請求項に記載の情報処理装置。
The generator
A claim characterized in that the similar information is generated based on the score, which is the degree of similarity between the distributed expression corresponding to the character information which is the target information and the distributed expression corresponding to the character information which is the reference information. The information processing apparatus according to 1.
前記生成部は、
前記類似情報として、前記スコアの大きさを視認可能にしたグラフに関する情報を生成する
前記出力部は、
前記第2クエリごとに、前記生成部によって生成されたグラフに関する情報を出力する
ことを特徴とする請求項またはに記載の情報処理装置。
The generator
As the similar information, the output unit that generates information about a graph that makes the magnitude of the score visible is
The information processing apparatus according to claim 1 or 2 , wherein information about a graph generated by the generation unit is output for each of the second queries.
前記受付部は、
取引対象を示す複数の第1クエリを受け付け、
前記生成部は、
前記類似情報として、前記取引対象の属性に応じて異なる色によって、前記スコアの大きさを示す領域が色分けされたグラフに関する情報を生成する
ことを特徴とする請求項のいずれか一つに記載の情報処理装置。
The reception department
Accepts multiple first queries that indicate the transaction target,
The generator
As the similar information, any one of claims 1 to 3 , wherein the region indicating the size of the score generates information regarding the color-coded graph by different colors according to the attribute of the transaction target. The information processing device described in.
前記受付部は、
取引対象を示す複数の第1クエリを受け付け、
前記生成部は、
前記類似情報として、前記取引対象を取り扱う事業者に応じて異なる色によって、前記スコアの大きさを示す領域が色分けされたグラフに関する情報を生成する
ことを特徴とする請求項のいずれか一つに記載の情報処理装置。
The reception department
Accepts multiple first queries that indicate the transaction target,
The generator
Any of claims 1 to 4 , wherein as the similar information, information on a graph in which a region indicating the size of the score is color-coded by a different color depending on the business operator handling the transaction target is generated. The information processing device described in one.
前記生成部は、
前記第2クエリごとに、前記類似情報と当該第2クエリとが対応付けて表示されるコンテンツを生成する
ことを特徴とする請求項1〜のいずれか一つに記載の情報処理装置。
The generator
The information processing apparatus according to any one of claims 1 to 5 , wherein for each of the second queries, a content displayed in which the similar information and the second query are associated with each other is generated.
コンピュータが実行する情報処理方法であって、
類似性の判定対象を示す複数の第1クエリと、前記類似性の判定基準を示す複数の第2クエリとを受け付ける受付工程と、
前記第2クエリごとに、各第1クエリが示す判定対象を示す対象情報が当該第1クエリとして入力された際の検索意図と、当該第2クエリが示す判定基準を示す基準情報が当該第2クエリとして入力された際の検索意図との類似性を示すスコアに基づいて、前記判定対象と前記判定基準との類似性を示す類似情報を生成する生成工程と、
前記生成工程によって生成された類似情報を出力する出力工程と、
を含み、
前記受付工程は、
取引対象を示す複数の第1クエリを受け付け、
前記生成工程は、
前記類似情報として、前記取引対象に関する情報に応じて異なる色によって、前記スコアの大きさを示す領域が色分けされたグラフに関する情報を生成する
ことを特徴とする情報処理方法。
It is an information processing method executed by a computer.
A reception process that accepts a plurality of first queries indicating similarity determination targets and a plurality of second queries indicating the similarity determination criteria.
For each of the second queries, the search intention when the target information indicating the determination target indicated by each first query is input as the first query and the reference information indicating the determination criteria indicated by the second query are the second. A generation step of generating similar information indicating the similarity between the judgment target and the judgment criterion based on the score showing the similarity with the search intention when input as a query.
An output process that outputs similar information generated by the generation process, and an output process that outputs similar information.
Only including,
The reception process is
Accepts multiple first queries that indicate the transaction target,
The production step is
As the similar information, an information processing method for generating information on a graph in which a region indicating the size of the score is color-coded with different colors depending on the information on the transaction target.
類似性の判定対象を示す複数の第1クエリと、前記類似性の判定基準を示す複数の第2クエリとを受け付ける受付手順と、
前記第2クエリごとに、各第1クエリが示す判定対象を示す対象情報が当該第1クエリとして入力された際の検索意図と、当該第2クエリが示す判定基準を示す基準情報が当該第2クエリとして入力された際の検索意図との類似性を示すスコアに基づいて、前記判定対象と前記判定基準との類似性を示す類似情報を生成する生成手順と、
前記生成手順によって生成された類似情報を出力する出力手順と、
をコンピュータに実行させ
前記受付手順は、
取引対象を示す複数の第1クエリを受け付け、
前記生成手順は、
前記類似情報として、前記取引対象に関する情報に応じて異なる色によって、前記スコアの大きさを示す領域が色分けされたグラフに関する情報を生成する
ことを特徴とする情報処理プログラム。
A reception procedure for accepting a plurality of first queries indicating similarity determination targets and a plurality of second queries indicating the similarity determination criteria.
For each of the second queries, the search intention when the target information indicating the determination target indicated by each first query is input as the first query and the reference information indicating the determination criteria indicated by the second query are the second. A generation procedure for generating similar information indicating the similarity between the judgment target and the judgment criterion based on the score showing the similarity with the search intention when input as a query, and
An output procedure that outputs similar information generated by the above generation procedure,
Let the computer run
The reception procedure is
Accepts multiple first queries that indicate the transaction target,
The generation procedure is
An information processing program characterized in that, as the similar information, information on a graph in which a region indicating the size of the score is color-coded by different colors depending on the information on the transaction target is generated.
JP2019123237A 2019-07-01 2019-07-01 Information processing equipment, information processing methods and information processing programs Active JP6938569B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019123237A JP6938569B2 (en) 2019-07-01 2019-07-01 Information processing equipment, information processing methods and information processing programs

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019123237A JP6938569B2 (en) 2019-07-01 2019-07-01 Information processing equipment, information processing methods and information processing programs

Publications (2)

Publication Number Publication Date
JP2021009573A JP2021009573A (en) 2021-01-28
JP6938569B2 true JP6938569B2 (en) 2021-09-22

Family

ID=74199435

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019123237A Active JP6938569B2 (en) 2019-07-01 2019-07-01 Information processing equipment, information processing methods and information processing programs

Country Status (1)

Country Link
JP (1) JP6938569B2 (en)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4189251B2 (en) * 2003-03-31 2008-12-03 日立ソフトウエアエンジニアリング株式会社 Keyword analysis method and program used therefor
JP5720071B2 (en) * 2011-07-11 2015-05-20 日本電気株式会社 Compound word concept analysis system, method and program
JP6731826B2 (en) * 2016-10-07 2020-07-29 ヤフー株式会社 Extraction device, extraction method, and extraction program

Also Published As

Publication number Publication date
JP2021009573A (en) 2021-01-28

Similar Documents

Publication Publication Date Title
US10713317B2 (en) Conversational agent for search
WO2022022002A1 (en) Information display method, information search method and apparatus
CN109564573A (en) Platform from computer application metadata supports cluster
KR20010007715A (en) Information guiding service system according to a sensitive index and the method thereof
KR20190086126A (en) Manual retrieval service providing server and method using chatbot
US10885081B2 (en) Systems and methods for contextual ranking of search results
JP6679683B2 (en) Information processing apparatus, information processing method, and information processing program
JP7071304B2 (en) Information processing equipment, information processing methods and information processing programs
JP7177013B2 (en) Information processing device, information processing method and information processing program
JP6938569B2 (en) Information processing equipment, information processing methods and information processing programs
JP6852114B2 (en) Specific device, specific method and specific program
JP7188879B2 (en) Provision device, provision method and provision program
JP6982017B2 (en) Information processing equipment, information processing methods and information processing programs
JP6584613B1 (en) Information processing apparatus, information processing method, and information processing program
Rezende et al. Combining natural language processing techniques and algorithms LSA, word2vec and WMD for technological forecasting and similarity analysis in patent documents
JP6728445B1 (en) Extraction device, extraction method, and extraction program
JP6979986B2 (en) Information processing equipment, information processing methods and information processing programs
JP2022010403A (en) Information processing device, information processing method, and information processing program
JP7212086B2 (en) Provision device, provision method and provision program
Haque et al. Doctor Recommendation Based on Patient Syndrome Using Convolutional Neural Network
JP6553793B1 (en) Information processing apparatus, information processing method, and information processing program
JP7413423B2 (en) Information processing system and information processing method
JP2020129193A (en) Information processing device, information processing method, and information processing program
JP7249222B2 (en) Information processing device, information processing method and information processing program
JP2019053682A (en) Information processing apparatus, information processing method, and program

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20191101

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20191108

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200309

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210309

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210507

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210803

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210901

R150 Certificate of patent or registration of utility model

Ref document number: 6938569

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350