JP2021009574A - Information processing device, information processing method, and information processing program - Google Patents

Information processing device, information processing method, and information processing program Download PDF

Info

Publication number
JP2021009574A
JP2021009574A JP2019123238A JP2019123238A JP2021009574A JP 2021009574 A JP2021009574 A JP 2021009574A JP 2019123238 A JP2019123238 A JP 2019123238A JP 2019123238 A JP2019123238 A JP 2019123238A JP 2021009574 A JP2021009574 A JP 2021009574A
Authority
JP
Japan
Prior art keywords
information
clusters
search
cluster
query
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019123238A
Other languages
Japanese (ja)
Other versions
JP7177013B2 (en
Inventor
泰介 森
Taisuke Mori
泰介 森
高昌 澁川
Takamasa Shibukawa
高昌 澁川
知紘 小川
Tomohiro Ogawa
知紘 小川
寺田 幸弘
Yukihiro Terada
幸弘 寺田
朋美 田畑
Tomomi Tabata
朋美 田畑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2019123238A priority Critical patent/JP7177013B2/en
Publication of JP2021009574A publication Critical patent/JP2021009574A/en
Application granted granted Critical
Publication of JP7177013B2 publication Critical patent/JP7177013B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

To obtain useful information.SOLUTION: An information processing device comprises a reception unit, a generation unit, and an output unit. The reception unit accepts a plurality of pieces of object information indicating a classification object, and the number of specified clusters, which is the number of clusters when the plurality of pieces of object information is classified into clusters. The generation unit generates specified cluster information on a cluster generated by classifying the plurality of pieces of object information into clusters of the number of specified cluster. The generation unit outputs the specified cluster information generated by the generation unit.SELECTED DRAWING: Figure 1

Description

本発明は、情報処理装置、情報処理方法及び情報処理プログラムに関する。 The present invention relates to an information processing device, an information processing method, and an information processing program.

近年、インターネットの飛躍的な普及に伴い、例えば、インターネット上の種々の情報を用いた分析に関する技術が提供されている。例えば、ユーザが入力した検索クエリに基づいて、所定の事業者が提供する対象に対するニーズに関する情報を抽出する技術が提案されている。 In recent years, with the rapid spread of the Internet, for example, techniques related to analysis using various information on the Internet have been provided. For example, a technique has been proposed in which information on needs for a target provided by a predetermined business operator is extracted based on a search query entered by a user.

特開2019−32776号公報JP-A-2019-32776

しかしながら、上記の従来技術では、有用な情報を得ることができるとは限らない。例えば、上記の従来技術では、所定の事業者が提供する対象に対するニーズに関する情報を抽出しているに過ぎないので、所定の事業者が提供する対象に対する潜在的なニーズに関する情報を抽出できるとは言えない。 However, it is not always possible to obtain useful information with the above-mentioned prior art. For example, in the above-mentioned prior art, since only the information regarding the needs for the target provided by the predetermined business operator is extracted, it is possible to extract the information regarding the potential needs for the target provided by the predetermined business operator. I can not say.

本願は、上記に鑑みてなされたものであって、有用な情報を提供することができる情報処理装置、情報処理方法及び情報処理プログラムを提供することを目的とする。 The present application has been made in view of the above, and an object of the present application is to provide an information processing device, an information processing method, and an information processing program capable of providing useful information.

本願に係る情報処理装置は、分類対象を示す複数の対象情報と、前記複数の対象情報をクラスタに分類する際のクラスタ数である指定クラスタ数とを受け付ける受付部と、前記複数の対象情報を前記指定クラスタ数のクラスタに分類することにより生成したクラスタに関する指定クラスタ情報を生成する生成部と、前記生成部によって生成された指定クラスタ情報を出力する出力部と、を有することを特徴とする。 The information processing apparatus according to the present application receives a plurality of target information indicating a classification target, a reception unit that receives a specified number of clusters, which is the number of clusters when the plurality of target information is classified into clusters, and the plurality of target information. It is characterized by having a generation unit that generates designated cluster information about clusters generated by classifying the clusters into the specified number of clusters, and an output unit that outputs the designated cluster information generated by the generation unit.

実施形態の一態様によれば、有用な情報を得ることができるといった効果を奏する。 According to one aspect of the embodiment, there is an effect that useful information can be obtained.

図1は、実施形態に係る情報処理の一例を示す図である。FIG. 1 is a diagram showing an example of information processing according to an embodiment. 図2は、実施形態に係る情報処理システムの構成例を示す図である。FIG. 2 is a diagram showing a configuration example of an information processing system according to an embodiment. 図3は、実施形態に係る情報処理装置の構成例を示す図である。FIG. 3 is a diagram showing a configuration example of the information processing device according to the embodiment. 図4は、実施形態に係るクエリ情報記憶部の一例を示す図である。FIG. 4 is a diagram showing an example of the query information storage unit according to the embodiment. 図5は、実施形態に係るベクトル情報記憶部の一例を示す図である。FIG. 5 is a diagram showing an example of a vector information storage unit according to the embodiment. 図6は、実施形態に係るクラスタ情報記憶部の一例を示す図である。FIG. 6 is a diagram showing an example of the cluster information storage unit according to the embodiment. 図7は、実施形態に係るモデル情報記憶部の一例を示す図である。FIG. 7 is a diagram showing an example of a model information storage unit according to the embodiment. 図8は、実施形態に係る端末装置の構成例を示す図である。FIG. 8 is a diagram showing a configuration example of the terminal device according to the embodiment. 図9は、実施形態に係る情報処理手順を示すフローチャートである。FIG. 9 is a flowchart showing an information processing procedure according to the embodiment. 図10は、実施形態に係る第1モデルの生成処理の一例を示す図である。FIG. 10 is a diagram showing an example of the generation process of the first model according to the embodiment. 図11は、実施形態に係る第1モデルの生成処理の一例を示す図である。FIG. 11 is a diagram showing an example of the generation process of the first model according to the embodiment. 図12は、実施形態に係る生成装置の構成例を示す図である。FIG. 12 is a diagram showing a configuration example of the generator according to the embodiment. 図13は、実施形態に係るクエリ情報記憶部の一例を示す図である。FIG. 13 is a diagram showing an example of the query information storage unit according to the embodiment. 図14は、実施形態に係るベクトル情報記憶部の一例を示す図である。FIG. 14 is a diagram showing an example of the vector information storage unit according to the embodiment. 図15は、実施形態に係るモデル情報記憶部の一例を示す図である。FIG. 15 is a diagram showing an example of a model information storage unit according to the embodiment. 図16は、実施形態に係る第1モデルの一例を示す図である。FIG. 16 is a diagram showing an example of the first model according to the embodiment. 図17は、実施形態に係る第1モデルの生成処理手順を示すフローチャートである。FIG. 17 is a flowchart showing a generation processing procedure of the first model according to the embodiment. 図18は、プログラムを実行するコンピュータのハードウェア構成の一例を示す図である。FIG. 18 is a diagram showing an example of the hardware configuration of the computer that executes the program.

以下に、本願に係る情報処理装置、情報処理方法及び情報処理プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る情報処理装置、情報処理方法及び情報処理プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略する。 Hereinafter, the information processing apparatus, the information processing method, and the mode for carrying out the information processing program (hereinafter referred to as “the embodiment”) according to the present application will be described in detail with reference to the drawings. Note that this embodiment does not limit the information processing apparatus, information processing method, and information processing program according to the present application. Further, in each of the following embodiments, the same parts are designated by the same reference numerals, and duplicate description will be omitted.

〔1.情報処理の一例〕
まず、図1を用いて、実施形態に係る情報処理の一例について説明する。図1は、実施形態に係る情報処理の一例を示す図である。実施形態に係る情報処理は、図1に示す情報処理装置100によって行われる。図1に示す情報処理装置100は、クライアント(企業等)に対して、クエリの分析サービスを提供するサーバ装置である。ここで、「クエリ」とは、データベースに対する問い合わせや要求を行うためにユーザによって用いられる語句(文字情報)を指す。例えば、「クエリ」には、ユーザによって検索に用いられる語句である検索クエリが含まれる。なお、本願発明における「クエリ」には、ユーザによってどのように用いられたかとは関係のない単なるキーワードやフレーズといった語句が含まれてもよいものとする。
[1. An example of information processing]
First, an example of information processing according to the embodiment will be described with reference to FIG. FIG. 1 is a diagram showing an example of information processing according to an embodiment. The information processing according to the embodiment is performed by the information processing device 100 shown in FIG. The information processing device 100 shown in FIG. 1 is a server device that provides a query analysis service to a client (company or the like). Here, the "query" refers to a phrase (character information) used by the user to make an inquiry or request to the database. For example, a "query" includes a search query, which is a phrase used by the user for a search. It should be noted that the "query" in the present invention may include words and phrases such as simple keywords and phrases that have nothing to do with how they are used by the user.

図1の説明に先立って、図2を用いて、実施形態に係る情報処理システムの構成について説明する。図2は、実施形態に係る情報処理システムの構成例を示す図である。図2に示すように、情報処理システム1には、端末装置10と、検索サーバ20と、生成装置50と、情報処理装置100とが含まれる。端末装置10と、検索サーバ20と、生成装置50と、情報処理装置100とは所定のネットワークNを介して、有線または無線により通信可能に接続される。なお、図2に示す情報処理システム1には、任意の数の端末装置10と任意の数の検索サーバ20と任意の数の生成装置50と任意の数の情報処理装置100とが含まれてもよい。 Prior to the description of FIG. 1, the configuration of the information processing system according to the embodiment will be described with reference to FIG. FIG. 2 is a diagram showing a configuration example of an information processing system according to an embodiment. As shown in FIG. 2, the information processing system 1 includes a terminal device 10, a search server 20, a generation device 50, and an information processing device 100. The terminal device 10, the search server 20, the generation device 50, and the information processing device 100 are connected to each other via a predetermined network N so as to be communicable by wire or wirelessly. The information processing system 1 shown in FIG. 2 includes an arbitrary number of terminal devices 10, an arbitrary number of search servers 20, an arbitrary number of generation devices 50, and an arbitrary number of information processing devices 100. May be good.

端末装置10は、クライアント(企業等)の担当者である利用者によって使用される情報処理装置である。端末装置10は、例えば、スマートフォンや、タブレット型端末や、ノート型PC(Personal Computer)や、携帯電話機や、PDA(Personal Digital Assistant)等により実現される。図1に示す例では、端末装置10はノート型PCである。なお、以下では、端末装置10を利用者と同一視する場合がある。すなわち、以下では、利用者を端末装置10と読み替えることもできる。 The terminal device 10 is an information processing device used by a user who is in charge of a client (company or the like). The terminal device 10 is realized by, for example, a smartphone, a tablet terminal, a notebook PC (Personal Computer), a mobile phone, a PDA (Personal Digital Assistant), or the like. In the example shown in FIG. 1, the terminal device 10 is a notebook PC. In the following, the terminal device 10 may be equated with the user. That is, in the following, the user can be read as the terminal device 10.

端末装置10は、クライアント(企業等)の担当者である利用者U11の操作に従って、分類対象を示す複数のクエリと、複数のクエリをクラスタに分類する際のクラスタ数である指定クラスタ数とを情報処理装置100に送信する。また、端末装置10は、複数のクエリを指定クラスタ数のクラスタに分類することにより生成したクラスタに関する指定クラスタ情報を情報処理装置100から受信する。端末装置10は、受信した指定クラスタ情報を端末装置10の画面に表示する。図1に示す例では、端末装置10は、受信した指定クラスタ情報を表示する部分コンテンツC12を端末装置10の画面に表示する。 The terminal device 10 determines a plurality of queries indicating the classification target and a designated number of clusters, which is the number of clusters when classifying the plurality of queries into clusters, according to the operation of the user U11 who is in charge of the client (company or the like). It is transmitted to the information processing device 100. Further, the terminal device 10 receives from the information processing device 100 the designated cluster information regarding the clusters generated by classifying the plurality of queries into clusters having a designated number of clusters. The terminal device 10 displays the received designated cluster information on the screen of the terminal device 10. In the example shown in FIG. 1, the terminal device 10 displays the partial content C12 displaying the received designated cluster information on the screen of the terminal device 10.

検索サーバ20は、検索サービスを提供するサーバ装置である。例えば、検索サーバ20が提供する検索サービスは、あらゆる情報を検索可能な総合検索サービスである。検索サーバ20は、利用者によって入力された検索クエリに関する情報を記憶する。具体的には、検索サーバ20は、利用者の検索履歴に関する情報を記憶する。また、検索サーバ20は、生成装置50の要求に応じて、利用者によって入力された検索クエリに関する情報を生成装置50に送信する。 The search server 20 is a server device that provides a search service. For example, the search service provided by the search server 20 is a comprehensive search service capable of searching for any information. The search server 20 stores information about the search query entered by the user. Specifically, the search server 20 stores information regarding the user's search history. Further, the search server 20 transmits information about the search query input by the user to the generation device 50 in response to the request of the generation device 50.

生成装置50は、第1モデルM1を生成するサーバ装置である。生成装置50は、後述する処理を実行することにより、第1モデルM1を生成する。第1モデルM1は、文字情報を入力すると、文字情報(例えば、検索クエリ)の分散表現を出力するモデルである。なお、分散表現は、ベクトルでもよい。ここで、第1モデルM1から出力される文字情報の分散表現には、その文字情報が検索クエリとして入力された際の利用者の検索意図を示す特徴情報が含まれている。また、第1モデルM1から出力される所定の文字情報の分散表現と他の文字情報の分散表現が類似することは、所定の文字情報が検索クエリとして入力された際の利用者の検索意図と他の文字情報が検索クエリとして入力された際の利用者の検索意図とが類似することを意味する。なお、生成装置50による第1モデルの生成処理の詳細については後述する。 The generation device 50 is a server device that generates the first model M1. The generation device 50 generates the first model M1 by executing a process described later. The first model M1 is a model that outputs a distributed representation of character information (for example, a search query) when character information is input. The distributed representation may be a vector. Here, the distributed representation of the character information output from the first model M1 includes feature information indicating the user's search intention when the character information is input as a search query. Further, the similarity between the distributed representation of the predetermined character information output from the first model M1 and the distributed representation of other character information is the search intention of the user when the predetermined character information is input as a search query. It means that the search intention of the user when other character information is input as a search query is similar. The details of the generation process of the first model by the generation device 50 will be described later.

情報処理装置100は、企業等であるクライアントに対して、クライアントが市場分析を所望する分析対象を示すキーワード(文字情報)に関する一般利用者の検索動向を分析するクエリの分析サービスを提供するサーバ装置である。図1に示す例では、情報処理装置100は、分類対象を示す複数のクエリと、複数のクエリをクラスタに分類する際のクラスタ数である指定クラスタ数とを受け付ける。また、情報処理装置100は、複数のクエリを指定クラスタ数のクラスタに分類することにより生成したクラスタに関する指定クラスタ情報を生成する。そして、情報処理装置100は、生成した指定クラスタ情報を出力する。 The information processing device 100 is a server device that provides a query analysis service for a client such as a company to analyze a general user's search trend regarding a keyword (character information) indicating an analysis target that the client desires to analyze the market. Is. In the example shown in FIG. 1, the information processing apparatus 100 accepts a plurality of queries indicating a classification target and a designated number of clusters, which is the number of clusters when the plurality of queries are classified into clusters. Further, the information processing apparatus 100 generates designated cluster information regarding the clusters generated by classifying a plurality of queries into clusters having a designated number of clusters. Then, the information processing device 100 outputs the generated designated cluster information.

一般的に、クエリの分析サービスでは、企業等であるクライアントから、クライアントが市場分析を所望する分析対象を示すキーワード(文字情報)を受け付ける。そして、クエリの分析サービスは、膨大なクエリのデータベースの中から、指定されたキーワードと類似するクエリに関する情報を抽出し、抽出したクエリに関する情報をクライアントに対して提供する。例えば、クエリの分析サービスは、指定されたキーワードとクエリとの類似性を数値によって把握するため、クエリに対応する文字列やクライアントによって指定されたキーワードを分散表現に変換する。そして、クエリの分析サービスは、指定されたキーワードを変換した分散表現とクエリに対応する文字列を変換した分散表現との類似度を算出することで、指定されたキーワードと類似するクエリに関する情報を抽出する。 Generally, the query analysis service accepts keywords (character information) indicating an analysis target that the client wants to analyze the market from a client such as a company. Then, the query analysis service extracts information on queries similar to the specified keyword from a huge database of queries, and provides the client with information on the extracted queries. For example, the query analysis service converts the character string corresponding to the query and the keyword specified by the client into a distributed expression in order to grasp the similarity between the specified keyword and the query numerically. Then, the query analysis service calculates the similarity between the distributed expression obtained by converting the specified keyword and the distributed expression obtained by converting the character string corresponding to the query, and obtains information about the query similar to the specified keyword. Extract.

ここで、クエリの分析サービスが保有するデータベースには、膨大な数のクエリが存在するため、クエリに対応する文字列を変換した分散表現の数も膨大な数になる。また、一般的に、文字列を変換した分散表現は、高次元のベクトル(例えば、何百次元や何千次元のベクトル)であることが一般的である。すなわち、クエリの分析サービスを提供する装置が指定されたキーワードと類似するクエリの分析結果に関する情報を単に抽出して提供するだけでは、分析結果に関する情報の提供を受けたクライアントが有用な情報を得ることは難しい。例えば、クライアントに対して提供される情報が、多数の高次元の分散表現を分散表現空間にマッピングした状態で提供された場合や、分散表現間の類似度を示す膨大な数のデータを羅列した状態で提供された場合には、情報量が多く、クライアントが分析結果を一見して把握することは難しい。そのため、提供された情報からクライアントが有用な情報を得ることは難しい。 Here, since the database owned by the query analysis service has a huge number of queries, the number of distributed representations obtained by converting the character strings corresponding to the queries is also huge. Also, in general, the distributed representation obtained by converting a character string is generally a high-dimensional vector (for example, a vector having hundreds or thousands of dimensions). That is, if the device that provides the query analysis service simply extracts and provides the information on the analysis result of the query similar to the specified keyword, the client who receives the information on the analysis result obtains useful information. It's difficult. For example, when the information provided to the client is provided with a large number of high-dimensional distributed representations mapped to the distributed representation space, or a huge amount of data showing the similarity between the distributed representations is listed. When provided in a state, the amount of information is large and it is difficult for the client to grasp the analysis result at a glance. Therefore, it is difficult for the client to obtain useful information from the provided information.

そこで、本願発明に係る情報処理装置100は、分類対象を示す複数の対象情報と、複数の対象情報をクラスタに分類する際のクラスタ数である指定クラスタ数とを受け付ける。また、情報処理装置100は、複数の対象情報を指定クラスタ数のクラスタに分類することにより生成したクラスタに関する指定クラスタ情報を生成する。そして、情報処理装置100は、生成した指定クラスタ情報を出力する。本願発明に係る情報処理装置100は、例えば、分類対象を示す100個の対象情報と、指定クラスタ数「5」とを受け付けたとする。この場合、本願発明に係る情報処理装置100は、分類対象を示す100個の対象情報を、類似する特徴を持つ対象情報の5つのクラスタに分けることができる。すなわち、本願発明に係る情報処理装置100は、100個の対象情報から、100個の対象情報の特徴の要約とも言える5つのクラスタ情報を抽出可能とする。そして、本願発明に係る情報処理装置100は、100個の対象情報の特徴を5つのクラスタ情報に要約して提供可能とする。このように、本願発明に係る情報処理装置100は、分類対象を示す多数の対象情報の特徴を少ない情報量の要約にまとめて提供可能とする。したがって、本願発明に係る情報処理装置100は、有用な情報を得ることができる。 Therefore, the information processing apparatus 100 according to the present invention accepts a plurality of target information indicating a classification target and a designated number of clusters, which is the number of clusters when the plurality of target information is classified into clusters. Further, the information processing apparatus 100 generates designated cluster information regarding the clusters generated by classifying the plurality of target information into clusters having a designated number of clusters. Then, the information processing device 100 outputs the generated designated cluster information. It is assumed that the information processing apparatus 100 according to the present invention has received, for example, 100 target information indicating a classification target and a designated number of clusters "5". In this case, the information processing apparatus 100 according to the present invention can divide 100 target information indicating a classification target into five clusters of target information having similar characteristics. That is, the information processing apparatus 100 according to the present invention can extract five cluster information, which can be said to be a summary of the features of the 100 target information, from the 100 target information. Then, the information processing apparatus 100 according to the present invention can provide the features of 100 target information in a summary of five cluster information. As described above, the information processing apparatus 100 according to the present invention can provide the features of a large number of target information indicating the classification target in a summary of a small amount of information. Therefore, the information processing apparatus 100 according to the present invention can obtain useful information.

ここから、図1を用いて、情報処理の流れについて説明する。図1では、情報処理装置100は、端末装置10の要求に応じて、コンテンツC1の部分コンテンツC11を端末装置10に送信する。具体的には、情報処理装置100は、クラスタ数を入力可能な入力フィールドF11と、複数のクエリを入力可能な入力フィールドF12と、入力フィールドに入力された情報を情報処理装置100に送信する送信ボタンB11とを含む部分コンテンツC11を端末装置10に送信する。 From here, the flow of information processing will be described with reference to FIG. In FIG. 1, the information processing device 100 transmits the partial content C11 of the content C1 to the terminal device 10 in response to the request of the terminal device 10. Specifically, the information processing device 100 transmits the input field F11 capable of inputting the number of clusters, the input field F12 capable of inputting a plurality of queries, and the information input in the input fields to the information processing device 100. The partial content C11 including the button B11 is transmitted to the terminal device 10.

端末装置10は、コンテンツC1の部分コンテンツC11を情報処理装置100から受信する。端末装置10は、部分コンテンツC11を受信すると、受信した部分コンテンツC11を端末装置10の画面に表示する。 The terminal device 10 receives the partial content C11 of the content C1 from the information processing device 100. When the terminal device 10 receives the partial content C11, the terminal device 10 displays the received partial content C11 on the screen of the terminal device 10.

端末装置10の利用者U11は、端末装置10の画面に表示された部分コンテンツC11に含まれる入力フィールドF11にクラスタ数を入力する操作を行う。図1に示す例では、利用者U11は、クラスタ数「3」(クラスタ数CN)を入力フィールドF11に入力する操作を行う。 The user U11 of the terminal device 10 performs an operation of inputting the number of clusters in the input field F11 included in the partial content C11 displayed on the screen of the terminal device 10. In the example shown in FIG. 1, the user U11 performs an operation of inputting the number of clusters “3” (number of clusters CN) into the input field F11.

また、端末装置10の利用者U11は、端末装置10の画面に表示された部分コンテンツC11に含まれる入力フィールドF12に複数のクエリを入力する操作を行う。図1に示す例では、利用者U11は、12個のクエリQ1-1〜Q1-12を入力フィールドF12に入力する操作を行う。具体的には、利用者U11は、区切り文字で区切られた各文字列をそれぞれ一つのクエリとして入力フィールドF12に入力する操作を行う。例えば、自動車メーカー#1の担当者である利用者U11は、自社(自動車メーカー#1)の商品である6種類の自動車の名称を示す6つのクエリ「車種T11」(クエリQ1-1)、クエリ「車種T12」(クエリQ1-2)、クエリ「車種T13」(クエリQ1-3)、クエリ「車種T14」(クエリQ1-4)、クエリ「車種T15」(クエリQ1-5)、クエリ「車種T16」(クエリQ1-6)を入力フィールドF12に入力する操作を行う。また、利用者U11は、競合他社である自動車メーカー#2の商品である6種類の自動車の名称を示す6つのクエリ「車種T21」(クエリQ1-7)、クエリ「車種T22」(クエリQ1-8)、クエリ「車種T23」(クエリQ1-9)、クエリ「車種T24」(クエリQ1-10)、クエリ「車種T25」(クエリQ1-11)、クエリ「車種T26」(クエリQ1-12)を入力フィールドF12に入力する操作を行う。 Further, the user U11 of the terminal device 10 performs an operation of inputting a plurality of queries into the input field F12 included in the partial content C11 displayed on the screen of the terminal device 10. In the example shown in FIG. 1, the user U11 performs an operation of inputting 12 queries Q1-1 to Q1-12 into the input field F12. Specifically, the user U11 performs an operation of inputting each character string separated by a delimiter into the input field F12 as one query. For example, the user U11, who is in charge of the automobile manufacturer # 1, has six queries "vehicle type T11" (query Q1-1) indicating the names of six types of automobiles that are products of the company (automobile manufacturer # 1). "Vehicle type T12" (query Q1-2), query "vehicle type T13" (query Q1-3), query "vehicle type T14" (query Q1-4), query "vehicle type T15" (query Q1-5), query "vehicle type" The operation of inputting "T16" (query Q1-6) into the input field F12 is performed. In addition, the user U11 uses six queries "vehicle type T21" (query Q1-7) and a query "vehicle type T22" (query Q1-) indicating the names of six types of vehicles that are products of competitor automobile manufacturer # 2. 8), query "vehicle type T23" (query Q1-9), query "vehicle type T24" (query Q1-10), query "vehicle type T25" (query Q1-11), query "vehicle type T26" (query Q1-12) Is input to the input field F12.

続いて、端末装置10の利用者U11は、端末装置10の画面に表示された部分コンテンツC11に含まれる送信ボタンB11を選択する操作を行う。端末装置10は、利用者U11の操作に従って送信ボタンB11が選択されると、入力フィールドF11に入力されたクラスタ数「3」と、入力フィールドF12に入力された12個のクエリQ1-1〜Q1-12を情報処理装置100に送信する。 Subsequently, the user U11 of the terminal device 10 performs an operation of selecting the transmission button B11 included in the partial content C11 displayed on the screen of the terminal device 10. When the transmission button B11 is selected according to the operation of the user U11, the terminal device 10 has the number of clusters "3" input in the input field F11 and the 12 queries Q1-1 to Q1 input in the input field F12. -12 is transmitted to the information processing device 100.

情報処理装置100は、クラスタ数「3」と12個のクエリQ1-1〜Q1-12を利用者U11から受け付ける。具体的には、情報処理装置100は、クラスタ数「3」と12個のクエリQ1-1〜Q1-12を端末装置10から受信する。 The information processing device 100 receives the number of clusters "3" and 12 queries Q1-1 to Q1-12 from the user U11. Specifically, the information processing device 100 receives the number of clusters "3" and 12 queries Q1-1 to Q1-12 from the terminal device 10.

情報処理装置100は、クラスタ数「3」と12個のクエリQ1-1〜Q1-12を受け付けると、第1モデルM1を用いて生成されたクエリQ1-1〜Q1-12の分散表現QV1-1〜QV1-12(図5参照)を取得する。続いて、情報処理装置100は、分散表現QV1-1〜QV1-12を取得すると、取得した分散表現QV1-1〜QV1-12をk−means法を用いてクラスタ数「3」のクラスタに分類する。なお、情報処理装置100は、取得した分散表現QV1-1〜QV1-12をクラスタ数「3」のクラスタに分類可能であれば、k−means法に限らず、どのようなクラスタリング手法を用いてもよい。 When the information processing device 100 receives the number of clusters "3" and 12 queries Q1-1 to Q1-12, the distributed representation QV1- of the queries Q1-1 to Q1-12 generated using the first model M1. Obtain 1 to QV1-12 (see FIG. 5). Subsequently, when the information processing apparatus 100 acquires the distributed expressions QV1-1 to QV1-12, the acquired distributed expressions QV1-1 to QV1-12 are classified into clusters having the number of clusters "3" by using the k-means method. To do. The information processing apparatus 100 uses any clustering method, not limited to the k-means method, as long as the acquired distributed representations QV1-1 to QV1-12 can be classified into clusters having the number of clusters "3". May be good.

また、情報処理装置100は、クエリQ1-1〜Q1-12に対応する分散表現QV1-1〜QV1-12をクラスタ数「3」のクラスタに分類することによって、各分散表現に対応する各クエリをクラスタ数「3」のクラスタに分類する。このように、情報処理装置100は、各分散表現に対応する各クエリをクラスタ数「3」のクラスタに分類することにより、各クエリが分類されるクラスタに関するクラスタ情報を生成する。 Further, the information processing apparatus 100 classifies the distributed expressions QV1-1 to QV1-12 corresponding to the queries Q1-1 to Q1-12 into clusters having the number of clusters "3", and thereby each query corresponding to each distributed expression. Is classified into clusters with the number of clusters "3". In this way, the information processing apparatus 100 classifies each query corresponding to each distributed representation into clusters having the number of clusters "3", thereby generating cluster information regarding the cluster into which each query is classified.

例えば、情報処理装置100は、分散表現QV1-1と分散表現QV1-2と分散表現QV1-3と分散表現QV1-7と分散表現QV1-8を一つのクラスタ(クラスタCL1)に分類する。情報処理装置100は、分散表現QV1-1をクラスタCL1に分類したので、分散表現QV1-1に対応するクエリQ1-1をクラスタCL1に分類する。また、情報処理装置100は、分散表現QV1-2をクラスタCL1に分類したので、分散表現QV1-2に対応するクエリQ1-2をクラスタCL1に分類する。同様に、情報処理装置100は、分散表現QV1-3と分散表現QV1-7と分散表現QV1-8をクラスタCL1に分類したので、分散表現QV1-3に対応するクエリQ1-3と分散表現QV1-7に対応するクエリQ1-7と分散表現QV1-8に対応するクエリQ1-8をクラスタCL1に分類する。このようにして、情報処理装置100は、クエリQ1-1とクエリQ1-2とクエリQ1-3とクエリQ1-7とクエリQ1-8が分類されるクラスタCL1に関するクラスタ情報を生成する。 For example, the information processing apparatus 100 classifies the distributed representation QV1-1, the distributed representation QV1-2, the distributed representation QV1-3, the distributed representation QV1-7, and the distributed representation QV1-8 into one cluster (cluster CL1). Since the information processing apparatus 100 has classified the distributed expression QV1-1 into the cluster CL1, the query Q1-1 corresponding to the distributed expression QV1-1 is classified into the cluster CL1. Further, since the information processing apparatus 100 classifies the distributed expression QV1-2 into the cluster CL1, the query Q1-2 corresponding to the distributed expression QV1-2 is classified into the cluster CL1. Similarly, since the information processing apparatus 100 classifies the distributed representation QV1-3, the distributed representation QV1-7, and the distributed representation QV1-8 into the cluster CL1, the queries Q1-3 and the distributed representation QV1 corresponding to the distributed representation QV1-3. Query Q1-7 corresponding to -7 and query Q1-8 corresponding to the distributed representation QV1-8 are classified into cluster CL1. In this way, the information processing apparatus 100 generates cluster information regarding the cluster CL1 in which the query Q1-1, the query Q1-2, the query Q1-3, the query Q1-7, and the query Q1-8 are classified.

ここで、第1モデルM1を用いて生成された文字情報の分散表現には、その文字情報が検索クエリとして入力された際の利用者の検索意図を示す特徴情報が含まれている。例えば、クエリQ1-1の分散表現QV1-1には、クエリQ1-1に対応する文字情報「車種T11」が検索クエリとして入力された際の利用者の検索意図を示す特徴情報が含まれている。また、クエリQ1-2の分散表現QV1-2には、クエリQ1-2に対応する文字情報「車種T12」が検索クエリとして入力された際の利用者の検索意図を示す特徴情報が含まれている。 Here, the distributed representation of the character information generated by using the first model M1 includes feature information indicating the user's search intention when the character information is input as a search query. For example, the distributed expression QV1-1 of the query Q1-1 includes feature information indicating the user's search intention when the character information "vehicle type T11" corresponding to the query Q1-1 is input as a search query. There is. Further, the distributed expression QV1-2 of the query Q1-2 includes feature information indicating the user's search intention when the character information "vehicle type T12" corresponding to the query Q1-2 is input as a search query. There is.

また、第1モデルM1から出力される所定の文字情報の分散表現と他の文字情報の分散表現が類似することは、所定の文字情報が検索クエリとして入力された際の利用者の検索意図と他の文字情報が検索クエリとして入力された際の利用者の検索意図とが類似することを意味する。例えば、文字情報「車種T11」の分散表現QV1-1と文字情報「車種T12」の分散表現QV1-2とが類似することは、文字情報「車種T11」が検索クエリとして入力された際の利用者の検索意図と文字情報「車種T12」が検索クエリとして入力された際の利用者の検索意図とが類似することを意味する。 Further, the similarity between the distributed representation of the predetermined character information output from the first model M1 and the distributed representation of other character information is the search intention of the user when the predetermined character information is input as a search query. It means that the search intention of the user when other character information is input as a search query is similar. For example, the similarity between the distributed expression QV1-1 of the character information "vehicle type T11" and the distributed expression QV1-2 of the character information "vehicle type T12" is used when the character information "vehicle type T11" is input as a search query. It means that the search intention of the user and the search intention of the user when the character information "vehicle type T12" is input as a search query are similar.

また、一般的に、k−means法等のクラスタリング法を用いて同一のクラスタに分類されるデータ同士は、類似する特徴を有する。例えば、k−means法を用いて同一のクラスタに分類されるベクトル同士は、類似する特徴を有する。したがって、本願発明において、例えば、k−means法を用いて分散表現QV1-1と分散表現QV1-2とが一つのクラスタ(クラスタCL1)に分類されることは、分散表現QV1-1に対応する文字情報「車種T11」が検索クエリとして入力された際の利用者の検索意図と、分散表現QV1-2に対応する文字情報「車種T12」が検索クエリとして入力された際の利用者の検索意図とが類似することを意味する。このように、本願発明において、同一のクラスタに分類される分散表現に対応する文字情報(例えば、クエリ)同士は、検索クエリとして入力された際の利用者の検索意図が類似する。例えば、同一のクラスタCL1に分類されたクエリQ1-1とクエリQ1-2とクエリQ1-3とクエリQ1-7とクエリQ1-8は、検索クエリとして入力された際の利用者の検索意図が互いに類似する。すなわち、情報処理装置100、複数のクエリを、各クエリが検索クエリとして入力された際の利用者の検索意図に応じた指定クラスタ数のクラスタに分類することができる。 Further, in general, data classified into the same cluster using a clustering method such as the k-means method have similar characteristics. For example, vectors classified into the same cluster using the k-means method have similar characteristics. Therefore, in the present invention, for example, the fact that the distributed representation QV1-1 and the distributed representation QV1-2 are classified into one cluster (cluster CL1) by using the k-means method corresponds to the distributed representation QV1-1. The user's search intention when the character information "vehicle type T11" is input as a search query, and the user's search intention when the character information "vehicle type T12" corresponding to the distributed expression QV1-2 is input as a search query. Means similar to. As described above, in the present invention, the character information (for example, the query) corresponding to the distributed representation classified into the same cluster has a similar search intention of the user when input as a search query. For example, the query Q1-1, the query Q1-2, the query Q1-3, the query Q1-7, and the query Q1-8 classified into the same cluster CL1 have the search intention of the user when they are input as a search query. Similar to each other. That is, the information processing device 100 and a plurality of queries can be classified into clusters having a specified number of clusters according to the user's search intention when each query is input as a search query.

なお、同じ複数のクエリであっても、検索意図に応じたクラスタリングと、通常のクラスタリングとでは、分類されるクラスタが異なる場合がある。例えば、「車種T11」と「車種T14」がスポーツカーであり、「車種T12」と「車種T15」がファミリーワゴン車であり、「車種T13」と「車種T16」が軽自動車であるとする。この場合、通常のクラスタリングであれば、スポーツカーである「車種T11」と「車種T14」、ファミリーワゴン車である「車種T12」と「車種T15」、軽自動車である「車種T13」と「車種T16」は、それぞれ車種が同一であるので、同一のクラスタに分類されることがある。しかしながら、本願発明におけるように、検索意図に応じたクラスタリングでは、必ずしも車種が同一であるから、同一のクラスタに分類されるとは限らず、また、異なる車種であっても同一のクラスタに分類される場合がある。例えば、スポーツカーである「車種T11」とファミリーワゴン車である「車種T12」と軽自動車である「車種T13」とが検索クエリとして入力された際の利用者の検索意図が互いに類似する場合には、異なる車種同士であっても同一のクラスタCL1に分類される。また、スポーツカーである「車種T14」とファミリーワゴン車である「車種T15」と軽自動車である「車種T16」とが検索クエリとして入力された際の利用者の検索意図が互いに類似する場合には、異なる車種同士であっても同一のクラスタCL2に分類される。このように、情報処理装置100は、検索意図に応じたクラスタリングを可能とするため、検索意図に応じたクラスタリングに基づく新たな知見を得ることができる。 Even for the same plurality of queries, the clusters classified according to the search intention and the normal clustering may be different. For example, assume that "vehicle type T11" and "vehicle type T14" are sports cars, "vehicle type T12" and "vehicle type T15" are family wagon vehicles, and "vehicle type T13" and "vehicle type T16" are light vehicles. In this case, in the case of normal clustering, the sports cars "vehicle type T11" and "vehicle type T14", the family wagon vehicles "vehicle type T12" and "vehicle type T15", and the light vehicles "vehicle type T13" and "vehicle type" Since the vehicle types of "T16" are the same, they may be classified into the same cluster. However, as in the present invention, in clustering according to the search intention, since the vehicle types are not necessarily the same, they are not always classified into the same cluster, and even different vehicle types are classified into the same cluster. May occur. For example, when the search intentions of the users when the sports car "vehicle type T11", the family wagon vehicle "vehicle type T12", and the light vehicle "vehicle type T13" are input as search queries are similar to each other. Is classified into the same cluster CL1 even if they are different vehicle types. In addition, when the search intentions of the users when the sports car "vehicle type T14", the family wagon vehicle "vehicle type T15", and the light vehicle "vehicle type T16" are input as search queries are similar to each other. Is classified into the same cluster CL2 even if they are different vehicle types. As described above, since the information processing apparatus 100 enables clustering according to the search intention, new knowledge based on the clustering according to the search intention can be obtained.

また、情報処理装置100は、分散表現QV1-4と分散表現QV1-5と分散表現QV1-6と分散表現QV1-9と分散表現QV1-10をクラスタCL1とは異なる一つのクラスタ(クラスタCL2)に分類する。情報処理装置100は、分散表現QV1-4をクラスタCL2に分類したので、分散表現QV1-4に対応するクエリQ1-4をクラスタCL2に分類する。また、情報処理装置100は、分散表現QV1-5をクラスタCL2に分類したので、分散表現QV1-5に対応するクエリQ1-5をクラスタCL2に分類する。同様に、情報処理装置100は、分散表現QV1-6と分散表現QV1-9と分散表現QV1-10をクラスタCL2に分類したので、分散表現QV1-6に対応するクエリQ1-6と分散表現QV1-9に対応するクエリQ1-9と分散表現QV1-10に対応するクエリQ1-10をクラスタCL2に分類する。このようにして、情報処理装置100は、クエリQ1-4とクエリQ1-5とクエリQ1-6とクエリQ1-9とクエリQ1-10が分類されるクラスタCL2に関するクラスタ情報を生成する。また、同一のクラスタCL2に分類されたクエリQ1-4とクエリQ1-5とクエリQ1-6とクエリQ1-9とクエリQ1-10は、検索クエリとして入力された際の利用者の検索意図が互いに類似する。 Further, the information processing apparatus 100 uses one cluster (cluster CL2) in which the distributed representation QV1-4, the distributed representation QV1-5, the distributed representation QV1-6, the distributed representation QV1-9, and the distributed representation QV1-10 are different from the cluster CL1. Classify into. Since the information processing apparatus 100 has classified the distributed expression QV1-4 into the cluster CL2, the query Q1-4 corresponding to the distributed expression QV1-4 is classified into the cluster CL2. Further, since the information processing apparatus 100 classifies the distributed expression QV1-5 into the cluster CL2, the query Q1-5 corresponding to the distributed expression QV1-5 is classified into the cluster CL2. Similarly, since the information processing apparatus 100 classifies the distributed representation QV1-6, the distributed representation QV1-9, and the distributed representation QV1-10 into the cluster CL2, the queries Q1-6 and the distributed representation QV1 corresponding to the distributed representation QV1-6 Queries Q1-9 corresponding to -9 and queries Q1-10 corresponding to the distributed representation QV1-10 are classified into cluster CL2. In this way, the information processing apparatus 100 generates cluster information regarding the cluster CL2 in which the query Q1-4, the query Q1-5, the query Q1-6, the query Q1-9, and the query Q1-10 are classified. Further, the query Q1-4, the query Q1-5, the query Q1-6, the query Q1-9, and the query Q1-10 classified into the same cluster CL2 have the search intention of the user when they are input as a search query. Similar to each other.

また、情報処理装置100は、分散表現QV1-11と分散表現QV1-12をクラスタCL1およびクラスタCL2とは異なる一つのクラスタ(クラスタCL3)に分類する。情報処理装置100は、分散表現QV1-11をクラスタCL3に分類したので、分散表現QV1-11に対応するクエリQ1-11をクラスタCL3に分類する。また、情報処理装置100は、分散表現QV1-12をクラスタCL3に分類したので、分散表現QV1-12に対応するクエリQ1-12をクラスタCL3に分類する。このようにして、情報処理装置100は、クエリQ1-11とクエリQ1-12が分類されるクラスタCL3に関するクラスタ情報を生成する。また、同一のクラスタCL3に分類されたクエリQ1-11とクエリQ1-12は、検索クエリとして入力された際の利用者の検索意図が互いに類似する。 Further, the information processing apparatus 100 classifies the distributed representation QV1-11 and the distributed representation QV1-12 into one cluster (cluster CL3) different from the cluster CL1 and the cluster CL2. Since the information processing apparatus 100 has classified the distributed representation QV1-11 into the cluster CL3, the query Q1-11 corresponding to the distributed representation QV1-11 is classified into the cluster CL3. Further, since the information processing apparatus 100 classifies the distributed expression QV1-12 into the cluster CL3, the query Q1-12 corresponding to the distributed expression QV1-12 is classified into the cluster CL3. In this way, the information processing apparatus 100 generates cluster information regarding the cluster CL3 in which the queries Q1-11 and the queries Q1-12 are classified. Further, the queries Q1-11 and the queries Q1-12 classified into the same cluster CL3 have similar search intentions of the users when they are input as search queries.

ここで、情報処理装置100によるクラスタリング結果の解釈についての一例を説明する。例えば、クラスタCL1には、自動車メーカー#1の商品名を示すクエリ(「車種T11」、「車種T12」、「車種T13」)と、自動車メーカー#2の商品名を示すクエリ(「車種T21」、「車種T22」)の両方が含まれている。また、クラスタCL2にも、自動車メーカー#1の商品名を示すクエリ(「車種T14」、「車種T15」、「車種T16」)と、自動車メーカー#2の商品名を示すクエリ(「車種T23」、「車種T24」)の両方が含まれている。一方、クラスタCL3には、自動車メーカー#1の商品名を示すクエリは含まれておらず、自動車メーカー#2の商品名を示すクエリ(「車種T25」、「車種T26」)のみが含まれている。これらの結果から、自動車メーカー#1の商品には、クラスタCL3に対応する検索意図で検索された商品に該当する商品が存在しないことがわかる。これにより、例えば、自動車メーカー#1は、クラスタCL3に対応する検索意図で検索される商品に関して、自動車メーカー#2と比べて市場における弱みがあるという分析結果を得ることができる。また、分析結果を得た自動車メーカー#1は、分析結果を、クラスタCL3に対応する検索意図で検索される商品開発を進める等のマーケティング方針に役立てることができる。このように、情報処理装置100は、クライアントに対して、利用者の検索意図を反映した市場分析に関する情報を提供可能とする。例えば、情報処理装置100は、利用者の検索意図を反映した市場における自社(他社)の弱みや強みに関する知見を提供可能とする。 Here, an example of interpretation of the clustering result by the information processing apparatus 100 will be described. For example, the cluster CL1 includes a query indicating the product name of the automobile manufacturer # 1 ("vehicle type T11", "vehicle type T12", "vehicle type T13") and a query indicating the product name of the automobile manufacturer # 2 ("vehicle type T21"). , "Vehicle type T22") are included. In addition, a query indicating the product name of the automobile manufacturer # 1 ("vehicle type T14", "vehicle type T15", "vehicle type T16") and a query indicating the product name of the automobile manufacturer # 2 ("vehicle type T23") are also sent to the cluster CL2. , "Vehicle type T24") are included. On the other hand, the cluster CL3 does not include a query indicating the product name of the automobile manufacturer # 1, but includes only a query indicating the product name of the automobile manufacturer # 2 ("vehicle type T25", "vehicle type T26"). There is. From these results, it can be seen that there is no product corresponding to the product searched with the search intention corresponding to the cluster CL3 in the product of the automobile manufacturer # 1. As a result, for example, the automobile manufacturer # 1 can obtain an analysis result that the product searched with the search intention corresponding to the cluster CL3 has a weakness in the market as compared with the automobile manufacturer # 2. In addition, the automobile manufacturer # 1 that has obtained the analysis result can use the analysis result for marketing policies such as promoting the development of products that are searched with the search intention corresponding to the cluster CL3. In this way, the information processing device 100 makes it possible to provide the client with information regarding market analysis that reflects the user's search intention. For example, the information processing apparatus 100 can provide knowledge about the weaknesses and strengths of the company (other companies) in the market that reflects the user's search intention.

続いて、情報処理装置100は、3つのクラスタCL1〜CL3に関するクラスタ情報を生成すると、生成した3つのクラスタCL1〜CL3に関するクラスタ情報を端末装置10に送信する。端末装置10は、3つのクラスタCL1〜CL3に関するクラスタ情報を取得すると、コンテンツC1の部分コンテンツC12に含まれる表示領域F21〜F23のそれぞれにクラスタCL1〜CL3に関するクラスタ情報が表示されるように画面の表示を制御する。 Subsequently, when the information processing apparatus 100 generates the cluster information regarding the three clusters CL1 to CL3, the information processing apparatus 100 transmits the cluster information regarding the generated three clusters CL1 to CL3 to the terminal apparatus 10. When the terminal device 10 acquires the cluster information related to the three clusters CL1 to CL3, the terminal device 10 displays the cluster information related to the clusters CL1 to CL3 in each of the display areas F21 to F23 included in the partial content C12 of the content C1. Control the display.

例えば、情報処理装置100は、クラスタCL1に関するクラスタ情報が表示される表示領域F21の上方にクラスタCL1の名称「クラスタ1」が表示されるように画面の表示を制御する。また、情報処理装置100は、クラスタCL2に関するクラスタ情報が表示される表示領域F22の上方にクラスタCL2の名称「クラスタ2」が表示されるように画面の表示を制御する。また、情報処理装置100は、クラスタCL3に関するクラスタ情報が表示される表示領域F23の上方にクラスタCL3の名称「クラスタ3」が表示されるように画面の表示を制御する。 For example, the information processing apparatus 100 controls the display of the screen so that the name "cluster 1" of the cluster CL1 is displayed above the display area F21 in which the cluster information regarding the cluster CL1 is displayed. Further, the information processing apparatus 100 controls the display of the screen so that the name "cluster 2" of the cluster CL2 is displayed above the display area F22 in which the cluster information regarding the cluster CL2 is displayed. Further, the information processing apparatus 100 controls the display of the screen so that the name "cluster 3" of the cluster CL3 is displayed above the display area F23 in which the cluster information regarding the cluster CL3 is displayed.

上述したように、情報処理装置100は、分類対象を示す複数の対象情報と、複数の対象情報をクラスタに分類する際のクラスタ数である指定クラスタ数とを受け付ける。また、情報処理装置100は、複数の対象情報を指定クラスタ数のクラスタに分類することにより生成したクラスタに関する指定クラスタ情報を生成する。そして、情報処理装置100は、生成した指定クラスタ情報を出力する。これにより、情報処理装置100は、分類対象を示す多数の対象情報から、多数の対象情報の特徴の要約とも言える指定クラスタ数のクラスタ情報を抽出可能とする。そして、情報処理装置100は、多数の対象情報の特徴を指定クラスタ数のクラスタ情報に要約して提供可能とする。このように、情報処理装置100は、分類対象を示す多数の対象情報の特徴を少ない情報量の要約にまとめて提供可能とする。したがって、情報処理装置100は、有用な情報を得ることができる。 As described above, the information processing apparatus 100 receives a plurality of target information indicating the classification target and a designated number of clusters which is the number of clusters when the plurality of target information is classified into clusters. Further, the information processing apparatus 100 generates designated cluster information regarding the clusters generated by classifying the plurality of target information into clusters having a designated number of clusters. Then, the information processing device 100 outputs the generated designated cluster information. As a result, the information processing apparatus 100 can extract cluster information of a specified number of clusters, which can be said to be a summary of the features of a large number of target information, from a large number of target information indicating classification targets. Then, the information processing apparatus 100 can summarize the features of a large number of target information into cluster information of a specified number of clusters and provide the information. As described above, the information processing apparatus 100 can provide the features of a large number of target information indicating the classification target in a summary of a small amount of information. Therefore, the information processing device 100 can obtain useful information.

〔2.情報処理装置の構成〕
次に、図3を用いて、実施形態に係る情報処理装置100の構成について説明する。図3は、実施形態に係る情報処理装置100の構成例を示す図である。図3に示すように、情報処理装置100は、通信部110と、記憶部120と、制御部130とを有する。なお、情報処理装置100は、情報処理装置100の管理者等から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を表示させるための表示部(例えば、液晶ディスプレイ等)を有してもよい。
[2. Information processing device configuration]
Next, the configuration of the information processing apparatus 100 according to the embodiment will be described with reference to FIG. FIG. 3 is a diagram showing a configuration example of the information processing device 100 according to the embodiment. As shown in FIG. 3, the information processing device 100 includes a communication unit 110, a storage unit 120, and a control unit 130. The information processing device 100 includes an input unit (for example, a keyboard, a mouse, etc.) that receives various operations from the administrator of the information processing device 100, and a display unit (for example, a liquid crystal display, etc.) for displaying various information. You may have.

(通信部110)
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部110は、ネットワークと有線または無線で接続され、例えば、端末装置10と検索サーバ20と生成装置50との間で情報の送受信を行う。
(Communication unit 110)
The communication unit 110 is realized by, for example, a NIC (Network Interface Card) or the like. Then, the communication unit 110 is connected to the network by wire or wirelessly, and for example, information is transmitted / received between the terminal device 10, the search server 20, and the generation device 50.

(記憶部120)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。記憶部120は、図3に示すように、クエリ情報記憶部121とベクトル情報記憶部122とクラスタ情報記憶部123とモデル情報記憶部124を有する。
(Memory unit 120)
The storage unit 120 is realized by, for example, a semiconductor memory element such as a RAM (Random Access Memory) or a flash memory (Flash Memory), or a storage device such as a hard disk or an optical disk. As shown in FIG. 3, the storage unit 120 includes a query information storage unit 121, a vector information storage unit 122, a cluster information storage unit 123, and a model information storage unit 124.

(クエリ情報記憶部121)
クエリ情報記憶部121は、ユーザから受け付けたクエリに関する各種の情報を記憶する。図4に、実施形態に係るクエリ情報記憶部の一例を示す。図4に示す例では、クエリ情報記憶部121は、「ユーザID」、「日時」、「指定クラスタ数」、「クエリ」、「クエリID」といった項目を有する。
(Query information storage unit 121)
The query information storage unit 121 stores various information related to the query received from the user. FIG. 4 shows an example of the query information storage unit according to the embodiment. In the example shown in FIG. 4, the query information storage unit 121 has items such as "user ID", "date and time", "specified number of clusters", "query", and "query ID".

「ユーザID」は、ユーザを識別するための識別情報を示す。「日時」は、ユーザからクエリを受け付けた日時を示す。「指定クラスタ数」は、ユーザから受け付けた複数のクエリをクラスタに分類する際のクラスタ数としてユーザから指定されたクラスタ数を示す。「クエリ」は、ユーザから受け付けたクエリを示す。具体的には、「クエリID」は、ユーザから受け付けたクエリを識別するための識別情報を示す。 The "user ID" indicates identification information for identifying a user. "Date and time" indicates the date and time when the query was received from the user. The "specified number of clusters" indicates the number of clusters specified by the user as the number of clusters when classifying a plurality of queries received from the user into clusters. "Query" indicates a query received from a user. Specifically, the "query ID" indicates identification information for identifying the query received from the user.

図4の1レコード目に示す例では、クエリID「Q1-1」で識別されるクエリ(クエリQ1-1)は、図1に示すクエリ「車種T11」に対応する。また、指定クラスタ数「3」は、ユーザから受け付けた12個のクエリQ1-1〜Q1-12をクラスタに分類する際のクラスタ数としてユーザから指定されたクラスタ数が「3」であることを示す。 In the example shown in the first record of FIG. 4, the query (query Q1-1) identified by the query ID "Q1-1" corresponds to the query "vehicle type T11" shown in FIG. Further, the specified number of clusters "3" means that the number of clusters specified by the user as the number of clusters when classifying the 12 queries Q1-1 to Q1-12 received from the user into clusters is "3". Shown.

(ベクトル情報記憶部122)
ベクトル情報記憶部122は、クエリの分散表現であるベクトルに関する各種の情報を記憶する。図5に、実施形態に係るベクトル情報記憶部の一例を示す。図5に示す例では、ベクトル情報記憶部122は、「ベクトルID」、「クエリID」、「ベクトル情報」といった項目を有する。
(Vector information storage unit 122)
The vector information storage unit 122 stores various information related to the vector, which is a distributed representation of the query. FIG. 5 shows an example of the vector information storage unit according to the embodiment. In the example shown in FIG. 5, the vector information storage unit 122 has items such as “vector ID”, “query ID”, and “vector information”.

「ベクトルID」は、クエリの分散表現であるベクトルを識別するための識別情報を示す。「クエリID」は、ベクトルに対応するクエリを識別するための識別情報を示す。「ベクトル情報」は、クエリの分散表現であるN次元(例えば、128次元)のベクトルを示す。 The "vector ID" indicates identification information for identifying a vector which is a distributed representation of a query. The "query ID" indicates identification information for identifying the query corresponding to the vector. The "vector information" indicates an N-dimensional (for example, 128-dimensional) vector which is a distributed representation of the query.

図5の1レコード目に示す例では、ベクトルID「QV1-1」で識別されるベクトル(ベクトルQV1-1)は、図1に示したクエリQ1-1分散表現であるベクトルQV1-1に対応する。また、クエリID「Q1-1」で識別されるクエリ(クエリQ1-1)は、ベクトルQV1-1に対応するクエリがクエリQ1-1であることを示す。また、ベクトル情報「QVDT1-1」は、クエリQ1-1の分散表現であるN次元のベクトルを示す。 In the example shown in the first record of FIG. 5, the vector (vector QV1-1) identified by the vector ID “QV1-1” corresponds to the vector QV1-1 which is the query Q1-1 distributed representation shown in FIG. To do. Further, the query (query Q1-1) identified by the query ID "Q1-1" indicates that the query corresponding to the vector QV1-1 is the query Q1-1. Further, the vector information "QVDT1-1" indicates an N-dimensional vector which is a distributed representation of the query Q1-1.

(クラスタ情報記憶部123)
クラスタ情報記憶部123は、クラスタに関する各種の情報を記憶する。図6に、実施形態に係るクラスタ情報記憶部の一例を示す。図6に示す例では、クラスタ情報記憶部123は、ユーザから受け付けた複数のクエリをユーザから受け付けた指定クラスタ数に分類することにより生成されるクラスタ情報毎にデータが格納される複数のデータテーブルから成る。また、各データテーブルは、「クラスタID」、「クラスタ名」、「クエリID」といった項目を有する。
(Cluster Information Storage Unit 123)
The cluster information storage unit 123 stores various information about the cluster. FIG. 6 shows an example of the cluster information storage unit according to the embodiment. In the example shown in FIG. 6, the cluster information storage unit 123 stores a plurality of data tables for each cluster information generated by classifying a plurality of queries received from the user into a specified number of clusters received from the user. Consists of. In addition, each data table has items such as "cluster ID", "cluster name", and "query ID".

「クラスタID」は、クラスタを識別するための識別情報を示す。「クラスタ名」は、クラスタの名称を示す。「クエリID」は、クエリを識別するための識別情報を示す。 The "cluster ID" indicates identification information for identifying the cluster. "Cluster name" indicates the name of the cluster. The "query ID" indicates identification information for identifying the query.

図6の1レコード目に示す例では、クラスタID「CL1」で識別されるクラスタ(クラスタCL1)は、図1に示すクラスタCL1に対応する。また、クラスタ名「クラスタ1」は、クラスタCL1の名称がクラスタ1であることを示す。また、クラスタCL1には、クエリID「Q1-1」で識別されるクエリ(クエリQ1-1)とクエリID「Q1-2」で識別されるクエリ(クエリQ1-2)とクエリID「Q1-3」で識別されるクエリ(クエリQ1-3)とクエリID「Q1-7」で識別されるクエリ(クエリQ1-7)とクエリID「Q1-8」で識別されるクエリ(クエリQ1-8)が分類されることを示す。 In the example shown in the first record of FIG. 6, the cluster (cluster CL1) identified by the cluster ID “CL1” corresponds to the cluster CL1 shown in FIG. Further, the cluster name "cluster 1" indicates that the name of the cluster CL1 is cluster 1. Further, the cluster CL1 includes a query (query Q1-1) identified by the query ID "Q1-1", a query (query Q1-2) identified by the query ID "Q1-2", and a query ID "Q1-2". Query identified by "3" (query Q1-3), query identified by query ID "Q1-7" (query Q1-7), and query identified by query ID "Q1-8" (query Q1-8) ) Is classified.

(モデル情報記憶部124)
モデル情報記憶部124は、生成装置50によって生成された学習モデルに関する各種の情報を記憶する。図7に、実施形態に係るモデル情報記憶部の一例を示す。図7に示す例では、モデル情報記憶部124は、「モデルID」、「モデルデータ」といった項目を有する。
(Model information storage unit 124)
The model information storage unit 124 stores various information related to the learning model generated by the generation device 50. FIG. 7 shows an example of the model information storage unit according to the embodiment. In the example shown in FIG. 7, the model information storage unit 124 has items such as "model ID" and "model data".

「モデルID」は、生成装置50によって生成された学習モデルを識別するための識別情報を示す。「モデルデータ」は、生成装置50によって生成された学習モデルのモデルデータを示す。例えば、「モデルデータ」には、クエリを分散表現に変換するためのデータが格納される。 The "model ID" indicates identification information for identifying the learning model generated by the generation device 50. The "model data" indicates the model data of the learning model generated by the generation device 50. For example, "model data" stores data for converting a query into a distributed representation.

図7の1レコード目に示す例では、モデルID「M1」で識別される学習モデルは、図1に示した第1モデルM1に対応する。また、モデルデータ「MDT1」は、生成装置50によって生成された第1モデルM1のモデルデータ(モデルデータMDT1)を示す。 In the example shown in the first record of FIG. 7, the learning model identified by the model ID “M1” corresponds to the first model M1 shown in FIG. Further, the model data "MDT1" indicates model data (model data MDT1) of the first model M1 generated by the generation device 50.

モデルデータMDT1は、クエリが入力される入力層と、出力層と、入力層から出力層までのいずれかの層であって出力層以外の層に属する第1要素と、第1要素と第1要素の重みとに基づいて値が算出される第2要素と、を含み、入力層に入力されたクエリに応じて、入力層に入力されたクエリの分散表現を出力層から出力するよう、生成装置50を機能させてもよい。 The model data MDT1 includes an input layer into which a query is input, an output layer, a first element which is any layer from the input layer to the output layer and belongs to a layer other than the output layer, and the first element and the first element. Generated to output a distributed representation of the query input to the input layer from the output layer, including a second element whose value is calculated based on the weight of the element, and in response to the query input to the input layer. The device 50 may function.

ここで、モデルデータMDT1が「y=a1*x1+a2*x2+・・・+ai*xi」で示す回帰モデルで実現されるとする。この場合、モデルデータMDT1が含む第1要素は、x1やx2等といった入力データ(xi)に対応する。また、第1要素の重みは、xiに対応する係数aiに対応する。ここで、回帰モデルは、入力層と出力層とを有する単純パーセプトロンと見做すことができる。各モデルを単純パーセプトロンと見做した場合、第1要素は、入力層が有するいずれかのノードに対応し、第2要素は、出力層が有するノードと見做すことができる。 Here, it is assumed that the model data MDT1 is realized by the regression model represented by "y = a1 * x1 + a2 * x2 + ... + ai * xi". In this case, the first element included in the model data MDT1 corresponds to input data (xi) such as x1 and x2. Further, the weight of the first element corresponds to the coefficient ai corresponding to xi. Here, the regression model can be regarded as a simple perceptron having an input layer and an output layer. When each model is regarded as a simple perceptron, the first element can be regarded as any node of the input layer, and the second element can be regarded as the node of the output layer.

また、モデルデータMDT1がDNN(Deep Neural Network)等、1つまたは複数の中間層を有するニューラルネットワークで実現されるとする。この場合、モデルデータMDT1が含む第1要素は、入力層または中間層が有するいずれかのノードに対応する。また、第2要素は、第1要素と対応するノードから値が伝達されるノードである次段のノードに対応する。また、第1要素の重みは、第1要素と対応するノードから第2要素と対応するノードに伝達される値に対して考慮される重みである接続係数に対応する。 Further, it is assumed that the model data MDT1 is realized by a neural network having one or a plurality of intermediate layers such as DNN (Deep Neural Network). In this case, the first element included in the model data MDT1 corresponds to either the node of the input layer or the intermediate layer. Further, the second element corresponds to a node in the next stage, which is a node to which a value is transmitted from a node corresponding to the first element. Further, the weight of the first element corresponds to a connection coefficient which is a weight considered for the value transmitted from the node corresponding to the first element to the node corresponding to the second element.

生成装置50は、上述した回帰モデルやニューラルネットワーク等、任意の構造を有するモデルを用いて、分散表現の算出を行う。具体的には、モデルデータMDT1は、クエリが入力された場合に、分散表現を出力するように係数が設定される。生成装置50は、このようなモデルデータMDT1を用いて、分散表現を算出する。 The generation device 50 calculates the variance representation using a model having an arbitrary structure such as the regression model and the neural network described above. Specifically, the model data MDT1 is set with a coefficient so as to output a distributed representation when a query is input. The generation device 50 calculates the distributed representation using such model data MDT1.

なお、上記例では、モデルデータMDT1が、クエリが入力された場合に、クエリの分散表現を出力するモデル(以下、モデルX1という。)である例を示した。しかし、実施形態に係るモデルデータMDT1は、モデルX1にデータの入出力を繰り返すことで得られる結果に基づいて生成されるモデルであってもよい。例えば、モデルデータMDT1は、クエリを入力とした際に、モデルX1が出力した分散表現を入力して学習されたモデル(以下、モデルY1という。)であってもよい。または、モデルデータMDT1は、クエリを入力とし、モデルY1の出力値を出力とするよう学習されたモデルであってもよい。 In the above example, the model data MDT1 is a model (hereinafter referred to as model X1) that outputs a distributed representation of the query when a query is input. However, the model data MDT1 according to the embodiment may be a model generated based on the result obtained by repeating the input / output of data to the model X1. For example, the model data MDT1 may be a model (hereinafter, referred to as model Y1) learned by inputting the distributed representation output by the model X1 when the query is input. Alternatively, the model data MDT1 may be a model trained to take a query as an input and output a value of the model Y1 as an output.

また、生成装置50がGAN(Generative Adversarial Networks)を用いた推定処理を行う場合、モデルデータMDT1は、GANの一部を構成するモデルであってもよい。 Further, when the generation device 50 performs the estimation process using GAN (Generative Adversarial Networks), the model data MDT1 may be a model forming a part of GAN.

(制御部130)
図3の説明に戻って、制御部130は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、情報処理装置100内部の記憶装置に記憶されている各種プログラム(情報処理プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部130は、コントローラであり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
(Control unit 130)
Returning to the description of FIG. 3, the control unit 130 is a controller, and is stored in a storage device inside the information processing device 100 by, for example, a CPU (Central Processing Unit) or an MPU (Micro Processing Unit). This is realized by executing various programs (corresponding to an example of an information processing program) using the RAM as a work area. Further, the control unit 130 is a controller, and is realized by, for example, an integrated circuit such as an ASIC (Application Specific Integrated Circuit) or an FPGA (Field Programmable Gate Array).

図3に示すように、制御部130は、受付部131と、取得部132と、生成部133と、出力部134とを有し、以下に説明する情報処理の作用を実現または実行する。なお、制御部130の内部構成は、図3に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。 As shown in FIG. 3, the control unit 130 includes a reception unit 131, an acquisition unit 132, a generation unit 133, and an output unit 134, and realizes or executes the information processing operation described below. The internal configuration of the control unit 130 is not limited to the configuration shown in FIG. 3, and may be another configuration as long as it is a configuration for performing information processing described later.

(受付部131)
受付部131は、端末装置10からコンテンツC1の配信要求を受け付ける。受付部131は、端末装置10からコンテンツC1の部分コンテンツC11の配信要求を受け付ける。具体的には、受付部131は、クラスタ数を入力可能な入力フィールドF11と、複数のクエリを入力可能な入力フィールドF12と、入力フィールドに入力された情報を情報処理装置100に送信する送信ボタンB11とを含む部分コンテンツC11の配信要求を受け付ける。
(Reception Department 131)
The reception unit 131 receives a distribution request for the content C1 from the terminal device 10. The reception unit 131 receives a distribution request for the partial content C11 of the content C1 from the terminal device 10. Specifically, the reception unit 131 has an input field F11 capable of inputting the number of clusters, an input field F12 capable of inputting a plurality of queries, and a send button for transmitting the information input in the input fields to the information processing apparatus 100. Accepts a distribution request for partial content C11 including B11.

続いて、受付部131は、コンテンツC1の配信要求を受け付けると、端末装置10にコンテンツC1を配信する。受付部131は、コンテンツC1の部分コンテンツC11の配信要求を受け付けると、端末装置10にコンテンツC1の部分コンテンツC11を配信する。具体的には、受付部131は、クラスタ数を入力可能な入力フィールドF11と、複数のクエリを入力可能な入力フィールドF12と、入力フィールドに入力された情報を情報処理装置100に送信する送信ボタンB11とを含む部分コンテンツC11を端末装置10に配信する。 Subsequently, when the reception unit 131 receives the distribution request for the content C1, the reception unit 131 distributes the content C1 to the terminal device 10. When the reception unit 131 receives the distribution request for the partial content C11 of the content C1, the reception unit 131 distributes the partial content C11 of the content C1 to the terminal device 10. Specifically, the reception unit 131 has an input field F11 capable of inputting the number of clusters, an input field F12 capable of inputting a plurality of queries, and a send button for transmitting the information input in the input fields to the information processing apparatus 100. The partial content C11 including the B11 is delivered to the terminal device 10.

また、受付部131は、分類対象を示す複数の対象情報と、複数の対象情報をクラスタに分類する際のクラスタ数である指定クラスタ数とを受け付ける。具体的には、受付部131は、分類対象を示す複数のクエリと、複数のクエリをクラスタに分類する際のクラスタ数である指定クラスタ数とを端末装置10から受信する。続いて、受付部131は、複数のクエリと指定クラスタ数とを受信すると、受信した複数のクエリと指定クラスタ数とを対応付けてクエリ情報記憶部121に格納する。 Further, the reception unit 131 receives a plurality of target information indicating the classification target and a designated number of clusters, which is the number of clusters when the plurality of target information is classified into clusters. Specifically, the reception unit 131 receives from the terminal device 10 a plurality of queries indicating the classification target and a designated number of clusters, which is the number of clusters when the plurality of queries are classified into clusters. Subsequently, when the reception unit 131 receives the plurality of queries and the specified number of clusters, the reception unit 131 stores the received plurality of queries and the designated number of clusters in the query information storage unit 121 in association with each other.

(取得部132)
取得部132は、各種情報を取得する。取得部132は、外部の情報処理装置から各種情報を取得する。取得部132は、生成装置50等の他の情報処理装置から各種情報を取得する。
(Acquisition unit 132)
The acquisition unit 132 acquires various types of information. The acquisition unit 132 acquires various information from an external information processing device. The acquisition unit 132 acquires various information from other information processing devices such as the generation device 50.

また、取得部132は、記憶部120から各種情報を取得する。取得部132は、クエリ情報記憶部121やベクトル情報記憶部122やクラスタ情報記憶部123やモデル情報記憶部124から各種情報を取得する。 Further, the acquisition unit 132 acquires various information from the storage unit 120. The acquisition unit 132 acquires various types of information from the query information storage unit 121, the vector information storage unit 122, the cluster information storage unit 123, and the model information storage unit 124.

具体的には、取得部132は、モデルを取得する。より具体的には、取得部132は、受付部131によって分類対象を示す複数のクエリと、複数のクエリをクラスタに分類する際のクラスタ数である指定クラスタ数とが受け付けられると、生成装置50から第1モデルM1を取得する。取得部132は、生成装置50から第1モデルM1のモデルデータMDT1を取得する。続いて、取得部132は、第1モデルM1(モデルデータMDT1)を取得すると、取得した第1モデルM1(モデルデータMDT1)をモデル情報記憶部124に格納する。 Specifically, the acquisition unit 132 acquires the model. More specifically, the acquisition unit 132 receives the plurality of queries indicating the classification target by the reception unit 131 and the specified number of clusters, which is the number of clusters when the plurality of queries are classified into clusters, and the generation device 50. The first model M1 is acquired from. The acquisition unit 132 acquires the model data MDT1 of the first model M1 from the generation device 50. Subsequently, when the acquisition unit 132 acquires the first model M1 (model data MDT1), the acquisition unit 132 stores the acquired first model M1 (model data MDT1) in the model information storage unit 124.

(生成部133)
生成部133は、種々の情報を生成する。生成部133は、クエリの分散表現を生成する。具体的には、生成部133は、受付部131によって受け付けられた複数のクエリの分散表現を生成する。
(Generator 133)
The generation unit 133 generates various information. The generation unit 133 generates a distributed representation of the query. Specifically, the generation unit 133 generates a distributed representation of a plurality of queries received by the reception unit 131.

また、生成部133は、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして、複数の検索クエリが有する特徴を学習した学習モデルを用いて、複数の対象情報に含まれるそれぞれの対象情報である文字情報に対応する分散表現を生成する。具体的には、生成部133は、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして、複数の検索クエリが有する特徴を学習した第1モデルM1を用いて、受付部131によって受け付けられた複数のクエリの分散表現を生成する。 In addition, the generation unit 133 uses a learning model that learns the characteristics of the plurality of search queries, assuming that the plurality of search queries input by the same user within a predetermined time have similar characteristics. Generates a distributed representation corresponding to the character information that is each target information included in the target information. Specifically, the generation unit 133 uses the first model M1 that has learned the characteristics of the plurality of search queries, assuming that the plurality of search queries input by the same user within a predetermined time have similar characteristics. It is used to generate a distributed representation of a plurality of queries received by the reception unit 131.

また、生成部133は、入力情報として所定の検索クエリが入力された際に、出力情報として所定の検索クエリの分散表現を出力する学習モデルを用いて、分散表現を生成する。具体的には、生成部133は、入力情報として所定の検索クエリが入力された際に、出力情報として所定の検索クエリの分散表現を出力する第1モデルM1を用いて、受付部131によって受け付けられた複数のクエリの分散表現を生成する。 Further, the generation unit 133 generates a distributed expression by using a learning model that outputs a distributed expression of the predetermined search query as output information when a predetermined search query is input as input information. Specifically, the generation unit 133 receives the input information by the reception unit 131 using the first model M1 that outputs the distributed representation of the predetermined search query as the output information when the predetermined search query is input. Generate a distributed representation of multiple queries.

また、生成部133は、所定の時間内に続けて入力された一対の検索クエリの分散表現が類似するように学習することで、複数の検索クエリが有する特徴を学習した学習モデルを用いて、分散表現を生成する。具体的には、生成部133は、所定の時間内に続けて入力された一対の検索クエリの分散表現が類似するように学習することで、複数の検索クエリが有する特徴を学習した第1モデルM1を用いて、受付部131によって受け付けられた複数のクエリの分散表現を生成する。 In addition, the generation unit 133 uses a learning model that learns the characteristics of a plurality of search queries by learning so that the distributed expressions of a pair of search queries input consecutively within a predetermined time are similar. Generate a distributed representation. Specifically, the generation unit 133 learns the characteristics of a plurality of search queries by learning so that the distributed expressions of a pair of search queries input consecutively within a predetermined time are similar to each other. Using M1, a distributed representation of a plurality of queries received by the reception unit 131 is generated.

また、生成部133は、同一のユーザによって所定の時間内に入力された複数の検索クエリとして、所定の区切り文字で区切られた文字列を含む複数の検索クエリが類似する特徴を有するものとして学習することで、複数の検索クエリが有する特徴を学習した学習モデルを用いて、分散表現を生成する。具体的には、生成部133は、同一のユーザによって所定の時間内に入力された複数の検索クエリとして、所定の区切り文字で区切られた文字列を含む複数の検索クエリが類似する特徴を有するものとして学習することで、複数の検索クエリが有する特徴を学習した第1モデルM1を用いて、受付部131によって受け付けられた複数のクエリの分散表現を生成する。 Further, the generation unit 133 learns that as a plurality of search queries input by the same user within a predetermined time, a plurality of search queries including a character string delimited by a predetermined delimiter have similar characteristics. By doing so, a distributed representation is generated using a learning model that has learned the characteristics of a plurality of search queries. Specifically, the generation unit 133 has a feature that a plurality of search queries including a character string separated by a predetermined delimiter are similar as a plurality of search queries input by the same user within a predetermined time. By learning as a thing, a distributed representation of a plurality of queries received by the reception unit 131 is generated by using the first model M1 that has learned the characteristics of the plurality of search queries.

また、生成部133は、ランダムに抽出された複数の検索クエリが相違する特徴を有するものとして学習することで、複数の検索クエリが有する特徴を学習した学習モデルを用いて、分散表現を生成する。具体的には、生成部133は、ランダムに抽出された複数の検索クエリが相違する特徴を有するものとして学習することで、複数の検索クエリが有する特徴を学習した第1モデルM1を用いて、受付部131によって受け付けられた複数のクエリの分散表現を生成する。 In addition, the generation unit 133 generates a distributed expression by using the learning model in which the characteristics of the plurality of search queries are learned by learning that the plurality of randomly extracted search queries have different characteristics. .. Specifically, the generation unit 133 uses the first model M1 that has learned the characteristics of the plurality of search queries by learning that the plurality of randomly extracted search queries have different characteristics. Generates a distributed representation of a plurality of queries received by the reception unit 131.

また、生成部133は、ランダムに抽出された一対の検索クエリの分散表現が相違するように学習することで、複数の検索クエリが有する特徴を学習した学習モデルを用いて、分散表現を生成する。具体的には、生成部133は、ランダムに抽出された一対の検索クエリの分散表現が相違するように学習することで、複数の検索クエリが有する特徴を学習した第1モデルM1を用いて、受付部131によって受け付けられた複数のクエリの分散表現を生成する。 Further, the generation unit 133 generates a distributed expression by using a learning model that has learned the characteristics of a plurality of search queries by learning so that the distributed expressions of a pair of randomly extracted search queries are different. .. Specifically, the generation unit 133 uses the first model M1 that has learned the characteristics of the plurality of search queries by learning so that the distributed expressions of the pair of randomly extracted search queries are different. Generates a distributed representation of a plurality of queries received by the reception unit 131.

より具体的には、生成部133は、受付部131によって分類対象を示す複数のクエリと、複数のクエリをクラスタに分類する際のクラスタ数である指定クラスタ数とが受け付けられると、モデル情報記憶部124を参照して、第1モデルM1を取得する。また、生成部133は、受付部131によって分類対象を示す複数のクエリと、複数のクエリをクラスタに分類する際のクラスタ数である指定クラスタ数とが受け付けられると、クエリ情報記憶部121を参照して、受付部131によって受け付けられた複数のクエリを取得する。図1に示す例では、生成部133は、受付部131によって受け付けられたクエリQ1-1〜Q1-12を取得する。 More specifically, the generation unit 133 stores model information when a plurality of queries indicating classification targets and a specified number of clusters, which is the number of clusters when classifying the plurality of queries into clusters, are received by the reception unit 131. The first model M1 is acquired with reference to the part 124. Further, when the generation unit 133 receives a plurality of queries indicating classification targets by the reception unit 131 and a specified number of clusters which is the number of clusters when classifying the plurality of queries into clusters, the generation unit 133 refers to the query information storage unit 121. Then, a plurality of queries received by the reception unit 131 are acquired. In the example shown in FIG. 1, the generation unit 133 acquires the queries Q1-1 to Q1-12 received by the reception unit 131.

続いて、生成部133は、複数のクエリを取得すると、複数のクエリの中から一のクエリを取得する。図1に示す例では、生成部133は、クエリQ1-1〜Q1-12を取得すると、クエリQ1-1〜Q1-12の中から一のクエリQ1-1を取得する。続いて、生成部133は、第1モデルM1の入力情報として、取得した一のクエリを第1モデルM1に入力する。図1に示す例では、生成部133は、第1モデルM1の入力情報として、取得した一のクエリQ1-1を第1モデルM1に入力する。また、生成部133は、第1モデルM1の出力情報として、第1モデルM1に入力されたクエリの分散表現を第1モデルM1から出力する。図1に示す例では、生成部133は、第1モデルM1の出力情報として、第1モデルM1に入力されたクエリQ1-1の分散表現QV1-1を第1モデルM1から出力する。このようにして、生成部133は、クエリの分散表現を生成する。同様に、生成部133は、取得したクエリの全てについて、各クエリの分散表現を生成する。図1に示す例では、生成部133は、取得したクエリQ1-1〜Q1-12について、各クエリQ1-1〜Q1-12の分散表現QV1-1〜QV1-12を生成する。続いて、生成部133は、各クエリの分散表現を生成すると、生成した各クエリの分散表現を各クエリと対応付けてベクトル情報記憶部122に格納する。 Subsequently, when the generation unit 133 acquires a plurality of queries, the generation unit 133 acquires one query from the plurality of queries. In the example shown in FIG. 1, when the generation unit 133 acquires the queries Q1-1 to Q1-12, the generation unit 133 acquires one query Q1-1 from the queries Q1-1 to Q1-12. Subsequently, the generation unit 133 inputs the acquired one query to the first model M1 as the input information of the first model M1. In the example shown in FIG. 1, the generation unit 133 inputs the acquired one query Q1-1 to the first model M1 as the input information of the first model M1. Further, the generation unit 133 outputs the distributed representation of the query input to the first model M1 as the output information of the first model M1 from the first model M1. In the example shown in FIG. 1, the generation unit 133 outputs the distributed representation QV1-1 of the query Q1-1 input to the first model M1 as the output information of the first model M1 from the first model M1. In this way, the generator 133 generates a distributed representation of the query. Similarly, the generation unit 133 generates a distributed representation of each query for all the acquired queries. In the example shown in FIG. 1, the generation unit 133 generates the distributed representations QV1-1 to QV1-12 of each query Q1-1 to Q1-12 for the acquired queries Q1-1 to Q1-12. Subsequently, when the generation unit 133 generates the distributed expression of each query, the generated unit 133 stores the distributed expression of each generated query in association with each query in the vector information storage unit 122.

また、生成部133は、クラスタを生成する。具体的には、生成部133は、複数の対象情報を指定クラスタ数のクラスタに分類することにより生成したクラスタを生成する。例えば、生成部133は、受付部131によって受け付けられた複数のクエリを指定クラスタ数のクラスタに分類することにより生成したクラスタを生成する。 In addition, the generation unit 133 generates a cluster. Specifically, the generation unit 133 generates a cluster generated by classifying a plurality of target information into clusters having a specified number of clusters. For example, the generation unit 133 generates a cluster generated by classifying a plurality of queries received by the reception unit 131 into clusters having a specified number of clusters.

また、生成部133は、複数の対象情報に含まれる一の対象情報が検索クエリとして入力された際の検索意図と、複数の対象情報に含まれる他の対象情報が検索クエリとして入力された際の検索意図との類似性に基づいて、複数の対象情報を指定クラスタ数のクラスタに分類する。具体的には、生成部133は、複数の対象情報に含まれる一の対象情報である文字情報に対応する分散表現と、複数の対象情報に含まれる他の対象情報である文字情報に対応する分散表現との類似度に基づいて、複数の対象情報を指定クラスタ数のクラスタに分類する。より具体的には、生成部133は、第1モデルM1を用いて生成された一のクエリの分散表現と、第1モデルM1を用いて生成された他のクエリの分散表現との類似度に基づいて、受付部131によって受け付けられた複数のクエリを指定クラスタ数のクラスタに分類する。 In addition, the generation unit 133 includes a search intention when one target information included in a plurality of target information is input as a search query, and a search query when another target information included in the plurality of target information is input as a search query. Classify multiple target information into clusters with a specified number of clusters based on the similarity with the search intention of. Specifically, the generation unit 133 corresponds to the distributed expression corresponding to the character information which is one target information included in the plurality of target information and the character information which is other target information included in the plurality of target information. Classify multiple target information into clusters with a specified number of clusters based on the similarity with the distributed representation. More specifically, the generation unit 133 determines the degree of similarity between the distributed representation of one query generated using the first model M1 and the distributed representation of another query generated using the first model M1. Based on this, a plurality of queries received by the reception unit 131 are classified into clusters having a specified number of clusters.

また、生成部133は、クラスタに関するクラスタ情報を生成する。具体的には、生成部133は、複数の対象情報を指定クラスタ数のクラスタに分類することにより、各対象情報が分類されるクラスタに関するクラスタ情報を生成する。例えば、生成部133は、受付部131によって受け付けられた複数のクエリを指定クラスタ数のクラスタに分類することにより、各クエリが分類されるクラスタに関する指定クラスタ情報を生成する。 In addition, the generation unit 133 generates cluster information regarding the cluster. Specifically, the generation unit 133 generates cluster information regarding the cluster in which each target information is classified by classifying a plurality of target information into clusters having a specified number of clusters. For example, the generation unit 133 generates designated cluster information regarding the cluster into which each query is classified by classifying the plurality of queries received by the reception unit 131 into clusters having a specified number of clusters.

また、生成部133は、複数の対象情報に含まれる一の対象情報が検索クエリとして入力された際の検索意図と、複数の対象情報に含まれる他の対象情報が検索クエリとして入力された際の検索意図との類似性に基づいて、指定クラスタ情報を生成する。具体的には、生成部133は、複数の対象情報に含まれる一の対象情報である文字情報に対応する分散表現と、複数の対象情報に含まれる他の対象情報である文字情報に対応する分散表現との類似度に基づいて、指定クラスタ情報を生成する。より具体的には、生成部133は、第1モデルM1を用いて生成された一のクエリの分散表現と、第1モデルM1を用いて生成された他のクエリの分散表現との類似度に基づいて、受付部131によって受け付けられた複数のクエリを指定クラスタ数のクラスタに分類することにより生成したクラスタに関する指定クラスタ情報を生成する。 In addition, the generation unit 133 includes a search intention when one target information included in the plurality of target information is input as a search query, and when another target information included in the plurality of target information is input as a search query. Generates designated cluster information based on the similarity to the search intent of. Specifically, the generation unit 133 corresponds to the distributed expression corresponding to the character information which is one target information included in the plurality of target information and the character information which is other target information included in the plurality of target information. Generates designated cluster information based on similarity to the distributed representation. More specifically, the generation unit 133 determines the degree of similarity between the distributed representation of one query generated using the first model M1 and the distributed representation of another query generated using the first model M1. Based on this, the designated cluster information regarding the cluster generated by classifying the plurality of queries received by the reception unit 131 into the clusters having the specified number of clusters is generated.

図1に示す例では、生成部133は、受付部131によってクラスタ数「3」と12個のクエリQ1-1〜Q1-12が受け付けられると、第1モデルM1を用いて生成されたクエリQ1-1〜Q1-12の分散表現QV1-1〜QV1-12を取得する。具体的には、生成部133は、クエリ情報記憶部121とベクトル情報記憶部122を参照して、第1モデルM1を用いて生成されたクエリQ1-1〜Q1-12の分散表現QV1-1〜QV1-12を取得する。 In the example shown in FIG. 1, when the reception unit 131 receives the number of clusters “3” and 12 queries Q1-1 to Q1-12, the generation unit 133 generates the query Q1 using the first model M1. Obtain the distributed representations QV1-1 to QV1-12 of -1 to Q1-12. Specifically, the generation unit 133 refers to the query information storage unit 121 and the vector information storage unit 122, and refers to the distributed representation QV1-1 of the queries Q1-1 to Q1-12 generated by using the first model M1. ~ QV1-12 is acquired.

続いて、生成部133は、分散表現QV1-1〜QV1-12を取得すると、取得した分散表現QV1-1〜QV1-12をk−means法を用いてクラスタ数「3」のクラスタに分類する。なお、生成部133は、取得した分散表現QV1-1〜QV1-12をクラスタ数「3」のクラスタに分類可能であれば、k−means法に限らず、どのようなクラスタリング手法を用いてもよい。 Subsequently, when the generation unit 133 acquires the distributed expressions QV1-1 to QV1-12, the generated unit 133 classifies the acquired distributed expressions QV1-1 to QV1-12 into clusters having the number of clusters "3" using the k-means method. .. Note that the generation unit 133 can use any clustering method, not limited to the k-means method, as long as the acquired distributed representations QV1-1 to QV1-12 can be classified into clusters having the number of clusters "3". Good.

また、生成部133は、クエリQ1-1〜Q1-12に対応する分散表現QV1-1〜QV1-12をクラスタ数「3」のクラスタに分類することによって、各分散表現に対応する各クエリをクラスタ数「3」のクラスタに分類する。このように、生成部133は、各分散表現に対応する各クエリをクラスタ数「3」のクラスタに分類することにより、各クエリが分類されるクラスタに関するクラスタ情報を生成する。 In addition, the generation unit 133 classifies the distributed expressions QV1-1 to QV1-12 corresponding to the queries Q1-1 to Q1-12 into clusters having the number of clusters "3", so that each query corresponding to each distributed expression is classified. Classify into clusters with the number of clusters "3". In this way, the generation unit 133 generates cluster information regarding the cluster to which each query is classified by classifying each query corresponding to each distributed representation into clusters having the number of clusters “3”.

例えば、生成部133は、分散表現QV1-1と分散表現QV1-2と分散表現QV1-3と分散表現QV1-7と分散表現QV1-8を一つのクラスタ(クラスタCL1)に分類する。生成部133は、分散表現QV1-1をクラスタCL1に分類したので、分散表現QV1-1に対応するクエリQ1-1をクラスタCL1に分類する。また、生成部133は、分散表現QV1-2をクラスタCL1に分類したので、分散表現QV1-2に対応するクエリQ1-2をクラスタCL1に分類する。同様に、生成部133は、分散表現QV1-3と分散表現QV1-7と分散表現QV1-8をクラスタCL1に分類したので、分散表現QV1-3に対応するクエリQ1-3と分散表現QV1-7に対応するクエリQ1-7と分散表現QV1-8に対応するクエリQ1-8をクラスタCL1に分類する。このようにして、生成部133は、クエリQ1-1とクエリQ1-2とクエリQ1-3とクエリQ1-7とクエリQ1-8が分類されるクラスタCL1に関するクラスタ情報を生成する。 For example, the generation unit 133 classifies the distributed representation QV1-1, the distributed representation QV1-2, the distributed representation QV1-3, the distributed representation QV1-7, and the distributed representation QV1-8 into one cluster (cluster CL1). Since the generation unit 133 has classified the distributed expression QV1-1 into the cluster CL1, the query Q1-1 corresponding to the distributed expression QV1-1 is classified into the cluster CL1. Further, since the generation unit 133 classifies the distributed expression QV1-2 into the cluster CL1, the query Q1-2 corresponding to the distributed expression QV1-2 is classified into the cluster CL1. Similarly, since the generation unit 133 classifies the distributed representation QV1-3, the distributed representation QV1-7, and the distributed representation QV1-8 into the cluster CL1, the query Q1-3 and the distributed representation QV1- corresponding to the distributed representation QV1-3. The query Q1-7 corresponding to 7 and the query Q1-8 corresponding to the distributed representation QV1-8 are classified into cluster CL1. In this way, the generation unit 133 generates cluster information regarding the cluster CL1 in which the query Q1-1, the query Q1-2, the query Q1-3, the query Q1-7, and the query Q1-8 are classified.

また、生成部133は、分散表現QV1-4と分散表現QV1-5と分散表現QV1-6と分散表現QV1-9と分散表現QV1-10をクラスタCL1とは異なる一つのクラスタ(クラスタCL2)に分類する。生成部133は、分散表現QV1-4をクラスタCL2に分類したので、分散表現QV1-4に対応するクエリQ1-4をクラスタCL2に分類する。また、生成部133は、分散表現QV1-5をクラスタCL2に分類したので、分散表現QV1-5に対応するクエリQ1-5をクラスタCL2に分類する。同様に、生成部133は、分散表現QV1-6と分散表現QV1-9と分散表現QV1-10をクラスタCL2に分類したので、分散表現QV1-6に対応するクエリQ1-6と分散表現QV1-9に対応するクエリQ1-9と分散表現QV1-10に対応するクエリQ1-10をクラスタCL2に分類する。このようにして、生成部133は、クエリQ1-4とクエリQ1-5とクエリQ1-6とクエリQ1-9とクエリQ1-10が分類されるクラスタCL2に関するクラスタ情報を生成する。 Further, the generation unit 133 puts the distributed representation QV1-4, the distributed representation QV1-5, the distributed representation QV1-6, the distributed representation QV1-9, and the distributed representation QV1-10 into one cluster (cluster CL2) different from the cluster CL1. Classify. Since the generation unit 133 has classified the distributed expression QV1-4 into the cluster CL2, the query Q1-4 corresponding to the distributed expression QV1-4 is classified into the cluster CL2. Further, since the generation unit 133 classifies the distributed expression QV1-5 into the cluster CL2, the query Q1-5 corresponding to the distributed expression QV1-5 is classified into the cluster CL2. Similarly, since the generation unit 133 classifies the distributed representation QV1-6, the distributed representation QV1-9, and the distributed representation QV1-10 into the cluster CL2, the query Q1-6 and the distributed representation QV1- corresponding to the distributed representation QV1-6. Query Q1-9 corresponding to 9 and query Q1-10 corresponding to the distributed representation QV1-10 are classified into cluster CL2. In this way, the generation unit 133 generates cluster information regarding the cluster CL2 in which the query Q1-4, the query Q1-5, the query Q1-6, the query Q1-9, and the query Q1-10 are classified.

また、生成部133は、分散表現QV1-11と分散表現QV1-12をクラスタCL1およびクラスタCL2とは異なる一つのクラスタ(クラスタCL3)に分類する。生成部133は、分散表現QV1-11をクラスタCL3に分類したので、分散表現QV1-11に対応するクエリQ1-11をクラスタCL3に分類する。また、生成部133は、分散表現QV1-12をクラスタCL3に分類したので、分散表現QV1-12に対応するクエリQ1-12をクラスタCL3に分類する。このようにして、生成部133は、クエリQ1-11とクエリQ1-12が分類されるクラスタCL3に関するクラスタ情報を生成する。 Further, the generation unit 133 classifies the distributed representation QV1-11 and the distributed representation QV1-12 into one cluster (cluster CL3) different from the cluster CL1 and the cluster CL2. Since the generation unit 133 has classified the distributed representation QV1-11 into the cluster CL3, the query Q1-11 corresponding to the distributed representation QV1-11 is classified into the cluster CL3. Further, since the generation unit 133 classifies the distributed expression QV1-12 into the cluster CL3, the query Q1-12 corresponding to the distributed expression QV1-12 is classified into the cluster CL3. In this way, the generation unit 133 generates cluster information regarding the cluster CL3 in which the query Q1-11 and the query Q1-12 are classified.

また、生成部133は、指定クラスタ情報として、クラスタごとに、クラスタに分類される対象情報を視認可能な情報を生成する。例えば、生成部133は、指定クラスタ情報として、クラスタごとに、クラスタに分類される対象情報を視認可能なコンテンツを生成する。 In addition, the generation unit 133 generates information in which the target information classified into the clusters can be visually recognized as the designated cluster information for each cluster. For example, the generation unit 133 generates content in which the target information classified into the clusters can be visually recognized as the designated cluster information for each cluster.

図1に示す例では、生成部133は、クラスタCL1に関するクラスタ情報が表示される表示領域F21の上方にクラスタCL1の名称「クラスタ1」が表示される部分コンテンツC12を生成してもよい。また、生成部133は、クラスタCL2に関するクラスタ情報が表示される表示領域F22の上方にクラスタCL2の名称「クラスタ2」が表示されるが表示される部分コンテンツC12を生成してもよい。また、生成部133は、クラスタCL3に関するクラスタ情報が表示される表示領域F23の上方にクラスタCL3の名称「クラスタ3」が表示されるが表示される部分コンテンツC12を生成してもよい。 In the example shown in FIG. 1, the generation unit 133 may generate the partial content C12 in which the name “cluster 1” of the cluster CL1 is displayed above the display area F21 in which the cluster information regarding the cluster CL1 is displayed. Further, the generation unit 133 may generate the partial content C12 in which the name “cluster 2” of the cluster CL2 is displayed above the display area F22 in which the cluster information regarding the cluster CL2 is displayed. Further, the generation unit 133 may generate the partial content C12 in which the name “cluster 3” of the cluster CL3 is displayed above the display area F23 in which the cluster information regarding the cluster CL3 is displayed.

(出力部134)
出力部134は、生成部133によって生成された指定クラスタ情報を出力する。具体的には、出力部134は、生成部133によって生成された指定クラスタ情報を端末装置10に送信する。
(Output unit 134)
The output unit 134 outputs the designated cluster information generated by the generation unit 133. Specifically, the output unit 134 transmits the designated cluster information generated by the generation unit 133 to the terminal device 10.

〔3.端末装置の構成〕
次に、図8を用いて、実施形態に係る端末装置10の構成について説明する。図8は、実施形態に係る端末装置10の構成例を示す図である。図8に示すように、端末装置10は、通信部11と、入力部12と、表示部13と、記憶部14と、制御部15とを有する。
[3. Terminal device configuration]
Next, the configuration of the terminal device 10 according to the embodiment will be described with reference to FIG. FIG. 8 is a diagram showing a configuration example of the terminal device 10 according to the embodiment. As shown in FIG. 8, the terminal device 10 includes a communication unit 11, an input unit 12, a display unit 13, a storage unit 14, and a control unit 15.

(通信部11)
通信部11は、例えば、NIC等によって実現される。そして、通信部11は、ネットワークNと有線または無線で接続され、情報処理装置100との間で情報の送受信を行う。
(Communication unit 11)
The communication unit 11 is realized by, for example, a NIC or the like. Then, the communication unit 11 is connected to the network N by wire or wirelessly, and transmits / receives information to / from the information processing device 100.

(入力部12、表示部13)
入力部12は、利用者から各種操作を受け付ける入力装置である。入力部12は、表示部13を介して各種情報が入力される。例えば、入力部12は、キーボードやマウスや操作キー等によって実現される。表示部13は、各種情報を表示するための表示装置であり、すなわち、画面である。例えば、表示部13は、液晶ディスプレイ等によって実現される。表示部13は、記憶部14に記憶された情報を表示する。表示部13は、受信部151によって受信された情報を表示する。表示部13は、表示制御部152による制御に応じて、各種情報を表示する。なお、端末装置10にタッチパネルが採用される場合には、入力部12と表示部13とは一体化される。また、以下の説明では、表示部13を画面と記載する場合がある。
(Input unit 12, display unit 13)
The input unit 12 is an input device that receives various operations from the user. Various information is input to the input unit 12 via the display unit 13. For example, the input unit 12 is realized by a keyboard, a mouse, operation keys, or the like. The display unit 13 is a display device for displaying various information, that is, a screen. For example, the display unit 13 is realized by a liquid crystal display or the like. The display unit 13 displays the information stored in the storage unit 14. The display unit 13 displays the information received by the reception unit 151. The display unit 13 displays various information according to the control by the display control unit 152. When a touch panel is adopted for the terminal device 10, the input unit 12 and the display unit 13 are integrated. Further, in the following description, the display unit 13 may be described as a screen.

図1の例では、表示部13は、受信部151によって受信されたコンテンツC1を表示する。表示部13は、受信部151によって受信されたコンテンツC1の部分コンテンツC11を表示する。具体的には、表示部13は、複数の第1クエリを入力可能な入力フィールドF11と、複数の第2クエリを入力可能な入力フィールドF12と、入力フィールドに入力されたクエリを情報処理装置100に送信する送信ボタンB11とを含む部分コンテンツC11を表示する。 In the example of FIG. 1, the display unit 13 displays the content C1 received by the reception unit 151. The display unit 13 displays the partial content C11 of the content C1 received by the reception unit 151. Specifically, the display unit 13 inputs the input field F11 capable of inputting a plurality of first queries, the input field F12 capable of inputting a plurality of second queries, and the information processing device 100 for the queries input in the input fields. The partial content C11 including the transmission button B11 to be transmitted to is displayed.

また、表示部13は、受信部151によって受信されたコンテンツC1の部分コンテンツC12を表示する。表示部13は、受信部151によって受信された棒グラフG21〜G23に関する情報を表示する。具体的には、表示部13は、受信部151によって受信されたコンテンツC1の部分コンテンツC12に含まれる表示領域F21〜F23のそれぞれに棒グラフG21〜G23に関する情報を表示する。 Further, the display unit 13 displays the partial content C12 of the content C1 received by the reception unit 151. The display unit 13 displays information about the bar graphs G21 to G23 received by the reception unit 151. Specifically, the display unit 13 displays information about the bar graphs G21 to G23 in each of the display areas F21 to F23 included in the partial content C12 of the content C1 received by the reception unit 151.

(記憶部14)
記憶部14は、例えば、RAM、フラッシュメモリ等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。記憶部14は、情報の表示に用いる各種情報を記憶する。記憶部14は、受信部151によって受信された情報を記憶する。図1に示す例では、記憶部14は、受信部151によって受信されたコンテンツC1を記憶する。また、記憶部14は、受信部151によって受信されたコンテンツC1の部分コンテンツC11を記憶する。また、記憶部14は、受信部151によって受信されたコンテンツC1の部分コンテンツC12を記憶する。また、記憶部14は、受信部151によって受信された棒グラフG21〜G23に関する情報を記憶する。
(Memory unit 14)
The storage unit 14 is realized by, for example, a semiconductor memory element such as a RAM or a flash memory, or a storage device such as a hard disk or an optical disk. The storage unit 14 stores various information used for displaying the information. The storage unit 14 stores the information received by the reception unit 151. In the example shown in FIG. 1, the storage unit 14 stores the content C1 received by the reception unit 151. Further, the storage unit 14 stores the partial content C11 of the content C1 received by the reception unit 151. Further, the storage unit 14 stores the partial content C12 of the content C1 received by the reception unit 151. Further, the storage unit 14 stores information regarding the bar graphs G21 to G23 received by the reception unit 151.

(制御部15)
制御部15は、CPUやMPU等によって、端末装置10内部の記憶装置に記憶されている各種プログラム(例えば、コンテンツC1等を画面に表示させる表示制御プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。例えば、この各種プログラムは、ウェブブラウザと呼ばれるアプリケーションプログラムに該当する。また、制御部15は、例えば、ASICやFPGA等の集積回路により実現される。
(Control unit 15)
In the control unit 15, various programs (for example, corresponding to an example of a display control program for displaying the content C1 or the like on the screen) stored in the storage device inside the terminal device 10 by the CPU, MPU, or the like use the RAM as a work area. It is realized by being executed. For example, these various programs correspond to application programs called web browsers. Further, the control unit 15 is realized by, for example, an integrated circuit such as an ASIC or FPGA.

図8に示すように、制御部15は、受信部151と、表示制御部152と、受付部153と、送信部154とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部15の内部構成は、図8に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。 As shown in FIG. 8, the control unit 15 includes a reception unit 151, a display control unit 152, a reception unit 153, and a transmission unit 154, and realizes or executes an information processing function or operation described below. To do. The internal configuration of the control unit 15 is not limited to the configuration shown in FIG. 8, and may be another configuration as long as it is a configuration for performing information processing described later.

(受信部151)
受信部151は、各種情報を受信する。受信部151は、外部の情報処理装置から各種情報を受信する。受信部151は、情報処理装置100等の他の情報処理装置から各種情報を受信する。図1の例では、受信部151は、情報処理装置100からコンテンツC1を受信する。また、受信部151は、情報処理装置100からコンテンツC1の部分コンテンツC11を受信する。また、受信部151は、情報処理装置100からコンテンツC1の部分コンテンツC12を受信する。また、受信部151は、情報処理装置100からクラスタCL1〜CL3に関するクラスタ情報を受信する。
(Receiver 151)
The receiving unit 151 receives various information. The receiving unit 151 receives various information from an external information processing device. The receiving unit 151 receives various information from other information processing devices such as the information processing device 100. In the example of FIG. 1, the receiving unit 151 receives the content C1 from the information processing device 100. Further, the receiving unit 151 receives the partial content C11 of the content C1 from the information processing device 100. Further, the receiving unit 151 receives the partial content C12 of the content C1 from the information processing device 100. Further, the receiving unit 151 receives the cluster information regarding the clusters CL1 to CL3 from the information processing device 100.

(表示制御部152)
表示制御部152は、各種表示を制御する。表示制御部152は、表示部13の表示を制御する。表示制御部152は、受信部151による受信に応じて、表示部13の表示を制御する。表示制御部152は、受信部151により受信された情報に基づいて、表示部13の表示を制御する。表示制御部152は、受付部153により受け付けられた情報に基づいて、表示部13の表示を制御する。表示制御部152は、受付部153による受付けに応じて、表示部13の表示を制御する。表示制御部152は、表示部13にコンテンツが表示されるように表示部13の表示を制御する。
(Display control unit 152)
The display control unit 152 controls various displays. The display control unit 152 controls the display of the display unit 13. The display control unit 152 controls the display of the display unit 13 in response to the reception by the reception unit 151. The display control unit 152 controls the display of the display unit 13 based on the information received by the reception unit 151. The display control unit 152 controls the display of the display unit 13 based on the information received by the reception unit 153. The display control unit 152 controls the display of the display unit 13 in response to the reception by the reception unit 153. The display control unit 152 controls the display of the display unit 13 so that the content is displayed on the display unit 13.

図1の例では、表示制御部152は、コンテンツC1が表示されるように表示部13の表示を制御する。また、表示制御部152は、コンテンツC1の部分コンテンツC11が表示されるように表示部13の表示を制御する。また、表示制御部152は、コンテンツC1の部分コンテンツC12が表示されるように表示部13の表示を制御する。また、表示制御部152は、コンテンツC1の部分コンテンツC12に含まれる表示領域F21〜F23のそれぞれにクラスタCL1〜CL3に関するクラスタ情報が表示されるように表示部13の表示を制御する。 In the example of FIG. 1, the display control unit 152 controls the display of the display unit 13 so that the content C1 is displayed. Further, the display control unit 152 controls the display of the display unit 13 so that the partial content C11 of the content C1 is displayed. Further, the display control unit 152 controls the display of the display unit 13 so that the partial content C12 of the content C1 is displayed. Further, the display control unit 152 controls the display of the display unit 13 so that the cluster information regarding the clusters CL1 to CL3 is displayed in each of the display areas F21 to F23 included in the partial content C12 of the content C1.

(受付部153)
受付部153は、各種情報を受け付ける。例えば、受付部153は、入力部12を介してユーザによる入力を受け付ける。受付部153は、ユーザによる操作を受け付ける。受付部153は、表示部13により表示された情報に対するユーザの操作を受け付ける。受付部153は、ユーザによる文字入力を受け付ける。受付部153は、ユーザによるクラスタ数の入力を受け付ける。受付部153は、コンテンツC1の部分コンテンツC11に含まれる入力フィールドF11への文字入力により、クラスタ数の入力を受け付ける。受付部153は、ユーザにより入力フィールドF11に入力された数字をクラスタ数として受け付ける。
(Reception Department 153)
The reception unit 153 receives various information. For example, the reception unit 153 receives an input by the user via the input unit 12. The reception unit 153 accepts operations by the user. The reception unit 153 accepts the user's operation on the information displayed by the display unit 13. The reception unit 153 accepts character input by the user. The reception unit 153 accepts the input of the number of clusters by the user. The reception unit 153 accepts the input of the number of clusters by inputting characters into the input field F11 included in the partial content C11 of the content C1. The reception unit 153 accepts the number input by the user in the input field F11 as the number of clusters.

また、受付部153は、ユーザによる複数のクエリの入力を受け付ける。受付部153は、コンテンツC1の部分コンテンツC11に含まれる入力フィールドF12への文字入力により、クエリの入力を受け付ける。受付部153は、ユーザにより入力フィールドF12に入力された文字列をクエリとして受け付ける。また、受付部153は、区切り文字で区切られた各文字列を各クエリとして受け付ける。 In addition, the reception unit 153 accepts input of a plurality of queries by the user. The reception unit 153 accepts the input of the query by inputting characters into the input field F12 included in the partial content C11 of the content C1. The reception unit 153 accepts the character string input by the user in the input field F12 as a query. Further, the reception unit 153 accepts each character string separated by a delimiter as each query.

また、受付部153は、ユーザによる送信ボタンB11の選択操作を受け付ける。受付部153は、入力部12によって受け付けられた送信ボタンB11の選択操作を受け付ける。 In addition, the reception unit 153 accepts the user's selection operation of the transmission button B11. The reception unit 153 accepts the selection operation of the transmission button B11 received by the input unit 12.

図1の例では、受付部153は、クラスタ数である数字「3」の入力を受け付ける。受付部153は、コンテンツC1の部分コンテンツC11に含まれる入力フィールドF11への文字入力により、クラスタ数「3」の入力を受け付ける。 In the example of FIG. 1, the reception unit 153 accepts the input of the number “3” which is the number of clusters. The reception unit 153 accepts the input of the number of clusters "3" by inputting characters into the input field F11 included in the partial content C11 of the content C1.

また、受付部153は、区切り文字で区切られた12個の文字列である12個のクエリQ1-1〜Q1-12の入力を受け付ける。受付部153は、コンテンツC1の部分コンテンツC11に含まれる入力フィールドF12への文字入力により、12個のクエリQ1-1〜Q1-12の入力を受け付ける。受付部153は、利用者U11により入力フィールドF12に入力された12個の文字列である12個の文字列「車種T11」〜文字列「車種T26」の入力を受け付ける。 In addition, the reception unit 153 accepts inputs of 12 queries Q1-1 to Q1-12, which are 12 character strings separated by delimiters. The reception unit 153 accepts the input of 12 queries Q1-1 to Q1-12 by inputting characters into the input field F12 included in the partial content C11 of the content C1. The reception unit 153 accepts input of 12 character strings "vehicle type T11" to character strings "vehicle type T26", which are 12 character strings input by the user U11 in the input field F12.

また、受付部153は、利用者U11による送信ボタンB11の選択操作を受け付ける。受付部153は、入力部12によって受け付けられた送信ボタンB11の選択操作を受け付ける。受付部153は、表示部13を介して受け付けられた送信ボタンB11の選択操作を受け付ける。 In addition, the reception unit 153 accepts the selection operation of the transmission button B11 by the user U11. The reception unit 153 accepts the selection operation of the transmission button B11 received by the input unit 12. The reception unit 153 accepts the selection operation of the transmission button B11 received via the display unit 13.

(送信部154)
送信部154は、外部の情報処理装置へ各種情報を送信する。例えば、送信部154は、情報処理装置100等の他の情報処理装置へ各種情報を送信する。送信部154は、記憶部14に記憶された情報を送信する。また、送信部154は、情報処理装置100等の他の情報処理装置からの情報に基づいて、各種情報を送信する。送信部154は、記憶部14に記憶された情報に基づいて、各種情報を送信する。送信部154は、受付部153によって受け付けられた情報を送信する。
(Transmission unit 154)
The transmission unit 154 transmits various information to an external information processing device. For example, the transmission unit 154 transmits various information to another information processing device such as the information processing device 100. The transmission unit 154 transmits the information stored in the storage unit 14. Further, the transmission unit 154 transmits various information based on information from another information processing device such as the information processing device 100. The transmission unit 154 transmits various types of information based on the information stored in the storage unit 14. The transmission unit 154 transmits the information received by the reception unit 153.

送信部154は、受付部153によって受け付けられたクラスタ数と複数のクエリを情報処理装置100に送信する。具体的には、送信部154は、受付部153によって送信ボタンB11の選択操作が受け付けられると、受付部153によって受け付けられたクラスタ数と複数のクエリを情報処理装置100に送信する。 The transmission unit 154 transmits the number of clusters received by the reception unit 153 and a plurality of queries to the information processing device 100. Specifically, when the reception unit 153 accepts the selection operation of the transmission button B11, the transmission unit 154 transmits the number of clusters accepted by the reception unit 153 and a plurality of queries to the information processing device 100.

図1の例では、送信部154は、受付部153によって送信ボタンB11の選択操作が受け付けられると、受付部153によって受け付けられたクラスタ数「3」を情報処理装置100に送信する。送信部154は、受付部153によって受け付けられた数字であるクラスタ数「3」を情報処理装置100に送信する。 In the example of FIG. 1, when the reception unit 153 accepts the selection operation of the transmission button B11, the transmission unit 154 transmits the number of clusters "3" accepted by the reception unit 153 to the information processing device 100. The transmission unit 154 transmits the number of clusters “3”, which is a number received by the reception unit 153, to the information processing device 100.

また、送信部154は、受付部153によって送信ボタンB11の選択操作が受け付けられると、受付部153によって受け付けられた12個のクエリQ1-1〜Q1-12を情報処理装置100に送信する。送信部154は、受付部153によって受け付けられた12個の文字列である12個のクエリQ2-1〜Q2-3を情報処理装置100に送信する。 Further, when the reception unit 153 accepts the selection operation of the transmission button B11, the transmission unit 154 transmits 12 queries Q1-1 to Q1-12 received by the reception unit 153 to the information processing device 100. The transmission unit 154 transmits 12 queries Q2-1 to Q2-3, which are 12 character strings received by the reception unit 153, to the information processing device 100.

〔4.情報処理のフロー〕
次に、図9を用いて、実施形態に係る情報処理の手順について説明する。図9は、実施形態に係る情報処理手順を示すフローチャートである。図9に示す例では、情報処理装置100は、複数のクエリと指定クラスタ数とを端末装置10から受け付けたか否かを判定する(ステップS101)。情報処理装置100は、複数のクエリと指定クラスタ数とを受け付けなかった場合(ステップS101;No)、複数のクエリと指定クラスタ数とを受け付けるまで待機する。
[4. Information processing flow]
Next, the procedure of information processing according to the embodiment will be described with reference to FIG. FIG. 9 is a flowchart showing an information processing procedure according to the embodiment. In the example shown in FIG. 9, the information processing apparatus 100 determines whether or not a plurality of queries and a specified number of clusters have been received from the terminal apparatus 10 (step S101). When the information processing apparatus 100 does not accept a plurality of queries and a specified number of clusters (step S101; No), the information processing apparatus 100 waits until the plurality of queries and the specified number of clusters are accepted.

続いて、情報処理装置100は、複数のクエリと指定クラスタ数とを受け付けた場合(ステップS101;Yes)、複数のクエリを指定クラスタ数に分類することにより生成したクラスタに関するクラスタ情報を生成する(ステップS102)。 Subsequently, when the information processing apparatus 100 receives a plurality of queries and a specified number of clusters (step S101; Yes), the information processing apparatus 100 generates cluster information regarding the generated clusters by classifying the plurality of queries into the specified number of clusters (step S101; Yes). Step S102).

続いて、情報処理装置100は、クラスタ情報を生成すると、生成したクラスタ情報を端末装置10に出力する(ステップS103)。 Subsequently, when the information processing apparatus 100 generates the cluster information, the information processing apparatus 100 outputs the generated cluster information to the terminal apparatus 10 (step S103).

〔5.変形例〕
上述した実施形態に係る情報処理システム1は、上記実施形態以外にも種々の異なる形態にて実施されてよい。そこで、以下では、情報処理システム1の他の実施形態について説明する。なお、実施形態と同一部分には、同一符号を付して説明を省略する。
[5. Modification example]
The information processing system 1 according to the above-described embodiment may be implemented in various different forms other than the above-described embodiment. Therefore, another embodiment of the information processing system 1 will be described below. The same parts as those in the embodiment are designated by the same reference numerals, and the description thereof will be omitted.

〔5−1.指定クラスタ数よりも少ないクラスタ数のクラスタ情報〕
情報処理装置100は、数の対象情報を指定クラスタ数よりも少ない数のクラスタに分類することにより生成したクラスタに関するクラスタ情報を生成する。また、情報処理装置100は、生成したクラスタ情報を指定クラスタ情報と比較可能に出力する。
[5-1. Cluster information for clusters less than the specified number of clusters]
The information processing apparatus 100 generates cluster information about the clusters generated by classifying the target information of the number into clusters having a number smaller than the number of designated clusters. Further, the information processing apparatus 100 outputs the generated cluster information in a comparable manner with the designated cluster information.

具体的には、生成部133は、複数の対象情報を指定クラスタ数よりも少ない数のクラスタに分類することにより生成したクラスタに関するクラスタ情報を生成する。続いて、出力部134は、生成部133によって生成されたクラスタ情報を指定クラスタ情報と比較可能に出力する。具体的には、生成部133は、指定クラスタ情報とクラスタ情報とを対比可能に上下に並べて表示する部分コンテンツC12を生成する。例えば、生成部133は、図1に示すような指定クラスタ数「3」の3つのクラスタCL1〜クラスタCL3に関する指定クラスタ情報を生成する。また、生成部133は、指定クラスタ数「3」より少ないクラスタ数「2」の2つのクラスタCL1(Q1-1、Q1-2、Q1-3、Q1-7、Q1-8、Q1-11)とクラスタCL2(Q1-4、Q1-5、Q1-6、Q1-9、Q1-10、Q1-12)に関するクラスタ情報を生成する。続いて、生成部133は、指定クラスタ情報とクラスタ情報とを対比可能に上下に並べて表示する部分コンテンツC12を生成する。続いて、出力部134は、生成部によって生成された部分コンテンツC12を出力する。 Specifically, the generation unit 133 generates cluster information regarding the generated clusters by classifying the plurality of target information into clusters having a number smaller than the number of designated clusters. Subsequently, the output unit 134 outputs the cluster information generated by the generation unit 133 so as to be comparable to the designated cluster information. Specifically, the generation unit 133 generates the partial content C12 that displays the designated cluster information and the cluster information side by side so as to be comparable. For example, the generation unit 133 generates the designated cluster information regarding the three clusters CL1 to CL3 having the designated number of clusters “3” as shown in FIG. In addition, the generation unit 133 has two clusters CL1 (Q1-1, Q1-2, Q1-3, Q1-7, Q1-8, Q1-11) having a number of clusters "2" less than the designated number of clusters "3". And cluster CL2 (Q1-4, Q1-5, Q1-6, Q1-9, Q1-10, Q1-12) to generate cluster information. Subsequently, the generation unit 133 generates the partial content C12 that displays the designated cluster information and the cluster information side by side so as to be comparable. Subsequently, the output unit 134 outputs the partial content C12 generated by the generation unit.

また、生成部133は、指定クラスタ情報とクラスタ情報との相違点(差分)に相当するクエリの文字色を変えた情報を生成してもよい。例えば、生成部133は、指定クラスタ数「3」の場合にクラスタCL3に分類されていた(Q1-11、Q1-12)の文字色を他のクエリとは異なる色(例えば、赤色)に着色した情報を生成する。続いて、生成部133は、指定クラスタ情報とクラスタ情報とを対比可能に上下に並べて表示する部分コンテンツC12を生成する。続いて、出力部134は、生成部133によって生成された部分コンテンツC12を出力する。 Further, the generation unit 133 may generate information in which the character color of the query corresponding to the difference (difference) between the designated cluster information and the cluster information is changed. For example, the generation unit 133 colors the character color of the cluster CL3 (Q1-11, Q1-12) in the case of the designated number of clusters "3" to a color different from other queries (for example, red). Generate the information. Subsequently, the generation unit 133 generates the partial content C12 that displays the designated cluster information and the cluster information side by side so as to be comparable. Subsequently, the output unit 134 outputs the partial content C12 generated by the generation unit 133.

〔6.第1モデルの生成処理〕
次に、図10を用いて、第1モデルの生成処理の流れについて説明する。図10は、実施形態に係る第1モデルの生成処理の一例を示す図である。図10に示す例では、生成装置50は、同一の利用者U1によって所定の時間内に連続して入力された「六本木 パスタ」という検索クエリQ11と「六本木 イタリアン」という検索クエリQ12とから成る一対の検索クエリを抽出する(ステップS11)。
[6. First model generation process]
Next, the flow of the generation process of the first model will be described with reference to FIG. FIG. 10 is a diagram showing an example of the generation process of the first model according to the embodiment. In the example shown in FIG. 10, the generator 50 is a pair consisting of a search query Q11 "Roppongi pasta" and a search query Q12 "Roppongi Italian" continuously input by the same user U1 within a predetermined time. The search query of is extracted (step S11).

続いて、生成装置50は、抽出した検索クエリQ11を第1モデルM1に入力して、検索クエリQ11の分散表現であるベクトルBQV11を出力する。ここで、ベクトルBQV11は、第1モデルM1の出力層から出力されたばかりの検索クエリQ11の分散表現であって、第1モデルM1にフィードバックをかける前(学習前)の分散表現を示す。また、生成装置50は、抽出した検索クエリQ12を第1モデルM1に入力して、検索クエリQ12の分散表現であるベクトルBQV12を出力する。ここで、ベクトルBQV12は、第1モデルM1の出力層から出力されたばかりの検索クエリQ12の分散表現であって、第1モデルM1にフィードバックをかける前(学習前)の分散表現を示す。このようにして、生成装置50は、検索クエリQ11の分散表現であるベクトルBQV11と、検索クエリQ12の分散表現であるベクトルBQV12とを出力する(ステップS12)。 Subsequently, the generation device 50 inputs the extracted search query Q11 into the first model M1 and outputs a vector BQV11 which is a distributed representation of the search query Q11. Here, the vector BQV11 is a distributed representation of the search query Q11 just output from the output layer of the first model M1, and shows a distributed representation before giving feedback to the first model M1 (before learning). Further, the generation device 50 inputs the extracted search query Q12 into the first model M1 and outputs a vector BQV12 which is a distributed representation of the search query Q12. Here, the vector BQV12 is a distributed representation of the search query Q12 just output from the output layer of the first model M1, and shows a distributed representation before giving feedback to the first model M1 (before learning). In this way, the generation device 50 outputs the vector BQV11 which is the distributed representation of the search query Q11 and the vector BQV12 which is the distributed representation of the search query Q12 (step S12).

続いて、生成装置50は、同一の利用者U1によって所定の時間内に連続して入力された検索クエリQ11(「六本木 パスタ」)と検索クエリQ12(「六本木 イタリアン」)とから成る一対の検索クエリは、所定の検索意図(例えば、「ある場所で飲食店を探す」という検索意図)で入力された検索クエリであると推定されるため、相互に類似する特徴を有するものとして、検索クエリQ11の分散表現(ベクトルQV11)と、検索クエリQ11と対となる検索クエリQ12の分散表現(ベクトルQV12)とが、分散表現空間上で類似するように第1モデルM1を学習させる。例えば、第1モデルM1にフィードバックをかける前(学習前)の検索クエリQ11の分散表現であるベクトルBQV11と検索クエリQ12の分散表現であるベクトルBQV12とのなす角度の大きさをΘとする。また、第1モデルM1にフィードバックをかけた後(学習後)の検索クエリQ11の分散表現であるベクトルQV11と検索クエリQ12の分散表現であるベクトルQV12とのなす角度の大きさをΦとする。この時、生成装置50は、ΘよりもΦが小さくなるように、第1モデルM1を学習させる。例えば、生成装置50は、ベクトルBQV11とベクトルBQV12のコサイン類似度の値を算出する。また、生成装置50は、ベクトルQV11とベクトルQV12のコサイン類似度の値を算出する。続いて、生成装置50は、ベクトルBQV11とベクトルBQV12のコサイン類似度の値よりも、ベクトルQV11とベクトルQV12のコサイン類似度の値が大きくなるように(値が1に近づくように)第1モデルM1を学習させる。このように、生成装置50は、一対の検索クエリに対応する一対の分散表現である2つのベクトルが分散表現空間上で類似するように第1モデルM1を学習させることで、検索クエリから分散表現を出力する第1モデルM1を生成する(ステップS13)。なお、生成装置50は、コサイン類似度に限らず、ベクトル間の距離尺度として適用可能な指標であれば、どのような指標に基づいて分散表現の間の類似度を算出してもよい。また、生成装置50は、ベクトル間の距離尺度として適用可能な指標であれば、どのような指標に基づいて第1モデルM1を学習させてもよい。例えば、生成装置50は、分散表現同士のユークリッド距離や双曲空間等の非ユークリッド空間中での距離、マンハッタン距離、マハラノビス距離等といった所定の距離関数の値を算出する。続いて、生成装置50は、分散表現同士の所定の距離関数の値(すなわち、分散表現空間における距離)が小さくなるように第1モデルM1を学習させてもよい。 Subsequently, the generator 50 is a pair of searches including the search query Q11 (“Roppongi pasta”) and the search query Q12 (“Roppongi Italian”) that are continuously input by the same user U1 within a predetermined time. Since the query is presumed to be a search query entered with a predetermined search intention (for example, a search intention of "searching for a restaurant in a certain place"), the search query Q11 is assumed to have similar characteristics to each other. The first model M1 is trained so that the distributed representation (vector QV11) of the above and the distributed representation (vector QV12) of the search query Q12 paired with the search query Q11 are similar in the distributed representation space. For example, let Θ be the magnitude of the angle formed by the vector BQV11 which is the distributed representation of the search query Q11 before giving feedback to the first model M1 (before learning) and the vector BQV12 which is the distributed representation of the search query Q12. Further, let Φ be the size of the angle formed by the vector QV11 which is the distributed representation of the search query Q11 after giving feedback to the first model M1 (after learning) and the vector QV12 which is the distributed representation of the search query Q12. At this time, the generator 50 trains the first model M1 so that Φ is smaller than Θ. For example, the generator 50 calculates the value of the cosine similarity between the vector BQV11 and the vector BQV12. Further, the generation device 50 calculates the value of the cosine similarity between the vector QV11 and the vector QV12. Subsequently, the generator 50 uses the first model so that the cosine similarity values of the vector QV11 and the vector QV12 are larger than the cosine similarity values of the vector BQV11 and the vector BQV12 (so that the values approach 1). Learn M1. In this way, the generation device 50 trains the first model M1 so that the two vectors, which are a pair of distributed representations corresponding to the pair of search queries, are similar in the distributed representation space, so that the distributed representation is expressed from the search query. The first model M1 that outputs the above is generated (step S13). The generator 50 is not limited to the cosine similarity, and may calculate the similarity between the distributed representations based on any index as long as it is an index applicable as a distance scale between vectors. Further, the generation device 50 may train the first model M1 based on any index as long as it is an index applicable as a distance scale between vectors. For example, the generation device 50 calculates the value of a predetermined distance function such as the Euclidean distance between distributed expressions, the distance in a non-Euclidean space such as a hyperbolic space, the Manhattan distance, and the Mahalanobis distance. Subsequently, the generation device 50 may train the first model M1 so that the value of a predetermined distance function between the distributed representations (that is, the distance in the distributed representation space) becomes small.

次に、図11を用いて、第1モデルの生成処理の流れについてより詳しく説明する。なお、図11の説明では、図9の説明と重複する部分は、適宜省略する。図11は、実施形態に係る第1モデルの生成処理を示す図である。図11に示す例では、生成装置50が生成した第1モデルM1によって出力された分散表現が分散表現空間にマッピングされる様子が示されている。生成装置50は、所定の検索クエリの分散表現と所定の検索クエリと対となる他の検索クエリの分散表現とが分散表現空間上で近くにマッピングされるように第1モデルM1のトレーニングを行う。 Next, the flow of the generation process of the first model will be described in more detail with reference to FIG. In the description of FIG. 11, a part that overlaps with the description of FIG. 9 will be omitted as appropriate. FIG. 11 is a diagram showing a generation process of the first model according to the embodiment. In the example shown in FIG. 11, the distributed representation output by the first model M1 generated by the generation device 50 is mapped to the distributed representation space. The generation device 50 trains the first model M1 so that the distributed representation of a predetermined search query and the distributed representation of another search query paired with the predetermined search query are mapped close to each other on the distributed representation space. ..

図11の上段に示す例では、生成装置50は、同一の利用者U1によって所定の時間内に連続して入力された4個の検索クエリである検索クエリQ11(「六本木 パスタ」)、検索クエリQ12(「六本木 イタリアン」)、検索クエリQ13(「赤坂 パスタ」)、検索クエリQ14(「麻布 パスタ」)を抽出する。生成装置50は、同一の利用者U1によって各検索クエリが入力された時間の間隔が所定の時間内である4個の検索クエリを抽出する。生成装置50は、同一の利用者U1によって後述する各検索クエリのペアが入力された時間の間隔が所定の時間内である複数の検索クエリを抽出する。生成装置50は、検索クエリが入力された順番に並べると、検索クエリQ11、検索クエリQ12、検索クエリQ13、検索クエリQ14の順番で入力された4個の検索クエリを抽出する。生成装置50は、4個の検索クエリを抽出すると、時系列的に隣り合う2つの検索クエリを一対の検索クエリとして、3対の検索クエリのペアである(検索クエリQ11、検索クエリQ12)、(検索クエリQ12、検索クエリQ13)、(検索クエリQ13、検索クエリQ14)を抽出する(ステップS21−1)。なお、生成装置50は、同一の利用者U1によって全ての検索クエリが所定の時間内に入力された複数の検索クエリを抽出してもよい。そして、生成装置50は、時系列的に隣り合うか否かに関わらず、抽出した複数の検索クエリの中から2つの検索クエリを選択して、選択した2つの検索クエリを一対の検索クエリとして抽出してもよい。 In the example shown in the upper part of FIG. 11, the generation device 50 is a search query Q11 (“Roppongi pasta”), which is four search queries continuously input by the same user U1 within a predetermined time, and a search query. Extract Q12 (“Roppongi Italian”), search query Q13 (“Akasaka pasta”), and search query Q14 (“Azabu pasta”). The generation device 50 extracts four search queries in which the time interval in which each search query is input by the same user U1 is within a predetermined time. The generation device 50 extracts a plurality of search queries in which the time interval in which each search query pair described later is input by the same user U1 is within a predetermined time. When the search query 50 is arranged in the order in which the search queries are input, the generation device 50 extracts four search queries input in the order of the search query Q11, the search query Q12, the search query Q13, and the search query Q14. When the generation device 50 extracts four search queries, it is a pair of three search queries (search query Q11, search query Q12), with two search queries adjacent in chronological order as a pair of search queries. (Search query Q12, search query Q13) and (search query Q13, search query Q14) are extracted (step S21-1). The generation device 50 may extract a plurality of search queries in which all the search queries are input within a predetermined time by the same user U1. Then, the generation device 50 selects two search queries from the extracted plurality of search queries regardless of whether they are adjacent to each other in chronological order, and uses the two selected search queries as a pair of search queries. It may be extracted.

続いて、生成装置50は、抽出した検索クエリQ1k(k=1、2、3、4)を第1モデルM1に入力して、検索クエリQ1k(k=1、2、3、4)の分散表現であるベクトルBQV1k(k=1、2、3、4)を出力する。ここで、ベクトルBQV1k(k=1、2、3、4)は、第1モデルM1の出力層から出力されたばかりの検索クエリQ1k(k=1、2、3、4)の分散表現であって、第1モデルM1にフィードバックをかける前(学習前)の分散表現を示す(ステップS22−1)。 Subsequently, the generation device 50 inputs the extracted search query Q1k (k = 1, 2, 3, 4) into the first model M1, and distributes the search query Q1k (k = 1, 2, 3, 4). The representation vector BQV1k (k = 1, 2, 3, 4) is output. Here, the vector BQV1k (k = 1, 2, 3, 4) is a distributed representation of the search query Q1k (k = 1, 2, 3, 4) just output from the output layer of the first model M1. , The distributed representation before giving feedback to the first model M1 (before learning) is shown (step S22-1).

続いて、生成装置50は、同一の利用者U1によって所定の時間内に連続して入力された一対の検索クエリは、所定の検索意図(例えば、「ある場所(東京都港区付近)で飲食店を探す」という検索意図)で入力された検索クエリであると推定されるため、相互に類似する特徴を有するものとして、検索クエリQ11の分散表現(ベクトルQV11)と、検索クエリQ11と対となる検索クエリQ12の分散表現(ベクトルQV12)とが、分散表現空間上で類似するように第1モデルM1を学習させる。また、生成装置50は、検索クエリQ12の分散表現(ベクトルQV12)と、検索クエリQ12と対となる検索クエリQ13の分散表現(ベクトルQV13)とが、分散表現空間上で類似するように第1モデルM1を学習させる。また、生成装置50は、検索クエリQ13の分散表現(ベクトルQV13)と、検索クエリQ13と対となる検索クエリQ14の分散表現(ベクトルQV14)とが、分散表現空間上で類似するように第1モデルM1を学習させる。このように、生成装置50は、一対の検索クエリに対応する一対の分散表現である2つのベクトルが分散表現空間上で類似するように第1モデルM1を学習させることで、検索クエリから分散表現を出力する第1モデルM1を生成する(ステップS23−1)。 Subsequently, in the generator 50, a pair of search queries continuously input by the same user U1 within a predetermined time is subjected to a predetermined search intention (for example, "eating and drinking at a certain place (near Minato-ku, Tokyo)). Since it is presumed that the search query was entered with the search intent of "finding a store"), the distributed representation of the search query Q11 (vector QV11) and the pair with the search query Q11 are assumed to have similar characteristics to each other. The first model M1 is trained so that the distributed representation (vector QV12) of the search query Q12 is similar on the distributed representation space. Further, in the generation device 50, the first distributed representation of the search query Q12 (vector QV12) and the distributed representation of the search query Q13 paired with the search query Q12 (vector QV13) are similar in the distributed representation space. Train model M1. Further, in the generation device 50, the first distributed representation of the search query Q13 (vector QV13) and the distributed representation of the search query Q14 paired with the search query Q13 (vector QV14) are similar in the distributed representation space. Train model M1. In this way, the generation device 50 trains the first model M1 so that the two vectors, which are a pair of distributed representations corresponding to the pair of search queries, are similar in the distributed representation space, so that the distributed representation is expressed from the search query. The first model M1 that outputs the above is generated (step S23-1).

図11の上段に示す情報処理の結果として、検索クエリQ1k(k=1、2、3、4)の分散表現であるベクトルQV1k(k=1、2、3、4)が分散表現空間の近い位置にクラスタCL11としてマッピングされる様子が示されている。例えば、検索クエリQ1k(k=1、2、3、4)は、利用者U1によって「ある場所(東京都港区付近)で飲食店を探す」という検索意図の下で検索された検索クエリの集合であると推定される。すなわち、検索クエリQ1k(k=1、2、3、4)は、「ある場所(東京都港区付近)で飲食店を探す」という検索意図の下で検索された検索クエリであるという点で、相互に類似する特徴を有する検索クエリであると推定される。ここで、生成装置50は、「ある場所(東京都港区付近)で飲食店を探す」という検索意図で入力された所定の検索クエリが第1モデルに入力されると、クラスタCL11の位置にマッピングされるような分散表現を出力することができる。これにより、例えば、生成装置50は、クラスタCL11の位置にマッピングされる分散表現に対応する検索クエリを抽出することにより、「ある場所(東京都港区付近)で飲食店を探す」という検索意図に応じた検索クエリを抽出することができる。したがって、生成装置50は、検索クエリの意味を適切に解釈可能とすることができる。 As a result of the information processing shown in the upper part of FIG. 11, the vector QV1k (k = 1, 2, 3, 4), which is a distributed representation of the search query Q1k (k = 1, 2, 3, 4), is close to the distributed representation space. It is shown that the location is mapped as cluster CL11. For example, the search query Q1k (k = 1, 2, 3, 4) is a search query searched by the user U1 with the search intention of "searching for a restaurant in a certain place (near Minato-ku, Tokyo)". It is presumed to be a set. That is, the search query Q1k (k = 1, 2, 3, 4) is a search query searched with the search intention of "searching for a restaurant in a certain place (near Minato-ku, Tokyo)". , It is presumed that the search query has similar characteristics to each other. Here, when a predetermined search query input with the search intention of "searching for a restaurant in a certain place (near Minato-ku, Tokyo)" is input to the first model, the generator 50 is placed at the position of the cluster CL11. It is possible to output a distributed representation that is mapped. As a result, for example, the generator 50 has a search intention of "searching for a restaurant in a certain place (near Minato-ku, Tokyo)" by extracting a search query corresponding to the distributed representation mapped to the position of the cluster CL11. Search queries can be extracted according to. Therefore, the generation device 50 can appropriately interpret the meaning of the search query.

図11の下段に示す例では、生成装置50は、同一の利用者U2によって所定の時間内に連続して入力された3個の検索クエリである検索クエリQ21(「冷蔵庫 400L」)、検索クエリQ22(「冷蔵庫 中型」)、検索クエリQ23(「冷蔵庫 中型 おすすめ」)を抽出する。生成装置50は、検索クエリが入力された順番に並べると、検索クエリQ21、検索クエリQ22、検索クエリQ23の順番で入力された3個の検索クエリを抽出する。生成装置50は、3個の検索クエリを抽出すると、時系列的に隣り合う2つの検索クエリを一対の検索クエリとして、2対の検索クエリのペアである(検索クエリQ21、検索クエリQ22)、(検索クエリQ22、検索クエリQ23)を抽出する(ステップS21−2)。 In the example shown in the lower part of FIG. 11, the generator 50 is a search query Q21 (“refrigerator 400L”), which is three search queries continuously input by the same user U2 within a predetermined time, and a search query. Extract Q22 ("refrigerator medium size") and search query Q23 ("refrigerator medium size recommended"). When the generation device 50 arranges the search queries in the order in which they are input, the generation device 50 extracts three search queries input in the order of the search query Q21, the search query Q22, and the search query Q23. When the generator 50 extracts three search queries, it is a pair of two search queries (search query Q21, search query Q22), with two search queries adjacent in chronological order as a pair of search queries. (Search query Q22, search query Q23) is extracted (step S21-2).

続いて、生成装置50は、抽出した検索クエリQ2m(m=1、2、3)を第1モデルM1に入力して、検索クエリQ2m(m=1、2、3)の分散表現であるベクトルBQV2m(m=1、2、3)を出力する。ここで、ベクトルBQV2m(m=1、2、3)は、第1モデルM1の出力層から出力されたばかりの検索クエリQ2m(m=1、2、3)の分散表現であって、第1モデルM1にフィードバックをかける前(学習前)の分散表現を示す(ステップS22−2)。 Subsequently, the generation device 50 inputs the extracted search query Q2m (m = 1, 2, 3) into the first model M1, and a vector that is a distributed representation of the search query Q2m (m = 1, 2, 3). BQV2m (m = 1, 2, 3) is output. Here, the vector BQV2m (m = 1, 2, 3) is a distributed representation of the search query Q2m (m = 1, 2, 3) just output from the output layer of the first model M1, and is the first model. The distributed expression before giving feedback to M1 (before learning) is shown (step S22-2).

続いて、生成装置50は、同一の利用者U2によって所定の時間内に連続して入力された一対の検索クエリは、所定の検索意図(例えば、「中型の冷蔵庫を調べる」という検索意図)で入力された検索クエリであると推定されるため、相互に類似する特徴を有するものとして、検索クエリQ21の分散表現(ベクトルQV21)と、検索クエリQ21と対となる検索クエリQ22の分散表現(ベクトルQV22)とが、分散表現空間上で類似するように第1モデルM1を学習させる。また、生成装置50は、検索クエリQ22の分散表現(ベクトルQV22)と、検索クエリQ22と対となる検索クエリQ23の分散表現(ベクトルQV23)とが、分散表現空間上で類似するように第1モデルM1を学習させる。このように、生成装置50は、一対の検索クエリに対応する一対の分散表現である2つのベクトルが分散表現空間上で類似するように第1モデルM1を学習させることで、検索クエリから分散表現を出力する第1モデルM1を生成する(ステップS23−2)。 Subsequently, in the generation device 50, a pair of search queries continuously input by the same user U2 within a predetermined time has a predetermined search intention (for example, a search intention of "examining a medium-sized refrigerator"). Since it is presumed to be an input search query, the distributed representation of the search query Q21 (vector QV21) and the distributed representation of the search query Q22 paired with the search query Q21 (vector) are assumed to have similar characteristics to each other. QV22) and the first model M1 are trained so as to be similar in the distributed expression space. Further, in the generation device 50, the first distributed representation of the search query Q22 (vector QV22) and the distributed representation of the search query Q23 paired with the search query Q22 (vector QV23) are similar in the distributed representation space. Train model M1. In this way, the generation device 50 trains the first model M1 so that the two vectors, which are a pair of distributed representations corresponding to the pair of search queries, are similar in the distributed representation space, so that the distributed representation is expressed from the search query. The first model M1 that outputs the above is generated (step S23-2).

図11の下段に示す情報処理の結果として、検索クエリQ2m(m=1、2、3)の分散表現であるベクトルQV2m(m=1、2、3)が分散表現空間の近い位置にクラスタCL21としてマッピングされる様子が示されている。例えば、検索クエリQ2m(m=1、2、3)は、利用者U2によって「中型の冷蔵庫を調べる」という検索意図の下で検索された検索クエリの集合であると推定される。すなわち、Q2m(m=1、2、3)は、「中型の冷蔵庫を調べる」という検索意図の下で検索された検索クエリであるという点で、相互に類似する特徴を有する検索クエリであると推定される。ここで、生成装置50は、「中型の冷蔵庫を調べる」という検索意図で入力された所定の検索クエリが第1モデルに入力されると、クラスタCL21の位置にマッピングされるような分散表現を出力することができる。これにより、例えば、生成装置50は、クラスタCL21の位置にマッピングされる分散表現に対応する検索クエリを抽出することにより、「中型の冷蔵庫を調べる」という検索意図に応じた検索クエリを抽出することができる。したがって、生成装置50は、検索クエリの意味を適切に解釈可能とすることができる。 As a result of the information processing shown in the lower part of FIG. 11, the vector QV2m (m = 1, 2, 3), which is a distributed representation of the search query Q2m (m = 1, 2, 3), is located near the distributed representation space of the cluster CL21. It is shown that it is mapped as. For example, the search query Q2m (m = 1, 2, 3) is presumed to be a set of search queries searched by the user U2 with the search intention of "checking a medium-sized refrigerator". That is, Q2m (m = 1, 2, 3) is a search query having characteristics similar to each other in that it is a search query searched with the search intention of "checking a medium-sized refrigerator". Presumed. Here, the generator 50 outputs a distributed representation that is mapped to the position of the cluster CL21 when a predetermined search query input with the search intention of "checking a medium-sized refrigerator" is input to the first model. can do. As a result, for example, the generator 50 extracts the search query corresponding to the distributed representation mapped to the position of the cluster CL21, thereby extracting the search query according to the search intention of "checking the medium-sized refrigerator". Can be done. Therefore, the generation device 50 can appropriately interpret the meaning of the search query.

また、本願発明に係る生成装置50は、ランダムに抽出された複数の検索クエリは、異なる検索意図の下で検索された検索クエリであるという点で、相互に相違する特徴を有する検索クエリであるとみなして第1モデルM1を学習させる。具体的には、生成装置50は、所定の検索クエリの分散表現と、所定の検索クエリとは無関係にランダムに抽出された検索クエリの分散表現とが分散表現空間上で遠くにマッピングされるように第1モデルM1のトレーニングを行う。図11に示す例では、生成装置50は、検索クエリQ11とは無関係にランダムに検索クエリを抽出したところ、検索クエリQ21が抽出されたとする。この場合、生成装置50は、検索クエリQ11の分散表現(ベクトルQV11)と、検索クエリQ11とは無関係にランダムに抽出された検索クエリQ21の分散表現(ベクトルQV21)とが分散表現空間上で遠くにマッピングされるように第1モデルM1のトレーニングを行う。その結果として、「ある場所(東京都港区付近)で飲食店を探す」という検索意図の下で検索された検索クエリQ1k(k=1、2、3、4)の分散表現であるベクトルQV1k(k=1、2、3、4)を含むクラスタCL11と、「中型の冷蔵庫を調べる」という検索意図の下で検索された検索クエリQ2m(m=1、2、3)の分散表現であるベクトルQV2m(m=1、2、3)を含むクラスタCL21とは、分散表現空間上で遠くにマッピングされる。すなわち、本願発明に係る生成装置50は、ランダムに抽出された複数の検索クエリの分散表現が相違するように第1モデルM1を学習させることにより、検索意図が異なる検索クエリの分散表現を分散表現空間上で遠い位置に出力可能とする。 Further, the generation device 50 according to the present invention is a search query having different characteristics from each other in that a plurality of randomly extracted search queries are search queries searched under different search intentions. Assuming that, the first model M1 is trained. Specifically, the generation device 50 maps the distributed representation of a predetermined search query and the distributed representation of a search query randomly extracted independently of the predetermined search query far away in the distributed representation space. The first model M1 is trained. In the example shown in FIG. 11, it is assumed that the generation device 50 randomly extracts the search query regardless of the search query Q11, and the search query Q21 is extracted. In this case, in the generation device 50, the distributed representation of the search query Q11 (vector QV11) and the distributed representation of the search query Q21 randomly extracted regardless of the search query Q11 (vector QV21) are far apart in the distributed representation space. The first model M1 is trained so as to be mapped to. As a result, the vector QV1k, which is a distributed expression of the search query Q1k (k = 1, 2, 3, 4) searched with the search intention of "searching for a restaurant in a certain place (near Minato-ku, Tokyo)". It is a distributed representation of cluster CL11 including (k = 1, 2, 3, 4) and search query Q2m (m = 1, 2, 3) searched with the search intention of "checking a medium-sized refrigerator". The cluster CL21 containing the vector QV2m (m = 1, 2, 3) is mapped far away on the distributed representation space. That is, the generator 50 according to the present invention trains the first model M1 so that the distributed expressions of a plurality of randomly extracted search queries are different, so that the distributed expressions of the search queries having different search intentions are distributed. It is possible to output to a distant position in space.

なお、生成装置50が生成した第1モデルM1によって出力された分散表現が分散表現空間にマッピングされた結果として、上述したクラスタCL11とクラスタCL21の他にも、同一のユーザによって所定の時間内に入力された複数の検索クエリの分散表現の集合であるクラスタCL12やクラスタCL22が生成される。 As a result of mapping the distributed representation output by the first model M1 generated by the generation device 50 to the distributed representation space, in addition to the cluster CL11 and the cluster CL21 described above, the same user within a predetermined time Cluster CL12 and cluster CL22, which are a set of distributed expressions of a plurality of input search queries, are generated.

上述したように、生成装置50は、ユーザによって入力された検索クエリを取得する。また、生成装置50は、取得した検索クエリのうち、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして学習することで、所定の検索クエリから所定の検索クエリの特徴情報を予測する第1モデルを生成する。すなわち、本願発明に係る生成装置50は、所定の時間内に連続して入力された複数の検索クエリは、所定の検索意図の下で検索された検索クエリであるという点で、相互に類似する特徴を有する検索クエリであるとみなして第1モデルを学習させる。具体的には、生成装置50は、同一のユーザによって所定の時間内に入力された複数の検索クエリの分散表現が類似するように第1モデルを学習させることで、所定の検索クエリから所定の検索クエリの特徴情報を含む分散表現を出力する第1モデルを生成する。すなわち、本願発明に係る生成装置50は、所定の時間内に連続して入力された複数の検索クエリの分散表現が類似するように第1モデルM1を学習させることにより、所定の検索意図の下で検索された検索クエリの分散表現を分散表現空間上で近い位置に出力可能とする。これにより、生成装置50は、検索クエリを入力したユーザのコンテクストに応じて検索クエリの意味(検索意図)を出力(解釈)することを可能にする。したがって、生成装置50は、検索クエリの意味を適切に解釈可能とすることができる。 As described above, the generator 50 acquires the search query entered by the user. Further, the generation device 50 learns from the acquired search queries that a plurality of search queries input by the same user within a predetermined time have similar characteristics, so that the generated search queries can be used as predetermined search queries. Generate a first model that predicts the feature information of the search query. That is, the generation device 50 according to the present invention is similar to each other in that a plurality of search queries continuously input within a predetermined time are search queries searched under a predetermined search intention. The first model is trained by regarding it as a search query having characteristics. Specifically, the generation device 50 trains the first model so that the distributed representations of a plurality of search queries input by the same user within a predetermined time are similar to each other, so that the first model is trained from the predetermined search query. Generate the first model that outputs the distributed representation including the feature information of the search query. That is, the generation device 50 according to the present invention trains the first model M1 so that the distributed representations of a plurality of search queries continuously input within a predetermined time are similar, so that the first model M1 is trained under a predetermined search intention. The distributed representation of the search query searched in is made possible to be output to a close position on the distributed representation space. This enables the generation device 50 to output (interpret) the meaning (search intention) of the search query according to the context of the user who input the search query. Therefore, the generation device 50 can appropriately interpret the meaning of the search query.

また、生成装置50は、所定の検索クエリの特徴情報を含む分散表現の近傍にマッピングされる分散表現に対応する検索クエリを抽出することにより、所定の検索クエリが検索された検索意図に応じた検索クエリを抽出することができる。すなわち、生成装置50は、検索クエリを入力したユーザの検索意図やコンテクストを考慮して、ユーザの検索動向を分析することを可能にする。したがって、生成装置50は、ユーザの検索動向の分析精度を高めることができる。また、生成装置50が生成した第1モデルM1を検索システムの一部として機能させることもできる。あるいは、生成装置50は、第1モデルM1によって予測された検索クエリの特徴情報を利用する他のシステム(例えば、検索エンジン)への入力情報として、第1モデルM1が出力した検索クエリの分散表現を提供することもできる。これにより、検索システムは、第1モデルM1によって予測された検索クエリの特徴情報に基づいて、検索結果として出力されるコンテンツを選択可能になる。すなわち、検索システムは、検索クエリを入力したユーザの検索意図やコンテクストを考慮して、検索結果として出力されるコンテンツを選択可能になる。さらに、検索システムは、第1モデルM1によって予測された検索クエリの特徴情報に基づいて、検索結果として出力されるコンテンツに含まれる文字情報の分散表現と検索クエリの分散表現との類似度を算出可能になる。そして、検索システムは、算出した類似度に基づいて、検索結果として出力されるコンテンツの表示順を決定可能になる。すなわち、検索システムは、検索クエリを入力したユーザの検索意図やコンテクストを考慮して、検索結果として出力されるコンテンツの表示順を決定可能になる。したがって、生成装置50は、検索サービスにおけるユーザビリティを向上させることができる。 Further, the generation device 50 extracts the search query corresponding to the distributed expression mapped in the vicinity of the distributed expression including the feature information of the predetermined search query, so that the predetermined search query can be searched according to the search intention. Search queries can be extracted. That is, the generation device 50 makes it possible to analyze the search trend of the user in consideration of the search intention and context of the user who input the search query. Therefore, the generation device 50 can improve the analysis accuracy of the user's search trend. Further, the first model M1 generated by the generation device 50 can be made to function as a part of the search system. Alternatively, the generation device 50 is a distributed representation of the search query output by the first model M1 as input information to another system (for example, a search engine) that uses the feature information of the search query predicted by the first model M1. Can also be provided. As a result, the search system can select the content output as the search result based on the feature information of the search query predicted by the first model M1. That is, the search system can select the content output as the search result in consideration of the search intention and context of the user who entered the search query. Further, the search system calculates the similarity between the distributed representation of the character information included in the content output as the search result and the distributed representation of the search query based on the characteristic information of the search query predicted by the first model M1. It will be possible. Then, the search system can determine the display order of the contents output as the search result based on the calculated similarity. That is, the search system can determine the display order of the contents output as the search result in consideration of the search intention and context of the user who input the search query. Therefore, the generation device 50 can improve the usability in the search service.

〔7.生成装置の構成〕
次に、図12を用いて、実施形態に係る生成装置50の構成について説明する。図12は、実施形態に係る生成装置50の構成例を示す図である。図12に示すように、生成装置50は、通信部51と、記憶部53と、制御部52とを有する。なお、生成装置50は、生成装置50の管理者等から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を表示するための表示部(例えば、液晶ディスプレイ等)を有してもよい。
[7. Generation device configuration]
Next, the configuration of the generation device 50 according to the embodiment will be described with reference to FIG. FIG. 12 is a diagram showing a configuration example of the generator 50 according to the embodiment. As shown in FIG. 12, the generation device 50 includes a communication unit 51, a storage unit 53, and a control unit 52. The generation device 50 has an input unit (for example, a keyboard, a mouse, etc.) that receives various operations from the administrator of the generation device 50, and a display unit (for example, a liquid crystal display, etc.) for displaying various information. You may.

(通信部51)
通信部51は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部51は、ネットワークと有線または無線で接続され、例えば、端末装置10と、検索サーバ20との間で情報の送受信を行う。
(Communication unit 51)
The communication unit 51 is realized by, for example, a NIC (Network Interface Card) or the like. Then, the communication unit 51 is connected to the network by wire or wirelessly, and transmits / receives information between the terminal device 10 and the search server 20, for example.

(記憶部53)
記憶部53は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。記憶部53は、図12に示すように、クエリ情報記憶部531と、ベクトル情報記憶部532と、モデル情報記憶部533とを有する。
(Memory unit 53)
The storage unit 53 is realized by, for example, a semiconductor memory element such as a RAM (Random Access Memory) or a flash memory (Flash Memory), or a storage device such as a hard disk or an optical disk. As shown in FIG. 12, the storage unit 53 includes a query information storage unit 531, a vector information storage unit 532, and a model information storage unit 533.

(クエリ情報記憶部531)
クエリ情報記憶部531は、ユーザによって入力された検索クエリに関する各種の情報を記憶する。図13に、実施形態に係るクエリ情報記憶部の一例を示す。図13に示す例では、クエリ情報記憶部531は、「ユーザID」、「日時」、「検索クエリ」、「検索クエリID」といった項目を有する。
(Query information storage unit 531)
The query information storage unit 531 stores various information related to the search query input by the user. FIG. 13 shows an example of the query information storage unit according to the embodiment. In the example shown in FIG. 13, the query information storage unit 531 has items such as "user ID", "date and time", "search query", and "search query ID".

「ユーザID」は、検索クエリを入力したユーザを識別するための識別情報を示す。「日時」は、検索サーバがユーザから検索クエリを受け付けた日時を示す。「検索クエリ」は、ユーザによって入力された検索クエリを示す。「検索クエリID」は、ユーザによって入力された検索クエリを識別するための識別情報を示す。 The "user ID" indicates identification information for identifying the user who entered the search query. "Date and time" indicates the date and time when the search server received the search query from the user. The "search query" indicates a search query entered by the user. The "search query ID" indicates identification information for identifying the search query entered by the user.

図13の1レコード目に示す例では、検索クエリID「Q11」で識別される検索クエリ(検索クエリQ11)は、図10に示した検索クエリQ11に対応する。また、ユーザID「U1」は、検索クエリQ11を入力したユーザがユーザID「U1」で識別されるユーザ(利用者U1)であることを示す。また、日時「2018/9/1 PM17:00」は、検索サーバが利用者U1から検索クエリQ11を受け付けた日時が2018年9月1日の午後17:00であることを示す。また、検索クエリ「六本木 パスタ」は、利用者U1によって入力された検索クエリQ11を示す。具体的には、検索クエリ「六本木 パスタ」は、地名を示す「六本木」と食品の種類を示す「パスタ」の文字とが区切り文字であるスペースで区切られた文字情報であることを示す。 In the example shown in the first record of FIG. 13, the search query (search query Q11) identified by the search query ID “Q11” corresponds to the search query Q11 shown in FIG. Further, the user ID "U1" indicates that the user who entered the search query Q11 is a user (user U1) identified by the user ID "U1". Further, the date and time "2018/9/1 PM 17:00" indicates that the date and time when the search server receives the search query Q11 from the user U1 is 17:00 pm on September 1, 2018. Further, the search query "Roppongi pasta" indicates the search query Q11 input by the user U1. Specifically, the search query "Roppongi pasta" indicates that the characters "Roppongi" indicating the place name and the characters "pasta" indicating the type of food are separated by a space which is a delimiter.

(ベクトル情報記憶部532)
ベクトル情報記憶部532は、検索クエリの分散表現であるベクトルに関する各種の情報を記憶する。図14に、実施形態に係るベクトル情報記憶部の一例を示す。図14に示す例では、ベクトル情報記憶部532は、「ベクトルID」、「検索クエリID」、「ベクトル情報」といった項目を有する。
(Vector information storage unit 532)
The vector information storage unit 532 stores various information related to the vector, which is a distributed representation of the search query. FIG. 14 shows an example of the vector information storage unit according to the embodiment. In the example shown in FIG. 14, the vector information storage unit 532 has items such as "vector ID", "search query ID", and "vector information".

「ベクトルID」は、検索クエリの分散表現であるベクトルを識別するための識別情報を示す。「検索クエリID」は、ベクトルに対応する検索クエリを識別するための識別情報を示す。「ベクトル情報」は、検索クエリの分散表現であるN次元のベクトルを示す。検索クエリの分散表現であるベクトルは、例えば、128次元のベクトルである。 The "vector ID" indicates identification information for identifying a vector which is a distributed representation of a search query. The "search query ID" indicates identification information for identifying the search query corresponding to the vector. "Vector information" indicates an N-dimensional vector which is a distributed representation of a search query. The vector, which is a distributed representation of the search query, is, for example, a 128-dimensional vector.

図14の1レコード目に示す例では、ベクトルID「QV11」で識別されるベクトル(ベクトルQV11)は、図10に示した検索クエリQ11の分散表現であるベクトルQV11に対応する。また、検索クエリID「Q11」で識別される検索クエリ(検索クエリQ11)は、ベクトルQV11に対応する検索クエリが検索クエリQ11であることを示す。また、ベクトル情報「QVDT11」は、検索クエリQ11の分散表現であるN次元のベクトルを示す。 In the example shown in the first record of FIG. 14, the vector (vector QV11) identified by the vector ID “QV11” corresponds to the vector QV11 which is a distributed representation of the search query Q11 shown in FIG. Further, the search query (search query Q11) identified by the search query ID "Q11" indicates that the search query corresponding to the vector QV11 is the search query Q11. Further, the vector information "QVDT11" indicates an N-dimensional vector which is a distributed representation of the search query Q11.

(モデル情報記憶部533)
モデル情報記憶部533は、生成装置50によって生成された学習モデルに関する各種の情報を記憶する。図15に、実施形態に係るモデル情報記憶部の一例を示す。図15に示す例では、モデル情報記憶部533は、「モデルID」、「モデルデータ」といった項目を有する。
(Model information storage unit 533)
The model information storage unit 533 stores various information related to the learning model generated by the generation device 50. FIG. 15 shows an example of the model information storage unit according to the embodiment. In the example shown in FIG. 15, the model information storage unit 533 has items such as "model ID" and "model data".

「モデルID」は、生成装置50によって生成された学習モデルを識別するための識別情報を示す。「モデルデータ」は、生成装置50によって生成された学習モデルのモデルデータを示す。例えば、「モデルデータ」には、検索クエリを分散表現に変換するためのデータが格納される。 The "model ID" indicates identification information for identifying the learning model generated by the generation device 50. The "model data" indicates the model data of the learning model generated by the generation device 50. For example, "model data" stores data for converting a search query into a distributed representation.

図15の1レコード目に示す例では、モデルID「M1」で識別される学習モデルは、図1に示した第1モデルM1に対応する。また、モデルデータ「MDT1」は、生成装置50によって生成された第1モデルM1のモデルデータ(モデルデータMDT1)を示す。 In the example shown in the first record of FIG. 15, the learning model identified by the model ID “M1” corresponds to the first model M1 shown in FIG. Further, the model data "MDT1" indicates model data (model data MDT1) of the first model M1 generated by the generation device 50.

モデルデータMDT1は、検索クエリが入力される入力層と、出力層と、入力層から出力層までのいずれかの層であって出力層以外の層に属する第1要素と、第1要素と第1要素の重みとに基づいて値が算出される第2要素と、を含み、入力層に入力された検索クエリに応じて、入力層に入力された検索クエリの分散表現を出力層から出力するよう、生成装置50を機能させてもよい。 The model data MDT1 includes an input layer into which a search query is input, an output layer, a first element which is any layer from the input layer to the output layer and belongs to a layer other than the output layer, and the first element and the first element. A second element whose value is calculated based on the weight of one element and a second element are included, and a distributed representation of the search query input to the input layer is output from the output layer according to the search query input to the input layer. As such, the generator 50 may function.

ここで、モデルデータMDT1が「y=a1*x1+a2*x2+・・・+ai*xi」で示す回帰モデルで実現されるとする。この場合、モデルデータMDT1が含む第1要素は、x1やx2等といった入力データ(xi)に対応する。また、第1要素の重みは、xiに対応する係数aiに対応する。ここで、回帰モデルは、入力層と出力層とを有する単純パーセプトロンと見做すことができる。各モデルを単純パーセプトロンと見做した場合、第1要素は、入力層が有するいずれかのノードに対応し、第2要素は、出力層が有するノードと見做すことができる。 Here, it is assumed that the model data MDT1 is realized by the regression model represented by "y = a1 * x1 + a2 * x2 + ... + ai * xi". In this case, the first element included in the model data MDT1 corresponds to input data (xi) such as x1 and x2. Further, the weight of the first element corresponds to the coefficient ai corresponding to xi. Here, the regression model can be regarded as a simple perceptron having an input layer and an output layer. When each model is regarded as a simple perceptron, the first element can be regarded as any node of the input layer, and the second element can be regarded as the node of the output layer.

また、モデルデータMDT1がDNN(Deep Neural Network)等、1つまたは複数の中間層を有するニューラルネットワークで実現されるとする。この場合、モデルデータMDT1が含む第1要素は、入力層または中間層が有するいずれかのノードに対応する。また、第2要素は、第1要素と対応するノードから値が伝達されるノードである次段のノードに対応する。また、第1要素の重みは、第1要素と対応するノードから第2要素と対応するノードに伝達される値に対して考慮される重みである接続係数に対応する。 Further, it is assumed that the model data MDT1 is realized by a neural network having one or a plurality of intermediate layers such as DNN (Deep Neural Network). In this case, the first element included in the model data MDT1 corresponds to either the node of the input layer or the intermediate layer. Further, the second element corresponds to a node in the next stage, which is a node to which a value is transmitted from a node corresponding to the first element. Further, the weight of the first element corresponds to a connection coefficient which is a weight considered for the value transmitted from the node corresponding to the first element to the node corresponding to the second element.

生成装置50は、上述した回帰モデルやニューラルネットワーク等、任意の構造を有するモデルを用いて、分散表現の算出を行う。具体的には、モデルデータMDT1は、検索クエリが入力された場合に、分散表現を出力するように係数が設定される。生成装置50は、このようなモデルデータMDT1を用いて、分散表現を算出する。 The generation device 50 calculates the variance representation using a model having an arbitrary structure such as the regression model and the neural network described above. Specifically, the model data MDT1 is set with a coefficient so as to output a distributed representation when a search query is input. The generation device 50 calculates the distributed representation using such model data MDT1.

なお、上記例では、モデルデータMDT1が、検索クエリが入力された場合に、検索クエリの分散表現を出力するモデル(以下、モデルX1という。)である例を示した。しかし、実施形態に係るモデルデータMDT1は、モデルX1にデータの入出力を繰り返すことで得られる結果に基づいて生成されるモデルであってもよい。例えば、モデルデータMDT1は、検索クエリを入力とした際に、モデルX1が出力した分散表現を入力して学習されたモデル(以下、モデルY1という。)であってもよい。または、モデルデータMDT1は、検索クエリを入力とし、モデルY1の出力値を出力とするよう学習されたモデルであってもよい。 In the above example, the model data MDT1 is a model (hereinafter referred to as model X1) that outputs a distributed representation of the search query when the search query is input. However, the model data MDT1 according to the embodiment may be a model generated based on the result obtained by repeating the input / output of data to the model X1. For example, the model data MDT1 may be a model (hereinafter, referred to as model Y1) learned by inputting the distributed representation output by the model X1 when the search query is input. Alternatively, the model data MDT1 may be a model trained to input a search query and output the output value of the model Y1.

また、生成装置50がGAN(Generative Adversarial Networks)を用いた推定処理を行う場合、モデルデータMDT1は、GANの一部を構成するモデルであってもよい。 Further, when the generation device 50 performs the estimation process using GAN (Generative Adversarial Networks), the model data MDT1 may be a model forming a part of GAN.

(制御部52)
図12の説明に戻って、制御部52は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、生成装置50内部の記憶装置に記憶されている各種プログラム(生成プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部52は、コントローラであり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
(Control unit 52)
Returning to the description of FIG. 12, the control unit 52 is a controller, and is stored in a storage device inside the generation device 50 by, for example, a CPU (Central Processing Unit) or an MPU (Micro Processing Unit). It is realized by executing various programs (corresponding to an example of a generation program) using the RAM as a work area. Further, the control unit 52 is a controller, and is realized by, for example, an integrated circuit such as an ASIC (Application Specific Integrated Circuit) or an FPGA (Field Programmable Gate Array).

また、制御部52は、モデル情報記憶部533に記憶されている第1モデルM1(モデルデータMDT1)に従った情報処理により、入力層に入力された検索クエリに対し、出力層以外の各層に属する各要素を第1要素として、第1要素と第1要素の重みとに基づく演算を行うことにより、分散表現を出力層から出力するよう、コンピュータを機能させる。 In addition, the control unit 52 sends the search query input to the input layer to each layer other than the output layer by information processing according to the first model M1 (model data MDT1) stored in the model information storage unit 533. The computer is made to function so as to output a distributed representation from the output layer by performing an operation based on the first element and the weight of the first element with each element to which it belongs as the first element.

また、制御部52は、モデル情報記憶部533に記憶されている第2モデルM2(モデルデータMDT2)に従った情報処理により、入力層に入力された検索クエリに対し、出力層以外の各層に属する各要素を第1要素として、第1要素と第1要素の重みとに基づく演算を行うことにより、検索クエリが各カテゴリに属する確率を出力層から出力するよう、コンピュータを機能させる。 Further, the control unit 52 sends the search query input to the input layer to each layer other than the output layer by information processing according to the second model M2 (model data MDT2) stored in the model information storage unit 533. By performing an operation based on the first element and the weight of the first element with each element to which it belongs as the first element, the computer is made to function so that the probability that the search query belongs to each category is output from the output layer.

図12に示すように、制御部52は、取得部521と、抽出部522と、生成部523を有し、以下に説明する情報処理の作用を実現または実行する。なお、制御部52の内部構成は、図12に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。 As shown in FIG. 12, the control unit 52 includes an acquisition unit 521, an extraction unit 522, and a generation unit 523, and realizes or executes the information processing operation described below. The internal configuration of the control unit 52 is not limited to the configuration shown in FIG. 12, and may be any other configuration as long as it performs information processing described later.

(取得部521)
取得部521は、種々の情報を取得する。具体的には、取得部521は、ユーザによって入力された検索クエリを検索サーバ20から取得する。取得部521は、ユーザによって入力された検索クエリを取得すると、取得した検索クエリをクエリ情報記憶部531に格納する。
(Acquisition unit 521)
The acquisition unit 521 acquires various information. Specifically, the acquisition unit 521 acquires the search query input by the user from the search server 20. When the acquisition unit 521 acquires the search query input by the user, the acquisition unit 521 stores the acquired search query in the query information storage unit 531.

また、取得部521は、検索クエリの分散表現であるベクトルに関するベクトル情報を取得する。取得部521は、ベクトル情報を取得すると、取得したベクトル情報をベクトル情報記憶部532に格納する。 In addition, the acquisition unit 521 acquires vector information regarding a vector which is a distributed representation of the search query. When the acquisition unit 521 acquires the vector information, the acquisition unit 521 stores the acquired vector information in the vector information storage unit 532.

また、取得部521は、第1モデルに関する情報を取得する。具体的には、取得部521は、取得部521は、生成部523によって生成された第1モデルに関する情報を取得する。取得部521は、第1モデルに関する情報を取得すると、取得した第1モデルに関する情報をモデル情報記憶部533に格納する。 In addition, the acquisition unit 521 acquires information about the first model. Specifically, the acquisition unit 521 acquires information about the first model generated by the generation unit 523. When the acquisition unit 521 acquires the information regarding the first model, the acquisition unit 521 stores the acquired information regarding the first model in the model information storage unit 533.

(抽出部522)
抽出部522は、種々の情報を抽出する。具体的には、抽出部522は、取得部521によって取得された検索クエリのうち、同一のユーザによって所定の時間内に入力された複数の検索クエリを抽出する。例えば、抽出部522は、同一のユーザによって各検索クエリが入力された時間の間隔が所定の時間内である複数の検索クエリを抽出する。続いて、抽出部522は、同一のユーザによって所定の時間内に入力された複数の検索クエリのうち、同一のユーザによって所定の時間内に連続して入力された一対の検索クエリを抽出する。例えば、抽出部522は、同一のユーザによって各検索クエリのペアが入力された時間の間隔が所定の時間内である複数の検索クエリを抽出する。例えば、抽出部522は、取得部521によって取得された検索クエリのうち、同一の利用者U1によって所定の時間内に連続して入力された4個の検索クエリである検索クエリQ11(「六本木 パスタ」)、検索クエリQ12(「六本木 イタリアン」)、検索クエリQ13(「赤坂 パスタ」)、検索クエリQ14(「麻布 パスタ」)を抽出する。抽出部522は、検索クエリが入力された順番に並べると、検索クエリQ11、検索クエリQ12、検索クエリQ13、検索クエリQ14の順番で入力された4個の検索クエリを抽出する。続いて、抽出部522は、4個の検索クエリを抽出すると、時系列的に隣り合う2つの検索クエリを一対の検索クエリとして、3対の検索クエリのペアである(検索クエリQ11、検索クエリQ12)、(検索クエリQ12、検索クエリQ13)、(検索クエリQ13、検索クエリQ14)を抽出する。なお、抽出部522は、同一のユーザによって全ての検索クエリが所定の時間内に入力された複数の検索クエリを抽出してもよい。そして、抽出部522は、時系列的に隣り合うか否かに関わらず、抽出した複数の検索クエリの中から2つの検索クエリを選択して、選択した2つの検索クエリを一対の検索クエリとして抽出してもよい。
(Extractor 522)
The extraction unit 522 extracts various information. Specifically, the extraction unit 522 extracts a plurality of search queries input by the same user within a predetermined time from the search queries acquired by the acquisition unit 521. For example, the extraction unit 522 extracts a plurality of search queries in which the time interval in which each search query is input by the same user is within a predetermined time. Subsequently, the extraction unit 522 extracts a pair of search queries continuously input by the same user within a predetermined time from among a plurality of search queries input by the same user within a predetermined time. For example, the extraction unit 522 extracts a plurality of search queries in which the time interval in which each search query pair is input by the same user is within a predetermined time. For example, the extraction unit 522 is a search query Q11 (“Roppongi pasta”), which is four search queries continuously input by the same user U1 within a predetermined time among the search queries acquired by the acquisition unit 521. ”), Search query Q12 (“Roppongi Italian”), search query Q13 (“Akasaka pasta”), and search query Q14 (“Azabu pasta”) are extracted. When the search queries are arranged in the order in which they are input, the extraction unit 522 extracts four search queries input in the order of search query Q11, search query Q12, search query Q13, and search query Q14. Subsequently, when the extraction unit 522 extracts four search queries, it is a pair of three search queries (search query Q11, search query), with two search queries adjacent in chronological order as a pair of search queries. Q12), (search query Q12, search query Q13), (search query Q13, search query Q14) are extracted. The extraction unit 522 may extract a plurality of search queries in which all the search queries are input by the same user within a predetermined time. Then, the extraction unit 522 selects two search queries from the extracted plurality of search queries regardless of whether they are adjacent to each other in chronological order, and sets the two selected search queries as a pair of search queries. It may be extracted.

また、抽出部522は、取得部521によって取得された検索クエリのうち、所定の検索クエリと所定の検索クエリに無関係な他の検索クエリとを抽出する。例えば、抽出部522は、取得部521によって取得された検索クエリの中から、所定の検索クエリを抽出する。続いて、抽出部522は、取得部521によって取得された検索クエリの中から、所定の検索クエリとは無関係にランダムに他の検索クエリを抽出する。 In addition, the extraction unit 522 extracts a predetermined search query and other search queries unrelated to the predetermined search query from the search queries acquired by the acquisition unit 521. For example, the extraction unit 522 extracts a predetermined search query from the search queries acquired by the acquisition unit 521. Subsequently, the extraction unit 522 randomly extracts another search query from the search queries acquired by the acquisition unit 521, regardless of the predetermined search query.

(生成部523)
生成部523は、種々の情報を生成する。具体的には、生成部523は、取得部521によって取得された検索クエリのうち、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして学習することで、所定の検索クエリから所定の検索クエリの特徴情報を予測する学習モデルを生成する。具体的には、生成部523は、同一のユーザによって所定の時間内に入力された複数の検索クエリの分散表現が類似するように学習モデルを学習させることで、所定の検索クエリから所定の検索クエリの特徴情報を予測する学習モデルを生成する。例えば、生成部523は、所定の時間内に続けて入力された一対の検索クエリの分散表現が類似するように学習することで、学習モデルを生成する。例えば、生成部523は、一対の検索クエリの学習前の分散表現の類似度の値を算出する。また、生成部523は、一対の検索クエリの学習後の分散表現の類似度の値を算出する。続いて、生成部523は、学習前の分散表現の類似度の値よりも、学習後の分散表現の類似度の値が大きくなるように学習モデルを学習させる。このように、生成部523は、一対の検索クエリに対応する一対の分散表現である2つのベクトルが分散表現空間上で類似するように学習モデルを学習させることで、検索クエリから分散表現を出力する学習モデルを生成する。より具体的には、生成部523は、RNNの一種であるLSTMを分散表現生成に用いたDSSMの技術を用いて、検索クエリから分散表現を出力する学習モデルを生成する。例えば、生成部523は、学習モデルの正解データとして、同一のユーザによって所定の時間内に入力された一対の検索クエリが類似する特徴を有するものとして、所定の検索クエリの分散表現と、所定の検索クエリと対となる他の検索クエリの分散表現とが、分散表現空間上で近くに存在するように学習する。また、生成部523は、第1モデルを生成すると、第1モデルを識別する識別情報と対応付けて、生成した第1モデル(モデルデータMDT1)をモデル情報記憶部533に格納する。
(Generation unit 523)
The generation unit 523 generates various information. Specifically, the generation unit 523 learns that among the search queries acquired by the acquisition unit 521, a plurality of search queries input by the same user within a predetermined time have similar characteristics. , Generate a learning model that predicts the feature information of a predetermined search query from a predetermined search query. Specifically, the generation unit 523 trains the learning model so that the distributed expressions of a plurality of search queries input by the same user within a predetermined time are similar, thereby performing a predetermined search from the predetermined search query. Generate a learning model that predicts the characteristic information of the query. For example, the generation unit 523 generates a learning model by learning so that the distributed representations of a pair of search queries input consecutively within a predetermined time are similar. For example, the generation unit 523 calculates the value of the similarity of the distributed representation before learning the pair of search queries. In addition, the generation unit 523 calculates the value of the similarity of the distributed representation after learning the pair of search queries. Subsequently, the generation unit 523 trains the learning model so that the value of the similarity of the distributed expression after learning is larger than the value of the similarity of the distributed expression before learning. In this way, the generation unit 523 outputs the distributed expression from the search query by training the learning model so that the two vectors, which are the pair of distributed expressions corresponding to the pair of search queries, are similar in the distributed expression space. Generate a learning model to do. More specifically, the generation unit 523 generates a learning model that outputs a distributed expression from a search query by using the DSSM technology that uses LSTM, which is a kind of RNN, for the distributed expression generation. For example, the generation unit 523 assumes that the pair of search queries input by the same user within a predetermined time have similar characteristics as the correct answer data of the learning model, and the distributed representation of the predetermined search query and the predetermined Learn so that the distributed representations of other search queries that are paired with the search query are close together in the distributed representation space. Further, when the first model is generated, the generation unit 523 stores the generated first model (model data MDT1) in the model information storage unit 533 in association with the identification information that identifies the first model.

〔8.第1モデルの一例〕
次に、図16を用いて生成装置50が生成する第1モデルの一例について説明する。図16は、実施形態に係る第1モデルの一例を示す図である。図16に示す例では、生成装置50が生成する第1モデルM1は、3層のLSTM RNNで構成されている。図16に示す例では、抽出部522は、同一の利用者U1によって所定の時間内に連続して入力された「六本木 パスタ」という検索クエリQ11と「六本木 イタリアン」という検索クエリQ12とから成る一対の検索クエリを抽出する。生成部523は、抽出部522によって抽出されたた検索クエリQ11を第1モデルM1の入力層に入力する(ステップS41)。
[8. Example of the first model]
Next, an example of the first model generated by the generation device 50 will be described with reference to FIG. FIG. 16 is a diagram showing an example of the first model according to the embodiment. In the example shown in FIG. 16, the first model M1 generated by the generation device 50 is composed of three layers of LSTM RNNs. In the example shown in FIG. 16, the extraction unit 522 is a pair consisting of a search query Q11 "Roppongi pasta" and a search query Q12 "Roppongi Italian" continuously input by the same user U1 within a predetermined time. Extract search queries for. The generation unit 523 inputs the search query Q11 extracted by the extraction unit 522 to the input layer of the first model M1 (step S41).

続いて、生成部523は、第1モデルM1の出力層から検索クエリQ11の分散表現である256次元のベクトルBQV11を出力する。また、生成部523は、抽出部522によって抽出された検索クエリQ12を第1モデルM1の入力層に入力する。続いて、生成部523は、第1モデルM1の出力層から検索クエリQ12の分散表現である256次元のベクトルBQV12を出力する(ステップS42)。 Subsequently, the generation unit 523 outputs a 256-dimensional vector BQV11 which is a distributed representation of the search query Q11 from the output layer of the first model M1. Further, the generation unit 523 inputs the search query Q12 extracted by the extraction unit 522 to the input layer of the first model M1. Subsequently, the generation unit 523 outputs a 256-dimensional vector BQV12 which is a distributed representation of the search query Q12 from the output layer of the first model M1 (step S42).

続いて、生成部523は、連続して入力された2つの検索クエリの分散表現が類似するように学習することで、検索クエリから分散表現を出力する第1モデルM1を生成する(ステップS43)。例えば、第1モデルM1にフィードバックをかける前(学習前)の検索クエリQ11の分散表現であるベクトルBQV11と検索クエリQ12の分散表現であるベクトルBQV12とのなす角度の大きさをΘとする。また、第1モデルM1にフィードバックをかけた後(学習後)の検索クエリQ11の分散表現であるベクトルQV11と検索クエリQ12の分散表現であるベクトルQV12とのなす角度の大きさをΦとする。この時、生成部523は、ΘよりもΦが小さくなるように、第1モデルM1を学習させる。例えば、生成部523は、ベクトルBQV11とベクトルBQV12のコサイン類似度の値を算出する。また、生成部523は、ベクトルQV11とベクトルQV12のコサイン類似度の値を算出する。続いて、生成部523は、ベクトルBQV11とベクトルBQV12のコサイン類似度の値よりも、ベクトルQV11とベクトルQV12のコサイン類似度の値が大きくなるように(値が1に近づくように)学習モデルM1を学習させる。このように、生成部523は、一対の検索クエリに対応する一対の分散表現である2つのベクトルが分散表現空間上で類似するように第1モデルM1を学習させることで、検索クエリから分散表現を出力する第1モデルM1を生成する。なお、生成部523は、コサイン類似度に限らず、ベクトル間の距離尺度として適用可能な指標であれば、どのような指標に基づいて分散表現の間の類似度を算出してもよい。また、生成部523は、ベクトル間の距離尺度として適用可能な指標であれば、どのような指標に基づいて学習モデルM1を学習させてもよい。例えば、生成部523は、分散表現同士のユークリッド距離や双曲空間等の非ユークリッド空間中での距離、マンハッタン距離、マハラノビス距離等といった所定の距離関数の値を算出する。続いて、生成部523は、分散表現同士の所定の距離関数の値(すなわち、分散表現空間における距離)が小さくなるように学習モデルM1を学習させてもよい。 Subsequently, the generation unit 523 generates the first model M1 that outputs the distributed expression from the search query by learning so that the distributed expressions of the two consecutively input search queries are similar (step S43). .. For example, let Θ be the magnitude of the angle formed by the vector BQV11 which is the distributed representation of the search query Q11 before giving feedback to the first model M1 (before learning) and the vector BQV12 which is the distributed representation of the search query Q12. Further, let Φ be the size of the angle formed by the vector QV11 which is the distributed representation of the search query Q11 after giving feedback to the first model M1 (after learning) and the vector QV12 which is the distributed representation of the search query Q12. At this time, the generation unit 523 trains the first model M1 so that Φ is smaller than Θ. For example, the generation unit 523 calculates the value of the cosine similarity between the vector BQV11 and the vector BQV12. Further, the generation unit 523 calculates the value of the cosine similarity between the vector QV11 and the vector QV12. Subsequently, the generation unit 523 prepares the learning model M1 so that the value of the cosine similarity between the vector QV11 and the vector QV12 is larger than the value of the cosine similarity between the vector BQV11 and the vector BQV12 (so that the value approaches 1). To learn. In this way, the generation unit 523 trains the first model M1 so that the two vectors, which are a pair of distributed representations corresponding to the pair of search queries, are similar in the distributed representation space, so that the distributed representation is expressed from the search query. Generates the first model M1 that outputs. The generation unit 523 may calculate the similarity between the variance representations based on any index as long as it is an index applicable as a distance scale between vectors, not limited to the cosine similarity. Further, the generation unit 523 may train the learning model M1 based on any index as long as it is an index applicable as a distance scale between vectors. For example, the generation unit 523 calculates the value of a predetermined distance function such as the Euclidean distance between distributed expressions, the distance in a non-Euclidean space such as hyperbolic space, the Manhattan distance, and the Mahalanobis distance. Subsequently, the generation unit 523 may train the learning model M1 so that the value of a predetermined distance function between the distributed expressions (that is, the distance in the distributed expression space) becomes small.

また、生成部523は、同一のユーザによって所定の時間内に入力された複数の検索クエリとして、所定の区切り文字で区切られた文字情報を含む複数の検索クエリが類似する特徴を有するものとして学習することで、第1モデルを生成する。例えば、生成部523は、地名を示す「六本木」と食品の種類を示す「パスタ」の文字とが区切り文字であるスペースで区切られた検索クエリ「六本木 パスタ」と、地名を示す「六本木」と料理の種類を示す「イタリアン」の文字とが区切り文字であるスペースで区切られた検索クエリ「六本木 イタリアン」とが類似する特徴を有するものとして学習することで、第1モデルを生成する。 Further, the generation unit 523 learns that, as a plurality of search queries input by the same user within a predetermined time, a plurality of search queries including character information delimited by a predetermined delimiter have similar characteristics. By doing so, the first model is generated. For example, the generation unit 523 includes a search query "Roppongi pasta" in which the characters "Roppongi" indicating the place name and the characters "pasta" indicating the type of food are separated by a space, and "Roppongi" indicating the place name. The first model is generated by learning that the search query "Roppongi Italian", which is separated by a space delimiter from the character "Italian" indicating the type of food, has similar characteristics.

また、生成部523は、取得部521によって取得された検索クエリのうち、ランダムに抽出された複数の検索クエリが相違する特徴を有するものとして学習することで、第1モデルを生成する。具体的には、生成部523は、取得部521によって取得された検索クエリのうち、ランダムに抽出された一対の検索クエリの分散表現が相違するように学習することで、第1モデルを生成する。例えば、生成部523は、抽出部522によって抽出された所定の検索クエリの分散表現と、所定の検索クエリとは無関係にランダムに抽出された検索クエリの分散表現とが分散表現空間上で遠くにマッピングされるように第1モデルM1のトレーニングを行う。 Further, the generation unit 523 generates the first model by learning that the plurality of randomly extracted search queries among the search queries acquired by the acquisition unit 521 have different characteristics. Specifically, the generation unit 523 generates the first model by learning so that the distributed representations of a pair of randomly extracted search queries among the search queries acquired by the acquisition unit 521 are different. .. For example, in the generation unit 523, the distributed representation of the predetermined search query extracted by the extraction unit 522 and the distributed representation of the search query randomly extracted regardless of the predetermined search query are far apart in the distributed representation space. The first model M1 is trained so as to be mapped.

〔9.第1モデルの生成処理のフロー〕
次に、図17を用いて、実施形態に係る第1モデルの生成処理の手順について説明する。図17は、実施形態に係る第1モデルの生成処理手順を示すフローチャートである。
[9. Flow of generation processing of the first model]
Next, the procedure of the generation process of the first model according to the embodiment will be described with reference to FIG. FIG. 17 is a flowchart showing a generation processing procedure of the first model according to the embodiment.

図17に示す例では、生成装置50は、ユーザによって入力された検索クエリを取得する(ステップS1001)。 In the example shown in FIG. 17, the generation device 50 acquires the search query input by the user (step S1001).

続いて、生成装置50は、同一のユーザによって所定の時間内に入力された複数の検索クエリを抽出する(ステップS1002)。 Subsequently, the generation device 50 extracts a plurality of search queries input by the same user within a predetermined time (step S1002).

続いて、生成装置50は、抽出した複数の検索クエリが類似する特徴を有するものとして学習することで、所定の検索クエリから所定の検索クエリの特徴情報を予測する第1モデルを生成する(ステップS1003)。 Subsequently, the generation device 50 generates a first model that predicts the characteristic information of a predetermined search query from the predetermined search query by learning that the plurality of extracted search queries have similar characteristics (step). S1003).

〔10.効果〕
上述してきたように、実施形態に係る情報処理装置100は、受付部131と生成部133と出力部134を有する。受付部131は、分類対象を示す複数の対象情報と、複数の対象情報をクラスタに分類する際のクラスタ数である指定クラスタ数とを受け付ける。生成部133は、複数の対象情報を指定クラスタ数のクラスタに分類することにより生成したクラスタに関する指定クラスタ情報を生成する。出力部134は、生成部133によって生成された指定クラスタ情報を出力する。
[10. effect〕
As described above, the information processing apparatus 100 according to the embodiment includes a reception unit 131, a generation unit 133, and an output unit 134. The reception unit 131 receives a plurality of target information indicating the classification target and a designated number of clusters, which is the number of clusters when the plurality of target information is classified into clusters. The generation unit 133 generates the designated cluster information regarding the generated clusters by classifying the plurality of target information into clusters having a designated number of clusters. The output unit 134 outputs the designated cluster information generated by the generation unit 133.

これにより、情報処理装置100は、分類対象を示す多数の対象情報から、多数の対象情報の特徴の要約とも言える指定クラスタ数のクラスタ情報を抽出可能とする。そして、情報処理装置100は、多数の対象情報の特徴を指定クラスタ数のクラスタ情報に要約して提供可能とする。このように、情報処理装置100は、分類対象を示す多数の対象情報の特徴を少ない情報量の要約にまとめて提供可能とする。したがって、情報処理装置100は、有用な情報を得ることができる。 As a result, the information processing apparatus 100 can extract cluster information of a specified number of clusters, which can be said to be a summary of the features of a large number of target information, from a large number of target information indicating classification targets. Then, the information processing apparatus 100 can summarize the features of a large number of target information into cluster information of a specified number of clusters and provide the information. As described above, the information processing apparatus 100 can provide the features of a large number of target information indicating the classification target in a summary of a small amount of information. Therefore, the information processing device 100 can obtain useful information.

また、生成部133は、複数の対象情報に含まれる一の対象情報が検索クエリとして入力された際の検索意図と、複数の対象情報に含まれる他の対象情報が検索クエリとして入力された際の検索意図との類似性に基づいて、指定クラスタ情報を生成する。 In addition, the generation unit 133 includes a search intention when one target information included in the plurality of target information is input as a search query, and when another target information included in the plurality of target information is input as a search query. Generates designated cluster information based on the similarity to the search intent of.

これにより、情報処理装置100は、対象情報が検索クエリとして入力された際の検索意図の類似度に基づいて分類された指定クラスタ数のクラスタに関する指定クラスタ情報を提供可能とする。 As a result, the information processing apparatus 100 can provide the designated cluster information regarding the clusters of the designated number of clusters classified based on the similarity of the search intention when the target information is input as the search query.

また、生成部133は、複数の対象情報に含まれる一の対象情報である文字情報に対応する分散表現と、複数の対象情報に含まれる他の対象情報である文字情報に対応する分散表現との類似度に基づいて、指定クラスタ情報を生成する。 Further, the generation unit 133 includes a distributed expression corresponding to the character information which is one target information included in the plurality of target information and a distributed expression corresponding to the character information which is other target information included in the plurality of target information. Generates designated cluster information based on the similarity of.

これにより、情報処理装置100は、クエリ同士の検索意図の類似性に基づくクラスタの分類結果を数値によって客観的に把握できる状態で提供可能とする。 As a result, the information processing apparatus 100 can provide the classification result of the cluster based on the similarity of the search intentions between the queries in a state where it can be objectively grasped numerically.

また、生成部133は、指定クラスタ情報として、クラスタごとに、クラスタに分類される対象情報を視認可能な情報を生成する。 In addition, the generation unit 133 generates information in which the target information classified into the clusters can be visually recognized as the designated cluster information for each cluster.

これにより、情報処理装置100は、多数の高次元の分散表現同士の類似度に関する分析結果を一見して把握しやすい状態で提供可能にする。 As a result, the information processing apparatus 100 can provide an analysis result regarding the similarity between a large number of high-dimensional distributed expressions in a state in which it is easy to grasp at a glance.

また、生成部133は、複数の対象情報を指定クラスタ数よりも少ない数のクラスタに分類することにより生成したクラスタに関するクラスタ情報を生成する。出力部134は、生成部133によって生成されたクラスタ情報を指定クラスタ情報と比較可能に出力する。 In addition, the generation unit 133 generates cluster information regarding the generated clusters by classifying the plurality of target information into clusters having a number smaller than the number of designated clusters. The output unit 134 outputs the cluster information generated by the generation unit 133 so as to be comparable to the designated cluster information.

これにより、情報処理装置100は、複数の対象情報を指定クラスタ数よりも少ない数のクラスタに分類することにより生成したクラスタに関するクラスタ情報と指定クラスタ情報とを比較できる状態で提供可能とする。 As a result, the information processing apparatus 100 can provide the cluster information about the cluster generated by classifying the plurality of target information into clusters smaller than the number of designated clusters in a state where the designated cluster information can be compared.

また、生成部133は、複数の対象情報に含まれる一の対象情報が検索クエリとして入力された際の検索意図と、複数の対象情報に含まれる他の対象情報が検索クエリとして入力された際の検索意図との類似性に基づいて、複数の対象情報を指定クラスタ数のクラスタに分類する。 In addition, the generation unit 133 includes a search intention when one target information included in a plurality of target information is input as a search query, and a search query when another target information included in the plurality of target information is input as a search query. Classify multiple target information into clusters with a specified number of clusters based on the similarity with the search intention of.

これにより、情報処理装置100は、対象情報が検索クエリとして入力された際の検索意図の類似度に基づいて指定クラスタ数のクラスタを生成することができる。 As a result, the information processing apparatus 100 can generate a specified number of clusters based on the similarity of the search intention when the target information is input as the search query.

また、生成部133は、複数の対象情報に含まれる一の対象情報である文字情報に対応する分散表現と、複数の対象情報に含まれる他の対象情報である文字情報に対応する分散表現との類似度に基づいて、複数の対象情報を指定クラスタ数のクラスタに分類する。 Further, the generation unit 133 includes a distributed expression corresponding to the character information which is one target information included in the plurality of target information and a distributed expression corresponding to the character information which is other target information included in the plurality of target information. Classify multiple target information into clusters with a specified number of clusters based on the similarity of.

これにより、情報処理装置100は、クエリ同士の検索意図の類似性に基づくクラスタの分類結果を数値によって客観的に把握できる状態で提供可能とする。 As a result, the information processing apparatus 100 can provide the classification result of the cluster based on the similarity of the search intentions between the queries in a state where it can be objectively grasped numerically.

また、生成部133は、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして、複数の検索クエリが有する特徴を学習した学習モデルを用いて、複数の対象情報に含まれるそれぞれの対象情報である文字情報に対応する分散表現を生成する。 In addition, the generation unit 133 uses a learning model that learns the characteristics of the plurality of search queries, assuming that the plurality of search queries input by the same user within a predetermined time have similar characteristics. Generates a distributed representation corresponding to the character information that is each target information included in the target information.

これにより、情報処理装置100は、対象情報である文字情報が検索クエリとし手入力された検索意図を反映した分散表現を生成可能とする。 As a result, the information processing apparatus 100 can generate a distributed representation in which the character information which is the target information reflects the search intention manually input as the search query.

また、生成部133は、入力情報として所定の検索クエリが入力された際に、出力情報として所定の検索クエリの分散表現を出力する学習モデルを用いて、分散表現を生成する。 Further, the generation unit 133 generates a distributed expression by using a learning model that outputs a distributed expression of the predetermined search query as output information when a predetermined search query is input as input information.

これにより、情報処理装置100は、対象情報である文字情報が検索クエリとし手入力された検索意図を反映した分散表現を生成可能とする。 As a result, the information processing apparatus 100 can generate a distributed expression that reflects the search intention manually input by using the character information as the target information as a search query.

また、生成部133は、所定の時間内に続けて入力された一対の検索クエリの分散表現が類似するように学習することで、複数の検索クエリが有する特徴を学習した学習モデルを用いて、分散表現を生成する。 In addition, the generation unit 133 uses a learning model that learns the characteristics of a plurality of search queries by learning so that the distributed expressions of a pair of search queries input consecutively within a predetermined time are similar. Generate a distributed representation.

これにより、情報処理装置100は、対象情報である文字情報が検索クエリとし手入力された検索意図を反映した分散表現を生成可能とする。 As a result, the information processing apparatus 100 can generate a distributed representation in which the character information which is the target information reflects the search intention manually input as the search query.

また、生成部133は、同一のユーザによって所定の時間内に入力された複数の検索クエリとして、所定の区切り文字で区切られた文字列を含む複数の検索クエリが類似する特徴を有するものとして学習することで、複数の検索クエリが有する特徴を学習した学習モデルを用いて、分散表現を生成する。 Further, the generation unit 133 learns that as a plurality of search queries input by the same user within a predetermined time, a plurality of search queries including a character string delimited by a predetermined delimiter have similar characteristics. By doing so, a distributed representation is generated using a learning model that has learned the characteristics of a plurality of search queries.

これにより、情報処理装置100は、対象情報である文字情報が検索クエリとし手入力された検索意図を反映した分散表現を生成可能とする。 As a result, the information processing apparatus 100 can generate a distributed representation in which the character information which is the target information reflects the search intention manually input as the search query.

また、生成部133は、ランダムに抽出された複数の検索クエリが相違する特徴を有するものとして学習することで、複数の検索クエリが有する特徴を学習した学習モデルを用いて、分散表現を生成する。 In addition, the generation unit 133 generates a distributed expression by using the learning model in which the characteristics of the plurality of search queries are learned by learning that the plurality of randomly extracted search queries have different characteristics. ..

これにより、情報処理装置100は、対象情報である文字情報が検索クエリとし手入力された検索意図を反映した分散表現を生成可能とする。 As a result, the information processing apparatus 100 can generate a distributed representation in which the character information which is the target information reflects the search intention manually input as the search query.

また、生成部133は、ランダムに抽出された一対の検索クエリの分散表現が相違するように学習することで、複数の検索クエリが有する特徴を学習した学習モデルを用いて、分散表現を生成する。 Further, the generation unit 133 generates a distributed expression by using a learning model that has learned the characteristics of a plurality of search queries by learning so that the distributed expressions of a pair of randomly extracted search queries are different. ..

これにより、情報処理装置100は、対象情報である文字情報が検索クエリとし手入力された検索意図を反映した分散表現を生成可能とする。 As a result, the information processing apparatus 100 can generate a distributed representation in which the character information which is the target information reflects the search intention manually input as the search query.

〔11.ハードウェア構成〕
また、上述してきた実施形態に係る情報処理装置100または生成装置50または端末装置10は、例えば図18に示すような構成のコンピュータ1000によって実現される。図18は、情報処理装置100または生成装置50または端末装置10の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を備える。
[11. Hardware configuration]
Further, the information processing device 100 or the generation device 50 or the terminal device 10 according to the above-described embodiment is realized by, for example, a computer 1000 having a configuration as shown in FIG. FIG. 18 is a hardware configuration diagram showing an example of a computer that realizes the functions of the information processing device 100, the generation device 50, or the terminal device 10. The computer 1000 includes a CPU 1100, a RAM 1200, a ROM 1300, an HDD 1400, a communication interface (I / F) 1500, an input / output interface (I / F) 1600, and a media interface (I / F) 1700.

CPU1100は、ROM1300またはHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。 The CPU 1100 operates based on a program stored in the ROM 1300 or the HDD 1400, and controls each part. The ROM 1300 stores a boot program executed by the CPU 1100 when the computer 1000 is started, a program that depends on the hardware of the computer 1000, and the like.

HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を格納する。通信インターフェイス1500は、所定の通信網を介して他の機器からデータを受信してCPU1100へ送り、CPU1100が生成したデータを所定の通信網を介して他の機器へ送信する。 The HDD 1400 stores a program executed by the CPU 1100, data used by such a program, and the like. The communication interface 1500 receives data from another device via a predetermined communication network and sends it to the CPU 1100, and transmits the data generated by the CPU 1100 to the other device via the predetermined communication network.

CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、生成したデータを入出力インターフェイス1600を介して出力装置へ出力する。 The CPU 1100 controls an output device such as a display or a printer, and an input device such as a keyboard or a mouse via the input / output interface 1600. The CPU 1100 acquires data from the input device via the input / output interface 1600. Further, the CPU 1100 outputs the generated data to the output device via the input / output interface 1600.

メディアインターフェイス1700は、記録媒体1800に格納されたプログラムまたはデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。 The media interface 1700 reads a program or data stored in the recording medium 1800 and provides the program or data to the CPU 1100 via the RAM 1200. The CPU 1100 loads the program from the recording medium 1800 onto the RAM 1200 via the media interface 1700, and executes the loaded program. The recording medium 1800 is, for example, an optical recording medium such as a DVD (Digital Versatile Disc) or PD (Phase change rewritable Disk), a magneto-optical recording medium such as an MO (Magneto-Optical disk), a tape medium, a magnetic recording medium, or a semiconductor memory. And so on.

例えば、コンピュータ1000が情報処理装置100または生成装置50または端末装置10として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部130または制御部52または制御部15の機能を実現する。コンピュータ1000のCPU1100は、これらのプログラムを記録媒体1800から読み取って実行するが、他の例として、他の装置から所定の通信網を介してこれらのプログラムを取得してもよい。 For example, when the computer 1000 functions as the information processing device 100, the generation device 50, or the terminal device 10, the CPU 1100 of the computer 1000 controls the control unit 130 or the control unit 52 or the control unit 52 by executing the program loaded on the RAM 1200. The function of the part 15 is realized. The CPU 1100 of the computer 1000 reads and executes these programs from the recording medium 1800, but as another example, these programs may be acquired from another device via a predetermined communication network.

以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。 Although some of the embodiments of the present application have been described in detail with reference to the drawings, these are examples, and various modifications are made based on the knowledge of those skilled in the art, including the embodiments described in the disclosure column of the invention. It is possible to practice the present invention in other improved forms.

〔12.その他〕
また、上記実施形態及び変形例において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
[12. Others]
Further, among the processes described in the above-described embodiments and modifications, all or part of the processes described as being automatically performed can be manually performed, or are described as being manually performed. It is also possible to automatically perform all or part of the processed processing by a known method. In addition, the processing procedure, specific name, and information including various data and parameters shown in the above document and drawings can be arbitrarily changed unless otherwise specified. For example, the various information shown in each figure is not limited to the illustrated information.

また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。 Further, each component of each of the illustrated devices is a functional concept, and does not necessarily have to be physically configured as shown in the figure. That is, the specific form of distribution / integration of each device is not limited to the one shown in the figure, and all or part of the device is functionally or physically distributed / physically in any unit according to various loads and usage conditions. It can be integrated and configured.

また、上述してきた実施形態及び変形例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。 In addition, the above-described embodiments and modifications can be appropriately combined as long as the processing contents do not contradict each other.

また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、生成部は、生成手段や生成回路に読み替えることができる。 In addition, the above-mentioned "section, module, unit" can be read as "means" or "circuit". For example, the generation unit can be read as a generation means or a generation circuit.

1 情報処理システム
10 端末装置
20 検索サーバ
50 生成装置
100 情報処理装置
110 通信部
120 記憶部
121 クエリ情報記憶部
122 ベクトル情報記憶部
123 クラスタ情報記憶部
124 モデル情報記憶部
130 制御部
131 受付部
132 取得部
133 生成部
134 出力部
1 Information processing system 10 Terminal device 20 Search server 50 Generation device 100 Information processing device 110 Communication unit 120 Storage unit 121 Query information storage unit 122 Vector information storage unit 123 Cluster information storage unit 124 Model information storage unit 130 Control unit 131 Reception unit 132 Acquisition unit 133 Generation unit 134 Output unit

Claims (15)

分類対象を示す複数の対象情報と、前記複数の対象情報をクラスタに分類する際のクラスタ数である指定クラスタ数とを受け付ける受付部と、
前記複数の対象情報を前記指定クラスタ数のクラスタに分類することにより生成したクラスタに関する指定クラスタ情報を生成する生成部と、
前記生成部によって生成された指定クラスタ情報を出力する出力部と、
を備えることを特徴とする情報処理装置。
A reception unit that accepts a plurality of target information indicating a classification target and a specified number of clusters, which is the number of clusters when the plurality of target information is classified into clusters.
A generator that generates designated cluster information related to a cluster generated by classifying the plurality of target information into clusters having the specified number of clusters, and a generator.
An output unit that outputs the specified cluster information generated by the generation unit, and
An information processing device characterized by being equipped with.
前記生成部は、
前記複数の対象情報に含まれる一の対象情報が検索クエリとして入力された際の検索意図と、当該複数の対象情報に含まれる他の対象情報が検索クエリとして入力された際の検索意図との類似性に基づいて、前記指定クラスタ情報を生成する
ことを特徴とする請求項1に記載の情報処理装置。
The generator
The search intention when one target information included in the plurality of target information is input as a search query and the search intention when other target information included in the plurality of target information is input as a search query. The information processing apparatus according to claim 1, wherein the designated cluster information is generated based on the similarity.
前記生成部は、
前記複数の対象情報に含まれる一の対象情報である文字情報に対応する分散表現と、当該複数の対象情報に含まれる他の対象情報である文字情報に対応する分散表現との類似度に基づいて、前記指定クラスタ情報を生成する
ことを特徴とする請求項1または2に記載の情報処理装置。
The generator
Based on the degree of similarity between the distributed expression corresponding to the character information which is one target information included in the plurality of target information and the distributed expression corresponding to the character information which is other target information included in the plurality of target information. The information processing apparatus according to claim 1 or 2, wherein the designated cluster information is generated.
前記生成部は、
前記指定クラスタ情報として、クラスタごとに、当該クラスタに分類される対象情報を視認可能な情報を生成する
ことを特徴とする請求項1〜3のいずれか一つに記載の情報処理装置。
The generator
The information processing apparatus according to any one of claims 1 to 3, wherein, as the designated cluster information, information that can visually recognize the target information classified into the cluster is generated for each cluster.
前記生成部は、
前記複数の対象情報を前記指定クラスタ数よりも少ない数のクラスタに分類することにより生成したクラスタに関するクラスタ情報を生成し、
前記出力部は、
前記生成部によって生成されたクラスタ情報を前記指定クラスタ情報と比較可能に出力する
ことを特徴とする請求項1〜4のいずれか一つに記載の情報処理装置。
The generator
Cluster information related to the cluster generated by classifying the plurality of target information into a number of clusters smaller than the specified number of clusters is generated.
The output unit
The information processing apparatus according to any one of claims 1 to 4, wherein the cluster information generated by the generation unit is output so as to be comparable to the designated cluster information.
前記生成部は、
前記複数の対象情報に含まれる一の対象情報が検索クエリとして入力された際の検索意図と、当該複数の対象情報に含まれる他の対象情報が検索クエリとして入力された際の検索意図との類似性に基づいて、前記複数の対象情報を前記指定クラスタ数のクラスタに分類する
ことを特徴とする請求項1〜5のいずれか一つに記載の情報処理装置。
The generator
The search intention when one target information included in the plurality of target information is input as a search query and the search intention when other target information included in the plurality of target information is input as a search query. The information processing apparatus according to any one of claims 1 to 5, wherein the plurality of target information is classified into clusters having a specified number of clusters based on the similarity.
前記生成部は、
前記複数の対象情報に含まれる一の対象情報である文字情報に対応する分散表現と、当該複数の対象情報に含まれる他の対象情報である文字情報に対応する分散表現との類似度に基づいて、前記複数の対象情報を前記指定クラスタ数のクラスタに分類する
ことを特徴とする請求項1〜6のいずれか一つに記載の情報処理装置。
The generator
Based on the degree of similarity between the distributed expression corresponding to the character information which is one target information included in the plurality of target information and the distributed expression corresponding to the character information which is other target information included in the plurality of target information. The information processing apparatus according to any one of claims 1 to 6, wherein the plurality of target information is classified into clusters having the specified number of clusters.
前記生成部は、
同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして、前記複数の検索クエリが有する特徴を学習した学習モデルを用いて、前記複数の対象情報に含まれるそれぞれの対象情報である文字情報に対応する分散表現を生成する
ことを特徴とする請求項1〜7のいずれか一つに記載の情報処理装置。
The generator
Assuming that a plurality of search queries input by the same user within a predetermined time have similar characteristics, the plurality of target information is included in the plurality of target information by using a learning model in which the characteristics of the plurality of search queries are learned. The information processing apparatus according to any one of claims 1 to 7, wherein a distributed expression corresponding to character information which is each target information is generated.
前記生成部は、
入力情報として所定の検索クエリが入力された際に、出力情報として前記所定の検索クエリの分散表現を出力する学習モデルを用いて、前記分散表現を生成する
ことを特徴とする請求項8に記載の情報処理装置。
The generator
The eighth aspect of claim 8 is characterized in that when a predetermined search query is input as input information, the distributed expression is generated by using a learning model that outputs a distributed expression of the predetermined search query as output information. Information processing equipment.
前記生成部は、
前記所定の時間内に続けて入力された一対の検索クエリの分散表現が類似するように学習することで、前記複数の検索クエリが有する特徴を学習した学習モデルを用いて、前記分散表現を生成する
ことを特徴とする請求項8または9に記載の情報処理装置。
The generator
By learning so that the distributed expressions of a pair of search queries input consecutively within the predetermined time are similar, the distributed expressions are generated using a learning model that has learned the characteristics of the plurality of search queries. The information processing apparatus according to claim 8 or 9.
前記生成部は、
同一のユーザによって所定の時間内に入力された複数の検索クエリとして、所定の区切り文字で区切られた文字列を含む複数の検索クエリが類似する特徴を有するものとして学習することで、前記複数の検索クエリが有する特徴を学習した学習モデルを用いて、前記分散表現を生成する
ことを特徴とする請求項8〜10のいずれか一つに記載の情報処理装置。
The generator
As a plurality of search queries input by the same user within a predetermined time, the plurality of search queries including a character string separated by a predetermined delimiter are learned as having similar characteristics. The information processing apparatus according to any one of claims 8 to 10, wherein the distributed representation is generated by using a learning model that has learned the characteristics of a search query.
前記生成部は、
ランダムに抽出された複数の検索クエリが相違する特徴を有するものとして学習することで、前記複数の検索クエリが有する特徴を学習した学習モデルを用いて、前記分散表現を生成する
ことを特徴とする請求項8〜11のいずれか一つに記載の情報処理装置。
The generator
It is characterized in that the distributed representation is generated by using a learning model that has learned the characteristics of the plurality of search queries by learning that a plurality of randomly extracted search queries have different characteristics. The information processing apparatus according to any one of claims 8 to 11.
前記生成部は、
ランダムに抽出された一対の検索クエリの分散表現が相違するように学習することで、前記複数の検索クエリが有する特徴を学習した学習モデルを用いて、前記分散表現を生成する
ことを特徴とする請求項8〜12のいずれか一つに記載の情報処理装置。
The generator
By learning so that the distributed expressions of a pair of randomly extracted search queries are different, the distributed expressions are generated by using a learning model that has learned the characteristics of the plurality of search queries. The information processing apparatus according to any one of claims 8 to 12.
コンピュータが実行する情報処理方法であって、
分類対象を示す複数の対象情報と、前記複数の対象情報をクラスタに分類する際のクラスタ数である指定クラスタ数とを受け付ける受付工程と、
前記複数の対象情報を前記指定クラスタ数のクラスタに分類することにより生成したクラスタに関する指定クラスタ情報を生成する生成工程と、
前記生成工程によって生成された指定クラスタ情報を出力する出力工程と、
を含むことを特徴とする情報処理方法。
Information processing method executed by a computer
A reception process that accepts a plurality of target information indicating a classification target and a designated number of clusters, which is the number of clusters when the plurality of target information is classified into clusters.
A generation process for generating designated cluster information regarding a cluster generated by classifying the plurality of target information into clusters having the specified number of clusters, and a generation step.
An output process that outputs the designated cluster information generated by the generation process, and
An information processing method characterized by including.
分類対象を示す複数の対象情報と、前記複数の対象情報をクラスタに分類する際のクラスタ数である指定クラスタ数とを受け付ける受付手順と、
前記複数の対象情報を前記指定クラスタ数のクラスタに分類することにより生成したクラスタに関する指定クラスタ情報を生成する生成手順と、
前記生成手順によって生成された指定クラスタ情報を出力する出力手順と、
をコンピュータに実行させることを特徴とする情報処理プログラム。
A reception procedure for accepting a plurality of target information indicating a classification target and a specified number of clusters, which is the number of clusters when classifying the plurality of target information into clusters.
A generation procedure for generating designated cluster information regarding a cluster generated by classifying the plurality of target information into clusters having the specified number of clusters, and a generation procedure.
An output procedure that outputs the specified cluster information generated by the above generation procedure, and
An information processing program characterized by having a computer execute.
JP2019123238A 2019-07-01 2019-07-01 Information processing device, information processing method and information processing program Active JP7177013B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019123238A JP7177013B2 (en) 2019-07-01 2019-07-01 Information processing device, information processing method and information processing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019123238A JP7177013B2 (en) 2019-07-01 2019-07-01 Information processing device, information processing method and information processing program

Publications (2)

Publication Number Publication Date
JP2021009574A true JP2021009574A (en) 2021-01-28
JP7177013B2 JP7177013B2 (en) 2022-11-22

Family

ID=74199434

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019123238A Active JP7177013B2 (en) 2019-07-01 2019-07-01 Information processing device, information processing method and information processing program

Country Status (1)

Country Link
JP (1) JP7177013B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7025578B1 (en) 2021-03-19 2022-02-24 ヤフー株式会社 Information processing equipment, information processing methods, and information processing programs

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001167203A (en) * 1999-09-30 2001-06-22 Fuji Electric Co Ltd Marketing analysis supporting system and recording medium
JP2005222489A (en) * 2004-02-09 2005-08-18 Toyota Motor Corp Conflict relationship data generation method, and computer and program therefor
JP2008084151A (en) * 2006-09-28 2008-04-10 Just Syst Corp Information display device and information display method
JP2008204374A (en) * 2007-02-22 2008-09-04 Fuji Xerox Co Ltd Cluster generating device and program
JP2009031931A (en) * 2007-07-25 2009-02-12 Univ Waseda Search word clustering device, method, program and recording medium
JP2018060469A (en) * 2016-10-07 2018-04-12 ヤフー株式会社 Extraction device, extraction method, and extraction program
JP2018180789A (en) * 2017-04-07 2018-11-15 日本電信電話株式会社 Query clustering device, method, and program

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001167203A (en) * 1999-09-30 2001-06-22 Fuji Electric Co Ltd Marketing analysis supporting system and recording medium
JP2005222489A (en) * 2004-02-09 2005-08-18 Toyota Motor Corp Conflict relationship data generation method, and computer and program therefor
JP2008084151A (en) * 2006-09-28 2008-04-10 Just Syst Corp Information display device and information display method
JP2008204374A (en) * 2007-02-22 2008-09-04 Fuji Xerox Co Ltd Cluster generating device and program
JP2009031931A (en) * 2007-07-25 2009-02-12 Univ Waseda Search word clustering device, method, program and recording medium
JP2018060469A (en) * 2016-10-07 2018-04-12 ヤフー株式会社 Extraction device, extraction method, and extraction program
JP2018180789A (en) * 2017-04-07 2018-11-15 日本電信電話株式会社 Query clustering device, method, and program

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
BHASKAR MITRA: "Exploring Session Context using Distributed Representations of Queries and Reformulations", PROCEEDING OF THE 38TH INTERNATIONAL ACM SIGIR CONFERENCE ON RESEARCH AND DEVELOPMENT IN INFORMATION, vol. pp.3〜12, JPN7021000774, 31 August 2015 (2015-08-31), ISSN: 0004647174 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7025578B1 (en) 2021-03-19 2022-02-24 ヤフー株式会社 Information processing equipment, information processing methods, and information processing programs
JP2022145213A (en) * 2021-03-19 2022-10-03 ヤフー株式会社 Information processor, method for processing information, and information processing program

Also Published As

Publication number Publication date
JP7177013B2 (en) 2022-11-22

Similar Documents

Publication Publication Date Title
Wu et al. A hierarchical attention model for social contextual image recommendation
US10922367B2 (en) Method and system for providing real time search preview personalization in data management systems
Athique The dynamics and potentials of big data for audience research
Mao et al. Multiobjective e-commerce recommendations based on hypergraph ranking
US20120158791A1 (en) Feature vector construction
Tiddi et al. Dedalo: Looking for clusters explanations in a labyrinth of linked data
JP2011501275A (en) Text classification with knowledge transfer from heterogeneous datasets
Schmidt et al. Text classification based filters for a domain-specific search engine
US10885081B2 (en) Systems and methods for contextual ranking of search results
CN112989010A (en) Data query method, data query device and electronic equipment
KR20150041908A (en) Method for automatically classifying answer type and apparatus, question-answering system for using the same
Shankar et al. An intelligent recommendation system in e-commerce using ensemble learning
JP7071304B2 (en) Information processing equipment, information processing methods and information processing programs
JP6679683B2 (en) Information processing apparatus, information processing method, and information processing program
JP7177013B2 (en) Information processing device, information processing method and information processing program
JP5213098B2 (en) Question answering method and system
JP6852114B2 (en) Specific device, specific method and specific program
JP7188879B2 (en) Provision device, provision method and provision program
JP6938569B2 (en) Information processing equipment, information processing methods and information processing programs
JP6584613B1 (en) Information processing apparatus, information processing method, and information processing program
JP7044729B2 (en) Information processing equipment, information processing methods and information processing programs
Li et al. A framework of ontology-based knowledge management system
JP7258988B2 (en) Information processing device, information processing method and information processing program
JP6728445B1 (en) Extraction device, extraction method, and extraction program
JP6553793B1 (en) Information processing apparatus, information processing method, and information processing program

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20191101

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20191108

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200309

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210316

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210514

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20210803

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211104

C60 Trial request (containing other claim documents, opposition documents)

Free format text: JAPANESE INTERMEDIATE CODE: C60

Effective date: 20211104

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20211116

C21 Notice of transfer of a case for reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C21

Effective date: 20211124

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20211203

C211 Notice of termination of reconsideration by examiners before appeal proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C211

Effective date: 20211207

C22 Notice of designation (change) of administrative judge

Free format text: JAPANESE INTERMEDIATE CODE: C22

Effective date: 20220301

C22 Notice of designation (change) of administrative judge

Free format text: JAPANESE INTERMEDIATE CODE: C22

Effective date: 20220405

C22 Notice of designation (change) of administrative judge

Free format text: JAPANESE INTERMEDIATE CODE: C22

Effective date: 20220705

C13 Notice of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: C13

Effective date: 20220719

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220920

C23 Notice of termination of proceedings

Free format text: JAPANESE INTERMEDIATE CODE: C23

Effective date: 20220927

C03 Trial/appeal decision taken

Free format text: JAPANESE INTERMEDIATE CODE: C03

Effective date: 20221101

C30A Notification sent

Free format text: JAPANESE INTERMEDIATE CODE: C3012

Effective date: 20221101

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221110

R150 Certificate of patent or registration of utility model

Ref document number: 7177013

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350