JP6553793B1 - Information processing apparatus, information processing method, and information processing program - Google Patents

Information processing apparatus, information processing method, and information processing program Download PDF

Info

Publication number
JP6553793B1
JP6553793B1 JP2018176617A JP2018176617A JP6553793B1 JP 6553793 B1 JP6553793 B1 JP 6553793B1 JP 2018176617 A JP2018176617 A JP 2018176617A JP 2018176617 A JP2018176617 A JP 2018176617A JP 6553793 B1 JP6553793 B1 JP 6553793B1
Authority
JP
Japan
Prior art keywords
learning model
search query
search
information processing
predetermined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018176617A
Other languages
Japanese (ja)
Other versions
JP2020047125A (en
Inventor
清水 徹
徹 清水
潤二 宰川
潤二 宰川
アヌパム バッタチャルジ
アヌパム バッタチャルジ
カウステューブ クルカルニ
カウステューブ クルカルニ
隼人 小林
隼人 小林
伸幸 清水
伸幸 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2018176617A priority Critical patent/JP6553793B1/en
Application granted granted Critical
Publication of JP6553793B1 publication Critical patent/JP6553793B1/en
Publication of JP2020047125A publication Critical patent/JP2020047125A/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】検索クエリの分類精度を高めること。【解決手段】本願に係る情報処理装置は、取得部と生成部とを備える。取得部は、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして、複数の検索クエリが有する特徴を学習した第1学習モデルを取得する。生成部は、取得部によって取得された第1学習モデルを用いて、所定の検索クエリから所定の検索クエリが属するカテゴリを予測する第2学習モデルを生成する。【選択図】図1To improve the classification accuracy of a search query. An information processing apparatus according to the present application includes an acquisition unit and a generation unit. The acquisition unit acquires a first learning model in which features of a plurality of search queries are learned, assuming that the plurality of search queries input within a predetermined time by the same user have similar features. The generation unit generates a second learning model that predicts a category to which a predetermined search query belongs from a predetermined search query using the first learning model acquired by the acquisition unit. [Selection] Figure 1

Description

本発明は、情報処理装置、情報処理方法及び情報処理プログラムに関する。   The present invention relates to an information processing apparatus, an information processing method, and an information processing program.

従来、種々の情報をカテゴリに分類する技術が知られている。具体的には、カテゴリ毎に分類された教師データの群によって、各カテゴリに応じた学習モデルを生成する。そして、生成した学習モデルに分類対象となるデータを入力して、分類対象となるデータが学習モデルに対応するカテゴリに属する確率を出力する技術が知られている。   Conventionally, techniques for classifying various information into categories are known. Specifically, a learning model corresponding to each category is generated by a group of teacher data classified for each category. Then, there is known a technique of inputting data to be classified into the generated learning model and outputting the probability that the data to be classified belongs to a category corresponding to the learning model.

特開2018−97397号公報JP-A-2018-97397

しかしながら、上記の従来技術では、検索クエリの分類精度を高めることができるとは限らない。具体的には、検索クエリをカテゴリに分類し、高い分類精度を得るためには、十分な量の教師データを用意することが必要である。しかしながら、上記の従来技術では、カテゴリ毎に分類された教師データの群によって、各カテゴリに応じた学習モデルを生成するにすぎないため、十分な量の教師データを用意することができるとは限らない。したがって、上記の従来技術では、検索クエリの分類精度を高めることができるとは限らない。   However, the above-mentioned prior art can not always improve the classification accuracy of the search query. Specifically, it is necessary to prepare a sufficient amount of teacher data in order to classify search queries into categories and obtain high classification accuracy. However, in the above-described prior art, a learning model corresponding to each category is merely generated from a group of teacher data classified for each category, so that a sufficient amount of teacher data cannot always be prepared. Absent. Therefore, the above-mentioned prior art can not necessarily improve the classification accuracy of the search query.

本願は、上記に鑑みてなされたものであって、検索クエリの分類精度を高めることができる情報処理装置、情報処理方法及び情報処理プログラムを提供することを目的とする。   The present application has been made in view of the above, and an object thereof is to provide an information processing apparatus, an information processing method, and an information processing program capable of improving the classification accuracy of a search query.

本願に係る情報処理装置は、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして、前記複数の検索クエリが有する特徴を学習した第1学習モデルを取得する取得部と、前記取得部によって取得された第1学習モデルを用いて、所定の検索クエリから前記所定の検索クエリが属するカテゴリを予測する第2学習モデルを生成する生成部とを備えたことを特徴とする。   The information processing apparatus according to the present application acquires a first learning model in which a plurality of search queries input within a predetermined time by the same user have similar characteristics and learns the characteristics of the plurality of search queries. And a generator configured to generate a second learning model for predicting a category to which the predetermined search query belongs from a predetermined search query using the first learning model acquired by the acquisition unit. It is characterized by

実施形態の一態様によれば、検索クエリの分類精度を高めることができるといった効果を奏する。   According to one aspect of the embodiment, there is an effect that the classification accuracy of the search query can be increased.

図1は、実施形態に係る情報処理の一例を示す図である。FIG. 1 is a diagram illustrating an example of information processing according to the embodiment. 図2は、実施形態に係る情報処理システムの構成例を示す図である。FIG. 2 is a diagram illustrating an exemplary configuration of an information processing system according to the embodiment. 図3は、実施形態に係る情報処理装置の構成例を示す図である。FIG. 3 is a diagram illustrating an exemplary configuration of the information processing apparatus according to the embodiment. 図4は、実施形態に係るクエリ情報記憶部の一例を示す図である。FIG. 4 is a diagram illustrating an example of a query information storage unit according to the embodiment. 図5は、実施形態に係るベクトル情報記憶部の一例を示す図である。FIG. 5 is a diagram illustrating an example of a vector information storage unit according to the embodiment. 図6は、実施形態に係る分類定義記憶部の一例を示す図である。FIG. 6 is a diagram illustrating an example of a classification definition storage unit according to the embodiment. 図7は、実施形態に係るカテゴリ情報記憶部の一例を示す図である。FIG. 7 is a diagram illustrating an example of the category information storage unit according to the embodiment. 図8は、実施形態に係るモデル情報記憶部の一例を示す図である。FIG. 8 is a diagram illustrating an example of a model information storage unit according to the embodiment. 図9は、実施形態に係る第1学習モデルの一例を示す図である。FIG. 9 is a diagram illustrating an example of the first learning model according to the embodiment. 図10は、実施形態に係る第2学習モデルの一例を示す図である。FIG. 10 is a diagram illustrating an example of the second learning model according to the embodiment. 図11は、実施形態に係る第1学習モデルの生成処理手順を示すフローチャートである。FIG. 11 is a flowchart illustrating a first learning model generation processing procedure according to the embodiment. 図12は、実施形態に係る情報処理手順を示すフローチャートである。FIG. 12 is a flowchart illustrating an information processing procedure according to the embodiment. 図13は、情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。FIG. 13 is a hardware configuration diagram showing an example of a computer for realizing the function of the information processing apparatus.

以下に、本願に係る情報処理装置、情報処理方法及び情報処理プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る情報処理装置、情報処理方法及び情報処理プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略する。   Hereinafter, a mode for carrying out an information processing apparatus, an information processing method, and an information processing program according to the present application (hereinafter referred to as “embodiment”) will be described in detail with reference to the drawings. Note that the information processing apparatus, the information processing method, and the information processing program according to the present application are not limited by this embodiment. Moreover, the same code | symbol is attached | subjected to the same site | part in each following embodiment, and the overlapping description is abbreviate | omitted.

〔1.情報処理の一例〕
まず、図1を用いて、実施形態に係る情報処理の一例について説明する。図1は、実施形態に係る情報処理の一例を示す図である。図1に示す情報処理は、ユーザ端末10と検索サーバ50と情報処理装置100とによって行われる。
[1. Example of information processing]
First, an example of information processing according to the embodiment will be described with reference to FIG. FIG. 1 is a diagram illustrating an example of information processing according to the embodiment. The information processing illustrated in FIG. 1 is performed by the user terminal 10, the search server 50, and the information processing apparatus 100.

〔情報処理システムの構成〕
図1の説明に先立って、図2を用いて情報処理システム1の構成について説明する。図2は、実施形態に係る情報処理システムの構成例を示す図である。図2に示すように、情報処理システム1には、ユーザ端末10と、検索サーバ50と、情報処理装置100とが含まれる。ユーザ端末10と、検索サーバ50と、情報処理装置100とは所定のネットワークNを介して、有線または無線により通信可能に接続される。なお、図2に示す情報処理システム1には、任意の数のユーザ端末10と任意の数の検索サーバ50と任意の数の情報処理装置100とが含まれてもよい。
[Configuration of information processing system]
Prior to the description of FIG. 1, the configuration of the information processing system 1 will be described with reference to FIG. FIG. 2 is a diagram illustrating an exemplary configuration of an information processing system according to the embodiment. As illustrated in FIG. 2, the information processing system 1 includes a user terminal 10, a search server 50, and an information processing apparatus 100. The user terminal 10, the search server 50, and the information processing apparatus 100 are connected via a predetermined network N so as to be communicable by wire or wirelessly. Note that the information processing system 1 illustrated in FIG. 2 may include an arbitrary number of user terminals 10, an arbitrary number of search servers 50, and an arbitrary number of information processing apparatuses 100.

ユーザ端末10は、検索サービスを利用するユーザによって使用される情報処理装置である。ユーザ端末10は、例えば、スマートフォンや、タブレット型端末や、ノート型PC(Personal Computer)や、携帯電話機や、PDA(Personal Digital Assistant)等により実現される。なお、以下では、ユーザ端末10をユーザと同一視する場合がある。すなわち、以下では、ユーザをユーザ端末10と読み替えることもできる。   The user terminal 10 is an information processing apparatus used by a user who uses a search service. The user terminal 10 is realized by, for example, a smartphone, a tablet terminal, a notebook PC (Personal Computer), a mobile phone, a PDA (Personal Digital Assistant), or the like. In the following, the user terminal 10 may be identified with the user. That is, the user may be read as the user terminal 10 below.

また、以下では、ユーザID「U1」により特定されるユーザを「ユーザU1」とする場合がある。このように、以下では、「ユーザU*(*は任意の数値)」と記載した場合、そのユーザはユーザID「U*」により特定されるユーザであることを示す。例えば、「ユーザU2」と記載した場合、そのユーザはユーザID「U2」により特定されるユーザである。   Also, in the following, the user specified by the user ID “U1” may be referred to as “user U1”. Thus, in the following, when “user U * (* is any numerical value)” is described, it indicates that the user is the user specified by the user ID “U *”. For example, when "user U2" is described, the user is a user specified by user ID "U2".

また、以下では、ユーザ端末10を利用するユーザに応じて、ユーザ端末10をユーザ端末10−1、10−2として説明する。例えば、ユーザ端末10−1は、ユーザU1により使用されるユーザ端末10である。また、例えば、ユーザ端末10−2は、ユーザU2により使用されるユーザ端末10である。また、以下では、ユーザ端末10−1、10−2について、特に区別なく説明する場合には、ユーザ端末10と記載する。   Moreover, below, the user terminal 10 is demonstrated as user terminal 10-1, 10-2 according to the user who uses the user terminal 10. For example, the user terminal 10-1 is the user terminal 10 used by the user U1. Also, for example, the user terminal 10-2 is a user terminal 10 used by the user U2. Also, in the following description, the user terminals 10-1 and 10-2 are described as the user terminal 10 when the description is made without particular distinction.

ユーザ端末10は、ユーザによって入力された検索クエリを検索サーバ50に送信する。具体的には、ユーザ端末10は、ユーザによる操作に従って、検索クエリを入力するための検索ボックスを含む検索ページを検索サーバ50から取得する。続いて、ユーザ端末10は、ユーザによって検索ボックスに文字が入力される操作に続いて、検索クエリを送信する操作が行われると、検索ページを介して検索ボックスに入力された文字を検索クエリとして検索サーバ50に送信する。例えば、ユーザ端末10は、ユーザによって検索ボックスに文字が入力される操作に続いて、検索クエリの送信ボタンが押下される操作やエンターキーが押下される操作が行われると、検索ページを介して検索ボックスに入力された文字を検索クエリとして検索サーバ50に送信する。   The user terminal 10 transmits a search query input by the user to the search server 50. Specifically, the user terminal 10 acquires a search page including a search box for inputting a search query from the search server 50 in accordance with an operation by the user. Subsequently, when an operation of transmitting a search query is performed following an operation in which the user inputs characters in the search box, the user terminal 10 uses the characters input in the search box via the search page as the search query. It transmits to the search server 50. For example, if the user terminal 10 performs an operation of pressing a search query transmission button or an enter key after an operation of inputting characters into a search box by the user, the user terminal 10 performs a search via a search page. The characters entered in the search box are transmitted to the search server 50 as a search query.

検索サーバ50は、検索サービスを提供するサーバ装置である。具体的には、検索サーバ50は、ユーザ端末10から検索クエリを受け付けると、受け付けた検索クエリに応じたコンテンツであって、検索結果として出力されるコンテンツを選択する。続いて、検索サーバ50は、選択されたコンテンツを含む検索結果ページをユーザ端末10に配信する。ここで、検索サーバ50によって配信されるコンテンツは、ウェブブラウザによって表示されるウェブページに限られない。例えば、検索サーバ50によって配信されるコンテンツは、ユーザ端末10にインストールされた専用のアプリケーションによって表示されるコンテンツであってもよい。また、検索サーバ50によって配信されるコンテンツは、音楽コンテンツや画像(静止画のみならず動画を含む。)コンテンツ、テキストコンテンツ(ニュース記事やSNS(Social Networking Service)に投稿された記事を含む。)、画像とテキストを組み合わせたコンテンツ、ゲームコンテンツなど、どのようなコンテンツであってもよい。   The search server 50 is a server device that provides a search service. Specifically, when receiving a search query from the user terminal 10, the search server 50 selects content corresponding to the received search query and output as a search result. Subsequently, the search server 50 delivers the search result page including the selected content to the user terminal 10. Here, the content delivered by the search server 50 is not limited to the web page displayed by the web browser. For example, the content distributed by the search server 50 may be content displayed by a dedicated application installed in the user terminal 10. The content distributed by the search server 50 includes music content, images (including moving images as well as still images), and text content (including news articles and articles posted on SNS (Social Networking Service)). Any content such as content combining an image and text, game content, and the like may be used.

また、検索サーバ50は、ユーザによって入力された検索クエリに関する情報を記憶する。具体的には、検索サーバ50は、ユーザの検索履歴に関する情報を記憶する。例えば、検索サーバ50は、ユーザ端末10から検索クエリを受け付けると、受け付けた検索クエリと検索クエリの送信元であるユーザを識別するユーザIDと検索クエリの送信日時とを対応付けてデータベースに登録する。検索サーバ50は、情報処理装置100の要求に応じて、ユーザによって入力された検索クエリに関する情報を情報処理装置100に送信する。   Further, the search server 50 stores information related to the search query input by the user. Specifically, the search server 50 stores information related to the user search history. For example, when receiving a search query from the user terminal 10, the search server 50 registers the received search query, the user ID for identifying the user who is the transmission source of the search query, and the transmission date and time of the search query in association with each other. . The search server 50 transmits information related to the search query input by the user to the information processing apparatus 100 in response to a request from the information processing apparatus 100.

情報処理装置100は、後述する第1学習モデルを用いて、所定の検索クエリから所定の検索クエリが属するカテゴリを予測する第2学習モデルを生成するサーバ装置である。ここで、第1学習モデルは、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして、同一のユーザによって所定の時間内に入力された複数の検索クエリが有する特徴を学習した学習モデルである。なお、以下では、適宜、第1学習モデルを第1モデル(又は、第1モデルM1)と記載する。また、以下では、適宜、第2学習モデルを第2モデル(又は、第1モデルM2)と記載する。   The information processing apparatus 100 is a server apparatus that generates a second learning model that predicts a category to which a predetermined search query belongs from a predetermined search query, using a first learning model described later. Here, the first learning model has a plurality of search queries input by the same user within a predetermined time, assuming that the plurality of search queries input by the same user within a predetermined time have similar characteristics. This is a learning model that learns the features of. Hereinafter, the first learning model is described as a first model (or first model M1) as appropriate. In the following description, the second learning model is described as a second model (or first model M2) as appropriate.

一般的に、検索者が検索を行う際、一回の検索で検索者の意図する情報に到達するケースよりも、異なる検索クエリを用いて複数回にわたって検索を行った結果、検索者の意図する情報に到達するケースの方が多いと考えられる。すなわち、ユーザはある意図を持って検索を複数回行うと考えられるため、所定の時間内に連続して入力された検索クエリは、検索意図が近いという推定が成り立つ。そこで、本願発明に係る情報処理装置100は、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして、同一のユーザによって所定の時間内に入力された複数の検索クエリが有する特徴を学習させた第1学習モデルを生成する。具体的には、情報処理装置100は、ユーザによって入力された検索クエリに関する情報を検索サーバ50から取得する。続いて、情報処理装置100は、検索サーバ50から取得した検索クエリのうち、同一のユーザによって所定の時間内に入力された複数の検索クエリを抽出する。続いて、情報処理装置100は、抽出した複数の検索クエリが類似する特徴を有するものとして学習することで、所定の検索クエリから所定の検索クエリの特徴情報を予測する第1学習モデルを生成する。例えば、情報処理装置100は、抽出した複数の検索クエリの分散表現が類似するように第1学習モデルを学習させることで、所定の検索クエリから所定の検索クエリの特徴情報を含む分散表現(ベクトル)を出力する第1学習モデルを生成する。   Generally, when a searcher performs a search, the searcher intends as a result of performing a search multiple times using different search queries than in the case where the information intended by the searcher is reached by one search. There are more cases where information is reached. That is, since it is considered that the user performs a search a plurality of times with a certain intention, it is assumed that a search query continuously input within a predetermined time has a close search intention. Therefore, in the information processing apparatus 100 according to the present invention, a plurality of search queries input by a single user within a predetermined period of time have a similar feature, and a plurality of search queries input by the same user within a predetermined period of time A first learning model in which features of the search query are learned is generated. Specifically, the information processing apparatus 100 acquires, from the search server 50, information on the search query input by the user. Subsequently, the information processing apparatus 100 extracts, from among the search queries acquired from the search server 50, a plurality of search queries input by the same user within a predetermined time. Subsequently, the information processing apparatus 100 generates a first learning model that predicts feature information of a predetermined search query from a predetermined search query by learning that the plurality of extracted search queries have similar features. . For example, the information processing apparatus 100 learns the first learning model so that the distributed expressions of the plurality of extracted search queries are similar to each other, so that the distributed expression (vector) including the characteristic information of the predetermined search query from the predetermined search query ) Is generated.

より具体的には、情報処理装置100は、RNN(Recurrent Neural Network)の一種であるLSTM(Long Short-Term Memory)を分散表現生成に用いたDSSM(Deep Structured Sematic Model)の技術を用いて、検索クエリから分散表現(ベクトル)を出力する第1学習モデルを生成する。例えば、情報処理装置100は、第1学習モデルの正解データとして、同一のユーザによって所定の時間内に入力された一対の検索クエリが類似する特徴を有するものとして、所定の検索クエリの分散表現(ベクトル)と、所定の検索クエリと対となる他の検索クエリの分散表現(ベクトル)とが、分散表現空間上で近くに存在するように学習する。なお、2つのベクトルが分散表現空間上で近くに存在するように学習することは、2つのベクトルが分散表現空間上で類似するように学習することと言い換えることができる。   More specifically, the information processing apparatus 100 uses the technology of Deep Structured Sematic Model (DSSM) that uses Long Short-Term Memory (LSTM), which is a type of Recurrent Neural Network (RNN), for distributed expression generation. A first learning model that outputs a distributed expression (vector) from the search query is generated. For example, it is assumed that the information processing apparatus 100 has a feature that the pair of search queries input by the same user within a predetermined time have similar characteristics as the correct data of the first learning model (a distributed search query (FIG. (Vector) and a distributed expression (vector) of another search query paired with a predetermined search query are learned so as to be present near each other on the distributed expression space. Note that learning so that two vectors are close to each other in the distributed representation space can be rephrased as learning so that the two vectors are similar in the distributed representation space.

ここから、図1を用いて、情報処理の流れについて説明する。図1は、実施形態に係る情報処理の一例を示す図である。図1の上段に示す例では、情報処理装置100は、同一のユーザU1によって所定の時間内に連続して入力された4個の検索クエリである検索クエリQ11(「六本木 パスタ」)、検索クエリQ12(「六本木 イタリアン」)、検索クエリQ13(「赤坂 パスタ」)、検索クエリQ14(「麻布 パスタ」)を抽出する。情報処理装置100は、同一のユーザU1によって各検索クエリが入力された時間の間隔が所定の時間内である複数の検索クエリを抽出する。また、情報処理装置100は、同一のユーザU1によって各検索クエリのペアが入力された時間の間隔が所定の時間内である複数の検索クエリを抽出する。ここで、4個の検索クエリは、検索クエリQ11、検索クエリQ12、検索クエリQ13、検索クエリQ14の順番でユーザU1によって各検索クエリが所定の時間内に入力された検索クエリであるとする。情報処理装置100は、4個の検索クエリを抽出すると、時系列的に隣り合う2つの検索クエリを一対の検索クエリとして、3対の検索クエリのペアである(検索クエリQ11、検索クエリQ12)、(検索クエリQ12、検索クエリQ13)、(検索クエリQ13、検索クエリQ14)を抽出する。情報処理装置100は、3対の検索クエリのペアを抽出すると、抽出した検索クエリQ1k(k=1、2、3、4)を第1モデルM1に入力する(ステップS11)。なお、情報処理装置100は、同一のユーザU1によって全ての検索クエリが所定の時間内に入力された複数の検索クエリを抽出してもよい。そして、情報処理装置100は、時系列的に隣り合うか否かに関わらず、抽出した複数の検索クエリの中から2つの検索クエリを選択して、選択した2つの検索クエリを一対の検索クエリとして抽出してもよい。   From here, the flow of information processing will be described with reference to FIG. FIG. 1 is a diagram illustrating an example of information processing according to the embodiment. In the example illustrated in the upper part of FIG. 1, the information processing apparatus 100 is a search query Q11 ("Roppongi pasta"), which is four search queries continuously input within the predetermined time by the same user U1. Q12 (“Roppongi Italian”), search query Q13 (“Akasaka pasta”), and search query Q14 (“Azabu pasta”) are extracted. The information processing apparatus 100 extracts a plurality of search queries in which the time interval when each search query is input by the same user U1 is within a predetermined time. Further, the information processing apparatus 100 extracts a plurality of search queries in which an interval of time in which each search query pair is input by the same user U1 is within a predetermined time. Here, it is assumed that the four search queries are search queries in which each search query is input within a predetermined time by the user U1 in the order of search query Q11, search query Q12, search query Q13, and search query Q14. When the information processing apparatus 100 extracts four search queries, it is a pair of three pairs of search queries with two search queries adjacent in time series as a pair of search queries (search query Q11, search query Q12) , (Search query Q12, search query Q13), (search query Q13, search query Q14) are extracted. After extracting the three search query pairs, the information processing apparatus 100 inputs the extracted search query Q1k (k = 1, 2, 3, 4) to the first model M1 (step S11). The information processing apparatus 100 may extract a plurality of search queries in which all the search queries are input within a predetermined time by the same user U1. Then, the information processing apparatus 100 selects two search queries from the plurality of extracted search queries regardless of whether they are adjacent in time series, and selects the two selected search queries as a pair of search queries. It may be extracted as

続いて、情報処理装置100は、検索クエリQ1k(k=1、2、3、4)の分散表現であるベクトルBQV1k(k=1、2、3、4)を第1モデルM1の出力データとして出力する(ステップS12)。ここで、ベクトルBQV1k(k=1、2、3、4)は、第1モデルM1の出力層から出力されたばかりの検索クエリQ1k(k=1、2、3、4)の分散表現であって、第1モデルM1にフィードバックをかける前(学習前)の分散表現を示す。   Subsequently, the information processing apparatus 100 uses the vector BQV1k (k = 1, 2, 3, 4), which is a distributed representation of the search query Q1k (k = 1, 2, 3, 4), as output data of the first model M1. It outputs (step S12). Here, the vector BQV1k (k = 1,2,3,4) is a distributed representation of the search query Q1k (k = 1,2,3,4) just output from the output layer of the first model M1. The distributed expression before applying feedback to the first model M1 (before learning) is shown.

ここで、同一のユーザU1によって所定の時間内に連続して入力された検索クエリQ1k(k=1、2、3、4)は、例えば、ユーザU1によって「ある場所(東京都港区付近)で飲食店を探す」という検索意図の下で検索された検索クエリの集合であると推定される。すなわち、検索クエリQ1k(k=1、2、3、4)は、「ある場所(東京都港区付近)で飲食店を探す」という検索意図の下で検索された検索クエリであるという点で、相互に類似する特徴を有する検索クエリであると推定される。そこで、情報処理装置100は、連続して入力された検索クエリが類似する特徴を有するものとして学習することで、所定の検索クエリから所定の検索クエリの特徴情報を予測する第1モデルを生成する(ステップS13)。具体的には、情報処理装置100は、連続して入力された検索クエリの分散表現が類似するものとして学習することで、所定の検索クエリから所定の検索クエリの分散表現を予測する第1モデルM1を生成する。例えば、情報処理装置100は、検索クエリQ11の分散表現(ベクトルQV11)と、検索クエリQ11と対となる検索クエリQ12の分散表現(ベクトルQV12)とが、分散表現空間上で類似するように第1モデルM1を学習させる。また、情報処理装置100は、検索クエリQ12の分散表現(ベクトルQV12)と、検索クエリQ12と対となる検索クエリQ13の分散表現(ベクトルQV13)とが、分散表現空間上で類似するように第1モデルM1を学習させる。また、情報処理装置100は、検索クエリQ13の分散表現(ベクトルQV13)と、検索クエリQ13と対となる検索クエリQ14の分散表現(ベクトルQV14)とが、分散表現空間上で類似するように第1モデルM1を学習させる。   Here, for example, the search query Q1k (k = 1, 2, 3, 4) continuously inputted within the predetermined time by the same user U1 is, for example, “a place (near Minato-ku, Tokyo) by the user U1 It is inferred that it is a set of search queries searched under the search intention “search for restaurant”. That is, the search query Q1k (k = 1, 2, 3, 4) is a search query searched under a search intention of “finding a restaurant in a certain place (near Tokyo Minato-ku)”. , It is presumed that the search queries have characteristics similar to each other. Therefore, the information processing apparatus 100 generates a first model that predicts feature information of a predetermined search query from a predetermined search query by learning that search queries sequentially input have similar characteristics. (Step S13). Specifically, the first information processing apparatus 100 predicts a distributed expression of a predetermined search query from a predetermined search query by learning that the distributed expressions of the search query input continuously are similar to each other. Generate M1. For example, in the information processing apparatus 100, the distributed expression (vector QV11) of the search query Q11 and the distributed expression (vector QV12) of the search query Q12 paired with the search query Q11 are similar in the distributed expression space. 1 Train the model M1. Further, the information processing apparatus 100 is configured such that the distributed representation of the search query Q12 (vector QV12) and the distributed representation of the search query Q13 paired with the search query Q12 (vector QV13) are similar in the distributed representation space. 1 Train the model M1. In addition, the information processing apparatus 100 causes the distributed representation of the search query Q13 (vector QV13) and the distributed representation of the search query Q14 paired with the search query Q13 (vector QV14) to be similar in the distributed representation space. One model M1 is learned.

図1の上段の右側には、学習済みの第1モデルM1の出力結果として、同一のユーザU1によって所定の時間内に入力された検索クエリQ1k(k=1、2、3、4)の分散表現であるベクトルQV1k(k=1、2、3、4)が分散表現空間のクラスタCL11としてマッピングされる様子が示されている。このように、情報処理装置100は、同一のユーザによって所定の時間内に入力された複数の検索クエリが有する特徴を学習した第1学習モデルM1を生成する。   In the upper right side of FIG. 1, as an output result of the learned first model M1, the distribution of the search query Q1k (k = 1, 2, 3, 4) input within a predetermined time by the same user U1 A state in which a vector QV1k (k = 1, 2, 3, 4) as an expression is mapped as a cluster CL11 in a distributed expression space is shown. As described above, the information processing apparatus 100 generates the first learning model M1 in which the features possessed by the plurality of search queries input by the same user within a predetermined time have been learned.

情報処理装置100は、第1モデルM1を生成すると、生成した第1モデルM1(第1モデルM1のモデルデータMDT1)を取得する。情報処理装置100は、第1モデルM1を取得すると、取得した第1モデルM1を用いて、第2学習モデルM2を生成する。具体的には、情報処理装置100は、第1モデルM1を再学習させることにより、第1モデルM1とは学習モデルの重みである接続係数が異なる第2モデルM2を生成する。より具体的には、情報処理装置100は、第1モデルM1を用いて、所定の検索クエリから所定の検索クエリが属するカテゴリを予測する第2学習モデルM2を生成する(ステップS14)。   When the information processing apparatus 100 generates the first model M1, the information processing apparatus 100 acquires the generated first model M1 (model data MDT1 of the first model M1). When acquiring the first model M1, the information processing apparatus 100 generates a second learning model M2 using the acquired first model M1. Specifically, the information processing apparatus 100 generates a second model M2 having a connection coefficient different from that of the first model M1 as a weight of the learning model by relearning the first model M1. More specifically, the information processing apparatus 100 generates a second learning model M2 that predicts, from the predetermined search query, a category to which the predetermined search query belongs, using the first model M1 (step S14).

図1の下段に示す例では、情報処理装置100は、検索クエリが第2モデルM2に入力された際に、CAT11(「飲食店を探す」)、CAT12(「商品を探す」)、CAT13(「飲食店を予約する」)、CAT14(「商品を購入する」)の4つのカテゴリのいずれのカテゴリに属するかを予測する第2モデルM2を生成する。具体的には、情報処理装置100は、入力情報として検索クエリが第2モデルM2に入力された際に、出力情報として検索クエリがそのカテゴリに属する確率をカテゴリ毎に出力する第2モデルM2を生成する。例えば、情報処理装置100は、第2モデルM2の正解データとして、検索クエリと検索クエリが属するカテゴリ(CAT11〜CAT14のいずれか)との組を学習する。   In the example illustrated in the lower part of FIG. 1, when the search query is input to the second model M2, the information processing apparatus 100 CAT11 ("search for restaurant"), CAT12 ("search for goods"), CAT13 ( A second model M2 that predicts which of the four categories of “Reserve restaurant” and CAT14 (“Purchase a product”) is generated. Specifically, when a search query is input to the second model M2 as input information, the information processing apparatus 100 outputs a second model M2 that outputs, for each category, a probability that the search query belongs to the category as output information. Generate For example, the information processing apparatus 100 learns a set of a search query and a category (any one of CAT11 to CAT14) to which the search query belongs as correct data of the second model M2.

なお、検索クエリがCAT11(「飲食店を探す」)に属することは、検索クエリが飲食店を探す意図で入力された検索クエリであることを示す。また、CAT12(「商品を探す」)に属することは、検索クエリが商品を探す意図で入力された検索クエリであることを示す。また、検索クエリがCAT13(「飲食店を予約する」)に属することは、検索クエリが飲食店を予約する意図で入力された検索クエリであることを示す。また、検索クエリがCAT14(「商品を購入する」)に属することは、検索クエリが商品を購入する意図で入力された検索クエリであることを示す。   The fact that the search query belongs to CAT11 (“Find a restaurant”) indicates that the search query is a search query input with the intention of searching for a restaurant. Also, belonging to CAT12 ("search for a product") indicates that the search query is a search query that is input with the intention of searching for a product. Further, the fact that the search query belongs to CAT 13 (“Reserve restaurant”) indicates that the search query is a search query input with the intention of reserving a restaurant. Also, the fact that the search query belongs to the CAT 14 (“purchase the item”) indicates that the search query is a search query entered with the intention of purchasing the item.

具体的には、情報処理装置100は、検索クエリが学習モデルに入力された際に、学習モデルが出力する分散表現の分類結果が、検索クエリが属するカテゴリに対応するように学習することで、所定の検索クエリから所定の検索クエリが属するカテゴリを予測する第2モデルM2を生成する。そして、情報処理装置100は、例えば、入力情報として検索クエリが第2モデルM2に入力された際に、出力情報として検索クエリがそのカテゴリに属する確率をカテゴリCAT11〜CAT14毎に出力する第2モデルM2を生成する。   Specifically, when the search query is input to the learning model, the information processing apparatus 100 performs learning so that the classification result of the distributed expression output by the learning model corresponds to the category to which the search query belongs. A second model M2 that predicts a category to which the predetermined search query belongs is generated from the predetermined search query. Then, for example, when a search query is input to the second model M2 as input information, the information processing apparatus 100 outputs, as output information, a probability that the search query belongs to the category for each category CAT11 to CAT14. Generate M2.

例えば、情報処理装置100は、入力情報として検索クエリQ11(「六本木 パスタ」)が第2モデルM2に入力された際に(ステップS15)、出力情報として検索クエリQ11(「六本木 パスタ」)の分散表現であるベクトルBQV11を出力する。ここで、ベクトルBQV11は、第2モデルM2の出力層から出力されたばかりの検索クエリQ11の分散表現であって、第2モデルM2にフィードバックをかける前(学習前)の分散表現を示す。ここで、検索クエリQ11(「六本木 パスタ」)が属する正解カテゴリがCAT11(「飲食店を探す」)であるとする。この場合、情報処理装置100は、出力された検索クエリQ11(「六本木 パスタ」)の分散表現であるベクトルBQV11がCAT11(「飲食店を探す」)に分類される確率が所定の閾値を超えるように第2モデルM2を学習させる。なお、情報処理装置100は、あらかじめ用意された正解データを用いて第2モデルを学習させる。情報処理装置100は、第2モデルM2の正解データを生成してもよい。そして、情報処理装置100は、生成した正解データを用いて第2モデルM2を学習させてもよい。具体的には、情報処理装置100は、検索クエリを検索したユーザの検索後の行動に基づいて、検索クエリが属する正解カテゴリを決定する。より具体的には、情報処理装置100は、所定の検索クエリを検索したユーザに対して、検索後に所定の行動を起こしたユーザの割合が所定の閾値を超える所定の行動を、正解カテゴリに対応する行動として決定する。例えば、検索クエリQ11(「六本木 パスタ」)を検索したユーザが検索後に所定の行動を起こしたユーザの割合として、飲食店を探す行動を起こしたユーザの割合が90%、検索後に商品を探す行動を起こしたユーザの割合が0%、検索後に飲食店を予約する行動を起こしたユーザの割合が10%、検索後に商品を購入する行動を起こしたユーザの割合が0%であったとする。この場合、情報処理装置100は、飲食店を探す行動を起こしたユーザの割合が所定の閾値(例えば、90%)を超えるため、飲食店を探す行動を検索クエリQ11(「六本木 パスタ」)の正解カテゴリに対応する行動として決定する。そして、情報処理装置100は、正解カテゴリに対応する行動を飲食店を探す行動であると決定したので、検索クエリQ11(「六本木 パスタ」)が属する正解カテゴリをCAT11(「飲食店を探す」)に決定する。   For example, when the search query Q11 ("Roppongi pasta") is input to the second model M2 as input information (step S15), the information processing apparatus 100 disperses the search query Q11 ("Roppongi pasta") as output information. A vector BQV11 which is an expression is output. Here, the vector BQV11 is a distributed representation of the search query Q11 that has just been output from the output layer of the second model M2, and indicates the distributed representation before applying feedback to the second model M2 (before learning). Here, it is assumed that the correct answer category to which the search query Q11 ("Roppongi pasta") belongs is CAT11 ("search for a restaurant"). In this case, in the information processing apparatus 100, the probability that the vector BQV11, which is a distributed expression of the output search query Q11 ("Roppongi pasta"), is classified into CAT 11 ("search for a restaurant") exceeds a predetermined threshold. To learn the second model M2. Note that the information processing apparatus 100 learns the second model using correct answer data prepared in advance. The information processing apparatus 100 may generate correct answer data of the second model M2. The information processing apparatus 100 may learn the second model M2 using the generated correct answer data. Specifically, the information processing apparatus 100 determines the correct answer category to which the search query belongs, based on the post-search behavior of the user who has searched for the search query. More specifically, the information processing apparatus 100 corresponds to a correct answer category for a user who has searched for a predetermined search query, a predetermined action in which the percentage of users who have performed a predetermined action after the search exceeds a predetermined threshold. Decide as the action to be taken. For example, the percentage of users who have searched for restaurants is 90%, and the percentage of users who have searched for restaurants as a percentage of users who have searched for a restaurant after searching for a search query Q11 (“Roppongi pasta”). It is assumed that the proportion of users who have caused is 0%, the proportion of users who have made an action to reserve a restaurant after a search is 10%, and the proportion of those who have made an action to purchase a product after a search is 0%. In this case, since the information processing apparatus 100 exceeds the predetermined threshold (for example, 90%) with the percentage of users who have made an action to search for a restaurant, the information processing apparatus 100 performs the search query Q11 ("Roppongi pasta") The action corresponding to the correct category is determined. Then, since the information processing apparatus 100 determines that the action corresponding to the correct answer category is an action for searching for a restaurant, the correct answer category to which the search query Q11 ("Roppongi pasta") belongs is CAT11 ("search for a restaurant") Decide on.

例えば、情報処理装置100は、学習前の第2モデルM2に検索クエリQ11(「六本木 パスタ」)が入力された際に、分散表現であるベクトルBQV11がCAT11(「飲食店を探す」)に分類される確率を80%、CAT12(「商品を探す」)に分類される確率を0%、CAT13(「飲食店を予約」)に分類される確率を20%、CAT14(「商品を購入する」)に分類される確率を0%と出力したとする。この場合、情報処理装置100は、分散表現であるベクトルBQV11がCAT11(「飲食店を探す」)に分類される確率を所定の閾値(例えば、90%)を超えるように第2モデルM2を学習させる。また、情報処理装置100は、分散表現であるベクトルBQV11がCAT11(「飲食店を探す」)に分類される確率が所定の閾値(例えば、90%)を超えるように学習させるのに合わせて、分散表現であるベクトルBQV11が他のカテゴリCAT13(「飲食店を予約」)に分類される確率を10%に下げるように第2モデルM2を学習させる。   For example, when the search query Q11 ("Roppongi pasta") is input to the second model M2 before learning, the information processing apparatus 100 classifies the vector BQV11, which is a distributed expression, into CAT11 ("search for a restaurant"). The probability of being classified is 80%, the probability of being classified as CAT 12 ("Find a product") is 0%, the probability of being classified as CAT 13 ("Reserve a restaurant") is 20%, CAT 14 ("Buy a product") ) Is output as 0%. In this case, the information processing apparatus 100 learns the second model M2 such that the probability that the vector BQV11, which is a distributed expression, is classified into the CAT 11 ("search for a restaurant") exceeds a predetermined threshold (for example, 90%) Let In addition, the information processing apparatus 100 learns that the probability that the vector BQV11, which is a distributed expression, is classified into the CAT 11 (“search for a restaurant”) exceeds a predetermined threshold (for example, 90%), The second model M2 is trained so as to reduce the probability that the vector BQV11, which is a distributed expression, is classified into the other category CAT13 ("Reserve restaurant") to 10%.

このように、情報処理装置100は、入力情報として所定の検索クエリが入力されると、出力情報として所定の検索クエリの分散表現が正解カテゴリに分類される確率が所定の閾値を超えるように第2モデルを学習させる。そして、情報処理装置100は、入力情報として所定の検索クエリが入力された際に、所定の検索クエリの分散表現がそのカテゴリに属する確率が所定の閾値を超えるカテゴリを、所定の検索クエリのカテゴリとして出力する。例えば、情報処理装置100は、学習済みの第2モデルM2に入力情報として検索クエリQ11(「六本木 パスタ」)が入力されると、検索クエリQ11(「六本木 パスタ」)の分散表現であるベクトルBQV11がカテゴリCAT11(「飲食店を探す」)に属する確率が90%を超えるので、出力情報として検索クエリが属するカテゴリをCAT11(「飲食店を探す」)と出力する(ステップS16)。このように、情報処理装置100は、検索クエリと検索クエリの正解カテゴリとの組を学習することで、所定の検索クエリから所定の検索クエリのカテゴリを予測する第2モデルを生成する(ステップS17)。   As described above, when the predetermined search query is input as the input information, the information processing apparatus 100 causes the probability that the distributed expression of the predetermined search query as the output information is classified into the correct answer category exceeds the predetermined threshold. 2 Train the model. Then, when a predetermined search query is input as input information, the information processing apparatus 100 selects a category in which the probability that the distributed expression of the predetermined search query belongs to the category exceeds a predetermined threshold, Output as For example, when the search query Q11 ("Roppongi pasta") is input as input information to the learned second model M2, the information processing apparatus 100 generates a vector BQV11 which is a distributed expression of the search query Q11 ("Roppongi pasta"). Since the probability of belonging to the category CAT11 ("search for a restaurant") exceeds 90%, the category to which the search query belongs is output as CAT11 ("search for a restaurant") as output information (step S16). Thus, the information processing apparatus 100 generates a second model that predicts a category of a predetermined search query from a predetermined search query by learning a set of a search query and a correct category of the search query (step S17). ).

一般的に、ユーザはある意図を持って検索を複数回行うと考えられるため、所定の時間内に連続して入力された検索クエリは、検索意図が近いという仮定が成り立つ。そこで、本願発明に係る情報処理装置100は、所定の時間内に連続して入力された複数の検索クエリは、所定の検索意図の下で検索された検索クエリであるという点で、相互に類似する特徴を有する検索クエリであるとみなして第1モデルM1を学習させる。これにより、情報処理装置100は、検索意図を考慮した検索クエリの特徴を第1モデルM1に学習させることができる。そして、情報処理装置100は、検索意図を考慮した検索クエリの特徴を学習した第1モデルM1を活用して、所定の検索クエリから所定の検索クエリのカテゴリを予測する第2モデルを効率的に生成することができる。これにより、情報処理装置100は、検索クエリを入力したユーザの検索意図を考慮したカテゴリに検索クエリを分類することを可能にする。また、従来、検索クエリをカテゴリに分類し、高い分類精度を得るためには、十分な量の正解データを用意することが必要であった。しかしながら、検索クエリ自体、多種多様であり、ロングテイルな性質を持つものであるため、多数の検索クエリに対応する正解カテゴリをラベル付けするのは、非常に手間がかかり困難である。ここで、情報処理装置100は、検索意図を考慮した検索クエリの特徴を学習させた第1モデルを出発点として第2モデルを学習させることにより、正解カテゴリをラベル付けする代わりに、ユーザの検索意図(検索クエリを入力したユーザのコンテクスト)を一種の正解として、検索クエリのカテゴリを予測する第2モデルを学習させることができる。これにより、情報処理装置100は、人手で検索クエリの正解カテゴリをラベル付けすることなく、第2モデルを学習させることができる。すなわち、情報処理装置100は、正解データが少ないときでも、十分な分類精度を得られるようになる。また、情報処理装置100は、正解データが多いときであれば、さらに高い分類精度を得られるようになる。したがって、情報処理装置100は、検索クエリの分類精度を高めることができる。   In general, since a user is considered to search several times with a certain intention, it is assumed that search queries sequentially input within a predetermined time have a similar search intention. Therefore, the information processing apparatus 100 according to the present invention is similar to each other in that a plurality of search queries input continuously within a predetermined time are search queries searched under a predetermined search intention. The first model M1 is learned by assuming that the search query has the characteristic of Thereby, the information processing apparatus 100 can cause the first model M1 to learn the characteristics of the search query considering the search intention. Then, the information processing apparatus 100 uses the first model M1 that has learned the characteristics of the search query in consideration of the search intention, and efficiently uses the second model that predicts the category of the predetermined search query from the predetermined search query. Can be generated. As a result, the information processing apparatus 100 can classify the search query into a category in consideration of the search intention of the user who has input the search query. Conventionally, it has been necessary to prepare a sufficient amount of correct answer data in order to classify search queries into categories and obtain high classification accuracy. However, since the search queries themselves are various and have long tail properties, it is very time consuming and difficult to label correct answer categories corresponding to a large number of search queries. Here, the information processing apparatus 100 learns the second model from the first model that has learned the characteristics of the search query in consideration of the search intention, so that the user's search can be performed instead of labeling the correct category. The second model which predicts the category of the search query can be learned with the intention (the context of the user who has input the search query) as a sort of correct answer. Thereby, the information processing apparatus 100 can learn the second model without manually labeling the correct answer category of the search query. That is, the information processing apparatus 100 can obtain sufficient classification accuracy even when there are few correct answer data. Further, the information processing apparatus 100 can obtain higher classification accuracy when there is a lot of correct answer data. Therefore, the information processing apparatus 100 can improve the classification accuracy of the search query.

〔2.情報処理装置の構成〕
次に、図3を用いて、実施形態に係る情報処理装置100の構成について説明する。図3は、実施形態に係る情報処理装置100の構成例を示す図である。図3に示すように、情報処理装置100は、通信部110と、記憶部120と、制御部130とを有する。なお、情報処理装置100は、情報処理装置100の管理者等から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を表示するための表示部(例えば、液晶ディスプレイ等)を有してもよい。
[2. Configuration of information processing apparatus]
Next, the configuration of the information processing apparatus 100 according to the embodiment will be described with reference to FIG. FIG. 3 is a diagram illustrating an exemplary configuration of the information processing apparatus 100 according to the embodiment. As shown in FIG. 3, the information processing apparatus 100 includes a communication unit 110, a storage unit 120, and a control unit 130. The information processing apparatus 100 includes an input unit (for example, a keyboard and a mouse) that receives various operations from an administrator of the information processing apparatus 100 and a display unit (for example, a liquid crystal display) for displaying various types of information. You may have.

(通信部110)
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部110は、ネットワークと有線または無線で接続され、例えば、ユーザ端末10と、検索サーバ50との間で情報の送受信を行う。
(Communication unit 110)
The communication unit 110 is realized by, for example, a network interface card (NIC). The communication unit 110 is connected to the network by wire or wirelessly, and transmits and receives information between the user terminal 10 and the search server 50, for example.

(記憶部120)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。記憶部120は、図3に示すように、クエリ情報記憶部121と、ベクトル情報記憶部122と、分類定義記憶部123と、カテゴリ情報記憶部124と、モデル情報記憶部125とを有する。
(Storage unit 120)
The storage unit 120 is realized by, for example, a semiconductor memory device such as a RAM (Random Access Memory) or a flash memory, or a storage device such as a hard disk or an optical disk. As illustrated in FIG. 3, the storage unit 120 includes a query information storage unit 121, a vector information storage unit 122, a classification definition storage unit 123, a category information storage unit 124, and a model information storage unit 125.

(クエリ情報記憶部121)
クエリ情報記憶部121は、ユーザによって入力された検索クエリに関する各種の情報を記憶する。図4に、実施形態に係るクエリ情報記憶部の一例を示す。図4に示す例では、クエリ情報記憶部121は、「ユーザID」、「日時」、「検索クエリ」、「検索クエリID」といった項目を有する。
(Query information storage unit 121)
The query information storage unit 121 stores various types of information related to the search query input by the user. FIG. 4 shows an example of the query information storage unit according to the embodiment. In the example illustrated in FIG. 4, the query information storage unit 121 has items such as “user ID”, “date and time”, “search query”, and “search query ID”.

「ユーザID」は、検索クエリを入力したユーザを識別するための識別情報を示す。「日時」は、検索サーバがユーザから検索クエリを受け付けた日時を示す。「検索クエリ」は、ユーザによって入力された検索クエリを示す。「検索クエリID」は、ユーザによって入力された検索クエリを識別するための識別情報を示す。   “User ID” indicates identification information for identifying the user who has input the search query. “Date and time” indicates the date and time when the search server received a search query from the user. “Search query” indicates a search query input by the user. “Search query ID” indicates identification information for identifying a search query input by a user.

図4の1レコード目に示す例では、検索クエリID「Q11」で識別される検索クエリ(検索クエリQ11)は、図1に示した検索クエリQ11に対応する。また、ユーザID「U1」は、検索クエリQ11を入力したユーザがユーザID「U1」で識別されるユーザ(ユーザU1)であることを示す。また、日時「2018/9/1 PM17:00」は、検索サーバがユーザU1から検索クエリQ11を受け付けた日時が2018年9月1日の午後17:00であることを示す。また、検索クエリ「六本木 パスタ」は、ユーザU1によって入力された検索クエリQ11を示す。具体的には、検索クエリ「六本木 パスタ」は、地名を示す「六本木」と食品の種類を示す「パスタ」の文字とが区切り文字であるスペースで区切られた文字列であることを示す。   In the example shown in the first record of FIG. 4, the search query (search query Q11) identified by the search query ID “Q11” corresponds to the search query Q11 shown in FIG. The user ID “U1” indicates that the user who has input the search query Q11 is the user (user U1) identified by the user ID “U1”. The date and time “2018/9/1 PM 17:00” indicates that the date and time when the search server accepted the search query Q11 from the user U1 is 17:00 pm on September 1, 2018. The search query “Roppongi pasta” indicates a search query Q11 input by the user U1. Specifically, the search query “Roppongi pasta” indicates that the character string “Roppongi” indicating the place name and the character “pasta” indicating the type of food are separated by a space as a delimiter.

(ベクトル情報記憶部122)
ベクトル情報記憶部122は、検索クエリの分散表現であるベクトルに関する各種の情報を記憶する。図5に、実施形態に係るベクトル情報記憶部の一例を示す。図5に示す例では、ベクトル情報記憶部122は、「ベクトルID」、「検索クエリID」、「ベクトル情報」といった項目を有する。
(Vector information storage unit 122)
The vector information storage unit 122 stores various types of information regarding vectors that are distributed representations of search queries. FIG. 5 shows an example of the vector information storage unit according to the embodiment. In the example illustrated in FIG. 5, the vector information storage unit 122 includes items such as “vector ID”, “search query ID”, and “vector information”.

「ベクトルID」は、検索クエリの分散表現であるベクトルを識別するための識別情報を示す。「検索クエリID」は、ベクトルに対応する検索クエリを識別するための識別情報を示す。「ベクトル情報」は、検索クエリの分散表現であるN次元のベクトルを示す。検索クエリの分散表現であるベクトルは、例えば、128次元のベクトルである。   "Vector ID" indicates identification information for identifying a vector that is a distributed expression of a search query. “Search query ID” indicates identification information for identifying a search query corresponding to a vector. “Vector information” indicates an N-dimensional vector which is a distributed expression of the search query. The vector that is a distributed expression of the search query is, for example, a 128-dimensional vector.

図5の1レコード目に示す例では、ベクトルID「QV11」で識別されるベクトル(ベクトルQV11)は、図1に示した検索クエリQ11の分散表現であるベクトルQV11に対応する。また、検索クエリID「Q11」で識別される検索クエリ(検索クエリQ11)は、ベクトルQV11に対応する検索クエリが検索クエリQ11であることを示す。また、ベクトル情報「QVDT11」は、検索クエリQ11の分散表現であるN次元のベクトルを示す。   In the example shown in the first record of FIG. 5, the vector (vector QV11) identified by the vector ID “QV11” corresponds to the vector QV11 that is a distributed representation of the search query Q11 shown in FIG. The search query (search query Q11) identified by the search query ID “Q11” indicates that the search query corresponding to the vector QV11 is the search query Q11. Also, vector information “QVDT11” indicates an N-dimensional vector that is a distributed expression of the search query Q11.

(分類定義記憶部123)
分類定義記憶部123は、検索クエリが分類されるカテゴリの定義に関する各種の情報を記憶する。図6に、実施形態に係る分類定義記憶部の一例を示す。図6に示す例では、分類定義記憶部123は、「大分類ID」、「大分類」、「小分類ID」、「小分類」といった項目を有する。
(Classification definition storage unit 123)
The classification definition storage unit 123 stores various types of information related to the definition of the category into which the search query is classified. FIG. 6 shows an example of the classification definition storage unit according to the embodiment. In the example shown in FIG. 6, the classification definition storage unit 123 has items such as “large classification ID”, “large classification”, “small classification ID”, and “small classification”.

「大分類」は、検索クエリが分類されるカテゴリの大分類を示す。「大分類ID」は、大分類を識別するための識別情報を示す。図6に示す例では、大分類「購買行動系」は、図1の下段に示す例で説明した大分類に対応する。大分類「購買行動系」は、検索クエリをユーザの購買行動に基づいて分類するカテゴリの大分類を示す。図6に示す例では、大分類「購買行動系」は、さらに4つの小分類を有する。大分類ID「CAT1」は、大分類「購買行動系」を識別するための識別情報を示す。   “Major classification” indicates the major classification of the category into which the search query is classified. The “major classification ID” indicates identification information for identifying the major classification. In the example illustrated in FIG. 6, the large classification “purchasing behavior system” corresponds to the large classification described in the example illustrated in the lower part of FIG. 1. The large classification “purchase behavior system” indicates a large classification of categories for classifying the search query based on the purchase behavior of the user. In the example illustrated in FIG. 6, the major classification “purchasing behavior system” further includes four minor classifications. The large category ID “CAT1” indicates identification information for identifying the large category “purchasing behavior system”.

「小分類」、検索クエリが分類されるカテゴリの小分類を示す。「小分類ID」は、小分類を識別するための識別情報を示す。図6に示す例では、小分類「飲食店を探す」は、大分類「購買行動系」に属する分類であって、小分類に分類される検索クエリが、ユーザによって飲食店を探す意図で入力された検索クエリであることを示す。小分類ID「CAT11」は、小分類「飲食店を探す」を識別するための識別情報を示す。   “Small category” indicates a minor category of a category into which the search query is classified. “Small category ID” indicates identification information for identifying a minor category. In the example shown in FIG. 6, the minor category "find restaurant" is a category belonging to the major category "purchasing behavior system", and a search query classified as minor category is input with the intention of the user to search for a restaurant Indicates that the search query was made. The small category ID "CAT11" indicates identification information for identifying the small category "finding restaurant".

小分類「商品を探す」は、大分類「購買行動系」に属する分類であって、小分類に分類される検索クエリが、ユーザによって商品を探す意図で入力された検索クエリであることを示す。小分類ID「CAT12」は、小分類「商品を探す」を識別するための識別情報を示す。   The subcategory “Find Product” is a category belonging to the major category “Purchasing Behavior”, and indicates that the search query that is classified into the subcategory is a search query that is entered by the user with the intention of searching for a product. . The small classification ID “CAT12” indicates identification information for identifying the small classification “search for a product”.

小分類「飲食店を予約」は、大分類「購買行動系」に属する分類であって、小分類に分類される検索クエリが、ユーザによって飲食店を予約する意図で入力された検索クエリであることを示す。小分類ID「CAT13」は、小分類「飲食店を予約」を識別するための識別情報を示す。   The minor category "reserve restaurant" is a category belonging to the major category "purchasing behavior type", and the search query classified into the minor category is a search query input by the user with the intention of reserving the restaurant by the user Indicates that. The small category ID "CAT13" indicates identification information for identifying the small category "reserve restaurant".

小分類「商品を購入」は、大分類「購買行動系」に属する分類であって、小分類に分類される検索クエリが、ユーザによって商品を購入する意図で入力された検索クエリであることを示す。小分類ID「CAT14」は、小分類「商品を購入」を識別するための識別情報を示す。   The subcategory “Purchase product” is a category belonging to the main category “Purchasing behavior”, and the search query classified into the subcategory is a search query entered by the user with the intention of purchasing the product. Show. The small classification ID “CAT14” indicates identification information for identifying the small classification “purchase a product”.

(カテゴリ情報記憶部124)
カテゴリ情報記憶部124は、検索クエリが属するカテゴリに関する各種の情報を記憶する。具体的には、カテゴリ情報記憶部124は、学習済みの第2学習モデルに検索クエリが入力された際に、第2学習モデルが出力するカテゴリに関する各種の情報を記憶する。図7に、実施形態に係るカテゴリ情報記憶部の一例を示す。図7に示す例では、カテゴリ情報記憶部124は、「検索クエリID」、「大分類ID」、「小分類ID」、「確率(%)」といった項目を有する。
(Category information storage unit 124)
The category information storage unit 124 stores various types of information related to the category to which the search query belongs. Specifically, the category information storage unit 124 stores various types of information related to the category output by the second learning model when the search query is input to the learned second learning model. FIG. 7 shows an example of the category information storage unit according to the embodiment. In the example illustrated in FIG. 7, the category information storage unit 124 has items such as “search query ID”, “large category ID”, “small category ID”, and “probability (%)”.

「検索クエリID」は、ユーザによって入力された検索クエリを識別するための識別情報を示す。図7に示す例では、検索クエリID「Q11」で識別される検索クエリ(検索クエリQ11)は、図1に示した検索クエリQ11に対応する。   “Search query ID” indicates identification information for identifying a search query input by a user. In the example shown in FIG. 7, the search query (search query Q11) identified by the search query ID “Q11” corresponds to the search query Q11 shown in FIG.

「大分類ID」は、大分類を識別するための識別情報を示す。「小分類ID」は、小分類を識別するための識別情報を示す。「確率(%)」は、学習済みの第2学習モデルに検索クエリが入力された際に、第2学習モデルが出力する小分類毎の確率を示す。図7に示す例では、確率(%)「90」は、検索クエリQ11がカテゴリCAT11に分類される確率が90%であることを示す。   The “major classification ID” indicates identification information for identifying the major classification. “Small category ID” indicates identification information for identifying a minor category. “Probability (%)” indicates the probability for each minor category output by the second learning model when the search query is input to the learned second learning model. In the example shown in FIG. 7, the probability (%) "90" indicates that the probability that the search query Q11 is classified into the category CAT11 is 90%.

(モデル情報記憶部125)
モデル情報記憶部125は、情報処理装置100によって生成された学習モデルに関する各種の情報を記憶する。図8に、実施形態に係るモデル情報記憶部の一例を示す。図8に示す例では、モデル情報記憶部125は、「モデルID」、「モデルデータ」といった項目を有する。
(Model information storage unit 125)
The model information storage unit 125 stores various types of information regarding the learning model generated by the information processing apparatus 100. FIG. 8 shows an example of a model information storage unit according to the embodiment. In the example illustrated in FIG. 8, the model information storage unit 125 includes items such as “model ID” and “model data”.

「モデルID」は、情報処理装置100によって生成された学習モデルを識別するための識別情報を示す。「モデルデータ」は、情報処理装置100によって生成された学習モデルのモデルデータを示す。例えば、「モデルデータ」には、検索クエリを分散表現に変換するためのデータが格納される。   “Model ID” indicates identification information for identifying a learning model generated by the information processing apparatus 100. “Model data” indicates model data of a learning model generated by the information processing apparatus 100. For example, “model data” stores data for converting a search query into a distributed expression.

図8の1レコード目に示す例では、モデルID「M1」で識別される学習モデルは、図1に示した第1モデルM1に対応する。また、モデルデータ「MDT1」は、情報処理装置100によって生成された第1モデルM1のモデルデータ(モデルデータMDT1)を示す。   In the example shown in the first record in FIG. 8, the learning model identified by the model ID “M1” corresponds to the first model M1 shown in FIG. The model data “MDT1” indicates model data (model data MDT1) of the first model M1 generated by the information processing apparatus 100.

モデルデータMDT1は、検索クエリが入力される入力層と、出力層と、入力層から出力層までのいずれかの層であって出力層以外の層に属する第1要素と、第1要素と第1要素の重みとに基づいて値が算出される第2要素と、を含み、入力層に入力された検索クエリに応じて、入力層に入力された検索クエリの分散表現を出力層から出力するよう、情報処理装置100を機能させてもよい。   The model data MDT1 is an input layer to which a search query is input, an output layer, and any layer from the input layer to the output layer, and is a first element belonging to a layer other than the output layer, a first element and a first A second element whose value is calculated based on the weight of one element, and outputs a distributed representation of the search query input to the input layer from the output layer in response to the search query input to the input layer As such, the information processing apparatus 100 may function.

ここで、モデルデータMDT1が「y=a1*x1+a2*x2+・・・+ai*xi」で示す回帰モデルで実現されるとする。この場合、モデルデータMDT1が含む第1要素は、x1やx2等といった入力データ(xi)に対応する。また、第1要素の重みは、xiに対応する係数aiに対応する。ここで、回帰モデルは、入力層と出力層とを有する単純パーセプトロンと見做すことができる。各モデルを単純パーセプトロンと見做した場合、第1要素は、入力層が有するいずれかのノードに対応し、第2要素は、出力層が有するノードと見做すことができる。   Here, it is assumed that the model data MDT1 is realized by a regression model represented by “y = a1 * x1 + a2 * x2 +... + Ai * xi”. In this case, the first element included in the model data MDT1 corresponds to input data (xi) such as x1 or x2. The weight of the first element corresponds to the coefficient ai corresponding to xi. Here, the regression model can be regarded as a simple perceptron having an input layer and an output layer. When each model is regarded as a simple perceptron, the first element can correspond to any node of the input layer, and the second element can be regarded as a node of the output layer.

また、モデルデータMDT1がDNN(Deep Neural Network)等、1つまたは複数の中間層を有するニューラルネットワークで実現されるとする。この場合、モデルデータMDT1が含む第1要素は、入力層または中間層が有するいずれかのノードに対応する。また、第2要素は、第1要素と対応するノードから値が伝達されるノードである次段のノードに対応する。また、第1要素の重みは、第1要素と対応するノードから第2要素と対応するノードに伝達される値に対して考慮される重みである接続係数に対応する。   Further, it is assumed that the model data MDT1 is realized by a neural network having one or a plurality of intermediate layers such as DNN (Deep Neural Network). In this case, the first element included in the model data MDT1 corresponds to any node of the input layer or the middle layer. Also, the second element corresponds to the next-stage node that is a node to which a value is transmitted from the node corresponding to the first element. Also, the weight of the first element corresponds to the connection coefficient, which is a weight considered for the value transmitted from the node corresponding to the first element to the node corresponding to the second element.

情報処理装置100は、上述した回帰モデルやニューラルネットワーク等、任意の構造を有するモデルを用いて、分散表現の算出を行う。具体的には、モデルデータMDT1は、検索クエリが入力された場合に、分散表現を出力するように係数が設定される。情報処理装置100は、このようなモデルデータMDT1を用いて、分散表現を算出する。   The information processing apparatus 100 calculates a distributed expression using a model having an arbitrary structure such as the above-described regression model or neural network. Specifically, in the model data MDT1, a coefficient is set so that a distributed expression is output when a search query is input. The information processing apparatus 100 calculates the distributed representation using such model data MDT1.

なお、上記例では、モデルデータMDT1が、検索クエリが入力された場合に、検索クエリの分散表現を出力するモデル(以下、モデルX1という。)である例を示した。しかし、実施形態に係るモデルデータMDT1は、モデルX1にデータの入出力を繰り返すことで得られる結果に基づいて生成されるモデルであってもよい。例えば、モデルデータMDT1は、検索クエリを入力とし、モデルX1が出力する分散表現を出力とするよう学習されたモデル(以下、モデルY1という。)であってもよい。または、モデルデータMDT1は、検索クエリを入力とし、モデルY1の出力値を出力とするよう学習されたモデルであってもよい。   In the above example, the model data MDT1 is an example in which the distributed expression of the search query is output (hereinafter referred to as a model X1) when the search query is input. However, model data MDT1 which concerns on embodiment may be a model produced | generated based on the result obtained by repeating input and output of data to model X1. For example, the model data MDT1 may be a model (hereinafter, referred to as a model Y1) that has been learned so that a search query is input and a distributed representation output by the model X1 is output. Alternatively, the model data MDT1 may be a model learned by using a search query as an input and outputting the output value of the model Y1.

また、情報処理装置100がGAN(Generative Adversarial Networks)を用いた推定処理を行う場合、モデルデータMDT1は、GANの一部を構成するモデルであってもよい。   When the information processing apparatus 100 performs an estimation process using GAN (Generative Adversarial Networks), the model data MDT1 may be a model that constitutes a part of the GAN.

図8の2レコード目に示す例では、モデルID「M2」で識別される学習モデルは、図1に示した第2モデルM2に対応する。また、モデルデータ「MDT2」は、情報処理装置100によって生成された第2モデルM2のモデルデータ(モデルデータMDT2)を示す。   In the example shown in the second record of FIG. 8, the learning model identified by the model ID “M2” corresponds to the second model M2 shown in FIG. 1. The model data “MDT2” indicates model data (model data MDT2) of the second model M2 generated by the information processing apparatus 100.

モデルデータMDT2は、検索クエリが入力される入力層と、出力層と、入力層から出力層までのいずれかの層であって出力層以外の層に属する第1要素と、第1要素と第1要素の重みとに基づいて値が算出される第2要素と、を含み、入力層に入力された検索クエリに応じて、入力層に入力された検索クエリが各カテゴリに属する確率を出力層から出力するよう、情報処理装置100を機能させてもよい。   The model data MDT2 is an input layer to which a search query is input, an output layer, and any layer from the input layer to the output layer, which is a first element belonging to a layer other than the output layer, a first element and a first A second element whose value is calculated based on the weight of one element, and in accordance with the search query input to the input layer, the probability that the search query input to the input layer belongs to each category is output to the output layer The information processing apparatus 100 may be caused to function so as to be output from.

ここで、モデルデータMDT2が「y=a1*x1+a2*x2+・・・+ai*xi」で示す回帰モデルで実現されるとする。この場合、モデルデータMDT2が含む第1要素は、x1やx2等といった入力データ(xi)に対応する。また、第1要素の重みは、xiに対応する係数aiに対応する。ここで、回帰モデルは、入力層と出力層とを有する単純パーセプトロンと見做すことができる。各モデルを単純パーセプトロンと見做した場合、第1要素は、入力層が有するいずれかのノードに対応し、第2要素は、出力層が有するノードと見做すことができる。   Here, it is assumed that the model data MDT2 is realized by a regression model represented by “y = a1 * x1 + a2 * x2 +... + Ai * xi”. In this case, the first element included in the model data MDT2 corresponds to input data (xi) such as x1 and x2. The weight of the first element corresponds to the coefficient ai corresponding to xi. Here, the regression model can be regarded as a simple perceptron having an input layer and an output layer. When each model is regarded as a simple perceptron, the first element can correspond to any node of the input layer, and the second element can be regarded as a node of the output layer.

また、モデルデータMDT2がDNN(Deep Neural Network)等、1つまたは複数の中間層を有するニューラルネットワークで実現されるとする。この場合、モデルデータMDT2が含む第1要素は、入力層または中間層が有するいずれかのノードに対応する。また、第2要素は、第1要素と対応するノードから値が伝達されるノードである次段のノードに対応する。また、第1要素の重みは、第1要素と対応するノードから第2要素と対応するノードに伝達される値に対して考慮される重みである接続係数に対応する。   Further, it is assumed that the model data MDT2 is realized by a neural network having one or a plurality of intermediate layers such as DNN (Deep Neural Network). In this case, the first element included in the model data MDT2 corresponds to any node that the input layer or the middle layer has. Also, the second element corresponds to the next-stage node that is a node to which a value is transmitted from the node corresponding to the first element. Also, the weight of the first element corresponds to the connection coefficient, which is a weight considered for the value transmitted from the node corresponding to the first element to the node corresponding to the second element.

情報処理装置100は、上述した回帰モデルやニューラルネットワーク等、任意の構造を有するモデルを用いて、検索クエリが各カテゴリに属する確率の算出を行う。具体的には、モデルデータMDT2は、検索クエリが入力された場合に、検索クエリが各カテゴリに属する確率を出力するように係数が設定される。情報処理装置100は、このようなモデルデータMDT2を用いて、検索クエリが各カテゴリに属する確率を算出する。   The information processing apparatus 100 calculates the probability that the search query belongs to each category, using a model having an arbitrary structure, such as the above-described regression model or neural network. Specifically, in the model data MDT2, coefficients are set so that the probability that the search query belongs to each category is output when the search query is input. The information processing apparatus 100 calculates the probability that the search query belongs to each category, using such model data MDT2.

なお、上記例では、モデルデータMDT2が、検索クエリが入力された場合に、検索クエリが各カテゴリに属する確率を出力するモデル(以下、モデルX2という。)である例を示した。しかし、実施形態に係るモデルデータMDT2は、モデルX2にデータの入出力を繰り返すことで得られる結果に基づいて生成されるモデルであってもよい。例えば、モデルデータMDT2は、検索クエリを入力とし、モデルX2が出力する確率を出力とするよう学習されたモデル(以下、モデルY2という。)であってもよい。または、モデルデータMDT2は、検索クエリを入力とし、モデルY2の出力値を出力とするよう学習されたモデルであってもよい。   In the above example, the model data MDT2 is an example of a model (hereinafter referred to as model X2) that outputs the probability that the search query belongs to each category when the search query is input. However, model data MDT2 which concerns on embodiment may be a model produced | generated based on the result obtained by repeating input and output of data to model X2. For example, the model data MDT2 may be a model (hereinafter referred to as a model Y2) that has been learned so as to have a search query as an input and a probability that the model X2 outputs as an output. Alternatively, the model data MDT2 may be a model learned by using a search query as an input and outputting the output value of the model Y2.

また、情報処理装置100がGAN(Generative Adversarial Networks)を用いた推定処理を行う場合、モデルデータMDT2は、GANの一部を構成するモデルであってもよい。   When the information processing apparatus 100 performs an estimation process using GAN (Generative Adversarial Networks), the model data MDT2 may be a model that constitutes a part of the GAN.

(制御部130)
図3の説明に戻って、制御部130は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、情報処理装置100内部の記憶装置に記憶されている各種プログラム(生成プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部130は、コントローラであり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
(Control unit 130)
Returning to the description of FIG. 3, the control unit 130 is a controller, and is stored in a storage device inside the information processing apparatus 100 by, for example, a CPU (Central Processing Unit) or an MPU (Micro Processing Unit). Various programs (corresponding to an example of a generation program) are realized by executing the RAM as a work area. The control unit 130 is a controller, and is realized by an integrated circuit such as an application specific integrated circuit (ASIC) or a field programmable gate array (FPGA).

また、制御部130は、モデル情報記憶部125に記憶されている第1モデルM1(モデルデータMDT1)に従った情報処理により、入力層に入力された検索クエリに対し、出力層以外の各層に属する各要素を第1要素として、第1要素と第1要素の重みとに基づく演算を行うことにより、分散表現を出力層から出力するよう、コンピュータを機能させる。   In addition, the control unit 130 performs a search query input to the input layer on each layer other than the output layer by information processing according to the first model M1 (model data MDT1) stored in the model information storage unit 125. The computer is functioned to output the distributed representation from the output layer by performing an operation based on the first element and the weight of the first element with each element to which it belongs as the first element.

また、制御部130は、モデル情報記憶部125に記憶されている第2モデルM2(モデルデータMDT2)に従った情報処理により、入力層に入力された検索クエリに対し、出力層以外の各層に属する各要素を第1要素として、第1要素と第1要素の重みとに基づく演算を行うことにより、検索クエリが各カテゴリに属する確率を出力層から出力するよう、コンピュータを機能させる。   In addition, the control unit 130 performs a search query input to the input layer on each layer other than the output layer by information processing according to the second model M2 (model data MDT2) stored in the model information storage unit 125. The computer is functioned to output the probability that the search query belongs to each category from the output layer by performing an operation based on the first element and the weight of the first element with each element to which it belongs as the first element.

図3に示すように、制御部130は、取得部131と、抽出部132と、生成部133とを有し、以下に説明する情報処理の作用を実現または実行する。なお、制御部130の内部構成は、図3に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。   As shown in FIG. 3, the control unit 130 includes an acquisition unit 131, an extraction unit 132, and a generation unit 133, and implements or executes the action of the information processing described below. Note that the internal configuration of the control unit 130 is not limited to the configuration illustrated in FIG. 3, and may be another configuration as long as the information processing described below is performed.

(取得部131)
取得部131は、種々の情報を取得する。具体的には、取得部131は、ユーザによって入力された検索クエリを検索サーバ50から取得する。取得部131は、ユーザによって入力された検索クエリを取得すると、取得した検索クエリをクエリ情報記憶部121に格納する。また、取得部131は、検索クエリの分散表現であるベクトルに関するベクトル情報を取得する。取得部131は、ベクトル情報を取得すると、取得したベクトル情報をベクトル情報記憶部122に格納する。また、取得部131は、検索クエリと検索クエリが属するカテゴリの分類を定義する情報を取得する。取得部131は、検索クエリと検索クエリが属するカテゴリの分類を定義する分類定義情報を取得すると、取得した分類定義情報を分類定義記憶部123に格納する。また、取得部131は、検索クエリが属するカテゴリに関するカテゴリ情報を取得する。取得部131は、カテゴリ情報を取得すると、取得したカテゴリ情報をカテゴリ情報記憶部124に格納する。
(Acquisition part 131)
The acquisition unit 131 acquires various information. Specifically, the acquisition unit 131 acquires a search query input by the user from the search server 50. When acquiring the search query input by the user, the acquiring unit 131 stores the acquired search query in the query information storage unit 121. In addition, the acquisition unit 131 acquires vector information related to a vector that is a distributed expression of a search query. When acquiring the vector information, the acquiring unit 131 stores the acquired vector information in the vector information storage unit 122. In addition, the acquisition unit 131 acquires information that defines the search query and the category of the category to which the search query belongs. When acquiring the classification definition information defining the search query and the classification of the category to which the search query belongs, the acquisition unit 131 stores the acquired classification definition information in the classification definition storage unit 123. Further, the acquisition unit 131 acquires category information related to the category to which the search query belongs. When acquiring the category information, the acquiring unit 131 stores the acquired category information in the category information storage unit 124.

また、取得部131は、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして、複数の検索クエリが有する特徴を学習した第1学習モデルを取得する。具体的には、取得部131は、生成部133によって、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして学習することで、所定の検索クエリから所定の検索クエリの特徴情報を予測する学習モデルとして生成された第1学習モデルを取得する。また、取得部131は、入力情報として所定の検索クエリが入力された際に、出力情報として所定の検索クエリの分散表現を出力する第1学習モデルを取得する。また、取得部131は、所定の時間内に続けて入力された一対の検索クエリの分散表現が類似するように学習することで、複数の検索クエリが有する特徴を学習した第1学習モデルを取得する。また、取得部131は、同一のユーザによって所定の時間内に入力された複数の検索クエリとして、所定の区切り文字で区切られた文字列を含む複数の検索クエリが類似する特徴を有するものとして学習することで、複数の検索クエリが有する特徴を学習した第1学習モデルを取得する。また、取得部131は、ランダムに抽出された複数の検索クエリが相違する特徴を有するものとして学習することで、複数の検索クエリが有する特徴を学習した第1学習モデルを取得する。また、取得部131は、ランダムに抽出された一対の検索クエリの分散表現が相違するように学習することで、複数の検索クエリが有する特徴を学習した第1学習モデルを取得する。取得部131は、第1学習モデルを取得すると、取得した第1学習モデルを識別する識別情報と対応付けて、第1学習モデルのモデルデータMDT1をモデル情報記憶部125に格納する。   In addition, the acquisition unit 131 acquires a first learning model in which a plurality of search queries input within a predetermined time by the same user have similar characteristics and learns the characteristics of the plurality of search queries. Specifically, the acquisition unit 131 learns that a plurality of search queries input by the same user within a predetermined time by the generation unit 133 have similar characteristics, and thus acquires the predetermined search query from the predetermined search query. The first learning model generated as a learning model for predicting the feature information of the search query is acquired. In addition, when a predetermined search query is input as input information, the acquisition unit 131 acquires a first learning model that outputs a distributed expression of the predetermined search query as output information. In addition, the acquisition unit 131 acquires a first learning model in which features of a plurality of search queries are learned by learning so that the distributed expressions of a pair of search queries input in succession within a predetermined time are similar. Do. In addition, the acquiring unit 131 learns that a plurality of search queries including character strings separated by predetermined delimiters have similar characteristics as a plurality of search queries input within a predetermined time by the same user. By doing this, the first learning model is obtained which has learned the features of the plurality of search queries. Further, the acquiring unit 131 acquires the first learning model in which the features included in the plurality of search queries are learned, by learning that the plurality of randomly extracted search queries have different features. In addition, the acquiring unit 131 acquires a first learning model in which features of a plurality of search queries are learned by learning so that the distributed expressions of a pair of search queries extracted at random are different. When acquiring the first learning model, the acquiring unit 131 stores model data MDT1 of the first learning model in the model information storage unit 125 in association with identification information that identifies the acquired first learning model.

また、取得部131は、生成部133によって、第1学習モデルを用いて、所定の検索クエリから所定の検索クエリが属するカテゴリを予測する学習モデルとして生成された第2学習モデルを取得する。取得部131は、第2学習モデルを取得すると、取得した第2学習モデルを識別する識別情報と対応付けて、第2学習モデルのモデルデータMDT2をモデル情報記憶部125に格納する。   In addition, the acquisition unit 131 acquires a second learning model generated by the generation unit 133 as a learning model that predicts a category to which a predetermined search query belongs from a predetermined search query using the first learning model. When acquiring the second learning model, the acquiring unit 131 stores model data MDT2 of the second learning model in the model information storage unit 125 in association with identification information identifying the acquired second learning model.

(抽出部132)
抽出部132は、種々の情報を抽出する。具体的には、抽出部132は、取得部131によって取得された検索クエリのうち、同一のユーザによって所定の時間内に入力された複数の検索クエリを抽出する。例えば、抽出部132は、同一のユーザによって各検索クエリが入力された時間の間隔が所定の時間内である複数の検索クエリを抽出する。続いて、抽出部132は、同一のユーザによって所定の時間内に入力された複数の検索クエリのうち、同一のユーザによって所定の時間内に連続して入力された一対の検索クエリを抽出する。例えば、抽出部132は、同一のユーザによって各検索クエリのペアが入力された時間の間隔が所定の時間内である複数の検索クエリを抽出する。例えば、抽出部132は、取得部131によって取得された検索クエリのうち、同一のユーザU1によって所定の時間内に連続して入力された4個の検索クエリである検索クエリQ11(「六本木 パスタ」)、検索クエリQ12(「六本木 イタリアン」)、検索クエリQ13(「赤坂 パスタ」)、検索クエリQ14(「麻布 パスタ」)を抽出する。抽出部132は、検索クエリが入力された順番に並べると、検索クエリQ11、検索クエリQ12、検索クエリQ13、検索クエリQ14の順番で入力された4個の検索クエリを抽出する。続いて、抽出部132は、4個の検索クエリを抽出すると、時系列的に隣り合う2つの検索クエリを一対の検索クエリとして、3対の検索クエリのペアである(検索クエリQ11、検索クエリQ12)、(検索クエリQ12、検索クエリQ13)、(検索クエリQ13、検索クエリQ14)を抽出する。なお、抽出部132は、同一のユーザによって全ての検索クエリが所定の時間内に入力された複数の検索クエリを抽出してもよい。そして、抽出部132は、時系列的に隣り合うか否かに関わらず、抽出した複数の検索クエリの中から2つの検索クエリを選択して、選択した2つの検索クエリを一対の検索クエリとして抽出してもよい。
(Extractor 132)
The extraction unit 132 extracts various information. Specifically, the extraction unit 132 extracts, from the search queries acquired by the acquisition unit 131, a plurality of search queries input by the same user within a predetermined time. For example, the extraction unit 132 extracts a plurality of search queries in which an interval of time in which each search query is input by the same user is within a predetermined time. Subsequently, the extraction unit 132 extracts a pair of search queries continuously input within a predetermined time by the same user among a plurality of search queries input within the predetermined time by the same user. For example, the extraction unit 132 extracts a plurality of search queries in which an interval of time in which each search query pair is input by the same user is within a predetermined time. For example, the extraction unit 132 includes, among the search queries acquired by the acquisition unit 131, a search query Q11 (“Roppongi Pasta”) that is four search queries that are continuously input by the same user U1 within a predetermined time. ), Search query Q12 ("Roppongi Italian"), search query Q13 ("Akasaka pasta"), search query Q14 ("Azabu pasta") are extracted. When arranged in the order in which the search queries are input, the extraction unit 132 extracts four search queries input in the order of the search query Q11, the search query Q12, the search query Q13, and the search query Q14. Subsequently, when the extraction unit 132 extracts four search queries, it is a pair of three pairs of search queries with two search queries adjacent in time series as a pair of search queries (search query Q11, search query Q12), (search query Q12, search query Q13), and (search query Q13, search query Q14) are extracted. Note that the extraction unit 132 may extract a plurality of search queries in which all search queries are input by the same user within a predetermined time. Then, the extraction unit 132 selects two search queries from the plurality of extracted search queries regardless of whether they are temporally adjacent to each other, and sets the selected two search queries as a pair of search queries. You may extract.

また、抽出部132は、取得部131によって取得された検索クエリのうち、所定の検索クエリと所定の検索クエリに無関係な他の検索クエリとを抽出する。例えば、抽出部132は、取得部131によって取得された検索クエリの中から、所定の検索クエリを抽出する。続いて、抽出部132は、取得部131によって取得された検索クエリの中から、所定の検索クエリとは無関係にランダムに他の検索クエリを抽出する。   The extraction unit 132 also extracts a predetermined search query and other search queries unrelated to the predetermined search query from the search queries acquired by the acquisition unit 131. For example, the extraction unit 132 extracts a predetermined search query from among the search queries acquired by the acquisition unit 131. Subsequently, the extraction unit 132 randomly extracts another search query from the search queries acquired by the acquisition unit 131 regardless of a predetermined search query.

(生成部133)
生成部133は、種々の情報を生成する。生成部133は、第1学習モデルを生成する。具体的には、生成部133は、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして、同一のユーザによって所定の時間内に入力された複数の検索クエリが有する特徴を学習させた第1学習モデルを生成する。より具体的には、生成部133は、取得部131によって取得された検索クエリのうち、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして学習することで、所定の検索クエリから所定の検索クエリの特徴情報を予測する第1学習モデルを生成する。
(Generator 133)
The generation unit 133 generates various information. The generation unit 133 generates a first learning model. Specifically, the generation unit 133 assumes that the plurality of search queries input by the same user within a predetermined time have similar characteristics, and the plurality of searches input by the same user within the predetermined time. A first learning model is generated in which the features of the query are learned. More specifically, the generation unit 133 learns that among the search queries acquired by the acquisition unit 131, a plurality of search queries input by the same user within a predetermined time have similar characteristics. The first learning model that predicts the feature information of the predetermined search query from the predetermined search query is generated.

生成部133は、同一のユーザによって所定の時間内に入力された複数の検索クエリの分散表現が類似するように学習モデルを学習させることで、所定の検索クエリから所定の検索クエリの特徴情報を予測する第1モデルを生成する。具体的には、生成部133は、所定の時間内に続けて入力された一対の検索クエリの分散表現が類似するように学習することで、第1学習モデルを生成する。より具体的には、生成部133は、RNNの一種であるLSTMを分散表現生成に用いたDSSMの技術を用いて、検索クエリから分散表現(ベクトル)を出力する第1学習モデルを生成する。例えば、生成部133は、第1学習モデルの正解データとして、同一のユーザによって所定の時間内に入力された一対の検索クエリが類似する特徴を有するものとして、所定の検索クエリの分散表現(ベクトル)と、所定の検索クエリと対となる他の検索クエリの分散表現(ベクトル)とが、分散表現空間上で近くに存在するように学習する。   The generation unit 133 learns the learning model so that distributed expressions of a plurality of search queries input within a predetermined time by the same user are similar, thereby obtaining feature information of the predetermined search query from the predetermined search query. Generate a first model to predict. Specifically, the generation unit 133 generates a first learning model by learning so that the distributed expressions of a pair of search queries input in succession within a predetermined time are similar. More specifically, the generation unit 133 generates a first learning model that outputs a distributed representation (vector) from the search query, using a DSSM technique using LSTM, which is a type of RNN, for distributed representation generation. For example, the generation unit 133 assumes that the pair of search queries input by the same user within a predetermined time as the correct answer data of the first learning model has similar characteristics, and a distributed expression (vector) of the predetermined search query ) And distributed expressions (vectors) of other search queries that are paired with a predetermined search query are learned so that they exist close together in the distributed expression space.

〔第1学習モデルの一例〕
ここで、図9を用いて情報処理装置100が生成する第1学習モデルの一例について説明する。図9は、実施形態に係る第1学習モデルの一例を示す図である。図9に示す例では、情報処理装置100が生成する第1学習モデルM1は、3層のLSTM RNNで構成されている。図9に示す例では、抽出部132は、同一のユーザU1によって所定の時間内に連続して入力された「六本木 パスタ」という検索クエリQ11と「六本木 イタリアン」という検索クエリQ12とから成る一対の検索クエリを抽出する。生成部133は、抽出部132によって抽出されたた検索クエリQ11を第1学習モデルM1の入力層に入力する(ステップS31)。
[Example of first learning model]
Here, an example of the first learning model generated by the information processing apparatus 100 will be described with reference to FIG. FIG. 9 is a diagram illustrating an example of the first learning model according to the embodiment. In the example illustrated in FIG. 9, the first learning model M1 generated by the information processing apparatus 100 is configured by three layers of LSTM RNN. In the example shown in FIG. 9, the extraction unit 132 is a pair of a search query Q11 "Roppongi Pasta" and a search query Q12 "Roppongi Italian", which are continuously input within a predetermined time by the same user U1. Extract the search query. The generation unit 133 inputs the search query Q11 extracted by the extraction unit 132 into the input layer of the first learning model M1 (step S31).

続いて、生成部133は、第1学習モデルM1の出力層から検索クエリQ11の分散表現である256次元のベクトルBQV11を出力する。また、生成部133は、抽出部132によって抽出された検索クエリQ12を第1学習モデルM1の入力層に入力する。続いて、生成部133は、第1学習モデルM1の出力層から検索クエリQ12の分散表現である256次元のベクトルBQV12を出力する(ステップS32)。   Subsequently, the generation unit 133 outputs a 256-dimensional vector BQV11, which is a distributed representation of the search query Q11, from the output layer of the first learning model M1. Further, the generation unit 133 inputs the search query Q12 extracted by the extraction unit 132 to the input layer of the first learning model M1. Subsequently, the generation unit 133 outputs a 256-dimensional vector BQV12 that is a distributed representation of the search query Q12 from the output layer of the first learning model M1 (step S32).

続いて、生成部133は、連続して入力された2つの検索クエリの分散表現(ベクトル)が類似するように学習することで、検索クエリから分散表現(ベクトル)を出力する第1学習モデルM1を生成する(ステップS33)。例えば、第1学習モデルM1にフィードバックをかける前(学習前)の検索クエリQ11の分散表現であるベクトルBQV11と検索クエリQ12の分散表現であるベクトルBQV12とのなす角度の大きさをΘとする。また、第1学習モデルM1にフィードバックをかけた後(学習後)の検索クエリQ11の分散表現であるベクトルQV11と検索クエリQ12の分散表現であるベクトルQV12とのなす角度の大きさをΦとする。この時、生成部133は、ΘよりもΦが小さくなるように、第1学習モデルM1を学習させる。すなわち、生成部133は、ベクトルBQV11とベクトルBQV12のコサイン類似度の値よりも、ベクトルQV11とベクトルQV12のコサイン類似度の値が大きくなるように(値が1に近づくように)第1学習モデルM1を学習させる。このように、生成部133は、一対の検索クエリに対応する一対の分散表現である2つのベクトルが分散表現空間上で類似するように第1学習モデルM1を学習させることで、検索クエリから分散表現(ベクトル)を出力する第1学習モデルM1を生成する。   Subsequently, the generation unit 133 learns so that the distributed expressions (vectors) of two search queries input in succession are similar to each other, whereby the first learning model M1 that outputs the distributed expressions (vectors) from the search query. Are generated (step S33). For example, let 大 き be a size of an angle formed by the vector BQV11 which is a dispersed expression of the search query Q11 before feedback (before learning) to the first learning model M1 and the vector BQV12 which is a distributed expression of the search query Q12. Also, let Φ be the magnitude of the angle between vector QV11, which is a distributed representation of search query Q11 after feedback to first learning model M1 (after learning), and vector QV12, which is a distributed representation of search query Q12. . At this time, the generation unit 133 causes the first learning model M1 to be learned so that Φ is smaller than Θ. That is, the generation unit 133 sets the first learning model such that the value of cosine similarity between vector QV11 and vector QV12 is larger than the value of cosine similarity between vector BQV11 and vector BQV12 (so that the value approaches 1). Make M1 learn. As described above, the generation unit 133 distributes from the search query by causing the first learning model M1 to learn so that two vectors that are a pair of distributed expressions corresponding to the pair of search queries are similar in the distributed expression space. A first learning model M1 that outputs an expression (vector) is generated.

また、生成部133は、同一のユーザによって所定の時間内に入力された複数の検索クエリとして、所定の区切り文字で区切られた文字列を含む複数の検索クエリが類似する特徴を有するものとして学習することで、第1学習モデルを生成する。例えば、生成部133は、地名を示す「六本木」と食品の種類を示す「パスタ」の文字とが区切り文字であるスペースで区切られた検索クエリ「六本木 パスタ」と、地名を示す「六本木」と料理の種類を示す「イタリアン」の文字とが区切り文字であるスペースで区切られた検索クエリ「六本木 イタリアン」とが類似する特徴を有するものとして学習することで、第1学習モデルを生成する。   In addition, the generation unit 133 learns that a plurality of search queries including character strings separated by predetermined delimiters have similar characteristics as a plurality of search queries input within a predetermined time by the same user. By doing so, a first learning model is generated. For example, the generation unit 133 may use a search query "Roppongi pasta" divided by a space where the characters "Roppongi" indicating a place name and "pasta" indicating a food type are delimiters, and "Roppongi" indicating a place name. The first learning model is generated by learning that the search query "Roppongi Italian" separated by a space, which is the character of "Italian" indicating the type of food, is a similar character.

また、生成部133は、取得部131によって取得された検索クエリのうち、ランダムに抽出された複数の検索クエリが相違する特徴を有するものとして学習することで、第1学習モデルを生成する。具体的には、生成部133は、取得部131によって取得された検索クエリのうち、ランダムに抽出された一対の検索クエリの分散表現が相違するように学習することで、第1学習モデルを生成する。例えば、生成部133は、抽出部132によって抽出された所定の検索クエリの分散表現と、所定の検索クエリとは無関係にランダムに抽出された検索クエリの分散表現とが分散表現空間上で遠くにマッピングされるように第1学習モデルM1のトレーニングを行う。   Moreover, the production | generation part 133 produces | generates a 1st learning model by learning as what has the characteristic from which the some search query extracted at random among the search queries acquired by the acquisition part 131 differs. Specifically, the generation unit 133 generates the first learning model by learning that the distributed expressions of the pair of search queries extracted at random among the search queries acquired by the acquisition unit 131 are different. Do. For example, the generating unit 133 may be configured such that the distributed expression of the predetermined search query extracted by the extracting unit 132 and the distributed expression of the search query extracted at random regardless of the predetermined search query are far apart in the distributed expression space The first learning model M1 is trained so as to be mapped.

また、生成部133は、第2学習モデルを生成する。生成部133は、取得部131によって取得された第1学習モデルを用いて、所定の検索クエリから所定の検索クエリが属するカテゴリを予測する第2学習モデルを生成する。より具体的には、生成部133は、第1学習モデルを生成すると、生成した第1学習モデル(第1学習モデルM1のモデルデータMDT1)を取得する。生成部133は、第1モデルM1を取得すると、取得した第1モデルM1を用いて、第2学習モデルM2を生成する。生成部133は、第1モデルM1を再学習させることにより、第1モデルM1とは学習モデルの重みである接続係数が異なる第2モデルM2を生成する。具体的には、生成部133は、検索クエリが学習モデルに入力された際に、学習モデルが出力する分散表現の分類結果が、検索クエリが属するカテゴリに対応するように学習することで、所定の検索クエリから所定の検索クエリが属するカテゴリを予測する第2モデルM2を生成する。   In addition, the generation unit 133 generates a second learning model. The generation unit 133 uses the first learning model acquired by the acquisition unit 131 to generate a second learning model that predicts a category to which a predetermined search query belongs from a predetermined search query. More specifically, when generating the first learning model, the generation unit 133 acquires the generated first learning model (the model data MDT1 of the first learning model M1). When the generation unit 133 acquires the first model M1, the generation unit 133 generates a second learning model M2 using the acquired first model M1. The generation unit 133 re-learns the first model M1, thereby generating a second model M2 having a connection coefficient that is a weight of the learning model different from that of the first model M1. Specifically, when the search query is input to the learning model, the generation unit 133 performs learning so that the classification result of the distributed expression output from the learning model corresponds to the category to which the search query belongs. A second model M2 is generated which predicts a category to which a predetermined search query belongs from the search query of.

具体的には、生成部133は、検索クエリが学習モデルに入力された際に、学習モデルが出力する分散表現の分類結果が、検索クエリが属するカテゴリに対応するように学習することで、所定の検索クエリから所定の検索クエリが属するカテゴリを予測する第2学習モデルを生成する。生成部133は、入力情報として検索クエリが学習モデルに入力された際に、出力情報として検索クエリが属するカテゴリ毎の確率を出力する第2学習モデルを生成する。例えば、生成部133は、第1モデルM1を用いて、入力情報として所定の検索クエリが学習モデルに入力された際に、出力情報として検索クエリの分散表現がそのカテゴリに分類される確率をカテゴリ毎に出力する第2モデルM2を生成する。生成部133は、入力情報として所定の検索クエリが入力されると、出力情報として所定の検索クエリの分散表現が正解カテゴリに分類される確率が所定の閾値を超えるように第2モデルを学習させる。そして、生成部133は、入力情報として所定の検索クエリが入力された際に、所定の検索クエリの分散表現がそのカテゴリに属する確率が所定の閾値を超えるカテゴリを、所定の検索クエリのカテゴリとして出力する第2モデルM2を生成する。   Specifically, when the search query is input to the learning model, the generation unit 133 performs learning so that the classification result of the distributed expression output from the learning model corresponds to the category to which the search query belongs. Generating a second learning model that predicts a category to which a predetermined search query belongs from the search query of When the search query is input to the learning model as input information, the generation unit 133 generates a second learning model that outputs a probability for each category to which the search query belongs as output information. For example, the generation unit 133 uses the first model M1 to calculate the probability that the distributed expression of the search query is classified into the category as output information when a predetermined search query is input as input information to the learning model. A second model M2 that is output every time is generated. When a predetermined search query is input as input information, the generation unit 133 causes the second model to be learned such that the probability that the distributed expression of the predetermined search query is classified into the correct category as output information exceeds a predetermined threshold. . Then, when a predetermined search query is input as input information, the generation unit 133 sets, as a category of the predetermined search query, a category in which the probability that the distributed expression of the predetermined search query belongs to the category exceeds a predetermined threshold. A second model M2 to be output is generated.

例えば、生成部133は、図8に示すモデル情報記憶部125を参照して、第1モデルM1(第1モデルM1のモデルデータMDT1)を取得する。続いて、生成部133は、図6に示す分類定義記憶部123を参照して、検索クエリを分類するカテゴリの大分類を選択する。続いて、生成部133は、大分類を選択すると、第2モデルM2の学習データとして、検索クエリと検索クエリが属する小分類との組を学習する。   For example, the generation unit 133 refers to the model information storage unit 125 illustrated in FIG. 8 to acquire a first model M1 (model data MDT1 of the first model M1). Subsequently, the generation unit 133 refers to the classification definition storage unit 123 illustrated in FIG. 6 and selects a large classification of categories for classifying the search query. Subsequently, when the large classification is selected, the generation unit 133 learns a set of a search query and a small classification to which the search query belongs as learning data of the second model M2.

例えば、検索クエリQ11(「六本木 パスタ」)が属する正解カテゴリがCAT11(「飲食店を探す」)であるとする。生成部133は、入力情報として検索クエリQ11(「六本木 パスタ」)が第2モデルM2に入力された際に、第2モデルM2の出力層から検索クエリQ11(「六本木 パスタ」)の分散表現であるベクトルBQV11を出力する。ここで、ベクトルBQV11は、第2モデルM2の出力層から出力されたばかりの検索クエリQ11の分散表現であって、第2モデルM2にフィードバックをかける前(学習前)の分散表現を示す。この場合、生成部133は、出力された検索クエリQ11(「六本木 パスタ」)の分散表現であるベクトルBQV11が正解カテゴリCAT11(「飲食店を探す」)に分類される確率が所定の閾値を超えるように第2モデルM2を学習させる。   For example, it is assumed that the correct answer category to which the search query Q11 ("Roppongi pasta") belongs is CAT 11 ("search for a restaurant"). When the search query Q11 ("Roppongi pasta") is input to the second model M2 as input information, the generation unit 133 uses the distributed representation of the search query Q11 ("Roppongi pasta") from the output layer of the second model M2 A certain vector BQV11 is output. Here, the vector BQV11 is a distributed representation of the search query Q11 that has just been output from the output layer of the second model M2, and indicates the distributed representation before applying feedback to the second model M2 (before learning). In this case, the generation unit 133 determines that the probability that the vector BQV11, which is a distributed expression of the output search query Q11 ("Roppongi pasta"), is classified into the correct category CAT11 ("search for a restaurant") exceeds a predetermined threshold. Thus, the second model M2 is learned.

例えば、生成部133は、学習前の第2モデルM2に検索クエリQ11(「六本木 パスタ」)が入力された際に、分散表現であるベクトルBQV11がCAT11(「飲食店を探す」)に分類される確率を80%、CAT12(「商品を探す」)に分類される確率を0%、CAT13(「飲食店を予約」)に分類される確率を20%、CAT14(「商品を購入する」)に分類される確率を0%と出力したとする。この場合、生成部133は、分散表現であるベクトルBQV11がCAT11(「飲食店を探す」)に分類される確率を所定の閾値(例えば、90%)を超えるように第2モデルM2を学習させる。また、生成部133は、分散表現であるベクトルBQV11がCAT11(「飲食店を探す」)に分類される確率が所定の閾値(例えば、90%)を超えるように学習させるのに合わせて、分散表現であるベクトルBQV11が他のカテゴリCAT13(「飲食店を予約」)に分類される確率を10%に下げるように第2モデルM2を学習させる。続いて、生成部133は、学習済みの第2モデルM2に入力情報として検索クエリQ11(「六本木 パスタ」)が入力されると、検索クエリQ11(「六本木 パスタ」)の分散表現であるベクトルBQV11がカテゴリCAT11(「飲食店を探す」)に属する確率が90%を超えるので、出力情報として検索クエリが属するカテゴリをCAT11(「飲食店を探す」)と出力する。   For example, when the search query Q11 ("Roppongi pasta") is input to the second model M2 before learning, the generation unit 133 classifies the vector BQV11, which is a distributed expression, into CAT 11 ("search for a restaurant"). The probability of being classified as 80%, the probability of being classified as CAT 12 ("Find a product") as 0%, the probability of being classified as CAT 13 ("Reserve a Restaurant") as 20%, CAT 14 ("Buy a Product") It is assumed that the probability of being classified as 0 is output as 0%. In this case, the generation unit 133 causes the second model M2 to be learned such that the probability that the vector BQV11, which is a distributed expression, is classified into the CAT 11 (“search for a restaurant”) exceeds a predetermined threshold (for example, 90%). . In addition, the generation unit 133 performs dispersion in accordance with learning so that the probability that the vector BQV11, which is a distributed expression, is classified into the CAT 11 (“search for a restaurant”) exceeds a predetermined threshold (for example, 90%). The second model M2 is trained so that the probability that the vector BQV11 as an expression is classified into another category CAT13 (“Reserve restaurant”) is reduced to 10%. Subsequently, when search query Q11 ("Roppongi pasta") is input as input information to second model M2 that has been learned, generation unit 133 generates vector BQV11 that is a distributed expression of search query Q11 ("Roppongi pasta"). Since the probability of belonging to the category CAT11 ("search for a restaurant") exceeds 90%, the category to which the search query belongs is output as CAT11 ("search for a restaurant") as output information.

なお、生成部133は、大分類として、任意の数の大分類を選択してもよい。そして、生成部133は、入力情報として検索クエリが第2モデルM2に入力された際に、出力情報として検索クエリが選択した任意の数の大分類に属する各小分類に属する確率を小分類毎に出力する第2モデルM2を生成してもよい。また、生成部133は、大分類として、全ての大分類を選択してもよい。そして、生成部133は、検索クエリが第2モデルM2に入力された際に、各小分類に属する確率を全ての小分類毎に出力する第2モデルM2を生成してもよい。   The generation unit 133 may select an arbitrary number of large classifications as the large classifications. Then, when a search query is input to the second model M2 as input information, the generation unit 133 sets the probability of belonging to each small category belonging to an arbitrary number of large categories selected by the search query as output information for each small category. The second model M2 to be output to may be generated. In addition, the generation unit 133 may select all of the large classifications as the large classifications. And the production | generation part 133 may produce | generate the 2nd model M2 which outputs the probability which belongs to each small classification for every small classification, when a search query is input into the 2nd model M2.

〔第2学習モデルの一例〕
ここで、図10を用いて情報処理装置100が生成する第2学習モデルの一例について説明する。図10は、実施形態に係る第2学習モデルの一例を示す図である。図10に示す例では、情報処理装置100が生成する第2学習モデルM2は、第1学習モデルM1を用いて生成される。すなわち、情報処理装置100は、第1学習モデルM1を再学習させることにより、第1学習モデルM1とは学習モデルの重みである接続係数が異なる第2学習モデルM2を生成する。
[Example of second learning model]
Here, an example of the second learning model generated by the information processing apparatus 100 will be described with reference to FIG. FIG. 10 is a diagram illustrating an example of the second learning model according to the embodiment. In the example illustrated in FIG. 10, the second learning model M2 generated by the information processing apparatus 100 is generated using the first learning model M1. That is, the information processing apparatus 100 generates the second learning model M2 having a different connection coefficient, which is a weight of the learning model, from the first learning model M1 by causing the first learning model M1 to re-learn.

より具体的には、情報処理装置100が生成する第2学習モデルM2は、第1学習モデルM1と同様に、3層のLSTM RNNで構成されている。図10に示す例では、抽出部132は、ユーザU1によって入力された「六本木 パスタ」という検索クエリQ11を第2学習モデルM2の入力層に入力する(ステップS41)。   More specifically, the second learning model M2 generated by the information processing apparatus 100 is composed of three layers of LSTM RNNs, like the first learning model M1. In the example illustrated in FIG. 10, the extraction unit 132 inputs the search query Q11 “Roppongi pasta” input by the user U1 to the input layer of the second learning model M2 (step S41).

続いて、生成部133は、第2学習モデルM2の出力層から検索クエリQ11の分散表現である256次元のベクトルBQV11を出力する(ステップS42)。   Subsequently, the generation unit 133 outputs a 256-dimensional vector BQV11 that is a distributed representation of the search query Q11 from the output layer of the second learning model M2 (step S42).

続いて、生成部133は、検索クエリQ11の分散表現であるベクトルBQV11が各カテゴリに分類される確率を出力する(ステップS43)。   Subsequently, the generation unit 133 outputs the probability that the vector BQV11, which is a distributed expression of the search query Q11, is classified into each category (step S43).

続いて、生成部133は、検索クエリQ11の分散表現であるベクトルBQV11が正解カテゴリに分類される確率を高くするように第2学習モデルM2を学習することで、検索クエリから検索クエリのカテゴリを予測する第2モデルを生成する(ステップS44)。   Subsequently, the generation unit 133 learns the second learning model M2 so as to increase the probability that the vector BQV11, which is a distributed expression of the search query Q11, is classified into the correct answer category, and thereby the search query category from the search query. A second model to be predicted is generated (step S44).

〔3.第1学習モデルの生成処理のフロー〕
次に、図11を用いて、実施形態に係る第1学習モデルの生成処理の手順について説明する。図11は、実施形態に係る第1学習モデルの生成処理手順を示すフローチャートである。図11に示す例では、情報処理装置100は、ユーザによって入力された検索クエリを取得する(ステップS101)。
[3. Flow of Generation Process of First Learning Model]
Next, the procedure of the first learning model generation process according to the embodiment will be described with reference to FIG. FIG. 11 is a flowchart illustrating a first learning model generation processing procedure according to the embodiment. In the example illustrated in FIG. 11, the information processing apparatus 100 acquires a search query input by a user (Step S <b> 101).

続いて、情報処理装置100は、同一のユーザによって所定の時間内に入力された複数の検索クエリを抽出する(ステップS102)。   Subsequently, the information processing apparatus 100 extracts a plurality of search queries input by the same user within a predetermined time (step S102).

続いて、情報処理装置100は、抽出した複数の検索クエリが類似する特徴を有するものとして学習することで、所定の検索クエリから所定の検索クエリの特徴情報を予測する第1学習モデルを生成する(ステップS103)。   Subsequently, the information processing apparatus 100 generates a first learning model that predicts feature information of a predetermined search query from the predetermined search query by learning that the extracted search queries have similar characteristics. (Step S103).

〔4.情報処理のフロー〕
次に、図12を用いて、実施形態に係る情報処理の手順について説明する。図12は、実施形態に係る情報処理手順を示すフローチャートである。図12に示す例では、情報処理装置100は、第1学習モデル(第1学習モデルM1のモデルデータMDT1)を取得する(ステップS201)。
[4. Flow of information processing]
Next, the procedure of the information processing according to the embodiment will be described with reference to FIG. FIG. 12 is a flowchart showing an information processing procedure according to the embodiment. In the example shown in FIG. 12, the information processing apparatus 100 acquires a first learning model (model data MDT1 of the first learning model M1) (step S201).

続いて、情報処理装置100は、第1学習モデルを用いて、所定の検索クエリから所定の検索クエリのカテゴリを予測する第2学習モデルを生成する(ステップS202)。   Subsequently, the information processing apparatus 100 uses the first learning model to generate a second learning model that predicts a category of the predetermined search query from the predetermined search query (step S202).

〔5.効果〕
上述してきたように、実施形態に係る情報処理装置100は、取得部131と生成部133を備える。取得部131は、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして、複数の検索クエリが有する特徴を学習した第1学習モデルを取得する。生成部133は、取得部131によって取得された第1学習モデルを用いて、所定の検索クエリから所定の検索クエリが属するカテゴリを予測する第2学習モデルを生成する。
[5. effect〕
As described above, the information processing apparatus 100 according to the embodiment includes the acquisition unit 131 and the generation unit 133. The acquiring unit 131 acquires a first learning model in which the features included in the plurality of search queries are learned, assuming that the plurality of search queries input by the same user within a predetermined time have similar features. The generation unit 133 uses the first learning model acquired by the acquisition unit 131 to generate a second learning model for predicting the category to which the predetermined search query belongs from the predetermined search query.

一般的に、ユーザはある意図を持って検索を複数回行うと考えられるため、所定の時間内に連続して入力された検索クエリは、検索意図が近いという仮定が成り立つ。そこで、本願発明に係る情報処理装置100は、所定の時間内に連続して入力された複数の検索クエリは、所定の検索意図の下で検索された検索クエリであるという点で、相互に類似する特徴を有する検索クエリであるとみなして第1モデルM1を学習させる。これにより、情報処理装置100は、検索意図を考慮した検索クエリの特徴を第1モデルM1に学習させることができる。そして、情報処理装置100は、検索意図を考慮した検索クエリの特徴を学習した第1モデルM1を活用して、所定の検索クエリから所定の検索クエリのカテゴリを予測する第2モデルを効率的に生成することができる。これにより、情報処理装置100は、検索クエリを入力したユーザの検索意図を考慮したカテゴリに検索クエリを分類することを可能にする。また、従来、検索クエリをカテゴリに分類し、高い分類精度を得るためには、十分な量の正解データを用意することが必要であった。しかしながら、検索クエリ自体、多種多様であり、ロングテイルな性質を持つものであるため、多数の検索クエリに対応する正解カテゴリをラベル付けするのは、非常に手間がかかり困難である。ここで、情報処理装置100は、検索意図を考慮した検索クエリの特徴を学習させた第1モデルを出発点として第2モデルを学習させることにより、正解カテゴリをラベル付けする代わりに、ユーザの検索意図(検索クエリを入力したユーザのコンテクスト)を一種の正解として、検索クエリのカテゴリを予測する第2モデルを学習させることができる。これにより、情報処理装置100は、人手で検索クエリの正解カテゴリをラベル付けすることなく、第2モデルを学習させることができる。すなわち、情報処理装置100は、正解データが少ないときでも、十分な分類精度を得られるようになる。また、情報処理装置100は、正解データが多いときであれば、さらに高い分類精度を得られるようになる。したがって、情報処理装置100は、検索クエリの分類精度を高めることができる。   In general, since a user is considered to search several times with a certain intention, it is assumed that search queries sequentially input within a predetermined time have a similar search intention. Therefore, the information processing apparatus 100 according to the present invention is similar to each other in that a plurality of search queries continuously input within a predetermined time are search queries searched under a predetermined search intention. The first model M1 is trained by regarding it as a search query having the following features. Thereby, the information processing apparatus 100 can cause the first model M1 to learn the characteristics of the search query considering the search intention. Then, the information processing apparatus 100 efficiently uses the first model M1 learned the features of the search query in consideration of the search intention to efficiently estimate the second model for predicting the category of the predetermined search query from the predetermined search query. Can be generated. As a result, the information processing apparatus 100 can classify the search query into a category in consideration of the search intention of the user who has input the search query. Conventionally, it has been necessary to prepare a sufficient amount of correct answer data in order to classify search queries into categories and obtain high classification accuracy. However, since the search queries themselves are various and have long-tailed nature, it is very time-consuming and difficult to label the correct answer categories corresponding to a large number of search queries. Here, the information processing apparatus 100 searches for the user instead of labeling the correct answer category by learning the second model by using the first model learned the features of the search query considering the search intention as the departure point. The second model for predicting the category of the search query can be learned using the intention (the context of the user who has input the search query) as a kind of correct answer. Thereby, the information processing apparatus 100 can learn the second model without manually labeling the correct answer category of the search query. That is, even when the correct data is small, the information processing apparatus 100 can obtain sufficient classification accuracy. In addition, the information processing apparatus 100 can obtain higher classification accuracy if the number of correct data is large. Therefore, the information processing apparatus 100 can improve the classification accuracy of the search query.

また、取得部131は、入力情報として所定の検索クエリが入力された際に、出力情報として所定の検索クエリの分散表現を出力する第1学習モデルを取得する。   In addition, when a predetermined search query is input as input information, the acquisition unit 131 acquires a first learning model that outputs a distributed expression of the predetermined search query as output information.

これにより、情報処理装置100は、所定の検索クエリの特徴という抽象的な概念を、分散表現という具体的な数値によって測定可能とすることができる。   As a result, the information processing apparatus 100 can measure the abstract concept of the characteristics of a predetermined search query using specific numerical values called distributed expressions.

また、取得部131は、所定の時間内に続けて入力された一対の検索クエリの分散表現が類似するように学習することで、複数の検索クエリが有する特徴を学習した第1学習モデルを取得する。   In addition, the acquisition unit 131 acquires a first learning model in which features of a plurality of search queries are learned by learning so that the distributed expressions of a pair of search queries input in succession within a predetermined time are similar. Do.

一般的に、同一のユーザが短時間に続けて入力した2つの検索クエリは、検索意図が同一であるか、同一でなくとも検索意図が近いと考えられる。すなわち、所定の時間内に続けて入力された一対の検索クエリは、検索意図が同一であるか、同一でなくとも検索意図が近いと考えられる。すなわち、情報処理装置100は、所定の時間内に続けて入力された一対の検索クエリの分散表現が類似するように学習させることにより、第1モデルの学習精度を向上させることができる。   In general, two search queries input by the same user in a short time are considered to have the same search intention or close search intention even if they are not the same. That is, it is considered that the search intentions of a pair of search queries that are continuously input within a predetermined time period have the same search intention or the search intentions that are not the same. That is, the information processing apparatus 100 can improve the learning accuracy of the first model by learning so that the distributed expressions of a pair of search queries subsequently inputted within a predetermined time are similar.

また、取得部131は、同一のユーザによって所定の時間内に入力された複数の検索クエリとして、所定の区切り文字で区切られた文字列を含む複数の検索クエリが類似する特徴を有するものとして学習することで、複数の検索クエリが有する特徴を学習した第1学習モデルを取得する。   In addition, the acquiring unit 131 learns that a plurality of search queries including character strings separated by predetermined delimiters have similar characteristics as a plurality of search queries input within a predetermined time by the same user. By doing this, the first learning model is obtained which has learned the features of the plurality of search queries.

一般的に、単体の文字列からなる検索クエリよりも、複数の文字列を含む検索クエリのほうが、検索意図がより明確であると考えられる。すなわち、情報処理装置100は、所定の区切り文字で区切られた文字列を含む検索クエリを用いて学習させることにより、第1モデルの学習精度を向上させることができる。   In general, a search query including a plurality of strings is considered to have a clearer search intention than a search query consisting of a single string. That is, the information processing apparatus 100 can improve the learning accuracy of the first model by learning using a search query including a character string divided by a predetermined delimiter.

また、取得部131は、ランダムに抽出された複数の検索クエリが相違する特徴を有するものとして学習することで、複数の検索クエリが有する特徴を学習した第1学習モデルを取得する。また、取得部131は、ランダムに抽出された一対の検索クエリの分散表現が相違するように学習することで、複数の検索クエリが有する特徴を学習した第1学習モデルを取得する。   Further, the acquiring unit 131 acquires the first learning model in which the features included in the plurality of search queries are learned, by learning that the plurality of randomly extracted search queries have different features. In addition, the acquiring unit 131 acquires a first learning model in which features of a plurality of search queries are learned by learning so that the distributed expressions of a pair of search queries extracted at random are different.

一般的に、ランダムに抽出された複数の検索クエリは、互いに無関係に入力された検索クエリであるため、検索意図が異なるか、検索意図が遠いと考えられる。そこで、本願発明に係る情報処理装置100は、ランダムに抽出された複数の検索クエリは、異なる検索意図の下で検索された検索クエリであるという点で、相互に相違する特徴を有する検索クエリであるとみなして学習モデルM1を学習させる。これにより、学習モデルは、検索意図が近い検索クエリのペアである正解データに加えて、検索意図が遠い検索クエリのペアである不正解データを学習することができる。すなわち、情報処理装置100は、第1モデルの学習精度を向上させることができる。   Generally, a plurality of search queries extracted at random are search queries that are input independently of each other, and therefore, the search intention is different or the search intention is considered to be far away. Therefore, the information processing apparatus 100 according to the present invention is a search query having characteristics that are different from each other in that the plurality of search queries extracted at random are search queries that are searched under different search intentions. The learning model M1 is learned by assuming that there is. Thus, the learning model can learn incorrect answer data, which is a pair of search queries far from the search intention, in addition to correct data that is a pair of search queries close to the search intention. That is, the information processing apparatus 100 can improve the learning accuracy of the first model.

また、生成部133は、検索クエリが学習モデルに入力された際に、学習モデルが出力する分散表現の分類結果が、検索クエリが属するカテゴリに対応するように学習することで、所定の検索クエリから所定の検索クエリが属するカテゴリを予測する第2学習モデルを生成する。また、生成部133は、入力情報として検索クエリが学習モデルに入力された際に、出力情報として検索クエリが属するカテゴリ毎の確率を出力する第2学習モデルを生成する。   In addition, when the search query is input to the learning model, the generation unit 133 learns the classification result of the distributed expression output from the learning model so as to correspond to the category to which the search query belongs, so that the predetermined search query A second learning model for predicting a category to which a predetermined search query belongs is generated. In addition, when a search query is input to the learning model as input information, the generation unit 133 generates a second learning model that outputs a probability for each category to which the search query belongs as output information.

これにより、情報処理装置100は、検索意図を考慮した検索クエリの特徴を含む分散表現を活用して、検索クエリを入力したユーザの検索意図を考慮したカテゴリに検索クエリを分類する第2学習モデルを効率的に生成することができる。すなわち、情報処理装置100は、検索クエリを入力したユーザの検索意図を考慮したカテゴリに検索クエリを分類することを可能にする。したがって、情報処理装置100は、検索クエリの分類精度を高めることができる。   Thereby, the information processing apparatus 100 utilizes the distributed expression including the characteristics of the search query considering the search intention, and uses the second learning model to classify the search query into a category considering the search intention of the user who has input the search query. Can be generated efficiently. In other words, the information processing apparatus 100 can classify the search query into a category in consideration of the search intention of the user who has input the search query. Therefore, the information processing apparatus 100 can improve the classification accuracy of the search query.

〔6.ハードウェア構成〕
また、上述してきた実施形態に係る情報処理装置100は、例えば図13に示すような構成のコンピュータ1000によって実現される。図13は、情報処理装置100の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を備える。
[6. Hardware configuration)
Further, the information processing apparatus 100 according to the embodiment described above is realized by a computer 1000 having a configuration as shown in FIG. 13, for example. FIG. 13 is a hardware configuration diagram illustrating an example of a computer that implements the functions of the information processing apparatus 100. The computer 1000 includes a CPU 1100, RAM 1200, ROM 1300, HDD 1400, communication interface (I / F) 1500, input / output interface (I / F) 1600, and media interface (I / F) 1700.

CPU1100は、ROM1300またはHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。   The CPU 1100 operates based on a program stored in the ROM 1300 or the HDD 1400 and controls each unit. The ROM 1300 stores a boot program executed by the CPU 1100 when the computer 1000 starts up, a program depending on the hardware of the computer 1000, and the like.

HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を格納する。通信インターフェイス1500は、所定の通信網を介して他の機器からデータを受信してCPU1100へ送り、CPU1100が生成したデータを所定の通信網を介して他の機器へ送信する。   The HDD 1400 stores a program executed by the CPU 1100, data used by the program, and the like. The communication interface 1500 receives data from another device via a predetermined communication network, sends the data to the CPU 1100, and transmits data generated by the CPU 1100 to the other device via the predetermined communication network.

CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、生成したデータを入出力インターフェイス1600を介して出力装置へ出力する。   The CPU 1100 controls an output device such as a display and a printer and an input device such as a keyboard and a mouse via the input / output interface 1600. The CPU 1100 acquires data from the input device via the input / output interface 1600. In addition, the CPU 1100 outputs the generated data to the output device via the input / output interface 1600.

メディアインターフェイス1700は、記録媒体1800に格納されたプログラムまたはデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。   The media interface 1700 reads a program or data stored in the recording medium 1800 and provides it to the CPU 1100 via the RAM 1200. The CPU 1100 loads such a program from the recording medium 1800 onto the RAM 1200 via the media interface 1700, and executes the loaded program. The recording medium 1800 is, for example, an optical recording medium such as a DVD (Digital Versatile Disc) or PD (Phase change rewritable disk), a magneto-optical recording medium such as an MO (Magneto-Optical disk), a tape medium, a magnetic recording medium, or a semiconductor memory. Etc.

例えば、コンピュータ1000が実施形態に係る情報処理装置100として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムまたはデータ(例えば、第1モデルM1のモデルデータMDT1、第2モデルM2のモデルデータMDT2)を実行することにより、制御部130の機能を実現する。コンピュータ1000のCPU1100は、これらのプログラムを記録媒体1800から読み取って実行するが、他の例として、他の装置から所定の通信網を介してこれらのプログラムまたはデータ(例えば、第1モデルM1のモデルデータMDT1、第2モデルM2のモデルデータMDT2)を取得してもよい。   For example, when the computer 1000 functions as the information processing apparatus 100 according to the embodiment, the CPU 1100 of the computer 1000 loads a program or data loaded on the RAM 1200 (for example, model data MDT1 of the first model M1 and second model M2). The function of the control unit 130 is realized by executing the model data MDT2). The CPU 1100 of the computer 1000 reads these programs from the recording medium 1800 and executes them. As another example, these programs or data (for example, the model of the first model M1) from other devices via a predetermined communication network. Data MDT1 and model data MDT2 of the second model M2 may be acquired.

以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。   As described above, some of the embodiments of the present application have been described in detail with reference to the drawings. However, these are merely examples, and various modifications, including the aspects described in the disclosure section of the invention, based on the knowledge of those skilled in the art, It is possible to implement the present invention in other forms with improvements.

〔7.その他〕
また、上記実施形態及び変形例において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
[7. Others]
In addition, among the processes described in the above-described embodiments and modifications, all or a part of the processes described as being automatically performed can be manually performed, or are described as being performed manually. All or part of the treatment may be performed automatically by known methods. In addition, information including processing procedures, specific names, various data and parameters shown in the above-mentioned documents and drawings can be arbitrarily changed unless otherwise specified. For example, the various information shown in each figure is not limited to the illustrated information.

また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。   Further, each component of each illustrated apparatus is functionally conceptual, and does not necessarily need to be physically configured as illustrated. In other words, the specific form of distribution / integration of each device is not limited to that shown in the figure, and all or a part thereof may be functionally or physically distributed or arbitrarily distributed in arbitrary units according to various loads or usage conditions. It can be integrated and configured.

また、上述してきた実施形態及び変形例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。   In addition, the above-described embodiments and modifications can be combined as appropriate within a range that does not contradict processing contents.

また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、生成部は、生成手段や生成回路に読み替えることができる。   In addition, the "section (module, unit)" described above can be read as "means" or "circuit". For example, the generation unit can be read as a generation unit or a generation circuit.

1 情報処理システム
10 ユーザ端末
50 検索サーバ
100 情報処理装置
121 クエリ情報記憶部
122 ベクトル情報記憶部
123 分類定義記憶部
124 カテゴリ情報記憶部
125 モデル情報記憶部
131 取得部
132 抽出部
133 生成部
DESCRIPTION OF SYMBOLS 1 information processing system 10 user terminal 50 search server 100 information processing apparatus 121 query information storage unit 122 vector information storage unit 123 classification definition storage unit 124 category information storage unit 125 model information storage unit 131 acquisition unit 132 extraction unit 133 generation unit

Claims (17)

同一のユーザによって所定の時間内に入力された一対の検索クエリの分散表現が類似する特徴を有するものとして、複数の検索クエリが有する特徴を学習した第1学習モデルを取得する取得部と、
前記取得部によって取得された第1学習モデルを用いて、所定の検索クエリから前記所定の検索クエリが属するカテゴリを予測する第2学習モデルを生成する生成部と、
を備えることを特徴とする情報処理装置。
An acquisition unit that acquires a first learning model in which features of a plurality of search queries are learned as having distributed features of a pair of search queries input within a predetermined time by the same user.
A generation unit configured to generate a second learning model that predicts a category to which the predetermined search query belongs from a predetermined search query using the first learning model acquired by the acquisition unit;
An information processing apparatus comprising:
同一のユーザによって所定の時間内に入力された複数の検索クエリとして、所定の区切り文字で区切られた文字列を含む複数の検索クエリが類似する特徴を有するものとして学習することで、前記複数の検索クエリが類似する特徴を有するものとして、前記複数の検索クエリが有する特徴を学習した第1学習モデルを取得する取得部と、
前記取得部によって取得された第1学習モデルを用いて、所定の検索クエリから前記所定の検索クエリが属するカテゴリを予測する第2学習モデルを生成する生成部と、
を備えることを特徴とする情報処理装置。
A plurality of search queries including a character string delimited by a predetermined delimiter as a plurality of search queries input within a predetermined time by the same user are learned as having similar characteristics. An acquisition unit that acquires a first learning model that has learned features of the plurality of search queries, as search queries having similar features;
A generation unit configured to generate a second learning model that predicts a category to which the predetermined search query belongs from a predetermined search query using the first learning model acquired by the acquisition unit;
An information processing apparatus comprising:
同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして、前記複数の検索クエリが有する特徴を学習した第1学習モデルを取得する取得部と、
前記取得部によって取得された第1学習モデルを用いて、所定の検索クエリから前記所定の検索クエリが属するカテゴリを予測する第2学習モデルを生成する生成部と、
を備え、
前記取得部は、
ランダムに抽出された複数の検索クエリが相違する特徴を有するものとして学習することで、前記複数の検索クエリが有する特徴を学習した第1学習モデルを取得する
ことを特徴とする情報処理装置。
An acquisition unit configured to acquire a first learning model obtained by learning the features of the plurality of search queries, assuming that the plurality of search queries input by the same user within a predetermined time have similar features;
A generation unit configured to generate a second learning model that predicts a category to which the predetermined search query belongs from a predetermined search query using the first learning model acquired by the acquisition unit;
With
The acquisition unit
An information processing apparatus that acquires a first learning model that learns features of a plurality of search queries by learning that the plurality of randomly extracted search queries have different features .
同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして、前記複数の検索クエリが有する特徴を学習した第1学習モデルを取得する取得部と、
前記取得部によって取得された第1学習モデルを用いて、所定の検索クエリから前記所定の検索クエリが属するカテゴリを予測する第2学習モデルを生成する生成部と、
を備え、
前記取得部は、
ランダムに抽出された一対の検索クエリの分散表現が相違するように学習することで、前記複数の検索クエリが有する特徴を学習した第1学習モデルを取得する
ことを特徴とする情報処理装置。
An acquisition unit configured to acquire a first learning model obtained by learning the features of the plurality of search queries, assuming that the plurality of search queries input by the same user within a predetermined time have similar features;
A generation unit configured to generate a second learning model that predicts a category to which the predetermined search query belongs from a predetermined search query using the first learning model acquired by the acquisition unit;
With
The acquisition unit
An information processing apparatus that acquires a first learning model in which features of the plurality of search queries are learned by learning such that distributed expressions of a pair of randomly extracted search queries are different .
同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして、前記複数の検索クエリが有する特徴を学習した第1学習モデルを取得する取得部と、
前記取得部によって取得された第1学習モデルを用いて、所定の検索クエリから前記所定の検索クエリが属するカテゴリを予測する第2学習モデルを生成する生成部と、
を備え、
前記生成部は、
検索クエリが学習モデルに入力された際に、学習モデルが出力する分散表現の分類結果が、前記検索クエリが属するカテゴリに対応するように学習することで、所定の検索クエリから前記所定の検索クエリが属するカテゴリを予測する第2学習モデルを生成する
ことを特徴とする情報処理装置。
An acquisition unit configured to acquire a first learning model obtained by learning the features of the plurality of search queries, assuming that the plurality of search queries input by the same user within a predetermined time have similar features;
A generation unit configured to generate a second learning model that predicts a category to which the predetermined search query belongs from a predetermined search query using the first learning model acquired by the acquisition unit;
With
The generation unit is
When the search query is input to the learning model, the distributed search classification result output from the learning model is learned so as to correspond to the category to which the search query belongs. An information processing apparatus that generates a second learning model that predicts a category to which the user belongs .
前記取得部は、
入力情報として所定の検索クエリが入力された際に、出力情報として前記所定の検索クエリの分散表現を出力する第1学習モデルを取得する
ことを特徴とする請求項1〜5のいずれか一つに記載の情報処理装置。
The acquisition unit
Claim 1-5, characterized in that the predetermined search query as input information when entered, obtains a first learning model for outputting a distributed representation of the predetermined search query as output information The information processing apparatus according to claim 1.
前記生成部は、
入力情報として検索クエリが学習モデルに入力された際に、出力情報として前記検索クエリが当該カテゴリに属する確率をカテゴリ毎に出力する第2学習モデルを生成する
ことを特徴とする請求項1〜6のいずれか一つに記載の情報処理装置。
The generator is
When a search query as input information is input to the training model, it claims 1-6, wherein the search query and generates a second learning model that outputs the probability belonging to the category in each category as output information The information processing apparatus according to any one of the above.
コンピュータが実行する情報処理方法であって、
同一のユーザによって所定の時間内に入力された一対の検索クエリの分散表現が類似する特徴を有するものとして、複数の検索クエリが有する特徴を学習した第1学習モデルを取得する取得工程と、
前記取得工程によって取得された第1学習モデルを用いて、所定の検索クエリから前記所定の検索クエリが属するカテゴリを予測する第2学習モデルを生成する生成工程と、
を含むことを特徴とする情報処理方法。
An information processing method executed by a computer,
Obtaining a first learning model in which features of a plurality of search queries are learned, assuming that the distributed expressions of a pair of search queries input within a predetermined time by the same user have similar features;
A generation step of generating a second learning model for predicting a category to which the predetermined search query belongs from a predetermined search query using the first learning model acquired by the acquisition step;
An information processing method comprising:
同一のユーザによって所定の時間内に入力された一対の検索クエリの分散表現が類似する特徴を有するものとして、複数の検索クエリが有する特徴を学習した第1学習モデルを取得する取得手順と、
前記取得手順によって取得された第1学習モデルを用いて、所定の検索クエリから前記所定の検索クエリが属するカテゴリを予測する第2学習モデルを生成する生成手順と、
をコンピュータに実行させることを特徴とする情報処理プログラム。
An acquisition procedure for acquiring a first learning model in which features of a plurality of search queries are learned as having distributed features of a pair of search queries input within a predetermined time by the same user,
A generation procedure for generating a second learning model for predicting a category to which the predetermined search query belongs from a predetermined search query using the first learning model acquired by the acquisition procedure;
An information processing program characterized by causing a computer to execute.
コンピュータが実行する情報処理方法であって、
同一のユーザによって所定の時間内に入力された複数の検索クエリとして、所定の区切り文字で区切られた文字列を含む複数の検索クエリが類似する特徴を有するものとして学習することで、前記複数の検索クエリが類似する特徴を有するものとして、前記複数の検索クエリが有する特徴を学習した第1学習モデルを取得する取得工程と、
前記取得工程によって取得された第1学習モデルを用いて、所定の検索クエリから前記所定の検索クエリが属するカテゴリを予測する第2学習モデルを生成する生成工程と、
を含むことを特徴とする情報処理方法。
An information processing method executed by a computer,
As the plurality of search queries input within a predetermined time by the same user, the plurality of search queries including a character string separated by a predetermined delimiter are learned as having similar characteristics. An acquiring step of acquiring a first learning model obtained by learning the features of the plurality of search queries, assuming that the search queries have similar features;
A generation step of generating a second learning model for predicting a category to which the predetermined search query belongs from a predetermined search query using the first learning model acquired by the acquisition step;
An information processing method comprising:
同一のユーザによって所定の時間内に入力された複数の検索クエリとして、所定の区切り文字で区切られた文字列を含む複数の検索クエリが類似する特徴を有するものとして学習することで、前記複数の検索クエリが類似する特徴を有するものとして、前記複数の検索クエリが有する特徴を学習した第1学習モデルを取得する取得手順と、
前記取得手順によって取得された第1学習モデルを用いて、所定の検索クエリから前記所定の検索クエリが属するカテゴリを予測する第2学習モデルを生成する生成手順と、
をコンピュータに実行させることを特徴とする情報処理プログラム。
A plurality of search queries including a character string delimited by a predetermined delimiter as a plurality of search queries input within a predetermined time by the same user are learned as having similar characteristics. An acquisition procedure for acquiring a first learning model that has learned features of the plurality of search queries, as search queries having similar features;
A generation procedure for generating a second learning model for predicting a category to which the predetermined search query belongs from a predetermined search query using the first learning model acquired by the acquisition procedure;
An information processing program characterized by causing a computer to execute.
コンピュータが実行する情報処理方法であって、
同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして、前記複数の検索クエリが有する特徴を学習した第1学習モデルを取得する取得工程と、
前記取得工程によって取得された第1学習モデルを用いて、所定の検索クエリから前記所定の検索クエリが属するカテゴリを予測する第2学習モデルを生成する生成工程と、
を含み、
前記取得工程は、
ランダムに抽出された複数の検索クエリが相違する特徴を有するものとして学習することで、前記複数の検索クエリが有する特徴を学習した第1学習モデルを取得する
ことを特徴とする情報処理方法。
An information processing method executed by a computer,
Obtaining a first learning model in which features of the plurality of search queries are learned, assuming that the plurality of search queries input by the same user within a predetermined time have similar features;
A generation step of generating a second learning model for predicting a category to which the predetermined search query belongs from a predetermined search query using the first learning model acquired by the acquisition step;
Including
The acquisition step is
An information processing method comprising: acquiring a first learning model in which features of the plurality of search queries are learned by learning that the plurality of randomly extracted search queries have different features .
同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして、前記複数の検索クエリが有する特徴を学習した第1学習モデルを取得する取得手順と、
前記取得手順によって取得された第1学習モデルを用いて、所定の検索クエリから前記所定の検索クエリが属するカテゴリを予測する第2学習モデルを生成する生成手順と、
をコンピュータに実行させ、
前記取得手順は、
ランダムに抽出された複数の検索クエリが相違する特徴を有するものとして学習することで、前記複数の検索クエリが有する特徴を学習した第1学習モデルを取得する
ことを特徴とする情報処理プログラム。
An acquisition procedure for acquiring a first learning model that learns features of the plurality of search queries, assuming that the plurality of search queries input by the same user within a predetermined time have similar characteristics;
A generation procedure for generating a second learning model for predicting a category to which the predetermined search query belongs from a predetermined search query using the first learning model acquired by the acquisition procedure;
To the computer,
The acquisition procedure is
An information processing program characterized by acquiring a first learning model in which features of the plurality of search queries are learned by learning that the plurality of randomly extracted search queries have different features .
コンピュータが実行する情報処理方法であって、
同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして、前記複数の検索クエリが有する特徴を学習した第1学習モデルを取得する取得工程と、
前記取得工程によって取得された第1学習モデルを用いて、所定の検索クエリから前記所定の検索クエリが属するカテゴリを予測する第2学習モデルを生成する生成工程と、
を含み、
前記取得工程は、
ランダムに抽出された一対の検索クエリの分散表現が相違するように学習することで、前記複数の検索クエリが有する特徴を学習した第1学習モデルを取得する
ことを特徴とする情報処理方法。
An information processing method executed by a computer,
Obtaining a first learning model in which features of the plurality of search queries are learned, assuming that the plurality of search queries input by the same user within a predetermined time have similar features;
A generation step of generating a second learning model for predicting a category to which the predetermined search query belongs from a predetermined search query using the first learning model acquired by the acquisition step;
Including
The acquisition step is
An information processing method comprising: acquiring a first learning model obtained by learning features of the plurality of search queries by learning so that distributed expressions of a pair of randomly extracted search queries are different .
同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして、前記複数の検索クエリが有する特徴を学習した第1学習モデルを取得する取得手順と、
前記取得手順によって取得された第1学習モデルを用いて、所定の検索クエリから前記所定の検索クエリが属するカテゴリを予測する第2学習モデルを生成する生成手順と、
をコンピュータに実行させ、
前記取得手順は、
ランダムに抽出された一対の検索クエリの分散表現が相違するように学習することで、前記複数の検索クエリが有する特徴を学習した第1学習モデルを取得する
ことを特徴とする情報処理プログラム。
An acquisition procedure for acquiring a first learning model that learns features of the plurality of search queries, assuming that the plurality of search queries input by the same user within a predetermined time have similar characteristics;
A generation procedure for generating a second learning model for predicting a category to which the predetermined search query belongs from a predetermined search query using the first learning model acquired by the acquisition procedure;
To the computer,
The acquisition procedure is
An information processing program that acquires a first learning model in which features of the plurality of search queries are learned by learning so that distributed expressions of a pair of randomly extracted search queries are different .
コンピュータが実行する情報処理方法であって、
同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして、前記複数の検索クエリが有する特徴を学習した第1学習モデルを取得する取得工程と、
前記取得工程によって取得された第1学習モデルを用いて、所定の検索クエリから前記所定の検索クエリが属するカテゴリを予測する第2学習モデルを生成する生成工程と、
を含み、
前記生成工程は、
検索クエリが学習モデルに入力された際に、学習モデルが出力する分散表現の分類結果が、前記検索クエリが属するカテゴリに対応するように学習することで、所定の検索クエリから前記所定の検索クエリが属するカテゴリを予測する第2学習モデルを生成する
ことを特徴とする情報処理方法。
An information processing method executed by a computer,
Obtaining a first learning model in which features of the plurality of search queries are learned, assuming that the plurality of search queries input by the same user within a predetermined time have similar features;
A generation step of generating a second learning model for predicting a category to which the predetermined search query belongs from a predetermined search query using the first learning model acquired by the acquisition step;
Including
The generation step is
When the search query is input to the learning model, the classification result of the distributed expression output by the learning model is learned so as to correspond to the category to which the search query belongs, whereby the predetermined search query can be obtained from the predetermined search query An information processing method comprising: generating a second learning model that predicts a category to which the user belongs .
同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして、前記複数の検索クエリが有する特徴を学習した第1学習モデルを取得する取得手順と、
前記取得手順によって取得された第1学習モデルを用いて、所定の検索クエリから前記所定の検索クエリが属するカテゴリを予測する第2学習モデルを生成する生成手順と、
をコンピュータに実行させ、
前記生成手順は、
検索クエリが学習モデルに入力された際に、学習モデルが出力する分散表現の分類結果が、前記検索クエリが属するカテゴリに対応するように学習することで、所定の検索クエリから前記所定の検索クエリが属するカテゴリを予測する第2学習モデルを生成する
ことを特徴とする情報処理プログラム。
An acquisition procedure for acquiring a first learning model that learns features of the plurality of search queries, assuming that the plurality of search queries input by the same user within a predetermined time have similar characteristics;
A generation procedure for generating a second learning model for predicting a category to which the predetermined search query belongs from a predetermined search query using the first learning model acquired by the acquisition procedure;
To the computer,
The generation procedure is
When the search query is input to the learning model, the distributed search classification result output from the learning model is learned so as to correspond to the category to which the search query belongs. An information processing program for generating a second learning model for predicting a category to which a user belongs .
JP2018176617A 2018-09-20 2018-09-20 Information processing apparatus, information processing method, and information processing program Active JP6553793B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018176617A JP6553793B1 (en) 2018-09-20 2018-09-20 Information processing apparatus, information processing method, and information processing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018176617A JP6553793B1 (en) 2018-09-20 2018-09-20 Information processing apparatus, information processing method, and information processing program

Publications (2)

Publication Number Publication Date
JP6553793B1 true JP6553793B1 (en) 2019-07-31
JP2020047125A JP2020047125A (en) 2020-03-26

Family

ID=67473289

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018176617A Active JP6553793B1 (en) 2018-09-20 2018-09-20 Information processing apparatus, information processing method, and information processing program

Country Status (1)

Country Link
JP (1) JP6553793B1 (en)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4874828B2 (en) * 2007-02-02 2012-02-15 ヤフー株式会社 Method and apparatus for creating search index by community extraction
JP5049223B2 (en) * 2008-07-29 2012-10-17 ヤフー株式会社 Retrieval device, retrieval method and program for automatically estimating retrieval request attribute for web query
JP5406794B2 (en) * 2010-06-28 2014-02-05 日本電信電話株式会社 Search query recommendation device and search query recommendation program
JP2016018286A (en) * 2014-07-07 2016-02-01 日本電信電話株式会社 Action type discrimination system, action type discrimination method, and action type discrimination program
JP6723182B2 (en) * 2017-03-17 2020-07-15 ヤフー株式会社 Information processing apparatus, information processing method, and program
JP6767342B2 (en) * 2017-11-15 2020-10-14 ヤフー株式会社 Search device, search method and search program

Also Published As

Publication number Publication date
JP2020047125A (en) 2020-03-26

Similar Documents

Publication Publication Date Title
EP3788580A1 (en) Combining machine-learning and social data to generate personalized recommendations
CN111008336A (en) Content recommendation method, device and equipment and readable storage medium
CN107103499A (en) Method is recommended in a kind of cross-site cold start-up based on deep learning
WO2022154897A1 (en) Classifier assistance using domain-trained embedding
Akehurst et al. Explicit and implicit user preferences in online dating
JP6050284B2 (en) Extraction apparatus, extraction method, and extraction program
JP7012599B2 (en) Information processing equipment, information processing methods, and information processing programs
CN110598084A (en) Object sorting method, commodity sorting device and electronic equipment
JP6679683B2 (en) Information processing apparatus, information processing method, and information processing program
JP7071304B2 (en) Information processing equipment, information processing methods and information processing programs
JP2019057023A (en) Generation device, learning apparatus, generation method, learning method, generation program, learning program, and model
JP6553793B1 (en) Information processing apparatus, information processing method, and information processing program
JP6982017B2 (en) Information processing equipment, information processing methods and information processing programs
JP7311121B1 (en) Information processing device, information processing method and information processing program
JP6584613B1 (en) Information processing apparatus, information processing method, and information processing program
JP6852114B2 (en) Specific device, specific method and specific program
JP6985059B2 (en) Generator, generation method, and generation program
JP7177013B2 (en) Information processing device, information processing method and information processing program
JP6979986B2 (en) Information processing equipment, information processing methods and information processing programs
JP2019125317A (en) Device, method, and program for processing information
JP2022097381A (en) Information processing device, information processing method, and information processing program
JP7258988B2 (en) Information processing device, information processing method and information processing program
JP6983672B2 (en) Information processing equipment, information processing methods, and information processing programs
JP2020190798A (en) Generating device, generating method, generating program, and extractor
JP7198900B2 (en) Generation device, generation method, and generation program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181213

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20181213

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20190204

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190219

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190422

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190604

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190704

R150 Certificate of patent or registration of utility model

Ref document number: 6553793

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350