JP2020129306A - Information processing device, information processing method, and information processing program - Google Patents
Information processing device, information processing method, and information processing program Download PDFInfo
- Publication number
- JP2020129306A JP2020129306A JP2019022029A JP2019022029A JP2020129306A JP 2020129306 A JP2020129306 A JP 2020129306A JP 2019022029 A JP2019022029 A JP 2019022029A JP 2019022029 A JP2019022029 A JP 2019022029A JP 2020129306 A JP2020129306 A JP 2020129306A
- Authority
- JP
- Japan
- Prior art keywords
- information
- search query
- input
- unit
- search
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 283
- 238000003672 processing method Methods 0.000 title claims description 7
- 238000003860 storage Methods 0.000 claims abstract description 131
- 238000012545 processing Methods 0.000 claims abstract description 92
- 238000000034 method Methods 0.000 claims description 131
- 230000008569 process Effects 0.000 claims description 102
- 238000013528 artificial neural network Methods 0.000 claims description 25
- 238000013527 convolutional neural network Methods 0.000 claims description 8
- 230000000306 recurrent effect Effects 0.000 claims description 5
- 230000014509 gene expression Effects 0.000 description 171
- 239000013598 vector Substances 0.000 description 121
- 235000015927 pasta Nutrition 0.000 description 51
- 238000000605 extraction Methods 0.000 description 43
- 239000000284 extract Substances 0.000 description 35
- 238000010586 diagram Methods 0.000 description 33
- 238000004364 calculation method Methods 0.000 description 26
- 101001111655 Homo sapiens Retinol dehydrogenase 11 Proteins 0.000 description 21
- 102100023916 Retinol dehydrogenase 11 Human genes 0.000 description 21
- 238000004458 analytical method Methods 0.000 description 14
- 230000009471 action Effects 0.000 description 13
- 230000004913 activation Effects 0.000 description 11
- 230000006399 behavior Effects 0.000 description 11
- 238000004891 communication Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 10
- 230000000877 morphologic effect Effects 0.000 description 10
- 230000004048 modification Effects 0.000 description 8
- 238000012986 modification Methods 0.000 description 8
- 101710114762 50S ribosomal protein L11, chloroplastic Proteins 0.000 description 6
- 101710156159 50S ribosomal protein L21, chloroplastic Proteins 0.000 description 5
- 238000009826 distribution Methods 0.000 description 4
- 235000013305 food Nutrition 0.000 description 4
- 239000013604 expression vector Substances 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 230000015654 memory Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000003825 pressing Methods 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000006403 short-term memory Effects 0.000 description 2
- 101710082414 50S ribosomal protein L12, chloroplastic Proteins 0.000 description 1
- 101710087140 50S ribosomal protein L22, chloroplastic Proteins 0.000 description 1
- 101100494773 Caenorhabditis elegans ctl-2 gene Proteins 0.000 description 1
- 101100112369 Fasciola hepatica Cat-1 gene Proteins 0.000 description 1
- 101100005271 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) cat-1 gene Proteins 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は、情報処理装置、情報処理方法及び情報処理プログラムに関する。 The present invention relates to an information processing device, an information processing method, and an information processing program.
従来、検索クエリ等の情報の意味を解釈する技術が知られている。例えば、対象ユーザが用いた各検索クエリに関する情報に対応するベクトル間の類似度に基づいて対象ユーザが用いた検索クエリに関する情報を第1クラスタに分類し、他のユーザの各検索クエリに関する情報に対応するベクトル間の類似度に基づいて他のユーザが用いた検索クエリに関する情報を第2クラスタに分類する。そして、第1クラスタと第2クラスタとの差異に基づいて、第1クラスタから対象ユーザに特徴的な行動を示すクラスタである特徴クラスタを抽出する技術が提案されている。 Conventionally, a technique of interpreting the meaning of information such as a search query is known. For example, the information regarding the search query used by the target user is classified into the first cluster based on the similarity between the vectors corresponding to the information regarding each search query used by the target user, and is classified into the information regarding each search query of other users. Information about search queries used by other users is classified into the second cluster based on the similarity between corresponding vectors. Then, based on the difference between the first cluster and the second cluster, a technique has been proposed for extracting a characteristic cluster, which is a cluster showing a characteristic behavior of the target user, from the first cluster.
しかしながら、上記の従来技術では、検索クエリ等の情報の意味を効率よく解釈可能とすることができるとは限らない。例えば、上記の従来技術では、各検索クエリに関する情報に対応するベクトル間の類似度に基づいて検索クエリに関する情報をクラスタに分類するにすぎず、検索クエリ等の情報の意味を効率よく解釈可能とすることができるとは限らない。なお、従来から、検索クエリに限らず、あらゆる情報の意味を効率よく解釈可能とすることは課題である。したがって、上記の従来技術では、情報の意味を効率よく解釈可能とすることができるとは限らない。 However, the above-mentioned conventional techniques do not always make it possible to efficiently interpret the meaning of information such as a search query. For example, in the above-mentioned conventional technique, the information about the search query is only classified into clusters based on the similarity between the vectors corresponding to the information about each search query, and the meaning of the information such as the search query can be efficiently interpreted. You can't always do it. In addition, conventionally, it is a problem to efficiently interpret meanings of all kinds of information, not limited to search queries. Therefore, in the above-mentioned conventional technology, it is not always possible to efficiently interpret the meaning of information.
本願は、上記に鑑みてなされたものであって情報の意味を効率よく解釈可能とすることができる情報処理装置、情報処理方法及び情報処理プログラムを提供することを目的とする。 The present application has been made in view of the above, and an object thereof is to provide an information processing device, an information processing method, and an information processing program capable of efficiently interpreting the meaning of information.
本願に係る情報処理装置は、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして、前記複数の検索クエリが有する特徴を学習した学習モデルを用いて、第1入力情報から前記第1入力情報の特徴を示す第1特徴情報を予測する予測部と、前記予測部が第2入力情報から前記第2入力情報の特徴を示す第2特徴情報を予測する予測処理に用いられる情報として、前記予測部による第1特徴情報の予測処理の途中経過に関する情報である経過情報を記憶する記憶部とを備えたことを特徴とする。 The information processing apparatus according to the present application uses a learning model that learns the characteristics of the plurality of search queries, assuming that the plurality of search queries input by the same user within a predetermined time have similar characteristics, A predicting unit that predicts first characteristic information indicating a characteristic of the first input information from first input information, and a predicting unit predicts second characteristic information indicating a characteristic of the second input information from second input information. As information used for the prediction process, a storage unit that stores progress information that is information regarding the progress of the prediction process of the first feature information by the prediction unit is provided.
実施形態の一態様によれば、情報の意味を効率よく解釈可能とすることができるといった効果を奏する。 According to one aspect of the embodiment, there is an effect that the meaning of information can be efficiently interpreted.
以下に、本願に係る情報処理装置、情報処理方法及び情報処理プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る情報処理装置、情報処理方法及び情報処理プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略する。 Hereinafter, modes (hereinafter, referred to as “embodiments”) for implementing an information processing apparatus, an information processing method, and an information processing program according to the present application will be described in detail with reference to the drawings. The information processing apparatus, the information processing method, and the information processing program according to the present application are not limited to this embodiment. Further, in each of the following embodiments, the same parts are designated by the same reference numerals, and overlapping description will be omitted.
〔1.情報処理の一例〕
まず、図1と図2を用いて、実施形態に係る情報処理の一例について説明する。図1と図2は、実施形態に係る情報処理の一例を示す図である。図1と図2に示す情報処理は、ユーザ端末10(図3参照)と検索サーバ50(図3参照)と情報処理装置100(図3参照)とによって行われる。
[1. Example of information processing]
First, an example of information processing according to the embodiment will be described with reference to FIGS. 1 and 2. 1 and 2 are diagrams illustrating an example of information processing according to the embodiment. The information processing shown in FIGS. 1 and 2 is performed by the user terminal 10 (see FIG. 3), the search server 50 (see FIG. 3), and the information processing device 100 (see FIG. 3).
ユーザ端末10は、ユーザによって使用される情報処理装置である。ユーザ端末10は、例えば、スマートフォンや、タブレット型端末や、ノート型PC(Personal Computer)や、携帯電話機や、PDA(Personal Digital Assistant)等により実現される。なお、以下では、ユーザ端末10をユーザと同一視する場合がある。すなわち、以下では、ユーザをユーザ端末10と読み替えることもできる。
The
また、以下では、ユーザID「U1」により特定されるユーザを「ユーザU1」とする場合がある。このように、以下では、「ユーザU*(*は任意の数値)」と記載した場合、そのユーザはユーザID「U*」により特定されるユーザであることを示す。例えば、「ユーザU2」と記載した場合、そのユーザはユーザID「U2」により特定されるユーザである。 In the following, the user identified by the user ID "U1" may be referred to as "user U1". As described above, in the following, when "user U* (* is an arbitrary numerical value)" is described, that user is a user specified by the user ID "U*". For example, when described as “user U2”, the user is the user specified by the user ID “U2”.
検索サーバ50は、検索サービスを提供するサーバ装置である。例えば、検索サーバ50が提供する検索サービスは、あらゆる情報を検索可能な総合検索サービスである。検索サーバ50は、ユーザによって入力された検索クエリに関する情報を記憶する。具体的には、検索サーバ50は、ユーザの検索履歴に関する情報を記憶する。 The search server 50 is a server device that provides a search service. For example, the search service provided by the search server 50 is a comprehensive search service that can search for any information. The search server 50 stores information about the search query input by the user. Specifically, the search server 50 stores information regarding the search history of the user.
情報処理装置100は、第1学習モデル(以下、適宜「第1モデル」と記載する。)を生成するサーバ装置である。具体的には、情報処理装置100は、ユーザによって入力された検索クエリに関する情報を検索サーバ50から取得する。続いて、情報処理装置100は、検索サーバ50から取得した検索クエリのうち、同一のユーザによって所定の時間内に入力された複数の検索クエリを抽出する。ここで、情報処理装置100は、ユーザによる1回の検索ごとに検索ボックスに入力された文字群全体をユーザによって入力された一つの検索クエリとして取り扱う。例えば、情報処理装置100は、ユーザU1による1回の検索で検索ボックスに「六本木 パスタ」のように複数の文字群を含む検索クエリが入力された場合は、「六本木 パスタ」全体で一つの検索クエリとして取り扱う。また、情報処理装置100は、同一のユーザによって各検索クエリが入力された時間の間隔が所定の時間内(例えば、2分以内)であるような複数の検索クエリを同一のユーザによって所定の時間内に入力された複数の検索クエリとして抽出する。続いて、情報処理装置100は、抽出した複数の検索クエリが類似する特徴を有するものとして学習することで、所定の検索クエリから所定の検索クエリの特徴情報を予測する第1学習モデルを生成する。具体的には、情報処理装置100は、抽出した複数の検索クエリの分散表現が類似するように第1学習モデルを学習させることで、所定の検索クエリから所定の検索クエリの特徴情報を含む分散表現(ベクトル)を出力する第1学習モデルを生成する。より具体的には、情報処理装置100は、再帰的ニューラルネットワークとも呼ばれるRNN(Recurrent Neural Network)の一種であるLSTM(Long Short-Term Memory)を分散表現生成に用いたDSSM(Deep Structured Semantic Model)の技術を用いて、検索クエリから分散表現(ベクトル)を出力する第1学習モデルを生成する。なお、以下では、RNNの拡張版のモデルとしてのLSTMを「LSTM‐RNN」と記載する。また、RNNの隠れ層(中間層)に置き換えられる層としてのLSTMを「LSTM層」と記載する。図1に示す例では、各ステップの縦に並んだ3つのブロックの各ブロックをLSTM層と記載する。例えば、情報処理装置100は、第1学習モデルの正解データとして、同一のユーザによって所定の時間内に入力された一対の検索クエリが類似する特徴を有するものとして、所定の検索クエリの分散表現(ベクトル)と、所定の検索クエリと対となる他の検索クエリの分散表現(ベクトル)とが類似するように学習する。
The
また、情報処理装置100は、第2学習モデル(以下、適宜「第2モデル」と記載する。)を生成する。具体的には、情報処理装置100は、第1学習モデルを用いて、所定の検索クエリから所定の検索クエリが属するカテゴリを予測する第2学習モデルを生成する。より具体的には、情報処理装置100は、第1学習モデルを生成すると、生成した第1学習モデル(第1学習モデルM1のモデルデータMDT1)を取得する。情報処理装置100は、第1モデルM1を取得すると、取得した第1モデルM1を用いて、第2学習モデルM2を生成する。情報処理装置100は、第1モデルM1を再学習させることにより、第1モデルM1とは学習モデルの重みである接続係数が異なる第2学習モデルM2を生成する。例えば、情報処理装置100は、検索クエリが学習モデルに入力された際に、学習モデルが出力する分散表現の分類結果が、検索クエリが属するカテゴリに対応するように学習することで、所定の検索クエリから所定の検索クエリが属するカテゴリを予測する第2学習モデルM2を生成する。
The
また、情報処理装置100は、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして、複数の検索クエリが有する特徴を学習した学習モデルを用いて、第1入力情報から第1入力情報の特徴を示す第1特徴情報を予測する。そして、情報処理装置100は、情報処理装置100が第2入力情報から第2入力情報の特徴を示す第2特徴情報を予測する予測処理に用いる情報として、第1特徴情報の予測処理の途中経過に関する情報である経過情報を記憶する。
In addition, the
ここから、図1を用いて、情報処理の流れについて説明する。図1は、実施形態に係る情報処理の一例を示す図である。図1では、情報処理装置100が、第2学習モデルM2を用いて、第1検索クエリから第1検索クエリが属するカテゴリを予測する例について説明する。また、情報処理装置100が、第2検索クエリから第2検索クエリが属するカテゴリを予測する予測処理に用いる情報として、第1検索クエリが属するカテゴリの予測処理の途中経過に関する情報である経過情報を記憶する例について説明する。なお、第2検索クエリは、第1検索クエリよりも後に第2学習モデルM2に入力される検索クエリを指す。
From here, the flow of information processing is demonstrated using FIG. FIG. 1 is a diagram illustrating an example of information processing according to the embodiment. In FIG. 1, an example will be described in which the
図1には、情報処理装置100が生成した第2学習モデルM2が示されている。第2学習モデルM2は、3層のLSTM‐RNNで構成されている。図1に示す「LSTM」の文字の右側にある各層は、LSTM‐RNNである各層を示す。すなわち、図1に示す「LSTM」の文字の右側にある縦3つの層で示す3つのLSTM‐RNNのセットが、第2学習モデルM2を示す。ここで、LSTM‐RNNは、RNN(Recurrent Neural Network)の一種である。RNNは、入力層と隠れ層と出力層とからなるニューラルネットワークであって、隠れ層に戻り値があるのが特徴である。そして、LSTM‐RNNは、RNNの隠れ層をLSTM層で置換えたニューラルネットワークである。図1は、LSTM層が隠れ層の値を再び隠れ層に入力する操作を処理の進行方向に展開した図である。例えば、縦3つのLSTM層のセットからなる第2学習モデルM2に「六」の文字が入力された処理ステップを「ステップ1」とする。続いて、第2学習モデルM2に「本」の文字が入力された処理ステップを「ステップ2」とする。続いて、第2学習モデルM2に「木」の文字が入力された処理ステップを「ステップ3」とする。続いて、第2学習モデルM2に「□」の文字が入力された処理ステップを「ステップ4」とする。続いて、第2学習モデルM2に「パ」の文字が入力された処理ステップを「ステップ5」とする。続いて、第2学習モデルM2に「ス」の文字が入力された処理ステップを「ステップ6」とする。続いて、第2学習モデルM2に「タ」の文字が入力された処理ステップを「ステップ7」とする。このように、第2学習モデルM2は、時系列データである文字群を、先頭から一文字ずつ順次処理する。
FIG. 1 shows the second learning model M2 generated by the
図1に示す例では、情報処理装置100は、地名を示す「六本木」と料理の種類を示す「パスタ」とが区切り文字であるスペースで区切られた文字群である第1検索クエリ「六本木 パスタ」を先頭から一文字ずつ第2学習モデルM2に入力する(ステップS1)。図1に示すように、第2学習モデルM2は、文字群である第1検索クエリ「六本木 パスタ」を、先頭から一文字ずつ順次処理する。
In the example illustrated in FIG. 1, the
続いて、情報処理装置100は、情報処理装置100が第2検索クエリから第2検索クエリが属するカテゴリを予測する予測処理に用いる情報として、第1検索クエリ「六本木 パスタ」が属するカテゴリの予測処理の途中経過に関する情報である経過情報を記憶する。具体的には、情報処理装置100は、ニューラルネットの処理で用いられる第2学習モデルM2の内部状態に関する情報を記憶する。一般的に、ニューラルネットの処理で用いられる学習モデルの内部状態に関する情報には、大きく分けると、接続係数(重み、パラメータ又はウェイト等とも称される)に関する情報とアクティベーション(activation)に関する情報の2種類が存在する。ここで、アクティベーション(activation)とは、ニューラルネットによる計算が行われる中での、各層の中間的な計算結果を指す。情報処理装置100は、第2学習モデルM2の内部状態に関する情報として、第2学習モデルM2のアクティベーション(activation)に関する情報を記憶する。すなわち、情報処理装置100は、第2学習モデルM2の内部状態に関する情報として、第2学習モデルM2を構成する各層(各LSTM層)の中間的な計算結果に関する情報を記憶する。図1に示す例では、情報処理装置100は、第2学習モデルM2を構成する3層のLSTM層の各層(各LSTM層)の中間的な計算結果に関する情報を記憶する。例えば、情報処理装置100は、第1検索クエリ「六本木 パスタ」が所定の区切り文字であるスペース(以下、スペースを適宜記号「□」で記載する。)を含むか否かを判定する。続いて、情報処理装置100は、第1検索クエリ「六本木 パスタ」が所定の区切り文字であるスペースを含む場合、地名を示す「六本木」と区切り文字であるスペースからなる文字群「六本木□」に対応する経過情報を記憶部120(図3参照)に記憶する(ステップS2)。具体的には、情報処理装置100は、文字群「六本木□」に対応する経過情報として、処理ステップ「ステップ4」における第2学習モデルM2の内部状態に関する情報を記憶する。より具体的には、情報処理装置100は、文字群「六本木□」に対応する経過情報として、処理ステップ「ステップ4」における第2学習モデルM2のアクティベーション(activation)に関する情報を記憶する。すなわち、情報処理装置100は、処理ステップ「ステップ4」における第2学習モデルM2を構成する各層の中間的な計算結果に関する情報を記憶する。図1に示す例では、情報処理装置100は、処理ステップ「ステップ4」における第2学習モデルM2を構成する3層のLSTM層の各層(各LSTM層)の中間的な計算結果であるベクトル(例えば、2048次元のベクトル)の値を3セット分(3層分)記憶する。
Subsequently, the
続いて、情報処理装置100は、経過情報を記憶すると、第1検索クエリ「六本木 パスタ」の分散表現を出力する(ステップS3)。なお、情報処理装置100は、第1検索クエリ「六本木 パスタ」と全く同じ検索クエリが入力された場合に備えて、第1検索クエリ「六本木 パスタ」に対応する分散表現を記憶部120(図3参照)に記憶する。
Then, the
情報処理装置100は、第1検索クエリ「六本木 パスタ」の分散表現を抽出して出力すると、第2学習モデルM2の出力データとして、第1検索クエリ「六本木 パスタ」の分散表現が各カテゴリに分類される確率をカテゴリ毎に出力する(ステップS4)。例えば、情報処理装置100は、第1検索クエリ「六本木 パスタ」の分散表現が、CAT11(「飲食店を探す」)に属する確率を「90(%)」、CAT12(「商品を探す」)に属する確率を「0(%)」、CAT13(「飲食店を予約する」)に属する確率を「10(%)」、CAT14(「商品を購入する」)に属する確率を「0(%)」と出力する。なお、検索クエリがCAT11(「飲食店を探す」)に属することは、検索クエリが飲食店を探す意図で入力された検索クエリであることを示す。また、CAT12(「商品を探す」)に属することは、検索クエリが商品を探す意図で入力された検索クエリであることを示す。また、検索クエリがCAT13(「飲食店を予約する」)に属することは、検索クエリが飲食店を予約する意図で入力された検索クエリであることを示す。また、検索クエリがCAT14(「商品を購入する」)に属することは、検索クエリが商品を購入する意図で入力された検索クエリであることを示す。
When the
次に、図2を用いて、情報処理の流れについて説明する。図2は、実施形態に係る情報処理の一例を示す図である。図2は、図1に示す情報処理の後に行われる情報処理を示す。図2に示す例では、情報処理装置100は、地名を示す「六本木」と料理の種類を示す「お好み焼き」とが区切り文字であるスペースで区切られた文字群である第2検索クエリ「六本木 お好み焼き」を先頭から一文字ずつ第2学習モデルM2に入力する(ステップS5)。
Next, the flow of information processing will be described with reference to FIG. FIG. 2 is a diagram illustrating an example of information processing according to the embodiment. FIG. 2 shows information processing performed after the information processing shown in FIG. In the example illustrated in FIG. 2, the
続いて、情報処理装置100は、記憶部120に記憶されている経過情報の中に、第2検索クエリ「六本木 お好み焼き」と一部又は全部が共通する文字群に対応する経過情報が存在するか否かを判定する。例えば、情報処理装置100は、記憶部120に記憶されている文字群の中に、第2検索クエリ「六本木 お好み焼き」と一致する文字群が存在するか否かを判定する。情報処理装置100は、第2検索クエリ「六本木 お好み焼き」と一致する文字群が存在しないと判定したとする。続いて、情報処理装置100は、記憶部120に記憶されている文字群の中に、第2検索クエリ「六本木 お好み焼き」に含まれる文字群「六本木□」と共通する文字群「六本木□」が存在するか否かを判定する。情報処理装置100は、第2検索クエリ「六本木 お好み焼き」に含まれる文字群「六本木□」と共通する文字群「六本木□」が存在すると判定したとする。続いて、情報処理装置100は、共通する文字群「六本木□」が存在すると判定すると、共通する文字群「六本木□」に対応する経過情報を記憶部120から取得する(ステップS6)。具体的には、情報処理装置100は、文字群「六本木□」に対応する経過情報として、図1の処理ステップ「ステップ4」における第2学習モデルM2の内部状態に関する情報を取得する。より具体的には、情報処理装置100は、文字群「六本木□」に対応する経過情報として、図1の処理ステップ「ステップ4」における第2学習モデルM2のアクティベーション(activation)に関する情報を取得する。すなわち、情報処理装置100は、図1の処理ステップ「ステップ4」における第2学習モデルM2を構成する各層の中間的な計算結果に関する情報を取得する。図2に示す例では、情報処理装置100は、図1の処理ステップ「ステップ4」における第2学習モデルM2を構成する3層のLSTM層の各層(各LSTM層)の中間的な計算結果であるベクトル(例えば、2048次元のベクトル)の値を3セット分(3層分)取得する。
Subsequently, the
続いて、情報処理装置100は、文字群「六本木□」に対応する経過情報を取得すると、取得した文字群「六本木□」に対応する経過情報を用いて、第2検索クエリ「六本木 お好み焼き」の分散表現を出力する(ステップS7)。具体的には、情報処理装置100は、図1の処理ステップ「ステップ4」における第2学習モデルM2の内部状態に関する情報を取得すると、処理ステップ「ステップ4」における第2学習モデルM2の内部状態を再現する。続いて、情報処理装置100は、処理ステップ「ステップ4」における第2学習モデルM2の内部状態に関する情報に基づいて、第2検索クエリ「六本木 お好み焼き」の文字群「お好み焼き」以降の予測処理を開始する。すなわち、情報処理装置100は、処理ステップ「ステップ4」における第2学習モデルM2を構成する各層の中間的な計算結果に関する情報に基づいて、第2検索クエリ「六本木 お好み焼き」の文字群「お好み焼き」以降の予測処理を開始する。そして、情報処理装置100は、第2検索クエリ「六本木 お好み焼き」の分散表現を出力する。
Subsequently, when the
続いて、情報処理装置100は、第2検索クエリ「六本木 お好み焼き」の分散表現を抽出して出力すると、第2学習モデルM2の出力データとして、第2検索クエリ「六本木 お好み焼き」の分散表現が各カテゴリに分類される確率をカテゴリ毎に出力する(ステップS8)。例えば、情報処理装置100は、第2検索クエリ「六本木 お好み焼き」の分散表現が、CAT11(「飲食店を探す」)に属する確率を「90(%)」、CAT12(「商品を探す」)に属する確率を「0(%)」、CAT13(「飲食店を予約する」)に属する確率を「10(%)」、CAT14(「商品を購入する」)に属する確率を「0(%)」と出力する。
Subsequently, when the
上述したように、情報処理装置100は、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして、複数の検索クエリが有する特徴を学習した学習モデルを用いて、第1入力情報から第1入力情報の特徴を示す第1特徴情報を予測する。そして、情報処理装置100は、第2入力情報から第2入力情報の特徴を示す第2特徴情報を予測する予測処理に用いる情報として、第1特徴情報の予測処理の途中経過に関する情報である経過情報を記憶する。これにより、情報処理装置100は、予測処理の途中経過まで予測結果を覚えておいて、必要に応じてキャッシングを取得し途中から処理を開始することができる。すなわち、情報処理装置100は、前に行った計算結果を用いて、効率よく特徴情報の予測処理を行うことができる。したがって、情報処理装置100は、情報の意味を効率よく解釈可能とすることができる。
As described above, the
なお、図1では、情報処理装置100が、検索クエリがスペース等の区切り文字を含む文字群である場合について、スペース等の区切り文字で区切られた単位ごとに第2学習モデルM2の内部状態に関する情報を記憶する例について説明した。しかしながら、情報処理装置100は、スペース等の区切り文字に限られず、検索クエリをどこで区切り、第2学習モデルM2の内部状態に関する情報をどのような単位で記憶してもよい。具体的には、情報処理装置100は、第1検索クエリが一定のルール(又は一定の手順)で区分できるか否かを判定する。例えば、情報処理装置100は、形態素解析を用いて第1検索クエリが区分できるか否かを判定する。また、例えば、情報処理装置100は、BPE(Byte pair encoding)を用いて第1検索クエリが区分できるか否かを判定する。続いて、情報処理装置100は、第1検索クエリが一定のルール(又は一定の手順)で区分できると判定した場合、第1検索クエリを一定のルール(又は一定の手順)で区分した単位ごとに第2学習モデルM2の内部状態に関する情報を記憶する。例えば、情報処理装置100は、形態素解析を用いて第1検索クエリを区分できると判定した場合、形態素解析を用いて第1検索クエリを区分した単位ごとに第2学習モデルM2の内部状態に関する情報を記憶する。また、例えば、情報処理装置100は、BPEを用いて第1検索クエリを区分できると判定した場合、BPEを用いて第1検索クエリを区分した単位ごとに第2学習モデルM2の内部状態に関する情報を記憶する。
Note that in FIG. 1, the
また、図2では、情報処理装置100が、第2検索クエリ「六本木 お好み焼き」と共通する文字群が記憶部120に一つ(文字群「六本木□」)しか存在しない場合について、第2検索クエリと共通する文字群「六本木□」に対応する経過情報を取得する例について説明した。ここでは、第2検索クエリと共通する文字群が記憶部120に複数存在する場合について説明する。具体的には、第2検索クエリ「六本木□お好み焼き□おすすめ」が入力された時点において、第2検索クエリと共通する文字群として、文字群「六本木□お好み焼き□」と文字群「六本木□」の2つが記憶部120に存在する場合を考える。情報処理装置100は、記憶部120を参照して、第2検索クエリと共通する文字群が複数存在すると判定した場合には、複数の文字群の間に包含関係があるか否かを判定する。例えば、情報処理装置100は、文字群「六本木□お好み焼き□」と文字群「六本木□」との間に包含関係があるか否かを判定する。続いて、情報処理装置100は、複数の文字群の間に包含関係があると判定した場合、複数の文字群の中から他の文字群をいずれも包含する文字群を選択する。続いて、情報処理装置100は、選択した文字群に対応する経過情報を記憶部120から取得する。例えば、情報処理装置100は、文字群「六本木□お好み焼き□」と文字群「六本木□」との間には、文字群「六本木□お好み焼き□」が文字群「六本木□」を含む(文字群「六本木□」が文字群「六本木□お好み焼き□」に包含される)関係があると判定する。続いて、情報処理装置100は、文字群「六本木□お好み焼き□」と文字群「六本木□」との間に、文字群「六本木□お好み焼き□」が文字群「六本木□」を含む包含関係があると判定すると、文字群「六本木□」を含む文字群「六本木□お好み焼き□」を選択する。続いて、情報処理装置100は、選択した文字群「六本木□お好み焼き□」に対応する経過情報を記憶部120から取得する。なお、図2では、第2学習モデルM2がLSTM‐RNNであるため、第2検索クエリと共通する文字群が複数存在する場合には、文字群の間に必ず包含関係が存在する。そのため、情報処理装置100は、第2検索クエリと共通する文字群が複数存在する場合には、最も長い文字群(文字数が最も多い文字群)を選択する。そして、情報処理装置100は、選択した最長の文字群に対応する経過情報を記憶部120から取得する。
In addition, in FIG. 2, when the
〔2.情報処理システムの構成〕
次に、図2を用いて、実施形態に係る情報処理システムの構成について説明する。図2は、実施形態に係る情報処理システムの構成例を示す図である。図2に示すように、情報処理システム1には、ユーザ端末10と、検索サーバ50と、情報処理装置100とが含まれる。ユーザ端末10と、検索サーバ50と、情報処理装置100とは所定のネットワークNを介して、有線または無線により通信可能に接続される。なお、図2に示す情報処理システム1には、任意の数のユーザ端末10と任意の数の検索サーバ50と任意の数の情報処理装置100とが含まれてもよい。
[2. Information processing system configuration]
Next, the configuration of the information processing system according to the embodiment will be described with reference to FIG. FIG. 2 is a diagram illustrating a configuration example of the information processing system according to the embodiment. As shown in FIG. 2, the
ユーザ端末10は、ユーザによって入力された検索クエリを検索サーバ50に送信する。具体的には、ユーザ端末10は、ユーザによる操作に従って、検索クエリを入力するための検索ボックスを含む検索ページを検索サーバ50から取得する。続いて、ユーザ端末10は、ユーザによって検索ボックスに文字が入力される操作に続いて、検索クエリを送信する操作が行われると、検索ページを介して検索ボックスに入力された文字を検索クエリとして検索サーバ50に送信する。例えば、ユーザ端末10は、ユーザによって検索ボックスに文字が入力される操作に続いて、検索クエリの送信ボタンが押下される操作やエンターキーが押下される操作が行われると、検索ページを介して検索ボックスに入力された文字を検索クエリとして検索サーバ50に送信する。
The
検索サーバ50は、ユーザ端末10から検索クエリを受け付けると、受け付けた検索クエリに応じたコンテンツであって、検索結果として出力されるコンテンツを選択する。続いて、検索サーバ50は、選択されたコンテンツを含む検索結果ページをユーザ端末10に配信する。ここで、検索サーバ50によって配信されるコンテンツは、ウェブブラウザによって表示されるウェブページに限られない。例えば、検索サーバ50によって配信されるコンテンツは、ユーザ端末10にインストールされた専用のアプリケーションによって表示されるコンテンツであってもよい。また、検索サーバ50によって配信されるコンテンツは、音楽コンテンツや画像(静止画のみならず動画を含む。)コンテンツ、テキストコンテンツ(ニュース記事やSNS(Social Networking Service)に投稿された記事を含む。)、画像とテキストを組み合わせたコンテンツ、ゲームコンテンツなど、どのようなコンテンツであってもよい。
When the search server 50 receives the search query from the
また、検索サーバ50は、ユーザ端末10から検索クエリを受け付けると、受け付けた検索クエリと検索クエリの送信元であるユーザを識別するユーザIDと検索クエリの送信日時とを対応付けてデータベースに登録する。検索サーバ50は、情報処理装置100の要求に応じて、ユーザによって入力された検索クエリに関する情報を情報処理装置100に送信する。
Further, when the search server 50 receives the search query from the
また、ユーザ端末10は、ユーザによって入力された検索クエリを情報処理装置100に送信する。具体的には、ユーザ端末10は、ユーザによる操作に従って、検索クエリを入力するための検索ボックスを含むコンテンツを情報処理装置100から取得する。続いて、ユーザ端末10は、ユーザによって検索ボックスに文字が入力される操作に続いて、検索クエリを送信する操作が行われると、コンテンツを介して検索ボックスに入力された文字群を検索クエリとして情報処理装置100に送信する。例えば、ユーザ端末10は、ユーザによって検索ボックスに文字が入力される操作に続いて、検索クエリの送信ボタンが押下される操作やエンターキーが押下される操作が行われると、コンテンツを介して検索ボックスに入力された文字群を検索クエリとして情報処理装置100に送信する。
In addition, the
情報処理装置100は、図1で説明した情報処理を行うサーバ装置である。情報処理装置100は、第1学習モデルを生成する。また、情報処理装置100は、第1学習モデルを用いて、第2学習モデルを生成する。情報処理装置100は、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして、複数の検索クエリが有する特徴を学習した学習モデルを用いて、第1入力情報から第1入力情報の特徴を示す第1特徴情報を予測する。そして、情報処理装置100は、第2入力情報から第2入力情報の特徴を示す第2特徴情報を予測する予測処理に用いる情報として、第1特徴情報の予測処理の途中経過に関する情報である経過情報を記憶する。
The
〔3.情報処理装置の構成〕
次に、図3を用いて、実施形態に係る情報処理装置100の構成について説明する。図3は、実施形態に係る情報処理装置100の構成例を示す図である。図3に示すように、情報処理装置100は、通信部110と、記憶部120と、制御部130とを有する。なお、情報処理装置100は、情報処理装置100の管理者等から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を表示させるための表示部(例えば、液晶ディスプレイ等)を有してもよい。
[3. Configuration of information processing device]
Next, the configuration of the
(通信部110)
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部110は、ネットワークと有線または無線で接続され、例えば、ユーザ端末10と検索サーバ50との間で情報の送受信を行う。
(Communication unit 110)
The communication unit 110 is realized by, for example, a NIC (Network Interface Card) or the like. The communication unit 110 is connected to a network by wire or wirelessly, and transmits and receives information between the
(記憶部120)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。記憶部120は、図3に示すように、クエリ情報記憶部121とカテゴリ情報記憶部122と分類定義記憶部123とモデル情報記憶部124と経過情報記憶部125を有する。
(Storage unit 120)
The storage unit 120 is realized by, for example, a semiconductor memory element such as a RAM (Random Access Memory) or a flash memory (Flash Memory), or a storage device such as a hard disk or an optical disk. As illustrated in FIG. 3, the storage unit 120 includes a query information storage unit 121, a category information storage unit 122, a classification definition storage unit 123, a model
(クエリ情報記憶部121)
クエリ情報記憶部121は、ユーザによって入力された検索クエリに関する各種の情報を記憶する。図5に、実施形態に係るクエリ情報記憶部の一例を示す。図5に示す例では、クエリ情報記憶部121は、「ユーザID」、「日時」、「検索クエリ」、「検索クエリID」といった項目を有する。
(Query information storage unit 121)
The query information storage unit 121 stores various information regarding the search query input by the user. FIG. 5 shows an example of the query information storage unit according to the embodiment. In the example illustrated in FIG. 5, the query information storage unit 121 has items such as “user ID”, “date and time”, “search query”, and “search query ID”.
「ユーザID」は、検索クエリを入力したユーザを識別するための識別情報を示す。「日時」は、検索サーバがユーザから検索クエリを受け付けた日時を示す。「検索クエリ」は、ユーザによって入力された検索クエリを示す。「検索クエリID」は、ユーザによって入力された検索クエリを識別するための識別情報を示す。 The “user ID” indicates identification information for identifying the user who has input the search query. The “date and time” indicates the date and time when the search server accepted the search query from the user. "Search query" indicates a search query input by the user. The “search query ID” indicates identification information for identifying the search query input by the user.
図5の1レコード目に示す例では、検索クエリID「Q11」で識別される検索クエリ(検索クエリQ11)は、図1に示した検索クエリ「六本木 パスタ」に対応する。また、ユーザID「U1」は、検索クエリQ11を入力したユーザがユーザID「U1」で識別されるユーザ(ユーザU1)であることを示す。また、日時「2018/9/1 PM17:00」は、検索サーバがユーザU1から検索クエリQ11を受け付けた日時が2018年9月1日の午後17:00であることを示す。また、検索クエリ「六本木 パスタ」は、ユーザU1によって入力された検索クエリQ11を示す。 In the example shown in the first record of FIG. 5, the search query (search query Q11) identified by the search query ID “Q11” corresponds to the search query “Roppongi pasta” shown in FIG. The user ID “U1” indicates that the user who inputs the search query Q11 is the user (user U1) identified by the user ID “U1”. Further, the date and time "2018/9/1 PM 17:00" indicates that the date and time when the search server receives the search query Q11 from the user U1 is 17:00 pm on September 1, 2018. The search query "Roppongi pasta" indicates the search query Q11 input by the user U1.
(カテゴリ情報記憶部122)
カテゴリ情報記憶部122は、検索クエリと検索クエリが属するカテゴリに関する各種の情報を記憶する。図6に、実施形態に係るカテゴリ情報記憶部の一例を示す。図6に示す例では、カテゴリ情報記憶部122は、「検索クエリID」、「大分類ID」、「小分類ID」といった項目を有する。
(Category information storage unit 122)
The category information storage unit 122 stores various kinds of information regarding the search query and the category to which the search query belongs. FIG. 6 shows an example of the category information storage unit according to the embodiment. In the example shown in FIG. 6, the category information storage unit 122 has items such as “search query ID”, “large classification ID”, and “small classification ID”.
「検索クエリID」は、ユーザによって入力された検索クエリを識別するための識別情報を示す。「大分類ID」、ユーザによって入力された検索クエリが分類されるカテゴリの大分類を識別するための識別情報を示す。「小分類ID」ユーザによって入力された検索クエリが分類されるカテゴリの小分類を識別するための識別情報を示す。 The “search query ID” indicates identification information for identifying the search query input by the user. “Large category ID” indicates identification information for identifying the major category of the category into which the search query input by the user is classified. “Small category ID” Indicates identification information for identifying the small category of the category into which the search query input by the user is classified.
図6の1レコード目に示す例では、検索クエリID「Q11」で識別される検索クエリ(検索クエリQ11)は、図1に示した検索クエリ「六本木 パスタ」に対応する。 In the example shown in the first record of FIG. 6, the search query (search query Q11) identified by the search query ID “Q11” corresponds to the search query “Roppongi pasta” shown in FIG.
(分類定義記憶部123)
分類定義記憶部123は、検索クエリが分類されるカテゴリの定義に関する各種の情報を記憶する。図7に、実施形態に係る分類定義記憶部の一例を示す。図7に示す例では、分類定義記憶部123は、「大分類ID」、「大分類」、「小分類ID」、「小分類」といった項目を有する。
(Classification definition storage unit 123)
The classification definition storage unit 123 stores various kinds of information regarding the definition of the category into which the search query is classified. FIG. 7 shows an example of the classification definition storage unit according to the embodiment. In the example shown in FIG. 7, the classification definition storage unit 123 has items such as “major classification ID”, “major classification”, “small classification ID”, and “small classification”.
「大分類」は、検索クエリが分類されるカテゴリの大分類を示す。「大分類ID」は、大分類を識別するための識別情報を示す。図7に示す例では、大分類「購買行動系」は、図1の下段に示す例で説明した大分類に対応する。大分類「購買行動系」は、検索クエリをユーザの購買行動に基づいて分類するカテゴリの大分類を示す。図7に示す例では、大分類「購買行動系」は、さらに4つの小分類を有する。大分類ID「CAT1」は、大分類「購買行動系」を識別するための識別情報を示す。 The “major classification” indicates the major classification of the categories into which the search query is classified. The “major classification ID” indicates identification information for identifying the major classification. In the example shown in FIG. 7, the large classification “purchasing behavior type” corresponds to the large classification described in the example shown in the lower part of FIG. The large classification "purchasing behavior system" indicates a large classification of categories into which the search query is classified based on the purchasing behavior of the user. In the example shown in FIG. 7, the large classification “purchasing behavior type” further has four small classifications. The large classification ID “CAT1” indicates identification information for identifying the large classification “purchasing behavior type”.
「小分類」、検索クエリが分類されるカテゴリの小分類を示す。「小分類ID」は、小分類を識別するための識別情報を示す。図7に示す例では、小分類「飲食店を探す」は、大分類「購買行動系」に属する分類であって、小分類に分類される検索クエリが、ユーザによって飲食店を探す意図で入力された検索クエリであることを示す。小分類ID「CAT11」は、小分類「飲食店を探す」を識別するための識別情報を示す。 “Minor classification” indicates a minor classification of the category into which the search query is classified. The “small category ID” indicates identification information for identifying the small category. In the example shown in FIG. 7, the small category “search for restaurants” is a category belonging to the large category “purchasing behavior”, and the search query classified into the small categories is input by the user with the intention of searching for restaurants. Indicates that the search query was performed. The small classification ID “CAT11” indicates identification information for identifying the small classification “search for a restaurant”.
小分類「商品を探す」は、大分類「購買行動系」に属する分類であって、小分類に分類される検索クエリが、ユーザによって商品を探す意図で入力された検索クエリであることを示す。小分類ID「CAT12」は、小分類「商品を探す」を識別するための識別情報を示す。 The small category “search for products” is a category belonging to the large category “purchasing behavior type”, and indicates that the search queries classified into the small categories are search queries input by the user with the intention of searching for products. .. The small classification ID “CAT12” indicates identification information for identifying the small classification “search for products”.
小分類「飲食店を予約」は、大分類「購買行動系」に属する分類であって、小分類に分類される検索クエリが、ユーザによって飲食店を予約する意図で入力された検索クエリであることを示す。小分類ID「CAT13」は、小分類「飲食店を予約」を識別するための識別情報を示す。 The small category “reserve a restaurant” is a category belonging to the large category “purchasing behavior type”, and the search query classified into the small category is a search query input by the user with the intention of reserving a restaurant. Indicates that. The small classification ID “CAT13” indicates identification information for identifying the small classification “reserve a restaurant”.
小分類「商品を購入」は、大分類「購買行動系」に属する分類であって、小分類に分類される検索クエリが、ユーザによって商品を購入する意図で入力された検索クエリであることを示す。小分類ID「CAT14」は、小分類「商品を購入」を識別するための識別情報を示す。 The small category “Purchase goods” is a category belonging to the large category “Purchasing behavior type”, and the search queries classified into the small categories are search queries input by the user with the intention of purchasing the product. Show. The small classification ID “CAT14” indicates identification information for identifying the small classification “purchase a product”.
(モデル情報記憶部124)
モデル情報記憶部124は、情報処理装置100によって生成された学習モデルに関する各種の情報を記憶する。図8に、実施形態に係るモデル情報記憶部の一例を示す。図8に示す例では、モデル情報記憶部124は、「モデルID」、「モデルデータ」といった項目を有する。
(Model information storage unit 124)
The model
「モデルID」は、情報処理装置100によって生成された学習モデルを識別するための識別情報を示す。「モデルデータ」は、情報処理装置100によって生成された学習モデルのモデルデータを示す。例えば、「モデルデータ」には、検索クエリを分散表現に変換するためのデータが格納される。
The “model ID” indicates identification information for identifying the learning model generated by the
図8の1レコード目に示す例では、モデルID「M1」で識別される学習モデルは、第1モデルM1に対応する。また、モデルデータ「MDT1」は、情報処理装置100によって生成された第1モデルM1のモデルデータ(モデルデータMDT1)を示す。なお、第1モデルM1の生成処理の詳細については、後述する。
In the example shown in the first record of FIG. 8, the learning model identified by the model ID “M1” corresponds to the first model M1. The model data “MDT1” indicates the model data (model data MDT1) of the first model M1 generated by the
モデルデータMDT1は、検索クエリが入力される入力層と、出力層と、入力層から出力層までのいずれかの層であって出力層以外の層に属する第1要素と、第1要素と第1要素の重みとに基づいて値が算出される第2要素と、を含み、入力層に入力された検索クエリに応じて、入力層に入力された検索クエリの分散表現を出力層から出力するよう、情報処理装置100を機能させてもよい。
The model data MDT1 includes an input layer to which a search query is input, an output layer, a first element belonging to any layer from the input layer to the output layer and other than the output layer, the first element, and the first element. A second element whose value is calculated based on the weight of one element, and a distributed expression of the search query input to the input layer is output from the output layer according to the search query input to the input layer. Thus, the
ここで、モデルデータMDT1が「y=a1*x1+a2*x2+・・・+ai*xi」で示す回帰モデルで実現されるとする。この場合、モデルデータMDT1が含む第1要素は、x1やx2等といった入力データ(xi)に対応する。また、第1要素の重みは、xiに対応する係数aiに対応する。ここで、回帰モデルは、入力層と出力層とを有する単純パーセプトロンと見做すことができる。各モデルを単純パーセプトロンと見做した場合、第1要素は、入力層が有するいずれかのノードに対応し、第2要素は、出力層が有するノードと見做すことができる。 Here, it is assumed that the model data MDT1 is realized by the regression model represented by “y=a1*x1+a2*x2+...+ai*xi”. In this case, the first element included in the model data MDT1 corresponds to the input data (xi) such as x1 and x2. The weight of the first element corresponds to the coefficient ai corresponding to xi. Here, the regression model can be regarded as a simple perceptron having an input layer and an output layer. When each model is regarded as a simple perceptron, the first element can be regarded as a node included in the input layer, and the second element can be regarded as a node included in the output layer.
また、モデルデータMDT1がDNN(Deep Neural Network)等、1つまたは複数の中間層を有するニューラルネットワークで実現されるとする。この場合、モデルデータMDT1が含む第1要素は、入力層または中間層が有するいずれかのノードに対応する。また、第2要素は、第1要素と対応するノードから値が伝達されるノードである次段のノードに対応する。また、第1要素の重みは、第1要素と対応するノードから第2要素と対応するノードに伝達される値に対して考慮される重みである接続係数に対応する。 Further, it is assumed that the model data MDT1 is realized by a neural network having one or a plurality of intermediate layers such as DNN (Deep Neural Network). In this case, the first element included in the model data MDT1 corresponds to any node included in the input layer or the intermediate layer. The second element corresponds to the node at the next stage, which is the node to which the value is transmitted from the node corresponding to the first element. The weight of the first element corresponds to the connection coefficient, which is a weight considered for the value transmitted from the node corresponding to the first element to the node corresponding to the second element.
情報処理装置100は、上述した回帰モデルやニューラルネットワーク等、任意の構造を有するモデルを用いて、分散表現の算出を行う。具体的には、モデルデータMDT1は、検索クエリが入力された場合に、分散表現を出力するように係数が設定される。情報処理装置100は、このようなモデルデータMDT1を用いて、分散表現を算出する。
The
なお、上記例では、モデルデータMDT1が、検索クエリが入力された場合に、検索クエリの分散表現を出力するモデル(以下、モデルX1という。)である例を示した。しかし、実施形態に係るモデルデータMDT1は、モデルX1にデータの入出力を繰り返すことで得られる結果に基づいて生成されるモデルであってもよい。例えば、モデルデータMDT1は、検索クエリを入力とし、モデルX1が出力する分散表現を出力とするよう学習されたモデル(以下、モデルY1という。)であってもよい。または、モデルデータMDT1は、検索クエリを入力とし、モデルY1の出力値を出力とするよう学習されたモデルであってもよい。 In the above example, the model data MDT1 is the model (hereinafter referred to as model X1) that outputs the distributed expression of the search query when the search query is input. However, the model data MDT1 according to the embodiment may be a model generated based on a result obtained by repeating input/output of data to/from the model X1. For example, the model data MDT1 may be a model (hereinafter, referred to as model Y1) that has been learned so that the search query is input and the distributed expression output by the model X1 is output. Alternatively, the model data MDT1 may be a model learned so that the search query is input and the output value of the model Y1 is output.
また、情報処理装置100がGAN(Generative Adversarial Networks)を用いた推定処理を行う場合、モデルデータMDT1は、GANの一部を構成するモデルであってもよい。
Further, when the
図8の2レコード目に示す例では、モデルID「M2」で識別される学習モデルは、図1に示した第2モデルM2に対応する。また、モデルデータ「MDT2」は、情報処理装置100によって生成された第2モデルM2のモデルデータ(モデルデータMDT2)を示す。なお、第2モデルM2の生成処理の詳細については、後述する。
In the example shown in the second record of FIG. 8, the learning model identified by the model ID “M2” corresponds to the second model M2 shown in FIG. The model data “MDT2” indicates model data (model data MDT2) of the second model M2 generated by the
モデルデータMDT2は、検索クエリが入力される入力層と、出力層と、入力層から出力層までのいずれかの層であって出力層以外の層に属する第1要素と、第1要素と第1要素の重みとに基づいて値が算出される第2要素と、を含み、入力層に入力された検索クエリに応じて、入力層に入力された検索クエリが各カテゴリに属する確率を出力層から出力するよう、情報処理装置100を機能させてもよい。
The model data MDT2 includes an input layer to which a search query is input, an output layer, a first element belonging to any layer from the input layer to the output layer and other than the output layer, the first element, and the first element. A second element whose value is calculated based on the weight of one element; and a probability that the search query input to the input layer belongs to each category according to the search query input to the input layer The
ここで、モデルデータMDT2が「y=a1*x1+a2*x2+・・・+ai*xi」で示す回帰モデルで実現されるとする。この場合、モデルデータMDT2が含む第1要素は、x1やx2等といった入力データ(xi)に対応する。また、第1要素の重みは、xiに対応する係数aiに対応する。ここで、回帰モデルは、入力層と出力層とを有する単純パーセプトロンと見做すことができる。各モデルを単純パーセプトロンと見做した場合、第1要素は、入力層が有するいずれかのノードに対応し、第2要素は、出力層が有するノードと見做すことができる。 Here, it is assumed that the model data MDT2 is realized by the regression model represented by “y=a1*x1+a2*x2+...+ai*xi”. In this case, the first element included in the model data MDT2 corresponds to the input data (xi) such as x1 and x2. The weight of the first element corresponds to the coefficient ai corresponding to xi. Here, the regression model can be regarded as a simple perceptron having an input layer and an output layer. When each model is regarded as a simple perceptron, the first element can be regarded as a node included in the input layer, and the second element can be regarded as a node included in the output layer.
また、モデルデータMDT2がDNN(Deep Neural Network)等、1つまたは複数の中間層を有するニューラルネットワークで実現されるとする。この場合、モデルデータMDT2が含む第1要素は、入力層または中間層が有するいずれかのノードに対応する。また、第2要素は、第1要素と対応するノードから値が伝達されるノードである次段のノードに対応する。また、第1要素の重みは、第1要素と対応するノードから第2要素と対応するノードに伝達される値に対して考慮される重みである接続係数に対応する。 It is also assumed that the model data MDT2 is realized by a neural network having one or a plurality of intermediate layers such as DNN (Deep Neural Network). In this case, the first element included in the model data MDT2 corresponds to any node included in the input layer or the intermediate layer. The second element corresponds to the node at the next stage, which is the node to which the value is transmitted from the node corresponding to the first element. The weight of the first element corresponds to the connection coefficient, which is a weight considered for the value transmitted from the node corresponding to the first element to the node corresponding to the second element.
情報処理装置100は、上述した回帰モデルやニューラルネットワーク等、任意の構造を有するモデルを用いて、検索クエリが各カテゴリに属する確率の算出を行う。具体的には、モデルデータMDT2は、検索クエリが入力された場合に、検索クエリが各カテゴリに属する確率を出力するように係数が設定される。情報処理装置100は、このようなモデルデータMDT2を用いて、検索クエリが各カテゴリに属する確率を算出する。
The
なお、上記例では、モデルデータMDT2が、検索クエリが入力された場合に、検索クエリが各カテゴリに属する確率を出力するモデル(以下、モデルX2という。)である例を示した。しかし、実施形態に係るモデルデータMDT2は、モデルX2にデータの入出力を繰り返すことで得られる結果に基づいて生成されるモデルであってもよい。例えば、モデルデータMDT2は、検索クエリを入力とし、モデルX2が出力する確率を出力とするよう学習されたモデル(以下、モデルY2という。)であってもよい。または、モデルデータMDT2は、検索クエリを入力とし、モデルY2の出力値を出力とするよう学習されたモデルであってもよい。 In the example described above, the model data MDT2 is a model (hereinafter, referred to as model X2) that outputs the probability that the search query belongs to each category when the search query is input. However, the model data MDT2 according to the embodiment may be a model generated based on a result obtained by repeating input/output of data to/from the model X2. For example, the model data MDT2 may be a model (hereinafter, referred to as model Y2) that has been learned so that the search query is input and the probability that the model X2 is output is output. Alternatively, the model data MDT2 may be a model learned so that the search query is input and the output value of the model Y2 is output.
また、情報処理装置100がGAN(Generative Adversarial Networks)を用いた推定処理を行う場合、モデルデータMDT2は、GANの一部を構成するモデルであってもよい。
Further, when the
(経過情報記憶部125)
図9に、実施形態に係る経過情報記憶部の一例を示す。図9に示す例では、経過情報記憶部125は、「文字群」、「経過情報」、「日時」といった項目を有する。
(Progress information storage unit 125)
FIG. 9 shows an example of the progress information storage unit according to the embodiment. In the example shown in FIG. 9, the progress information storage unit 125 has items such as “character group”, “progress information”, and “date and time”.
「文字群」は、第1入力情報に含まれる所定の区切り文字で区切られた文字群を示す。「経過情報」は、第1入力情報に含まれる所定の区切り文字で区切られた文字群毎に対応する予測処理の途中経過に関する情報である経過情報を示す。具体的には、「経過情報」は、第2学習モデルM2の内部状態に関する情報を示す。より具体的には、「経過情報」は、第2学習モデルM2のアクティベーション(activation)に関する情報を示す。例えば、「経過情報」は、第2学習モデルM2を構成する各層(各LSTM層)の中間的な計算結果に関する情報を示す。図1に示す例では、「経過情報」は、第2学習モデルM2を構成する3層のLSTM層の各層(各LSTM層)の中間的な計算結果に関する情報を示す。「日時」は、文字群に対応する経過情報が記憶された日時を示す。 “Character group” indicates a character group separated by a predetermined delimiter included in the first input information. The “progress information” indicates progress information that is information about the progress of the prediction process corresponding to each character group delimited by the predetermined delimiter included in the first input information. Specifically, the “progress information” indicates information regarding the internal state of the second learning model M2. More specifically, the “progress information” indicates information regarding activation of the second learning model M2. For example, the “progress information” indicates information about an intermediate calculation result of each layer (each LSTM layer) forming the second learning model M2. In the example illustrated in FIG. 1, the “progress information” indicates information about an intermediate calculation result of each layer (each LSTM layer) of the three LSTM layers forming the second learning model M2. The “date and time” indicates the date and time when the progress information corresponding to the character group is stored.
図9の1レコード目に示す例では、文字群「六本木□」は、図1に示した文字群「六本木□」に対応する。また、経過情報「CDT11」は、文字群「六本木□」に対応する予測処理の途中経過に関する情報である経過情報を示す。また、日時「日時#11」は、文字群「六本木□」に対応する経過情報「CDT11」が記憶された日時が「日時#11」であることを示す。 In the example shown in the first record of FIG. 9, the character group “Roppongi□” corresponds to the character group “Roppongi□” shown in FIG. In addition, the progress information “CDT11” indicates progress information that is information about the progress of the prediction process corresponding to the character group “Roppongi□”. The date and time “date and time #11” indicates that the date and time when the progress information “CDT11” corresponding to the character group “Roppongi□” is stored is “date and time #11”.
(制御部130)
図3の説明に戻って、制御部130は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、情報処理装置100内部の記憶装置に記憶されている各種プログラム(情報処理プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部130は、コントローラであり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
(Control unit 130)
Returning to the description of FIG. 3, the control unit 130 is a controller, and is stored in a storage device inside the
図3に示すように、制御部130は、取得部131と、抽出部132と、生成部133と、予測部134を有し、以下に説明する情報処理の作用を実現または実行する。なお、制御部130の内部構成は、図3に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。 As illustrated in FIG. 3, the control unit 130 includes an acquisition unit 131, an extraction unit 132, a generation unit 133, and a prediction unit 134, and realizes or executes the operation of information processing described below. Note that the internal configuration of the control unit 130 is not limited to the configuration shown in FIG.
(取得部131)
取得部131は、種々の情報を取得する。具体的には、取得部131は、ユーザによって入力された検索クエリに関する情報を検索サーバ50から取得する。取得部131は、ユーザによって入力された検索クエリに関する情報を取得すると、取得した検索クエリに関する情報をクエリ情報記憶部121に格納する。
(Acquisition unit 131)
The acquisition unit 131 acquires various information. Specifically, the acquisition unit 131 acquires information regarding the search query input by the user from the search server 50. When acquiring the information about the search query input by the user, the acquisition unit 131 stores the acquired information about the search query in the query information storage unit 121.
また、取得部131は、検索クエリと検索クエリが属するカテゴリに関する正解データであるカテゴリ情報を取得する。例えば、取得部131は、情報処理装置100の管理者によってあらかじめ用意されたカテゴリ情報を取得する。取得部131は、カテゴリ情報を取得すると、取得したカテゴリ情報をカテゴリ情報記憶部122に格納する。
The acquisition unit 131 also acquires category information that is correct answer data regarding the search query and the category to which the search query belongs. For example, the acquisition unit 131 acquires category information prepared in advance by the administrator of the
あるいは、取得部131は、検索クエリと検索クエリが属するカテゴリに関する正解データを生成してもよい。具体的には、取得部131は、検索クエリを検索したユーザの検索後の行動に基づいて、検索クエリが属する正解カテゴリを決定する。より具体的には、取得部131は、所定の検索クエリを検索したユーザによる所定の検索クエリの検索後の検索履歴に関する情報を検索サーバ50から取得する。続いて、取得部131は、所定の検索クエリの検索後の検索履歴に関する情報に基づいて、検索後に所定の行動を起こしたユーザの割合を算出する。続いて、取得部131は、所定の検索クエリを検索したユーザに対して、検索後に所定の行動を起こしたユーザの割合が所定の閾値を超える所定の行動を、正解カテゴリに対応する行動として決定する。例えば、検索クエリQ11(「六本木 パスタ」)を検索したユーザが検索後に所定の行動を起こしたユーザの割合として、飲食店を探す行動を起こしたユーザの割合が90%、検索後に商品を探す行動を起こしたユーザの割合が0%、検索後に飲食店を予約する行動を起こしたユーザの割合が10%、検索後に商品を購入する行動を起こしたユーザの割合が0%であったとする。この場合、取得部131は、飲食店を探す行動を起こしたユーザの割合が所定の閾値(例えば、90%)を超えるため、飲食店を探す行動を検索クエリQ11(「六本木 パスタ」)の正解カテゴリに対応する行動として決定する。そして、取得部131は、飲食店を探す行動を正解カテゴリに対応する行動として決定したので、検索クエリQ11(「六本木 パスタ」)が属する正解カテゴリをCAT11(「飲食店を探す」)に決定する。このようにして、取得部131は、検索クエリと検索クエリが属するカテゴリに関する正解データを生成する。そして、取得部131は、生成した正解データを取得する。取得部131は、カテゴリ情報を取得すると、取得したカテゴリ情報をカテゴリ情報記憶部122に格納する。 Alternatively, the acquisition unit 131 may generate correct answer data regarding the search query and the category to which the search query belongs. Specifically, the acquisition unit 131 determines the correct category to which the search query belongs, based on the post-search behavior of the user who searched for the search query. More specifically, the acquisition unit 131 acquires, from the search server 50, information regarding the search history after the search of the predetermined search query by the user who searched for the predetermined search query. Subsequently, the acquisition unit 131 calculates the ratio of users who have performed a predetermined action after the search based on the information regarding the search history after the search of the predetermined search query. Subsequently, the acquisition unit 131 determines, as an action corresponding to the correct answer category, a predetermined action in which the ratio of users who have performed a predetermined action after the search exceeds a predetermined threshold with respect to the user who searched for the predetermined search query. To do. For example, as a ratio of users who searched for the search query Q11 (“Roppongi pasta”) to take a predetermined action after the search, a ratio of users who took action to search for a restaurant was 90%, and to search for a product after the search. It is assumed that the percentage of users who have caused a search is 0%, the percentage of users who have made an action to reserve a restaurant after the search is 10%, and the percentage of users who have made an action to purchase a product after the search is 0%. In this case, since the ratio of the users who have taken the action to search for the restaurant exceeds the predetermined threshold value (for example, 90%), the acquisition unit 131 searches for the action to search for the restaurant in the correct answer of the search query Q11 (“Roppongi pasta”). Determined as the action corresponding to the category. Since the acquisition unit 131 has determined the action of searching for a restaurant as the action corresponding to the correct category, the acquisition unit 131 determines that the correct category to which the search query Q11 (“Roppongi pasta”) belongs is CAT11 (“Search for a restaurant”). .. In this way, the acquisition unit 131 generates correct answer data regarding the search query and the category to which the search query belongs. Then, the acquisition unit 131 acquires the generated correct answer data. When acquiring the category information, the acquisition unit 131 stores the acquired category information in the category information storage unit 122.
また、取得部131は、検索クエリと検索クエリが属するカテゴリの分類を定義する分類定義情報を取得する。例えば、取得部131は、情報処理装置100の管理者によってあらかじめ用意された分類定義情報を取得する。取得部131は、分類定義情報を取得すると、取得した分類定義情報を分類定義記憶部123に格納する。
The acquisition unit 131 also acquires classification definition information that defines the classification of the search query and the category to which the search query belongs. For example, the acquisition unit 131 acquires the classification definition information prepared in advance by the administrator of the
また、取得部131は、生成部133によって生成された第1学習モデル(モデルデータMDT1)を取得する。具体的には、取得部131は、モデル情報記憶部124を参照して、生成部133によって生成された第1学習モデルを取得する。
The acquisition unit 131 also acquires the first learning model (model data MDT1) generated by the generation unit 133. Specifically, the acquisition unit 131 acquires the first learning model generated by the generation unit 133 with reference to the model
また、取得部131は、生成部133によって生成された第2学習モデル(モデルデータMDT2)を取得する。具体的には、取得部131は、モデル情報記憶部124を参照して、生成部133によって生成された第2学習モデルを取得する。
The acquisition unit 131 also acquires the second learning model (model data MDT2) generated by the generation unit 133. Specifically, the acquisition unit 131 refers to the model
また、取得部131は、予測部134が第2入力情報から第2入力情報の特徴を示す第2特徴情報を予測する予測処理に用いる情報として、予測部134による第1特徴情報の予測処理の途中経過に関する情報である経過情報を取得する。具体的には、取得部131は、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして、複数の検索クエリが有する特徴を学習した学習モデルの内部状態に関する情報である経過情報を取得する。より具体的には、取得部131は、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして、複数の検索クエリが有する特徴を学習した学習モデルのアクティベーション(activation)に関する情報を取得する。取得部131は、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして、複数の検索クエリが有する特徴を学習した学習モデルを構成する各層(各LSTM層)の中間的な計算結果に関する情報を取得する。図1に示す例では、取得部131は、第2学習モデルM2を構成する3層のLSTM層の各層(各LSTM層)の中間的な計算結果に関する情報を取得する。例えば、取得部131は、第1検索クエリ「六本木 パスタ」が所定の区切り文字であるスペース(以下、スペースを適宜記号「□」で記載する。)を含むか否かを判定する。続いて、取得部131は、第1検索クエリ「六本木 パスタ」が所定の区切り文字であるスペースを含むと判定すると、地名を示す「六本木」と区切り文字であるスペースからなる文字群「六本木□」に対応する経過情報を取得する。具体的には、取得部131は、文字群「六本木□」に対応する経過情報として、処理ステップ「ステップ4」における第2学習モデルM2の内部状態に関する情報を取得する。より具体的には、取得部131は、文字群「六本木□」に対応する経過情報として、処理ステップ「ステップ4」における第2学習モデルM2のアクティベーション(activation)に関する情報を取得する。すなわち、取得部131は、処理ステップ「ステップ4」における第2学習モデルM2を構成する各層の中間的な計算結果に関する情報を取得する。図1に示す例では、取得部131は、処理ステップ「ステップ4」における第2学習モデルM2を構成する3層のLSTM層の各層(各LSTM層)の中間的な計算結果であるベクトル(例えば、2048次元のベクトル)の値を3セット分(3層分)取得する。続いて、取得部131は、経過情報を取得すると、取得した経過情報を経過情報記憶部125に記憶する。 Further, the acquisition unit 131 uses, as the information used by the prediction unit 134 in the prediction process of predicting the second feature information indicating the feature of the second input information from the second input information, the prediction process of the first feature information by the prediction unit 134. Acquire progress information that is information about the progress. Specifically, the acquisition unit 131 determines that the plurality of search queries input by the same user within a predetermined time period have similar features, and the internal state of the learning model that has learned the features of the plurality of search queries. Acquires the progress information that is the information about. More specifically, the acquisition unit 131 determines that a plurality of search queries input by the same user within a predetermined time period have similar features, and that the learning model has learned the features of the plurality of search queries. Get information about activation. The acquisition unit 131 regards each layer (each LSTM layer) that configures a learning model in which the characteristics of a plurality of search queries are learned, as a plurality of search queries input by the same user within a predetermined time have similar characteristics. ) To obtain information about intermediate calculation results. In the example illustrated in FIG. 1, the acquisition unit 131 acquires information regarding an intermediate calculation result of each layer (each LSTM layer) of the three LSTM layers forming the second learning model M2. For example, the acquisition unit 131 determines whether or not the first search query “Roppongi pasta” includes a space that is a predetermined delimiter (hereinafter, the space is appropriately described by a symbol “□”). Subsequently, when the acquisition unit 131 determines that the first search query “Roppongi pasta” includes a space that is a predetermined delimiter, the character group “Roppongi□” that includes the place name “Roppongi” and the delimiter space. Get the progress information corresponding to. Specifically, the acquisition unit 131 acquires information regarding the internal state of the second learning model M2 in the processing step “step 4” as the progress information corresponding to the character group “Roppongi□”. More specifically, the acquisition unit 131 acquires information regarding activation of the second learning model M2 in the processing step “step 4” as the progress information corresponding to the character group “Roppongi □”. That is, the acquisition unit 131 acquires information regarding the intermediate calculation result of each layer forming the second learning model M2 in the processing step “step 4”. In the example illustrated in FIG. 1, the acquisition unit 131 uses a vector (for example, an intermediate calculation result of each layer (each LSTM layer) of the three LSTM layers forming the second learning model M2 in the processing step “step 4” (for example, , 2048-dimensional vector) values for three sets (three layers) are acquired. Subsequently, when acquiring the progress information, the acquisition unit 131 stores the acquired progress information in the progress information storage unit 125.
また、取得部131は、スペース等の所定の区切り文字に限られず、検索クエリをどこで区切り、第2学習モデルM2の内部状態に関する情報をどのような単位で取得してもよい。具体的には、取得部131は、第1検索クエリが一定のルール(又は一定の手順)で区分できるか否かを判定する。例えば、取得部131は、形態素解析を用いて第1検索クエリが区分できるか否かを判定する。また、例えば、取得部131は、BPE(Byte pair encoding)を用いて第1検索クエリが区分できるか否かを判定する。続いて、取得部131は、第1検索クエリが一定のルール(又は一定の手順)で区分できると判定した場合、第1検索クエリを一定のルール(又は一定の手順)で区分した単位ごとに第2学習モデルM2の内部状態に関する情報を取得する。例えば、取得部131は、形態素解析を用いて第1検索クエリを区分できると判定した場合、形態素解析を用いて第1検索クエリを区分した単位ごとに第2学習モデルM2の内部状態に関する情報を取得する。また、例えば、取得部131は、BPEを用いて第1検索クエリを区分できると判定した場合、BPEを用いて第1検索クエリを区分した単位ごとに第2学習モデルM2の内部状態に関する情報を取得する。続いて、取得部131は、第2学習モデルM2の内部状態に関する情報を取得すると、取得した第2学習モデルM2の内部状態に関する情報を文字群と対応付けて経過情報記憶部125に記憶する。 Further, the acquisition unit 131 is not limited to a predetermined delimiter such as a space, and may delimit a search query anywhere and acquire information regarding the internal state of the second learning model M2 in any unit. Specifically, the acquisition unit 131 determines whether the first search query can be classified according to a certain rule (or a certain procedure). For example, the acquisition unit 131 determines whether or not the first search query can be classified using morphological analysis. In addition, for example, the acquisition unit 131 determines whether the first search query can be classified using BPE (Byte pair encoding). Subsequently, when the acquisition unit 131 determines that the first search query can be classified by a certain rule (or a certain procedure), the acquisition unit 131 divides the first search query by a unit by a certain rule (or a certain procedure). Information about the internal state of the second learning model M2 is acquired. For example, when the acquisition unit 131 determines that the first search query can be classified using morphological analysis, the acquisition unit 131 obtains information about the internal state of the second learning model M2 for each unit in which the first search query is classified using morphological analysis. get. In addition, for example, when the acquisition unit 131 determines that the first search query can be classified using the BPE, the acquisition unit 131 obtains information regarding the internal state of the second learning model M2 for each unit in which the first search query is classified using the BPE. get. Subsequently, when acquiring the information regarding the internal state of the second learning model M2, the acquisition unit 131 stores the acquired information regarding the internal state of the second learning model M2 in the progress information storage unit 125 in association with the character group.
取得部131は、処理単位毎の情報である単位情報を複数含む第1入力情報に含まれる単位情報が、予測部134によって順次処理されることにより行われる予測処理の経過情報を取得する。より具体的には、取得部131は、単位情報を複数含む第1入力情報に含まれる所定の単位情報で区切られた単位情報群毎に経過情報を取得する。例えば、取得部131は、複数の文字を含む第1検索クエリに含まれる所定の区切り文字で区切られた文字群毎に第1検索クエリのカテゴリを予測する予測処理の途中経過に関する情報である経過情報を取得する。続いて、取得部131は、経過情報を取得すると、取得した経過情報を文字群と対応付けて経過情報記憶部125に記憶する。 The acquisition unit 131 acquires the progress information of the prediction process performed by sequentially processing the unit information included in the first input information including a plurality of unit information that is information for each processing unit by the prediction unit 134. More specifically, the acquisition unit 131 acquires the progress information for each unit information group divided by the predetermined unit information included in the first input information including a plurality of unit information. For example, the acquisition unit 131 is information about the progress of the prediction process for predicting the category of the first search query for each character group separated by a predetermined delimiter included in the first search query including a plurality of characters. Get information. Subsequently, when acquiring the progress information, the acquisition unit 131 stores the acquired progress information in the progress information storage unit 125 in association with the character group.
また、取得部131は、第1入力情報に含まれる所定数の単位情報毎に経過情報を取得する。例えば、取得部131は、単位情報である文字を含む第1入力情報に含まれる所定数の文字毎に第1特徴情報の予測処理の途中経過に関する情報を取得する。例えば、取得部131は、複数の文字を含む第1検索クエリに含まれる文字毎に第1検索クエリのカテゴリを予測する予測処理の途中経過に関する情報である経過情報を取得する。続いて、取得部131は、経過情報を取得すると、取得した経過情報を文字と対応付けて経過情報記憶部125に記憶する。 In addition, the acquisition unit 131 acquires the progress information for each predetermined number of unit information included in the first input information. For example, the acquisition unit 131 acquires information about the progress of the prediction process of the first characteristic information for each predetermined number of characters included in the first input information including the character that is the unit information. For example, the acquisition unit 131 acquires progress information that is information about the progress of the prediction process of predicting the category of the first search query for each character included in the first search query that includes a plurality of characters. Subsequently, when acquiring the progress information, the acquisition unit 131 stores the acquired progress information in the progress information storage unit 125 in association with the character.
(抽出部132)
抽出部132は、種々の情報を抽出する。具体的には、抽出部132は、取得部131によって取得された検索クエリのうち、同一のユーザによって所定の時間内に入力された複数の検索クエリを抽出する。例えば、抽出部132は、同一のユーザによって各検索クエリが入力された時間の間隔が所定の時間内である複数の検索クエリを抽出する。続いて、抽出部132は、同一のユーザによって所定の時間内に入力された複数の検索クエリのうち、同一のユーザによって所定の時間内に連続して入力された一対の検索クエリを抽出する。例えば、抽出部132は、同一のユーザによって各検索クエリのペアが入力された時間の間隔が所定の時間内である複数の検索クエリを抽出する。例えば、抽出部132は、取得部131によって取得された検索クエリのうち、同一のユーザU1によって所定の時間内に連続して入力された4個の検索クエリである検索クエリQ11(「六本木 パスタ」)、検索クエリQ12(「六本木 イタリアン」)、検索クエリQ13(「赤坂 パスタ」)、検索クエリQ14(「麻布 パスタ」)を抽出する。抽出部132は、検索クエリが入力された順番に並べると、検索クエリQ11、検索クエリQ12、検索クエリQ13、検索クエリQ14の順番で入力された4個の検索クエリを抽出する。続いて、抽出部132は、4個の検索クエリを抽出すると、時系列的に隣り合う2つの検索クエリを一対の検索クエリとして、3対の検索クエリのペアである(検索クエリQ11、検索クエリQ12)、(検索クエリQ12、検索クエリQ13)、(検索クエリQ13、検索クエリQ14)を抽出する。なお、抽出部132は、同一のユーザによって全ての検索クエリが所定の時間内に入力された複数の検索クエリを抽出してもよい。そして、抽出部132は、時系列的に隣り合うか否かに関わらず、抽出した複数の検索クエリの中から2つの検索クエリを選択して、選択した2つの検索クエリを一対の検索クエリとして抽出してもよい。
(Extractor 132)
The extraction unit 132 extracts various information. Specifically, the extraction unit 132 extracts, from the search queries acquired by the acquisition unit 131, a plurality of search queries input by the same user within a predetermined time. For example, the extraction unit 132 extracts a plurality of search queries in which the time intervals at which each search query is input by the same user are within a predetermined time. Subsequently, the extraction unit 132 extracts a pair of search queries continuously input by the same user within a predetermined time from among a plurality of search queries input by the same user within a predetermined time. For example, the extraction unit 132 extracts a plurality of search queries in which a time interval in which each search query pair is input by the same user is within a predetermined time. For example, the extraction unit 132, among the search queries acquired by the acquisition unit 131, a search query Q11 (“Roppongi pasta”) that is four search queries continuously input by the same user U1 within a predetermined time. ), search query Q12 (“Roppongi Italian”), search query Q13 (“Akasaka pasta”), and search query Q14 (“Azabu pasta”). After arranging the search queries in the input order, the extraction unit 132 extracts the four search queries input in the order of the search query Q11, the search query Q12, the search query Q13, and the search query Q14. Subsequently, when the four search queries are extracted, the extraction unit 132 regards two search queries that are adjacent in time series as a pair of search queries and is a pair of three search queries (search query Q11, search query). Q12), (search query Q12, search query Q13), and (search query Q13, search query Q14) are extracted. Note that the extraction unit 132 may extract a plurality of search queries in which all search queries have been input by the same user within a predetermined time. Then, the extraction unit 132 selects two search queries from the plurality of extracted search queries, regardless of whether they are adjacent in time series, and sets the selected two search queries as a pair of search queries. You may extract.
また、抽出部132は、取得部131によって取得された検索クエリのうち、所定の検索クエリと所定の検索クエリに無関係な他の検索クエリとを抽出する。例えば、抽出部132は、取得部131によって取得された検索クエリの中から、所定の検索クエリを抽出する。続いて、抽出部132は、取得部131によって取得された検索クエリの中から、所定の検索クエリとは無関係にランダムに他の検索クエリを抽出する。 In addition, the extraction unit 132 extracts a predetermined search query and other search queries unrelated to the predetermined search query from the search queries acquired by the acquisition unit 131. For example, the extraction unit 132 extracts a predetermined search query from the search queries acquired by the acquisition unit 131. Subsequently, the extraction unit 132 randomly extracts another search query from the search queries acquired by the acquisition unit 131, regardless of the predetermined search query.
(生成部133)
生成部133は、種々の情報を生成する。具体的には、生成部133は、取得部131によって取得された検索クエリのうち、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして学習することで、所定の検索クエリから所定の検索クエリの特徴情報を予測する学習モデルを生成する。具体的には、生成部133は、同一のユーザによって所定の時間内に入力された複数の検索クエリの分散表現が類似するように学習モデルを学習させることで、所定の検索クエリから所定の検索クエリの特徴情報を予測する学習モデルを生成する。例えば、生成部133は、所定の時間内に続けて入力された一対の検索クエリの分散表現が類似するように学習することで、学習モデルを生成する。例えば、生成部133は、一対の検索クエリの学習前の分散表現(ベクトル)の類似度の値を算出する。また、生成部133は、一対の検索クエリの学習後の分散表現(ベクトル)の類似度の値を算出する。続いて、生成部133は、学習前の分散表現(ベクトル)の類似度の値よりも、学習後の分散表現(ベクトル)の類似度の値が大きくなるように学習モデルを学習させる。このように、生成部133は、一対の検索クエリに対応する一対の分散表現である2つのベクトルが分散表現空間上で類似するように学習モデルを学習させることで、検索クエリから分散表現(ベクトル)を出力する学習モデルを生成する。より具体的には、生成部133は、RNNの一種であるLSTMを分散表現生成に用いたDSSMの技術を用いて、検索クエリから分散表現(ベクトル)を出力する学習モデルを生成する。例えば、生成部133は、学習モデルの正解データとして、同一のユーザによって所定の時間内に入力された一対の検索クエリが類似する特徴を有するものとして、所定の検索クエリの分散表現(ベクトル)と、所定の検索クエリと対となる他の検索クエリの分散表現(ベクトル)とが、分散表現空間上で近くに存在するように学習する。また、生成部133は、第1学習モデルを生成すると、第1学習モデルを識別する識別情報と対応付けて、生成した第1学習モデル(モデルデータMDT1)をモデル情報記憶部124に格納する。
(Generator 133)
The generation unit 133 generates various information. Specifically, the generation unit 133 learns that among the search queries acquired by the acquisition unit 131, a plurality of search queries input by the same user within a predetermined time have similar characteristics. , A learning model for predicting the characteristic information of the predetermined search query from the predetermined search query is generated. Specifically, the generation unit 133 learns the learning model such that the distributed expressions of the plurality of search queries input by the same user within a predetermined time are similar to each other, thereby performing a predetermined search from the predetermined search query. A learning model for predicting query feature information is generated. For example, the generation unit 133 generates a learning model by learning so that the distributed expressions of a pair of search queries that are continuously input within a predetermined time period are similar to each other. For example, the generation unit 133 calculates the value of the similarity of the distributed expression (vector) before learning of the pair of search queries. The generation unit 133 also calculates the value of the similarity of the distributed representation (vector) after learning of the pair of search queries. Subsequently, the generation unit 133 trains the learning model such that the similarity value of the distributed expression (vector) after learning is larger than the similarity value of the distributed expression (vector) before learning. In this way, the generation unit 133 trains the learning model such that the two vectors, which are a pair of distributed expressions corresponding to the pair of search queries, are similar in the distributed expression space, and thus the distributed expression (vector ) Is output to generate a learning model. More specifically, the generation unit 133 generates a learning model that outputs a distributed expression (vector) from a search query using the DSSM technique that uses LSTM, which is a type of RNN, for distributed expression generation. For example, the generation unit 133 determines that, as correct answer data of the learning model, a pair of search queries input by the same user within a predetermined time have similar characteristics and a distributed expression (vector) of the predetermined search query. , A predetermined search query and a distributed expression (vector) of another search query paired with each other are learned so as to exist close to each other in the distributed expression space. Further, when the generation unit 133 generates the first learning model, the generation unit 133 stores the generated first learning model (model data MDT1) in the model
〔第1学習モデルの生成処理の一例〕
ここで、図10を用いて、第1学習モデルの生成処理の流れについて説明する。図10は、実施形態に係る第1学習モデルの生成処理の一例を示す図である。図10に示す例では、抽出部132は、同一のユーザU1によって所定の時間内に連続して入力された「六本木 パスタ」という検索クエリQ11と「六本木 イタリアン」という検索クエリQ12とから成る一対の検索クエリを抽出する(ステップS11)。
[Example of Generation Processing of First Learning Model]
Here, the flow of the generation process of the first learning model will be described with reference to FIG. 10. FIG. 10 is a diagram illustrating an example of the first learning model generation process according to the embodiment. In the example illustrated in FIG. 10, the extraction unit 132 includes a pair of search queries Q11 “Roppongi pasta” and a search query Q12 “Roppongi Italian” that are continuously input by the same user U1 within a predetermined time. A search query is extracted (step S11).
続いて、生成部133は、抽出部132によって抽出された検索クエリQ11を第1モデルM1に入力して、検索クエリQ11の分散表現であるベクトルBQV11を第1モデルM1から出力する。ここで、ベクトルBQV11は、第1モデルM1の出力層から出力されたばかりの検索クエリQ11の分散表現であって、第1モデルM1にフィードバックをかける前(学習前)の分散表現を示す。また、生成部133は、抽出部132によって抽出された検索クエリQ12を第1モデルM1に入力して、検索クエリQ12の分散表現であるベクトルBQV12を第1モデルM1から出力する。ここで、ベクトルBQV12は、第1モデルM1の出力層から出力されたばかりの検索クエリQ12の分散表現であって、第1モデルM1にフィードバックをかける前(学習前)の分散表現を示す。このようにして、生成部133は、検索クエリQ11の分散表現であるベクトルBQV11と、検索クエリQ12の分散表現であるベクトルBQV12とを出力する(ステップS12)。 Subsequently, the generation unit 133 inputs the search query Q11 extracted by the extraction unit 132 into the first model M1, and outputs the vector BQV11, which is a distributed expression of the search query Q11, from the first model M1. Here, the vector BQV11 is a distributed expression of the search query Q11 just output from the output layer of the first model M1, and represents a distributed expression before feedback is given to the first model M1 (before learning). Further, the generation unit 133 inputs the search query Q12 extracted by the extraction unit 132 into the first model M1, and outputs the vector BQV12, which is a distributed expression of the search query Q12, from the first model M1. Here, the vector BQV12 is a distributed expression of the search query Q12 just output from the output layer of the first model M1, and represents a distributed expression before feedback is applied to the first model M1 (before learning). In this way, the generation unit 133 outputs the vector BQV11 that is the distributed expression of the search query Q11 and the vector BQV12 that is the distributed expression of the search query Q12 (step S12).
続いて、生成部133は、同一のユーザU1によって所定の時間内に連続して入力された検索クエリQ11(「六本木 パスタ」)と検索クエリQ12(「六本木 イタリアン」)とから成る一対の検索クエリは、所定の検索意図(例えば、「ある場所で飲食店を探す」という検索意図)で入力された検索クエリであると推定されるため、相互に類似する特徴を有するものとして、検索クエリQ11の分散表現(ベクトルQV11)と、検索クエリQ11と対となる検索クエリQ12の分散表現(ベクトルQV12)とが、類似するように第1モデルM1を学習させる。例えば、第1モデルM1にフィードバックをかける前(学習前)の検索クエリQ11の分散表現であるベクトルBQV11と検索クエリQ12の分散表現であるベクトルBQV12とのなす角度の大きさをΘとする。また、第1モデルM1にフィードバックをかけた後(学習後)の検索クエリQ11の分散表現であるベクトルQV11と検索クエリQ12の分散表現であるベクトルQV12とのなす角度の大きさをΦとする。この時、生成部133は、ΘよりもΦが小さくなるように、第1モデルM1を学習させる。例えば、生成部133は、ベクトルBQV11とベクトルBQV12のコサイン類似度の値を算出する。また、生成部133は、ベクトルQV11とベクトルQV12のコサイン類似度の値を算出する。続いて、生成部133は、ベクトルBQV11とベクトルBQV12のコサイン類似度の値よりも、ベクトルQV11とベクトルQV12のコサイン類似度の値が大きくなるように(値が1に近づくように)第1モデルM1を学習させる。このように、生成部133は、一対の検索クエリに対応する一対の分散表現である2つのベクトルが類似するように第1モデルM1を学習させることで、検索クエリから分散表現(ベクトル)を出力する第1モデルM1を生成する(ステップS13)。なお、生成部133は、コサイン類似度に限らず、ベクトル間の距離尺度として適用可能な指標であれば、どのような指標に基づいて分散表現(ベクトル)の間の類似度を算出してもよい。また、生成部133は、ベクトル間の距離尺度として適用可能な指標であれば、どのような指標に基づいて第1モデルM1を学習させてもよい。例えば、生成部133は、分散表現(ベクトル)同士のユークリッド距離や双曲空間等の非ユークリッド空間中での距離、マンハッタン距離、マハラノビス距離等といった所定の距離関数の値を算出する。続いて、生成部133は、分散表現(ベクトル)同士の所定の距離関数の値(すなわち、分散表現空間における距離)が小さくなるように第1モデルM1を学習させてもよい。 Subsequently, the generation unit 133 includes a pair of search queries including a search query Q11 (“Roppongi pasta”) and a search query Q12 (“Roppongi Italian”) that are continuously input by the same user U1 within a predetermined time. Is presumed to be a search query input with a predetermined search intent (for example, a search intent of “searching for a restaurant at a certain place”), so that it is assumed that the search queries Q11 have similar features to each other. The first model M1 is trained so that the distributed expression (vector QV11) and the distributed expression (vector QV12) of the search query Q12 paired with the search query Q11 are similar. For example, the magnitude of the angle between the vector BQV11, which is the distributed expression of the search query Q11 before feedback (before learning) to the first model M1, and the vector BQV12, which is the distributed expression of the search query Q12, is Θ. Further, the size of the angle formed by the vector QV11, which is the distributed expression of the search query Q11 after feedback is applied to the first model M1 (after learning), and the vector QV12, which is the distributed expression of the search query Q12, is Φ. At this time, the generation unit 133 trains the first model M1 so that Φ becomes smaller than Θ. For example, the generation unit 133 calculates the value of the cosine similarity between the vector BQV11 and the vector BQV12. Further, the generation unit 133 calculates the value of the cosine similarity between the vector QV11 and the vector QV12. Next, the generation unit 133 causes the first model so that the value of the cosine similarity between the vectors QV11 and QV12 is larger than the value of the cosine similarity between the vectors BQV11 and BQV12 (so that the value approaches 1). Train M1. In this way, the generation unit 133 outputs the distributed expression (vector) from the search query by learning the first model M1 so that the two vectors, which are the pair of distributed expressions corresponding to the pair of search queries, are similar. The first model M1 to be generated is generated (step S13). The generation unit 133 is not limited to the cosine similarity and may calculate the similarity between the distributed expressions (vectors) based on any index as long as it is an index applicable as a distance measure between vectors. Good. Further, the generation unit 133 may train the first model M1 based on any index as long as it is an index applicable as a distance measure between vectors. For example, the generation unit 133 calculates a value of a predetermined distance function such as a Euclidean distance between distributed expressions (vectors), a distance in a non-Euclidean space such as a hyperbolic space, a Manhattan distance, a Mahalanobis distance, or the like. Subsequently, the generation unit 133 may train the first model M1 so that the value of the predetermined distance function between the distributed expressions (vectors) (that is, the distance in the distributed expression space) becomes small.
次に、図11を用いて、第1学習モデルの生成処理の流れについてより詳しく説明する。なお、図11の説明では、図10の説明と重複する部分は、適宜省略する。図11は、実施形態に係る第1学習モデルの生成処理を示す図である。図11に示す例では、情報処理装置100が生成した第1モデルM1によって出力された分散表現(ベクトル)が分散表現空間にマッピングされる様子が示されている。情報処理装置100は、所定の検索クエリの分散表現と所定の検索クエリと対となる他の検索クエリの分散表現とが分散表現空間上で近くにマッピングされるように第1モデルM1のトレーニングを行う。
Next, the flow of the generation process of the first learning model will be described in more detail with reference to FIG. Note that in the description of FIG. 11, parts that overlap with the description of FIG. 10 are omitted as appropriate. FIG. 11 is a diagram showing a generation process of the first learning model according to the embodiment. The example illustrated in FIG. 11 illustrates a state in which the distributed representation (vector) output by the first model M1 generated by the
図11の上段に示す例では、抽出部132は、同一のユーザU1によって所定の時間内に連続して入力された4個の検索クエリである検索クエリQ11(「六本木 パスタ」)、検索クエリQ12(「六本木 イタリアン」)、検索クエリQ13(「赤坂 パスタ」)、検索クエリQ14(「麻布 パスタ」)を抽出する。抽出部132は、同一のユーザU1によって各検索クエリが入力された時間の間隔が所定の時間内である4個の検索クエリを抽出する。抽出部132は、同一のユーザU1によって後述する各検索クエリのペアが入力された時間の間隔が所定の時間内である複数の検索クエリを抽出する。抽出部132は、検索クエリが入力された順番に並べると、検索クエリQ11、検索クエリQ12、検索クエリQ13、検索クエリQ14の順番で入力された4個の検索クエリを抽出する。抽出部132は、4個の検索クエリを抽出すると、時系列的に隣り合う2つの検索クエリを一対の検索クエリとして、3対の検索クエリのペアである(検索クエリQ11、検索クエリQ12)、(検索クエリQ12、検索クエリQ13)、(検索クエリQ13、検索クエリQ14)を抽出する(ステップS21−1)。なお、抽出部132は、同一のユーザU1によって全ての検索クエリが所定の時間内に入力された複数の検索クエリを抽出してもよい。そして、抽出部132は、時系列的に隣り合うか否かに関わらず、抽出した複数の検索クエリの中から2つの検索クエリを選択して、選択した2つの検索クエリを一対の検索クエリとして抽出してもよい。 In the example illustrated in the upper part of FIG. 11, the extraction unit 132 uses the search query Q11 (“Roppongi pasta”), which is four search queries continuously input by the same user U1 within a predetermined time, and the search query Q12. (“Roppongi Italian”), search query Q13 (“Akasaka pasta”), and search query Q14 (“Azabu pasta”) are extracted. The extraction unit 132 extracts four search queries whose time intervals at which each search query is input by the same user U1 are within a predetermined time. The extraction unit 132 extracts a plurality of search queries in which the same user U1 inputs a pair of search queries to be described later and the time interval is within a predetermined time. After arranging the search queries in the input order, the extraction unit 132 extracts the four search queries input in the order of the search query Q11, the search query Q12, the search query Q13, and the search query Q14. When the four search queries are extracted, the extraction unit 132 defines two search queries that are adjacent in time series as a pair of search queries, and is a pair of three search queries (search query Q11, search query Q12). (Search query Q12, search query Q13) and (search query Q13, search query Q14) are extracted (step S21-1). The extraction unit 132 may extract a plurality of search queries in which all the search queries have been input by the same user U1 within a predetermined time. Then, the extraction unit 132 selects two search queries from the plurality of extracted search queries regardless of whether or not they are adjacent in time series, and sets the selected two search queries as a pair of search queries. You may extract.
続いて、生成部133は、抽出部132によって抽出された検索クエリQ1k(k=1、2、3、4)を第1モデルM1に入力して、検索クエリQ1k(k=1、2、3、4)の分散表現であるベクトルBQV1k(k=1、2、3、4)を第1モデルM1から出力する。ここで、ベクトルBQV1k(k=1、2、3、4)は、第1モデルM1の出力層から出力されたばかりの検索クエリQ1k(k=1、2、3、4)の分散表現であって、第1モデルM1にフィードバックをかける前(学習前)の分散表現を示す(ステップS22−1)。 Subsequently, the generation unit 133 inputs the search query Q1k (k=1, 2, 3, 4) extracted by the extraction unit 132 into the first model M1, and the search query Q1k (k=1, 2, 3). 4) which is a distributed representation of the vector BQV1k (k=1, 2, 3, 4) is output from the first model M1. Here, the vector BQV1k (k=1, 2, 3, 4) is a distributed representation of the search query Q1k (k=1, 2, 3, 4) just output from the output layer of the first model M1. , A distributed expression before feedback is given to the first model M1 (before learning) (step S22-1).
続いて、生成部133は、同一のユーザU1によって所定の時間内に連続して入力された一対の検索クエリは、所定の検索意図(例えば、「ある場所(東京都港区付近)で飲食店を探す」という検索意図)で入力された検索クエリであると推定されるため、相互に類似する特徴を有するものとして、検索クエリQ11の分散表現(ベクトルQV11)と、検索クエリQ11と対となる検索クエリQ12の分散表現(ベクトルQV12)とが、類似するように第1モデルM1を学習させる。また、生成部133は、検索クエリQ12の分散表現(ベクトルQV12)と、検索クエリQ12と対となる検索クエリQ13の分散表現(ベクトルQV13)とが、類似するように第1モデルM1を学習させる。また、生成部133は、検索クエリQ13の分散表現(ベクトルQV13)と、検索クエリQ13と対となる検索クエリQ14の分散表現(ベクトルQV14)とが、類似するように第1モデルM1を学習させる。このように、生成部133は、一対の検索クエリに対応する一対の分散表現である2つのベクトルが類似するように第1モデルM1を学習させることで、検索クエリから分散表現(ベクトル)を出力する第1モデルM1を生成する(ステップS23−1)。 Subsequently, the generation unit 133 determines that a pair of search queries continuously input by the same user U1 within a predetermined time period has a predetermined search intention (for example, “a place (in the vicinity of Minato-ku, Tokyo) at a restaurant). It is presumed that the search queries have been input according to the search intention of "searching for". Therefore, the search query Q11 is paired with the distributed expression (vector QV11) of the search query Q11 as having similar features. The first model M1 is trained so that the distributed expression (vector QV12) of the search query Q12 is similar. Further, the generation unit 133 trains the first model M1 so that the distributed expression (vector QV12) of the search query Q12 and the distributed expression of the search query Q13 (vector QV13) paired with the search query Q12 are similar. .. Further, the generation unit 133 trains the first model M1 so that the distributed expression (vector QV13) of the search query Q13 and the distributed expression (vector QV14) of the search query Q14 paired with the search query Q13 are similar. .. In this way, the generation unit 133 outputs the distributed expression (vector) from the search query by learning the first model M1 so that the two vectors, which are the pair of distributed expressions corresponding to the pair of search queries, are similar. The 1st model M1 which does is generated (step S23-1).
図11の上段に示す情報処理の結果として、検索クエリQ1k(k=1、2、3、4)の分散表現であるベクトルQV1k(k=1、2、3、4)が分散表現空間の近い位置にクラスタCL11としてマッピングされる様子が示されている。例えば、検索クエリQ1k(k=1、2、3、4)は、ユーザU1によって「ある場所(東京都港区付近)で飲食店を探す」という検索意図の下で検索された検索クエリの集合であると推定される。すなわち、検索クエリQ1k(k=1、2、3、4)は、「ある場所(東京都港区付近)で飲食店を探す」という検索意図の下で検索された検索クエリであるという点で、相互に類似する特徴を有する検索クエリであると推定される。ここで、情報処理装置100は、「ある場所(東京都港区付近)で飲食店を探す」という検索意図で入力された所定の検索クエリが第1モデルに入力されると、クラスタCL11の位置にマッピングされるような分散表現を出力することができる。これにより、例えば、情報処理装置100は、クラスタCL11の位置にマッピングされる分散表現に対応する検索クエリを抽出することにより、「ある場所(東京都港区付近)で飲食店を探す」という検索意図に応じた検索クエリを抽出することができる。したがって、情報処理装置100は、検索クエリの意味を適切に解釈可能とすることができる。
As a result of the information processing shown in the upper part of FIG. 11, the vector QV1k (k=1, 2, 3, 4), which is the distributed expression of the search query Q1k (k=1, 2, 3, 4), is close to the distributed expression space. It is shown that the position is mapped as the cluster CL11. For example, the search query Q1k (k=1, 2, 3, 4) is a set of search queries searched by the user U1 under the search intention of “searching for a restaurant in a certain place (near Minato-ku, Tokyo)”. Is estimated to be That is, the search query Q1k (k=1, 2, 3, 4) is a search query that is searched under the search intent of “searching for a restaurant in a certain place (in the vicinity of Minato-ku, Tokyo)”. , Are presumed to be search queries having similar features to each other. Here, the
図11の下段に示す例では、抽出部132は、同一のユーザU2によって所定の時間内に連続して入力された3個の検索クエリである検索クエリQ21(「冷蔵庫 400L」)、検索クエリQ22(「冷蔵庫 中型」)、検索クエリQ23(「冷蔵庫 中型 おすすめ」)を抽出する。抽出部132は、検索クエリが入力された順番に並べると、検索クエリQ21、検索クエリQ22、検索クエリQ23の順番で入力された3個の検索クエリを抽出する。抽出部132は、3個の検索クエリを抽出すると、時系列的に隣り合う2つの検索クエリを一対の検索クエリとして、2対の検索クエリのペアである(検索クエリQ21、検索クエリQ22)、(検索クエリQ22、検索クエリQ23)を抽出する(ステップS21−2)。 In the example illustrated in the lower part of FIG. 11, the extraction unit 132 includes the search query Q21 (“refrigerator 400L”) and the search query Q22, which are three search queries continuously input within the predetermined time by the same user U2. (“Refrigerator Medium-sized”) and search query Q23 (“Refrigerator Medium-sized recommended”) are extracted. After arranging the search queries in the input order, the extraction unit 132 extracts the three search queries input in the order of the search query Q21, the search query Q22, and the search query Q23. When the three search queries are extracted, the extraction unit 132 regards two search queries that are adjacent in time series as a pair of search queries and is a pair of two search queries (search query Q21, search query Q22), (Search query Q22, search query Q23) is extracted (step S21-2).
続いて、生成部133は、抽出部132によって抽出された検索クエリQ2m(m=1、2、3)を第1モデルM1に入力して、検索クエリQ2m(m=1、2、3)の分散表現であるベクトルBQV2m(m=1、2、3)を第1モデルM1から出力する。ここで、ベクトルBQV2m(m=1、2、3)は、第1モデルM1の出力層から出力されたばかりの検索クエリQ2m(m=1、2、3)の分散表現であって、第1モデルM1にフィードバックをかける前(学習前)の分散表現を示す(ステップS22−2)。 Subsequently, the generation unit 133 inputs the search query Q2m (m=1, 2, 3) extracted by the extraction unit 132 into the first model M1 to generate the search query Q2m (m=1, 2, 3). The vector BQV2m (m=1, 2, 3), which is a distributed expression, is output from the first model M1. Here, the vector BQV2m (m=1, 2, 3) is a distributed representation of the search query Q2m (m=1, 2, 3) just output from the output layer of the first model M1, and is the first model. A distributed expression before feedback is given to M1 (before learning) is shown (step S22-2).
続いて、生成部133は、同一のユーザU2によって所定の時間内に連続して入力された一対の検索クエリは、所定の検索意図(例えば、「中型の冷蔵庫を調べる」という検索意図)で入力された検索クエリであると推定されるため、相互に類似する特徴を有するものとして、検索クエリQ21の分散表現(ベクトルQV21)と、検索クエリQ21と対となる検索クエリQ22の分散表現(ベクトルQV22)とが、類似するように第1モデルM1を学習させる。また、生成部133は、検索クエリQ22の分散表現(ベクトルQV22)と、検索クエリQ22と対となる検索クエリQ23の分散表現(ベクトルQV23)とが、類似するように第1モデルM1を学習させる。このように、生成部133は、一対の検索クエリに対応する一対の分散表現である2つのベクトルが類似するように第1モデルM1を学習させることで、検索クエリから分散表現(ベクトル)を出力する第1モデルM1を生成する(ステップS23−2)。 Subsequently, the generation unit 133 inputs a pair of search queries continuously input by the same user U2 within a predetermined time with a predetermined search intent (for example, a search intent to "search for a medium-sized refrigerator"). Since it is estimated that the search query is a search query that has been performed, it is assumed that the search query Q21 has a distributed expression (vector QV21) and a search query Q22 that forms a pair with the search query Q22 (vector QV22). ) Trains the first model M1 so that and are similar. Further, the generation unit 133 trains the first model M1 so that the distributed expression of the search query Q22 (vector QV22) and the distributed expression of the search query Q23 (vector QV23) paired with the search query Q22 are similar. .. In this way, the generation unit 133 outputs the distributed expression (vector) from the search query by learning the first model M1 so that the two vectors, which are the pair of distributed expressions corresponding to the pair of search queries, are similar. The first model M1 to be generated is generated (step S23-2).
図11の下段に示す情報処理の結果として、検索クエリQ2m(m=1、2、3)の分散表現であるベクトルQV2m(m=1、2、3)が分散表現空間の近い位置にクラスタCL21としてマッピングされる様子が示されている。例えば、検索クエリQ2m(m=1、2、3)は、ユーザU2によって「中型の冷蔵庫を調べる」という検索意図の下で検索された検索クエリの集合であると推定される。すなわち、Q2m(m=1、2、3)は、「中型の冷蔵庫を調べる」という検索意図の下で検索された検索クエリであるという点で、相互に類似する特徴を有する検索クエリであると推定される。ここで、情報処理装置100は、「中型の冷蔵庫を調べる」という検索意図で入力された所定の検索クエリが第1モデルに入力されると、クラスタCL21の位置にマッピングされるような分散表現を出力することができる。これにより、例えば、情報処理装置100は、クラスタCL21の位置にマッピングされる分散表現に対応する検索クエリを抽出することにより、「中型の冷蔵庫を調べる」という検索意図に応じた検索クエリを抽出することができる。したがって、情報処理装置100は、検索クエリの意味を適切に解釈可能とすることができる。
As a result of the information processing shown in the lower part of FIG. 11, the vector QV2m (m=1, 2, 3), which is the distributed expression of the search query Q2m (m=1, 2, 3), is located in the cluster CL21 near the distributed expression space. Is mapped as. For example, the search query Q2m (m=1, 2, 3) is presumed to be a set of search queries searched by the user U2 under the search intention of “searching for a medium-sized refrigerator”. That is, Q2m (m=1, 2, 3) is a search query having similar characteristics in that it is a search query searched under the search intention of “searching for a medium-sized refrigerator”. Presumed. Here, when the predetermined search query input with the search intention of “search for a medium-sized refrigerator” is input to the first model, the
また、生成部133は、ランダムに抽出された複数の検索クエリは、異なる検索意図の下で検索された検索クエリであるという点で、相互に相違する特徴を有する検索クエリであるとみなして第1モデルM1を学習させる。具体的には、生成部133は、所定の検索クエリの分散表現と、所定の検索クエリとは無関係にランダムに抽出された検索クエリの分散表現とが相違するように(例えば、分散表現空間上で遠くにマッピングされるように)第1モデルM1のトレーニングを行う。図11に示す例では、抽出部132は、検索クエリQ11とは無関係にランダムに検索クエリを抽出したところ、検索クエリQ21を抽出したとする。この場合、生成部133は、検索クエリQ11の分散表現(ベクトルQV11)と、検索クエリQ11とは無関係にランダムに抽出された検索クエリQ21の分散表現(ベクトルQV21)とが相違するように第1モデルM1のトレーニングを行う。その結果として、「ある場所(東京都港区付近)で飲食店を探す」という検索意図の下で検索された検索クエリQ1k(k=1、2、3、4)の分散表現であるベクトルQV1k(k=1、2、3、4)を含むクラスタCL11と、「中型の冷蔵庫を調べる」という検索意図の下で検索された検索クエリQ2m(m=1、2、3)の分散表現であるベクトルQV2m(m=1、2、3)を含むクラスタCL21とは、分散表現空間上で遠くにマッピングされる。すなわち、本願発明に係る情報処理装置100は、ランダムに抽出された複数の検索クエリの分散表現が相違するように第1モデルM1を学習させることにより、検索意図が異なる検索クエリの分散表現を分散表現空間上で遠い位置に出力可能とする。
In addition, the generation unit 133 considers that the plurality of randomly extracted search queries are search queries that are searched under different search intentions, and considers that the search queries have mutually different characteristics. 1 Learn the model M1. Specifically, the generation unit 133 causes the distributed expression of the predetermined search query to be different from the distributed expression of the search query that is randomly extracted regardless of the predetermined search query (for example, on the distributed expression space). The first model M1 is trained (so that it is mapped far away in.). In the example illustrated in FIG. 11, it is assumed that the extraction unit 132 extracts the search query Q21 when the search query is randomly extracted regardless of the search query Q11. In this case, the generation unit 133 is configured such that the distributed expression (vector QV11) of the search query Q11 and the distributed expression (vector QV21) of the search query Q21 randomly extracted irrespective of the search query Q11 are different from each other. Train the model M1. As a result, the vector QV1k, which is a distributed expression of the search query Q1k (k=1, 2, 3, 4), which is searched under the search intention of “searching for a restaurant in a certain place (Near Minato-ku, Tokyo)”. It is a distributed representation of a cluster CL11 including (k=1, 2, 3, 4) and a search query Q2m (m=1, 2, 3) searched under the search intention of “searching for a medium-sized refrigerator”. The cluster CL21 including the vector QV2m (m=1, 2, 3) is mapped far in the distributed representation space. That is, the
なお、情報処理装置100が生成した第1モデルM1によって出力された分散表現(ベクトル)が分散表現空間にマッピングされた結果として、上述したクラスタCL11とクラスタCL21の他にも、同一のユーザによって所定の時間内に入力された複数の検索クエリの分散表現(ベクトル)の集合であるクラスタCL12やクラスタCL22が生成される。
As a result of the distributed representation (vector) output by the first model M1 generated by the
上述したように、情報処理装置100は、ユーザによって入力された検索クエリを取得する。また、情報処理装置100は、取得した検索クエリのうち、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして学習することで、所定の検索クエリから所定の検索クエリの特徴情報を予測する第1モデルを生成する。すなわち、本願発明に係る情報処理装置100は、所定の時間内に連続して入力された複数の検索クエリは、所定の検索意図の下で検索された検索クエリであるという点で、相互に類似する特徴を有する検索クエリであるとみなして第1モデルを学習させる。具体的には、情報処理装置100は、同一のユーザによって所定の時間内に入力された複数の検索クエリの分散表現が類似するように第1モデルを学習させることで、所定の検索クエリから所定の検索クエリの特徴情報を含む分散表現を出力する第1モデルを生成する。すなわち、本願発明に係る情報処理装置100は、所定の時間内に連続して入力された複数の検索クエリの分散表現が類似するように第1モデルM1を学習させることにより、所定の検索意図の下で検索された検索クエリの分散表現を分散表現空間上で近い位置に出力可能とする。これにより、情報処理装置100は、検索クエリを入力したユーザのコンテクストに応じて検索クエリの意味(検索意図)を出力(解釈)することを可能にする。したがって、情報処理装置100は、検索クエリの意味を適切に解釈可能とすることができる。さらに、情報処理装置100は、所定の検索クエリの特徴情報を含む分散表現の近傍にマッピングされる分散表現に対応する検索クエリを抽出することにより、所定の検索クエリが検索された検索意図に応じた検索クエリを抽出することができる。すなわち、情報処理装置100は、検索クエリを入力したユーザの検索意図やコンテクストを考慮して、ユーザの検索動向を分析することを可能にする。したがって、情報処理装置100は、ユーザの検索動向の分析精度を高めることができる。
As described above, the
また、情報処理装置100が生成した第1モデルM1を検索システムの一部として機能させることもできる。あるいは、情報処理装置100は、第1モデルM1によって予測された検索クエリの特徴情報を利用する他のシステム(例えば、検索エンジン)への入力情報として、第1モデルM1が出力した検索クエリの分散表現を提供することもできる。これにより、検索システムは、第1モデルM1によって予測された検索クエリの特徴情報に基づいて、検索結果として出力されるコンテンツを選択可能になる。すなわち、検索システムは、検索クエリを入力したユーザの検索意図やコンテクストを考慮して、検索結果として出力されるコンテンツを選択可能になる。さらに、検索システムは、第1モデルM1によって予測された検索クエリの特徴情報に基づいて、検索結果として出力されるコンテンツに含まれる文字群の分散表現と検索クエリの分散表現との類似度を算出可能になる。そして、検索システムは、算出した類似度に基づいて、検索結果として出力されるコンテンツの表示順を決定可能になる。すなわち、検索システムは、検索クエリを入力したユーザの検索意図やコンテクストを考慮して、検索結果として出力されるコンテンツの表示順を決定可能になる。したがって、情報処理装置100は、検索サービスにおけるユーザビリティを向上させることができる。
Further, the first model M1 generated by the
〔第2学習モデルの生成処理の一例〕
次に、図12を用いて、第2学習モデルの生成処理の流れについて説明する。図12は、実施形態に係る第2学習モデルの生成処理の一例を示す図である。なお、以下では、適宜、第2学習モデルを第2モデル(又は、第2モデルM2)と記載する。図12の上段に示す例では、抽出部132は、同一のユーザU1によって所定の時間内に連続して入力された4個の検索クエリである検索クエリQ11(「六本木 パスタ」)、検索クエリQ12(「六本木 イタリアン」)、検索クエリQ13(「赤坂 パスタ」)、検索クエリQ14(「麻布 パスタ」)を抽出する。抽出部132は、同一のユーザU1によって各検索クエリが入力された時間の間隔が所定の時間内である複数の検索クエリを抽出する。また、抽出部132は、同一のユーザU1によって各検索クエリのペアが入力された時間の間隔が所定の時間内である複数の検索クエリを抽出する。ここで、4個の検索クエリは、検索クエリQ11、検索クエリQ12、検索クエリQ13、検索クエリQ14の順番でユーザU1によって各検索クエリが所定の時間内に入力された検索クエリであるとする。抽出部132は、4個の検索クエリを抽出すると、時系列的に隣り合う2つの検索クエリを一対の検索クエリとして、3対の検索クエリのペアである(検索クエリQ11、検索クエリQ12)、(検索クエリQ12、検索クエリQ13)、(検索クエリQ13、検索クエリQ14)を抽出する。生成部133は、抽出部132によって3対の検索クエリのペアが抽出されると、抽出した検索クエリQ1k(k=1、2、3、4)を第1モデルM1に入力する(ステップS31)。なお、抽出部132は、同一のユーザU1によって全ての検索クエリが所定の時間内に入力された複数の検索クエリを抽出してもよい。そして、抽出部132は、時系列的に隣り合うか否かに関わらず、抽出した複数の検索クエリの中から2つの検索クエリを選択して、選択した2つの検索クエリを一対の検索クエリとして抽出してもよい。
[Example of Second Learning Model Generation Processing]
Next, the flow of generation processing of the second learning model will be described with reference to FIG. FIG. 12 is a diagram illustrating an example of a second learning model generation process according to the embodiment. In the following, the second learning model will be appropriately referred to as the second model (or the second model M2). In the example shown in the upper part of FIG. 12, the extraction unit 132 uses the search query Q11 (“Roppongi pasta”), which is four search queries continuously input by the same user U1 within a predetermined time, and the search query Q12. (“Roppongi Italian”), search query Q13 (“Akasaka pasta”), and search query Q14 (“Azabu pasta”) are extracted. The extraction unit 132 extracts a plurality of search queries in which the time intervals at which the search queries are input by the same user U1 are within a predetermined time. In addition, the extraction unit 132 extracts a plurality of search queries in which the time interval at which each search query pair is input by the same user U1 is within a predetermined time. Here, it is assumed that the four search queries are search queries in which the search query Q11, the search query Q12, the search query Q13, and the search query Q14 are input in this order by the user U1 within a predetermined time. When the four search queries are extracted, the extraction unit 132 defines two search queries that are adjacent in time series as a pair of search queries, and is a pair of three search queries (search query Q11, search query Q12). (Search query Q12, search query Q13), (search query Q13, search query Q14) are extracted. When the extraction unit 132 extracts three pairs of search queries, the generation unit 133 inputs the extracted search query Q1k (k=1, 2, 3, 4) to the first model M1 (step S31). .. The extraction unit 132 may extract a plurality of search queries in which all the search queries have been input by the same user U1 within a predetermined time. Then, the extraction unit 132 selects two search queries from the plurality of extracted search queries, regardless of whether they are adjacent in time series, and sets the selected two search queries as a pair of search queries. You may extract.
続いて、生成部133は、検索クエリQ1k(k=1、2、3、4)の分散表現であるベクトルBQV1k(k=1、2、3、4)を第1モデルM1の出力データとして出力する(ステップS32)。ここで、ベクトルBQV1k(k=1、2、3、4)は、第1モデルM1の出力層から出力されたばかりの検索クエリQ1k(k=1、2、3、4)の分散表現であって、第1モデルM1にフィードバックをかける前(学習前)の分散表現を示す。 Subsequently, the generation unit 133 outputs the vector BQV1k (k=1, 2, 3, 4), which is the distributed expression of the search query Q1k (k=1, 2, 3, 4), as the output data of the first model M1. Yes (step S32). Here, the vector BQV1k (k=1, 2, 3, 4) is a distributed representation of the search query Q1k (k=1, 2, 3, 4) just output from the output layer of the first model M1. , A distributed expression before feedback is applied to the first model M1 (before learning).
ここで、同一のユーザU1によって所定の時間内に連続して入力された検索クエリQ1k(k=1、2、3、4)は、例えば、ユーザU1によって「ある場所(東京都港区付近)で飲食店を探す」という検索意図の下で検索された検索クエリの集合であると推定される。すなわち、検索クエリQ1k(k=1、2、3、4)は、「ある場所(東京都港区付近)で飲食店を探す」という検索意図の下で検索された検索クエリであるという点で、相互に類似する特徴を有する検索クエリであると推定される。そこで、生成部133は、連続して入力された検索クエリが類似する特徴を有するものとして学習することで、所定の検索クエリから所定の検索クエリの特徴情報を予測する第1モデルを生成する(ステップS33)。具体的には、生成部133は、連続して入力された検索クエリの分散表現が類似するものとして学習することで、所定の検索クエリから所定の検索クエリの分散表現を予測する第1モデルM1を生成する。例えば、生成部133は、検索クエリQ11の分散表現(ベクトルQV11)と、検索クエリQ11と対となる検索クエリQ12の分散表現(ベクトルQV12)とが、分散表現空間上で類似するように第1モデルM1を学習させる。また、生成部133は、検索クエリQ12の分散表現(ベクトルQV12)と、検索クエリQ12と対となる検索クエリQ13の分散表現(ベクトルQV13)とが、分散表現空間上で類似するように第1モデルM1を学習させる。また、生成部133は、検索クエリQ13の分散表現(ベクトルQV13)と、検索クエリQ13と対となる検索クエリQ14の分散表現(ベクトルQV14)とが、分散表現空間上で類似するように第1モデルM1を学習させる。 Here, the search query Q1k (k=1, 2, 3, 4) continuously input by the same user U1 within a predetermined time is, for example, “some place (near Minato-ku, Tokyo)” by the user U1. It is presumed to be a set of search queries searched under the search intention of "searching for restaurants in." That is, the search query Q1k (k=1, 2, 3, 4) is a search query that is searched under the search intent of “searching for a restaurant in a certain place (in the vicinity of Minato-ku, Tokyo)”. , Are presumed to be search queries having similar features to each other. Therefore, the generation unit 133 generates the first model that predicts the characteristic information of the predetermined search query from the predetermined search query by learning that the continuously input search queries have similar characteristics ( Step S33). Specifically, the generation unit 133 learns that the distributed expressions of continuously input search queries are similar to each other, and thus the first model M1 that predicts the distributed expression of the predetermined search query from the predetermined search query. To generate. For example, the generation unit 133 may make the distributed representation of the search query Q11 (vector QV11) and the distributed representation of the search query Q12 (vector QV12) that is paired with the search query Q11 similar to each other in the distributed representation space. The model M1 is trained. In addition, the generation unit 133 makes the distributed representation of the search query Q12 (vector QV12) and the distributed representation of the search query Q13 (vector QV13) paired with the search query Q12 similar to each other in the distributed representation space. The model M1 is trained. In addition, the generation unit 133 makes the distributed expression of the search query Q13 (vector QV13) and the distributed expression of the search query Q14 (vector QV14) paired with the search query Q13 similar to each other in the distributed expression space. The model M1 is trained.
図12の上段の右側には、学習済みの第1モデルM1の出力結果として、同一のユーザU1によって所定の時間内に入力された検索クエリQ1k(k=1、2、3、4)の分散表現であるベクトルQV1k(k=1、2、3、4)が分散表現空間のクラスタCL11としてマッピングされる様子が示されている。このように、生成部133は、同一のユーザによって所定の時間内に入力された複数の検索クエリが有する特徴を学習した第1学習モデルM1を生成する。 On the right side of the upper part of FIG. 12, the variance of the search query Q1k (k=1, 2, 3, 4) input by the same user U1 within a predetermined time as the output result of the learned first model M1. It is shown that the expression vector QV1k (k=1, 2, 3, 4) is mapped as the cluster CL11 in the distributed expression space. In this way, the generation unit 133 generates the first learning model M1 that has learned the characteristics of the plurality of search queries input by the same user within a predetermined time period.
生成部133は、第1モデルM1を生成すると、生成した第1モデルM1(第1モデルM1のモデルデータMDT1)を取得する。生成部133は、第1モデルM1を取得すると、取得した第1モデルM1を用いて、第2学習モデルM2を生成する。具体的には、生成部133は、第1モデルM1を再学習させることにより、第1モデルM1とは学習モデルの重みである接続係数が異なる第2モデルM2を生成する。より具体的には、生成部133は、第1モデルM1を用いて、所定の検索クエリから所定の検索クエリが属するカテゴリを予測する第2学習モデルM2を生成する(ステップS34)。 After generating the first model M1, the generation unit 133 acquires the generated first model M1 (model data MDT1 of the first model M1). When the generating unit 133 acquires the first model M1, the generating unit 133 generates the second learning model M2 using the acquired first model M1. Specifically, the generation unit 133 re-learns the first model M1 to generate the second model M2 having a connection coefficient that is a weight of the learning model different from that of the first model M1. More specifically, the generation unit 133 uses the first model M1 to generate a second learning model M2 that predicts a category to which a predetermined search query belongs from a predetermined search query (step S34).
図12の下段に示す例では、生成部133は、検索クエリが第2モデルM2に入力された際に、CAT11(「飲食店を探す」)、CAT12(「商品を探す」)、CAT13(「飲食店を予約する」)、CAT14(「商品を購入する」)の4つのカテゴリのいずれのカテゴリに属するかを予測する第2モデルM2を生成する。具体的には、生成部133は、入力情報として検索クエリが第2モデルM2に入力された際に、出力情報として検索クエリがそのカテゴリに属する確率をカテゴリ毎に出力する第2モデルM2を生成する。例えば、生成部133は、第2モデルM2の正解データとして、検索クエリと検索クエリが属するカテゴリ(CAT11〜CAT14のいずれか)との組を学習する。 In the example illustrated in the lower part of FIG. 12, when the search query is input to the second model M2, the generation unit 133 includes CAT11 (“search for a restaurant”), CAT12 (“searches for a product”), and CAT13 (“ A second model M2 that predicts which of the four categories of "reserve a restaurant") and CAT14 ("purchase a product") is generated. Specifically, when the search query is input to the second model M2 as the input information, the generation unit 133 generates the second model M2 that outputs the probability that the search query belongs to the category as the output information for each category. To do. For example, the generation unit 133 learns a set of a search query and a category (one of CAT11 to CAT14) to which the search query belongs as the correct answer data of the second model M2.
なお、検索クエリがCAT11(「飲食店を探す」)に属することは、検索クエリが飲食店を探す意図で入力された検索クエリであることを示す。また、CAT12(「商品を探す」)に属することは、検索クエリが商品を探す意図で入力された検索クエリであることを示す。また、検索クエリがCAT13(「飲食店を予約する」)に属することは、検索クエリが飲食店を予約する意図で入力された検索クエリであることを示す。また、検索クエリがCAT14(「商品を購入する」)に属することは、検索クエリが商品を購入する意図で入力された検索クエリであることを示す。 It should be noted that the fact that the search query belongs to CAT11 (“search for restaurants”) indicates that the search query is a search query that was input with the intention of searching for restaurants. Belonging to CAT12 (“search for product”) indicates that the search query is a search query input with the intention of searching for a product. Further, the fact that the search query belongs to CAT13 (“reserve a restaurant”) indicates that the search query is a search query input with the intention of reserving a restaurant. Further, the fact that the search query belongs to CAT14 (“purchase a product”) indicates that the search query is a search query input with the intention of purchasing the product.
具体的には、生成部133は、検索クエリが学習モデルに入力された際に、学習モデルが出力する分散表現の分類結果が、検索クエリが属するカテゴリに対応するように学習することで、所定の検索クエリから所定の検索クエリが属するカテゴリを予測する第2モデルM2を生成する。そして、生成部133は、例えば、入力情報として検索クエリが第2モデルM2に入力された際に、出力情報として検索クエリがそのカテゴリに属する確率をカテゴリCAT11〜CAT14毎に出力する第2モデルM2を生成する。 Specifically, when the search query is input to the learning model, the generation unit 133 learns such that the classification result of the distributed expression output by the learning model corresponds to the category to which the search query belongs, and thus the predetermined result is obtained. The second model M2 that predicts the category to which the predetermined search query belongs is generated from the search query of. Then, for example, when the search query is input as the input information to the second model M2, the generation unit 133 outputs the probability that the search query belongs to the category as the output information for each of the categories CAT11 to CAT14. To generate.
例えば、生成部133は、入力情報として検索クエリQ11(「六本木 パスタ」)が第2モデルM2に入力された際に(ステップS35)、出力情報として検索クエリQ11(「六本木 パスタ」)の分散表現であるベクトルBQV11を第2モデルM2から出力する。ここで、ベクトルBQV11は、第2モデルM2の出力層から出力されたばかりの検索クエリQ11の分散表現であって、第2モデルM2にフィードバックをかける前(学習前)の分散表現を示す。ここで、検索クエリQ11(「六本木 パスタ」)が属する正解カテゴリがCAT11(「飲食店を探す」)であるとする。この場合、生成部133は、出力された検索クエリQ11(「六本木 パスタ」)の分散表現であるベクトルBQV11がCAT11(「飲食店を探す」)に分類される確率が所定の閾値を超えるように第2モデルM2を学習させる。なお、生成部133は、あらかじめ用意された正解データを用いて第2モデルを学習させる。あるいは、生成部133は、取得部131によって生成された第2モデルM2の正解データを用いて第2モデルM2を学習させてもよい。 For example, when the search query Q11 (“Roppongi pasta”) is input to the second model M2 as input information (step S35), the generation unit 133 outputs the distributed expression of the search query Q11 (“Roppongi pasta”) as output information. Is output from the second model M2. Here, the vector BQV11 is a distributed expression of the search query Q11 just output from the output layer of the second model M2, and represents a distributed expression before feedback is applied to the second model M2 (before learning). Here, it is assumed that the correct category to which the search query Q11 (“Roppongi pasta”) belongs is CAT11 (“Find a restaurant”). In this case, the generation unit 133 causes the probability that the vector BQV11, which is the distributed expression of the output search query Q11 (“Roppongi pasta”), is classified into CAT11 (“Find a restaurant”) exceeds a predetermined threshold. The second model M2 is trained. The generation unit 133 trains the second model using the correct answer data prepared in advance. Alternatively, the generation unit 133 may train the second model M2 using the correct answer data of the second model M2 generated by the acquisition unit 131.
例えば、生成部133は、学習前の第2モデルM2に検索クエリQ11(「六本木 パスタ」)が入力された際に、分散表現であるベクトルBQV11がCAT11(「飲食店を探す」)に分類される確率を80%、CAT12(「商品を探す」)に分類される確率を0%、CAT13(「飲食店を予約」)に分類される確率を20%、CAT14(「商品を購入する」)に分類される確率を0%と出力したとする。この場合、生成部133は、分散表現であるベクトルBQV11がCAT11(「飲食店を探す」)に分類される確率を所定の閾値(例えば、90%)を超えるように第2モデルM2を学習させる。また、生成部133は、分散表現であるベクトルBQV11がCAT11(「飲食店を探す」)に分類される確率が所定の閾値(例えば、90%)を超えるように学習させるのに合わせて、分散表現であるベクトルBQV11が他のカテゴリCAT13(「飲食店を予約」)に分類される確率を10%に下げるように第2モデルM2を学習させる。 For example, when the search query Q11 (“Roppongi pasta”) is input to the second model M2 before learning, the generation unit 133 classifies the vector BQV11, which is a distributed expression, into CAT11 (“Find a restaurant”). 80% probability, 0% probability of being classified as CAT12 (“find merchandise”), 20% probability of being classified as CAT13 (“reserve food”), CAT14 (“buy merchandise”) It is assumed that the probability of being classified as is output as 0%. In this case, the generation unit 133 trains the second model M2 so that the probability that the vector BQV11, which is a distributed expression, is classified into CAT11 (“search for a restaurant”) exceeds a predetermined threshold value (for example, 90%). .. In addition, the generation unit 133 performs learning so that the probability that the vector BQV11, which is a distributed expression, is classified into CAT11 (“search for a restaurant”) exceeds a predetermined threshold value (for example, 90%), and the distribution is performed. The second model M2 is trained so that the probability that the expression vector BQV11 is classified into another category CAT13 (“reserve a restaurant”) is reduced to 10%.
このように、生成部133は、入力情報として所定の検索クエリが入力されると、出力情報として所定の検索クエリの分散表現が正解カテゴリに分類される確率が所定の閾値を超えるように第2モデルを学習させる。そして、生成部133は、入力情報として所定の検索クエリが入力された際に、所定の検索クエリの分散表現がそのカテゴリに属する確率が所定の閾値を超えるカテゴリを、所定の検索クエリのカテゴリとして出力する。例えば、生成部133は、学習済みの第2モデルM2に入力情報として検索クエリQ11(「六本木 パスタ」)が入力されると、検索クエリQ11(「六本木 パスタ」)の分散表現であるベクトルBQV11がカテゴリCAT11(「飲食店を探す」)に属する確率が90%を超えるので、出力情報として検索クエリが属するカテゴリをCAT11(「飲食店を探す」)と出力する(ステップS36)。このように、生成部133は、検索クエリと検索クエリの正解カテゴリとの組を学習することで、所定の検索クエリから所定の検索クエリのカテゴリを予測する第2モデルを生成する(ステップS37)。 As described above, when the predetermined search query is input as the input information, the generation unit 133 is configured so that the probability that the distributed expression of the predetermined search query is classified as the correct category as the output information exceeds the predetermined threshold. Train the model. Then, when a predetermined search query is input as input information, the generation unit 133 sets, as a predetermined search query category, a category whose probability that the distributed expression of the predetermined search query belongs to that category exceeds a predetermined threshold value. Output. For example, when the search query Q11 (“Roppongi pasta”) is input as input information to the learned second model M2, the generation unit 133 generates a vector BQV11 that is a distributed expression of the search query Q11 (“Roppongi pasta”). Since the probability of belonging to the category CAT11 (“search for restaurants”) exceeds 90%, the category to which the search query belongs is output as output information as CAT11 (“searches for restaurants”) (step S36). In this way, the generation unit 133 generates a second model that predicts a category of a predetermined search query from the predetermined search query by learning a set of the search query and the correct category of the search query (step S37). ..
一般的に、ユーザはある意図を持って検索を複数回行うと考えられるため、所定の時間内に連続して入力された検索クエリは、検索意図が近いという仮定が成り立つ。そこで、本願発明に係る情報処理装置100は、所定の時間内に連続して入力された複数の検索クエリは、所定の検索意図の下で検索された検索クエリであるという点で、相互に類似する特徴を有する検索クエリであるとみなして第1モデルM1を学習させる。これにより、情報処理装置100は、検索意図を考慮した検索クエリの特徴を第1モデルM1に学習させることができる。そして、情報処理装置100は、検索意図を考慮した検索クエリの特徴を学習した第1モデルM1を活用して、所定の検索クエリから所定の検索クエリのカテゴリを予測する第2モデルを効率的に生成することができる。これにより、情報処理装置100は、検索クエリを入力したユーザの検索意図を考慮したカテゴリに検索クエリを分類することを可能にする。また、従来、検索クエリをカテゴリに分類し、高い分類精度を得るためには、十分な量の正解データを用意することが必要であった。しかしながら、検索クエリ自体、多種多様であり、ロングテイルな性質を持つものであるため、多数の検索クエリに対応する正解カテゴリをラベル付けするのは、非常に手間がかかり困難である。ここで、情報処理装置100は、正解カテゴリをラベル付けする代わりに、ユーザの検索意図(検索クエリを入力したユーザのコンテクスト)を一種の正解として、検索クエリのカテゴリを予測する第2モデルを学習させることができる。これにより、情報処理装置100は、人手で検索クエリの正解カテゴリをラベル付けすることなく、第2モデルを学習させることができる。すなわち、情報処理装置100は、正解データが少ないときでも、十分な分類精度を得られるようになる。また、情報処理装置100は、正解データが多いときであれば、さらに高い分類精度を得られるようになる。したがって、情報処理装置100は、検索クエリの分類精度を高めることができる。
Generally, it is considered that a user performs a search a plurality of times with a certain intention, and therefore it is assumed that search queries continuously input within a predetermined time have similar search intentions. Therefore, the
〔第1学習モデルの一例〕
次に、図13を用いて情報処理装置100が生成する第1学習モデルの一例について説明する。図13は、実施形態に係る第1学習モデルの一例を示す図である。図13に示す例では、情報処理装置100が生成する第1学習モデルM1は、3層のLSTM‐RNNで構成されている。図13に示す例では、抽出部132は、同一のユーザU1によって所定の時間内に連続して入力された「六本木 パスタ」という検索クエリQ11と「六本木 イタリアン」という検索クエリQ12とから成る一対の検索クエリを抽出する。生成部133は、抽出部132によって抽出されたた検索クエリQ11を第1学習モデルM1の入力層に入力する(ステップS41)。
[Example of first learning model]
Next, an example of the first learning model generated by the
続いて、生成部133は、第1学習モデルM1の出力層から検索クエリQ11の分散表現である256次元のベクトルBQV11を出力する。また、生成部133は、抽出部132によって抽出された検索クエリQ12を第1学習モデルM1の入力層に入力する。続いて、生成部133は、第1学習モデルM1の出力層から検索クエリQ12の分散表現である256次元のベクトルBQV12を出力する(ステップS42)。 Then, the generation unit 133 outputs a 256-dimensional vector BQV11, which is a distributed expression of the search query Q11, from the output layer of the first learning model M1. Further, the generation unit 133 inputs the search query Q12 extracted by the extraction unit 132 into the input layer of the first learning model M1. Subsequently, the generating unit 133 outputs the 256-dimensional vector BQV12, which is the distributed expression of the search query Q12, from the output layer of the first learning model M1 (step S42).
続いて、生成部133は、連続して入力された2つの検索クエリの分散表現(ベクトル)が類似するように学習することで、検索クエリから分散表現(ベクトル)を出力する第1学習モデルM1を生成する(ステップS43)。例えば、第1学習モデルM1にフィードバックをかける前(学習前)の検索クエリQ11の分散表現であるベクトルBQV11と検索クエリQ12の分散表現であるベクトルBQV12とのなす角度の大きさをΘとする。また、第1学習モデルM1にフィードバックをかけた後(学習後)の検索クエリQ11の分散表現であるベクトルQV11と検索クエリQ12の分散表現であるベクトルQV12とのなす角度の大きさをΦとする。この時、生成部133は、ΘよりもΦが小さくなるように、第1学習モデルM1を学習させる。例えば、生成部133は、ベクトルBQV11とベクトルBQV12のコサイン類似度の値を算出する。また、生成部133は、ベクトルQV11とベクトルQV12のコサイン類似度の値を算出する。続いて、生成部133は、ベクトルBQV11とベクトルBQV12のコサイン類似度の値よりも、ベクトルQV11とベクトルQV12のコサイン類似度の値が大きくなるように(値が1に近づくように)学習モデルM1を学習させる。このように、生成部133は、一対の検索クエリに対応する一対の分散表現である2つのベクトルが分散表現空間上で類似するように第1学習モデルM1を学習させることで、検索クエリから分散表現(ベクトル)を出力する第1学習モデルM1を生成する。なお、生成部133は、コサイン類似度に限らず、ベクトル間の距離尺度として適用可能な指標であれば、どのような指標に基づいて分散表現(ベクトル)の間の類似度を算出してもよい。また、生成部133は、ベクトル間の距離尺度として適用可能な指標であれば、どのような指標に基づいて学習モデルM1を学習させてもよい。例えば、生成部133は、分散表現(ベクトル)同士のユークリッド距離や双曲空間等の非ユークリッド空間中での距離、マンハッタン距離、マハラノビス距離等といった所定の距離関数の値を算出する。続いて、生成部133は、分散表現(ベクトル)同士の所定の距離関数の値(すなわち、分散表現空間における距離)が小さくなるように学習モデルM1を学習させてもよい。 Subsequently, the generating unit 133 learns so that the distributed expressions (vectors) of the two consecutively input search queries are similar to each other, and thus the first learning model M1 that outputs the distributed expressions (vectors) from the search query. Is generated (step S43). For example, the magnitude of the angle between the vector BQV11, which is the distributed expression of the search query Q11 before feedback (before learning) to the first learning model M1, and the vector BQV12, which is the distributed expression of the search query Q12, is Θ. In addition, the size of the angle formed by the vector QV11, which is the distributed expression of the search query Q11 after feedback is applied to the first learning model M1 (after learning), and the vector QV12, which is the distributed expression of the search query Q12, is Φ. .. At this time, the generation unit 133 trains the first learning model M1 so that Φ becomes smaller than Θ. For example, the generation unit 133 calculates the value of the cosine similarity between the vector BQV11 and the vector BQV12. Further, the generation unit 133 calculates the value of the cosine similarity between the vector QV11 and the vector QV12. Then, the generation unit 133 sets the learning model M1 such that the value of the cosine similarity between the vectors QV11 and QV12 is larger than the value of the cosine similarity between the vectors BQV11 and BQV12 (so that the value approaches 1). To learn. As described above, the generation unit 133 learns the first learning model M1 so that two vectors, which are a pair of distributed expressions corresponding to a pair of search queries, are similar in the distributed expression space, and thus the search query is distributed. A first learning model M1 that outputs an expression (vector) is generated. The generation unit 133 is not limited to the cosine similarity and may calculate the similarity between the distributed expressions (vectors) based on any index as long as it is an index applicable as a distance measure between vectors. Good. Further, the generation unit 133 may train the learning model M1 based on any index as long as it is an index applicable as a distance measure between vectors. For example, the generation unit 133 calculates a value of a predetermined distance function such as a Euclidean distance between distributed expressions (vectors), a distance in a non-Euclidean space such as a hyperbolic space, a Manhattan distance, a Mahalanobis distance, or the like. Subsequently, the generation unit 133 may train the learning model M1 so that the value of the predetermined distance function between the distributed expressions (vectors) (that is, the distance in the distributed expression space) becomes small.
また、生成部133は、同一のユーザによって所定の時間内に入力された複数の検索クエリとして、所定の区切り文字で区切られた文字群を含む複数の検索クエリが類似する特徴を有するものとして学習することで、第1学習モデルを生成する。例えば、生成部133は、地名を示す「六本木」と料理の種類を示す「パスタ」の文字とが区切り文字であるスペースで区切られた検索クエリ「六本木 パスタ」と、地名を示す「六本木」と料理の種類を示す「イタリアン」の文字とが区切り文字であるスペースで区切られた検索クエリ「六本木 イタリアン」とが類似する特徴を有するものとして学習することで、第1学習モデルを生成する。 The generation unit 133 also learns that a plurality of search queries that are input by the same user within a predetermined time have a similar feature in a plurality of search queries that include a character group separated by a predetermined delimiter. By doing so, the first learning model is generated. For example, the generation unit 133 uses a search query “Roppongi pasta” in which “Roppongi” indicating a place name and “pasta” indicating the type of dish are separated by a space that is a delimiter, and “Roppongi” indicating a place name. The first learning model is generated by learning that the search query “Roppongi Italian”, which is delimited by a space that is a delimiter between the characters “Italian” indicating the type of food, has similar characteristics.
また、生成部133は、取得部131によって取得された検索クエリのうち、ランダムに抽出された複数の検索クエリが相違する特徴を有するものとして学習することで、第1学習モデルを生成する。具体的には、生成部133は、取得部131によって取得された検索クエリのうち、ランダムに抽出された一対の検索クエリの分散表現が相違するように学習することで、第1学習モデルを生成する。例えば、生成部133は、抽出部132によって抽出された所定の検索クエリの分散表現と、所定の検索クエリとは無関係にランダムに抽出された検索クエリの分散表現とが分散表現空間上で遠くにマッピングされるように第1学習モデルM1のトレーニングを行う。 In addition, the generation unit 133 generates a first learning model by learning that among the search queries acquired by the acquisition unit 131, a plurality of randomly extracted search queries have different characteristics. Specifically, the generation unit 133 generates a first learning model by learning so that the distributed expressions of a pair of search queries that are randomly extracted from among the search queries acquired by the acquisition unit 131 are different. To do. For example, the generation unit 133 causes the distributed expression of the predetermined search query extracted by the extraction unit 132 and the distributed expression of the search query randomly extracted irrespective of the predetermined search query to be far apart in the distributed expression space. The first learning model M1 is trained so as to be mapped.
また、生成部133は、第2学習モデルを生成する。具体的には、生成部133は、モデル情報記憶部124を参照して、生成部133によって生成された第1学習モデル(第1学習モデルM1のモデルデータMDT1)を取得する。続いて、生成部133は、取得した第1学習モデルを用いて、所定の検索クエリから所定の検索クエリが属するカテゴリを予測する第2学習モデルを生成する。生成部133は、第1モデルM1を取得すると、取得した第1モデルM1を用いて、第2学習モデルM2を生成する。生成部133は、第1モデルM1を再学習させることにより、第1モデルM1とは学習モデルの重みである接続係数が異なる第2モデルM2を生成する。具体的には、生成部133は、検索クエリが学習モデルに入力された際に、学習モデルが出力する分散表現の分類結果が、検索クエリが属するカテゴリに対応するように学習することで、所定の検索クエリから所定の検索クエリが属するカテゴリを予測する第2モデルM2を生成する。
The generation unit 133 also generates a second learning model. Specifically, the generation unit 133 refers to the model
具体的には、生成部133は、検索クエリが学習モデルに入力された際に、学習モデルが出力する分散表現の分類結果が、検索クエリが属するカテゴリに対応するように学習することで、所定の検索クエリから所定の検索クエリが属するカテゴリを予測する第2学習モデルを生成する。生成部133は、入力情報として検索クエリが学習モデルに入力された際に、出力情報として検索クエリが属するカテゴリ毎の確率を出力する第2学習モデルを生成する。例えば、生成部133は、第1モデルM1を用いて、入力情報として所定の検索クエリが学習モデルに入力された際に、出力情報として検索クエリの分散表現がそのカテゴリに分類される確率をカテゴリ毎に出力する第2モデルM2を生成する。生成部133は、入力情報として所定の検索クエリが入力されると、出力情報として所定の検索クエリの分散表現が正解カテゴリに分類される確率が所定の閾値を超えるように第2モデルを学習させる。そして、生成部133は、入力情報として所定の検索クエリが入力された際に、所定の検索クエリの分散表現がそのカテゴリに属する確率が所定の閾値を超えるカテゴリを、所定の検索クエリのカテゴリとして出力する第2モデルM2を生成する。また、生成部133は、第2学習モデルを生成すると、第2学習モデルを識別する識別情報と対応付けて、生成した第2学習モデル(モデルデータMDT2)をモデル情報記憶部124に格納する。
Specifically, when the search query is input to the learning model, the generation unit 133 learns such that the classification result of the distributed expression output by the learning model corresponds to the category to which the search query belongs, and thus the predetermined result is obtained. A second learning model that predicts a category to which a predetermined search query belongs is generated from the search query. The generation unit 133 generates a second learning model that outputs the probability of each category to which the search query belongs as output information when the search query is input as input information to the learning model. For example, the generation unit 133 uses the first model M1 to determine the probability that the distributed expression of the search query is classified as the output information into the category when the predetermined search query is input as the input information into the learning model. A second model M2 to be output for each is generated. When the predetermined search query is input as the input information, the generation unit 133 trains the second model so that the probability that the distributed expression of the predetermined search query is classified as the correct category as the output information exceeds the predetermined threshold. .. Then, when a predetermined search query is input as input information, the generation unit 133 sets, as a predetermined search query category, a category whose probability that the distributed expression of the predetermined search query belongs to that category exceeds a predetermined threshold value. The second model M2 to be output is generated. Further, when the generation unit 133 generates the second learning model, the generation unit 133 stores the generated second learning model (model data MDT2) in the model
例えば、生成部133は、図8に示すモデル情報記憶部124を参照して、第1モデルM1(第1モデルM1のモデルデータMDT1)を取得する。続いて、生成部133は、図9に示す分類定義記憶部123を参照して、検索クエリを分類するカテゴリの大分類を選択する。続いて、生成部133は、大分類を選択すると、第2モデルM2の学習データとして、検索クエリと検索クエリが属する小分類との組を学習する。
For example, the generation unit 133 refers to the model
例えば、検索クエリQ11(「六本木 パスタ」)が属する正解カテゴリがCAT11(「飲食店を探す」)であるとする。生成部133は、入力情報として検索クエリQ11(「六本木 パスタ」)が第2モデルM2に入力された際に、第2モデルM2の出力層から検索クエリQ11(「六本木 パスタ」)の分散表現であるベクトルBQV11を出力する。ここで、ベクトルBQV11は、第2モデルM2の出力層から出力されたばかりの検索クエリQ11の分散表現であって、第2モデルM2にフィードバックをかける前(学習前)の分散表現を示す。この場合、生成部133は、出力された検索クエリQ11(「六本木 パスタ」)の分散表現であるベクトルBQV11が正解カテゴリCAT11(「飲食店を探す」)に分類される確率が所定の閾値を超えるように第2モデルM2を学習させる。 For example, it is assumed that the correct category to which the search query Q11 (“Roppongi pasta”) belongs is CAT11 (“Find a restaurant”). When the search query Q11 (“Roppongi pasta”) is input to the second model M2 as input information, the generation unit 133 uses the distributed representation of the search query Q11 (“Roppongi pasta”) from the output layer of the second model M2. It outputs a certain vector BQV11. Here, the vector BQV11 is a distributed expression of the search query Q11 just output from the output layer of the second model M2, and represents a distributed expression before feedback is applied to the second model M2 (before learning). In this case, the generation unit 133 causes the probability that the vector BQV11, which is the distributed expression of the output search query Q11 (“Roppongi pasta”), is classified into the correct category CAT11 (“Find a restaurant”) exceeds a predetermined threshold. Thus, the second model M2 is trained.
例えば、生成部133は、学習前の第2モデルM2に検索クエリQ11(「六本木 パスタ」)が入力された際に、分散表現であるベクトルBQV11がCAT11(「飲食店を探す」)に分類される確率を80%、CAT12(「商品を探す」)に分類される確率を0%、CAT13(「飲食店を予約」)に分類される確率を20%、CAT14(「商品を購入する」)に分類される確率を0%と出力したとする。この場合、生成部133は、分散表現であるベクトルBQV11がCAT11(「飲食店を探す」)に分類される確率を所定の閾値(例えば、90%)を超えるように第2モデルM2を学習させる。また、生成部133は、分散表現であるベクトルBQV11がCAT11(「飲食店を探す」)に分類される確率が所定の閾値(例えば、90%)を超えるように学習させるのに合わせて、分散表現であるベクトルBQV11が他のカテゴリCAT13(「飲食店を予約」)に分類される確率を10%に下げるように第2モデルM2を学習させる。続いて、生成部133は、学習済みの第2モデルM2に入力情報として検索クエリQ11(「六本木 パスタ」)が入力されると、検索クエリQ11(「六本木 パスタ」)の分散表現であるベクトルBQV11がカテゴリCAT11(「飲食店を探す」)に属する確率が90%を超えるので、出力情報として検索クエリが属するカテゴリをCAT11(「飲食店を探す」)と出力する。 For example, when the search query Q11 (“Roppongi pasta”) is input to the second model M2 before learning, the generation unit 133 classifies the vector BQV11, which is a distributed expression, into CAT11 (“Find a restaurant”). 80% probability, 0% probability of being classified as CAT12 (“find merchandise”), 20% probability of being classified as CAT13 (“reserve food”), CAT14 (“buy merchandise”) It is assumed that the probability of being classified as is output as 0%. In this case, the generation unit 133 trains the second model M2 so that the probability that the vector BQV11, which is a distributed expression, is classified into CAT11 (“search for a restaurant”) exceeds a predetermined threshold value (for example, 90%). .. In addition, the generation unit 133 performs learning so that the probability that the vector BQV11, which is a distributed expression, is classified into CAT11 (“search for a restaurant”) exceeds a predetermined threshold value (for example, 90%), and the distribution is performed. The second model M2 is trained so that the probability that the expression vector BQV11 is classified into another category CAT13 (“reserve a restaurant”) is reduced to 10%. Subsequently, when the search query Q11 (“Roppongi pasta”) is input as input information to the learned second model M2, the generation unit 133 generates a vector BQV11 that is a distributed expression of the search query Q11 (“Roppongi pasta”). Belongs to the category CAT11 (“search for restaurants”) exceeds 90%, the category to which the search query belongs is output as output information as CAT11 (“searches for restaurants”).
なお、生成部133は、大分類として、任意の数の大分類を選択してもよい。そして、生成部133は、入力情報として検索クエリが第2モデルM2に入力された際に、出力情報として検索クエリが選択した任意の数の大分類に属する各小分類に属する確率を小分類毎に出力する第2モデルM2を生成してもよい。また、生成部133は、大分類として、全ての大分類を選択してもよい。そして、生成部133は、検索クエリが第2モデルM2に入力された際に、各小分類に属する確率を全ての小分類毎に出力する第2モデルM2を生成してもよい。 Note that the generation unit 133 may select an arbitrary number of large categories as the large categories. Then, when the search query is input to the second model M2 as the input information, the generation unit 133 determines the probability of belonging to each of the small categories belonging to the arbitrary number of the large categories selected by the search query as the output information for each of the small categories. The second model M2 to be output to may be generated. Further, the generation unit 133 may select all the large classifications as the large classifications. Then, the generation unit 133 may generate the second model M2 that outputs the probability of belonging to each small classification for every small classification when the search query is input to the second model M2.
〔第2学習モデルの一例〕
次に、図14を用いて情報処理装置100が生成する第2学習モデルの一例について説明する。図14は、実施形態に係る第2学習モデルの一例を示す図である。図14に示す例では、情報処理装置100が生成する第2学習モデルM2は、第1学習モデルM1を用いて生成される。すなわち、情報処理装置100は、第1学習モデルM1を再学習させることにより、第1学習モデルM1とは学習モデルの重みである接続係数が異なる第2学習モデルM2を生成する。
[Example of Second Learning Model]
Next, an example of the second learning model generated by the
より具体的には、情報処理装置100が生成する第2学習モデルM2は、第1学習モデルM1と同様に、3層のLSTM‐RNNで構成されている。図14に示す例では、抽出部132は、ユーザU1によって入力された「六本木 パスタ」という検索クエリQ11を第2学習モデルM2の入力層に入力する(ステップS51)。
More specifically, the second learning model M2 generated by the
続いて、生成部133は、第2学習モデルM2の出力層から検索クエリQ11の分散表現である256次元のベクトルBQV11を出力する(ステップS52)。 Subsequently, the generation unit 133 outputs the 256-dimensional vector BQV11, which is the distributed expression of the search query Q11, from the output layer of the second learning model M2 (step S52).
続いて、生成部133は、検索クエリQ11の分散表現であるベクトルBQV11が各カテゴリに分類される確率を出力する(ステップS53)。 Then, the generation unit 133 outputs the probability that the vector BQV11, which is the distributed expression of the search query Q11, is classified into each category (step S53).
続いて、生成部133は、検索クエリQ11の分散表現であるベクトルBQV11が正解カテゴリに分類される確率を高くするように第2学習モデルM2を学習することで、検索クエリから検索クエリのカテゴリを予測する第2モデルを生成する(ステップS54)。 Subsequently, the generation unit 133 learns the second learning model M2 so as to increase the probability that the vector BQV11, which is the distributed expression of the search query Q11, is classified into the correct answer category, thereby changing the category of the search query from the search query. A second model to be predicted is generated (step S54).
(予測部134)
予測部134は、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして、複数の検索クエリが有する特徴を学習した学習モデルを用いて、第1入力情報から第1入力情報の特徴を示す第1特徴情報を予測する。具体的には、取得部131は、モデル情報記憶部124を参照して、生成部133によって生成された第2学習モデルを取得する。続いて、予測部134は、取得部131によって取得された第2学習モデルを用いて、第1入力情報である第1検索クエリから第1検索クエリの特徴を示す第1特徴情報である第1検索クエリのカテゴリを予測する。
(Predictor 134)
The prediction unit 134 determines that the plurality of search queries input by the same user within a predetermined time period have similar features, and uses the learning model that has learned the features of the plurality of search queries to use the first input information. From the first feature information indicating the feature of the first input information. Specifically, the acquisition unit 131 refers to the model
また、予測部134は、記憶部120に記憶された経過情報を用いて、複数の単位情報を含む第2入力情報の特徴を示す第2特徴情報を予測する。具体的には、予測部134は、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして、複数の検索クエリが有する特徴を学習した学習モデルの内部状態に関する情報である経過情報を用いて、複数の単位情報を含む第2入力情報の特徴を示す第2特徴情報を予測する。より具体的には、予測部134は、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして、複数の検索クエリが有する特徴を学習した学習モデルの内部状態に関する情報である経過情報を用いて、複数の単位情報を含む第2入力情報の特徴を示す第2特徴情報を予測する。予測部134は、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして、複数の検索クエリが有する特徴を学習した学習モデルのアクティベーション(activation)に関する情報を用いて、複数の単位情報を含む第2入力情報の特徴を示す第2特徴情報を予測する。予測部134は、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして、複数の検索クエリが有する特徴を学習した学習モデルを構成する各層(各LSTM層)の中間的な計算結果に関する情報を用いて、複数の単位情報を含む第2入力情報の特徴を示す第2特徴情報を予測する。予測部134は、経過情報記憶部125を参照して、処理単位毎の情報である単位情報を複数含む第1入力情報に含まれる単位情報が、予測部134によって順次処理されることにより行われる予測処理の経過情報を取得する。ここで、順次処理とは、処理対象となる情報を、ある法則に従って処理するという意味である。ある法則の一例として、複数の処理単位を含む情報を、先頭から順に処理する方法がある。より具体的には、予測部134は、単位情報を複数含む第1入力情報に含まれる所定の単位情報で区切られた単位情報群毎に経過情報を取得する。 Further, the prediction unit 134 uses the progress information stored in the storage unit 120 to predict the second characteristic information indicating the characteristic of the second input information including the plurality of unit information. Specifically, the prediction unit 134 determines that the plurality of search queries input by the same user within a predetermined time period have similar features, and the prediction unit 134 has learned the features of the plurality of search queries and is in the internal state of the learning model. The second characteristic information indicating the characteristic of the second input information including the plurality of unit information is predicted using the progress information which is the information on the second input information. More specifically, the prediction unit 134 determines that a plurality of search queries input by the same user within a predetermined time period have similar features, and the inside of the learning model that has learned the features of the plurality of search queries. The second characteristic information indicating the characteristic of the second input information including the plurality of unit information is predicted using the progress information that is information about the state. The prediction unit 134 determines that a plurality of search queries input by the same user within a predetermined time have similar features, and information regarding activation of a learning model that has learned the features of the plurality of search queries. Is used to predict the second characteristic information indicating the characteristic of the second input information including a plurality of unit information. The prediction unit 134 determines that the plurality of search queries input by the same user within a predetermined time period have similar features, and that each layer (each LSTM layer) that configures a learning model in which the features of the plurality of search queries are learned. The second characteristic information indicating the characteristic of the second input information including the plurality of unit information is predicted by using the information on the intermediate calculation result of (1). The prediction unit 134 refers to the progress information storage unit 125, and is performed by sequentially processing the unit information included in the first input information including a plurality of unit information that is information for each processing unit by the prediction unit 134. Acquires the progress information of the prediction process. Here, the sequential processing means that the information to be processed is processed according to a certain rule. As an example of a certain rule, there is a method of sequentially processing information including a plurality of processing units from the beginning. More specifically, the prediction unit 134 acquires the progress information for each unit information group divided by the predetermined unit information included in the first input information including a plurality of unit information.
例えば、予測部134は、複数の文字を含む第1検索クエリに含まれる所定の区切り文字で区切られた文字群毎に第1検索クエリのカテゴリを予測する予測処理の途中経過に関する情報である経過情報を取得する。続いて、予測部134は、取得した経過情報を用いて、複数の文字を含む第2検索クエリのカテゴリを予測する。具体的には、予測部134は、第1入力情報に対応する経過情報のうち、第2入力情報と共通する単位情報に対応する経過情報を用いて、第2特徴情報を予測する。例えば、予測部134は、第1入力情報に対応する経過情報のうち、第2入力情報と共通する単位情報までの学習モデルの内部状態に関する情報である経過情報を用いて、第2特徴情報を予測する。より具体的には、予測部134は、第1入力情報に対応する経過情報のうち、第2入力情報と共通する単位情報までの学習モデルの内部状態に関する情報である経過情報を用いて、第2特徴情報を予測する。予測部134は、第1入力情報に対応する経過情報のうち、第2入力情報と共通する単位情報までの学習モデルのアクティベーション(activation)に関する情報を用いて、第2特徴情報を予測する。予測部134は、第1入力情報に対応する経過情報のうち、第2入力情報と共通する単位情報までの学習モデルを構成する各層(各LSTM層)の中間的な計算結果に関する情報を用いて、第2特徴情報を予測する。例えば、予測部134は、複数の文字を含む第1検索クエリに対応する経過情報のうち、複数の文字を含む第2検索クエリと共通する文字に対応する経過情報を用いて、第2検索クエリのカテゴリを予測する。例えば、予測部134は、複数の文字群を含む第1検索クエリに対応する経過情報のうち、複数の文字群を含む第2検索クエリと共通する文字群に対応する経過情報を用いて、第2検索クエリのカテゴリを予測する。例えば、予測部134は、複数の文字を含む第1検索クエリに対応する経過情報のうち、複数の文字を含む第2検索クエリと一致する文字までの経過情報を用いて、第2検索クエリのカテゴリを予測する。例えば、予測部134は、複数の文字を含む第1検索クエリに対応する経過情報のうち、複数の文字を含む第2検索クエリと一致する文字までの第2学習モデルの内部状態に関する情報である経過情報を用いて、第2検索クエリのカテゴリを予測する。より具体的には、予測部134は、複数の文字を含む第1検索クエリに対応する経過情報のうち、複数の文字を含む第2検索クエリと一致する文字までの第2学習モデルの内部状態に関する情報である経過情報を用いて、第2検索クエリのカテゴリを予測する。 For example, the prediction unit 134 is information about the progress of the prediction process of predicting the category of the first search query for each character group separated by a predetermined delimiter included in the first search query including a plurality of characters. Get information. Then, the prediction unit 134 uses the acquired progress information to predict the category of the second search query including a plurality of characters. Specifically, the prediction unit 134 predicts the second characteristic information by using the progress information corresponding to the unit information common to the second input information among the progress information corresponding to the first input information. For example, the prediction unit 134 uses the progress information, which is information about the internal state of the learning model up to the unit information common to the second input information, among the progress information corresponding to the first input information, to determine the second feature information. Predict. More specifically, the prediction unit 134 uses the progress information, which is the information about the internal state of the learning model up to the unit information common to the second input information, from the progress information corresponding to the first input information, 2 Predict feature information. The prediction unit 134 predicts the second feature information by using information about activation of the learning model up to the unit information common to the second input information among the progress information corresponding to the first input information. The prediction unit 134 uses the information regarding the intermediate calculation result of each layer (each LSTM layer) that constitutes the learning model up to the unit information common to the second input information among the progress information corresponding to the first input information. , The second feature information is predicted. For example, the prediction unit 134 uses the progress information corresponding to the character common to the second search query including the plurality of characters among the progress information corresponding to the first search query including the plurality of characters, and then uses the progress information corresponding to the second search query. Predict the category of. For example, the prediction unit 134 uses the progress information corresponding to the character group common to the second search query including the plurality of character groups from the progress information corresponding to the first search query including the plurality of character groups, and 2 Predict category of search query. For example, the prediction unit 134 uses the progress information up to the character that matches the second search query including the plurality of characters among the progress information corresponding to the first search query including the plurality of characters, and uses the progress information of the second search query. Predict categories. For example, the prediction unit 134 is information about the internal state of the second learning model up to the character that matches the second search query that includes a plurality of characters in the progress information that corresponds to the first search query that includes a plurality of characters. The history information is used to predict the category of the second search query. More specifically, the prediction unit 134 causes the internal state of the second learning model up to the character matching the second search query including the plurality of characters in the progress information corresponding to the first search query including the plurality of characters. The category of the second search query is predicted using the history information that is information about the second search query.
図2に示す例では、予測部134は、記憶部120に記憶されている経過情報の中に、第2検索クエリ「六本木 お好み焼き」と一部又は全部が共通する文字群に対応する経過情報が存在するか否かを判定する。例えば、予測部134は、記憶部120に記憶されている文字群の中に、第2検索クエリ「六本木 お好み焼き」と一致する文字群が存在するか否かを判定する。予測部134は、第2検索クエリ「六本木 お好み焼き」と一致する文字群が存在しないと判定したとする。続いて、予測部134は、記憶部120に記憶されている文字群の中に、第2検索クエリ「六本木 お好み焼き」に含まれる文字群「六本木□」と共通する文字群「六本木□」が存在するか否かを判定する。予測部134は、第2検索クエリ「六本木 お好み焼き」に含まれる文字群「六本木□」と共通する文字群「六本木□」が存在すると判定したとする。続いて、予測部134は、共通する文字群「六本木□」が存在すると判定すると、共通する文字群「六本木□」に対応する経過情報を記憶部120から取得する。具体的には、予測部134は、文字群「六本木□」に対応する経過情報として、図1の処理ステップ「ステップ4」における第2学習モデルM2の内部状態に関する情報を取得する。より具体的には、予測部134は、文字群「六本木□」に対応する経過情報として、図1の処理ステップ「ステップ4」における第2学習モデルM2のアクティベーション(activation)に関する情報を取得する。すなわち、予測部134は、図1の処理ステップ「ステップ4」における第2学習モデルM2を構成する各層の中間的な計算結果に関する情報を取得する。図2に示す例では、予測部134は、図1の処理ステップ「ステップ4」における第2学習モデルM2を構成する3層のLSTM層の各層(各LSTM層)の中間的な計算結果であるベクトル(例えば、2048次元のベクトル)の値を3セット分(3層分)取得する。 In the example illustrated in FIG. 2, the prediction unit 134 includes, in the progress information stored in the storage unit 120, progress information corresponding to a character group that is partially or entirely common to the second search query “Roppongi Okonomiyaki”. Determine if it exists. For example, the prediction unit 134 determines whether or not the character group stored in the storage unit 120 includes a character group that matches the second search query “Roppongi Okonomiyaki”. It is assumed that the prediction unit 134 determines that there is no character group that matches the second search query “Roppongi Okonomiyaki”. Then, the prediction unit 134 has a character group “Roppongi□” that is common to the character group “Roppongi□” included in the second search query “Roppongi Okonomiyaki” among the character groups stored in the storage unit 120. It is determined whether to do. It is assumed that the prediction unit 134 determines that the character group “Roppongi□” common to the character group “Roppongi□” included in the second search query “Roppongi Okonomiyaki” exists. Subsequently, when the prediction unit 134 determines that the common character group “Roppongi□” exists, the prediction unit 134 acquires the progress information corresponding to the common character group “Roppongi□” from the storage unit 120. Specifically, the prediction unit 134 acquires information about the internal state of the second learning model M2 in the processing step “step 4” of FIG. 1 as the progress information corresponding to the character group “Roppongi□”. More specifically, the prediction unit 134 acquires information regarding the activation of the second learning model M2 in the processing step “step 4” of FIG. 1 as the progress information corresponding to the character group “Roppongi□”. .. That is, the prediction unit 134 acquires information about the intermediate calculation result of each layer forming the second learning model M2 in the processing step “step 4” of FIG. In the example illustrated in FIG. 2, the prediction unit 134 is an intermediate calculation result of each layer (each LSTM layer) of the three LSTM layers that configure the second learning model M2 in the processing step “step 4” of FIG. Three sets (three layers) of vector (for example, 2048-dimensional vector) values are acquired.
続いて、予測部134は、文字群「六本木□」に対応する経過情報を取得すると、取得した文字群「六本木□」に対応する経過情報を用いて、第2検索クエリ「六本木 お好み焼き」の分散表現を出力する。具体的には、予測部134は、図1の処理ステップ「ステップ4」における第2学習モデルM2の内部状態に関する情報を取得すると、処理ステップ「ステップ4」における第2学習モデルM2の内部状態を再現する。続いて、予測部134は、処理ステップ「ステップ4」における第2学習モデルM2の内部状態に関する情報に基づいて、第2検索クエリ「六本木 お好み焼き」の文字群「お好み焼き」以降の予測処理を開始する。すなわち、予測部134は、処理ステップ「ステップ4」における第2学習モデルM2を構成する各層の中間的な計算結果に関する情報に基づいて、第2検索クエリ「六本木 お好み焼き」の文字群「お好み焼き」以降の予測処理を開始する。そして、予測部134は、第2検索クエリ「六本木 お好み焼き」の分散表現を出力する。 Subsequently, when the prediction unit 134 acquires the progress information corresponding to the character group “Roppongi□”, the prediction unit 134 uses the progress information corresponding to the acquired character group “Roppongi□” to distribute the second search query “Roppongi Okonomiyaki”. Output the expression. Specifically, when the prediction unit 134 acquires the information about the internal state of the second learning model M2 in the processing step “step 4” of FIG. 1, the prediction unit 134 determines the internal state of the second learning model M2 in the processing step “step 4”. Reproduce. Subsequently, the prediction unit 134 starts the prediction process after the character group "Okonomiyaki" of the second search query "Roppongi Okonomiyaki" based on the information about the internal state of the second learning model M2 in the processing step "Step 4". .. That is, the prediction unit 134, based on the information about the intermediate calculation result of each layer forming the second learning model M2 in the processing step “Step 4”, the second search query “Roppongi Okonomiyaki” character group “Okonomiki” and subsequent characters. The prediction process of is started. Then, the prediction unit 134 outputs the distributed expression of the second search query “Roppongi Okonomiyaki”.
続いて、予測部134は、第2検索クエリ「六本木 お好み焼き」の分散表現を抽出して出力すると、第2学習モデルM2の出力データとして、第2検索クエリ「六本木 お好み焼き」の分散表現が各カテゴリに分類される確率をカテゴリ毎に出力する。例えば、予測部134は、第2検索クエリ「六本木 お好み焼き」の分散表現が、CAT11(「飲食店を探す」)に属する確率を「90(%)」、CAT12(「商品を探す」)に属する確率を「0(%)」、CAT13(「飲食店を予約する」)に属する確率を「10(%)」、CAT14(「商品を購入する」)に属する確率を「0(%)」と出力する。 Subsequently, when the prediction unit 134 extracts and outputs the distributed expression of the second search query “Roppongi Okonomiyaki”, the distributed expression of the second search query “Roppongi Okonomiyaki” is output as the output data of the second learning model M2 in each category. The probability of being classified into is output for each category. For example, the prediction unit 134 assigns the probability that the distributed expression of the second search query “Roppongi Okonomiyaki” belongs to CAT11 (“Find a restaurant”) to “90(%)” and CAT12 (“Find a product”). The probability is “0 (%)”, the probability of belonging to CAT13 (“reserve a restaurant”) is “10 (%)”, and the probability of belonging to CAT14 (“purchase a product”) is “0 (%)”. Output.
予測部134は、記憶部120を参照して、第2検索クエリと共通する文字群が複数存在すると判定した場合には、複数の文字群の間に包含関係があるか否かを判定する。例えば、予測部134は、第2検索クエリ「六本木□お好み焼き□おすすめ」が入力された時点において、第2検索クエリと共通する文字群として、文字群「六本木□お好み焼き□」と文字群「六本木□」の2つが記憶部120に存在する場合には、文字群「六本木□お好み焼き□」と文字群「六本木□」との間に包含関係があるか否かを判定する。続いて、予測部134は、複数の文字群の間に包含関係があると判定した場合、複数の文字群の中から他の文字群をいずれも包含する文字群を選択する。続いて、予測部134は、選択した文字群に対応する経過情報を記憶部120から取得する。例えば、予測部134は、文字群「六本木□お好み焼き□」と文字群「六本木□」との間には、文字群「六本木□お好み焼き□」が文字群「六本木□」を含む(文字群「六本木□」が文字群「六本木□お好み焼き□」に包含される)関係があると判定する。続いて、予測部134は、文字群「六本木□お好み焼き□」と文字群「六本木□」との間に、文字群「六本木□お好み焼き□」が文字群「六本木□」を含む包含関係があると判定すると、文字群「六本木□」を含む文字群「六本木□お好み焼き□」を選択する。続いて、予測部134は、選択した文字群「六本木□お好み焼き□」に対応する経過情報を記憶部120から取得する。なお、図2では、第2学習モデルM2がLSTM‐RNNであるため、第2検索クエリと共通する文字群が複数存在する場合には、文字群の間に必ず包含関係が存在する。そのため、予測部134は、第2検索クエリと共通する文字群が複数存在する場合には、最も長い文字群(文字数が最も多い文字群)を選択する。そして、予測部134は、選択した最長の文字群に対応する経過情報を記憶部120から取得する。 When the prediction unit 134 refers to the storage unit 120 and determines that there are a plurality of character groups that are common to the second search query, the prediction unit 134 determines whether or not there is an inclusive relationship between the plurality of character groups. For example, the prediction unit 134, when the second search query “Roppongi □ Okonomiyaki □ recommended” is input, as the character group common to the second search query, the character group “Roppongi □ Okonomiyaki □” and the character group “Roppongi □”. 2” in the storage unit 120, it is determined whether or not there is an inclusive relation between the character group “Roppongi □ Okonomiyaki □” and the character group “Roppongi □”. Subsequently, when the prediction unit 134 determines that there is an inclusive relationship between the plurality of character groups, the prediction unit 134 selects a character group that includes all of the other character groups from the plurality of character groups. Then, the prediction unit 134 acquires the progress information corresponding to the selected character group from the storage unit 120. For example, the prediction unit 134 includes the character group “Roppongi □ Okonomiyaki □” and the character group “Roppongi □” in the character group “Roppongi □ Okonomiyaki □” (the character group “Roppongi □”). □” is included in the character group “Roppongi □ Okonomiyaki □”). Subsequently, the prediction unit 134 determines that the character group “Roppongi □ Okonomiyaki □” includes the character group “Roppongi □” between the character group “Roppongi □ Okonomiyaki □” and the character group “Roppongi □”. When judged, the character group "Roppongi □ Okonomiyaki □" including the character group "Roppongi □" is selected. Subsequently, the prediction unit 134 acquires the progress information corresponding to the selected character group “Roppongi □ Okonomiyaki □” from the storage unit 120. Note that, in FIG. 2, since the second learning model M2 is the LSTM-RNN, when there are a plurality of character groups that are common to the second search query, an inclusive relationship always exists between the character groups. Therefore, when there are a plurality of character groups common to the second search query, the prediction unit 134 selects the longest character group (the character group having the largest number of characters). Then, the prediction unit 134 acquires the progress information corresponding to the selected longest character group from the storage unit 120.
また、予測部134は、経過情報記憶部125を参照して、第1入力情報に含まれる所定数の単位情報毎に経過情報を取得する。例えば、予測部134は、単位情報である文字を含む第1入力情報に含まれる所定数の文字毎に第1特徴情報の予測処理の途中経過に関する情報を取得する。例えば、予測部134は、複数の文字を含む第1検索クエリに含まれる文字毎に第1検索クエリのカテゴリを予測する予測処理の途中経過に関する情報である経過情報を取得する。続いて、予測部134は、取得した経過情報を用いて、複数の文字を含む第2検索クエリのカテゴリを予測する。具体的には、予測部134は、第1入力情報に対応する経過情報のうち、第2入力情報と共通する単位情報に対応する経過情報を用いて、第2特徴情報を予測する。例えば、予測部134は、第1入力情報に対応する経過情報のうち、第2入力情報と共通する単位情報に対応する学習モデルの内部状態に関する情報である経過情報を用いて、第2特徴情報を予測する。より具体的には、予測部134は、第1入力情報に対応する経過情報のうち、第2入力情報と共通する単位情報に対応する学習モデルの内部状態に関する情報である経過情報を用いて、第2特徴情報を予測する。例えば、予測部134は、複数の文字を含む第1検索クエリに対応する経過情報のうち、複数の文字を含む第2検索クエリと共通する文字に対応する経過情報を用いて、第2検索クエリのカテゴリを予測する。例えば、予測部134は、複数の文字を含む第1検索クエリに対応する経過情報のうち、複数の文字を含む第2検索クエリと一致する文字までの経過情報を用いて、第2検索クエリのカテゴリを予測する。例えば、予測部134は、複数の文字を含む第1検索クエリに対応する経過情報のうち、複数の文字を含む第2検索クエリと一致する文字までの第2学習モデルの内部状態に関する情報である経過情報を用いて、第2検索クエリのカテゴリを予測する。より具体的には、予測部134は、複数の文字を含む第1検索クエリに対応する経過情報のうち、複数の文字を含む第2検索クエリと一致する文字までの第2学習モデルの内部状態に関する情報である経過情報を用いて、第2検索クエリのカテゴリを予測する。 In addition, the prediction unit 134 refers to the progress information storage unit 125 and acquires the progress information for each predetermined number of unit information items included in the first input information. For example, the prediction unit 134 acquires information about the progress of the prediction process of the first characteristic information for each predetermined number of characters included in the first input information including the character that is the unit information. For example, the prediction unit 134 acquires progress information that is information about the progress of the prediction process of predicting the category of the first search query for each character included in the first search query that includes a plurality of characters. Subsequently, the prediction unit 134 predicts the category of the second search query including a plurality of characters by using the acquired progress information. Specifically, the prediction unit 134 predicts the second characteristic information by using the progress information corresponding to the unit information common to the second input information, among the progress information corresponding to the first input information. For example, the prediction unit 134 uses the progress information, which is information about the internal state of the learning model corresponding to the unit information common to the second input information, among the progress information corresponding to the first input information, and uses the second feature information. Predict. More specifically, the prediction unit 134 uses the progress information, which is the information about the internal state of the learning model corresponding to the unit information common to the second input information, among the progress information corresponding to the first input information, Predict the second feature information. For example, the prediction unit 134 uses the progress information corresponding to the character common to the second search query including the plurality of characters among the progress information corresponding to the first search query including the plurality of characters, and then uses the progress information corresponding to the second search query. Predict the category of. For example, the prediction unit 134 uses the progress information up to the character that matches the second search query including the plurality of characters among the progress information corresponding to the first search query including the plurality of characters, and uses the progress information of the second search query. Predict categories. For example, the prediction unit 134 is information about the internal state of the second learning model up to the character that matches the second search query that includes a plurality of characters in the progress information that corresponds to the first search query that includes a plurality of characters. The history information is used to predict the category of the second search query. More specifically, the prediction unit 134 causes the internal state of the second learning model up to the character matching the second search query including the plurality of characters in the progress information corresponding to the first search query including the plurality of characters. The category of the second search query is predicted using the history information that is information about the second search query.
〔4.第1学習モデルの生成処理のフロー〕
次に、図15を用いて、実施形態に係る第1学習モデルの生成処理の手順について説明する。図15は、実施形態に係る第1学習モデルの生成処理手順を示すフローチャートである。図15に示す例では、情報処理装置100は、ユーザによって入力された検索クエリを取得する(ステップS101)。
[4. Flow of processing for generating first learning model]
Next, the procedure of the first learning model generation process according to the embodiment will be described with reference to FIG. 15. FIG. 15 is a flowchart showing a procedure for generating the first learning model according to the embodiment. In the example illustrated in FIG. 15, the
続いて、情報処理装置100は、同一のユーザによって所定の時間内に入力された複数の検索クエリを抽出する(ステップS102)。
Subsequently, the
続いて、情報処理装置100は、抽出した複数の検索クエリが類似する特徴を有するものとして学習することで、所定の検索クエリから所定の検索クエリの特徴情報を予測する第1学習モデルを生成する(ステップS103)。
Subsequently, the
〔5.第2学習モデルの生成処理のフロー〕
次に、図16を用いて、実施形態に係る第2学習モデルの生成処理の手順について説明する。図16は、実施形態に係る第2学習モデルの生成処理の手順を示すフローチャートである。図16に示す例では、情報処理装置100は、第1学習モデル(第1学習モデルM1のモデルデータMDT1)を取得する(ステップS201)。
[5. Flow of second learning model generation processing]
Next, the procedure of the second learning model generation process according to the embodiment will be described with reference to FIG. 16. FIG. 16 is a flowchart showing the procedure of the second learning model generation processing according to the embodiment. In the example illustrated in FIG. 16, the
続いて、情報処理装置100は、第1学習モデルを用いて、所定の検索クエリから所定の検索クエリのカテゴリを予測する第2学習モデルを生成する(ステップS202)。
Then, the
〔6.情報処理のフロー〕
次に、図17を用いて、実施形態に係る情報処理の手順について説明する。図17は、実施形態に係る情報処理の手順を示すフローチャートである。図17に示す例では、情報処理装置100は、検索クエリを受け付けたか否かを判定する(ステップS301)。情報処理装置100は、検索クエリを受け付けていない場合(ステップS301;No)、検索クエリを受け付けるまで待機する。
[6. Information processing flow]
Next, a procedure of information processing according to the embodiment will be described with reference to FIG. FIG. 17 is a flowchart showing a procedure of information processing according to the embodiment. In the example illustrated in FIG. 17, the
一方、情報処理装置100は、検索クエリを受け付けた場合(ステップS301;Yes)、検索クエリに対応する文字群が所定の区切り文字を含むか否かを判定する(ステップS302)。情報処理装置100は、検索クエリに対応する文字群が所定の区切り文字を含まない場合(ステップS302;No)、文字群に対応する経過情報が経過情報記憶部125に存在するか否かを判定する(ステップS305)。情報処理装置100は、文字群に対応する経過情報が経過情報記憶部125に存在する場合(ステップS305;Yes)、処理を終了する。一方、情報処理装置100は、文字群に対応する経過情報が経過情報記憶部125に存在しない場合(ステップS305;No)、文字群に対応する経過情報を経過情報記憶部125に記憶する(ステップS306)。
On the other hand, when the
一方、情報処理装置100は、検索クエリに対応する文字群が所定の区切り文字を含む場合(ステップS302;Yes)、所定の区切り文字で区切られた文字群に対応する経過情報が経過情報記憶部125に存在するか否かを判定する(ステップS303)。情報処理装置100は、所定の区切り文字で区切られた文字群に対応する経過情報が経過情報記憶部125に存在する場合(ステップS303;Yes)、処理を終了する。一方、情報処理装置100は、所定の区切り文字で区切られた文字群に対応する経過情報が経過情報記憶部125に存在しない場合(ステップS303;No)、所定の区切り文字で区切られた文字群に対応する経過情報を経過情報記憶部125に記憶する(ステップS304)。
On the other hand, when the character group corresponding to the search query includes a predetermined delimiter (Yes in step S302), the
〔7.予測処理のフロー〕
次に、図18を用いて、実施形態に係る予測処理の手順について説明する。図18は、実施形態に係る予測処理の手順を示すフローチャートである。図18に示す例では、情報処理装置100は、検索クエリを受け付けたか否かを判定する(ステップS401)。情報処理装置100は、検索クエリを受け付けていない場合(ステップS401;No)、検索クエリを受け付けるまで待機する。
[7. Prediction processing flow]
Next, the procedure of the prediction process according to the embodiment will be described with reference to FIG. FIG. 18 is a flowchart showing the procedure of the prediction process according to the embodiment. In the example illustrated in FIG. 18, the
一方、情報処理装置100は、検索クエリを受け付けた場合(ステップS401;Yes)、検索クエリに対応する文字群が所定の区切り文字を含むか否かを判定する(ステップS402)。情報処理装置100は、検索クエリに対応する文字群が所定の区切り文字を含まない場合(ステップS402;No)、文字群に対応する経過情報が経過情報記憶部125に存在するか否かを判定する(ステップS406)。情報処理装置100は、文字群に対応する経過情報が経過情報記憶部125に存在しない場合(ステップS406;No)、検索クエリのカテゴリを予測する(ステップS405)。一方、情報処理装置100は、文字群に対応する経過情報が経過情報記憶部125に存在する場合(ステップS406;Yes)、文字群に対応する経過情報を経過情報記憶部125から取得する(ステップS407)。情報処理装置100は、文字群に対応する経過情報を取得すると、取得した経過情報を用いて、検索クエリのカテゴリを予測する(ステップS405)。
On the other hand, when the
一方、情報処理装置100は、検索クエリに対応する文字群が所定の区切り文字を含む場合(ステップS402;Yes)、所定の区切り文字で区切られた文字群に対応する経過情報が経過情報記憶部125に存在するか否かを判定する(ステップS403)。情報処理装置100は、所定の区切り文字で区切られた文字群に対応する経過情報が経過情報記憶部125に存在する場合(ステップS403;Yes)、所定の区切り文字で区切られた文字群に対応する経過情報を経過情報記憶部125から取得する(ステップS404)。情報処理装置100は、所定の区切り文字で区切られた文字群に対応する経過情報を取得すると、取得した経過情報を用いて、検索クエリのカテゴリを予測する(ステップS405)。一方、情報処理装置100は、所定の区切り文字で区切られた文字群に対応する経過情報が経過情報記憶部125に存在しない場合(ステップS403;No)、検索クエリのカテゴリを予測する(ステップS405)。
On the other hand, in the
〔8.変形例〕
上述した実施形態に係る情報処理システム1は、上記実施形態以外にも種々の異なる形態にて実施されてよい。そこで、以下では、情報処理システム1の他の実施形態について説明する。なお、実施形態と同一部分には、同一符号を付して説明を省略する。
[8. Modified example)
The
上述した実施形態では、第2学習モデルM2が再帰的ニューラルネットワーク(Recurrent Neural Network)の一種であるLSTM(Long Short-Term Memory)で構成される例について説明したが、第2学習モデルM2はLSTM−RNNに限られない。ここでは、第2学習モデルM2が他の構造である場合について説明する。 In the above-described embodiment, an example in which the second learning model M2 is configured by LSTM (Long Short-Term Memory) which is a type of recursive neural network (Recurrent Neural Network) has been described, but the second learning model M2 is LSTM. -Not limited to RNN. Here, a case where the second learning model M2 has another structure will be described.
〔8−1.Recursive Neural Network〕
次に、図19を用いて、変形例に係る情報処理について説明する。図19は、変形例に係る情報処理の一例を示す図である。取得部131は、木構造型再帰的ニューラルネットワーク(Recursive Neural Network)である学習モデルを用いて予測部134によって予測された第1特徴情報の予測処理の途中経過に関する情報である経過情報を取得する。取得部131は、経過情報を取得すると、取得した経過情報を文字群と対応付けて経過情報記憶部125に記憶する。
[8-1. Recursive Neural Network)
Next, information processing according to the modification will be described with reference to FIG. FIG. 19 is a diagram illustrating an example of information processing according to the modification. The acquisition unit 131 acquires progress information, which is information about the progress of the prediction process of the first feature information predicted by the prediction unit 134, using a learning model that is a tree-structured recursive neural network. .. When acquiring the progress information, the acquisition unit 131 stores the acquired progress information in the progress information storage unit 125 in association with the character group.
図19に示す例では、予測部134は、地名を示す「六本木」と料理の種類を示す「ラーメン」とが所定の区切り文字であるスペース(以下、スペースを適宜記号「□」で記載する。)で区切られた文字群である第1検索クエリ「六本木□ラーメン」を先頭から一文字ずつ木構造型再帰的ニューラルネットワーク(Recursive Neural Network)である第2学習モデルM2Aに入力する(ステップS1A)。予測部134は、第1検索クエリ「六本木□ラーメン」が第2学習モデルM2Aに入力されると、第1検索クエリ「六本木□ラーメン」が所定の区切り文字であるスペースを含むか否かを判定する。続いて、予測部134は、第1検索クエリ「六本木□ラーメン」が所定の区切り文字であるスペースを含むと判定した場合、第1検索クエリ「六本木□ラーメン」に含まれる文字群「六本木□」と文字群「ラーメン」とを、それぞれ別々に順次処理する。図19に示すように、予測部134は、第1検索クエリ「六本木□ラーメン」に含まれる文字群である「六本木□」と文字群である「ラーメン」とを、それぞれ別々に順次処理する。具体的には、予測部134は、各文字群の先頭から一文字ずつ順次処理する。 In the example illustrated in FIG. 19, the prediction unit 134 describes a space in which “Roppongi” indicating a place name and “ramen” indicating a type of dish are predetermined delimiters (hereinafter, the space is appropriately represented by a symbol “□”). The first search query “Roppongi □ Ramen”, which is a character group delimited by ), is input to the second learning model M2A that is a tree-structured recursive neural network from the beginning (step S1A). When the first search query “Roppongi□Ramen” is input to the second learning model M2A, the prediction unit 134 determines whether or not the first search query “Roppongi□Ramen” includes a space that is a predetermined delimiter. To do. Subsequently, when the prediction unit 134 determines that the first search query “Roppongi □ ramen” includes a space that is a predetermined delimiter, the character group “Roppongi □” included in the first search query “Roppongi □ ramen”. And the character group "ramen" are sequentially processed separately. As illustrated in FIG. 19, the prediction unit 134 sequentially processes the character group “Roppongi□” and the character group “Ramen” included in the first search query “Roppongi□Ramen” separately. Specifically, the prediction unit 134 sequentially processes one character from the beginning of each character group.
例えば、予測部134は、処理ステップ「ステップLA1−1」で、第2学習モデルM2Aの入力情報の一部である文字群「六本木□」に含まれる先頭の2文字「六本」の予測結果を出力する。続いて、予測部134は、処理ステップ「ステップLA2−1」で、入力情報の一部である文字群「六本木□」に含まれる3文字目の「木」と処理ステップ「ステップLA1−1」の予測結果とに基づいて、先頭の3文字「六本木」の予測結果を出力する。続いて、予測部134は、処理ステップ「ステップLA3−1」で、入力情報の一部である文字群「六本木□」に含まれる4文字目の「□」と処理ステップ「ステップLA2−1」の予測結果とに基づいて、入力情報の一部である文字群「六本木□」の中間的な計算結果に関する情報である第1経過情報を出力する。 For example, the prediction unit 134, in the processing step “step LA1-1”, the prediction result of the first two characters “Roppon” included in the character group “Roppongi□” that is a part of the input information of the second learning model M2A. Is output. Subsequently, the prediction unit 134, in the processing step “step LA2-1”, the third character “tree” included in the character group “Roppongi□” that is a part of the input information and the processing step “step LA1-1”. The prediction result of the first three characters "Roppongi" is output based on the prediction result of the above. Subsequently, the prediction unit 134, in the processing step “step LA3-1”, the fourth character “□” included in the character group “Roppongi□” that is a part of the input information and the processing step “step LA2-1”. The first progress information, which is information about the intermediate calculation result of the character group “Roppongi□” that is a part of the input information, is output based on the prediction result of 1.
また、例えば、予測部134は、処理ステップ「ステップLA1−2」で、第2学習モデルM2Aの入力情報の一部である文字群「ラーメン」に含まれる先頭の2文字「ラー」の予測結果を出力する。続いて、予測部134は、処理ステップ「ステップLA2−2」で、入力情報の一部である文字群「ラーメン」に含まれる3文字目の「メ」と処理ステップ「ステップLA1−2」の予測結果とに基づいて、先頭の3文字「ラーメ」の予測結果を出力する。続いて、予測部134は、処理ステップ「ステップLA3−2」で、入力情報の一部である文字群「ラーメン」に含まれる4文字目の「ン」と処理ステップ「ステップLA2−1」の予測結果とに基づいて、入力情報の一部である文字群「ラーメン」の中間的な計算結果に関する情報である第2経過情報を出力する。 In addition, for example, the prediction unit 134, in the processing step “step LA1-2”, the prediction result of the first two characters “Ra” included in the character group “Ramen” that is a part of the input information of the second learning model M2A. Is output. Subsequently, in the processing step “step LA2-2”, the prediction unit 134 executes the third character “me” included in the character group “ramen” that is a part of the input information and the processing step “step LA1-2”. Based on the prediction result, the prediction result of the first three characters “lame” is output. Subsequently, in the processing step “step LA3-2”, the prediction unit 134 executes the fourth character “n” included in the character group “ramen” that is a part of the input information and the processing step “step LA2-1”. Based on the prediction result, the second progress information, which is information about the intermediate calculation result of the character group “ramen” that is a part of the input information, is output.
続いて、取得部131は、予測部134が第2検索クエリから第2検索クエリが属するカテゴリを予測する予測処理に用いる情報として、第1検索クエリ「六本木 ラーメン」が属するカテゴリの予測処理の途中経過に関する情報である経過情報を取得する。例えば、取得部131は、地名を示す「六本木」と区切り文字であるスペースからなる文字群「六本木□」に対応する第1経過情報(図19に示す処理ステップ「LA3−1」のステップにおける第2学習モデルM2Aを構成する各層の中間的な計算結果に関する情報)を取得する(ステップS2A−1)。取得部131は、第1経過情報を取得すると、取得した第1経過情報を文字群「六本木□」と対応付けて経過情報記憶部125に記憶する。また、取得部131は、料理名を示す「ラーメン」である文字群「ラーメン」に対応する第2経過情報(図19に示す処理ステップ「LA3−2」のステップにおける第2学習モデルM2Aを構成する各層の中間的な計算結果に関する情報)を取得する(ステップS2A−2)。取得部131は、第2経過情報を取得すると、取得した第2経過情報を文字群「ラーメンと対応付けて経過情報記憶部125に記憶する。 Then, the acquisition unit 131 uses the prediction unit 134 in the process of predicting the category to which the first search query “Roppongi Ramen” belongs, as information used in the prediction process to predict the category to which the second search query belongs from the second search query. Acquires the progress information that is information about the progress. For example, the acquisition unit 131 uses the first progress information corresponding to the character group “Roppongi□” that includes a space name that is a delimiter and “Roppongi” that represents a place name (the first progress information in the step of the processing step “LA3-1” illustrated in FIG. The information about the intermediate calculation result of each layer forming the 2 learning model M2A) is acquired (step S2A-1). When the acquisition unit 131 acquires the first progress information, the acquisition unit 131 stores the acquired first progress information in the progress information storage unit 125 in association with the character group “Roppongi□”. In addition, the acquisition unit 131 configures the second progress information corresponding to the character group “ramen” that is the “ramen” that indicates the dish name (the second learning model M2A in the step of the processing step “LA3-2” illustrated in FIG. 19 is configured. Information regarding the intermediate calculation result of each layer) is acquired (step S2A-2). When acquiring the second progress information, the acquisition unit 131 stores the acquired second progress information in the progress information storage unit 125 in association with the character group “ramen.
続いて、予測部134は、記憶部120によって経過情報が記憶されると、第1検索クエリ「六本木 ラーメン」の分散表現を出力する(ステップS3A)。なお、情報処理装置100は、第1検索クエリ「六本木 ラーメン」と全く同じ検索クエリが入力された場合に備えて、第1検索クエリ「六本木 ラーメン」に対応する分散表現を記憶部120(図3参照)に記憶する。
Subsequently, when the storage unit 120 stores the historical information, the prediction unit 134 outputs the distributed expression of the first search query “Roppongi Ramen” (step S3A). In addition, the
続いて、情報処理装置100は、第1検索クエリ「六本木 ラーメン」の分散表現を抽出して出力すると、第2学習モデルM2Aの出力データとして、第1検索クエリ「六本木 ラーメン」の分散表現が各カテゴリに分類される確率をカテゴリ毎に出力する(ステップS4A)。例えば、情報処理装置100は、第1検索クエリ「六本木 ラーメン」の分散表現が、CAT11(「飲食店を探す」)に属する確率を「90(%)」、CAT12(「商品を探す」)に属する確率を「0(%)」、CAT13(「飲食店を予約する」)に属する確率を「10(%)」、CAT14(「商品を購入する」)に属する確率を「0(%)」と出力する。
Subsequently, when the
なお、取得部131は、スペース等の区切り文字に限られず、検索クエリをどこで区切り、第2学習モデルM2Aの内部状態に関する情報をどのような単位で記憶してもよい。具体的には、予測部134は、第1検索クエリが一定のルール(又は一定の手順)で区分できるか否かを判定する。例えば、予測部134は、形態素解析を用いて第1検索クエリが区分できるか否かを判定する。また、例えば、予測部134は、BPEを用いて第1検索クエリが区分できるか否かを判定する。続いて、予測部134は、第1検索クエリが一定のルール(又は一定の手順)で区分できると判定した場合、第1検索クエリを一定のルール(又は一定の手順)で区分した単位ごとに、それぞれ別々に順次処理する。例えば、予測部134は、形態素解析を用いて第1検索クエリを区分できると判定した場合、形態素解析を用いて第1検索クエリを区分した単位ごとに、それぞれ別々に順次処理する。また、例えば、予測部134は、BPEを用いて第1検索クエリを区分できると判定した場合、BPEを用いて第1検索クエリを区分した単位ごとに、それぞれ別々に順次処理する。続いて、取得部131は、予測部134によって予測処理された単位ごとに、対応する経過情報を取得する。 Note that the acquisition unit 131 is not limited to a delimiter such as a space, and may delimit the search query anywhere and store information regarding the internal state of the second learning model M2A in any unit. Specifically, the prediction unit 134 determines whether the first search query can be classified according to a certain rule (or a certain procedure). For example, the prediction unit 134 uses morphological analysis to determine whether the first search query can be classified. Further, for example, the prediction unit 134 determines whether or not the first search query can be classified using BPE. Subsequently, when the prediction unit 134 determines that the first search query can be classified according to a certain rule (or a certain procedure), the prediction unit 134 is divided for each unit of the first search query according to a certain rule (or a certain procedure). , Each of which is processed separately. For example, when the prediction unit 134 determines that the first search query can be classified by using the morphological analysis, the prediction unit 134 sequentially and sequentially processes each of the units by which the first search query is classified by using the morphological analysis. In addition, for example, when the prediction unit 134 determines that the first search query can be classified using the BPE, the prediction unit 134 sequentially processes the first search query using the BPE separately. Subsequently, the acquisition unit 131 acquires corresponding progress information for each unit for which the prediction processing is performed by the prediction unit 134.
〔8−2.Dilated Convolutional Neural Network〕
次に、図20を用いて、変形例に係る情報処理について説明する。図20は、変形例に係る情報処理の一例を示す図である。取得部131は、拡張畳み込みニューラルネットワーク(Dilated Convolutional Neural Network)である学習モデルを用いて予測部134によって予測された第1特徴情報の予測処理の途中経過に関する情報である経過情報を取得する。取得部131は、経過情報を取得すると、取得した経過情報を文字群と対応付けて経過情報記憶部125に格納する。
[8-2. Dilated Convolutional Neural Network)
Next, information processing according to the modification will be described with reference to FIG. FIG. 20 is a diagram illustrating an example of information processing according to the modification. The acquisition unit 131 acquires progress information, which is information about the progress of the prediction process of the first feature information predicted by the prediction unit 134, using a learning model that is an extended convolutional neural network (Dilated Convolutional Neural Network). When acquiring the progress information, the acquisition unit 131 stores the acquired progress information in the progress information storage unit 125 in association with the character group.
図20に示す例では、予測部134は、地名を示す「六本木」と料理の種類を示す「ラーメン」とが所定の区切り文字であるスペース(以下、スペースを適宜記号「□」で記載する。)で区切られた文字群である第1検索クエリ「六本木□ラーメン」を先頭から一文字ずつ拡張畳み込みニューラルネットワーク(Dilated Convolutional Neural Network)である第2学習モデルM2Bに入力する(ステップS1B)。予測部134は、第1検索クエリ「六本木□ラーメン」が第2学習モデルM2Bに入力されると、第1検索クエリ「六本木□ラーメン」が所定の区切り文字であるスペースを含むか否かを判定する。続いて、予測部134は、第1検索クエリ「六本木□ラーメン」が所定の区切り文字であるスペースを含むと判定した場合、第1検索クエリ「六本木□ラーメン」に含まれる文字群「六本木□」と文字群「ラーメン」とを、それぞれ別々に順次処理する。図20に示すように、予測部134は、第1検索クエリ「六本木□ラーメン」に含まれる文字群である「六本木□」と文字群である「ラーメン」とを、それぞれ別々に順次処理する。 In the example illustrated in FIG. 20, the prediction unit 134 writes a space in which “Roppongi” that represents a place name and “ramen” that represents the type of dish are predetermined delimiters (hereinafter, the space is appropriately represented by a symbol “□”). The first search query “Roppongi □ ramen”, which is a character group delimited by ), is input to the second learning model M2B, which is an extended convolutional neural network (Dilated Convolutional Neural Network), character by character from the beginning (step S1B). When the first search query “Roppongi□Ramen” is input to the second learning model M2B, the prediction unit 134 determines whether or not the first search query “Roppongi□Ramen” includes a space that is a predetermined delimiter. To do. Subsequently, when the prediction unit 134 determines that the first search query “Roppongi □ ramen” includes a space that is a predetermined delimiter, the character group “Roppongi □” included in the first search query “Roppongi □ ramen”. And the character group "ramen" are sequentially processed separately. As illustrated in FIG. 20, the prediction unit 134 sequentially processes the character group “Roppongi□” and the character group “Ramen” included in the first search query “Roppongi□Ramen” separately.
例えば、予測部134は、処理ステップ「ステップLB1−1」で、第2学習モデルM2Bの入力情報の一部である文字群「六本木□」に含まれる前半の2文字「六本」の予測結果を出力する。また、例えば、予測部134は、処理ステップ「ステップLB1−2」で、第2学習モデルM2Bの入力情報の一部である文字群「六本木□」に含まれる後半の2文字「木□」の予測結果を出力する。続いて、予測部134は、処理ステップ「ステップLB2−1」で、処理ステップ「ステップLB1−1」の予測結果と処理ステップ「ステップLB1−2」の予測結果とに基づいて、入力情報の一部である文字群「六本木□」の中間的な計算結果に関する情報である第1経過情報を出力する。 For example, the prediction unit 134, in the processing step “step LB1-1”, the prediction result of the first two characters “Roppongi” included in the character group “Roppongi□” that is a part of the input information of the second learning model M2B. Is output. In addition, for example, the prediction unit 134, in the processing step “step LB1-2”, includes the latter two characters “tree □” included in the character group “Roppongi □” that is a part of the input information of the second learning model M2B. Output the prediction result. Subsequently, in the processing step “step LB2-1”, the prediction unit 134 sets one of the input information based on the prediction result of the processing step “step LB1-1” and the prediction result of the processing step “step LB1-2”. The first progress information, which is information about an intermediate calculation result of the character group “Roppongi□” that is a part, is output.
また、例えば、予測部134は、処理ステップ「ステップLB1−3」で、第2学習モデルM2Bの入力情報の一部である文字群「ラーメン」に含まれる前半の2文字「ラー」の予測結果を出力する。また、例えば、予測部134は、処理ステップ「ステップLB1−4」で、第2学習モデルM2Bの入力情報の一部である文字群「ラーメン」に含まれる後半の2文字「メン」の予測結果を出力する。続いて、予測部134は、処理ステップ「ステップLB2−2」で、処理ステップ「ステップLB1−3」の予測結果と処理ステップ「ステップLB1−4」の予測結果とに基づいて、入力情報の一部である文字群「ラーメン」の中間的な計算結果に関する情報である第2経過情報を出力する。 In addition, for example, the prediction unit 134, in the processing step “step LB1-3”, a prediction result of the first two characters “Ra” included in the character group “Ramen” that is a part of the input information of the second learning model M2B. Is output. Further, for example, the prediction unit 134, in the processing step “step LB1-4”, the prediction result of the latter two characters “men” included in the character group “ramen” that is a part of the input information of the second learning model M2B. Is output. Subsequently, in the processing step “step LB2-2”, the prediction unit 134 sets one of the input information based on the prediction result of the processing step “step LB1-3” and the prediction result of the processing step “step LB1-4”. Second progress information, which is information about an intermediate calculation result of the character group “ramen” that is a part, is output.
続いて、取得部131は、予測部134が第2検索クエリから第2検索クエリが属するカテゴリを予測する予測処理に用いる情報として、第1検索クエリ「六本木□ラーメン」が属するカテゴリの予測処理の途中経過に関する情報である経過情報を取得する。例えば、取得部131は、地名を示す「六本木」と区切り文字であるスペースからなる文字群「六本木□」に対応する第1経過情報を取得する(ステップS2B−1)。取得部131は、第1経過情報を取得すると、取得した第1経過情報を文字群「六本木□」と対応付けて経過情報記憶部125に記憶する。また、取得部131は、料理名を示す「ラーメン」である文字群「ラーメン」に対応する第2経過情報を取得する(ステップS2B−2)。取得部131は、第2経過情報を取得すると、取得した第2経過情報を文字群「ラーメンと対応付けて経過情報記憶部125に記憶する。 Then, the acquisition unit 131 uses the prediction process of the category to which the first search query “Roppongi □ ramen” belongs, as the information used by the prediction unit 134 to predict the category to which the second search query belongs from the second search query. Acquire progress information that is information about the progress. For example, the acquisition unit 131 acquires the first progress information corresponding to the character group “Roppongi□” that includes a space name that is a delimiter and “Roppongi” that represents a place name (step S2B-1). When the acquisition unit 131 acquires the first progress information, the acquisition unit 131 stores the acquired first progress information in the progress information storage unit 125 in association with the character group “Roppongi□”. Moreover, the acquisition part 131 acquires the 2nd progress information corresponding to the character group "ramen" which is "ramen" which shows a dish name (step S2B-2). When acquiring the second progress information, the acquisition unit 131 stores the acquired second progress information in the progress information storage unit 125 in association with the character group “ramen.
続いて、予測部134は、記憶部120によって経過情報が記憶されると、第1検索クエリ「六本木□ラーメン」の分散表現を出力する(ステップS3B)。なお、情報処理装置100は、第1検索クエリ「六本木□ラーメン」と全く同じ検索クエリが入力された場合に備えて、第1検索クエリ「六本木□ラーメン」に対応する分散表現を記憶部120(図3参照)に記憶する。
Subsequently, when the storage unit 120 stores the historical information, the prediction unit 134 outputs the distributed expression of the first search query “Roppongi□Ramen” (step S3B). Note that the
続いて、情報処理装置100は、第1検索クエリ「六本木□ラーメン」の分散表現を抽出して出力すると、第2学習モデルM2Bの出力データとして、第1検索クエリ「六本木□ラーメン」の分散表現が各カテゴリに分類される確率をカテゴリ毎に出力する(ステップS4B)。例えば、情報処理装置100は、第1検索クエリ「六本木□ラーメン」の分散表現が、CAT11(「飲食店を探す」)に属する確率を「90(%)」、CAT12(「商品を探す」)に属する確率を「0(%)」、CAT13(「飲食店を予約する」)に属する確率を「10(%)」、CAT14(「商品を購入する」)に属する確率を「0(%)」と出力する。
Subsequently, when the
なお、取得部131は、スペース等の区切り文字に限られず、検索クエリをどこで区切り、第2学習モデルM2Bの内部状態に関する情報をどのような単位で記憶してもよい。具体的には、予測部134は、第1検索クエリが一定のルール(又は一定の手順)で区分できるか否かを判定する。例えば、予測部134は、形態素解析を用いて第1検索クエリが区分できるか否かを判定する。また、例えば、予測部134は、BPEを用いて第1検索クエリが区分できるか否かを判定する。続いて、予測部134は、第1検索クエリが一定のルール(又は一定の手順)で区分できると判定した場合、第1検索クエリを一定のルール(又は一定の手順)で区分した単位ごとに、それぞれ別々に順次処理する。例えば、予測部134は、形態素解析を用いて第1検索クエリを区分できると判定した場合、形態素解析を用いて第1検索クエリを区分した単位ごとに、それぞれ別々に順次処理する。また、例えば、予測部134は、BPEを用いて第1検索クエリを区分できると判定した場合、BPEを用いて第1検索クエリを区分した単位ごとに、それぞれ別々に順次処理する。続いて、取得部131は、予測部134によって予測処理された単位ごとに、対応する経過情報を取得する。 Note that the acquisition unit 131 may store the information about the internal state of the second learning model M2B in any unit, not limited to a delimiter such as a space, where the search query is delimited. Specifically, the prediction unit 134 determines whether the first search query can be classified according to a certain rule (or a certain procedure). For example, the prediction unit 134 uses morphological analysis to determine whether the first search query can be classified. Further, for example, the prediction unit 134 determines whether or not the first search query can be classified using BPE. Subsequently, when the prediction unit 134 determines that the first search query can be classified according to a certain rule (or a certain procedure), the prediction unit 134 is divided for each unit of the first search query according to a certain rule (or a certain procedure). , Each of which is processed separately. For example, when the prediction unit 134 determines that the first search query can be classified by using the morphological analysis, the prediction unit 134 sequentially and sequentially processes each of the units by which the first search query is classified by using the morphological analysis. In addition, for example, when the prediction unit 134 determines that the first search query can be classified using the BPE, the prediction unit 134 sequentially processes the first search query using the BPE separately. Subsequently, the acquisition unit 131 acquires corresponding progress information for each unit for which the prediction processing is performed by the prediction unit 134.
また、第2学習モデルM2Bでは、第1検索クエリの中身に依らず、一律(2文字単位、それをまとめた4文字単位、それをさらにまとめた8文字単位、といった単位ごと)に予測処理が行われるため、ツリー構造の下の方の予測結果(図20に示す例では、処理ステップ「ステップLB1−1」〜処理ステップ「ステップLB1−4」の予測結果)は、経過情報の再利用で得られるメリットが小さいことが予想される。そこで、情報処理装置100は、第2検索クエリから第2検索クエリが属するカテゴリを予測する予測処理に用いる情報として、ツリー構造の下の方の文字群(例えば、2文字単位)の予測結果に対応する経過情報を記憶しない。図20に示す例では、情報処理装置100は、第2検索クエリから第2検索クエリが属するカテゴリを予測する予測処理に用いる情報として、処理ステップ「ステップLB1−1」〜処理ステップ「ステップLB1−4」の予測結果に対応する経過情報を記憶しない。一方、情報処理装置100は、ツリー構造のある程度上の方の文字群(例えば、4文字単位や8文字単位)の予測結果に対応する経過情報については、所定の条件を満たす場合のみ、第2検索クエリから第2検索クエリが属するカテゴリを予測する予測処理に用いる情報として記憶する。図20に示す例では、情報処理装置100は、処理ステップ「ステップLB2−1」〜処理ステップ「ステップLB2−2」の予測結果に対応する経過情報については、所定の条件を満たす場合のみ、第2検索クエリから第2検索クエリが属するカテゴリを予測する予測処理に用いる情報として記憶する。具体的には、情報処理装置100は、ツリー構造のある程度上の方の文字群が、辞書等に掲載された既知の単語と一致するか否かを判定する。続いて、情報処理装置100は、ツリー構造のある程度上の方の文字群が、辞書等に掲載された既知の単語と一致すると判定した場合は、第2検索クエリから第2検索クエリが属するカテゴリを予測する予測処理に用いる情報として、ツリー構造のある程度上の方の文字群の予測結果に対応する経過情報を記憶する。すなわち、情報処理装置100は、辞書等に掲載された既知の単語と一致する文字群は、第2検索クエリから第2検索クエリが属するカテゴリを予測する予測処理に再利用できる見込みが高いため、経過情報を記憶する。一方、情報処理装置100は、ツリー構造のある程度上の方の文字群が、辞書等に掲載された既知の単語と一致しない場合は、第2検索クエリから第2検索クエリが属するカテゴリを予測する予測処理に用いる情報として、ツリー構造のある程度上の方の文字群の予測結果に対応する経過情報を記憶しない。
In addition, in the second learning model M2B, the prediction process is performed uniformly (for each unit such as a unit of 2 characters, a unit of 4 characters that collects it, or a unit of 8 characters that further collects it) regardless of the content of the first search query. Therefore, the prediction result in the lower part of the tree structure (in the example shown in FIG. 20, the prediction result of the processing step “step LB1-1” to the processing step “step LB1-4”) is the reuse of the progress information. It is expected that the merit obtained will be small. Therefore, the
〔9.効果〕
上述してきたように、実施形態に係る情報処理装置100は、予測部134と記憶部120を備える。予測部134は、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして、複数の検索クエリが有する特徴を学習した学習モデルを用いて、第1入力情報から第1入力情報の特徴を示す第1特徴情報を予測する。記憶部120は、予測部134が第2入力情報から第2入力情報の特徴を示す第2特徴情報を予測する予測処理に用いる情報として、予測部134による第1特徴情報の予測処理の途中経過に関する情報である経過情報を記憶する。
[9. effect〕
As described above, the
これにより、情報処理装置100は、予測処理の途中経過まで予測結果を覚えておいて、必要に応じてキャッシングを取得し途中から処理を開始することができる。すなわち、情報処理装置100は、前に行った計算結果を用いて、効率よく特徴情報の予測処理を行うことができる。したがって、情報処理装置100は、情報の意味を効率よく解釈可能とすることができる。
With this, the
また、記憶部120は、処理単位毎の情報である単位情報を複数含む第1入力情報に含まれる単位情報が、予測部134によって順次処理されることにより行われる予測処理の経過情報を記憶する。予測部134は、記憶部120に記憶された経過情報を用いて、複数の単位情報を含む第2入力情報の特徴を示す第2特徴情報を予測する。 In addition, the storage unit 120 stores the progress information of the prediction process performed by the prediction unit 134 sequentially processing the unit information included in the first input information including a plurality of unit information that is information for each processing unit. .. The prediction unit 134 predicts the second characteristic information indicating the characteristic of the second input information including the plurality of unit information, using the progress information stored in the storage unit 120.
これにより、情報処理装置100は、処理単位毎に予測処理の途中経過まで予測結果を覚えておいて、必要に応じて処理単位毎にキャッシングを取得し途中から処理を開始することができる。
Accordingly, the
また、記憶部120は、第1入力情報に含まれる所定の単位情報で区切られた単位情報群毎に経過情報を記憶する。 The storage unit 120 also stores the progress information for each unit information group divided by the predetermined unit information included in the first input information.
これにより、情報処理装置100は、単位情報群毎に予測処理の途中経過まで予測結果を覚えておいて、必要に応じて単位情報群毎にキャッシングを取得し途中から処理を開始することができる。
Thus, the
また、記憶部120は、第1入力情報に含まれる所定数の単位情報毎に経過情報を記憶する。 The storage unit 120 also stores the progress information for each predetermined number of unit information included in the first input information.
これにより、情報処理装置100は、単位情報毎に予測処理の途中経過まで予測結果を覚えておいて、必要に応じて単位情報毎にキャッシングを取得し途中から処理を開始することができる。
Thereby, the
また、予測部134は、第1入力情報に対応する経過情報のうち、第2入力情報と共通する単位情報に対応する経過情報を用いて、第2特徴情報を予測する。 In addition, the prediction unit 134 predicts the second characteristic information by using the progress information corresponding to the unit information common to the second input information among the progress information corresponding to the first input information.
これにより、情報処理装置100は、前に行った計算結果を用いて、効率よく特徴情報の予測処理を行うことができる。
As a result, the
また、記憶部120は、単位情報である文字を含む第1入力情報に含まれる所定数の文字毎に第1特徴情報の予測処理の途中経過に関する情報を記憶する。 The storage unit 120 also stores information about the progress of the prediction process of the first characteristic information for each predetermined number of characters included in the first input information including the character that is the unit information.
これにより、情報処理装置100は、文字毎に予測処理の途中経過まで予測結果を覚えておいて、必要に応じて文字毎にキャッシングを取得し途中から処理を開始することができる。
With this, the
また、記憶部120は、第1入力情報に含まれる所定の区切り文字で区切られた文字群毎に第1特徴情報の予測処理の途中経過に関する情報を記憶する。 The storage unit 120 also stores information about the progress of the prediction process of the first feature information for each character group separated by a predetermined delimiter included in the first input information.
これにより、情報処理装置100は、文字群毎に予測処理の途中経過まで予測結果を覚えておいて、必要に応じて文字群毎にキャッシングを取得し途中から処理を開始することができる。
With this, the
また、記憶部120は、再帰的ニューラルネットワーク(Recurrent Neural Network)、木構造型再帰的ニューラルネットワーク(Recursive Neural Network)、又は拡張畳み込みニューラルネットワーク(Dilated Convolutional Neural Network)である学習モデルを用いて予測部134によって予測された第1特徴情報の予測処理の途中経過に関する情報である経過情報を記憶する。 In addition, the storage unit 120 uses a learning model that is a recursive neural network (Recurrent Neural Network), a tree-structured recursive neural network (Recursive Neural Network), or an extended convolutional neural network (Dilated Convolutional Neural Network). The progress information, which is information about the progress of the prediction process of the first feature information predicted by 134, is stored.
これにより、情報処理装置100は、学習モデルの構造に応じた経過情報を記憶し、必要に応じてキャッシングを取得し途中から処理を開始することができる。
As a result, the
〔10.ハードウェア構成〕
また、上述してきた実施形態に係る情報処理装置100は、例えば図21に示すような構成のコンピュータ1000によって実現される。図21は、情報処理装置100を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を備える。
[10. Hardware configuration]
Further, the
CPU1100は、ROM1300またはHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。
The CPU 1100 operates based on a program stored in the
HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を格納する。通信インターフェイス1500は、所定の通信網を介して他の機器からデータを受信してCPU1100へ送り、CPU1100が生成したデータを所定の通信網を介して他の機器へ送信する。
The
CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、生成したデータを入出力インターフェイス1600を介して出力装置へ出力する。
The CPU 1100 controls output devices such as a display and a printer and input devices such as a keyboard and a mouse via the input/
メディアインターフェイス1700は、記録媒体1800に格納されたプログラムまたはデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
The
例えば、コンピュータ1000が情報処理装置100として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部130の機能を実現する。コンピュータ1000のCPU1100は、これらのプログラムを記録媒体1800から読み取って実行するが、他の例として、他の装置から所定の通信網を介してこれらのプログラムを取得してもよい。
For example, when the
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。 As described above, some of the embodiments of the present application have been described in detail based on the drawings, but these are examples, and various modifications based on the knowledge of those skilled in the art, including the modes described in the section of the disclosure of the invention, It is possible to implement the present invention in other forms with improvements.
〔11.その他〕
また、上記実施形態及び変形例において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
[11. Other]
Further, of the processes described in the above-described embodiment and modification, all or part of the processes described as being automatically performed may be manually performed, or described as manually performed. It is also possible to automatically carry out all or part of the above-mentioned processing by a known method. In addition, the processing procedures, specific names, information including various data and parameters shown in the above-mentioned documents and drawings can be arbitrarily changed unless otherwise specified. For example, the various information shown in each drawing is not limited to the illustrated information.
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。 Further, each component of each device shown in the drawings is functionally conceptual and does not necessarily have to be physically configured as shown. That is, the specific form of distribution/integration of each device is not limited to that shown in the figure, and all or part of the device may be functionally or physically distributed/arranged in arbitrary units according to various loads and usage conditions. It can be integrated and configured.
また、上述してきた実施形態及び変形例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。 Further, the above-described embodiments and modified examples can be appropriately combined within a range in which the processing content is not inconsistent.
また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、予測部は、予測手段や予測回路に読み替えることができる。 Also, the above-mentioned "section (module, unit)" can be read as "means" or "circuit". For example, the prediction unit can be read as a prediction unit or a prediction circuit.
1 情報処理システム
10 ユーザ端末
50 検索サーバ
100 情報処理装置
110 通信部
120 記憶部
121 クエリ情報記憶部
122 カテゴリ情報記憶部
123 分類定義記憶部
124 モデル情報記憶部
125 経過情報記憶部
130 制御部
131 取得部
132 抽出部
133 生成部
134 予測部
1
Claims (10)
前記予測部が第2入力情報から前記第2入力情報の特徴を示す第2特徴情報を予測する予測処理に用いる情報として、前記予測部による第1特徴情報の予測処理の途中経過に関する情報である経過情報を記憶する記憶部と、
を備えることを特徴とする情報処理装置。 It is assumed that the plurality of search queries input by the same user within a predetermined time have similar features, and a learning model that learns the features of the plurality of search queries is used to extract the first input information from the first input information. A prediction unit that predicts first characteristic information indicating characteristics of input information;
As the information used by the prediction unit to predict the second feature information indicating the feature of the second input information from the second input information, it is information about the progress of the prediction process of the first feature information by the prediction unit. A storage unit for storing progress information,
An information processing apparatus comprising:
処理単位毎の情報である単位情報を複数含む前記第1入力情報に含まれる単位情報が、前記予測部によって順次処理されることにより行われる予測処理の前記経過情報を記憶し、
前記予測部は、
前記記憶部に記憶された経過情報を用いて、複数の単位情報を含む前記第2入力情報の特徴を示す第2特徴情報を予測する
ことを特徴とする請求項1に記載の情報処理装置。 The storage unit is
The unit information included in the first input information including a plurality of unit information that is information for each processing unit stores the progress information of the prediction process performed by being sequentially processed by the prediction unit,
The prediction unit is
The information processing apparatus according to claim 1, wherein second characteristic information indicating a characteristic of the second input information including a plurality of unit information is predicted using the progress information stored in the storage unit.
前記第1入力情報に含まれる所定の単位情報で区切られた単位情報群毎に前記経過情報を記憶する
ことを特徴とする請求項2に記載の情報処理装置。 The storage unit is
The information processing apparatus according to claim 2, wherein the progress information is stored for each unit information group divided by predetermined unit information included in the first input information.
前記第1入力情報に含まれる所定数の単位情報毎に前記経過情報を記憶する
ことを特徴とする請求項2に記載の情報処理装置。 The storage unit is
The information processing apparatus according to claim 2, wherein the progress information is stored for each of a predetermined number of unit information included in the first input information.
前記第1入力情報に対応する経過情報のうち、前記第2入力情報と共通する単位情報に対応する経過情報を用いて、前記第2特徴情報を予測する
ことを特徴とする請求項2〜4のいずれか一つに記載の情報処理装置。 The prediction unit is
Among the progress information corresponding to the first input information, the second feature information is predicted using the progress information corresponding to the unit information common to the second input information. The information processing apparatus described in any one of 1.
前記単位情報である文字を含む前記第1入力情報に含まれる所定数の文字毎に前記第1特徴情報の予測処理の途中経過に関する情報を記憶する
ことを特徴とする請求項2〜5のいずれか一つに記載の情報処理装置。 The storage unit is
Information regarding the progress of the prediction process of the first feature information is stored for each of a predetermined number of characters included in the first input information that includes the character that is the unit information. The information processing device according to one.
前記第1入力情報に含まれる所定の区切り文字で区切られた文字群毎に前記第1特徴情報の予測処理の途中経過に関する情報を記憶する
ことを特徴とする請求項1〜6のいずれか一つに記載の情報処理装置。 The storage unit is
The information regarding the progress of the prediction process of the first feature information is stored for each character group delimited by a predetermined delimiter included in the first input information. Information processing device described in.
再帰的ニューラルネットワーク(Recurrent Neural Network)、木構造型再帰的ニューラルネットワーク(Recursive Neural Network)、又は拡張畳み込みニューラルネットワーク(Dilated Convolutional Neural Network)である学習モデルを用いて前記予測部によって予測された第1特徴情報の予測処理の途中経過に関する情報である経過情報を記憶する
ことを特徴とする請求項1〜7のいずれか一つに記載の情報処理装置。 The storage unit is
The first predicted by the prediction unit using a learning model that is a recurrent neural network, a tree-structured recursive neural network, or a dilated convolutional neural network. The information processing apparatus according to any one of claims 1 to 7, characterized in that progress information, which is information relating to the progress of the feature information prediction process, is stored.
同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして、前記複数の検索クエリが有する特徴を学習した学習モデルを用いて、第1入力情報から前記第1入力情報の特徴を示す第1特徴情報を予測する予測工程と、
前記予測工程が第2入力情報から前記第2入力情報の特徴を示す第2特徴情報を予測する予測処理に用いられる情報として、前記予測工程による第1特徴情報の予測処理の途中経過に関する情報である経過情報を記憶する記憶工程と、
を含むことを特徴とする情報処理方法。 An information processing method executed by a computer,
It is assumed that the plurality of search queries input by the same user within a predetermined time have similar features, and a learning model that learns the features of the plurality of search queries is used to extract the first input information from the first input information. A prediction step of predicting first characteristic information indicating characteristics of input information,
The information used in the prediction process of predicting the second feature information indicating the feature of the second input information from the second input information by the prediction process is information about the progress of the prediction process of the first feature information by the prediction process. A storage step of storing certain progress information,
An information processing method comprising:
前記予測手段が第2入力情報から前記第2入力情報の特徴を示す第2特徴情報を予測する予測処理に用いられる情報として、前記予測手段による第1特徴情報の予測処理の途中経過に関する情報である経過情報を記憶する記憶手段と、
をコンピュータに実行させることを特徴とする情報処理プログラム。 It is assumed that the plurality of search queries input by the same user within a predetermined time have similar features, and a learning model that learns the features of the plurality of search queries is used to extract the first input information from the first input information. Prediction means for predicting first characteristic information indicating characteristics of input information;
The information used by the prediction unit to predict the second characteristic information indicating the characteristic of the second input information from the second input information is information about the progress of the prediction process of the first characteristic information by the prediction unit. Storage means for storing certain progress information,
An information processing program that causes a computer to execute.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019022029A JP6982017B2 (en) | 2019-02-08 | 2019-02-08 | Information processing equipment, information processing methods and information processing programs |
JP2021188188A JP7258988B2 (en) | 2019-02-08 | 2021-11-18 | Information processing device, information processing method and information processing program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019022029A JP6982017B2 (en) | 2019-02-08 | 2019-02-08 | Information processing equipment, information processing methods and information processing programs |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2021188188A Division JP7258988B2 (en) | 2019-02-08 | 2021-11-18 | Information processing device, information processing method and information processing program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020129306A true JP2020129306A (en) | 2020-08-27 |
JP6982017B2 JP6982017B2 (en) | 2021-12-17 |
Family
ID=72174590
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019022029A Active JP6982017B2 (en) | 2019-02-08 | 2019-02-08 | Information processing equipment, information processing methods and information processing programs |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6982017B2 (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3945623A1 (en) | 2020-07-30 | 2022-02-02 | Toyota Jidosha Kabushiki Kaisha | Power storage device |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008096934A1 (en) * | 2007-02-05 | 2008-08-14 | True Systems Co., Ltd. | Prediction-based word inputting method |
JP2013528873A (en) * | 2010-05-31 | 2013-07-11 | ヤフー! インコーポレイテッド | Research mission identification |
JP2016018286A (en) * | 2014-07-07 | 2016-02-01 | 日本電信電話株式会社 | Action type discrimination system, action type discrimination method, and action type discrimination program |
US20160125028A1 (en) * | 2014-11-05 | 2016-05-05 | Yahoo! Inc. | Systems and methods for query rewriting |
CN106095749A (en) * | 2016-06-03 | 2016-11-09 | 杭州量知数据科技有限公司 | A kind of text key word extracting method based on degree of depth study |
CN108090038A (en) * | 2016-11-11 | 2018-05-29 | 科大讯飞股份有限公司 | Text punctuate method and system |
CN108304526A (en) * | 2018-01-25 | 2018-07-20 | 腾讯科技(深圳)有限公司 | A kind of data processing method, device and server |
-
2019
- 2019-02-08 JP JP2019022029A patent/JP6982017B2/en active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008096934A1 (en) * | 2007-02-05 | 2008-08-14 | True Systems Co., Ltd. | Prediction-based word inputting method |
JP2013528873A (en) * | 2010-05-31 | 2013-07-11 | ヤフー! インコーポレイテッド | Research mission identification |
JP2016018286A (en) * | 2014-07-07 | 2016-02-01 | 日本電信電話株式会社 | Action type discrimination system, action type discrimination method, and action type discrimination program |
US20160125028A1 (en) * | 2014-11-05 | 2016-05-05 | Yahoo! Inc. | Systems and methods for query rewriting |
CN106095749A (en) * | 2016-06-03 | 2016-11-09 | 杭州量知数据科技有限公司 | A kind of text key word extracting method based on degree of depth study |
CN108090038A (en) * | 2016-11-11 | 2018-05-29 | 科大讯飞股份有限公司 | Text punctuate method and system |
CN108304526A (en) * | 2018-01-25 | 2018-07-20 | 腾讯科技(深圳)有限公司 | A kind of data processing method, device and server |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3945623A1 (en) | 2020-07-30 | 2022-02-02 | Toyota Jidosha Kabushiki Kaisha | Power storage device |
Also Published As
Publication number | Publication date |
---|---|
JP6982017B2 (en) | 2021-12-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11507989B2 (en) | Multi-label product categorization | |
CN110909182A (en) | Multimedia resource searching method and device, computer equipment and storage medium | |
US20220051143A1 (en) | Machine learning system | |
CN110598084A (en) | Object sorting method, commodity sorting device and electronic equipment | |
EP2849095A1 (en) | Information processing device, information processing method, and program | |
CN111428007B (en) | Cross-platform based synchronous push feedback method | |
JP6679683B2 (en) | Information processing apparatus, information processing method, and information processing program | |
Valois B Jr et al. | Recommender systems in social networks | |
JP7071304B2 (en) | Information processing equipment, information processing methods and information processing programs | |
JP6982017B2 (en) | Information processing equipment, information processing methods and information processing programs | |
US20130054616A1 (en) | System and Method for Finding Mood-Dependent Top Selling/Rated Lists | |
JP6852114B2 (en) | Specific device, specific method and specific program | |
JP6584613B1 (en) | Information processing apparatus, information processing method, and information processing program | |
JP7258988B2 (en) | Information processing device, information processing method and information processing program | |
JP7177013B2 (en) | Information processing device, information processing method and information processing program | |
JP7231322B2 (en) | LEARNING DEVICE, LEARNING METHOD, LEARNING PROGRAM AND PROGRAM | |
WO2023160947A1 (en) | Method and device for providing a recommender system | |
JP6979986B2 (en) | Information processing equipment, information processing methods and information processing programs | |
JP6553793B1 (en) | Information processing apparatus, information processing method, and information processing program | |
JP6865706B2 (en) | Information processing equipment, information processing methods, and information processing programs | |
JP6983672B2 (en) | Information processing equipment, information processing methods, and information processing programs | |
JP6938569B2 (en) | Information processing equipment, information processing methods and information processing programs | |
JP6728445B1 (en) | Extraction device, extraction method, and extraction program | |
JP7044729B2 (en) | Information processing equipment, information processing methods and information processing programs | |
Siddique et al. | Movies Rating Prediction using Supervised Machine Learning Techniques |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20191101 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20191108 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200917 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210827 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211019 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211118 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6982017 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |