JP6679683B2 - Information processing apparatus, information processing method, and information processing program - Google Patents
Information processing apparatus, information processing method, and information processing program Download PDFInfo
- Publication number
- JP6679683B2 JP6679683B2 JP2018176628A JP2018176628A JP6679683B2 JP 6679683 B2 JP6679683 B2 JP 6679683B2 JP 2018176628 A JP2018176628 A JP 2018176628A JP 2018176628 A JP2018176628 A JP 2018176628A JP 6679683 B2 JP6679683 B2 JP 6679683B2
- Authority
- JP
- Japan
- Prior art keywords
- search query
- search
- information processing
- query
- learning model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 322
- 238000003672 processing method Methods 0.000 title claims description 7
- 230000014509 gene expression Effects 0.000 claims description 227
- 238000004458 analytical method Methods 0.000 claims description 105
- 238000012549 training Methods 0.000 claims description 2
- 239000013598 vector Substances 0.000 description 192
- 239000000284 extract Substances 0.000 description 51
- 235000015927 pasta Nutrition 0.000 description 37
- 238000000034 method Methods 0.000 description 31
- 230000037180 bone health Effects 0.000 description 29
- 101001111655 Homo sapiens Retinol dehydrogenase 11 Proteins 0.000 description 24
- 102100023916 Retinol dehydrogenase 11 Human genes 0.000 description 24
- 238000010586 diagram Methods 0.000 description 24
- 238000000605 extraction Methods 0.000 description 21
- 230000006870 function Effects 0.000 description 18
- 239000000047 product Substances 0.000 description 18
- 230000008569 process Effects 0.000 description 16
- 230000009471 action Effects 0.000 description 13
- 230000006399 behavior Effects 0.000 description 11
- 238000004891 communication Methods 0.000 description 9
- 238000012545 processing Methods 0.000 description 9
- 238000013528 artificial neural network Methods 0.000 description 7
- 101710114762 50S ribosomal protein L11, chloroplastic Proteins 0.000 description 6
- 235000013305 food Nutrition 0.000 description 6
- 101710156159 50S ribosomal protein L21, chloroplastic Proteins 0.000 description 5
- 230000036541 health Effects 0.000 description 5
- 241000251468 Actinopterygii Species 0.000 description 4
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 4
- 230000037118 bone strength Effects 0.000 description 4
- 229910052791 calcium Inorganic materials 0.000 description 4
- 239000011575 calcium Substances 0.000 description 4
- 238000007796 conventional method Methods 0.000 description 4
- 238000002372 labelling Methods 0.000 description 4
- 102100035959 Cationic amino acid transporter 2 Human genes 0.000 description 2
- 108091006231 SLC7A2 Proteins 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- 230000015654 memory Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 239000013589 supplement Substances 0.000 description 2
- 101710082414 50S ribosomal protein L12, chloroplastic Proteins 0.000 description 1
- 101710087140 50S ribosomal protein L22, chloroplastic Proteins 0.000 description 1
- 101100494773 Caenorhabditis elegans ctl-2 gene Proteins 0.000 description 1
- 101100112369 Fasciola hepatica Cat-1 gene Proteins 0.000 description 1
- 101100005271 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) cat-1 gene Proteins 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、情報処理装置、情報処理方法及び情報処理プログラムに関する。 The present invention relates to an information processing device, an information processing method, and an information processing program.
従来、特定のユーザに特徴的な情報を抽出する技術が知られている。具体的には、対象ユーザが用いた各検索クエリに関する情報に対応するベクトル間の類似度に基づいて対象ユーザが用いた検索クエリに関する情報を第1クラスタに分類し、他のユーザの各検索クエリに関する情報に対応するベクトル間の類似度に基づいて他のユーザが用いた検索クエリに関する情報を第2クラスタに分類する。そして、第1クラスタと第2クラスタとの差異に基づいて、第1クラスタから対象ユーザに特徴的な行動を示すクラスタである特徴クラスタを抽出する技術が提案されている。 Conventionally, a technique of extracting information characteristic of a specific user is known. Specifically, the information about the search query used by the target user is classified into the first cluster based on the similarity between the vectors corresponding to the information about each search query used by the target user, and the search queries of other users are classified. Information regarding a search query used by another user is classified into the second cluster based on the degree of similarity between vectors corresponding to the information regarding. Then, based on the difference between the first cluster and the second cluster, a technique has been proposed for extracting a characteristic cluster, which is a cluster showing a characteristic behavior of the target user, from the first cluster.
しかしながら、上記の従来技術では、ユーザの検索動向の分析精度を高めることができるとは限らない。具体的には、言葉の意味は、その言葉が用いられるコンテクストによって異なる場合がある。そのため、コンテクストの中で用いられた文字列をコンテクストから切り離して抽出したとしても、その文字列の本来の意味(すなわち、その文字列がそのコンテクストで用いられた意味)を解釈することは難しい場合がある。以上を踏まえると、上記の従来技術では、文字列としての検索クエリの類似度を考慮するにすぎないため、検索クエリの本来の意味を解釈することは難しい。そのため、上記の従来技術では、検索クエリを入力したユーザのコンテクストを考慮して、ユーザの検索動向を分析することは難しい。したがって、上記の従来技術では、ユーザの検索動向の分析精度を高めることができるとは限らない。 However, the above-mentioned conventional technique cannot always improve the accuracy of analysis of the user's search trend. Specifically, the meaning of a word may depend on the context in which it is used. Therefore, even if the string used in the context is separated from the context and extracted, it is difficult to interpret the original meaning of the string (that is, the meaning that the string was used in the context). There is. In view of the above, in the above-mentioned conventional technique, it is difficult to interpret the original meaning of the search query because the similarity of the search query as a character string is only considered. Therefore, in the above-mentioned conventional technique, it is difficult to analyze the search trend of the user in consideration of the context of the user who inputs the search query. Therefore, the above-mentioned conventional technique cannot always improve the accuracy of analysis of the search trend of the user.
本願は、上記に鑑みてなされたものであってユーザの検索動向の分析精度を高めることができる情報処理装置、情報処理方法及び情報処理プログラムを提供することを目的とする。 The present application has been made in view of the above, and an object thereof is to provide an information processing apparatus, an information processing method, and an information processing program that can improve the accuracy of analysis of a user's search trend.
本願に係る情報処理装置は、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして、前記複数の検索クエリが有する特徴を学習した第1学習モデルを用いて、所定の検索クエリと類似する特徴を有する検索クエリである類似クエリを抽出するサービス提供部を備えたことを特徴とする。 The information processing apparatus according to the present application uses the first learning model in which the features of the plurality of search queries are learned, assuming that the plurality of search queries input by the same user within a predetermined time have similar features. And a service providing unit that extracts a similar query that is a search query having characteristics similar to a predetermined search query.
実施形態の一態様によれば、ユーザの検索動向の分析精度を高めることができるといった効果を奏する。 According to the aspect of the embodiment, it is possible to improve the accuracy of analysis of the search trend of the user.
以下に、本願に係る情報処理装置、情報処理方法及び情報処理プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る情報処理装置、情報処理方法及び情報処理プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略する。 Hereinafter, modes (hereinafter, referred to as “embodiments”) for implementing an information processing apparatus, an information processing method, and an information processing program according to the present application will be described in detail with reference to the drawings. Note that the information processing apparatus, the information processing method, and the information processing program according to the present application are not limited to this embodiment. Further, in each of the following embodiments, the same parts are designated by the same reference numerals, and duplicated description will be omitted.
〔1.情報処理の一例〕
まず、図1を用いて、実施形態に係る情報処理の一例について説明する。図1は、実施形態に係る情報処理の一例を示す図である。図1に示す情報処理は、ユーザ端末10とクライアント端末20と検索サーバ50と情報処理装置100とによって行われる。
[1. Example of information processing]
First, an example of information processing according to the embodiment will be described with reference to FIG. FIG. 1 is a diagram illustrating an example of information processing according to the embodiment. The information processing shown in FIG. 1 is performed by the
〔情報処理システムの構成〕
図1の説明に先立って、図5を用いて情報処理システム1の構成について説明する。図5は、実施形態に係る情報処理システムの構成例を示す図である。図5に示すように、情報処理システム1には、ユーザ端末10と、クライアント端末20と、検索サーバ50と、情報処理装置100とが含まれる。ユーザ端末10と、クライアント端末20と、検索サーバ50と、情報処理装置100とは所定のネットワークNを介して、有線または無線により通信可能に接続される。なお、図5に示す情報処理システム1には、任意の数のユーザ端末10と任意の数のクライアント端末20と任意の数の検索サーバ50と任意の数の情報処理装置100とが含まれてもよい。
[Configuration of information processing system]
Prior to the description of FIG. 1, the configuration of the information processing system 1 will be described with reference to FIG. FIG. 5 is a diagram illustrating a configuration example of the information processing system according to the embodiment. As shown in FIG. 5, the information processing system 1 includes a
ユーザ端末10は、検索サービスを利用するユーザによって使用される情報処理装置である。ユーザ端末10は、例えば、スマートフォンや、タブレット型端末や、ノート型PC(Personal Computer)や、携帯電話機や、PDA(Personal Digital Assistant)等により実現される。なお、以下では、ユーザ端末10をユーザと同一視する場合がある。すなわち、以下では、ユーザをユーザ端末10と読み替えることもできる。
The
また、以下では、ユーザID「U1」により特定されるユーザを「ユーザU1」とする場合がある。このように、以下では、「ユーザU*(*は任意の数値)」と記載した場合、そのユーザはユーザID「U*」により特定されるユーザであることを示す。例えば、「ユーザU2」と記載した場合、そのユーザはユーザID「U2」により特定されるユーザである。 In the following, the user identified by the user ID “U1” may be referred to as “user U1”. Thus, in the following, when "user U * (* is an arbitrary numerical value)" is described, it means that the user is the user specified by the user ID "U *". For example, when described as “user U2”, the user is the user specified by the user ID “U2”.
また、以下では、ユーザ端末10を利用するユーザに応じて、ユーザ端末10をユーザ端末10−1、10−2として説明する。例えば、ユーザ端末10−1は、ユーザU1により使用されるユーザ端末10である。また、例えば、ユーザ端末10−2は、ユーザU2により使用されるユーザ端末10である。また、以下では、ユーザ端末10−1、10−2について、特に区別なく説明する場合には、ユーザ端末10と記載する。
Moreover, below, the
ユーザ端末10は、ユーザによって入力された検索クエリを検索サーバ50に送信する。具体的には、ユーザ端末10は、ユーザによる操作に従って、検索クエリを入力するための検索ボックスを含む検索ページを検索サーバ50から取得する。続いて、ユーザ端末10は、ユーザによって検索ボックスに文字が入力される操作に続いて、検索クエリを送信する操作が行われると、検索ページを介して検索ボックスに入力された文字を検索クエリとして検索サーバ50に送信する。例えば、ユーザ端末10は、ユーザによって検索ボックスに文字が入力される操作に続いて、検索クエリの送信ボタンが押下される操作やエンターキーが押下される操作が行われると、検索ページを介して検索ボックスに入力された文字を検索クエリとして検索サーバ50に送信する。
The
クライアント端末20は、広告主であるクライアントによって使用される情報処理装置である。クライアント端末20は、例えば、スマートフォンや、タブレット型端末や、ノート型PC、携帯電話機や、PDA等により実現される。なお、以下では、クライアント端末20をクライアント(広告主)と同一視する場合がある。すなわち、以下では、クライアント(広告主)をクライアント端末20と読み替えることもできる。
The
クライアント端末20は、ユーザの検索動向を分析する分析テーマに関するキーワードである分析クエリを情報処理装置100に送信する。具体的には、クライアント端末20は、複数の分析クエリを情報処理装置100に送信する。例えば、広告主であるクライアントが、検索クエリの分析テーマとして「骨の健康関連」を希望しているとする。また、より具体的には、広告主であるクライアントは、分析テーマに関するキーワードとして、「骨 健康」、「骨 丈夫」、「カルシウム 小魚」などを意図しているものとする。この場合、クライアント端末20は、広告主であるクライアントの操作にしたがって、「骨 健康」、「骨 丈夫」、「カルシウム 小魚」などの複数の分析クエリを情報処理装置100に送信する。また、クライアント端末20は、分析クエリに類似する検索クエリである類似クエリを分類する分類軸(カテゴリ)に関する情報を情報処理装置100に送信する。例えば、クライアント端末20は、情報処理装置100によって提供される検索クエリの分析サービスを利用するためのユーザーインターフェースを通じて、分析クエリと分類軸(カテゴリ)に関する情報とを情報処理装置100に送信する。
The
検索サーバ50は、検索サービスを提供するサーバ装置である。具体的には、検索サーバ50は、ユーザ端末10から検索クエリを受け付けると、受け付けた検索クエリに応じたコンテンツであって、検索結果として出力されるコンテンツを選択する。続いて、検索サーバ50は、選択されたコンテンツを含む検索結果ページをユーザ端末10に配信する。ここで、検索サーバ50によって配信されるコンテンツは、ウェブブラウザによって表示されるウェブページに限られない。例えば、検索サーバ50によって配信されるコンテンツは、ユーザ端末10にインストールされた専用のアプリケーションによって表示されるコンテンツであってもよい。また、検索サーバ50によって配信されるコンテンツは、音楽コンテンツや画像(静止画のみならず動画を含む。)コンテンツ、テキストコンテンツ(ニュース記事やSNS(Social Networking Service)に投稿された記事を含む。)、画像とテキストを組み合わせたコンテンツ、ゲームコンテンツなど、どのようなコンテンツであってもよい。
The
また、検索サーバ50は、ユーザによって入力された検索クエリに関する情報を記憶する。具体的には、検索サーバ50は、ユーザの検索履歴に関する情報を記憶する。例えば、検索サーバ50は、ユーザ端末10から検索クエリを受け付けると、受け付けた検索クエリと検索クエリの送信元であるユーザを識別するユーザIDと検索クエリの送信日時とを対応付けてデータベースに登録する。検索サーバ50は、情報処理装置100の要求に応じて、ユーザによって入力された検索クエリに関する情報を情報処理装置100に送信する。
The
情報処理装置100は、広告主であるクライアントに対して、検索クエリの分析サービスを提供するサーバ装置である。具体的には、情報処理装置100は、ユーザの検索動向を分析する分析テーマに関するキーワードである分析クエリをクライアント端末20から受け付ける。なお、情報処理装置100は、分析テーマに関する複数の分析クエリを受け付けてもよい。例えば、広告主であるクライアントが、検索クエリの分析テーマとして「骨の健康関連」を希望しているとする。そして、情報処理装置100は、「骨 健康」、「骨 丈夫」、「カルシウム 小魚」など複数の分析クエリをクライアント端末20から受け付ける。これにより、情報処理装置100は、一度に一つの分析クエリを受け付ける場合よりも、より多くの類似クエリを抽出することができる。すなわち、情報処理装置100は、広告主であるクライアントの分析テーマに沿った類似クエリを漏れなく抽出することができる。続いて、情報処理装置100は、受け付けた分析テーマに対応する検索クエリを抽出する。例えば、情報処理装置100は、後述する第1学習モデルを用いて、分析クエリと類似する特徴を有する検索クエリである類似クエリを抽出する。ここで、第1学習モデルとは、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして学習することで、所定の検索クエリから前記所定の検索クエリの特徴情報を予測する学習モデルである。なお、以下では、適宜、第1学習モデルを第1モデル(又は、第1モデルM1)と記載する。
The
また、情報処理装置100は、分析クエリに類似する検索クエリである類似クエリを分類する分類軸(カテゴリ)をクライアント端末20から受け付ける。なお、情報処理装置100は、分類対象となる一つの類似クエリの集合について、複数の分類軸(カテゴリ)を受け付けてもよい。続いて、情報処理装置100は、受け付けた分類軸に対応するカテゴリに類似クエリを分類する。例えば、情報処理装置100は、後述する第2学習モデルを用いて、受け付けた分類軸に対応するカテゴリに類似クエリを分類する。ここで、第2学習モデルとは、第1学習モデルを用いて生成された学習モデルであって、所定の検索クエリから所定の検索クエリが属するカテゴリを予測する学習モデルである。なお、以下では、適宜、第2学習モデルを第2モデル(又は、第2モデルM2)と記載する。
Further, the
また、情報処理装置100は、第1学習モデルを生成する。具体的には、情報処理装置100は、同一のユーザによって所定の時間内に入力された複数の検索クエリの分散表現が類似するように第1学習モデルを学習させることで、所定の検索クエリから所定の検索クエリの特徴情報を予測する第1学習モデルを生成する。ここで、情報処理装置100は、ユーザによる1回の検索ごとに検索ボックスに入力された文字列全体をユーザによって入力された検索クエリとして学習する。例えば、情報処理装置100は、ユーザU1による1回の検索で検索ボックスに「六本木 パスタ」のように複数の文字列を含む検索クエリが入力された場合は、「六本木 パスタ」全体で一つの検索クエリとして学習する。また、情報処理装置100は、同一のユーザによって各検索クエリが入力された時間の間隔が所定の時間内(例えば、2分以内)であるような複数の検索クエリを同一のユーザによって所定の時間内に入力された複数の検索クエリとして学習する。すなわち、情報処理装置100は、同一のユーザによって短時間のうちに立て続けに入力された複数の検索クエリは、類似する特徴を有するものとして学習する。なお、情報処理装置100は、所定の検索クエリが入力されて、所定の時間を超えて(例えば、2分以上経って)から、他の検索クエリが入力された場合は、所定の検索クエリと他の検索クエリとは、相違する特徴を有するものとして学習する。
In addition, the
一般的に、検索者が検索を行う際、一回の検索で検索者の意図する情報に到達するケースよりも、異なる検索クエリを用いて複数回にわたって検索を行った結果、検索者の意図する情報に到達するケースの方が多いと考えられる。すなわち、ユーザはある意図を持って検索を複数回行うと考えられるため、所定の時間内に連続して入力された検索クエリは、検索意図が近いという推定が成り立つ。そこで、本願発明に係る情報処理装置100は、同一のユーザによって所定の時間内に連続して入力された複数の検索クエリは、類似する特徴を有するものとして第1学習モデルを学習させる。具体的には、情報処理装置100は、ユーザによって入力された検索クエリに関する情報を検索サーバ50から取得する。続いて、情報処理装置100は、検索サーバ50から取得した検索クエリのうち、同一のユーザによって所定の時間内に入力された複数の検索クエリを抽出する。続いて、情報処理装置100は、抽出した複数の検索クエリが類似する特徴を有するものとして学習することで、所定の検索クエリから所定の検索クエリの特徴情報を予測する第1学習モデルを生成する。例えば、情報処理装置100は、抽出した複数の検索クエリの分散表現が類似するように第1学習モデルを学習させることで、所定の検索クエリから所定の検索クエリの特徴情報を含む分散表現(ベクトル)を出力する第1学習モデルを生成する。
Generally, when a searcher performs a search, the searcher's intention is the result of multiple searches using different search queries, rather than the case where the searcher reaches the information intended by the searcher once. It is thought that there are more cases where information is reached. That is, since it is considered that the user performs the search a plurality of times with a certain intention, it is presumed that the search queries continuously input within a predetermined time have similar search intentions. Therefore, the
より具体的には、情報処理装置100は、RNN(Recurrent Neural Network)の一種であるLSTM(Long Short-Term Memory)を分散表現生成に用いたDSSM(Deep Structured Sematic Model)の技術を用いて、検索クエリから分散表現(ベクトル)を出力する第1学習モデルを生成する。例えば、情報処理装置100は、第1学習モデルの正解データとして、同一のユーザによって所定の時間内に入力された一対の検索クエリが類似する特徴を有するものとして、所定の検索クエリの分散表現(ベクトル)と、所定の検索クエリと対となる他の検索クエリの分散表現(ベクトル)とが、分散表現空間上で近くに存在するように学習する。なお、2つのベクトルが分散表現空間上で近くに存在するように学習することは、2つのベクトルが分散表現空間上で類似するように学習することと言い換えることができる。このように、情報処理装置100は、LSTMを分散表現生成に用いたDSSMの技術を用いて第1学習モデルを生成するため、情報処理装置100によって生成された第1学習モデルは、任意の文字列から分散表現(ベクトル)を生成することができる。つまり、情報処理装置100は、既知の文字列(例えば、学習時に学習した検索クエリ)の分散表現(ベクトル)だけでなく、未知の文字列(例えば、学習時に学習したことがない検索クエリ)についても分散表現(ベクトル)を生成することができる。
More specifically, the
また、情報処理装置100は、第2学習モデルを生成する。具体的には、情報処理装置100は、第1学習モデルを用いて、所定の検索クエリから所定の検索クエリが属するカテゴリを予測する第2学習モデルを生成する。より具体的には、情報処理装置100は、第1学習モデルを生成すると、生成した第1学習モデル(第1学習モデルM1のモデルデータMDT1)を取得する。情報処理装置100は、第1モデルM1を取得すると、取得した第1モデルM1を用いて、第2学習モデルM2を生成する。情報処理装置100は、第1モデルM1を再学習させることにより、第1モデルM1とは学習モデルの重みである接続係数が異なる第2モデルM2を生成する。例えば、情報処理装置100は、検索クエリが学習モデルに入力された際に、学習モデルが出力する分散表現の分類結果が、検索クエリが属するカテゴリに対応するように学習することで、所定の検索クエリから所定の検索クエリが属するカテゴリを予測する第2モデルM2を生成する。
The
ここから、図1を用いて、情報処理の流れについて説明する。図1は、実施形態に係る情報処理の一例を示す図である。図1に示す例では、広告主であるクライアントが希望する分析テーマは「骨の健康関連」である。例えば、広告主であるクライアントは、健康関連事業を営む事業者である。また、広告主であるクライアントは、自社の商品に関する広告を展開するにあたり、「骨の健康」に関心のあるユーザの検索動向を分析することを希望している。情報処理装置100は、分析クエリである「骨 健康」と4つの小分類から成る分類軸(カテゴリ)とをクライアント端末20から受け付ける(ステップS1)。なお、情報処理装置100は、広告主であるクライアントから指定された分類軸(カテゴリ)を受け付ける代わりに、後述する図9に示す分類定義記憶部123に示すカテゴリの中から、広告主であるクライアントによって選択された大分類を分類軸として受け付けてもよい。図1に示す例では、広告主であるクライアントは、後述する分類定義記憶部123に示すカテゴリの中から、大分類ID「CAT2」で識別される大分類「健康系」を選択する。そして、情報処理装置100は、広告主であるクライアントによって選択された大分類「健康系」を分類軸として受け付ける。
From here, the flow of information processing is demonstrated using FIG. FIG. 1 is a diagram illustrating an example of information processing according to the embodiment. In the example shown in FIG. 1, the analysis theme desired by the client who is the advertiser is “bone health related”. For example, a client who is an advertiser is a business operator who operates a health-related business. Further, the client as the advertiser desires to analyze the search trend of the user who is interested in "bone health" in developing the advertisement regarding the company's product. The
続いて、情報処理装置100は、分析クエリを受け付けると、受け付けた分析クエリ「骨 健康」を第1モデルM1に入力する(ステップS2)。情報処理装置100は、あらかじめ、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして、複数の検索クエリが有する特徴を学習した第1モデルM1を生成しているものとする。情報処理装置100は、分析クエリを第1モデルM1に入力すると、分析クエリ「骨 健康」の分散表現(ベクトル)を第1モデルM1から出力する(ステップS3)。
Subsequently, when the
続いて、情報処理装置100は、分析クエリ「骨 健康」の分散表現(ベクトル)を出力すると、分散表現(ベクトル)同士の類似度が所定の閾値を超える検索クエリを分析クエリ「骨 健康」に類似する類似クエリとして抽出する(ステップS4)。例えば、情報処理装置100は、分散表現空間において、出力した分析クエリ「骨 健康」の分散表現(ベクトル)の近傍に位置する分散表現(ベクトル)を抽出する。続いて、情報処理装置100は、分析クエリ「骨 健康」の分散表現(ベクトル)と近傍に位置する分散表現(ベクトル)との類似度を算出する。例えば、情報処理装置100は、分散表現(ベクトル)同士のコサイン類似度を算出する。続いて、情報処理装置100は、コサイン類似度が所定の閾値を超える分散表現(ベクトル)を分析クエリ「骨 健康」の分散表現(ベクトル)と類似する分散表現(ベクトル)として抽出する。なお、情報処理装置100は、コサイン類似度に限らず、ベクトル間の距離尺度として適用可能な指標であれば、どのような指標に基づいて分散表現(ベクトル)の間の類似度を算出してもよい。例えば、情報処理装置100は、分散表現(ベクトル)同士のユークリッド距離や双曲空間等の非ユークリッド空間中での距離、マンハッタン距離、マハラノビス距離等といった所定の距離関数の値を算出する。続いて、情報処理装置100は、分散表現(ベクトル)同士の所定の距離関数の値(すなわち、分散表現空間における距離)が所定の閾値を下回る分散表現(ベクトル)を分析クエリ「骨 健康」の分散表現(ベクトル)と類似する分散表現(ベクトル)として抽出してもよい。続いて、情報処理装置100は、類似する分散表現(ベクトル)を抽出すると、後述するベクトル情報記憶部122を参照して、抽出した分散表現(ベクトル)に対応する検索クエリを特定する。そして、情報処理装置100は、特定した検索クエリを分析クエリと類似する類似クエリとして抽出する。
Subsequently, when the
続いて、情報処理装置100は、類似クエリを抽出すると、抽出した類似クエリを第2モデルM2に入力する(ステップS5)。情報処理装置100は、類似クエリを第2モデルM2に入力すると、類似クエリが属するカテゴリを第2モデルM2から出力する(ステップS6)。なお、情報処理装置100は、広告主であるクライアントによって指定された分類軸(カテゴリ)を受け付けてから、受け付けた分類軸(カテゴリ)に応じて検索クエリを分類するように第2モデルM2を学習させてもよい。あるいは、情報処理装置100は、後述する分類定義記憶部123に示すカテゴリに応じて検索クエリを分類するようにあらかじめ第2モデルM2を学習させる。そして、情報処理装置100は、分類定義記憶部123に示すカテゴリの中から広告主であるクライアントに分類軸を選択させ、広告主であるクライアントによって選択された分類軸(カテゴリ)をクライアント端末20から受け付けてもよい。
Subsequently, when the
続いて、情報処理装置100は、分類軸(カテゴリ)に応じたクエリの分類結果をクライアント端末20に送信する(ステップS7)。例えば、情報処理装置100は、分類軸(カテゴリ)に応じたクエリの分類結果として、分析テーマである「骨の健康関連」に関する検索クエリとして検索された検索クエリの構成を提供する。例えば、情報処理装置100は、分析クエリに類似する類似クエリとして抽出した検索クエリの内訳として、「飲み物」に関する検索クエリの割合が40%、「食べ物」に関する検索クエリの割合が30%、「運動」に関する検索クエリの割合が20%、「サプリメント」に関する検索クエリの割合が10%であるといった分析結果を提供する。
Then, the
上述したように、情報処理装置100は、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして、複数の検索クエリが有する特徴を学習した第1学習モデルを用いて、所定の検索クエリと類似する特徴を有する検索クエリである類似クエリを抽出する。後述するように、第1学習モデルは、検索クエリを入力したユーザのコンテクストを踏まえて、検索クエリの意味を適切に解釈することを可能にする。よって、情報処理装置100は、第1学習モデルを用いることにより、検索クエリを入力したユーザのコンテクストを考慮して、ユーザの検索動向を分析することができる。したがって、情報処理装置100は、ユーザの検索動向の分析精度を高めることができる。
As described above, the
〔第1学習モデルの生成処理〕
次に、図2を用いて、第1学習モデルの生成処理の流れについて説明する。図2は、実施形態に係る第1学習モデルの生成処理の一例を示す図である。図2に示す例では、情報処理装置100は、同一のユーザU1によって所定の時間内に連続して入力された「六本木 パスタ」という検索クエリQ11と「六本木 イタリアン」という検索クエリQ12とから成る一対の検索クエリを抽出する(ステップS11)。
[Generation processing of first learning model]
Next, the flow of generation processing of the first learning model will be described with reference to FIG. FIG. 2 is a diagram illustrating an example of a generation process of the first learning model according to the embodiment. In the example illustrated in FIG. 2, the
続いて、情報処理装置100は、抽出した検索クエリQ11を第1モデルM1に入力して、検索クエリQ11の分散表現であるベクトルBQV11を出力する。ここで、ベクトルBQV11は、第1モデルM1の出力層から出力されたばかりの検索クエリQ11の分散表現であって、第1モデルM1にフィードバックをかける前(学習前)の分散表現を示す。また、情報処理装置100は、抽出した検索クエリQ12を第1モデルM1に入力して、検索クエリQ12の分散表現であるベクトルBQV12を出力する。ここで、ベクトルBQV12は、第1モデルM1の出力層から出力されたばかりの検索クエリQ12の分散表現であって、第1モデルM1にフィードバックをかける前(学習前)の分散表現を示す。このようにして、情報処理装置100は、検索クエリQ11の分散表現であるベクトルBQV11と、検索クエリQ12の分散表現であるベクトルBQV12とを出力する(ステップS12)。
Subsequently, the
続いて、情報処理装置100は、同一のユーザU1によって所定の時間内に連続して入力された検索クエリQ11(「六本木 パスタ」)と検索クエリQ12(「六本木 イタリアン」)とから成る一対の検索クエリは、所定の検索意図(例えば、「ある場所で飲食店を探す」という検索意図)で入力された検索クエリであると推定されるため、相互に類似する特徴を有するものとして、検索クエリQ11の分散表現(ベクトルQV11)と、検索クエリQ11と対となる検索クエリQ12の分散表現(ベクトルQV12)とが、分散表現空間上で類似するように第1モデルM1を学習させる。例えば、第1モデルM1にフィードバックをかける前(学習前)の検索クエリQ11の分散表現であるベクトルBQV11と検索クエリQ12の分散表現であるベクトルBQV12とのなす角度の大きさをΘとする。また、第1モデルM1にフィードバックをかけた後(学習後)の検索クエリQ11の分散表現であるベクトルQV11と検索クエリQ12の分散表現であるベクトルQV12とのなす角度の大きさをΦとする。この時、情報処理装置100は、ΘよりもΦが小さくなるように、第1モデルM1を学習させる。例えば、情報処理装置100は、ベクトルBQV11とベクトルBQV12のコサイン類似度の値を算出する。また、情報処理装置100は、ベクトルQV11とベクトルQV12のコサイン類似度の値を算出する。続いて、情報処理装置100は、ベクトルBQV11とベクトルBQV12のコサイン類似度の値よりも、ベクトルQV11とベクトルQV12のコサイン類似度の値が大きくなるように(値が1に近づくように)第1モデルM1を学習させる。このように、情報処理装置100は、一対の検索クエリに対応する一対の分散表現である2つのベクトルが分散表現空間上で類似するように第1モデルM1を学習させることで、検索クエリから分散表現(ベクトル)を出力する第1モデルM1を生成する(ステップS13)。なお、情報処理装置100は、コサイン類似度に限らず、ベクトル間の距離尺度として適用可能な指標であれば、どのような指標に基づいて分散表現(ベクトル)の間の類似度を算出してもよい。また、情報処理装置100は、ベクトル間の距離尺度として適用可能な指標であれば、どのような指標に基づいて第1モデルM1を学習させてもよい。例えば、情報処理装置100は、分散表現(ベクトル)同士のユークリッド距離や双曲空間等の非ユークリッド空間中での距離、マンハッタン距離、マハラノビス距離等といった所定の距離関数の値を算出する。続いて、情報処理装置100は、分散表現(ベクトル)同士の所定の距離関数の値(すなわち、分散表現空間における距離)が小さくなるように第1モデルM1を学習させてもよい。
Subsequently, the
次に、図3を用いて、第1学習モデルの生成処理の流れについてより詳しく説明する。なお、図3の説明では、図2の説明と重複する部分は、適宜省略する。図3は、実施形態に係る第1学習モデルの生成処理を示す図である。図3に示す例では、情報処理装置100が生成した第1モデルM1によって出力された分散表現(ベクトル)が分散表現空間にマッピングされる様子が示されている。情報処理装置100は、所定の検索クエリの分散表現と所定の検索クエリと対となる他の検索クエリの分散表現とが分散表現空間上で近くにマッピングされるように第1モデルM1のトレーニングを行う。
Next, the flow of the generation process of the first learning model will be described in more detail with reference to FIG. In the description of FIG. 3, the portions overlapping the description of FIG. 2 will be omitted as appropriate. FIG. 3 is a diagram illustrating a generation process of the first learning model according to the embodiment. In the example shown in FIG. 3, the distributed representation (vector) output by the first model M1 generated by the
図3の上段に示す例では、情報処理装置100は、同一のユーザU1によって所定の時間内に連続して入力された4個の検索クエリである検索クエリQ11(「六本木 パスタ」)、検索クエリQ12(「六本木 イタリアン」)、検索クエリQ13(「赤坂 パスタ」)、検索クエリQ14(「麻布 パスタ」)を抽出する。情報処理装置100は、同一のユーザU1によって各検索クエリが入力された時間の間隔が所定の時間内である4個の検索クエリを抽出する。情報処理装置100は、同一のユーザU1によって後述する各検索クエリのペアが入力された時間の間隔が所定の時間内である複数の検索クエリを抽出する。情報処理装置100は、検索クエリが入力された順番に並べると、検索クエリQ11、検索クエリQ12、検索クエリQ13、検索クエリQ14の順番で入力された4個の検索クエリを抽出する。情報処理装置100は、4個の検索クエリを抽出すると、時系列的に隣り合う2つの検索クエリを一対の検索クエリとして、3対の検索クエリのペアである(検索クエリQ11、検索クエリQ12)、(検索クエリQ12、検索クエリQ13)、(検索クエリQ13、検索クエリQ14)を抽出する(ステップS21−1)。なお、情報処理装置100は、同一のユーザU1によって全ての検索クエリが所定の時間内に入力された複数の検索クエリを抽出してもよい。そして、情報処理装置100は、時系列的に隣り合うか否かに関わらず、抽出した複数の検索クエリの中から2つの検索クエリを選択して、選択した2つの検索クエリを一対の検索クエリとして抽出してもよい。
In the example illustrated in the upper part of FIG. 3, the
続いて、情報処理装置100は、抽出した検索クエリQ1k(k=1、2、3、4)を第1モデルM1に入力して、検索クエリQ1k(k=1、2、3、4)の分散表現であるベクトルBQV1k(k=1、2、3、4)を出力する。ここで、ベクトルBQV1k(k=1、2、3、4)は、第1モデルM1の出力層から出力されたばかりの検索クエリQ1k(k=1、2、3、4)の分散表現であって、第1モデルM1にフィードバックをかける前(学習前)の分散表現を示す(ステップS22−1)。
Then, the
続いて、情報処理装置100は、同一のユーザU1によって所定の時間内に連続して入力された一対の検索クエリは、所定の検索意図(例えば、「ある場所(東京都港区付近)で飲食店を探す」という検索意図)で入力された検索クエリであると推定されるため、相互に類似する特徴を有するものとして、検索クエリQ11の分散表現(ベクトルQV11)と、検索クエリQ11と対となる検索クエリQ12の分散表現(ベクトルQV12)とが、分散表現空間上で類似するように第1モデルM1を学習させる。また、情報処理装置100は、検索クエリQ12の分散表現(ベクトルQV12)と、検索クエリQ12と対となる検索クエリQ13の分散表現(ベクトルQV13)とが、分散表現空間上で類似するように第1モデルM1を学習させる。また、情報処理装置100は、検索クエリQ13の分散表現(ベクトルQV13)と、検索クエリQ13と対となる検索クエリQ14の分散表現(ベクトルQV14)とが、分散表現空間上で類似するように第1モデルM1を学習させる。このように、情報処理装置100は、一対の検索クエリに対応する一対の分散表現である2つのベクトルが分散表現空間上で類似するように第1モデルM1を学習させることで、検索クエリから分散表現(ベクトル)を出力する第1モデルM1を生成する(ステップS23−1)。
Subsequently, the
図3の上段に示す情報処理の結果として、検索クエリQ1k(k=1、2、3、4)の分散表現であるベクトルQV1k(k=1、2、3、4)が分散表現空間の近い位置にクラスタCL11としてマッピングされる様子が示されている。例えば、検索クエリQ1k(k=1、2、3、4)は、ユーザU1によって「ある場所(東京都港区付近)で飲食店を探す」という検索意図の下で検索された検索クエリの集合であると推定される。すなわち、検索クエリQ1k(k=1、2、3、4)は、「ある場所(東京都港区付近)で飲食店を探す」という検索意図の下で検索された検索クエリであるという点で、相互に類似する特徴を有する検索クエリであると推定される。ここで、情報処理装置100は、「ある場所(東京都港区付近)で飲食店を探す」という検索意図で入力された所定の検索クエリが第1モデルに入力されると、クラスタCL11の位置にマッピングされるような分散表現を出力することができる。これにより、例えば、情報処理装置100は、クラスタCL11の位置にマッピングされる分散表現に対応する検索クエリを抽出することにより、「ある場所(東京都港区付近)で飲食店を探す」という検索意図に応じた検索クエリを抽出することができる。したがって、情報処理装置100は、検索クエリの意味を適切に解釈可能とすることができる。
As a result of the information processing shown in the upper part of FIG. 3, the vector QV1k (k = 1, 2, 3, 4), which is the distributed expression of the search query Q1k (k = 1, 2, 3, 4), is close to the distributed expression space. It is shown that the position is mapped as the cluster CL11. For example, the search query Q1k (k = 1, 2, 3, 4) is a set of search queries searched by the user U1 under the search intent of “search for a restaurant in a certain place (near Minato-ku, Tokyo)”. Is estimated to be That is, the search query Q1k (k = 1, 2, 3, 4) is a search query that is searched under the search intent of “searching for a restaurant in a certain place (near Minato-ku, Tokyo)”. , Are presumed to be search queries having similar features to each other. Here, the
図3の下段に示す例では、情報処理装置100は、同一のユーザU2によって所定の時間内に連続して入力された3個の検索クエリである検索クエリQ21(「冷蔵庫 400L」)、検索クエリQ22(「冷蔵庫 中型」)、検索クエリQ23(「冷蔵庫 中型 おすすめ」)を抽出する。情報処理装置100は、検索クエリが入力された順番に並べると、検索クエリQ21、検索クエリQ22、検索クエリQ23の順番で入力された3個の検索クエリを抽出する。情報処理装置100は、3個の検索クエリを抽出すると、時系列的に隣り合う2つの検索クエリを一対の検索クエリとして、2対の検索クエリのペアである(検索クエリQ21、検索クエリQ22)、(検索クエリQ22、検索クエリQ23)を抽出する(ステップS21−2)。
In the example illustrated in the lower part of FIG. 3, the
続いて、情報処理装置100は、抽出した検索クエリQ2m(m=1、2、3)を第1モデルM1に入力して、検索クエリQ2m(m=1、2、3)の分散表現であるベクトルBQV2m(m=1、2、3)を出力する。ここで、ベクトルBQV2m(m=1、2、3)は、第1モデルM1の出力層から出力されたばかりの検索クエリQ2m(m=1、2、3)の分散表現であって、第1モデルM1にフィードバックをかける前(学習前)の分散表現を示す(ステップS22−2)。
Subsequently, the
続いて、情報処理装置100は、同一のユーザU2によって所定の時間内に連続して入力された一対の検索クエリは、所定の検索意図(例えば、「中型の冷蔵庫を調べる」という検索意図)で入力された検索クエリであると推定されるため、相互に類似する特徴を有するものとして、検索クエリQ21の分散表現(ベクトルQV21)と、検索クエリQ21と対となる検索クエリQ22の分散表現(ベクトルQV22)とが、分散表現空間上で類似するように第1モデルM1を学習させる。また、情報処理装置100は、検索クエリQ22の分散表現(ベクトルQV22)と、検索クエリQ22と対となる検索クエリQ23の分散表現(ベクトルQV23)とが、分散表現空間上で類似するように第1モデルM1を学習させる。このように、情報処理装置100は、一対の検索クエリに対応する一対の分散表現である2つのベクトルが分散表現空間上で類似するように第1モデルM1を学習させることで、検索クエリから分散表現(ベクトル)を出力する第1モデルM1を生成する(ステップS23−2)。
Subsequently, the
図3の下段に示す情報処理の結果として、検索クエリQ2m(m=1、2、3)の分散表現であるベクトルQV2m(m=1、2、3)が分散表現空間の近い位置にクラスタCL21としてマッピングされる様子が示されている。例えば、検索クエリQ2m(m=1、2、3)は、ユーザU2によって「中型の冷蔵庫を調べる」という検索意図の下で検索された検索クエリの集合であると推定される。すなわち、Q2m(m=1、2、3)は、「中型の冷蔵庫を調べる」という検索意図の下で検索された検索クエリであるという点で、相互に類似する特徴を有する検索クエリであると推定される。ここで、情報処理装置100は、「中型の冷蔵庫を調べる」という検索意図で入力された所定の検索クエリが第1モデルに入力されると、クラスタCL21の位置にマッピングされるような分散表現を出力することができる。これにより、例えば、情報処理装置100は、クラスタCL21の位置にマッピングされる分散表現に対応する検索クエリを抽出することにより、「中型の冷蔵庫を調べる」という検索意図に応じた検索クエリを抽出することができる。したがって、情報処理装置100は、検索クエリの意味を適切に解釈可能とすることができる。
As a result of the information processing shown in the lower part of FIG. 3, the vector QV2m (m = 1, 2, 3), which is the distributed expression of the search query Q2m (m = 1, 2, 3), is located near the cluster CL21 in the distributed expression space. Is mapped as. For example, the search query Q2m (m = 1, 2, 3) is presumed to be a set of search queries searched by the user U2 under the search intention of “searching for a medium-sized refrigerator”. That is, Q2m (m = 1, 2, 3) is a search query having similar characteristics in that it is a search query searched under the search intention of “searching for a medium-sized refrigerator”. Presumed. Here, the
また、本願発明に係る情報処理装置100は、ランダムに抽出された複数の検索クエリは、異なる検索意図の下で検索された検索クエリであるという点で、相互に相違する特徴を有する検索クエリであるとみなして第1モデルM1を学習させる。具体的には、情報処理装置100は、所定の検索クエリの分散表現と、所定の検索クエリとは無関係にランダムに抽出された検索クエリの分散表現とが分散表現空間上で遠くにマッピングされるように第1モデルM1のトレーニングを行う。図3に示す例では、情報処理装置100は、検索クエリQ11とは無関係にランダムに検索クエリを抽出したところ、検索クエリQ21が抽出されたとする。この場合、情報処理装置100は、検索クエリQ11の分散表現(ベクトルQV11)と、検索クエリQ11とは無関係にランダムに抽出された検索クエリQ21の分散表現(ベクトルQV21)とが分散表現空間上で遠くにマッピングされるように第1モデルM1のトレーニングを行う。その結果として、「ある場所(東京都港区付近)で飲食店を探す」という検索意図の下で検索された検索クエリQ1k(k=1、2、3、4)の分散表現であるベクトルQV1k(k=1、2、3、4)を含むクラスタCL11と、「中型の冷蔵庫を調べる」という検索意図の下で検索された検索クエリQ2m(m=1、2、3)の分散表現であるベクトルQV2m(m=1、2、3)を含むクラスタCL21とは、分散表現空間上で遠くにマッピングされる。すなわち、本願発明に係る情報処理装置100は、ランダムに抽出された複数の検索クエリの分散表現が相違するように第1モデルM1を学習させることにより、検索意図が異なる検索クエリの分散表現を分散表現空間上で遠い位置に出力可能とする。
In addition, the
なお、情報処理装置100が生成した第1モデルM1によって出力された分散表現(ベクトル)が分散表現空間にマッピングされた結果として、上述したクラスタCL11とクラスタCL21の他にも、同一のユーザによって所定の時間内に入力された複数の検索クエリの分散表現(ベクトル)の集合であるクラスタCL12やクラスタCL22が生成される。
As a result of the distributed representation (vector) output by the first model M1 generated by the
上述したように、情報処理装置100は、ユーザによって入力された検索クエリを取得する。また、情報処理装置100は、取得した検索クエリのうち、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして学習することで、所定の検索クエリから所定の検索クエリの特徴情報を予測する第1モデルを生成する。すなわち、本願発明に係る情報処理装置100は、所定の時間内に連続して入力された複数の検索クエリは、所定の検索意図の下で検索された検索クエリであるという点で、相互に類似する特徴を有する検索クエリであるとみなして第1モデルを学習させる。具体的には、情報処理装置100は、同一のユーザによって所定の時間内に入力された複数の検索クエリの分散表現が類似するように第1モデルを学習させることで、所定の検索クエリから所定の検索クエリの特徴情報を含む分散表現を出力する第1モデルを生成する。すなわち、本願発明に係る情報処理装置100は、所定の時間内に連続して入力された複数の検索クエリの分散表現が類似するように第1モデルM1を学習させることにより、所定の検索意図の下で検索された検索クエリの分散表現を分散表現空間上で近い位置に出力可能とする。これにより、情報処理装置100は、検索クエリを入力したユーザのコンテクストに応じて検索クエリの意味(検索意図)を出力(解釈)することを可能にする。したがって、情報処理装置100は、検索クエリの意味を適切に解釈可能とすることができる。さらに、情報処理装置100は、所定の検索クエリの特徴情報を含む分散表現の近傍にマッピングされる分散表現に対応する検索クエリを抽出することにより、所定の検索クエリが検索された検索意図に応じた検索クエリを抽出することができる。すなわち、情報処理装置100は、検索クエリを入力したユーザの検索意図やコンテクストを考慮して、ユーザの検索動向を分析することを可能にする。したがって、情報処理装置100は、ユーザの検索動向の分析精度を高めることができる。また、情報処理装置100が生成した第1モデルM1を検索システムの一部として機能させることもできる。あるいは、情報処理装置100は、第1モデルM1によって予測された検索クエリの特徴情報を利用する他のシステム(例えば、検索エンジン)への入力情報として、第1モデルM1が出力した検索クエリの分散表現を提供することもできる。これにより、検索システムは、第1モデルM1によって予測された検索クエリの特徴情報に基づいて、検索結果として出力されるコンテンツを選択可能になる。すなわち、検索システムは、検索クエリを入力したユーザの検索意図やコンテクストを考慮して、検索結果として出力されるコンテンツを選択可能になる。さらに、検索システムは、第1モデルM1によって予測された検索クエリの特徴情報に基づいて、検索結果として出力されるコンテンツに含まれる文字列の分散表現と検索クエリの分散表現との類似度を算出可能になる。そして、検索システムは、算出した類似度に基づいて、検索結果として出力されるコンテンツの表示順を決定可能になる。すなわち、検索システムは、検索クエリを入力したユーザの検索意図やコンテクストを考慮して、検索結果として出力されるコンテンツの表示順を決定可能になる。したがって、情報処理装置100は、検索サービスにおけるユーザビリティを向上させることができる。
As described above, the
〔第2学習モデルの生成処理〕
次に、図4を用いて、第2学習モデルの生成処理の流れについて説明する。図4は、実施形態に係る第2学習モデルの生成処理の一例を示す図である。なお、以下では、適宜、第2学習モデルを第2モデル(又は、第2モデルM2)と記載する。図4の上段に示す例では、情報処理装置100は、同一のユーザU1によって所定の時間内に連続して入力された4個の検索クエリである検索クエリQ11(「六本木 パスタ」)、検索クエリQ12(「六本木 イタリアン」)、検索クエリQ13(「赤坂 パスタ」)、検索クエリQ14(「麻布 パスタ」)を抽出する。情報処理装置100は、同一のユーザU1によって各検索クエリが入力された時間の間隔が所定の時間内である複数の検索クエリを抽出する。また、情報処理装置100は、同一のユーザU1によって各検索クエリのペアが入力された時間の間隔が所定の時間内である複数の検索クエリを抽出する。ここで、4個の検索クエリは、検索クエリQ11、検索クエリQ12、検索クエリQ13、検索クエリQ14の順番でユーザU1によって各検索クエリが所定の時間内に入力された検索クエリであるとする。情報処理装置100は、4個の検索クエリを抽出すると、時系列的に隣り合う2つの検索クエリを一対の検索クエリとして、3対の検索クエリのペアである(検索クエリQ11、検索クエリQ12)、(検索クエリQ12、検索クエリQ13)、(検索クエリQ13、検索クエリQ14)を抽出する。情報処理装置100は、3対の検索クエリのペアを抽出すると、抽出した検索クエリQ1k(k=1、2、3、4)を第1モデルM1に入力する(ステップS31)。なお、情報処理装置100は、同一のユーザU1によって全ての検索クエリが所定の時間内に入力された複数の検索クエリを抽出してもよい。そして、情報処理装置100は、時系列的に隣り合うか否かに関わらず、抽出した複数の検索クエリの中から2つの検索クエリを選択して、選択した2つの検索クエリを一対の検索クエリとして抽出してもよい。
[Generation process of second learning model]
Next, the flow of the second learning model generation process will be described with reference to FIG. FIG. 4 is a diagram illustrating an example of the second learning model generation process according to the embodiment. In the following, the second learning model will be appropriately referred to as the second model (or the second model M2). In the example illustrated in the upper part of FIG. 4, the
続いて、情報処理装置100は、検索クエリQ1k(k=1、2、3、4)の分散表現であるベクトルBQV1k(k=1、2、3、4)を第1モデルM1の出力データとして出力する(ステップS32)。ここで、ベクトルBQV1k(k=1、2、3、4)は、第1モデルM1の出力層から出力されたばかりの検索クエリQ1k(k=1、2、3、4)の分散表現であって、第1モデルM1にフィードバックをかける前(学習前)の分散表現を示す。
Subsequently, the
ここで、同一のユーザU1によって所定の時間内に連続して入力された検索クエリQ1k(k=1、2、3、4)は、例えば、ユーザU1によって「ある場所(東京都港区付近)で飲食店を探す」という検索意図の下で検索された検索クエリの集合であると推定される。すなわち、検索クエリQ1k(k=1、2、3、4)は、「ある場所(東京都港区付近)で飲食店を探す」という検索意図の下で検索された検索クエリであるという点で、相互に類似する特徴を有する検索クエリであると推定される。そこで、情報処理装置100は、連続して入力された検索クエリが類似する特徴を有するものとして学習することで、所定の検索クエリから所定の検索クエリの特徴情報を予測する第1モデルを生成する(ステップS33)。具体的には、情報処理装置100は、連続して入力された検索クエリの分散表現が類似するものとして学習することで、所定の検索クエリから所定の検索クエリの分散表現を予測する第1モデルM1を生成する。例えば、情報処理装置100は、検索クエリQ11の分散表現(ベクトルQV11)と、検索クエリQ11と対となる検索クエリQ12の分散表現(ベクトルQV12)とが、分散表現空間上で類似するように第1モデルM1を学習させる。また、情報処理装置100は、検索クエリQ12の分散表現(ベクトルQV12)と、検索クエリQ12と対となる検索クエリQ13の分散表現(ベクトルQV13)とが、分散表現空間上で類似するように第1モデルM1を学習させる。また、情報処理装置100は、検索クエリQ13の分散表現(ベクトルQV13)と、検索クエリQ13と対となる検索クエリQ14の分散表現(ベクトルQV14)とが、分散表現空間上で類似するように第1モデルM1を学習させる。
Here, the search query Q1k (k = 1, 2, 3, 4) continuously input by the same user U1 within a predetermined time is, for example, “some place (near Minato-ku, Tokyo)” by the user U1. It is presumed to be a set of search queries searched under the search intention of "searching for restaurants in." That is, the search query Q1k (k = 1, 2, 3, 4) is a search query that is searched under the search intent of “searching for a restaurant in a certain place (near Minato-ku, Tokyo)”. , Are presumed to be search queries having similar features to each other. Therefore, the
図4の上段の右側には、学習済みの第1モデルM1の出力結果として、同一のユーザU1によって所定の時間内に入力された検索クエリQ1k(k=1、2、3、4)の分散表現であるベクトルQV1k(k=1、2、3、4)が分散表現空間のクラスタCL11としてマッピングされる様子が示されている。このように、情報処理装置100は、同一のユーザによって所定の時間内に入力された複数の検索クエリが有する特徴を学習した第1学習モデルM1を生成する。
On the right side of the upper part of FIG. 4, the variance of the search query Q1k (k = 1, 2, 3, 4) input by the same user U1 within a predetermined time as the output result of the learned first model M1. It is shown that the expression vector QV1k (k = 1, 2, 3, 4) is mapped as the cluster CL11 in the distributed expression space. In this way, the
情報処理装置100は、第1モデルM1を生成すると、生成した第1モデルM1(第1モデルM1のモデルデータMDT1)を取得する。情報処理装置100は、第1モデルM1を取得すると、取得した第1モデルM1を用いて、第2学習モデルM2を生成する。具体的には、情報処理装置100は、第1モデルM1を再学習させることにより、第1モデルM1とは学習モデルの重みである接続係数が異なる第2モデルM2を生成する。より具体的には、情報処理装置100は、第1モデルM1を用いて、所定の検索クエリから所定の検索クエリが属するカテゴリを予測する第2学習モデルM2を生成する(ステップS34)。
After generating the first model M1, the
図4の下段に示す例では、情報処理装置100は、検索クエリが第2モデルM2に入力された際に、CAT11(「飲食店を探す」)、CAT12(「商品を探す」)、CAT13(「飲食店を予約する」)、CAT14(「商品を購入する」)の4つのカテゴリのいずれのカテゴリに属するかを予測する第2モデルM2を生成する。具体的には、情報処理装置100は、入力情報として検索クエリが第2モデルM2に入力された際に、出力情報として検索クエリがそのカテゴリに属する確率をカテゴリ毎に出力する第2モデルM2を生成する。例えば、情報処理装置100は、第2モデルM2の正解データとして、検索クエリと検索クエリが属するカテゴリ(CAT11〜CAT14のいずれか)との組を学習する。
In the example illustrated in the lower part of FIG. 4, when the search query is input to the second model M2, the
なお、検索クエリがCAT11(「飲食店を探す」)に属することは、検索クエリが飲食店を探す意図で入力された検索クエリであることを示す。また、CAT12(「商品を探す」)に属することは、検索クエリが商品を探す意図で入力された検索クエリであることを示す。また、検索クエリがCAT13(「飲食店を予約する」)に属することは、検索クエリが飲食店を予約する意図で入力された検索クエリであることを示す。また、検索クエリがCAT14(「商品を購入する」)に属することは、検索クエリが商品を購入する意図で入力された検索クエリであることを示す。 The fact that the search query belongs to CAT11 (“search for restaurants”) indicates that the search query is a search query that was input with the intention of searching for restaurants. Belonging to CAT12 (“search for product”) indicates that the search query is a search query input with the intention of searching for a product. In addition, the fact that the search query belongs to CAT13 (“reserve a restaurant”) indicates that the search query is a search query that is input with the intention of reserving a restaurant. Further, the fact that the search query belongs to CAT14 (“purchase the product”) indicates that the search query is a search query input with the intention of purchasing the product.
具体的には、情報処理装置100は、検索クエリが学習モデルに入力された際に、学習モデルが出力する分散表現の分類結果が、検索クエリが属するカテゴリに対応するように学習することで、所定の検索クエリから所定の検索クエリが属するカテゴリを予測する第2モデルM2を生成する。そして、情報処理装置100は、例えば、入力情報として検索クエリが第2モデルM2に入力された際に、出力情報として検索クエリがそのカテゴリに属する確率をカテゴリCAT11〜CAT14毎に出力する第2モデルM2を生成する。
Specifically, when the search query is input to the learning model, the
例えば、情報処理装置100は、入力情報として検索クエリQ11(「六本木 パスタ」)が第2モデルM2に入力された際に(ステップS35)、出力情報として検索クエリQ11(「六本木 パスタ」)の分散表現であるベクトルBQV11を出力する。ここで、ベクトルBQV11は、第2モデルM2の出力層から出力されたばかりの検索クエリQ11の分散表現であって、第2モデルM2にフィードバックをかける前(学習前)の分散表現を示す。ここで、検索クエリQ11(「六本木 パスタ」)が属する正解カテゴリがCAT11(「飲食店を探す」)であるとする。この場合、情報処理装置100は、出力された検索クエリQ11(「六本木 パスタ」)の分散表現であるベクトルBQV11がCAT11(「飲食店を探す」)に分類される確率が所定の閾値を超えるように第2モデルM2を学習させる。なお、情報処理装置100は、あらかじめ用意された正解データを用いて第2モデルを学習させる。情報処理装置100は、第2モデルM2の正解データを生成してもよい。そして、情報処理装置100は、生成した正解データを用いて第2モデルM2を学習させてもよい。具体的には、情報処理装置100は、検索クエリを検索したユーザの検索後の行動に基づいて、検索クエリが属する正解カテゴリを決定する。より具体的には、情報処理装置100は、所定の検索クエリを検索したユーザに対して、検索後に所定の行動を起こしたユーザの割合が所定の閾値を超える所定の行動を、正解カテゴリに対応する行動として決定する。例えば、検索クエリQ11(「六本木 パスタ」)を検索したユーザが検索後に所定の行動を起こしたユーザの割合として、飲食店を探す行動を起こしたユーザの割合が90%、検索後に商品を探す行動を起こしたユーザの割合が0%、検索後に飲食店を予約する行動を起こしたユーザの割合が10%、検索後に商品を購入する行動を起こしたユーザの割合が0%であったとする。この場合、情報処理装置100は、飲食店を探す行動を起こしたユーザの割合が所定の閾値(例えば、90%)を超えるため、飲食店を探す行動を検索クエリQ11(「六本木 パスタ」)の正解カテゴリに対応する行動として決定する。そして、情報処理装置100は、正解カテゴリに対応する行動を飲食店を探す行動であると決定したので、検索クエリQ11(「六本木 パスタ」)が属する正解カテゴリをCAT11(「飲食店を探す」)に決定する。
For example, when the search query Q11 (“Roppongi pasta”) is input to the second model M2 as input information (step S35), the
例えば、情報処理装置100は、学習前の第2モデルM2に検索クエリQ11(「六本木 パスタ」)が入力された際に、分散表現であるベクトルBQV11がCAT11(「飲食店を探す」)に分類される確率を80%、CAT12(「商品を探す」)に分類される確率を0%、CAT13(「飲食店を予約」)に分類される確率を20%、CAT14(「商品を購入する」)に分類される確率を0%と出力したとする。この場合、情報処理装置100は、分散表現であるベクトルBQV11がCAT11(「飲食店を探す」)に分類される確率を所定の閾値(例えば、90%)を超えるように第2モデルM2を学習させる。また、情報処理装置100は、分散表現であるベクトルBQV11がCAT11(「飲食店を探す」)に分類される確率が所定の閾値(例えば、90%)を超えるように学習させるのに合わせて、分散表現であるベクトルBQV11が他のカテゴリCAT13(「飲食店を予約」)に分類される確率を10%に下げるように第2モデルM2を学習させる。
For example, when the search query Q11 (“Roppongi pasta”) is input to the second model M2 before learning, the
このように、情報処理装置100は、入力情報として所定の検索クエリが入力されると、出力情報として所定の検索クエリの分散表現が正解カテゴリに分類される確率が所定の閾値を超えるように第2モデルを学習させる。そして、情報処理装置100は、入力情報として所定の検索クエリが入力された際に、所定の検索クエリの分散表現がそのカテゴリに属する確率が所定の閾値を超えるカテゴリを、所定の検索クエリのカテゴリとして出力する。例えば、情報処理装置100は、学習済みの第2モデルM2に入力情報として検索クエリQ11(「六本木 パスタ」)が入力されると、検索クエリQ11(「六本木 パスタ」)の分散表現であるベクトルBQV11がカテゴリCAT11(「飲食店を探す」)に属する確率が90%を超えるので、出力情報として検索クエリが属するカテゴリをCAT11(「飲食店を探す」)と出力する(ステップS36)。このように、情報処理装置100は、検索クエリと検索クエリの正解カテゴリとの組を学習することで、所定の検索クエリから所定の検索クエリのカテゴリを予測する第2モデルを生成する(ステップS37)。
As described above, when the predetermined search query is input as the input information, the
一般的に、ユーザはある意図を持って検索を複数回行うと考えられるため、所定の時間内に連続して入力された検索クエリは、検索意図が近いという仮定が成り立つ。そこで、本願発明に係る情報処理装置100は、所定の時間内に連続して入力された複数の検索クエリは、所定の検索意図の下で検索された検索クエリであるという点で、相互に類似する特徴を有する検索クエリであるとみなして第1モデルM1を学習させる。これにより、情報処理装置100は、検索意図を考慮した検索クエリの特徴を第1モデルM1に学習させることができる。そして、情報処理装置100は、検索意図を考慮した検索クエリの特徴を学習した第1モデルM1を活用して、所定の検索クエリから所定の検索クエリのカテゴリを予測する第2モデルを効率的に生成することができる。これにより、情報処理装置100は、検索クエリを入力したユーザの検索意図を考慮したカテゴリに検索クエリを分類することを可能にする。また、従来、検索クエリをカテゴリに分類し、高い分類精度を得るためには、十分な量の正解データを用意することが必要であった。しかしながら、検索クエリ自体、多種多様であり、ロングテイルな性質を持つものであるため、多数の検索クエリに対応する正解カテゴリをラベル付けするのは、非常に手間がかかり困難である。ここで、情報処理装置100は、正解カテゴリをラベル付けする代わりに、ユーザの検索意図(検索クエリを入力したユーザのコンテクスト)を一種の正解として、検索クエリのカテゴリを予測する第2モデルを学習させることができる。これにより、情報処理装置100は、人手で検索クエリの正解カテゴリをラベル付けすることなく、第2モデルを学習させることができる。すなわち、情報処理装置100は、正解データが少ないときでも、十分な分類精度を得られるようになる。また、情報処理装置100は、正解データが多いときであれば、さらに高い分類精度を得られるようになる。したがって、情報処理装置100は、検索クエリの分類精度を高めることができる。
In general, a user is considered to perform a search a plurality of times with a certain intention, and therefore it is assumed that search queries continuously input within a predetermined time have similar search intentions. Therefore, the
〔2.情報処理装置の構成〕
次に、図6を用いて、実施形態に係る情報処理装置100の構成について説明する。図6は、実施形態に係る情報処理装置100の構成例を示す図である。図6に示すように、情報処理装置100は、通信部110と、記憶部120と、制御部130とを有する。なお、情報処理装置100は、情報処理装置100の管理者等から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を表示するための表示部(例えば、液晶ディスプレイ等)を有してもよい。
[2. Configuration of information processing device]
Next, the configuration of the
(通信部110)
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部110は、ネットワークと有線または無線で接続され、例えば、ユーザ端末10と、検索サーバ50との間で情報の送受信を行う。
(Communication unit 110)
The
(記憶部120)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。記憶部120は、図6に示すように、クエリ情報記憶部121と、ベクトル情報記憶部122と、分類定義記憶部123と、カテゴリ情報記憶部124と、モデル情報記憶部125とを有する。
(Storage unit 120)
The
(クエリ情報記憶部121)
クエリ情報記憶部121は、ユーザによって入力された検索クエリに関する各種の情報を記憶する。図7に、実施形態に係るクエリ情報記憶部の一例を示す。図7に示す例では、クエリ情報記憶部121は、「ユーザID」、「日時」、「検索クエリ」、「検索クエリID」といった項目を有する。
(Query information storage unit 121)
The query information storage unit 121 stores various information regarding the search query input by the user. FIG. 7 shows an example of the query information storage unit according to the embodiment. In the example shown in FIG. 7, the query information storage unit 121 has items such as “user ID”, “date and time”, “search query”, and “search query ID”.
「ユーザID」は、検索クエリを入力したユーザを識別するための識別情報を示す。「日時」は、検索サーバがユーザから検索クエリを受け付けた日時を示す。「検索クエリ」は、ユーザによって入力された検索クエリを示す。「検索クエリID」は、ユーザによって入力された検索クエリを識別するための識別情報を示す。 The “user ID” indicates identification information for identifying the user who has input the search query. The “date and time” indicates the date and time when the search server accepted the search query from the user. "Search query" indicates a search query input by the user. The “search query ID” indicates identification information for identifying the search query input by the user.
図7の1レコード目に示す例では、検索クエリID「Q11」で識別される検索クエリ(検索クエリQ11)は、図2に示した検索クエリQ11に対応する。また、ユーザID「U1」は、検索クエリQ11を入力したユーザがユーザID「U1」で識別されるユーザ(ユーザU1)であることを示す。また、日時「2018/9/1 PM17:00」は、検索サーバがユーザU1から検索クエリQ11を受け付けた日時が2018年9月1日の午後17:00であることを示す。また、検索クエリ「六本木 パスタ」は、ユーザU1によって入力された検索クエリQ11を示す。具体的には、検索クエリ「六本木 パスタ」は、地名を示す「六本木」と食品の種類を示す「パスタ」の文字とが区切り文字であるスペースで区切られた文字列であることを示す。 In the example shown in the first record of FIG. 7, the search query (search query Q11) identified by the search query ID “Q11” corresponds to the search query Q11 shown in FIG. The user ID “U1” indicates that the user who inputs the search query Q11 is the user (user U1) identified by the user ID “U1”. The date and time "2018/9/1 PM 17:00" indicates that the date and time when the search server receives the search query Q11 from the user U1 is 17:00 pm on September 1, 2018. The search query "Roppongi pasta" indicates the search query Q11 input by the user U1. Specifically, the search query “Roppongi pasta” indicates that it is a character string in which “Roppongi” indicating a place name and “pasta” indicating the type of food are separated by a space, which is a delimiter.
(ベクトル情報記憶部122)
ベクトル情報記憶部122は、検索クエリの分散表現であるベクトルに関する各種の情報を記憶する。図8に、実施形態に係るベクトル情報記憶部の一例を示す。図8に示す例では、ベクトル情報記憶部122は、「ベクトルID」、「検索クエリID」、「ベクトル情報」といった項目を有する。
(Vector information storage unit 122)
The vector information storage unit 122 stores various kinds of information regarding vectors, which are distributed expressions of search queries. FIG. 8 shows an example of the vector information storage unit according to the embodiment. In the example shown in FIG. 8, the vector information storage unit 122 has items such as “vector ID”, “search query ID”, and “vector information”.
「ベクトルID」は、検索クエリの分散表現であるベクトルを識別するための識別情報を示す。「検索クエリID」は、ベクトルに対応する検索クエリを識別するための識別情報を示す。「ベクトル情報」は、検索クエリの分散表現であるN次元のベクトルを示す。検索クエリの分散表現であるベクトルは、例えば、128次元のベクトルである。 “Vector ID” indicates identification information for identifying a vector that is a distributed expression of a search query. The “search query ID” indicates identification information for identifying the search query corresponding to the vector. “Vector information” indicates an N-dimensional vector that is a distributed expression of a search query. The vector that is the distributed expression of the search query is, for example, a 128-dimensional vector.
図8の1レコード目に示す例では、ベクトルID「QV11」で識別されるベクトル(ベクトルQV11)は、図2に示した検索クエリQ11の分散表現であるベクトルQV11に対応する。また、検索クエリID「Q11」で識別される検索クエリ(検索クエリQ11)は、ベクトルQV11に対応する検索クエリが検索クエリQ11であることを示す。また、ベクトル情報「QVDT11」は、検索クエリQ11の分散表現であるN次元のベクトルを示す。 In the example shown in the first record of FIG. 8, the vector identified by the vector ID “QV11” (vector QV11) corresponds to the vector QV11 that is the distributed expression of the search query Q11 shown in FIG. The search query (search query Q11) identified by the search query ID “Q11” indicates that the search query corresponding to the vector QV11 is the search query Q11. The vector information “QVDT11” indicates an N-dimensional vector that is a distributed expression of the search query Q11.
(分類定義記憶部123)
分類定義記憶部123は、検索クエリが分類されるカテゴリの定義に関する各種の情報を記憶する。図9に、実施形態に係る分類定義記憶部の一例を示す。図9に示す例では、分類定義記憶部123は、「大分類ID」、「大分類」、「小分類ID」、「小分類」といった項目を有する。
(Classification definition storage unit 123)
The classification
「大分類」は、検索クエリが分類されるカテゴリの大分類を示す。「大分類ID」は、大分類を識別するための識別情報を示す。図9に示す例では、大分類「購買行動系」は、図1の下段に示す例で説明した大分類に対応する。大分類「購買行動系」は、検索クエリをユーザの購買行動に基づいて分類するカテゴリの大分類を示す。図9に示す例では、大分類「購買行動系」は、さらに4つの小分類を有する。大分類ID「CAT1」は、大分類「購買行動系」を識別するための識別情報を示す。 The “major classification” indicates the major classification of the categories into which the search query is classified. The “major classification ID” indicates identification information for identifying the major classification. In the example shown in FIG. 9, the large classification “purchasing behavior type” corresponds to the large classification described in the example shown in the lower part of FIG. The large classification "purchasing behavior system" indicates a large classification of categories into which the search query is classified based on the purchasing behavior of the user. In the example shown in FIG. 9, the large classification “purchasing behavior type” further has four small classifications. The large classification ID “CAT1” indicates identification information for identifying the large classification “purchasing behavior type”.
「小分類」、検索クエリが分類されるカテゴリの小分類を示す。「小分類ID」は、小分類を識別するための識別情報を示す。図9に示す例では、小分類「飲食店を探す」は、大分類「購買行動系」に属する分類であって、小分類に分類される検索クエリが、ユーザによって飲食店を探す意図で入力された検索クエリであることを示す。小分類ID「CAT11」は、小分類「飲食店を探す」を識別するための識別情報を示す。 “Minor classification” indicates a minor classification of the category into which the search query is classified. The “small classification ID” indicates identification information for identifying the small classification. In the example shown in FIG. 9, the small category “search for restaurants” belongs to the large category “purchase behavior system”, and the search query classified into the small categories is input by the user with the intention of searching for restaurants. Indicates that the search query was performed. The small classification ID “CAT11” indicates identification information for identifying the small classification “search for restaurants”.
小分類「商品を探す」は、大分類「購買行動系」に属する分類であって、小分類に分類される検索クエリが、ユーザによって商品を探す意図で入力された検索クエリであることを示す。小分類ID「CAT12」は、小分類「商品を探す」を識別するための識別情報を示す。 The small category “search for products” is a category belonging to the large category “purchasing behavior”, and indicates that the search queries classified into the small categories are search queries input by the user with the intention of searching for products. . The small classification ID “CAT12” indicates identification information for identifying the small classification “search for products”.
小分類「飲食店を予約」は、大分類「購買行動系」に属する分類であって、小分類に分類される検索クエリが、ユーザによって飲食店を予約する意図で入力された検索クエリであることを示す。小分類ID「CAT13」は、小分類「飲食店を予約」を識別するための識別情報を示す。 The small category “reserve a restaurant” is a category belonging to the large category “purchasing behavior type”, and the search query classified into the small category is a search query input by the user with the intention of reserving a restaurant. Indicates that. The small classification ID “CAT13” indicates identification information for identifying the small classification “reserve a restaurant”.
小分類「商品を購入」は、大分類「購買行動系」に属する分類であって、小分類に分類される検索クエリが、ユーザによって商品を購入する意図で入力された検索クエリであることを示す。小分類ID「CAT14」は、小分類「商品を購入」を識別するための識別情報を示す。 The small category “Purchase goods” is a category that belongs to the large category “Purchasing behavior type”, and the search queries classified into the small categories are search queries input by the user with the intention of purchasing the product. Show. The small classification ID “CAT14” indicates identification information for identifying the small classification “purchase a product”.
(カテゴリ情報記憶部124)
カテゴリ情報記憶部124は、検索クエリが属するカテゴリに関する各種の情報を記憶する。具体的には、カテゴリ情報記憶部124は、学習済みの第2学習モデルに検索クエリが入力された際に、第2学習モデルが出力するカテゴリに関する各種の情報を記憶する。図10に、実施形態に係るカテゴリ情報記憶部の一例を示す。図10に示す例では、カテゴリ情報記憶部124は、「検索クエリID」、「大分類ID」、「小分類ID」、「確率(%)」といった項目を有する。
(Category information storage unit 124)
The category
「検索クエリID」は、ユーザによって入力された検索クエリを識別するための識別情報を示す。図10に示す例では、検索クエリID「Q11」で識別される検索クエリ(検索クエリQ11)は、図4に示した検索クエリQ11に対応する。 The “search query ID” indicates identification information for identifying the search query input by the user. In the example shown in FIG. 10, the search query (search query Q11) identified by the search query ID “Q11” corresponds to the search query Q11 shown in FIG.
「大分類ID」は、大分類を識別するための識別情報を示す。「小分類ID」は、小分類を識別するための識別情報を示す。「確率(%)」は、学習済みの第2学習モデルに検索クエリが入力された際に、第2学習モデルが出力する小分類毎の確率を示す。図10に示す例では、確率(%)「90」は、検索クエリQ11がカテゴリCAT11に分類される確率が90%であることを示す。 The “major classification ID” indicates identification information for identifying the major classification. The “small classification ID” indicates identification information for identifying the small classification. The “probability (%)” indicates the probability of each subclass output by the second learning model when a search query is input to the already learned second learning model. In the example shown in FIG. 10, the probability (%) “90” indicates that the probability that the search query Q11 is classified into the category CAT11 is 90%.
(モデル情報記憶部125)
モデル情報記憶部125は、情報処理装置100によって生成された学習モデルに関する各種の情報を記憶する。図11に、実施形態に係るモデル情報記憶部の一例を示す。図11に示す例では、モデル情報記憶部125は、「モデルID」、「モデルデータ」といった項目を有する。
(Model information storage unit 125)
The model
「モデルID」は、情報処理装置100によって生成された学習モデルを識別するための識別情報を示す。「モデルデータ」は、情報処理装置100によって生成された学習モデルのモデルデータを示す。例えば、「モデルデータ」には、検索クエリを分散表現に変換するためのデータが格納される。
The “model ID” indicates identification information for identifying the learning model generated by the
図11の1レコード目に示す例では、モデルID「M1」で識別される学習モデルは、図1に示した第1モデルM1に対応する。また、モデルデータ「MDT1」は、情報処理装置100によって生成された第1モデルM1のモデルデータ(モデルデータMDT1)を示す。
In the example shown in the first record of FIG. 11, the learning model identified by the model ID “M1” corresponds to the first model M1 shown in FIG. The model data “MDT1” indicates the model data (model data MDT1) of the first model M1 generated by the
モデルデータMDT1は、検索クエリが入力される入力層と、出力層と、入力層から出力層までのいずれかの層であって出力層以外の層に属する第1要素と、第1要素と第1要素の重みとに基づいて値が算出される第2要素と、を含み、入力層に入力された検索クエリに応じて、入力層に入力された検索クエリの分散表現を出力層から出力するよう、情報処理装置100を機能させてもよい。
The model data MDT1 includes an input layer to which a search query is input, an output layer, a first element belonging to any layer from the input layer to the output layer and other than the output layer, the first element, and the first element. A second element whose value is calculated based on the weight of one element, and a distributed expression of the search query input to the input layer is output from the output layer according to the search query input to the input layer. Thus, the
ここで、モデルデータMDT1が「y=a1*x1+a2*x2+・・・+ai*xi」で示す回帰モデルで実現されるとする。この場合、モデルデータMDT1が含む第1要素は、x1やx2等といった入力データ(xi)に対応する。また、第1要素の重みは、xiに対応する係数aiに対応する。ここで、回帰モデルは、入力層と出力層とを有する単純パーセプトロンと見做すことができる。各モデルを単純パーセプトロンと見做した場合、第1要素は、入力層が有するいずれかのノードに対応し、第2要素は、出力層が有するノードと見做すことができる。 Here, it is assumed that the model data MDT1 is realized by the regression model represented by “y = a1 * x1 + a2 * x2 + ... + ai * xi”. In this case, the first element included in the model data MDT1 corresponds to the input data (xi) such as x1 and x2. The weight of the first element corresponds to the coefficient ai corresponding to xi. Here, the regression model can be regarded as a simple perceptron having an input layer and an output layer. When each model is regarded as a simple perceptron, the first element can be regarded as a node included in the input layer, and the second element can be regarded as a node included in the output layer.
また、モデルデータMDT1がDNN(Deep Neural Network)等、1つまたは複数の中間層を有するニューラルネットワークで実現されるとする。この場合、モデルデータMDT1が含む第1要素は、入力層または中間層が有するいずれかのノードに対応する。また、第2要素は、第1要素と対応するノードから値が伝達されるノードである次段のノードに対応する。また、第1要素の重みは、第1要素と対応するノードから第2要素と対応するノードに伝達される値に対して考慮される重みである接続係数に対応する。 It is also assumed that the model data MDT1 is realized by a neural network having one or a plurality of intermediate layers such as DNN (Deep Neural Network). In this case, the first element included in the model data MDT1 corresponds to any node included in the input layer or the intermediate layer. The second element corresponds to the node at the next stage, which is the node to which the value is transmitted from the node corresponding to the first element. The weight of the first element corresponds to the connection coefficient, which is a weight considered for the value transmitted from the node corresponding to the first element to the node corresponding to the second element.
情報処理装置100は、上述した回帰モデルやニューラルネットワーク等、任意の構造を有するモデルを用いて、分散表現の算出を行う。具体的には、モデルデータMDT1は、検索クエリが入力された場合に、分散表現を出力するように係数が設定される。情報処理装置100は、このようなモデルデータMDT1を用いて、分散表現を算出する。
The
なお、上記例では、モデルデータMDT1が、検索クエリが入力された場合に、検索クエリの分散表現を出力するモデル(以下、モデルX1という。)である例を示した。しかし、実施形態に係るモデルデータMDT1は、モデルX1にデータの入出力を繰り返すことで得られる結果に基づいて生成されるモデルであってもよい。例えば、モデルデータMDT1は、検索クエリを入力とした際に、モデルX1が出力した分散表現を入力して学習されたモデル(以下、モデルY1という。)であってもよい。または、モデルデータMDT1は、検索クエリを入力とし、モデルY1の出力値を出力とするよう学習されたモデルであってもよい。 In the above example, the model data MDT1 is the model (hereinafter, referred to as model X1) that outputs the distributed expression of the search query when the search query is input. However, the model data MDT1 according to the embodiment may be a model generated based on a result obtained by repeating input / output of data to / from the model X1. For example, the model data MDT1 may be a model (hereinafter, referred to as model Y1) learned by inputting the distributed expression output by the model X1 when the search query is input. Alternatively, the model data MDT1 may be a model learned so that the search query is input and the output value of the model Y1 is output.
また、情報処理装置100がGAN(Generative Adversarial Networks)を用いた推定処理を行う場合、モデルデータMDT1は、GANの一部を構成するモデルであってもよい。
Further, when the
図11の2レコード目に示す例では、モデルID「M2」で識別される学習モデルは、図1に示した第2モデルM2に対応する。また、モデルデータ「MDT2」は、情報処理装置100によって生成された第2モデルM2のモデルデータ(モデルデータMDT2)を示す。
In the example shown in the second record of FIG. 11, the learning model identified by the model ID “M2” corresponds to the second model M2 shown in FIG. Further, the model data “MDT2” indicates model data (model data MDT2) of the second model M2 generated by the
モデルデータMDT2は、検索クエリが入力される入力層と、出力層と、入力層から出力層までのいずれかの層であって出力層以外の層に属する第1要素と、第1要素と第1要素の重みとに基づいて値が算出される第2要素と、を含み、入力層に入力された検索クエリに応じて、入力層に入力された検索クエリが各カテゴリに属する確率を出力層から出力するよう、情報処理装置100を機能させてもよい。
The model data MDT2 includes an input layer to which a search query is input, an output layer, a first element belonging to any layer from the input layer to the output layer and other than the output layer, the first element, and the first element. A second element whose value is calculated based on the weight of one element; and a probability that the search query input to the input layer belongs to each category according to the search query input to the input layer The
ここで、モデルデータMDT2が「y=a1*x1+a2*x2+・・・+ai*xi」で示す回帰モデルで実現されるとする。この場合、モデルデータMDT2が含む第1要素は、x1やx2等といった入力データ(xi)に対応する。また、第1要素の重みは、xiに対応する係数aiに対応する。ここで、回帰モデルは、入力層と出力層とを有する単純パーセプトロンと見做すことができる。各モデルを単純パーセプトロンと見做した場合、第1要素は、入力層が有するいずれかのノードに対応し、第2要素は、出力層が有するノードと見做すことができる。 Here, it is assumed that the model data MDT2 is realized by a regression model represented by “y = a1 * x1 + a2 * x2 + ... + ai * xi”. In this case, the first element included in the model data MDT2 corresponds to the input data (xi) such as x1 and x2. The weight of the first element corresponds to the coefficient ai corresponding to xi. Here, the regression model can be regarded as a simple perceptron having an input layer and an output layer. When each model is regarded as a simple perceptron, the first element can be regarded as a node included in the input layer, and the second element can be regarded as a node included in the output layer.
また、モデルデータMDT2がDNN(Deep Neural Network)等、1つまたは複数の中間層を有するニューラルネットワークで実現されるとする。この場合、モデルデータMDT2が含む第1要素は、入力層または中間層が有するいずれかのノードに対応する。また、第2要素は、第1要素と対応するノードから値が伝達されるノードである次段のノードに対応する。また、第1要素の重みは、第1要素と対応するノードから第2要素と対応するノードに伝達される値に対して考慮される重みである接続係数に対応する。 Further, it is assumed that the model data MDT2 is realized by a neural network having one or more intermediate layers such as DNN (Deep Neural Network). In this case, the first element included in the model data MDT2 corresponds to any node included in the input layer or the intermediate layer. The second element corresponds to the node at the next stage, which is the node to which the value is transmitted from the node corresponding to the first element. The weight of the first element corresponds to the connection coefficient, which is a weight considered for the value transmitted from the node corresponding to the first element to the node corresponding to the second element.
情報処理装置100は、上述した回帰モデルやニューラルネットワーク等、任意の構造を有するモデルを用いて、検索クエリが各カテゴリに属する確率の算出を行う。具体的には、モデルデータMDT2は、検索クエリが入力された場合に、検索クエリが各カテゴリに属する確率を出力するように係数が設定される。情報処理装置100は、このようなモデルデータMDT2を用いて、検索クエリが各カテゴリに属する確率を算出する。
The
なお、上記例では、モデルデータMDT2が、検索クエリが入力された場合に、検索クエリの分散表現を出力するモデル(以下、モデルX2という。)である例を示した。しかし、実施形態に係るモデルデータMDT2は、モデルX2にデータの入出力を繰り返すことで得られる結果に基づいて生成されるモデルであってもよい。例えば、モデルデータMDT2は、検索クエリを入力とした際に、モデルX2が出力した分散表現を入力して学習されたモデル(以下、モデルY2という。)であってもよい。または、モデルデータMDT2は、検索クエリを入力とし、モデルY2の出力値を出力とするよう学習されたモデルであってもよい。 In the above example, the model data MDT2 is the model (hereinafter, referred to as model X2) that outputs the distributed expression of the search query when the search query is input. However, the model data MDT2 according to the embodiment may be a model generated based on a result obtained by repeating input / output of data to / from the model X2. For example, the model data MDT2 may be a model (hereinafter, referred to as model Y2) learned by inputting the distributed expression output by the model X2 when the search query is input. Alternatively, the model data MDT2 may be a model learned so that the search query is input and the output value of the model Y2 is output.
また、情報処理装置100がGAN(Generative Adversarial Networks)を用いた推定処理を行う場合、モデルデータMDT2は、GANの一部を構成するモデルであってもよい。
When the
(制御部130)
図6の説明に戻って、制御部130は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、情報処理装置100内部の記憶装置に記憶されている各種プログラム(生成プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部130は、コントローラであり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
(Control unit 130)
Returning to the description of FIG. 6, the control unit 130 is a controller, and is stored in a storage device inside the
また、制御部130は、モデル情報記憶部125に記憶されている第1モデルM1(モデルデータMDT1)に従った情報処理により、入力層に入力された検索クエリに対し、出力層以外の各層に属する各要素を第1要素として、第1要素と第1要素の重みとに基づく演算を行うことにより、分散表現を出力層から出力するよう、コンピュータを機能させる。
In addition, the control unit 130 performs information processing in accordance with the first model M1 (model data MDT1) stored in the model
また、制御部130は、モデル情報記憶部125に記憶されている第2モデルM2(モデルデータMDT2)に従った情報処理により、入力層に入力された検索クエリに対し、出力層以外の各層に属する各要素を第1要素として、第1要素と第1要素の重みとに基づく演算を行うことにより、検索クエリが各カテゴリに属する確率を出力層から出力するよう、コンピュータを機能させる。
In addition, the control unit 130 performs information processing in accordance with the second model M2 (model data MDT2) stored in the model
図6に示すように、制御部130は、取得部131と、抽出部132と、生成部133と、サービス提供部134を有し、以下に説明する情報処理の作用を実現または実行する。なお、制御部130の内部構成は、図6に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。
As illustrated in FIG. 6, the control unit 130 includes an acquisition unit 131, an
(取得部131)
取得部131は、種々の情報を取得する。具体的には、取得部131は、ユーザによって入力された検索クエリを検索サーバ50から取得する。取得部131は、ユーザによって入力された検索クエリを取得すると、取得した検索クエリをクエリ情報記憶部121に格納する。また、取得部131は、検索クエリの分散表現であるベクトルに関するベクトル情報を取得する。取得部131は、ベクトル情報を取得すると、取得したベクトル情報をベクトル情報記憶部122に格納する。また、取得部131は、検索クエリと検索クエリが属するカテゴリの分類を定義する情報を取得する。取得部131は、検索クエリと検索クエリが属するカテゴリの分類を定義する分類定義情報を取得すると、取得した分類定義情報を分類定義記憶部123に格納する。また、取得部131は、検索クエリが属するカテゴリに関するカテゴリ情報を取得する。取得部131は、カテゴリ情報を取得すると、取得したカテゴリ情報をカテゴリ情報記憶部124に格納する。
(Acquisition unit 131)
The acquisition unit 131 acquires various information. Specifically, the acquisition unit 131 acquires the search query input by the user from the
(抽出部132)
抽出部132は、種々の情報を抽出する。具体的には、抽出部132は、取得部131によって取得された検索クエリのうち、同一のユーザによって所定の時間内に入力された複数の検索クエリを抽出する。例えば、抽出部132は、同一のユーザによって各検索クエリが入力された時間の間隔が所定の時間内である複数の検索クエリを抽出する。続いて、抽出部132は、同一のユーザによって所定の時間内に入力された複数の検索クエリのうち、同一のユーザによって所定の時間内に連続して入力された一対の検索クエリを抽出する。例えば、抽出部132は、同一のユーザによって各検索クエリのペアが入力された時間の間隔が所定の時間内である複数の検索クエリを抽出する。例えば、抽出部132は、取得部131によって取得された検索クエリのうち、同一のユーザU1によって所定の時間内に連続して入力された4個の検索クエリである検索クエリQ11(「六本木 パスタ」)、検索クエリQ12(「六本木 イタリアン」)、検索クエリQ13(「赤坂 パスタ」)、検索クエリQ14(「麻布 パスタ」)を抽出する。抽出部132は、検索クエリが入力された順番に並べると、検索クエリQ11、検索クエリQ12、検索クエリQ13、検索クエリQ14の順番で入力された4個の検索クエリを抽出する。続いて、抽出部132は、4個の検索クエリを抽出すると、時系列的に隣り合う2つの検索クエリを一対の検索クエリとして、3対の検索クエリのペアである(検索クエリQ11、検索クエリQ12)、(検索クエリQ12、検索クエリQ13)、(検索クエリQ13、検索クエリQ14)を抽出する。なお、抽出部132は、同一のユーザによって全ての検索クエリが所定の時間内に入力された複数の検索クエリを抽出してもよい。そして、抽出部132は、時系列的に隣り合うか否かに関わらず、抽出した複数の検索クエリの中から2つの検索クエリを選択して、選択した2つの検索クエリを一対の検索クエリとして抽出してもよい。
(Extractor 132)
The
また、抽出部132は、取得部131によって取得された検索クエリのうち、所定の検索クエリと所定の検索クエリに無関係な他の検索クエリとを抽出する。例えば、抽出部132は、取得部131によって取得された検索クエリの中から、所定の検索クエリを抽出する。続いて、抽出部132は、取得部131によって取得された検索クエリの中から、所定の検索クエリとは無関係にランダムに他の検索クエリを抽出する。
In addition, the
(生成部133)
生成部133は、種々の情報を生成する。具体的には、生成部133は、取得部131によって取得された検索クエリのうち、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして学習することで、所定の検索クエリから所定の検索クエリの特徴情報を予測する学習モデルを生成する。具体的には、生成部133は、同一のユーザによって所定の時間内に入力された複数の検索クエリの分散表現が類似するように学習モデルを学習させることで、所定の検索クエリから所定の検索クエリの特徴情報を予測する学習モデルを生成する。例えば、生成部133は、所定の時間内に続けて入力された一対の検索クエリの分散表現が類似するように学習することで、学習モデルを生成する。例えば、生成部133は、一対の検索クエリの学習前の分散表現(ベクトル)の類似度の値を算出する。また、生成部133は、一対の検索クエリの学習後の分散表現(ベクトル)の類似度の値を算出する。続いて、生成部133は、学習前の分散表現(ベクトル)の類似度の値よりも、学習後の分散表現(ベクトル)の類似度の値が大きくなるように学習モデルを学習させる。このように、生成部133は、一対の検索クエリに対応する一対の分散表現である2つのベクトルが分散表現空間上で類似するように学習モデルを学習させることで、検索クエリから分散表現(ベクトル)を出力する学習モデルを生成する。より具体的には、生成部133は、RNNの一種であるLSTMを分散表現生成に用いたDSSMの技術を用いて、検索クエリから分散表現(ベクトル)を出力する学習モデルを生成する。例えば、生成部133は、学習モデルの正解データとして、同一のユーザによって所定の時間内に入力された一対の検索クエリが類似する特徴を有するものとして、所定の検索クエリの分散表現(ベクトル)と、所定の検索クエリと対となる他の検索クエリの分散表現(ベクトル)とが、分散表現空間上で近くに存在するように学習する。また、生成部133は、第1学習モデルを生成すると、第1学習モデルを識別する識別情報と対応付けて、生成した第1学習モデル(モデルデータMDT1)をモデル情報記憶部125に格納する。
(Generator 133)
The
〔第1学習モデルの一例〕
ここで、図12を用いて情報処理装置100が生成する第1学習モデルの一例について説明する。図12は、実施形態に係る第1学習モデルの一例を示す図である。図12に示す例では、情報処理装置100が生成する第1学習モデルM1は、3層のLSTM RNNで構成されている。図12に示す例では、抽出部132は、同一のユーザU1によって所定の時間内に連続して入力された「六本木 パスタ」という検索クエリQ11と「六本木 イタリアン」という検索クエリQ12とから成る一対の検索クエリを抽出する。生成部133は、抽出部132によって抽出されたた検索クエリQ11を第1学習モデルM1の入力層に入力する(ステップS41)。
[Example of first learning model]
Here, an example of the first learning model generated by the
続いて、生成部133は、第1学習モデルM1の出力層から検索クエリQ11の分散表現である256次元のベクトルBQV11を出力する。また、生成部133は、抽出部132によって抽出された検索クエリQ12を第1学習モデルM1の入力層に入力する。続いて、生成部133は、第1学習モデルM1の出力層から検索クエリQ12の分散表現である256次元のベクトルBQV12を出力する(ステップS42)。
Then, the
続いて、生成部133は、連続して入力された2つの検索クエリの分散表現(ベクトル)が類似するように学習することで、検索クエリから分散表現(ベクトル)を出力する第1学習モデルM1を生成する(ステップS43)。例えば、第1学習モデルM1にフィードバックをかける前(学習前)の検索クエリQ11の分散表現であるベクトルBQV11と検索クエリQ12の分散表現であるベクトルBQV12とのなす角度の大きさをΘとする。また、第1学習モデルM1にフィードバックをかけた後(学習後)の検索クエリQ11の分散表現であるベクトルQV11と検索クエリQ12の分散表現であるベクトルQV12とのなす角度の大きさをΦとする。この時、生成部133は、ΘよりもΦが小さくなるように、第1学習モデルM1を学習させる。例えば、生成部133は、ベクトルBQV11とベクトルBQV12のコサイン類似度の値を算出する。また、生成部133は、ベクトルQV11とベクトルQV12のコサイン類似度の値を算出する。続いて、生成部133は、ベクトルBQV11とベクトルBQV12のコサイン類似度の値よりも、ベクトルQV11とベクトルQV12のコサイン類似度の値が大きくなるように(値が1に近づくように)学習モデルM1を学習させる。このように、生成部133は、一対の検索クエリに対応する一対の分散表現である2つのベクトルが分散表現空間上で類似するように第1学習モデルM1を学習させることで、検索クエリから分散表現(ベクトル)を出力する第1学習モデルM1を生成する。なお、生成部133は、コサイン類似度に限らず、ベクトル間の距離尺度として適用可能な指標であれば、どのような指標に基づいて分散表現(ベクトル)の間の類似度を算出してもよい。また、生成部133は、ベクトル間の距離尺度として適用可能な指標であれば、どのような指標に基づいて学習モデルM1を学習させてもよい。例えば、生成部133は、分散表現(ベクトル)同士のユークリッド距離や双曲空間等の非ユークリッド空間中での距離、マンハッタン距離、マハラノビス距離等といった所定の距離関数の値を算出する。続いて、生成部133は、分散表現(ベクトル)同士の所定の距離関数の値(すなわち、分散表現空間における距離)が小さくなるように学習モデルM1を学習させてもよい。
Subsequently, the generating
また、生成部133は、同一のユーザによって所定の時間内に入力された複数の検索クエリとして、所定の区切り文字で区切られた文字列を含む複数の検索クエリが類似する特徴を有するものとして学習することで、第1学習モデルを生成する。例えば、生成部133は、地名を示す「六本木」と食品の種類を示す「パスタ」の文字とが区切り文字であるスペースで区切られた検索クエリ「六本木 パスタ」と、地名を示す「六本木」と料理の種類を示す「イタリアン」の文字とが区切り文字であるスペースで区切られた検索クエリ「六本木 イタリアン」とが類似する特徴を有するものとして学習することで、第1学習モデルを生成する。
Further, the
また、生成部133は、取得部131によって取得された検索クエリのうち、ランダムに抽出された複数の検索クエリが相違する特徴を有するものとして学習することで、第1学習モデルを生成する。具体的には、生成部133は、取得部131によって取得された検索クエリのうち、ランダムに抽出された一対の検索クエリの分散表現が相違するように学習することで、第1学習モデルを生成する。例えば、生成部133は、抽出部132によって抽出された所定の検索クエリの分散表現と、所定の検索クエリとは無関係にランダムに抽出された検索クエリの分散表現とが分散表現空間上で遠くにマッピングされるように第1学習モデルM1のトレーニングを行う。
Further, the
また、生成部133は、第2学習モデルを生成する。具体的には、生成部133は、モデル情報記憶部125を参照して、生成部133によって生成された第1学習モデル(第1学習モデルM1のモデルデータMDT1)を取得する。続いて、生成部133は、取得した第1学習モデルを用いて、所定の検索クエリから所定の検索クエリが属するカテゴリを予測する第2学習モデルを生成する。生成部133は、第1モデルM1を取得すると、取得した第1モデルM1を用いて、第2学習モデルM2を生成する。生成部133は、第1モデルM1を再学習させることにより、第1モデルM1とは学習モデルの重みである接続係数が異なる第2モデルM2を生成する。具体的には、生成部133は、検索クエリが学習モデルに入力された際に、学習モデルが出力する分散表現の分類結果が、検索クエリが属するカテゴリに対応するように学習することで、所定の検索クエリから所定の検索クエリが属するカテゴリを予測する第2モデルM2を生成する。
In addition, the
具体的には、生成部133は、検索クエリが学習モデルに入力された際に、学習モデルが出力する分散表現の分類結果が、検索クエリが属するカテゴリに対応するように学習することで、所定の検索クエリから所定の検索クエリが属するカテゴリを予測する第2学習モデルを生成する。生成部133は、入力情報として検索クエリが学習モデルに入力された際に、出力情報として検索クエリが属するカテゴリ毎の確率を出力する第2学習モデルを生成する。例えば、生成部133は、第1モデルM1を用いて、入力情報として所定の検索クエリが学習モデルに入力された際に、出力情報として検索クエリの分散表現がそのカテゴリに分類される確率をカテゴリ毎に出力する第2モデルM2を生成する。生成部133は、入力情報として所定の検索クエリが入力されると、出力情報として所定の検索クエリの分散表現が正解カテゴリに分類される確率が所定の閾値を超えるように第2モデルを学習させる。そして、生成部133は、入力情報として所定の検索クエリが入力された際に、所定の検索クエリの分散表現がそのカテゴリに属する確率が所定の閾値を超えるカテゴリを、所定の検索クエリのカテゴリとして出力する第2モデルM2を生成する。また、生成部133は、第2学習モデルを生成すると、第2学習モデルを識別する識別情報と対応付けて、生成した第2学習モデル(モデルデータMDT2)をモデル情報記憶部125に格納する。
Specifically, when the search query is input to the learning model, the
例えば、生成部133は、図11に示すモデル情報記憶部125を参照して、第1モデルM1(第1モデルM1のモデルデータMDT1)を取得する。続いて、生成部133は、図9に示す分類定義記憶部123を参照して、検索クエリを分類するカテゴリの大分類を選択する。続いて、生成部133は、大分類を選択すると、第2モデルM2の学習データとして、検索クエリと検索クエリが属する小分類との組を学習する。
For example, the
例えば、検索クエリQ11(「六本木 パスタ」)が属する正解カテゴリがCAT11(「飲食店を探す」)であるとする。生成部133は、入力情報として検索クエリQ11(「六本木 パスタ」)が第2モデルM2に入力された際に、第2モデルM2の出力層から検索クエリQ11(「六本木 パスタ」)の分散表現であるベクトルBQV11を出力する。ここで、ベクトルBQV11は、第2モデルM2の出力層から出力されたばかりの検索クエリQ11の分散表現であって、第2モデルM2にフィードバックをかける前(学習前)の分散表現を示す。この場合、生成部133は、出力された検索クエリQ11(「六本木 パスタ」)の分散表現であるベクトルBQV11が正解カテゴリCAT11(「飲食店を探す」)に分類される確率が所定の閾値を超えるように第2モデルM2を学習させる。
For example, it is assumed that the correct category to which the search query Q11 (“Roppongi pasta”) belongs is CAT11 (“Find a restaurant”). When the search query Q11 (“Roppongi pasta”) is input to the second model M2 as input information, the
例えば、生成部133は、学習前の第2モデルM2に検索クエリQ11(「六本木 パスタ」)が入力された際に、分散表現であるベクトルBQV11がCAT11(「飲食店を探す」)に分類される確率を80%、CAT12(「商品を探す」)に分類される確率を0%、CAT13(「飲食店を予約」)に分類される確率を20%、CAT14(「商品を購入する」)に分類される確率を0%と出力したとする。この場合、生成部133は、分散表現であるベクトルBQV11がCAT11(「飲食店を探す」)に分類される確率を所定の閾値(例えば、90%)を超えるように第2モデルM2を学習させる。また、生成部133は、分散表現であるベクトルBQV11がCAT11(「飲食店を探す」)に分類される確率が所定の閾値(例えば、90%)を超えるように学習させるのに合わせて、分散表現であるベクトルBQV11が他のカテゴリCAT13(「飲食店を予約」)に分類される確率を10%に下げるように第2モデルM2を学習させる。続いて、生成部133は、学習済みの第2モデルM2に入力情報として検索クエリQ11(「六本木 パスタ」)が入力されると、検索クエリQ11(「六本木 パスタ」)の分散表現であるベクトルBQV11がカテゴリCAT11(「飲食店を探す」)に属する確率が90%を超えるので、出力情報として検索クエリが属するカテゴリをCAT11(「飲食店を探す」)と出力する。
For example, when the search query Q11 (“Roppongi pasta”) is input to the second model M2 before learning, the generating
なお、生成部133は、大分類として、任意の数の大分類を選択してもよい。そして、生成部133は、入力情報として検索クエリが第2モデルM2に入力された際に、出力情報として検索クエリが選択した任意の数の大分類に属する各小分類に属する確率を小分類毎に出力する第2モデルM2を生成してもよい。また、生成部133は、大分類として、全ての大分類を選択してもよい。そして、生成部133は、検索クエリが第2モデルM2に入力された際に、各小分類に属する確率を全ての小分類毎に出力する第2モデルM2を生成してもよい。
The
〔第2学習モデルの一例〕
ここで、図13を用いて情報処理装置100が生成する第2学習モデルの一例について説明する。図13は、実施形態に係る第2学習モデルの一例を示す図である。図13に示す例では、情報処理装置100が生成する第2学習モデルM2は、第1学習モデルM1を用いて生成される。すなわち、情報処理装置100は、第1学習モデルM1を再学習させることにより、第1学習モデルM1とは学習モデルの重みである接続係数が異なる第2学習モデルM2を生成する。
[Example of Second Learning Model]
Here, an example of the second learning model generated by the
より具体的には、情報処理装置100が生成する第2学習モデルM2は、第1学習モデルM1と同様に、3層のLSTM RNNで構成されている。図13に示す例では、抽出部132は、ユーザU1によって入力された「六本木 パスタ」という検索クエリQ11を第2学習モデルM2の入力層に入力する(ステップS51)。
More specifically, the second learning model M2 generated by the
続いて、生成部133は、第2学習モデルM2の出力層から検索クエリQ11の分散表現である256次元のベクトルBQV11を出力する(ステップS52)。
Subsequently, the
続いて、生成部133は、検索クエリQ11の分散表現であるベクトルBQV11が各カテゴリに分類される確率を出力する(ステップS53)。
Subsequently, the
続いて、生成部133は、検索クエリQ11の分散表現であるベクトルBQV11が正解カテゴリに分類される確率を高くするように第2学習モデルM2を学習することで、検索クエリから検索クエリのカテゴリを予測する第2モデルを生成する(ステップS54)。
Then, the
(サービス提供部134)
サービス提供部134は、第1学習モデルを取得する。具体的には、サービス提供部134は、モデル情報記憶部125を参照して、生成部133によって生成された第1学習モデルを取得する。より具体的には、サービス提供部134は、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして、複数の検索クエリが有する特徴を学習した第1学習モデルを取得する。例えば、サービス提供部134は、生成部133によって、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして学習することで、所定の検索クエリから所定の検索クエリの特徴情報を予測する学習モデルとして生成された第1学習モデルを取得する。また、サービス提供部134は、入力情報として所定の検索クエリが入力された際に、出力情報として所定の検索クエリの分散表現を出力する第1学習モデルを取得する。また、サービス提供部134は、所定の時間内に続けて入力された一対の検索クエリの分散表現が類似するように学習することで、複数の検索クエリが有する特徴を学習した第1学習モデルを取得する。また、サービス提供部134は、同一のユーザによって所定の時間内に入力された複数の検索クエリとして、所定の区切り文字で区切られた文字列を含む複数の検索クエリが類似する特徴を有するものとして学習することで、複数の検索クエリが有する特徴を学習した第1学習モデルを取得する。また、サービス提供部134は、ランダムに抽出された複数の検索クエリが相違する特徴を有するものとして学習することで、複数の検索クエリが有する特徴を学習した第1学習モデルを取得する。また、サービス提供部134は、ランダムに抽出された一対の検索クエリの分散表現が相違するように学習することで、複数の検索クエリが有する特徴を学習した第1学習モデルを取得する。
(Service providing unit 134)
The
また、サービス提供部134は、第2学習モデルを取得する。具体的には、サービス提供部134は、モデル情報記憶部125を参照して、生成部133によって生成された第2学習モデルを取得する。より具体的には、サービス提供部134は、生成部133によって、第1学習モデルを用いて、所定の検索クエリから所定の検索クエリが属するカテゴリを予測する学習モデルとして生成された第2学習モデルを取得する。例えば、サービス提供部134は、検索クエリが学習モデルに入力された際に、学習モデルが出力する分散表現の分類結果が、検索クエリが属するカテゴリに対応するように学習することで、所定の検索クエリから所定の検索クエリが属するカテゴリを予測する第2学習モデルを取得する。例えば、サービス提供部134は、入力情報として検索クエリが学習モデルに入力された際に、出力情報として検索クエリがカテゴリに属する確率をカテゴリ毎に出力する第2学習モデルを取得する。
In addition, the
サービス提供部134は、広告主であるクライアントに対して、検索クエリの分析サービスを提供する。サービス提供部134は、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして、複数の検索クエリが有する特徴を学習した第1学習モデルを用いて、所定の検索クエリと類似する特徴を有する検索クエリである類似クエリを抽出する。具体的には、サービス提供部134は、広告主であるクライアントから検索クエリの分析テーマを受け付け、受け付けた分析テーマに対応する検索クエリを抽出する。例えば、サービス提供部134は、ユーザの検索動向を分析する分析テーマに関するキーワードである分析クエリをクライアント端末20から受け付ける。サービス提供部134は、分析テーマに関する複数の分析クエリを受け付けてもよい。例えば、広告主であるクライアントが、検索クエリの分析テーマとして「骨の健康関連」を希望しているとする。そして、サービス提供部134は、「骨 健康」、「骨 丈夫」、「カルシウム 小魚」など複数の分析クエリをクライアント端末20から受け付ける。これにより、サービス提供部134は、一度に一つの分析クエリを受け付ける場合よりも、より多くの類似クエリを抽出することができる。すなわち、サービス提供部134は、広告主であるクライアントの分析テーマに沿った類似クエリを漏れなく抽出することができる。続いて、サービス提供部134は、受け付けた分析テーマに対応する検索クエリを抽出する。例えば、サービス提供部134は、第1学習モデルを用いて、分析クエリと類似する特徴を有する検索クエリである類似クエリを抽出する。
The
また、サービス提供部134は、第2学習モデルを用いて、所定の検索クエリと類似する特徴を有する検索クエリである類似クエリを分類する。具体的には、サービス提供部134は、広告主であるクライアントから検索クエリの分類軸を受け付け、受け付けた分類軸に対応するカテゴリに検索クエリを分類する。例えば、サービス提供部134は、分析クエリに類似する検索クエリである類似クエリを分類する分類軸(カテゴリ)をクライアント端末20から受け付ける。なお、サービス提供部134は、分類対象となる一つの類似クエリの集合について、複数の分類軸(カテゴリ)を受け付けてもよい。続いて、サービス提供部134は、第2学習モデルを用いて、受け付けた分類軸に対応するカテゴリに類似クエリを分類する。
In addition, the
図1に示す例では、サービス提供部134は、分析クエリである「骨 健康」と4つの小分類から成る分類軸(カテゴリ)とをクライアント端末20から受け付ける。なお、サービス提供部134は、広告主であるクライアントから指定された分類軸(カテゴリ)を受け付ける代わりに、図9に示す分類定義記憶部123に示すカテゴリの中から、広告主であるクライアントによって選択された大分類を分類軸として受け付けてもよい。図1に示す例では、広告主であるクライアントは、後述する分類定義記憶部123に示すカテゴリの中から、大分類ID「CAT2」で識別される大分類「健康系」を選択する。そして、サービス提供部134は、広告主であるクライアントによって選択された大分類「健康系」を分類軸として受け付ける。
In the example illustrated in FIG. 1, the
続いて、サービス提供部134は、分析クエリを受け付けると、受け付けた分析クエリ「骨 健康」を第1モデルM1に入力する。サービス提供部134は、サービス提供部134は、分析クエリを第1モデルM1に入力すると、分析クエリ「骨 健康」の分散表現(ベクトル)を第1モデルM1から出力する。
Subsequently, when the
続いて、サービス提供部134は、分析クエリ「骨 健康」の分散表現(ベクトル)を出力すると、分散表現(ベクトル)同士の類似度が所定の閾値を超える検索クエリを分析クエリ「骨 健康」に類似する類似クエリとして抽出する。例えば、サービス提供部134は、分散表現空間において、出力した分析クエリ「骨 健康」の分散表現(ベクトル)の近傍に位置する分散表現(ベクトル)を抽出する。続いて、サービス提供部134は、分析クエリ「骨 健康」の分散表現(ベクトル)と近傍に位置する分散表現(ベクトル)との類似度を算出する。例えば、サービス提供部134は、分散表現(ベクトル)同士のコサイン類似度を算出する。続いて、サービス提供部134は、コサイン類似度が所定の閾値を超える分散表現(ベクトル)を分析クエリ「骨 健康」の分散表現(ベクトル)と類似する分散表現(ベクトル)として抽出する。なお、サービス提供部134は、コサイン類似度に限らず、ベクトル間の距離尺度として適用可能な指標であれば、どのような指標に基づいて分散表現(ベクトル)の間の類似度を算出してもよい。例えば、サービス提供部134は、分散表現(ベクトル)同士のユークリッド距離や双曲空間等の非ユークリッド空間中での距離、マンハッタン距離、マハラノビス距離等といった所定の距離関数の値を算出する。続いて、サービス提供部134は、分散表現(ベクトル)同士の所定の距離関数の値(すなわち、分散表現空間における距離)が所定の閾値を下回る分散表現(ベクトル)を分析クエリ「骨 健康」の分散表現(ベクトル)と類似する分散表現(ベクトル)として抽出してもよい。続いて、サービス提供部134は、類似する分散表現(ベクトル)を抽出すると、ベクトル情報記憶部122を参照して、抽出した分散表現(ベクトル)に対応する検索クエリを特定する。そして、サービス提供部134は、特定した検索クエリを分析クエリと類似する類似クエリとして抽出する。
Next, when the
続いて、サービス提供部134は、類似クエリを抽出すると、抽出した類似クエリを第2モデルM2に入力する。サービス提供部134は、類似クエリを第2モデルM2に入力すると、類似クエリが属するカテゴリを第2モデルM2から出力する。なお、サービス提供部134は、広告主であるクライアントによって指定された分類軸(カテゴリ)を受け付けてから、受け付けた分類軸(カテゴリ)に応じて検索クエリを分類するように第2モデルM2を学習させてもよい。あるいは、サービス提供部134は、後述する分類定義記憶部123に示すカテゴリに応じて検索クエリを分類するようにあらかじめ第2モデルM2を学習させる。そして、サービス提供部134は、分類定義記憶部123に示すカテゴリの中から広告主であるクライアントに分類軸を選択させ、広告主であるクライアントによって選択された分類軸(カテゴリ)をクライアント端末20から受け付けてもよい。
Subsequently, when the
続いて、サービス提供部134は、分類軸(カテゴリ)に応じたクエリの分類結果をクライアント端末20に送信する。例えば、サービス提供部134は、分類軸(カテゴリ)に応じたクエリの分類結果として、分析テーマである「骨の健康関連」に関する検索クエリとして検索された検索クエリの構成を提供する。例えば、サービス提供部134は、分析クエリに類似する類似クエリとして抽出した検索クエリの内訳として、「飲み物」に関する検索クエリの割合が40%、「食べ物」に関する検索クエリの割合が30%、「運動」に関する検索クエリの割合が20%、「サプリメント」に関する検索クエリの割合が10%であるといった分析結果を提供する。
Subsequently, the
〔3.第1学習モデルの生成処理のフロー〕
次に、図14を用いて、実施形態に係る第1学習モデルの生成処理の手順について説明する。図14は、実施形態に係る第1学習モデルの生成処理手順を示すフローチャートである。図14に示す例では、情報処理装置100は、ユーザによって入力された検索クエリを取得する(ステップS101)。
[3. Flow of processing for generating first learning model]
Next, the procedure of the first learning model generation process according to the embodiment will be described with reference to FIG. 14. FIG. 14 is a flowchart showing a procedure for generating the first learning model according to the embodiment. In the example illustrated in FIG. 14, the
続いて、情報処理装置100は、同一のユーザによって所定の時間内に入力された複数の検索クエリを抽出する(ステップS102)。
Subsequently, the
続いて、情報処理装置100は、抽出した複数の検索クエリが類似する特徴を有するものとして学習することで、所定の検索クエリから所定の検索クエリの特徴情報を予測する第1学習モデルを生成する(ステップS103)。
Subsequently, the
〔4.第2学習モデルの生成処理のフロー〕
次に、図15を用いて、実施形態に係る第2学習モデルの生成処理の手順について説明する。図15は、実施形態に係る第2学習モデルの生成処理の手順を示すフローチャートである。図15に示す例では、情報処理装置100は、第1学習モデル(第1学習モデルM1のモデルデータMDT1)を取得する(ステップS201)。
[4. Flow of second learning model generation processing]
Next, the procedure of the second learning model generation process according to the embodiment will be described with reference to FIG. 15. FIG. 15 is a flowchart showing the procedure of the second learning model generation process according to the embodiment. In the example illustrated in FIG. 15, the
続いて、情報処理装置100は、第1学習モデルを用いて、所定の検索クエリから所定の検索クエリのカテゴリを予測する第2学習モデルを生成する(ステップS202)。
Subsequently, the
〔5.情報処理のフロー〕
次に、図16を用いて、実施形態に係る情報処理の手順について説明する。図16は、実施形態に係る情報処理の手順を示すフローチャートである。図16に示す例では、情報処理装置100は、分析クエリと分類軸(カテゴリ)をクライアントから取得する(ステップS301)。続いて、情報処理装置100は、第1モデルを用いて、分析クエリと類似する類似クエリを抽出する(ステップS302)。続いて、情報処理装置100は、第2モデルを用いて、類似クエリを分類軸(カテゴリ)に分類する(ステップS303)。続いて、情報処理装置100は、分析結果をクライアントに提供する(ステップS304)。
[5. Information processing flow]
Next, a procedure of information processing according to the embodiment will be described with reference to FIG. FIG. 16 is a flowchart showing a procedure of information processing according to the embodiment. In the example illustrated in FIG. 16, the
〔6.効果〕
上述してきたように、実施形態に係る情報処理装置100は、サービス提供部134を備える。サービス提供部134は、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして、複数の検索クエリが有する特徴を学習した第1学習モデルを用いて、所定の検索クエリと類似する特徴を有する検索クエリである類似クエリを抽出する。
[6. effect〕
As described above, the
一般的に、ユーザはある意図を持って検索を複数回行うと考えられるため、所定の時間内に連続して入力された検索クエリは、検索意図が近いという仮定が成り立つ。そこで、本願発明に係る情報処理装置100は、所定の時間内に連続して入力された複数の検索クエリは、所定の検索意図の下で検索された検索クエリであるという点で、相互に類似する特徴を有する検索クエリであるとみなして学習モデルM1を学習させる。具体的には、本願発明に係る情報処理装置100は、所定の時間内に連続して入力された検索クエリの分散表現が類似するように学習モデルM1を学習させることにより、検索意図が近い検索クエリの分散表現を分散表現空間上で近い位置に出力可能とする。これにより、情報処理装置100は、検索クエリを入力したユーザのコンテクストに応じて検索クエリの意味(検索意図)を出力(解釈)することを可能にする。したがって、情報処理装置100は、検索クエリの意味を適切に解釈可能とすることができる。さらに、情報処理装置100は、所定の検索クエリの特徴情報を含む分散表現の近傍にマッピングされる分散表現に対応する検索クエリを抽出することにより、所定の検索クエリが検索された検索意図に応じた検索クエリを抽出することができる。すなわち、情報処理装置100は、検索クエリを入力したユーザのコンテクストを考慮した検索クエリを抽出可能にする。よって、情報処理装置100は、第1学習モデルを用いることにより、検索クエリを入力したユーザのコンテクストを考慮して、ユーザの検索動向を分析することができる。したがって、情報処理装置100は、ユーザの検索動向の分析精度を高めることができる。
In general, a user is considered to perform a search a plurality of times with a certain intention, and therefore it is assumed that search queries continuously input within a predetermined time have similar search intentions. Therefore, the
また、情報処理装置100が生成した学習モデルM1を検索システム(例えば、情報処理装置100が提供する検索クエリの分析サービスに用いられる検索システム)の一部として機能させることもできる。あるいは、情報処理装置100は、学習モデルM1によって予測された検索クエリの特徴情報を利用する他のシステム(例えば、情報処理装置100が提供する検索クエリの分析サービスに用いられる検索エンジン)への入力情報として、学習モデルM1が出力した検索クエリの分散表現を提供することもできる。これにより、検索システムは、学習モデルM1によって予測された検索クエリの特徴情報に基づいて、検索結果として出力されるコンテンツを選択可能になる。すなわち、検索システムは、検索クエリを入力したユーザの検索意図やコンテクストを考慮して、検索結果として出力されるコンテンツを選択可能になる。さらに、検索システムは、学習モデルM1によって予測された検索クエリの特徴情報に基づいて、検索結果として出力されるコンテンツに含まれる文字列の分散表現と検索クエリの分散表現との類似度を算出可能になる。そして、検索システムは、算出した類似度に基づいて、検索結果として出力されるコンテンツの表示順を決定可能になる。すなわち、検索システムは、検索クエリを入力したユーザの検索意図やコンテクストを考慮して、検索結果として出力されるコンテンツの表示順を決定可能になる。したがって、情報処理装置100は、検索サービスにおけるユーザビリティを向上させることができる。
Further, the learning model M1 generated by the
また、サービス提供部134は、入力情報として所定の検索クエリが入力された際に、出力情報として所定の検索クエリの分散表現を出力する第1学習モデルを取得する。
Also, the
これにより、情報処理装置100は、所定の検索クエリの特徴という抽象的な概念を、分散表現という具体的な数値によって測定可能とすることができる。
With this, the
また、サービス提供部134は、所定の時間内に続けて入力された一対の検索クエリの分散表現が類似するように学習することで、複数の検索クエリが有する特徴を学習した第1学習モデルを取得する。
In addition, the
一般的に、同一のユーザが短時間に続けて入力した2つの検索クエリは、検索意図が同一であるか、同一でなくとも検索意図が近いと考えられる。すなわち、所定の時間内に続けて入力された一対の検索クエリは、検索意図が同一であるか、同一でなくとも検索意図が近いと考えられる。すなわち、情報処理装置100は、所定の時間内に続けて入力された一対の検索クエリの分散表現が類似するように学習することにより、ユーザの検索意図に応じた検索クエリをより精度よく抽出可能とすることができる。
Generally, it is considered that two search queries input by the same user in a short period of time have the same search intention, or have similar search intentions even if they are not the same. That is, it is considered that the pair of search queries that are continuously input within a predetermined time have the same search intention, or even if they are not the same, the search intention is close. That is, the
また、サービス提供部134は、同一のユーザによって所定の時間内に入力された複数の検索クエリとして、所定の区切り文字で区切られた文字列を含む複数の検索クエリが類似する特徴を有するものとして学習することで、複数の検索クエリが有する特徴を学習した第1学習モデルを取得する。
In addition, the
一般的に、単体の文字列からなる検索クエリよりも、複数の文字列を含む検索クエリのほうが、検索意図がより明確であると考えられる。すなわち、情報処理装置100は、所定の区切り文字で区切られた文字列を含む検索クエリを用いて学習することにより、ユーザの検索意図に応じた検索クエリをより精度よく抽出可能とすることができる。
In general, a search query including a plurality of character strings is considered to have a clearer search intention than a search query including a single character string. That is, the
また、サービス提供部134は、ランダムに抽出された複数の検索クエリが相違する特徴を有するものとして学習することで、複数の検索クエリが有する特徴を学習した第1学習モデルを取得する。また、サービス提供部134は、ランダムに抽出された一対の検索クエリの分散表現が相違するように学習することで、複数の検索クエリが有する特徴を学習した第1学習モデルを取得する。
In addition, the
一般的に、ランダムに抽出された複数の検索クエリは、互いに無関係に入力された検索クエリであるため、検索意図が異なるか、検索意図が遠いと考えられる。そこで、本願発明に係る情報処理装置100は、ランダムに抽出された複数の検索クエリは、異なる検索意図の下で検索された検索クエリであるという点で、相互に相違する特徴を有する検索クエリであるとみなして学習モデルM1を学習させる。具体的には、本願発明に係る情報処理装置100は、ランダムに抽出された複数の検索クエリの分散表現が相違するように学習モデルM1を学習させることにより、検索意図が異なる検索クエリの分散表現を分散表現空間上で遠い位置に出力可能とする。これにより、学習モデルは、検索意図が近い検索クエリのペアである正解データに加えて、検索意図が遠い検索クエリのペアである不正解データを学習することができる。すなわち、情報処理装置100は、学習モデルの精度を向上させることができる。したがって、情報処理装置100は、検索クエリの意味を適切に解釈可能とすることができる。
In general, a plurality of search queries that are randomly extracted are search queries that are input independently of each other, and thus it is considered that the search intentions are different or the search intentions are far. Therefore, the
また、サービス提供部134は、第1学習モデルを用いて生成された第2学習モデルであって、所定の検索クエリから所定の検索クエリが属するカテゴリを予測する第2学習モデルを取得する。
The
これにより、情報処理装置100は、検索意図を考慮した検索クエリの特徴を学習した第1学習モデルを活用して、所定の検索クエリから所定の検索クエリのカテゴリを予測する第2学習モデルを効率的に生成することができる。これにより、情報処理装置100は、検索クエリを入力したユーザの検索意図を考慮したカテゴリに検索クエリを分類することを可能にする。また、従来、検索クエリをカテゴリに分類し、高い分類精度を得るためには、十分な量の正解データを用意することが必要であった。しかしながら、検索クエリ自体、多種多様であり、ロングテイルな性質を持つものであるため、多数の検索クエリに対応する正解カテゴリをラベル付けするのは、非常に手間がかかり困難である。ここで、情報処理装置100は、正解カテゴリをラベル付けする代わりに、ユーザの検索意図(検索クエリを入力したユーザのコンテクスト)を一種の正解として、検索クエリのカテゴリを予測する第2モデルを学習させることができる。これにより、情報処理装置100は、人手で検索クエリの正解カテゴリをラベル付けすることなく、第2モデルを学習させることができる。すなわち、情報処理装置100は、正解データが少ないときでも、十分な分類精度を得られるようになる。また、情報処理装置100は、正解データが多いときであれば、さらに高い分類精度を得られるようになる。したがって、情報処理装置100は、検索クエリの分類精度を高めることができる。
As a result, the
また、サービス提供部134は、検索クエリが学習モデルに入力された際に、学習モデルが出力する分散表現の分類結果が、検索クエリが属するカテゴリに対応するように学習することで、所定の検索クエリから所定の検索クエリが属するカテゴリを予測する第2学習モデルを取得する。また、サービス提供部134は、入力情報として検索クエリが学習モデルに入力された際に、出力情報として検索クエリがカテゴリに属する確率をカテゴリ毎に出力する第2学習モデルを取得する。
Further, when the search query is input to the learning model, the
これにより、情報処理装置100は、検索意図を考慮した検索クエリの特徴を含む分散表現を活用して、検索クエリを入力したユーザの検索意図を考慮したカテゴリに検索クエリを分類する第2学習モデルを効率的に生成することができる。すなわち、情報処理装置100は、検索クエリを入力したユーザの検索意図を考慮したカテゴリに検索クエリを分類することを可能にする。したがって、情報処理装置100は、検索クエリの分類精度を高めることができる。
Thereby, the
また、サービス提供部134は、第2学習モデルを用いて、所定の検索クエリと類似する特徴を有する検索クエリである類似クエリを分類する。
In addition, the
これにより、情報処理装置100は、検索クエリを入力したユーザの検索意図を考慮したカテゴリに検索クエリを分類することを可能にする。したがって、情報処理装置100は、検索クエリの分類精度を高めることができる。
As a result, the
また、サービス提供部134は、広告主であるクライアントから検索クエリの分析テーマを受け付け、受け付けた分析テーマに対応する検索クエリを抽出する。
Further, the
これにより、情報処理装置100は、広告主であるクライアントが所望する分析テーマに合ったユーザの検索動向の分析結果を適切に提供することができる。
As a result, the
また、サービス提供部134は、広告主であるクライアントから検索クエリの分類軸を受け付け、受け付けた分類軸に対応するカテゴリに検索クエリを分類する。
Further, the
これにより、情報処理装置100は、広告主であるクライアントが所望する分類軸に沿ったユーザの検索動向の分析結果を適切に提供することができる。
As a result, the
〔7.ハードウェア構成〕
また、上述してきた実施形態に係る情報処理装置100は、例えば図17に示すような構成のコンピュータ1000によって実現される。図17は、情報処理装置100の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を備える。
[7. Hardware configuration)
Further, the
CPU1100は、ROM1300またはHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。 The CPU 1100 operates based on a program stored in the ROM 1300 or the HDD 1400, and controls each unit. The ROM 1300 stores a boot program executed by the CPU 1100 when the computer 1000 starts up, a program dependent on the hardware of the computer 1000, and the like.
HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を格納する。通信インターフェイス1500は、所定の通信網を介して他の機器からデータを受信してCPU1100へ送り、CPU1100が生成したデータを所定の通信網を介して他の機器へ送信する。 The HDD 1400 stores programs executed by the CPU 1100, data used by the programs, and the like. The communication interface 1500 receives data from another device via a predetermined communication network, sends the data to the CPU 1100, and transmits the data generated by the CPU 1100 to another device via the predetermined communication network.
CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、生成したデータを入出力インターフェイス1600を介して出力装置へ出力する。 The CPU 1100 controls output devices such as a display and a printer and input devices such as a keyboard and a mouse via the input / output interface 1600. The CPU 1100 obtains data from an input device via the input / output interface 1600. Further, the CPU 1100 outputs the generated data to the output device via the input / output interface 1600.
メディアインターフェイス1700は、記録媒体1800に格納されたプログラムまたはデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。 The media interface 1700 reads a program or data stored in the recording medium 1800 and provides the program or data to the CPU 1100 via the RAM 1200. The CPU 1100 loads the program from the recording medium 1800 onto the RAM 1200 via the media interface 1700 and executes the loaded program. The recording medium 1800 is, for example, an optical recording medium such as a DVD (Digital Versatile Disc) or PD (Phase change rewritable Disk), a magneto-optical recording medium such as an MO (Magneto-Optical disk), a tape medium, a magnetic recording medium, or a semiconductor memory. Etc.
例えば、コンピュータ1000が実施形態に係る情報処理装置100として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムまたはデータ(例えば、第1モデルM1のモデルデータMDT1、第2モデルM2のモデルデータMDT2)を実行することにより、制御部130の機能を実現する。コンピュータ1000のCPU1100は、これらのプログラムを記録媒体1800から読み取って実行するが、他の例として、他の装置から所定の通信網を介してこれらのプログラムまたはデータ(例えば、第1モデルM1のモデルデータMDT1、第2モデルM2のモデルデータMDT2)を取得してもよい。
For example, when the computer 1000 functions as the
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。 As described above, some of the embodiments of the present application have been described in detail based on the drawings, but these are examples, and various modifications based on the knowledge of those skilled in the art, including the modes described in the section of the disclosure of the invention, It is possible to implement the present invention in other forms with improvements.
〔8.その他〕
また、上記実施形態及び変形例において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
[8. Other]
Further, of the processes described in the above-described embodiment and modified examples, all or part of the processes described as being automatically performed may be manually performed, or described as manually performed. It is also possible to automatically carry out all or part of the processing performed by a known method. In addition, the processing procedures, specific names, and information including various data and parameters shown in the above documents and drawings can be arbitrarily changed unless otherwise specified. For example, the various information shown in each drawing is not limited to the information shown.
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。 Further, each component of each device shown in the drawings is functionally conceptual, and does not necessarily have to be physically configured as shown. That is, the specific form of distribution / integration of each device is not limited to that shown in the figure, and all or a part of the device may be functionally or physically distributed / arranged in arbitrary units according to various loads and usage conditions. It can be integrated and configured.
また、上述してきた実施形態及び変形例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。 Further, the above-described embodiments and modified examples can be appropriately combined within a range that does not contradict processing contents.
また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、サービス提供部は、サービス提供手段やサービス提供回路に読み替えることができる。 Also, the above-mentioned "section (module, unit)" can be read as "means" or "circuit". For example, the service providing unit can be read as a service providing unit or a service providing circuit.
1 情報処理システム
10 ユーザ端末
20 クライアント端末
50 検索サーバ
100 情報処理装置
121 クエリ情報記憶部
122 ベクトル情報記憶部
123 分類定義記憶部
124 カテゴリ情報記憶部
125 モデル情報記憶部
131 取得部
132 抽出部
133 生成部
134 サービス提供部
1
Claims (14)
を備えることを特徴とする情報処理装置。 A plurality of analysis queries that are keywords related to the analysis theme of the search query and analysis categories that classify similar queries that are search queries similar to the analysis query are acquired from the client, and are input by the same user within a predetermined time period. As a search query having similar features, a similar query that is a search query having features similar to the analysis query is extracted using a first learning model that has learned the features of the plurality of search queries, The second learning model generated using the first learning model, the second learning model predicting a category to which the predetermined search query belongs from a predetermined search query, the extracted similar query is analyzed. For each analysis category, which is calculated based on the number of similar queries classified into the analysis category. The information processing apparatus comprising: a service providing unit that provides information about the component ratio of queries to the client similar.
入力情報として所定の検索クエリが入力された際に、出力情報として前記所定の検索クエリの分散表現を出力する第1学習モデルを取得する
ことを特徴とする請求項1に記載の情報処理装置。 The service providing unit,
The information processing apparatus according to claim 1, wherein, when a predetermined search query is input as input information, a first learning model that outputs a distributed expression of the predetermined search query is output as output information.
前記所定の時間内に続けて入力された一対の検索クエリの分散表現が類似するように学習することで、前記複数の検索クエリが有する特徴を学習した第1学習モデルを取得する
ことを特徴とする請求項1または2に記載の情報処理装置。 The service providing unit,
A first learning model in which the features of the plurality of search queries are learned by learning so that the distributed expressions of a pair of search queries that are continuously input within the predetermined time period are similar to each other. The information processing device according to claim 1 or 2 .
同一のユーザによって所定の時間内に入力された複数の検索クエリとして、所定の区切り文字で区切られた文字列を含む複数の検索クエリが類似する特徴を有するものとして学習することで、前記複数の検索クエリが有する特徴を学習した第1学習モデルを取得する
ことを特徴とする請求項1〜3のいずれか一つに記載の情報処理装置。 The service providing unit,
By learning as a plurality of search queries input by the same user within a predetermined time, a plurality of search queries including a character string delimited by a predetermined delimiter have similar characteristics, Search query information processing apparatus according to any one of claims 1-3, characterized in that obtaining the first learning model trained features included in.
ランダムに抽出された複数の検索クエリが相違する特徴を有するものとして学習することで、前記複数の検索クエリが有する特徴を学習した第1学習モデルを取得する
ことを特徴とする請求項1〜4のいずれか一つに記載の情報処理装置。 The service providing unit,
By learning as a plurality of search queries that are extracted at random has a characteristic which differs, according to claim 1-4, characterized in that obtaining the first learning model learned features the plurality of search queries has The information processing apparatus described in any one of 1.
ランダムに抽出された一対の検索クエリの分散表現が相違するように学習することで、前記複数の検索クエリが有する特徴を学習した第1学習モデルを取得する
ことを特徴とする請求項1〜5のいずれか一つに記載の情報処理装置。 The service providing unit,
By distributed representation of a pair of search queries extracted randomly learns to differences claims, characterized in that obtaining the first learning model learned features the plurality of search queries has 1-5 The information processing apparatus described in any one of 1.
前記第1学習モデルを用いて生成された第2学習モデルであって、所定の検索クエリから前記所定の検索クエリが属するカテゴリを予測する第2学習モデルを取得する
ことを特徴とする請求項1〜6のいずれか一つに記載の情報処理装置。 The service providing unit,
The second learning model generated by using the first learning model, wherein a second learning model that predicts a category to which the predetermined search query belongs is obtained from a predetermined search query. The information processing apparatus according to any one of items 1 to 6 .
検索クエリが学習モデルに入力された際に、学習モデルが出力する分散表現の分類結果が、前記検索クエリが属するカテゴリに対応するように学習することで、所定の検索クエリから前記所定の検索クエリが属するカテゴリを予測する第2学習モデルを取得する
ことを特徴とする請求項1〜7のいずれか一つに記載の情報処理装置。 The service providing unit,
When the search query is input to the learning model, the classification result of the distributed expression output by the learning model is learned so as to correspond to the category to which the search query belongs, so that the predetermined search query is changed from the predetermined search query. the information processing apparatus according to any one of claims 1-7, characterized in that to obtain the second learning model that predicts the category to which belongs.
入力情報として検索クエリが学習モデルに入力された際に、出力情報として前記検索クエリがカテゴリに属する確率をカテゴリ毎に出力する第2学習モデルを取得する
ことを特徴とする請求項1〜8のいずれか一つに記載の情報処理装置。 The service providing unit,
When a search query as input information is input to the training model, the search query according to claim 1-8, characterized in that to obtain the second learning model for outputting the probability that belong to the category in each category as output information The information processing device described in any one of the above.
前記第2学習モデルを用いて、所定の検索クエリと類似する特徴を有する検索クエリである類似クエリを分類する
ことを特徴とする請求項7〜9のいずれか一つに記載の情報処理装置。 The service providing unit,
The second with a learning model, the information processing apparatus according to any one of claims 7-9, characterized in that classifying the similar query is a search query having characteristics similar to the predetermined search query.
広告主であるクライアントから検索クエリの分析テーマを受け付け、受け付けた分析テーマに対応する検索クエリを抽出する
ことを特徴とする請求項1〜10のいずれか一つに記載の情報処理装置。 The service providing unit,
Ad accepts Lord is analyzed themes search query from the client, the information processing apparatus according to any one of claims 1-10, characterized in that to extract the search query corresponding to the accepted analysis theme.
広告主であるクライアントから検索クエリの分類軸を受け付け、受け付けた分類軸に対応するカテゴリに検索クエリを分類する
ことを特徴とする請求項1〜11のいずれか一つに記載の情報処理装置。 The service providing unit,
Advertiser in which accepts classification axis search query from the client, the information processing apparatus according to any one of claims 1 to 11, characterized in that classifying the search query to the category corresponding to the received classification axis.
検索クエリの分析テーマに関するキーワードである分析クエリと、前記分析クエリに類似する検索クエリである類似クエリを分類する分析カテゴリとをクライアントから取得し、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして、前記複数の検索クエリが有する特徴を学習した第1学習モデルを用いて、前記分析クエリと類似する特徴を有する検索クエリである類似クエリを抽出し、前記第1学習モデルを用いて生成された第2学習モデルであって、所定の検索クエリから前記所定の検索クエリが属するカテゴリを予測する第2学習モデルを用いて、抽出した類似クエリを前記分析カテゴリに分類し、前記分析カテゴリに分類された類似クエリの数に基づいて算出された分析カテゴリ毎の類似クエリの構成比率に関する情報を前記クライアントに対して提供するサービス提供工程
を含むことを特徴とする情報処理方法。 An information processing method executed by a computer,
A plurality of analysis queries that are keywords related to the analysis theme of the search query and analysis categories that classify similar queries that are search queries similar to the analysis query are acquired from the client, and are input by the same user within a predetermined time period. As a search query having similar features, a similar query that is a search query having features similar to the analysis query is extracted using a first learning model that has learned the features of the plurality of search queries, The second learning model generated using the first learning model, the second learning model predicting a category to which the predetermined search query belongs from a predetermined search query, the extracted similar query is analyzed. For each analysis category, which is calculated based on the number of similar queries classified into the analysis category. The information processing method characterized by information about the component ratio of the similar queries including service providing step of providing to the client.
をコンピュータに実行させることを特徴とする情報処理プログラム。 A plurality of analysis queries that are keywords related to the analysis theme of the search query and analysis categories that classify similar queries that are search queries similar to the analysis query are acquired from the client, and are input by the same user within a predetermined time period. As a search query having similar features, a similar query that is a search query having features similar to the analysis query is extracted using a first learning model that has learned the features of the plurality of search queries, The second learning model generated using the first learning model, the second learning model predicting a category to which the predetermined search query belongs from a predetermined search query, the extracted similar query is analyzed. For each analysis category, which is calculated based on the number of similar queries classified into the analysis category. The information processing program characterized by executing the service providing means for providing information about the component ratio of queries to the client similar to a computer.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018176628A JP6679683B2 (en) | 2018-09-20 | 2018-09-20 | Information processing apparatus, information processing method, and information processing program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018176628A JP6679683B2 (en) | 2018-09-20 | 2018-09-20 | Information processing apparatus, information processing method, and information processing program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020047126A JP2020047126A (en) | 2020-03-26 |
JP6679683B2 true JP6679683B2 (en) | 2020-04-15 |
Family
ID=69901442
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018176628A Active JP6679683B2 (en) | 2018-09-20 | 2018-09-20 | Information processing apparatus, information processing method, and information processing program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6679683B2 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102418953B1 (en) * | 2020-05-11 | 2022-07-11 | 네이버 주식회사 | Method and system for expanding shopping search results |
JP2022126427A (en) * | 2021-02-18 | 2022-08-30 | ヤフー株式会社 | Information processing device, information processing method, and information processing program |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7689585B2 (en) * | 2004-04-15 | 2010-03-30 | Microsoft Corporation | Reinforced clustering of multi-type data objects for search term suggestion |
US7877389B2 (en) * | 2007-12-14 | 2011-01-25 | Yahoo, Inc. | Segmentation of search topics in query logs |
US8768861B2 (en) * | 2010-05-31 | 2014-07-01 | Yahoo! Inc. | Research mission identification |
JP5296745B2 (en) * | 2010-06-17 | 2013-09-25 | ヤフー株式会社 | Query suggestion providing apparatus and method |
US9064007B1 (en) * | 2011-01-05 | 2015-06-23 | Google Inc. | Co-click based similarity score of queries and keywords |
JP6124489B1 (en) * | 2016-08-01 | 2017-05-10 | ヤフー株式会社 | Query providing apparatus, query providing method, and query providing program |
JP6434954B2 (en) * | 2016-11-28 | 2018-12-05 | ヤフー株式会社 | Information processing apparatus, information processing method, and program |
-
2018
- 2018-09-20 JP JP2018176628A patent/JP6679683B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2020047126A (en) | 2020-03-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11514333B2 (en) | Combining machine-learning and social data to generate personalized recommendations | |
JP6745384B2 (en) | Method and apparatus for pushing information | |
US11507989B2 (en) | Multi-label product categorization | |
US8856109B2 (en) | Topical affinity badges in information retrieval | |
Alabdulrahman et al. | Catering for unique tastes: Targeting grey-sheep users recommender systems through one-class machine learning | |
JP7071304B2 (en) | Information processing equipment, information processing methods and information processing programs | |
CN110598084A (en) | Object sorting method, commodity sorting device and electronic equipment | |
JP6679683B2 (en) | Information processing apparatus, information processing method, and information processing program | |
JP2016006593A (en) | Extraction device, extraction method, and extraction program | |
CN117391824B (en) | Method and device for recommending articles based on large language model and search engine | |
Patel et al. | CNNRec: Convolutional Neural Network based recommender systems-A survey | |
Melese | Food and restaurant recommendation system using hybrid filtering mechanism | |
TW201903672A (en) | A deep learning based system and method for analyzing customer features thereof | |
JP6982017B2 (en) | Information processing equipment, information processing methods and information processing programs | |
JP6852114B2 (en) | Specific device, specific method and specific program | |
JP7177013B2 (en) | Information processing device, information processing method and information processing program | |
JP6584613B1 (en) | Information processing apparatus, information processing method, and information processing program | |
JP6553793B1 (en) | Information processing apparatus, information processing method, and information processing program | |
JP7044729B2 (en) | Information processing equipment, information processing methods and information processing programs | |
Kavitha et al. | Sentiment analysis using NLP and machine learning techniques on social media data | |
JP7258988B2 (en) | Information processing device, information processing method and information processing program | |
JP6696018B1 (en) | Information processing apparatus, information processing method, and information processing program | |
JP6960361B2 (en) | Information processing equipment, information processing methods, and information processing programs | |
JP6983672B2 (en) | Information processing equipment, information processing methods, and information processing programs | |
Hang et al. | Machine learning applied to pack classification |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181213 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20181213 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20181218 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190312 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190513 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20190813 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20191101 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20191108 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191112 |
|
C60 | Trial request (containing other claim documents, opposition documents) |
Free format text: JAPANESE INTERMEDIATE CODE: C60 Effective date: 20191112 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20200219 |
|
C21 | Notice of transfer of a case for reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C21 Effective date: 20200225 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200310 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200318 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6679683 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |