JP6979986B2 - Information processing equipment, information processing methods and information processing programs - Google Patents
Information processing equipment, information processing methods and information processing programs Download PDFInfo
- Publication number
- JP6979986B2 JP6979986B2 JP2019140358A JP2019140358A JP6979986B2 JP 6979986 B2 JP6979986 B2 JP 6979986B2 JP 2019140358 A JP2019140358 A JP 2019140358A JP 2019140358 A JP2019140358 A JP 2019140358A JP 6979986 B2 JP6979986 B2 JP 6979986B2
- Authority
- JP
- Japan
- Prior art keywords
- search query
- category
- character string
- learning model
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 230
- 238000003672 processing method Methods 0.000 title claims description 7
- 238000000605 extraction Methods 0.000 claims description 99
- 230000014509 gene expression Effects 0.000 claims description 84
- 238000012545 processing Methods 0.000 claims description 76
- 239000000284 extract Substances 0.000 claims description 70
- 238000000034 method Methods 0.000 claims description 43
- 230000008569 process Effects 0.000 claims description 22
- 239000013598 vector Substances 0.000 description 119
- 235000015927 pasta Nutrition 0.000 description 35
- 101001111655 Homo sapiens Retinol dehydrogenase 11 Proteins 0.000 description 34
- 102100023916 Retinol dehydrogenase 11 Human genes 0.000 description 34
- 238000010586 diagram Methods 0.000 description 31
- 238000004891 communication Methods 0.000 description 14
- 230000006870 function Effects 0.000 description 14
- 230000009471 action Effects 0.000 description 13
- 238000013528 artificial neural network Methods 0.000 description 12
- 230000006399 behavior Effects 0.000 description 10
- 102100026933 Myelin-associated neurite-outgrowth inhibitor Human genes 0.000 description 8
- 101710114762 50S ribosomal protein L11, chloroplastic Proteins 0.000 description 6
- 238000012549 training Methods 0.000 description 6
- 101710156159 50S ribosomal protein L21, chloroplastic Proteins 0.000 description 5
- 238000002372 labelling Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 235000013305 food Nutrition 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 241000251556 Chordata Species 0.000 description 2
- 101150087840 UL11 gene Proteins 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 101710082414 50S ribosomal protein L12, chloroplastic Proteins 0.000 description 1
- 101710087140 50S ribosomal protein L22, chloroplastic Proteins 0.000 description 1
- 101100494773 Caenorhabditis elegans ctl-2 gene Proteins 0.000 description 1
- 101100112369 Fasciola hepatica Cat-1 gene Proteins 0.000 description 1
- 101150041636 NEC1 gene Proteins 0.000 description 1
- 101100005271 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) cat-1 gene Proteins 0.000 description 1
- 101150003725 TK gene Proteins 0.000 description 1
- 101150023763 UL12 gene Proteins 0.000 description 1
- 101150105144 UL21 gene Proteins 0.000 description 1
- 101150118251 UL23 gene Proteins 0.000 description 1
- 101150019585 UL31 gene Proteins 0.000 description 1
- 101150081727 UL32 gene Proteins 0.000 description 1
- 101150044021 UL41 gene Proteins 0.000 description 1
- 101150099321 UL42 gene Proteins 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 101150055782 gH gene Proteins 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
本発明は、情報処理装置、情報処理方法及び情報処理プログラムに関する。 The present invention relates to an information processing apparatus, an information processing method and an information processing program.
近年、インターネットの飛躍的な普及に伴い、インターネット上の種々の情報を用いた分析に関する技術が提供されている。例えば、検索クエリの分析に基づいて、所定の分野におけるトレンドを予測する技術が提案されている。 In recent years, with the rapid spread of the Internet, techniques related to analysis using various information on the Internet have been provided. For example, a technique for predicting a trend in a predetermined field based on the analysis of a search query has been proposed.
しかしながら、上記の従来技術では、所定のカテゴリに属する対象を示す文字列を適切に抽出することができるとは限らない。例えば、上記の従来技術では、所定のカテゴリにおけるイノベータを特定し、特定したイノベータによって検索された検索クエリに基づいて、所定のカテゴリにおけるトレンドを予測するに過ぎず、所定のカテゴリに属する対象を示す文字列を適切に抽出することができるとは限らない。例えば、上記の従来技術では、検索クエリとして入力された文字列が、世の中に登場したばかりの新しい用語である場合には、その用語が示す対象を特定することは困難である。例えば、新しい用語の意味を辞書等で調べようとしても、まだその用語が辞書等に掲載されていない場合がある。このような場合、新しい用語によって示される対象を特定することは困難なため、新しい用語によって示される対象が属するカテゴリを特定することも困難である。 However, in the above-mentioned conventional technique, it is not always possible to appropriately extract a character string indicating an object belonging to a predetermined category. For example, in the above-mentioned prior art, an innovator in a predetermined category is identified, and a trend in the predetermined category is only predicted based on a search query searched by the specified innovator, and an object belonging to the predetermined category is shown. It is not always possible to properly extract a character string. For example, in the above-mentioned conventional technique, when the character string input as a search query is a new term that has just appeared in the world, it is difficult to specify the target indicated by the term. For example, even if an attempt is made to look up the meaning of a new term in a dictionary or the like, the term may not be listed in the dictionary or the like yet. In such a case, it is difficult to identify the object indicated by the new term, and it is also difficult to identify the category to which the object indicated by the new term belongs.
本願は、上記に鑑みてなされたものであって、所定のカテゴリに属する対象を示す文字列を適切に抽出することができる情報処理装置、情報処理方法及び情報処理プログラムを提供することを目的とする。 The present application has been made in view of the above, and an object thereof is to provide an information processing apparatus, an information processing method, and an information processing program capable of appropriately extracting a character string indicating an object belonging to a predetermined category. do.
本願に係る情報処理装置は、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして前記複数の検索クエリが有する特徴を学習した第1学習モデルを用いて生成された第2学習モデルであって、所定の検索クエリから前記所定の検索クエリが属するカテゴリを予測する前記第2学習モデルを取得する取得部と、前記取得部によって取得された第2学習モデルを用いて、検索クエリとして入力された文字列によって示される対象が属するカテゴリを推定する推定部と、前記推定部によって推定されたカテゴリに基づいて、前記文字列の中から、対象分野に属する抽出対象を示す対象文字列を抽出する抽出部を備えたことを特徴とする。 The information processing apparatus according to the present application uses a first learning model in which a plurality of search queries input by the same user within a predetermined time have similar characteristics and the characteristics of the plurality of search queries are learned. An acquisition unit that acquires the second learning model that predicts the category to which the predetermined search query belongs from the generated second learning model, and a second learning model acquired by the acquisition unit. Is used to estimate the category to which the target indicated by the character string input as the search query belongs, and the extraction belonging to the target field from the character string based on the category estimated by the estimation unit. It is characterized by having an extraction unit for extracting a target character string indicating a target.
実施形態の一態様によれば、所定のカテゴリに属する対象を示す文字列を適切に抽出することができるといった効果を奏する。 According to one aspect of the embodiment, there is an effect that a character string indicating an object belonging to a predetermined category can be appropriately extracted.
以下に、本願に係る情報処理装置、情報処理方法及び情報処理プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る情報処理装置、情報処理方法及び情報処理プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略する。 Hereinafter, an information processing apparatus, an information processing method, and an embodiment for implementing an information processing program (hereinafter referred to as “embodiments”) according to the present application will be described in detail with reference to the drawings. Note that this embodiment does not limit the information processing apparatus, information processing method, and information processing program according to the present application. Further, in each of the following embodiments, the same parts are designated by the same reference numerals, and duplicate description will be omitted.
〔1.実施形態〕
〔1−1.情報処理の一例〕
まず、図1を用いて、実施形態に係る情報処理の一例について説明する。図1は、実施形態に係る情報処理の一例を示す図である。実施形態に係る情報処理は、図1に示す情報処理装置100によって行われる。図1に示す例では、情報処理装置100は、ファッション系サイトに流入した流入検索クエリ群に含まれる雑多な文字列の中から、対象分野であるファッション分野(ファッションに関するカテゴリ)に属する対象を示す文字列を抽出する。
[1. Embodiment]
[1-1. An example of information processing]
First, an example of information processing according to an embodiment will be described with reference to FIG. FIG. 1 is a diagram showing an example of information processing according to an embodiment. The information processing according to the embodiment is performed by the
図1の説明に先立って、図2を用いて、実施形態に係る情報処理システムの構成について説明する。図2は、実施形態に係る情報処理システムの構成例を示す図である。図2に示すように、情報処理システム1には、生成装置50と、情報処理装置100と、サービスサーバ200が含まれる。生成装置50と、情報処理装置100と、サービスサーバ200は所定のネットワークNを介して、有線または無線により通信可能に接続される。なお、図2に示す情報処理システム1には、任意の数の生成装置50と任意の数の情報処理装置100と任意の数のサービスサーバ200が含まれてもよい。
Prior to the description of FIG. 1, the configuration of the information processing system according to the embodiment will be described with reference to FIG. FIG. 2 is a diagram showing a configuration example of an information processing system according to an embodiment. As shown in FIG. 2, the
生成装置50は、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして複数の検索クエリが有する特徴を学習した第1学習モデルを用いて生成された第2学習モデルであって、所定の検索クエリから所定の検索クエリが属するカテゴリを予測する第2学習モデルを生成する情報処理装置である。なお、生成装置50による第2学習モデルの生成処理の詳細については後述する。生成装置50は、情報処理装置100の要求に応じて、第2学習モデルのモデルデータMDT2を情報処理装置100に対して送信する。
The
情報処理装置100は、対象分野に属する抽出対象を示す対象文字列を抽出するサーバ装置である。図1に示す例では、情報処理装置100は、ファッション系サイトに流入した流入検索クエリに含まれる文字列の中から、ファッション分野(以下、ファッションカテゴリともいう)に属する対象を示す文字列を抽出する。
The
ここで、一般的に、所定期間内に所定のカテゴリに関するサイトに流入した流入検索クエリには、様々な検索クエリが含まれている。具体的には、流入検索クエリの中には、所定のカテゴリに属する対象を示す文字列とは異なる一般的な用語やサイトの名称等が含まれる。このように、流入検索クエリには、所定のカテゴリに属する対象を示す文字列とは異なる文字列が多く含まれているため、これらの文字列を取り除く必要がある。 Here, in general, the inflow search query that has flowed into the site related to a predetermined category within a predetermined period includes various search queries. Specifically, the inflow search query includes general terms, site names, etc. that are different from the character strings indicating the target belonging to the predetermined category. As described above, since the inflow search query contains many character strings different from the character strings indicating the target belonging to the predetermined category, it is necessary to remove these character strings.
例えば、ファッション系サイトに流入した流入検索クエリの中には、ファッションカテゴリに属する対象を示す文字列とは異なる文字列として、レディース、人気、コーデ、サイズ、…等の一般的な用語や、流入先のサイトの名称を示す文字列が含まれている。これら一般的な用語や、流入先のサイトの名称を示す文字列については、不要な文字列としてあらかじめ登録しておき、辞書ベースで取り除くことができる。一方、流入検索クエリとして入力された文字列の中に、世の中に登場したばかりの新しい用語(以下、未知用語ともいう)が含まれる場合には、その用語を取り除くことは困難である。例えば、ファッション系サイトに流入した流入検索クエリの中には、ファッションカテゴリに属する対象を示す文字列とは異なる文字列として、人名、ブランド名、店舗名、…等を示す文字列が含まれている。これら人名、ブランド名、店舗名、…等を示す文字列は、新たな人名、新たなブランド名、新たな店舗名、…等が次々と世の中に登場するため、未知用語が多く存在する。したがって、これら人名、ブランド名、店舗名、…等を示す文字列については、あらかじめ全ての文字列を登録しておくことが困難である。したがって、従来は、流入検索クエリの中から、所定のカテゴリに属する対象を示す文字列以外の文字列を取り除くことが困難であった。 For example, in the inflow search query that has flowed into a fashion-related site, general terms such as ladies', popularity, coordination, size, etc., and inflow as a character string different from the character string indicating the target belonging to the fashion category. Contains a string indicating the name of the previous site. These general terms and character strings indicating the name of the inflow destination site can be registered in advance as unnecessary character strings and removed on a dictionary basis. On the other hand, if the character string entered as an inflow search query contains a new term that has just appeared in the world (hereinafter, also referred to as an unknown term), it is difficult to remove the term. For example, the inflow search query that has flowed into a fashion site includes a character string that indicates a person name, a brand name, a store name, ..., etc. as a character string different from the character string that indicates a target belonging to a fashion category. There is. There are many unknown terms in the character strings indicating these personal names, brand names, store names, etc., because new personal names, new brand names, new store names, etc. appear one after another in the world. Therefore, it is difficult to register all the character strings indicating the person name, brand name, store name, ..., Etc. in advance. Therefore, conventionally, it has been difficult to remove a character string other than a character string indicating a target belonging to a predetermined category from an inflow search query.
また、抽出対象の文字列が未知用語である場合もある。例えば、ファッション系サイトに流入した流入検索クエリの中には、ファッションカテゴリに属する対象を示す文字列であって、世の中に登場したばかりの新しい用語(以下、未知用語ともいう)が含まれる。特に、ファッション分野のように、新しい対象を示す新しい用語が次々に登場する分野においては、抽出対象の文字列が未知用語である場合も珍しくない。そこで、未知用語が抽出対象の文字列であるか否かを判断するために、用語の意味を辞書等で調べる方法が考えられるが、世の中に登場したばかりの未知用語はまだ辞書等に掲載されていない場合がある。このような場合、未知用語によって示される対象を特定することは困難なため、未知用語によって示される対象が属するカテゴリを特定することも困難である。すなわち、従来は、未知用語によって示される対象が属するカテゴリを特定することが困難なため、未知用語を対象分野に属する文字列として抽出することは困難であった。 In addition, the character string to be extracted may be an unknown term. For example, the inflow search query that has flowed into a fashion-related site includes a new term (hereinafter, also referred to as an unknown term) that is a character string indicating an object belonging to a fashion category and has just appeared in the world. In particular, in fields such as the fashion field where new terms indicating new targets appear one after another, it is not uncommon for the character string to be extracted to be an unknown term. Therefore, in order to determine whether or not the unknown term is a character string to be extracted, a method of looking up the meaning of the term in a dictionary or the like can be considered, but the unknown term that has just appeared in the world is still published in the dictionary or the like. It may not be. In such a case, since it is difficult to specify the object indicated by the unknown term, it is also difficult to specify the category to which the object indicated by the unknown term belongs. That is, conventionally, since it is difficult to specify the category to which the object indicated by the unknown term belongs, it is difficult to extract the unknown term as a character string belonging to the target field.
そこで、本願発明に係る情報処理装置100は、所定の検索クエリから所定の検索クエリが属するカテゴリを予測する第2学習モデルを用いて、流入検索クエリとして入力された文字列によって示される対象が属するカテゴリを推定する。これにより、本願発明に係る情報処理装置100は、流入検索クエリとして入力された文字列が未知用語である場合であっても、未知用語によって示される対象が属するカテゴリを推定することができるため、所定のカテゴリに属する対象を示す文字列を精度よく抽出することができる。具体的には、情報処理装置100は、未知用語に対して対象分野とは異なる非対象分野を示すカテゴリが推定された場合には、その未知用語が対象カテゴリに属する対象を示す文字列以外の文字列であると推定することができる。よって、情報処理装置100は、その未知用語を不要文字列として取り除くことができる。一方、情報処理装置100は、流入検索クエリとして入力された文字列が未知用語である場合であっても、未知用語に対して対象分野を示すカテゴリが推定された場合には、その未知用語を対象分野に属する対象文字列であると推定することができる。よって、情報処理装置100は、その未知用語を対象文字列として抽出することができる。したがって、本願発明に係る情報処理装置100は、所定のカテゴリに属する対象を示す文字列を適切に抽出することができる。
Therefore, in the
サービスサーバ200は、対象分野に関するサイトを提供するサーバ装置である。具体的には、サービスサーバ200は、対象分野に関するサイトに流入した流入検索クエリに関する情報を記憶する。図1に示す例では、サービスサーバ200は、ファッション分野に関するサイトに流入した流入検索クエリに関する情報を記憶する。サービスサーバ200は、情報処理装置100の要求に応じて、流入検索クエリに関する情報を情報処理装置100に対して送信する。なお、サービスサーバ200は、ファッション分野に限らず、種々の分野に関するサイトを提供してもよい。
The
ここから、図1を用いて、情報処理の流れについて説明する。図1では、情報処理装置100は、ファッション系サイトに流入した流入検索クエリに関する情報の取得要求をサービスサーバ200に対して送信する。サービスサーバ200は、情報処理装置100の要求に応じて、流入検索クエリに関する情報を情報処理装置100に対して送信する。
From here, the flow of information processing will be described with reference to FIG. In FIG. 1, the
情報処理装置100は、サービスサーバ200からファッション系サイトに流入した流入検索クエリに関する情報を取得する。具体的には、情報処理装置100は、流入検索クエリとして入力された各文字列を取得する(ステップS1)。
The
図1の左側に示す例では、情報処理装置100は、流入検索クエリQ100として入力された文字列「レディース 未知用語L1」を取得する。ここで、「未知用語L1」は、世の中に登場したばかりの新しい用語(例えば、ファッション用語)であって、まだ辞書等に掲載されていない用語であるものとする。
In the example shown on the left side of FIG. 1, the
また、情報処理装置100は、流入検索クエリQ200として入力された文字列「未知用語L1 Mサイズ 店舗名T1」を取得する。なお、「店舗名T1」は、特定の店舗(例えば、特定のアパレルメーカー)の名称を示す語句であって、例えば、世の中に登場したばかりの新しい店舗名を示す語句であるものとする。
Further, the
また、情報処理装置100は、流入検索クエリQ300として入力された文字列「Yシャツ 20代」を取得する。
Further, the
また、情報処理装置100は、流入検索クエリQ400として入力された文字列「Yシャツ 人名M1」を取得する。なお、「人名M1」は、特定の人物(例えば、ファッションモデルや芸能人等)の名称を示す語句であって、例えば、世の中に登場したばかりの新しい人名を示す語句であるものとする。
Further, the
また、情報処理装置100は、流入検索クエリQ500として入力された文字列「未知用語L2 コーデ」を取得する。ここで、「未知用語L2」は、「未知用語L1」と同様、世の中に登場したばかりの新しい用語(例えば、ファッション用語)であって、まだ辞書等に掲載されていない用語であるものとする。
Further, the
また、情報処理装置100は、流入検索クエリQ600として入力された文字列「未知用語L2 ブランド名B1 人気」を取得する。なお、「ブランド名B1」は、特定のアパラレルブランドの名称を示す語句であって、例えば、世の中に登場したばかりの新しいブランド名を示す語句であるものとする。
Further, the
続いて、情報処理装置100は、流入検索クエリ群を取得すると、取得した流入検索クエリ群に含まれる各検索クエリとして入力された各文字列から不要な文字列として登録された不要文字列を取り除いた第1文字列を取得する。例えば、情報処理装置100は、不要な文字列として登録された不要文字列のリストを取得する。続いて、情報処理装置100は、取得した不要文字列のリストを参照して、取得した流入検索クエリ群に含まれる各検索クエリとして入力された各文字列の中に不要文字列が含まれるか否かを判定する。続いて、情報処理装置100は、不要文字列が含まれると判定した場合には、検索クエリとして入力された文字列から不要文字列を取り除いた第1文字列を取得する。
Subsequently, when the
例えば、情報処理装置100は、不要文字列のリストを参照して、流入検索クエリQ100として入力された文字列「レディース 未知用語L1」に不要文字列である「レディース」が含まれると判定する。続いて、情報処理装置100は、不要文字列が含まれると判定すると、流入検索クエリQ100として入力された文字列「レディース 未知用語L1」から不要文字列である「レディース」を取り除いた第1文字列「未知用語L1」(第1文字列L1)を取得する。
For example, the
また、情報処理装置100は、不要文字列のリストを参照して、流入検索クエリQ200として入力された文字列「未知用語L1 Mサイズ 店舗名T1」に不要文字列である「Mサイズ」が含まれると判定する。続いて、情報処理装置100は、不要文字列が含まれると判定すると、流入検索クエリQ200として入力された文字列「未知用語L1 Mサイズ 店舗名T1」から不要文字列である「Mサイズ」を取り除いた第1文字列「未知用語L1 店舗名T1」(第1文字列L2)を取得する。
Further, the
また、情報処理装置100は、不要文字列のリストを参照して、流入検索クエリQ300として入力された文字列「Yシャツ 20代」に不要文字列である「20代」が含まれると判定する。続いて、情報処理装置100は、不要文字列が含まれると判定すると、流入検索クエリQ300として入力された文字列「Yシャツ 20代」から不要文字列である「20代」を取り除いた第1文字列「Yシャツ」(第1文字列L3)を取得する。
Further, the
また、情報処理装置100は、不要文字列のリストを参照して、流入検索クエリQ500として入力された文字列「未知用語L2 コーデ」に不要文字列である「コーデ」が含まれると判定する。続いて、情報処理装置100は、不要文字列が含まれると判定すると、流入検索クエリQ500として入力された文字列「未知用語L2 コーデ」から不要文字列である「コーデ」を取り除いた第1文字列「未知用語L2」(第1文字列L5)を取得する。
Further, the
また、情報処理装置100は、不要文字列のリストを参照して、流入検索クエリQ600として入力された文字列「未知用語L2 ブランド名B1 人気」に不要文字列である「人気」が含まれると判定する。続いて、情報処理装置100は、不要文字列が含まれると判定すると、流入検索クエリQ600として入力された文字列「未知用語L2 ブランド名B1 人気」から不要文字列である「人気」を取り除いた第1文字列「未知用語L2 ブランド名B1」(第1文字列L6)を取得する。
Further, when the
続いて、情報処理装置100は、第1文字列を取得すると、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして複数の検索クエリが有する特徴を学習した第1学習モデルを用いて生成された第2学習モデルであって、所定の検索クエリから所定の検索クエリが属するカテゴリを予測する第2学習モデル(第2学習モデルM2)を取得する。続いて、情報処理装置100は、第2学習モデルを取得すると、第2学習モデルを用いて、第1文字列によって示される対象が属するカテゴリを推定する。情報処理装置100は、第1文字列によって示される対象が属する複数のカテゴリを推定する。具体的には、情報処理装置100は、第1文字列によって示される対象が各カテゴリに属する確率をカテゴリ毎に出力する。より具体的には、情報処理装置100は、第2学習モデルM2の入力情報として第1文字列を入力することにより、第2学習モデルM2の出力情報として第1文字列によって示される対象が各カテゴリに属する確率をカテゴリ毎に出力する(ステップS2)。
Subsequently, when the
図1の真ん中に示す例では、情報処理装置100は、第1文字列L1を取得すると、第2学習モデルM2の入力情報として第1文字列L1を入力することにより、第2学習モデルM2の出力情報として第1文字列L1によって示される対象が各カテゴリに属する確率をカテゴリ毎に出力する。例えば、情報処理装置100は、第1文字列L1によって示される対象がファッションに関するカテゴリC1(以下、ファッションカテゴリC1ともいう)に属する確率を100パーセント、その他のカテゴリに属する確率を0%と出力する。
In the example shown in the middle of FIG. 1, when the
また、情報処理装置100は、第1文字列L2を取得すると、第2学習モデルM2の入力情報として第1文字列L2を入力することにより、第2学習モデルM2の出力情報として第1文字列L2によって示される対象が各カテゴリに属する確率をカテゴリ毎に出力する。例えば、情報処理装置100は、第1文字列L2によって示される対象がファッションカテゴリC1に属する確率を70パーセント、店舗名に関するカテゴリC4に属する確率を30パーセント、その他のカテゴリに属する確率を0%と出力する。
Further, when the
また、情報処理装置100は、第1文字列L3を取得すると、第2学習モデルM2の入力情報として第1文字列L3を入力することにより、第2学習モデルM2の出力情報として第1文字列L3によって示される対象が各カテゴリに属する確率をカテゴリ毎に出力する。例えば、情報処理装置100は、第1文字列L3によって示される対象がファッションカテゴリC1に属する確率を100パーセント、その他のカテゴリに属する確率を0%と出力する。
Further, when the
また、情報処理装置100は、第1文字列L4を取得すると、第2学習モデルM2の入力情報として第1文字列L4を入力することにより、第2学習モデルM2の出力情報として第1文字列L4によって示される対象が各カテゴリに属する確率をカテゴリ毎に出力する。例えば、情報処理装置100は、第1文字列L4によって示される対象がファッションカテゴリC1に属する確率を50パーセント、人名に関するカテゴリC2に属する確率を50パーセント、その他のカテゴリに属する確率を0%と出力する。
Further, when the
また、情報処理装置100は、第1文字列L5を取得すると、第2学習モデルM2の入力情報として第1文字列L5を入力することにより、第2学習モデルM2の出力情報として第1文字列L5によって示される対象が各カテゴリに属する確率をカテゴリ毎に出力する。例えば、情報処理装置100は、第1文字列L5によって示される対象がファッションカテゴリC1に属する確率を100パーセント、その他のカテゴリに属する確率を0%と出力する。
Further, when the
また、情報処理装置100は、第1文字列L6を取得すると、第2学習モデルM2の入力情報として第1文字列L6を入力することにより、第2学習モデルM2の出力情報として第1文字列L6によって示される対象が各カテゴリに属する確率をカテゴリ毎に出力する。例えば、情報処理装置100は、第1文字列L6によって示される対象がファッションカテゴリC1に属する確率を60パーセント、ブランド名に関するカテゴリC3に属する確率を40パーセント、その他のカテゴリに属する確率を0%と出力する。
Further, when the
続いて、情報処理装置100は、第1文字列によって示される対象が属するカテゴリを推定すると、推定されたカテゴリに基づいて、第1文字列の中から、対象分野であるファッションカテゴリC1に属する抽出対象を示す対象文字列を抽出する(ステップS3)。図1の右側に示す例では、情報処理装置100は、第1文字列の中から、第1文字列「未知用語L1」(第1文字列L1)を対象文字列W1として抽出する。また、情報処理装置100は、第1文字列の中から、第1文字列「Yシャツ」(第1文字列L3)を対象文字列W2として抽出する。また、情報処理装置100は、第1文字列の中から、第1文字列「未知用語L2」(第1文字列L5)を対象文字列W3として抽出する。
Subsequently, when the
具体的には、情報処理装置100は、第1文字列によって示される対象が属するカテゴリを推定すると、推定したカテゴリの中に、対象分野であるファッションカテゴリC1が含まれるか否かを第1文字列毎に判定する。続いて、情報処理装置100は、推定したカテゴリの中に、対象分野であるファッションカテゴリC1が含まれると判定した場合、その第1文字列を抽出する。すなわち、情報処理装置100は、ファッションカテゴリC1に属する対象を示す第1文字列を抽出する。続いて、情報処理装置100は、ファッションカテゴリC1に属する対象を示す第1文字列を抽出すると、推定したカテゴリの中に不要なカテゴリとして登録された不要カテゴリを含むか否かを抽出した第1文字列毎に判定する。続いて、情報処理装置100は、推定したカテゴリの中に不要なカテゴリとして登録された不要カテゴリを含まないと判定した場合、その第1文字列を対象文字列として抽出する。すなわち、情報処理装置100は、不要なカテゴリに属する対象を示す第1文字列以外の第1文字列を対象文字列として抽出する。
Specifically, when the
例えば、情報処理装置100は、第1文字列L1について推定されたカテゴリの中に、対象分野であるファッションカテゴリC1が含まれるか否かを判定する。情報処理装置100は、第1文字列L1について推定されたカテゴリの中に、対象分野であるファッションカテゴリC1が含まれると判定する。続いて、情報処理装置100は、ファッションカテゴリC1が含まれると判定したので、第1文字列L1について推定されたカテゴリの中に、不要カテゴリを含むか否かを判定する。続いて、情報処理装置100は、第1文字列L1について推定されたカテゴリの中に、不要カテゴリを含まないと判定する。続いて、情報処理装置100は、不要カテゴリを含まないと判定したので、第1文字列L1を対象文字列W1として抽出する。
For example, the
また、情報処理装置100は、第1文字列L2について推定されたカテゴリの中に、対象分野であるファッションカテゴリC1が含まれるか否かを判定する。情報処理装置100は、第1文字列L2について推定されたカテゴリの中に、対象分野であるファッションカテゴリC1が含まれると判定する。続いて、情報処理装置100は、ファッションカテゴリC1が含まれると判定したので、第1文字列L2について推定されたカテゴリの中に、不要カテゴリを含むか否かを判定する。続いて、情報処理装置100は、第1文字列L2について推定されたカテゴリの中に、不要カテゴリである店舗名に関するカテゴリC3を含むと判定する。続いて、情報処理装置100は、不要カテゴリを含むと判定したので、第1文字列L2を対象文字列として抽出しないことを決定する。
Further, the
また、情報処理装置100は、第1文字列L3について推定されたカテゴリの中に、対象分野であるファッションカテゴリC1が含まれるか否かを判定する。情報処理装置100は、第1文字列L3について推定されたカテゴリの中に、対象分野であるファッションカテゴリC1が含まれると判定する。続いて、情報処理装置100は、ファッションカテゴリC1が含まれると判定したので、第1文字列L3について推定されたカテゴリの中に、不要カテゴリを含むか否かを判定する。続いて、情報処理装置100は、第1文字列L3について推定されたカテゴリの中に、不要カテゴリを含まないと判定する。続いて、情報処理装置100は、不要カテゴリを含まないと判定したので、第1文字列L3を対象文字列W2として抽出する。
Further, the
また、情報処理装置100は、第1文字列L4について推定されたカテゴリの中に、対象分野であるファッションカテゴリC1が含まれるか否かを判定する。情報処理装置100は、第1文字列L4について推定されたカテゴリの中に、対象分野であるファッションカテゴリC1が含まれると判定する。続いて、情報処理装置100は、ファッションカテゴリC1が含まれると判定したので、第1文字列L4について推定されたカテゴリの中に、不要カテゴリを含むか否かを判定する。続いて、情報処理装置100は、第1文字列L4について推定されたカテゴリの中に、不要カテゴリである人名に関するカテゴリC2を含むと判定する。続いて、情報処理装置100は、不要カテゴリを含むと判定したので、第1文字列L4を対象文字列として抽出しないことを決定する。
Further, the
また、情報処理装置100は、第1文字列L5について推定されたカテゴリの中に、対象分野であるファッションカテゴリC1が含まれるか否かを判定する。情報処理装置100は、第1文字列L5について推定されたカテゴリの中に、対象分野であるファッションカテゴリC1が含まれると判定する。続いて、情報処理装置100は、ファッションカテゴリC1が含まれると判定したので、第1文字列L5について推定されたカテゴリの中に、不要カテゴリを含むか否かを判定する。続いて、情報処理装置100は、第1文字列L5について推定されたカテゴリの中に、不要カテゴリを含まないと判定する。続いて、情報処理装置100は、不要カテゴリを含まないと判定したので、第1文字列L5を対象文字列W3として抽出する。
Further, the
また、情報処理装置100は、第1文字列L6について推定されたカテゴリの中に、対象分野であるファッションカテゴリC1が含まれるか否かを判定する。情報処理装置100は、第1文字列L6について推定されたカテゴリの中に、対象分野であるファッションカテゴリC1が含まれると判定する。続いて、情報処理装置100は、ファッションカテゴリC1が含まれると判定したので、第1文字列L6について推定されたカテゴリの中に、不要カテゴリを含むか否かを判定する。続いて、情報処理装置100は、第1文字列L6について推定されたカテゴリの中に、不要カテゴリであるブランド名に関するカテゴリC3を含むと判定する。続いて、情報処理装置100は、不要カテゴリを含むと判定したので、第1文字列L6を対象文字列として抽出しないことを決定する。
Further, the
上述したように、情報処理装置100は、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして複数の検索クエリが有する特徴を学習した第1学習モデルを用いて生成された第2学習モデルであって、所定の検索クエリから所定の検索クエリが属するカテゴリを予測する第2学習モデルを取得する。また、情報処理装置100は、取得した第2学習モデルを用いて、検索クエリとして入力された文字列によって示される対象が属するカテゴリを推定する。そして、情報処理装置100は、推定したカテゴリに基づいて、文字列の中から、対象分野に属する抽出対象を示す対象文字列を抽出する。
As described above, the
これにより、情報処理装置100は、検索クエリとして入力された文字列が未知用語である場合であっても、未知用語によって示される対象が属するカテゴリを推定することができるため、所定のカテゴリに属する対象を示す文字列を精度よく抽出することができる。例えば、情報処理装置100は、未知用語に対して対象分野とは異なる非対象分野を示すカテゴリが推定された場合には、その未知用語を不要な文字列として取り除くことができる。また、情報処理装置100は、流入検索クエリとして入力された文字列が未知用語である場合であっても、未知用語に対して対象分野を示すカテゴリが推定された場合には、その未知用語を対象分野に属する対象文字列として抽出することができる。したがって、本願発明に係る情報処理装置100は、所定のカテゴリに属する対象を示す文字列を適切に抽出することができる。
As a result, the
〔1−2.情報処理装置の構成〕
次に、図3を用いて、実施形態に係る情報処理装置100の構成について説明する。図3は、実施形態に係る情報処理装置100の構成例を示す図である。図3に示すように、情報処理装置100は、通信部110と、記憶部120と、制御部130とを有する。なお、情報処理装置100は、情報処理装置100の管理者等から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を表示させるための表示部(例えば、液晶ディスプレイ等)を有してもよい。
[1-2. Information processing device configuration]
Next, the configuration of the
(通信部110)
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部110は、ネットワークと有線または無線で接続され、例えば、生成装置50とサービスサーバ200との間で情報の送受信を行う。
(Communication unit 110)
The
(記憶部120)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。記憶部120は、図3に示すように、クエリ情報記憶部121と不要文字列記憶部122と不要カテゴリ記憶部123とモデル情報記憶部124を有する。
(Memory unit 120)
The storage unit 120 is realized by, for example, a semiconductor memory element such as a RAM (Random Access Memory) or a flash memory (Flash Memory), or a storage device such as a hard disk or an optical disk. As shown in FIG. 3, the storage unit 120 includes a query
(クエリ情報記憶部121)
クエリ情報記憶部121は、対象分野に関するサイトに流入した検索クエリに関する各種の情報を記憶する。例えば、クエリ情報記憶部121は、ファッション系サイトに流入した検索クエリに関する各種の情報を記憶する。図4に、実施形態に係るクエリ情報記憶部の一例を示す。図4に示す例では、クエリ情報記憶部121は、「検索クエリID」、「日時」、「流入サイト名」、「文字列」といった項目を有する。
(Query information storage unit 121)
The query
「検索クエリID」は、対象分野に関するサイトに流入した検索クエリを識別する識別情報を示す。「日時」は、検索クエリが対象分野に関するサイトに流入した日時を示す。「流入サイト名」は、検索クエリが流入した流入先のサイト名を示す。「文字列」は、検索クエリとして入力された文字列を示す。 The "search query ID" indicates identification information that identifies the search query that has flowed into the site related to the target field. "Date and time" indicates the date and time when the search query entered the site related to the target field. The "inflow site name" indicates the site name of the inflow destination to which the search query has flowed. "Character string" indicates a character string entered as a search query.
図4の1レコード目に示す例では、検索クエリID「Q1」で識別される検索クエリ(検索クエリQ1)は、日時「DT1」に流入サイト名「サイト名N1」に流入した検索クエリであることを示す。また、文字列「サイト名N1 コサッシュ」は、検索クエリQ1として入力された文字列が「サイト名N1 コサッシュ」であることを示す。 In the example shown in the first record of FIG. 4, the search query (search query Q1) identified by the search query ID "Q1" is a search query that has flowed into the site name "site name N1" that has flowed into the date and time "DT1". Show that. Further, the character string "site name N1 cosash" indicates that the character string input as the search query Q1 is "site name N1 cosash".
(不要文字列記憶部122)
不要文字列記憶部122は、不要文字列に関する各種の情報を記憶する。図5に、実施形態に係る不要文字列記憶部の一例を示す。図5に示す例では、不要文字列記憶部122は、「不要文字列ID」、「不要文字列」といった項目を有する。
(Unnecessary character string storage unit 122)
The unnecessary character
「不要文字列ID」は、不要文字列を識別する識別情報を示す。「不要文字列」は、不要な文字列として登録された文字列を示す。 The "unnecessary character string ID" indicates identification information for identifying the unnecessary character string. "Unnecessary character string" indicates a character string registered as an unnecessary character string.
図5の1レコード目に示す例では、不要文字列ID「UL11」で識別される不要文字列が「サイト名N1」であることを示す。例えば、「サイト名N1」は、ファッション系サイトのサイト名を示す。 In the example shown in the first record of FIG. 5, it is shown that the unnecessary character string identified by the unnecessary character string ID “UL11” is “site name N1”. For example, "site name N1" indicates the site name of a fashion-related site.
(不要カテゴリ記憶部123)
不要カテゴリ記憶部123は、不要カテゴリに関する各種の情報を記憶する。図6に、実施形態に係る不要カテゴリ記憶部の一例を示す。図6に示す例では、不要カテゴリ記憶部123は、「不要カテゴリID」、「不要カテゴリ」といった項目を有する。
(Unnecessary category storage unit 123)
The unnecessary
「不要カテゴリID」は、不要カテゴリを識別する識別情報を示す。「不要カテゴリ」は、不要なカテゴリとして登録されたカテゴリを示す。 The "unnecessary category ID" indicates identification information for identifying the unnecessary category. "Unnecessary category" indicates a category registered as an unnecessary category.
図6の1レコード目に示す例では、不要カテゴリ「人名」は、不要カテゴリID「C2」で識別される不要カテゴリが人名に関するカテゴリであることを示す。 In the example shown in the first record of FIG. 6, the unnecessary category "person name" indicates that the unnecessary category identified by the unnecessary category ID "C2" is a category related to a person name.
(モデル情報記憶部124)
モデル情報記憶部124は、生成装置50によって生成された学習モデルに関する各種の情報を記憶する。図7に、実施形態に係るモデル情報記憶部の一例を示す。図7に示す例では、モデル情報記憶部124は、「モデルID」、「モデルデータ」といった項目を有する。
(Model information storage unit 124)
The model information storage unit 124 stores various information about the learning model generated by the
「モデルID」は、生成装置50によって生成された学習モデルを識別するための識別情報を示す。「モデルデータ」は、生成装置50によって生成された学習モデルのモデルデータを示す。例えば、「モデルデータ」には、検索クエリを検索クエリが各カテゴリに属する確率に変換するためのデータが格納される。
The "model ID" indicates identification information for identifying the learning model generated by the
図7の1レコード目に示す例では、モデルID「M1」で識別される学習モデルは、後述する第1モデルM1に対応する。また、モデルデータ「MDT1」は、情報処理装置100によって生成された第1モデルM1のモデルデータ(モデルデータMDT1)を示す。
In the example shown in the first record of FIG. 7, the learning model identified by the model ID “M1” corresponds to the first model M1 described later. Further, the model data "MDT1" indicates model data (model data MDT1) of the first model M1 generated by the
モデルデータMDT1は、検索クエリが入力される入力層と、出力層と、入力層から出力層までのいずれかの層であって出力層以外の層に属する第1要素と、第1要素と第1要素の重みとに基づいて値が算出される第2要素と、を含み、入力層に入力された検索クエリに応じて、入力層に入力された検索クエリの分散表現を出力層から出力するよう、情報処理装置100を機能させてもよい。
The model data MDT1 includes an input layer into which a search query is input, an output layer, a first element which is any layer from the input layer to the output layer and belongs to a layer other than the output layer, and the first element and the first element. The output layer outputs a distributed representation of the search query input to the input layer according to the search query input to the input layer, including the second element whose value is calculated based on the weight of one element. As such, the
ここで、モデルデータMDT1が「y=a1*x1+a2*x2+・・・+ai*xi」で示す回帰モデルで実現されるとする。この場合、モデルデータMDT1が含む第1要素は、x1やx2等といった入力データ(xi)に対応する。また、第1要素の重みは、xiに対応する係数aiに対応する。ここで、回帰モデルは、入力層と出力層とを有する単純パーセプトロンと見做すことができる。各モデルを単純パーセプトロンと見做した場合、第1要素は、入力層が有するいずれかのノードに対応し、第2要素は、出力層が有するノードと見做すことができる。 Here, it is assumed that the model data MDT1 is realized by the regression model shown by "y = a1 * x1 + a2 * x2 + ... + ai * xi". In this case, the first element included in the model data MDT1 corresponds to input data (xi) such as x1 and x2. Further, the weight of the first element corresponds to the coefficient ai corresponding to xi. Here, the regression model can be regarded as a simple perceptron having an input layer and an output layer. When each model is regarded as a simple perceptron, the first element corresponds to any node of the input layer, and the second element can be regarded as the node of the output layer.
また、モデルデータMDT1がDNN(Deep Neural Network)等、1つまたは複数の中間層を有するニューラルネットワークで実現されるとする。この場合、モデルデータMDT1が含む第1要素は、入力層または中間層が有するいずれかのノードに対応する。また、第2要素は、第1要素と対応するノードから値が伝達されるノードである次段のノードに対応する。また、第1要素の重みは、第1要素と対応するノードから第2要素と対応するノードに伝達される値に対して考慮される重みである接続係数に対応する。 Further, it is assumed that the model data MDT1 is realized by a neural network having one or a plurality of intermediate layers such as DNN (Deep Neural Network). In this case, the first element included in the model data MDT1 corresponds to either the node of the input layer or the intermediate layer. Further, the second element corresponds to the node of the next stage, which is the node to which the value is transmitted from the node corresponding to the first element. Further, the weight of the first element corresponds to a connection coefficient which is a weight considered for the value transmitted from the node corresponding to the first element to the node corresponding to the second element.
情報処理装置100は、上述した回帰モデルやニューラルネットワーク等、任意の構造を有するモデルを用いて、分散表現の算出を行う。具体的には、モデルデータMDT1は、検索クエリが入力された場合に、分散表現を出力するように係数が設定される。情報処理装置100は、このようなモデルデータMDT1を用いて、分散表現を算出する。
The
なお、上記例では、モデルデータMDT1が、検索クエリが入力された場合に、検索クエリの分散表現を出力するモデル(以下、モデルX1という。)である例を示した。しかし、実施形態に係るモデルデータMDT1は、モデルX1にデータの入出力を繰り返すことで得られる結果に基づいて生成されるモデルであってもよい。例えば、モデルデータMDT1は、検索クエリを入力とし、モデルX1が出力する分散表現を出力とするよう学習されたモデル(以下、モデルY1という。)であってもよい。または、モデルデータMDT1は、検索クエリを入力とし、モデルY1の出力値を出力とするよう学習されたモデルであってもよい。 In the above example, the model data MDT1 is a model (hereinafter referred to as model X1) that outputs a distributed representation of the search query when the search query is input. However, the model data MDT1 according to the embodiment may be a model generated based on the result obtained by repeating the input / output of data to the model X1. For example, the model data MDT1 may be a model (hereinafter referred to as model Y1) trained to input a search query and output a distributed expression output by the model X1. Alternatively, the model data MDT1 may be a model trained to input a search query and output the output value of the model Y1.
また、情報処理装置100がGAN(Generative Adversarial Networks)を用いた推定処理を行う場合、モデルデータMDT1は、GANの一部を構成するモデルであってもよい。
Further, when the
図7の2レコード目に示す例では、モデルID「M2」で識別される学習モデルは、図1に示した第2モデルM2に対応する。また、モデルデータ「MDT2」は、情報処理装置100によって生成された第2モデルM2のモデルデータ(モデルデータMDT2)を示す。
In the example shown in the second record of FIG. 7, the learning model identified by the model ID “M2” corresponds to the second model M2 shown in FIG. Further, the model data "MDT2" indicates model data (model data MDT2) of the second model M2 generated by the
モデルデータMDT2は、検索クエリが入力される入力層と、出力層と、入力層から出力層までのいずれかの層であって出力層以外の層に属する第1要素と、第1要素と第1要素の重みとに基づいて値が算出される第2要素と、を含み、入力層に入力された検索クエリに応じて、入力層に入力された検索クエリが各カテゴリに属する確率を出力層から出力するよう、情報処理装置100を機能させてもよい。
The model data MDT2 includes an input layer into which a search query is input, an output layer, a first element which is any layer from the input layer to the output layer and belongs to a layer other than the output layer, and the first element and the first element. An output layer that includes a second element whose value is calculated based on the weight of one element, and the probability that the search query input to the input layer belongs to each category according to the search query input to the input layer. The
ここで、モデルデータMDT2が「y=a1*x1+a2*x2+・・・+ai*xi」で示す回帰モデルで実現されるとする。この場合、モデルデータMDT2が含む第1要素は、x1やx2等といった入力データ(xi)に対応する。また、第1要素の重みは、xiに対応する係数aiに対応する。ここで、回帰モデルは、入力層と出力層とを有する単純パーセプトロンと見做すことができる。各モデルを単純パーセプトロンと見做した場合、第1要素は、入力層が有するいずれかのノードに対応し、第2要素は、出力層が有するノードと見做すことができる。 Here, it is assumed that the model data MDT2 is realized by the regression model shown by "y = a1 * x1 + a2 * x2 + ... + ai * xi". In this case, the first element included in the model data MDT2 corresponds to input data (xi) such as x1 and x2. Further, the weight of the first element corresponds to the coefficient ai corresponding to xi. Here, the regression model can be regarded as a simple perceptron having an input layer and an output layer. When each model is regarded as a simple perceptron, the first element corresponds to any node of the input layer, and the second element can be regarded as the node of the output layer.
また、モデルデータMDT2がDNN(Deep Neural Network)等、1つまたは複数の中間層を有するニューラルネットワークで実現されるとする。この場合、モデルデータMDT2が含む第1要素は、入力層または中間層が有するいずれかのノードに対応する。また、第2要素は、第1要素と対応するノードから値が伝達されるノードである次段のノードに対応する。また、第1要素の重みは、第1要素と対応するノードから第2要素と対応するノードに伝達される値に対して考慮される重みである接続係数に対応する。 Further, it is assumed that the model data MDT2 is realized by a neural network having one or a plurality of intermediate layers such as DNN (Deep Neural Network). In this case, the first element included in the model data MDT2 corresponds to either the node of the input layer or the intermediate layer. Further, the second element corresponds to the node of the next stage, which is the node to which the value is transmitted from the node corresponding to the first element. Further, the weight of the first element corresponds to a connection coefficient which is a weight considered for the value transmitted from the node corresponding to the first element to the node corresponding to the second element.
情報処理装置100は、上述した回帰モデルやニューラルネットワーク等、任意の構造を有するモデルを用いて、検索クエリが各カテゴリに属する確率の算出を行う。具体的には、モデルデータMDT2は、検索クエリが入力された場合に、検索クエリが各カテゴリに属する確率を出力するように係数が設定される。情報処理装置100は、このようなモデルデータMDT2を用いて、検索クエリが各カテゴリに属する確率を算出する。
The
なお、上記例では、モデルデータMDT2が、検索クエリが入力された場合に、検索クエリが各カテゴリに属する確率を出力するモデル(以下、モデルX2という。)である例を示した。しかし、実施形態に係るモデルデータMDT2は、モデルX2にデータの入出力を繰り返すことで得られる結果に基づいて生成されるモデルであってもよい。例えば、モデルデータMDT2は、検索クエリを入力とし、モデルX2が出力する確率を出力とするよう学習されたモデル(以下、モデルY2という。)であってもよい。または、モデルデータMDT2は、検索クエリを入力とし、モデルY2の出力値を出力とするよう学習されたモデルであってもよい。 In the above example, the model data MDT2 is a model (hereinafter referred to as model X2) that outputs the probability that the search query belongs to each category when the search query is input. However, the model data MDT2 according to the embodiment may be a model generated based on the result obtained by repeating the input / output of data to the model X2. For example, the model data MDT2 may be a model trained to input a search query and output a probability output by the model X2 (hereinafter referred to as a model Y2). Alternatively, the model data MDT2 may be a model trained to input a search query and output the output value of the model Y2.
また、情報処理装置100がGAN(Generative Adversarial Networks)を用いた推定処理を行う場合、モデルデータMDT2は、GANの一部を構成するモデルであってもよい。
Further, when the
(制御部130)
図3の説明に戻って、制御部130は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、情報処理装置100内部の記憶装置に記憶されている各種プログラム(情報処理プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部130は、コントローラであり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
(Control unit 130)
Returning to the description of FIG. 3, the
図3に示すように、制御部130は、取得部131と、処理部132と、推定部133と、抽出部134とを有し、以下に説明する情報処理の作用を実現または実行する。なお、制御部130の内部構成は、図3に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。
As shown in FIG. 3, the
(取得部131)
取得部131は、各種情報を取得する。具体的には、取得部131は、対象分野に属する対象を示す文字列とは異なる対象を示す文字列である不要文字列を取得する。例えば、取得部131は、不要な文字列として登録された不要文字列のリストを取得する。例えば、取得部131は、情報処理装置100の管理者によって登録された不要文字列のリストを取得する。取得部131は、不要文字列を取得すると、取得した不要文字列を不要文字列記憶部122に記憶する。
(Acquisition unit 131)
The
また、取得部131は、対象分野とは異なる非対象分野を示すカテゴリである不要カテゴリに関する情報を取得する。例えば、取得部131は、不要カテゴリとして登録された不要カテゴリのリストを取得する。例えば、取得部131は、情報処理装置100の管理者によって登録された不要カテゴリのリストを取得する。取得部131は、不要カテゴリを取得すると、取得した不要カテゴリを不要カテゴリ記憶部123に記憶する。
In addition, the
また、取得部131は、外部の情報処理装置から各種情報を取得する。具体的には、取得部131は、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして複数の検索クエリが有する特徴を学習した第1学習モデルを用いて生成された第2学習モデルであって、所定の検索クエリから所定の検索クエリが属するカテゴリを予測する第2学習モデルを生成装置50から取得する。続いて、取得部131は、第2学習モデルを取得すると、取得した第2学習モデルをモデル情報記憶部124に格納する。
Further, the
また、取得部131は、同一のユーザによって所定の時間内に入力された一対の検索クエリの分散表現が類似する特徴を有するものとして複数の検索クエリが有する特徴を学習した第1学習モデルを用いて生成された第2学習モデルであって、所定の検索クエリから所定の検索クエリが属するカテゴリを予測する第2学習モデルを取得する。
Further, the
また、取得部131は、入力情報として所定の検索クエリが入力された際に、出力情報として所定の検索クエリの分散表現を出力する第1学習モデルを用いて生成された第2学習モデルを取得する。
Further, the
また、取得部131は、入力情報として検索クエリが第2学習モデルに入力された際に、出力情報として検索クエリがカテゴリに属する確率をカテゴリ毎に出力する第2学習モデルを取得する。
Further, the
また、取得部131は、同一のユーザによって所定の時間内に入力された複数の検索クエリとして、所定の区切り文字で区切られた文字列を含む複数の検索クエリが類似する特徴を有するものとして学習することで、複数の検索クエリが類似する特徴を有するものとして、複数の検索クエリが有する特徴を学習した第1学習モデルを用いて生成された第2学習モデルであって、所定の検索クエリから所定の検索クエリが属するカテゴリを予測する第2学習モデルを取得する。
Further, the
また、取得部131は、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして複数の検索クエリが有する特徴を学習した第1学習モデルであって、ランダムに抽出された複数の検索クエリが相違する特徴を有するものとして学習することで、複数の検索クエリが有する特徴を学習した第1学習モデルを用いて生成された第2学習モデルであって、所定の検索クエリから所定の検索クエリが属するカテゴリを予測する第2学習モデルを取得する。
Further, the
また、取得部131は、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして複数の検索クエリが有する特徴を学習した第1学習モデルであって、ランダムに抽出された一対の検索クエリの分散表現が相違するように学習することで、複数の検索クエリが有する特徴を学習した第1学習モデルを用いて生成された第2学習モデルであって、所定の検索クエリから所定の検索クエリが属するカテゴリを予測する第2学習モデルを取得する。
Further, the
また、取得部131は、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして複数の検索クエリが有する特徴を学習した第1学習モデルを用いて生成された第2学習モデルであって、検索クエリが第2学習モデルに入力された際に、第2学習モデルが出力する分散表現の分類結果が、検索クエリが属するカテゴリに対応するように学習することで、所定の検索クエリから所定の検索クエリが属するカテゴリを予測する第2学習モデルを取得する。
Further, the
(処理部132)
処理部132は、対象分野に関するサイトに流入した流入検索クエリを取得し、流入検索クエリとして入力された文字列から、不要な文字列として登録された不要文字列を取り除いた第1文字列を取得する。具体的には、処理部132は、サービスサーバ200から対象分野に関するサイトに流入した流入検索クエリに関する情報を取得する。より具体的には、処理部132は、各流入検索クエリとして入力された各文字列を取得する。処理部132は、流入検索クエリとして入力された文字列を取得すると、取得した文字列をクエリ情報記憶部121に格納する。
(Processing unit 132)
The processing unit 132 acquires the inflow search query that has flowed into the site related to the target field, and acquires the first character string obtained by removing the unnecessary character string registered as an unnecessary character string from the character string input as the inflow search query. do. Specifically, the processing unit 132 acquires information regarding the inflow search query that has flowed into the site related to the target field from the
図1に示す例では、処理部132は、サービスサーバ200からファッション系サイトに流入した流入検索クエリに関する情報を取得する。具体的には、処理部132は、流入検索クエリとして入力された各文字列を取得する。
In the example shown in FIG. 1, the processing unit 132 acquires information regarding the inflow search query that has flowed into the fashion site from the
図1の左側に示す例では、処理部132は、流入検索クエリQ100として入力された文字列「レディース 未知用語L1」を取得する。ここで、「未知用語L1」は、世の中に登場したばかりの新しい用語(例えば、ファッション用語)であって、まだ辞書等に掲載されていない用語であるものとする。 In the example shown on the left side of FIG. 1, the processing unit 132 acquires the character string “ladies unknown term L1” input as the inflow search query Q100. Here, it is assumed that the "unknown term L1" is a new term (for example, a fashion term) that has just appeared in the world and has not yet been published in a dictionary or the like.
また、処理部132は、流入検索クエリQ200として入力された文字列「未知用語L1 Mサイズ 店舗名T1」を取得する。なお、「店舗名T1」は、特定の店舗(例えば、特定のアパレルメーカー)の名称を示す語句であって、例えば、世の中に登場したばかりの新しい店舗名を示す語句であるものとする。 Further, the processing unit 132 acquires the character string “unknown term L1 M size store name T1” input as the inflow search query Q200. The "store name T1" is a phrase indicating the name of a specific store (for example, a specific apparel maker), and is, for example, a phrase indicating a new store name that has just appeared in the world.
また、処理部132は、流入検索クエリQ300として入力された文字列「Yシャツ 20代」を取得する。 Further, the processing unit 132 acquires the character string "Y-shirt 20s" input as the inflow search query Q300.
また、処理部132は、流入検索クエリQ400として入力された文字列「Yシャツ 人名M1」を取得する。なお、「人名M1」は、特定の人物(例えば、ファッションモデルや芸能人等)の名称を示す語句であって、例えば、世の中に登場したばかりの新しい人名を示す語句であるものとする。 Further, the processing unit 132 acquires the character string "Y-shirt person name M1" input as the inflow search query Q400. The "personal name M1" is a phrase indicating the name of a specific person (for example, a fashion model, an entertainer, etc.), and is, for example, a phrase indicating a new personal name that has just appeared in the world.
また、処理部132は、流入検索クエリQ500として入力された文字列「未知用語L2 コーデ」を取得する。ここで、「未知用語L2」は、「未知用語L1」と同様、世の中に登場したばかりの新しい用語(例えば、ファッション用語)であって、まだ辞書等に掲載されていない用語であるものとする。 Further, the processing unit 132 acquires the character string "unknown term L2 coordination" input as the inflow search query Q500. Here, it is assumed that the "unknown term L2" is a new term (for example, a fashion term) that has just appeared in the world and has not yet been published in a dictionary or the like, like the "unknown term L1". ..
また、処理部132は、流入検索クエリQ600として入力された文字列「未知用語L2 ブランド名B1 人気」を取得する。なお、「ブランド名B1」は、特定のアパラレルブランドの名称を示す語句であって、例えば、世の中に登場したばかりの新しいブランド名を示す語句であるものとする。 Further, the processing unit 132 acquires the character string "unknown term L2 brand name B1 popularity" input as the inflow search query Q600. The "brand name B1" is a phrase indicating the name of a specific parallel brand, and is, for example, a phrase indicating a new brand name that has just appeared in the world.
続いて、処理部132は、流入検索クエリ群を取得すると、取得した流入検索クエリ群に含まれる各検索クエリとして入力された各文字列から不要な文字列として登録された不要文字列を取り除いた第1文字列を取得する。例えば、処理部132は、不要文字列記憶部122を参照して、不要な文字列として登録された不要文字列のリストを取得する。続いて、処理部132は、取得した不要文字列のリストを参照して、取得した流入検索クエリ群に含まれる各検索クエリとして入力された各文字列の中に不要文字列が含まれるか否かを判定する。続いて、処理部132は、不要文字列が含まれると判定した場合には、検索クエリとして入力された文字列から不要文字列を取り除いた第1文字列を取得する。
Subsequently, when the inflow search query group is acquired, the processing unit 132 removes the unnecessary character string registered as an unnecessary character string from each character string input as each search query included in the acquired inflow search query group. Get the first character string. For example, the processing unit 132 refers to the unnecessary character
例えば、処理部132は、不要文字列のリストを参照して、流入検索クエリQ100として入力された文字列「レディース 未知用語L1」に不要文字列である「レディース」が含まれると判定する。続いて、処理部132は、不要文字列が含まれると判定すると、流入検索クエリQ100として入力された文字列「レディース 未知用語L1」から不要文字列である「レディース」を取り除いた第1文字列「未知用語L1」(第1文字列L1)を取得する。 For example, the processing unit 132 refers to the list of unnecessary character strings, and determines that the character string “ladies unknown term L1” input as the inflow search query Q100 includes the unnecessary character string “ladies”. Subsequently, when the processing unit 132 determines that the unnecessary character string is included, the first character string obtained by removing the unnecessary character string "ladies" from the character string "ladies unknown term L1" input as the inflow search query Q100. Acquire the "unknown term L1" (first character string L1).
また、処理部132は、不要文字列のリストを参照して、流入検索クエリQ200として入力された文字列「未知用語L1 Mサイズ 店舗名T1」に不要文字列である「Mサイズ」が含まれると判定する。続いて、処理部132は、不要文字列が含まれると判定すると、流入検索クエリQ200として入力された文字列「未知用語L1 Mサイズ 店舗名T1」から不要文字列である「Mサイズ」を取り除いた第1文字列「未知用語L1 店舗名T1」(第1文字列L2)を取得する。 Further, the processing unit 132 refers to the list of unnecessary character strings, and the character string "unknown term L1 M size store name T1" input as the inflow search query Q200 includes the unnecessary character string "M size". Is determined. Subsequently, when the processing unit 132 determines that the unnecessary character string is included, the processing unit 132 removes the unnecessary character string "M size" from the character string "unknown term L1 M size store name T1" input as the inflow search query Q200. The first character string "unknown term L1 store name T1" (first character string L2) is acquired.
また、処理部132は、不要文字列のリストを参照して、流入検索クエリQ300として入力された文字列「Yシャツ 20代」に不要文字列である「20代」が含まれると判定する。続いて、処理部132は、不要文字列が含まれると判定すると、流入検索クエリQ300として入力された文字列「Yシャツ 20代」から不要文字列である「20代」を取り除いた第1文字列「Yシャツ」(第1文字列L3)を取得する。
Further, the processing unit 132 refers to the list of unnecessary character strings, and determines that the character string "Y-shirt 20s" input as the inflow search query Q300 includes the unnecessary character string "20s". Subsequently, when the processing unit 132 determines that the unnecessary character string is included, the first character obtained by removing the unnecessary character string "20's" from the character string "Y-
また、処理部132は、不要文字列のリストを参照して、流入検索クエリQ500として入力された文字列「未知用語L2 コーデ」に不要文字列である「コーデ」が含まれると判定する。続いて、処理部132は、不要文字列が含まれると判定すると、流入検索クエリQ500として入力された文字列「未知用語L2 コーデ」から不要文字列である「コーデ」を取り除いた第1文字列「未知用語L2」(第1文字列L5)を取得する。 Further, the processing unit 132 refers to the list of unnecessary character strings, and determines that the character string "unknown term L2 coordination" input as the inflow search query Q500 includes the unnecessary character string "coordination". Subsequently, when the processing unit 132 determines that the unnecessary character string is included, the first character string obtained by removing the unnecessary character string "corde" from the character string "unknown term L2 coordination" input as the inflow search query Q500. Acquire the "unknown term L2" (first character string L5).
また、処理部132は、不要文字列のリストを参照して、流入検索クエリQ600として入力された文字列「未知用語L2 ブランド名B1 人気」に不要文字列である「人気」が含まれると判定する。続いて、処理部132は、不要文字列が含まれると判定すると、流入検索クエリQ600として入力された文字列「未知用語L2 ブランド名B1 人気」から不要文字列である「人気」を取り除いた第1文字列「未知用語L2 ブランド名B1」(第1文字列L6)を取得する。 Further, the processing unit 132 refers to the list of unnecessary character strings, and determines that the character string "unknown term L2 brand name B1 popularity" input as the inflow search query Q600 includes "popularity" which is an unnecessary character string. do. Subsequently, when the processing unit 132 determines that the unnecessary character string is included, the processing unit 132 removes the unnecessary character string "popularity" from the character string "unknown term L2 brand name B1 popularity" input as the inflow search query Q600. Acquire one character string "unknown term L2 brand name B1" (first character string L6).
(推定部133)
推定部133は、取得部131によって取得された第2学習モデルを用いて、検索クエリとして入力された文字列によって示される対象が属するカテゴリを推定する。推定部133は、処理部132によって取得された第1文字列によって示される対象が属するカテゴリを推定する。具体的には、推定部133は、処理部132によって第1文字列が取得されると、モデル情報記憶部124を参照して、第2学習モデル(第2学習モデルM2)を取得する。続いて、推定部133は、第2学習モデルを取得すると、第2学習モデルを用いて、第1文字列によって示される対象が属するカテゴリを推定する。推定部133は、文字列によって示される対象が属する複数のカテゴリを推定する。例えば、推定部133は、第1文字列によって示される対象が属する複数のカテゴリを推定する。
(Estimation unit 133)
The
より具体的には、推定部133は、文字列によって示される対象が各カテゴリに属する確率をカテゴリ毎に出力する。例えば、推定部133は、第1文字列によって示される対象が各カテゴリに属する確率をカテゴリ毎に出力する。例えば、推定部133は、第2学習モデルM2の入力情報として第1文字列を入力することにより、第2学習モデルM2の出力情報として第1文字列によって示される対象が各カテゴリに属する確率をカテゴリ毎に出力する。
More specifically, the
図1の真ん中に示す例では、推定部133は、第1文字列L1を取得すると、第2学習モデルM2の入力情報として第1文字列L1を入力することにより、第2学習モデルM2の出力情報として第1文字列L1によって示される対象が各カテゴリに属する確率をカテゴリ毎に出力する。例えば、推定部133は、第1文字列L1によって示される対象がファッションに関するカテゴリC1(以下、ファッションカテゴリC1ともいう)に属する確率を100パーセント、その他のカテゴリに属する確率を0%と出力する。
In the example shown in the middle of FIG. 1, when the
また、推定部133は、第1文字列L2を取得すると、第2学習モデルM2の入力情報として第1文字列L2を入力することにより、第2学習モデルM2の出力情報として第1文字列L2によって示される対象が各カテゴリに属する確率をカテゴリ毎に出力する。例えば、推定部133は、第1文字列L2によって示される対象がファッションカテゴリC1に属する確率を70パーセント、店舗名に関するカテゴリC4に属する確率を30パーセント、その他のカテゴリに属する確率を0%と出力する。
Further, when the
また、推定部133は、第1文字列L3を取得すると、第2学習モデルM2の入力情報として第1文字列L3を入力することにより、第2学習モデルM2の出力情報として第1文字列L3によって示される対象が各カテゴリに属する確率をカテゴリ毎に出力する。例えば、推定部133は、第1文字列L3によって示される対象がファッションカテゴリC1に属する確率を100パーセント、その他のカテゴリに属する確率を0%と出力する。
Further, when the
また、推定部133は、第1文字列L4を取得すると、第2学習モデルM2の入力情報として第1文字列L4を入力することにより、第2学習モデルM2の出力情報として第1文字列L4によって示される対象が各カテゴリに属する確率をカテゴリ毎に出力する。例えば、推定部133は、第1文字列L4によって示される対象がファッションカテゴリC1に属する確率を50パーセント、人名に関するカテゴリC2に属する確率を50パーセント、その他のカテゴリに属する確率を0%と出力する。
Further, when the
また、推定部133は、第1文字列L5を取得すると、第2学習モデルM2の入力情報として第1文字列L5を入力することにより、第2学習モデルM2の出力情報として第1文字列L5によって示される対象が各カテゴリに属する確率をカテゴリ毎に出力する。例えば、推定部133は、第1文字列L5によって示される対象がファッションカテゴリC1に属する確率を100パーセント、その他のカテゴリに属する確率を0%と出力する。
Further, when the
また、推定部133は、第1文字列L6を取得すると、第2学習モデルM2の入力情報として第1文字列L6を入力することにより、第2学習モデルM2の出力情報として第1文字列L6によって示される対象が各カテゴリに属する確率をカテゴリ毎に出力する。例えば、推定部133は、第1文字列L6によって示される対象がファッションカテゴリC1に属する確率を60パーセント、ブランド名に関するカテゴリC3に属する確率を40パーセント、その他のカテゴリに属する確率を0%と出力する。
Further, when the
(抽出部134)
抽出部134は、推定部133によって推定されたカテゴリに基づいて、文字列の中から、対象分野に属する抽出対象を示す対象文字列を抽出する。具体的には、抽出部134は、推定部133によって推定されたカテゴリの中に、対象分野を示すカテゴリを含む文字列を対象文字列として抽出する。例えば、抽出部134は、推定部133によって第1文字列によって示される対象が属するカテゴリが推定されると、推定部133によって推定されたカテゴリの中に、対象分野を示すカテゴリが含まれるか否かを第1文字列毎に判定する。続いて、抽出部134は、推定部133によって推定されたカテゴリの中に、対象分野を示すカテゴリが含まれると判定した場合、その第1文字列を抽出する。すなわち、抽出部134は、対象分野を示すカテゴリに属する対象を示す第1文字列を抽出する。
(Extraction unit 134)
The extraction unit 134 extracts a target character string indicating an extraction target belonging to the target field from the character string based on the category estimated by the
また、抽出部134は、推定部133によって推定されたカテゴリの中に、不要なカテゴリとして登録された不要カテゴリを含まない文字列を対象文字列として抽出する。例えば、抽出部134は、不要カテゴリ記憶部123を参照して、不要なカテゴリとして登録された不要カテゴリのリストを取得する。続いて、抽出部134は、対象分野を示すカテゴリが含まれる第1文字列を抽出すると、取得した不要カテゴリのリストを参照して、推定部133によって推定されたカテゴリの中に、不要なカテゴリとして登録された不要カテゴリが含まれるか否かを抽出した第1文字列毎に判定する。続いて、抽出部134は、推定部133によって推定されたカテゴリの中に、不要カテゴリが含まれないと判定した場合、その第1文字列を対象文字列として抽出する。すなわち、抽出部134は、不要カテゴリに属する対象を示す第1文字列以外の第1文字列を対象文字列として抽出する。
Further, the extraction unit 134 extracts a character string that does not include the unnecessary category registered as an unnecessary category from the categories estimated by the
図1の右側に示す例では、情報処理装置100は、第1文字列の中から、第1文字列「未知用語L1」(第1文字列L1)を対象文字列W1として抽出する。また、情報処理装置100は、第1文字列の中から、第1文字列「Yシャツ」(第1文字列L3)を対象文字列W2として抽出する。また、情報処理装置100は、第1文字列の中から、第1文字列「未知用語L2」(第1文字列L5)を対象文字列W3として抽出する。
In the example shown on the right side of FIG. 1, the
具体的には、抽出部134は、推定部133によって第1文字列L1について推定されたカテゴリの中に、対象分野であるファッションカテゴリC1が含まれるか否かを判定する。抽出部134は、第1文字列L1について推定されたカテゴリの中に、対象分野であるファッションカテゴリC1が含まれると判定する。続いて、抽出部134は、ファッションカテゴリC1が含まれると判定したので、第1文字列L1について推定されたカテゴリの中に、不要カテゴリを含むか否かを判定する。続いて、抽出部134は、第1文字列L1について推定されたカテゴリの中に、不要カテゴリを含まないと判定する。続いて、抽出部134は、不要カテゴリを含まないと判定したので、第1文字列L1を対象文字列W1として抽出する。
Specifically, the extraction unit 134 determines whether or not the fashion category C1 which is the target field is included in the category estimated for the first character string L1 by the
また、抽出部134は、推定部133によって第1文字列L2について推定されたカテゴリの中に、対象分野であるファッションカテゴリC1が含まれるか否かを判定する。抽出部134は、第1文字列L2について推定されたカテゴリの中に、対象分野であるファッションカテゴリC1が含まれると判定する。続いて、抽出部134は、ファッションカテゴリC1が含まれると判定したので、第1文字列L2について推定されたカテゴリの中に、不要カテゴリを含むか否かを判定する。続いて、抽出部134は、第1文字列L2について推定されたカテゴリの中に、不要カテゴリである店舗名に関するカテゴリC3を含むと判定する。続いて、抽出部134は、不要カテゴリを含むと判定したので、第1文字列L2を対象文字列として抽出しないことを決定する。
Further, the extraction unit 134 determines whether or not the fashion category C1 which is the target field is included in the category estimated for the first character string L2 by the
また、抽出部134は、推定部133によって第1文字列L3について推定されたカテゴリの中に、対象分野であるファッションカテゴリC1が含まれるか否かを判定する。抽出部134は、第1文字列L3について推定されたカテゴリの中に、対象分野であるファッションカテゴリC1が含まれると判定する。続いて、抽出部134は、ファッションカテゴリC1が含まれると判定したので、第1文字列L3について推定されたカテゴリの中に、不要カテゴリを含むか否かを判定する。続いて、抽出部134は、第1文字列L3について推定されたカテゴリの中に、不要カテゴリを含まないと判定する。続いて、抽出部134は、不要カテゴリを含まないと判定したので、第1文字列L3を対象文字列W2として抽出する。
Further, the extraction unit 134 determines whether or not the fashion category C1 which is the target field is included in the category estimated for the first character string L3 by the
また、抽出部134は、推定部133によって第1文字列L4について推定されたカテゴリの中に、対象分野であるファッションカテゴリC1が含まれるか否かを判定する。抽出部134は、第1文字列L4について推定されたカテゴリの中に、対象分野であるファッションカテゴリC1が含まれると判定する。続いて、抽出部134は、ファッションカテゴリC1が含まれると判定したので、第1文字列L4について推定されたカテゴリの中に、不要カテゴリを含むか否かを判定する。続いて、抽出部134は、第1文字列L4について推定されたカテゴリの中に、不要カテゴリである人名に関するカテゴリC2を含むと判定する。続いて、抽出部134は、不要カテゴリを含むと判定したので、第1文字列L4を対象文字列として抽出しないことを決定する。
Further, the extraction unit 134 determines whether or not the fashion category C1 which is the target field is included in the category estimated for the first character string L4 by the
また、抽出部134は、推定部133によって第1文字列L5について推定されたカテゴリの中に、対象分野であるファッションカテゴリC1が含まれるか否かを判定する。抽出部134は、第1文字列L5について推定されたカテゴリの中に、対象分野であるファッションカテゴリC1が含まれると判定する。続いて、抽出部134は、ファッションカテゴリC1が含まれると判定したので、第1文字列L5について推定されたカテゴリの中に、不要カテゴリを含むか否かを判定する。続いて、抽出部134は、第1文字列L5について推定されたカテゴリの中に、不要カテゴリを含まないと判定する。続いて、抽出部134は、不要カテゴリを含まないと判定したので、第1文字列L5を対象文字列W3として抽出する。
Further, the extraction unit 134 determines whether or not the fashion category C1 which is the target field is included in the category estimated for the first character string L5 by the
また、抽出部134は、推定部133によって第1文字列L6について推定されたカテゴリの中に、対象分野であるファッションカテゴリC1が含まれるか否かを判定する。抽出部134は、第1文字列L6について推定されたカテゴリの中に、対象分野であるファッションカテゴリC1が含まれると判定する。続いて、抽出部134は、ファッションカテゴリC1が含まれると判定したので、第1文字列L6について推定されたカテゴリの中に、不要カテゴリを含むか否かを判定する。続いて、抽出部134は、第1文字列L6について推定されたカテゴリの中に、不要カテゴリであるブランド名に関するカテゴリC3を含むと判定する。続いて、抽出部134は、不要カテゴリを含むと判定したので、第1文字列L6を対象文字列として抽出しないことを決定する。
Further, the extraction unit 134 determines whether or not the fashion category C1 which is the target field is included in the category estimated for the first character string L6 by the
次に、図8を用いて、実施形態に係る情報処理の一例についてより詳しく説明する。図8は、実施形態に係る情報処理の一例を示す図である。図8に示す例では、処理部132は、クエリ情報記憶部121を参照して、ファッション系サイトに流入した検索クエリとして入力された文字列を取得する(ステップS1´)。
Next, an example of information processing according to the embodiment will be described in more detail with reference to FIG. FIG. 8 is a diagram showing an example of information processing according to the embodiment. In the example shown in FIG. 8, the processing unit 132 refers to the query
例えば、処理部132は、検索クエリQ1として入力された文字列「サイト名N1 コサッシュ」を取得する。また、処理部132は、検索クエリQ2として入力された文字列「サイト名N2 コサッシュ 人名M1」を取得する。また、処理部132は、検索クエリQ3として入力された文字列「花柄サーマル レディース」を取得する。また、処理部132は、検索クエリQ4として入力された文字列「花柄サーマル 人気 ブランド名B1」を取得する。また、処理部132は、検索クエリQ5として入力された文字列「花柄サーマル コーデ 店舗名T1」を取得する。また、処理部132は、検索クエリQ6として入力された文字列「マニデニム Mサイズ」を取得する。また、処理部132は、検索クエリQ7として入力された文字列「マニデニム Lサイズ ブランド名B2」を取得する。また、処理部132は、検索クエリQ8として入力された文字列「抜け襟 20代」を取得する。また、処理部132は、検索クエリQ9として入力された文字列「抜け襟 30代 人名M2」を取得する。 For example, the processing unit 132 acquires the character string “site name N1 cosash” input as the search query Q1. Further, the processing unit 132 acquires the character string "site name N2 Kosash person name M1" input as the search query Q2. Further, the processing unit 132 acquires the character string "floral pattern thermal ladies" input as the search query Q3. Further, the processing unit 132 acquires the character string "floral pattern thermal popular brand name B1" input as the search query Q4. Further, the processing unit 132 acquires the character string "floral pattern thermal coordination store name T1" input as the search query Q5. Further, the processing unit 132 acquires the character string "mani-denim M size" input as the search query Q6. Further, the processing unit 132 acquires the character string "manidenim L size brand name B2" input as the search query Q7. In addition, the processing unit 132 acquires the character string "missing collar 20s" input as the search query Q8. Further, the processing unit 132 acquires the character string “missing collar 30s person name M2” input as the search query Q9.
続いて、処理部132は、流入検索クエリを取得すると、不要文字列記憶部122を参照して、取得した流入検索クエリ群に含まれる各検索クエリとして入力された各文字列から不要な文字列として登録された不要文字列を取り除いた第1文字列を取得する。具体的には、処理部132は、図8のステップS1´の下段に示すテーブル121Aを記憶部120に一時的に記憶する。
Subsequently, when the processing unit 132 acquires the inflow search query, the processing unit 132 refers to the unnecessary character
例えば、処理部132は、検索クエリQ1として入力された文字列「サイト名N1 コサッシュ」から不要文字列「サイト名N1」(不要文字列UL11)を取り除いた第1文字列「コサッシュ」(第1文字列L11)を取得する。また、処理部132は、検索クエリQ2として入力された文字列「サイト名N2 コサッシュ 人名M1」から不要文字列「サイト名N2」(不要文字列UL12)を取り除いた第1文字列「コサッシュ 人名M1」(第1文字列L12)を取得する。また、処理部132は、検索クエリQ3として入力された文字列「花柄サーマル レディース」から不要文字列「レディース」(不要文字列UL21)を取り除いた第1文字列「花柄サーマル」(第1文字列L13)を取得する。また、処理部142は、検索クエリQ4として入力された文字列「花柄サーマル 人気 ブランド名B1」から不要文字列「人気」(不要文字列UL22)を取り除いた第1文字列「花柄サーマル ブランド名B1」(第1文字列L14)を取得する。また、処理部152は、検索クエリQ5として入力された文字列「花柄サーマル コーデ 店舗名T1」から不要文字列「コーデ」(不要文字列UL23)を取り除いた第1文字列「花柄サーマル 店舗名T1」(第1文字列L15)を取得する。また、処理部162は、検索クエリQ6として入力された文字列「マニデニム Mサイズ」から不要文字列「Mサイズ」(不要文字列UL31)を取り除いた第1文字列「マニデニム」(第1文字列L16)を取得する。また、処理部172は、検索クエリQ7として入力された文字列「マニデニム Lサイズ ブランド名B2」から不要文字列「Lサイズ」(不要文字列UL32)を取り除いた第1文字列「マニデニム ブランド名B2」(第1文字列L17)を取得する。また、処理部182は、検索クエリQ8として入力された文字列「抜け襟 20代」から不要文字列「20代」(不要文字列UL41)を取り除いた第1文字列「抜け襟」(第1文字列L18)を取得する。また、処理部192は、検索クエリQ9として入力された文字列「抜け襟 30代 人名M2」から不要文字列「30代」(不要文字列UL42)を取り除いた第1文字列「抜け襟 人名M2」(第1文字列L19)を取得する。 For example, the processing unit 132 removes the unnecessary character string "site name N1" (unnecessary character string UL11) from the character string "site name N1 cosash" input as the search query Q1, and removes the first character string "cosash" (first). The character string L11) is acquired. Further, the processing unit 132 removes the unnecessary character string "site name N2" (unnecessary character string UL12) from the character string "site name N2 Kosash person name M1" input as the search query Q2, and removes the first character string "Kosash person name M1". "(First character string L12) is acquired. Further, the processing unit 132 removes the unnecessary character string "ladies" (unnecessary character string UL21) from the character string "floral pattern thermal ladies" input as the search query Q3, and removes the first character string "floral pattern thermal" (first). The character string L13) is acquired. In addition, the processing unit 142 removes the unnecessary character string "popular" (unnecessary character string UL22) from the character string "flower pattern thermal popular brand name B1" input as the search query Q4, and removes the first character string "flower pattern thermal brand". First name B1 ”(first character string L14) is acquired. In addition, the processing unit 152 removes the unnecessary character string "coordination" (unnecessary character string UL23) from the character string "flower pattern thermal coordination store name T1" input as the search query Q5, and removes the first character string "flower pattern thermal coordination store". First name T1 ”(first character string L15) is acquired. Further, the processing unit 162 removes the unnecessary character string "M size" (unnecessary character string UL31) from the character string "mani denim M size" input as the search query Q6, and removes the first character string "mani denim" (first character string). L16) is acquired. Further, the processing unit 172 removes the unnecessary character string "L size" (unnecessary character string UL32) from the character string "mani denim L size brand name B2" input as the search query Q7, and removes the first character string "mani denim brand name B2". "(First character string L17) is acquired. Further, the processing unit 182 removes the unnecessary character string "20s" (unnecessary character string UL41) from the character string "missing collar 20s" input as the search query Q8, and removes the first character string "missing collar" (first). The character string L18) is acquired. In addition, the processing unit 192 removes the unnecessary character string "30s" (unnecessary character string UL42) from the character string "missing collar 30s person name M2" input as the search query Q9, and removes the first character string "missing collar person name M2". "(First character string L19) is acquired.
続いて、推定部133は、処理部132によって第1文字列が取得されると、モデル情報記憶部124を参照して、第2学習モデル(第2学習モデルM2)を取得する。続いて、推定部133は、第2学習モデルを取得すると、第2学習モデルを用いて、第1文字列によって示される対象が各カテゴリに属する確率をカテゴリ毎に出力する。図8に示す例では、推定部133は、第2学習モデルM2の入力情報として第1文字列を入力することにより、第2学習モデルM2の出力情報として第1文字列によって示される対象が各カテゴリに属する確率をカテゴリ毎に出力する(ステップS2´)。具体的には、推定部133は、図8のステップS2´に示すテーブル121Bの情報を記憶部120に一時的に記憶する。
Subsequently, when the first character string is acquired by the processing unit 132, the
例えば、推定部133は、第2学習モデルM2の入力情報として第1文字列「コサッシュ」(第1文字列L11)を入力することにより、第2学習モデルM2の出力情報として第1文字列L11によって示される対象がファッションカテゴリC1に属する確率を100パーセント、その他のカテゴリに属する確率を0%と出力する。
For example, the
また、推定部133は、第2学習モデルM2の入力情報として第1文字列「コサッシュ 人名M1」(第1文字列L12)を入力することにより、第2学習モデルM2の出力情報として第1文字列L12によって示される対象がファッションカテゴリC1に属する確率を50パーセント、人名に関するカテゴリC2に属する確率を50パーセント、その他のカテゴリに属する確率を0%と出力する。
Further, the
また、推定部133は、第2学習モデルM2の入力情報として第1文字列「花柄サーマル」(第1文字列L13)を入力することにより、第2学習モデルM2の出力情報として第1文字列L13によって示される対象がファッションカテゴリC1に属する確率を100パーセント、その他のカテゴリに属する確率を0%と出力する。
Further, the
また、推定部133は、第2学習モデルM2の入力情報として第1文字列「花柄サーマル ブランド名B1」(第1文字列L14)を入力することにより、第2学習モデルM2の出力情報として第1文字列L14によって示される対象がファッションカテゴリC1に属する確率を60パーセント、ブランド名に関するカテゴリC3に属する確率を40パーセント、その他のカテゴリに属する確率を0%と出力する。
Further, the
また、推定部133は、第2学習モデルM2の入力情報として第1文字列「花柄サーマル 店舗名T1」(第1文字列L15)を入力することにより、第2学習モデルM2の出力情報として第1文字列L15によって示される対象がファッションカテゴリC1に属する確率を70パーセント、店舗名に関するカテゴリC4に属する確率を30パーセント、その他のカテゴリに属する確率を0%と出力する。
Further, the
また、推定部133は、第2学習モデルM2の入力情報として第1文字列「マニデニム」(第1文字列L16)を入力することにより、第2学習モデルM2の出力情報として第1文字列L16によって示される対象がファッションカテゴリC1に属する確率を100パーセント、その他のカテゴリに属する確率を0%と出力する。
Further, the
また、推定部133は、第2学習モデルM2の入力情報として第1文字列「マニデニム ブランド名B2」(第1文字列L17)を入力することにより、第2学習モデルM2の出力情報として第1文字列L17によって示される対象がファッションカテゴリC1に属する確率を50パーセント、ブランド名に関するカテゴリC3に属する確率を50パーセント、その他のカテゴリに属する確率を0%と出力する。
Further, the
また、推定部133は、第2学習モデルM2の入力情報として第1文字列「抜け襟」(第1文字列L18)を入力することにより、第2学習モデルM2の出力情報として第1文字列L18によって示される対象がファッションカテゴリC1に属する確率を100パーセント、その他のカテゴリに属する確率を0%と出力する。
Further, the
また、推定部133は、第2学習モデルM2の入力情報として第1文字列「抜け襟 人名M2」(第1文字列L19)を入力することにより、第2学習モデルM2の出力情報として第1文字列L19によって示される対象がファッションカテゴリC1に属する確率を80パーセント、人名に関するカテゴリC2に属する確率を20パーセント、その他のカテゴリに属する確率を0%と出力する。
Further, the
続いて、抽出部134は、推定部133によって第1文字列によって示される対象が各カテゴリに属する確率をカテゴリ毎に出力すると、推定部133によって推定されたカテゴリの中に、対象分野を示すカテゴリが含まれる第1文字列を抽出する。すなわち、抽出部134は、対象分野を示すカテゴリに属する対象を示す第1文字列を抽出する。続いて、抽出部134は、対象分野を示すカテゴリが含まれる第1文字列を抽出すると、不要カテゴリ記憶部123を参照して、推定部133によって推定されたカテゴリの中に、不要カテゴリが含まれない第1文字列を対象文字列として抽出する。すなわち、抽出部134は、不要カテゴリに属する対象を示す第1文字列以外の第1文字列を対象文字列(第2文字列ともいう)として抽出する(ステップS3´)。具体的には、推定部133は、図8のステップS3´に示すテーブル121Cの情報を記憶部120に記憶する。
Subsequently, when the extraction unit 134 outputs the probability that the object indicated by the first character string belongs to each category by the
例えば、抽出部134は、第1文字列「コサッシュ」(第1文字列L11)について推定されたカテゴリの中に、対象分野を示すファッションカテゴリC1が含まれており、かつ、不要カテゴリが含まれないので、第1文字列「コサッシュ」(第1文字列L11)を第2文字列W21として抽出する。 For example, the extraction unit 134 includes the fashion category C1 indicating the target field in the category estimated for the first character string “Cosash” (first character string L11), and also includes an unnecessary category. Since there is no such thing, the first character string "Cosash" (first character string L11) is extracted as the second character string W21.
また、抽出部134は、第1文字列「コサッシュ 人名M1」(第1文字列L12)について推定されたカテゴリの中にはファッションカテゴリC1が含まれるが、不要カテゴリである人名に関するカテゴリC2が含まれるので、第1文字列「コサッシュ 人名M1」(第1文字列L12)を第2文字列として抽出しないことを決定する。 Further, the extraction unit 134 includes the fashion category C1 in the category estimated for the first character string "Kosash person name M1" (first character string L12), but includes the category C2 for the person name which is an unnecessary category. Therefore, it is determined not to extract the first character string "Kosash person name M1" (first character string L12) as the second character string.
また、抽出部134は、第1文字列「花柄サーマル」(第1文字列L13)について推定されたカテゴリの中に、対象分野を示すファッションカテゴリC1が含まれており、かつ、不要カテゴリが含まれないので、第1文字列「花柄サーマル」(第1文字列L13)を第2文字列W22として抽出する。 Further, the extraction unit 134 includes the fashion category C1 indicating the target field in the category estimated for the first character string "flower pattern thermal" (first character string L13), and the unnecessary category is included. Since it is not included, the first character string "flower pattern thermal" (first character string L13) is extracted as the second character string W22.
また、抽出部134は、第1文字列「花柄サーマル ブランド名B1」(第1文字列L14)について推定されたカテゴリの中にはファッションカテゴリC1が含まれるが、不要カテゴリであるブランド名に関するカテゴリC3が含まれるので、第1文字列「花柄サーマル ブランド名B1」(第1文字列L14)を第2文字列として抽出しないことを決定する。 Further, the extraction unit 134 includes the fashion category C1 in the category estimated for the first character string "flower pattern thermal brand name B1" (first character string L14), but relates to a brand name which is an unnecessary category. Since the category C3 is included, it is determined not to extract the first character string "flower pattern thermal brand name B1" (first character string L14) as the second character string.
また、抽出部134は、第1文字列「花柄サーマル 店舗名T1」(第1文字列L15)について推定されたカテゴリの中にはファッションカテゴリC1が含まれるが、不要カテゴリである店舗名に関するカテゴリC4が含まれるので、第1文字列「花柄サーマル 店舗名T1」(第1文字列L15)を第2文字列として抽出しないことを決定する。 Further, the extraction unit 134 includes the fashion category C1 in the category estimated for the first character string "flower pattern thermal store name T1" (first character string L15), but relates to the store name which is an unnecessary category. Since the category C4 is included, it is determined not to extract the first character string "flower pattern thermal store name T1" (first character string L15) as the second character string.
また、抽出部134は、第1文字列「マニデニム」(第1文字列L16)について推定されたカテゴリの中に、対象分野を示すファッションカテゴリC1が含まれており、かつ、不要カテゴリが含まれないので、第1文字列「マニデニム」(第1文字列L16)を第2文字列W23として抽出する。 Further, the extraction unit 134 includes the fashion category C1 indicating the target field in the category estimated for the first character string "mani denim" (first character string L16), and also includes an unnecessary category. Since there is no such thing, the first character string "mani denim" (first character string L16) is extracted as the second character string W23.
また、抽出部134は、第1文字列「マニデニム ブランド名B2」(第1文字列L17)について推定されたカテゴリの中にはファッションカテゴリC1が含まれるが、不要カテゴリであるブランド名に関するカテゴリC3が含まれるので、第1文字列「マニデニム ブランド名B2」(第1文字列L17)を第2文字列として抽出しないことを決定する。 Further, the extraction unit 134 includes the fashion category C1 in the category estimated for the first character string "mani denim brand name B2" (first character string L17), but the category C3 regarding the brand name which is an unnecessary category. Is included, so it is determined not to extract the first character string "manidenim brand name B2" (first character string L17) as the second character string.
また、抽出部134は、第1文字列「抜け襟」(第1文字列L18)について推定されたカテゴリの中に、対象分野を示すファッションカテゴリC1が含まれており、かつ、不要カテゴリが含まれないので、第1文字列「抜け襟」(第1文字列L18)を第2文字列W24として抽出する。 Further, the extraction unit 134 includes the fashion category C1 indicating the target field in the category estimated for the first character string "missing collar" (first character string L18), and also includes an unnecessary category. Therefore, the first character string "missing collar" (first character string L18) is extracted as the second character string W24.
また、抽出部134は、第1文字列「抜け襟 人名M2」(第1文字列L19)について推定されたカテゴリの中にはファッションカテゴリC1が含まれるが、不要カテゴリである人名に関するカテゴリC2が含まれるので、第1文字列「抜け襟 人名M2」(第1文字列L19)を第2文字列として抽出しないことを決定する。 Further, the extraction unit 134 includes the fashion category C1 in the category estimated for the first character string "missing collar person name M2" (first character string L19), but the category C2 relating to the person name which is an unnecessary category is included. Since it is included, it is determined not to extract the first character string "missing collar person name M2" (first character string L19) as the second character string.
〔1−3.情報処理のフロー〕
次に、図9を用いて、実施形態に係る情報処理の手順について説明する。図9は、実施形態に係る情報処理手順を示すフローチャートである。図9に示す例では、情報処理装置100は、対象分野に関するサイトに流入した検索クエリを取得する(ステップS101)。続いて、情報処理装置100は、対象分野に関するサイトに流入した検索クエリを取得すると、検索クエリとして入力された文字列から不要文字列を取り除いた第1文字列を取得する(ステップS102)。続いて、情報処理装置100は、第1文字列を取得すると、第2学習モデルを用いて、第1文字列によって示される対象が属するカテゴリを推定する(ステップS103)。続いて、情報処理装置100は、カテゴリを推定すると、推定したカテゴリに基づいて、第1文字列の中から抽出対象を示す第2文字列を抽出する(ステップS104)。
[1-3. Information processing flow]
Next, the procedure of information processing according to the embodiment will be described with reference to FIG. FIG. 9 is a flowchart showing an information processing procedure according to the embodiment. In the example shown in FIG. 9, the
〔2.学習モデルの生成処理〕
〔2−1.第1学習モデルの生成処理〕
次に、図10を用いて、第1学習モデルの生成処理の流れについて説明する。図10は、実施形態に係る第1学習モデルの生成処理の一例を示す図である。図10に示す例では、生成装置50は、同一のユーザU1によって所定の時間内に連続して入力された「六本木 パスタ」という検索クエリQ11と「六本木 イタリアン」という検索クエリQ12とから成る一対の検索クエリを抽出する(ステップS11)。
[2. Learning model generation process]
[2-1. First learning model generation process]
Next, the flow of the generation process of the first learning model will be described with reference to FIG. FIG. 10 is a diagram showing an example of a generation process of the first learning model according to the embodiment. In the example shown in FIG. 10, the
続いて、生成装置50は、抽出した検索クエリQ11を第1モデルM1に入力して、検索クエリQ11の分散表現であるベクトルBQV11を出力する。ここで、ベクトルBQV11は、第1モデルM1の出力層から出力されたばかりの検索クエリQ11の分散表現であって、第1モデルM1にフィードバックをかける前(学習前)の分散表現を示す。また、生成装置50は、抽出した検索クエリQ12を第1モデルM1に入力して、検索クエリQ12の分散表現であるベクトルBQV12を出力する。ここで、ベクトルBQV12は、第1モデルM1の出力層から出力されたばかりの検索クエリQ12の分散表現であって、第1モデルM1にフィードバックをかける前(学習前)の分散表現を示す。このようにして、生成装置50は、検索クエリQ11の分散表現であるベクトルBQV11と、検索クエリQ12の分散表現であるベクトルBQV12とを出力する(ステップS12)。
Subsequently, the
続いて、生成装置50は、同一のユーザU1によって所定の時間内に連続して入力された検索クエリQ11(「六本木 パスタ」)と検索クエリQ12(「六本木 イタリアン」)とから成る一対の検索クエリは、所定の検索意図(例えば、「ある場所で飲食店を探す」という検索意図)で入力された検索クエリであると推定されるため、相互に類似する特徴を有するものとして、検索クエリQ11の分散表現(ベクトルQV11)と、検索クエリQ11と対となる検索クエリQ12の分散表現(ベクトルQV12)とが、分散表現空間上で類似するように第1モデルM1を学習させる。例えば、第1モデルM1にフィードバックをかける前(学習前)の検索クエリQ11の分散表現であるベクトルBQV11と検索クエリQ12の分散表現であるベクトルBQV12とのなす角度の大きさをΘとする。また、第1モデルM1にフィードバックをかけた後(学習後)の検索クエリQ11の分散表現であるベクトルQV11と検索クエリQ12の分散表現であるベクトルQV12とのなす角度の大きさをΦとする。この時、生成装置50は、ΘよりもΦが小さくなるように、第1モデルM1を学習させる。例えば、生成装置50は、ベクトルBQV11とベクトルBQV12のコサイン類似度の値を算出する。また、生成装置50は、ベクトルQV11とベクトルQV12のコサイン類似度の値を算出する。続いて、生成装置50は、ベクトルBQV11とベクトルBQV12のコサイン類似度の値よりも、ベクトルQV11とベクトルQV12のコサイン類似度の値が大きくなるように(値が1に近づくように)第1モデルM1を学習させる。このように、生成装置50は、一対の検索クエリに対応する一対の分散表現である2つのベクトルが分散表現空間上で類似するように第1モデルM1を学習させることで、検索クエリから分散表現を出力する第1モデルM1を生成する(ステップS13)。なお、生成装置50は、コサイン類似度に限らず、ベクトル間の距離尺度として適用可能な指標であれば、どのような指標に基づいて分散表現の間の類似度を算出してもよい。また、生成装置50は、ベクトル間の距離尺度として適用可能な指標であれば、どのような指標に基づいて第1モデルM1を学習させてもよい。例えば、生成装置50は、分散表現同士のユークリッド距離や双曲空間等の非ユークリッド空間中での距離、マンハッタン距離、マハラノビス距離等といった所定の距離関数の値を算出する。続いて、生成装置50は、分散表現同士の所定の距離関数の値(すなわち、分散表現空間における距離)が小さくなるように第1モデルM1を学習させてもよい。
Subsequently, the
次に、図11を用いて、第1学習モデルの生成処理の流れについてより詳しく説明する。なお、図11の説明では、図10の説明と重複する部分は、適宜省略する。図11は、実施形態に係る第1学習モデルの生成処理を示す図である。図11に示す例では、生成装置50が生成した第1モデルM1によって出力された分散表現が分散表現空間にマッピングされる様子が示されている。生成装置50は、所定の検索クエリの分散表現と所定の検索クエリと対となる他の検索クエリの分散表現とが分散表現空間上で近くにマッピングされるように第1モデルM1のトレーニングを行う。
Next, the flow of the generation process of the first learning model will be described in more detail with reference to FIG. In the description of FIG. 11, a part that overlaps with the description of FIG. 10 will be omitted as appropriate. FIG. 11 is a diagram showing a generation process of the first learning model according to the embodiment. In the example shown in FIG. 11, the distributed representation output by the first model M1 generated by the
図11の上段に示す例では、生成装置50は、同一のユーザU1によって所定の時間内に連続して入力された4個の検索クエリである検索クエリQ11(「六本木 パスタ」)、検索クエリQ12(「六本木 イタリアン」)、検索クエリQ13(「赤坂 パスタ」)、検索クエリQ14(「麻布 パスタ」)を抽出する。生成装置50は、同一のユーザU1によって各検索クエリが入力された時間の間隔が所定の時間内である4個の検索クエリを抽出する。生成装置50は、同一のユーザU1によって後述する各検索クエリのペアが入力された時間の間隔が所定の時間内である複数の検索クエリを抽出する。生成装置50は、検索クエリが入力された順番に並べると、検索クエリQ11、検索クエリQ12、検索クエリQ13、検索クエリQ14の順番で入力された4個の検索クエリを抽出する。生成装置50は、4個の検索クエリを抽出すると、時系列的に隣り合う2つの検索クエリを一対の検索クエリとして、3対の検索クエリのペアである(検索クエリQ11、検索クエリQ12)、(検索クエリQ12、検索クエリQ13)、(検索クエリQ13、検索クエリQ14)を抽出する(ステップS21−1)。なお、生成装置50は、同一のユーザU1によって全ての検索クエリが所定の時間内に入力された複数の検索クエリを抽出してもよい。そして、生成装置50は、時系列的に隣り合うか否かに関わらず、抽出した複数の検索クエリの中から2つの検索クエリを選択して、選択した2つの検索クエリを一対の検索クエリとして抽出してもよい。
In the example shown in the upper part of FIG. 11, the
続いて、生成装置50は、抽出した検索クエリQ1k(k=1、2、3、4)を第1モデルM1に入力して、検索クエリQ1k(k=1、2、3、4)の分散表現であるベクトルBQV1k(k=1、2、3、4)を出力する。ここで、ベクトルBQV1k(k=1、2、3、4)は、第1モデルM1の出力層から出力されたばかりの検索クエリQ1k(k=1、2、3、4)の分散表現であって、第1モデルM1にフィードバックをかける前(学習前)の分散表現を示す(ステップS22−1)。
Subsequently, the
続いて、生成装置50は、同一のユーザU1によって所定の時間内に連続して入力された一対の検索クエリは、所定の検索意図(例えば、「ある場所(東京都港区付近)で飲食店を探す」という検索意図)で入力された検索クエリであると推定されるため、相互に類似する特徴を有するものとして、検索クエリQ11の分散表現(ベクトルQV11)と、検索クエリQ11と対となる検索クエリQ12の分散表現(ベクトルQV12)とが、分散表現空間上で類似するように第1モデルM1を学習させる。また、生成装置50は、検索クエリQ12の分散表現(ベクトルQV12)と、検索クエリQ12と対となる検索クエリQ13の分散表現(ベクトルQV13)とが、分散表現空間上で類似するように第1モデルM1を学習させる。また、生成装置50は、検索クエリQ13の分散表現(ベクトルQV13)と、検索クエリQ13と対となる検索クエリQ14の分散表現(ベクトルQV14)とが、分散表現空間上で類似するように第1モデルM1を学習させる。このように、生成装置50は、一対の検索クエリに対応する一対の分散表現である2つのベクトルが分散表現空間上で類似するように第1モデルM1を学習させることで、検索クエリから分散表現を出力する第1モデルM1を生成する(ステップS23−1)。
Subsequently, in the
図11の上段に示す情報処理の結果として、検索クエリQ1k(k=1、2、3、4)の分散表現であるベクトルQV1k(k=1、2、3、4)が分散表現空間の近い位置にクラスタCL11としてマッピングされる様子が示されている。例えば、検索クエリQ1k(k=1、2、3、4)は、ユーザU1によって「ある場所(東京都港区付近)で飲食店を探す」という検索意図の下で検索された検索クエリの集合であると推定される。すなわち、検索クエリQ1k(k=1、2、3、4)は、「ある場所(東京都港区付近)で飲食店を探す」という検索意図の下で検索された検索クエリであるという点で、相互に類似する特徴を有する検索クエリであると推定される。ここで、生成装置50は、「ある場所(東京都港区付近)で飲食店を探す」という検索意図で入力された所定の検索クエリが第1モデルに入力されると、クラスタCL11の位置にマッピングされるような分散表現を出力することができる。これにより、例えば、生成装置50は、クラスタCL11の位置にマッピングされる分散表現に対応する検索クエリを抽出することにより、「ある場所(東京都港区付近)で飲食店を探す」という検索意図に応じた検索クエリを抽出することができる。したがって、生成装置50は、検索クエリの意味を適切に解釈可能とすることができる。
As a result of the information processing shown in the upper part of FIG. 11, the vector QV1k (k = 1, 2, 3, 4), which is a distributed representation of the search query Q1k (k = 1, 2, 3, 4), is close to the distributed representation space. It is shown that the position is mapped as the cluster CL11. For example, the search query Q1k (k = 1, 2, 3, 4) is a set of search queries searched by the user U1 with the search intention of "searching for a restaurant in a certain place (near Minato-ku, Tokyo)". Is presumed to be. That is, the search query Q1k (k = 1, 2, 3, 4) is a search query searched with the search intention of "searching for a restaurant in a certain place (near Minato-ku, Tokyo)". , Is presumed to be a search query with similar characteristics. Here, when the predetermined search query input with the search intention of "searching for a restaurant in a certain place (near Minato-ku, Tokyo)" is input to the first model, the
図11の下段に示す例では、生成装置50は、同一のユーザU2によって所定の時間内に連続して入力された3個の検索クエリである検索クエリQ21(「冷蔵庫 400L」)、検索クエリQ22(「冷蔵庫 中型」)、検索クエリQ23(「冷蔵庫 中型 おすすめ」)を抽出する。生成装置50は、検索クエリが入力された順番に並べると、検索クエリQ21、検索クエリQ22、検索クエリQ23の順番で入力された3個の検索クエリを抽出する。生成装置50は、3個の検索クエリを抽出すると、時系列的に隣り合う2つの検索クエリを一対の検索クエリとして、2対の検索クエリのペアである(検索クエリQ21、検索クエリQ22)、(検索クエリQ22、検索クエリQ23)を抽出する(ステップS21−2)。
In the example shown in the lower part of FIG. 11, the
続いて、生成装置50は、抽出した検索クエリQ2m(m=1、2、3)を第1モデルM1に入力して、検索クエリQ2m(m=1、2、3)の分散表現であるベクトルBQV2m(m=1、2、3)を出力する。ここで、ベクトルBQV2m(m=1、2、3)は、第1モデルM1の出力層から出力されたばかりの検索クエリQ2m(m=1、2、3)の分散表現であって、第1モデルM1にフィードバックをかける前(学習前)の分散表現を示す(ステップS22−2)。
Subsequently, the
続いて、生成装置50は、同一のユーザU2によって所定の時間内に連続して入力された一対の検索クエリは、所定の検索意図(例えば、「中型の冷蔵庫を調べる」という検索意図)で入力された検索クエリであると推定されるため、相互に類似する特徴を有するものとして、検索クエリQ21の分散表現(ベクトルQV21)と、検索クエリQ21と対となる検索クエリQ22の分散表現(ベクトルQV22)とが、分散表現空間上で類似するように第1モデルM1を学習させる。また、生成装置50は、検索クエリQ22の分散表現(ベクトルQV22)と、検索クエリQ22と対となる検索クエリQ23の分散表現(ベクトルQV23)とが、分散表現空間上で類似するように第1モデルM1を学習させる。このように、生成装置50は、一対の検索クエリに対応する一対の分散表現である2つのベクトルが分散表現空間上で類似するように第1モデルM1を学習させることで、検索クエリから分散表現を出力する第1モデルM1を生成する(ステップS23−2)。
Subsequently, the
図11の下段に示す情報処理の結果として、検索クエリQ2m(m=1、2、3)の分散表現であるベクトルQV2m(m=1、2、3)が分散表現空間の近い位置にクラスタCL21としてマッピングされる様子が示されている。例えば、検索クエリQ2m(m=1、2、3)は、ユーザU2によって「中型の冷蔵庫を調べる」という検索意図の下で検索された検索クエリの集合であると推定される。すなわち、Q2m(m=1、2、3)は、「中型の冷蔵庫を調べる」という検索意図の下で検索された検索クエリであるという点で、相互に類似する特徴を有する検索クエリであると推定される。ここで、生成装置50は、「中型の冷蔵庫を調べる」という検索意図で入力された所定の検索クエリが第1モデルに入力されると、クラスタCL21の位置にマッピングされるような分散表現を出力することができる。これにより、例えば、生成装置50は、クラスタCL21の位置にマッピングされる分散表現に対応する検索クエリを抽出することにより、「中型の冷蔵庫を調べる」という検索意図に応じた検索クエリを抽出することができる。したがって、生成装置50は、検索クエリの意味を適切に解釈可能とすることができる。
As a result of the information processing shown in the lower part of FIG. 11, the vector QV2m (m = 1, 2, 3), which is a distributed representation of the search query Q2m (m = 1, 2, 3), is located close to the distributed representation space in the cluster CL21. It is shown how it is mapped as. For example, the search query Q2m (m = 1, 2, 3) is presumed to be a set of search queries searched by the user U2 with the search intention of "checking a medium-sized refrigerator". That is, Q2m (m = 1, 2, 3) is a search query having similar characteristics in that it is a search query searched with the search intention of "searching for a medium-sized refrigerator". Presumed. Here, the
また、本願発明に係る生成装置50は、ランダムに抽出された複数の検索クエリは、異なる検索意図の下で検索された検索クエリであるという点で、相互に相違する特徴を有する検索クエリであるとみなして第1モデルM1を学習させる。具体的には、生成装置50は、所定の検索クエリの分散表現と、所定の検索クエリとは無関係にランダムに抽出された検索クエリの分散表現とが分散表現空間上で遠くにマッピングされるように第1モデルM1のトレーニングを行う。図11に示す例では、生成装置50は、検索クエリQ11とは無関係にランダムに検索クエリを抽出したところ、検索クエリQ21が抽出されたとする。この場合、生成装置50は、検索クエリQ11の分散表現(ベクトルQV11)と、検索クエリQ11とは無関係にランダムに抽出された検索クエリQ21の分散表現(ベクトルQV21)とが分散表現空間上で遠くにマッピングされるように第1モデルM1のトレーニングを行う。その結果として、「ある場所(東京都港区付近)で飲食店を探す」という検索意図の下で検索された検索クエリQ1k(k=1、2、3、4)の分散表現であるベクトルQV1k(k=1、2、3、4)を含むクラスタCL11と、「中型の冷蔵庫を調べる」という検索意図の下で検索された検索クエリQ2m(m=1、2、3)の分散表現であるベクトルQV2m(m=1、2、3)を含むクラスタCL21とは、分散表現空間上で遠くにマッピングされる。すなわち、本願発明に係る生成装置50は、ランダムに抽出された複数の検索クエリの分散表現が相違するように第1モデルM1を学習させることにより、検索意図が異なる検索クエリの分散表現を分散表現空間上で遠い位置に出力可能とする。
Further, the
なお、生成装置50が生成した第1モデルM1によって出力された分散表現が分散表現空間にマッピングされた結果として、上述したクラスタCL11とクラスタCL21の他にも、同一のユーザによって所定の時間内に入力された複数の検索クエリの分散表現の集合であるクラスタCL12やクラスタCL22が生成される。
As a result of mapping the distributed representation output by the first model M1 generated by the
上述したように、生成装置50は、ユーザによって入力された検索クエリを取得する。また、生成装置50は、取得した検索クエリのうち、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして学習することで、所定の検索クエリから所定の検索クエリの特徴情報を予測する第1モデルを生成する。すなわち、本願発明に係る生成装置50は、所定の時間内に連続して入力された複数の検索クエリは、所定の検索意図の下で検索された検索クエリであるという点で、相互に類似する特徴を有する検索クエリであるとみなして第1モデルを学習させる。具体的には、生成装置50は、同一のユーザによって所定の時間内に入力された複数の検索クエリの分散表現が類似するように第1モデルを学習させることで、所定の検索クエリから所定の検索クエリの特徴情報を含む分散表現を出力する第1モデルを生成する。すなわち、本願発明に係る生成装置50は、所定の時間内に連続して入力された複数の検索クエリの分散表現が類似するように第1モデルM1を学習させることにより、所定の検索意図の下で検索された検索クエリの分散表現を分散表現空間上で近い位置に出力可能とする。これにより、生成装置50は、検索クエリを入力したユーザのコンテクストに応じて検索クエリの意味(検索意図)を出力(解釈)することを可能にする。したがって、生成装置50は、検索クエリの意味を適切に解釈可能とすることができる。さらに、生成装置50は、所定の検索クエリの特徴情報を含む分散表現の近傍にマッピングされる分散表現に対応する検索クエリを抽出することにより、所定の検索クエリが検索された検索意図に応じた検索クエリを抽出することができる。すなわち、生成装置50は、検索クエリを入力したユーザの検索意図やコンテクストを考慮して、ユーザの検索動向を分析することを可能にする。したがって、生成装置50は、ユーザの検索動向の分析精度を高めることができる。また、生成装置50が生成した第1モデルM1を検索システムの一部として機能させることもできる。あるいは、生成装置50は、第1モデルM1によって予測された検索クエリの特徴情報を利用する他のシステム(例えば、検索エンジン)への入力情報として、第1モデルM1が出力した検索クエリの分散表現を提供することもできる。これにより、検索システムは、第1モデルM1によって予測された検索クエリの特徴情報に基づいて、検索結果として出力されるコンテンツを選択可能になる。すなわち、検索システムは、検索クエリを入力したユーザの検索意図やコンテクストを考慮して、検索結果として出力されるコンテンツを選択可能になる。さらに、検索システムは、第1モデルM1によって予測された検索クエリの特徴情報に基づいて、検索結果として出力されるコンテンツに含まれる文字列の分散表現と検索クエリの分散表現との類似度を算出可能になる。そして、検索システムは、算出した類似度に基づいて、検索結果として出力されるコンテンツの表示順を決定可能になる。すなわち、検索システムは、検索クエリを入力したユーザの検索意図やコンテクストを考慮して、検索結果として出力されるコンテンツの表示順を決定可能になる。したがって、生成装置50は、検索サービスにおけるユーザビリティを向上させることができる。
As described above, the
〔2−2.第2学習モデルの生成処理〕
次に、図12を用いて、第2学習モデルの生成処理の流れについて説明する。図12は、実施形態に係る第2学習モデルの生成処理の一例を示す図である。なお、以下では、適宜、第2学習モデルを第2モデル(又は、第2モデルM2)と記載する。図12の上段に示す例では、生成装置50は、同一のユーザU1によって所定の時間内に連続して入力された4個の検索クエリである検索クエリQ11(「六本木 パスタ」)、検索クエリQ12(「六本木 イタリアン」)、検索クエリQ13(「赤坂 パスタ」)、検索クエリQ14(「麻布 パスタ」)を抽出する。生成装置50は、同一のユーザU1によって各検索クエリが入力された時間の間隔が所定の時間内である複数の検索クエリを抽出する。また、生成装置50は、同一のユーザU1によって各検索クエリのペアが入力された時間の間隔が所定の時間内である複数の検索クエリを抽出する。ここで、4個の検索クエリは、検索クエリQ11、検索クエリQ12、検索クエリQ13、検索クエリQ14の順番でユーザU1によって各検索クエリが所定の時間内に入力された検索クエリであるとする。生成装置50は、4個の検索クエリを抽出すると、時系列的に隣り合う2つの検索クエリを一対の検索クエリとして、3対の検索クエリのペアである(検索クエリQ11、検索クエリQ12)、(検索クエリQ12、検索クエリQ13)、(検索クエリQ13、検索クエリQ14)を抽出する。生成装置50は、3対の検索クエリのペアを抽出すると、抽出した検索クエリQ1k(k=1、2、3、4)を第1モデルM1に入力する(ステップS31)。なお、生成装置50は、同一のユーザU1によって全ての検索クエリが所定の時間内に入力された複数の検索クエリを抽出してもよい。そして、生成装置50は、時系列的に隣り合うか否かに関わらず、抽出した複数の検索クエリの中から2つの検索クエリを選択して、選択した2つの検索クエリを一対の検索クエリとして抽出してもよい。
[2-2. Second learning model generation process]
Next, the flow of the generation process of the second learning model will be described with reference to FIG. FIG. 12 is a diagram showing an example of a generation process of the second learning model according to the embodiment. In the following, the second learning model will be referred to as a second model (or a second model M2) as appropriate. In the example shown in the upper part of FIG. 12, the
続いて、生成装置50は、検索クエリQ1k(k=1、2、3、4)の分散表現であるベクトルBQV1k(k=1、2、3、4)を第1モデルM1の出力データとして出力する(ステップS32)。ここで、ベクトルBQV1k(k=1、2、3、4)は、第1モデルM1の出力層から出力されたばかりの検索クエリQ1k(k=1、2、3、4)の分散表現であって、第1モデルM1にフィードバックをかける前(学習前)の分散表現を示す。
Subsequently, the
ここで、同一のユーザU1によって所定の時間内に連続して入力された検索クエリQ1k(k=1、2、3、4)は、例えば、ユーザU1によって「ある場所(東京都港区付近)で飲食店を探す」という検索意図の下で検索された検索クエリの集合であると推定される。すなわち、検索クエリQ1k(k=1、2、3、4)は、「ある場所(東京都港区付近)で飲食店を探す」という検索意図の下で検索された検索クエリであるという点で、相互に類似する特徴を有する検索クエリであると推定される。そこで、生成装置50は、連続して入力された検索クエリが類似する特徴を有するものとして学習することで、所定の検索クエリから所定の検索クエリの特徴情報を予測する第1モデルを生成する(ステップS33)。具体的には、生成装置50は、連続して入力された検索クエリの分散表現が類似するものとして学習することで、所定の検索クエリから所定の検索クエリの分散表現を予測する第1モデルM1を生成する。例えば、生成装置50は、検索クエリQ11の分散表現(ベクトルQV11)と、検索クエリQ11と対となる検索クエリQ12の分散表現(ベクトルQV12)とが、分散表現空間上で類似するように第1モデルM1を学習させる。また、生成装置50は、検索クエリQ12の分散表現(ベクトルQV12)と、検索クエリQ12と対となる検索クエリQ13の分散表現(ベクトルQV13)とが、分散表現空間上で類似するように第1モデルM1を学習させる。また、生成装置50は、検索クエリQ13の分散表現(ベクトルQV13)と、検索クエリQ13と対となる検索クエリQ14の分散表現(ベクトルQV14)とが、分散表現空間上で類似するように第1モデルM1を学習させる。
Here, the search query Q1k (k = 1, 2, 3, 4) continuously input by the same user U1 within a predetermined time is, for example, "a certain place (near Minato-ku, Tokyo)" by the user U1. It is presumed to be a set of search queries searched under the search intention of "searching for restaurants in Tokyo". That is, the search query Q1k (k = 1, 2, 3, 4) is a search query searched with the search intention of "searching for a restaurant in a certain place (near Minato-ku, Tokyo)". , Is presumed to be a search query with similar characteristics. Therefore, the
図12の上段の右側には、学習済みの第1モデルM1の出力結果として、同一のユーザU1によって所定の時間内に入力された検索クエリQ1k(k=1、2、3、4)の分散表現であるベクトルQV1k(k=1、2、3、4)が分散表現空間のクラスタCL11としてマッピングされる様子が示されている。このように、生成装置50は、同一のユーザによって所定の時間内に入力された複数の検索クエリが有する特徴を学習した第1学習モデルM1を生成する。
On the right side of the upper part of FIG. 12, as the output result of the trained first model M1, the variance of the search query Q1k (k = 1, 2, 3, 4) input by the same user U1 within a predetermined time is distributed. It is shown that the representation vector QV1k (k = 1, 2, 3, 4) is mapped as the cluster CL11 in the distributed representation space. In this way, the
生成装置50は、第1モデルM1を生成すると、生成した第1モデルM1(第1モデルM1のモデルデータMDT1)を取得する。生成装置50は、第1モデルM1を取得すると、取得した第1モデルM1を用いて、第2学習モデルM2を生成する。具体的には、生成装置50は、第1モデルM1を再学習させることにより、第1モデルM1とは学習モデルの重みである接続係数が異なる第2モデルM2を生成する。より具体的には、生成装置50は、第1モデルM1を用いて、所定の検索クエリから所定の検索クエリが属するカテゴリを予測する第2学習モデルM2を生成する(ステップS34)。
When the
図12の下段に示す例では、生成装置50は、検索クエリが第2モデルM2に入力された際に、CAT11(「飲食店を探す」)、CAT12(「商品を探す」)、CAT13(「飲食店を予約する」)、CAT14(「商品を購入する」)の4つのカテゴリのいずれのカテゴリに属するかを予測する第2モデルM2を生成する。具体的には、生成装置50は、入力情報として検索クエリが第2モデルM2に入力された際に、出力情報として検索クエリがそのカテゴリに属する確率をカテゴリ毎に出力する第2モデルM2を生成する。例えば、生成装置50は、第2モデルM2の正解データとして、検索クエリと検索クエリが属するカテゴリ(CAT11〜CAT14のいずれか)との組を学習する。
In the example shown in the lower part of FIG. 12, when the search query is input to the second model M2, the
なお、検索クエリがCAT11(「飲食店を探す」)に属することは、検索クエリが飲食店を探す意図で入力された検索クエリであることを示す。また、CAT12(「商品を探す」)に属することは、検索クエリが商品を探す意図で入力された検索クエリであることを示す。また、検索クエリがCAT13(「飲食店を予約する」)に属することは、検索クエリが飲食店を予約する意図で入力された検索クエリであることを示す。また、検索クエリがCAT14(「商品を購入する」)に属することは、検索クエリが商品を購入する意図で入力された検索クエリであることを示す。 The fact that the search query belongs to CAT11 (“search for a restaurant”) indicates that the search query is a search query entered with the intention of searching for a restaurant. Further, belonging to CAT12 (“searching for a product”) indicates that the search query is a search query input with the intention of searching for a product. Further, the fact that the search query belongs to CAT13 (“reserving a restaurant”) indicates that the search query is a search query input with the intention of reserving a restaurant. Further, the fact that the search query belongs to CAT14 (“purchase a product”) indicates that the search query is a search query input with the intention of purchasing a product.
具体的には、生成装置50は、検索クエリが学習モデルに入力された際に、学習モデルが出力する分散表現の分類結果が、検索クエリが属するカテゴリに対応するように学習することで、所定の検索クエリから所定の検索クエリが属するカテゴリを予測する第2モデルM2を生成する。そして、生成装置50は、例えば、入力情報として検索クエリが第2モデルM2に入力された際に、出力情報として検索クエリがそのカテゴリに属する確率をカテゴリCAT11〜CAT14毎に出力する第2モデルM2を生成する。
Specifically, the
例えば、生成装置50は、入力情報として検索クエリQ11(「六本木 パスタ」)が第2モデルM2に入力された際に(ステップS35)、出力情報として検索クエリQ11(「六本木 パスタ」)の分散表現であるベクトルBQV11を出力する。ここで、ベクトルBQV11は、第2モデルM2の出力層から出力されたばかりの検索クエリQ11の分散表現であって、第2モデルM2にフィードバックをかける前(学習前)の分散表現を示す。ここで、検索クエリQ11(「六本木 パスタ」)が属する正解カテゴリがCAT11(「飲食店を探す」)であるとする。この場合、生成装置50は、出力された検索クエリQ11(「六本木 パスタ」)の分散表現であるベクトルBQV11がCAT11(「飲食店を探す」)に分類される確率が所定の閾値を超えるように第2モデルM2を学習させる。なお、生成装置50は、あらかじめ用意された正解データを用いて第2モデルを学習させる。生成装置50は、第2モデルM2の正解データを生成してもよい。そして、生成装置50は、生成した正解データを用いて第2モデルM2を学習させてもよい。具体的には、生成装置50は、検索クエリを検索したユーザの検索後の行動に基づいて、検索クエリが属する正解カテゴリを決定する。より具体的には、生成装置50は、所定の検索クエリを検索したユーザに対して、検索後に所定の行動を起こしたユーザの割合が所定の閾値を超える所定の行動を、正解カテゴリに対応する行動として決定する。例えば、検索クエリQ11(「六本木 パスタ」)を検索したユーザが検索後に所定の行動を起こしたユーザの割合として、飲食店を探す行動を起こしたユーザの割合が90%、検索後に商品を探す行動を起こしたユーザの割合が0%、検索後に飲食店を予約する行動を起こしたユーザの割合が10%、検索後に商品を購入する行動を起こしたユーザの割合が0%であったとする。この場合、生成装置50は、飲食店を探す行動を起こしたユーザの割合が所定の閾値(例えば、90%)を超えるため、飲食店を探す行動を検索クエリQ11(「六本木 パスタ」)の正解カテゴリに対応する行動として決定する。そして、生成装置50は、正解カテゴリに対応する行動を飲食店を探す行動であると決定したので、検索クエリQ11(「六本木 パスタ」)が属する正解カテゴリをCAT11(「飲食店を探す」)に決定する。
For example, the
例えば、生成装置50は、学習前の第2モデルM2に検索クエリQ11(「六本木 パスタ」)が入力された際に、分散表現であるベクトルBQV11がCAT11(「飲食店を探す」)に分類される確率を80%、CAT12(「商品を探す」)に分類される確率を0%、CAT13(「飲食店を予約」)に分類される確率を20%、CAT14(「商品を購入する」)に分類される確率を0%と出力したとする。この場合、生成装置50は、分散表現であるベクトルBQV11がCAT11(「飲食店を探す」)に分類される確率を所定の閾値(例えば、90%)を超えるように第2モデルM2を学習させる。また、生成装置50は、分散表現であるベクトルBQV11がCAT11(「飲食店を探す」)に分類される確率が所定の閾値(例えば、90%)を超えるように学習させるのに合わせて、分散表現であるベクトルBQV11が他のカテゴリCAT13(「飲食店を予約」)に分類される確率を10%に下げるように第2モデルM2を学習させる。
For example, in the
このように、生成装置50は、入力情報として所定の検索クエリが入力されると、出力情報として所定の検索クエリの分散表現が正解カテゴリに分類される確率が所定の閾値を超えるように第2モデルを学習させる。そして、生成装置50は、入力情報として所定の検索クエリが入力された際に、所定の検索クエリの分散表現がそのカテゴリに属する確率が所定の閾値を超えるカテゴリを、所定の検索クエリのカテゴリとして出力する。例えば、生成装置50は、学習済みの第2モデルM2に入力情報として検索クエリQ11(「六本木 パスタ」)が入力されると、検索クエリQ11(「六本木 パスタ」)の分散表現であるベクトルBQV11がカテゴリCAT11(「飲食店を探す」)に属する確率が90%を超えるので、出力情報として検索クエリが属するカテゴリをCAT11(「飲食店を探す」)と出力する(ステップS36)。このように、生成装置50は、検索クエリと検索クエリの正解カテゴリとの組を学習することで、所定の検索クエリから所定の検索クエリのカテゴリを予測する第2モデルを生成する(ステップS37)。
As described above, when the predetermined search query is input as the input information, the
一般的に、ユーザはある意図を持って検索を複数回行うと考えられるため、所定の時間内に連続して入力された検索クエリは、検索意図が近いという仮定が成り立つ。そこで、本願発明に係る生成装置50は、所定の時間内に連続して入力された複数の検索クエリは、所定の検索意図の下で検索された検索クエリであるという点で、相互に類似する特徴を有する検索クエリであるとみなして第1モデルM1を学習させる。これにより、生成装置50は、検索意図を考慮した検索クエリの特徴を第1モデルM1に学習させることができる。そして、生成装置50は、検索意図を考慮した検索クエリの特徴を学習した第1モデルM1を活用して、所定の検索クエリから所定の検索クエリのカテゴリを予測する第2モデルを効率的に生成することができる。これにより、生成装置50は、検索クエリを入力したユーザの検索意図を考慮したカテゴリに検索クエリを分類することを可能にする。また、従来、検索クエリをカテゴリに分類し、高い分類精度を得るためには、十分な量の正解データを用意することが必要であった。しかしながら、検索クエリ自体、多種多様であり、ロングテイルな性質を持つものであるため、多数の検索クエリに対応する正解カテゴリをラベル付けするのは、非常に手間がかかり困難である。ここで、生成装置50は、正解カテゴリをラベル付けする代わりに、ユーザの検索意図(検索クエリを入力したユーザのコンテクスト)を一種の正解として、検索クエリのカテゴリを予測する第2モデルを学習させることができる。これにより、生成装置50は、人手で検索クエリの正解カテゴリをラベル付けすることなく、第2モデルを学習させることができる。すなわち、生成装置50は、正解データが少ないときでも、十分な分類精度を得られるようになる。また、生成装置50は、正解データが多いときであれば、さらに高い分類精度を得られるようになる。したがって、生成装置50は、検索クエリの分類精度を高めることができる。
In general, it is considered that the user performs a search a plurality of times with a certain intention, so that it is assumed that the search queries that are continuously input within a predetermined time have similar search intentions. Therefore, the
〔2−3.情報処理装置の構成〕
次に、図13を用いて、実施形態に係る生成装置50の構成について説明する。図13は、実施形態に係る生成装置50の構成例を示す図である。図13に示すように、生成装置50は、通信部51と、記憶部53と、制御部52とを有する。なお、生成装置50は、生成装置50の管理者等から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を表示するための表示部(例えば、液晶ディスプレイ等)を有してもよい。
[2-3. Information processing device configuration]
Next, the configuration of the
(通信部51)
通信部51は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部51は、ネットワークと有線または無線で接続され、例えば、ユーザ端末10と、検索サーバ20との間で情報の送受信を行う。
(Communication unit 51)
The communication unit 51 is realized by, for example, a NIC (Network Interface Card) or the like. Then, the communication unit 51 is connected to the network by wire or wirelessly, and for example, information is transmitted / received between the
(記憶部53)
記憶部53は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。記憶部53は、図13に示すように、クエリ情報記憶部531と、ベクトル情報記憶部532と、分類定義記憶部533と、カテゴリ情報記憶部534と、モデル情報記憶部535とを有する。
(Memory unit 53)
The storage unit 53 is realized by, for example, a semiconductor memory element such as a RAM (Random Access Memory) or a flash memory (Flash Memory), or a storage device such as a hard disk or an optical disk. As shown in FIG. 13, the storage unit 53 includes a query
(クエリ情報記憶部531)
クエリ情報記憶部531は、ユーザによって入力された検索クエリに関する各種の情報を記憶する。図14に、実施形態に係るクエリ情報記憶部の一例を示す。図14に示す例では、クエリ情報記憶部531は、「ユーザID」、「日時」、「検索クエリ」、「検索クエリID」といった項目を有する。
(Query information storage unit 531)
The query
「ユーザID」は、検索クエリを入力したユーザを識別するための識別情報を示す。「日時」は、検索サーバがユーザから検索クエリを受け付けた日時を示す。「検索クエリ」は、ユーザによって入力された検索クエリを示す。「検索クエリID」は、ユーザによって入力された検索クエリを識別するための識別情報を示す。 The "user ID" indicates identification information for identifying the user who entered the search query. "Date and time" indicates the date and time when the search server received the search query from the user. A "search query" indicates a search query entered by the user. The "search query ID" indicates identification information for identifying the search query entered by the user.
図14の1レコード目に示す例では、検索クエリID「Q11」で識別される検索クエリ(検索クエリQ11)は、図10に示した検索クエリQ11に対応する。また、ユーザID「U1」は、検索クエリQ11を入力したユーザがユーザID「U1」で識別されるユーザ(ユーザU1)であることを示す。また、日時「2018/9/1 PM17:00」は、検索サーバがユーザU1から検索クエリQ11を受け付けた日時が2018年9月1日の午後17:00であることを示す。また、検索クエリ「六本木 パスタ」は、ユーザU1によって入力された検索クエリQ11を示す。具体的には、検索クエリ「六本木 パスタ」は、地名を示す「六本木」と食品の種類を示す「パスタ」の文字とが区切り文字であるスペースで区切られた文字列であることを示す。 In the example shown in the first record of FIG. 14, the search query (search query Q11) identified by the search query ID "Q11" corresponds to the search query Q11 shown in FIG. Further, the user ID "U1" indicates that the user who has input the search query Q11 is the user (user U1) identified by the user ID "U1". Further, the date and time "2018/9/1 PM 17:00" indicates that the date and time when the search server receives the search query Q11 from the user U1 is 17:00 pm on September 1, 2018. Further, the search query "Roppongi pasta" indicates the search query Q11 input by the user U1. Specifically, the search query "Roppongi pasta" indicates that the characters "Roppongi" indicating the place name and the characters "pasta" indicating the type of food are separated by a space which is a delimiter.
(ベクトル情報記憶部532)
ベクトル情報記憶部532は、検索クエリの分散表現であるベクトルに関する各種の情報を記憶する。図15に、実施形態に係るベクトル情報記憶部の一例を示す。図15に示す例では、ベクトル情報記憶部532は、「ベクトルID」、「検索クエリID」、「ベクトル情報」といった項目を有する。
(Vector information storage unit 532)
The vector
「ベクトルID」は、検索クエリの分散表現であるベクトルを識別するための識別情報を示す。「検索クエリID」は、ベクトルに対応する検索クエリを識別するための識別情報を示す。「ベクトル情報」は、検索クエリの分散表現であるN次元のベクトルを示す。検索クエリの分散表現であるベクトルは、例えば、128次元のベクトルである。 The "vector ID" indicates identification information for identifying a vector which is a distributed representation of a search query. The "search query ID" indicates identification information for identifying the search query corresponding to the vector. "Vector information" indicates an N-dimensional vector which is a distributed representation of a search query. The vector that is the distributed representation of the search query is, for example, a 128-dimensional vector.
図15の1レコード目に示す例では、ベクトルID「QV11」で識別されるベクトル(ベクトルQV11)は、図10に示した検索クエリQ11の分散表現であるベクトルQV11に対応する。また、検索クエリID「Q11」で識別される検索クエリ(検索クエリQ11)は、ベクトルQV11に対応する検索クエリが検索クエリQ11であることを示す。また、ベクトル情報「QVDT11」は、検索クエリQ11の分散表現であるN次元のベクトルを示す。 In the example shown in the first record of FIG. 15, the vector (vector QV11) identified by the vector ID “QV11” corresponds to the vector QV11 which is the distributed representation of the search query Q11 shown in FIG. Further, the search query (search query Q11) identified by the search query ID "Q11" indicates that the search query corresponding to the vector QV11 is the search query Q11. Further, the vector information "QVDT11" indicates an N-dimensional vector which is a distributed representation of the search query Q11.
(分類定義記憶部533)
分類定義記憶部533は、検索クエリが分類されるカテゴリの定義に関する各種の情報を記憶する。図16に、実施形態に係る分類定義記憶部の一例を示す。図16に示す例では、分類定義記憶部533は、「大分類ID」、「大分類」、「小分類ID」、「小分類」といった項目を有する。
(Classification definition storage unit 533)
The classification definition storage unit 533 stores various information regarding the definition of the category in which the search query is classified. FIG. 16 shows an example of the classification definition storage unit according to the embodiment. In the example shown in FIG. 16, the classification definition storage unit 533 has items such as "major classification ID", "major classification", "minor classification ID", and "minor classification".
「大分類」は、検索クエリが分類されるカテゴリの大分類を示す。「大分類ID」は、大分類を識別するための識別情報を示す。図16に示す例では、大分類「購買行動系」は、図1の下段に示す例で説明した大分類に対応する。大分類「購買行動系」は、検索クエリをユーザの購買行動に基づいて分類するカテゴリの大分類を示す。図16に示す例では、大分類「購買行動系」は、さらに4つの小分類を有する。大分類ID「CAT1」は、大分類「購買行動系」を識別するための識別情報を示す。 "Major classification" indicates a major classification of the category in which the search query is classified. The "major classification ID" indicates identification information for identifying the major classification. In the example shown in FIG. 16, the major classification “purchasing behavior system” corresponds to the major classification described in the example shown in the lower part of FIG. Major classification "Purchasing behavior system" indicates a major classification of categories that classify search queries based on the user's purchasing behavior. In the example shown in FIG. 16, the major classification "purchasing behavior system" has four further minor classifications. The major classification ID "CAT1" indicates identification information for identifying the major classification "purchasing behavior system".
「小分類」、検索クエリが分類されるカテゴリの小分類を示す。「小分類ID」は、小分類を識別するための識別情報を示す。図16に示す例では、小分類「飲食店を探す」は、大分類「購買行動系」に属する分類であって、小分類に分類される検索クエリが、ユーザによって飲食店を探す意図で入力された検索クエリであることを示す。小分類ID「CAT11」は、小分類「飲食店を探す」を識別するための識別情報を示す。 "Minor classification", indicates the subclassification of the category in which the search query is classified. The "minor classification ID" indicates identification information for identifying the minor classification. In the example shown in FIG. 16, the minor classification "find a restaurant" is a classification belonging to the major classification "purchasing behavior system", and the search query classified into the minor classification is input with the intention of searching for a restaurant by the user. Indicates that the search query was made. The sub-category ID "CAT11" indicates identification information for identifying the sub-category "find a restaurant".
小分類「商品を探す」は、大分類「購買行動系」に属する分類であって、小分類に分類される検索クエリが、ユーザによって商品を探す意図で入力された検索クエリであることを示す。小分類ID「CAT12」は、小分類「商品を探す」を識別するための識別情報を示す。 The sub-category "search for products" is a category that belongs to the major category "purchasing behavior system", and indicates that the search query classified in the sub-category is a search query entered by the user with the intention of searching for products. .. The sub-classification ID "CAT12" indicates identification information for identifying the sub-classification "search for a product".
小分類「飲食店を予約」は、大分類「購買行動系」に属する分類であって、小分類に分類される検索クエリが、ユーザによって飲食店を予約する意図で入力された検索クエリであることを示す。小分類ID「CAT13」は、小分類「飲食店を予約」を識別するための識別情報を示す。 The sub-category "reserve restaurant" is a classification belonging to the major category "purchasing behavior system", and the search query classified into the sub-category is a search query input by the user with the intention of reserving the restaurant. Show that. The sub-category ID "CAT13" indicates identification information for identifying the sub-category "reserve a restaurant".
小分類「商品を購入」は、大分類「購買行動系」に属する分類であって、小分類に分類される検索クエリが、ユーザによって商品を購入する意図で入力された検索クエリであることを示す。小分類ID「CAT14」は、小分類「商品を購入」を識別するための識別情報を示す。 The sub-category "Purchase a product" is a category that belongs to the major category "Purchase behavior system", and the search query classified in the sub-category is a search query entered by the user with the intention of purchasing the product. show. The sub-category ID "CAT14" indicates identification information for identifying the sub-category "purchase a product".
(カテゴリ情報記憶部534)
カテゴリ情報記憶部534は、検索クエリが属するカテゴリに関する各種の情報を記憶する。具体的には、カテゴリ情報記憶部534は、学習済みの第2学習モデルに検索クエリが入力された際に、第2学習モデルが出力するカテゴリに関する各種の情報を記憶する。図17に、実施形態に係るカテゴリ情報記憶部の一例を示す。図17に示す例では、カテゴリ情報記憶部534は、「検索クエリID」、「大分類ID」、「小分類ID」、「確率(%)」といった項目を有する。
(Category information storage unit 534)
The category
「検索クエリID」は、ユーザによって入力された検索クエリを識別するための識別情報を示す。図17に示す例では、検索クエリID「Q11」で識別される検索クエリ(検索クエリQ11)は、図12に示した検索クエリQ11に対応する。 The "search query ID" indicates identification information for identifying the search query entered by the user. In the example shown in FIG. 17, the search query (search query Q11) identified by the search query ID "Q11" corresponds to the search query Q11 shown in FIG.
「大分類ID」は、大分類を識別するための識別情報を示す。「小分類ID」は、小分類を識別するための識別情報を示す。「確率(%)」は、学習済みの第2学習モデルに検索クエリが入力された際に、第2学習モデルが出力する小分類毎の確率を示す。図17に示す例では、確率(%)「90」は、検索クエリQ11がカテゴリCAT11に分類される確率が90%であることを示す。 The "major classification ID" indicates identification information for identifying the major classification. The "minor classification ID" indicates identification information for identifying the minor classification. The "probability (%)" indicates the probability for each subclass output by the second learning model when a search query is input to the trained second learning model. In the example shown in FIG. 17, the probability (%) "90" indicates that the probability that the search query Q11 is classified into the category CAT11 is 90%.
(モデル情報記憶部535)
モデル情報記憶部535は、生成装置50によって生成された学習モデルに関する各種の情報を記憶する。図18に、実施形態に係るモデル情報記憶部の一例を示す。図18に示す例では、モデル情報記憶部535は、「モデルID」、「モデルデータ」といった項目を有する。
(Model information storage unit 535)
The model
「モデルID」は、生成装置50によって生成された学習モデルを識別するための識別情報を示す。「モデルデータ」は、生成装置50によって生成された学習モデルのモデルデータを示す。例えば、「モデルデータ」には、検索クエリを分散表現に変換するためのデータが格納される。
The "model ID" indicates identification information for identifying the learning model generated by the
図18の1レコード目に示す例では、モデルID「M1」で識別される学習モデルは、図1に示した第1モデルM1に対応する。また、モデルデータ「MDT1」は、生成装置50によって生成された第1モデルM1のモデルデータ(モデルデータMDT1)を示す。
In the example shown in the first record of FIG. 18, the learning model identified by the model ID “M1” corresponds to the first model M1 shown in FIG. Further, the model data "MDT1" indicates model data (model data MDT1) of the first model M1 generated by the
モデルデータMDT1は、検索クエリが入力される入力層と、出力層と、入力層から出力層までのいずれかの層であって出力層以外の層に属する第1要素と、第1要素と第1要素の重みとに基づいて値が算出される第2要素と、を含み、入力層に入力された検索クエリに応じて、入力層に入力された検索クエリの分散表現を出力層から出力するよう、生成装置50を機能させてもよい。
The model data MDT1 includes an input layer into which a search query is input, an output layer, a first element which is any layer from the input layer to the output layer and belongs to a layer other than the output layer, and the first element and the first element. The output layer outputs a distributed representation of the search query input to the input layer according to the search query input to the input layer, including the second element whose value is calculated based on the weight of one element. As such, the
ここで、モデルデータMDT1が「y=a1*x1+a2*x2+・・・+ai*xi」で示す回帰モデルで実現されるとする。この場合、モデルデータMDT1が含む第1要素は、x1やx2等といった入力データ(xi)に対応する。また、第1要素の重みは、xiに対応する係数aiに対応する。ここで、回帰モデルは、入力層と出力層とを有する単純パーセプトロンと見做すことができる。各モデルを単純パーセプトロンと見做した場合、第1要素は、入力層が有するいずれかのノードに対応し、第2要素は、出力層が有するノードと見做すことができる。 Here, it is assumed that the model data MDT1 is realized by the regression model shown by "y = a1 * x1 + a2 * x2 + ... + ai * xi". In this case, the first element included in the model data MDT1 corresponds to input data (xi) such as x1 and x2. Further, the weight of the first element corresponds to the coefficient ai corresponding to xi. Here, the regression model can be regarded as a simple perceptron having an input layer and an output layer. When each model is regarded as a simple perceptron, the first element corresponds to any node of the input layer, and the second element can be regarded as the node of the output layer.
また、モデルデータMDT1がDNN(Deep Neural Network)等、1つまたは複数の中間層を有するニューラルネットワークで実現されるとする。この場合、モデルデータMDT1が含む第1要素は、入力層または中間層が有するいずれかのノードに対応する。また、第2要素は、第1要素と対応するノードから値が伝達されるノードである次段のノードに対応する。また、第1要素の重みは、第1要素と対応するノードから第2要素と対応するノードに伝達される値に対して考慮される重みである接続係数に対応する。 Further, it is assumed that the model data MDT1 is realized by a neural network having one or a plurality of intermediate layers such as DNN (Deep Neural Network). In this case, the first element included in the model data MDT1 corresponds to either the node of the input layer or the intermediate layer. Further, the second element corresponds to the node of the next stage, which is the node to which the value is transmitted from the node corresponding to the first element. Further, the weight of the first element corresponds to a connection coefficient which is a weight considered for the value transmitted from the node corresponding to the first element to the node corresponding to the second element.
生成装置50は、上述した回帰モデルやニューラルネットワーク等、任意の構造を有するモデルを用いて、分散表現の算出を行う。具体的には、モデルデータMDT1は、検索クエリが入力された場合に、分散表現を出力するように係数が設定される。生成装置50は、このようなモデルデータMDT1を用いて、分散表現を算出する。
The
なお、上記例では、モデルデータMDT1が、検索クエリが入力された場合に、検索クエリの分散表現を出力するモデル(以下、モデルX1という。)である例を示した。しかし、実施形態に係るモデルデータMDT1は、モデルX1にデータの入出力を繰り返すことで得られる結果に基づいて生成されるモデルであってもよい。例えば、モデルデータMDT1は、検索クエリを入力とした際に、モデルX1が出力した分散表現を入力して学習されたモデル(以下、モデルY1という。)であってもよい。または、モデルデータMDT1は、検索クエリを入力とし、モデルY1の出力値を出力とするよう学習されたモデルであってもよい。 In the above example, the model data MDT1 is a model (hereinafter referred to as model X1) that outputs a distributed representation of the search query when the search query is input. However, the model data MDT1 according to the embodiment may be a model generated based on the result obtained by repeating the input / output of data to the model X1. For example, the model data MDT1 may be a model (hereinafter referred to as model Y1) learned by inputting the distributed representation output by the model X1 when the search query is input. Alternatively, the model data MDT1 may be a model trained to input a search query and output the output value of the model Y1.
また、生成装置50がGAN(Generative Adversarial Networks)を用いた推定処理を行う場合、モデルデータMDT1は、GANの一部を構成するモデルであってもよい。
Further, when the
図18の2レコード目に示す例では、モデルID「M2」で識別される学習モデルは、図1に示した第2モデルM2に対応する。また、モデルデータ「MDT2」は、生成装置50によって生成された第2モデルM2のモデルデータ(モデルデータMDT2)を示す。
In the example shown in the second record of FIG. 18, the learning model identified by the model ID “M2” corresponds to the second model M2 shown in FIG. Further, the model data "MDT2" indicates model data (model data MDT2) of the second model M2 generated by the
モデルデータMDT2は、検索クエリが入力される入力層と、出力層と、入力層から出力層までのいずれかの層であって出力層以外の層に属する第1要素と、第1要素と第1要素の重みとに基づいて値が算出される第2要素と、を含み、入力層に入力された検索クエリに応じて、入力層に入力された検索クエリが各カテゴリに属する確率を出力層から出力するよう、生成装置50を機能させてもよい。
The model data MDT2 includes an input layer into which a search query is input, an output layer, a first element which is any layer from the input layer to the output layer and belongs to a layer other than the output layer, and the first element and the first element. An output layer that includes a second element whose value is calculated based on the weight of one element, and the probability that the search query input to the input layer belongs to each category according to the search query input to the input layer. The
ここで、モデルデータMDT2が「y=a1*x1+a2*x2+・・・+ai*xi」で示す回帰モデルで実現されるとする。この場合、モデルデータMDT2が含む第1要素は、x1やx2等といった入力データ(xi)に対応する。また、第1要素の重みは、xiに対応する係数aiに対応する。ここで、回帰モデルは、入力層と出力層とを有する単純パーセプトロンと見做すことができる。各モデルを単純パーセプトロンと見做した場合、第1要素は、入力層が有するいずれかのノードに対応し、第2要素は、出力層が有するノードと見做すことができる。 Here, it is assumed that the model data MDT2 is realized by the regression model shown by "y = a1 * x1 + a2 * x2 + ... + ai * xi". In this case, the first element included in the model data MDT2 corresponds to input data (xi) such as x1 and x2. Further, the weight of the first element corresponds to the coefficient ai corresponding to xi. Here, the regression model can be regarded as a simple perceptron having an input layer and an output layer. When each model is regarded as a simple perceptron, the first element corresponds to any node of the input layer, and the second element can be regarded as the node of the output layer.
また、モデルデータMDT2がDNN(Deep Neural Network)等、1つまたは複数の中間層を有するニューラルネットワークで実現されるとする。この場合、モデルデータMDT2が含む第1要素は、入力層または中間層が有するいずれかのノードに対応する。また、第2要素は、第1要素と対応するノードから値が伝達されるノードである次段のノードに対応する。また、第1要素の重みは、第1要素と対応するノードから第2要素と対応するノードに伝達される値に対して考慮される重みである接続係数に対応する。 Further, it is assumed that the model data MDT2 is realized by a neural network having one or a plurality of intermediate layers such as DNN (Deep Neural Network). In this case, the first element included in the model data MDT2 corresponds to either the node of the input layer or the intermediate layer. Further, the second element corresponds to the node of the next stage, which is the node to which the value is transmitted from the node corresponding to the first element. Further, the weight of the first element corresponds to a connection coefficient which is a weight considered for the value transmitted from the node corresponding to the first element to the node corresponding to the second element.
生成装置50は、上述した回帰モデルやニューラルネットワーク等、任意の構造を有するモデルを用いて、検索クエリが各カテゴリに属する確率の算出を行う。具体的には、モデルデータMDT2は、検索クエリが入力された場合に、検索クエリが各カテゴリに属する確率を出力するように係数が設定される。生成装置50は、このようなモデルデータMDT2を用いて、検索クエリが各カテゴリに属する確率を算出する。
The
なお、上記例では、モデルデータMDT2が、検索クエリが入力された場合に、検索クエリの分散表現を出力するモデル(以下、モデルX2という。)である例を示した。しかし、実施形態に係るモデルデータMDT2は、モデルX2にデータの入出力を繰り返すことで得られる結果に基づいて生成されるモデルであってもよい。例えば、モデルデータMDT2は、検索クエリを入力とした際に、モデルX2が出力した分散表現を入力して学習されたモデル(以下、モデルY2という。)であってもよい。または、モデルデータMDT2は、検索クエリを入力とし、モデルY2の出力値を出力とするよう学習されたモデルであってもよい。 In the above example, the model data MDT2 is a model (hereinafter referred to as model X2) that outputs a distributed representation of the search query when the search query is input. However, the model data MDT2 according to the embodiment may be a model generated based on the result obtained by repeating the input / output of data to the model X2. For example, the model data MDT2 may be a model (hereinafter referred to as model Y2) learned by inputting the distributed representation output by the model X2 when the search query is input. Alternatively, the model data MDT2 may be a model trained to input a search query and output the output value of the model Y2.
また、生成装置50がGAN(Generative Adversarial Networks)を用いた推定処理を行う場合、モデルデータMDT2は、GANの一部を構成するモデルであってもよい。
Further, when the
(制御部52)
図13の説明に戻って、制御部52は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、生成装置50内部の記憶装置に記憶されている各種プログラム(生成プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部52は、コントローラであり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
(Control unit 52)
Returning to the description of FIG. 13, the control unit 52 is a controller, and is stored in a storage device inside the
また、制御部52は、モデル情報記憶部535に記憶されている第1モデルM1(モデルデータMDT1)に従った情報処理により、入力層に入力された検索クエリに対し、出力層以外の各層に属する各要素を第1要素として、第1要素と第1要素の重みとに基づく演算を行うことにより、分散表現を出力層から出力するよう、コンピュータを機能させる。
Further, the control unit 52 sends the search query input to the input layer to each layer other than the output layer by information processing according to the first model M1 (model data MDT1) stored in the model
また、制御部52は、モデル情報記憶部535に記憶されている第2モデルM2(モデルデータMDT2)に従った情報処理により、入力層に入力された検索クエリに対し、出力層以外の各層に属する各要素を第1要素として、第1要素と第1要素の重みとに基づく演算を行うことにより、検索クエリが各カテゴリに属する確率を出力層から出力するよう、コンピュータを機能させる。
Further, the control unit 52 sends the search query input to the input layer to each layer other than the output layer by information processing according to the second model M2 (model data MDT2) stored in the model
図13に示すように、制御部52は、取得部521と、抽出部522と、生成部523を有し、以下に説明する情報処理の作用を実現または実行する。なお、制御部52の内部構成は、図13に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。
As shown in FIG. 13, the control unit 52 includes an acquisition unit 521, an extraction unit 522, and a
(取得部521)
取得部521は、種々の情報を取得する。具体的には、取得部521は、ユーザによって入力された検索クエリを検索サーバ20から取得する。取得部521は、ユーザによって入力された検索クエリを取得すると、取得した検索クエリをクエリ情報記憶部531に格納する。また、取得部521は、検索クエリの分散表現であるベクトルに関するベクトル情報を取得する。取得部521は、ベクトル情報を取得すると、取得したベクトル情報をベクトル情報記憶部532に格納する。また、取得部521は、検索クエリと検索クエリが属するカテゴリの分類を定義する情報を取得する。取得部521は、検索クエリと検索クエリが属するカテゴリの分類を定義する分類定義情報を取得すると、取得した分類定義情報を分類定義記憶部533に格納する。また、取得部521は、検索クエリが属するカテゴリに関するカテゴリ情報を取得する。取得部521は、カテゴリ情報を取得すると、取得したカテゴリ情報をカテゴリ情報記憶部534に格納する。
(Acquisition unit 521)
The acquisition unit 521 acquires various information. Specifically, the acquisition unit 521 acquires the search query input by the user from the
(抽出部522)
抽出部522は、種々の情報を抽出する。具体的には、抽出部522は、取得部521によって取得された検索クエリのうち、同一のユーザによって所定の時間内に入力された複数の検索クエリを抽出する。例えば、抽出部522は、同一のユーザによって各検索クエリが入力された時間の間隔が所定の時間内である複数の検索クエリを抽出する。続いて、抽出部522は、同一のユーザによって所定の時間内に入力された複数の検索クエリのうち、同一のユーザによって所定の時間内に連続して入力された一対の検索クエリを抽出する。例えば、抽出部522は、同一のユーザによって各検索クエリのペアが入力された時間の間隔が所定の時間内である複数の検索クエリを抽出する。例えば、抽出部522は、取得部521によって取得された検索クエリのうち、同一のユーザU1によって所定の時間内に連続して入力された4個の検索クエリである検索クエリQ11(「六本木 パスタ」)、検索クエリQ12(「六本木 イタリアン」)、検索クエリQ13(「赤坂 パスタ」)、検索クエリQ14(「麻布 パスタ」)を抽出する。抽出部522は、検索クエリが入力された順番に並べると、検索クエリQ11、検索クエリQ12、検索クエリQ13、検索クエリQ14の順番で入力された4個の検索クエリを抽出する。続いて、抽出部522は、4個の検索クエリを抽出すると、時系列的に隣り合う2つの検索クエリを一対の検索クエリとして、3対の検索クエリのペアである(検索クエリQ11、検索クエリQ12)、(検索クエリQ12、検索クエリQ13)、(検索クエリQ13、検索クエリQ14)を抽出する。なお、抽出部522は、同一のユーザによって全ての検索クエリが所定の時間内に入力された複数の検索クエリを抽出してもよい。そして、抽出部522は、時系列的に隣り合うか否かに関わらず、抽出した複数の検索クエリの中から2つの検索クエリを選択して、選択した2つの検索クエリを一対の検索クエリとして抽出してもよい。
(Extraction unit 522)
The extraction unit 522 extracts various information. Specifically, the extraction unit 522 extracts a plurality of search queries input by the same user within a predetermined time from the search queries acquired by the acquisition unit 521. For example, the extraction unit 522 extracts a plurality of search queries in which the time interval in which each search query is input by the same user is within a predetermined time. Subsequently, the extraction unit 522 extracts a pair of search queries continuously input by the same user within a predetermined time from among a plurality of search queries input by the same user within a predetermined time. For example, the extraction unit 522 extracts a plurality of search queries in which the time interval in which each search query pair is input by the same user is within a predetermined time. For example, the extraction unit 522 is a search query Q11 (“Roppongi pasta”” which is four search queries continuously input by the same user U1 within a predetermined time among the search queries acquired by the acquisition unit 521. ), Search query Q12 (“Roppongi Italian”), search query Q13 (“Akasaka pasta”), and search query Q14 (“Azabu pasta”). When the search queries are arranged in the order in which the search queries are input, the extraction unit 522 extracts four search queries input in the order of search query Q11, search query Q12, search query Q13, and search query Q14. Subsequently, when the extraction unit 522 extracts four search queries, it is a pair of three pairs of search queries (search query Q11, search query), with two search queries adjacent in chronological order as a pair of search queries. Q12), (search query Q12, search query Q13), (search query Q13, search query Q14) are extracted. The extraction unit 522 may extract a plurality of search queries in which all the search queries are input by the same user within a predetermined time. Then, the extraction unit 522 selects two search queries from the plurality of extracted search queries regardless of whether they are adjacent to each other in chronological order, and the two selected search queries are used as a pair of search queries. It may be extracted.
また、抽出部522は、取得部521によって取得された検索クエリのうち、所定の検索クエリと所定の検索クエリに無関係な他の検索クエリとを抽出する。例えば、抽出部522は、取得部521によって取得された検索クエリの中から、所定の検索クエリを抽出する。続いて、抽出部522は、取得部521によって取得された検索クエリの中から、所定の検索クエリとは無関係にランダムに他の検索クエリを抽出する。 Further, the extraction unit 522 extracts a predetermined search query and other search queries unrelated to the predetermined search query from the search queries acquired by the acquisition unit 521. For example, the extraction unit 522 extracts a predetermined search query from the search queries acquired by the acquisition unit 521. Subsequently, the extraction unit 522 randomly extracts other search queries from the search queries acquired by the acquisition unit 521, regardless of the predetermined search query.
(生成部523)
生成部523は、種々の情報を生成する。具体的には、生成部523は、取得部521によって取得された検索クエリのうち、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして学習することで、所定の検索クエリから所定の検索クエリの特徴情報を予測する学習モデルを生成する。具体的には、生成部523は、同一のユーザによって所定の時間内に入力された複数の検索クエリの分散表現が類似するように学習モデルを学習させることで、所定の検索クエリから所定の検索クエリの特徴情報を予測する学習モデルを生成する。例えば、生成部523は、所定の時間内に続けて入力された一対の検索クエリの分散表現が類似するように学習することで、学習モデルを生成する。例えば、生成部523は、一対の検索クエリの学習前の分散表現の類似度の値を算出する。また、生成部523は、一対の検索クエリの学習後の分散表現の類似度の値を算出する。続いて、生成部523は、学習前の分散表現の類似度の値よりも、学習後の分散表現の類似度の値が大きくなるように学習モデルを学習させる。このように、生成部523は、一対の検索クエリに対応する一対の分散表現である2つのベクトルが分散表現空間上で類似するように学習モデルを学習させることで、検索クエリから分散表現を出力する学習モデルを生成する。より具体的には、生成部523は、RNNの一種であるLSTMを分散表現生成に用いたDSSMの技術を用いて、検索クエリから分散表現を出力する学習モデルを生成する。例えば、生成部523は、学習モデルの正解データとして、同一のユーザによって所定の時間内に入力された一対の検索クエリが類似する特徴を有するものとして、所定の検索クエリの分散表現と、所定の検索クエリと対となる他の検索クエリの分散表現とが、分散表現空間上で近くに存在するように学習する。また、生成部523は、第1学習モデルを生成すると、第1学習モデルを識別する識別情報と対応付けて、生成した第1学習モデル(モデルデータMDT1)をモデル情報記憶部535に格納する。
(Generation unit 523)
The
〔2−4.第1学習モデルの一例〕
ここで、図19を用いて生成装置50が生成する第1学習モデルの一例について説明する。図19は、実施形態に係る第1学習モデルの一例を示す図である。図19に示す例では、生成装置50が生成する第1学習モデルM1は、3層のLSTM RNNで構成されている。図19に示す例では、抽出部522は、同一のユーザU1によって所定の時間内に連続して入力された「六本木 パスタ」という検索クエリQ11と「六本木 イタリアン」という検索クエリQ12とから成る一対の検索クエリを抽出する。生成部523は、抽出部522によって抽出されたた検索クエリQ11を第1学習モデルM1の入力層に入力する(ステップS41)。
[2-4. An example of the first learning model]
Here, an example of the first learning model generated by the
続いて、生成部523は、第1学習モデルM1の出力層から検索クエリQ11の分散表現である256次元のベクトルBQV11を出力する。また、生成部523は、抽出部522によって抽出された検索クエリQ12を第1学習モデルM1の入力層に入力する。続いて、生成部523は、第1学習モデルM1の出力層から検索クエリQ12の分散表現である256次元のベクトルBQV12を出力する(ステップS42)。
Subsequently, the
続いて、生成部523は、連続して入力された2つの検索クエリの分散表現が類似するように学習することで、検索クエリから分散表現を出力する第1学習モデルM1を生成する(ステップS43)。例えば、第1学習モデルM1にフィードバックをかける前(学習前)の検索クエリQ11の分散表現であるベクトルBQV11と検索クエリQ12の分散表現であるベクトルBQV12とのなす角度の大きさをΘとする。また、第1学習モデルM1にフィードバックをかけた後(学習後)の検索クエリQ11の分散表現であるベクトルQV11と検索クエリQ12の分散表現であるベクトルQV12とのなす角度の大きさをΦとする。この時、生成部523は、ΘよりもΦが小さくなるように、第1学習モデルM1を学習させる。例えば、生成部523は、ベクトルBQV11とベクトルBQV12のコサイン類似度の値を算出する。また、生成部523は、ベクトルQV11とベクトルQV12のコサイン類似度の値を算出する。続いて、生成部523は、ベクトルBQV11とベクトルBQV12のコサイン類似度の値よりも、ベクトルQV11とベクトルQV12のコサイン類似度の値が大きくなるように(値が1に近づくように)学習モデルM1を学習させる。このように、生成部523は、一対の検索クエリに対応する一対の分散表現である2つのベクトルが分散表現空間上で類似するように第1学習モデルM1を学習させることで、検索クエリから分散表現を出力する第1学習モデルM1を生成する。なお、生成部523は、コサイン類似度に限らず、ベクトル間の距離尺度として適用可能な指標であれば、どのような指標に基づいて分散表現の間の類似度を算出してもよい。また、生成部523は、ベクトル間の距離尺度として適用可能な指標であれば、どのような指標に基づいて学習モデルM1を学習させてもよい。例えば、生成部523は、分散表現同士のユークリッド距離や双曲空間等の非ユークリッド空間中での距離、マンハッタン距離、マハラノビス距離等といった所定の距離関数の値を算出する。続いて、生成部523は、分散表現同士の所定の距離関数の値(すなわち、分散表現空間における距離)が小さくなるように学習モデルM1を学習させてもよい。
Subsequently, the
また、生成部523は、同一のユーザによって所定の時間内に入力された複数の検索クエリとして、所定の区切り文字で区切られた文字列を含む複数の検索クエリが類似する特徴を有するものとして学習することで、第1学習モデルを生成する。例えば、生成部523は、地名を示す「六本木」と食品の種類を示す「パスタ」の文字とが区切り文字であるスペースで区切られた検索クエリ「六本木 パスタ」と、地名を示す「六本木」と料理の種類を示す「イタリアン」の文字とが区切り文字であるスペースで区切られた検索クエリ「六本木 イタリアン」とが類似する特徴を有するものとして学習することで、第1学習モデルを生成する。
Further, the
また、生成部523は、取得部521によって取得された検索クエリのうち、ランダムに抽出された複数の検索クエリが相違する特徴を有するものとして学習することで、第1学習モデルを生成する。具体的には、生成部523は、取得部521によって取得された検索クエリのうち、ランダムに抽出された一対の検索クエリの分散表現が相違するように学習することで、第1学習モデルを生成する。例えば、生成部523は、抽出部522によって抽出された所定の検索クエリの分散表現と、所定の検索クエリとは無関係にランダムに抽出された検索クエリの分散表現とが分散表現空間上で遠くにマッピングされるように第1学習モデルM1のトレーニングを行う。
Further, the
また、生成部523は、第2学習モデルを生成する。具体的には、生成部523は、モデル情報記憶部535を参照して、生成部523によって生成された第1学習モデル(第1学習モデルM1のモデルデータMDT1)を取得する。続いて、生成部523は、取得した第1学習モデルを用いて、所定の検索クエリから所定の検索クエリが属するカテゴリを予測する第2学習モデルを生成する。生成部523は、第1モデルM1を取得すると、取得した第1モデルM1を用いて、第2学習モデルM2を生成する。生成部523は、第1モデルM1を再学習させることにより、第1モデルM1とは学習モデルの重みである接続係数が異なる第2モデルM2を生成する。具体的には、生成部523は、検索クエリが学習モデルに入力された際に、学習モデルが出力する分散表現の分類結果が、検索クエリが属するカテゴリに対応するように学習することで、所定の検索クエリから所定の検索クエリが属するカテゴリを予測する第2モデルM2を生成する。
In addition, the
具体的には、生成部523は、検索クエリが学習モデルに入力された際に、学習モデルが出力する分散表現の分類結果が、検索クエリが属するカテゴリに対応するように学習することで、所定の検索クエリから所定の検索クエリが属するカテゴリを予測する第2学習モデルを生成する。生成部523は、入力情報として検索クエリが学習モデルに入力された際に、出力情報として検索クエリが属するカテゴリ毎の確率を出力する第2学習モデルを生成する。例えば、生成部523は、第1モデルM1を用いて、入力情報として所定の検索クエリが学習モデルに入力された際に、出力情報として検索クエリの分散表現がそのカテゴリに分類される確率をカテゴリ毎に出力する第2モデルM2を生成する。生成部523は、入力情報として所定の検索クエリが入力されると、出力情報として所定の検索クエリの分散表現が正解カテゴリに分類される確率が所定の閾値を超えるように第2モデルを学習させる。そして、生成部523は、入力情報として所定の検索クエリが入力された際に、所定の検索クエリの分散表現がそのカテゴリに属する確率が所定の閾値を超えるカテゴリを、所定の検索クエリのカテゴリとして出力する第2モデルM2を生成する。また、生成部523は、第2学習モデルを生成すると、第2学習モデルを識別する識別情報と対応付けて、生成した第2学習モデル(モデルデータMDT2)をモデル情報記憶部535に格納する。
Specifically, the
例えば、生成部523は、図18に示すモデル情報記憶部535を参照して、第1モデルM1(第1モデルM1のモデルデータMDT1)を取得する。続いて、生成部523は、図16に示す分類定義記憶部533を参照して、検索クエリを分類するカテゴリの大分類を選択する。続いて、生成部523は、大分類を選択すると、第2モデルM2の学習データとして、検索クエリと検索クエリが属する小分類との組を学習する。
For example, the
例えば、検索クエリQ11(「六本木 パスタ」)が属する正解カテゴリがCAT11(「飲食店を探す」)であるとする。生成部523は、入力情報として検索クエリQ11(「六本木 パスタ」)が第2モデルM2に入力された際に、第2モデルM2の出力層から検索クエリQ11(「六本木 パスタ」)の分散表現であるベクトルBQV11を出力する。ここで、ベクトルBQV11は、第2モデルM2の出力層から出力されたばかりの検索クエリQ11の分散表現であって、第2モデルM2にフィードバックをかける前(学習前)の分散表現を示す。この場合、生成部523は、出力された検索クエリQ11(「六本木 パスタ」)の分散表現であるベクトルBQV11が正解カテゴリCAT11(「飲食店を探す」)に分類される確率が所定の閾値を超えるように第2モデルM2を学習させる。
For example, assume that the correct answer category to which the search query Q11 (“Roppongi pasta”) belongs is CAT11 (“find a restaurant”). When the search query Q11 (“Roppongi pasta”) is input to the second model M2 as input information, the
例えば、生成部523は、学習前の第2モデルM2に検索クエリQ11(「六本木 パスタ」)が入力された際に、分散表現であるベクトルBQV11がCAT11(「飲食店を探す」)に分類される確率を80%、CAT12(「商品を探す」)に分類される確率を0%、CAT13(「飲食店を予約」)に分類される確率を20%、CAT14(「商品を購入する」)に分類される確率を0%と出力したとする。この場合、生成部523は、分散表現であるベクトルBQV11がCAT11(「飲食店を探す」)に分類される確率を所定の閾値(例えば、90%)を超えるように第2モデルM2を学習させる。また、生成部523は、分散表現であるベクトルBQV11がCAT11(「飲食店を探す」)に分類される確率が所定の閾値(例えば、90%)を超えるように学習させるのに合わせて、分散表現であるベクトルBQV11が他のカテゴリCAT13(「飲食店を予約」)に分類される確率を10%に下げるように第2モデルM2を学習させる。続いて、生成部523は、学習済みの第2モデルM2に入力情報として検索クエリQ11(「六本木 パスタ」)が入力されると、検索クエリQ11(「六本木 パスタ」)の分散表現であるベクトルBQV11がカテゴリCAT11(「飲食店を探す」)に属する確率が90%を超えるので、出力情報として検索クエリが属するカテゴリをCAT11(「飲食店を探す」)と出力する。
For example, in the
なお、生成部523は、大分類として、任意の数の大分類を選択してもよい。そして、生成部523は、入力情報として検索クエリが第2モデルM2に入力された際に、出力情報として検索クエリが選択した任意の数の大分類に属する各小分類に属する確率を小分類毎に出力する第2モデルM2を生成してもよい。また、生成部523は、大分類として、全ての大分類を選択してもよい。そして、生成部523は、検索クエリが第2モデルM2に入力された際に、各小分類に属する確率を全ての小分類毎に出力する第2モデルM2を生成してもよい。
The
〔2−5.第2学習モデルの一例〕
ここで、図20を用いて生成装置50が生成する第2学習モデルの一例について説明する。図20は、実施形態に係る第2学習モデルの一例を示す図である。図20に示す例では、生成装置50が生成する第2学習モデルM2は、第1学習モデルM1を用いて生成される。すなわち、生成装置50は、第1学習モデルM1を再学習させることにより、第1学習モデルM1とは学習モデルの重みである接続係数が異なる第2学習モデルM2を生成する。
[2-5. An example of the second learning model]
Here, an example of the second learning model generated by the
より具体的には、生成装置50が生成する第2学習モデルM2は、第1学習モデルM1と同様に、3層のLSTM RNNで構成されている。図20に示す例では、抽出部522は、ユーザU1によって入力された「六本木 パスタ」という検索クエリQ11を第2学習モデルM2の入力層に入力する(ステップS51)。
More specifically, the second learning model M2 generated by the
続いて、生成部523は、第2学習モデルM2の出力層から検索クエリQ11の分散表現である256次元のベクトルBQV11を出力する(ステップS52)。
Subsequently, the
続いて、生成部523は、検索クエリQ11の分散表現であるベクトルBQV11が各カテゴリに分類される確率を出力する(ステップS53)。
Subsequently, the
続いて、生成部523は、検索クエリQ11の分散表現であるベクトルBQV11が正解カテゴリに分類される確率を高くするように第2学習モデルM2を学習することで、検索クエリから検索クエリのカテゴリを予測する第2モデルを生成する(ステップS54)。
Subsequently, the
〔2−6.第1学習モデルの生成処理のフロー〕
次に、図21を用いて、実施形態に係る第1学習モデルの生成処理の手順について説明する。図21は、実施形態に係る第1学習モデルの生成処理手順を示すフローチャートである。
[2-6. Flow of generation process of the first learning model]
Next, the procedure for generating the first learning model according to the embodiment will be described with reference to FIG. 21. FIG. 21 is a flowchart showing a generation processing procedure of the first learning model according to the embodiment.
図21に示す例では、生成装置50は、ユーザによって入力された検索クエリを取得する(ステップS1001)。
In the example shown in FIG. 21, the
続いて、生成装置50は、同一のユーザによって所定の時間内に入力された複数の検索クエリを抽出する(ステップS1002)。
Subsequently, the
続いて、生成装置50は、抽出した複数の検索クエリが類似する特徴を有するものとして学習することで、所定の検索クエリから所定の検索クエリの特徴情報を予測する第1学習モデルを生成する(ステップS1003)。
Subsequently, the
〔2−7.第2学習モデルの生成処理のフロー〕
次に、図22を用いて、実施形態に係る第2学習モデルの生成処理の手順について説明する。図22は、実施形態に係る第2学習モデルの生成処理の手順を示すフローチャートである。
[2-7. Flow of generation process of the second learning model]
Next, the procedure for generating the second learning model according to the embodiment will be described with reference to FIG. 22. FIG. 22 is a flowchart showing the procedure of the generation process of the second learning model according to the embodiment.
図22に示す例では、生成装置50は、第1学習モデル(第1学習モデルM1のモデルデータMDT1)を取得する(ステップS2001)。
In the example shown in FIG. 22, the
続いて、生成装置50は、第1学習モデルを用いて、所定の検索クエリから所定の検索クエリのカテゴリを予測する第2学習モデルを生成する(ステップS2002)。
Subsequently, the
〔3.効果〕
上述してきたように、実施形態に係る情報処理装置100は、取得部131と推定部133と抽出部134を備える。取得部131は、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして複数の検索クエリが有する特徴を学習した第1学習モデルを用いて生成された第2学習モデルであって、所定の検索クエリから所定の検索クエリが属するカテゴリを予測する第2学習モデルを取得する。推定部133は、取得部131によって取得された第2学習モデルを用いて、検索クエリとして入力された文字列によって示される対象が属するカテゴリを推定する。抽出部134は、推定部133によって推定されたカテゴリに基づいて、文字列の中から、対象分野に属する抽出対象を示す対象文字列を抽出する。
[3. effect〕
As described above, the
これにより、情報処理装置100は、検索クエリとして入力された文字列が未知用語である場合であっても、未知用語によって示される対象が属するカテゴリを推定することができるため、所定のカテゴリに属する対象を示す文字列を精度よく抽出することができる。例えば、情報処理装置100は、未知用語に対して対象分野とは異なる非対象分野を示すカテゴリが推定された場合には、その未知用語を不要な文字列として取り除くことができる。また、情報処理装置100は、流入検索クエリとして入力された文字列が未知用語である場合であっても、未知用語に対して対象分野を示すカテゴリが推定された場合には、その未知用語を対象分野に属する対象文字列として抽出することができる。したがって、本願発明に係る情報処理装置100は、所定のカテゴリに属する対象を示す文字列を適切に抽出することができる。
As a result, the
また、一般的に、ユーザはある意図を持って検索を複数回行うと考えられるため、所定の時間内に連続して入力された検索クエリは、検索意図が近いという仮定が成り立つ。そこで、本願発明に係る生成装置50は、所定の時間内に連続して入力された複数の検索クエリは、所定の検索意図の下で検索された検索クエリであるという点で、相互に類似する特徴を有する検索クエリであるとみなして第1モデルM1を学習させる。これにより、生成装置50は、検索意図を考慮した検索クエリの特徴を第1モデルM1に学習させることができる。そして、生成装置50は、検索意図を考慮した検索クエリの特徴を学習した第1モデルM1を活用して、所定の検索クエリから所定の検索クエリのカテゴリを予測する第2モデルを効率的に生成することができる。これにより、生成装置50は、検索クエリを入力したユーザの検索意図を考慮したカテゴリに検索クエリを分類することを可能にする。また、従来、検索クエリをカテゴリに分類し、高い分類精度を得るためには、十分な量の正解データを用意することが必要であった。しかしながら、検索クエリ自体、多種多様であり、ロングテイルな性質を持つものであるため、多数の検索クエリに対応する正解カテゴリをラベル付けするのは、非常に手間がかかり困難である。ここで、生成装置50は、検索意図を考慮した検索クエリの特徴を学習させた第1モデルを出発点として第2モデルを学習させることにより、正解カテゴリをラベル付けする代わりに、ユーザの検索意図(検索クエリを入力したユーザのコンテクスト)を一種の正解として、検索クエリのカテゴリを予測する第2モデルを学習させることができる。これにより、生成装置50は、人手で検索クエリの正解カテゴリをラベル付けすることなく、第2モデルを学習させることができる。すなわち、第2モデルは、正解データが少ないときでも、十分な分類精度を得られるようになる。また、第2モデルは、正解データが多いときであれば、さらに高い分類精度を得られるようになる。したがって、情報処理装置100は、検索クエリの分類精度を高めることができる。
Further, since it is generally considered that the user performs a search a plurality of times with a certain intention, it is assumed that the search queries continuously input within a predetermined time have similar search intentions. Therefore, the
また、推定部133は、文字列によって示される対象が属する複数のカテゴリを推定する。また、推定部133は、文字列によって示される対象が各カテゴリに属する確率をカテゴリ毎に出力する。
Further, the
これにより、情報処理装置100は、文字列によって示される対象が属するカテゴリとして、対象分野を示すカテゴリと複数の非対象分野を示すカテゴリとを同時に推定することができる。
Thereby, the
また、抽出部134は、推定部133によって推定されたカテゴリの中に、対象分野を示すカテゴリを含む文字列を対象文字列として抽出する。
Further, the extraction unit 134 extracts a character string including the category indicating the target field from the categories estimated by the
これにより、情報処理装置100は、対象分野に属する対象を示す文字列を適切に抽出することができる。
As a result, the
また、抽出部134は、推定部133によって推定されたカテゴリの中に、不要なカテゴリとして登録された不要カテゴリを含まない文字列を対象文字列として抽出する。
Further, the extraction unit 134 extracts a character string that does not include the unnecessary category registered as an unnecessary category from the categories estimated by the
これにより、情報処理装置100は、非対象分野に属する対象を示す文字列を適切に取り除くことができる。
As a result, the
また、実施形態に係る情報処理装置100は、処理部132をさらに備える。処理部132は、対象分野に関するサイトに流入した流入検索クエリを取得し、流入検索クエリとして入力された文字列から、不要な文字列として登録された不要文字列を取り除いた第1文字列を取得する。推定部133は、処理部132によって取得された第1文字列によって示される対象が属するカテゴリを推定する。
Further, the
これにより、情報処理装置100は、辞書ベースで取り除くことができる文字列については、あらかじめ取り除いておくことで、第2学習モデルに入力される入力情報の精度を高めることができる。したがって、情報処理装置100は、第2学習モデルによって推定されるカテゴリの推定精度を高めることができる。
As a result, the
また、取得部131は、同一のユーザによって所定の時間内に入力された一対の検索クエリの分散表現が類似する特徴を有するものとして複数の検索クエリが有する特徴を学習した第1学習モデルを用いて生成された第2学習モデルであって、所定の検索クエリから所定の検索クエリが属するカテゴリを予測する第2学習モデルを取得する。
Further, the
一般的に、同一のユーザが短時間に続けて入力した2つの検索クエリは、検索意図が同一であるか、同一でなくとも検索意図が近いと考えられる。すなわち、所定の時間内に続けて入力された一対の検索クエリは、検索意図が同一であるか、同一でなくとも検索意図が近いと考えられる。すなわち、生成装置50は、所定の時間内に続けて入力された一対の検索クエリの分散表現が類似するように学習させることにより、第1モデルの学習精度を向上させることができる。したがって、生成装置50は、学習精度が向上した第1モデルを用いて第2モデルを生成することができるので、第2モデルの学習精度を向上させることができる。
In general, two search queries entered by the same user in succession in a short period of time are considered to have the same search intent or similar search intents even if they are not the same. That is, it is considered that the pair of search queries that are continuously input within a predetermined time have the same search intent, or the search intents are close even if they are not the same. That is, the
また、取得部131は、同一のユーザによって所定の時間内に入力された複数の検索クエリとして、所定の区切り文字で区切られた文字列を含む複数の検索クエリが類似する特徴を有するものとして学習することで、複数の検索クエリが類似する特徴を有するものとして、複数の検索クエリが有する特徴を学習した第1学習モデルを用いて生成された第2学習モデルであって、所定の検索クエリから所定の検索クエリが属するカテゴリを予測する第2学習モデルを取得する。
Further, the
一般的に、単体の文字列からなる検索クエリよりも、複数の文字列を含む検索クエリのほうが、検索意図がより明確であると考えられる。すなわち、生成装置50は、所定の区切り文字で区切られた文字列を含む検索クエリを用いて学習させることにより、第1モデルの学習精度を向上させることができる。したがって、生成装置50は、学習精度が向上した第1モデルを用いて第2モデルを生成することができるので、第2モデルの学習精度を向上させることができる。
In general, a search query containing a plurality of character strings is considered to have a clearer search intent than a search query consisting of a single character string. That is, the
また、取得部131は、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして複数の検索クエリが有する特徴を学習した第1学習モデルであって、ランダムに抽出された複数の検索クエリが相違する特徴を有するものとして学習することで、複数の検索クエリが有する特徴を学習した第1学習モデルを用いて生成された第2学習モデルであって、所定の検索クエリから所定の検索クエリが属するカテゴリを予測する第2学習モデルを取得する。また、取得部131は、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして複数の検索クエリが有する特徴を学習した第1学習モデルであって、ランダムに抽出された一対の検索クエリの分散表現が相違するように学習することで、複数の検索クエリが有する特徴を学習した第1学習モデルを用いて生成された第2学習モデルであって、所定の検索クエリから所定の検索クエリが属するカテゴリを予測する第2学習モデルを取得する。
Further, the
一般的に、ランダムに抽出された複数の検索クエリは、互いに無関係に入力された検索クエリであるため、検索意図が異なるか、検索意図が遠いと考えられる。そこで、本願発明に係る生成装置50は、ランダムに抽出された複数の検索クエリは、異なる検索意図の下で検索された検索クエリであるという点で、相互に相違する特徴を有する検索クエリであるとみなして学習モデルM1を学習させる。これにより、学習モデルは、検索意図が近い検索クエリのペアである正解データに加えて、検索意図が遠い検索クエリのペアである不正解データを学習することができる。すなわち、生成装置50は、第1モデルの学習精度を向上させることができる。したがって、生成装置50は、学習精度が向上した第1モデルを用いて第2モデルを生成することができるので、第2モデルの学習精度を向上させることができる。
In general, a plurality of randomly extracted search queries are search queries that are input independently of each other, so it is considered that the search intents are different or the search intents are distant. Therefore, the
また、取得部131は、同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして複数の検索クエリが有する特徴を学習した第1学習モデルを用いて生成された第2学習モデルであって、検索クエリが第2学習モデルに入力された際に、第2学習モデルが出力する分散表現の分類結果が、検索クエリが属するカテゴリに対応するように学習することで、所定の検索クエリから所定の検索クエリが属するカテゴリを予測する第2学習モデルを取得する。また、取得部131は、入力情報として所定の検索クエリが入力された際に、出力情報として所定の検索クエリの分散表現を出力する第1学習モデルを用いて生成された第2学習モデルを取得する。また、取得部131は、入力情報として検索クエリが第2学習モデルに入力された際に、出力情報として検索クエリがカテゴリに属する確率をカテゴリ毎に出力する第2学習モデルを取得する。
Further, the
これにより、生成装置50は、検索意図を考慮した検索クエリの特徴を含む分散表現を活用して、検索クエリを入力したユーザの検索意図を考慮したカテゴリに検索クエリを分類する第2学習モデルを効率的に生成することができる。すなわち、生成装置50は、検索クエリを入力したユーザの検索意図を考慮したカテゴリに検索クエリを分類することを可能にする。したがって、生成装置50は、検索クエリの分類精度を高めることができる。
As a result, the
〔4.ハードウェア構成〕
また、上述してきた実施形態に係る情報処理装置100および実施形態に係る生成装置50は、例えば図23に示すような構成のコンピュータ1000によって実現される。図23は、情報処理装置100および生成装置50の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を備える。
[4. Hardware configuration]
Further, the
CPU1100は、ROM1300またはHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。
The
HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を格納する。通信インターフェイス1500は、所定の通信網を介して他の機器からデータを受信してCPU1100へ送り、CPU1100が生成したデータを所定の通信網を介して他の機器へ送信する。
The
CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、生成したデータを入出力インターフェイス1600を介して出力装置へ出力する。
The
メディアインターフェイス1700は、記録媒体1800に格納されたプログラムまたはデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
The
例えば、コンピュータ1000が情報処理装置100または生成装置50として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部130または制御部52の機能を実現する。コンピュータ1000のCPU1100は、これらのプログラムを記録媒体1800から読み取って実行するが、他の例として、他の装置から所定の通信網を介してこれらのプログラムを取得してもよい。
For example, when the
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。 Although some of the embodiments of the present application have been described in detail with reference to the drawings, these are examples, and various modifications are made based on the knowledge of those skilled in the art, including the embodiments described in the disclosure column of the invention. It is possible to carry out the present invention in other modified forms.
〔5.その他〕
また、上記実施形態及び変形例において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
[5. others〕
Further, among the processes described in the above-described embodiments and modifications, all or part of the processes described as being automatically performed can be manually performed, or are described as being manually performed. It is also possible to automatically perform all or part of the performed processing by a known method. In addition, information including processing procedures, specific names, various data and parameters shown in the above documents and drawings can be arbitrarily changed unless otherwise specified. For example, the various information shown in each figure is not limited to the information shown in the figure.
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。 Further, each component of each of the illustrated devices is a functional concept, and does not necessarily have to be physically configured as shown in the figure. That is, the specific form of distribution / integration of each device is not limited to the one shown in the figure, and all or part of them may be functionally or physically distributed / physically distributed in any unit according to various loads and usage conditions. Can be integrated and configured.
また、上述してきた実施形態及び変形例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。 Further, the above-described embodiments and modifications can be appropriately combined as long as the processing contents do not contradict each other.
また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、抽出部は、抽出手段や抽出回路に読み替えることができる。 Further, the above-mentioned "section, module, unit" can be read as "means" or "circuit". For example, the extraction unit can be read as an extraction means or an extraction circuit.
1 情報処理システム
10 ユーザ端末
20 検索サーバ
50 生成装置
100 情報処理装置
110 通信部
120 記憶部
121 クエリ情報記憶部
122 不要文字列記憶部
123 不要カテゴリ記憶部
124 モデル情報記憶部
130 制御部
131 取得部
132 処理部
133 推定部
134 抽出部
1
Claims (15)
前記取得部によって取得された第2学習モデルを用いて、検索クエリとして入力された文字列によって示される対象が属するカテゴリを推定する推定部と、
前記推定部によって推定されたカテゴリに基づいて、前記文字列の中から、前記カテゴリに対応する対象分野に属する抽出対象を示す対象文字列を抽出する抽出部
を備えることを特徴とする情報処理装置。 In the second learning model generated by using the first learning model in which the characteristics of the plurality of search queries are trained assuming that the plurality of search queries input by the same user within a predetermined time have similar characteristics. There is an acquisition unit that acquires the second learning model that predicts the category to which the predetermined search query belongs from the predetermined search query.
Using the second learning model acquired by the acquisition unit, an estimation unit that estimates the category to which the target indicated by the character string input as a search query belongs, and an estimation unit.
An information processing apparatus including an information processing unit that extracts a target character string indicating an extraction target belonging to a target field corresponding to the category from the character string based on a category estimated by the estimation unit. ..
前記文字列によって示される対象が属する複数のカテゴリを推定する
ことを特徴とする請求項1に記載の情報処理装置。 The estimation unit
The information processing apparatus according to claim 1, wherein a plurality of categories to which the object indicated by the character string belongs are estimated.
前記文字列によって示される対象が各カテゴリに属する確率をカテゴリ毎に出力する
ことを特徴とする請求項2に記載の情報処理装置。 The estimation unit
The information processing apparatus according to claim 2, wherein the probability that the object indicated by the character string belongs to each category is output for each category.
前記推定部によって推定されたカテゴリの中に、前記対象分野を示すカテゴリを含む文字列を前記対象文字列として抽出する
ことを特徴とする請求項1〜3のいずれか一つに記載の情報処理装置。 The extraction unit
The information processing according to any one of claims 1 to 3, wherein a character string including a category indicating the target field is extracted as the target character string from the categories estimated by the estimation unit. Device.
前記推定部によって推定されたカテゴリの中に、不要なカテゴリとして登録された不要カテゴリを含まない文字列を前記対象文字列として抽出する
ことを特徴とする請求項1〜4のいずれか一つに記載の情報処理装置。 The extraction unit
One of claims 1 to 4, wherein a character string that does not include an unnecessary category registered as an unnecessary category is extracted as the target character string from the categories estimated by the estimation unit. The information processing device described.
前記推定部は、
前記処理部によって取得された第1文字列によって示される対象が属するカテゴリを推定する
ことを特徴とする請求項1〜5のいずれか一つに記載の情報処理装置。 A processing unit that acquires an inflow search query that has flowed into a site related to the target field, and acquires a first character string obtained by removing an unnecessary character string registered as an unnecessary character string from the character string input as the inflow search query. Further prepared,
The estimation unit
The information processing apparatus according to any one of claims 1 to 5, wherein the category to which the object indicated by the first character string acquired by the processing unit belongs is estimated.
同一のユーザによって所定の時間内に入力された一対の検索クエリの分散表現が類似する特徴を有するものとして複数の検索クエリが有する特徴を学習した第1学習モデルを用いて生成された第2学習モデルであって、所定の検索クエリから前記所定の検索クエリが属するカテゴリを予測する前記第2学習モデルを取得する
ことを特徴とする請求項1〜6のいずれか一つに記載の情報処理装置。 The acquisition unit
The second learning generated by using the first learning model in which the characteristics of a plurality of search queries are learned as the distributed representations of a pair of search queries input by the same user within a predetermined time have similar characteristics. The information processing apparatus according to any one of claims 1 to 6, further comprising acquiring the second learning model, which is a model and predicts a category to which the predetermined search query belongs from a predetermined search query. ..
同一のユーザによって所定の時間内に入力された複数の検索クエリとして、所定の区切り文字で区切られた文字列を含む複数の検索クエリが類似する特徴を有するものとして学習することで、前記複数の検索クエリが類似する特徴を有するものとして、前記複数の検索クエリが有する特徴を学習した第1学習モデルを用いて生成された第2学習モデルであって、所定の検索クエリから前記所定の検索クエリが属するカテゴリを予測する前記第2学習モデルを取得する
ことを特徴とする請求項1〜7のいずれか一つに記載の情報処理装置。 The acquisition unit
As a plurality of search queries input by the same user within a predetermined time, the plurality of search queries including a character string separated by a predetermined delimiter are learned as having similar characteristics. Assuming that the search queries have similar characteristics, it is a second learning model generated by using the first learning model that has learned the characteristics of the plurality of search queries, and is the predetermined search query from the predetermined search query. The information processing apparatus according to any one of claims 1 to 7, wherein the second learning model for predicting the category to which the second learning model belongs is acquired.
同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして前記複数の検索クエリが有する特徴を学習した第1学習モデルであって、ランダムに抽出された複数の検索クエリが相違する特徴を有するものとして学習することで、前記複数の検索クエリが有する特徴を学習した前記第1学習モデルを用いて生成された第2学習モデルであって、所定の検索クエリから前記所定の検索クエリが属するカテゴリを予測する前記第2学習モデルを取得する
ことを特徴とする請求項1〜8のいずれか一つに記載の情報処理装置。 The acquisition unit
A first learning model in which a plurality of search queries input by the same user within a predetermined time have similar characteristics and the characteristics of the plurality of search queries are learned, and a plurality of randomly extracted search queries. A second learning model generated by using the first learning model in which the characteristics of the plurality of search queries are learned by learning the search queries as having different characteristics, from a predetermined search query. The information processing apparatus according to any one of claims 1 to 8, wherein the second learning model for predicting the category to which the predetermined search query belongs is acquired.
同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして前記複数の検索クエリが有する特徴を学習した第1学習モデルであって、ランダムに抽出された一対の検索クエリの分散表現が相違するように学習することで、前記複数の検索クエリが有する特徴を学習した前記第1学習モデルを用いて生成された第2学習モデルであって、所定の検索クエリから前記所定の検索クエリが属するカテゴリを予測する前記第2学習モデルを取得する
ことを特徴とする請求項1〜9のいずれか一つに記載の情報処理装置。 The acquisition unit
A first learning model in which a plurality of search queries entered by the same user within a predetermined time learn the characteristics of the plurality of search queries as having similar characteristics, and a pair of randomly extracted search queries. It is a second learning model generated by using the first learning model that learned the characteristics of the plurality of search queries by learning so that the distributed expressions of the search queries are different, and is from a predetermined search query. The information processing apparatus according to any one of claims 1 to 9, wherein the second learning model for predicting a category to which the predetermined search query belongs is acquired.
同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして前記複数の検索クエリが有する特徴を学習した第1学習モデルを用いて生成された第2学習モデルであって、検索クエリが前記第2学習モデルに入力された際に、前記第2学習モデルが出力する分散表現の分類結果が、前記検索クエリが属するカテゴリに対応するように学習することで、所定の検索クエリから前記所定の検索クエリが属するカテゴリを予測する前記第2学習モデルを取得する
ことを特徴とする請求項1〜10のいずれか一つに記載の情報処理装置。 The acquisition unit
In the second learning model generated by using the first learning model in which the characteristics of the plurality of search queries are trained assuming that the plurality of search queries input by the same user within a predetermined time have similar characteristics. Therefore, when the search query is input to the second learning model, the classification result of the distributed expression output by the second learning model is learned so as to correspond to the category to which the search query belongs. The information processing apparatus according to any one of claims 1 to 10, wherein the second learning model that predicts the category to which the predetermined search query belongs is acquired from the search query of.
入力情報として所定の検索クエリが入力された際に、出力情報として前記所定の検索クエリの分散表現を出力する前記第1学習モデルを用いて生成された前記第2学習モデルを取得する
ことを特徴とする請求項1〜11のいずれか一つに記載の情報処理装置。 The acquisition unit
When a predetermined search query is input as input information, the second learning model generated by using the first learning model that outputs a distributed representation of the predetermined search query as output information is acquired. The information processing apparatus according to any one of claims 1 to 11.
入力情報として検索クエリが前記第2学習モデルに入力された際に、出力情報として前記検索クエリが前記カテゴリに属する確率をカテゴリ毎に出力する前記第2学習モデルを取得する
ことを特徴とする請求項1〜12のいずれか一つに記載の情報処理装置。 The acquisition unit
When a search query is input to the second learning model as input information, a request characterized by acquiring the second learning model that outputs the probability that the search query belongs to the category as output information for each category. Item 6. The information processing apparatus according to any one of Items 1 to 12.
同一のユーザによって所定の時間内に入力された複数の検索クエリが類似する特徴を有するものとして前記複数の検索クエリが有する特徴を学習した第1学習モデルを用いて生成された第2学習モデルであって、所定の検索クエリから前記所定の検索クエリが属するカテゴリを予測する前記第2学習モデルを取得する取得工程と、
前記取得工程によって取得された第2学習モデルを用いて、検索クエリとして入力された文字列によって示される対象が属するカテゴリを推定する推定工程と、
前記推定工程によって推定されたカテゴリに基づいて、前記文字列の中から、前記カテゴリに対応する対象分野に属する抽出対象を示す対象文字列を抽出する抽出工程
を含むことを特徴とする情報処理方法。 It is an information processing method executed by a computer.
In the second learning model generated by using the first learning model in which the characteristics of the plurality of search queries are trained assuming that the plurality of search queries input by the same user within a predetermined time have similar characteristics. Therefore, the acquisition process of acquiring the second learning model that predicts the category to which the predetermined search query belongs from the predetermined search query, and
Using the second learning model acquired by the acquisition process, an estimation process for estimating the category to which the target indicated by the character string input as a search query belongs, and an estimation process.
An information processing method comprising an extraction step of extracting a target character string indicating an extraction target belonging to a target field corresponding to the category from the character string based on a category estimated by the estimation step. ..
前記取得手順によって取得された第2学習モデルを用いて、検索クエリとして入力された文字列によって示される対象が属するカテゴリを推定する推定手順と、
前記推定手順によって推定されたカテゴリに基づいて、前記文字列の中から、前記カテゴリに対応する対象分野に属する抽出対象を示す対象文字列を抽出する抽出手順
をコンピュータに実行させることを特徴とする情報処理プログラム。 In the second learning model generated by using the first learning model in which the characteristics of the plurality of search queries are trained assuming that the plurality of search queries input by the same user within a predetermined time have similar characteristics. Therefore, the acquisition procedure for acquiring the second learning model that predicts the category to which the predetermined search query belongs from the predetermined search query, and the acquisition procedure.
Using the second learning model acquired by the acquisition procedure, an estimation procedure for estimating the category to which the target indicated by the character string input as a search query belongs, and an estimation procedure.
Based on the category estimated by the estimation procedure, the computer is made to execute an extraction procedure for extracting a target character string indicating an extraction target belonging to the target field corresponding to the category from the character string. Information processing program.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019140358A JP6979986B2 (en) | 2019-07-30 | 2019-07-30 | Information processing equipment, information processing methods and information processing programs |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019140358A JP6979986B2 (en) | 2019-07-30 | 2019-07-30 | Information processing equipment, information processing methods and information processing programs |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021022343A JP2021022343A (en) | 2021-02-18 |
JP6979986B2 true JP6979986B2 (en) | 2021-12-15 |
Family
ID=74574839
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019140358A Active JP6979986B2 (en) | 2019-07-30 | 2019-07-30 | Information processing equipment, information processing methods and information processing programs |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6979986B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2022180796A1 (en) * | 2021-02-26 | 2022-09-01 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5426526B2 (en) * | 2010-12-21 | 2014-02-26 | 日本電信電話株式会社 | Probabilistic information search processing device, probabilistic information search processing method, and probabilistic information search processing program |
JP6479239B1 (en) * | 2018-04-19 | 2019-03-06 | ヤフー株式会社 | Information processing apparatus, information processing system, information processing method, and program |
-
2019
- 2019-07-30 JP JP2019140358A patent/JP6979986B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2021022343A (en) | 2021-02-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ak et al. | Learning attribute representations with localization for flexible fashion search | |
Zhao et al. | Memory-augmented attribute manipulation networks for interactive fashion search | |
Yao et al. | An ensemble model for fake online review detection based on data resampling, feature pruning, and parameter optimization | |
US20210073891A1 (en) | Complementary item recommendations based on multi-modal embeddings | |
KR20190117584A (en) | Method and apparatus for detecting, filtering and identifying objects in streaming video | |
CN111444372B (en) | System and method for image processing | |
Chen et al. | Modeling fashion | |
JP5794036B2 (en) | Image search apparatus, image search method, and program | |
Uricchio et al. | An evaluation of nearest-neighbor methods for tag refinement | |
Sapna et al. | Recommendence and fashionsence: Online fashion advisor for offline experience | |
JP6979986B2 (en) | Information processing equipment, information processing methods and information processing programs | |
JP2020129192A (en) | Information processing device, information processing method, and information processing program | |
CN106997350A (en) | A kind of method and device of data processing | |
Papadopoulos et al. | Attentive hierarchical label sharing for enhanced garment and attribute classification of fashion imagery | |
Zhao et al. | Big transfer learning for fine art classification | |
Jaradat et al. | Dynamic CNN models for fashion recommendation in Instagram | |
JP7282218B2 (en) | Image retrieval method and apparatus | |
JP6852114B2 (en) | Specific device, specific method and specific program | |
US20220100792A1 (en) | Method, device, and program for retrieving image data by using deep learning algorithm | |
JP7177013B2 (en) | Information processing device, information processing method and information processing program | |
JP6584613B1 (en) | Information processing apparatus, information processing method, and information processing program | |
Celikik et al. | Outfit generation and recommendation—An experimental study | |
Karessli et al. | Learning size and fit from fashion images | |
JP6553793B1 (en) | Information processing apparatus, information processing method, and information processing program | |
Betul et al. | A visual similarity recommendation system using generative adversarial networks |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20191101 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20191108 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200309 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210212 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210309 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210507 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20211019 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20211116 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6979986 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |