JP7231322B2 - LEARNING DEVICE, LEARNING METHOD, LEARNING PROGRAM AND PROGRAM - Google Patents
LEARNING DEVICE, LEARNING METHOD, LEARNING PROGRAM AND PROGRAM Download PDFInfo
- Publication number
- JP7231322B2 JP7231322B2 JP2017137434A JP2017137434A JP7231322B2 JP 7231322 B2 JP7231322 B2 JP 7231322B2 JP 2017137434 A JP2017137434 A JP 2017137434A JP 2017137434 A JP2017137434 A JP 2017137434A JP 7231322 B2 JP7231322 B2 JP 7231322B2
- Authority
- JP
- Japan
- Prior art keywords
- user
- user information
- information
- learning
- predetermined
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 38
- PWPJGUXAGUPAHP-UHFFFAOYSA-N lufenuron Chemical compound C1=C(Cl)C(OC(F)(F)C(C(F)(F)F)F)=CC(Cl)=C1NC(=O)NC(=O)C1=C(F)C=CC=C1F PWPJGUXAGUPAHP-UHFFFAOYSA-N 0.000 title 2
- 230000009471 action Effects 0.000 claims description 59
- 230000006399 behavior Effects 0.000 claims description 46
- 238000004364 calculation method Methods 0.000 claims description 9
- 238000012549 training Methods 0.000 claims description 5
- 238000010187 selection method Methods 0.000 claims 2
- 238000012545 processing Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 239000000284 extract Substances 0.000 description 5
- 230000010365 information processing Effects 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012937 correction Methods 0.000 description 3
- 238000011478 gradient descent method Methods 0.000 description 3
- 238000012417 linear regression Methods 0.000 description 3
- 238000007477 logistic regression Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 235000014510 cooky Nutrition 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000003542 behavioural effect Effects 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
本発明は、学習装置、学習方法、学習プログラム及びプログラムに関する。 The present invention relates to a learning device, a learning method, a learning program and a program .
従来、特定のユーザに関するユーザ情報を用いて、当該特定のユーザと行動が類似する類似ユーザを特定する技術が知られている。例えば、特定のユーザに関するユーザ情報に基づいて、当該特定のユーザの行動についての行動予測モデルを生成し、生成された行動予測モデルを用いて、当該特定のユーザと行動が類似する類似ユーザを特定する技術が知られている。 Conventionally, there is known a technique of specifying similar users whose behavior is similar to that of a specific user using user information about the specific user. For example, based on user information about a specific user, generate a behavior prediction model for the specific user's behavior, and use the generated behavior prediction model to identify similar users whose behavior is similar to that of the specific user. There are known techniques for
しかしながら、上記の従来技術では、特定のユーザと行動が類似する類似ユーザを特定することができるとは限らない。例えば、上記の従来技術では、特定のユーザに関するユーザ情報が不十分な場合には、行動予測モデルの精度が低くなるため、特定のユーザと行動が類似する類似ユーザを特定することができるとは限らない。 However, with the conventional technology described above, it is not always possible to identify similar users whose behavior is similar to that of a specific user. For example, in the conventional technology described above, if the user information regarding a specific user is insufficient, the accuracy of the behavior prediction model will be low. Not exclusively.
本願は、上記に鑑みてなされたものであって、特定のユーザと行動が類似する類似ユーザを特定することができる学習装置、学習方法、学習プログラム、学習用データ及びモデルを提供することを目的とする。 The present application has been made in view of the above, and aims to provide a learning device, a learning method, a learning program, learning data, and a model that can identify similar users whose behavior is similar to that of a specific user. and
本願に係る学習装置は、第1行動を行った第1ユーザの第1ユーザ情報との類似性に基づいて、当該第1ユーザと異なる第2ユーザを選択する選択部と、前記選択部によって選択された前記第2ユーザが前記第1行動を行ったものとした場合の前記第2ユーザの第2ユーザ情報と、前記第1ユーザ情報とを用いて、前記第1行動の予測モデルを学習する学習部と、を備えたことを特徴とする。 A learning device according to the present application includes a selection unit that selects a second user different from the first user based on similarity with first user information of a first user who has performed a first action, and selection by the selection unit. learning a predictive model of the first action using the second user information of the second user and the first user information when the second user is assumed to have performed the first action and a learning unit.
実施形態の一態様によれば、特定のユーザと行動が類似する類似ユーザを特定することができるという効果を奏する。 According to one aspect of the embodiment, it is possible to identify similar users whose behavior is similar to that of a specific user.
以下に、本願に係る学習装置、学習方法、学習プログラム、学習用データ及びモデルを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る学習装置、学習方法、学習プログラム、学習用データ及びモデルが限定されるものではない。また、各実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。 A learning device, a learning method, a learning program, learning data, and a mode for implementing a model (hereinafter referred to as "embodiments") according to the present application will be described in detail below with reference to the drawings. Note that the learning device, learning method, learning program, learning data and model according to the present application are not limited to this embodiment. Further, each embodiment can be appropriately combined within a range that does not contradict the processing contents. Also, in each of the following embodiments, the same parts are denoted by the same reference numerals, and overlapping descriptions are omitted.
〔1.ネットワークシステムの構成〕
まず、図1を用いて、実施形態に係るネットワークシステム1の構成について説明する。図1に示すように、実施形態に係るネットワークシステム1には、端末装置101~10n(総称して「10」)と、情報提供装置20と、学習装置100とが含まれる。端末装置10、情報提供装置20、学習装置100は、それぞれネットワークNと有線又は無線により接続される。なお、図1では、ネットワークシステム1に、1台の情報提供装置20と、1台の学習装置100とが含まれる例を示したが、ネットワークシステム1には、複数台の情報提供装置20や、複数台の学習装置100が含まれてもよい。
[1. Network system configuration]
First, the configuration of the
端末装置10は、ユーザによって利用される情報処理装置である。端末装置10は、デスクトップ型PC(Personal Computer)、タブレット型PC、スマートフォン、PDA(Personal Digital Assistant)を含む、任意のタイプの情報処理装置であってもよい。 The terminal device 10 is an information processing device used by a user. The terminal device 10 may be any type of information processing device including a desktop PC (Personal Computer), a tablet PC, a smart phone, and a PDA (Personal Digital Assistant).
情報提供装置20は、各種情報を端末装置10に提供するサーバ装置である。例えば、情報提供装置20は、端末装置10に対してウェブサイトを提供する。なお、ウェブサイトは、ショッピングサイト、ニュースサイト、オークションサイト、天気予報サイト、ファイナンス(株価)サイト、路線検索サイト、地図提供サイト、旅行サイト、飲食店紹介サイト、アンケートサイト、ウェブブログを含む、任意のタイプのウェブサイトであってよい。また、ウェブサイトは、ショッピング、ニュース、オークション、天気予報、ファイナンス(株価)、路線情報、地図情報、アンケートなどのコンテンツを含む、任意のタイプのポータルサイトであってよい。ただし、「ウェブサイト」という用語は、「アプリケーション」を含むように広義に解釈し得る。例えば、「ポータルサイト」という用語は、スマートフォン上で実行するアプリケーションのポータルサイトを意味するものと解釈し得る。 The information providing device 20 is a server device that provides various information to the terminal device 10 . For example, the information providing device 20 provides a website to the terminal device 10 . Websites include shopping sites, news sites, auction sites, weather forecast sites, finance (stock prices) sites, route search sites, map providing sites, travel sites, restaurant introduction sites, survey sites, and web blogs. type of website. Also, the website may be any type of portal site, including content such as shopping, news, auctions, weather forecasts, finance (stock prices), route information, map information, surveys, and the like. However, the term "website" may be interpreted broadly to include "applications." For example, the term "portal" may be interpreted to mean an application portal that runs on a smart phone.
また、情報提供装置20は、ウェブサイトを通して、端末装置10のユーザに関連するユーザ情報を受信する。そして、情報提供装置20は、ウェブサイトを通して受信されたユーザ情報を、学習装置100に提供する。 The information providing device 20 also receives user information related to the user of the terminal device 10 through the website. The information providing device 20 then provides the learning device 100 with the user information received through the website.
学習装置100は、情報提供装置20から提供されたユーザ情報から規則性や法則性を学習するサーバ装置である。例えば、学習装置100は、情報提供装置20から提供されたユーザ情報を用いて、ユーザの行動についての予測モデルを学習する。 The learning device 100 is a server device that learns regularities and rules from user information provided from the information providing device 20 . For example, the learning device 100 uses user information provided from the information providing device 20 to learn a predictive model of user behavior.
〔2.学習処理〕
次に、図2を用いて、実施形態に係る学習装置による学習処理の一例について説明する。図2は、実施形態に係る学習装置による学習処理の一例を示す説明図である。
[2. Learning process]
Next, an example of learning processing by the learning device according to the embodiment will be described with reference to FIG. FIG. 2 is an explanatory diagram showing an example of learning processing by the learning device according to the embodiment.
はじめに、学習装置100は、端末装置10のユーザに関連するユーザ情報を、情報提供装置20から受信する。例えば、学習装置100は、情報提供装置20によって提供されるウェブサイト上でのユーザの行動についての行動履歴情報を、情報提供装置20から受信する。図1の例では、行動履歴情報は、ユーザの購入履歴情報を含む。 First, the study device 100 receives user information related to the user of the terminal device 10 from the information providing device 20 . For example, the learning device 100 receives from the information providing device 20 action history information about the user's actions on the website provided by the information providing device 20 . In the example of FIG. 1, the action history information includes user's purchase history information.
続いて、学習装置100は、ユーザ情報に含まれる複数のユーザのうちから、特定の行動を行ったユーザを、当該特定の行動についての予測モデルの学習に用いる「正解ユーザ」として選択する。例えば、学習装置100は、ユーザの購入履歴情報を参照し、特定の商品を購入したユーザを、特定の商品の購入についての予測モデルの学習に用いる正解ユーザとして選択する。図1の例では、学習装置100は、パソコンを購入したユーザを、パソコンの購入についての予測モデルM1の学習に用いる正解ユーザC1として選択する。 Next, learning device 100 selects a user who has performed a specific action from among multiple users included in the user information as a “correct user” to be used for learning a prediction model for the specific action. For example, the learning device 100 refers to the user's purchase history information and selects a user who purchased a specific product as a correct user to be used for learning a prediction model for purchasing the specific product. In the example of FIG. 1, the learning device 100 selects the user who purchased the personal computer as the correct user C1 to be used for learning the prediction model M1 regarding the purchase of the personal computer.
図2では、例示を目的として、パソコンを購入した複数のユーザを、複数の正解ユーザC1の集合E1として示している。図2の例では、複数の正解ユーザC1の集合E1は、ユーザU1、ユーザU2及びユーザU3を含む。図2中では図示していないが、複数の正解ユーザC1の集合E1は、ユーザU1、ユーザU2及びユーザU3以外の複数の正解ユーザC1を含み得る。 In FIG. 2, for purposes of illustration, multiple users who have purchased personal computers are shown as a set E1 of multiple correct users C1. In the example of FIG. 2, a set E1 of multiple correct users C1 includes user U1, user U2, and user U3. Although not shown in FIG. 2, a set E1 of multiple correct users C1 may include multiple correct users C1 other than user U1, user U2, and user U3.
続いて、学習装置100は、特定の行動を行ったユーザのユーザ情報との類似性に基づいて、ユーザ情報に含まれる複数のユーザのうちから、当該特定の行動を行ったユーザと異なるユーザを、当該特定の行動についての予測モデルの学習に用いる「補助ユーザ」として選択する。例えば、学習装置100は、特定の行動と類似する行動を行ったユーザを、補助ユーザとして選択する。 Subsequently, learning device 100 selects a user who is different from the user who has performed the specific behavior from among the plurality of users included in the user information based on the similarity of the user who has performed the specific behavior with the user information. , as the "assistant user" to use in training the predictive model for that particular behavior. For example, learning device 100 selects a user who has performed an action similar to a specific action as an auxiliary user.
1つの例では、学習装置100は、ユーザの購入履歴情報に含まれる複数の商品を参照し、参照された商品の間で上位分類が共通するか否かに基づいて、補助ユーザを選択することができる。図1の例では、学習装置100は、パソコンに対応する上位分類「情報端末」をユーザ情報から読み出し、読みだした上位分類「情報端末」に対応する商品「スマートフォン」を購入したユーザを、パソコンの購入についての予測モデルM1の学習に用いる補助ユーザA1として選択する。 In one example, the learning device 100 refers to a plurality of products included in the user's purchase history information, and selects the assistant user based on whether or not the referenced products have a common upper classification. can be done. In the example of FIG. 1, the learning device 100 reads out the upper class "information terminal" corresponding to the personal computer from the user information, and assigns the user who purchased the product "smartphone" corresponding to the read superclass "information terminal" to the personal computer. is selected as the auxiliary user A1 to be used for learning the prediction model M1 regarding the purchase of .
図2では、例示を目的として、スマートフォンを購入した複数のユーザを、複数の補助ユーザA1の集合E2として示している。図2の例では、複数の補助ユーザA1の集合E2は、ユーザU4、ユーザU5、ユーザU6及びユーザU7を含む。図2中では図示していないが、複数の補助ユーザA1の集合E2は、ユーザU4、ユーザU5、ユーザU6及びユーザU7以外の複数の補助ユーザA1を含み得る。 In FIG. 2, for illustrative purposes, multiple users who have purchased smart phones are shown as a set E2 of multiple auxiliary users A1. In the example of FIG. 2, the set E2 of multiple auxiliary users A1 includes user U4, user U5, user U6 and user U7. Although not shown in FIG. 2, the set E2 of multiple auxiliary users A1 may include multiple auxiliary users A1 other than user U4, user U5, user U6, and user U7.
続いて、学習装置100は、正解ユーザのユーザ情報に、第1の重みを割り当てる。図1の例では、学習装置100は、正解ユーザC1のユーザ情報に、重み「1」を割り当てる(ステップS11)。ここで、重みは、ユーザの行動についての予測モデルを学習する際に用いられるパラメータである。具体的には、重みは、ユーザ情報が予測モデルの学習に与える影響の大きさを示すパラメータである。一例として、重みは、勾配降下法における学習率(学習係数とも呼ばれる)に補正係数として乗ぜられ得る。 Subsequently, learning device 100 assigns the first weight to the user information of the correct user. In the example of FIG. 1, the learning device 100 assigns the weight "1" to the user information of the correct user C1 (step S11). Here, the weight is a parameter used when learning a predictive model for user behavior. Specifically, the weight is a parameter that indicates the magnitude of the influence of user information on the learning of the prediction model. As an example, the weight can be multiplied as a correction factor by the learning rate (also called learning factor) in gradient descent.
続いて、学習装置100は、補助ユーザが特定の行動を行ったものとした場合の補助ユーザのユーザ情報に、第1の重みよりも小さい第2の重みを割り当てる。図1の例では、学習装置100は、補助ユーザA1がパソコンを購入したものとした場合の補助ユーザA1のユーザ情報に、「1」よりも小さい重みを割り当てる(ステップS12)。 Subsequently, learning device 100 assigns a second weight, which is smaller than the first weight, to the user information of the assistant user when the assistant user has performed a specific action. In the example of FIG. 1, the learning device 100 assigns a weight smaller than "1" to the user information of the assistant user A1 when the assistant user A1 has purchased a personal computer (step S12).
続いて、学習装置100は、補助ユーザが特定の行動を行ったものとした場合の補助ユーザのユーザ情報と、正解ユーザのユーザ情報とを用いて、当該特定の行動の予測モデルを学習する。図1の例では、補助ユーザA1がパソコンを購入したものとした場合の補助ユーザA1のユーザ情報と、パソコンを購入した正解ユーザC1のユーザ情報とを用いて、パソコンの購入についての予測モデルM1を学習する(ステップS13)。例えば、学習装置100は、所定のユーザの検索履歴情報を説明変数とし、当該所定のユーザがパソコンを購入する確率を目的変数とする予測モデルM1を学習する。 Subsequently, the learning device 100 learns a prediction model of the specific behavior using the user information of the assistant user and the user information of the correct user when the assistant user performs the specific behavior. In the example of FIG. 1, a predictive model M1 for the purchase of a personal computer is obtained by using the user information of the auxiliary user A1 and the user information of the correct user C1 who purchased the personal computer. is learned (step S13). For example, the learning device 100 learns a prediction model M1 that uses search history information of a given user as an explanatory variable and the probability that the given user will purchase a personal computer as an objective variable.
その後、学習装置100は、学習された予測モデルを、情報提供装置20に提供する。図1の例では、学習装置100は、パソコンの購入についての予測モデルM1を、情報提供装置20に提供する。 After that, the learning device 100 provides the learned prediction model to the information providing device 20 . In the example of FIG. 1, the learning device 100 provides the information providing device 20 with a predictive model M1 regarding the purchase of a personal computer.
このように、実施形態に係る学習装置100は、特定の行動を行った正解ユーザのユーザ情報との類似性に基づいて、当該特定の行動を行った正解ユーザと異なるユーザを、当該特定の行動についての予測モデルの学習に用いる補助ユーザとして選択する。そして、学習装置100は、補助ユーザが特定の行動を行ったものとした場合の補助ユーザのユーザ情報と、特定の行動を行った正解ユーザのユーザ情報とを用いて、当該特定の行動の予測モデルを学習する。 In this way, the learning device 100 according to the embodiment selects a user who is different from the correct user who performed a specific action based on the similarity with the user information of the correct user who performed the specific action. Select as an auxiliary user to use in training a predictive model for Then, the learning device 100 predicts the specific behavior using the user information of the assistant user when the assistant user has performed the specific behavior and the user information of the correct user who has performed the specific behavior. learn the model.
これにより、実施形態に係る学習装置100は、特定のユーザと行動が類似する類似ユーザを特定することができる。より詳細に説明すると、一般的に、ユーザの行動についての予測モデルの精度は、当該行動を行った正解ユーザのユーザ情報の量に依存する。学習装置100は、正解ユーザのユーザ情報の量が不十分である場合でも、正解ユーザのユーザ情報に加えて、補助ユーザのユーザ情報を用いて、ユーザの行動についての予測モデルを学習することができる。この結果、学習装置100は、正解ユーザのユーザ情報の量が不十分である場合でも、正解ユーザと行動が類似する類似ユーザを精度よく特定することができる。以下、このような学習処理を実現する学習装置100について詳細に説明する。 As a result, the learning device 100 according to the embodiment can identify similar users whose behavior is similar to that of a specific user. More specifically, generally, the accuracy of a predictive model for user behavior depends on the amount of user information about the correct user who performed the behavior. Even if the amount of user information of the correct user is insufficient, the learning device 100 can learn a predictive model of the user's behavior using the user information of the auxiliary user in addition to the user information of the correct user. can. As a result, the learning device 100 can accurately identify similar users whose behavior is similar to that of the correct user even when the amount of user information of the correct user is insufficient. The learning device 100 that implements such learning processing will be described in detail below.
〔3.学習装置の構成〕
次に、図3を用いて、実施形態に係る学習装置100の構成について説明する。図3は、実施形態に係る学習装置100の構成例を示す図である。図3に示すように、学習装置100は、通信部110と、ユーザ情報記憶部120と、制御部130とを有する。なお、提供装置100は、提供装置100を利用する管理者等から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を表示するための表示部(液晶ディスプレイ等)を有してもよい。
[3. Configuration of learning device]
Next, the configuration of the learning device 100 according to the embodiment will be described using FIG. FIG. 3 is a diagram showing a configuration example of the learning device 100 according to the embodiment. As shown in FIG. 3 , learning device 100 includes communication section 110 , user
(通信部110)
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。図1に示すように、通信部110は、ネットワークNと有線又は無線により接続され、ネットワークNを介して、端末装置10や情報提供装置20との間で情報の送受信を行う。
(Communication unit 110)
The communication unit 110 is realized by, for example, a NIC (Network Interface Card) or the like. As shown in FIG. 1, the communication unit 110 is connected to the network N by wire or wirelessly, and transmits and receives information to and from the terminal device 10 and the information providing device 20 via the network N.
(ユーザ情報記憶部120)
ユーザ情報記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。図3に示すように、ユーザ情報記憶部120は、購入履歴情報記憶部121と、検索履歴情報記憶部122と、予測モデル情報記憶部123とを記憶する。
(User information storage unit 120)
The user
(購入履歴情報記憶部121)
購入履歴情報記憶部121は、ユーザの購入履歴情報を記憶する。例えば、購入履歴情報記憶部121は、受信部131によって受信されたユーザの購入履歴情報を記憶する。ここで、図4に、実施形態に係る購入履歴情報記憶部121の一例を示す。図4の例では、購入履歴情報記憶部121には、「購入履歴情報」が「ユーザID」ごとに記憶される。例示として、「購入履歴情報」には、項目「商品」、「購入時刻」、「下位分類」及び「上位分類」が含まれる。
(Purchase history information storage unit 121)
The purchase history
「ユーザID」は、端末装置10のユーザを識別するための識別子を示す。情報提供装置20と端末装置10との間でHTTP(Hypertext Transfer Protocol)クッキー等が送受信される場合には、HTTPクッキーにユーザIDが設定されてもよい。 “User ID” indicates an identifier for identifying the user of the terminal device 10 . When an HTTP (Hypertext Transfer Protocol) cookie or the like is transmitted and received between the information providing device 20 and the terminal device 10, the user ID may be set in the HTTP cookie.
「商品」は、ユーザが情報提供装置20によって提供されるウェブサイトにおいて購入した商品を示す。「購入時刻」は、ユーザが商品を購入した時刻を示す。「下位分類」は、商品が属する商品グループの下位区分を示す。「上位分類」は、商品が属する商品グループを示す。すなわち、図4は、ユーザID「U1」で識別されるユーザが、下位分類「パソコン」及び上位分類「情報端末」に属する商品「パソコンX1」を、「2017年6月20日午後11時59分」に購入したことを示している。 “Product” indicates the product purchased by the user on the website provided by the information providing device 20 . "Purchase time" indicates the time when the user purchased the product. "Subclass" indicates a subdivision of the product group to which the product belongs. "Superior classification" indicates the product group to which the product belongs. That is, FIG. 4 shows that the user identified by the user ID "U1" purchased the product "PC X1" belonging to the lower class "PC" and the higher class "Information terminal" at "June 20, 2017 at 11:59 pm. It shows that it was purchased in minutes.
(検索履歴情報記憶部122)
検索履歴情報記憶部122は、ユーザの検索履歴情報を記憶する。例えば、検索履歴情報記憶部122は、受信部131によって受信されたユーザの検索履歴情報を記憶する。ここで、図5に、実施形態に係る検索履歴情報記憶部122の一例を示す。図5の例では、検索履歴情報記憶部122には、「検索履歴情報」が「ユーザID」ごとに記憶される。例示として、「検索履歴情報」には、項目「検索クエリ」及び「検索時刻」が含まれる。
(Search history information storage unit 122)
The search history
「検索クエリ」は、ユーザが情報提供装置20によって提供されるウェブサイトにおいて入力した検索クエリを示す。「検索時刻」は、ユーザが検索クエリを入力した時刻を示す。すなわち、図5は、ユーザID「U1」で識別されるユーザが、検索クエリ「パソコン」を、「2017年6月20日午後11時59分」に入力したことを示している。 “Search query” indicates a search query input by the user on the website provided by the information providing device 20 . "Search time" indicates the time when the user entered the search query. That is, FIG. 5 shows that the user identified by the user ID "U1" entered the search query "personal computer" at "June 20, 2017 at 11:59 PM".
(予測モデル情報記憶部123)
予測モデル情報記憶部123は、選択部132によって選択された学習用データを記憶する。ここで、予測モデル情報記憶部123に記憶されている学習用データは、各ユーザのユーザ情報と、各ユーザに対応付けられるパラメータであって、各ユーザの学習における影響度を示すパラメータとを含む学習用データであって、入力層と出力層とを有し、入力層から出力層までのいずれかの層であって出力層以外の層に属する第1要素と、第1要素と第1要素の重みとに基づいて値が算出される第2要素と、入力層に入力されたユーザ情報に対し、出力層以外の各層に属する各要素を第1要素として、第1要素と第1要素の重みとに基づく演算を行うモデルの入力層に入力されることにより、演算結果を示す出力値をモデルの出力層から出力させ、ユーザ情報に対応するパラメータに応じて決定される正解値と出力値との比較に基づく学習を行なうよう、コンピュータを機能させるための学習用データである。例えば、予測モデル情報記憶部123に記憶されている学習用データは、正解ユーザ及び補助ユーザのそれぞれのユーザ情報と、正解ユーザ及び補助ユーザにそれぞれ対応付けられるパラメータであって、正解ユーザ及び補助ユーザのそれぞれの学習における影響度を示すパラメータとを含む学習用データであって、入力層と出力層とを有し、入力層から出力層までのいずれかの層であって出力層以外の層に属する第1要素と、第1要素と第1要素の重みとに基づいて値が算出される第2要素と、入力層に入力されたユーザ情報に対し、出力層以外の各層に属する各要素を第1要素として、第1要素と第1要素の重みとに基づく演算を行うモデルの入力層に入力されることにより、演算結果を示す出力値をモデルの出力層から出力させ、ユーザ情報に対応するパラメータに応じて決定される正解値と出力値との比較に基づく学習を行なうよう、コンピュータを機能させるための学習用データである。
(Prediction model information storage unit 123)
The prediction model
また、予測モデル情報記憶部123は、学習部133によって学習された予測モデルを記憶する。ここで、予測モデル情報記憶部123に記憶されている予測モデルは、ユーザの学習における影響度を示すパラメータが対応付けられたユーザ情報が入力される入力層と、出力層と、入力層から出力層までのいずれかの層であって出力層以外の層に属する第1要素と、第1要素と第1要素の重みとに基づいて値が算出される第2要素と、を含み、入力層に入力された情報に対し、出力層以外の各層に属する各要素を第1要素として、第1要素と第1要素の重みとに基づく演算を行うことにより、ユーザの情報の提供に用いられるスコアの値を出力層から出力する、ユーザ情報に対応するパラメータに応じて決定される正解値と出力値との比較に基づいて学習されるよう、コンピュータを機能させ生成されたモデルである。例えば、予測モデル情報記憶部123に記憶されている予測モデルは、ユーザ情報が予測モデルの学習に与える影響の大きさを示すパラメータが対応付けられたユーザ情報が入力される入力層と、出力層と、入力層から出力層までのいずれかの層であって出力層以外の層に属する第1要素と、第1要素と第1要素の重みとに基づいて値が算出される第2要素と、を含み、入力層に入力された情報に対し、出力層以外の各層に属する各要素を第1要素として、第1要素と第1要素の重みとに基づく演算を行うことにより、ユーザ情報に対応するユーザが特定の行動を行う確率に関する値を出力層から出力する、ユーザ情報に対応するパラメータに応じて決定される正解値と出力値との比較に基づいて学習されるよう、コンピュータを機能させ生成されたモデルである。
Also, the prediction model
ここで、予測モデルが「y=a1*x1+a2*x2+・・・+ai*xi」で示す回帰モデルで実現されるとする。この場合、予測モデルが含む第1要素は、x1やx2等といった入力データ(xi)に対応する。また、第1要素の重みは、xiに対応する係数aiに対応する。ここで、回帰モデルは、入力層と出力層とを有する単純パーセプトロンと見做すことができる。各モデルを単純パーセプトロンと見做した場合、第1要素は、入力層が有するいずれかのノードに対応し、第2要素は、出力層が有するノードと見做すことができる。 Here, it is assumed that the prediction model is realized by a regression model indicated by "y=a1*x1+a2*x2+...+ai*xi". In this case, the first element included in the prediction model corresponds to the input data (xi) such as x1 and x2. Also, the weight of the first element corresponds to the coefficient ai corresponding to xi. Here, the regression model can be viewed as a simple perceptron with an input layer and an output layer. When each model is regarded as a simple perceptron, the first element can be regarded as a node of the input layer, and the second element can be regarded as a node of the output layer.
また、予測モデルがDNN(Deep Neural Network)等、1つまたは複数の中間層を有するニューラルネットワークで実現されるとする。この場合、予測モデルが含む第1要素は、入力層または中間層が有するいずれかのノードに対応する。また、第2要素は、第1要素と対応するノードから値が伝達されるノードである次段のノードに対応する。また、第1要素の重みは、第1要素と対応するノードから第2要素と対応するノードに伝達される値に対して考慮される重みである接続係数に対応する。 It is also assumed that the prediction model is realized by a neural network having one or more intermediate layers, such as DNN (Deep Neural Network). In this case, the first element included in the prediction model corresponds to any node of the input layer or the intermediate layer. Also, the second element corresponds to the next node, which is a node to which the value is transmitted from the node corresponding to the first element. Also, the weight of the first element corresponds to the connection coefficient, which is the weight considered for the value transmitted from the node corresponding to the first element to the node corresponding to the second element.
(制御部130)
制御部130は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)、MPU(Micro Processing Unit)等のプロセッサによって、学習装置100内部の記憶装置に記憶されている各種プログラムがRAM等を作業領域として実行されることにより実現される。また、制御部130は、コントローラ(controller)であり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現されてもよい。
(control unit 130)
The control unit 130 is a controller, and various programs stored in a storage device inside the learning device 100 are transferred to the RAM or the like by a processor such as a CPU (Central Processing Unit) or an MPU (Micro Processing Unit). It is realized by being executed as a work area. Also, the control unit 130 is a controller, and may be realized by an integrated circuit such as an ASIC (Application Specific Integrated Circuit) or an FPGA (Field Programmable Gate Array).
制御部130は、図3に示すように、受信部131と、選択部132と、学習部133と、提供部134とを有し、以下に説明する情報処理の機能や作用を実現又は実行する。なお、制御部130の内部構成は、図3に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。
As shown in FIG. 3, the control unit 130 includes a receiving unit 131, a selecting
(受信部131)
受信部131は、端末装置10のユーザに関連するユーザ情報を、情報提供装置20から受信する。例えば、受信部131は、情報提供装置20によって提供されるウェブサイト上でのユーザの行動についての行動履歴情報を、情報提供装置20から受信する。具体的には、受信部131は、ユーザの購入履歴情報とユーザの検索履歴情報とを含む行動履歴情報を、情報提供装置20から受信する。
(Receiver 131)
The receiving unit 131 receives user information related to the user of the terminal device 10 from the information providing device 20 . For example, the receiving unit 131 receives, from the information providing device 20 , action history information regarding user actions on a website provided by the information providing device 20 . Specifically, the receiving unit 131 receives, from the information providing device 20, action history information including the user's purchase history information and the user's search history information.
また、受信部131は、情報提供装置20から受信したユーザ情報を、ユーザ情報記憶部120に格納する。例えば、受信部131は、情報提供装置20から受信したユーザの購入履歴情報を、購入履歴情報記憶部121に格納する。また、例えば、受信部131は、情報提供装置20から受信したユーザの検索履歴情報を、検索履歴情報記憶部122に格納する。
The receiving unit 131 also stores the user information received from the information providing device 20 in the user
(選択部132)
選択部132は、ユーザ情報に含まれる複数のユーザのうちから、特定の行動を行ったユーザを、当該特定の行動についての予測モデルの学習に用いる「正解ユーザ」として選択する。そして、選択部132は、特定の行動を行ったユーザのユーザ情報との類似性に基づいて、ユーザ情報に含まれる複数のユーザのうちから、当該特定の行動を行ったユーザと異なるユーザを、当該特定の行動についての予測モデルの学習に用いる「補助ユーザ」として選択する。そして、選択部132は、選択された正解ユーザのユーザ情報と、選択された補助ユーザのユーザ情報とを、学習用データとして予測モデル情報記憶部123に格納する。
(Selection unit 132)
The
説明のための一例として、図4に示される例において、選択部132が、購入履歴情報記憶部121に記憶されている購入履歴情報に含まれる複数のユーザのうちから、「パソコンの購入についての予測モデル」の学習に用いる補助ユーザを選択する例を考える。 As an example for explanation, in the example shown in FIG. Consider the example of selecting an auxiliary user for training a predictive model.
はじめに、選択部132は、購入履歴情報に含まれる下位分類「パソコン」を参照する。そして、選択部132は、参照した下位分類「パソコン」に属する商品を購入したユーザを、「パソコンの購入についての予測モデル」の学習に用いる正解ユーザとして選択する。例えば、選択部132は、ユーザID「U1」で識別されるユーザを、正解ユーザとして選択する。
First, the
続いて、選択部132は、下位分類「パソコン」に対応する上位分類「情報端末」を参照する。その後、選択部132は、下位分類「パソコン」に属する商品を購入していない複数のユーザのうちから、参照した上位分類「情報端末」に属する商品を購入したユーザを、「パソコンの購入についての予測モデル」の学習に用いる補助ユーザとして選択する。図4の例では、選択部132は、下位分類「スマートフォン」に属する商品を購入したユーザを、補助ユーザとして選択する。例えば、選択部132は、ユーザID「U4」で識別されるユーザを、補助ユーザとして選択する。
Next, the
(学習部133)
学習部133は、選択部132によって選択された正解ユーザのユーザ情報に、第1の重みを割り当てる。また、学習部133は、選択部132によって選択された補助ユーザのユーザ情報に、第1の重みよりも小さい第2の重みを割り当てる。そして、学習部133は、補助ユーザが特定の行動を行ったものとした場合の補助ユーザのユーザ情報と、正解ユーザのユーザ情報とを用いて、当該特定の行動の予測モデルを学習する。そして、学習部133は、学習された予測モデルを、予測モデル情報記憶部123に格納する。学習部133によって行われる予測モデルの学習は、線形回帰、ロジスティック回帰、ニューラルネットワーク、サポートベクターマシン、決定木学習などを含むことができるが、これらに限定されない。
(Learning unit 133)
The learning unit 133 assigns a first weight to the user information of the correct user selected by the
説明のための一例として、図4、図5に示される例において、学習部133が、スマートフォンを購入した補助ユーザがパソコンを購入したものとした場合の補助ユーザの検索履歴情報と、パソコンを購入した正解ユーザの検索履歴情報とを用いて、「パソコンの購入についての予測モデル」を学習する例を考える。 As an example for explanation, in the example shown in FIGS. 4 and 5, the learning unit 133 stores the search history information of the assistant user when the assistant user who purchased the smartphone purchased the personal computer, Let us consider an example of learning a "prediction model for purchase of a personal computer" by using the search history information of the correct user.
はじめに、学習部133は、パソコンを購入したユーザの検索履歴情報に重み「1」を割り当てる。ここで、重みは、「パソコンの購入についての予測モデル」を学習する際に用いられるパラメータである。具体的には、重みは、「パソコンの購入についての予測モデル」の学習に与える影響の大きさを示すパラメータである。 First, the learning unit 133 assigns a weight of "1" to the search history information of the user who purchased the personal computer. Here, the weight is a parameter used when learning the "prediction model for personal computer purchase". Specifically, the weight is a parameter that indicates the magnitude of the influence on the learning of the "prediction model for personal computer purchase".
1つの例では、学習部133は、検索履歴情報記憶部122に記憶されている検索履歴情報を用いて、勾配降下法によって、所定のユーザの検索クエリの検索回数を説明変数とし、当該所定のユーザがパソコンを購入する確率を目的変数とする予測モデルを学習することができる。この場合、重みは、勾配降下法における学習率に補正係数として乗ぜられる。例えば、学習率に補正係数として乗ぜられた重みに基づいて、勾配降下法のステップサイズが調整される。
In one example, the learning unit 133 uses the search history information stored in the search history
続いて、学習部133は、スマートフォンを購入したユーザの検索履歴情報に、「1」よりも小さい所定の重み(例えば、「0.8」)を割り当てる。1つの例では、学習部133は、パソコンを購入したユーザの検索履歴情報とスマートフォンを購入したユーザの検索履歴情報との間の類似性に基づいて、「1」よりも小さい所定の重みを決定することができる。例えば、学習部133は、TF-IDF(Term Frequency - Inverse Document Frequency)を用いて、検索履歴情報に含まれる検索クエリに重みを割り当て、検索クエリに割り当てられた重みを成分とするクエリベクトルを算出する。そして、学習部133は、パソコンを購入したユーザの検索履歴情報から算出されたクエリベクトルとスマートフォンを購入したユーザの検索履歴情報から算出されたクエリベクトルとの間のコサイン類似度に基づいて、「1」よりも小さい所定の重みを決定する。 Subsequently, the learning unit 133 assigns a predetermined weight smaller than "1" (for example, "0.8") to the search history information of the user who purchased the smart phone. In one example, the learning unit 133 determines a predetermined weight smaller than "1" based on the similarity between the search history information of the user who purchased the personal computer and the search history information of the user who purchased the smart phone. can do. For example, the learning unit 133 uses TF-IDF (Term Frequency-Inverse Document Frequency) to assign weights to search queries included in the search history information, and calculate a query vector whose components are the weights assigned to the search queries. do. Then, the learning unit 133, based on the cosine similarity between the query vector calculated from the search history information of the user who purchased the personal computer and the query vector calculated from the search history information of the user who purchased the smartphone, Determine a predetermined weight that is less than 1″.
その後、学習部133は、パソコンを購入したユーザの検索履歴情報を用いて、所定のユーザの検索クエリの検索回数を説明変数とし、当該所定のユーザがパソコンを購入する確率を目的変数とする予測モデルを学習する。また、学習部133は、スマートフォンを購入した補助ユーザの検索履歴情報を、パソコンを購入したユーザの検索履歴情報として用いて、所定のユーザの検索クエリの検索回数を説明変数とし、当該所定のユーザがパソコンを購入する確率を目的変数とする予測モデルを学習する。 After that, the learning unit 133 uses the search history information of the user who purchased the personal computer to make a prediction using the number of searches of a predetermined user's search query as an explanatory variable and the probability that the predetermined user will purchase a personal computer as an objective variable. learn the model. In addition, the learning unit 133 uses the search history information of the auxiliary user who purchased the smartphone as the search history information of the user who purchased the personal computer, sets the number of searches of the predetermined user's search query as an explanatory variable, and uses the search history information of the predetermined user. Learn a predictive model with the probability of purchasing a personal computer as the objective variable.
いくつかの実施形態において、学習部133は、選択部132によって選択された正解ユーザのユーザ情報に含まれる正解値(すなわち、教師出力)に、第1の重みを乗ずることができる。また、学習部133は、選択部132によって選択された補助ユーザのユーザ情報に含まれる正解値に、第1の重みよりも小さい第2の重みを乗ずることができる。例えば、学習部133は、パソコンを購入したユーザの正解値(例えば、「1」)に、第1の重み(例えば、「1」)を乗ずることができる。また、例えば、学習部133は、スマートフォンを購入したユーザの正解値(例えば、「1」)に、第2の重み(例えば、「0.8」を乗ずることができる。
In some embodiments, the learning unit 133 can multiply the correct value (that is, the teacher output) included in the user information of the correct user selected by the
そして、いくつかの実施形態において、学習部133は、第1の重みが乗ぜられた正解値を含む正解ユーザのユーザ情報と、第2の重みが乗ぜられた正解値を含む補助ユーザのユーザ情報とを用いて、特定の行動の予測モデルを学習することができる。説明のための例として、パソコンの購入についての予測モデルは、線形回帰モデルとして表現されることがある。この例では、学習部133は、正解ユーザのユーザ情報及び補助ユーザのユーザ情報に正規方程式(Normal Equationとも呼ばれる)を適用することで、パソコンの購入についての線形回帰モデルを学習することができる。 In some embodiments, the learning unit 133 generates user information of the correct user including the correct value multiplied by the first weight and user information of the assistant user including the correct value multiplied by the second weight. can be used to learn a predictive model for a particular behavior. As an illustrative example, a predictive model for personal computer purchases may be expressed as a linear regression model. In this example, the learning unit 133 can learn a linear regression model for personal computer purchases by applying a normal equation to the user information of the correct user and the user information of the auxiliary user.
(提供部134)
提供部134は、学習部133によって学習された予測モデルを、情報提供装置20に提供する。また、学習部133によって学習された予測モデルの出力データを、情報提供装置20に提供してもよい。例えば、提供部134は、予測モデルに従った情報処理により、所定のユーザのユーザ情報を入力層に入力する。そして、提供部134は、入力データを中間層と出力層に伝播させることで出力層から、所定のユーザが特定の行動を行う確率に関する値を出力させる。図4、図5の例では、提供部134は、所定のユーザがパソコンを購入する確率を表すデータを、情報提供装置20に提供してもよい。
(Providing unit 134)
The providing
いくつかの実施形態において、提供部134は、上述した回帰モデルやニューラルネットワーク等、任意の構造を有するモデルを用いて、所定のユーザが特定の行動を行う確率に関する値の算出を行うことができる。具体的には、予測モデルは、所定のユーザに関するユーザ情報(例えば、検索履歴情報)が入力された場合に、所定のユーザが特定の行動を行う確率に関する値を出力するように係数が設定される。提供部134は、このような予測モデルを用いて、所定のユーザが特定の行動を行う確率に関する値を算出することができる。なお、学習部133がGAN(Generative Adversarial Networks)を用いた学習処理を行う場合、予測モデルは、GANの一部を構成するモデルであってもよい。
In some embodiments, the providing
〔4.学習処理のフロー〕
次に、実施形態に係る学習装置100による学習処理の手順について説明する。図6は、実施形態に係る学習装置100による学習処理手順を示すフローチャートである。
[4. Flow of learning processing]
Next, a procedure of learning processing by the learning device 100 according to the embodiment will be described. FIG. 6 is a flowchart showing a learning processing procedure by the learning device 100 according to the embodiment.
図6に示すように、学習装置100の受信部131は、端末装置10のユーザに関連するユーザ情報を、情報提供装置20から受信する(ステップS101)。 As shown in FIG. 6, the receiving unit 131 of the study device 100 receives user information related to the user of the terminal device 10 from the information providing device 20 (step S101).
続いて、選択部132は、受信部131によって受信されたユーザ情報に含まれる複数のユーザのうちから、特定の行動を行ったユーザを、当該特定の行動についての予測モデルの学習に用いる「正解ユーザ」として選択する(ステップS102)。続いて、選択部132は、特定の行動を行ったユーザのユーザ情報との類似性に基づいて、受信部131によって受信されたユーザ情報に含まれる複数のユーザのうちから、当該特定の行動を行ったユーザと異なるユーザを、当該特定の行動についての予測モデルの学習に用いる「補助ユーザ」として選択する(ステップS103)。
Subsequently, the selecting
続いて、学習部133は、選択部132によって選択された正解ユーザのユーザ情報に、第1の重みを割り当てる(ステップS104)。続いて、学習部133は、選択部132によって選択された補助ユーザが特定の行動を行ったものとした場合の補助ユーザのユーザ情報に、第1の重みよりも小さい第2の重みを割り当てる(ステップS105)。続いて、学習部133は、補助ユーザが特定の行動を行ったものとした場合の補助ユーザのユーザ情報と、正解ユーザのユーザ情報とを用いて、当該特定の行動の予測モデルを学習する(ステップS106)。
Subsequently, the learning unit 133 assigns the first weight to the user information of the correct user selected by the selection unit 132 (step S104). Subsequently, the learning unit 133 assigns a second weight smaller than the first weight to the user information of the assistant user when the assistant user selected by the
続いて、提供部134は、学習部133によって学習された予測モデルを、情報提供装置20に提供する(ステップS107)。
Subsequently, the providing
〔5.変形例〕
上述してきた実施形態に係る学習装置100は、上記実施形態以外にも種々の異なる形態にて実施されてよい。そこで、以下に、上記の学習装置100の他の実施形態について説明する。
[5. Modification]
The learning device 100 according to the above-described embodiments may be implemented in various forms other than the above embodiments. Therefore, another embodiment of the learning device 100 will be described below.
〔5-1.補助ユーザの動的選択〕
上述した学習装置100の選択部132は、正解ユーザC1が行った特定の行動と類似する行動を行ったユーザを、補助ユーザA1として選択した。しかし、この例に限られず、選択部132は、正解ユーザC1のユーザ情報に基づく正解ユーザの特徴に関連する当該正解ユーザ情報との類似性に基づいて、補助ユーザを選択してもよい。以下の説明では、図7を用いて、補助ユーザの動的選択について説明する。
[5-1. Dynamic Selection of Auxiliary User]
The
図7は、変形例に係る学習処理の一例を示す図である。はじめに、選択部132は、受信部131によって受信されたユーザ情報に含まれる複数のユーザのうちから、特定の行動を行ったユーザを、当該特定の行動についての予測モデルの学習に用いる「正解ユーザ」として選択する。図7の例では、選択部132は、パソコンを購入したユーザを、パソコンの購入についての予測モデルM2の学習に用いる正解ユーザC1として選択する。図7では、例示を目的として、パソコンを購入した複数のユーザを、複数の正解ユーザC1の集合E1として示している。
FIG. 7 is a diagram illustrating an example of learning processing according to a modification. First, the
続いて、学習部133は、正解ユーザC1のユーザ情報を用いて、正解ユーザC1が行った特定の行動についての予測モデルを学習する。図7の例では、学習部133は、パソコンを購入した正解ユーザC1のユーザ情報を用いて、パソコンの購入についての予測モデルM2を学習する。そして、学習部133は、学習された予測モデルM2の出力データに基づいて、正解ユーザC1の特徴情報を抽出する。図7の例では、学習部133は、検索クエリ「パソコン」、「スペック」の検索回数を、正解ユーザC1の特徴情報として抽出する。 Subsequently, the learning unit 133 uses the user information of the correct user C1 to learn a prediction model for a specific action performed by the correct user C1. In the example of FIG. 7, the learning unit 133 uses the user information of the correct user C1 who purchased the personal computer to learn the prediction model M2 regarding the purchase of the personal computer. Then, the learning unit 133 extracts the feature information of the correct user C1 based on the learned output data of the prediction model M2. In the example of FIG. 7, the learning unit 133 extracts the number of searches for the search queries "personal computer" and "spec" as the characteristic information of the correct user C1.
1つの実施形態では、学習部133は、所定のユーザの検索クエリの検索回数を説明変数とし、当該所定のユーザがパソコンを購入する確率を目的変数とするロジスティック回帰モデルを学習する。そして、学習部133は、学習されたロジスティック回帰モデルの回帰係数に基づいて、主要な説明変数を決定する。そして、学習部133は、決定された主要な説明変数を、正解ユーザC1の特徴情報として抽出する。 In one embodiment, the learning unit 133 learns a logistic regression model in which the number of searches of a given user's search query is used as an explanatory variable and the probability that the given user purchases a personal computer is used as an objective variable. Then, the learning unit 133 determines main explanatory variables based on the learned regression coefficients of the logistic regression model. Then, the learning unit 133 extracts the determined main explanatory variables as feature information of the correct user C1.
続いて、選択部132は、学習部133によって抽出された正解ユーザC1の特徴情報との類似性に基づいて、ユーザ情報に含まれる複数のユーザのうちから、正解ユーザC1と異なるユーザを、正解ユーザC1が行った特定の行動についての予測モデルの学習に用いる「補助ユーザ」として選択する。図7の例では、選択部132は、検索クエリ「パソコン」、「スペック」の検索回数に基づいて、検索履歴情報記憶部122に記憶されている検索履歴情報に含まれるユーザのうちから、正解ユーザC1と異なるユーザを、パソコンの購入についての予測モデルM3の学習に用いる補助ユーザA2として選択する。図7では、例示を目的として、選択された複数の補助ユーザを、複数の補助ユーザA2の集合E3として示している。
Subsequently, the
続いて、学習部133は、正解ユーザC1の特徴情報と選択部132によって選択された補助ユーザA2のユーザ情報との間の類似性に基づいて、補助ユーザA2ごとの類似性スコアを算出する。図7の例では、学習部133は、補助ユーザA2の検索クエリ「パソコン」、「スペック」の検索回数を説明変数とし、当該補助ユーザA2がパソコンを購入する確率を目的変数とする予測モデルM2の出力データに基づいて、補助ユーザA2ごとの類似性スコアを算出する。
Subsequently, the learning unit 133 calculates a similarity score for each auxiliary user A2 based on the similarity between the feature information of the correct user C1 and the user information of the auxiliary user A2 selected by the
続いて、学習部133は、正解ユーザC1のユーザ情報に、第1の重みを割り当てる。図7の例では、学習部133は、正解ユーザC1のユーザ情報に、重み「1」を割り当てる。 Subsequently, the learning unit 133 assigns the first weight to the user information of the correct user C1. In the example of FIG. 7, the learning unit 133 assigns the weight "1" to the user information of the correct user C1.
続いて、学習部133は、算出された補助ユーザA2ごとの類似性スコアに基づいて、補助ユーザA2が特定の行動を行ったものとした場合の補助ユーザA2のユーザ情報に、第1の重みよりも小さい第2の重みを割り当てる。図7の例では、学習部133は、補助ユーザA2の類似性スコアに等しい第2の重みを、当該補助ユーザA2のユーザ情報に割り当てる。 Subsequently, based on the calculated similarity score for each assistant user A2, the learning unit 133 applies a first weight assign a second weight that is less than In the example of FIG. 7, the learning unit 133 assigns a second weight equal to the similarity score of the assistant user A2 to the user information of the assistant user A2.
続いて、学習部133は、補助ユーザA2が特定の行動を行ったものとした場合の補助ユーザA2のユーザ情報と、正解ユーザC1のユーザ情報とを用いて、当該特定の行動の予測モデルを再学習する。図7の例では、学習部133は、補助ユーザA2がパソコンを購入したものとした場合の補助ユーザA2のユーザ情報と、パソコンを購入した正解ユーザC1のユーザ情報とを用いて、パソコンの購入についての予測モデルM3を学習する。そして、学習部133は、学習された予測モデルM3の出力データに基づいて、正解ユーザC1の集合E1と補助ユーザA2の集合E3の和集合E4に属するユーザの特徴情報を抽出する。図7の例では、学習部133は、検索クエリ「パソコン」、「値段」の検索回数を、和集合E4に属するユーザの特徴情報として抽出する。 Next, the learning unit 133 uses the user information of the assistant user A2 and the user information of the correct user C1 when the assistant user A2 has performed a specific action to create a prediction model of the specific action. Relearn. In the example of FIG. 7, the learning unit 133 uses the user information of the assistant user A2 when the assistant user A2 purchased the personal computer and the user information of the correct user C1 who purchased the personal computer to determine whether the personal computer was purchased. Learn a predictive model M3 for Based on the output data of the learned prediction model M3, the learning unit 133 extracts feature information of users belonging to the union E4 of the set E1 of the correct users C1 and the set E3 of the auxiliary users A2. In the example of FIG. 7, the learning unit 133 extracts the number of searches for the search queries "personal computer" and "price" as feature information of users belonging to the union E4.
続いて、選択部132は、正解ユーザC1の集合E1と補助ユーザA2の集合E3の和集合E4に属するユーザの特徴情報との類似性に基づいて、ユーザ情報に含まれる複数のユーザのうちから、正解ユーザC1、補助ユーザA2と異なるユーザを、類似ユーザR1として選択する。図7の例では、選択部132は、検索クエリ「パソコン」、「値段」の検索回数に基づいて、検索履歴情報記憶部122に記憶されている検索履歴情報に含まれるユーザのうちから、正解ユーザC1、補助ユーザA2と異なるユーザを、類似ユーザR1として選択する。図7では、例示を目的として、選択された複数の類似ユーザを、複数の類似ユーザR1の集合E5として示している。
Next, the
その後、学習部133は、和集合E4に属するユーザの特徴情報と選択部132によって選択された類似ユーザR1のユーザ情報との間の類似性に基づいて、類似ユーザR1ごとの類似性スコアを算出する。図7の例では、学習部133は、類似ユーザR1の検索クエリ「パソコン」、「値段」の検索回数を説明変数とし、当該類似ユーザR1がパソコンを購入する確率を目的変数とする予測モデルM3の出力値に基づいて、類似ユーザR1ごとの類似性スコアを算出する。
After that, the learning unit 133 calculates a similarity score for each similar user R1 based on the similarity between the feature information of the users belonging to the union E4 and the user information of the similar user R1 selected by the
〔5-2.その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
[5-2. others〕
Further, among the processes described in the above embodiments, all or part of the processes described as being automatically performed can be manually performed, or the processes described as being performed manually can be performed manually. All or part of this can also be done automatically by known methods. In addition, information including processing procedures, specific names, various data and parameters shown in the above documents and drawings can be arbitrarily changed unless otherwise specified.
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。 Also, each component of each device illustrated is functionally conceptual, and does not necessarily need to be physically configured as illustrated. In other words, the specific form of distribution and integration of each device is not limited to the one shown in the figure, and all or part of them can be functionally or physically distributed and integrated in arbitrary units according to various loads and usage conditions. Can be integrated and configured.
例えば、図3に示したユーザ情報記憶部120の一部又は全部は、学習装置100によって保持されるのではなく、ストレージサーバ等に保持されてもよい。この場合、学習装置100は、ストレージサーバにアクセスすることで、購入履歴情報や検索履歴情報等の各種情報を取得する。
For example, part or all of the user
〔5-3.ハードウェア構成〕
また、上述してきた実施形態に係る提供装置100は、例えば図8に示すような構成のコンピュータ1000によって実現される。図8は、ハードウェア構成の一例を示す図である。コンピュータ1000は、出力装置1010、入力装置1020と接続され、演算装置1030、一次記憶装置1040、二次記憶装置1050、出力IF(Interface)1060、入力IF1070、ネットワークIF1080がバス1090により接続された形態を有する。
[5-3. Hardware configuration]
Also, the providing apparatus 100 according to the above-described embodiments is implemented by a
演算装置1030は、一次記憶装置1040や二次記憶装置1050に格納されたプログラムや入力装置1020から読み出したプログラム等に基づいて動作し、各種の処理を実行する。一次記憶装置1040は、RAM等、演算装置1030が各種の演算に用いるデータを一時的に記憶するメモリ装置である。また、二次記憶装置1050は、演算装置1030が各種の演算に用いるデータや、各種のデータベースが登録される記憶装置であり、ROM(Read Only Memory)、HDD、フラッシュメモリ等により実現される。
The
出力IF1060は、モニタやプリンタといった各種の情報を出力する出力装置1010に対し、出力対象となる情報を送信するためのインタフェースであり、例えば、USB(Universal Serial Bus)やDVI(Digital Visual Interface)、HDMI(登録商標)(High Definition Multimedia Interface)といった規格のコネクタにより実現される。また、入力IF1070は、マウス、キーボード、およびスキャナ等といった各種の入力装置1020から情報を受信するためのインタフェースであり、例えば、USB等により実現される。 The output IF 1060 is an interface for transmitting information to be output to the output device 1010 that outputs various types of information such as a monitor and a printer. It is realized by a connector conforming to a standard such as HDMI (registered trademark) (High Definition Multimedia Interface). Also, the input IF 1070 is an interface for receiving information from various input devices 1020 such as a mouse, keyboard, scanner, etc., and is realized by, for example, USB.
なお、入力装置1020は、例えば、CD(Compact Disc)、DVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等から情報を読み出す装置であってもよい。また、入力装置1020は、USBメモリ等の外付け記憶媒体であってもよい。 Note that the input device 1020 includes, for example, optical recording media such as CDs (Compact Discs), DVDs (Digital Versatile Discs), PDs (Phase change rewritable discs), magneto-optical recording media such as MOs (Magneto-Optical discs), and tapes. It may be a device that reads information from a medium, a magnetic recording medium, a semiconductor memory, or the like. Also, the input device 1020 may be an external storage medium such as a USB memory.
ネットワークIF1080は、ネットワークNを介して他の機器からデータを受信して演算装置1030へ送り、また、ネットワークNを介して演算装置1030が生成したデータを他の機器へ送信する。
Network IF 1080 receives data from other devices via network N and sends the data to
演算装置1030は、出力IF1060や入力IF1070を介して、出力装置1010や入力装置1020の制御を行う。例えば、演算装置1030は、入力装置1020や二次記憶装置1050からプログラムを一次記憶装置1040上にロードし、ロードしたプログラムを実行する。
The
例えば、コンピュータ1000が学習装置100として機能する場合、コンピュータ1000の演算装置1030は、一次記憶装置1040上にロードされたプログラムまたはデータ(例えば、予測モデル)を実行することにより、制御部130の機能を実現する。
For example, when the
〔6.効果〕
上述してきたように、実施形態に係る学習装置100は、選択部132と、学習部133とを有する。選択部132は、第1行動(例えば、特定の行動)を行った第1ユーザ(例えば、正解ユーザ)の第1ユーザ情報との類似性に基づいて、当該第1ユーザと異なる第2ユーザ(例えば、補助ユーザ)を選択する。学習部133は、選択部132によって選択された第2ユーザが第1行動を行ったものとした場合の当該第2ユーザの第2ユーザ情報と、第1ユーザ情報とを用いて、第1行動の予測モデルを学習する。
[6. effect〕
As described above, the learning device 100 according to the embodiment has the
これにより、学習装置は、第1ユーザのユーザ情報の量が不十分である場合でも、第1ユーザのユーザ情報に加えて、第1ユーザのユーザ情報との類似性に基づいて選択された第2ユーザのユーザ情報を用いて、第1ユーザの行動についての精度の高い予測モデルを学習することができる。この結果、学習装置100は、特定のユーザのユーザ情報の量が不十分である場合でも、特定のユーザと行動が類似する類似ユーザを特定することができる。 As a result, even when the amount of user information of the first user is insufficient, the learning device selects the second Using the user information of the two users, it is possible to learn a highly accurate prediction model for the behavior of the first user. As a result, learning device 100 can identify similar users whose behavior is similar to that of the specific user even when the amount of user information on the specific user is insufficient.
また、実施形態に係る学習装置100において、選択部132は、第1ユーザ情報である第1行動と類似する第2行動を行った第2ユーザを選択する。
In addition, in the learning device 100 according to the embodiment, the
これにより、学習装置100は、第1ユーザと行動傾向が類似する第2ユーザのユーザ情報を用いて、第1ユーザの行動についての精度の高い予測モデルを学習することができる。この結果、学習装置100は、特定のユーザのユーザ情報の量が不十分である場合でも、特定のユーザと行動が類似する類似ユーザを特定することができる。 As a result, the learning device 100 can learn a highly accurate prediction model for the behavior of the first user using the user information of the second user whose behavioral tendency is similar to that of the first user. As a result, learning device 100 can identify similar users whose behavior is similar to that of the specific user even when the amount of user information on the specific user is insufficient.
また、実施形態に係る学習装置100において、学習部133は、第1ユーザ情報に第1の重みを割り当てるともに、選択部132によって選択された第2ユーザが第1行動を行ったものとした場合の第2ユーザの第2ユーザ情報に、当該第1の重みよりも小さい第2の重みを割り当て、予測モデルを学習する。
Further, in the learning device 100 according to the embodiment, when the learning unit 133 assigns the first weight to the first user information and the second user selected by the
これにより、学習装置100は、第2の重みを用いて、第2ユーザの第2ユーザ情報が予測モデルの学習に与える影響を、第1ユーザの行動についての予測モデルの学習に適合するように補正することができる。この結果、学習装置100は、特定のユーザのユーザ情報の量が不十分である場合でも、特定のユーザと行動が類似する類似ユーザを特定することができる。 As a result, learning device 100 adjusts the influence of the second user information of the second user on the learning of the prediction model using the second weight so as to match the learning of the prediction model for the behavior of the first user. can be corrected. As a result, learning device 100 can identify similar users whose behavior is similar to that of the specific user even when the amount of user information on the specific user is insufficient.
また、実施形態に係る学習装置100において、選択部132は、第1ユーザ情報に基づく第1ユーザの特徴に関連する当該第1ユーザ情報との類似性に基づいて、第2ユーザを選択する。
Further, in the learning device 100 according to the embodiment, the
これにより、学習装置100は、第1ユーザと特徴が類似する第2ユーザのユーザ情報を用いて、第1ユーザの行動についての予測モデルを学習することができる。この結果、学習装置100は、特定のユーザと行動が類似する類似ユーザを特定することができる。 Thus, learning device 100 can learn a predictive model of the behavior of the first user using the user information of the second user whose features are similar to those of the first user. As a result, learning device 100 can identify similar users whose behavior is similar to that of a specific user.
また、実施形態に係る学習装置100において、学習部133は、第1ユーザ情報に第1の重みを割り当てるともに、第1ユーザ情報に基づく第1ユーザの特徴に関連する第1ユーザ情報と第2ユーザ情報との間の類似性に基づいて、選択部132によって選択された第2ユーザが第1行動を行ったものとした場合の第2ユーザの第2ユーザ情報に、第2の重みを割り当て、予測モデルを学習する。
In addition, in the learning device 100 according to the embodiment, the learning unit 133 assigns the first weight to the first user information, and also assigns the first user information and the second user information related to the characteristics of the first user based on the first user information. A second weight is assigned to the second user information of the second user when the second user selected by the
これにより、学習装置100は、第2ユーザの第2ユーザ情報が予測モデルの学習に与える影響を、予測モデルの精度を向上させるように決定することができる。この結果、学習装置100は、特定のユーザと行動が類似する類似ユーザを特定することができる。 Thereby, the learning device 100 can determine the influence of the second user's second user information on the learning of the prediction model so as to improve the accuracy of the prediction model. As a result, learning device 100 can identify similar users whose behavior is similar to that of a specific user.
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。 As described above, some of the embodiments of the present application have been described in detail based on the drawings. It is possible to carry out the invention in other forms with modifications.
また、上述した学習装置100は、複数のサーバコンピュータで実現してもよく、また、機能によっては外部のプラットフォーム等をAPI(Application Programming Interface)やネットワークコンピューティングなどで呼び出して実現するなど、構成は柔軟に変更できる。 Further, the learning device 100 described above may be implemented by a plurality of server computers, and some functions may be implemented by calling an external platform or the like using an API (Application Programming Interface) or network computing. Flexible to change.
また、特許請求の範囲に記載した「手段」は、「部(section、module、unit)」や「回路」などに読み替えることができる。例えば、取得手段は、取得部や取得回路に読み替えることができる。 In addition, "means" described in the claims can be read as "section, module, unit" or "circuit". For example, the acquisition means can be read as an acquisition unit or an acquisition circuit.
1 ネットワークシステム
10 端末装置
20 情報提供装置
100 学習装置
121 購入履歴情報記憶部
122 検索履歴情報記憶部
123 予測モデル情報記憶部
131 受信部
132 選択部
133 学習部
134 提供部
1 network system 10 terminal device 20 information providing device 100
Claims (10)
前記第1ユーザ情報と、前記第2ユーザの検索履歴情報を含む第2ユーザ情報との類似性を所定の方法で算出し、前記第1ユーザ情報の特徴に基づいて、前記第1ユーザの前記第1ユーザ情報に所定の重みを割り当て、前記第2ユーザ情報に前記所定の方法で算出した類似性に応じた重みを割り当て、前記第1ユーザ情報と対応するユーザが前記所定の対象を購入する確度を予測するモデルを学習する学習部と、
を備えることを特徴とする学習装置。 extracting features of first user information including search history information of a first user who has purchased a predetermined object; a selection unit that selects a second user different from the first user;
Similarity between the first user information and second user information including search history information of the second user is calculated by a predetermined method, and based on the characteristics of the first user information , the A predetermined weight is assigned to the first user information, a weight corresponding to the similarity calculated by the predetermined method is assigned to the second user information, and the user corresponding to the first user information purchases the predetermined object. a learning unit that learns a model for predicting accuracy ;
A learning device comprising:
前記第1ユーザ情報に第1の重みを割り当てるとともに、前記選択部によって選択された前記第2ユーザの前記第2ユーザ情報に、当該第1の重みよりも小さい第2の重みを割り当て、前記モデルを学習する、
ことを特徴とする請求項1に記載の学習装置。 The learning unit
Allocating a first weight to the first user information, allocating a second weight smaller than the first weight to the second user information of the second user selected by the selection unit, and assigning a second weight to the model to learn the
2. The learning device according to claim 1, wherein:
前記第1ユーザ情報と、前記第2ユーザの検索履歴情報を含む第2ユーザ情報との類似性を所定の方法で算出し、前記第1ユーザ情報の特徴に基づいて、前記第1ユーザの前記第1ユーザ情報に所定の重みを割り当て、前記第2ユーザ情報に前記所定の方法で算出した類似性に応じた重みを割り当て、前記第1ユーザ情報と対応するユーザが前記所定の対象を購入する確度を予測するモデルを学習する学習部と、
を備えることを特徴とする学習装置。 extracting features related to the action history of the first user based on first user information including search history information of the first user who purchased a predetermined target, and extracting features related to the action history of the user information including the search history information; a selection unit that selects a second user who is similar to the feature related to the action history of the first user information and is different from the first user;
Similarity between the first user information and second user information including search history information of the second user is calculated by a predetermined method, and based on the characteristics of the first user information , the A predetermined weight is assigned to the first user information, a weight corresponding to the similarity calculated by the predetermined method is assigned to the second user information, and the user corresponding to the first user information purchases the predetermined object. a learning unit that learns a model for predicting accuracy ;
A learning device comprising:
前記第1ユーザ情報に第1の重みを割り当てるとともに、前記選択部によって選択された前記第2ユーザの前記第2ユーザ情報に、第2の重みを割り当て、前記モデルを学習する、
ことを特徴とする請求項3に記載の学習装置。 The learning unit
assigning a first weight to the first user information, assigning a second weight to the second user information of the second user selected by the selection unit, and learning the model;
4. The learning device according to claim 3, characterized in that:
所定の対象を購入した第1ユーザの検索履歴情報を含む第1ユーザ情報の特徴を抽出し、検索履歴情報を含むユーザ情報の特徴が前記第1ユーザ情報の特徴と類似するユーザであって前記第1ユーザと異なる第2ユーザを選択する選択工程と、
前記第1ユーザ情報と、前記第2ユーザの検索履歴情報を含む第2ユーザ情報との類似性を所定の方法で算出し、前記第1ユーザ情報の特徴に基づいて、前記第1ユーザの前記第1ユーザ情報に所定の重みを割り当て、前記第2ユーザ情報に前記所定の方法で算出した類似性に応じた重みを割り当て、前記第1ユーザ情報と対応するユーザが前記所定の対象を購入する確度を予測するモデルを学習する学習工程と、
を含むことを特徴とする学習方法。 A computer implemented learning method comprising:
extracting features of first user information including search history information of a first user who has purchased a predetermined object; a selection step of selecting a second user different from the first user;
Similarity between the first user information and second user information including search history information of the second user is calculated by a predetermined method, and based on the characteristics of the first user information , the A predetermined weight is assigned to the first user information, a weight corresponding to the similarity calculated by the predetermined method is assigned to the second user information, and the user corresponding to the first user information purchases the predetermined object. a learning step of learning a model to predict accuracy ;
A learning method comprising:
前記第1ユーザ情報と、前記第2ユーザの検索履歴情報を含む第2ユーザ情報との類似性を所定の方法で算出し、前記第1ユーザ情報の特徴に基づいて、前記第1ユーザの前記第1ユーザ情報に所定の重みを割り当て、前記第2ユーザ情報に前記所定の方法で算出した類似性に応じた重みを割り当て、前記第1ユーザ情報と対応するユーザが前記所定の対象を購入する確度を予測するモデルを学習する学習手順と、
をコンピュータに実行させることを特徴とする学習プログラム。 extracting features of first user information including search history information of a first user who has purchased a predetermined object; a selection procedure for selecting a second user different from the first user;
Similarity between the first user information and second user information including search history information of the second user is calculated by a predetermined method, and based on the characteristics of the first user information , the A predetermined weight is assigned to the first user information, a weight corresponding to the similarity calculated by the predetermined method is assigned to the second user information, and the user corresponding to the first user information purchases the predetermined object. a learning procedure for learning a model to predict accuracy ;
A learning program characterized by causing a computer to execute
所定の対象を購入した第1ユーザの検索履歴情報を含む第1ユーザ情報に基づく当該第1ユーザの行動履歴に係る特徴を抽出し、検索履歴情報を含むユーザ情報の行動履歴に係る特徴が前記第1ユーザ情報の行動履歴に係る特徴と類似するユーザであって前記第1ユーザと異なる第2ユーザを選択する選択工程と、
前記第1ユーザ情報と、前記第2ユーザの検索履歴情報を含む第2ユーザ情報との類似性を所定の方法で算出し、前記第1ユーザ情報の特徴に基づいて、前記第1ユーザの前記第1ユーザ情報に所定の重みを割り当て、前記第2ユーザ情報に前記所定の方法で算出した類似性に応じた重みを割り当て、前記第1ユーザ情報と対応するユーザが前記所定の対象を購入する確度を予測するモデルを学習する学習工程と、
を含むことを特徴とする学習方法。 A computer implemented learning method comprising:
extracting features related to the action history of the first user based on first user information including search history information of the first user who purchased a predetermined target, and extracting features related to the action history of the user information including the search history information; a selection step of selecting a second user who is similar to the characteristics related to the action history of the first user information and is different from the first user;
Similarity between the first user information and second user information including search history information of the second user is calculated by a predetermined method, and based on the characteristics of the first user information , the A predetermined weight is assigned to the first user information, a weight corresponding to the similarity calculated by the predetermined method is assigned to the second user information, and the user corresponding to the first user information purchases the predetermined object. a learning step of learning a model to predict accuracy ;
A learning method comprising:
前記第1ユーザ情報と、前記第2ユーザの検索履歴情報を含む第2ユーザ情報との類似性を所定の方法で算出し、前記第1ユーザ情報の特徴に基づいて、前記第1ユーザの前記第1ユーザ情報に所定の重みを割り当て、前記第2ユーザ情報に前記所定の方法で算出した類似性に応じた重みを割り当て、前記第1ユーザ情報と対応するユーザが前記所定の対象を購入する確度を予測するモデルを学習する学習手順と、
をコンピュータに実行させることを特徴とする学習プログラム。 extracting features related to the action history of the first user based on first user information including search history information of the first user who purchased a predetermined target, and extracting features related to the action history of the user information including the search history information; A selection procedure for selecting a second user who is similar to the characteristics related to the action history of the first user information and is different from the first user;
Similarity between the first user information and second user information including search history information of the second user is calculated by a predetermined method, and based on the characteristics of the first user information , the A predetermined weight is assigned to the first user information, a weight corresponding to the similarity calculated by the predetermined method is assigned to the second user information, and the user corresponding to the first user information purchases the predetermined object. a learning procedure for learning a model to predict accuracy ;
A learning program characterized by causing a computer to execute
前記第1ユーザ情報の特徴に基づいて、前記第1ユーザ情報に所定の重みを割り当て、所定の方法で算出した前記第1ユーザ情報と前記第2ユーザの検索履歴情報を含む第2ユーザ情報との類似性を用いて、前記第2ユーザ情報に当該類似性に応じた重みを割り当て、前記第1ユーザ情報と対応するユーザが前記所定の対象を購入する確度を予測する行動予測モデルを学習させる、学習用データを備えたコンピュータに対し、
入力層と出力層とを有し、前記入力層から前記出力層までのいずれかの層であって前記出力層以外の層に属する第1要素と、前記第1要素と前記第1要素の所定の重みとに基づいて値が算出される第2要素と、前記入力層に入力された前記第1ユーザ情報及び前記第2ユーザ情報について、前記出力層以外の各層に属する各要素を前記第1要素として、前記第1要素と前記第1要素の所定の重みとに基づく所定の演算を行う前記行動予測モデルの前記入力層に入力することにより、演算結果を示す出力値を前記行動予測モデルの前記出力層から出力し、前記第1ユーザ情報及び前記第2ユーザ情報に対応する所定の重みに応じて決定される正解値と前記出力値との比較に基づく学習を行なうよう、
機能させるためのプログラム。 extracting features of first user information including search history information of a first user who has purchased a predetermined object; selecting a second user different from the first user;
A predetermined weight is assigned to the first user information based on the characteristics of the first user information , and the first user information calculated by a predetermined method and the second user information including search history information of the second user; A weight corresponding to the similarity is assigned to the second user information using the similarity, and a behavior prediction model is learned that predicts the probability that the user corresponding to the first user information will purchase the predetermined target. For a computer with training data that allows
having an input layer and an output layer, a first element belonging to any layer from the input layer to the output layer and belonging to a layer other than the output layer; and the first user information and the second user information input to the input layer, each element belonging to each layer other than the output layer is assigned to the first By inputting an element into the input layer of the action prediction model that performs a predetermined calculation based on the first element and a predetermined weight of the first element, an output value indicating a calculation result is input to the action prediction model. To perform learning based on a comparison between a correct value output from the output layer and a correct value determined according to a predetermined weight corresponding to the first user information and the second user information and the output value,
A program to make it work.
前記第1ユーザ情報の特徴に基づいて当該ユーザ情報と対応するユーザが前記所定の対象を購入する確度を予測する行動予測モデルとして、前記第1ユーザ情報に所定の重みを割り当てた第1ユーザ情報と、所定の方法で算出した前記第1ユーザ情報と前記第2ユーザの検索履歴情報を含む第2ユーザ情報との類似性を用いて、前記第2ユーザ情報に当該類似性に応じた重みを割り当てた第2ユーザ情報とが入力される入力層と、
出力層と、
前記入力層から前記出力層までのいずれかの層であって前記出力層以外の層に属する第1要素と、
前記第1要素と前記第1要素の所定の重みとに基づいて値が算出される第2要素と、を含む前記行動予測モデルであって、
前記入力層に入力された前記第1ユーザ情報及び前記第2ユーザ情報について、前記出力層以外の各層に属する各要素を前記第1要素として、前記第1要素と前記第1要素の所定の重みとに基づく所定の演算を行うことにより、それぞれのユーザの情報の提供に用いられるスコアの値を前記出力層から出力し、前記第1ユーザ情報及び前記第2ユーザ情報に対応する所定の重みに応じて決定される正解値と前記スコアの値との比較に基づいて学習された前記行動予測モデルとして、
コンピュータに実行させるためのプログラム。 extracting features of first user information including search history information of a first user who has purchased a predetermined object; selecting a second user different from the first user;
A first user who assigns a predetermined weight to the first user information as a behavior prediction model for predicting the probability that the user corresponding to the user information will purchase the predetermined object based on the characteristics of the first user information . information and the similarity between the first user information calculated by a predetermined method and the second user information including the search history information of the second user, the second user information corresponding to the similarity an input layer to which weighted second user information is input;
an output layer;
a first element belonging to any layer from the input layer to the output layer and belonging to a layer other than the output layer;
The behavior prediction model including a second element whose value is calculated based on the first element and a predetermined weight of the first element,
With respect to the first user information and the second user information input to the input layer, each element belonging to each layer other than the output layer is defined as the first element, and a predetermined weight is applied to the first element and the first element. By performing a predetermined calculation based on and, the score value used for providing information of each user is output from the output layer, and the predetermined weight corresponding to the first user information and the second user information As the action prediction model learned based on the comparison of the score value and the correct value determined according to
A program that makes a computer run.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017137434A JP7231322B2 (en) | 2017-07-13 | 2017-07-13 | LEARNING DEVICE, LEARNING METHOD, LEARNING PROGRAM AND PROGRAM |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017137434A JP7231322B2 (en) | 2017-07-13 | 2017-07-13 | LEARNING DEVICE, LEARNING METHOD, LEARNING PROGRAM AND PROGRAM |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2019020930A JP2019020930A (en) | 2019-02-07 |
JP7231322B2 true JP7231322B2 (en) | 2023-03-01 |
Family
ID=65355567
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2017137434A Active JP7231322B2 (en) | 2017-07-13 | 2017-07-13 | LEARNING DEVICE, LEARNING METHOD, LEARNING PROGRAM AND PROGRAM |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7231322B2 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7195187B2 (en) * | 2019-03-19 | 2022-12-23 | ヤフー株式会社 | Estimation device, estimation method and estimation program |
JP7354195B2 (en) * | 2021-09-15 | 2023-10-02 | ヤフー株式会社 | Information processing device, information processing method, and information processing program |
JP7407779B2 (en) * | 2021-09-15 | 2024-01-04 | Lineヤフー株式会社 | Information processing device, information processing method, and information processing program |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004203531A (en) | 2002-12-24 | 2004-07-22 | Canon Inc | Proper stock management of commodity |
JP2004294264A (en) | 2003-03-27 | 2004-10-21 | Mazda Motor Corp | Navigation system |
JP2013503391A (en) | 2009-08-27 | 2013-01-31 | アリババ グループ ホールディング リミテッド | Information matching method and system on electronic commerce website |
JP2013228812A (en) | 2012-04-24 | 2013-11-07 | Nec Corp | Behavior model creation system, behavior model creation method, and behavior model creation program |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015049802A1 (en) * | 2013-10-04 | 2015-04-09 | 株式会社日立製作所 | Database generation device and database generation method |
-
2017
- 2017-07-13 JP JP2017137434A patent/JP7231322B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004203531A (en) | 2002-12-24 | 2004-07-22 | Canon Inc | Proper stock management of commodity |
JP2004294264A (en) | 2003-03-27 | 2004-10-21 | Mazda Motor Corp | Navigation system |
JP2013503391A (en) | 2009-08-27 | 2013-01-31 | アリババ グループ ホールディング リミテッド | Information matching method and system on electronic commerce website |
JP2013228812A (en) | 2012-04-24 | 2013-11-07 | Nec Corp | Behavior model creation system, behavior model creation method, and behavior model creation program |
Also Published As
Publication number | Publication date |
---|---|
JP2019020930A (en) | 2019-02-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021135588A1 (en) | Recommendation method, model generation method and apparatus, medium and device | |
US11544336B2 (en) | Collaborative-filtered content recommendations with justification in real-time | |
CN108431833B (en) | End-to-end depth collaborative filtering | |
KR102155261B1 (en) | Wide and deep machine learning models | |
US10332015B2 (en) | Particle thompson sampling for online matrix factorization recommendation | |
US20150066586A1 (en) | Evaluation calculating device, evaluation calculating method, and recording medium | |
JP2024503774A (en) | Fusion parameter identification method and device, information recommendation method and device, parameter measurement model training method and device, electronic device, storage medium, and computer program | |
JP6698040B2 (en) | Generation device, generation method, and generation program | |
US20140180804A1 (en) | Tunable Algorithmic Segments | |
US20170206549A1 (en) | Recommending Advertisements Using Ranking Functions | |
CN111783810A (en) | Method and apparatus for determining attribute information of user | |
JP7231322B2 (en) | LEARNING DEVICE, LEARNING METHOD, LEARNING PROGRAM AND PROGRAM | |
JP6344995B2 (en) | Specific apparatus, specific method, and specific program | |
US20170278206A1 (en) | Digital Rights Management and Updates | |
CA3111094C (en) | Noise contrastive estimation for collaborative filtering | |
KR20150122307A (en) | Method and server apparatus for advertising | |
JP7041299B1 (en) | Information processing equipment, information processing methods and information processing programs | |
US20190188274A1 (en) | Recommendation prediction based on preference elicitation | |
JP2019036173A (en) | Calculation device, calculation method, calculation program and second model | |
JP7073557B2 (en) | Generator, generation method, and generation program | |
JP6043755B2 (en) | Generating device, generating method, and generating program | |
CN113159877A (en) | Data processing method, device, system and computer readable storage medium | |
JP2020135566A (en) | Information processing device, information processing method, and information processing program | |
JP7044922B1 (en) | Information processing equipment, information processing methods and information processing programs | |
CN111414535B (en) | Method and device for recommending target object to user |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20191101 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20191108 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200309 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201225 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210209 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210412 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20210928 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211220 |
|
C60 | Trial request (containing other claim documents, opposition documents) |
Free format text: JAPANESE INTERMEDIATE CODE: C60 Effective date: 20211220 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20220105 |
|
C21 | Notice of transfer of a case for reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C21 Effective date: 20220111 |
|
A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20220210 |
|
C211 | Notice of termination of reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C211 Effective date: 20220215 |
|
C22 | Notice of designation (change) of administrative judge |
Free format text: JAPANESE INTERMEDIATE CODE: C22 Effective date: 20220510 |
|
C13 | Notice of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: C13 Effective date: 20220628 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220829 |
|
C13 | Notice of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: C13 Effective date: 20220927 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221124 |
|
C22 | Notice of designation (change) of administrative judge |
Free format text: JAPANESE INTERMEDIATE CODE: C22 Effective date: 20221213 |
|
C23 | Notice of termination of proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C23 Effective date: 20221220 |
|
C03 | Trial/appeal decision taken |
Free format text: JAPANESE INTERMEDIATE CODE: C03 Effective date: 20230117 |
|
C30A | Notification sent |
Free format text: JAPANESE INTERMEDIATE CODE: C3012 Effective date: 20230117 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230216 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7231322 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |