JP7096093B2 - Learning equipment, learning methods and learning programs - Google Patents
Learning equipment, learning methods and learning programs Download PDFInfo
- Publication number
- JP7096093B2 JP7096093B2 JP2018140429A JP2018140429A JP7096093B2 JP 7096093 B2 JP7096093 B2 JP 7096093B2 JP 2018140429 A JP2018140429 A JP 2018140429A JP 2018140429 A JP2018140429 A JP 2018140429A JP 7096093 B2 JP7096093 B2 JP 7096093B2
- Authority
- JP
- Japan
- Prior art keywords
- vector
- user
- distribution target
- learning
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 36
- 239000013598 vector Substances 0.000 claims description 275
- 238000012549 training Methods 0.000 claims description 46
- 230000008569 process Effects 0.000 claims description 17
- 238000013500 data storage Methods 0.000 description 14
- 238000013528 artificial neural network Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 10
- 238000012545 processing Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 230000004913 activation Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000001932 seasonal effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Description
本発明は、学習装置、学習方法及び学習プログラムに関する。 The present invention relates to a learning device, a learning method and a learning program.
従来、各種の情報を利用者に対して提供する技術が知られている。このような技術の一例として、利用者が過去に選択した情報と関連する情報に基づいて、利用者と関連性が高い情報や利用者が興味を有する情報等、利用者と対応する情報を推定し、推定した情報を利用者に提供する技術が知られている。 Conventionally, techniques for providing various types of information to users have been known. As an example of such a technique, based on the information related to the information selected by the user in the past, the information corresponding to the user such as the information highly related to the user or the information that the user is interested in is estimated. However, there are known techniques for providing estimated information to users.
しかしながら、上述した従来技術では、利用者と対応する情報を適切に推定できない恐れがある。 However, with the above-mentioned conventional technique, there is a possibility that the information corresponding to the user cannot be estimated appropriately.
例えば、上述した従来技術では、新規の利用者等、過去に情報を選択していない利用者に対しては、利用者と対応する情報を適切に推定できない。 For example, in the above-mentioned conventional technique, it is not possible to appropriately estimate information corresponding to a user for a user who has not selected information in the past, such as a new user.
本願は、上記に鑑みてなされたものであって、利用者と対応する情報の推定精度を向上させることを目的とする。 The present application has been made in view of the above, and an object thereof is to improve the estimation accuracy of the information corresponding to the user.
本願に係る学習装置は、配信対象を示すベクトルであって、当該配信対象に含まれる情報と対応する次元に所定の値が格納された配信対象ベクトルと、利用者を示す利用者ベクトルとを取得する取得部と、前記配信対象ベクトルと前記利用者ベクトルとに基づいて、当該配信対象ベクトルと対応する配信対象が、当該利用者ベクトルと対応する利用者と対応するか否かを判定するモデルを学習する学習部とを有することを特徴とする。 The learning device according to the present application is a vector indicating a distribution target, and acquires a distribution target vector in which a predetermined value is stored in a dimension corresponding to the information included in the distribution target and a user vector indicating a user. Based on the acquisition unit, the distribution target vector, and the user vector, a model for determining whether or not the distribution target corresponding to the distribution target vector corresponds to the user corresponding to the user vector is determined. It is characterized by having a learning unit for learning.
実施形態の一態様によれば、利用者と対応する情報の推定精度を向上させることができるという効果を奏する。 According to one aspect of the embodiment, there is an effect that the estimation accuracy of the information corresponding to the user can be improved.
以下に、本願に係る学習装置、学習方法及び学習プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る学習装置、学習方法及び学習プログラムが限定されるものではない。また、各実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略する。 Hereinafter, the learning device, the learning method, and the embodiment for implementing the learning program (hereinafter referred to as “the embodiment”) according to the present application will be described in detail with reference to the drawings. It should be noted that this embodiment does not limit the learning device, learning method and learning program according to the present application. In addition, each embodiment can be appropriately combined as long as the processing contents do not contradict each other. Further, in each of the following embodiments, the same parts are designated by the same reference numerals, and duplicate description will be omitted.
〔1.ネットワークシステムの構成〕
まず、図1を参照して、実施形態に係るネットワークシステム1の構成について説明する。図1は、実施形態に係るネットワークシステム1の構成例を示す図である。図1に示すように、実施形態に係るネットワークシステム1には、端末装置10と、提供装置20と、学習装置100とが含まれる。端末装置10、提供装置20および学習装置100は、それぞれネットワークNと有線又は無線により接続される。
[1. Network system configuration]
First, the configuration of the
図1中では図示していないが、ネットワークシステム1は、端末装置101~10nを含んでもよい。本明細書では、端末装置101~10nを区別する必要がない場合は、端末装置101~10nを「端末装置10」と総称する。また、ネットワークシステム1は、複数台の提供装置20や、複数台の学習装置100を含んでもよい。
Although not shown in FIG. 1, the
端末装置10は、ユーザによって利用される情報処理装置である。端末装置10は、スマートフォン、デスクトップ型PC(Personal Computer)、ノート型PC、タブレット型PC、PDA(Personal Digital Assistant)を含む、任意のタイプの情報処理装置であってもよい。
The
提供装置20は、端末装置10および学習装置100に、各種情報を提供するサーバ装置である。例えば、提供装置20は、端末装置10に対して、コンテンツ(例えば、プッシュ通知)を提供する。また、例えば、提供装置20は、学習装置100に対して、コンテンツに関連する判定モデルを生成するための訓練データを提供する。
The providing
学習装置100は、ユーザに適合する情報を判定するモデルを学習するサーバ装置である。学習装置100は、ネットワークNを介して、有線又は無線により端末装置10および提供装置20と通信を行う。
The
〔2.学習処理〕
次に、図2を参照して、実施形態に係る学習処理の一例について説明する。図2は、実施形態に係る学習処理の一例を示す図である。
[2. Learning process]
Next, an example of the learning process according to the embodiment will be described with reference to FIG. FIG. 2 is a diagram showing an example of a learning process according to an embodiment.
図2の例では、提供装置20は、「ユーザU1」によって利用される端末装置101に対して、プッシュ型で「通知N1」を送信する。「プッシュ型」という語は、情報が、情報を提供する装置のトリガに基づいて送信される仕組みを指す。言い換えると、提供装置20は、端末装置101に、通知N1を、プッシュ通知として送信する。
In the example of FIG. 2, the providing
図2の例では、提供装置20は、通知N1に対する応答を受信する。一例では、提供装置20は、通知N1が選択されたことを示す選択情報を、端末装置101から受信する。この場合、通知N1は、ユーザU1に適合すると考えられる。別の例では、提供装置20は、通知N1が選択されなかったことを示す選択情報を、端末装置101から受信する。この場合、通知N1は、ユーザU1に適合しないと考えられる。
In the example of FIG. 2, the providing
図2の例では、提供装置20は、訓練データを、学習装置100に送信する。訓練データは、ユーザU1の属性情報AI1(例えば、ユーザU1のデモグラフィック属性)と、通知N1の通知情報NI1(例えば、通知N1のタイトル)と、ユーザU1が通知N1を選択したか否かを示す選択情報SI1(例えば、選択フラグ)とを含む。
In the example of FIG. 2, the providing
図2の例では、学習装置100は、提供装置20から受信された訓練データを用いて、所定の通知がユーザに適合するか否かを判定する順伝播型ニューラルネットを学習する。より具体的には、学習装置100は、ユーザU1の属性情報AI1と通知N1の通知情報NI1とを、訓練データの入力として用いる。また、学習装置100は、通知N1が選択されたか否か示す選択情報SI1を、訓練データの出力として用いる。
In the example of FIG. 2, the
図2の例では、ユーザU1の属性情報AI1は、ユーザU1に対応するワンホットベクトル(one hot vector)OV1を含む。ワンホットベクトルOV1の複数の成分のうちゼロでない1つの成分は、ユーザU1のユーザIDに対応する。一例では、ワンホットベクトルOV1の次元数は、ユーザIDの数と同一である。また、ユーザU1の属性情報AI1は、ワンホットベクトルOV1に対応する埋め込みベクトルUE1を含む。一例では、埋め込みベクトルUE1は、ユーザU1のデモグラフィック属性に対応する。例えば、ユーザU1の属性が「30代」の場合に、埋め込みベクトルUE1は、ユーザ属性「30代」に対応する分散表現である。 In the example of FIG. 2, the attribute information AI1 of the user U1 includes a one hot vector OV1 corresponding to the user U1. One non-zero component of the plurality of components of the one-hot vector OV1 corresponds to the user ID of the user U1. In one example, the number of dimensions of the one-hot vector OV1 is the same as the number of user IDs. Further, the attribute information AI1 of the user U1 includes an embedded vector UE1 corresponding to the one-hot vector OV1. In one example, the embedded vector UE1 corresponds to the demographic attribute of user U1. For example, when the attribute of the user U1 is "30s", the embedded vector UE1 is a distributed expression corresponding to the user attribute "30s".
図2の例では、通知N1の通知情報NI1は、BoWベクトル(bag of words vector)BV1を含む。BoWベクトルBV1の複数の成分のうちゼロでない少なくとも1つの成分は、通知N1の通知情報NI1に含まれる少なくとも1つの単語に対応する。また、通知情報NI1は、BoWベクトルBV1に対応する埋め込みベクトルNE1を含む。一例では、BoWベクトルBV1は、通知N1のタイトルに対応する。例えば、通知N1のタイトルが、単語「今夜」、「映画」、「テレビ」を含む場合に、埋め込みベクトルNE1は、単語「今夜」、「映画」、「テレビ」にそれぞれ対応する3つの分散表現の平均ベクトルである。 In the example of FIG. 2, the notification information NI1 of the notification N1 includes a BoW vector (bag of words vector) BV1. At least one non-zero component of the plurality of components of the BoW vector BV1 corresponds to at least one word contained in the notification information NI1 of the notification N1. Further, the notification information NI1 includes an embedded vector NE1 corresponding to the BoW vector BV1. In one example, the BoW vector BV1 corresponds to the title of notification N1. For example, if the title of notification N1 includes the words "tonight", "movie", and "television", the embedded vector NE1 has three distributed representations corresponding to the words "tonight", "movie", and "television", respectively. Is the average vector of.
図2の例では、通知N1が選択されたか否か示す選択情報SI1は、0または1の選択フラグを含む。一例では、通知N1が選択されたことを示す選択フラグは、「1」である。この例では、通知N1が選択されなかったことを示す選択フラグは、「0」である。 In the example of FIG. 2, the selection information SI1 indicating whether or not the notification N1 is selected includes a selection flag of 0 or 1. In one example, the selection flag indicating that notification N1 has been selected is "1". In this example, the selection flag indicating that notification N1 was not selected is "0".
はじめに、学習装置100は、提供装置20から受信された訓練データを参照し、ユーザU1のワンホットベクトルOV1に対応する埋め込みベクトルUE1を取得する。
First, the
次いで、学習装置100は、訓練データを参照し、通知N1のBoWベクトルBV1に対応する埋め込みベクトルNE1を取得する。
Next, the
次いで、学習装置100は、埋め込みベクトルUE1と埋め込みベクトルNE1とを連結(concatenate)することで、ベクトルCV1を生成する。埋め込みベクトルUE1が次元n(nは、任意の自然数)を持ち、埋め込みベクトルNE1が次元m(mは、任意の自然数)を持つ場合に、生成されたベクトルCV1は、次元(n+m)を持つ。この場合、ベクトルCV1は、(n+m)次元の分散表現である。
Next, the
次いで、学習装置100は、第1の重み行列にベクトルCV1を乗ずることで、ベクトル(図示せず)を算出する。そして、学習装置100は、算出されたベクトルを活性化関数(例えば、ReLU(Rectified Linear unit)関数)に代入することで、隠れ状態ベクトルHV1を生成する。
Next, the
次いで、学習装置100は、第2の重み行列に隠れ状態ベクトルHV1を乗ずることで、関連度RS1を算出する。
Next, the
次いで、学習装置100は、選択情報SI1に含まれる選択フラグの値と、算出された関連度RS1とを用いて、所定の通知がユーザU1に適合するか否かを判定する順伝播型ニューラルネットを学習する。例えば、学習装置100は、誤差逆伝播法を用いて、選択情報SI1に含まれる選択フラグの値および算出された関連度RS1に対応する目的関数(例えば、交差エントロピー損失関数)が最小化されるように、順伝播型ニューラルネットを学習する。
Next, the
通知N1以外の通知についても、学習装置100は、同様の学習処理で、順伝播型ニューラルネットを学習することができる。学習装置100は、かかる学習処理を繰り返すことで、汎化誤差が最小化されるように、順伝播型ニューラルネットを学習することができる。
For notifications other than the notification N1, the
その後、学習装置100は、学習された順伝播型ニューラルネットを用いて、ユーザU1と通知との間の関連性を示す関連性スコアを出力する。より具体的には、学習装置100は、ユーザU1に対応する埋め込みベクトルUE1と、所定の通知に対応する埋め込みベクトルとを、判定モデルに入力することで、ユーザU1が所定の通知を選択する事後確率を、ユーザU1と通知との間の関連性スコアとして出力する。
After that, the
上述のように、実施形態に係る学習装置100は、ユーザに対応する埋め込みベクトルと、通知に対応する埋め込みベクトルとを、訓練データの入力として用いる。また、学習装置100は、通知の選択フラグの値を、訓練データの出力として用いる。そして、学習装置100は、汎化誤差が最小化されるように、順伝播型ニューラルネットを学習する。これにより、学習装置100は、所定の通知がユーザに適合するか否かを判定する判定モデルを学習することができる。
As described above, the
ところで、図2の例では、提供装置20は、端末装置10に、通知をプッシュ通知として送信している。一般的に、プッシュ通知は、季節性のある情報である。例えば、提供装置20は、速報性の高い情報(例えば、今夜の番組)を1回だけプッシュ通知として送信する。したがって、このようなプッシュ通知に対応する配信履歴が存在しない場合がある。このような状況は、コールドスタート問題(cold start problem)に関連する。この点に関し、プッシュ通知に対応する配信履歴が存在しない場合でも、学習装置100は、上述の判定モデルを用いて、プッシュ通知がユーザに適合するか否かを判定することができる。このため、学習装置100は、ユーザが、ユーザが関心のあるプッシュ通知をタイムリーに受け取ることを可能にする。以下、このような学習処理を実現する学習装置100について詳細に説明する。
By the way, in the example of FIG. 2, the providing
〔3.学習装置の構成〕
次に、図3を参照して、実施形態に係る学習装置100の構成例について説明する。図3は、実施形態に係る学習装置100の構成例を示す図である。図3に示すように、学習装置100は、通信部110と、記憶部120と、制御部130とを有する。なお、学習装置100は、学習装置100を利用する管理者等から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を表示するための表示部(液晶ディスプレイ等)を有してもよい。
[3. Configuration of learning device]
Next, a configuration example of the
(通信部110)
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。通信部110は、ネットワーク網と有線又は無線により接続され、ネットワーク網を介して、端末装置10および提供装置20との間で情報の送受信を行う。
(Communication unit 110)
The
(記憶部120)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。図3に示すように、記憶部120は、訓練データ記憶部121と、判定モデル記憶部122とを有する。
(Memory unit 120)
The
(訓練データ記憶部121)
図4は、実施形態に係る訓練データ記憶部121の一例を示す図である。訓練データ記憶部121は、コンテンツに関連する予測モデルを生成するための訓練データを記憶する。予測モデルは、例えば、所定の通知がユーザに適合するか否かを判定する判定モデルである。一例では、判定モデルは、順伝播型ニューラルネットである。
(Training data storage unit 121)
FIG. 4 is a diagram showing an example of the training
訓練データ記憶部121は、例えば、受信部131によって受信された訓練データを記憶する。図4の例では、訓練データ記憶部121には、「訓練データ」が「ユーザID」ごとに記憶される。例示として、「訓練データ」には、項目「属性情報」、「通知ID」、「通知情報」および「選択情報」が含まれる。
The training
「ユーザID」は、ユーザを識別するための識別子を示す。「属性情報」は、ユーザの属性に関する情報を示す。ユーザの属性は、例えば、ユーザのデモグラフィック属性や、サイコグラフィック属性等である。 The "user ID" indicates an identifier for identifying a user. "Attribute information" indicates information about the user's attributes. User attributes are, for example, user demographic attributes, psychographic attributes, and the like.
属性情報は、ユーザに対応するワンホットベクトルを含む。ワンホットベクトルの複数の成分のうちゼロでない1つの成分が、ユーザのユーザIDに対応する。一例では、ワンホットベクトルの次元数は、ユーザIDの数と同一である。また、属性情報は、ワンホットベクトルに対応する埋め込みベクトル(例えば、分散表現)を含む。埋め込みベクトルは、例えば、ユーザのデモグラフィック属性や、サイコグラフィック属性等に対応する。例えば、ユーザの属性が「女性」の場合に、埋め込みベクトルは、ユーザ属性「女性」に対応する分散表現である。ユーザ属性に対応する分散表現は、所定のコーパスと、ニューラル言語モデルによって獲得され得る。 The attribute information includes a one-hot vector corresponding to the user. One non-zero component of the plurality of components of the one-hot vector corresponds to the user ID of the user. In one example, the number of dimensions of the one-hot vector is the same as the number of user IDs. Further, the attribute information includes an embedded vector (for example, a distributed representation) corresponding to the one-hot vector. The embedded vector corresponds to, for example, a user's demographic attribute, a psychographic attribute, and the like. For example, when the user attribute is "female", the embedded vector is a distributed representation corresponding to the user attribute "female". The distributed representation corresponding to the user attribute can be acquired by a predetermined corpus and a neural language model.
「通知ID」は、通知を識別するための識別子を示す。「通知情報」は、通知の内容に関する情報を示す。通知の内容は、例えば、通知のタイトルや、通知のボディ(例えば、本文のテキスト)や、通知が選択された場合のアクション(例えば、リンク先への画面遷移)等である。 The "notification ID" indicates an identifier for identifying the notification. "Notification information" indicates information regarding the content of the notification. The content of the notification is, for example, the title of the notification, the body of the notification (for example, the text of the text), the action when the notification is selected (for example, the screen transition to the link destination), and the like.
通知情報は、通知に対応するBoWベクトル(BoW表現とも呼ばれる)を含む。BoWベクトルの複数の成分のうちゼロでない少なくとも1つの成分は、通知の通知情報に含まれる少なくとも1つの単語に対応する。また、通知情報は、BoWベクトルに対応する埋め込みベクトルを含む。一例では、BoWベクトルは、通知のタイトルに対応する。例えば、通知のタイトルが「ジムに行く?」場合に、埋め込みベクトルは、単語「ジム」、「行く」にそれぞれ対応する2つの分散表現の平均ベクトルである。 The notification information includes a BoW vector (also referred to as a BoW representation) corresponding to the notification. At least one non-zero component of the plurality of components of the BoW vector corresponds to at least one word contained in the notification information of the notification. Further, the notification information includes an embedded vector corresponding to the Bow vector. In one example, the BoW vector corresponds to the title of the notification. For example, if the title of the notification is "Go to Jim?", The embedded vector is the average vector of the two distributed representations corresponding to the words "Jim" and "Go" respectively.
「選択情報」は、通知の選択に関する情報を示す。例えば、選択情報は、通知が選択されたか否か示す。例えば、選択情報は、通知が選択されたか否か示す選択フラグを含む。図4の例では、通知が選択されたことを示す選択フラグは、「1」である。この例では、通知が選択されなかったことを示す選択フラグは、「0」である。 "Selection information" indicates information regarding the selection of notifications. For example, the selection information indicates whether or not the notification has been selected. For example, the selection information includes a selection flag indicating whether or not the notification was selected. In the example of FIG. 4, the selection flag indicating that the notification has been selected is "1". In this example, the selection flag indicating that the notification was not selected is "0".
例えば、図4は、ユーザID「U1」で識別されるユーザが、属性情報AI1に対応することを示している。また、例えば、図4は、通知ID「N1」で識別される通知が、通知情報NI1に対応することを示している。また、例えば、図4は、ユーザID「U1」で識別されるユーザが、通知ID「N1」で識別される通知を選択したことを示している。 For example, FIG. 4 shows that the user identified by the user ID “U1” corresponds to the attribute information AI1. Further, for example, FIG. 4 shows that the notification identified by the notification ID “N1” corresponds to the notification information NI1. Further, for example, FIG. 4 shows that the user identified by the user ID “U1” has selected the notification identified by the notification ID “N1”.
(判定モデル記憶部122)
図3に戻ると、判定モデル記憶部122は、配信対象に関連する判定モデルを記憶する。判定モデル記憶部122は、例えば、学習部133によって学習されたモデルであって、配信対象ベクトルと対応する配信対象が、利用者ベクトルと対応する利用者と対応するか否かを判定するモデルを記憶する。
(Judgment model storage unit 122)
Returning to FIG. 3, the determination
(制御部130)
制御部130は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)、MPU(Micro Processing Unit)等のプロセッサによって、学習装置100内部の記憶装置に記憶されている各種プログラムがRAM等を作業領域として実行されることにより実現される。また、制御部130は、コントローラ(controller)であり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現されてもよい。
(Control unit 130)
The
(受信部131)
受信部131は、提供装置20から、コンテンツに関連する判定モデルを生成するための訓練データを受信する。訓練データは、ユーザの属性情報と、通知の通知情報と、ユーザが通知を選択したか否かを示す選択情報とを含む。受信部131は、受信された訓練データを、訓練データ記憶部121に格納してもよい。
(Receiver 131)
The receiving
受信部131は、提供装置20から、配信対象を示すベクトルであって、かかる配信対象に含まれる情報と対応する次元に所定の値が格納された配信対象ベクトルを受信する。例えば、受信部131は、配信対象となる文章に含まれる単語と対応する次元に所定の値が格納された配信対象ベクトルを受信する。一例では、受信部131は、通知に対応する埋め込みベクトルを受信する。上述の通知情報は、配信対象を示すベクトルであって、かかる配信対象に含まれる情報と対応する次元に所定の値が格納された配信対象ベクトルを含んでもよい。受信部131は、受信された配信対象ベクトルを、訓練データ記憶部121に格納してもよい。受信部131は、配信対象に含まれる情報を受信してもよい。
The receiving
上述の配信対象は、例えば、通知(例えば、プッシュ通知)、ニュース記事、テキストベースのメッセージ(例えば、レコメント情報)等である。配信対象がプッシュ通知である場合に、上述の配信対象ベクトルは、例えば、プッシュ通知のタイトルに含まれる単語と対応する次元に所定の値が格納されたベクトル(例えば、分散表現)である。 The above-mentioned distribution target is, for example, a notification (for example, push notification), a news article, a text-based message (for example, recomment information), or the like. When the delivery target is a push notification, the above-mentioned delivery target vector is, for example, a vector (for example, a distributed representation) in which a predetermined value is stored in a dimension corresponding to a word included in the title of the push notification.
受信部131は、提供装置20から、利用者を示す利用者ベクトルを受信する。例えば、受信部131は、利用者が有する属性と対応する次元に所定の値が格納された利用者ベクトルを受信する。一例では、受信部131は、ユーザに対応する埋め込みベクトルを受信する。上述の属性情報は、利用者を示す利用者ベクトルを含んでもよい。受信部131は、受信された利用者ベクトルを、訓練データ記憶部121に格納してもよい。受信部131は、利用者が有する属性に関する情報を受信してもよい。
The receiving
(取得部132)
取得部132は、コンテンツに関連する判定モデルを生成するための訓練データを取得する。取得部132は、例えば、受信部131によって受信された訓練データを取得する。取得部132は、訓練データ記憶部121から訓練データを取得してもよい。
(Acquisition unit 132)
The
取得部132は、配信対象を示すベクトルであって、かかる配信対象に含まれる情報と対応する次元に所定の値が格納された配信対象ベクトルを取得する。例えば、受信部131は、配信対象となる文章に含まれる単語と対応する次元に所定の値が格納された配信対象ベクトルを取得する。
The
取得部132は、例えば、受信部131によって受信された配信対象ベクトルを取得する。取得部132は、訓練データ記憶部121から配信対象ベクトルを取得してもよい。
The
取得部132は、利用者を示す利用者ベクトルを取得する。例えば、取得部132は、利用者が有する属性と対応する次元に所定の値が格納された利用者ベクトルを取得する。
The
取得部132は、例えば、受信部131によって受信された利用者ベクトルを取得する。取得部132は、訓練データ記憶部121から利用者ベクトルを取得してもよい。
The
(学習部133)
学習部133は、配信対象ベクトルと利用者ベクトルとに基づいて、配信対象ベクトルと対応する配信対象が、利用者ベクトルと対応する利用者と対応するか否かを判定するモデルを学習する。例えば、学習部133は、利用者に配信された配信対象と対応する配信対象ベクトルと、利用者の利用者ベクトルとの共起性をモデルに学習させる。
(Learning Department 133)
The
より具体的には、学習部133は、利用者に配信された配信対象が選択されたか否か示す選択情報(例えば、選択フラグ)に基づいて、配信対象ベクトルと利用者ベクトルとの共起性をモデルに学習させる。例えば、学習部133は、利用者ベクトルおよび配信対象ベクトルを訓練データの入力として用い、かつ利用者に配信された配信対象が選択されたか否か示す選択情報を訓練データの出力として用いることで、配信対象ベクトルと利用者ベクトルとの共起性に関する距離をモデルに学習させる。
More specifically, the
一例では、モデルは、ニューラルネットである。この例では、配信対象ベクトルは、配信対象(例えば、プッシュ通知)に対応する埋め込みベクトル(例えば、分散表現)である。また、この例では、利用者ベクトルは、利用者(例えば、ユーザ)に対応する埋め込みベクトルである。 In one example, the model is a neural network. In this example, the delivery target vector is an embedded vector (eg, distributed representation) corresponding to the delivery target (eg, push notification). Further, in this example, the user vector is an embedded vector corresponding to a user (for example, a user).
学習部133は、配信対象ベクトルと利用者ベクトルとを連結した連結ベクトルから、配信対象ベクトルと対応する配信対象が、利用者ベクトルと対応する利用者と対応するか否かを判定するモデルを学習する。言い換えれば、学習部133は、配信対象ベクトルと利用者ベクトルとの連結(concatenation)であるベクトルから、モデルを学習する。例えば、学習部133は、利用者ベクトルの末尾に配信対象ベクトルを連結した連結ベクトルから、配信対象が利用者と対応するか否かを判定するモデルを学習する。例えば、学習部133は、次元数が削減されるように連結ベクトルを徐々に畳み込むことで、配信対象が利用者と対応するか否かを示す値を生成するモデルを学習する。
The
一例では、学習部133は、配信対象に対応する埋め込みベクトルと利用者に対応する埋め込みベクトルとを連結することで、第1のベクトルを生成する。そして、学習部133は、生成された第1のベクトルに対応する中間層を含むニューラルネットであって、配信対象が利用者と対応するか否かを判定するニューラルネットを学習する。
In one example, the
例えば、学習部133は、第1の重み行列に第1のベクトルを乗ずることで、第2のベクトルを算出する。次いで、学習部133は、算出された第2のベクトルを活性化関数に代入することで、隠れ状態ベクトルを生成する。次いで、学習部133は、第2の重み行列に隠れ状態ベクトを乗ずることで、関連度を算出する。その後、学習部133は、配信対象が選択されたか否か示す選択情報(例えば、選択フラグ)と、算出された関連度とを用いて、所定の配信対象が利用者に適合するか否かを判定するニューラルネットを学習する。
For example, the
学習部133は、配信対象ベクトルから、配信対象ベクトルが示す配信対象に含まれる情報の特徴を示す特徴ベクトルの平均値の和となるベクトルを生成し、生成されたベクトルに基づいて、利用者と配信対象とが対応するか否かを判定するモデルを学習する。
The
一例では、情報の特徴を示す特徴ベクトルは、分散表現である。この例では、配信対象に含まれる情報が、第1~3の特徴を含む場合に、配信対象に対応する埋め込みベクトルは、第1~3の特徴にそれぞれ対応する3つの分散表現の平均ベクトルである。 In one example, the feature vector that represents the feature of the information is a distributed representation. In this example, when the information included in the distribution target includes the first to third features, the embedded vector corresponding to the delivery target is the average vector of the three distributed representations corresponding to the first to third features, respectively. be.
学習部133は、利用者ベクトルと、利用者ベクトルが示す利用者が選択した配信対象を示す配信対象ベクトルとが入力された際に、利用者ベクトルが示す利用者と配信対象ベクトルが示す配信対象とが対応する旨を出力し、利用者ベクトルと、利用者ベクトルが示す利用者が選択しなかった配信対象を示す配信対象ベクトルとが入力された際に、利用者ベクトルが示す利用者と配信対象ベクトルが示す配信対象とが対応しない旨が出力されるように、モデルを学習する。
When the user vector and the distribution target vector indicating the distribution target selected by the user indicated by the user vector are input, the
例えば、学習部133は、利用者ベクトルと、利用者が選択した配信対象を示す配信対象ベクトル(例えば、テストデータである配信対象ベクトル)とが入力された際に、モデルによって出力される値が、配信対象が選択されたことを示す値(例えば、選択フラグの選択に対応する値「1」)に近づくように、訓練用のデータである配信対象ベクトルを用いてモデルを訓練する。また、例えば、学習部133は、正則化手法(例えば、L2正則化等)を用いて、汎化誤差が最小化されるようにモデルを学習する。
For example, in the
学習部133は、例えば、配信対象が選択されたか否か示す選択情報およびモデルの出力に対応する目的関数が最小化されるように、モデルを学習する。一例では、学習部133は、誤差逆伝播法を用いて、選択情報に含まれる選択フラグの値およびニューラルネットワークの出力(例えば、上述の関連度)に対応する目的関数が最小化されるように、ニューラルネットを学習する。
The
(生成部134)
生成部134は、配信対象の候補となる配信対象に含まれる情報と対応する次元に所定の値が格納された候補ベクトルと、配信対象の候補の配信先となる利用者を示す配信先ベクトルとを生成する。例えば、生成部134は、所定のサーバから、配信対象の候補となる配信対象に含まれる情報に含まれるキーワードに対応する少なくとも1つのベクトル(例えば、分散表現)を取得する。また、例えば、生成部134は、所定のサーバから、配信対象の候補の配信先となる利用者の特徴に対応する少なくとも1つのベクトル(例えば、分散表現)を取得する。そして、生成部134は、情報に含まれるキーワードに対応する少なくとも1つのベクトルに基づいて、候補ベクトルを生成する。また、生成部134は、利用者の特徴に対応する少なくとも1つのベクトルに基づいて、配信先ベクトルを生成する。
(Generation unit 134)
The
生成部134は、配信対象に含まれる情報を用いて、配信対象を示すベクトルであって、かかる配信対象に含まれる情報と対応する次元に所定の値が格納された配信対象ベクトルを生成してもよい。また、生成部134は、利用者が有する属性に関する情報を用いて、利用者が有する属性と対応する次元に所定の値が格納された利用者ベクトルを生成してもよい。
The
生成部134は、配信対象に含まれる情報を用いて、配信対象に対応するBoWベクトルを生成してもよい。また、生成部134は、利用者が有する属性に関する情報を用いて、利用者に対応するワンホットベクトルを生成してもよい。
The
(判定部135)
判定部135は、学習部133により学習されたモデルを用いて、候補ベクトルと配信先ベクトルとから、配信対象の候補を配信先となる利用者に配信するか否かを判定する。また、判定部135は、候補ベクトルと配信先ベクトルとが入力された際に、候補ベクトルが示す配信候補が、配信先ベクトルが示す利用者と対応する旨をモデルが出力した場合は、配信候補を利用者に配信すると判定する。
(Judgment unit 135)
The
一例では、判定部135は、学習されたモデル(例えば、ニューラルネット)を用いて、利用者と配信対象の候補との間の関連性を示す関連性スコアを出力する。より具体的には、判定部135は、配信対象の候補の配信先に対応する配信先ベクトルと、配信対象の候補に対応する候補ベクトルとを、モデルに入力することで、利用者が配信対象の候補を選択する確率を、利用者と配信対象の候補との間の関連性スコアとして出力する。
In one example, the
(提供部136)
提供部136は、学習部133により学習されたモデルを提供する。例えば、提供部136は、学習されたモデルを提供装置20に提供する。提供部136は、判定部135による判定結果を、提供装置20に提供してもよい。
(Providing Department 136)
The providing
〔4.学習処理のフロー〕
次に、実施形態に係る学習装置100による学習処理の手順について説明する。図5は、実施形態に係る学習装置100による学習処理手順を示すフローチャートである。
[4. Learning process flow]
Next, the procedure of the learning process by the
図5に示すように、はじめに、学習装置100は、配信対象を示すベクトルであって、配信対象に含まれる情報と対応する次元に所定の値が格納された配信対象ベクトルと、利用者を示す利用者ベクトルとを取得する(ステップS101)。例えば、学習装置100は、利用者が有する属性と対応する次元に所定の値が格納された利用者ベクトルを取得する。また、例えば、学習装置100は、信対象となる文章に含まれる単語と対応する次元に所定の値が格納された配信対象ベクトルと取得する。
As shown in FIG. 5, first, the
次いで、学習装置100は、配信対象ベクトルと利用者ベクトルとに基づいて、配信対象ベクトルと対応する配信対象が、利用者ベクトルと対応する利用者と対応するか否かを判定するモデルを学習する(ステップS102)。例えば、学習装置100は、利用者に配信された配信対象と対応する配信対象ベクトルと、利用者の利用者ベクトルとの共起性を前記モデルに学習させる。
Next, the
より具体的には、学習装置100は、利用者ベクトルおよび配信対象ベクトルを訓練データの入力として用い、かつ利用者に配信された配信対象が選択されたか否か示す選択情報を訓練データの出力として用いることで、配信対象ベクトルと利用者ベクトルとの共起性に関する距離をモデルに学習させる。
More specifically, the
〔5.その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の一部を手動的に行うこともできる。あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
[5. others〕
Further, among the processes described in the above-described embodiment, a part of the processes described as being automatically performed can also be performed manually. Alternatively, all or part of the process described as being performed manually can be automatically performed by a known method. In addition, information including processing procedures, specific names, various data and parameters shown in the above documents and drawings can be arbitrarily changed unless otherwise specified. For example, the various information shown in each figure is not limited to the information shown in the figure.
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。 Further, each component of each of the illustrated devices is a functional concept, and does not necessarily have to be physically configured as shown in the figure. That is, the specific form of distribution / integration of each device is not limited to the one shown in the figure, and all or part of them may be functionally or physically distributed / physically in any unit according to various loads and usage conditions. Can be integrated and configured.
例えば、図3に示した記憶部120の一部又は全部は、学習装置100によって保持されるのではなく、ストレージサーバ等に保持されてもよい。この場合、学習装置100は、ストレージサーバにアクセスすることで、訓練データ等の各種情報を取得する。
For example, a part or all of the
〔6.ハードウェア構成〕
また、上述してきた実施形態に係る学習装置100は、例えば図6に示すような構成のコンピュータ1000によって実現される。図6は、ハードウェア構成の一例を示す図である。コンピュータ1000は、出力装置1010、入力装置1020と接続され、演算装置1030、一次記憶装置1040、二次記憶装置1050、出力IF(Interface)1060、入力IF1070、ネットワークIF1080がバス1090により接続された形態を有する。
[6. Hardware configuration]
Further, the
演算装置1030は、一次記憶装置1040や二次記憶装置1050に格納されたプログラムや入力装置1020から読み出したプログラム等に基づいて動作し、各種の処理を実行する。一次記憶装置1040は、RAM等、演算装置1030が各種の演算に用いるデータを一時的に記憶するメモリ装置である。また、二次記憶装置1050は、演算装置1030が各種の演算に用いるデータや、各種のデータベースが登録される記憶装置であり、ROM(Read Only Memory)、HDD、フラッシュメモリ等により実現される。
The
出力IF1060は、モニタやプリンタといった各種の情報を出力する出力装置1010に対し、出力対象となる情報を送信するためのインタフェースであり、例えば、USB(Universal Serial Bus)やDVI(Digital Visual Interface)、HDMI(登録商標)(High Definition Multimedia Interface)といった規格のコネクタにより実現される。また、入力IF1070は、マウス、キーボード、およびスキャナ等といった各種の入力装置1020から情報を受信するためのインタフェースであり、例えば、USB等により実現される。
The output IF 1060 is an interface for transmitting information to be output to an
なお、入力装置1020は、例えば、CD(Compact Disc)、DVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等から情報を読み出す装置であってもよい。また、入力装置1020は、USBメモリ等の外付け記憶媒体であってもよい。
The
ネットワークIF1080は、ネットワークNを介して他の機器からデータを受信して演算装置1030へ送り、また、ネットワークNを介して演算装置1030が生成したデータを他の機器へ送信する。
The network IF 1080 receives data from another device via the network N and sends it to the
演算装置1030は、出力IF1060や入力IF1070を介して、出力装置1010や入力装置1020の制御を行う。例えば、演算装置1030は、入力装置1020や二次記憶装置1050からプログラムを一次記憶装置1040上にロードし、ロードしたプログラムを実行する。
The
例えば、コンピュータ1000が学習装置100として機能する場合、コンピュータ1000の演算装置1030は、一次記憶装置1040上にロードされたプログラムを実行することにより、制御部130の機能を実現する。
For example, when the
〔7.効果〕
上述してきたように、実施形態に係る学習装置100は、取得部132と、学習部133とを有する。取得部132は、配信対象を示すベクトルであって、配信対象に含まれる情報と対応する次元に所定の値が格納された配信対象ベクトルと、利用者を示す利用者ベクトルとを取得する。学習部133は、配信対象ベクトルと利用者ベクトルとに基づいて、配信対象ベクトルと対応する配信対象が、利用者ベクトルと対応する利用者と対応するか否かを判定するモデルを学習する。
[7. effect〕
As described above, the
また、実施形態に係る学習装置100において、取得部132は、利用者が有する属性と対応する次元に所定の値が格納された利用者ベクトルを取得する。
Further, in the
また、実施形態に係る学習装置100において、取得部132は、配信対象となる文章に含まれる単語と対応する次元に所定の値が格納された配信対象ベクトルを取得する。
Further, in the
また、実施形態に係る学習装置100において、学習部133は、利用者に配信された配信対象と対応する配信対象ベクトルと、利用者の利用者ベクトルとの共起性をモデルに学習させる。
Further, in the
また、実施形態に係る学習装置100において、学習部133は、配信対象ベクトルと利用者ベクトルとを連結した連結ベクトルから、配信対象ベクトルと対応する配信対象が、利用者ベクトルと対応する利用者と対応するか否かを判定するモデルを学習する。
Further, in the
また、実施形態に係る学習装置100において、学習部133は、利用者ベクトルの末尾に配信対象ベクトルを連結した連結ベクトルから、配信対象が利用者と対応するか否かを判定するモデルを学習する。
Further, in the
また、実施形態に係る学習装置100において、学習部133は、次元数が削減されるように連結ベクトルを徐々に畳み込むことで、配信対象が利用者と対応するか否かを示す値を生成するモデルを学習する。
Further, in the
また、実施形態に係る学習装置100において、学習部133は、配信対象ベクトルから、配信対象ベクトルが示す配信対象に含まれる情報の特徴を示す特徴ベクトルの平均値の和となるベクトルを生成し、生成されたベクトルに基づいて、利用者と配信対象とが対応するか否かを判定するモデルを学習する。
Further, in the
また、実施形態に係る学習装置100において、学習部133は、利用者ベクトルと、利用者ベクトルが示す利用者が選択した配信対象を示す配信対象ベクトルとが入力された際に、利用者ベクトルが示す利用者と配信対象ベクトルが示す配信対象とが対応する旨を出力し、利用者ベクトルと、利用者ベクトルが示す利用者が選択しなかった配信対象を示す配信対象ベクトルとが入力された際に、利用者ベクトルが示す利用者と配信対象ベクトルが示す配信対象とが対応しない旨が出力されるように、モデルを学習する。
Further, in the
また、実施形態に係る学習装置100は、配信対象の候補となる配信対象に含まれる情報と対応する次元に所定の値が格納された候補ベクトルと、配信対象の候補の配信先となる利用者を示す配信先ベクトルとを生成する生成部134を有する。また、実施形態に係る学習装置100は、学習部133により学習されたモデルを用いて、候補ベクトルと配信先ベクトルとから、配信対象の候補を配信先となる利用者に配信するか否かを判定する判定部135を有する。
Further, the
また、実施形態に係る学習装置100において、判定部135は、候補ベクトルと配信先ベクトルとが入力された際に、候補ベクトルが示す配信候補が、配信先ベクトルが示す利用者と対応する旨をモデルが出力した場合は、配信候補を利用者に配信すると判定する。
Further, in the
上述した各処理により、学習装置100は、所定の通知がユーザに適合するか否かを判定する判定モデルを学習することができる。
By each of the above-mentioned processes, the
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。 Although some of the embodiments of the present application have been described in detail with reference to the drawings, these are examples, and various modifications are made based on the knowledge of those skilled in the art, including the embodiments described in the disclosure column of the invention. It is possible to carry out the present invention in other modified forms.
また、上述した学習装置100は、複数のサーバコンピュータで実現してもよく、また、機能によっては外部のプラットフォーム等をAPI(Application Programming Interface)やネットワークコンピューティングなどで呼び出して実現するなど、構成は柔軟に変更できる。
Further, the above-mentioned
また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、受信部は、受信手段や受信回路に読み替えることができる。 Further, the above-mentioned "section, module, unit" can be read as "means" or "circuit". For example, the receiving unit can be read as a receiving means or a receiving circuit.
1 ネットワークシステム
10 端末装置
20 提供装置
100 学習装置
120 記憶部
121 訓練データ記憶部
122 判定モデル記憶部
130 制御部
131 受信部
132 取得部
133 学習部
134 生成部
135 判定部
136 提供部
1
Claims (10)
前記配信対象ベクトルと前記利用者ベクトルとを、訓練データの入力として用い、前記選択情報を、訓練データの出力として用いて、第2の利用者がプッシュ通知である第2の配信対象を選択するかを判定するモデルを学習する学習部と
を有し、
前記学習部は、
次元数が削減されるように、前記配信対象ベクトルと前記利用者ベクトルとを連結した連結ベクトルを徐々に畳み込むことで、当該配信対象ベクトルと対応する配信対象が、当該利用者ベクトルと対応する利用者と対応するか否かを判定するモデルを学習する
ことを特徴する学習装置。 The distribution target vector, which is a distributed expression corresponding to the word included in the title of the first distribution target, which is a push notification, the user vector, which is a distributed expression corresponding to the demographic attribute of the first user, and the first. An acquisition unit that acquires selection information indicating whether the user of 1 has selected the first distribution target, and
The distribution target vector and the user vector are used as input of training data, and the selection information is used as output of training data, and the second user selects a second distribution target which is a push notification . It has a learning unit that learns a model to determine whether
The learning unit
By gradually convolving the connection vector that connects the distribution target vector and the user vector so that the number of dimensions is reduced, the distribution target corresponding to the distribution target vector can be used corresponding to the user vector. Learn a model that determines whether or not to correspond to a person
A learning device that features that.
前記第1の利用者が有するデモグラフィック属性と対応する次元に所定の値が格納された利用者ベクトルを取得する
ことを特徴とする請求項1に記載の学習装置。 The acquisition unit
The learning device according to claim 1, wherein a user vector in which a predetermined value is stored in a dimension corresponding to the demographic attribute possessed by the first user is acquired.
配信対象となる文章に含まれる単語と対応する次元に所定の値が格納された配信対象ベクトルを取得する
ことを特徴とする請求項1または2に記載の学習装置。 The acquisition unit
The learning device according to claim 1 or 2, wherein a distribution target vector in which a predetermined value is stored in a dimension corresponding to a word included in a sentence to be distributed is acquired.
前記利用者ベクトルの末尾に前記配信対象ベクトルを連結した連結ベクトルから、前記配信対象が前記利用者と対応するか否かを判定するモデルを学習する
ことを特徴とする請求項1~3のうちいずれか1つに記載の学習装置。 The learning unit
Of claims 1 to 3, a model for determining whether or not the distribution target corresponds to the user is learned from a connection vector in which the distribution target vector is connected to the end of the user vector. The learning device according to any one .
前記配信対象ベクトルから、当該配信対象ベクトルが示す配信対象に含まれる情報の特徴を示す特徴ベクトルの平均ベクトルを生成し、生成された平均ベクトルに基づいて、前記第2の利用者と前記第2の配信対象とが対応するか否かを判定するモデルを学習する
ことを特徴とする請求項1~4のうちいずれか1つに記載の学習装置。 The learning unit
From the distribution target vector, an average vector of a feature vector indicating the characteristics of the information included in the distribution target indicated by the distribution target vector is generated, and based on the generated average vector, the second user and the second user. The learning device according to any one of claims 1 to 4, wherein the learning device is characterized by learning a model for determining whether or not the delivery target is compatible with the above.
前記利用者ベクトルと、当該利用者ベクトルが示す利用者が選択した配信対象を示す配信対象ベクトルとが入力された際に、当該利用者ベクトルが示す利用者と当該配信対象ベクトルが示す配信対象とが対応する旨を出力し、前記利用者ベクトルと、当該利用者ベクトルが示す利用者が選択しなかった配信対象を示す配信対象ベクトルとが入力された際に、当該利用者ベクトルが示す利用者と当該配信対象ベクトルが示す配信対象とが対応しない旨が出力されるように、前記モデルを学習する
ことを特徴とする請求項1~5のうちいずれか1つに記載の学習装置。 The learning unit
When the user vector and the distribution target vector indicating the distribution target selected by the user indicated by the user vector are input, the user indicated by the user vector and the distribution target indicated by the distribution target vector Outputs the correspondence, and when the user vector and the distribution target vector indicating the distribution target not selected by the user indicated by the user vector are input, the user indicated by the user vector is input. The learning device according to any one of claims 1 to 5 , wherein the model is trained so that it is output that the delivery target and the delivery target indicated by the delivery target vector do not correspond to each other.
前記学習部により学習されたモデルを用いて、前記候補ベクトルと前記配信先ベクトルとから、前記配信対象の候補を前記配信先となる利用者に配信するか否かを判定する判定部と
を有することを特徴とする請求項1~6のうちいずれか1つに記載の学習装置。 Generation that generates a candidate vector in which a predetermined value is stored in a dimension corresponding to the information contained in the distribution target that is a candidate for distribution target, and a distribution destination vector that indicates a user who is a distribution destination of the candidate distribution target. Department and
Using the model learned by the learning unit, it has a determination unit for determining whether or not to distribute the candidate to be distributed to the user who is the distribution destination from the candidate vector and the distribution destination vector. The learning device according to any one of claims 1 to 6, wherein the learning device is characterized by the above.
前記候補ベクトルと前記配信先ベクトルとが入力された際に、当該候補ベクトルが示す配信候補が、前記配信先ベクトルが示す利用者と対応する旨を前記モデルが出力した場合は、当該配信候補を当該利用者に配信すると判定する
ことを特徴とする請求項7に記載の学習装置。 The determination unit
When the candidate vector and the delivery destination vector are input, if the model outputs that the delivery candidate indicated by the candidate vector corresponds to the user indicated by the delivery destination vector, the delivery candidate is selected. The learning device according to claim 7 , wherein it is determined to deliver to the user.
プッシュ通知である第1の配信対象のタイトルに含まれる単語に対応する分散表現である配信対象ベクトルと、第1の利用者のデモグラフィック属性に対応する分散表現である利用者ベクトルと、当該第1の利用者が当該第1の配信対象を選択したかを示す選択情報とを取得する取得工程と、
前記配信対象ベクトルと前記利用者ベクトルとを、訓練データの入力として用い、前記選択情報を、訓練データの出力として用いて、第2の利用者がプッシュ通知である第2の配信対象を選択するかを判定するモデルを学習する学習工程と
を含み、
前記学習工程は、
次元数が削減されるように、前記配信対象ベクトルと前記利用者ベクトルとを連結した連結ベクトルを徐々に畳み込むことで、当該配信対象ベクトルと対応する配信対象が、当該利用者ベクトルと対応する利用者と対応するか否かを判定するモデルを学習する
ことを特徴とする学習方法。 The way the learning device performs,
The distribution target vector, which is a distributed expression corresponding to the word included in the title of the first distribution target, which is a push notification, the user vector, which is a distributed expression corresponding to the demographic attribute of the first user, and the first. An acquisition process for acquiring selection information indicating whether the user of 1 has selected the first distribution target, and
The distribution target vector and the user vector are used as input of training data, and the selection information is used as output of training data, and the second user selects a second distribution target which is a push notification . Including a learning process to learn a model to determine
The learning process is
By gradually convolving the connection vector that connects the distribution target vector and the user vector so that the number of dimensions is reduced, the distribution target corresponding to the distribution target vector can be used corresponding to the user vector. Learn a model that determines whether or not to correspond to a person
A learning method characterized by that.
前記配信対象ベクトルと前記利用者ベクトルとを、訓練データの入力として用い、前記選択情報を、訓練データの出力として用いて、第2の利用者がプッシュ通知である第2の配信対象を選択するかを判定するモデルを学習する学習手順と
をコンピュータに実行させ、
前記学習手順は、
次元数が削減されるように、前記配信対象ベクトルと前記利用者ベクトルとを連結した連結ベクトルを徐々に畳み込むことで、当該配信対象ベクトルと対応する配信対象が、当該利用者ベクトルと対応する利用者と対応するか否かを判定するモデルを学習する
ことを特徴とする学習プログラム。 The distribution target vector, which is a distributed expression corresponding to the word included in the title of the first distribution target, which is a push notification, the user vector, which is a distributed expression corresponding to the demographic attribute of the first user, and the first. An acquisition procedure for acquiring selection information indicating whether the user of 1 has selected the first distribution target, and
The distribution target vector and the user vector are used as input of training data, and the selection information is used as output of training data, and the second user selects a second distribution target which is a push notification . Let the computer perform the learning procedure to learn the model to determine
The learning procedure is
By gradually convolving the connection vector that connects the distribution target vector and the user vector so that the number of dimensions is reduced, the distribution target corresponding to the distribution target vector can be used corresponding to the user vector. Learn a model that determines whether or not to correspond to a person
A learning program characterized by that .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018140429A JP7096093B2 (en) | 2018-07-26 | 2018-07-26 | Learning equipment, learning methods and learning programs |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018140429A JP7096093B2 (en) | 2018-07-26 | 2018-07-26 | Learning equipment, learning methods and learning programs |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020017126A JP2020017126A (en) | 2020-01-30 |
JP7096093B2 true JP7096093B2 (en) | 2022-07-05 |
Family
ID=69580461
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018140429A Active JP7096093B2 (en) | 2018-07-26 | 2018-07-26 | Learning equipment, learning methods and learning programs |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7096093B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7010337B2 (en) * | 2020-07-03 | 2022-01-26 | 楽天グループ株式会社 | A program of a learning device, an estimation device, a learning method, an estimation method, a program, and a trained estimation model. |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020107853A1 (en) | 2000-07-26 | 2002-08-08 | Recommind Inc. | System and method for personalized search, information filtering, and for generating recommendations utilizing statistical latent class models |
JP2005157535A (en) | 2003-11-21 | 2005-06-16 | Canon Inc | Content extraction method, content extraction device, content information display method, and display device |
JP2008273497A (en) | 2007-03-30 | 2008-11-13 | Denso It Laboratory Inc | Information provision support method and information provision support device |
US20100191689A1 (en) | 2009-01-27 | 2010-07-29 | Google Inc. | Video content analysis for automatic demographics recognition of users and videos |
US20120209795A1 (en) | 2011-02-12 | 2012-08-16 | Red Contexto Ltd. | Web page analysis system for computerized derivation of webpage audience characteristics |
JP6059314B1 (en) | 2015-09-17 | 2017-01-11 | ヤフー株式会社 | Estimation apparatus, estimation method, and estimation program |
US20170017886A1 (en) | 2015-07-14 | 2017-01-19 | Facebook, Inc. | Compatibility prediction based on object attributes |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8924993B1 (en) * | 2010-11-11 | 2014-12-30 | Google Inc. | Video content analysis for automatic demographics recognition of users and videos |
JP6712796B2 (en) * | 2015-11-10 | 2020-06-24 | 国立大学法人 東京大学 | Method and apparatus for learning between different language documents via image, cross-language document retrieval method and apparatus |
JP6635587B2 (en) * | 2015-12-14 | 2020-01-29 | 日本放送協会 | Advertising sentence selection device and program |
-
2018
- 2018-07-26 JP JP2018140429A patent/JP7096093B2/en active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020107853A1 (en) | 2000-07-26 | 2002-08-08 | Recommind Inc. | System and method for personalized search, information filtering, and for generating recommendations utilizing statistical latent class models |
JP2005157535A (en) | 2003-11-21 | 2005-06-16 | Canon Inc | Content extraction method, content extraction device, content information display method, and display device |
JP2008273497A (en) | 2007-03-30 | 2008-11-13 | Denso It Laboratory Inc | Information provision support method and information provision support device |
US20100191689A1 (en) | 2009-01-27 | 2010-07-29 | Google Inc. | Video content analysis for automatic demographics recognition of users and videos |
US20120209795A1 (en) | 2011-02-12 | 2012-08-16 | Red Contexto Ltd. | Web page analysis system for computerized derivation of webpage audience characteristics |
US20170017886A1 (en) | 2015-07-14 | 2017-01-19 | Facebook, Inc. | Compatibility prediction based on object attributes |
JP6059314B1 (en) | 2015-09-17 | 2017-01-11 | ヤフー株式会社 | Estimation apparatus, estimation method, and estimation program |
Also Published As
Publication number | Publication date |
---|---|
JP2020017126A (en) | 2020-01-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
GB2573189A (en) | Generating a topic-based summary of textual content | |
US11544336B2 (en) | Collaborative-filtered content recommendations with justification in real-time | |
CN109981785B (en) | Method and device for pushing information | |
JP2019008742A (en) | Learning device, generation device, learning method, generation method, learning program, and generation program | |
WO2014141976A1 (en) | Method for user categorization in social media, computer program, and computer | |
US20190155884A1 (en) | Dynamic Digital Document Visual Aids in a Digital Medium Environment | |
JP6344995B2 (en) | Specific apparatus, specific method, and specific program | |
JP2019219737A (en) | Interactive server, interactive method and interactive program | |
CN110059172B (en) | Method and device for recommending answers based on natural language understanding | |
JP7096093B2 (en) | Learning equipment, learning methods and learning programs | |
JP6679448B2 (en) | Generation device, generation method, and generation program | |
JP2019053558A (en) | Learning device, learning method, learning program, first model, and second model | |
JP7041018B2 (en) | Learning equipment, learning methods and learning programs | |
WO2022116827A1 (en) | Automatic delineation and extraction of tabular data in portable document format using graph neural networks | |
WO2021095358A1 (en) | Learning method, evaluation device, and evaluation system | |
WO2022050060A1 (en) | Information processing device and information processing method | |
CN114996507A (en) | Video recommendation method and device | |
JP7073227B2 (en) | Providing equipment, providing method and providing program | |
JP6963988B2 (en) | Providing equipment, providing method and providing program | |
JP2018511873A (en) | Search service providing apparatus, method, and computer program | |
JP2021162997A (en) | Information processing device and information processing method | |
CN112131502A (en) | Data processing method, data processing apparatus, electronic device, and medium | |
US20190130443A1 (en) | Usable interferences based on a user's updated digital profile | |
JP2020016960A (en) | Estimation device, estimation method and estimation program | |
JP7326387B2 (en) | Information processing system and information processing method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20191101 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20191108 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200819 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210615 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20210618 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210816 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20220118 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220418 |
|
C60 | Trial request (containing other claim documents, opposition documents) |
Free format text: JAPANESE INTERMEDIATE CODE: C60 Effective date: 20220418 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20220427 |
|
C21 | Notice of transfer of a case for reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C21 Effective date: 20220510 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220614 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220623 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7096093 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |