JP2020027517A - 行動データ識別システム - Google Patents

行動データ識別システム Download PDF

Info

Publication number
JP2020027517A
JP2020027517A JP2018152855A JP2018152855A JP2020027517A JP 2020027517 A JP2020027517 A JP 2020027517A JP 2018152855 A JP2018152855 A JP 2018152855A JP 2018152855 A JP2018152855 A JP 2018152855A JP 2020027517 A JP2020027517 A JP 2020027517A
Authority
JP
Japan
Prior art keywords
data
identification
behavior data
behavior
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018152855A
Other languages
English (en)
Inventor
田中 茂樹
Shigeki Tanaka
茂樹 田中
伊藤 拓
Hiroshi Ito
拓 伊藤
佑介 深澤
Yusuke Fukazawa
佑介 深澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Priority to JP2018152855A priority Critical patent/JP2020027517A/ja
Publication of JP2020027517A publication Critical patent/JP2020027517A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】 レコメンドの精度の評価を行うため等の多数の行動データを容易に取得する。【解決手段】 行動データ識別システムであるレコメンドエンジン評価システム10は、ユーザの行動に対する条件及び当該条件に応じたユーザの行動を示す行動データを取得する学習用データ取得部11と、取得された行動データに基づいて、相互の機械学習によって、真の行動データと偽の行動データとを識別する識別モデル、及び当該識別モデルによって真の行動データと識別されるような偽の行動データを生成する生成モデルを生成するモデル生成部12と、生成された生成モデルとは独立して、識別対象の行動データを取得する識別用データ取得部13と、生成された識別モデルを用いて、取得された識別対象の行動データの真偽を識別する識別部14とを備える。【選択図】 図1

Description

本発明は、ユーザの行動を示す行動データに係る識別を行う行動データ識別システムに関する。
従来から、ユーザに応じた動画のレコメンドを行うことが提案されている(例えば、特許文献1参照)。例えば、ユーザの満足度を向上させるためにユーザの嗜好に合わせたコンテンツがレコメンドされる。
特開2013−161116号公報
一般にレコメンドの精度は、レコメンドしたコンテンツのCTR(Click Through Rate、クリック率)及び視聴時間等といったレコメンドに対するユーザの好意的な行動で評価される。そのため、レコメンドの精度の評価を行うためには、レコメンドに対するユーザの行動を示す行動データを多く取得する必要がある。しかしながら通常、行動データを取得するにはユーザに対して実際のレコメンドを行う必要があるため、多数の行動データを多く取得するには困難な場合がある。
本発明は、上記に鑑みてなされたものであり、レコメンドの精度の評価を行うため等の多数の行動データを容易に取得することができる行動データ識別システムを提供することを目的とする。
上記の目的を達成するために、本発明に係る行動データ識別システムは、ユーザの行動に対する条件及び当該条件に応じたユーザの行動を示す行動データを取得する学習用データ取得部と、学習用データ取得部によって取得された行動データに基づいて、相互の機械学習によって、真の行動データと偽の行動データとを識別する識別モデル、及び当該識別モデルによって真の行動データと識別されるような偽の行動データを生成する生成モデルを生成するモデル生成部と、モデル生成部によって生成された生成モデルとは独立して、識別対象の行動データを取得する識別用データ取得部と、モデル生成部によって生成された識別モデルを用いて、識別用データ取得部によって取得された行動データの真偽を識別する識別部と、を備える。
本発明に係る行動データ識別システムでは、実際のユーザの行動に係る少数の行動データ、即ち、少数の真の行動データが取得できれば、それに基づいて識別モデルが生成される。また、当該識別モデルが用いられて識別対象の行動データの真偽が識別されることによって、当該識別対象の行動データから多数の妥当性の高い行動データが取得される。従って、本発明に係る行動データ識別システムによれば、レコメンドの精度の評価を行うため等の多数の行動データを容易に取得することができる。
本発明では、実際のユーザの行動に係る少数の行動データ、即ち、少数の真の行動データが取得できれば、それに基づいて識別モデルが生成される。また、当該識別モデルが用いられて識別対象の行動データの真偽が識別されることによって、当該識別対象の行動データから多数の妥当性の高い行動データが取得される。従って、本発明によれば、レコメンドの精度の評価を行うため等の多数の行動データを容易に取得することができる。
本発明の実施形態に係る行動データ識別システムであるレコメンドエンジン評価システムの構成を示す図である。 行動データの例を示すテーブルである。 Generatorの機能を模式的に示す図である。 Discriminatorの機能を模式的に示す図である。 レコメンドの精度の評価に用いられる行動データの例を示す図である。 本発明の実施形態に係る行動データ識別システムであるレコメンドエンジン評価システムで実行される処理全体を示すフローチャートである。 本発明の実施形態に係る行動データ識別システムであるレコメンドエンジン評価システムで実行されるGANによるGenerator及びDiscriminatorの生成全体(機械学習全体)の処理を示すフローチャートである。 本発明の実施形態に係る行動データ識別システムであるレコメンドエンジン評価システムで実行されるDiscriminatorの学習の処理を示すフローチャートである。 本発明の実施形態に係る行動データ識別システムであるレコメンドエンジン評価システムで実行されるGeneratorの学習の処理を示すフローチャートである。 本発明の実施形態に係る行動データ識別システムであるレコメンドエンジン評価システムのハードウェア構成を示す図である。
以下、図面と共に本発明に係る行動データ識別システムの実施形態について詳細に説明する。なお、図面の説明においては同一要素には同一符号を付し、重複する説明を省略する。
図1に本実施形態に係る行動データ識別システムであるレコメンドエンジン評価システム10を示す。レコメンドエンジン評価システム10は、レコメンドエンジンによるレコメンドの精度を評価するシステム(装置)である。レコメンドエンジンは、ユーザにレコメンドされる動画等のコンテンツを決定するシステム(装置)である。レコメンドエンジンは、ユーザの属性及び状態の少なくとも何れかに応じて、ユーザに合ったコンテンツをレコメンドされるコンテンツとして決定する。なお、レコメンドは、動画等のコンテンツを対象とするものに限られず広告(プッシュ広告)等を対象とするものであってもよい。
コンテンツのレコメンドは、例えば、ユーザが所持する端末にコンテンツを示す情報が送信されることで行われる。当該端末においてコンテンツを示す情報の表示等の出力が行われて、ユーザは、レコメンドされたコンテンツを認識することができる。ユーザは、レコメンドされたコンテンツに興味を持った場合、端末を操作してレコメンドされたコンテンツを取得して参照(例えば、視聴)することができる。
レコメンドエンジン評価システム10は、例えば、レコメンドされたコンテンツがユーザに参照(例えば、視聴)されている程、レコメンドの精度が高いと評価する。上述したように通常、レコメンドの精度の評価を行うためには、レコメンドに対するユーザの行動に係る実際の行動データが必要となる。しかしながら通常、実際の行動データを取得するには、ユーザに対して実際のレコメンドを行う必要があるため、多数の行動データを取得するには困難な場合があった。また、レコメンドエンジンは、レコメンドの精度の評価を受けてチューニングされる。通常、レコメンドの精度の評価とチューニングとが繰り返し行われるため、多数の行動データを取得できたとしても、従来はレコメンドエンジンのチューニングに非常に時間が掛かっていた。
そこで、本実施形態に係るレコメンドエンジン評価システム10は、実際のレコメンドに基づかない人工的な行動データを取得して、当該行動データを用いてレコメンドの精度を評価する。レコメンドエンジン評価システム10は、例えば、サーバ装置、PC(パーソナルコンピュータ)等のコンピュータによって実現される。また、レコメンドエンジン評価システム10は、複数のコンピュータ、即ち、コンピュータシステムによって実現されてもよい。
引き続いて、本実施形態に係るレコメンドエンジン評価システム10の機能を説明する。図1に示すようにレコメンドエンジン評価システム10は、学習用データ取得部11と、モデル生成部12と、識別用データ取得部13と、識別部14と、評価部15とを備えて構成される。
学習用データ取得部11は、ユーザの行動に対する条件及び当該条件に応じたユーザの行動を示す行動データを取得する機能部である。条件は、ユーザにレコメンドされるコンテンツを含み、ユーザの行動は、当該レコメンドに対するユーザの行動である。学習用データ取得部11は、実際に行われたレコメンドに対する実際のユーザの行動に係る実際の行動データを取得する。即ち、実際の行動データを生成するために、予め、実際のユーザに対して実際のコンテンツをレコメンドしておく。レコメンドに対するユーザの行動は、例えば、レコメンドされたコンテンツを取得して視聴したか否か、及び視聴した場合の視聴時間である。レコメンドされるコンテンツは、評価対象のレコメンドエンジンによって決定されたものでも、それ以外によって決定されたものでもよい。
ユーザの行動に対する条件は、ユーザに係るもの及びコンテンツに係るものを含む。ユーザに係る条件としては、例えば、年齢、性別及び興味等のユーザの属性、並びにレコメンドされた際の時刻及び場所等のレコメンドされた際のユーザの状態を含む。コンテンツに係る条件としては、コンテンツのジャンル及びコンテンツの長さ等である。なお、ユーザの行動に対する条件及びユーザの行動としては、上記以外のものが含まれていてもよい。また、ユーザに係る条件及びコンテンツに係る条件として、上記の全てが含まれている必要はない。
行動データは、例えば、実際のレコメンドのレコメンドログに基づいて、レコメンドエンジン評価システム10の管理者によって生成される。学習用データ取得部11は、例えば、レコメンドエンジン評価システム10への行動データの入力操作を受け付けて行動データを取得する。あるいは、学習用データ取得部11が、レコメンドログを取得して、レコメンドログに基づいて行動データを生成してもよい。
学習用データ取得部11によって取得される行動データの例を図2に示す。図2における個々のレコード(1つの行に相当)が、1つの行動データに対応する。ユーザメタの欄の情報は、ユーザの属性を示す情報である。ユーザメタの欄は、数値である特徴量1〜3の情報を含む。特徴量1〜3は、ユーザの属性を複数次元の数値としたものである。なお、数値の次元数は、図2に示すような3次元に限られず、任意でよい。ユーザの属性の数値化は、従来の技術によって行うことができる。ユーザの属性の数値化は、行動データがレコメンドエンジン評価システム10に入力される時点で予め行われていてもよいし、年齢、性別及び興味といったユーザの属性を示す情報に基づいて学習用データ取得部11によって行われてもよい。以下の数値化された情報についても同様である。
コンテンツメタの欄の情報は、レコメンドされたコンテンツに係る条件を示す情報である。コンテンツメタの欄の情報は、ユーザメタの欄の情報と同様に複数次元の数値にされている。条件の欄の情報は、ユーザの状態を示す情報である。そのうち、時間の情報は、レコメンドが1日中の何時に行われたかを示している。例えば、時間の欄の「23」は、23時にレコメンドが行われたことを示している。場所の情報は、レコメンドされた際にユーザがどこにいたかを示している。例えば、場所の欄の「0」は家、「1」は職場、「2」は移動中であったことを示している。
行動の欄の情報は、レコメンドに対するユーザの行動を示す情報である。クリックの欄の情報は、ユーザがレコメンドされたコンテンツを取得(視聴)するためにレコメンドから一定時間以内にクリックしたか否かを示している。例えば、クリックの欄の「1」は、クリックしたことを示しており、「0」は、クリックしなかったことを示している。視聴時間は、レコメンドされたコンテンツを視聴した時間(例えば、分単位での時間)である。クリックされていない行動データについては、視聴時間は0となる。
図2に示すフォーマットの行動データは、レコメンドの精度の評価に用いることができるものである。但し、学習用データ取得部11によって取得される実際の行動データの数は、レコメンドの精度の評価に十分である必要はない。学習用データ取得部11によって取得される実際の行動データは、後述する人工的な行動データの取得のために用いられる。学習用データ取得部11によって取得される実際の行動データの数は、後述する機械学習が適切に行える数とするのがよい。人工的な行動データも、図2に示す実際の行動データのフォーマットと同様のフォーマットのデータである。なお、行動データは、必ずしも図2に示すものである必要はなく、ユーザの行動に対する条件及び当該条件に応じたユーザの行動を示すデータであればよい。
学習用データ取得部11は、取得した実際の行動データをレコメンドエンジン評価システム10に記憶させる。記憶された実際の行動データは、後述する機能部によって用いられる。
モデル生成部12は、学習用データ取得部11によって取得された行動データに基づいて、相互の機械学習によって、真の行動データと偽の行動データとを識別する識別モデル、及び当該識別モデルによって真の行動データと識別されるような偽の行動データを生成する生成モデルを生成する機能部である。モデル生成部12は、GAN(Generative Adversarial Network、敵対的生成ネットワーク)によって相互の機械学習を行う。
モデル生成部12によって生成される生成モデルは、GANにおけるGeneratorである。図3に示すようにGeneratorは、入力値から、偽の行動データである偽データを出力する。入力値は、例えば、ランダムな値(ノイズ)である。図2に示すように偽データは、学習用データ取得部11によって取得される行動データと同じフォーマットのデータである。Generatorは、より正解データ(真の行動データ)らしい偽データを出力する。ここでいう正解データは、学習用データ取得部11によって取得される実際の行動データである。
モデル生成部12によって生成される識別モデルは、GANにおけるDiscriminatorである。Discriminatorは、行動データを入力して、当該行動データが正解データであるか、偽データであるかを示す情報を出力する。図4に示すように、例えば、Discriminatorは、入力した行動データが正解データである尤度(0〜1)(確率)を出力する。Discriminatorは、正解データを入力すると1に近い尤度、偽データを入力すると0に近い尤度を出力する。
GANによる機械学習では、以下のようにGeneratorとDiscriminatorとを敵対させ交互に学習させていくことで両方の精度を高める。モデル生成部12は、予めGenerator及びDiscriminatorそれぞれの初期モデルを記憶しておく。Generator及びDiscriminatorは、ニューラルネットワークにより構成されている。モデル生成部12は、相互の機械学習を行うことで、Generator及びDiscriminatorを構成するニューラルネットワークの重み付け係数であるパラメータを最適化(高精度化)する。なお、Generatorの初期モデル(未学習のGenerator)は、ほとんどの場合、正解データからかけ離れた偽データを出力するが、上述したように機械学習を行うことで、より正解データらしい偽データを出力可能になる。また、また、Discriminatorの初期モデル(未学習のDiscriminator)は、ほとんどの場合、正解データにも偽データにも曖昧な尤度を出力するが、上述したように機械学習を行うことで、正解データを入力すると1に近い尤度、偽データを入力すると0に近い尤度を出力可能になる。
モデル生成部12は、学習用データ取得部11によって取得された行動データに基づいて、従来のGANと同様にGenerator及びDiscriminatorの相互の機械学習を行って、学習済みのGenerator及びDiscriminatorを生成する。例えば、モデル生成部12は、以下のように学習済みのGenerator及びDiscriminatorを生成する。
モデル生成部12は、Discriminatorの学習及びGeneratorの学習を順番に行う。Discriminator及びGeneratorの一方を学習させる時、他方は固定し(即ち、パラメータを更新せず)評価のみに使用する。なお、Discriminatorの学習及びGeneratorの学習の順番は、上記の順番でなくてもよく逆であってもよい。
以下、Discriminatorの学習を説明する。モデル生成部12は、ランダムな値を発生させ、その値をGeneratorに入力して偽データを生成する。また、学習用データ取得部11によって取得されてレコメンドエンジン評価システム10に記憶されている正解データを読み出す。モデル生成部12は、偽データ及び正解データのそれぞれをDiscriminatorに入力して行動データの真偽の識別を行う。即ち、モデル生成部12は、偽データ及び正解データのそれぞれをDiscriminatorに入力して出力値である尤度の値を取得する。Discriminatorの学習で用いる偽データ及び正解データそれぞれは、複数あってもよい。
モデル生成部12は、Discriminatorによる識別結果を示す値、即ち、Discriminatorからの出力値である尤度の値からLossを算出する。偽データの場合、Discriminatorからの出力値は0になるべきであるので、Lossは0と出力値である尤度との差分となる。正解データの場合、Discriminatorからの出力値は1になるべきであるので、Lossは1と出力値である尤度との差分となる。モデル生成部12は、Lossに基づいてDiscriminatorのパラメータを更新する。パラメータの更新はLossを小さくするように行われる。パラメータの更新は、具体的には従来のGANと同様に行われる。
続いて、モデル生成部12は、Discriminatorの学習が収束したか判断する。例えば、一定回数連続して(例えば、5回)Lossにほとんど変化がない(変化が一定の閾値以下)場合に収束したと判断する。収束していないと判断したら、モデル生成部12は、パラメータ更新後のDiscriminatorによる上記の行動データの真偽の識別以降の処理を改めて行う。収束していると判断したら、モデル生成部12は、その時点でDiscriminatorの学習を終了する。また、上記にかえてあるいは加えて、パラメータ更新の回数の上限を予め決めておき、繰り返しの回数がその上限に達したら、Discriminatorの学習を終了してもよい。また、上記以外のDiscriminatorの学習の終了条件を用いてもよい。
続いて、Generatorの学習を説明する。モデル生成部12は、ランダムな値を発生させ、その値をGeneratorに入力して偽データを生成する。モデル生成部12は、偽データをDiscriminatorに入力して行動データの真偽の識別を行う。即ち、モデル生成部12は、偽データをDiscriminatorに入力して出力値である尤度の値を取得する。Generatorの学習で用いる偽データ(生成する偽データ)は、複数あってもよい。
モデル生成部12は、Discriminatorによる識別結果を示す値、即ち、Discriminatorからの出力値である尤度の値からLossを算出する。偽データの場合、Discriminatorからの出力値は0になるべきであるので、Lossは0と出力値である尤度との差分となる。モデル生成部12は、Lossに基づいてGeneratorのパラメータを更新する。パラメータの更新はLossを小さくするように行われる。パラメータの更新は、具体的には従来のGANと同様に行われる。
続いて、モデル生成部12は、Generatorの学習が収束したか判断する。例えば、一定回数連続して(例えば、5回)Lossにほとんど変化がない(変化が一定の閾値以下)場合に収束したと判断する。収束していないと判断したら、モデル生成部12は、パラメータ更新後のGeneratorによって偽データを生成し、それ以降の処理を改めて行う。収束していると判断したら、モデル生成部12は、その時点でGeneratorの学習を終了する。また、上記にかえてあるいは加えて、パラメータ更新の回数の上限を予め決めておき、繰り返しの回数がその上限に達したら、Generatorの学習を終了してもよい。また、上記以外のGeneratorの学習の終了条件を用いてもよい。
モデル生成部12は、Discriminator及びGeneratorそれぞれの学習を終了したら、学習全体の収束を判断する。学習全体の収束の判断は、具体的には従来のGANと同様に行われる。収束していないと判断したら、モデル生成部12は、改めて、Discriminator及びGeneratorの上述した学習を行って収束を判断する。収束していると判断したら、モデル生成部12は、その時点のGenerator及びDiscriminatorを、学習済みのGenerator及びDiscriminatorとする。
モデル生成部12は、生成したGenerator及びDiscriminatorをレコメンドエンジン評価システム10に記憶させる。記憶されたGenerator及びDiscriminatorは、後述する機能部によって用いられる。
なお、モデル生成部12によって生成されるGenerator及びDiscriminatorは、人工知能ソフトウェアの一部であるプログラムモジュールとしての利用が想定される。当該予測モデルは、CPU及びメモリを備えるコンピュータにて用いられる。具体的には、コンピュータのCPUが、メモリに記憶されたGenerator及びDiscriminatorからの指令に従って、ニューラルネットワークの入力層に情報を入力して、ニューラルネットワークにおける学習済の重み付け係数等に基づく演算を行って、ニューラルネットワークの出力層から結果を出力するように動作する。
識別用データ取得部13は、モデル生成部12によって生成された生成モデルとは独立して、識別対象の行動データを取得する機能部である。識別用データ取得部13によって取得される識別対象の行動データは、モデル生成部によって生成された生成モデルとは独立したものである。即ち、識別対象の行動データは、生成モデルによって生成されたものではない。識別対象の行動データは、レコメンドの精度の評価に用いる候補となるものである。モデル生成部12によって生成されたDiscriminatorは、人工的な行動データ、即ち、偽の行動データが尤もらしいか否かの判断(識別)を行うことが可能である。そこで、ユーザにコンテンツをレコメンドした際の複数のユーザの行動についての行動データに対して、Discriminatorが識別を行うことで、レコメンドの精度の評価に用いる行動データを決定することができる。例えば、同一のコンテンツに対してユーザが視聴(クリック)したことを示す行動データと、ユーザが視聴しなかったことを示す行動データとの両方に対して、Discriminatorが識別を行うことで、それらのうちの一方をレコメンドの精度の評価に用いる行動データを決定することができる。
識別用データ取得部13は、条件を示す情報を取得して、当該条件に対する複数の行動に係る識別対象の複数の行動データを生成する。具体的には、識別用データ取得部13は、以下のように識別対象の行動データを生成して取得する。識別用データ取得部13によって生成されて取得される行動データは、学習用データ取得部11によって取得される行動データと同じフォーマットのデータである。識別用データ取得部13は、条件を示す情報として、ユーザに係るもの及びコンテンツに係るもの取得する。具体的には、識別用データ取得部13は、コンテンツのレコメンド対象となるユーザに係る情報と、当該ユーザに対してレコメンドされるコンテンツとしてレコメンドエンジンによって決定されたコンテンツに係る情報とを取得する。識別用データ取得部13は、当該ユーザ及び当該コンテンツについての、図2に示す行動データのユーザメタ、コンテンツメタ及び条件の欄に相当する情報を取得する。識別用データ取得部13は、例えば、レコメンドエンジン評価システム10への当該情報の入力操作を受け付けて当該情報を取得する。
識別用データ取得部13は、取得した当該ユーザ及び当該コンテンツについての情報に、当該ユーザの複数の行動を示す情報(即ち、図2に示す行動データの行動の欄に相当する情報)を対応付けて、複数の行動データを生成する。複数の行動は、例えば、クリックした及びクリックしないである。また、クリックした場合の視聴時間は、例えば、コンテンツ毎に予め設定されていてもよい。クリックしない場合の視聴時間は0である。これによって1つのユーザ及びコンテンツの組み合わせについて、クリックした場合の行動データと、クリックしない場合の行動データとの2つの行動データが生成される。即ち、同一のユーザ及びコンテンツの条件で、ユーザがクリックするパターンと、クリックしないパターンとの偽データが生成される。生成される行動データの例を図5(Discriminatorの入力前の行動データ)に示す。図5に示すように、ユーザメタ、コンテンツメタ及び条件の欄の情報が同一であり、行動の欄の情報が異なる(クリックの欄がそれぞれ1と0とになっている)行動データが生成される。
上述したようにレコメンドの精度の評価には多数の行動データが必要となる。そこで識別用データ取得部13は、多数のユーザ及びコンテンツの組み合わせについて、行動データを生成して取得することとしてもよい。識別用データ取得部13は、取得した行動データを識別部14に出力する。
なお、上記の例では、1つのユーザ及びコンテンツについて2つの行動データが生成されているが、クリックされた場合に視聴時間が異なる複数の行動データが生成されてもよい。例えば、視聴時間が、コンテンツの最初までの行動データ、コンテンツの中ほどまでの行動データ、及びコンテンツの最後までの行動データが生成されてもよい。また、レコメンドエンジンによってレコメンドされるコンテンツに限らず、レコメンド候補となる(レコメンドされる可能性がある)ユーザとコンテンツとの全ての組み合わせについて、識別対象の行動データを生成して取得することとしてもよい。また、識別対象の行動データは、識別用データ取得部13による生成ではなく、外部からの入力等によって取得されてもよい。また、取得される識別対象の行動データに係るユーザ及びコンテンツは、上述したレコメンドエンジンのレコメンドに係るものでなくてもよく、任意のものであってもよい。
識別部14は、モデル生成部12によって生成された識別モデルを用いて、識別用データ取得部13によって取得された行動データの真偽を識別する機能部である。識別部14は、識別用データ取得部13から識別対象の行動データを入力する。また、識別部14は、モデル生成部12によって生成されてレコメンドエンジン評価システム10に記憶されている識別モデルであるDiscriminatorを読み出す。
識別部14は、識別対象の行動データのそれぞれをDiscriminatorに入力して行動データの真偽の識別を行う。即ち、図5に示すように、識別部14は、識別対象の行動データのそれぞれをDiscriminatorに入力して出力値である尤度の値を取得する。識別部14は、同一のユーザ及びコンテンツの条件に対して、最も高い尤度となる行動データをレコメンドの精度の評価に用いる行動データと決定する。識別部14は、複数のパターンの偽データ(識別対象の行動データ)に対して、どれが尤もらしいか識別(判別)することで欠損のない行動テーブルを生成することができる。
上記の決定によって、ユーザ及びコンテンツ毎にコンテンツに対するユーザの尤もらしい行動を決定することができる。図5にある条件下でコンテンツをレコメンドされた場合のユーザの行動である視聴時間のテーブルを示す。
識別部14は、レコメンドの精度の評価に用いる行動データと決定した行動データ(あるいは、当該行動データに応じた情報(例えば、上記の視聴時間のテーブル))を評価部15に出力する。
評価部15は、識別部14による識別に応じた行動データを用いて、レコメンドの評価を行う機能部である。評価部15は、識別部14から、レコメンドの精度の評価に用いる行動データと決定された行動データ(あるいは、当該行動データに応じた情報)を入力する。評価部15は、当該行動データを用いてレコメンドの精度の評価(レコメンドエンジンの評価)を行う。
例えば、評価部15は、当該行動データからCTRを算出する。CTRは、識別部14から入力された行動データのうちクリックされたことを示す行動データの数を、全行動データの数(レコメンドが行われた数、インプレッション数)で割ることで算出することができる。また、クリックされたが数秒で見るのを止めてしまったといった実質失敗と考えられるレコメンドを除外して厳密な評価を行うために一定時間以上視聴された行動データの数を、全行動データの数で割ることで有効クリック率を算出することとしてもよい。あるいは、レコメンドしたコンテンツの平均視聴時間を算出してもよい。
また、識別用データ取得部13によって生成されて取得される識別対象の行動データが、レコメンド対象となるユーザとコンテンツとの全ての組み合わせについてのものである場合、評価部15は、以下のようにレコメンドの評価を行うこととしてもよい。この場合、評価部15は、レコメンド対象となるユーザに対してレコメンドされるコンテンツとしてレコメンドエンジンによって決定されたコンテンツに係る情報を取得する。評価部15は、識別部14から入力した行動データの応じた情報(例えば、上述した視聴時間のテーブル)を照会して、レコメンドエンジンによってレコメンドされるコンテンツがユーザに視聴されているか(レコメンドされるコンテンツがどれくらい当たっているか)を計測する。
なお、レコメンドの評価には、識別部14によって識別された行動データ、即ち、人工的に生成された行動データだけではなく、学習用データ取得部11によって取得された実際の行動データも用いられてもよい。また、レコメンドの精度の評価は、識別部14から入力された情報が用いられるものであれば、どのような方法で行われてもよい。
評価部15は、上記のように算出したレコメンドの精度の評価を示す情報を出力する。例えば、評価部15は、レコメンドエンジン評価システム10が備える表示装置にレコメンドの精度の評価を示す情報を表示して、レコメンドエンジン評価システム10の管理者等によって参照できるようにしてもよい。あるいは、評価部15は、レコメンドエンジン評価システム10以外の装置に当該情報を送信することとしてもよい。また、それ以外の出力が行われてもよい。以上が、本実施形態に係るレコメンドエンジン評価システム10の機能である。
引き続いて、図6〜図9のフローチャートを用いて、本実施形態に係るレコメンドエンジン評価システム10で実行される処理(レコメンドエンジン評価システム10が行う動作方法)を説明する。図6に示すように、本処理では、まず、学習用データ取得部11によって、レコメンドログに基づく実際の行動データが取得される(S01)。続いて、モデル生成部12によって、Generator及びDiscriminatorが生成される(S02)。Generator及びDiscriminatorの生成は、GANによって行われる。
Generator及びDiscriminatorの生成(S02)について、図7〜図9のフローチャートを用いて詳細に説明する。図7にGenerator及びDiscriminatorの生成全体(機械学習全体)の処理に係るフローチャートを示す。図8にDiscriminatorの学習の処理に係るフローチャートを示す。図9にGeneratorの学習の処理に係るフローチャートを示す。
図7に示すようにGenerator及びDiscriminatorの生成では、Discriminatorの学習が行われる(S21)。続いて、Generatorの学習が行われる(S22)。続いて、学習全体の収束が判断される(S23)。収束していないと判断されたら(S23のNO)、再度、S21〜S23の処理が行われる。収束していると判断されたら(S23のYES)、その時点のGenerator及びDiscriminatorが、学習済みのGenerator及びDiscriminatorとされて、Generator及びDiscriminatorの生成の処理が終了する。
図8に示すようにDiscriminatorの学習では、まず、Generatorによって偽データが生成される(S211)。また、学習用データ取得部11によって取得されてレコメンドエンジン評価システム10に記憶されている正解データが読み出される(S212)。続いて、Discriminatorによって偽データ及び正解データのそれぞれの真偽が識別される(S213)。続いて、それぞれの識別結果に応じたLossが算出される(S214)。続いて、Lossに基づいてDiscriminatorのパラメータが更新される(S215)。続いて、Discriminatorの学習の収束が判断される(S216)。収束していないと判断されたら(S216のNO)、再度、S213〜S216の処理が行われる。収束していると判断されたら(S216のYES)、Discriminatorの学習の処理が終了する。
図9に示すようにGeneratorの学習では、まず、Generatorによって偽データが生成される(S221)。続いて、Discriminatorによって偽データの真偽が識別される(S222)。続いて、識別結果に応じたLossが算出される(S223)。続いて、Lossに基づいてGeneratorのパラメータが更新される(S224)。続いて、Generatorの学習の収束が判断される(S225)。収束していないと判断されたら(S225のNO)、再度、S221〜S225の処理が行われる。収束していると判断されたら(S225のYES)、Generatorの学習の処理が終了する。
Generator及びDiscriminatorの生成(S02)が終了したら続いて、図6に示すように、識別用データ取得部13によって、識別対象の行動データが取得される(S03)。識別対象の行動データは、レコメンドの精度の評価に用いる候補となるものであり、所定の条件に対する複数の行動に係る複数の行動データである。続いて、識別部14によって、識別対象の行動データのそれぞれの真偽の識別が行われる(S04)。当該識別は、Discriminatorが用いて行われる。続いて、当該識別に応じた行動データが用いられて、評価部15によってレコメンドの精度の評価が行われる(S05)。以上が、本実施形態に係るレコメンドエンジン評価システム10で実行される処理である。
本実施形態では、実際のユーザの行動に係る少数の行動データ、即ち、少数の真の行動データが取得できれば、それに基づいて識別モデルが生成される。また、当該識別モデルが用いられて識別対象の行動データの真偽が識別されることによって、当該識別対象の行動データから多数の妥当性の高い行動データが取得される。このように、本実施形態によれば、ユーザに実際のレコメンドを行わずに、検証環境においてレコメンドの精度の評価に用いることができる行動データを取得することができる。従って、本実施形態によれば、レコメンドの精度の評価を行うための多数の行動データを容易に取得することができる。
多数の行動データを容易に取得できることで、レコメンドの精度の評価も容易に行うことができる。その結果、従来では不可能であった、レコメンドエンジンの設計、効果検証(評価)及びレコメンドエンジンのチューニングを検証環境で行うことができるようになる。その結果を従来と比べてレコメンドエンジンのチューニングを短い時間で行うことができる。
また、ユーザに対して多数のレコメンドを行わずに行動データを生成することができるため、当該レコメンドのためのネットワークの負荷及び装置の処理負荷を低減することができる。
また、本実施形態のようにレコメンドの評価を行うこととしてもよい。この構成によれば、レコメンドの評価まで確実に行うことができる。但し、本発明に係る行動データ識別システムは、レコメンドの評価まで行う必要はなく、識別対象の行動データの真偽の識別を行うものであればよい。
また、本実施形態のように、識別対象の行動データの取得において、条件に対する複数の行動に係る識別対象の複数の行動データを生成することとしてもよい。この構成によれば、条件に応じた妥当性の高いユーザの行動を示す行動データを確実に取得することができる。例えば、上述したようにレコメンドされたコンテンツに対してユーザがクリックするか否かを示す妥当性の高いユーザの行動を示す行動データを確実に取得することができる。
また、本実施形態のように、識別モデル(上述したDiscriminatorに相当)及び生成モデル(上述したGenerator)は、GANによる相互の機械学習によって生成されることとしてもよい。この構成によれば、実際の行動データから、確実かつ適切に識別モデルを生成することができ、確実かつ適切に本発明を実施することができる。但し、必ずしもGANによる相互の機械学習によって識別モデル及び生成モデルが生成される必要はなく、それ以外の方法の相互の機械学習によって識別モデル及び生成モデルが生成されてもよい。
なお、本実施形態では、行動データは、レコメンドの精度の評価を行うためのものであったが、それ以外の目的に用いられるものであってもよい。また、本実施形態では、行動データは、コンテンツのレコメンドに対するユーザの行動に係るものであるとしたが、これに限られず、条件に応じたユーザの行動に係るものであればどのようなものでもよい。
昨今、GANの研究は活発であるが、ほとんどの研究の目的は学習されたGeneratorを用いて尤もらしい画像を生成することである。また、目標設定から学会発表は数多くあるが、実際のビジネスに適用された例はほぼない。
本発明者は、GANは画像に特化したものではなく普遍的であり、人らしい行動に係る行動データすら生成可能であるという点に気付き、その気付きに基づいて発明した。ビジネスにおいて人の行動、特にこちらのアクションに対するレスポンスを事前予測できることの利益は大きく、本発明はあらゆるビジネスに取り入れられ、ビジネスの在り方を変え得る画期的なものである。
また、GANの研究では、ほとんどの場合Generatorを用いて目的を達成しようとするが、本実施形態では、Discriminatorを用いて目的を達成する点も非常に画期的である。GANは、尤もらしいデータを生成できることが特徴的であり、それを行うGeneratorが注目されがちであるが、Generatorによって生成されるデータはコントロールできない。そのため、あるユーザがある条件下で取り得る尤もらしい行動といったある程度条件を指定したデータの生成は不可能である。本実施形態では、一定条件下でのあり得るデータを定義した上で、非常に高度な分別機であるDiscriminatorに尤もらしい行動を選ばせることで条件指定でのデータ生成を可能とした。この発想によりGANはコントロール可能な尤もらしいデータ生成機として活用可能となり、GANの可能性を大きく広げた。
なお、上記実施の形態の説明に用いたブロック図は、機能単位のブロックを示している。これらの機能ブロック(構成部)は、ハードウェア及び/又はソフトウェアの任意の組み合わせによって実現される。また、各機能ブロックの実現手段は特に限定されない。すなわち、各機能ブロックは、物理的及び/又は論理的に結合した1つの装置により実現されてもよいし、物理的及び/又は論理的に分離した2つ以上の装置を直接的及び/又は間接的に(例えば、有線及び/又は無線)で接続し、これら複数の装置により実現されてもよい。
例えば、本発明の一実施の形態におけるレコメンドエンジン評価システム10は、本実施形態のレコメンドエンジン評価システム10の処理を行うコンピュータとして機能してもよい。図10は、本実施形態に係るレコメンドエンジン評価システム10のハードウェア構成の一例を示す図である。上述のレコメンドエンジン評価システム10は、物理的には、プロセッサ1001、メモリ1002、ストレージ1003、通信装置1004、入力装置1005、出力装置1006、バス1007などを含むコンピュータ装置として構成されてもよい。
なお、以下の説明では、「装置」という文言は、回路、デバイス、ユニットなどに読み替えることができる。レコメンドエンジン評価システム10のハードウェア構成は、図に示した各装置を1つ又は複数含むように構成されてもよいし、一部の装置を含まずに構成されてもよい。
レコメンドエンジン評価システム10における各機能は、プロセッサ1001、メモリ1002などのハードウェア上に所定のソフトウェア(プログラム)を読み込ませることで、プロセッサ1001が演算を行い、通信装置1004による通信や、メモリ1002及びストレージ1003におけるデータの読み出し及び/又は書き込みを制御することで実現される。
プロセッサ1001は、例えば、オペレーティングシステムを動作させてコンピュータ全体を制御する。プロセッサ1001は、周辺装置とのインターフェース、制御装置、演算装置、レジスタなどを含む中央処理装置(CPU:Central Processing Unit)で構成されてもよい。例えば、レコメンドエンジン評価システム10の各機能は、プロセッサ1001で実現されてもよい。
また、プロセッサ1001は、プログラム(プログラムコード)、ソフトウェアモジュールやデータを、ストレージ1003及び/又は通信装置1004からメモリ1002に読み出し、これらに従って各種の処理を実行する。プログラムとしては、上述の実施の形態で説明した動作の少なくとも一部をコンピュータに実行させるプログラムが用いられる。例えば、レコメンドエンジン評価システム10の各機能は、メモリ1002に格納され、プロセッサ1001で動作する制御プログラムによって実現されてもよい。上述の各種処理は、1つのプロセッサ1001で実行される旨を説明してきたが、2以上のプロセッサ1001により同時又は逐次に実行されてもよい。プロセッサ1001は、1以上のチップで実装されてもよい。なお、プログラムは、電気通信回線を介してネットワークから送信されても良い。
メモリ1002は、コンピュータ読み取り可能な記録媒体であり、例えば、ROM(Read Only Memory)、EPROM(Erasable Programmable ROM)、EEPROM(Electrically Erasable Programmable ROM)、RAM(Random Access Memory)などの少なくとも1つで構成されてもよい。メモリ1002は、レジスタ、キャッシュ、メインメモリ(主記憶装置)などと呼ばれてもよい。メモリ1002は、本発明の一実施の形態に係る方法を実施するために実行可能なプログラム(プログラムコード)、ソフトウェアモジュールなどを保存することができる。
ストレージ1003は、コンピュータ読み取り可能な記録媒体であり、例えば、CD−ROM(Compact Disc ROM)などの光ディスク、ハードディスクドライブ、フレキシブルディスク、光磁気ディスク(例えば、コンパクトディスク、デジタル多用途ディスク、Blu−ray(登録商標)ディスク)、スマートカード、フラッシュメモリ(例えば、カード、スティック、キードライブ)、フロッピー(登録商標)ディスク、磁気ストリップなどの少なくとも1つで構成されてもよい。ストレージ1003は、補助記憶装置と呼ばれてもよい。上述の記憶媒体は、例えば、メモリ1002及び/又はストレージ1003を含むデータベース、サーバその他の適切な媒体であってもよい。
通信装置1004は、有線及び/又は無線ネットワークを介してコンピュータ間の通信を行うためのハードウェア(送受信デバイス)であり、例えばネットワークデバイス、ネットワークコントローラ、ネットワークカード、通信モジュールなどともいう。例えば、上述のレコメンドエンジン評価システム10の各機能は、通信装置1004で実現されてもよい。
入力装置1005は、外部からの入力を受け付ける入力デバイス(例えば、キーボード、マウス、マイクロフォン、スイッチ、ボタン、センサなど)である。出力装置1006は、外部への出力を実施する出力デバイス(例えば、ディスプレイ、スピーカー、LEDランプなど)である。なお、入力装置1005及び出力装置1006は、一体となった構成(例えば、タッチパネル)であってもよい。
また、プロセッサ1001やメモリ1002などの各装置は、情報を通信するためのバス1007で接続される。バス1007は、単一のバスで構成されてもよいし、装置間で異なるバスで構成されてもよい。
また、レコメンドエンジン評価システム10は、マイクロプロセッサ、デジタル信号プロセッサ(DSP:Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)、PLD(Programmable Logic Device)、FPGA(Field Programmable Gate Array)などのハードウェアを含んで構成されてもよく、当該ハードウェアにより、各機能ブロックの一部又は全てが実現されてもよい。例えば、プロセッサ1001は、これらのハードウェアの少なくとも1つで実装されてもよい。
以上、本実施形態について詳細に説明したが、当業者にとっては、本実施形態が本明細書中に説明した実施形態に限定されるものではないということは明らかである。本実施形態は、特許請求の範囲の記載により定まる本発明の趣旨及び範囲を逸脱することなく修正及び変更態様として実施することができる。したがって、本明細書の記載は、例示説明を目的とするものであり、本実施形態に対して何ら制限的な意味を有するものではない。
情報の通知は、本明細書で説明した態様/実施形態に限られず、他の方法で行われてもよい。例えば、情報の通知は、物理レイヤシグナリング(例えば、DCI(Downlink Control Information)、UCI(Uplink Control Information))、上位レイヤシグナリング(例えば、RRC(Radio Resource Control)シグナリング、MAC(Medium Access Control)シグナリング、報知情報(MIB(Master Information Block)、SIB(System Information Block)))、その他の信号又はこれらの組み合わせによって実施されてもよい。また、RRCシグナリングは、RRCメッセージと呼ばれてもよく、例えば、RRC接続セットアップ(RRC Connection Setup)メッセージ、RRC接続再構成(RRC ConnectionReconfiguration)メッセージなどであってもよい。
本明細書で説明した各態様/実施形態の処理手順、シーケンス、フローチャートなどは、矛盾の無い限り、順序を入れ替えてもよい。例えば、本明細書で説明した方法については、例示的な順序で様々なステップの要素を提示しており、提示した特定の順序に限定されない。
入出力された情報等は特定の場所(例えば、メモリ)に保存されてもよいし、管理テーブルで管理してもよい。入出力される情報等は、上書き、更新、または追記され得る。出力された情報等は削除されてもよい。入力された情報等は他の装置へ送信されてもよい。
判定は、1ビットで表される値(0か1か)によって行われてもよいし、真偽値(Boolean:trueまたはfalse)によって行われてもよいし、数値の比較(例えば、所定の値との比較)によって行われてもよい。
本明細書で説明した各態様/実施形態は単独で用いてもよいし、組み合わせて用いてもよいし、実行に伴って切り替えて用いてもよい。また、所定の情報の通知(例えば、「Xであること」の通知)は、明示的に行うものに限られず、暗黙的(例えば、当該所定の情報の通知を行わない)ことによって行われてもよい。
ソフトウェアは、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、ハードウェア記述言語と呼ばれるか、他の名称で呼ばれるかを問わず、命令、命令セット、コード、コードセグメント、プログラムコード、プログラム、サブプログラム、ソフトウェアモジュール、アプリケーション、ソフトウェアアプリケーション、ソフトウェアパッケージ、ルーチン、サブルーチン、オブジェクト、実行可能ファイル、実行スレッド、手順、機能などを意味するよう広く解釈されるべきである。
また、ソフトウェア、命令などは、伝送媒体を介して送受信されてもよい。例えば、ソフトウェアが、同軸ケーブル、光ファイバケーブル、ツイストペア及びデジタル加入者回線(DSL)などの有線技術及び/又は赤外線、無線及びマイクロ波などの無線技術を使用してウェブサイト、サーバ、又は他のリモートソースから送信される場合、これらの有線技術及び/又は無線技術は、伝送媒体の定義内に含まれる。
本明細書で説明した情報、信号などは、様々な異なる技術のいずれかを使用して表されてもよい。例えば、上記の説明全体に渡って言及され得るデータ、命令、コマンド、情報、信号、ビット、シンボル、チップなどは、電圧、電流、電磁波、磁界若しくは磁性粒子、光場若しくは光子、又はこれらの任意の組み合わせによって表されてもよい。
なお、本明細書で説明した用語及び/又は本明細書の理解に必要な用語については、同一の又は類似する意味を有する用語と置き換えてもよい。例えば、チャネル及び/又はシンボルは信号(シグナル)であってもよい。また、信号はメッセージであってもよい。また、コンポーネントキャリア(CC)は、キャリア周波数、セルなどと呼ばれてもよい。
本明細書で使用する「システム」および「ネットワーク」という用語は、互換的に使用される。
また、本明細書で説明した情報、パラメータなどは、絶対値で表されてもよいし、所定の値からの相対値で表されてもよいし、対応する別の情報で表されてもよい。例えば、無線リソースはインデックスで指示されるものであってもよい。
上述したパラメータに使用する名称はいかなる点においても限定的なものではない。さらに、これらのパラメータを使用する数式等は、本明細書で明示的に開示したものと異なる場合もある。様々なチャネル(例えば、PUCCH、PDCCHなど)及び情報要素(例えば、TPCなど)は、あらゆる好適な名称によって識別できるので、これらの様々なチャネル及び情報要素に割り当てている様々な名称は、いかなる点においても限定的なものではない。
本明細書で使用する「判断(determining)」、「決定(determining)」という用語は、多種多様な動作を包含する場合がある。「判断」、「決定」は、例えば、判定(judging)、計算(calculating)、算出(computing)、処理(processing)、導出(deriving)、調査(investigating)、探索(looking up)(例えば、テーブル、データベースまたは別のデータ構造での探索)、確認(ascertaining)した事を「判断」「決定」したとみなす事などを含み得る。また、「判断」、「決定」は、受信(receiving)(例えば、情報を受信すること)、送信(transmitting)(例えば、情報を送信すること)、入力(input)、出力(output)、アクセス(accessing)(例えば、メモリ中のデータにアクセスすること)した事を「判断」「決定」したとみなす事などを含み得る。また、「判断」、「決定」は、解決(resolving)、選択(selecting)、選定(choosing)、確立(establishing)、比較(comparing)などした事を「判断」「決定」したとみなす事を含み得る。つまり、「判断」「決定」は、何らかの動作を「判断」「決定」したとみなす事を含み得る。
「接続された(connected)」、「結合された(coupled)」という用語、又はこれらのあらゆる変形は、2又はそれ以上の要素間の直接的又は間接的なあらゆる接続又は結合を意味し、互いに「接続」又は「結合」された2つの要素間に1又はそれ以上の中間要素が存在することを含むことができる。要素間の結合又は接続は、物理的なものであっても、論理的なものであっても、或いはこれらの組み合わせであってもよい。本明細書で使用する場合、2つの要素は、1又はそれ以上の電線、ケーブル及び/又はプリント電気接続を使用することにより、並びにいくつかの非限定的かつ非包括的な例として、無線周波数領域、マイクロ波領域及び光(可視及び不可視の両方)領域の波長を有する電磁エネルギーなどの電磁エネルギーを使用することにより、互いに「接続」又は「結合」されると考えることができる。
本明細書で使用する「に基づいて」という記載は、別段に明記されていない限り、「のみに基づいて」を意味しない。言い換えれば、「に基づいて」という記載は、「のみに基づいて」と「に少なくとも基づいて」の両方を意味する。
本明細書で「第1の」、「第2の」などの呼称を使用した場合においては、その要素へのいかなる参照も、それらの要素の量または順序を全般的に限定するものではない。これらの呼称は、2つ以上の要素間を区別する便利な方法として本明細書で使用され得る。したがって、第1および第2の要素への参照は、2つの要素のみがそこで採用され得ること、または何らかの形で第1の要素が第2の要素に先行しなければならないことを意味しない。
「含む(include)」、「含んでいる(including)」、およびそれらの変形が、本明細書あるいは特許請求の範囲で使用されている限り、これら用語は、用語「備える(comprising)」と同様に、包括的であることが意図される。さらに、本明細書あるいは特許請求の範囲において使用されている用語「または(or)」は、排他的論理和ではないことが意図される。
本明細書において、文脈または技術的に明らかに1つのみしか存在しない装置である場合以外は、複数の装置をも含むものとする。本開示の全体において、文脈から明らかに単数を示したものではなければ、複数のものを含むものとする。
10…レコメンドエンジン評価システム、11…学習用データ取得部、12…モデル生成部、13…識別用データ取得部、14…識別部、15…評価部、1001…プロセッサ、1002…メモリ、1003…ストレージ、1004…通信装置、1005…入力装置、1006…出力装置、1007…バス。

Claims (5)

  1. ユーザの行動に対する条件及び当該条件に応じたユーザの行動を示す行動データを取得する学習用データ取得部と、
    前記学習用データ取得部によって取得された行動データに基づいて、相互の機械学習によって、真の行動データと偽の行動データとを識別する識別モデル、及び当該識別モデルによって真の行動データと識別されるような偽の行動データを生成する生成モデルを生成するモデル生成部と、
    前記モデル生成部によって生成された生成モデルとは独立して、識別対象の行動データを取得する識別用データ取得部と、
    前記モデル生成部によって生成された識別モデルを用いて、前記識別用データ取得部によって取得された行動データの真偽を識別する識別部と、
    を備える行動データ識別システム。
  2. 前記条件は、ユーザにレコメンドされるコンテンツを含み、ユーザの行動は、当該レコメンドに対するユーザの行動である請求項1に記載の行動データ識別システム。
  3. 前記識別部による識別に応じた行動データを用いて、前記レコメンドの評価を行う評価部を更に備える請求項2に記載の行動データ識別システム。
  4. 前記識別用データ取得部は、条件を示す情報を取得して、当該条件に対する複数の行動に係る識別対象の複数の行動データを生成する請求項1〜3の何れか一項に記載の行動データ識別システム。
  5. 前記モデル生成部は、GAN(Generative Adversarial Network)によって相互の機械学習を行う請求項1〜4の何れか一項に記載の行動データ識別システム。
JP2018152855A 2018-08-15 2018-08-15 行動データ識別システム Pending JP2020027517A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018152855A JP2020027517A (ja) 2018-08-15 2018-08-15 行動データ識別システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018152855A JP2020027517A (ja) 2018-08-15 2018-08-15 行動データ識別システム

Publications (1)

Publication Number Publication Date
JP2020027517A true JP2020027517A (ja) 2020-02-20

Family

ID=69620178

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018152855A Pending JP2020027517A (ja) 2018-08-15 2018-08-15 行動データ識別システム

Country Status (1)

Country Link
JP (1) JP2020027517A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111859114A (zh) * 2020-06-18 2020-10-30 北京百度网讯科技有限公司 推荐系统的优化方法、装置、设备和计算机存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111859114A (zh) * 2020-06-18 2020-10-30 北京百度网讯科技有限公司 推荐系统的优化方法、装置、设备和计算机存储介质
JP2022000755A (ja) * 2020-06-18 2022-01-04 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド 推薦システムの最適化方法、装置、デバイス及びコンピュータ記憶媒体
JP7224395B2 (ja) 2020-06-18 2023-02-17 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド 推薦システムの最適化方法、装置、デバイス及びコンピュータ記憶媒体
US11836222B2 (en) 2020-06-18 2023-12-05 Beijing Baidu Netcom Science And Technology Co., Ltd. Method and apparatus for optimizing recommendation system, device and computer storage medium

Similar Documents

Publication Publication Date Title
KR102480204B1 (ko) 침입 탐지를 위한 지속적인 학습
US10846052B2 (en) Community discovery method, device, server and computer storage medium
US10938927B2 (en) Machine learning techniques for processing tag-based representations of sequential interaction events
US20170250930A1 (en) Interactive content recommendation personalization assistant
Tama et al. Tree-based classifier ensembles for early detection method of diabetes: an exploratory study
CN108520470B (zh) 用于生成用户属性信息的方法和装置
US20220294797A1 (en) Website verification platform
US10949000B2 (en) Sticker recommendation method and apparatus
US20160132904A1 (en) Influence score of a brand
CN108108743B (zh) 异常用户识别方法和用于识别异常用户的装置
CN112534424A (zh) 在线系统中基于神经网络的内容分发
US10474926B1 (en) Generating artificial intelligence image processing services
US11494559B2 (en) Hybrid in-domain and out-of-domain document processing for non-vocabulary tokens of electronic documents
CN111708876A (zh) 生成信息的方法和装置
US11586838B2 (en) End-to-end fuzzy entity matching
US20210158210A1 (en) Hybrid in-domain and out-of-domain document processing for non-vocabulary tokens of electronic documents
CN113222073B (zh) 训练广告推荐模型的方法及装置
JP2020027517A (ja) 行動データ識別システム
US11836591B1 (en) Scalable systems and methods for curating user experience test results
CN116862580A (zh) 短信触达时间预测方法、装置、计算机设备及存储介质
WO2019167684A1 (ja) 在宅予測装置
CN113935251B (zh) 用户行为预测模型的生成方法、用户行为预测方法及装置
US20220067572A1 (en) Action determination using recommendations based on prediction of sensor-based systems
WO2022070278A1 (ja) 異常判定システム、異常判定方法及びプログラム
JP6745402B2 (ja) 質問推定装置