JP7231585B2 - 評価装置、評価方法及び評価プログラム - Google Patents

評価装置、評価方法及び評価プログラム Download PDF

Info

Publication number
JP7231585B2
JP7231585B2 JP2020112101A JP2020112101A JP7231585B2 JP 7231585 B2 JP7231585 B2 JP 7231585B2 JP 2020112101 A JP2020112101 A JP 2020112101A JP 2020112101 A JP2020112101 A JP 2020112101A JP 7231585 B2 JP7231585 B2 JP 7231585B2
Authority
JP
Japan
Prior art keywords
feature
information
probability
target
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020112101A
Other languages
English (en)
Other versions
JP2022011154A (ja
Inventor
佑一 中曽
大地 秋本
崇司 牧野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yahoo Japan Corp
Original Assignee
Yahoo Japan Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Japan Corp filed Critical Yahoo Japan Corp
Priority to JP2020112101A priority Critical patent/JP7231585B2/ja
Publication of JP2022011154A publication Critical patent/JP2022011154A/ja
Application granted granted Critical
Publication of JP7231585B2 publication Critical patent/JP7231585B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Description

特許法第30条第2項適用 令和2年2月25日ヤフー株式会社内において日本航空株式会社と行われた商談で公開
本開示は、評価装置、評価方法及び評価プログラムに関する。
情報を分析する技術が、科学、産業、ビジネスといった幅広い分野において発展している。情報の利用が進むにつれ、新たな分析技術が開発され、多様な目的に活用されている。
分析対象のデータは、例えば、モノやコトのインターネット(Internet of things、IoT)から発生し、発生したデータは、予測分析に使用される。予測分析は、分析の対象の特徴を表すデータから、分析対象の性質を予測するものである。予測分析の一例は、機械学習モデルを使用した予測である。近年、様々な技術が、モデルを使用した予測の精度を向上させるために提案されている。例えば、モデルの出力を、他のモデルの入力として使用することが提案されている(特許文献1)。
特開2019-36173号公報
しかしながら、上記の従来技術では、有用な情報が対象の特徴から引き出されない場合がある。例えば、予測分析のターゲット自体が適切でない場合に、有益な情報が、予測結果から得られない場合がある。
本願は、上記に鑑みてなされたものであって、対象の特徴から有用な情報を引き出すことを目的とする。
本開示の実施形態に係る評価装置は、第1の特徴を有する対象が、第2の特徴を有することを仮定した第1の特徴情報と、当該対象が、当該第2の特徴を有さないことを仮定した第2の特徴情報とを作成する作成部と、前記作成部によって作成された第1の特徴情報に基づいて予測された、前記対象が前記第2の特徴を有する場合に前記対象に関連する所定の事象が発生する第1の可能性と、前記作成部によって作成された第2の特徴情報に基づいて予測された、前記対象が前記第2の特徴を有さない場合に前記対象に関連する当該所定の事象が発生する第2の可能性との比較から、前記対象に関連する当該所定の事象が発生する可能性に対して、前記第2の特徴が与える影響を評価する評価部とを備える。
実施形態の一態様によれば、対象の特徴から有用な情報を引き出すことができる。
図1は、典型的な広告配信と好ましい広告配信との比較の一例を示す説明図である。 図2Aは、本開示の例示的な実施形態に係る、予測確率から予測リフトを抽出する予測リフト抽出処理の一例を示す説明図である。 図2Bは、本開示の例示的な実施形態に係る、予測確率から予測リフトを抽出する予測リフト抽出処理の一例を示す説明図である。 図2Cは、本開示の例示的な実施形態に係る、予測確率から予測リフトを抽出する予測リフト抽出処理の一例を示す説明図である。 図3は、実施形態に係る情報配信システムの一例を示す図である。 図4は、実施形態に係る情報配信装置によって実行される、予測コンバージョン確率のリフト値に基づいて広告を配信するための処理の一例を示すフローチャートである。 図5は、ハードウェア構成の一例を示す図である。
以下、本開示の実施形態について、図面を参照しつつ詳細に説明する。なお、この実施形態により本発明が限定されるものではない。1つまたは複数の実施形態の詳細は、以下の説明および図面に記載される。また、複数の実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。また、以下の1つまたは複数の実施形態において同一の部位には同一の符号を付し、重複する説明は省略する。
〔1.例示的な実施形態〕
まず、図1および図2A~図2Cを参照して、本開示の例示的な実施形態について詳細に説明する。
〔1-1.例示的な実施形態の概要〕
例示的な実施形態に係る情報配信装置は、ユーザが広告に接触した場合のコンバージョン確率と、このユーザが広告に接触しなかった場合のコンバージョン確率とを予測する。
そして、情報配信装置は、予測された2つのコンバージョン確率を比較し、この比較に基づいて、広告接触の有無によるコンバージョン確率の上昇幅として、コンバージョン確率のリフト値を予測する。情報配信装置は、各ユーザのリフト値の予測に基づいて、ユーザの中から、広告配信のターゲットを決定する。
これにより、情報配信装置は、高いコンバージョン確率を有するわけではないが、広告接触で高いコンバージョン確率の上昇を示すユーザに対して、広告を配信することができる。それに加え、情報配信装置は、広告が、もともと高いコンバージョン確率を有しており、広告接触で高いコンバージョン確率の上昇を示さないユーザといった、広告接触とは関係なくコンバージョンするユーザに配信されるのを防止することができる。
このため、情報配信装置は、全ユーザに占めるコンバージョンするユーザの割合を増加させることができる。
〔1-2.例示的な実施形態の序論〕
広告配信のターゲットは、広告配信戦略に基づいて決定される。典型的な広告配信の一例は、広告がコンバージョンしそうなユーザに対して配信される予測コンバージョン率に基づく広告配信である。
「コンバージョン(conversion、CV)する」という用語は、「コンバージョンイベントを発生させること」、「コンバージョンアクションを実行すること」、等のユーザアクションを示すことがある。例えば、コンバージョンアクションの実行は、「広告を閲覧し、その後、所定のコンテンツにおいて、広告の商品を購入すること」や、「広告をクリックし、リンク先にあるコンテンツにおいて、広告の商品を購入すること」を包含する。
図1は、典型的な広告配信と好ましい広告配信との比較の一例を示す説明図である。図1の例では、広告配信のターゲットの候補は、ユーザU1、ユーザU2、ユーザU3、ユーザU4およびユーザU5等のユーザを含む。ユーザU1およびユーザU2は、高い予測コンバージョン率を有するユーザである。一方、ユーザU4およびユーザU5は、高い予測コンバージョン率を有さないユーザである。
典型的な広告配信TAD1は、予測コンバージョン率に基づく広告配信である。図1に示されるように、典型的な広告配信TAD1では、広告は、高い予測コンバージョン率を有するユーザU1およびユーザU2に配信される。図1に示されるように、典型的な広告配信TAD1では、広告が、コンバージョンしそうなユーザに当たる。
しかしながら、一般的に、広告配信のターゲットの候補は、広告に接触しなくてもコンバージョンするユーザを含む。広告に接触しなくてもコンバージョンするユーザは、コンバージョンしそうなユーザの中にも含まれる。図1の例では、ユーザU1が、広告に接触しなくてもコンバージョンするユーザであると仮定する。典型的な広告配信TAD1では、広告に接触しなくてもコンバージョンするユーザU1が、広告配信のターゲットに含まれてしまっている。
また、一般的に、広告配信のターゲットの候補は、広告がユーザに当たった場合に高い確率でコンバージョンするようになるユーザを含む。このようなユーザは、もともとコンバージョンしそうでないユーザの中に含まれる。図1の例では、ユーザU4およびユーザU5が、広告がユーザに当たった場合に高い確率でコンバージョンするようになるユーザであると仮定する。典型的な広告配信TAD1では、広告がユーザに当たった場合に高い確率でコンバージョンするようになるユーザU4およびユーザU5が、広告配信のターゲットに含まれていない。しかしながら、広告がユーザU4およびユーザU5に当たった場合に、ユーザU4およびユーザU5のコンバージョンは、非常に獲得しやすくなる。
上述のように、典型的な広告配信TAD1の第1の問題点は、広告が、広告に接触しなくてもコンバージョンするユーザU1に対して配信されていることである。また、典型的な広告配信TAD1の第2の問題点は、広告が、広告がユーザに当たった場合に高い確率でコンバージョンするようになるユーザU4やユーザU5に対して、配信されないことである。言い換えると、典型的な広告配信TAD1では、広告に接触しなくてもコンバージョンするユーザが、広告配信のターゲットにされ、またさらに、広告への接触によりコンバージョンするユーザが、見逃されている。
理想的な広告配信の一例として、好ましい広告配信PAD1は、広告への接触によりコンバージョンするユーザに対して、広告を配信するものである。図1に示されるように、好ましい広告配信PAD1では、広告は、広告に接触しなくてもコンバージョンするユーザU1に対して配信されない。一方、広告は、広告がユーザに当たった場合に高い確率でコンバージョンするようになるユーザU4およびユーザU5に対して配信される。このように、好ましい広告配信PAD1は、広告に接触しなくてもコンバージョンするユーザを放っておき、広告の接触でコンバージョン率の高い上昇を示すユーザを狙うものである。
そこで、例示的な実施形態に係る情報配信装置は、広告が、好ましい広告配信PAD1の場合のようにユーザに配信されるように、以下に説明される予測リフト抽出処理を実行する。
〔1-3.予測リフト抽出処理〕
以下では、図2A~図2Cを参照して、例示的な実施形態に係る予測リフト抽出処理について説明する。
図2A~図2Cは、本開示の例示的な実施形態に係る、予測確率から予測リフトを抽出する予測リフト抽出処理の一例を示す説明図である。例示的な実施形態では、予測リフト抽出処理が、図3を参照して後述する情報配信装置100によって行われる。情報配信装置100は、評価装置の一例である。
図2Aを参照すると、はじめに、情報配信装置100は、訓練セットTS1を取得する(ステップS1)。訓練セットTS1は、インスタンスと、インスタンスに関連付けられたラベルとを含む。図2Aの例では、インスタンスは、モデルの説明変数(すなわち、入力)に対応し、ラベルは、モデルの目的変数(すなわち、出力やターゲット)に対応する。
図2Aの例に示されるように、インスタンスは、ユーザの特徴(「特徴量」とも呼ばれる)として、ユーザの属性とこの属性の値との組み合わせを示す。ここで、目的変数が、コンバージョンの有無であり、説明変数が、属性(例えば、性別、年齢、国内旅行、海外旅行等の興味関心)および広告接触の有無である。
例示のため、特定の航空会社が、特定の航空会社に関連する広告コンテンツを配信する広告キャンペーンを実施するよう、情報配信装置100に関係するインターネット企業に依頼したと仮定する。この例では、広告クリエイティブは、例えば、「ニューヨークに行くなら、あの飛行機(例示の広告文)」等の広告文を含む。この場合、コンバージョンアクションやコンバージョンイベントは、ニューヨーク行きの航空券の購入である。
例えば、訓練セットTS1は、27歳の男性が、国内旅行に興味があり、海外旅行に興味がないことを示している。また、訓練セットTS1は、この27歳の男性が、広告に接触し、その後、コンバージョンしなかったことを示している。
また、例えば、訓練セットTS1は、35歳の女性が、国内旅行に興味があり、海外旅行に興味があることを示している。さらに、訓練セットTS1は、この35歳の女性が、この35歳の女性がコンバージョンする前に、広告に接触していなかったことを示している。
次いで、情報配信装置100は、取得された訓練セットTS1から機械学習モデルを訓練することによって、コンバージョン(CV)確率予測モデルCPPM1を構築する(ステップS2)。機械学習モデルは、例えば、ロジスティック回帰等の回帰モデルである。
図2Bを参照すると、図2AのステップS2の後に、情報配信装置100は、データセットDS1を取得する(ステップS3)。データセットDS1は、新しいインスタンスとして、新しいユーザの属性情報(例えば、性別、年齢、海外旅行等の興味関心)を含む。例えば、データセットDS1は、26歳の男性が、海外旅行に興味がないことや、22歳の女性が、海外旅行に興味がないことを示している。
次いで、情報配信装置100は、取得されたデータセットDS1から、広告接触の有無を仮定したデータセットを作成する(ステップS4)。
より具体的には、情報配信装置100は、データセットDS1に含まれる属性情報に、広告接触の有無を示す有無情報を追加する。図2Bの例では、情報配信装置100は、広告接触があることを仮定したデータセットとして、データセットPDS1を作成する。さらに、情報配信装置100は、広告接触がないことを仮定したデータセットとして、データセットPDS2を作成する。
図2Cを参照すると、図2BのステップS4の後に、情報配信装置100は、広告接触前および後のコンバージョン(CV)確率を、各新しいユーザごとに予測する(ステップS5)。
図2Cの例では、情報配信装置100は、データセットPDS1(すなわち、広告接触がないことを仮定したデータセット)と、データセットPDS2(すなわち、広告接触があることを仮定したデータセット)とに、コンバージョン確率予測モデルCPPM1を適用することによって、広告接触前のコンバージョン確率CPBA1と、広告接触後のコンバージョン確率CPAA1とを予測する。
このように、情報配信装置100は、広告接触の有無によって互いに異なる、同一のユーザの2つの予測コンバージョン確率を算出する。図2Cの例では、広告接触前のコンバージョン確率CPBA1は、新しいユーザが広告に接触しなかった場合のコンバージョン確率の予測値を示す。一方、広告接触後のコンバージョン確率CPAA1は、この新しいユーザが広告に接触した場合のコンバージョン確率の予測値を示す。情報配信装置100は、各新しいユーザ(例えば、26歳の男性、42歳の女性)について、広告接触前後のコンバージョン確率の予測値を出力する。
その後、情報配信装置100は、広告接触によるコンバージョン(CV)確率のリフト値を算出する(ステップS6)。図2Cの例では、情報配信装置100は、広告接触後のコンバージョン確率CPAA1と、広告接触前のコンバージョン確率CPBA1との差を、広告接触によるコンバージョン確率のリフト値LVCP1として算出する。
図2Cの例では、例えば、26歳の男性のリフト値は、リフト値「0.15-0.10=0.05」である。また、例えば、42歳の女性のリフト値は、リフト値「0.45-0.20=0.25」である。このように、情報配信装置100は、広告接触後の予測コンバージョン確率と、広告接触前の予測コンバージョン確率との差を、広告接触による予測コンバージョン確率のリフト値として抽出する。このようなリフト値は、広告がユーザに当たった場合にユーザのコンバージョン確率がどの程度上昇するかを示している。
そして、情報配信装置100は、広告接触によるコンバージョン確率のリフト値LVCP1に基づいて、広告配信のターゲットとなるユーザを選択する。例えば、情報配信装置100は、広告接触によるコンバージョン確率のリフト値LVCP1に基づいて、新しいユーザをソートし、上位n人(nは任意の自然数)を、広告配信のターゲットとして決定する。
〔1-4.例示的な実施形態の効果〕
上述のように、例示的な実施形態に係る情報配信装置100は、広告がユーザに当たった場合に高い確率でコンバージョンするようになるユーザを、広告配信のターゲットとして望ましいユーザとして、探すことができる。このようなユーザへの広告は、ユーザのコンバージョンにつながる可能性が高い。情報配信装置100は、広告への接触によりコンバージョン率の高い上昇を示すユーザを見逃すことなく、獲得されるユーザのコンバージョンを増加させることができる。
図1を参照して上述した典型的な広告配信TAD1との比較の観点からは、情報配信装置100は、広告の配信量に関する制約がある中で、広告配信の全体最適を実現することができる。
より具体的には、情報配信装置100は、広告接触による予測コンバージョン確率のリフト値に基づいて、どのユーザに対して広告が配信されるかを決定することができる。例えば、情報配信装置100は、ユーザが広告に接触した場合にコンバージョンしそうなユーザ(すなわち、広告への接触により高いリフト値を示すユーザ)に対して、広告を配信する。このようにして、情報配信装置100は、広告が、広告への接触によりコンバージョンするユーザに対して配信されない場合に生じ得る機会損失を低減させることができる。
一方、ユーザが高いコンバージョン率を有する場合であっても、情報配信装置100は、広告への接触により高いリフト値を示さないユーザに対して、広告を配信しない。したがって、高いコンバージョン率を有するユーザのコンバージョン率は、典型的な広告配信TAD1と比べて低下することがある。しかしながら、全ユーザのリフト値の合計や平均は、典型的な広告配信TAD1と比べて増加する。すなわち、全ユーザに占めるコンバージョンするユーザの割合は、典型的な広告配信TAD1と比べて増加する。それに加えて、広告への接触により高いリフト値を示さないユーザの中には、広告に接触しなくてもコンバージョンするユーザも存在する。その結果、情報配信装置100は、ユーザのコンバージョンの獲得効率を高めることができる。
このため、情報配信装置100は、広告に接触しなくてもコンバージョンするユーザのコンバージョンを維持しつつ、広告によって獲得されるユーザのコンバージョンを増加させることができる。
以下、このような予測リフト抽出処理を行う情報配信装置100について詳細に説明する。
〔2.情報配信システム〕
次に、図3を参照して、情報配信装置100を含むシステムの構成例について説明する。
〔2-1.情報配信システムの構成要素〕
図3は、実施形態に係る情報配信システム1の一例を示す図である。図3に示されるように、情報配信システム1は、情報配信装置100、情報提供装置200およびユーザ装置300等の構成要素を含む。図3中では図示していないが、情報配信システム1は、複数台の情報配信装置100や、複数台の情報提供装置200や、複数台のユーザ装置300を含んでもよい。また、情報配信システム1は、情報配信装置100に関係するエンティティ(例えば、業者、エンドユーザ)の装置等の、他の構成要素を含んでもよい。
情報配信システム1において、情報配信装置100、情報提供装置200およびユーザ装置300は、それぞれネットワークNと有線又は無線により接続される。ネットワークNは、例えば、インターネット、WAN(Wide Area Network)、LAN(Local Area Network)等のネットワークである。情報配信システム1の構成要素は、ネットワークNを介して互いに通信を行うことができる。
情報配信装置100(評価装置の一例に相当)は、情報配信のための処理を実行する情報処理装置である。情報配信の一例は、コンテンツ配信である。例えば、情報配信装置100は、コンテンツとして、広告を配信することができる。
情報配信装置100は、データ分析手法を使用することによって、対象の特徴から、対象についての様々な情報を取り出すことができる。情報配信装置100は、多岐にわたる対象を、データ分析のターゲットとして選択することができる。例えば、インターネット広告においては、対象は、インターネットのユーザである。この場合、ユーザ情報(例えば、ユーザの属性)が、ユーザに対する広告の効果を分析するために使用される。
情報配信装置100は、機械学習アルゴリズムにユーザ情報を与え、ユーザに対する広告の効果を分析することができる。例えば、情報配信装置100は、ユーザ情報から、広告の効果を予測する機械学習モデルを構築することができる。このような機械学習モデルの一例は、ユーザの特徴が入力であり、ユーザの性質(例えば、ユーザに対する広告の効果)が出力である予測モデルである。
情報配信装置100は、サーバを含む、任意のタイプの情報処理装置であってもよい。複数台の情報配信装置100が、ウェブサーバ、アプリケーションサーバ、データベースサーバ等の各種サーバの機能をそれぞれ提供してもよい。情報配信装置100の構成例は、次の節で詳述される。
情報提供装置200は、情報配信装置100に、各種情報を提供する情報処理装置である。情報提供装置200は、各種インターネットサービスを提供することができる。また、情報提供装置200は、各種インターネットサービスを介して、各種情報を収集することができる。情報提供装置200は、サーバを含む、任意のタイプの情報処理装置であってもよい。
各種インターネットサービスは、検索、ポータル、ショッピング、オークション、ニュース、ファイナンス、旅行、飲食店紹介、スポーツ、テレビ、動画、ゲーム、地図、路線情報、料理、不動産、自動車、ブログ、結婚、漫画、占い、地域情報等のサービスであってもよい。
情報提供装置200は、各種インターネットサービスを、クライアントプログラムを介して提供することができる。クライアントプログラムは、例えば、スマートフォンのアプリケーション、ウェブブラウザ等のプログラムである。情報提供装置200は、上述の各種インターネットサービスの提供を通じて、各種インターネットサービスのユーザの情報を収集することができる。
情報提供装置200は、検索履歴、購買履歴、閲覧履歴、移動履歴等のユーザ情報を収集することができる。情報提供装置200は、このようなユーザ情報を、事象情報や特徴情報として蓄積することができる。
事象情報は、特定の事象を表す。例えば、事象情報は、ユーザがコンバージョンイベントを発生させたことや、コンバージョンアクションを実行したことを示すことができる。一例として、事象情報は、ユーザが、広告を閲覧し、その後、所定のコンテンツにおいて、広告の商品を購入したことを示してもよい。別の例として、事象情報は、ユーザが、広告をクリックし、リンク先にあるコンテンツにおいて、広告の商品を購入したことを示してもよい。
特徴情報は、対象の特徴を表す。例えば、特徴情報は、ユーザの行動履歴(例えば、検索履歴)や、ユーザの属性情報(例えば、デモグラフィック属性、サイコグラフィック属性)を示すことができる。
ユーザ装置300は、ユーザによって利用される情報処理装置である。ユーザ装置300は、情報提供装置200によって提供される各種インターネットサービスへのアクセスを要求することができる。ユーザ装置300は、スマートフォン、デスクトップ型PC(Personal Computer)、ノート型PC、タブレット型PC等のクライアント装置を含む、任意のタイプの情報処理装置であってもよい。
ユーザ装置300は、上述の各種インターネットサービスを介して、情報提供装置200に、各種情報を要求することができる。また、ユーザ装置300は、上述の各種インターネットサービスを介して、情報提供装置200から、各種情報を受信することができる。上述のように、ユーザ装置300のユーザの情報は、この各種インターネットサービスを介して、情報提供装置200によって収集され得る。
〔2-2.情報配信装置の構成〕
図3に示されるように、情報配信装置100は、通信部110と、記憶部120と、制御部130とを有する。なお、情報配信装置100は、情報配信装置100を利用する管理者等から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を表示するための表示部(液晶ディスプレイ等)を有してもよい。
(通信部110)
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。通信部110は、有線または無線によりネットワーク網と接続される。通信部110は、情報提供装置200およびユーザ装置300に、ネットワークNを介して、通信可能に接続されてもよい。通信部110は、情報提供装置200およびユーザ装置300との間で、ネットワーク網を介して、情報の送受信を行うことができる。
(記憶部120)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。図3に示されるように、記憶部120は、事象情報記憶部121と、モデル記憶部122と、特徴情報記憶部123と、配信用情報記憶部124とを有する。
(事象情報記憶部121)
事象情報記憶部121は、事象情報を記憶する。上述のように、事象情報は、特定の事象を表す。事象情報は、対象に関連する所定の事象の発生とこの対象の特徴との関係を示すことができる。例えば、事象情報は、訓練インスタンスを含むことができる。この場合、インスタンスは、対象の特徴であり、インタスタンスに関連付けられたラベルは、所定の事象であり得る。
上述の例示的な実施形態では、事象情報は、図2Aを参照して上述した訓練セットTS1である。図2Aの例では、対象の特徴は、ユーザの属性(例えば、性別、年齢、国内旅行、海外旅行等の興味関心)および広告接触の有無であり、ラベルは、コンバージョンの有無である。訓練セットTS1は、過去のユーザのコンバージョンに関する情報を示している。
図2Aの例では、事象情報(すなわち、訓練セットTS1)は、広告が配信されたため、27歳の男性がコンバージョンしたことを示唆している。また、この事象情報は、広告が配信されていないにもかかわらず、35歳の女性がコンバージョンしたことを示している。この場合、この事象情報は、この35歳の女性が、もともと広告の商品を購入する予定であったことを示唆している。
(モデル記憶部122)
モデル記憶部122は、モデル(すなわち、機械学習モデル)を記憶する。モデル記憶部122は、後述する生成部133によって生成されたモデル(例えば、機械学習モデルのデータ)を記憶することができる。いくつかの実施形態では、後述する収集部131によって受信されたモデルを記憶してもよい。
一例では、モデルの目的変数は、コンバージョンの有無であり、モデルの説明変数は、属性データ(例えば、性別、年齢、興味関心等)と、広告接触の有無とを含むユーザ情報である。
(特徴情報記憶部123)
特徴情報記憶部123は、特徴情報を記憶する。上述のように、特徴情報は、対象の特徴を表す。例えば、特徴情報は、新しいインスタンスを含むことができる。この場合、新しいインスタンスは、新しい対象の特徴であり得る。
上述の例示的な実施形態では、特徴情報は、図2Bを参照して上述したデータセットDS1である。図2Bの例では、対象(例えば、新しい対象)の特徴は、ユーザ(例えば、新しいユーザ)の属性(例えば、性別、年齢、海外旅行等の興味関心)である。
(配信用情報記憶部124)
配信用情報記憶部124は、配信用情報を記憶する。配信用情報は、後述する配信部139によって配信される各種情報である。各種情報の一例は、コンテンツ(例えば、広告)である。
上述の例示的な実施形態では、配信用情報は、広告である。図2A~図2Cの例では、広告は、特定の航空会社に関連する広告コンテンツである。図2A~図2Cの例では、この広告コンテンツ(例えば、「ニューヨークに行くなら、あの飛行機(例示の広告文)」等の広告文を含む広告)が配信されたため、航空券を購入したユーザがいる。言い換えると、この広告コンテンツが配信されなかった場合に、航空券を購入しなかったユーザがいる。このように、ユーザのコンバージョンは、広告クリエイティブによって影響を受ける。
(制御部130)
制御部130は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)、MPU(Micro Processing Unit)等のプロセッサによって、情報配信装置100内部の記憶装置に記憶されている各種プログラム(評価プログラムの一例に相当)がRAM等を作業領域として実行されることにより実現される。また、制御部130は、コントローラ(controller)であり、例えば、ASIC(Application Specific Integrated Circuit)、FPGA(Field Programmable Gate Array)、GPGPU(General Purpose Graphic Processing Unit)等の集積回路により実現されてもよい。
制御部130は、図3に示されるように、収集部131と、事象情報取得部132と、生成部133と、受信部134と、特徴情報取得部135と、作成部136と、予測部137と、評価部138と、配信部139とを有し、以下に説明する情報処理の機能や作用を実現又は実行する。また、制御部130は、図2A~図2Cを参照して上述した予測リフト抽出処理を実現することができる。情報配信装置100の1つまたは複数のプロセッサは、情報配信装置100の1つまたは複数のメモリに記憶された命令を実行することによって、制御部130内の各制御部の機能を実現することができる。なお、制御部130の内部構成は、図3に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。例えば、評価部138は、評価部138以外の部に関して後述する情報処理の全部または一部を行ってもよい。
(収集部131)
収集部131は、情報配信のための処理を実行するのに使用される各種情報を収集することができる。例えば、収集部131は、上述の事象情報を収集することができる。収集部131は、情報提供装置200から事象情報を受信することができる。収集部131は、上述のモデル(すなわち、機械学習モデル)を収集してもよい。
収集部131は、事象情報、モデル等の各種情報を、所定の情報処理装置(例えば、情報配信装置100に関係するエンティティ(例えば、特定のインターネット企業)の装置)から受信することができる。また、例えば、収集部131は、情報配信装置100を利用する管理者から、ユーザインタフェースを介して、このような情報を受信することができる。収集部131は、事象情報記憶部121に、受信された事象情報を格納してもよい。また、収集部131は、モデル記憶部122に、受信されたモデルを格納してもよい。
(事象情報取得部132)
事象情報取得部132は、情報配信のための処理を実行するのに使用される各種情報を取得することができる。事象情報取得部132は、記憶部120から各種情報を取得することができる。例えば、事象情報取得部132は、上述の事象情報を、事象情報記憶部121から取得することができる。
一例では、事象情報取得部132は、訓練セットを取得する。図2Aを参照して上述したように、訓練セットは、インスタンスと、インスタンスに関連付けられたラベルとを含む。
(生成部133)
生成部133は、情報配信のための処理を実行するのに使用される機械学習モデルを生成することができる。生成部133は、事象情報取得部132によって取得された事象情報から、機械学習モデルを構築することができる。
生成部133は、第1の対象に関連する所定の事象が発生する可能性の予測について、第2の対象に関連する所定の事象の発生とこの第2の対象の特徴との関係を示す事象情報から学習した機械学習モデルを生成することができる。例えば、生成部133は、機械学習モデルに事象情報を与える。そして、生成部133は、事象情報に基づいて、機械学習モデルを訓練することができる。生成部133は、汎化誤差が最小化されるように、モデルパラメータ値を探すことができる。生成部133は、モデルパラメータ値を探すために、各種オプティマイザを実装することができる。
一例では、生成部133は、事象情報取得部132によって取得された訓練セットから機械学習モデルを訓練することによって、コンバージョン確率予測モデルを構築する。図2Aを参照して上述したように、機械学習モデルは、例えば、ロジスティック回帰等の回帰モデルである。
(受信部134)
受信部134は、情報配信のための処理を実行するのに使用される各種情報を受信することができる。例えば、受信部134は、上述の特徴情報を受信することができる。受信部134は、情報提供装置200から特徴情報を受信することができる。
受信部134は、特徴情報等の各種情報を、所定の情報処理装置(例えば、情報配信装置100に関係するエンティティ(例えば、特定のインターネット企業)の装置)から受信することができる。また、例えば、受信部134は、情報配信装置100を利用する管理者から、ユーザインタフェースを介して、このような情報を受信することができる。受信部134は、特徴情報記憶部123に、受信された特徴情報を格納してもよい。
(特徴情報取得部135)
特徴情報取得部135は、情報配信のための処理を実行するのに使用される各種情報を取得することができる。特徴情報取得部135は、記憶部120から各種情報を取得することができる。例えば、特徴情報取得部135は、上述の特徴情報を、特徴情報記憶部123から取得することができる。
特徴情報取得部135は、対象の特徴を表す特徴情報を取得することができる。特徴情報取得部135は、対象が第1の特徴を有することを示す特徴情報を取得することができる。例えば、特徴情報取得部135は、第1の特徴を有することとして、第1の属性の値を表す特徴情報を取得することができる。
特徴情報取得部135は、対象に関連する事象が発生する可能性の予測に使用される複数の特徴の第1の部分である第1の特徴を有することを示す特徴情報を取得することができる。
一例では、特徴情報取得部135は、データセットを取得する。図2Bを参照して上述したように、データセットは、新しいインスタンスとして、新しいユーザの属性情報(例えば、性別、年齢、海外旅行等の興味関心)を含む。
(作成部136)
作成部136は、特徴情報を作成することができる。例えば、作成部136は、特徴情報取得部135によって取得された特徴情報から、新たな特徴情報を作成することができる。作成部136は、所定の事象を予測するためのデータセットから、新たな特徴の存在を仮定した擬似データセットを作成することができる。
少なくとも1つの実施形態では、作成部136は、第1の特徴を有する対象が、第2の特徴を有することを仮定した第1の特徴情報と、この対象が、この第2の特徴を有さないことを仮定した第2の特徴情報とを作成する。例えば、作成部136は、特徴情報取得部135によって取得された特徴情報から、第1の特徴情報と、第2の特徴情報とを作成する。
作成部136は、特徴情報取得部135によって取得された特徴情報から、対象が、第1の特徴に加えて、第2の特徴を有することを仮定した第1の特徴情報と、対象が、第1の特徴を有するが、この第2の特徴を有さないことを仮定した第2の特徴情報とを作成することができる。言い換えると、作成部136は、特徴情報取得部135によって取得された特徴情報から、対象が、第1の特徴を有し、かつ第2の特徴を有することを仮定した第1の特徴情報と、対象が、前記第1の特徴を有するが、この第2の特徴を有さないことを仮定した第2の特徴情報とを作成することができる。すなわち、第1の特徴情報は、第1の特徴に加えて第2の特徴が対象にあることを仮定する。一方、第2の特徴情報は、第1の特徴が対象にあるが、第2の特徴が対象にないことを仮定する。
作成部136は、特徴情報取得部135によって取得された、対象に関連する事象が発生する可能性の予測に使用される複数の特徴の第1の部分である第1の特徴を有することを示す特徴情報から、対象が、第1の特徴に加えて、対象に関連する事象が発生する可能性の予測に使用される複数の特徴の第2の部分である第2の特徴を有することを仮定した第1の仮定の特徴情報と、対象が、第1の特徴を有するが、この第2の特徴を有さないことを仮定した第2の仮定の特徴情報とを作成することができる。
少なくとも1つの実施形態では、作成部136は、第2の特徴を有することとして、第2の属性の第1の値を表す第1の特徴情報と、第2の特徴を有さないこととして、この第2の属性の第2の値を表す第2の特徴情報とを作成する。
少なくとも1つの実施形態では、作成部136は、対象に第2の特徴があることとして、所定の情報が対象に配信されたことを示す第1の特徴情報と、対象に第2の特徴がないこととして、この所定の情報が対象に配信されていないことを示す第2の特徴情報とを作成する。
一例では、作成部136は、特徴情報取得部135によって取得されたデータセットから、広告接触の有無を仮定したデータセットを作成する。
より具体的には、図2Bを参照して上述したように、作成部136は、データセットに含まれる属性情報に、広告接触の有無を示す有無情報を追加する。作成部136は、広告接触があることを仮定したデータセットとして、第1のデータセットを作成する。さらに、作成部136は、広告接触がないことを仮定したデータセットとして、第2のデータセットを作成する。
(予測部137)
予測部137は、所定の事象が発生する可能性を予測することができる。例えば、予測部137は、作成部136によって作成された特徴情報に対して、機械学習アルゴリズムを適用することによって、所定の事象が発生する可能性を予測することができる。
少なくとも1つの実施形態では、予測部137は、第1の特徴または第2の特徴を有する学習対象の特徴情報から、この学習対象に所定の事象が発生する可能性を予測するように学習が行われた予測モデルを用いて、対象が第2の特徴を有する場合に対象に関連する所定の事象が発生する第1の可能性と、対象が第2の特徴を有さない場合に対象に関連する所定の事象が発生する第2の可能性とを予測する。例えば、予測部137は、学習対象に関連する所定の事象の発生と学習対象の特徴との関係を示す特徴情報を使用して訓練された予測モデルを用いて、第1の可能性と第2の可能性とを予測する。
予測部137は、作成部136によって作成された第1の特徴情報および第2の特徴情報に対して、第1の対象に関連する所定の事象が発生する可能性の予測について、第2の対象に関連する所定の事象の発生とこの第2の対象の特徴との関係を示す事象情報から学習した学習アルゴリズムを適用することによって、対象が第2の特徴を有する場合に対象に関連する所定の事象が発生する第1の可能性と、対象が第2の特徴を有さない場合に対象に関連する所定の事象が発生する第2の可能性とを予測することができる。
学習アルゴリズムの例は、ロジスティック回帰、サポートベクトルマシン、ニューラルネットワーク等のモデルベース学習や、k最近傍等のインスタンスベースの学習を含む。予測部137は、学習アルゴリズムとして、上述の事象情報を使用して訓練されたモデルを適用することによって、対象が第2の特徴を有する場合に対象に関連する所定の事象が発生する第1の可能性と、対象が第2の特徴を有さない場合に対象に関連する所定の事象が発生する第2の可能性とを予測することができる。
一例では、予測部137は、広告接触前および後のコンバージョン確率を、各新しいユーザごとに予測する。図2Cを参照して上述したように、予測部137は、第1のデータセット(すなわち、広告接触がないことを仮定したデータセット)と、第2のデータセット(すなわち、広告接触があることを仮定したデータセット)とに、コンバージョン確率予測モデルを適用することによって、広告接触前のコンバージョン確率と、広告接触後のコンバージョン確率とを予測する。
(評価部138)
評価部138は、対象に関連する所定の事象が発生する可能性に対して、対象の特徴が与える影響を評価することができる。例えば、評価部138は、予測部137によって予測された可能性に基づいて、対象に関連する所定の事象が発生する可能性の変化を評価することができる。例えば、評価部138は、予測部137によって予測された可能性に基づいて、対象が所定の事象を発生させる可能性に対して、この対象の特徴が与える影響を評価することができる。
少なくとも1つの実施形態では、評価部138は、作成部136によって作成された第1の特徴情報に基づいて予測された、対象が第2の特徴を有する場合に対象に関連する所定の事象が発生する第1の可能性と、作成部136によって作成された第2の特徴情報に基づいて予測された、対象が第2の特徴を有さない場合に対象に関連するこの所定の事象が発生する第2の可能性との比較から、対象に関連するこの所定の事象が発生する可能性に対して、第2の特徴が与える影響を評価する。例えば、評価部138は、予測部137によって予測された第1の可能性と、予測部137によって予測された第2の可能性との比較から、対象に関連するこの所定の事象が発生する可能性に対して、第2の特徴が与える影響を評価する。
少なくとも1つの実施形態では、評価部138は、対象に関連するこの所定の事象が発生する可能性に対して第2の特徴が与える影響として、第1の可能性と第2の可能性とを比較するための所定の指標を評価する。例えば、評価部138は、所定の指標として、第1の可能性が、対象が第2の特徴を有することが仮定されない場合に対象に関連する所定の事象が発生する可能性に対して、どの程度上昇したかを示す評価指標を算出する。例えば、評価部138は、評価指標として、第1の可能性と第2の可能性との差および第1の可能性と第2の可能性との比のうちの少なくとも1つに基づく、第2の特徴によるリフト値を算出する。
少なくとも1つの実施形態では、評価部138は、第1の可能性と第2の可能性との比較から、対象に関連するこの所定の事象が発生する可能性に対して第2の特徴が与える影響として、第1の特徴情報によって表された、第2の属性の第1の値と、第2の特徴情報によって表された、第2の属性の第2の値との違いに由来する、対象に関連する所定の事象が発生する可能性の変化を評価する。
少なくとも1つの実施形態では、評価部138は、対象が第2の特徴を有する場合に対象が所定の事象である所定の行動を取る第1の可能性と、対象が第2の特徴を有さない場合に対象が所定の事象であるこの所定の行動を取る第2の可能性との比較から、対象がこの所定の行動を取る可能性である、対象に関連する所定の事象が発生する可能性に対して、第2の特徴が与える影響を評価する。
少なくとも1つの実施形態では、評価部138は、第1の可能性と第2の可能性との比較から、対象に関連する所定の事象が発生する可能性に対して第2の特徴が与える影響として、対象に関連する所定の事象が発生する可能性に対して、所定の情報の配信が与える影響を評価する。
一例では、評価部138は、広告接触によるコンバージョン確率のリフト値を算出する。図2Cを参照して上述したように、評価部138は、広告接触後のコンバージョン確率と、広告接触前のコンバージョン確率との差を、広告接触によるコンバージョン確率のリフト値として算出する。
上述のように、評価部138は、単に、特徴情報に予め含まれる所定の属性の値を変動させることによって、事象の発生の予測に対して、所定の属性が与える影響を評価するのではなく、特徴情報に予め含まれない新たな属性の存在と、この新たな属性の値の存在とを仮定した新たな特徴情報から、事象の発生の予測に対して、新たな属性が与える影響を評価することができる。
(配信部139)
配信部139は、所定の情報を対象に配信することができる。配信部139は、配信用情報記憶部124から、所定の情報として、配信用情報を取得することができる。上述のように、配信用情報は、例えば、広告コンテンツである。配信部139は、広告コンテンツに関する各種データ(例えば、入札価格、広告の品質)に基づいて、配信される広告コンテンツを決定してもよい。
配信部139は、配信用情報記憶部124から取得された広告コンテンツを、ユーザ装置300に配信することができる。例えば、配信部139は、情報提供装置200によって提供された各種コンテンツ内のコンテンツスロットに、広告コンテンツを配信することができる。各種コンテンツは、例えば、上述の各種インターネットサービスに関連する、ウェブページ、アプリ内コンテンツ等のコンテンツである。
少なくとも1つの実施形態では、配信部139は、評価部138によって評価された、対象に関連する所定の事象が発生する可能性の変化が所定の条件を満たす場合に、所定の情報を対象に配信する。
一例では、配信部139は、広告接触によるコンバージョン確率のリフト値に基づいて、広告配信のターゲットとなるユーザを選択する。図2Cを参照して上述したように、配信部139は、広告接触によるコンバージョン確率のリフト値に基づいて、新しいユーザをソートし、上位n人(nは任意の自然数)を、広告配信のターゲットとして決定する。
〔3.予測リフト抽出処理のフロー〕
次に、図4を参照して、実施形態に係る情報配信装置100による予測リフト抽出処理の手順について説明する。
図4は、実施形態に係る情報配信装置100によって実行される、予測コンバージョン確率のリフト値に基づいて広告を配信するための処理の一例を示すフローチャートである。
図4に示されるように、はじめに、情報配信装置100の事象情報取得部132は、訓練セットを取得する(ステップS101)。例えば、事象情報取得部132は、事象情報記憶部121から、訓練セットを取得する。
訓練セットは、訓練インスタンスとして、ユーザの特徴を表す特徴情報を含む。特徴情報は、例えば、広告接触の有無、行動履歴(例えば、検索履歴)、属性情報(例えば、デモグラフィック属性、サイコグラフィック属性)等のユーザ情報である。ラベルが、訓練インスタンスに関連付けられている。ラベルは、コンバージョンの有無を示す。予測子は、ユーザ情報等の特徴情報であり、ターゲットの数値は、コンバージョン率である。
次いで、情報配信装置100の生成部133は、事象情報取得部132によって取得された訓練セットから、コンバージョン(CV)確率予測モデルを構築する(ステップS102)。生成部133は、訓練セットをモデルに与え、訓練セットに基づいて、モデルを訓練する。生成部133は、汎化誤差が最小化されるように、モデルを訓練することができる。
モデルとして使用される学習アルゴリズムは、例えば、ロジスティック回帰や、各種機械学習システム(例えば、XGBoost)である。コンバージョン確率予測モデルは、コンバージョンとユーザの特徴との相関や、コンバージョンとユーザの特徴との因果関係を読み解くことを可能にすることができる。
次いで、情報配信装置100の特徴情報取得部135は、データセットを取得する(ステップS103)。データセットは、新しいインスタンスのデータである。データセットは、新しいインスタンスとして、新しいユーザの特徴を表す特徴情報を含む。
なお、新しいユーザは、広告ターゲット(すなわち、広告配信のターゲット)の候補である。したがって、新しいユーザの特徴情報は、この時点では、広告接触の有無に関する情報を含まない。新しいユーザは、例えば、ユニークユーザである。ユニークユーザは、所定の期間に所定のサービスを利用したユーザである。この場合、ユニークユーザは、所定のサービスに関連する広告のターゲットの候補である。
次いで、情報配信装置100の作成部136は、特徴情報取得部135によって取得されたデータセットから、広告接触の有無が異なる2つのデータセットを作成する(ステップS104)。より具体的には、作成部136は、特徴情報取得部135によって取得されたデータセットに含まれる一連の特徴に、「ユーザに広告接触が有ること」を仮定した特徴を追加する。さらに、作成部136は、特徴情報取得部135によって取得されたデータセットに含まれる一連の特徴に、「ユーザに広告接触が無いこと」を仮定した特徴を追加する。
言い換えると、作成部136は、特徴情報取得部135によって取得されたデータセットに、広告接触の属性と、この属性の値「あり」とを追加することによって、広告接触「あり」のデータセットを作成する。さらに、作成部136は、特徴情報取得部135によって取得されたデータセットに、広告接触の属性と、この属性の値「なし」とを追加することによって、広告接触「なし」のデータセットを作成する。
次いで、情報配信装置100の予測部137は、作成部136によって作成された広告接触の有無が異なる2つのデータセットに対して、生成部133によって生成されたコンバージョン(CV)確率予測モデルを適用することによって、広告接触が有るコンバージョン(CV)確率と、広告接触が無いコンバージョン(CV)確率とを予測する(ステップS105)。
すなわち、予測部137は、コンバージョン確率予測モデルを用いて、新しいユーザが広告に接触した場合のコンバージョン確率と、新しいユーザが広告に接触しなかった場合のコンバージョン確率とを予測する。予測部137は、広告接触が有るコンバージョン確率と、広告接触が無いコンバージョン確率とを、各新しいユーザごとに出力する。
次いで、情報配信装置100の評価部138は、予測部137によって予測された、広告接触が有るコンバージョン(CV)確率と、広告接触が無いコンバージョン(CV)確率とに基づいて、コンバージョン(CV)確率のリフト値を算出する(ステップS106)。評価部138は、コンバージョン確率のリフト値を、各新しいユーザごとに出力する。このように、評価部138は、広告接触によって引き起こされるコンバージョン確率の上昇幅に基づいて、広告ターゲットの候補をスコアリングすることができる。
コンバージョン確率のリフト値は、広告接触が有るコンバージョン確率と、広告接触が無いコンバージョン確率と使用した所定の式で定義される。この所定の式の形は、相関ルール学習において使用されるリフト値の式の形に対応してもよい。あるいは、この所定の式の形は、広告接触が有るコンバージョン確率と、広告接触が無いコンバージョン確率との差や、広告接触が有るコンバージョン確率と、広告接触が無いコンバージョン確率との比に対応してもよい。
一例として、評価部138は、広告接触が有るコンバージョン確率と、広告接触が無いコンバージョン確率との差分を抽出し、抽出された差分を、広告が新しいユーザに当たった場合のコンバージョン確率の上昇値であるスコアとして決定する。このようなスコアは、コンバージョン確率のリフト値の一例である。
次いで、情報配信装置100の配信部139は、評価部138によって算出されたコンバージョン(CV)確率のリフト値に基づいて、広告ターゲットを決定する(ステップS107)。例えば、配信部139は、コンバージョン確率のリフト値に基づいて、複数の新しいユーザをソートし、上位n人(nは任意の自然数)の新しいユーザを、広告ターゲットとして決定する。あるいは、新しいユーザのコンバージョン確率のリフト値が閾値を満たす場合に、配信部139は、この新しいユーザを、広告ターゲットとして決定してもよい。いくつかの実装形態では、新しいユーザの「広告接触が有るコンバージョン確率」が閾値を満たさない場合に、配信部139は、この新しいユーザを、広告ターゲットとして決定しなくてもよい。
〔4.他の実施形態〕
上述の実施形態に係る情報配信装置100は、上述の実施形態以外にも、種々の異なる形態で実施されてよい。そこで、以下では、上記の情報配信装置100の他の実施形態について説明する。
〔4-1.複数の種類の配信用情報〕
複数の種類の配信用情報がある場合に、情報配信装置100は、複数の種類の配信用情報の組み合わせを考慮してもよい。例えば、上述の例示的な実施形態では、情報配信装置100は、第1の広告接触の存在と、第2の広告接触の存在とを考慮してもよい。一例として、第1の広告は、「ニューヨークに行くなら、あの飛行機(例示の広告文)」等の広告文を含んでもよい。また、第2の広告は、「マイレージキャンペーン(例示の広告文)」等の広告文を含んでもよい。
例えば、コンバージョン確率予測モデルの説明変数は、属性(例えば、性別、年齢、国内旅行、海外旅行等の興味関心)、第1の広告接触の有無および第2の広告接触の有無であってもよい。この場合、情報配信装置100の作成部136は、第1の広告接触の有無または第2の広告接触の有無を仮定したデータセットを作成してもよい。例えば、作成部136は、第1の広告接触がないことと、第2の広告接触がないこととを仮定した第1のデータセットと、第1の広告接触があることと、第2の広告接触がないこととを仮定した第2のデータセットと、第1の広告接触がないことと、第2の広告接触があることとを仮定した第3のデータセットと、第1の広告接触があることと、第2の広告接触があることとを仮定した第4のデータセットとを作成してもよい。
情報配信装置100は、広告接触の順番を考慮してもよい。例えば、第1の広告接触に対応する属性は、第1のタイミングに対応してもよい。また、第2の広告接触に対応する属性は、第2のタイミングに対応してもよい。
そして、情報配信装置100の予測部137は、第1の広告接触の有無と、第2の広告接触の有無とによって互いに異なる、同一のユーザの4つの予測コンバージョン確率を算出してもよい。これにより、情報配信装置100の評価部138は、第1の広告接触の有無および第2の広告接触の有無に対応する4つのリフト値を算出することができる。情報配信装置100の配信部139は、この4つのリフト値に基づいて、広告配信のターゲットとなるユーザを選択してもよい。
〔4-2.適用可能なドメイン〕
図2A~図2Cに示した例示的な実施形態では、情報配信装置100は、広告接触によるコンバージョン確率のリフト値に基づいて、広告配信のターゲットとなるユーザを選択しているが、これに限定されるものではない。いくつかの実装形態では、情報配信装置100は、広告配信以外のドメインに適用され得る。上述したような「対象が第1の特徴を有する場合の対象の第2の特徴が、対象に関連する事象が発生する可能性に与える影響」を、広告配信以外のドメインに適用することが可能である。例えば、対象の第1の特徴がユーザのユーザ情報(例えば、属性情報、行動情報)である場合に、情報配信装置100は、次のようなドメインに適用され得る。
(クーポン)
上述のように、対象の第1の特徴がユーザのユーザ情報である場合に、対象の第2の特徴は、各種クーポンが配信されたかであってもよい。この場合、対象に関連する所定の事象は、各種クーポンの使用等のコンバージョンイベントであってもよい。
(プッシュ通知)
対象の第2の特徴は、プッシュ通知が配信されたかであってもよい。この場合、対象に関連する所定の事象は、プッシュ通知に関連する商品の購入等のコンバージョンイベントであってもよい。
(アンケート)
対象の第2の特徴は、アンケートが配信されたかであってもよい。この場合、対象に関連する所定の事象は、アンケートに対する回答等のコンバージョンイベントであってもよい。
(インセンティブ)
対象の第2の特徴は、ポイント等のインセンティブが配信されたかであってもよい。この場合、対象に関連する所定の事象は、例えば、インセンティブの使用等のコンバージョンイベントであってもよい。
〔4-3.対象の実体〕
対象は、例えば、人間のユーザであるが、これに限定されるものではない。いくつかの実施形態では、対象は、機械のエージェント(例えば、強化学習のエージェント)であってもよい。この場合、エージェントの特徴は、エージェントの行動や属性に基づいて決定されてもよい。このような特徴は、様々な特徴量エンジニアリングによって作成されてもよい。エージェントに関連する所定の事象は、所定のタスクの実行であってもよい。対象が強化学習のエージェントである場合に、コンバージョンイベントは、成功エピソードや失敗エピソードと読み替えられてもよい。
〔5.その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の一部を手動的に行うこともできる。あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
例えば、図3に示した記憶部120の一部又は全部は、情報配信装置100によって保持されるのではなく、ストレージサーバ等に保持されてもよい。この場合、情報配信装置100は、ストレージサーバにアクセスすることで、事象情報(例えば、訓練インスタンス)、モデルデータ(例えば、訓練済みモデルのデータ)、特徴情報(例えば、新しいインスタンス)、配信用情報(例えば、広告コンテンツ)等の各種情報を取得する。
〔6.ハードウェア構成〕
また、上述してきた実施形態に係る情報配信装置100は、例えば図5に示すような構成のコンピュータ1000によって実現される。図5は、ハードウェア構成の一例を示す図である。コンピュータ1000は、出力装置1010、入力装置1020と接続され、演算装置1030、一次記憶装置1040、二次記憶装置1050、出力IF(Interface)1060、入力IF1070、ネットワークIF1080がバス1090により接続された形態を有する。
演算装置1030は、一次記憶装置1040や二次記憶装置1050に格納されたプログラムや入力装置1020から読み出したプログラム等に基づいて動作し、各種の処理を実行する。一次記憶装置1040は、RAM等、演算装置1030が各種の演算に用いるデータを一時的に記憶するメモリ装置である。また、二次記憶装置1050は、演算装置1030が各種の演算に用いるデータや、各種のデータベースが登録される記憶装置であり、ROM(Read Only Memory)、HDD(Hard Disk Drive)、フラッシュメモリ等により実現される。
出力IF1060は、モニタやプリンタといった各種の情報を出力する出力装置1010に対し、出力対象となる情報を送信するためのインタフェースであり、例えば、USB(Universal Serial Bus)やDVI(Digital Visual Interface)、HDMI(登録商標)(High Definition Multimedia Interface)といった規格のコネクタにより実現される。また、入力IF1070は、マウス、キーボード、およびスキャナ等といった各種の入力装置1020から情報を受信するためのインタフェースであり、例えば、USB等により実現される。
なお、入力装置1020は、例えば、CD(Compact Disc)、DVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等から情報を読み出す装置であってもよい。また、入力装置1020は、USBメモリ等の外付け記憶媒体であってもよい。
ネットワークIF1080は、ネットワークNを介して他の機器からデータを受信して演算装置1030へ送り、また、ネットワークNを介して演算装置1030が生成したデータを他の機器へ送信する。
演算装置1030は、出力IF1060や入力IF1070を介して、出力装置1010や入力装置1020の制御を行う。例えば、演算装置1030は、入力装置1020や二次記憶装置1050からプログラムを一次記憶装置1040上にロードし、ロードしたプログラムを実行する。
例えば、コンピュータ1000が情報配信装置100として機能する場合、コンピュータ1000の演算装置1030は、一次記憶装置1040上にロードされたプログラムを実行することにより、制御部130の機能を実現する。
〔7.効果〕
上述してきたように、実施形態に係る情報配信装置100は、作成部136と、評価部138とを有する。
実施形態に係る情報配信装置100において、作成部136は、第1の特徴を有する対象が、第2の特徴を有することを仮定した第1の特徴情報と、この対象が、この第2の特徴を有さないことを仮定した第2の特徴情報とを作成する。また、実施形態に係る情報配信装置100において、評価部138は、作成部136によって作成された第1の特徴情報に基づいて予測された、対象が第2の特徴を有する場合に対象に関連する所定の事象が発生する第1の可能性と、作成部136によって作成された第2の特徴情報に基づいて予測された、対象が第2の特徴を有さない場合に対象に関連するこの所定の事象が発生する第2の可能性との比較から、対象に関連するこの所定の事象が発生する可能性に対して、第2の特徴が与える影響を評価する。
また、実施形態に係る情報配信装置100は、第1の特徴または第2の特徴を有する学習対象の特徴情報から、この学習対象に所定の事象が発生する可能性を予測するように学習が行われた予測モデルを用いて、対象が第2の特徴を有する場合に対象に関連する所定の事象が発生する第1の可能性と、対象が第2の特徴を有さない場合に対象に関連する所定の事象が発生する第2の可能性とを予測する予測部137を有する。また、実施形態に係る情報配信装置100において、評価部138は、予測部137によって予測された第1の可能性と、予測部137によって予測された第2の可能性との比較から、対象に関連するこの所定の事象が発生する可能性に対して、第2の特徴が与える影響を評価する。
また、実施形態に係る情報配信装置100において、予測部137は、学習対象に関連する所定の事象の発生と学習対象の特徴との関係を示す特徴情報を使用して訓練された予測モデルを用いて、第1の可能性と第2の可能性とを予測する。
また、実施形態に係る情報配信装置100において、評価部138は、対象に関連するこの所定の事象が発生する可能性に対して第2の特徴が与える影響として、第1の可能性と第2の可能性とを比較するための所定の指標を評価する。
また、実施形態に係る情報配信装置100において、評価部138は、所定の指標として、第1の可能性が、対象が第2の特徴を有することが仮定されない場合に対象に関連する所定の事象が発生する可能性に対して、どの程度上昇したかを示す評価指標を算出する。
また、実施形態に係る情報配信装置100において、評価部138は、評価指標として、第1の可能性と第2の可能性との差および第1の可能性と第2の可能性との比のうちの少なくとも1つに基づく、第2の特徴によるリフト値を算出する。
また、実施形態に係る情報配信装置100において、作成部136は、第2の特徴を有することとして、第2の属性の第1の値を表す第1の特徴情報と、第2の特徴を有さないこととして、この第2の属性の第2の値を表す第2の特徴情報とを作成する。また、実施形態に係る情報配信装置100において、評価部138は、第1の可能性と第2の可能性との比較から、対象に関連するこの所定の事象が発生する可能性に対して第2の特徴が与える影響として、第1の特徴情報によって表された、第2の属性の第1の値と、第2の特徴情報によって表された、第2の属性の第2の値との違いに由来する、対象に関連する所定の事象が発生する可能性の変化を評価する。
また、実施形態に係る情報配信装置100において、評価部138は、対象が第2の特徴を有する場合に対象が所定の事象である所定の行動を取る第1の可能性と、対象が第2の特徴を有さない場合に対象が所定の事象であるこの所定の行動を取る第2の可能性との比較から、対象がこの所定の行動を取る可能性である、対象に関連する所定の事象が発生する可能性に対して、第2の特徴が与える影響を評価する。
また、実施形態に係る情報配信装置100において、作成部136は、対象に第2の特徴があることとして、所定の情報が対象に配信されたことを示す第1の特徴情報と、対象に第2の特徴がないこととして、この所定の情報が対象に配信されていないことを示す第2の特徴情報とを作成する。また、実施形態に係る情報配信装置100において、評価部138は、第1の可能性と第2の可能性との比較から、対象に関連する所定の事象が発生する可能性に対して第2の特徴が与える影響として、対象に関連する所定の事象が発生する可能性に対して、所定の情報の配信が与える影響を評価する。
また、実施形態に係る情報配信装置100は、評価部138によって評価された、対象に関連する所定の事象が発生する可能性の変化が所定の条件を満たす場合に、所定の情報を対象に配信する配信部139を有する。
上述した各処理により、情報配信装置100は、特徴から有用な情報を引き出すことができる。
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
また、上述した情報配信装置100は、複数のサーバコンピュータで実現してもよく、また、機能によっては外部のプラットフォーム等をAPI(Application Programming Interface)やネットワークコンピューティングなどで呼び出して実現するなど、構成は柔軟に変更できる。
また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、収集部は、収集手段や収集回路に読み替えることができる。
1 情報配信システム
100 情報配信装置
110 通信部
120 記憶部
121 事象情報記憶部
122 モデル記憶部
123 特徴情報記憶部
124 配信用情報記憶部
130 制御部
131 収集部
132 事象情報取得部
133 生成部
134 受信部
135 特徴情報取得部
136 作成部
137 予測部
138 評価部
139 配信部
200 情報提供装置
300 ユーザ装置

Claims (10)

  1. 第1の特徴を有する対象が、第2の特徴を有することを仮定した第1の特徴情報と、当該対象が、当該第2の特徴を有さないことを仮定した第2の特徴情報とを作成する作成部と、
    前記対象が前記第2の特徴を有する場合に前記対象に関連する所定の事象が発生する第1の可能性を、前記作成部によって作成された第1の特徴情報に対して、予測モデルを適用することによって、予測し、かつ、前記対象が前記第2の特徴を有さない場合に前記対象に関連する当該所定の事象が発生する第2の可能性を、前記作成部によって作成された第2の特徴情報に対して、前記予測モデルを適用することによって、予測する予測部であって、前記予測モデルが、学習対象の前記第1の特徴及び当該学習対象の前記第2の特徴の有無を示す特徴情報と、前記所定の事象の有無を示すラベルとを含む訓練セットを使用して訓練されている、予測部と、
    前記予測部によって予測された前記第1の可能性と、前記予測部によって予測された前記第2の可能性との比較から、前記対象に関連する当該所定の事象が発生する可能性に対して、前記第2の特徴が与える影響を評価する評価部と
    を備えることを特徴とする評価装置。
  2. 前記評価部は、前記対象に関連する当該所定の事象が発生する可能性に対して前記第2の特徴が与える影響として、前記第1の可能性と前記第2の可能性とを比較するための所定の指標を評価する
    ことを特徴とする請求項に記載の評価装置。
  3. 前記評価部は、前記所定の指標として、前記第1の可能性が、前記対象が前記第2の特徴を有することが仮定されない場合に前記対象に関連する所定の事象が発生する可能性に対して、どの程度上昇したかを示す評価指標を算出する
    ことを特徴とする請求項に記載の評価装置。
  4. 前記評価部は、前記評価指標として、前記第1の可能性と前記第2の可能性との差及び前記第1の可能性と前記第2の可能性との比のうちの少なくとも1つに基づく、前記第2の特徴によるリフト値を算出する
    ことを特徴とする請求項に記載の評価装置。
  5. 前記作成部は、前記第2の特徴を有することとして、第2の属性の第1の値を表す前記第1の特徴情報と、前記第2の特徴を有さないこととして、当該第2の属性の第2の値を表す前記第2の特徴情報とを作成し、
    前記評価部は、前記第1の可能性と前記第2の可能性との比較から、前記対象に関連する当該所定の事象が発生する可能性に対して前記第2の特徴が与える影響として、前記第1の特徴情報によって表された、前記第2の属性の前記第1の値と、前記第2の特徴情報によって表された、前記第2の属性の前記第2の値との違いに由来する、前記対象に関連する前記所定の事象が発生する可能性の変化を評価する
    ことを特徴とする請求項1~4のうちいずれか1つに記載の評価装置。
  6. 前記評価部は、前記対象が前記第2の特徴を有する場合に前記対象が前記所定の事象である所定の行動を取る前記第1の可能性と、前記対象が前記第2の特徴を有さない場合に前記対象が前記所定の事象である当該所定の行動を取る前記第2の可能性との比較から、前記対象が当該所定の行動を取る可能性である、前記対象に関連する前記所定の事象が発生する可能性に対して、前記第2の特徴が与える影響を評価する
    ことを特徴とする請求項1~5のうちいずれか1つに記載の評価装置。
  7. 前記作成部は、前記対象に前記第2の特徴があることとして、所定の情報が前記対象に配信されたことを示す前記第1の特徴情報と、前記対象に前記第2の特徴がないこととして、当該所定の情報が前記対象に配信されていないことを示す前記第2の特徴情報とを作成し、
    前記評価部は、前記第1の可能性と前記第2の可能性との比較から、前記対象に関連する前記所定の事象が発生する可能性に対して前記第2の特徴が与える影響として、前記対象に関連する前記所定の事象が発生する可能性に対して、前記所定の情報の配信が与える影響を評価する
    ことを特徴とする請求項1~6のうちいずれか1つに記載の評価装置。
  8. 前記評価部によって評価された、前記対象に関連する前記所定の事象が発生する可能性の変化が所定の条件を満たす場合に、前記所定の情報を前記対象に配信する配信部をさらに備える
    ことを特徴とする請求項に記載の評価装置。
  9. コンピュータが実行する評価方法であって、
    第1の特徴を有する対象が、第2の特徴を有することを仮定した第1の特徴情報と、当該対象が、当該第2の特徴を有さないことを仮定した第2の特徴情報とを作成する作成工程と、
    前記対象が前記第2の特徴を有する場合に前記対象に関連する所定の事象が発生する第1の可能性を、前記作成工程によって作成された第1の特徴情報に対して、予測モデルを適用することによって、予測し、かつ、前記対象が前記第2の特徴を有さない場合に前記対象に関連する当該所定の事象が発生する第2の可能性を、前記作成工程によって作成された第2の特徴情報に対して、前記予測モデルを適用することによって、予測する予測工程であって、前記予測モデルが、学習対象の前記第1の特徴及び当該学習対象の前記第2の特徴の有無を示す特徴情報と、前記所定の事象の有無を示すラベルとを含む訓練セットを使用して訓練されている、予測工程と、
    前記予測工程によって予測された前記第1の可能性と、前記予測工程によって予測された前記第2の可能性との比較から、前記対象に関連する当該所定の事象が発生する可能性に対して、前記第2の特徴が与える影響を評価する評価工程と
    を含むことを特徴とする評価方法。
  10. 第1の特徴を有する対象が、第2の特徴を有することを仮定した第1の特徴情報と、当該対象が、当該第2の特徴を有さないことを仮定した第2の特徴情報とを作成する作成手順と、
    前記対象が前記第2の特徴を有する場合に前記対象に関連する所定の事象が発生する第1の可能性を、前記作成手順によって作成された第1の特徴情報に対して、予測モデルを適用することによって、予測し、かつ、前記対象が前記第2の特徴を有さない場合に前記対象に関連する当該所定の事象が発生する第2の可能性を、前記作成手順によって作成された第2の特徴情報に対して、前記予測モデルを適用することによって、予測する予測手順であって、前記予測モデルが、学習対象の前記第1の特徴及び当該学習対象の前記第2の特徴の有無を示す特徴情報と、前記所定の事象の有無を示すラベルとを含む訓練セットを使用して訓練されている、予測手順と、
    前記予測手順によって予測された前記第1の可能性と、前記予測手順によって予測された前記第2の可能性との比較から、前記対象に関連する当該所定の事象が発生する可能性に対して、前記第2の特徴が与える影響を評価する評価手順と
    をコンピュータに実行させることを特徴とする評価プログラム。
JP2020112101A 2020-06-29 2020-06-29 評価装置、評価方法及び評価プログラム Active JP7231585B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020112101A JP7231585B2 (ja) 2020-06-29 2020-06-29 評価装置、評価方法及び評価プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020112101A JP7231585B2 (ja) 2020-06-29 2020-06-29 評価装置、評価方法及び評価プログラム

Publications (2)

Publication Number Publication Date
JP2022011154A JP2022011154A (ja) 2022-01-17
JP7231585B2 true JP7231585B2 (ja) 2023-03-01

Family

ID=80147974

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020112101A Active JP7231585B2 (ja) 2020-06-29 2020-06-29 評価装置、評価方法及び評価プログラム

Country Status (1)

Country Link
JP (1) JP7231585B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7290219B2 (ja) 2019-09-18 2023-06-13 国立大学法人静岡大学 レクテナ装置及びレクテナ装置を設計する方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024105981A1 (ja) * 2022-11-15 2024-05-23 株式会社Nttドコモ レコメンド評価装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008287580A (ja) 2007-05-18 2008-11-27 Toshiba Corp 環境影響評価システム、評価方法および評価プログラム
JP2018526741A (ja) 2015-09-08 2018-09-13 フェイスブック,インク. 広告リフトの測定
JP2019036173A (ja) 2017-08-17 2019-03-07 ヤフー株式会社 算出装置、算出方法、算出プログラム及び第2モデル

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008287580A (ja) 2007-05-18 2008-11-27 Toshiba Corp 環境影響評価システム、評価方法および評価プログラム
JP2018526741A (ja) 2015-09-08 2018-09-13 フェイスブック,インク. 広告リフトの測定
JP2019036173A (ja) 2017-08-17 2019-03-07 ヤフー株式会社 算出装置、算出方法、算出プログラム及び第2モデル

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7290219B2 (ja) 2019-09-18 2023-06-13 国立大学法人静岡大学 レクテナ装置及びレクテナ装置を設計する方法

Also Published As

Publication number Publication date
JP2022011154A (ja) 2022-01-17

Similar Documents

Publication Publication Date Title
Kannan Digital marketing: A framework, review and research agenda
Trusov et al. Crumbs of the cookie: User profiling in customer-base analysis and behavioral targeting
US10366400B2 (en) Reducing un-subscription rates for electronic marketing communications
Li et al. Attributing conversions in a multichannel online marketing environment: An empirical model and a field experiment
Bucklin et al. Click here for Internet insight: Advances in clickstream data analysis in marketing
US9235570B2 (en) Optimizing internet campaigns
US10902443B2 (en) Detecting differing categorical features when comparing segments
KR102123264B1 (ko) 온라인 광고 성과 향상 방법, 장치, 및 시스템
US20180083995A1 (en) Identifying significant anomalous segments of a metrics dataset
US8732015B1 (en) Social media pricing engine
US20160140627A1 (en) Generating high quality leads for marketing campaigns
EP3326070A1 (en) Cross-screen measurement accuracy in advertising performance
Yerasani et al. Estimation and maximization of user influence in social networks
CN111095330B (zh) 用于预测在线用户交互的机器学习方法和系统
KR102451099B1 (ko) 인공지능 기반의 사용자 니즈 추론을 통한 구매 유도 시스템 및 방법
Olbrich et al. Analyzing the Click Path Of Affiliate-Marketing Campaigns: Interacting Effects of Affiliates' Design Parameters With Merchants' Search-Engine Advertising
JP7231585B2 (ja) 評価装置、評価方法及び評価プログラム
JP2019527906A (ja) 通信ネットワーク内で個人向けコンテンツを配信するための手段
US20160342699A1 (en) Systems, methods, and devices for profiling audience populations of websites
Omorogbe Improving Digital Marketing Strategy: The Impact of Digital Analytics
Kim et al. Understanding online users by segmenting their search keywords: empirical analysis from online auto insurance search advertising
Gupta et al. Click-through rate estimation using CHAID classification tree model
Hasan et al. Effective Digital Marketing Approaches for E-commerce Platforms
Guo A study on data mining of digital display performance of brand advertisement
US20160343025A1 (en) Systems, methods, and devices for data quality assessment

Legal Events

Date Code Title Description
A80 Written request to apply exceptions to lack of novelty of invention

Free format text: JAPANESE INTERMEDIATE CODE: A80

Effective date: 20200729

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210819

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220629

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220719

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220920

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230117

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230216

R150 Certificate of patent or registration of utility model

Ref document number: 7231585

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350