JP2020194545A - エンゲージメント関連性モデルのオフライン評価メトリック - Google Patents

エンゲージメント関連性モデルのオフライン評価メトリック Download PDF

Info

Publication number
JP2020194545A
JP2020194545A JP2020093258A JP2020093258A JP2020194545A JP 2020194545 A JP2020194545 A JP 2020194545A JP 2020093258 A JP2020093258 A JP 2020093258A JP 2020093258 A JP2020093258 A JP 2020093258A JP 2020194545 A JP2020194545 A JP 2020194545A
Authority
JP
Japan
Prior art keywords
model
user
pae
weighted
users
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020093258A
Other languages
English (en)
Other versions
JP6963653B2 (ja
Inventor
チャン シャオハン
Xiaohan Zhang
チャン シャオハン
セッティミオ メッリ ガボール
Settimio Melli Gabor
セッティミオ メッリ ガボール
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Interactive Entertainment Inc
Original Assignee
Sony Interactive Entertainment Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Interactive Entertainment Inc filed Critical Sony Interactive Entertainment Inc
Publication of JP2020194545A publication Critical patent/JP2020194545A/ja
Application granted granted Critical
Publication of JP6963653B2 publication Critical patent/JP6963653B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Mathematical Physics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computing Systems (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】結果を歪め得るアイテムの比例重要度の差を考慮しモデルを適切に区別するエンゲージメント関連性モデルのオンライン評価メトリックを提供する。【解決手段】エンゲージメント関連性モデルのオンライン評価メトリックにおいて、オフラインベンチマーク構築モジュール204は、製品購入、ウェブページ上の滞在時間、製品ランキング等のグラウンドトゥルースを、異なるモデル特徴を有する複数の予測モジュール210に入力し、予測モデル値を算出させる。オフライン確率絶対誤差評価モジュール216は、グランドトゥルースと各々の予測モデル値から、加重PAEを算出し、多様性または順位ベースランキングを考慮してモデルの有効性を評価しメトリック218を出力する。オフラインクリーンアップユーティリティ220は、メトリック218を使用して最良の予測モデル210を特定する。【選択図】図2

Description

本出願は、エンゲージメント関連性モデルを評価することに関する。
関連性モデルを使用して、特定ユーザが購入する可能性のある製品、特定ユーザが特定のウェブページに留まる可能性のある時間の長さ、及び複数のアイテムに関してユーザがどのようにランクを付ける可能性があるかを含む、様々な電子商取引メトリックが予測される。顧客の商品購入の仕方、顧客のニュースフィードとのインタラクションの仕方、及び顧客のメディアコンテンツとのインタラクションの仕方などのファクタに基づいて、カスタマエクスペリエンスをカスタマイズするため、現代の商取引において的確な関連性モデルが重要であることは明白である。これらのエクスペリエンスを提供するために、組織は、ユーザが様々なタイプのアイテムにどのように関連しているかについてスコアを提供する関連性モデルを構築する必要がある。
本明細書で認識されるように、関連性モデルの有効性を評価する既存の方法は、2進タイプ(例えばユーザがアイテムを購入したか否か)、多変量タイプ(例えばアンカーアイテムに対する品物の類似度のランク)、及び数値タイプ(例えばウェブページ上の滞在時間)など、グランドトゥルースの複数のタイプを十分に考慮していない。さらに、関連性モデルの有効性を評価する既存の方法は、分類の問題、ランキングの問題だけでなく、推定の問題も考慮するのに、1つの関連性メトリックを有するという点で、柔軟性に欠ける。さらに、関連性モデルの有効性を評価する既存の方法は、例えば、推奨商品の多様性を奨励し、同時に順位ベースランキングを適用するなど、特別な事例に対処する柔軟性がない。さらに、関連性モデルの有効性を評価する既存の方法は、i)結果を歪め得るアイテムの比例重要度の差を考慮すること、ii)誤った予測に対し適切なペナルティを科すこと、iii)同様に良い結果でもモデルを適切に区別すること、これらの3つの要件に同時に対処していない。加えて、関連性モデルの有効性を評価するメトリックは、評価の結果を簡単かつ定量化可能な方法で(例えば、回帰モデルの2つの既存のメトリック、RMSE及びMAEとは異なり、固定範囲内に制約されたメトリックで)伝える必要がある。
従って、デバイスは、一時的信号ではない少なくとも1つのコンピュータストレージを含み、次に少なくとも1つのコンピュータストレージは命令を含み、命令は、少なくとも1つのプロセッサにより、第1のモデルに関して、ユーザとアイテムとの複数の集合の集合ごとに、アイテムとのユーザインタラクションのモデル予測を表す第1の値と、アイテムとの実際のユーザインタラクションを表す第2の値との絶対差を特定することを、実行可能である。命令は、多数のユーザのユーザごとに、全アイテムにわたって、第1の値の合計が1になるように第1の値を正規化することを、実行可能である。同様の正規化命令が、第2の値に適用される。命令は、多数のユーザのユーザごとに、複数のアイテムの特定された絶対差を合計してユーザ合計を出し、ユーザ合計を合計して総計を出し、総計をユーザ数で割って確率絶対誤差(PAE)を出すことを、実行可能である。PAEは、少なくとも第2のモデルでも同様に特定される。第1のモデルが第2のモデルより低いPAEを有する場合、第1のモデルがより良いモデルとして出力され、そうでない場合には、第2のモデルがより良いモデルとして出力され、コンピュータシミュレーションを含む電子商取引を提供するために、より良いモデルが使用される。
いくつかの実施態様では、例えば不均衡な人気を有するテストインタラクションによる評価の歪みなどの特別な事例を考慮するために、命令は、ユーザ合計を合計する前に、少なくともいくつかのユーザ合計に、アイテムとの実際のユーザインタラクションを表す加重された第2の値の合計を掛けて、加重されたユーザ合計を出すことを、実行可能であり得る。命令はさらに、対象ユーザごとに、対象アイテムはネガティブではない(例えばユーザはこのアイテムを購入する/読む/クリックする/検討する)とモデルが予測した各アイテムに関して、重みw_I*予測確率p_u,Iの値を計算し、これを対象ユーザごとに全アイテムにわたって合計し、合計を全ユーザにわたって合計して、加重PAE(WPAE)を出すことを、実行可能であり得る。この実施形態では、命令は、電子商取引を提供する時により良いモデルを使用するために、第1のモデルが第2のモデルより低いWPAEを有する場合、第1のモデルをより良いモデルとして出力し、そうでない場合には、第2のモデルをより良いモデルとして出力することを、実行可能であり得る。
別の態様では、コンピュータ実施方法は、電子商取引及びコンピュータシミュレーションの目的に有用な複数のエンゲージメント関連性モデルを受け取ることを含む。方法は、少なくとも1つのメトリックを予測するのにどれがより良いモデルであるかを特定するために、グラウンドトゥルースに対して複数のモデルの予測をオフラインで評価することを含む。評価することは、複数のユーザのユーザごとに、グラウンドトゥルース及びモデル予測を、それぞれの合計が1となるように正規化することと、複数のユーザのユーザごとに、グラウンドトゥルースとモデル予測との絶対誤差を合計することと、ユーザ合計を合計して総計を出すことと、総計をユーザ数で割って確率絶対誤差(PAE)を出すことと、を含む。
別の態様では、装置は、少なくとも1つのプロセッサと、プロセッサによりアクセス可能であり、命令を含む少なくとも1つのコンピュータストレージを含み、命令は、プロセッサにより、第1のモデルに関して、0以上2以下の値を有する第1の確率絶対誤差(PAE)を特定することを、実行可能である。命令は、第2のモデルに関して、0以上2以下の値を有する第2のPAEを特定し、第1のPAEが第2のPAE未満であることに応じて、第1のモデルを使用して電子商取引におけるユーザインタラクションを予測することを、実行可能である。命令は、第1のPAEが第2のPAEより大きいことに応じて、第2のモデルを使用して電子商取引におけるユーザインタラクションを予測することを、実行可能である。
本出願の詳細は、その構造及び動作の両方に関して、添付の図面を参照することで最もよく理解することができ、図面では、同様の参照番号は、同様の部分を指す。
本発明の原理による、例を含む例示的なシステムのブロック図である。 本発明の原理による、例示的なアーキテクチャのブロック図である。 PAEを特定するための、本発明の原理と一致する例示的なロジックのフローチャートである。 WPAEを特定するための、本発明の原理と一致する例示的なロジックのフローチャートである。 評価への入力を表すデータ構造を示す。 評価への入力を表すデータ構造を示す。 単一のポジティブアイテムのシナリオに関する、完璧(「オラクル」)モデル及び完全過誤モデルを示す。 単一のポジティブアイテムのシナリオに関する、完璧(「オラクル」)モデル及び完全過誤モデルを示す。 平均モデルを示す。 複数のポジティブアイテムに関する、完璧モデル、優良モデル、一致モデル、及び過誤モデルを示す。 複数のポジティブアイテムに関する、完璧モデル、優良モデル、一致モデル、及び過誤モデルを示す。 複数のポジティブアイテムに関する、完璧モデル、優良モデル、一致モデル、及び過誤モデルを示す。 複数のポジティブアイテムに関する、完璧モデル、優良モデル、一致モデル、及び過誤モデルを示す。 例示的なモデルに関する、PAEとWPAEとの比較を示す。 例示的なモデルに関する、PAEとWPAEとの比較を示す。 例示的なモデルに関する、PAEとWPAEとの比較を示す。
本開示は、一般に、コンピュータゲームネットワークといったコンピュータシミュレーションネットワークなどのこれに限定されない一般消費者向け電子製品(CE)デバイスネットワークの態様を含むコンピュータエコシステムに関する。本明細書のシステムは、クライアントコンポーネントとサーバコンポーネントとの間でデータが交換され得るように、ネットワークを介して接続されたサーバコンポーネント及びクライアントコンポーネントを含み得る。クライアントコンポーネントは、1つ以上のコンピューティングデバイスを含み得、これには、Sony PlayStation(登録商標)あるいはMicrosoftもしくはNintendoまたは他の製造業者によるゲームコンソールなどのゲームコンソール、仮想現実(VR)ヘッドセット、拡張現実(AR)ヘッドセット、ポータブルテレビ(例えばスマートTV、インターネット対応TV)、ラップトップ及びタブレットコンピュータなどのポータブルコンピュータ、並びにスマートフォン及び下記に論じられる追加例を含む他のモバイルデバイスが含まれる。これらのクライアントデバイスは、様々な動作環境で作動し得る。例えば、クライアントコンピュータのうちのいくつかは、例を挙げると、Linux(登録商標)オペレーティングシステム、Microsoft社のオペレーティングシステム、もしくはUnix(登録商標)オペレーティングシステム、またはApple Computer製もしくはGoogle製のオペレーティングシステムを採用し得る。これらの動作環境を使用して、MicrosoftもしくはGoogle製のブラウザ、または下記に論じられるインターネットサーバによりホストされるウェブサイトにアクセスできるMozillaもしくは他のブラウザプログラムなど、1つ以上のブラウジングプログラムが実行され得る。また、本発明の原理による動作環境を使用して、1つ以上のコンピュータゲームプログラムが実行され得る。
サーバ及び/またはゲートウェイは、1つ以上のプロセッサを含み得、1つ以上のプロセッサは、インターネットなどのネットワークを介してデータを送受信するようにサーバを構成する命令を実行する。あるいは、クライアントとサーバは、ローカルイントラネットまたは仮想プライベートネットワークを介して接続することができる。サーバまたはコントローラは、Sony PlayStation(登録商標)といったゲームコンソール、パーソナルコンピュータなどにより、インスタンス化され得る。
クライアントとサーバとの間でネットワークを介して情報が交換され得る。このために、及びセキュリティのために、サーバ及び/またはクライアントは、ファイアウォール、ロードバランサ、テンポラリストレージ、及びプロキシ、並びに信頼性及びセキュリティのための他のネットワークインフラストラクチャを含み得る。1つ以上のサーバは、オンラインソーシャルウェブサイトなどの安全なコミュニティを、ネットワークメンバーに提供する方法を実施する装置を形成し得る。
本明細書で使用される命令は、システムにおいて情報を処理するためのコンピュータ実施ステップを指す。命令は、ソフトウェア、ファームウェア、またはハードウェアにおいて実施することができ、システムのコンポーネントにより実行される任意の種類のプログラム化されたステップを含み得る。
プロセッサは、アドレスライン、データライン、及び制御ラインなどの様々なライン、並びにレジスタ及びシフトレジスタを用いてロジックを実行することができる任意の従来の汎用単一チッププロセッサまたは汎用マルチチッププロセッサであり得る。
本明細書において、フローチャートを介して説明されるソフトウェアモジュール、及びユーザインターフェースは、様々なサブルーチン、プロシージャなどを含み得る。本開示を限定することなく、特定のモジュールにより実行されると述べられるロジックは、他のソフトウェアモジュールに再配分されてもよく、及び/または単一モジュールにおいて一緒に組み合わされてもよく、及び/または共有可能なライブラリにおいて利用可能な状態にされてもよい。
本明細書で述べられる本発明の原理は、ハードウェア、ソフトウェア、ファームウェア、またはこれらの組み合わせとして実装され得、ゆえに、例示的なコンポーネント、ブロック、モジュール、回路、及びステップは、これらの機能の観点から説明される。
下記で説明される機能及び方法は、ソフトウェアで実施される場合、Java(登録商標)、C#、またはC++などのこれに限定されない好適な言語で記述され得、コンピュータ可読記憶媒体により記憶またはコンピュータ可読記憶媒体を介して送信され得、コンピュータ可読記憶媒体の例には、ランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、電気的消去可能プログラマブル読み出し専用メモリ(EEPROM)、コンパクトディスク読み出し専用メモリ(CD−ROM)、またはデジタル多用途ディスク(DVD)などの他の光学ディスクストレージ、磁気ディスクストレージ、またはリムーバブルサムドライブを含む他の磁気ストレージデバイスなどが挙げられる。接続により、コンピュータ可読媒体が確立され得る。このような接続には、例として、光ファイバ及び同軸ワイヤを含むハードワイヤケーブル、並びにデジタル加入者線(DSL)及びツイストペア線が含まれ得る。このような接続には、赤外線及びラジオを含む無線通信接続が含まれてもよい。
一実施形態に含まれる構成要素は、他の実施形態において、任意の好適な組み合わせで使用することができる。例えば、本明細書で説明され及び/または図に描かれる様々な構成要素のいずれも、組み合わされてもよく、交換されてもよく、または他の実施形態から除外されてもよい。
「A、B、及びCのうちの少なくとも1つを有するシステム」(同様に「A、B、またはCのうちの少なくとも1つを有するシステム」及び「A、B、Cのうちの少なくとも1つを有するシステム」)には、Aのみ、Bのみ、Cのみ、AとBを一緒に、AとCを一緒に、BとCを一緒に、及び/またはAとBとCを一緒に、などを有するシステムが含まれる。
ここで具体的に図1を参照すると、本発明の原理による、上記で言及され下記でさらに説明される例示的なデバイスのうちの1つ以上を含み得る例示的なシステム10が示される。システム10に含まれる例示的なデバイスのうち初めに、TVチューナー(同等にTVを制御するセットトップボックス)を備えたインターネット対応TVなどのこれに限定されないオーディオビデオデバイス(AVD)12といった一般消費者向け電子製品(CE)デバイスが存在する。しかしながら、代替的に、AVD12は、例えばインターネット対応コンピュータ化冷蔵庫、洗濯機、または乾燥機などの電化製品または家庭用品であってもよい。また、代替的に、AVD12は、インターネット対応コンピュータ化(「スマート」)電話、タブレットコンピュータ、ノートブックコンピュータ、例えばインターネット対応コンピュータ化腕時計、インターネット対応コンピュータ化ブレスレット、他のインターネット対応コンピュータ化デバイスなどの装着可能コンピュータ化デバイス、インターネット対応コンピュータ化音楽プレーヤ、インターネット対応コンピュータ化ヘッドホン、埋め込み型皮膚デバイスなどのインターネット対応コンピュータ化埋め込み型デバイスなどであってもよい。いずれにせよ、AVD12は、本発明の原理を実施する(例えば、本発明の原理を実施するために他のCEデバイスと通信し、本明細書に説明されるロジックを実行し、本明細書に説明される任意の他の機能及び/または動作を実行する)ように構成されることを理解されたい。
従って、このような原理を実施するために、図1に示されるコンポーネントのうちのいくつかまたは全てにより、AVD12は確立され得る。例えば、AVD12は、1つ以上のディスプレイ14を含み得、これは、高解像度または超高解像度「4K」以上のフラットスクリーンが実装され得、ディスプレイ上のタッチを介してユーザ入力信号を受信するタッチ対応であり得る。AVD12は、本発明の原理に従って音声を出力するための1つ以上のスピーカ16と、例えばAVD12を制御するためにAVD12に音声コマンドを入力する、例えば音声受信器/マイクロホンなどの少なくとも1つの追加入力デバイス18と、を含み得る。例示的なAVD12はまた、1つ以上のプロセッサ24の制御下で、インターネット、WAN、LANなどの少なくとも1つのネットワーク22を介して通信するための1つ以上のネットワークインターフェース20を含み得る。グラフィックプロセッサ24Aも含まれ得る。従って、インターフェース20は、非限定的にメッシュネットワーク送受信器など、無線コンピュータネットワークインターフェースの例であるWi−Fi送受信器であり得るが、これに限定されない。プロセッサ24は、AVD12を制御して本発明の原理を実施し、これには、例えばディスプレイ14を制御してディスプレイ14上に画像を提示し、ディスプレイ14から入力を受信するなど、本明細書に説明されるAVD12の他の要素が含まれることを理解されたい。さらに、ネットワークインターフェース20は、例えば有線または無線のモデムまたはルータであり得る、あるいは、例えば無線電話送受信器、または前述のWi−Fi送受信器などの他の好適なインターフェースであり得ることに、留意されたい。
上記に加えて、AVD12はまた、別のCEデバイスに(例えば有線接続を用いて)物理的に接続するための、例えば高解像度マルチメディアインタフェース(HDMI(登録商標))ポートまたはUSBポートなどの1つ以上の入力ポート26、及び/または、ヘッドホンをAVD12に接続して、AVD12からの音声をヘッドホンを介してユーザに提供するためのヘッドホンポートを含み得る。例えば、入力ポート26は、オーディオビデオコンテンツのケーブルソースまたは衛星ソース26aに、有線または無線を介して接続され得る。従って、ソース26aは、例えば、別個のまたは統合されたセットトップボックスまたは衛星受信器であり得る。あるいは、ソース26aは、コンピュータゲームソフトウェア及びデータベースなどのコンテンツを含むゲームコンソールまたはディスクプレーヤであってもよい。ソース26aは、ゲームコンソールとして実装される場合、CEデバイス44に関連して下記で説明されるコンポーネントのうちのいくつかまたは全てを含み得る。
AVD12はさらに、一時的信号ではないディスクベースストレージまたはソリッドステートストレージなどの1つ以上のコンピュータメモリ28を含み得、これらは、いくつかの事例では、AVDのシャシー内にスタンドアロンデバイスとして、またはAVプログラムを再生するためにAVDのシャシーの内部もしくは外部のパーソナルビデオレコーディングデバイス(PVR)もしくはビデオディスクプレーヤとして、またはリムーバブルメモリ媒体として、具現化されている。また、いくつかの実施形態では、AVD12は、位置受信器すなわち所在地受信器を含み得、これは、携帯電話受信器、GPS受信器、及び/または高度計30などであるがこれらに限定されず、例えば少なくとも1つの衛星または携帯電話中継塔から地理的位置情報を受信し、情報をプロセッサ24に提供し、及び/またはプロセッサ24と連動して、AVD12が配置されている高度を特定するように構成される。しかしながら、例えば、AVD12の所在地を、例えば全3次元で特定するために、携帯電話受信器、GPS受信器、及び/または高度計以外の別の好適な位置受信器が、本発明の原理に従って使用されてもよいことを、理解されたい。
AVD12の説明を続けると、いくつかの実施形態では、AVD12は、1つ以上のカメラ32を含み得、これは、例えば熱画像カメラ、ウェブカメラなどのデジタルカメラ、及び/またはAVD12に統合されたカメラであり得、本発明の原理に従って写真/画像及び/または映像を収集するようにプロセッサ24により制御可能であり得る。本明細書で説明されるカメラのいずれも、下記でさらに説明される高スペクトルカメラの例または複数の例を使用してもよい。
また、AVD12は、ブルートゥース(登録商標)送受信器34と他の近距離無線通信(NFC)要素36とを含み得、これらは、ブルートゥース(登録商標)及び/またはNFC技術をそれぞれ使用して、他のデバイスと通信する。例示的なNFC要素は、無線周波数識別(RFID)要素であり得る。また、Zigbee(登録商標)が使用されてもよい。
さらにまた、AVD12は、プロセッサ24に入力を提供する1つ以上の補助センサ37を含み得る(例えば、加速度計、ジャイロスコープ、サイクロメータ、または磁気センサなどのモーションセンサ、赤外線(IR)センサ、光学センサ、速度及び/またはケイデンスセンサ、ジェスチャセンサ(例えばジェスチャコマンドを感知する)など)。AVD12は、地上波(OTA)TV放送を受信し、プロセッサ24に入力を提供するOTA TV放送ポート38を含み得る。前述に加えて、AVD12はまた、赤外線データ関連付け(IRDA)デバイスなどの赤外線(IR)送信器及び/またはIR受信器及び/またはIR送受信器42を含み得ることに留意されたい。AVD12に電力供給を行うために、バッテリ(図示せず)が提供され得る。
さらに図1を参照すると、AVD12に加えて、システム10は、1つ以上の他のCEデバイスタイプを含み得る。一例では、第1のCEデバイス44を使用して、AVD12に直接及び/または後述のサーバを通して送信されるコマンドを介して、AVD12にコンピュータゲームの音声及び映像が送信され得るが、第2のCEデバイス46も、第1のCEデバイス44と同様のコンポーネントを含み得る。示される例では、第2のCEデバイス46は、図示されるようにプレーヤ47が装着するVRヘッドセット、またはプレーヤ47が操作するハンドヘルドゲームコントローラとして、構成され得る。示される例では、2つのCEデバイス44、46のみが図示されるが、より少ないまたはより多いデバイスが使用されてもよいことが理解されよう。
示される例では、本発明の原理を例示するために、3つのデバイス12、44、46は全て、例えば自宅内のエンターテインメントネットワークのメンバーである、または少なくとも家屋などの場所で互いに近接して存在すると、想定される。しかしながら、本発明の原理は、明確に別段の主張がない限り、破線48で示される特定の場所に限定されない。
非限定的な例示の第1のCEデバイス44は、前述のデバイスのうちのいずれか1つ、例えば、ポータブル無線ラップトップコンピュータもしくはノートブックコンピュータ、またはゲームコントローラ(「コンソール」とも称される)により確立され得、従って、後述されるコンポーネントのうちの1つ以上を有し得る。第1のCEデバイス44は、例えば、AV再生及び一時停止コマンドをAVD12に発令するために、リモートコントロール(RC)であり得る、または第1のCEデバイス44は、タブレットコンピュータ、有線または無線リンクを介してAVD12と通信するゲームコントローラ、パーソナルコンピュータ、無線電話などのより洗練されたデバイスであり得る。
従って、第1のCEデバイス44は、ディスプレイ上のタッチを介してユーザ入力信号を受信するタッチ対応であり得る1つ以上のディスプレイ50を含み得る。第1のCEデバイス44は、本発明の原理に従って音声を出力するための1つ以上のスピーカ52と、例えば第1のCEデバイス44を制御するために第1のCEデバイス44に音声コマンドを入力する、例えば音声受信器/マイクロホンなどの少なくとも1つの追加入力デバイス54と、を含み得る。例示的な第1のCEデバイス44はまた、1つ以上のCEデバイスプロセッサ58の制御下で、ネットワーク22を介して通信するための1つ以上のネットワークインターフェース56を含み得る。グラフィックプロセッサ58Aも含まれ得る。従って、インターフェース56は、メッシュネットワークインターフェースを含む、無線コンピュータネットワークインターフェースの例であるWi−Fi送受信器であり得るが、これに限定されない。プロセッサ58は、第1のCEデバイス44を制御して本発明の原理を実施し、これには、例えばディスプレイ50を制御してディスプレイ50上に画像を提示し、ディスプレイ50から入力を受信するなど、本明細書に説明される第1のCEデバイス44の他の要素が含まれることを理解されたい。さらに、ネットワークインターフェース56は、例えば有線または無線のモデムまたはルータであり得る、あるいは、例えば無線電話送受信器、または前述のWi−Fi送受信器などの他の好適なインターフェースであり得ることに、留意されたい。
上記に加えて、第1のCEデバイス44はまた、別のCEデバイスに(例えば有線接続を用いて)物理的に接続するための、例えばHDMI(登録商標)ポートまたはUSBポートなどの1つ以上の入力ポート60、及び/または、ヘッドホンを第1のCEデバイス44に接続して、第1のCEデバイス44からの音声をヘッドホンを介してユーザに提供するためのヘッドホンポートを含み得る。第1のCEデバイス44はさらに、ディスクベースストレージまたはソリッドステートストレージなどの1つ以上の有形コンピュータ可読記憶媒体62を含み得る。また、いくつかの実施形態では、第1のCEデバイス44は、位置受信器すなわち所在地受信器を含み得、これは、携帯電話及び/またはGPS受信器及び/または高度計64などであるがこれらに限定されず、例えば、三角測量を使用して、少なくとも1つの衛星及び/または携帯電話中継塔から地理的位置情報を受信し、情報をCEデバイスプロセッサ58に提供し、及び/またはCEデバイスプロセッサ58と連動して、第1のCEデバイス44が配置されている高度を特定するように構成される。しかしながら、例えば、第1のCEデバイス44の所在地を、例えば全3次元で特定するために、携帯電話及び/またはGPS受信器及び/または高度計以外の別の好適な位置受信器が、本発明の原理に従って使用されてもよいことを、理解されたい。
第1のCEデバイス44の説明を続けると、いくつかの実施形態では、第1のCEデバイス44は、1つ以上のカメラ66を含み得、これは、例えば熱画像カメラ、ウェブカメラなどのデジタルカメラ、及び/または第1のCEデバイス44に統合されたカメラであり得、本発明の原理に従って写真/画像及び/または映像を収集するようにCEデバイスプロセッサ58により制御可能であり得る。また、第1のCEデバイス44は、ブルートゥース(登録商標)送受信器68と他の近距離無線通信(NFC)要素70を含み得、これらは、ブルートゥース(登録商標)及び/またはNFC技術をそれぞれ使用して、他のデバイスと通信する。例示的なNFC要素は、無線周波数識別(RFID)要素であり得る。
さらにまた、第1のCEデバイス44は、CEデバイスプロセッサ58に入力を提供する1つ以上の補助センサ72を含み得る(例えば、加速度計、ジャイロスコープ、サイクロメータ、または磁気センサなどのモーションセンサ、赤外線(IR)センサ、光学センサ、速度及び/またはケイデンスセンサ、ジェスチャセンサ(例えばジェスチャコマンドを感知する)など)。第1のCEデバイス44はさらに、例えば、1つ以上の気候センサ74(例えば気圧計、湿度センサ、風センサ、光センサ、温度センサなど)及び/または1つ以上の生体センサ76などの他のセンサを含み得、これらは、CEデバイスプロセッサ58に入力を提供する。前述に加えて、いくつかの実施形態では、第1のCEデバイス44はまた、赤外線データ関連付け(IRDA)デバイスなどの赤外線(IR)送信器及び/またはIR受信器及び/またはIR送受信器78を含み得ることに留意されたい。第1のCEデバイス44に電力供給を行うために、バッテリ(図示せず)が提供され得る。CEデバイス44は、前述の通信モード及び関連コンポーネントのうちのいずれかを介して、AVD12と通信し得る。
第2のCEデバイス46は、CEデバイス44に関して示されるコンポーネントのうちのいくつかまたは全てを含み得る。一方または両方のCEデバイスが、1つ以上のバッテリにより電力供給され得る。
ここで、前述の少なくとも1つのサーバ80を参照すると、これは、少なくとも1つのサーバプロセッサ82と、ディスクベースストレージまたはソリッドステートストレージなどの少なくとも1つの有形コンピュータ可読記憶媒体84と、少なくとも1つのネットワークインターフェース86とを含み、少なくとも1つのネットワークインターフェース86は、サーバプロセッサ82の制御下で、ネットワーク22を介して図1の他のデバイスと通信することを可能にし、実際に、本発明の原理に従ってサーバとクライアントデバイスとの間の通信を促進し得る。ネットワークインターフェース86は、例えば、有線もしくは無線のモデムもしくはルータ、Wi−Fi送受信器、または例えば無線電話送受信器などの他の好適なインターフェースであり得ることに、留意されたい。
従って、いくつかの実施形態では、サーバ80は、インターネットサーバまたはサーバ「ファーム」全体であり得、例えばネットワークゲームアプリケーションなどの例示的な実施形態で、システム10のデバイスがサーバ80を介して「クラウド」環境にアクセスし得るように、「クラウド」機能を含み実行し得る。あるいは、サーバ80は、図1に示される他のデバイスと同じ部屋または近くに存在する1つ以上のゲームコンソールまたは他のコンピュータにより、実施され得る。
上記で示唆されたことに加えて、後述されるロジックブロック、モジュール、及び回路は、汎用プロセッサ、デジタル信号プロセッサ(DSP)、フィールドプログラマブルゲートアレイ(FPGA)、または他のプログラマブルロジックデバイス、例えば特定用途向け集積回路(ASIC)、個別ゲートもしくはトランジスタロジック、個別ハードウェアコンポーネント、あるいは本明細書で説明される機能を実行するように設計されたこれらの任意の組み合わせにより、実装または実行され得る。プロセッサは、コントローラまたはステートマシンまたはコンピューティングデバイスの組み合わせにより、実施され得る。従って、本明細書の方法は、プロセッサにより実行されるソフトウェア命令、好適に構成された特定用途向け集積回路(ASIC)もしくはフィールドプログラマブルゲートアレイ(FPGA)モジュール、または当業者に自明の任意の他の便利な方法で、実施され得る。ソフトウェア命令が採用される場合、ソフトウェア命令は、ハードディスクドライブ、CD ROM、またはフラッシュドライブなどの非一時的デバイス内で具現化され得る。またソフトウェアコード命令は、インターネットからダウンロードされてもよい。
図2は、ハードウェア記憶デバイスと、好適なプロセッサにより実行されるソフトウェアモジュールとを含む、本発明の原理と一致する例示的なアーキテクチャ200を示す。複数のデータソース202は、実際の製品購入、ウェブページ上の滞在時間、製品ランキングなど、本明細書で「グラウンドトゥルース」と称されることもある実際の顧客インタラクションを蓄積するオフラインベンチマーク構築モジュール204に、情報を供給する。データソースには、様々な企業のコンピュータベース販売データベースが含まれ得る。この「グラウンドトゥルース」データは、コンピュータストレージ206に記憶され得る。
複数の予測モデルの各予測モデルのモデル特徴208は、対応付けられたストレージ212を有するそれぞれのオフラインバッチ予測モジュール210に供給される。モデル特徴は、予測モデルがそれぞれのモデルトレーニングプロセス214使用時に基づく命令であり、オフラインバッチ予測モジュール210は、モデルの特徴208に基づいてモデルの予測を出力するモデル実行モジュールである。
モジュール210からの予測モデル値は、対応するグラウンドトゥルースデータと共に、それぞれのオフライン確率絶対誤差(PAE)評価モジュール216に提供され、オフライン確率絶対誤差(PAE)評価モジュール216は、下記でも論述される重みを使用して加重PAE(WPAE)を出すように実施され得、加重PAE(WPAE)は、多様性または順位ベースランキングを考慮してモデルの有効性を評価し、メトリック218を出力する。PAE216の出力(メトリック218)は、オフラインクリーンアップユーティリティ220を使用して複数のモデル210の中から「最良」を特定するために使用され、オフラインクリーンアップユーティリティ220は、様々なストレージ226を介して、結果の視覚化222、並びに結果の性質及び可用性に関するアラートを提供し得る。示される例では、PAE評価モジュール216用のグラウンドトゥルースデータをクリーンアップするために、対応付けられたストレージ230を有するベンチマーククリーンアップユーティリティ228も提供され得る。本明細書に説明されるストレージは、分散され得る。
図3及び図4は、確率絶対誤差(PAE)を、複数の予測モデル及び加重PAE(WPAE)から特定するための例示的なロジックを、それぞれ示す。一般に、ユーザアイテム関連性モデルは、ユーザu及びアイテムiごとに、アイテムがユーザにどのように関連するかを測定する関連性スコア「s」が存在するように、関連性関数 をモデル化することを目的とすると、想定される。
「アイテム」の例には、コンピュータゲームなどのコンピュータシミュレーション、デスクトップテーマ、アバター、アドオン、及び仮想通過などのダウンロード可能コンテンツ(DLC)、バンドル、デモンストレーションビデオもしくは他のデモンストレーションコンテンツ、「新着情報」ニュースフィード、友達、人々、コミュニティのストーリー、並びにユーザ生成コンテンツ(UGC)、例えばUGCビデオ、UGCブロードキャスト、及びUGC画像などが、含まれ得る。
上記を考慮して、PAEは、次のように導入される。
Uはユーザの集合であり、|U|はユーザの総数であり、uは任意の単一ユーザを表し、iは任意の単一アイテムを表す。Iは、ユーザuがインタラクションを行った実際のポジティブアイテムi、すなわちアイテムとの実際のユーザインタラクションから記録されたグラウンドトゥルースを含む。Pu,iは、アイテムiに対するユーザuの実際の正規化されたインタラクションスコアを表し、例えば、購入イベントの場合は1または0(1=購入、0=未購入)であり、ページに費やした時間の場合は1または9(後で数値0.1及び0.9に正規化される)などである。同様に、P^u,iは、ユーザu及びアイテムiに関するテスト対象モデルの予測スコアである。正規化の制約により、ユーザuごとに、ユーザがインタラクションを行った全てのアイテムに関して、スコアが合計1となるようにする。言い換えると、次のように表される。
ロジックは、データ集合内のユーザごとにブロック300から始まり、ブロック302へ進み、ユーザがインタラクションを行う(または行わない)と予測される各アイテムに対して、後続のステップを実行する。ブロック303へ進むと、予測インタラクション数値及び実インタラクション数値が、前述の正規化制約に確実に従うように、正規化プロセスが実行される。ブロック304にて、上記の方程式に示されるように、テスト対象アイテムとのユーザの正規化予測インタラクションと正規化実インタラクションとの絶対差が特定される。判定菱形306にて、テスト対象アイテムが最後のアイテムではないと判定された場合、ロジックはブロック308へ進み、次のアイテム、すなわちテスト対象ユーザの次のアイテムの予測インタラクション及び実インタラクションを取得し、ブロック304へ戻り、説明されたように進む。
一方、ステート306にて、テスト対象ユーザに関して最後のアイテムが処理されたという判定に応じて、ロジックはブロック310へ進み、そのユーザに関して、ブロック304にて特定された絶対差を合計する。次にロジックは、ステート312にて、テスト対象ユーザが最後の処理対象ユーザであるか否かを判定し、そうでない場合、ロジックは、ブロック314へ進み、次のユーザに対応付けられたデータを取得し、ブロック302に戻り、前述の動作を実行する。
対照的に、ステート312にて最後のユーザのインタラクション情報が処理されたという判定に応じて、ロジックは、ブロック316へ進み、ブロック310の反復からユーザ合計を合計する。ユーザ合計の合計は、ユーザの総数により割られて、テスト対象モデルのPAEが出され、これはブロック318に出力される。プロセスは、評価が求められる全ての予測モデルに対し繰り返され、最小のPAEを有するモデルは「最良モデル」と示され、ブロック320にて、電子商取引または他の用途に使用される。
上記で論じられた正規化により、PAEは、本明細書で「オラクル」と称されることもある完璧モデルである値0と、何も正しく予測しない過誤モデルである値2との間の任意の値であり得ることに、留意されたい。
非限定的な例として、「最良」モデルを使用して、特定のユーザが購入し得る製品を予測し得ることで、そのユーザを対象にその製品の広告を行うことができる。あるいは、「最良」モデルを使用して、ユーザが製品のリストをどのようにランク付けするかを予測し得ることで、そのユーザを対象にリスト上位の製品の広告を行い、リスト下位の製品の広告はそのユーザには行わないようにすることができる。あるいは、「最良」モデルを使用して、ユーザが特定のウェブページに滞在する時間の長さを予測し得ることで、ユーザが比較的長い時間滞在するとモデルが予測するウェブページ上に、対象となる広告を提示することができる。
図4を導入するにあたって、いくつかの特別な事例でPAEを適用する時に、実際のデータ分布が非常に人気のある特定のアイテムに偏って表れる場合、PAEもそのように偏り得ると、本発明の原理は認識している。本発明の原理は、人気の低いアイテムを正しく予測する事例をより大きい割合で報奨することが望ましいという意味では、多様性を報奨するメトリックを求めている。言い換えると、より人気のあるアイテムの正しい予測は、単調変換に従って減値される。特別な事例の他の例には、順位ベースランキングが含まれ、より高いランクの正しい予測は、順位ベース変換に従って報奨される。
上記を念頭に置いて、加重PAW(WPAE)は、次のように導入される。
ここで、I^は予測を含み、Iはユーザuがインタラクションを行った実際のポジティブアイテムiを含み、wは、このようなアイテムiに関連する減値された重みであり、グラウンドトゥルースから計算され、減値が実行されない場合は1であり得、あるいは、任意の単調変換、例えばアイテム頻度に関連した減値、頻度の平方根割る頻度(√freq/freq)またはlog(freq)freqであり得る。順位ベースランキングの例では、重みは、例えばN位であり得、Nは、考慮対象となる上位N個の予測を示し、位は、特定のアイテムのランキング順位である。
「オラクル」(すなわち的確なグラウンドトゥルースを知る完璧モデル)の場合、常にWPAE=0となる。事実から完全に外れたモデルの場合、常にWPAE=2となる。図4に、さらに例示される。ブロック400から始まり、図3のステート304〜310で示された方法と同じ方法で、個々のユーザ合計が取得される。ブロック402へ進むと、ユーザ合計ごとに、各予測インタラクションに重み付けが行われて、加重予測インタラクションが生成され、加重予測インタラクションが合計されて、加重アイテム合計が生成される。ブロック404に進むと、各ユーザ合計に加重アイテム合計を掛けて、ユーザ合計積が生成され、全てのユーザのユーザ合計積が、ブロック406で合計される。ブロック406での合計は、テスト対象モデルのWPAEを確立するために、ブロック408にて次のように処理される:モデルが対象アイテムはネガティブではない(例えばユーザはこのアイテムを購入する/読む/クリックする/検討する)と予測した各アイテムに関して、重みw_I*予測確率p_u,Iの値が計算される。最後に、対象ユーザごとに、全アイテムにわたり合計し、次に全ユーザにわたり合計を合計する。
実施例1
例として、頻度70%のアイテム1と、頻度30%のアイテム2という、2つのアイテムがあると仮定する。ユーザ1〜7は、アイテム1を購入し、ユーザ8〜10は、アイテム2を購入した。
全てのアイテム1を予測する単純モデルは、7回正しく予測し、3回誤って予測する。7回のうち、ユーザごとの予測とグラウンドトゥルースとの個別誤差は0であり、3回のうち、ユーザごとの個別誤差は2である。
減値なしでは、w1=1、w2=1である。各ユーザは1つのアイテムのみを購入したので、予測インタラクションは、全u、iに関して、u∈1、2、i∈1、・・・、10である。次にWPAEは、1/((1x7)+(1x3))x(1x7x0+1x3x2)=0.60となる(重みの適用なし)。
ここで、√freq/freqが減値重みとして使用される場合、w=√7/7=0.37であり、w=√3/3=0.57である。再び、この実施例では、各ユーザは1つのアイテムのみを購入するため、新しいWPAEは、次の通りである。
1/(0.37*7+0.57*3)x(0.37*7*0+0.57*3*2)=0.79
別のモデルは、アイテム1を7回のうち6回正しく予測し、アイテム2を3回のうち1回正しく予測し、次のような結果となる。
WPAE=1/(1*7+1*3)x(1*1*2+1*2*2)=0.60(均等な重み付け)
及び
WPAE=1/(0.37*7+0.57*3)x(0.37*1*2+0.57*2*2)=0.70(不均等な重み付け)
さらに別のモデルは、アイテム1を7回のうち4回正しく予測し、アイテム2を3回のうち3回正しく予測し、次のような結果となる。
WPAE=1/(1*7+1*3)x(3*1*2+0*1*0)=0.60(重み付けなし)
WPAE=1/(0.37*7+0.57*3)x(0.37*3*2+0.57*1*0)=0.51(重み付けあり)
完全失敗モデルは、アイテム1を7回のうち0回正しく予測し、アイテム2を3回のうち0回正しく予測し、次のような結果となる。
WPAE=1/(1*7+1*3)x(7*1*2+3*1*2)=2(重み付けなし)
WPAE=1/(0.37*7+0.57*3)x(0.37*7*2+0.57*3*2)=2(重み付けあり)
実施例2
この実施例では、ユーザが複数のアイテムを購入する事例を扱う。前の実施例と同様に、2つのアイテムがあると仮定する。前の実施例と異なる点は、ユーザ1〜6はアイテム1を購入し、ユーザ7〜9はアイテム2を購入し、ユーザ10は両アイテムを同等に購入したと想定される。ここで、11件の購入があり、アイテム1は7回購入され、アイテム2は4回購入されている。この区別は、下記に示されるように、減値係数を計算する時に重要である。
全てのアイテム1を予測する単純モデルは、6回正解し、1回部分的に正解する。6回のうち、ユーザごとの予測と実際との個別誤差は0であり、3回のうち、ユーザごとの個別誤差は2であり、1回のうち、ユーザごとの個別誤差は|0.5−1|+|0.5−0|=1である。この事例では、WPAE=1/(1*7+1*3)x(1*6*0+1*3*2+1*1*1)=0.7である。
ここで、加重減値では、減値された重みを知っている必要がある。アイテム1のwは、√7/7=0.378であり、アイテム2のwは、√4/4=0.5である。両アイテムを等しく購入したユーザ10の場合、このモデルはユーザ10のアイテム1を予測したため、WPAEは、|0.5−1|+|0.5−0|=1である。さらに、ユーザ10の減値係数は、このユーザのIの加重実インタラクションfの合計であるため、=0.379 0.5+0.5 0.5=0.439である。この減値係数は、定義に従って、複数の箇所で考慮される必要がある。
WPAE=1/(0.378*6+0.5*3+0.439)x(0.378*6*0+0.5*3*2+0.439*1*1)=0.81
完全失敗モデルは、アイテム1を6回のうち0回正しく予測し、アイテム2を3回のうち0回正しく予測し、ユーザ10に関しては、全ての回を誤って予測している(例示の便宜上、完全失敗モデルは、ユーザ10に関して別のアイテム、例えばアイテム3を予測したと想定することができる)。
WPAE=1/(1*7+1*3)x(1*6*2+1*3*2+1*1*2)=2
そして、この加重WPAEは、最高可能スコアである2に留まる。
WPAE=1/(0.37*7+0.57*2+0.47)x(0.37*6*2+0.57*3*2+0.47*1*2)=2
実施例3
ここで、4つのアイテムと2人のみのユーザを想定する。4つのアイテムのアイテム頻度は、4、3、2、1である。freqの平方根/freqの減値変換を使用して、減値係数が表に示される。次の表は、グラウンドトゥルースと、異なる予測の4つのモデルとを示す。
ユーザ1
頻度 4 3 2 1
減値w 0.5 0.6 0.7 1
アイテム i1 i2 i3 i4
ユーザ1 事実 0.5 0.5 0 0
モデル1 0 0 0 0
モデル2 0.6 0.4 0 0
モデル3 0.2 0.2 0.5 0.1
モデル4 0 0 0 1
ユーザ2
頻度 4 3 2 1
減値w 0.5 0.6 0.7 1
アイテム i1 i2 i3 i4
ユーザ2 事実 1 0 0 0
モデル1 1 0 0 0
モデル2 0.6 0.4 0 0
モデル3 0.2 0.2 0.5 0.1
モデル4 0 0 0 1
全てのモデルで、ユーザ1は、アイテム掛ける加重グラウンドトゥルースの合計=0.5*0.5+0.6*0.5=0.55であり、ユーザ2は、0.5*1+0.5=1であり、ユーザ2のPAEは、1−1+0=0であり、WPAE=1/(0.5+0.55)x(0.55*1+0.5*0)=0.52である。
モデル2では、ユーザ1のPAEは、0.6−0.5+0.5−0.4=0.2であり、ユーザ2のPAEは、1−0.6+0.4=0.8である。この事例のWPAEは、WPAE=1/(0.5+0.55)x(0.55*0.2+0.5*0.8)=0.48である。減値係数を加えない場合、モデル1とモデル2は、全く同じ全体のPAEを有することに留意されたい。ここで、アイテム2(i2)を正しく予測したことに対して、減値による小さい報奨が与えられる。
モデル3の場合、ユーザ1のPAEは、0.5−0.2+0.5−0.2+0.5+0.1=0.3+0.3+(1−0.4)=1.2である。ユーザ2のPAEは、1−0.2+0.2+0.5+0.1=1−0.2+(1−0.2)=1.6である。この事例のWPAEは、WPAE=1/(0.5+0.55)x(0.55*1.2+0.5*1.6)=1.39である。
モデル4では、ユーザ1のPAEは、0.5+0.5+1=2であり、ユーザ2のPAEは、1−0+1−0=2である。この事例のWPAEは、WPAE=1/(0.5+0.55)x(0.55*2+0.5*2)=2である。
図5は、ユーザを、グラウンドトゥルースインタラクション(すなわちアイテム)とインタラクションのスコアとに関連付けるデータ構造を示し、示される例では、「1」は、ユーザがアイテムにインタラクションを行ったこと(インタラクションを行わないことと対照的に)を意味する。図6は、ユーザインタラクションのモデル予測のデータ構造を示し、示される例では、0.8である。通常、各ユーザは、多数のインタラクション(アイテム)と、対応するグラウンドトゥルースと、予測スコアとに対応付けられ、各モデルは、多数のユーザに対応付けられる。図5及び図6は、基本的に、PAE及びWPAEに関する上記の等式の入力値を示す。
図7及び8はそれぞれ、単一のポジティブアイテムシナリオに関して、全アイテムにわたり実際すなわちグラウンドトゥルースの結果702を完璧に予測した(PAE=0)図7の楕円700で示される完璧(「オラクル」)モデルと、全アイテムにわたり実際すなわちグラウンドトゥルースの結果702を全く予測しなかった(PAE=2)図8の楕円800で示される完全過誤モデルとを示す。完全ランダムモデル704は、全アイテムに関して同じ確率を予測することに留意されたい。さらに、図では正規化が示され、全アイテムの全値の合計は1に等しく、省略記号706が存在するが、説明を明確にするために、表示の値は合計すると1となるように示され、省略記号706は、表示よりも多くのアイテムが通常分析されることを示すためにのみ使用されていることに、留意されたい。図9は、楕円900の中に、PAEが1の平均モデルを示す。
図10〜図13はそれぞれ、複数のポジティブアイテムに関する、完璧モデル1000(図10)、優良モデル1100(図11)、一致モデル1200(図12)、及び過誤モデル1300(図13)を示す。
図14及び図15は、特定のモデルに関して、PAEとWPAEとの測定の差を例示し、一方図16は、完全過誤モデルに関して、PAE及びWPAEの両方が同じ値を示すことを例示する。図14では、2つのモデル、モデル1及びモデル2が、示される条件で同じPAEを出すが、WPAEは異なっており、これは、ユーザ1と比較してユーザ2は、行1400で示されるようにグラウンドトゥルースの統計がより偏っており、残りの統計は両ユーザとも4つのアイテム全てに関して同じであることに、起因する。図15は、PAEとWPAEの違いが付随する精度の低いモデル(モデル3)の同じ統計を例示する。図16は、完全過誤モデル(モデル4)に関して、両測定(PAE及びWPAE)が完全な失敗を示す同じ値であることを示す。
本明細書の他の箇所で本発明の原理を使用して記された利点に加えて、または利点の増幅で、PAEは、ドメインの詳細を有利に取り除き、評価のみに集中する一貫性があり柔軟なメトリックを提供する。評価されたモデルは、ドメイン知識またはモデル特有情報を正規化に組み込むことができる(例えば上位20または30を使用して、スコアの信頼度を高める)。グラウンドトゥルースは、ビジネス知識を念頭に置いて(例えば再生時間、購入数、獲得収益などの数値の処理;返金、否定的なレビューなどの否定的な値の処理方法)、正規化され得る。0が完全一致で2が完全不一致である[0、2]の固定範囲により、PAEはより低いスコアの時により良いモデルを意味することが、簡単に理解することができる。PAEは、高いランキング力を有するモデルを報奨し、ランキングの代理として確率を正規化する。ポジティブサンプルに関してより高い確率を予測するモデルは、スコアが高くなる。
WPAEに関して、実際のデータが歪んでいる場合、評価は当然、歪みを活用するモデルを報奨し得ることに留意されたい。例えば、1つのゲーム(500ゲーム中)が合計購入の17%を占める場合、この1つのゲームを単純に予測すると、PAEは比較的低くなる。多様性及びカバレッジを与える「ロングテール」の予測に優れたモデルを報奨するために、一貫性があり柔軟性のあるWPAEが提供され、その理由は、WPAEが、幅広いスコアに適用可能であり、データ及びモデルの正規化にドメイン知識を組み込む柔軟性を有するからである。WPAEはまた、データの自然な分布の実施と多様性の奨励との間でバランスを取る柔軟性も有し、PAEと同様に、伝達と理解が簡単である。
本発明の原理は、いくつかの例示的な実施形態を参照して説明されたが、これらは限定を意図するものではなく、本明細書で請求される主題を実施するために、様々な代替的構成が使用されてもよいことは、理解されよう。

Claims (20)

  1. 一時的信号ではなく、かつ命令を含む少なくとも1つのコンピュータストレージを備えるデバイスであって、
    前記命令は、少なくとも1つのプロセッサにより、
    第1のモデルに関して、
    ユーザとアイテムとの複数の集合の集合ごとに、前記アイテムとのユーザインタラクションのモデル予測を表す第1の値と、前記アイテムとの実際のユーザインタラクションを表す第2の値との絶対差を特定することであって、各ユーザの前記第1の値は、前記第1の値の合計が1となるように正規化され、各ユーザの前記第2の値は、前記第2の値の合計が1となるように正規化される、前記特定することと、
    多数のユーザのユーザごとに、複数のアイテムの特定された前記絶対差を合計してユーザ合計を出すことと、
    前記ユーザ合計を合計して、総計を出すことと、
    前記総計をユーザ数で割って確率絶対誤差(PAE)を出すことと、
    少なくとも第2のモデルのPAEを特定することと、
    前記第1のモデルが前記第2のモデルより低いPAEを有する場合、前記第1のモデルをより良いモデルとして出力し、そうでない場合には、前記第2のモデルを前記より良いモデルとして出力することであって、少なくとも、各ユーザの前記第2の値は、前記第2の値の合計が1となるように正規化される、前記出力することと、
    電子商取引を提供する際に、前記より良いモデルを使用することと、
    を実行可能である、
    デバイス。
  2. 前記少なくとも1つのプロセッサを備える、請求項1に記載のデバイス。
  3. 各ユーザの前記第1の値は、前記第1の値の合計が1となるように正規化される、請求項1に記載のデバイス。
  4. 前記命令は、
    前記ユーザ合計を合計する前に、少なくともいくつかのユーザ合計に、前記アイテムとの前記実際のユーザインタラクションを表す加重された第2の値の合計を掛けて、加重されたユーザ合計を出すことと、
    前記加重されたユーザ合計を合計して、加重ユーザ合計を出すことと、
    を実行可能である、請求項1に記載のデバイス。
  5. 前記命令は、
    前記加重ユーザ合計を、全ユーザにわたる前記加重された第2の値の合計で割って、加重PAE(WPAE)を出すこと
    を実行可能である、請求項4に記載のデバイス。
  6. 前記命令は、
    前記第1のモデルが前記第2のモデルより低いWPAEを有する場合、前記第1のモデルをより良いモデルとして出力し、そうでない場合には、前記第2のモデルを前記より良いモデルとして出力することと、
    電子商取引を提供する際に、前記より良いモデルを使用することと、
    を実行可能である、請求項5に記載のデバイス。
  7. 前記命令を実行する前記少なくとも1つのプロセッサを備える、請求項2に記載のデバイス。
  8. コンピュータ実施方法であって、
    電子商取引及びコンピュータシミュレーションの目的に有用な複数のエンゲージメント関連性モデルを受け取ることと、
    少なくとも1つのメトリックを予測するのにどれがより良いモデルであるかを特定するために、グラウンドトゥルースに対して前記複数のモデルの予測をオフラインで評価することと、
    を含み、
    前記評価することは、
    多数のユーザのユーザごとにグラウンドトゥルースとモデル予測との絶対誤差を合計することと、
    全予測統計の前記合計が1となるように正規化することと、
    を含む、
    方法。
  9. 不均衡な人気を有するアイテムに対する偏りを考慮して評価の歪みを低減させるために、重みを適用すること
    を含む、請求項8に記載の方法。
  10. 前記メトリックは、購入される可能性のある少なくとも1つの製品を含む、請求項8に記載の方法。
  11. 前記メトリックは、ユーザがウェブページに留まる少なくとも1つの期間を含む、請求項8に記載の方法。
  12. 前記メトリックは、少なくとも1つの製品ランキングを含む、請求項8に記載の方法。
  13. 前記メトリックは、少なくとも1つのサービスランキングを含む、請求項8に記載の方法。
  14. 少なくとも1つのプロセッサと、
    前記プロセッサによりアクセス可能であり、かつ命令を含む少なくとも1つのコンピュータストレージと、
    を備える装置であって、
    前記命令は、前記プロセッサにより、
    第1のモデルに関して、0以上2以下の値を有する第1の確率絶対誤差(PAE)を特定することと、
    第2のモデルに関して、0以上2以下の値を有する第2のPAEを特定することと、
    前記第1のPAEが前記第2のPAEより小さいことに応じて、前記第1のモデルを使用して電子商取引におけるユーザインタラクションを予測することと、
    前記第1のPAEが前記第2のPAEより大きいことに応じて、前記第2のモデルを使用して電子商取引におけるユーザインタラクションを予測することと、
    を実行可能である、
    装置。
  15. 前記第1のPAEは、次式
    のように特定される請求項14に記載の装置。
  16. 前記命令は、
    ユーザとアイテムとの複数の集合の集合ごとに、前記アイテムとのユーザインタラクションのモデル予測を表す第1の値と、前記アイテムとの実際のユーザインタラクションを表す第2の値との絶対差を特定することであって、各ユーザの前記第1の値は、前記第1の値の合計が1となるように正規化され、各ユーザの前記第2の値は、前記第2の値の合計が1となるように正規化される、前記ユーザとアイテムとの複数の集合の集合ごとに、前記絶対差を特定することと、
    多数のユーザのユーザごとに、複数のアイテムの特定された前記絶対差を合計してユーザ合計を出すことと、
    前記ユーザ合計を合計して、総計を出すことと、
    前記総計をユーザ数で割って前記第1のPAEを出すことであって、少なくとも前記第1の値は、合計して1となるように正規化される、前記第1のPAEを出すことと、
    を実行可能である、請求項14に記載の装置。
  17. 前記命令は、
    前記ユーザ合計を合計する前に、少なくともいくつかのユーザ合計に、前記アイテムとの前記実際のユーザインタラクションを表す加重された第2の値の合計を掛けて、加重されたユーザ合計を出すことと、
    前記加重されたユーザ合計を合計して、加重ユーザ合計を出すことと、
    を実行可能である、請求項16に記載の装置。
  18. 前記命令は、
    前記加重ユーザ合計を、全ユーザにわたる前記加重された第2の値の合計で割って、加重PAE(WPAE)を出すこと
    を実行可能である、請求項17に記載の装置。
  19. 前記命令は、
    前記第1のモデルが前記第2のモデルより低いWPAEを有する場合、前記第1のモデルをより良いモデルとして出力し、そうでない場合には、前記第2のモデルを前記より良いモデルとして出力することと、
    電子商取引を提供する際に、前記より良いモデルを使用することと、
    を実行可能である、請求項17に記載の装置。
  20. 前記命令は、次式
    を使用してWPAEを特定することを実行可能である、請求項18に記載の装置。
JP2020093258A 2019-05-28 2020-05-28 エンゲージメント関連性モデルのオフライン評価メトリック Active JP6963653B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US16/424,193 2019-05-28
US16/424,193 US20200380536A1 (en) 2019-05-28 2019-05-28 Engagement relevance model offline evaluation metric

Publications (2)

Publication Number Publication Date
JP2020194545A true JP2020194545A (ja) 2020-12-03
JP6963653B2 JP6963653B2 (ja) 2021-11-10

Family

ID=70736759

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020093258A Active JP6963653B2 (ja) 2019-05-28 2020-05-28 エンゲージメント関連性モデルのオフライン評価メトリック

Country Status (4)

Country Link
US (1) US20200380536A1 (ja)
EP (1) EP3745341A1 (ja)
JP (1) JP6963653B2 (ja)
CN (1) CN112016952A (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007241605A (ja) * 2006-03-08 2007-09-20 Hitachi East Japan Solutions Ltd 需要予測支援システム、需要予測支援方法および需要予測支援プログラム
KR20110023748A (ko) * 2009-08-31 2011-03-08 액센처 글로벌 서비스 게엠베하 적응적 분석 다차원 프로세싱 시스템
JP6147949B1 (ja) * 2016-03-24 2017-06-14 楽天株式会社 情報処理システム、情報処理方法、及び情報処理プログラム
US20180330261A1 (en) * 2017-05-15 2018-11-15 OpenGov, Inc. Auto-selection of hierarchically-related near-term forecasting models
WO2019065610A1 (ja) * 2017-09-29 2019-04-04 日本電気株式会社 情報処理装置、制御方法、及びプログラム

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10872322B2 (en) * 2008-03-21 2020-12-22 Dressbot, Inc. System and method for collaborative shopping, business and entertainment
US10366346B2 (en) * 2014-05-23 2019-07-30 DataRobot, Inc. Systems and techniques for determining the predictive value of a feature
US10127573B2 (en) * 2015-11-13 2018-11-13 Facebook, Inc. Framework for evaluating targeting models
US10810638B2 (en) * 2016-06-24 2020-10-20 Benjamin Yeung Network based platform structure for collecting user activity data and capitalizing user activities
US11651237B2 (en) * 2016-09-30 2023-05-16 Salesforce, Inc. Predicting aggregate value of objects representing potential transactions based on potential transactions expected to be created
US10915945B2 (en) * 2017-08-30 2021-02-09 Sony Interactive Entertainment LLC Method and apparatuses for intelligent TV startup based on consumer behavior and real time content availability
US11351453B2 (en) * 2017-09-12 2022-06-07 Sony Interactive Entertainment LLC Attention-based AI determination of player choices
US10264315B2 (en) * 2017-09-13 2019-04-16 Bby Solutions, Inc. Streaming events modeling for information ranking
US20190143221A1 (en) * 2017-11-15 2019-05-16 Sony Interactive Entertainment America Llc Generation and customization of personalized avatars

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007241605A (ja) * 2006-03-08 2007-09-20 Hitachi East Japan Solutions Ltd 需要予測支援システム、需要予測支援方法および需要予測支援プログラム
KR20110023748A (ko) * 2009-08-31 2011-03-08 액센처 글로벌 서비스 게엠베하 적응적 분석 다차원 프로세싱 시스템
JP6147949B1 (ja) * 2016-03-24 2017-06-14 楽天株式会社 情報処理システム、情報処理方法、及び情報処理プログラム
US20180330261A1 (en) * 2017-05-15 2018-11-15 OpenGov, Inc. Auto-selection of hierarchically-related near-term forecasting models
WO2019065610A1 (ja) * 2017-09-29 2019-04-04 日本電気株式会社 情報処理装置、制御方法、及びプログラム

Also Published As

Publication number Publication date
CN112016952A (zh) 2020-12-01
EP3745341A1 (en) 2020-12-02
JP6963653B2 (ja) 2021-11-10
US20200380536A1 (en) 2020-12-03

Similar Documents

Publication Publication Date Title
TWI718422B (zh) 對模型預測值進行融合的方法、裝置和設備
US8868689B1 (en) Device configuration based content selection
US20180268306A1 (en) Using Different Data Sources for a Predictive Model
US10594814B2 (en) Information pushing method, apparatus, and system
US11250322B2 (en) Self-healing machine learning system for transformed data
US20190268427A1 (en) Multi computing device network based conversion determination based on computer network traffic
US11875241B2 (en) Aspect pre-selection using machine learning
US20190373331A1 (en) Multi-content recommendation system combining user model, item model and real time signals
CN108629608A (zh) 用户数据处理方法及装置
US11410111B1 (en) Generating predicted values based on data analysis using machine learning
CN116910373B (zh) 房源推荐方法、装置、电子设备及存储介质
US20160148253A1 (en) Temporal Dynamics in Display Advertising Prediction
KR102416421B1 (ko) 터치 패드 입력을 갖는 게임 컨트롤러
KR102385393B1 (ko) 비교 뷰 내의 상이한 액션 사용자 인터페이스 컴포넌트
US20180341710A1 (en) Heterogeneous social networking
JP6963653B2 (ja) エンゲージメント関連性モデルのオフライン評価メトリック
US20140108290A1 (en) Merchant influence scoring
US20170213236A1 (en) Estimation of Causal Impact of Digital Marketing Content
KR20210051349A (ko) 전자장치 및 그 제어방법
US20210374624A1 (en) Electronic apparatus and method of controlling the same
CN114430504A (zh) 一种媒体内容的推荐方法以及相关装置
TW202133093A (zh) 即時通訊應用程式內容評價方法、系統以及電腦可讀取記錄媒體
US20220358522A1 (en) Artificial-intelligence-based orchestration
US20220286361A1 (en) Methods and apparatus to perform computer-based community detection in a network
US20210382806A1 (en) Electronic apparatus and control method thereof

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200528

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210528

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210608

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210901

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211012

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211015

R150 Certificate of patent or registration of utility model

Ref document number: 6963653

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150