JP7440703B2 - 情報処理装置、情報処理方法、プログラム、および学習モデル - Google Patents
情報処理装置、情報処理方法、プログラム、および学習モデル Download PDFInfo
- Publication number
- JP7440703B2 JP7440703B2 JP2023501077A JP2023501077A JP7440703B2 JP 7440703 B2 JP7440703 B2 JP 7440703B2 JP 2023501077 A JP2023501077 A JP 2023501077A JP 2023501077 A JP2023501077 A JP 2023501077A JP 7440703 B2 JP7440703 B2 JP 7440703B2
- Authority
- JP
- Japan
- Prior art keywords
- similarity
- content
- information processing
- user
- users
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000010365 information processing Effects 0.000 title claims description 75
- 238000003672 processing method Methods 0.000 title claims description 8
- 238000000034 method Methods 0.000 claims description 46
- 238000009826 distribution Methods 0.000 claims description 45
- 230000008569 process Effects 0.000 claims description 34
- 238000012545 processing Methods 0.000 claims description 28
- 238000009795 derivation Methods 0.000 claims description 6
- 230000006870 function Effects 0.000 description 13
- 238000004891 communication Methods 0.000 description 12
- 238000012546 transfer Methods 0.000 description 10
- 238000005070 sampling Methods 0.000 description 9
- 230000006399 behavior Effects 0.000 description 8
- 230000001186 cumulative effect Effects 0.000 description 7
- 230000009471 action Effects 0.000 description 6
- 230000008859 change Effects 0.000 description 4
- 238000005315 distribution function Methods 0.000 description 3
- 239000004973 liquid crystal related substance Substances 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 230000002787 reinforcement Effects 0.000 description 3
- 238000001914 filtration Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- FFBHFFJDDLITSX-UHFFFAOYSA-N benzyl N-[2-hydroxy-4-(3-oxomorpholin-4-yl)phenyl]carbamate Chemical compound OC1=C(NC(=O)OCC2=CC=CC=C2)C=CC(=C1)N1CCOCC1=O FFBHFFJDDLITSX-UHFFFAOYSA-N 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0242—Determining effectiveness of advertisements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0276—Advertisement creation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0277—Online advertisement
Landscapes
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
図1に、本実施形態による情報処理システムの構成例を示す。本情報処理システムは、その一例として、図1に示すように、情報処理装置10と、任意の複数のユーザ1~Mにより使用される複数のユーザ装置11-1~11-M(M>1)とを含んで構成される。なお、以下の説明において、特に説明がない限り、ユーザ装置11-1~11-Mをユーザ装置11と総称しうる。また、以下の説明において、ユーザ装置とユーザという語は同義に使用されうる。
なお、ユーザ装置11は、図1に示すような形態のデバイスに限らず、デスクトップ型のPC(Personal Computer)や、ノート型のPCといったデバイスであってもよい。その場合、ユーザ1~Mによる操作は、マウスやキーボードといった入力装置を用いて行われうる。また、ユーザ装置11は、表示面を別に備えてもよい。
情報処理装置10は、ユーザ装置11-1~11Mのユーザ1~Mのそれぞれの属性(属性を表す情報)を、ユーザ特徴として取得することができる。また、情報処理装置10は、提供する広告に関する複数の特徴を、広告特徴として取得することができる。情報処理装置10は、取得したユーザ特徴と広告特徴を用いて、後述する学習モデルのアルゴリズムを実行し、ユーザ装置11-1~11-Mのうちの任意の1つ以上のユーザ装置に適した広告を決定して、当該任意の1つ以上のユーザ装置に提供する。当該学習モデルと当該学習モデルを用いた処理については、後述する。
コンテンツ特徴取得部102は、過去にユーザに提供したコンテンツだけでなく、将来に提供予定のコンテンツのコンテンツ特徴も取得可能に構成される。
次に、本実施形態による学習モデルのアルゴリズムについて説明する。本実施形態による学習モデルは、バンディットアルゴリズム(Bandit Algorithm)のためのモデルである。バンディットアルゴリズムは、強化学習(Reinforcement Learning)のアルゴリズムとして知られており、累積報酬を最大化することを目的としている。具体的には、バンディットアルゴリズムは、アームに対する活用(Exploitation)と探索(Exploration)のバランス(活用と探索の割合)を調節することにより、期待報酬を最大にするようにアームを引くことを目的としている。なお、強化学習の分野では、アームは、一般的にはアクションと呼ばれ、以下の説明においてもアクションという用語を用いる。
と、時間ステップtでのソースsにおける広告特徴:
を、観察する。
そして、ユーザは、時間ステップtでのソースsにおける広告:
を見て、それによる報酬(reward)
を観察する。当該報酬は、ユーザit sが広告at sをクリックしたかどうか(広告に対するクリックの有無)を示す、暗黙的な(implicit)報酬を表す。
よって、全体の観察は、
として示される。
なお、当該報酬は、広告をクリックし、かつ、コンバージョン(商品購入や資料請求といった最終成果)に至ったかを示す指標に対応するように構成されてもよい。
を最大化するときに表示する広告at sを決定することを目的としている。ここで、Tは、時間ステップtが取りうる最大値である。累積報酬期待値の最大化は、ユーザiの総リグレットを最小化するものとして、式(1)のように表すことができる。
から、広告を取り出すポリシーを学習するモデルである。また、本実施形態による学習モデルは、ソース間の接続を利用して、ソース間(すなわち、広告間)とユーザ間のそれぞれにおいて、知識を転移させる。これにより、当該ポリシーは、より一般化されたユーザの挙動(behavior)を認識することになる。本実施形態による学習モデルは、ソース間とユーザ間とで、知識としての報酬を転移させる。報酬の転移の度合い(degree)は、一方のオブジェクトの特徴と、対象(target)としての他方のオブジェクトの特徴との類似度に基づく。
ベータ分布関数は、式(3)のように表すことができる。
まず、時間ステップtでの対象のユーザiと対象の広告kに対する事前推定のための正報酬(α)と負報酬(β)を表すパラメータを、以下の式(4)のように定式化する。
したがって、ユーザ間の類似度と広告間の類似度に基づいて、報酬を転移させる。また、ユーザの好みは時間とともに変化しうるものであるから、累積正報酬sil(t)に割引率γを導入し、ユーザの最近の挙動からの報酬に、高い値を与えることができる。本実施形態では、上記(4)、(5A)、(5B)式で示したように、対象のユーザiによる他の広告lに対する実行処理(広告表示)で得られた報酬と、他のユーザjによる対象の広告kに対する実行処理の報酬を、時間の経過によって割引き(あるいは逓減)する。そして、これらの割引き後の報酬を用いて事前分布が推定される。なお、割引率の設定はオプションであってもよい。
本実施形態では、式(4)の事前知識を用いて、事後ベータ分布のパラメータを式(6)のように定式化する。
である。
また、gは、ユーザ間と広告間で報酬を転移させた、グローバルな報酬の重要性を調整するハイパーパラメータである。
また、オリジナルのトンプソンサンプリング方策と同様に、sk(t)とfk(t)が、ユーザ間の報酬の平均として組み込まれている。これは、現実世界のケースでは、有効な類似するユーザがほとんど発生せず、ユーザと広告の相互作用(interaction)は、疎(sparse)であるからである。最後の項の「1」は、履歴的報酬が利用可能でなかった場合のエラーを避けるための擬似カウントである。
S1:時間ステップtが0~Tの間、
S2:時間ステップtでのソースsにおけるユーザiのユーザ特徴(ユーザのコンテキスト特徴)と、広告(アクション)のセットAsと、それらの広告特徴(広告のコンテキスト特徴)のセットYsを観察する
S3:Asに含まれる全ての広告k(k∈As)に対して、
S4:式(4)に従い、時間ステップtでのユーザiと広告kに対する事前推定のための正報酬(α)と負報酬(β)を表すパラメータを計算する
S5:式(6)に従い、事後ベータ分布の正報酬(α)と負報酬(β)を表すパラメータを計算する
S6:事後ベータ分布のパラメータαとβを用いたベータ分布から、θkをサンプリングする
S7:S4~S6の処理のループの終了
S8:θkの最大値を与える広告kの表示を行い、報酬rを観察する
S9:観察Oを追加
S10:S2~S9の処理のループの終了
なお、前述の事前分布と事後分布のために用いる関数は、ベータ分布関数に限定されない。例えば、ガウス分布関数も用いることが可能である。
図4は、本実施形態による情報処理装置10のハードウェア構成の一例を示すブロック図である。
本実施形態による情報処理装置10は、単一または複数の、あらゆるコンピュータ、モバイルデバイス、または他のいかなる処理プラットフォーム上にも実装することができる。
図4を参照して、情報処理装置10は、単一のコンピュータに実装される例が示されているが、本実施形態による情報処理装置10は、複数のコンピュータを含むコンピュータシステムに実装されてよい。複数のコンピュータは、有線または無線のネットワークにより相互通信可能に接続されてよい。
CPU(Central Processing Unit)41は、情報処理装置10における動作を統括的に制御するものであり、データ伝送路であるシステムバス48を介して、各構成部(42~47)を制御する。
RAM(Random Access Memory)43は、揮発性メモリであり、CPU51の主メモリ、ワークエリア等として機能する。すなわち、CPU41は、処理の実行に際してROM42から必要なプログラム等をRAM43にロードし、当該プログラム等を実行することで各種の機能動作を実現する。
入力部45は、キーボードやマウス等のポインティングデバイスにより構成される。
表示部46は、液晶ディスプレイ(LCD)等のモニターにより構成される。表示部56は、入力部55と組み合わせて構成されることにより、GUI(Graphical User Interface)として機能してもよい。
通信I/F47は、ネットワークとのインタフェースを提供し、ネットワークを介して、外部装置との通信を実行する。通信I/F47を介して、外部装置との間で各種データや各種パラメータ等が送受信される。本実施形態では、通信I/F47は、イーサネット(登録商標)等の通信規格に準拠する有線LAN(Local Area Network)や専用線を介した通信を実行してよい。ただし、本実施形態で利用可能なネットワークはこれに限定されず、無線ネットワークで構成されてもよい。この無線ネットワークは、Bluetooth(登録商標)、ZigBee(登録商標)、UWB(Ultra Wide Band)等の無線PAN(Personal Area Network)を含む。また、Wi-Fi(Wireless Fidelity)(登録商標)等の無線LAN(Local Area Network)や、WiMAX(登録商標)等の無線MAN(Metropolitan Area Network)を含む。さらに、LTE/3G、4G、5G等の無線WAN(Wide Area Network)を含む。なお、ネットワークは、各機器を相互に通信可能に接続し、通信が可能であればよく、通信の規格、規模、構成は上記に限定されない。
図1に示すユーザ装置11のハードウェア構成は、図4と同様でありうる。すなわち、ユーザ装置11は、CPU41と、ROM42と、RAM43と、HDD44と、入力部45と、表示部46と、通信I/F47と、システムバス48とを備えうる。ユーザ装置11は、情報処理装置10により提供された各種情報を、表示部46に表示し、GUI(入力部45と表示部46による構成)を介してユーザ1から受け付ける入力操作に対応する処理を行うことができる。
図5に、本実施形態による情報処理装置10により実行される処理のフローチャートを示す。図5に示す処理は、情報処理装置10のCPU41がROM42等に格納されたプログラムをRAM43にロードして実行することによって実現されうる。図5に示す処理を、図6に示す適用例に沿って説明する。図6は、図1に示した情報処理システムを参照した、本実施形態による学習モデルを適用した適用例を示す。
図6の例では、ユーザ特徴取得部101は、ユーザ1~Mのうち、すでに広告を提供していたユーザiを対象ユーザとして特定する。
図6の例では、コンテンツ特徴取得部102は、ドメインA(例えば、電子商取引サイト)における広告の特徴と、ドメインB(例えば、レストラン予約サイト)における広告の特徴を取得する。さらに、コンテンツ特徴取得部102は、新たに作成されてユーザに提供されていないドメインC(例えば、ホテル予約サイト)における広告の特徴を取得する。ドメインCにおける広告は新規な広告であり、ユーザに提供されていない。そのため、ドメインCの広告に関する履歴情報は蓄積されていない。
図6の例では、ドメインAにおける広告の特徴、ドメインBにおける広告の特徴、およびドメインCにおける広告の特徴に対して、あらゆる2つの組み合わせの広告の特徴の類似度を算出する。
なお、S51~S55の処理の順序は図5の順序に限定されない。
なお、推定部104は、S56の処理の対象となった各広告について、得られた期待報酬に基づき、対象ユーザに提供するか否かを判定してもよい。
上記実施形態では、コンテンツとして広告を用いて説明したが、あらゆるコンテンツに対して、本実施形態を適用可能である。例えば、コンテンツとして、映画、書籍、または各種商品を用いてもよい。
Claims (13)
- 対象のコンテンツと1以上の他のコンテンツとの類似度であるコンテンツ間類似度と、対象のユーザと1以上の他のユーザとの類似度であるユーザ間類似度と、を取得する取得手段と、
前記コンテンツ間類似度と前記ユーザ間類似度とに基づいて、前記対象のユーザによる前記対象のコンテンツに対する実行処理により得られる期待報酬の事前分布を推定する推定手段と、
前記事前分布を用いて、前記期待報酬の事後分布を導出する導出手段と、
を有することを特徴とする情報処理装置。 - 前記取得手段は、前記対象のコンテンツと前記1以上の他のコンテンツの特徴を用いて、前記コンテンツ間類似度を取得し、前記対象のユーザと前記1以上の他のユーザの特徴を用いて前記ユーザ間類似度を取得することを特徴とする請求項1に記載の情報処理装置。
- 前記推定手段は、前記対象のユーザによる前記他のコンテンツに対する実行処理により得られた第1の報酬を用いて、前記事前分布を推定することを特徴とする請求項1または2に記載の情報処理装置。
- 前記第1の報酬は、時間の経過による報酬の割引により、前記対象のユーザによる前記他のコンテンツに対する過去の実行処理より最近の実行処理により得られた報酬が高くなるように構成されることを特徴とする請求項3に記載の情報処理装置。
- 前記推定手段は、前記他のユーザによる前記対象のコンテンツに対する実行処理により得られた第2の報酬を用いて、前記事前分布を推定することを特徴とする請求項1から4のいずれか1項に記載の情報処理装置。
- 前記第2の報酬は、時間の経過による報酬の割引により、前記他のユーザによる前記対象のコンテンツに対する過去の実行処理より最近の実行処理により得られた報酬が高くなるように構成されることを特徴とする請求項5に記載の情報処理装置。
- 前記導出手段により導出された前記期待報酬の事後分布に基づいて、前記対象のコンテンツを前記対象のユーザに提供するかを判定する判定手段をさらに有することを特徴とする請求項1から6のいずれか1項に記載の情報処理装置。
- 前記コンテンツは、有形または無形の商品またはサービスに関する広告であり、前記実行処理は、広告の表示処理であり、前記期待報酬に係る報酬は、前記広告に対するクリックの有無を示すことを特徴とする請求項1から7のいずれか1項に記載の情報処理装置。
- 複数のコンテンツ間の類似度と、複数のユーザ間の類似度を取得する取得手段と、
前記複数のコンテンツ間の類似度と前記複数のユーザ間の類似度を用いて、前記複数のコンテンツ間と前記複数のユーザ間において報酬を転移させることによりコンテンツごとに得られた期待報酬が、前記複数のコンテンツのうちで最大のコンテンツを、前記複数のユーザのうちの1以上のユーザに適したコンテンツとして決定する決定手段と、
を有することを特徴とする情報処理装置。 - 情報処理装置によって実行される情報処理方法であって、
対象のコンテンツと1以上の他のコンテンツとの類似度であるコンテンツ間類似度と、対象のユーザと1以上の他のユーザとの類似度であるユーザ間類似度と、を取得する取得工程と、
前記コンテンツ間類似度と前記ユーザ間類似度とに基づいて、前記対象のユーザによる前記対象のコンテンツに対する実行処理により得られる期待報酬の事前分布を推定する推定工程と、
前記事前分布を用いて、前記期待報酬の事後分布を導出する導出工程と、
を有する情報処理方法。 - 情報処理をコンピュータに実行させるための情報処理プログラムであって、該プログラムは、前記コンピュータに、
対象のコンテンツと1以上の他のコンテンツとの類似度であるコンテンツ間類似度と、対象のユーザと1以上の他のユーザとの類似度であるユーザ間類似度と、を取得する取得処理と、
前記コンテンツ間類似度と前記ユーザ間類似度とに基づいて、前記対象のユーザによる前記対象のコンテンツに対する実行処理により得られる期待報酬の事前分布を推定する推定処理と、
前記事前分布を用いて、前記期待報酬の事後分布を導出する導出処理と、を含む処理を実行させるためのものである、
情報処理プログラム。 - 情報処理装置によって実行される情報処理方法であって、
複数のコンテンツ間の類似度と、複数のユーザ間の類似度を取得する取得工程と、
前記複数のコンテンツ間の類似度と前記複数のユーザ間の類似度を用いて、前記複数のコンテンツ間と前記複数のユーザ間において報酬を転移させることによりコンテンツごとに得られた期待報酬が、前記複数のコンテンツのうちで最大のコンテンツを、前記複数のユーザのうちの1以上のユーザに適したコンテンツとして決定する決定工程と、
を有することを特徴とする情報処理方法。 - 情報処理をコンピュータに実行させるための情報処理プログラムであって、該プログラムは、前記コンピュータに、
複数のコンテンツ間の類似度と、複数のユーザ間の類似度を取得する取得処理と、
前記複数のコンテンツ間の類似度と前記複数のユーザ間の類似度を用いて、前記複数のコンテンツ間と前記複数のユーザ間において報酬を転移させることによりコンテンツごとに得られた期待報酬が、前記複数のコンテンツのうちで期待報酬が最大のコンテンツを、前記複数のユーザのうちの1以上のユーザに適したコンテンツとして決定する決定処理と、を含む処理を実行させるためのものである、
情報処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2024020809A JP2024056888A (ja) | 2022-02-14 | 2024-02-15 | 情報処理装置、情報処理方法、およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2022/005602 WO2023152950A1 (ja) | 2022-02-14 | 2022-02-14 | 情報処理装置、情報処理方法、プログラム、および学習モデル |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2024020809A Division JP2024056888A (ja) | 2022-02-14 | 2024-02-15 | 情報処理装置、情報処理方法、およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2023152950A1 JPWO2023152950A1 (ja) | 2023-08-17 |
JP7440703B2 true JP7440703B2 (ja) | 2024-02-28 |
Family
ID=87563999
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023501077A Active JP7440703B2 (ja) | 2022-02-14 | 2022-02-14 | 情報処理装置、情報処理方法、プログラム、および学習モデル |
JP2024020809A Pending JP2024056888A (ja) | 2022-02-14 | 2024-02-15 | 情報処理装置、情報処理方法、およびプログラム |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2024020809A Pending JP2024056888A (ja) | 2022-02-14 | 2024-02-15 | 情報処理装置、情報処理方法、およびプログラム |
Country Status (3)
Country | Link |
---|---|
EP (1) | EP4322097A4 (ja) |
JP (2) | JP7440703B2 (ja) |
WO (1) | WO2023152950A1 (ja) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160350802A1 (en) | 2015-05-27 | 2016-12-01 | Staples, Inc. | Promotion Selection for Online Customers Using Bayesian Bandits |
US20170061481A1 (en) | 2015-08-27 | 2017-03-02 | Staples, Inc. | Realtime Feedback Using Affinity-Based Dynamic User Clustering |
US20170098236A1 (en) | 2015-10-02 | 2017-04-06 | Yahoo! Inc. | Exploration of real-time advertising decisions |
US20170278114A1 (en) | 2016-03-24 | 2017-09-28 | Xerox Corporation | Adaptive collaborative filtering with extended kalman filters and multi-armed bandits |
US20180211303A1 (en) | 2017-01-23 | 2018-07-26 | Wal-Mart Stores, Inc. | Systems and methods for promoting products in product search results using transfer learning with active sampling |
JP2018156306A (ja) | 2017-03-16 | 2018-10-04 | ヤフー株式会社 | 算出装置、算出方法および算出プログラム |
US20190007720A1 (en) | 2017-06-29 | 2019-01-03 | Facebook, Inc. | Recommending recently obtained content to online system users based on characteristics of other users interacting with the recently obtained content |
US20190080348A1 (en) | 2017-09-12 | 2019-03-14 | Yahoo Holdings, Inc. | Exploration for search advertising |
-
2022
- 2022-02-14 WO PCT/JP2022/005602 patent/WO2023152950A1/ja active Application Filing
- 2022-02-14 JP JP2023501077A patent/JP7440703B2/ja active Active
- 2022-02-14 EP EP22925970.0A patent/EP4322097A4/en active Pending
-
2024
- 2024-02-15 JP JP2024020809A patent/JP2024056888A/ja active Pending
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160350802A1 (en) | 2015-05-27 | 2016-12-01 | Staples, Inc. | Promotion Selection for Online Customers Using Bayesian Bandits |
US20170061481A1 (en) | 2015-08-27 | 2017-03-02 | Staples, Inc. | Realtime Feedback Using Affinity-Based Dynamic User Clustering |
US20170098236A1 (en) | 2015-10-02 | 2017-04-06 | Yahoo! Inc. | Exploration of real-time advertising decisions |
US20170278114A1 (en) | 2016-03-24 | 2017-09-28 | Xerox Corporation | Adaptive collaborative filtering with extended kalman filters and multi-armed bandits |
US20180211303A1 (en) | 2017-01-23 | 2018-07-26 | Wal-Mart Stores, Inc. | Systems and methods for promoting products in product search results using transfer learning with active sampling |
JP2018156306A (ja) | 2017-03-16 | 2018-10-04 | ヤフー株式会社 | 算出装置、算出方法および算出プログラム |
US20190007720A1 (en) | 2017-06-29 | 2019-01-03 | Facebook, Inc. | Recommending recently obtained content to online system users based on characteristics of other users interacting with the recently obtained content |
US20190080348A1 (en) | 2017-09-12 | 2019-03-14 | Yahoo Holdings, Inc. | Exploration for search advertising |
Also Published As
Publication number | Publication date |
---|---|
EP4322097A1 (en) | 2024-02-14 |
JPWO2023152950A1 (ja) | 2023-08-17 |
WO2023152950A1 (ja) | 2023-08-17 |
JP2024056888A (ja) | 2024-04-23 |
EP4322097A4 (en) | 2024-05-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11055764B2 (en) | Systems and methods for providing personalized online content | |
US10332015B2 (en) | Particle thompson sampling for online matrix factorization recommendation | |
US11657253B1 (en) | Flexible multi-task neutral network for content ranking | |
US10678861B2 (en) | Personalized post session model for an online system | |
US20190228105A1 (en) | Dynamic website content optimization | |
US11361239B2 (en) | Digital content classification and recommendation based upon artificial intelligence reinforcement learning | |
US8990191B1 (en) | Method and system to determine a category score of a social network member | |
US20190005409A1 (en) | Learning representations from disparate data sets | |
WO2015187661A1 (en) | Systems and methods for serving product recommendations | |
US10839313B2 (en) | Identity prediction for unknown users of an online system | |
US20170178181A1 (en) | Click through rate prediction calibration | |
WO2019226935A1 (en) | Real-time recommendation monitoring dashboard | |
Chavez et al. | Using eye-tracking to model attribute non-attendance in choice experiments | |
US10909454B2 (en) | Multi-task neutral network for feed ranking | |
US20150278836A1 (en) | Method and system to determine member profiles for off-line targeting | |
JP7160866B2 (ja) | 情報提供システム、情報提供方法、およびプログラム | |
Shah et al. | Stackelberg game for two-level supply chain with price markdown option | |
JP7440703B2 (ja) | 情報処理装置、情報処理方法、プログラム、および学習モデル | |
US20240062237A1 (en) | Information processing method and apparatus | |
US10839418B1 (en) | Predicting performance of content item campaigns | |
JP2011081451A (ja) | 表示データ生成装置及びプログラム | |
US11544774B1 (en) | Method, apparatus, and computer program product for device rendered object sets based on multiple objectives | |
US20180020066A1 (en) | Generating viewer affinity score in an on-line social network | |
JP7496923B1 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP7303855B2 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230106 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20230106 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230418 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230515 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230711 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230814 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231114 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240110 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240123 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240215 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7440703 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |