JP7047911B2 - 情報処理システム、情報処理方法及び記憶媒体 - Google Patents
情報処理システム、情報処理方法及び記憶媒体 Download PDFInfo
- Publication number
- JP7047911B2 JP7047911B2 JP2020529906A JP2020529906A JP7047911B2 JP 7047911 B2 JP7047911 B2 JP 7047911B2 JP 2020529906 A JP2020529906 A JP 2020529906A JP 2020529906 A JP2020529906 A JP 2020529906A JP 7047911 B2 JP7047911 B2 JP 7047911B2
- Authority
- JP
- Japan
- Prior art keywords
- reward
- action
- information processing
- promotion
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0207—Discounts or incentives, e.g. coupons or rebates
- G06Q30/0226—Incentive systems for frequent usage, e.g. frequent flyer miles programs or point systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
本実施形態の具体的構成の説明に先立って、本実施形態の前提となる技術事項及び適用場面の例について説明する。本実施形態の情報処理システムは、プロモーション(広告の配信等の販売促進活動)等の施策の割り当て方等の意思決定のための情報処理を行うシステムである。ここで、プロモーションの割り当てとは、例えば、どのユーザにプロモーションを提供し、どのユーザにプロモーションを提供しないかを決定することを指す。また、プロモーションの割り当ては、より一般的にアクションと呼ばれることもある。またユーザは、より一般的に候補と呼ばれることもある。プロモーションの内容は特に限定されるものではないが、例えば、ブラウザ上に表示されるオンライン広告、電子メールによる広告、ダイレクトメール、割引チケットの送付等であり得る。
適用例1では、本実施形態の効果をわかりやすく説明するため、単純化されたモデルへの本実施形態の適用例を説明する。まず適用例1の前提条件を説明する。プロモーションの対象となり得るユーザは、ユーザ1とユーザ2の2名のみであるものとする。また、プロモーションの種類は1種類のみであるものとする。更に、プロモーションの提供可能数はユーザ1とユーザ2のいずれか1名のみであることをプロモーションの制約条件とする。すなわち、取り得るアクション(アクションの制約情報)は、「ユーザ1にプロモーションを提供し、ユーザ2にプロモーションを提供しない」及び「ユーザ1にプロモーションを提供せず、ユーザ2にプロモーションを提供する」の2種類のうちのいずれかである。
適用例1の問題の一部を変更して、報酬が確率的に与えられる場合におけるより適切な報酬関数の設定方法を適用例2として説明する。
(楽観的推定報酬)=(推定報酬)+(推定の信頼度) (3)
適用例2で述べた、報酬が確率的に与えられる場合における課題に対する別のアプローチを適用例3として説明する。適用例3では、トンプソンサンプリングを用いてアクションの決定(プロモーションの割り当ての決定)を行う。トンプソンサンプリングは、各アクションの期待値の事後確率分布(例えばベータ分布)に従う乱数を生成し、生成された乱数を評価指標として(例えば乱数の値が最大の)アクションを実行するという手法である。この手法によれば、あるアクションが最適であるという事後確率と当該アクションの実行確率が一致するようにアクションが選択される。この手法では、ある時点で最適とされているアクション以外のアクションも事後確率分布に応じた確率で時々実行されるので、適用例2で述べたような不適切な学習がなされる可能性を低減することができる。
図9は、本実施形態に係る情報処理システム200の構成例を示す機能ブロック図である。情報処理システム200は、条件取得部202、報酬関数推定部203及びアクション決定部204を備える。条件取得部202は、アクションの制約情報と、アクションの対象である複数の候補の各々についての候補情報とを取得する。報酬関数推定部203は、制約情報及び候補情報に基づいて、アクションに応じた報酬を算出するための報酬関数を複数の候補の各々について推定する。アクション決定部204は、複数の候補の各々の報酬関数に基づいてアクションの内容を決定する。
以上、実施形態を参照して本発明を説明したが、本発明は上述の実施形態に限定されるものではない。本願発明の構成及び詳細には本発明の要旨を逸脱しない範囲で、当業者が理解し得る様々な変形をすることができる。
アクションの制約情報と、前記アクションの対象である複数の候補の各々についての候補情報とを取得する条件取得部と、
前記制約情報及び前記候補情報に基づいて、前記アクションに応じた報酬を算出するための報酬関数を前記複数の候補の各々について推定する報酬関数推定部と、
前記複数の候補の各々の前記報酬関数に基づいて、前記アクションの内容を決定するアクション決定部と、
を有する、情報処理システム。
前記アクションは、前記複数の候補のうちの少なくとも一つを施策の対象として選択し、前記選択された候補以外の候補を前記施策の対象外とすることを含む、付記1に記載の情報処理システム。
前記報酬関数は、対応する候補が前記施策の対象である場合の報酬と、前記施策の対象でない場合の報酬とを算出可能である、付記2に記載の情報処理システム。
前記報酬関数は、前記アクションの結果に基づいて変化する関数を含む、付記1乃至3のいずれか1項に記載の情報処理システム。
前記報酬関数は、過去に前記アクションが行われた回数に応じて変化する関数を含む、付記4に記載の情報処理システム。
前記報酬関数は、対応する候補が前記アクションに含まれる施策の対象となった回数に応じて変化する関数を含む、付記4又は5に記載の情報処理システム。
前記報酬関数は、UCB(Upper Confidence Bound)に基づく関数を含む、付記5又は6に記載の情報処理システム。
前記報酬関数は、乱数を含む、付記4乃至7のいずれか1項に記載の情報処理システム。
前記報酬関数は、トンプソンサンプリングに基づく乱数を含む、付記4乃至8のいずれか1項に記載の情報処理システム。
前記候補情報は、前記アクションに含まれる施策の対象になったことがあるか否かを示す情報を含む、付記4乃至9のいずれか1項に記載の情報処理システム。
前記候補情報は、前記アクションの結果を示す情報を含む、付記4乃至10のいずれか1項に記載の情報処理システム。
前記アクション決定部は、前記報酬関数に基づいて、前記複数の候補の各々の報酬の総和が最大になるように前記アクションの内容を決定する、付記1乃至11のいずれか1項に記載の情報処理システム。
前記アクションは、プロモーションの割り当てを含み、
前記候補は、前記プロモーションの提供を受けるユーザである、
付記1乃至12のいずれか1項に記載の情報処理システム。
アクションの制約情報と、前記アクションの対象である複数の候補の各々についての候補情報とを取得するステップと、
前記制約情報及び前記候補情報に基づいて、前記アクションに応じた報酬を算出するための報酬関数を前記複数の候補の各々について推定するステップと、
前記複数の候補の各々の前記報酬関数に基づいて、前記アクションの内容を決定するステップと、
を有する、情報処理方法。
コンピュータに、
アクションの制約情報と、前記アクションの対象である複数の候補の各々についての候補情報とを取得するステップと、
前記制約情報及び前記候補情報に基づいて、前記アクションに応じた報酬を算出するための報酬関数を前記複数の候補の各々について推定するステップと、
前記複数の候補の各々の前記報酬関数に基づいて、前記アクションの内容を決定するステップと、
を有する情報処理方法を実行させるためのプログラムを記憶した記憶媒体。
101 フィードバック取得部
102、202 条件取得部
103、203 報酬関数推定部
104、204 アクション決定部
105 記憶部
151 CPU
152 RAM
153 ROM
154 HDD
155 通信I/F
156 表示装置
157 入力装置
158 バス
Claims (8)
- アクションの制約情報と、前記アクションの対象である複数の候補の各々についての候補情報とを取得する条件取得部と、
前記制約情報及び前記候補情報に基づいて、前記アクションに応じた報酬を算出するための報酬関数を前記複数の候補の各々について推定する報酬関数推定部と、
前記複数の候補の各々の前記報酬関数に基づいて、前記アクションの内容を決定するアクション決定部と、
を有し、
前記アクションは、前記複数の候補のうちの少なくとも一つを施策の対象として選択し、前記選択された候補以外の候補を前記施策の対象外とすることを含み、
前記報酬関数は、対応する候補が前記施策の対象である場合の報酬と、前記施策の対象でない場合の報酬とを算出可能である、情報処理システム。 - 前記報酬関数は、前記アクションの結果に基づいて変化する関数を含む、請求項1に記載の情報処理システム。
- 前記報酬関数は、過去に前記アクションが行われた回数に応じて変化する関数を含む、請求項2に記載の情報処理システム。
- 前記報酬関数は、対応する候補が前記アクションに含まれる施策の対象となった回数に応じて変化する関数を含む、請求項2又は3に記載の情報処理システム。
- 前記報酬関数は、UCB(Upper Confidence Bound)に基づく関数を含む、請求項3又は4に記載の情報処理システム。
- 前記報酬関数は、トンプソンサンプリングに基づく乱数を含む、請求項2乃至5のいずれか1項に記載の情報処理システム。
- コンピュータにより実行される情報処理方法であって、
アクションの制約情報と、前記アクションの対象である複数の候補の各々についての候補情報とを取得するステップと、
前記制約情報及び前記候補情報に基づいて、前記アクションに応じた報酬を算出するための報酬関数を前記複数の候補の各々について推定するステップと、
前記複数の候補の各々の前記報酬関数に基づいて、前記アクションの内容を決定するステップと、
を有し、
前記アクションは、前記複数の候補のうちの少なくとも一つを施策の対象として選択し、前記選択された候補以外の候補を前記施策の対象外とすることを含み、
前記報酬関数は、対応する候補が前記施策の対象である場合の報酬と、前記施策の対象でない場合の報酬とを算出可能である、情報処理方法。 - コンピュータに、
アクションの制約情報と、前記アクションの対象である複数の候補の各々についての候補情報とを取得するステップと、
前記制約情報及び前記候補情報に基づいて、前記アクションに応じた報酬を算出するための報酬関数を前記複数の候補の各々について推定するステップと、
前記複数の候補の各々の前記報酬関数に基づいて、前記アクションの内容を決定するステップと、
を有する情報処理方法を実行させるためのプログラムであって、
前記アクションは、前記複数の候補のうちの少なくとも一つを施策の対象として選択し、前記選択された候補以外の候補を前記施策の対象外とすることを含み、
前記報酬関数は、対応する候補が前記施策の対象である場合の報酬と、前記施策の対象でない場合の報酬とを算出可能である、プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2018/026273 WO2020012589A1 (ja) | 2018-07-12 | 2018-07-12 | 情報処理システム、情報処理方法及び記憶媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2020012589A1 JPWO2020012589A1 (ja) | 2021-06-10 |
JP7047911B2 true JP7047911B2 (ja) | 2022-04-05 |
Family
ID=69142330
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020529906A Active JP7047911B2 (ja) | 2018-07-12 | 2018-07-12 | 情報処理システム、情報処理方法及び記憶媒体 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20210390574A1 (ja) |
JP (1) | JP7047911B2 (ja) |
WO (1) | WO2020012589A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20230214757A1 (en) * | 2020-06-01 | 2023-07-06 | Nec Corporation | Optimization processing apparatus, optimization processing method, and computer readable recording medium |
WO2022079829A1 (ja) * | 2020-10-14 | 2022-04-21 | 日本電気株式会社 | 情報処理装置、情報処理方法、情報処理システム、および記憶媒体 |
CN117172627B (zh) * | 2023-11-03 | 2024-02-27 | 腾讯科技(深圳)有限公司 | 一种业务执行方法、装置、设备及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016118918A (ja) | 2014-12-19 | 2016-06-30 | ヤフー株式会社 | モデル生成装置、情報配信装置、モデル生成方法、情報配信方法、モデル生成プログラムおよび情報配信プログラム |
JP2017151821A (ja) | 2016-02-25 | 2017-08-31 | カルチュア・コンビニエンス・クラブ株式会社 | 装置、方法、および、プログラム |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10290009B2 (en) * | 2010-03-25 | 2019-05-14 | Safeway Inc. | Adaptable retail pricing environment and electronic exchange, delivering customized retailer opportunity rewards and discounts |
JP5485311B2 (ja) * | 2012-02-07 | 2014-05-07 | ヤフー株式会社 | 広告評価装置、広告評価方法およびプログラム |
US9836765B2 (en) * | 2014-05-19 | 2017-12-05 | Kibo Software, Inc. | System and method for context-aware recommendation through user activity change detection |
JP6470965B2 (ja) * | 2014-12-24 | 2019-02-13 | 株式会社Nttドコモ | 広告選択装置、広告選択方法及びプログラム |
US10796335B2 (en) * | 2015-10-08 | 2020-10-06 | Samsung Sds America, Inc. | Device, method, and computer readable medium of generating recommendations via ensemble multi-arm bandit with an LPBoost |
-
2018
- 2018-07-12 US US17/258,590 patent/US20210390574A1/en not_active Abandoned
- 2018-07-12 JP JP2020529906A patent/JP7047911B2/ja active Active
- 2018-07-12 WO PCT/JP2018/026273 patent/WO2020012589A1/ja active Application Filing
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016118918A (ja) | 2014-12-19 | 2016-06-30 | ヤフー株式会社 | モデル生成装置、情報配信装置、モデル生成方法、情報配信方法、モデル生成プログラムおよび情報配信プログラム |
JP2017151821A (ja) | 2016-02-25 | 2017-08-31 | カルチュア・コンビニエンス・クラブ株式会社 | 装置、方法、および、プログラム |
Non-Patent Citations (1)
Title |
---|
本多 淳也,バンディット問題の理論とアルゴリズム,株式会社講談社 鈴木 哲,2016年08月24日,P.30, 31, 38~40, 114~115 |
Also Published As
Publication number | Publication date |
---|---|
US20210390574A1 (en) | 2021-12-16 |
JPWO2020012589A1 (ja) | 2021-06-10 |
WO2020012589A1 (ja) | 2020-01-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20190156357A1 (en) | Advanced computational prediction models for heterogeneous data | |
JP7047911B2 (ja) | 情報処理システム、情報処理方法及び記憶媒体 | |
US20150006292A1 (en) | Promotion scheduling management | |
US20210158259A1 (en) | Orchestrated intelligent supply chain optimizer | |
US20160125435A1 (en) | Interrogation of mean field system | |
US20200302486A1 (en) | Method and system for determining optimized customer touchpoints | |
EP3371764A1 (en) | Systems and methods for pricing optimization with competitive influence effects | |
US20170345071A1 (en) | Planning device and planning method | |
US20170132699A1 (en) | Markov decision process-based decision support tool for financial planning, budgeting, and forecasting | |
JP2023512738A (ja) | 離散制約を有する目的を最適化するための方法及びシステム | |
US9858592B2 (en) | Generating apparatus, generation method, information processing method and program | |
JP2007233944A (ja) | 商品販売予測システム | |
US20200311749A1 (en) | System for Generating and Using a Stacked Prediction Model to Forecast Market Behavior | |
JP5963320B2 (ja) | 情報処理装置、情報処理方法、及び、プログラム | |
EP4024203A1 (en) | System performance optimization | |
Sakhrawi et al. | Support vector regression for enhancement effort prediction of Scrum projects from COSMIC functional size | |
US11288691B2 (en) | Systems and methods for price markdown optimization | |
WO2015073041A1 (en) | Product data analysis | |
US11232483B2 (en) | Marketing attribution capturing synergistic effects between channels | |
JP6968730B2 (ja) | 案件進捗予測装置および案件進捗予測システム | |
US8126765B2 (en) | Market demand estimation method, system, and apparatus | |
JP7439922B2 (ja) | 最適化処理装置、最適化処理方法、及びプログラム | |
JP2009003850A (ja) | 企業施策の決定支援装置、企業施策の決定支援方法及びそのプログラム | |
US10235686B2 (en) | System forecasting and improvement using mean field | |
Alfares | Introduction to optimization models and techniques |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201120 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20201120 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210907 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211104 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220222 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220307 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7047911 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |