JP5868104B2 - 周期性を有するマルコフ決定過程を用いて最適施策を決定する方法、装置及びコンピュータプログラム - Google Patents
周期性を有するマルコフ決定過程を用いて最適施策を決定する方法、装置及びコンピュータプログラム Download PDFInfo
- Publication number
- JP5868104B2 JP5868104B2 JP2011218556A JP2011218556A JP5868104B2 JP 5868104 B2 JP5868104 B2 JP 5868104B2 JP 2011218556 A JP2011218556 A JP 2011218556A JP 2011218556 A JP2011218556 A JP 2011218556A JP 5868104 B2 JP5868104 B2 JP 5868104B2
- Authority
- JP
- Japan
- Prior art keywords
- subspace
- cost
- value
- selection
- partial space
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computational Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Algebra (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Complex Calculations (AREA)
Description
11 CPU
12 メモリ
13 記憶装置
14 I/Oインタフェース
15 ビデオインタフェース
16 可搬型ディスクドライブ
17 通信インタフェース
18 内部バス
90 可搬型記録媒体
100 コンピュータプログラム
Claims (9)
- 少なくとも一の状態を有するT(Tは自然数)個の部分空間が周期構造を有するマルコフ決定過程を用いて最適施策を決定する装置のコンピュータで実行する方法であって、
前記コンピュータが、
状態空間の一部である部分空間を特定する工程と、
特定された部分空間のうち、t(tは自然数、t≦T)番目の部分空間の選択を受け付ける工程と、
選択を受け付けたt番目の部分空間における一又は複数の状態から一周期後のt番目の部分空間における一又は複数の状態に到達する確率とコストの期待値とを算出する工程と、
算出したt番目の部分空間における確率とコストの期待値とに基づいて、(t−1)番目の部分空間における価値とコストの期待値とを算出し、以下、tを順次1までデクリメントし、次にtをTから順次デクリメントして(t+1)になるまで、すべてのtについて(t−1)番目の部分空間における価値とコストの期待値とを再帰的に算出する工程と
を含む方法。 - 前記コンピュータが、
T個の部分空間のうちt番目の部分空間として、最も状態数が少ない部分空間の選択を受け付ける請求項1に記載の方法。 - 前記コンピュータが、
t番目の部分空間における一又は複数の状態の価値及びコストの期待値の平均値を算出する請求項1又は2に記載の方法。 - 前記コンピュータが、
T個の部分空間それぞれに対して価値変数を算出し、マルコフ決定過程を最適化する請求項1乃至3のいずれか一項に記載の方法。 - 少なくとも一の状態を有するT(Tは自然数)個の部分空間が周期構造を有するマルコフ決定過程を用いて最適施策を決定する装置であって、
状態空間の一部である部分空間を特定する部分空間特定部と、
特定された部分空間のうち、t(tは自然数、t≦T)番目の部分空間の選択を受け付ける選択受付部と、
選択を受け付けたt番目の部分空間における一又は複数の状態から一周期後のt番目の部分空間における一又は複数の状態に到達する確率とコストの期待値とを算出する確率・コスト算出部と、
算出したt番目の部分空間における確率とコストの期待値とに基づいて、(t−1)番目の部分空間における価値とコストの期待値とを算出し、以下、tを順次1までデクリメントし、次にtをTから順次デクリメントして(t+1)になるまで、すべてのtについて(t−1)番目の部分空間における価値とコストの期待値とを再帰的に算出する再帰算出部と
を備える装置。 - T個の部分空間のうちt番目の部分空間として、最も状態数が少ない部分空間の選択を受け付ける請求項5に記載の装置。
- t番目の部分空間における一又は複数の状態の価値及びコストの期待値の平均値を算出する請求項5又は6に記載の装置。
- T個の部分空間それぞれに対して価値変数を算出し、マルコフ決定過程を最適化する請求項5乃至7のいずれか一項に記載の装置。
- 少なくとも一の状態を有するT(Tは自然数)個の部分空間が周期構造を有するマルコフ決定過程を用いて最適施策を決定する装置で実行することが可能なコンピュータプログラムであって、
前記装置を、
状態空間の一部である部分空間を特定する部分空間特定手段、
特定された部分空間のうち、t(tは自然数、t≦T)番目の部分空間の選択を受け付ける選択受付手段、
選択を受け付けたt番目の部分空間における一又は複数の状態から一周期後のt番目の部分空間における一又は複数の状態に到達する確率とコストの期待値とを算出する確率・コスト算出手段、及び
算出したt番目の部分空間における確率とコストの期待値とに基づいて、(t−1)番目の部分空間における価値とコストの期待値とを算出し、以下、tを順次1までデクリメントし、次にtをTから順次デクリメントして(t+1)になるまで、すべてのtについて(t−1)番目の部分空間における価値とコストの期待値とを再帰的に算出する再帰算出手段
として機能させるコンピュータプログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011218556A JP5868104B2 (ja) | 2011-09-30 | 2011-09-30 | 周期性を有するマルコフ決定過程を用いて最適施策を決定する方法、装置及びコンピュータプログラム |
US13/586,385 US9135563B2 (en) | 2011-09-30 | 2012-08-15 | Using cyclic Markov decision process to determine optimum policy |
US13/589,407 US9135564B2 (en) | 2011-09-30 | 2012-08-20 | Using cyclic Markov decision process to determine optimum policy |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011218556A JP5868104B2 (ja) | 2011-09-30 | 2011-09-30 | 周期性を有するマルコフ決定過程を用いて最適施策を決定する方法、装置及びコンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013080280A JP2013080280A (ja) | 2013-05-02 |
JP5868104B2 true JP5868104B2 (ja) | 2016-02-24 |
Family
ID=47993560
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011218556A Expired - Fee Related JP5868104B2 (ja) | 2011-09-30 | 2011-09-30 | 周期性を有するマルコフ決定過程を用いて最適施策を決定する方法、装置及びコンピュータプログラム |
Country Status (2)
Country | Link |
---|---|
US (2) | US9135563B2 (ja) |
JP (1) | JP5868104B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6103540B2 (ja) * | 2014-03-14 | 2017-03-29 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 生成装置、生成方法、情報処理方法、及び、プログラム |
US10528883B2 (en) | 2015-09-09 | 2020-01-07 | International Business Machines Corporation | Hybrid estimation of transition probability values in markov decision processes |
US11657310B2 (en) * | 2016-01-06 | 2023-05-23 | International Business Machines Corporiation | Utilizing stochastic controller to provide user-controlled notification rate of wearable-based events |
US11034019B2 (en) * | 2018-04-19 | 2021-06-15 | Brown University | Sequence-to-sequence language grounding of non-Markovian task specifications |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3960286B2 (ja) | 2003-09-05 | 2007-08-15 | 独立行政法人科学技術振興機構 | 適応型制御器、適応型制御方法および適応型制御プログラム |
JP5413831B2 (ja) * | 2009-07-17 | 2014-02-12 | 学校法人立命館 | 電力取引管理システム、管理装置、電力取引方法、及び電力取引用コンピュータプログラム |
US8412649B2 (en) * | 2009-12-29 | 2013-04-02 | Mitsubishi Electric Research Laboratories, Inc. | Method for converting dynamical systems with continuous states into Markov decision processes with discrete states |
-
2011
- 2011-09-30 JP JP2011218556A patent/JP5868104B2/ja not_active Expired - Fee Related
-
2012
- 2012-08-15 US US13/586,385 patent/US9135563B2/en not_active Expired - Fee Related
- 2012-08-20 US US13/589,407 patent/US9135564B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US20130085974A1 (en) | 2013-04-04 |
US9135563B2 (en) | 2015-09-15 |
US20130085983A1 (en) | 2013-04-04 |
JP2013080280A (ja) | 2013-05-02 |
US9135564B2 (en) | 2015-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Li et al. | An accumulative error based adaptive design of experiments for offline metamodeling | |
US20230237375A1 (en) | Dynamic placement of computation sub-graphs | |
US9058216B2 (en) | Method for estimating job run time | |
JP4661250B2 (ja) | 予測方法、予測装置および予測プログラム | |
US20110131163A1 (en) | Managing a Portfolio of Experts | |
US20210081763A1 (en) | Electronic device and method for controlling the electronic device thereof | |
Bülbül et al. | A linear programming-based method for job shop scheduling | |
JP7003753B2 (ja) | 探索点決定プログラム、探索点決定方法および探索点決定装置 | |
JP5868104B2 (ja) | 周期性を有するマルコフ決定過程を用いて最適施策を決定する方法、装置及びコンピュータプログラム | |
CN113283671B (zh) | 一种预测补货量的方法、装置、计算机设备及存储介质 | |
Kumar et al. | Benchmarking stochastic and deterministic MPC: A case study in stationary battery systems | |
Wang et al. | Robust scheduling optimization for flexible manufacturing systems with replenishment under uncertain machine failure disruptions | |
US11562210B2 (en) | Stochastically determining to accept a state transition for an optimization device | |
US20160364684A1 (en) | Incremental estimation for probabilistic forecaster | |
Cheng et al. | A comparison of optimal control and stochastic programming from a formulation and computation perspective | |
JP2014520340A (ja) | パラメータ推定を用いた小売予測 | |
US8346704B2 (en) | Controlled constraint sharing in parallel problem solvers | |
Wang | Retrospective optimization of mixed-integer stochastic systems using dynamic simplex linear interpolation | |
US20210026853A1 (en) | Combination search system, information processing device, method, and program | |
CN110826814A (zh) | 备件库存确定方法、备件库存确定装置和电子设备 | |
JP2010108078A (ja) | 需要予測装置 | |
Bermúdez et al. | Forecasting time series with missing data using Holt's model | |
CN114079953A (zh) | 无线网络系统的资源调度方法、装置、终端及存储介质 | |
JP2004110300A (ja) | データ予測方法、データ予測装置、コンピュータプログラム、及び記録媒体 | |
Bagheri et al. | SACOBRA: Self-adjusting constrained black-box optimization with RBF |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140507 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150731 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150825 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150925 |
|
TRDD | Decision of grant or rejection written | ||
RD14 | Notification of resignation of power of sub attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7434 Effective date: 20151208 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20151208 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160105 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5868104 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |