JP5562216B2 - 連続システムをマルコフ決定過程に変換するための方法 - Google Patents
連続システムをマルコフ決定過程に変換するための方法 Download PDFInfo
- Publication number
- JP5562216B2 JP5562216B2 JP2010257949A JP2010257949A JP5562216B2 JP 5562216 B2 JP5562216 B2 JP 5562216B2 JP 2010257949 A JP2010257949 A JP 2010257949A JP 2010257949 A JP2010257949 A JP 2010257949A JP 5562216 B2 JP5562216 B2 JP 5562216B2
- Authority
- JP
- Japan
- Prior art keywords
- state
- continuous
- triangle
- discrete
- mdp
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/0205—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric not using a model or a simulator of the controlled system
- G05B13/024—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric not using a model or a simulator of the controlled system in which a parameter or coefficient is automatically adjusted to optimise the performance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/11—Complex mathematical operations for solving equations, e.g. nonlinear equations, general mathematical optimization problems
- G06F17/13—Differential equations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Mathematical Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computational Mathematics (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Algebra (AREA)
- Computing Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Automation & Control Theory (AREA)
- Operations Research (AREA)
- Databases & Information Systems (AREA)
- Air Conditioning Control Device (AREA)
- Feedback Control In General (AREA)
- Image Generation (AREA)
Description
xk+1=f(xk,ak)
ここで、xkは時刻tkにおけるシステムの状態であり、akは時刻tkにおいて適用される制御動作であり、fは任意の非線形遷移関数であり、システムは、選択された間隔Δtについてtk=kΔtとなるような離散時間で展開する。動作シーケンスa0,a1,a2,…は、性能の指標が最適化されるように選択しなければならない。例えば、HVACシステムは、最小のエネルギー消費で、環境を所望の温度に徐々に持って行くことによって最適化することができる。
図1〜図3に示すように、動的システムは、連続状態x(i)の集合X101を有する。各状態は、d次元ベクトルによって表すことができる。図4に示すように、例示的なHVACシステムの状態xは、連続的に変化する温度401及び湿度402を含む。
本明細書及び特許請求の範囲では一般に、各三角形は、より一般的な項であるシンプレックスに置き換えることができる。シンプレックスは、任意の次元dの状態空間Xにおいて三角形を一般化したものである。例えば、次元数d=2である場合、シンプレックス(又は三角形)における頂点の数はd+1=3であり、d=3の場合、シンプレックスは、d+1=4個の頂点を有する四面体である。
c=E−1(y−q)
を求めることができる。
Claims (6)
- 連続システムをマルコフ決定過程(MDP)に変換するための方法であって、前記連続システムは動的であり、前記MDPは離散状態を有し、該方法は、
前記連続システムの所定の数の連続状態を選択するステップであって、各連続状態は前記MDPの1つの離散状態に対応する、選択するステップと、
ドローネ三角形分割を前記連続状態に適用するステップであって、一組の三角形を作成し、各三角形の頂点は前記連続状態を表す、適用するステップと、
を含み、
各離散状態について、
次の離散状態y=f(x,a)を求めるステップであって、xはその離散状態に対応する前記連続状態を表し、aは制御動作であり、fは前記連続状態の非線形遷移関数である、求めるステップと、
前記次の離散状態yを含む特定の三角形を識別するステップと、
前記次の離散状態yを、前記特定の三角形の前記頂点によって表された前記連続状態xに対応する前記離散状態に遷移する確率として表すステップと、
をさらに含み、
前記特定の三角形を識別するステップは、差分行列Eの列jが、j=1,・・・,dについて、三角形mのj番目の頂点vm,jと該三角形mのd+1番目の頂点q=vm,d+1との間の差分vm,j−vm,d+1を含むようなd×d差分行列Eを形成し、ベクトルcについて方程式Ec=(y−q)の線形システムを解くことによって実行され、前記三角形mは、すべてcj>0、j=1,・・・,dであり、かつ
前記ステップは、プロセッサにおいて実行される、
方法。 - 前記MDPの前記離散状態は、前記連続システムの状態空間Xの一様ランダムサンプリングによって選択される、請求項1に記載の方法。
- 前記MDPの前記離散状態は、前記連続システムの状態空間Xに規則的なグリッドを使用することによって選択される、請求項1に記載の方法。
- c=E−1(y−q)として線形方程式を解くことができるように、前記行列Eの逆行列E−1が事前に計算されて格納される、請求項1に記載の方法。
- 前記特定の三角形を識別するステップは、前記ドローネ三角形分割により作成された前記一組の三角形のすべてについて、前記頂点の重心から前記状態yまでの距離の昇順で移動していくことによって前記特定の三角形を突き止める、請求項1に記載の方法。
- 前記三角形はシンプレックスに一般化される、請求項1に記載の方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12/649,244 US8412649B2 (en) | 2009-12-29 | 2009-12-29 | Method for converting dynamical systems with continuous states into Markov decision processes with discrete states |
US12/649,244 | 2009-12-29 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2011138489A JP2011138489A (ja) | 2011-07-14 |
JP2011138489A5 JP2011138489A5 (ja) | 2013-11-07 |
JP5562216B2 true JP5562216B2 (ja) | 2014-07-30 |
Family
ID=43902618
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010257949A Expired - Fee Related JP5562216B2 (ja) | 2009-12-29 | 2010-11-18 | 連続システムをマルコフ決定過程に変換するための方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US8412649B2 (ja) |
EP (1) | EP2341447A3 (ja) |
JP (1) | JP5562216B2 (ja) |
CN (1) | CN102109820A (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5868104B2 (ja) * | 2011-09-30 | 2016-02-24 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 周期性を有するマルコフ決定過程を用いて最適施策を決定する方法、装置及びコンピュータプログラム |
US8938348B2 (en) * | 2011-12-13 | 2015-01-20 | Mitsubishi Electric Research Laboratories, Inc. | Method for optimizing run curve of vehicles |
JP6451152B2 (ja) * | 2014-09-03 | 2019-01-16 | 株式会社国際電気通信基礎技術研究所 | 駆動システム |
CN111008238B (zh) * | 2019-11-15 | 2023-10-10 | 武汉楚誉科技股份有限公司 | 基于关联演化大数据的关键模式自动定位与预警方法 |
CN111031613B (zh) * | 2019-11-20 | 2022-04-19 | 南京理工大学 | 一种复杂对流环境下的功率器件主动热控制方法 |
CN115017720A (zh) * | 2022-06-22 | 2022-09-06 | 东南大学 | 一种基于巢式动态离散选择的出行活动链生成方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FI113410B (fi) * | 2002-05-31 | 2004-04-15 | Ekahau Oy | Probabilistinen malli paikannustekniikkaa varten |
-
2009
- 2009-12-29 US US12/649,244 patent/US8412649B2/en not_active Expired - Fee Related
-
2010
- 2010-11-18 JP JP2010257949A patent/JP5562216B2/ja not_active Expired - Fee Related
- 2010-12-21 EP EP10015889A patent/EP2341447A3/en not_active Withdrawn
- 2010-12-23 CN CN2010106031518A patent/CN102109820A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
EP2341447A3 (en) | 2013-01-30 |
US8412649B2 (en) | 2013-04-02 |
JP2011138489A (ja) | 2011-07-14 |
US20110161258A1 (en) | 2011-06-30 |
CN102109820A (zh) | 2011-06-29 |
EP2341447A2 (en) | 2011-07-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5562216B2 (ja) | 連続システムをマルコフ決定過程に変換するための方法 | |
US11397901B2 (en) | Method and system for perceiving physical bodies | |
US11366433B2 (en) | Reinforcement learning method and device | |
KR20140043184A (ko) | 에너지 소비량 예측 장치 및 방법 | |
KR20190087635A (ko) | 자동화된 의사 결정을 위한 방법 및 장치 | |
WO2020203854A1 (ja) | 発電量予測装置、発電量予測方法、およびプログラム | |
Liu et al. | Evaluation of reinforcement learning for optimal control of building active and passive thermal storage inventory | |
Yan et al. | Efficient selection of a set of good enough designs with complexity preference | |
JP6958808B2 (ja) | 方策改善プログラム、方策改善方法、および方策改善装置 | |
WO2020162205A1 (ja) | 最適化装置、方法、及びプログラム | |
JP2013125544A (ja) | エネルギー消費を削減するようにシステムを制御する方法 | |
JP2020144530A (ja) | パラメータ推定装置、方法、及びプログラム | |
JP2020095586A (ja) | 強化学習方法、および強化学習プログラム | |
CN115293623A (zh) | 一种生产调度模型的训练方法、装置、电子设备及介质 | |
CN115048557A (zh) | 一种基于人工智能的车辆数据处理方法和装置 | |
WO2024189994A1 (en) | Reduced order modeling and control of high dimensional physical systems using neural network model | |
Kvasnica et al. | Low-complexity polynomial approximation of explicit MPC via linear programming | |
JP6607264B2 (ja) | x管理システムのための最適スケジューリングおよびリアルタイム制御の方法 | |
CN110135725A (zh) | 一种线缆装配序列规划方法、装置及设备 | |
Liu et al. | Application of least square support vector machine based on particle swarm optimization to chaotic time series prediction | |
KR102507185B1 (ko) | 전력 계통 클러스터링 방법 및 장치 | |
Jiang et al. | Monthly electricity consumption forecasting by the fruit fly optimization algorithm enhanced Holt-Winters smoothing method | |
Horng et al. | Integrating ant colony system and ordinal optimization for solving stochastic job shop scheduling problem | |
CN107196328A (zh) | 一种配电网光储联合系统接入点薄弱性指数预测方法 | |
Clausen et al. | A Modifiable Architectural Design for Commercial Greenhouses Energy Economic Dispatch Testbed |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130920 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130920 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20130920 |
|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20131111 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131119 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140217 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140513 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140610 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5562216 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |