JP4811997B2 - 状態推定装置、状態推定システム及びコンピュータプログラム - Google Patents
状態推定装置、状態推定システム及びコンピュータプログラム Download PDFInfo
- Publication number
- JP4811997B2 JP4811997B2 JP2005320988A JP2005320988A JP4811997B2 JP 4811997 B2 JP4811997 B2 JP 4811997B2 JP 2005320988 A JP2005320988 A JP 2005320988A JP 2005320988 A JP2005320988 A JP 2005320988A JP 4811997 B2 JP4811997 B2 JP 4811997B2
- Authority
- JP
- Japan
- Prior art keywords
- observation
- state
- result
- estimated
- reinforcement learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Feedback Control In General (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
ディー.ジー.ルエンバーガー(D.G.Luenberger),Anintroduction to observers,IEEETrans.,AC,Vol.16,P.596-602,1971 アール.イー.カルマン、アール.エス.ビューシー(R.E.Kalman and R.S.Bucy),New results in linear filtering and prediction theory,Trans.,ASME,Series D,J.ofBasic Engineering,Vol.83,No.1,P.95-108,1961 エフ.エル.ルイス(F.L.Lewis),Optimal Estimation:with an Introduction to Stochastic Control Theory,John Wilkey & Sons,1977
2 制御装置
3 強化学習状態推定装置
3a 模擬モデル
3b 強化学習モジュール
3c 出力関数
3d 報酬関数
300 コンピュータプログラム
301 記録媒体
Claims (4)
- 観測対象の状態を観測した観測結果に基づいて前記観測対象の状態を推定する状態推定装置において、
前記観測対象の状態を推定する模擬モデルと、
該模擬モデルによる状態の推定結果に基づいて、観測結果を推定した推定観測結果を算出する手段と、
推定観測結果及び観測結果、並びに推定観測結果及び観測結果の差を用いて、強化学習モジュールにおける状態推定の方策に基づくフィードバック値を算出する強化学習モジュールと、
推定観測結果及び観測結果の差並びにフィードバック値に基づいて、報酬値を算出する手段と、
算出した報酬値を用いて強化学習モジュールの方策を更新する更新手段と、
前記強化学習モジュールにて算出されたフィードバック値に基づいて、前記模擬モデルの観測対象の状態を推定する手段と
を備え、
前記更新手段は、報酬値に応じて更新される学習パラメータに基づく平均値及び標準偏差にて示される正規分布に従って分布するように方策を更新する
ことを特徴とする状態推定装置。 - 前記学習パラメータは、報酬値の移動平均を用いた関数に基づいて更新される様に構成してあることを特徴とする請求項1に記載の状態推定装置。
- 観測対象と、
該観測対象の状態を推定する請求項1又は請求項2に記載の状態推定装置と、
前記観測対象を制御する制御装置と
を備え、
前記状態推定装置の模擬モデルは、前記観測対象の状態の推定結果を前記制御装置へ出力する手段を更に備え、
前記制御装置は、
受け付けた推定結果に基づいて、観測対象を制御する制御命令を生成する手段と、
生成した制御命令を前記観測対象へ出力する手段と
を備え、
前記観測対象は、受け付けた制御命令に従って動作する手段を備える
ことを特徴とする状態推定システム。 - 観測対象の状態を観測した観測結果の入力を受け付けるコンピュータに、受け付けた観測結果に基づいて、前記制御対象の状態を推定させるコンピュータプログラムにおいて、
コンピュータに、前記観測対象の状態を模する模擬モデルを用いて、前記観測対象の状態を推定させる手順と、
コンピュータに、前記模擬モデルによる状態の推定結果に基づいて、観測結果を推定した推定観測結果を算出させる手順と、
コンピュータに、推定観測結果及び観測結果、並びに推定観測結果及び観測結果の差を用いて、強化学習モジュールにおける状態推定の方策に基づくフィードバック値を算出させる手順と、
コンピュータに、推定観測結果及び観測結果の差並びにフィードバック値に基づいて、
報酬値を算出させる手順と、
コンピュータに、算出した報酬値を用いて強化学習モジュールの方策を更新させる手順と、
コンピュータに、前記強化学習モジュールにて算出されたフィードバック値に基づいて、前記模擬モデルの観測対象の状態を推定させる手順と
を実行させ、
前記更新させる手順は、報酬値に応じて更新される学習パラメータに基づく平均値及び標準偏差にて示される正規分布に従って分布するように方策を更新する
ことを特徴とするコンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005320988A JP4811997B2 (ja) | 2005-11-04 | 2005-11-04 | 状態推定装置、状態推定システム及びコンピュータプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005320988A JP4811997B2 (ja) | 2005-11-04 | 2005-11-04 | 状態推定装置、状態推定システム及びコンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007128318A JP2007128318A (ja) | 2007-05-24 |
JP4811997B2 true JP4811997B2 (ja) | 2011-11-09 |
Family
ID=38150926
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005320988A Expired - Fee Related JP4811997B2 (ja) | 2005-11-04 | 2005-11-04 | 状態推定装置、状態推定システム及びコンピュータプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4811997B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11928556B2 (en) * | 2018-12-29 | 2024-03-12 | International Business Machines Corporation | Removing unnecessary history from reinforcement learning state |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7067895B2 (ja) * | 2017-10-25 | 2022-05-16 | 株式会社東芝 | 末端圧力制御支援装置、末端圧力制御支援方法及びコンピュータプログラム |
CN110895876B (zh) * | 2018-09-11 | 2021-07-20 | 深圳云天励飞技术有限公司 | 一种车辆监控方法、装置及存储介质 |
CN109447422A (zh) * | 2018-10-08 | 2019-03-08 | 北京百分点信息科技有限公司 | 一种基于系统动力学模型的政策模拟系统及方法 |
JP7302226B2 (ja) * | 2019-03-27 | 2023-07-04 | 株式会社ジェイテクト | 研削盤の支援装置及び支援方法 |
CN110837231A (zh) * | 2019-11-15 | 2020-02-25 | 清华大学 | 在环仿真方法、装置及控制平台 |
JP7331660B2 (ja) * | 2019-11-26 | 2023-08-23 | 横河電機株式会社 | 装置、方法およびプログラム |
JP7368725B2 (ja) | 2020-01-10 | 2023-10-25 | 日本製鉄株式会社 | 溶鋼流動制御装置、溶鋼流動制御方法、およびプログラム |
JP7484382B2 (ja) | 2020-04-24 | 2024-05-16 | 横河電機株式会社 | 制御装置、制御方法および制御プログラム |
WO2022249335A1 (ja) * | 2021-05-26 | 2022-12-01 | 日本電気株式会社 | 情報処理装置、情報処理方法、情報処理システム、およびプログラム |
CN113878588B (zh) * | 2021-11-12 | 2023-03-31 | 哈尔滨工业大学(深圳) | 面向卡扣式连接的基于触觉反馈的机器人柔顺装配方法 |
-
2005
- 2005-11-04 JP JP2005320988A patent/JP4811997B2/ja not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11928556B2 (en) * | 2018-12-29 | 2024-03-12 | International Business Machines Corporation | Removing unnecessary history from reinforcement learning state |
Also Published As
Publication number | Publication date |
---|---|
JP2007128318A (ja) | 2007-05-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4811997B2 (ja) | 状態推定装置、状態推定システム及びコンピュータプログラム | |
US10120396B2 (en) | Control device for machine apparatus and gain determination method for friction compensation | |
EP3379349B1 (en) | Control device, control program, and control system | |
JP4952025B2 (ja) | 運転制御方法,運転制御装置及び運転制御システム | |
Pereira et al. | Adaptive input shaping for single-link flexible manipulators using an algebraic identification | |
CN111433689B (zh) | 用于目标系统的控制系统的生成 | |
US10591876B2 (en) | Method and system for adaptive compensation of dry friction | |
Li et al. | Global finite-time adaptive control for uncalibrated robot manipulator based on visual servoing | |
KR100696751B1 (ko) | 프로세스 제어장치의 조정방법, 그 조정 툴 및 이를사용한 프로세스 제어장치 | |
JP4453526B2 (ja) | サーボ制御装置 | |
JP2006127079A (ja) | 制御対象モデル生成装置および生成方法 | |
JP2009175917A (ja) | 制御パラメータ調整方法および制御パラメータ調整プログラム | |
US20190138886A1 (en) | System state prediction | |
JP5740433B2 (ja) | 遅延補償装置、方法、プログラム及び記録媒体 | |
US20130018612A1 (en) | Device and method for observing or controlling a non-linear system | |
JP2014117787A (ja) | 制御装置 | |
JP7115654B1 (ja) | 制御装置、制御方法及びプログラム | |
JP2020140641A (ja) | 情報処理装置及び情報処理方法 | |
JPWO2019142728A1 (ja) | 制御装置、制御方法およびプログラム | |
JP5561519B2 (ja) | プラントシミュレータ | |
WO2020162200A1 (ja) | 制御装置および制御プログラム | |
Zhao et al. | Robust output tracking control for a class of uncertain nonlinear systems using extended state observer | |
CN113219842A (zh) | 基于自适应动态规划的机械臂最优跟踪控制方法、系统、处理设备、存储介质 | |
CN101943889A (zh) | 使电气传动系统调节器自动启动和/或运行的方法及装置 | |
JP2020003893A (ja) | ロバスト調整装置及びモデル作成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080820 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080820 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110222 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110419 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110517 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110705 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110726 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110819 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140902 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |