JP2021135940A - 情報処理装置、制御システム、制御変数決定方法、および制御変数決定プログラム - Google Patents
情報処理装置、制御システム、制御変数決定方法、および制御変数決定プログラム Download PDFInfo
- Publication number
- JP2021135940A JP2021135940A JP2020033904A JP2020033904A JP2021135940A JP 2021135940 A JP2021135940 A JP 2021135940A JP 2020033904 A JP2020033904 A JP 2020033904A JP 2020033904 A JP2020033904 A JP 2020033904A JP 2021135940 A JP2021135940 A JP 2021135940A
- Authority
- JP
- Japan
- Prior art keywords
- control
- control variable
- distribution
- crane
- information processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 63
- 238000009826 distribution Methods 0.000 claims abstract description 175
- 238000004364 calculation method Methods 0.000 claims abstract description 64
- 230000006870 function Effects 0.000 claims description 104
- 230000010365 information processing Effects 0.000 claims description 64
- 238000011156 evaluation Methods 0.000 abstract description 48
- 230000008569 process Effects 0.000 description 41
- 238000005457 optimization Methods 0.000 description 21
- 239000000428 dust Substances 0.000 description 18
- 238000002474 experimental method Methods 0.000 description 18
- 239000002699 waste material Substances 0.000 description 11
- 238000012545 processing Methods 0.000 description 10
- 238000003756 stirring Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 239000011159 matrix material Substances 0.000 description 6
- 230000007246 mechanism Effects 0.000 description 6
- 206010001497 Agitation Diseases 0.000 description 5
- 238000013019 agitation Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 4
- 239000000203 mixture Substances 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 210000000078 claw Anatomy 0.000 description 2
- 230000003028 elevating effect Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000001965 increasing effect Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000000692 Student's t-test Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013398 bayesian method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012353 t test Methods 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B19/00—Programme-control systems
- G05B19/02—Programme-control systems electric
- G05B19/04—Programme control other than numerical control, i.e. in sequence controllers or logic controllers
- G05B19/042—Programme control other than numerical control, i.e. in sequence controllers or logic controllers using digital processors
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B66—HOISTING; LIFTING; HAULING
- B66C—CRANES; LOAD-ENGAGING ELEMENTS OR DEVICES FOR CRANES, CAPSTANS, WINCHES, OR TACKLES
- B66C13/00—Other constructional features or details
- B66C13/18—Control systems or devices
- B66C13/48—Automatic control of crane drives for producing a single or repeated working cycle; Programme control
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/10—Machine learning using kernel methods, e.g. support vector machines [SVM]
Landscapes
- Engineering & Computer Science (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Mechanical Engineering (AREA)
- Feedback Control In General (AREA)
- Testing And Monitoring For Control Systems (AREA)
- Refuse Collection And Transfer (AREA)
- Control And Safety Of Cranes (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
(システム概要)
本発明の一実施形態に係る制御システム9の概要を図2に基づいて説明する。図2は、制御システム9の概要を示す図である。図示のように、制御システム9には、情報処理装置1Aと、制御装置3と、クレーン5とが含まれる。
情報処理装置1Aの構成を図1に基づいて説明する。図1は、情報処理装置1Aの要部構成の一例を示すブロック図である。なお、以下では、情報処理装置1Aが、ベイズ最適化(以下、BOと呼ぶ)により、所望の制御結果が期待できる制御変数を決定する例、つまりBOで制御変数を最適化する例を説明する。
それに対する評価値は、
情報処理装置1Aがクレーン5の制御変数を決定する処理(制御変数決定方法)の流れを図3に基づいて説明する。図3は、クレーン5の制御変数を決定する処理の一例を示すフローチャートである。
本発明の他の実施形態について、以下に説明する。なお、説明の便宜上、上記実施形態にて説明した部材と同じ機能を有する部材については、同じ符号を付記し、その説明を繰り返さない。
本実施形態に係る情報処理装置1Bの構成を図5に基づいて説明する。図5は、情報処理装置1Bの要部構成の一例を示すブロック図である。図示のように、情報処理装置1Bは、情報処理装置1Bの各部を統括して制御する制御部10Bを備えている。図1に示す情報処理装置1Aの制御部10Aと、制御部10Bとの相違点は、制御部10Bには予測分布算出部102の代わりに予測分布算出部301が含まれている点にある。
実施形態1と同じく、制御結果データ201にN点の制御変数が含まれていた場合、それらの制御変数は、
それに対する評価値は、
上述のように、本実施形態におけるタスクは、クレーン5に実行させる動作あるいは作業である。タスクが変われば最適な制御変数も変わる。しかし、他のタスクであっても類似したタスク(以下、類似タスクと呼ぶ)であれば評価関数の予測分布も類似する場合があり、そのような場合には、当該類似タスクの制御結果データを利用することができる。以下では、他のタスクの制御結果データを利用して予測分布を算出または更新する方法について述べる。
k((θ,t),(θ’,t’))=kt(t,t’)kθ(θ,θ’) (22)
タスクカーネルは、タスク類似度を示す関数であるが、入力であるタスクラベルtnが同一タスクを区別するためのラベルであるため、タスクラベルtnの値からタスクの類似度を計算することはできない。また、タスク数がM個であるため、タスクカーネルの出力はM×M個のパターンである。そのため、M次正方行列Ktを用いてタスクカーネルを表現し、タスクカーネルに入力されたタスクラベルが示す要素の値を、タスクカーネルの出力とする。
kt(t,t’)=[Kt]t,t’ (23)
また、タスクカーネルをカーネル関数として用いるためには、Ktが正定行列である必要がある。そこで、コレスキー分解を利用して、Ktを下三角行列LによってKt=LLTと分解する。これにより、下三角行列LのM(M+1)/2個の要素をタスクカーネルのパラメータαtとし、このパラメータαtを変分推論の枠組みの中で最適化して、制御結果データからタスク間の類似度を学習することができる。なお、タスク間の類似度を学習するとは、タスク間の類似度が反映されるように(類似タスクの制御結果データの寄与度が非類似タスクの制御結果データの寄与度よりも大きくなるように)事後分布を更新することを意味する。
情報処理装置1Bがクレーン5の制御変数を決定する処理の流れを説明する。この処理の流れは、図3に示した情報処理装置1Aの処理の流れと概ね同様であるが、S2およびS8とS3の処理が相違している。以下ではこの相違点を中心に説明する。
情報処理装置1Aおよび1Bの効果を検証するための実験を行った。その結果を図7および図8に基づいて説明する。図7は、実験結果を示す図である。図8は、実験10〜12における最適化終了時のタスクカーネルを示す図である。
E(θ)=5−10×RMS(w(θ)−wI) (24)
上述のように、模擬的なごみも実際のごみピットに貯留されているごみと同様に不均質であるから、同じ動作パラメータでもw(θ)が大きく異なる場合があり、評価値E(θ)に影響する。
情報処理装置1Aおよび1Bの制御ブロック(特に制御部10Aおよび制御部10Bに含まれる各部)は、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよいし、ソフトウェアによって実現してもよい。
本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
102 予測分布算出部
103 制御変数探索部
104 制御変数決定部
201 制御結果データ
1B 情報処理装置
301 予測分布算出部
3 制御装置
5 クレーン
9 制御システム
Claims (6)
- 予測分布算出部と、
制御変数探索部と、
制御変数決定部と、を備える情報処理装置であって、
上記予測分布算出部は、ごみを運搬するクレーンの制御変数と、該制御変数を用いて上記クレーンを制御した制御結果とを対応付けた制御結果データを用いて、当該制御変数と当該制御結果との関係を示す関数の予測分布を算出し、
上記制御変数探索部は、上記予測分布に基づいて上記制御変数の最適値の候補である候補制御変数を探索し、
上記予測分布算出部は、上記制御変数探索部が検出した上記候補制御変数と、当該候補制御変数を用いて上記クレーンを制御した制御結果と、を用いて上記予測分布を更新し、
上記制御変数決定部は、上記更新後の上記予測分布に基づいて構成される関数を用いて、上記制御変数の最適値を決定する、情報処理装置。 - 上記予測分布算出部は、複数の上記制御結果データのそれぞれの上記予測分布算出における寄与度を、当該制御結果データの信頼度に応じた寄与度として、上記予測分布を算出または更新する、請求項1に記載の情報処理装置。
- 上記予測分布算出部は、上記制御変数を用いて上記クレーンに行わせるタスクとは異なる他のタスクの制御結果データの上記予測分布算出における寄与度を、当該他のタスクと上記タスクとの類似度に応じた寄与度として、上記予測分布を算出または更新する、請求項1または2に記載の情報処理装置。
- 請求項1から3の何れか1項に記載の情報処理装置と、
上記制御変数を用いて上記クレーンを制御する制御装置と、
上記クレーンと、を含む制御システム。 - 1または複数の情報処理装置によって実行される制御変数決定方法であって、
ごみを運搬するクレーンの制御変数と、該制御変数を用いて上記クレーンを制御した制御結果とを対応付けた制御結果データを用いて、当該制御変数と当該制御結果との関係を示す関数の予測分布を算出する予測分布算出ステップと、
上記予測分布に基づいて上記制御変数の最適値の候補である候補制御変数を探索する制御変数探索ステップと、
上記制御変数探索ステップで検出した上記候補制御変数と、当該候補制御変数を用いて上記クレーンを制御した制御結果と、を用いて上記予測分布を更新する更新ステップと、
上記更新後の上記予測分布に基づいて構成される関数を用いて、上記制御変数の最適値を決定する制御変数決定ステップと、を含む制御変数決定方法。 - 請求項1に記載の情報処理装置としてコンピュータを機能させるための制御変数決定プログラムであって、上記予測分布算出部、上記制御変数探索部、および上記制御変数決定部としてコンピュータを機能させるための制御変数決定プログラム。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020033904A JP7450212B2 (ja) | 2020-02-28 | 2020-02-28 | 情報処理装置、制御システム、制御変数決定方法、および制御変数決定プログラム |
EP20922289.2A EP4112498A4 (en) | 2020-02-28 | 2020-11-30 | INFORMATION PROCESSING DEVICE, CONTROL SYSTEM, CONTROL VARIABLE DETERMINATION METHOD, AND CONTROL VARIABLE DETERMINATION PROGRAM |
CN202080097673.7A CN115175868A (zh) | 2020-02-28 | 2020-11-30 | 信息处理装置、控制系统、控制变量确定方法、及控制变量确定程序 |
PCT/JP2020/044442 WO2021171720A1 (ja) | 2020-02-28 | 2020-11-30 | 情報処理装置、制御システム、制御変数決定方法、および制御変数決定プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020033904A JP7450212B2 (ja) | 2020-02-28 | 2020-02-28 | 情報処理装置、制御システム、制御変数決定方法、および制御変数決定プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021135940A true JP2021135940A (ja) | 2021-09-13 |
JP7450212B2 JP7450212B2 (ja) | 2024-03-15 |
Family
ID=77490828
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020033904A Active JP7450212B2 (ja) | 2020-02-28 | 2020-02-28 | 情報処理装置、制御システム、制御変数決定方法、および制御変数決定プログラム |
Country Status (4)
Country | Link |
---|---|
EP (1) | EP4112498A4 (ja) |
JP (1) | JP7450212B2 (ja) |
CN (1) | CN115175868A (ja) |
WO (1) | WO2021171720A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024034243A1 (ja) * | 2022-08-08 | 2024-02-15 | 日立造船株式会社 | 情報処理装置、制御システム、探索方法、および探索プログラム |
WO2024128090A1 (ja) * | 2022-12-12 | 2024-06-20 | 日立造船株式会社 | 情報処理装置、制御システム、探索方法、および探索プログラム |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116703893B (zh) * | 2023-08-01 | 2023-09-29 | 四川深山农业科技开发有限公司 | 一种基于机器视觉的魔芋凝胶测控方法 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0592891A (ja) * | 1991-09-30 | 1993-04-16 | Kawasaki Steel Corp | アンローダの掴み量制御方法 |
JPH1121077A (ja) * | 1997-07-01 | 1999-01-26 | Toshiba Corp | クレーン制御装置 |
US6625500B1 (en) * | 1999-03-16 | 2003-09-23 | Chou H. Li | Self-optimizing method and machine |
JP2003176093A (ja) | 2001-12-11 | 2003-06-24 | Toshiba Ge Automation Systems Corp | クレーンの振れ止め・位置制御装置及び旋回振れ止め・旋回位置制御装置 |
JP5185197B2 (ja) | 2009-05-28 | 2013-04-17 | 株式会社神戸製鋼所 | ごみ攪拌評価方法及びごみ攪拌評価プログラム、並びにごみ攪拌評価装置 |
US10139809B2 (en) * | 2016-01-14 | 2018-11-27 | Rockwell Automation Technologies, Inc. | Optimization based controller tuning systems and methods |
WO2017188328A1 (ja) | 2016-04-28 | 2017-11-02 | 日立造船株式会社 | 計算装置、計算装置の制御方法、制御プログラム、および記録媒体 |
JP6659474B2 (ja) * | 2016-06-09 | 2020-03-04 | 日立造船株式会社 | クレーン制御装置、クレーン制御装置の制御方法、制御プログラム、および記録媒体 |
US20210089952A1 (en) | 2018-06-19 | 2021-03-25 | Shimadzu Corporation | Parameter-searching method, parameter-searching device, and program for parameter search |
-
2020
- 2020-02-28 JP JP2020033904A patent/JP7450212B2/ja active Active
- 2020-11-30 WO PCT/JP2020/044442 patent/WO2021171720A1/ja unknown
- 2020-11-30 EP EP20922289.2A patent/EP4112498A4/en active Pending
- 2020-11-30 CN CN202080097673.7A patent/CN115175868A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024034243A1 (ja) * | 2022-08-08 | 2024-02-15 | 日立造船株式会社 | 情報処理装置、制御システム、探索方法、および探索プログラム |
WO2024128090A1 (ja) * | 2022-12-12 | 2024-06-20 | 日立造船株式会社 | 情報処理装置、制御システム、探索方法、および探索プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP7450212B2 (ja) | 2024-03-15 |
EP4112498A4 (en) | 2024-04-10 |
WO2021171720A1 (ja) | 2021-09-02 |
CN115175868A (zh) | 2022-10-11 |
EP4112498A1 (en) | 2023-01-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021171720A1 (ja) | 情報処理装置、制御システム、制御変数決定方法、および制御変数決定プログラム | |
Uchendu et al. | Jump-start reinforcement learning | |
Kang et al. | Policy optimization with demonstrations | |
Zhang et al. | Automatic curriculum learning through value disagreement | |
Nagabandi et al. | Deep online learning via meta-learning: Continual adaptation for model-based rl | |
Guo et al. | Autosem: Automatic task selection and mixing in multi-task learning | |
US10466658B2 (en) | Numerical controller and machine learning device | |
Malik et al. | Calibrated model-based deep reinforcement learning | |
Kim et al. | Imitation learning via kernel mean embedding | |
Boney et al. | Regularizing model-based planning with energy-based models | |
Saleh et al. | You only design once (YODO): Gaussian Process-Batch Bayesian optimization framework for mixture design of ultra high performance concrete | |
US12005580B2 (en) | Method and device for controlling a robot | |
Liang et al. | Evolutionary bilevel optimization for complex control tasks | |
Price et al. | A Bayesian approach to imitation in reinforcement learning | |
CN112509392A (zh) | 一种基于元学习的机器人行为示教方法 | |
Lakhani et al. | Stability-preserving automatic tuning of PID control with reinforcement learning | |
Muñoz et al. | CollisionGP: Gaussian process-based collision checking for robot motion planning | |
JP7371535B2 (ja) | 自動運転制御装置、自動運転制御システム、自動運転制御方法、および廃棄物処理施設 | |
JP7378309B2 (ja) | 作業装置 | |
Kuzmin et al. | Hierarchical reinforcement learning with options and united neural network approximation | |
JP2023125953A (ja) | 情報処理装置、クレーン制御システム、学習方法、および学習プログラム | |
Azizzadenesheli | Maybe a few considerations in Reinforcement Learning Research? | |
Dantas et al. | The impact of state representation on approximate Q-learning for a selection hyper-heuristic | |
Jha et al. | Data efficient learning of robust control policies | |
Turchetta | Safety and robustness in reinforcement learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230207 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231107 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231222 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240206 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240226 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7450212 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |