JP2720605B2 - 学習制御装置 - Google Patents

学習制御装置

Info

Publication number
JP2720605B2
JP2720605B2 JP503291A JP503291A JP2720605B2 JP 2720605 B2 JP2720605 B2 JP 2720605B2 JP 503291 A JP503291 A JP 503291A JP 503291 A JP503291 A JP 503291A JP 2720605 B2 JP2720605 B2 JP 2720605B2
Authority
JP
Japan
Prior art keywords
input
vector
output
equation
qualitative model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP503291A
Other languages
English (en)
Other versions
JPH04211801A (ja
Inventor
成彰 松林
修 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP503291A priority Critical patent/JP2720605B2/ja
Publication of JPH04211801A publication Critical patent/JPH04211801A/ja
Application granted granted Critical
Publication of JP2720605B2 publication Critical patent/JP2720605B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Feedback Control In General (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、例えば歩行ロボットや
化学プラントなどのように、入出力間の関係をあらかじ
め正確に把握する事が困難な制御対象を制御する事が可
能な学習制御装置に関するものである。
【0002】
【従来の技術】従来の学習制御装置としては、例えば、
論文 ”行動する機械”(生体の科学,Vol.37, No.1, p
p.41-48, 1986年)において、中野によって提案されて
いるものがある。この論文では、図2に示された歩行ロ
ボットの制御について論じている。
【0003】図2において、歩行ロボット105は前足
102Aおよび後足102Bより構成されており、胴体
100で接続されている。さらに前足102Aおよび後
足102Bはそれぞれモーター103Aおよび103B
で駆動されており、各モータの回転はドライバー回路1
04より指令されている。また歩行ロボットが移動した
距離は出力検出器106で検出される。
【0004】以上のように構成された歩行ロボット10
5の動作は(数2)式のように表現できる。
【0005】
【数2】
【0006】ここで、yは歩行ロボットの出力である歩
行距離、U=(u1A、u1B、u2A、u2B)は歩行ロボッ
トの前足102Aおよび後足102Bへの入力ベクトル
であるモータ回転角ベクトル、gは正確に把握すること
が困難な関数である。また、u1Aは動作前の前足の角
度、u1Bは動作後の前足の角度、u2Aは動作前の後足の
角度、u2Bは動作後の後足の角度である。
【0007】(数2)式のyをできるだけ大きくするよ
うなUを求めるために、従来の学習制御装置は、一般的
に以下の手順から構成される「山登り法」を用いてい
る。
【0008】 手順1: 例えば (△u1A,0,0,0)、(0,-△
1B,△u2A,△u2B)などの、微小な値を各要素に持つ
入力変化ベクトル△Uiを△U1,…,△U81と81個作
成する。この例では、入力変化ベクトルの個数は34
81個となり、”3”は各要素の符号の種類数、すなわ
ち”+”、”−”あるいは”0”の3個に相当し、ベキ
数”4”は入力変化ベクトル△Uiの次数に相当する。
【0009】 手順2: 現在の入力ベクトルUに上記の入力変化ベク
トルを一つづつ加えて、すなわち、Ui←U+△Uiとし
て歩行ロボットに入力し、その時の出力変化 △
1,...,△y81を検出する。
【0010】 手順3: 上記の出力変化を最大にする入力変化ベクト
ル △Uj を選び、現在の入力ベクトルUをU←U+△
jと更新して、手順2〜3を繰り返す。ただし、上記
の出力変化が全て負または零の時は、現在の入力ベクト
ルが所望のベクトルであるので、上記の繰り返しを終了
する。
【0011】
【発明が解決しようとする課題】この学習制御装置は、
全く同一の構成を用いて、歩行ロボットに限らず、特性
のわからないあらゆる制御対象に適用可能であるという
利点を持つ。しかしながら、手順2においては81回も
の試行が必要であり、仮に出力yが極大値に達するまで
に必要な手順2〜3の繰り返し回数を10とすると、合
計で810回という極めて多くの試行を繰り返さなけれ
ばならないという実用上の課題があった。
【0012】
【課題を解決するための手段】したがって本発明の目的
は、従来の学習制御装置と比較して、必要な繰り返し回
数が極めて少ない学習制御装置を提供する事である。
【0013】この目的を達成するために、本発明は以下
のような構成を備えたものである。即ち、制御対象に印
加する制御入力Uを変化させる複数の入力変化ベクトル
ΔU iを発生させる手段と、前記入力変化ベクトルΔUi
に所定の定性モデルにもとづいた演算を行ない予測符号
データ
【0014】
【数3】
【0015】を出力する定性モデル演算手段と、前記制
御対象の出力yを検出する検出手段と、前記検出手段の
検出値yと目標値ydとの差の値の符号を検出する誤差
符号検出手段と、前記誤差符号検出手段の出力[e]及
び前記予測符号データ(数3)に基づいて、前記入力変
化ベクトルΔUiを選択する入力変化ベクトル選択回路
と、前記制御対象の出力の値の変化を表す所定の符号を
検出する出力符号検出手段と、前記入力ベクトル選択回
路で選択された入力変化ベクトルを前記制御対象の入力
に加算する入力ベクトル更新手段と、前記制御対象の入
力及び前記出力符号検出手段の検出出力に基づいて前記
定性モデルを修正する定性モデル修正手段とを具備する
ことを特徴とする学習制御装置を提供するものである。
【0016】
【作用】本発明によれば、定性モデル演算手段および入
力変化ベクトル選択手段において、出力yを所望の目標
値ydに近づけることができる入力変化ベクトル△Uj
みを選択し、これについてのみ試行するために、従来の
ようにすべての入力変化ベクトルについて試行する必要
がなく、出力yが目標値ydに一致するまでの繰り返し
回数を極めて少なくすることができる。さらに状態が変
化し、出力yが目標値ydから離れる傾向にある場合に
は、定性モデル修正手段において出力yが目標値yd
近づくように定性モデルを修正するため、あらゆる状態
で繰り返し回数を少なくできる効果を維持することがで
きる。
【0017】
【実施例】以下図面を用いて、本発明の第一の実施例に
ついて説明する。図1は本発明の第一の実施例における
学習制御装置のブロック図である。図1において、制御
対象は図3(a)および図3(b)に示す歩行ロボット
105である。図3(a)および図3(b)において、
歩行機械105は、胴体100に前足102Aおよび後
足102Bが取り付けられており、それぞれがモータ1
03Aおよび103Bで回動できるように構成されてい
る。床101と接触している前足先102Cおよび後足
先102Dのそれぞれの摩擦係数は互いに異なってい
る。また歩行ロボットが移動した距離は出力検出器10
6で検出される。
【0018】上記の歩行ロボット105の動作を以下に
説明する。歩行ロボットに与えられる入力ベクトルUは
(数4)式によって表される。
【0019】
【数4】
【0020】(数4)式において、u1Aは動作前の前足
の角度、u1Bは動作後の前足の角度、u2Aは動作前の後
足の角度、u2Bは動作後の後足の角度である。
【0021】制御入力Uはベクトル量であり、その要素
1A,u1B,u2A及びu2Bはいずれも実数で定義される。
【0022】前足102Aと後足102Bはそれぞれの
モータ103A及び103Bにより、図3(a)及び図
3(b)に示すように回転される。その結果前足先10
2C及び後足先102Dの床面101に対する摩擦力が
同じでない場合歩行ロボット105は一定方向に移動す
る。
【0023】歩行ロボットは図3(a)に示す状態から
図3(b)に示す状態に動作し、次に再び図3(a)に
示す状態に戻り、1サイクルの歩行動作を完了する。従
って(数4)式は歩行ロボットの半サイクルの動作を表
している。
【0024】歩行ロボット105が図3(a)、図3
(b)に示す1サイクルの歩行動作によって進む距離を
yとすると、制御入力Uと距離yの関係は(数2)式に
よって表される。この(数2)式における関数gは、前
足102Aと後足102Bにおける歩行ロボット105
の重量配分、前足102Aの長さL1と後足102Bの
長さL2の比、及び床101と各足先102C、102
D間の摩擦係数等によって変化する。
【0025】図1において、第1の実施例の学習制御装
置は、入力変化ベクトルを定める入力変化ベクトル決定
回路310、入力変化ベクトル決定回路310の出力に
基づいて、歩行ロボットに入力される入力ベクトルを更
新する入力ベクトル更新回路311、距離検出器106
の出力から移動方向の符号 (一定の方向を正又は負と
定めておく)を検出する出力符号検出回路313、定性
モデル修正回路312及び誤差符号検出回路308を有
している。
【0026】入力変化ベクトル決定回路310は次に示
す回路を有している。 (1)入力変化ベクトルメモリ301:あらかじめ定め
られた81個の入力変化ベクトルΔU1,・・・,ΔU81がメ
モリされている。入力変化ベクトルΔUiの数は「従来
の技術」の項で述べた方法により求められる。入力変化
ベクトルΔUiは4つのデータ(Δu1A,Δu1B,Δu2A,
Δu2B)を含んでおり、各データは正の値、負の値、零
のいずれかである。例えば(Δu1A,0,0,0)、(0,
−Δu1B,Δu2A,Δu2B)となる。正の値はあらかじめ
定められた方向への増加を表し、負の値は減少を表して
いる。零は変化ないことを表している。各データ(Δu
1A,Δu1B,Δu2A,Δu2B)は前足102A及び後足1
02Bの回転角度に加えられる微少角であり、例えば2
°などの微小な値が設定される。各データがすべて同じ
角度である必要はなく、互いに異なる値が設定されても
よい(例:2,−3°,0°,2°)。 (2)スイッチ305A:入力変化ベクトルメモリ30
1のデータを符号ベクトル検出器302に入力するとき
に閉にされる。 (3)符号ベクトル検出器302:入力変化ベクトルメ
モリ301から入力される入力変化ベクトルΔUiに基
づいて、その各データの符号(+,−,0)を表す符号ベ
クトル[ΔUi]を出力する。(以後[ ]に入れられた文
字はその文字が表すデータの符号“+”、“−”、ある
いは“0”を示す。)例えば入力変化ベクトルΔUi=
(0,−Δu1B,Δu2A,Δu2B)が入力されると、符号ベ
クトル[ΔUi]=(0,−,+,+)が出力される。 (4)定性モデル演算回路303: 符号ベクトル検出
器302から出力される符号ベクトル[ΔUi]に基づい
て、歩行ロボット105の移動距離yの変化方向の符号
(移動方向に対応する)を予測する演算回路を有する。
演算はあらかじめ設定された定性モデルに従って行なわ
れ、結果の予測符号データ
【0027】
【数5】
【0028】が出力される。以後文字の上のハット
“^”はその文字が表すデータの予測データを表す。
予測符号データ(数5)は出力yの変化方向を示す符号
を表しており、増加予測は“+”、減少予測は“−”、
変化なしは“0”、予測不可能は“?”のいずれかのデ
ータを有する。 (5) スイッチ305B: 定性モデル演算回路303の出力データをメモリ304
に入力するときに閉じられる。 (6) メモリ304: 定性モデル演算回路303から出力されて予測符号デー
タ(数5)はスイッチ305Bを経てメモリ304にメ
モリされる。通常81個の予測符号データ
【0029】
【数6】
【0030】がメモリされる。 (7) 入力変化ベクトル選択回路309: メモリ304からの予測符号データ(数5)と入力変化
ベクトルΔUiが入力され、そのすべての予測符号デー
タ(数6)からその符号が後に述べる誤差符号検出回路
308から入力される誤差の値の符号[e]と一致する
1個の予測符号データ
【0031】
【数7】
【0032】が選択され、定性モデル修正回路311に
印加される。この学習制御装置はさらに次の回路を備え
ている。誤差符号検出回路308は距離検出器106に
よって検出された値yと目標値ydとの差を求める誤差
演算回路306を備え、演算結果の誤差eを符号検出回
路307に入力する。符号検出回路307においては、
誤差eの値の符号[e]を検出し、入力変化ベクトル選
択回路309に入力する。符号[e]は“+”、
“−”、“0”のいずれか1つを表すデータを有してい
る。すなわち符号[e]は出力yを目標出力ydに近づ
けるために出力yを増加又は減少させるか、あるいは現
在の値を保持すべきかの情報を有している。
【0033】入力ベクトル更新回路311は入力変化ベ
クトル選択回路309から出力される入力変化ベクトル
ΔUjと現在の入力Uとを加算演算し、更新された新し
い入力Uを出力する。スイッチ316は上記の加算演算
中は開となる。
【0034】定性モデル修正回路312には入力U、予
測符号データ(数7)が入力される。また出力符号検出
回路313において、移動距離の変化方向を表す符号変
化ベクトル[△y]が検出されるとスイッチ314が閉
となり(図4のフローチャート図のステップ1,2)、
符号変化ベクトル[△y]が定性モデル修正回路312
に入力される(ステップ3)。
【0035】定性モデル修正回路312において、符号
変化ベクトル[△y]と予測符号データ(数7)が比較
され(ステップ4)、両者が等しくない場合はスイッチ
315が閉となり修正出力QA、QBが定性モデル演算回
路303に入力される(ステップ5,6)。
【0036】定性モデルについて以下に説明する。歩行
ロボットが前足102Aと後足102Bを開いた図3
(a)の姿勢から図3(b)に示す両足102A,10
2Bを閉じた姿勢へ移るとき、前足先102Cの摩擦力
が後足先102Dの摩擦力より大きいときは、前足先1
02Cは床101上をすべらず、後足先102Dのみが
床101上をすべって、歩行ロボットは図5に示すよう
に距離yABだけ移動する。この場合、前足102Aの角
度の変化量(u1A-u1B)が大きいほど移動の距離yAB
は大きい。従って後足102Bの回転量は移動距離に貢
献しない。その結果、前記の姿勢の変化による移動距離
ABは(数8)式により表される。
【0037】
【数8】
【0038】ここに、F1Aは前足先102Cの摩擦力、
2Aは後足先102Dの摩擦力である。
【0039】g1,g2は増加関数であり、g1(0)=g
2(0)=0である。 (数8)式において、式(F1A-F2A)の値の符号を判
定する必要があるが、これらの摩擦力を検出するこは極
めて困難である。そこで検知可能な角度データである入
力ベクトル(u1A,u1B,u2A,u2B)を用いてこの式
(F1A-F2A)に等価な式を表す。
【0040】(数8)式における式(F1A-F2A=0)
は前足先102Cと後足先102Dの摩擦力が等しいこ
とを表している。前足102Aの長さL1と後足102
Bの長さL2が等しく、前足102Aと床101間の摩
擦係数μ1、後足102Bと床101間の摩擦係数μ2
等しいと仮定すると、式(F1A-F2A=0)は式(u1A-
2A=0)と等価である。
【0041】上記の関係は一般には(数9)式によって
表される。
【0042】
【数9】
【0043】ここで、QAはL1,L212の関係によ
って変動する境界パラメータであり、従ってu2A-u1A-
Aは入力と境界パラメータからなる境界関数であり、
入力と同じ次元である。ただし、L1=L2 かつμ1=μ
2の時はQA=0となる。
【0044】(数9)式と(数8)式を組み合わせる
と、(数19)式が得られる。
【0045】
【数10】
【0046】同様に考えると、図3(b)から図3
(a)へ変化するときの歩行距離yBAは(数11)式で
表される。
【0047】
【数11】
【0048】また、歩行ロボットが図3(a)→図3
(b)→図3(a)と変化するとき、歩行距離yは、
(数12)式で表わされる。
【0049】
【数12】
【0050】(数9)式〜(数11)式をまとめると、
(表1)に示すようになる。
【0051】
【表1】
【0052】(表1)において、領域番号(1〜9)は
歩行ロボットに与えた入力U=(u1A,u1B,u2A,
2B)と境界パラメータQA,QBの差の値の符号によっ
て分けられる領域を示すものである。その領域は、(数
10)式において、入力値(u1A-u2 A)と境界パラメ
ータQAの差の値の符号から3通りに分けられる。また
(数11)において、入力値(u2B-u1A)と境界パラ
メータQBの差の値の符号から3通りの領域に分けられ
る。従って9(3×3=9)通りの領域に区分され、そ
れぞれの領域において歩行距離yを求めるための関数が
異なる。
【0053】境界関数の値の符号は次のようにして得ら
れる。例えば、領域番号(1)において、境界関数符号
[u2A−u1A−QA]については、 u2A−u1A−QA>0で
あるのでその値の符号は“+”である。同様にして、領
域番号(2)において、境界関数符号[u2B−u1B−Q
B]についてはu2B−u1B−QB=0であるのでその値は
“0”となる。なお、境界関数符号[u2A−u1A−QA]
や、境界関数符号[u2B−u1B−QB]のことを請求項で
は一般的な表現として定性式としている。
【0054】各領域番号における出力値yは次のように
して求められる。すなわち、領域番号(1)では、(数
10)式よりyAB=g1(u1A-u1B)、(数11)式よ
りy BA=-g1(u1A-u1B)であるので、歩行距離yは
【0055】
【数13】
【0056】となる。また、領域番号(2)では、(数
10)式よりyAB=g1(u1A-u1B)、(数11)式よ
りyBA=0であるので、歩行距離yは
【0057】
【数14】
【0058】となる。関数g1,g2が増加関数であるの
で、入力ベクトルの値の符号に対する出力の符号を予測
することができる。この「符号の予測」が定性モデル演
算回路303に設定された「定性モデル」に基づいて行
なわれる。(表2)はこの「定性モデル」を表すもので
あり、境界関数符号[u2A-u1A-QA]及び[u2B-u1B
-QB]の符号の組合せに対応する予測符号データ(数
3)が示されている。
【0059】
【表2】
【0060】(表2)において、予測符号データ(数
3)は次のようにして求められる。例えば領域番号
(1)の場合には、符号ベクトル[△Ui]=(+,
0,−,+)に対して、予測符号データ(数5)は
“0”となる。(符号ベクトル[△U i]がどのような
値をとる場合でも予測符号データ
【0061】
【数15】
【0062】となる。)領域番号(2)の場合には、例
えば符号ベクトル[△Ui]=(+,−,−,+)に対
して、予測符号データ(数5)は“+”になる。
【0063】
【数16】
【0064】また例えば、符号ベクトル[△Ui]=
(+、+、−、+)に対しては、予測符号データ(数
5)は確定した値が求まらない。
【0065】
【数17】
【0066】定性モデル修正回路312の出力は前足先
102Cと床101との摩擦係数μ1、及び後足先10
2Dと床101との摩擦係数μ2、前足102A及び後
足102Bのそれぞれの長さによって定まる境界パラメ
ータQA,QBを含んでいる。摩擦係数μ1,μ2は測定の困
難なデータであり、予測できない、従ってそれらを含ん
でいる境界パラメータQA,QBを正確に予測することが
できず、(表2)の予測が正しいとは限らない。この予
測が正しくなかった場合には、出力符号検出回路313
により検出された実際の出力値の符号データ[Δy]と入
力ベクトル選択回路309から出力される予測符号デー
(数7)が一致しない。このような場合には定性モデ
ル演算回路303で用いられる定性モデルが適正でない
と思われるので、定性モデルの境界パラメータQA,QB
を変更する。
【0067】実際の数値を当てはめた修正操作の一例を
次に示す。歩行ロボットの入力が
【0068】
【数18】
【0069】であり、QA=20゜、QB=10゜とする
と、(数10)式から
【0070】
【数19】
【0071】また(数11)式から
【0072】
【数20】
【0073】(数19)式と(数20)式の演算結果か
ら(表2)の領域番号(2)が選択される。
【0074】このとき、入力変化ベクトルとして例えば
次のデータを入力するとする。
【0075】
【数21】
【0076】この場合、予測符号データ(数3)は(表
2)から次のように計算される。
【0077】
【数22】
【0078】次に上記の入力変化ベクトルが与えられた
歩行ロボットの歩行動作終了後の符号データ[Δy]が
“−”になった場合には、領域番号の選択が間違ってい
ると予想される。そこで(表2)において、予測符号デ
ータ(数3)が“−”になる領域番号をさがす。その結
果、適合する領域番号は(4)であることがわかる
((数20)式の演算から)。
【0079】そこで、(数18)式,(数21)式のデ
ータにおいて、領域番号(4)の境界関数に適合するよ
うな境界パラメータQA,QBを求める。
【0080】(数10)式、(数11)式から
【0081】
【数23】
【0082】上の2式が成立するためにはQA',QB'の
値を次のようにすればよい。
【0083】
【数24】
【0084】ここで、“ε”は正の実数である。他方符
号データ[Δy]が“+”の場合には
【0085】
【数25】
【0086】であるので、予測符号データと符号データ
が一致する。したがって境界パラメータQA,QBの修正
はしない。
【0087】両足の摩擦係数が等しく(μ1=μ2)、か
つ前足と後足の長さが等しい(L1=L2)場合には、Q
A=QB=0である。したがって定性モデルの修正は行な
わない。その結果定性モデル修正回路312、出力変化
符号検出回路313及びスイッチ314,315のない
図6の回路を用いることができる。
【0088】また、この実施例は学習制御を歩行ロボッ
トに適用しているが、本発明の学習制御は化学プラント
や空調システム等にも適用することができる。
【0089】
【発明の効果】以上、本発明によれば、定性モデル演算
回路303および入力変化ベクトル選択回路309にお
いて、歩行距離yを所望の目標歩行距離ydに近づける
ことができる入力変化ベクトル△Ujのみを選択し、こ
れについてのみ歩行動作を行うため、従来のようにすべ
ての入力変化ベクトルについて試行する必要がなく、目
標歩行距離ydに到達するまでの歩行動作の繰り返し回
数を極めて少なくすることができる。さらに、摩擦係数
μ1およびμ2や前足102Aの長さL1および後足10
2Bの長さL2が変化し、歩行距離yが目標歩行距離yd
から離れる傾向にある場合には、定性モデル修正回路に
おいて歩行距離yが目標歩行距離ydに近づくように定
性モデルを修正するため、繰り返し回数を少なくできる
効果を維持することができる。実際に実験では、同じ目
標歩行距離ydに到達するのに、従来例では既に述べた
ように約810回の試行を必要としていたのに対し、本
発明では約10回の試行で実現でき、大きな効果を確認
できた。
【図面の簡単な説明】
【図1】本発明の第1の実施例における学習制御装置の
ブロック図である。
【図2】本発明の学習制御装置の制御対象の一例であ
る、歩行ロボットの斜視図である。
【図3】本発明の学習制御装置の制御対象の一例であ
る、歩行ロボットの動作例を表わす正面図である。
【図4】本発明の第1の実施例である学習制御装置にお
ける定性モデル修正回路と出力符号検出回路の動作を示
すフローチャート図である。
【図5】本発明の学習制御装置の制御対象の一例であ
る、歩行ロボットの動作中を示す正面図である。
【図6】本発明の第2の実施例における学習制御装置の
ブロック図である。
【符号の説明】
100 胴体 101 床 102A 前足 102B 後足 102C 前足先 102D 後足先 103A モータ 103B モータ 104 ドライバー回路 105 歩行ロボット 106 出力検出器 305A、305B スイッチ 306 誤差演算回路 308 誤差符号検出回路 310 入力変化ベクトル決定回路 311 入力ベクトル更新回路 314 スイッチ 315 スイッチ 316 スイッチ

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】制御対象に印加する制御入力Uを変化させ
    る複数の入力変化ベクトルΔUiを発生させる手段と、
    前記入力変化ベクトルΔUiに所定の定性モデルにもと
    づいた演算を行い予測符号データ 【数1】 を出力する定性モデル演算手段と、前記制御対象の出力
    yを検出する検出手段と、前記検出手段の検出値yと目
    標値ydとの差の値の符号を検出する誤差符号検出手段
    と、前記誤差符号検出手段の出力[e]及び前記予測符号
    データ(数1)に基づいて、前記入力変化ベクトルΔU
    iを選択する入力変化ベクトル選択回路と、前記制御対
    象の出力の値の変化を表す所定の符号を検出する出力符
    号検出手段と、前入力ベクトル選択回路で選択された入
    力変化ベクトルを前記制御対象の入力に加算する入力ベ
    クトル更新手段と、前記制御対象の入力及び前記出力符
    号検出手段の検出出力および前記予測符号データに基づ
    いて前記定性モデルを修正する定性モデル修正手段を具
    備し、前記制御対象の出力yを目標値Ydに一致させる
    学習制御装置。
  2. 【請求項2】定性モデル演算手段は入力ベクトルUと少
    なくとも1つの境界パラメータを有する境界関数と前記
    入力ベクトルを前記境界関数に代入することによって得
    られる値の符号に対応する少なくとも1つの定性式によ
    って表される定性モデルを有することを特徴とする請求
    項1記載の学習制御装置。
  3. 【請求項3】定性モデル修正手段は、境界パラメータを
    変更する手段を有することを特徴とする請求項2記載の
    学習制御装置。
  4. 【請求項4】制御対象に印加する制御入力Uを変化させ
    る複数の入力変化ベクトルΔUiを発生させる手段と、
    前記入力変化ベクトルΔUiに所定の定性モデルにもと
    づいた演算を行い予測符号データ(数1)を出力する定
    性モデル演算手段と、前記制御対象の出力yを検出する
    検出手段と、前記検出手段の検出値yと目標値ydとの
    差の値の符号を検出する誤差符号検出手段と、前記誤差
    符号検出手段の出力[e]及び前記予測符号データ(数
    1)に基づいて、前記入力変化ベクトルΔUiを選択す
    る入力変化ベクトル選択回路と、前記入力ベクトル選択
    回路で選択された入力変化ベクトルを前記制御対象の入
    力に加算する入力ベクトル更新手段を具備し、前記制御
    対象の出力yを目標値Ydに一致させる学習制御装置。
  5. 【請求項5】定性モデル演算手段は入力ベクトルUと少
    なくとも1つの境界パラメータを有する境界関数と、前
    記入力ベクトルを前記境界関数に代入することによって
    得られる値の符号に対応する少なくとも1つの定性式に
    よって表される定性モデルを有することを特徴とする請
    求項4記載の学習制御装置。
JP503291A 1990-01-22 1991-01-21 学習制御装置 Expired - Fee Related JP2720605B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP503291A JP2720605B2 (ja) 1990-01-22 1991-01-21 学習制御装置

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP1314190 1990-01-22
JP19363890 1990-07-20
JP2-193638 1990-07-20
JP2-13141 1990-07-20
JP503291A JP2720605B2 (ja) 1990-01-22 1991-01-21 学習制御装置

Publications (2)

Publication Number Publication Date
JPH04211801A JPH04211801A (ja) 1992-08-03
JP2720605B2 true JP2720605B2 (ja) 1998-03-04

Family

ID=27276567

Family Applications (1)

Application Number Title Priority Date Filing Date
JP503291A Expired - Fee Related JP2720605B2 (ja) 1990-01-22 1991-01-21 学習制御装置

Country Status (1)

Country Link
JP (1) JP2720605B2 (ja)

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
平井成興、外2名、「ロボット作業動作改良への定性推論の応用」、電気学会システム・制御研究資料、電気学会、平成元年、SC−89−8、P.1−10

Also Published As

Publication number Publication date
JPH04211801A (ja) 1992-08-03

Similar Documents

Publication Publication Date Title
Gutmann et al. An experimental comparison of localization methods continued
US7072741B2 (en) Robot control algorithm constructing apparatus
US20150343633A1 (en) Robot with joints of variable rigidity and method for calculating said optimized rigidity
JP2019166626A (ja) 制御装置及び機械学習装置
JPH11509344A (ja) 範囲制御を使用した多変数予想コントローラにおいて変数の最適スケーリングを行う方法
US11897066B2 (en) Simulation apparatus
Lin et al. An ensemble method for inverse reinforcement learning
JP2720605B2 (ja) 学習制御装置
JPH04364536A (ja) ファジィ推論ルールの自動生成装置
JPH11514774A (ja) 設定値生成器を用いての制御
Nayak et al. Parameter estimation of DC motor using adaptive transfer function based on Nelder-Mead optimisation
EP0439091B1 (en) Adaptive control system
JPH056202A (ja) 学習制御装置
WO2003045640A1 (en) An industrial robot system and a method for programming thereof
Zelek A framework for mobile robot concurrent path planning and execution in incomplete and uncertain environments
JP2009245195A (ja) 自律移動ロボット及びその障害物識別方法
JP2958978B2 (ja) 学習制御方法
JPS6310201A (ja) 離散時間制御装置
KR0175253B1 (ko) 냉난방기의 실내환경 제어회로 및 그 제어방법
López-Lozada et al. Mobile robotic navigation system with improved autonomy under diverse scenarios
KR19990011102A (ko) 로봇의 위치제어용 선형출력 제어장치 및 방법
Pimenta et al. Application of direct adaptive generalized predictive control (GPCAD) to a robotic joint
JP3281312B2 (ja) 調整方法および調整装置
JP2532976B2 (ja) ファジィ知識ベ―ス構築装置
JPH03268103A (ja) オートチューニングコントローラ

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees