JPH01173202A - ロボット制御方式 - Google Patents
ロボット制御方式Info
- Publication number
- JPH01173202A JPH01173202A JP33348587A JP33348587A JPH01173202A JP H01173202 A JPH01173202 A JP H01173202A JP 33348587 A JP33348587 A JP 33348587A JP 33348587 A JP33348587 A JP 33348587A JP H01173202 A JPH01173202 A JP H01173202A
- Authority
- JP
- Japan
- Prior art keywords
- robot
- unit
- output
- layer
- behavior pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000009471 action Effects 0.000 claims abstract description 30
- 230000006870 function Effects 0.000 claims abstract description 24
- 230000006399 behavior Effects 0.000 claims description 46
- 238000000034 method Methods 0.000 claims description 29
- 238000001514 detection method Methods 0.000 claims description 11
- 238000011895 specific detection Methods 0.000 claims description 6
- 230000003542 behavioural effect Effects 0.000 claims description 4
- 238000009825 accumulation Methods 0.000 claims description 2
- 239000010410 layer Substances 0.000 description 64
- 230000003287 optical effect Effects 0.000 description 17
- 239000013598 vector Substances 0.000 description 16
- 230000008859 change Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 4
- 238000003672 processing method Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 241000122205 Chamaeleonidae Species 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000011229 interlayer Substances 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
Landscapes
- Manipulator (AREA)
- Feedback Control In General (AREA)
- Numerical Control (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔概 要〕
センシングされた外界情報に基づいて行動するロボット
を制御するためのロボット制御方式において。
を制御するためのロボット制御方式において。
新たな状況の出現や環境の変化が生じた場合においても
、ロボットが尤もらしい行動をとることができる“°柔
らかい”ロボット制御方式の技術を実現することを目的
としており。
、ロボットが尤もらしい行動をとることができる“°柔
らかい”ロボット制御方式の技術を実現することを目的
としており。
制御信号を生成するロボット制御手段を重みを有する階
層ネットワークで構成するとともに、予め選択されるい
くつかの好ましい制御内容が実現できるようにと学習制
御することでこの階層ネットワークの重みを設定し、こ
のようにして設定された重みを有する階層ネットワーク
に従って外界情報に応じた制御信号を生成してロボット
を制御するようにと構成するものである。
層ネットワークで構成するとともに、予め選択されるい
くつかの好ましい制御内容が実現できるようにと学習制
御することでこの階層ネットワークの重みを設定し、こ
のようにして設定された重みを有する階層ネットワーク
に従って外界情報に応じた制御信号を生成してロボット
を制御するようにと構成するものである。
本発明は、複数のセンサ情報に基づいて行動するロボッ
トの制御方式に関する。
トの制御方式に関する。
近年1人工知能(AI)、ファクトリオートメーション
(FA)、オフィスオートメーション(OA)の進展に
伴い1人間にとって使い易く。
(FA)、オフィスオートメーション(OA)の進展に
伴い1人間にとって使い易く。
人間と共存できる知的な゛柔らかい”システムへの要求
が高まっている。この期待に応えるため。
が高まっている。この期待に応えるため。
エキスパー1〜システム等を適用したシステムや。
パターン認識機能を備えたロボット等が提供され始めて
いるが、未だ“柔らかい”システムというには程遠い段
階にある。これから、使用方法や環境の変化に応じてロ
ボットの行動を適応的に制御する“柔らかい′°ロボッ
ト制御方式の開発が望まれているのである。
いるが、未だ“柔らかい”システムというには程遠い段
階にある。これから、使用方法や環境の変化に応じてロ
ボットの行動を適応的に制御する“柔らかい′°ロボッ
ト制御方式の開発が望まれているのである。
従来のロボット制御方式は、逐次処理コンピュータ (
ノイマン型コンピュータ)によって実現されている。従
って、複数のセンサ情報に基づいて行動するロボットの
制御方式についても、どのセンサがどういう情報をもた
らすかということを予め人間が考慮した上で、どのよう
なセンサからの入カバターンが入ってきた時、どのよう
な化カバターンを発生し1行動したらよいかをプログラ
ムの形で厳密に記述していくといったような構成により
実現されていた。
ノイマン型コンピュータ)によって実現されている。従
って、複数のセンサ情報に基づいて行動するロボットの
制御方式についても、どのセンサがどういう情報をもた
らすかということを予め人間が考慮した上で、どのよう
なセンサからの入カバターンが入ってきた時、どのよう
な化カバターンを発生し1行動したらよいかをプログラ
ムの形で厳密に記述していくといったような構成により
実現されていた。
従って、ロボットはこのプログラムに基づいて行動して
いるだけであり、当然、プログラムに記述されていない
状況には対応できず、また、センサの特性が少しでも変
化したり、多数のセンサのうち1つでも壊れたりすると
、適切な行動をとることができない等といった問題点が
あった。さらに、ロボットが多数のセンサ群を備えてい
る場合。
いるだけであり、当然、プログラムに記述されていない
状況には対応できず、また、センサの特性が少しでも変
化したり、多数のセンサのうち1つでも壊れたりすると
、適切な行動をとることができない等といった問題点が
あった。さらに、ロボットが多数のセンサ群を備えてい
る場合。
プログラムを作成すること自体が極めて困難、或いは不
可能になるといった問題点を生していた。
可能になるといった問題点を生していた。
本発明はかかる事情に鑑みてなされたものであって、い
かなる条件下にあってもロボットが適切な行動をとれる
ようにする“柔らかい”システムをなすロボット制御方
式の提供を目的とするものである。
かなる条件下にあってもロボットが適切な行動をとれる
ようにする“柔らかい”システムをなすロボット制御方
式の提供を目的とするものである。
第1図は2本発明の原理説明図である。
図中、1はセンサ手段であり、ロボットを取囲む外界情
報を取り込む複数のセンサからなるもの。
報を取り込む複数のセンサからなるもの。
2は行動パターン発生手段であり9行動パターン信号を
発生させてロボットの行動パターンを規定するもの、3
はロボット制御手段であり2重みを有する階層ネットワ
ークから構成され、この階層ネットワークに従ってセン
サ手段1の検出パターンに応じた制御信号を生成して行
動パターン発生手段2を制御するもの、4は動作モード
信号であり、ロボット制御手段3の動作モードを学習モ
ードか処理かのいずれかに設定するためのもの、5は基
本制御動作格納手段であり、予め選択されるセンサ手段
1の1つまたは複数個の特定の検出パターンに対しての
ロボット制御手段3の生成すべき制御信号情報を格納す
るためのものである。
発生させてロボットの行動パターンを規定するもの、3
はロボット制御手段であり2重みを有する階層ネットワ
ークから構成され、この階層ネットワークに従ってセン
サ手段1の検出パターンに応じた制御信号を生成して行
動パターン発生手段2を制御するもの、4は動作モード
信号であり、ロボット制御手段3の動作モードを学習モ
ードか処理かのいずれかに設定するためのもの、5は基
本制御動作格納手段であり、予め選択されるセンサ手段
1の1つまたは複数個の特定の検出パターンに対しての
ロボット制御手段3の生成すべき制御信号情報を格納す
るためのものである。
〔作 用〕
本発明では、ロボット制御手段3は、学習モードのとき
に、基本制御動作格納手段5に格納される格納情報が実
現できるようにと学習制御することで階層ネットワーク
の重みを設定するとともに。
に、基本制御動作格納手段5に格納される格納情報が実
現できるようにと学習制御することで階層ネットワーク
の重みを設定するとともに。
処理モードのときに、このようにして設定された重みを
有する階層ネットワークに従ってセンサ手段1の検出パ
ターンに応じた制御信号を生成して。
有する階層ネットワークに従ってセンサ手段1の検出パ
ターンに応じた制御信号を生成して。
行動パターン発生手段2を介してロボットの行動を制御
することになる。
することになる。
このように本発明によれば、予め1人間がすべての入カ
バターンとそれに対応する行動パターンとの対を考慮し
て、厳密なプログラミングを行う必要がなく9人間は基
本的の入出カバターンの対の数だけ、基本制御動作格納
手段5を通してロボット制御手段3に与えてやればよい
。また、ロボット制御手段3は、ネットワークで構成さ
れており、入力層および中間層のユニット数が多ければ
。
バターンとそれに対応する行動パターンとの対を考慮し
て、厳密なプログラミングを行う必要がなく9人間は基
本的の入出カバターンの対の数だけ、基本制御動作格納
手段5を通してロボット制御手段3に与えてやればよい
。また、ロボット制御手段3は、ネットワークで構成さ
れており、入力層および中間層のユニット数が多ければ
。
入力層の1つのユニ・ノド当たりの情報は中間層のユニ
ットの中に分散されてしまうので、入力層に多少の誤差
が混入しても出力層に影響を及ぼすことなく、誤差を吸
収することができるので、学習。
ットの中に分散されてしまうので、入力層に多少の誤差
が混入しても出力層に影響を及ぼすことなく、誤差を吸
収することができるので、学習。
訓練に用いた入カバターン以外の未知のセンサ入カバタ
ーンが発生しても、その入カバターンに近い学習、訓練
に用いた入カバターンと連合された出カバターンを発生
でき、尤もらしい行動をとることができる。同様の理由
で、センサの特性変化や、故障にも対応することも可能
となる。
ーンが発生しても、その入カバターンに近い学習、訓練
に用いた入カバターンと連合された出カバターンを発生
でき、尤もらしい行動をとることができる。同様の理由
で、センサの特性変化や、故障にも対応することも可能
となる。
以下、実施例に従って本発明の詳細な説明する。
第2図は、第1図で説明したロボット制御手段3の詳細
な実施例構成図である。この図に示すように1本発明の
ロボット制御手段3は、ユニットと呼ぶ一種のノードと
重みを持つ内部結合とからなる階層ネットワークにより
構成されることになる。この構成は、基本的には、コン
ピュータに適応機能を与えるデータ処理方式として提唱
されているバンク・プロパゲーション法と呼ばれている
処理方式(D、 E、 Rumelhart、 G、
E、 Hinton、 andR,J、 Willi
ams、 ’ Learning Interna
lRepresentations by Error
Propagation+″PARALLEL DI
STRIBUTED PROCESSING、 Vol
、1. pp。
な実施例構成図である。この図に示すように1本発明の
ロボット制御手段3は、ユニットと呼ぶ一種のノードと
重みを持つ内部結合とからなる階層ネットワークにより
構成されることになる。この構成は、基本的には、コン
ピュータに適応機能を与えるデータ処理方式として提唱
されているバンク・プロパゲーション法と呼ばれている
処理方式(D、 E、 Rumelhart、 G、
E、 Hinton、 andR,J、 Willi
ams、 ’ Learning Interna
lRepresentations by Error
Propagation+″PARALLEL DI
STRIBUTED PROCESSING、 Vol
、1. pp。
318−364. The MIT Press、 1
986)と同じものである。
986)と同じものである。
次に、このハック・プロパゲーション法の概要について
説明する。
説明する。
バック・プロパゲーション法ではユニットと呼ぶ一種の
ノードと重みを持つ内部結合とから階層ネットワークを
構成している。第3図は、ユニットの内部構成を示した
もので基本ユニット30と呼ぶ。この基本ユニット30
は、多大カー出力系となっている。このユニットでは、
複数の各々の入力に対し各々の内部結合の重みを乗じて
これらの全乗算結果を和算する累算部31と、さらに、
閾値処理を施して1つの出力を出す閾値処理部32とを
もっている。即ちバンク・プロパゲーション法における
基本ユニット30でのデータ処理は、入力と重みとの積
和演算および閾値処理からなっている。
ノードと重みを持つ内部結合とから階層ネットワークを
構成している。第3図は、ユニットの内部構成を示した
もので基本ユニット30と呼ぶ。この基本ユニット30
は、多大カー出力系となっている。このユニットでは、
複数の各々の入力に対し各々の内部結合の重みを乗じて
これらの全乗算結果を和算する累算部31と、さらに、
閾値処理を施して1つの出力を出す閾値処理部32とを
もっている。即ちバンク・プロパゲーション法における
基本ユニット30でのデータ処理は、入力と重みとの積
和演算および閾値処理からなっている。
ここで、バンク・プロパゲーション法では閾値の関数と
して2式(2)で示されるシグモイド関数を用いている
。
して2式(2)で示されるシグモイド関数を用いている
。
基本ユニットで行われる演算を数式で示すと以下のよう
になる。
になる。
Xpi−ΣyphWih 式(1)
y pi = 1 / (1+exp(−xpt+θ、
)) 式(2)但し。
y pi = 1 / (1+exp(−xpt+θ、
)) 式(2)但し。
h :h層のユニット番号
j :′1層のユニット番号
p :入カバターン番号
θ、=i層のi番目のユニットの閾値
W1h:h−i層間の内部結合の重み
Xp工:h層の各ユニットからi層の1番ユニットへの
入力の積和 yph:pパターン入力に対するh層の出力yp琶pパ
ターン入力に対するi層の出力バンク・プロパゲーショ
ン法では、この積和と閾値処理を基本とする基本ユニッ
ト30を第2図のような誤差フィードパンクを持つ階層
ネットワーク構造として9重みと閾値とを誤差のフィー
ドバックにより適応的に自動調節するアルゴリズムを用
い、所望のデータ処理方法(入カバターンと出カバター
ンとの間の連合)をネットワークに学習させることによ
り適応的なデータ処理を実行する。
入力の積和 yph:pパターン入力に対するh層の出力yp琶pパ
ターン入力に対するi層の出力バンク・プロパゲーショ
ン法では、この積和と閾値処理を基本とする基本ユニッ
ト30を第2図のような誤差フィードパンクを持つ階層
ネットワーク構造として9重みと閾値とを誤差のフィー
ドバックにより適応的に自動調節するアルゴリズムを用
い、所望のデータ処理方法(入カバターンと出カバター
ンとの間の連合)をネットワークに学習させることによ
り適応的なデータ処理を実行する。
ここで1式(1)および式(2)から、バンク・プロパ
ゲーション法では重みと閾値との調節が同時に実行され
る必要があるが1重みと閾値との設定は相互に干渉する
難しい作業となる。従来のへツク・プロパゲーション法
の方法では、ユニット毎に閾値を与えていたが、ユニッ
ト数が多数となると各ユニット毎に閾値を与えることが
煩雑で面倒な作業となるため、閾値の自動設定が切望さ
れていたのである。そこで本発明のロボット制御手段3
では、第2図に示すように、入力層中に入力信号数の入
力ユニット3−hの外に、常に「1」が入力される閾値
調節用の閾値入カユニット3′−hを設けるよう構成す
るものである。
ゲーション法では重みと閾値との調節が同時に実行され
る必要があるが1重みと閾値との設定は相互に干渉する
難しい作業となる。従来のへツク・プロパゲーション法
の方法では、ユニット毎に閾値を与えていたが、ユニッ
ト数が多数となると各ユニット毎に閾値を与えることが
煩雑で面倒な作業となるため、閾値の自動設定が切望さ
れていたのである。そこで本発明のロボット制御手段3
では、第2図に示すように、入力層中に入力信号数の入
力ユニット3−hの外に、常に「1」が入力される閾値
調節用の閾値入カユニット3′−hを設けるよう構成す
るものである。
このように、閾値入力ユニット3′−hを設けたことに
よって中間層の各ユニット3−4の閾値を。
よって中間層の各ユニット3−4の閾値を。
中間層に対する重みW、hを設定することと同等の処理
にて設定できる理由は次の如きものと考えてよい。即ち
。
にて設定できる理由は次の如きものと考えてよい。即ち
。
中間層の各ユニット3−iにおいては、入力層内の1つ
余分にもうけたユニット3′〜hからの値yphが常に
「1」であることから、値Xp、□は式%式% (ただしh′は入力層の閾値入カニニットの番号)で与
えられる。この結果からθi −w、l、’ として
式(2)に代入すると。
余分にもうけたユニット3′〜hからの値yphが常に
「1」であることから、値Xp、□は式%式% (ただしh′は入力層の閾値入カニニットの番号)で与
えられる。この結果からθi −w、l、’ として
式(2)に代入すると。
ypt=1/(1+exp(Xpi W=h’ ))
となり9式(2)に示されている閾値θ1を実質的に−
Wい?に設定変更したことに対応する。即ち。
となり9式(2)に示されている閾値θ1を実質的に−
Wい?に設定変更したことに対応する。即ち。
中間層における各ユニットの閾値をいちいち設定する煩
雑さが解消される。
雑さが解消される。
次に、第4図に示す具体例に従って、第1図で説明した
基本制御動作格納手段5に格納される゛ところの格納情
報について説明する。例えば第2図に示すようにセンサ
出力が2値化モードで入カニニット3−hが3個のとき
には、第4図にも示すようにロボット制御手段3への入
カバターンの数は8通りとなる。従って、ロボットの行
動パターンが例えば動状態か停止状態という2通りであ
るならば、これらの8通りの入カバターンの各々に対し
て「1」か「0」というロボットの行動パターンは定ま
ることになる。このように、センサ手段1の検出パター
ンに対してロボットが本来的にどういう行動をとるべき
かということは定まっているので、基本制御動作格納手
段5には、このような情報の内のいくつかが予め選択さ
れて格納されるよう構成されることになる。なお、第4
図に示したような8通りの入カバターンと数の少ないも
のにあってはそのすべてを格納することも可能である。
基本制御動作格納手段5に格納される゛ところの格納情
報について説明する。例えば第2図に示すようにセンサ
出力が2値化モードで入カニニット3−hが3個のとき
には、第4図にも示すようにロボット制御手段3への入
カバターンの数は8通りとなる。従って、ロボットの行
動パターンが例えば動状態か停止状態という2通りであ
るならば、これらの8通りの入カバターンの各々に対し
て「1」か「0」というロボットの行動パターンは定ま
ることになる。このように、センサ手段1の検出パター
ンに対してロボットが本来的にどういう行動をとるべき
かということは定まっているので、基本制御動作格納手
段5には、このような情報の内のいくつかが予め選択さ
れて格納されるよう構成されることになる。なお、第4
図に示したような8通りの入カバターンと数の少ないも
のにあってはそのすべてを格納することも可能である。
第4図の例の内容についての理解を深めるために、第5
図に示すロボットの行動パターンの具体例について説明
する。第5図では具体的に、第5図(alに示す3つの
光センサと“右に旋回する”という行動をとるための1
つのモータを持つロボットを考えている。そして、この
ロボットに、第5図ta+に示すようなロボットの周り
を回る発光源に追従するという行動をとらせたいと想定
する。このとき、ロボットのセンサ入カバターンとして
は。
図に示すロボットの行動パターンの具体例について説明
する。第5図では具体的に、第5図(alに示す3つの
光センサと“右に旋回する”という行動をとるための1
つのモータを持つロボットを考えている。そして、この
ロボットに、第5図ta+に示すようなロボットの周り
を回る発光源に追従するという行動をとらせたいと想定
する。このとき、ロボットのセンサ入カバターンとして
は。
第4図の入カバターンの欄に示す組み合わせが考えられ
る。例えば、第4図の「0」の入カバターンは光センサ
■、■、■が3つともOFFの状態。
る。例えば、第4図の「0」の入カバターンは光センサ
■、■、■が3つともOFFの状態。
「4」の入カバターンは光センサ■がON、光センサ■
、■がOFFの状M、r6Jの入力パターンは光センサ
■、■がON、光センサ■がOF Fの状態である。ロ
ボットを回転する発光源に追従させるためには、このよ
うな入カバターンに応じて、第4図の教師信号欄に示す
出カバターン(行動)がネットワークの学習、訓練によ
り、実現できるようにすればよい。例えば、第4図の「
0」の入カバターンは、光センサ■、■、■ともOFF
の状態、即ち9発光源から光が出ていない状態なので、
この時の出カバターンは“0”、即ち。
、■がOFFの状M、r6Jの入力パターンは光センサ
■、■がON、光センサ■がOF Fの状態である。ロ
ボットを回転する発光源に追従させるためには、このよ
うな入カバターンに応じて、第4図の教師信号欄に示す
出カバターン(行動)がネットワークの学習、訓練によ
り、実現できるようにすればよい。例えば、第4図の「
0」の入カバターンは、光センサ■、■、■ともOFF
の状態、即ち9発光源から光が出ていない状態なので、
この時の出カバターンは“0”、即ち。
″モータをOFFにせよ”という制御を表している。ま
た、「6」の入カバターンは、光センサ■。
た、「6」の入カバターンは、光センサ■。
■がON、光センサ■がOFFの状態、即ち、まさに発
光源を捉えた状態(第5図(a))なので。
光源を捉えた状態(第5図(a))なので。
“モータをOFFにせよ”という制御を表し。
「4」の入カバターンは光センサ■がON、光センサ■
、■がOFFの状態、即ち、ロボットが捉えた発光源が
さらに移動した状態(第5図(b))なので、“′モー
タをONにせよく右に旋回せよ)”ということを表して
いる。すなわち、第4図に示すような教師信号が得られ
れば、第5図で説明したようなロボットの行動パターン
は好ましく制御されることになる。
、■がOFFの状態、即ち、ロボットが捉えた発光源が
さらに移動した状態(第5図(b))なので、“′モー
タをONにせよく右に旋回せよ)”ということを表して
いる。すなわち、第4図に示すような教師信号が得られ
れば、第5図で説明したようなロボットの行動パターン
は好ましく制御されることになる。
このような好ましい制御を実現するために1本発明では
、ロボット制御手段3の階層ネットワークの内部結合の
重みW、6及びW j iを、基本制御動作格納手段5
に格納される格納情報に従って学習的に決定していこう
とするものである。すなわち。
、ロボット制御手段3の階層ネットワークの内部結合の
重みW、6及びW j iを、基本制御動作格納手段5
に格納される格納情報に従って学習的に決定していこう
とするものである。すなわち。
ロボット制御手段3の動作モードを学習モードにセント
し、基本制御動作格納手段5から順次格納情報を読み出
して、ハック・プロパゲーション法の学習アルゴリズム
を用いて重みW8.、及びW j iの値を自動決定す
るよう構成するものである。
し、基本制御動作格納手段5から順次格納情報を読み出
して、ハック・プロパゲーション法の学習アルゴリズム
を用いて重みW8.、及びW j iの値を自動決定す
るよう構成するものである。
次に、この重みW8.及びW、、、の値を決定するため
の学!手順について説明する。ここで、この学習手順の
説明は、第6図に示すようなロボット制御手段3の出力
層が複数の出力ユニット3 jをもつ更に一般化した
もので説明するものである。
の学!手順について説明する。ここで、この学習手順の
説明は、第6図に示すようなロボット制御手段3の出力
層が複数の出力ユニット3 jをもつ更に一般化した
もので説明するものである。
まず、内部結合の重みの初期値を決める。この初期値は
、1以下の乱数により決める。これは。
、1以下の乱数により決める。これは。
重みの値が全て同しか、あるいはユニットに関して対称
となると5ハツク・プロパゲーション法では重みの変化
が生ぜず、学習が進行しなくなってしまうのでこれを避
ける目的で乱数を用いるのである。続いて、基本制御動
作格納手段5に格納されるところの入カバターンとその
入カバターンと対をなす所望の出カバターンのデータを
順次読み出す。例えば第4図に示すように、8個の格納
情報があればこれらのすべてが順次読み出されることに
なる。
となると5ハツク・プロパゲーション法では重みの変化
が生ぜず、学習が進行しなくなってしまうのでこれを避
ける目的で乱数を用いるのである。続いて、基本制御動
作格納手段5に格納されるところの入カバターンとその
入カバターンと対をなす所望の出カバターンのデータを
順次読み出す。例えば第4図に示すように、8個の格納
情報があればこれらのすべてが順次読み出されることに
なる。
続いて、ハック・プロパゲーション法に関わる制御パラ
メータを入力する。ここでは、インクリメンタルな繰り
返し学習の一回当たりの重みの変化量の係数である学習
率と収束時の振動を抑えるための学習速度を制御パラメ
ータとしている。そして、バンク・プロパゲーション法
のアルゴリズムに従って出力層ユニット3−jの出力値
が所望の出力と一致するようにインクリメンタルに内部
結合の重みを学習し、最後に、出力層ユニットの出力値
と所望の出力値との誤差が全ての入カバターンに関して
所定の値より少なくなったら、学習を終了する。
メータを入力する。ここでは、インクリメンタルな繰り
返し学習の一回当たりの重みの変化量の係数である学習
率と収束時の振動を抑えるための学習速度を制御パラメ
ータとしている。そして、バンク・プロパゲーション法
のアルゴリズムに従って出力層ユニット3−jの出力値
が所望の出力と一致するようにインクリメンタルに内部
結合の重みを学習し、最後に、出力層ユニットの出力値
と所望の出力値との誤差が全ての入カバターンに関して
所定の値より少なくなったら、学習を終了する。
具体的な階層ネ・ノドワークの重みの更新のアルゴリズ
ムを以下に説明する。式(1)1式(2)からの類推に
よって次の式が得られる。即ち。
ムを以下に説明する。式(1)1式(2)からの類推に
よって次の式が得られる。即ち。
Xp、−Σyp□W1h 式(3)
y pi = 1 / (1+exp(x pt+θ1
))式(4)xl−ΣypiW=、
式(5)Vp== 1/(1+exp(−xpj+θ、
))式(6)但し。
y pi = 1 / (1+exp(x pt+θ1
))式(4)xl−ΣypiW=、
式(5)Vp== 1/(1+exp(−xpj+θ、
))式(6)但し。
yph:p番目パターン入力値に対するh層(ここては
入力層)のh番目のユニットからの出力 ypi’p番目パターン入力値に対するi層(ここては
中間層)のi番目のユニットからの出力 ypJ:p番目パターン入力値に対する3層(ここては
出力層)のj番目のユニットからの出力 Xpi:i層のi番目のユニットへのp番目バタ−ン入
力に対する総和 xpj’J層のj番目のユニットへのp番目パターン入
力に対する総和 J)、:hjih番目ユニットとi層i番目ユニット間
の重め Wji:1層i番目ユニットとJ層j番目ユニット間の
重み 次に、これらの値から、教師入力ベクトルとネットワー
クの出力ベクトルとの誤差の二乗和Epをネットワーク
の誤差として計算する。
入力層)のh番目のユニットからの出力 ypi’p番目パターン入力値に対するi層(ここては
中間層)のi番目のユニットからの出力 ypJ:p番目パターン入力値に対する3層(ここては
出力層)のj番目のユニットからの出力 Xpi:i層のi番目のユニットへのp番目バタ−ン入
力に対する総和 xpj’J層のj番目のユニットへのp番目パターン入
力に対する総和 J)、:hjih番目ユニットとi層i番目ユニット間
の重め Wji:1層i番目ユニットとJ層j番目ユニット間の
重み 次に、これらの値から、教師入力ベクトルとネットワー
クの出力ベクトルとの誤差の二乗和Epをネットワーク
の誤差として計算する。
Ep−%Σ(’I pj d pj)”
式(7)%式% Ep :p番目パターン入力に対する誤差ベクトル E :全パターン入力に対する誤差ベクトルの総和 dpj’p番目パターン入力に対するj層j番目ユニッ
トへの教師信号 ここで誤差ベクトルと出力層ベクトルとの関係を求める
ため9式(7)をypjに関して偏微分すると。
式(7)%式% Ep :p番目パターン入力に対する誤差ベクトル E :全パターン入力に対する誤差ベクトルの総和 dpj’p番目パターン入力に対するj層j番目ユニッ
トへの教師信号 ここで誤差ベクトルと出力層ベクトルとの関係を求める
ため9式(7)をypjに関して偏微分すると。
θypJ
を得る。更に、誤差ベクトルとj層への入力との関係を
求めるため、誤差ヘタ1〜ルをxpjで偏微分すると。
求めるため、誤差ヘタ1〜ルをxpjで偏微分すると。
aEp 8Ep aypja Xpj
8)’pj aXpj−δpjyp、(l
yp;) 式(9)を得る。但し1本実施例で
は入力層に1つの入カニニット3′−hを設けこのユニ
ット3′−hに常に11」の値を入力する方式を採用す
ることで、他の各ユニットの閾値θの自動調節を実現し
ている。
8)’pj aXpj−δpjyp、(l
yp;) 式(9)を得る。但し1本実施例で
は入力層に1つの入カニニット3′−hを設けこのユニ
ット3′−hに常に11」の値を入力する方式を採用す
ることで、他の各ユニットの閾値θの自動調節を実現し
ている。
更に、誤差ベクトルとi−j層間の重みとの関係をもと
めるため、誤差ベクトルをW1工で偏微分すると。
めるため、誤差ベクトルをW1工で偏微分すると。
a Ep a Ep a Xpj−δ
pjypj (1−ypJ) ypi 式(10)の
積和で表される解を得る。
pjypj (1−ypJ) ypi 式(10)の
積和で表される解を得る。
次に、i層の出力y□に対す−る誤差ベクトルE。
の変化を求めると。
f3Yp= j aXpj aypl−Σ
δpj ypj (13′ pi) wJ1式(11) を得る。更に、i屑入カニニットへの総和xptの変化
に対する誤差ベクトルE2の変化を計算すると。
δpj ypj (13′ pi) wJ1式(11) を得る。更に、i屑入カニニットへの総和xptの変化
に対する誤差ベクトルE2の変化を計算すると。
θX□ a Y pi a X pi−(Σ
δpJ3′pJ(1−3′pJ) WJt) yp□
(1ypl)式(12) の積和で表される解を得る。更に、h−4層間の重みの
変化に対する誤差ベクトルの変化の関係を求めると。
δpJ3′pJ(1−3′pJ) WJt) yp□
(1ypl)式(12) の積和で表される解を得る。更に、h−4層間の重みの
変化に対する誤差ベクトルの変化の関係を求めると。
aEp aEp aypl8 W
rh a X pt a W=h−(
ΣδpJypJ(1−yp、+) W、tt) y
pi(1−ypt) 3′ph式(13) の積和で表される解を得る。
rh a X pt a W=h−(
ΣδpJypJ(1−yp、+) W、tt) y
pi(1−ypt) 3′ph式(13) の積和で表される解を得る。
これらから、全入カバターンに対する誤差ベクトルとi
−j層間の重みとの関係を求めると以下のようになる。
−j層間の重みとの関係を求めると以下のようになる。
aW、、1 p aW。
また、全入カバターンに対する誤差ベクトルとh−1層
間の重みとの関係を求めると以下のようになる。
間の重みとの関係を求めると以下のようになる。
aILh p aW;h
式(14)および式(15)は、各層間の重みの変化に
対する誤差ベクトルの変化率を示していることから、こ
の値が常に負になるように重みを変化させ−3〇− ると公知の勾配法により、誤差の2乗和であるEを漸近
的にOとすることができる。そこで本実施例では2重め
の一回当たりの変化量Δw1.を以下のように設定し、
勾配法に基づき繰り返しこの操作を行い、Eを零に収束
させている。
対する誤差ベクトルの変化率を示していることから、こ
の値が常に負になるように重みを変化させ−3〇− ると公知の勾配法により、誤差の2乗和であるEを漸近
的にOとすることができる。そこで本実施例では2重め
の一回当たりの変化量Δw1.を以下のように設定し、
勾配法に基づき繰り返しこの操作を行い、Eを零に収束
させている。
8W、6
但し。
ε:学習率(勾配法の勾配率と同じ機能)更に1本発明
では、勾配法における収束時の振動を抑制する目的で学
習速度を式(16)および式(17)に適用して、ΔW
1.とΔWJiを以下のように設定している。
では、勾配法における収束時の振動を抑制する目的で学
習速度を式(16)および式(17)に適用して、ΔW
1.とΔWJiを以下のように設定している。
式(19)
%式%
:
なお、上述の重みW、hやWjiは各ユニット3−1や
3−jに夫々対応する記憶装置内に格納され。
3−jに夫々対応する記憶装置内に格納され。
その内容が上述の学習の間フィードバックによって修正
される。そして最終的に定まった学習結果の重みW i
h+ Wjiが、これから説明する実際の処理に当って
使われることになる。この記憶装置としては、基本制御
動作格納手段5を用いることも可能であるが、また別に
設けるものであってもよい。
される。そして最終的に定まった学習結果の重みW i
h+ Wjiが、これから説明する実際の処理に当って
使われることになる。この記憶装置としては、基本制御
動作格納手段5を用いることも可能であるが、また別に
設けるものであってもよい。
次に、このようにして決定された階層ネットワークの内
部結合の重みW、h及びW4□を用いて実行されること
になるロボットの制御について説明する。
部結合の重みW、h及びW4□を用いて実行されること
になるロボットの制御について説明する。
階層ネットワークの学習を終えると、ロボット制御手段
3の動作モードを処理モード、すなわち実際にロボット
の動作を制御するモードにと切換える。この処理モード
では、複数のセンサからなるセンサ手段1により取り込
まれたセンサの検出信号からなる入カバターンは、ロボ
ット制御手段3の階層ネットワークの入力層にと入力さ
れる。
3の動作モードを処理モード、すなわち実際にロボット
の動作を制御するモードにと切換える。この処理モード
では、複数のセンサからなるセンサ手段1により取り込
まれたセンサの検出信号からなる入カバターンは、ロボ
ット制御手段3の階層ネットワークの入力層にと入力さ
れる。
そして、ロボ71・制御手段3は、この入カバターンに
対して学習モードで定まった重み値及び閾値を使って積
和演算と閾値処理を実行して出カバターンを求めるとと
もに、この求めた出カバターンを制御信号として行動パ
ターン発生手段2にと送出する。そして、この制御信号
を受は取った行動パターン発生手段2は、その制御信号
に対応する行動パターン信号を発生してロボットの行動
パターンを規定することになる。従って、このような処
理を繰返すことによって、ロボットは複数のセンサの検
出パターンに応じた適切な行動をとることができること
になる。
対して学習モードで定まった重み値及び閾値を使って積
和演算と閾値処理を実行して出カバターンを求めるとと
もに、この求めた出カバターンを制御信号として行動パ
ターン発生手段2にと送出する。そして、この制御信号
を受は取った行動パターン発生手段2は、その制御信号
に対応する行動パターン信号を発生してロボットの行動
パターンを規定することになる。従って、このような処
理を繰返すことによって、ロボットは複数のセンサの検
出パターンに応じた適切な行動をとることができること
になる。
この処理の内容を第5図の例に従って具体的にみてみる
ことにする。今、ロボットと発光源との関係が第5図(
a)の状態、即ち、ロボットの光センサ■、■がON、
光センサ■がOFF、モータがOFFの状態にあるとす
る。この時1発光源が第5図(b)のように、右側に動
くと、ロボットの光センサ■がON、光センサ■、■が
OFFの状態に変わる。これを第2図に示したネットワ
ークに入力すると、出カバターンとして″モータをON
にせよ(右に旋回せよ)”という制御を表す「1」とい
う出力が発生される。従って、ロボットは右旋回を行う
。この右旋回は、3つの光センサのうち2つがONにな
るまで続けられる。この場合では、第5図(C)のよう
に、光センサ■、■がON。
ことにする。今、ロボットと発光源との関係が第5図(
a)の状態、即ち、ロボットの光センサ■、■がON、
光センサ■がOFF、モータがOFFの状態にあるとす
る。この時1発光源が第5図(b)のように、右側に動
くと、ロボットの光センサ■がON、光センサ■、■が
OFFの状態に変わる。これを第2図に示したネットワ
ークに入力すると、出カバターンとして″モータをON
にせよ(右に旋回せよ)”という制御を表す「1」とい
う出力が発生される。従って、ロボットは右旋回を行う
。この右旋回は、3つの光センサのうち2つがONにな
るまで続けられる。この場合では、第5図(C)のよう
に、光センサ■、■がON。
光センサ■がOFFの状態になった時、ネットワークは
“モータをOFFにせよ”という制御を表す「0」を出
すので、ロボットは停止する。このようにして、ロボッ
トが1時々刻々と取り込んでくるセンサ入力信号パター
ンを第2図に示したネ ゛ソトワークに入力し、ネ
ットワークがその人カバターンに対応して時々刻々と出
力する最適な出カバターンに従ってモータを制御するこ
とにより。
“モータをOFFにせよ”という制御を表す「0」を出
すので、ロボットは停止する。このようにして、ロボッ
トが1時々刻々と取り込んでくるセンサ入力信号パター
ンを第2図に示したネ ゛ソトワークに入力し、ネ
ットワークがその人カバターンに対応して時々刻々と出
力する最適な出カバターンに従ってモータを制御するこ
とにより。
発光源の動きに追従することができる。この例では1発
光源が右に動く場合について述べたが、第5図(dlの
ように発光源が左に動いても、同様にして、ロボットは
追従することができる。
光源が右に動く場合について述べたが、第5図(dlの
ように発光源が左に動いても、同様にして、ロボットは
追従することができる。
このようにして、ロボットが適切な行動をとるようにと
御J?卸されていくことになる。しかるに。
御J?卸されていくことになる。しかるに。
センサの数や制御信号の数が多いときには、基本制御動
作格納手段5に入カバターンとその入カバターンと対を
なす所望の出カバターンのデータのすべてを格納するこ
とができないので、基本的なものが格納されることにな
る。これから、この基本的なデータを使った学習により
求まる重み値と閾値で出カバターンを求めていったとき
に、所望のロボットの行動が得られないことが生ずるこ
とがある。このようなとき5本発明では、動作モードを
学習モードに切り換え、その段階でのネットワークの結
合の重みを初期値として、所望の得られなかった時点の
入カバターンと所望の出カバターンとの対を基本制御動
作格納手段5に格納して。
作格納手段5に入カバターンとその入カバターンと対を
なす所望の出カバターンのデータのすべてを格納するこ
とができないので、基本的なものが格納されることにな
る。これから、この基本的なデータを使った学習により
求まる重み値と閾値で出カバターンを求めていったとき
に、所望のロボットの行動が得られないことが生ずるこ
とがある。このようなとき5本発明では、動作モードを
学習モードに切り換え、その段階でのネットワークの結
合の重みを初期値として、所望の得られなかった時点の
入カバターンと所望の出カバターンとの対を基本制御動
作格納手段5に格納して。
ロボット制御手段3に、それらの入出カバターン対をさ
らに重ねて連合することができるように結合の重みを自
動的に微調整させることにより、ロボットの制御性能を
向上させることができる。したがって、最終的には、ロ
ボットの最適な制御を実現できるようになる。
らに重ねて連合することができるように結合の重みを自
動的に微調整させることにより、ロボットの制御性能を
向上させることができる。したがって、最終的には、ロ
ボットの最適な制御を実現できるようになる。
第7図は、ハック・プロパゲーション法により一種のパ
リティチエツク処理をネットワークに学習(重みと閾値
との自動調整)させた結果のネットワークを示している
。ここで第7図(A)図示のNetlと第7図(B)I
F示のNe t2とは夫々奇数パリティをチエツクする
同一の特性、即ち、「0」または「1」をとる3つの入
力に対して「l」の数が奇数個のとき出力層は「1」を
出力するようになっている。第7図では、内部結合線の
隣の数字が重みであり、ユニットを表ず○の中の数字が
閾値である。NetlとNet2とを比較すると9重み
と閾値とが全く異なることが分かる。これは、ネットワ
ークに冗長性があるため、こうした差異が生ずることに
なる。この第7図に示すように、基本ユニット30の出
力を11」と「0]の状態しかとらないようにとネット
ワークを構成することも可能である。
リティチエツク処理をネットワークに学習(重みと閾値
との自動調整)させた結果のネットワークを示している
。ここで第7図(A)図示のNetlと第7図(B)I
F示のNe t2とは夫々奇数パリティをチエツクする
同一の特性、即ち、「0」または「1」をとる3つの入
力に対して「l」の数が奇数個のとき出力層は「1」を
出力するようになっている。第7図では、内部結合線の
隣の数字が重みであり、ユニットを表ず○の中の数字が
閾値である。NetlとNet2とを比較すると9重み
と閾値とが全く異なることが分かる。これは、ネットワ
ークに冗長性があるため、こうした差異が生ずることに
なる。この第7図に示すように、基本ユニット30の出
力を11」と「0]の状態しかとらないようにとネット
ワークを構成することも可能である。
次に1階層ネットワークを構成する中間層のユニット数
の冗長性について説明する。第8図は。
の冗長性について説明する。第8図は。
排他OR機能を実現するネットワークであり、中間層ユ
ニット数の冗長性を持たせない場合の例である。排他O
Rでは、第9図において9人カバターンの直線による識
別(線形識別)に関して、−本の直線では不可能で少な
くとも第9図(B)図示の如く二本の直線を要する。従
って、この識別には第9図(A)図示の如く2つの中間
層ユニットが最小限必要となっている。ところが9本発
明では中間層ユニットと出力層ユニットの閾値を自動調
整するのに入力層に常時「1」を入力信号として持つ閾
値入カニニット3′−りが設けられていることから、第
8図図示のネットワークにおいては、識別すべき数に対
して中間層ユニットの数に冗長性がない。この場合、2
つの中間層ユニット3−iは出力層ユニット3−jの閾
値を含めた自動調節をしなければならす、排他OR特性
に適応するまでの繰り返し学習回数が増大することにな
る。これに対して第10図は冗長性をもつネットワーク
の例を示す。図に示したように、中間層ユニノ1〜数に
冗長性を持たせると、余ったユニットが出力層のユニッ
ト3−jの閾値の調節に専念できることから繰り返し学
習回数は、冗長なユニットかない場合に比し大幅に低減
できる。
ニット数の冗長性を持たせない場合の例である。排他O
Rでは、第9図において9人カバターンの直線による識
別(線形識別)に関して、−本の直線では不可能で少な
くとも第9図(B)図示の如く二本の直線を要する。従
って、この識別には第9図(A)図示の如く2つの中間
層ユニットが最小限必要となっている。ところが9本発
明では中間層ユニットと出力層ユニットの閾値を自動調
整するのに入力層に常時「1」を入力信号として持つ閾
値入カニニット3′−りが設けられていることから、第
8図図示のネットワークにおいては、識別すべき数に対
して中間層ユニットの数に冗長性がない。この場合、2
つの中間層ユニット3−iは出力層ユニット3−jの閾
値を含めた自動調節をしなければならす、排他OR特性
に適応するまでの繰り返し学習回数が増大することにな
る。これに対して第10図は冗長性をもつネットワーク
の例を示す。図に示したように、中間層ユニノ1〜数に
冗長性を持たせると、余ったユニットが出力層のユニッ
ト3−jの閾値の調節に専念できることから繰り返し学
習回数は、冗長なユニットかない場合に比し大幅に低減
できる。
次に内部結合の重みの具体的な計算例について説明する
。
。
奇数パリティチエツク機能の学習を終了した時の各ユニ
ット間の内部結合重みを第11図および第13図に示す
。第11図ないし第13回の重みは異なるが機能は同じ
である。これは、学習率と学習速度パラメータが異なる
ことと中間層ユニット数の冗長性とによる。第12図(
A>(B)(C)は夫々。
ット間の内部結合重みを第11図および第13図に示す
。第11図ないし第13回の重みは異なるが機能は同じ
である。これは、学習率と学習速度パラメータが異なる
ことと中間層ユニット数の冗長性とによる。第12図(
A>(B)(C)は夫々。
第11図で示した学習終了後に、任意のパターンを入力
した場合の入力と出力を示している。また第14図(A
)(B) (C)は夫々、第13図で示した学習終了
後に、任意のパターンを入力した場合の入力と出力を示
している。ロボット制御手段3では、演算をアナログ値
で行うため、出力値は完全な1または0となっていない
が、閾値を用いるなどすれば第12図および第14図図
示の出力値から1またはOを判断することは容易である
ことは明らかである。
した場合の入力と出力を示している。また第14図(A
)(B) (C)は夫々、第13図で示した学習終了
後に、任意のパターンを入力した場合の入力と出力を示
している。ロボット制御手段3では、演算をアナログ値
で行うため、出力値は完全な1または0となっていない
が、閾値を用いるなどすれば第12図および第14図図
示の出力値から1またはOを判断することは容易である
ことは明らかである。
また、第15図は奇数パリティチエツク機能を学習させ
たのと全く同しネットワークに偶数パリティチエツク機
能を学習させた結果を示すものであり、各内部結合の重
みを示している。第16図(A)(B)(C)は夫々、
第15図で示した学M終了後に、任意のパターンを入力
した場合の入力と出力を示している。
たのと全く同しネットワークに偶数パリティチエツク機
能を学習させた結果を示すものであり、各内部結合の重
みを示している。第16図(A)(B)(C)は夫々、
第15図で示した学M終了後に、任意のパターンを入力
した場合の入力と出力を示している。
この結果から5本発明によりネットワークの適応性を低
下させずに、しかも重みと閾値の同時且つ自動調節が簡
単な方法でできること、また、カメレオンのように様々
な機能を持つデータ処理装置に変身できることが示され
た。
下させずに、しかも重みと閾値の同時且つ自動調節が簡
単な方法でできること、また、カメレオンのように様々
な機能を持つデータ処理装置に変身できることが示され
た。
以上説明したように1本発明によれば、複数のセンサ入
力信号から成るパターンと、その入カバターンに対して
とるべき最適な行動を規定する出カバターンとを階層ネ
ットワークの中にいわば連合させて記憶するので1人間
はすべてのセンサ入カバターンとそれに対する出カバタ
ーンを洗い出して、@密にプログラミングする必要はな
く、ただ、基本的な入出カバターン対を階層ネットワー
クに教えるだけですむ。また、学習させた入出カバター
ン対以外の未知の入カバターンに対しても。
力信号から成るパターンと、その入カバターンに対して
とるべき最適な行動を規定する出カバターンとを階層ネ
ットワークの中にいわば連合させて記憶するので1人間
はすべてのセンサ入カバターンとそれに対する出カバタ
ーンを洗い出して、@密にプログラミングする必要はな
く、ただ、基本的な入出カバターン対を階層ネットワー
クに教えるだけですむ。また、学習させた入出カバター
ン対以外の未知の入カバターンに対しても。
その入カバターンに近い学習した入カバターンに応じた
出カバターンを発生できるので、センサの特性変化や、
故障にも柔軟に対応できる。さらに。
出カバターンを発生できるので、センサの特性変化や、
故障にも柔軟に対応できる。さらに。
基本的な人出カバターン対で入カバターンと出カバター
ンとの連合を完了したネットワークの結合の重みで、実
際にロボットを制御した結果、所望の行動が得られなか
った場合、その段階でのネットワークの結合の重みを初
期値として、所望の得られなかった時点の入カバターン
と所望の出カバターンとの対をさらに重ねて連合するこ
とができるように結合の重みを自動的に微調整させるこ
とにより、ロボソ1−の制御性能を向」ニさせることが
できる。従って、最終的には、ロボットの最適な制御を
実現できるようになる。しかも9階層ネットワークは並
列処理アーキテクチャのマシンに適した処理方式であり
、センサ入カバターンを取り込むと瞬時に出カバターン
を発生できるので、ロボットの柔軟なリアルタイム制御
に寄与するところが大きい。
ンとの連合を完了したネットワークの結合の重みで、実
際にロボットを制御した結果、所望の行動が得られなか
った場合、その段階でのネットワークの結合の重みを初
期値として、所望の得られなかった時点の入カバターン
と所望の出カバターンとの対をさらに重ねて連合するこ
とができるように結合の重みを自動的に微調整させるこ
とにより、ロボソ1−の制御性能を向」ニさせることが
できる。従って、最終的には、ロボットの最適な制御を
実現できるようになる。しかも9階層ネットワークは並
列処理アーキテクチャのマシンに適した処理方式であり
、センサ入カバターンを取り込むと瞬時に出カバターン
を発生できるので、ロボットの柔軟なリアルタイム制御
に寄与するところが大きい。
更に1本発明によれば2階層ネットワークの入力層に閾
値ユニットをもうけ、また中間層のユニットの個数に識
別すべき数基上の冗長制御を持たせていることから、各
ユニット間の内部結合の重みと各ユニットの閾値との調
節が自動的且つ節、単な方法で実行でき、閾値を全く意
識せず、またネットワークの適応性を低下させることな
く学習を遂行出来るのである。
値ユニットをもうけ、また中間層のユニットの個数に識
別すべき数基上の冗長制御を持たせていることから、各
ユニット間の内部結合の重みと各ユニットの閾値との調
節が自動的且つ節、単な方法で実行でき、閾値を全く意
識せず、またネットワークの適応性を低下させることな
く学習を遂行出来るのである。
第1図は本発明の原理説明図。
第2図はロボット制御手段の実施例構成図。
べ
第3図は基本ユニットの構侍図。
第4図は基本制御動作格納手段の格納情報例。
第5図はロポソ1〜の行動パターンの具体例。
第6図はロボット制御手段の他の実施例構成図。
第7図は奇数パリティチエツク機能をもつネットワーク
の例。 第8図は中間層の数が冗長性を持たない排他ORのネッ
トワーク。 第9図は排他ORと中間層ユニットの役割を説明する説
明図。 第10図は中間層の数が冗長性を持つ排他ORのの説明
図。 第12図は第11図の重みに従った処理例。 第13図は学習結果を示す内部結合の重み(n)の説明
図。 第14図は第13図の重みに従った処理例。 第15図は学習結果を示す内部結合の重み(I[I)の
説明図。 第16図は第15図の重みに従った処理例である。 図中、1はセンサ手段、2は行動パターン発生手段、3
はロボット制′41■手段、3′−hは閾値入力ユニッ
ト、5は基本制御動作格納手段、30は基本ユニット、
31は累算部、32は閾値処理部である。
の例。 第8図は中間層の数が冗長性を持たない排他ORのネッ
トワーク。 第9図は排他ORと中間層ユニットの役割を説明する説
明図。 第10図は中間層の数が冗長性を持つ排他ORのの説明
図。 第12図は第11図の重みに従った処理例。 第13図は学習結果を示す内部結合の重み(n)の説明
図。 第14図は第13図の重みに従った処理例。 第15図は学習結果を示す内部結合の重み(I[I)の
説明図。 第16図は第15図の重みに従った処理例である。 図中、1はセンサ手段、2は行動パターン発生手段、3
はロボット制′41■手段、3′−hは閾値入力ユニッ
ト、5は基本制御動作格納手段、30は基本ユニット、
31は累算部、32は閾値処理部である。
Claims (6)
- (1)ロボットを取囲む外界情報を取り込む複数のセン
サからなるセンサ手段(1)と、ロボットの行動パター
ンを規定する行動パターン信号を発生する行動パターン
発生手段(2)と、上記センサ手段(1)の検出パター
ンに応じて上記行動パターン発生手段(2)に制御信号
を送出するロボット制御手段(3)と、予め選択される
上記センサ手段(1)の1つまたは複数個の特定の検出
パターンに対しての上記ロボット制御手段(3)の送出
すべき制御信号情報を格納する基本制御動作格納手段(
5)とを備え、 上記ロボット制御手段(3)が、上記基本制御動作格納
手段(5)の格納情報に従って自らが備える制御判断機
能を学習制御するとともに、この学習制御された判断機
能に基づいて上記行動パターン発生手段(2)への制御
信号を送出してなることを、 特徴とするロボット制御方式。 - (2)ロボットを取囲む外界情報を取り込む複数のセン
サからなるセンサ手段(1)と、ロボットの行動パター
ンを規定する行動パターン信号を発生する行動パターン
発生手段(2)と、上記センサ手段(1)の検出パター
ンに応じて上記行動パターン発生手段(2)に制御信号
を送出するロボット制御手段(3)と、予め選択される
上記センサ手段(1)の1つまたは複数個の特定の検出
パターンに対しての上記ロボット制御手段(3)の送出
すべき制御信号情報を格納する基本制御動作格納手段(
5)とを備え、 上記ロボット制御手段(3)は、1つまたは複数の入力
とこの入力に対して乗算されるべき重みとを受取って積
和を得る累算部(31)と、この累算部(31)からの
出力を閾値関数によって変換して最終出力を得る閾値処
理部(32)とを有する基本ユニット(30)を単位ユ
ニットとし、上記センサ手段(1)に接続される複数個
の上記単位ユニット(3−h)を入力層とし、かつ複数
個の上記単位ユニット(3−i)を中間層として1つま
たは複数段の中間層を備え、かつ上記行動パターン発生
手段(2)に接続される1つまたは複数個の上記単位ユ
ニット(3−j)を出力層とし、上記入力層と最前段の
中間層との間、中間層相互間および最終段の中間層と出
力層との間で内部結合を構成することで階層ネットワー
クを構成し、そして、上記ロボット制御手段(3)は、
上記基本制御動作格納手段(5)の格納情報が実現でき
るようにと学習制御することで自らが備える上記階層ネ
ットワークの重みの値を設定するとともに、この重み値
の設定された上記階層ネットワークの出力層の出力値を
もって上記行動パターン発生手段(2)への制御信号と
してなることを、 特徴とするロボット制御方式。 - (3)ロボットを取囲む外界情報を2値化モードで取り
込む複数のセンサからなるセンサ手段(1)と、ロボッ
トの行動パターンを規定する行動パターン信号を発生す
る行動パターン発生手段(2)と、上記センサ手段(1
)の検出パターンに応じて上記行動パターン発生手段(
2)に2値化モードの制御信号を送出するロボット制御
手段(3)と、予め選択される上記センサ手段(1)の
1つまたは複数個の特定の検出パターンに対しての上記
ロボット制御手段(3)の送出すべき制御信号情報を格
納する基本制御動作格納手段(5)とを備え、 上記ロボット制御手段(3)は、1つまたは複数の入力
とこの入力に対して乗算されるべき重みとを受取って積
和を得る累算部(31)と、この累算部(31)からの
出力を閾値関数によって変換して最終出力を得る閾値処
理部(32)とを有する基本ユニット(30)を単位ユ
ニットとし、上記センサ手段(1)に接続される複数個
の上記単位ユニット(3−h)を入力層とし、かつ複数
個の上記単位ユニット(3−i)を中間層として1つま
たは複数段の中間層を備え、かつ上記行動パターン発生
手段(2)に接続される1つまたは複数個の上記単位ユ
ニット(3−j)を出力層とし、上記入力層と最前段の
中間層との間、中間層相互間および最終段の中間層と出
力層との間で内部結合を構成することで階層ネットワー
クを構成し、そして、上記ロボット制御手段(3)は、
上記基本制御動作格納手段(5)の格納情報が実現でき
るようにと学習制御することで自らが備える上記階層ネ
ットワークの重みの値を設定するとともに、この重み値
の設定された上記階層ネットワークの出力層の2値化さ
れた出力値をもって上記行動パターン発生手段(2)へ
の制御信号としてなることを、 特徴とするロボット制御方式。 - (4)ロボットを取囲む外界情報を取り込む複数のセン
サからなるセンサ手段(1)と、ロボットの行動パター
ンを規定する行動パターン信号を発生する行動パターン
発生手段(2)と、上記センサ手段(1)の検出パター
ンに応じて上記行動パターン発生手段(2)に制御信号
を送出するロボット制御手段(3)とを備え、 上記ロボット制御手段(3)は、1つまたは複数の入力
とこの入力に対して乗算されるべき重みとを受取って積
和を得る累算部(31)と、この累算部(31)からの
出力を閾値関数によって変換して最終出力を得る閾値処
理部(32)とを有する基本ユニット(30)を単位ユ
ニットとし、上記センサ手段(1)に接続される複数個
の上記単位ユニット(3−h)を入力層とし、かつ複数
個の上記単位ユニット(3−i)を中間層として1つま
たは複数段の中間層を備え、かつ上記行動パターン発生
手段(2)に接続される1つまたは複数個の上記単位ユ
ニット(3−j)を出力層とし、上記入力層と最前段の
中間層との間、中間層相互間および最終段の中間層と出
力層との間で内部結合を構成することで階層ネットワー
クを構成し、そして、上記ロボット制御手段(3)は、
上記階層ネットワークの出力層の出力値をもって上記行
動パターン発生手段(2)を制御したにもかかわらず所
望のロボットの行動パターンが得られなかったときにお
いては、そのときの上記階層ネットワークの重みの値を
初期値として、その所望の行動パターンが実現できるよ
うにと学習制御することで上記階層ネットワークの重み
値を再調整してなることを、 特徴とするロボット制御方式。 - (5)ロボットを取囲む外界情報を取り込む複数のセン
サからなるセンサ手段(1)と、ロボットの行動パター
ンを規定する行動パターン信号を発生する行動パターン
発生手段(2)と、上記センサ手段(1)の検出パター
ンに応じて上記行動パターン発生手段(2)に制御信号
を送出するロボット制御手段(3)と、予め選択される
上記センサ手段(1)の1つまたは複数個の特定の検出
パターンに対しての上記ロボット制御手段(3)の送出
すべき制御信号情報を格納する基本制御動作格納手段(
5)とを備え、 上記ロボット制御手段(3)は、1つまたは複数の入力
とこの入力に対して乗算されるべき重みとを受取って積
和を得る累算部(31)と、この累算部(31)からの
出力を閾値関数によって変換して最終出力を得る閾値処
理部(32)とを有する基本ユニット(30)を単位ユ
ニットとし、上記センサ手段(1)に接続される複数個
の上記単位ユニット(3−h)を入力層とし、かつ複数
個の上記単位ユニット(3−i)を中間層として1つま
たは複数段の中間層を備え、かつ上記行動パターン発生
手段(2)に接続される1つまたは複数個の上記単位ユ
ニット(3−j)を出力層とし、上記入力層と最前段の
中間層との間、中間層相互間および最終段の中間層と出
力層との間で内部結合を構成することで階層ネットワー
クを構成するとともに、上記入力層を構成する単位ユニ
ットのみに入力信号とは別に常に値「1」を入力値とし
てもつ閾値入力ユニット(3′−h)を1つ以上設け、
そして、上記ロボット制御手段(3)は、上記基本制御
動作格納手段(5)の格納情報に従って学習制御するこ
とで自らが備える上記階層ネットワークの重みの値を設
定するとともに、上記閾値入力ユニット(3′−h)の
出力に基づいて上記中間層および出力層を構成する単位
ユニットにおける上記閾値関数を設定し、このようにし
て設定された上記階層ネットワークの出力層の出力値を
もって上記行動パターン発生手段(2)への制御信号と
してなることを、 特徴とするロボット制御方式。 - (6)ロボットを取囲む外界情報を取り込む複数のセン
サからなるセンサ手段(1)と、ロボットの行動パター
ンを規定する行動パターン信号を発生する行動パターン
発生手段(2)と、上記センサ手段(1)の検出パター
ンに応じて上記行動パターン発生手段(2)に制御信号
を送出するロボット制御手段(3)と、予め選択される
上記センサ手段(1)の1つまたは複数個の特定の検出
パターンに対しての上記ロボット制御手段(3)の送出
すべき制御信号情報を格納する基本制御動作格納手段(
5)とを備え、 上記ロボット制御手段(3)は、1つまたは複数の入力
とこの入力に対して乗算されるべき重みとを受取って積
和を得る累算部(31)と、この累算部(31)からの
出力を閾値関数によって変換して最終出力を得る閾値処
理部(32)とを有する基本ユニット(30)を単位ユ
ニットとし、上記センサ手段(1)に接続される複数個
の上記単位ユニット(3−h)を入力層とし、かつ複数
個の上記単位ユニット(3−i)を中間層として1つま
たは複数段の中間層を備え、かつ上記行動パターン発生
手段(2)に接続される1つまたは複数個の上記単位ユ
ニット(3−j)を出力層とし、上記入力層と最前段の
中間層との間、中間層相互間および最終段の中間層と出
力層との間で内部結合を構成することで階層ネットワー
クを構成するとともに、上記入力層を構成する単位ユニ
ットのみに入力信号とは別に常に値「1」を入力値とし
てもつ閾値入力ユニット(3′−h)を1つ以上設け、
更に、上記中間層を構成する単位ユニットの個数に識別
に必要な個数以上の冗長性をそして、上記ロボット制御
手段(3)は、上記基本制御動作格納手段(5)の格納
情報に従って学習制御することで自らが備える上記階層
ネットワークの重みの値を設定するとともに、上記閾値
入力ユニット(3′−h)の出力に基づいて上記中間層
および出力層を構成する単位ユニットにおける上記閾値
関数を設定し、このようにして設定された上記階層ネッ
トワークの出力層の出力値をもって上記行動パターン発
生手段(2)への制御信号としてなることを、 特徴とするロボット制御方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62333485A JP2669626B2 (ja) | 1987-12-28 | 1987-12-28 | ロボット制御方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP62333485A JP2669626B2 (ja) | 1987-12-28 | 1987-12-28 | ロボット制御方式 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH01173202A true JPH01173202A (ja) | 1989-07-07 |
JP2669626B2 JP2669626B2 (ja) | 1997-10-29 |
Family
ID=18266587
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP62333485A Expired - Fee Related JP2669626B2 (ja) | 1987-12-28 | 1987-12-28 | ロボット制御方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2669626B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0381803A (ja) * | 1989-08-25 | 1991-04-08 | Hitachi Ltd | シーケンス制御方法及び装置 |
JPH04216107A (ja) * | 1990-12-17 | 1992-08-06 | Nippon Telegr & Teleph Corp <Ntt> | 半自律行動ロボット遠隔操縦方法 |
US5555347A (en) * | 1992-09-21 | 1996-09-10 | Toyoda Koki Kabushiki Kaisha | Method and apparatus for controlling a robot using a neural network |
JP6077617B1 (ja) * | 2015-09-25 | 2017-02-08 | ファナック株式会社 | 最適な速度分布を生成する工作機械 |
CN111512254A (zh) * | 2018-01-02 | 2020-08-07 | 通用电气公司 | 用于基于人类演示的工业任务的机器人学习的系统和方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6272004A (ja) * | 1985-09-26 | 1987-04-02 | Toshiba Corp | ロボツト |
-
1987
- 1987-12-28 JP JP62333485A patent/JP2669626B2/ja not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6272004A (ja) * | 1985-09-26 | 1987-04-02 | Toshiba Corp | ロボツト |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0381803A (ja) * | 1989-08-25 | 1991-04-08 | Hitachi Ltd | シーケンス制御方法及び装置 |
JPH04216107A (ja) * | 1990-12-17 | 1992-08-06 | Nippon Telegr & Teleph Corp <Ntt> | 半自律行動ロボット遠隔操縦方法 |
US5555347A (en) * | 1992-09-21 | 1996-09-10 | Toyoda Koki Kabushiki Kaisha | Method and apparatus for controlling a robot using a neural network |
JP6077617B1 (ja) * | 2015-09-25 | 2017-02-08 | ファナック株式会社 | 最適な速度分布を生成する工作機械 |
CN111512254A (zh) * | 2018-01-02 | 2020-08-07 | 通用电气公司 | 用于基于人类演示的工业任务的机器人学习的系统和方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2669626B2 (ja) | 1997-10-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Sastry et al. | Memory neuron networks for identification and control of dynamical systems | |
Jiang et al. | A brief review of neural networks based learning and control and their applications for robots | |
Chen et al. | Adaptive control of nonlinear systems using neural networks | |
Köker et al. | A neural-network committee machine approach to the inverse kinematics problem solution of robotic manipulators | |
Lewis et al. | Neural net robot controller: Structure and stability proofs | |
Gorinevsky et al. | Comparison of some neural network and scattered data approximations: The inverse manipulator kinematics example | |
Balakrishnan et al. | Neurocontrol: A literature survey | |
Cui et al. | Design of control systems using quaternion neural network and its application to inverse kinematics of robot manipulator | |
Mouha | Deep learning for robotics | |
US6000827A (en) | System identifying device and adaptive learning control device | |
JPH01173202A (ja) | ロボット制御方式 | |
Navarro-Gonzalez et al. | On-line incremental learning for unknown conditions during assembly operations with industrial robots | |
An et al. | Comparative aspects of neural network algorithms for on-line modelling of dynamic processes | |
Ichihashi et al. | Neuro-fuzzy optimal control of backing up a trailer truck | |
JP2523150B2 (ja) | ロボット制御方式 | |
Barreto et al. | Unsupervised learning and recall of temporal sequences: An application to robotics | |
JPH0454685A (ja) | 状熊学習装置及び状態推定装置 | |
Araújo et al. | A partially recurrent neural network to perform trajectory planning, inverse kinematics, and inverse dynamics | |
Katić et al. | Connectionist approaches to the control of manipulation robots at the executive hierarchical level: An overview | |
Collins et al. | Cerebellar control of a line following robot | |
Ichihashi et al. | A neurofuzzy approach to variational problems by using Gaussian membership functions | |
Jack et al. | Neural networks and the inverse kinematics problem | |
JPH01173257A (ja) | ネットワーク構成データ処理装置 | |
Araújo et al. | Associative memory used for trajectory generation and inverse kinematics problem | |
JPH03268077A (ja) | ニューラルネットワークによる重心決定要素出力装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |