JP2669626B2 - ロボット制御方式 - Google Patents

ロボット制御方式

Info

Publication number
JP2669626B2
JP2669626B2 JP62333485A JP33348587A JP2669626B2 JP 2669626 B2 JP2669626 B2 JP 2669626B2 JP 62333485 A JP62333485 A JP 62333485A JP 33348587 A JP33348587 A JP 33348587A JP 2669626 B2 JP2669626 B2 JP 2669626B2
Authority
JP
Japan
Prior art keywords
unit
output
robot
layer
action pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP62333485A
Other languages
English (en)
Other versions
JPH01173202A (ja
Inventor
茂美 長田
和雄 浅川
英樹 吉沢
実 関口
信雄 渡部
隆 木本
旭 川村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP62333485A priority Critical patent/JP2669626B2/ja
Publication of JPH01173202A publication Critical patent/JPH01173202A/ja
Application granted granted Critical
Publication of JP2669626B2 publication Critical patent/JP2669626B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Numerical Control (AREA)
  • Manipulator (AREA)
  • Feedback Control In General (AREA)

Description

【発明の詳細な説明】 〔概 要〕 センシングされた外界情報に基づいて行動するロボッ
トを制御するためのロボット制御方式において, 新たな状況の出現や環境の変化が生じた場合において
も,ロボットが尤もらしい行動をとることができる“柔
らかい”ロボット制御方式の技術を実現することを目的
としており, 制御信号を生成するロボット制御手段を重みを有する
階層ネットワークで構成するとともに,予め選択される
いくつかの好ましい制御内容が実現できるようにと学習
制御することでこの階層ネットワークの重みを設定し,
このようにして設定された重みを有する階層ネットワー
クに従って外界情報に応じた制御信号を生成してロボッ
トを制御するようにと構成するものである。 〔産業上の利用分野〕 本発明は,複数のセンサ情報に基づいて行動するロボ
ットの制御方式に関する。 近年,人工知能(AI),ファクトリオートメーション
(FA),オフィスオートメーション(OA)の進展に伴
い,人間にとって使い易く,人間と共存できる知的な
“柔らかい”システムへの要求が高まっている。この期
待に応えるため,エキスパートシステム等を適用したシ
ステムや,パターン認識機能を備えたロボット等が提供
され始めているが,未だ“柔らかい”システムというに
は程遠い段階にある。これから,使用方法や環境の変化
に応じてロボットの行動を適応的に制御する“柔らか
い”ロボット制御方式の開発が望まれているのである。 〔従来の技術〕 従来のロボット制御方式は,逐次処理コンピュータ
(ノイマン型コンピュータ)によって実現されている。
従って,複数のセンサ情報に基づいて行動するロボット
の制御方式についても,どのセンサがどういう情報をも
たらすかということを予め人間が考慮した上で,どのよ
うなセンサからの入力パターンが入ってきた時,どのよ
うな出力パターンを発生し,行動したらよいかをプログ
ラムの形で厳密に記述していくといったような構成によ
り実現されていた。 〔発明が解決しようとする問題点〕 従って,ロボットはこのプログラムに基づいて行動し
ているだけであり,当然,プログラムに記述されていな
い状況には対応できず,また,センサの特性が少しでも
変化したり,多数のセンサのうち1つでも壊れたりする
と,適切な行動をとることができない等といった問題点
があった。さらに,ロボットが多数のセンサ群を備えて
いる場合,プログラムを作成すること自体が極めて困
難,或いは不可能になるといった問題点を生じていた。 発明はかかる事情に鑑みてなされたものであって,い
かなる条件下にあってもロボットが適切な行動をとるよ
うにする“柔らかい”システムをなすロボット制御方式
の提供を目的とするものである。 〔問題点を解決するための手段〕 第1図は,本発明の原理説明図である。 図中,1はセンサ手段であり,ロボットを取囲む外界情
報を取り込む複数のセンサからなるもの,2は行動パター
ン発生手段であり、行動パターン信号を発生させてロボ
ットの行動パターンを規定するもの,3はロボット制御手
段であり,重みを有する階層ネットワークから構成さ
れ,階層ネットワークに従ってセンサ手段1の検出パタ
ーンに応じた制御信号を生成して行動パターン発生手段
2を制御するもの,4は動作モード信号であり,ロボット
制御手段3の動作モードを学習モードか処理かのいずれ
かに設定するためのもの,5は基本制御動作格納手段であ
り,予め選択されるセンサ手段1の1つまたは複数個の
特定の検出パターンに対してのロボット制御手段3の生
成すべき制御信号情報を格納するためのものである。 〔作 用〕 本発明では,ロボット制御手段3は,学習モードのと
きに,基本制御動作格納手段5に格納される格納情報が
実現できるようにと学習制御することで階層ネットワー
クの重みを設定するとともに,処理モードのときに,こ
のようにして設定された重みを有す階層ネットワークに
従ってセンサ手段1の検出パターンに応じた制御信号を
生成して,行動パターン発生手段2を介してロボットの
行動を制御することになる。 このように本発明によれば,予め,人間がすべての入
力パターンとそれに対応する行動パターンとの対を考慮
して,厳密なプログラミングを行う必要がなく,人間は
基本的の入出力パターンの対の数だけ,基本制御動作格
納手段5を通してロボット制御手段3に与えてやればよ
い。また,ロボット制御手段3は,ネットワークで構成
されており,入力層および中間層のユニット数が多けれ
ば,入力層の1つのユニット当たりの情報は中間層のユ
ニットの中に分散されてしまうので,入力層に多少の誤
差が混入しても出力層に影響を及ぼすことなく,誤差を
吸収することができるので,学習,訓練に用いた入力パ
ターン以外の未知のセンサ入力パターンが発生しても,
その入力パターンに近い学習,訓練に用いた入力パター
ンと連合された出力パターンを発生でき,尤もらしい行
動をとることができる。同様の理由で,センサの特性変
化や,故障にも対応することも可能となる。 〔実施例〕 以下,実施例に従って本発明を詳細に説明する。 第2図は,第1図で説明したロボット制御手段3の詳
細な実施例構成図である。この図に示すように,本発明
のロボット制御手段3は,ユニットと呼ぶ一種のノード
と重みを持つ内部結合とからなる階層ネットワークより
構成されることになる。この構成は,基本的には,コン
ピュータに適応機能を与えるデータ処理方式として提唱
されているバック・プロパゲーション法と呼ばれている
処理方式(D.E.Rumelhart,G.E.Hinton,and R.J.William
s,“Learning"Internal Representations by Error Pro
pagation,"PARALLEL DISTRIBUTED PROCESSING,Vol.1,p
p.318−364,The MIT Press,1986)と同じものである。 次に,このバック・プロパゲーション法の概要につい
て説明する。 バック・プロパゲーション法ではユニットと呼ぶ一種
のノードと重みを持つ内部結合とから階層ネットワーク
を構成している。第3図は,ユニットの内部構成を示し
たもので基本ユニット30と呼ぶ。この基本ユニット30
は,多入力一出力系となっている。このユニットでは,
複数の各々の入力に対し各々の内部結合の重みを乗じて
これらの全乗算結果を和算する累算部31と,さらに,閾
値処理を施して1つの出力を出す閾値処理部32とをもっ
ている。即ちバック・プロパゲーション法における基本
ユニット30でのデータ処理は,入力と重みとの積和演算
および閾値処理からなっている。ここで,バック・プロ
パゲーション法では閾値の関数として,式(2)で示さ
れるシグモイド関数を用いている。 基本ユニットで行われる演算を数式で示すと以下のよ
うになる。 ypi=1/(1+exp(−xpi+θ)) 式(2) 但し, h:h層のユニット番号 i:i層のユニット番号 p:入力パターン番号 θi:i層のi番目のユニットの閾値 Wih:h−i層間の内部結合の重み xpi:h層の各ユニットからi層のi番ユニット への入力の積和 yph:pパターン入力に対するh層の出力 ypi:pパターン入力に対するi層の出力 バック・プロパゲーション法では,この積和と閾値処
理を基本とする基本ユニット30を第2図のような誤差フ
ィードバックを持つ階層ネットワーク構造として,重み
と閾値とを誤差のフィードバックにより適応的に自動調
節するアルゴリズムを用い,所望のデータ処理方法(入
力パターンと出力パターンとの間の連合)をネットワー
クに学習させることにより適応的なデータ処理を実行す
る。 ここで,式(1)および式(2)から,バック・プロ
パゲーション法では重みと閾値との調節が同時に実行さ
れる必要があるが,重みと閾値との設定は相互に干渉す
る難しい作業となる。従来のバック・プロパゲーション
法では,ユニット毎に閾値を与えていたが,ユニット数
が多数となると各ユニット毎に閾値を与えることが煩雑
で面倒な作業となるため,閾値の自動設定が切望されて
いたのである。そこで本発明のロボット制御手段3で
は,第2図に示すように,入力層中に入力信号数の入力
ユニット3−hの外に,常に「1」が入力される閾値調
節用の閾値入力ユニット3′−hを設けるよう構成する
ものである。 このように,閾値入力ユニット3′−hを設けたこと
によって中間層の各ユニット3−iの閾値を,中間層に
対する重みWihを設定することと同等の処理にて設定で
きる理由は次の如きものと考えてよい。即ち, 中間層の各ユニット3−iにおいては,入力層内の1
つ余分にもうけたユニット3′−hからの値yphが常に
「1」であることから,値xpiは式(1)から, ∴x′pi=xpi+Wih′ (ただしh′は入力層の閾値入力ユニットの番号)で与
えられる。この結果からθ=−Wih′として式(2)
に代入すると, ypi=1/(1+exp(−xpi−Wih′)) となり,式(2)に示されている閾値θを実質的に−
Wih′に設定変更したことに対応する。即ち,中間層に
おける各ユニットの閾値をいちいち設定する煩雑さが解
消される。 次に,第4図に示す具体例に従って,第1図で説明し
た基本制御動作格納手段5に格納されるところの格納情
報について説明する。例えば第2図に示すようにセンサ
出力が2値化モードで入力ユニット3−hが3個のとき
は,第4図にも示すようにロボット制御手段3への入力
パターンの数は8通りとなる。従って,ロボット行動パ
ターンが例えば動状態か停止状態という2通りであるな
らば,これらの8通りの入力パターンの各々に対して
「1」か「0」というロボットの行動パターンは定まる
ことになる。このように,センサ手段1の検出パターン
に対してロボットが本来的にどういう行動をとるべきか
ということは定まっているので,基本制御動作格納手段
5には,このような情報の内のいくつかが予め選択され
て格納されるように構成されることになる。なお,第4
図に示したような8通りの入力パターンと数の少ないも
のにあってはそのすべてを格納することも可能である。 第4図の例の内容についての理解を深めるために,第
5図に示すロボットの行動パターンの具体例について説
明する。第5図では具体的に,第5図(a)に示す3つ
の光センサと“右に旋回する”という行動をとるための
1つのモータを持つロボットを考えている。そして,こ
のロボットに,第5図(a)に示すようなロボットの周
りを回る発光源に追従するという行動をとらせたいと想
定する。このとき,ロボットのセンサ入力パターンとし
ては,第4図の入力パターンの欄に示す組み合わせが考
えられる。例えば,第4図の「0」の入力パターンは光
センサ,,が3つともOFFの状態,「4」の入力
パターンは光センサがON,光センサ,がOFFの状
態,「6」の入力パターンは光センサ,がON,光セ
ンサがOFFの状態である。ロボットを回転する発光源
に追従させるためには,このような入力パターンに応じ
て,第4図の教師信号欄に示す出力パターン(行動)が
ネットワークの学習,訓練により,実現できるようにす
ればよい。例えば,第4図の「0」の入力パターンは,
光センサ,,ともOFFの状態,即ち,発光源から
光が出ていない状態なので,この時の出力パターンは
“0",即ち,“モータをOFFにせよ”という制御を表して
いる。また,「6」の入力パターンは,光センサ,
がON,光センサがOFFの状態,即ち,まさに発光源を捉
えた状態(第5図(a))なので,“モータをOFFにせ
よ”という制御を表し,「4」の入力パターンは光セン
サがON,光センサ,がOFFの状態,即ち,ロボット
が捉えた発光源がさらに移動した状態(第5図(b))
なので,“モータをONにせよ(右に旋回せよ)”という
ことを表している。すなわち,第4図に示すような教師
信号が得られれば,第5図で説明したようなロボットの
行動パターンは好ましく制御されることになる。 このような好ましい制御を実現するために,本発明で
は,ロボット制御手段3の階層ネットワークの内部結合
の重みWih及びWjiを,基本制御動作格納手段5に格納さ
れる格納情報に従って学習的に決定していこうとするも
のである。すなわち,ロボット制御手段3の動作モード
を学習モードにセットし,基本制御動作格納手段5から
順次格納情報を読み出して,バック・プロパゲーション
法の学習アルゴリズムを用いて重みWih及びWjiの値を自
動設定するよう構成するものである。 次に,この重みWih及びWjiの値を決定するための学習
手順について説明する。ここで,この学習手順の説明
は,第6図に示すようなロボット制御手段3の出力層が
複数の出力ユニット3−jをもつ更に一般化したもので
説明するものである。 まず,内部結合の重みの初期値を決める。この初期値
は,1以下の乱数により決める。これは,重みの値が全て
同じか,あるいはユニットに関して対称となると,バッ
ク・プロパゲーション法では重みの変化が生ぜず,学習
が進行しなくなってしまうのでこれを避ける目的で乱数
を用いるのである。続いて,基本制御動作格納手段5に
格納されるところの入力パターンとその入力パターンと
対をなす所望の出力パターンのデータを順次読み出す。
例えば第4図に示すように,8個の格納情報があればこれ
らのすべてが順次読み出されることになる。 続いて,バック・プロパゲーション法に関わる制御パ
ラメータを入力する。ここでは,インクリメンタルな繰
り返し学習の一回当たりの重みの変化量の係数である学
習率と収束時の振動を抑えるための学習速度を制御パラ
メータとしている。そして,バック・プロパゲーション
法のアルゴリズムに従って出力層ユニット3−jの出力
値が所望の出力と一致するようにインクリメンタルに内
部結合の重みを学習し,最後に,出力層ユニットの出力
と所望の出力値との誤差が全ての入力パターンに関して
所定の値より少なくなったら,学習を終了する。 具体的な階層ネットワークの重みの更新のアルゴリズ
ムを以下に説明する。式(1),式(2)からの類推に
よって次の式が得られる。即ち, ypi=1/(1+exp(−xpi+θ)) 式(4) ypj=1/(1+exp(−xpj+θ)) 式(6) 但し, yph:p番目パターン入力値に対するh層(ここでは入力
層)のh番目のユニットからの出力 ypi:p番目パターン入力値に対するi層(ここでは中間
層)のi番目のユニットからの出力 ypj:p番目パターン入力値に対するj層(ここでは出力
層)のj番目のユニットからの出力 xpi:i層のi番目のユニットへのp番目パターン入力に
対する総和 xpj:j層のj番目のユニットへのp番目パターン入力に
対する総和 Wih:h層h番目ユニットとi層i番目ユニット間の重み Wji:i層i番目ユニットとj層j番目ユニット間の重み 次に,これらの値から,教師入力ベクトルとネットワ
ークの出力ベクトルとの誤差の二乗和Epをネットワーク
の誤差として計算する。 但し, Ep:p番目パターン入力に対する誤差ベクトル E:全パターン入力に対する誤差ベクトルの総和 dpj:p番目パターン入力に対するj層j番目ユニットへ
の教師信号 ここで誤差ベクトルと出力層ベクトルとの関係を求め
るため,式(7)をypjに関して偏微分すると, を得る。更に,誤差ベクトルとj層への入力との関係を
求めるため,誤差ベクトルをxpjで偏微分すると, を得る。但し,本実施例では入力層に1つの入力ユニッ
ト3′−hを設けこのユニット3′−hに常に「1」の
値を入力する方式を採用することで,他の各ユニットの
閾値θの自動調節を実現している。更に,誤差ベクトル
とi−j層間の重みとの関係をもとめるため,誤差ベク
トルをWjiで偏微分すると, の積和で表される解を得る。 次に,i層の出力ypiに対する誤差ベクトルEpの変化で
求めると, を得る。更に,i層入力ユニットへの総和xpiの変化に対
する誤差ベクトルEpの変化を計算すると,の積和で表される解を得る。更に,h−i層間の重みの変
化に対する誤差ベクトルの変化の関係を求めると, の積和で表される解を得る。 これらから,全入力パターンに対する誤差ベクトルと
i−j層間の重みとの関係を求めると以下のようにな
る。 また,全入力パターンに対する誤差ベクトルとh−i
層間の重みとの関係を求めると以下のようになる。 式(14)および式(15)は,各層間の重みの変化に対
する誤差ベクトルの変化率を示していることから,この
値が常に負になるように重みを変化させると公知の勾配
法により,誤差の2乗和であるEを漸近的に0とするこ
とができる。そこで本実施例では,重みの一回当たりの
変化量ΔWjiを以下のように設定し,勾配法に基づき繰
り返しこの操作を行い,Eを零に収束させている。 但し, ε:学習率(勾配法の勾配率と同じ機能) 更に,本発明では,勾配法における収束時の振動を抑
制する目的で学習速度を式(16)および式(17)に適用
して,ΔWihとΔWjiを以下のように設定している。 但し, α:学習速度定数 t:回数 なお,上述の重みWihやWjiは各ユニット3−iや3−
jに夫々対応する記憶装置内に格納され,その内容が上
述の学習の間フィードバックによって修正される。そし
て最終的に定まった学習結果の重みWih,Wjiが,これか
ら説明する実際の処理に当って使われることになる。こ
の記憶装置としては,基本制御動作格納手段5を用いる
ことも可能であるが,また別に設けるものであってもよ
い。 次に,このようにして決定された階層ネットワークの
内部結合の重みWih及びWjiを用いて実行されることにな
るロボットの制御について説明する。 階層ネットワークの学習を終えると,ロボット制御手
段3の動作モードを処理モード,すなわち実際にロボッ
トの動作を制御するモードにと切換える。この処理モー
ドでは,複数のセンサからなるセンサ手段1により取り
込まれたセンサの検出信号からなる入力パターンは,ロ
ボット制御手段3の階層ネットワークの入力層にと入力
される。そして,ロボット制御手段3は,この入力パタ
ーンに対して学習モードで定まった重み値及び閾値を使
って積和演算と閾値処理を実行して出力パターンを求め
るとともに,この求めた出力パターンを制御信号として
行動パターン発生手段2にと送出する。そして,この制
御信号を受け取った行動パターン発生手段2は,その制
御信号に対応する行動パターン信号を発生してロボット
の行動パターンを規定することになる。従って,このよ
うな処理を繰返すことによって,ロボットは複数のセン
サの検出パターンに応じた適切な行動をとることができ
ることになる。 この処理の内容を第5図の例に従って具体的にみてみ
ることにする。今,ロボットと発光源との関係が第5図
(a)の状態,即ち,ロボットの光センサ,がON,
光センサがOFF,モータがOFFの状態にあるとする。こ
の時,発光源が第5図(b)のように,右側に動くと,
ロボットの光センサがON,光センサ,がOFFの状態
に変わる。これを第2図に示したネットワークに入力す
ると,出力パターンとして“モータをONにせよ(右に旋
回せよ)”という制御信号を表す「1」という出力が発
生される。従って,ロボットは右旋回を行う。この右旋
回は,3つの光センサのうち2つがONになるまで続けられ
る。この場合では,第5図(c)のように,光センサ
,がON,光センサがOFFの状態になった時,ネット
ワークは“モータをOFFにせよ”という制御を表す
「0」を出すので,ロボットは停止する。このようにし
て,ロボットが時々刻々と取り込んでくるセンサ入力信
号パターンを第2図に示したネットワークに入力し,ネ
ットワークがその入力パターンに対応して時々刻々と出
力する最適な出力パターンに従ってモータを制御するこ
とにより,発光源の動きに追従することができる。この
例では,発光源が右に動く場合について述べたが,第5
図(d)のように発光源が左に動いても,同様にして,
ロボットは追従することができる。 このようにして,ロボットが適切な行動をとるように
と制御されていくことになる。しかるに,センサの数や
制御信号の数が多いときには,基本制御動作格納手段5
に入力パターンとその入力パターンと対をなす所望の出
力パターンのデータのすべてを格納することができない
ので,基本的なものが格納されることになる。これか
ら,この基本的なデータを使った学習により求まる重み
値と閾値で出力パターンを求めていったときに,所望の
ロボットの行動が得られないことが生ずることがある。
このようなとき,本発明では,動作モードを学習モード
に切り換え,その段階でのネットワークの結合の重みを
初期値として,所望の得られなかった時点の入力パター
ンと所望の出力パターンとの対を基本制御動作格納手段
5に格納して,ロボット制御手段3に,それらの入出力
パターン対をさらに重ねて連合することができるように
結合の重みを自動的に微調整させることにより,ロボッ
トの制御性能を向上させることができる。したがって,
最終的には,ロボットの最適な制御を実現できるように
なる。 第7図は,バック・プロパゲーション法により一種の
パリティチェック処理をネットワークに学習(重みと閾
値との自動調整)させた結果のネットワークを示してい
る。ここで第7図(A)図示のNet1と第7図(B)図示
のNet2とは夫々奇数パリティをチェックする同一の特
性,即ち,「0」または「1」をとる3つの入力に対し
て「1」の数が奇数個のとき出力層は「1」を出力する
ようになっている。第7図では,内部結合線の隣の数字
が重みであり,ユニットを表す○の中の数字が閾値であ
る。Net1とNet2を比較すると,重みと閾値とが全く異な
ることが分かる。これは,ネットワークに冗長性がある
ため,こうした差異が生じることになる。この第7図に
示すように,基本ユニット30の出力を「1」と「0」の
状態しかとらないようにとネットワークを構成すること
も可能である。 次に,階層ネットワークを構成する中間層のユニット
数の冗長性について説明する。第8図は,排他OR機能を
実現するネットワークであり,中間層ユニット数の冗長
性を持たせない場合の例である。排他ORは,第9図にお
いて,入力パターンの直線による識別(線形識別)に関
して,一本の直線では不可能で少なくとも第9図(B)
図示の如く二本の直線を要する。従って,この識別には
第9図(A)図示の如く2つの中間層ユニットが最小限
必要となっている。ところが,本発明では中間層ユニッ
トと出力層ユニットの閾値を自動調整するのに入力層に
常時「1」を入力信号として持つ閾値入力ユニット3′
−hが設けられていることから,第8図図示のネットワ
ークにおいては,識別すべき数に対して中間層ユニット
の数に冗長性がない。この場合,2つの中間層ユニット3
−iは出力層ユニット3−jの閾値を含めた自動調節を
しなければならず,排他OR特性に適応するまでの繰り返
し学習回数が増大することになる。これに対して第10図
は冗長性をもつネットワークの例を示す。図に示したよ
うに,中間層ユニット数に冗長性を持たせると,余った
ユニットが出力層のユニット3−jの閾値の調節に専念
できることから繰り返し学習回数は,冗長なユニットが
ない場合に比し大幅に低減できる。 次に内部結合の重みの具体的な計算例について説明す
る。 奇数パリティチェック機能の学習を終了した時の各ユ
ニット間の内部結合重みを第11図および第13図に示す。
第11図ないし第13図の重みは異なるが機能は同じであ
る。これは,学習率と学習速度パラメータが異なること
と中間層ユニット数の冗長性とによる。第12図(A)
(B)(C)は夫々,第11図で示した学習終了後に,任
意のパターンを入力した場合の入力と出力を示してい
る。また第14図(A)(B)(C)は夫々,第13図で示
した学習終了後に,任意のパターンを入力した場合の入
力と出力を示している。ロボット制御手段3では,演算
アナログ値で行うため,出力値は完全な1または0とな
っていないが,閾値を用いるなどすれば第12図および第
14図図示の出力値から1または0を判断することは容易
であることは明らかである。 また,第15図は奇数パリティチェック機能を学習させ
たのと全く同じネットワークに偶数パリティチェック機
能を学習させた結果を示すものであり,各内部結合の重
みを示している。第16図(A)(B)(C)は夫々,第
15図で示した学習終了後に,任意のパターンを入力した
場合の入力と出力を示している。 この結果から,本発明によりネットワークの適応性を
低下させずに,しかも重みと閾値の同時且つ自動調節が
簡単な方法でできること,また,カメレオンのように様
々な機能を持つデータ処理装置に変身できるとが示され
た。 〔発明の効果〕 以上説明したように,本発明によれば,複数のセンサ
入力信号から成るパターンと,その入力パターンに対し
てとるべき最適な行動を規定する出力パターンとを階層
ネットワークの中にいわば連合させて記憶するので,人
間はすべてのセンサ入力パターンとそれに対する出力パ
ターンを洗い出して,厳密にプログラミングする必要は
なく,ただ,基本的な入出力パターン対を階層ネットワ
ークに教えるだけですむ。また,学習させた入出力パタ
ーン対以外の未知の入力パターンに対しても,その入力
パターンに近い学習した入力パターンに応じた出力パタ
ーンを発生できるので,センサの特性変化や,故障にも
柔軟に対応できる。さらに,基本的な入出力パターン対
で入力パターンと出力パターンとの連合を完了したネッ
トワークの結合の重みで,実際にロボットを制御した結
果,所望の行動が得られなかった場合,その段階でのネ
ットワークの結合の重みを初期値として,所望の得られ
なかった時点の入力パターンと所望の出力パターンとの
対をさらに重ねて連合することができるように結合の重
みを自動的に微調整させることにより,ロボットの制御
性能を向上させることができる。従って,最終的には,
ロボットの最適な制御を実現できるようになる。しか
も,階層ネットワークは並列処理アーキテクチャのマシ
ンに適した処理方式であり,センサ入力パターンを取り
込むと瞬時に出力パターンを発生できるので,ロボット
の柔軟なリアルタイム制御に寄与するところが大きい。 更に,本発明によれば,階層ネットワークの入力層に
閾値ユニットをもうけ,また中間層のユニットの個数に
識別すべき数以上の冗長制御を持たせていることから,
各ユニット間の内部結合の重みと各ユニットの閾値との
調節が自動的且つ簡単な方法で実行でき,閾値を全く意
識せず,またネットワークの適応性を低下させることな
く学習を遂行出来るのである。
【図面の簡単な説明】 第1図は本発明の原理説明図, 第2図はロボット制御手段の実施例構成図, 第3図は基本ユニットの構成図, 第4図は基本制御動作格納手段の格納情報例, 第5図はロボットの行動パターンの具体例, 第6図はロボット制御手段の他の実施例構成図, 第7図は奇数パリティチェック機能をもつネットワーク
の例, 第8図は中間層の数が冗長性を持たない排他ORのネット
ワーク, 第9図は排他ORと中間層ユニットの役割を説明する説明
図, 第10図は中間層の数が冗長性を持つ排他ORのネットワー
ク, 第11図は学習結果を示す内部結合の重み(I)の説明
図, 第12図は第11図の重みに従った処理例, 第13図は学習結果を示す内部結合の重み(II)の説明
図, 第14図は第13図の重みに従った処理例, 第15図は学習結果を示す内部結合の重み(III)の説明
図, 第16図は第15図の重みに従った処理例である。 図中,1はセンサ手段,2は行動パターン発生手段,3はロボ
ット制御手段,3′−hは閾値入力ユニット,5は基本制御
動作格納手段,30は基本ユニット,31は累算部,32は閾値
処理部である。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 関口 実 神奈川県川崎市中原区上小田中1015番地 富士通株式会社内 (72)発明者 渡部 信雄 神奈川県川崎市中原区上小田中1015番地 富士通株式会社内 (72)発明者 木本 隆 神奈川県川崎市中原区上小田中1015番地 富士通株式会社内 (72)発明者 川村 旭 神奈川県川崎市中原区上小田中1015番地 富士通株式会社内 (56)参考文献 特開 昭62−72004(JP,A) 特開 平1−183763(JP,A) 特公 昭55−930(JP,B1) 特公 平7−36183(JP,B2)

Claims (1)

  1. (57)【特許請求の範囲】 1.ロボットを取囲む外界情報を取り込む複数のセンサ
    からなるセンサ手段と、ロボットの行動パターンを規定
    する行動パターン信号を発生する行動パターン発生手段
    と、上記センサ手段の検出パターンに応じて上記行動パ
    ターン発生手段に制御信号を送出するロボット制御手段
    と、予め選択される上記センサの手段の1つまたは複数
    個の特定の検出パターンに対しての上記ロボット制御手
    段の送出すべき制御信号情報を格納する基本制御動作格
    納手段とを備え、 上記ロボット制御手段は、1つまたは複数の入力とこの
    入力に対し乗算されるべき重みとを受取って積和を得る
    累算部と、この累算部からの出力を閾値関数によって変
    換して最終出力を得る閾値処理部とを有する基本ユニッ
    トを単位ユニットとし、上記センサ手段の検出値を受け
    取って分配する複数個のユニットを入力層とし、かつ複
    数個の上記単位ユニットを中間層として1つまたは複数
    段の中間層を備え、かつ上記行動パターン発生手段に接
    続される1つまたは複数個の上記単位ユニットを出力層
    とし、上記入力層と最前段の中間層との間、中間層相互
    間および最終段の中間層と出力層との間で内部結合を構
    成することで階層ネットワークを構成し、 そして、上記ロボット制御手段は、上記基本制御動作格
    納手段の格納情報が実現できるようにと学習制御するこ
    とで自らが備える上記階層ネットワークの重みの値を設
    定するとともに、この重み値の設定された上記階層ネッ
    トワークの出力層の出力値をもって上記行動パターン発
    生手段への制御信号としてなることを、 特徴とするロボット制御方式。 2.ロボットを取囲む外界情報を2値化モードで取り込
    む複数のセンサからなるセンサ手段と、ロボットの行動
    パターンを規定する行動パターン信号を発生する行動パ
    ターン発生手段と、上記センサ手段の検出パターンに応
    じて上記行動パターン発生手段に2値化モードの制御信
    号を送出するロボット制御手段と、予め選択される上記
    センサ手段の1つまたは複数個の特定の検出パターンに
    対しての上記ロボット制御手段の送出すべき制御信号情
    報を格納する基本制御動作格納手段とを備え、 上記ロボット制御手段は、1つまたは複数の入力とこの
    入力に対して乗算されるべき重みとを受取って積和を得
    る累算部と、この累算部からの出力を閾値関数によって
    変換して最終出力を得る閾値部とを有する基本ユニット
    を単位ユニットとし、上記センサ手段の検出値を受け取
    って分配する複数個のユニットを入力層とし、かつ複数
    個の上記単位ユニットを中間層として1つまたは複数段
    の中間層を備え、かつ上記行動パターン発生手段に接続
    される1つまたは複数個の上記単位ユニットを出力層と
    し、上記入力層と最前段の中間層との間、中間層相互間
    および最終段の中間層と出力層との間で内部結合を構成
    することで階層ネットワークを構成し、 そして、上記ロボット制御手段は、上記基本制御動作格
    納手段の格納情報が実現できるようにと学習制御するこ
    とで自らが備える上記階層ネットワークの重みの値を設
    定するとともに、この重み値の設定された上記階層ネッ
    トワークの出力層の2値化された出力値をもって上記行
    動パターン発生手段への制御信号としてなることを、 特徴とするロボット制御方式。 3.ロボットを取囲む外界情報を取り込む複数のセンサ
    からなるセンサ手段と、ロボットの行動パターンを規定
    する行動パターン信号を発生する行動パターン発生手段
    と、上記センサ手段の検出パターンに応じて上記行動パ
    ターン発生手段に制御信号を送出するロボット制御手段
    とを備え、 上記ロボット制御手段は、1つまたは複数の入力とこの
    入力に対し乗算されるべき重みとを受取って積和を得る
    累算部と、この累算部からの出力を閾値関数によって変
    換して最終出力を得る閾値処理部とを有する基本ユニッ
    トを単位ユニットとし、上記センサ手段の検出値を受け
    取って分配する複数個のユニットを入力層とし、かつ複
    数個の上記単位ユニットを中間層として1つまたは複数
    段の中間層を備え、かつ上記行動パターン発生手段に接
    続される1つまたは複数個の上記単位ユニットを出力層
    とし、上記入力層と最前段の中間層との間、中間層相互
    間および最終段の中間層と出力層との間で内部結合を構
    成することで階層ネットワークを構成し、 そして、上記ロボット制御手段は、上記階層ネットワー
    クの出力層の出力値をもって上記行動パターン発生手段
    を制御したにもかかわらず所望のロボットの行動パター
    ンが得られなかったときにおいては、そのときの上記階
    層ネットワークの重みの値を初期値として、その所望の
    行動パターンが実現できるようにと学習制御することで
    上記階層ネットワークの重みの値を再調整してなること
    を、 特徴とするロボット制御方式。 4.ロボットを取囲む外界情報を取り込む複数のセンサ
    からなるセンサ手段と、ロボットの行動パターンを規定
    する行動パターン信号を発生する行動パターン発生手段
    と、上記センサ手段の検出パターンに応じて上記行動パ
    ターン発生手段に制御信号を送出するロボット制御手段
    と、予め選択される上記センサ手段の1つまたは複数個
    の特定の検出パターンに対しての上記ロボット制御手段
    の送出すべき制御信号情報を格納する基本制御動作格納
    手段とを備え、 上記ロボット制御手段は、1つまたは複数の入力とこの
    入力に対して乗算されるべき重みとを受取って積和を得
    る累算部と、この累算部からの出力を閾値関数によって
    変換して最終出力を得る閾値処理部とを有する基本ユニ
    ットを単位ユニットとし、上記センサ手段の検出値を受
    け取って分配する複数個のユニットを入力層とし、かつ
    複数個の上記単位ユニットを中間層として1つまたは複
    数段の中間層を備え、かつ上記行動パターン発生手段に
    接続される1つまたは複数個の上記単位ユニットを出力
    層とし、上記入力層と最前段の中間層との間、中間層相
    互間および最終段の中間層と出力層との間で内部結合を
    構成することで階層ネットワークを構成するとともに、
    常に入力値「1」を受け取って分配する閾値入力ユニッ
    トを1つ以上設け、 そして、上記ロボット制御手段は、上記基本制御動作格
    納手段の格納情報に従って学習制御することで自らが備
    える上記階層ネットワークの重みの値を設定するととも
    に、上記閾値入力ユニットの出力に基づいて上記中間層
    および出力層を構成する単位ユニットにおける上記閾値
    関数を設定し、このようにして設定された上記階層ネッ
    トワークの出力層の出力値をもって上記行動パターン発
    生手段への制御信号としてなることを、 特徴とするロボット制御方式。 5.ロボットを取囲む外界情報を取り込む複数のセンサ
    からなるセンサ手段と、ロボットの行動パターンを規定
    する行動パターン信号を発生する行動パターン発生手段
    と、上記センサ手段の検出パターンに応じて上記行動パ
    ターン発生手段に制御信号を送出するロボット制御手段
    と、予め選択される上記センサ手段の1つまたは複数個
    の特定の検出パターンに対しての上記ロボット制御手段
    の送出すべき制御信号情報を格納する基本制御動作格納
    手段とを備え、 上記ロボット制御手段は、1つまたは複数の入力とこの
    入力に対して乗算されるべき重みとを受取って積和を得
    る累算部と、この累算部からの出力を閾値関数によって
    変換して最終出力を得る閾値処理部とを有する基本ユニ
    ットを単位ユニットとし、上記センサ手段の検出値を受
    け取って分配する複数個のユニットを入力層とし、かつ
    複数個の上記単位ユニットを中間層として1つまたは複
    数段の中間層を備え、かつ上記行動パターン発生手段に
    接続される1つまたは複数個の上記単位ユニットを出力
    層とし、上記入力層と最前段の中間層との間、中間層相
    互間および最終段の中間層と出力層との間で内部結合を
    構成することで階層ネットワークを構成するとともに、
    常に入力値「1」を受け取って分配する閾値入力ユニッ
    トを1つ以上設け、更に、上記中間層を構成する単位ユ
    ニットの個数に識別に必要な個数以上の冗長性を与え、 そして、上記ロボット制御手段は、上記基本制御動作格
    納手段の格納情報に従って学習制御することで自らが備
    える上記階層ネットワークの重みの値を設定するととも
    に、上記閾値入力ユニットの出力に基づいて上記中間層
    および出力層を構成する単位ユニットにおける上記閾値
    関数を設定し、このようにして設定された上記階層ネッ
    トワークの出力層の出力値をもって上記行動パターン発
    生手段への制御信号としてなることを、 特徴とするロボット制御方式。
JP62333485A 1987-12-28 1987-12-28 ロボット制御方式 Expired - Fee Related JP2669626B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62333485A JP2669626B2 (ja) 1987-12-28 1987-12-28 ロボット制御方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62333485A JP2669626B2 (ja) 1987-12-28 1987-12-28 ロボット制御方式

Publications (2)

Publication Number Publication Date
JPH01173202A JPH01173202A (ja) 1989-07-07
JP2669626B2 true JP2669626B2 (ja) 1997-10-29

Family

ID=18266587

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62333485A Expired - Fee Related JP2669626B2 (ja) 1987-12-28 1987-12-28 ロボット制御方式

Country Status (1)

Country Link
JP (1) JP2669626B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0381803A (ja) * 1989-08-25 1991-04-08 Hitachi Ltd シーケンス制御方法及び装置
JP2742928B2 (ja) * 1990-12-17 1998-04-22 日本電信電話株式会社 半自律行動ロボット遠隔操縦方法
EP0589394A1 (en) * 1992-09-21 1994-03-30 Toyoda Koki Kabushiki Kaisha Method and apparatus for controlling a robot using a neural network
JP6077617B1 (ja) * 2015-09-25 2017-02-08 ファナック株式会社 最適な速度分布を生成する工作機械
US10913154B2 (en) * 2018-01-02 2021-02-09 General Electric Company Systems and method for robotic learning of industrial tasks based on human demonstration

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6272004A (ja) * 1985-09-26 1987-04-02 Toshiba Corp ロボツト

Also Published As

Publication number Publication date
JPH01173202A (ja) 1989-07-07

Similar Documents

Publication Publication Date Title
Jin et al. Robot manipulator control using neural networks: A survey
Chen et al. Adaptive control of nonlinear systems using neural networks
Sastry et al. Memory neuron networks for identification and control of dynamical systems
Nguyen et al. Neural networks for self-learning control systems
Köker et al. A neural-network committee machine approach to the inverse kinematics problem solution of robotic manipulators
Thompson et al. Neighborhood sequential and random training techniques for CMAC
Oyama et al. Inverse kinematics learning for robotic arms with fewer degrees of freedom by modular neural network systems
Ananthraman et al. Training backpropagation and CMAC neural networks for control of a SCARA robot
Zilouchian Fundamentals of neural networks
JP2669626B2 (ja) ロボット制御方式
Juarez-Lora et al. R-stdp spiking neural network architecture for motion control on a changing friction joint robotic arm
Wang et al. Unsupervising adaption neural-network control
Navarro-Gonzalez et al. On-line incremental learning for unknown conditions during assembly operations with industrial robots
An et al. Comparative aspects of neural network algorithms for on-line modelling of dynamic processes
Simon et al. Variations on the cascadecorrelation learning architecture for fast convergence in robot control
Plagianakos et al. Evolutionary training of hardware realizable multilayer perceptrons
JP2523151B2 (ja) ロボット制御方式
Romero et al. Neural network based algorithm for dynamic system optimization
Katić et al. Connectionist approaches to the control of manipulation robots at the executive hierarchical level: An overview
JP2523150B2 (ja) ロボット制御方式
Lara Artificial neural networks: An introduction
Rao et al. On-line learning of robot inverse kinematic transformations
JPH0736183B2 (ja) ネットワーク構成データ処理装置
Collins et al. Cerebellar control of a line following robot
Li et al. Powell's method applied to learning neural control of three unknown dynamic systems

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees