JP2669626B2

JP2669626B2 - ロボット制御方式

Info

Publication number: JP2669626B2
Application number: JP62333485A
Authority: JP
Inventors: 茂美長田; 和雄浅川; 英樹吉沢; 実関口; 信雄渡部; 隆木本; 旭川村
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1987-12-28
Filing date: 1987-12-28
Publication date: 1997-10-29
Anticipated expiration: 2012-10-29
Also published as: JPH01173202A

Description

【発明の詳細な説明】〔概要〕センシングされた外界情報に基づいて行動するロボッ
トを制御するためのロボット制御方式において，新たな状況の出現や環境の変化が生じた場合において
も，ロボットが尤もらしい行動をとることができる“柔
らかい”ロボット制御方式の技術を実現することを目的
としており，制御信号を生成するロボット制御手段を重みを有する
階層ネットワークで構成するとともに，予め選択される
いくつかの好ましい制御内容が実現できるようにと学習
制御することでこの階層ネットワークの重みを設定し，
このようにして設定された重みを有する階層ネットワー
クに従って外界情報に応じた制御信号を生成してロボッ
トを制御するようにと構成するものである。〔産業上の利用分野〕本発明は，複数のセンサ情報に基づいて行動するロボ
ットの制御方式に関する。近年，人工知能（AI），ファクトリオートメーション
（FA），オフィスオートメーション（OA）の進展に伴
い，人間にとって使い易く，人間と共存できる知的な
“柔らかい”システムへの要求が高まっている。この期
待に応えるため，エキスパートシステム等を適用したシ
ステムや，パターン認識機能を備えたロボット等が提供
され始めているが，未だ“柔らかい”システムというに
は程遠い段階にある。これから，使用方法や環境の変化
に応じてロボットの行動を適応的に制御する“柔らか
い”ロボット制御方式の開発が望まれているのである。〔従来の技術〕従来のロボット制御方式は，逐次処理コンピュータ
（ノイマン型コンピュータ）によって実現されている。
従って，複数のセンサ情報に基づいて行動するロボット
の制御方式についても，どのセンサがどういう情報をも
たらすかということを予め人間が考慮した上で，どのよ
うなセンサからの入力パターンが入ってきた時，どのよ
うな出力パターンを発生し，行動したらよいかをプログ
ラムの形で厳密に記述していくといったような構成によ
り実現されていた。〔発明が解決しようとする問題点〕従って，ロボットはこのプログラムに基づいて行動し
ているだけであり，当然，プログラムに記述されていな
い状況には対応できず，また，センサの特性が少しでも
変化したり，多数のセンサのうち１つでも壊れたりする
と，適切な行動をとることができない等といった問題点
があった。さらに，ロボットが多数のセンサ群を備えて
いる場合，プログラムを作成すること自体が極めて困
難，或いは不可能になるといった問題点を生じていた。発明はかかる事情に鑑みてなされたものであって，い
かなる条件下にあってもロボットが適切な行動をとるよ
うにする“柔らかい”システムをなすロボット制御方式
の提供を目的とするものである。〔問題点を解決するための手段〕第１図は，本発明の原理説明図である。図中,1はセンサ手段であり，ロボットを取囲む外界情
報を取り込む複数のセンサからなるもの,2は行動パター
ン発生手段であり、行動パターン信号を発生させてロボ
ットの行動パターンを規定するもの,3はロボット制御手
段であり，重みを有する階層ネットワークから構成さ
れ，階層ネットワークに従ってセンサ手段１の検出パタ
ーンに応じた制御信号を生成して行動パターン発生手段
２を制御するもの,4は動作モード信号であり，ロボット
制御手段３の動作モードを学習モードか処理かのいずれ
かに設定するためのもの,5は基本制御動作格納手段であ
り，予め選択されるセンサ手段１の１つまたは複数個の
特定の検出パターンに対してのロボット制御手段３の生
成すべき制御信号情報を格納するためのものである。〔作用〕本発明では，ロボット制御手段３は，学習モードのと
きに，基本制御動作格納手段５に格納される格納情報が
実現できるようにと学習制御することで階層ネットワー
クの重みを設定するとともに，処理モードのときに，こ
のようにして設定された重みを有す階層ネットワークに
従ってセンサ手段１の検出パターンに応じた制御信号を
生成して，行動パターン発生手段２を介してロボットの
行動を制御することになる。このように本発明によれば，予め，人間がすべての入
力パターンとそれに対応する行動パターンとの対を考慮
して，厳密なプログラミングを行う必要がなく，人間は
基本的の入出力パターンの対の数だけ，基本制御動作格
納手段５を通してロボット制御手段３に与えてやればよ
い。また，ロボット制御手段３は，ネットワークで構成
されており，入力層および中間層のユニット数が多けれ
ば，入力層の１つのユニット当たりの情報は中間層のユ
ニットの中に分散されてしまうので，入力層に多少の誤
差が混入しても出力層に影響を及ぼすことなく，誤差を
吸収することができるので，学習，訓練に用いた入力パ
ターン以外の未知のセンサ入力パターンが発生しても，
その入力パターンに近い学習，訓練に用いた入力パター
ンと連合された出力パターンを発生でき，尤もらしい行
動をとることができる。同様の理由で，センサの特性変
化や，故障にも対応することも可能となる。〔実施例〕以下，実施例に従って本発明を詳細に説明する。第２図は，第１図で説明したロボット制御手段３の詳
細な実施例構成図である。この図に示すように，本発明
のロボット制御手段３は，ユニットと呼ぶ一種のノード
と重みを持つ内部結合とからなる階層ネットワークより
構成されることになる。この構成は，基本的には，コン
ピュータに適応機能を与えるデータ処理方式として提唱
されているバック・プロパゲーション法と呼ばれている
処理方式（D.E.Rumelhart,G.E.Hinton,and R.J.William
s,“Learning"Internal Representations by Error Pro
pagation,"PARALLEL DISTRIBUTED PROCESSING,Vol.1,p
p.318−364,The MIT Press,1986）と同じものである。次に，このバック・プロパゲーション法の概要につい
て説明する。バック・プロパゲーション法ではユニットと呼ぶ一種
のノードと重みを持つ内部結合とから階層ネットワーク
を構成している。第３図は，ユニットの内部構成を示し
たもので基本ユニット30と呼ぶ。この基本ユニット30
は，多入力一出力系となっている。このユニットでは，
複数の各々の入力に対し各々の内部結合の重みを乗じて
これらの全乗算結果を和算する累算部31と，さらに，閾
値処理を施して１つの出力を出す閾値処理部32とをもっ
ている。即ちバック・プロパゲーション法における基本
ユニット30でのデータ処理は，入力と重みとの積和演算
および閾値処理からなっている。ここで，バック・プロ
パゲーション法では閾値の関数として，式（２）で示さ
れるシグモイド関数を用いている。基本ユニットで行われる演算を数式で示すと以下のよ
うになる。 y_pi＝1/（１＋exp（−x_pi＋θ_ｉ））式（２）但し， h:h層のユニット番号 i:i層のユニット番号 p:入力パターン番号 θ_i:i層のｉ番目のユニットの閾値 W_ih:h−ｉ層間の内部結合の重み x_pi:h層の各ユニットからｉ層のｉ番ユニットへの入力の積和 y_ph:pパターン入力に対するｈ層の出力 y_pi:pパターン入力に対するｉ層の出力バック・プロパゲーション法では，この積和と閾値処
理を基本とする基本ユニット30を第２図のような誤差フ
ィードバックを持つ階層ネットワーク構造として，重み
と閾値とを誤差のフィードバックにより適応的に自動調
節するアルゴリズムを用い，所望のデータ処理方法（入
力パターンと出力パターンとの間の連合）をネットワー
クに学習させることにより適応的なデータ処理を実行す
る。ここで，式（１）および式（２）から，バック・プロ
パゲーション法では重みと閾値との調節が同時に実行さ
れる必要があるが，重みと閾値との設定は相互に干渉す
る難しい作業となる。従来のバック・プロパゲーション
法では，ユニット毎に閾値を与えていたが，ユニット数
が多数となると各ユニット毎に閾値を与えることが煩雑
で面倒な作業となるため，閾値の自動設定が切望されて
いたのである。そこで本発明のロボット制御手段３で
は，第２図に示すように，入力層中に入力信号数の入力
ユニット３−ｈの外に，常に「１」が入力される閾値調
節用の閾値入力ユニット３′−ｈを設けるよう構成する
ものである。このように，閾値入力ユニット３′−ｈを設けたこと
によって中間層の各ユニット３−ｉの閾値を，中間層に
対する重みW_ihを設定することと同等の処理にて設定で
きる理由は次の如きものと考えてよい。即ち，中間層の各ユニット３−ｉにおいては，入力層内の１
つ余分にもうけたユニット３′−ｈからの値y_phが常に
「１」であることから，値x_piは式（１）から， ∴ｘ′_pi＝x_pi＋W_ih′ （ただしｈ′は入力層の閾値入力ユニットの番号）で与
えられる。この結果からθ_ｉ＝−W_ih′として式（２）
に代入すると， y_pi＝1/（１＋exp（−x_pi−W_ih′））となり，式（２）に示されている閾値θ_ｉを実質的に−
W_ih′に設定変更したことに対応する。即ち，中間層に
おける各ユニットの閾値をいちいち設定する煩雑さが解
消される。次に，第４図に示す具体例に従って，第１図で説明し
た基本制御動作格納手段５に格納されるところの格納情
報について説明する。例えば第２図に示すようにセンサ
出力が２値化モードで入力ユニット３−ｈが３個のとき
は，第４図にも示すようにロボット制御手段３への入力
パターンの数は８通りとなる。従って，ロボット行動パ
ターンが例えば動状態か停止状態という２通りであるな
らば，これらの８通りの入力パターンの各々に対して
「１」か「０」というロボットの行動パターンは定まる
ことになる。このように，センサ手段１の検出パターン
に対してロボットが本来的にどういう行動をとるべきか
ということは定まっているので，基本制御動作格納手段
５には，このような情報の内のいくつかが予め選択され
て格納されるように構成されることになる。なお，第４
図に示したような８通りの入力パターンと数の少ないも
のにあってはそのすべてを格納することも可能である。第４図の例の内容についての理解を深めるために，第
５図に示すロボットの行動パターンの具体例について説
明する。第５図では具体的に，第５図（ａ）に示す３つ
の光センサと“右に旋回する”という行動をとるための
１つのモータを持つロボットを考えている。そして，こ
のロボットに，第５図（ａ）に示すようなロボットの周
りを回る発光源に追従するという行動をとらせたいと想
定する。このとき，ロボットのセンサ入力パターンとし
ては，第４図の入力パターンの欄に示す組み合わせが考
えられる。例えば，第４図の「０」の入力パターンは光
センサ，，が３つともOFFの状態，「４」の入力
パターンは光センサがON,光センサ，がOFFの状
態，「６」の入力パターンは光センサ，がON,光セ
ンサがOFFの状態である。ロボットを回転する発光源
に追従させるためには，このような入力パターンに応じ
て，第４図の教師信号欄に示す出力パターン（行動）が
ネットワークの学習，訓練により，実現できるようにす
ればよい。例えば，第４図の「０」の入力パターンは，
光センサ，，ともOFFの状態，即ち，発光源から
光が出ていない状態なので，この時の出力パターンは
“0",即ち，“モータをOFFにせよ”という制御を表して
いる。また，「６」の入力パターンは，光センサ，
がON,光センサがOFFの状態，即ち，まさに発光源を捉
えた状態（第５図（ａ））なので，“モータをOFFにせ
よ”という制御を表し，「４」の入力パターンは光セン
サがON,光センサ，がOFFの状態，即ち，ロボット
が捉えた発光源がさらに移動した状態（第５図（ｂ））
なので，“モータをONにせよ（右に旋回せよ）”という
ことを表している。すなわち，第４図に示すような教師
信号が得られれば，第５図で説明したようなロボットの
行動パターンは好ましく制御されることになる。このような好ましい制御を実現するために，本発明で
は，ロボット制御手段３の階層ネットワークの内部結合
の重みW_ih及びW_jiを，基本制御動作格納手段５に格納さ
れる格納情報に従って学習的に決定していこうとするも
のである。すなわち，ロボット制御手段３の動作モード
を学習モードにセットし，基本制御動作格納手段５から
順次格納情報を読み出して，バック・プロパゲーション
法の学習アルゴリズムを用いて重みW_ih及びW_jiの値を自
動設定するよう構成するものである。次に，この重みW_ih及びW_jiの値を決定するための学習
手順について説明する。ここで，この学習手順の説明
は，第６図に示すようなロボット制御手段３の出力層が
複数の出力ユニット３−ｊをもつ更に一般化したもので
説明するものである。まず，内部結合の重みの初期値を決める。この初期値
は,1以下の乱数により決める。これは，重みの値が全て
同じか，あるいはユニットに関して対称となると，バッ
ク・プロパゲーション法では重みの変化が生ぜず，学習
が進行しなくなってしまうのでこれを避ける目的で乱数
を用いるのである。続いて，基本制御動作格納手段５に
格納されるところの入力パターンとその入力パターンと
対をなす所望の出力パターンのデータを順次読み出す。
例えば第４図に示すように,8個の格納情報があればこれ
らのすべてが順次読み出されることになる。続いて，バック・プロパゲーション法に関わる制御パ
ラメータを入力する。ここでは，インクリメンタルな繰
り返し学習の一回当たりの重みの変化量の係数である学
習率と収束時の振動を抑えるための学習速度を制御パラ
メータとしている。そして，バック・プロパゲーション
法のアルゴリズムに従って出力層ユニット３−ｊの出力
値が所望の出力と一致するようにインクリメンタルに内
部結合の重みを学習し，最後に，出力層ユニットの出力
と所望の出力値との誤差が全ての入力パターンに関して
所定の値より少なくなったら，学習を終了する。具体的な階層ネットワークの重みの更新のアルゴリズ
ムを以下に説明する。式（１），式（２）からの類推に
よって次の式が得られる。即ち， y_pi＝1/（１＋exp（−x_pi＋θ_ｉ））式（４） y_pj＝1/（１＋exp（−x_pj＋θ_ｊ））式（６）但し， y_ph:p番目パターン入力値に対するｈ層（ここでは入力
層）のｈ番目のユニットからの出力 y_pi:p番目パターン入力値に対するｉ層（ここでは中間
層）のｉ番目のユニットからの出力 y_pj:p番目パターン入力値に対するｊ層（ここでは出力
層）のｊ番目のユニットからの出力 x_pi:i層のｉ番目のユニットへのｐ番目パターン入力に
対する総和 x_pj:j層のｊ番目のユニットへのｐ番目パターン入力に
対する総和 W_ih:h層ｈ番目ユニットとｉ層ｉ番目ユニット間の重み W_ji:i層ｉ番目ユニットとｊ層ｊ番目ユニット間の重み次に，これらの値から，教師入力ベクトルとネットワ
ークの出力ベクトルとの誤差の二乗和E_pをネットワーク
の誤差として計算する。但し， E_p:p番目パターン入力に対する誤差ベクトル E:全パターン入力に対する誤差ベクトルの総和 d_pj:p番目パターン入力に対するｊ層ｊ番目ユニットへ
の教師信号ここで誤差ベクトルと出力層ベクトルとの関係を求め
るため，式（７）をy_pjに関して偏微分すると，を得る。更に，誤差ベクトルとｊ層への入力との関係を
求めるため，誤差ベクトルをx_pjで偏微分すると，を得る。但し，本実施例では入力層に１つの入力ユニッ
ト３′−ｈを設けこのユニット３′−ｈに常に「１」の
値を入力する方式を採用することで，他の各ユニットの
閾値θの自動調節を実現している。更に，誤差ベクトル
とｉ−ｊ層間の重みとの関係をもとめるため，誤差ベク
トルをW_jiで偏微分すると，の積和で表される解を得る。次に,i層の出力y_piに対する誤差ベクトルE_pの変化で
求めると，を得る。更に,i層入力ユニットへの総和x_piの変化に対
する誤差ベクトルE_pの変化を計算すると，の積和で表される解を得る。更に,h−ｉ層間の重みの変
化に対する誤差ベクトルの変化の関係を求めると，の積和で表される解を得る。これらから，全入力パターンに対する誤差ベクトルと
ｉ−ｊ層間の重みとの関係を求めると以下のようにな
る。また，全入力パターンに対する誤差ベクトルとｈ−ｉ
層間の重みとの関係を求めると以下のようになる。式（14）および式（15）は，各層間の重みの変化に対
する誤差ベクトルの変化率を示していることから，この
値が常に負になるように重みを変化させると公知の勾配
法により，誤差の２乗和であるＥを漸近的に０とするこ
とができる。そこで本実施例では，重みの一回当たりの
変化量ΔW_jiを以下のように設定し，勾配法に基づき繰
り返しこの操作を行い,Eを零に収束させている。但し， ε：学習率（勾配法の勾配率と同じ機能）更に，本発明では，勾配法における収束時の振動を抑
制する目的で学習速度を式（16）および式（17）に適用
して，ΔW_ihとΔW_jiを以下のように設定している。但し， α：学習速度定数 t:回数なお，上述の重みW_ihやW_jiは各ユニット３−ｉや３−
ｊに夫々対応する記憶装置内に格納され，その内容が上
述の学習の間フィードバックによって修正される。そし
て最終的に定まった学習結果の重みW_ih,W_jiが，これか
ら説明する実際の処理に当って使われることになる。こ
の記憶装置としては，基本制御動作格納手段５を用いる
ことも可能であるが，また別に設けるものであってもよ
い。次に，このようにして決定された階層ネットワークの
内部結合の重みW_ih及びW_jiを用いて実行されることにな
るロボットの制御について説明する。階層ネットワークの学習を終えると，ロボット制御手
段３の動作モードを処理モード，すなわち実際にロボッ
トの動作を制御するモードにと切換える。この処理モー
ドでは，複数のセンサからなるセンサ手段１により取り
込まれたセンサの検出信号からなる入力パターンは，ロ
ボット制御手段３の階層ネットワークの入力層にと入力
される。そして，ロボット制御手段３は，この入力パタ
ーンに対して学習モードで定まった重み値及び閾値を使
って積和演算と閾値処理を実行して出力パターンを求め
るとともに，この求めた出力パターンを制御信号として
行動パターン発生手段２にと送出する。そして，この制
御信号を受け取った行動パターン発生手段２は，その制
御信号に対応する行動パターン信号を発生してロボット
の行動パターンを規定することになる。従って，このよ
うな処理を繰返すことによって，ロボットは複数のセン
サの検出パターンに応じた適切な行動をとることができ
ることになる。この処理の内容を第５図の例に従って具体的にみてみ
ることにする。今，ロボットと発光源との関係が第５図
（ａ）の状態，即ち，ロボットの光センサ，がON,
光センサがOFF,モータがOFFの状態にあるとする。こ
の時，発光源が第５図（ｂ）のように，右側に動くと，
ロボットの光センサがON,光センサ，がOFFの状態
に変わる。これを第２図に示したネットワークに入力す
ると，出力パターンとして“モータをONにせよ（右に旋
回せよ）”という制御信号を表す「１」という出力が発
生される。従って，ロボットは右旋回を行う。この右旋
回は,3つの光センサのうち２つがONになるまで続けられ
る。この場合では，第５図（ｃ）のように，光センサ
，がON,光センサがOFFの状態になった時，ネット
ワークは“モータをOFFにせよ”という制御を表す
「０」を出すので，ロボットは停止する。このようにし
て，ロボットが時々刻々と取り込んでくるセンサ入力信
号パターンを第２図に示したネットワークに入力し，ネ
ットワークがその入力パターンに対応して時々刻々と出
力する最適な出力パターンに従ってモータを制御するこ
とにより，発光源の動きに追従することができる。この
例では，発光源が右に動く場合について述べたが，第５
図（ｄ）のように発光源が左に動いても，同様にして，
ロボットは追従することができる。このようにして，ロボットが適切な行動をとるように
と制御されていくことになる。しかるに，センサの数や
制御信号の数が多いときには，基本制御動作格納手段５
に入力パターンとその入力パターンと対をなす所望の出
力パターンのデータのすべてを格納することができない
ので，基本的なものが格納されることになる。これか
ら，この基本的なデータを使った学習により求まる重み
値と閾値で出力パターンを求めていったときに，所望の
ロボットの行動が得られないことが生ずることがある。
このようなとき，本発明では，動作モードを学習モード
に切り換え，その段階でのネットワークの結合の重みを
初期値として，所望の得られなかった時点の入力パター
ンと所望の出力パターンとの対を基本制御動作格納手段
５に格納して，ロボット制御手段３に，それらの入出力
パターン対をさらに重ねて連合することができるように
結合の重みを自動的に微調整させることにより，ロボッ
トの制御性能を向上させることができる。したがって，
最終的には，ロボットの最適な制御を実現できるように
なる。第７図は，バック・プロパゲーション法により一種の
パリティチェック処理をネットワークに学習（重みと閾
値との自動調整）させた結果のネットワークを示してい
る。ここで第７図（Ａ）図示のNet1と第７図（Ｂ）図示
のNet2とは夫々奇数パリティをチェックする同一の特
性，即ち，「０」または「１」をとる３つの入力に対し
て「１」の数が奇数個のとき出力層は「１」を出力する
ようになっている。第７図では，内部結合線の隣の数字
が重みであり，ユニットを表す○の中の数字が閾値であ
る。Net1とNet2を比較すると，重みと閾値とが全く異な
ることが分かる。これは，ネットワークに冗長性がある
ため，こうした差異が生じることになる。この第７図に
示すように，基本ユニット30の出力を「１」と「０」の
状態しかとらないようにとネットワークを構成すること
も可能である。次に，階層ネットワークを構成する中間層のユニット
数の冗長性について説明する。第８図は，排他OR機能を
実現するネットワークであり，中間層ユニット数の冗長
性を持たせない場合の例である。排他ORは，第９図にお
いて，入力パターンの直線による識別（線形識別）に関
して，一本の直線では不可能で少なくとも第９図（Ｂ）
図示の如く二本の直線を要する。従って，この識別には
第９図（Ａ）図示の如く２つの中間層ユニットが最小限
必要となっている。ところが，本発明では中間層ユニッ
トと出力層ユニットの閾値を自動調整するのに入力層に
常時「１」を入力信号として持つ閾値入力ユニット３′
−ｈが設けられていることから，第８図図示のネットワ
ークにおいては，識別すべき数に対して中間層ユニット
の数に冗長性がない。この場合,2つの中間層ユニット３
−ｉは出力層ユニット３−ｊの閾値を含めた自動調節を
しなければならず，排他OR特性に適応するまでの繰り返
し学習回数が増大することになる。これに対して第10図
は冗長性をもつネットワークの例を示す。図に示したよ
うに，中間層ユニット数に冗長性を持たせると，余った
ユニットが出力層のユニット３−ｊの閾値の調節に専念
できることから繰り返し学習回数は，冗長なユニットが
ない場合に比し大幅に低減できる。次に内部結合の重みの具体的な計算例について説明す
る。奇数パリティチェック機能の学習を終了した時の各ユ
ニット間の内部結合重みを第11図および第13図に示す。
第11図ないし第13図の重みは異なるが機能は同じであ
る。これは，学習率と学習速度パラメータが異なること
と中間層ユニット数の冗長性とによる。第12図（Ａ）
（Ｂ）（Ｃ）は夫々，第11図で示した学習終了後に，任
意のパターンを入力した場合の入力と出力を示してい
る。また第14図（Ａ）（Ｂ）（Ｃ）は夫々，第13図で示
した学習終了後に，任意のパターンを入力した場合の入
力と出力を示している。ロボット制御手段３では，演算
アナログ値で行うため，出力値は完全な１または０とな
っていないが，閾値を用いるなどすれば第12図および第
14図図示の出力値から１または０を判断することは容易
であることは明らかである。また，第15図は奇数パリティチェック機能を学習させ
たのと全く同じネットワークに偶数パリティチェック機
能を学習させた結果を示すものであり，各内部結合の重
みを示している。第16図（Ａ）（Ｂ）（Ｃ）は夫々，第
15図で示した学習終了後に，任意のパターンを入力した
場合の入力と出力を示している。この結果から，本発明によりネットワークの適応性を
低下させずに，しかも重みと閾値の同時且つ自動調節が
簡単な方法でできること，また，カメレオンのように様
々な機能を持つデータ処理装置に変身できるとが示され
た。〔発明の効果〕以上説明したように，本発明によれば，複数のセンサ
入力信号から成るパターンと，その入力パターンに対し
てとるべき最適な行動を規定する出力パターンとを階層
ネットワークの中にいわば連合させて記憶するので，人
間はすべてのセンサ入力パターンとそれに対する出力パ
ターンを洗い出して，厳密にプログラミングする必要は
なく，ただ，基本的な入出力パターン対を階層ネットワ
ークに教えるだけですむ。また，学習させた入出力パタ
ーン対以外の未知の入力パターンに対しても，その入力
パターンに近い学習した入力パターンに応じた出力パタ
ーンを発生できるので，センサの特性変化や，故障にも
柔軟に対応できる。さらに，基本的な入出力パターン対
で入力パターンと出力パターンとの連合を完了したネッ
トワークの結合の重みで，実際にロボットを制御した結
果，所望の行動が得られなかった場合，その段階でのネ
ットワークの結合の重みを初期値として，所望の得られ
なかった時点の入力パターンと所望の出力パターンとの
対をさらに重ねて連合することができるように結合の重
みを自動的に微調整させることにより，ロボットの制御
性能を向上させることができる。従って，最終的には，
ロボットの最適な制御を実現できるようになる。しか
も，階層ネットワークは並列処理アーキテクチャのマシ
ンに適した処理方式であり，センサ入力パターンを取り
込むと瞬時に出力パターンを発生できるので，ロボット
の柔軟なリアルタイム制御に寄与するところが大きい。更に，本発明によれば，階層ネットワークの入力層に
閾値ユニットをもうけ，また中間層のユニットの個数に
識別すべき数以上の冗長制御を持たせていることから，
各ユニット間の内部結合の重みと各ユニットの閾値との
調節が自動的且つ簡単な方法で実行でき，閾値を全く意
識せず，またネットワークの適応性を低下させることな
く学習を遂行出来るのである。

【図面の簡単な説明】第１図は本発明の原理説明図，第２図はロボット制御手段の実施例構成図，第３図は基本ユニットの構成図，第４図は基本制御動作格納手段の格納情報例，第５図はロボットの行動パターンの具体例，第６図はロボット制御手段の他の実施例構成図，第７図は奇数パリティチェック機能をもつネットワーク
の例，第８図は中間層の数が冗長性を持たない排他ORのネット
ワーク，第９図は排他ORと中間層ユニットの役割を説明する説明
図，第10図は中間層の数が冗長性を持つ排他ORのネットワー
ク，第11図は学習結果を示す内部結合の重み（Ｉ）の説明
図，第12図は第11図の重みに従った処理例，第13図は学習結果を示す内部結合の重み（II）の説明
図，第14図は第13図の重みに従った処理例，第15図は学習結果を示す内部結合の重み（III）の説明
図，第16図は第15図の重みに従った処理例である。図中,1はセンサ手段,2は行動パターン発生手段,3はロボ
ット制御手段,3′−ｈは閾値入力ユニット,5は基本制御
動作格納手段,30は基本ユニット,31は累算部,32は閾値
処理部である。

───────────────────────────────────────────────────── フロントページの続き (72)発明者関口実神奈川県川崎市中原区上小田中1015番地富士通株式会社内 (72)発明者渡部信雄神奈川県川崎市中原区上小田中1015番地富士通株式会社内 (72)発明者木本隆神奈川県川崎市中原区上小田中1015番地富士通株式会社内 (72)発明者川村旭神奈川県川崎市中原区上小田中1015番地富士通株式会社内 (56)参考文献特開昭62−72004（ＪＰ，Ａ) 特開平１−183763（ＪＰ，Ａ) 特公昭55−930（ＪＰ，Ｂ１) 特公平７−36183（ＪＰ，Ｂ２)

Claims

(57)【特許請求の範囲】１．ロボットを取囲む外界情報を取り込む複数のセンサ
からなるセンサ手段と、ロボットの行動パターンを規定
する行動パターン信号を発生する行動パターン発生手段
と、上記センサ手段の検出パターンに応じて上記行動パ
ターン発生手段に制御信号を送出するロボット制御手段
と、予め選択される上記センサの手段の１つまたは複数
個の特定の検出パターンに対しての上記ロボット制御手
段の送出すべき制御信号情報を格納する基本制御動作格
納手段とを備え、上記ロボット制御手段は、１つまたは複数の入力とこの
入力に対し乗算されるべき重みとを受取って積和を得る
累算部と、この累算部からの出力を閾値関数によって変
換して最終出力を得る閾値処理部とを有する基本ユニッ
トを単位ユニットとし、上記センサ手段の検出値を受け
取って分配する複数個のユニットを入力層とし、かつ複
数個の上記単位ユニットを中間層として１つまたは複数
段の中間層を備え、かつ上記行動パターン発生手段に接
続される１つまたは複数個の上記単位ユニットを出力層
とし、上記入力層と最前段の中間層との間、中間層相互
間および最終段の中間層と出力層との間で内部結合を構
成することで階層ネットワークを構成し、そして、上記ロボット制御手段は、上記基本制御動作格
納手段の格納情報が実現できるようにと学習制御するこ
とで自らが備える上記階層ネットワークの重みの値を設
定するとともに、この重み値の設定された上記階層ネッ
トワークの出力層の出力値をもって上記行動パターン発
生手段への制御信号としてなることを、特徴とするロボット制御方式。２．ロボットを取囲む外界情報を２値化モードで取り込
む複数のセンサからなるセンサ手段と、ロボットの行動
パターンを規定する行動パターン信号を発生する行動パ
ターン発生手段と、上記センサ手段の検出パターンに応
じて上記行動パターン発生手段に２値化モードの制御信
号を送出するロボット制御手段と、予め選択される上記
センサ手段の１つまたは複数個の特定の検出パターンに
対しての上記ロボット制御手段の送出すべき制御信号情
報を格納する基本制御動作格納手段とを備え、上記ロボット制御手段は、１つまたは複数の入力とこの
入力に対して乗算されるべき重みとを受取って積和を得
る累算部と、この累算部からの出力を閾値関数によって
変換して最終出力を得る閾値部とを有する基本ユニット
を単位ユニットとし、上記センサ手段の検出値を受け取
って分配する複数個のユニットを入力層とし、かつ複数
個の上記単位ユニットを中間層として１つまたは複数段
の中間層を備え、かつ上記行動パターン発生手段に接続
される１つまたは複数個の上記単位ユニットを出力層と
し、上記入力層と最前段の中間層との間、中間層相互間
および最終段の中間層と出力層との間で内部結合を構成
することで階層ネットワークを構成し、そして、上記ロボット制御手段は、上記基本制御動作格
納手段の格納情報が実現できるようにと学習制御するこ
とで自らが備える上記階層ネットワークの重みの値を設
定するとともに、この重み値の設定された上記階層ネッ
トワークの出力層の２値化された出力値をもって上記行
動パターン発生手段への制御信号としてなることを、特徴とするロボット制御方式。３．ロボットを取囲む外界情報を取り込む複数のセンサ
からなるセンサ手段と、ロボットの行動パターンを規定
する行動パターン信号を発生する行動パターン発生手段
と、上記センサ手段の検出パターンに応じて上記行動パ
ターン発生手段に制御信号を送出するロボット制御手段
とを備え、上記ロボット制御手段は、１つまたは複数の入力とこの
入力に対し乗算されるべき重みとを受取って積和を得る
累算部と、この累算部からの出力を閾値関数によって変
換して最終出力を得る閾値処理部とを有する基本ユニッ
トを単位ユニットとし、上記センサ手段の検出値を受け
取って分配する複数個のユニットを入力層とし、かつ複
数個の上記単位ユニットを中間層として１つまたは複数
段の中間層を備え、かつ上記行動パターン発生手段に接
続される１つまたは複数個の上記単位ユニットを出力層
とし、上記入力層と最前段の中間層との間、中間層相互
間および最終段の中間層と出力層との間で内部結合を構
成することで階層ネットワークを構成し、そして、上記ロボット制御手段は、上記階層ネットワー
クの出力層の出力値をもって上記行動パターン発生手段
を制御したにもかかわらず所望のロボットの行動パター
ンが得られなかったときにおいては、そのときの上記階
層ネットワークの重みの値を初期値として、その所望の
行動パターンが実現できるようにと学習制御することで
上記階層ネットワークの重みの値を再調整してなること
を、特徴とするロボット制御方式。４．ロボットを取囲む外界情報を取り込む複数のセンサ
からなるセンサ手段と、ロボットの行動パターンを規定
する行動パターン信号を発生する行動パターン発生手段
と、上記センサ手段の検出パターンに応じて上記行動パ
ターン発生手段に制御信号を送出するロボット制御手段
と、予め選択される上記センサ手段の１つまたは複数個
の特定の検出パターンに対しての上記ロボット制御手段
の送出すべき制御信号情報を格納する基本制御動作格納
手段とを備え、上記ロボット制御手段は、１つまたは複数の入力とこの
入力に対して乗算されるべき重みとを受取って積和を得
る累算部と、この累算部からの出力を閾値関数によって
変換して最終出力を得る閾値処理部とを有する基本ユニ
ットを単位ユニットとし、上記センサ手段の検出値を受
け取って分配する複数個のユニットを入力層とし、かつ
複数個の上記単位ユニットを中間層として１つまたは複
数段の中間層を備え、かつ上記行動パターン発生手段に
接続される１つまたは複数個の上記単位ユニットを出力
層とし、上記入力層と最前段の中間層との間、中間層相
互間および最終段の中間層と出力層との間で内部結合を
構成することで階層ネットワークを構成するとともに、
常に入力値「１」を受け取って分配する閾値入力ユニッ
トを１つ以上設け、そして、上記ロボット制御手段は、上記基本制御動作格
納手段の格納情報に従って学習制御することで自らが備
える上記階層ネットワークの重みの値を設定するととも
に、上記閾値入力ユニットの出力に基づいて上記中間層
および出力層を構成する単位ユニットにおける上記閾値
関数を設定し、このようにして設定された上記階層ネッ
トワークの出力層の出力値をもって上記行動パターン発
生手段への制御信号としてなることを、特徴とするロボット制御方式。５．ロボットを取囲む外界情報を取り込む複数のセンサ
からなるセンサ手段と、ロボットの行動パターンを規定
する行動パターン信号を発生する行動パターン発生手段
と、上記センサ手段の検出パターンに応じて上記行動パ
ターン発生手段に制御信号を送出するロボット制御手段
と、予め選択される上記センサ手段の１つまたは複数個
の特定の検出パターンに対しての上記ロボット制御手段
の送出すべき制御信号情報を格納する基本制御動作格納
手段とを備え、上記ロボット制御手段は、１つまたは複数の入力とこの
入力に対して乗算されるべき重みとを受取って積和を得
る累算部と、この累算部からの出力を閾値関数によって
変換して最終出力を得る閾値処理部とを有する基本ユニ
ットを単位ユニットとし、上記センサ手段の検出値を受
け取って分配する複数個のユニットを入力層とし、かつ
複数個の上記単位ユニットを中間層として１つまたは複
数段の中間層を備え、かつ上記行動パターン発生手段に
接続される１つまたは複数個の上記単位ユニットを出力
層とし、上記入力層と最前段の中間層との間、中間層相
互間および最終段の中間層と出力層との間で内部結合を
構成することで階層ネットワークを構成するとともに、
常に入力値「１」を受け取って分配する閾値入力ユニッ
トを１つ以上設け、更に、上記中間層を構成する単位ユ
ニットの個数に識別に必要な個数以上の冗長性を与え、そして、上記ロボット制御手段は、上記基本制御動作格
納手段の格納情報に従って学習制御することで自らが備
える上記階層ネットワークの重みの値を設定するととも
に、上記閾値入力ユニットの出力に基づいて上記中間層
および出力層を構成する単位ユニットにおける上記閾値
関数を設定し、このようにして設定された上記階層ネッ
トワークの出力層の出力値をもって上記行動パターン発
生手段への制御信号としてなることを、特徴とするロボット制御方式。