以下、本発明の作業支援装置、作業支援方法、位置決め作業支援装置およびパワーアシスト作業支援装置の実施形態について図を参照して説明する。まず、本発明の作業支援装置の実施形態を図1〜図5に基づいて説明する。図1に示すように、本実施形態に係る作業アシスト装置20は、主に、アシスト制御部30とアシスト実行部40とにより構成されており、ロボット41を操作して所定の作業を行う作業者Mを、当該ロボット41の制御面から作業支援するものである。
アシスト制御部30は、コンピュータ32を中心に、コントローラ34、インターフェイス36a、36b、36c、36d、メモリカード38等から構成されており、後述するように、力センサ42から出力される印加操作量情報等に基づいて作業支援処理等を実行して作業者Mの作業意図や作業状態に適したロボット指令値をロボット41に対し出力する機能を有するものである。
コンピュータ32には、例えば、パーソナルコンピュータやFA用のコンピュータあるいはマイクロコンピュータ等が用いられおり、例えば、マイクロプロセッサ(MPU)、メモリ装置(ROM、RAM等)、システムバスに対する入出力インターフェイス等により構成されている。このコンピュータ32では後述の作業支援処理や制御アルゴリズムによる各種処理が実行されている。なお、このコンピュータ32は、特許請求の範囲に記載の「推定手段、次制御内容決定手段、制御アルゴリズム選択切替手段および制御情報生成出力手段」に相当し得るものである。
コントローラ34は、後述するロボット41のサーボシステム等を含むもので、コンピュータ32とほぼ同様にマイクロプロセッサ(MPU)、メモリ装置(ROM、RAM等)等から構成されている。具体的には、コントローラ34は、コンピュータ32とロボット41との間に介在し、コンピュータ32およびロボット41に対してデータの送受信を可能に構成されており、コンピュータ32から出力される制御情報とロボット41の各種センサから得られる内界センサ情報とに基づいてロボット指令値を生成したり、またロボット41から取得した内界センサ情報を制御コンピュータ32に出力したりする機能を有する。ここで「内界センサ情報」とは、ロボット41のアーム部分や関節部分に取り付けられたセンサから出力される角度情報、速度情報、加速度情報、ロボット41のハンド部分に取り付けられたセンサから出力される速度情報または加速度情報、等のロボット41の各種センサから得られるロボット41の動作状態に関する情報のことである。なお、コントローラ34は、コンピュータ32とともに特許請求の範囲に記載の「制御情報生成出力手段」に相当し得るものである。また本実施形態では、コントローラ34をコンピュータ32とは別個に構成したが、本発明を具現化するうえではこれに限られることはなく、例えば、コントローラ34を設けずにコントローラ34の機能をコンピュータ32が担うように構成しても良い。
インターフェイス36a、36b、36c、36dは、アシスト実行部40からコンピュータ32に対してセンサ信号を入力したり、コンピュータ32からアシスト実行部40に対して制御信号を出力したりするために介在する装置で、信号レベルの変換やシリアル・パラレル間またはアナログ・ディジタル間等の信号方式の変換等を行う機能を有するものである。本実施形態では、インターフェイス36aは、力センサ42から出力されるセンサ信号(印加操作量情報)の入力を受け付けて印加操作量情報をコンピュータ32に出力する。同様に、インターフェイス36bは対象検出センサ43から出力されるセンサ信号(対象位置情報)の入力を受け付けて対象位置情報を、またインターフェイス36cは評価スイッチ44から出力されるスイッチ信号(評価情報)の入力を受け付けて評価情報を、それぞれコンピュータ32に出力する。一方、インターフェイス36dは、後述するように、コンピュータ32から出力されるロボット41の行動情報や状態量情報を受け付けてその内容をロボット行動意思等表示器46により表示可能な表示制御信号に変換して当該ロボット行動意思等表示器46に出力する。
メモリカード38は、後述するように、コンピュータ32により演算される推定制御情報を書込み・読出し可能な機能を有し、コンピュータ32から取り外し可能に構成される情報記憶媒体である。例えば、PCタイプ、コンパクトフラッシュ(登録商標)タイプ、SDタイプ等のメモリカードがこれに相当し、不揮発性メモリ(例えばEEPROM)をメモリ素子として構成される。なお、このコンピュータ32から取り外し可能に構成される情報記憶媒体に推定制御情報を書込むことは、特許請求の範囲に記載の「更新される推定制御情報は、当該作業支援装置から外部に出力可能であること」の一例に相当し得る。
なお、本実施形態では、コンピュータ32からメモリカード38に推定制御情報を書込み可能に構成したが、「更新される推定制御情報は、当該作業支援装置から外部に出力可能であること」の他の例として、例えば、メモリカード38に代えてLANインターフェイス等のネットワークインターフェイスカード(NIC)を設けてイーサネット(登録商標)やインターネットあるいは無線LAN等の情報伝送媒体に推定制御情報を出力可能に構成するものが挙げられる。
一方、アシスト実行部40は、ロボット41、力センサ42、対象検出センサ43、評価スイッチ44、ロボット行動意思等表示器46等から構成されている。ロボット41は、例えば、作業者Mと協働して、ワークWの搬入、搬出、搬送等の移動作業やワークWの姿勢変更作業、等を可能にするもので、特許請求の範囲に記載の「アクチュエータ」に相当し得るものである。具体的には、例えば、多関節ロボットや3軸ロボット、6軸ロボット等の産業用ロボット等が相当し、後述するように、本実施形態では、ロボットアーム141(図7参照)やパワーアシスト機構241(図8参照)がロボット41に相当する。
力センサ42は、アシスト制御部30のインターフェイス36aを介してコンピュータ32に電気的に接続されており、ロボット41を操作する作業者Mの操作状態を検出し印加操作量情報(操作状態情報)としてアシスト制御部30に出力する機能を有するものである。具体的には、例えば、作業者Mに握られた棒状のハンドルに加わる操作力を検出して印加操作量情報(操作状態情報)を出力可能に構成される6自由度の力覚センサが用いられる。なお、この力センサ42は、特許請求の範囲に記載の「操作状態検出手段」に相当し得るものである。
対象検出センサ43は、アシスト制御部30のインターフェイス36bを介してコンピュータ32に電気的に接続されており、ワークWの所定の状態量を検出し対象位置情報(状態量情報)として出力する機能を有するものである。具体的には、例えば、図2に示すような半導体位置検出素子(PSD;Position Sensitive Detector、以下「PSDセンサ」という。)や、CCDステレオカメラ等によりワークWやその周囲を撮影してこれらの画像情報を画像解析処理等を介して画像認識することによってワークWの所定の状態量を検出するような画像認識装置等が用いられる(図8参照)。この対象検出センサ43は、特許請求の範囲に記載の「状態量検出手段」に相当し得るものである。ここで、図2を参照してPSDセンサの概要を説明する。
図2に示すように、対象検出センサ43の一例であるPSDセンサは、十字型PSDと称されるもので、十字形状のPSD43aを中心部に穴が形成されたマスク43cに取り付けて構成されるものである。市販されている一次元PSDは、棒状の受光面に照射されるスポット状の光の位置を当該スポットの中心から両端の電極までの距離に比例して出力される電流値によって検出できる光センサである。この一次元PSDをマスク43cの穴中心に当該十字の交差部分が位置するような構造として製作された十字型PSDは、ワークWに形成された孔の位置を高速かつ高精度に検出可能にしている。
例えば、当該ワークWの孔を中心にその周辺にも赤外光等を照射すると、孔の部分からは反射光が得られず、孔の周囲に反射した赤外光を反射光として得ることができる。この現象を利用して孔の周囲から反射してくる反射光がマスク43cの穴に入射するように十字型PSDを位置させると、図2に示すように、孔に相当する部分からは反射光が入射しないので、入射のない部分が孔の影として現れ(図2に示す半径rの灰色円内)、入射のある部分がこの孔の影の周囲に現れる(図2に示す反射光部分)。そこで、1次元PSD43a、43bの受光面に当たった入射部分(図2に示す斜線部分)の面積を、1次元PSD43a、43bの各電極(XR極、XL極、YU極、YD極)を流れる電流値により計測することによって、PSD上にある孔の影の中心位置Pと十字の交差中心位置とのズレ(誤差)を求めることが可能となる。なお、この十字型PSDについては、早川・土田・田中「十字型PSDセンサを装着したロボットによる移動物体へのはめ合い作業」、電気学会論文誌C、Vol.120-C No.4、2000年、516頁〜521頁や、豊田工業大学のインターネットホームページ(URL;http://www.toyota-ti.ac.jp/Lab/Denshi/5s40/research/psd/crosspsd.htm)に詳しいので、詳細は当該論文やホームページを参照されたい。
評価スイッチ44は、アシスト制御部30のインターフェイス36cを介してコンピュータ32に電気的に接続されており、作業者Mが評価した結果を評価情報(作業支援評価情報)として入力する機能を有するものである。具体的には、例えば、評価結果が「満足」な場合だけを入力可能に1回路のオンオフスイッチにより構成し1ビット表現による評価情報を出力したり、また評価結果を「満足」、「普通」および「不満」による3段階を入力可能にオンオフスイッチとエンコーダにより構成し2ビット表現による評価情報を出力する。なお、この評価スイッチ44は、特許請求の範囲に記載の「評価情報入力手段」に相当し得るものである。
ロボット行動意思等表示器46は、アシスト制御部30のインターフェイス36dを介してコンピュータ32に電気的に接続されており、後述するように、意図・状態推定システム32b(次制御内容決定手段)により決定された次のロボット41の行動情報(制御内容)や対象検出センサ43により出力された対象位置情報(状態量情報)を出力装置に出力してこれらの情報を作業者Mに告知する機能を有するものである。出力装置としては、例えば、発光ダイオード(以下「LED」という。)や液晶表示器(以下「LCD」という。)等により表示される文字・図形等の視覚的情報を介して告知するものや、サウンドジュネレータや合成音声ジュネレータ等により発せられる音、合成音声等の聴覚的情報を介して告知するもの、あるいはバイブレータや微弱電流等により付与される振動刺激・電気刺激等の触覚的情報を介して告知するもの等がある。なお、このロボット行動意思等表示器46は、特許請求の範囲に記載の「次制御内容告知手段」および「状態量情報告知手段」に相当し得るものである。
次に、作業アシスト装置20のアシスト制御部30により制御される内容を図3〜図5に基づいて説明する。図3に示すように、アシスト制御部30では、アシスト実行部40から入力される印加操作量情報、対象位置情報、評価情報および内界センサ情報に基づいて、主に、意図・状態推定システム32aおよび制御アルゴリズム切替えシステム32bによる制御が行われる。なお、図4には、意図・状態推定システム32aの概念図、また図5には、制御アルゴリズム切替えシステム32bの概念図がそれぞれ図示されている。
[意図・状態推定システム32a]
意図・状態推定システム32aは、次の7つの制御処理を行う。即ち、(1) 現在、ロボット41が行っている動作状態や作業者Mの印加操作量情報から、作業者MがワークWに対しこれから行おうとしている作業意図および作業者Mが現在行っている作業状態を推定する処理(推定手段)を行う。/(2) (1)の推定結果に基づいてロボット41による次の制御内容を決定する処理(次制御内容決定手段)を行う。/(3) (2)の決定された次の制御内容を実現する最適な制御アルゴリズムを複数の制御アルゴリズム32cから選択する処理(制御アルゴリズム選択切替手段の一部)を行う。 /(4) 評価スイッチ44により入力された評価情報に基づいて意図・状態推定システム32aの推定制御情報を更新する処理(推定制御情報更新手段)を行う。/(5) (2)の決定された次の制御内容をロボット行動意思等表示器46を介して作業者Mに告知する処理(次制御内容告知手段)を行う。 /(6) 対象検出センサ43から出力された対象位置情報をロボット行動意思等表示器46を介して作業者Mに告知する処理(状態量情報告知手段)を行う。/(7) (4)で更新された意図・状態推定システム32aの推定制御情報を情報記憶媒体や情報伝送媒体等の外部に出力する処理を行う。なお、意図・状態推定システム32aは、特許請求の範囲に記載の「推定手段」、「次制御内容決定手段」、「制御アルゴリズム選択切替手段」の一部、「推定制御情報更新手段」、「次制御内容告知手段」および「状態量情報告知手段」に相当し得るものである。
[制御アルゴリズム切替えシステム32b]
制御アルゴリズム切替えシステム32bは、事前に各種の状況を想定してそれらに応じて実装された複数の制御アルゴリズム32cを、意図・状態推定システム32aから入力されるアルゴリズム切替え指令に基づいて切り替えるもので、前述の意図・状態推定システム32aとともに特許請求の範囲に記載の「制御アルゴリズム選択切替手段」を構成し得るもの、つまり特許請求の範囲に記載の「制御アルゴリズム選択切替手段」の残部に相当し得るものである。なお、図3において、制御アルゴリズム切替えシステム32bのブロックを左下方から右上方に向けて斜めに通り抜けている矢印記号は、制御アルゴリズム切替えシステム32bに入力される情報が制御アルゴリズム切替えシステム32bをチューニングしていることを示す制御工学分野における慣用表現で、本実施形態の場合では、入力されるアルゴリズム切替え指令に基づいて複数の制御アルゴリズム32cが切り替えられることを示している。また、意図・状態推定システム32aを斜めに通り抜けている矢印記号も同様に、本実施形態の場合では、入力される評価情報に基づいて意図・状態推定システム32aの推定制御情報が更新されることを示している。
このような意図・状態推定システム32aおよび制御アルゴリズム切替えシステム32bによって、例えば、ワークWが対象検出センサ43により未だ検知されていない場合には、いわゆるパワーアシスト状態の制御アルゴリズムが選択されて切り替えられる。そして、ワークWが検知された場合には、そのワークWに対して近づこうとする制御アルゴリズムを加えた形で制御を可能にする制御アルゴリズムが意図・状態推定システム32aにより選択されて制御アルゴリズム切替えシステム32bにより切り替えられる。一方、作業者Mの作業意図等の推定によって、当該作業者MはそのワークWを作業目標としていないと判断した場合には、また別の制御アルゴリズムが意図・状態推定システム32aにより選択されて制御アルゴリズム切替えシステム32bにより切り替えられる。
ここで、意図・状態推定システム32aの説明に戻る。図3に示すように「意図・状態推定システム」とは、ロボット41の各種センサから得られる内界センサ情報、対象検出センサ43から得られる対象位置情報および力センサ42から得られる操作印加量情報に基づいて、現在の作業者Mによる作業状態と作業者Mが意図している操作の種類(作業意図のこと)のそれぞれを推定し、次に推定された作業状態と作業意図のいずれか一方あるいは両方に基づいてロボット41の次の行動を決定し、その行動情報をロボット行動意思等表示器46に出力するとともに、現在処理中の制御アルゴリズムを切替える必要がある場合には、制御アルゴリズム切替えシステム32bに対してアルゴリズム切替え指令を出力するものである。そして、さらに推定された作業状態が、当該作業の完了である場合には、評価スイッチ44から作業者Mの評価情報を取得し、その評価情報を基礎とした学習により意図・状態推定システムそのものを更新する機能を兼ね備えたものである。
このような意図・状態推定システム32aには、例えば、隠れマルコフモデル(Hidden Markov Model )を用いた方法や、人工ニューラルネットワークあるいはファジィ推論に参照テーブルを併用した方式等を利用することができる。本実施形態では、隠れマルコフモデルの場合を例に説明する。なお、隠れマルコフモデルを用いた方法については、酒井・山田・梅谷「隠れマルコフモデルを応用した人間の意図する動作パターンの推定」、日本ロボット学会学術講演会予稿集、第1分冊、29頁〜30頁、1998年や、山田・大東・酒井・梅谷「人間/ロボット共同搬送作業において作業者の意向を反映させるためのヒューマン・インターフェイスの提案」、日本機械学会論文集C編、Vol.67 No.656、1069頁〜1976頁、2001年等に詳しい。
この「隠れマルコフモデル」とは、観測される現象を確率的に記述するためのモデルの一つであり、観測される現象が与えられるとき、その現象が観測される尤度をモデルから計算することができるものである。例えば、前述の(1) による処理のうち、作業者Mが現在行っている作業状態を推定する場合には、図4に示すように、作業中に想定される作業状態(図4に示す作業状態A〜C)に対応した隠れマルコフモデルを想定される作業状態の数だけ、予め作成して用意しておく。次に各時点において得られるロボットの内界センサ情報、対象位置情報および操作印加量情報を観測される現象として、それぞれのモデルからその現象が観測される尤度(尤もらしさの程度;その現象がそれぞれのモデルから観測される「可能性」の大小)をリアルタイムに計算し、モデル間の尤度の大小を実時間で比較する(図4に示す作業状態A〜Cの尤度の比較器)。そして、最も尤度の高い計算値(最尤値)を与えたモデルに対応する作業状態が、その時点での作業状態であると定義すれば、作業状態の推定が可能となる。
また、ある観測される現象に対する作業状態の推定結果が妥当でないときには、その推定結果を与えた観測現象を教示データとしてモデルのパラメータを再推定を実施し、モデルの精度を改善することも可能である。同様に、前述の(1) による処理のうち、作業者MがワークWに対しこれから行おうとしている作業意図を推定する場合にも、上述した作業状態の推定と同じアルゴリズムにより行うことができる(図4に示す作業状態a〜c、およびその尤度の比較器)。
一方、作業者Mによる評価情報を基礎とした学習によって、意図・状態推定システム32aそのものを更新するには(前述の(4) の処理)、例えば、強化学習(Reinforcement Learning)や、人工ニューラルネットワークあるいはファジィ推論に参照テーブルを併用した方式等を利用することできる。なお、強化学習については、Richard S. Sutton,Andrew G. Barto共著、三上貞芳,皆川雅章共訳「強化学習」、森北出版、2000年や、東京工業大学大学院総合理工学研究科知能システム科学専攻、小林(重)研究室のインターネットホームページ(URL;http://www.fe.dis.titech.ac.jp/~gen/edu/RL_intro.html)に詳しい。
この「強化学習」とは、学習本体(エージェント)がセンサ情報等を通じて認識する制御対象の「状態」に対応して制御対象への働きかけ、即ち「行動」を事前に定義された「行動群」の中から選択するアルゴリズムと、制御対象から与えられる「報酬」に基づき「状態」に対する「行動」の選択方法がより適切になるように学習するアルゴリズムとを統合したアルゴリズムの一つである。
例えば、隠れマルコフモデルを用いた方法により推定された作業状態と作業者Mが意図する操作の種類の両方を学習本体が認識する制御対象の状態とし、一方で制御アルゴリズムの切替え指令を予めいくつか定義しておき(図5に示す制御アルゴリズム1〜n)、学習本体の行動とする。このような学習本体に状態を実時間で与えることで、制御アルゴリズムの切替えをオンラインで制御アルゴリズムに指令することが可能となる(図3および図5に示すアルゴリズム切替え指令)。このアルゴリズム切替え指令には「制御アルゴリズムを切り替えない」という指令も含まれる。また、作業完了後に評価スイッチ44によって与えられる作業者Mによる評価を学習本体に対する報酬として、評価に基づいて学習本体における状態に対する行動の選択方法、即ち、推定された作業状態と作業者Mが意図する操作の種類に応じた制御アルゴリズムの切替え方法を学習させることができる(図5)。この学習は作業終了後に行われる。なお、図5に示される「学習機能付き制御アルゴリズム選択器」は、意図・状態推定システム32aの一部を構成し、同図の「制御アルゴリズム切替器」は、制御アルゴリズム切替えシステム32bを構成するものであることに留意されたい。
次に、図3に示すアシスト制御部30の制御ブロック線図を具体的に処理する作業支援処理の流れを図6に示すフローチャートに基づいて説明する。なお、以下説明する作業支援処理のステップS111、S113、S115、S117、S119、S120、S127、S129、S133、S135は、前述した意図・状態推定システム32aにより行われるもので、またステップS120、S121、S123は、前述した制御アルゴリズム切替えシステム32bにより行われるものである。
図6に示すように、作業アシスト装置20では、主電源が投入されると、まずステップS101によりメモリカード38があるか否か、即ち、アシスト制御部30にメモリカード38が実装されているか否かを判断する処理が行われる。そして、メモリカード38があると判断される場合には(S101でYes)、ステップS102により実装されているメモリカード38から所定のデータとして推定制御情報を読み出す処理が行われる。一方、メモリカード38があると判断されない場合には(S101でNo)、メモリカード38が実装されていないのでステップS103によりデフォルト値が設定された基本推定制御情報を使用する設定処理が行われる。そして、ステップS105により各システムを初期化する処理が行われ、続くステップS107により作業が開始されるまで待機する(S107でNo)。
ステップS107により作業が開始されたと判断されると(S107でYes)、続くステップS109により初期制御アルゴリズムを設定する処理が行われる。例えば、搬入されたワークW2 をワークW1 の所定箇所に取り付けて搬出するというような作業の場合、まずワークW2 を搬入口からワークW1 のところまで搬送する作業が必要になる。この例の場合、当該ワークW2 の搬送制御が当該初期制御アルゴリズムに相当する。
次のステップS111では、力センサ42、対象検出センサ43、ロボット41の各種センサから各情報を取得する処理が行われる。例えば、搬入されたワークW2 をワークW1 の所定箇所に取り付けて搬出する作業の先の設例では、作業者Mによる操作状態を力センサ42から出力される印加操作量情報として、また搬送中のワークW2 に対するワークW1 の位置情報を対象検出センサ43から出力される対象位置情報として、さらにロボット41の関節やアームの角度情報あるいはハンドの移動速度情報等を各種センサから出力される内界センサ情報として、それぞれ取り込む処理を行う。これにより、続くステップS113による意図・状態推定システム32aによる推定処理を可能にしている。なお、このステップS111は、特許請求の範囲に記載の「操作状態検出ステップ」および「状態量検出ステップ」に相当し得るものである。
ステップS113では、意図・状態推定システム32aにより作業状態と作業意図を推定する処理が行われる。即ち、前述したように、ステップS111により取得された内界センサ情報、対象位置情報および操作印加量情報に基づいて、現在の作業者Mによる作業状態と作業者Mが意図している操作の種類(作業意図)のそれぞれを推定することができるので、これらを意図・状態推定システム32aにより推定して推定結果として作業状態および作業意図を得る。
例えば、ワークW2 を搬送する先の設例では、ロボット41の動作状態(関節やアームの角度、ハンドの移動速度等)、作業者Mによる操作状態(力の方向や入れ具合等)、ワークW1 、W2 の位置関係等に基づいて、現在の作業者Mによる作業状態がワークW2 の搬送作業の完了間際にあり(作業状態)、ワークW2 の搬送作業からワークW2 をワークW1 の所定箇所に取り付けるために位置決めする作業に移行しようとしている(作業意図)等の、作業状態および作業意図を推定する。なお、このステップS113は、特許請求の範囲に記載の「推定ステップ」に相当し得るものである。
続くステップS115では、ロボット41による次の行動を決定する処理が行われる。即ち、ステップS113により推定された作業状態と作業意図のいずれか一方あるいは両方に基づいてロボット41の次の制御内容を決定する処理を行う。例えば、先の設例では、推定結果として、現在の作業者Mによる作業状態がワークW2 の搬送作業が完了しているという作業状態と、ワークW2 の搬送作業からワークW2 をワークW1 の所定箇所に取り付けるために位置決めする作業に移行しようとしているという作業意図と、を得た場合には、ロボット41による次の制御を位置決め作業の内容に決定する処理を行う。なお、このステップS115は、特許請求の範囲に記載の「次制御内容決定ステップ」に相当し得るものである。
続くステップS117では、ステップS115により決定されたロボット41の次の制御内容をロボット41の行動意思として表示する処理が行われる。これにより、例えば先の設例では、作業者Mは、次に行われるワークW2 の位置決め作業に移行するロボット41の行動意思を事前に把握できるので、作業者Mに対し、ロボット41が予期しない作業に突然移行するというような不安感を与え難くすることができる。したがって、このような不安感に起因する不快感、疲労感等の発生を抑制して操作感を向上することができる。
また、ステップS117では、対象検出センサ43により出力される対象位置情報をロボット行動意思等表示器46に出力する処理が行われることもある。これにより、例えば前記設例では、作業者Mは、ワークW1 に対するワークW2 の位置関係をロボット行動意思等表示器46により把握することができ、ロボット41による搬送作業の完了判断の妥当性を定量的に判断することができるので、適切な位置でワークW2 の搬送を停止させ、搬送作業を完了させることができる。したがって、作業者Mに、不快感、不安感、疲労感等を与え難くし、操作感を向上することができる。
次のステップS119では、制御アルゴリズムの切替えがあるか否かを判断する処理が行われる。即ち、ステップS115によりロボット41の次の行動が決定された結果から、現在実行している制御アルゴリズムを他の制御アルゴリズムに切り替える必要があるか否かを判断する処理を行う。これにより、切り替える必要がある判断された場合には(S119でYes)、ステップS120に移行して決定された次の制御内容を実現する最適な制御アルゴリズムを複数の制御アルゴリズム32cから選択し切り替える処理が行われる。なお、この処理は、前述したように、意図・状態推定システム32aと制御アルゴリズム切替えシステム32bにより行われる。
例えば、前記設例において、次の制御内容としてワークW2 をワークW1 の所定箇所に取り付けるために位置決めする制御を行うことがステップS115により決定されている場合には、現在の搬送制御のアルゴリズムから位置決め制御のアルゴリズムに切り替える必要があるので(S119でYes)、ステップS120に移行して、意図・状態推定システム32aにより複数の制御アルゴリズム32cの中から位置決め制御のアルゴリズムを選択する。そして、制御アルゴリズム切替えシステム32bにより搬送制御のアルゴリズムから位置決め制御のアルゴリズムに切り替える処理を行う。なお、ステップS119、S120は、特許請求の範囲に記載の「制御アルゴリズム選択切替ステップ」に相当し得るものである。
続くステップS121では、現在の制御アルゴリズムに基づいてロボット41への制御入力を生成する処理が行われる。即ち、ステップS119により制御アルゴリズムの切替えがある場合には(S119でYes)、ステップS120により切り替えられた制御アルゴリズムに基づいて、一方、ステップS119により制御アルゴリズムの切替えがない場合には(S119でNo)、前回の処理から継続使用している制御アルゴリズムに基づいて、当該制御アルゴリズムの内容に従ったロボット41の制御指令情報を適宜、生成する処理を行う。例えば、前記設例では、次制御においては、ワークW2 の搬送制御から位置決め制御に移行するため、当該位置決め制御に必要なロボット41の制御指令情報が生成される。
次のステップS123では、ステップS121で生成した制御指令情報をロボット41に制御入力する処理が行われる。これにより、作業者Mに合わせた制御、例えば前記設例では、搬送制御から位置決め制御に移行する制御がロボット41に対して行われるため、作業者Mがロボット41の制御に合わせることによる精神的・肉体的に負担を軽減することができる。したがって、作業者Mに、不快感、不安感、疲労感等を与え難いので、操作感を向上することができる。なお、ステップS121、S123は、特許請求の範囲に記載の「制御情報生成出力ステップ」に相当し得るもので、これらの処理はコンピュータ32またはコントローラ34あるいは両者の分担(例えば、S121はコンピュータ32、S123はコントローラ34)により行われる。
このようなステップS111〜S123の各制御を、当該作業者Mによる所定の作業が終了するまで繰り返し実行される必要から、続くステップS125により作業の完了を確認するまでステップS111に処理を戻す(S125でNo)。そして、作業者Mによる作業の完了入力あるいはセンサ等による作業の完了検出があると(S125でYes)、次のステップS127に処理を移行する。例えば、前記設例では、ワークW1 の所定箇所にワークW2 が位置決めされて取付作業が完了し、ワークW1 が搬出された場合に作業者Mによる入力される作業完了の情報を取得してから、ステップS127に移行する。なお、このようなステップS111〜S123による制御処理期間を、前述の「強化学習」の説明中では、「オンライン」と称している(以下同様)。またこれから説明するステップS127〜S135による制御処理期間を以下「オフライン」と称する。
ステップS127では、作業者Mによる評価情報を取得する処理が行われる。即ち、前述したステップS111〜S123によるオンライン時の作業者Mの支援に対して、当該作業者Mが評価した結果が評価情報として評価スイッチ44により入力されるので、この評価情報を取得する処理を行う。例えば、前記設例では、ワークW2 の搬送作業からワークW2 をワークW1 の所定箇所に取り付けるための位置決めする作業に移行し、さらにその位置決めが完了するまで、に行われた作業アシスト装置20による作業支援について、当該作業者Mが満足していると評価した場合には、その旨あるいはその段階の評価情報が評価スイッチ44を介して入力される。なお、不満である場合にも、満足の評価情報と同様にその旨等を入力可能に構成しても良い。
ステップS127により取得された評価情報は、続くステップS129により推定制御情報を更新する処理に用いられる。即ち、このステップS129では、取得された評価情報に基づいて、意図・状態推定システム32aを構成する推定制御情報を更新する処理が行われる。具体的には、評価情報の評価内容(満足、不満等)に基づいて意図・状態推定システム32aを構成するif-then ルールの条件設定を変更したり、またif-then ルール以外の制御パラメータ等を変更したりする等の意図・状態推定システム32aの推定アルゴリズムに関する変更処理を行う。これにより、当該評価情報に基づいた学習機能を得ることができるので、当該評価情報に基づいて作業者Mの「主観」、「技量差」、「癖」、「好み」さらには「使用時間帯」等といった作業者個々に有する個人差情報を得ることができる。そのため、作業者Mの癖等の個人差情報に合わせた制御がロボット41に対して行われるため、作業者Mがロボット41の制御に合わせることによる精神的・肉体的に負担をより一層軽減することができる。したがって、作業者Mに、不快感、不安感、疲労感等をさらに与え難いので、操作感をより向上することができる。
ステップS131では、次の作業があるか否かを判断する処理が行われ、もし次の作業があれば(S131でYes)、ステップS107に処理を移行し、次の作業がなければ(S131でNo)、ステップS133に移行してメモリカード38があるか否かの判断処理を行う。そして、メモリカード38がある場合、即ち、メモリカード38がアシスト制御部30に実装されている場合には(S133でYes)、更新された推定制御情報をステップS135により当該メモリカード38に書き出す処理が行われる。これにより、例えば、当該更新された推定制御情報をメモリカード38を介して他の作業支援装置に出力することができる。そのため、この更新された推定制御情報に基づいて作業者個々に有する個人差情報を得られるので、当該他の作業支援装置においても、作業者Mの主観、癖等の個人差情報に合わせた制御をロボット41等に対して行うことができる。したがって、当該他の作業支援装置でも、作業者Mに、不快感、不安感、疲労感等を与え難くし、操作感を向上することができる。
一方、メモリカード38がアシスト制御部30に実装されていない場合には(S133でNo)、推定制御情報を書き出す外部記憶装置(情報記憶媒体)等が存在しないので、ステップS135による推定制御情報の書き出し処理を行うことなく、一連の本作業支援処理を終了する。なお、ステップS135による推定制御情報の書き出し処理が完了した場合にも一連の本作業支援処理を終了する。また、ステップS135による推定制御情報の書き出し処理は、その書き出し対象をメモリカード38等の情報記憶媒体に限定することはなく、例えば、ネットワークインターフェイスカード(NIC)等を介したイーサネットケーブル(登録商標)やUTP(非シールドより対線)等による有線LANや電波や赤外線等による無線LAN等の情報伝送媒体に推定制御情報を出力しても良い。これにより、当該情報伝送媒体に接続される他の作業支援装置も当該推定制御情報を受信することによって、メモリカード38等の情報記憶媒体の場合と同様に、作業者Mの主観、癖等の個人差情報に合わせた制御をロボット41等に対して行うことができるので、当該他の作業支援装置でも、作業者Mに、不快感、不安感、疲労感等を与え難くし、操作感を向上することができる。
このように、本実施形態に係る作業アシスト装置20によると、複数の制御アルゴリズム32cにより制御されるロボット41を直接的または間接的に操作してワークWに対し所定の作業を行う作業者Mを、支援するものにおいて、力センサ42によりロボット41を操作する作業者Mの操作状態を検出して印加操作量情報として出力し、対象検出センサ43によりワークWの所定の状態量を検出し対象位置情報として出力する(S111)。そして、アシスト制御部30の意図・状態推定システム32aによって印加操作量情報および対象位置情報に基づいて作業者MがワークWに対しこれから行おうとしている作業意図および作業者Mが現在行っている作業状態を推定し(S113)、この推定結果に基づいてロボット41による次の制御内容を意図・状態推定システム32aにより決定する(S115)。この決定された次の制御内容を実現する最適な制御アルゴリズムを複数の制御アルゴリズム32cから意図・状態推定システム32aにより選択し制御アルゴリズム切替えシステム32bにより切り替えて(S120)、この切り替えられた制御アルゴルズムにより制御されるロボット41に対する制御情報を当該制御アルゴリズム32c等によって生成しロボット41に出力する(S121、S123)。
これにより、ワークに対し作業者Mがこれから行おうとしている作業意図および作業者が現在行っている作業状態を推定した結果に基づいて得られた次の制御内容を実現する最適な制御アルゴリズムに従ってロボット41が制御されるので、作業者Mによる次作業に対して適切な作業支援を行うことができる。いわば作業者Mに合わせた制御がロボット41に対して行われるため、作業者Mがロボット41の制御に合わせることによる精神的・肉体的に負担を軽減することができる。したがって、作業者Mに、不快感、不安感、疲労感等を与え難いので、操作感を向上することができる。
なお、ロボット41を直接的または間接的に操作のうちの「直接的に操作」とは、例えば、作業者Mが操作ハンドルや操作コントローラ等を操作することによりロボット41のロボットハンド等を介してワークWに対し所定の作業を行う場合と意味する。一方、「間接的に操作」とは、例えば、ワークWの一端側をロボット41が支えて当該ワークWの他端側を作業者Mが支えるというように、作業者Mとともにロボット41が協働してワークWを持ち合う場合において、作業者Mが、ワークWを上下左右に移動させたり、力の入れ具合を変化させたり、等々することで、いわば作業者MがワークWを介在させてロボット41を間接的に操作することを意味する。
また、本実施形態に係る作業アシスト装置20によると、作業アシスト装置20により支援を受けた作業者Mによる評価結果を評価情報として評価スイッチ44により入力可能にし(S127)、この入力された評価情報に基づいて意図・状態推定システム32aを構成する推定制御情報を意図・状態推定システム32aにより更新する(S129)。これにより、意図・状態推定システム32aの推定制御情報が更新されるので、次回は、この更新された推定制御情報に従って作業者Mの作業意図および作業状態が推定される。つまり、意図・状態推定システム32aは、評価情報に基づいた学習機能を得ることができ、当該評価情報に基づいて作業者Mの「主観」、「技量差」、「癖」、「好み」さらには
「使用時間帯」等といった作業者個々に有する個人差情報を得ることができる。そのため、作業者Mの癖等の個人差情報に合わせた制御がロボット41に対して行われるため、作業者Mがロボット41の制御に合わせることによる精神的・肉体的に負担をより一層軽減することができる。したがって、作業者Mに、不快感、不安感、疲労感等をさらに与え難いので、操作感をより向上することができる。
なお、「作業者Mに合わせた制御がロボット41に対して行われる」という点について、米国、ノースカロライナ州立大学のロナルド・メイス氏によって提唱されている「ユニバーサルデザイン」に近似したものと解釈される余地はない。「ユニバーサルデザイン」とは、同氏により「できるだけ多くの人が利用可能であるように製品、建物、空間をデザインすること」と定義されている設計思想であり、「誰が利用しても同じ、均質の機能・サービスを提供すること」を意味する。しかしながら、ユニバーサルデザインは、ある特定の個人に対する主観、技量差、癖、使用時間帯などに基づいたものであってはならないことから、本願発明(請求項2)による作業支援評価情報に基づいた学習機能から得られる『作業者の「主観」、「技量差」、「癖」、「好み」さらには「使用時間帯」等といった作業者個々に有する個人差情報に合わせた制御がロボット41に対して行われる』ことは「ユニバーサルデザイン」の思想と本質的に性質を異にするものである。したがって、両者は、近似した概念になり得ないのである。
次に、上述した作業アシスト装置20を位置決めアシスト装置100に適用した例を図1、図3および図7に基づいて説明する。図7に示すように、位置決めアシスト装置100は、主に、コンピュータ132、コントローラ134、ロボットアーム141、表示装置146により構成されるもので、複数の制御アルゴリズム32cにより制御されるロボットアーム141(マニピュレータ)のエンドエフェクタ141cを操作し、立方体形状のワークW1 (第1のワーク)に形成された挿入孔h1 〜h3 (所定位置)に棒状のワークW2 (第2のワーク)を位置決めして挿入する作業を行う作業者Mを支援するもので、軸挿入・位置決めアシスト装置である。なお、コンピュータ132は図1に示すコンピュータ32の概念に相当し、またコントローラ134は図1に示すコントローラ34の概念に相当する。さらにロボットアーム141は図1に示すロボット41の概念に相当する。そのため、ここではコンピュータ132およびコントローラ134の説明は割愛し、ロボットアーム141を中心とした構成、作動等を説明する。
ロボットアーム141は、主に、アーム141a、関節141bおよび棒状のワークW2 を把持可能なエンドエフェクタ141c等により構成されており、このアーム141aや関節141bには、角度と速度を検出し得る図略のセンサが前述した内界センサ情報を出力する内界センサとして取り付けられている。またエンドエフェクタ141c上部のアーム141aには力センサ142が取り付けられており、またエンドエフェクタ141cにはPSDセンサ143が取り付けられている。さらに力センサ142の下方には評価スイッチ144が取り付けられている。なお、力センサ142は図1に示す力センサ42の概念、PSDセンサ143は図1に示す対象検出センサ43の概念、また評価スイッチ144は図1に示す評価スイッチ44の概念、にそれぞれ相当する。
一方、表示装置146は、図1に示すロボット行動意思等表示器46の概念に相当するもので、作業中の作業者Mの視野内に収まる位置に設けられている。この表示装置146は、マトリックス状に配置された複数個のLED146aおよびその駆動回路によって構成されており、コンピュータ132から出力されるロボットアーム141の行動情報およびワークW1 の挿入孔h1 等の対象位置情報が、複数のLED146aによる図形・記号等の表示態様によって表示される。なお、図7中に示す符号Lは、ワークW1 を搬送するコンベアを指しており、当該コンベアLは、紙面裏面から紙面表面方向にゆっくりとした速度(例えば時速1km〜2km)で載置されたワークW1 を搬送している。
このように構成される位置決めアシスト装置100は、図3に示す意図・状態推定システム32aにおいて、次の作業状態に対応した隠れマルコフモデルが設定される。*「停止」という作業状態に対応した隠れマルコフモデル。*「回送」という作業状態に対応した隠れマルコフモデル。なお、ここでいう「回送」とは、ロボットアーム141が運動状態にあるが、次に述べる「目標接近」、「目標穴確定」、「並走」、「挿入」、「退避」のいずれにも属さない作業状態を指す。*「目標接近」という作業状態に対応した隠れマルコフモデル。ここでいう「目標接近」とは、挿入孔h1 〜h3 にロボットアーム141のエンドエフェクタ141cが接近しているが、挿入孔h1 等がPSDセンサ143によって検知されるに至らない作業状態を指す。*「目標孔確定」という作業状態に対応した隠れマルコフモデル。ここでいう「目標孔確定」とは、PSDセンサ143によって挿入孔h1 等が検出され、対象位置情報が有効に得られている作業状態であって、かつ、次に述べる「並走」、「挿入」、「退避」のいずれにも属さない作業状態を指す。*「並走」という作業状態に対応した隠れマルコフモデル。ここでいう「並走」とは、対象検出センサによって軸挿入対象孔が検出され、対象位置情報が有効に得られている作業状態であって、かつ、装置が軸挿入対象孔と位置誤差なく並走している作業状態を指す。*「挿入」という作業状態に対応した隠れマルコフモデル。ここでいう「挿入」とは、装置が軸挿入対象孔に軸を挿入している作業状態を指す。*「退避」という作業状態に対応した隠れマルコフモデル。ここでいう「退避」とは、「挿入」という作業状態の完了後、装置が軸を残して軸挿入対象孔から遠ざかる作業状態を指す。
また、図3に示す意図・状態推定システム32aにおいて、作業者Mが意図する操作の種類に対応した隠れマルコフモデルが設定される。*「作業者Mがエンドエフェクタ141cの移動を加速させる」という作業者Mが意図する操作の種類に対応した隠れマルコフモデル。*「作業者Mがエンドエフェクタ141cの移動を等速運動させる」という作業者Mが意図する操作の種類に対応した隠れマルコフモデル。*「作業者Mがエンドエフェクタ141cの移動を減速させる」という作業者Mが意図する操作の種類に対応した隠れマルコフモデル。*「作業者Mが軸挿入・位置決めしようとする」という作業者Mが意図する操作の種類に対応した隠れマルコフモデル。*「作業者Mがエンドエフェクタ141cを移動させる方向」の作業者Mが意図する操作の種類に対応した隠れマルコフモデル。
さらに、各「隠れマルコフモデル」に対する入力(隠れマルコフモデルと位置決めアシスト装置100に特有のセンサ情報との対応)として、次のものが挙げられる。*「内界センサ情報」:ロボットアーム141の関節141bの角度、角速度。*「対象位置情報」:PSDセンサ143から検出される、ワークW1 の位置に関する情報。*「操作印加量情報」:力センサ142によって計測される、作業者Mの操作力。
各「隠れマルコフモデル」からの出力として次のものが挙げられる。*前記に例示した、それぞれの隠れマルコフモデルが表現する、それぞれの作業状態が現在の作業状態として尤もらしい確率(尤度)。*前記に例示した、それぞれの隠れマルコフモデルが表現する、それぞれの作業者Mの意図する操作の種類が現在の操作の種類として尤もらしい確率(尤度)。
「隠れマルコフモデル」群からの出力として次のものが挙げられる。*現在の作業状態として、最も尤もらしい(最尤の)作業状態。*現在の人の意図する操作の種類の中で、最も尤もらしい(最尤の)操作の種類。
一方、図3に示す意図・状態推定システム32aにおいて、強化学習の「状態」と位置決めアシスト装置100に特有のセンサ情報や制御パラメータの対応として、次のものが挙げられ、これらが強化学習の「状態」に対応する。*前記隠れマルコフモデル群からの出力として得られた、現在の作業状態として最も尤もらしい(最尤の)作業状態。*前記隠れマルコフモデル群からの出力として得られた、現在の作業者Mの意図する操作の種類の中で、最も尤もらしい(最尤の)操作の種類。*現在の作業状態として最も尤もらしい作業状態と現在の作業者Mの意図する操作の種類の中で最も尤もらしい操作の種類とからなる信号群。
また、強化学習の「行動」と位置決めアシスト装置100に特有のセンサ情報や制御パラメータ等の対応として、次のものが挙げられる。図3に示す制御アルゴリズム切替えシステム32bにより選択可能な複数の制御アルゴリズム32cのうち、次に用いるべき制御アルゴリズム32cの選択。
このように位置決めアシスト装置100を構成することにより、位置決めアシスト装置100では、力センサ142により出力される印加操作量情報はロボットアーム141を操作する作業者Mの操作力を表す操作力情報を含み、PSDセンサ143により出力される対象位置情報はワークW1 の挿入孔h1 等を表す所定位置情報を含む。これにより、意図・状態推定システム32aによって、ワークW1 の挿入孔h1 等に対し棒状のワークW2 を挿入位置決めしようとする作業者Mの作業意図や作業状態を推定し、この推定した結果に基づいてロボットアーム141のエンドエフェクタ141cによる次の制御内容を意図・状態推定システム32aにより決定する。
このため、例えば、ワークW1 がコンベアLにより移動する場合であっても、操作力情報および所定位置情報によって、移動するワークW1 の挿入孔h1 等に対し、棒状のワークW2 を把持したエンドエフェクタ141cを近づけようとする作業者Mの作業意図や作業状態を推定することができる。また、例えば、ワークW1 に複数箇所の挿入孔が存在する場合であっても、操作力情報および所定位置情報によってワークW1 の複数箇所の挿入孔から作業者Mが選択した例えば挿入孔h1 にエンドエフェクタ141cに把持されたワークW2 を近づけようとする作業者Mの作業意図や作業状態を推定することができる。またこのワークW1 がコンベアLにより移動する場合においても同様に、作業者Mの作業意図や作業状態を推定することができる。これにより、この推定結果に基づいて得られた次の制御内容を実現する最適な制御アルゴリズム32cに従ってエンドエフェクタ141cが制御されるので、作業者Mによる次作業に対して適切な作業支援を行うことができる。したがって、作業者Mがエンドエフェクタ141cの制御に合わせることによる精神的・肉体的に負担を軽減することができるので、作業者Mに、不快感、不安感、疲労感等を与え難くく、操作感を向上することができる。またコンベアL等によるワークW1 が移動する場合であっても同様に、作業者Mによる次作業に対し適切な作業支援を行うことができるので、作業者MはワークW2 の位置決め・挿入作業を比較的容易に行うことができる。
なお、図7に示す位置決めアシスト装置100は、次のような技術的思想として把握することができる。複数の制御アルゴリズムにより制御されるマニピュレータを操作して、ワークに形成された所定の挿入孔に軸部材を挿入する作業を行う作業者を支援する特許請求の範囲の請求項1〜5のいずれか一項に記載の作業支援装置を用いた軸挿入位置決め作業支援装置であって、前記操作状態検出手段により出力される操作状態情報は、前記マニピュレータを操作する作業者の操作力を表す操作力情報を含み、前記状態量検出手段により出力される状態量情報は、前記ワークの挿入孔の位置を表す挿入孔位置情報を含むことを特徴とする軸挿入位置決め作業支援装置。
この技術的思想により、軸挿入位置決め作業支援装置では、操作状態検出手段により出力される操作状態情報は、マニピュレータを操作する作業者の操作力を表す操作力情報を含み、状態量検出手段により出力される状態量情報は、ワークの挿入孔の位置を表す挿入孔位置情報を含む。これにより、推定手段によって、ワークの所定の挿入孔に軸部材を挿入しようとする作業者の作業意図や作業状態を推定し、この推定した結果に基づいてマニピュレータによる次の制御内容を次制御内容決定手段により決定する。このため、例えば、ワークが移動する場合であっても、操作力情報および挿入孔位置情報によって、移動するワークの所定の挿入孔に軸部材を挿入しようとする作業者の作業意図や作業状態を推定することができる。また、例えば、ワークに複数箇所に挿入孔が存在する場合であっても、操作力情報および挿入孔位置情報によって、ワークの複数箇所の挿入孔から作業者が選択した挿入孔に軸部材を挿入しようとする作業者の作業意図や作業状態を推定することができる。さらに、例えば、移動するワークに複数箇所に挿入孔が存在する場合であっても、操作力情報および挿入孔位置情報によって、移動するワークの複数箇所の挿入孔から作業者が選択した挿入孔に軸部材を挿入しようとする作業者の作業意図や作業状態を推定することができる。これにより、この推定結果に基づいて得られた次の制御内容を実現する最適な制御アルゴリズムに従ってマニピュレータが制御されるので、作業者による次作業に対して適切な作業支援を行うことができる。
次に、上述した作業アシスト装置20をパワーアシスト装置200に適用した例を図1、図3、図8〜図9に基づいて説明する。図8に示すように、パワーアシスト装置200は、主に、コンピュータ232、コントローラ234、パワーアシスト機構241により構成されるもので、複数の制御アルゴリズム32cにより制御されるパワーアシスト機構241を操作してワークを移動させる作業を行う作業者Mを支援するものである。なお、図8に示す例では、ワークW2 である自動車用のインナーパネルを、ワークW1 である自動車の車体内部前方に組み付ける作業を支援するパワーアシスト装置200を想定している。なお、コンピュータ232は図1に示すコンピュータ32の概念に相当し、またコントローラ234は図1に示すコントローラ34の概念に相当する。さらにパワーアシスト機構241は図1に示すロボット41の概念に相当する。そのため、ここではコンピュータ232およびコントローラ234の説明は割愛し、パワーアシスト機構241を中心とした構成、作動等を説明する。
パワーアシスト機構241は、主に、コンベアによるラインの進行方向と進行方向に対して直交する方向とに架設された2本のガイドレールと、このガイドレールに設けられる走行軸駆動ユニット241aおよび横行軸駆動ユニット241bと、これらの駆動ユニットにより走行軸(Y軸)方向および横行軸(X軸)方向にそれぞれ移動可能な昇降軸用エアバランサ241cと、この昇降軸用エアバランサ241cに取り付けられてワークW2 (インナーパネル)を把持可能なハンド241dと、から構成されている。なお、昇降軸用エアバランサ241cは、鉛直軸(Z軸)方向に吊り上げ・吊り下げ可能に可働する(図9参照)。以下、本例では、ワークW1 のことを車体、ワークW2 のことをインナーパネルと便宜上に称する。
この走行軸駆動ユニット241a、横行軸駆動ユニット241b、昇降軸用エアバランサ241cおよびハンド241dには、それぞれの移動位置、移動速度あるいは加速度を検出し得る図略のセンサが前述した内界センサ情報を出力する内界センサとして取り付けられている。また昇降軸用エアバランサ241cの下端部には、力センサ242、評価スイッチ244および表示装置246が取り付けられている。さらに、車体が移動するラインの上方には、CCDステレオカメラ243が設けられており、車体内に組み付けられるインナーパネルのセット位置等をコンピュータ232により画像認識可能に構成されている。なお、力センサ242は図1に示す力センサ42の概念、CCDステレオカメラ243は図1に示す対象検出センサ43の概念、また評価スイッチ244は図1に示す評価スイッチ44の概念、表示装置246は図1に示すロボット行動意思等表示器46の概念、にそれぞれ相当する。なお、図8中に示す車体(ワークW1 )は、紙面裏面から紙面表面方向にゆっくりとした速度(例えば時速1km〜2km)で図略のコンベア装置により搬送されている。
このように構成されるパワーアシスト装置200は、図3に示す意図・状態推定システム32aにおいて、次の作業状態に対応した隠れマルコフモデルが設定される。*「インナーパネル取り出し」という状態に対応した隠れマルコフモデル。ここでいう「インナーパネル取り出し」とは、インナーパネルを把持するためにインナーパネル取り出し位置にて、インナーパネルへの接近、減速、停止、把持、離脱といった一連のインナーパネル治具からの離脱を指す。*「加速横行」という状態に対応した隠れマルコフモデル。ここでいう「加速横行」は、図9に示す区間A、Cにおいて、横行軸方向に加速する作業状態を指す。*「等速横行」という状態に対応した隠れマルコフモデル。ここでいう「等速横行」は、図9に示す区間A、Cにおいて、横行軸方向に等速運動する作業状態を指す。*「減速横行」という状態に対応した隠れマルコフモデル。ここでいう「減速横行」は、図9に示す区間A、Cにおいて、横行軸方向で減速する作業状態を指す。*「方向転換」という状態に対応した隠れマルコフモデル。ここでいう「方向転換」は、区間AからBへ、あるいは区間BからCへ、その移動方向を変えることを指す。*「加速走行」という状態に対応した隠れマルコフモデル。ここでいう「加速走行」は、区間Bにおいて、走行軸方向に加速する作業状態を指す。「加速横行」との違いは、指令対象の駆動ユニットの駆動モータが異なる点とパワーアシスト装置200を支持するガイドレールで、使用するガイドレールが異なる点である。*「等速走行」という状態に対応した隠れマルコフモデル。ここでいう「等速走行」は、区間Bにおいて、走行軸方向に等速運動する作業状態を指す。*「減速走行」という状態に対応した隠れマルコフモデル。ここでいう「減速走行」は、区間Bにおいて、走行軸方向で減速する作業状態を指す。*「同期走行」という状態に対応した隠れマルコフモデル。ここでいう「同期走行」は、車体との並走を指す。前記「等速走行」後半と前記「減速走行」において同時に存在する作業状態である。同期は、ラインに設けられている同期棒がパワーアシスト装置200に接触して始まる。*「インナーパネルセット」という状態に対応した隠れマルコフモデル。ここでいう「インナーパネルセット」は、インナーパネルを車体にセットすることを指す。「インナーパネルセット」では、画像処理に基づきインナーパネルを所定の位置に固定する作業状態を指す。
また、図3に示す意図・状態推定システム32aにおいて、作業者Mが意図する操作の種類に対応した隠れマルコフモデルが設定される。*「作業者Mが装置を加速させる」という作業者Mが意図する操作の種類に対応した隠れマルコフモデル。作業者Mとコンピュータ232との接点としての力センサ242の印加操作量情報をもとに、「作業者Mが昇降軸用エアバランサ241cを加速させる」を推定をする。現在の速度に対し、さらに操作力が加わっていたならば加速と判断する。*「作業者Mが昇降軸用エアバランサ241cを等速運動させる」という作業者Mが意図する操作の種類に対応した隠れマルコフモデル。*「作業者Mが昇降軸用エアバランサ241cを減速運動させる」という作業者Mが意図する操作の種類に対応した隠れマルコフモデル。*「作業者Mが昇降軸用エアバランサ241cの移動方向を変える」という作業者Mが意図する操作の種類に対応した隠れマルコフモデル。力センサ242の分力より、その移動方向の変化を判断する。*「作業者Mがインナーパネルを車内に投入しようとする」という作業者Mが意図する操作の種類に対応した隠れマルコフモデル。前記同期中、力センサ242の横行軸方向への分力より車内投入意図を判断する。*「作業者Mがインナーパネルをセットしようとする」という作業者Mが意図する操作の種類に対応した隠れマルコフモデル。画像処理データより所定位置にインナーパネルが配置されたこと、力センサ242の検出操作力がほぼ零になったことでその意図を判断する。さらに走行軸駆動ユニット241aあるいは横行軸駆動ユニット241bの駆動モータのエンコーダ値より装置の位置を確認できるので、その位置より横行軸方向か、走行軸方向かの判断を行なう。
さらに各「隠れマルコフモデル」に入力等するパワーアシスト装置200に特有のセンサ情報として、次のものが挙げられる。*「内界センサ情報」:走行軸駆動ユニット241aおよび横行軸駆動ユニット241bの各駆動モータのエンコーダ値。*「対象位置情報」:CCDステレオカメラ243から出力される画像処理データ。*「操作印加量情報」:力センサ242から出力される作業者Mの操作力。
また各「隠れマルコフモデル」に入力等するパワーアシスト装置200に特有の制御パラメータとして、次のものが挙げられる。*図9に示す区間A、B、Cにおいて、インピーダンス制御:仮想質量m、仮想粘性c、仮想バネ定数k、*図9に示す区間Dにおいて(インナーパネルを車体にセットする区間)、PID制御:一般的な位置制御を指す。但し、制御パラメータは、目標位置、速度、加速度。
一方、図5に示す学習機能付き制御アルゴリズム切替え器(強化学習)において、インナーパネルを車体にセットする区間D(図9参照)ではPID制御、区間A、B、Cではインピーダンス制御に切り換える。また図5に示す学習アルゴリズムでは、PID制御では、インナーパネルのセット時の車体が受ける衝撃を作業者Mが見て判断し、あるいはインナーパネルのセットに要する所要時間をみて評価スイッチ244を押すことにより、アシスト制御部30で目標位置、速度、加速度を更新する。
インピーダンス制御では、仮想質量m、仮想粘性c、仮想バネ定数kを更新する。特に、加速時の操作感の「重さ」、等速時の「軽さ」、減速時の「引っ張られる」違和感、移動方向の変更のしやすさ、インナーパネル取り出しにおいては微小位置決めが可能かどうか、インナーパネルを車体に投入するにあたっては車体にインナーパネルをぶつけないように俊敏な動きができるかどうか、等を作業者Mが判断して評価スイッチ244を押すことによって、操作感の重さ・軽さに主に関係する仮想質量m、位置決めのしやすさに主に関係する仮想粘性cを更新する。
このようにパワーアシスト装置200を構成することにより、パワーアシスト装置200では、力センサ242により出力される印加操作量情報はパワーアシスト機構241を操作する作業者Mの操作力を表す操作力情報を含み、CCDステレオカメラ243により出力される状態量情報は、インナーパネル(ワークW2 )の位置を表す位置情報、インナーパネル(ワークW2 )の速度を表す速度情報およびインナーパネル(ワークW2 )の加速度を表す加速度情報のうち少なくとも1つの情報を含む。これにより、意図・状態推定システム32aによって、パワーアシスト機構241を操作してインナーパネル(ワークW2 )を移動または姿勢変更させようとする作業者Mの作業意図や作業状態を推定し、この推定した結果に基づいてパワーアシスト機構241による次の制御内容を次制御内容決定手段により決定する。
このため、例えば、操作力情報およびインナーパネル(ワークW2 )の位置情報によって、比較的高い位置または低い位置においてインナーパネル(ワークW2 )を移動等させようとする作業者Mの作業意図や作業状態を推定することができる。また、例えば、操作力情報およびインナーパネル(ワークW2 )の速度情報によって、移動中のインナーパネル(ワークW2 )について、当該速度で移動を継続させようとしているのか、もしくは加速または減速させようとしているのか、等の作業者Mの作業意図や作業状態を推定することができる。さらに、例えば、操作力情報およびインナーパネル(ワークW2 )の加速度情報によって、移動中のインナーパネル(ワークW2 )の速度を加速または減速させようとする作業者Mの作業意図や作業状態を推定することができる。これにより、この推定結果に基づいて得られた次の制御内容を実現する最適な制御アルゴリズム32cに従ってパワーアシスト機構241が制御されるので、作業者Mによる次作業に対して適切な作業支援を行うことができる。したがって、作業者Mがパワーアシスト機構241の制御に合わせることによる精神的・肉体的に負担を軽減することができるので、作業者Mに、不快感、不安感、疲労感等を与え難く、操作感を向上することができる。