JP2017170553A - 制御方法 - Google Patents

制御方法 Download PDF

Info

Publication number
JP2017170553A
JP2017170553A JP2016058370A JP2016058370A JP2017170553A JP 2017170553 A JP2017170553 A JP 2017170553A JP 2016058370 A JP2016058370 A JP 2016058370A JP 2016058370 A JP2016058370 A JP 2016058370A JP 2017170553 A JP2017170553 A JP 2017170553A
Authority
JP
Japan
Prior art keywords
target
information
time
joint
force
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016058370A
Other languages
English (en)
Other versions
JP6567998B2 (ja
Inventor
中村 仁彦
Yoshihiko Nakamura
仁彦 中村
渉 高野
Wataru Takano
渉 高野
高橋 太郎
Taro Takahashi
太郎 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Tokyo NUC
Toyota Motor Corp
Original Assignee
University of Tokyo NUC
Toyota Motor Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Tokyo NUC, Toyota Motor Corp filed Critical University of Tokyo NUC
Priority to JP2016058370A priority Critical patent/JP6567998B2/ja
Publication of JP2017170553A publication Critical patent/JP2017170553A/ja
Application granted granted Critical
Publication of JP6567998B2 publication Critical patent/JP6567998B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Manipulator (AREA)

Abstract

【課題】統計モデル構築時と可動部の制御時で、可動部と操作対象物の位置関係が異なる場合でも、可動部を適正に制御すること。【解決手段】動作する可動部の位置又は速度情報と該可動部に対する力情報とに基づき構築した統計モデルと、時刻tの可動部の位置又は速度情報と力情報と、に基づいて、時刻t+1の目標位置情報又は目標速度情報をサンプリングし、時刻t+1の目標位置情報、目標速度情報及び目標加速度情報に基づいて、逆動力学演算を行って、時刻t+1の可動部の目標力情報を算出し、時刻tの位置情報及び力情報と統計モデルとに基づいて時刻t+1の目標位置情報及び目標力情報が統計モデルから生成される確率を算出し、時刻t+1の目標位置情報及び目標力情報と確率とに基づいて時刻t+1における目標位置情報及び目標力情報の期待値を算出し、該期待値に基づいて可動部を制御する。【選択図】図5

Description

本発明は、統計モデルを用いて可動部を制御する制御方法に関する。
動作する可動部の位置情報(ロボットの関節角度など)に基づき構築した統計モデル(隠れマルコフモデルなど)を用いて、可動部を制御する制御方法が知られている(例えば、特許文献1参照)。
特開2004−330361号公報
上記制御方法においては、位置情報に基づいて統計モデルを構築している。このため、統計モデル構築時と、実際の可動部の制御時とで、例えば、その可動部と操作対象物との位置関係が変化した場合に、可動部と操作対象物との間に過大な力が発生する、あるいは可動部が操作対象物に接触できない虞がある。
本発明は、かかる課題を解決するためになされたものであり、統計モデル構築時と可動部の制御時で、可動部と操作対象物の位置関係が異なる場合でも、可動部と操作対象物との間に過大な力が発生する、あるいは可動部が操作対象物に接触できない状況を抑制できる制御方法を提供することを主たる目的とする。
上記目的を達成するための本発明の一態様は、
動作する可動部の位置又は速度情報と該可動部に対する力情報とに基づき構築したモデルであって、各ノード間の遷移確率が設定され該各ノードは前記位置又は速度情報と力情報の分布を有する統計モデルと、時刻t(tは自然数)における前記可動部の位置又は速度情報と力情報と、に基づいて、時刻t+1における前記可動部の目標位置情報又は目標速度情報をサンプリングするステップと、
前記サンプリングした目標位置情報又は目標速度情報に基づいて、時刻t+1における前記可動部の目標位置情報又は目標速度情報と、目標加速度情報と、を算出するステップと、
前記算出した時刻t+1における目標位置情報、目標速度情報及び目標加速度情報に基づいて、逆動力学演算を行って、時刻t+1における前記可動部の目標力情報を算出するステップと、
前記時刻tにおける位置情報及び力情報と、前記統計モデルと、に基づいて、前記算出した時刻t+1における目標位置情報及び目標力情報が前記統計モデルから生成される確率を算出するステップと、
前記算出した時刻t+1における目標位置情報及び目標力情報と、前記算出した確率と、に基づいて、前記時刻t+1における目標位置情報及び目標力情報の期待値を算出するステップと、
前記算出した目標位置情報及び目標力情報の期待値に基づいて、前記可動部を制御するステップと、
を含む、ことを特徴とする制御方法
である。
この一態様によれば、可動部の位置指令値と力指令値の整合性を取ることができるため、統計モデル構築時と可動部制御時で、可動部と操作対象物の位置関係が異なる場合などでも、可動部と操作対象物との間で、過大な力が発生する、あるいは可動部が操作対象物に接触できない状況を抑制できる。
本発明によれば、統計モデル構築時と可動部の制御時で、可動部と操作対象物の位置関係が異なる場合でも、可動部と操作対象物との間に過大な力が発生する、あるいは可動部が操作対象物に接触できない状況を抑制できる制御方法を提供できる。
本発明の実施形態1に係るロボットアームの概略的な構成を示す図である。 本発明の実施形態1に係るロボットアーム及び制御装置の概略的なシステム構成を示すブロック図である。 隠れマルコフモデルの一例を示す図である。 各関節部の目標軌道生成およびロボットアーム制御を示す図である。 本発明の実施形態1に係る制御方法のフローを示すフローチャートである。
以下、図面を参照して本発明の実施の形態について説明する。
実施形態1
図1は、本発明の実施形態1に係るロボットアームの概略的な構成を示す図である。本実施形態1に係る制御装置は、例えば、多関節型のロボットアーム(可動部の一具体例)2を制御する。
ロボットアーム2は、複数のリンク21と、各リンク21を回動可能に連結する関節部(手首関節、肘関節、肩関節など)22と、その先端に設けられ操作対象を操作するエンドエフェクタ23と、を有する。
図2は、本発明の実施形態1に係るロボットアーム及び制御装置の概略的なシステム構成を示すブロック図である。各関節部22には、各関節部22の関節角度(位置情報の一具体例)を検出するエンコーダなどの角度センサ24と、各関節部22を駆動するサーボモータなどのアクチュエータ25と、各関節部22の操作力を検出する力センサ26と、が設けられている。
力センサ26は、例えば、各関節部22の関節トルク(力情報の一具体例)を検出するトルクセンサなどである。各関節部22には、減速機構が設けられている。エンドエフェクタ23は、例えば、物体を把持、接触などして物体に操作力を加える。エンドエフェクタ23には、エンドエフェクタ23を駆動するアクチュエータ25と、エンドエフェクタ23の操作力を検出する力センサ26と、が設けられている。
制御装置1は、例えば、各関節部22の角度センサ24からの角度情報(関節角度など)と、力センサ26からの操作力と、に基づいて、各関節部22及びエンドエフェクタ23のアクチュエータ25を制御することで、ロボットアーム2をフィードバック制御する。
なお、制御装置1は、例えば、演算処理等と行うCPU(Central Processing Unit)1a、CPU1aによって実行される演算プログラム、制御プログラム等が記憶されたROM(Read Only Memory)やRAM(Random Access Memory)からなるメモリ1b、外部と信号の入出力を行うインターフェイス部(I/F)1c、などからなるマイクロコンピュータを中心にして、それぞれ、ハードウェア構成されている。CPU1a、メモリ1b、及びインターフェイス部1cは、データバス1dなどを介して相互に接続されている。
本実施形態1に係る制御装置1は、例えば、隠れマルコフモデル(Hidden Markov Model:HMM)などの統計モデルを用いて、人の動作を模倣学習することで、ロボットアーム2によるテーブル拭きのような力を加えて行う物理タスクを実行する。
ところで、ロボットアームが上記のような物理タスクを実行するために、制御装置は、ロボットアームの位置情報(関節角度や手先位置)に加えて、ロボットアームの力情報(関節トルクや手先反力)についても学習する必要がある。この場合、制御装置が単にロボットアームの位置情報と同様に、力情報を学習するだけでは次のような問題が生じる。例えば、その学習時と制御時とでそのロボットアームと操作対象物との位置関係が変化した場合(テーブルの高さが変化した場合など)に、ロボットアームと操作対象物との間に過大な力が発生する、あるいはロボットアームが操作対象物に接触できない虞がある。
これに対し、本実施形態1に係る制御装置1は、隠れマルコフモデルによるロボットアーム2の目標軌道生成時に、後述の動力学演算式を用いて力学的整合性を確保する。
制御装置1は、予め用意されたデータに基づいて学習を行い隠れマルコフモデルを構築する学習処理と、学習処理で構築した隠れマルコフモデルを用いてロボットアーム2を制御する実行処理と、を実行する。
(学習処理)
制御装置1は、学習処理において、例えば、予め用意されたロボットアーム2の各関節部22の関節角度および関節トルクの時系列データ(シミュレーションデータなど)を用いて学習を行い、Baum-Welch法によりleft-right隠れマルコフモデルを構築する(図3)。
なお、制御装置1は、実際にロボットアーム2を遠隔的に動作させ、その際に角度センサ24及び力センサ26により検出されたロボットアーム2の各関節部22の関節角度および関節トルクの時系列データを用いて学習を行い、隠れマルコフモデルを構築してもよい。
図3に示す如く、隠れマルコフモデルにおいて、各ノードqと、ノードq間を遷移する遷移確率aが設定される。各ノードqは、各関節部22の関節角度θおよび関節トルクτの分布を有している。制御装置1は、上記各関節部22の関節角度および関節トルクの時系列データを用いてノード間の遷移確率aと、各関節部22の関節角度θおよび関節トルクτの分布を表すパラメータと、を学習した隠れマルコフモデルを構築する。
このように、学習処理において、ロボットアーム2の関節角度と関節トルクを使用して隠れマルコフモデルを構築する。これにより、ロボットアーム2の関節角度と関節トルクの相関関係も含めて時系列データを保存でき、ロボットアーム2が操作対象物の接触動作を行うための位置指令と力指令の両者を同時に生成できる。また、そのデータの情報量を圧縮しつつ、ロボットアーム2の動作認識等を行うこともできる。
(実行処理)
制御装置1は、本実行処理において、図4に示す如く、各関節部22の目標軌道生成と、ロボットアーム制御と、を同時に実行する。さらに、制御装置1は、このロボットアーム制御時において、力センサ26及び角度センサ24により検出された現在時刻tのセンサ値に基づいて、次瞬間である時刻t+1のロボットアーム2の目標位置情報θplan及び目標力情報τplanを決定し、これら目標位置情報θplan及び目標力情報τplanに基づいてロボットアーム2のコンプライアンス制御を実行する。これにより、ロボットアーム2の現在の状態から大きく離れた指令値が生成され、ロボットアーム2が急激に動作するような状況を回避できる。さらに、ロボットアーム2の位置指令及び力指令を同時に厳密に満たせない場合でも、上記目標位置情報及び目標力情報を用いて、ロボットアーム2の位置及び力を予め設定したパラメータに従ったバランス状態で適正に制御できる。
制御装置1は、所定時間毎に、以下の[prediction](1)〜(8)および[resampling]を繰り返して関節部22の目標軌道を生成する。
[prediction]
(1)制御装置1は、まず、現在時刻tにおける隠れマルコフモデルのノードqと、角度センサ24及び力センサ26により検出された現在時刻tにおける関節角度θ及び関節トルクτと、(パーティクル)を保持する。
(2)制御装置1は、隠れマルコフモデルのノード間の遷移確率aを用いて、次瞬間である時刻t+1におけるノードqt+1をサンプリングする。
(3)制御装置1は、サンプリングしたノードqt+1が有する関節角度の分布(ノードqt+1における出力確率)に基づいて、時刻t+1における関節部22の目標関節角度(目標位置情報の一具体例)θt+1 refをサンプリングする。
このように、関節部22の目標軌道生成時に関節部22の関節角度び関節トルクを含む隠れマルコフモデルと、角度センサ24及び力センサ26により検出された現在時刻tにおける関節角度及び関節トルクと、に基づいて、目標関節角度をサンプリングしている。
(4)制御装置1は、サンプリングした目標関節角度θt+1 refを1階微分して関節部22の目標関節角速度(目標速度情報の一具体例)θ(ドット)t+1 refを算出し、目標関節角度θt+1 refを2階微分して関節部22の目標関節角加速度(目標加速度情報の一具体例)θ(2ドット)t+1 refを算出する。なお、上記のようにθの上部に1つのドット記号を付したもの(1階微分値)をθ(ドット)と表記し、θの上部に2つのドット記号を付したもの(2階微分値)をθ(2ドット)と表記し、以降、他のパラメータについても同様に表記する。
(5)制御装置1は、算出した目標関節角加速度θ(2ドット)t+1 refを下記(式1)を用いて修正する。下記式1において、K及びKは、予め設定される係数行列である。
この修正により、制御安定性をより高めることができる。
Figure 2017170553
なお、本実施形態1において、制御装置1は、処理の高速化を図るために、上記(5)による目標関節角加速度θ(2ドット)t+1 refの修正を行わなくても良い。
(6)制御装置1は、算出した目標関節角度θt+1 ref、目標関節角速度θ(ドット)t+1 ref、および修正した目標関節角加速度θ(2ドット)t+1 refと、目標反力Ft+1 refとを実現する、目標関節トルクτt+1を算出する。
なお、上記目標反力Ft+1 refは、ロボットアーム2の操作内容に基づいてユーザにより設定される。例えば、ロボットアーム2を操作対象物に強く接触させる場合は、目標反力10[N]に設定し、軽く接触させる場合は、1[N]に設定する。
制御装置1は、算出した目標関節角度θt+1 ref、目標関節角速度θ(ドット)t+1 ref、および修正した目標関節角加速度θ(2ドット)t+1 refと、目標反力Ft+1 refと、に基づいて、下記逆動力学演算式(運動方程式)(式2)を用いて関節部22の目標関節トルク(目標力情報の一具体例)τt+1を算出する。なお、下記(式2)において、Mは慣性行列であり、Cは遠心及びコリオリ項であり、Gは重力項である。Jは、関節角速度をロボットアーム2(可動部)の速度に関係付けるヤコビ行列である。
このように、下記逆動力学演算式を用いて目標関節トルクτt+1を算出することで、隠れマルコフモデルによる関節部22の目標軌道生成時において、ロボットアーム2の力学的な整合性を確保することができる。
Figure 2017170553
(7)制御装置1は、角度センサ24及び力センサ26により検出された現在時刻tでの関節角度θ及び関節トルクτと、隠れマルコフモデルと、に基づいて、目標関節角度θt+1 ref、および目標関節トルクτt+1が隠れマルコフモデルから生成される(qt+1、θt+1 ref、τt+1に到達する)確率P(θt+1 ref、τt+1|θ、τ、λ)を算出する。このように、角度センサ24及び力センサ26により検出された現在時刻tの関節角度及び関節トルク(センサ値)と、隠れマルコフモデルと、から、その目標関節角度θt+1 refおよび目標関節トルクτt+1になる確率(尤度)を算出する。
制御装置1は、パーティクル毎に上記確率Pを算出する。ここで、制御装置1は、各パーティクルの確率Pの総和が1にするため、次の修正処理を行う。例えば、制御装置1は、各パーティクルの確率の総和を算出し、各パーティクルの確率を算出した総和で除算する。
(8)制御装置1は、目標関節角度θt+1 ref、目標関節トルクτt+1および修正した確率に基づいて下記(式3)を用いて、次瞬間の指令値である時刻t+1における目標関節角度の推定値θ(ハット)t+1 ref及び目標関節トルクの推定値τ(ハット)t+1を、パーティクル毎の関節角度及び関節トルクの期待値として算出する。なお、θ及びτの上部にハット記号を付したものを、夫々、θ(ハット)及びτ(ハット)と表記し、以降、他のパラメータについても同様に表記する。
このように、上記(7)で算出した確率による重みづけ平均により次瞬間の指令値を算出する。
Figure 2017170553
制御装置1は、上記(8)において算出した目標関節角度の推定値θ(ハット)t+1 ref及び目標関節トルクの推定値τ(ハット)t+1と、角度センサ24により検出された各関節部22の関節角度θと、に基づいて、各関節部22のコンプライアンス制御を行う。制御装置1は、上記(8)において算出した目標関節角度の推定値θ(ハット)t+1 ref及び目標関節トルクの推定値τ(ハット)t+1を、夫々、角度指令θplan、及びトルク指令τplanとして、下記(式4)を用いて、トルク指令τrefを算出する。なお、下記(式4)において、K及びDは予め設定される係数行列である。
Figure 2017170553
制御装置1は、算出したトルク指令τrefを各関節部22のアクチュエータ25に送信することで、各アクチュエータ25を制御する。
さらに、制御装置1は、力センサ26により検出された関節トルクτが、算出したトルク指令τrefに追従するように、関節部22のアクチュエータ25に対して、フィードバック制御を行う。
以上のように、目標軌道生成時において、関節部22の関節角度及び関節トルクを含む隠れマルコフモデルと、角度センサ24及び力センサ26により検出された関節角度及び関節トルクに基づいて、目標関節角度をサンプリングする。サンプリングした目標関節角度に基づいて目標関節角速度及び目標関節角加速度を算出し、目標関節角度と、算出した目標関節角速度および目標関節角加速度と、目標反力と、に基づいて、逆動力学演算を行い目標関節トルクを算出して、ロボットアーム2の力学的な整合性を確保する。現在時刻tの角度センサ値及びトルクセンサ値と、隠れマルコフモデルと、から、その目標関節角度および目標関節トルクになる確率を算出する。算出した確率による重みづけ平均により時刻t+1の目標関節角度及び目標関節トルクの期待値を算出し、この目標関節角度及び目標関節トルクの期待値を用いてロボットアーム2の関節部22を制御する。
これにより、ロボットアーム2の位置指令値と力指令値の整合性を取ることができる。したがって、隠れマルコフモデル構築時とロボットアーム制御時で、例えば、操作対象物の大きさ、形状が異なる場合や、ロボットアーム2と操作対象物の位置関係(テーブルの高さが異なるなど)が異なる場合などでも、ロボットアーム2と操作対象物との間で、過大な力が発生する、あるいはロボットアームが操作対象物に接触できない状況を抑制できる。
[resampling]
制御装置1は、上記算出した確率Pを正規化して、確率密度分布pを算出する。
制御装置1は、各パーティクルの確率Pとなるように、確率密度分布pに従ってパーティクルをばらまき、時刻t+1でのパーティクルを更新する。これにより、確率の低いパーティクルを除去し、確率の高いパーティクルを残すことができる。
制御装置1は、選択したパーティクルsのノードqt+1を次のフレームのためにqにセットし、上記(1)に戻り処理を繰り返す。
図5は、本実施形態1に係る制御方法のフローを示すフローチャートである。なお、図5に示す制御処理は、例えば、所定時間毎に繰返し実行される。
制御装置1は、隠れマルコフモデルのノード間の遷移確率aを用いて時刻t+1(次瞬間)におけるノードqt+1をサンプリングする(ステップS101)。
制御装置1は、サンプリングしたノードqt+1が有する関節角度の分布に基づいて、時刻t+1における目標関節角度θt+1 refをサンプリングする(ステップS102)。
制御装置1は、サンプリングした目標関節角度θt+1 refを1階微分して目標関節角速度θ(ドット)t+1 refを算出し、目標関節角度θt+1 refを2階微分して目標関節角加速度θ(2ドット)t+1 refを算出する(ステップS103)。
制御装置1は、算出した目標関節角加速度θ(2ドット)t+1 refを上記(式1)を用いて修正する(ステップS104)。
制御装置1は、算出した目標関節角度θt+1 ref、目標関節角速度θ(ドット)t+1 ref、および修正した目標関節角加速度θ(2ドット)t+1 refと、目標反力Ft+1 refと、に基づいて、上記逆動力学演算式(式2)を用いて目標関節トルクτt+1を算出する(ステップS105)。
制御装置1は、角度センサ24及び力センサ26により検出された現在時刻tでの関節角度θ及び関節トルクτと、隠れマルコフモデルと、に基づいて、目標関節角度θt+1 ref、および目標関節トルクτt+1が隠れマルコフモデルから生成される確率P(θt+1 ref、τt+1|θ、τ、λ)を算出する(ステップS106)。
制御装置1は、目標関節角度θt+1 ref、目標関節トルクτt+1および修正した確率に基づいて上記(式3)を用いて、時刻t+1における目標関節角度の推定値θ(ハット)t+1 ref及び目標関節トルクの推定値τ(ハット)t+1(次瞬間の指令値)を、パーティクル毎の関節角度及び関節トルクの期待値として算出する(ステップS107)。
制御装置1は、上記(8)において算出した目標関節角度の推定値θ(ハット)t+1 ref及び目標関節トルクの推定値τ(ハット)t+1と、角度センサ24により検出された各関節部の関節角度θと、に基づいて、各関節部22のコンプライアンス制御を行う(ステップS108)。
制御装置1は、各パーティクルの確率Pとなるように、確率密度分布pに従ってパーティクルをばらまき、時刻t+1でのパーティクルを更新する(ステップS109)。
以上、本実施形態1において、関節部22の関節角度及び関節トルクを含む隠れマルコフモデルと、角度センサ24及び力センサ26により検出された関節角度及び関節トルクに基づいて、目標関節角度をサンプリングする。サンプリングした目標関節角度に基づいて目標関節角速度及び目標関節角加速度を算出し、目標関節角度と、算出した目標関節角速度および目標関節角加速度と、目標反力と、に基づいて、逆動力学演算を行い目標関節トルクを算出する。現在時刻tの角度センサ値及びトルクセンサ値と、隠れマルコフモデルと、から、その目標関節角度および目標関節トルクになる確率を算出する。算出した確率による重みづけ平均により時刻t+1の目標関節角度及び目標関節トルクの期待値を算出し、この目標関節角度及び目標関節トルクの期待値を用いてロボットアーム2の関節部22を制御する。
これにより、ロボットアーム2の位置指令値と力指令値の整合性を取ることができる。したがって、隠れマルコフモデル構築時とロボットアーム制御時で、例えば、操作対象物の大きさ、形状が異なる場合や、ロボットアーム2と操作対象物の位置関係が異なる場合などでも、ロボットアーム2と操作対象物との間で、過大な力が発生する、あるいはロボットアームが操作対象物に接触できない状況を抑制できる。
実施形態2
本発明の実施形態2において、制御装置1は、エンドエフェクタ23の手先位置(位置情報の一具体例)および、エンドエフェクタ23の手先反力(力情報の一具体例)の時系列データに基づいて、隠れマルコフモデルを構築してもよい。この場合、制御装置1は、上記実施形態1における[prediction](1)〜(8)および[resampling]の関節角度および関節トルクを、夫々、手先位置および手先反力に置き換えて同様の処理を行う。
(学習処理)
制御装置1は、学習処理において、例えば、予め用意されたエンドエフェクタ23の手先位置および手先反力の時系列データを用いて学習を行い、Baum-Welch法によりleft-right隠れマルコフモデルを構築する。
(実行処理)
制御装置1は、所定時間毎に、以下の[prediction](1)〜(8)および[resampling]を繰り返す。
[prediction]
(1)制御装置1は、まず、現在時刻tにおける隠れマルコフモデルのノードqと、センサにより検出された現在時刻tにおける手先位置及び手先反力と、(パーティクル)を保持する。
(2)制御装置1は、隠れマルコフモデルのノード間の遷移確率aを用いて時刻t+1(次瞬間)におけるノードqt+1をサンプリングする。
(3)制御装置1は、サンプリングしたノードqt+1が有する手先位置の分布に基づいて、時刻t+1における目標手先位置(目標位置情報の一具体例)をサンプリングする。
(4)制御装置1は、サンプリングした目標手先位置にを1階微分して目標手先速度(目標速度情報の一具体例)を算出し、目標手先位置にを2階微分して目標手先加速度(目標加速度情報の一具体例)を算出する。
(5)制御装置1は、制御安定性を向上させるために、算出した目標手先加速度を修正する。本実施形態2において、制御装置1は、上記(5)による目標手先加速度の修正を行わなくても良い。
(6)制御装置1は、算出した目標手先位置、目標手先速度、および修正した目標手先加速度と、目標反力とを実現する、目標手先反力(目標力情報の一具体例)を算出する。
(7)制御装置1は、センサにより検出された現在時刻tでの手先位置及び手先反力と、隠れマルコフモデルと、に基づいて、目標手先位置および目標手先反力が隠れマルコフモデルから生成される確率Pを算出する。
制御装置1は、パーティクル毎に上記確率Pを算出する。ここで、制御装置1は、各パーティクルの確率Pの総和が1にするため、次の修正処理を行う。例えば、制御装置1は、各パーティクルの確率の総和を算出し、各パーティクルの確率を算出した総和で除算する。
制御装置1は、算出した確率Pを正規化して、確率密度分布pを算出する。
(8)制御装置1は、目標手先位置、目標手先反力および修正した確率に基づいて、時刻t+1における目標手先位置の推定値及び目標手先反力の推定値(次瞬間の指令値)を、パーティクル毎の手先位置及び手先反力の期待値として算出する。
制御装置1は、上記(8)において算出した目標手先位置の推定値及び目標手先反力の推定値と、センサにより検出された手先位置と、に基づいて、各関節部22のコンプライアンス制御を行う。
[resampling]
制御装置1は、各パーティクルの確率Pとなるように、確率密度分布pに従ってパーティクルをばらまき、時刻t+1でのパーティクルを更新する。
実施形態3
本発明の実施形態3において、制御装置1は、ロボットアーム2の各関節部22の関節角度および関節トルクと、エンドエフェクタ23の手先反力と、の時系列データに基づいて隠れマルコフモデルを構築する。
この場合、制御装置1は、上記実施形態1の[prediction](3)において、サンプリングしたノードqt+1が有する関節角度の分布に基づいて、時刻t+1における目標関節角度θt+1 ref及び目標反力をサンプリングする。
そして、制御装置1は、上記[prediction](3)において、算出した目標関節角度θt+1 ref、目標関節角速度θ(ドット)t+1 ref、および修正した目標関節角加速度θ(2ドット)t+1 refと、サンプリングした目標反力Ft+1と、に基づいて、上記運動方程式(逆動力学演算式)(式3)を用いて目標関節トルクτt+1を算出する。
これにより、隠れマルコフモデルに手先反力を含めることで、[prediction]の過程で自動的に目標反力を設定することができる。
本実施形態3において、上記[prediction](3)及び(6)以外の他の処理は、上記実施形態1と同一であるため、詳細な説明は省略する。
実施形態4
本発明の実施形態4において、制御装置1は、エンドエフェクタ23の手先速度(速度情報の一具体例)および、エンドエフェクタ23の手先反力、の時系列データに基づいて、隠れマルコフモデルを構築する。
(学習処理)
制御装置1は、学習処理において、例えば、予め用意されたエンドエフェクタ23の手先速度および手先反力の時系列データを用いて学習を行い、Baum-Welch法によりleft-right隠れマルコフモデルを構築する。
(実行処理)
[prediction]
(1)制御装置1は、まず、現在時刻tにおける隠れマルコフモデルのノードqと、センサにより検出された現在時刻tにおける手先速度及び手先反力と、(パーティクル)を保持する。
(2)制御装置1は、隠れマルコフモデルのノード間の遷移確率aを用いて時刻t+1(次瞬間)におけるノードqt+1をサンプリングする。
(3)制御装置1は、サンプリングしたノードqt+1が有する手先速度の分布に基づいて、時刻t+1における目標手先速度をサンプリングする。
(4)制御装置1は、サンプリングした目標手先速度を1階積分して目標手先位置を算出し、目標手先速度を1階微分して目標手先加速度を算出する。
上記(1)乃至(4)以外の処理は、上記実施形態2と同一であるため、詳細な説明は省略する。
実施形態5
本発明の実施形態5において、制御装置1は、ロボットアーム2の各関節部22の関節角速度および関節トルクの時系列データに基づいて、隠れマルコフモデルを構築する。
(学習処理)
制御装置1は、学習処理において、例えば、予め用意されたロボットアーム2の各関節部22の関節角速度および関節トルクの時系列データを用いて学習を行い、Baum-Welch法によりleft-right隠れマルコフモデルを構築する。
(実行処理)
[prediction]
(1)制御装置1は、まず、現在時刻tにおける隠れマルコフモデルのノードqと、センサにより検出された現在時刻tにおける関節角速度及び関節トルクと、(パーティクル)を保持する。
(2)制御装置1は、隠れマルコフモデルのノード間の遷移確率aを用いて時刻t+1(次瞬間)におけるノードqt+1をサンプリングする。
(3)制御装置1は、サンプリングしたノードqt+1が有する関節角速度の分布に基づいて、時刻t+1における目標関節角速度をサンプリングする。
(4)制御装置1は、サンプリングした目標関節角速度にを1階積分して目標関節角度を算出し、目標関節角速度にを1階微分して目標関節角加速度を算出する。
上記(1)乃至(4)以外の処理は、上記実施形態1と同一であるため、詳細な説明は省略する。
なお、本発明は上記実施の形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。
上記実施形態において、制御装置1は、隠れマルコフモデルを構築し、構築した隠れマルコフモデルを用いて制御を行っているが、これに限定されない。制御装置1は、各ノード間に遷移確率が設定され各ノードは位置又は速度情報と力情報の分布を有する、グラフィカルな統計モデルを構築し、この統計モデル用いて制御を行っても良い。制御装置1は、例えば、マルコフモデル、やCRF(Conditional Random Field)などのグラフィカルな統計モデルを構築してもよい。
上記実施形態において、制御装置1は、ロボットアーム2を制御しているが、これに限定されない。制御装置1は、例えば、複数の関節部を有するロボット脚部や、人の脚部に装着されその歩行を補助する歩行支援ロボットを制御してよく、複数の関節部を有するロボットの各部を制御できる。さらに、制御装置1は、ロボットの制御だけでなく、工作機械(力制御を行う加工機械における人の加工方法の模倣等)、車両などの自動運転(人のハンドル操作の模倣等)、モータによる可動部分を含む装置、などを制御してもよい。
本発明は、例えば、図5に示す処理を、CPU1aにコンピュータプログラムを実行させることにより実現することも可能である。
プログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer readable medium)を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば光磁気ディスク)、CD−ROM(Read Only Memory)、CD−R、CD−R/W、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(random access memory))を含む。
プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。
1 制御装置、2 ロボットアーム、21 リンク、22 関節部、23 エンドエフェクタ、24 角度センサ、25 アクチュエータ、26 力センサ

Claims (1)

  1. 動作する可動部の位置又は速度情報と該可動部に対する力情報とに基づき構築したモデルであって、各ノード間の遷移確率が設定され、該各ノードは前記位置又は速度情報と力情報の分布を有する統計モデルと、時刻t(tは自然数)における前記可動部の位置又は速度情報と力情報と、に基づいて、時刻t+1における前記可動部の目標位置情報又は目標速度情報をサンプリングするステップと、
    前記サンプリングした目標位置情報又は目標速度情報に基づいて、時刻t+1における前記可動部の目標位置情報又は目標速度情報と、目標加速度情報と、を算出するステップと、
    前記算出した時刻t+1における目標位置情報、目標速度情報及び目標加速度情報に基づいて、逆動力学演算を行って、時刻t+1における前記可動部の目標力情報を算出するステップと、
    前記時刻tにおける位置情報及び力情報と、前記統計モデルと、に基づいて、前記算出した時刻t+1における目標位置情報及び目標力情報が前記統計モデルから生成される確率を算出するステップと、
    前記算出した時刻t+1における目標位置情報及び目標力情報と、前記算出した確率と、に基づいて、前記時刻t+1における目標位置情報及び目標力情報の期待値を算出するステップと、
    前記算出した目標位置情報及び目標力情報の期待値に基づいて、前記可動部を制御するステップと、
    を含む、ことを特徴とする制御方法。
JP2016058370A 2016-03-23 2016-03-23 制御方法 Expired - Fee Related JP6567998B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016058370A JP6567998B2 (ja) 2016-03-23 2016-03-23 制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016058370A JP6567998B2 (ja) 2016-03-23 2016-03-23 制御方法

Publications (2)

Publication Number Publication Date
JP2017170553A true JP2017170553A (ja) 2017-09-28
JP6567998B2 JP6567998B2 (ja) 2019-08-28

Family

ID=59971651

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016058370A Expired - Fee Related JP6567998B2 (ja) 2016-03-23 2016-03-23 制御方法

Country Status (1)

Country Link
JP (1) JP6567998B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019225747A1 (ja) * 2018-05-25 2019-11-28 川崎重工業株式会社 ロボットシステム及びロボット制御方法
WO2019225746A1 (ja) * 2018-05-25 2019-11-28 川崎重工業株式会社 ロボットシステム及び追加学習方法
JP2021084188A (ja) * 2019-11-28 2021-06-03 株式会社国際電気通信基礎技術研究所 制御システム
CN113858189A (zh) * 2020-06-30 2021-12-31 精工爱普生株式会社 机器人的控制方法及机器人系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05111889A (ja) * 1991-10-23 1993-05-07 Fanuc Ltd 制御方式可変型ロボツト制御方式
JPH05150836A (ja) * 1991-11-26 1993-06-18 Kawasaki Heavy Ind Ltd ロボツトの制御装置
JP2009066693A (ja) * 2007-09-12 2009-04-02 Toyota Motor Corp 運動データの生成装置、方法、及びロボット装置
JP2012071358A (ja) * 2010-09-27 2012-04-12 Honda Motor Co Ltd ロボットおよびその行動制御システム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05111889A (ja) * 1991-10-23 1993-05-07 Fanuc Ltd 制御方式可変型ロボツト制御方式
JPH05150836A (ja) * 1991-11-26 1993-06-18 Kawasaki Heavy Ind Ltd ロボツトの制御装置
JP2009066693A (ja) * 2007-09-12 2009-04-02 Toyota Motor Corp 運動データの生成装置、方法、及びロボット装置
JP2012071358A (ja) * 2010-09-27 2012-04-12 Honda Motor Co Ltd ロボットおよびその行動制御システム

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019225747A1 (ja) * 2018-05-25 2019-11-28 川崎重工業株式会社 ロボットシステム及びロボット制御方法
JP2019202404A (ja) * 2018-05-25 2019-11-28 川崎重工業株式会社 ロボットシステム及びロボット制御方法
WO2019225746A1 (ja) * 2018-05-25 2019-11-28 川崎重工業株式会社 ロボットシステム及び追加学習方法
JPWO2019225746A1 (ja) * 2018-05-25 2021-06-10 川崎重工業株式会社 ロボットシステム及び追加学習方法
JP7039389B2 (ja) 2018-05-25 2022-03-22 川崎重工業株式会社 ロボットシステム及びロボット制御方法
JP7167141B2 (ja) 2018-05-25 2022-11-08 川崎重工業株式会社 ロボットシステム及び追加学習方法
JP2021084188A (ja) * 2019-11-28 2021-06-03 株式会社国際電気通信基礎技術研究所 制御システム
JP7391635B2 (ja) 2019-11-28 2023-12-05 株式会社国際電気通信基礎技術研究所 制御システム
CN113858189A (zh) * 2020-06-30 2021-12-31 精工爱普生株式会社 机器人的控制方法及机器人系统
CN113858189B (zh) * 2020-06-30 2024-01-09 精工爱普生株式会社 机器人的控制方法及机器人系统

Also Published As

Publication number Publication date
JP6567998B2 (ja) 2019-08-28

Similar Documents

Publication Publication Date Title
Sheng et al. An integrated framework for human–robot collaborative manipulation
JP6567998B2 (ja) 制御方法
CN112428278B (zh) 机械臂的控制方法、装置及人机协同模型的训练方法
Rozo et al. Learning force and position constraints in human-robot cooperative transportation
JP6170285B2 (ja) マニピュレータ及びその経路生成方法
JP7117237B2 (ja) ロボット制御装置、ロボットシステム及びロボット制御方法
CN112638596B (zh) 自主学习型机器人装置以及自主学习型机器人装置的动作生成方法
JP7035309B2 (ja) マスタスレーブシステム
JP7295421B2 (ja) 制御装置及び制御方法
JP2010207986A (ja) ロボット装置及びその制御方法
CN110154024B (zh) 一种基于长短期记忆神经网络增量模型的装配控制方法
US11806872B2 (en) Device and method for controlling a robotic device
CN114516060A (zh) 用于控制机器人装置的设备和方法
Nemec et al. Speed adaptation for self-improvement of skills learned from user demonstrations
Ben Amor et al. Kinesthetic bootstrapping: Teaching motor skills to humanoid robots through physical interaction
CN115781685A (zh) 一种基于强化学习的高精度机械臂控制方法及系统
JP7210201B2 (ja) 情報処理方法、プログラム、記録媒体、情報処理装置、ロボットシステム、物品の製造方法
Gäbert et al. Generation of human-like arm motions using sampling-based motion planning
JP2023526211A (ja) 分散型ロボット実証学習
JP7263987B2 (ja) 制御装置、制御方法、及び制御プログラム
TWI781708B (zh) 學習裝置、學習方法、學習程式、控制裝置、控制方法及控制程式
Sugimoto et al. Trajectory-model-based reinforcement learning: Application to bimanual humanoid motor learning with a closed-chain constraint
JP4222338B2 (ja) 適応型ビジュアルフィードバック制御方法
JPH05337860A (ja) ロボットハンドの教示装置およびロボットハンド
JP2008305064A (ja) 学習型制御装置および該方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180509

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190320

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190409

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190605

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190709

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190801

R150 Certificate of patent or registration of utility model

Ref document number: 6567998

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees