JP7054130B2 - 運動学習支援装置および運動学習支援方法 - Google Patents

運動学習支援装置および運動学習支援方法 Download PDF

Info

Publication number
JP7054130B2
JP7054130B2 JP2017148882A JP2017148882A JP7054130B2 JP 7054130 B2 JP7054130 B2 JP 7054130B2 JP 2017148882 A JP2017148882 A JP 2017148882A JP 2017148882 A JP2017148882 A JP 2017148882A JP 7054130 B2 JP7054130 B2 JP 7054130B2
Authority
JP
Japan
Prior art keywords
torque
user
joint
control
assist
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017148882A
Other languages
English (en)
Other versions
JP2019025104A (ja
Inventor
達也 寺前
淳 森本
智之 野田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ATR Advanced Telecommunications Research Institute International
Original Assignee
ATR Advanced Telecommunications Research Institute International
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ATR Advanced Telecommunications Research Institute International filed Critical ATR Advanced Telecommunications Research Institute International
Priority to JP2017148882A priority Critical patent/JP7054130B2/ja
Publication of JP2019025104A publication Critical patent/JP2019025104A/ja
Application granted granted Critical
Publication of JP7054130B2 publication Critical patent/JP7054130B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Rehabilitation Tools (AREA)

Description

本発明は、ユーザの運動学習をアシストするための運動学習支援装置の制御の技術に関するものである。
日本をはじめ多くの国で少子高齢化社会が問題になる中、ロボティクス技術を応用したアシスト機器への要望が高まっている。一方、バランスや歩行が可能なロボットが開発されてきている。例えば、運動に必要な作用力を空間上の任意の複数接触点に最適に配分し,ヒトと同じように各関節のトルクを発生できるロボットが存在する(特許文献1参照)。
また、近年では、下肢・体幹運動の支援をめざした外骨格型ロボットのようなリハビリテーションを支援するロボットの開発をますます要求することとなってきている。たとえば、外骨格型ロボットは、患者の自立生活を促進するリハビリテーションにおいて、脳卒中の患者などのために使用される(特許文献2を参照)。
たとえば、世界保健機構によれば、世界的に、1500万人が、毎年、脳卒中を発症すると報告しており、さらに、500万人の脳卒中生存者が、後遺症に苦しんでいるといわれる。
すなわち、アシストロボットやコミュニケーションロボットなどの人間と同じ環境において共存し、互いにインタラクションを行うロボットへの注目が高まっている。そのような環境では、高精度の制御が可能であり、かつ工場用マニピュレータなどの重く、硬い機構を持つロボットではなく、軽量かつ高いバックドライバビリティを有するロボットが求められている。しかし、それらを同時に実現する汎用のアクチュエータの開発およびそれを適切に制御することは一般に困難である。
このようなリハビリテーションの支援ロボットのようなアシストロボットやコミュニケーションロボットにおいて、ロボットのアシスト力を制御するために、ユーザの筋電位を利用する技術(特許文献3を参照)が報告されている。また、このようなアシストロボットの駆動のためのアクチュエーション装置として、人工筋と電動モータとのハイブリッドアクチュエータを使用し、その制御のために、いわゆるモデル予測制御を利用する技術についても、報告がある(特許文献4を参照)。
ここで、アシストアズニーディッド(AAN:Assist-As-Needed)コントロールは、ロボット・システムの使用により、能動的にアシスト運動を実施する1つの方法であり、アシストアズニーディッドコントロールが脳卒中患者の回復に役立つことを示した報告もある(非特許文献1を参照)。
「アシストアズニーディッド」とは、ユーザが自発的に学習できるよう学習状態を推定して支援量を調整する支援システムの原理であり、より特定的には、ユーザの運動が目標に近づくほど、支援量を減少させるという原理である。すなわち、たとえば、予め用意された運動軌道をユーザに学習させるような場合、人は、支援に依存し易く、過度な支援は、人の内在的なフィードバックをかえって阻害し、運動スキル学習を妨げてしまう、という知見に基づくものである。
従来のアシストアズニーディッドアプローチの1つの方法は、サーボ制御によるものである(非特許文献2、非特許文献3を参照)。
しかしながら、人体の条件は、その都度、大きく異なるので、サーボ制御において、適切な利得パラメーターを見つけて、所望の軌道を適切に追跡することは、特に患者に対しては困難である。他方で、アシストロボットが物理的に人間のユーザと相互作用するので、正確な運動軌道のトラッキングのために、あまり高い利得のサーボ制御を使用することができない。高い利得のサーボ制御は、被験者の随意運動を妨げてしまうことになる。
従来のアシストアズニーディッドアプローチの他の方法としては、適応制御アプローチがあり、ユーザの運動のモデルは反復の学習によって特定される。アシストロボットは、運動支援のために必要なフィード・フォワード・トルクを学習し、トラッキング制御システムに対して、サーボ利得は小さくなりえる(たとえば、非特許文献4を参照)。
しかしながら、適応制御アプローチの欠点は、適応制御法は、ユーザの運動のモデルのパラメーターを特定するために反復的に学習することが要求されるということである。したがって、適応制御法の使用は、使用前の状況からユーザがタスクを反復的に実施できることが前提となっているため、リハビリテーションの臨床の現場には、あまり実用的でない可能性がある。
以上より、従来のアシストアズニーディッドコントローラーを設計する難しさは、主としてユーザのトルク出力を直接には観測または評価していない、ということが原因であると考えられる。さらに、直接ユーザのトルク出力を観測できたとしても、ユーザの発揮するトルクが変化する状況を事前に予測し対処する制御はできない。
ユーザのトルク出力を予測していないので、サーボ制御アプローチにおいては事後的に対処することになる。そのため、制御の安定性を確保するためには、保守的な低い利得のフィードバックを使用するという制御戦略を採用することになる。一方で、適応制御アプローチにおいては、動作モデルパラメーターを特定するために、学習の試行を反復することが必要になるという問題がある。
したがって、ユーザが生成するトルク出力を明示的に計測して抽出し、予測することは非常に有用であり、そのような抽出のための1つのアプローチは状態推定方法を用いることである(非特許文献5を参照)。
また、アシストアズニーディッドフレームワークにおいて、人間の関節トルクを、カルマンフィルターを使用して、明示的に評価した技術についての報告もあるが、ユーザのトルク出力を角度センサから評価したに過ぎない(非特許文献6を参照)。
WO2007/139135号公報
特開2012-045194号公報
特開2014-155998号公報
特開2016-053824号公報
Kahn, Leonard E et al. "Robot-Assisted Reaching Exercise Promotes Arm Movement Recovery in Chronic Hemiparetic Stroke:Randomized Controlled Pilot Study"Journal of NeuroEngineering and Rehabilitation 3, 12 2006.
H. I. KrebsJ.J. PalazzoloL. DipietroM. FerraroJ. KrolK. Rannekleiv B.T.VolpeN. Hogan, "Rehabilitation Robotics:Performance-Based Progressive Robot-Assisted Therapy," Autonomous Robots, July 2003, Volume 15, Issue 1, pp 7-20, 2003.
Guan De Lee, Wei-Wen Wang, Kai-Wen Lee, Sheng-Yen Lin, Li-Chen Fu, Jin-Shin Lai, Wen-Shiang Chen, Jer-Junn Luh, "Arm exoskeleton rehabilitation robot with assistive system for patient after stroke," 12th International Conference on Control, Automation and Systems, 1943-1948, 2012.
A. U. Pehlivan, F. Sergi and M. K. O’Malley, A Subject-Adaptive Controller for Wrist Robotic Rehabilitation, IEEE/ASME Transactions on Mechatronics, Vol. 20, Issue: 3, pp. 1338-1350, 2014.
J. Furukawa, T. Noda, T. Teramae and J. Morimoto, Estimating Joint Movements from Observed EMG Signals with Multiple Electrodes under Sensor Failure Situations Toward Safe Assistive Robot Control, Proceeding of 2015 IEEE International Conference on Robotics and Automation, 2015.
A. U. Pehlivan, D. P. Losey and M. K. O’Malley,Minimal Assist-as-Needed Controller for Upper Limb Robotic Rehabilitation, IEEE TRANSACTIONS ON ROBOTICS, VOL. 32, NO. 1, pp. 113-124, 2016.
上述したような方法では、状態変化の偏差は、コマンドによって生成されたロボット側のトルクによって引き起こされないものであり、ユーザに生成されたトルクによって引き起こされるものとして、事後的にユーザにより生成されるトルクが評価される。
しかしながら、このアプローチは、単にロボットの関節状態の情報を使用し、ユーザの運動モデルを仮定していないので、ユーザの将来の運動を予測することができず、したがってユーザの運動変化に事前に対処する予測制御には使用することができない。
したがって、この方法はフィードバック制御アプローチと考えられ、したがって、この場合も、やはり注意深く利得パラメーターを、タスクやアシスト条件ごとに安定性と誤差のトレードオフを考慮しつつ、設定することが要求される。
さらに、ロボットにより発生するトルクは、アクチュエータの制御指令に対して、若干の遅れが発生するため、将来的に生成されるユーザの発揮するトルクを予測することで、前もってロボットが制御入力を適切な負荷となるように調整・変更することが要求される。
本発明は、上記のような問題点を解決するためになされたものであって、その目的は、アシストアズニーディッドの原理に基づく運動学習支援においてアシスト力を生成するにあたり、将来的に生成されうるユーザが発揮するトルクを予測しつつ、目標運動の達成を適切に支援することが可能なアシスト力を生成可能な運動学習支援装置および運動学習支援方法を提供することである。このように、アシストアズニーディッドアプローチにおいては、人が全く力を発揮していなくても、所望の軌道や所望の到達点への最適な運動を経験することができ、人が力を発揮した場合には、その力を有効に利用しつつ、足りない分の力もしくは過剰な力を修正する力を、アシストロボットが適切に提供しつつ、所望の軌道もしくは到達点へ到達する最適な運動を、安定かつ安全に提供することが目的である。
この発明の他の目的は、事前に過度な負担をユーザに与えることなく、アシストアズニーディッドの原理に基づく適切な運動負荷の運動学習支援が可能な運動学習支援装置および運動学習支援方法を提供することである。
この発明の1つの局面に従うと、ユーザの関節の運動の運動学習をアシストするための運動学習支援装置であって、アシストを受けるユーザの関節部に装着され、関節部へのアシストトルクを生成するアクチュエータ手段を有する能動関節と、ユーザの関節の運動に対するユーザの中枢からの指令に基づいて生成される生体信号を検出するための検知装置と、ユーザの学習対象となる運動の目標軌道情報を格納する記憶装置と、能動関節が発生するアシストトルクを制御するための制御信号を生成する制御部とを備え、制御部は、生体信号に基づいて、検出時から所定の時間経過した時点においてユーザが自身の関節により生成するユーザトルクを推定し、目標軌道情報に対応する目標軌道の運動を生成するために不足している不足関節トルクを導出し、不足関節トルクをアシストトルクとして、関節部が目標軌道を運動するように、ユーザが発揮するトルクのモデルを事前に取得したデータに従って最適化し、モデル予測制御により生成した制御信号で能動関節を制御する。
好ましくは、制御部は、生体信号に基づいて、検出時から所定の時間経過した時点のユーザが自身の関節により生成するユーザトルクを推定するトルク推定手段と、推定されたユーザトルクとアシストトルクとにより、能動関節が目標軌道を運動するように、制御信号によりアクチュエータ手段を制御するためのモデル予測制御手段とを含み、モデル予測制御手段は、推定されたユーザトルクの推定情報を用いて、アクチュエータ手段のモデル予測制御のための価値関数を最小化するように、制御信号を算出する。
好ましくは、能動関節の関節角度を検知するための角度検知手段をさらに備え、目標軌道は、関節角度および関節角度の角速度を含む。
好ましくは、モデル予測制御手段は、所定の時間に相当する期間を予測ホライズンとして、制御信号を算出し、価値関数は、予測ホライズンの期間におけるコスト関数の積算値であり、コスト関数は、現在の能動関節の状態と目標軌道をとった場合の能動関節の状態との差の絶対値に応じて単調に増加する項と、能動関節の出力するトルクの絶対値に応じて単調に増加する項との重み付き線形和である。
好ましくは、記憶装置は、トルク推定手段によるユーザトルクの推定値を所定のタイムステップごとに推定情報として格納し、モデル予測制御手段は、記憶装置に格納された推定情報を用いて、アクチュエータ手段のモデル予測制御のための価値関数を最小化するように、制御信号を算出する。
好ましくは、能動関節は、ユーザの四肢のいずれかに装着された外骨格型ロボットの能動関節である。
好ましくは、生体信号は、ユーザの関節を駆動する筋肉の体表面から取得される筋電信号であり、トルク推定手段は、筋電信号に対する線形モデルを用いて、ユーザトルクを推定する。
この発明の他の局面に従うと、ユーザの関節の運動の運動学習をアシストするための運動学習支援装置を用いた運動学習支援方法であって、運動学習支援装置は、アシストを受けるユーザの関節部に装着され、関節部へのアシストトルクを生成するアクチュエータ手段を有する能動関節と、ユーザの関節の運動に対するユーザの中枢からの指令に関わる生体信号を検出するための検知装置と、ユーザの学習対象となる運動の目標軌道情報を格納する記憶装置と、能動関節が発生するアシストトルクを制御するための制御信号を生成する制御部とを含み、制御部が、生体信号に基づいて、検出時から所定の時間経過した時点のユーザが自身の関節により生成するユーザトルクを推定するステップと、制御部が、推定されたユーザトルクとアシストトルクとにより、関節部目標軌道情報に対応する目標軌道を運動するように、制御信号によりアクチュエータ手段を制御するステップとを備え、アクチュエータ手段を制御するステップは、推定されたユーザトルクにより、目標軌道の運動を生成するために不足している不足関節トルクを導出し、不足関節トルクをアシストトルクとして、関節部が目標軌道を運動するように、ユーザが発揮するトルクのモデルを事前に取得したデータに従って最適化し、モデル予測制御により生成した制御信号で能動関節を制御するステップを含む。
本発明の運動学習支援装置および運動学習支援方法によれば、アシストアズニーディッドの原理に基づく運動学習支援においてアシスト力を生成するにあたり、ロボットが振動するような不安定性を解消しつつ、ユーザが発揮するトルクが異なる条件下でも、目標運動の達成を適切に支援することが可能である。
本発明の運動学習支援装置および運動学習支援方法によれば、事前に過度な負担をユーザに与えることなく、アシストアズニーディッドの原理に基づく運動学習支援が可能である。
本実施の形態における運動学習支援装置1000の構成を説明するための概念図である。 図1に示したような1自由度分の動作を行うアシストロボット300のアクチュエータシステムを制御する構成を説明するための機能ブロック図である。 EMG信号の計測における電極配置とEMG信号によるトルク推定の処理を説明するための図である。 予測インターバルの概念を説明するための図である。 モデル予測制御の手続を説明するための概念図である。 実験に使用した肘関節トラッキング・タスクを説明するための図である。 3つの異なる実験条件でのロボットと人間の被験者の間のトルク分配を示す図である。 3つの異なる実験条件において、ロボットおよび人間の被験者の実際の関節角度の軌道およびトルク特性を示す図である。 6人の被験者について、異なる実験条件でのロボットと人間の被験者の間のトルク分配を示す図である。 本実施の形態の制御と筋電信号を用いないアシストアズニーディッド制御との比較結果を示す図である。 本実施の形態の制御方法による複雑な軌道トラッキング・タスクの評価結果を示す図である。 他の制御方法による複雑な軌道トラッキング・タスクの評価結果を示す図である。
以下、本発明の実施の形態の運動学習支援装置に対する駆動システムの構成について、図に従って説明する。なお、以下の実施の形態において、同じ符号を付した構成要素および処理工程は、同一または相当するものであり、必要でない場合は、その説明は繰り返さない。
また、運動学習支援装置で使用されるアシストトルクを生成するための機械構造物としては、外骨格型ロボットなどに使用される関節構造を例とし、このような関節構造を駆動するためのアクチュエータとしては、一例として、「電動モータ」を例として説明する。
ただし、機械的構造物としては、このようなものに必ずしも限定されず、また、駆動装置としても他のアクチェータであってもよい。
以下では、運動学習を行うユーザの関節の運動としては、前腕の運動を例にとって説明するが、運動学習を行うユーザの関節としては、ユーザの四肢のいずれであってもよく、より一般的には、ユーザが随意的に動かすことが可能な関節であれば、他の関節であってもよい。
また、ユーザ自身が生成するトルクを予測するために計測する生体信号としては、運動学習の対象となるユーザの関節を駆動する筋肉の体表側に装着された電極から取得される筋電信号を例として説明する。
そこで、以下の実施の形態での説明では、一例として、リハビリテーションのための物理的な人間・ロボット相互作用を設計し、新しいアシストアズニーディッド(AAN:Assist-as-Needed)モデル予測制御(MPC:Model Predictive Control)アプローチに基づいた制御を筋電計測(EMG:Electromyography)を用いた最適制御フレームワークとして説明する。
したがって、以下の実施の形態では、アシストトルクの制御にあたり、運動学習支援装置は、測定されたEMG信号からユーザの関節トルクを評価し、次に、モデル予測制御(MPC)法を用いて、評価された関節トルクを考慮することにより、目標運動を生成するために不足している関節トルクを導出する。
ただし、生体信号としては、このような筋電信号には、必ずしも限定されるものではなく、たとえば、脳活動を外部から非侵襲的に計測した信号であってもよい。
以下に説明するように、アシストアズニーディッド制御のフレームワークでは、アシスト力を生成するロボットは、単に、目標運動を生成するのにユーザ自身の生成するトルクでは不足している分のトルクを生成するものである。
[実施の形態]
図1は、本実施の形態における運動学習支援装置1000の構成を説明するための概念図である。ここでは、運動学習支援装置1000は、一例として、ユーザ2の肘関節の動きに対するリハビリテーションを支援するものとして、説明する。
以下に説明するように、運動学習支援装置1000は、アシストアズニーディッドの原理に基づきユーザの関節の運動の運動学習をアシストする。アシストロボット300は、ユーザの関節部に装着され、関節部へのアシストトルクを生成する。コンピュータ20は、筋電信号に基づいて、検出時から所定の時間経過した時点のユーザが自身の関節により生成すると推定されたユーザトルクと上記アシストトルクとにより、関節部が目標軌道を運動するように、ユーザが発揮するトルクのモデルを事前に取得したデータに従って最適化した上で、モデル予測制御によりアシストロボット300のアクチュエータを制御する。
図1(a)に示されるように、電極102により測定された筋電信号から、ユーザ2によって現実に肘を駆動するためのトルクが出力される前に、関節トルク推定部202が、関節トルク出力τhを推定する。以下では、推定された関節トルク出力を、τhハット(文字Xの頭部に^が付されたものを、「Xハット」と表記する)と呼ぶことにする。
したがって、目標となるリハビリテーション動作を実行するのに必要で、アシストロボット300により生成される付加的な関節トルクτrを正確に導出するのために、モデル予測制御部204は、目標軌道の情報と、関節トルク推定部202からの出力に基づいて、モデル予測制御を実行する。後述するように、推定される関節トルクは、計測時点よりも所定時間だけ将来に現実に発生される関節トルクに対応するものであるため、モデル予測制御を用いることは、ユーザ2によるトルク出力を明示的に考慮するのにふさわしい。
その結果、付加的なトルク入力が目標動作を実行するのに必要な場合のみ、ロボットが被験者の動作をアシストするという、アシストアズニーディッドな制御を実行することが可能となる。
したがって、重要なポイントは、ユーザ2が、ゼロに近いトルクを生成するような場合でも、モデル予測制御部204は、目標運動の軌道を追跡するための制御信号をアシストロボット300に対して出力するので、ユーザ2は、所望の軌道に従う運動を生成できるということである。
そして、ユーザ2の腕が、アシストロボット300の外骨格ロボットにより動かされたとしても、ユーザ2に体知覚の入力があると、ユーザ2の神経系の回復を増進するということが知られている。
なお、ここで、「目標軌道」とは、i)ユーザ2自身が任意で与える、ii)理学療法士などの専門家が外部から与える、iii)最適制御手法によって得られる最適軌道で与える、などの方法で設定できる。最適制御手法では最終到達点からコストを最小化する最適軌道を設定することができる。すなわち、最適制御手法では人の筋活動レベルを任意に重みづけして、患者は発揮できる筋活動レベルの最大値を考慮しつつも、例えば訓練したい特定の筋を積極的に活用する軌道を設定することができる。
このようにすることで、人とロボットのインタラクションを考慮して予測された未来の位置・速度・加速度・力に基づきユーザの発揮するトルクを予測し、ロボットが発揮すべきトルク(制御量)を生成することができる。その結果、未来に起こるであろう人とロボットのインタラクションフォース(ユーザの発揮するトルク)を予測し、制御量に反映することで追従性能の向上、振動現象・運動の阻害が減少し、親和性を向上させることができる。
図1(b)は、アシストロボット300のアーム部の外観を示す図である。アシストロボット300のアーム350の先端には、この図では、重り302が付加されている。
腕帯304により、アーム350がユーザ2の前腕に装着され、電動モータ312によりアーム350が駆動される。
図2は、図1に示したような1自由度分の動作を行うアシストロボット300のアクチュエータシステムを制御する構成を説明するための機能ブロック図である。
外部制御装置20に接続されたマルチファンクションボード10は、外部制御装置20からのコマンドに応じて、アシストロボット300を制御する。具体的には、マルチファンクションボード10は、電動モータ312の出力トルクを制御するためのモータドライバ311を制御するとともに、マルチファンクションボード10は、関節角度θを検知する角度エンコーダ324および電極102からの筋電信号を読み取り外部制御装置20に対して通信するインタフェースとしても機能する。また、後述するような電極102からの信号に対するフィルタリング処理や増幅処理を、マルチファンクションボード10が実行する構成とすることができる。
ここで、外部制御装置20としては、たとえば、汎用のパーソナルコンピュータを用いることが可能である。外部制御装置20は、後述するようなモデル予測制御のための演算処理を実行する。
角度エンコーダ324は、たとえば、直交エンコーダを使用することが可能である。
電動モータ312からの駆動力は、プーリー付回転関節310を介して、アシストロボットの腕(または脚)350にトルクτを与える。
なお、上記の説明では、アシストロボット300のモータドライバ311の制御や、センサからの入力信号の読取などを、マルチファンクションボード10を介して実行する構成として説明しているが、必ずしもこのような構成に限定されるものではない。たとえば、外部制御装置20を専用コンピュータとして、マルチファンクションボード10の機能や、モデル予測制御の演算処理などを1つのハードウェアとして統合したものであってもよい。
また、電動モータ312からの駆動力の伝達機構としても、プーリーによる伝達に限られるものではない。
外部制御装置20では、インターフェース部(I/F部)220を介して、マルチファンクションボード10と通信し、記憶装置210との間でデータの授受を実行する。外部制御装置20中の演算装置200は、記憶装置210に格納された図示しないプログラムに基づき、ユーザの生成する関節トルクの推定を行う関節トルク推定部202の機能およびモータ312の生成するトルクを制御するためのモデル予測制御部204の機能を実行する。
記憶装置210は、ランダムアクセス可能な不揮発性記憶装置であればよく、たとえば、ハードディスクドライブでもよいし、ソリッドステートドライブ(SSD)であってもよい。また、演算装置200は、たとえば、中央演算装置(CPU:Central Processing Unit)であってもよく、図示しない揮発性のランダムアクセスメモリに、上記プログラムをロードしたり、ワーキングメモリとして使用したりして、上記機能を実行する構成であってもよい。
関節トルク推定部202が推定するユーザの関節トルクは、所定時間(予測インターバル)後にユーザが生成すると推定されるトルクの値であり、筋電を計測するサンプリングタイムごと(またはその所定の自然数倍ごと)に推定した値を、関節トルク推定部202は、記憶装置210に、推定トルク情報として格納する。
モデル予測制御部204は、記憶装置210に格納された運動学習のための目標軌道を特定するための目標軌道情報と推定トルク情報とに基づいて、モデル予測制御により、アシストロボット300により生成するべきトルクの値を算出し、モータドライバ311は、これに応じて、モータ312を駆動する。
(モデル予測制御)
以下では、外部制御装置20の実行するモデル予測制御について、さらに詳しく説明する。
アシストアズニーディッドアプローチでのアシストロボットへの制御入力は、次のように表わすことができる。
Figure 0007054130000001
ここで、τrは、ロボット・トルクを表し、τdは、所望の軌道で運動するための所望のトルクを表し、τhは、人間によって生成されたトルクを表す。
(EMG信号の計測とトルク推定)
図3は、EMG信号の計測における電極配置とEMG信号によるトルク推定の処理を説明するための図である。
まず、図3(a)に示すように、前腕の運動時にユーザが生成する肘関節のトルクを推定するにあたり、二頭筋(biceps)と三頭筋(triceps)の筋肉活動を測定するために、4つのEMG電極を使用する。
各EMG電極からの信号を以下のように表す。
Figure 0007054130000002
厳密には、トルク評価モデルは、ユーザの体の特性およびEMG測定条件に依存する。
したがって、以下の文献に記載されるようにパラメーターを較正する必要がある。
公知文献1:J. Furukawa, T. Noda, T. Teramae and J. Morimoto, Estimating Joint Movements from Observed EMG Signals with Multiple Electrodes under Sensor Failure Situations Toward Safe Assistive Robot Control, Proceeding of 2015 IEEE International Conference on Robotics and Automation, 2015.
公知文献2:K. Kiguchi and Y. Hayashi, An EMG-Based Control for an Upper-Limb Power-Assist Exoskeleton Robot, in IEEE Transactions on Systems, Man, and Cybernetics, Part B (Cybernetics), vol. 42, no. 4, pp. 1064-1071, Aug. 2012.
また、上述した特許文献3にも、筋電位から筋張力へ変換するための較正処理や、信号変換について開示がある。そこで、以下では、筋電位から筋張力への変換について、簡単にまとめる。
(EMG測定と生成トルクへの変換)
特に限定されないが、フロントエンドのアンプで、測定されたEMG信号は、たとえば、10倍に増幅され、主アンプで500倍に増幅される。
また、このようにして増幅されたEMG信号は、全波整流され、たとえば、2.6Hzの遮断周波数でローパスフィルタリングされる。
(筋電信号による関節トルク評価)
上述のとおり測定されたEMG信号は、マルチファンクションボード10において全波整流およびローパス・フィルタリングによる前処理が施され、関節トルク推定部202は、時間ステップtにおいて処理されたEMG信号を使用して、時間ステップt+kにおける関節トルクを評価する。ここで、kは上述した予測インターバルに相当する時間ステップである。
ここでは、上述したK. Kiguchiらによる文献(公知文献2)に開示された線形のトルク評価モデルにより、筋電信号をトルクに変換するものとして説明する。
Figure 0007054130000003
ここで、Aとbは線形のパラメーターである。
一般に、EMG信号は筋肉張力の出力のおよそ0.2秒前に観察されることが知られている。そこで、以下では、一例として、上述した予測インターバルは、0.2秒であるものとして説明することにする。
たとえば、ロボット制御周波数を200Hzとすると、予測インターバルに相当する予測時間ステップk=40と設定することになる。
図3(b)は、このようなEMG信号の計測と、生成トルクの推定との関係を示すタイミングチャートである。
フィルタ処理後のEMG信号は、その0.2秒後に、被験者が生成するトルクであるものとして、上述した線形評価モデルにより推定される。推定されたトルクは、後述するモデル予制御に使用される。
上述した線形評価モデルについては、以下の式(1-3)の目的関数に対して最小自乗評価法を使用することにより、線形のパラメーターを測定することができる。
Figure 0007054130000004
ここで、τt hは逆動力学モデルから導かれる人間のトルクであり、たとえば、上述したJ. Furukawaらの文献(公知文献1)に開示がある。また、τt hハットは、式(1-2)により推定された人間の生成するトルクである。
後述する各実験の前に、線形のパラメーターを較正した。また、測定プロセスでは、被験者は、ロボットの先端に0.5kgの重りをつけた場合と、つけない場合とで、2回、サイン関数の運動を行った。線形のパラメーターを見出すために、40秒間の測定データを使用した。
図4は、予測インターバルの概念を説明するための図である。
図4に示すように、筋電位を計測するサンプリング時間dtごとに、ユーザの生成するトルクの推定を行う場合、関節トルク推定部202は、サンプリング時間ごとに予測インターバルk後に出力される推定トルク値を算出し、推定トルク情報として、記憶装置210に格納する。
(最適制御問題)
図5は、モデル予測制御の手続を説明するための概念図である。
実ロボットの制御では、ロボットやアクチュエータとその数理モデルとの間にモデル化誤差が存在する。さらに、人がロボットとインタラクションを行う場合には、ロボットと人との物理的な接触による外乱が発生する。このような状況下では、オフラインにおいて求められた最適入力列を用いても、目的とする運動を実現することは難しい。
また、このようなアクチュエータとロボットから構成されるシステムは、一般に非線形システムとなり、非線形システムに対する最適制御の方法として、「非線形モデル予測制御(Nonlinear Model Predictive Control)」と呼ばれる手法が提案されている。(なお、以下、「線形」および「非線形」の場合を総称して、「モデル予測制御」と呼ぶ。)
モデル予測制御では、まず、図5(a)に示すように、現在時刻tから有限時間先の(t+T)まで(この期間を「予測ホライズン」と呼ぶ)において、系に対する価値関数を最小化するように、最適な制御入力列とその予測値を求める。そして得られた最適な入力列の中で最初の制御入力u(t)のみを現在時刻tにおいて入力する。
続いて、図5(b)に示すように、次の時刻では, 再び現在時刻の状態を初期値として現在時刻tから有限時間先のt+Tまでにおいて最適な制御入力列とその予測値を求め、その中で最初の制御入力u(t)のみを入力する。
さらに、図5(c)に示すように、次の時刻では、同様な手順を繰り返していく。各時刻においては、開ループの最適制御問題を解いているが、各時刻において初期値をフィードバックして考えていることから、開ループ系から閉ループ系にすることができる。
モデル予測制御はモデルに基づいた最適制御方法であり、たとえば、EMG信号によって評価された被験者動作のような予測された将来のイベントを明示的に考慮にいれることができる。
なお、前提としてEMG信号からユーザが将来生成すると推定したトルクをモデル予測制御に使用すること、および、制御性能を落とすことになるので予測ホライズンを予測インターバルよりも短くすることは望ましくないことから、好ましくは、予測ホライズンは、予測インターバルに等しい値に設定される。
特に限定されないが、後述する実験では、評価のために、1:23のギヤ比のモータで駆動される前腕外骨格ロボットを使用している。
このような低いギア比により、外骨格ロボットの関節は、バックドライバブルなものとなっている。ここで、「バックドライブ」とは、外力によりロボットの出力関節が動作すること、を意味し、人間の関節等に装着するロボットでは重要である。
前腕の運動のアシストを目的とする場合、ロボットの状態は、以下のように定義される
Figure 0007054130000005
また、連続時間領域の外骨格ロボットの逆動力学モデルは、次のように与えることができる。
Figure 0007054130000006
ここでIは慣性モーメントのパラメーターを表わす。
下記のようにhは摩擦項である。
Figure 0007054130000007
これは、第1項の粘性のモデルおよび第2項の静止摩擦モデルからなる。Γ1およびΓ2は静止摩擦パラメーターである。
式(2)において、g(θ)は重力項を表わす。
そして、測定されたEMG信号から人間の関節トルクτhハットを評価すると、推定されたトルクを式(2)に適用することで、以下の式(4)を得る。
Figure 0007054130000008
その後、モデル予測制御を用いることで、ロボットへの最適制御入力τrを導出する。
アシストアズニーディッドコントロール方法では、モデル予測制御のためのコスト関数は、所望の軌道と測定された関節角度の間のトラッキング誤差およびロボット制御コストから以下のように構成される。
Figure 0007054130000009
ここで、xtは、時刻tにおけるロボットの状態であり、xt dは、時刻tにおけるロボットの所望の状態(目標軌道の状態)を示す。
tは、時刻tにおける制御出力を示し、ここでは、ut=τt r(時刻tにおけるロボット生成トルク)である。係数wpおよびwmはコスト関数の重み係数である。
すなわち、コスト関数は、現在のロボットの状態と目標軌道をとった場合のロボットの状態との差の絶対値に応じて単調に増加する項と、ロボットの制御出力(出力トルク)の絶対値に応じて単調に増加する項との重み付き線形和で表される。
ここでは、一例として、予測ホライズンは0.2sとする。すなわち、制御周波数が200Hzであるとするので、0.2sは、k=40ステップに相当する。
筋電信号から評価された関節トルク入力に基づいて、目標運動を追跡するために、最適制御問題を解くというモデル予測制御(MPC)法を、以下のようにして実行する。
モデル予測制御部204は、現在の時刻ステップtからの時間幅がTステップの最適制御入力シーケンスut,…ut+T-1を導出するものの、上述のとおり、第1ステップのコントロール入力utのみを使用する。
各制御時間ステップでは、Tステップ最適制御入力シーケンスは、以下のJに対して、式(7)の力学制約の下で、導出される。ここで、式(6)において、最小化演算の対象となる関数を価値関数と呼ぶ。
Figure 0007054130000010
なお、式(7)において、関数fはロボット全体のダイナミクス(摩擦や慣性、重力など)、関数kはアクチュエータのダイナミクス(入力信号からトルクへの変換など)を表す関数であり、制御対象のダイナミクスに対応して設定される。
単に第1ステップのコントロール出力を使用し、次のステップでは、新しい最適制御問題を再計算するので、モデル予測制御では、各ステップでの計算はそれぞれ開ループ・コントロール・シーケンスを算出するものの、有効にフィードバック制御方法として機能する。
以上説明したように、本実施の形態では、モデル予測制御と生体信号(たとえば、本実施の形態ではEMG信号)による人の生成するトルクの推定とを組み合わせることにより、以下のような利点がある。
i)現時刻からある区間において最適化するモデル予測制御を用いることで常に最適なゲインが調整されるため、従来法と異なり、試行中における人の能動性の変化に適応することが可能となる。
ii)人の出力トルクを線形のEMGモデルと組み合わせることで、使用者の個人差を線形モデルで学習できるため、少ない訓練データでモデリングができる。
iii)従来の方法では、EMG信号はアーチファクトや人の意思による不確実性を含むため、EMGのフィードバックゲインが高い場合、システムが不安定になる可能性があるが、最適制御手法の高いロバスト性によってシステムの安定性を確保できる。
iv)EMG信号からの人の生成トルクの推定には、線形モデルを採用し、一方で、MPCモデルにおいては、MPCモデルの外乱としてEMG推定トルクを組み込んでいる。このため、これら二つの手法を単純に組み合わせただけではなく、それぞれの短所を補完しあえる実装になっている。
また、情報(状態)として、力もしくはトルクセンサを使う場合:例えば、カフに力センサもしくはロボットの関節の出力軸側にトルクセンサを取り付ければ、ユーザが発揮するトルクを推定もしくは計測できる。センサを状態として、将来的にどのようなユーザトルクが発生するのかを予測するモデルを構築する(e.g. ARMAモデルもしくはカルマンフィルタを再帰的に使用する)。例えば、予測トルク(e.g. 200ミリ秒後に発生するだろうユーザトルク)を使って、人とロボットが発揮する(発揮すべき)トルクを、最適制御から導き出されるトルクに調整することができる。
[アシストアズニーディッド法の制御に対する実験]
以上説明したような、筋電位を計測することによるモデル予測制御を用いた、アシストロボットのアシストアズニーディッド制御の実験結果について以下説明する。
(実験条件)
アシストアズニーディッド法の制御を評価するために、目標リハビリテーション運動として、肘関節トラッキング制御タスクに、本実施の形態で説明した方法を適用した。さらに本実施の形態で説明した方法を、筋電信号に基づかないアシストアズニーディッドアプローチと比較した。
(肘関節トラッキング・タスク)
図6は、実験に使用した肘関節トラッキング・タスクを説明するための図である。
肘関節に対する「カール運動」は脳卒中患者のための標準的なリハビリ訓練運動である。
「カール運動」とは、図6(a)(b)に示すように、肘を前後に動かさずに肘を支点にして、前腕を前後に動かす運動である。このタスクを健康な被験者にとってさえ難しくするために、ロボットの先端に0.5kgの重りを加えた。
ただし、この重りは、患者のリハビリ訓練においては必要ではない。
20度の振幅および0.1Hzの周波数の運動を10秒間行う正弦波の肘関節軌道を目標移動プロフィールと見なした。
被験者は、目標軌道および現在の自身の関節の角度を表示したモニターを見つつ、自身の肘関節を運動させて、目標軌道の運動を実行する。
モデル予測制御(MPC)のためのコスト関数パラメーターは、wp=[1.0×106]およびwm=0.1に設定する。
アシストアズニーディッドコントロール方法は、単に、目標動作を追跡するのに必要な補充トルクをアシストすることにより、被験者の手足の運動をアシスト可能である必要がある。
この実験では、目標運動を生成するユーザの随意の出力トルクが変動した場合でも、アシストアズニーディッドコントローラーが所望の軌道を追跡することができることを示す。
したがって、下記のように3つの異なる条件の方法を評価した。
1)ロボット優勢な(RD)条件:
被験者は、トラッキング・タスクのための関節トルクを生成する外骨格ロボットに任せて運動するように命じられた。外骨格ロボットが目標動作を追跡する関節トルクを優勢に生成する。
2)ロボット人間間の協力(CO)条件:
被験者は、外骨格ロボットと協力的に目標軌道を追跡するために、必要な関節トルクを部分的に生成するように命じられた。
3)人間の優勢な(HD)条件:
被験者は、目標動作を追跡する関節トルクを任意に生成するように命じられた。外骨格ロボットは、単に目標をトラッキングするために必要な不足する小さなトルクを生成するだろうと期待される。
まず、1人の被験者で、この肘関節トラッキング・タスクを行ない、与えられたタスクへの彼の関与のレベルに基づいて、どのように適応的にアシスト・トルクを変更することができるか評価するために、このタスクを5回行ってくれるように依頼した。
さらに、提案されたアシストアズニーディッドフレームワークが異なるユーザに対して、どのように適切に動作するか評価するために、6人の被験者に、RDとHDの条件で実験を行なった。
(筋電計測に基づかないアシストアズニーディッド法との比較)
次に、提案されたアシストアズニーディッドフレームワークを、被験者のトルク出力を評価するために筋電信号を使用しない技術のアシストアズニーディッド方法と比較する。このような方法は、たとえば、以下の文献に開示されている。
公知文献3: A.U.Pehlivan,D.P.Losey and M.K.O’Malley,Minimal Assist-as-Needed Controller for Upper Limb Robotic Rehabilitation, IEEE TRANSACTIONS ON ROBOTICS, VOL. 32, NO. 1, pp. 113-124, 2016.
この筋電信号を使用しないアシストアズニーディッドアプローチは、2段階の計算ステップからなっている。
最初に、人間の関節トルクは、評価され観測されたロボット状態間の誤差が、人間の被験者によって生成された関節トルク入力の結果と考えられるカルマンフィルタを使用して評価された。
次に、目標軌道を追跡するのに必要となる、不足するトルクは、第1ステップにおいて評価された人間の関節トルクに基づいて導出された。
このアプローチでは、2,3のパラメーターが、第1と第2の計算ステップで、手動で選択されなければならない。
実験的にRDとHDの両方の条件において、これらのステップに適切なパラメーターを選び、肘関節トラッキング・タスクで、本実施の形態で説明した方法および筋電信号に基づかないアシストアズニーディッドコントローラーのトラッキング実行を比較した。
(ロボット支援のない状態での人間関節での比較)
次に、本実施の形態で説明した方法によって生成されたアシストのための関節トルクが、大きな関節トルクおよび正確な動作を生成するのをどのようにして支援するかを評価するために、目標軌道をトラッキングする試行を純粋な人間の関節制御と比較した。
さらに、患者の運動機能の程度によって目標となるリハビリテーション動作は変わることになるので、異なる周波数での周期的なパターンに対して本実施の形態で説明した方法を適用し、具体的には、前の実験条件より複雑な追跡タスクを考慮した。
これらの異なる周波数の目標軌道とは、0.5,1.0および1.5Hzの異なる周波数を有する3つの異なるサイン波形を含んでいる目標軌道である。
この実験は、本実施の形態で説明した方法が、患者というだけにとどまらず、正確な運動を要求するタスクを訓練する必要のある人に対してさえ役立つことを示した。
(実験結果)
(A)人間の関与レベルの3つの異なる条件での肘関節トラッキングパフォーマンス
以下では、軌道トラッキング試行のパフォーマンスとトラッキング・タスクのために関節トルクがどのように生成されたかを示す。
図7は、3つの異なる実験条件でのロボットと人間の被験者の間のトルク分配を示す図である。
3つの実験条件とは、上述したロボット優勢条件(RD)、ロボット人間の協力条件(CO)および人間の優勢条件(HD)である。
図中、エラーバーは標準偏差を表わす。
目標トラッキング・タスクへの人間の被験者関与の増加するにしたがって、ロボットにより生成される関節トルクは、期待されるとおり減少した。
すなわち、本実施の形態の制御方法によれば、アシストアズニーディッド制御が実現できていることがわかる。
図8は、3つの異なる実験条件において、ロボットおよび人間の被験者の実際の関節角度の軌道およびトルク特性を示す図である。
図8の上側の図8(a)(c)(e)に示すように、本実施の形態で説明した方法の使用によって、関節運動は人間の関与条件にかかわらず目標運動を追跡(目標軌道を追従)できている。
なお、図8(a)(c)(e)において、点線が目標軌道であり、実線が、計測されたロボットの状態を示す軌道である。
一方で、下側の図8(b)(d)(f)のように、3つの異なる人間の関与レベルに従って、関節トルク・レベルは適応的に調整されているのがわかる。
さらに、6人の異なる被験者について、本実施の形態で説明した方法を評価した。
図9は、6人の被験者について、異なる実験条件でのロボットと人間の被験者の間のトルク分配を示す図である。
複数の被験者に対する実験においても、人間の関与レベルに応じて、本実施の形態で説明した方法によって、追跡タスクを実現するのに必要とされる不足トルクを導出できていることがわかる。
(B)筋電信号を用いないアシストアズニーディッド方法との比較
本実施の形態のアシストアズニーディッド方法の目標関節トラッキング試行を、RDとHDの条件で、筋電信号を用いないアシストアズニーディッド制御と比較した。
図10は、本実施の形態の制御と筋電信号を用いないアシストアズニーディッド制御との比較結果を示す図である。
図10(a)はHDの条件下で調整したパラメータで実施した筋電信号を用いないアシストアズニーディッド制御におけるRDの条件のロボットおよび人間の被験者の実際の関節角度の軌道、(b)はRDの条件下で調整したパラメータで実施した筋電信号を用いないアシストアズニーディッド制御におけるHDの条件のロボットおよび人間の被験者の実際の関節角度の軌道、(c)は同じ被験者による本実施の形態アシストアズニーディッド方法を10回、筋電信号を用いないアシストアズニーディッド方法のRDおよびHDの5回の試行に対するトラッキング・エラー(2乗平均平方根誤差)のボックスプロットを示す。
図10に示されるように、異なる条件下で調整されたパラメータではトラッキング・エラーの増加(図10(a))が発生し、また、その逆の条件下で調整されたパラメータでは制御が不安定になり振動が発生する(図10(b))ことがわかる。また、本実施の形態で説明した方法のトラッキング・エラーは、筋電信号を用いない方法より著しく小さいことがわかる。このように、本発明によって、ユーザのトルク出力を予測することで、アシストアズニーディッドの目的を達成する上で、従来の方法に比べて追従誤差と安定性のトレードオフが緩和されていることがわかる。
(C)複雑な軌道トラッキング・タスクの純粋な対人コントロールとの比較
最後に、複雑な軌道トラッキング・タスクについて、本実施の形態で説明した方法を評価した。
図11は、本実施の形態の制御方法による複雑な軌道トラッキング・タスクの評価結果を示す図である。
図11(a)では、本実施の形態のアシストアズニーディッド方法のトラッキング試行を示す。
ここでも、点線は目標軌道を示し、実線は、生成された軌道を示す。
標準偏差は、この場合非常に小さいが、灰色の地域は標準偏差の内となる領域を表わす。
本実施の形態で説明した方法は、複雑な軌道トラッキング・タスクに対してさえ、うまく運動支援できていることがわかる。
図11(b)は、ロボットおよび被験者によって生成された関節トルクを示す。
被験者は、自身で、自発的に関節トルクを生成するように命じられた。
興味深いことに、この複雑な運動については、被験者は、最初は、アシストロボット・トルクに依存するものの、徐々に自分自身で目標運動を生成していることがわかる。
図12は、他の制御方法による複雑な軌道トラッキング・タスクの評価結果を示す図である。
図12(c)は、人間の被験者のみによるトラッキング試行を示す。
この実験条件では、ロボットはトルクを生成していない。ここでも、点線は目標軌道を示し、実線は生成された軌道を示す。灰色の領域は、標準偏差内となる領域を表わす。
この結果は、被験者が正確に複雑な軌道を追跡するには、困難であったことを示している。
図12(d)は、本実施の形態で説明した方法と、ロボットを使用していない純粋に人による制御との間のトラッキング誤差を比較して示す。
アシストアズニーディッドフレームワークを用いた外骨格ロボットは、アシストがあることで、追従精度が良好な追跡パフォーマンスを示す。
上記の結果は、本実施の形態で説明した方法がリハビリテーション等の臨床以外の状況においても、役立つことを示す。
以上説明したとおり、本実施の形態のアシストロボットの制御装置および制御方法を使用すれば、人間のトルク出力を評価するために生体信号、たとえば、筋電信号を使用し、評価された人間トルク出力を考慮に入れることができるモデル予測制御方法を使って学習支援用のロボットの出力を制御する。
なお、以上の説明では、モデル予測制御にあたり、ロボットの目標軌道をロボットの状態の時間変化の情報として入力した。しかしながら、コントローラーに目標軌道そのものを供給する必要は必ずしもない。例えば、アシストアズニーディッドコントローラーを導出するために、最終到達点での軌道誤差を式(5)の第1項のコストととし、目標ポイントのようなより抽象的な目標を設定するような使用を考慮するようにしてもよい。
また、以上の説明では、運動支援のためのロボットとしては、1自由度のロボットを例として説明したが、必ずしもこのような場合に限定されず、多自由度の制御、たとえば、二足歩行動作を支援するための脚外骨格ロボットの制御に、以上説明したような制御を適用することも可能である。
以上説明したように、本実施の形態の運動学習支援装置では、アシストアズニーディッドの原理に基づく運動学習支援においてアシスト力を生成するにあたり、目標運動の達成を適切に支援することが可能である。
本実施の形態の運動学習支援装置および運動学習支援方法によれば、事前に過度な負担をユーザに与えることなく、アシストアズニーディッドの原理に基づく運動学習支援が可能である。
(実施の形態の変形例)
なお、以上の説明では、筋電位からユーザの発揮するトルクを、事前に得られている筋電位から発揮力(ユーザトルク)の変換式に従って予測し、将来的なユーザの発揮力・発揮トルクが予測するという構成であるものとして説明した。ただし、たとえば、アシストロボット側に装着されているセンサからの計測情報を使って、ユーザの発揮するトルクを、事前に得られているトルクセンサから発揮力の変換式に従って、予測するという構成とすることも可能である。この場合、トルク値の時系列がユーザごとの反射・トルク発生の癖、ユーザに依らない人間に生来的に備わる反射(たとえば、大きな力がかかると人は逆方向に力を発揮する、もしくは、姿勢を維持もしくはバランスを取ろうとする等の反射的な行動をとる等)を反映したような行動予測が可能となるので、上述したような筋電などの生体信号と同様のフレームワークの制御系が構築可能である。
以下、本実施の形態の変形例としてアシストロボット側に装着されているセンサからの計測情報による制御方法を、従来手法と対比して、説明する。
i)PID制御(Proportional-Integral-Differential Controller)は、以下の式のように現在と過去の誤差に基づく制御である。
Figure 0007054130000011
ここで、eは、目標値と現在の制御量との差の偏差であり、Kpは比例ゲインである。Kp・Tdは微分ゲインであり、Kp・Tiは積分ゲインである。
ii)「PD制御+ダイナミクスキャンセル」による手法は、現在の誤差と位置、速度、加速度に基づき、以下の式であらわされる。
Figure 0007054130000012
iii)従来のアシストアズニーディッド制御
これに対して、従来のアシストアズニーディッド制御としては、以下の文献に記載の方法がある。
非特許文献6(再掲):A. U. Pehlivan, D. P. Losey and M. K. O’Malley, Minimal Assist-as-Needed Controller for Upper Limb Robotic Rehabilitation, IEEE TRANSACTIONS ON ROBOTICS, VOL. 32, NO. 1, pp. 113-124, 2016
この非特許文献6に開示の手法は、「PD制御+ダイナミクスキャンセル+カルマンフィルタ」の構成を有するものであり、過去の状態に基づいて現在の状態を推定し、モデル誤差から現在の人による外乱を推定している。力センサによって外乱を計測した場合も未来の情報は使われていない。
iv)本実施の形態の変形例の手法
モデル予測制御(MPC)は人とロボットが一体となった系を対象とする場合、未来のロボットの入力に対するヒトの出力を予測する数式モデルを使用する。
MPCの制御則δuは、以下の式であらわされる。
Figure 0007054130000013
ここで、lはフィードフォーワード項、Lはフィードバックゲイン、δxは線形近似された非線形モデルから得られたシステムの状態である。lおよびLを目的関数とシステムモデルの制約に基づき最適化する。
すなわち、本実施の形態の変形例においては、モデルの学習や予測に用いる入力データセットは、人とロボットの相互作用が含まれたデータである。
本実施の形態の変形例においては、人とロボットの相互作用によって生じた過去と現在のデータに基づきカルマンフィルタによって推定された内部状態を使用し、さらに1ステップ(もしくは2ステップ以上先)の出力を予測する。人とロボットの相互作用によって生じた関節トルクを力センサによって検出し、その過去と現在のデータを入力として、たとえば、ARMAモデル(自己回帰移動平均モデル:Auto-Regressive Moving Average model)を使って、将来の1ステップを予測して、それを推定値として使用する。
なお、ARMAモデルについては、たとえば、以下の文献に開示がある。
公知文献4:Said,Said E., and David A. Dickey. ”Testing for unit roots in autoregressive-moving average models of unknown order.” Biometrika 71.3 (1984):599-607.
そこで、ユーザの関節の運動に対するユーザの中枢からの指令に基づいて生成される信号として、筋電電位などの生体信号と、人とロボットの相互作用によって生じた関節トルクを力センサによって検出した信号とを、総称して、「生体由来信号」と呼ぶことにする。
以上のような構成とすることで、ロボットとユーザが協調してタスクを実施する際に、ロボットとユーザのトルクの和が適切なトルク(最適制御によって導出されるトルク)に調整したい場合、「現在もしくは過去に計測されたアシスト力や発生しているユーザトルクから、ロボットの発揮するトルクを決める」のではなく、「現在得られている情報に加えて、過去にロボットが経験したユーザの反応もしくは行動履歴を利用し、近い将来(数十ミリ~数百ミリ秒後)発生するであろうユーザトルク(ユーザが発揮するであるトルク)を予測し、その量に基づいてロボットが発揮すべきトルクを調整する」という構成とすることができる。これにより、ユーザが発揮するトルクとロボットが発生するトルクがスムーズに発生する。さらに、ユーザが反射的に発生するトルクを予測しつつ、そのユーザのトルクをうまく利用したり、発生する軌道の変化による振動を抑えることが可能である。
今回開示された実施の形態は、本発明を具体的に実施するための構成の例示であって、本発明の技術的範囲を制限するものではない。本発明の技術的範囲は、実施の形態の説明ではなく、特許請求の範囲によって示されるものであり、特許請求の範囲の文言上の範囲および均等の意味の範囲内での変更が含まれることが意図される。
2 ユーザ、10 マルチファンクションボード、20 外部制御装置、102 EMG電極、200 演算装置、202 関節トルク推定部、204 モデル予測制御部、210 記憶装置、220 インタフェース部、300 アシストロボット、304 腕帯、310 プーリー付回転関節、311 モータドライバ、312 電動モータ、324 角度エンコーダ、350 アーム。

Claims (8)

  1. ユーザの関節の運動の運動学習をアシストするための運動学習支援装置であって、
    前記アシストを受ける前記ユーザの関節部に装着され、前記関節部へのアシストトルクを生成するアクチュエータ手段を有する能動関節と、
    前記ユーザの関節の運動に対する前記ユーザの中枢からの指令に基づいて生成される生体信号を検出するための検知装置と、
    前記ユーザの学習対象となる運動の目標軌道情報を格納する記憶装置と、
    前記能動関節が発生する前記アシストトルクを制御するための制御信号を生成する制御部とを備え、
    前記制御部は、前記生体信号に基づいて、検出時から所定の時間経過した時点においてユーザが自身の関節により生成するユーザトルクを推定し、前記目標軌道情報に対応する目標軌道の運動を生成するために不足している不足関節トルクを導出し、前記不足関節トルクを前記アシストトルクとして、前記関節部が前記目標軌道を運動するように、前記ユーザが発揮するトルクのモデルを事前に取得したデータに従って最適化し、モデル予測制御により生成した前記制御信号で前記能動関節を制御する、運動学習支援装置。
  2. 前記制御部は、
    前記生体信号に基づいて、検出時から所定の時間経過した時点の前記ユーザが自身の関節により生成する前記ユーザトルクを推定するトルク推定手段と、
    定された前記ユーザトルクと前記アシストトルクとにより、前記能動関節が目標軌道を運動するように、前記制御信号により前記アクチュエータ手段を制御するためのモデル予測制御手段とを含み、
    前記モデル予測制御手段は、推定された前記ユーザトルクの推定情報を用いて、前記アクチュエータ手段のモデル予測制御のための価値関数を最小化するように、前記制御信号を算出する、請求項1記載の運動学習支援装置。
  3. 前記能動関節の関節角度を検知するための角度検知手段をさらに備え、
    前記モデル予測制御手段は、前記目標軌道の運動のための前記モデル予測制御において前記アクチュエータ手段の状態を表すパラメータとして前記関節角度および前記関節角度の角速度を用いる、請求項2記載の運動学習支援装置。
  4. 前記モデル予測制御手段は、前記所定の時間に相当する期間を予測ホライズンとして、前記制御信号を算出し、
    前記価値関数は、前記予測ホライズンの期間におけるコスト関数の積算値であり、
    前記コスト関数は、現在の能動関節の状態と目標軌道をとった場合の能動関節の状態との差の絶対値に応じて単調に増加する項と、能動関節の出力するトルクの絶対値に応じて単調に増加する項との重み付き線形和である、請求項2または3記載の運動学習支援装置。
  5. 前記記憶装置は、前記トルク推定手段による前記ユーザトルクの推定値を所定のタイムステップごとに前記推定情報として格納し、
    前記モデル予測制御手段は、前記記憶装置に格納された前記推定情報を用いて、前記アクチュエータ手段のモデル予測制御のための価値関数を最小化するように、前記制御信号を算出する、請求項2~4のいずれか1項に記載の運動学習支援装置。
  6. 前記能動関節は、前記ユーザの四肢のいずれかに装着された外骨格型ロボットの能動関節である、請求項1~5のいずれか1項に記載の運動学習支援装置。
  7. +
    前記生体信号は、前記ユーザの関節を駆動する筋肉の体表面から取得される筋電信号であり、
    前記トルク推定手段は、前記筋電信号に対する線形モデルを用いて、前記ユーザトルクを推定する、請求項3記載の運動学習支援装置。
  8. ユーザの関節の運動の運動学習をアシストするための運動学習支援装置を用いた運動学習支援方法であって、
    前記運動学習支援装置は、前記アシストを受ける前記ユーザの関節部に装着され、前記関節部へのアシストトルクを生成するアクチュエータ手段を有する能動関節と、前記ユーザの関節の運動に対する前記ユーザの中枢からの指令に関わる生体信号を検出するための検知装置と、前記ユーザの学習対象となる運動の目標軌道情報を格納する記憶装置と、前記能動関節が発生する前記アシストトルクを制御するための制御信号を生成する制御部とを含み、
    前記制御部が、前記生体信号に基づいて、検出時から所定の時間経過した時点の前記ユーザが自身の関節により生成するユーザトルクを推定するステップと、
    前記制御部が、推定された前記ユーザトルクと前記アシストトルクとにより、前記関節部前記目標軌道情報に対応する目標軌道を運動するように、制御信号により前記アクチュエータ手段を制御するステップとを備え、
    前記アクチュエータ手段を制御するステップは、推定された前記ユーザトルクにより、前記目標軌道の運動を生成するために不足している不足関節トルクを導出し、前記不足関節トルクを前記アシストトルクとして、前記関節部が前記目標軌道を運動するように、前記ユーザが発揮するトルクのモデルを事前に取得したデータに従って最適化し、モデル予測制御により生成した前記制御信号で前記能動関節を制御するステップを含む、運動学習支援方法。
JP2017148882A 2017-08-01 2017-08-01 運動学習支援装置および運動学習支援方法 Active JP7054130B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017148882A JP7054130B2 (ja) 2017-08-01 2017-08-01 運動学習支援装置および運動学習支援方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017148882A JP7054130B2 (ja) 2017-08-01 2017-08-01 運動学習支援装置および運動学習支援方法

Publications (2)

Publication Number Publication Date
JP2019025104A JP2019025104A (ja) 2019-02-21
JP7054130B2 true JP7054130B2 (ja) 2022-04-13

Family

ID=65475151

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017148882A Active JP7054130B2 (ja) 2017-08-01 2017-08-01 運動学習支援装置および運動学習支援方法

Country Status (1)

Country Link
JP (1) JP7054130B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7200849B2 (ja) * 2019-06-27 2023-01-10 トヨタ自動車株式会社 学習装置、歩行訓練システム、方法、プログラム、及び学習済みモデル
CN112115812A (zh) * 2020-08-31 2020-12-22 深圳市联合视觉创新科技有限公司 人体运动信号的标注方法、装置及计算设备
CN113442114A (zh) * 2021-06-04 2021-09-28 迈宝智能科技(苏州)有限公司 腰部助力外骨骼及其控制方法
CN114021376B (zh) * 2021-11-17 2024-04-09 中国北方车辆研究所 一种四足机器人地形坡度估计方法
CN114869306A (zh) 2022-06-14 2022-08-09 东南大学 基于博弈论和sEMG的上肢康复机器人自适应控制方法及系统
CN115337175A (zh) * 2022-08-17 2022-11-15 上海神泰医疗科技有限公司 存储介质及康复机器人

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080009771A1 (en) 2006-03-29 2008-01-10 Joel Perry Exoskeleton
JP2013094502A (ja) 2011-11-02 2013-05-20 Toyota Motor Corp アシストロボット制御装置
JP2014119797A (ja) 2012-12-13 2014-06-30 Institute Of National Colleges Of Technology Japan モデル予測制御を用いたパワーアシストシステム
JP2015083091A (ja) 2013-10-25 2015-04-30 国立大学法人山口大学 動作支援装置
JP2016053824A (ja) 2014-09-03 2016-04-14 株式会社国際電気通信基礎技術研究所 駆動システム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080009771A1 (en) 2006-03-29 2008-01-10 Joel Perry Exoskeleton
JP2013094502A (ja) 2011-11-02 2013-05-20 Toyota Motor Corp アシストロボット制御装置
JP2014119797A (ja) 2012-12-13 2014-06-30 Institute Of National Colleges Of Technology Japan モデル予測制御を用いたパワーアシストシステム
JP2015083091A (ja) 2013-10-25 2015-04-30 国立大学法人山口大学 動作支援装置
JP2016053824A (ja) 2014-09-03 2016-04-14 株式会社国際電気通信基礎技術研究所 駆動システム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
瓜野琢也,「表面筋電位センサとトルクセンサを併用したモデル予測制御の力動作予測に基づくパワーアシストの実現」,ロボティクス・メカトロニクス講演会講演概要集,日本機械学会,2012年,1A1-U11(1)-1A1-U11(4)

Also Published As

Publication number Publication date
JP2019025104A (ja) 2019-02-21

Similar Documents

Publication Publication Date Title
JP7054130B2 (ja) 運動学習支援装置および運動学習支援方法
Li et al. Adaptive human–robot interaction control for robots driven by series elastic actuators
US10555865B2 (en) Torque control methods for an exoskeleton device
Long et al. Active disturbance rejection control based human gait tracking for lower extremity rehabilitation exoskeleton
US10016332B2 (en) Admittance shaping controller for exoskeleton assistance of the lower extremities
Asl et al. Field-based assist-as-needed control schemes for rehabilitation robots
Pehlivan et al. Minimal assist-as-needed controller for upper limb robotic rehabilitation
Qiu et al. Exoskeleton online learning and estimation of human walking intention based on dynamical movement primitives
Aguirre-Ollinger et al. Active-impedance control of a lower-limb assistive exoskeleton
Zhang et al. Torque control in legged locomotion
Madoński et al. Application of a disturbance-rejection controller for robotic-enhanced limb rehabilitation trainings
Tran et al. The relationship between physical human-exoskeleton interaction and dynamic factors: using a learning approach for control applications
Galinski et al. Optimal design of an alignment-free two-DOF rehabilitation robot for the shoulder complex
Han et al. Human–robot interaction evaluation-based AAN control for upper limb rehabilitation robots driven by series elastic actuators
Oghogho et al. Deep reinforcement learning for emg-based control of assistance level in upper-limb exoskeletons
Asl et al. Satisfying task completion and assist-as-needed performance in robotic exoskeletons
Dalla Gasperina et al. Development and electromyographic validation of a compliant human-robot interaction controller for cooperative and personalized neurorehabilitation
Paredes-Acuña et al. Tactile-based assistive method to support physical therapy routines in a lightweight upper-limb exoskeleton
Huang et al. Self-learning assistive exoskeleton with sliding mode admittance control
Huang et al. Adaptive compliance shaping with human impedance estimation
Ahmed et al. Robotic exoskeleton control for lower limb rehabilitation of knee joint
Han et al. The swing control of knee exoskeleton based on admittance model and nonlinear oscillator
Kong et al. Mechanical design and impedance compensation of SUBAR (Sogang University’s Biomedical Assist Robot)
Durandau et al. Myoelectric model-based control of a bi-lateral robotic ankle exoskeleton during even ground locomotion
Anwar et al. Adaptive trajectory control to achieve smooth interaction force in robotic rehabilitation device

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170920

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200717

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210526

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210708

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20210903

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211011

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220323

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220323

R150 Certificate of patent or registration of utility model

Ref document number: 7054130

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150