JP2022549448A - ニューラルネットワークのパラメータを学習する方法、エクソスケルトンの軌道を生成する方法及びエクソスケルトンを動かす方法 - Google Patents
ニューラルネットワークのパラメータを学習する方法、エクソスケルトンの軌道を生成する方法及びエクソスケルトンを動かす方法 Download PDFInfo
- Publication number
- JP2022549448A JP2022549448A JP2022518764A JP2022518764A JP2022549448A JP 2022549448 A JP2022549448 A JP 2022549448A JP 2022518764 A JP2022518764 A JP 2022518764A JP 2022518764 A JP2022518764 A JP 2022518764A JP 2022549448 A JP2022549448 A JP 2022549448A
- Authority
- JP
- Japan
- Prior art keywords
- exoskeleton
- trajectory
- periodic
- trajectories
- parameters
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1656—Programme controls characterised by programming, planning systems for manipulators
- B25J9/1664—Programme controls characterised by programming, planning systems for manipulators characterised by motion, path, trajectory planning
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/0006—Exoskeletons, i.e. resembling a human figure
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61H—PHYSICAL THERAPY APPARATUS, e.g. DEVICES FOR LOCATING OR STIMULATING REFLEX POINTS IN THE BODY; ARTIFICIAL RESPIRATION; MASSAGE; BATHING DEVICES FOR SPECIAL THERAPEUTIC OR HYGIENIC PURPOSES OR SPECIFIC PARTS OF THE BODY
- A61H3/00—Appliances for aiding patients or disabled persons to walk about
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1602—Programme controls characterised by the control system, structure, architecture
- B25J9/161—Hardware, e.g. neural networks, fuzzy logic, interfaces, processor
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1628—Programme controls characterised by the control loop
- B25J9/163—Programme controls characterised by the control loop learning, adaptive, model based, rule based expert control
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B62—LAND VEHICLES FOR TRAVELLING OTHERWISE THAN ON RAILS
- B62D—MOTOR VEHICLES; TRAILERS
- B62D57/00—Vehicles characterised by having other propulsion or other ground- engaging means than wheels or endless track, alone or in addition to wheels or endless track
- B62D57/02—Vehicles characterised by having other propulsion or other ground- engaging means than wheels or endless track, alone or in addition to wheels or endless track with ground-engaging propulsion means, e.g. walking members
- B62D57/032—Vehicles characterised by having other propulsion or other ground- engaging means than wheels or endless track, alone or in addition to wheels or endless track with ground-engaging propulsion means, e.g. walking members with alternately or sequentially lifted supporting base and legs; with alternately or sequentially lifted feet or skid
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/048—Activation functions
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61H—PHYSICAL THERAPY APPARATUS, e.g. DEVICES FOR LOCATING OR STIMULATING REFLEX POINTS IN THE BODY; ARTIFICIAL RESPIRATION; MASSAGE; BATHING DEVICES FOR SPECIAL THERAPEUTIC OR HYGIENIC PURPOSES OR SPECIFIC PARTS OF THE BODY
- A61H3/00—Appliances for aiding patients or disabled persons to walk about
- A61H2003/007—Appliances for aiding patients or disabled persons to walk about secured to the patient, e.g. with belts
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61H—PHYSICAL THERAPY APPARATUS, e.g. DEVICES FOR LOCATING OR STIMULATING REFLEX POINTS IN THE BODY; ARTIFICIAL RESPIRATION; MASSAGE; BATHING DEVICES FOR SPECIAL THERAPEUTIC OR HYGIENIC PURPOSES OR SPECIFIC PARTS OF THE BODY
- A61H2201/00—Characteristics of apparatus not provided for in the preceding codes
- A61H2201/16—Physical interface with patient
- A61H2201/1602—Physical interface with patient kind of interface, e.g. head rest, knee support or lumbar support
- A61H2201/164—Feet or leg, e.g. pedal
- A61H2201/1642—Holding means therefor
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61H—PHYSICAL THERAPY APPARATUS, e.g. DEVICES FOR LOCATING OR STIMULATING REFLEX POINTS IN THE BODY; ARTIFICIAL RESPIRATION; MASSAGE; BATHING DEVICES FOR SPECIAL THERAPEUTIC OR HYGIENIC PURPOSES OR SPECIFIC PARTS OF THE BODY
- A61H2201/00—Characteristics of apparatus not provided for in the preceding codes
- A61H2201/16—Physical interface with patient
- A61H2201/1602—Physical interface with patient kind of interface, e.g. head rest, knee support or lumbar support
- A61H2201/165—Wearable interfaces
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61H—PHYSICAL THERAPY APPARATUS, e.g. DEVICES FOR LOCATING OR STIMULATING REFLEX POINTS IN THE BODY; ARTIFICIAL RESPIRATION; MASSAGE; BATHING DEVICES FOR SPECIAL THERAPEUTIC OR HYGIENIC PURPOSES OR SPECIFIC PARTS OF THE BODY
- A61H2201/00—Characteristics of apparatus not provided for in the preceding codes
- A61H2201/50—Control means thereof
- A61H2201/5007—Control means thereof computer controlled
- A61H2201/501—Control means thereof computer controlled connected to external computer devices or networks
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61H—PHYSICAL THERAPY APPARATUS, e.g. DEVICES FOR LOCATING OR STIMULATING REFLEX POINTS IN THE BODY; ARTIFICIAL RESPIRATION; MASSAGE; BATHING DEVICES FOR SPECIAL THERAPEUTIC OR HYGIENIC PURPOSES OR SPECIFIC PARTS OF THE BODY
- A61H2205/00—Devices for specific parts of the body
- A61H2205/10—Leg
Abstract
本発明は、エクソスケルトン(1)の軌道を生成するためにニューラルネットワークのパラメータを学習する方法であって、当該方法は、第1のサーバ(10a)のデータ処理手段(11a)により、(a)前記エクソスケルトン(1)の一連の可能な歩行のための周期軌道を学習するための第1のデータベースに従って、前記エクソスケルトン(1)の周期基本軌道を生成するのに好適な第1のニューラルネットワークのパラメータを学習するステップであって、該パラメータのそれぞれは、n組の歩行パラメータによって定義される前記エクソスケルトンの所与の歩行のためのものである、ステップと、(b)前記エクソスケルトン(1)の一連の可能な歩行のための周期基本軌道及び遷移の第2の学習データベースに従って、前記エクソスケルトン(1)の周期基本軌道と、前記エクソスケルトン(1)の1つの周期基本軌道から前記エクソスケルトン(1)の別の周期基本軌道への遷移を生成するのに好適な第2のニューラルネットワークのパラメータを、前記第1のニューラルネットワークからのパラメータを用いて学習するステップと、を実施することを含む。
Description
本発明はエクソスケルトン型のロボットの分野に関する。より詳細には、本発明はニューラルネットワークのパラメータを学習する方法、エクソスケルトンの軌道を生成するためにニューラルネットワークを用いる方法及びエクソスケルトンを動かす方法に関する。
近年、対麻痺等の実質的な移動の問題を抱える人々のために、エクソスケルトンと呼ばれる歩行支援装置が登場し、該装置は、エクソスケルトンの動きをオペレータ(人間のユーザ)自身の動きに結びつけるファスナーのシステムのおかげで、オペレータが「装着」する外部ロボット装置である。下肢用のエクソスケルトンは、歩行の動きを再現するために、概して少なくとも膝及び臀部にいくつかの関節を有する。アクチュエータはこれらの関節を動かすことを可能にし、その結果オペレータを動かすことができる。インタフェースシステムは、オペレータがエクソスケルトンに命令を与えることを可能にし、制御システムはこれらの命令をアクチュエータに対するコマンドに変換する。装置は概してセンサが設けられている。
これらのエクソスケルトンは、オペレータが立ち上がり、歩くことを可能にするため、車椅子に対する進歩を成す。エクソスケルトンは、もはや車輪によって制限されず、理論的には平坦でない大半の環境で動作することができる。車輪は、脚とは異なって、段差、階段、高さが大きすぎる障害物等の実質的な障害を横断することができない。
しかしながら、これらのエクソスケルトンのいずれも、その使用において、自律的な人間の歩行(すなわち、広範な地形にわたって安定し、実行可能であり、人為的で補助されていない)を行うことができない。
ほとんどの場合、これらの制限は、装置がそれ自体でバランス又は歩行方向の管理を行うことができないことに起因する。これらの2つのタスクは、通常、オペレータに移され、オペレータは、例えば、特許文献1又は特許文献2で提案されているような松葉杖によりそれらのタスクを行う。
特許文献3には、自身の安定性を確保することができない人のために、外部の支援なしに用いることが可能な唯一のエクソスケルトンが記載されている。特許文献3の0122段落に記載されている制御原理は、支持ポリゴンの一部(地面との接触点の凸状の包絡線)の圧力の中心(地面によってシステムに対して作用する反力の結果に対応する物理的な点)を支持ポリゴンの別の部分に移す必要性が明確に説明されている。
この制限により、ステップの短い(通常の歩幅は50~80cmであるが、30cm未満)極めて遅い歩行(通常の歩行は2km/hを越えるが、数m/分)となり、その間支持足は常に地面と平坦に接触している。したがって、実際には不均一な地形が除外されるため、アクセス可能な環境の種類が限られる。同様に、小さな物体であ小石や小さな物体等のわずかな障害物であっても、それの上にシステムがある時点で足を置いた場合にバランスを崩し、最終的にはシステムが落下するリスクをもたらす。
反対に、「自然な」人間の歩行は、足が地面の上、空中又は地面の上で転がる過程で平坦になることができる一連のフェーズによって特徴付けられる。足をローリングする能力は歩行に不可欠である。何故なら、より大きな歩幅を取ることができ、多種多様な地形で安定を可能にするからである。
しかしながら、上述のいわゆる第1世代のエクソスケルトンは、作動足部を有していないか又は支持足部を地上で維持しない。
二足歩行のヒューマノイドロボット又はロボット装置にとって、このローリングを行うことは実際に複雑である。圧力の中心が支持ポリゴンの限界に達すると、システムはこの点の周りを回転し始めるため、もはや静的平衡状態にない。
歩行の場合、足のローリングは、支持足において地面との接触が部分的に失われ、いくつかの結果がもたらされる。
-支持ポリゴン(維持面)が潜在的にある点まで減少して、支持ポリゴン内で圧力の中心を維持することを困難になり、さらには不可能になる。
-システムは、劣駆動(under-actuation)の状態、すなわち、もはやその自由度の全てで作用することはできない。そうなれば、全ての動きはもはや不可能になる。
-支持ポリゴン(維持面)が潜在的にある点まで減少して、支持ポリゴン内で圧力の中心を維持することを困難になり、さらには不可能になる。
-システムは、劣駆動(under-actuation)の状態、すなわち、もはやその自由度の全てで作用することはできない。そうなれば、全ての動きはもはや不可能になる。
このような状況では、非特許文献1等に記載の平坦な足で歩行する従来の形式又は特許文献3に記載されている原理はもはや機能しない。
自然なアイデアは、「転倒」の過程で話す方法で、システムが支持足を中心に自由に回転している間に、支持ポリゴン及びバランスに戻るために、脚を前に振り出し、第2の足を地面に置くことがある。そして、身体は遷移としてのみ一連の不安定な姿勢をとるため、これは動的歩行と呼ばれる(もしその人がその場で「止められた」ならば、転倒する)。
この動的歩行のアプローチでは、振り出された脚を素早くバランスを再確立する位置に少なくとも短期間位置させることは複雑である。実際、この足が予め計算された時間にパラメータ化された軌道に従うようにされた場合、たとえわずかな外乱を受けただけでも、劣駆動のシステムの制御不能な挙動により、足が地面に当たるのが早すぎたり遅すぎたりするリスクがある(計画された軌道からわずかにずれた軌道を修正することは不可能である)。これは、オペレータに不快感を与え、オペレータが不均衡になるか又はオペレータが単純なものを含む地形で転倒する可能性がある。
このため、全ての第1世代のエクソスケルトン(及び多くのヒューマノイドロボット)は、支持足を平坦に保つことによってこのような状況を避けようとする。その結果、前述の歩行速度の制限、歩幅の制限、許容可能な地形の種類及び一般的な歩行の安定性の問題が生じる。
その結果、「仮想制約(virtual constraints)」と「ハイブリッドゼロダイナミックス」(HZD)の原理を組み合わせた、困難で予期せぬ地形であっても、転倒や不均衡のリスクなしに、速く且つ自然な歩行を可能するエクソスケルトンのための新たな歩行パラダイムが特許文献4で提案された。
従来、軌道、各自由度ごとの変化は時間の関数として表される。システムの「動力学」は関数
反対に、HZDは作動されていない自由度の動力学である。この動力学は、コマンドが動作できないか又は動作を望まない自由度に対応するため、「ゼロ」と呼ばれる。すなわち、コマンドの価値は0である。そして、地面上での足の衝撃は連続するフェーズと交差する非連続な瞬間的フェーズを課すため、「ハイブリッド」と呼ばれる。
いわゆる「仮想制約」法では、原理は、動作自由度の選択について、時間ではなく構成に直接従って、変化パラメータによりパラメータ化された軌道を定義することであり、このパラメータはフェーズ変数と呼ばれる。そのようなフェーズ変数の一例は、踵-臀部軸と垂直方向との間の角度であり、この角度は、上述の作動されない自由度を構成する。
フェーズ変数は、ステップの「進行」を定義することを可能にする。より正確には、各ステップで、フェーズ変数は、初期値が再割り当てされる前に、連続的に初期値から最終値に切り替わり、これは、次のステップの開始である。より簡単にするために、フェーズパラメータの値を0と1の間で正規化することができる。
変更パラメータの各値は、システムが従わなければならない作動自由度の値に対応し、これらの関係(このように制御されることが望ましい作動自由度のそれぞれに対して1つ)が仮想制約と呼ばれる。
もし、システムが、動作することが可能で且つ望ましい自由度についてこの軌道に厳密に従った場合、すなわち、仮想制約がこれらの自由度について編集された場合、システムの変化は、HZDであるそれら自身の動力学に従う、作動されないこれらの自由度によって、完全に決定される。
そのため、仮想制約の良好な選択は、この動力学を魅力的な周期的「軌道」、すなわち、システムが自然に引きつけられる安定した軌道を含むようにすることができる。
このHZD法は大きな満足を与えるが、軌道を生成するのが困難である(さらに「フラットフット」法の場合も同様である)。実際、所与の軌道は、歩幅の長さ、歩行頻度及びバストの傾斜(階段を交渉する場合はステップの高さ、湾曲動作の場合は瞬間的な回転角度、リハビリテーションの活動の枠組みではバストの中心の位置及び側方偏位も)等の歩行の「特性」に関連し、安定していなければならない。もし歩行の特性が変化した場合、新たな軌道が必要になる。
Kajita S., K. F. (2003), Biped Walkingpattern generation by using preview control of Zero-Moment Point, ICRA, (pp.1620-1626)
今日、リアルタイムで軌道を生成することを可能にする解決策は存在しておらず、それらを事前に計算し、テストする必要があり、これにはいくつかの理由がある。
-現在の軌道生成アルゴリズムは、制約下の非線形非凸の課題を最適化するための方法に基づいている。この種類のアルゴリズムは、収束性を保証するものではない。したがって、数学的にコンパクトな探索空間に限定されていても、所望の歩行特性のための軌道を得ることができることを確認することは不可能である。
-制約の下でのこのような非線形非凸の課題を解くことは複雑であり、かなりの計算能力を必要とする。ハイエンドコンピュータ上の物理的コア当たり、軌道毎に約90sの計算時間が必要となるが、リアルタイム動作を考慮するためにはこの時間は約100μsでなければならない。
-現在、計算はリモートサーバ上で行われ、次いで、結果がインターネットによって転送される。これは、エクソスケルトンのユーザは永続的で安定した接続を有する必要があり、日常生活での使用にとって大きな不便を表す。
-現在の軌道生成アルゴリズムは、制約下の非線形非凸の課題を最適化するための方法に基づいている。この種類のアルゴリズムは、収束性を保証するものではない。したがって、数学的にコンパクトな探索空間に限定されていても、所望の歩行特性のための軌道を得ることができることを確認することは不可能である。
-制約の下でのこのような非線形非凸の課題を解くことは複雑であり、かなりの計算能力を必要とする。ハイエンドコンピュータ上の物理的コア当たり、軌道毎に約90sの計算時間が必要となるが、リアルタイム動作を考慮するためにはこの時間は約100μsでなければならない。
-現在、計算はリモートサーバ上で行われ、次いで、結果がインターネットによって転送される。これは、エクソスケルトンのユーザは永続的で安定した接続を有する必要があり、日常生活での使用にとって大きな不便を表す。
そのため、エクソスケルトンのオペレータにとってわずかなリスクが伴うことなく、
最終的にリアルタイムで実施可能な軌道を生成するための新しい解決策を有することが望ましい。
最終的にリアルタイムで実施可能な軌道を生成するための新しい解決策を有することが望ましい。
そのため、第1の態様によれば、本発明はエクソスケルトンの軌道を生成するためにニューラルネットワークのパラメータを学習する方法に関し、当該方法は、第1のサーバのデータ処理手段により、
(a)前記エクソスケルトンの一連の可能な歩行のための周期軌道を学習するための第1のデータベースに従って、前記エクソスケルトンの周期基本軌道を生成するのに好適な第1のニューラルネットワークのパラメータを学習するステップであって、該パラメータのそれぞれは、n組の歩行パラメータによって定義される前記エクソスケルトンの所与の歩行のためのものである、ステップと、
(b)前記エクソスケルトンの一連の可能な歩行のための周期基本軌道及び遷移の第2の学習データベースに従って、前記エクソスケルトンの周期基本軌道と、前記エクソスケルトンの1つの周期基本軌道から前記エクソスケルトンの別の周期基本軌道への遷移を生成するのに好適な第2のニューラルネットワークのパラメータを、前記第1のニューラルネットワークからのパラメータを用いて学習するステップと、
を実施することを含む。
(a)前記エクソスケルトンの一連の可能な歩行のための周期軌道を学習するための第1のデータベースに従って、前記エクソスケルトンの周期基本軌道を生成するのに好適な第1のニューラルネットワークのパラメータを学習するステップであって、該パラメータのそれぞれは、n組の歩行パラメータによって定義される前記エクソスケルトンの所与の歩行のためのものである、ステップと、
(b)前記エクソスケルトンの一連の可能な歩行のための周期基本軌道及び遷移の第2の学習データベースに従って、前記エクソスケルトンの周期基本軌道と、前記エクソスケルトンの1つの周期基本軌道から前記エクソスケルトンの別の周期基本軌道への遷移を生成するのに好適な第2のニューラルネットワークのパラメータを、前記第1のニューラルネットワークからのパラメータを用いて学習するステップと、
を実施することを含む。
他の有利且つ非限定的の特徴によれば、前記ステップ(a)は、最適化アルゴリズムを用いることにより、前記エクソスケルトンの一連の可能な歩行のための周期軌道の前記第1の学習データベースを構築することを含む。
前記エクソスケルトンの一連の可能な歩行は、前記n組の歩行パラメータが値を有する空間が均一にカバーされるように選択される。
前記ステップ(a)は、前記第1のニューラルネットワークの前記予測の精度を表す基準を検証することさらに含み、該基準が検証されていない場合、前記ステップ(a)が繰り返される。
前記ステップ(b)は、前記第1の学習データベースを用いて、前記エクソスケルトンの一連の可能な歩行のための周期軌道及び遷移を学習するための前記第2のデータベースを構築することを含む。
前記第2のデータベースは、前記第1の学習データベースの前記エクソスケルトンの周期基本軌道から、前記第1の学習データベースの前記エクソスケルトンの別の周期基本軌道への全ての遷移を含む。
初期周期基本軌道と呼ばれる前記エクソスケルトンの周期基本軌道から、最終周期基本軌道と呼ばれる前記エクソスケルトンの別の周期基本軌道への各遷移は、前記初期周期基本軌道、少なくとも1つの中間周期基本軌道及び前記最終周期基本軌道を連続的に含む一連の周期基本軌道として定義され、前記第2のデータベースを構築することは、前記第1の学習データベースの初期周期軌道及び最終周期軌道の各対について、前記少なくとも1つの中間周期基本軌道を決定することを含む。
初期周期基本軌道と最終周期軌道との間の各中間周期基本軌道は、前記初期周期基本軌道と最終周期基本軌道との線形的な混合である。
前記初期周期軌道及び最終周期軌道の各対について、前記少なくとも1つの中間周期基本軌道を決定することは、1つの周期基本軌道から別の周期基本軌道に通過するためのコストが、前記エクソスケルトンの動力学における不一致を表すように、周期基本軌道のグラフにおいて前記初期周期基本軌道から前記最終周期軌道までいわゆる最短経路アルゴリズムを用いる。
前記ステップ(b)は、前記第2のニューラルネットワークの予測の精度を表す基準を検証することをさらに含み、該基準が検証されていない場合、前記ステップ(b)が繰り返される。
第2の態様によれば、本発明はエクソスケルトンの軌道を生成する方法に関し、当該方法は、
(c)第1の態様に係る、エクソスケルトンの軌道を生成するためにニューラルネットワークのパラメータを学習する方法を用いて学習した第2のニューラルネットワークのパラメータを第2のサーバのメモリに記憶するステップと、
(d)前記第2のニューラルネットワークを用いることにより、前記第2のサーバのデータ処理手段によって前記エクソスケルトンの軌道を生成するステップと、
を含む。
(c)第1の態様に係る、エクソスケルトンの軌道を生成するためにニューラルネットワークのパラメータを学習する方法を用いて学習した第2のニューラルネットワークのパラメータを第2のサーバのメモリに記憶するステップと、
(d)前記第2のニューラルネットワークを用いることにより、前記第2のサーバのデータ処理手段によって前記エクソスケルトンの軌道を生成するステップと、
を含む。
他の有利且つ非限定的の特徴によれば、前記エクソスケルトンは人間のオペレータを受容し、前記ステップ(d)は、前記オペレータによって所望される前記エクソスケルトンの一連のn組の歩行パラメータを特定することを含み、前記エクソスケルトンの軌道は、該一連のn組の歩行パラメータに従って生成される
前記エクソスケルトンの生成された軌道は、前記一連のn組の歩行パラメータのそれぞれについて、新たな周期基本軌道と、該新たな周期基本軌道への遷移とを含む。
第3の態様によれば、本発明は、複数の自由度を含み、該複数の自由度のうちの少なくとも1つの自由度はデータ処理手段によって制御されるアクチュエータによって作動されるエクソスケルトンを動作させる方法に関し、当該方法は、前記エクソスケルトンが歩行できるように、第2の態様に係るエクソスケルトンの軌道を生成する方法により生成された前記エクソスケルトンの軌道を、前記エクソスケルトンのデータ処理手段により実行するステップ(e)を含む。
第4の態様によれば、本発明は、それぞれがデータ処理手段を含む第1のサーバ、第2のサーバ及びエクソスケルトンを含むシステムに関し、前記データ処理手段は、第1の態様に係る、前記エクソスケルトンの軌道を生成するためにニューラルネットワークのパラメータを学習する方法、第2の態様に係る、前記エクソスケルトンの軌道を生成するための方法及び/又は第3の態様に係る、前記エクソスケルトンを動かすための方法を実施するように構成されている。
第5及び第6の態様によれば、本発明は第1の態様に係る、エクソスケルトンの軌道を生成するためにニューラルネットワークのパラメータを学習する方法、第2の態様に係る、エクソスケルトンの軌道を生成するための方法及び/又は第3の態様に係る、エクソスケルトンを動かすための方法を実行するためのコード命令を含むコンピュータプログラム製品と、第1の態様に係る、エクソスケルトンの軌道を生成するためにニューラルネットワークのパラメータを学習する方法、第2の態様に係る、エクソスケルトンの軌道を生成するための方法及び/又は第3の態様に係るエクソスケルトンを動かすための方法を実行するためのコード命令を含むコンピュータプログラム製品が記憶される、IT機器によって読み取り可能な記憶手段に関する。
本発明の他の特徴及び利点は、下記の好ましい実施形態の説明を読んだ場合に明確になるであろう。添付の図面を参照しながら説明する。
図1は、本発明に係る方法を実施するためのアーキテクチャの図である。
図2は、本発明に係る方法によって用いられるエクソスケルトンの図である。
図3は、本発明に係る方法で用いられるニューラルネットワークの図である。
図4は、本発明に係る方法の好ましい実施形態を示す図である。
アーキテクチャ
本発明の3つの相補的な態様によれば、
-エクソスケルトン1の軌道を生成するために、とりわけFNN(Feedforward Neural Network)型のニューラルネットワークのパラメータを学習するための方法と、
-(前述の方法により有利に学習したニューラルネットワークを用いて)エクソスケルトン1の軌道を生成する方法と、
-(第2の態様の方法に係る方法により生成された軌道を適用して)エクソスケルトン1を動かすための方法と、
が提案される。
本発明の3つの相補的な態様によれば、
-エクソスケルトン1の軌道を生成するために、とりわけFNN(Feedforward Neural Network)型のニューラルネットワークのパラメータを学習するための方法と、
-(前述の方法により有利に学習したニューラルネットワークを用いて)エクソスケルトン1の軌道を生成する方法と、
-(第2の態様の方法に係る方法により生成された軌道を適用して)エクソスケルトン1を動かすための方法と、
が提案される。
これらの3つの種類の方法は図1に示すアーキテクチャにおいて、第1のサーバ10a及び/又は第2のサーバ10bにより実施される。第1のサーバ10aは(第1の方法を実施する)学習サーバであり、第2のサーバ10bは(第2の方法を実施する)軌道を生成するサーバである。これらの2つのサーバが統合されることは完全に可能であるが、実際には、第1のサーバ10aはリモートサーバであるのに対して、第2のサーバ10bは、リアルタイムな動作のためにエクソスケルトン1に組み込むことが可能である。
一般に、これらのサーバ10a、10bのそれぞれは、データをやりとりするためにインターネットネットワーク等のワイドエリアネットワーク20に接続されるIT機器のであるが、実際には、ニューラルネットワークが学習され、第2のサーバ10bに埋め込まれた場合、通信を少なくとも断続的に中断できる。各サーバは、プロセッサ型のデータ処理手段11a、11b(特に、学習することは、学習したニューラルネットワークの単純な使用に比べて長く複雑であるため、第1のサーバのデータ処理手段11aは高い計算能力を有する)と、適用可能な場合には、コンピュータメモリ、例えばハードドライブ等のデータ記憶手段12a、12bを含む。さらに、学習データベースは、第1のサーバ10bのメモリ12aに記憶される。
本発明に係る3種類の方法を組み合わせた好ましい実施形態によれば、システムは、第2の機器10bが組み込まれたエクソスケルトン1にネットワーク20を介して接続される第1のサーバ10aを含む。
-第1のサーバ10aは、適用可能な場合に、その計算能力を用いて2つの学習データベースを構成し、次に、これらの学習データベースを用いて第2のニューラルネットワークのパラメータを学習するための方法を実施し、第2のニューラルネットワークから学習したパラメータを第2のサーバ1bに送信する。
-第2のサーバ10bは、第1のサーバ10aから読み出したパラメータを用いたニューラルネットワークにより、エクソスケルトン1の軌道を生成する方法を実施する。
-エクソスケルトン1は、その場で生成された軌道を直接適用して動作する。
-第1のサーバ10aは、適用可能な場合に、その計算能力を用いて2つの学習データベースを構成し、次に、これらの学習データベースを用いて第2のニューラルネットワークのパラメータを学習するための方法を実施し、第2のニューラルネットワークから学習したパラメータを第2のサーバ1bに送信する。
-第2のサーバ10bは、第1のサーバ10aから読み出したパラメータを用いたニューラルネットワークにより、エクソスケルトン1の軌道を生成する方法を実施する。
-エクソスケルトン1は、その場で生成された軌道を直接適用して動作する。
それぞれに第2のサーバ10bが組み込まれた複数のエクソスケルトン1があるか(その場合、パワー及び空間が限られるため、専用のエクソスケルトン1ためのみに軌道を生成する)又はより強力で、任意で第1のサーバ10aと統合可能な(そして、全てのエクソスケルトン1のためにすぐさま軌道を生成する能力を有する)第2のサーバ10bにそれぞれが接続される複数のエクソスケルトン1があることが分かる。
図2を参照して、「エクソスケルトン1」という用語は、作動及び制御され、2本の脚を備え、それぞれの下肢がエクソスケルトン1の脚(とりわけストラップにより)に取り付けられた人間のオペレータをより正確に受容する二足歩行ロボット装置型の関節式機械システムを意味する。そのため、それは多かれ少なかれヒューマノイドロボットであり得る。ここで、「歩行」とは、ロボット装置1を広義に動かすことを意味し、立位(平地、傾斜ランプ、階段等)において、変位だけでなく、座位から立位へ移行する動作(「立ち上がり」とも呼ばれる動作)又はその反対の動作が得られるように脚に対して交互に支持をもたらすものである。
エクソスケルトン1は複数の自由度、すなわち、(概して回転を介した)変形可能な関節、すなわち、互いに対して可動であり、それが「作動される」か又は「作動されない」かのいずれかである。
作動された自由度は、データ処理手段11cによって制御されるアクチュエータを備えた関節を示す。すなわち、この自由度は制御されており、それに作用することができる。反対に、作動されない自由度は、アクチュエータがない関節、すなわち、この自由度は、それ自身の動力学に従い、データ処理手段11cはそれに何ら直接的な制御を及ぼさない(ただし、先験的には、他の作動自由度を介した間接的な制御である)。図1の例では、踵と地面とは点接触であるため、エクソスケルトン1はこの接触点に対して自由に回転する。そのため、踵-臀部軸と垂直との間の角度は、作動されない自由度を構成する。
本発明のエクソスケルトンは、前述したように、当然ながら、少なくとも1つの作動自由度、好ましくは複数の作動自由度と、好ましくは作動されない(すなわち「劣駆動」と言われる)少なくとも1つの自由度とを含む。作動されない自由度の数は、劣駆動度と呼ばれる。
データ処理手段11cは、IT機器(通常、エクソスケルトン1が「遠隔制御」されている場合には外付けプロセッサであるが、エクソスケルトン1に組み込まれていることが好ましい)を表し、適用可能な場合では、組み込まれている場合は第2のサーバ10bのデータ処理手段11bと統合され(図2に示す場合)、様々なアクチュエータのために命令を処理し、コマンドを生成するのに好適である。後者は、電気的、油圧的等であり得る。
エクソスケルトン1は、メモリ12(特に、第2のサーバ10bのメモリ、即ち、サーバ10bが組み込まれていない場合、手段12は外付けとすることができる)と、地面13に対する足の衝撃を検出する手段、慣性測定手段14、オペレータのセンサベスト15等の様々なセンサとをさらに含むことができる。
本願は、如何なるエクソスケルトン1のアーキテクチャにも限定されず、例は、国際出願公開第2015/140352号及び国際出願公開第2015/140353号に記載されているようなものとする。
そのため、好ましくは、そしてこれらの出願によれば、エクソスケルトン1は、各脚に、エクソスケルトンを装着した人の足が平らな場合に当接する支持平面を含む足構造を含む。
この支持平面は前側プラットフォーム及び後ろ側プラットフォームを含み、足軸動接続は、作動されない自由度を構成することにより、前側プラットフォームを後ろ側プラットフォームに接続する。このようなアーキテクチャは、「HZD」型の軌道にとりわけ適している。
しかしながら、当業者であれば、本方法を他の任意の機械的アーキテクチャに適合させる方法を知っているであろう。
発明の原理
過去数年、リアルタイム制御の分野における人工知能技術への関心が高まっている。
過去数年、リアルタイム制御の分野における人工知能技術への関心が高まっている。
残念ながら、軌道を生成するための現在のプロセスは、誤差の逆伝搬に必要な解析的勾配がないため、補強による学習方法との互換性がほとんどない。次に、Q学習や方策勾配等のより複雑な方法にはリソースが必要となり、取得するのが高価なより多くの実験データを必要とする。加えて、これらの方法では、実際のエクソスケルトン1で学習を行うことができない。したがって、シミュレーションを行う必要がある。
そのため、ロボット工学における特定の研究は、計画タスクを実行するためにニューラルネットワークを利用するが、その使用は非線形回帰に限定され、ほとんどの場合、軌道のデータベースを圧縮し、それによりそれを実装置に容易に埋め込むことを目的としている。このアプローチは、ニューラルネットワークを、マシンラーニングではなく従来のロボット工学の分野から生じる課題に焦点を当てた研究の枠組における「ブラックボックス」ツールのステータスに限定し、研究の展望をほとんど提供しない。さらに、軌道はモデル化が困難なデータであり、後者は入力パラメータに関して多くの不規則性とカオス的性質を有するため、これらの研究のパフォーマンスは緩和されている。
本方法は、第1及び第2のニューラルネットワークと呼ばれる2つのニューラルネットワークを連続的に学習することにより、これらの困難を巧みに解決する。第2のニューラルネットワークは、エクソスケルトンの軌道を効果的に生成することを可能にする「出力」ネットワークである。
説明したように、エクソスケルトンの「軌道」とは、時間又はフェーズ変数の関数として表される各自由度(とりわけ作動自由度)の変化を意味する。
このアイデアは、「複雑な」軌道を、遷移によって交わる「基本(elementary)」と呼ばれる一連の周期軌道を定義することである。周期軌道(periodic
trajectory)という用語は、ステップの開始時におけるエクソスケルトン1の初期状態(足の接触の時点)から始まるような方法で、ステップの期間にわたって適用される(適用可能な場合には繰り返し)任意の軌道を意味し、次のステップの開始時に同じ状態に戻る(説明したように、これはあらゆる平坦な歩行を包含するが、ランプ上を歩くこと、階段の上り下り等も包含する)。また、周期軌道は「限られた周期」を形成すると言われている。そのため、前記周期軌道は、安定した態様で任意の数のステップにわたって適用可能である。
trajectory)という用語は、ステップの開始時におけるエクソスケルトン1の初期状態(足の接触の時点)から始まるような方法で、ステップの期間にわたって適用される(適用可能な場合には繰り返し)任意の軌道を意味し、次のステップの開始時に同じ状態に戻る(説明したように、これはあらゆる平坦な歩行を包含するが、ランプ上を歩くこと、階段の上り下り等も包含する)。また、周期軌道は「限られた周期」を形成すると言われている。そのため、前記周期軌道は、安定した態様で任意の数のステップにわたって適用可能である。
つまり、各基本軌道は、エクソスケルトン1の所与の歩行(n組の歩行パラメータによって定義される歩行)に関連し、安定で実行可能な形でこの歩行を維持することを可能にする(即ち、見られるように、最適化の課題の全ての制約を尊重し、可能な限りコスト関数を最小化する)。前述のように、歩行パラメータは、ステップの長さ、歩行頻度及びバストの傾き等の歩き方の「特性」に対応するだけでなく、階段を交渉する場合はステップの高さ、湾曲動作の場合は瞬間的な回転角度、オペレータの形態学的特徴(患者パラメータと呼ばれる歩行パラメータのサブグループ)、例えば、サイズ、体重、大腿部又は脛骨の長さ、質量中心の位置(前方へのシフトの値)及びリハビリテーション活動の枠組におけるバストの側方偏位にも対応する。
上述した歩行の「制約」は変化させることができ、所望の歩行の種類、例えば、「フラットフット」歩行又は「HZD」に依存する。本方法は任意の種類の所望の歩行に限定されない。
遷移は、歩行の変化、すなわち、前記歩行パラメータの値の変化(例えば、歩幅の長さの増加)に対応する。歩行パラメータの初期セット及び歩行パラメータの最終セット、故に、(歩行パラメータの初期セットに関連する)初期周期軌道及び(歩行パラメータの最終セットに関連する)最終周期軌道を知ることで、前記遷移は、初期周期軌道から最終軌道に移行することを可能にする軌道の断片である。なお、「初期」又は「最終」の遷移、例えば、立ち上がるか又は座る動作があり得るが、初期遷移又は最終遷移を予め計算できるという点で、周期軌道の間の「中間」遷移に焦点を当てるものとする。
これからわかるように、このような遷移は、周期軌道の空間における経路として見えることができる。すなわち、初期周期軌道と最終周期軌道との間で、とりわけこれらの2つの軌道の間の「混合」に対応する、すなわちこれらの初期及び最終軌道の間の中間歩行パラメータを有する1つ以上の中間軌道を計画することができる。実際には、一連の可能な中間周期基本軌道セット(特に、初期及び最終軌道の一方から他方への歩行パラメータを直線的に変化させることによる全ての軌道)を予め利用でき、遷移軌道の決定は、中間軌道の適切な連続を選択することからなる(有利には、以下に示すように「進行」と呼ばれる関数によってパラメータ化される)。これらの中間軌道の数を設定でき、それらは均一に分布すること、すなわち、可能な中間軌道の全てが連続し且つ線形の遷移を形成することが有利である。
つまり、初期軌道から最終軌道へと瞬時に移行するのではなく、これは連続するサイクルにわたって小さな増分で進行する。遷移が十分ゆっくりの場合、軌道の漸進的な変化の影響を無視することができる。つまり、システムの状態は実質的に、各ステップにおける限定的なサイクルに属する。
第1のニューラルネットワークは歩行を予測することができる。すなわち、エクソスケルトン1の所与の歩行のためにエクソスケルトン1の周期基本軌道を生できる。つまり、第1のニューラルネットワークは、n組の歩行パラメータを入力として取り、対応する周期軌道を出力として生成する。この利点は、このアプローチでは寸法の数が限定されるため、現在のシステムの範囲内にとどまることができる点である。
第2のニューラルネットワークは、第1のニューラルネットワークによって得られるものと同一の周期的な歩行を生成できるが、また、周期的な歩行サイクルの間で物理的に許容される遷移を予測すること、すなわち、周期基本軌道及び遷移の両方を生成すること、すなわち、最終的に任意の軌道を生成することも可能である。したがって、これは第1のニューラルネットワークを一般化し、置き換えとなる。
第1及び第2のネットワークのそれぞれは、好ましくは、FNN(Feedforward Neural Network)型のネットワークである。すなわち、情報は、反復的な接続なしに入力ノードから隠れ層(該当する場合)を通って出力ノードへと一方向(順方向)にしか流れない。何故なら、このようなネットワークは優れたスケーラビリティを有するからである。とりわけ、2又は3の隠れ層を有し、層当たり200~300個のニューロンを有するFNNを採用することができる。あるいは、畳み込みニューラルネットワーク(CNN)、LSTM(Long Short-term Memory)又はGRU(Gated Recurrent
Unit)型等のリカレントネットワーク等の他の種類のニューラルネットワークを使用することもできる。
Unit)型等のリカレントネットワーク等の他の種類のニューラルネットワークを使用することもできる。
なお、第1及び/又は第2のニューラルネットワークは、歩行パラメータに関して連続的に導出可能な性質を有することが望ましく、このために、例えば、連続的に導出可能な(特にReLUとは反対に)S字型の活性化機能を用いるネットワークが好ましい。
図3に示すとりわけ好ましい実施形態によれば、第1及び第2のネットワークのそれぞれは、交互に畳み込み層及びアップサンプリング層を用いる、デコンボリューション(又は転置畳み込み)と呼ばれる最終ブロックを有するFNNであることが有利である。より正確には、このアーキテクチャは、オートエンコーダ(又は「エンコーダ-デコーダ」)と呼ばれる構造を形成し、主FNNブロックは、初期コード化シーケンスと呼ばれる小さな寸法の特徴マップを生成することによりエンコーダの役割を果たし、デコンボリューションブロックは、初期コード化シーケンスから予測される軌道を定義する出力シーケンスを再構成することによりデコーダの役割を果たす。このアーキテクチャは、その構造が互いに相関する時間シーケンスを自然に予測することから、学習すべきパラメータが少ないため、従来のFNNの場合のようにこのゼロ挙動を学習する必要はない。
学習方法
第1の態様によれば、第1のサーバ1aのデータ処理手段11aによって実施される学習方法が提案される。
第1の態様によれば、第1のサーバ1aのデータ処理手段11aによって実施される学習方法が提案される。
図4で図示説明するように、この方法は、エクソスケルトン1の一連の可能な歩行のための周期軌道を学習するための第1のデータベースに従って、n組の歩行パラメータによって定義されるエクソスケルトン1の所与の歩行のために、エクソスケルトン1の周期基本軌道を生成することが可能な第1のニューラルネットワークのパラメータを学習するステップ(a)から始まる。
好ましくは、このステップ(a)は、前記第1の学習データベースの構築、すなわち、それを構成する前記周期軌道を生成することを含む。
このアイデアは、エクソスケルトン1の一連の可能な歩行をカバーすること、すなわち、可能であれば、良好に分布された関連する軌道として、多数のn組の歩行パラメータを有することである。
説明したように、これについての最適化ツールが知られており、特に、様々な歩行パラメータから構成される一連の許容可能なリサーチのコンパクトな空間にわたる最適化によって、軌道の第1のデータベースを生成することが可能である。例えば、HZD軌道の場合では、軌道を生成する課題は、いわゆる直接コロケーションアルゴリズム(direct collocation algorism)によって好ましくは解決可能な最適制御課題の形態で定式化される。Omar Haribらの「Feedback Control of a Exoskeleton
for Paraplegics for Towards Robusly Stable Hands-Free Dynamic Walking」参照されたい。
for Paraplegics for Towards Robusly Stable Hands-Free Dynamic Walking」参照されたい。
サンプルは、少数のサンプルについてさえも完全な空間の均一なカバーを保証し、正確にその境界を含むように、パラメータ毎に同一の数の可能な値を有する有限集合にわたって一様で離散化された法則に従ってランダムに生成されることが有利である。数学的には、これは、任意の所与のn組のパラメータに対して、「閉じられた」サンプルがあることを意味する。
なお、第1の学習ベースを構成するこのステップは長いが、はるか上流で行うことができ、第1のベースは少しずつ完成させることができる。予め構築されたベースから開始することも可能である。
第1のネットワーク自体の学習については、とりわけ監督学習(supervised learning)により従来の方法で進めることができ、最終的に、学習の有無を検証するためにニューラルネットワークの予測精度を表す基準を検証することができる。
より厳密には、予測誤差はステップの間の実際のエクソスケルトンの参照モニタリングの最大誤差よりも平均で有意に小さくなければならない。すなわち、0.01rad等の閾値よりも大きい予測の最大誤差(無限標準で、即ち、全ての関節及び全ての瞬間が全体として取る)を有する予測の所与の一部(特に4%)よりも小さくなければならない。
もしそうでない場合、軌道生成アルゴリズム自体は、基準(本ケースではニューラルネットワークの予測に対応する)に類似した軌道を生成するようにそれを促すような方法で変更することができる。
次いで、新たな第1のデータベースはこの方法論に従うことによって生成されることが好ましく、第1のニューラルネットワークは、ステップ(a)の新たな発生において、それを再初期化することなく、むしろ、その先行状態に関して漸増的に、この新たなベース上で再訓練される(すなわち、ステップ(a)の最初の発生の終わりで得られた重みから始める)。予測の精度基準が依然検証されていない場合は、そのプロセスが繰り返される。
ステップ(a)の終わりに、周期軌道を予測可能な第1のニューラルネットワークが利用可能になる。これらの周期軌道は、実行可能で安定したものであることが保証される。すなわち、それは、軌道最適化アルゴリズムから生じる最適化の課題の全ての制約を満たし、元の課題のコスト関数を可能な限り最小化する。説明したように、提案したアプローチを遷移の生成に広げることは探索すべき次元の数が大きすぎるため可能ではない。
所与のタスクに対して多数(無限大の場合も)の実現可能な軌道が存在することが理解される(即ち、制約を満たす)。最適化プロセスの役割は、後者(実際にはエネルギー)の中から選択されるコストを最小化するものを計算することである。しかしながら、これらの解決策の全てはニューラルネットワークによってモデル化することが困難であり、そのため、完全にモデル化できる軌道のみに最適化の課題を限定することを希求している。具体的には、データベースの全ての軌道間のコンセンサスの問題である。すなわち、後者は、集合としてモデル化することができ、正確で信頼性の高い予測(即ち、訓練サンプルについてであるが、試験サンプルについてもエクソスケルトン1で実行可能/安定)を保証するためには、互いに合意しなければならない。この問題を直接解決することは、複雑すぎるため不可能であることから、ここでは反復法が役立つ。
そのため、説明したように、本方法は、第1のニューラルネットワークからのパラメータを用いて、エクソスケルトン1の周期基本軌道と、エクソスケルトン1の1つの周期基本軌道からエクソスケルトン1の別の周期基本軌道へ遷移の生成に好適な第2のニューラルネットワークのパラメータを、エクソスケルトン1の一連の可能な歩行のセットのための周期基本軌道及び遷移の第2の学習データベースに従って学習するステップ(b)を含む。
好ましくは、第2のニューラルネットワーク及び第1のニューラルネットワークは、説明したように同じアーキテクチャ(例えば、図3のアーキテクチャ)を有することが好ましいが、第2のニューラルネットワークは、ステップ(b)の間に追加のパラメータが学習可能できるため、(例えば、FNNの場合層単位でより多くのパラメータを有することにより又は例えば、畳み込みネットワークの場合は多くのチャネルを有することにより)より多くの数のパラメータを含む。任意で、ステップ(a)で得られた値から開始することにより、共通パラメータをステップ(b)で再学習することもできる。あるいは、第2のニューラルネットワークは、第1のネットワークに対して追加の層を有して、第1のニューラルネットワークに対応することができ、そのパラメータはステップ(b)の間に学習される。
ステップ(a)の場合と同じように、ステップ(b)は前記第2の学習データベースの構築、すなわち、それを構成する周期軌道及び遷移を生成することを含むことができることが分かる。これは前記第1のデータベースからのものであることが有利である。より具体的には、全ての遷移は、第1の学習データベースのいわゆる初期周期軌道から、第1の学習データベースの別のいわゆる最終周期軌道へと構成される。この場合も、第2の学習ベースははるか上流に構築され、少しずつ完成され及び/又は予め構築できる。
説明したように、遷移は、周期軌道の空間における最初の軌道から最後の軌道への経路とみなすことができ、第2のベースは、第1のベースの初期及び最終周期基本軌道の各対(即ち、最初の軌道と他方の最終軌道を指定するn組の歩行パラメータの各対)について、一方から他方への遷移を含むことができる。全ての可能な遷移は、遷移の振幅に関係なく、蓋然性が等しいとみなされることが有利である。
実際には、周期歩行予測のみに基づく発見的方法を提案することができる。アプローチは以下の通りである。
1)歩行パラメータを直線的に変化させることにより、初期周期軌道から最終軌道までの範囲の(可能な限り多くの中間軌道である)周期軌道の格子を生成する。これらの中間軌道は、2つの初期及び最終軌道の間の線形混合に対応する。説明したように、中間軌道の数を設定でき、それらは一様に分布していることが有利である。
2)遷移は、この格子を左上隅(すなわち、開始時の初期周期軌道)から右下隅(最終時の最終軌道)へと通過する任意の経路に対応する。無限の可能性のある選択肢の中で最適と考えられる遷移は、制約下でいわゆる最短経路アルゴリズムを用いて計算することができる。グリッドを無向グラフ、すなわちグラフの頂点は周期基本軌道(初期、最終、中間)であると考えることにより、ある頂点から別の頂点への各遷移(エッジの移動、即ち軌道の変化)に関連するコストは、ある周期歩行から別の周期歩行への遷移による動力学の「不一致」に対応し、その目的は軌道全体にわたる遷移の「矛盾」を最小化することである。より正確には、移行期間中に、不均衡をもたらすリスクがある過度に大きな影響を有し得る軌道の変化を回避することが望ましい。この矛盾は、数学的に、遷移軌道に沿った動力学方程式の違反に対応する。例えば、遷移軌道から計算した数値微分と動力学方程式による期待項との間の残差誤差を用いることができる。実際には、説明したように、格子内の移動は、初期周期軌道と最終周期軌道との間の漸進的な遷移を定義する「進行」と呼ばれる関数によってパラメータ化することができ、この関数は、例えば、係数が矛盾を最小限にし、前記最短経路アルゴリズムの結果としてエッジ条件を尊重するように最適化された多項式によってパラメータ化することができる。
第2のネットワーク自体の学習については、コスト関数を最小限に抑えることで進めることができるが、学習の有無を検証するために、ニューラルネットワークの予測精度を表す前記基準をここでも最後にチェックする。
ステップ(b)の最後で、(遷移を含む)複雑な軌道を予測可能な第1のニューラルネットワークが利用可能である。次いで、第2のニューラルネットワーク(より具体的にはその学習パラメータ)をステップ(c)で(好ましくは、エクソスケルトン1の)第2のサーバ10bに組み込むことができる。
軌道を生成する方法
第2の態様によれば、第2のサーバ1bのデータ処理手段11bによって実施される、エクソスケルトン1の軌道の軌道を生成する方法が提案される。エクソスケルトン1の軌道の軌道を生成する方法は、第1の態様に係る、第2のニューラルネットワークの学習方法の実施に続く。より具体的には、これは、エクソスケルトン1の軌道を生成するためにニューラルネットワークのパラメータを学習する方法によって学習された第2のニューラルネットワークのパラメータを、第2のサーバ10bのメモリ12に記憶するステップ(c)から始まる。
第2の態様によれば、第2のサーバ1bのデータ処理手段11bによって実施される、エクソスケルトン1の軌道の軌道を生成する方法が提案される。エクソスケルトン1の軌道の軌道を生成する方法は、第1の態様に係る、第2のニューラルネットワークの学習方法の実施に続く。より具体的には、これは、エクソスケルトン1の軌道を生成するためにニューラルネットワークのパラメータを学習する方法によって学習された第2のニューラルネットワークのパラメータを、第2のサーバ10bのメモリ12に記憶するステップ(c)から始まる。
説明したように、第2のニューラルネットワークは十分に前もって生成して、多くのエクソスケルトン1に組み込むことができる。それはリアルタイムに実施されることが好ましい。
前記第2の方法は、エクソスケルトン1の動作期間にわたって定期的に実施でき、特に、前記第2のニューラルネットワークを用いることによって第2のサーバ10bのデータ処理手段11bによりエクソスケルトン1の軌道を生成するステップ(d)において、周期軌道及び/又は遷移を得るような方法で、前記第2のニューラルネットワークを繰り返し呼び出すことを任意で含む。
より具体的には、漸進的に得られたn組の歩行パラメータのシーケンスが想定される(例えば、エクソスケルトンのオペレータからの新しいコマンドにより)。新たなn組のパラメータのそれぞれについて、第2のニューラルネットワークは新たな周期軌道と、この新たな周期軌道の方への遷移を決定する。
そのために、軌道を生成する方法は、エクソスケルトン1のn組の歩行パラメータを決定すること(適用可能な場合には、規則的に反復する)を含むことが有利である。
実際に、エクソスケルトン1が人間のオペレータを受容するエクソスケルトンの場合、前記パラメータを決定するのは(歩行の速度及び/又は方向のセットポイントを含むスタートアップ要求を直接受け取ることができる通常のロボットの場合とは異なり)前記人間のオペレータの姿勢(及び任意でボタンの押圧)である。
そのために、オペレータには、説明したように、それらのバストの構成(後者の方向)を検出することを可能にするセンサベスト15を設けることができる。オペレータがバストを向ける方向は、オペレータが歩きたい方向であり、スピードは、オペレータがバストを前方に寄せる強度(オペレータが横になる程度)によって与えられる。スタートアップ要求は、歩行を開始する意図ことを伝達し、データ処理手段に前記パラメータを決定するように命令するためにオペレータがボタンを押すこと(又は特定の姿勢)に対応する。瞬間的な回転角又は交渉階段の場合の段の高さ等のいくつかのパラメータは、他のセンサ13、14によって予め決定するか又は得ることができる。
第3の態様によれば、エクソスケルトン1を動作させる方法が提案され、エクソスケルトンの軌道を生成するための、第2の態様(ステップ(a)、(b)、(c)、(d))に係る前記方法の実施を含み、次いで((e)として言及したステップにおいて)、エクソスケルトン1が歩行するように前記軌道の実行することを含む。
ステップ(d)及びステップ(e)は、エクソスケルトン1の軌道を常にリアルタイムで補正するような方法で繰り返すことができる。
機器及びシステム
第4の態様によれば、本発明は、第1及び第2及び/又は第3の態様に係る方法の実施のためのシステムに関する。
第4の態様によれば、本発明は、第1及び第2及び/又は第3の態様に係る方法の実施のためのシステムに関する。
説明したように、このシステムは、第1のサーバ10a、第2のサーバ10b及び場合によっては統合されたエクソスケルトン1を含む。
第1のサーバ10aは、第1の態様に係る方法の実施のためのデータ処理手段11aを含む。
第2のサーバ10bは、第2の態様に係る方法を実施するためのデータ処理手段11bと、第2のニューラルネットワーク(又はその学習パラメータ)を記憶するためのデータ記憶手段12とを概して含む。
エクソスケルトン1は、第3の態様に係る方法の実施のために構成されたデータ処理手段11cと、必要に応じて、データ記憶手段12(特に、第2のサーバ10bのモノ)、慣性測定手段14(慣性測定手段)、地面13に対する足の衝撃を検出する手段(接触センサ又は任意の圧力センサ)及び/又はセンサベスト15を含む。
それは複数の自由度を有し、複数の自由度のうちの少なくとも1つの自由度は、第3の態様に係る方法を実施する枠組みにおいて、データ処理手段11cによって制御されるアクチュエータによって作動される。
コンピュータプログラム製品
第5及び第6の態様によれば、本発明はコンピュータプログラム製品に関し、コンピュータプログラム製品は、ニューラルネットワークのパラメータを学習する第1の態様に係る方法、エクソスケルトン1の軌道を生成する第2の態様に係る方法及び/又はエクソスケルトン1を動かすための第3の態様に係る方法の(処理手段11a、11b、11c上での)実行のためのコード命令及びこのコンピュータプログラム製品が見出されるIT機器によって読み出しが可能な記憶手段を含む。
第5及び第6の態様によれば、本発明はコンピュータプログラム製品に関し、コンピュータプログラム製品は、ニューラルネットワークのパラメータを学習する第1の態様に係る方法、エクソスケルトン1の軌道を生成する第2の態様に係る方法及び/又はエクソスケルトン1を動かすための第3の態様に係る方法の(処理手段11a、11b、11c上での)実行のためのコード命令及びこのコンピュータプログラム製品が見出されるIT機器によって読み出しが可能な記憶手段を含む。
Claims (17)
- エクソスケルトンの軌道を生成するためにニューラルネットワークのパラメータを学習する方法であって、当該方法は、第1のサーバのデータ処理手段により、
(a)前記エクソスケルトンの一連の可能な歩行のための周期軌道を学習するための第1のデータベースに従って、前記エクソスケルトンの周期基本軌道を生成するのに好適な第1のニューラルネットワークのパラメータを学習するステップであって、該パラメータのそれぞれは、n組の歩行パラメータによって定義される前記エクソスケルトンの所与の歩行のためのものである、ステップと、
(b)前記エクソスケルトンの一連の可能な歩行のための周期基本軌道及び遷移の第2の学習データベースに従って、前記エクソスケルトンの周期基本軌道と、前記エクソスケルトンの1つの周期基本軌道から前記エクソスケルトンの別の周期基本軌道への遷移を生成するのに好適な第2のニューラルネットワークのパラメータを、前記第1のニューラルネットワークからのパラメータを用いて学習するステップと、
を実施することを含む、方法。 - 前記ステップ(a)は、最適化アルゴリズムを用いることにより、前記エクソスケルトンの一連の可能な歩行のための周期軌道の前記第1の学習データベースを構築することを含む、請求項1に記載の方法。
- 前記エクソスケルトンの一連の可能な歩行は、前記n組の歩行パラメータが値を有する空間が均一にカバーされるように選択される、請求項2に記載の方法。
- 前記ステップ(a)は、前記第1のニューラルネットワークの前記予測の精度を表す基準を検証することさらに含み、該基準が検証されていない場合、前記ステップ(a)が繰り返される、請求項2又は3に記載の方法。
- 前記ステップ(b)は、前記第1の学習データベースを用いて、前記エクソスケルトンの一連の可能な歩行のための周期軌道及び遷移を学習するための前記第2のデータベースを構築することを含む、請求項1乃至4のいずれか一項に記載の方法。
- 前記第2のデータベースは、前記第1の学習データベースの前記エクソスケルトンの周期基本軌道から、前記第1の学習データベースの前記エクソスケルトンの別の周期基本軌道への全ての遷移を含む、請求項5に記載の方法。
- 初期周期基本軌道と呼ばれる前記エクソスケルトンの周期基本軌道から、最終周期基本軌道と呼ばれる前記エクソスケルトンの別の周期基本軌道への各遷移は、前記初期周期基本軌道、少なくとも1つの中間周期基本軌道及び前記最終周期基本軌道を連続的に含む一連の周期基本軌道として定義され、前記第2のデータベースを構築することは、前記第1の学習データベースの初期周期軌道及び最終周期軌道の各対について、前記少なくとも1つの中間周期基本軌道を決定することを含む、請求項6に記載の方法。
- 初期周期基本軌道と最終周期軌道との間の各中間周期基本軌道は、前記初期周期基本軌道と最終周期基本軌道との線形的な混合である、請求項7に記載の方法。
- 前記初期周期軌道及び最終周期軌道の各対について、前記少なくとも1つの中間周期基本軌道を決定することは、1つの周期基本軌道から別の周期基本軌道に通過するためのコストが、前記エクソスケルトンの動力学における不一致を表すように、周期基本軌道のグラフにおいて前記初期周期基本軌道から前記最終周期軌道までいわゆる最短経路アルゴリズムを用いる、請求項7又は8に記載の方法。
- 前記ステップ(b)は、前記第2のニューラルネットワークの予測の精度を表す基準を検証することをさらに含み、該基準が検証されていない場合、前記ステップ(b)が繰り返される、請求項5乃至9のいずれか一項に記載の方法。
- エクソスケルトンの軌道を生成する方法であって、
(c)請求項1乃至10のいずれか一項に記載の、エクソスケルトンの軌道を生成するためにニューラルネットワークのパラメータを学習する方法を用いて学習した第2のニューラルネットワークのパラメータを第2のサーバのメモリに記憶するステップと、
(d)前記第2のニューラルネットワークを用いることにより、前記第2のサーバのデータ処理手段によって前記エクソスケルトンの軌道を生成するステップと、
を含む、方法。 - 前記エクソスケルトンは人間のオペレータを受容し、前記ステップ(d)は、前記オペレータによって所望される前記エクソスケルトンの一連のn組の歩行パラメータを特定することを含み、前記エクソスケルトンの軌道は、該一連のn組の歩行パラメータに従って生成される、請求項11に記載の方法。
- 前記エクソスケルトンの生成された軌道は、前記一連のn組の歩行パラメータのそれぞれについて、新たな周期基本軌道と、該新たな周期基本軌道への遷移とを含む、請求項12に記載の方法。
- 複数の自由度を含み、該複数の自由度のうちの少なくとも1つの自由度はデータ処理手段によって制御されるアクチュエータによって作動されるエクソスケルトンを動作させる方法であって、前記エクソスケルトンが歩行できるように、請求項11乃至13のいずれか一項に記載の、エクソスケルトンの軌道を生成する方法により生成された前記エクソスケルトンの軌道を、前記エクソスケルトンのデータ処理手段により実行するステップ(e)を含む、方法。
- それぞれがデータ処理手段を含む第1のサーバ、第2のサーバ及びエクソスケルトンを含むシステムであって、データ処理手段は、請求項1乃至10のいずれか一項に記載の、前記エクソスケルトンの軌道を生成するためにニューラルネットワークのパラメータを学習する方法、請求項11乃至13のいずれか一項に記載の、エクソスケルトンの軌道を生成するための方法及び/又は請求項14に記載の、エクソスケルトンを動かすための方法を実施するように構成されている、システム。
- 請求項1乃至10のいずれか一項に記載の、エクソスケルトンの軌道を生成するためにニューラルネットワークのパラメータを学習する方法、請求項11乃至13のいずれか一項に記載の、エクソスケルトンの軌道を生成するための方法及び/又は請求項14に記載のエクソスケルトンを動かすための方法を実行するためのコード命令を含むコンピュータプログラム製品であって、前記プログラムはコンピュータ上で実行される、コンピュータプログラム製品。
- 請求項1乃至10のいずれか一項に記載の、エクソスケルトンの軌道を生成するためにニューラルネットワークのパラメータを学習する方法、請求項11乃至13のいずれか一項に記載の、エクソスケルトンの軌道を生成するための方法及び/又は請求項14に記載のエクソスケルトンを動かすための方法を実行するためのコード命令を含むコンピュータプログラム製品が記憶される、IT機器によって読み取り可能な記憶手段。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR1910649 | 2019-09-26 | ||
FR1910649A FR3101463B1 (fr) | 2019-09-26 | 2019-09-26 | Procédés d’apprentissage de paramètres d’un réseau de neurones, de génération d’une trajectoire d’un exosquelette et de mise en mouvement de l’exosquelette |
PCT/FR2020/051672 WO2021058918A1 (fr) | 2019-09-26 | 2020-09-25 | Procedes d'apprentissage de parametres d'un reseau de neurones, de generation d'une trajectoire d'un exosquelette et de mise en mouvement de l'exosquelette |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022549448A true JP2022549448A (ja) | 2022-11-25 |
Family
ID=69375452
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022518764A Pending JP2022549448A (ja) | 2019-09-26 | 2020-09-25 | ニューラルネットワークのパラメータを学習する方法、エクソスケルトンの軌道を生成する方法及びエクソスケルトンを動かす方法 |
Country Status (9)
Country | Link |
---|---|
US (1) | US20220347847A1 (ja) |
EP (1) | EP4034344B1 (ja) |
JP (1) | JP2022549448A (ja) |
KR (1) | KR20220079854A (ja) |
CN (1) | CN114467097A (ja) |
AU (1) | AU2020351688A1 (ja) |
CA (1) | CA3154119C (ja) |
FR (1) | FR3101463B1 (ja) |
WO (1) | WO2021058918A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113829339B (zh) * | 2021-08-02 | 2023-09-15 | 上海大学 | 基于长短时记忆网络的外骨骼运动协同方法 |
CN113977557B (zh) * | 2021-11-18 | 2023-03-21 | 杭州电子科技大学 | 一种基于运动想象时频空特征的外骨骼机器人控制方法 |
EP4234177A1 (en) | 2022-02-25 | 2023-08-30 | Wandercraft | Methods for training a neural network and for using said neural network to stabilize a bipedal robot |
CN115755592B (zh) * | 2023-01-10 | 2023-05-12 | 常熟理工学院 | 调整三自由度外骨骼运动状态的多模态控制方法及外骨骼 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7153242B2 (en) | 2001-05-24 | 2006-12-26 | Amit Goffer | Gait-locomotor apparatus |
WO2009082249A2 (en) | 2007-12-26 | 2009-07-02 | Richard Little | Mobility aid |
CA2902074A1 (en) | 2013-03-13 | 2014-10-09 | Ekso Bionics, Inc. | Gait orthotic system and method for achieving hands-free stability |
FR3018681B1 (fr) | 2014-03-21 | 2016-04-15 | Wandercraft | Exosquelette comprenant une structure de bassin |
EP3125848B1 (fr) | 2014-03-21 | 2020-08-19 | Wandercraft | Exosquelette comprenant une structure de pied |
FR3061653B1 (fr) | 2017-01-10 | 2019-05-31 | Wandercraft | Procede de mise en mouvement d'un exosquelette |
-
2019
- 2019-09-26 FR FR1910649A patent/FR3101463B1/fr active Active
-
2020
- 2020-09-25 JP JP2022518764A patent/JP2022549448A/ja active Pending
- 2020-09-25 EP EP20790377.4A patent/EP4034344B1/fr active Active
- 2020-09-25 CN CN202080068196.1A patent/CN114467097A/zh active Pending
- 2020-09-25 WO PCT/FR2020/051672 patent/WO2021058918A1/fr unknown
- 2020-09-25 KR KR1020227012005A patent/KR20220079854A/ko unknown
- 2020-09-25 CA CA3154119A patent/CA3154119C/fr active Active
- 2020-09-25 US US17/760,895 patent/US20220347847A1/en active Pending
- 2020-09-25 AU AU2020351688A patent/AU2020351688A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
AU2020351688A1 (en) | 2022-04-07 |
KR20220079854A (ko) | 2022-06-14 |
CA3154119A1 (fr) | 2021-04-01 |
FR3101463A1 (fr) | 2021-04-02 |
WO2021058918A1 (fr) | 2021-04-01 |
FR3101463B1 (fr) | 2021-10-22 |
EP4034344A1 (fr) | 2022-08-03 |
CA3154119C (fr) | 2024-03-26 |
CN114467097A (zh) | 2022-05-10 |
EP4034344B1 (fr) | 2024-05-01 |
US20220347847A1 (en) | 2022-11-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2022549448A (ja) | ニューラルネットワークのパラメータを学習する方法、エクソスケルトンの軌道を生成する方法及びエクソスケルトンを動かす方法 | |
Chen et al. | Dynamic balance gait for walking assistance exoskeleton | |
Al-Shuka et al. | Modeling, stability and walking pattern generators of biped robots: a review | |
Albert et al. | Analytic path planning algorithms for bipedal robots without a trunk | |
Huang et al. | Optimisation of reference gait trajectory of a lower limb exoskeleton | |
Huan et al. | Adaptive gait generation for humanoid robot using evolutionary neural model optimized with modified differential evolution technique | |
US20240000648A1 (en) | Method for moving an exoskeleton | |
Zhao et al. | Realization of nonlinear real-time optimization based controllers on self-contained transfemoral prosthesis | |
US20230355458A1 (en) | Method for moving an exoskeleton | |
Kooij et al. | An alternative approach to synthesizing bipedal walking | |
Khan et al. | A review on gait generation of the biped robot on various terrains | |
Chen et al. | Step length adaptation for walking assistance | |
US20230069928A1 (en) | Methods for generating a trajectory of an exoskeleton and for setting the exoskeleton in motion | |
JP4587699B2 (ja) | ロボット装置及びその制御方法 | |
Kumar et al. | Analysis of an adaptive fuzzy control scheme: application to a lower limb exoskeleton | |
Wang et al. | Online gait generation for an exoskeleton used in lower limb rehabilitation | |
Spitz et al. | Minimal feedback to a rhythm generator improves the robustness to slope variations of a compass biped | |
EP4234177A1 (en) | Methods for training a neural network and for using said neural network to stabilize a bipedal robot | |
Chen et al. | Robust Robot Control for Human-Walking Assistance from Physical Human-Robot Interaction | |
Roy et al. | Walking of Prismatic Knee Biped Robot Using Reinforcement Learning | |
Ruina | Reflex approximation of optimal control for an energy-efficient bipedal walking platform | |
Bhardwaj et al. | Cycloidal Trajectory Realization on Staircase based on Neural Network Temporal Quantized Lagrange Dynamics (NNTQLD) with Ant Colony Optimization for a 9-Link Bipedal Robot | |
Rijt | Design of a Momentum-Based Optimal Controller for a Lower Limb Humanoid | |
Liu | Walking control for a bipedal model with exoskeleton applications | |
Roos | Design of a direct collocation model predictive control framework for legged locomotion based on whole-body dynamics and explicit contact phases |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230703 |