JP2022549448A

JP2022549448A - ニューラルネットワークのパラメータを学習する方法、エクソスケルトンの軌道を生成する方法及びエクソスケルトンを動かす方法

Info

Publication number: JP2022549448A
Application number: JP2022518764A
Authority: JP
Inventors: デュバーク，アレクシス; シュヴァレイル，ヤン; ボエリ，ギュイレム
Original assignee: ワンダークラフト
Priority date: 2019-09-26
Filing date: 2020-09-25
Publication date: 2022-11-25
Also published as: AU2020351688A1; KR20220079854A; CA3154119A1; FR3101463A1; WO2021058918A1; FR3101463B1; EP4034344A1; CA3154119C; CN114467097A; EP4034344B1; US20220347847A1

Abstract

本発明は、エクソスケルトン（１）の軌道を生成するためにニューラルネットワークのパラメータを学習する方法であって、当該方法は、第１のサーバ（１０ａ）のデータ処理手段（１１ａ）により、（ａ）前記エクソスケルトン（１）の一連の可能な歩行のための周期軌道を学習するための第１のデータベースに従って、前記エクソスケルトン（１）の周期基本軌道を生成するのに好適な第１のニューラルネットワークのパラメータを学習するステップであって、該パラメータのそれぞれは、ｎ組の歩行パラメータによって定義される前記エクソスケルトンの所与の歩行のためのものである、ステップと、（ｂ）前記エクソスケルトン（１）の一連の可能な歩行のための周期基本軌道及び遷移の第２の学習データベースに従って、前記エクソスケルトン（１）の周期基本軌道と、前記エクソスケルトン（１）の１つの周期基本軌道から前記エクソスケルトン（１）の別の周期基本軌道への遷移を生成するのに好適な第２のニューラルネットワークのパラメータを、前記第１のニューラルネットワークからのパラメータを用いて学習するステップと、を実施することを含む。

Description

本発明はエクソスケルトン型のロボットの分野に関する。より詳細には、本発明はニューラルネットワークのパラメータを学習する方法、エクソスケルトンの軌道を生成するためにニューラルネットワークを用いる方法及びエクソスケルトンを動かす方法に関する。

近年、対麻痺等の実質的な移動の問題を抱える人々のために、エクソスケルトンと呼ばれる歩行支援装置が登場し、該装置は、エクソスケルトンの動きをオペレータ（人間のユーザ）自身の動きに結びつけるファスナーのシステムのおかげで、オペレータが「装着」する外部ロボット装置である。下肢用のエクソスケルトンは、歩行の動きを再現するために、概して少なくとも膝及び臀部にいくつかの関節を有する。アクチュエータはこれらの関節を動かすことを可能にし、その結果オペレータを動かすことができる。インタフェースシステムは、オペレータがエクソスケルトンに命令を与えることを可能にし、制御システムはこれらの命令をアクチュエータに対するコマンドに変換する。装置は概してセンサが設けられている。

これらのエクソスケルトンは、オペレータが立ち上がり、歩くことを可能にするため、車椅子に対する進歩を成す。エクソスケルトンは、もはや車輪によって制限されず、理論的には平坦でない大半の環境で動作することができる。車輪は、脚とは異なって、段差、階段、高さが大きすぎる障害物等の実質的な障害を横断することができない。

しかしながら、これらのエクソスケルトンのいずれも、その使用において、自律的な人間の歩行（すなわち、広範な地形にわたって安定し、実行可能であり、人為的で補助されていない）を行うことができない。

ほとんどの場合、これらの制限は、装置がそれ自体でバランス又は歩行方向の管理を行うことができないことに起因する。これらの２つのタスクは、通常、オペレータに移され、オペレータは、例えば、特許文献１又は特許文献２で提案されているような松葉杖によりそれらのタスクを行う。

特許文献３には、自身の安定性を確保することができない人のために、外部の支援なしに用いることが可能な唯一のエクソスケルトンが記載されている。特許文献３の０１２２段落に記載されている制御原理は、支持ポリゴンの一部（地面との接触点の凸状の包絡線）の圧力の中心（地面によってシステムに対して作用する反力の結果に対応する物理的な点）を支持ポリゴンの別の部分に移す必要性が明確に説明されている。

この制限により、ステップの短い（通常の歩幅は５０～８０ｃｍであるが、３０ｃｍ未満）極めて遅い歩行（通常の歩行は２ｋｍ／ｈを越えるが、数ｍ／分）となり、その間支持足は常に地面と平坦に接触している。したがって、実際には不均一な地形が除外されるため、アクセス可能な環境の種類が限られる。同様に、小さな物体であ小石や小さな物体等のわずかな障害物であっても、それの上にシステムがある時点で足を置いた場合にバランスを崩し、最終的にはシステムが落下するリスクをもたらす。

反対に、「自然な」人間の歩行は、足が地面の上、空中又は地面の上で転がる過程で平坦になることができる一連のフェーズによって特徴付けられる。足をローリングする能力は歩行に不可欠である。何故なら、より大きな歩幅を取ることができ、多種多様な地形で安定を可能にするからである。

しかしながら、上述のいわゆる第１世代のエクソスケルトンは、作動足部を有していないか又は支持足部を地上で維持しない。

二足歩行のヒューマノイドロボット又はロボット装置にとって、このローリングを行うことは実際に複雑である。圧力の中心が支持ポリゴンの限界に達すると、システムはこの点の周りを回転し始めるため、もはや静的平衡状態にない。

歩行の場合、足のローリングは、支持足において地面との接触が部分的に失われ、いくつかの結果がもたらされる。
－支持ポリゴン（維持面）が潜在的にある点まで減少して、支持ポリゴン内で圧力の中心を維持することを困難になり、さらには不可能になる。
－システムは、劣駆動（under-actuation）の状態、すなわち、もはやその自由度の全てで作用することはできない。そうなれば、全ての動きはもはや不可能になる。

このような状況では、非特許文献１等に記載の平坦な足で歩行する従来の形式又は特許文献３に記載されている原理はもはや機能しない。

自然なアイデアは、「転倒」の過程で話す方法で、システムが支持足を中心に自由に回転している間に、支持ポリゴン及びバランスに戻るために、脚を前に振り出し、第２の足を地面に置くことがある。そして、身体は遷移としてのみ一連の不安定な姿勢をとるため、これは動的歩行と呼ばれる（もしその人がその場で「止められた」ならば、転倒する）。

この動的歩行のアプローチでは、振り出された脚を素早くバランスを再確立する位置に少なくとも短期間位置させることは複雑である。実際、この足が予め計算された時間にパラメータ化された軌道に従うようにされた場合、たとえわずかな外乱を受けただけでも、劣駆動のシステムの制御不能な挙動により、足が地面に当たるのが早すぎたり遅すぎたりするリスクがある（計画された軌道からわずかにずれた軌道を修正することは不可能である）。これは、オペレータに不快感を与え、オペレータが不均衡になるか又はオペレータが単純なものを含む地形で転倒する可能性がある。

このため、全ての第１世代のエクソスケルトン（及び多くのヒューマノイドロボット）は、支持足を平坦に保つことによってこのような状況を避けようとする。その結果、前述の歩行速度の制限、歩幅の制限、許容可能な地形の種類及び一般的な歩行の安定性の問題が生じる。

その結果、「仮想制約（virtual constraints）」と「ハイブリッドゼロダイナミックス」（ＨＺＤ）の原理を組み合わせた、困難で予期せぬ地形であっても、転倒や不均衡のリスクなしに、速く且つ自然な歩行を可能するエクソスケルトンのための新たな歩行パラダイムが特許文献４で提案された。

従来、軌道、各自由度ごとの変化は時間の関数として表される。システムの「動力学」は関数

で定義され、そして出発点は、

であり、関数fは、

として記載され、ｘはエクソスケルトン１の状態空間であり、Ｕは制御空間、tは時間を表す。

反対に、ＨＺＤは作動されていない自由度の動力学である。この動力学は、コマンドが動作できないか又は動作を望まない自由度に対応するため、「ゼロ」と呼ばれる。すなわち、コマンドの価値は０である。そして、地面上での足の衝撃は連続するフェーズと交差する非連続な瞬間的フェーズを課すため、「ハイブリッド」と呼ばれる。

いわゆる「仮想制約」法では、原理は、動作自由度の選択について、時間ではなく構成に直接従って、変化パラメータによりパラメータ化された軌道を定義することであり、このパラメータはフェーズ変数と呼ばれる。そのようなフェーズ変数の一例は、踵－臀部軸と垂直方向との間の角度であり、この角度は、上述の作動されない自由度を構成する。

フェーズ変数は、ステップの「進行」を定義することを可能にする。より正確には、各ステップで、フェーズ変数は、初期値が再割り当てされる前に、連続的に初期値から最終値に切り替わり、これは、次のステップの開始である。より簡単にするために、フェーズパラメータの値を０と１の間で正規化することができる。

変更パラメータの各値は、システムが従わなければならない作動自由度の値に対応し、これらの関係（このように制御されることが望ましい作動自由度のそれぞれに対して１つ）が仮想制約と呼ばれる。

もし、システムが、動作することが可能で且つ望ましい自由度についてこの軌道に厳密に従った場合、すなわち、仮想制約がこれらの自由度について編集された場合、システムの変化は、ＨＺＤであるそれら自身の動力学に従う、作動されないこれらの自由度によって、完全に決定される。

そのため、仮想制約の良好な選択は、この動力学を魅力的な周期的「軌道」、すなわち、システムが自然に引きつけられる安定した軌道を含むようにすることができる。

このＨＺＤ法は大きな満足を与えるが、軌道を生成するのが困難である（さらに「フラットフット」法の場合も同様である）。実際、所与の軌道は、歩幅の長さ、歩行頻度及びバストの傾斜（階段を交渉する場合はステップの高さ、湾曲動作の場合は瞬間的な回転角度、リハビリテーションの活動の枠組みではバストの中心の位置及び側方偏位も）等の歩行の「特性」に関連し、安定していなければならない。もし歩行の特性が変化した場合、新たな軌道が必要になる。

米国特許第７１５３２４２号明細書米国特許出願公開第２０１６／０３８３７１号明細書欧州特許第２２３１０９６号明細書国際公開第２０１８／１３０７８４号

Kajita S., K. F. (２００３), Biped Walkingpattern generation by using preview control of Zero-Moment Point, ICRA, (pp.1620-1626)

今日、リアルタイムで軌道を生成することを可能にする解決策は存在しておらず、それらを事前に計算し、テストする必要があり、これにはいくつかの理由がある。
－現在の軌道生成アルゴリズムは、制約下の非線形非凸の課題を最適化するための方法に基づいている。この種類のアルゴリズムは、収束性を保証するものではない。したがって、数学的にコンパクトな探索空間に限定されていても、所望の歩行特性のための軌道を得ることができることを確認することは不可能である。
－制約の下でのこのような非線形非凸の課題を解くことは複雑であり、かなりの計算能力を必要とする。ハイエンドコンピュータ上の物理的コア当たり、軌道毎に約９０sの計算時間が必要となるが、リアルタイム動作を考慮するためにはこの時間は約１００μsでなければならない。
－現在、計算はリモートサーバ上で行われ、次いで、結果がインターネットによって転送される。これは、エクソスケルトンのユーザは永続的で安定した接続を有する必要があり、日常生活での使用にとって大きな不便を表す。

そのため、エクソスケルトンのオペレータにとってわずかなリスクが伴うことなく、
最終的にリアルタイムで実施可能な軌道を生成するための新しい解決策を有することが望ましい。

そのため、第１の態様によれば、本発明はエクソスケルトンの軌道を生成するためにニューラルネットワークのパラメータを学習する方法に関し、当該方法は、第１のサーバのデータ処理手段により、
（ａ）前記エクソスケルトンの一連の可能な歩行のための周期軌道を学習するための第１のデータベースに従って、前記エクソスケルトンの周期基本軌道を生成するのに好適な第１のニューラルネットワークのパラメータを学習するステップであって、該パラメータのそれぞれは、ｎ組の歩行パラメータによって定義される前記エクソスケルトンの所与の歩行のためのものである、ステップと、
（ｂ）前記エクソスケルトンの一連の可能な歩行のための周期基本軌道及び遷移の第２の学習データベースに従って、前記エクソスケルトンの周期基本軌道と、前記エクソスケルトンの１つの周期基本軌道から前記エクソスケルトンの別の周期基本軌道への遷移を生成するのに好適な第２のニューラルネットワークのパラメータを、前記第１のニューラルネットワークからのパラメータを用いて学習するステップと、
を実施することを含む。

他の有利且つ非限定的の特徴によれば、前記ステップ（ａ）は、最適化アルゴリズムを用いることにより、前記エクソスケルトンの一連の可能な歩行のための周期軌道の前記第１の学習データベースを構築することを含む。

前記エクソスケルトンの一連の可能な歩行は、前記ｎ組の歩行パラメータが値を有する空間が均一にカバーされるように選択される。

前記ステップ（ａ）は、前記第１のニューラルネットワークの前記予測の精度を表す基準を検証することさらに含み、該基準が検証されていない場合、前記ステップ（ａ）が繰り返される。

前記ステップ（ｂ）は、前記第１の学習データベースを用いて、前記エクソスケルトンの一連の可能な歩行のための周期軌道及び遷移を学習するための前記第２のデータベースを構築することを含む。

前記第２のデータベースは、前記第１の学習データベースの前記エクソスケルトンの周期基本軌道から、前記第１の学習データベースの前記エクソスケルトンの別の周期基本軌道への全ての遷移を含む。

初期周期基本軌道と呼ばれる前記エクソスケルトンの周期基本軌道から、最終周期基本軌道と呼ばれる前記エクソスケルトンの別の周期基本軌道への各遷移は、前記初期周期基本軌道、少なくとも１つの中間周期基本軌道及び前記最終周期基本軌道を連続的に含む一連の周期基本軌道として定義され、前記第２のデータベースを構築することは、前記第１の学習データベースの初期周期軌道及び最終周期軌道の各対について、前記少なくとも１つの中間周期基本軌道を決定することを含む。

初期周期基本軌道と最終周期軌道との間の各中間周期基本軌道は、前記初期周期基本軌道と最終周期基本軌道との線形的な混合である。

前記初期周期軌道及び最終周期軌道の各対について、前記少なくとも１つの中間周期基本軌道を決定することは、１つの周期基本軌道から別の周期基本軌道に通過するためのコストが、前記エクソスケルトンの動力学における不一致を表すように、周期基本軌道のグラフにおいて前記初期周期基本軌道から前記最終周期軌道までいわゆる最短経路アルゴリズムを用いる。

前記ステップ（ｂ）は、前記第２のニューラルネットワークの予測の精度を表す基準を検証することをさらに含み、該基準が検証されていない場合、前記ステップ（ｂ）が繰り返される。

第２の態様によれば、本発明はエクソスケルトンの軌道を生成する方法に関し、当該方法は、
（ｃ）第１の態様に係る、エクソスケルトンの軌道を生成するためにニューラルネットワークのパラメータを学習する方法を用いて学習した第２のニューラルネットワークのパラメータを第２のサーバのメモリに記憶するステップと、
（ｄ）前記第２のニューラルネットワークを用いることにより、前記第２のサーバのデータ処理手段によって前記エクソスケルトンの軌道を生成するステップと、
を含む。

他の有利且つ非限定的の特徴によれば、前記エクソスケルトンは人間のオペレータを受容し、前記ステップ（ｄ）は、前記オペレータによって所望される前記エクソスケルトンの一連のｎ組の歩行パラメータを特定することを含み、前記エクソスケルトンの軌道は、該一連のｎ組の歩行パラメータに従って生成される

前記エクソスケルトンの生成された軌道は、前記一連のｎ組の歩行パラメータのそれぞれについて、新たな周期基本軌道と、該新たな周期基本軌道への遷移とを含む。

第３の態様によれば、本発明は、複数の自由度を含み、該複数の自由度のうちの少なくとも１つの自由度はデータ処理手段によって制御されるアクチュエータによって作動されるエクソスケルトンを動作させる方法に関し、当該方法は、前記エクソスケルトンが歩行できるように、第２の態様に係るエクソスケルトンの軌道を生成する方法により生成された前記エクソスケルトンの軌道を、前記エクソスケルトンのデータ処理手段により実行するステップ（ｅ）を含む。

第４の態様によれば、本発明は、それぞれがデータ処理手段を含む第１のサーバ、第２のサーバ及びエクソスケルトンを含むシステムに関し、前記データ処理手段は、第１の態様に係る、前記エクソスケルトンの軌道を生成するためにニューラルネットワークのパラメータを学習する方法、第２の態様に係る、前記エクソスケルトンの軌道を生成するための方法及び／又は第３の態様に係る、前記エクソスケルトンを動かすための方法を実施するように構成されている。

第５及び第６の態様によれば、本発明は第１の態様に係る、エクソスケルトンの軌道を生成するためにニューラルネットワークのパラメータを学習する方法、第２の態様に係る、エクソスケルトンの軌道を生成するための方法及び／又は第３の態様に係る、エクソスケルトンを動かすための方法を実行するためのコード命令を含むコンピュータプログラム製品と、第１の態様に係る、エクソスケルトンの軌道を生成するためにニューラルネットワークのパラメータを学習する方法、第２の態様に係る、エクソスケルトンの軌道を生成するための方法及び／又は第３の態様に係るエクソスケルトンを動かすための方法を実行するためのコード命令を含むコンピュータプログラム製品が記憶される、ＩＴ機器によって読み取り可能な記憶手段に関する。

本発明の他の特徴及び利点は、下記の好ましい実施形態の説明を読んだ場合に明確になるであろう。添付の図面を参照しながら説明する。
図１は、本発明に係る方法を実施するためのアーキテクチャの図である。図２は、本発明に係る方法によって用いられるエクソスケルトンの図である。図３は、本発明に係る方法で用いられるニューラルネットワークの図である。図４は、本発明に係る方法の好ましい実施形態を示す図である。

アーキテクチャ
本発明の３つの相補的な態様によれば、
－エクソスケルトン１の軌道を生成するために、とりわけＦＮＮ（Feedforward Neural Network）型のニューラルネットワークのパラメータを学習するための方法と、
－（前述の方法により有利に学習したニューラルネットワークを用いて）エクソスケルトン１の軌道を生成する方法と、
－（第２の態様の方法に係る方法により生成された軌道を適用して）エクソスケルトン１を動かすための方法と、
が提案される。

これらの３つの種類の方法は図１に示すアーキテクチャにおいて、第１のサーバ１０ａ及び／又は第２のサーバ１０ｂにより実施される。第１のサーバ１０ａは（第１の方法を実施する）学習サーバであり、第２のサーバ１０ｂは（第２の方法を実施する）軌道を生成するサーバである。これらの２つのサーバが統合されることは完全に可能であるが、実際には、第１のサーバ１０ａはリモートサーバであるのに対して、第２のサーバ１０ｂは、リアルタイムな動作のためにエクソスケルトン１に組み込むことが可能である。

一般に、これらのサーバ１０ａ、１０ｂのそれぞれは、データをやりとりするためにインターネットネットワーク等のワイドエリアネットワーク２０に接続されるＩＴ機器のであるが、実際には、ニューラルネットワークが学習され、第２のサーバ１０ｂに埋め込まれた場合、通信を少なくとも断続的に中断できる。各サーバは、プロセッサ型のデータ処理手段１１ａ、１１ｂ（特に、学習することは、学習したニューラルネットワークの単純な使用に比べて長く複雑であるため、第１のサーバのデータ処理手段１１ａは高い計算能力を有する）と、適用可能な場合には、コンピュータメモリ、例えばハードドライブ等のデータ記憶手段１２ａ、１２ｂを含む。さらに、学習データベースは、第１のサーバ１０ｂのメモリ１２ａに記憶される。

本発明に係る３種類の方法を組み合わせた好ましい実施形態によれば、システムは、第２の機器１０ｂが組み込まれたエクソスケルトン１にネットワーク２０を介して接続される第１のサーバ１０ａを含む。
－第１のサーバ１０ａは、適用可能な場合に、その計算能力を用いて２つの学習データベースを構成し、次に、これらの学習データベースを用いて第２のニューラルネットワークのパラメータを学習するための方法を実施し、第２のニューラルネットワークから学習したパラメータを第２のサーバ１ｂに送信する。
－第２のサーバ１０ｂは、第１のサーバ１０ａから読み出したパラメータを用いたニューラルネットワークにより、エクソスケルトン１の軌道を生成する方法を実施する。
－エクソスケルトン１は、その場で生成された軌道を直接適用して動作する。

それぞれに第２のサーバ１０ｂが組み込まれた複数のエクソスケルトン１があるか（その場合、パワー及び空間が限られるため、専用のエクソスケルトン１ためのみに軌道を生成する）又はより強力で、任意で第１のサーバ１０ａと統合可能な(そして、全てのエクソスケルトン１のためにすぐさま軌道を生成する能力を有する)第２のサーバ１０ｂにそれぞれが接続される複数のエクソスケルトン１があることが分かる。

図２を参照して、「エクソスケルトン１」という用語は、作動及び制御され、２本の脚を備え、それぞれの下肢がエクソスケルトン１の脚（とりわけストラップにより）に取り付けられた人間のオペレータをより正確に受容する二足歩行ロボット装置型の関節式機械システムを意味する。そのため、それは多かれ少なかれヒューマノイドロボットであり得る。ここで、「歩行」とは、ロボット装置１を広義に動かすことを意味し、立位（平地、傾斜ランプ、階段等）において、変位だけでなく、座位から立位へ移行する動作（「立ち上がり」とも呼ばれる動作）又はその反対の動作が得られるように脚に対して交互に支持をもたらすものである。

エクソスケルトン１は複数の自由度、すなわち、（概して回転を介した）変形可能な関節、すなわち、互いに対して可動であり、それが「作動される」か又は「作動されない」かのいずれかである。

作動された自由度は、データ処理手段１１ｃによって制御されるアクチュエータを備えた関節を示す。すなわち、この自由度は制御されており、それに作用することができる。反対に、作動されない自由度は、アクチュエータがない関節、すなわち、この自由度は、それ自身の動力学に従い、データ処理手段１１ｃはそれに何ら直接的な制御を及ぼさない（ただし、先験的には、他の作動自由度を介した間接的な制御である）。図１の例では、踵と地面とは点接触であるため、エクソスケルトン１はこの接触点に対して自由に回転する。そのため、踵－臀部軸と垂直との間の角度は、作動されない自由度を構成する。

本発明のエクソスケルトンは、前述したように、当然ながら、少なくとも１つの作動自由度、好ましくは複数の作動自由度と、好ましくは作動されない（すなわち「劣駆動」と言われる）少なくとも１つの自由度とを含む。作動されない自由度の数は、劣駆動度と呼ばれる。

データ処理手段１１ｃは、ＩＴ機器（通常、エクソスケルトン１が「遠隔制御」されている場合には外付けプロセッサであるが、エクソスケルトン１に組み込まれていることが好ましい）を表し、適用可能な場合では、組み込まれている場合は第２のサーバ１０ｂのデータ処理手段１１ｂと統合され（図２に示す場合）、様々なアクチュエータのために命令を処理し、コマンドを生成するのに好適である。後者は、電気的、油圧的等であり得る。

エクソスケルトン１は、メモリ１２（特に、第２のサーバ１０ｂのメモリ、即ち、サーバ１０ｂが組み込まれていない場合、手段１２は外付けとすることができる）と、地面１３に対する足の衝撃を検出する手段、慣性測定手段１４、オペレータのセンサベスト１５等の様々なセンサとをさらに含むことができる。

本願は、如何なるエクソスケルトン１のアーキテクチャにも限定されず、例は、国際出願公開第２０１５／１４０３５２号及び国際出願公開第２０１５／１４０３５３号に記載されているようなものとする。

そのため、好ましくは、そしてこれらの出願によれば、エクソスケルトン１は、各脚に、エクソスケルトンを装着した人の足が平らな場合に当接する支持平面を含む足構造を含む。

この支持平面は前側プラットフォーム及び後ろ側プラットフォームを含み、足軸動接続は、作動されない自由度を構成することにより、前側プラットフォームを後ろ側プラットフォームに接続する。このようなアーキテクチャは、「ＨＺＤ」型の軌道にとりわけ適している。

しかしながら、当業者であれば、本方法を他の任意の機械的アーキテクチャに適合させる方法を知っているであろう。

発明の原理
過去数年、リアルタイム制御の分野における人工知能技術への関心が高まっている。

残念ながら、軌道を生成するための現在のプロセスは、誤差の逆伝搬に必要な解析的勾配がないため、補強による学習方法との互換性がほとんどない。次に、Ｑ学習や方策勾配等のより複雑な方法にはリソースが必要となり、取得するのが高価なより多くの実験データを必要とする。加えて、これらの方法では、実際のエクソスケルトン１で学習を行うことができない。したがって、シミュレーションを行う必要がある。

そのため、ロボット工学における特定の研究は、計画タスクを実行するためにニューラルネットワークを利用するが、その使用は非線形回帰に限定され、ほとんどの場合、軌道のデータベースを圧縮し、それによりそれを実装置に容易に埋め込むことを目的としている。このアプローチは、ニューラルネットワークを、マシンラーニングではなく従来のロボット工学の分野から生じる課題に焦点を当てた研究の枠組における「ブラックボックス」ツールのステータスに限定し、研究の展望をほとんど提供しない。さらに、軌道はモデル化が困難なデータであり、後者は入力パラメータに関して多くの不規則性とカオス的性質を有するため、これらの研究のパフォーマンスは緩和されている。

本方法は、第１及び第２のニューラルネットワークと呼ばれる２つのニューラルネットワークを連続的に学習することにより、これらの困難を巧みに解決する。第２のニューラルネットワークは、エクソスケルトンの軌道を効果的に生成することを可能にする「出力」ネットワークである。

説明したように、エクソスケルトンの「軌道」とは、時間又はフェーズ変数の関数として表される各自由度（とりわけ作動自由度）の変化を意味する。

このアイデアは、「複雑な」軌道を、遷移によって交わる「基本（elementary）」と呼ばれる一連の周期軌道を定義することである。周期軌道（periodic
trajectory）という用語は、ステップの開始時におけるエクソスケルトン１の初期状態（足の接触の時点）から始まるような方法で、ステップの期間にわたって適用される（適用可能な場合には繰り返し）任意の軌道を意味し、次のステップの開始時に同じ状態に戻る（説明したように、これはあらゆる平坦な歩行を包含するが、ランプ上を歩くこと、階段の上り下り等も包含する）。また、周期軌道は「限られた周期」を形成すると言われている。そのため、前記周期軌道は、安定した態様で任意の数のステップにわたって適用可能である。

つまり、各基本軌道は、エクソスケルトン１の所与の歩行（ｎ組の歩行パラメータによって定義される歩行）に関連し、安定で実行可能な形でこの歩行を維持することを可能にする（即ち、見られるように、最適化の課題の全ての制約を尊重し、可能な限りコスト関数を最小化する）。前述のように、歩行パラメータは、ステップの長さ、歩行頻度及びバストの傾き等の歩き方の「特性」に対応するだけでなく、階段を交渉する場合はステップの高さ、湾曲動作の場合は瞬間的な回転角度、オペレータの形態学的特徴（患者パラメータと呼ばれる歩行パラメータのサブグループ）、例えば、サイズ、体重、大腿部又は脛骨の長さ、質量中心の位置（前方へのシフトの値）及びリハビリテーション活動の枠組におけるバストの側方偏位にも対応する。

上述した歩行の「制約」は変化させることができ、所望の歩行の種類、例えば、「フラットフット」歩行又は「ＨＺＤ」に依存する。本方法は任意の種類の所望の歩行に限定されない。

遷移は、歩行の変化、すなわち、前記歩行パラメータの値の変化（例えば、歩幅の長さの増加）に対応する。歩行パラメータの初期セット及び歩行パラメータの最終セット、故に、（歩行パラメータの初期セットに関連する）初期周期軌道及び（歩行パラメータの最終セットに関連する）最終周期軌道を知ることで、前記遷移は、初期周期軌道から最終軌道に移行することを可能にする軌道の断片である。なお、「初期」又は「最終」の遷移、例えば、立ち上がるか又は座る動作があり得るが、初期遷移又は最終遷移を予め計算できるという点で、周期軌道の間の「中間」遷移に焦点を当てるものとする。

これからわかるように、このような遷移は、周期軌道の空間における経路として見えることができる。すなわち、初期周期軌道と最終周期軌道との間で、とりわけこれらの２つの軌道の間の「混合」に対応する、すなわちこれらの初期及び最終軌道の間の中間歩行パラメータを有する１つ以上の中間軌道を計画することができる。実際には、一連の可能な中間周期基本軌道セット（特に、初期及び最終軌道の一方から他方への歩行パラメータを直線的に変化させることによる全ての軌道)を予め利用でき、遷移軌道の決定は、中間軌道の適切な連続を選択することからなる（有利には、以下に示すように「進行」と呼ばれる関数によってパラメータ化される）。これらの中間軌道の数を設定でき、それらは均一に分布すること、すなわち、可能な中間軌道の全てが連続し且つ線形の遷移を形成することが有利である。

つまり、初期軌道から最終軌道へと瞬時に移行するのではなく、これは連続するサイクルにわたって小さな増分で進行する。遷移が十分ゆっくりの場合、軌道の漸進的な変化の影響を無視することができる。つまり、システムの状態は実質的に、各ステップにおける限定的なサイクルに属する。

第１のニューラルネットワークは歩行を予測することができる。すなわち、エクソスケルトン１の所与の歩行のためにエクソスケルトン１の周期基本軌道を生できる。つまり、第１のニューラルネットワークは、ｎ組の歩行パラメータを入力として取り、対応する周期軌道を出力として生成する。この利点は、このアプローチでは寸法の数が限定されるため、現在のシステムの範囲内にとどまることができる点である。

第２のニューラルネットワークは、第１のニューラルネットワークによって得られるものと同一の周期的な歩行を生成できるが、また、周期的な歩行サイクルの間で物理的に許容される遷移を予測すること、すなわち、周期基本軌道及び遷移の両方を生成すること、すなわち、最終的に任意の軌道を生成することも可能である。したがって、これは第１のニューラルネットワークを一般化し、置き換えとなる。

第１及び第２のネットワークのそれぞれは、好ましくは、ＦＮＮ（Feedforward Neural Network）型のネットワークである。すなわち、情報は、反復的な接続なしに入力ノードから隠れ層(該当する場合)を通って出力ノードへと一方向（順方向）にしか流れない。何故なら、このようなネットワークは優れたスケーラビリティを有するからである。とりわけ、２又は３の隠れ層を有し、層当たり２００～３００個のニューロンを有するＦＮＮを採用することができる。あるいは、畳み込みニューラルネットワーク（ＣＮＮ）、ＬＳＴＭ（Long Short-term Memory）又はＧＲＵ（Gated Recurrent
Unit）型等のリカレントネットワーク等の他の種類のニューラルネットワークを使用することもできる。

なお、第１及び／又は第２のニューラルネットワークは、歩行パラメータに関して連続的に導出可能な性質を有することが望ましく、このために、例えば、連続的に導出可能な（特にＲｅＬＵとは反対に）S字型の活性化機能を用いるネットワークが好ましい。

図３に示すとりわけ好ましい実施形態によれば、第１及び第２のネットワークのそれぞれは、交互に畳み込み層及びアップサンプリング層を用いる、デコンボリューション（又は転置畳み込み）と呼ばれる最終ブロックを有するＦＮＮであることが有利である。より正確には、このアーキテクチャは、オートエンコーダ（又は「エンコーダ－デコーダ」）と呼ばれる構造を形成し、主ＦＮＮブロックは、初期コード化シーケンスと呼ばれる小さな寸法の特徴マップを生成することによりエンコーダの役割を果たし、デコンボリューションブロックは、初期コード化シーケンスから予測される軌道を定義する出力シーケンスを再構成することによりデコーダの役割を果たす。このアーキテクチャは、その構造が互いに相関する時間シーケンスを自然に予測することから、学習すべきパラメータが少ないため、従来のＦＮＮの場合のようにこのゼロ挙動を学習する必要はない。

学習方法
第１の態様によれば、第１のサーバ１ａのデータ処理手段１１ａによって実施される学習方法が提案される。

図４で図示説明するように、この方法は、エクソスケルトン１の一連の可能な歩行のための周期軌道を学習するための第１のデータベースに従って、ｎ組の歩行パラメータによって定義されるエクソスケルトン１の所与の歩行のために、エクソスケルトン１の周期基本軌道を生成することが可能な第１のニューラルネットワークのパラメータを学習するステップ（ａ）から始まる。

好ましくは、このステップ（ａ）は、前記第１の学習データベースの構築、すなわち、それを構成する前記周期軌道を生成することを含む。

このアイデアは、エクソスケルトン１の一連の可能な歩行をカバーすること、すなわち、可能であれば、良好に分布された関連する軌道として、多数のｎ組の歩行パラメータを有することである。

説明したように、これについての最適化ツールが知られており、特に、様々な歩行パラメータから構成される一連の許容可能なリサーチのコンパクトな空間にわたる最適化によって、軌道の第１のデータベースを生成することが可能である。例えば、ＨＺＤ軌道の場合では、軌道を生成する課題は、いわゆる直接コロケーションアルゴリズム（direct collocation algorism）によって好ましくは解決可能な最適制御課題の形態で定式化される。Omar Haribらの「Feedback Control of a Exoskeleton
for Paraplegics for Towards Robusly Stable Hands-Free Dynamic Walking」参照されたい。

サンプルは、少数のサンプルについてさえも完全な空間の均一なカバーを保証し、正確にその境界を含むように、パラメータ毎に同一の数の可能な値を有する有限集合にわたって一様で離散化された法則に従ってランダムに生成されることが有利である。数学的には、これは、任意の所与のｎ組のパラメータに対して、「閉じられた」サンプルがあることを意味する。

なお、第１の学習ベースを構成するこのステップは長いが、はるか上流で行うことができ、第１のベースは少しずつ完成させることができる。予め構築されたベースから開始することも可能である。

第１のネットワーク自体の学習については、とりわけ監督学習（supervised learning）により従来の方法で進めることができ、最終的に、学習の有無を検証するためにニューラルネットワークの予測精度を表す基準を検証することができる。

より厳密には、予測誤差はステップの間の実際のエクソスケルトンの参照モニタリングの最大誤差よりも平均で有意に小さくなければならない。すなわち、０．０１ｒａｄ等の閾値よりも大きい予測の最大誤差（無限標準で、即ち、全ての関節及び全ての瞬間が全体として取る）を有する予測の所与の一部（特に４％）よりも小さくなければならない。

もしそうでない場合、軌道生成アルゴリズム自体は、基準（本ケースではニューラルネットワークの予測に対応する）に類似した軌道を生成するようにそれを促すような方法で変更することができる。

次いで、新たな第１のデータベースはこの方法論に従うことによって生成されることが好ましく、第１のニューラルネットワークは、ステップ（ａ）の新たな発生において、それを再初期化することなく、むしろ、その先行状態に関して漸増的に、この新たなベース上で再訓練される（すなわち、ステップ（ａ）の最初の発生の終わりで得られた重みから始める）。予測の精度基準が依然検証されていない場合は、そのプロセスが繰り返される。

ステップ（ａ）の終わりに、周期軌道を予測可能な第１のニューラルネットワークが利用可能になる。これらの周期軌道は、実行可能で安定したものであることが保証される。すなわち、それは、軌道最適化アルゴリズムから生じる最適化の課題の全ての制約を満たし、元の課題のコスト関数を可能な限り最小化する。説明したように、提案したアプローチを遷移の生成に広げることは探索すべき次元の数が大きすぎるため可能ではない。

所与のタスクに対して多数（無限大の場合も）の実現可能な軌道が存在することが理解される（即ち、制約を満たす）。最適化プロセスの役割は、後者（実際にはエネルギー）の中から選択されるコストを最小化するものを計算することである。しかしながら、これらの解決策の全てはニューラルネットワークによってモデル化することが困難であり、そのため、完全にモデル化できる軌道のみに最適化の課題を限定することを希求している。具体的には、データベースの全ての軌道間のコンセンサスの問題である。すなわち、後者は、集合としてモデル化することができ、正確で信頼性の高い予測（即ち、訓練サンプルについてであるが、試験サンプルについてもエクソスケルトン１で実行可能／安定）を保証するためには、互いに合意しなければならない。この問題を直接解決することは、複雑すぎるため不可能であることから、ここでは反復法が役立つ。

そのため、説明したように、本方法は、第１のニューラルネットワークからのパラメータを用いて、エクソスケルトン１の周期基本軌道と、エクソスケルトン１の１つの周期基本軌道からエクソスケルトン１の別の周期基本軌道へ遷移の生成に好適な第２のニューラルネットワークのパラメータを、エクソスケルトン１の一連の可能な歩行のセットのための周期基本軌道及び遷移の第２の学習データベースに従って学習するステップ(ｂ)を含む。

好ましくは、第２のニューラルネットワーク及び第１のニューラルネットワークは、説明したように同じアーキテクチャ（例えば、図３のアーキテクチャ）を有することが好ましいが、第２のニューラルネットワークは、ステップ(ｂ)の間に追加のパラメータが学習可能できるため、（例えば、ＦＮＮの場合層単位でより多くのパラメータを有することにより又は例えば、畳み込みネットワークの場合は多くのチャネルを有することにより）より多くの数のパラメータを含む。任意で、ステップ（ａ）で得られた値から開始することにより、共通パラメータをステップ（ｂ）で再学習することもできる。あるいは、第２のニューラルネットワークは、第１のネットワークに対して追加の層を有して、第１のニューラルネットワークに対応することができ、そのパラメータはステップ（ｂ）の間に学習される。

ステップ（ａ）の場合と同じように、ステップ（ｂ）は前記第２の学習データベースの構築、すなわち、それを構成する周期軌道及び遷移を生成することを含むことができることが分かる。これは前記第１のデータベースからのものであることが有利である。より具体的には、全ての遷移は、第１の学習データベースのいわゆる初期周期軌道から、第１の学習データベースの別のいわゆる最終周期軌道へと構成される。この場合も、第２の学習ベースははるか上流に構築され、少しずつ完成され及び／又は予め構築できる。

説明したように、遷移は、周期軌道の空間における最初の軌道から最後の軌道への経路とみなすことができ、第２のベースは、第１のベースの初期及び最終周期基本軌道の各対（即ち、最初の軌道と他方の最終軌道を指定するｎ組の歩行パラメータの各対）について、一方から他方への遷移を含むことができる。全ての可能な遷移は、遷移の振幅に関係なく、蓋然性が等しいとみなされることが有利である。

実際には、周期歩行予測のみに基づく発見的方法を提案することができる。アプローチは以下の通りである。

１）歩行パラメータを直線的に変化させることにより、初期周期軌道から最終軌道までの範囲の（可能な限り多くの中間軌道である）周期軌道の格子を生成する。これらの中間軌道は、２つの初期及び最終軌道の間の線形混合に対応する。説明したように、中間軌道の数を設定でき、それらは一様に分布していることが有利である。

２）遷移は、この格子を左上隅（すなわち、開始時の初期周期軌道）から右下隅（最終時の最終軌道）へと通過する任意の経路に対応する。無限の可能性のある選択肢の中で最適と考えられる遷移は、制約下でいわゆる最短経路アルゴリズムを用いて計算することができる。グリッドを無向グラフ、すなわちグラフの頂点は周期基本軌道（初期、最終、中間）であると考えることにより、ある頂点から別の頂点への各遷移（エッジの移動、即ち軌道の変化）に関連するコストは、ある周期歩行から別の周期歩行への遷移による動力学の「不一致」に対応し、その目的は軌道全体にわたる遷移の「矛盾」を最小化することである。より正確には、移行期間中に、不均衡をもたらすリスクがある過度に大きな影響を有し得る軌道の変化を回避することが望ましい。この矛盾は、数学的に、遷移軌道に沿った動力学方程式の違反に対応する。例えば、遷移軌道から計算した数値微分と動力学方程式による期待項との間の残差誤差を用いることができる。実際には、説明したように、格子内の移動は、初期周期軌道と最終周期軌道との間の漸進的な遷移を定義する「進行」と呼ばれる関数によってパラメータ化することができ、この関数は、例えば、係数が矛盾を最小限にし、前記最短経路アルゴリズムの結果としてエッジ条件を尊重するように最適化された多項式によってパラメータ化することができる。

第２のネットワーク自体の学習については、コスト関数を最小限に抑えることで進めることができるが、学習の有無を検証するために、ニューラルネットワークの予測精度を表す前記基準をここでも最後にチェックする。

ステップ（ｂ）の最後で、（遷移を含む）複雑な軌道を予測可能な第１のニューラルネットワークが利用可能である。次いで、第２のニューラルネットワーク（より具体的にはその学習パラメータ）をステップ（ｃ）で（好ましくは、エクソスケルトン１の）第２のサーバ１０ｂに組み込むことができる。

軌道を生成する方法
第２の態様によれば、第２のサーバ１ｂのデータ処理手段１１ｂによって実施される、エクソスケルトン１の軌道の軌道を生成する方法が提案される。エクソスケルトン１の軌道の軌道を生成する方法は、第１の態様に係る、第２のニューラルネットワークの学習方法の実施に続く。より具体的には、これは、エクソスケルトン１の軌道を生成するためにニューラルネットワークのパラメータを学習する方法によって学習された第２のニューラルネットワークのパラメータを、第２のサーバ１０ｂのメモリ１２に記憶するステップ（ｃ）から始まる。

説明したように、第２のニューラルネットワークは十分に前もって生成して、多くのエクソスケルトン１に組み込むことができる。それはリアルタイムに実施されることが好ましい。

前記第２の方法は、エクソスケルトン１の動作期間にわたって定期的に実施でき、特に、前記第２のニューラルネットワークを用いることによって第２のサーバ１０ｂのデータ処理手段１１ｂによりエクソスケルトン１の軌道を生成するステップ（ｄ）において、周期軌道及び／又は遷移を得るような方法で、前記第２のニューラルネットワークを繰り返し呼び出すことを任意で含む。

より具体的には、漸進的に得られたｎ組の歩行パラメータのシーケンスが想定される（例えば、エクソスケルトンのオペレータからの新しいコマンドにより）。新たなｎ組のパラメータのそれぞれについて、第２のニューラルネットワークは新たな周期軌道と、この新たな周期軌道の方への遷移を決定する。

そのために、軌道を生成する方法は、エクソスケルトン１のｎ組の歩行パラメータを決定すること（適用可能な場合には、規則的に反復する）を含むことが有利である。

実際に、エクソスケルトン１が人間のオペレータを受容するエクソスケルトンの場合、前記パラメータを決定するのは（歩行の速度及び／又は方向のセットポイントを含むスタートアップ要求を直接受け取ることができる通常のロボットの場合とは異なり)前記人間のオペレータの姿勢（及び任意でボタンの押圧）である。

そのために、オペレータには、説明したように、それらのバストの構成（後者の方向）を検出することを可能にするセンサベスト１５を設けることができる。オペレータがバストを向ける方向は、オペレータが歩きたい方向であり、スピードは、オペレータがバストを前方に寄せる強度（オペレータが横になる程度）によって与えられる。スタートアップ要求は、歩行を開始する意図ことを伝達し、データ処理手段に前記パラメータを決定するように命令するためにオペレータがボタンを押すこと（又は特定の姿勢）に対応する。瞬間的な回転角又は交渉階段の場合の段の高さ等のいくつかのパラメータは、他のセンサ１３、１４によって予め決定するか又は得ることができる。

第３の態様によれば、エクソスケルトン１を動作させる方法が提案され、エクソスケルトンの軌道を生成するための、第２の態様（ステップ（ａ）、（ｂ）、（ｃ）、（ｄ））に係る前記方法の実施を含み、次いで（（ｅ）として言及したステップにおいて）、エクソスケルトン１が歩行するように前記軌道の実行することを含む。

ステップ（ｄ）及びステップ（ｅ）は、エクソスケルトン１の軌道を常にリアルタイムで補正するような方法で繰り返すことができる。

機器及びシステム
第４の態様によれば、本発明は、第１及び第２及び／又は第３の態様に係る方法の実施のためのシステムに関する。

説明したように、このシステムは、第１のサーバ１０ａ、第２のサーバ１０ｂ及び場合によっては統合されたエクソスケルトン１を含む。

第１のサーバ１０ａは、第１の態様に係る方法の実施のためのデータ処理手段１１ａを含む。

第２のサーバ１０ｂは、第２の態様に係る方法を実施するためのデータ処理手段１１ｂと、第２のニューラルネットワーク（又はその学習パラメータ）を記憶するためのデータ記憶手段１２とを概して含む。

エクソスケルトン１は、第３の態様に係る方法の実施のために構成されたデータ処理手段１１ｃと、必要に応じて、データ記憶手段１２（特に、第２のサーバ１０ｂのモノ）、慣性測定手段１４（慣性測定手段）、地面１３に対する足の衝撃を検出する手段（接触センサ又は任意の圧力センサ）及び／又はセンサベスト１５を含む。

それは複数の自由度を有し、複数の自由度のうちの少なくとも１つの自由度は、第３の態様に係る方法を実施する枠組みにおいて、データ処理手段１１ｃによって制御されるアクチュエータによって作動される。

コンピュータプログラム製品
第５及び第６の態様によれば、本発明はコンピュータプログラム製品に関し、コンピュータプログラム製品は、ニューラルネットワークのパラメータを学習する第１の態様に係る方法、エクソスケルトン１の軌道を生成する第２の態様に係る方法及び／又はエクソスケルトン１を動かすための第３の態様に係る方法の（処理手段１１ａ、１１ｂ、１１ｃ上での）実行のためのコード命令及びこのコンピュータプログラム製品が見出されるＩＴ機器によって読み出しが可能な記憶手段を含む。

Claims

エクソスケルトンの軌道を生成するためにニューラルネットワークのパラメータを学習する方法であって、当該方法は、第１のサーバのデータ処理手段により、
（ａ）前記エクソスケルトンの一連の可能な歩行のための周期軌道を学習するための第１のデータベースに従って、前記エクソスケルトンの周期基本軌道を生成するのに好適な第１のニューラルネットワークのパラメータを学習するステップであって、該パラメータのそれぞれは、ｎ組の歩行パラメータによって定義される前記エクソスケルトンの所与の歩行のためのものである、ステップと、
（ｂ）前記エクソスケルトンの一連の可能な歩行のための周期基本軌道及び遷移の第２の学習データベースに従って、前記エクソスケルトンの周期基本軌道と、前記エクソスケルトンの１つの周期基本軌道から前記エクソスケルトンの別の周期基本軌道への遷移を生成するのに好適な第２のニューラルネットワークのパラメータを、前記第１のニューラルネットワークからのパラメータを用いて学習するステップと、
を実施することを含む、方法。
前記ステップ（ａ）は、最適化アルゴリズムを用いることにより、前記エクソスケルトンの一連の可能な歩行のための周期軌道の前記第１の学習データベースを構築することを含む、請求項１に記載の方法。
前記エクソスケルトンの一連の可能な歩行は、前記ｎ組の歩行パラメータが値を有する空間が均一にカバーされるように選択される、請求項２に記載の方法。
前記ステップ（ａ）は、前記第１のニューラルネットワークの前記予測の精度を表す基準を検証することさらに含み、該基準が検証されていない場合、前記ステップ（ａ）が繰り返される、請求項２又は３に記載の方法。
前記ステップ（ｂ）は、前記第１の学習データベースを用いて、前記エクソスケルトンの一連の可能な歩行のための周期軌道及び遷移を学習するための前記第２のデータベースを構築することを含む、請求項１乃至４のいずれか一項に記載の方法。
前記第２のデータベースは、前記第１の学習データベースの前記エクソスケルトンの周期基本軌道から、前記第１の学習データベースの前記エクソスケルトンの別の周期基本軌道への全ての遷移を含む、請求項５に記載の方法。
初期周期基本軌道と呼ばれる前記エクソスケルトンの周期基本軌道から、最終周期基本軌道と呼ばれる前記エクソスケルトンの別の周期基本軌道への各遷移は、前記初期周期基本軌道、少なくとも１つの中間周期基本軌道及び前記最終周期基本軌道を連続的に含む一連の周期基本軌道として定義され、前記第２のデータベースを構築することは、前記第１の学習データベースの初期周期軌道及び最終周期軌道の各対について、前記少なくとも１つの中間周期基本軌道を決定することを含む、請求項６に記載の方法。
初期周期基本軌道と最終周期軌道との間の各中間周期基本軌道は、前記初期周期基本軌道と最終周期基本軌道との線形的な混合である、請求項７に記載の方法。
前記初期周期軌道及び最終周期軌道の各対について、前記少なくとも１つの中間周期基本軌道を決定することは、１つの周期基本軌道から別の周期基本軌道に通過するためのコストが、前記エクソスケルトンの動力学における不一致を表すように、周期基本軌道のグラフにおいて前記初期周期基本軌道から前記最終周期軌道までいわゆる最短経路アルゴリズムを用いる、請求項７又は８に記載の方法。
前記ステップ（ｂ）は、前記第２のニューラルネットワークの予測の精度を表す基準を検証することをさらに含み、該基準が検証されていない場合、前記ステップ（ｂ）が繰り返される、請求項５乃至９のいずれか一項に記載の方法。
エクソスケルトンの軌道を生成する方法であって、
（ｃ）請求項１乃至１０のいずれか一項に記載の、エクソスケルトンの軌道を生成するためにニューラルネットワークのパラメータを学習する方法を用いて学習した第２のニューラルネットワークのパラメータを第２のサーバのメモリに記憶するステップと、
（ｄ）前記第２のニューラルネットワークを用いることにより、前記第２のサーバのデータ処理手段によって前記エクソスケルトンの軌道を生成するステップと、
を含む、方法。
前記エクソスケルトンは人間のオペレータを受容し、前記ステップ（ｄ）は、前記オペレータによって所望される前記エクソスケルトンの一連のｎ組の歩行パラメータを特定することを含み、前記エクソスケルトンの軌道は、該一連のｎ組の歩行パラメータに従って生成される、請求項１１に記載の方法。
前記エクソスケルトンの生成された軌道は、前記一連のｎ組の歩行パラメータのそれぞれについて、新たな周期基本軌道と、該新たな周期基本軌道への遷移とを含む、請求項１２に記載の方法。
複数の自由度を含み、該複数の自由度のうちの少なくとも１つの自由度はデータ処理手段によって制御されるアクチュエータによって作動されるエクソスケルトンを動作させる方法であって、前記エクソスケルトンが歩行できるように、請求項１１乃至１３のいずれか一項に記載の、エクソスケルトンの軌道を生成する方法により生成された前記エクソスケルトンの軌道を、前記エクソスケルトンのデータ処理手段により実行するステップ（ｅ）を含む、方法。
それぞれがデータ処理手段を含む第１のサーバ、第２のサーバ及びエクソスケルトンを含むシステムであって、データ処理手段は、請求項１乃至１０のいずれか一項に記載の、前記エクソスケルトンの軌道を生成するためにニューラルネットワークのパラメータを学習する方法、請求項１１乃至１３のいずれか一項に記載の、エクソスケルトンの軌道を生成するための方法及び／又は請求項１４に記載の、エクソスケルトンを動かすための方法を実施するように構成されている、システム。
請求項１乃至１０のいずれか一項に記載の、エクソスケルトンの軌道を生成するためにニューラルネットワークのパラメータを学習する方法、請求項１１乃至１３のいずれか一項に記載の、エクソスケルトンの軌道を生成するための方法及び／又は請求項１４に記載のエクソスケルトンを動かすための方法を実行するためのコード命令を含むコンピュータプログラム製品であって、前記プログラムはコンピュータ上で実行される、コンピュータプログラム製品。
請求項１乃至１０のいずれか一項に記載の、エクソスケルトンの軌道を生成するためにニューラルネットワークのパラメータを学習する方法、請求項１１乃至１３のいずれか一項に記載の、エクソスケルトンの軌道を生成するための方法及び／又は請求項１４に記載のエクソスケルトンを動かすための方法を実行するためのコード命令を含むコンピュータプログラム製品が記憶される、ＩＴ機器によって読み取り可能な記憶手段。