JP2023151524A

JP2023151524A - 推定装置、推定方法、プログラム、及び学習モデル生成装置

Info

Publication number: JP2023151524A
Application number: JP2022061180A
Authority: JP
Inventors: 三博西田; Mitsuhiro Nishida; 良櫻井; Makoto Sakurai; 浩平中嶋; Kohei Nakajima
Original assignee: Bridgestone Corp; University of Tokyo NUC
Current assignee: Bridgestone Corp; University of Tokyo NUC
Priority date: 2022-03-31
Filing date: 2022-03-31
Publication date: 2023-10-16
Also published as: WO2023189445A1

Abstract

【課題】部材の変形を直接計測することなく、部材の変形を推定する。【解決手段】推定装置（１）は、部材（２）の変形に応じて変化する複数の物理量を学習用データとして用いて、ターゲット物理量以外の少なくとも１つの物理量を入力とし、ターゲット物理量を出力するように学習された学習モデル（５１）であって、ターゲット物理量以外の少なくとも１つの物理量を入力とし、ターゲット物理量及び少なくとも１つの物理量以外の物理量を中間物理量として出力するように学習された第１モデル（５１Ａ）と、ターゲット物理量以外の少なくとも１つの物理量、及び第１モデルから出力される中間物理量を入力とし、ターゲット物理量を出力するように学習された第２モデル（５１Ｂ）と、を含む学習モデルに対して、推定対象のターゲット物理量以外の少なくとも１つの物理量（３）を入力し、推定対象のターゲット物理量（６）を推定する。【選択図】図１

Description

本発明は、推定装置、推定方法、プログラム、及び学習モデル生成装置に関する。

従来より、バネ部材およびゴム部材などの弾性体は、与えられた力によって伸長および収縮が可能であり、弾性体を含む部材の制御を行う場合、弾性体を含む部材の挙動を把握することが要求される。その弾性体を含む部材の挙動を把握するために、部材の長さを距離センサによって測定する技術が知られている（例えば、特許文献１参照）。

特開２０１３－１０５２号公報

ところで、弾性体を含む部材は線形に変形する挙動を示したり、非線形に変形する挙動を示す場合がある。例えば、ゴム部材などの柔らかい弾性体を含む部材は、与えられた力に対して非線形に変形する挙動を示す。柔らかい弾性体を含む部材に力を与えた後に力を徐々に解除して元の状態に戻す場合、部材の変形（例えば、長さの変動）は、非線形の挙動を示す。このため、部材の変形を検出するためには、部材が非線形に変形することを考慮して、逐次、センサによって形状を検出することが好ましい。ところが、部材を装置に組み込む場合、より少ないセンサで部材の変形を検出すること、および装置の小型化が要求される。しかし、部材の変形を検出するセンサシステムは、部材が非線形に変形することを考慮することで大規模なものとなり、装置の大型化を招く。また、部材に専用のセンサを装備して変形を検出する場合、装備した専用のセンサが部材の挙動に影響する場合もある。従って、部材の変形を直接計測することは、実用上好ましくない。

また、弾性体を含む部材の変形について、力等の部材に与えられたエネルギから推定する試みが行われている。ところが、部材には、付与する位置や方向を伴う圧力、及び荷重等のように種類が異なる複数のエネルギが与えられた結果で生じると考えられる。しかしながら、種類が異なる複数のエネルギを複数のセンサで検出することは、装置の大型化を招くので好ましくなく、また、センサが部材の挙動に影響する場合もある。さらに、たとえ、種類が異なる複数のエネルギを検出できたとしても、複数のエネルギがどのように部材の変形に寄与するかは不明である。従って、部材の変形を推定するのには改善の余地がある。

本開示は、部材の変形を直接計測することなく、部材の変形を推定することを可能にする推定装置、推定方法、プログラム、及び学習モデル生成装置を提供することを目的とする。

上記目的を達成するために、第１態様は、弾性変形可能な部材における前記部材の変形に応じて変化する種類が異なる少なくとも３つの物理量で、かつ時系列情報が対応付けられたターゲット物理量を含む前記少なくとも３つの物理量の複数を学習用データとして用いて、前記ターゲット物理量以外の少なくとも１つの物理量を入力とし、前記ターゲット物理量を出力するように学習された学習モデルであって、前記ターゲット物理量以外の少なくとも１つの物理量を入力とし、前記ターゲット物理量及び前記少なくとも１つの物理量以外の物理量を中間物理量として出力するように学習された第１モデルと、前記ターゲット物理量以外の少なくとも１つの物理量、及び前記第１モデルから出力される前記中間物理量を入力とし、前記ターゲット物理量を出力するように学習された第２モデルと、を含む前記学習モデルに対して、推定対象の前記ターゲット物理量以外の少なくとも１つの物理量を入力し、前記推定対象の前記ターゲット物理量を推定する推定部を含む推定装置である。

第２態様は、第１態様の推定装置において、前記第１モデルは、前記ターゲット物理量以外の物理量のうちの第１物理量及び前記第１物理量と異なる第２物理量を入力とし、前記ターゲット物理量及び前記第１物理量及び第２物理量以外の第３物理量を中間物理量として出力するように学習され、前記第２モデルは、前記第１物理量及び前記第２物理量と、前記第１モデルから出力される前記中間物理量である前記第３物理量と、を入力とし、前記ターゲット物理量を出力するように学習される。

第３態様は、第１態様の推定装置において、前記第１モデルは、前記ターゲット物理量以外の物理量のうちの第１物理量を入力とし、前記ターゲット物理量及び前記第１物理量以外の第２物理量及び第３物理量を中間物理量として出力するように学習され、前記第２モデルは、前記第１物理量と、前記第１モデルから出力される前記中間物理量である第２物理量及び前記第３物理量と、を入力とし、前記ターゲット物理量を出力するように学習される。

第４態様は、第１態様から第３態様の何れか１態様の推定装置において、前記部材は、前記変形に応じて電気特性が変化し、前記少なくとも３つの物理量として、前記部材の変形に応じて変化した前記電気特性を表す第１物理量、前記部材を変形させる第２物理量、前記部材を変形させ、かつ前記第２物理量と異なる物理量を表す第３物理量、及び前記部材の変形量を表すターゲット物理量を含み、前記学習モデルは、少なくとも前記第１物理量を入力として、前記ターゲット物理量を出力するように学習される。

第５態様は、第４態様の推定装置において、前記部材は、内部が中空に形成され、かつ前記中空の内部に加圧流体が供給されて所定方向に収縮力を発生する弾性体を含み、前記第１物理量は、前記弾性体の電気抵抗値であり、前記第２物理量は、前記弾性体に供給される前記加圧流体の供給状態を表す圧力値又は前記弾性体の内圧を表す圧力値であり、前記第３物理量は、前記弾性体に与えられる荷重を示す値であり、前記ターゲット物理量は、前記弾性体の前記所定方向の距離である。

第６態様は、第１態様から第５態様の何れか１態様の推定装置において、前記学習モデルは、再帰型ニューラルネットワークを用いて学習させることで生成されたモデルである。

第７態様は、第１態様から第６態様の何れか１態様の推定装置において、前記学習モデルは、リザバコンピューティングによるネットワークを用いて学習させることで生成されたモデルである。

第８態様は、第１態様から第６態様の何れか１態様の推定装置において、前記学習モデルは、非線形に変形する部材における前記少なくとも３つの物理量を複数蓄積したリザバを用いた物理的リザバコンピューティングによるネットワークを用いて学習させることで生成されたモデルである。

第９態様は、コンピュータが線形又は非線形に変形する部材における前記変形に応じて変化する種類が異なる少なくとも３つの物理量で、かつ時系列情報が対応付けられたターゲット物理量を含む前記少なくとも３つの物理量の複数を学習用データとして用いて、前記ターゲット物理量以外の少なくとも１つの物理量を入力とし、前記ターゲット物理量を出力するように学習された学習モデルであって、前記ターゲット物理量以外の少なくとも１つの物理量を入力とし、前記ターゲット物理量及び前記少なくとも１つの物理量以外の物理量を中間物理量として出力するように学習された第１モデルと、前記ターゲット物理量以外の少なくとも１つの物理量、及び前記第１モデルから出力される前記中間物理量を入力とし、前記ターゲット物理量を出力するように学習された第２モデルと、を含む前記学習モデルに対して、推定対象の前記ターゲット物理量以外の少なくとも１つの物理量を入力し、前記推定対象の前記ターゲット物理量を推定する推定方法である。

第１０態様は、コンピュータを弾性変形可能な部材における前記部材の変形に応じて変化する種類が異なる少なくとも３つの物理量で、かつ時系列情報が対応付けられたターゲット物理量を含む前記少なくとも３つの物理量の複数を学習用データとして用いて、前記ターゲット物理量以外の少なくとも１つの物理量を入力とし、前記ターゲット物理量を出力するように学習された学習モデルであって、前記ターゲット物理量以外の少なくとも１つの物理量を入力とし、前記ターゲット物理量及び前記少なくとも１つの物理量以外の物理量を中間物理量として出力するように学習された第１モデルと、前記ターゲット物理量以外の少なくとも１つの物理量、及び前記第１モデルから出力される前記中間物理量を入力とし、前記ターゲット物理量を出力するように学習された第２モデルと、を含む前記学習モデルに対して、推定対象の前記ターゲット物理量以外の少なくとも１つの物理量を入力し、前記推定対象の前記ターゲット物理量を推定する推定部として機能させるためのプログラムである。

第１１態様は、弾性変形可能な部材における前記部材の変形に応じて変化する種類が異なる少なくとも３つの物理量で、かつ時系列情報が対応付けられたターゲット物理量を含む前記少なくとも３つの物理量を複数を学習用データとして取得する取得部と、前記取得部の取得結果に基づいて、前記ターゲット物理量以外の少なくとも１つの物理量を入力とし、前記ターゲット物理量を出力するように学習された学習モデルであって、前記ターゲット物理量以外の少なくとも１つの物理量を入力とし、前記ターゲット物理量及び前記少なくとも１つの物理量以外の物理量を中間物理量として出力するように学習された第１モデルと、前記ターゲット物理量以外の少なくとも１つの物理量、及び前記第１モデルから出力される前記中間物理量を入力とし、前記ターゲット物理量を出力するように学習された第２モデルと、を含む前記学習モデルを生成する学習モデル生成部と、を含む学習モデル生成装置である。

本開示によれば、部材の変形を直接計測することなく、部材の変形を推定することができる、という効果を有する。

物理量推定装置の一実施形態の機能構成を示すブロック図である。非線形に変形する部材の説明図である。第１実施形態に係る学習処理部の概念図である。第１実施形態に係る測定装置の一例を示すブロック図である。第１実施形態に係る学習データ収集処理の一例を示すフローチャートである。第１実施形態に係る学習処理部の概念図である。第１実施形態に係る学習処理部の概念図である。第１実施形態に係る学習処理の流れの一例を示すフローチャートである。第１実施形態に係る物理量推定装置の各種機能を実現する装置をコンピュータを含んで構成した場合の一例を示すブロック図である。第１実施形態に係る推定処理の流れの一例を示すフローチャートである。第２実施形態に係る学習処理部の概念図である。第２実施形態に係る学習処理の流れの一例を示すフローチャートである。第３実施形態に係る学習処理部の概念図である。第３実施形態に係る学習処理の流れの一例を示すフローチャートである。第４実施形態に係る学習処理部の概念図である。第４実施形態に係る学習処理の流れの一例を示すフローチャートである。第５実施形態に係る学習処理部の概念図である。

以下、図面を参照して本開示の技術を実現する実施形態を詳細に説明する。
なお、作用、機能が同じ働きを担う構成要素及び処理には、全図面を通して同じ符合を付与し、重複する説明を適宜省略する場合がある。また、本開示は、以下の実施形態に何ら限定されるものではなく、本開示の目的の範囲内において、適宜変更を加えて実施することができる。また、本開示では、主として非線形に変形する部材に対する物理量の推定を説明するが、線形に変形する部材に対する物理量の推定に適用可能であることは言うまでもない。

本開示において「部材」とは、弾性変形可能な部材であって、非線形に変形し、かつ変形に応じて電気特性が変化する材料を含む概念である。「弾性体」とは、部材の一例であり、ゴム、発泡材および樹脂材などの柔らかい材料を含む概念である。また、「弾性収縮体」とは、弾性体の一例であり、付与された物理量により所定方向に収縮力を発生する部材を含む概念である。収縮力を発生する所定方向は、２次元で表現される伸縮を示す直線方向であってもよく、３次元で表現される撓みを示す曲線方向であってもよい。また、弾性収縮体は、内部が中空に形成され、その中空の内部に加圧流体が供給されて所定方向に収縮力を発生する部材を含む。

なお、本開示における部材における物理量のうち、第１物理量は、部材の変形に応じて変化する電気特性を表す物理量であり、一例として時系列の電気抵抗値が挙げられる。第２物理量は、部材を変形させる力に関する物理量であり、一例として圧力特性を表す時系列の圧力値が挙げられる。第３物理量は、第２物理量とは異なる部材を変形させる力に関する物理量であり、一例として部材に与えられる荷重を表す時系列の荷重値が挙げられる。第４物理量は、部材の変形に関する物理量であり、一例として距離、撓み、および歪を示す変形値が挙げられる。

ところで、ゴム部材などの柔らかい弾性体は、与えられた力に対して非線形な挙動を示す。弾性体について形状変化の観点で２次元の形状変化を想定した場合、与えられた力（すなわち、物理量又はエネルギ）に応じて或る方向（例えば、直線方向）に伸縮する距離が非線形に変化する。例えば、図２に非線形に変化する長さを概念として示すように、弾性体は、与えられた力の増減方向により長さの変化特性が相違する。図２に示す例では、圧力Ｐ１及びＰ２で同一の長さＬ１になる。従って、力の大きさ（例えば、圧力値）から変形の大きさ（例えば、長さ）を同定することは困難である。また、弾性体に種類が異なる力（例えば、荷重）が与えられても、弾性体の長さの変化特性が変化する。そこで、本開示の推定装置は、予め学習された学習モデルを用いて、非線形に変形する部材について、部材に関する物理量のうちの１物理量以上の物理量から他の物理量を推定する。

すなわち、本開示の推定装置は、部材における変形に応じて変化する種類が異なる少なくとも３つの物理量で、かつ時系列情報が対応付けられたターゲット物理量を含む少なくとも３つの物理量の複数を学習用データとして用いて、ターゲット物理量以外の少なくとも１つの物理量を入力とし、ターゲット物理量を出力するように学習された学習モデルであって、ターゲット物理量以外の少なくとも１つの物理量を入力とし、ターゲット物理量及び少なくとも１つの物理量以外の物理量を中間物理量として出力するように学習された第１モデルと、ターゲット物理量以外の少なくとも１つの物理量、及び第１モデルから出力される中間物理量を入力とし、ターゲット物理量を出力するように学習された第２モデルと、を含む学習モデルに対して、推定対象の前記ターゲット物理量以外の少なくとも１つの物理量を入力し、推定対象のターゲット物理量を推定する。

（第１実施形態）
図１に、本開示の推定装置としての弾性体を含む部材の物理量推定装置１の構成の一例を示す。本実施形態では、予め学習された学習モデルを用いて、非線形に変形する部材について、少なくとも２つの物理量から他の物理量を推定する物理量推定装置を一例として説明する。

なお、本開示では、弾性体を含む部材における物理量を把握するために、一例として、非線形に変形する弾性体のうちゴム部材などの柔らかい弾性体を含み、付与された物理量により所定方向に収縮力を発生する弾性収縮体に本開示の技術を適用した場合を説明する。また、本開示では、所定方向に収縮する弾性収縮体の両端の距離（すなわち、弾性収縮体の長さ）を、距離センサなどの専用のセンサを装備することなく推定する推定処理に本開示の技術を適用した場合を説明する。

以降では、弾性収縮体の一例として、公知技術のエアバッグタイプの部材を適用する場合について説明する（例えば、特公昭52-40378号参照）。
エアバッグタイプの弾性収縮体の一例（以下、ラバーアクチュエータという。）は、ゴム部材等の柔らかい弾性体で構成される管状体の外周を、有機又は無機高張力繊維、例えば芳香族ポリアミド繊維の編組み補強構造により被覆した本体２１を有し、両端開口２２を閉塞部材２３によって封止したものである。ラバーアクチュエータは、その閉塞部材２３に設けられた接続口２４を介して内部空洞に加圧流体が供給されることによって膨径変形し、軸線方向に沿って収縮力が発生するようになっている。このラバーアクチュエータは、膨径変形によって、ラバーアクチュエータの長さが変化する。ただし、ラバーアクチュエータを適用対象とするのはあくまで一例に過ぎず、本開示の推定装置はラバーアクチュエータ以外の弾性収縮体又は弾性体を含む部材にも適用可能である。

本実施形態では、ラバーアクチュエータにおける物理量のうち、第１物理量に、ラバーアクチュエータの変形に応じて変化する時系列の電気抵抗値による電気特性を適用する。第２物理量には、時系列の圧力値による圧力特性を適用し、第３物理量には、第２物理量とは異なる力の一例としての時系列の荷重値によりラバーアクチュエータに与えられる荷重特性を適用する。第４物理量には、ラバーアクチュエータの変形値（すなわち、変形量）を適用し、当該ラバーアクチュエータの変形量を表すターゲット物理量として、距離（すなわち、ラバーアクチュエータの長さ）を適用した場合を説明する。

なお、本開示の技術は、ラバーアクチュエータにおける物理量として、第１物理量、第２物理量、第３物理量、及び第４物理量である４つの物理量を用いることに限定されない。例えば、電気特性を示す第１物理量、荷重特性を示す第３物理量、及びラバーアクチュエータの変形量を表すターゲット物理量である距離を示す第４物理量の３つの物理量を適用する場合にも、本開示の技術は適用可能である。すなわち、圧力特性を示す第２物理量は省略可能である。

物理量推定装置１における推定処理は、ラバーアクチュエータにおける電気特性を示す第１データ、圧力特性を示す第２データ、荷重特性を示す第３データ、及び長さを示す第４データにより学習を行った学習済みの学習モデルを用いて、未知のラバーアクチュエータに対して与えられる力に対応するラバーアクチュエータの長さを推定する。

本実施形態では、推定処理の一例として、未知のラバーアクチュエータにおける第１データ（電気特性）及び第２データ（圧力特性）に対応するラバーアクチュエータの長さを推定する場合を説明する。これにより、非線形に変形する部材、すなわち非線形に長さが変化するラバーアクチュエータであっても、当該変形を、直接計測することなく、計測した長さに近い長さを推定することが可能となる。

図１に示すように、物理量推定装置１は、推定部５を備えている。推定部５には、入力データ３として、ラバーアクチュエータ２における時系列の電気抵抗の大きさ（電気抵抗値）による電気特性を表す第１データ３１、及びラバーアクチュエータ２への時系列の圧力の大きさ（圧力値）による圧力特性を表す第２データ３２が入力される。また、推定部５は、学習モデル５１を用いて推定したラバーアクチュエータ２の変形の大きさ（長さ）を表す出力データ６を出力する。

学習モデル５１は、ラバーアクチュエータ２の電気特性（第１データ３１）、及びラバーアクチュエータ２の圧力特性（第２データ３２）から、ラバーアクチュエータ２の長さ（出力データ６）を出力する学習を済ませたモデルである。詳細は後述するが、学習モデル５１は、ラバーアクチュエータ２における荷重を考慮して学習されたモデルであり、第１モデル５１Ａと第２モデル５１Ｂを含み、第１モデル５１Ａで荷重特性を示す荷重データを推定し、推定された荷重データを用いて第２モデルで長さを出力する。学習モデル５１は、例えば、学習済みのニューラルネットワークを規定するモデルであり、ニューラルネットワークを構成するノード（ニューロン）同士の間の結合の重み（強度）の情報の集合として表現される。
荷重データは、本開示の中間物理量を示すデータの一例である。

図３に、学習モデル５１を生成する学習処理部５２の概念構成の一例を示す。
学習モデル５１は、学習処理部５２の学習処理により生成される。学習処理部５２は、ラバーアクチュエータ２における時系列な物理量として測定済みの物理量を用いて学習処理を行う。すなわち、ラバーアクチュエータ２における物理量を時系列に測定した大量のデータを学習データとする。本実施形態では、ラバーアクチュエータ２における物理量について圧力特性及び荷重特性で表される力を考慮して、学習モデル５１を学習する。学習データは、ラバーアクチュエータ２における電気特性（第１データ３１）、圧力特性（第２データ３２）及び荷重特性（第３データ３３）と、ラバーアクチュエータ２の長さ（第４データ３４）と、のセットを大量に含む。なお、ラバーアクチュエータ２の長さを示す第４データ３４の各々に測定時刻を示す情報を付与することで時系列情報が対応付けられる。この場合、前記セットに測定時刻を示す情報を付与して時系列情報を対応付けてもよい。

次に、学習処理部５２が行う学習処理について説明する。

まず、学習処理に用いる学習データについて説明する。
図４に、ラバーアクチュエータ２における物理量を測定する測定装置７の一例を示す。

測定装置７は、基台７１に固定された取付板７２にラバーアクチュエータ２の一方の閉塞部材２３は取り付けられ、他方の閉塞部材２３は移動可能な可動板７３に取り付けられる。ラバーアクチュエータ２の両端の閉塞部材２３には、電気特性（ラバーアクチュエータ２の変形により変化する時系列の電気抵抗値Ｒ）を検出するセンサを含んだ電気特性検出部７６（図４では「Ａ］としても表記）が接続される。ラバーアクチュエータ２の接続口２４には、圧力特性（ラバーアクチュエータ２を変形させる時系列の圧力値Ｐ）を検出する圧力センサを含み、ラバーアクチュエータ２に加圧流体を供給する供給部７５が連通される。

また、他方の閉塞部材２３には、荷重特性（ラバーアクチュエータ２を変形させる他の物理量である荷重値Ｆ）を検出する荷重センサを含み、ラバーアクチュエータ２に荷重を与える荷重部８０が接続される。なお、荷重部８０は、荷重を与える荷重付与部と荷重を検出する荷重検出部とを独立して形成してもよい。

また、基台７１には、可動板７３との距離を検出するレーザセンサ等の距離センサ７７が取り付けられた固定板７４が固定される。距離センサ７７は、長さ同定部７８に接続される。長さ同定部７８は、距離センサ７７で検出された距離から、ラバーアクチュエータ２の長さ（ラバーアクチュエータ２の変形量を表すターゲット物理量）を同定する。例えば、長さ同定部７８は、加圧流体が供給されない初期状態（図４に初期状態２００として示す。）のラバーアクチュエータ２の長さＬ、および距離センサ７７で検出された距離（Ｌａ）を初期値として記憶しておく。そして、長さ同定部７８は、加圧流体が供給された状態（図４に供給状態２１０として示す。）の距離の差分を、初期状態の長さから減算することで、ラバーアクチュエータ２の長さ（Ｌ＝Ｌｂ－Ｌａ）を同定可能である。なお、測定装置７は、ロードセルおよび空気圧シリンダから構成された空気圧検出部７９を取り付け可能になっている。空気圧検出部７９では、供給部７５から供給された加圧流体によって変化するラバーアクチュエータ２の内圧を検出することが可能である。従って、供給部７５から供給される加圧流体によるラバーアクチュエータ２を変形させる圧力値Ｐは、空気圧検出部７９で検出されるラバーアクチュエータ２の内圧に対応させることが可能である。

測定装置７は、供給部７５、電気特性検出部７６、荷重部８０、及び長さ同定部７８に接続されたコントローラ７０を備えている。コントローラ７０は、供給部７５及び荷重部８０の制御を行う。コントローラ７０は、供給部７５及び荷重部８０の制御に応じてラバーアクチュエータ２の圧力特性（圧力値）、電気特性（電気抵抗値）、ラバーアクチュエータ２における荷重特性（荷重値）、及び長さをデータとして取得し、記憶する。取得したデータ、すなわち、ラバーアクチュエータ２における物理量である、電気特性（電気抵抗値）、圧力特性（圧力値）、荷重特性（荷重値）、及び長さのデータセットは時系列に複数取得可能となり、後述する学習処理で学習データとして用いる。

具体的には、コントローラ７０は、図示しないＣＰＵを含むコンピュータを含んで構成可能であり、学習データを収集する学習データ収集処理を実行する。

図５に、コントローラ７０で実行される学習データ収集処理の流れの一例を示す。
コントローラは、ステップＳ１００で、供給部７５に対して加圧流体を供給する制御指示を行い、荷重部８０に対して荷重を付与する制御指示を行う。ステップＳ１０２で、ラバーアクチュエータ２における時系列の電気抵抗値（Ｒ）による電気特性、圧力値（Ｐ）による圧力特性、荷重値（Ｆ）による荷重特性、及び長さ（Ｌ）を取得し、次のステップＳ１０４で記憶する。なお、圧力値（圧力特性）はラバーアクチュエータの内圧でもよい。コントローラ７０は、これらのラバーアクチュエータ２の電気特性（電気抵抗値Ｒ）、圧力特性（圧力値Ｐ）、荷重特性（荷重値Ｆ）、及び長さ（Ｌ）のセットが予め定めた所定数、又は予め定めた所定時間に達するまで（ステップＳ１０６で、肯定判断されるまで否定判断し）、上記処理を繰り返す。

従って、コントローラ７０は、ラバーアクチュエータ２を変形させる制御（すなわち供給部７５及び荷重部８０の制御）を行うことによって、ラバーアクチュエータ２の電気特性（電気抵抗値Ｒ）、圧力特性（圧力値Ｐ）、荷重特性（荷重値Ｆ）、及び長さ（Ｌ）を取得し、記憶することが可能となる。このコントローラ７０に記憶されたデータセットが学習データとなる。

次に、図６及び図７を参照して、学習処理部５２について説明する。図６には、学習処理部５２の概念構成の一例を示す。図７には、学習処理部５２の具体的な構成の一例を示す。なお、学習処理部５２は、学習用データとして、上述した測定装置７で測定したラバーアクチュエータ２の電気特性（電気抵抗値Ｒ）、圧力特性（圧力値Ｐ）、荷重特性（荷重値Ｆ）、及び長さ（Ｌ）のデータセットを多数保持、又は取得する。

図６に示すように、学習処理部５２は、第１の学習処理部５２Ａと第２の学習処理部５２Ｂとを含む。なお、以降では、第１の学習処理部５２Ａを、学習処理部５２Ａと称し、第２の学習処理部５２Ｂを、学習処理部５２Ｂと称する。学習処理部５２Ａは、ラバーアクチュエータ２の第１データ３１（電気特性）、及び第２データ３２（圧力特性）を入力として、当該入力に対応する第３データ３３（荷重特性）に一致又は近い荷重特性を推定し推定結果を荷重データ４０として出力するように学習処理を行う機能部である。学習処理部５２Ｂは、ラバーアクチュエータ２の第１データ３１（電気特性）、第２データ３２（圧力特性）、及び学習処理部５２Ａから出力される荷重データ４０（推定結果の荷重特性）を入力として、当該入力に対応する第４データ３４（長さ）に一致又は近いラバーアクチュエータ２の長さを推定して出力データ６として出力するように学習処理を行う機能部である。

図７に示すように、学習処理部５２Ａは、生成器５４Ａと演算器５６Ａとを含む。生成器５４Ａは、時系列入力の前後関係を考慮して出力を生成する機能を有する。演算器５６Ａは、荷重データ４０（推定結果）と、学習データの第３データ３３（荷重特性）とを比較し、その比較結果の誤差を演算する機能を有する。

生成器５４Ａは、入力層５４０Ａ、中間層５４２Ａ、及び出力層５４４Ａを含んで、公知の再帰型ニューラルネットワーク、例えば、リカレントニューラルネットワーク（ＲＮＮ：ＲｅｃｕｒｒｅｎｔＮｅｕｒａｌＮｅｔｗｏｒｋ）を構成している。再帰型ニューラルネットワーク（例えば、ＲＮＮ）自体は公知の技術であるため詳細な説明は省略するが、中間層５４２Ａは、ノード間結合およびフィードバック結合を有するノード群（ニューロン群）を多数含む。その中間層５４２Ａには、入力層５４０Ａからのデータが入力され、中間層５４２Ａの演算結果のデータは、出力層５４４Ａへ出力される。

具体的には、生成器５４Ａは、入力された第１データ３１（電気特性）及び第２データ３２（圧力特性）から荷重特性を表す荷重データ４０を生成するニューラルネットワークである。荷重データ４０は、第１データ３１（電気特性）及び第２データ３２（圧力特性）からラバーアクチュエータ２における荷重特性を推定したデータである。生成器５４Ａは、時系列に入力された第１データ３１（電気特性）及び第２データ３２（圧力特性）から、ラバーアクチュエータ２における荷重に関する測定値に近い荷重特性又は荷重値を示す荷重データ４０を生成する。生成器５４Ａは、多数の第１データ３１及び第２データ３２を用いて学習することで、よりラバーアクチュエータにおける荷重に関する測定値に近い荷重データ４０を生成できるようになる。

演算器５６Ａは、荷重データ４０と、学習データの第３データ３３とを比較し、その比較結果の誤差を演算する。学習処理部５２Ａは、荷重データ４０、及び学習データの第３データ３３を演算器５６Ａに入力する。これに応じて、演算器５６Ａは、荷重データ４０と、学習データの第３データ３３との誤差を演算し、その演算結果を示す信号を出力する。

学習処理部５２Ａは、演算器５６Ａで演算された誤差に基づいて、ノード間の結合の重みパラメータをチューニングすることで、生成器５４Ａの学習を行う。具体的には、生成器５４Ａにおける入力層５４０Ａと中間層５４２Ａとのノード間の結合の重みパラメータ、中間層５４２Ａ内のノード間の結合の重みパラメータ、および中間層５４２Ａと出力層５４４Ａとのノード間の結合の重みパラメータの各々を例えば勾配降下法や誤差逆伝搬法等の手法を用いて、生成器５４Ａにフィードバックする。すなわち、学習データの第３データ３３を目標として、出力層５４４Ａから出力される荷重データ４０と学習データの第３データ３３との誤差を最小化するように全てのノード間の結合を最適化する。

学習処理部５２Ａの学習処理により第１モデル５１Ａが生成される。第１モデル５１Ａは、学習処理部５２Ａによる学習結果のノード間の結合の重みパラメータ（重み又は強度）の情報の集合として表現される。

生成器５４Ｂは、生成器５４Ａと同様に形成される。具体的には、生成器５４Ｂは、入力層５４０Ｂ、中間層５４２Ｂ、及び出力層５４４Ｂを含んで構成される。中間層５４２Ｂは、ノード間結合およびフィードバック結合を有するノード群（ニューロン群）を多数含む。その中間層５４２Ｂには、入力層５４０Ｂからのデータが入力され、中間層５４２Ｂの演算結果のデータは、出力層５４４Ｂへ出力される。

生成器５４Ｂは、第１データ３１（電気特性）及び第２データ３２（圧力特性）と、上述した荷重データ４０とを用いてラバーアクチュエータ２の長さを表す長さデータ４２を生成するニューラルネットワークである。長さデータ４２は、第１データ３１（電気特性）、第２データ３２（圧力特性）、及び荷重データ４０からラバーアクチュエータ２の長さを推定したデータである。生成器５４Ｂは、時系列に入力された第１データ３１（電気特性）、第２データ３２（圧力特性）、及び荷重データ４０から、ラバーアクチュエータ２の測定値に近い長さを示す長さデータ４２を生成する。生成器５４Ｂは、多数の第１データ３１及び第２データ３２と、荷重データ４０とを用いて学習することで、よりラバーアクチュエータにおける測定値に近い長さデータ４２を生成できるようになる。

演算器５６Ｂは、長さデータ４２と、学習データの第４データ３４（長さ）とを比較し、その比較結果の誤差を演算する。学習処理部５２Ｂは、長さデータ４２、及び学習データの第４データ３４を演算器５６Ｂに入力する。これに応じて、演算器５６Ｂは、長さデータ４２と、学習データの第４データ３４との誤差を演算し、その演算結果を示す信号を出力する。

学習処理部５２Ｂは、学習処理部５２Ａと同様に、演算器５６Ｂで演算された誤差に基づいて、ノード間の結合の重みパラメータをチューニングすることで、生成器５４Ｂの学習を行う。すなわち、学習データの第４データ３４を目標として、出力層５４４Ｂから出力される長さデータ４２と学習データの第４データ３４との誤差を最小化するように全てのノード間の結合を最適化する。

学習処理部５２Ｂの学習処理により第２モデル５１Ｂが生成される。第２モデル５１Ｂは、学習処理部５２Ｂによる学習結果のノード間の結合の重みパラメータ（重み又は強度）の情報の集合として表現される。

従って、学習モデル５１は、学習処理部５２Ａの学習処理により生成される第１モデル５１Ａと、学習処理部５２Ｂの学習処理により生成される第２モデル５１Ｂとを含む。

図８に、学習処理部５２における学習処理の流れの一例を示す。学習処理部５２は、図示しないＣＰＵを含むコンピュータを含んで構成し、学習処理を実行することが可能である。
学習処理部５２は、次の各ステップを実行する。まず、ステップＳ１１０で、学習データを取得する。すなわち、時系列に測定した結果のデータとして、第１データ３１（電気特性）、第２データ３２（圧力特性）、第３データ３３（荷重特性）、及び第４データ３４（長さ）を取得する。次に、ステップＳ１１２及びステップＳ１１３では、時系列の学習データを用いて第１モデル５１Ａ及び第２モデル５１Ｂを含む学習モデル５１を生成する。すなわち、多数の学習データを用いて学習した学習結果のノード間の結合の重みパラメータ（重み又は強度）の情報の集合を得る。具体的には、ステップＳ１１２で、荷重データ４０を推定するための第１段目のノード間の結合の重みパラメータの情報の第１集合を得る。当該第１集合によるデータはコンピュータを第１モデル５１Ａとして機能するための要素データである。ステップＳ１１３では、長さデータ４２を推定するための第２段目のノード間の結合の重みパラメータの情報の第２集合を得る。当該第２集合によるデータはコンピュータを第２モデル５１Ｂとして機能するための要素データである。そして、ステップＳ１１４で、第１集合として表現されるデータを第１モデル５１Ａとして記憶し、第２集合として表現されるデータを第２モデル５１Ｂとして記憶する。

なお、上述した生成器は、時系列入力の前後関係を考慮して出力を生成する機能を有するものであり、上記では再帰型ニューラルネットワークを用いた一例を説明したが、本開示の技術は、再帰型ニューラルネットワークを用いることに限定するものではない。すなわち、本開示の技術は、時系列入力の前後関係を考慮して出力を生成する機能を有するものであればよく、他の手法を用いてもよい。

物理量推定装置１では、以上に例示した手法により生成した学習済みの生成器（すなわち、学習結果のノード間の結合の重みパラメータの情報の集合として表現されるデータ）を第１モデル５１Ａと第２モデル５１Ｂとを含む学習モデル５１を用いる。十分に学習した学習モデル５１を用いれば、非線形に変形するラバーアクチュエータについて、時系列な圧力値および電気抵抗値から荷重を考慮した長さを推定することも不可能ではない。

なお、学習処理部５２による処理は、本開示の学習モデル生成装置の処理の一例である。また、物理量推定装置１は、本開示の推定部および推定装置の一例である。さらに、ステップＳ１１０で学習データを取得することは、本開示の取得部の機能の一例である。また、取得した学習データは取得結果の一例である。また、上述した学習処理を実行する学習処理部５２は、学習モデル生成部の一例である。

物理量推定装置１は、コンピュータに上述の各機能を表すプログラムを実行させることにより実現可能である。

図９に、物理量推定装置１の各種機能を実現する処理を実行する実行装置としてコンピュータを含んで構成した場合の一例を示す。

図９に示す物理量推定装置１として機能するコンピュータは、コンピュータ本体１００を備えている。コンピュータ本体１００は、ＣＰＵ１０２、揮発性メモリ等のＲＡＭ１０４、ＲＯＭ１０６、ハードディスク装置（ＨＤＤ）等の補助記憶装置１０８、及び入出力インターフェース（Ｉ／Ｏ）１１０を備えている。これらのＣＰＵ１０２、ＲＡＭ１０４、ＲＯＭ１０６、補助記憶装置１０８、及び入出力Ｉ／Ｏ１１０は、相互にデータ及びコマンドを授受可能にバス１１２を介して接続された構成である。また、入出力Ｉ／Ｏ１１０には、通信インタフェース（Ｉ／Ｆ）１１４、及びディスプレイやキーボード等の操作表示部１１６が接続されている。通信Ｉ／Ｆ１１４は、外部装置との間で、第１データ３１（電気特性）、第２データ３２（圧力特性）、及び出力データ６（長さ）を入出力する入出力部として機能する。

補助記憶装置１０８には、コンピュータ本体１００を本開示の推定装置の一例としての物理量推定装置１として機能させるための制御プログラム１０８Ｐが記憶される。ＣＰＵ１０２は、制御プログラム１０８Ｐを補助記憶装置１０８から読み出してＲＡＭ１０４に展開して処理を実行する。これにより、制御プログラム１０８Ｐを実行したコンピュータ本体１００は、本開示の推定装置の一例として物理量推定装置１として動作する。

なお、補助記憶装置１０８には、第１モデル５１Ａと第２モデル５１Ｂによる学習モデル５１を含む学習モデル１０８Ｍ、及び各種データを含むデータ１０８Ｄが記憶される。制御プログラム１０８Ｐは、ＣＤ－ＲＯＭ等の記録媒体により提供するようにしても良い。

次に、コンピュータにより実現された物理量推定装置１における推定処理について説明する。

図１０に、コンピュータ本体１００において、実行される制御プログラム１０８Ｐによる推定処理の流れの一例を示す。図１０に示す推定処理は、コンピュータ本体１００に電源投入されると、ＣＰＵ１０２により実行される。すなわち、ＣＰＵ１０２は、制御プログラム１０８Ｐを補助記憶装置１０８から読み出し、ＲＡＭ１０４に展開して処理を実行する。

まず、ＣＰＵ１０２は、ステップＳ２００で、補助記憶装置１０８の学習モデル１０８Ｍから、第１モデル５１Ａと第２モデル５１Ｂとを含む学習モデル５１を読み出し、ＲＡＭ１０４に展開することで、学習モデル５１を取得する。具体的には、学習モデル５１としての第１モデル５１Ａと第２モデル５１Ｂとの各々に表現された重みパラメータによるノード間の結合となるネットワークモデルを、ＲＡＭ１０４に展開する。よって、重みパラメータによるノード間の結合が実現された第１モデル５１Ａと第２モデル５１Ｂによる学習モデル５１が構築される。

次に、ＣＰＵ１０２は、ステップＳ２０２で、ラバーアクチュエータ２の長さを推定する対象となる未知の第１データ３１（電気特性）及び未知の第２データ３２（圧力特性）を、通信Ｉ／Ｆ１１４を介して時系列に取得する。

次に、ＣＰＵ１０２は、ステップＳ２０４で、学習モデル５１のうちの第１モデル５１Ａを用いて、ステップＳ２０２において取得した第１データ３１（電気特性）及び第２データ３２（圧力特性）に対応する荷重データ４０を推定する。すなわち、時系列に変化する電気抵抗値（電気特性）及び圧力値（圧力特性）に対応して、或る時点の圧力値および電気抵抗値から、その時点の荷重値（荷重特性）が推定される。

次に、ＣＰＵ１０２は、ステップＳ２０６で、第２モデルへの入力用のデータとして、前記未知の第１データ３１（電気特性）及び未知の第２データ３２（圧力特性）と、ステップＳ２０４で推定した荷重データ４０（荷重特性）とを取得する。

次に、ＣＰＵ１０２は、ステップＳ２０８で、学習モデル５１のうちの第２モデル５１Ｂを用いて、取得した第１データ３１（電気特性）及び第２データ３２（圧力特性）と、荷重データ４０（荷重特性）とに対応する長さデータ４２を推定する。すなわち、時系列に変化する電気抵抗値及び圧力値に対応して、或る時点の電気抵抗値及び圧力値から、その時点における電気抵抗値及び圧力値への変化と荷重とに応じて非線形に変化する長さが推定される。

次のステップＳ２１０で、ステップＳ２０８での推定結果の長さデータ４２を出力データ６（ラバーアクチュエータ２の長さ）として、通信Ｉ／Ｆ１１４を介して出力して、本処理ルーチンを終了する。

なお、図１０に示す推定処理は、本開示の推定方法で実行される処理の一例である。

以上説明したように、本開示によれば、ラバーアクチュエータ２に対して、未知の第１データ３１（電気特性）及び第２データ３２（圧力特性）から、ラバーアクチュエータ２の長さを推定することが可能となる。すなわち、非線形に変形するラバーアクチュエータ２における非線形な変形を直接計測することなく、ラバーアクチュエータ２の長さを推定することができる。これによって、本開示によれば、ラバーアクチュエータ２を用いる装置および構造物の大型化を抑制することが可能となる。

なお、本開示の技術は、圧力特性を示す第２物理量は省略可能であって、ラバーアクチュエータ２に対して、未知の第１データ３１（電気特性）から、ラバーアクチュエータ２の長さを推定することも可能となる。

（第２実施形態）
次に、第２実施形態を説明する。第２実施形態は、ラバーアクチュエータ２の長さを推定するにあたって、推定速度を向上することを考慮したものである。なお、第２実施形態は第１実施形態と略同様の構成のため、同一部分には同一符号を付して詳細な説明を省略する。

一般的な再帰型ニューラルネットワークでは、入力層から中間層へのノードの結合、中間層におけるノード間の結合およびフィードバック結合、そして中間層から出力層へのノード間の結合の各々の結合について重みパラメータの情報を最適化する。しかし、非線形に変形するラバーアクチュエータ２に対して時間的な相関を持つ時系列データを用いた学習では膨大な学習時間が要求される。また、時系列な学習データによる学習時に、時間的遡及を行うために、膨大なメモリも要求される。

この膨大な時間が要求される学習時間を抑制することを目的とし、リザバコンピューティングと呼ばれる周知のネットワークモデルが、非線形に変形するラバーアクチュエータ２の長さ推定に適用可能である。リザバコンピューティング（ＲＣ：ＲｅｓｅｒｖｏｉｒＣｏｍｐｕｔｉｎｇ）と呼ばれるネットワークモデル（以下、ＲＣＮという。）自体は公知の技術であるため、詳細な説明を省略するが、ＲＣＮの一例は、再帰型ニューラルネットワークの一部を固定し（ランダムなネットワークに置き換え）、中間層から出力層へのノード間の結合のみを最適化するものである。

図１１に、ＲＣＮを用いた学習処理部の概念構成の一例を示す。図１１に示す学習処理部５２は、図７に示す学習処理部５２Ａ、５２Ｂを学習処理部５２Ｃ、５２Ｄに代え、図７に示す生成器５４Ａ、５４Ｂを生成器５４Ｃ、５４Ｄに代え、演算器５６Ａ、５６Ｂにより導出された誤差を出力層５４４Ａ、５４４Ｂ側にのみ反映させて学習を行う点が図７に示す学習処理部５２と異なっている。

図１１に示すように、学習処理部５２Ｃの生成器５４Ｃは、図７と同様の入力層５４０、出力層５４４Ａ、及び図７の中間層５４２Ａに代えてリザバコンピューティングにおけるリザバであるリザバ層５４３Ｃを含んで、公知のＲＣＮを構成する。ＲＣＮでは、入力層５４０Ａからリザバ層５４３Ｃへのノードの結合と、リザバ層５４３Ｃにおけるノード間の結合およびフィードバック結合とに、固定の重みパラメータの情報（以下、重み係数という。）が設定される。そして、リザバ層５４３Ｃから出力層５４４Ａへのノード間の結合は、例えば線形結合とされ、各々の重みパラメータが学習データの学習によって最適化される。

なお、固定の重み係数は、予め設定しておくものとする。この固定の重み係数は、初期値として定めた係数を設定することが可能である。また、固定の重み係数は、学習データを用いて、学習データの第３データ３３を目標として、荷重データ４０と学習データの第３データ３３との誤差を最小化するようにノード間等の結合を、誤差を最小化するには不十分な所定回数又は所定時間だけ最適化した場合の重み係数を設定してもよい。

一方、リザバ層５４３Ｃから出力層５４４Ａへのノード間の結合を規定する重みパラメータは、多数の学習データを用いて、荷重データ４０と学習データの第３データ３３との誤差を最小化するように学習して導出される。

同様に、学習処理部５２Ｄの生成器５４Ｄは、図７と同様の入力層５４０Ｂ、出力層５４４Ｂ、及び図７の中間層５４２Ｂに代えてリザバコンピューティングにおけるリザバ層５４３Ｄを含んで、公知のＲＣＮを構成する。リザバ層５４３Ｄから出力層５４４Ｂへのノード間の結合（例えば線形結合）は、各々の重みパラメータが学習データの学習によって最適化される。また、固定の重み係数は、予め設定しておく。

一方、リザバ層５４３Ｄから出力層５４４Ｂへのノード間の結合を規定する重みパラメータは、多数の学習データを用いて、長さデータ４２と学習データの第４データ３４との誤差を最小化するように学習して導出される。

図１２に、本実施形態に係る学習処理の流れの一例を示す。生成器５４Ｃを含む学習処理部５２Ｃ及び生成器５４Ｄを含む学習処理部５２Ｄによる学習処理部５２は、図示しないＣＰＵを含むコンピュータを含んで構成し、学習処理を実行することが可能である。

学習処理部５２は、次の各ステップを実行する。まず、上記ステップＳ１１０と同様に、ステップＳ１２０で、時系列に測定した結果の学習データを取得する。すなわち、時系列に測定した結果のデータとして、第１データ３１（電気特性）、第２データ３２（圧力特性）、第３データ３３（荷重特性）、及び第４データ３４（長さ）を取得する。

ステップＳ１２２では、第１モデル用の入力層５４０Ａ及びリザバ層５４３Ｃを構築する。ここでは、図７に示す生成器５４Ａと同様であるが、一部の学習データを用いて、学習処理を行う場合を説明する。具体的には、一部の学習データを用いて、学習処理を行う。この一部の学習データを用いて学習した学習結果のノード間の結合の重みパラメータの情報の集合を得て、入力層５４０Ａからリザバ層５４３Ｃへのノードの結合と、リザバ層５４３Ｃにおけるノード間の結合及びフィードバック結合とを、重み係数として導出する。この導出した重み係数により入力層５４０Ａ及びリザバ層５４３Ｃを同定することで入力層５４０Ａ及びリザバ層５４３Ｃを構築する。

次に、ステップＳ１２３では、多数の学習データを用いて第１モデル５１Ａを生成する。すなわち、リザバ層５４３Ｃから出力層５４４Ａへのノード間の結合についてのみ学習し、学習結果のノード間の結合の重みパラメータの情報の集合を得ることで、第１モデル用のＲＣＮを構築する。

次のステップＳ１２４では、上記ステップＳ１２２と同様に、第２モデル用の入力層５４０Ｂ及びリザバ層５４３Ｄを構築する。すなわち、一部の学習データを用いて、学習処理を行う。この一部の学習データを用いて学習した学習結果のノード間の結合の重みパラメータの情報の集合を得て、入力層５４０Ｂからリザバ層５４３Ｄへのノードの結合と、リザバ層５４３Ｄにおけるノード間の結合およびフィードバック結合とを、重み係数として導出する。この導出した重み係数により入力層５４０Ｂ及びリザバ層５４３Ｄを同定することで入力層５４０Ｂ及びリザバ層５４３Ｄを構築する。

次に、ステップＳ１２５では、上記ステップＳ１２３と同様に、多数の学習データを用いて第２モデル５１Ｂを生成する。すなわち、リザバ層５４３Ｄから出力層５４４Ｂへのノード間の結合についてのみ学習し、学習結果のノード間の結合の重みパラメータの情報の集合を得ることで、第２モデル用のＲＣＮを構築する。

そして、ステップＳ１２６において、ステップＳ１２２で導出した重み係数と、ステップＳ１２３の学習結果のノード間の結合の重みパラメータの情報の集合として表現されるデータを第１モデル５１Ａとして記憶する。また、ステップＳ１２４で導出した重み係数と、ステップＳ１２５の学習結果のノード間の結合の重みパラメータの情報の集合として表現されるデータを第２モデル５１Ｂとして記憶する。

本実施形態に係る物理量推定装置１では、上記に例示した手法により生成した学習済みの生成器５４Ｃ、５４Ｄを学習モデル５１として用いる。ここでは、入力層５４０Ａからリザバ層５４３Ｃへのノードの結合と、リザバ層５４３Ｃにおけるノード間の結合及びフィードバック結合とを表す重み係数と、リザバ層５４３Ｃから出力層５４４Ａへのノード間の結合とを表す重みパラメータとが第１モデル５１Ａに対応する。また、入力層５４０Ｂからリザバ層５４３Ｄへのノードの結合と、リザバ層５４３Ｄにおけるノード間の結合及びフィードバック結合とを表す重み係数と、リザバ層５４３Ｄから出力層５４４Ｂへのノード間の結合とを表す重みパラメータとが第２モデル５１Ｂに対応する。十分に学習した第１モデル５１Ａと第２モデル５１Ｂを含む学習モデル５１を用いれば、非線形に変形するラバーアクチュエータについて、電気特性及び圧力特性（時系列な電気抵抗値及び圧力値）から非線形に変化する長さを同定することも不可能ではない。

以上説明したように、本開示によれば、一般的な再帰型ニューラルネットワークに代えて、ＲＣＮによりネットワークを構築して学習モデル５１を最適化する。これによって、一般的な再帰型ニューラルネットワークにより学習モデルを構築する場合と比べて、必要とされた学習時間を抑制可能となる。

また、一般的な再帰型ニューラルネットワークでは時間的遡及を行うために、必要とされる膨大なメモリ（メモリ容量）も抑制可能となる。

（第３実施形態）
次に、第３実施形態を説明する。第３実施形態は、ラバーアクチュエータ２の長さを推定するための学習モデル５１の学習効果の向上を考慮したものである。なお、第３実施形態は第１実施形態及び第２実施形態と略同様の構成のため、同一部分には同一符号を付して詳細な説明を省略する。

上述したＲＣＮを用いることで、学習時間を低減可能となる。ところで、入力層からリザバ層へのノードの結合と、リザバ層におけるノード間の結合およびフィードバック結合とに、固定の重みパラメータを用いた場合、学習の効果が不十分な場合がある。これは、リザバ層から出力層へのノード間の結合の重みパラメータを学習しても、固定の重みパラメータによる限られた個数のノードが設定されたリザバ層では、リザバ層からの出力が最適化に足る出力とならない場合があるからである。このため、リザバ層に用いる再帰型ニューラルネットワークの構造を複雑にすることが想定されるが、リザバ層の設定時間を要することになるため、好ましくない。

リザバコンピューティング（ＲＣＮ）は、周知のように、入力を高次元空間に非線形変換により高次元の特徴空間に射影することである。この点について、再帰型ニューラルネットワークに代えて非線形な動的システムをリザバ層に用いる、物理的リザバコンピューティング（ＰＲＣ：Physical Reservoir Computing）と呼ばれるネットワークモデル（以下、ＰＲＣＮという。）が知られている。ＰＲＣおよびＰＲＣＮ自体は公知の技術であるため、詳細な説明を省略するが、リザバ層に非線形に変形するラバーアクチュエータ２の変形に関するデータを貯留するものとして利用可能である。すなわち、ＰＲＣＮは、非線形に変形するラバーアクチュエータ２の長さの推定に好適に適用可能である。

図１３に、ＰＲＣＮを用いた学習処理部の概念構成の一例を示す。図１３に示す学習処理部５２は、図１１に示す学習処理部５２Ｃ、５２Ｄを学習処理部５２Ｅ、５２Ｆに代え、図１１に示す生成器５４Ｃ、５４Ｄを生成器５４Ｅ、５４Ｆに代え、演算器５６Ａ、５６Ｂにより導出された誤差を出力層５４４Ａ、５４４Ｂ側にのみ反映させて学習を行う点が図７に示す学習処理部５２と異なっている。

図１３に示すように、学習処理部５２Ｅの生成器５４Ｅは、図１１と同様の入力層５４０Ａと出力層５４４Ａ、及び図１１のリザバ層５４３Ｃに代えて物理リザバ層５４５Ｅを含んで、公知のＰＲＣＮを構成する。ＰＲＣＮ自体は公知の技術であるため、詳細な説明を省略するが、ＰＲＣＮでは、入力層５４０Ａから物理リザバ層５４５Ｅへのノードの結合には、固定の重み係数が設定される。物理リザバ層５４５Ｅは、多数の時系列な相関関係について特徴量を貯留し、入力に近い複数の特徴量を出力する構成になっている。そして、物理リザバ層５４５Ｅから出力層５４４Ａへのノード間の結合（例えば線形結合）は、各々の重みパラメータが、多数の学習データを用い、荷重データ４０と学習データの第３データ３３（荷重特性）との誤差を最小化する学習によって最適化される。

なお、固定の重み係数は、上述したように、初期値として定めた係数を設定してもよく、学習データを用いて、所定回数又は所定時間だけ最適化した場合の重み係数を設定してもよい。

物理リザバ層５４５Ｅは、ラバーアクチュエータ２の時系列に物理的な相関関係が多数貯留され、入力層５４０Ａからの未知の入力データ（電気特性と圧力特性）に近い、入力データ（電気特性と圧力特性）に対応する長さを抽出し、複数の特徴量として出力層５４４Ａへ出力する。概念的には、ラバーアクチュエータ２の挙動として、電気特性と圧力特性、すなわち時系列に変化する電気抵抗値及び圧力値に対応する荷重特性（荷重値）との相関関係を多数記憶しておき、未知の電気特性と圧力特性（時系列の電気抵抗値及び圧力値）に近い複数のラバーアクチュエータ２における荷重特性（荷重値）の各々を特徴量として選択して出力することである。これによって、複雑な計算を実行することを低減可能となる。

同様に、学習処理部５２Ｆの生成器５４Ｆは、入力層５４０Ｂと出力層５４４Ｂ、及び物理リザバ層５４５Ｆを含んで、公知のＰＲＣＮを構成する。入力層５４０Ｂから物理リザバ層５４５Ｆへのノードの結合には、固定の重み係数が設定され、物理リザバ層５４５Ｆは、多数の時系列な相関関係について特徴量を貯留し、入力に近い複数の特徴量を出力する構成になっている。物理リザバ層５４５Ｆから出力層５４４Ａへのノード間の結合は、各々の重みパラメータが、多数の学習データを用い、長さデータ４２と学習データの第４データ３４（長さ）との誤差を最小化する学習によって最適化される。

物理リザバ層５４５Ｆは、入力層５４０Ｂからの未知の入力データ（電気特性、圧力特性、及び荷重特性）に近い、入力データに対応する長さを抽出し、複数の特徴量として出力層５４４Ｂへ出力する。これによって、複雑な計算を実行することを抑制可能となる。

図１４に、本実施形態に係る学習処理の流れの一例を示す。生成器５４Ｅを含む学習処理部５２Ｅ及び生成器５４Ｆを含む学習処理部５２Ｆによる学習処理部５２は、図示しないＣＰＵを含むコンピュータを含んで構成し、学習処理を実行することが可能である。

学習処理部５２は、次の各ステップを実行する。まず、上記ステップＳ１１０と同様に、ステップＳ１３０で、時系列に測定した結果の学習データを取得する。すなわち、時系列に測定した結果のデータとして、第１データ３１（電気特性）、第２データ３２（圧力特性）、第３データ３３（荷重特性）、及び第４データ３４（長さ）を取得する。

ステップＳ１３２では、第１モデル用の入力層５４０Ａ及びリザバ層５４３Ｃを構築する。入力層５４０Ａは、予め定めた重み係数を設定するものとする。よって、入力層５４０Ａから物理リザバ層５４５Ｅへのノードの結合を、予め定めた重み係数により同定することで入力層５４０Ａを構築する。一方、物理リザバ層５４５Ｅは、学習データの各々、すなわち、電気特性及び圧力特性（時系列に変化する電気抵抗値及び圧力値）に対応する荷重特性（荷重値）との相関関係を多数貯留したものとする。よって、物理リザバ層５４５Ｅは、学習データによる時系列に変化する電気特性及び圧力特性（電気抵抗値及び圧力値）に対応する荷重特性（荷重値）との相関関係が特徴量として貯留され、その中から入力に近い複数の特徴量を出力するように構成することで構築する。なお、物理リザバ層５４５Ｅにおいて入力に近い複数の特徴量を出力する構成の一例には、入力された電気特性と圧力特性に近い、電気特性と圧力特性に対応する複数の荷重特性の各々を特徴量として選択して出力するフィルタ等のデータを適用すればよい。

次に、ステップＳ１３３では、多数の学習データを用いて第１モデル５１Ａを生成する。すなわち、上述した物理リザバ層５４５Ｅから出力層５４４Ａへのノード間の結合についてのみ学習し、学習結果のノード間の結合の重みパラメータの情報の集合を得ることで、第１モデル用のＰＲＣＮを構築する。

次のステップＳ１３４では、上記ステップＳ１３２と同様に、第２モデル用の入力層５４０Ｂ及び物理リザバ層５４５Ｆを構築する。すなわち、入力層５４０Ｂは、予め定めた重み係数を設定し、入力層５４０Ｂから物理リザバ層５４５Ｆへのノードの結合を、予め定めた重み係数により同定することで入力層５４０Ｂを構築する。物理リザバ層５４５Ｆは、学習データの各々、すなわち、電気特性及び圧力特性（時系列に変化する電気抵抗値及び圧力値）と、電気特性及び圧力特性に対応する荷重特性（荷重値）との相関関係を多数貯留する。よって、物理リザバ層５４５Ｆは、学習データによる電気特性及び圧力特性に対応する荷重特性との相関関係が特徴量として貯留され、その中から入力に近い複数の特徴量を出力するように構成することで構築する。なお、物理リザバ層５４５Ｆにおいて入力に近い複数の特徴量を出力する構成の一例には、入力された電気特性及び圧力特性と、荷重特性とに近い、対応する複数の長さの各々を特徴量として選択して出力するフィルタ等のデータを適用すればよい。

次に、ステップＳ１３５では、上記ステップＳ１３３と同様に、多数の学習データを用いて第２モデル５１Ｂを生成する。すなわち、物理リザバ層５４５Ｆから出力層５４４Ｂへのノード間の結合についてのみ学習し、学習結果のノード間の結合の重みパラメータの情報の集合を得ることで、第２モデル用のＰＲＣＮを構築する。

次のステップＳ１３６では、上述した構築済みの第１モデル用のＰＲＣＮ及び第２モデル用のＰＲＣＮを学習モデル５１として記憶する。具体的には、第１モデル用のＰＲＣＮを示すデータとして、入力層５４０Ａから物理リザバ層５４５Ｅへのノードの結合、物理リザバ層５４５Ｅ、及び物理リザバ層５４５Ｅから出力層５４４Ａへのノード間の結合を表す重みパラメータで表現されるデータを、第１モデル５１Ａとして記憶する。また、第２モデル用のＰＲＣＮを示すデータとして、入力層５４０Ｂから物理リザバ層５４５Ｆへのノードの結合、物理リザバ層５４５Ｆ、及び物理リザバ層５４５Ｆから出力層５４４Ｂへのノード間の結合を表す重みパラメータで表現されるデータを、第２モデル５１Ｂとして記憶する。

本実施形態に係る物理量推定装置では、上述した手法により生成した学習済みの生成器５４Ｅ、５４Ｆを学習モデル５１として用いる。

本実施形態に係る物理量推定装置１は、未知の入力データであるラバーアクチュエータ２の電気特性及び圧力特性に対して、第１モデル５１Ａにおいて、物理リザバ層５４５Ｅに貯留されたラバーアクチュエータ２の時系列の物理的な相関関係のうち、未知の入力データ（電気特性及び圧力特性）に近い当該入力データに対応する荷重特性（荷重値）を示すデータを、複数の特徴量として抽出する。この物理リザバ層５４５Ｅからの複数の特徴量を、学習された重みパラメータによって、例えば線形結合してラバーアクチュエータ２の荷重特性（荷重データ４０）として推定する。十分に学習した第１モデル５１Ａを用いれば、ラバーアクチュエータにおける電気特性及び圧力特性から荷重特性を同定することも不可能ではない。そして、第２モデル５１Ｂにおいて、未知の入力データであるラバーアクチュエータ２の電気特性及び圧力特性に対して、物理リザバ層５４５Ｆに貯留されたラバーアクチュエータ２の時系列の物理的な相関関係のうち、未知の入力データ（電気特性及び圧力特性）と、当該未知の入力データ（電気特性及び圧力特性）に対応する荷重特性とに近い、対応する長さを示すデータを、複数の特徴量として抽出する。この物理リザバ層５４５Ｆからの複数の特徴量を、学習された重みパラメータによって、例えば線形結合してラバーアクチュエータ２の長さ（長さデータ４２）として推定する。十分に学習した学習モデル５１を用いれば、ラバーアクチュエータ２について、電気特性及び圧力特性から長さを推定することも不可能ではない。

以上説明したように、本開示によれば、ＲＣＮに代えて、ＰＲＣＮによりネットワークを構築して学習モデル５１を最適化する。これによって、ＲＣＮにより学習モデルを構築する場合と比べて、学習モデル５１の学習効果の向上が図れる。

（第４実施形態）
次に、第４実施形態を説明する。なお、第４実施形態は上述した実施形態と略同様の構成のため、同一部分には同一符号を付して詳細な説明を省略する。

上述した実施形態では、少なくとも２つの物理量から他の物理量を推定する場合、すなわち、例えば、ラバーアクチュエータ２における第１データ（電気特性）及び第２データ（圧力特性）を用いて、ラバーアクチュエータ２の長さを推定する場合を説明した。第４実施形態は、１つの物理量から他の物理量を推定する場合に本開示の技術を適用したものである。

図１５に、本実施形態に係る物理量推定装置の構成の一例を示す。本実施形態では、予め学習された学習モデルを用いて、ラバーアクチュエータ２について、第１データ３１（電気特性）のみからラバーアクチュエータ２の長さを推定する。

ここで、ラバーアクチュエータ２の変形によって得られる第１データ３１（電気特性）には、圧力特性、荷重特性、及び長さの各々の成分が含まれていると考えられる。そこで、本実施形態では、入力された第１データ３１（電気特性）から圧力特性を示す圧力データ及び荷重特性を示す荷重データを推定し、当該推定結果を用いて、ラバーアクチュエータ２の長さを推定する。

図１５に示すように、本実施形態に係る物理量推定装置１０における推定部５には、入力データ３として、ラバーアクチュエータ２における時系列の電気抵抗の大きさ（電気抵抗値）による電気特性を表す第１データ３１のみが入力される。物理量推定装置１０における推定部５は、学習済みの学習モデル５１を用いて推定したラバーアクチュエータ２の変形の大きさ（長さ）を表す出力データ６を出力する。

図１６に、本実施形態に係る学習処理部５２の概念構成の一例を示す。
学習処理部５２は、ラバーアクチュエータ２における時系列な物理量として測定済みの物理量を用いて学習処理を行う。すなわち、ラバーアクチュエータ２における物理量を時系列に測定した大量のデータを学習データとする。本実施形態では、ラバーアクチュエータ２における物理量について圧力特性及び荷重特性で表される力を考慮して、学習モデル５１を学習する。学習データは、ラバーアクチュエータ２における電気特性（第１データ３１）、圧力特性（第２データ３２）及び荷重特性（第３データ３３）と、ラバーアクチュエータ２の長さ（第４データ３４）と、のセットを大量に含む。

図１６に示すように、本実施形態に係る学習処理部５２は、学習処理部５２Ａ、５２Ｂを含み、学習処理部５２Ａは第１データ３１（電気特性）から圧力特性を示す圧力データ４４及び荷重特性を示す荷重データ４０を出力するように学習処理を行う機能部である。具体的には、学習処理部５２Ａは、第１データ３１（電気特性）を入力として、当該入力に対応する第２データ３２（圧力特性）に一致又は近い圧力特性を推定し、推定結果を圧力データ４４として出力するように学習処理を行う。また、学習処理部５２Ａは、第１データ３１（電気特性）を入力として、当該入力に対応する第３データ３３（荷重特性）に一致又は近い荷重特性を推定し、推定結果を荷重データ４０として出力するように学習処理を行う。学習処理部５２Ｂは、ラバーアクチュエータ２の第１データ３１（電気特性）と、学習処理部５２Ａから出力される圧力データ４４、及び荷重データ４０と、を入力として、当該入力に対応する第４データ３４（長さ）に一致又は近いラバーアクチュエータ２の長さを推定して出力データ６として出力するように学習処理を行う機能部である。

学習処理部５２Ａは、学習データのうちの第１データ３１（電気特性）を入力とし、学習データのうちの第２データ３２（圧力特性）及び第３データ３３（荷重特性）の両方を目標として、出力層５４４Ａから出力される圧力データ４４と学習データの第２データ３２との誤差、及び荷重データ４０と学習データの第３データ３３との誤差を最小化するようにノード間の結合を最適化する。

学習処理部５２Ｂは、学習データのうちの第１データ３１（電気特性）を入力とし、第１データ３１により推定される圧力データ４４と荷重データ４０も入力とする。学習処理部５２Ｂは、入力されたデータに対して、学習データのうちの第４データ３４（長さ）を目標として、出力層５４４Ｂから出力される長さデータ４２と学習データの第４データ３４との誤差を最小化するようにノード間の結合を最適化する。

十分に学習した第１モデル５１Ａを用いれば、ラバーアクチュエータ２における電気特性（電気抵抗値）から圧力特性（圧力値）及び荷重特性（荷重値）を推定することも不可能ではない。また、第１モデル５１Ａの推定結果を用いて十分に学習した第２モデル５１Ｂを用いれば、ラバーアクチュエータ２における電気特性（電気抵抗値）から圧力特性（圧力値）及び荷重特性（荷重値）を考慮したラバーアクチュエータ２の長さを推定することも不可能ではない。

以上説明したように、本実施形態によれば、１つの物理量としての電気特性（電気抵抗値）から他の物理量（ラバーアクチュエータ２の長さ）を推定できる。従って、ラバーアクチュエータ２の時系列の電気抵抗値による電気特性を検出するのみで、ラバーアクチュエータ２の長さを推定することが可能となる。

（第５実施形態）
次に、第５実施形態を説明する。なお、第５実施形態は上述した実施形態と略同様の構成のため、同一部分には同一符号を付して詳細な説明を省略する。

上述した実施形態では、物理量推定装置１０における推定部５で用いる学習モデル５１として、第１モデル５１Ａと第２モデル５１Ｂとを独立したモデルで形成し、個別に学習処理して第１モデル５１Ａと第２モデルとを生成する場合を説明した。本開示の技術は、第１モデル５１Ａと第２モデル５１Ｂとを独立した２つのモデルで形成することに限定されない。例えば、３つ以上のモデルによって段階的に学習モデルを形成してもよく、１つのモデルで、学習モデル５１を形成してもよい。第５実施形態は、一例として、第１実施形態における第１モデル５１Ａと第２モデル５１Ｂとを１つのモデルで、学習モデル５１を形成する場合に本開示の技術を適用したものである。

図１７に、１つのモデルで、学習モデル５１を形成する場合における学習処理部５２の概念構成の一例を示す。

図１７に示すように、本実施形態に係る学習処理部５２は、１つのモデルに対して２段階の学習処理を行う。第１段階の学習処理では、第１データ３１（電気特性）及び第２データ３２（圧力特性）から荷重特性を示す荷重データ４０を出力するように学習処理を行う。具体的には、図１７に実線で示すように、学習処理部５２は、第１段階の学習処理として、第１データ３１（電気特性）及び第２データ（圧力特性）を入力として、当該入力に対応する第３データ３３（荷重特性）に一致又は近い荷重特性を推定し、推定結果を荷重データ４０として出力するように学習処理を行う。第２段階の学習処理では、図１７に点線で示すように、第１データ３１（電気特性）及び第２データ（圧力特性）と、学習処理部５２Ａから出力される荷重データ４０と、を入力として、当該入力に対応する第４データ３４（長さ）に一致又は近いラバーアクチュエータ２の長さを推定して出力データ６として出力するように学習処理を行う。この第２段階の学習処理では、第１段階で学習処理したことにより得られる荷重データ４０が、第２段階の学習処理においても維持されるように学習処理が行われる。

十分に学習した学習モデル５１を用いれば、１つの学習モデルであっても、ラバーアクチュエータ２における電気特性（電気抵抗値）及び圧力特性（圧力値）から荷重特性（荷重値）を中間ノードとして推定しつつ、ラバーアクチュエータ２の長さを推定することも不可能ではない。

以上説明したように、本実施形態によれば、１つの学習モデルによって、入力された物理量（例えば、電気特性及び圧力特性）から他の物理量（ラバーアクチュエータ２の長さ）を推定できる。従って、複数の学習モデルを構築することに比べて、モデルの数量を低減可能となり、ネットワーク構成を簡略化することが可能となる。

（実施例１）
次に、上述した実施形態を適用した推定装置を用いて、荷重を与えた際におけるラバーアクチュエータ２の長さを推定する検証を行った。次の表１に、第１データ３１（電気特性）と、第２データ３２（圧力特性）とを計測した実測物理量を用いてラバーアクチュエータ２の長さを推定した場合における検証結果を示す。当該検証では、荷重データ４０の推定を実行せずにラバーアクチュエータ２の長さを推定した結果を比較例として例示する。また、検証結果を評価する評価指標には、ラバーアクチュエータ２の長さの実測値と予測値との誤差の総和による指標（ＮＭＳＥ）を用いた。

比較例１は、第１データ３１（電気特性）であるラバーアクチュエータ２における電気抵抗値と、第２データ３２（圧力特性）であるラバーアクチュエータ２における圧力値（内圧値）とを計測した計測値を実測物理量として入力し、ラバーアクチュエータ２の長さを推定した結果である。比較例２は、電気抵抗値と、圧力値（内圧値）と、第３データ３３（荷重特性）として荷重値とを計測した計測値を実測物理量として入力し、ラバーアクチュエータ２の長さを推定した結果である。実施例１は、電気抵抗値と、圧力値（内圧値）とを計測した計測値を実測物理量として第１モデル５１Ａに入力し、第１モデル５１Ａによる推定結果の荷重データ４０を、前記電気抵抗値及び圧力値（内圧値）に加えて第２モデル５１Ｂに入力してラバーアクチュエータ２の長さを推定した結果である。

比較例２では、評価指標が０．０１３８と小さい値となり、高精度に長さを推定可能であるが、常時、荷重を実測することは困難である。一方、比較例１に示すように、荷重を実測値を用いない場合は、評価指標が０．２２００になり、比較例２に比べて推定精度が極端に低下する。一方、実施例１では、荷重特性を考慮した学習モデルを用いることで、評価指標が０．０５２３となり、比較例２に比べて高精度に長さを推定可能である。すなわち、実施例１では、第１モデル５１Ａにより電気特性（電気抵抗値）及び圧力特性（内圧）から荷重特性を推定し、その推定結果の荷重データ４０を加えた物理量を用いて第２モデル５１Ｂにより長さを推定する。このように、長さを推定するための物理量として荷重特性を用いることなく、電気特性（電気抵抗値）及び圧力特性（内圧）のみを用いた場合であっても、荷重特性を考慮した結果に近い推定結果を得ることが可能となる。従って、荷重特性を推定し、その推定結果の荷重データを用いて長さを推定することで、比較例２に比べて推定精度を大幅に向上することが可能となる。

（実施例２）
次に、ラバーアクチュエータ２の第１データ３１（電気特性）を計測した実測物理量を用いてラバーアクチュエータ２の長さを推定した検証について説明する。次の表２に、第１データ３１（電気特性）を用いてラバーアクチュエータ２の長さを推定した場合における検証結果を示す。

比較例３は、第１データ３１（電気特性）である電気抵抗値を計測した計測値を実測物理量として入力し、ラバーアクチュエータ２の長さを推定した結果である。実施例２は、第１データ３１（電気特性）である電気抵抗値による実測物理量を第１モデル５１Ａに入力し、第１モデル５１Ａによる推定結果の圧力データ４４及び荷重データ４０を加えて第２モデル５１Ｂに入力してラバーアクチュエータ２の長さを推定した結果である。

実施例２では、圧力特性及び荷重特性を考慮した学習モデルを用いることで、評価指標が０．１０８となり、比較例３の評価指標が０．１６３と比べて高精度に長さを推定可能である。すなわち、実施例２では、長さを推定するための物理量として圧力特性及び荷重特性を用いることなく、電気特性（電気抵抗値）のみを用いた場合であっても、圧力特性及び荷重特性を考慮した結果に近い推定結果を得ることが可能となる。従って、圧力特性及び荷重特性を推定し、その推定結果を用いて長さを推定することで、比較例３に比べて推定精度を大幅に向上することが可能となる。

比較例４は、電気特性に代えて圧力特性である圧力値（内圧値）の計測値を実測物理量として入力し、電気特性及び荷重特性を推定してラバーアクチュエータ２の長さを推定した結果である。比較例５は、荷重特性である荷重値の計測値を実測物理量として入力し、電気特性及び圧力特性を推定してラバーアクチュエータ２の長さを推定した結果である。

比較例４では評価指標が０．８７６となり、比較例５では評価指標が０．２５３となり、実施例２と比べて、推定精度が極端に低下する。従って、ラバーアクチュエータ２の長さを推定するにあたって用いる物理量は、電気特性である電気抵抗値を計測した計測値を用いることで、推定精度を大幅に向上することが可能であることが理解される。

上述のように、本開示では、部材としてラバーアクチュエータを適用した場合を説明したが、部材はラバーアクチュエータに限定されないことは勿論である。また、ラバーアクチュエータに関する物理量として電気特性、圧力特性、荷重特性、及び長さを適用した場合を説明したが、本開示の技術はこれらの物理量に限定されるものではなく、他の物理量を適用してもよい。

また、上述した各実施形態では、圧力特性を示す第２物理量は省略可能であって、ラバーアクチュエータ２に対して、未知の第１データ３１（電気特性）から、ラバーアクチュエータ２の長さを推定することも可能となる。すなわち、３つの物理量を対象として、２つの物理量から他の物理量を推定する場合にも本開示の技術は適用可能である。

なお、上述した実施形態は、次の技術事項を含む。
＜技術事項１＞
弾性変形可能な部材を変形させる物理量を示す第１特徴量、
前記部材を変形させる物理量であって前記第１特徴量と異なる物理量を示す第２特徴量、
変形に応じて変化する前記部材の物理量を示す第３特徴量、及び、
変形に応じて変化する前記部材の物理量であって前記第３特徴量と異なる物理量を示す第４特徴量の４つの特徴量を用い、
前記第１特徴量及び前記第２特徴量の少なくとも一方を中間特徴量とし、かつ前記第３特徴量及び前記第４特徴量の一方をターゲット物理量を示すターゲット特徴量とし、
前記４つの特徴量のうち前記ターゲット特徴量以外の少なくとも１つの特徴量を入力とし、前記中間特徴量を出力するように学習された第１モデルと、
前記第１モデルへの入力、及び前記第１モデルから出力された中間特徴量を入力とし、前記ターゲット特徴量を出力するように学習された第２のモデルと、を含む前記学習モデルに対して、
推定対象の前記ターゲット特徴量以外の少なくとも１つの特徴量を入力し、前記推定対象の前記ターゲット特徴量を推定する推定部
を含む推定装置。

＜技術事項２＞
前記第１特徴量は、前記部材を変形させる物理量を示す第２物理量であり、
前記第２特徴量は、前記部材を変形させる物理量であって前記第１特徴量と異なる物理量を示す第３物理量であり、
前記第３特徴量は、前記部材の変形に応じて変化する物理量を示す第１物理量であり、
前記第４特徴量は、前記部材の変形に応じて変化する物理量であって前記第３特徴量と異なる物理量を示す第４物理量である
技術事項１に記載の推定装置。

＜技術事項３＞
前記第１特徴量は、前記部材を変形させる圧力を示す物理量であり、
前記第２特徴量は、前記部材を変形させる荷重を示す物理量であり、
前記第３特徴量は、前記部材の変形に応じて変化する電気特性を示す物理量であり、
前記第４特徴量は、前記部材の変形に応じて変化する前記部材の長さを示す第４物理量である
技術事項２に記載の推定装置。

＜技術事項４＞
前記中間特徴量は、前記第１特徴量及び前記第２特徴量の一方であり、
前記第１モデルへの入力は、前記第１特徴量及び前記第２特徴量の他方、及び前記第３特徴量及び前記第４特徴量の他方である技術事項１に記載の推定装置。

＜技術事項５＞
前記中間特徴量は、前記第１特徴量及び前記第２特徴量の両方であり、前記第１モデルへの入力は、前記第３特徴量及び前記第４特徴量の他方である技術事項１に記載の推定装置。

以上、本開示の技術を実施形態を用いて説明したが、本開示の技術の技術的範囲は上記実施形態に記載の範囲には限定されない。要旨を逸脱しない範囲で上記実施形態に多様な変更または改良を加えることができ、当該変更または改良を加えた形態も開示の技術の技術的範囲に含まれる。

また、上記実施の形態では、補助記憶装置に記憶したプログラムを実行することにより行われる処理を説明したが、少なくとも一部のプログラムの処理をハードウエアで実現してもよい。また、上述した実施形態で説明したプログラムの処理の流れも、一例であり、主旨を逸脱しない範囲内において不要なステップを削除したり、新たなステップを追加したり、処理順序を入れ替えたりしてもよい。

さらに、上述した実施形態における処理をコンピュータにより実行させるために、上述した処理をコンピュータで処理可能なコードで記述したプログラムを光ディスク等の記憶媒体等に記憶して流通するようにしてもよい。

上述した実施形態では、汎用的なプロセッサの一例としてＣＰＵを用いて説明したが、上記実施形態において、プロセッサとは広義的なプロセッサを指し、汎用的なプロセッサ（例えばＣＰＵ：ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ、等）や、専用のプロセッサ（例えばＧＰＵ：ＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｎｉｔ、ＡＳＩＣ：ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔ、ＦＰＧＡ：ＦｉｅｌｄＰｒｏｇｒａｍｍａｂｌｅＧａｔｅＡｒｒａｙ、プログラマブル論理デバイス、等）を含むものである。

また、上述した実施形態におけるプロセッサの動作は、１つのプロセッサによって成すのみでなく、複数のプロセッサが連携して成すものであってもよく、物理的に離れた位置に存在する複数のプロセッサが協働して成すものであってもよい。

本明細書に記載された全ての文献、特許出願、及び技術規格は、個々の文献、特許出願、及び技術規格が参照により取り込まれることが具体的かつ個々に記された場合と同程度に、本明細書中に参照により取り込まれる。

１物理量推定装置
２ラバーアクチュエータ
３入力データ
５推定部
６出力データ
７測定装置
２１本体
３１第１データ
３２第２データ
３３第３データ
３４第４データ
４０荷重データ
４２長さデータ
４４圧力データ
５１学習モデル
５１Ａ第１モデル
５１Ｂ第２モデル
５２学習処理部
５４Ａ、５４Ｂ生成器
５６Ａ、５６Ｂ演算器
７０コントローラ
７６電気特性検出部
７７距離センサ
８０荷重部
１００コンピュータ本体
１０８補助記憶装置
１０８Ｐ制御プログラム
５４０Ａ、５４０Ｂ入力層
５４２Ａ、５４２Ｂ中間層
５４３Ｃ、５４３Ｄリザバ層
５４４Ａ、５４４Ｂ出力層
５４５Ｅ、５４５Ｆ物理リザバ層

Claims

弾性変形可能な部材における前記部材の変形に応じて変化する種類が異なる少なくとも３つの物理量で、かつ時系列情報が対応付けられたターゲット物理量を含む前記少なくとも３つの物理量の複数を学習用データとして用いて、前記ターゲット物理量以外の少なくとも１つの物理量を入力とし、前記ターゲット物理量を出力するように学習された学習モデルであって、前記ターゲット物理量以外の少なくとも１つの物理量を入力とし、前記ターゲット物理量及び前記少なくとも１つの物理量以外の物理量を中間物理量として出力するように学習された第１モデルと、前記ターゲット物理量以外の少なくとも１つの物理量、及び前記第１モデルから出力される前記中間物理量を入力とし、前記ターゲット物理量を出力するように学習された第２モデルと、を含む前記学習モデルに対して、推定対象の前記ターゲット物理量以外の少なくとも１つの物理量を入力し、前記推定対象の前記ターゲット物理量を推定する推定部
を含む推定装置。
前記第１モデルは、前記ターゲット物理量以外の物理量のうちの第１物理量及び前記第１物理量と異なる第２物理量を入力とし、前記ターゲット物理量及び前記第１物理量及び第２物理量以外の第３物理量を中間物理量として出力するように学習され、
前記第２モデルは、前記第１物理量及び前記第２物理量と、前記第１モデルから出力される前記中間物理量である前記第３物理量と、を入力とし、前記ターゲット物理量を出力するように学習される
請求項１に記載の推定装置。
前記第１モデルは、前記ターゲット物理量以外の物理量のうちの第１物理量を入力とし、前記ターゲット物理量及び前記第１物理量以外の第２物理量及び第３物理量を中間物理量として出力するように学習され、
前記第２モデルは、前記第１物理量と、前記第１モデルから出力される前記中間物理量である第２物理量及び前記第３物理量と、を入力とし、前記ターゲット物理量を出力するように学習される
請求項１に記載の推定装置。
前記部材は、前記変形に応じて電気特性が変化し、
前記少なくとも３つの物理量として、前記部材の変形に応じて変化した前記電気特性を表す第１物理量、前記部材を変形させる第２物理量、前記部材を変形させ、かつ前記第２物理量と異なる物理量を表す第３物理量、及び前記部材の変形量を表すターゲット物理量を含み、
前記学習モデルは、少なくとも前記第１物理量を入力として、前記ターゲット物理量を出力するように学習される
請求項１から請求項３の何れか１項に記載の推定装置。
前記部材は、内部が中空に形成され、かつ前記中空の内部に加圧流体が供給されて所定方向に収縮力を発生する弾性体を含み、
前記第１物理量は、前記弾性体の電気抵抗値であり、
前記第２物理量は、前記弾性体に供給される前記加圧流体の供給状態を表す圧力値又は前記弾性体の内圧を表す圧力値であり、
前記第３物理量は、前記弾性体に与えられる荷重を示す値であり、
前記ターゲット物理量は、前記弾性体の前記所定方向の距離である
請求項４に記載の推定装置。
前記学習モデルは、再帰型ニューラルネットワークを用いて学習させることで生成されたモデルである
請求項１から請求項５の何れか１項に記載の推定装置。
前記学習モデルは、リザバコンピューティングによるネットワークを用いて学習させることで生成されたモデルである
請求項１から請求項６の何れか１項に記載の推定装置。
前記学習モデルは、非線形に変形する部材における前記少なくとも３つの物理量を複数蓄積したリザバを用いた物理的リザバコンピューティングによるネットワークを用いて学習させることで生成されたモデルである
請求項１から請求項６の何れか１項に記載の推定装置。
コンピュータが
弾性変形可能な部材における前記部材の変形に応じて変化する種類が異なる少なくとも３つの物理量で、かつ時系列情報が対応付けられたターゲット物理量を含む前記少なくとも３つの物理量の複数を学習用データとして用いて、前記ターゲット物理量以外の少なくとも１つの物理量を入力とし、前記ターゲット物理量を出力するように学習された学習モデルであって、前記ターゲット物理量以外の少なくとも１つの物理量を入力とし、前記ターゲット物理量及び前記少なくとも１つの物理量以外の物理量を中間物理量として出力するように学習された第１モデルと、前記ターゲット物理量以外の少なくとも１つの物理量、及び前記第１モデルから出力される前記中間物理量を入力とし、前記ターゲット物理量を出力するように学習された第２モデルと、を含む前記学習モデルに対して、推定対象の前記ターゲット物理量以外の少なくとも１つの物理量を入力し、前記推定対象の前記ターゲット物理量を推定する
推定方法。
コンピュータを
弾性変形可能な部材における前記部材の変形に応じて変化する種類が異なる少なくとも３つの物理量で、かつ時系列情報が対応付けられたターゲット物理量を含む前記少なくとも３つの物理量の複数を学習用データとして用いて、前記ターゲット物理量以外の少なくとも１つの物理量を入力とし、前記ターゲット物理量を出力するように学習された学習モデルであって、前記ターゲット物理量以外の少なくとも１つの物理量を入力とし、前記ターゲット物理量及び前記少なくとも１つの物理量以外の物理量を中間物理量として出力するように学習された第１モデルと、前記ターゲット物理量以外の少なくとも１つの物理量、及び前記第１モデルから出力される前記中間物理量を入力とし、前記ターゲット物理量を出力するように学習された第２モデルと、を含む前記学習モデルに対して、推定対象の前記ターゲット物理量以外の少なくとも１つの物理量を入力し、前記推定対象の前記ターゲット物理量を推定する推定部
として機能させるためのプログラム。
線形又は非線形に変形する部材における前記変形に応じて変化する種類が異なる少なくとも３つの物理量で、かつ時系列情報が対応付けられたターゲット物理量を含む前記少なくとも３つの物理量を複数を学習用データとして取得する取得部と、
前記取得部の取得結果に基づいて、前記ターゲット物理量以外の少なくとも１つの物理量を入力とし、前記ターゲット物理量を出力するように学習された学習モデルであって、前記ターゲット物理量以外の少なくとも１つの物理量を入力とし、前記ターゲット物理量及び前記少なくとも１つの物理量以外の物理量を中間物理量として出力するように学習された第１モデルと、前記ターゲット物理量以外の少なくとも１つの物理量、及び前記第１モデルから出力される前記中間物理量を入力とし、前記ターゲット物理量を出力するように学習された第２モデルと、を含む前記学習モデルを生成する学習モデル生成部と、
を含む学習モデル生成装置。