WO2023008190A1

WO2023008190A1 - 推定装置、推定方法、及び推定プログラム

Info

Publication number: WO2023008190A1
Application number: PCT/JP2022/027486
Authority: WO
Inventors: 創北野; 泰通若尾; 仁安井; 真広山口; 浩人杉野; 祐輔藤沢
Original assignee: 株式会社ブリヂストン
Priority date: 2021-07-26
Filing date: 2022-07-12
Publication date: 2023-02-02
Also published as: EP4378639A1

Abstract

推定装置は導電性を有し、かつ付与された圧力の変化に応じて電気特性が変化する柔軟材料を備えたロボットにおける複数の検出点の間の電気特性を検出部で検出する。推定部は、学習モデルを用いてロボットの電気特性からロボット状態を推定する。柔軟材料に圧力を与えた際の電気特性と、ロボットの柔軟材料に圧力を与えるロボット状態とを学習用データとして用いて、その電気特性を入力とし、ロボット状態を出力するように学習された学習モデルに対して、電気特性を入力し、入力した電気特性に対応するロボット状態を出力するように学習される。

Description

推定装置、推定方法、及び推定プログラム

　本開示は、推定装置、推定方法、及び推定プログラムに関する。

　従来より、ユーザの作業や動作を支援するロボットに関する技術開発が盛んに行われている。ロボットは、人や物との緩衝を考慮するため、多数の特殊な接触センサを備えて、ロボットに対する人や物の接触を検出する技術が知られている（例えば、特開２０１１－０５６６１９号公報参照）。

　また、ロボットに対する人や物の接触を検出するために、ロボットの外郭に生じる形状変化を検出することが考えられるが、形状変化を検出する側面で、変形を検出するためには、特殊な検出装置が要求される。例えば、カメラによる物体の変位と振動を測定して、変形画像を取得し、変形量を抽出する技術が知られている（例えば、国際公開２０１７０２９９０５号参照）。また、光の透過量から変形量を推定する柔軟触覚センサに関する技術も知られている（例えば、特開２０１３－１０１０９６号公報参照）。

　本開示の推定装置は、
　導電性を有し、かつ与えられた圧力の変化に応じて電気特性が変化する柔軟材料を外郭部の少なくとも一部に備えたロボット、又は把持部材、若しくは前記柔軟材料を少なくとも一部を覆って配置するかまたは覆うことが可能に配置した可動体の基体から屈曲可能な突出部における前記柔軟材料に予め定められた複数の検出点の間の電気特性を検出する検出部と、
　前記柔軟材料に圧力を与えた際の時系列の電気特性と、前記柔軟材料に圧力を与えるロボット状態を示すロボット状態情報、又は前記柔軟材料に圧力を与える物体を示す接触物体情報、若しくは前記柔軟材料に刺激を与える前記把持部材により把持対象物を把持した際の滑り状態を示す滑り状態情報、或いは、前記柔軟材料に圧力を与える付与刺激状態を示す付与刺激状態情報とを学習用データとして用いて、前記時系列の電気特性を入力とし、前記ロボット状態情報、又は前記接触物体情報、若しくは前記滑り状態情報、或いは、前記付与刺激状態情報を出力するように学習された学習モデルに対して、前記検出部で検出された時系列の電気特性を入力し、入力した時系列の電気特性に対応するロボット状態を示すロボット状態情報、又は前記柔軟材料に圧力を与えた物体を示す接触物体情報、若しくは、入力した時系列の電気特性に対応する前記把持部材により前記把持対象物を把持した際の滑り状態を示す滑り状態情報、或いは、入力した時系列の電気特性に対応する付与刺激状態を示す付与刺激状態情報を推定する
推定部と、
　を含む。

　本開示の推定方法は、
　コンピュータが
　導電性を有し、かつ与えられた圧力の変化に応じて電気特性が変化する柔軟材料を外郭部の少なくとも一部に備えたロボット、又は把持部材、若しくは前記柔軟材料を少なくとも一部を覆って配置するかまたは覆うことが可能に配置した可動体の基体から屈曲可能な突出部における前記柔軟材料に予め定められた複数の検出点の間の電気特性を検出する検出部から前記電気特性を取得し、
　前記柔軟材料に圧力を与えた際の時系列の電気特性と、前記柔軟材料に圧力を与えるロボット状態を示すロボット状態情報、又は前記柔軟材料に圧力を与える物体を示す接触物体情報、若しくは前記柔軟材料に刺激を与える前記把持部材により把持対象物を把持した際の滑り状態を示す滑り状態情報、或いは、前記柔軟材料に圧力を与える付与刺激状態を示す付与刺激状態情報とを学習用データとして用いて、前記時系列の電気特性を入力とし、前記ロボット状態情報、又は前記接触物体情報、若しくは前記滑り状態情報、或いは、前記付与刺激状態情報を出力するように学習された学習モデルに対して、前記検出部で検出された時系列の電気特性を入力し、入力した時系列の電気特性に対応するロボット状態を示すロボット状態情報、又は前記柔軟材料に圧力を与えた物体を示す接触物体情報、若しくは、入力した時系列の電気特性に対応する前記把持部材により前記把持対象物を把持した際の滑り状態を示す滑り状態情報、或いは、入力した時系列の電気特性に対応する付与刺激状態を示す付与刺激状態情報を推定する。

　本開示のプログラムは、
　コンピュータに
　導電性を有し、かつ与えられた圧力の変化に応じて電気特性が変化する柔軟材料を外郭部の少なくとも一部に備えたロボット、又は把持部材、若しくは前記柔軟材料を少なくとも一部を覆って配置するかまたは覆うことが可能に配置した可動体の基体から屈曲可能な突出部における前記柔軟材料に予め定められた複数の検出点の間の電気特性を検出する検出部から前記電気特性を取得し、
　前記柔軟材料に圧力を与えた際の時系列の電気特性と、前記柔軟材料に圧力を与えるロボット状態を示すロボット状態情報、又は前記柔軟材料に圧力を与える物体を示す接触物体情報、若しくは前記柔軟材料に刺激を与える前記把持部材により把持対象物を把持した際の滑り状態を示す滑り状態情報、或いは、前記柔軟材料に圧力を与える付与刺激状態を示す付与刺激状態情報とを学習用データとして用いて、前記時系列の電気特性を入力とし、前記ロボット状態情報、又は前記接触物体情報、若しくは前記滑り状態情報、或いは、前記付与刺激状態情報を出力するように学習された学習モデルに対して、前記検出部で検出された時系列の電気特性を入力し、入力した時系列の電気特性に対応するロボット状態を示すロボット状態情報、又は前記柔軟材料に圧力を与えた物体を示す接触物体情報、若しくは、入力した時系列の電気特性に対応する前記把持部材により前記把持対象物を把持した際の滑り状態を示す滑り状態情報、或いは、入力した時系列の電気特性に対応する付与刺激状態を示す付与刺激状態情報を推定する
　処理を実行させるための推定プログラムである。

実施形態に係るロボット状態推定装置の構成の一例を示す図である。実施形態に係るロボットに関する図である。実施形態に係るロボットの腕部に関する図である。実施形態に係るロボットの外郭部に関する図である。実施形態に係るロボットの外郭部の硬さに関する図である。実施形態に係るロボットに関する図である。実施形態に係るロボットに関する図である。実施形態に係る導電性を有する部材の検出点に関する図である。実施形態に係る導電性を有する部材に関する図である。実施形態に係る導電性を有する部材に関する図である。実施形態に係る導電性を有する部材に関する図である。実施形態に係る学習処理に関する図である。実施形態に係る学習データ収集処理の一例を示すフローチャートである。実施形態に係る学習処理部における学習処理に関する図である。実施形態に係る学習処理の流れの一例を示すフローチャートである。実施形態に係る学習処理部における学習処理に関する図である。実施形態に係るロボット状態推定装置の構成の一例を示す図である。実施形態に係る推定処理の流れの一例を示すフローチャートである。実施形態に係るロボットに関係する特性を示す図である。第２実施形態に係る状態推定装置の構成の一例を示す図である。第２実施形態に係るロボットに関する図である。第２実施形態に係るロボットに関する図である。第２実施形態に係る学習処理部における学習処理に関する図である。第２実施形態に係る手袋の一例を示す図である。第３実施形態に係るロボットの胴体部に関する図である。第３実施形態に係る学習処理部における学習処理に関する図である。第４実施形態に係るロボット制御装置の構成を示す図である。第４実施形態に係るロボットに関する図である。第４実施形態に係る学習処理に関する図である。第４実施形態に係る学習処理に関する図である。第４実施形態に係る学習データ収集処理の流れを示すフローチャートである。第４実施形態に係るロボットに関係する特性を示す概念図である。第４実施形態に係る学習処理の流れを示すフローチャートである。第４実施形態に係るロボット制御処理の流れを示すフローチャートである。手袋を装着した手を示す図である。手袋を装着した手で把持対象物を把持した状態を示す図である。推定装置の詳細な構成を示す図である。手袋を装着した手を示す図である。推定装置の詳細な構成を示す図である。実施形態に係る推定処理の流れを示すフローチャートである。実施形態に係る推定処理の流れを示すフローチャートである。

　以下、図面を参照して本開示の技術を実現する実施形態を詳細に説明する。
　なお、作用、機能が同じ働きを担う構成要素及び処理には、全図面を通して同じ符号を付与し、重複する説明を適宜省略する場合がある。また、本開示は、以下の実施形態に何ら限定されるものではなく、本開示の目的の範囲内において、適宜変更を加えて実施することができる。また、本開示では、主として非線形に変形する部材に対する物理量の推定を説明するが、線形に変形する部材に対する物理量の推定に適用可能であることは言うまでもない。

［第１実施形態］
　ところで、多数の特殊な接触センサを備えて接触を検出する側面では、接触を検出するための各部位に接触センサを備えることが要求され、センサ数が膨大となって、ロボットの大型化を招くので好ましくはない。また、多数の特殊な接触センサ自体がロボットの接触状態を阻害する虞もある。

　また、形状変化を検出する側面では、変形量を検出するためにカメラや光の透過量を検出するセンサとセンサ出力を解析する解析装置等を含むシステムは、大規模なものとなり、ロボットの大型化を招くので好ましくはない。また、変形量を検出するためにロボットの全ての部位に対して変形量を検出するセンサを配置することが要求され、好ましくはない。

　本開示は、特殊な検出装置を用いることなく、導電性を有する柔軟材料の電気特性を利用して、ロボット状態を示すロボット状態情報を推定することができる推定装置、推定方法、推定プログラム、及び学習モデル生成装置を提供する。

　本開示において「ロボット」とは、複数の部位（以下、パーツという。）が連携して構成され、少なくとも一部のパーツが可動可能な構造体を含む概念である。「ロボット状態」とは、能動形態を示す状態（以下、能動形態状態という。）及び受動形態を示す状態（以下、受動形態状態という。）を含む概念である。能動形態状態は、構造体を構成する少なくとも一部のパーツによって示されるロボットの姿勢、立ち振る舞い、及び動き等の能動形態を示す状態を含む概念である。受動形態状態は、少なくとも一部のパーツに対して圧力等のエネルギが与えられることによって示される受動形態を示す状態を含む概念である。能動形態を示す状態の一例には、１又は複数パーツの組み合わせによって示される静的な姿勢を示す姿勢状態、及び動的な動きを示す挙動状態が挙げられる。受動形態を示す状態の一例には、人体及び物体等の人物がロボットに接触される接触状態を含む、人体及び物体等の人物により圧力等のエネルギがロボットに与えられる付勢状態が挙げられる。

　また、本開示において人物とは、ロボットに外部から圧力を与える外部の人体及び物体の少なくとも一方を含む概念である。例えば、接触状態は、ロボット外部の人体がロボットに接触される状態、外部の物体がロボットに接触される状態、並びに、外部の人体及び物体がロボットに接触される状態を含む。なお、以下の説明では、人体及び物体の少なくとも一方を区別することなく、ヒトとモノとを含む概念として人物と総称して説明する。具体的には、人体及び物体のそれぞれの単体、及び人体と物体の組み合わせを人物と称する。

　本開示において「柔軟材料」とは、外部力が与えられることによって少なくとも一部が撓み等のように変形可能な材料を含む概念であり、ゴム材料等の柔らかい弾性体、繊維状及び網目状の少なくとも一方の構造体、及び内部に微小な空気泡が複数散在する構造体を含む。繊維状及び網目状の少なくとも一方の構造体は、繊維状及び網目状の少なくとも一方を骨格として有する構造体でもよい。外部力の一例には圧力が挙げられる。繊維状及び網目状の少なくとも一方の構造体、及び内部に微小な空気泡が複数散在する構造体の一例には、ウレタン材及びゴム（発泡体）などの高分子材料が挙げられる。「導電性が付与された柔軟材料」とは、導電性を有する材料を含む概念であり、導電性を付与するために導電材を柔軟材料に付与した材料、及び柔軟材料が導電性を有する材料を含む。導電性を付与する柔軟材料はウレタン材及びゴムなどの高分子材料が好適である。また、導電性が付与された柔軟材料は、変形に応じて電気特性が変化する機能を有する。なお、変形に応じて電気特性が変化する機能を生じさせる物理量の一例には柔軟材料に与えられる圧力による刺激（以下、圧力刺激という。）を示す圧力値が挙げられる。柔軟材料の変形に応じて変化する電気特性を表す物理量の一例には、電気抵抗値が挙げられる。また、他例には、電圧値、又は電流値が挙げられる。電気抵抗値は、柔軟材料の体積抵抗値と捉えることが可能である。

　柔軟材料は、導電性を与えることで、圧力による変形に応じた電気特性が現れる。すなわち、導電性が付与された柔軟材料は、電気経路が複雑に連携し、変形に応じて電気経路が伸縮したり膨縮したりする。また、電気経路が一時的に切断される挙動、及び以前と異なる接続が生じる挙動を示す場合もある。従って、柔軟材料は、所定距離を隔てた位置（例えば電極が配置された検出点の位置）の間では、与えられた力（例えば圧力刺激）の大きさや分布に応じて異なる電気特性を有する挙動を示す。このため、柔軟材料に与えられた力（例えば圧力刺激）の大きさや分布に応じて電気特性が変化する。

　なお、導電性が付与された柔軟材料を用いるため、人体及び物体等の人物によって柔軟材料に圧力が与えられる箇所の全てに電極等の検出点を設ける必要はない。柔軟材料の圧力が与えられる箇所を挟む任意の少なくとも２箇所に電極等の検出点が設けられていればよい。

　本開示の推定装置は、学習済みの学習モデルを用いて、ロボットに備えられた導電性を有する柔軟材料における電気特性からロボット状態を推定する。学習モデルは、導電性を有する柔軟材料に圧力を与えた際の時系列の電気特性と、その柔軟材料に圧力を与えるロボット状態を示すロボット状態情報とを学習用データとして用いる。学習モデルは、時系列の電気特性を入力とし、その時系列の電気特性に対応するロボット状態を示すロボット状態情報を出力するように学習される。

　以下の説明では、導電性が付与された柔軟材料の一例として、ウレタン材の全部または一部に導電材料を配合及び浸潤（含浸ともいう）等により形成させた部材を、「導電性ウレタン」と称して説明する。導電性ウレタンは、導電材料を配合と浸潤（含浸）との何れかの方法で形成可能であり、導電材料の配合又は浸潤（含浸）で形成可能で、また導電材料の配合と浸潤（含浸）とを組み合わせて形成可能である。例えば、浸潤（含浸）による導電性ウレタンが、配合による導電性ウレタンより導電性が高い場合には、浸潤（含浸）により導電性ウレタンを形成することが好ましい。

　また、本実施形態では、導電性ウレタンが、ロボットの少なくとも一部の外郭部に配置された場合を説明する。また、導電性ウレタンを変形させる物理量としてはロボット、すなわち柔軟材料に与えられる圧力刺激を示す値（圧力値）を適用する。なお、圧力刺激に応じて変化する物理量としては、導電性ウレタンの電気抵抗値を適用した場合を説明する。

　図１に、本開示の推定装置としてのロボット状態推定装置１の構成の一例を示す。

　ロボット状態推定装置１における推定処理は、学習済みの学習モデル５１を用いて、ロボット２に配置された導電性ウレタン２２における電気特性から、未知のロボット状態として、ロボット２における能動形態状態、及び受動形態状態を推定し、出力する。これにより、特殊な装置や大型の装置を用いたりロボット２の外郭の変形を直接計測することなく、ロボット状態を示すロボット状態情報を推定することが可能となる。学習モデル５１は、ロボット状態（例えば、能動形態状態又は受動形態状態を示す状態値）をラベルとし、当該ロボットの状態における導電性ウレタンの電気特性（すなわち、ロボット２に配置された導電性ウレタンの電気抵抗値）を入力として学習される。学習モデル５１の学習については後述する。

　ここで、ロボット２の構造を説明する。図２に人型に模した人型ロボット２００のロボット構造の一例を示す。
　図２に示す人型ロボット２００は、頭部２１０、胴体部２２０、腕部２３０（上腕２３２、前腕２３４、手２３６）、脚部２４０（大腿２４２、下腿２４４、足２４６）の各々のパーツが骨格２１によって連結される。人型ロボット２００は、骨格２１の周囲に導電性ウレタン２２を配置することで、人型ロボット２００の外側である外郭に導電性ウレタン２２が配置される。人型ロボット２００に配置された導電性ウレタン２２は、電極等の検出点７５を介して電気特性検出部７６（図８）に接続される。

　例えば、図３に上腕２３２の概略構造の一例を断面図で示すように、上腕２３２の骨格２１の周囲に、人工筋肉などの構造物を含む内部層２５が配置され、内部層２５の周囲に表皮としても機能する外郭部２７が配置される。なお、骨格２１の周囲に表皮として機能する外郭部２７を配置してもよい。

　導電性ウレタン２２は、骨格２１の周囲に配置する材料、すなわち外郭部２７の少なくとも一部に配置すればよく、内部に配置してもよいし外部に配置してもよい（図４）。具体的な一例には、外郭部２７のＡ－Ａ断面を外郭断面２７－１として示すように、外郭部２７の内部を全て導電性ウレタン２２で構成しても良い。また、外郭断面２７－２に示すように、外郭部２７の外側（表面側）の一部に導電性ウレタン２２を形成しても良く、外郭断面２７－３に示すように、外郭部２７の内側（骨格側）に導電性ウレタン２２を形成しても良い。さらに、外郭断面２７－４に示すように、外郭部２７の内部の一部に導電性ウレタン２２を形成しても良い。また、外郭断面２７－５に示すように、外郭部２７を構成する柔軟性を有する材料２７Ａの外側に導電性ウレタン２２を配置しても良く、外郭断面２７－６に示すように、外郭部２７の内側（骨格側）の外部に導電性ウレタン２２を配置しても良い。導電性ウレタン２２を外郭部２７を構成する材料２７Ａの外部に配置する場合、導電性ウレタン２２と外郭部２７を構成する材料とを積層するのみでもよく、導電性ウレタン２２と外郭部２７を構成する材料とを接着等により一体化してもよい。なお、導電性ウレタン２２を外郭部２７を構成する材料の外部に配置する場合であっても、導電性ウレタン２２が導電性を有するウレタン部材であるため、外郭部２７を構成する材料の柔軟性は阻害されない。

　また、導電性ウレタン２２は、所定の硬さの柔軟性を有するように形成してもよく、例えば、図５に示すように、深さに応じて硬さが変化する柔軟性を有するように形成してもよい。図５はロボットの外郭部の硬さに関する概念図であり、紙面左側に導電性ウレタン２２の構造に関する概念図を示し、紙面右側に導電性ウレタン２２の深さと硬さの関係の概念図を示す。図５に示す例では、外郭断面２７－７として示す外郭部２７を導電性ウレタン２２で構成する場合、外郭部２７の外側（表面側）から内側（骨格側）に向かうに従って、すなわち深さが深くなるのに従って徐々に硬さが硬くなるように導電性ウレタン２２を形成することが可能である。また、外郭断面２７－８に示すように、硬さが異なる複数の導電性ウレタン２２（硬さ：２２Ｘ＜２２Ｙ＜２２Ｚ）を配置しても良い。導電性ウレタン２２を含む外郭部２７の硬さ（柔軟性）を深さに応じて変化するように構成することで、人体の表皮部分に近い触感を提供することが可能である。

　以降では、説明を簡単にするため、本開示のロボットの一例として、図６に示す簡易型のロボットを含む自立型ロボットシステムをロボット２として適用した場合を説明する。ロボット２は、骨格２１の周囲にロボット２の外側である外郭として導電性ウレタン２２を配置して外郭部を形成する。

　図６に示すように、ロボット２は、表示部２１１及び首部２１２を含んで頭部２１０を構成し、上部胴体２２２、及び下部胴体２２４を含んで胴体部２２０を構成する。また、ロボット２は、肩部２３１、アーム部２３３、及び手２３６を含んで腕部２３０を構成し、図示しない移動機構を備えたベース部２４１を含んで脚部２４０を構成する。頭部２１０、胴体部２２０、腕部２３０及び脚部２４０は、骨格２１によって連結される。

　図６に示すロボット２では、胴体部２２０（上部胴体２２２、及び下部胴体２２４）、腕部２３０（肩部２３１、アーム部２３３、及び手２３６）、脚部２４０（ベース部２４１）の各々の外側に導電性ウレタン２２を含む外郭部２７が配置される。なお、外郭部２７は、１枚のシートで構成して配置してもよく、各々のパーツ毎に配置してもよい。各々のパーツ毎に導電性ウレタン２２を含む外郭部２７を配置する場合、外郭部２７の一部が重複するように配置してもよい。ロボット２に配置された導電性ウレタン２２は、電極等の検出点７５を介して電気特性検出部７６（図８）に接続される。

　腕部２３０は、肩部２３１を支点として、アーム部２３３が屈曲可能に形成される。腕部２３０でアーム部２３３が屈曲可能に形成する構成には、線形又は非線形に変形する弾性体を含む部材が適用可能であり、付与された物理量（例えば圧力や流体の供給）により所定方向に収縮力を発生する弾性収縮体が一例として挙げられる。弾性収縮体の一例には、公知技術のエアバッグタイプの部材を適用可能である（例えば、特公昭52-40378号参照）。エアバッグタイプの弾性収縮体（例えば、ラバーアクチュエータ）は、ゴム部材等の柔らかい弾性体で構成される管状体の外周を、有機又は無機高張力繊維、例えば芳香族ポリアミド繊維の編組み補強構造により被覆した本体を有し、両端開口を閉塞部材によって
封止したものである。ラバーアクチュエータは、その閉塞部材に設けられた接続口を介して内部空洞に加圧流体が供給されることによって膨径変形し、軸線方向に沿って収縮力が発生するようになっている。このラバーアクチュエータは、膨径変形によって、ラバーアクチュエータの長さが変化する。ただし、ラバーアクチュエータを適用対象とするのはあくまで一例に過ぎず、本開示の推定装置はラバーアクチュエータ以外の部材にも適用可能である。

　ロボット２は、図示しない弾性収縮体の駆動によって、図７に示すように、アーム部２３３が屈曲する。アーム部２３３の作動によって、人体の腕部を模擬することが可能となる。

　また、ロボット２は、ベース部２４１に図示しない移動機構を備えることで、移動可能とされる。ベース部２４１には、ロボット２の制御を行う制御装置２５０が備えられている（図１７）。制御装置２５０は、ロボット状態推定装置１として動作する機能部を含む。

　また、ロボット２は、操作部１１５、表示部２１１、マイク１１７、スピーカ１１８を備えることで（図１７）、ユーザからの指示やユーザの状態、及びユーザへの応答等の情報を取得したり提供することが可能である。

　なお、ロボット２は、ベース部２４１を含む脚部２４０以外の部位において、骨格２１の連携による各パーツを移動するための駆動部１１９（図１７）を備えている。駆動部１１９（図１７）の駆動によって、ロボット２は、パーツ毎の移動、或いは複数のパーツが連携した移動によって、各種の姿勢を維持したり、各種の挙動を実行することが可能となる。よって、ロボット２は、自立型ロボットシステムとして動作する。

　ところで、ロボット状態推定装置１は、ロボット状態を推定するために、ロボット２に配置された導電性ウレタン２２における電気特性を検出する。

　図８に示すように、距離を隔てて配置された複数（図８では２個）の検出点７５からの信号によって、導電性ウレタン２２の電気特性（すなわち、電気抵抗値である体積抵抗値）を検出することが可能である。図８は、外郭部２７の一部として配置された導電性ウレタン２２を平面展開した場合を例示した。また、図８では、導電性ウレタン２２上の側辺部分に検出点７５を偏らせて、導電性ウレタン２２上で距離を隔てて対角位置に配置された複数の検出点７５からの信号により電気抵抗値を検出する検出セット＃１が示されている。なお、複数の検出点７５の配置は、図８に示す位置に限定されるものではなく、導電性ウレタン２２の電気特性を検出可能な位置であれば何れの位置でもよい。例えば、複数の検出点７５を離間して配置すればよく、側辺部分への配置に限定されず、中央部であってもよく、側辺部分と中央部分との組み合わせであってもよい。また、導電性ウレタン２２の電気特性は、電気特性（すなわち、電気抵抗値である体積抵抗値）の検出する電気特性検出部７６を検出点７５に接続し、その出力を用いればよい。

　外郭部２７に導電性ウレタン２２を備えて構成されるロボット２において検出される電気抵抗値は、ロボット２の外郭部２７に圧力刺激が与えられる等の導電性ウレタン２２の変形によって、その変形の前後で変化する。よって、時系列の電気抵抗値の検出、すなわち、ロボット２に圧力刺激が与えられていない状態からの電気抵抗値の変化を検出（例えば予め定めた閾値を超えた電気抵抗値を検出）することで、ロボット２に対する人物の付勢を検出することが可能となる。具体的には、ロボット２に対する人物の付勢を示す付勢状態は、ロボット２に対する人物の接触であっても圧力刺激を伴うため、接触状態を含む。よって、ロボット２に導電性ウレタン２２を配置することで、ロボット２に対する人物
の接触を含む付勢を検出可能となる。また、ロボット２に与えられた圧力刺激の位置や分布、及び大きさの何れか１つが変化しても電気抵抗値は変化する。従って、時系列に変化した電気抵抗値から、ロボット２に対する人物の接触位置を含む付勢状態を検出することも不可能ではない。

　ロボット２に形成される導電性ウレタン２２を含む外郭部２７は、ロボット２の外側を一体構造として導電性ウレタン２２を含む外郭部２７を形成してもよく、パーツ毎に独立した導電性ウレタン２２を含む外郭部２７を形成してもよい。

　なお、１つの導電性ウレタン２２の電気特性の検出精度を向上するため、図８に示す検出点（２個）より多くの検出点を用いてもよい。

　一例としては、各々検出点が配置された複数の導電性ウレタン片からなる列を１列または複数列並べて導電性ウレタン２２を形成し、複数の導電性ウレタン片毎に電気特性を検出してもよい。例えば、導電性ウレタン片２３（図９）を、配列して導電性ウレタン２２を構成してもよい（図１０、図１１）。図９に示す例は、距離を隔てて対角位置に配置された検出点７５Ａからの信号により電気抵抗値を検出する第１の検出セット＃１と、他の対角位置に配列された検出点７５Ｂからの信号により電気抵抗値を検出する第２の検出セット＃２とを示している。また、図１０に示す例では、導電性ウレタン片２３（図９）を、外郭部２７の長手方向に配列（４ｘ１）して導電性ウレタン２２を構成し、順に、第１の検出セット＃１から第８の検出セット＃８を構成することを示している。さらに、図１１に示す例では、導電性ウレタン片２３（図９）において各々第１の検出セット＃１を採用し、外郭部２７の長手方向及び幅方向に配列（４ｘ２）して導電性ウレタン２２を構成し、第１の検出セット＃１から第８の検出セット＃８を構成することを示している。

　また、他例としては、導電性ウレタン２２上における検出範囲を分割して分割した検出範囲毎に検出点を設けて検出範囲毎に電気特性を検出してもよい。例えば、図１０及び図１１に示す導電性ウレタン片２３の大きさに相当する領域を検出範囲として導電性ウレタン２２に設定し、設定した検出範囲毎に検出点を配置して、検出範囲毎に電気特性を検出すればよい。

　図１に示すように、ロボット状態推定装置１は、推定部５を備えている。推定部５には、導電性ウレタン２２における電気抵抗の大きさ（電気抵抗値）を表す時系列の電気特性である入力データ４が入力される。具体的には、導電性ウレタン２２の検出点７５に接続された電気特性検出部７６から出力される電気特性（すなわち、電気抵抗値である体積抵抗値）が入力される。入力データ４は、ロボット２のロボット状態３に対応する。また、推定部５は、推定結果としてロボット状態３を示す物理量（ロボット状態値）である出力を表す出力データ６を出力する。なお、推定部５は、学習済みの学習モデル５１を含む。

　学習モデル５１は、ロボット状態３に応じた圧力刺激により変化する導電性ウレタン２２の電気抵抗（入力データ４）から、ロボット状態、すなわちロボット２における能動形態状態又は受動形態状態（出力データ６）を導出する学習を済ませたモデルである。学習モデル５１は、例えば、学習済みのニューラルネットワークを規定するモデルであり、ニューラルネットワークを構成するノード（ニューロン）同士の間の結合の重み（強度）の情報の集合として表現される。

　学習モデル５１は、学習処理部５２（図１２）の学習処理により生成される。学習処理部５２は、ロボット状態３により生じる圧力刺激で変化する導電性ウレタン２２における電気特性（入力データ４）を用いて学習処理を行う。すなわち、ロボット状態３をラベルとして導電性ウレタン２２における電気抵抗を時系列に測定した大量のデータを学習データとする。具体的には、学習データは、電気抵抗値（入力データ４）を含んだ入力データと、その入力データに対応するロボット状態３を示す情報（出力データ６）と、のセットを大量に含む。ここでは、導電性ウレタン２２の電気抵抗値（入力データ４）の各々に測定時刻を示す情報を付与することで時系列情報が対応付けられる。この場合、ロボット状態３として定まる期間について、導電性ウレタン２２における時系列な電気抵抗値のセットに測定時刻を示す情報を付与して時系列情報を対応付けてもよい。

　次に、学習処理部５２について説明する。
　学習処理部５２が行う学習処理では、上述した導電性ウレタン２２が配置されたロボット２の外郭部２７が検出部として適用され、ロボット状態３、及び導電性ウレタン２２による電気抵抗値（入力データ４）が学習データとして用いられる。

　例えば、能動形態状態を示すロボット状態に対するデータを学習データとする。具体的には、ロボット２の少なくとも一部のパーツによる所定の姿勢や動き等の挙動となるように駆動部１１９の駆動制御を行い、そのときの電気抵抗値を検出して、ロボット状態（ロボット状態値）と対応付けて学習データとする。ロボット２は、自己の姿勢、立ち振る舞い、及び動き等によって外郭部２７が変形して、導電性ウレタン２２の電気抵抗値が変化するので、時系列な電気抵抗値を検出して、ロボット状態（ロボット状態値）と対応付けて学習データとすることが可能となる。能動形態状態には、１又は複数パーツの組み合わせによって示される静的な姿勢を示す姿勢状態、及び動的な動きを示す挙動状態が適用される。

　また、受動形態状態を示すロボット状態に対するデータを学習データとする。具体的には、少なくとも一部のパーツに対して圧力等のエネルギが与えられる所定のロボット状態となるように、ユーザＯＰに、ロボット２に対して所定姿勢で接触したり動きを伴って接触する等を行うことを指示し、そのときの電気抵抗値を検出して、ロボット状態と対応付けて学習データとする。ロボット２は、人物から少なくとも一部のパーツに対して圧力等のエネルギが与えられることによって外郭部２７が変形して、導電性ウレタン２２の電気抵抗値が変化するので、時系列な電気抵抗値を検出して、ロボット状態（ロボット状態値）と対応付けて学習データとすることが可能となる。受動形態状態には、人物がロボットに接触される接触状態を含み、人物により圧力等のエネルギがロボットに与えられる付勢状態が適用される。

　学習処理部５２は、図示しないＣＰＵを含むコンピュータを含んで構成可能であり、学習データ収集処理及び学習処理を実行する。図１３に、図示しないＣＰＵが実行する学習データ収集処理の一例を示す。学習処理部５２は、ステップＳ１００で、上述したロボット状態を得るための圧力刺激の付与に関する処理を行い、ステップＳ１０２で、ロボット状態に応じた圧力刺激により変化する導電性ウレタン２２の電気抵抗値を時系列に取得する。次のステップＳ１０４では、取得した時系列の電気抵抗値にロボット状態３を示すロボット状態値をラベルとして付与して、記憶する。学習処理部５２は、これらロボット状態値、及び導電性ウレタン２２の電気抵抗値のセットが予め定めた所定数、又は予め定めた所定時間に達するまで（ステップＳ１０６で、肯定判断されるまで否定判断し）、上記処理を繰り返す。これにより、学習処理部５２は、ロボット状態３毎に、導電性ウレタン２２における電気抵抗値を時系列に取得し、記憶することが可能となり、記憶されたロボット状態毎の時系列な導電性ウレタン２２の電気抵抗値のセットが学習データとなる。

　ところで、ロボット状態のうち、ロボット２に人物が接触等の圧力刺激を伴って付勢した場合、人物が外郭部２７に接触する付勢状態から付勢力（押圧力）が大きくなるのに従って、電気特性（電気抵抗値）が大きく変化する。従って、時系列の電気特性が接触検出用に予め定めた閾値を超えることを検出することで、少なくとも人物が外郭部２７に接触した付勢状態を検出可能である。よって、少なくとも人物が外郭部２７に接触した付勢状態を検出するのであれば、接触した付勢状態を特定する付勢力（押圧力）に対応する時系列の電気特性を学習データとすればよい。

　図１９に、ロボット２のアーム部２３３における電気特性の一例を示す。図１９は、ロボット２のアーム部２３３を、異なる付勢力（ピーク値Ｐ１～Ｐ８の押圧力）によってユーザの手により押圧した際の導電性ウレタン２２の電気特性を示す。また、ピーク値Ｐ１～Ｐ７は、人物が接触に至らないロボット状態とし、ピーク値Ｐ８は、人物が接触したときのロボット状態とする。

　図１９に示すように、導電性ウレタン２２の時系列の電気特性（各ピーク値Ｐ１～Ｐ８を含む前後の電気特性）の各々が、ユーザの付勢力（押圧力）に応じてアーム部２３３に接触し、付勢された際のロボット状態における特徴パターンである。すなわち、アーム部２３３がユーザの手により押圧されると、電気抵抗値が急激に上昇し、押圧が解除（ユーザの手が離間）されると電気抵抗値が徐々に低下するパターンが、特徴パターンとして現れている。図１９に示す例では、ピーク値Ｐ１～Ｐ７に比べて、ピーク値Ｐ８が大きい電気抵抗値となっている。このため、ピーク値Ｐ１～Ｐ７を超える電気抵抗値を閾値ｔｈに定めることで、人物が外郭部２７に接触した付勢状態を検出可能である。よって、学習処理部５２は、接触した付勢状態を特定する付勢力（押圧力）に対応する時系列の電気特性を学習データとして学習する。

　一方、接触検出に限定しないロボット状態は、ロボット２における各パーツの位置、又は複数のパーツの相対的な位置関係、各パーツにおける圧力刺激の分布、大きさ、及び頻度等の各物理量により同定可能である。従って、導電性ウレタン２２の時系列の電気特性には、ロボット状態を示す時系列の物理量の特徴が含まれる。本実施形態では、導電性ウレタン２２を用いることで、これらの物理量が反映された電気特性（体積抵抗）を時系列に検出することが可能である。

　従って、ロボット状態に応じてロボット２における圧力刺激が変化し、その圧力刺激の変化に対応する電気特性を時系列に取得することで、ロボット状態に時系列の電気特性を対応付けて記憶することが可能となる。当該時系列の電気特性およびロボット状態を示すロボット状態値とのセットを学習データとすることが可能となる。

　次に、上述した学習データの一例を表で示す。表１は、姿勢状態及び挙動状態を含む能動形態状態に関する学習データとして、時系列の電気抵抗値データ（ｒ）と能動形態状態値とを対応付けたデータの一例である。表２は、接触状態及び付勢状態を含む受動形態状態に関する学習データとして、時系列の電気抵抗値データ（Ｒ）と受動形態状態値とを対応付けたデータの一例である。表３は、ロボット２における各パーツが連携することを考慮して、各パーツで検出された時系列の電気抵抗値を示す特性データ（Ｊ）のセットと、ロボット状態値とを対応付けたデータの一例である。このセットに含まれる何れかの特性データ（Ｊ）にロボット状態の特徴、すなわち、特徴パターンが含まれる。各特性データ（Ｊ）は、全て学習データとして用いる。例えば、ロボット２で検出された複数の特性データ（Ｊ）とロボット状態値（表３ではロボットが人物を「両腕で抱える」動作を示す値）とを学習データとして用いる。

　次に、学習処理部５２における学習処理ついて説明する。図１４は、学習処理において学習処理部５２の図示しないＣＰＵにおける機能を示す図である。
　学習処理部５２の図示しないＣＰＵは、生成器５４及び演算器５６の機能部を含む。生成器５４は、入力である時系列に取得された電気抵抗値の前後関係を考慮して出力を生成する機能を有する。

　また、学習処理部５２は、学習用データとして、上述した入力である入力データ４（電気抵抗値）と、入力データ４（電気抵抗値）に対応するロボット状態３を表す出力である出力データ６とのセットを多数保持している。

　生成器５４は、入力層５４０、中間層５４２、および出力層５４４を含んで、公知のニューラルネットワーク（ＮＮ：Neural Network）を構成する。ニューラルネットワーク自体は公知の技術であるため詳細な説明は省略するが、中間層５４２は、ノード間結合およびフィードバック結合を有するノード群（ニューロン群）を多数含む。その中間層５４２には、入力層５４０からのデータが入力され、中間層５４２の演算結果のデータは、出力層５４４へ出力される。

　生成器５４は、入力された入力データ４（電気抵抗）からロボット状態を表す生成出力データ６Ａを生成するニューラルネットワークである。生成出力データ６Ａは、入力データ４（電気抵抗）からロボット状態を推定したデータである。生成器５４は、時系列に入力された入力データ４（電気抵抗）から、ロボット状態に近い状態を示す生成出力データを生成する。生成器５４は、多数の入力データ４（電気抵抗）を用いて学習することで、ロボット２すなわち導電性ウレタン２２に圧力刺激が与えられるロボット状態に近い生成出力データ６Ａを生成できるようになる。他の側面では、時系列に入力された入力データ４である電気特性をパターンとして捉え、当該パターンを学習することで、ロボット２すなわち導電性ウレタン２２に圧力刺激が与えられるロボット状態に近い生成出力データ６Ａを生成できるようになる。

　演算器５６は、生成出力データ６Ａと、学習データの出力データ６とを比較し、その比較結果の誤差を演算する演算器である。学習処理部５２は、生成出力データ６Ａ、および学習データの出力データ６を演算器５６に入力する。これに応じて、演算器５６は、生成出力データ６Ａと、学習データの出力データ６との誤差を演算し、その演算結果を示す信号を出力する。

　学習処理部５２は、演算器５６で演算された誤差に基づいて、ノード間の結合の重みパラメータをチューニングする、生成器５４の学習を行う。具体的には、生成器５４における入力層５４０と中間層５４２とのノード間の結合の重みパラメータ、中間層５４２内のノード間の結合の重みパラメータ、および中間層５４２と出力層５４４とのノード間の結合の重みパラメータの各々を例えば勾配降下法や誤差逆伝搬法等の手法を用いて、生成器５４にフィードバックする。すなわち、学習データの出力データ６を目標として、生成出力データ６Ａと学習データの出力データ６との誤差を最小化するように全てのノード間の結合を最適化する。

　学習モデル５１は、学習処理部５２の学習処理により生成される。学習モデル５１は、学習処理部５２による学習結果のノード間の結合の重みパラメータ（重み又は強度）の情報の集合として表現される。

　図１５に学習処理の流れの一例を示す。学習処理部５２は、ステップＳ１１０で、時系列に測定した結果の学習データである、ロボット状態を示す情報をラベルとした入力データ４（電気抵抗）を取得する。学習処理部５２は、ステップＳ１１２で、時系列に測定した結果の学習データを用いて学習モデル５１を生成する。すなわち、上記のようにして多数の学習データを用いて学習した学習結果のノード間の結合の重みパラメータ（重み又は強度）の情報の集合を得る。そして、ステップＳ１１４で、学習結果のノード間の結合の重みパラメータ（重み又は強度）の情報の集合として表現されるデータを学習モデル５１として記憶する。

　なお、生成器５４は、時系列入力の前後関係を考慮して出力を生成する機能を有する再帰型ニューラルネットワークを用いてもよく、他の手法を用いてもよい。

　そして、上記ロボット状態推定装置１では、以上に例示した手法により生成した学習済みの生成器５４（すなわち、学習結果のノード間の結合の重みパラメータの情報の集合として表現されるデータ）を学習モデル５１として用いる。十分に学習した学習モデル５１を用いれば、ロボット２、すなわち外郭部２７に配置された導電性ウレタン２２における時系列の電気抵抗値からロボット状態を同定することも不可能ではない。

　なお、学習処理部５２による処理は、本開示の学習モデル生成装置の処理の一例である。また、ロボット状態推定装置１は、本開示の推定部および推定装置の一例である。ロボット状態３を示す情報である出力データ６は、本開示のロボット状態情報の一例である。

　ところで、上述したように、導電性ウレタン２２は、上述したように電気経路が複雑に連携し、変形に応じた電気経路の伸縮、膨縮、一時的な切断、及び新たな接続が生じる等の挙動を示し、結果的に、与えられた力（例えば圧力刺激）に応じて異なる電気特性を有する挙動を示す。このことは、導電性ウレタン２２を、導電性ウレタン２２の変形に関するデータを貯留するリザーバとして扱うことが可能である。すなわち、ロボット状態推定装置１は、物理的なリザーバコンピューティング（ＰＲＣ：Physical Reservoir Computing）と呼ばれるネットワークモデル（以下、ＰＲＣＮという。）に、導電性ウレタン２２を適用することが可能である。ＰＲＣおよびＰＲＣＮ自体は公知の技術であるため、詳細な説明を省略するが、すなわち、ＰＲＣ、及びＰＲＣＮは、導電性ウレタン２２の変形に関する情報の推定に好適に適用可能である。なお、リザーバは、リザバ及びリザーバーと称する場合がある。

　図１６に、導電性ウレタン２２を含むロボット２を、導電性ウレタン２２を含むロボット２の変形に関するデータを貯留するリザーバとして扱って学習する学習処理部５２の一例を示す。導電性ウレタン２２は、多様な圧力刺激の各々に応じた電気特性（電気抵抗値）となり、電気抵抗値を入力する入力層として機能し、また、導電性ウレタン２２の変形に関するデータを貯留するリザーバ層として機能する。導電性ウレタン２２は、ロボット状態３により与えられた圧力刺激に応じて異なる電気特性（入力データ４）を出力するので、推定層で、導電性ウレタン２２の電気抵抗値から与えられた圧力刺激３を推定することが可能である。従って、学習処理では、推定層を学習すればよい。

　上述のロボット状態推定装置１は、例えば、コンピュータに上述の各機能を表すプログラムを実行させることにより実現可能である。

　図１７に、ロボット状態推定装置１の各種機能を実現する処理を実行する実行装置としてコンピュータを含んで構成した制御装置２５０の一例を示す。

　ロボット状態推定装置１として機能する制御装置２５０は、図１７に示すコンピュータ本体１００を備えている。コンピュータ本体１００は、ＣＰＵ１０２、揮発性メモリ等のＲＡＭ１０４、ＲＯＭ１０６、ハードディスク装置（ＨＤＤ）等の補助記憶装置１０８、及び入出力インターフェース（Ｉ／Ｏ）１１０を備えている。これらのＣＰＵ１０２、ＲＡＭ１０４、ＲＯＭ１０６、補助記憶装置１０８、及び入出力Ｉ／Ｏ１１０は、相互にデータ及びコマンドを授受可能にバス１１２を介して接続された構成である。また、入出力Ｉ／Ｏ１１０には、外部装置と通信するための通信部１１４が接続されている。通信部１１４は、導電性ウレタン２２を含むロボット２との間で、入力データ４（電気抵抗）を取得する機能する。すなわち、通信部１１４は、検出部である、ロボット２に配置された導電性ウレタン２２における検出点７５に接続された電気特性検出部７６から入力データ４（電気抵抗）を取得することが可能である。

　また、入出力Ｉ／Ｏ１１０には、キーボード等の操作部１１５、ディスプレイ等の表示部２１１、音声入力のためのマイク１１７、音声出力のためのスピーカ１１８、及び駆動部１１９が接続されている。表示部２１１は、ロボット２の頭部２１０に配置される。また、操作部１１５、マイク１１７、及びスピーカ１１８は、例えば、ロボット２の胴体部２２０の内部に配置される（図示省略）。駆動部１１９は、ロボット２の骨格２１の連携による各パーツを移動可能に駆動するように配置される（図示省略）。

　補助記憶装置１０８には、コンピュータ本体１００を本開示の推定装置の一例としてロボット状態推定装置１として機能させるための制御プログラム１０８Ｐが記憶される。ＣＰＵ１０２は、制御プログラム１０８Ｐを補助記憶装置１０８から読み出してＲＡＭ１０４に展開して処理を実行する。これにより、制御プログラム１０８Ｐを実行したコンピュータ本体１００は、本開示の推定装置の一例としてロボット状態推定装置１として動作する。

　なお、補助記憶装置１０８には、学習モデル５１を含む学習モデル１０８Ｍ、及び各種データを含むデータ１０８Ｄが記憶される。制御プログラム１０８Ｐは、ＣＤ－ＲＯＭ等の記録媒体により提供するようにしても良い。

　次に、コンピュータにより実現されたロボット状態推定装置１における推定処理について説明する。

　図１８に、コンピュータ本体１００において、実行される制御プログラム１０８Ｐによる推定処理の流れの一例を示す。
　図１８に示す推定処理では、コンピュータ本体１００が電源投入されると、ＣＰＵ１０２により実行される。すなわち、ＣＰＵ１０２は、制御プログラム１０８Ｐを補助記憶装置１０８から読み出し、ＲＡＭ１０４に展開して処理を実行する。

　まず、ＣＰＵ１０２は、ステップＳ２００で、補助記憶装置１０８の学習モデル１０８Ｍから学習モデル５１を読み出し、ＲＡＭ１０４に展開することで、学習モデル５１を取得する。具体的には、学習モデル５１として表現された重みパラメータによるノード間の結合となるネットワークモデル（図１４、図１６参照）を、ＲＡＭ１０４に展開する。よって、重みパラメータによるノード間の結合が実現された学習モデル５１が構築される。

　次に、ＣＰＵ１０２は、ステップＳ２０２で、導電性ウレタン２２に与えられた圧力刺激によるロボット状態を推定する対象となる未知の入力データ４（電気抵抗）を、通信部１１４を介して時系列に取得する。

　次に、ＣＰＵ１０２は、ステップＳ２０４で、ステップＳ２００で取得した学習モデル５１を用いて、ステップＳ２０２において取得した入力データ４（電気抵抗）に対応する出力データ６（未知のロボット状態）を推定する。

　そして、次のステップＳ２０６で、推定結果の出力データ６（ロボット状態）を、通信部１１４を介して出力したり、スピーカ１１８から音を発するようにデータを出力したり、表示部２１１に表示するようにデータを出力して、本処理ルーチンを終了する。

　なお、図１８に示す推定処理は、本開示の推定方法で実行される処理の一例である。

　以上説明したように、本開示によれば、導電性ウレタン２２に対して、ロボット状態３における圧力刺激に応じて変化する入力データ４（電気抵抗）から、ロボット状態を推定することが可能となる。すなわち、特殊な装置や大型の装置を用いたり柔軟部材の変形を直接計測することなく、未知のロボット状態を推定することが可能となる。

　また、ロボット状態に応じて電気特性が変化し、当該電気特性（時系列の電気抵抗）にロボット状態の特徴が反映されるので、導電性ウレタン２２において時系列に変化する電気抵抗値からロボット状態を推定可能である。すなわち、ロボット２が様々なロボット状態であっても、上述した学習モデルを用いることで、適切なロボット状態を推定できる。

　本実施形態に係るロボット状態推定装置１では、上述した学習処理によって学習された学習モデル５１を用いることによって、導電性ウレタン２２の電気特性を入力することで、電気特性に対応した様々なロボット状態を推定できることを確認した。

　なお、本実施形態では、上述したように、柔軟部材の一例として導電性ウレタンを適用した場合を説明したが、柔軟部材は導電性を有する材料であればよく、導電性ウレタンに限定されないことは勿論である。

　また、本実施形態では、上述した学習処理によって学習された学習モデル５１を用いて、導電性ウレタン２２の電気特性に対応した様々なロボット状態を推定する場合を説明した。この場合、ロボット状態として人物が外郭部２７に接触した付勢状態、例えば接触状態を検出することに注目する場合、ロボット状態推定装置１を、時系列の電気特性が接触検出用に予め定めた閾値を超えること検出する機能部分は、ロボット２の人物の接触を検出する接触検出装置として適用可能である。

［第２実施形態］
　次に、本開示の第２実施形態を説明する。第２実施形態は、第１実施形態と同様の構成のため、同一部分には同一符号を付して詳細な説明を省略する場合がある。

　本開示は、特殊な検出装置を用いることなく、導電性を有する柔軟材料の電気特性を利用して、柔軟材料に圧力を与える付与刺激状態を推定することができる推定装置、推定方法、推定プログラム、及び学習モデル生成装置を提供する。

　本開示において可動体とは、１パーツによる可動体または一部のパーツが可動可能な複数のパーツが連携して構成されるロボットを含む概念である。また、可動体は、人体の一部の部位に適用可能である。突出部は、ロボット等を構成する基体（例えば、ボデーや胴体）から突出し、かつ当該基体に対して相対的に移動可能な頭部、腕部及び脚部等のパーツや部位を含む概念である。なお、突出部は、例えば、腕部における指や指を備える手部等のように部分体を備えることが可能である。突出部には、柔軟材料が配置される。

　また、本開示において付与刺激状態とは、柔軟材料に可動体以外の外部から圧力を与える外部の人体及び物体の少なくとも一方の状態を含む概念である。つまり、付与刺激状態は、外部の人体の状態、外部の物体の状態、並びに、外部の人体及び物体の状態を含む。なお、以下の説明では、柔軟材料に可動体以外の外部から圧力を与える外部の人体及び物体の少なくとも一方を区別することなく、ヒトとモノとを含む概念として人物と総称して説明する。具体的には、人体及び物体のそれぞれの単体、及び人体と物体の組み合わせを人物と称する。例えば、付与刺激状態は、接触状態、形状状態、及び物理状態の少なくとも１状態を含む。接触状態は、柔軟材料と外部の人物とが接触される状態を含む。なお、接触状態は、柔軟材料と外部の人物との間に予め定められた部材が介在する場合を含む。例えば、接触状態は、予め定められた部材を介して柔軟材料と外部の人物との間に相対的にエネルギの授受が生じて柔軟部材が変形する状態であればよい。形状状態は、人物の表面形状、表面の質感及び表面の触感の何れかを示す状態を含む。物理状態は、人物に関する物理的な状態であり、人物からの圧力、人物の重さ、及び人物の硬さを示す状態を含む。

　なお、付与刺激状態は、可動体における能動形態を示す状態（以下、能動形態状態という。）及び受動形態を示す状態（以下、受動形態状態という。）の何れかの状態下において表れる。能動形態状態は、柔軟材料が配置された可動体によって示される可動体の立ち振る舞い、及び動き等の動的な形態を示す状態を含む概念である。受動形態状態は、可動体の姿勢等の柔軟材料に外部から圧力等のエネルギが与えられる際の静的な形態を示す状態を含む概念である。能動形態を示す状態の一例には、可動体の動きを示す挙動状態が挙げられる。受動形態を示す状態の一例には、可動体の姿勢を示す姿勢状態が挙げられる。

　本開示の推定装置は、学習済みの学習モデルを用いて、可動体に配置された導電性を有する柔軟材料における電気特性から付与刺激状態を推定する。柔軟材料は、可動体（例えば、ロボット等）の基体（例えば、胴体）と相対的に移動可能に基体から突出した突出部（例えば、頭部、手部及び脚部等の何れか）の少なくとも一部を覆うように配置される。学習モデルは、導電性を有する柔軟材料に圧力を与えた際の時系列の電気特性と、その柔軟材料に圧力を与える人物の付与刺激状態を示す付与刺激状態情報とを学習用データとして用いる。学習モデルは、時系列の電気特性を入力とし、その時系列の電気特性に対応する付与刺激状態を示す付与刺激状態情報を出力するように学習される。

　本実施形態では、可動体としてロボットを適用した場合を説明する。また、導電性を有する柔軟材料としてウレタン部材の全部または少なくとも一部に導電材料が浸潤された導電性ウレタンが、ロボットの少なくとも一部の外郭部に配置された場合を説明する。また、導電性ウレタンを変形させる物理量としてはロボット、すなわち柔軟材料に与えられる圧力刺激を示す値（圧力値）を適用する。なお、圧力刺激に応じて変化する物理量としては、導電性ウレタンの電気抵抗値を適用した場合を説明する。

　図２０に、本開示の推定装置としての状態推定装置の構成の一例を示す。本実施形態に係る状態推定装置は、上述したロボット状態推定装置１と同様の構成のため、本実施形態では、上述したロボット状態推定装置１を状態推定装置１と称する。図２０は、ロボットハンドに導電性ウレタン２２を配置した点で図１と異なる。ロボットハンドについては後述する。

　状態推定装置１における推定処理は、学習済みの学習モデル５１を用いて、ロボットに配置された導電性ウレタン２２における電気特性から、未知の人物の付与刺激状態として、ロボット外部の人物の表面形状、表面の質感及び表面の触感等の状態、並びに外部の人物の接触状態の何れかを推定し、出力する。これにより、特殊な装置や大型の装置を用いて計測することなく、ロボットに圧力を与える人物の表面形状、表面の質感及び表面の触感等の状態、並びに外部の人物の接触状態等の人物の付与刺激状態を推定することが可能となる。学習モデル５１は、付与刺激状態（例えば、付与刺激状態を示す状態値）をラベルとし、当該付与刺激状態における導電性ウレタンの電気特性（例えば、電気抵抗値）を入力として学習される。学習モデル５１の学習については後述する。

　上述したように、人型ロボット２００は、頭部２１０、胴体部２２０、腕部２３０（上腕２３２、前腕２３４、手２３６）、脚部２４０（大腿２４２、下腿２４４、足２４６）の各々のパーツが骨格２１によって連結される（図２）。人型ロボット２００は、骨格２１の周囲に導電性ウレタン２２を配置することで、人型ロボット２００の外側である外郭に導電性ウレタン２２が配置される。人型ロボット２００に配置された導電性ウレタン２２は、電極等の検出点７５を介して電気特性検出部７６（図８）に接続される。

　本実施形態では、説明を簡単にするため、本開示のロボットの一例として、図２１に示す簡易型のロボットハンドをロボットハンド２として適用した場合を説明する。図２１に示すロボットハンド２は図２に示すロボットの腕部２３０に含まれる手２３６のパーツに対応する。

　図２１に示すように、ロボットハンド２は、ベース部２３７及びベース部２３７に連結された複数（図３に示す例では、３つ）の指部２３８を含んでロボットハンドを構成する。各指部２３８は、流体供給等により屈曲可能な構成となっており（詳細は後述）、屈曲の度合いに応じた指形態を形成する。図２１では、各指部２３８の先端が所定の初期間隔で位置する指形態２３６－１、各指部２３８の先端が接近する指形態２３６－２、及び各指部２３８の先端が離間する指形態２３６－３が一例として示されている。

　図２１に示すロボットハンド２では、指部２３８の各々の外側に導電性ウレタン２２を含む外郭部２７が配置される。すなわち、ロボットハンド２の指部２３８の各々は、骨格２１を含み、骨格２１の周囲に外郭として導電性ウレタン２２を配置して外郭部２７を形成する。なお、ベース部２３７は骨格としても機能する。各指部２３８の外郭部２７は、導電性ウレタン２２を含む１枚のシートで構成して配置してもよく、少なくとも１つに導電性ウレタン２２を含む複数のシートを配置してもよい。複数シートにより外郭部２７を形成する場合、シートの一部が重複するように配置してもよい。導電性ウレタン２２は、電極等の検出点７５を介して電気特性検出部７６（図８）に接続される。

　指部２３８は、ベース部２３７を支点として、屈曲可能に形成される。指部２３８を屈曲可能に形成する構成には、線形又は非線形に変形する弾性体を含む部材が適用可能であり、付与された物理量（例えば圧力や流体の供給）により所定方向に収縮力を発生する弾性収縮体（例えば、上述したラバーアクチュエータ）が一例として挙げられる。

　ロボットハンド２は、図示しない弾性収縮体の駆動によって、図２１に指形態２３６－１～２３６－３として示すように、指部２３８が屈曲する。指部２３８の作動（屈曲）によって、人物を把持したり、把持を解除する人体の手を模擬することが可能となる。図２１に示す例は、指形態２３６－１が初期形態、指形態２３６－２が把持形態、そして指形態２３６－３が把持を解除する開放形態の一例である。

　また、ロボットハンド２は、ベース部２３７に、ロボットハンド２の制御を行う制御装置２５０が備えられている（図１７）。制御装置２５０は、状態推定装置１として動作する機能部を含む。

　なお、ロボットハンド２は、パーツである各指部２３８を、流体供給等によって屈曲するための駆動部１１９（図１７）を備えている。駆動部１１９（図１７）の駆動によって、各指部２３８が屈曲し、各種の指形態を形成することが可能となる。よって、ロボットハンド２を備えたロボットは、自立型ロボットシステムとして動作する。

　本実施形態では、ロボットハンド２として、ベース部２３７に連結された３つの指部２３８によりロボットハンドを構成する一例を説明するが、指部２３８は３つに限定されるものではなく、２つであってもよく、４つ以上であってもよい。また、各指部２３８は、同一形状であることに限定されない。例えば、人体の指を模して異なる形状に形成してもよいことは勿論である。

　また、本実施形態では、各指部２３８が骨格２１の周囲に導電性ウレタン２２を配置して外郭部２７を形成するロボットハンド２を説明するが（図２１）、ロボットハンド２の構成は各指部２３８の周囲に導電性ウレタン２２を配置ことに限定されない。例えば、図２２にロボットハンド２Ａとして示すように、ベース部２３７に連結され、骨格２１を備えた複数の指部２３８Ａの周囲に導電性ウレタン２２を配置して手２３６の外郭部２７を形成してもよい。また、ロボットハンド２は、複数の指部２３８を備えることに限定されない。例えば、図２２にロボットハンド２Ｂとして示すように、骨格２１を備えた指部２３８Ｂからなる手の周囲に導電性ウレタン２２を配置して手２３６の外郭部２７を形成してもよい。ロボットハンド２Ｂでは、握った状態の手を模擬することが可能となる。一方、ロボットハンド２は、曲面を備えることに限定されない。例えば、図２２にロボットハンド２Ｃとして示すように、骨格２１を備えた指部２３８Ｂからなる平坦な手の周囲に導電性ウレタン２２を配置して手２３６の外郭部２７を形成してもよい。ロボットハンド２Ｃでは、掌や甲を模擬することが可能となる。

　状態推定装置１は、付与刺激状態を推定するために、ロボットハンド２に配置された導電性ウレタン２２における電気特性を検出する（図８参照）。

　外郭部２７に導電性ウレタン２２を備えて構成されるロボットハンド２において検出される電気抵抗値は、ロボットハンド２の外郭部２７に圧力刺激が与えられる等の導電性ウレタン２２の変形によって、その変形の前後で変化する。よって、時系列の電気抵抗値の検出、すなわち、ロボットハンド２に圧力刺激が与えられていない状態からの電気抵抗値の変化を検出（例えば予め定めた閾値を超えた電気抵抗値を検出）することで、ロボットハンド２に圧力を与える人物の付与刺激状態を検出することが可能となる。具体的には、ロボットハンド２に対する人物の付与刺激状態は、ロボットハンド２に対する人物の接触であっても圧力刺激を伴うため、接触状態を含む。よって、ロボットハンド２に導電性ウレタン２２を配置することで、ロボットハンド２に対する人物の接触を含む付与刺激状態を検出可能となる。また、ロボットハンド２に与えられた圧力刺激の位置や分布、及び大きさの何れか１つが変化しても電気抵抗値は変化する。従って、時系列に変化した電気抵抗値から、ロボットハンド２に対する人物の接触位置を含む付与刺激状態を検出することも不可能ではない。

　ロボットハンド２に配置される導電性ウレタン２２を含む外郭部２７は、ロボットハンド２の外側を一体構造として導電性ウレタン２２を含む外郭部２７を形成してもよく、指部等のパーツ毎に独立した導電性ウレタン２２を含む外郭部２７を形成してもよい。

　なお、１つの導電性ウレタン２２の電気特性の検出精度を向上するため、上述したように検出点として上記より多くの検出点を用いてもよい（図９から図１１を参照）。

　状態推定装置１は、推定部５を備えている。推定部５には、導電性ウレタン２２における電気抵抗の大きさ（電気抵抗値）を表す時系列の電気特性である入力データ４が入力される。具体的には、導電性ウレタン２２の検出点７５に接続された電気特性検出部７６から出力される電気特性（すなわち、電気抵抗値である体積抵抗値）が入力される。入力データ４は、ロボットハンド２の付与刺激状態３に対応する。また、推定部５は、推定結果として付与刺激状態３を示す物理量（付与刺激状態値）を表す出力である出力データ６を出力する。なお、推定部５は、学習済みの学習モデル５１を含む。

　学習モデル５１は、付与刺激状態３に応じた圧力刺激により変化する導電性ウレタン２２の電気抵抗（入力データ４）から、付与刺激状態、すなわちロボットハンド２における能動形態状態又は受動形態状態（出力データ６）を導出する学習を済ませたモデルである。学習モデル５１は、例えば、学習済みのニューラルネットワークを規定するモデルであり、ニューラルネットワークを構成するノード（ニューロン）同士の間の結合の重み（強度）の情報の集合として表現される。

　学習モデル５１は、学習処理部５２（図１２）の学習処理により生成される。本実施形態では、学習処理部５２は、上述したロボット状態に代えて付与刺激状態３により生じる圧力刺激で変化する導電性ウレタン２２における電気特性（入力データ４）を用いて学習処理を行う。すなわち、付与刺激状態３をラベルとして導電性ウレタン２２における電気抵抗を時系列に測定した大量のデータを学習データとする。具体的には、学習データは、電気抵抗値（入力データ４）を含んだ入力データと、その入力データに対応する付与刺激状態３を示す情報（出力データ６）と、のセットを大量に含む。ここでは、導電性ウレタン２２の電気抵抗値（入力データ４）の各々に測定時刻を示す情報を付与することで時系列情報が対応付けられる。この場合、付与刺激状態３として定まる期間について、導電性ウレタン２２における時系列の電気抵抗値のセットに測定時刻を示す情報を付与して時系列情報を対応付けてもよい。

　次に、学習処理部５２について説明する。
　学習処理部５２が行う学習処理では、上述した導電性ウレタン２２が配置されたロボットハンド２の外郭部２７が検出部として適用され、付与刺激状態３、及び導電性ウレタン２２による電気抵抗値（入力データ４）が学習データとして用いられる。

　例えば、能動形態状態及び受動形態状態における付与刺激状態を示すデータを学習データとする。具体的には、ロボットハンド２の少なくとも一部のパーツによる所定の姿勢や動き等の挙動となるように駆動部１１９の駆動制御を行い、そのときの電気抵抗値を検出して、付与刺激状態（付与刺激状態値）と対応付けて学習データとする。

　能動形態状態では、ロボットハンド２は、動き等によって外郭部２７が変形して、導電性ウレタン２２の電気抵抗値が変化する。従って、能動形態状態における時系列の電気抵抗値には、付与刺激状態の特徴を示すデータが含まれる。よって、時系列の電気抵抗値を検出して、付与刺激状態（付与刺激状態値）と対応付けて学習データとすればよい。なお、能動形態状態における時系列の電気抵抗値の成分を分離する場合は、付与刺激状態が存在しない状態、例えば無負荷の状態による能動形態状態での時系列の電気抵抗値と、当該能動形態状態における付与刺激状態での時系列の電気抵抗値との相違成分（例えば差分）を、付与刺激状態と対応付けて学習データとしてもよい。

　一方、受動形態状態では、ロボットハンド２の少なくとも一部のパーツによる所定の姿勢となるように駆動部１１９の駆動制御を行い、そのときの電気抵抗値を検出して、付与刺激状態（付与刺激状態値）と対応付けて学習データとすればよい。具体的には、所定姿勢のロボットハンド２に対して、人物を接触させたり、人物を押圧したりする付与刺激状態を生じさせ、そのときの電気抵抗値を検出して、付与刺激状態と対応付けて学習データとする。

　学習処理部５２は、図示しないＣＰＵを含むコンピュータを含んで構成可能であり、学習データ収集処理及び学習処理を実行する（図１３）。本実施形態では、上述したロボット状態を付与刺激状態に代えて、図示しないＣＰＵが学習データ収集処理を実行する。すなわち、学習処理部５２は、ステップＳ１００で、ロボットハンド２の状態（能動形態状態又は受動形態状態）でロボットハンド２に圧力を与え、ステップＳ１０２で、付与刺激状態に応じて変化する導電性ウレタン２２の電気抵抗値を時系列に取得する。次のステップＳ１０４では、取得した時系列の電気抵抗値に付与刺激状態３を示す付与刺激状態値をラベルとして付与して、記憶する。学習処理部５２は、これら付与刺激状態値、及び導電性ウレタン２２の電気抵抗値のセットが予め定めた所定数、又は予め定めた所定時間に達するまで（ステップＳ１０６で、肯定判断されるまで否定判断し）、上記処理を繰り返す。これにより、学習処理部５２は、付与刺激状態３毎に、導電性ウレタン２２における電気抵抗値を時系列に取得し、記憶することが可能となり、記憶された付与刺激状態毎の時系列の導電性ウレタン２２の電気抵抗値のセットが学習データとなる。

　ところで、ロボットハンド２に対する人物の接触等では、人物が外郭部２７に接触する付勢力（押圧力）が大きくなるのに従って、電気特性（電気抵抗値）が大きく変化する。従って、時系列の電気特性が接触検出用に予め定めた閾値を超えること検出することで、少なくとも人物が外郭部２７に接触したことを示す付与刺激状態を検出可能である。よって、少なくとも人物が外郭部２７に接触した付与刺激状態を推定可能に学習処理を実行するのであれば、接触を特定する付勢力（押圧力）に対応する時系列の電気特性を学習データとすればよい（図１９も参照）。

　導電性ウレタン２２の時系列の電気特性（各ピーク値Ｐ１～Ｐ８を含む前後の電気特性）の各々が、付勢力（押圧力）に応じて接触し、付与刺激状態における特徴パターンとして現れる。すなわち、ロボットハンド２が人物により押圧されると、電気抵抗値が急激に上昇し、押圧が解除（ユーザの手が離間）されると電気抵抗値が徐々に低下するパターンが、特徴パターンとして現れる。このため、上述したようにピーク値Ｐ１～Ｐ７を超える電気抵抗値を閾値ｔｈに定めることで、人物が外郭部２７に接触した付与刺激状態を検出可能である。よって、学習処理部５２は、接触した付与刺激状態を特定する付勢力（押圧力）に対応する時系列の電気特性を学習データとして学習する。

　一方、接触検出に限定しない付与刺激状態は、ロボットハンド２における各パーツの位置、又は複数のパーツの相対的な位置関係、各パーツにおける圧力刺激の分布、大きさ、及び頻度等の各物理量により同定可能である。従って、導電性ウレタン２２の時系列の電気特性には、付与刺激状態を示す時系列の物理量の特徴が含まれる。本実施形態では、導電性ウレタン２２を用いることで、これらの物理量が反映された電気特性（体積抵抗）を時系列に検出することが可能である。

　従って、付与刺激状態に応じてロボットハンド２における圧力刺激が変化し、その圧力刺激の変化に対応する電気特性を時系列に取得することで、付与刺激状態に時系列の電気特性を対応付けて記憶することが可能となる。当該時系列の電気特性および付与刺激状態を示す付与刺激状態値とのセットを学習データとすることが可能となる。

　次に、上述した学習データの一例を表で示す。表４は、付与刺激状態に関する学習データとして、時系列の電気抵抗値データ（ｒ）と付与刺激状態能動形態状態値とを対応付たデータの一例である。表５は、ロボットハンド２における部位ごとの時系列の電気抵抗値データ（Ｒ）を示すデータの一例である。表３は、ロボットハンド２における各指部で検出された時系列の電気抵抗値を示す特性データ（Ｊ）のセットと、付与刺激状態値とを対応付たデータの一例である。

　表４に示す例は、付与刺激状態に含まれる接触状態、形状状態、及び物理状態の各状態について、対象となる人物の部位、及び性質を適用とし、当該状態に対応する触感、質感、物理量を示す値を対応付けた学習データである。

　表５に示す例は、ロボットハンド２に与えられる圧力を検出する部位として、指先、指腹、付け根、及び掌、甲、側面を含む。表５に示すデータは、表１に示すデータの各々に含むようにしてもよい。例えば、ｒ１１＝（Ｒ１１１、Ｒ１１２、Ｒ１１３、・・・、Ｒ１１ｍ：ｎ＝ｍ）とすることが可能である。

　表６に示す例は、ロボットハンド２における各パーツが連携することを考慮して、各パーツで検出された時系列の電気抵抗値を示す特性データ（Ｊ）のセットと、付与刺激状態値とを対応付た学習データである。ロボットハンド２では、各セットに含まれる何れかの特性データ（Ｊ）に付与刺激状態の特徴、すなわち、特徴パターンが含まれる。よって、各特性データ（Ｊ）は、全て学習データとして用いることが可能である。例えば、ロボットハンド２を構成する３つの指部２３６の各々で検出された電気抵抗値の変動を含む特性データ（Ｊ）の組み合わせから付与刺激状態を同定可能である。例えば３つの指部２３６において２以上の部位で電気抵抗値が押圧方向に変動したことで「物を把持」を同定可能であり、２以上の部位で閾値以内の電気抵抗値の変動から急激に変化する場合に「握りそこね」や「把持解除」を同定可能である。また、閾値以内の電気抵抗値の変動からの変動幅の大きさから人物の把持に人物の位置がずれる「すべり」を同定可能である。

　次に、学習処理部５２における学習処理ついて説明する。学習処理部５２では上述した学習処理が行われる（図１４）。本実施形態では、上述したロボット状態を付与刺激状態に代えて学習処理が実行される。学習処理については上記と同様のため、説明を省略する。

　学習モデル５１は、上述した学習処理部５２の学習処理により生成される（図１５）。学習モデル５１は、学習処理部５２による学習結果のノード間の結合の重みパラメータ（重み又は強度）の情報の集合として表現される。

　そして、上記状態推定装置１では、以上に例示した手法により生成した学習済みの生成器５４（すなわち、学習結果のノード間の結合の重みパラメータの情報の集合として表現されるデータ）を学習モデル５１として用いる。十分に学習した学習モデル５１を用いれば、ロボットハンド２、すなわち外郭部２７に配置された導電性ウレタン２２における時系列の電気抵抗値から付与刺激状態を同定することも不可能ではない。

　なお、学習処理部５２による処理は、本開示の学習モデル生成装置の処理の一例である。また、状態推定装置１は、本開示の推定部および推定装置の一例である。付与刺激状態３を示す情報である出力データ６は、本開示の付与刺激状態情報の一例である。

　また、上述したように、導電性ウレタン２２は、導電性ウレタン２２の変形に関するデータを貯留するリザーバとして扱うことが可能である。すなわち、状態推定装置１は、物理的なリザーバコンピューティング（ＰＲＣ）と呼ばれるＰＲＣＮに、導電性ウレタン２２を適用することが可能である。

　図２３に、上述した図１６に示す例と同様に、本実施形態に係る導電性ウレタン２２を含むロボットハンド２を、導電性ウレタン２２を含むロボットハンド２の変形に関するデータを貯留するリザーバとして扱って学習する学習処理部５２の一例を示す。従って、上述したように学習処理では、推定層を学習すればよい。

　状態推定装置１は、例えば、コンピュータに上述の各機能を表すプログラムを実行させることにより実現可能である。例えば、状態推定装置１の各種機能を実現する処理を実行する実行装置としてコンピュータを含んで制御装置２５０を構成すればよい（図１７）。

　次に、コンピュータにより実現された状態推定装置１における推定処理について説明する。

　本実施形態に係る推定処理は、コンピュータ本体１００に電源投入されると、ＣＰＵ１０２により実行される（図１８）。すなわち、ＣＰＵ１０２は、制御プログラム１０８Ｐを補助記憶装置１０８から読み出し、ＲＡＭ１０４に展開して処理を実行する。本実施形態では、上述したようにロボット状態を付与刺激状態に代えて、推定処理が実行される。

　次に、ＣＰＵ１０２は、ステップＳ２０２で、導電性ウレタン２２に与えられた圧力刺激による付与刺激状態を推定する対象となる未知の入力データ４（電気抵抗）を、通信部１１４を介して時系列に取得する。

　次に、ＣＰＵ１０２は、ステップＳ２０４で、ステップＳ２００で取得した学習モデル５１を用いて、ステップＳ２０２において取得した入力データ４（電気抵抗）に対応する出力データ６（未知の付与刺激状態）を推定する。

　そして、次のステップＳ２０６で、推定結果の出力データ６（付与刺激状態）を、通信部１１４を介して出力したり、スピーカ１１８から音を発するようにデータを出力したり、表示部２１１に表示するようにデータを出力して、本処理ルーチンを終了する。

　なお、本実施形態に係る推定処理は、本開示の推定方法で実行される処理の一例である。

　以上説明したように、本開示によれば、導電性ウレタン２２に対して、付与刺激状態３における圧力刺激に応じて変化する入力データ４（電気抵抗）から、付与刺激状態を推定することが可能となる。すなわち、特殊な装置や大型の装置を用いたり柔軟部材の変形を直接計測することなく、未知の付与刺激状態を推定することが可能となる。

　また、付与刺激状態に応じて電気特性が変化し、当該電気特性（時系列の電気抵抗）に付与刺激状態の特徴が反映されるので、導電性ウレタン２２において時系列に変化する電気抵抗値から付与刺激状態を推定可能である。すなわち、ロボットハンド２に対して人物によって圧力が与えれる各種の付与刺激状態であっても、上述した学習モデルを用いることで、適切な付与刺激状態を推定できる。

　本実施形態に係る状態推定装置１では、上述した学習処理によって学習された学習モデル５１を用いることによって、導電性ウレタン２２の電気特性を入力することで、電気特性に対応した様々な付与刺激状態を推定できることを確認した。

＜応用例＞
　上述した状態推定装置１は、各種の装置への応用が可能である。

　上述した状態推定装置１は、複数の場所において付与刺激状態を共有する場合に有効に機能する。例えば、状態推定装置１は、ロボットハンド２を遠隔地に配置される遠隔装置の一部として機能させることで、ロボットハンド２の配置先から離間した場所において、ロボットハンド２により検出される人物の未知の付与刺激状態を把握することが可能である。遠隔地において、人物の未知の付与刺激状態を把握するためには、上述した推定結果である付与刺激状態を示す付与刺激状態値をデータとして、通信部１１４を介して予め定めた遠隔地の送信先に送信する処理を追加すればよい。

　また、上述した実施形態では、上述した学習処理によって学習された学習モデル５１を用いて、導電性ウレタン２２の電気特性に対応した様々な付与刺激状態を推定する場合を説明した。この場合、付与刺激状態として人物が外郭部２７に接触した接触状態を検出することに注目する場合、状態推定装置１を、時系列の電気特性が接触検出用に予め定めた閾値を超えること検出する機能部分は、人物の接触を検出する接触検出装置として適用可能である。

　上述した実施形態では、本開示の技術を導電性ウレタン２２が外殻部に配置されたロボットに適用した場合を説明したが、本開示の技術は、ロボットへの適用に限定されない。例えば、導電性ウレタン２２を含む部材を、ロボットの周囲に配置されるカバー部に配置したり、人体の一部に装着される袋体（例えば、帽子、手袋及び足袋等）に配置してもよい。すなわち、導電性ウレタンを配置する可動体は、ロボットや人体等の導電性ウレタン２２に付与刺激状態に応じて圧力を与えるための基体及び突出部を有する人物であればよい。

　図２４に、本開示の技術を適用した導電性ウレタン２２が配置された手袋２９を示す。手袋２９は、人体の手の外部に装着する部材であり、内部又は外部の少なくとも一部に導電性ウレタン２２が配置される。

　ここでは、説明を簡単にするため、人体の手の外部に装着する部材を導電性ウレタン２２で形成した手袋２０を説明する。図２４に示すように手袋２０は、親指を覆う第１指部２０－１、人差し指を覆う第２指部２０－２、中指を覆う第３指部２０－３、薬指を覆う第４指部２０－４、及び小指を覆う第５指部２０－５を備え、各々掌（甲）を覆う掌部２０－６に連結される。なお、手袋２０は、図２に示すロボットの手２３６を覆うものであってもよい。

　また、手袋２０は、各部位毎に、すなわち、第１指部２０－１から第５指部２０－５及び掌部２０－６の各々における電気特性を検出するために、各部位の導電性ウレタン２２に電極等の検出点７５が配置される。手袋２０では、導電性ウレタン２２は、電気特性検出部７６（図８）を備えた制御装置２５０Ａに接続される。制御装置２５０Ａは、図２１に示す制御装置２５０と同様の構成であるため、説明を省略する。

　なお、図２４に示す手袋２０における電極等の検出点７５の配置は一例であって、図２４に示す配置に限定されるものではない。例えば、手袋２０に少なくとも一対の電極等の検出点７５を配置すればよく、検出精度向上のために、複数の検出点を配置してもよい。

　導電性ウレタン２２を配置した手袋２０は、ロボット又は人の手の能動形態状態及び受動形態状態に応じた人物の付与刺激状態を推定できる。よって、導電性ウレタン２２を含む部材を、ロボットの周囲に配置されるカバー部に配置したり、人体の一部に装着される袋体（例えば、帽子、手袋及び足袋等）に配置することにより、大規模なセンサシステムを備えることなく、簡単に人物の付与刺激状態を推定可能となる。

［第３実施形態］
　次に、本開示の第３実施形態を説明する。第３実施形態は、第１実施形態及び第２実施形態と同様の構成のため、同一部分には同一符号を付して詳細な説明を省略する場合がある。

　本開示は、特殊な検出装置を用いることなく、導電性を有する柔軟材料の電気特性を利用して、接触物体を示す接触物体情報を推定することができる推定装置、推定方法、推定プログラム、ロボットシステム及び学習モデル生成装置を提供する。

　本開示において「接触物体」とは、接触した物体の種類及び接触した物体の状態を含む概念である。

　本開示の推定装置は、学習済みの学習モデルを用いて、ロボットに備えられた導電性を有する柔軟材料における電気特性から接触物体に関する情報を推定する。学習モデルは、導電性を有する柔軟材料に圧力を与えた際の時系列の電気特性と、その柔軟材料に圧力を与える接触物体を示す接触物体情報とを学習用データとして用いる。学習モデルは、時系列の電気特性を入力とし、その時系列の電気特性に対応する接触物体を示す接触物体情報を出力するように学習される。

　以下の説明では、導電性を有する柔軟材料としてウレタン部材の全部または少なくとも一部に導電材が配合された導電性ウレタンが、ロボットの胴体部の少なくとも一部の外郭部に配置された場合を説明する。また、導電性ウレタンを変形させる物理量としてはロボット、すなわち柔軟材料に与えられる圧力刺激を示す値（圧力値）を適用する。なお、圧力刺激に応じて変化する物理量としては、導電性ウレタンの電気抵抗値を適用した場合を説明する。

　本開示の推定装置としての接触物体推定装置は、上述したロボット状態推定装置１と同様の構成のため、本実施形態では、上述したロボット状態推定装置１を接触物体推定装置１と称して接触物体推定装置１の構成については詳細な説明を省略する。

　接触物体推定装置１における推定処理は、学習済みの学習モデル５１を用いて、ロボット２に配置された導電性ウレタン２２における電気特性から、未知の接触物体の種類及び状態を推定し、出力する。これにより、特殊な装置や大型の装置を用いたりロボット２の外郭の変形を直接計測することなく、接触物体を示す接触物体情報を推定することが可能
となる。学習モデル５１は、接触物体（例えば、接触物体の種類を示す値又は接触物体の状態を示す状態値）をラベルとし、当該接触物体により圧力刺激が与えられた状態における導電性ウレタンの電気特性（すなわち、ロボット２に配置された導電性ウレタンの電気抵抗値）を入力として学習される。

　本実施形態では、例えば、図２５に胴体部２２０の概略構造の一例を断面図で示すように、胴体部２２０の複数の骨格２１を覆うように、人工筋肉などの構造物を含む内部層２５が配置され、内部層２５の周囲に表皮としても機能する外郭部２７が配置される。なお、胴体部２２０の複数の骨格２１を覆う表皮として機能する外郭部２７を配置してもよい。

　導電性ウレタン２２は、上記と同様に（例えば、図４に示すように）、胴体部２２０の複数の骨格２１を覆うように配置する材料、すなわち外郭部２７の少なくとも一部に配置すればよく、内部に配置してもよいし外部に配置してもよい。

　本実施形態では、本開示のロボットの一例として、上述した簡易型のロボットを含む自立型ロボットシステムをロボット２として適用した場合を説明する（図６）。ロボット２は、胴体部２２０の複数の骨格２１を覆うようにロボット２の外側である外郭として導電性ウレタン２２を配置して外郭部を形成する。

　ところで、接触物体推定装置１は、接触物体を推定するために、ロボット２に配置された導電性ウレタン２２における電気特性を検出する（図８参照）。
。

　外郭部２７に導電性ウレタン２２を備えて構成されるロボット２において検出される電気抵抗値は、ロボット２の胴体部２２０の外郭部２７に圧力刺激が与えられる等の導電性ウレタン２２の変形によって、その変形の前後で変化する。よって、時系列の電気抵抗値の検出、すなわち、ロボット２の胴体部２２０に圧力刺激が与えられていない状態からの電気抵抗値の変化を検出（例えば予め定めた閾値を超えた電気抵抗値を検出）することで、ロボット２の胴体部２２０に対する接触物体を検出することが可能となる。具体的には、ロボット２の胴体部２２０に対する接触物体は、ロボット２の胴体部２２０に対する接触物体の種類及び接触物体の状態を含む。よって、ロボット２の胴体部２２０に導電性ウレタン２２を配置することで、ロボット２の胴体部２２０に対する接触物体の種類及び接触物体の状態を検出可能となる。また、ロボット２に与えられた圧力刺激の位置や分布、及び大きさの何れか１つが変化しても電気抵抗値は変化する。従って、時系列に変化した電気抵抗値から、ロボット２の胴体部２２０に対する接触物体の種類及び接触物体の状態を検出することも不可能ではない。

　ロボット２の胴体部２２０に形成される導電性ウレタン２２を含む外郭部２７は、ロボット２の胴体部２２０の外側を一体構造として導電性ウレタン２２を含む外郭部２７を形成してもよく、上部胴体２２２及び下部胴体２２４毎に独立した導電性ウレタン２２を含む外郭部２７を形成してもよい。

　なお、１つの導電性ウレタン２２の電気特性の検出精度を向上するため、上述したように、上記より多くの検出点を用いてもよい（図９から図１１を参照）。

　接触物体推定装置１は、推定部５を備えている。推定部５には、導電性ウレタン２２における電気抵抗の大きさ（電気抵抗値）を表す時系列の入力データ４が入力される。入力データ４は、ロボット２の接触物体３に対応する。また、推定部５は、推定結果として接触物体３を示す接触物体情報を表す出力データ６を出力する。なお、推定部５は、学習済みの学習モデル５１を含む。

　学習モデル５１は、接触物体３に応じた圧力刺激により変化する導電性ウレタン２２の電気抵抗（入力データ４）から、接触物体、すなわちロボット２の胴体部２２０に対する接触物体の種類及び接触物体の状態（出力データ６）を導出する学習を済ませたモデルである。学習モデル５１は、例えば、学習済みのニューラルネットワークを規定するモデルであり、ニューラルネットワークを構成するノード（ニューロン）同士の間の結合の重み（強度）の情報の集合として表現される。

　学習モデル５１は、学習処理部５２（図１２）の学習処理により生成される。本実施形態では、学習処理部５２は、上述したロボット状態に代えて接触物体３により生じる圧力刺激で変化する導電性ウレタン２２における電気特性（入力データ４）を用いて学習処理を行う。すなわち、接触物体３をラベルとして導電性ウレタン２２における電気抵抗を時系列に測定した大量のデータを学習データとする。具体的には、学習データは、電気抵抗値（入力データ４）を含んだ入力データと、その入力データに対応する接触物体３を示す接触物体情報（出力データ６）と、のセットを大量に含む。ここでは、導電性ウレタン２２の電気抵抗値（入力データ４）の各々に測定時刻を示す情報を付与することで時系列情報が対応付けられる。この場合、接触物体３として定まる期間について、導電性ウレタン２２における時系列の電気抵抗値のセットに測定時刻を示す情報を付与して時系列情報を対応付けてもよい。

　次に、学習処理部５２について説明する。
　学習処理部５２が行う学習処理では、上述した導電性ウレタン２２が配置されたロボット２の胴体部２２０の外郭部２７が検出部として適用され、接触物体３の種類、状態、及び導電性ウレタン２２による電気抵抗値（入力データ４）が学習データとして用いられる。

　例えば、接触物体の各種類に対するデータを学習データとする。具体的には、ロボット２の胴体部２２０に対して圧力等のエネルギが与えられる所定の種類の接触物体により圧力刺激を与えるように、ユーザＯＰに指示し、そのときの電気抵抗値を検出して、接触物体の種類と対応付けて学習データとする。ロボット２の胴体部２２０は、接触物体から圧力等のエネルギが与えられることによって外郭部２７が変形して、導電性ウレタン２２の電気抵抗値が変化するので、時系列の電気抵抗値を検出して、接触物体の種類と対応付けて学習データとすることが可能となる。

　また、接触物体の各状態に対するデータを学習データとする。具体的には、ロボット２の胴体部２２０に対して圧力等のエネルギが与えられる所定の状態で接触物体により圧力刺激を与えるように、ユーザＯＰに指示し、そのときの電気抵抗値を検出して、接触物体の状態と対応付けて学習データとする。ロボット２の胴体部２２０は、接触物体から圧力等のエネルギが与えられることによって外郭部２７が変形して、導電性ウレタン２２の電気抵抗値が変化するので、時系列の電気抵抗値を検出して、接触物体の状態と対応付けて学習データとすることが可能となる。接触物体の状態には、人物がロボットに接触する接触状態が含まれる。

　学習処理部５２は、図示しないＣＰＵを含むコンピュータを含んで構成可能であり、学習データ収集処理及び学習処理を実行する（図１３）。本実施形態では、学習処理部５２は、ステップＳ１００で、物体によりロボット２の胴体部２２０に対して圧力刺激を与えるための指示を行い、ステップＳ１０２で、接触物体に応じた圧力刺激により変化する導電性ウレタン２２の電気抵抗値を時系列に取得する。次のステップＳ１０４では、取得した時系列の電気抵抗値に接触物体３の種類及び状態を示す接触物体情報をラベルとして付与して、記憶する。学習処理部５２は、これら接触物体情報、及び導電性ウレタン２２の電気抵抗値のセットが予め定めた所定数、又は予め定めた所定時間に達するまで（ステップＳ１０６で、肯定判断されるまで否定判断し）、上記処理を繰り返す。これにより、学習処理部５２は、接触物体３の種類毎及び接触物体３の状態毎に、導電性ウレタン２２における電気抵抗値を時系列に取得し、記憶することが可能となり、記憶された接触物体の種類毎及び状態毎の時系列の導電性ウレタン２２の電気抵抗値のセットが学習データとなる。

　ところで、ロボット２の胴体部２２０の外郭部２７に物体の接触による圧力刺激を与えた場合、接触物体の種類及び状態に応じて、電気特性（電気抵抗値）が大きく変化する。従って、時系列の電気特性を検出することで、接触物体の種類及び状態を検出可能である。よって、接触物体の種類及び状態に対応する時系列の電気特性を学習データとすればよい。

　次に、上述した学習データの一例を表で示す。表７は、接触物体の種類に関する学習データとして、時系列の電気抵抗値データ（ｒ）と接触物体の種類とを対応付けたデータの一例である。表８は、接触物体の状態に関する学習データとして、時系列の電気抵抗値データ（Ｒ）と接触物体の状態とを対応付けたデータの一例である。

　次に、学習処理部５２における学習処理ついて説明する。学習処理部５２では、上述した学習処理が行われる（図１４）。本実施形態では、上述したロボット状態を接触物体の種類及び状態に代えて学習処理が実行される。学習処理については上記と同様のため、説明を省略する。

　そして、上記接触物体推定装置１では、以上に例示した手法により生成した学習済みの生成器５４（すなわち、学習結果のノード間の結合の重みパラメータの情報の集合として表現されるデータ）を学習モデル５１として用いる。十分に学習した学習モデル５１を用いれば、ロボット２、すなわち外郭部２７に配置された導電性ウレタン２２における時系列の電気抵抗値から接触物体の種類及び状態を同定することも不可能ではない。

　なお、学習処理部５２による処理は、本開示の学習モデル生成装置の処理の一例である。また、接触物体推定装置１は、本開示の推定部および推定装置の一例である。接触物体３の種類及び状態を示す情報である出力データ６は、本開示の接触物体情報の一例である。

　また、上述したように、導電性ウレタン２２は、導電性ウレタン２２の変形に関するデータを貯留するリザーバとして扱うことが可能である。すなわち、接触物体推定装置１は、ＰＲＣと呼ばれるＰＲＣＮに、導電性ウレタン２２を適用することが可能である。

　図２６に、上述した図１６と同様に、導電性ウレタン２２を含むロボット２を、導電性ウレタン２２を含むロボット２の変形に関するデータを貯留するリザーバとして扱って学習する学習処理部５２の一例を示す。導電性ウレタン２２は、多様な圧力刺激の各々に応じた電気特性（電気抵抗値）となり、電気抵抗値を入力する入力層として機能し、また、導電性ウレタン２２の変形に関するデータを貯留するリザーバ層として機能する。導電性ウレタン２２は、接触物体３により与えられた圧力刺激に応じて異なる電気特性（入力データ４）を出力するので、推定層で、導電性ウレタン２２の電気抵抗値から与えられた接触物体３の種類及び状態を推定することが可能である。従って、学習処理では、推定層を学習すればよい。

　上述の接触物体推定装置１は、例えば、コンピュータに上述の各機能を表すプログラムを実行させることにより実現可能である。例えば、接触物体推定装置１の各種機能を実現する処理を実行する実行装置としてコンピュータを含んで制御装置２５０を構成すればよい（図１７）。

　次に、コンピュータにより実現された接触物体推定装置１における推定処理について説明する。

　本実施形態に係る推定処理は、上述したように、コンピュータ本体１００に電源投入されると、ＣＰＵ１０２により実行される（図１８）。すなわち、ＣＰＵ１０２は、制御プログラム１０８Ｐを補助記憶装置１０８から読み出し、ＲＡＭ１０４に展開して処理を実行する。

　すなわち、ＣＰＵ１０２は、ステップＳ２００で、補助記憶装置１０８の学習モデル１０８Ｍから学習モデル５１を読み出し、ＲＡＭ１０４に展開することで、学習モデル５１を取得する。具体的には、学習モデル５１として表現された重みパラメータによるノード間の結合となるネットワークモデル（図１４、図１６参照）を、ＲＡＭ１０４に展開する。よって、重みパラメータによるノード間の結合が実現された学習モデル５１が構築される。

　次に、ＣＰＵ１０２は、ステップＳ２０２で、導電性ウレタン２２に圧力刺激を与えた接触物体を推定する対象となる未知の入力データ４（電気抵抗）を、通信部Ｉ／Ｆ１１４を介して時系列に取得する。

　次に、ＣＰＵ１０２は、ステップＳ２０４で、ステップＳ２００で取得した学習モデル５１を用いて、ステップＳ２０２において取得した入力データ４（電気抵抗）に対応する出力データ６（未知の接触物体の種類及び状態）を推定する。

　そして、次のステップＳ２０６で、推定結果の出力データ６（接触物体の種類及び状態）を、通信部Ｉ／Ｆ１１４を介して出力したり、スピーカ１１８から音を発するようにデータを出力したり、表示部２１１に表示するようにデータを出力して、本処理ルーチンを
終了する。また、制御装置２５０は、推定結果の出力データ６（接触物体の種類及び状態）に基づいて、ロボット２の各種の姿勢を維持したり、各種の挙動を実行する。例えば、推定された接触物体の状態が、「かるくたたく」である場合に、ロボット２の電源のオンオフを切り替える。これにより、ロボット２の胴体部２２０が大きなスイッチとして機能する。また、推定された接触物体の状態が、「さする」である場合に、ロボット２の挙動速度を遅くする。

　以上説明したように、本開示によれば、導電性ウレタン２２に対して、接触物体３における圧力刺激に応じて変化する入力データ４（電気抵抗）から、接触物体の種類及び状態を推定することが可能となる。すなわち、特殊な装置や大型の装置を用いたり柔軟部材の変形を直接計測することなく、未知の接触物体の種類及び状態を推定することが可能となる。

　また、接触物体に応じて電気特性が変化し、当該電気特性（時系列の電気抵抗）に接触物体の特徴が反映されるので、導電性ウレタン２２において時系列に変化する電気抵抗値から接触物体の種類及び状態を推定可能である。すなわち、様々な接触物体であっても、上述した学習モデルを用いることで、適切な接触物体の種類及び状態を推定できる。例えば、胴体部２２０に何がぶつかったのかを判別できたり、誰が、どれぐらいの強さで抱き着いたかを判別することができる。

　本実施形態に係る接触物体推定装置１では、上述した学習処理によって学習された学習モデル５１を用いることによって、導電性ウレタン２２の電気特性を入力することで、電気特性に対応した様々な接触物体の種類及び状態を推定できる。

　また、本実施形態では、上述した学習処理によって学習された学習モデル５１を用いて、導電性ウレタン２２の電気特性に対応した様々な接触物体の種類及び状態を推定する場合を説明した。この場合、接触物体として人物が外郭部２７に接触した接触状態を検出することに注目する場合、接触物体推定装置１を、時系列の電気特性から、ロボット２の人物の接触を検出する接触検出装置として適用可能である。

　また、胴体部２２０の前部（腹部）、後部（背中）で独立して導電性ウレタン２２の電気特性を検出するようにしてもよい。この場合、正面からの抱きつきや背後からのタックル等の行為を推定することができる。

［第４実施形態］
　次に、本開示の第４実施形態を説明する。第４実施形態は、第１実施形態から第３実施形態と同様の構成のため、同一部分には同一符号を付して詳細な説明を省略する場合がある。

　ところで、例えば、姿勢変化が可能なロボットでロボットの姿勢を変化させるための作動を制御する場合、ロボットに対する人体及び物体の少なくとも一方の接触やロボットの形状変化を検出して、予め定められた姿勢となるように制御することが考えられる。

　しかしながら、多数の特殊な接触センサを備えて接触を検出する側面では、接触を検出するための各部位に接触センサを備えることが要求され、センサ数が膨大となって、ロボットの大型化を招くので好ましくはない。また、多数の特殊な接触センサ自体がロボットの接触状態を阻害する虞もある。

　従って、簡単な構成で、ロボットに対する人体及び物体の少なくとも一方の接触等に応じてロボットの作動を制御するためには、改善の余地がある。

　本開示は、特殊装置を用いることなく簡単な構成で、導電性を有する柔軟材料の電気特性から推定されるロボット状態を利用して、ロボットの作動状態を制御することができるロボット制御装置、ロボット制御方法、ロボット制御プログラム、及びロボットシステムを提供する。

　本開示において「ロボットの作動状態」とは、上述したロボット状態から、ロボットを構成する少なくとも一部のパーツが作動によって可動した場合に形成されるロボット状態を含む概念である。例えば、ロボットの作動状態は、能動形態状態及び受動形態状態の少なくとも一方の状態、すなわち、ロボットの少なくとも一部のパーツに対して圧力等のエネルギが与えられることが可能なロボット状態に対して、少なくとも一部のパーツの作動によって形成される、予め定められた（または予測された）ロボット状態を含む。

　本開示のロボット制御装置は、作動状態が制御可能で、導電性を有し、かつ与えられた圧力の変化に応じて電気特性が変化する柔軟材料を備えたロボットにおける複数の検出点間の電気特性を検出部で検出する。導出部は、ロボットの電気特性から第１学習モデルを用いて推定されたロボット状態に対応して変化させる作動状態を示す作動データを導出し、ロボットのパーツを駆動する駆動部へ出力する。ロボット制御装置は、作動データに基づく駆動部によるロボットの少なくとも一部のパーツの駆動によってロボットの作動状態を制御する。

　図２７に、本開示の推定装置としてのロボット制御装置の一例を示す。本実施形態に係るロボット制御装置は、上述したロボット状態推定装置１と同様の構成のため、本実施形態では、上述したロボット状態推定装置１をロボット制御装置１と称する。本実施形態に係るロボット制御装置１は、ロボット状態を推定する推定機能を有するロボット状態推定装置１Ａ、及びロボット駆動を行うロボット駆動装置１Ｂを含む。

　ロボット状態推定装置１Ａは、推定部５を備え、推定部５において、ロボット状態を推定する推定処理を実行する。推定処理は、学習済みの学習モデル５１を用いて、ロボット２に配置された導電性ウレタン２２における電気特性（入力データ４）から、未知のロボット状態として、ロボット２におけるロボット状態を推定し、出力データ６として出力する。これにより、特殊な装置や大型の装置を用いたりロボット２の外郭の変形を直接計測することなく、ロボット状態を推定することが可能となる。学習モデル５１は、ロボット状態（例えば、状態値）をラベルとし、当該ロボット状態における導電性ウレタンの電気特性（すなわち、ロボット２に配置された導電性ウレタンの電気抵抗値）を入力として学習される。推定処理及び推定処理で用いる学習モデル５１の学習については後述する。

　ロボット駆動装置１Ｂでは、導出部７を備え、導出部７において、ロボット状態推定装置１Ａで推定されたロボット状態（出力データ６）を用いて、推定されたロボット状態に対応するロボット２の作動状態にロボット２を移行する制御を実行する。この制御は、学習済みの学習モデル５１を用いて、ロボット２の現在のロボット状態に対して、将来のロボット状態、例えば次にロボット２が移行する状態を示すデータとして、ロボット２における各パーツの駆動値を示す作動データ８（駆動情報）を導出し、駆動部１１９に出力する。これにより、ロボット２は推定されたロボット状態に対応する作動状態９となり、特殊装置を用いることなく簡単な構成で、ロボットの作動を制御することが可能となる。学習モデル５１は、将来のロボット状態（例えば、駆動値を含む作動状態値）をラベルとし、ロボット状態（すなわち、ロボット２に配置された導電性ウレタンの電気抵抗値から推定されるロボット２の状態）を入力として学習される。導出処理及び導出処理で用いる学習モデル５１の学習については後述する。

　なお、本実施形態では、ロボット制御装置１におけるロボット状態推定装置１Ａ、及びロボット駆動装置１Ｂの各々で共通の学習モデル５１を用いる場合を説明するが、本開示はこれに限定されない。例えば、ロボット状態推定装置１Ａ、及びロボット駆動装置１Ｂの各々に対して独立した学習モデルを用いてもよい。

　本実施形態では、説明を簡単にするため、ロボット２の一例として、上述した簡易型のロボット（図６）を含む自立型ロボットシステムをロボット２として適用した場合を説明する。

　図２８に詳細を示すように、ロボット２は、ベース部２４１に図示しない移動機構を備えることで、移動可能とされる。ベース部２４１には、ロボット２の制御を行う制御装置２５０が備えられている。制御装置２５０は、ロボット状態推定装置１Ａ、及びロボット駆動装置１Ｂの各々として動作する機能部を含む。

　また、ロボット２は、ベース部２４１を含む脚部２４０以外の部位において、骨格２１の連携による各パーツを移動するための駆動部１１９を備えている。駆動部１１９の駆動によって、ロボット２は、パーツ毎の移動や変形、或いは複数のパーツが連携した移動や変形によって、各種の姿勢を維持したり、各種の挙動を実行することが可能となる。すなわち、ロボット２は、駆動部１１９の駆動によって、ロボット２の作動状態を制御可能である。よって、ロボット２は、自立型ロボットシステムとして動作する。なお、駆動部１１９は、頭部２１０に含まれる表示部２１１へのデータを表示するために、表示部２１１に表示のためのデータを出力する表示駆動部としても機能する。

　ところで、ロボット制御装置１におけるロボット状態推定装置１Ａは、ロボット状態を推定するために、ロボット２に配置された導電性ウレタン２２における電気特性を検出する（図８）。

　外郭部２７に導電性ウレタン２２を備えて構成されるロボット２において検出される電気抵抗値は、ロボット２の外郭部２７に圧力刺激が与えられる等の導電性ウレタン２２の変形によって、その変形の前後で変化する。よって、時系列の電気抵抗値の検出、すなわち、ロボット２に圧力刺激が与えられていない状態からの電気抵抗値の変化を検出（例えば予め定めた閾値を超えた電気抵抗値を検出）することで、ロボット２に対する人物の付勢を検出することが可能となる。具体的には、ロボット２に対する人物の付勢を示す付勢状態は、ロボット２に対する人物の接触であっても圧力刺激を伴うため、接触状態を含む。よって、ロボット２に導電性ウレタン２２を配置することで、ロボット２に対する人物の接触を含む付勢を検出可能となる。また、ロボット２に与えられた圧力刺激の位置や分布、及び大きさの何れか１つが変化しても電気抵抗値は変化する。従って、時系列に変化
した電気抵抗値から、ロボット２に対する人物の接触位置を含む付勢状態を検出することも不可能ではない。

　なお、上述したように、ロボット２に形成される導電性ウレタン２２を含む外郭部２７は、ロボット２の外側を一体構造として導電性ウレタン２２を含む外郭部２７を形成してもよく、パーツ毎に独立した導電性ウレタン２２を含む外郭部２７を形成してもよい。また、１つの導電性ウレタン２２の電気特性の検出精度を向上するため、より多くの検出点を用いてもよい（図９から図１１を参照）。

　図２７に示すように、ロボット状態推定装置１Ａは、推定部５を備えている。推定部５には、導電性ウレタン２２における電気抵抗の大きさ（電気抵抗値）を表す時系列の入力データ（電気特性）４が入力される。具体的には、導電性ウレタン２２の検出点７５に接続された電気特性検出部７６から出力される電気特性（すなわち、電気抵抗値である体積抵抗値）が入力される。入力データ４は、ロボット２のロボット状態３に対応する。また、推定部５は、推定結果として入力データ４に対応する未知のロボット状態を示す物理量（ロボット状態値）を表す出力データ６を出力する。なお、推定部５は、学習済みの学習モデル５１を用いて未知のロボット状態を示す出力データ６を推定する。

　また、図２７に示すように、ロボット駆動装置１Ｂは、導出部７を備えている。導出部７には、ロボット状態推定装置１Ａにおいて時系列の入力データ（電気特性）４から推定されたロボット状態（出力データ６）が入力される。入力されたロボット状態（出力データ６）には、将来、例えば、現在のロボット状態から次の作動状態に推移することが好ましい場合がある。そこで、導出部７は、推定されたロボット状態（出力データ６）に対応するロボット２の未知の作動状態に作動させるための物理量を表す作動データ８を導出し、駆動部１１９に出力する。よって、ロボット２は、作動状態９になるように駆動される。なお、導出部７は、学習済みの学習モデル５１を用いて、推定されたロボット状態に対応する作動状態を示す作動データ８を導出する。

　学習モデル５１は、データが入力されると、入力されたデータの特徴や入力されたデータの関連情報を示すデータを出力するように学習された、学習済みのモデルである。具体的には、学習モデル５１は、ロボット状態推定装置１Ａで用いる学習モデルとして、導電性ウレタン２２の電気抵抗（入力データ４）から、ロボット２におけるロボット状態（出力データ６）を導出する学習を済ませた第１学習モデル５１Ａを含む。また、学習モデル５１は、ロボット駆動装置１Ｂで用いる学習モデルとして、推定部５で推定されたロボット状態から、当該ロボット状態に対応する作動状態にロボット２を制御するための作動データ８を導出する学習を済ませた第２学習モデル５１Ｂを含む。学習モデル５１は、例えば、学習済みのニューラルネットワークを規定するモデルであり、ニューラルネットワークを構成するノード（ニューロン）同士の間の結合の重み（強度）の情報の集合として表現される。

　第１学習モデル５１Ａ及び第２学習モデル５１Ｂを含む学習モデル５１は、学習処理部５２（図２９Ａ、図２９Ｂ）の学習処理により生成される。

　学習処理部５２は、第１学習モデル５１Ａを生成するために、ロボット状態３により生じる圧力刺激で変化する導電性ウレタン２２における電気特性（入力データ４）を用いて学習処理を行う（図２９Ａ）。すなわち、ロボット状態３をラベルとして導電性ウレタン２２における電気抵抗を時系列に測定した大量のデータを学習データとする。具体的には、学習データは、電気抵抗値（入力データ４）を含んだ入力データと、その入力データに対応するロボット状態３を示す情報（出力データ６）と、のセットを大量に含む。ここでは、導電性ウレタン２２の電気抵抗値（入力データ４）の各々に測定時刻を示す情報を付与することで時系列情報が対応付けられる。この場合、ロボット状態３として定まる期間について、導電性ウレタン２２における時系列の電気抵抗値のセットに測定時刻を示す情報を付与して時系列情報を対応付けてもよい。

　また、学習処理部５２は、第２学習モデル５１Ｂを生成するために、導電性ウレタン２２の電気特性から推定されるロボット状態６ｘにより変化するロボット２の作動状態９を用いて学習処理を行う（図２９Ｂ）。すなわち、ロボット２の作動状態９をラベルとして導電性ウレタン２２の時系列の電気特性から推定されたロボット状態６ｘに対応する作動状態にロボット２を作動するための作動データを測定した大量のデータを学習データとする。具体的には、学習データは、ロボット状態６ｘを示す情報（出力データ６）を含んだ入力データと、その入力データに対応する作動データ８、すなわちロボット状態６ｘに対応してロボット２を作動させる作動データ８（出力データ）と、のセットを大量に含む。作動データ８は、ロボット２のバーツを駆動部１１９により駆動するためのデータである。

　第１学習モデル５１Ａを生成するための学習データの一例には、ロボット状態に対応するデータが挙げられる。ロボット状態には、１又は複数パーツの組み合わせによって示される静的な姿勢を示す姿勢状態、及び動的な動きを示す挙動状態等の状態が適用される。例えば、ロボット２の少なくとも一部のパーツによる所定の姿勢や動き等の挙動となるように駆動部１１９の駆動制御を行い、そのときの電気抵抗値を検出して、ロボット状態（ロボット状態値）と対応付けて学習データとすればよい。ロボット２は、人物から少なくとも一部のパーツに対して圧力等のエネルギが与えられることによって外郭部２７が変形して、導電性ウレタン２２の電気抵抗値が変化するので、時系列の電気抵抗値を検出して、ロボット状態（ロボット状態値）と対応付けて学習データとすることが可能となる。

　また、第２学習モデル５１Ｂを生成するための学習データの一例には、推定されたロボット状態に対して、ロボット２が次に作動する作動状態を示すデータが挙げられる。作動状態には、ロボットが、推定されたロボット状態に応じたメッセージを報知する処理等のデータが適用される。また、作動状態には、人物からロボット２に対して与えられた圧力等のエネルギに対して応答する状態も適用可能である。例えば、ロボット２に与えられるエネルギが予め定められた閾値より大きく、この後にロボット２のバランスが崩れるようなロボット状態では、ロボット２は、バランスを維持する作動状態に推移する応答をすることが好ましい。具体的には、胴体部２２０に、予め定められた閾値（バランス維持可能に定めた値）より大きいエネルギでユーザが抱き着いた際のロボット状態に対する作動状態に推移すればよい。この場合、ロボット２は、バランスを維持する作動状態として、与えられたエネルギを抑制するへく、ロボット２が移動したり、エネルギが与えられた該当パーツ又は他のパーツを移動させたり変形させてバランスを維持する作動状態に移行すればよい。

　学習処理部５２は、図示しないＣＰＵを含むコンピュータを含んで構成可能であり、学習データ収集処理及び学習処理を実行する。図３０に、図示しないＣＰＵが実行する学習データ収集処理の一例を示す。学習処理部５２は、ステップＳ１００で、ロボット状態を取得し、ステップＳ１０２で、導電性ウレタン２２の電気抵抗値を時系列に取得する。次のステップＳ１０４では、取得した時系列の電気抵抗値にロボット状態３を示すデータ（ロボット状態値）をラベルとして付与した物理量のセットを記憶する。次のステップＳ１０５Ａでは、ロボット状態への対応を示す情報(作動状態値）を取得する。作動状態値は、ロボット２のバーツを駆動するための駆動値を示す作動データ８が適用される。次のステップＳ１０５Ｂでは、取得したロボット状態への対応を示す情報(作動状態値）にロボット状態３を示すデータ（ロボット状態値）をラベルとして付与して、対応セットとして記憶する。なお、ロボット状態への対応を示す情報(作動状態）が存在しない場合は、ステップＳ１０５Ａ及びステップＳ１０５Ｂの処理を省略（スキップ）してもよい。学習処理部５２は、これらロボット状態値、及び導電性ウレタン２２の電気抵抗値のセットが予め定めた所定数、又は予め定めた所定時間に達するまで（ステップＳ１０６で、肯定判断されるまで否定判断し）、上記処理を繰り返す。

　これにより、学習処理部５２は、ロボット状態３毎に、導電性ウレタン２２における電気抵抗値を時系列に取得し、記憶することが可能となり、記憶されたロボット状態毎の時系列の導電性ウレタン２２の電気抵抗値のセットが学習データとなる。記憶されたロボット状態毎の時系列の導電性ウレタン２２の電気抵抗値のセットは、第１学習モデル５１Ａの学習データの一例である。また、学習処理部５２は、ロボット状態３毎に、ロボット状態への対応を示す情報(作動状態値）を取得し、記憶することが可能となり、記憶されたロボット状態毎の作動状態値の対応セットも学習データとなる。記憶されたロボット状態毎の作動状態値の対応セットは、第２学習モデル５１Ｂの学習データの一例である。

　上述したロボット状態のうち、ロボット２に人物が接触等の圧力刺激を伴って付勢した場合、人物が外郭部２７に接触する付勢状態から付勢力（押圧力）が大きくなるのに従って、電気特性（電気抵抗値）が大きく変化する。従って、時系列の電気特性が接触検出用に予め定めた閾値を超えることを検出することで、少なくとも人物が外郭部２７に接触した付勢状態を検出可能である。よって、少なくとも人物が外郭部２７に接触した付勢状態を検出するロボット状態を推定可能に学習処理を実行するのであれば、接触した付勢状態を特定する付勢力（押圧力）に対応する時系列の電気特性を学習データとすればよい。

　従って、上述したようにロボット状態に応じてロボット２における圧力刺激が変化し、その圧力刺激の変化に対応する電気特性を時系列に取得することで、ロボット状態に時系列の電気特性を対応付けて記憶することが可能となる。当該時系列の電気特性およびロボット状態を示すロボット状態値とのセットを学習データとすることが可能となる。

　ところで、ロボット状態のうち、ロボット２に人物の付勢による圧力刺激が与えられた際に、ロボット２が所定の作動状態に移行することが好ましい場合がある。例えば、人物が外郭部２７に与える付勢力（押圧力）が大きくなるのに従って、電気特性（電気抵抗値）が大きく変化する。従って、時系列の電気特性が所定の作動状態への移行用に予め定めた閾値を超えることを検出することで、所定の作動状態に移行するための人物による外郭部２７への付勢状態を検出可能である。よって、所定の作動状態に移行するための付勢状態を検出するロボット状態を推定可能に学習処理を実行するのであれば、付勢状態を特定する付勢力（押圧力）に対応する時系列の電気特性を学習データとすればよい。

　図３１に、ロボット２の胴体部２２０における電気特性の概念図を一例として示す。図３１は、所定の電気特性（例えば図１９に示す電気特性）を基にして、ロボット２の胴体部２２０に対して、異なる付勢力（ピーク値Ｐ１１～Ｐ１７の押圧力）でのユーザの抱き着きについて技術的に予測可能な導電性ウレタン２２の電気特性の概念図である。図中、ピーク値Ｐ１１、Ｐ１３、Ｐ１４、Ｐ１７は、ユーザがロボット２の胴体部２２０への抱き着きに至らないロボット状態に対応する電気特性の概念である。また、ピーク値Ｐ１２、Ｐ１６は、胴体部２２０への抱き着きによるロボット状態に対応する電気特性の概念である。さらに、ピーク値Ｐ１５は、ロボット２がバランスを崩す程度に胴体部２２０へのユーザの抱き着きによるロボット状態に対応する電気特性の概念である。よって、学習処理部５２は、接触した付勢状態を特定する付勢力（押圧力）に対応する時系列の電気特性を学習データとして学習することが可能である。

　図３１に概念図として示す導電性ウレタン２２の時系列の電気特性（各ピーク値Ｐ１１～Ｐ１７を含む前後の電気特性）の各々が、ロボット２の胴体部２２０へのユーザの付勢力（押圧力）に応じたロボット状態における特徴パターンとして捉えることが可能である。時系列の電気特性は、胴体部２２０がユーザにより押圧されると、電気抵抗値が急激に上昇し、押圧が解除（ユーザが離間）されると電気抵抗値が徐々に低下するパターンが、特徴パターンとして現れると考えられる。また、ピーク値Ｐ１２、Ｐ１６は、ピーク値Ｐ１１、Ｐ１３，Ｐ１４，Ｐ１７と比べて大きい電気抵抗値である。このため、ピーク値Ｐ１１、Ｐ１３，Ｐ１４，Ｐ１７を超える電気抵抗値を閾値ｔｈ１に定めることで、ユーザが胴体部２２０の外郭部２７に接触した付勢状態（抱き着いた状態）を検出することも可能である。

　一方、ピーク値Ｐ１５は、ピーク値Ｐ１２、Ｐ１６に比べてさらに大きい電気抵抗値に推移すると考えられる。このため、ピーク値Ｐ１２、Ｐ１６を超える電気抵抗値を閾値ｔｈ２に定めることで、ロボット２がバランスを崩す程度に胴体部２２０にユーザが抱き着いた状態を検出することも可能である。例えば、ロボット２は、閾値ｔｈ２を超えた電気抵抗値によるロボット状態になることが予測されるときに、バランスを維持する作動状態として、与えられたエネルギを抑制するべく、ロボット２が移動してバランスを維持する作動状態に移行する処理を実行してもよい。また、ロボット２は、バランスを維持する作動状態として、エネルギが与えられた該当パーツ又は他のパーツの移動及び変形によってバランスを維持する作動状態に移行する処理を実行してもよい。

　次に、上述した学習データの一例を表で示す。表９は、第１学習モデル５１Ａを生成するためのロボット状態に関する学習データとして、時系列の電気抵抗値データ（ｒ）とロボット状態値とを対応付けたデータの一例である。表１０から表１２は、第２学習モデル５１Ｂを生成するための作動状態に関する学習データとして、ロボット状態値と作動状態値とを対応付けたデータの一例である。

　表９に示す例は、ロボット状態を示すロボット状態値を、３つの指標を含むデータとして示す一例である。第１指標は、入力する電気特性の対象部位をパーツとして示すデータである。第２指標は、入力する電気特性に対応するロボット状態を推定状態として示すデータである。第３指標は、入力する電気特性に対応するロボット状態で示される圧力が与えられる状態の大きさ（強度）や性質などの物理量を感度として示すデータである。表１に示す例は、パーツ、推定状態、及び感度の各指標をロボット状態値として入力する電気特性に対応付けた学習データの一例である。

　表１０に示す例は、ロボット２の作動状態として、表示部２１１等へのデータの表示を、ロボット状態への対応とする側面の学習データの一例である。表１０では、ロボット状態は、上述した３つの指標により示し、ロボット状態を推定する処理（一次処理）による推定結果として表記している。また、作動状態の欄では、作動状態の情報(作動状態値）として、電気特性から推定されたロボット状態に対して実行されるロボット２における処理を対応処理とし、対応処理で用いるデータを作動データとして示す一例である。

　表１１に示す例は、ロボット２の作動状態として、一次処理で推定されたロボット状態からさらに詳細な推定を実行することを、ロボット状態への対応とする側面の学習データの一例である。表１１では、接触により推定された接触対象の平滑な状態であることを示すロボット状態から、さらにロボット２の手を駆動部１１９への駆動値で微小移動させたり摺動させることで、詳細な推定を実行可能にするようにロボット２を作動させることを示している。

　表１２に示す例は、ロボット２の作動状態として、一次処理で推定されたロボット状態に対して、ロボットを作動させることを、ロボット状態への対応とする側面の学習データの一例である。表１２では、ロボット状態に対する対応処理としてロボット２を作動させる駆動部１１９の駆動値を作動データ８としてロボット２を作動させることを示している。

　学習処理部５２は、上記と同様に、演算器５６で演算された誤差に基づいて、ノード間の結合の重みパラメータをチューニングする、生成器５４の学習を行う。具体的には、生成器５４における入力層５４０と中間層５４２とのノード間の結合の重みパラメータ、中間層５４２内のノード間の結合の重みパラメータ、および中間層５４２と出力層５４４とのノード間の結合の重みパラメータの各々を例えば勾配降下法や誤差逆伝搬法等の手法を用いて、生成器５４にフィードバックする。すなわち、学習データの出力データ６を目標として、生成出力データ６Ａと学習データの出力データ６との誤差を最小化するように全てのノード間の結合を最適化する。

　第１学習モデル５１Ａは、上述した学習処理部５２の学習処理により生成される。第１学習モデル５１Ａは、学習処理部５２による学習結果のノード間の結合の重みパラメータ（重み又は強度）の情報の集合として表現される。

　なお、第２学習モデル５１Ｂについては、上述した第１学習モデル５１Ａと同様のため、詳細な説明を省略する。

　図３２に学習処理の流れの一例を示す。学習処理部５２は、ステップＳ１１０で、ロボット状態を示す情報をラベルとした入力データ４（時系列の電気抵抗）、すなわち、ロボット状態値及び電気抵抗値のセットの学習データを取得する。学習処理部５２は、ステップＳ１１２で、学習データを用いて学習モデル５１を生成する。すなわち、上記のようにして多数の学習データを用いて学習した学習結果のノード間の結合の重みパラメータ（重み又は強度）の情報の集合を得る。そして、ステップＳ１１４で、学習結果のノード間の結合の重みパラメータ（重み又は強度）の情報の集合として表現されるデータを学習モデル５１に含まれる第１学習モデル５１Ａとして記憶する。

　次に、学習処理部５２は、ステップＳ１２０で、ロボット状態値及び電気抵抗値のセットの学習データに対応する作動状態を示す作動データ８（作動状態値）が記憶されているか否かを判断する。ステップＳ１２０で肯定判断の場合はステップＳ１２２へ処理を移行し、否定判断の場合は本処理ルーチンを終了する。

　ステップＳ１２２では、学習処理部５２は、ロボット状態を示す情報（ロボット状態値）をラベルとした作動状態を示す作動データ８（作動状態値）、すなわち、ロボット状態及び作動状態を示す情報の対応セットの学習データを取得する。学習処理部５２は、ステップＳ１２４で、対応セットの学習データを用いて学習モデル５１を生成する。すなわち、上記のようにして多数の学習データを用いて学習した学習結果のノード間の結合の重みパラメータ（重み又は強度）の情報の集合を得る。そして、ステップＳ１２６で、学習結果のノード間の結合の重みパラメータ（重み又は強度）の情報の集合として表現されるデータを学習モデル５１に含まれる第２学習モデル５１Ｂとして記憶する。

　そして、ロボット制御装置１では、以上に例示した手法により生成した学習済みの生成器５４（すなわち、学習結果のノード間の結合の重みパラメータの情報の集合として表現されるデータ）を学習モデル５１として用いる。十分に学習した学習モデル５１を用いれば、ロボット２、すなわち外郭部２７に配置された導電性ウレタン２２における時系列の電気抵抗値からロボット状態を同定すること、及び当該ロボット状態に対する作動状態を同定することも不可能ではない。

　なお、学習処理部５２による処理は、本開示の導出部で用いる学習モデルを生成する処理の一例である。また、ロボット制御装置１は、本開示の導出部および制御部の一例である。導出部７は、本開示の導出部の一例である。駆動部１１９は、本開示の制御部でロボットを制御する際のロボットを作動する機能部の一例である。

　また、上述したように、導電性ウレタン２２は、導電性ウレタン２２の変形に関するデータを貯留するリザーバとして扱うことが可能である。すなわち、ロボット状態推定装置１Ａを含むロボット制御装置１は、物理的なＰＲＣと呼ばれるネットワークモデル（ＰＲＣＮ）に、導電性ウレタン２２を適用することが可能である（図１６）。よって、学習処理では、推定層を学習すればよい。

　上述のロボット制御装置１は、上記実施形態と同様に、コンピュータに上述の各機能を表すプログラムを実行させることにより実現可能である（図１７）。

　次に、コンピュータにより実現されたロボット制御装置１におけるロボット制御処理について説明する。

　図３３に、コンピュータ本体１００において、実行される制御プログラム１０８Ｐによるロボット制御処理の流れの一例を示す。
　図３３に示すロボット制御処理は、コンピュータ本体１００が電源投入されると、ＣＰＵ１０２により実行される。すなわち、ＣＰＵ１０２は、制御プログラム１０８Ｐを補助記憶装置１０８から読み出し、ＲＡＭ１０４に展開して処理を実行する。本実施形態では、ロボット制御処理は、ロボット２のロボット状態を推定する推定処理と、推定されたロボット状態に応じたロボット制御に関する処理とを含む。

　まず、ＣＰＵ１０２は、ロボット２のロボット状態を推定する推定処理を実行する。具体的には、ＣＰＵ１０２は、ステップＳ２００で、補助記憶装置１０８の学習モデル１０８Ｍから学習モデル５１（すなわち、第１学習モデル５１Ａ）を読み出し、ＲＡＭ１０４に展開することで、学習モデル５１（すなわち、第１学習モデル５１Ａ）を取得する。具体的には、学習モデル５１に含まれる第１学習モデル５１Ａとして表現された重みパラメータによるノード間の結合となるネットワークモデル（図１４、図１６参照）を、ＲＡＭ１０４に展開する。よって、重みパラメータによるノード間の結合が実現された第１学習モデル５１Ａが構築される。

　次に、ＣＰＵ１０２は、ステップＳ２０２で、導電性ウレタン２２に与えられた圧力刺激によるロボット状態の推定対象となる未知の入力データ４（電気抵抗）を、通信部１１４を介して時系列に取得する。

　次に、ＣＰＵ１０２は、ステップＳ２０４で、ステップＳ２００で取得した学習モデル５１（すなわち、第１学習モデル５１Ａ）を用いて、ステップＳ２０２において取得した入力データ４（電気抵抗）に対応する出力データ６（未知のロボット状態）を推定する。

　次に、ＣＰＵ１０２は、ステップＳ２０４で推定されたロボット状態に応じたロボット制御に関する処理を実行する。具体的には、ステップＳ２０６で、推定結果の出力データ６（ロボット状態を示すロボット状態値）を出力する出力制御を行う。この出力制御には、出力データ６を通信部１１４を介して外部に出力する処理、出力データ６に対応する信号をスピーカ１１８に出力する処理、及び出力データ６に対応するメッセージデータを表示部２１１に出力する処理等の少なくとも１処理が適用可能である。なお、ステップＳ２０６の処理は、後述するステップＳ２１２の処理に含めてもよい。

　次に、ＣＰＵ１０２は、ステップＳ２１０で、学習モデル５１（すなわち、第２学習モデル５１Ｂ）を用いて、推定された出力データ６（未知のロボット状態）への対応を示す情報であるロボット２の作動状態を示す作動状態値（作動データ８）を導出する。例えば、作動状態値（作動データ８）は、ロボット２のバーツを駆動するための駆動値を示すデータが導出される。

　次に、ＣＰＵ１０２は、ステップＳ２１２で、導出されたロボット状態への対応を示す情報(作動状態値）を用いて、ロボット２が作動状態に移行するように作動状態に関する処理を実行することでロボット２の制御を行って、本処理ルーチンを終了する。具体的には、ＣＰＵ１０２は、駆動部１１９へ、ロボット２のバーツを駆動するための駆動値（作動データ８）を出力する制御を行う。これによって、ロボット２は、駆動部１１９に入力されたロボット２において該当するバーツが駆動され、ロボット２が作動状態に移行される。

　なお、図３３に示す制御処理は、本開示のロボット制御方法で実行される処理の一例である。また、図３３に示す制御処理をコンピュータに実行させるためのプログラムは、本開示のロボット制御プログラムの一例である。

　また、ロボット状態への対応を示す作動状態にロボット２を作動させることが可能であり、特殊装置を用いることなく簡単な構成で、導電性ウレタン２２の電気特性から推定されるロボット状態を利用して、ロボットの作動状態を制御することが可能になる。

　本実施形態に係るロボット制御装置１では、上述した学習処理によって学習された学習モデル５１を用いることによって、導電性ウレタン２２の電気特性を入力することで、電気特性に対応した様々なロボット状態を推定でき、そのロボット状態に対する対応としてロボット２を制御可能であることを確認した。

［第５実施形態］
　次に、本開示の第５実施形態を説明する。第５実施形態は、第１実施形態から第４実施形態の少なくとも１実施形態と同様の構成のため、同一部分には同一符号を付して詳細な説明を省略する場合がある。

　ところで、例えば手に装着するグローブ及びロボットのハンド等のような把持部材が把持対象物を把持した際に生じる形状変化から把持対象物の滑り状態を検出する場合、把持部材に専用の検出器を設けて把持部材の形状変化から滑り状態を検出する他なかった。また、把持対象物を把持した際に生じる滑り状態を検出するのは、複雑かつ大掛かりな装置が要求されるため、実用的ではなかった。

　本開示は、特殊な検出装置を用いることなく、導電性を有する柔軟材料を備えた把持部材の電気特性を利用して、把持部材が把持対象物を把持した際の滑り状態を推定可能な推定装置、推定方法、推定プログラム、及び学習モデル生成装置を提供する。

　上記実施形態で説明したように、導電性ウレタン２２の電気抵抗値から未知の付与側の状態を推定可能である。具体的には、推定装置では、付与側の状態により導電性ウレタン２２に与えられた刺激に応じて変化する入力データ４（電気特性）から、人物等の付与側の状態を推定することが可能となる。すなわち、特殊な装置や大型の装置を用いたり柔軟部材の変形を直接計測することなく、人物等の付与側の状態を推定することが可能となる。

　本開示の推定装置としての本実施形態に係る推定装置は、上述したロボット状態推定装置１と同様の構成のため、本実施形態では、上述したロボット状態推定装置１を推定装置１と称して推定装置１の構成については詳細な説明を省略する。

＜滑り状態の推定＞

　本実施形態では、上述した導電性ウレタン２２を手袋に適用する場合について説明する。導電性ウレタン２２を手袋に適用した場合、手袋を装着した手による把持対象物を把持する動きに応じて手袋の部分的な圧縮といった圧力刺激が生じる。また、手が把持対象物を把持する把持力、把持対象物の把持の仕方、手袋の素材、把持対象物の重さ、及び把持対象物の素材等によって、把持対象物の滑りやすさを示す滑り状態は異なる。滑り状態は、導電性ウレタン２２に加わる圧力の時系列変化に基づいて推定することが可能である。そのため、推定装置１によって、導電性ウレタン２２の時系列の電気抵抗値から手袋を装着した手により把持対象物を把持した際の滑り状態が推定可能となる。説明の便宜上、以降では、手袋Ｇをはめる人物を、単に「人物」ということにする。

　ここで、滑り状態は、例えば把持部材の一例としての手袋を装着した手と把持対象物との摩擦力分布に関する状態を含む。導電性ウレタン２２を含む手袋と把持対象物との摩擦力の分布が分かれば把持対象物が手袋を装着した手から滑り落ちるか否かを推定することができる。従って、滑り状態は、把持対象物が滑り落ちる度合いを含む。なお、滑り状態は、把持部材と把持対象物との滑りの度合いを示すものであれば、これらに限られるものではない。

　図３４は、導電性ウレタン２２を対象物２としての手袋Ｇに適用した一例を示す図である。すなわち、圧力刺激が与えられる対象物２は手袋Ｇということになる。ここで、手袋Ｇは、手の全てを覆うものに限定されず、例えば、指先の部分を覆わないようなものであってもよいし、又、各指に分かれている五本指型の手袋Ｇではなく、各指に分かれていないミトン型の手袋Ｇであってもよい。

　図３５に示すように、人物は導電性ウレタン２２を含む手袋Ｇを装着した手Ｈで把持対象物Ｂを把持する。なお、手袋Ｇに導電性ウレタン２２が含まれるとは、導電性ウレタン２２と手袋Ｇを構成する部材２１（この場合、綿や化学繊維）との配置例が、図４に示したような導電性ウレタン２２と部材２１の配置例の何れかを満たすことをいう。

　図３４に示すように、導電性ウレタン２２は、手袋Ｇと略同一の形状であり、例えば手袋Ｇの内側全体に設けられる。また、手袋Ｇは、検出ユニット７８を備える。

　図３６に示すように、検出ユニット７８は、導電性ウレタン２２に設けられた複数の検出点７５が接続された電気特性検出部７６、通信部８０、蓄電部８２、及び発電部８４を備えている。なお、検出点７５の位置及び数は、圧力刺激による電気特性の変化が手袋Ｇの全体で検出可能なように、手袋Ｇのサイズ及び形状に応じて適宜設定される。

　電気特性検出部７６は、検出点７５から入力される電気特性を検出し、検出結果を通信部８０に出力する。

　通信部８０は、スマートフォン等の携帯端末装置３０と通信を行い、電気特性検出部７６の検出点７５から得られる電気特性を表す物理量の検出結果を携帯端末装置３０に送信する。通信部８０は、例えば、Ｗｉ－Ｆｉ（登録商標）やＢｌｕｅｔｏｏｔｈ（登録商標）等の近距離無線通信により、携帯端末装置３０と通信を行う。

　蓄電部８２は、電気特性検出部７６が電気特性を検出するための電力、及び通信部８０が携帯端末装置３０と通信するための電力を供給する。蓄電部８２は、例えば、各種充電電池や、キャパシタ等が適用され、発電部８４による発電電力により充電される。

　発電部８４は、種々の周知の方法で発電し、発電電力を蓄電部８２に供給することにより、蓄電部８２を充電する。例えば、コイルと磁石を用いて、手袋Ｇの揺動に応じて磁石がコイル中を相対移動することにより発電してもよい。或いは、光、熱、圧力、振動などのエネルギーを電力に変換する発電素子等を用いて発電してもよい。

　一方、携帯端末装置３０は、上述のコンピュータ本体１００、通信部１１４、及び操作表示部１１６の構成を備える。

　携帯端末装置３０は、推定装置１として機能し、コンピュータ本体１００が、学習済みの学習モデル５１を用いて、手袋Ｇに設けた導電性ウレタン２２における電気特性から手袋Ｇを装着した手Ｈで把持対象物Ｂを把持した際の滑り状態を推定する。

　通信部１１４は、手袋Ｇの通信部８０と通信を行い、電気特性検出部７６の検出点７５から得られる電気特性を表す物理量の検出結果を手袋Ｇから取得する。通信部１１４は、例えば、Ｗｉ－Ｆｉ（登録商標）やＢｌｕｅｔｏｏｔｈ（登録商標）等の近距離無線通信により、携帯端末装置３０と通信を行う。

　操作表示部１１６は、出力部の一例に対応し、コンピュータ本体１００によって推定した、手袋Ｇを装着した手Ｈで把持対象物Ｂを把持した際の滑り状態、例えば摩擦力分布等を表示する。これにより、把持対象物Ｂが滑り落ちそうか否かを把握することができる。

　携帯端末装置３０における推定処理は、学習済みの学習モデル５１を用いて、手袋Ｇを装着した手Ｈで把持対象物Ｂを把持した際の未知の滑り状態として、例えば摩擦力分布等を推定し、出力する。これにより、特殊な装置や大型の装置を用いたり手袋Ｇに含まれる導電性ウレタン２２の変形を直接計測したりすることなく、手袋Ｇを装着した手Ｈで把持対象物Ｂを把持した際の滑り状態を同定することが可能となる。従って、導電性ウレタン２２における電気特性から手袋Ｇを装着した手Ｈで把持対象物Ｂを把持した際の滑り状態を推定するために、携帯端末装置３０には、導電性ウレタン２２における電気特性から手袋Ｇを装着した手Ｈで把持対象物Ｂを把持した際の滑り状態を推定する学習モデル５１が補助記憶装置１０８に記憶される。

　次に、手袋Ｇを装着した手Ｈで把持対象物Ｂを把持した際の滑り状態情報を推定するための学習モデル５１を生成する学習処理について説明する。

　本実施形態に係る学習モデル生成装置の学習処理部５２は、図１２に示した学習処理部と同様に、学習データ収集処理において、手袋Ｇを装着した手Ｈで把持対象物Ｂを把持した際の滑り状態を表す状態データ３をラベルとする導電性ウレタン２２における電気抵抗値を時系列に測定した大量の入力データ４を学習データとして収集する。

　具体的には、学習データ収集処理では、手袋Ｇを装着した手Ｈで把持対象物Ｂを把持することにより圧力刺激が与えられた手袋Ｇに含まれる導電性ウレタン２２の電気特性（例えば、電気抵抗値）を手袋Ｇに取り付けられた電気特性検出部７６から時系列に取得する。次に、取得した時系列の電気特性である入力データ４に状態データ３を、滑り状態を示すラベルとして付与し、状態データ３と入力データ４とを組み合わせた複数の学習データを準備する。

　以降では、手袋Ｇに含まれる導電性ウレタン２２の電気特性の一例として電気抵抗値を用いた説明を行うが、導電性ウレタン２２の電気特性として電流値又は電圧値を用いてもよいことは前述した通りである。

　手袋Ｇを装着した手Ｈで把持対象物Ｂを把持した際の滑り状態情報の推定に用いる学習データとしては、例えば前述した表１に示すデータセットが用いられる。導電性ウレタン２２を手袋Ｇに適用した場合における表１のデータセットは、手袋Ｇから得られた時系列の電気抵抗値データ（ｒ）と、手袋Ｇを装着した手Ｈで把持対象物Ｂを把持した際の滑り状態を示す状態データ（Ｒ）とを対応付けたデータセットである。

　この場合、上述した状態Ｒ１～Ｒｋ・・・は、手袋Ｇを装着した手Ｈに対する滑り状態Ｒ１～Ｒｋ・・・である。滑り状態の例としては、前述したように、摩擦力分布及び把持対象物Ｂが滑り落ちる度合い等が挙げられる。

　学習処理部５２は、このような時系列の電気抵抗値データ（ｒ）と、手袋Ｇを装着した手Ｈに対する滑り状態を示す状態データ（Ｒ）と、が対応付けられた学習データを用いて、前述した学習モデル生成処理により学習モデル５１を生成する。

　推定装置１は、導電性ウレタン２２の時系列の電気抵抗値データによって表される特徴パターンと、手袋Ｇを装着した手Ｈで把持対象物Ｂを把持した際の滑り状態との関連性を機械学習した滑り状態に関する学習モデル５１を用いて図７に示した推定処理を実行することによって、導電性ウレタン２２における時系列の未知の電気抵抗値データから、手袋Ｇを装着した手Ｈで把持対象物Ｂを把持した際の滑り状態を推定する。

　具体的には、図１８に示す処理と同様の処理を行う、すなわち、ステップＳ２００と同様に、推定装置１のＣＰＵ１０２は、手袋Ｇを装着した手Ｈで把持対象物Ｂを把持した際の滑り状態に関する学習モデル５１を取得し、ステップＳ２０２と同様に、ＣＰＵ１０２は、滑り状態の推定対象となる手袋Ｇに設けられた電気特性検出部７６から送信された時系列の電気抵抗値データを入力データ４として取得する。

　なお、取得する入力データ４は、推定処理の実行期間中に手袋Ｇからリアルタイムに得られた入力データ４であっても、推定処理を実行する前に予め得られていた入力データ４であってもよい。

　次に、ステップＳ２０４と同様に、ＣＰＵ１０２は、取得した学習モデル５１に、取得した入力データ４を入力し、学習モデル５１から出力された出力データ６を取得する。ＣＰＵ１０２は、状態データ３のうち、出力データ６に最も近い状態データ３と対応付けられている滑り状態を、手袋Ｇを装着した手Ｈで把持対象物Ｂを把持した際の滑り状態として推定する。

　次に、ステップＳ２０６と同様に、ＣＰＵ１０２は、推定した手袋Ｇを装着した手Ｈで把持対象物Ｂを把持した際の滑り状態を示す滑り状態情報を出力する。例えば、摩擦力分布を操作表示部１１６に表示させたり、把持対象物Ｂが滑り落ちる度合いを操作表示部１１６に表示させたりする。

　このように、本実施形態に係る推定装置１によれば、導電性ウレタン２２を手袋Ｇに適用し、手袋Ｇを装着した手Ｈで把持対象物Ｂを把持することにより発生する圧力刺激によって変化する導電性ウレタン２２の時系列の電気特性と、手袋Ｇを装着した手Ｈで把持対象物Ｂを把持した際の滑り状態を示す滑り状態情報との関連性を予め機械学習した学習モデル５１に、手袋Ｇを装着した手Ｈで把持対象物Ｂを把持した際の滑り状態に対応した時系列の未知の電気特性を入力することで得られる出力データ６により、手袋Ｇを装着した手Ｈで把持対象物Ｂを把持した際の滑り状態を推定する。

　したがって、本実施形態に係る推定装置１によって、例えば、上記で説明した手袋Ｇを装着した手Ｈで把持対象物Ｂを把持した際の滑り状態を推定することが可能となり、推定した滑り状態を操作表示部１１６に表示することが可能となる。これにより、把持対象物Ｂを適切な把持状態で把持するよう促すことができる。

　ところで、手袋Ｇを、自動で把持状態を調整可能な構成とし、推定した滑り状態情報に基づいて、把持状態を自動で制御するようにしてもよい。ここで、把持状態とは、把持力及び把持の仕方の少なくとも１つを含む。把持の仕方とは、どのように把持対象物を把持するかを表し、例えば把持対象物を把持する際の手袋Ｇの形状を含む。この場合、図３７に示すように、手袋Ｇは、手袋Ｇの把持状態を調整するための駆動部７９を備えた構成とする。駆動部７９は、図３８に示すように、通信部８０を介して携帯端末装置３０と通信可能である。

　携帯端末装置３０のコンピュータ本体１００は制御部として機能し、推定した滑り状態情報に基づいて、把持状態を制御するための制御信号を、通信部１１４を介して手袋Ｇに送信する。これにより、手袋Ｇでは、通信部８０を介して携帯端末装置３０からの制御信号を受信し、受信した制御信号に基づいて駆動部７９が手袋Ｇの把持状態を制御する。

　図３９には、手袋Ｇの把持状態を制御する場合の制御処理のフローチャートを示す。図３９の制御処理は、図１８の推定処理にステップＳ２０８が追加されたものであり、ステップＳ２００～Ｓ２０６の処理は図１８と同一であるので説明は省略する。

　ステップＳ２０８では、ステップＳ２０４で推定された滑り状態に基づいて、手袋Ｇの把持状態を制御する。例えば、推定された滑り状態が、把持対象物Ｂが滑り落ちる状態を示している場合は、把持対象物が滑り落ちないよう把持状態の変更を指示する制御信号を送信する。これにより、手袋Ｇの駆動部７９は、把持対象物が滑り落ちないように手袋Ｇの把持状態を変更する。すなわち、例えば把持力を強くしたり、把持対象物の把持の仕方を変更したりする。一方、推定された滑り状態が、把持対象物Ｂが滑り落ちない状態を示している場合は、把持状態を維持することを指示する制御信号を送信する。これにより、手袋Ｇの把持対象物Ｂの把持状態を自動で制御することができる。このため、例えば手の力が弱くなっている人物が把持対象物Ｂを把持する動作を支援することが可能となる。

　なお、本実施形態では、把持部材が手袋Ｇである場合について説明したが、ロボットのハンドでもよい。例えば図４０に示すように、ロボットＲＢのハンドＨＤに導電性ウレタン２２を設けた構成とする。この場合、ハンドＨＤが把持対象物Ｂを把持した際の滑り状態が、把持対象物Ｂが滑り落ちる状態を示している場合は、把持対象物Ｂが滑り落ちないようにハンドＨＤの把持状態を変更する。一方、ハンドＨＤが把持対象物Ｂを把持した際の滑り状態が、把持対象物Ｂが滑り落ちない状態を示している場合は、把持対象物Ｂの把持状態を維持する。このように、把持対象物Ｂが滑り落ちないように把持状態が自動で制御されるため、把持対象物Ｂが滑り落ちてしまうのを防ぐことができる。

［本開示の技術に係る態様］
　上述したように、本開示の技術は、特殊な検出装置を用いることなく、導電性を有する柔軟材料の電気特性を利用して、様々な状態を推定可能である。また、本開示の技術は、コンピュータを利用したソフトウェア構成やハードウェア構成により各種の処理が実現されることを含むので、以下の態様を含む。

　本開示の第１態様は、
　導電性を有し、かつ与えられた圧力の変化に応じて電気特性が変化する柔軟材料であって、可動体の基体から屈曲可能な突出部の少なくとも一部を覆って配置されるかまたは覆うことが可能な前記柔軟材料に予め定められた複数の検出点間の電気特性を検出する検出部と、
　前記柔軟材料に圧力を与えた際の時系列の電気特性と、前記柔軟材料に圧力を与える付与刺激状態を示す付与刺激状態情報とを学習用データとして用いて、前記時系列の電気特性を入力とし、前記付与刺激状態情報を出力するように学習された学習モデルに対して、前記検出部で検出された時系列の電気特性を入力し、入力した時系列の電気特性に対応する付与刺激状態を示す付与刺激状態情報を推定する推定部と、
　を含む推定装置である。

　第２態様は、第１態様の推定装置において、
　前記電気特性は、体積抵抗であり、
　前記ロボット状態は、ロボットへの人物の接触を含む付勢状態を含み、
　前記学習モデルは、検出された電気特性に対応する人物の付勢状態を示す情報を前記ロボット状態情報として出力するように学習される。

　第３態様は、第１態様又は第２態様の推定装置において、
　前記柔軟材料は、繊維状及び網目状の少なくとも一方の構造、又は内部に微小な空気泡が複数散在する構造のウレタン材の少なくとも一部に導電性が付与された材料を含む。

　第４態様は、第１態様から第３態様の何れか１態様の推定装置において、
　前記柔軟材料は、前記ロボットの骨格の周囲に配置され、前記ロボットの骨格に近づくに従って、硬さが硬くなる材料で形成されるか、又は前記ロボットの骨格に近づくに従って、硬さが硬くなるように、硬さが異なる複数の材料を積層して形成される。

　第５態様は、第１態様から第４態様の何れか１態様の推定装置において、
　前記柔軟材料は、前記ロボットの複数の異なる部位に配置され、
　前記検出部は、前記複数の異なる部位の各々における複数の検出点の間の電気特性を検出し、
　前記学習モデルは、前記複数の異なる部位の各々に対するパーツ状態を示すパーツ状態情報を前記ロボット状態情報として出力するように学習される。

　第６態様は、第１態様から第５態様の何れか１態様の推定装置において、
　前記学習モデルは、前記柔軟材料をリザーバとして当該リザーバを用いたリザーバコンピューティングによるネットワークを用いて学習させることで生成されたモデルを含む。

　第７態様は、
　導電性を有し、かつ与えられた圧力の変化に応じて電気特性が変化する柔軟材料を外郭部の少なくとも一部に備えたロボットと、
　前記推定装置と、
　を備えたロボットシステムである。

　第８態様は、
　コンピュータが
　導電性を有し、かつ与えられた圧力の変化に応じて電気特性が変化する柔軟材料を外郭部の少なくとも一部に備えたロボットにおける前記柔軟材料に予め定められた複数の検出点の間の電気特性を検出する検出部から前記電気特性を取得し、
　前記柔軟材料に圧力を与えた際の時系列の電気特性と、前記柔軟材料に圧力を与えるロボット状態を示すロボット状態情報とを学習用データとして用いて、前記時系列の電気特性を入力とし、前記ロボット状態情報を出力するように学習された学習モデルに対して、前記検出部で検出された時系列の電気特性を入力し、入力した時系列の電気特性に対応するロボット状態を示すロボット状態情報を推定する
　推定方法である。

　第９態様は、
　コンピュータに
　導電性を有し、かつ与えられた圧力の変化に応じて電気特性が変化する柔軟材料を外郭部の少なくとも一部に備えたロボットにおける前記柔軟材料に予め定められた複数の検出点の間の電気特性を検出する検出部から前記電気特性を取得し、
　前記柔軟材料に圧力を与えた際の時系列の電気特性と、前記柔軟材料に圧力を与えるロボット状態を示すロボット状態情報とを学習用データとして用いて、前記時系列の電気特性を入力とし、前記ロボット状態情報を出力するように学習された学習モデルに対して、前記検出部で検出された時系列の電気特性を入力し、入力した時系列の電気特性に対応するロボット状態を示すロボット状態情報を推定する
　処理を実行させるための推定プログラムである。

　第１０態様は、
　導電性を有し、かつ与えられた圧力の変化に応じて電気特性が変化する柔軟材料を外郭部の少なくとも一部に備えたロボットにおける前記柔軟材料に予め定められた複数の検出点の間の電気特性を検出する検出部から前記電気特性を入力とし、前記柔軟材料に圧力を与えるロボット状態を示すロボット状態情報を出力する学習モデルを生成する学習モデル生成部
　を含む学習モデル生成装置である。

　本開示によれば、特殊な検出装置を用いることなく、導電性を有する柔軟材料の電気特性を利用して、ロボット状態を示すロボット状態情報を推定することができる、という効果を有する。

　本開示の第１１態様は、
　導電性を有し、かつ与えられた圧力の変化に応じて電気特性が変化する柔軟材料であって、可動体の基体から屈曲可能な突出部の少なくとも一部を覆って配置されるかまたは覆うことが可能な前記柔軟材料に予め定められた複数の検出点間の電気特性を検出する検出部と、
　前記柔軟材料に圧力を与えた際の時系列の電気特性と、前記柔軟材料に圧力を与える付与刺激状態を示す付与刺激状態情報とを学習用データとして用いて、前記時系列の電気特性を入力とし、前記付与刺激状態情報を出力するように学習された学習モデルに対して、前記検出部で検出された時系列の電気特性を入力し、入力した時系列の電気特性に対応する付与刺激状態を示す付与刺激状態情報を推定する推定部と、
　を含む推定装置である。

　第１２態様は、第１１態様の推定装置において、
　前記電気特性は、体積抵抗であり、
　胴体部を前記基体とし、前記胴体部に連結される手部及び脚部の少なくとも一方を前記突出部とするロボットを前記可動体とし、
　前記柔軟材料は、前記ロボットの手部及び脚部の少なくとも一方の骨格の周囲に配置される。

　第１３態様は、第１１態様又は第１２態様の推定装置において、
　前記柔軟材料は、前記突出部の外側に装着可能な外部部材に配置される。

　第１４態様は、第１１態様から第１３態様の何れか１態様の推定装置において、
　前記付与刺激状態は、人体及び物体の少なくとも一方について、表面形状を示す状態、表面材質を示す状態、重さを示す状態、及び硬さを示す状態の少なくとも１状態を含む。

　第１５態様は、第１１態様から第１４態様の何れか１態様の推定装置において、
　前記柔軟材料は、繊維状及び網目状の少なくとも一方の構造、又は内部に微小な空気泡が複数散在する構造のウレタン材の少なくとも一部に導電性が付与された材料を含む。

　第１６態様は、第１５態様の推定装置において、
　前記柔軟材料は、表面から前記突出部の内部に向かうに従って硬さが硬くなる材料で形成されるか、又は表面から前記突出部の内部に向かうに従って硬さが硬くなるように硬さが異なる複数の材料を積層して形成される。

　第１７態様は、第１１態様から第１６態様の何れか１態様の推定装置において、
　前記学習モデルは、前記柔軟材料をリザーバとして当該リザーバを用いたリザーバコンピューティングによるネットワークを用いて学習させることで生成されたモデルを含む。

　第１８態様は、
　コンピュータが
　導電性を有し、かつ与えられた圧力の変化に応じて電気特性が変化する柔軟材料であって、可動体の基体から屈曲可能な突出部の少なくとも一部を覆って配置されるかまたは覆うことが可能な前記柔軟材料に予め定められた複数の検出点間の電気特性を検出する検出部から前記電気特性を取得し、
　前記柔軟材料に圧力を与えた際の時系列の電気特性と、前記柔軟材料に圧力を与える付与刺激状態を示す付与刺激状態情報とを学習用データとして用いて、前記時系列の電気特性を入力とし、前記付与刺激状態情報を出力するように学習された学習モデルに対して、前記取得された時系列の電気特性を入力し、入力した時系列の電気特性に対応する付与刺激状態を示す付与刺激状態情報を推定する
　推定方法である。

　第１９態様は、
　コンピュータに
　導電性を有し、かつ与えられた圧力の変化に応じて電気特性が変化する柔軟材料であって、可動体の基体から屈曲可能な突出部の少なくとも一部を覆って配置されるかまたは覆うことが可能な前記柔軟材料に予め定められた複数の検出点間の電気特性を検出する検出部から前記電気特性を取得し、
　前記柔軟材料に圧力を与えた際の時系列の電気特性と、前記柔軟材料に圧力を与える付与刺激状態を示す付与刺激状態情報とを学習用データとして用いて、前記時系列の電気特性を入力とし、前記付与刺激状態情報を出力するように学習された学習モデルに対して、前記取得された時系列の電気特性を入力し、入力した時系列の電気特性に対応する付与刺激状態を示す付与刺激状態情報を推定する
　処理を実行させるための推定プログラムである。

　第２０態様は、
　導電性を有し、かつ与えられた圧力の変化に応じて電気特性が変化する柔軟材料であって、可動体の基体から屈曲可能な突出部の少なくとも一部を覆って配置されるかまたは覆うことが可能な前記柔軟材料に予め定められた複数の検出点間の電気特性を検出する検出部で検出された前記電気特性を入力とし、前記柔軟材料に圧力を与える付与刺激状態を示す付与刺激状態情報を出力する学習モデルを生成する学習モデル生成部
　を含む学習モデル生成装置である。

　本開示によれば、特殊な検出装置を用いることなく、導電性を有する柔軟材料の電気特性を利用して、柔軟材料に圧力を与える付与刺激状態を推定することができる、という効果を有する。

　本開示の第２１態様は、
　導電性を有し、かつ与えられた圧力の変化に応じて電気特性が変化する柔軟材料を胴体部の少なくとも一部に備えたロボットにおける前記柔軟材料に予め定められた複数の検出点の間の電気特性を検出する検出部と、
　物体により前記柔軟材料に圧力を与えた際の時系列の電気特性と、前記柔軟材料に圧力を与えた物体を示す接触物体情報とを学習用データとして用いて、前記時系列の電気特性を入力とし、前記接触物体情報を出力するように学習された学習モデルに対して、前記検出部で検出された時系列の電気特性を入力し、入力した時系列の電気特性に対応する、前記柔軟材料に圧力を与えた物体を示す接触物体情報を推定する推定部と、
　を含む推定装置である。

　第２２態様は、第２１態様の推定装置において、
　前記電気特性は、体積抵抗であり、
　前記接触物体情報は、前記柔軟材料に圧力を与えた物体の種類又は前記物体の状態を含み、
　前記学習モデルは、検出された電気特性に対応する、前記柔軟材料に圧力を与えた物体の種類又は前記物体の状態を示す情報を前記接触物体情報として出力するように学習される。

　第２３態様は、第２１態様又は第２２態様の推定装置において、
前記柔軟材料は、繊維状若しくは網目状の構造、又は内部に微小な空気泡が複数散在する構造のウレタン材の少なくとも一部に導電性が付与された材料を含む。

　第２４態様は、第２１態様から第２３態様の何れか１態様の推定装置において、
　前記柔軟材料は、前記ロボットの胴体部の骨格の周囲に配置され、前記胴体部の骨格に近づくに従って、硬さが硬くなる材料で形成されるか、又は前記胴体部の骨格に近づくに従って、硬さが硬くなるように、硬さが異なる複数の材料を積層して形成される。

　第２５態様は、第２１態様から第２４態様の何れか１態様の推定装置において、
　前記柔軟材料は、前記ロボットの胴体部の複数の異なる部位に配置され、
　前記検出部は、前記複数の異なる部位の各々における複数の検出点の間の電気特性を検出し、
　前記学習モデルは、前記複数の異なる部位の各々に対するパーツの前記柔軟材料に圧力を与えた物体の種類又は前記物体の状態を示すパーツ接触物体情報を前記接触物体情報として出力するように学習される。

　第２６態様は、第２１態様から第２５態様の何れか１態様の推定装置において、
　前記学習モデルは、前記柔軟材料をリザーバとして当該リザーバを用いたリザーバコンピューティングによるネットワークを用いて学習させることで生成されたモデルを含む。

　第２７態様は、
導電性を有し、かつ与えられた圧力の変化に応じて電気特性が変化する柔軟材料を胴体部の外郭部の少なくとも一部に備えたロボットと、
　前記推定装置と、
　を備えたロボットシステムである。

　第２８態様は、
　コンピュータが
　導電性を有し、かつ与えられた圧力の変化に応じて電気特性が変化する柔軟材料を胴体部の少なくとも一部に備えたロボットにおける前記柔軟材料に予め定められた複数の検出点の間の電気特性を検出する検出部から前記電気特性を取得し、
　物体により前記柔軟材料に圧力を与えた際の時系列の電気特性と、前記柔軟材料に圧力を与えた物体を示す接触物体情報とを学習用データとして用いて、前記時系列の電気特性を入力とし、前記接触物体情報を出力するように学習された学習モデルに対して、前記検出部で検出された時系列の電気特性を入力し、入力した時系列の電気特性に対応する、前記柔軟材料に圧力を与えた物体を示す接触物体情報を推定する
　推定方法である。

　第２９態様は、
　コンピュータに
　導電性を有し、かつ与えられた圧力の変化に応じて電気特性が変化する柔軟材料を胴体部の少なくとも一部に備えたロボットにおける前記柔軟材料に予め定められた複数の検出点の間の電気特性を検出する検出部から前記電気特性を取得し、
　物体により前記柔軟材料に圧力を与えた際の時系列の電気特性と、前記柔軟材料に圧力を与えた物体を示す接触物体情報とを学習用データとして用いて、前記時系列の電気特性を入力とし、前記接触物体情報を出力するように学習された学習モデルに対して、前記検出部で検出された時系列の電気特性を入力し、入力した時系列の電気特性に対応する、前記柔軟材料に圧力を与えた物体を示す接触物体情報を推定する
　処理を実行させるための推定プログラムである。

　第３０態様は、
　導電性を有し、かつ与えられた圧力の変化に応じて電気特性が変化する柔軟材料を胴体部の少なくとも一部に備えたロボットにおける前記柔軟材料に予め定められた複数の検出点の間の電気特性を検出する検出部から前記電気特性を入力とし、前記柔軟材料に圧力を与えた物体を示す接触物体情報を出力する学習モデルを生成する学習モデル生成部
　を含む学習モデル生成装置である。

　本開示によれば、特殊な検出装置を用いることなく、導電性を有する柔軟材料の電気特性を利用して、接触物体を示す接触物体情報を推定することができる、という効果を有する。

　第３１態様は、
　少なくとも一部の部位の作動状態が制御可能なロボットであって、導電性を有し、かつ与えられた圧力の変化に応じて電気特性が変化する柔軟材料を外郭部の少なくとも一部に備えた前記ロボットにおける前記柔軟材料に予め定められた複数の検出点間の電気特性を検出する検出部と、
　前記柔軟材料に圧力を与えた際の前記複数の検出点間の時系列の電気特性と、前記柔軟材料に前記圧力を与えるロボット状態を示すロボット状態情報とを第１学習用データとして用いて、前記時系列の電気特性を入力した際に、前記ロボット状態情報を出力するように学習された第１学習モデル、及び前記柔軟材料に圧力を与えるロボット状態を示すロボット状態情報と、ロボット状態に対応して変化させる前記ロボットの少なくとも一部の部位の作動状態を示す作動状態情報とを第２学習用データとして用いて、前記ロボット状態情報を入力した際に、前記作動状態情報を出力するように学習されると共に、前記第１学習モデルの出力が入力されるように接続された第２学習モデルを備え、前記第１学習モデルに前記検出部で検出された時系列の電気特性が入力された際に出力される情報を、前記検出部で検出された電気特性に対応する作動状態として導出する導出部と、
　前記導出部で導出された作動状態に基づいて、前記ロボットを制御する制御部と、
　を含むロボット制御装置である。

　第３２態様は、第３１態様のロボット制御装置において、
　前記電気特性は、体積抵抗であり、
　前記ロボットは、複数のパーツから構成され、
　前記作動状態は、前記複数のパーツの組み合わせによって形成されるロボットの姿勢状態を含み、
　前記作動状態情報は、前記ロボットが前記姿勢状態を示すように前記複数のパーツの内の少なくとも１パーツを駆動する駆動情報を含む。

　第３３態様は、第３１態様又は第３２態様のロボット制御装置において、
　前記柔軟材料は、繊維状及び網目状の少なくとも一方の構造、又は内部に微小な空気泡が複数散在する構造のウレタン材の少なくとも一部に導電性が付与された材料を含む。

　第３４態様は、第３１態様から第３３態様の何れか１態様のロボット制御装置において、
　前記柔軟材料は、前記ロボットの骨格の周囲に配置され、前記ロボットの骨格に近づくに従って、硬さが硬くなる材料で形成されるか、又は前記ロボットの骨格に近づくに従って、硬さが硬くなるように、硬さが異なる複数の材料を積層して形成される。

　第３５態様は、第３１態様から第３４態様の何れか１態様のロボット制御装置において、
　前記第１学習モデルは、前記柔軟材料をリザーバとして当該リザーバを用いたリザーバコンピューティングによるネットワークを用いて学習させることで生成されたモデルを含む。

　第３６態様は、
　少なくとも一部の部位の作動状態が制御可能なロボットであって、導電性を有し、かつ与えられた圧力の変化に応じて電気特性が変化する柔軟材料を外郭部の少なくとも一部に備えた前記ロボットと、
　前記ロボット制御装置と、
　を備えたロボットシステムである。

　第３７態様は、
　コンピュータが
　少なくとも一部の部位の作動状態が制御可能なロボットであって、導電性を有し、かつ与えられた圧力の変化に応じて電気特性が変化する柔軟材料を外郭部の少なくとも一部に備えた前記ロボットにおける前記柔軟材料に予め定められた複数の検出点間の電気特性を検出する検出部から前記電気特性を取得し、
　前記柔軟材料に圧力を与えた際の前記複数の検出点間の時系列の電気特性と、前記柔軟材料に前記圧力を与えるロボット状態を示すロボット状態情報とを第１学習用データとして用いて、前記時系列の電気特性を入力した際に、前記ロボット状態情報を出力するように学習された第１学習モデル、及び前記柔軟材料に圧力を与えるロボット状態を示すロボット状態情報と、ロボット状態に対応して変化させる前記ロボットの少なくとも一部の部位の作動状態を示す作動状態情報とを第２学習用データとして用いて、前記ロボット状態情報を入力した際に、前記作動状態情報を出力するように学習されると共に、前記第１学習モデルの出力が入力されるように接続された第２学習モデルを用いて、前記第１学習モデルに前記検出部で検出された時系列の電気特性が入力された際に出力される情報を、前記検出部で検出された電気特性に対応する作動状態として導出し、
　導出された作動状態に基づいて、前記ロボットを制御する
　ロボット制御方法である。

　第３８態様は、
　コンピュータに
　少なくとも一部の部位の作動状態が制御可能なロボットであって、導電性を有し、かつ与えられた圧力の変化に応じて電気特性が変化する柔軟材料を外郭部の少なくとも一部に備えた前記ロボットにおける前記柔軟材料に予め定められた複数の検出点間の電気特性を検出する検出部から前記電気特性を取得し、
　前記柔軟材料に圧力を与えた際の前記複数の検出点間の時系列の電気特性と、前記柔軟材料に前記圧力を与えるロボット状態を示すロボット状態情報とを第１学習用データとして用いて、前記時系列の電気特性を入力した際に、前記ロボット状態情報を出力するように学習された第１学習モデル、及び前記柔軟材料に圧力を与えるロボット状態を示すロボット状態情報と、ロボット状態に対応して変化させる前記ロボットの少なくとも一部の部位の作動状態を示す作動状態情報とを第２学習用データとして用いて、前記ロボット状態情報を入力した際に、前記作動状態情報を出力するように学習されると共に、前記第１学習モデルの出力が入力されるように接続された第２学習モデルを用いて、前記第１学習モデルに前記検出部で検出された時系列の電気特性が入力された際に出力される情報を、前記検出部で検出された電気特性に対応する作動状態として導出し、
　導出された作動状態に基づいて、前記ロボットを制御する
　処理を実行させるためのロボット制御プログラムである。

　本開示によれば、特殊装置を用いることなく簡単な構成で、導電性を有する柔軟材料の電気特性から推定されるロボット状態を利用して、ロボットの作動状態を制御することができる、という効果を有する。

　第３９態様は、導電性を有し、かつ与えられた刺激の変化に応じて電気特性が変化する柔軟材料を備えた把持部材の前記柔軟材料に予め定められた複数の検出点の間の電気特性を検出する検出部と、前記柔軟材料に刺激を与えた際の時系列の電気特性と、前記柔軟材料に刺激を与える前記把持部材により把持対象物を把持した際の滑り状態を示す滑り状態情報とを学習用データとして用いて、前記時系列の電気特性を入力とし、前記滑り状態情報を出力するように学習された学習モデルに対して、前記検出部で検出された時系列の電気特性を入力し、入力した時系列の電気特性に対応する前記把持部材により前記把持対象物を把持した際の滑り状態を示す滑り状態情報を推定する推定部と、前記滑り状態情報を出力する出力部と、を含む推定装置である。

　第４０態様は、第３９態様の推定装置において、前記滑り状態は、前記把持部材と前記把持対象物との摩擦力分布に関する状態を含む。

　第４１態様は、第３９態様又は第４０態様の推定装置において、前記把持部材は、手に装着するグローブ及びロボットのハンドの何れかである。

　第４２態様は、第３９～第４１態様の何れかの態様の推定装置において、前記把持部材は、前記把持対象物を把持する際の把持状態を調整可能であり、前記滑り状態情報に基づいて、前記把持状態を制御する制御部を更に備える。

　第４３態様は、第３９～第４２態様の何れかの態様の推定装置において、前記把持部材は、繊維状及び網目状の少なくとも一方の骨格を有する構造、又は内部に微小な空気泡が複数散在する構造のウレタン材、若しくはゴムの少なくとも一部に導電性が付与された材料を含む。

　第４４態様は、第３９～第４３態様の何れかの態様の推定装置において、前記学習モデルは、前記柔軟材料をリザーバとして当該リザーバを用いたリザーバコンピューティングによるネットワークを用いて学習させることで生成されたモデルを含む。

　第４５態様は、コンピュータが、導電性を有し、かつ与えられた刺激の変化に応じて電気特性が変化する柔軟材料を備えた把持部材の前記柔軟材料に予め定められた複数の検出点の間の電気特性を検出し、前記柔軟材料に刺激を与えた際の時系列の電気特性と、前記柔軟材料に刺激を与える前記把持部材により把持対象物を把持した際の滑り状態を示す滑り状態情報とを学習用データとして用いて、前記時系列の電気特性を入力とし、前記滑り状態情報を出力するように学習された学習モデルに対して、検出された時系列の電気特性を入力し、入力した時系列の電気特性に対応する前記把持部材により前記把持対象物を把持した際の滑り状態を示す滑り状態情報を推定し、前記滑り状態情報を出力する推定方法である。

　第４６態様は、コンピュータに、導電性を有し、かつ与えられた刺激の変化に応じて電気特性が変化する柔軟材料を備えた把持部材の前記柔軟材料に予め定められた複数の検出点の間の電気特性を検出し、前記柔軟材料に刺激を与えた際の時系列の電気特性と、前記柔軟材料に刺激を与える前記把持部材により把持対象物を把持した際の滑り状態を示す滑り状態情報とを学習用データとして用いて、前記時系列の電気特性を入力とし、前記滑り状態情報を出力するように学習された学習モデルに対して、検出された時系列の電気特性を入力し、入力した時系列の電気特性に対応する前記把持部材により前記把持対象物を把持した際の滑り状態を示す滑り状態情報を推定し、前記滑り状態情報を出力する処理を実行させる推定プログラムである。

　第４７態様は、導電性を有し、かつ与えられた刺激の変化に応じて電気特性が変化する柔軟材料を備えた把持部材の前記柔軟材料に予め定められた複数の検出点の間の電気特性を検出する検出部からの前記電気特性と、前記柔軟材料に刺激を与える前記把持部材により把持対象物を把持した際の滑り状態を示す滑り状態情報と、を取得する取得部と、前記取得部の取得結果に基づいて、前記柔軟材料に圧力を与えた際の時系列の電気特性を入力とし、前記柔軟材料に刺激を与える前記把持部材により前記把持対象物を把持した際の滑り状態を示す滑り状態情報を出力する学習モデルを生成する学習モデル生成部と、を含む学習モデル生成装置である。

　本開示によれば、特殊な検出装置を用いることなく、導電性を有する柔軟材料を備えた把持部材の電気特性を利用して、把持部材が把持対象物を把持した際の滑り状態を推定することができる、という効果を有する。

［その他の実施形態］
　本開示では、柔軟部材の一例として導電性ウレタンを適用した場合を説明したが、柔軟部材は柔軟性を有すればよく、上述した導電性ウレタンに限定されないことは勿論である。

　本開示の技術的範囲は上記実施形態に記載の範囲には限定されない。要旨を逸脱しない範囲で上記実施形態に多様な変更または改良を加えることができ、当該変更または改良を加えた形態も本開示の技術的範囲に含まれる。

　また、上記実施形態では、推定処理及び学習処理を、フローチャートを用いた処理によるソフトウエア構成によって実現した場合について説明したが、これに限定されるものではなく、例えば各処理をハードウェア構成により実現する形態としてもよい。また、上述した実施形態で説明したプログラムの処理の流れも、一例であり、主旨を逸脱しない範囲内において不要なステップを削除したり、新たなステップを追加したり、処理順序を入れ替えたりしてもよい。

　また、推定装置の一部、例えば学習モデル等のニューラルネットワークを、ハードウェア回路として構成してもよい。

　さらに、上述した実施形態における処理をコンピュータにより実行させるために、上述した処理をコンピュータで処理可能なコードで記述したプログラムを光ディスク等の記憶媒体等に記憶して流通するようにしてもよい。

　上述した実施形態では、汎用的なプロセッサの一例としてＣＰＵを用いて説明したが、上記実施形態において、プロセッサとは広義的なプロセッサを指し、汎用的なプロセッサ（例えばＣＰＵ等）や、専用のプロセッサ（例えばＧＰＵ：Ｇｒａｐｈｉｃｓ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ、ＡＳＩＣ：　Ａｐｐｌｉｃａｔｉｏｎ　Ｓｐｅｃｉｆｉｃ　Ｉｎｔｅｇｒａｔｅｄ　Ｃｉｒｃｕｉｔ、ＦＰＧＡ：　Ｆｉｅｌｄ　Ｐｒｏｇｒａｍｍａｂｌｅ　Ｇａｔｅ　Ａｒｒａｙ、プログラマブル論理デバイス、等）を含むものである。

　また、上述した実施形態におけるプロセッサの動作は、１つのプロセッサによって成すのみでなく、複数のプロセッサが連携して成すものであってもよく、物理的に離れた位置に存在する複数のプロセッサが協働して成すものであってもよい。

　本明細書に記載された全ての文献、特許出願、及び技術規格は、個々の文献、特許出願、及び技術規格が参照により取り込まれることが具体的かつ個々に記された場合と同程度に、本明細書中に参照により取り込まれる。

Claims

　導電性を有し、かつ与えられた圧力の変化に応じて電気特性が変化する柔軟材料を外郭部の少なくとも一部に備えたロボット、又は把持部材、若しくは前記柔軟材料を少なくとも一部を覆って配置するかまたは覆うことが可能に配置した可動体の基体から屈曲可能な突出部における前記柔軟材料に予め定められた複数の検出点の間の電気特性を検出する検出部と、
　前記柔軟材料に圧力を与えた際の時系列の電気特性と、前記柔軟材料に圧力を与えるロボット状態を示すロボット状態情報、又は前記柔軟材料に圧力を与える物体を示す接触物体情報、若しくは前記柔軟材料に刺激を与える前記把持部材により把持対象物を把持した際の滑り状態を示す滑り状態情報、或いは、前記柔軟材料に圧力を与える付与刺激状態を示す付与刺激状態情報とを学習用データとして用いて、前記時系列の電気特性を入力とし、前記ロボット状態情報、又は前記接触物体情報、若しくは前記滑り状態情報、或いは、前記付与刺激状態情報を出力するように学習された学習モデルに対して、前記検出部で検出された時系列の電気特性を入力し、入力した時系列の電気特性に対応するロボット状態を示すロボット状態情報、又は前記柔軟材料に圧力を与えた物体を示す接触物体情報、若しくは、入力した時系列の電気特性に対応する前記把持部材により前記把持対象物を把持した際の滑り状態を示す滑り状態情報、或いは、入力した時系列の電気特性に対応する付与刺激状態を示す付与刺激状態情報を推定する
推定部と、
　を含む推定装置。
　前記電気特性は、体積抵抗であり、
　前記ロボット状態は、ロボットへの人物の接触を含む付勢状態を含み、
　前記学習モデルは、検出された電気特性に対応する人物の付勢状態を示す情報を前記ロボット状態情報として出力するように学習される
　請求項１に記載の推定装置。
　前記柔軟材料は、繊維状及び網目状の少なくとも一方の構造、又は内部に微小な空気泡が複数散在する構造のウレタン材の少なくとも一部に導電性が付与された材料を含む
　請求項１又は請求項２に記載の推定装置。
　前記柔軟材料は、前記ロボットの骨格の周囲に配置され、前記ロボットの骨格に近づくに従って、硬さが硬くなる材料で形成されるか、又は前記ロボットの骨格に近づくに従って、硬さが硬くなるように、硬さが異なる複数の材料を積層して形成される
　請求項１から請求項３の何れか１項に記載の推定装置。
　前記柔軟材料は、前記ロボットの複数の異なる部位に配置され、
　前記検出部は、前記複数の異なる部位の各々における複数の検出点の間の電気特性を検出し、
　前記学習モデルは、前記複数の異なる部位の各々に対するパーツ状態を示すパーツ状態情報を前記ロボット状態情報として出力するように学習される
　請求項１から請求項４の何れか１項に記載の推定装置。
　前記学習モデルは、前記柔軟材料をリザーバとして当該リザーバを用いたリザーバコンピューティングによるネットワークを用いて学習させることで生成されたモデルを含む
　請求項１から請求項５の何れか１項に記載の推定装置。
　前記電気特性は、体積抵抗であり、
　胴体部を前記基体とし、前記胴体部に連結される手部及び脚部の少なくとも一方を前記突出部とするロボットを前記可動体とし、
　前記柔軟材料は、前記ロボットの手部及び脚部の少なくとも一方の骨格の周囲に配置される
　請求項１に記載の推定装置。
　前記柔軟材料は、前記突出部の外側に装着可能な外部部材に配置される
　請求項７に記載の推定装置。
　前記付与刺激状態は、人体及び物体の少なくとも一方について、表面形状を示す状態、表面材質を示す状態、重さを示す状態、及び硬さを示す状態の少なくとも１状態を含む
　請求項７又は請求項８に記載の推定装置。
　前記柔軟材料は、表面から前記突出部の内部に向かうに従って硬さが硬くなる材料で形成されるか、又は表面から前記突出部の内部に向かうに従って硬さが硬くなるように硬さが異なる複数の材料を積層して形成される
　請求項７から請求項９の何れか１項に記載の推定装置。
　前記電気特性は、体積抵抗であり、
　前記接触物体情報は、前記柔軟材料に圧力を与えた物体の種類又は前記物体の状態を含み、
　前記学習モデルは、検出された電気特性に対応する、前記柔軟材料に圧力を与えた物体の種類又は前記物体の状態を示す情報を前記接触物体情報として出力するように学習される
　請求項１に記載の推定装置。
　前記柔軟材料は、前記ロボットの胴体部の骨格の周囲に配置され、前記胴体部の骨格に近づくに従って、硬さが硬くなる材料で形成されるか、又は前記胴体部の骨格に近づくに従って、硬さが硬くなるように、硬さが異なる複数の材料を積層して形成される
　請求項１１に記載の推定装置。
　前記柔軟材料は、前記ロボットの胴体部の複数の異なる部位に配置され、
　前記検出部は、前記複数の異なる部位の各々における複数の検出点の間の電気特性を検出し、
　前記学習モデルは、前記複数の異なる部位の各々に対するパーツの前記柔軟材料に圧力を与えた物体の種類又は前記物体の状態を示すパーツ接触物体情報を前記接触物体情報として出力するように学習される
　請求項１１又は１２に記載の推定装置。
　前記推定部は、前記学習モデルとして、前記柔軟材料に圧力を与えた際の前記複数の検出点間の時系列の電気特性と、前記柔軟材料に前記圧力を与えるロボット状態を示すロボット状態情報とを第１学習用データとして用いて、前記時系列の電気特性を入力した際に、前記ロボット状態情報を出力するように学習された第１学習モデル、及び前記柔軟材料に圧力を与えるロボット状態を示すロボット状態情報と、ロボット状態に対応して変化させる前記ロボットの少なくとも一部の部位の作動状態を示す作動状態情報とを第２学習用データとして用いて、前記ロボット状態情報を入力した際に、前記作動状態情報を出力するように学習されると共に、前記第１学習モデルの出力が入力されるように接続された第２学習モデルを備え、前記第１学習モデルに前記検出部で検出された時系列の電気特性が入力された際に出力される情報を、前記検出部で検出された電気特性に対応する作動状態として導出する導出部を含み、
　前記導出部で導出された作動状態に基づいて、前記ロボットを制御する制御部をさらに備える
　請求項１に記載の推定装置。
　前記電気特性は、体積抵抗であり、
　前記ロボットは、複数のパーツから構成され、
　前記作動状態は、前記複数のパーツの組み合わせによって形成されるロボットの姿勢状態を含み、
　前記作動状態情報は、前記ロボットが前記姿勢状態を示すように前記複数のパーツの内の少なくとも１パーツを駆動する駆動情報を含む
　請求項１４に記載の推定装置。
　前記滑り状態は、前記把持部材と前記把持対象物との摩擦力分布に関する状態を含む
　請求項１に記載の推定装置。
　前記把持部材は、手に装着するグローブ及びロボットのハンドの何れかである
　請求項１６に記載の推定装置。
　前記把持部材は、前記把持対象物を把持する際の把持状態を調整可能であり、
　前記滑り状態情報に基づいて、前記把持状態を制御する制御部
　を更に備えた請求項１６又は請求項１７に記載の推定装置。
　コンピュータが
　導電性を有し、かつ与えられた圧力の変化に応じて電気特性が変化する柔軟材料を外郭部の少なくとも一部に備えたロボット、又は把持部材、若しくは前記柔軟材料を少なくとも一部を覆って配置するかまたは覆うことが可能に配置した可動体の基体から屈曲可能な突出部における前記柔軟材料に予め定められた複数の検出点の間の電気特性を検出する検出部から前記電気特性を取得し、
　前記柔軟材料に圧力を与えた際の時系列の電気特性と、前記柔軟材料に圧力を与えるロボット状態を示すロボット状態情報、又は前記柔軟材料に圧力を与える物体を示す接触物体情報、若しくは前記柔軟材料に刺激を与える前記把持部材により把持対象物を把持した際の滑り状態を示す滑り状態情報、或いは、前記柔軟材料に圧力を与える付与刺激状態を示す付与刺激状態情報とを学習用データとして用いて、前記時系列の電気特性を入力とし、前記ロボット状態情報、又は前記接触物体情報、若しくは前記滑り状態情報、或いは、前記付与刺激状態情報を出力するように学習された学習モデルに対して、前記検出部で検出された時系列の電気特性を入力し、入力した時系列の電気特性に対応するロボット状態を示すロボット状態情報、又は前記柔軟材料に圧力を与えた物体を示す接触物体情報、若しくは、入力した時系列の電気特性に対応する前記把持部材により前記把持対象物を把持した際の滑り状態を示す滑り状態情報、或いは、入力した時系列の電気特性に対応する付与刺激状態を示す付与刺激状態情報を推定する
　推定方法。
　コンピュータに
　導電性を有し、かつ与えられた圧力の変化に応じて電気特性が変化する柔軟材料を外郭部の少なくとも一部に備えたロボット、又は把持部材、若しくは前記柔軟材料を少なくとも一部を覆って配置するかまたは覆うことが可能に配置した可動体の基体から屈曲可能な突出部における前記柔軟材料に予め定められた複数の検出点の間の電気特性を検出する検出部から前記電気特性を取得し、
　前記柔軟材料に圧力を与えた際の時系列の電気特性と、前記柔軟材料に圧力を与えるロボット状態を示すロボット状態情報、又は前記柔軟材料に圧力を与える物体を示す接触物体情報、若しくは前記柔軟材料に刺激を与える前記把持部材により把持対象物を把持した際の滑り状態を示す滑り状態情報、或いは、前記柔軟材料に圧力を与える付与刺激状態を示す付与刺激状態情報とを学習用データとして用いて、前記時系列の電気特性を入力とし、前記ロボット状態情報、又は前記接触物体情報、若しくは前記滑り状態情報、或いは、前記付与刺激状態情報を出力するように学習された学習モデルに対して、前記検出部で検出された時系列の電気特性を入力し、入力した時系列の電気特性に対応するロボット状態を示すロボット状態情報、又は前記柔軟材料に圧力を与えた物体を示す接触物体情報、若しくは、入力した時系列の電気特性に対応する前記把持部材により前記把持対象物を把持した際の滑り状態を示す滑り状態情報、或いは、入力した時系列の電気特性に対応する付与刺激状態を示す付与刺激状態情報を推定する
　処理を実行させるための推定プログラム。