JP2023017592A

JP2023017592A - 推定装置、推定方法、推定プログラム、及び学習モデル生成装置

Info

Publication number: JP2023017592A
Application number: JP2021121942A
Authority: JP
Inventors: 創北野; So Kitano; 泰通若尾; Yasumichi Wakao; 仁安井; Hitoshi Yasui; 真広山口; Masahiro Yamaguchi; 浩人杉野; Hiroto Sugino; 祐輔藤沢; Yusuke FUJISAWA
Original assignee: Bridgestone Corp
Current assignee: Bridgestone Corp
Priority date: 2021-07-26
Filing date: 2021-07-26
Publication date: 2023-02-07

Abstract

【課題】特殊な検出装置を用いることなく、導電性を有する柔軟材料を備えたロボットの電気特性を利用して、柔軟材料に圧力を与える人物の付与刺激状態を推定する。【解決手段】推定装置（１）は導電性を有し、かつ付与された圧力の変化に応じて電気特性が変化する柔軟材料を備えたロボットハンド（２）における複数の検出点の間の電気特性を検出部で検出する。推定部（５）は、学習モデル（５１）を用いてロボットハンド（２）の電気特性から付与刺激状態を推定する。柔軟材料に圧力を与えた際の電気特性と、ロボット（２）の柔軟材料に圧力を与える付与刺激状態とを学習用データとして用いて、その電気特性を入力とし、付与刺激状態を出力するように学習された学習モデルに対して、電気特性を入力し、入力した電気特性に対応する付与刺激状態を出力するように学習される。【選択図】図１

Description

本開示は、推定装置、推定方法、推定プログラム、及び学習モデル生成装置に関する。

従来より、ユーザの作業や動作を支援するロボットに関する技術開発が盛んに行われている。ロボットは、人や物との緩衝を考慮するため、多数の特殊な接触センサを備えて、ロボットに対する人や物の接触を検出する技術が知られている（例えば、特許文献１参照）。

また、ロボットに対する人や物の接触を検出するために、ロボットの外郭に生じる形状変化を検出することが考えられるが、形状変化を検出する側面で、変形を検出するためには、特殊な検出装置が要求される。例えば、カメラによる物体の変位と振動を測定して、変形画像を取得し、変形量を抽出する技術が知られている（例えば、特許文献２参照）。また、光の透過量から変形量を推定する柔軟触覚センサに関する技術も知られている（例えば、特許文献３参照）。

特開２０１１－０５６６１９号公報国際公開２０１７０２９９０５号公報特開２０１３－１０１０９６号公報

しかしながら、多数の特殊な接触センサを備えて接触を検出する側面では、接触を検出するための各部位に接触センサを備えることが要求され、センサ数が膨大となって、ロボットの大型化を招くので好ましくはない。また、多数の特殊な接触センサ自体がロボットの接触状態を阻害する虞もある。

また、形状変化を検出する側面では、変形量を検出するためにカメラや光の透過量を検出するセンサとセンサ出力を解析する解析装置等を含むシステムは、大規模なものとなり、ロボットの大型化を招くので好ましくはない。また、変形量を検出するためにロボットの全ての部位に対して変形量を検出するセンサを配置することが要求され、好ましくはない。

本開示は、特殊な検出装置を用いることなく、導電性を有する柔軟材料の電気特性を利用して、柔軟材料に圧力を与える付与刺激状態を推定することができる推定装置、推定方法、推定プログラム、及び学習モデル生成装置を提供することを目的とする。

上記目的を達成するために、第１態様は、
導電性を有し、かつ与えられた圧力の変化に応じて電気特性が変化する柔軟材料であって、可動体の基体から屈曲可能な突出部の少なくとも一部を覆って配置されるかまたは覆うことが可能な前記柔軟材料に予め定められた複数の検出点間の電気特性を検出する検出部と、
前記柔軟材料に圧力を与えた際の時系列の電気特性と、前記柔軟材料に圧力を与える付与刺激状態を示す付与刺激状態情報とを学習用データとして用いて、前記時系列の電気特性を入力とし、前記付与刺激状態情報を出力するように学習された学習モデルに対して、前記検出部で検出された時系列の電気特性を入力し、入力した時系列の電気特性に対応する付与刺激状態を示す付与刺激状態情報を推定する推定部と、
を含む推定装置である。

第２態様は、第１態様の推定装置において、
前記電気特性は、体積抵抗であり、
胴体部を前記基体とし、前記胴体部に連結される手部及び脚部の少なくとも一方を前記突出部とするロボットを前記可動体とし、
前記柔軟材料は、前記ロボットの手部及び脚部の少なくとも一方の骨格の周囲に配置される。

第３態様は、第１態様又は第２態様の推定装置において、
前記柔軟材料は、前記突出部の外側に装着可能な外部部材に配置される。

第４態様は、第１態様から第３態様の何れか１態様の推定装置において、
前記付与刺激状態は、人体及び物体の少なくとも一方について、表面形状を示す状態、表面材質を示す状態、重さを示す状態、及び硬さを示す状態の少なくとも１状態を含む。

第５態様は、第１態様から第４態様の何れか１態様の推定装置において、
前記柔軟材料は、繊維状及び網目状の少なくとも一方の構造、又は内部に微小な空気泡が複数散在する構造のウレタン材の少なくとも一部に導電性が付与された材料を含む。

第６態様は、第５態様の推定装置において、
前記柔軟材料は、表面から前記突出部の内部に向かうに従って硬さが硬くなる材料で形成されるか、又は表面から前記突出部の内部に向かうに従って硬さが硬くなるように硬さが異なる複数の材料を積層して形成される。

第７態様は、第１態様から第６態様の何れか１態様の推定装置において、
前記学習モデルは、前記柔軟材料をリザーバとして当該リザーバを用いたリザーバコンピューティングによるネットワークを用いて学習させることで生成されたモデルを含む。

第８態様は、
コンピュータが
導電性を有し、かつ与えられた圧力の変化に応じて電気特性が変化する柔軟材料であって、可動体の基体から屈曲可能な突出部の少なくとも一部を覆って配置されるかまたは覆うことが可能な前記柔軟材料に予め定められた複数の検出点間の電気特性を検出する検出部から前記電気特性を取得し、
前記柔軟材料に圧力を与えた際の時系列の電気特性と、前記柔軟材料に圧力を与える付与刺激状態を示す付与刺激状態情報とを学習用データとして用いて、前記時系列の電気特性を入力とし、前記付与刺激状態情報を出力するように学習された学習モデルに対して、前記取得された時系列の電気特性を入力し、入力した時系列の電気特性に対応する付与刺激状態を示す付与刺激状態情報を推定する
推定方法である。

第９態様は、
コンピュータに
導電性を有し、かつ与えられた圧力の変化に応じて電気特性が変化する柔軟材料であって、可動体の基体から屈曲可能な突出部の少なくとも一部を覆って配置されるかまたは覆うことが可能な前記柔軟材料に予め定められた複数の検出点間の電気特性を検出する検出部から前記電気特性を取得し、
前記柔軟材料に圧力を与えた際の時系列の電気特性と、前記柔軟材料に圧力を与える付与刺激状態を示す付与刺激状態情報とを学習用データとして用いて、前記時系列の電気特性を入力とし、前記付与刺激状態情報を出力するように学習された学習モデルに対して、前記取得された時系列の電気特性を入力し、入力した時系列の電気特性に対応する付与刺激状態を示す付与刺激状態情報を推定する
処理を実行させるための推定プログラムである。

第１０態様は、
導電性を有し、かつ与えられた圧力の変化に応じて電気特性が変化する柔軟材料であって、可動体の基体から屈曲可能な突出部の少なくとも一部を覆って配置されるかまたは覆うことが可能な前記柔軟材料に予め定められた複数の検出点間の電気特性を検出する検出部で検出された前記電気特性を入力とし、前記柔軟材料に圧力を与える付与刺激状態を示す付与刺激状態情報を出力する学習モデルを生成する学習モデル生成部
を含む学習モデル生成装置である。

本開示によれば、特殊な検出装置を用いることなく、導電性を有する柔軟材料の電気特性を利用して、柔軟材料に圧力を与える付与刺激状態を推定することができる、という効果を有する。

実施形態に係る状態推定装置の構成の一例を示す図である。実施形態に係るロボットに関する図である。実施形態に係るロボットの腕部に関する図である。実施形態に係るロボットの外郭部に関する図である。実施形態に係るロボットの外郭部の硬さに関する図である。実施形態に係るロボットに関する図である。実施形態に係るロボットに関する図である。実施形態に係る導電性を有する部材の検出点に関する図である。実施形態に係る導電性を有する部材に関する図である。実施形態に係る導電性を有する部材に関する図である。実施形態に係る導電性を有する部材に関する図である。実施形態に係る学習処理に関する図である。実施形態に係る学習データ収集処理の一例を示すフローチャートである。実施形態に係る学習処理部における学習処理に関する図である。実施形態に係る学習処理の流れの一例を示すフローチャートである。実施形態に係る学習処理部における学習処理に関する図である。実施形態に係る状態推定装置の構成の一例を示す図である。実施形態に係る推定処理の流れの一例を示すフローチャートである。実施形態に係るロボットに関係する特性を示す図である。実施形態に係る手袋の一例を示す図である。

以下、図面を参照して本開示の技術を実現する実施形態を詳細に説明する。
なお、作用、機能が同じ働きを担う構成要素及び処理には、全図面を通して同じ符合を付与し、重複する説明を適宜省略する場合がある。また、本開示は、以下の実施形態に何ら限定されるものではなく、本開示の目的の範囲内において、適宜変更を加えて実施することができる。また、本開示では、主として非線形に変形する部材に対する物理量の推定を説明するが、線形に変形する部材に対する物理量の推定に適用可能であることは言うまでもない。

本開示において「柔軟材料」とは、外部力が与えられることによって少なくとも一部が撓み等のように変形可能な材料を含む概念であり、ゴム材料等の柔らかい弾性体、繊維状及び網目状の少なくとも一方の構造体、及び内部に微小な空気泡が複数散在する構造体を含む。繊維状及び網目状の少なくとも一方の構造体は、繊維状及び網目状の少なくとも一方を骨格として有する構造体でもよい。外部力の一例には圧力が挙げられる。繊維状及び網目状の少なくとも一方の構造体、及び内部に微小な空気泡が複数散在する構造体の一例には、ウレタン材などの高分子材料が挙げられる。「導電性が付与された柔軟材料」とは、導電性を有する材料を含む概念であり、導電性を付与するために導電材を柔軟材料に付与した材料、及び柔軟材料が導電性を有する材料を含む。また、導電性が付与された柔軟材料は、変形に応じて電気特性が変化する機能を有する。なお、変形に応じて電気特性が変化する機能を生じさせる物理量の一例には柔軟材料に与えられる圧力による刺激（以下、圧力刺激という。）を示す圧力値が挙げられる。柔軟材料の変形に応じて変化する電気特性を表す物理量の一例には、電気抵抗値が挙げられる。また、他例には、電圧値、又は電流値が挙げられる。電気抵抗値は、柔軟材料の体積抵抗値と捉えることが可能である。

柔軟材料は、導電性を与えることで、圧力による変形に応じた電気特性が現れる。すなわち、導電性が付与された柔軟材料は、電気経路が複雑に連携し、変形に応じて電気経路が伸縮したり膨縮したりする。また、電気経路が一時的に切断される挙動、及び以前と異なる接続が生じる挙動を示す場合もある。従って、柔軟材料は、所定距離を隔てた位置（例えば電極が配置された検出点の位置）の間では、与えられた力（例えば圧力刺激）の大きさや分布に応じて異なる電気特性を有する挙動を示す。このため、柔軟材料に与えられた力（例えば圧力刺激）の大きさや分布に応じて電気特性が変化する。

なお、導電性が付与された柔軟材料を用いるため、人体及び物体等によって柔軟材料に圧力が与えられる箇所の全てに電極等の検出点を設ける必要はない。柔軟材料の圧力が与えられる箇所を挟む任意の少なくとも２箇所に電極等の検出点が設けられていればよい。

本開示において可動体とは、１パーツによる可動体または一部のパーツが可動可能な複数のパーツが連携して構成されるロボットを含む概念である。また、可動体は、人体の一部の部位に適用可能である。突出部は、ロボット等を構成する基体（例えば、ボデーや胴体）から突出し、かつ当該基体に対して相対的に移動可能な頭部、腕部及び脚部等のパーツや部位を含む概念である。なお、突出部は、例えば、腕部における指や指を備える手部等のように部分体を備えることが可能である。突出部には、柔軟材料が配置される。

また、本開示において付与刺激状態とは、柔軟材料に可動体以外の外部から圧力を与える外部の人体及び物体の少なくとも一方の状態を含む概念である。つまり、付与刺激状態は、外部の人体の状態、外部の物体の状態、並びに、外部の人体及び物体の状態を含む。なお、以下の説明では、柔軟材料に可動体以外の外部から圧力を与える外部の人体及び物体の少なくとも一方を区別することなく、ヒトとモノとを含む概念として人物と総称して説明する。具体的には、人体及び物体のそれぞれの単体、及び人体と物体の組み合わせを人物と称する。例えば、付与刺激状態は、接触状態、形状状態、及び物理状態の少なくとも１状態を含む。接触状態は、柔軟材料と外部の人物とが接触される状態を含む。なお、接触状態は、柔軟材料と外部の人物との間に予め定められた部材が介在する場合を含む。例えば、接触状態は、予め定められた部材を介して柔軟材料と外部の人物との間に相対的にエネルギの授受が生じて柔軟部材が変形する状態であればよい。形状状態は、人物の表面形状、表面の質感及び表面の触感の何れかを示す状態を含む。物理状態は、人物に関する物理的な状態であり、人物からの圧力、人物の重さ、及び人物の硬さを示す状態を含む。

なお、付与刺激状態は、可動体における能動形態を示す状態（以下、能動形態状態という。）及び受動形態を示す状態（以下、受動形態状態という。）の何れかの状態下において表れる。能動形態状態は、柔軟材料が配置された可動体によって示される可動体の立ち振る舞い、及び動き等の動的な形態を示す状態を含む概念である。受動形態状態は、可動体の姿勢等の柔軟材料に外部から圧力等のエネルギが与えられる際の静的な形態を示す状態を含む概念である。能動形態を示す状態の一例には、可動体の動きを示す挙動状態が挙げられる。受動形態を示す状態の一例には、可動体の姿勢を示す姿勢状態が挙げられる。

本開示の推定装置は、学習済みの学習モデルを用いて、可動体に配置された導電性を有する柔軟材料における電気特性から付与刺激状態を推定する。柔軟材料は、可動体（例えば、ロボット等）の基体（例えば、胴体）と相対的に移動可能に基体から突出した突出部（例えば、頭部、手部及び脚部等の何れか）の少なくとも一部を覆うように配置される。学習モデルは、導電性を有する柔軟材料に圧力を与えた際の時系列の電気特性と、その柔軟材料に圧力を与える人物の付与刺激状態を示す付与刺激状態情報とを学習用データとして用いる。学習モデルは、時系列の電気特性を入力とし、その時系列の電気特性に対応する付与刺激状態を示す付与刺激状態情報を出力するように学習される。

本実施形態では、可動体としてロボットを適用した場合を説明する。また、導電性を有する柔軟材料としてウレタン部材の全部または少なくとも一部に導電材料が浸潤されたシート部材（以下、導電性ウレタンという。）が、ロボットの少なくとも一部の外郭部に配置された場合を説明する。また、導電性ウレタンを変形させる物理量としてはロボット、すなわち柔軟材料に与えられる圧力刺激を示す値（圧力値）を適用する。なお、圧力刺激に応じて変化する物理量としては、導電性ウレタンの電気抵抗値を適用した場合を説明する。

図１に、本開示の推定装置としての状態推定装置１の構成の一例を示す。

状態推定装置１における推定処理は、学習済みの学習モデル５１を用いて、ロボットに配置された導電性ウレタン２２における電気特性から、未知の人物の付与刺激状態として、ロボット外部の人物の表面形状、表面の質感及び表面の触感等の状態、並びに外部の人物の接触状態の何れかを推定し、出力する。これにより、特殊な装置や大型の装置を用いて計測することなく、ロボットに圧力を与える人物の表面形状、表面の質感及び表面の触感等の状態、並びに外部の人物の接触状態等の人物の付与刺激状態を推定することが可能となる。学習モデル５１は、付与刺激状態（例えば、付与刺激状態を示す状態値）をラベルとし、当該付与刺激状態における導電性ウレタンの電気特性（例えば、電気抵抗値）を入力として学習される。学習モデル５１の学習については後述する。

ここで、本開示の技術に関係するロボットの構造を説明する。図２に、ロボットの構造例として、人型に模した人型ロボット２００の構造を示す。
図２に示す人型ロボット２００は、頭部２１０、胴体部２２０、腕部２３０（上腕２３２、前腕２３４、手２３６）、脚部２４０（大腿２４２、下腿２４４、足２４６）の各々のパーツが骨格２１によって連結される。人型ロボット２００は、骨格２１の周囲に導電性ウレタン２２を配置することで、人型ロボット２００の外側である外郭に導電性ウレタン２２が配置される。人型ロボット２００に配置された導電性ウレタン２２は、電極等の検出点７５を介して電気特性検出部７６（図８）に接続される。

例えば、図３に上腕２３２の概略構造の一例を断面図で示すように、上腕２３２の骨格２１の周囲に、人工筋肉などの構造物を含む内部層２５が配置され、内部層２５の周囲に表皮としても機能する外郭部２７が配置される。なお、骨格２１の周囲に表皮として機能する外郭部２７を配置してもよい。

導電性ウレタン２２は、骨格２１の周囲に配置する材料、すなわち外郭部２７の少なくとも一部に配置すればよく、内部に配置してもよいし外部に配置してもよい（図４）。具体的な一例には、外郭部２７のＡ－Ａ断面を外郭断面２７－１として示すように、外郭部２７の内部を全て導電性ウレタン２２で構成しても良い。また、外郭断面２７－２に示すように、外郭部２７の外側（表面側）の一部に導電性ウレタン２２を形成しても良く、外郭断面２７－３に示すように、外郭部２７の内側（骨格側）に導電性ウレタン２２を形成しても良い。さらに、外郭断面２７－４に示すように、外郭部２７の内部の一部に導電性ウレタン２２を形成しても良い。また、外郭断面２７－５に示すように、外郭部２７を構成する柔軟性を有する材料２７Ａの外側に導電性ウレタン２２を配置しても良く、外郭断面２７－６に示すように、外郭部２７の内側（骨格側）の外部に導電性ウレタン２２を配置しても良い。導電性ウレタン２２を外郭部２７を構成する材料２７Ａの外部に配置する場合、導電性ウレタン２２と外郭部２７を構成する材料とを積層するのみでもよく、導電性ウレタン２２と外郭部２７を構成する材料とを接着等により一体化してもよい。なお、導電性ウレタン２２を外郭部２７を構成する材料の外部に配置する場合であっても、導電性ウレタン２２が導電性を有するウレタン部材であるため、外郭部２７を構成する材料の柔軟性は阻害されない。

また、導電性ウレタン２２は、所定の硬さの柔軟性を有するように形成してもよく、例えば、図５に示すように、深さに応じて硬さが変化する柔軟性を有するように形成してもよい。図５はロボットの外郭部の硬さに関する概念図であり、紙面左側に導電性ウレタン２２の構造に関する概念図を示し、紙面右側に導電性ウレタン２２の深さと硬さの関係の概念図を示す。図５に示す例では、外郭断面２７－７として示す外郭部２７を導電性ウレタン２２で構成する場合、外郭部２７の外側（表面側）から内側（骨格側）に向かうに従って、すなわち深さが深くなるのに従って徐々に硬さが硬くなるように導電性ウレタン２２を形成することが可能である。また、外郭断面２７－８に示すように、硬さが異なる複数の導電性ウレタン２２（硬さ：２２Ｘ＜２２Ｙ＜２２Ｚ）を配置しても良い。導電性ウレタン２２を含む外郭部２７の硬さ（柔軟性）を深さに応じて変化するように構成することで、人体の表皮部分に近い触感を提供することが可能である。

以降では、説明を簡単にするため、本開示のロボットの一例として、図６に示す簡易型のロボットハンドをロボットハンド２として適用した場合を説明する。図６に示すロボットハンド２は図２に示すロボットの腕部２３０に含まれる手２３６のパーツに対応する。

図６に示すように、ロボットハンド２は、ベース部２３７及びベース部２３７に連結された複数（図３に示す例では、３つ）の指部２３８を含んでロボットハンドを構成する。各指部２３８は、流体供給等により屈曲可能な構成となっており（詳細は後述）、屈曲の度合いに応じた指形態を形成する。図６では、各指部２３８の先端が所定の初期間隔で位置する指形態２３６－１、各指部２３８の先端が接近する指形態２３６－２、及び各指部２３８の先端が離間する指形態２３６－３が一例として示されている。

図６に示すロボットハンド２では、指部２３８の各々の外側に導電性ウレタン２２を含む外郭部２７が配置される。すなわち、ロボットハンド２の指部２３８の各々は、骨格２１を含み、骨格２１の周囲に外郭として導電性ウレタン２２を配置して外郭部２７を形成する。なお、ベース部２３７は骨格としても機能する。各指部２３８の外郭部２７は、導電性ウレタン２２を含む１枚のシートで構成して配置してもよく、少なくとも１つに導電性ウレタン２２を含む複数のシートを配置してもよい。複数シートにより外郭部２７を形成する場合、シートの一部が重複するように配置してもよい。導電性ウレタン２２は、電極等の検出点７５を介して電気特性検出部７６（図８）に接続される。

指部２３８は、ベース部２３７を支点として、屈曲可能に形成される。指部２３８を屈曲可能に形成する構成には、線形又は非線形に変形する弾性体を含む部材が適用可能であり、付与された物理量（例えば圧力や流体の供給）により所定方向に収縮力を発生する弾性収縮体が一例として挙げられる。弾性収縮体の一例には、公知技術のエアバッグタイプの部材を適用可能である（例えば、特公昭52-40378号参照）。エアバッグタイプの弾性収縮体（例えば、ラバーアクチュエータ）は、ゴム部材等の柔らかい弾性体で構成される管状体の外周を、有機又は無機高張力繊維、例えば芳香族ポリアミド繊維の編組み補強構造により被覆した本体を有し、両端開口を閉塞部材によって封止したものである。ラバーアクチュエータは、その閉塞部材に設けられた接続口を介して内部空洞に加圧流体が供給されることによって膨径変形し、軸線方向に沿って収縮力が発生するようになっている。このラバーアクチュエータは、膨径変形によって、ラバーアクチュエータの長さが変化する。ただし、ラバーアクチュエータを適用対象とするのはあくまで一例に過ぎず、本開示の推定装置はラバーアクチュエータ以外の部材、例えば人口筋肉にも適用可能である。

ロボットハンド２は、図示しない弾性収縮体の駆動によって、図６に指形態２３６－１～２３６－３として示すように、指部２３８が屈曲する。指部２３８の作動（屈曲）によって、人物を把持したり、把持を解除する人体の手を模擬することが可能となる。図６に示す例は、指形態２３６－１が初期形態、指形態２３６－２が把持形態、そして指形態２３６－３が把持を解除する開放形態の一例である。

また、ロボットハンド２は、ベース部２３７に、ロボットハンド２の制御を行う制御装置２５０が備えられている（図１７）。制御装置２５０は、状態推定装置１として動作する機能部を含む。

なお、ロボットハンド２は、パーツである各指部２３８を、流体供給等によって屈曲するための駆動部１１９（図１７）を備えている。駆動部１１９（図１７）の駆動によって、各指部２３８が屈曲し、各種の指形態を形成することが可能となる。よって、ロボットハンド２を備えたロボットは、自立型ロボットシステムとして動作する。

本実施形態では、ロボットハンド２として、ベース部２３７に連結された３つの指部２３８によりロボットハンドを構成する一例を説明するが、指部２３８は３つに限定されるものではなく、２つであってもよく、４つ以上であってもよい。また、各指部２３８は、同一形状であることに限定されない。例えば、人体の指を模して異なる形状に形成してもよいことは勿論である。

また、本実施形態では、各指部２３８が骨格２１の周囲に導電性ウレタン２２を配置して外郭部２７を形成するロボットハンド２を説明するが（図６）、ロボットハンド２の構成は各指部２３８の周囲に導電性ウレタン２２を配置ことに限定されない。例えば、図７にロボットハンド２Ａとして示すように、ベース部２３７に連結され、骨格２１を備えた複数の指部２３８Ａの周囲に導電性ウレタン２２を配置して手２３６の外郭部２７を形成してもよい。また、ロボットハンド２は、複数の指部２３８を備えることに限定されない。例えば、図７にロボットハンド２Ｂとして示すように、骨格２１を備えた指部２３８Ｂからなる手の周囲に導電性ウレタン２２を配置して手２３６の外郭部２７を形成してもよい。ロボットハンド２Ｂでは、握った状態の手を模擬することが可能となる。一方、ロボットハンド２は、曲面を備えることに限定されない。例えば、図７にロボットハンド２Ｃとして示すように、骨格２１を備えた指部２３８Ｂからなる平坦な手の周囲に導電性ウレタン２２を配置して手２３６の外郭部２７を形成してもよい。ロボットハンド２Ｃでは、掌や甲を模擬することが可能となる。

ところで、状態推定装置１は、付与刺激状態を推定するために、ロボットハンド２に配置された導電性ウレタン２２における電気特性を検出する。

図８に示すように、距離を隔てて配置された複数（図８では２個）の検出点７５からの信号によって、導電性ウレタン２２の電気特性（すなわち、電気抵抗値である体積抵抗値）を検出することが可能である。図８は、外郭部２７の一部として配置された導電性ウレタン２２を平面展開した場合を例示した。また、図８では、導電性ウレタン２２上の側辺部分に検出点７５を偏らせて、導電性ウレタン２２上で距離を隔てて対角位置に配置された複数の検出点７５からの信号により電気抵抗値を検出する検出セット＃１が示されている。なお、複数の検出点７５の配置は、図８に示す位置に限定されるものではなく、導電性ウレタン２２の電気特性を検出可能な位置であれば何れの位置でもよい。例えば、複数の検出点７５を離間して配置すればよく、側辺部分への配置に限定されず、中央部であってもよく、側辺部分と中央部分との組み合わせであってもよい。また、導電性ウレタン２２の電気特性は、電気特性（すなわち、電気抵抗値である体積抵抗値）の検出する電気特性検出部７６を検出点７５に接続し、その出力を用いればよい。

外郭部２７に導電性ウレタン２２を備えて構成されるロボットハンド２において検出される電気抵抗値は、ロボットハンド２の外郭部２７に圧力刺激が与えられる等の導電性ウレタン２２の変形によって、その変形の前後で変化する。よって、時系列の電気抵抗値の検出、すなわち、ロボットハンド２に圧力刺激が与えられていない状態からの電気抵抗値の変化を検出（例えば予め定めた閾値を超えた電気抵抗値を検出）することで、ロボットハンド２に圧力を与える人物の付与刺激状態を検出することが可能となる。具体的には、ロボットハンド２に対する人物の付与刺激状態は、ロボットハンド２に対する人物の接触であっても圧力刺激を伴うため、接触状態を含む。よって、ロボットハンド２に導電性ウレタン２２を配置することで、ロボットハンド２に対する人物の接触を含む付与刺激状態を検出可能となる。また、ロボットハンド２に与えられた圧力刺激の位置や分布、及び大きさの何れか１つが変化しても電気抵抗値は変化する。従って、時系列に変化した電気抵抗値から、ロボットハンド２に対する人物の接触位置を含む付与刺激状態を検出することも不可能ではない。

ロボットハンド２に配置される導電性ウレタン２２を含む外郭部２７は、ロボットハンド２の外側を一体構造として導電性ウレタン２２を含む外郭部２７を形成してもよく、指部等のパーツ毎に独立した導電性ウレタン２２を含む外郭部２７を形成してもよい。

なお、１つの導電性ウレタン２２の電気特性の検出精度を向上するため、図８に示す検出点（２個）より多くの検出点を用いてもよい。

一例としては、各々検出点が配置された複数の導電性ウレタン片からなる列を１列または複数列並べて導電性ウレタン２２を形成し、複数の導電性ウレタン片毎に電気特性を検出してもよい。例えば、導電性ウレタン片２３（図９）を、配列して導電性ウレタン２２を構成してもよい（図１０、図１１）。図９に示す例は、距離を隔てて対角位置に配置された検出点７５Ａからの信号により電気抵抗値を検出する第１の検出セット＃１と、他の対角位置に配列された検出点７５Ｂからの信号により電気抵抗値を検出する第２の検出セット＃２とを示している。また、図１０に示す例では、導電性ウレタン片２３（図９）を、外郭部２７の長手方向に配列（４ｘ１）して導電性ウレタン２２を構成し、順に、第１の検出セット＃１から第８の検出セット＃８を構成することを示している。さらに、図１１に示す例では、導電性ウレタン片２３（図９）において各々第１の検出セット＃１を採用し、外郭部２７の長手方向及び幅方向に配列（４ｘ２）して導電性ウレタン２２を構成し、第１の検出セット＃１から第８の検出セット＃８を構成することを示している。

また、他例としては、導電性ウレタン２２上における検出範囲を分割して分割した検出範囲毎に検出点を設けて検出範囲毎に電気特性を検出してもよい。例えば、図１０及び図１１に示す導電性ウレタン片２３の大きさに相当する領域を検出範囲として導電性ウレタン２２に設定し、設定した検出範囲毎に検出点を配置して、検出範囲毎に電気特性を検出すればよい。

図１に示すように、状態推定装置１は、推定部５を備えている。推定部５には、導電性ウレタン２２における電気抵抗の大きさ（電気抵抗値）を表す時系列の電気特性である入力データ４が入力される。具体的には、導電性ウレタン２２の検出点７５に接続された電気特性検出部７６から出力される電気特性（すなわち、電気抵抗値である体積抵抗値）が入力される。入力データ４は、ロボットハンド２の付与刺激状態３に対応する。また、推定部５は、推定結果として付与刺激状態３を示す物理量（付与刺激状態値）を表す出力である出力データ６を出力する。なお、推定部５は、学習済みの学習モデル５１を含む。

学習モデル５１は、付与刺激状態３に応じた圧力刺激により変化する導電性ウレタン２２の電気抵抗（入力データ４）から、付与刺激状態、すなわちロボットハンド２における能動形態状態又は受動形態状態（出力データ６）を導出する学習を済ませたモデルである。学習モデル５１は、例えば、学習済みのニューラルネットワークを規定するモデルであり、ニューラルネットワークを構成するノード（ニューロン）同士の間の結合の重み（強度）の情報の集合として表現される。

学習モデル５１は、学習処理部５２（図１２）の学習処理により生成される。学習処理部５２は、付与刺激状態３により生じる圧力刺激で変化する導電性ウレタン２２における電気特性（入力データ４）を用いて学習処理を行う。すなわち、付与刺激状態３をラベルとして導電性ウレタン２２における電気抵抗を時系列に測定した大量のデータを学習データとする。具体的には、学習データは、電気抵抗値（入力データ４）を含んだ入力データと、その入力データに対応する付与刺激状態３を示す情報（出力データ６）と、のセットを大量に含む。ここでは、導電性ウレタン２２の電気抵抗値（入力データ４）の各々に測定時刻を示す情報を付与することで時系列情報が対応付けられる。この場合、付与刺激状態３として定まる期間について、導電性ウレタン２２における時系列の電気抵抗値のセットに測定時刻を示す情報を付与して時系列情報を対応付けてもよい。

次に、学習処理部５２について説明する。
学習処理部５２が行う学習処理では、上述した導電性ウレタン２２が配置されたロボットハンド２の外郭部２７が検出部として適用され、付与刺激状態３、及び導電性ウレタン２２による電気抵抗値（入力データ４）が学習データとして用いられる。

例えば、能動形態状態及び受動形態状態における付与刺激状態を示すデータを学習データとする。具体的には、ロボットハンド２の少なくとも一部のパーツによる所定の姿勢や動き等の挙動となるように駆動部１１９の駆動制御を行い、そのときの電気抵抗値を検出して、付与刺激状態（付与刺激状態値）と対応付けて学習データとする。

能動形態状態では、ロボットハンド２は、動き等によって外郭部２７が変形して、導電性ウレタン２２の電気抵抗値が変化する。従って、能動形態状態における時系列の電気抵抗値には、付与刺激状態の特徴を示すデータが含まれる。よって、時系列の電気抵抗値を検出して、付与刺激状態（付与刺激状態値）と対応付けて学習データとすればよい。なお、能動形態状態における時系列の電気抵抗値の成分を分離する場合は、付与刺激状態が存在しない状態、例えば無負荷の状態による能動形態状態での時系列の電気抵抗値と、当該能動形態状態における付与刺激状態での時系列の電気抵抗値との相違成分（例えば差分）を、付与刺激状態と対応付けて学習データとしてもよい。

一方、受動形態状態では、ロボットハンド２の少なくとも一部のパーツによる所定の姿勢となるように駆動部１１９の駆動制御を行い、そのときの電気抵抗値を検出して、付与刺激状態（付与刺激状態値）と対応付けて学習データとすればよい。具体的には、所定姿勢のロボットハンド２に対して、人物を接触させたり、人物を押圧したりする付与刺激状態を生じさせ、そのときの電気抵抗値を検出して、付与刺激状態と対応付けて学習データとする。

学習処理部５２は、図示しないＣＰＵを含むコンピュータを含んで構成可能であり、学習データ収集処理及び学習処理を実行する。図１３に、図示しないＣＰＵが実行する学習データ収集処理の一例を示す。学習処理部５２は、ステップＳ１００で、ロボットハンド２の状態（能動形態状態又は受動形態状態）でロボットハンド２に圧力を与え、ステップＳ１０２で、付与刺激状態に応じて変化する導電性ウレタン２２の電気抵抗値を時系列に取得する。次のステップＳ１０４では、取得した時系列の電気抵抗値に付与刺激状態３を示す付与刺激状態値をラベルとして付与して、記憶する。学習処理部５２は、これら付与刺激状態値、及び導電性ウレタン２２の電気抵抗値のセットが予め定めた所定数、又は予め定めた所定時間に達するまで（ステップＳ１０６で、肯定判断されるまで否定判断し）、上記処理を繰り返す。これにより、学習処理部５２は、付与刺激状態３毎に、導電性ウレタン２２における電気抵抗値を時系列に取得し、記憶することが可能となり、記憶された付与刺激状態毎の時系列の導電性ウレタン２２の電気抵抗値のセットが学習データとなる。

ところで、ロボットハンド２に対する人物の接触等では、人物が外郭部２７に接触する付勢力（押圧力）が大きくなるのに従って、電気特性（電気抵抗値）が大きく変化する。従って、時系列の電気特性が接触検出用に予め定めた閾値を超えること検出することで、少なくとも人物が外郭部２７に接触したことを示す付与刺激状態を検出可能である。よって、少なくとも人物が外郭部２７に接触した付与刺激状態を推定可能に学習処理を実行するのであれば、接触を特定する付勢力（押圧力）に対応する時系列の電気特性を学習データとすればよい。

図１９に、ロボットハンド２における電気特性の一例を示す。図１９は、ロボットハンド２の先端部を、異なる付勢力（ピーク値Ｐ１～Ｐ８の押圧力）によって人物が押圧した際の導電性ウレタン２２の電気特性を示す。また、ピーク値Ｐ１～Ｐ７は、人物が接触に至らない付与刺激状態とし、ピーク値Ｐ８は、人物が接触したときの付与刺激状態とする。

図１９に示すように、導電性ウレタン２２の時系列の電気特性（各ピーク値Ｐ１～Ｐ８を含む前後の電気特性）の各々が、付勢力（押圧力）に応じて接触し、付与刺激状態における特徴パターンである。すなわち、ロボットハンド２が人物により押圧されると、電気抵抗値が急激に上昇し、押圧が解除（ユーザの手が離間）されると電気抵抗値が徐々に低下するパターンが、特徴パターンとして現れている。図１９に示す例では、ピーク値Ｐ１～Ｐ７に比べて、ピーク値Ｐ８が大きい電気抵抗値となっている。このため、ピーク値Ｐ１～Ｐ７を超える電気抵抗値を閾値ｔｈに定めることで、人物が外郭部２７に接触した付与刺激状態を検出可能である。よって、学習処理部５２は、接触した付与刺激状態を特定する付勢力（押圧力）に対応する時系列の電気特性を学習データとして学習する。

一方、接触検出に限定しない付与刺激状態は、ロボットハンド２における各パーツの位置、又は複数のパーツの相対的な位置関係、各パーツにおける圧力刺激の分布、大きさ、及び頻度等の各物理量により同定可能である。従って、導電性ウレタン２２の時系列の電気特性には、付与刺激状態を示す時系列の物理量の特徴が含まれる。本実施形態では、導電性ウレタン２２を用いることで、これらの物理量が反映された電気特性（体積抵抗）を時系列に検出することが可能である。

従って、付与刺激状態に応じてロボットハンド２における圧力刺激が変化し、その圧力刺激の変化に対応する電気特性を時系列に取得することで、付与刺激状態に時系列の電気特性を対応付けて記憶することが可能となる。当該時系列の電気特性および付与刺激状態を示す付与刺激状態値とのセットを学習データとすることが可能となる。

次に、上述した学習データの一例を表で示す。表１は、付与刺激状態に関する学習データとして、時系列の電気抵抗値データ（ｒ）と付与刺激状態能動形態状態値とを対応付たデータの一例である。表２は、ロボットハンド２における部位ごとの時系列の電気抵抗値データ（Ｒ）を示すデータの一例である。表３は、ロボットハンド２における各指部で検出された時系列の電気抵抗値を示す特性データ（Ｊ）のセットと、付与刺激状態値とを対応付たデータの一例である。

表１に示す例は、付与刺激状態に含まれる接触状態、形状状態、及び物理状態の各状態について、対象となる人物の部位、及び性質を適用とし、当該状態に対応する触感、質感、物理量を示す値を対応付けた学習データである。

表２に示す例は、ロボットハンド２に与えられる圧力を検出する部位として、指先、指腹、付け根、及び掌、甲、側面を含む。表２に示すデータは、表１に示すデータの各々に含むようにしてもよい。例えば、ｒ１１＝（Ｒ１１１、Ｒ１１２、Ｒ１１３、・・・、Ｒ１１ｍ：ｎ＝ｍ）とすることが可能である。

表３に示す例は、ロボットハンド２における各パーツが連携することを考慮して、各パーツで検出された時系列の電気抵抗値を示す特性データ（Ｊ）のセットと、付与刺激状態値とを対応付た学習データである。ロボットハンド２では、各セットに含まれる何れかの特性データ（Ｊ）に付与刺激状態の特徴、すなわち、特徴パターンが含まれる。よって、各特性データ（Ｊ）は、全て学習データとして用いることが可能である。例えば、ロボットハンド２を構成する３つの指部２３６の各々で検出された電気抵抗値の変動を含む特性データ（Ｊ）の組み合わせから付与刺激状態を同定可能である。例えば３つの指部２３６において２以上の部位で電気抵抗値が押圧方向に変動したことで「物を把持」を同定可能であり、２以上の部位で閾値以内の電気抵抗値の変動から急激に変化する場合に「握りそこね」や「把持解除」を同定可能である。また、閾値以内の電気抵抗値の変動からの変動幅の大きさから人物の把持に人物の位置がずれる「すべり」を同定可能である。

次に、学習処理部５２における学習処理ついて説明する。図１４は、学習処理において学習処理部５２の図示しないＣＰＵにおける機能を示す図である。
学習処理部５２の図示しないＣＰＵは、生成器５４及び演算器５６の機能部を含む。生成器５４は、入力である時系列に取得された電気抵抗値の前後関係を考慮して出力を生成する機能を有する。

また、学習処理部５２は、学習用データとして、上述した入力データ４（電気抵抗値）と、入力データ４（電気抵抗値）に対応する付与刺激状態３である出力データ６とのセットを多数保持している。

生成器５４は、入力層５４０、中間層５４２、および出力層５４４を含んで、公知のニューラルネットワーク（ＮＮ：Neural Network）を構成する。ニューラルネットワーク自体は公知の技術であるため詳細な説明は省略するが、中間層５４２は、ノード間結合およびフィードバック結合を有するノード群（ニューロン群）を多数含む。その中間層５４２には、入力層５４０からのデータが入力され、中間層５４２の演算結果のデータは、出力層５４４へ出力される。

生成器５４は、入力された入力データ４（電気抵抗）から付与刺激状態を表す生成出力データ６Ａを生成するニューラルネットワークである。生成出力データ６Ａは、入力データ４（電気抵抗）から付与刺激状態を推定したデータである。生成器５４は、時系列に入力された入力データ４（電気抵抗）から、付与刺激状態に近い状態を示す生成出力データを生成する。生成器５４は、多数の入力データ４（電気抵抗）を用いて学習することで、ロボットハンド２すなわち導電性ウレタン２２に圧力刺激が与えられる付与刺激状態に近い生成出力データ６Ａを生成できるようになる。他の側面では、時系列に入力された入力データ４である電気特性をパターンとして捉え、当該パターンを学習することで、ロボットハンド２すなわち導電性ウレタン２２に圧力刺激が与えられる付与刺激状態に近い生成出力データ６Ａを生成できるようになる。

演算器５６は、生成出力データ６Ａと、学習データの出力データ６とを比較し、その比較結果の誤差を演算する演算器である。学習処理部５２は、生成出力データ６Ａ、および学習データの出力データ６を演算器５６に入力する。これに応じて、演算器５６は、生成出力データ６Ａと、学習データの出力データ６との誤差を演算し、その演算結果を示す信号を出力する。

学習処理部５２は、演算器５６で演算された誤差に基づいて、ノード間の結合の重みパラメータをチューニングする、生成器５４の学習を行う。具体的には、生成器５４における入力層５４０と中間層５４２とのノード間の結合の重みパラメータ、中間層５４２内のノード間の結合の重みパラメータ、および中間層５４２と出力層５４４とのノード間の結合の重みパラメータの各々を例えば勾配降下法や誤差逆伝搬法等の手法を用いて、生成器５４にフィードバックする。すなわち、学習データの出力データ６を目標として、生成出力データ６Ａと学習データの出力データ６との誤差を最小化するように全てのノード間の結合を最適化する。

学習モデル５１は、学習処理部５２の学習処理により生成される。学習モデル５１は、学習処理部５２による学習結果のノード間の結合の重みパラメータ（重み又は強度）の情報の集合として表現される。

図１５に学習処理の流れの一例を示す。学習処理部５２は、ステップＳ１１０で、時系列に測定した結果の学習データである、付与刺激状態を示す情報をラベルとした入力データ４（電気抵抗）を取得する。学習処理部５２は、ステップＳ１１２で、時系列に測定した結果の学習データを用いて学習モデル５１を生成する。すなわち、上記のようにして多数の学習データを用いて学習した学習結果のノード間の結合の重みパラメータ（重み又は強度）の情報の集合を得る。そして、ステップＳ１１４で、学習結果のノード間の結合の重みパラメータ（重み又は強度）の情報の集合として表現されるデータを学習モデル５１として記憶する。

なお、生成器５４は、時系列入力の前後関係を考慮して出力を生成する機能を有する再帰型ニューラルネットワークを用いてもよく、他の手法を用いてもよい。

そして、上記状態推定装置１では、以上に例示した手法により生成した学習済みの生成器５４（すなわち、学習結果のノード間の結合の重みパラメータの情報の集合として表現されるデータ）を学習モデル５１として用いる。十分に学習した学習モデル５１を用いれば、ロボットハンド２、すなわち外郭部２７に配置された導電性ウレタン２２における時系列の電気抵抗値から付与刺激状態を同定することも不可能ではない。

なお、学習処理部５２による処理は、本開示の学習モデル生成装置の処理の一例である。また、状態推定装置１は、本開示の推定部および推定装置の一例である。付与刺激状態３を示す情報である出力データ６は、本開示の付与刺激状態情報の一例である。

ところで、上述したように、導電性ウレタン２２は、上述したように電気経路が複雑に連携し、変形に応じた電気経路の伸縮、膨縮、一時的な切断、及び新たな接続が生じる等の挙動を示し、結果的に、与えられた力（例えば圧力刺激）に応じて異なる電気特性を有する挙動を示す。このことは、導電性ウレタン２２を、導電性ウレタン２２の変形に関するデータを貯留するリザーバとして扱うことが可能である。すなわち、状態推定装置１は、物理的なリザーバコンピューティング（ＰＲＣ：Physical Reservoir Computing）と呼ばれるネットワークモデル（以下、ＰＲＣＮという。）に、導電性ウレタン２２を適用することが可能である。ＰＲＣおよびＰＲＣＮ自体は公知の技術であるため、詳細な説明を省略するが、すなわち、ＰＲＣ、及びＰＲＣＮは、導電性ウレタン２２の変形に関する情報の推定に好適に適用可能である。

図１６に、導電性ウレタン２２を含むロボットハンド２を、導電性ウレタン２２を含むロボットハンド２の変形に関するデータを貯留するリザーバとして扱って学習する学習処理部５２の一例を示す。導電性ウレタン２２は、多様な圧力刺激の各々に応じた電気特性（電気抵抗値）となり、電気抵抗値を入力する入力層として機能し、また、導電性ウレタン２２の変形に関するデータを貯留するリザーバ層として機能する。導電性ウレタン２２は、付与刺激状態３により与えられた圧力刺激に応じて異なる電気特性（入力データ４）を出力するので、推定層で、導電性ウレタン２２の電気抵抗値から付与刺激状態３を推定することが可能である。従って、学習処理では、推定層を学習すればよい。

上述の状態推定装置１は、例えば、コンピュータに上述の各機能を表すプログラムを実行させることにより実現可能である。

図１７に、状態推定装置１の各種機能を実現する処理を実行する実行装置としてコンピュータを含んで構成した制御装置２５０の一例を示す。

状態推定装置１として機能する制御装置２５０は、図１７に示すコンピュータ本体１００を備えている。コンピュータ本体１００は、ＣＰＵ１０２、揮発性メモリ等のＲＡＭ１０４、ＲＯＭ１０６、ハードディスク装置（ＨＤＤ）等の補助記憶装置１０８、及び入出力インターフェース（Ｉ／Ｏ）１１０を備えている。これらのＣＰＵ１０２、ＲＡＭ１０４、ＲＯＭ１０６、補助記憶装置１０８、及び入出力Ｉ／Ｏ１１０は、相互にデータ及びコマンドを授受可能にバス１１２を介して接続された構成である。また、入出力Ｉ／Ｏ１１０には、外部装置と通信するための通信部１１４が接続されている。通信部１１４は、導電性ウレタン２２を含むロボットハンド２との間で、入力データ４（電気抵抗）を取得する機能する。すなわち、通信部１１４は、検出部である、ロボットハンド２に配置された導電性ウレタン２２における検出点７５に接続された電気特性検出部７６から入力データ４（電気抵抗）を取得することが可能である。

また、入出力Ｉ／Ｏ１１０には、キーボード等の操作部１１５、ディスプレイ等の表示部２１１、音声入力のためのマイク１１７、音声出力のためのスピーカ１１８、及び駆動部１１９が接続可能になっている。駆動部１１９は、ロボットハンド２の各パーツを移動可能に駆動するように配置される（図６）。

補助記憶装置１０８には、コンピュータ本体１００を本開示の推定装置の一例として状態推定装置１として機能させるための制御プログラム１０８Ｐが記憶される。ＣＰＵ１０２は、制御プログラム１０８Ｐを補助記憶装置１０８から読み出してＲＡＭ１０４に展開して処理を実行する。これにより、制御プログラム１０８Ｐを実行したコンピュータ本体１００は、本開示の推定装置の一例として状態推定装置１として動作する。

なお、補助記憶装置１０８には、学習モデル５１を含む学習モデル１０８Ｍ、及び各種データを含むデータ１０８Ｄが記憶される。制御プログラム１０８Ｐは、ＣＤ－ＲＯＭ等の記録媒体により提供するようにしても良い。

次に、コンピュータにより実現された状態推定装置１における推定処理について説明する。

図１８に、コンピュータ本体１００において、実行される制御プログラム１０８Ｐによる推定処理の流れの一例を示す。
図１８に示す推定処理は、コンピュータ本体１００に電源投入されると、ＣＰＵ１０２により実行される。すなわち、ＣＰＵ１０２は、制御プログラム１０８Ｐを補助記憶装置１０８から読み出し、ＲＡＭ１０４に展開して処理を実行する。

まず、ＣＰＵ１０２は、ステップＳ２００で、補助記憶装置１０８の学習モデル１０８Ｍから学習モデル５１を読み出し、ＲＡＭ１０４に展開することで、学習モデル５１を取得する。具体的には、学習モデル５１として表現された重みパラメータによるノード間の結合となるネットワークモデル（図１４、図１６参照）を、ＲＡＭ１０４に展開する。よって、重みパラメータによるノード間の結合が実現された学習モデル５１が構築される。

次に、ＣＰＵ１０２は、ステップＳ２０２で、導電性ウレタン２２に与えられた圧力刺激による付与刺激状態を推定する対象となる未知の入力データ４（電気抵抗）を、通信部１１４を介して時系列に取得する。

次に、ＣＰＵ１０２は、ステップＳ２０４で、ステップＳ２００で取得した学習モデル５１を用いて、ステップＳ２０２において取得した入力データ４（電気抵抗）に対応する出力データ６（未知の付与刺激状態）を推定する。

そして、次のステップＳ２０６で、推定結果の出力データ６（付与刺激状態）を、通信部１１４を介して出力したり、スピーカ１１８から音を発するようにデータを出力したり、表示部２１１に表示するようにデータを出力して、本処理ルーチンを終了する。

なお、図１８に示す推定処理は、本開示の推定方法で実行される処理の一例である。

以上説明したように、本開示によれば、導電性ウレタン２２に対して、付与刺激状態３における圧力刺激に応じて変化する入力データ４（電気抵抗）から、付与刺激状態を推定することが可能となる。すなわち、特殊な装置や大型の装置を用いたり柔軟部材の変形を直接計測することなく、未知の付与刺激状態を推定することが可能となる。

また、付与刺激状態に応じて電気特性が変化し、当該電気特性（時系列の電気抵抗）に付与刺激状態の特徴が反映されるので、導電性ウレタン２２において時系列に変化する電気抵抗値から付与刺激状態を推定可能である。すなわち、ロボットハンド２に対して人物によって圧力が与えれる各種の付与刺激状態であっても、上述した学習モデルを用いることで、適切な付与刺激状態を推定できる。

本実施形態に係る状態推定装置１では、上述した学習処理によって学習された学習モデル５１を用いることによって、導電性ウレタン２２の電気特性を入力することで、電気特性に対応した様々な付与刺激状態を推定できることを確認した。

＜他の実施形態＞
上述した状態推定装置１は、各種の装置への応用が可能である。

上述した状態推定装置１は、複数の場所において付与刺激状態を共有する場合に有効に機能する。例えば、状態推定装置１は、ロボットハンド２を遠隔地に配置される遠隔装置の一部として機能させることで、ロボットハンド２の配置先から離間した場所において、ロボットハンド２により検出される人物の未知の付与刺激状態を把握することが可能である。遠隔地において、人物の未知の付与刺激状態を把握するためには、上述した推定結果である付与刺激状態を示す付与刺激状態値をデータとして、通信部１１４を介して予め定めた遠隔地の送信先に送信する処理を追加すればよい。

また、上述した実施形態では、上述した学習処理によって学習された学習モデル５１を用いて、導電性ウレタン２２の電気特性に対応した様々な付与刺激状態を推定する場合を説明した。この場合、付与刺激状態として人物が外郭部２７に接触した接触状態を検出することに注目する場合、状態推定装置１を、時系列の電気特性が接触検出用に予め定めた閾値を超えること検出する機能部分は、人物の接触を検出する接触検出装置として適用可能である。

上述した実施形態では、本開示の技術を導電性ウレタン２２が外殻部に配置されたロボットに適用した場合を説明したが、本開示の技術は、ロボットへの適用に限定されない。例えば、導電性ウレタン２２を含む部材を、ロボットの周囲に配置されるカバー部に配置したり、人体の一部に装着される袋体（例えば、帽子、手袋及び足袋等）に配置してもよい。すなわち、導電性ウレタンを配置する可動体は、ロボットや人体等の導電性ウレタン２２に付与刺激状態に応じて圧力を与えるための基体及び突出部を有する人物であればよい。

図２０に、本開示の技術を適用した導電性ウレタン２２が配置された手袋２９を示す。手袋２９は、人体の手の外部に装着する部材であり、内部又は外部の少なくとも一部に導電性ウレタン２２が配置される。

ここでは、説明を簡単にするため、人体の手の外部に装着する部材を導電性ウレタン２２で形成した手袋２９を説明する（図４参照）。図２０に示すように手袋２０は、親指を覆う第１指部２０－１、人差し指を覆う第２指部２０－２、中指を覆う第３指部２０－３、薬指を覆う第４指部２０－４、及び小指を覆う第５指部２０－５を備え、各々掌（甲）を覆う掌部２０－６に連結される。なお、手袋２０は、図２に示すロボットの手２３６を覆うものであってもよい。

また、手袋２０は、各部位毎に、すなわち、第１指部２０－１から第５指部２０－５及び掌部２０－６の各々における電気特性を検出するために、各部位の導電性ウレタン２２に電極等の検出点７５が配置される。手袋２０では、導電性ウレタン２２は、電気特性検出部７６（図８）を備えた制御装置２５０Ａに接続される。制御装置２５０Ａは、図６に示す制御装置２５０と同様の構成であるため、説明を省略する。

なお、図２０に示す手袋２０における電極等の検出点７５の配置は一例であって、図２０に示す配置に限定されるものではない。例えば、手袋２０に少なくとも一対の電極等の検出点７５を配置すればよく、検出精度向上のために、複数の検出点を配置してもよい。

導電性ウレタン２２を配置した手袋２０は、ロボット又は人の手の能動形態状態及び受動形態状態に応じた人物の付与刺激状態を推定できる。よって、導電性ウレタン２２を含む部材を、ロボットの周囲に配置されるカバー部に配置したり、人体の一部に装着される袋体（例えば、帽子、手袋及び足袋等）に配置することにより、大規模なセンサシステムを備えることなく、簡単に人物の付与刺激状態を推定可能となる。

なお、上述した実施形態では、柔軟部材の一例として導電性ウレタンを適用した場合を説明したが、柔軟部材は導電性を有する材料であればよく、導電性ウレタンに限定されないことは勿論である。

本開示の技術的範囲は上記実施形態に記載の範囲には限定されない。要旨を逸脱しない範囲で上記実施形態に多様な変更または改良を加えることができ、当該変更または改良を加えた形態も本開示の技術的範囲に含まれる。

また、上記実施形態では、推定処理及び学習処理を、フローチャートを用いた処理によるソフトウエア構成によって実現した場合について説明したが、これに限定されるものではなく、例えば各処理をハードウェア構成により実現する形態としてもよい。

また、推定装置の一部、例えば学習モデル等のニューラルネットワークを、ハードウェア回路として構成してもよい。

１状態推定装置
２ロボットハンド
３付与刺激状態
４入力データ
５推定部
６出力データ
６Ａ生成出力データ
２０手袋
２２導電性ウレタン
２３導電性ウレタン片
５１学習モデル
５２学習処理部
５４生成器
５６演算器
７５検出点
７６電気特性検出部

Claims

導電性を有し、かつ与えられた圧力の変化に応じて電気特性が変化する柔軟材料であって、可動体の基体から屈曲可能な突出部の少なくとも一部を覆って配置されるかまたは覆うことが可能な前記柔軟材料に予め定められた複数の検出点間の電気特性を検出する検出部と、
前記柔軟材料に圧力を与えた際の時系列の電気特性と、前記柔軟材料に圧力を与える付与刺激状態を示す付与刺激状態情報とを学習用データとして用いて、前記時系列の電気特性を入力とし、前記付与刺激状態情報を出力するように学習された学習モデルに対して、前記検出部で検出された時系列の電気特性を入力し、入力した時系列の電気特性に対応する付与刺激状態を示す付与刺激状態情報を推定する推定部と、
を含む推定装置。
前記電気特性は、体積抵抗であり、
胴体部を前記基体とし、前記胴体部に連結される手部及び脚部の少なくとも一方を前記突出部とするロボットを前記可動体とし、
前記柔軟材料は、前記ロボットの手部及び脚部の少なくとも一方の骨格の周囲に配置される
請求項１に記載の推定装置。
前記柔軟材料は、前記突出部の外側に装着可能な外部部材に配置される
請求項１又は請求項２に記載の推定装置。
前記付与刺激状態は、人体及び物体の少なくとも一方について、表面形状を示す状態、表面材質を示す状態、重さを示す状態、及び硬さを示す状態の少なくとも１状態を含む
請求項１から請求項３の何れか１項に記載の推定装置。
前記柔軟材料は、繊維状及び網目状の少なくとも一方の構造、又は内部に微小な空気泡が複数散在する構造のウレタン材の少なくとも一部に導電性が付与された材料を含む
請求項１から請求項４の何れか１項に記載の推定装置。
前記柔軟材料は、表面から前記突出部の内部に向かうに従って硬さが硬くなる材料で形成されるか、又は表面から前記突出部の内部に向かうに従って硬さが硬くなるように硬さが異なる複数の材料を積層して形成される
請求項５に記載の推定装置。
前記学習モデルは、前記柔軟材料をリザーバとして当該リザーバを用いたリザーバコンピューティングによるネットワークを用いて学習させることで生成されたモデルを含む
請求項１から請求項６の何れか１項に記載の推定装置。
コンピュータが
導電性を有し、かつ与えられた圧力の変化に応じて電気特性が変化する柔軟材料であって、可動体の基体から屈曲可能な突出部の少なくとも一部を覆って配置されるかまたは覆うことが可能な前記柔軟材料に予め定められた複数の検出点間の電気特性を検出する検出部から前記電気特性を取得し、
前記柔軟材料に圧力を与えた際の時系列の電気特性と、前記柔軟材料に圧力を与える付与刺激状態を示す付与刺激状態情報とを学習用データとして用いて、前記時系列の電気特性を入力とし、前記付与刺激状態情報を出力するように学習された学習モデルに対して、取得された時系列の電気特性を入力し、入力した時系列の電気特性に対応する付与刺激状態を示す付与刺激状態情報を推定する
推定方法。
コンピュータに
導電性を有し、かつ与えられた圧力の変化に応じて電気特性が変化する柔軟材料であって、可動体の基体から屈曲可能な突出部の少なくとも一部を覆って配置されるかまたは覆うことが可能な前記柔軟材料に予め定められた複数の検出点間の電気特性を検出する検出部から前記電気特性を取得し、
前記柔軟材料に圧力を与えた際の時系列の電気特性と、前記柔軟材料に圧力を与える付与刺激状態を示す付与刺激状態情報とを学習用データとして用いて、前記時系列の電気特性を入力とし、前記付与刺激状態情報を出力するように学習された学習モデルに対して、前記取得された時系列の電気特性を入力し、入力した時系列の電気特性に対応する付与刺激状態を示す付与刺激状態情報を推定する
処理を実行させるための推定プログラム。
導電性を有し、かつ与えられた圧力の変化に応じて電気特性が変化する柔軟材料であって、可動体の基体から屈曲可能な突出部の少なくとも一部を覆って配置されるかまたは覆うことが可能な前記柔軟材料に予め定められた複数の検出点間の電気特性を検出する検出部で検出された前記電気特性を入力とし、前記柔軟材料に圧力を与える付与刺激状態を示す付与刺激状態情報を出力する学習モデルを生成する学習モデル生成部
を含む学習モデル生成装置。