WO2023167003A1

WO2023167003A1 - 制御装置、制御方法、及び制御プログラム

Info

Publication number: WO2023167003A1
Application number: PCT/JP2023/005572
Authority: WO
Inventors: 政志 ▲濱▼屋; 敦史橋本; 一敏田中; 玲奈石川
Original assignee: オムロン株式会社
Priority date: 2022-03-02
Filing date: 2023-02-16
Publication date: 2023-09-07
Also published as: JP2023128087A

Abstract

制御装置は、対象物に作用するエンドエフェクタと、エンドエフェクタ又はロボット本体を駆動する駆動源と、エンドエフェクタに設けられた触覚センサと、を備えたロボットに接続され、駆動源を制御して対象物に作用を及ぼす制御装置であって、触覚センサを用いて、対象物から受ける接触力を予め定められた期間毎に取得する取得部と、入力された接触力に対して、所定の時期に対象物において所定の作用が生じるか否かを推定するモデルを有し、取得部により取得した接触力をモデルに入力して対象物に所定の作用が生じる時期を推定する推定部と、推定部により推定された推定結果に応じて、駆動源を制御する制御部と、を備える。

Description

制御装置、制御方法、及び制御プログラム

　本開示は、制御装置、制御方法、及び制御プログラムに関する。

　ロボットに設けられたグリッパを用いて、対象物に応じて把持力を制御して、対象物の把持を可能とする技術がある。

　例えば、特開２０１９－１８８５８７号公報には、柔らかい対象物を把持する場合において、対象物を撮影して得られた画像データから対象物の面積を取得し、取得した面積に応じたエア圧を供給することによって、エア圧に応じて屈折するグリッパを制御してグリッパにおける把持部の間隔、又はグリッパにおける把持力を変化させるロボット制御装置について開示されている。

　しかしながら、対象物を把持するロボットは、柔らかい対象物を把持するために把持力の制御を行う、及び柔らかい対象物を把持するために専用のグリッパを設ける等、特定の対象物に応じて特化して構成されていることがある。

　また、対象物に応じて把持力の制御を行う場合において同一の対象物であっても（例えば、野菜及び果物等の熟成具合に応じて）対象物の柔軟性が異なることがある。

　そのため、専用の柔軟なグリッパなしに、破損を生じさせずに、様々な脆弱物体を把持できなかった。

　本発明は、専用の柔軟なグリッパなしに、破損を生じさせずに、様々な脆弱物体を把持できる制御装置、制御方法、及び制御プログラムを提供することを目的とする。

　第１の態様の制御装置は、対象物に作用するエンドエフェクタと、前記エンドエフェクタ又はロボット本体を駆動する駆動源と、前記エンドエフェクタに設けられた触覚センサと、を備えたロボットに接続され、前記駆動源を制御して前記対象物に作用を及ぼす制御装置であって、前記触覚センサを用いて、前記対象物から受ける接触力を予め定められた期間毎に取得する取得部と、入力された接触力に対して、所定の時期に前記対象物において所定の作用が生じるか否かを推定するモデルを有し、前記取得部により取得した前記接触力を前記モデルに入力して前記対象物に前記所定の作用が生じる時期を推定する推定部と、前記推定部により推定された推定結果に応じて、前記駆動源を制御する制御部と、を備える。

　第２の態様の制御装置は、第１の態様に係る制御装置であって、前記取得部は、対象物に所定の作用が生じた際に得られた前記接触力の結果を示す作用結果をさらに取得し、取得した前記作用結果を用いて、前記モデルに前記所定の作用が生じる時期を推定するための機械学習を実行する学習部をさらに備える。

　第３の態様の制御装置は、第２の態様に係る制御装置であって、前記学習部は、前記作用結果から前記接触力の時系列特徴を検出し、検出した前記時系列特徴のうち、第１の条件を満たした時系列特徴に係る時期を、前記対象物に所定の作用が生じた時期として学習させる。

　第４の態様の制御装置は、第３の態様に係る制御装置であって、前記第１の条件を満たした時系列特徴は、前記接触力が閾値を超えた後に、最初に検出された時系列特徴である。

　第５の態様に係る制御装置は、第１の態様から第４の態様の何れか１つの態様に係る制御装置であって、前記モデルは、入力された前記接触力を用いて、前記接触力の時系列特徴、及び前記所定の時期における推定接触力を推定し、前記推定接触力に係る前記所定の時期が、前記接触力の時系列特徴における時期に対応する場合、前記所定の時期に前記所定の作用が生じると推定する。

　第６の態様に係る制御装置は、第５の態様に係る制御装置であって、前記モデルは、前記接触力の時系列特徴における時期を基点とした範囲を設定し、前記推定接触力における所定の時期が、前記範囲に含まれる場合、前記所定の作用が生じると推定する。

　第７の態様に係る制御装置は、第６の態様に係る制御装置であって、前記取得部は、前記対象物の特徴を示す特徴量をさらに取得し、前記モデルは、取得した前記特徴量に応じて、前記範囲を設定する。

　第８の態様に係る制御装置は、第１の態様から第７の態様の何れか１つの態様に係る制御装置であって、前記取得部は、前記エンドエフェクタに、複数の前記触覚センサが設けられ、前記触覚センサの各々を用いて、複数の前記接触力を取得する。

　第９の態様に係る制御装置は、第８の態様に係る制御装置であって、前記モデルは、前記複数の接触力の各々から、前記接触力の時系列特徴をそれぞれ推定し、推定した前記接触力の時系列特徴のうち、第２の条件を満たした時系列特徴を用いて、前記所定の作用が生じる時期を推定する。

　第１０の態様に係る制御装置は、第９の態様に係る制御装置であって、前記第２の条件を満たした時系列特徴は、前記接触力が閾値を超えた後に、最初に検出された時系列特徴である。

　第１１の態様に係る制御装置は、第１の態様から第１０の態様の何れか１つの態様に係る制御装置であって、前記制御部は、前記所定の時期に前記所定の作用が生じると推定した場合、前記駆動源の駆動を停止する。

　第１２の態様に係る制御方法は、対象物に作用するエンドエフェクタと、前記エンドエフェクタ又はロボット本体を駆動する駆動源と、前記エンドエフェクタに設けられた触覚センサと、を備えたロボットに接続され、前記駆動源を制御して前記対象物に作用を及ぼす制御装置における制御方法であって、前記触覚センサを用いて、前記対象物から受ける接触力を予め定められた期間毎に取得し、入力された接触力に対して、所定の時期に前記対象物において所定の作用が生じるか否かを推定するモデルを有し、取得した前記接触力を前記モデルに入力して前記対象物に所定の作用が生じる時期を推定し、推定された推定結果に応じて、前記駆動源を制御する。

　第１３の態様に係る制御プログラムは、対象物に作用するエンドエフェクタと、前記エンドエフェクタ又はロボット本体を駆動する駆動源と、前記エンドエフェクタに設けられた触覚センサと、を備えたロボットに接続され、前記駆動源を制御して前記対象物に作用を及ぼす制御装置における制御プログラムであって、前記触覚センサを用いて、前記対象物から受ける接触力を予め定められた期間毎に取得し、入力された接触力に対して、所定の時期に前記対象物において所定の作用が生じるか否かを推定するモデルを有し、取得した前記接触力を前記モデルに入力して前記対象物に所定の作用が生じる時期を推定し、推定された推定結果に応じて、前記駆動源を制御する、処理をコンピュータに実行させる。

　本開示によれば、専用の柔軟なグリッパなしに、破損を生じさせずに、様々な脆弱物体を把持できる。

第１実施形態に係るロボットシステムの構成図である。各実施形態に係るロボットシステムの機能ブロック図である。第１実施形態に係るエンコーダ・デコーダモデルの一例を示す模式図である。第１実施形態に係る推定した接触力の一例を示すグラフである。各実施形態に係る制御装置の構成の一例を示すブロック図である。第１実施形態に係るモデル生成処理の流れを示すフローチャートである。第１実施形態に係る推定処理の流れを示すフローチャートである。第２実施形態に係るロボットシステムの構成図である。第２実施形態に係る推定した接触力の一例を示すグラフである。第２実施形態に係るモデル生成処理の流れを示すフローチャートである。第２実施形態に係る推定処理の流れを示すフローチャートである。第３実施形態に係る推定した接触力の一例を示すグラフである。第６実施形態に係るロボットシステムの構成図である。第６実施形態に係る推定した接触力の一例を示すグラフである。第７実施形態に係るＲＮＮの一例を示す模式図である。

　以下、本開示の実施形態の一例を、図面を参照しつつ説明する。なお、各図面において同一又は等価な構成要素及び部分には同一の参照符号を付与している。また、図面の寸法比率は、説明の都合上誇張されている場合があり、実際の比率とは異なる場合がある。

＜第１実施形態＞
　図１は、第１実施形態に係るロボットシステム１０の構成図である。図１に示すように、ロボットシステム１０は、ロボット２０、及び制御装置３０を備える。ロボットシステム１０は、本実施形態では、対象Ｔをピッキングするピッキング装置として機能する。

　ロボット２０は、ピッキング動作を行う際の運動制御の対象である機構部分としてのロボットアームＡＲと、ロボットアームＡＲの先端に取り付けられたグリッパＧＲと、を含む。

　グリッパＧＲは、対象物の一例としての対象Ｔを把持する２つの指Ｆ１、及び指Ｆ２を備える。なお、本実施形態では指の数が２つの場合について説明するが、指の数は２つに限られるものではなく、３つ以上の指を備えてもよい。また、指Ｆ１、Ｆ２は、本実施形態では一例として板状の部材で構成されるが、指Ｆ１、及び指Ｆ２の形状はこれに限られるものではない。

　また、グリッパＧＲは、指Ｆ１、及び指Ｆ２のうち少なくとも１つの指を駆動指として駆動するモータＭを備える。モータＭは、リニアガイドＬＧと接続されている。リニアガイドＬＧは、モータＭの回転運動を直線運動に変換する変換機構を含む。ここで、グリッパＧＲ、指Ｆ１、及び指Ｆ２は、「エンドエフェクタ」の一例である

　指Ｆ１、及び指Ｆ２は、リニアガイドＬＧに取り付けられている。リニアガイドＬＧは、モータＭによって駆動され、モータＭのＺ軸を回転軸とした回転運動をＸ軸方向の直線運動に変換する。

　具体的には、例えばモータＭが正転した場合は、リニアガイドＬＧは、指Ｆ１、及び指Ｆ２を閉じる方向、すなわち対象Ｔを把持する方向に駆動する。一方、モータＭが逆転した場合は、リニアガイドＬＧは、指Ｆ１、及び指Ｆ２を開く方向、すなわち対象Ｔを放す方向に駆動する。なお、本実施形態では、モータＭが回転すると、指Ｆ１、及び指Ｆ２が同時に駆動される構成の場合について説明するが、指Ｆ１、及び指Ｆ２のうち何れかの指のみが駆動される構成としてもよい。すなわち、本実施形態では、駆動指が指Ｆ１、及び指Ｆ２の両方の場合について説明するが、駆動指が指Ｆ１、及び指Ｆ２の一方のみでもよい。

　また、グリッパＧＲは、モータＭを駆動するモータ駆動部２１を備える（図２参照）。モータ駆動部２１は、後述する制御部３５から停止する指示を受信するまでモータＭを等速度で駆動する。

　また、指Ｆ１、及び指Ｆ２の把持面には、触覚センサＳ１、及び触覚センサＳ２が各々設けられている。触覚センサＳ１、及び触覚センサＳ２は、指Ｆ１、及び指Ｆ２が対象Ｔを把持したときに触覚センサＳ１、及び触覚センサＳ２が対象Ｔから受ける接触力を検出する。

　なお、本実施形態に係る触覚センサＳは、分布型触覚センサである形態について説明する。しかし、これに限定されない。触覚センサＳは、単点型の触覚センサであってもよい。また、本実施形態では、指Ｆ１、及び指Ｆ２の両方に触覚センサＳが設けられた構成、すなわち指Ｆ１、及び指Ｆ２の両方が触覚指である場合について説明する。しかし、これに限定されない。指Ｆ１、及び指Ｆ２の何れか一方にのみ触覚センサＳが設けられた構成としてもよい。

　ここで、接触力とは、把持力の反力であり、把持力と向きが反対で大きさは同じである。また、把持力とは、駆動指又は触覚指が対象Ｔに加える力である。なお、本実施形態では、対象Ｔを把持せずに指Ｆ１、及び指Ｆ２同士が直接接触して互いに相手の指に力を加えている場合に相手の指に加える力も把持力と称する。また、把持力は指Ｆ１、及び指Ｆ２の各々に発生するが、重力の影響を考えない場合は、指Ｆ１、及び指Ｆ２の把持力は互いに反対向きで同じ大きさとなる。

　ロボット２０は、一例として自由度が６の垂直多関節ロボット、水平多関節ロボット等が用いられるが、ロボットの自由度及び種類はこれらに限られるものではない。

　制御装置３０は、ロボット２０を制御する。一例として図２に示すように、制御装置３０は、機能的には、取得部３１、記憶部３２、学習部３３、推定部３４、及び制御部３５を備えている。また、推定部３４は、破損が生じる時期を推定するための機械学習を行った推定モデル４０を備えている。

　取得部３１は、触覚センサＳ１、及び触覚センサＳ２を用いて、対象Ｔから受ける接触力を予め定められた期間毎に取得する。

　記憶部３２は、検出結果として、ロボット２０の稼働毎に取得部３１が取得した接触力を記憶する。なお、本実施形態に係る検出結果は、グリッパＧＲによって、対象Ｔを破壊及び変形等の破損させた際に得られた接触力の時系列データである。ここで、検出結果は、「作用結果」の一例であり、対象Ｔを破壊及び変形等の破損は、「所定の作用」の一例である。

　学習部３３は、学習フェーズにおいて、記憶部３２に記憶されている検出結果を用いて、破損が生じる時期を推定するための機械学習を行った推定モデル４０を生成する。具体的には、学習部３３は、検出結果から時系列特徴を検出し、当該時系列特徴が生じる時期を学習させ、推定モデル４０を生成する。なお、本実施形態に係る時系列特徴は、対象Ｔに破損が生じる、接触力が所定の閾値を超えた後に、最初に検出されたピーク値である。ここで、本実施形態では、複数の触覚センサＳを用いていることから複数の検出結果を取得可能である。また、分布型触覚センサは、１回の稼働において複数の接触力を検出可能である。すなわち、学習部３３は、１回の稼働において取得した複数の検出結果を用いて、機械学習を実行可能である。

　例えば、学習部３３は、入力データとして、所定の期間における複数の接触力、及び教師データとして、所定の期間からδ秒後の接触力、及び対象Ｔに対する接触力のピーク値を用いて機械学習を実行し、推定モデル４０を生成する。

　推定モデル４０は、エンコーダ・デコーダモデルを用いたリカレントニューラルネットワーク（ＲＮＮ：Ｒｅｃｕｒｒｅｎｔ　Ｎｅｕｒａｌ　Ｎｅｔｗｏｒｋ）である。ＲＮＮは、一例として図３に示すように、入力層、中間層（隠れ層）、及び出力層を備え、中間層において、処理済みのデータを異なるノード４１に伝搬して処理を行う。また、エンコーダ・デコーダモデルは、中間層において、入力されたデータから特徴を抽出して予め定められた次元のベクトルに圧縮するエンコード処理と、圧縮された圧縮データに含まれる特徴を復号するデコード処理と、を行う。エンコーダ・デコーダモデルである推定モデル４０は、過去の所定の期間における接触力を用いて、所定の時期における接触力、及び対象Ｔの状態の判定を推定して出力する。

　一例として、図４に示すように、入力データとして、現時点ｔ_ｎまでの期間ｗに取得した接触力が入力された場合、推定モデル４０は、現時点ｔ_ｎからδ秒後に得られる接触力（以下、「推定接触力」という。）ｘ_ｔδ、及び対象Ｔの状態ｙを推定する。なお、本実施形態に係る対象Ｔの状態は、対象Ｔに破損が生じるか否かである。また、以下では、推定接触力ｘ_ｔδが得られる現時点ｔ_ｎからδ秒後の時期を「所定の時期」という。

　具体的には、推定モデル４０は、入力された複数の接触力を用いて、対象Ｔから受ける接触力を推定して接触力のピーク値ｘ_ｔｐを特定する。推定モデル４０は、特定した接触力のピーク値ｘ_ｔｐが生じる時期ｔｐを特定し、特定した時期ｔｐを基点として、予め定められたマージンｍの範囲を設定する。推定モデル４０は、推定接触力ｘ_ｔδが得られる所定の時期ｔ_δが、時期ｔｐを基点としたマージンｍの範囲に含まれている場合、破損が生じると判定する。換言すると、推定モデル４０は、以下の数式によって表される条件を満たす場合、所定の時期ｔ_δに破損が生じる（ｙ＝１）と判定し、満たさない場合、所定の時期ｔ_δに破損が生じない（ｙ＝０）と判定する。

　なお、本実施形態に係るマージンｍは、予め定められている形態について説明した。しかし、これに限定されない。対象Ｔに応じて、マージンｍを設定してもよい。例えば、対象Ｔの質量を計測し、質量に応じて、マージンｍを設定してもよいし、対象Ｔに超音波を射出して得られた結果から密度を算出し、密度に応じてマージンｍを設定してもよい。また、対象Ｔを撮影した画像から対象Ｔの大きさ、及び材質を推定し、推定した大きさ、及び材質に応じて、マージンｍを設定してもよい。ここで、対象Ｔの質量、密度、大きさ、及び材質とは、「特徴量」の一例である。

　また、本実施形態では、分布型触覚センサである触覚センサＳ１、及び触覚センサＳ２を用いているため、１つの対象Ｔから複数の接触力が得られる。そのため、推定モデル４０は、複数の接触力の各々から、それぞれ接触力が閾値を超えた後に最初に検出されたピーク値ｘ_ｔｐを推定する。推定モデル４０は、推定した複数の接触力のピーク値ｘ_ｔｐのうち、最初に検出されたピーク値ｘ_ｔｐを用いて、対象Ｔの状態を判定する。

　推定部３４は、取得部３１が取得した所定の期間における接触力を推定モデル４０に入力して、対象Ｔの状態（所定の時期に破損が生じるか否か）の判定を行う。

　制御部３５は、推定部３４によって、所定の時期に破損が生じると判定された場合、モータ駆動部２１にモータＭを停止する指示を送信して、対象Ｔに生じる把持力を制御する。

　次に、図５を参照して、制御装置３０のハードウェア構成について説明する。図５は、制御装置３０のハードウェア構成を示すブロック図である。

　図５に示すように、制御装置３０は、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）３０Ａ、ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）３０Ｂ、ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）３０Ｃ、ストレージ３０Ｄ、入力部３０Ｅ、モニタ３０Ｆ、通信インタフェース（Ｉ／Ｆ）３０Ｇを有する。各構成は、バス３０Ｈを介して相互に通信可能に接続されている。

　本実施形態では、ストレージ３０Ｄには、制御プログラムが格納されている。ＣＰＵ３０Ａは、中央演算処理ユニットであり、各種プログラムを実行したり、各構成を制御したりする。すなわち、ＣＰＵ３０Ａは、ストレージ３０Ｄからプログラムを読み出し、ＲＡＭ３０Ｃを作業領域としてプログラムを実行する。ＣＰＵ３０Ａは、ストレージ３０Ｄに記録されているプログラムに従って、上記各構成の制御及び各種の演算処理を行う。

　ＲＯＭ３０Ｂは、各種プログラム及び各種データを格納する。ＲＡＭ３０Ｃは、作業領域として一時的にプログラム又はデータを記憶する。ストレージ３０Ｄは、ＨＤＤ（Ｈａｒｄ　Ｄｉｓｋ　Ｄｒｉｖｅ）又はＳＳＤ（Ｓｏｌｉｄ　Ｓｔａｔｅ　Ｄｒｉｖｅ）により構成され、オペレーティングシステムを含む各種プログラム、及び各種データを格納する。

　入力部３０Ｅは、キーボード、及びマウス等のポインティングデバイスを含み、各種の入力を行うために使用される。モニタ３０Ｆは、例えば、液晶ディスプレイであり、対象Ｔの把持状態等の各種の情報を表示する。モニタ３０Ｆは、タッチパネル方式を採用して、入力部３０Ｅとして機能してもよい。

　通信Ｉ／Ｆ３０Ｇは、他の機器と通信するためのインタフェースであり、例えば、イーサネット（登録商標）、ＦＤＤＩ又はＷｉ－Ｆｉ（登録商標）等の規格が用いられる。

　図２に示した制御装置３０の各機能構成は、ＣＰＵ３０Ａがストレージ３０Ｄに記憶された制御プログラムを読み出し、ＲＡＭ３０Ｃに展開して実行することにより実現される。

　次に、図６及び図７を参照して、制御装置３０の作用について説明する。

　図６は、制御装置３０による推定モデル４０を生成する処理の流れを示すフローチャートである。ユーザーが入力部３０Ｅを操作してモデル生成処理の実行を指示すると、ＣＰＵ３０Ａがストレージ３０Ｄから制御プログラムを読み出して、ＲＡＭ３０Ｃに展開し実行することにより、モデル生成処理が実行される。

　ステップＳ１０１において、ＣＰＵ３０Ａは、稼働回数に１を設定する。ここで、ＣＰＵ３０Ａは、初期状態として、グリッパＧＲを開いた状態に設定する。

　ステップＳ１０２において、ＣＰＵ３０Ａは、モータ駆動部２１にモータＭを駆動する指示を送信して、グリッパＧＲを等速度で閉じる。

　ステップＳ１０３において、ＣＰＵ３０Ａは、対象Ｔを破損して触覚センサＳから接触力を検出した検出結果を取得し、記憶する。

　ステップＳ１０４において、ＣＰＵ３０Ａは、稼働回数が閾値以上であるか否かの判定を行う。稼働回数が閾値以上である場合（ステップＳ１０４：ＹＥＳ）、ＣＰＵ３０Ａは、ステップＳ１０５に移行する。一方、稼働回数が閾値以上ではない（稼働回数が閾値未満である）場合（ステップＳ１０４：ＮＯ）、ＣＰＵ３０Ａは、ステップＳ１０６に移行する。

　ステップＳ１０５において、ＣＰＵ３０Ａは、記憶された検出結果を用いて、機械学習を実行し、推定モデル４０を生成する。

　ステップＳ１０６において、ＣＰＵ３０Ａは、モータ駆動部２１にモータＭを駆動する指示を送信してグリッパＧＲを開き、初期状態に設定する。ここで、破損した対象Ｔに代えて、新たな対象Ｔが設置される。

　ステップＳ１０７において、ＣＰＵ３０Ａは、事象回数に１を加算して、ステップＳ１０２に移行する。

　次に、図７を参照して、対象Ｔに対して作用を及ぼす制御処理について説明する。図７は、制御装置３０による制御処理の流れを示すフローチャートである。ユーザーが入力部３０Ｅを操作して制御処理を指示すると、ＣＰＵ３０Ａがストレージ３０Ｄから制御プログラムを読み出して、ＲＡＭ３０Ｃに展開し実行することにより、制御処理が実行される。

　ステップＳ２０１において、ＣＰＵ３０Ａは、モータ駆動部２１にモータＭを駆動する指示を送信して、グリッパＧＲを開いた状態である初期状態に設定し、グリッパＧＲを等速度で閉じる。

　ステップＳ２０２において、ＣＰＵ３０Ａは、計測時間を初期化して、時間の計測を開始する。

　ステップＳ２０３において、ＣＰＵ３０Ａは、触覚センサＳから対象Ｔから受ける接触力を取得する。

　ステップＳ２０４において、ＣＰＵ３０Ａは、計測時間が、所定の期間を経過したか否かの判定を行う。所定の期間を経過した場合（ステップＳ２０４：ＹＥＳ）、ＣＰＵ３０Ａは、ステップＳ２０５に移行する。一方、所定の期間を経過していない（計測時間が所定の期間未満である）場合（ステップＳ２０４：ＮＯ）、ＣＰＵ３０Ａは、ステップＳ２０３に移行して、接触力を取得する。

　ステップＳ２０５において、ＣＰＵ３０Ａは、所定の期間に取得した接触力を用いて、所定時間後の対象Ｔの状態を推定する。

　ステップＳ２０６において、ＣＰＵ３０Ａは、所定の時期に破損が生じるか否かの判定を行う。所定の時期に破損が生じる場合（ステップＳ２０６：ＹＥＳ）、ＣＰＵ３０Ａは、ステップＳ２０７に移行する。一方、所定の時期に破損が生じない場合（ステップＳ２０６：ＮＯ）、ＣＰＵ３０Ａは、ステップＳ２０２に移行して、計測時間を初期化して、時間の計測を開始する。

　ステップＳ２０７において、ＣＰＵ３０Ａは、モータ駆動部２１にモータＭを停止する指示を送信して、グリッパＧＲを停止する。

　ステップＳ２０８において、ＣＰＵ３０Ａは、モータ駆動部２１にモータＭを駆動する指示を送信して、対象Ｔを持ち上げる。

　以上説明したように、本実施形態によれば、専用の柔軟なグリッパなしに、破損を生じさせずに、様々な脆弱物体を把持できる。

＜第２実施形態＞
　第１実施形態では、グリッパＧＲに設けられた指の駆動を制御する形態について説明した。本実施形態では、ロボットに設けられたロボットアームＡＲの駆動を制御する形態について説明する。

　なお、以下では、ロボットシステムの機能（図２参照）、エンコーダ・デコーダモデルを示す図（図３参照）、推定した接触力を示すグラフ（図４参照）、及び制御装置の構成（図５参照）は、第１実施形態と同様であるため、説明を省略する。

　図８は、第２実施形態に係るロボットシステム１０の構成図である。図８に示すように、ロボットシステム１０は、ロボット２０、及び制御装置３０を備える。本実施形態に係るロボットシステム１０は、スイッチ等の対象Ｔを押下する入力装置として機能する。

　ロボット２０は、押下動作を行う際の運動制御の対象である機構部分としてのロボットアームＡＲと、ロボットアームＡＲに接続されている関節ＪＴと、を含む。

　ロボットアームＡＲは、対象物の一例としての対象Ｔを押下する１つの指Ｆを備える。関節ＪＴは、接続されているロボットアームＡＲを駆動するモータＭを備える。モータＭは、駆動することによってロボットアームＡＲの位置、及び方向を制御するサーボモータである。なお、本実施形態に係るロボット２０は、モータＭを駆動することによって、ロボットアームＡＲの位置、及び方向を制御し、対象Ｔを等速度でＸ軸方向に押下する形態について説明する。しかし、これに限定されない。モータＭは、ロボットアームＡＲに設けられた指Ｆの伸縮を制御してもよいし、ロボット２０を移動して位置を制御してもよい。

　また、指Ｆの接触面には、触覚センサＳが設けられている。触覚センサＳは、指Ｆが対象Ｔを押下したときに触覚センサＳが対象Ｔから受ける接触力を検出する。

　すなわち、ロボット２０は、各々の関節ＪＴに設けられたモータＭを駆動することにより、ロボットアームＡＲに設けられた指Ｆの位置を制御して、対象Ｔを押下する。

　制御装置３０は、ロボット２０におけるロボットアームＡＲの駆動を制御する。具体的には、図２に示す取得部３１が、触覚センサＳから接触力を取得し、推定部３４が、取得した接触力を用いてスイッチの状態（スイッチが切り替わったか否か）を推定する。制御部３５が、推定部３４の推定結果に応じてモータＭを停止する指示をモータ駆動部２１に送信することにより、制御装置３０は、ロボット２０を制御する。

　一例として図９に示すように、スイッチ等の対象Ｔを押下する場合、対象Ｔから受ける接触力は、スイッチが切り替わる直前で極大となり、スイッチが切り替わった瞬間に極小へと変化する。

　そのため、推定部３４は、推定モデル４０を用いて、時系列特徴としてスイッチが切り替わる接触力の極小を推定し、対象Ｔの状態を推定する。具体的には、推定モデル４０は、取得した接触力を用いて推定した接触力の極小値ｘ_{ｔｍｉｎｉ}が生じる時期ｔ_ｍｉｎｉを特定し、特定した時期ｔ_ｍｉｎｉを基点として、予め定められたマージンｍの範囲を設定する。推定モデル４０は、所定の時期ｔ_δが、時期ｔ_ｍｉｎｉを基点としたマージンｍの範囲に含まれている場合、スイッチが切り替わったと判定する。

　図１０は、制御装置３０による推定モデル４０を生成する処理の流れを示すフローチャートである。ユーザーが入力部３０Ｅを操作してモデル生成処理の実行を指示すると、ＣＰＵ３０Ａがストレージ３０Ｄから制御プログラムを読み出して、ＲＡＭ３０Ｃに展開し実行することにより、モデル生成処理が実行される。なお、図１０において、図６に示すモデル生成処理と同一のステップについては、図６と同一の符号を付して、その説明を省略する。

　ステップＳ１０８において、ＣＰＵ３０Ａは、稼働回数に１を設定する。ここで、ＣＰＵ３０Ａは、初期状態として、指Ｆが対象Ｔの正面に位置する状態にロボットアームＡＲを設定する。

　ステップＳ１０９において、ＣＰＵ３０Ａは、モータ駆動部２１にモータＭを駆動する指示を送信して、ロボットアームＡＲを駆動する。

　ステップＳ１１０において、ＣＰＵ３０Ａは、モータ駆動部２１にモータＭを駆動する指示を送信してロボットアームＡＲを駆動し、指Ｆが対象Ｔの正面に位置する初期状態に設定する。ここで、切り替えられた対象Ｔは、切り替えられる前の状態に設定される。

　次に、図１１を参照して、対象Ｔを押下する処理について説明する。図１１は、制御装
置３０による対象Ｔを押下する処理の流れを示すフローチャートである。ユーザーが入力部３０Ｅを操作して押下処理を指示すると、ＣＰＵ３０Ａがストレージ３０Ｄから制御プログラムを読み出して、ＲＡＭ３０Ｃに展開し実行することにより、押下処理が実行される。なお、図１１において、図７に示す押下処理と同一のステップについては、図７と同一の符号を付して、その説明を省略する。

　ステップＳ２０９において、ＣＰＵ３０Ａは、モータ駆動部２１にモータＭを駆動する指示を送信して、初期状態に設定されたロボットアームＡＲを駆動する。

　ステップＳ２１０において、ＣＰＵ３０Ａは、対象Ｔの状態が所定の時期に切り替わるか否かの判定を行う。所定の時期に切り替わる場合（ステップＳ２１０：ＹＥＳ）、ＣＰＵ３０Ａは、ステップＳ２１１に移行する。一方、所定の時期に切り替わらない場合（ステップＳ２１０：ＮＯ）、ＣＰＵ３０Ａは、ステップＳ２０２に移行して、計測時間を初期化して、時間の計測を開始する。

　ステップＳ２１１において、ＣＰＵ３０Ａは、所定の時期になったか否かの判定を行う。所定の時期になった場合（ステップＳ２１１：ＹＥＳ）、ＣＰＵ３０Ａは、ステップＳ２１２に移行する。一方、所定の時期になっていない場合（ステップＳ２１１：ＮＯ）、ＣＰＵ３０Ａは、所定の時期になるまで待機する。

　ステップＳ２１２において、ＣＰＵ３０Ａは、モータ駆動部２１にモータＭを停止する指示を送信して、ロボットアームＡＲを停止する。

　以上説明したように、本実施形態によれば、専用の柔軟なグリッパなしに、破損を生じさせずに、様々な脆弱物体（スイッチ等を含む）を押下できる。

＜第３実施形態＞
　第２実施形態では、対象Ｔから受ける接触力の極小を推定する形態について説明した。本実施形態では、対象Ｔから受ける接触力の極大を推定する形態について説明する。

　推定モデル４０は、図１２に示す接触力の極大となる時期ｔ_ｍａｘｉを特定し、特定した時期ｔ_ｍａｘｉを基点として、予め定められたマージンｍの範囲を設定する。推定モデル４０は、所定の時期ｔ_δが、時期ｔ_ｍａｘｉを基点としたマージンｍの範囲を超えた場合、スイッチが切り替わったと判定する。

＜第４実施形態＞
　第２実施形態、及び第３実施形態では、対象Ｔから受ける接触力の極小、及び極大を推定する形態について説明した。本実施形態では、対象Ｔから受ける接触力の変化の傾きを推定する形態について説明する。

　例えば、推定モデル４０は、時系列における接触力を推定し、時系列特徴として、接触力の変化の傾き（接触力を時間ｔで１階微分した値）が０となる時期を推定する。図１２において、接触力の変化の傾きが０となる時期は、接触力が極大、又は極小となる時期を示すため、推定モデル４０は、当該時期を基点にしてマージンｍを設定して、対象Ｔの状態を推定する。

＜第５実施形態＞
　第４実施形態では、接触力の変化の傾き（接触力を時間ｔで１階微分した値）が０となる時期を推定する形態について説明した。本実施形態では、接触力の変曲点となる時期を推定する形態について説明する。

　例えば、推定モデル４０は、時系列における接触力を推定し、時系列特徴として、接触力の変曲点（接触力を時間ｔで２階微分した値が０）となる時期を推定する。図１２において、接触力の変曲点となる時期は、接触力が極大となる時期と、極小となる時期と、の間に位置するため、推定モデル４０は、当該時期を基点にして、対象Ｔの状態を推定する。例えば、推定モデル４０は、所定の時期ｔ_δが、基点とした時期を超えた場合、対象Ｔが切り替わったと判定する。

＜第６実施形態＞
　第２実施形態から第５実施形態では、スイッチ等の対象Ｔを押下する形態について説明した。本実施形態では、タッチパネル等の対象Ｔを押下する形態について説明する。

　図１３は、第６実施形態に係るロボットシステム１０の構成図である。図１３に示すように、ロボットシステム１０は、ロボット２０、及び制御装置３０を備える。ロボットシステム１０は、本実施形態では、タッチパネル等の対象Ｔを押下する入力装置として機能する。

　一例として図１３に示すタッチパネル等の対象Ｔは、押下した際に接触した面が撓み、接触した位置の検出を行う。一例として示す図１４に示すように、対象Ｔを押下した場合、撓みの限度までは対象Ｔに対して適度な負荷が掛かっている状態である。しかしながら、さらに力を加えて、対象Ｔの撓みの限度を超えて押下した場合、対象Ｔに加わる力は急激に大きくなる。対象Ｔに対して、さらに撓みの限度を超えて押下した場合、対象Ｔに過度な負荷が掛かり、対象Ｔに破損が生じる。

　そのため、推定モデル４０は、時系列特徴として、対象Ｔの撓みの限度を示す接触力の変化点ｘ_ｔｃｈを推定し、対象Ｔの状態を推定する。具体的には、推定モデル４０は、取得した接触力を用いて、推定した接触力の変化点ｘ_ｔｃｈが生じる時期ｔ_ｃｈを特定し、特定した時期ｔ_ｃｈを基点として、予め定められたマージンｍの範囲を設定する。推定モデル４０は、推定接触力ｘ_ｔδが得られる所定の時期ｔ_δが、時期ｔ_ｃｈを基点としたマージンｍの範囲に含まれている場合、対象Ｔに過度な負荷が掛かり、対象Ｔに破損が生じると判定する。

＜第７実施形態＞
　第１実施形態から第６実施形態では、推定モデル４０は、エンコーダ・デコーダモデルである形態について、説明した。本実施形態では、推定モデル４０は、ＲＮＮである形態について説明する。

　一例として図１５に示すように、ＲＮＮは、中間層において、ノード４２で処理されたデータを他のノード４２に伝達し、入力層から入力されたデータと、他のノード４２から入力されたデータと、を用いて処理を行う。

　本実施形態に係る推定モデル４０は、入力層から入力された接触力と、他のノード４２が処理して入力されたデータ（例えば、推定した推定接触力、及び過去に入力された接触力等）と、を用いて、次の時期における推定接触力を推定する。この処理を中間層に含まれるノード４２において繰り返し行うことによって、推定接触力ｘ_ｔδを推定する。

　ここで、入力層から入力される接触力に代えて、一のノード４２が推定した推定接触力を入力することによって、接触力を繰り返し取得することなく、長期間先の所定の時期ｔ_δに係る推定接触力ｘ_ｔδを推定可能である。

　なお、本実施形態では、推定モデル４０はＲＮＮである形態について説明した。しかし、これに限定されない。推定モデル４０は、多層パーセプトロン（ニューラルネットワーク）であってもよいし、サポートベクタマシーンであってもよいし、ランダムフォレストであってもよい。

＜第８実施形態＞
　第１実施形態から第７実施形態では、推定モデル４０は、ノンパラメトリックな手法によって、推定接触力を推定する形態について説明した。本実施形態では、推定モデル４０は、パラメトリックな手法によって、推定接触力を推定する形態について説明する。

　例えば、推定モデル４０は、接触力を検出した検出結果を学習することにより、正規分布に基づいて、推定接触力を推定する。推定モデル４０は、入力された接触力から対応する正規分布を推定し、当該正規分布の極大値を推定接触力ｘ_ｔδと推定する。

＜第９実施形態＞
　第１実施形態から第８実施形態では、推定モデル４０は、ニューラルネットワーク等の機械学習を実行したモデルである形態について説明した。本実施形態では、推定モデル４０は、統計に基づいた関数である形態について説明する。

　例えば、推定モデル４０は、回帰分析を行う関数である。例えば、推定モデル４０は、入力された複数の接触力を用いて、接触力の平均二乗誤差に対応する回帰直線を導出し、所定の時期ｔ_δに係る推定接触力ｘ_ｔδを推定する。

　さらに、関数として非線形関数への回帰、ＳＶＭ（Ｓｕｐｐｏｒｔ　Ｖｅｃｔｏｒ　Ｍａｃｈｉｎｅ）、ＧＰＲ（Ｇａｕｓｓｉａｎ　Ｐｒｏｃｅｓｓ　Ｒｅｇｒｅｓｓｉｏｎ）、多項式関数への回帰も適用可能である。

　上記実施形態は、本開示の構成例を例示的に説明するものに過ぎない。本開示は上記の具体的な形態には限定されることはなく、その技術的思想の範囲内で種々の変形が可能である。

　なお、上記各実施形態でＣＰＵがソフトウェア（プログラム）を読み込んで実行した制御処理を、ＣＰＵ以外の各種のプロセッサが実行してもよい。この場合のプロセッサとしては、ＦＰＧＡ（Ｆｉｅｌｄ－Ｐｒｏｇｒａｍｍａｂｌｅ　Ｇａｔｅ　Ａｒｒａｙ）等の製造後に回路構成を変更可能なＰＬＤ（Ｐｒｏｇｒａｍｍａｂｌｅ　Ｌｏｇｉｃ　Ｄｅｖｉｃｅ）、及びＡＳＩＣ（Ａｐｐｌｉｃａｔｉｏｎ　Ｓｐｅｃｉｆｉｃ　Ｉｎｔｅｇｒａｔｅｄ　Ｃｉｒｃｕｉｔ）等の特定の処理を実行させるために専用に設計された回路構成を有するプロセッサである専用電気回路等が例示される。また、制御処理を、これらの各種のプロセッサのうちの１つで実行してもよいし、同種又は異種の２つ以上のプロセッサの組み合わせ（例えば、複数のＦＰＧＡ、及びＣＰＵとＦＰＧＡとの組み合わせ等）で実行してもよい。また、これらの各種のプロセッサのハードウェア的な構造は、より具体的には、半導体素子等の回路素子を組み合わせた電気回路である。

　また、上記各実施形態では、制御プログラムがストレージ３０Ｄ又はＲＯＭ３０Ｂに予め記憶（インストール）されている態様を説明したが、これに限定されない。プログラムは、ＣＤ－ＲＯＭ（Ｃｏｍｐａｃｔ　Ｄｉｓｋ　Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）、ＤＶＤ－ＲＯＭ（Ｄｉｇｉｔａｌ　Ｖｅｒｓａｔｉｌｅ　Ｄｉｓｋ　Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）、及びＵＳＢ（Ｕｎｉｖｅｒｓａｌ　Ｓｅｒｉａｌ　Ｂｕｓ）メモリ等の記録媒体に記録された形態で提供されてもよい。また、プログラムは、ネットワークを介して外部装置からダウンロードされる形態としてもよい。
　本願は、２０２２年３月２日出願の日本国出願、特願２０２２－０３２１７６号の優先権を主張すると共に、その全体が参照により本明細書に取り込まれる。

１０ロボットシステム
２０ロボット
２１モータ駆動部
３０制御装置
３１取得部
３２記憶部
３３学習部
３４推定部
３５制御部
４０推定モデル
４１、４２ノード
Ｆ、Ｆ１、Ｆ２指
ＡＲロボットアーム
ＪＴ関節
ＧＲグリッパ
Ｍモータ
Ｓ、Ｓ１、Ｓ２触覚センサ
Ｔ対象

Claims

　対象物に作用するエンドエフェクタと、前記エンドエフェクタ又はロボット本体を駆動する駆動源と、前記エンドエフェクタに設けられた触覚センサと、を備えたロボットに接続され、前記駆動源を制御して前記対象物に作用を及ぼす制御装置であって、
　前記触覚センサを用いて、前記対象物から受ける接触力を予め定められた期間毎に取得する取得部と、
　入力された接触力に対して、所定の時期に前記対象物において所定の作用が生じるか否かを推定するモデルを有し、前記取得部により取得した前記接触力を前記モデルに入力して前記対象物に前記所定の作用が生じる時期を推定する推定部と、
　前記推定部により推定された推定結果に応じて、前記駆動源を制御する制御部と、
　を備えた制御装置。
　前記取得部は、対象物に所定の作用が生じた際に得られた前記接触力の結果を示す作用結果をさらに取得し、
　取得した前記作用結果を用いて、前記モデルに前記所定の作用が生じる時期を推定するための機械学習を実行する学習部をさらに備える請求項１に記載の制御装置。
　前記学習部は、前記作用結果から前記接触力の時系列特徴を検出し、検出した前記時系列特徴のうち、第１の条件を満たした時系列特徴に係る時期を、前記対象物に所定の作用が生じた時期として学習させる請求項２に記載の制御装置。
　前記第１の条件を満たした時系列特徴は、前記接触力が閾値を超えた後に、最初に検出された時系列特徴である
　請求項３に記載の制御装置。
　前記モデルは、入力された前記接触力を用いて、前記接触力の時系列特徴、及び前記所定の時期における推定接触力を推定し、前記推定接触力に係る前記所定の時期が、前記接触力の時系列特徴における時期に対応する場合、前記所定の時期に前記所定の作用が生じると推定する
　請求項１から請求項４の何れか１項に記載の制御装置。
　前記モデルは、前記接触力の時系列特徴における時期を基点とした範囲を設定し、前記推定接触力における所定の時期が、前記範囲に含まれる場合、前記所定の作用が生じると推定する
　請求項５に記載の制御装置。
　前記取得部は、前記対象物の特徴を示す特徴量をさらに取得し、
　前記モデルは、取得した前記特徴量に応じて、前記範囲を設定する
　請求項６に記載の制御装置。
　前記取得部は、前記エンドエフェクタに、複数の前記触覚センサが設けられ、前記触覚センサの各々を用いて、複数の前記接触力を取得する
　請求項１から請求項７の何れか１項に記載の制御装置。
　前記モデルは、前記複数の接触力の各々から、前記接触力の時系列特徴をそれぞれ推定し、推定した前記接触力の時系列特徴のうち、第２の条件を満たした時系列特徴を用いて、前記所定の作用が生じる時期を推定する
　請求項８に記載の制御装置。
　前記第２の条件を満たした時系列特徴は、前記接触力が閾値を超えた後に、最初に検出された時系列特徴である
　請求項９に記載の制御装置。
　前記制御部は、前記所定の時期に前記所定の作用が生じると推定した場合、前記駆動源の駆動を停止する
　請求項１から請求項１０の何れか１項に記載の制御装置。
　対象物に作用するエンドエフェクタと、前記エンドエフェクタ又はロボット本体を駆動する駆動源と、前記エンドエフェクタに設けられた触覚センサと、を備えたロボットに接続され、前記駆動源を制御して前記対象物に作用を及ぼす制御装置における制御方法であって、
　前記触覚センサを用いて、前記対象物から受ける接触力を予め定められた期間毎に取得し、
　入力された接触力に対して、所定の時期に前記対象物において所定の作用が生じるか否かを推定するモデルを有し、取得した前記接触力を前記モデルに入力して前記対象物に所定の作用が生じる時期を推定し、
　推定された推定結果に応じて、前記駆動源を制御する、
　制御方法。
　対象物に作用するエンドエフェクタと、前記エンドエフェクタ又はロボット本体を駆動する駆動源と、前記エンドエフェクタに設けられた触覚センサと、を備えたロボットに接続され、前記駆動源を制御して前記対象物に作用を及ぼす制御装置における制御プログラムであって、
　前記触覚センサを用いて、前記対象物から受ける接触力を予め定められた期間毎に取得し、
　入力された接触力に対して、所定の時期に前記対象物において所定の作用が生じるか否かを推定するモデルを有し、取得した前記接触力を前記モデルに入力して前記対象物に所定の作用が生じる時期を推定し、
　推定された推定結果に応じて、前記駆動源を制御する、
　処理をコンピュータに実行させる制御プログラム。