WO2023100656A1

WO2023100656A1 - 機械学習装置および推定装置

Info

Publication number: WO2023100656A1
Application number: PCT/JP2022/042549
Authority: WO
Inventors: 龍彦松本; 智貴西出
Original assignee: 株式会社村田製作所
Priority date: 2021-12-01
Filing date: 2022-11-16
Publication date: 2023-06-08

Abstract

行動状態学習システムの学習部（１１）は、推定部（１１２）と予測モデル更新部（１１５）とを備える。推定部（１１２）は、予測モデルを用いて計測値から予測値を推定する。予測モデル更新部（１１５）は、実測値と予測値との関係を示す関係データを用いて、予測値が実測値に対して偏った傾向を示すように予測モデルを更新しながら学習する。

Description

機械学習装置および推定装置

　本発明は、計測値から所定物理量を推定（予測）するときに利用する予測モデルの学習技術、および、当該予測モデルを用いた推定技術に関する。

　特許文献１には、行動状態学習装置が記載されている。特許文献１に記載の行動状態学習装置は、振動検知センサによって測定された信号から行動状態を推定するために用いるモデルを構築する。

　特許文献１に記載の行動状態学習装置は、振動検知センサによって測定された信号と、筋電位センサによって測定された信号とを用いて、行動状態モデルを学習する。この際、特許文献１に記載の行動状態学習装置は、振動検知センサによって測定された信号から予測される予測値と、筋電位センサによって測定された信号から得られる実測値とが略一致するように、行動状態モデルを学習する。

特開２０１１－１８２８２４号公報

　しかしながら、特許文献１に示すような従来の学習装置では、残差（予測値から実装値を減算した値）が正となった場合、同じ入力に対して低い予測値が出力されるように行動状態モデルの更新が行われる。また、特許文献１に示すような従来の学習装置では、残差が負となった場合、同じ入力に対して高い予測値が出力されるように行動状態モデルの更新が行われる。したがって、最終的に完成する学習済の行動状態モデルを用いた場合、残差の正負は、平均的にばらつく。

　この場合、例えば、上記行動状態モデルから出力された予測値を確認しながら、使用者が筋力トレーニングを行う場合、残差が正であると実測値よりも高い予測値が出力される。残差が正となる時間が長いと、使用者の認識よりも負荷が少ない時間が長くなり、トレーニング効率が悪くなる。一方、残差が負であると実測値よりも低い予測値が出力される。残差が負となる時間が長いと、使用者の想定よりも負荷をかけていないと誤認識する時間が長くなり、トレーニングに対するモチベーションが低下してしまうことがある。

　すなわち、予測値は、使用者の目的に合わないものとなってしまうことがある。

　したがって、本発明の目的は、実測値を参照しながら使用者の目的に応じた予測値を設定できる学習装置を提供することにある。

　この発明の機械学習装置は、推定部と予測モデル更新部とを備える。推定部は、予測モデルを用いて計測値から予測値を推定する。予測モデル更新部は、実測値と予測値との関係を示す関係データを用いて、予測値が実測値に対して偏った傾向を示すように予測モデルを更新しながら学習する。予測値が実測値に対して偏った傾向とは、例えば、予測値が実測値よりも小さい関係にある関係データの個数が、予測値が実測値以上の関係にある関係データの個数と比較して定常的に多い状態を意味する。または、予測値が実測値に対して偏った傾向とは、例えば、予測値が実測値よりも大きい関係にある関係データの個数が、予測値が実測値以下の関係にある関係データの個数と比較して、定常的に多い状態を意味する。

　この構成では、予測値は、予測モデルに基づく予測曲線に対して特定の偏った傾向を有する。これにより、予測値は、実測値に対して均等にばらつかず、特定の傾向をもって出力される。

　この発明によれば、実測値を参照しながら使用者の目的に応じた予測値を得られる。

図１は、本発明の実施形態に係る行動状態学習システムの機能ブロック図である。図２は、本発明の実施形態に係る学習部の機能ブロック図である。図３（Ａ）は、複数の関係データの分類の概念の第１態様を示す図であり、図３（Ｂ）は、損失値の設定例の第１態様を示す図である。図４（Ａ）は従来の損失値の設定方法による予測モデルの一例を示す図であり、図４（Ｂ）は本願の損失値の設定方法による予測モデルの一例を示す図である。図５（Ａ）、図５（Ｂ）、図５（Ｃ）は、予測値と実測値との関係（関係データ）を示す図である。図６は、本実施形態に係る行動状態学習方法を示すフローチャートである。図７（Ａ）は、入力ベクトルの生成方法を示すフローチャートであり、図７（Ｂ）は、教師データの生成方法を示すフローチャートである。図８は、予測モデルの学習の終了を決定するフローチャートである。図９（Ａ）は、複数の関係データの分類の概念の第２態様を示す図であり、図９（Ｂ）は、損失値の設定例の第２態様を示す図である。図１０（Ａ）は、複数の関係データの分類の概念の第３態様を示す図であり、図１０（Ｂ）は、損失値の設定例の第３態様を示す図である。図１１（Ａ）は、複数の関係データの分類の概念の第４態様を示す図であり、図１１（Ｂ）は、損失値の設定例の第４態様を示す図である。図１２（Ａ）は、複数の関係データの分類の概念の第５態様を示す図であり、図１２（Ｂ）は、損失値の設定例の第５態様を示す図である。図１３は、本発明の実施形態に係る行動状態推定装置の機能ブロック図である。

　［行動状態学習装置］
　本発明の実施形態に係る行動状態学習装置について、図を参照して説明する。図１は、本発明の実施形態に係る行動状態学習システムの機能ブロック図である。

　図１に示すように、行動状態学習システムは、学習部１１、予測モデル記憶部１２、変位検知センサ１０１、および、筋活動検知センサ１０２を備える。学習部１１が「機械学習装置」に対応する。変位検知センサ１０１が「第１センサ」に対応し、筋活動検知センサ１０２が「第２センサ」に対応する。

　変位検知センサ１０１は、例えば、振戦センサ、加速度センサ、角速度センサの少なくとも１つである。変位検知センサ１０１は、観測対象の変位を検知して、変位の大きさに応じた計測値を出力する。

　筋活動検知センサ１０２は、例えば、筋電センサ、姿勢を判定するカメラ、姿勢センサ等の少なくとも１つである。筋活動検知センサ１０２は、観測対象の筋肉の動きを検知して、動きの大きさに応じた実測値を出力する。

　例えば、被検体における下肢の筋肉活動を観測する場合、変位検知センサ１０１は、被検体の足首に取り付けられる。筋活動検知センサ１０２は、観測対象の筋肉が存在する皮膚の表面等に配置される。

　下記の学習を行った後は、被検体における下肢の筋肉活動は、被検体の足首に取り付けられた変位検知センサ１０１のみによって観測される。したがって、変位検知センサ１０１の出力する計測値から筋活動量（例えば筋電位）を推定する必要があり、このために、下記の学習が実行される。

　学習部１１は、変位検知センサ１０１からの計測値と、筋活動検知センサ１０２の実測値とを用いて、上記推定のための予測モデルを更新、学習する。この際、概略的には、学習部１１は、直前の予測モデルを用いて計測値から予測値を推定する。学習部１１は、実測値と予測値との関係を示す関係データを用いて、予測値が実測値に対して偏った傾向を示すように予測モデルを更新しながら学習する。学習部１１は、更新（学習）した予測モデルを、予測モデル記憶部１２に出力する。

　なお、予測値が実測値に対して偏った傾向とは、例えば、予測値が実測値よりも小さい関係にある関係データの個数が、予測値が実測値以上の関係にある関係データの個数と比較して定常的に多い状態を意味する。または、予測値が実測値に対して偏った傾向とは、例えば、予測値が実測値よりも大きい関係にある関係データの個数が、予測値が実測値以下の関係にある関係データの個数と比較して、定常的に多い状態を意味する。

　さらには、予測値が実測値に対して偏った傾向とは、例えば、全ての関係データに対して、予測値が実測値よりも小さい関係にある関係データが殆どを占める状態を意味する。または、予測値が実測値に対して偏った傾向とは、例えば、全ての関係データに対して、予測値が実測値よりも大きい関係にある関係データが殆どを占める状態を意味する。

　また、さらには、予測値が実測値に対して偏った傾向とは、例えば、全ての関係データにおいて、予測値が実測値よりも小さい関係にある状態を意味する。または、予測値が実測値に対して偏った傾向とは、例えば、全ての関係データにおいて、予測値が実測値よりも大きい関係にある状態を意味する。

　以下では、一例として、予測値が実測値よりも小さい関係にある関係データの個数が、予測値が実測値以上の関係にある関係データの個数と比較して定常的に多い状態、全ての関係データに対して予測値が実測値よりも小さい関係にある関係データが殆どを占める状態、または、全ての関係データにおいて予測値が実測値よりも小さい関係にある状態とする場合を説明する。

　予測モデル記憶部１２は、学習部１１で学習した予測モデルを記憶する。学習が終了した予測モデルは、上述の推定に利用される。

　（学習部１１）
　図２は、本発明の実施形態に係る学習部の機能ブロック図である。図２に示すように、学習部１１は、学習用データ生成部１１１、推定部１１２、データ取得部１１３、学習用条件設定部１１４、および、予測モデル更新部１１５を備える。学習部１１は、ＣＰＵ等のハードウェアの演算処理装置と、学習部１１の各機能を実行するためのプログラムと、プログラムを記憶する記憶部とによって実現される。記憶部は、演算処理装置の処理時にも利用される。演算処理装置がこのプログラムを実行することで、学習部１１は、上述の各機能を実現する。

　学習用データ生成部１１１には、変位検知センサ１０１から計測値が入力され、筋活動検知センサ１０２から実測値が入力される。

　学習用データ生成部１１１は、予測モデルに対する入力ベクトルを計測値から生成する。例えば、学習用データ生成部１１１は、計測値の特徴量を検出し、特徴量を入力ベクトルとして生成する。特徴量は、例えば、計測値の時間波形の特徴を示すもの（最大値、平均値等）や、計測値の周波数スペクトルの特徴を示すもの（最大スペクトル値、最大スペクトルの周波数等）である。なお、特徴量はこれに限るものではなく、被検体の観測対象箇所の動きに対応付け可能なものであればよい。

　学習用データ生成部１１１は、予測モデルに対する教師データを実測値から生成する。例えば、学習用データ生成部１１１は、実測値から行動状態成分を検出し、行動状態成分を入力ベクトルとして生成する。行動状態成分は、実測値における、被検体の観測対象箇所の動きに対応付け可能な成分である。

　学習用データ生成部１１１は、入力ベクトルと行動状態成分とを予測モデル更新部１１５に出力する。この際、学習用データ生成部１１１は、略同時刻の計測値と実測値から得られる入力ベクトルと行動状態成分とを対にして出力する。なお、略同時刻の計測値と実測値とは、同期されたサンプリングタイミングで得られた計測値と実測値とのことを示す。また、学習用データ生成部１１１は、入力ベクトルを推定部１１２に出力する。

　推定部１１２は、予測モデルを用いて入力ベクトルから予測値を推定する。この際に用いられる予測モデルは、直前の更新によって得られた予測モデルである。推定部１１２は、予測値をデータ取得部１１３に出力する。

　データ取得部１１３には、実測値と予測値とが入力される。データ取得部１１３は、実測値と予測値との関係を示す関係データを生成する。関係データは、実測値と予測値とをそれぞれ、データの第１構成要素および第２構成要素としたものである。この際の予測値は、実測値と略同時刻に検知された計測値から推定されたものである。なお、関係データには、この検知の時刻も関連付けられている。

　データ取得部１１３は、順次入力される実測値と予測値から、関係データを所定周期で順次生成する。これにより、データ取得部１１３は、複数の関係データ（複数時刻の関係データ）を生成する。データ取得部１１３は、複数の関係データを学習用条件設定部１１４に出力する。

　学習用条件設定部１１４は、複数の関係データを分類し、分類毎に設定された学習用の損失値を用いて、予測モデルの更新、学習に利用する学習用条件を設定する。

　より具体的には、学習用条件設定部１１４は、領域設定部１４１、損失値設定部１４２、個数検出部１４３、評価値算出部１４４、および、合計値算出部１４５を備える。

　領域設定部１４１は、複数の関係データを分類するための領域を設定する。図３（Ａ）は、複数の関係データの分類の概念の第１態様を示す図であり、図３（Ｂ）は、損失値の設定例の第１態様を示す図である。図３（Ａ）に示すように、領域設定部１４１は、実測値と予測値とを直交２軸とする直交座標系を設定する。領域設定部１４１は、実測値と予測値との直交座標系に対して、基準線９０を設定する。基準線９０は、実測値と予測値とが一致する点の集まり、すなわち、残差（予測値－実測値）が０となる点の集まりによって設定される。

　領域設定部１４１は、基準線９０よりも実測値側の領域９１と、基準線９０よりも予測値側の領域９２とを設定する。言い換えれば、領域設定部１４１は、残差が負値の領域９１と、残差が正値の領域９２とを設定する。

　損失値設定部１４２は、複数の領域９１、および、複数の領域９２に対して、損失値を設定する。例えば、図３（Ｂ）に示すように、損失値設定部１４２は、領域９１の関係データ対して損失値β１を設定し、領域９２の関係データに対して損失値β２を設定する。損失値β１および損失値β２は、正値である。損失値β２は損失値β１よりも大きい（β２＞β１）。なお、損失値設定部１４２は、基準線９０上の関係データについては、損失値０を設定する。

　個数検出部１４３は、複数の関係データのそれぞれについて、残差を算出し、領域９１、領域９２に分類する。具体的に、個数検出部１４３は、関係データの予測値と実測値との残差が負値ならば、この関係データは領域９１に属すると判定する。個数検出部１４３は、関係データの予測値と実測値との残差が正値ならば、この関係データは領域９２に属すると判定する。

　個数検出部１４３は、領域９１に属する関係データの個数（第１個数ｎ１）と、領域９２に属する関係データの個数（第２個数ｎ２）とを検出する。個数検出部１４３は、第１個数ｎ１と第２個数ｎ２とを評価値算出部１４４に出力する。

　評価値算出部１４４は、損失値β１、損失値β２、第１個数ｎ１、および、第２個数ｎ２を用いて、評価値Ｌ１を算出する。具体的には、評価値算出部１４４は、第１個数ｎ１と損失値β１との乗算（ｎ１×β１）によって、領域９１（残差が負値の関係データ）に対する評価値Ｌ１を算出する。評価値算出部１４４は、第２個数ｎ２と損失値β２との乗算（ｎ１×β１）によって、領域９２（残差が正値の関係データ）に対する評価値Ｌ２を算出する。評価値算出部１４４は、評価値Ｌ１と評価値Ｌ２とを合計値算出部１４５に出力する。

　合計値算出部１４５は、評価値Ｌ１と評価値Ｌ２とを加算して合計値Ｌを算出する。すなわち、合計値算出部１４５は、Ｌ＝Ｌ１＋Ｌ２＝ｎ１×β１＋ｎ２×β２の演算を行う。合計値算出部１４５は、合計値Ｌを学習用条件として予測モデル更新部１１５に出力する。

　このように、学習用条件設定部１１４は、残差の大きさに応じて関係データ毎に個別に損失値を設定するのではなく、残差の絶対値に関係なく残差の正負のみに応じて、関係データに対する損失値を設定する。

　予測モデル更新部１１５には、計測値に基づく入力ベクトルと、実測値の基づく教師データとが入力される。また、予測モデル更新部１１５には、学習用条件（合計値Ｌ）が入力される。

　予測モデル更新部１１５は、学習用条件（合計値Ｌ）が低くなるように、予測モデルを更新、学習する。予測モデルの学習は、既知の方法であり、例えば、多クラス分類可能なＳＶＭやＧＭＭ、ＨＭＭ、ニューラルネットワーク、学習型ベイジアンネットワーク等の認識器や複数の認識器の構成を用いて行われる。認識器については、複数の認識器を組み合わせてもよく、例えば、ＡｄａＢｏｏｓｔといった手法に代表されるブースティング（ｂｏｏｓｔｉｎｇ）などの手法を用いてもよい。この他、１クラスの分類しかできない認識器や多クラス分類可能な認識器を多段に構成して一つの認識方式を構成してもよい。

　予測モデル更新部１１５は、学習を繰り返しながら予測モデルを更新し、学習終了を検知すると、学習の終了を検出すると、その時点での予測モデルを、予測モデル記憶部１２に出力する。

　ここで、学習用条件設定部１１４は、損失値β２を損失値β１よりも大きく設定している。これにより、予測モデルは、以下のような形状になり、これに応じて、予測値と実測値との関係も以下のように遷移する。

　図４（Ａ）は従来の損失値の設定方法による予測モデルの一例を示す図であり、図４（Ｂ）は本願の損失値の設定方法による予測モデルの一例を示す図である。図４（Ａ）に示す従来の損失値の設定方法は、残差の大きさに応じて関係データの損失値を個別に設定する方法である。

　図４（Ａ）に示すように、従来の損失値の設定方法では、入力ベクトルと教師データとによって定義される複数の点は、予測モデル曲線８０の両側に略均等に存在する。すなわち、教師データが入力ベクトルよりも高い点と、教師データが入力ベクトルよりも低い点が同程度に存在する。

　しかしながら、図４（Ｂ）に示すように、本願の損失値の設定方法では、入力ベクトルと教師データとによって定義される複数の点は、予測モデル曲線８０の一方側に集中する。すなわち、教師データが入力ベクトルよりも高い点の集まりとなり、教師データが入力ベクトルよりも低い点はほぼなくなる。

　これにより、予測値と実測値の関係は、図５（Ａ）、図５（Ｂ）、図５（Ｃ）に示すように遷移する。図５（Ａ）、図５（Ｂ）、図５（Ｃ）は、予測値と実測値との関係（関係データ）を示す図である。図５（Ａ）、図５（Ｂ）、図５（Ｃ）の順で学習が進んでいる。

　図５（Ａ）、図５（Ｂ）、図５（Ｃ）に示すように、学習が進むにしたがって、予測値が実測値よりも大きくなる点（関係データ）は少なくなる。そして、最終的には、予測値の大きさおよび実測値の大きさに関わらず、予測値が実測値よりも小さい場合がほとんどとなる。

　したがって、この予測モデルを用いて、計測値から予測値を推定すると、予測値は実測値よりも小さくなる。これにより、例えば、この予測値を用いてトレーニングを行う場合、ユーザ（被検体）の認識よりも負荷が大きい時間が長くなり、トレーニング効率を高くできる。

　また、損失値β１と損失値β２との関係を逆にした場合（β２＜β１）、この予測モデルを用いて、計測値から予測値を推定すると、予測値は実測値よりも大きくなる。これにより、例えば、この予測値を用いてトレーニングを行う場合、ユーザの想定よりも負荷をかけていると思わせる時間が長くなり、トレーニングに対するモチベーションを向上させることができる。

　このように、本実施形態の行動状態学習システムを用いることで、計測値と実測値とを用いながら、所望とする推定結果を得られるように、予測モデルを構成できる。

　（行動状態学習方法）
　図６は、本実施形態に係る行動状態学習方法を示すフローチャートである。図７（Ａ）は、入力ベクトルの生成方法を示すフローチャートであり、図７（Ｂ）は、教師データの生成方法を示すフローチャートである。図８は、予測モデルの学習の終了を決定するフローチャートである。なお、各処理での具体的な内容は、上述の構成において行っており、追加説明が必要な箇所を除いて、以下では説明を省略する。

　行動状態学習システムの学習部１１は、計測値から入力ベクトルを生成し、実測値から教師データを生成する（Ｓ１１）。より具体的には、学習部１１は、計測値を取得し（Ｓ２１）、計測値の特徴量を抽出する（Ｓ２２）。学習部１１は、計測値の特徴量を用いて入力ベクトルを生成する（Ｓ２３）。また、学習部１１は、実測値を取得し（Ｓ３１）、実測値から行動状態成分量を算出する（Ｓ３２）。学習部１１は、行動状態成分量から教師データを生成する（Ｓ３３）。

　学習部１１は、予測値と実測値の関係データを生成する（Ｓ１２）。学習部１１は、領域９１、９２毎に関係データの個数ｎ１、ｎ２を算出する（Ｓ１３）。学習部１１は、領域９１、９２毎に設定された損失値β１、β２と個数ｎ１、ｎ２とを用いて、領域９１、９２毎に評価値Ｌ１、Ｌ２を算出する（Ｓ１４）。

　学習部１１は、評価値Ｌ１、Ｌ２を用いて合計値Ｌを算出する（Ｓ１５）。学習部１１は、合計値Ｌを学習用条件として、予測モデルを更新（学習）する（Ｓ１６）。

　学習部１１は、学習終了条件をクリアすると（Ｓ１７：ＹＥＳ）、予測モデルを出力する（Ｓ１８）。学習部１１は、学習終了条件をクリアしていなければ（Ｓ１７：ＮＯ）、予測モデルの学習を繰り返す。

　より具体的には、学習部１１は、前回の合計値（学習用条件）と今回の合計値（学習用条件）とを比較する（Ｓ４１）。今回の合計値が前回の合計値よりも小さければ（Ｓ４２：ＹＥＳ）、今回学習した予測モデルに更新し（Ｓ４３）、予測モデルの学習を繰り返す。学習部１１は、今回の合計値が前回の合計値よりも小さくなければ（Ｓ４２：ＮＯ）、前回の学習時の予測モデルを維持する（Ｓ４４）。学習部１１は、予測モデルの維持回数が閾値回数未満であれば（Ｓ４５：ＹＥＳ）、学習を継続する（Ｓ４６）。学習部１１は、予測モデルの維持回数が閾値回数に達すると（Ｓ４５：ＮＯ）、学習を終了する（Ｓ４７）。

　（領域および損失値の設定の別態様）
　図９（Ａ）は、複数の関係データの分類の概念の第２態様を示す図であり、図９（Ｂ）は、損失値の設定例の第２態様を示す図である。

　図９（Ａ）に示すように、領域および損失値の第２態様としては、領域９１Ａ、領域９２Ａ、領域９３Ａを設定する。領域９１Ａは、残差が負値であり、その絶対値が領域決定用閾値以上の領域である。領域９２Ａは、残差が正値であり、その絶対値が領域決定用閾値以上の領域である。領域９３Ａは、残差の絶対値が領域決定用閾値未満の領域である。

　領域９１Ａには損失値β１が設定され、領域９２Ａには損失値β２が設定される。損失値β１は損失値β２よりも小さい。領域９３Ａの損失値は０に設定される。

　このような設定を行うことによって、予測モデルの学習に対する計測値と実測値との測定誤差の影響を抑制できる。

　図１０（Ａ）は、複数の関係データの分類の概念の第３態様を示す図であり、図１０（Ｂ）は、損失値の設定例の第３態様を示す図である。

　図１０（Ａ）に示すように、領域および損失値の第３態様としては、領域９１Ｂ、領域９２Ｂ、領域９３Ｂを設定する。領域９１Ｂは、残差が負値であり、その絶対値が領域決定用第１閾値以上の領域である。領域９２Ｂは、残差が正値であり、その絶対値が領域決定用第２閾値以上の領域である。領域９３Ａは、残差が負値で且つその絶対値が領域決定用第１閾値未満、または、残差が正値で且つその絶対値が領域決定用第２閾値未満の領域である。

　領域９１Ｂには損失値β１が設定され、領域９２Ｂには損失値β２が設定される。損失値β１は損失値β２よりも小さい。領域９３Ｂの損失値は０に設定される。

　このような設定を行うことによって、予測モデルの学習に対する計測値と実測値との測定誤差の影響を抑制できる。また、この設定では、残差が負値側における損失値が０の領域は、残差が正値側における損失値が０の領域よりも広い。これにより、予測値が実測値よりもさらに確実に小さくなる予測モデルを設定できる。

　図１１（Ａ）は、複数の関係データの分類の概念の第４態様を示す図であり、図１１（Ｂ）は、損失値の設定例の第４態様を示す図である。

　図１１（Ａ）に示すように、領域および損失値の第４態様としては、領域９１Ｃ、領域９２Ｃ、領域９３Ｃを設定する。領域９１Ｃは、残差が負値であり、実測値が領域決定用第３閾値以上の領域である。領域９２Ｃは、残差が正値であり、実測値が領域決定用第３閾値以上の領域である。領域９３Ｃは、残差の絶対値が領域決定用閾値未満か、実測値が領域決定用第３閾値未満の領域である。

　領域９１Ｃには損失値β１が設定され、領域９２Ｃには損失値β２が設定される。損失値β１は損失値β２よりも小さい。領域９３Ｃの損失値は０に設定される。

　このような設定を行うことによって、予測モデルの学習に対する実測値が小さい場合の影響を抑制できる。すなわち、推定される予測値が実使用の範囲内となるよう場合だけを想定して、予測モデルを学習することができる。

　図１２（Ａ）は、複数の関係データの分類の概念の第５態様を示す図であり、図１２（Ｂ）は、損失値の設定例の第５態様を示す図である。

　図１２（Ａ）に示すように、領域および損失値の第５態様としては、領域９１Ｄ、領域９２Ｄを設定する。領域９１Ｄは、残差が負値であり、その絶対値が領域決定用閾値以上の領域である。領域９２Ｄは、残差が正値、または、残差が負値であり、その絶対値が領域決定用閾値未満の領域である。

　領域９１Ｄには損失値β１が設定され、領域９２Ｄには損失値β２が設定される。損失値β１は損失値β２よりも小さい。

　このような設定を行うことによって、領域９２Ｄは、基準線９０の領域を含み、領域９１Ｄよりも広い。これにより、予測値が実測値よりもさらに確実に小さくなる予測モデルを設定できる。

　なお、上述の各態様では、予測値を実測値よりも小さくする場合を示したが、上述の概念を適用することで、各領域を適宜設定することで、予測値を実測値よりも大きくすることも可能である。

　（行動状態推定装置）
　図１３は、本発明の実施形態に係る行動状態推定装置の機能ブロック図である。図１３に示すように、行動状態推定装置１６は、入力ベクトル生成部１６１、および、推定演算部１６２を備える。

　入力ベクトル生成部１６１は、変位検知センサ１０１からの計測値を用いて、入力ベクトルを生成する。入力ベクトルの生成方法は、上述の学習用データ生成部１１１と同様である。入力ベクトル生成部１６１は、生成した入力ベクトルを推定演算部１６２に出力する。

　推定演算部１６２は、予測モデル記憶部１２に記憶された予測モデルを用いて、入力ベクトルから予測値を推定する。この際、推定演算部１６２は、上述のように学習した予測モデルを用いる。

　このような構成によって、行動状態推定装置１６は、実測値に対して偏った傾向を示すように予測値を推定できる。例えば、行動状態推定装置１６は、予測値が実測値よりも小さくなるように、予測値を推定できる。より具体的には、行動状態推定装置１６は、予測値の全てが実測値より小さくなるように、予測値を推定できる。または、行動状態推定装置１６は、予測値が実測値より小さい回数が、予測値が実測値より大きい回数よりも少なくなるように、予測値を推定できる。

　または、行動状態推定装置１６は、予測値が実測値よりも大きくなるように、予測値を推定することも可能である。

　また、行動状態推定装置１６は、予測値が実測値よりも小さくなるようにするか、それとも大きくなるようにするか、を選択できるようにすることも可能である。この場合、例えば、行動状態推定システムは、スイッチ等の操作入力部を備える。ユーザは、自分の目的に応じて、操作入力部を操作する。これにより、行動状態推定装置１６は、予測値が実測値よりも小さくなるようにするか、予測値が実測値よりも大きくなるようにするか、を選択できる。

　なお、上述の例では、筋力トレーニングに適用する場合を示したが、筋力の回復を目指すリハビリテーションにも適用できる。

１１：学習部
１２：予測モデル記憶部
１０１：変位検知センサ
１０２：筋活動検知センサ
１１１：学習用データ生成部
１１２：推定部
１１３：データ取得部
１１４：学習用条件設定部
１１５：予測モデル更新部
１４１：領域設定部
１４２：損失値設定部
１４３：個数検出部
１４４：評価値算出部
１４５：合計値算出部
１６：行動状態推定装置
１６１：入力ベクトル生成部
１６２：推定演算部

Claims

　予測モデルを用いて計測値から予測値を推定する推定部と、
　実測値と前記予測値との関係を示す関係データを用いて、前記予測値が前記実測値に対して偏った傾向を示すように前記予測モデルを更新しながら学習する予測モデル更新部と、
　を備える、
　機械学習装置。
　前記予測値と前記実測値との関係を示す関係データを複数回取得するデータ取得部と、
　前記複数の関係データを残差によって分類し、前記分類毎に設定された学習用の損失値を用いて、学習用条件を設定する学習用条件設定部と、を備え、
　前記予測モデル更新部は、
　　前記学習用条件を用いて、前記予測モデルを更新する、
　を備える、請求項１に記載の機械学習装置。
　前記学習用条件設定部は、
　前記複数の関係データの分類として、前記複数回取得した関係データの分布に対して複数の領域を設定する領域設定部と、
　前記複数の領域毎に異なる損失値を設定する損失値設定部と、
　前記残差を用いて前記複数回取得した関係データがそれぞれにいずれの領域に分類されるかを検出し、前記関係データの個数を前記複数の領域毎に検出する個数検出部と、
　前記複数の領域毎に、前記個数と前記損失値とを用いて評価値を算出する評価値算出部と、
　前記複数の領域の評価値の合計値を算出する合計値算出部と、
　を備え、
　前記予測モデル更新部は、
　　前記学習用条件として前記合計値が低下するように前記予測モデルを更新する、
　請求項２に記載の機械学習装置。
　前記予測モデル更新部は、
　　前記予測モデルの更新後の前記合計値が前記予測モデルの更新前の前記合計値よりも小さくなるように、前記予測モデルの更新を繰り返す、
　請求項３に記載の機械学習装置。
　前記予測モデル更新部は、
　　前記予測モデルの更新後の前記合計値が前記予測モデルの更新前の前記合計値よりも小さければ、前記予測モデルの更新を継続する、
　請求項３または請求項４のいずれかに記載の機械学習装置。
　前記予測モデル更新部は、
　　前記予測モデルの更新後の前記合計値が前記予測モデルの更新前の前記合計値よりも大きければ、前記予測モデルの更新を行わない、
　請求項３乃至請求項５のいずれかに記載の機械学習装置。
　前記予測モデル更新部は、
　前記予測モデルの更新を行わない回数が閾値回数に達すると、前記予測モデルの更新を停止する、
　請求項３乃至請求項６のいずれかに記載の機械学習装置。
　前記推定部は、直前に更新された予測モデルを用いて前記予測値を推定する、
　請求項３乃至請求項７のいずれかに記載の機械学習装置。
　前記計測値を計測する第１センサと、
　前記第１センサと異なる種類のセンサからなり、前記実測値を測定する第２センサと、
　備える、
　請求項３乃至請求項８のいずれかに記載の機械学習装置。
　前記第１センサは、振戦センサを含み、
　前記第２センサは、筋電センサである、
　請求項９に記載の機械学習装置。
　前記第１センサは、加速度センサおよび角速度センサの少なくとも一方を含む、
　請求項１０に記載の機械学習装置。
　前記第１センサは、被検体の足首に取り付けられ、
　前記予測モデルは、下肢の筋肉の活動を予測するモデルである、
　請求項９乃至請求項１１のいずれかに記載の機械学習装置。
　前記損失値設定部は、前記複数の領域の大きさを可変にする、
　請求項３乃至請求項１２のいずれかに記載の機械学習装置。
　前記損失値設定部は、前記複数の領域毎の損失値を可変にする、
　請求項３乃至請求項１３のいずれかに記載の機械学習装置。
　前記損失値設定部は、
　前記損失値が０でない複数の領域と、前記損失値が０の領域とを設定する、
　請求項３乃至請求項１４のいずれかに記載の機械学習装置。
　前記損失値設定部は、
　前記実測値が所定値以上の関係データに対してのみ前記損失値を設定する、
　請求項３乃至請求項１５のいずれかに記載の機械学習装置。
　計測値を計測する第１センサと、
　前記計測値と予測モデルとを用いて、予測値を推定する推定部と、
　を備え、
　前記推定部は、
　　前記第１センサと異なる第２センサで実測された実測値に対して偏った傾向を示すように、前記予測値を推定する、
　推定装置。
　前記推定部は、
　　前記実測値に対して前記予測値が偏った傾向を示す前記予測モデルを用いて、前記予測値を推定する、
　請求項１７に記載の推定装置。
　前記推定部は、
　　前記予測値が前記実測値より小さい回数が、前記予測値が前記実測値より大きい回数よりも多くなるように、前記予測値を推定する、
　請求項１７または請求項１８に記載の推定装置。
　前記推定部は、
　　前記予測値の全てが前記実測値より小さくなるように、前記予測値を推定する、
　請求項１９に記載の推定装置。
　前記推定部は、
　　前記予測値が前記実測値より小さい回数が、前記予測値が前記実測値より大きい回数よりも少なくなるように、前記予測値を推定する、
　請求項１７または請求項１８に記載の推定装置。
　前記推定部は、
　　前記予測値の全てが前記実測値より大きくなるように、前記予測値を推定する、
　請求項２１に記載の推定装置。
　前記第１センサは、振戦センサを含む、
　請求項１７乃至請求項２２のいずれかに記載の推定装置。
　前記第１センサは、加速度センサおよび角速度センサの少なくとも一方を含む、
　請求項２３に記載の推定装置。
　前記第１センサは、被検体の足首に取り付けられ、
　前記予測モデルは、下肢の筋肉の活動を予測するモデルである、
　請求項１７乃至請求項２４のいずれかに記載の推定装置。