WO2023139718A1

WO2023139718A1 - 特徴量選定装置、特徴量選定方法、身体状態推定システム、および記録媒体

Info

Publication number: WO2023139718A1
Application number: PCT/JP2022/001953
Authority: WO
Inventors: 晨暉黄; 史行二瓶
Original assignee: 日本電気株式会社
Priority date: 2022-01-20
Filing date: 2022-01-20
Publication date: 2023-07-27
Also published as: US20250045354A1; JPWO2023139718A1

Abstract

飛び値や外れ値に対するロバスト性の高い特徴量を選定するために、複数のデータセットを取得する取得部と、データセットに含まれるデータの分布を変更して複数の再抽出データセットを構築する構築部と、ラッソ回帰の手法を用いて、複数の再抽出データセットを解析する解析部と、複数の再抽出データセットの解析結果に応じて複数の再抽出データセットに含まれる要素の値を集計し、要素の値の集計結果に応じて複数の再抽出データセットに含まれる要素に論理値を設定する統計部と、予め設定された特定ルールに従って、要素に設定された論理値の値に応じた組み合わせの特徴量を選定する選定部と、選定された特徴量の組み合わせに関する選定情報を出力する出力部と、を備える特徴量選定装置とする。

Description

特徴量選定装置、特徴量選定方法、身体状態推定システム、および記録媒体

　本開示は、推定に用いられる特徴量を選定する特徴量選定装置等に関する。

　ＩｏＴ（Internet of Things）技術の普及により、各種のＩｏＴ機器から、様々な情報を収集できる。例えば、医療やヘルスケア、セキュリティなどの分野において、ＩｏＴ機器によって収集された情報を活用する試みがなされている。ＩｏＴ機器によって収集された情報に機械学習を適用すれば、身体状態の推定などの用途に、それらの情報を活用できる。ＩｏＴ機器は、電力供給が難しい場所に配置されることが多いため、高度な省電力が要求される。ＩｏＴ機器の消費電力のうち、通信に費やされる消費電力の割合が大きい。例えば、身体状態の推定などに用いられる特徴量の情報量を削減できれば、ＩｏＴ機器から送信される情報量が削減され、ＩｏＴ機器の電力消費を低減できる。

　特許文献１には、工場などで収集されるセンサデータから、装置の異常予測との因果関係が希薄なデータを削減する技術が開示されている。特許文献１には、複数のスパース推定手法を活用して、因果関係の希薄なデータを削減する技術が開示されている。特許文献１には、スパース推定手法の一例として、ＬＡＳＳＯ（Least Absolute Shrinkage and Selection Operator）回帰（ラッソ回帰とも呼ばれる）が挙げられている。特許文献１の手法では、スパース推定手法を適用可能である複数のデータを入力とし、複数のスパース推定手法を適用して所定の出力を行うモデルに対して、複数のスパース推定手法の各適用度合いを学習させる。特許文献１の手法によれば、課題に応じて適切なスパース推定手法を選択し、選択したスパース推定手法に対してスパース性の度合いを調整できる。

特開２０２１－１４９５９０号公報

　特許文献１の手法を用いれば、身体状態などの推定に用いられる特徴量のうち、重要ではない特徴量を削減することも可能である。例えば、ラッソ回帰を用いれば、推定に用いられる特徴量のうち重要な特徴量を選定することで、不要な特徴量を削減できる。しかしながら、被験者数が少ない場合、ラッソ回帰を用いて特徴量を選定すると、飛び値や外れ値による影響を受けやすい。数少ないデータの中で、飛び値や外れ値を恣意的に除外すると、推定に用いられるモデルの有効性が低下する。そのため、飛び値や外れ値に対するロバスト性の高い特徴量を選定することが求められる。

　本開示の目的は、飛び値や外れ値に対するロバスト性の高い特徴量を選定できる特徴量選定装置等を提供することにある。

　本開示の一態様の特徴量選定装置は、複数のデータセットを取得する取得部と、データセットに含まれるデータの分布を変更して複数の再抽出データセットを構築する構築部と、ラッソ回帰の手法を用いて、複数の再抽出データセットを解析する解析部と、複数の再抽出データセットの解析結果に応じて複数の再抽出データセットに含まれる要素の値を集計し、要素の値の集計結果に応じて複数の再抽出データセットに含まれる要素に論理値を設定する統計部と、予め設定された特定ルールに従って、要素に設定された論理値の値に応じた組み合わせの特徴量を選定する選定部と、選定された特徴量の組み合わせに関する選定情報を出力する出力部と、を備える。

　本開示の一態様の特徴量推定方法においては、複数のデータセットを取得し、データセットに含まれるデータの分布を変更して複数の再抽出データセットを構築し、ラッソ回帰の手法を用いて、複数の再抽出データセットを解析し、複数の再抽出データセットの解析結果に応じて複数の再抽出データセットに含まれる要素の値を集計し、要素の値の集計結果に応じて複数の再抽出データセットに含まれる要素に論理値を設定し、予め設定された特定ルールに従って、要素に設定された論理値の値に応じた組み合わせの特徴量を選定し、選定された特徴量の組み合わせに関する選定情報を出力する。

　本開示の一態様のプログラムは、複数のデータセットを取得する処理と、データセットに含まれるデータの分布を変更して複数の再抽出データセットを構築する処理と、ラッソ回帰の手法を用いて、複数の再抽出データセットを解析する処理と、複数の再抽出データセットの解析結果に応じて複数の再抽出データセットに含まれる要素の値を集計する処理と、要素の値の集計結果に応じて複数の再抽出データセットに含まれる要素に論理値を設定する処理と、予め設定された特定ルールに従って、要素に設定された論理値の値に応じた組み合わせの特徴量を選定する処理と、選定された特徴量の組み合わせに関する選定情報を出力する処理と、をコンピュータに実行させる。

　本開示によれば、飛び値や外れ値に対するロバスト性の高い特徴量を選定できる特徴量選定装置等を提供することが可能になる。

第１の実施形態に係る特徴量選定装置の構成の一例を示すブロック図である。第１の実施形態に係る特徴量選定装置が生成する第１行列について説明するための概念図である。第１の実施形態に係る特徴量選定装置が生成する複数パターンの第１行列について説明するための概念図である。第１の実施形態に係る特徴量選定装置が生成する複数パターンの第１行列の各セルの集計値について説明するための概念図である。第１の実施形態に係る特徴量選定装置が生成する第２行列について説明するための概念図である。一般的なラッソ回帰の手法で選定された特徴量を用いて生成された推定モデルを用いた推定例である。第１の実施形態の手法で選定された特徴量を用いて生成された推定モデルを用いた推定例である。複数の被験者に関して計測されたセンサデータに含まれうる飛び値や外れ値の影響について説明するためのグラフである。第１の実施形態に係る特徴量選定装置の動作の一例について説明するためのフローチャートである。第１の実施形態に係る特徴量選定装置の動作の一例について説明するためのフローチャートである。第２の実施形態に係る特徴量選定装置の構成の一例を示すブロック図である。第２の実施形態に係る特徴量選定装置の動作の一例について説明するためのフローチャートである。第２の実施形態に係る特徴量選定装置の動作の一例について説明するためのフローチャートである。第２の実施形態に係る特徴量選定装置の動作の一例について説明するためのフローチャートである。第３の実施形態に係る特徴量選定装置の構成の一例を示すブロック図である。第３の実施形態に係る特徴量選定装置の動作の一例について説明するためのフローチャートである。第３の実施形態に係る特徴量選定装置の動作の一例について説明するためのフローチャートである。第４の実施形態に係る特徴量選定装置の構成の一例を示すブロック図である。第５の実施形態に係る学習システムの構成の一例を示すブロック図である。第５の実施形態に係る学習システムが備える学習装置の構成の一例を示すブロック図である。第５の実施形態に係る学習システムが備える学習装置の学習の一例について説明するための概念図である。第６の実施形態に係る身体状態推定システムの構成の一例を示すブロック図である。第６の実施形態に係る身体状態推定システムが備える歩容計測装置の構成の一例を示すブロック図である。第６の実施形態に係る身体状態推定システムが備える歩容計測装置の配置例について説明するための概念図である。第６の実施形態に係る身体状態推定システムが備える歩容計測装置に設定される座標系について説明するための概念図である。第６の実施形態に係る身体状態推定システムが備える歩容計測装置に関する説明で用いられる人体面について説明するための概念図である。第６の実施形態に係る身体状態推定システムが備える歩容計測装置に関する説明で用いられる歩行周期について説明するための概念図である。第６の実施形態に係る身体状態推定システムが備える歩容計測装置が計測するセンサデータの時系列データの一例について説明するためのグラフである。第６の実施形態に係る身体状態推定システムが備える歩容計測装置が計測するセンサデータの時系列データから抽出される歩行波形データの正規化の一例について説明するための図である。第６の実施形態に係る身体状態推定システムが備える歩容計測装置の特徴量データ生成部が特徴量を抽出する歩行フェーズクラスターの一例について説明するための概念図である。第６の実施形態に係る身体状態推定システムが備える推定装置の構成の一例を示すブロック図である。第６の実施形態に係る身体状態推定システムが備える推定装置による身体状態のスコアの推定例を示すブロック図である。第６の実施形態に係る身体状態推定システムが備える歩容計測装置の動作の一例について説明するためのフローチャートである。第６の実施形態に係る身体状態推定システムが備える推定装置の動作の一例について説明するためのフローチャートである。第６の実施形態に係る身体状態推定システムの適用例について説明するための概念図である。各実施形態に係る処理を実行するハードウェア構成の一例を示すブロック図である。

　以下に、本発明を実施するための形態について図面を用いて説明する。ただし、以下に述べる実施形態には、本発明を実施するために技術的に好ましい限定がされているが、発明の範囲を以下に限定するものではない。なお、以下の実施形態の説明に用いる全図においては、特に理由がない限り、同様箇所には同一符号を付す。また、以下の実施形態において、同様の構成・動作に関しては繰り返しの説明を省略する場合がある。

　（第１の実施形態）
　まず、第１の実施形態に係る特徴量選定装置について、図面を参照しながら説明する。本実施形態の特徴量選定装置は、ＬＡＳＳＯ（Least Absolute Shrinkage and Selection Operator）回帰（以下、ラッソ回帰と呼ぶ）の手法を用いて、身体状態などの推定に用いられる特徴量を選定する。ラッソ回帰は、Ｌ１正則化とも呼ばれる。

　以下においては、身体状態の推定に用いられる特徴量の選定に関して説明する。例えば、身体状態の推定に用いられる特徴量は、ユーザの歩行に応じた足の動きに関するセンサデータに基づいて、抽出される。例えば、足の動きに関するセンサデータは、履物に設置された計測装置によって計測される。例えば、計測装置は、加速度センサや角速度センサを含む。なお、センサデータは、足の動きに関するセンサデータに限定されず、歩容に関する特徴を含めばよい。例えば、センサデータは、モーションキャプチャーやスマートアパレル等を用いて計測された、歩容に関する特徴を含むセンサデータであってもよい。また、以下の手法は、歩容に関する特徴量の選定のみならず、任意のセンサデータから特徴量を選定する用途に適用できる。

　（構成）
　図１は、本実施形態に係る特徴量選定装置１０の構成の一例を示すブロック図である。特徴量選定装置１０は、取得部１１、構築部１２、解析部１３、統計部１５、選定部１７、および出力部１９を備える。

　取得部１１は、複数の被験者に関して計測された、身体状態の推定に用いられるデータセットを取得する。データセットは、説明変数と、その説明変数に対応する目的変数とを組み合わせたデータである。例えば、データセットは、被験者に関する計測値や特徴量と、その被験者の身体状態とを対応付けたデータである。例えば、身体状態の推定に用いられる説明変数は、足の動きや歩容に関するセンサデータから抽出された特徴量である。

　構築部１２は、複数の被験者に関するデータセットの分布を変えて、新たなデータセット（再抽出データセットとも呼ばれる）を構築する。例えば、構築部１２は、Leave-One-Subject-Out（ＬＯＳＯとも呼ばれる）の手法を用いて、再抽出データセットを構築する。ＬＯＳＯの手法を用いる場合、複数のデータセットから一つを除去し、残りのデータセットを用いて再構築データセットを構築する。ＬＯＳＯの手法を用いる場合、再構築データセットは、被験者の数だけ生成される。例えば、被験者が５０人いる場合、ＬＯＳＯの手法を用いれば、５０個の再抽出データセットを構築できる。

　構築部１２は、ブートストラップ法を用いて、再抽出データセットを構築してもよい。ブートストラップ法では、復元抽出法によって標本集団からランダムに抽出される値に基づいて、母集団の性質を推定する。ブートストラップ法では、標本集団からランダムに抽出される値を用いた新しいデータセットの生成を繰り返し、統計値を計算する。例えば、新しいデータセットの生成を１０００回繰り返したら、１０００個分のデータの再抽出データセットを構築できる。

　解析部１３は、構築部１２によって構築された再抽出データセットに関して、ラッソ回帰を実行する。例えば、解析部１３は、以下の式１で表される損失関数を用いる。

上記の式１において、Ｎは、観測数である。ｉは、観測値の番号である。ｘ_iは、観測値ｉにおける長さｐのベクトル（データ）である。ｙ_iは、観測値ｉの応答データ（正解値）である。λは、一つの値に対応する非負の正則化パラメータ（ラグランジュ乗数）である。β₀は、スカラーである。βは、長さｐのベクトルである。ｊは、特徴量番号である。特徴量がｐ個の場合、特徴量番号ｊは、１～ｐのいずれかになる。β_jは、推定モデルとして用いられる多項式関数の係数（モデルパラメータとも呼ばれる）に相当する。Ｔは、転置処理を示す。

　式１の右辺の第１項は、二乗和誤差に関する項である。式１の右辺の第２項は、正則化項である。正則化項は、モデルパラメータβ_ｊが大きくなるほど大きい値を返すように定義された関数である。正則化項は、モデルパラメータβ_ｊの大きさに対するペナルティに相当する。

　正則化パラメータλは、モデルの学習時に設定されるメタなパラメータである。正則化パラメータλは、正則化（ペナルティ）の強さを調節する。正則化パラメータλの値が大きいと、正則化項のペナルティが強くなり、過学習がより強く抑えられる。正則化パラメータλの値が大きすぎると、モデルパラメータを小さく保つことが優先されてモデルの表現力が低下する。その結果、正則化パラメータλの値が大きすぎると、大きなバイアスが残る。

　正則化パラメータλの設定に応じて、ラッソ回帰では、以下の式２の問題が解決される。

上記の式２は、β₀と係数ベクトルβを変数とした場合における最小値を示す。式２は、モデルパラメータβ_jの絶対値の大きさに応じて、ペナルティに関する第２項（正規化項）の大きさを決定する。

　以下の式３は、係数ベクトルの各要素に対する制限条件である。

　上記の式２は、最小二乗法によって重回帰の係数ベクトルβを求めるときに、係数ベクトルβの各要素（モデルパラメータβ_j）に対して、式３の制限条件を設けた際のモデルパラメータβ_jを求めることに相当する。

　正則化パラメータλには、対応する係数ベクトルβが一つある。正則化パラメータλが大きくなると、係数ベクトルβの非ゼロ要素が減る。すなわち、正則化パラメータλが大きくなると、係数ベクトルβのゼロ要素が増えて、不要な特徴量が増える。それに対し、正則化パラメータλが小さくなると、係数ベクトルβの非ゼロ要素が増えて、必要な特徴量が増える。適切な正則化パラメータλが設定されれば、推定に必要な非ゼロ要素を残しながら、不要なゼロ要素を削減できる。

　解析部１３は、構築部１２によって構築された再抽出データセットに関して、ラッソ回帰を実行する。解析部１３は、被験者ごとの再抽出データセットに関して、正則化パラメータλを変化させてラッソ回帰を実行する。解析部１３は、正則化パラメータλの数の列と、特徴量の数の行とによって構成される行列（第１行列とも呼ばれる）を生成する。例えば、正則化パラメータλがＰ個の場合、各々の正則化パラメータλには、１～Ｐの番号（λ番号とも呼ばれる）が付与される（Ｐは自然数）。第１行列は、身体状態などの推定に用いられる特徴量の数の行を有する。特徴量の数がｐ個の場合、各々の特徴量には、１～ｐの番号（特徴量番号とも呼ばれる）が付与される（ｐは自然数）。

　図２は、第１行列の一例を示す概念図である。図２の第１行列において、ハッチングがかけられているセルは、非ゼロ要素であることを示す。図２の第１行列において、ハッチングがかけられていない空白のセルは、ゼロ要素であることを示す。

　図３は、ＬＯＳＯによって構築された再構築データセットを用いて、５０人の被験者に関して生成された第１行列の一例である。ＬＯＳＯによって再構築データセットが構築された場合、被験者ごとの第１行列が生成される。図３の例の場合、被験者の数（５０人）に応じて、５０パターンの第１行列が生成される。図３の第１行列において、ハッチングがかけられているセルは、非ゼロ要素であることを示す。図３の第１行列において、ハッチングがかけられていない空白のセルは、ゼロ要素であることを示す。

　統計部１５は、生成された複数パターンの第１行列の各セルに、論理値（０、１）を割り当てる。ラッソ回帰で生成された複数パターンの第１行列の各セルに論理値（０、１）を割り当てる処理は、第１統計処理とも呼ばれる。統計部１５は、第１統計処理において、複数の第１行列に関して、非ゼロ要素をＴＲＵＥ（１）、ゼロ要素をＦＡＬＳＥ（０）に設定する。統計部１５は、全ての第１行列に関して、セルごとの論理値（０、１）を集計する。統計部１５は、全ての第１行列に関して、非ゼロ要素の論理値（１）をセルごとに加算することによって、セルごとの論理値（０、１）を集計する。

　図４は、５０人の被験者の第１行列に関する論理値の集計値を、全ての第１行列に対応する行列（第２行列とも呼ばれる）の各セルに記入した例である。第２行列の各セルには、複数のパターンに関して、第１行列の非ゼロ要素の数（ＴＲＵＥの数）が記入される。

　統計部１５は、全ての第１行列に含まれる各セルの集計値に応じて、第２行列の各セルに論理値（０または１）を割り当てる。第２行列の各セルに関する集計値が所定の閾値以上の場合、統計部１５は、そのセルをＴＲＵＥ（１）に設定する。一方、集計値が所定の閾値を下回る場合、統計部１５は、そのセルをＦＡＬＳＥ（０）に設定する。全ての第１行列に関して、セルごとの論理値（０、１）を集計し、集計値に応じた論理値（０または１）を第２行列の各セルに割り当てる処理は、第２統計処理とも呼ばれる。

　図５は、図４の集計値に関して、論理値（０または１）を割り当てた一例を示す概念図である。図５の例では、図４の集計値が４９以上のセルが、ＴＲＵＥ（１）に設定される。図５の例では、第２統計処理によってＴＲＵＥ（１）に設定されたセルに、ハッチングがかけられている。図５の例では、第２統計処理によってＦＡＬＳＥ（０）に設定されたセルは、空白である。例えば、図５のような第２統計処理の結果を、ユーザが確認可能な画面に表示させてもよい。その場合、ユーザは、画面に表示された第２統計処理の結果に応じたλ番号を選択することで、所望の特徴量の組み合わせを選定できる。

　統計部１５は、集計値の平均値に応じた論理値を、第２行列の各セルに割り当ててもよい。例えば、統計部１５は、第２行列の各セルに関して、集計値の平均値が所定の閾値以上のセルをＴＲＵＥ（１）に設定する。一方、統計部１５は、集計値の平均値が所定の閾値を下回るセルをＦＡＬＳＥ（０）に設定する。このような処理も、第２統計処理に含まれる。

　選定部１７は、予め設定された特定ルールに従って、λ番号を選択する。特定ルールは、選択されるλ番号を決めるためのルールである。例えば、特定ルールは、ＴＲＵＥ（１）に設定されたセルの数が、予め設定された基準値に相当するλ番号を選択するというルールである。基準値は、計算量や通信量の制約に応じて設定されてもよい。例えば、基準値は、計算量や通信量に割り当て可能な負荷を越えない値に設定される。例えば、基準値は、計算量や通信量に割り当て可能な負荷に対する割合（例えば、５０～８０パーセントなど）を越えない値に設定される。例えば、ＴＲＵＥ（１）に設定されたセルの数が基準値に相当するλ番号が複数ある場合、少なくともいずれかのλ番号が選択されればよい。選定部１７は、特定ルールに基づいて、選択されたλ番号のセルがＴＲＵＥ（１）に設定された特徴量の組み合わせを選定する。例えば、選定部１７は、ユーザによって設定された基準値に応じて、特徴量の組み合わせを選定してもよい。

　出力部１９は、選定部１７によって選定された特徴量に関する情報（選定情報とも呼ぶ）を出力する。選定情報は、身体状態などの推定に用いられる特徴量の組み合わせに関する情報である。例えば、足の動きに関するセンサデータの場合、選定情報は、一歩行周期分の加速度や角速度の時系列データにおいて、いずれの歩行フェーズから特徴量を抽出するのかを示す情報を含む。歩行フェーズとは、一歩行周期を０～１００パーセントに正規化した場合における、歩行周期（パーセント）を示す。連続した複数の歩行フェーズにわたる特徴量が抽出されてもよい。特徴量が抽出される連続した複数の歩行フェーズの塊は、歩行フェーズクラスターとも呼ばれる。

　出力部１９から出力された選定情報は、計測装置等によって計測されたセンサデータから特徴量を抽出するための条件として用いられる。例えば、選定部１７によって選定情報は、図示しない記憶部に記憶させてもよい。例えば、選定情報に応じて抽出される特徴量は、身体状態などを推定するための推定モデルの学習に用いられる。例えば、抽出対象の特徴量は、身体状態の推定対象のユーザに装着された計測装置等によって計測されるセンサデータから抽出される。

　図６～図７は、一般的なラッソ回帰（比較例）の手法を用いて選定された特徴量と、本実施形態の手法を用いて選定された特徴量とを用いた学習によって生成された推定モデルによる推定値の相違について説明するための概念図である。図６～図７は、被験者の移動能力として、ＴＵＧ（Time Up and Go）テストの成績を推定した例である。ＴＵＧテストの成績は、椅子から立ち上がって３メートル先の目印まで歩いて方向転換し、再び椅子に座るまでの時間（ＴＵＧ所要時間とも呼ぶ）である。

　図６は、一般的なラッソ回帰（比較例）の手法で選定された９個の特徴量を用いて生成された推定モデルを用いた推定例である。ＴＵＧ所要時間の真値（計測値）と推定値に関して、相関級内相関係数ＩＣＣ（Intraclass Correlation Coefficients）は０．６０２であった。また、ＴＵＧ所要時間の真値（計測値）と推定値に関して、平均絶対誤差ＭＡＥ（Mean Absolute Error）は０．７１であった。

　図７は、本実施形態の手法で選定された９個の特徴量を用いて生成された推定モデルを用いた推定例である。図７の例では、ＬＯＳＯによって構築された再抽出データセットを用いた。ＴＵＧ所要時間の真値（計測値）と推定値に関して、相関級内相関係数ＩＣＣは０．６８２であった。また、ＴＵＧ所要時間の真値（計測値）と推定値に関して、平均絶対誤差ＭＡＥは０．６３であった。以上のように、本実施形態の手法を用いた方が、ＩＣＣとＭＡＥがともに大きかった。すなわち、本実施形態の手法を用いることで、飛び値や外れ値に対するロバスト性が向上した。

　図８は、複数の被験者に関して計測されたセンサデータに含まれうる飛び値や外れ値の影響について説明するためのグラフである。破線の円で囲った範囲内のデータが、飛び値や外れ値に相当する。Ｌ１は、飛び値や外れ値を含めて、複数のセンサデータを線形回帰した場合の回帰直線である。Ｌ２は、飛び値や外れ値を恣意的に除外して、複数のセンサデータを線形回帰した場合の回帰直線である。回帰直線Ｌ１は、飛び値や外れ値の影響を受けており、大多数のセンサデータにフィットしていない。一方、回帰直線Ｌ２は、飛び値や外れ値の影響を受けず、大多数のセンサデータにフィットしている。回帰直線Ｌ１と回帰直線Ｌ２を比較すると、飛び値や外れ値を恣意的に除外した回帰直線Ｌ２を用いれば、より精度の高い推定モデルを構築できそうである。しかしながら、飛び値や外れ値を恣意的に除外すると、推定モデルの有効性が低下する。そのため、推定モデルの有効性を低下させずに、飛び値や外れ値に対するロバスト性の高い特徴量を選定することが求められる。

　本実施形態の手法では、ＬＯＳＯやブートストラップ法などの手法を用いてデータセットの分布を変更した上で、ラッソ回帰を行う。また、本実施形態の手法では、ＬＯＳＯやブートストラップ法などの手法とラッソ回帰とを単に組み合わせるだけではなく、上述した第１統計処理および第２統計処理を実行する。その結果、本実施形態の手法によれば、飛び値や外れ値の影響が低減された平均的な解が求められる。また、本実施形態の手法によれば、推定モデルの有効性を低下させることがなく、飛び値や外れ値に対するロバスト性の高い特徴量を選定できる。

　（動作）
　次に、本実施形態の特徴量選定装置１０の動作について、図面を参照しながら説明する。図９～図１０は、特徴量選定装置１０の動作の一例について説明するためのフローチャートである。図９～図１０のフローチャートを用いた説明においては、特徴量選定装置１０を動作主体として説明する。

　図９において、まず、特徴量選定装置１０は、Ｎ個のデータセットを取得する（ステップＳ１１１）。データセットの番号は、データセットに含まれる説明変数（特徴量）の番号（特徴量番号）に相当する。

　次に、特徴量選定装置１０は、特徴量番号ｎを１にセットする（ステップＳ１１２）。ｎは、データセット（特徴量）の番号である。

　次に、特徴量選定装置１０は、ｎ番目の被験者のデータを除外する（ステップＳ１１３）。

　次に、特徴量選定装置１０は、ｎ番目の被験者のデータが除外されたＮ－１個のデータセットに関して、ラッソ回帰を実行する（ステップＳ１１４）。

　次に、特徴量選定装置１０は、第１統計処理を実行する（ステップＳ１１５）。特徴量選定装置１０は、第１統計処理として、ラッソ回帰によって生成された第１行列（行列Ｂ_n）の各セルに論理値を割り当てる。例えば、特徴量選定装置１０は、行列Ｂ_nの非ゼロ要素をＴＲＵＥ（１）に設定し、行列Ｂ_nのゼロ要素をＦＡＬＳＥ（０）に設定する。例えば、特徴量選定装置１０は、行列Ｂ_nの要素の値が閾値Ｔ₀以上のセルをＴＲＵＥ（１）に設定し、行列Ｂ_nの要素の値が閾値Ｔ₀を下回るセルをＦＡＬＳＥ（０）に設定してもよい。

　次に、特徴量選定装置１０は、特徴量番号ｎをインクリメント（＋１）する（ステップＳ１１６）。

　ここで、データセットの個数Ｎよりも特徴量番号ｎが小さい場合（ステップＳ１１７でＹｅｓ）、ステップＳ１１３に戻る。一方、特徴量番号ｎがデータセットの個数Ｎ以上の場合（ステップＳ１１７でＮｏ）、図１０のステップＳ１２１に進む。

　図９のステップＳ１１７でＮｏの場合、特徴量選定装置１０は、第２統計処理を実行する（ステップＳ１２１）。特徴量選定装置１０は、第２統計処理として、全ての第１行列に関して、セルごとの論理値（０または１）を集計する。特徴量選定装置１０は、セルごとの論理値の集計値と所定の閾値との関係に応じて、集計された第２行列の各セルに論理値（０または１）を設定する。例えば、特徴量選定装置１０は、集計値が所定の閾値以上のセルを、ＴＲＵＥ（１）に設定する。一方、特徴量選定装置１０は、集計値が所定の閾値を下回るセルを、ＦＡＬＳＥ（０）に設定する。

　次に、特徴量選定装置１０は、第２統計処理の結果に応じて、特定ルールに基づいてλ番号を選択する（ステップＳ１２２）。

　次に、特徴量選定装置１０は、選択されたλ番号に対応する特徴量の組み合わせを選定する（ステップＳ１２３）。

　次に、特徴量選定装置１０は、選定された特徴量に関する情報（選定情報）を出力する（ステップＳ１２４）。特徴量選定装置１０から出力された選定情報は、計測装置等によって計測されたセンサデータから特徴量を抽出するための条件として用いられる。

　以上のように、本実施形態の特徴量選定装置は、取得部、構築部、解析部、統計部、選定部、および出力部を備える。取得部は、複数のデータセットを取得する。構築部は、データセットに含まれるデータの分布を変更して複数の再抽出データセットを構築する。解析部は、ラッソ回帰の手法を用いて、複数の再抽出データセットを解析する。統計部は、複数の再抽出データセットの解析結果に応じて、複数の再抽出データセットに含まれる要素の値を集計する。統計部は、要素の値の集計結果に応じて、複数の再抽出データセットに含まれる要素に論理値を設定する。選定部は、予め設定された特定ルールに従って、要素に設定された論理値の値に応じた組み合わせの特徴量を選定する。出力部は、選定された特徴量の組み合わせに関する選定情報を出力する。

　本実施形態において、解析部は、複数の再抽出データセットに関して、予め設定された複数の正則化パラメータごとにラッソ回帰を実行する。解析部は、ラッソ回帰で用いられた正則化パラメータに対応する列と、特徴量に対応する行とによって構成される複数パターンの第１行列を生成する。統計部は、複数パターンの第１行列に関して、非ゼロ要素のセルの第１論理値を１に設定して、ゼロ要素のセルの第１論理値を０に設定する第１統計処理を実行する。統計部は、複数パターンの第１行列を構成するセルごとに第１論理値を集計する。統計部は、第１論理値の集計値が所定条件を満たすセルに第２論理値として１が設定され、第１論理値の集計値が所定条件を満たさないセルに第２論理値として０が設定された第２行列を生成する第２統計処理を実行する。選定部は、予め設定された特定ルールに従って第２行列の列を選択し、選択された列に対応する特徴量の組み合わせを選定する。

　本実施形態によれば、データの分布を変えてラッソ回帰することによって、飛び値や外れ値の影響をそのまま受けた場合と比較して、真値により近い平均的な値の特徴量を求めることができる。そのため、本実施形態によれば、飛び値や外れ値に対するロバスト性の高い特徴量を選定できる。

　本実施形態の一態様において、構築部は、Leave-One-Subject-Outの手法を用いて、複数の再抽出データセットを構築する。本態様によれば、Leave-One-Subject-Outの手法を用いてデータの分布を擬似的に変えることによって、本来あるべき母集団の分布に、データの分布を近づけることができる。

　本実施形態の一態様において、構築部は、ブートストラップ法を用いて、複数の再抽出データセットを構築する。本態様によれば、ブートストラップ法を用いてデータの分布を擬似的に変えることによって、標本集団から推定される母集団の分布に、データの分布を近づけることができる。

　本実施形態の一態様において、統計部は、第２統計処理において、複数パターンの第１行列を構成するセルごとに第１論理値の合計値を計算する。統計部は、第１論理値の合計値が所定閾値以上のセルの第２論理値が１に設定され、第１論理値の合計値が所定閾値未満のセルが０に設定された第２行列を生成する。本態様によれば、第１論理値の合計値に応じて設定された第２行列の論理値に基づいて、特徴量の組み合わせを選定できる。

　本実施形態の一態様において、統計部は、第２統計処理において、複数パターンの第１行列を構成するセルごとに第１論理値の平均値を計算する。統計部は、第１論理値の平均値が所定閾値以上のセルの第２論理値が１に設定され、第１論理値の平均値が所定閾値未満のセルが０に設定された第２行列を生成する。本態様によれば、第１論理値の平均値に応じて設定された第２行列の論理値に基づいて、特徴量の組み合わせを選定できる。

　（第２の実施形態）
　次に、第２の実施形態に係る特徴量選定装置について、図面を参照しながら説明する。本実施形態の特徴量選定装置は、第１の実施形態の手法で選定された特徴量を用いて、推定モデルを構築する。本実施形態の特徴量選定装置は、構築された推定モデルの推定結果に応じて、特徴量を選定する。

　（構成）
　図１１は、本実施形態に係る特徴量選定装置２０の構成の一例を示すブロック図である。特徴量選定装置２０は、取得部２１、構築部２２、解析部２３、統計部２５、推定モデル構築部２６、選定部２７、および出力部２９を備える。

　取得部２１は、第１の実施形態の取得部１１と同様の構成である。取得部２１は、複数の被験者に関して計測された、身体状態の推定に用いられるデータセットを取得する。

　構築部２２は、第１の実施形態の構築部１２と同様の構成である。構築部２２は、複数の被験者に関するデータセットの分布を変えて、新たなデータセット（再抽出データセットとも呼ばれる）を構築する。例えば、構築部２２は、Leave-One-Subject-Out（ＬＯＳＯとも呼ばれる）の手法を用いて、再抽出データセットを構築する。例えば、構築部１２は、ブートストラップ法を用いて、再抽出データセットを構築してもよい。

　解析部２３は、第１の実施形態の解析部１３と同様の構成である。解析部２３は、構築部２２によって構築された再抽出データセットに関して、ラッソ回帰を実行する。解析部２３は、正則化パラメータλの数の列と、特徴量の数の行とによって構成される行列（第１行列とも呼ばれる）を生成する。その結果、変化させた正則化パラメータλの数の列を有する第１行列が生成される。

　統計部２５は、第１の実施形態の統計部１５と同様の構成である。統計部２５は、被験者ごとに生成された複数パターンの第１行列の各セルに、論理値（０、１）を割り当てる第１統計処理を実行する。統計部２５は、第１統計処理において、複数の第１行列に関して、非ゼロ要素をＴＲＵＥ（１）、ゼロ要素をＦＡＬＳＥ（０）に設定する。

　統計部２５は、全ての第１行列に関して、セルごとの論理値（０、１）を集計して、非ゼロ要素の論理値（１）をセルごとに加算する第２統計処理を実行する。統計部２５は、第１行列の各セルの集計値に応じて、第２行列の各セルに論理値（０または１）を割り当てる。第２行列の各セルに関して、集計値が所定の閾値以上の場合、統計部２５は、そのセルをＴＲＵＥ（１）に設定する。一方、集計値が所定の閾値を下回る場合、統計部２５は、そのセルをＦＡＬＳＥ（０）に設定する。

　推定モデル構築部２６は、選定部２７によって選定された特徴量を用いた学習により、推定モデルを構築する。推定モデル構築部２６は、構築された推定モデルを評価する。例えば、推定モデル構築部２６は、平均平方二乗誤差や、平均絶対誤差、平均相対誤差、決定係数、相関係数などの評価指標を計算する。推定モデル構築部２６は、算出された評価指標を選定部２７に出力する。例えば、推定モデルの評価結果を、ユーザが確認可能な画面に表示させてもよい。その場合、ユーザは、画面に表示された評価結果に応じて、最尤な特徴量の組み合わせを選定できる。

　選定部２７は、推定モデル構築部２６によって算出された評価指標が最も高い特徴量の組み合わせを選択する。例えば、選定部２７は、ユーザによって入力された指示に応じて、最尤な特徴量を選定してもよい。

　出力部２９は、第１の実施形態の出力部１９と同様の構成である。出力部２９は、選定部２７によって選定された特徴量に関する情報（選定情報とも呼ぶ）を出力する。出力部２９から出力された選定情報は、計測装置等によって計測されたセンサデータから特徴量を抽出するための条件として用いられる。例えば、選定部２７によって選定情報は、図示しない記憶部に記憶させてもよい。例えば、選定情報に応じて抽出される特徴量は、身体状態などを推定するための推定モデルの学習に用いられる。例えば、抽出対象の特徴量は、身体状態の推定対象のユーザに装着された計測装置等によって計測されるセンサデータから抽出される。

　（動作）
　次に、本実施形態の特徴量選定装置２０の動作について、図面を参照しながら説明する。図１２～図１３は、特徴量選定装置２０の動作の一例について説明するためのフローチャートである。図１２～図１３のフローチャートを用いた説明においては、特徴量選定装置２０を動作主体として説明する。

　図１２において、まず、特徴量選定装置２０は、Ｎ個のデータセットを取得する（ステップＳ２１１）。データセットの番号は、データセットに含まれる説明変数（特徴量）の番号（特徴量番号）に相当する。

　次に、特徴量選定装置２０は、特徴量番号ｎを１にセットする（ステップＳ２１２）。ｎは、データセット（特徴量）の番号である。

　次に、特徴量選定装置２０は、ｎ番目の被験者のデータを除外する（ステップＳ２１３）。

　次に、特徴量選定装置２０は、ｎ番目の被験者のデータが除外されたＮ－１個のデータセットに関して、ラッソ回帰を実行する（ステップＳ２１４）。

　次に、特徴量選定装置２０は、第１統計処理を実行する（ステップＳ２１５）。特徴量選定装置２０は、第１統計処理として、ラッソ回帰によって生成された第１行列（行列Ｂ_n）の各セルに論理値を割り当てる。例えば、特徴量選定装置２０は、行列Ｂ_nの非ゼロ要素をＴＲＵＥ（１）に設定し、行列Ｂ_nのゼロ要素をＦＡＬＳＥ（０）に設定する。例えば、特徴量選定装置２０は、行列Ｂ_nの要素の値が閾値Ｔ₀以上のセルをＴＲＵＥ（１）に設定し、行列Ｂ_nの要素の値が閾値Ｔ₀を下回るセルをＦＡＬＳＥ（０）に設定してもよい。

　次に、特徴量選定装置２０は、特徴量番号ｎをインクリメント（＋１）する（ステップＳ２１６）。

　ここで、データセットの個数Ｎよりも特徴量番号ｎが小さい場合（ステップＳ２１７でＹｅｓ）、ステップＳ２１３に戻る。一方、特徴量番号ｎがデータセットの個数Ｎ以上の場合（ステップＳ２１７でＮｏ）、図１３のステップＳ２２１に進む。

　図１２のステップＳ２１７でＮｏの場合、特徴量選定装置２０は、第２統計処理を実行する（ステップＳ２２１）。特徴量選定装置２０は、第２統計処理として、全ての第１行列に関して、セルごとの論理値（０、１）を集計する。特徴量選定装置２０は、集計された第１行列の各セルに関する論理値の和を、第２行列の各セルに割り当てる。特徴量選定装置２０は、第２行列の各セルの値に応じて、集計された第２行列の各セルに論理値（０または１）を設定する。例えば、特徴量選定装置２０は、集計値が所定の閾値以上のセルを、ＴＲＵＥ（１）に設定する。一方、特徴量選定装置２０は、集計値が所定の閾値を下回るセルを、ＦＡＬＳＥ（０）に設定する。

　次に、特徴量選定装置２０は、モデル評価処理を実行する（ステップＳ２２２）。ステップＳ２２２のモデル評価処理については、後述する（図１４）。

　次に、特徴量選定装置２０は、モデル評価処理によって得られた評価指標に応じたλ番号を検索する（ステップＳ２２３）。

　次に、特徴量選定装置２０は、検索されたλ番号に対応する特徴量の組み合わせを選定する（ステップＳ２２４）。

　次に、特徴量選定装置２０は、選定された特徴量に関する情報（選定情報）を出力する（ステップＳ２２５）。特徴量選定装置２０から出力された選定情報は、計測装置等によって計測されたセンサデータから特徴量を抽出するための条件として用いられる。

　〔モデル評価処理〕
　次に、図１３のステップＳ２２２のモデル評価処理について、図面を参照しながら説明する。図１４は、モデル評価処理について説明するためのフローチャートである。図１４のフローチャートを用いた説明においては、特徴量選定装置２０を動作主体として説明する。

　図１４において、まず、特徴量選定装置２０は、λ番号ｍを１にセットする（ステップＳ２３１）。ｍは、正則化パラメータλの番号である。

　次に、特徴量選定装置２０は、λ番号ｍに対応する特徴量の組み合わせを選択する（ステップＳ２３２）。

　次に、特徴量選定装置２０は、選択された特徴量を用いて、推定モデルを構築する（ステップＳ２３３）。

　次に、特徴量選定装置２０は、構築された推定モデルを評価する（ステップＳ２３４）。

　次に、特徴量選定装置２０は、推定モデルの評価指標を出力する（ステップＳ２３５）。

　次に、特徴量選定装置２０は、λ番号ｍをインクリメント（＋１）する（ステップＳ２３６）。

　ここで、正則化パラメータλの個数Ｐよりもλ番号ｍが小さい場合（ステップＳ２３７でＹｅｓ）、ステップＳ２３２に戻る。一方、λ番号ｍが正則化パラメータλの個数Ｐ以上の場合（ステップＳ２３７でＹｅｓ）、図１３のステップＳ２２３に進む。

　以上のように、本実施形態の特徴量選定装置は、取得部、構築部、解析部、統計部、選定部、推定モデル構築部、および出力部を備える。取得部は、複数のデータセットを取得する。構築部は、データセットに含まれるデータの分布を変更して複数の再抽出データセットを構築する。解析部は、ラッソ回帰の手法を用いて、複数の再抽出データセットを解析する。統計部は、複数の再抽出データセットの解析結果に応じて、複数の再抽出データセットに含まれる要素の値を集計する。統計部は、要素の値の集計結果に応じて、複数の再抽出データセットに含まれる要素に論理値を設定する。選定部は、予め設定された特定ルールに従って、要素に設定された論理値の値に応じた組み合わせの特徴量を選定する。推定モデル構築部は、選定された特徴量を用いた学習により推定モデルを構築し、構築された推定モデルを評価する。選定部は、推定モデルの評価結果に応じて、特徴量の組み合わせを選定する。出力部は、選定された特徴量の組み合わせに関する選定情報を出力する。

　本実施形態では、選定部によって選定された特徴量を用いて構築された推定モデルの評価結果に応じて、特徴量を選定する。そのため、本実施形態によれば、推定モデルの評価結果を用いることで、信頼性の高い特徴量を選定できる。

　（第３の実施形態）
　次に、第３の実施形態に係る特徴量選定装置について図面を参照しながら説明する。本実施形態の特徴量選定装置は、第１統計処理を省略し、複数の第１行列に関する各セルの平均値に関して第２統計処理を実行する点において、第１の実施形態とは異なる。

　（構成）
　図１５は、本実施形態に係る特徴量選定装置３０の構成の一例を示すブロック図である。特徴量選定装置３０は、取得部３１、構築部３２、解析部３３、統計部３５、３選定部３７、および出力部３９を備える。

　取得部３１は、第１の実施形態の取得部１１と同様の構成である。取得部３１は、複数の被験者に関して計測された、身体状態の推定に用いられるデータセットを取得する。

　構築部３２は、第１の実施形態の構築部１２と同様の構成である。構築部３２は、複数の被験者に関するデータセットの分布を変えて、新たなデータセット（再抽出データセットとも呼ばれる）を構築する。例えば、構築部３２は、Leave-One-Subject-Out（ＬＯＳＯとも呼ばれる）の手法を用いて、再抽出データセットを構築する。例えば、構築部３２は、ブートストラップ法を用いて、再抽出データセットを構築してもよい。

　解析部３３は、第１の実施形態の解析部１３と同様の構成である。解析部３３は、構築部３２によって構築された再抽出データセットに関して、ラッソ回帰を実行する。解析部３３は、正則化パラメータλの数の列と、特徴量の数の行とによって構成される行列（第１行列とも呼ばれる）を生成する。その結果、変化させた正則化パラメータλの数の列を有する第１行列が生成される。

　統計部３５は、被験者ごとに生成された複数パターンの第１行列について、各セルの平均値を計算する。統計部３５は、複数パターンの第１行列の各セルに、各セルの平均値が割り当てられた第２行列を生成する。例えば、統計部３５は、第２行列の各セルに関して、集計値の平均値が所定の閾値以上のセルをＴＲＵＥ（１）に設定する。一方、統計部３５は、集計値の平均値が所定の閾値を下回るセルをＦＡＬＳＥ（０）に設定する。この処理は、第２統計処理に含まれる。

　選定部３７は、第１の実施形態の選定部１７と同様の構成である。選定部１７は、予め設定された特定ルールに基づいて、λ番号を選択する。選定部１７は、特定ルールに基づいて、選択されたλ番号のセルがＴＲＵＥ（１）に設定された特徴量の組み合わせを選定する。

　出力部３９は、第１の実施形態の出力部１９と同様の構成である。出力部３９は、選定部２７によって選定された特徴量に関する情報（選定情報とも呼ぶ）を出力する。出力部３９から出力された選定情報は、計測装置等によって計測されたセンサデータから特徴量を抽出するための条件として用いられる。例えば、選定部３７によって選定情報は、図示しない記憶部に記憶させてもよい。例えば、選定情報に応じて抽出される特徴量は、身体状態などを推定するための推定モデルの学習に用いられる。例えば、抽出対象の特徴量は、身体状態の推定対象のユーザに装着された計測装置等によって計測されるセンサデータから抽出される。

　（動作）
　次に、本実施形態の特徴量選定装置３０の動作について、図面を参照しながら説明する。図１６～図１７は、特徴量選定装置３０の動作の一例について説明するためのフローチャートである。図１６～図１７のフローチャートを用いた説明においては、特徴量選定装置３０を動作主体として説明する。

　図１６において、まず、特徴量選定装置３０は、Ｎ個のデータセットを取得する（ステップＳ３１１）。データセットの番号は、データセットに含まれる説明変数（特徴量）の番号（特徴量番号）に相当する。

　次に、特徴量選定装置３０は、特徴量番号ｎを１にセットする（ステップＳ３１２）。ｎは、データセット（特徴量）の番号である。

　次に、特徴量選定装置３０は、ｎ番目の被験者のデータを除外する（ステップＳ３１３）。

　次に、特徴量選定装置３０は、ｎ番目の被験者のデータが除外されたＮ－１個のデータセットに関して、ラッソ回帰を実行する（ステップＳ３１４）。

　次に、特徴量選定装置３０は、特徴量番号ｎをインクリメント（＋１）する（ステップＳ３１５）。

　ここで、データセットの個数Ｎよりも特徴量番号ｎが小さい場合（ステップＳ３１６でＹｅｓ）、ステップＳ３１３に戻る。一方、特徴量番号ｎがデータセットの個数Ｎ以上の場合（ステップＳ３１６でＮｏ）、図１７のステップＳ３２１に進む。

　図１６のステップＳ３１６でＮｏの場合、特徴量選定装置３０は、第２統計処理を実行する（ステップＳ３２１）。第２統計処理の第１段階として、特徴量選定装置３０は、被験者ごとに生成された複数パターンの第１行列の各セルに、各セルの平均値が割り当てられた第２行列を生成する。第２統計処理の第２段階として、特徴量選定装置３０は、第２統計処理として、生成された第２行列に関して、セルごとに論理値（０、１）を設定する。例えば、特徴量選定装置３０は、第２行列の各セルに関して、集計値の平均値が所定の閾値以上のセルをＴＲＵＥ（１）に設定する。一方、特徴量選定装置３０は、集計値の平均値が所定の閾値を下回るセルをＦＡＬＳＥ（０）に設定する。

　次に、特徴量選定装置３０は、第２統計処理の結果に応じて、特定ルールに基づいてλ番号を選択する（ステップＳ３２２）。

　次に、特徴量選定装置３０は、選択されたλ番号に対応する特徴量の組み合わせを選定する（ステップＳ３２３）。

　次に、特徴量選定装置３０は、選定された特徴量に関する情報（選定情報）を出力する（ステップＳ３２４）。特徴量選定装置３０から出力された選定情報は、計測装置等によって計測されたセンサデータから特徴量を抽出するための条件として用いられる。

　本実施形態において、解析部は、複数の再抽出データセットの各々に関して、予め設定された複数の正則化パラメータごとにラッソ回帰を実行する。解析部は、ラッソ回帰で用いられた正則化パラメータに対応する列と、特徴量に対応する行とによって構成される複数パターンの第１行列を生成する。統計部は、複数パターンの第１行列を構成するセルごとに要素の値を集計する。統計部は、要素の値の平均値が所定閾値以上のセルに第２論理値として１が設定され、要素の値の平均値が所定閾値未満のセルに第２論理値として０が設定された第２行列を生成する第２統計処理を実行する。選定部は、予め設定された特定ルールに従って第２行列の列を選択し、選択された列に対応する特徴量の組み合わせを選定する。

　（第４の実施形態）
　次に、第４の実施形態に係る特徴量選定装置について図面を参照しながら説明する。本実施形態の特徴量選定装置は、第１～第３の実施形態の特徴量選定装置を簡略化した構成である。

　図１８は、本実施形態に係る特徴量選定装置４０の構成の一例を示すブロック図である。特徴量選定装置４０は、取得部４１、構築部４２、解析部４３、統計部４５、選定部４７、および出力部４９を備える。

　取得部４１は、複数のデータセットを取得する。構築部４２は、データセットに含まれるデータの分布を変更して複数の再抽出データセットを構築する。解析部４３は、ラッソ回帰の手法を用いて、複数の再抽出データセットを解析する。統計部４５は、複数の再抽出データセットの解析結果に応じて、複数の再抽出データセットに含まれる要素の値を集計する。統計部４５は、要素の値の集計結果に応じて、複数の再抽出データセットに含まれる要素に論理値を設定する。選定部４７は、予め設定された特定ルールに従って、要素に設定された論理値の値に応じた組み合わせの特徴量を選定する。出力部４９は、選定された特徴量の組み合わせに関する選定情報を出力する。

　（第５の実施形態）
　次に、第５の実施形態に係る学習システムについて図面を参照しながら説明する。本実施形態の学習システムは、第１～第４の実施形態の特徴量選定装置によって選定された特徴量を用いた学習を実行する。

　図１９は、本実施形態に係る学習システム５の構成の一例を示すブロック図である。学習システム５は、歩容計測装置５０および学習装置５５を備える。歩容計測装置５０と学習装置５５は、有線で接続されてもよいし、無線で接続されてもよい。歩容計測装置５０と学習装置５５は、単一の装置で構成されてもよい。また、学習システム５の構成から歩容計測装置５０を除き、学習装置５５だけで学習システム５が構成されてもよい。図１９には歩容計測装置５０を一つしか図示していないが、左右両足に歩容計測装置５０が一つずつ（計二つ）配置されてもよい。また、学習装置５５は、歩容計測装置５０に接続されず、予め歩容計測装置５０によって生成されてデータベースに格納されていた特徴量データを用いて、学習を実行するように構成されてもよい。

　歩容計測装置５０は、左右の足のうち少なくとも一方に設置される。歩容計測装置５０は、第１の実施形態の歩容計測装置５０と同様の構成である。歩容計測装置５０は、加速度センサおよび角速度センサを含む。歩容計測装置５０は、計測された物理量をデジタルデータ（センサデータとも呼ぶ）に変換する。歩容計測装置５０は、センサデータの時系列データから、正規化された一歩行周期分の歩行波形データを生成する。歩容計測装置５０は、身体状態の推定に用いられる特徴量データを生成する。歩容計測装置５０は、生成された特徴量データを学習装置５５に送信する。なお、歩容計測装置５０は、学習装置５５によってアクセスされるデータベース（図示しない）に、特徴量データを送信するように構成されてもよい。データベースに蓄積された特徴量データは、学習装置５５の学習に用いられる。

　学習装置５５は、歩容計測装置５０から特徴量データを受信する。学習装置５５が受信する特徴量データは、第１～第４の実施形態の特徴量選定装置によって選定された特徴量を含む。データベース（図示しない）に蓄積された特徴量データを用いる場合、学習装置５５は、データベースから特徴量データを受信する。学習装置５５は、受信された特徴量データを用いた学習を実行する。例えば、学習装置５５は、複数の被験者の歩行波形データから抽出された特徴量データを説明変数とし、その特徴量データに応じた身体状態に関する値を目的変数とする教師データを学習する。学習装置５５が実行する学習のアルゴリズムには、特に限定を加えない。学習装置５５は、複数の被験者に関する教師データを用いて学習された推定モデルを生成する。学習装置５５は、生成された推定モデルを記憶する。学習装置５５によって学習された推定モデルは、学習装置５５の外部の記憶装置に格納されてもよい。

　〔学習装置〕
　次に、学習装置５５の詳細について図面を参照しながら説明する。図２０は、学習装置５５の詳細構成の一例を示すブロック図である。学習装置５５は、受信部５５１、学習部５５３、および記憶部５５５を有する。

　受信部５５１は、歩容計測装置５０から特徴量データを受信する。受信部５５１は、受信された特徴量データを学習部５５３に出力する。受信部５５１は、ケーブルなどの有線を介して特徴量データを歩容計測装置５０から受信してもよいし、無線通信を介して特徴量データを歩容計測装置５０から受信してもよい。例えば、受信部５５１は、Ｂｌｕｅｔｏｏｔｈ（登録商標）やＷｉＦｉ（登録商標）などの規格に則した無線通信機能（図示しない）を介して、特徴量データを歩容計測装置５０から受信するように構成される。なお、受信部５５１の通信機能は、Ｂｌｕｅｔｏｏｔｈ（登録商標）やＷｉＦｉ（登録商標）以外の規格に則していてもよい。

　学習部５５３は、受信部５５１から特徴量データを取得する。学習部５５３は、取得した特徴量データを用いて学習を実行する。例えば、学習部５５３は、被験者の歩容に関して抽出された特徴量データを説明変数とし、その被験者の身体状態を目的変数とするデータセットを教師データとして学習する。例えば、学習部５５３は、被験者の握力や全身筋力、下肢筋力、移動能力、動的バランス、静的バランスなどの身体状態を学習対象とする。例えば、学習部５５３は、複数のユーザに関して学習された、特徴量データの入力に応じて身体状態を推定する推定モデルを生成する。例えば、学習部５５３は、性別や年齢、身長、体重などの属性データを含む説明変数を用いて、属性に応じた推定を行う推定モデルを生成する。学習部５５３は、複数の被験者に関して学習された推定モデルを記憶部５５５に記憶させる。

　例えば、学習部５５３は、線形回帰のアルゴリズムを用いた学習を実行する。例えば、学習部５５３は、サポートベクターマシン（ＳＶＭ：Support Vector Machine）のアルゴリズムを用いた学習を実行する。例えば、学習部５５３は、ガウス過程回帰（ＧＰＲ：Gaussian Process Regression）のアルゴリズムを用いた学習を実行する。例えば、学習部５５３は、ランダムフォレスト（ＲＦ：Random Forest）のアルゴリズムを用いた学習を実行する。例えば、学習部５５３は、特徴量データに応じて、その特徴量データの生成元の被験者を分類する教師なし学習を実行してもよい。学習部５５３が実行する学習のアルゴリズムには、特に限定を加えない。

　学習部５５３は、一歩行周期分の歩行波形データ（センサデータ）を説明変数として、学習を実行してもよい。例えば、学習部５５３は、３軸方向の加速度、３軸周りの角速度、３軸周りの角度（姿勢角）の歩行波形データを説明変数とし、推定対象である身体状態の正解値を目的変数とした教師あり学習を実行する。

　図２１は、推定モデルを生成するための学習について説明するための概念図である。図２１は、説明変数である特徴量Ｆ１～Ｆｎと、目的変数である身体状態に関するスコアとのデータセットを教師データとして、学習部５５３に学習させる一例を示す概念図である。例えば、学習部５５３は、複数の被験者に関するデータを学習し、センサデータから抽出された特徴量の入力に応じて、被験者の身体状態に関する出力（推定値）を出力する推定モデルを生成する。

　記憶部５５５は、複数の被験者に関して学習された推定モデルを記憶する。例えば、記憶部５５５は、複数の被験者に関して学習された、身体状態を推定する推定モデルを記憶する。例えば、記憶部５５５に記憶された推定モデルは、後述する第６の実施形態の身体状態推定システムによる身体状態の推定に用いられる。

　以上のように、本実施形態の学習システムは、歩容計測装置および学習装置を備える。歩容計測装置は、足の動きに関するセンサデータの時系列データを取得する。歩容計測装置は、センサデータの時系列データから一歩行周期分の歩行波形データを抽出し、抽出された歩行波形データを正規化する。歩容計測装置は、正規化された歩行波形データから、推定対象の身体状態に関する特徴量を抽出する。歩容計測装置は、第１～第４の実施形態の特徴量選定装置によって選定された特徴量を抽出する。歩容計測装置は、抽出された特徴量を含む特徴量データを生成する。歩容計測装置は、生成された特徴量データを学習装置に出力する。

　学習装置は、受信部、学習部、および記憶部を有する。受信部は、歩容計測装置によって生成された特徴量データを取得する。学習部は、特徴量データを用いて学習を実行する。学習部は、ユーザの歩行に伴って計測されるセンサデータの時系列データから抽出される特徴量の入力に応じて、身体状態を出力する推定モデルを生成する。学習部によって生成された推定モデルは、記憶部に保存される。

　本実施形態の学習システムは、歩容計測装置によって計測された特徴量データを用いて、推定モデルを生成する。本実施形態の学習システムは、第１～第４の実施形態の特徴量選定装置によって選定された特徴量を用いた学習を実行する。そのため、本態様によれば、ロバスト性の高い特徴量を用いて、日常生活において身体状態を適宜推定することを可能とする推定モデルを生成できる。

　（第６の実施形態）
　次に、第６の実施形態に係る身体状態推定システムについて図面を参照しながら説明する。本実施形態の身体状態推定システムは、ユーザの歩行に応じた足の動きに関するセンサデータを計測する。本実施形態の身体状態推定システムは、計測されたセンサデータを用いて、そのユーザの身体状態を推定する。例えば、本実施形態の身体状態推定システムは、身体状態として、握力や膝伸展力などの筋力指標や、動的バランス、下肢筋力、移動能力、静的バランスなどを推定する。なお、センサデータは、モーションキャプチャーやスマートアパレル等を用いて計測された、歩容に関する特徴を含むセンサデータであってもよい。

　（構成）
　図２２は、本実施形態に係る身体状態推定システム６の構成の一例を示すブロック図である。身体状態推定システム６は、歩容計測装置６０と推定装置６３を備える。本実施形態においては、歩容計測装置６０と推定装置６３が別々のハードウェアに構成される例について説明する。例えば、歩容計測装置６０は、身体状態の推定対象である被験者（ユーザ）の履物等に設置される。例えば、推定装置６３の機能は、被験者（ユーザ）の携帯する携帯端末にインストールされる。以下においては、歩容計測装置６０および推定装置６３の構成について、個別に説明する。

　〔歩容計測装置〕
　図２３は、歩容計測装置６０の構成の一例を示すブロック図である。歩容計測装置６０は、センサ６１と特徴量データ生成部６２を有する。本実施形態においては、センサ６１と特徴量データ生成部６２が一体化された例を挙げる。センサ６１と特徴量データ生成部６２は、別々の装置として提供されてもよい。

　図２３のように、センサ６１は、加速度センサ６１１と角速度センサ６１２を有する。図２３には、加速度センサ６１１と角速度センサ６１２が、センサ６１に含まれる例を挙げる。センサ６１には、加速度センサ６１１および角速度センサ６１２以外のセンサが含まれてもよい。センサ６１に含まれうる加速度センサ６１１および角速度センサ６１２以外のセンサについては、説明を省略する。

　加速度センサ６１１は、３軸方向の加速度（空間加速度とも呼ぶ）を計測するセンサである。加速度センサ６１１は、足の動きに関する物理量として、加速度（空間加速度とも呼ぶ）を計測する。加速度センサ６１１は、計測した加速度を特徴量データ生成部６２に出力する。例えば、加速度センサ６１１には、圧電型や、ピエゾ抵抗型、静電容量型等の方式のセンサを用いることができる。加速度センサ６１１として用いられるセンサは、加速度を計測できれば、その計測方式に限定を加えない。

　角速度センサ６１２は、３軸周りの角速度（空間角速度とも呼ぶ）を計測するセンサである。角速度センサ６１２は、足の動きに関する物理量として、角速度（空間角速度とも呼ぶ）を計測する。角速度センサ６１２は、計測した角速度を特徴量データ生成部６２に出力する。例えば、角速度センサ６１２には、振動型や静電容量型等の方式のセンサを用いることができる。角速度センサ６１２として用いられるセンサは、角速度を計測できれば、その計測方式に限定を加えない。

　センサ６１は、例えば、加速度や角速度を計測する慣性計測装置によって実現される。慣性計測装置の一例として、ＩＭＵ（Inertial Measurement Unit）が挙げられる。ＩＭＵは、３軸方向の加速度を計測する加速度センサ６１１と、３軸周りの角速度を計測する角速度センサ６１２を含む。センサ６１は、ＶＧ（Vertical Gyro）やＡＨＲＳ（Attitude Heading）などの慣性計測装置によって実現されてもよい。また、センサ６１は、ＧＰＳ／ＩＮＳ（Global Positioning System／Inertial Navigation System）によって実現されてもよい。センサ６１は、足の動きに関する物理量を計測できれば、慣性計測装置以外の装置によって実現されてもよい。

　図２４は、右足の靴６００の中に、歩容計測装置６０が配置される一例を示す概念図である。図２４の例では、足弓の裏側に当たる位置に、歩容計測装置６０が設置される。例えば、歩容計測装置６０は、靴６００の中に挿入されるインソールに配置される。例えば、歩容計測装置６０は、靴６００の底面に配置されてもよい。例えば、歩容計測装置６０は、靴６００の本体に埋設されてもよい。歩容計測装置６０は、靴６００から着脱できてもよいし、靴６００から着脱できなくてもよい。歩容計測装置６０は、足の動きに関するセンサデータを計測できさえすれば、足弓の裏側ではない位置に設置されてもよい。また、歩容計測装置６０は、ユーザが履いている靴下や、ユーザが装着しているアンクレット等の装飾品に設置されてもよい。また、歩容計測装置６０は、足に直に貼り付けられたり、足に埋め込まれたりしてもよい。図２４には、右足の靴６００に歩容計測装置６０が設置される例を示す。歩容計測装置６０は、両足の靴６００に設置されてもよい。

　図２４の例では、歩容計測装置６０（センサ６１）を基準として、左右方向のｘ軸、前後方向のｙ軸、上下方向のｚ軸を含むローカル座標系が設定される。ｘ軸は左方を正とし、ｙ軸は後方を正とし、ｚ軸は上方を正とする。センサ６１に設定される軸の向きは、左右の足で同じでもよく、左右の足で異なっていてもよい。例えば、同じスペックで生産されたセンサ６１が左右の靴６００の中に配置される場合、左右の靴６００に配置されるセンサ６１の上下の向き（Ｚ軸方向の向き）は、同じ向きである。その場合、左足に由来するセンサデータに設定されるローカル座標系の３軸と、右足に由来するセンサデータに設定されるローカル座標系の３軸とは、左右で同じにある。

　図２５は、足弓の裏側に設置された歩容計測装置６０（センサ６１）に設定されるローカル座標系（ｘ軸、ｙ軸、ｚ軸）と、地面に対して設定される世界座標系（Ｘ軸、Ｙ軸、Ｚ軸）について説明するための概念図である。世界座標系（Ｘ軸、Ｙ軸、Ｚ軸）では、進行方向に正対した状態のユーザが直立した状態で、ユーザの横方向がＸ軸方向（左向きが正）、ユーザの背面の方向がＹ軸方向（後ろ向きが正）、重力方向がＺ軸方向（鉛直上向きが正）に設定される。なお、図２５の例は、ローカル座標系（ｘ軸、ｙ軸、ｚ軸）と世界座標系（Ｘ軸、Ｙ軸、Ｚ軸）の関係を概念的に示すものであり、ユーザの歩行に応じて変動するローカル座標系と世界座標系の関係を正確に示すものではない。

　図２６は、人体に対して設定される面（人体面とも呼ぶ）について説明するための概念図である。本実施形態では、身体を左右に分ける矢状面、身体を前後に分ける冠状面、身体を水平に分ける水平面が定義される。なお、図２６のように、足の中心線を進行方向に向けて直立した状態では、世界座標系とローカル座標系が一致する。本実施形態においては、ｘ軸を回転軸とする矢状面内の回転をロール、ｙ軸を回転軸とする冠状面内の回転をピッチ、ｚ軸を回転軸とする水平面内の回転をヨーと定義する。また、ｘ軸を回転軸とする矢状面内の回転角をロール角、ｙ軸を回転軸とする冠状面内の回転角をピッチ角、ｚ軸を回転軸とする水平面内の回転角をヨー角と定義する。

　図２３のように、特徴量データ生成部６２（特徴量データ生成装置とも呼ぶ）は、取得部６２１、正規化部６２２、抽出部６２３、生成部６２５、および特徴量データ出力部６２７を有する。例えば、特徴量データ生成部６２は、歩容計測装置６０の全体制御やデータ処理を行うマイクロコンピュータまたはマイクロコントローラによって実現される。例えば、特徴量データ生成部６２は、ＣＰＵ（Central Processing Unit）やＲＡＭ（Random Access Memory）、ＲＯＭ（Read Only Memory）、フラッシュメモリ等を有する。特徴量データ生成部６２は、加速度センサ６１１および角速度センサ６１２を制御して、角速度や加速度を計測する。例えば、特徴量データ生成部６２は、被験者（ユーザ）の携帯する携帯端末（図示しない）の側に実装されてもよい。

　取得部６２１は、加速度センサ６１１から、３軸方向の加速度を取得する。また、取得部６２１は、角速度センサ６１２から、３軸周りの角速度を取得する。例えば、取得部６２１は、取得された角速度および加速度等の物理量（アナログデータ）をＡＤ変換（Analog-to-Digital Conversion）する。なお、加速度センサ６１１および角速度センサ６１２によって計測された物理量（アナログデータ）は、加速度センサ６１１および角速度センサ６１２の各々においてデジタルデータに変換されてもよい。取得部６２１は、変換後のデジタルデータ（センサデータとも呼ぶ）を正規化部６２２に出力する。取得部６２１は、図示しない記憶部に、センサデータを記憶させるように構成されてもよい。センサデータには、デジタルデータに変換された加速度データと、デジタルデータに変換された角速度データとが少なくとも含まれる。加速度データは、３軸方向の加速度ベクトルを含む。角速度データは、３軸周りの角速度ベクトルを含む。加速度データおよび角速度データには、それらのデータの取得時間が紐付けられる。また、取得部６２１は、加速度データおよび角速度データに対して、実装誤差や温度補正、直線性補正などの補正を加えてもよい。

　正規化部６２２は、取得部６２１からセンサデータを取得する。正規化部６２２は、センサデータに含まれる３軸方向の加速度および３軸周りの角速度の時系列データから、一歩行周期分の時系列データ（歩行波形データとも呼ぶ）を抽出する。正規化部６２２は、抽出された一歩行周期分の歩行波形データの時間を、０～１００％（パーセント）の歩行周期に正規化（第１正規化とも呼ぶ）する。０～１００％の歩行周期に含まれる１％や１０％などのタイミングを、歩行フェーズとも呼ぶ。また、正規化部６２２は、第１正規化された一歩行周期分の歩行波形データに関して、立脚相が６０％、遊脚相が４０％になるように正規化（第２正規化とも呼ぶ）する。立脚相は、足の裏側の少なくとも一部が地面に接している期間である。遊脚相は、足の裏側が地面から離れている期間である。歩行波形データを第２正規化すれば、特徴量が抽出される歩行フェーズのずれが、外乱の影響でぶれることを抑制できる。

　図２７は、右足を基準とする一歩行周期について説明するための概念図である。左足を基準とする一歩行周期も、右足と同様である。図２７の横軸は、右足の踵が地面に着地した時点を起点とし、次に右足の踵が地面に着地した時点を終点とする右足の一歩行周期である。図２７の横軸は、一歩行周期を１００％として第１正規化されている。また、図２７の横軸は、立脚相が６０％、遊脚相が４０％になるように第２正規化されている。片足の一歩行周期は、足の裏側の少なくとも一部が地面に接している立脚相と、足の裏側が地面から離れている遊脚相とに大別される。立脚相は、さらに、荷重応答期Ｔ１、立脚中期Ｔ２、立脚終期Ｔ３、遊脚前期Ｔ４に細分される。遊脚相は、さらに、遊脚初期Ｔ５、遊脚中期Ｔ６、遊脚終期Ｔ７に細分される。なお、図２７は一例であって、一歩行周期を構成する期間や、それらの期間の名称等を限定するものではない。

　図２７のように、歩行においては、複数の事象（歩行イベントとも呼ぶ）が発生する。Ｅ１は、右足の踵が接地する事象（踵接地）を表す（ＨＣ：Heel Contact）。Ｅ２は、右足の足裏が接地した状態で、左足の爪先が地面から離れる事象（反対足爪先離地）を表す（ＯＴＯ：Opposite Toe Off）。Ｅ３は、右足の足裏が接地した状態で、右足の踵が持ち上がる事象（踵持ち上がり）を表す（ＨＲ：Heel Rise）。Ｅ４は、左足の踵が接地した事象（反対足踵接地）である（ＯＨＳ：Opposite Heel Strike）。Ｅ５は、左足の足裏が接地した状態で、右足の爪先が地面から離れる事象（爪先離地）を表す（ＴＯ：Toe Off）。Ｅ６は、左足の足裏が接地した状態で、左足と右足が交差する事象（足交差）を表す（ＦＡ：Foot Adjacent）。Ｅ７は、左足の足裏が接地した状態で、右足の脛骨が地面に対してほぼ垂直になる事象（脛骨垂直）を表す（ＴＶ：Tibia Vertical）。Ｅ８は、右足の踵が接地する事象（踵接地）を表す（ＨＣ：Heel Contact）。Ｅ８は、Ｅ１から始まる歩行周期の終点に相当するとともに、次の歩行周期の起点に相当する。なお、図２７は一例であって、歩行において発生する事象や、それらの事象の名称を限定するものではない。

　図２８は、進行方向加速度（Ｙ方向加速度）の時系列データ（実線）から、踵接地ＨＣや爪先離地ＴＯを検出する一例について説明するための図である。踵接地ＨＣのタイミングは、進行方向加速度（Ｙ方向加速度）の時系列データに表れる極大ピークの直後の極小ピークのタイミングである。踵接地ＨＣのタイミングの目印になる極大ピークは、一歩行周期分の歩行波形データの最大ピークに相当する。連続する踵接地ＨＣの間の区間が、一歩行周期である。爪先離地ＴＯのタイミングは、進行方向加速度（Ｙ方向加速度）の時系列データに変動が表れない立脚相の期間の後に表れる極大ピークの立ち上がりのタイミングである。図２８には、ロール角（Ｘ軸周り角速度）の時系列データ（破線）も示す。ロール角が最小のタイミングと、ロール角が最大のタイミングとの中点のタイミングが、立脚中期に相当する。例えば、歩行速度や、歩幅、分回し、内旋／外旋、底屈／背屈などのパラメータ（歩容パラメータとも呼ぶ）は、立脚中期を基準として求めることができる。

　図２９は、正規化部６２２によって正規化された歩行波形データの一例について説明するための図である。正規化部６２２は、進行方向加速度（Ｙ方向加速度）の時系列データから、踵接地ＨＣと爪先離地ＴＯを検出する。正規化部６２２は、連続する踵接地ＨＣの間の区間を、一歩行周期分の歩行波形データとして抽出する。正規化部６２２は、第１正規化によって、一歩行周期分の歩行波形データの横軸（時間軸）を、０～１００％の歩行周期に変換する。図２９には、第１正規化後の歩行波形データを破線で示す。第１正規化後の歩行波形データ（破線）では、爪先離地ＴＯのタイミングが６０％からずれている。

　図２９の例において、正規化部６２２は、歩行フェーズが０％の踵接地ＨＣから、その踵接地ＨＣに後続する爪先離地ＴＯまでの区間を０～６０％に正規化する。また、正規化部６２２は、爪先離地ＴＯから、爪先離地ＴＯに後続する歩行フェーズが１００％の踵接地ＨＣまでの区間を６０～１００％に正規化する。その結果、一歩行周期分の歩行波形データは、歩行周期が０～６０％の区間（立脚相）と、歩行周期が６０～１００％の区間（遊脚相）とに正規化される。図８には、第２正規化後の歩行波形データを実線で示す。第２正規化後の歩行波形データ（実線）では、爪先離地ＴＯのタイミングが６０％に一致する。

　図２８～図２９には、進行方向加速度（Ｙ方向加速度）に基づいて、一歩行周期分の歩行波形データを抽出／正規化する例を示した。進行方向加速度（Ｙ方向加速度）以外の加速度／角速度に関して、正規化部６２２は、進行方向加速度（Ｙ方向加速度）の歩行周期に合わせて、一歩行周期分の歩行波形データを抽出／正規化する。また、正規化部６２２は、３軸周りの角速度の時系列データを積分することで、３軸周りの角度の時系列データを生成してもよい。その場合、正規化部６２２は、３軸周りの角度に関しても、進行方向加速度（Ｙ方向加速度）の歩行周期に合わせて、一歩行周期分の歩行波形データを抽出／正規化する。

　正規化部６２２は、進行方向加速度（Ｙ方向加速度）以外の加速度／角速度に基づいて、一歩行周期分の歩行波形データを抽出／正規化してもよい（図面は省略）。例えば、正規化部６２２は、垂直方向加速度（Ｚ方向加速度）の時系列データから、踵接地ＨＣや爪先離地ＴＯを検出してもよい。踵接地ＨＣのタイミングは、垂直方向加速度（Ｚ方向加速度）の時系列データに表れる急峻な極小ピークのタイミングである。急峻な極小ピークのタイミングにおいては、垂直方向加速度（Ｚ方向加速度）の値がほぼ０になる。踵接地ＨＣのタイミングの目印になる極小ピークは、一歩行周期分の歩行波形データの最小ピークに相当する。連続する踵接地ＨＣの間の区間が、一歩行周期である。爪先離地ＴＯのタイミングは、垂直方向加速度（Ｚ方向加速度）の時系列データが、踵接地ＨＣの直後の極大ピークの後に変動の小さい区間を経た後に、なだらかに増大する途中の変曲点のタイミングである。また、正規化部６２２は、進行方向加速度（Ｙ方向加速度）および垂直方向加速度（Ｚ方向加速度）の両方に基づいて、一歩行周期分の歩行波形データを抽出／正規化してもよい。また、正規化部６２２は、進行方向加速度（Ｙ方向加速度）および垂直方向加速度（Ｚ方向加速度）以外の加速度や角速度、角度等に基づいて、一歩行周期分の歩行波形データを抽出／正規化してもよい。

　抽出部６２３は、正規化部６２２によって正規化された一歩行周期分の歩行波形データを取得する。抽出部６２３は、一歩行周期分の歩行波形データから、身体状態の推定に用いられる特徴量を抽出する。抽出部６２３は、予め設定された条件に基づいて、時間的に連続する歩行フェーズを統合した歩行フェーズクラスターから、歩行フェーズクラスターごとの特徴量を抽出する。歩行フェーズクラスターは、少なくとも一つの歩行フェーズを含む。歩行フェーズクラスターには、単一の歩行フェーズも含まれる。身体状態の推定に用いられる特徴量が抽出される歩行波形データや歩行フェーズについては、後述する。

　図３０は、一歩行周期分の歩行波形データから、身体状態を推定するための特徴量を抽出することについて説明するための概念図である。例えば、抽出部６２３は、時間的に連続する歩行フェーズＩ～Ｉ＋ｍを、歩行フェーズクラスターＣとして抽出する（Ｉ、ｍは自然数）。歩行フェーズクラスターＣは、ｍ個の歩行フェーズ（構成要素）を含む。すなわち、歩行フェーズクラスターＣを構成する歩行フェーズ（構成要素）の数（構成要素数とも呼ぶ）は、ｍである。図３０には、歩行フェーズが整数値の例を挙げるが、歩行フェーズは小数点以下まで細分化されてもよい。歩行フェーズが小数点以下まで細分化される場合、歩行フェーズクラスターＣの構成要素数は、歩行フェーズクラスターの区間のデータ点数に応じた数になる。抽出部６２３は、歩行フェーズＩ～Ｉ＋ｍの各々から特徴量を抽出する。歩行フェーズクラスターＣが単一の歩行フェーズＪによって構成される場合、抽出部６２３は、その単一の歩行フェーズＪから特徴量を抽出する（Ｊは自然数）。

　生成部６２５は、歩行フェーズクラスターを構成する歩行フェーズの各々から抽出された特徴量（第１特徴量）に特徴量構成式を適用して、歩行フェーズクラスターの特徴量（第２特徴量）を生成する。特徴量構成式は、歩行フェーズクラスターの特徴量を生成するために、予め設定された計算式である。例えば、特徴量構成式は、四則演算に関する計算式である。例えば、特徴量構成式を用いて算出される第２特徴量は、歩行フェーズクラスターに含まれる各歩行フェーズにおける第１特徴量の積分平均値や算術平均値、傾斜、ばらつきなどである。例えば、生成部６２５は、歩行フェーズクラスターを構成する歩行フェーズの各々から抽出された第１特徴量の傾斜やばらつきを算出する計算式を、特徴量構成式として適用する。例えば、歩行フェーズクラスターが単独の歩行フェーズで構成される場合は、傾斜やばらつきを算出できないため、積分平均値や算術平均値などを計算する特徴量構成式を用いればよい。

　特徴量データ出力部６２７は、生成部６２５によって生成された歩行フェーズクラスターごとの特徴量データを出力する。特徴量データ出力部６２７は、生成された歩行フェーズクラスターの特徴量データを、その特徴量データを使用する推定装置６３に出力する。

　〔推定装置〕
　図３１は、推定装置６３の構成の一例を示すブロック図である。推定装置６３は、データ取得部６３１、記憶部６３２、推定部６３３、および出力部６３５を有する。

　データ取得部６３１は、歩容計測装置６０から特徴量データを取得する。データ取得部６３１は、受信された特徴量データを推定部６３３に出力する。データ取得部６３１は、ケーブルなどの有線を介して特徴量データを歩容計測装置６０から受信してもよいし、無線通信を介して特徴量データを歩容計測装置６０から受信してもよい。例えば、データ取得部６３１は、Ｂｌｕｅｔｏｏｔｈ（登録商標）やＷｉＦｉ（登録商標）などの規格に則した無線通信機能（図示しない）を介して、特徴量データを歩容計測装置６０から受信するように構成される。なお、データ取得部６３１の通信機能は、Ｂｌｕｅｔｏｏｔｈ（登録商標）やＷｉＦｉ（登録商標）以外の規格に則していてもよい。

　記憶部６３２は、歩行波形データから抽出された特徴量データを用いて、身体状態を推定する推定モデルを記憶する。記憶部６３２は、複数の被験者の身体状態に関する特徴量データと、その身体状態との関係を学習した推定モデルを記憶する。例えば、記憶部６３２は、複数の被験者に関して学習された、身体状態を推定する推定モデルを記憶する。例えば、記憶部６３２は、属性に応じた推定モデルを記憶してもよい。

　推定モデルは、製品の工場出荷時や、身体状態推定システム６をユーザが使用する前のキャリブレーション時等のタイミングで、記憶部６３２に記憶させておけばよい。例えば、外部のサーバ等の記憶装置に保存された推定モデルを用いるように構成してもよい。その場合、その記憶装置と接続されたインターフェース（図示しない）を介して、推定モデルを用いるように構成すればよい。

　推定部６３３は、データ取得部６３１から特徴量データを取得する。推定部６３３は、取得された特徴量データを用いて、身体状態の推定を実行する。推定部６３３は、記憶部６３２に記憶された推定モデルに特徴量データを入力する。推定部６３３は、推定モデルから出力される身体状態に応じた推定結果を出力する。クラウドやサーバ等に構築された外部の記憶装置に保存された推定モデルを用いる場合、推定部６３３は、その記憶装置と接続されたインターフェース（図示しない）を介して、推定モデルを用いるように構成される。

　出力部６３５は、推定部６３３による身体状態の推定結果を出力する。例えば、出力部６３５は、被験者（ユーザ）の携帯端末の画面に、身体状態の推定結果を表示させる。例えば、出力部６３５は、推定結果を使用する外部システム等に対して、その推定結果を出力する。推定装置６３から出力された身体状態の使用に関しては、特に限定を加えない。

　例えば、推定装置６３は、被験者（ユーザ）が携帯する携帯端末（図示しない）を介して、クラウドやサーバに構築された外部システム等に接続される。携帯端末（図示しない）は、携帯可能な通信機器である。例えば、携帯端末は、スマートフォンや、スマートウォッチ、携帯電話等の通信機能を有する携帯型の通信機器である。例えば、推定装置６３は、ケーブルなどの有線を介して、携帯端末に接続される。例えば、推定装置６３は、無線通信を介して、携帯端末に接続される。例えば、推定装置６３は、Ｂｌｕｅｔｏｏｔｈ（登録商標）やＷｉＦｉ（登録商標）などの規格に則した無線通信機能（図示しない）を介して、携帯端末に接続される。なお、推定装置６３の通信機能は、Ｂｌｕｅｔｏｏｔｈ（登録商標）やＷｉＦｉ（登録商標）以外の規格に則していてもよい。身体状態の推定結果は、携帯端末にインストールされたアプリケーションによって使用されてもよい。その場合、携帯端末は、その携帯端末にインストールされたアプリケーションソフトウェア等によって、推定結果を用いた処理を実行する。

　図３２は、第５の実施形態の学習システムによって、身体状態を推定するために予め構築された推定モデル６５１に、ユーザの歩行に伴って計測されたセンサデータから抽出される特徴量Ｆ１～Ｆｎを入力して、身体状態に関するスコアが出力される一例を示す概念図である。推定モデル６５１は、特徴量Ｆ１～Ｆｎの入力に応じて、身体状態のスコアを出力する。例えば、推定モデル６５１は、身体状態の推定に用いられる特徴量Ｆ１～Ｆｎを説明変数とし、身体状態を目的変数とする教師データを用いた学習で生成される。身体状態を推定するための特徴量データの入力に応じて、身体状態に関する推定結果が出力されれば、推定モデル６５１の推定結果には限定を加えない。例えば、推定モデル６５１は、身体状態の推定に用いられる特徴量Ｆ１～Ｆｎに加えて、性別や年齢、身長、体重などの属性を説明変数として、身体状態を推定するモデルであってもよい。

　例えば、記憶部６３２には、重回帰予測法を用いて、身体状態を推定する推定モデルが記憶される。例えば、記憶部６３２には、以下の式１を用いて、身体状態のスコアＳを推定するためのパラメータが記憶される。
Ｓ＝ｆ１×Ｆ１＋ｆ２×Ｆ２＋・・・＋ｆｎ×Ｆｎ＋ｆ０・・・（１）
上記の式１において、Ｆ１、Ｆ２、・・・、Ｆｎは、身体状態の推定に用いられる歩行フェーズクラスターごとの特徴量である。ｆ１、ｆ２、・・・、ｆｎは、Ｆ１、Ｆ２、・・・、Ｆｎに掛け合わされる係数である。ｆ０は、定数項である。例えば、記憶部６３２には、ｆ１、ｆ２、・・・、ｆｎなどの係数を記憶させておく。

　（動作）
　次に、身体状態推定システム６の動作について図面を参照しながら説明する。ここでは、身体状態推定システム６に含まれる歩容計測装置６０および推定装置６３について、個別に説明する。歩容計測装置６０に関しては、歩容計測装置６０に含まれる特徴量データ生成部６２の動作について説明する。

　〔歩容計測装置〕
　図３３は、歩容計測装置６０に含まれる特徴量データ生成部６２の動作について説明するためのフローチャートである。図３３のフローチャートに沿った説明においては、特徴量データ生成部６２を動作主体として説明する。

　図３３において、まず、特徴量データ生成部６２は、歩容に関するセンサデータの時系列データを取得する（ステップＳ６０１）。

　次に、特徴量データ生成部６２は、センサデータの時系列データから一歩行周期分の歩行波形データを抽出する（ステップＳ６０２）。特徴量データ生成部６２は、センサデータの時系列データから踵接地および爪先離地を検出する。特徴量データ生成部６２は、連続する踵接地間の区間の時系列データを、一歩行周期分の歩行波形データとして抽出する。

　次に、特徴量データ生成部６２は、抽出された一歩行周期分の歩行波形データを正規化する（ステップＳ６０３）。特徴量データ生成部６２は、一歩行周期分の歩行波形データを０～１００％の歩行周期に正規化する（第１正規化）。さらに、特徴量データ生成部６２は、第１正規化された一歩行周期分の歩行波形データの立脚相と遊脚相の比を６０：４０に正規化する（第２正規化）。

　次に、特徴量データ生成部６２は、正規化された歩行波形に関して、身体状態の推定に用いられる歩行フェーズから特徴量を抽出する（ステップＳ６０４）。例えば、特徴量データ生成部６２は、性別ごとに構築された推定モデルに入力される特徴量を抽出する。

　次に、特徴量データ生成部６２は、抽出された特徴量を用いて、歩行フェーズクラスターごとの特徴量を生成する（ステップＳ６０５）。

　次に、特徴量データ生成部６２は、歩行フェーズクラスターごとの特徴量を統合して、一歩行周期分の特徴量データを生成する（ステップＳ６０６）。

　次に、特徴量データ生成部６２は、生成された特徴量データを推定装置６３に出力する（ステップＳ６０７）。

　〔推定装置〕
　図３３は、推定装置６３の動作について説明するためのフローチャートである。図３３のフローチャートに沿った説明においては、推定装置６３を動作主体として説明する。

　図３３において、まず、推定装置６３は、歩容に関するセンサデータを用いて生成された特徴量データを取得する（ステップＳ６３１）。

　次に、推定装置６３は、取得した特徴量データを、身体状態を推定する推定モデルに入力する（ステップＳ６３２）。

　次に、推定装置６３は、推定モデルからの出力（推定値）に応じて、ユーザの身体状態を推定する（ステップＳ６３３）。

　次に、推定装置６３は、推定された身体状態に関する情報を出力する（ステップＳ６３４）。例えば、身体状態は、ユーザの携帯する端末装置（図示しない）に出力される。例えば、身体状態は、身体状態を用いた処理を実行するシステムに出力される。

　（適用例）
　次に、本実施形態に係る適用例について図面を参照しながら説明する。以下の適用例において、靴に配置された歩容計測装置６０によって計測された特徴量データを用いて、ユーザが携帯する携帯端末にインストールされた推定装置６３の機能が、身体状態を推定する例を示す。

　図３５は、歩容計測装置６０が配置された靴６００を履いて歩行するユーザの携帯する携帯端末６６０の画面に、推定装置６３による推定結果を表示させる一例を示す概念図である。図３５は、ユーザの歩行中に計測されたセンサデータに応じた特徴量データを用いた身体状態の推定結果に応じた情報を、携帯端末６６０の画面に表示させる例である。

　図３５は、身体状態に関する推定値に応じた情報が、携帯端末６６０の画面に表示される例である。図３５の例では、身体状態に関する推定結果として、予め設定された基準で数値化されたスコアが、携帯端末６６０の表示部に表示させる。また、図３５の例では、身体状態に関する推定値に応じて、「全身総合筋力が低下しています。」という身体状態の推定結果に関する情報が、携帯端末６６０の表示部に表示される。また、図３５の例では、身体状態の推定値に応じて、「トレーニングＡを推奨します。下記の動画をご覧ください。」という全身総合筋力の推定結果に応じた推薦情報が、携帯端末６６０の表示部に表示される。携帯端末６６０の表示部に表示された情報を確認したユーザは、表示された推薦情報に応じて、トレーニングＡの動画を参照して運動することによって、全身総合筋力の改善につながるトレーニングを実践できる。

　以上のように、本実施形態の身体状態推定システムは、歩容計測装置および身体状態推定装置を備える。歩容計測装置は、センサと特徴量データ生成部を備える。センサは、加速度センサと角速度センサを有する。センサは、加速度センサを用いて、空間加速度を計測する。センサは、角速度センサを用いて、空間角速度を計測する。センサは、計測した空間加速度および空間角速度を用いて、足の動きに関するセンサデータを生成する。センサは、生成したセンサデータを特徴量データ生成部に出力する。特徴量データ生成部は、足の動きに関するセンサデータの時系列データを取得する。特徴量データ生成部は、センサデータの時系列データから一歩行周期分の歩行波形データを抽出する。特徴量データ生成部は、抽出された歩行波形データを正規化する。特徴量データ生成部は、正規化された歩行波形データから、推定対象の身体状態に関する特徴量を、時間的に連続する少なくとも一つの歩行フェーズによって構成される歩行フェーズクラスターから抽出する。特徴量データ生成部は、第１～第４の実施形態の特徴量選定装置によって選定された特徴量を抽出する。特徴量データ生成部は、抽出された特徴量を含む特徴量データを生成する。特徴量データ生成部は、生成された特徴量データを出力する。

　身体状態推定装置は、データ取得部、記憶部、推定部、および出力部を備える。データ取得部は、ユーザの歩容の特徴から抽出された、ユーザの身体状態の推定に用いられる特徴量を含む特徴量データを取得する。記憶部は、特徴量データの入力に応じた身体状態を出力する推定モデルを記憶する。推定部は、取得された特徴量データを推定モデルに入力して、ユーザの身体状態を推定する。出力部は、推定された身体状態に関する情報を出力する。

　本実施形態の身体状態推定システムは、ユーザの歩容の特徴から抽出された特徴量を用いて、ユーザの身体状態を推定する。そのため、本実施形態の身体状態推定システムによれば、ロバスト性の高い特徴量を用いて、日常生活において身体状態を適宜推定できる。

　（ハードウェア）
　ここで、本開示の各実施形態に係る処理を実行するハードウェア構成について、図３６の情報処理装置９０を一例として挙げて説明する。なお、図３６の情報処理装置９０は、各実施形態の処理を実行するための構成例であって、本開示の範囲を限定するものではない。

　図３６のように、情報処理装置９０は、プロセッサ９１、主記憶装置９２、補助記憶装置９３、入出力インターフェース９５、および通信インターフェース９６を備える。図３６においては、インターフェースをＩ／Ｆ（Interface）と略記する。プロセッサ９１、主記憶装置９２、補助記憶装置９３、入出力インターフェース９５、および通信インターフェース９６は、バス９８を介して、互いにデータ通信可能に接続される。また、プロセッサ９１、主記憶装置９２、補助記憶装置９３、および入出力インターフェース９５は、通信インターフェース９６を介して、インターネットやイントラネットなどのネットワークに接続される。

　プロセッサ９１は、補助記憶装置９３等に格納されたプログラムを、主記憶装置９２に展開する。プロセッサ９１は、主記憶装置９２に展開されたプログラムを実行する。本実施形態においては、情報処理装置９０にインストールされたソフトウェアプログラムを用いる構成とすればよい。プロセッサ９１は、各実施形態に係る処理を実行する。

　主記憶装置９２は、プログラムが展開される領域を有する。主記憶装置９２には、プロセッサ９１によって、補助記憶装置９３等に格納されたプログラムが展開される。主記憶装置９２は、例えばＤＲＡＭ（Dynamic Random Access Memory）などの揮発性メモリによって実現される。また、主記憶装置９２として、ＭＲＡＭ（Magnetoresistive Random Access Memory）などの不揮発性メモリが構成／追加されてもよい。

　補助記憶装置９３は、プログラムなどの種々のデータを記憶する。補助記憶装置９３は、ハードディスクやフラッシュメモリなどのローカルディスクによって実現される。なお、種々のデータを主記憶装置９２に記憶させる構成とし、補助記憶装置９３を省略することも可能である。

　入出力インターフェース９５は、規格や仕様に基づいて、情報処理装置９０と周辺機器とを接続するためのインターフェースである。通信インターフェース９６は、規格や仕様に基づいて、インターネットやイントラネットなどのネットワークを通じて、外部のシステムや装置に接続するためのインターフェースである。入出力インターフェース９５および通信インターフェース９６は、外部機器と接続するインターフェースとして共通化してもよい。

　情報処理装置９０には、必要に応じて、キーボードやマウス、タッチパネルなどの入力機器が接続されてもよい。それらの入力機器は、情報や設定の入力に使用される。なお、タッチパネルを入力機器として用いる場合は、表示機器の表示画面が入力機器のインターフェースを兼ねる構成としてもよい。プロセッサ９１と入力機器との間のデータ通信は、入出力インターフェース９５に仲介させればよい。

　また、情報処理装置９０には、情報を表示するための表示機器を備え付けてもよい。表示機器を備え付ける場合、情報処理装置９０には、表示機器の表示を制御するための表示制御装置（図示しない）が備えられていることが好ましい。表示機器は、入出力インターフェース９５を介して情報処理装置９０に接続すればよい。

　また、情報処理装置９０には、ドライブ装置が備え付けられてもよい。ドライブ装置は、プロセッサ９１と記録媒体（プログラム記録媒体）との間で、記録媒体からのデータやプログラムの読み込み、情報処理装置９０の処理結果の記録媒体への書き込みなどを仲介する。ドライブ装置は、入出力インターフェース９５を介して情報処理装置９０に接続すればよい。

　以上が、本発明の各実施形態に係る処理を可能とするためのハードウェア構成の一例である。なお、図３６のハードウェア構成は、各実施形態に係る処理を実行するためのハードウェア構成の一例であって、本発明の範囲を限定するものではない。また、各実施形態に係る処理をコンピュータに実行させるプログラムも本発明の範囲に含まれる。さらに、各実施形態に係るプログラムを記録したプログラム記録媒体も本発明の範囲に含まれる。記録媒体は、例えば、ＣＤ（Compact Disc）やＤＶＤ（Digital Versatile Disc）などの光学記録媒体で実現できる。記録媒体は、ＵＳＢ（Universal Serial Bus）メモリやＳＤ（Secure Digital）カードなどの半導体記録媒体によって実現されてもよい。また、記録媒体は、フレキシブルディスクなどの磁気記録媒体、その他の記録媒体によって実現されてもよい。プロセッサが実行するプログラムが記録媒体に記録されている場合、その記録媒体はプログラム記録媒体に相当する。

　各実施形態の構成要素は、任意に組み合わせてもよい。また、各実施形態の構成要素は、ソフトウェアによって実現されてもよいし、回路によって実現されてもよい。

　以上、実施形態を参照して本発明を説明してきたが、本発明は上記実施形態に限定されるものではない。本発明の構成や詳細には、本発明のスコープ内で当業者が理解し得る様々な変更をすることができる。

　５　　学習システム
　６　　身体状態推定システム
　１０、２０、３０、４０　　特徴量選定装置
　１１、２１、３１、４１　取得部
　１２、２２、３２、４２　　構築部
　１３、２３、３３、４３　　解析部
　１５、２５、３５、４５　　統計部
　１７、２７、３７、４７　　選定部
　１９、２９、３９、４９　　出力部
　２６　　推定モデル構築部
　５０、６０　　歩容計測装置
　５５　　学習装置
　６１　　センサ
　６２　　特徴量データ生成部
　６３　　推定装置
　５５１　　受信部
　５５３　　学習部
　５５５　　記憶部
　６３１　　データ取得部
　６３２　　記憶部
　６３３　　推定部
　６３５　　出力部

Claims

　複数のデータセットを取得する取得手段と、
　前記データセットに含まれるデータの分布を変更して複数の再抽出データセットを構築する構築手段と、
　ラッソ回帰の手法を用いて、複数の前記再抽出データセットを解析する解析手段と、
　複数の前記再抽出データセットの解析結果に応じて複数の前記再抽出データセットに含まれる要素の値を集計し、前記要素の値の集計結果に応じて複数の前記再抽出データセットに含まれる前記要素に論理値を設定する統計手段と、
　予め設定された特定ルールに従って、前記要素に設定された前記論理値の値に応じた組み合わせの特徴量を選定する選定手段と、
　選定された前記特徴量の組み合わせに関する選定情報を出力する出力手段と、を備える特徴量選定装置。
　前記構築手段は、
　Leave-One-Subject-Outの手法を用いて、複数の前記再抽出データセットを構築する請求項１に記載の特徴量選定装置。
　前記構築手段は、
　ブートストラップ法を用いて、複数の前記再抽出データセットを構築する請求項１に記載の特徴量選定装置。
　前記解析手段は、
　複数の前記再抽出データセットに関して、予め設定された複数の正則化パラメータごとに前記ラッソ回帰を実行し、
　前記ラッソ回帰で用いられた前記正則化パラメータに対応する列と、前記特徴量に対応する行とによって構成される複数パターンの第１行列を生成し、
　前記統計手段は、
　複数パターンの前記第１行列に関して、非ゼロ要素のセルの第１論理値を１に設定して、ゼロ要素のセルの第１論理値を０に設定する第１統計処理を実行し、
　複数パターンの前記第１行列を構成するセルごとに前記第１論理値を集計して、前記第１論理値の集計値が所定条件を満たすセルに第２論理値として１が設定され、前記第１論理値の集計値が前記所定条件を満たさないセルに前記第２論理値として０が設定された第２行列を生成する第２統計処理を実行し、
　前記選定手段は、
　予め設定された前記特定ルールに従って前記第２行列の列を選択し、選択された列に対応する前記特徴量の組み合わせを選定する請求項１乃至３のいずれか一項に記載の特徴量選定装置。
　前記統計手段は、
　前記第２統計処理において、
　複数パターンの前記第１行列を構成するセルごとに前記第１論理値の合計値を計算し、
　前記第１論理値の合計値が所定閾値以上のセルの前記第２論理値が１に設定され、前記第１論理値の合計値が所定閾値未満のセルが０に設定された前記第２行列を生成する請求項４に記載の特徴量選定装置。
　前記統計手段は、
　前記第２統計処理において、
　複数パターンの前記第１行列を構成するセルごとに前記第１論理値の平均値を計算し、
　前記第１論理値の平均値が所定閾値以上のセルの前記第２論理値が１に設定され、前記第１論理値の平均値が所定閾値未満のセルが０に設定された前記第２行列を生成する請求項４に記載の特徴量選定装置。
　前記解析手段は、
　複数の前記再抽出データセットの各々に関して、予め設定された複数の正則化パラメータごとに前記ラッソ回帰を実行し、
　前記ラッソ回帰で用いられた前記正則化パラメータに対応する列と、前記特徴量に対応する行とによって構成される複数パターンの第１行列を生成し、
　前記統計手段は、
　複数パターンの前記第１行列を構成するセルごとに前記要素の値を集計して、前記要素の値の平均値が所定閾値以上のセルに第２論理値として１が設定され、前記要素の値の平均値が前記所定閾値未満のセルに前記第２論理値として０が設定された第２行列を生成する第２統計処理を実行し、
　前記選定手段は、
　予め設定された前記特定ルールに従って前記第２行列の列を選択し、選択された列に対応する前記特徴量の組み合わせを選定する請求項１乃至３のいずれか一項に記載の特徴量選定装置。
　選定された前記特徴量を用いた学習により推定モデルを構築し、構築された前記推定モデルを評価する推定モデル構築手段を備え、
　前記選定手段は、
　前記推定モデルの評価結果に応じて、前記特徴量の組み合わせを選定する請求項１乃至７のいずれか一項に記載の特徴量選定装置。
　コンピュータが、
　複数のデータセットを取得し、
　前記データセットに含まれるデータの分布を変更して複数の再抽出データセットを構築し、
　ラッソ回帰の手法を用いて、複数の前記再抽出データセットを解析し、
　複数の前記再抽出データセットの解析結果に応じて複数の前記再抽出データセットに含まれる要素の値を集計し、
　前記要素の値の集計結果に応じて複数の前記再抽出データセットに含まれる前記要素に論理値を設定し、
　予め設定された特定ルールに従って、前記要素に設定された前記論理値の値に応じた組み合わせの特徴量を選定し、
　選定された前記特徴量の組み合わせに関する選定情報を出力する特徴量選定方法。
　複数のデータセットを取得する処理と、
　前記データセットに含まれるデータの分布を変更して複数の再抽出データセットを構築する処理と、
　ラッソ回帰の手法を用いて、複数の前記再抽出データセットを解析する処理と、
　複数の前記再抽出データセットの解析結果に応じて複数の前記再抽出データセットに含まれる要素の値を集計する処理と、
　前記要素の値の集計結果に応じて複数の前記再抽出データセットに含まれる前記要素に論理値を設定する処理と、
　予め設定された特定ルールに従って、前記要素に設定された前記論理値の値に応じた組み合わせの特徴量を選定する処理と、
　選定された前記特徴量の組み合わせに関する選定情報を出力する処理と、をコンピュータに実行させるプログラムを記録させた非一過性の記録媒体。