WO2023139718A1 - 特徴量選定装置、特徴量選定方法、身体状態推定システム、および記録媒体 - Google Patents

特徴量選定装置、特徴量選定方法、身体状態推定システム、および記録媒体 Download PDF

Info

Publication number
WO2023139718A1
WO2023139718A1 PCT/JP2022/001953 JP2022001953W WO2023139718A1 WO 2023139718 A1 WO2023139718 A1 WO 2023139718A1 JP 2022001953 W JP2022001953 W JP 2022001953W WO 2023139718 A1 WO2023139718 A1 WO 2023139718A1
Authority
WO
WIPO (PCT)
Prior art keywords
unit
feature
data
values
data sets
Prior art date
Application number
PCT/JP2022/001953
Other languages
English (en)
French (fr)
Inventor
晨暉 黄
史行 二瓶
Original Assignee
日本電気株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電気株式会社 filed Critical 日本電気株式会社
Priority to PCT/JP2022/001953 priority Critical patent/WO2023139718A1/ja
Priority to JP2023574969A priority patent/JPWO2023139718A5/ja
Publication of WO2023139718A1 publication Critical patent/WO2023139718A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Definitions

  • the present disclosure relates to a feature quantity selection device or the like that selects feature quantities used for estimation.
  • IoT Internet of Things
  • IoT devices Internet of Things
  • machine learning By applying machine learning to the information collected by IoT devices, that information can be used for applications such as estimating physical conditions.
  • IoT devices are often placed in places where power supply is difficult, advanced power saving is required.
  • the proportion of power consumed for communication is large. For example, if it is possible to reduce the amount of information of the feature amount used for estimating the physical state, the amount of information transmitted from the IoT device can be reduced, and the power consumption of the IoT device can be reduced.
  • Patent Document 1 discloses a technique for reducing data that has a weak causal relationship with device abnormality prediction from sensor data collected in factories and the like.
  • Patent Literature 1 discloses a technique of reducing data with sparse causal relationships by utilizing a plurality of sparse estimation techniques.
  • Patent Document 1 mentions LASSO (Least Absolute Shrinkage and Selection Operator) regression (also called Lasso regression) as an example of the sparse estimation method.
  • LASSO Least Absolute Shrinkage and Selection Operator
  • a model that applies a plurality of sparse estimation methods and outputs a predetermined output learns the degree of application of each of the sparse estimation methods.
  • an appropriate sparsity estimation technique can be selected according to the problem, and the degree of sparsity can be adjusted for the selected sparsity estimation technique.
  • An object of the present disclosure is to provide a feature value selection device and the like that can select feature values that are highly robust against outliers and outliers.
  • a feature amount selection device includes an acquisition unit that acquires multiple data sets, a building unit that builds multiple re-extracted data sets by changing the distribution of data included in the data sets, an analysis unit that analyzes the multiple re-extracted data sets using the Lasso regression method, and aggregating the values of elements included in the multiple re-extracting data sets according to the analysis results of the multiple re-extracting data sets, and setting logical values to the elements included in the multiple re-extracting data sets according to the aggregation results of the element values.
  • a statistical unit a selection unit that selects a combination of feature amounts according to a logical value set for the element according to a preset specific rule, and an output unit that outputs selection information about the combination of the selected feature amounts.
  • a plurality of data sets are acquired, the distribution of data included in the data sets is changed to construct a plurality of re-extracted data sets, the plurality of re-extracted data sets are analyzed using the Lasso regression technique, the values of elements included in the plurality of re-extracted data sets are aggregated according to the analysis results of the plurality of re-extracted data sets, the logical values are set for the elements included in the multiple re-extracted data sets according to the aggregation results of the element values, and a predetermined specific rule is set.
  • a combination of feature amounts is selected according to the value of the logical value set to the element, and selection information regarding the combination of the selected feature amounts is output.
  • a program includes a process of acquiring multiple data sets, a process of changing the distribution of data contained in the data sets to construct multiple re-extracted data sets, a process of analyzing the multiple re-extracted data sets using the Lasso regression technique, a process of aggregating the values of elements included in the multiple re-extracted data sets according to the analysis results of the multiple re-extracted data sets, and a process of setting logical values to the elements contained in the multiple re-extracted data sets according to the results of the aggregation of the values of the elements.
  • a computer is caused to execute a process of selecting a combination of feature amounts corresponding to the value of a logical value set to an element and a process of outputting selection information about the combination of the selected feature amounts.
  • a feature quantity selection device or the like that can select a feature quantity that is highly robust against outliers and outliers.
  • FIG. 1 is a block diagram showing an example of the configuration of a feature selection device according to a first embodiment
  • FIG. FIG. 4 is a conceptual diagram for explaining a first matrix generated by the feature quantity selection device according to the first embodiment
  • FIG. 4 is a conceptual diagram for explaining a plurality of patterns of first matrices generated by the feature quantity selection device according to the first embodiment
  • FIG. 4 is a conceptual diagram for explaining aggregated values of cells of a first matrix of a plurality of patterns generated by the feature quantity selection device according to the first embodiment
  • FIG. 4 is a conceptual diagram for explaining a second matrix generated by the feature quantity selection device according to the first embodiment
  • This is an estimation example using an estimation model generated using feature values selected by a general Lasso regression method.
  • 7 is a graph for explaining the effects of outliers and outliers that may be included in sensor data measured for multiple subjects.
  • 4 is a flowchart for explaining an example of the operation of the feature selection device according to the first embodiment; 4 is a flowchart for explaining an example of the operation of the feature selection device according to the first embodiment; It is a block diagram showing an example of a configuration of a feature amount selection device according to a second embodiment.
  • FIG. 12 is a block diagram showing an example of the configuration of a feature selection device according to a fourth embodiment;
  • FIG. FIG. 21 is a block diagram showing an example of the configuration of a learning system according to a fifth embodiment;
  • FIG. FIG. 12 is a block diagram showing an example of a configuration of a learning device included in a learning system according to a fifth embodiment;
  • FIG. FIG. 11 is a conceptual diagram for explaining an example of learning by a learning device included in a learning system according to a fifth embodiment;
  • FIG. 21 is a block diagram showing an example of the configuration of a physical condition estimation system according to a sixth embodiment;
  • FIG. FIG. 11 is a block diagram showing an example of the configuration of a gait measuring device included in a physical state estimation system according to a sixth embodiment;
  • FIG. 12 is a conceptual diagram for explaining an example of arrangement of gait measuring devices included in the physical state estimation system according to the sixth embodiment
  • FIG. 11 is a conceptual diagram for explaining a coordinate system set in a gait measuring device included in a physical state estimation system according to a sixth embodiment
  • FIG. 12 is a conceptual diagram for explaining a human body plane used in the explanation of the gait measuring device included in the physical state estimation system according to the sixth embodiment
  • FIG. 11 is a conceptual diagram for explaining a walking cycle used in explaining a gait measuring device included in a physical state estimation system according to a sixth embodiment
  • FIG. 14 is a graph for explaining an example of time-series data of sensor data measured by a gait measuring device included in the physical state estimation system according to the sixth embodiment
  • FIG. 20 is a diagram for explaining an example of normalization of walking waveform data extracted from time-series data of sensor data measured by a gait measuring device included in the physical state estimation system according to the sixth embodiment
  • FIG. 11 is a conceptual diagram for explaining an example of a walking phase cluster from which feature amounts are extracted by a feature amount data generation unit of a gait measuring device included in a physical state estimation system according to a sixth embodiment
  • FIG. 12 is a block diagram showing an example of the configuration of an estimation device included in a physical state estimation system according to a sixth embodiment
  • FIG. FIG. 11 is a block diagram showing an example of estimation of a physical condition score by an estimating device included in a physical condition estimating system according to a sixth embodiment
  • FIG. 16 is a flowchart for explaining an example of the operation of a gait measuring device included in the physical state estimation system according to the sixth embodiment;
  • FIG. 16 is a flowchart for explaining an example of the operation of an estimation device included in the physical state estimation system according to the sixth embodiment;
  • FIG. 12 is a conceptual diagram for explaining an application example of the physical condition estimation system according to the sixth embodiment; It is a block diagram showing an example of hardware constitutions which perform processing concerning each embodiment.
  • the feature amount selection device of the present embodiment uses LASSO (Least Absolute Shrinkage and Selection Operator) regression (hereinafter referred to as Lasso regression) to select feature amounts to be used for estimating a physical state or the like. Lasso regression is also called L1 regularization.
  • LASSO Least Absolute Shrinkage and Selection Operator
  • the feature quantity used for estimating the physical state is extracted based on sensor data relating to the movement of the user's legs as they walk.
  • sensor data related to foot movement is measured by a measurement device installed on the footwear.
  • the measuring device includes an acceleration sensor and an angular velocity sensor.
  • sensor data is not limited to sensor data relating to leg movements, and may include features relating to gait.
  • the sensor data may be sensor data including features related to gait that are measured using motion capture, smart apparel, or the like.
  • the following method can be applied not only to the selection of feature amounts related to gaits, but also to the use of selecting feature amounts from arbitrary sensor data.
  • FIG. 1 is a block diagram showing an example of the configuration of a feature selection device 10 according to this embodiment.
  • the feature quantity selection device 10 includes an acquisition unit 11 , a construction unit 12 , an analysis unit 13 , a statistics unit 15 , a selection unit 17 and an output unit 19 .
  • the acquisition unit 11 acquires a data set used for estimating physical conditions, measured for multiple subjects.
  • a data set is data obtained by combining an explanatory variable and an objective variable corresponding to the explanatory variable.
  • a data set is data in which measured values or feature values relating to a subject are associated with the physical state of the subject.
  • the explanatory variables used for estimating the physical state are feature quantities extracted from sensor data relating to leg movements and gaits.
  • the constructing unit 12 constructs a new dataset (also called a re-extracted dataset) by changing the distribution of datasets regarding multiple subjects. For example, the constructing unit 12 constructs the re-extracted data set using a Leave-One-Subject-Out (also called LOSO) method. When using the LOSO approach, one is removed from the multiple datasets and the remaining datasets are used to construct the reconstructed dataset. When using the LOSO approach, reconstructed datasets are generated for the number of subjects. For example, if there are 50 subjects, 50 re-extracted datasets can be constructed using the LOSO approach.
  • a new dataset also called a re-extracted dataset
  • the construction unit 12 may construct the re-extracted dataset using the bootstrap method.
  • the bootstrap method estimates the properties of a population based on values randomly sampled from a sample population by sampling with replacement.
  • the bootstrap method involves iteratively generating new data sets using randomly sampled values from a sample population and calculating statistical values. For example, after 1000 iterations of generating new datasets, a re-extracted dataset of 1000 data can be constructed.
  • the analysis unit 13 executes Lasso regression on the re-extracted data set constructed by the construction unit 12 .
  • the analysis unit 13 uses a loss function represented by Equation 1 below.
  • N is the number of observations.
  • i is the observation number.
  • x i is a vector (data) of length p at observation i.
  • y i is the response data (correct value) of the observed value i.
  • is a non-negative regularization parameter (Lagrange multiplier) corresponding to one value.
  • ⁇ 0 is a scalar.
  • is a vector of length p.
  • j is a feature quantity number. If there are p feature quantities, the feature quantity number j is one of 1 to p.
  • ⁇ j correspond to the coefficients of the polynomial function (also called model parameters) used as the estimation model.
  • T indicates a transposition process.
  • the first term on the right side of Equation 1 is the term for the sum-of-squares error.
  • the second term on the right side of Equation 1 is the regularization term.
  • the regularization term is a function defined to return a larger value as the model parameter ⁇ j increases.
  • the regularization term corresponds to a penalty on the magnitude of the model parameters ⁇ j .
  • the regularization parameter ⁇ is a meta parameter set during model learning.
  • the regularization parameter ⁇ adjusts the strength of regularization (penalty).
  • the penalty of the regularization term becomes strong, and overfitting is suppressed more strongly.
  • the value of the regularization parameter ⁇ is too large, keeping the model parameters small is prioritized and the expressive power of the model decreases. As a result, too large a value of the regularization parameter ⁇ leaves a large bias.
  • Equation 2 shows the minimum value when ⁇ 0 and the coefficient vector ⁇ are variables. Equation 2 determines the magnitude of the second term (regularization term) related to the penalty according to the magnitude of the absolute value of the model parameter ⁇ j .
  • Equation 3 is a limiting condition for each element of the coefficient vector. Equation 2 above corresponds to determining the model parameter ⁇ j when the limiting condition of Equation 3 is provided for each element (model parameter ⁇ j ) of the coefficient vector ⁇ when the multiple regression coefficient vector ⁇ is determined by the least squares method.
  • the regularization parameter ⁇ has one corresponding coefficient vector ⁇ . As the regularization parameter ⁇ increases, the coefficient vector ⁇ has fewer non-zero elements. That is, as the regularization parameter ⁇ increases, the number of zero elements in the coefficient vector ⁇ increases, resulting in an increase in unnecessary features. On the other hand, when the regularization parameter ⁇ becomes smaller, the number of non-zero elements of the coefficient vector ⁇ increases and the required feature amount increases. If an appropriate regularization parameter ⁇ is set, unnecessary zero elements can be reduced while leaving nonzero elements necessary for estimation.
  • the analysis unit 13 executes Lasso regression on the re-extracted data set constructed by the construction unit 12.
  • the analysis unit 13 changes the regularization parameter ⁇ and executes Lasso regression on the re-extracted data set for each subject.
  • the analysis unit 13 generates a matrix (also referred to as a first matrix) composed of columns for the number of regularization parameters ⁇ and rows for the number of features. For example, if there are P regularization parameters ⁇ , each regularization parameter ⁇ is given a number from 1 to P (also called a ⁇ number) (P is a natural number).
  • the first matrix has rows of the number of feature values used for estimating the physical condition or the like. When the number of feature quantities is p, each feature quantity is given a number from 1 to p (also called a feature quantity number) (p is a natural number).
  • FIG. 2 is a conceptual diagram showing an example of the first matrix.
  • hatched cells indicate non-zero elements.
  • unhatched blank cells indicate zero elements.
  • FIG. 3 is an example of the first matrix generated for 50 subjects using the reconstructed data set constructed by LOSO.
  • a first matrix for each subject is generated.
  • the first matrix of 50 patterns is generated according to the number of subjects (50).
  • hatched cells indicate non-zero elements.
  • blank cells that are not hatched indicate zero elements.
  • the statistics unit 15 assigns a logical value (0, 1) to each cell of the first matrix of the generated multiple patterns.
  • the process of assigning logical values (0, 1) to each cell of the first matrix of multiple patterns generated by Lasso regression is also called first statistical process.
  • the statistical unit 15 sets non-zero elements to TRUE (1) and zero elements to FALSE (0) for the plurality of first matrices.
  • the statistic unit 15 aggregates logical values (0, 1) for each cell with respect to all first matrices.
  • the statistic unit 15 aggregates the logical values (0, 1) for each cell by adding the logical values (1) of non-zero elements for all the first matrices.
  • FIG. 4 is an example in which the aggregate value of the logical values for the first matrix of 50 subjects is entered in each cell of the matrix (also called the second matrix) corresponding to all the first matrices.
  • Each cell of the second matrix is filled with the number of non-zero elements (number of TRUEs) of the first matrix for multiple patterns.
  • the statistics unit 15 assigns a logical value (0 or 1) to each cell of the second matrix according to the total value of each cell included in all of the first matrix. If the aggregate value for each cell in the second matrix is equal to or greater than a predetermined threshold, the statistic unit 15 sets that cell to TRUE (1). On the other hand, if the aggregated value is below the predetermined threshold, the statistic unit 15 sets the cell to FALSE (0).
  • the process of totaling the logical values (0, 1) of each cell for all the first matrixes and assigning the logical value (0 or 1) according to the totaled value to each cell of the second matrix is also called second statistical processing.
  • FIG. 5 is a conceptual diagram showing an example of assigning logical values (0 or 1) to the total values in FIG.
  • cells with a total value of 49 or more in FIG. 4 are set to TRUE (1).
  • cells set to TRUE (1) by the second statistical processing are hatched.
  • cells set to FALSE (0) by the second statistical process are blank.
  • the result of the second statistical processing as shown in FIG. 5 may be displayed on a screen that the user can confirm. In that case, the user can select a desired combination of feature amounts by selecting the ⁇ number according to the result of the second statistical processing displayed on the screen.
  • the statistics unit 15 may assign a logical value corresponding to the average value of the aggregated values to each cell of the second matrix. For example, the statistic unit 15 sets TRUE(1) to cells in which the average value of the total values is equal to or greater than a predetermined threshold for each cell in the second matrix. On the other hand, the statistic unit 15 sets FALSE (0) to cells in which the average value of the total values is less than the predetermined threshold. Such processing is also included in the second statistical processing.
  • the selection unit 17 selects the ⁇ number according to preset specific rules.
  • a specific rule is a rule for determining the ⁇ number to be selected.
  • the specific rule is to select a ⁇ number whose number of cells set to TRUE (1) corresponds to a preset reference value.
  • the reference value may be set according to restrictions on the amount of calculation and the amount of communication.
  • the reference value is set to a value that does not exceed the load that can be assigned to the amount of computation and the amount of communication.
  • the reference value is set to a value that does not exceed a ratio (for example, 50 to 80%) of the load that can be assigned to the amount of computation or communication.
  • the selection unit 17 selects a combination of feature amounts in which the selected ⁇ number cell is set to TRUE (1) based on the specific rule. For example, the selection unit 17 may select a combination of feature amounts according to a reference value set by the user.
  • the output unit 19 outputs information (also referred to as selection information) regarding the feature quantity selected by the selection unit 17 .
  • the selection information is information about a combination of feature quantities used for estimating a physical condition or the like.
  • the selection information includes information indicating from which walking phase the feature amount is to be extracted in the time-series data of acceleration and angular velocity for one step cycle.
  • a gait phase indicates a gait cycle (percent) when the step cycle is normalized to 0 to 100 percent.
  • a feature amount over a plurality of consecutive walking phases may be extracted.
  • a cluster of a plurality of continuous walking phases from which feature values are extracted is also called a walking phase cluster.
  • the selection information output from the output unit 19 is used as a condition for extracting feature amounts from sensor data measured by a measuring device or the like.
  • the selection information may be stored in a storage unit (not shown) by the selection unit 17 .
  • the feature amount extracted according to the selection information is used for learning an estimation model for estimating the physical condition and the like.
  • the feature amount to be extracted is extracted from sensor data measured by a measuring device or the like worn by the user whose physical condition is to be estimated.
  • FIGS. 6 and 7 are conceptual diagrams for explaining differences in estimated values by an estimation model generated by learning using feature values selected using a general Lasso regression (comparative example) method and feature values selected using the method of this embodiment.
  • FIGS. 6 and 7 show an example of estimating TUG (Time Up and Go) test results as a subject's mobility ability. The performance of the TUG test is the time it takes to stand up from a chair, walk to a landmark 3 meters away, turn around, and sit back in the chair (also called TUG duration).
  • TUG Time Up and Go
  • Fig. 6 is an example of estimation using an estimation model generated using nine feature values selected by a general Lasso regression (comparative example) method.
  • the correlation intraclass correlation coefficient ICC Intraclass Correlation Coefficients
  • MAE Mean Absolute Error
  • FIG. 7 is an estimation example using an estimation model generated using nine feature values selected by the method of this embodiment.
  • the intra-class correlation coefficient ICC was 0.682 for the true value (measured value) and the estimated value of the TUG required time.
  • the mean absolute error MAE between the true value (measured value) and the estimated value of the TUG required time was 0.63.
  • both ICC and MAE were larger when the method of the present embodiment was used. That is, by using the method of this embodiment, the robustness against outliers and outliers is improved.
  • FIG. 8 is a graph for explaining the influence of outliers and outliers that may be included in sensor data measured for multiple subjects.
  • the data within the range enclosed by the dashed circle corresponds to outliers and outliers.
  • L1 is a regression line obtained by performing linear regression on a plurality of sensor data, including outliers and outliers.
  • L2 is a regression line obtained by arbitrarily excluding outliers and outliers and linearly regressing a plurality of sensor data.
  • the regression line L1 is affected by outliers and outliers and does not fit most of the sensor data.
  • the regression line L2 is not affected by outliers and outliers and fits most sensor data.
  • Lasso regression is performed after changing the distribution of the dataset using a method such as LOSO or the bootstrap method.
  • a method such as LOSO or the bootstrap method.
  • the above-described first statistical processing and second statistical processing are executed.
  • an average solution in which the effects of outliers and outliers are reduced is obtained.
  • FIGS. 9 and 10 are flowcharts for explaining an example of the operation of the feature selection device 10.
  • FIG. In the explanation using the flow charts of FIGS. 9 and 10, the feature quantity selection device 10 will be explained as an operator.
  • the feature quantity selection device 10 acquires N data sets (step S111).
  • the data set number corresponds to the explanatory variable (feature quantity) number (feature quantity number) included in the data set.
  • the feature quantity selection device 10 sets the feature quantity number n to 1 (step S112).
  • n is the number of the data set (feature amount).
  • the feature quantity selection device 10 excludes the data of the n-th subject (step S113).
  • the feature quantity selection device 10 executes Lasso regression on the N-1 data sets from which the data of the n-th subject is excluded (step S114).
  • the feature quantity selection device 10 executes the first statistical processing (step S115).
  • the feature quantity selection device 10 assigns a logical value to each cell of the first matrix (matrix B n ) generated by Lasso regression.
  • the feature selection device 10 sets the non-zero elements of the matrix B n to TRUE (1) and sets the zero elements of the matrix B n to FALSE (0).
  • the feature selection device 10 may set TRUE (1) to cells whose matrix B n element values are equal to or greater than the threshold T 0 , and FALSE (0) to cells whose matrix B n element values are less than the threshold T 0 .
  • the feature quantity selection device 10 increments (+1) the feature quantity number n (step S116).
  • step S117 if the feature quantity number n is smaller than the number N of data sets (Yes in step S117), the process returns to step S113. On the other hand, if the feature quantity number n is greater than or equal to the number N of data sets (No in step S117), the process proceeds to step S121 in FIG.
  • the feature quantity selection device 10 executes the second statistical processing (step S121).
  • the feature quantity selection device 10 aggregates logical values (0 or 1) for each cell with respect to all the first matrices.
  • the feature quantity selection device 10 sets a logical value (0 or 1) to each cell of the aggregated second matrix according to the relationship between the aggregate value of the logical values for each cell and a predetermined threshold value. For example, the feature quantity selection device 10 sets TRUE (1) to cells whose total value is greater than or equal to a predetermined threshold. On the other hand, the feature quantity selection device 10 sets FALSE (0) to cells whose total value is less than the predetermined threshold.
  • the feature quantity selection device 10 selects a ⁇ number based on a specific rule according to the result of the second statistical processing (step S122).
  • the feature amount selection device 10 selects a combination of feature amounts corresponding to the selected ⁇ number (step S123).
  • the feature amount selection device 10 outputs information (selection information) on the selected feature amount (step S124).
  • the selection information output from the feature quantity selection device 10 is used as conditions for extracting feature quantities from sensor data measured by a measuring device or the like.
  • the feature quantity selection device of this embodiment includes an acquisition unit, a construction unit, an analysis unit, a statistics unit, a selection unit, and an output unit.
  • the acquisition unit acquires multiple data sets.
  • the constructing unit constructs a plurality of re-extracted datasets by changing the distribution of data contained in the datasets.
  • the analysis unit analyzes multiple re-extracted data sets using the Lasso regression technique.
  • the statistical unit aggregates the values of the elements included in the plurality of re-extracted data sets according to the analysis results of the plurality of re-extracted data sets.
  • the statistical unit sets logical values to the elements included in the plurality of re-extracted data sets according to the result of counting the values of the elements.
  • the selection unit selects a combination of feature quantities according to the logical values set for the elements, according to a preset specific rule.
  • the output unit outputs selection information about the selected combination of feature amounts.
  • the analysis unit executes Lasso regression for each of a plurality of preset regularization parameters for a plurality of re-extracted datasets.
  • the analysis unit generates a first matrix of multiple patterns configured by columns corresponding to regularization parameters used in Lasso regression and rows corresponding to feature amounts.
  • the statistical unit performs a first statistical process of setting a first logical value of non-zero element cells to 1 and setting a first logical value of zero element cells to 0 for the first matrix of the plurality of patterns.
  • the statistic unit aggregates the first logical values for each cell that constitutes the first matrix of the plurality of patterns.
  • the statistical unit executes a second statistical process for generating a second matrix in which 1 is set as a second logical value to cells whose aggregated first logical values satisfy a predetermined condition, and 0 is set as a second logical value to cells whose aggregated first logical values do not satisfy the predetermined condition.
  • the selection unit selects columns of the second matrix according to a preset specific rule, and selects combinations of feature amounts corresponding to the selected columns.
  • the construction unit constructs multiple re-extracted datasets using the Leave-One-Subject-Out technique. According to this aspect, by artificially changing the data distribution using the Leave-One-Subject-Out method, the data distribution can be brought closer to the original distribution of the population.
  • the construction unit constructs multiple re-extracted datasets using the bootstrap method.
  • the data distribution can be approximated to the distribution of the population estimated from the sample group by artificially changing the data distribution using the bootstrap method.
  • the statistical unit calculates the total value of the first logical values for each cell that constitutes the first matrix of multiple patterns.
  • the statistic unit generates a second matrix in which the second logical values of cells whose total first logical values are equal to or greater than a predetermined threshold are set to 1, and the cells whose total first logical values are less than the predetermined threshold are set to 0.
  • a combination of feature amounts can be selected based on the logical values of the second matrix set according to the total value of the first logical values.
  • the statistical unit calculates the average value of the first logical values for each cell that constitutes the first matrix of multiple patterns.
  • the statistic unit generates a second matrix in which the second logical value of cells whose average first logical value is equal to or greater than a predetermined threshold is set to 1, and 0 is set to cells whose average first logical value is less than the predetermined threshold.
  • a combination of feature amounts can be selected based on the logical values of the second matrix set according to the average value of the first logical values.
  • the feature quantity selection device of the present embodiment constructs an estimation model using the feature quantity selected by the method of the first embodiment.
  • the feature amount selection device of the present embodiment selects feature amounts according to the estimation result of the constructed estimation model.
  • FIG. 11 is a block diagram showing an example of the configuration of the feature selection device 20 according to this embodiment.
  • the feature selection device 20 includes an acquisition unit 21 , a construction unit 22 , an analysis unit 23 , a statistics unit 25 , an estimation model construction unit 26 , a selection unit 27 and an output unit 29 .
  • the acquisition unit 21 has the same configuration as the acquisition unit 11 of the first embodiment. Acquisition unit 21 acquires a data set used for estimating physical conditions, measured for a plurality of subjects.
  • the construction unit 22 has the same configuration as the construction unit 12 of the first embodiment.
  • the constructing unit 22 constructs a new dataset (also called a re-extracted dataset) by changing the distribution of datasets for multiple subjects.
  • the constructing unit 22 constructs the re-extracted data set using a Leave-One-Subject-Out (also called LOSO) technique.
  • the construction unit 12 may construct the re-extracted data set using the bootstrap method.
  • the analysis unit 23 has the same configuration as the analysis unit 13 of the first embodiment.
  • the analysis unit 23 executes Lasso regression on the re-extracted data set constructed by the construction unit 22 .
  • the analysis unit 23 generates a matrix (also referred to as a first matrix) composed of columns for the number of regularization parameters ⁇ and rows for the number of features. As a result, a first matrix is generated that has as many columns as the number of varied regularization parameters ⁇ .
  • the statistic unit 25 has the same configuration as the statistic unit 15 of the first embodiment.
  • the statistical unit 25 performs a first statistical process of assigning a logical value (0, 1) to each cell of the first matrix of multiple patterns generated for each subject. In the first statistical processing, the statistical unit 25 sets non-zero elements to TRUE (1) and zero elements to FALSE (0) for the plurality of first matrices.
  • the statistical unit 25 aggregates the logical values (0, 1) for each cell with respect to all the first matrices, and performs the second statistical processing for adding the logical value (1) of non-zero elements for each cell.
  • the statistics unit 25 assigns a logical value (0 or 1) to each cell of the second matrix according to the aggregated value of each cell of the first matrix. For each cell in the second matrix, if the total value is equal to or greater than a predetermined threshold, the statistic unit 25 sets the cell to TRUE (1). On the other hand, when the total value is below the predetermined threshold, the statistic unit 25 sets the cell to FALSE (0).
  • the estimation model construction unit 26 constructs an estimation model by learning using the feature amount selected by the selection unit 27.
  • the estimation model construction unit 26 evaluates the constructed estimation model. For example, the estimation model construction unit 26 calculates evaluation indices such as mean squared error, mean absolute error, mean relative error, coefficient of determination, and correlation coefficient.
  • the estimation model construction unit 26 outputs the calculated evaluation index to the selection unit 27 .
  • the estimation model evaluation results may be displayed on a screen that the user can check. In that case, the user can select the most likely combination of feature amounts according to the evaluation results displayed on the screen.
  • the selection unit 27 selects a combination of feature quantities with the highest evaluation index calculated by the estimation model construction unit 26 .
  • the selection unit 27 may select the most likely feature amount according to an instruction input by the user.
  • the output unit 29 has the same configuration as the output unit 19 of the first embodiment.
  • the output unit 29 outputs information (also referred to as selection information) regarding the feature amount selected by the selection unit 27 .
  • the selection information output from the output unit 29 is used as a condition for extracting feature amounts from sensor data measured by a measuring device or the like.
  • the selection information may be stored in a storage unit (not shown) by the selection unit 27 .
  • the feature amount extracted according to the selection information is used for learning an estimation model for estimating the physical condition and the like.
  • the feature amount to be extracted is extracted from sensor data measured by a measuring device or the like worn by the user whose physical condition is to be estimated.
  • FIGS. 12 and 13 are flowcharts for explaining an example of the operation of the feature selection device 20.
  • FIG. In the description using the flowcharts of FIGS. 12 and 13, the feature quantity selection device 20 will be described as an operating entity.
  • the feature quantity selection device 20 acquires N data sets (step S211).
  • the data set number corresponds to the explanatory variable (feature quantity) number (feature quantity number) included in the data set.
  • the feature quantity selection device 20 sets the feature quantity number n to 1 (step S212).
  • n is the number of the data set (feature amount).
  • the feature quantity selection device 20 excludes the data of the n-th subject (step S213).
  • the feature quantity selection device 20 executes Lasso regression on the N-1 data sets from which the data of the n-th subject is excluded (step S214).
  • the feature quantity selection device 20 executes the first statistical processing (step S215).
  • the feature quantity selection device 20 assigns a logical value to each cell of the first matrix (matrix B n ) generated by Lasso regression.
  • the feature selection device 20 sets the non-zero elements of the matrix B n to TRUE (1) and sets the zero elements of the matrix B n to FALSE (0).
  • the feature selection device 20 may set TRUE (1) to cells whose matrix B n element values are equal to or greater than the threshold T 0 , and FALSE (0) to cells whose matrix B n element values are less than the threshold T 0 .
  • the feature quantity selection device 20 increments (+1) the feature quantity number n (step S216).
  • step S217 if the feature quantity number n is smaller than the number N of data sets (Yes in step S217), the process returns to step S213. On the other hand, if the feature quantity number n is greater than or equal to the number N of data sets (No in step S217), the process proceeds to step S221 in FIG.
  • the feature quantity selection device 20 executes the second statistical processing (step S221).
  • the feature quantity selection device 20 aggregates logical values (0, 1) for each cell with respect to all the first matrices.
  • the feature quantity selection device 20 assigns the sum of the aggregated logical values for each cell of the first matrix to each cell of the second matrix.
  • the feature quantity selection device 20 sets a logical value (0 or 1) to each cell of the aggregated second matrix according to the value of each cell of the second matrix. For example, the feature selection device 20 sets TRUE (1) to cells whose total value is greater than or equal to a predetermined threshold. On the other hand, the feature quantity selection device 20 sets the cells whose total value is below the predetermined threshold to FALSE (0).
  • step S222 the feature quantity selection device 20 executes model evaluation processing.
  • the model evaluation processing in step S222 will be described later (FIG. 14).
  • the feature quantity selection device 20 searches for the ⁇ number corresponding to the evaluation index obtained by the model evaluation process (step S223).
  • the feature amount selection device 20 selects a combination of feature amounts corresponding to the retrieved ⁇ numbers (step S224).
  • the feature amount selection device 20 outputs information (selection information) on the selected feature amount (step S225).
  • the selection information output from the feature quantity selection device 20 is used as conditions for extracting feature quantities from sensor data measured by a measuring device or the like.
  • FIG. 14 is a flowchart for explaining model evaluation processing.
  • the feature quantity selection device 20 will be explained as an operator.
  • the feature quantity selection device 20 sets the ⁇ number m to 1 (step S231). m is the number of the regularization parameter ⁇ .
  • the feature amount selection device 20 selects a combination of feature amounts corresponding to the ⁇ number m (step S232).
  • the feature quantity selection device 20 constructs an estimation model using the selected feature quantity (step S233).
  • the feature quantity selection device 20 evaluates the constructed estimation model (step S234).
  • the feature quantity selection device 20 outputs the evaluation index of the estimation model (step S235).
  • the feature quantity selection device 20 increments (+1) the ⁇ number m (step S236).
  • step S237 if the ⁇ number m is smaller than the number P of regularization parameters ⁇ (Yes in step S237), the process returns to step S232. On the other hand, if the ⁇ number m is greater than or equal to the number P of regularization parameters ⁇ (Yes in step S237), the process proceeds to step S223 in FIG.
  • the feature quantity selection device of the present embodiment includes an acquisition unit, construction unit, analysis unit, statistics unit, selection unit, estimation model construction unit, and output unit.
  • the acquisition unit acquires multiple data sets.
  • the constructing unit constructs a plurality of re-extracted datasets by changing the distribution of data contained in the datasets.
  • the analysis unit analyzes multiple re-extracted data sets using the Lasso regression technique.
  • the statistical unit aggregates the values of the elements included in the plurality of re-extracted data sets according to the analysis results of the plurality of re-extracted data sets.
  • the statistical unit sets logical values to the elements included in the plurality of re-extracted data sets according to the result of counting the values of the elements.
  • the selection unit selects a combination of feature quantities according to the logical values set for the elements, according to a preset specific rule.
  • the estimation model construction unit constructs an estimation model by learning using the selected feature amount, and evaluates the constructed estimation model.
  • the selection unit selects a combination of feature amounts according to the evaluation result of the estimation model.
  • the output unit outputs selection information about the selected combination of feature amounts.
  • the feature quantity is selected according to the evaluation result of the estimation model constructed using the feature quantity selected by the selection unit. Therefore, according to the present embodiment, it is possible to select a highly reliable feature amount by using the evaluation result of the estimation model.
  • the feature quantity selection apparatus of the present embodiment differs from the first embodiment in that the first statistical processing is omitted and the second statistical processing is executed on the average value of each cell regarding a plurality of first matrices.
  • FIG. 15 is a block diagram showing an example of the configuration of the feature selection device 30 according to this embodiment.
  • the feature amount selection device 30 includes an acquisition unit 31 , a construction unit 32 , an analysis unit 33 , a statistics unit 35 , a 3-selection unit 37 and an output unit 39 .
  • the acquisition unit 31 has the same configuration as the acquisition unit 11 of the first embodiment.
  • the acquisition unit 31 acquires a data set used for estimating physical conditions, which is measured for a plurality of subjects.
  • the construction unit 32 has the same configuration as the construction unit 12 of the first embodiment.
  • the constructing unit 32 constructs a new dataset (also called a re-extracted dataset) by changing the distribution of datasets for multiple subjects.
  • the constructing unit 32 constructs the re-extracted data set using a Leave-One-Subject-Out (also called LOSO) technique.
  • the construction unit 32 may construct the re-extracted data set using the bootstrap method.
  • the analysis unit 33 has the same configuration as the analysis unit 13 of the first embodiment.
  • the analysis unit 33 executes Lasso regression on the re-extracted data set constructed by the construction unit 32 .
  • the analysis unit 33 generates a matrix (also referred to as a first matrix) composed of columns for the number of regularization parameters ⁇ and rows for the number of features. As a result, a first matrix is generated that has as many columns as the number of varied regularization parameters ⁇ .
  • the statistical unit 35 calculates the average value of each cell for the first matrix of multiple patterns generated for each subject.
  • the statistics unit 35 generates a second matrix in which an average value of each cell is assigned to each cell of the first matrix of multiple patterns. For example, the statistic unit 35 sets TRUE(1) to cells in which the average value of the total values is equal to or greater than a predetermined threshold for each cell in the second matrix. On the other hand, the statistics unit 35 sets FALSE (0) to cells in which the average value of the aggregated values is less than the predetermined threshold. This processing is included in the second statistical processing.
  • the selection unit 37 has the same configuration as the selection unit 17 of the first embodiment.
  • the selection unit 17 selects a ⁇ number based on a preset specific rule.
  • the selection unit 17 selects a combination of feature amounts in which the selected ⁇ number cell is set to TRUE (1) based on the specific rule.
  • the output unit 39 has the same configuration as the output unit 19 of the first embodiment.
  • the output unit 39 outputs information (also referred to as selection information) regarding the feature amount selected by the selection unit 27 .
  • the selection information output from the output unit 39 is used as conditions for extracting feature amounts from sensor data measured by a measuring device or the like.
  • the selection information may be stored in a storage unit (not shown) by the selection unit 37 .
  • the feature amount extracted according to the selection information is used for learning an estimation model for estimating the physical condition and the like.
  • the feature amount to be extracted is extracted from sensor data measured by a measuring device or the like worn by the user whose physical condition is to be estimated.
  • FIGS. 16 and 17 are flowcharts for explaining an example of the operation of the feature selection device 30.
  • FIG. In the description using the flowcharts of FIGS. 16 and 17, the feature quantity selection device 30 will be described as an operating body.
  • the feature quantity selection device 30 acquires N data sets (step S311).
  • the data set number corresponds to the explanatory variable (feature quantity) number (feature quantity number) included in the data set.
  • the feature quantity selection device 30 sets the feature quantity number n to 1 (step S312).
  • n is the number of the data set (feature quantity).
  • the feature quantity selection device 30 excludes the data of the n-th subject (step S313).
  • the feature quantity selection device 30 executes Lasso regression on the N-1 data sets from which the data of the n-th subject is excluded (step S314).
  • the feature quantity selection device 30 increments (+1) the feature quantity number n (step S315).
  • step S316 if the feature quantity number n is smaller than the number N of data sets (Yes in step S316), the process returns to step S313. On the other hand, if the feature quantity number n is greater than or equal to the number N of data sets (No in step S316), the process proceeds to step S321 in FIG.
  • the feature quantity selection device 30 executes the second statistical processing (step S321).
  • the feature quantity selection device 30 As the first stage of the second statistical processing, the feature quantity selection device 30 generates a second matrix in which the average value of each cell is assigned to each cell of the first matrix of multiple patterns generated for each subject.
  • the feature quantity selection device 30 sets logical values (0, 1) for each cell with respect to the generated second matrix as the second statistical processing. For example, the feature quantity selection device 30 sets TRUE (1) to cells in which the average value of the total values is equal to or greater than a predetermined threshold value for each cell of the second matrix.
  • the feature quantity selection device 30 sets FALSE (0) to cells in which the average value of the total values is less than the predetermined threshold.
  • the feature quantity selection device 30 selects a ⁇ number based on a specific rule according to the result of the second statistical processing (step S322).
  • the feature amount selection device 30 selects a combination of feature amounts corresponding to the selected ⁇ number (step S323).
  • the feature amount selection device 30 outputs information (selection information) on the selected feature amount (step S324).
  • the selection information output from the feature quantity selection device 30 is used as conditions for extracting feature quantities from sensor data measured by a measuring device or the like.
  • the feature quantity selection device of this embodiment includes an acquisition unit, a construction unit, an analysis unit, a statistics unit, a selection unit, and an output unit.
  • the acquisition unit acquires multiple data sets.
  • the constructing unit constructs a plurality of re-extracted datasets by changing the distribution of data contained in the datasets.
  • the analysis unit analyzes multiple re-extracted data sets using the Lasso regression technique.
  • the statistical unit aggregates the values of the elements included in the plurality of re-extracted data sets according to the analysis results of the plurality of re-extracted data sets.
  • the statistical unit sets logical values to the elements included in the plurality of re-extracted data sets according to the result of counting the values of the elements.
  • the selection unit selects a combination of feature quantities according to the logical values set for the elements, according to a preset specific rule.
  • the output unit outputs selection information about the selected combination of feature amounts.
  • the analysis unit executes Lasso regression for each of a plurality of preset regularization parameters for each of the plurality of re-extracted data sets.
  • the analysis unit generates a first matrix of multiple patterns configured by columns corresponding to regularization parameters used in Lasso regression and rows corresponding to feature amounts.
  • the statistical unit aggregates element values for each cell that constitutes the first matrix of the plurality of patterns.
  • the statistic unit performs a second statistical process of generating a second matrix in which 1 is set as a second logical value to cells in which the average element value is equal to or greater than a predetermined threshold, and 0 is set as a second logical value to cells in which the average element value is less than the predetermined threshold.
  • the selection unit selects columns of the second matrix according to a preset specific rule, and selects combinations of feature amounts corresponding to the selected columns.
  • the feature quantity selection device of this embodiment has a simplified configuration of the feature quantity selection devices of the first to third embodiments.
  • FIG. 18 is a block diagram showing an example of the configuration of the feature selection device 40 according to this embodiment.
  • the feature quantity selection device 40 includes an acquisition unit 41 , a construction unit 42 , an analysis unit 43 , a statistics unit 45 , a selection unit 47 and an output unit 49 .
  • the acquisition unit 41 acquires multiple data sets.
  • the constructing unit 42 constructs a plurality of re-extracted datasets by changing the distribution of data included in the datasets.
  • the analysis unit 43 analyzes a plurality of re-extracted data sets using the Lasso regression technique.
  • the statistics unit 45 aggregates the values of the elements included in the plurality of re-extracted data sets according to the analysis results of the plurality of re-extracted data sets.
  • the statistics unit 45 sets logical values to the elements included in the plurality of re-extracted data sets according to the results of counting the values of the elements.
  • the selection unit 47 selects a combination of feature amounts according to the values of the logical values set to the elements according to a preset specific rule.
  • the output unit 49 outputs selection information regarding the selected combination of feature amounts.
  • the learning system of this embodiment executes learning using the feature values selected by the feature value selection devices of the first to fourth embodiments.
  • FIG. 19 is a block diagram showing an example of the configuration of the learning system 5 according to this embodiment.
  • the learning system 5 includes a gait measuring device 50 and a learning device 55 .
  • the gait measuring device 50 and the learning device 55 may be wired or wirelessly connected.
  • the gait measuring device 50 and the learning device 55 may be configured as a single device.
  • the learning system 5 may be configured by only the learning device 55 by excluding the gait measuring device 50 from the configuration of the learning system 5 .
  • the learning device 55 may be configured to perform learning using feature amount data that is not connected to the gait measuring device 50 and that is generated in advance by the gait measuring device 50 and stored in a database.
  • the gait measuring device 50 is installed on at least one of the left and right feet.
  • the gait measuring device 50 has the same configuration as the gait measuring device 50 of the first embodiment.
  • Gait measuring device 50 includes an acceleration sensor and an angular velocity sensor.
  • the gait measuring device 50 converts the measured physical quantity into digital data (also called sensor data).
  • the gait measuring device 50 generates normalized gait waveform data for one step cycle from time-series data of sensor data.
  • the gait measuring device 50 generates feature amount data used for estimating the physical condition.
  • the gait measuring device 50 transmits the generated feature amount data to the learning device 55 .
  • the gait measuring device 50 may be configured to transmit feature amount data to a database (not shown) accessed by the learning device 55 .
  • the feature amount data accumulated in the database is used for learning by the learning device 55 .
  • the learning device 55 receives feature amount data from the gait measuring device 50 .
  • the feature quantity data received by the learning device 55 includes the feature quantities selected by the feature quantity selection devices of the first to fourth embodiments.
  • the learning device 55 receives the feature amount data from the database.
  • the learning device 55 performs learning using the received feature amount data. For example, the learning device 55 learns teacher data using feature amount data extracted from walking waveform data of a plurality of subjects as explanatory variables and values relating to physical conditions according to the feature amount data as objective variables.
  • the learning algorithm executed by the learning device 55 is not particularly limited.
  • the learning device 55 generates an estimated model trained using teacher data regarding a plurality of subjects.
  • the learning device 55 stores the generated estimation model.
  • the estimation model learned by the learning device 55 may be stored in a storage device external to the learning device 55 .
  • FIG. 20 is a block diagram showing an example of the detailed configuration of the learning device 55. As shown in FIG. The learning device 55 has a receiving section 551 , a learning section 553 and a storage section 555 .
  • the receiving unit 551 receives feature amount data from the gait measuring device 50 .
  • the receiving unit 551 outputs the received feature amount data to the learning unit 553 .
  • the receiving unit 551 may receive the feature amount data from the gait measurement device 50 via a cable such as a cable, or may receive the feature amount data from the gait measurement device 50 via wireless communication.
  • the receiving unit 551 is configured to receive feature amount data from the gait measuring device 50 via a wireless communication function (not shown) conforming to standards such as Bluetooth (registered trademark) and WiFi (registered trademark).
  • the communication function of the receiving unit 551 may conform to standards other than Bluetooth (registered trademark) and WiFi (registered trademark).
  • the learning unit 553 acquires feature amount data from the receiving unit 551 .
  • the learning unit 553 performs learning using the acquired feature amount data.
  • the learning unit 553 learns, as teaching data, a data set in which feature amount data extracted regarding the subject's gait is used as an explanatory variable and the subject's physical state is used as an objective variable.
  • the learning unit 553 learns physical conditions such as grip strength, whole-body muscle strength, lower-limb muscle strength, mobility, dynamic balance, static balance, and the like of the subject.
  • the learning unit 553 generates an estimation model for estimating the physical state according to input of feature amount data learned about a plurality of users.
  • the learning unit 553 uses explanatory variables including attribute data such as gender, age, height, and weight to generate an estimation model that performs estimation according to attributes.
  • the learning unit 553 causes the storage unit 555 to store the estimated models learned for the plurality of subjects.
  • the learning unit 553 performs learning using a linear regression algorithm.
  • the learning unit 553 performs learning using a Support Vector Machine (SVM) algorithm.
  • the learning unit 553 performs learning using a Gaussian Process Regression (GPR) algorithm.
  • the learning unit 553 performs learning using a random forest (RF) algorithm.
  • the learning unit 553 may perform unsupervised learning for classifying subjects who generated the feature amount data according to the feature amount data.
  • a learning algorithm executed by the learning unit 553 is not particularly limited.
  • the learning unit 553 may perform learning using the walking waveform data (sensor data) for one step cycle as explanatory variables. For example, the learning unit 553 performs supervised learning using walking waveform data of acceleration in three-axis directions, angular velocity about three axes, and angle (posture angle) about three axes as explanatory variables, and correct values of the body state to be estimated as objective variables.
  • FIG. 21 is a conceptual diagram for explaining learning for generating an estimation model.
  • FIG. 21 is a conceptual diagram showing an example of learning by the learning unit 553 using a data set of feature values F1 to Fn, which are explanatory variables, and scores relating to physical conditions, which are objective variables, as teacher data.
  • the learning unit 553 learns data about a plurality of subjects, and generates an estimation model that outputs an output (estimated value) regarding the subject's physical condition according to the input of the feature amount extracted from the sensor data.
  • the storage unit 555 stores estimated models learned for a plurality of subjects.
  • the storage unit 555 stores an estimation model for estimating the physical condition learned for a plurality of subjects.
  • the estimation model stored in the storage unit 555 is used for body condition estimation by a body condition estimation system according to a sixth embodiment, which will be described later.
  • the learning system of this embodiment includes a gait measuring device and a learning device.
  • a gait measuring device acquires time-series data of sensor data relating to leg movements.
  • the gait measuring device extracts walking waveform data for one step cycle from time-series data of sensor data, and normalizes the extracted walking waveform data.
  • the gait measuring device extracts a feature amount related to the body state of an estimation target from the normalized walking waveform data.
  • the gait measuring device extracts feature quantities selected by the feature quantity selecting devices of the first to fourth embodiments.
  • the gait measuring device generates feature amount data including the extracted feature amount.
  • the gait measuring device outputs the generated feature amount data to the learning device.
  • the learning device has a receiving unit, a learning unit, and a storage unit.
  • the receiving unit acquires feature amount data generated by the gait measuring device.
  • the learning unit performs learning using the feature amount data.
  • the learning unit generates an estimation model that outputs a physical state according to an input of feature values extracted from time-series data of sensor data measured as the user walks.
  • the estimation model generated by the learning unit is stored in the storage unit.
  • the learning system of this embodiment uses the feature amount data measured by the gait measuring device to generate an estimation model.
  • the learning system of this embodiment executes learning using the feature values selected by the feature value selection devices of the first to fourth embodiments. Therefore, according to this aspect, it is possible to generate an estimation model that enables appropriate estimation of the physical condition in daily life using highly robust feature values.
  • the physical state estimation system of this embodiment measures sensor data related to the movement of the user's feet as they walk.
  • the physical condition estimation system of the present embodiment uses the measured sensor data to estimate the physical condition of the user.
  • the physical condition estimation system of the present embodiment estimates muscle strength indices such as grip strength and knee extension strength, dynamic balance, leg muscle strength, mobility, static balance, and the like, as physical conditions.
  • the sensor data may be sensor data including features related to gait that are measured using motion capture, smart apparel, or the like.
  • FIG. 22 is a block diagram showing an example of the configuration of the physical state estimation system 6 according to this embodiment.
  • the physical state estimation system 6 includes a gait measurement device 60 and an estimation device 63 .
  • the gait measuring device 60 and the estimating device 63 are configured as separate hardware will be described.
  • the gait measuring device 60 is installed on footwear or the like of a subject (user) whose body condition is to be estimated.
  • the function of the estimation device 63 is installed in a mobile terminal carried by a subject (user).
  • the configurations of the gait measuring device 60 and the estimating device 63 will be individually described below.
  • FIG. 23 is a block diagram showing an example of the configuration of the gait measuring device 60.
  • the gait measuring device 60 has a sensor 61 and a feature quantity data generator 62 .
  • the sensor 61 and the feature amount data generation unit 62 are integrated will be given.
  • the sensor 61 and feature amount data generator 62 may be provided as separate devices.
  • the sensor 61 has an acceleration sensor 611 and an angular velocity sensor 612.
  • FIG. 23 shows an example in which the sensor 61 includes an acceleration sensor 611 and an angular velocity sensor 612 .
  • Sensors 61 may include sensors other than acceleration sensor 611 and angular velocity sensor 612 . Description of sensors other than the acceleration sensor 611 and the angular velocity sensor 612 that may be included in the sensor 61 is omitted.
  • the acceleration sensor 611 is a sensor that measures acceleration in three axial directions (also called spatial acceleration).
  • the acceleration sensor 611 measures acceleration (also referred to as spatial acceleration) as a physical quantity related to foot movement.
  • the acceleration sensor 611 outputs the measured acceleration to the feature quantity data generator 62 .
  • the acceleration sensor 611 can be a sensor of a piezoelectric type, a piezoresistive type, a capacitive type, or the like. As long as the sensor used as the acceleration sensor 611 can measure acceleration, the measurement method is not limited.
  • the angular velocity sensor 612 is a sensor that measures angular velocities around three axes (also called spatial angular velocities).
  • the angular velocity sensor 612 measures angular velocity (also called spatial angular velocity) as a physical quantity related to foot movement.
  • the angular velocity sensor 612 outputs the measured angular velocity to the feature amount data generator 62 .
  • the angular velocity sensor 612 can be a vibration type sensor or a capacitance type sensor. As long as the sensor used as the angular velocity sensor 612 can measure the angular velocity, the measurement method is not limited.
  • the sensor 61 is realized, for example, by an inertial measurement device that measures acceleration and angular velocity.
  • An example of an inertial measurement device is an IMU (Inertial Measurement Unit).
  • the IMU includes an acceleration sensor 611 that measures acceleration along three axes and an angular velocity sensor 612 that measures angular velocity around three axes.
  • the sensor 61 may be implemented by an inertial measurement device such as VG (Vertical Gyro) or AHRS (Attitude Heading).
  • the sensor 61 may be realized by GPS/INS (Global Positioning System/Inertial Navigation System).
  • the sensor 61 may be implemented by a device other than an inertial measurement device as long as it can measure physical quantities related to foot movement.
  • FIG. 24 is a conceptual diagram showing an example in which the gait measuring device 60 is arranged in the shoe 600 of the right foot.
  • the gait measuring device 60 is installed at a position corresponding to the back side of the arch.
  • the gait measuring device 60 is placed on an insole that is inserted into the shoe 600 .
  • the gait measuring device 60 may be arranged on the bottom surface of the shoe 600 .
  • the gait measuring device 60 may be embedded in the body of the shoe 600 .
  • the gait measuring device 60 may be detachable from the shoe 600 or may not be detachable from the shoe 600 .
  • the gait measuring device 60 may be installed at a position other than the back side of the arch as long as it can measure sensor data relating to the movement of the foot. Also, the gait measuring device 60 may be installed on a sock worn by the user or an accessory such as an anklet worn by the user. Also, the gait measuring device 60 may be attached directly to the foot or embedded in the foot. FIG. 24 shows an example in which the gait measuring device 60 is installed on the shoe 600 of the right foot. The gait measuring device 60 may be installed on the shoes 600 of both feet.
  • a local coordinate system including the x-axis in the horizontal direction, the y-axis in the front-back direction, and the z-axis in the vertical direction is set with the gait measuring device 60 (sensor 61) as a reference.
  • the x-axis is positive to the left
  • the y-axis is positive to the rear
  • the z-axis is positive to the top.
  • the directions of the axes set in the sensors 61 may be the same for the left and right feet, or may be different for the left and right feet.
  • the vertical directions (Z-axis direction) of the sensors 61 placed in the left and right shoes 600 are the same.
  • the three axes of the local coordinate system set in the sensor data derived from the left leg and the three axes of the local coordinate system set in the sensor data derived from the right leg are the same on the left and right.
  • FIG. 25 is a conceptual diagram for explaining the local coordinate system (x-axis, y-axis, z-axis) set in the gait measuring device 60 (sensor 61) installed on the back side of the foot arch and the world coordinate system (X-axis, Y-axis, Z-axis) set with respect to the ground.
  • the world coordinate system X-axis, Y-axis, Z-axis
  • the user's lateral direction is set to the X-axis direction (leftward is positive)
  • the user's back direction is set to the Y-axis direction (rearward is positive)
  • the direction of gravity is set to the Z-axis direction (vertically upward is positive) when the user is standing upright facing the direction of travel. Note that the example in FIG.
  • 25 conceptually shows the relationship between the local coordinate system (x-axis, y-axis, z-axis) and the world coordinate system (X-axis, Y-axis, Z-axis), and does not accurately show the relationship between the local coordinate system and the world coordinate system, which fluctuate according to the user's walking.
  • FIG. 26 is a conceptual diagram for explaining a plane set for the human body (also called a human body plane).
  • a sagittal plane that divides the body left and right a coronal plane that divides the body front and back, and a horizontal plane that divides the body horizontally are defined.
  • the world coordinate system and the local coordinate system coincide with each other in a state in which the center line of the foot is directed in the direction of travel.
  • rotation in the sagittal plane with the x-axis as the rotation axis is defined as roll
  • rotation in the coronal plane with the y-axis as the rotation axis is defined as pitch
  • rotation in the horizontal plane with the z-axis as the rotation axis is defined as yaw
  • the rotation angle in the sagittal plane with the x-axis as the rotation axis is defined as the roll angle
  • the rotation angle in the coronal plane with the y-axis as the rotation axis is defined as the pitch angle
  • the rotation angle in the horizontal plane with the z-axis as the rotation axis is defined as the yaw angle.
  • the feature amount data generation unit 62 (also called a feature amount data generation device) has an acquisition unit 621, a normalization unit 622, an extraction unit 623, a generation unit 625, and a feature amount data output unit 627.
  • the feature amount data generator 62 is implemented by a microcomputer or microcontroller that performs overall control and data processing of the gait measuring device 60 .
  • the feature amount data generator 62 has a CPU (Central Processing Unit), RAM (Random Access Memory), ROM (Read Only Memory), flash memory, and the like.
  • the feature amount data generator 62 controls the acceleration sensor 611 and the angular velocity sensor 612 to measure angular velocity and acceleration.
  • the feature amount data generator 62 may be mounted on the side of a mobile terminal (not shown) carried by the subject (user).
  • the acquisition unit 621 acquires acceleration in three axial directions from the acceleration sensor 611 . Also, the acquisition unit 621 acquires angular velocities around the three axes from the angular velocity sensor 612 . For example, the acquisition unit 621 performs AD conversion (Analog-to-Digital Conversion) on physical quantities (analog data) such as the acquired angular velocity and acceleration. The physical quantities (analog data) measured by acceleration sensor 611 and angular velocity sensor 612 may be converted into digital data by acceleration sensor 611 and angular velocity sensor 612, respectively. The acquisition unit 621 outputs converted digital data (also referred to as sensor data) to the normalization unit 622 . The acquisition unit 621 may be configured to store sensor data in a storage unit (not shown).
  • the sensor data includes at least acceleration data converted into digital data and angular velocity data converted into digital data.
  • the acceleration data includes acceleration vectors in three axial directions.
  • the angular velocity data includes angular velocity vectors around three axes. Acceleration data and angular velocity data are associated with acquisition times of those data. Further, the acquisition unit 621 may apply corrections such as mounting error correction, temperature correction, and linearity correction to the acceleration data and the angular velocity data.
  • the normalization unit 622 acquires sensor data from the acquisition unit 621.
  • the normalization unit 622 extracts time-series data (also referred to as walking waveform data) for one step cycle from the time-series data of the acceleration in the three-axis direction and the angular velocity around the three axes included in the sensor data.
  • the normalization unit 622 normalizes (also referred to as first normalization) the time of the extracted walking waveform data for one step cycle to a walking cycle of 0 to 100% (percentage). Timings such as 1% and 10% included in the 0-100% walking cycle are also called walking phases.
  • the normalization unit 622 normalizes (also referred to as second normalization) the walking waveform data for the first normalized step cycle so that the stance phase is 60% and the swing phase is 40%.
  • the stance phase is the period during which at least part of the sole of the foot is in contact with the ground.
  • the swing phase is the period during which the sole of the foot is off the ground.
  • FIG. 27 is a conceptual diagram for explaining the step cycle based on the right foot.
  • the step cycle based on the left foot is also the same as the right foot.
  • the horizontal axis of FIG. 27 represents one gait cycle of the right foot starting when the heel of the right foot lands on the ground and ending when the heel of the right foot lands on the ground.
  • the horizontal axis of FIG. 27 is first normalized with the stride period as 100%.
  • the horizontal axis in FIG. 27 is second normalized so that the stance phase is 60% and the swing phase is 40%.
  • One walking cycle of one leg is roughly divided into a stance phase in which at least part of the sole of the foot is in contact with the ground, and a swing phase in which the sole of the foot is separated from the ground.
  • the stance phase is further subdivided into a load response period T1, a middle stance period T2, a final stance period T3, and an early swing period T4.
  • the swing phase is further subdivided into early swing phase T5, middle swing phase T6, and final swing phase T7.
  • FIG. 27 is an example, and does not limit the periods constituting the one-step cycle, the names of these periods, and the like.
  • E1 represents an event (heel contact) in which the heel of the right foot touches the ground (HC: Heel Contact).
  • E2 represents an event in which the toe of the left foot leaves the ground while the sole of the right foot is in contact with the ground (OTO: Opposite Toe Off).
  • E3 represents an event (heel rise) in which the heel of the right foot is lifted while the sole of the right foot is in contact with the ground (HR: Heel Rise).
  • E4 is an event in which the heel of the left foot touches the ground (opposite heel strike) (OHS: Opposite Heel Strike).
  • E5 represents an event (toe off) in which the toe of the right foot leaves the ground while the sole of the left foot is in contact with the ground (TO: Toe Off).
  • E6 represents an event (Foot Adjacent) in which the left foot and the right foot cross each other while the sole of the left foot is in contact with the ground (FA: Foot Adjacent).
  • E7 represents an event (tibia vertical) in which the tibia of the right foot becomes almost vertical to the ground while the sole of the left foot is in contact with the ground (TV: Tibia Vertical).
  • E8 represents an event (heel contact) in which the heel of the right foot touches the ground (HC: Heel Contact).
  • E8 corresponds to the end point of the walking cycle starting from E1 and the starting point of the next walking cycle. Note that FIG. 27 is an example, and does not limit the events that occur during walking and the names of those events.
  • FIG. 28 is a diagram for explaining an example of detecting heel contact HC and toe off TO from time-series data (solid line) of traveling direction acceleration (Y-direction acceleration).
  • the timing of heel contact HC is the timing of the minimum peak immediately after the maximum peak appearing in the time-series data of traveling direction acceleration (Y-direction acceleration).
  • the maximum peak that marks the timing of heel contact HC corresponds to the maximum peak of the walking waveform data for one step cycle.
  • the interval between successive heel strikes HC is the stride period.
  • the timing of the toe-off TO is the timing of the rise of the maximum peak that appears after the period of the stance phase in which no change appears in the time-series data of the acceleration in the traveling direction (the Y-direction acceleration).
  • time-series data (dashed line) of the roll angle (angular velocity around the X-axis).
  • the midpoint timing between the timing when the roll angle is minimum and the timing when the roll angle is maximum corresponds to the middle stage of stance.
  • parameters also called gait parameters
  • walking speed stride length
  • circumcision internal rotation/external rotation
  • plantarflexion/dorsiflexion etc.
  • FIG. 29 is a diagram for explaining an example of walking waveform data normalized by the normalization unit 622.
  • the normalization unit 622 detects heel contact HC and toe off TO from the time-series data of traveling direction acceleration (Y-direction acceleration).
  • the normalization unit 622 extracts the interval between consecutive heel strikes HC as walking waveform data for one step cycle.
  • the normalization unit 622 converts the horizontal axis (time axis) of the walking waveform data for one step cycle into a walking cycle of 0 to 100% by the first normalization.
  • the walking waveform data after the first normalization is indicated by a dashed line.
  • the timing of the toe take-off TO deviates from 60%.
  • the normalization unit 622 normalizes the section from the heel contact HC at 0% in the walking phase to the toe-off TO following the heel contact HC to 0-60%. Further, the normalization unit 622 normalizes the section from the toe-off TO to the heel-contact HC in which the walking phase subsequent to the toe-off TO is 100% to 60% to 100%.
  • the gait waveform data for one step cycle is normalized into a section of 0 to 60% of the gait cycle (stance phase) and a section of 60 to 100% of the gait cycle (swing phase).
  • the walking waveform data after the second normalization is indicated by a solid line. In the second normalized walking waveform data (solid line), the timing of the toe take-off TO coincides with 60%.
  • Figures 28 and 29 show an example of extracting/normalizing the walking waveform data for one step cycle based on the traveling direction acceleration (Y-direction acceleration).
  • the normalization unit 622 extracts/normalizes walking waveform data for one step cycle in accordance with the walking cycle of the traveling direction acceleration (Y direction acceleration).
  • the normalization unit 622 may also generate time-series data of angles about three axes by integrating time-series data of angular velocities about three axes.
  • the normalization unit 622 also extracts/normalizes the walking waveform data for the one-step cycle in accordance with the walking cycle of the acceleration in the direction of travel (acceleration in the Y direction) with respect to the angles around the three axes.
  • the normalization unit 622 may extract/normalize the walking waveform data for one step cycle based on the acceleration/angular velocity other than the traveling direction acceleration (Y-direction acceleration) (not shown). For example, the normalization unit 622 may detect heel contact HC and toe off TO from time series data of vertical direction acceleration (Z direction acceleration).
  • the timing of the heel contact HC is the timing of a sharp minimum peak appearing in the time-series data of vertical acceleration (Z-direction acceleration). At the timing of the sharp minimum peak, the value of the vertical acceleration (Z-direction acceleration) becomes almost zero.
  • the minimum peak that marks the timing of heel contact HC corresponds to the minimum peak of walking waveform data for one step cycle.
  • the interval between successive heel strikes HC is the stride period.
  • the timing of the toe-off TO is the timing of the inflection point in the middle of the time-series data of the vertical acceleration (Z-direction acceleration) gradually increasing after passing through a section with small fluctuations after the maximum peak immediately after the heel contact HC.
  • the normalization unit 622 may extract/normalize the walking waveform data for one step cycle based on both the traveling direction acceleration (Y direction acceleration) and the vertical direction acceleration (Z direction acceleration). Further, the normalization unit 622 may extract/normalize the walking waveform data for one step cycle based on acceleration, angular velocity, angle, etc. other than the traveling direction acceleration (Y direction acceleration) and vertical direction acceleration (Z direction acceleration).
  • the extraction unit 623 acquires the walking waveform data for the one-step cycle normalized by the normalization unit 622 .
  • the extraction unit 623 extracts a feature amount used for estimating the physical condition from the walking waveform data for one step cycle.
  • the extraction unit 623 extracts a feature amount for each walking phase cluster from walking phase clusters obtained by integrating temporally continuous walking phases based on preset conditions.
  • a walking phase cluster includes at least one walking phase.
  • a gait phase cluster also includes a single gait phase. The walking waveform data and the walking phase from which the feature amount used for estimating the physical condition is extracted will be described later.
  • FIG. 30 is a conceptual diagram for explaining extraction of a feature amount for estimating a physical condition from walking waveform data for one step cycle.
  • the extraction unit 623 extracts temporally consecutive walking phases I to I+m as a walking phase cluster C (I and m are natural numbers).
  • the walking phase cluster C includes m walking phases (components). That is, the number of walking phases (constituent elements) constituting the walking phase cluster C (also referred to as the number of constituent elements) is m.
  • FIG. 30 shows an example in which the walking phase is an integer value, the walking phase may be subdivided to decimal places.
  • the number of constituent elements of the walking phase cluster C is a number corresponding to the number of data points in the section of the walking phase cluster.
  • the extraction unit 623 extracts feature amounts from each of the walking phases I to I+m.
  • the extraction unit 623 extracts the feature quantity from the single walking phase J (J is a natural number).
  • the generation unit 625 applies the feature amount constitutive formula to the feature amount (first feature amount) extracted from each of the walking phases that make up the walking phase cluster, and generates the feature amount (second feature amount) of the walking phase cluster.
  • the feature quantity constitutive formula is a calculation formula set in advance to generate the feature quantity of the walking phase cluster.
  • the feature quantity configuration formula is a calculation formula regarding the four arithmetic operations.
  • the second feature amount calculated using the feature amount construction formula is the integral average value, arithmetic average value, inclination, variation, etc. of the first feature amount in each walking phase included in the walking phase cluster.
  • the generation unit 625 applies a calculation formula for calculating the slope and variation of the first feature amount extracted from each of the walking phases forming the walking phase cluster as the feature amount configuration formula. For example, if the walking phase cluster is composed of a single walking phase, the inclination and the variation cannot be calculated, so a feature value constitutive formula that calculates an integral average value or an arithmetic average value may be used.
  • the feature amount data output unit 627 outputs feature amount data for each walking phase cluster generated by the generation unit 625 .
  • the feature amount data output unit 627 outputs the feature amount data of the generated walking phase cluster to the estimation device 63 that uses the feature amount data.
  • FIG. 31 is a block diagram showing an example of the configuration of the estimation device 63. As shown in FIG. The estimation device 63 has a data acquisition section 631 , a storage section 632 , an estimation section 633 and an output section 635 .
  • the data acquisition unit 631 acquires feature amount data from the gait measurement device 60 .
  • the data acquisition unit 631 outputs the received feature amount data to the estimation unit 633 .
  • the data acquisition unit 631 may receive the feature amount data from the gait measurement device 60 via a cable such as a cable, or may receive the feature amount data from the gait measurement device 60 via wireless communication.
  • the data acquisition unit 631 is configured to receive feature amount data from the gait measurement device 60 via a wireless communication function (not shown) conforming to standards such as Bluetooth (registered trademark) and WiFi (registered trademark).
  • the communication function of the data acquisition unit 631 may conform to standards other than Bluetooth (registered trademark) and WiFi (registered trademark).
  • the storage unit 632 stores an estimation model for estimating the physical condition using the feature amount data extracted from the walking waveform data.
  • the storage unit 632 stores feature amount data relating to physical conditions of a plurality of subjects and an estimation model that has learned the relationship between the physical conditions.
  • the storage unit 632 stores an estimation model for estimating the physical condition learned for a plurality of subjects.
  • the storage unit 632 may store estimation models according to attributes.
  • the estimation model may be stored in the storage unit 632 at times such as when the product is shipped from the factory or during calibration before the user uses the physical condition estimation system 6 .
  • an estimation model stored in a storage device such as an external server may be used.
  • the estimated model may be used via an interface (not shown) connected to the storage device.
  • the estimation unit 633 acquires feature amount data from the data acquisition unit 631 .
  • the estimation unit 633 estimates the physical state using the acquired feature amount data.
  • the estimation unit 633 inputs the feature amount data to the estimation model stored in the storage unit 632 .
  • the estimation unit 633 outputs an estimation result according to the physical condition output from the estimation model.
  • the estimating unit 633 uses the estimated model via an interface (not shown) connected to the storage device.
  • the output unit 635 outputs the estimation result of the physical condition by the estimation unit 633 .
  • the output unit 635 displays the estimation result of the physical condition on the screen of the subject's (user's) mobile terminal.
  • the output unit 635 outputs the estimation result to an external system or the like that uses the estimation result. No particular limitation is imposed on the use of the physical condition output from the estimating device 63 .
  • the estimation device 63 is connected to an external system built on a cloud or server via a mobile terminal (not shown) carried by the subject (user).
  • a mobile terminal (not shown) is a portable communication device.
  • the mobile terminal is a mobile communication device having a communication function such as a smart phone, a smart watch, or a mobile phone.
  • the estimating device 63 is connected to the mobile terminal via a wire such as a cable.
  • the estimating device 63 is connected to the mobile terminal via wireless communication.
  • the estimating device 63 is connected to the mobile terminal via a wireless communication function (not shown) conforming to standards such as Bluetooth (registered trademark) and WiFi (registered trademark).
  • the communication function of the estimation device 63 may conform to standards other than Bluetooth (registered trademark) and WiFi (registered trademark).
  • the body state estimation result may be used by an application installed on the mobile terminal. In that case, the mobile terminal executes processing using the estimation result by application software or the like installed in the mobile terminal.
  • FIG. 32 is a conceptual diagram showing an example in which the learning system of the fifth embodiment inputs the feature quantities F1 to Fn extracted from the sensor data measured as the user walks into the estimation model 651 pre-built for estimating the physical condition, and outputs a score regarding the physical condition.
  • the estimation model 651 outputs a physical condition score according to the input of the feature quantities F1 to Fn.
  • the estimation model 651 is generated by learning using teacher data with the physical condition as the objective variable and the feature quantities F1 to Fn used for estimating the physical condition as explanatory variables.
  • the estimation result of the estimation model 651 is not limited as long as the estimation result related to the physical condition is output according to the input of the feature amount data for estimating the physical condition.
  • the estimation model 651 may be a model for estimating the physical condition using attributes such as gender, age, height, and weight as explanatory variables in addition to the feature quantities F1 to Fn used for estimating the physical condition.
  • the storage unit 632 stores an estimation model for estimating the physical condition using the multiple regression prediction method.
  • the storage unit 632 stores parameters for estimating the physical condition score S using Equation 1 below.
  • S f1 x F1 + f2 x F2 + + fn x Fn + f0
  • F1, F2, . f1, f2, . . . , fn are coefficients by which F1, F2, . f0 is a constant term.
  • the storage unit 632 stores coefficients such as f1, f2, . . . , fn.
  • the operation of the physical condition estimation system 6 will be described with reference to the drawings.
  • the gait measuring device 60 and the estimating device 63 included in the physical state estimating system 6 will be individually described.
  • the operation of the feature amount data generation unit 62 included in the gait measuring device 60 will be described.
  • FIG. 33 is a flow chart for explaining the operation of the feature amount data generator 62 included in the gait measuring device 60. As shown in FIG. In the description according to the flowchart of FIG. 33, the feature amount data generation unit 62 will be described as an operating entity.
  • the feature amount data generation unit 62 acquires time-series data of sensor data related to gait (step S601).
  • the feature amount data generation unit 62 extracts walking waveform data for one step cycle from the time-series data of the sensor data (step S602).
  • the feature amount data generator 62 detects heel contact and toe off from the time-series data of the sensor data.
  • the feature amount data generator 62 extracts the time-series data of the section between successive heel strikes as walking waveform data for one step cycle.
  • the feature amount data generation unit 62 normalizes the extracted walking waveform data for one step cycle (step S603).
  • the feature amount data generator 62 normalizes the walking waveform data for one step cycle to a walking cycle of 0 to 100% (first normalization). Further, the feature amount data generator 62 normalizes the ratio of the stance phase and the swing phase of the walking waveform data for the first normalized step cycle to 60:40 (second normalization).
  • the feature amount data generation unit 62 extracts feature amounts from the walking phases used for estimating the physical condition with respect to the normalized walking waveform (step S604). For example, the feature amount data generation unit 62 extracts feature amounts to be input to the estimation model constructed for each gender.
  • the feature quantity data generation unit 62 uses the extracted feature quantity to generate a feature quantity for each walking phase cluster (step S605).
  • the feature amount data generation unit 62 integrates the feature amounts for each walking phase cluster to generate feature amount data for the one step cycle (step S606).
  • the feature amount data generation unit 62 outputs the generated feature amount data to the estimation device 63 (step S607).
  • FIG. 33 is a flowchart for explaining the operation of the estimating device 63.
  • the estimation device 63 will be described as an operating entity.
  • the estimating device 63 acquires feature amount data generated using sensor data relating to gait (step S631).
  • the estimating device 63 inputs the acquired feature amount data to the estimation model for estimating the physical state (step S632).
  • the estimation device 63 estimates the user's physical condition according to the output (estimated value) from the estimation model (step S633).
  • the estimation device 63 outputs information on the estimated physical condition (step S634).
  • the physical condition is output to a terminal device (not shown) carried by the user.
  • the physical state is output to a system that performs processing using the physical state.
  • the function of the estimating device 63 installed in the mobile terminal carried by the user estimates the physical condition using feature amount data measured by the gait measuring device 60 placed on the shoe.
  • FIG. 35 is a conceptual diagram showing an example of displaying the estimation result by the estimation device 63 on the screen of the mobile terminal 660 carried by the user walking wearing the shoes 600 on which the gait measurement device 60 is arranged.
  • FIG. 35 shows an example of displaying on the screen of the portable terminal 660 information corresponding to the result of estimating the physical condition using feature amount data corresponding to sensor data measured while the user is walking.
  • FIG. 35 is an example of information displayed on the screen of the mobile terminal 660 according to the estimated value of the physical condition.
  • a score digitized according to a preset criterion is displayed on the display unit of the mobile terminal 660 as the estimated result of the physical condition.
  • the information about the estimation result of the physical condition is displayed on the display unit of the portable terminal 660 according to the estimated value of the physical condition, such as "the total muscle strength of the whole body is declining.”
  • the display unit of the mobile terminal 660 displays recommendation information according to the estimated total muscle strength, such as “Training A is recommended. Please see the video below.” After confirming the information displayed on the display unit of the mobile terminal 660, the user can practice training that leads to improvement of the total muscle strength of the whole body by exercising with reference to the training A video in accordance with the displayed recommendation information.
  • the physical condition estimation system of this embodiment includes a gait measuring device and a physical condition estimation device.
  • a gait measuring device includes a sensor and a feature amount data generator.
  • the sensor has an acceleration sensor and an angular velocity sensor.
  • the sensor measures spatial acceleration using an acceleration sensor.
  • the sensor measures the spatial angular velocity using an angular velocity sensor.
  • the sensor uses the measured spatial acceleration and spatial angular velocity to generate sensor data regarding foot movement.
  • the sensor outputs the generated sensor data to the feature data generator.
  • the feature amount data generation unit acquires time-series data of sensor data related to foot movement.
  • the feature amount data generation unit extracts walking waveform data for one step cycle from the time-series data of the sensor data.
  • the feature amount data generator normalizes the extracted walking waveform data.
  • the feature amount data generation unit extracts, from the normalized walking waveform data, a feature amount related to the body condition of the estimation target from a walking phase cluster composed of at least one temporally continuous walking phase.
  • the feature quantity data generator extracts the feature quantities selected by the feature quantity selection devices of the first to fourth embodiments.
  • the feature amount data generation unit generates feature amount data including the extracted feature amount.
  • the feature amount data generation unit outputs the generated feature amount data.
  • a physical condition estimation device includes a data acquisition unit, a storage unit, an estimation unit, and an output unit.
  • the data acquisition unit acquires feature amount data including feature amounts used for estimating the physical state of the user, which are extracted from the features of the user's gait.
  • the storage unit stores an estimation model that outputs a physical state according to input of feature amount data.
  • the estimation unit inputs the acquired feature amount data to the estimation model to estimate the physical state of the user.
  • the output unit outputs information about the estimated physical condition.
  • the physical condition estimation system of this embodiment estimates the user's physical condition using the feature amount extracted from the user's gait characteristics. Therefore, according to the physical condition estimation system of the present embodiment, it is possible to appropriately estimate the physical condition in daily life using feature values with high robustness.
  • the information processing device 90 includes a processor 91, a main storage device 92, an auxiliary storage device 93, an input/output interface 95, and a communication interface 96.
  • the interface is abbreviated as I/F (Interface).
  • Processor 91 , main storage device 92 , auxiliary storage device 93 , input/output interface 95 , and communication interface 96 are connected to each other via bus 98 so as to enable data communication.
  • the processor 91 , the main storage device 92 , the auxiliary storage device 93 and the input/output interface 95 are connected to a network such as the Internet or an intranet via a communication interface 96 .
  • the processor 91 loads the program stored in the auxiliary storage device 93 or the like into the main storage device 92 .
  • the processor 91 executes programs developed in the main memory device 92 .
  • a configuration using a software program installed in the information processing device 90 may be used.
  • the processor 91 executes processing according to each embodiment.
  • the main storage device 92 has an area in which programs are expanded.
  • a program stored in the auxiliary storage device 93 or the like is developed in the main storage device 92 by the processor 91 .
  • the main memory device 92 is realized by a volatile memory such as a DRAM (Dynamic Random Access Memory). Further, as the main storage device 92, a non-volatile memory such as MRAM (Magnetoresistive Random Access Memory) may be configured/added.
  • the auxiliary storage device 93 stores various data such as programs.
  • the auxiliary storage device 93 is implemented by a local disk such as a hard disk or flash memory. It should be noted that it is possible to store various data in the main storage device 92 and omit the auxiliary storage device 93 .
  • the input/output interface 95 is an interface for connecting the information processing device 90 and peripheral devices based on standards and specifications.
  • a communication interface 96 is an interface for connecting to an external system or device through a network such as the Internet or an intranet based on standards and specifications.
  • the input/output interface 95 and the communication interface 96 may be shared as an interface for connecting with external devices.
  • Input devices such as a keyboard, mouse, and touch panel may be connected to the information processing device 90 as necessary. These input devices are used to enter information and settings.
  • a touch panel is used as an input device, the display screen of the display device may also serve as an interface of the input device. Data communication between the processor 91 and the input device may be mediated by the input/output interface 95 .
  • the information processing device 90 may be equipped with a display device for displaying information.
  • the information processing device 90 is preferably provided with a display control device (not shown) for controlling the display of the display device.
  • the display device may be connected to the information processing device 90 via the input/output interface 95 .
  • the information processing device 90 may be equipped with a drive device. Between the processor 91 and a recording medium (program recording medium), the drive device mediates reading of data and programs from the recording medium, writing of processing results of the information processing device 90 to the recording medium, and the like.
  • the drive device may be connected to the information processing device 90 via the input/output interface 95 .
  • the above is an example of the hardware configuration for enabling the processing according to each embodiment of the present invention.
  • the hardware configuration of FIG. 36 is an example of a hardware configuration for executing processing according to each embodiment, and does not limit the scope of the present invention.
  • the scope of the present invention also includes a program that causes a computer to execute the processing according to each embodiment.
  • the scope of the present invention also includes a program recording medium on which the program according to each embodiment is recorded.
  • the recording medium can be implemented as an optical recording medium such as a CD (Compact Disc) or a DVD (Digital Versatile Disc).
  • the recording medium may be implemented by a semiconductor recording medium such as a USB (Universal Serial Bus) memory or an SD (Secure Digital) card.
  • the recording medium may be realized by a magnetic recording medium such as a flexible disk, or other recording medium.
  • each embodiment may be combined arbitrarily. Also, the components of each embodiment may be realized by software or by circuits.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Artificial Intelligence (AREA)
  • Image Analysis (AREA)

Abstract

飛び値や外れ値に対するロバスト性の高い特徴量を選定するために、複数のデータセットを取得する取得部と、データセットに含まれるデータの分布を変更して複数の再抽出データセットを構築する構築部と、ラッソ回帰の手法を用いて、複数の再抽出データセットを解析する解析部と、複数の再抽出データセットの解析結果に応じて複数の再抽出データセットに含まれる要素の値を集計し、要素の値の集計結果に応じて複数の再抽出データセットに含まれる要素に論理値を設定する統計部と、予め設定された特定ルールに従って、要素に設定された論理値の値に応じた組み合わせの特徴量を選定する選定部と、選定された特徴量の組み合わせに関する選定情報を出力する出力部と、を備える特徴量選定装置とする。

Description

特徴量選定装置、特徴量選定方法、身体状態推定システム、および記録媒体
 本開示は、推定に用いられる特徴量を選定する特徴量選定装置等に関する。
 IoT(Internet of Things)技術の普及により、各種のIoT機器から、様々な情報を収集できる。例えば、医療やヘルスケア、セキュリティなどの分野において、IoT機器によって収集された情報を活用する試みがなされている。IoT機器によって収集された情報に機械学習を適用すれば、身体状態の推定などの用途に、それらの情報を活用できる。IoT機器は、電力供給が難しい場所に配置されることが多いため、高度な省電力が要求される。IoT機器の消費電力のうち、通信に費やされる消費電力の割合が大きい。例えば、身体状態の推定などに用いられる特徴量の情報量を削減できれば、IoT機器から送信される情報量が削減され、IoT機器の電力消費を低減できる。
 特許文献1には、工場などで収集されるセンサデータから、装置の異常予測との因果関係が希薄なデータを削減する技術が開示されている。特許文献1には、複数のスパース推定手法を活用して、因果関係の希薄なデータを削減する技術が開示されている。特許文献1には、スパース推定手法の一例として、LASSO(Least Absolute Shrinkage and Selection Operator)回帰(ラッソ回帰とも呼ばれる)が挙げられている。特許文献1の手法では、スパース推定手法を適用可能である複数のデータを入力とし、複数のスパース推定手法を適用して所定の出力を行うモデルに対して、複数のスパース推定手法の各適用度合いを学習させる。特許文献1の手法によれば、課題に応じて適切なスパース推定手法を選択し、選択したスパース推定手法に対してスパース性の度合いを調整できる。
特開2021-149590号公報
 特許文献1の手法を用いれば、身体状態などの推定に用いられる特徴量のうち、重要ではない特徴量を削減することも可能である。例えば、ラッソ回帰を用いれば、推定に用いられる特徴量のうち重要な特徴量を選定することで、不要な特徴量を削減できる。しかしながら、被験者数が少ない場合、ラッソ回帰を用いて特徴量を選定すると、飛び値や外れ値による影響を受けやすい。数少ないデータの中で、飛び値や外れ値を恣意的に除外すると、推定に用いられるモデルの有効性が低下する。そのため、飛び値や外れ値に対するロバスト性の高い特徴量を選定することが求められる。
 本開示の目的は、飛び値や外れ値に対するロバスト性の高い特徴量を選定できる特徴量選定装置等を提供することにある。
 本開示の一態様の特徴量選定装置は、複数のデータセットを取得する取得部と、データセットに含まれるデータの分布を変更して複数の再抽出データセットを構築する構築部と、ラッソ回帰の手法を用いて、複数の再抽出データセットを解析する解析部と、複数の再抽出データセットの解析結果に応じて複数の再抽出データセットに含まれる要素の値を集計し、要素の値の集計結果に応じて複数の再抽出データセットに含まれる要素に論理値を設定する統計部と、予め設定された特定ルールに従って、要素に設定された論理値の値に応じた組み合わせの特徴量を選定する選定部と、選定された特徴量の組み合わせに関する選定情報を出力する出力部と、を備える。
 本開示の一態様の特徴量推定方法においては、複数のデータセットを取得し、データセットに含まれるデータの分布を変更して複数の再抽出データセットを構築し、ラッソ回帰の手法を用いて、複数の再抽出データセットを解析し、複数の再抽出データセットの解析結果に応じて複数の再抽出データセットに含まれる要素の値を集計し、要素の値の集計結果に応じて複数の再抽出データセットに含まれる要素に論理値を設定し、予め設定された特定ルールに従って、要素に設定された論理値の値に応じた組み合わせの特徴量を選定し、選定された特徴量の組み合わせに関する選定情報を出力する。
 本開示の一態様のプログラムは、複数のデータセットを取得する処理と、データセットに含まれるデータの分布を変更して複数の再抽出データセットを構築する処理と、ラッソ回帰の手法を用いて、複数の再抽出データセットを解析する処理と、複数の再抽出データセットの解析結果に応じて複数の再抽出データセットに含まれる要素の値を集計する処理と、要素の値の集計結果に応じて複数の再抽出データセットに含まれる要素に論理値を設定する処理と、予め設定された特定ルールに従って、要素に設定された論理値の値に応じた組み合わせの特徴量を選定する処理と、選定された特徴量の組み合わせに関する選定情報を出力する処理と、をコンピュータに実行させる。
 本開示によれば、飛び値や外れ値に対するロバスト性の高い特徴量を選定できる特徴量選定装置等を提供することが可能になる。
第1の実施形態に係る特徴量選定装置の構成の一例を示すブロック図である。 第1の実施形態に係る特徴量選定装置が生成する第1行列について説明するための概念図である。 第1の実施形態に係る特徴量選定装置が生成する複数パターンの第1行列について説明するための概念図である。 第1の実施形態に係る特徴量選定装置が生成する複数パターンの第1行列の各セルの集計値について説明するための概念図である。 第1の実施形態に係る特徴量選定装置が生成する第2行列について説明するための概念図である。 一般的なラッソ回帰の手法で選定された特徴量を用いて生成された推定モデルを用いた推定例である。 第1の実施形態の手法で選定された特徴量を用いて生成された推定モデルを用いた推定例である。 複数の被験者に関して計測されたセンサデータに含まれうる飛び値や外れ値の影響について説明するためのグラフである。 第1の実施形態に係る特徴量選定装置の動作の一例について説明するためのフローチャートである。 第1の実施形態に係る特徴量選定装置の動作の一例について説明するためのフローチャートである。 第2の実施形態に係る特徴量選定装置の構成の一例を示すブロック図である。 第2の実施形態に係る特徴量選定装置の動作の一例について説明するためのフローチャートである。 第2の実施形態に係る特徴量選定装置の動作の一例について説明するためのフローチャートである。 第2の実施形態に係る特徴量選定装置の動作の一例について説明するためのフローチャートである。 第3の実施形態に係る特徴量選定装置の構成の一例を示すブロック図である。 第3の実施形態に係る特徴量選定装置の動作の一例について説明するためのフローチャートである。 第3の実施形態に係る特徴量選定装置の動作の一例について説明するためのフローチャートである。 第4の実施形態に係る特徴量選定装置の構成の一例を示すブロック図である。 第5の実施形態に係る学習システムの構成の一例を示すブロック図である。 第5の実施形態に係る学習システムが備える学習装置の構成の一例を示すブロック図である。 第5の実施形態に係る学習システムが備える学習装置の学習の一例について説明するための概念図である。 第6の実施形態に係る身体状態推定システムの構成の一例を示すブロック図である。 第6の実施形態に係る身体状態推定システムが備える歩容計測装置の構成の一例を示すブロック図である。 第6の実施形態に係る身体状態推定システムが備える歩容計測装置の配置例について説明するための概念図である。 第6の実施形態に係る身体状態推定システムが備える歩容計測装置に設定される座標系について説明するための概念図である。 第6の実施形態に係る身体状態推定システムが備える歩容計測装置に関する説明で用いられる人体面について説明するための概念図である。 第6の実施形態に係る身体状態推定システムが備える歩容計測装置に関する説明で用いられる歩行周期について説明するための概念図である。 第6の実施形態に係る身体状態推定システムが備える歩容計測装置が計測するセンサデータの時系列データの一例について説明するためのグラフである。 第6の実施形態に係る身体状態推定システムが備える歩容計測装置が計測するセンサデータの時系列データから抽出される歩行波形データの正規化の一例について説明するための図である。 第6の実施形態に係る身体状態推定システムが備える歩容計測装置の特徴量データ生成部が特徴量を抽出する歩行フェーズクラスターの一例について説明するための概念図である。 第6の実施形態に係る身体状態推定システムが備える推定装置の構成の一例を示すブロック図である。 第6の実施形態に係る身体状態推定システムが備える推定装置による身体状態のスコアの推定例を示すブロック図である。 第6の実施形態に係る身体状態推定システムが備える歩容計測装置の動作の一例について説明するためのフローチャートである。 第6の実施形態に係る身体状態推定システムが備える推定装置の動作の一例について説明するためのフローチャートである。 第6の実施形態に係る身体状態推定システムの適用例について説明するための概念図である。 各実施形態に係る処理を実行するハードウェア構成の一例を示すブロック図である。
 以下に、本発明を実施するための形態について図面を用いて説明する。ただし、以下に述べる実施形態には、本発明を実施するために技術的に好ましい限定がされているが、発明の範囲を以下に限定するものではない。なお、以下の実施形態の説明に用いる全図においては、特に理由がない限り、同様箇所には同一符号を付す。また、以下の実施形態において、同様の構成・動作に関しては繰り返しの説明を省略する場合がある。
 (第1の実施形態)
 まず、第1の実施形態に係る特徴量選定装置について、図面を参照しながら説明する。本実施形態の特徴量選定装置は、LASSO(Least Absolute Shrinkage and Selection Operator)回帰(以下、ラッソ回帰と呼ぶ)の手法を用いて、身体状態などの推定に用いられる特徴量を選定する。ラッソ回帰は、L1正則化とも呼ばれる。
 以下においては、身体状態の推定に用いられる特徴量の選定に関して説明する。例えば、身体状態の推定に用いられる特徴量は、ユーザの歩行に応じた足の動きに関するセンサデータに基づいて、抽出される。例えば、足の動きに関するセンサデータは、履物に設置された計測装置によって計測される。例えば、計測装置は、加速度センサや角速度センサを含む。なお、センサデータは、足の動きに関するセンサデータに限定されず、歩容に関する特徴を含めばよい。例えば、センサデータは、モーションキャプチャーやスマートアパレル等を用いて計測された、歩容に関する特徴を含むセンサデータであってもよい。また、以下の手法は、歩容に関する特徴量の選定のみならず、任意のセンサデータから特徴量を選定する用途に適用できる。
 (構成)
 図1は、本実施形態に係る特徴量選定装置10の構成の一例を示すブロック図である。特徴量選定装置10は、取得部11、構築部12、解析部13、統計部15、選定部17、および出力部19を備える。
 取得部11は、複数の被験者に関して計測された、身体状態の推定に用いられるデータセットを取得する。データセットは、説明変数と、その説明変数に対応する目的変数とを組み合わせたデータである。例えば、データセットは、被験者に関する計測値や特徴量と、その被験者の身体状態とを対応付けたデータである。例えば、身体状態の推定に用いられる説明変数は、足の動きや歩容に関するセンサデータから抽出された特徴量である。
 構築部12は、複数の被験者に関するデータセットの分布を変えて、新たなデータセット(再抽出データセットとも呼ばれる)を構築する。例えば、構築部12は、Leave-One-Subject-Out(LOSOとも呼ばれる)の手法を用いて、再抽出データセットを構築する。LOSOの手法を用いる場合、複数のデータセットから一つを除去し、残りのデータセットを用いて再構築データセットを構築する。LOSOの手法を用いる場合、再構築データセットは、被験者の数だけ生成される。例えば、被験者が50人いる場合、LOSOの手法を用いれば、50個の再抽出データセットを構築できる。
 構築部12は、ブートストラップ法を用いて、再抽出データセットを構築してもよい。ブートストラップ法では、復元抽出法によって標本集団からランダムに抽出される値に基づいて、母集団の性質を推定する。ブートストラップ法では、標本集団からランダムに抽出される値を用いた新しいデータセットの生成を繰り返し、統計値を計算する。例えば、新しいデータセットの生成を1000回繰り返したら、1000個分のデータの再抽出データセットを構築できる。
 解析部13は、構築部12によって構築された再抽出データセットに関して、ラッソ回帰を実行する。例えば、解析部13は、以下の式1で表される損失関数を用いる。
Figure JPOXMLDOC01-appb-M000001
上記の式1において、Nは、観測数である。iは、観測値の番号である。xiは、観測値iにおける長さpのベクトル(データ)である。yiは、観測値iの応答データ(正解値)である。λは、一つの値に対応する非負の正則化パラメータ(ラグランジュ乗数)である。β0は、スカラーである。βは、長さpのベクトルである。jは、特徴量番号である。特徴量がp個の場合、特徴量番号jは、1~pのいずれかになる。βjは、推定モデルとして用いられる多項式関数の係数(モデルパラメータとも呼ばれる)に相当する。Tは、転置処理を示す。
 式1の右辺の第1項は、二乗和誤差に関する項である。式1の右辺の第2項は、正則化項である。正則化項は、モデルパラメータβが大きくなるほど大きい値を返すように定義された関数である。正則化項は、モデルパラメータβの大きさに対するペナルティに相当する。
 正則化パラメータλは、モデルの学習時に設定されるメタなパラメータである。正則化パラメータλは、正則化(ペナルティ)の強さを調節する。正則化パラメータλの値が大きいと、正則化項のペナルティが強くなり、過学習がより強く抑えられる。正則化パラメータλの値が大きすぎると、モデルパラメータを小さく保つことが優先されてモデルの表現力が低下する。その結果、正則化パラメータλの値が大きすぎると、大きなバイアスが残る。
 正則化パラメータλの設定に応じて、ラッソ回帰では、以下の式2の問題が解決される。
Figure JPOXMLDOC01-appb-M000002
上記の式2は、β0と係数ベクトルβを変数とした場合における最小値を示す。式2は、モデルパラメータβjの絶対値の大きさに応じて、ペナルティに関する第2項(正規化項)の大きさを決定する。
 以下の式3は、係数ベクトルの各要素に対する制限条件である。
Figure JPOXMLDOC01-appb-M000003
 上記の式2は、最小二乗法によって重回帰の係数ベクトルβを求めるときに、係数ベクトルβの各要素(モデルパラメータβj)に対して、式3の制限条件を設けた際のモデルパラメータβjを求めることに相当する。
 正則化パラメータλには、対応する係数ベクトルβが一つある。正則化パラメータλが大きくなると、係数ベクトルβの非ゼロ要素が減る。すなわち、正則化パラメータλが大きくなると、係数ベクトルβのゼロ要素が増えて、不要な特徴量が増える。それに対し、正則化パラメータλが小さくなると、係数ベクトルβの非ゼロ要素が増えて、必要な特徴量が増える。適切な正則化パラメータλが設定されれば、推定に必要な非ゼロ要素を残しながら、不要なゼロ要素を削減できる。
 解析部13は、構築部12によって構築された再抽出データセットに関して、ラッソ回帰を実行する。解析部13は、被験者ごとの再抽出データセットに関して、正則化パラメータλを変化させてラッソ回帰を実行する。解析部13は、正則化パラメータλの数の列と、特徴量の数の行とによって構成される行列(第1行列とも呼ばれる)を生成する。例えば、正則化パラメータλがP個の場合、各々の正則化パラメータλには、1~Pの番号(λ番号とも呼ばれる)が付与される(Pは自然数)。第1行列は、身体状態などの推定に用いられる特徴量の数の行を有する。特徴量の数がp個の場合、各々の特徴量には、1~pの番号(特徴量番号とも呼ばれる)が付与される(pは自然数)。
 図2は、第1行列の一例を示す概念図である。図2の第1行列において、ハッチングがかけられているセルは、非ゼロ要素であることを示す。図2の第1行列において、ハッチングがかけられていない空白のセルは、ゼロ要素であることを示す。
 図3は、LOSOによって構築された再構築データセットを用いて、50人の被験者に関して生成された第1行列の一例である。LOSOによって再構築データセットが構築された場合、被験者ごとの第1行列が生成される。図3の例の場合、被験者の数(50人)に応じて、50パターンの第1行列が生成される。図3の第1行列において、ハッチングがかけられているセルは、非ゼロ要素であることを示す。図3の第1行列において、ハッチングがかけられていない空白のセルは、ゼロ要素であることを示す。
 統計部15は、生成された複数パターンの第1行列の各セルに、論理値(0、1)を割り当てる。ラッソ回帰で生成された複数パターンの第1行列の各セルに論理値(0、1)を割り当てる処理は、第1統計処理とも呼ばれる。統計部15は、第1統計処理において、複数の第1行列に関して、非ゼロ要素をTRUE(1)、ゼロ要素をFALSE(0)に設定する。統計部15は、全ての第1行列に関して、セルごとの論理値(0、1)を集計する。統計部15は、全ての第1行列に関して、非ゼロ要素の論理値(1)をセルごとに加算することによって、セルごとの論理値(0、1)を集計する。
 図4は、50人の被験者の第1行列に関する論理値の集計値を、全ての第1行列に対応する行列(第2行列とも呼ばれる)の各セルに記入した例である。第2行列の各セルには、複数のパターンに関して、第1行列の非ゼロ要素の数(TRUEの数)が記入される。
 統計部15は、全ての第1行列に含まれる各セルの集計値に応じて、第2行列の各セルに論理値(0または1)を割り当てる。第2行列の各セルに関する集計値が所定の閾値以上の場合、統計部15は、そのセルをTRUE(1)に設定する。一方、集計値が所定の閾値を下回る場合、統計部15は、そのセルをFALSE(0)に設定する。全ての第1行列に関して、セルごとの論理値(0、1)を集計し、集計値に応じた論理値(0または1)を第2行列の各セルに割り当てる処理は、第2統計処理とも呼ばれる。
 図5は、図4の集計値に関して、論理値(0または1)を割り当てた一例を示す概念図である。図5の例では、図4の集計値が49以上のセルが、TRUE(1)に設定される。図5の例では、第2統計処理によってTRUE(1)に設定されたセルに、ハッチングがかけられている。図5の例では、第2統計処理によってFALSE(0)に設定されたセルは、空白である。例えば、図5のような第2統計処理の結果を、ユーザが確認可能な画面に表示させてもよい。その場合、ユーザは、画面に表示された第2統計処理の結果に応じたλ番号を選択することで、所望の特徴量の組み合わせを選定できる。
 統計部15は、集計値の平均値に応じた論理値を、第2行列の各セルに割り当ててもよい。例えば、統計部15は、第2行列の各セルに関して、集計値の平均値が所定の閾値以上のセルをTRUE(1)に設定する。一方、統計部15は、集計値の平均値が所定の閾値を下回るセルをFALSE(0)に設定する。このような処理も、第2統計処理に含まれる。
 選定部17は、予め設定された特定ルールに従って、λ番号を選択する。特定ルールは、選択されるλ番号を決めるためのルールである。例えば、特定ルールは、TRUE(1)に設定されたセルの数が、予め設定された基準値に相当するλ番号を選択するというルールである。基準値は、計算量や通信量の制約に応じて設定されてもよい。例えば、基準値は、計算量や通信量に割り当て可能な負荷を越えない値に設定される。例えば、基準値は、計算量や通信量に割り当て可能な負荷に対する割合(例えば、50~80パーセントなど)を越えない値に設定される。例えば、TRUE(1)に設定されたセルの数が基準値に相当するλ番号が複数ある場合、少なくともいずれかのλ番号が選択されればよい。選定部17は、特定ルールに基づいて、選択されたλ番号のセルがTRUE(1)に設定された特徴量の組み合わせを選定する。例えば、選定部17は、ユーザによって設定された基準値に応じて、特徴量の組み合わせを選定してもよい。
 出力部19は、選定部17によって選定された特徴量に関する情報(選定情報とも呼ぶ)を出力する。選定情報は、身体状態などの推定に用いられる特徴量の組み合わせに関する情報である。例えば、足の動きに関するセンサデータの場合、選定情報は、一歩行周期分の加速度や角速度の時系列データにおいて、いずれの歩行フェーズから特徴量を抽出するのかを示す情報を含む。歩行フェーズとは、一歩行周期を0~100パーセントに正規化した場合における、歩行周期(パーセント)を示す。連続した複数の歩行フェーズにわたる特徴量が抽出されてもよい。特徴量が抽出される連続した複数の歩行フェーズの塊は、歩行フェーズクラスターとも呼ばれる。
 出力部19から出力された選定情報は、計測装置等によって計測されたセンサデータから特徴量を抽出するための条件として用いられる。例えば、選定部17によって選定情報は、図示しない記憶部に記憶させてもよい。例えば、選定情報に応じて抽出される特徴量は、身体状態などを推定するための推定モデルの学習に用いられる。例えば、抽出対象の特徴量は、身体状態の推定対象のユーザに装着された計測装置等によって計測されるセンサデータから抽出される。
 図6~図7は、一般的なラッソ回帰(比較例)の手法を用いて選定された特徴量と、本実施形態の手法を用いて選定された特徴量とを用いた学習によって生成された推定モデルによる推定値の相違について説明するための概念図である。図6~図7は、被験者の移動能力として、TUG(Time Up and Go)テストの成績を推定した例である。TUGテストの成績は、椅子から立ち上がって3メートル先の目印まで歩いて方向転換し、再び椅子に座るまでの時間(TUG所要時間とも呼ぶ)である。
 図6は、一般的なラッソ回帰(比較例)の手法で選定された9個の特徴量を用いて生成された推定モデルを用いた推定例である。TUG所要時間の真値(計測値)と推定値に関して、相関級内相関係数ICC(Intraclass Correlation Coefficients)は0.602であった。また、TUG所要時間の真値(計測値)と推定値に関して、平均絶対誤差MAE(Mean Absolute Error)は0.71であった。
 図7は、本実施形態の手法で選定された9個の特徴量を用いて生成された推定モデルを用いた推定例である。図7の例では、LOSOによって構築された再抽出データセットを用いた。TUG所要時間の真値(計測値)と推定値に関して、相関級内相関係数ICCは0.682であった。また、TUG所要時間の真値(計測値)と推定値に関して、平均絶対誤差MAEは0.63であった。以上のように、本実施形態の手法を用いた方が、ICCとMAEがともに大きかった。すなわち、本実施形態の手法を用いることで、飛び値や外れ値に対するロバスト性が向上した。
 図8は、複数の被験者に関して計測されたセンサデータに含まれうる飛び値や外れ値の影響について説明するためのグラフである。破線の円で囲った範囲内のデータが、飛び値や外れ値に相当する。L1は、飛び値や外れ値を含めて、複数のセンサデータを線形回帰した場合の回帰直線である。L2は、飛び値や外れ値を恣意的に除外して、複数のセンサデータを線形回帰した場合の回帰直線である。回帰直線L1は、飛び値や外れ値の影響を受けており、大多数のセンサデータにフィットしていない。一方、回帰直線L2は、飛び値や外れ値の影響を受けず、大多数のセンサデータにフィットしている。回帰直線L1と回帰直線L2を比較すると、飛び値や外れ値を恣意的に除外した回帰直線L2を用いれば、より精度の高い推定モデルを構築できそうである。しかしながら、飛び値や外れ値を恣意的に除外すると、推定モデルの有効性が低下する。そのため、推定モデルの有効性を低下させずに、飛び値や外れ値に対するロバスト性の高い特徴量を選定することが求められる。
 本実施形態の手法では、LOSOやブートストラップ法などの手法を用いてデータセットの分布を変更した上で、ラッソ回帰を行う。また、本実施形態の手法では、LOSOやブートストラップ法などの手法とラッソ回帰とを単に組み合わせるだけではなく、上述した第1統計処理および第2統計処理を実行する。その結果、本実施形態の手法によれば、飛び値や外れ値の影響が低減された平均的な解が求められる。また、本実施形態の手法によれば、推定モデルの有効性を低下させることがなく、飛び値や外れ値に対するロバスト性の高い特徴量を選定できる。
 (動作)
 次に、本実施形態の特徴量選定装置10の動作について、図面を参照しながら説明する。図9~図10は、特徴量選定装置10の動作の一例について説明するためのフローチャートである。図9~図10のフローチャートを用いた説明においては、特徴量選定装置10を動作主体として説明する。
 図9において、まず、特徴量選定装置10は、N個のデータセットを取得する(ステップS111)。データセットの番号は、データセットに含まれる説明変数(特徴量)の番号(特徴量番号)に相当する。
 次に、特徴量選定装置10は、特徴量番号nを1にセットする(ステップS112)。nは、データセット(特徴量)の番号である。
 次に、特徴量選定装置10は、n番目の被験者のデータを除外する(ステップS113)。
 次に、特徴量選定装置10は、n番目の被験者のデータが除外されたN-1個のデータセットに関して、ラッソ回帰を実行する(ステップS114)。
 次に、特徴量選定装置10は、第1統計処理を実行する(ステップS115)。特徴量選定装置10は、第1統計処理として、ラッソ回帰によって生成された第1行列(行列Bn)の各セルに論理値を割り当てる。例えば、特徴量選定装置10は、行列Bnの非ゼロ要素をTRUE(1)に設定し、行列Bnのゼロ要素をFALSE(0)に設定する。例えば、特徴量選定装置10は、行列Bnの要素の値が閾値T0以上のセルをTRUE(1)に設定し、行列Bnの要素の値が閾値T0を下回るセルをFALSE(0)に設定してもよい。
 次に、特徴量選定装置10は、特徴量番号nをインクリメント(+1)する(ステップS116)。
 ここで、データセットの個数Nよりも特徴量番号nが小さい場合(ステップS117でYes)、ステップS113に戻る。一方、特徴量番号nがデータセットの個数N以上の場合(ステップS117でNo)、図10のステップS121に進む。
 図9のステップS117でNoの場合、特徴量選定装置10は、第2統計処理を実行する(ステップS121)。特徴量選定装置10は、第2統計処理として、全ての第1行列に関して、セルごとの論理値(0または1)を集計する。特徴量選定装置10は、セルごとの論理値の集計値と所定の閾値との関係に応じて、集計された第2行列の各セルに論理値(0または1)を設定する。例えば、特徴量選定装置10は、集計値が所定の閾値以上のセルを、TRUE(1)に設定する。一方、特徴量選定装置10は、集計値が所定の閾値を下回るセルを、FALSE(0)に設定する。
 次に、特徴量選定装置10は、第2統計処理の結果に応じて、特定ルールに基づいてλ番号を選択する(ステップS122)。
 次に、特徴量選定装置10は、選択されたλ番号に対応する特徴量の組み合わせを選定する(ステップS123)。
 次に、特徴量選定装置10は、選定された特徴量に関する情報(選定情報)を出力する(ステップS124)。特徴量選定装置10から出力された選定情報は、計測装置等によって計測されたセンサデータから特徴量を抽出するための条件として用いられる。
 以上のように、本実施形態の特徴量選定装置は、取得部、構築部、解析部、統計部、選定部、および出力部を備える。取得部は、複数のデータセットを取得する。構築部は、データセットに含まれるデータの分布を変更して複数の再抽出データセットを構築する。解析部は、ラッソ回帰の手法を用いて、複数の再抽出データセットを解析する。統計部は、複数の再抽出データセットの解析結果に応じて、複数の再抽出データセットに含まれる要素の値を集計する。統計部は、要素の値の集計結果に応じて、複数の再抽出データセットに含まれる要素に論理値を設定する。選定部は、予め設定された特定ルールに従って、要素に設定された論理値の値に応じた組み合わせの特徴量を選定する。出力部は、選定された特徴量の組み合わせに関する選定情報を出力する。
 本実施形態において、解析部は、複数の再抽出データセットに関して、予め設定された複数の正則化パラメータごとにラッソ回帰を実行する。解析部は、ラッソ回帰で用いられた正則化パラメータに対応する列と、特徴量に対応する行とによって構成される複数パターンの第1行列を生成する。統計部は、複数パターンの第1行列に関して、非ゼロ要素のセルの第1論理値を1に設定して、ゼロ要素のセルの第1論理値を0に設定する第1統計処理を実行する。統計部は、複数パターンの第1行列を構成するセルごとに第1論理値を集計する。統計部は、第1論理値の集計値が所定条件を満たすセルに第2論理値として1が設定され、第1論理値の集計値が所定条件を満たさないセルに第2論理値として0が設定された第2行列を生成する第2統計処理を実行する。選定部は、予め設定された特定ルールに従って第2行列の列を選択し、選択された列に対応する特徴量の組み合わせを選定する。
 本実施形態によれば、データの分布を変えてラッソ回帰することによって、飛び値や外れ値の影響をそのまま受けた場合と比較して、真値により近い平均的な値の特徴量を求めることができる。そのため、本実施形態によれば、飛び値や外れ値に対するロバスト性の高い特徴量を選定できる。
 本実施形態の一態様において、構築部は、Leave-One-Subject-Outの手法を用いて、複数の再抽出データセットを構築する。本態様によれば、Leave-One-Subject-Outの手法を用いてデータの分布を擬似的に変えることによって、本来あるべき母集団の分布に、データの分布を近づけることができる。
 本実施形態の一態様において、構築部は、ブートストラップ法を用いて、複数の再抽出データセットを構築する。本態様によれば、ブートストラップ法を用いてデータの分布を擬似的に変えることによって、標本集団から推定される母集団の分布に、データの分布を近づけることができる。
 本実施形態の一態様において、統計部は、第2統計処理において、複数パターンの第1行列を構成するセルごとに第1論理値の合計値を計算する。統計部は、第1論理値の合計値が所定閾値以上のセルの第2論理値が1に設定され、第1論理値の合計値が所定閾値未満のセルが0に設定された第2行列を生成する。本態様によれば、第1論理値の合計値に応じて設定された第2行列の論理値に基づいて、特徴量の組み合わせを選定できる。
 本実施形態の一態様において、統計部は、第2統計処理において、複数パターンの第1行列を構成するセルごとに第1論理値の平均値を計算する。統計部は、第1論理値の平均値が所定閾値以上のセルの第2論理値が1に設定され、第1論理値の平均値が所定閾値未満のセルが0に設定された第2行列を生成する。本態様によれば、第1論理値の平均値に応じて設定された第2行列の論理値に基づいて、特徴量の組み合わせを選定できる。
 (第2の実施形態)
 次に、第2の実施形態に係る特徴量選定装置について、図面を参照しながら説明する。本実施形態の特徴量選定装置は、第1の実施形態の手法で選定された特徴量を用いて、推定モデルを構築する。本実施形態の特徴量選定装置は、構築された推定モデルの推定結果に応じて、特徴量を選定する。
 (構成)
 図11は、本実施形態に係る特徴量選定装置20の構成の一例を示すブロック図である。特徴量選定装置20は、取得部21、構築部22、解析部23、統計部25、推定モデル構築部26、選定部27、および出力部29を備える。
 取得部21は、第1の実施形態の取得部11と同様の構成である。取得部21は、複数の被験者に関して計測された、身体状態の推定に用いられるデータセットを取得する。
 構築部22は、第1の実施形態の構築部12と同様の構成である。構築部22は、複数の被験者に関するデータセットの分布を変えて、新たなデータセット(再抽出データセットとも呼ばれる)を構築する。例えば、構築部22は、Leave-One-Subject-Out(LOSOとも呼ばれる)の手法を用いて、再抽出データセットを構築する。例えば、構築部12は、ブートストラップ法を用いて、再抽出データセットを構築してもよい。
 解析部23は、第1の実施形態の解析部13と同様の構成である。解析部23は、構築部22によって構築された再抽出データセットに関して、ラッソ回帰を実行する。解析部23は、正則化パラメータλの数の列と、特徴量の数の行とによって構成される行列(第1行列とも呼ばれる)を生成する。その結果、変化させた正則化パラメータλの数の列を有する第1行列が生成される。
 統計部25は、第1の実施形態の統計部15と同様の構成である。統計部25は、被験者ごとに生成された複数パターンの第1行列の各セルに、論理値(0、1)を割り当てる第1統計処理を実行する。統計部25は、第1統計処理において、複数の第1行列に関して、非ゼロ要素をTRUE(1)、ゼロ要素をFALSE(0)に設定する。
 統計部25は、全ての第1行列に関して、セルごとの論理値(0、1)を集計して、非ゼロ要素の論理値(1)をセルごとに加算する第2統計処理を実行する。統計部25は、第1行列の各セルの集計値に応じて、第2行列の各セルに論理値(0または1)を割り当てる。第2行列の各セルに関して、集計値が所定の閾値以上の場合、統計部25は、そのセルをTRUE(1)に設定する。一方、集計値が所定の閾値を下回る場合、統計部25は、そのセルをFALSE(0)に設定する。
 推定モデル構築部26は、選定部27によって選定された特徴量を用いた学習により、推定モデルを構築する。推定モデル構築部26は、構築された推定モデルを評価する。例えば、推定モデル構築部26は、平均平方二乗誤差や、平均絶対誤差、平均相対誤差、決定係数、相関係数などの評価指標を計算する。推定モデル構築部26は、算出された評価指標を選定部27に出力する。例えば、推定モデルの評価結果を、ユーザが確認可能な画面に表示させてもよい。その場合、ユーザは、画面に表示された評価結果に応じて、最尤な特徴量の組み合わせを選定できる。
 選定部27は、推定モデル構築部26によって算出された評価指標が最も高い特徴量の組み合わせを選択する。例えば、選定部27は、ユーザによって入力された指示に応じて、最尤な特徴量を選定してもよい。
 出力部29は、第1の実施形態の出力部19と同様の構成である。出力部29は、選定部27によって選定された特徴量に関する情報(選定情報とも呼ぶ)を出力する。出力部29から出力された選定情報は、計測装置等によって計測されたセンサデータから特徴量を抽出するための条件として用いられる。例えば、選定部27によって選定情報は、図示しない記憶部に記憶させてもよい。例えば、選定情報に応じて抽出される特徴量は、身体状態などを推定するための推定モデルの学習に用いられる。例えば、抽出対象の特徴量は、身体状態の推定対象のユーザに装着された計測装置等によって計測されるセンサデータから抽出される。
 (動作)
 次に、本実施形態の特徴量選定装置20の動作について、図面を参照しながら説明する。図12~図13は、特徴量選定装置20の動作の一例について説明するためのフローチャートである。図12~図13のフローチャートを用いた説明においては、特徴量選定装置20を動作主体として説明する。
 図12において、まず、特徴量選定装置20は、N個のデータセットを取得する(ステップS211)。データセットの番号は、データセットに含まれる説明変数(特徴量)の番号(特徴量番号)に相当する。
 次に、特徴量選定装置20は、特徴量番号nを1にセットする(ステップS212)。nは、データセット(特徴量)の番号である。
 次に、特徴量選定装置20は、n番目の被験者のデータを除外する(ステップS213)。
 次に、特徴量選定装置20は、n番目の被験者のデータが除外されたN-1個のデータセットに関して、ラッソ回帰を実行する(ステップS214)。
 次に、特徴量選定装置20は、第1統計処理を実行する(ステップS215)。特徴量選定装置20は、第1統計処理として、ラッソ回帰によって生成された第1行列(行列Bn)の各セルに論理値を割り当てる。例えば、特徴量選定装置20は、行列Bnの非ゼロ要素をTRUE(1)に設定し、行列Bnのゼロ要素をFALSE(0)に設定する。例えば、特徴量選定装置20は、行列Bnの要素の値が閾値T0以上のセルをTRUE(1)に設定し、行列Bnの要素の値が閾値T0を下回るセルをFALSE(0)に設定してもよい。
 次に、特徴量選定装置20は、特徴量番号nをインクリメント(+1)する(ステップS216)。
 ここで、データセットの個数Nよりも特徴量番号nが小さい場合(ステップS217でYes)、ステップS213に戻る。一方、特徴量番号nがデータセットの個数N以上の場合(ステップS217でNo)、図13のステップS221に進む。
 図12のステップS217でNoの場合、特徴量選定装置20は、第2統計処理を実行する(ステップS221)。特徴量選定装置20は、第2統計処理として、全ての第1行列に関して、セルごとの論理値(0、1)を集計する。特徴量選定装置20は、集計された第1行列の各セルに関する論理値の和を、第2行列の各セルに割り当てる。特徴量選定装置20は、第2行列の各セルの値に応じて、集計された第2行列の各セルに論理値(0または1)を設定する。例えば、特徴量選定装置20は、集計値が所定の閾値以上のセルを、TRUE(1)に設定する。一方、特徴量選定装置20は、集計値が所定の閾値を下回るセルを、FALSE(0)に設定する。
 次に、特徴量選定装置20は、モデル評価処理を実行する(ステップS222)。ステップS222のモデル評価処理については、後述する(図14)。
 次に、特徴量選定装置20は、モデル評価処理によって得られた評価指標に応じたλ番号を検索する(ステップS223)。
 次に、特徴量選定装置20は、検索されたλ番号に対応する特徴量の組み合わせを選定する(ステップS224)。
 次に、特徴量選定装置20は、選定された特徴量に関する情報(選定情報)を出力する(ステップS225)。特徴量選定装置20から出力された選定情報は、計測装置等によって計測されたセンサデータから特徴量を抽出するための条件として用いられる。
 〔モデル評価処理〕
 次に、図13のステップS222のモデル評価処理について、図面を参照しながら説明する。図14は、モデル評価処理について説明するためのフローチャートである。図14のフローチャートを用いた説明においては、特徴量選定装置20を動作主体として説明する。
 図14において、まず、特徴量選定装置20は、λ番号mを1にセットする(ステップS231)。mは、正則化パラメータλの番号である。
 次に、特徴量選定装置20は、λ番号mに対応する特徴量の組み合わせを選択する(ステップS232)。
 次に、特徴量選定装置20は、選択された特徴量を用いて、推定モデルを構築する(ステップS233)。
 次に、特徴量選定装置20は、構築された推定モデルを評価する(ステップS234)。
 次に、特徴量選定装置20は、推定モデルの評価指標を出力する(ステップS235)。
 次に、特徴量選定装置20は、λ番号mをインクリメント(+1)する(ステップS236)。
 ここで、正則化パラメータλの個数Pよりもλ番号mが小さい場合(ステップS237でYes)、ステップS232に戻る。一方、λ番号mが正則化パラメータλの個数P以上の場合(ステップS237でYes)、図13のステップS223に進む。
 以上のように、本実施形態の特徴量選定装置は、取得部、構築部、解析部、統計部、選定部、推定モデル構築部、および出力部を備える。取得部は、複数のデータセットを取得する。構築部は、データセットに含まれるデータの分布を変更して複数の再抽出データセットを構築する。解析部は、ラッソ回帰の手法を用いて、複数の再抽出データセットを解析する。統計部は、複数の再抽出データセットの解析結果に応じて、複数の再抽出データセットに含まれる要素の値を集計する。統計部は、要素の値の集計結果に応じて、複数の再抽出データセットに含まれる要素に論理値を設定する。選定部は、予め設定された特定ルールに従って、要素に設定された論理値の値に応じた組み合わせの特徴量を選定する。推定モデル構築部は、選定された特徴量を用いた学習により推定モデルを構築し、構築された推定モデルを評価する。選定部は、推定モデルの評価結果に応じて、特徴量の組み合わせを選定する。出力部は、選定された特徴量の組み合わせに関する選定情報を出力する。
 本実施形態では、選定部によって選定された特徴量を用いて構築された推定モデルの評価結果に応じて、特徴量を選定する。そのため、本実施形態によれば、推定モデルの評価結果を用いることで、信頼性の高い特徴量を選定できる。
 (第3の実施形態)
 次に、第3の実施形態に係る特徴量選定装置について図面を参照しながら説明する。本実施形態の特徴量選定装置は、第1統計処理を省略し、複数の第1行列に関する各セルの平均値に関して第2統計処理を実行する点において、第1の実施形態とは異なる。
 (構成)
 図15は、本実施形態に係る特徴量選定装置30の構成の一例を示すブロック図である。特徴量選定装置30は、取得部31、構築部32、解析部33、統計部35、3選定部37、および出力部39を備える。
 取得部31は、第1の実施形態の取得部11と同様の構成である。取得部31は、複数の被験者に関して計測された、身体状態の推定に用いられるデータセットを取得する。
 構築部32は、第1の実施形態の構築部12と同様の構成である。構築部32は、複数の被験者に関するデータセットの分布を変えて、新たなデータセット(再抽出データセットとも呼ばれる)を構築する。例えば、構築部32は、Leave-One-Subject-Out(LOSOとも呼ばれる)の手法を用いて、再抽出データセットを構築する。例えば、構築部32は、ブートストラップ法を用いて、再抽出データセットを構築してもよい。
 解析部33は、第1の実施形態の解析部13と同様の構成である。解析部33は、構築部32によって構築された再抽出データセットに関して、ラッソ回帰を実行する。解析部33は、正則化パラメータλの数の列と、特徴量の数の行とによって構成される行列(第1行列とも呼ばれる)を生成する。その結果、変化させた正則化パラメータλの数の列を有する第1行列が生成される。
 統計部35は、被験者ごとに生成された複数パターンの第1行列について、各セルの平均値を計算する。統計部35は、複数パターンの第1行列の各セルに、各セルの平均値が割り当てられた第2行列を生成する。例えば、統計部35は、第2行列の各セルに関して、集計値の平均値が所定の閾値以上のセルをTRUE(1)に設定する。一方、統計部35は、集計値の平均値が所定の閾値を下回るセルをFALSE(0)に設定する。この処理は、第2統計処理に含まれる。
 選定部37は、第1の実施形態の選定部17と同様の構成である。選定部17は、予め設定された特定ルールに基づいて、λ番号を選択する。選定部17は、特定ルールに基づいて、選択されたλ番号のセルがTRUE(1)に設定された特徴量の組み合わせを選定する。
 出力部39は、第1の実施形態の出力部19と同様の構成である。出力部39は、選定部27によって選定された特徴量に関する情報(選定情報とも呼ぶ)を出力する。出力部39から出力された選定情報は、計測装置等によって計測されたセンサデータから特徴量を抽出するための条件として用いられる。例えば、選定部37によって選定情報は、図示しない記憶部に記憶させてもよい。例えば、選定情報に応じて抽出される特徴量は、身体状態などを推定するための推定モデルの学習に用いられる。例えば、抽出対象の特徴量は、身体状態の推定対象のユーザに装着された計測装置等によって計測されるセンサデータから抽出される。
 (動作)
 次に、本実施形態の特徴量選定装置30の動作について、図面を参照しながら説明する。図16~図17は、特徴量選定装置30の動作の一例について説明するためのフローチャートである。図16~図17のフローチャートを用いた説明においては、特徴量選定装置30を動作主体として説明する。
 図16において、まず、特徴量選定装置30は、N個のデータセットを取得する(ステップS311)。データセットの番号は、データセットに含まれる説明変数(特徴量)の番号(特徴量番号)に相当する。
 次に、特徴量選定装置30は、特徴量番号nを1にセットする(ステップS312)。nは、データセット(特徴量)の番号である。
 次に、特徴量選定装置30は、n番目の被験者のデータを除外する(ステップS313)。
 次に、特徴量選定装置30は、n番目の被験者のデータが除外されたN-1個のデータセットに関して、ラッソ回帰を実行する(ステップS314)。
 次に、特徴量選定装置30は、特徴量番号nをインクリメント(+1)する(ステップS315)。
 ここで、データセットの個数Nよりも特徴量番号nが小さい場合(ステップS316でYes)、ステップS313に戻る。一方、特徴量番号nがデータセットの個数N以上の場合(ステップS316でNo)、図17のステップS321に進む。
 図16のステップS316でNoの場合、特徴量選定装置30は、第2統計処理を実行する(ステップS321)。第2統計処理の第1段階として、特徴量選定装置30は、被験者ごとに生成された複数パターンの第1行列の各セルに、各セルの平均値が割り当てられた第2行列を生成する。第2統計処理の第2段階として、特徴量選定装置30は、第2統計処理として、生成された第2行列に関して、セルごとに論理値(0、1)を設定する。例えば、特徴量選定装置30は、第2行列の各セルに関して、集計値の平均値が所定の閾値以上のセルをTRUE(1)に設定する。一方、特徴量選定装置30は、集計値の平均値が所定の閾値を下回るセルをFALSE(0)に設定する。
 次に、特徴量選定装置30は、第2統計処理の結果に応じて、特定ルールに基づいてλ番号を選択する(ステップS322)。
 次に、特徴量選定装置30は、選択されたλ番号に対応する特徴量の組み合わせを選定する(ステップS323)。
 次に、特徴量選定装置30は、選定された特徴量に関する情報(選定情報)を出力する(ステップS324)。特徴量選定装置30から出力された選定情報は、計測装置等によって計測されたセンサデータから特徴量を抽出するための条件として用いられる。
 以上のように、本実施形態の特徴量選定装置は、取得部、構築部、解析部、統計部、選定部、および出力部を備える。取得部は、複数のデータセットを取得する。構築部は、データセットに含まれるデータの分布を変更して複数の再抽出データセットを構築する。解析部は、ラッソ回帰の手法を用いて、複数の再抽出データセットを解析する。統計部は、複数の再抽出データセットの解析結果に応じて、複数の再抽出データセットに含まれる要素の値を集計する。統計部は、要素の値の集計結果に応じて、複数の再抽出データセットに含まれる要素に論理値を設定する。選定部は、予め設定された特定ルールに従って、要素に設定された論理値の値に応じた組み合わせの特徴量を選定する。出力部は、選定された特徴量の組み合わせに関する選定情報を出力する。
 本実施形態において、解析部は、複数の再抽出データセットの各々に関して、予め設定された複数の正則化パラメータごとにラッソ回帰を実行する。解析部は、ラッソ回帰で用いられた正則化パラメータに対応する列と、特徴量に対応する行とによって構成される複数パターンの第1行列を生成する。統計部は、複数パターンの第1行列を構成するセルごとに要素の値を集計する。統計部は、要素の値の平均値が所定閾値以上のセルに第2論理値として1が設定され、要素の値の平均値が所定閾値未満のセルに第2論理値として0が設定された第2行列を生成する第2統計処理を実行する。選定部は、予め設定された特定ルールに従って第2行列の列を選択し、選択された列に対応する特徴量の組み合わせを選定する。
 本実施形態によれば、データの分布を変えてラッソ回帰することによって、飛び値や外れ値の影響をそのまま受けた場合と比較して、真値により近い平均的な値の特徴量を求めることができる。そのため、本実施形態によれば、飛び値や外れ値に対するロバスト性の高い特徴量を選定できる。
 (第4の実施形態)
 次に、第4の実施形態に係る特徴量選定装置について図面を参照しながら説明する。本実施形態の特徴量選定装置は、第1~第3の実施形態の特徴量選定装置を簡略化した構成である。
 図18は、本実施形態に係る特徴量選定装置40の構成の一例を示すブロック図である。特徴量選定装置40は、取得部41、構築部42、解析部43、統計部45、選定部47、および出力部49を備える。
 取得部41は、複数のデータセットを取得する。構築部42は、データセットに含まれるデータの分布を変更して複数の再抽出データセットを構築する。解析部43は、ラッソ回帰の手法を用いて、複数の再抽出データセットを解析する。統計部45は、複数の再抽出データセットの解析結果に応じて、複数の再抽出データセットに含まれる要素の値を集計する。統計部45は、要素の値の集計結果に応じて、複数の再抽出データセットに含まれる要素に論理値を設定する。選定部47は、予め設定された特定ルールに従って、要素に設定された論理値の値に応じた組み合わせの特徴量を選定する。出力部49は、選定された特徴量の組み合わせに関する選定情報を出力する。
 本実施形態によれば、データの分布を変えてラッソ回帰することによって、飛び値や外れ値の影響をそのまま受けた場合と比較して、真値により近い平均的な値の特徴量を求めることができる。そのため、本実施形態によれば、飛び値や外れ値に対するロバスト性の高い特徴量を選定できる。
 (第5の実施形態)
 次に、第5の実施形態に係る学習システムについて図面を参照しながら説明する。本実施形態の学習システムは、第1~第4の実施形態の特徴量選定装置によって選定された特徴量を用いた学習を実行する。
 図19は、本実施形態に係る学習システム5の構成の一例を示すブロック図である。学習システム5は、歩容計測装置50および学習装置55を備える。歩容計測装置50と学習装置55は、有線で接続されてもよいし、無線で接続されてもよい。歩容計測装置50と学習装置55は、単一の装置で構成されてもよい。また、学習システム5の構成から歩容計測装置50を除き、学習装置55だけで学習システム5が構成されてもよい。図19には歩容計測装置50を一つしか図示していないが、左右両足に歩容計測装置50が一つずつ(計二つ)配置されてもよい。また、学習装置55は、歩容計測装置50に接続されず、予め歩容計測装置50によって生成されてデータベースに格納されていた特徴量データを用いて、学習を実行するように構成されてもよい。
 歩容計測装置50は、左右の足のうち少なくとも一方に設置される。歩容計測装置50は、第1の実施形態の歩容計測装置50と同様の構成である。歩容計測装置50は、加速度センサおよび角速度センサを含む。歩容計測装置50は、計測された物理量をデジタルデータ(センサデータとも呼ぶ)に変換する。歩容計測装置50は、センサデータの時系列データから、正規化された一歩行周期分の歩行波形データを生成する。歩容計測装置50は、身体状態の推定に用いられる特徴量データを生成する。歩容計測装置50は、生成された特徴量データを学習装置55に送信する。なお、歩容計測装置50は、学習装置55によってアクセスされるデータベース(図示しない)に、特徴量データを送信するように構成されてもよい。データベースに蓄積された特徴量データは、学習装置55の学習に用いられる。
 学習装置55は、歩容計測装置50から特徴量データを受信する。学習装置55が受信する特徴量データは、第1~第4の実施形態の特徴量選定装置によって選定された特徴量を含む。データベース(図示しない)に蓄積された特徴量データを用いる場合、学習装置55は、データベースから特徴量データを受信する。学習装置55は、受信された特徴量データを用いた学習を実行する。例えば、学習装置55は、複数の被験者の歩行波形データから抽出された特徴量データを説明変数とし、その特徴量データに応じた身体状態に関する値を目的変数とする教師データを学習する。学習装置55が実行する学習のアルゴリズムには、特に限定を加えない。学習装置55は、複数の被験者に関する教師データを用いて学習された推定モデルを生成する。学習装置55は、生成された推定モデルを記憶する。学習装置55によって学習された推定モデルは、学習装置55の外部の記憶装置に格納されてもよい。
 〔学習装置〕
 次に、学習装置55の詳細について図面を参照しながら説明する。図20は、学習装置55の詳細構成の一例を示すブロック図である。学習装置55は、受信部551、学習部553、および記憶部555を有する。
 受信部551は、歩容計測装置50から特徴量データを受信する。受信部551は、受信された特徴量データを学習部553に出力する。受信部551は、ケーブルなどの有線を介して特徴量データを歩容計測装置50から受信してもよいし、無線通信を介して特徴量データを歩容計測装置50から受信してもよい。例えば、受信部551は、Bluetooth(登録商標)やWiFi(登録商標)などの規格に則した無線通信機能(図示しない)を介して、特徴量データを歩容計測装置50から受信するように構成される。なお、受信部551の通信機能は、Bluetooth(登録商標)やWiFi(登録商標)以外の規格に則していてもよい。
 学習部553は、受信部551から特徴量データを取得する。学習部553は、取得した特徴量データを用いて学習を実行する。例えば、学習部553は、被験者の歩容に関して抽出された特徴量データを説明変数とし、その被験者の身体状態を目的変数とするデータセットを教師データとして学習する。例えば、学習部553は、被験者の握力や全身筋力、下肢筋力、移動能力、動的バランス、静的バランスなどの身体状態を学習対象とする。例えば、学習部553は、複数のユーザに関して学習された、特徴量データの入力に応じて身体状態を推定する推定モデルを生成する。例えば、学習部553は、性別や年齢、身長、体重などの属性データを含む説明変数を用いて、属性に応じた推定を行う推定モデルを生成する。学習部553は、複数の被験者に関して学習された推定モデルを記憶部555に記憶させる。
 例えば、学習部553は、線形回帰のアルゴリズムを用いた学習を実行する。例えば、学習部553は、サポートベクターマシン(SVM:Support Vector Machine)のアルゴリズムを用いた学習を実行する。例えば、学習部553は、ガウス過程回帰(GPR:Gaussian Process Regression)のアルゴリズムを用いた学習を実行する。例えば、学習部553は、ランダムフォレスト(RF:Random Forest)のアルゴリズムを用いた学習を実行する。例えば、学習部553は、特徴量データに応じて、その特徴量データの生成元の被験者を分類する教師なし学習を実行してもよい。学習部553が実行する学習のアルゴリズムには、特に限定を加えない。
 学習部553は、一歩行周期分の歩行波形データ(センサデータ)を説明変数として、学習を実行してもよい。例えば、学習部553は、3軸方向の加速度、3軸周りの角速度、3軸周りの角度(姿勢角)の歩行波形データを説明変数とし、推定対象である身体状態の正解値を目的変数とした教師あり学習を実行する。
 図21は、推定モデルを生成するための学習について説明するための概念図である。図21は、説明変数である特徴量F1~Fnと、目的変数である身体状態に関するスコアとのデータセットを教師データとして、学習部553に学習させる一例を示す概念図である。例えば、学習部553は、複数の被験者に関するデータを学習し、センサデータから抽出された特徴量の入力に応じて、被験者の身体状態に関する出力(推定値)を出力する推定モデルを生成する。
 記憶部555は、複数の被験者に関して学習された推定モデルを記憶する。例えば、記憶部555は、複数の被験者に関して学習された、身体状態を推定する推定モデルを記憶する。例えば、記憶部555に記憶された推定モデルは、後述する第6の実施形態の身体状態推定システムによる身体状態の推定に用いられる。
 以上のように、本実施形態の学習システムは、歩容計測装置および学習装置を備える。歩容計測装置は、足の動きに関するセンサデータの時系列データを取得する。歩容計測装置は、センサデータの時系列データから一歩行周期分の歩行波形データを抽出し、抽出された歩行波形データを正規化する。歩容計測装置は、正規化された歩行波形データから、推定対象の身体状態に関する特徴量を抽出する。歩容計測装置は、第1~第4の実施形態の特徴量選定装置によって選定された特徴量を抽出する。歩容計測装置は、抽出された特徴量を含む特徴量データを生成する。歩容計測装置は、生成された特徴量データを学習装置に出力する。
 学習装置は、受信部、学習部、および記憶部を有する。受信部は、歩容計測装置によって生成された特徴量データを取得する。学習部は、特徴量データを用いて学習を実行する。学習部は、ユーザの歩行に伴って計測されるセンサデータの時系列データから抽出される特徴量の入力に応じて、身体状態を出力する推定モデルを生成する。学習部によって生成された推定モデルは、記憶部に保存される。
 本実施形態の学習システムは、歩容計測装置によって計測された特徴量データを用いて、推定モデルを生成する。本実施形態の学習システムは、第1~第4の実施形態の特徴量選定装置によって選定された特徴量を用いた学習を実行する。そのため、本態様によれば、ロバスト性の高い特徴量を用いて、日常生活において身体状態を適宜推定することを可能とする推定モデルを生成できる。
 (第6の実施形態)
 次に、第6の実施形態に係る身体状態推定システムについて図面を参照しながら説明する。本実施形態の身体状態推定システムは、ユーザの歩行に応じた足の動きに関するセンサデータを計測する。本実施形態の身体状態推定システムは、計測されたセンサデータを用いて、そのユーザの身体状態を推定する。例えば、本実施形態の身体状態推定システムは、身体状態として、握力や膝伸展力などの筋力指標や、動的バランス、下肢筋力、移動能力、静的バランスなどを推定する。なお、センサデータは、モーションキャプチャーやスマートアパレル等を用いて計測された、歩容に関する特徴を含むセンサデータであってもよい。
 (構成)
 図22は、本実施形態に係る身体状態推定システム6の構成の一例を示すブロック図である。身体状態推定システム6は、歩容計測装置60と推定装置63を備える。本実施形態においては、歩容計測装置60と推定装置63が別々のハードウェアに構成される例について説明する。例えば、歩容計測装置60は、身体状態の推定対象である被験者(ユーザ)の履物等に設置される。例えば、推定装置63の機能は、被験者(ユーザ)の携帯する携帯端末にインストールされる。以下においては、歩容計測装置60および推定装置63の構成について、個別に説明する。
 〔歩容計測装置〕
 図23は、歩容計測装置60の構成の一例を示すブロック図である。歩容計測装置60は、センサ61と特徴量データ生成部62を有する。本実施形態においては、センサ61と特徴量データ生成部62が一体化された例を挙げる。センサ61と特徴量データ生成部62は、別々の装置として提供されてもよい。
 図23のように、センサ61は、加速度センサ611と角速度センサ612を有する。図23には、加速度センサ611と角速度センサ612が、センサ61に含まれる例を挙げる。センサ61には、加速度センサ611および角速度センサ612以外のセンサが含まれてもよい。センサ61に含まれうる加速度センサ611および角速度センサ612以外のセンサについては、説明を省略する。
 加速度センサ611は、3軸方向の加速度(空間加速度とも呼ぶ)を計測するセンサである。加速度センサ611は、足の動きに関する物理量として、加速度(空間加速度とも呼ぶ)を計測する。加速度センサ611は、計測した加速度を特徴量データ生成部62に出力する。例えば、加速度センサ611には、圧電型や、ピエゾ抵抗型、静電容量型等の方式のセンサを用いることができる。加速度センサ611として用いられるセンサは、加速度を計測できれば、その計測方式に限定を加えない。
 角速度センサ612は、3軸周りの角速度(空間角速度とも呼ぶ)を計測するセンサである。角速度センサ612は、足の動きに関する物理量として、角速度(空間角速度とも呼ぶ)を計測する。角速度センサ612は、計測した角速度を特徴量データ生成部62に出力する。例えば、角速度センサ612には、振動型や静電容量型等の方式のセンサを用いることができる。角速度センサ612として用いられるセンサは、角速度を計測できれば、その計測方式に限定を加えない。
 センサ61は、例えば、加速度や角速度を計測する慣性計測装置によって実現される。慣性計測装置の一例として、IMU(Inertial Measurement Unit)が挙げられる。IMUは、3軸方向の加速度を計測する加速度センサ611と、3軸周りの角速度を計測する角速度センサ612を含む。センサ61は、VG(Vertical Gyro)やAHRS(Attitude Heading)などの慣性計測装置によって実現されてもよい。また、センサ61は、GPS/INS(Global Positioning System/Inertial Navigation System)によって実現されてもよい。センサ61は、足の動きに関する物理量を計測できれば、慣性計測装置以外の装置によって実現されてもよい。
 図24は、右足の靴600の中に、歩容計測装置60が配置される一例を示す概念図である。図24の例では、足弓の裏側に当たる位置に、歩容計測装置60が設置される。例えば、歩容計測装置60は、靴600の中に挿入されるインソールに配置される。例えば、歩容計測装置60は、靴600の底面に配置されてもよい。例えば、歩容計測装置60は、靴600の本体に埋設されてもよい。歩容計測装置60は、靴600から着脱できてもよいし、靴600から着脱できなくてもよい。歩容計測装置60は、足の動きに関するセンサデータを計測できさえすれば、足弓の裏側ではない位置に設置されてもよい。また、歩容計測装置60は、ユーザが履いている靴下や、ユーザが装着しているアンクレット等の装飾品に設置されてもよい。また、歩容計測装置60は、足に直に貼り付けられたり、足に埋め込まれたりしてもよい。図24には、右足の靴600に歩容計測装置60が設置される例を示す。歩容計測装置60は、両足の靴600に設置されてもよい。
 図24の例では、歩容計測装置60(センサ61)を基準として、左右方向のx軸、前後方向のy軸、上下方向のz軸を含むローカル座標系が設定される。x軸は左方を正とし、y軸は後方を正とし、z軸は上方を正とする。センサ61に設定される軸の向きは、左右の足で同じでもよく、左右の足で異なっていてもよい。例えば、同じスペックで生産されたセンサ61が左右の靴600の中に配置される場合、左右の靴600に配置されるセンサ61の上下の向き(Z軸方向の向き)は、同じ向きである。その場合、左足に由来するセンサデータに設定されるローカル座標系の3軸と、右足に由来するセンサデータに設定されるローカル座標系の3軸とは、左右で同じにある。
 図25は、足弓の裏側に設置された歩容計測装置60(センサ61)に設定されるローカル座標系(x軸、y軸、z軸)と、地面に対して設定される世界座標系(X軸、Y軸、Z軸)について説明するための概念図である。世界座標系(X軸、Y軸、Z軸)では、進行方向に正対した状態のユーザが直立した状態で、ユーザの横方向がX軸方向(左向きが正)、ユーザの背面の方向がY軸方向(後ろ向きが正)、重力方向がZ軸方向(鉛直上向きが正)に設定される。なお、図25の例は、ローカル座標系(x軸、y軸、z軸)と世界座標系(X軸、Y軸、Z軸)の関係を概念的に示すものであり、ユーザの歩行に応じて変動するローカル座標系と世界座標系の関係を正確に示すものではない。
 図26は、人体に対して設定される面(人体面とも呼ぶ)について説明するための概念図である。本実施形態では、身体を左右に分ける矢状面、身体を前後に分ける冠状面、身体を水平に分ける水平面が定義される。なお、図26のように、足の中心線を進行方向に向けて直立した状態では、世界座標系とローカル座標系が一致する。本実施形態においては、x軸を回転軸とする矢状面内の回転をロール、y軸を回転軸とする冠状面内の回転をピッチ、z軸を回転軸とする水平面内の回転をヨーと定義する。また、x軸を回転軸とする矢状面内の回転角をロール角、y軸を回転軸とする冠状面内の回転角をピッチ角、z軸を回転軸とする水平面内の回転角をヨー角と定義する。
 図23のように、特徴量データ生成部62(特徴量データ生成装置とも呼ぶ)は、取得部621、正規化部622、抽出部623、生成部625、および特徴量データ出力部627を有する。例えば、特徴量データ生成部62は、歩容計測装置60の全体制御やデータ処理を行うマイクロコンピュータまたはマイクロコントローラによって実現される。例えば、特徴量データ生成部62は、CPU(Central Processing Unit)やRAM(Random Access Memory)、ROM(Read Only Memory)、フラッシュメモリ等を有する。特徴量データ生成部62は、加速度センサ611および角速度センサ612を制御して、角速度や加速度を計測する。例えば、特徴量データ生成部62は、被験者(ユーザ)の携帯する携帯端末(図示しない)の側に実装されてもよい。
 取得部621は、加速度センサ611から、3軸方向の加速度を取得する。また、取得部621は、角速度センサ612から、3軸周りの角速度を取得する。例えば、取得部621は、取得された角速度および加速度等の物理量(アナログデータ)をAD変換(Analog-to-Digital Conversion)する。なお、加速度センサ611および角速度センサ612によって計測された物理量(アナログデータ)は、加速度センサ611および角速度センサ612の各々においてデジタルデータに変換されてもよい。取得部621は、変換後のデジタルデータ(センサデータとも呼ぶ)を正規化部622に出力する。取得部621は、図示しない記憶部に、センサデータを記憶させるように構成されてもよい。センサデータには、デジタルデータに変換された加速度データと、デジタルデータに変換された角速度データとが少なくとも含まれる。加速度データは、3軸方向の加速度ベクトルを含む。角速度データは、3軸周りの角速度ベクトルを含む。加速度データおよび角速度データには、それらのデータの取得時間が紐付けられる。また、取得部621は、加速度データおよび角速度データに対して、実装誤差や温度補正、直線性補正などの補正を加えてもよい。
 正規化部622は、取得部621からセンサデータを取得する。正規化部622は、センサデータに含まれる3軸方向の加速度および3軸周りの角速度の時系列データから、一歩行周期分の時系列データ(歩行波形データとも呼ぶ)を抽出する。正規化部622は、抽出された一歩行周期分の歩行波形データの時間を、0~100%(パーセント)の歩行周期に正規化(第1正規化とも呼ぶ)する。0~100%の歩行周期に含まれる1%や10%などのタイミングを、歩行フェーズとも呼ぶ。また、正規化部622は、第1正規化された一歩行周期分の歩行波形データに関して、立脚相が60%、遊脚相が40%になるように正規化(第2正規化とも呼ぶ)する。立脚相は、足の裏側の少なくとも一部が地面に接している期間である。遊脚相は、足の裏側が地面から離れている期間である。歩行波形データを第2正規化すれば、特徴量が抽出される歩行フェーズのずれが、外乱の影響でぶれることを抑制できる。
 図27は、右足を基準とする一歩行周期について説明するための概念図である。左足を基準とする一歩行周期も、右足と同様である。図27の横軸は、右足の踵が地面に着地した時点を起点とし、次に右足の踵が地面に着地した時点を終点とする右足の一歩行周期である。図27の横軸は、一歩行周期を100%として第1正規化されている。また、図27の横軸は、立脚相が60%、遊脚相が40%になるように第2正規化されている。片足の一歩行周期は、足の裏側の少なくとも一部が地面に接している立脚相と、足の裏側が地面から離れている遊脚相とに大別される。立脚相は、さらに、荷重応答期T1、立脚中期T2、立脚終期T3、遊脚前期T4に細分される。遊脚相は、さらに、遊脚初期T5、遊脚中期T6、遊脚終期T7に細分される。なお、図27は一例であって、一歩行周期を構成する期間や、それらの期間の名称等を限定するものではない。
 図27のように、歩行においては、複数の事象(歩行イベントとも呼ぶ)が発生する。E1は、右足の踵が接地する事象(踵接地)を表す(HC:Heel Contact)。E2は、右足の足裏が接地した状態で、左足の爪先が地面から離れる事象(反対足爪先離地)を表す(OTO:Opposite Toe Off)。E3は、右足の足裏が接地した状態で、右足の踵が持ち上がる事象(踵持ち上がり)を表す(HR:Heel Rise)。E4は、左足の踵が接地した事象(反対足踵接地)である(OHS:Opposite Heel Strike)。E5は、左足の足裏が接地した状態で、右足の爪先が地面から離れる事象(爪先離地)を表す(TO:Toe Off)。E6は、左足の足裏が接地した状態で、左足と右足が交差する事象(足交差)を表す(FA:Foot Adjacent)。E7は、左足の足裏が接地した状態で、右足の脛骨が地面に対してほぼ垂直になる事象(脛骨垂直)を表す(TV:Tibia Vertical)。E8は、右足の踵が接地する事象(踵接地)を表す(HC:Heel Contact)。E8は、E1から始まる歩行周期の終点に相当するとともに、次の歩行周期の起点に相当する。なお、図27は一例であって、歩行において発生する事象や、それらの事象の名称を限定するものではない。
 図28は、進行方向加速度(Y方向加速度)の時系列データ(実線)から、踵接地HCや爪先離地TOを検出する一例について説明するための図である。踵接地HCのタイミングは、進行方向加速度(Y方向加速度)の時系列データに表れる極大ピークの直後の極小ピークのタイミングである。踵接地HCのタイミングの目印になる極大ピークは、一歩行周期分の歩行波形データの最大ピークに相当する。連続する踵接地HCの間の区間が、一歩行周期である。爪先離地TOのタイミングは、進行方向加速度(Y方向加速度)の時系列データに変動が表れない立脚相の期間の後に表れる極大ピークの立ち上がりのタイミングである。図28には、ロール角(X軸周り角速度)の時系列データ(破線)も示す。ロール角が最小のタイミングと、ロール角が最大のタイミングとの中点のタイミングが、立脚中期に相当する。例えば、歩行速度や、歩幅、分回し、内旋/外旋、底屈/背屈などのパラメータ(歩容パラメータとも呼ぶ)は、立脚中期を基準として求めることができる。
 図29は、正規化部622によって正規化された歩行波形データの一例について説明するための図である。正規化部622は、進行方向加速度(Y方向加速度)の時系列データから、踵接地HCと爪先離地TOを検出する。正規化部622は、連続する踵接地HCの間の区間を、一歩行周期分の歩行波形データとして抽出する。正規化部622は、第1正規化によって、一歩行周期分の歩行波形データの横軸(時間軸)を、0~100%の歩行周期に変換する。図29には、第1正規化後の歩行波形データを破線で示す。第1正規化後の歩行波形データ(破線)では、爪先離地TOのタイミングが60%からずれている。
 図29の例において、正規化部622は、歩行フェーズが0%の踵接地HCから、その踵接地HCに後続する爪先離地TOまでの区間を0~60%に正規化する。また、正規化部622は、爪先離地TOから、爪先離地TOに後続する歩行フェーズが100%の踵接地HCまでの区間を60~100%に正規化する。その結果、一歩行周期分の歩行波形データは、歩行周期が0~60%の区間(立脚相)と、歩行周期が60~100%の区間(遊脚相)とに正規化される。図8には、第2正規化後の歩行波形データを実線で示す。第2正規化後の歩行波形データ(実線)では、爪先離地TOのタイミングが60%に一致する。
 図28~図29には、進行方向加速度(Y方向加速度)に基づいて、一歩行周期分の歩行波形データを抽出/正規化する例を示した。進行方向加速度(Y方向加速度)以外の加速度/角速度に関して、正規化部622は、進行方向加速度(Y方向加速度)の歩行周期に合わせて、一歩行周期分の歩行波形データを抽出/正規化する。また、正規化部622は、3軸周りの角速度の時系列データを積分することで、3軸周りの角度の時系列データを生成してもよい。その場合、正規化部622は、3軸周りの角度に関しても、進行方向加速度(Y方向加速度)の歩行周期に合わせて、一歩行周期分の歩行波形データを抽出/正規化する。
 正規化部622は、進行方向加速度(Y方向加速度)以外の加速度/角速度に基づいて、一歩行周期分の歩行波形データを抽出/正規化してもよい(図面は省略)。例えば、正規化部622は、垂直方向加速度(Z方向加速度)の時系列データから、踵接地HCや爪先離地TOを検出してもよい。踵接地HCのタイミングは、垂直方向加速度(Z方向加速度)の時系列データに表れる急峻な極小ピークのタイミングである。急峻な極小ピークのタイミングにおいては、垂直方向加速度(Z方向加速度)の値がほぼ0になる。踵接地HCのタイミングの目印になる極小ピークは、一歩行周期分の歩行波形データの最小ピークに相当する。連続する踵接地HCの間の区間が、一歩行周期である。爪先離地TOのタイミングは、垂直方向加速度(Z方向加速度)の時系列データが、踵接地HCの直後の極大ピークの後に変動の小さい区間を経た後に、なだらかに増大する途中の変曲点のタイミングである。また、正規化部622は、進行方向加速度(Y方向加速度)および垂直方向加速度(Z方向加速度)の両方に基づいて、一歩行周期分の歩行波形データを抽出/正規化してもよい。また、正規化部622は、進行方向加速度(Y方向加速度)および垂直方向加速度(Z方向加速度)以外の加速度や角速度、角度等に基づいて、一歩行周期分の歩行波形データを抽出/正規化してもよい。
 抽出部623は、正規化部622によって正規化された一歩行周期分の歩行波形データを取得する。抽出部623は、一歩行周期分の歩行波形データから、身体状態の推定に用いられる特徴量を抽出する。抽出部623は、予め設定された条件に基づいて、時間的に連続する歩行フェーズを統合した歩行フェーズクラスターから、歩行フェーズクラスターごとの特徴量を抽出する。歩行フェーズクラスターは、少なくとも一つの歩行フェーズを含む。歩行フェーズクラスターには、単一の歩行フェーズも含まれる。身体状態の推定に用いられる特徴量が抽出される歩行波形データや歩行フェーズについては、後述する。
 図30は、一歩行周期分の歩行波形データから、身体状態を推定するための特徴量を抽出することについて説明するための概念図である。例えば、抽出部623は、時間的に連続する歩行フェーズI~I+mを、歩行フェーズクラスターCとして抽出する(I、mは自然数)。歩行フェーズクラスターCは、m個の歩行フェーズ(構成要素)を含む。すなわち、歩行フェーズクラスターCを構成する歩行フェーズ(構成要素)の数(構成要素数とも呼ぶ)は、mである。図30には、歩行フェーズが整数値の例を挙げるが、歩行フェーズは小数点以下まで細分化されてもよい。歩行フェーズが小数点以下まで細分化される場合、歩行フェーズクラスターCの構成要素数は、歩行フェーズクラスターの区間のデータ点数に応じた数になる。抽出部623は、歩行フェーズI~I+mの各々から特徴量を抽出する。歩行フェーズクラスターCが単一の歩行フェーズJによって構成される場合、抽出部623は、その単一の歩行フェーズJから特徴量を抽出する(Jは自然数)。
 生成部625は、歩行フェーズクラスターを構成する歩行フェーズの各々から抽出された特徴量(第1特徴量)に特徴量構成式を適用して、歩行フェーズクラスターの特徴量(第2特徴量)を生成する。特徴量構成式は、歩行フェーズクラスターの特徴量を生成するために、予め設定された計算式である。例えば、特徴量構成式は、四則演算に関する計算式である。例えば、特徴量構成式を用いて算出される第2特徴量は、歩行フェーズクラスターに含まれる各歩行フェーズにおける第1特徴量の積分平均値や算術平均値、傾斜、ばらつきなどである。例えば、生成部625は、歩行フェーズクラスターを構成する歩行フェーズの各々から抽出された第1特徴量の傾斜やばらつきを算出する計算式を、特徴量構成式として適用する。例えば、歩行フェーズクラスターが単独の歩行フェーズで構成される場合は、傾斜やばらつきを算出できないため、積分平均値や算術平均値などを計算する特徴量構成式を用いればよい。
 特徴量データ出力部627は、生成部625によって生成された歩行フェーズクラスターごとの特徴量データを出力する。特徴量データ出力部627は、生成された歩行フェーズクラスターの特徴量データを、その特徴量データを使用する推定装置63に出力する。
 〔推定装置〕
 図31は、推定装置63の構成の一例を示すブロック図である。推定装置63は、データ取得部631、記憶部632、推定部633、および出力部635を有する。
 データ取得部631は、歩容計測装置60から特徴量データを取得する。データ取得部631は、受信された特徴量データを推定部633に出力する。データ取得部631は、ケーブルなどの有線を介して特徴量データを歩容計測装置60から受信してもよいし、無線通信を介して特徴量データを歩容計測装置60から受信してもよい。例えば、データ取得部631は、Bluetooth(登録商標)やWiFi(登録商標)などの規格に則した無線通信機能(図示しない)を介して、特徴量データを歩容計測装置60から受信するように構成される。なお、データ取得部631の通信機能は、Bluetooth(登録商標)やWiFi(登録商標)以外の規格に則していてもよい。
 記憶部632は、歩行波形データから抽出された特徴量データを用いて、身体状態を推定する推定モデルを記憶する。記憶部632は、複数の被験者の身体状態に関する特徴量データと、その身体状態との関係を学習した推定モデルを記憶する。例えば、記憶部632は、複数の被験者に関して学習された、身体状態を推定する推定モデルを記憶する。例えば、記憶部632は、属性に応じた推定モデルを記憶してもよい。
 推定モデルは、製品の工場出荷時や、身体状態推定システム6をユーザが使用する前のキャリブレーション時等のタイミングで、記憶部632に記憶させておけばよい。例えば、外部のサーバ等の記憶装置に保存された推定モデルを用いるように構成してもよい。その場合、その記憶装置と接続されたインターフェース(図示しない)を介して、推定モデルを用いるように構成すればよい。
 推定部633は、データ取得部631から特徴量データを取得する。推定部633は、取得された特徴量データを用いて、身体状態の推定を実行する。推定部633は、記憶部632に記憶された推定モデルに特徴量データを入力する。推定部633は、推定モデルから出力される身体状態に応じた推定結果を出力する。クラウドやサーバ等に構築された外部の記憶装置に保存された推定モデルを用いる場合、推定部633は、その記憶装置と接続されたインターフェース(図示しない)を介して、推定モデルを用いるように構成される。
 出力部635は、推定部633による身体状態の推定結果を出力する。例えば、出力部635は、被験者(ユーザ)の携帯端末の画面に、身体状態の推定結果を表示させる。例えば、出力部635は、推定結果を使用する外部システム等に対して、その推定結果を出力する。推定装置63から出力された身体状態の使用に関しては、特に限定を加えない。
 例えば、推定装置63は、被験者(ユーザ)が携帯する携帯端末(図示しない)を介して、クラウドやサーバに構築された外部システム等に接続される。携帯端末(図示しない)は、携帯可能な通信機器である。例えば、携帯端末は、スマートフォンや、スマートウォッチ、携帯電話等の通信機能を有する携帯型の通信機器である。例えば、推定装置63は、ケーブルなどの有線を介して、携帯端末に接続される。例えば、推定装置63は、無線通信を介して、携帯端末に接続される。例えば、推定装置63は、Bluetooth(登録商標)やWiFi(登録商標)などの規格に則した無線通信機能(図示しない)を介して、携帯端末に接続される。なお、推定装置63の通信機能は、Bluetooth(登録商標)やWiFi(登録商標)以外の規格に則していてもよい。身体状態の推定結果は、携帯端末にインストールされたアプリケーションによって使用されてもよい。その場合、携帯端末は、その携帯端末にインストールされたアプリケーションソフトウェア等によって、推定結果を用いた処理を実行する。
 図32は、第5の実施形態の学習システムによって、身体状態を推定するために予め構築された推定モデル651に、ユーザの歩行に伴って計測されたセンサデータから抽出される特徴量F1~Fnを入力して、身体状態に関するスコアが出力される一例を示す概念図である。推定モデル651は、特徴量F1~Fnの入力に応じて、身体状態のスコアを出力する。例えば、推定モデル651は、身体状態の推定に用いられる特徴量F1~Fnを説明変数とし、身体状態を目的変数とする教師データを用いた学習で生成される。身体状態を推定するための特徴量データの入力に応じて、身体状態に関する推定結果が出力されれば、推定モデル651の推定結果には限定を加えない。例えば、推定モデル651は、身体状態の推定に用いられる特徴量F1~Fnに加えて、性別や年齢、身長、体重などの属性を説明変数として、身体状態を推定するモデルであってもよい。
 例えば、記憶部632には、重回帰予測法を用いて、身体状態を推定する推定モデルが記憶される。例えば、記憶部632には、以下の式1を用いて、身体状態のスコアSを推定するためのパラメータが記憶される。
S=f1×F1+f2×F2+・・・+fn×Fn+f0・・・(1)
上記の式1において、F1、F2、・・・、Fnは、身体状態の推定に用いられる歩行フェーズクラスターごとの特徴量である。f1、f2、・・・、fnは、F1、F2、・・・、Fnに掛け合わされる係数である。f0は、定数項である。例えば、記憶部632には、f1、f2、・・・、fnなどの係数を記憶させておく。
 (動作)
 次に、身体状態推定システム6の動作について図面を参照しながら説明する。ここでは、身体状態推定システム6に含まれる歩容計測装置60および推定装置63について、個別に説明する。歩容計測装置60に関しては、歩容計測装置60に含まれる特徴量データ生成部62の動作について説明する。
 〔歩容計測装置〕
 図33は、歩容計測装置60に含まれる特徴量データ生成部62の動作について説明するためのフローチャートである。図33のフローチャートに沿った説明においては、特徴量データ生成部62を動作主体として説明する。
 図33において、まず、特徴量データ生成部62は、歩容に関するセンサデータの時系列データを取得する(ステップS601)。
 次に、特徴量データ生成部62は、センサデータの時系列データから一歩行周期分の歩行波形データを抽出する(ステップS602)。特徴量データ生成部62は、センサデータの時系列データから踵接地および爪先離地を検出する。特徴量データ生成部62は、連続する踵接地間の区間の時系列データを、一歩行周期分の歩行波形データとして抽出する。
 次に、特徴量データ生成部62は、抽出された一歩行周期分の歩行波形データを正規化する(ステップS603)。特徴量データ生成部62は、一歩行周期分の歩行波形データを0~100%の歩行周期に正規化する(第1正規化)。さらに、特徴量データ生成部62は、第1正規化された一歩行周期分の歩行波形データの立脚相と遊脚相の比を60:40に正規化する(第2正規化)。
 次に、特徴量データ生成部62は、正規化された歩行波形に関して、身体状態の推定に用いられる歩行フェーズから特徴量を抽出する(ステップS604)。例えば、特徴量データ生成部62は、性別ごとに構築された推定モデルに入力される特徴量を抽出する。
 次に、特徴量データ生成部62は、抽出された特徴量を用いて、歩行フェーズクラスターごとの特徴量を生成する(ステップS605)。
 次に、特徴量データ生成部62は、歩行フェーズクラスターごとの特徴量を統合して、一歩行周期分の特徴量データを生成する(ステップS606)。
 次に、特徴量データ生成部62は、生成された特徴量データを推定装置63に出力する(ステップS607)。
 〔推定装置〕
 図33は、推定装置63の動作について説明するためのフローチャートである。図33のフローチャートに沿った説明においては、推定装置63を動作主体として説明する。
 図33において、まず、推定装置63は、歩容に関するセンサデータを用いて生成された特徴量データを取得する(ステップS631)。
 次に、推定装置63は、取得した特徴量データを、身体状態を推定する推定モデルに入力する(ステップS632)。
 次に、推定装置63は、推定モデルからの出力(推定値)に応じて、ユーザの身体状態を推定する(ステップS633)。
 次に、推定装置63は、推定された身体状態に関する情報を出力する(ステップS634)。例えば、身体状態は、ユーザの携帯する端末装置(図示しない)に出力される。例えば、身体状態は、身体状態を用いた処理を実行するシステムに出力される。
 (適用例)
 次に、本実施形態に係る適用例について図面を参照しながら説明する。以下の適用例において、靴に配置された歩容計測装置60によって計測された特徴量データを用いて、ユーザが携帯する携帯端末にインストールされた推定装置63の機能が、身体状態を推定する例を示す。
 図35は、歩容計測装置60が配置された靴600を履いて歩行するユーザの携帯する携帯端末660の画面に、推定装置63による推定結果を表示させる一例を示す概念図である。図35は、ユーザの歩行中に計測されたセンサデータに応じた特徴量データを用いた身体状態の推定結果に応じた情報を、携帯端末660の画面に表示させる例である。
 図35は、身体状態に関する推定値に応じた情報が、携帯端末660の画面に表示される例である。図35の例では、身体状態に関する推定結果として、予め設定された基準で数値化されたスコアが、携帯端末660の表示部に表示させる。また、図35の例では、身体状態に関する推定値に応じて、「全身総合筋力が低下しています。」という身体状態の推定結果に関する情報が、携帯端末660の表示部に表示される。また、図35の例では、身体状態の推定値に応じて、「トレーニングAを推奨します。下記の動画をご覧ください。」という全身総合筋力の推定結果に応じた推薦情報が、携帯端末660の表示部に表示される。携帯端末660の表示部に表示された情報を確認したユーザは、表示された推薦情報に応じて、トレーニングAの動画を参照して運動することによって、全身総合筋力の改善につながるトレーニングを実践できる。
 以上のように、本実施形態の身体状態推定システムは、歩容計測装置および身体状態推定装置を備える。歩容計測装置は、センサと特徴量データ生成部を備える。センサは、加速度センサと角速度センサを有する。センサは、加速度センサを用いて、空間加速度を計測する。センサは、角速度センサを用いて、空間角速度を計測する。センサは、計測した空間加速度および空間角速度を用いて、足の動きに関するセンサデータを生成する。センサは、生成したセンサデータを特徴量データ生成部に出力する。特徴量データ生成部は、足の動きに関するセンサデータの時系列データを取得する。特徴量データ生成部は、センサデータの時系列データから一歩行周期分の歩行波形データを抽出する。特徴量データ生成部は、抽出された歩行波形データを正規化する。特徴量データ生成部は、正規化された歩行波形データから、推定対象の身体状態に関する特徴量を、時間的に連続する少なくとも一つの歩行フェーズによって構成される歩行フェーズクラスターから抽出する。特徴量データ生成部は、第1~第4の実施形態の特徴量選定装置によって選定された特徴量を抽出する。特徴量データ生成部は、抽出された特徴量を含む特徴量データを生成する。特徴量データ生成部は、生成された特徴量データを出力する。
 身体状態推定装置は、データ取得部、記憶部、推定部、および出力部を備える。データ取得部は、ユーザの歩容の特徴から抽出された、ユーザの身体状態の推定に用いられる特徴量を含む特徴量データを取得する。記憶部は、特徴量データの入力に応じた身体状態を出力する推定モデルを記憶する。推定部は、取得された特徴量データを推定モデルに入力して、ユーザの身体状態を推定する。出力部は、推定された身体状態に関する情報を出力する。
 本実施形態の身体状態推定システムは、ユーザの歩容の特徴から抽出された特徴量を用いて、ユーザの身体状態を推定する。そのため、本実施形態の身体状態推定システムによれば、ロバスト性の高い特徴量を用いて、日常生活において身体状態を適宜推定できる。
 (ハードウェア)
 ここで、本開示の各実施形態に係る処理を実行するハードウェア構成について、図36の情報処理装置90を一例として挙げて説明する。なお、図36の情報処理装置90は、各実施形態の処理を実行するための構成例であって、本開示の範囲を限定するものではない。
 図36のように、情報処理装置90は、プロセッサ91、主記憶装置92、補助記憶装置93、入出力インターフェース95、および通信インターフェース96を備える。図36においては、インターフェースをI/F(Interface)と略記する。プロセッサ91、主記憶装置92、補助記憶装置93、入出力インターフェース95、および通信インターフェース96は、バス98を介して、互いにデータ通信可能に接続される。また、プロセッサ91、主記憶装置92、補助記憶装置93、および入出力インターフェース95は、通信インターフェース96を介して、インターネットやイントラネットなどのネットワークに接続される。
 プロセッサ91は、補助記憶装置93等に格納されたプログラムを、主記憶装置92に展開する。プロセッサ91は、主記憶装置92に展開されたプログラムを実行する。本実施形態においては、情報処理装置90にインストールされたソフトウェアプログラムを用いる構成とすればよい。プロセッサ91は、各実施形態に係る処理を実行する。
 主記憶装置92は、プログラムが展開される領域を有する。主記憶装置92には、プロセッサ91によって、補助記憶装置93等に格納されたプログラムが展開される。主記憶装置92は、例えばDRAM(Dynamic Random Access Memory)などの揮発性メモリによって実現される。また、主記憶装置92として、MRAM(Magnetoresistive Random Access Memory)などの不揮発性メモリが構成/追加されてもよい。
 補助記憶装置93は、プログラムなどの種々のデータを記憶する。補助記憶装置93は、ハードディスクやフラッシュメモリなどのローカルディスクによって実現される。なお、種々のデータを主記憶装置92に記憶させる構成とし、補助記憶装置93を省略することも可能である。
 入出力インターフェース95は、規格や仕様に基づいて、情報処理装置90と周辺機器とを接続するためのインターフェースである。通信インターフェース96は、規格や仕様に基づいて、インターネットやイントラネットなどのネットワークを通じて、外部のシステムや装置に接続するためのインターフェースである。入出力インターフェース95および通信インターフェース96は、外部機器と接続するインターフェースとして共通化してもよい。
 情報処理装置90には、必要に応じて、キーボードやマウス、タッチパネルなどの入力機器が接続されてもよい。それらの入力機器は、情報や設定の入力に使用される。なお、タッチパネルを入力機器として用いる場合は、表示機器の表示画面が入力機器のインターフェースを兼ねる構成としてもよい。プロセッサ91と入力機器との間のデータ通信は、入出力インターフェース95に仲介させればよい。
 また、情報処理装置90には、情報を表示するための表示機器を備え付けてもよい。表示機器を備え付ける場合、情報処理装置90には、表示機器の表示を制御するための表示制御装置(図示しない)が備えられていることが好ましい。表示機器は、入出力インターフェース95を介して情報処理装置90に接続すればよい。
 また、情報処理装置90には、ドライブ装置が備え付けられてもよい。ドライブ装置は、プロセッサ91と記録媒体(プログラム記録媒体)との間で、記録媒体からのデータやプログラムの読み込み、情報処理装置90の処理結果の記録媒体への書き込みなどを仲介する。ドライブ装置は、入出力インターフェース95を介して情報処理装置90に接続すればよい。
 以上が、本発明の各実施形態に係る処理を可能とするためのハードウェア構成の一例である。なお、図36のハードウェア構成は、各実施形態に係る処理を実行するためのハードウェア構成の一例であって、本発明の範囲を限定するものではない。また、各実施形態に係る処理をコンピュータに実行させるプログラムも本発明の範囲に含まれる。さらに、各実施形態に係るプログラムを記録したプログラム記録媒体も本発明の範囲に含まれる。記録媒体は、例えば、CD(Compact Disc)やDVD(Digital Versatile Disc)などの光学記録媒体で実現できる。記録媒体は、USB(Universal Serial Bus)メモリやSD(Secure Digital)カードなどの半導体記録媒体によって実現されてもよい。また、記録媒体は、フレキシブルディスクなどの磁気記録媒体、その他の記録媒体によって実現されてもよい。プロセッサが実行するプログラムが記録媒体に記録されている場合、その記録媒体はプログラム記録媒体に相当する。
 各実施形態の構成要素は、任意に組み合わせてもよい。また、各実施形態の構成要素は、ソフトウェアによって実現されてもよいし、回路によって実現されてもよい。
 以上、実施形態を参照して本発明を説明してきたが、本発明は上記実施形態に限定されるものではない。本発明の構成や詳細には、本発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
 5  学習システム
 6  身体状態推定システム
 10、20、30、40  特徴量選定装置
 11、21、31、41 取得部
 12、22、32、42  構築部
 13、23、33、43  解析部
 15、25、35、45  統計部
 17、27、37、47  選定部
 19、29、39、49  出力部
 26  推定モデル構築部
 50、60  歩容計測装置
 55  学習装置
 61  センサ
 62  特徴量データ生成部
 63  推定装置
 551  受信部
 553  学習部
 555  記憶部
 631  データ取得部
 632  記憶部
 633  推定部
 635  出力部

Claims (10)

  1.  複数のデータセットを取得する取得手段と、
     前記データセットに含まれるデータの分布を変更して複数の再抽出データセットを構築する構築手段と、
     ラッソ回帰の手法を用いて、複数の前記再抽出データセットを解析する解析手段と、
     複数の前記再抽出データセットの解析結果に応じて複数の前記再抽出データセットに含まれる要素の値を集計し、前記要素の値の集計結果に応じて複数の前記再抽出データセットに含まれる前記要素に論理値を設定する統計手段と、
     予め設定された特定ルールに従って、前記要素に設定された前記論理値の値に応じた組み合わせの特徴量を選定する選定手段と、
     選定された前記特徴量の組み合わせに関する選定情報を出力する出力手段と、を備える特徴量選定装置。
  2.  前記構築手段は、
     Leave-One-Subject-Outの手法を用いて、複数の前記再抽出データセットを構築する請求項1に記載の特徴量選定装置。
  3.  前記構築手段は、
     ブートストラップ法を用いて、複数の前記再抽出データセットを構築する請求項1に記載の特徴量選定装置。
  4.  前記解析手段は、
     複数の前記再抽出データセットに関して、予め設定された複数の正則化パラメータごとに前記ラッソ回帰を実行し、
     前記ラッソ回帰で用いられた前記正則化パラメータに対応する列と、前記特徴量に対応する行とによって構成される複数パターンの第1行列を生成し、
     前記統計手段は、
     複数パターンの前記第1行列に関して、非ゼロ要素のセルの第1論理値を1に設定して、ゼロ要素のセルの第1論理値を0に設定する第1統計処理を実行し、
     複数パターンの前記第1行列を構成するセルごとに前記第1論理値を集計して、前記第1論理値の集計値が所定条件を満たすセルに第2論理値として1が設定され、前記第1論理値の集計値が前記所定条件を満たさないセルに前記第2論理値として0が設定された第2行列を生成する第2統計処理を実行し、
     前記選定手段は、
     予め設定された前記特定ルールに従って前記第2行列の列を選択し、選択された列に対応する前記特徴量の組み合わせを選定する請求項1乃至3のいずれか一項に記載の特徴量選定装置。
  5.  前記統計手段は、
     前記第2統計処理において、
     複数パターンの前記第1行列を構成するセルごとに前記第1論理値の合計値を計算し、
     前記第1論理値の合計値が所定閾値以上のセルの前記第2論理値が1に設定され、前記第1論理値の合計値が所定閾値未満のセルが0に設定された前記第2行列を生成する請求項4に記載の特徴量選定装置。
  6.  前記統計手段は、
     前記第2統計処理において、
     複数パターンの前記第1行列を構成するセルごとに前記第1論理値の平均値を計算し、
     前記第1論理値の平均値が所定閾値以上のセルの前記第2論理値が1に設定され、前記第1論理値の平均値が所定閾値未満のセルが0に設定された前記第2行列を生成する請求項4に記載の特徴量選定装置。
  7.  前記解析手段は、
     複数の前記再抽出データセットの各々に関して、予め設定された複数の正則化パラメータごとに前記ラッソ回帰を実行し、
     前記ラッソ回帰で用いられた前記正則化パラメータに対応する列と、前記特徴量に対応する行とによって構成される複数パターンの第1行列を生成し、
     前記統計手段は、
     複数パターンの前記第1行列を構成するセルごとに前記要素の値を集計して、前記要素の値の平均値が所定閾値以上のセルに第2論理値として1が設定され、前記要素の値の平均値が前記所定閾値未満のセルに前記第2論理値として0が設定された第2行列を生成する第2統計処理を実行し、
     前記選定手段は、
     予め設定された前記特定ルールに従って前記第2行列の列を選択し、選択された列に対応する前記特徴量の組み合わせを選定する請求項1乃至3のいずれか一項に記載の特徴量選定装置。
  8.  選定された前記特徴量を用いた学習により推定モデルを構築し、構築された前記推定モデルを評価する推定モデル構築手段を備え、
     前記選定手段は、
     前記推定モデルの評価結果に応じて、前記特徴量の組み合わせを選定する請求項1乃至7のいずれか一項に記載の特徴量選定装置。
  9.  コンピュータが、
     複数のデータセットを取得し、
     前記データセットに含まれるデータの分布を変更して複数の再抽出データセットを構築し、
     ラッソ回帰の手法を用いて、複数の前記再抽出データセットを解析し、
     複数の前記再抽出データセットの解析結果に応じて複数の前記再抽出データセットに含まれる要素の値を集計し、
     前記要素の値の集計結果に応じて複数の前記再抽出データセットに含まれる前記要素に論理値を設定し、
     予め設定された特定ルールに従って、前記要素に設定された前記論理値の値に応じた組み合わせの特徴量を選定し、
     選定された前記特徴量の組み合わせに関する選定情報を出力する特徴量選定方法。
  10.  複数のデータセットを取得する処理と、
     前記データセットに含まれるデータの分布を変更して複数の再抽出データセットを構築する処理と、
     ラッソ回帰の手法を用いて、複数の前記再抽出データセットを解析する処理と、
     複数の前記再抽出データセットの解析結果に応じて複数の前記再抽出データセットに含まれる要素の値を集計する処理と、
     前記要素の値の集計結果に応じて複数の前記再抽出データセットに含まれる前記要素に論理値を設定する処理と、
     予め設定された特定ルールに従って、前記要素に設定された前記論理値の値に応じた組み合わせの特徴量を選定する処理と、
     選定された前記特徴量の組み合わせに関する選定情報を出力する処理と、をコンピュータに実行させるプログラムを記録させた非一過性の記録媒体。
PCT/JP2022/001953 2022-01-20 2022-01-20 特徴量選定装置、特徴量選定方法、身体状態推定システム、および記録媒体 WO2023139718A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
PCT/JP2022/001953 WO2023139718A1 (ja) 2022-01-20 2022-01-20 特徴量選定装置、特徴量選定方法、身体状態推定システム、および記録媒体
JP2023574969A JPWO2023139718A5 (ja) 2022-01-20 特徴量選定装置、特徴量選定方法、およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2022/001953 WO2023139718A1 (ja) 2022-01-20 2022-01-20 特徴量選定装置、特徴量選定方法、身体状態推定システム、および記録媒体

Publications (1)

Publication Number Publication Date
WO2023139718A1 true WO2023139718A1 (ja) 2023-07-27

Family

ID=87348296

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2022/001953 WO2023139718A1 (ja) 2022-01-20 2022-01-20 特徴量選定装置、特徴量選定方法、身体状態推定システム、および記録媒体

Country Status (1)

Country Link
WO (1) WO2023139718A1 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018151883A (ja) * 2017-03-13 2018-09-27 株式会社東芝 解析装置、解析方法、及び、プログラム
WO2021229648A1 (ja) * 2020-05-11 2021-11-18 日本電気株式会社 数式モデル生成システム、数式モデル生成方法および数式モデル生成プログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018151883A (ja) * 2017-03-13 2018-09-27 株式会社東芝 解析装置、解析方法、及び、プログラム
WO2021229648A1 (ja) * 2020-05-11 2021-11-18 日本電気株式会社 数式モデル生成システム、数式モデル生成方法および数式モデル生成プログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ENDO, AKIHIRO; NAGATA, KENJI; KIDO, SHOJI; SHOUNO, HAYARU: "Feature Selection for Diffuse Lung Disease Images by Bolasso", IPSJ JOURNAL, vol. 12, no. 3, 1 December 2019 (2019-12-01), pages 68 - 77, XP009547814, ISSN: 1882-7780 *

Also Published As

Publication number Publication date
JPWO2023139718A1 (ja) 2023-07-27

Similar Documents

Publication Publication Date Title
WO2021140658A1 (ja) 異常検出装置、判定システム、異常検出方法、およびプログラム記録媒体
WO2018003910A1 (ja) 歩行状態判定装置、歩行状態判定システム、歩行状態判定方法及び記憶媒体
WO2020240752A1 (ja) 情報処理装置、体重推定装置、体重推定システム、情報処理方法及び記憶媒体
WO2023139718A1 (ja) 特徴量選定装置、特徴量選定方法、身体状態推定システム、および記録媒体
WO2023127008A1 (ja) 動的バランス推定装置、動的バランス推定システム、動的バランス推定方法、および記録媒体
WO2022201338A1 (ja) 特徴量生成装置、歩容計測システム、特徴量生成方法、および記録媒体
US20240138757A1 (en) Pelvic inclination estimation device, estimation system, pelvic inclination estimation method, and recording medium
US20240172966A1 (en) Harmonic index estimation device, estimation system, harmonic index estimation method, and recording medium
WO2023127007A1 (ja) 筋力指標推定装置、筋力指標推定システム、筋力指標推定方法、および記録媒体
WO2023127010A1 (ja) 移動能力推定装置、移動能力推定システム、移動能力推定方法、および記録媒体
WO2023127014A1 (ja) 易転倒性推定装置、易転倒性推定システム、易転倒性推定方法、および記録媒体
WO2023127013A1 (ja) 静的バランス推定装置、静的バランス推定システム、静的バランス推定方法、および記録媒体
Chen et al. Smart Gait Detection and Analysis
WO2023157161A1 (ja) 検出装置、検出システム、歩容計測システム、検出方法、および記録媒体
US20240138710A1 (en) Waist swinging estimation device, estimation system, waist swinging estimation method, and recording medium
WO2023127009A1 (ja) 下肢筋力推定装置、下肢筋力推定システム、下肢筋力推定方法、および記録媒体
WO2023127015A1 (ja) 筋力評価装置、筋力評価システム、筋力評価方法、および記録媒体
WO2022208838A1 (ja) 生体情報処理装置、情報処理システム、生体情報処理方法、および記録媒体
WO2022038663A1 (ja) 検出装置、検出システム、検出方法、およびプログラム記録媒体
US20240237922A1 (en) Estimation device, estimation system, estimation method, and recording medium
JP7480868B2 (ja) ゲイン調整装置、歩行状態推定装置、歩容解析システム、ゲイン調整方法、およびプログラム
WO2022269698A1 (ja) 補間装置、歩容計測システム、補間方法、および記録媒体
JP2023174049A (ja) フレイル推定装置、推定システム、フレイル推定方法、およびプログラム
US20240350034A1 (en) Estimation device, information presentation system, estimation method, and recording medium
US20240298926A1 (en) Gait evaluation device, gait evaluation method, gait measurement system and recording medium

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 22921876

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2023574969

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE