JP4254892B1 - 特徴量候補作成装置および特徴量候補作成方法 - Google Patents
特徴量候補作成装置および特徴量候補作成方法 Download PDFInfo
- Publication number
- JP4254892B1 JP4254892B1 JP2007285178A JP2007285178A JP4254892B1 JP 4254892 B1 JP4254892 B1 JP 4254892B1 JP 2007285178 A JP2007285178 A JP 2007285178A JP 2007285178 A JP2007285178 A JP 2007285178A JP 4254892 B1 JP4254892 B1 JP 4254892B1
- Authority
- JP
- Japan
- Prior art keywords
- feature
- feature quantity
- evaluation
- model
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 72
- 238000011156 evaluation Methods 0.000 claims abstract description 81
- 238000004364 calculation method Methods 0.000 claims abstract description 6
- 230000008569 process Effects 0.000 description 21
- 238000010276 construction Methods 0.000 description 15
- 238000005259 measurement Methods 0.000 description 13
- 238000012545 processing Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 238000002474 experimental method Methods 0.000 description 6
- 230000036541 health Effects 0.000 description 6
- 210000001596 intra-abdominal fat Anatomy 0.000 description 5
- 210000000577 adipose tissue Anatomy 0.000 description 4
- 230000007704 transition Effects 0.000 description 4
- 241000282412 Homo Species 0.000 description 3
- 230000036772 blood pressure Effects 0.000 description 3
- 230000036760 body temperature Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 238000012706 support-vector machine Methods 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000001276 Kolmogorov–Smirnov test Methods 0.000 description 1
- 239000008476 aike Substances 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000037396 body weight Effects 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 230000001364 causal effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 230000006806 disease prevention Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000003925 fat Substances 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/50—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
Landscapes
- Medical Informatics (AREA)
- Engineering & Computer Science (AREA)
- Public Health (AREA)
- Health & Medical Sciences (AREA)
- Pathology (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Biomedical Technology (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Image Analysis (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
Abstract
【解決手段】複数種類の特徴量について、複数のサンプルのそれぞれから抽出された特徴量の値を記憶している記憶手段と、特徴量の値の種類の数をサンプルの数で正規化することにより得られる指標値を、複数種類の特徴量のそれぞれについて算出する指標値算出手段と、複数種類の特徴量から評価対象とする特徴量の組み合わせを選択する評価対象選択手段と、評価対象として選択された特徴量の組み合わせについて、各特徴量の指標値の度数分布の一様性が所定の基準を満たすか否かを評価する評価手段と、評価手段により所定の基準を満たすと評価された特徴量の組み合わせを、モデル作成装置に対して与える特徴量候補に決定する候補決定手段と、を備える特徴量候補作成装置。
【選択図】図2
Description
や個別性によるばらつきの影響を受けにくい特徴量といった性質の異なる特徴量を網羅的に準備するのである。
生体の複雑性と個別性に対応すべく性質の異なる特徴量を網羅的に準備しようとしても、従来は特徴量の性質を定量的に評価するための有効な手法がなかったために、試行錯誤的に特徴量を峻別し準備するしか方法がなく、非常に非効率的であった。
(1)性別:男、身長:170cm、体重59kg
(2)性別:男、身長:173cm、体重65kg
(3)性別:男、身長:168cm、体重65kg
(4)性別:女、身長:152cm、体重42kg
(5)性別:女、身長:159cm、体重50kg
NC=(カーディナリティ)/(サンプルデータ数)
図1は、本発明の実施形態に係るモデル構築システムの構成を模式的に示す図である。
次に、図2のフローチャートを参照しながら、モデル構築システムの各部の機能及びその動作について説明する。図2は、本システムの全体フローを示す図である。
ステップS1において、特徴量候補作成部10は、特徴量データベース11から計測データや属性データを読み込み、それらのデータから特徴量を算出する。ここでは、計測データ(計測値)や属性データ(属性値)そのものを第一次特徴量とよび、1または複数の計測値から算出される算出値を第二次特徴量とよぶ。たとえば被験者から計測されたウエスト周囲長wや生体インピーダンスZは第一次特徴量であり、それらの次元拡張や組み合わせにより得られる、w2、1/w、Z・wなどは第二次特徴量である。第二次特徴量としてどのようなものを生成するかは、特徴量候補作成部10に予め設定しておいてもよいし、ランダムにもしくは網羅的に様々な形式の第二次特徴量を生成してもよい。
において、特徴量候補作成部10は、NCpの部分に属する特徴量のうち、分解能をβ%細かくすることのできる特徴量を抽出する。抽出された特徴量が少なくとも1つ存在する場合は(ステップS45;YES)、それら特徴量の分解能をβ%細かくした特徴量を用意し(ステップS46)、ステップS47に進む。
ステップS7において、モデル準備部20は、モデル候補(推定式の候補)を作成する。ここでは、モデル準備部20は、特徴量候補に含まれる特徴量の全ての組み合わせについて、モデル候補を作成する。ただし、特徴量の数が多すぎて全ての組み合わせを評価するのが現実的でない場合は、選択する特徴量の数を固定するなど(たとえば、特徴量の総数がn個、選択する特徴量の数をm個としたら、モデル候補の数はnCm通りに限られる。)、適宜モデル候補の数を限定すればよい。
aike Information Criterion)という指標が用いられる。AICは、モデルの単純さと既知のデータへの適合性能を両立したモデルを選択するための統計的な基準である。ステップS9において、特徴量・モデル選定部21は、各モデル候補についてAICを算出する。そして、ステップS10において、AICが最も小さいモデル候補が、最適なモデル、つまり単純さと既知のデータへの適合性能を両立したモデルとして選択される。なお、特徴量・モデルを評価するための指標としては、AICに限らず、Cp値などの他の指標を用いても良い。
正規化カーディナリティNCを考慮して特徴量を選択することの有効性を検証するため、採用した特徴量のNCの傾向が異なる3つのモデル(推定式)を用意し、各モデルの推定精度および安定性を評価した。
用意した推定式は下記のとおり。なお、これらの推定式は、ヒトから計測または取得された特徴量に基づいて内臓脂肪面積を推定するためのモデルである。それぞれの特徴量の意味については省略する。
本評価実験では、各推定式の推定精度の高さと安定性を評価するための指標として、相関係数と誤差標準偏差を用いる。また、推定式の安定性を評価するための指標として、回帰係数の標準偏差を用いる。以下に、これらの評価指標の詳細について示す。
任意の推定式による内臓脂肪面積の推定値とMRIより得られる真値の相関をピアソンの積率相関係数により算出することで、未知の個体に対する表現性能、すなわち内臓脂肪
面積が小さい個体から大きい個体まで、高い推定精度を確保できるか否かを評価する。
任意の推定式による推定値とMRIより得られる実測値との誤差の標準偏差(以下、誤差SDという)により、未知の個体に対する推定精度の安定性を評価する。
学習用データセットを複数準備しておき、任意の推定式の回帰係数を学習したときの、回帰係数の標準偏差により、学習用データにおける個体差に対する推定式の安定性を評価する。
方式1、2、3の比較評価を行うにあたり、交差検証を実施する。次に手順を示す。
(2)一方のデータ群で推定式の回帰係数の学習を行う。
(3)他方のデータ群を用いて、各推定式から推定値を算出する。
(4)推定値とMRIによる実測値との相関係数、および誤差SDの算出を行う。
(5)推定式の安定性を検証するために、(1)〜(4)を複数回実施する。本実験では実施回数を10回とした。
10回の試行における各方式による推定値と実測値の相関係数の推移を図8に、誤差SDの推移を図9に示す。
10 特徴量候補作成部
11 特徴量データベース
2 モデル作成装置
20 モデル準備部
21 特徴量・モデル選定部
22 モデル評価部
Claims (6)
- 与えられた特徴量候補の中から選択した複数の特徴量を用いてモデルを構築するモデル作成装置に対して、与えるべき特徴量候補を作成するための特徴量候補作成装置であって、
複数種類の特徴量について、複数のサンプルのそれぞれから抽出された特徴量の値を記憶している記憶手段と、
前記特徴量の値の種類の数を前記サンプルの数で正規化することにより得られる指標値を、前記複数種類の特徴量のそれぞれについて算出する指標値算出手段と、
前記複数種類の特徴量から評価対象とする特徴量の組み合わせを選択する評価対象選択手段と、
前記評価対象として選択された特徴量の組み合わせについて、各特徴量の指標値の度数分布の一様性が所定の基準を満たすか否かを評価する評価手段と、
前記評価手段により前記所定の基準を満たすと評価された特徴量の組み合わせを、前記モデル作成装置に対して与える特徴量候補に決定する候補決定手段と、
を備えることを特徴とする特徴量候補作成装置。 - 前記所定の基準を満たす特徴量の組み合わせを発見するために、前記評価対象選択手段による評価対象の更新と、前記評価手段による前記更新された評価対象の評価とが繰り返されることを特徴とする請求項1に記載の特徴量候補作成装置。
- 前記評価対象選択手段は、前記複数種類の特徴量のうち前記評価対象に含まれていない特徴量を前記評価対象に追加することにより、前記評価対象を更新するものであり、
前記評価対象選択手段は、前記評価対象に含まれる特徴量の指標値の度数分布において最小の度数を示す部分を特定し、その最小の度数を示す部分に該当する指標値を有する特徴量を、前記評価対象に追加する特徴量として選ぶことを特徴とする請求項2に記載の特徴量候補作成装置。 - 前記評価対象選択手段は、前記評価対象に含まれる特徴量のうち少なくともいずれかの特徴量の値の分解能を変更することにより、前記評価対象を更新するものであり、
前記評価対象選択手段は、前記評価対象に含まれる特徴量の指標値の度数分布において最大の度数を示す部分を特定し、その最大の度数を示す部分に該当する指標値を有する特徴量の分解能を変更することを特徴とする請求項2または3に記載の特徴量候補作成装置。 - 与えられた特徴量候補の中から選択した複数の特徴量を用いてモデルを構築するモデル作成装置に対して、与えるべき特徴量候補を作成するための特徴量候補作成方法であって、
複数種類の特徴量について、複数のサンプルのそれぞれから抽出された特徴量の値を記憶している記憶手段を備えるコンピュータが、
前記特徴量の値の種類の数を前記サンプルの数で正規化することにより得られる指標値を、前記複数種類の特徴量のそれぞれについて算出する指標値算出ステップと、
前記複数種類の特徴量から評価対象とする特徴量の組み合わせを選択する評価対象選択ステップと、
前記評価対象として選択された特徴量の組み合わせについて、各特徴量の指標値の度数分布の一様性が所定の基準を満たすか否かを評価する評価ステップと、
前記評価ステップにより前記所定の基準を満たすと評価された特徴量の組み合わせを、前記モデル作成装置に対して与える特徴量候補に決定する候補決定ステップと、
を実行することを特徴とする特徴量候補作成方法。 - 与えられた特徴量候補の中から選択した複数の特徴量を用いてモデルを構築するモデル作成装置に対して、与えるべき特徴量候補を作成するための特徴量候補作成プログラムであって、
複数種類の特徴量について、複数のサンプルのそれぞれから抽出された特徴量の値を記憶している記憶手段を備えるコンピュータに、
前記特徴量の値の種類の数を前記サンプルの数で正規化することにより得られる指標値を、前記複数種類の特徴量のそれぞれについて算出する指標値算出ステップと、
前記複数種類の特徴量から評価対象とする特徴量の組み合わせを選択する評価対象選択ステップと、
前記評価対象として選択された特徴量の組み合わせについて、各特徴量の指標値の度数分布の一様性が所定の基準を満たすか否かを評価する評価ステップと、
前記評価ステップにより前記所定の基準を満たすと評価された特徴量の組み合わせを、前記モデル作成装置に対して与える特徴量候補に決定する候補決定ステップと、
を実行させることを特徴とする特徴量候補作成プログラム。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007285178A JP4254892B1 (ja) | 2007-11-01 | 2007-11-01 | 特徴量候補作成装置および特徴量候補作成方法 |
US12/740,336 US8630823B2 (en) | 2007-11-01 | 2008-10-31 | Feature parameter candidate generation apparatus and feature parameter candidate generation method |
PCT/JP2008/069951 WO2009057778A1 (ja) | 2007-11-01 | 2008-10-31 | 特徴量候補作成装置および特徴量候補作成方法 |
CN2008801128560A CN101835421B (zh) | 2007-11-01 | 2008-10-31 | 特征量候选生成装置和特征量候选生成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007285178A JP4254892B1 (ja) | 2007-11-01 | 2007-11-01 | 特徴量候補作成装置および特徴量候補作成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP4254892B1 true JP4254892B1 (ja) | 2009-04-15 |
JP2009112330A JP2009112330A (ja) | 2009-05-28 |
Family
ID=40591158
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007285178A Active JP4254892B1 (ja) | 2007-11-01 | 2007-11-01 | 特徴量候補作成装置および特徴量候補作成方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US8630823B2 (ja) |
JP (1) | JP4254892B1 (ja) |
CN (1) | CN101835421B (ja) |
WO (1) | WO2009057778A1 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5407737B2 (ja) * | 2009-10-16 | 2014-02-05 | 富士通セミコンダクター株式会社 | モデル生成プログラム、モデル生成装置、およびモデル生成方法 |
WO2011085090A1 (en) * | 2010-01-06 | 2011-07-14 | Hill's Pet Nutrition, Inc. | Method of managing a weight condition in an animal |
JP5661344B2 (ja) * | 2010-06-18 | 2015-01-28 | 沖電気工業株式会社 | 情報処理装置、認識システム、認識方法、及びプログラム |
US10198813B2 (en) * | 2014-05-13 | 2019-02-05 | Omron Corporation | Posture estimation device, posture estimation system, posture estimation method, posture estimation program, and computer-readable recording medium on which posture estimation program is recorded |
WO2017090114A1 (ja) * | 2015-11-25 | 2017-06-01 | 株式会社日立製作所 | データ処理システム及びデータ処理方法 |
JP6746508B2 (ja) * | 2017-01-04 | 2020-08-26 | オムロン株式会社 | ユーザ端末装置およびデータ送信方法 |
JP6833660B2 (ja) * | 2017-11-08 | 2021-02-24 | 株式会社東芝 | 信頼度監視システム、信頼度評価方法、及びプログラム |
CN112654982B (zh) * | 2019-07-26 | 2024-09-06 | 株式会社日立高新技术 | 数据处理装置、方法、以及半导体制造装置 |
US12033037B2 (en) | 2020-08-24 | 2024-07-09 | International Business Machines Corporation | Open feature library management |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2551212B2 (ja) | 1990-07-26 | 1996-11-06 | 日本電気株式会社 | 特徴量選択方法及び装置と高速識別方法及び装置 |
JPH0981731A (ja) | 1995-09-19 | 1997-03-28 | Hitachi Ltd | 画像認識方法および装置 |
JPH113354A (ja) * | 1997-06-13 | 1999-01-06 | Nec Software Ltd | データキューブ制御方式 |
JP3597026B2 (ja) | 1997-10-24 | 2004-12-02 | 富士通株式会社 | 特徴量選択装置 |
US6496834B1 (en) * | 2000-12-22 | 2002-12-17 | Ncr Corporation | Method for performing clustering in very large databases |
US7756804B2 (en) * | 2002-05-10 | 2010-07-13 | Oracle International Corporation | Automated model building and evaluation for data mining system |
US7174343B2 (en) * | 2002-05-10 | 2007-02-06 | Oracle International Corporation | In-database clustering |
-
2007
- 2007-11-01 JP JP2007285178A patent/JP4254892B1/ja active Active
-
2008
- 2008-10-31 US US12/740,336 patent/US8630823B2/en active Active
- 2008-10-31 WO PCT/JP2008/069951 patent/WO2009057778A1/ja active Application Filing
- 2008-10-31 CN CN2008801128560A patent/CN101835421B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN101835421B (zh) | 2013-04-03 |
US20100235151A1 (en) | 2010-09-16 |
JP2009112330A (ja) | 2009-05-28 |
CN101835421A (zh) | 2010-09-15 |
WO2009057778A1 (ja) | 2009-05-07 |
US8630823B2 (en) | 2014-01-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4254892B1 (ja) | 特徴量候補作成装置および特徴量候補作成方法 | |
İşler et al. | Combining classical HRV indices with wavelet entropy measures improves to performance in diagnosing congestive heart failure | |
JP6750055B2 (ja) | 顔画像からの定性的特徴を評価するコンピュータ実行ツールを構築する方法 | |
JP2013088880A (ja) | 診療情報処理装置および方法並びにプログラム | |
US20170329918A1 (en) | Internet of things based monitoring and assessment platform | |
Valsecchi et al. | Age estimation in forensic anthropology: methodological considerations about the validation studies of prediction models | |
JP7502192B2 (ja) | うつ状態を推定する装置、方法及びそのためのプログラム | |
Nugroho et al. | Effective predictive modelling for coronary artery diseases using support vector machine | |
CN107785079B (zh) | 一种基于弥散张量成像的抑郁症患者疾病恢复的评估方法 | |
CN110706822A (zh) | 基于逻辑回归模型和决策树模型的健康管理方法 | |
CN108937967A (zh) | 一种基于vr技术的心理学记忆数据提升检测方法及系统 | |
KR102371440B1 (ko) | 개인 맞춤 생체나이 예측 모형 생성 방법 및 시스템 | |
CN114190949B (zh) | 生理状态评估方法与生理状态评估装置 | |
CN114049957A (zh) | 一种风险预测模型训练方法、疾病风险预测模型及方法 | |
JP2020004126A (ja) | ヘルスケアデータ分析システム、ヘルスケアデータ分析方法、ヘルスケアデータ分析プログラム、学習済みモデル、情報処理装置、情報処理方法および情報処理プログラム | |
JP2015111438A (ja) | 生体情報の評価システム及び評価方法 | |
US20220328187A1 (en) | Condition predicting apparatus, condition predicting method, computer program, and recording medium | |
JP2012194741A (ja) | 行列形データの欠損値予測装置、欠損値予測計算方法および欠損値予測プログラム | |
JP5175585B2 (ja) | 文書処理装置、電子カルテ装置および文書処理プログラム | |
CN116564521A (zh) | 一种慢性病风险评估模型建立方法、介质及系统 | |
JP2010207272A (ja) | 生体情報の評価システム及び評価方法 | |
JP7521609B2 (ja) | 情報処理装置、特徴量選択方法、教師データ生成方法、推定モデル生成方法、ストレス度の推定方法、およびプログラム | |
Ovchinnik et al. | Monotonicity detection and enforcement in longitudinal classification | |
US20240266062A1 (en) | Disease risk evaluation method, disease risk evaluation system, and health information processing device | |
CN118395283A (zh) | 一种基于人工智能的健康状况评估方法和系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090106 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090119 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120206 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4254892 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120206 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130206 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140206 Year of fee payment: 5 |