JP5771510B2 - 判別と回帰を同時に行う回帰分析システムおよび回帰分析方法 - Google Patents
判別と回帰を同時に行う回帰分析システムおよび回帰分析方法 Download PDFInfo
- Publication number
- JP5771510B2 JP5771510B2 JP2011253439A JP2011253439A JP5771510B2 JP 5771510 B2 JP5771510 B2 JP 5771510B2 JP 2011253439 A JP2011253439 A JP 2011253439A JP 2011253439 A JP2011253439 A JP 2011253439A JP 5771510 B2 JP5771510 B2 JP 5771510B2
- Authority
- JP
- Japan
- Prior art keywords
- evaluation
- evaluation function
- regression
- evaluation value
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 93
- 238000000611 regression analysis Methods 0.000 title claims description 31
- 238000011156 evaluation Methods 0.000 claims description 376
- 230000006870 function Effects 0.000 claims description 168
- 238000009826 distribution Methods 0.000 claims description 31
- 239000002131 composite material Substances 0.000 claims description 30
- 238000004364 calculation method Methods 0.000 claims description 24
- 238000005457 optimization Methods 0.000 claims description 16
- 230000015572 biosynthetic process Effects 0.000 claims description 11
- 238000003786 synthesis reaction Methods 0.000 claims description 11
- 239000013598 vector Substances 0.000 claims 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 95
- 201000010099 disease Diseases 0.000 description 93
- 210000003811 finger Anatomy 0.000 description 44
- 238000010079 rubber tapping Methods 0.000 description 32
- 230000033001 locomotion Effects 0.000 description 29
- 238000007796 conventional method Methods 0.000 description 26
- 230000008569 process Effects 0.000 description 26
- 238000004458 analytical method Methods 0.000 description 13
- 238000010586 diagram Methods 0.000 description 13
- 238000011002 quantification Methods 0.000 description 13
- 238000012545 processing Methods 0.000 description 10
- 230000001133 acceleration Effects 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 9
- 238000012706 support-vector machine Methods 0.000 description 9
- 238000012360 testing method Methods 0.000 description 9
- 238000003745 diagnosis Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 7
- 238000005259 measurement Methods 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 230000009977 dual effect Effects 0.000 description 4
- 238000010606 normalization Methods 0.000 description 4
- 230000035945 sensitivity Effects 0.000 description 4
- 238000011282 treatment Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 210000003813 thumb Anatomy 0.000 description 3
- 206010003591 Ataxia Diseases 0.000 description 2
- 208000023105 Huntington disease Diseases 0.000 description 2
- 208000002740 Muscle Rigidity Diseases 0.000 description 2
- 206010052904 Musculoskeletal stiffness Diseases 0.000 description 2
- 208000018737 Parkinson disease Diseases 0.000 description 2
- 206010044565 Tremor Diseases 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 208000035475 disorder Diseases 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 238000002945 steepest descent method Methods 0.000 description 2
- 208000024891 symptom Diseases 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- RZVAJINKPMORJF-UHFFFAOYSA-N Acetaminophen Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 1
- 206010012289 Dementia Diseases 0.000 description 1
- 208000016285 Movement disease Diseases 0.000 description 1
- 206010039203 Road traffic accident Diseases 0.000 description 1
- FFBHFFJDDLITSX-UHFFFAOYSA-N benzyl N-[2-hydroxy-4-(3-oxomorpholin-4-yl)phenyl]carbamate Chemical compound OC1=C(NC(=O)OCC2=CC=CC=C2)C=CC(=C1)N1CCOCC1=O FFBHFFJDDLITSX-UHFFFAOYSA-N 0.000 description 1
- 238000009534 blood test Methods 0.000 description 1
- 238000002939 conjugate gradient method Methods 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000012850 discrimination method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000002599 functional magnetic resonance imaging Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000002595 magnetic resonance imaging Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000033764 rhythmic process Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000001308 synthesis method Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2411—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2218/00—Aspects of pattern recognition specially adapted for signal processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Public Health (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Algebra (AREA)
- Probability & Statistics with Applications (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Pathology (AREA)
- Biomedical Technology (AREA)
- Operations Research (AREA)
- Computing Systems (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Description
以降は、本発明の概要を説明し、従来法との相違を述べる。そして、本発明の各手段について述べる。その後、本発明を上記データに適用した結果を示す。
≪実施形態1の主たる手段≫
本発明の実施形態1のシステム構成を図1に示す。計測対象のデータは計測装置60で計測され、処理装置70に取り込まれる。特徴量抽出装置73では、取り込まれた元データから後で詳述する特徴量が抽出される。それぞれのデータサンプルから抽出された特徴量と、それらデータサンプルに付された評価値とは、メモリ73に蓄積される。処理装置70は、この特殊量と評価値の蓄積された値を用いて新規サンプルから推定評価値を算出するための推定式を最適化し、さらに同時に、その推定式で新規サンプルの特徴量から推定評価値を算出する処理を実行する。ここではこの処理を判別回帰処理と呼ぶ。
≪精度を向上させるための追加手段≫
さらに、本実施形態では、図3のように、図2のフローに以下の4つの手段を追加することで、推定式の精度を高めることが出来る。追加する手段は、評価値変換手段10と判別回帰優先度調整手段19と収束判定手段22と重要特徴量選別手段23の4つである。この4つの手段は、図2のフローに個別に追加してもよいし、同時に追加してもよい。以下、4つの手段の構成と効果をそれぞれ説明する。
≪従来法との比較≫
ここで、従来法のフローを図4に示して、本発明のフローとの違いを説明する。従来法では、判別処理101(判別分析等)によって健常群・疾患群の判別を行った後に、疾患群と判別された場合のみに、回帰処理102(重回帰分析等)を適用して重症度を算出する。
≪特徴量と評価値≫
[特徴量]
本発明に係る判別回帰処理の入力は、特徴量と評価値である。まず、特徴量について述べる。
本実施形態では、指タッピング運動データから算出された特徴量を用いる。指タッピング運動とは、図5に示すように、親指と人差し指を繰り返し開閉させる運動である。2指を開いた状態41と2指を閉じた状態42を交互に繰り返す。本実施形態では、磁気センサ43を親指と人差し指にそれぞれ装着して、2指の距離44を計測する。磁気センサとは、2つのコイルから構成され、1つのコイルが発信した磁場をもう1つのコイルが受信することで、2コイルの距離を計測するセンサである。
[評価値]
次に、評価値について述べる。評価値は、サンプルに対して予め与えられた数値である。人が採点して得られた数値でも良いし、実験結果から得られた数値でも良い。サンプルを所定の基準で評価して得られた数値であれば、どのような指標でもよい。
[本実施形態で用いるサンプル群]
本発明を適用するサンプル群として、健常群196名(男女50〜70代)とPD群28名(男女60〜70代)の指タッピング運動を計測した。前述したように、疾患群のデータの入手は困難であるため、PD群が28名と少人数となっている。計測は、「出来る限り大きく、出来る限り速く」という指示を出して、右手の指タッピング運動を30秒間計測した。得られた波形から、前述の21個の特徴量を算出した。また、その指タッピング運動を医師が目視で採点したUPDRS ftを評価値として記録した。
≪推定式の定義≫
これ以降、本発明の構成及び具体的な適用方法について説明する。
≪評価値の変換≫
評価値変換手段10(図3)について説明する。評価値変換手段10には、評価値置換テーブル作成手段11および評価値置換手段12およびサンプル割当て手段13が含まれる。本実施形態では、健常群にはUPDRS ftが評価されていないため、評価値が欠損している。そのため、以下の解釈によって、評価値を数値範囲に置換する。
≪合成評価関数の算出≫
合成評価関数20(E)の算出方法を述べる。そのために、Eの算出過程で必要となる、健常群と疾患群との判別精度を評価する判別評価関数17(Ed)と、疾患群の重症度定量化の精度を評価する回帰評価関数16(Er)を定義する。以下、回帰評価関数Er、判別評価関数Edの順で、両者の算出方法を説明する。
[回帰評価関数の算出]
回帰評価関数算出手段14(図1または図2または図3)について説明する。回帰評価関数16(Er)は、疾患群の重症度定量化の精度を表す評価関数である。ここでは、Erを重回帰分析で定義される誤差関数と同一とする。つまり、(数3a)のように、疾患群の全てのサンプル(i=1~ Nr、Nrは回帰に用いるサンプル数)に対して、評価スケールyriと推定評価値yeiとの誤差の二乗の総和を計算する。
尚、Erは等しい評価値を持つサンプルの数が異なる場合は、各群をサンプル数で正規化しておくと良い。これは、入力するサンプル数によってErのレンジが変わることを防ぐためである。正規化を行うことで、後述する優先度定数がサンプル数の影響を受けにくいというメリットがある。また、回帰する評価値が複数あり、それに伴って推定式が複数定義される場合は、それぞれにErk(kは各評価値を示す)を定義し、各Erkを重みを付けて足し合わせることでErを算出すればよい。尚、Erkの合成方法は他の方法でも良い。
[判別評価関数の算出]
次に、判別評価関数算出手段15(図1または図2または図3)について説明する。上記のようにErのみを最小化する場合は、重症度定量化の精度が向上したとしても、疾患群と健常群との判別精度も同時に向上するとは限らない。そのため、(数4)で表される健常群と疾患群との判別精度を評価する判別評価関数17(Ed)を導入する。
尚、Edはサンプル数で正規化しておくと良い。入力するサンプル数によってEdのレンジが変わることを防ぐためである。正規化を行うことで、後述する優先度定数cがサンプル数の影響を受けにくいというメリットがある。また、3つ以上の群を判別する場合は、上記の計算を2群ずつ行ってEdk (kは2群の組み合わせ)を算出し、各Edkを合成してEdを算出することが出来る。
[回帰評価関数と判別評価関数の合成]
合成評価関数算出手段18(図1または図2または図3)について説明する。以上のように、健常群と疾患群との判別の精度を表す回帰評価関数16(Er)と、疾患群の重症度定量化の精度を表す判別評価関数17(Ed)を定義し、それぞれ最小化する必要があると示した。しかし、一般的には、Edを最適化するwnと、Erを最適化するwnとは等しくならないため、EdとErを同時に最適化することはできない。そのため、両者の優先度を調整する優先度定数1901としてc1とc2を導入して、(数7a)のような合成評価関数Eを定義し、Eを最適化することとする。
[回帰と判別の優先度調整]
判別回帰優先度調整手段19(図2)について説明する。本実施形態では、上述の優先度定数1901をc1 = 0.2、c2 = 1.0とした。しかし、c1とc2を予め決めた数値にせずに判別性能や回帰性能が最良となる数値を探索してもよい。例えば、判別精度をAUC(Area Under the ROC Curve)を基準として、黄金分割法を用いて、AUCが最も高くなるcを探索する方法が考えられる。他には、Eを最適化して得られた推定式で推定された推定評価値と、サンプル群に与えられた評価値との二乗誤差の総和を最小化してもよい。これらの評価は、LOO法(Leave one out法)や交差確認法(cross validation)等を用いて行うと良い。
≪合成評価関数の最適化≫
合成評価関数最適化手段21(図1または図2または図3)について説明する。前述した合成評価関数20(E)を、準ニュートン法を用いて最小化する。準ニュートン法とは、ニュートン法で用いるヘッセ行列の逆行列をBFGS公式によって近似することで、計算量を低減する手法である。準ニュートン法の中で用いるステップサイズは、一次探索法の一種である黄金分割法を用いた。このように、合成評価関数Eの最小化手法として、準ニュートン法のような逐次的に関数を最小化する手法を用いるのは、一般的には解析的に合成評価関数を最適化することが出来ないためである。解析的に最適化できるように合成評価関数Eを定義した場合は、逐次的な解法を用いなくてもよい。
≪合成評価関数の最適化の収束判定≫
収束判定手段22(図2)について説明する。本実施形態では、合成評価関数20の最適化は一回のみ行った。しかし、最適化の結果を評価値変換手段10の評価値置換テーブル作成手段11にフィードバックすることで、合成評価関数を再計算し、再度最適化を行っても良い。この場合は、再度最適化を行った結果に対して収束判定を行い、十分に収束していない場合は、更に評価値置換テーブル作成手段11にフィードバックする。十分に収束した場合には、推定式24を出力する。
≪推定式の適用≫
推定式適用手段25(図1または図2または図3)について説明する。前述したように、合成評価関数20(E)を最適化して得られた推定式24に、新規サンプル3の特徴量301を入力して、推定評価値5を得る。この推定評価値5が本手法の出力となる。本実施形態では、PDの有無や重症度が不明の新規の被験者に対して、指タッピング運動データからUPDRS ftを推定できることになる。
≪重要な特徴量の選別≫
重要特徴量選別手段23(図2)について説明する。合成評価関数を最適化して推定式を算出する過程で、複数の特徴量の中から重要特徴量4を選別することができる。重要特徴量4とは、評価値を推定する際に影響が大きい特徴量を意味する。重要特徴量4は複数個あってもよい。本実施形態では、推定評価値5と特徴量xnとの相関係数を基準として、相関係数が最も高い特徴量xnを重要特徴量4とする。
≪システムの運用方法≫
推定式24を算出するための本発明は、最初に一度だけ計算してもよいし、サンプル群が増加・変更される度に再計算しても良い。前者の場合は、システムは算出された推定式24のみ記憶していれば、推定評価値5を算出することができる。後者の場合は、毎回の計算のために、サンプル群2を記憶しておく必要がある。
≪本発明の評価≫
[本発明の評価方法]
本発明の評価には、LOO(Leave One Out)法を用いる。LOO法とは、N個の評価データを N-1個の学習用データと1個のテスト用データに分けて評価する方法である(N=健常群のデータ数+疾患群のデータ数)。つまり、全ての評価データが1回ずつテスト用データになるように組み合わせを変えて、N回評価を繰り返すことになる。仮にLOO法を使わずにN個のデータでモデルを学習し、同一のN個のデータで評価してモデルの精度が高かったとしても、未知のデータに対しても精度が高いとは限らないという問題が生じる。LOO法は、評価データのうち1個を未知のデータとみなすことでこの問題を解決し、モデルの精度を正しく評価することができる。
本研究では、提案手法である本発明のほか、従来法(判別分析と重回帰分析を併用)も適用して、両者の重症度定量化の精度を上記のeを用いて比較する。 尚、上記のeによる評価以外に、感度(疾患群と疾患と判別する割合)・特異度(健常群を健常と判別する割合)による判別精度の評価も行う。また、データの分布を観察するために、LOO法を用いずにN個のデータで学習したモデルを同一のN個のデータに適用し、全データの推定評価値をプロットして評価する。
[本発明の適用結果]
健常群とPD群の指タッピング運動データに、本発明を適用した結果を示す。その後、同一データを従来法(判別分析により健常群とPD群を判別後、PD群に対してのみ重回帰分析により評価値を算出)を適用した結果を示し、本発明の結果と比較する。
<本発明を適用した結果>
図15(a)は、本発明を適用した結果である。横軸は評価スケールであるUPDRS ft、縦軸は本発明で出力した推定評価値である。+印は健常群、○印はPD群を表している。健常群のUPDRS ftは評価されないので、UPDRS ft = 0としてプロットしている。この結果は、LOO法を使わず、n個のデータでモデルを学習し、そのモデルに同一のデータを適用して評価値を算出した結果を示している。
<従来法を適用した結果>
図16(a-1)及び(a-2)は、健常群とPD群の指タッピング運動データに、従来法(判別分析によって健常群・疾患群の判別を行った後に、疾患群に対してのみ重回帰分析を適用して評価値を算出する方法)を適用した結果である。横軸は評価スケールであるUPDRS ft(医師の採点した評価スケール)、縦軸は重回帰分析で出力した推定評価値である。+印は健常群、○印はPD群を表している。健常群にUPDRS ftは評価されないので、UPDRS ft = 0としてプロットしている。図16(a-1)は、判別分析で疾患群と判別されたデータのみをプロットした図である。図16(a-2)は、判別分析の判別結果を問わず全データをプロットした図である。尚、これらの図16(a-1)(a-2)の結果は、LOO法を使わず、N個のデータでモデルを学習し、そのモデルに同一のデータを適用して評価値を算出した結果である。
<本発明の結果と従来法の結果の比較>
本発明の判別結果(図15(b)に示す表)を従来法の1つ目の処理である判別分析による判別結果(図16(b)に示す表)と比較すると、判別精度については、感度は10.7%低く、特異度は7.8%高いことが分かる。このことから、本発明は、判別分析と比較して、疾患群と健常群との判別が曖昧な場合は疾患群と判別しやすいことが分かる。つまり、本発明は疾患の可能性がある被験者を広く検出でき、スクリーニング検査に適切なアルゴリズムであると言える。また、図15(c)に示す表と図16(c)に示す表を比較すると、本発明の方が従来法よりも、健常群に対する推定評価値の精度が20倍程度高く、健常群・疾患群を全体として見ても3倍以上精度が高いことが分かる。
<重要な特徴量の選別結果>
使用した21個の特徴量の中で、推定評価値との相関係数が最も高かったのはタップインターバルの標準偏差(21)で、0.4595であった。よって、タップインターバルの標準偏差(21)が評価値を推定するにあたって、最も重要な特徴量であると分かる。
≪実施形態2≫
以下、実施形態2について、適宜図面を参照しながら詳細に説明する。本実施形態では、実施形態1で説明した判別回帰処理に基づいて、複数評価値のための判別回帰処理を示す。以下では、特に、2種類の疾患の重症度を推定する場合を想定して説明する。
3 新規サンプル
4 重要特徴量
5 推定評価値
11 評価値置換テーブル作成手段
12 評価値置換手段
13 サンプル割当て手段
14 回帰評価関数算出手段
15 判別評価関数算出手段
16 回帰評価関数
17 判別評価関数
18 合成評価関数算出手段
19 判別回帰優先度調整手段
20 合成評価関数
21 合成評価関数最適化手段
22 収束判定手段
23 重要特徴量選別手段
24 推定式
25 推定式適用手段
41 2指を閉じた状態
42 2指を開いた状態
43 磁気センサ
44 2指の距離
51 距離波形
52 速度波形
53 加速度波形
101 判別処理
102 回帰処理
103 サンプル群(1)
104 新規サンプル
105 サンプル群(2)
106 推定評価値
201 サンプル群の特徴量
202 サンプル群の評価値
301 新規サンプルの特徴量
1011 判別評価関数算出手段
1012 判別評価関数
1013 判別評価関数最適化手段
1014 判別式
1015 判別式適用手段
1021 回帰評価関数算出手段
1022 回帰評価関数
1023 回帰評価関数最適化手段
1024 推定式
1025 推定式適用手段
1901 優先度定数
1902 優先度定数探索手段
2001 健常群
2002 疾患群1
2003 健常群
2004 疾患群2
2005 独立条件付き合成評価関数算出手段
2006 独立条件付き合成評価関数
2007 推定式1
2008 推定式2
2009 推定評価値1
2010 推定評価値2
2011 独立条件定義手段
2012 独立条件定数
2013 独立条件定数探索手段
2014 疾患優先度定数
2015 疾患優先度定数探索手段
2201 疾患1の推定重症度の軸
2202 疾患2の推定重症度の軸
10301 サンプル群(1)の特徴量
10401 新規サンプルの特徴量
10501 サンプル群(2)の特徴量
10502 サンプル群(2)の評価値
Claims (15)
- 特徴量と評価値を持つサンプル群を蓄積するメモリと、
前記メモリに蓄積されたサンプル群の前記特徴量と前記評価値を用いて、新規サンプルの特徴量から評価値を推定する推定式の係数を算出する推定式算出手段と、
新規サンプルの特徴量を前記推定式に適用することで推定評価値を算出する推定式適用手段とを有する回帰分析システムにおいて、
前記推定式算出手段は、
前記推定評価値が前記評価値を推定する精度を表す回帰評価関数を算出する回帰評価関数算出手段と、
前記サンプル群中の複数のクラスを判別する精度を評価する判別評価関数を算出する判別評価関数算出手段と、
前記回帰評価関数と前記判別評価関数とを合成して合成評価関数を算出する合成評価関数算出手段と、
前記合成評価関数を最適化して推定式の係数を算出する合成評価関数最適化手段(21)とを備えることを特徴とする回帰分析システム。 - 前記合成評価関数算出手段は、
前記回帰評価関数と前記判別評価関数の優先度を調整する優先度定数を使用して前記合成評価関数を算出する判別回帰優先度調整手段を含むことを特徴とする請求項1に記載の回帰分析システム。 - 前記判別回帰優先度調整手段は、合成評価関数を最適化する前記優先度定数を探索する優先度定数探索手段を含むことを特徴とする請求項2に記載の回帰分析システム。
- 評価値に数値分布を対応付ける、または、評価値が欠損している場合に数値分布を対応付けるテーブルを作成する評価値置換テーブル作成手段と、
一部または全部のサンプルの評価値を前記評価値置換テーブル作成手段で対応付けられた前記数値分布に置換する、または、評価値が欠損している一部または全部のサンプルの評価値を前記評価値置換テーブル作成手段で対応付けられた前記数値分布として与える評価値置換手段と、
評価値が置換された前記サンプル群を前記回帰評価関数算出手段と前記判別評価関数算出手段とに割り当てるサンプル割当て手段と、
を含むことを特徴とする請求項1に記載の回帰分析システム。 - 前記評価値置換テーブル作成手段の前記数値分布は、1つ以上の不等式で制限される数値範囲で表されることを特徴とする請求項4に記載の回帰分析システム。
- 前記評価値置換テーブル作成手段の前記数値分布は、前記評価値を入力とする数値関数で表されることを特徴とする請求項4に記載の回帰分析システム。
- 前記評価値置換テーブル作成手段の前記数値分布は、前記評価値と異なる数値とすることを特徴とする請求項4に記載の回帰分析システム。
- 前記回帰評価関数算出手段で算出される前記回帰評価関数は、サンプル群の評価値と推定評価値との誤差のべき乗の総和とすることを特徴とする請求項1に記載の回帰分析システム。
- 前記合成評価関数最適化手段(21)の後に収束判定を行い、収束していない場合は評価値置換テーブル作成手段にフィードバックして前記テーブルを修正する収束判定手段を含むことを特徴とする請求項4に記載の回帰分析システム。
- 前記特徴量の中で前記推定評価値との関連性が高い特徴量を選別する重要特徴量選別手段を含むことを特徴とする請求項1に記載の回帰分析システム。
- 複数種類の評価値が互いに独立になる条件を定義する独立条件定義手段と、
前記独立条件と複数種類の評価値に対応する複数の前記合成評価関数とを用いて、独立条件付き合成評価関数を算出する独立条件付き合成評価関数算出手段と、
を含むことを特徴とする請求項1に記載の回帰分析システム。 - 前記独立条件定義手段は、2種類の評価値が互いに独立になる条件を、2種類の評価値の軸ベクトルの内積を各軸ベクトルの絶対値で除算して得られる余弦によって定義することを特徴とする請求項11に記載の回帰分析システム
- 前記独立条件付き合成評価関数算出手段は、独立条件の強さを表す独立条件定数を使用して前記独立条件付き合成評価関数を算出することを特徴とする請求項11に記載の回帰分析システム。
- 前記独立条件付き合成評価関数算出手段で用いる前記独立条件定数を探索する独立条件定数探索手段を含むことを特徴とする請求項13に記載の回帰分析システム。
- 評価値を有する蓄積されたサンプル群の一部または全てについて、評価値置換テーブルにしたがってそれぞれの評価値を数値分布に置換すること、
評価値が数値分布に置換された前記サンプル群を回帰評価関数算出手段と判別評価関数算出手段とに割り当て、前記回帰評価関数算出手段により推定評価値が前記評価値を推定する精度を表す回帰評価関数を算出し、前記判別評価関数算出手段により前記サンプル群中の複数のクラスを判別する精度を評価する判別評価関数を算出すること、
前記回帰評価関数と前記判別評価関数とを合成して合成評価関数を算出すること、
前記合成評価関数を最適化して推定式の係数を算出すること
新規サンプルの特徴量を前記推定式に適用することで前記新規サンプルの推定評価値を算出することの手順を有する回帰分析方法。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011253439A JP5771510B2 (ja) | 2011-11-21 | 2011-11-21 | 判別と回帰を同時に行う回帰分析システムおよび回帰分析方法 |
PCT/JP2012/075889 WO2013077093A1 (ja) | 2011-11-21 | 2012-10-05 | 判別と回帰を同時に行う回帰分析システムおよび回帰分析方法 |
US14/358,369 US10963805B2 (en) | 2011-11-21 | 2012-10-05 | Regression analysis system and regression analysis method that perform discrimination and regression simultaneously |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011253439A JP5771510B2 (ja) | 2011-11-21 | 2011-11-21 | 判別と回帰を同時に行う回帰分析システムおよび回帰分析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013109540A JP2013109540A (ja) | 2013-06-06 |
JP5771510B2 true JP5771510B2 (ja) | 2015-09-02 |
Family
ID=48469548
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011253439A Active JP5771510B2 (ja) | 2011-11-21 | 2011-11-21 | 判別と回帰を同時に行う回帰分析システムおよび回帰分析方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US10963805B2 (ja) |
JP (1) | JP5771510B2 (ja) |
WO (1) | WO2013077093A1 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10719577B2 (en) * | 2014-12-05 | 2020-07-21 | Nec Corporation | System analyzing device, system analyzing method and storage medium |
CN111246794B (zh) * | 2017-10-30 | 2023-01-20 | 麦克赛尔株式会社 | 异常数据处理系统和异常数据处理方法 |
JP6833660B2 (ja) * | 2017-11-08 | 2021-02-24 | 株式会社東芝 | 信頼度監視システム、信頼度評価方法、及びプログラム |
JP2019162288A (ja) * | 2018-03-20 | 2019-09-26 | 公立大学法人公立諏訪東京理科大学 | 判定値算出装置、方法、及びプログラム、マイクロエラー発生判断装置、方法、及びプログラム |
JPWO2021220597A1 (ja) * | 2020-04-28 | 2021-11-04 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07253343A (ja) * | 1994-03-14 | 1995-10-03 | Mitsubishi Electric Corp | 判別方法及び判別装置及び判別システム |
US5860917A (en) * | 1997-01-15 | 1999-01-19 | Chiron Corporation | Method and apparatus for predicting therapeutic outcomes |
AU2006210430B2 (en) * | 2005-02-04 | 2012-06-14 | Entelos Holding Corp. | Method for defining virtual patient populations |
WO2010029627A1 (ja) * | 2008-09-11 | 2010-03-18 | 富士通株式会社 | 重回帰分析による予測モデルの作成方法、作成プログラム、作成装置 |
JP5330933B2 (ja) * | 2009-08-27 | 2013-10-30 | 日立コンシューマエレクトロニクス株式会社 | 運動機能評価システム、運動機能評価方法およびプログラム |
-
2011
- 2011-11-21 JP JP2011253439A patent/JP5771510B2/ja active Active
-
2012
- 2012-10-05 US US14/358,369 patent/US10963805B2/en active Active
- 2012-10-05 WO PCT/JP2012/075889 patent/WO2013077093A1/ja active Application Filing
Also Published As
Publication number | Publication date |
---|---|
US10963805B2 (en) | 2021-03-30 |
WO2013077093A1 (ja) | 2013-05-30 |
JP2013109540A (ja) | 2013-06-06 |
US20140304213A1 (en) | 2014-10-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Cowley et al. | Methodological standards for the development and evaluation of clinical prediction rules: a review of the literature | |
Kamal et al. | Alzheimer’s patient analysis using image and gene expression data and explainable-AI to present associated genes | |
CN112766379B (zh) | 一种基于深度学习多权重损失函数的数据均衡方法 | |
JP5771510B2 (ja) | 判別と回帰を同時に行う回帰分析システムおよび回帰分析方法 | |
Lahmar et al. | On the value of deep learning for diagnosing diabetic retinopathy | |
Filipovych et al. | JointMMCC: joint maximum-margin classification and clustering of imaging data | |
CN113490987A (zh) | 用于评估肌肉相关病症的方法 | |
KR102586853B1 (ko) | 3d-cnn 기반의 딥러닝 모델을 이용한 급성 허혈성 뇌졸중 진단 정보 제공 장치 및 방법 | |
Nabavi et al. | Automatic multi-class cardiovascular magnetic resonance image quality assessment using unsupervised domain adaptation in spatial and frequency domains | |
EP1357480A1 (en) | Osteoporosis screening method | |
Ahmed et al. | Benchmarking and selecting optimal diabetic retinopathy detecting machine learning model using entropy and TOPSIS method | |
Raza et al. | Classifier fusion using dempster-shafer theory of evidence to predict breast cancer tumors | |
Torghabeh et al. | An efficient tool for Parkinson's disease detection and severity grading based on time-frequency and fuzzy features of cumulative gait signals through improved LSTM networks | |
Gronowski et al. | Achieving utility, fairness, and compactness via tunable information bottleneck measures | |
Gummadi et al. | Transfer learning based classification of plasmodium falciparum parasitic blood smear images | |
Pahwa et al. | Utility of Machine learning in the Management of Normal Pressure Hydrocephalus (NPH): A Systematic Review | |
CN114388129B (zh) | 基于动态信息价值准则和集成学习的动脉粥样硬化风险预测方法 | |
Singh | Breast Cancer Classification Using ML on WDBC | |
Sano et al. | Severity estimation of finger-tapping caused by Parkinson's disease by using linear discriminant regression analysis | |
Minowa et al. | Comparing Deep Learning Models for Age Prediction Based on the Resting State fMRI Dataset from the “Brain Dock” Service in Japan | |
Chalmers et al. | Predicting the outcome of brace treatment for scoliosis using conditional fuzzy clustering | |
Rezeki et al. | Severity classification of alzheimer dementia based on mri images using deep neural network | |
Krzywicka et al. | Sensitivity of Standard Evaluation Metrics for Disease Classification and Progression Assessment Based on Whole-Body Imaging | |
Codex | Evaluating the Performance of Voting Mechanisms in Ensemble Classification for Breast Tumor Diagnosis: A Comprehensive Review | |
Bui | OPTIMAL CARE FOR GERIATRIC HIP FRACTURE PATIENTS |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140805 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150602 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150629 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5771510 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |