JP2007122418A - 予測方法、予測装置および予測プログラム - Google Patents
予測方法、予測装置および予測プログラム Download PDFInfo
- Publication number
- JP2007122418A JP2007122418A JP2005313930A JP2005313930A JP2007122418A JP 2007122418 A JP2007122418 A JP 2007122418A JP 2005313930 A JP2005313930 A JP 2005313930A JP 2005313930 A JP2005313930 A JP 2005313930A JP 2007122418 A JP2007122418 A JP 2007122418A
- Authority
- JP
- Japan
- Prior art keywords
- prediction
- function
- variable
- probability
- explanatory
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 23
- 230000006870 function Effects 0.000 claims abstract description 88
- 230000001419 dependent effect Effects 0.000 claims abstract description 37
- 238000004364 calculation method Methods 0.000 claims abstract description 23
- 238000012360 testing method Methods 0.000 claims description 4
- 230000003993 interaction Effects 0.000 abstract description 6
- 238000012706 support-vector machine Methods 0.000 description 17
- 201000010099 disease Diseases 0.000 description 11
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 11
- 108700028369 Alleles Proteins 0.000 description 7
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 6
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 6
- 239000002773 nucleotide Substances 0.000 description 5
- 125000003729 nucleotide group Chemical group 0.000 description 5
- 238000012545 processing Methods 0.000 description 4
- 108090000623 proteins and genes Proteins 0.000 description 4
- 238000000611 regression analysis Methods 0.000 description 4
- 229940104302 cytosine Drugs 0.000 description 3
- 230000035487 diastolic blood pressure Effects 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 230000009021 linear effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 229940113082 thymine Drugs 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000012417 linear regression Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 235000015598 salt intake Nutrition 0.000 description 2
- 208000007530 Essential hypertension Diseases 0.000 description 1
- 108091092878 Microsatellite Proteins 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 102000054766 genetic haplotypes Human genes 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 230000009022 nonlinear effect Effects 0.000 description 1
- 238000012887 quadratic function Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 201000000980 schizophrenia Diseases 0.000 description 1
- 238000002945 steepest descent method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 208000001072 type 2 diabetes mellitus Diseases 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
【解決手段】本発明の予測方法は、複数の説明変数と、ある状態の発生の有無をあらわす従属変数とを有するサンプルの集合である学習データをデータベースから読み出す読出ステップと、前記説明変数ごとに用意された要素カーネル関数の和としてのカーネル関数を用いて定義された回帰式における回帰係数を、前記学習データを用いてあらかじめ与えられた目的関数を最適化することによって求める係数計算ステップと、入力パラメータとして複数の説明変数を前記回帰式に入力して従属変数を求める従属変数算出ステップと、求めた従属変数を確率予測関数に入力して前記ある状態が発生または発生しない確率を予測する確率予測ステップと、を備える。
【選択図】図1
Description
それをロジスティック変換によりある事象が起こる確率とするロジスティック重回帰分析がある。各説明変数の従属変数への寄与の指標として、オッズ比が得られる。
Vapnik, V.N., 1999."The nature of statistical learning theory", Springer-Verlag. Haussler, D., 1999."Convolution kernels on discrete structure", UCSC-CRL-99-10. Guyon, I., Weston, J., Barnhill, S., Vapnik, V.N., 2002."Gene selection for cancer classification using support vector machine", Machine Learning, Vol.46: 389-422. Hartl, D., 2000."A primer of population genetics, 3rd eds.", Sinauer Associates. Courant, R., Hilbert, D., 1953."Methods of mathematical physics, Vol.1", Interscience.
説明変数:i(1,2,...,l)、
個体の番号:j,k(1,2,...,n)とする。
また、F1i=(T,C), F2i=(T,C)の場合は以下のようになる。
図3の値からも理解されるように、(式4)のカーネル関数は、遺伝学におけるidentical by descentの関係(非特許文献4参照)にありうる対立遺伝子の最大の数をあらわすものである。
説明変数が順序に意味のない2成分をもつ離散的なベクトル量であるとき、1番目のサンプルの説明変数をベクトルF1とし、2番目のサンプルの説明変数をベクトルF2とすると、関数
非線形SVMにおけるカーネル関数は
12 解析用計算機
13 学習用計算機
14 学習データベース
Claims (10)
- 複数の説明変数と、ある状態の発生の有無をあらわす従属変数とを有するサンプルの集合である学習データをデータベースから読み出す読出ステップと、
前記説明変数ごとに用意された要素カーネル関数の和としてのカーネル関数を用いて定義された回帰式における回帰係数を、前記学習データを用いてあらかじめ与えられた目的関数を最適化することによって求める係数計算ステップと、
入力パラメータとして複数の説明変数を前記回帰式に入力して従属変数を求める従属変数算出ステップと、
求めた従属変数を確率予測関数に入力して前記ある状態が発生または発生しない確率を予測する確率予測ステップと、
を備えた予測方法。 - leave-one-out法を用いて前記サンプル数分の確率を予測する予測ステップと、
予測した各前記確率を階級に分類する分類ステップと、
前記階級に属するサンプルの個数のうち、予測すべき状態をもつサンプルの個数の比率を計算する計算ステップと、
各前記階級の代表値と、各前記階級から計算された前記比率とから前記回帰式の適合度を求める適合度検定ステップと、
をさらに備えることを特徴とする請求項1または2に記載の予測方法。 - 前記目的関数からある説明変数を含む項を除いて、除く前との前記目的関数の値の差分を求めることを全ての説明変数について行い、最も差分が小さい説明変数を除く除去ステップと、
前記係数計算ステップ、前記予測ステップ、前記分類ステップ、前記計算ステップ、前記適合度検定ステップ、前記除去ステップを繰り返す再帰ステップと、
をさらに備えたことを特徴とする請求項3に記載の予測方法。 - 前記再帰ステップは、前記除去ステップによる除去後の説明変数の個数が閾値に達した場合は繰り返しを終了し、最も適合度が高いときの説明変数を、予測に有用な説明変数として選択することを特徴とする請求項4に記載の予測方法。
- 選択された各前記説明変数について、前記回帰式の従属変数に対する寄与率を寄与率計算関数に基づいて計算する寄与率計算ステップをさらに備えたことを特徴とする請求項5に記載の予測方法。
- 前記確率予測関数として、ロジスティック関数を採用することを特徴とする請求項1ないし6のいずれかに記載の予測方法。
- 請求項1ないし7のいずれか一項に記載の各ステップをコンピュータに実行させるための予測プログラム。
- 複数の説明変数と、ある状態の発生の有無をあらわす従属変数とを有するサンプルの集合である学習データを格納したデータベースと、
前記説明変数ごとに用意された要素カーネル関数の和としてのカーネル関数を用いて定義された回帰式における回帰係数を、前記学習データを用いてあらかじめ与えられた目的関数を最適化することによって求める学習計算部と、
入力パラメータとして複数の説明変数を前記回帰式に入力して従属変数を求め、求めた従属変数を確率予測関数に入力して前記ある状態が発生または発生しない確率を予測する解析計算部と、
を備えた予測装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005313930A JP5005208B2 (ja) | 2005-10-28 | 2005-10-28 | 予測方法、予測装置および予測プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005313930A JP5005208B2 (ja) | 2005-10-28 | 2005-10-28 | 予測方法、予測装置および予測プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007122418A true JP2007122418A (ja) | 2007-05-17 |
JP5005208B2 JP5005208B2 (ja) | 2012-08-22 |
Family
ID=38146205
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005313930A Expired - Fee Related JP5005208B2 (ja) | 2005-10-28 | 2005-10-28 | 予測方法、予測装置および予測プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5005208B2 (ja) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010271877A (ja) * | 2009-05-21 | 2010-12-02 | Yamaguchi Univ | 災害発生確率評価システムとそのプログラム |
WO2012001921A1 (ja) * | 2010-06-28 | 2012-01-05 | 日本電気株式会社 | フィードバック情報を用いた医療情報からの異常イベント抽出装置、方法およびプログラム |
WO2012001920A1 (ja) * | 2010-06-28 | 2012-01-05 | 日本電気株式会社 | 医療情報からの異常イベント抽出装置、方法及びプログラム |
JP2012256182A (ja) * | 2011-06-08 | 2012-12-27 | Sharp Corp | データ解析装置、データ解析方法およびデータ解析プログラム |
US9087294B2 (en) | 2012-01-11 | 2015-07-21 | International Business Machines Corporation | Prediction method, prediction system and program |
JP2018147280A (ja) * | 2017-03-07 | 2018-09-20 | 株式会社日立ソリューションズ | データ分析装置及びデータ分析方法 |
JP2019215831A (ja) * | 2018-06-14 | 2019-12-19 | 株式会社日立物流 | 予測システム及び予測方法 |
CN111340361A (zh) * | 2020-02-25 | 2020-06-26 | 武汉轻工大学 | 求解黄酒原料指标范围的数据驱动模型分析方法及装置 |
JP2022151738A (ja) * | 2021-03-23 | 2022-10-07 | 日本電気株式会社 | データ処理のための方法、装置及びプログラム |
CN111445992B (zh) * | 2020-01-21 | 2023-11-03 | 中国医学科学院肿瘤医院 | 建立预测模型的方法、装置、介质及设备 |
-
2005
- 2005-10-28 JP JP2005313930A patent/JP5005208B2/ja not_active Expired - Fee Related
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4701371B2 (ja) * | 2009-05-21 | 2011-06-15 | 国立大学法人山口大学 | 災害発生確率評価システムとそのプログラム |
JP2010271877A (ja) * | 2009-05-21 | 2010-12-02 | Yamaguchi Univ | 災害発生確率評価システムとそのプログラム |
JP5900334B2 (ja) * | 2010-06-28 | 2016-04-06 | 日本電気株式会社 | フィードバック情報を用いた医療情報からの異常イベント抽出装置、方法およびプログラム |
WO2012001921A1 (ja) * | 2010-06-28 | 2012-01-05 | 日本電気株式会社 | フィードバック情報を用いた医療情報からの異常イベント抽出装置、方法およびプログラム |
WO2012001920A1 (ja) * | 2010-06-28 | 2012-01-05 | 日本電気株式会社 | 医療情報からの異常イベント抽出装置、方法及びプログラム |
JP5900333B2 (ja) * | 2010-06-28 | 2016-04-06 | 日本電気株式会社 | 医療情報からの異常イベント抽出装置、方法及びプログラム |
US9269118B2 (en) | 2010-06-28 | 2016-02-23 | Nec Corporation | Device, method, and program for extracting abnormal event from medical information |
JP2012256182A (ja) * | 2011-06-08 | 2012-12-27 | Sharp Corp | データ解析装置、データ解析方法およびデータ解析プログラム |
US9087294B2 (en) | 2012-01-11 | 2015-07-21 | International Business Machines Corporation | Prediction method, prediction system and program |
JP2018147280A (ja) * | 2017-03-07 | 2018-09-20 | 株式会社日立ソリューションズ | データ分析装置及びデータ分析方法 |
JP2019215831A (ja) * | 2018-06-14 | 2019-12-19 | 株式会社日立物流 | 予測システム及び予測方法 |
JP7015740B2 (ja) | 2018-06-14 | 2022-02-03 | 株式会社日立物流 | 予測システム及び予測方法 |
CN111445992B (zh) * | 2020-01-21 | 2023-11-03 | 中国医学科学院肿瘤医院 | 建立预测模型的方法、装置、介质及设备 |
CN111340361A (zh) * | 2020-02-25 | 2020-06-26 | 武汉轻工大学 | 求解黄酒原料指标范围的数据驱动模型分析方法及装置 |
CN111340361B (zh) * | 2020-02-25 | 2023-04-28 | 武汉轻工大学 | 求解黄酒原料指标范围的数据驱动模型分析方法及装置 |
JP2022151738A (ja) * | 2021-03-23 | 2022-10-07 | 日本電気株式会社 | データ処理のための方法、装置及びプログラム |
JP7416111B2 (ja) | 2021-03-23 | 2024-01-17 | 日本電気株式会社 | データ処理のための方法、装置及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5005208B2 (ja) | 2012-08-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5005208B2 (ja) | 予測方法、予測装置および予測プログラム | |
Whalen et al. | Navigating the pitfalls of applying machine learning in genomics | |
Chatterjee et al. | Developing and evaluating polygenic risk prediction models for stratified disease prevention | |
Lazar et al. | Batch effect removal methods for microarray gene expression data integration: a survey | |
Lee et al. | Bayesian semiparametric analysis of semicompeting risks data: investigating hospital readmission after a pancreatic cancer diagnosis | |
US20210375392A1 (en) | Machine learning platform for generating risk models | |
EP3471107A1 (en) | Medical device and computer-implemented method of predicting risk, occurrence or progression of adverse health conditions in test subjects in subpopulations arbitrarily selected from a total population | |
Li et al. | An empirical Bayes approach for multiple tissue eQTL analysis | |
Wilfert et al. | Genome-wide significance testing of variation from single case exomes | |
JP2008511058A (ja) | コンピュータシステムを用いるデータ品質および/または部分異数染色体の決定 | |
Sinnott et al. | Improving the power of genetic association tests with imperfect phenotype derived from electronic medical records | |
Cologne et al. | Conventional case–cohort design and analysis for studies of interaction | |
US20210343414A1 (en) | Methods and apparatus for phenotype-driven clinical genomics using a likelihood ratio paradigm | |
Zhu et al. | An iterative approach to detect pleiotropy and perform Mendelian Randomization analysis using GWAS summary statistics | |
Logsdon et al. | A novel variational Bayes multiple locus Z-statistic for genome-wide association studies with Bayesian model averaging | |
Marciano et al. | Developmental validation of PACE™: Automated artifact identification and contributor estimation for use with GlobalFiler™ and PowerPlex® fusion 6c generated data | |
Bao et al. | Genome-wide association studies using a penalized moving-window regression | |
Yang et al. | Newborn screening in the era of precision medicine | |
Tawiah et al. | A bivariate joint frailty model with mixture framework for survival analysis of recurrent events with dependent censoring and cure fraction | |
Cheng et al. | MR-Corr2: a two-sample Mendelian randomization method that accounts for correlated horizontal pleiotropy using correlated instrumental variants | |
Le et al. | Nearest-neighbor Projected-Distance Regression (NPDR) for detecting network interactions with adjustments for multiple tests and confounding | |
Sauk et al. | NIPTmer: rapid k-mer-based software package for detection of fetal aneuploidies | |
González et al. | Obtaining relevant genes by analysis of expression arrays with a multi-agent system | |
Levy et al. | Development and validation of self-monitoring auto-updating prognostic models of survival for hospitalized COVID-19 patients | |
Palowitch et al. | Estimation of cis-eQTL effect sizes using a log of linear model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20081006 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110823 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111024 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120424 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120523 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150601 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |