JP5005208B2 - 予測方法、予測装置および予測プログラム - Google Patents
予測方法、予測装置および予測プログラム Download PDFInfo
- Publication number
- JP5005208B2 JP5005208B2 JP2005313930A JP2005313930A JP5005208B2 JP 5005208 B2 JP5005208 B2 JP 5005208B2 JP 2005313930 A JP2005313930 A JP 2005313930A JP 2005313930 A JP2005313930 A JP 2005313930A JP 5005208 B2 JP5005208 B2 JP 5005208B2
- Authority
- JP
- Japan
- Prior art keywords
- individuals
- individual
- explanatory
- variable
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
それをロジスティック変換によりある事象が起こる確率とするロジスティック重回帰分析がある。各説明変数の従属変数への寄与の指標として、オッズ比が得られる。
Vapnik, V.N., 1999."The nature of statistical learning theory", Springer-Verlag. Haussler, D., 1999."Convolution kernels on discrete structure", UCSC-CRL-99-10. Guyon, I., Weston, J., Barnhill, S., Vapnik, V.N., 2002."Gene selection for cancer classification using support vector machine", Machine Learning, Vol.46: 389-422. Hartl, D., 2000."A primer of population genetics, 3rd eds.", Sinauer Associates. Courant, R., Hilbert, D., 1953."Methods of mathematical physics, Vol.1", Interscience.
説明変数:i(1,2,...,l)、
個体の番号:j,k(1,2,...,n)とする。
また、F1i=(T,C), F2i=(T,C)の場合は以下のようになる。
図3の値からも理解されるように、(式4)のカーネル関数は、遺伝学におけるidentical by descentの関係(非特許文献4参照)にありうる対立遺伝子の最大の数をあらわすものである。
説明変数が順序に意味のない2成分をもつ離散的なベクトル量であるとき、1番目のサンプルの説明変数をベクトルF1とし、2番目のサンプルの説明変数をベクトルF2とすると、関数
非線形SVMにおけるカーネル関数は
12 解析用計算機
13 学習用計算機
14 学習データベース
Claims (9)
- 複数の個体について、前記個体の因子の値をそれぞれ表す複数の説明変数と、前記個体についてある状態の発生の有無をあらわす従属変数とを有するサンプルの集合である学習データを用いて、前記ある状態が発生するまたは発生しない確率を予測するための予測装置であって、
前記学習データをデータベースから読み出す読出ステップと、
(A-1)前記説明変数ごとに用意され前記複数の個体のうち異なる2つの個体の前記説明変数を入力とする要素カーネル関数の、前記複数の説明変数についての和を表すカーネル関数と、
(A-2)前記複数の個体ごとに用意された回帰係数とを用いて、
(A-3)前記複数の個体のうちの2つの個体のすべての組み合わせについて、前記カーネル関数と、前記2つの個体のそれぞれの回帰係数と、前記2つの個体の従属変数とを乗算し、合計した値を、すべての個体に対する前記回帰係数の合計から減算することを定めた、目的関数を作成し、前記個体ごとの前記回帰係数が取り得る値の範囲の条件と、前記個体ごとの前記回帰係数と前記個体ごとの前記従属変数との乗算和がとる値の条件を満たすように、前記目的関数を最大化することにより、前記複数の個体ごとの回帰係数を同定する、
係数計算ステップと、
予測対象となる個体の因子の値をそれぞれ表す複数の説明変数を入力するステップと、
(B-1)前記説明変数ごとに用意され、予測対象となる個体の前記説明変数と前記複数の個体のうちの1つの前記説明変数とを入力とする要素カーネル関数の、前記複数の説明変数についての和を表すカーネル関数を用いて、
(B-2)前記個体のすべてについて、前記カーネル関数と、前記複数の個体のうちの1つの個体について同定された回帰係数と、前記1つの個体の従属変数とを乗算し、合計することを定めた回帰式を計算することにより、前記予測対象となる個体の従属変数を求める、
従属変数算出ステップと、
前記従属変数算出ステップで求められた従属変数を、ロジスティック関数により変換することで前記予測対象となる個体について前記ある状態が発生する、または発生しない確率を予測する確率予測ステップと
をコンピュータが実行する予測方法。 - leave-one-out法を用いて前記複数の個体のそれぞれについて前記ある状態が発生するまたは発生しない確率を予測する予測ステップと、
前記予測ステップで各個体について予測した確率を、それぞれ異なる確率範囲を表す階級に分類する分類ステップと、
前記階級に属する個体のうち、前記ある状態が発生したまたは発生していないことを示す従属変数をもつ個体の数の比率を計算する計算ステップと、
各前記階級の中央値と、各前記階級について計算した前記個体の比率とからカイ二乗適合度検定を行うことにより、p値を求める適合度検定ステップと、
をさらに前記コンピュータが実行することを特徴とする請求項1または2に記載の予測方法。 - 前記目的関数からある説明変数を含む項を除いて、除く前との前記目的関数の値の差分を求めることを全ての説明変数について行い、最も差分が小さい説明変数を除く除去ステップと、
前記係数計算ステップ、前記予測ステップ、前記分類ステップ、前記計算ステップ、前記適合度検定ステップ、前記除去ステップを繰り返す再帰ステップと、
をさらに前記コンピュータが実行することを特徴とする請求項3に記載の予測方法。 - 前記再帰ステップは、前記除去ステップによる除去後の説明変数の個数が閾値に達した場合は繰り返しを終了し、前記適合度検定ステップで最も高いp値が得られたときの回帰式で用いられている説明変数を、予測に有用な説明変数として選択することを特徴とする請求項4に記載の予測方法。
- 予測に有用として選択された各前記説明変数のそれぞれについて、
前記予測対象となる個体の前記選択された説明変数と、前記複数の個体のうちの1つの個体の前記選択された説明変数とを入力とする要素カーネル関数と、前記1つの個体の前記回帰係数と、前記1つの個体の前記従属変数とを乗算し、前記複数の個体について合計することを定めた関数に基づき、
前記関数を前記選択された説明変数のすべてについて合計した値に対する、前記選択された説明変数のそれぞれに対応する前記関数の比率を、前記選択された説明変数の寄与率としてそれぞれ計算する寄与率計算ステップをさらに前記コンピュータが実行することを特徴とする請求項5に記載の予測方法。 - 請求項1ないし6のいずれか一項に記載の各ステップをコンピュータに実行させるための予測プログラム。
- 複数の個体について、前記個体の因子の値をそれぞれ表す複数の説明変数と、前記個体についてある状態の発生の有無をあらわす従属変数とを有するサンプルの集合である学習データを格納したデータベースと、
(A-1)前記説明変数ごとに用意され前記複数の個体のうち異なる2つの個体の前記説明変数を入力とする要素カーネル関数の、前記複数の説明変数についての和を表すカーネル関数と、
(A-2)前記複数の個体ごとに用意された回帰係数とを用いて、
(A-3)前記複数の個体のうちの2つの個体のすべての組み合わせについて、前記カーネル関数と、前記2つの個体のそれぞれの回帰係数と、前記2つの個体の従属変数とを乗算し、合計した値を、すべての個体に対する前記回帰係数の合計から減算することを定めた、目的関数を作成し、前記個体ごとの前記回帰係数が取り得る値の範囲の条件と、前記個体ごとの前記回帰係数と前記個体ごとの前記従属変数との乗算和がとる値の条件を満たすように、前記目的関数を最大化することにより、前記複数の個体ごとの回帰係数を同定する、手段と、
予測対象となる個体の因子の値をそれぞれ表す複数の説明変数を受ける手段と、
(B-1)前記説明変数ごとに用意され、予測対象となる個体の前記説明変数と前記複数の個体のうちの1つの前記説明変数とを入力とする要素カーネル関数の、前記複数の説明変数についての和を表すカーネル関数を用いて、
(B-2)前記個体のすべてについて、前記カーネル関数と、前記複数の個体のうちの1つの個体について同定された回帰係数と、前記1つの個体の従属変数とを乗算し、合計することを定めた回帰式を計算することにより、前記予測対象となる個体の従属変数を求める、
手段と、
を有する学習計算部と、
前記従属変数算出ステップで求められた従属変数を、ロジスティック関数により変換することで、前記予測対象となる個体について前記ある状態が発生する、または発生しない確率を予測する解析計算部と、
を備えた予測装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005313930A JP5005208B2 (ja) | 2005-10-28 | 2005-10-28 | 予測方法、予測装置および予測プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005313930A JP5005208B2 (ja) | 2005-10-28 | 2005-10-28 | 予測方法、予測装置および予測プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007122418A JP2007122418A (ja) | 2007-05-17 |
JP5005208B2 true JP5005208B2 (ja) | 2012-08-22 |
Family
ID=38146205
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005313930A Expired - Fee Related JP5005208B2 (ja) | 2005-10-28 | 2005-10-28 | 予測方法、予測装置および予測プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5005208B2 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4701371B2 (ja) * | 2009-05-21 | 2011-06-15 | 国立大学法人山口大学 | 災害発生確率評価システムとそのプログラム |
WO2012001921A1 (ja) * | 2010-06-28 | 2012-01-05 | 日本電気株式会社 | フィードバック情報を用いた医療情報からの異常イベント抽出装置、方法およびプログラム |
WO2012001920A1 (ja) * | 2010-06-28 | 2012-01-05 | 日本電気株式会社 | 医療情報からの異常イベント抽出装置、方法及びプログラム |
JP2012256182A (ja) * | 2011-06-08 | 2012-12-27 | Sharp Corp | データ解析装置、データ解析方法およびデータ解析プログラム |
JP5988419B2 (ja) | 2012-01-11 | 2016-09-07 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 予測方法、予測システムおよびプログラム |
JP2018147280A (ja) * | 2017-03-07 | 2018-09-20 | 株式会社日立ソリューションズ | データ分析装置及びデータ分析方法 |
JP7015740B2 (ja) * | 2018-06-14 | 2022-02-03 | 株式会社日立物流 | 予測システム及び予測方法 |
CN111445992B (zh) * | 2020-01-21 | 2023-11-03 | 中国医学科学院肿瘤医院 | 建立预测模型的方法、装置、介质及设备 |
CN111340361B (zh) * | 2020-02-25 | 2023-04-28 | 武汉轻工大学 | 求解黄酒原料指标范围的数据驱动模型分析方法及装置 |
CN115115056A (zh) | 2021-03-23 | 2022-09-27 | 日本电气株式会社 | 用于数据处理的方法、装置和介质 |
-
2005
- 2005-10-28 JP JP2005313930A patent/JP5005208B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2007122418A (ja) | 2007-05-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5005208B2 (ja) | 予測方法、予測装置および予測プログラム | |
Chatterjee et al. | Developing and evaluating polygenic risk prediction models for stratified disease prevention | |
Lazar et al. | Batch effect removal methods for microarray gene expression data integration: a survey | |
Bravo et al. | Model-based quality assessment and base-calling for second-generation sequencing data | |
US20210375392A1 (en) | Machine learning platform for generating risk models | |
Lange et al. | A joint model for multistate disease processes and random informative observation times, with applications to electronic medical records data | |
Cologne et al. | Conventional case–cohort design and analysis for studies of interaction | |
EP3471107A1 (en) | Medical device and computer-implemented method of predicting risk, occurrence or progression of adverse health conditions in test subjects in subpopulations arbitrarily selected from a total population | |
Mughal et al. | Localizing and classifying adaptive targets with trend filtered regression | |
JP2006519440A (ja) | 疾患の増大リスクの統計学的同定法 | |
US20210343414A1 (en) | Methods and apparatus for phenotype-driven clinical genomics using a likelihood ratio paradigm | |
Derkach et al. | Power Analysis for Genetic Association Test (PAGEANT) provides insights to challenges for rare variant association studies | |
CA2877011A1 (en) | Systems and methods for identifying a contributor's str genotype based on a dna sample having multiple contributors | |
Logsdon et al. | A novel variational Bayes multiple locus Z-statistic for genome-wide association studies with Bayesian model averaging | |
Deshwar et al. | PLIDA: cross-platform gene expression normalization using perturbed topic models | |
Marciano et al. | Developmental validation of PACE™: Automated artifact identification and contributor estimation for use with GlobalFiler™ and PowerPlex® fusion 6c generated data | |
Bao et al. | Genome-wide association studies using a penalized moving-window regression | |
Sauk et al. | NIPTmer: rapid k-mer-based software package for detection of fetal aneuploidies | |
Le et al. | Nearest-neighbor Projected-Distance Regression (NPDR) for detecting network interactions with adjustments for multiple tests and confounding | |
Bolli et al. | Software as a service for the genomic prediction of complex diseases | |
Palowitch et al. | Estimation of cis-eQTL effect sizes using a log of linear model | |
JP6374532B2 (ja) | 特定遺伝子座群又は個別の遺伝子座の遺伝型の判定方法、判定用コンピュータシステム及び判定用プログラム | |
CN116525108A (zh) | 基于snp数据的预测方法、装置、设备及存储介质 | |
Huang et al. | Statistical modeling of isoform splicing dynamics from RNA-seq time series data | |
Xu et al. | High-throughput and efficient multilocus genome-wide association study on longitudinal outcomes |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20081006 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110823 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20111024 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120424 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120523 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150601 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |