JP5413952B2 - 網羅的ゲノムワイドsnp情報に基づくエピスタシス効果の探索アルゴリズム - Google Patents
網羅的ゲノムワイドsnp情報に基づくエピスタシス効果の探索アルゴリズム Download PDFInfo
- Publication number
- JP5413952B2 JP5413952B2 JP2009070753A JP2009070753A JP5413952B2 JP 5413952 B2 JP5413952 B2 JP 5413952B2 JP 2009070753 A JP2009070753 A JP 2009070753A JP 2009070753 A JP2009070753 A JP 2009070753A JP 5413952 B2 JP5413952 B2 JP 5413952B2
- Authority
- JP
- Japan
- Prior art keywords
- snp
- formula
- analysis
- type
- phenotype
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000000694 effects Effects 0.000 title claims description 111
- 238000010845 search algorithm Methods 0.000 title 1
- 238000004458 analytical method Methods 0.000 claims description 62
- 238000000034 method Methods 0.000 claims description 56
- 238000004364 calculation method Methods 0.000 claims description 45
- 238000007405 data analysis Methods 0.000 claims description 31
- 230000002195 synergetic effect Effects 0.000 claims description 16
- 238000007781 pre-processing Methods 0.000 claims description 10
- 238000012216 screening Methods 0.000 claims description 10
- 108700028369 Alleles Proteins 0.000 claims description 9
- 239000002773 nucleotide Substances 0.000 claims description 8
- 125000003729 nucleotide group Chemical group 0.000 claims description 8
- 238000000491 multivariate analysis Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 5
- 230000009044 synergistic interaction Effects 0.000 claims description 4
- 108090000623 proteins and genes Proteins 0.000 description 31
- 230000003993 interaction Effects 0.000 description 13
- 238000007477 logistic regression Methods 0.000 description 6
- 208000033808 peripheral neuropathy Diseases 0.000 description 6
- 238000007476 Maximum Likelihood Methods 0.000 description 4
- 238000002512 chemotherapy Methods 0.000 description 4
- 238000007796 conventional method Methods 0.000 description 4
- 239000003814 drug Substances 0.000 description 4
- 238000012795 verification Methods 0.000 description 4
- 206010006187 Breast cancer Diseases 0.000 description 3
- 208000026310 Breast neoplasm Diseases 0.000 description 3
- 229930012538 Paclitaxel Natural products 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 229960001592 paclitaxel Drugs 0.000 description 3
- RCINICONZNJXQF-MZXODVADSA-N taxol Chemical compound O([C@@H]1[C@@]2(C[C@@H](C(C)=C(C2(C)C)[C@H](C([C@]2(C)[C@@H](O)C[C@H]3OC[C@]3([C@H]21)OC(C)=O)=O)OC(=O)C)OC(=O)[C@H](O)[C@@H](NC(=O)C=1C=CC=CC=1)C=1C=CC=CC=1)O)C(=O)C1=CC=CC=C1 RCINICONZNJXQF-MZXODVADSA-N 0.000 description 3
- 101000690100 Homo sapiens U1 small nuclear ribonucleoprotein 70 kDa Proteins 0.000 description 2
- 102100024121 U1 small nuclear ribonucleoprotein 70 kDa Human genes 0.000 description 2
- 239000002246 antineoplastic agent Substances 0.000 description 2
- 229940041181 antineoplastic drug Drugs 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 238000000018 DNA microarray Methods 0.000 description 1
- 238000000729 Fisher's exact test Methods 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 230000003042 antagnostic effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 210000000481 breast Anatomy 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 231100000862 numbness Toxicity 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 238000001356 surgical procedure Methods 0.000 description 1
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
これまで古くからエピスタシスの概念は存在したが、実際にエピスタシス効果を探索することが困難な場合がある。少数遺伝子セットの解析において、ロジスティックモデルを用いた解析法も提案されている。非特許文献4:Cordell and Clayton. Am J Hum Genet, Vol.70, No.1, 124-141, 2002を参照のこと。単独遺伝子が表現型に対して主効果を持つ場合のエピスタシス効果の検出には罰則付最尤推定法およびBSE法の可変間隔アプローチがある。非特許文献5:Zhang, Shrinkage Estimation Method for Mapping Multiple Quantitative Trait Loci、Vol.33 No.10, Page.861-869, 2006を参照のこと。また、遺伝子座における主効果と2遺伝子座間の交互作用をエントロピーに基づいて解析する方法も提案されている。非特許文献6:Dong et al. Eur J Hum Genet. Vol.16, 229-235, 2008を参照のこと。
(1)2種類のクラスの表現型を有するN個の検体から観測された総計M個(Mは50万以上)のSNPのジェノタイプデータと各検体に対応する表現型のクラスを入力する入力手段と、
(2)前記入力手段(1)を介して入力されたN個の検体の表現型のクラスと総計M個のジェノタイプデータを記憶する記憶手段と、
(3)前記記憶手段(2)によって記憶されているi番目のSNPに対して、検体N人に対する2つの表現型のクラスとジェノタイプデータの統計処理を行い、クラス別ジェノタイプ別計数を算出し、算出したマイナーアレル別計数を基にi番目のSNPの解析継続の適否を判定する前処理ステップとしてのスクリーニングを行う演算手段と、
(4)前記演算手段(3)によって、解析対象SNPとして「解析継続適」と判定された場合は、算出した計数を基にi番目のSNPが表現型に対して優性型か劣性型かを統計的手段により判定し、解析継続の適否および優性型・劣性型に関する判定結果を内部記憶装置に記憶する記憶手段と、
(5)前記統計的手段によって判定された、優性型・劣性型に関する判定結果に基づき、表現型の2つのクラスの各々に対して、i番目とj番目(j≠i、初期値としてi=1, j=2)のそれぞれ2つのSNPの優性型・劣性型が判定された2x2分割表を作成し、作成された2x2分割表に対してエピスタシスを判定する指標を算出し、この指標を基にエピスタシス効果の有無を判定する演算手段と、
(6)前記演算手段(5)によって、「エピスタシス効果有り」と判定された場合に、2つのSNPに対する「エピスタシス効果有り」の判定結果を記憶し、次のSNPの解析に移るに際して、j番目のSNPをj+1番目のSNPに変更し、前記記録手段(4)のステップに戻り、j+1番目のSNPの優性型・劣性型を統計的手段により判定し前記演算手段(3)のステップの計算を繰り返し、j+1がMに達した場合には、i番目のSNPをi+1番目に、j番目をi+2番目のSNPを選択する解析手段と、
(7)前記演算手段(5)において、「エピスタシス効果有り」と判定された場合、ロジスティック解析分析を用いた多変量解析手段によって、相乗的エピスタシス効果の確認を行う演算手段と、
を具えている
ことを特徴とするデータ解析システムである。
コンピュータを用い50万箇所以上におよぶゲノムワイドな一塩基多型(SNP)のジェノタイプデータから、2値のクラスを有する表現型に対して、主効果が確認されない場合でも相乗的相互作用(エピスタシス効果)を有するSNPのペアーを網羅的に同定するデータ解析方法であって、
(1)2種類のクラスの表現型を有するN個の検体から観測された総計M個(Mは50万以上)のSNPのジェノタイプデータと各検体に対応する表現型のクラスを入力する入力ステップと、
(2)前記入力ステップ(2)を介して入力されたN個の検体の表現型のクラスと総計M個のジェノタイプデータを、記憶手段に記憶する記憶ステップと、
(3)前記記憶ステップ(2)によって、記憶手段に記憶されているi番目のSNPに対して、検体N人に対する2つの表現型のクラスとジェノタイプデータの統計処理を行い、クラス別ジェノタイプ別計数を算出し、算出したマイナーアレル別別計数を基にi番目のSNPの解析継続の適否を判定する前処理ステップとしてのスクリーニングを行う演算ステップと、
(4)前記演算ステップ(3)において、解析対象SNPとして「解析継続適」と判定された場合は、算出した計数を基にi番目のSNPが表現型に対して優性型か劣性型かを統計的手段により判定し、解析継続の適否および優性型・劣性型に関する判定結果を内部記憶装置に記憶する記憶ステップと、
(5)前記ステップ(4)において、統計的手段よって判定された、優性型・劣性型に関する判定結果に基づき、表現型の2つのクラスの各々に対して、i番目とj番目(j≠i、初期値としてi=1, j=2)のそれぞれ2つのSNPの優性型・劣性型が判定された2x2分割表を作成し、作成された2x2分割表に対してエピスタシスを判定する指標を算出し、この指標を基にエピスタシス効果の有無を判定する演算ステップと、
(6)前記演算ステップ(5)によって、「エピスタシス効果有り」と判定された場合に、2つのSNPに対する「エピスタシス効果有り」の判定結果を記憶し、次のSNPの解析に移るに際して、j番目のSNPをj+1番目のSNPに変更し前記ステップ(4)に戻り、j+1番目のSNPの優性型・劣性型を統計的手段により判定し前記ステップ(3)の計算を繰り返し、j+1がMに達した場合には、i番目のSNPをi+1番目に、j番目をi+2番目のSNPを選択する解析ステップと
(7)前記演算ステップ(5)において、「エピスタシス効果有り」と判定された場合、ロジスティック解析分析を用いた多変量解析手段によって、相乗的エピスタシス効果の確認を行う演算ステップと
を備えている
ことを特徴とするデータ解析方法である。
前記記憶装置に記憶されたN個の検体に対する2種類のクラスの表現型と、各検体から観測された総計M個のSNPのジェノタイプデータを基に、第i番目のSNPに対して、検体N人に対する2つの表現型のクラスとジェノタイプデータの統計処理を行い、クラス別ジェノタイプ別計数を演算装置にて算出する。
(I)a11 + a12 ≦1 または a11+ a13 ≦1 または a12+ a13 ≦1 (式1)
(II)a21 + a22 ≦1 または a21+ a23 ≦1 または a22+ a23 ≦1 (式2)
(III)a11 = 0 かつ a23 = 0 (式3)
(IV)a13 = 0 かつ a21 = 0 (式4)
前記(I)と(II)の条件は、表現型の各クラスにおいて3種のジェノタイプのうち2種のジェノタイプの検体数が0または1になることを指定し、(I)と(II)の条件のいずれかが成り立つ場合は、他のSNPのジェノタイプと組合わせた場合に、他のSNPの3種のジェノタイプのうち2種のジェノタイプで検体数がゼロになり、以降に述べるエピスタシス判定条件を明らかに満たすことができない場合を羅列したものである。
前記演算ステップ(3)において、解析対象のSNPが、「解析継続適」が判定された場合は、算出した表現型クラス別ジェノタイプ別計数を基に、i番目のSNPが表現型に対して優性型か劣性型かを統計的手段により判定する。
OR1 = (a11 + a12) x a23 / (a13 x (a21 + a22) ) (式14)
OR2 = a11 x (a22 + a23) / ((a12 + a13) x a21 ) (式15)
OR1とOR2を比較し、OR1の値がOR2の値以上の場合(OR1≧OR2)は、ジェノタイプAAとAaのアレルを有する場合に、第1のクラスの表現型(例えば、副作用あり)になりやすいことを表現するため優性型(またはタイプ1)と判断し、OR1がOR2以下の場合(OR1<OR2)は、劣性型(タイプ2)と判断し、「解析継続の適否」および優性・劣性型のタイプを1番のSNPからM番のSNPまでに対して算出し記憶する。
前記統計的手段によって判定された、「優性型・劣性型に関する判定結果」に基づき、表現型の2つのクラスの各々に対して、i番目とj番目(j≠i、初期値としてi=1, j=2)のそれぞれ2つのSNPの優性・劣性が判定された2x2分割表を作成し、作成された2x2分割表に対してエピスタシスを判定する以下の指標を算出する。
R1= (x11x22)/(x12x21) ≧w1 かつ R2= (y11y22)/(y12y21) <1/w2 (式5)
すなわち、該ステップ(5)おける、「エピスタシス効果の有無」の判定においては、
判定の対象である、「第i番目のSNPと第j番目のSNP」の組み合わせについて、
下記の手順に従って、指標として、R1=(x11x22)/(x12x21)とR2=(y11y22)/(y12y21)を算出し、
算出した指標に基づく、「エピスタシス効果の有無」の判定では、
指標:R1=(x11x22)/(x12x21)とR2=(y11y22)/(y12y21)が、
R1=(x11x22)/(x12x21) ≧ w1 かつ R2=(y11y22)/(y12y21) ≦ 1/w2 (式5)
前記(式5)を満足する場合に、
「エピスタシス効果有り」と判定する。
x11は表現型クラスが1でi番目とj番目のSNPが共に優性型の検体数、
x12はi番目とSNPが優性型でj番目のSNPが劣性型の検体数、
x21はi番目とSNPが劣性型でj番目のSNPが優性型の検体数、
x22はi番目とj番目のSNPが共に劣性型の検体数、
y11は表現型クラスが2でi番目とj番目のSNPが共に優性型の検体数、
y12はi番目とSNPが優性型でj番目のSNPが劣性型の検体数、
y21はi番目とSNPが劣性型でj番目のSNPが優性型の検体数、
y22はi番目とj番目のSNPが共に劣性型の検体数である。
このとき、表現型がクラス1である検体に対して、c11を第i番目のSNPのジェノタイプAAと第j番目のSNPのジェノタイプBBを有する検体の計数(AAとBBを有する場合)であり、c12をAAとBbを有する検体の計数、c13をAAとbbを有する検体の計数とする。同様に、c21をAaとBB、c22をAaとBb、c23をAaとbb、c31をaaとBB、c32をaaとBb、c33をaaとbbの計数とする。これらの計数は以下の数式を満足する。
c11+c12+c13+c21+c22+c23+c31+c32+c33=n1 (式6)
表現型がクラス2である検体に対して、d11を第i番目のSNPのジェノタイプAAと第j番目のSNPのジェノタイプBBを有する検体の計数(AAとBBを有する場合)であり、d12をAAとBbを有する検体の計数、d13をAAとbbを有する検体の計数とする。
d11+d12+d13+d21+d22+d23+d31+d32+d33=n2 (式7)
優性型・劣性型に関する判定結果に基づき、
具体的にx11、x22、x12、x21 、y11、y22、y12、y21は、下記のように場合分けして与えられる。
(i) 第i番目のSNPが優性型、第j番目のSNPが優性型(図4参照)
x11=c11+c12+c21+c22, x12=c13+c23, x21=c31+c32, x22=c33,
y11=d11+d12+d21+d22, y12=d13+d23, y21=d31+d32, y22=d33 (式8)
(ii) 第i番目のSNPが優性型、第j番目のSNPが劣性型(図5参照)
x11=c11+c21, x12=c12+c13+c22+c23, x21=c31, x22=c32+c33,
y11=d11+d21, y12=d12+d13+d22+d23, y21=d31, y22=d32+d33 (式9)
(iii) 第i番目のSNPが劣性型、第j番目のSNPが優性型(図6参照)
x11=c11+c12, x12=c13, x21=c21+c22+c31+c32, x22=c23+c33,
y11=d11+d12, y12=d13, y21=d21+d22+d31+d32, y22=d23+d33 (式10)
(iv) 第i番目のSNPが劣性型、第j番目のSNPが劣性型(図7参照)
x11=c11, x12=c12+c13, x21=c21+c31, x22=c22+c23+c32+c33
y11=d11, y12=d12+d13, y21=d21+d31, y22=d22+d23+d32+d33 (式11)
優性型・劣性型に関する判定結果に基づき、上記の(i)〜(iv)のいずれかで与えられる、x11、x22、x12、x21、y11、y22、y12、y21から、指標:(x11x22)/(x12x21)と(y11y22)/(y12y21)を算出する。
Log (z11z22)/(z12z21) − log (v11v22)/(v12v21) = 0 (式16)
w1とw2の「選択可能な範囲」は上記(式12)で与えられるが、必ずしも交差積比の分母が最少、すなわち、x12 =1かつx21=1とならない場合があるため、w1の最小値と1/w2の最大値を使用する。すなわち、w1=n1-3、w2=n2-3としている。
なお、「主効果がある」可能性があると、判断される方式については、以下のようになる。
全体の平均リスクであるr1は、(a11+a12+a13)/(a11+a12+a13+a21+a22+a23)、
AAにおけるリスクr1AAは、a11/(a11+a21)、
Aaにおけるリスクr1Aaは、a12/(a12+a22)、
Aaにおけるリスクr1aaは、a13/(a13+a23)となる。
その場合、例えば、r1aa>r1Aa>r1>r1AA、すなわち、[a13/(a13+a23)]>[a12/(a12+a22)]>[a11/(a11+a21)]の関係があれば、「主効果がある」可能性があると、判断される。
解析ステップ(6)では、
前記演算ステップ(5)において、「エピスタシス効果あり」と判定された場合に、2つのSNPに対する結果を記憶し、次のSNPの解析に移るに際して、j番目のSNPをj+1番目のSNPに変更し前記ステップ(4)に戻り、j+1番目のSNPの優性・劣性を統計的手段により判定し前記ステップ(3)の計算を繰り返し、j+1がMに達した場合には、i番目のSNPをi+1番目に、j番目をi+2番目のSNPを選択し解析する。
前記演算ステップ(5)において、エピスタシス効果ありと判定された場合、ロジスティック解析分析を用いた多変量解析手段によって、相乗的エピスタシス効果の確認を行う。
以下に、図面を参照して、本発明の実施の形態に係わる、網羅的ゲノムワイドSNP情報に基づく主効果が無い場合のエピスタシス効果の高速同定方法について説明する。なお、以下においては、乳がん患者60例に対してタキソール単剤の術前化学療法を施行し、末梢神経障害の副作用発生に関連する相乗的エピスタシス効果を示す2つのSNPを同定する場合を例として説明する。
解析に用いた検体は、癌研究会乳腺外科にてインフォームドコンセントが取れたタキソール単剤の術前化学療法(タキソール80mg/m2 /q1w)を施行された乳癌60症例である。
H1: [a13/(a13+a23)]>[a12/(a12+a22)]>[a11/(a11+a21)]
とし、
明確な「主効果がある」可能性が高いと、判断される場合を
H2: [a13/(a13+a23)]/[a12/(a12+a22)]>[a12/(a12+a22)]/[a11/(a11+a21)]
とする。
211個のSNPペアの各々をSNP-AとSNP-Bで表し、
SNP−AでH1が成立するとき AH1=1、 成立しないときAH1=0 とし、
SNP−BでH1が成立するとき BH1=1、 成立しないときBH1=0 とした。
従来の解析方法では、ともに「主効果がある」可能性がないと判断された84ペア(約40%)を同定することは困難であり、本方法の有用性が示された。
使用データは表3の中に存在する、69146番目のSNPと 97440番目のSNPである。
「解析プログラム」の一例:
program SNP
integer IG*4
dimension IDAT(1000000,60),Adata(100000)
dimension IT(3,3,2) ,IS(60)
character Adata*20
OPEN (UNIT=1, FILE='D:\ptxPNP#Aold.txt')
OPEN (UNIT=2, FILE='D:\ptxPNP-out.txt')
OPEN (UNIT=3, FILE='D:\ptxPNP-out-begin.txt')
write(3,300)
300 FORMAT(1H ,'Start ')
CLOSE (UNIT = 3)
NN=60
DO 500 I=1,52
IS(I)=0
500 CONTINUE
DO 505 I=53,60
IS(I)=1
505 CONTINUE
c**************************************************
read(1,*) Adata(IG)
read(1,*) Adata(IG)
read(1,*) n1,n2
IG=1
5 continue@@
read(1,*,end=99) Adata(IG),(IDAT(IG,K),K=1,NN)
200 FORMAT(1H ,F5.3,44I4,A20)
IG=IG+1
c IF(IG.GT.500000) GOTO 99
GOTO 5
99 CONTINUE
IGEND=IG-1
DO 10 IG=1,IGEND-1
DO 20 JG=IG+1,IGEND
DO 40 kk=1,2
DO 40 J=1,3
DO 40 I=1,3
IT(I,J,kk)=0
40 CONTINUE
DO 30 K=1,NN
IF(IDAT(IG,K).EQ.-10.OR.IDAT(JG,K).EQ.-10) GOTO 30
IF(IS(K).EQ.0) GOTO 33
c AE(+):IS(K)=1
IF(IDAT(IG,K).EQ.0.and.IDAT(JG,K).EQ.0) IT(1,1,1)=IT(1,1,1)+1
IF(IDAT(IG,K).EQ.0.and.IDAT(JG,K).EQ.1) IT(1,2,1)=IT(1,2,1)+1
IF(IDAT(IG,K).EQ.0.and.IDAT(JG,K).EQ.2) IT(1,3,1)=IT(1,3,1)+1
IF(IDAT(IG,K).EQ.1.and.IDAT(JG,K).EQ.0) IT(2,1,1)=IT(2,1,1)+1
IF(IDAT(IG,K).EQ.1.and.IDAT(JG,K).EQ.1) IT(2,2,1)=IT(2,2,1)+1
IF(IDAT(IG,K).EQ.1.and.IDAT(JG,K).EQ.2) IT(2,3,1)=IT(2,3,1)+1
IF(IDAT(IG,K).EQ.2.and.IDAT(JG,K).EQ.0) IT(3,1,1)=IT(3,1,1)+1
IF(IDAT(IG,K).EQ.2.and.IDAT(JG,K).EQ.1) IT(3,2,1)=IT(3,2,1)+1
IF(IDAT(IG,K).EQ.2.and.IDAT(JG,K).EQ.2) IT(3,3,1)=IT(3,3,1)+1
GOTO 30
c AE(-):IS(K)=0
33 CONTINUE
IF(IDAT(IG,K).EQ.0.and.IDAT(JG,K).EQ.0) IT(1,1,2)=IT(1,1,2)+1
IF(IDAT(IG,K).EQ.0.and.IDAT(JG,K).EQ.1) IT(1,2,2)=IT(1,2,2)+1
IF(IDAT(IG,K).EQ.0.and.IDAT(JG,K).EQ.2) IT(1,3,2)=IT(1,3,2)+1
IF(IDAT(IG,K).EQ.1.and.IDAT(JG,K).EQ.0) IT(2,1,2)=IT(2,1,2)+1
IF(IDAT(IG,K).EQ.1.and.IDAT(JG,K).EQ.1) IT(2,2,2)=IT(2,2,2)+1
IF(IDAT(IG,K).EQ.1.and.IDAT(JG,K).EQ.2) IT(2,3,2)=IT(2,3,2)+1
IF(IDAT(IG,K).EQ.2.and.IDAT(JG,K).EQ.0) IT(3,1,2)=IT(3,1,2)+1
IF(IDAT(IG,K).EQ.2.and.IDAT(JG,K).EQ.1) IT(3,2,2)=IT(3,2,2)+1
IF(IDAT(IG,K).EQ.2.and.IDAT(JG,K).EQ.2) IT(3,3,2)=IT(3,3,2)+1
30 CONTINUE
ISNP1A=IT(1,1,1)+IT(1,2,1)+IT(1,3,1)
ISNP2A=IT(2,1,1)+IT(2,2,1)+IT(2,3,1)
ISNP3A=IT(3,1,1)+IT(3,2,1)+IT(3,3,1)
ISNP1B=IT(1,1,2)+IT(1,2,2)+IT(1,3,2)
ISNP2B=IT(2,1,2)+IT(2,2,2)+IT(2,3,2)
ISNP3B=IT(3,1,2)+IT(3,2,2)+IT(3,3,2)
JSNP1A=IT(1,1,1)+IT(2,1,1)+IT(3,1,1)
JSNP2A=IT(1,2,1)+IT(2,2,1)+IT(3,2,1)
JSNP3A=IT(1,3,1)+IT(2,3,1)+IT(3,3,1)
@
JSNP1B=IT(1,1,2)+IT(2,1,2)+IT(3,1,2)
JSNP2B=IT(1,2,2)+IT(2,2,2)+IT(3,2,2)
JSNP3B=IT(1,3,2)+IT(2,3,2)+IT(3,3,2)
C For SNP1
OR1=FLOAT( (ISNP1A+ISNP2A)*ISNP3B ) /
+ ( (FLOAT(ISNP3A)+0.1)*(FLOAT(ISNP1B+ISNP2B)+0.1) )
OR2=FLOAT( ISNP1A*(ISNP2B+ISNP3B) ) /
+ ( (FLOAT(ISNP2A+ISNP3A)+0.1)*(FLOAT(ISNP1B)+0.1) )
IF(OR1.GE.OR2) THEN
Itype=1
ELSE
Itype=2
ENDIF
35 CONTINUE
OR3=FLOAT( (JSNP1A+JSNP2A)*JSNP3B ) /
+ ( (FLOAT(JSNP3A)+0.1)*(FLOAT(JSNP1B+JSNP2B)+0.1) )
OR4=FLOAT( JSNP1A*(JSNP2B+JSNP3B) ) /
+ ( (FLOAT(JSNP2A+JSNP3A)+0.1)*(FLOAT(JSNP1B)+0.1) )
IF(OR3.GE.OR4) THEN
Jtype=1
ELSE
Jtype=2
ENDIF
37 CONTINUE
IF(Itype.EQ.1.and.Jtype.EQ.1) THEN
X11=FLOAT(IT(1,1,1)+IT(1,2,1)+IT(2,1,1)+IT(2,2,1) )
X12=FLOAT(IT(1,3,1)+IT(2,3,1))
X21=FLOAT(IT(3,1,1)+IT(3,2,1))
X22=FLOAT(IT(3,3,1))
Y11=FLOAT(IT(1,1,2)+IT(1,2,2)+IT(2,1,2)+IT(2,2,2) )
Y12=FLOAT(IT(1,3,2)+IT(2,3,2))
Y21=FLOAT(IT(3,1,2)+IT(3,2,2))
Y22=FLOAT(IT(3,3,2))
GOTO 77
ENDIF
IF(Itype.EQ.1.and.Jtype.EQ.2) THEN
X11=FLOAT(IT(1,1,1)+IT(2,1,1))
X12=FLOAT(IT(1,2,1)+IT(1,3,1)+IT(2,2,1)+IT(2,3,1) )
X21=FLOAT(IT(3,1,1))
X22=FLOAT(IT(3,2,1)+IT(3,3,1))
Y11=FLOAT(IT(1,1,2)+IT(2,1,2))
Y12=FLOAT(IT(1,2,2)+IT(1,3,2)+IT(2,2,2)+IT(2,3,2) )
Y21=FLOAT(IT(3,1,2))
Y22=FLOAT(IT(3,2,2)+IT(3,3,2))
GOTO 77
ENDIF
IF(Itype.EQ.2.and.Jtype.EQ.1) THEN
X11=FLOAT(IT(1,1,1)+IT(1,2,1))
X12=FLOAT(IT(1,3,1))
X21=FLOAT(IT(2,1,1)+IT(2,2,1)+IT(3,1,1)+IT(3,2,1) )
X22=FLOAT(IT(2,3,1)+IT(3,3,1))
Y11=FLOAT(IT(1,1,2)+IT(1,2,2))
Y12=FLOAT(IT(1,3,2))
Y21=FLOAT(IT(2,1,2)+IT(2,2,2)+IT(3,1,2)+IT(3,2,2) )
Y22=FLOAT(IT(2,3,2)+IT(3,3,2))
GOTO 77
ENDIF
IF(Itype.EQ.2.and.Jtype.EQ.2) THEN
X11=FLOAT(IT(1,1,1))
X12=FLOAT(IT(1,2,1)+IT(1,3,1))
X21=FLOAT(IT(2,1,1)+IT(3,1,1))
X22=FLOAT(IT(2,2,1)+IT(2,3,1)+IT(3,2,1)+IT(3,3,1) )
Y11=FLOAT(IT(1,1,2))
Y12=FLOAT(IT(1,2,2)+IT(1,3,2))
Y21=FLOAT(IT(2,1,2)+IT(3,1,2))
Y22=FLOAT(IT(2,2,2)+IT(2,3,2)+IT(3,2,2)+IT(3,3,2) )
ELSE
write(2,"Itype error exist")
ENDIF
77 CONTINUE
ICHECK=0
RU=50.0
RD=1.0/50.0
X=FLOAT(ISNP1A+ISNP3A)
Y=FLOAT(ISNP1B+ISNP3B)
IF(X11*X12*X21*X22.EQ.0.0) GO TO 20
IF(Y11*Y12*Y21*Y22.EQ.0.0) GO TO 20
w1=n1-3
w2=n2-3
IF( X11*X22/(X12*X21).GE.w1
+ .and.Y11*Y22/( Y12*Y21 ).LT.w2)
+ ICHECK=1
IF(ICHECK.EQ.1) NC=NC+1
c
IF(ICHECK.EQ.1) THEN
WRITE(2,699) IG,JG
699 FORMAT(1H , 2I8)
WRITE(2,333)(X11+1.0)*(X22+1.0)/( (X12+1.0)*(X21+1.0) ),
+ (Y11+1.0)*(Y22+1.0)/( (Y12+1.0)*(Y21+1.0) )
333 FORMAT(1H ,"Check", 2F8.3)
write(2,1000) OR1,OR2,Itype
write(2,1010) OR3,OR4,Jtype
1000 FORMAT(1H , 'OR, Itype',2F6.1,2x,I3)
1010 FORMAT(1H , 'OR, Jtype',2F6.1,2x,I3)
DO 70 I=1,3
WRITE(2,700) (IT(I,J,1), J=1,3), (IT(I,J,2), J=1,3)
700 FORMAT(1H ,3I3, 3x,3I3)
WRITE(2,698)
698 FORMAT(1H ,' ' )
70 CONTINUE
WRITE(2,702) X11, X12, Y11, Y12
WRITE(2,702) X21, X22, Y21, Y22
702 FORMAT(1H ,2F3.0, 3x,2F3.0)
WRITE(2,698)
END IF
20 CONTINUE
10 CONTINUE
write(2,15) IG
write(6,15) IG
15 FORMAT(1H ,'READ DATA = ',I10)
write(2,25) NC
write(6,25) NC
25 FORMAT(1H ,'WRITE DATA = ',I15)
CLOSE (UNIT = 1)
CLOSE (UNIT = 2)
stop
end
Claims (3)
- コンピュータを用い50万箇所以上におよぶゲノムワイドな一塩基多型(SNP)のジェノタイプデータから、2値のクラスを有する表現型に対して、主効果が確認されない場合でも相乗的相互作用(エピスタシス効果)を有するSNPのペアーを網羅的に同定するデータ解析方法であって、
(1)2種類のクラスの表現型を有するN個の検体から観測された総計M個(Mは50万以上)のSNPのジェノタイプデータと各検体に対応する表現型のクラスを入力する入力ステップと、
(2)前記入力ステップ(2)を介して入力されたN個の検体の表現型のクラスと総計M個のジェノタイプデータを、記憶手段に記憶する記憶ステップと、
(3)前記記憶ステップ(2)によって、記憶手段に記憶されているi番目のSNPに対して、検体N人に対する2つの表現型のクラスとジェノタイプデータの統計処理を行い、クラス別ジェノタイプ別計数を算出し、算出したマイナーアレル計数を基にi番目のSNPの解析継続の適否を判定する前処理ステップとしてのスクリーニングを行う演算ステップと、
(4)前記演算ステップ(3)において、解析対象SNPとして「解析継続適」と判定された場合は、算出した計数を基にi番目のSNPが表現型に対して優性型か劣性型かを統計的手段により判定し、解析継続の適否および優性型・劣性型に関する判定結果を内部記憶装置に記憶する記憶ステップと、
(5)前記ステップ(4)において、統計的手段よって判定された、優性型・劣性型に関する判定結果に基づき、表現型の2つのクラスの各々に対して、i番目とj番目(j≠i、初期値としてi=1, j=2)のそれぞれ2つのSNPの優性型・劣性型が判定された2x2分割表を作成し、作成された2x2分割表に対してエピスタシスを判定する指標を算出し、この指標を基にエピスタシス効果の有無を判定する演算ステップと、
(6)前記演算ステップ(5)によって、「エピスタシス効果有り」と判定された場合に、2つのSNPに対する「エピスタシス効果有り」の判定結果を記憶し、次のSNPの解析に移るに際して、j番目のSNPをj+1番目のSNPに変更し前記ステップ(4)に戻り、j+1番目のSNPの優性型・劣性型を統計的手段により判定し前記ステップ(3)の計算を繰り返し、j+1がMに達した場合には、i番目のSNPをi+1番目に、j番目をi+2番目のSNPを選択する解析ステップと
(7)前記演算ステップ(5)において、「エピスタシス効果有り」と判定された場合、ロジスティック解析分析を用いた多変量解析手段によって、相乗的エピスタシス効果の確認を行う演算ステップと
を備えており、
前記ステップ(3)に記載する、
i番目のSNPの解析継続の適否を判定する前処理ステップとしてのスクリーニングを行う演算において、「i番目のSNPの解析継続の適否」は、以下の手順に従って判定される;
各SNPのジェノタイプデータは、母由来および父由来の2つ塩基のタイプにより、集団中において2種のホモ接合体と、1種のヘテロの接合体の計3種類に分類される。ここでは、これらの2種のホモ接合体をAA、とaa、1種のヘテロ接合体をAaで表現する;
さらに、a11、a12、a13を、それぞれ検体総数がn1である表現型1のクラスにおけるジェノタイプAA、Aa、aaでの計数とし、a21、a22、a23を、それぞれ検体総数がn2である表現型2のクラスにおけるジェノタイプAA、Aa、aaでの計数とする;
演算装置で実行される前処理ステップとしてのスクリーニングにおいて、「i番目のSNPの解析継続の適否」の判定は、
a11、a12、a13、 a21、a22、a23が、以下の(I)〜(IV)の条件をどれか一つでも満たす時に、「解析継続否」と判定し、
「解析継続否」と判定されたSNPは、ステップ(4)以降の解析から除外する
(I)a11 + a12 ≦1 または a11+ a13 ≦1 または a12+ a13 ≦1 (式1)
(II)a21 + a22 ≦1 または a21+ a23 ≦1 または a22+ a23 ≦1 (式2)
(III)a11 = 0 かつ a23 = 0 (式3)
(IV)a13 = 0 かつ a21 = 0 (式4)
前記ステップ(5)に記載する、
「エピスタシス効果の有無」の判定においては、
判定の対象である、「第i番目のSNPと第j番目のSNP」の組み合わせについて、
下記の手順に従って、指標として、R1=(x 11 x 22 )/(x 12 x 21 )とR2=(y 11 y 22 )/(y 12 y 21 )を算出し、
算出した指標に基づく、「エピスタシス効果の有無」の判定では、
指標:R1=(x 11 x 22 )/(x 12 x 21 )とR2=(y 11 y 22 )/(y 12 y 21 )が、
R1=(x 11 x 22 )/(x 12 x 21 ) ≧ w 1 かつ R2=(y 11 y 22 )/(y 12 y 21 ) ≦ 1/w 2 (式5)
上記の式を満足する場合に、
「エピスタシス効果有り」と判定する;
なお、上記の(式5)においてx 11 、x 22 、x 12 、x 21 、y 11 、y 22 、y 12 、y 21 は、下記の手順に従って、算出される。
また、上記の(式5)においてx 11 、x 22 、x 12 、x 21 は、表現型がクラス1における第i番目のSNPと第j番目のSNPの優性型・劣性型の組み合わせによって決定される計数である。
同様に、y 11 、y 22 、y 12 、y 21 、は、表現型がクラス2における第i番目のSNPと第j番目のSNPの優性型・劣性型の組み合わせによって決定される計数である。
優性型とは、表現型のクラス1に対して、AAとAaのジェノタイプが関連するモデルで、A1=(AA,Aa)、A2=(aa)と記載される。また、劣性型とは、表現型のクラス1に対して、aaのジェノタイプが関連するモデルで、A1=(AA)、A2=(Aa,aa)と記載される。第j番目のSNPの優性型については、BBとBbのジェノタイプが関連するモデルで、B1=(BB,Bb)、B2=(bb)と記載される。また、第j番目のSNPの劣性型とは、表現型のクラス1に対して、bbのジェノタイプが関連するモデルで、B1=(BB)、B2=(Bb,bb)と記載される。
このとき、表現型がクラス1である検体に対して、c11を第i番目のSNPのジェノタイプAAと第j番目のSNPのジェノタイプBBを有する検体の計数(AAとBBを有する場合)であり、c12をAAとBbを有する検体の計数、c13をAAとbbを有する検体の計数とする。同様に、c21をAaとBB、c22をAaとBb、c23をAaとbb、c31をaaとBB、c32をaaとBb、c33をaaとbbの計数とする。これらの計数は以下の数式を満足する。
c11+c12+c13+c21+c22+c23+c31+c32+c33=n1 (式6)
表現型がクラス2である検体に対して、d11を第i番目のSNPのジェノタイプAAと第j番目のSNPのジェノタイプBBを有する検体の計数(AAとBBを有する場合)であり、d12をAAとBbを有する検体の計数、d13をAAとbbを有する検体の計数とする。
同様に、d21をAaとBB、d22をAaとBb、d23をAaとbb、d31をaaとBB、d32をaaとBb、d33をaaとbbの計数とする。これらの計数は以下の数式を満足する。
d11+d12+d13+d21+d22+d23+d31+d32+d33=n2 (式7)
優性型・劣性型に関する判定結果に基づき、
具体的に、x 11 、x 22 、x 12 、x 21 、y 11 、y 22 、y 12 、y 21 は、下記のように場合分けして与えられる。
(i) 第i番目のSNPが優性型、第j番目のSNPが優性型
x 11 =c11+c12+c21+c22, x 12 =c13+c23, x 21 =c31+c32, x 22 =c33,
y 11 =d11+d12+d21+d22, y 12 =d13+d23, y 21 =d31+d32, y 22 =d33 (式8)
(ii) 第i番目のSNPが優性型、第j番目のSNPが劣性型
x 11 =c11+c21, x 12 =c12+c13+c22+c23, x 21 =c31, x 22 =c32+c33,
y 11 =d11+d21, y 12 =d12+d13+d22+d23, y 21 =d31, y 22 =d32+d33 (式9)
(iii) 第i番目のSNPが劣性型、第j番目のSNPが優性型
x 11 =c11+c12, x 12 =c13, x 21 =c21+c22+c31+c32, x 22 =c23+c33,
y 11 =d11+d12, y 12 =d13, y 21 =d21+d22+d31+d32, y 22 =d23+d33 (式10)
(iv) 第i番目のSNPが劣性型、第j番目のSNPが劣性型
x 11 =c11, x 12 =c12+c13, x 21 =c21+c31, x 22 =c22+c23+c32+c33
y 11 =d11, y 12 =d12+d13, y 21 =d21+d31, y 22 =d22+d23+d32+d33 (式11)
優性型・劣性型に関する判定結果に基づき、上記の(i)〜(iv)のいずれかで与えられる、x 11 、x 22 、x 12 、x 21 、y 11 、y 22 、y 12 、y 21 から、指標:(x 11 x 22 )/(x 12 x 21 )と(y 11 y 22 )/(y 12 y 21 )を算出する。
なお(式5)に記載のw 1 とw 2 は、以下の範囲で指定される。
n1-3≦w 1 ≦(n1/2-1) 2 , n2-3≦w 2 ≦(n2/2-1) 2 (式12)
その際、上記(式5)に記載のw 1 とw 2 は、(式12)に記載する範囲で指定されるため、w 1 とw 2 は(式13)に示す最も緩やかな条件で指定する
w 1 =n1-3 , w 2 =n2-3 (式13)
ことを特徴とするデータ解析方法。 - コンピュータを用い50万箇所以上におよぶゲノムワイドな一塩基多型(SNP)のジェノタイプデータから、2値のクラスを有する表現型に対して、主効果が確認されない場合でも相乗的相互作用(エピスタシス効果)を有するSNPのペアーを網羅的に同定するデータ解析システムであって、
(1)2種類のクラスの表現型を有するN個の検体から観測された総計M個(Mは50万以上)のSNPのジェノタイプデータと各検体に対応する表現型のクラスを入力する入力手段と、
(2)前記入力手段(1)を介して入力されたN個の検体の表現型のクラスと総計M個のジェノタイプデータを記憶する記憶手段と、
(3)前記記憶手段(2)によって記憶されているi番目のSNPに対して、検体N人に対する2つの表現型のクラスとジェノタイプデータの統計処理を行い、クラス別ジェノタイプ別計数を算出し、算出したマイナーアレル別計数を基にi番目のSNPの解析継続の適否を判定する前処理ステップとしてのスクリーニングを行う演算手段と、
(4)前記演算手段(3)によって、解析対象SNPとして「解析継続適」と判定された場合は、算出した計数を基にi番目のSNPが表現型に対して優性型か劣性型かを統計的手段により判定し、解析継続の適否および優性型・劣性型に関する判定結果を内部記憶装置に記憶する記憶手段と、
(5)前記統計的手段によって判定された、優性型・劣性型に関する判定結果に基づき、表現型の2つのクラスの各々に対して、i番目とj番目(j≠i、初期値としてi=1, j=2)のそれぞれ2つのSNPの優性型・劣性型が判定された2x2分割表を作成し、作成された2x2分割表に対してエピスタシスを判定する指標を算出し、この指標を基にエピスタシス効果の有無を判定する演算手段と、
(6)前記演算手段(5)によって、「エピスタシス効果有り」と判定された場合に、2つのSNPに対する「エピスタシス効果有り」の判定結果を記憶し、次のSNPの解析に移るに際して、j番目のSNPをj+1番目のSNPに変更し、前記記録手段(4)のステップに戻り、j+1番目のSNPの優性型・劣性型を統計的手段により判定し前記演算手段(3)のステップの計算を繰り返し、j+1がMに達した場合には、i番目のSNPをi+1番目に、j番目をi+2番目のSNPを選択する解析手段と、
(7)前記演算手段(5)において、「エピスタシス効果有り」と判定された場合、ロジスティック解析分析を用いた多変量解析手段によって、相乗的エピスタシス効果の確認を行う演算手段と、
を具えており、
前記演算手段(3)に記載する、
i番目のSNPの解析継続の適否を判定する前処理ステップとしてのスクリーニングを行う演算において、「i番目のSNPの解析継続の適否」は、以下の手順に従って判定される;
各SNPのジェノタイプデータは、母由来および父由来の2つ塩基のタイプにより、集団中において2種のホモ接合体と、1種のヘテロの接合体の計3種類に分類される。ここでは、これらの2種のホモ接合体をAA、とaa、1種のヘテロ接合体をAaで表現する;
さらに、a11、a12、a13を、それぞれ検体総数がn1である表現型1のクラスにおけるジェノタイプAA、Aa、aaでの計数とし、a21、a22、a23を、それぞれ検体総数がn2である表現型2のクラスにおけるジェノタイプAA、Aa、aaでの計数とする;
演算装置で実行される前処理ステップとしてのスクリーニングにおいて、「i番目のSNPの解析継続の適否」の判定は、
a11、a12、a13、 a21、a22、a23が、以下の(I)〜(IV)の条件をどれか一つでも満たす時に、「解析継続否」と判定し、
「解析継続否」と判定されたSNPは、前記演算手段(5)以降の解析から除外する
(I)a11 + a12 ≦1 または a11+ a13 ≦1 または a12+ a13 ≦1 (式1)
(II)a21 + a22 ≦1 または a21+ a23 ≦1 または a22+ a23 ≦1 (式2)
(III)a11 = 0 かつ a23 = 0 (式3)
(IV)a13 = 0 かつ a21 = 0 (式4)
前記演算手段(5)に記載する、
「エピスタシス効果の有無」の判定においては、
判定の対象である、「第i番目のSNPと第j番目のSNP」の組み合わせについて、
下記の手順に従って、指標として、R1=(x 11 x 22 )/(x 12 x 21 )とR2=(y 11 y 22 )/(y 12 y 21 )を算出し、
算出した指標に基づく、「エピスタシス効果の有無」の判定では、
指標:R1=(x 11 x 22 )/(x 12 x 21 )とR2=(y 11 y 22 )/(y 12 y 21 )が、
R1=(x 11 x 22 )/(x 12 x 21 ) ≧ w 1 かつ R2=(y 11 y 22 )/(y 12 y 21 ) ≦ 1/w 2 (式5)
上記の式を満足する場合に、
「エピスタシス効果有り」と判定する;
なお、上記の(式5)においてx 11 、x 22 、x 12 、x 21 、y 11 、y 22 、y 12 、y 21 は、下記の手順に従って、算出される。
また、上記の(式5)においてx 11 、x 22 、x 12 、x 21 は、表現型がクラス1における第i番目のSNPと第j番目のSNPの優性型・劣性型の組み合わせによって決定される計数である。
同様に、y 11 、y 22 、y 12 、y 21 、は、表現型がクラス2における第i番目のSNPと第j番目のSNPの優性型・劣性型の組み合わせによって決定される計数である。
優性型とは、表現型のクラス1に対して、AAとAaのジェノタイプが関連するモデルで、A1=(AA,Aa)、A2=(aa)と記載される。また、劣性型とは、表現型のクラス1に対して、aaのジェノタイプが関連するモデルで、A1=(AA)、A2=(Aa,aa)と記載される。第j番目のSNPの優性型については、BBとBbのジェノタイプが関連するモデルで、B1=(BB,Bb)、B2=(bb)と記載される。また、第j番目のSNPの劣性型とは、表現型のクラス1に対して、bbのジェノタイプが関連するモデルで、B1=(BB)、B2=(Bb,bb)と記載される。
このとき、表現型がクラス1である検体に対して、c11を第i番目のSNPのジェノタイプAAと第j番目のSNPのジェノタイプBBを有する検体の計数(AAとBBを有する場合)であり、c12をAAとBbを有する検体の計数、c13をAAとbbを有する検体の計数とする。同様に、c21をAaとBB、c22をAaとBb、c23をAaとbb、c31をaaとBB、c32をaaとBb、c33をaaとbbの計数とする。これらの計数は以下の数式を満足する。
c11+c12+c13+c21+c22+c23+c31+c32+c33=n1 (式6)
表現型がクラス2である検体に対して、d11を第i番目のSNPのジェノタイプAAと第j番目のSNPのジェノタイプBBを有する検体の計数(AAとBBを有する場合)であり、d12をAAとBbを有する検体の計数、d13をAAとbbを有する検体の計数とする。
同様に、d21をAaとBB、d22をAaとBb、d23をAaとbb、d31をaaとBB、d32をaaとBb、d33をaaとbbの計数とする。これらの計数は以下の数式を満足する。
d11+d12+d13+d21+d22+d23+d31+d32+d33=n2 (式7)
優性型・劣性型に関する判定結果に基づき、
具体的に、x 11 、x 22 、x 12 、x 21 、y 11 、y 22 、y 12 、y 21 は、下記のように場合分けして与えられる。
(i) 第i番目のSNPが優性型、第j番目のSNPが優性型
x 11 =c11+c12+c21+c22, x 12 =c13+c23, x 21 =c31+c32, x 22 =c33,
y 11 =d11+d12+d21+d22, y 12 =d13+d23, y 21 =d31+d32, y 22 =d33 (式8)
(ii) 第i番目のSNPが優性型、第j番目のSNPが劣性型
x 11 =c11+c21, x 12 =c12+c13+c22+c23, x 21 =c31, x 22 =c32+c33,
y 11 =d11+d21, y 12 =d12+d13+d22+d23, y 21 =d31, y 22 =d32+d33 (式9)
(iii) 第i番目のSNPが劣性型、第j番目のSNPが優性型
x 11 =c11+c12, x 12 =c13, x 21 =c21+c22+c31+c32, x 22 =c23+c33,
y 11 =d11+d12, y 12 =d13, y 21 =d21+d22+d31+d32, y 22 =d23+d33 (式10)
(iv) 第i番目のSNPが劣性型、第j番目のSNPが劣性型
x 11 =c11, x 12 =c12+c13, x 21 =c21+c31, x 22 =c22+c23+c32+c33
y 11 =d11, y 12 =d12+d13, y 21 =d21+d31, y 22 =d22+d23+d32+d33 (式11)
優性型・劣性型に関する判定結果に基づき、上記の(i)〜(iv)のいずれかで与えられる、x 11 、x 22 、x 12 、x 21 、y 11 、y 22 、y 12 、y 21 から、指標:(x 11 x 22 )/(x 12 x 21 )と(y 11 y 22 )/(y 12 y 21 )を算出する。
なお(式5)に記載のw 1 とw 2 は、以下の範囲で指定される。
n1-3≦w 1 ≦(n1/2-1) 2 , n2-3≦w 2 ≦(n2/2-1) 2 (式12)
その際、上記(式5)に記載のw 1 とw 2 は、(式12)に記載する範囲で指定されるため、w 1 とw 2 は(式13)に示す最も緩やかな条件で指定する
w 1 =n1-3 , w 2 =n2-3 (式13)
ことを特徴とするデータ解析システム。 - 請求項1に記載の方法をコンピュータに実行させるプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009070753A JP5413952B2 (ja) | 2009-03-23 | 2009-03-23 | 網羅的ゲノムワイドsnp情報に基づくエピスタシス効果の探索アルゴリズム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009070753A JP5413952B2 (ja) | 2009-03-23 | 2009-03-23 | 網羅的ゲノムワイドsnp情報に基づくエピスタシス効果の探索アルゴリズム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010224815A JP2010224815A (ja) | 2010-10-07 |
JP5413952B2 true JP5413952B2 (ja) | 2014-02-12 |
Family
ID=43041945
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009070753A Active JP5413952B2 (ja) | 2009-03-23 | 2009-03-23 | 網羅的ゲノムワイドsnp情報に基づくエピスタシス効果の探索アルゴリズム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5413952B2 (ja) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3836149A1 (en) * | 2011-11-07 | 2021-06-16 | QIAGEN Redwood City, Inc. | Methods and systems for identification of causal genomic variants |
JP5852902B2 (ja) * | 2012-02-27 | 2016-02-03 | 株式会社エヌ・ティ・ティ・データ | 遺伝子間相互作用解析システム、その方法及びプログラム |
US10102333B2 (en) | 2013-01-21 | 2018-10-16 | International Business Machines Corporation | Feature selection for efficient epistasis modeling for phenotype prediction |
PE20181137A1 (es) * | 2015-09-25 | 2018-07-17 | Contextual Genomics Inc | Metodos moleculares de aseguramiento de la calidad para su uso en la secuenciacion |
CN112447263B (zh) * | 2020-11-22 | 2023-12-26 | 西安邮电大学 | 多任务高阶snp上位检测方法、系统、存储介质、设备 |
CN113808665B (zh) * | 2021-09-29 | 2024-03-08 | 山东大学 | 全基因组致病snp精细定位的因果关联分析方法 |
-
2009
- 2009-03-23 JP JP2009070753A patent/JP5413952B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2010224815A (ja) | 2010-10-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5413952B2 (ja) | 網羅的ゲノムワイドsnp情報に基づくエピスタシス効果の探索アルゴリズム | |
Liu et al. | Heads you win, tails you lose: Life‐history traits predict invasion and extinction risk of the world's freshwater fishes | |
AU2024202507A1 (en) | Peptides, Reagents And Methods For Detecting Food Allergy | |
Archer et al. | L 1 penalized continuation ratio models for ordinal response prediction using high‐dimensional datasets | |
Shaw et al. | Histopathologic features of genetically determined ovarian cancer | |
Lei et al. | Power of ordered hypothesis testing | |
Xie et al. | Ancient demographics determine the effectiveness of genetic purging in endangered lizards | |
Ware et al. | The genetic architecture of pediatric cardiomyopathy | |
Bretz et al. | Multiplicity issues in microarray experiments | |
Ariad et al. | Haplotype-aware inference of human chromosome abnormalities | |
Rego et al. | Symmetry breaking in interspecific Drosophila hybrids is not due to developmental noise | |
So et al. | Estimating the total number of susceptibility variants underlying complex diseases from genome-wide association studies | |
Veisian et al. | Association of IL-6-176G> C polymorphism with susceptibility to preeclampsia: A systematic review and meta-analysis | |
Moorhead et al. | Optimal genotype determination in highly multiplexed SNP data | |
Goag et al. | A simplified mortality score using delta neutrophil index and the thrombotic microangiopathy score for prognostication in critically ill patients | |
WO2023173543A1 (zh) | 数据分类模型的训练方法、分类方法、装置、设备和介质 | |
Sun et al. | A geometric interpretation of the permutation p-value and its application in eQTL studies | |
Hudson et al. | Compression distance can discriminate animals by genetic profile, build relationship matrices and estimate breeding values | |
Perdry et al. | Using affected sib-pairs to uncover rare disease variants | |
Tsiliki et al. | Multi-platform data integration in microarray analysis | |
Lello et al. | Genomic prediction of complex disease risk | |
Khalili et al. | A robust unified approach to analyzing methylation and gene expression data | |
US20230307130A1 (en) | Methods and related aspects for analyzing chromosome number status | |
Ohashi et al. | Selecting a contingency table in a population-based association study: allele frequency or positivity? | |
Rueda et al. | Detection of Recurrent Copy Number Alterations in the Genome: a Probabilistic Approach |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120229 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130723 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130913 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131015 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131107 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5413952 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |