JP4437050B2 - 診断支援システム、診断支援方法および診断支援サービスの提供方法 - Google Patents

診断支援システム、診断支援方法および診断支援サービスの提供方法 Download PDF

Info

Publication number
JP4437050B2
JP4437050B2 JP2004091104A JP2004091104A JP4437050B2 JP 4437050 B2 JP4437050 B2 JP 4437050B2 JP 2004091104 A JP2004091104 A JP 2004091104A JP 2004091104 A JP2004091104 A JP 2004091104A JP 4437050 B2 JP4437050 B2 JP 4437050B2
Authority
JP
Japan
Prior art keywords
haplotype
information
diagnosis support
individual
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004091104A
Other languages
English (en)
Other versions
JP2005276022A (ja
JP2005276022A5 (ja
Inventor
聡 斎藤
訓 光山
伴  秀行
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2004091104A priority Critical patent/JP4437050B2/ja
Priority to CNA2004100716130A priority patent/CN1674028A/zh
Priority to US10/901,215 priority patent/US20050216208A1/en
Publication of JP2005276022A publication Critical patent/JP2005276022A/ja
Publication of JP2005276022A5 publication Critical patent/JP2005276022A5/ja
Application granted granted Critical
Publication of JP4437050B2 publication Critical patent/JP4437050B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/40Population genetics; Linkage disequilibrium
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material

Description

本発明は、臨床情報と遺伝子情報との関連性を解析し、臨床上有用な情報を抽出して提示する診断支援システムおよび診断支援方法に関する。
ヒトゲノムプロジェクトは配列決定をほぼ終了し、ポストシークエンスの時代に突入した。今後は、蓄積された膨大な遺伝子情報の医学への有効利用が期待されている。遺伝子と疾患との関連性の解明が進むと、個人の遺伝子型を基礎として疾患の発症リスクを予測することが可能になり、個人の遺伝的体質に応じた疾患の予防、早期発見、治療を行なうことが可能になる。これらを実現するためには、臨床情報と遺伝子情報との関連性の解析が必要である。
臨床情報と遺伝子情報との関連性の解析において強力な手法の一つに、遺伝統計学的解析法がある。遺伝統計学的解析法は、個人の遺伝子情報と疾患の有無とをデータとして、統計学を用いて疾患に関連する遺伝子を探索する方法であり、機序が未知である疾患の関連遺伝子も発見できる可能性があるため、次第に重要性を増している。遺伝統計学的解析法は、複数の遺伝子座(染色体上の遺伝子の位置)間の連鎖を利用して特定の形質に関係する遺伝子領域を探索する技術である。形質とは、個体レベルで観察される各種の形態的特徴のことで、疾患罹患の有無、身長、目や髪の色等が形質である。連鎖とは、「2つの異なる形質はそれぞれ分離独立して遺伝する」というメンデルの独立法則の例外である。
ある2つの形質を規定する遺伝子座が染色体上で近い位置に存在しているとき、それらの遺伝子は分離独立せずに、つながったまま親から子へ遺伝する。この状態を、2つの遺伝子座が連鎖しているという。減数分裂の際に、両親から伝わった1対の染色体間に部分的な交換が起こり、子に伝える遺伝子の組み合わせが両親由来のものと異なる場合がある。この現象を組み換えという。
1回の減数分裂においてある2つの遺伝子座間に組み換えが起こる確率を組み換え割合という。2つの遺伝子座間の距離が近いほど、組み換え割合は小さい。すなわち、連鎖する可能性が高い。遺伝統計学的解析法では、組み換えの情報を基礎として染色体上に網羅された遺伝子多型(一塩基多型(SNPs)やマイクロサテライト等)と疾患関連遺伝子との連鎖の有無を検定することによって、疾患関連遺伝子座を絞り込む。
遺伝統計学的解析法は現在までにいくつかの手法が報告されている。単一遺伝子疾患については、大家系のデータを用いたパラメトリック連鎖解析によって、これまでに数多くの原因遺伝子が同定されてきた。今後の疾患原因遺伝子探索の研究においては、複数の遺伝的要因と環境要因とによって発症する多因子疾患(complex disease)の原因遺伝子の探索が主流になるものと考えられる。当初は、多因子疾患の原因遺伝子についても、多数の小家系のデータを用いたノンパラメトリック連鎖解析(罹患同胞対解析)によってその同定が可能と考えられていた。しかし、一般に浸透率(発症する確率)の低い多因子疾患の原因遺伝子を直接同定することは困難な場合が多い。最近では、その検出力の高さと解析のしやすさから、疾患集団と正常集団において着目する遺伝子多型の対立遺伝子(アレル)頻度を比較する相関解析(関連解析ともいう)が注目されている。
従来の相関解析では、真に形質と関係している遺伝子を見落としたり、目的とする形質とまったく関係がない遺伝子を誤って選択したりする可能性が比較的高かった。一般に、前者は偽陰性の問題、後者は偽陽性の問題として取り扱われる問題である。解析結果に偽陰性や偽陽性が生じる理由としては、単一の遺伝子多型もしくは狭い範囲の遺伝子多型によるハプロタイプのみを用いて遺伝子と形質との関係を解析していること、ハプロタイプを用いた解析を行なう際にハプロタイプブロックを考慮していないこと、対象とする集団に存在する多様性(これを遺伝的構造と呼ぶことにする)を考慮していないこと、等が挙げられる。
ハプロタイプとは、連鎖している複数の座位における同じ親由来のアレルの組み合わせのことをいう。染色体上の近い距離に存在する複数の座位におけるアレルは、世代交代における組み換えの影響を受けずに連鎖した状態で次の世代へと伝達される。その結果、何世代にもおよぶ世代交代を経た後も、近い距離に存在する複数の座位にはお互いに相関関係が見られる。この状態を連鎖不平衡と呼ぶ。近年、例えば、非特許文献1(Gabriel SB et al.: The Structure of Haplotype Blocks in the Human Genome, Science, Vol.296, pp.2225‐2229, 2002)等によって、ゲノム上には連鎖不平衡が比較的強い状態で保たれたハプロタイプブロックとよばれる部分と、組み換えが高頻度で起こるために座位間の連鎖不平衡を弱めるホットスポットとよばれる部分とが交互に存在することが報告されている。
この事実は、ハプロタイプブロックの位置を正確に推定することができれば、ハプロタイプブロック内の数個の座位の遺伝子型を測定するだけで正確なハプロタイプパターンを決定することが可能であることを意味している。また、この事実は同時に、ホットスポットを跨ぐような複数の座位を用いて解析を行なった場合には、遺伝学的には意味がない偽陽性の結果が多く出てしまうことを意味している。
一般に、相関解析を行なう際には、注目する形質に応じて対象とする集団を群分けすることが多い。ある集団の中から多数の患者(case)と対照者(control)とをサンプルし、着目するアレルの頻度を患者群と対照者群とで比較し、アレル頻度に有意な差がみられる多型の座位を検出する症例対照研究(case−control study)が最も有名である。症例対照研究においては、患者の集団と対照者の集団とが注目する形質以外は完全にマッチした集団であることが前提となっている。
しかし、この前提は常に成立しているわけではない。対象とする集団に遺伝的構造が存在する場合は特に問題となる。患者群と対照者群とを遺伝的に異なる、全く別の集団からサンプリングしてしまった場合などには、遺伝的構造が解析結果に大きく影響を与える。簡単な例を挙げて集団の遺伝的構造の影響を説明する。例えば、アメリカで鎌形赤血球症の患者群と対照者群を集めようとすると、患者群にはアフリカ由来の人々が多く含まれ、対照者群にはヨーロッパ由来の人々が多く含まれるはずである。遺伝的構造の影響を考えずにこの2つの集団を比較すると、本来アフリカ人とヨーロッパ人とでアレル頻度に差がある多くの座位が、鎌形赤血球症の原因座位として検出されてしまう。このように、集団の遺伝的構造は解析結果に多くの偽陽性を生じさせる。また、集団の遺伝的構造は解析結果に偽陽性だけではなく偽陰性を生じさせることもある。
Gabriel SB et al.: The Structure of Haplotype Blocks in the Human Genome, Science, Vol.296, pp.2225‐2229, 2002
上述したように、相関解析を行なう際に、対象とする集団に存在するハプロタイプブロックの影響や遺伝的構造の影響を考慮しなかった場合、解析の際に多くの偽陰性や偽陽性が生じ、解析結果に多大な影響を与えるという問題があった。そこで、本発明では、ハプロタイプブロックおよび遺伝的構造の影響を考慮することによって、高精度な診断支援を行なうシステムを提供することを目的とする。
本発明の診断支援システムおよび診断支援方法は、ハプロタイプブロック推定手段によって遺伝子多型情報を基礎として組み換えの位置を推定してハプロタイプブロックの位置を推定し、ハプロタイプブロックごとに解析を行なうことによって、個体のハプロタイプパターンを高精度に推定する。推定されたハプロタイプ頻度情報や個体のハプロタイプパターン情報はハプロタイプ情報データベースに格納される。また、遺伝的構造推定手段によって個体のハプロタイプパターンによるクラスタリングを行ない、集団をいくつかの亜集団に分割することによって、集団に存在する遺伝的構造の影響を除去し、臨床情報と遺伝子情報との関連性を高精度に解析することを可能にする。遺伝的構造推定手段によって得られた結果は遺伝的構造情報データベースに格納され、遺伝的構造情報データベースと診療情報データベースとを用いて臨床情報と遺伝子情報との関連性を解析することによって、高精度な診断支援知識の提供が可能となる。臨床情報と遺伝子情報との関連性の解析によって得られた診断支援知識は診断支援知識データベースに格納され、罹患危険度算出手段によって診断支援知識データベースの情報を基礎として所定の個体が疾患に罹患する危険度を算出する。
本発明の診断支援システムおよび診断支援方法は、ハプロタイプブロック推定アルゴリズムによって組み換えの位置を推定してハプロタイプブロックの位置を推定し、ハプロタイプブロックごとに解析を行なうことによって、個体のハプロタイプパターンを高精度に推定することを可能にする。また、遺伝的構造推定アルゴリズムによって個体のハプロタイプパターンによるクラスタリングを行ない、集団をいくつかの亜集団に分割することによって、集団に存在する遺伝的構造の影響を除去し、臨床情報と遺伝子情報との関連性を高精度に解析することを可能にする。
図1は、本発明の診断支援システムの構成例を示す図である。本発明の診断支援システム111は、いわゆるパソコン等の電子計算機を主体として構成される。システムバス5に処理装置1、メモリー2、入力装置3、表示装置4および外部記憶装置10が接続される。外部記憶装置10内には、複数の個体(被診断者)の診療情報を格納する診療情報データベース11、複数の個体(被診断者)の遺伝子多型に関する情報を格納する遺伝子多型情報データベース12、該遺伝子多型情報データベース12の情報を基礎としてハプロタイプブロックの位置を推定し、ハプロタイプブロックごとに集団のハプロタイプ頻度および個体のハプロタイプパターンを推定して得られたハプロタイプブロックごとに集団のハプロタイプ頻度情報と個体のハプロタイプパターンを格納するハプロタイプ情報データベース14、該ハプロタイプ情報データベース14の情報を基礎として集団の遺伝的構造を推定し、ハプロタイプブロックごとに個体のハプロタイプパターンによるクラスタリングを行ない、集団をいくつかの亜集団に分割するとともに、各個体の各亜集団への帰属度を推定して得られた、分割された亜集団ごとのハプロタイプ情報および各個体の各亜集団への帰属度情報を格納する遺伝的構造情報データベース16、前記診療情報データベース11および遺伝的構造情報データベース16の情報を基礎として、亜集団のハプロタイプブロックごとに個体のハプロタイプパターンと形質との関連性を解析し、疾患に罹患する危険度を算出する関連性解析によって得られた知識を格納する診断支援知識データベース18と、前記遺伝子多型情報データベース12の情報から前記ハプロタイプ情報データベース14の情報を導出するためのハプロタイプブロック推定処理プログラム13、前記ハプロタイプ情報データベース14の情報から前記遺伝的構造情報データベース16の情報を導出する遺伝的構造推定処理プログラム15、前記診療情報データベース11および前記遺伝的構造情報データベース16の情報から前記診断支援知識データベース18の情報を導出する関連性解析処理プログラム17、前記診断支援知識データベース18の情報を基礎として所定の個体が疾患に罹患する危険度を算出する罹患危険度算出処理プログラム19が内蔵される。もちろん、これらの他に、電子計算機としての機能を果たすために必要とされるデータベースおよび処理プログラムが備えられる。
ここで、上述のデータベースは集団のデータが扱われるものであり、診断支援知識データベース18の情報は、その集団に対して有効なものである。また、これらのデータベースの内容は診断を受けた人のデータの蓄積により、より充実したものとなる。
本発明の診断支援システムは、ハプロタイプブロック推定処理プログラム13によって遺伝子多型情報を基礎として組み換えの位置を推定してハプロタイプブロックの位置を推定し、ハプロタイプブロックごとに解析を行なうことによって、個体のハプロタイプパターンを高精度に推定する。推定されたハプロタイプ頻度情報や個体のハプロタイプパターン情報はハプロタイプ情報データベース14に格納される。また、遺伝的構造推定手段15によって個体のハプロタイプパターンによるクラスタリングを行ない、集団をいくつかの亜集団に分割することによって、集団に存在する遺伝的構造の影響を除去し、臨床情報と遺伝子情報との関連性を高精度に解析することを可能にする。遺伝的構造推定処理プログラム15によって得られた結果は遺伝的構造情報データベース16に格納され、遺伝的構造情報データベース16と診療情報データベース11とを用いて臨床情報と遺伝子情報との関連性を解析することによって、高精度な診断支援知識の提供が可能となる。臨床情報と遺伝子情報との関連性の解析によって得られた診断支援知識は診断支援知識データベース18に格納され、罹患危険度算出処理プログラム19によって診断支援知識データベース18の情報を基礎として所定の個体が疾患に罹患する危険度を算出する。
診療情報データベース11には、個体の氏名、住所、生年月日、家族構成等の基本データや、個体の既往歴、家族歴、主訴、所見、検査結果、生活習慣、症状経過、治療経過、薬剤の処方に関する情報等の臨床データや、インフォームドコンセントに関するデータ等を格納する。遺伝子多型情報データベース12には、多型に関する基本情報(位置、測定方法、多型タイプ(SNP、STRP等)、アレル頻度等)や、個体の遺伝子多型測定結果(塩基配列パターン、ホモ、ヘテロ等)や、検査に用いた検体の識別情報や、保存状態等の検体管理データ等を格納する。
次に、ハプロタイプブロック推定処理プログラム13について説明する。先に述べたように、ハプロタイプブロック内では比較的強い状態で連鎖不平衡が保たれている。また、例えば、先に述べた非特許文献1に示されるように、ハプロタイプブロック内ではハプロタイプの多様性が比較的小さいことも知られている。ハプロタイプブロックの位置を推定するためには、ゲノム上のある領域における連鎖不平衡の強さを定義する必要がある。
一般に、連鎖不平衡の強さは2つの座位間の連鎖不平衡係数D’を用いて表されることが多い。本発明では、例えば、ある領域における複数の座位の連鎖不平衡係数が次式の条件を満たすような場合に、その領域をハプロタイプブロックとして定義する。
min(|D’|)>0.8
推定したハプロタイプブロックについて、各ハプロタイプブロック内における集団のハプロタイプ頻度および個体のハプロタイプパターンを推定する。個体が持つ2つのハプロタイプの組み合わせのことをディプロタイプ形と呼ぶことにする。遺伝子型データから個体のディプロタイプ形を推定するための手法は現在までにいくつか提案されている。代表的なものとしては、例えば、文献:Excoffier L & Slatkin M: Maximum‐likelihood estimation of molecular haplotype frequencies in a diploid population, Mol Biol Evol, Vol. 12, pp. 921-927, 1995に示すようなEMアルゴリズムを用いた手法や、文献:Stephens M et al.: A new statistical method for haplotype reconstruction from population data, Am J Hum Genet, Vol. 68, pp. 978‐989, 2001に示すようなPHASE法等がある。
EMアルゴリズムを用いて母集団のハプロタイプ頻度と個体のディプロタイプ形とを推定する方法について以下で説明する。いま、n個の個体からなるサンプル集団を考える。この集団において、連鎖する複数のマーカー座位におけるハプロタイプを考え、その母集団における頻度をF=(F,F,・・・,F)とする。Mは可能なハプロタイプの総数である。例えば、マーカー座位が全てSNP座位である場合、座位数をLとするとM=2である。各個体の、連鎖する複数のマーカー座位における遺伝子型の観察データをG=(G,G,・・・,G)とする。多くの場合、Gは不完全データである。したがって、Gに対応するディプロタイプ形は1つに定まらないことが多い。このような場合は、可能なディプロタイプ形の上の確率分布(これをディプロタイプ分布と呼ぶ)を定義する。個体i(i=1,2,・・・,n)について、Gに対応するディプロタイプ形をDij(j=1,2,・・・,mi)とする。ここで、miはGに対して可能なディプロタイプの数であり、miの最大値はMである。
図2は、母集団のハプロタイプ頻度と個体のディプロタイプ形とを推定するハプロタイプブロック推定処理プログラム13の例を示す図である。
ステップ21:まず、可能なM個のハプロタイプ(それぞれH,H,・・・,Hとする)に対して、ハプロタイプ頻度の初期値F(0)を与える。ハプロタイプ頻度の合計は1である。
次に、t=0,1,2,・・・について、以下のステップ22〜ステップ25によってF(t)からF(t+1)を計算する。
ステップ22:各ディプロタイプ形Dijは2つのハプロタイプH,Hによって構成されている。ただし、1≦l≦M、1≦m≦Mである。母集団のハプロタイプ頻度F(t)が与えられているとき、Dijが得られる確率は式(1)の通りである。
Figure 0004437050
したがって、遺伝子型の観察データGのもとでの、個体iのディプロタイプ形がDijである事後確率Pr(Dij|G)は、ベイズの定理より、式(2)となる。
Figure 0004437050
これを全てのj(j=1,2,・・・,mi)について計算すれば個体iのディプロタイプ分布が定まる。これをサンプル集団における全ての個体について適用する。
ステップ23:個体のディプロタイプ分布が定まると、サンプル集団における全ての個体のディプロタイプ分布から母集団のハプロタイプ頻度の期待値を計算することができる。母集団のハプロタイプ頻度の期待値は、式(3)となる。
Figure 0004437050
ここで、NDjkiはディプロタイプ形Djkの中に含まれるHの数(すなわち0,1,2のいずれか)である。
ステップ24:このとき、全体の尤度は、個体ごとの全てのディプロタイプ形の尤度を結合し、さらに全ての個体の尤度を結合することによって、式(4)で表すことができる。
Figure 0004437050
ステップ25:F(t+1)=E[F(t)]としてFを更新する。L(F)の値が収束したか否か判定する。L(F(t+1))−L(F(t))<βを満足すれば収束としてステップ26に進み、満足しなければ、ステップ22に戻り、ステップ25まで繰り返す。ここでβは閾値である。
ステップ26:収束した時点でのE[F]=F(EM)を母集団におけるハプロタイプ頻度の最尤推定値とし、このときのPr(D|G)を母集団におけるハプロタイプ頻度の最尤推定値のもとでの個体のディプロタイプ分布とする。
ハプロタイプ情報データベース14には、前述したように、遺伝子多型情報データベース12の情報を基礎として、ハプロタイプブロックの位置を推定し、ハプロタイプブロックごとに集団のハプロタイプ頻度および個体のハプロタイプパターンを推定して得られたハプロタイプブロックごとに集団のハプロタイプ頻度情報と個体のハプロタイプパターンを格納するとともに、ハプロタイプブロックの設定に必要な基本情報と、各ハプロタイプブロック内におけるハプロタイプパターンおよびハプロタイプ頻度情報とを格納する。
図3は、ハプロタイプブロックの設定に必要な基本情報の格納データ例を示す図である。例えば、遺伝子GENE_1については、SNP多型である多型POL_1および多型POL_2とSTRP多型であるPOL_3がテーブルに登録されており、POL_1,POL_2およびPOL_3がハプロタイプブロックHB_1を構成していることを示している。図3に示したデータ以外にも、例えば、ハプロタイプブロックの長さ、ハプロタイプブロックを構成する多型の選択基準(アレル頻度やアミノ酸変異の有無等)、連鎖不平衡係数、ハプロタイプブロックを構成する多型が存在する遺伝子の位置等を格納してもよい。
図4は、各ハプロタイプブロック内におけるハプロタイプパターンおよびハプロタイプ頻度情報の格納例を示す図である。例えば、ハプロタイプブロックHB_1内には、ハプロタイプHT_1,ハプロタイプHT_2,ハプロタイプHT_3およびハプロタイプHT_4の4つのハプロタイプが存在し、各ハプロタイプの母集団における頻度はそれぞれ0.50,0.28,0.15および0.07であることを示している。
図5は、個体ごとのハプロタイプパターンの格納例を示す図である。例えば、個体PERSON_1はハプロタイプブロックHB_1についてはハプロタイプHT_1を2つ有しており(2つのハプロタイプHT_1から構成されるディプロタイプ形を有しており)、そのディプロタイプ形を有している確率が1.00であることを示している。同様に、個体PERSON_1はハプロタイプブロックHB_2については2つのハプロタイプHT_5から構成されるディプロタイプ形(確率0.95)またはハプロタイプHT_5およびハプロタイプHT_6から構成されるディプロタイプ形(確率0.05)を有しており、ハプロタイプブロックHB_mについては2つのハプロタイプHT_Yから構成されるディプロタイプ形(確率1.00)を有していることを示している。
次に、遺伝的構造推定処理プログラム15について説明する。本発明では、集団の遺伝的構造を推定するために、個体のハプロタイプパターンによるクラスタリングを行ない、集団をいくつかの亜集団に分割する。本発明では、各ハプロタイプ間における突然変異および組み換えの起こりやすさによって決定される距離を新しく定義し、この距離を用いて個体のクラスタリングを行なう。以下では、本発明のクラスタリング手法について述べる。
図6は、あるハプロタイプブロック内においてハプロタイプ1〜ハプロタイプ5に示す5つのハプロタイプが観察された例を説明する図である。各ハプロタイプ間の距離を計算するために、まず図6に示すようなハプロタイプ進化系統樹を作成する。ハプロタイプ進化系統樹を作成する方法は、例えば、文献:McPeek MS & Strahs A:Assessment of linkage disequilibrium by the decay of haplotype sharing、 with application to fine‐scale genetic mapping、Am J Hum Genet、Vol. 65, pp. 858‐875, 1999に示される方法等、現在までにいくつか報告されている。
本発明では、進化系統樹の枝(edge)が1回の突然変異もしくは1回の組み換えによる進化を表すように進化系統樹を作成する。図6のハプロタイプ1からハプロタイプ5への進化のように、1回の突然変異もしくは1回の組み換えだけでは進化を表すことができない場合は、実際には観察されていない補助的なハプロタイプを挿入して進化系統樹を作成する。図6のハプロタイプ6は、この補助的なハプロタイプの例である。
次に、作成した系統樹のそれぞれの枝について、その進化が組み換えによるものなのか突然変異によるものなのかを決定する。例えば、図6において、ハプロタイプ1からハプロタイプ4への進化は組み換えによるものと考えられるが、ハプロタイプ1からハプロタイプ2への進化やハプロタイプ1からハプロタイプ3への進化は、突然変異による進化と組み換えによる進化の両方が考えられる。
あるハプロタイプHが別のハプロタイプHへと進化したときの尤度は、式(5)で表される。
Figure 0004437050
ここで、mut.は突然変異(mutation)を、rec.は組み換え(recombination)を示す。(式)5は、あるハプロタイプHが別のハプロタイプHへと進化したときの尤度はその進化が突然変異によるものであると仮定した場合の尤度と組み換えによるものであると仮定した場合の尤度との和で表されることを示している。ここで、ある座位jにおける突然変異率をγ、ハプロタイプにおけるk番目のギャップの組み換え割合をθとすると、Pr(mut.|mut. or rec.)=A/(A+B)であり、また、Pr(rec.|mut. or rec.)=B/(A+B)である。ただし、Aは式(6)、Bは式(7)に示す通りである。
Figure 0004437050
Figure 0004437050
図6におけるハプロタイプ1からハプロタイプ4への進化のように、ハプロタイプを構成する多型が2つ以上の座位で異なる場合は、その進化が組み換えによるものであることが明らかであり、Pr(H|H、mut.)=0である。組み換えによる進化の場合は、例えば、図6のハプロタイプ1からハプロタイプ4への進化の場合、ハプロタイプ1およびハプロタイプ4の右側に共通する部分ハプロタイプGCCCTCTAT上のどのギャップ(両端を含む)において組み換えが起こっても、見かけ上は同じハプロタイプが形成される。そこで、HとHとが、k番目のギャップまでは見かけ上同じアレルから構成されており(これをIBS(identical by state)という)、それ以降の部分で異なっているとすると、組み換えによる進化の場合の尤度は式(8)と表される。
Figure 0004437050
いま、HがL個の座位によって構成されていることとし、Hのうちの座位m,m+1,・・・,nの部分で構成される部分ハプロタイプをH {m:n}と表すことにする。Hについても同様に表すことにすると、式(9)となる。
Figure 0004437050
ここで、ある2つのハプロタイプがIBD(identical by descent)であるとは、同祖由来のアレルを共有していることを示す。また、ある2つのハプロタイプが見かけ上はIBSであっても実際にはIBDである場合もあるため、これをIBS*と表すことにする。
ベイズの定理を適用すると、式(10)となる。
Figure 0004437050
ここで、式(11)と仮定することができ、
Figure 0004437050
式(12)はH {1:k}の頻度であるから、式(10)の値は容易に計算することができる。
Figure 0004437050
本発明では、式(5)で表される尤度を各ハプロタイプ間の距離として新しく定義し、この距離を用いて個体のクラスタリングを行なうこととした。したがって、k番目のハプロタイプブロックについてHkak、Hkbkのハプロタイプをもつ個体とHkck、Hkdkのハプロタイプをもつ個体との距離dkを、式(13)のように定義する。
Figure 0004437050
ハプロタイプブロックの数をmとすると、2つの個体間の距離dは、全てのハプロタイプブロックにおける距離を結合して、式(14)となる。
Figure 0004437050
次に、個体の帰属度の推定方法、すなわち、遺伝的構造推定処理プログラム15について説明する。本発明では、各個体が、先に述べたクラスタリング手法によって生成された亜集団のうちのどの亜集団に属するかという情報を、個体の帰属度として定義する。
図7は、個体の帰属度を推定する遺伝的構造推定処理プログラム15を示す図である。
ステップ71:図6を参照して説明した方法によって、各ハプロタイプごとにハプロタイプ間の距離を決定する。
ステップ72:ハプロタイプ間の距離にもとづくクラスタリングを行なう。
ステップ73:ステップ72の結果から、n個の個体からなる集団がN個の亜集団に分割されたとする。このとき、ある個体iがある亜集団jに分類されているとすると、個体iの亜集団jへの帰属度は100%であり、個体iの亜集団j以外の亜集団への帰属度は0%である。ハプロタイプブロックの数をmとすると、全体の尤度は式(15)と表すことができる。
Figure 0004437050
ここで、Pr(D|G)は個体の最尤ディプロタイプ分布であり、式(16)はある亜集団jのk番目のハプロタイプブロックにおける個体iの最尤ディプロタイプ分布を示す。
Figure 0004437050
ステップ74:L(N)の値が収束したか否か判定する。L(Nk−1)−L(N)<βを満足すれば収束としてステップ75に進み、満足しなければ、ステップ71に戻り、ステップ74まで繰り返す。ここでβは閾値である。
また、式(17)は個体iの亜集団jへの帰属度である。
Figure 0004437050
ステップ75:式(15)で表される尤度が最大となるときのNが亜集団数の最尤推定値である。この最尤推定値をパラメータとして採用する。
ステップ76:式(15)で表される尤度を基礎として個体の各亜集団への帰属度を計算する。例えば、N_{k}個の亜集団があり、次の連結ステップで亜集団N_{l}と亜集団N_{l+1}とが連結されてN_{k−1}個の亜集団が形成されるとすると、このステップにおいて尤度に変化がなく、かつこのときに尤度が最大となる場合には、亜集団N_{l}および亜集団N_{l+1}に分類されている全ての個体について、亜集団N_{l}および亜集団N_{l+1}への帰属度をそれぞれ50%ずつとする。
遺伝的構造情報データベース16には、先にも述べたように、各亜集団におけるハプロタイプパターンおよびハプロタイプ頻度情報と、個体ごとの各亜集団への帰属度情報とを格納する。
図8は、各亜集団におけるハプロタイプパターンおよびハプロタイプ頻度情報の格納例を示す図である。例えば、亜集団SUBPOP_1および亜集団SUBPOP_2内にハプロタイプブロックHB_1、HB_2がある。ここで、亜集団SUBPOP_1内にはハプロタイプHT_1,ハプロタイプHT_2,ハプロタイプHT_3およびハプロタイプHT_4の4つのハプロタイプが存在し、亜集団SUBPOP_2内には別のハプロタイプHT_7,ハプロタイプHT_8,ハプロタイプHT_9の3つのハプロタイプが存在することを示している。
一方、図4を参照して分かるように、例えば、ハプロタイプブロックHB_1内には、ハプロタイプHT_1,ハプロタイプHT_2,ハプロタイプHT_3およびハプロタイプHT_4の4つのハプロタイプが存在し、各ハプロタイプの母集団における頻度はそれぞれ0.50,0.28,0.15および0.07であることを示している。また、ハプロタイプブロックHB_1内に、別のハプロタイプHT_7,ハプロタイプHT_8およびハプロタイプHT_9の3つのハプロタイプが存在し、各ハプロタイプの母集団における頻度はそれぞれ0.34,0.33および0.33であることを示している。
図9は、個体ごとの各亜集団への帰属度情報の格納例を示す図である。例えば、個体PERSON_1は亜集団SUBPOP_1への帰属度は1.00(100%と百分率で表記してもよい)であり、個体PERSON_2は亜集団SUBPOP_1への帰属度が0.50(50%)、亜集団SUBPOP_3への帰属度が0.50(50%)であることを示している。
次に、関連性解析処理プログラム17によって、診療情報データベース11および遺伝的構造情報データベース16の情報を基礎として、各亜集団のハプロタイプブロックごとに個体のハプロタイプパターンと形質との関連性を解析する手順について説明する。関連性解析処理プログラム17は、特定のハプロタイプを所有する個体の群と所有しない個体の群との間の形質を比較して(例えば、疾患の発症の有無を比較して)両群間のオッズ比等を計算し、特定のハプロタイプを所有する個体の群が特定のハプロタイプを所有しない個体の群と比較してどの程度疾患を発症するリスクが高まるかどうかを推定する。
本発明では、例えば、特定のハプロタイプを所有する個体の群の、特定のハプロタイプを所有しない個体の群に対する疾患発症のオッズ比をハプロタイプ相対リスクとして定義する。多くの場合、特定のハプロタイプの所有の有無、疾患の発症の有無(臨床イベントの有無や薬剤の副作用の有無等でもよい)によって2×2分割表を作成し、この2×2分割表の独立性の検定(χ2乗検定やFisherの直接確率法を用いる)によって特定のハプロタイプの所有の有無が疾患の発症の有無に与える影響を計算する。形質がいくつかのカテゴリに分割できないような場合は、t検定やWilcoxonテスト等を実施し、特定のハプロタイプを所有する個体の群と所有しない個体の群との形質の差を比較してもよい。
関連性解析処理プログラム17によって得られた知識は、診断支援知識データベース18に格納される。
図10は、診断支援知識データベース18の記述例を示す図である。各亜集団におけるハプロタイプ相対リスク情報の格納例を示している。ハプロタイプ相対リスクは、疾患の発症の有無や臨床イベントの有無、検査結果の正常・異常、薬剤の副作用の有無等、様々な臨床データについて定義することが可能であり、ここでは、心疾患、糖尿病、疾患Xの発症の有無に対する各亜集団ごとのハプロタイプ相対リスク情報の格納例を示している。例えば、ハプロタイプHT_1は亜集団SUBPOP_1内では心疾患に対する相対リスクが1.50であり、糖尿病、疾患Xに対する相対リスクがそれぞれ1.35,1.00であることを示している。また、同時に、ハプロタイプHT_1は亜集団SUBPOP_2内では心疾患に対する相対リスクが2.00であり、糖尿病、疾患Xに対する相対リスクがそれぞれ1.89,1.00と変化することを示している。
罹患危険度算出処理プログラム19は、遺伝的構造情報データベース16および診断支援知識データベース18を参照して所定の個体が疾患に罹患する危険度を算出する。個体iがある疾患に罹患する危険度Rは、ハプロタイプブロックの数をm、集団内に存在する亜集団の数をN、亜集団jのハプロタイプブロックkにおける個体iのハプロタイプ相対リスクをrijkとすると、式(18)と表すことができる。
Figure 0004437050
図11は、外部診療機関112から接続パス31,32およびインターネット30を介して本発明の診断支援システム111にアクセスし、本発明の診断支援システム111を利用した診断支援を受ける場合のシステム例を示す図である。外部診療機関112も、いわゆるパソコン等の電子計算機を備え、システムバス5に処理装置1、メモリー2、入力装置3、表示装置4および外部記憶装置10が接続される。ただし、外部診療機関112は、本発明のように、大規模な母集団のデータを扱うものではないので、複数の個体(被診断者)の診療情報を格納する診療情報データベース113および複数の個体(被診断者)の遺伝子多型に関する情報を格納する遺伝子多型情報データベース114は小規模のもので良い。単に、被診断者の診断に際して、個別に、本発明の診断支援システム111を利用した診断支援を受けることだけであれば、診療情報データベース113および遺伝子多型情報データベース114は無くても良い。尤も、本発明の診断支援システム111は、これを利用する外部診療機関112が、被診断者のデータを収集してこれを提供してくれることで、データを充実させてシステムをより完全なものにしていくことが望ましい。外部診療機関112が本発明の診断支援システム111を利用した診断支援を受ける場合は、外部診療機関112は診療情報データベース113および遺伝子多型情報データベース114から個体の遺伝子データおよび形質データを抽出して本発明の診断支援システム111へ送付する。外部診療機関112が診療情報データベース113および遺伝子多型情報データベース114を持たないときは、これらの情報を入力装置3から入力して、本発明の診断支援システム111に送付するものとすれば良い。本発明の診断支援システム111は、これらのデータを基礎に、算出された疾患に対する罹患危険度情報、遺伝的構造情報、個体の各亜集団への帰属度情報等を依頼元の外部診療機関112へ提供する。計算機の処理フローは特に説明するまでもない。
本発明の診断支援システムの構成例を示す図である。 母集団のハプロタイプ頻度と個体のディプロタイプ形とを推定するハプロタイプブロック推定処理プログラム13の例を示す図である。 ハプロタイプブロックの設定に必要な基本情報の格納データ例を示す図である。 各ハプロタイプブロック内におけるハプロタイプパターンおよびハプロタイプ頻度情報の格納例を示す図である。 個体ごとのハプロタイプパターンの格納例を示す図である。 あるハプロタイプブロック内においてハプロタイプ1〜ハプロタイプ5に示す5つのハプロタイプが観察された例を説明する図である。 個体の帰属度を推定する遺伝的構造推定処理プログラム15を示す図である。 各亜集団におけるハプロタイプパターンおよびハプロタイプ頻度情報の格納例を示す図である。 個体ごとの各亜集団への帰属度情報の格納例を示す図である。 診断支援知識データベース18の記述例を示す図である。 外部診療機関112から接続パス31,32およびインターネット30を介して本発明の診断支援システム111にアクセスし、本発明の診断支援システム111を利用した診断支援を受ける場合のシステム例を示す図である。
符号の説明
1…処理装置、2…メモリー、3…入力装置、4…表示装置、5…システムバス、10…外部記憶装置、11…診療情報データベース、12…遺伝子多型情報データベース、13…ハプロタイプブロック推定処理プログラム、14…ハプロタイプ情報データベース、15…遺伝的構造推定処理プログラム、16…遺伝的構造情報データベース、17…関連性解析処理プログラム、18…診断支援知識データベース、19…罹患危険度算出処理プログラム、21…ハプロタイプ頻度初期値設定ステップ、22…ディプロタイプ分布計算ステップ、23…尤度計算ステップ、24…ハプロタイプ頻度期待値計算ステップ、25…ハプロタイプ頻度・ディプロタイプ分布最尤推定値採用ステップ、71…ハプロタイプ間距離決定ステップ、72…クラスタリング実行ステップ、73…尤度計算ステップ、74…パラメータ採用ステップ、75…帰属度計算ステップ、111…診断支援システム、112…外部診療機関、113…外部診療の診療情報データベース、114…外部診療機関の遺伝子多型情報データベース。

Claims (5)

  1. 複数の個体の診療情報を格納する診療情報データベースと、集団の遺伝子多型に関する情報を格納する遺伝子多型情報データベースと、前記遺伝子多型情報データベースの情報を基礎として前記集団のハプロタイプブロックおよび前記各ハプロタイプブロック内におけるハプロタイプ頻度を推定するハプロタイプブロック推定処理プログラムと、前記集団の推定された前記各ハプロタイプブロック内におけるハプロタイプパターンおよび前記ハプロタイプ頻度を格納するハプロタイプ情報データベースと、前記ハプロタイプ情報データベースに格納された、異なる前記ハプロタイプパターン間の距離を計算し、該距離の近いパターンを同一の亜集団として前記集団を複数の亜集団に分割し、前記各個体の前記各亜集団への帰属度を計算する遺伝的構造推定処理プログラムと、分割された前記亜集団ごとの前記ハプロタイプ情報および前記各個体の前記各亜集団への帰属度情報を格納する遺伝的構造情報データベースと、前記遺伝的構造情報データベースに格納された前記各亜集団ごとに、前記各ハプロタイプブロックにおける前記ハプロタイプパターンと前記診療情報データベースに格納された前記各個体の診療情報との関連性を解析する関連性解析処理プログラムと、前記関連性解析処理プログラムによって得られた情報を格納する診断支援知識データベースと、前記診断支援知識データベースの情報を基礎として所定の個体が疾患に罹患する危険度を算出する罹患危険度算出処理プログラムとを有することを特徴とする診断支援システム。
  2. 前記距離が、各ハプロタイプ間における組み換えおよび突然変異の起こりやすさにより定義される請求項1に記載の診断支援システム。
  3. 遺伝子多型に関する情報を格納する遺伝子多型情報データベースの情報を基礎としてハプロタイプブロックおよび各ハプロタイプブロック内におけるハプロタイプ頻度を推定するステップ、推定された前記各ハプロタイプブロック内におけるハプロタイプパターンおよびハプロタイプ頻度をハプロタイプ情報データベースに格納するステップと、前記ハプロタイプ情報データベースに格納された、異なる前記ハプロタイプパターン間の距離を計算し、該距離の近いパターンを同一の亜集団として前記集団を複数の亜集団に分割し、前記各個体の前記各亜集団への帰属度を計算する遺伝的構造を推定するステップと、分割された前記亜集団ごとの前記ハプロタイプ情報および前記各個体の前記各亜集団への帰属度情報を遺伝的構造情報データベースに格納するステップと、前記遺伝的構造情報データベースに格納された前記各亜集団ごとに、前記各ハプロタイプブロックにおける前記ハプロタイプパターンと複数の個体の診療情報を格納する診療情報データベース内の前記各個体の診療情報との関連性を解析する関連性解析ステップと、前記関連性解析ステップで得られた情報を診断支援知識データベースに格納するステップと、前記診断支援知識データベースの情報を基礎として所定の個体が疾患に罹患する危険度を算出する罹患危険度算出ステップとよりなることを特徴とする診断支援方法。
  4. 請求項3に記載の診断支援方法であって、
    前記距離が、各ハプロタイプ間における組み換えおよび突然変異の起こりやすさにより定義されることを特徴とする診断支援方法。
  5. 複数の個体の診療情報を格納する診療情報データベースと、遺伝子多型に関する情報を格納する遺伝子多型情報データベースと、前記遺伝子多型情報データベースの情報を基礎としてハプロタイプブロックおよび前記各ハプロタイプブロック内におけるハプロタイプ頻度を推定するハプロタイプブロック推定処理プログラムと、推定された前記各ハプロタイプブロック内におけるハプロタイプパターンおよび前記ハプロタイプ頻度を格納するハプロタイプ情報データベースと、前記ハプロタイプ情報データベースに格納された、異なる前記ハプロタイプパターン間の距離を計算し、該距離の近いパターンを同一の亜集団として前記集団を複数の亜集団に分割し、前記各個体の前記各亜集団への帰属度を計算する遺伝的構造推定処理プログラムと、分割された前記亜集団ごとの前記ハプロタイプ情報および前記各個体の前記各亜集団への帰属度情報を格納する遺伝的構造情報データベースと、前記遺伝的構造情報データベースに格納された前記各亜集団ごとに、前記各ハプロタイプブロックにおける前記ハプロタイプパターンと前記診療情報データベースに格納された前記各個体の診療情報との関連性を解析する関連性解析処理プログラムと、前記関連性解析処理プログラムによって得られた情報を格納する診断支援知識データベースと、前記診断支援知識データベースの情報を基礎として所定の個体が疾患に罹患する危険度を算出する罹患危険度算出処理プログラムとを有する診断支援システムに接続して受けることができる診断支援サービスの提供方法であって、
    診断支援サービスを受けるものは、被診断者の個体から受け取った前記所定の個体遺伝子型データおよび診療情報を診断支援システムに送信して、
    診断支援システムは、前記集団に存在する遺伝的構造に関する情報と、前記所定の個体の前記各亜集団への帰属度と、前記所定の個体が疾患に罹患する危険度とを算出して前記診断支援サービスを受けるものに提供することを特徴とする診断支援サービスの提供方法。
JP2004091104A 2004-03-26 2004-03-26 診断支援システム、診断支援方法および診断支援サービスの提供方法 Expired - Fee Related JP4437050B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2004091104A JP4437050B2 (ja) 2004-03-26 2004-03-26 診断支援システム、診断支援方法および診断支援サービスの提供方法
CNA2004100716130A CN1674028A (zh) 2004-03-26 2004-07-16 诊断支援系统及诊断支援方法
US10/901,215 US20050216208A1 (en) 2004-03-26 2004-07-29 Diagnostic decision support system and method of diagnostic decision support

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004091104A JP4437050B2 (ja) 2004-03-26 2004-03-26 診断支援システム、診断支援方法および診断支援サービスの提供方法

Publications (3)

Publication Number Publication Date
JP2005276022A JP2005276022A (ja) 2005-10-06
JP2005276022A5 JP2005276022A5 (ja) 2006-06-15
JP4437050B2 true JP4437050B2 (ja) 2010-03-24

Family

ID=34991181

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004091104A Expired - Fee Related JP4437050B2 (ja) 2004-03-26 2004-03-26 診断支援システム、診断支援方法および診断支援サービスの提供方法

Country Status (3)

Country Link
US (1) US20050216208A1 (ja)
JP (1) JP4437050B2 (ja)
CN (1) CN1674028A (ja)

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9424392B2 (en) 2005-11-26 2016-08-23 Natera, Inc. System and method for cleaning noisy genetic data from target individuals using genetic data from genetically related individuals
US10083273B2 (en) 2005-07-29 2018-09-25 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US10081839B2 (en) 2005-07-29 2018-09-25 Natera, Inc System and method for cleaning noisy genetic data and determining chromosome copy number
US11111544B2 (en) 2005-07-29 2021-09-07 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
US11111543B2 (en) 2005-07-29 2021-09-07 Natera, Inc. System and method for cleaning noisy genetic data and determining chromosome copy number
WO2007062164A2 (en) * 2005-11-26 2007-05-31 Gene Security Network Llc System and method for cleaning noisy genetic data and using data to make predictions
JP2007279999A (ja) * 2006-04-06 2007-10-25 Hitachi Ltd 薬物動態解析システム及び方法
WO2008007424A1 (fr) * 2006-07-11 2008-01-17 Digital Information Technologies Corporation Système d'analyse du génome, procédé d'analyse du génome et programme
US20080228698A1 (en) * 2007-03-16 2008-09-18 Expanse Networks, Inc. Creation of Attribute Combination Databases
TWM329206U (en) * 2007-07-24 2008-03-21 Behavior Tech Computer Corp Foldable mouse
US20090043752A1 (en) * 2007-08-08 2009-02-12 Expanse Networks, Inc. Predicting Side Effect Attributes
US8645074B2 (en) * 2007-11-19 2014-02-04 International Business Machines Corporation Method for reconstructing evolutionary data
US8108406B2 (en) 2008-12-30 2012-01-31 Expanse Networks, Inc. Pangenetic web user behavior prediction system
US20100169338A1 (en) * 2008-12-30 2010-07-01 Expanse Networks, Inc. Pangenetic Web Search System
US8255403B2 (en) 2008-12-30 2012-08-28 Expanse Networks, Inc. Pangenetic web satisfaction prediction system
US8386519B2 (en) 2008-12-30 2013-02-26 Expanse Networks, Inc. Pangenetic web item recommendation system
EP3276526A1 (en) 2008-12-31 2018-01-31 23Andme, Inc. Finding relatives in a database
EP2473638B1 (en) 2009-09-30 2017-08-09 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11326208B2 (en) 2010-05-18 2022-05-10 Natera, Inc. Methods for nested PCR amplification of cell-free DNA
WO2011146632A1 (en) 2010-05-18 2011-11-24 Gene Security Network Inc. Methods for non-invasive prenatal ploidy calling
US10316362B2 (en) 2010-05-18 2019-06-11 Natera, Inc. Methods for simultaneous amplification of target loci
US11408031B2 (en) 2010-05-18 2022-08-09 Natera, Inc. Methods for non-invasive prenatal paternity testing
US20190010543A1 (en) 2010-05-18 2019-01-10 Natera, Inc. Methods for simultaneous amplification of target loci
US11322224B2 (en) 2010-05-18 2022-05-03 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11339429B2 (en) 2010-05-18 2022-05-24 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US9677118B2 (en) 2014-04-21 2017-06-13 Natera, Inc. Methods for simultaneous amplification of target loci
US11332793B2 (en) 2010-05-18 2022-05-17 Natera, Inc. Methods for simultaneous amplification of target loci
US11332785B2 (en) 2010-05-18 2022-05-17 Natera, Inc. Methods for non-invasive prenatal ploidy calling
US11939634B2 (en) 2010-05-18 2024-03-26 Natera, Inc. Methods for simultaneous amplification of target loci
JP6222202B2 (ja) * 2010-07-05 2017-11-01 ソニー株式会社 生体情報処理方法および装置、並びに記録媒体
JP6328934B2 (ja) 2010-12-22 2018-05-23 ナテラ, インコーポレイテッド 非侵襲性出生前親子鑑定法
AU2011358564B9 (en) 2011-02-09 2017-07-13 Natera, Inc Methods for non-invasive prenatal ploidy calling
WO2013044354A1 (en) * 2011-09-26 2013-04-04 Trakadis John Method and system for genetic trait search based on the phenotype and the genome of a human subject
US10577655B2 (en) 2013-09-27 2020-03-03 Natera, Inc. Cell free DNA diagnostic testing standards
US10262755B2 (en) 2014-04-21 2019-04-16 Natera, Inc. Detecting cancer mutations and aneuploidy in chromosomal segments
WO2015071815A1 (en) * 2013-11-13 2015-05-21 Koninklijke Philips N.V. Hierarchical self-learning system for computerized clinical diagnostic support
CN113774132A (zh) 2014-04-21 2021-12-10 纳特拉公司 检测染色体片段中的突变和倍性
US11479812B2 (en) 2015-05-11 2022-10-25 Natera, Inc. Methods and compositions for determining ploidy
WO2018067517A1 (en) 2016-10-04 2018-04-12 Natera, Inc. Methods for characterizing copy number variation using proximity-litigation sequencing
US10011870B2 (en) 2016-12-07 2018-07-03 Natera, Inc. Compositions and methods for identifying nucleic acid molecules
US11525159B2 (en) 2018-07-03 2022-12-13 Natera, Inc. Methods for detection of donor-derived cell-free DNA

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU785425B2 (en) * 2001-03-30 2007-05-17 Genetic Technologies Limited Methods of genomic analysis
US6920398B2 (en) * 2001-06-08 2005-07-19 President And Fellows Of Harvard College Haplotype determination

Also Published As

Publication number Publication date
US20050216208A1 (en) 2005-09-29
CN1674028A (zh) 2005-09-28
JP2005276022A (ja) 2005-10-06

Similar Documents

Publication Publication Date Title
JP4437050B2 (ja) 診断支援システム、診断支援方法および診断支援サービスの提供方法
Taliun et al. Sequencing of 53,831 diverse genomes from the NHLBI TOPMed Program
Harper et al. Common genetic variants and modifiable risk factors underpin hypertrophic cardiomyopathy susceptibility and expressivity
Kanzi et al. Next generation sequencing and bioinformatics analysis of family genetic inheritance
Band et al. Imputation-based meta-analysis of severe malaria in three African populations
JP7277438B2 (ja) ゲノムデータ解析に近縁性を活用するシステム及び方法
KR20180132727A (ko) 유전자 변이체 표현형 분석 시스템 및 사용 방법
US20060122816A1 (en) Computer systems and methods for subdividing a complex disease into component diseases
Inshaw et al. The chromosome 6q22. 33 region is associated with age at diagnosis of type 1 diabetes and disease risk in those diagnosed under 5 years of age
Hollenbach et al. Analytical methods for disease association studies with immunogenetic data
KR20180116309A (ko) 비정상적인 핵형을 검출하기 위한 방법 및 시스템
US20140088942A1 (en) Molecular genetic diagnostic system
CN113272912A (zh) 使用似然比范式的用于表型驱动临床基因组的方法和装置
Francioli et al. A framework for the detection of de novo mutations in family-based sequencing data
CN112735599A (zh) 一种判断罕见遗传性疾病的评估方法
KR102085169B1 (ko) 개인 유전체 맵 기반 맞춤의학 분석 시스템 및 이를 이용한 분석 방법
Balick et al. Overcoming constraints on the detection of recessive selection in human genes from population frequency data
Lasky-Su Statistical techniques for genetic analysis
KR102041504B1 (ko) 환자 계층화를 위한 맞춤의학 분석 플랫폼
Markus et al. Integration of SNP genotyping confidence scores in IBD inference
Yorgov et al. Use of admixture and association for detection of quantitative trait loci in the Type 2 Diabetes Genetic Exploration by Next-Generation Sequencing in Ethnic Samples (T2D-GENES) study
Oliveira et al. Homozygosity mapping using whole-exome sequencing: a valuable approach for pathogenic variant identification in genetic diseases
Jakaitiene et al. Beta-binomial model for the detection of rare mutations in pooled next-generation sequencing experiments
KR102041497B1 (ko) 개인 유전체 맵 기반 맞춤의학 분석 플랫폼 및 이를 이용한 분석 방법
Kumaran et al. eyeVarP: A computational framework for the identification of pathogenic variants specific to eye disease

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060419

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060419

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20060419

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090512

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090702

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20091215

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100104

R150 Certificate of patent or registration of utility model

Ref document number: 4437050

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130108

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140108

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees