JP2015007985A - 複数の環境的リスク因子及び遺伝的リスク因子を組み込む方法及びシステム - Google Patents

複数の環境的リスク因子及び遺伝的リスク因子を組み込む方法及びシステム Download PDF

Info

Publication number
JP2015007985A
JP2015007985A JP2014151568A JP2014151568A JP2015007985A JP 2015007985 A JP2015007985 A JP 2015007985A JP 2014151568 A JP2014151568 A JP 2014151568A JP 2014151568 A JP2014151568 A JP 2014151568A JP 2015007985 A JP2015007985 A JP 2015007985A
Authority
JP
Japan
Prior art keywords
individual
risk
score
disease
genetic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014151568A
Other languages
English (en)
Inventor
ハルペリン,エラン
Halperin Eran
ウェッセル,ジェニファー
Wessel Jennifer
カーギル,ミシェル
Cargill Michele
エー. スティーブン,ディートリッチ
A Stephan Dietrich
エー. スティーブン,ディートリッチ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Navigenics Inc
Original Assignee
Navigenics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Navigenics Inc filed Critical Navigenics Inc
Publication of JP2015007985A publication Critical patent/JP2015007985A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/10Ploidy or copy number detection
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Evolutionary Biology (AREA)
  • Analytical Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Public Health (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Data Mining & Analysis (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

【課題】個体の疾患又は症状に関する環境遺伝複合指数(EGCI)スコアの作成方法を提供する。【解決手段】個体の遺伝子サンプルからゲノムプロファイルを作成し、個体から少なくとも1つの環境因子を得て、ゲノムプロファイル及び少なくとも1つの環境因子からEGCIスコアを作成し、そして該個体又は該個体のヘルスケア管理者にEGCIスコアを報告する。追加の、又は修正した環境因子を用いて更新したEGCIスコアをさらに含む。EGCIスコアは、コンピューターによって算定され、そしてその結果がコンピューターによって入手され、出力される。【選択図】図1

Description

関連出願の相互参照
本出願は、2008年9月12日出願の米国仮出願番号第61/096758号に基づく優先権を主張するものであり、この仮出願全体を本明細書中に援用する。
背景
一般的な病気及び状態の病因は、典型的には、遺伝的因子と環境因子の両方の結果と考えられる。遺伝子型決定技術における最近の進歩は、そういった疾患に関する遺伝子の貢献に対する理解を大いに改善した。多くの全ゲノム関連研究が最近終了し、ゲノム全般にわたる一般的な病気と一般的な遺伝子変異体との新たな関連の発見を目指している。これらの研究は、疾患のメカニズム、及び彼らの遺伝的組成に基づいた、彼らが一生のうちで病気に罹る個体のリスクに光を当てた。生涯の早い時期に臨床的意志決定プロセスの中に遺伝性の遺伝的リスク情報を組み込むことは、疾患若しくは状態を改善する又はさらに、予防する際に重要な影響を持つ。
一般的な慢性非伝染性疾患の有病率は、典型的には、組み合わされる遺伝子疾患と感染症の両方の有病率を目立たなくする。一般的なSNP変異体は、一般的な疾患に関する生殖系列の遺伝的リスクの、全てでないが、かなりの数のうちの一部を占め、そして状況に応じて使用されるとき、十分に個別化され且つ集中的な暴露の緩和、早期検出及び個体に関する早期介入パラダイムを許容する。
ゲノム中の遺伝子変異、例えば一塩基多系(SNP)、突然変異、欠失、挿入、反復、ミクロサテライトなどは、様々な表現型、例えば疾患又は症状などに関連する。個体の遺伝子変異は、異なる表現型に対する個体の素因又はリスクを決定するために特定され、関連づけられ、そして個別の表現型プロファイルが作成され得る。
小さいエフェクトサイズの一般的なSNP変異体、希少な及び個別の変異体、DNAコピー数変異体、及び後成的修正は、典型的には、遺伝性リスクの大部分を占めている。状態を発症する個体のリスクの正確な推定は、困難な課題である。そのリスクは、遺伝的リスク因子の負担、環境因子、性別、及び年齢を含めた多くの因子によって決定される。よって、ほとんどの状態に関して、最も正確なリスク評価は、確率論的リスク推定をもたらすにすぎない。因子としては、異なる関連変異体、それらのエフェクトサイズ、集団中のそれらの頻度、個体に影響する環境因子(例えば食生活、年齢、家族歴、及び民族的背景など)、並びにそれらの相互作用が挙げられる。すぐにこれらの因子のすべてを調査する大規模な研究は、実施に法外な費用がかかるので、我々が知る限り、なにも行われていない。
よって、遺伝子変異の影響を考慮に入れたリスク推定を含む個別の表現型プロファイルを作成する方法が必要とされている、けれども、同時に複数のリスクプロファイルを評価する大規模研究の結果を必要としているわけではない。さらに、例えば臨床的分類子として予測力を持っているような臨床的意志決定のためのさらなるツールを提供する、疾患によって変化するだけではなく、環境データと組み合わせることができるリスク推定を作成する必要性が存在する。本開示及び本明細書中に開示された実施形態は、これらのニーズを満たし、そしてまた関連した利益もまた提供する。
概要
本開示は、個体の疾患又は症状に関する環境遺伝複合指数(EGCI)スコアの作成方法を提供する。この方法は、該個体の遺伝子サンプルからゲノムプロファイルを作成し;該個体から少なくとも1つの環境因子を得;ゲノムプロファイル及び少なくとも1つの環境因子からEGCIスコアを作成し;そして該個体又は該個体のヘルスケア管理者にEGCIスコアを報告することを含み得る。その方法は、追加の又は修正した環境因子を用いて更新したEGCIスコアをさらに含むことができる。いくつかの実施形態では、その方法はコンピューターによって実施される。例えば、EGCIスコアは、コンピューターによって算定され、そしてその結果がコンピューターによって入手され、出力される。
疾患又は症状に関する環境因子の相対リスクは、少なくとも約1である。いくつかの実施形態では、疾患又は症状に関する相対リスクは、少なくとも約1.1、1.2、1.3、1.4、又は1.5である。相対リスクは、少なくとも約2、3、4、5、10、12、15、20、25、30、25、40、45、又は50であり得る。いくつかの実施形態では、環境因子は、少なくとも約1のオッズ比(OR)をもつ。さらに他の実施形態では、ORは、少なくとも約1.1、1.2、1.3、1.4、又は1.5である。ORは、少なくとも約1.5、2、3、4、5、10、12、15、20、25、30、25、40、45、又は50であり得る。
別の実施形態では、環境因子は、以下の:個体の出生地、居住場所、ライフスタイルの状況;食生活、運動習慣、及び個人的な人間関係から成る群から選択されることができる。例えば、ライフスタイルの状況は、喫煙又はアルコール摂取であり得る。いくつかの実施形態では、環境因子は、個体の身体計測値、例えばボディーマスインデックス、血圧、心拍数、グルコースレベル、代謝レベル、イオンレベル、体重、身長、コレステロールレベル、ビタミンレベル、血球数、タンパク質レベル、又は転写物レベルなどである。
EGCIスコアは、少なくとも2つの環境因子を使用して作成されてもよく、EGCIスコアを作成することで、環境因子の少なくとも1つ、又はそれ以上が前述の疾患又は症状に関して独立なリスクプロファイルであると仮定することもできる。
いくつかの実施形態では、EGCIスコアは、約95%未満の遺伝率を有する疾患又は症状関して作成される。いくつかの実施形態では、前記疾患又は症状は、約5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、又は90%未満の遺伝率を有する。
別の実施形態では、本明細書中に開示された方法は、個体の遺伝子サンプルを入手するか、又は個体のゲノムプロファイルを作成する第三者を含んでなる。前記遺伝子サンプルは、DNA又はRNAであり得、そして生体サンプル、例えば血液、毛髪、皮膚、唾液、精液、尿、糞便、汗、又は口腔粘膜サンプルなどから入手されうる。
前記方法はさらに、コンピューターの使用による、ネットワーク上でのEGCIスコアの伝達、オンラインポータルを通じた、紙による又はeメールによるEGCIの報告も含んでなる。前記報告は、セキュリティー保護された又は保護されていない様式である。個体のゲノムプロファイルは、セキュリティー保護されたデータベース又は金庫に預けられることもでき、且つ、一塩基多型プロファイルであるか、又はトランケーション、挿入、欠失、若しくは反復を含むゲノムプロファイルであり得る。前記ゲノムプロファイルは、高密度DNAマイクロアレイ、RT‐PCR、又はDNA配列決定法を使用して作成され得る。いくつかの実施形態では、ゲノムプロファイルは、対象又は個体から遺伝子サンプルを増幅することによって作成される。あるいは、ゲノムプロファイルは、遺伝子サンプルを増幅することなく作成され得る。
援用
この明細書中で言及された、すべての刊行物、特許、及び特許出願を、各々、個別の刊行物、特許、又は特許出願について、援用されるべきことが特異的に且つ個別に示されたのと同じように、本明細書中に援用する。
本明細書中に開示された実施形態の新規特徴を、添付の請求項中に詳細に説明する。本開示の特徴及び利点のより良い理解は、本明細書中に開示した原理が利用されている例示的な実施形態、及び添付図面を説明する以下の詳細な説明を参照することによって得られるであろう。
a)クローン病、B)2型糖尿病、及びC)関節リウマチのROC曲線を例示する。各プロットにおいて、黒色線は、無作為期待値に対応し、紫色及び青色線は、遺伝的変数が既知の場合の理論的期待値に対応し(2つの状態モデル下、以下に詳述)、黄色線は、GCIに対応し、及び緑色線は、ロジスティック回帰に対応している。 a)クローン病、B)関節リウマチ、及びC)2型糖尿病の相互作用に伴うモデル及び単純乗法的モデルに関するROC曲線を例示する。各プロットにおいて、6400の閾値ポイントを使用する。 A)25%の生涯リスクと64%の遺伝率を用いた2型糖尿病に関するオッズ比と相対リスクの比較、B)42%の生涯リスクと57%の遺伝率を用いた心筋梗塞に関するオッズ比と相対リスクの比較、及びC)2型糖尿病に関する平均二乗誤差対罹患確率、を描く。 既知の遺伝的リスク対既知の家族歴を例示する。家族歴対理論的ROC曲線、この場合、遺伝的リスクは、A)2型糖尿病、B)クローン病、及びC)関節リウマチに関して完全に知られている。赤色の曲線は、単独家族歴に基づく適性検査のための異価bに関する真及び偽陽性部分を示す。 A)クローン病、B)2型糖尿病、及びC)関節リウマチに関する単独の既知の遺伝的因子及び環境因子対既知の遺伝因子の影響を例示する。クローン病に関して、2つの曲線のAUCは0.68及び0.72である。遺伝因子に加えて、喫煙(相対リスク3)を環境変量とみなす。2型糖尿病に関して、2つの曲線のAUCは、それぞれ0.57及び0.79である(B)。遺伝因子に加えて、ボディーマスインデックス(相対リスク42.1)、アルコール摂取(相対リスク1.75)及び喫煙頻度(相対リスク1.70)を2型糖尿病の環境因子とみなす。関節リウマチに関して、2つの曲線のAUCは、0.685及び0.688である(C)。遺伝因子に加えて、喫煙(相対リスク1.4)が環境変量である。 A)2型糖尿病におけるGCI算定に関するGCIベースの平均生涯リスクと、仮定された生涯リスクの関数としての真の平均リスク(LTR’)の間の誤差。T2Dの真の平均リスク=0.25。B)GCIベースの平均生涯リスクと生涯リスク(LTR’)の間の誤差を仮定LTR’の関数としてのGCI算定に関して仮定する。
詳細な説明
本開示は、個体(単独)の自身のゲノムプロファイルの遺伝的組成に基づくリスク推定の開発方法を提供する。いくつかの実施形態では、推定は、個体のゲノムプロファイル又は遺伝的組成のみに基づき、すべてのその他の因子が固定されている。本明細書中に記載のリスク推定又はリスクスコアは、遺伝複合指数(GCI)とも呼ばれ、特徴の決定など臨床方針決定のガイドとなる任意型の遺伝的リスク因子の入力を伴って臨床現場で使用できる測定可能な尺度である。GCIは、平均生涯リスク、複数のリスク遺伝子座にわたるオッズ比情報、及び基準集団中の遺伝子型頻度の分布を伴う個体の遺伝子型に関する情報を、状態を発症する個体のリスクを表す1つの統合されたスコアに組み合わせる。より高いGCIスコアは、状態に関するより高いリスクとして直観的に解釈され得る。GCIは、以下に詳述されるいくつかの仮定に基づく。異なる条件下、GCIのロバスト性を試験するためのシミュレート・データ、並びに実際の遺伝子型及び臨床データも本明細書中に記載されている。いくつかの実施形態では、SNPの影響は、文献の中で統計学的に有意であることが示されている既知のSNP‐SNP相互作用が存在しない限り、独立している。弱いSNP‐SNP相互作用は予測性に有意に影響しないので、独立に関するこの仮定は、典型的には、我々のモデルの一般性に影響しない。
現在のリスク評価法は、予防薬プログラムに役立つリスク評価手段の開発の出発点を提供している。しかしながら、これらの異なる方法の質と有効性は、それらの起源及び実施、それらの理論的制限、及びそれらの優劣に依存する。例えば、受信者行動特性(ROC)曲線は、様々なリスク尺度の有効性を計測するのに使用される(例えばLu and Elston,Am.J.of Human Genetics,82:641‐651(2008)を参照のこと)。
例えばGCIが理論的に最適な試験であり、そして他方がリスク評価法であることを示すことによって、ROC曲線はさらに、GCIスコアを評価するためにも使用できる。例えば、異なる状態モデルは、すべての遺伝因子が既知である理想的な「最良の症例」シナリオ下で、そういった異なる方法(例えば、GCI対他のモデル)の予測力を算定するためにシミュレートされ得る。この理想的なリスク評価は、いくつかの因子、中でも遺伝率及び状態を発症する平均生涯リスクに依存する。典型的には、遺伝率が高いほど、単独で遺伝子型情報のみに基づくリスク評価が良い。同様に、平均生涯リスクは、一般に、集団内のリスク確率の変動に影響するので、そのため、理想的なリスク評価シナリオの精度に影響する。さらに、本明細書中に記載したGCIは、例えば遺伝因子又は環境因子などの多重因子が利用できない場合、例えば多重因子、例えば複数の一般的な病気などを同時に試験するように設計された大規模研究が利用できない場合などに使用できる。
ゲノムプロファイル
GCIは、個体のゲノムプロファイルに基づいて作成される。個体のゲノムプロファイルは、遺伝子変異又はマーカーに基づく個体の遺伝子に関する情報を含んでいる。遺伝子変異はゲノムプロファイルを構成する遺伝子型を形成し得る。このような遺伝子変異又はマーカーには、単一ヌクレオチド多型(SNP)、単一及び/又は複数のヌクレオチド反復、単一及び/又は複数のヌクレオチド欠失、マイクロサテライト反復(典型的には5〜1000反復単位を伴う少数のヌクレオチド反復)、ジヌクレオチド反復、トリヌクレオチド反復、配列再編成(転座及び複製を含む)、コピー数変異(特異的な遺伝子座の喪失と獲得の両方)等があるが、これだけに限定されるものではない。その他の遺伝子変異には、染色体複製及び転座、並びにセントロメア及びテロメア反復配列がある。
遺伝子型はまた、ハプロタイプとディプロタイプも包含し得る。いくつかの実施形態において、ゲノムプロファイルは少なくとも100000、300000、500000、又は1000000の遺伝子型を持つことができる。いくつかの実施形態において、ゲノムプロファイルは個体の実質的に完全なゲノム配列であり得る。他の実施形態では、ゲノムプロファイルは個体の完全ゲノム配列の少なくとも60%、80%、又は95%である。ゲノムプロファイルは個体の完全なゲノム配列のほぼ100%であることができる。標的を含む遺伝子サンプルは、増幅されていないゲノムDNA若しくはRNAサンプル又は増幅されたDNA(若しくはcDNA)を包含するが、これだけに限定されるものではない。標的は、特に興味深い遺伝子マーカーを含むゲノムDNAの特定領域であるかもしれない。
ゲノムプロファイルを得るために、個々の遺伝子サンプルを個体の生体サンプルから単離できる。生体サンプルには、RNA及び/又はDNAなどの遺伝物質を単離することが含まれる。そのような生体サンプルには、血液、毛髪、皮膚、唾液、精液、尿、糞便物質、汗、口腔粘膜、及び様々な身体組織が包含されるが、これだけに限定されるものではない。個体が組織サンプルを直接採取し、例えば口腔粘膜サンプルは個体が頬の内側に綿棒を当てることにより入手できる。唾液、精液、尿、糞便物質、又は汗などのその他のサンプルもまた、個体自身によって提供できる。その他の生体サンプルは、瀉血専門医、看護師又は医師などのヘルスケアの専門家によって採取され得る。例えば、血液サンプルは、看護師により個体から採血され得る。組織生検はヘルスケア専門家によって行われ、サンプルを効率的に入手するための市販キットもまたヘルスケア専門家に容易に入手できる。小円筒状の皮膚を採取することができ、又は針を使用して組織又は体液の少量サンプルを採取できる。
サンプル採集キットが個体に提供されることもある。このキットには個体の生体サンプルのためのサンプル採集コンテナが含まれ得る。このキットにはまた、個体が自身のサンプルを直接採集するための取扱説明書、例えばどのくらいの毛髪、尿、汗、又は唾液を提供するか、も個体に提供できる。キットにはまた、個体がヘルスケア専門家に組織サンプルの採取を要請するための取扱説明書が入っているかもしれない。キットには、サンプルが第三者により採取される場所が含まれており、例えば、キットがヘルスケア施設に提供され、次にその施設が個体からサンプルを集めることがある。キットはまた、サンプルがサンプル処理施設に送付されるための返送用梱包材をも提供でき、その施設で遺伝物質が生体サンプルから単離される。
いくつかの周知の生物化学的及び分子生物学的方法のいずれかに従ってDNA又はRNAの遺伝子サンプルが生体サンプルから単離できる。例えば、Sambrook,et al.,Molecular Cloning:A Laboratory Manual(Cold Spring Harbor Laboratory,New York)(1989)を参照のこと。生体サンプルからDNA又はRNAを単離するための市販キット及び試薬もまたいくつかあり、例えば、DNA Genotek、Gentra Systems、Qiagen、Ambion、及びその他の供給業者から入手できるものがある。口腔粘膜サンプルキットは、Epicentre Biotechnologies製のMasterAmp(商標)Buccal Swab DNA抽出キットなどが容易に商業的に入手でき、Sigma Aldrich製のExtract‐N‐Amp(商標)などの血液サンプルからのDNA抽出用キットもまた同様である。他の組織からのDNAは、組織をプロテアーゼと熱で消化し、サンプルを遠心分離し、フェノール‐クロロホルムを用いて不要物質を抽出し、水相にDNAを残すことによって得ることができる。次いでこのDNAをエタノール沈殿によってさらに単離できる。
例えば、ゲノムDNAを、DNA Genotek製のDNA自己採集キットを使用して唾液から単離できる。個体は、そのキットを使用して臨床処理のための唾液標本を採集でき、そして都合の良いことに、このサンプルは室温にて保存及び搬送することができる。サンプルが処理のための適当な検査所に送付された後、典型的には採集キットの供給業者によって供給された試薬を使用して、サンプルを50℃にて少なくとも1時間熱変性及びプロテアーゼ消化することによってDNAが単離される。次にこのサンプルを遠心分離し、上清をエタノール沈殿させる。このDNAペレットを、その後の分析に適した緩衝液中に懸濁する。
遺伝子サンプルとしてRNAを使用できる、例えば、発現される遺伝子変異はmRNAから特定できる。mRNAは、プレmRNA転写産物(群)、転写産物プロセシング中間体、翻訳の準備が整った成熟mRNA(群)及び、遺伝子若しくは遺伝子(群)の転写物、又はmRNA転写物(群)から誘導される核酸を包含するが、これだけに限定されるものではない。転写プロセシングは、スプライシング、編集及び分解を含むことができる。本明細書中で使用する、mRNA転写物から引き出した核酸とは、その合成のためにmRNA転写物又はその部分配列が最終的に鋳型として働く核酸を指す。よって、mRNAから逆転写されたcDNA、該cDNAから増幅されたDNA、増幅されたDNAから転写されたRNAなどはすべてmRNA転写物から誘導される。RNAは、当該技術分野で知られている方法、例えばPreAnalytiXから入手可能なPAXgene(商標)Blood RNAシステムを使用する未分画全血からのRNA単離などを使用して、いくつかの身体組織のいずれかから単離できる。典型的にはmRNAを用いてcDNAを逆転写し、次いでそれを遺伝子変異解析のために使用又は増幅する。
ゲノムプロファイルは遺伝子サンプルの増幅なしに遺伝子サンプルから作成されることもある。あるいは、ゲノムプロファイル解析に先立ち、遺伝子サンプルを、DNA又はRNAから逆転写されたcDNAのいずれかから増幅する。DNAはいくつかの方法で増幅でき、その多くはPCRを使用する。例えば、PCR Technology:Principles and Applications for DNA Amplification(Ed.H.A.Erlich,Freeman Press,NY,N.Y.,1992);PCR Protocols:A Guide to Methods and Applications(Eds. Innis,el al.,Academic Press,San Diego,Calif.,1990);Mattila et al.,Nucleic Acids Res.19,4967(1991);Eckert et al.,PCR Methods and Applications 1,17(1991);PCR(Eds.McPherson et al.,IRL Press,Oxford);並びに米国特許番号第4683202号、同第4683195号、同第4800159号、同第4965188号及び同第5333675号を参照のこと、あらゆる目的のためにこれらの各々の全文を本明細書中に援用する。
その他の好適な増幅法には、リガーゼ連鎖反応(LCR)(例えば、Wu and Wallace,Genomics 4,560(1989),Landegren et al.,Science 241,1077(1988)及びBarringer et al.,Gene 89:117(1990))、転写増幅(Kwoh et al.,Proc.Natl.Acad.Sci.USA 86:1173−1177(1989)及びWO88/10315)、自己持続配列複製(Guateili et al.,Proc.Nat.Acad.Sci.USA,87:1874‐1878(1990)及びWO90/06995)、標的ポリヌクレオチド配列の選択的増幅(米国特許番号第6410276号)、コンセンサス配列プライムドポリメラーゼ連鎖反応(CP‐PCR)(米国特許番号第4437975号)、任意にプライムされるポリメラーゼ連鎖反応(AP‐PCR)(米国特許番号第5413909号、同第5861245号)、核酸配列に基づく増幅(NASBA)、ローリングサークル増幅(RCA)、多置換増幅(MDA)(米国特許番号第6124120号及び同第6323009号)、並びにサークル‐トゥー‐サークル増幅(C2CA)(Dahl et al.,Proc.Natl.Acad.Sci.101:4548‐4553(2004))が挙げられる。(米国特許番号第5409818号、同第5554517号、及び同第6063603号を参照のこと、これらの各々を本明細書中に援用する。)利用できるその他の増幅法は、米国特許番号第5242794号、同第5494810号、同第5409818号、同第4988617号、同第6063603号及び同第5554517号、並びに米国特許出願番号第09/854317号に記載されており、これらの各々を本明細書中に援用する。
ゲノムプロファイルの作成は、いくつかの方法のうちのいずれかを使用することで実施される。遺伝子変異を特定する方法は当該技術分野ではいくつか知られており、いくつかの方法のうちいずれかの方法によるDNA配列決定、PCRに基づく方法、断片長多型アッセイ(制限断片長多型(RFLP)、開裂断片長多型(CFLP))、鋳型として対立遺伝子特異的なオリゴヌクレオチドを使用するハイブリダイゼーション法(例えばTaqManアッセイ及びマイクロアレイ。本明細書中で後ほど述べる。)、プライマー伸長反応を使用する方法、質量分析(例えばMALDI‐TOF/MS法)などがあるが(例えばKwok,Pharmocogenomics 1:95‐100(2000)に記載されている)、これだけに限定されるものではない。その他の方法には、インベーダー方法、例えばモノプレックス及びバイプレックスインベーダーアッセイ(例えば、Third Wave Technologies,Madison,WIより入手でき、Olivler et al.,Nucl.Acids Res.30:e53(2002)に記載されている)などが挙げられる。
例えば、ゲノムプロファイル作成に高密度DNAアレイを使用できる。そのようなアレイは、Asymetrix及びIllumina(Affymetrix GeneChip(登録商標)500K Assay Manual(Affymetrix,Santa Clara,CA)(本明細書中に援用する);Sentrix(登録商標)humanHap650Y遺伝子型決定ビーズチップ(Illumina,San Diego,CA)を参照のこと)から市販されている。高密度アレイは、SNPであるところの遺伝子変異を包含するゲノムプロファイル作成に使用できる。
例えば、SNPプロファイルは、Affymetrix Genome Wide Human SNP Array 6.0を使用して900000以上のSNPを遺伝子型決定することによって作成できる。あるいは、Affymetrix GeneChip Human Mapping 500K Array Setを使用することによって、全ゲノムサンプリング解析を通じて500000以上のSNPを決定することができる。これらのアッセイでは、ヒトゲノムの小集団を、制限酵素消化され、アダプターライゲーションされたヒトゲノムDNAを使用した単一プライマー増幅反応によって増幅する。典型的には、次いで、増幅されたDNAを断片化し、サンプルの品質を決定した後、コートされた石英表面の特定位置にDNAプローブを有するマイクロアレイへのハイブリダイゼーションのためにサンプルを変性させ、そして標識する。増幅されたDNA配列の関数として、それぞれのプローブにハイブリダイズする標識の量を監視し、それにより、配列情報及び得られるSNP遺伝子型を求める。
高密度アレイの使用は、当該技術分野で周知であるので、商業的に得られるのであれば、それを製造業者の指示とおりに実施する。例えば、Affymetrix GeneChipの使用は、単離されたゲノムDNAをNspI又はStyI制限エンドヌクレアーゼのいずれかで消化することを伴う。次に、消化したDNAを、それぞれNspI又はStyI制限消化されたDNAのいずれかとアニーリングするNspI又はStyIアダプターオリゴヌクレオチドとライゲーションする。次に、ライゲーション後のアダプター含有DNAをPCR増幅し、約200〜1100塩基対(ゲル電気泳動によって確認)の増幅DNA断片を得る。増幅基準に合致するPCR産物を断片化のために精製及び定量化する。このPCR産物を、最適なDNAチップハイブリダイゼーションのためにDNaseIで断片化する。断片化の後、ゲル電気泳動で確認したところ、DNA断片は250塩基対未満であり、平均して約180塩基対である。次に、断片化基準に合致するサンプルをターミナルデオキシヌクレオチジルトランスフェラーゼを使用してビオチン化合物で標識する。次に、標識された断片を変性させ、GeneChip 25OKアレイにハイブリダイズさせる。ハイブリダイゼーション後、アレイを染色し、ストレプトアビジン・フィコエリスリン(SAPE)染色、次いでビオチン化抗ストレプトアビジン抗体(ヤギ)による抗体増幅ステップ、及びストレプトアビジン・フィコエリスリン(SAPE)による最終染色より成る三ステップ工程でスキャンする。標識後、アレイをアレイ保持緩衝液で被覆し、例えばAffymetrix GeneChip Scanner 3000などのスキャナでスキャンする。
製造業者の指針に従い、高密度アレイのスキャンに従うデータ解析を実施する。例えば、Affymetrix GeneChipと共に、GeneChip Operating Software(GCOS)の使用によって、又はAffymetrix GeneChip Command Console(商標)を使用することによって生データを獲得できる。生データを獲得した後、GeneChip Genotyping Analysis Software(GTYPE)で解析をおこなう。特定のパーセンテージを下回るGTYPEコールレートのサンプルを除外することもできる。例えば、約70、75、80、85、90、又は95%未満のコールレートを除外することもできる。次に、サンプルをBRLMM及び/又はSNiPerアルゴリズム解析で調べる。95%未満のBRLMMコールレート又は98%未満のSNiPerコールレートのサンプルは除外する。最後に、関連性解析を実施し、0.45未満のSNiPer品質指数及び/又は0.00001未満のHardy‐Weinberg p値を有するサンプルを除外する。
マイクロアレイ解析に代わって、又はこれに加えて、他のハイブリダイゼーションに基づく方法、例えばTaqMan法及びその変法などを使用することによって、SNPや突然変異などの遺伝子変異が検出できる。TaqMan PCR、反復TaqMan、及びリアルタイムPCR(RT‐PCR)のその他の変法(例えばLivak et al.,Nature Genet.,9,341‐32(1995)及びRanade et al.,Genome Res.,11,1262‐1268(2001)に記載されている)を本明細書中に開示する方法に利用できる。いくつかの実施形態において、特定の遺伝子変異、例えばSNPなどのためのプローブを標識してTaqManプローブを作製する。このプローブは典型的には少なくとも約12、15、18又は20塩基対の長さである。これらは約10〜70、15〜60、20〜60、又は18〜22塩基対長であってよい。このプローブを、レポーター標識、例えばフルオロフォアで5’末端を、そして3’末端を該標識のクエンチャーで標識する。レポーター標識は、クエンチャーに非常に接近すると、例えば該プローブの長さ程に接近するとその蛍光が阻害又はクエンチされる任意の蛍光分子であってもよい。例えば、レポーター標識は、6‐カルボキシフルオレセイン(FAM)、テトラクロロフルオレセイン(TET)又はその誘導体などのフルオロフォアであってもよく、クエンチャーはテトラメチルローダミン(TAMRA)、ジヒドロシクロピロロインドールトリペプチド(MGB)又はその誘導体であってもよい。
レポーターフルオロフォア及びクエンチャーがプローブの長さ分だけ隔てられて接近すると、蛍光はクエンチされる。プローブが標的配列、例えばサンプル中のSNPを含む配列とアニーリングするとき、5’から3’へのエキソヌクレアーゼ活性を有するDNAポリメラーゼ、例えばTaqポリメラーゼなどがプライマーを伸長させ、エキソヌクレアーゼ活性がプローブを開裂させ、レポーターをクエンチャーから分離し、その結果レポーターが蛍光を発する。このプロセスは、例えばRT‐PCRなどにおいて反復される。TaqManプローブは、典型的には、配列を増幅するように設計された2つのプライマー間に位置する標的配列と相補的である。よって、各プローブが新たに作製されたPCR産物とハイブリダイズできるため、PCR産物の蓄積が、放出されるフルオロフォアの蓄積と相関し得る。放出されるフルオロフォアを計測し、存在する標的配列の量を決定できる。高速大量処理遺伝子型決定のためのRT‐PCR法を利用できる。
遺伝子変異はまた、DNA配列決定によっても特定できる。DNA配列決定を利用して個体のゲノム配列のかなりの部分又は全体の配列決定ができる。伝統的には、一般的なDNA配列決定は、ポリアクリルアミドゲル分画化に基づいて鎖終止断片の集団を分解してきた(Sanger et al.,Proc.Natl.Acad.Sci.USA 74:5463‐5467(1977))。DNA配列決定の速度及び容易さを高める代替法が開発されており、且つ、その開発が続いている。例えば、高速大量処理及び単分子配列決定プラットフォームが、454 Life Sciences(Branford,CT)(Margulies et al.,Nature 437:376‐380(2005));Solexa/Illumina(Hayward,CA);Helicos BioSciences Corporation(Cambridge,MA)(2005年6月23日付で出願された米国特許出願番号第11/167046号)、及びLi‐Cor Biosciences(Lincoln,NE)(2005年4月29日付で出願された米国特許出願番号第11/118031号、)から市販されているか、又は開発中である。
個体のゲノムプロファイルを作成した後、このプロファイルを、例えばコンピューターが読み取り可能なメディアなどにデジタル保存する。このプロファイルをセキュリティーで保護された様式でデジタル保存することもできる。このゲノムプロファイルを、例えばコンピューターが読み取り可能なメディアなどにデータセットの一部として保存するためにコンピューターが読み取り可能な形式でコード化してデータベースとして保存するが、その場合、ゲノムプロファイルは「預けられ(banked)」、後に再びアクセスすることができる。このデータセットは複数のデータ点を含んでなり、ここで各データ点はある個体に関連している。各データ点は複数のデータ要素を持つことができる。1個のデータ要素は一意的な識別子であり、個体のゲノムプロファイルの特定に利用される。その一意的な識別子はバーコードであってもよい。別のデータ要素は遺伝子型情報、例えばSNPs又は個体のゲノムのヌクレオチド配列などである。遺伝子型情報に対応するデータ要素もまた、データ点に包含されていてもよい。例えば、遺伝子型情報がマイクロアレイ解析により特定されたSNPを含む場合、他のデータ要素は、マイクロアレイSNP識別番号を包含し得る。あるいは、遺伝子型情報が他の手段、例えばRT‐PCR法(例えばTaqManアッセイなど)などによって特定された場合、データ要素は蛍光レベル、プライマー情報、及びプローブ配列を包含し得る。他のデータ要素は、SNP rs番号、多型ヌクレオチド、遺伝子型情報の染色体位置、データの品質測定法、生データファイル、データの画像、及び抽出された強度スコアを包含し得るが、これだけに限定されるものではない。
例えば身体データ、医療データ、民族性、祖先、地理、性別、年齢、家族歴、既知の表現型、人口統計データ、暴露データ、ライフスタイルデータ、行動データ、及びその他の既知の表現型などの個体の特異的因子もまたデータ要素として組み込むことができる。例えば因子には、個体の出生地、両親及び/又は祖父母、血縁者の祖先、居住地、祖先の居住地、環境条件、既知の健康状態、既知の薬物相互作用、家族の健康状態、ライフスタイル状況、食生活、運動習慣、結婚歴、及び身体計測値、例えば、体重、身長、コレステロールレベル、心拍数、血圧、グルコースレベル、及び当該技術分野で知られているその他の測定値が包含されるがこれだけに限定されるものではない。個体の血縁者又は祖先、例えば両親や祖父母などについての上記因子をデータ要素として組み込み、表現型又は状態に関する個体のリスクを決定するために利用することもできる。
特別な因子がアンケート又は個体のヘルスケア管理者から得られることがある。その場合、「預けられた」プロファイルからの情報にアクセスし、所望により利用することができる。例えば、個体の遺伝子型相関を最初に評価する場合、その個体の全情報(典型的には、ゲノム全体にわたる又はゲノム全体から入手した、SNP又はその他のゲノム配列)が遺伝子型相関について解析される。その後の解析では、保存された若しくは預けられたゲノムプロファイル由来の情報全体、又はその一部に、希望に応じて、又は必要に応じてアクセスすることができる。
相関と表現型プロファイル
ゲノムプロファイルは、表現型プロファイルを作成するのに使用される。このゲノムプロファイルは、典型的には、デジタル保存され、表現型プロファイルを作成する任意の時点で容易にアクセスされる。表現型プロファイルは、遺伝子型を表現型と相関させ又は関連づける規則を適用することによって作成される。典型的には、その規則はコンピュータを使用して適用される。規則は、遺伝子型と表現型との相関を実証する科学的研究に基づいて作成できる。相関は、1人又はそれ以上の専門家による委員会により監督又は検証される。個体のゲノムプロファイルに規則を適用することにより、個体の遺伝子型と表現型との関連性が決定できる。個体の表現型プロファイルはこの決定を有することになる。その決定は、該個体が所定の表現型を有する、又はその表現型を発現するであろうという、個体の遺伝子型及び所定の表現型の間の明らかな関連性であってもよい。あるいは、その個体が所定の表現型を持たない、又は発現しないであろう、という決定がなされてもよい。他の実施形態では、この決定は、個体がある表現型を有する、又は発現するであろうというリスク因子、推定、又は確率であってもよい。
この決定は、いくつかの規則に基づいておこなうことができ、例えば、複数の規則をゲノムプロファイルに適用して、個体の遺伝子型と特定の表現型の関連性を決定することができる。この決定はまた、個体に特有の因子、例えば民族性、性別、ライフスタイル(例えば食習慣や運動習慣)、年齢、環境(例えば居住地)、家族の既往歴、及びその他の既知の表現型などを組み込むこともできる。この特有の因子の組み入れは、これらの因子を包含する既存の規則を修正することによるものであってもよい。あるいは、これらの因子によって別個の規則を作成し、既存の規則を適用した後に個体の表現型決定に適用することもできる。
表現型には任意の計測可能な形質又は特徴、例えば特定の疾患への感受性若しくは薬物療法に対する応答などを包含することができる。包含され得るその他の表現型は、身体的及び精神的特徴、例えば身長、体重、毛髪の色、目の色、日焼けに対する感受性、体格、記憶、知性、楽観主義のレベル、及び一般気質などである。表現型はまた、他の個体又は生物との遺伝的比較をも包含し得る。例えば、個体は自身のゲノムプロファイルと著名人のゲノムプロファイルの類似性に興味を持つかもしれない。彼らのゲノムプロファイルはまた、細菌、植物又は他の動物などの他の生物と比較させることもできる。同時に、個体に関して決定される相関表現型のコレクションには、個体に関する表現型プロファイルが包含される。
遺伝子変異と表現型の相関を、科学文献から入手する。遺伝子変異についての相関を、着目の1若しくは複数の表現型形質の有無について、そしてそれらの遺伝子型プロファイルについて検査された個体集団の解析から決定する。それぞれの遺伝子変異の対立遺伝子又はそのプロファイル中の多型を再検討し、特定の対立遺伝子の有無が着目の形質と関連するかどうかを決定する。相関づけは標準的な統計学的方法によって実施でき、遺伝子変異と表現型の特徴の間の統計学的に有意な相関を記録する。例えば、多型Aの対立遺伝子A1の存在は心臓病と相関していることが決定づけられるかもしれない。更なる例として、多型Aにおける、対立遺伝子A1と多型Bにおける対立遺伝子B1の共存が、癌のリスク増加と相関することがわかるかもしれない。解析結果は専門家の検討する文献に発表され、他の研究グループによって検証され、及び/又は専門家、例えば遺伝学者、統計学者、疫学者及び医師などから成る委員会により解析され、さらには監督されることもある。例えば、米国特許公開番号第20080131887及びPCT公報第WO/2008/067551号(両文献の全体を本明細書中に援用する)に開示されている相関を、本明細書中に記載の実施形態に使用することもできる。
あるいは、相関は保存されたゲノムプロファイルから作成されることもできる。例えば、保存されたゲノムプロファイルを持つ個体はまた、既知の表現型情報も同様に保存させることができる。この保存されたゲノムプロファイル及び既知表現型の解析が、遺伝子型相関を生じることもある。一例として、保存されたゲノムプロファイルを有する250人の個体が、過去に糖尿病と診断されたという保存された情報も持っている。それらのゲノムプロファイルの解析をおこない、糖尿病のなし対照個体群と比較する。次に、過去に糖尿病と診断された個体が、対照群と比較して特定の遺伝子変異体を有する率が高いことを決定づけ、その特定の遺伝子変異体と糖尿病の間に遺伝子型相関が作成され得る。
特定の表現型に対する遺伝子変異体の検証された相関に基づいて規則を作成する。規則は、米国特許公開番号第20080131887号及びPCT公報第WO/2008/067551号に開示されているように、相関している遺伝子型と表現型に基づいて作成することもでき、そしていくつかの規則は、効果推定値を作成するため、その他の要素、例えば性別又は民族性などを組み込むであろう。規則から導かれる他の尺度は、相対リスク上昇推定値がある。効果推定値と相対リスク上昇推定値は、公表文献によるものであってよく、又はその公表文献から算出されるものであってもよい。あるいは、規則は、保存されているゲノムプロファイル及び過去に判明した表現型から作成される相関に基づいていてもよい。
遺伝子変異はSNPを包含することもできる。SNPは単一の部位に存在するが、1ヶ所の部位に特定のSNP対立遺伝子を有する個体は他の部位に特定のSNP対立遺伝子を有すると予想されることが多い。SNPと、個体を疾患又は症状に陥らせ易くする対立遺伝子の相関は、連鎖不平衡によって起こり、その場合、2又はそれ以上の遺伝子座における対立遺伝子の非ランダムな関連性が、組み換えを介したランダムな形成から予想されるよりも、より頻繁に集団に起こる。
その他の遺伝子マーカー又は変異体、例えばヌクレオチド反復若しくは挿入などもまた、特定の表現型と関連していることが示されている遺伝子マーカーと連鎖不平衡であることがある。例えば、あるヌクレオチド挿入がある表現型に相関し、あるSNPがあるヌクレオチド挿入と連鎖不平衡にある。このSNPと表現型の間の相関に基づいて規則が作成できる。このヌクレオチド挿入と表現型の間の相関に基づく規則もまた作成できる。1個のSNPの存在があるリスク因子を与え、別のSNPの存在が別のリスク因子を与え、そしてそれらが組み合わせられると、リスクを増強し得るといったように、いずれかの規則又は両方の規則をゲノムプロファイルに適用できる。
連鎖不平衡を通じて、ある疾患にかかりやすくする対立遺伝子は、SNPの特定の対立遺伝子又はSNPの特定の対立遺伝子の組み合わせと一緒に分離する。染色体に沿ったSNP対立遺伝子の特定の組み合わせをハプロタイプと呼び、それらが組み合わさって存在するDNA領域をハプロタイプブロックと呼ぶことができる。ハプロタイプブロックは、1個のSNPで構成され得るが、典型的にはハプロタイプブロックは、個体間でのハプロタイプ多様性の低い、且つ一般に組み換え頻度の低い、連続した2又はそれ以上のSNPを表す。ハプロタイプの特定は、あるハプロタイプブロックに存在する1若しくは複数のSNPを特定することによっておこなうことができる。よって、典型的には、SNPプロファイルを使用して、所定のハプロタイプブロック中のすべてのSNPの特定を必ずしも必要とせずに、ハプロタイプブロックを特定することができる。
SNPハプロタイプパターンと疾患、状態又は身体状態の間の遺伝子型相関が次第に判明しつつある。所定の疾患について、その疾患を患っているとわかっている人々の群のハプロタイプパターンを、該疾患を患っていない人々の群と比較する。多くの個体を解析することによって、集団における多型の頻度を決定し、次にこれらの頻度又は遺伝子型を特定の表現型、例えば疾患若しくは状態と関連づけることができる。既知のSNP‐疾患相関の例には、加齢性黄斑変性症における補体因子Hの多型(Klein et al.,Science:308:385‐389(2005))及び肥満に関連するINSIG2遺伝子近傍の変異体(Herbert et al.,Science:312:279‐283(2006))がある。その他の既知のSNP相関には、CDKN2A及びBを包含する9p21領域の多型、例えば心筋梗塞に相関するrs10757274、rs2383206、rs13333040、rs2383207、及びrs10116277がある(Helgadottir et al.,Science 316:1491‐1493(2007);McPherson et al.,Science 316:1488‐1491(2007))。
SNPは機能的であるか又は非機能的であるかもしれない。例えば、機能的なSNPは、細胞機能に影響を及ぼし、その結果、表現型をもたらすが、それに対して非機能的なSNPは、機能の点で沈黙しているが機能的なSNPと連鎖不平衡にあることがある。SNPはまた、同義的であることも非同義的であることもある。同義的であるSNPとは、異なった形態が同じポリペプチド配列を導くSNPであり、そしてそれは非機能的なSNPである。SNPが異なるポリペプチドを導く場合、そのSNPは非同義的であり、機能的であることもそうでないこともある。2又はそれ以上のハプロタイプであるディプロタイプの中のハプロタイプを特定するのに用いられるSNP又はその他の遺伝子マーカーもまた、ディプロタイプに関連する表現型の相関づけに利用できる。個体のハプロタイプ、ディプロタイプ、及びSNPプロファイルに関する情報は、その個体のゲノムプロファイルの中にあり得る。
典型的には、ある表現型と相関している別の遺伝子マーカーと連鎖不平衡にある遺伝子マーカーに基づいて規則が作成されるためには、その遺伝子マーカーは、当該技術分野において連鎖不平衡を決定するのに一般的に使用されるスコアである、r2又はD’スコアが0.5より大きい。スコアは、約0.5、0.6、0.7、0.8、0.90、0.95又は0.99超であり得る。その結果、個体のゲノムプロファイルに表現型を相関させるのに使用される遺伝子マーカーは、表現型と相関する機能的又は公表されたSNPと同じであってもよいし異なっていてもよい。いくつかの実施形態では、試験SNPはまだ特定できていないが、公表されたSNP情報を使用して、対立遺伝子の相違又はSNPを別のアッセイ、例えばTaqManなどに基づいて特定することもできる。例えば、公表されたSNPはrs1061170であるが、試験SNPは特定されていない。試験SNPは、公表されたSNPを用いたLD解析によって特定することもできる。あるいは、試験SNPを使用できず、代わりにTaqMan又はその他の類似のアッセイが試験SNPを持っている個体のゲノムを評価するのに使用される。
試験SNPは「直接的(DIRECT)」又は「タグ(TAG)」SNPであってもよい。直接的SNPは、公表されたか又は機能的なSNPと同じ試験SNPである。例えば、直接的SNPは、ヨーロッパ人及びアジア人におけるSNP rs1073640(マイナーな対立遺伝子はAであり、他の対立遺伝子はGである)を利用して、FGFR2と乳癌の相関に使用にも利用できる(Easton et al.,Nature 447:1087‐1093(2007))。ヨーロッパ人及びアジア人におけるFGFR2と乳癌の相関に関する直接的SNPになりうるもう一つの公表された又は機能的なSNPはrs1219648である(Hunter et al.,Nat.Genet.39:870‐874(2007))。タグSNPは、試験SNPが機能的であるか又は公表されたSNPのそれと異なっているところである。タグSNPはまた、CAMTA1(rs4908449)、9p21(rs10757274、rs2383206、rs13333040、rs2383207、rs10116277)、COL1A1(rs1800012)、FVL(rs6025)、HLA‐DQA1(rs4988889、rs2588331)、eNOS(rs1799983)、MTHFR(rs801133)、及びAPC(rs28933380)のSNPなどのその他の遺伝子変異体にも利用できる。
SNPのデータベースは、例えば国際HapMapプロジェクト(www.hapmap.org,The International HapMap Consortium,Nature 426:789‐796(2003)、及びThe International HapMap Consortium,Nature 437:1299‐1320(2005)を参照のこと)、the Human Gene Mutation Database(HGMD)公開データベース(www.hgmd.orgを参照のこと)、及びSingle Nucleotide Polymorphismデータベース(dbSNP)(www.ncbi.nlm.nih.gov/SNP/を参照されたい)から公的に入手可能である。これらのデータベースは、SNPハプロタイプを提供するか、又はSNPハプロタイプパターンの決定を可能にする。したがって、これらのSNPデータベースにより、広範囲の疾患及び状態、例えば癌、炎症性疾患、心臓血管疾患、神経変性疾患、及び感染症などの根底に存在する遺伝的リスク因子の調査を可能にする。その疾患又は症状は、処置及び治療法が現在存在する、対処可能なものであるかもしれない。処置には、予防的処置、並びにライフスタイルの変更を包含する、症状及び状態を改善する処置が包含され得る。
身体的形質、生理的形質、精神的形質、情緒的形質、民族性、祖先、及び年齢などのその他の多くの表現型もまた調べることができる。身体的形質には、身長、髪の色、目の色、身体、又は形質、例えば持久力、耐久力、及び敏捷性などがある。精神的形質には、知性、記憶力、又は学習能力がある。民族性及び祖先には、祖先若しくは民族性の特定、又は個体の祖先の起源がどこであるかが包含される。年齢は、個体の実年齢の決定であることもあり、又は個体の遺伝的特徴が一般集団に対して該個体を位置づける年齢の決定であることもある。例えば、個体の実年齢は38歳であるが、その遺伝的特徴は、記憶力や身体の健康が平均28歳のものであると決定づけることがある。もう一つの年齢形質は、個体の推定寿命であり得る。
他の表現型はまた、非医学的状態、例えば「おもしろい」表現型なども包含し得る。これらの表現型は、周知の個体、例えば外国の要人、政治家、著名人、発明家、運動選手、音楽家、芸術家、実業家など、及び悪名高い個体、例えば囚人などとの比較を包含し得る。その他の「おもしろい」表現型は、他の生物、例えば細菌、昆虫、植物、又はヒト以外の動物などとの比較を包含し得る。例えば、個体は、自身のゲノムプロファイルが自分たちのペットのイヌ、又は元大統領のゲノムプロファイルと比較してどうなのかを知ることに興味を持つかもしれない。
預けられたゲノムプロファイルに規則を適用して、表現型プロファイルを作成する。例えば、公表された源からの、又は預けられたゲノムプロファイルからの相関データは、個体のゲノムプロファイルに適用するための規則又は試験の基礎を形成する。この規則は、試験SNP及び対立遺伝子に関する情報、及び効果推定値、例えばORなど、又はオッズ比(95%信頼区間)若しくは平均値を包含することもできる。効果推定値は、遺伝子型リスク、例えば同型接合体にとってのリスク(homoz又はRR)、異型接合体にとってのリスク(heteroz又はRN)、及び同型接合体にとっての非リスク(homoz又はNN)などであってよい。効果推定値はまた、保因者のリスクであってもよく、それはRR又はRN対NNである。効果推定値は、対立遺伝子、対立遺伝子リスク、例えばR対Nに基づいていてもよい。2、3、4つ、又はそれ以上の遺伝子座の遺伝子効果推定値(例えば二遺伝子座効果推定値のための9個の可能な遺伝子型組み合わせについては、RRRR、RRNNなど)もまたあり得る。
ある状態についての推定リスクは、米国特許出願公開番号第20080131887号及びPCT公報第WO2008/067551号に列挙されるSNPに基づくものであってよい。いくつかの実施形態では、ある状態についてのリスクは少なくとも1個のSNPに基づくものであってよい。例えば、アルツハイマー(AD)、結腸直腸癌(CRC)、骨関節炎(OA)又は落屑緑内障(XFG))についての個体リスク評価は1SNPに基づくものであり得る(例えば、ADについてはrs4420638、CRCについてはrs6983267、OAについてはrs4911178、及びXFGについてはrs2165241)。肥満(BMIOB)、バセドウ病(GD)、又は血色素症(HEM)などのその他の状態については、個体の推定リスクは少なくとも1又は2個のSNPに基づくものであり得る(例えば、BMIOBについてはrs9939609及び/又はrs9291171;GDについてはDRB1*0301 DQA1*0501及び/又はrs3087243;HEMについてはrs1800562及び/又はrs129128)。心筋梗塞(MI)、多発性硬化症(MS)、又は乾癬(PS)など(これだけに限定されるものではない)の状態については、1、2又は3個のSNPを使用してこれらの状態については個体リスクを評価できる(例えば、MIについてはrs1866389、rs1333049、及び/又はrs6922269;MSについてはrs6897932、rs12722489、及び/又はDRB1*1501;PSについてはrs6859018、rs11209026、及び/又はHLAC*0602)。ムズムズ脚症候群(RLS)又はセリアック病(CelD)の個体リスク評価には、1、2、3、又は4個のSNP(例えば、RLSについてはrs6904723、rs2300478、rs1026732、及び/又はrs9296249;CelDについてはrs6840978、rs11571315、rs2187668、及び/又はDQA1*0301 DQB1*0302)。前立腺癌(PC)又はループス(SLE)については、1、2、3、4、又は5個のSNPを使用してPC又はSLEの個体リスクを評価できる(例えば、PCについてはrs4242384、rs6983267、rs16901979、rs17765344、及び/又はrs4430796;SLEについてはrs12531711、rs10954213、rs2004640、DRB1*0301、及び/又はDRB1*1501)。個体の黄斑変性症(AMD)又は関節リウマチ(RA)についての生涯リスク)を評価するには、1、2、3、4、5、又は6個のSNPを使用できる(例えば、AMDについてはrs10737680、rs10490924、rs541862、rs2230199、rs1061170、及び/又はrs9332739;RAについてはrs6679677、rs11203367、rs6457617、DRB*0101、DRB1*0401、及び/又はDRB1*0404)。個体の乳癌(BC)についての生涯リスクを評価するには、1、2、3、4,5、6又は7個のSNPを使用できる(例えば、rs3803662、rs2981582、rs4700485、rs3817198、rs17468277、rs6721996、及び/又はrs3803662)。個体のクローン病(CD)又は2型糖尿病(T2D)についての生涯リスクを評価するには、1、2、3、4、5、6、7、8、9、10、又は11個のSNPを使用できる。(例えば、CDについてはrs2066845、rs5743293、rs10883365、rs17234657、rs10210302、rs9858542、rs11805303、rs1000113、rs17221417、rs2542151、及び/又はrs10761659;T2Dについてはrs13266634、rs4506565、rs10012946、rs7756992、rs10811661、rs12288738、rs8050136、rs1111875、rs4402960、rs5215、及び/又はrs1801282)。いくつかの実施形態では、リスク決定の基礎として使用されるSNPは、上記のSNP又は米国特許出願公開番号第20080131887号及びPCT公報第WO2008/067551号に記載のようなその他のSNPと連鎖不平衡にあることもある。
個体の表現型プロファイルはいくつかの表現型を含み得る。特に、本明細書中に開示された方法による、疾患又はその他の状態、例えば代謝、有効性及び/又は安全を包含する起こり得る薬物反応などについての患者のリスク評価は、症候のある、又は前駆症候のある、又は無症候の個体にかかわらず、1若しくは複数の疾患/状態誘発対立遺伝子の保因者を包含する個体において、症候のある、又は前駆症候のある、又は無症候の個体における、複数の無関係の疾患及び状態への感受性の予後又は診断的解析を可能にする。したがって、これらの方法は、特定の疾患又は症状の検査についての先入観なしに、疾患又は症状に対する個体の感受性の一般評価を提供する。例えば、本明細書中に開示した方法は、個体のゲノムプロファイルに基づいて、米国特許出願公開第20080131887号及びPCT公報第WO2008/067551号で列挙されているいくつかの状態のいずれかに対する個体の感受性評価を可能にする。さらに、この方法は、1若しくは複数の表現型又は状態に関する個体の推定される生涯リスク又は相対リスクの評価を可能にする。
この評価は、これらの状態のうち2又はそれ以上、これらの状態のうちの少なくとも3、4、5、10、15、18、20、25、30、35、40、45、50、100又はそれ以上に関する情報を提供する。表現型についての1個の規則を、単一遺伝子表現型に適用できる。2以上の規則を1個の表現型、例えば多遺伝子表現型又は単一遺伝子表現型などに適用することもでき、この場合、1個の遺伝子の中にある複数の遺伝子変異体がその表現型を持っている確率に影響する。
個々の患者のゲノムプロファイルの初期スクリーニングに続いて、さらなる遺伝子変異体が判明した場合、そのさらなる遺伝子変異体、例えばSNPなどと比較することにより、個体の遺伝子型相関の更新をおこなう(又はそれが入手できる)。例えば、更新は、新しい遺伝子型相関について科学文献を精査する、遺伝学分野において通常の技量を有する1人又はそれ以上の人々が、定期的に、例えば、毎日、毎週、又は毎月実施することができる。次いで、この新しい遺伝子型相関を、1人又はそれ以上の当該技術分野の専門家がさらに検証できる。
新しい規則は、既存の規則を持たない遺伝子型又は表現型を包含することができる。例えば、いかなる表現型とも相関していない遺伝子型が、新たな又は既存の表現型と相関していることが発見される。新しい規則はまた、過去にいずれの遺伝子型も相関していなかった表現型との相関についてのものであってもよい。新しい規則はまた、既存の規則を持っている遺伝子型及び表現型について決定されることもできる。例えば、遺伝子型A及び表現型Aの間の相関に基づく規則が存在する。新たな研究により、遺伝子型Bが表現型Aと相関することが明らかになり、この相関に基づいて新しい規則が作られる。別の例では、表現型Bが遺伝子型Aに関連していることが発見され、それよって新しい規則を作成することができる。
既知の、但し公表された科学文献では当初特定できなかった相関に基づく発見に関しても規則が作られることもある。例えば、遺伝子型Cが表現型Cと相関していることが報告される。別の刊行物は、遺伝子型Dが表現型Dと相関していることを報告する。表現型C及びDは関連症状、例えば表現型Cが息切れであり、表現型Dが小さい肺活量である。遺伝子型C及びD、並びに表現型C及びDを持つ個体の既存の預けられたゲノムプロファイルを用いる統計学的手段によって、又はさらなる研究によって、遺伝子型Cと表現型D、又は遺伝子型Dと表現型Cの間の相関が発見され、検証され得る。そして、新しく発見され検証された相関に基づいて、新しい規則が作成できる。他の実施形態では、特定の又は関連する表現型を持ついくつかの個体の預けられたゲノムプロファイルを調査し、それらの個体に共通な遺伝子型を決定し、相関を決定することができる。この相関に基づいて新しい規則が作成され得る。
既存の規則を修正するためにも規則が作成されることもある。例えば、遺伝子型と表現型の間の相関は、既知の個々の特徴、例えば該個体の民族性、祖先、地理、性別、年齢、家族歴、又はその他の任意の既知表現型などによっても部分的に決定できる。これらの既知の個々の特徴に基づいて規則を作成し、既存の規則に組み入れ、修正された規則を提供することができる。適用されるべき修正された規則の選択は、個体の特定の個々の因子に依存するであろう。例えば、個体が遺伝子型Eを持っている場合、表現型Eを持っている個体が35%であるという確率に基づいて規則を作成できる。しかしながら、ある個体が特定の民族性を有する場合、その確率は5%である。この結果に基づいて新しい規則を作成し、その特定の民族性を持つ個体に適用することができる。あるいは、35%という決定を含む既存の規則は適用し、次に該表現型について、民族性に基づく別の規則を適用することもできる。既知の個々の特徴に基づく規則は、科学文献から決定するか、又は預けられたゲノムプロファイルの研究に基づいて決定することもできる。新しい規則が作成されたときに、新しい規則をゲノムプロファイルに追加し、且つ、適用してもよいし、それらを定期的に、例えば年に一度、適用してもよい。
科学技術の進歩がより洗練されたSNPゲノムプロファイルの解明を可能にしているため、個体の疾患リスクに関する情報もまた拡大され得る。先に示したように、初期SNPゲノムプロファイルは500000個のSNPをスキャンするマイクロアレイ技術を使用することで容易に作成できる。ハプロタイプブロックの性質を考慮すると、この数によって、個体ゲノム中のすべてのSNPの代表的なプロファイルの入手が可能である。それにもかかわらず、ヒトゲノムには約1000万個のSNPがあると推定されている(国際HapMapプロジェクト;www.hapmap.org)。1000000、1500000、2000000、3000000個又はそれ以上のSNPのマイクロアレイ、又は全ゲノム配列決定などのように、科学技術の進歩が、実用的で費用効率の高いSNPの解析をより洗練された詳細度で可能にするため、より詳細なSNPゲノムプロファイルが作成できる。同様に、費用効率の高い、より洗練されたSNPゲノムプロファイル解析及びSNP‐疾患相関に関するマスターデータベースへの更新が、コンピュータ解析法の進歩によって可能になる。
いくつかの実施形態では、「現場配置(field−deployed)」メカニズムを個体から収集し、個体のための表現型プロファイルに組み入れることもできる。例えば、ある個体は遺伝情報に基づいて初期表現型プロファイルを作成させることができる。作成された初期表現型プロファイルには、種々の表現型についてのリスク因子及び個人の行動プランの中で報告される、推奨される処置又は予防措置が含まれる。そのプロファイルは、特定の状態のために利用可能な薬物療法に関する情報、及び/又は食生活の変更又は運動レジメンに関する提案)を含み得る。その個体は、自信の表現型プロファイルについて相談するために、医師又は遺伝カウンセラーに面会するか、又はウェブポータル若しくは電話により連絡を取るかを選ぶことができる。その個体は、例えば、特別な薬剤治療をする、食生活を変えるなど、いずれかの一連の行動を取る決意をすることもある。次に、その個体は、それに続いて自身の身体状態の変化及びリスク因子に起こり得る変化を評価するために生体サンプルを提出し得る。
個体は、ゲノムプロファイル及び表現型プロファイルを作成する設備(又は関連施設、例えば遺伝子プロファイル及び表現型プロファイルを作成する事業体と契約した施設など)に生体サンプルを直接提出することによって、変化を決定してもらうことができる。あるいは、その個体は、「現場配置」メカニズムを使用でき、その場合、個体は唾液、血液、又はその他の生体サンプルを自宅の検出装置にかけ、第三者に解析させ、そしてそのデータを送信して別の表現型プロファイルに組み入れることができる。例えば、ある個体が、遺伝データに基づいて心筋梗塞(MI)の生涯リスクが高いと報告する初期表現型報告を受け取ったかもしれない。その報告にはまた、MIのリスクを低減するための予防措置についての提案、例えばコレステロール低下薬及び食物の変更なども記載されていることもある。その個体は、遺伝カウンセラー又は医師に連絡をとり、その報告と予防措置について相談することを選ぶことができ、そして食生活を変えようと決める。新たな食生活でしばらく過ごした後に、その個体は、かかりつけの医師の診察を受け、コレステロールレベルを計測してもらうことができる。ゲノム情報を持っている事業体に新しい情報(コレステロールレベル)が(例えばインターネットを介して)伝えられ、そしてこの新しい情報が、心筋梗塞及び/又はその他の状態に関する新しいリスク因子を伴う該個体の新しい表現型プロファイルの作成に利用される。
個体はまた、特定の薬剤に対する自身の個々の応答を決定するために「現場配置」メカニズム又は直接メカニズムを使用することもできる。例えば、個体は、ある薬物に対する自身の応答を計測してもらい、その情報を利用して、より効果的な処置を決定することができる。計測可能な情報には、代謝物レベル、グルコースレベル、イオンレベル(例えば、カルシウム、ナトリウム、カリウム、鉄)、ビタミン、血球数、ボディーマスインデックス(BMI)、タンパク質レベル、転写物レベル、心拍数などがあり(但しこれだけに限定されるものではない)、これらをで容易に実施可能な方法で測定し、アルゴリズム上で要因として考慮して、初期ゲノムプロファイルと組み合わせて、修正された総合的なリスク推定スコアを決定することができる。このリスク推定スコアは、GCIスコアであってもよい。
遺伝複合指数(GCI)
いくつかの実施形態では、多数の遺伝子マーカー又は変異体と1若しくは複数の疾患又は症状の関連性に関する情報を組み合わせ、解析して遺伝複合指数(Genetic Composite Index)(GCI)スコアを求める。例えば、GCIスコアには、1若しくは複数のオッズ比、又はある表現型に関して異なった遺伝子変異体の有無からの相対リスクを組み込むこともできる。GCIスコアには、様々な遺伝子変異体からの少なくとも2、3、4、5、6、7、8、9、又は10のオッズ比又は相対リスクを組み込むこともできる。
このスコアは、既知のリスク因子、並びに他の情報及び仮定、例えば対立遺伝子頻度や疾患の有病率などを組み込んでいる。GCIを使用して、ある疾患又は症状と、一組の遺伝子マーカーの複合効果の関連性を定性的に推定することができる。GCIスコアを使用して、遺伝子の訓練を受けていない人々に、彼らの個人のいかなる疾患リスクが最新の科学的研究に基づいて関連集団と比較されているかについての、信頼できる(すなわちロバストな)、理解できる、及び/又は直感的な感覚を提供できる。
GCIプラススコアは、GCIスコアを使用して作成することができる。本明細書中に開示した方法は、GCIスコアを使用を包含するものなので、当業者は、本明細書中に記載のGCIスコアに代わるGCIプラススコア又はその変形の使用を容易に理解できるであろう。GCIプラススコアは、リスク(例えば生涯リスクなど)、年齢により定義される有病率、及び/又は年齢により定義される該状態の発生率を包含する、すべてのGCI仮定を含むことができる、そして、個体の生涯リスクをGCIプラススコアとして算定できるが、それは、個体のGCIスコアを平均GCIスコアで除したものに比例する。平均GCIスコアは、類似の祖先背景を持つ個体群、例えば、白人、アジア人、東インド人の群、又は共通の祖先背景を持つその他の群から決定することができる。群は少なくとも5、10、15、20、25、30、35、40、45、50、55、又は60人の個体を含み得る。いくつかの実施形態では、平均値は、少なくとも75、80、95、又は100人の個体から決定され得る。GCIプラススコアは、個体のGCIスコアを決定し、そのGCIスコアを平均相対リスクで除し、そしてある状態又は表現型について生涯リスクを掛けることによって決定できる。例えば、米国特許出願公開第20080131887号及びPCT公報第WO2008/067551からのデータを利用して、個人のGCI又はGCIプラススコアを決定できる。このスコアを、個体の表現型プロファイルの中の1若しくは複数の状態に関する遺伝的リスク、例えば推定生涯リスクなどに関する情報を作成するのに使用できる。この方法は、推定生涯リスク、あるいは1若しくは複数の表現型又は状態に関する相対リスクの算定を可能にする。単一状態に関するリスクは、1若しくは複数のSNPに基づくことができる。例えば、表現型又は状態に関する推定リスクは、少なくとも2、3、4、5、6、7、8、9、10、11、又は12個のSNPに基づき、この場合、リスクを推定するためのSNPは、公表されたSNP、試験SNP、又はその両方であり得る。
GCIスコアを、目的とする疾患又は症状の各々について作成する。これらのGCIスコアを集めて、ある個体のリスクプロファイルを形成できる、GCIスコアは、リスクプロファイルを作成するため、いかなる時点においても容易にアクセスできるようにデジタル保存することができる。リスクプロファイルは、例えば癌、心臓病、代謝異常、精神障害、骨疾患、又は年齢発症障害などの広範な疾患クラスに分類できる。広範な疾患クラスはさらに下位カテゴリーに細分できる。例えば、癌などの広範なクラスでは、タイプ(肉腫、癌腫又は白血病など)又は組織特異性(神経、乳房、卵巣、精巣、前立腺、骨、リンパ節、膵臓、食道、胃、肝臓、脳、肺、腎臓など)による癌の下位カテゴリーを列挙できる。さらにリスクプロファイルは、個体の年齢又は様々なリスク因子を調節する時にGCIスコアの変化をどう予測するかに関する情報を示すことができる。例えば、特定の疾患についてのGCIスコアは、食生活の変化効果又は実行された予防措置(禁煙、薬物投与、定型的両側乳房切除術、子宮摘出術等)の効果を考慮に入れることができる。
GCIスコアが、ある個体のために作成され、それが少なくとも1つの疾患又は症状を獲得するその個体のリスク又は感受性について容易に理解できる情報を提供する。1若しくは複数のGCIスコアが、たった一つの疾患、状態、多数の疾患又は症状について作成され得る。1若しくは複数のGCIスコアがオンラインポータルによってアクセス可能である。あるいは、1若しくは複数のGCIスコアが紙の形態で提供され、その後の更新もまた紙の形態で提供されることもできる。この紙の形態は、個体又は彼らのヘルスケア管理者にメールされるか、又は自分で提供できる。
異なる遺伝子座の組み合わせ効果に関するロバストなGCIスコアを作成するための方法は、研究された各遺伝子座に関する報告された個体リスクに基づいている。例えば、目的とする疾患又は症状が同定され、次にその他のデータベース、特許公告、及び科学文献を含めた情報源は、1若しくは複数の遺伝子座と疾患又は症状の関連に関する情報を質問される。これらの情報提供源は、品質基準を使用して企画され、評価される。いくつかの実施形態では、評価プロセスは、多数のステップを伴う。他の実施形態では、情報源は、多数の品質基準に関して評価される。情報源から得られる情報は、目的とする疾患又は症状の各々に対する1若しくは複数の遺伝子座に関するオッズ比又は相対リスクを特定するのに使用される。
代替の実施形態では、少なくとも1つの遺伝子座に関するオッズ比(OR)又は相対リスク(RR)は、情報源から入手可能でないか又はアクセス可能でない。RRはその場合、(1)同一遺伝子座の複対立遺伝子の報告されたOR、(2)データセット、例えばHapMapデータセットからの対立遺伝子頻度、及び/又は(3)利用可能な情報源(例えばCDC、国立健康統計センターなど)からの疾患/状態有病率を使用することで算定され、目的とするすべての対立遺伝子のRRを得る。1つの実施形態では、同一遺伝子座の複対立遺伝子のORは、別々に又は独立に推定される。好ましい実施形態では、同一遺伝子座の複対立遺伝子のORは、異なる対立遺伝子のOR間の依存関係を説明するために組み合わされる。いくつかの実施形態では、確立された疾患モデル(例えば乗法的、加法的、ハーバード修正型、優性効果などのモデルがあるが、これだけに限定されるものではない)を用いて、選ばれたモデルに従って個体のリスクを表す中間スコアを作成する。
目的とする疾患又は症状に関する多数のモデルを解析し、これらの異なるモデルから得られた結果を相関させる方法を使用する;これは、特定の状態モデルの選択により導入され得る可能性のある誤差を最小限にする。この方法は、相対リスクの算定に関する情報源から得られる有病率、対立遺伝子頻度、及びORの推定における合理的な誤差の影響を最小限にする。RRに及ぼす有病率推定の影響の「直線性」又は単調性のため、理論値によって制限されずに、最終ランクスコアに及ぼす不正確な有病率推定の影響はまずない;但し、同一モデルは、報告が作成されるすべての個体に一貫して適用される。
本明細書中に記載した方法はまた、追加的「遺伝子座」として環境/行動/人口統計のデータを考慮に入れることができる。関連方法では、そのようなデータは、医学又は科学文献又はデータベースなどの情報源から(例えば、喫煙と肺癌の関連、又は保険業界健康リスク評価から)得ることができる。1若しくは複数の複合疾患に関して示されるGCIスコアもまた、本明細書中に開示される。複合疾患は、多遺伝子、環境因子、及びそれらの相互作用により影響を及ぼされ得る。多数の可能性のある相互作用は、複合疾患を研究する場合、解析される必要がある。GCIスコアを作成するために、多重比較に関して補正するために実行される手法、例えばボンフェローニ補正などを使用できる。あるいは、Simes検定を用いて検定が非依存的であるか又は特定の型の依存を示す場合、全体の有意水準(別名「族辺りの過誤率(familywise error rate)」)を制御するために使用できる(Sarkat S.,Ann Stat 26:494‐504(1998))。Simes検定は、1、...、Kにおける任意のkに関してp(k)≦αk/Kである場合に、すべてのK検定特異的帰無仮説が正しいという、全体的帰無仮説を棄却する(Simes,R.J.,Biometrika 73:751‐754(1986))。
多遺伝子及び多環境因子解析との関連で使用されるその他の実施形態は、誤り発見率(false‐discovery rate)‐すなわち、間違って棄却される棄却帰無仮説の予想比率、を制御する。このアプローチは、マイクロアレイ研究の場合と同様に、帰無仮説の一部が誤っていると推定される場合、特に有効である。Devlinら(Genet.Epidemiol.25:36‐47(2003))は、多遺伝子座関連研究において多数の考え得る遺伝子×遺伝子相互作用を試験する場合、誤り発見率を制御するBenjamini及びHochberg(J.R.Stat.Soc.Ser.B 57:289‐300(1995))のステップアップ手法の変法を提唱した。Benjamini及びHochberg手法は、Simes検定と関連づけられる;p(k)≦αk/Kであるようにk*=maxkと設定すると、それはp(1)、...、p(k * )に対応するすべてのk*帰無仮説を棄却する。実際、Benjamini及びHochbergの手法は、すべての帰無仮説が正しい場合、Simes検定と同じになる(Benjamini and Yekutieli,Ann.Stat.29:1165‐1188(2001))。
最終ランクスコアをつけるためにその中間スコアに基づく個体集団との比較において、個体がランクづけされる個体のランキングもまた本明細書中に提供される。これは、集団におけるランク、例えば99th百分位数、又は99th、98th、97th、96th、95th、94th、93th、92th、91th、90th、89th、88th、87th、86th、85th、84th、83th、82th、81th、80th、79th、78th、77th、76th、75th、74th、73th、72th、71th、70th、69th、65th、60th、55th、50th、45th、40th、40th、35th、30th、25th、20th、15th、10th、5th、若しくは0th百分位数などとして表され得る。ランクスコアは、100th〜95th百分位数、95th〜85th百分位数、85th〜60th百分位数、又は100th〜Oth百分位数の任意の下位範囲などの範囲として示され得る。個体はまた、四分位数、例えば最高75th四分位数、又は最低25th四分位数などでもランクづけできる。個体はまた、集団の平均又は中央値との比較においてもランクづけできる。
一実施形態では、個体が比較される集団は、様々な地理的及び民族的背景からの多くの人々、例えば世界的集団を包含する。あるいは、個体が比較される集団は、特定の地理、祖先、民族、性別、年齢(例えば胎児、新生児、小児、青年、ティーンエイジャー、成人、老人の個体)、疾患状態(例えば症候性、無症候性、保因性、早期発症、後期発症)に限定される。いくつかの実施形態では、個体が比較される集団は、公的及び/又は私的な情報源から報告された情報から得られる。
GCIスコアは、多段階プロセスを使用して作成される。例えば、最初に、試験されるべき各状態に関して、遺伝子マーカーの各々に関するオッズ比からの相対リスクが算定される。すべての有病率値p=0.01、0.02、...、0.5に関して、HapMap CEU集団のGCIスコアが、有病率に基づいて、そしてHapMap対立遺伝子頻度に基づいて算定される。GCIスコアが種々の有病率下で不変である場合には、考慮される唯一の仮定は、乗法的モデルが存在するというものである。さもなければ、モデルは有病率に感受性である、ということが決定される。HapMap集団における相対リスクとスコアの分布が、無呼出値の任意の組み合わせに関しても得られる。各々の新規の個体にとって、個体のスコアがHapMap分布と比較され、得られたスコアがこの集団における個体のランクである。プロセス中になされた仮定のため、報告されたスコアの解像度が低いことがある。集団は、変位値(3〜6bin)に分割され、報告されたbinは個体のランクが下がる場合のものである。binの数は、各疾患に関するスコアの解像度などの問題に基づいた異なる疾患に関しては異なり得る。異なるHapMap個体のスコア間のつながりの場合、平均ランクが使用される。
GCIスコアが高いほど、状態又は疾患にかかっている又はそう診断されるリスクが増大する指標と解釈される。典型的には、数学的モデルを使用して、GCIスコアを得る。GCIスコアは、集団及び/又は疾患若しくは状態に関する基本的な情報の不完全性を説明する数学的モデルに基づいている。その数学的モデルは、GCIスコアを算定する基礎の一部として少なくとも1つの推定を包含するが、この場合、その推定としては、オッズ比値が与えられるという推定;状態の有病率が既知であるという推定;集団中の遺伝子型頻度が既知であるという推定;及び/又はカスタマーが試験に使用される集団と、そしてHapMapと同じ祖先背景から来ているという推定;合併リスクが個体の遺伝子マーカーの異なるリスク因子の積であるという推定があるが、これだけに限定されるものではない。GCIはまた、遺伝子型の多遺伝子型頻度がSNP又は個体の遺伝子マーカーの各々の対立遺伝子の頻度の積である(例えば異なるSNP又は遺伝子マーカーは集団全体で独立している)という推定も包含しうる。
乗法的モデル
GCIスコアは、遺伝子マーカーセットに起因すると考えられるリスクが個体の遺伝子マーカーに起因すると考えられるリスクの積である、という仮定の下で算定される。これは、異なる遺伝子マーカーが他の遺伝子マーカーとは独立して疾患のリスクに帰する、ことを意味する。形式的には、リスク対立遺伝子r1、...、rk及び非リスク対立遺伝子n1、...、nkを有するk遺伝子マーカーがある。SNP iにおいて、3つの考え得る遺伝子型値をrii、nii、及びniiとして示す。個体の遺伝子型情報は、位置iにおけるリスク対立遺伝子の数によって、ベクター(g1、...、gk){ここで、giは、0、1、又は2であり得る。}により記述され得る。同一位置での同型非リスク対立遺伝子と比較した場合の位置iにおける異型遺伝子型の相対リスクをλi 1によって示す。言い換えれば、以下のとおりである。
Figure 2015007985
同様に、rii遺伝子型の相対リスクは、以下のように示す。
Figure 2015007985
乗法的モデル下では、遺伝子型(g1、...、gk)を有する個体のリスクは、以下:
Figure 2015007985
であると、仮定する。
相対リスクの推定
他の実施形態では、異なる遺伝子マーカーに関する相対リスクは既知であり、乗法的モデルがリスク評価のために使用され得る。しかしながら、いくつかの実施形態では、関連研究を含めて、試験設計は相対リスクの報告を妨げている。いくつかの症例‐対照試験では、相対リスクは更なる仮定なしにはデータから直接算定できない。相対リスクを報告する代わりに、遺伝子型のオッズ比(OR)を報告することが通例であり、これは、リスク遺伝子型(rii又はniiのいずれか)を付与された疾患を保有する確率対リスク遺伝子型を付与される疾患を保有しない確率である。式で表すと以下のとおりである。
Figure 2015007985
オッズ比から相対リスクを知ることは、さらなる仮定を必要とする。例えば、全集団中の対立遺伝子頻度:
Figure 2015007985
が既知であるか又は推定されている(これらは、120の染色体を含むHapMapデータセットなどの最新データセットから推定することができた)、という仮定、及び/又は疾患の有病率p=p(D)が既知であるという仮定など。先の3つの方程式から、以下が導き出され得る。
Figure 2015007985
相対リスクの定義により、項pP(D|nii)で割ると、第1方程式は以下のように書き直され、
Figure 2015007985
そのため、後の2つの方程式は、以下のように書き直される。
Figure 2015007985
a=1(非リスク対立遺伝子頻度が1)である場合、方程式系1は、Zhang及びYu(JAMA,280:1690‐1691(1998))(この文献の全体を本明細書中に援用する)中のZhang及びYuの式と等価である、ということに留意されたい。Zhang及びYuの式と対比して、いくつかの実施形態は、集団中の対立遺伝子頻度を考慮するが、これは、相対リスクに影響を及ぼし得る。さらに、いくつかの実施形態は、相対リスクの相互依存性を考慮に入れ、計算とは対照的に、相対リスクの各々が独立している。
方程式系1は、多くて4つの考え得る解法を有する2つの二次方程式として書き直され得る。これらの方程式を解くために勾配下降アルゴリズムが使用されるが、この場合、開始点がオッズ比であるように設定される(例えば、λi 1=ORi 1、及びλi 2=ORi 2
例えば、以下のとおりである。
Figure 2015007985
これらの方程式の解法を見つけるのは、関数g(λ1,λ2)=f1(λ1,λ22+f2(λ1,λ22の最小値を見つけることと同じである。よって、以下のとおりである。
Figure 2015007985
この例では、x0=OR1、y0=OR2と設定することにより始める。値[イプシロン]=10-10をアルゴリズムを通して、許容定数であると設定する。反復iにおいて、以下のように定義し、
Figure 2015007985
次に、以下のように設定する。
Figure 2015007985
その反復は、g(xi,yi)<許容範囲まで繰り返されるが、この場合、許容範囲は、供給コードで10-7に設定される。
この例では、これらの方程式は、a、b、c、p、OR1、及びOR2の異なる値に関して正しい解を提供する。
相対リスク推定のロバスト性
いくつかの実施形態では、相対リスクの推定に及ぼす異なるパラメーター(有病率、対立遺伝子頻度、及びオッズ比誤差)の作用が計測される。相対リスク値に及ぼす対立遺伝子頻度及び有病率推定値の作用を計測するために、異なるオッズ比と異なる対立遺伝子頻度のセットの値からの相対リスクが(HWE下で)算定され、そしてこれらの算定結果が、0〜1の範囲の有病率に関してプロットされる。加えて、有病率の固定値に関して、得られた相対リスクは、リスク‐対立遺伝子頻度の一関数としてプロットされ得る。p=0である場合、λ1=OR1、λ2=OR2であり、そしてp=1である場合、λ1=λ2=0である。これは、前記方程式から直接算定され得る。さらに、いくつかの実施形態では、リスク対立遺伝子頻度が高い場合、λ1は線形関数により近くなり、そしてλ2は有界二次微分を伴う凹関数に近くなる。極限において、c=1である場合、λ2=OR2+p(1‐OR2)であり、そして以下のとおりである。
Figure 2015007985
OR1=OR2である場合、後者もまた線形関数に近くなる。リスク‐対立遺伝子頻度が低い場合、λ1及びλ2は、関数1/pの挙動に近づく。極限において、c=0である場合、以下のとおりである。
Figure 2015007985
これは、高リスク‐対立遺伝子頻度に関して、有病率の不正確な推定が得られる相対リスクに有意に影響を及ぼさない、ということを示す。さらに、低リスク‐対立遺伝子頻度に関して、p’=αpの有病率値が正確な有病率pに置換される場合には、得られた相対リスクは、多くても、
Figure 2015007985
倍に下がる。
GCIスコアの算定
一実施形態では、GCIは、関連集団を表す基準セットを使用して算定される。この基準セットは、HapMap又は別の遺伝子型データセット中の集団の1つであってもよい。
この実施形態では、GCIは以下のとおり算定される:kリスク遺伝子座の各々に関して、相対リスクが方程式系1を使用して、オッズ比から算定されるか、又は以下に記載するように算定される。次に、基準セット中の各個体に関する乗法的スコアが算定され、これは、遺伝子座全体にわたる相対リスクの積である。この乗法的スコアは、異なるSNPが疾患又は症状に独立した作用を持っていることを暗に仮定しているが、いくつかの相互作用が既知であるケースにも、このモデルが拡大適用され得る。sの乗法的スコアを有する個体のGCIは、s’≦sのスコアを有する基準データセット中のすべての個体の分数である。例えば基準セット中の個体の50%がsより小さい乗法的スコアを有する場合、個体の最終GCIスコアは0.5である。GCIは、オッズ比又は相対リスクが異なる遺伝子型又はハプロタイプの組み合わせで既知である場合(場合によって、これらは文献で見つけられる)、SNP‐SNP相互作用を明らかにするために一般化され得る。
本明細書中に記載のとおり、乗法的モデルがGCIスコアに使用され得るが、しかしながら、GCIスコアを決定するために他のモデルが使用されることもある。その他の好適なモデルには、以下のものがあるが、これだけに限定されるものではない。
加法的モデル。加法的モデル下で、遺伝子型(g1、...、gk)を有する個体のリスクは以下のとおりであると推定される:
Figure 2015007985
一般化加法的モデル。一般化加法的モデル下で、遺伝子型(g1、...gk)を有する個体のリスクが以下のとおりであるような一関数fが存在すると推定される。
Figure 2015007985
ハーバード修正型スコア(Het)。このスコアは、Colditzら(Cancer Causes and Controls,11:477‐488(2000))(この文献の全体を本明細書中に援用する)から得られる。Hetスコアは、本質的には一般化加法的スコアであるが、しかし、関数fは相対リスクの代わりにオッズ比値に働く。これは、相対リスクを推定するのが難しい場合に有用であり得る。関数fを定義するために、中間関数gが以下のとおり定義される。
Figure 2015007985
次に、数量が、以下のとおり:
Figure 2015007985
{式中、pi hetは、基準集団全体のSNP iにおける異型接合個体の頻度である。}算定される。次に、関数fが、f(x)=g(x)/hetと定義され、そしてハーバード修正型スコア(Het)が、以下のとおり平易に定義される。
Figure 2015007985
ハーバード修正型スコア(Hom)。このスコアはHetスコアと類似しているが、但し、値Hetは、以下の値:
Figure 2015007985
{式中、pi homは、同型接合リスク‐対立遺伝子を有する個体の頻度である。}
により置き換えられる。
最大オッズ比。このモデルでは、遺伝子マーカーのうちの1つ(最大オッズ比を有するもの)は全パネルの組み合わせリスクに関して下限を示す、と推定される。数式で表すと、遺伝子型(g1、...、gk)を有する個体のスコアは、以下のとおりである。
Figure 2015007985
スコアの比較は実施例1に記載されており、そしてGCIスコアの評価は実施例2に記載されている。
随意数の変異体へのモデルの拡大
モデルは、随意数の考え得る変異体が生じる状況に拡大され得る。従来の考察は、3つの考え得る変異体(nn、nr、rr)が存在する状況に関係する。一般的に、多SNP関連が知られている場合、随意数の変異体が集団中に見出され得る。例えば、2つの遺伝子マーカー間の相互作用が、ある状態と関連する場合、9つの考え得る変異体が存在する。これは、8つの異なるオッズ比値を生じる。
初期の式を作成するために、k+1の考え得る変異体a0、...、akが存在し、頻度f0、f1、...、fk、測定オッズ比1、OR1、...、ORk、そして未知の相対リスク値1、λ1、...、λkである、と考えられ得る。さらに、すべての相対リスク及びオッズ比はa0に関して計測され、したがって以下のとおりであると考えられる。
Figure 2015007985
以下の:
Figure 2015007985
に基づいて、以下のとおり決定される。
Figure 2015007985
さらに、以下:
Figure 2015007985
と設定された場合、これは、以下の方程式:
Figure 2015007985
を生じ、したがって、以下のとおりとなる。
Figure 2015007985
後者は、1つの変数(C)を有する方程式である。この方程式は、多数の異なる解を生じ得る(本質的には、k+1までの異なる解)。典型的な最適化ツールは、例えば勾配降下などを用いて、以下の:
Figure 2015007985
に最も近い解を見い出し得る。
また、リスク因子の定量化のためのロバストなスコアリング・フレームワークもまた本明細書中に提供される。異なる遺伝的モデルは異なるスコアを生じ得るが、通常、その結果は相関がある。そのため、リスク因子の定量化は、一般に、使用されるモデルに依存しない。
相対リスク症例対照試験の推定
症例-対照試験における複対立遺伝子のオッズ比から相対リスクを推定する方法はまた、本明細書中に開示される。従来のアプローチに対比して、本方法は対立遺伝子頻度、疾患の有病率、及び異なる対立遺伝子の相対リスク間の依存関係を考慮に入れる。シミュレートした症例-対照試験におけるアプローチの成果が計測され、非常に正確であることがわかった。
方法
特定のSNPが疾患Dとの関連に関して試験される場合、R及びNはこの特定のSNPのリスク及び非リスク対立遺伝子を意味する。各々、人がリスク対立遺伝子に関して同型接合であり、非リスク対立遺伝子に関して異型接合又は同型接合であるとすると、P(RR|D)、P(RN|D)及びP(NN|D)は、疾患により影響を受ける確率を意味する。fRR、fRN、及びfNNは、集団中の3つの遺伝子型の頻度を意味するのに使用される。これらの定義を使用して、相対リスクは以下のとおりに定義される。
Figure 2015007985
症例-対照試験では、値P(RR|D)、P(RR|〜D)、すなわち、症例及び対照の中のRRの頻度、並びにP(RN|D)、P(RN|〜D)、P(NN|D)及びP(NN|〜D)、すなわち、症例及び対照の中のRN及びNNの頻度が推定され得る。相対リスクを推定するために、ベイズの法則を使用して、以下の式を得る。
Figure 2015007985
よって、遺伝子型の頻度が既知である場合、相対リスクを算定するためにそれらを使用し得る。集団中の遺伝子型の頻度は、それらが集団中の疾患の有病率によるので、症例-対照試験それ自体から算定され得ない。特に、疾患の有病率がp(D)である場合には、以下のようになる:
Figure 2015007985
p(D)が十分に小さい場合、遺伝子型の頻度は対照集団中の遺伝子型の頻度により見積もられ得るが、しかしこれは、有病率が高い場合、正確な推定ではない。しかしながら、基準データセットが示された場合(例えばHapMap[引用])、基準データセットに基づく遺伝子型の頻度を推定し得る。
大部分の一般試験は、相対リスクを推定するために基準データセットを使用せず、そしてオッズ比だけが報告される。オッズ比は、以下のとおり書き表される。
Figure 2015007985
通常は集団中の対立遺伝子頻度の推定を有する必要がないため、オッズ比は典型的には有益である;オッズ比を算定するために、典型的に必要とされるものは、奨励におけるそして対照における遺伝子型頻度である。
いくつかの状況では、遺伝子型データそれ自体は利用できないが、しかし要約データ、例えばオッズ比が入手可能である。これは、従来の症例-対照試験からの結果に基づいて、メタ分析が実施されている場合である。この場合、オッズ比から相対リスクを見い出す方法が実証される。以下の方程式:
Figure 2015007985
が当てはまる、という事実を使用する。
この方程式を、P(D|NN)で割ることで、我々は以下の式を得る。
Figure 2015007985
これは、以下のようにオッズ比を書き表すことを可能にする。
Figure 2015007985
同様の算定により、以下の連立方程式が生じる:
Figure 2015007985
オッズ比、集団中の遺伝子型の頻度、及び疾患の有病率が既知である場合、相対リスクはこの方程式セットを解くことによって見出され得る。
これらは2つの二次方程式であり、よって、それらには最大で4つの解があることに留意されたい。しかしながら、以下に示されているように、典型的にはこの方程式には1つの考え得る解が存在する。
NN=1である場合、方程式系1は、Zhang及びYuの式と等価であることに留意されたい;しかしながら、ここで、集団中の対立遺伝子頻度が考慮される。さらに、2つの相対リスクが互いに依存するという事実を我々の方法は考慮するが、従来の方法は相対リスクを各々独立して算定することを示唆している。
複対立遺伝子遺伝子座に関する相対リスク。多マーカー又はその他の複対立遺伝子変異体が考察される場合、算定は少し複雑になる。a0、a1、...、akは、考え得るk+1対立遺伝子によって示され、この場合、a0は非リスク対立遺伝子である。k+1の考え得る対立遺伝子に関してする集団中の対立遺伝子頻度f0、f1、f2、...、fkが仮定される。対立遺伝子iに関して、相対リスク及びオッズ比は、以下のとおり定義される。
Figure 2015007985
以下の方程式が疾患の有病率に当てはまる:
Figure 2015007985
よって、方程式の両辺をp(D|a0)で割ると、我々は以下の式を得る。
Figure 2015007985
以下の式を生じる。
Figure 2015007985
以下の式:
Figure 2015007985
を設定することにより、結果は以下のとおりである。
Figure 2015007985
よって、Cの定義によると、以下のとおりである。
Figure 2015007985
これは1つの変数Cを有する多項式である。Cがいったん決定されると、相対リスクが決定される。多項式は次数k+1のものであり、よって、我々は多くてk+1の解を有すると予測する。しかしながら、方程式の右辺はCの一関数として狭義の減少関数であるため、典型的にはこの方程式に対して1つの解のみが存在し得る。この解を見出すことは二分探索法を使用すると容易であるが、それは、解がC=1と以下の式との間で設定されるためである。
Figure 2015007985
相対リスク推定のロバスト性。相対リスクの推定に及ぼす異なるパラメーター(有病率、対立遺伝子頻度、及びオッズ比誤差)の各々の影響が計測された。相対リスク値に及ぼす対立遺伝子頻度と有病率推定の影響を計測するために、相対リスクは、1セットの異なるオッズ比、(HWE下の)異なる対立遺伝子頻度の値のから算定され、そして、0〜1の範囲の有病率値に関するこれらの算定の結果をプロットした。
さらに、有病率の固定値に関して、リスク対立遺伝子頻度の一関数として得られた相対リスクがプロットされた。明らかに、p(D)=0であるすべての場合、λRR=ORRR及びλRN=ORRNであり、そしてp(D)=1である場合、λRR=λRN=0である。これは、方程式1から直接算定され得る。さらに、リスク対立遺伝子頻度が高い場合、λRRは線形挙動に近づき、そしてλRNは有界二次微分を伴う凹関数に近くなる。リスク‐対立遺伝子頻度が低い場合、λRR及びλRNは関数1/p(D)の挙動に近づく。これは、高リスク‐対立遺伝子頻度に関して、有病率の間違った推定が、典型的には、得られた相対リスクに大きく影響しないことを意味する。
オッズ比対相対リスク。疫学文献では、相対リスクはリスクの直感的で有益な基準であると見なされることが多い。しかしながら、相対リスクは、一般的に症例-対照試験及び全ゲノム関連試験に関連して直接算定できない。相対リスクは、通常、プロスペクティブ試験を通して推定され、この場合、一組の健常人が長期間にわたって研究される。対照的に、オッズ比は、通常、症例-対照試験において報告される。オッズ比は、症例対対照におけるリスク対立遺伝子を保有する確率の比である。希な病気に関して、オッズ比は、相対リスクの良好な近似であるが;しかしながら、ありふれた病気に関して、オッズ比はリスクの紛らわしい推定をもたらすかもしれず、そこでは、リスクの増大がわずかな場合であっても、オッズ比が著しく高いことがある。
相対生涯リスク対相対リスク。相対リスクは、対照のいずれもが現在疾患にかかっていないと暗に仮定している。疾患にかかる確率が推定されている場合、これが関連している。しかしながら、一生の間のリスク推定、又は個体が状態を発症する生涯リスクに関係させるのであれば、一部の対照が疾患を最終的に発症する事実が考慮される。相対生涯リスクは、リスク対立遺伝子rを保有する個体の生涯を通じて状態を発症するリスクと非リスク対立遺伝子を保有する個体の生涯を通じた状態を発症するリスクとの間の比と定義される。これは、症例-対照試験における相対リスクの典型的な使用とは異なっており、それは有病率情報に基づいている。
0、a1、...、akによって意味されるものは考え得るk+1対立遺伝子であり、この場合、a0は非リスク対立遺伝子である。k+1の考え得る対立遺伝子に関する集団中の対立遺伝子頻度f0、f1、f2、...、fkが仮定される。さらに、試験された個体が3つの群:CA、Y、及びZに分割され得ると仮定する。CAは症例を意味するのに対し、Y及びZは対照を意味する。Zの個体と対照的に、Yの個体が最終的に状態を発症すると思われる。同様に、COによって意味されるものはYとZの和集合であり、そしてDによって意味されるものはYとCAの和集合である。|Y|=α|CO|=α(|Y|+|Z|)と仮定され、この場合、αは一生の間に状態を発症する対照の割合である。αが平均生涯リスクを上限としていることに留意されたい。もしかすると、疾患の発病年齢、及び対照の年齢によって、αが平均寿命より小さいこともある。
相対リスク及びオッズ比は、ここで、以下のとおりに表される。
Figure 2015007985
オッズ比は、以下のとおり書き表すことができる。
Figure 2015007985
1行目から2行目までの微分はベイズの法則に基づいているが、3行目は、CA及びYが本質的に同じ集団であるので、そのためP(CA|ai)=P(Y|ai)であるという事実に基づいている。ここで、P(Z|ai)=1‐P(CA|ai)という事実を使用することで、以下の式をもたらす。
Figure 2015007985
すでに述べたように、以下のとおりであり:
Figure 2015007985
この場合、p(D)は平均生涯リスクである。よって、以下の等式:
Figure 2015007985
を使用することで、オッズ比を以下のとおり書き直すことができる。
Figure 2015007985
よって、Cが与えられている場合、相対生涯リスクは、以下の式:
Figure 2015007985
を割り当てることによって見出される。
Cは、以下の方程式:
Figure 2015007985
を解くことによって見出される。
当業者は、C及とオッズ比の定義であるC>(2α‐1)p(D)(ORi‐1)によって確認することができる。そのため、右辺はCの減少関数であり、それは二分探索法を適用することによって見出すことができる。
GCIに基づく生涯リスク推定。GCIは、すべての関連SNP全体に非リスク対立遺伝子を有する個体と比較した個体の相対リスクを原則的に提供する。個体の生涯リスクを算定するために、平均生涯リスクを有する個体の生涯リスクの積が得られ、そしてこの積を集団全体の平均生涯リスクで割る。この算定は、平均生涯リスクと相対リスクの定義と一致している。平均生涯リスクを計算するために、すべての考え得る遺伝子型が列挙され、そして、単一SNPの各々の中のそれらの変異体の相対リスクの積として算定されるそれらの相対リスクがまとめられる。
環境遺伝複合指数(EGCI)
いくつかの実施形態では、環境因子は、環境遺伝複合指数(EGCI)スコアを作成するGCIスコアの中に組み入れられる。EGCIスコアは、コンピューターによって算定するか、又は決定することができる。環境因子には、非遺伝因子、例えば食生活因子、運動する習慣からの因子、及びその他のライフスタイルなど、又は個人的な選択、例えば個人的な人間関係、仕事や家庭状況などがあるが、これだけに限定されるものではない。例えば、喫煙(喫煙の頻度及び/又は量、ニコチン摂取レベル等)、薬物使用(薬物使用のタイプ、量、及び頻度)、並びにアルコール摂取(例えば量及び頻度)が、EGCIスコアを作成するためにGCIスコアに組み入れられる環境因子であり得る。その他の環境因子は、食生活のタイプ、摂取の量、及び頻度があってもよい。その他の因子は、個体の運動計画、例えば特定のタイプの身体的活動の強度、タイプ、長さ、及び頻度などである。
さらに、その他の環境因子には、個体の生活環境、例えば農村部、都会環境、又は特定の個体群密度若しくは汚染レベルの都市などが含まれ得る。個体の居住地、例えば個体の労働又は住居環境のスモッグレベル又は大気質などを考慮することもできる。個体の睡眠習慣、個人的な関係(例えば既婚若しくは未婚、親しい間柄の人の数、友人、家族関係)、社会的地位、雇用(高い/低いストレス、責任の度合い、職務の満足度、同僚や上司との関係等)を考慮することもできる。
よって、環境因子は、個体の出生地、居住場所、ライフスタイルの状態;食生活、運動習慣、及び個人的な関係であり得るが、これだけに限定されるものではない。環境因子はまた、個体の身体計測値、例えばボディーマスインデックス、血圧、心拍数、グルコースレベル、代謝物レベル、イオンレベル、体重、身長、コレステロールレベル、ビタミンレベル、血球数、タンパク質レベル、及び転写レベルなどでもあり得る。EGCIはまた、2以上の環境因子、例えば少なくとも1、2、3、4、5、10、12、15、20、25、又はそれ以上の環境因子を組み込むこともできる。
環境因子は、疾患又は症状のリスクの一因となっている1若しくは複数の遺伝因子とは無関係であることもある。環境因子はまた、疾患又は症状のリスクの一因となっている1若しくは複数のその他の環境因子とは無関係であることもある。いくつかの実施形態では、環境因子は1若しくは複数の遺伝因子とは無関係ではないこともある。さらに他の実施形態では、環境因子は、その他の環境因子とは無関係ではないこともある。環境因子はその他の遺伝因子又は環境因子と無関係ではないこともあるが、EGCIスコアに組み入れられている場合、EGCIスコアが算定されているときには(実施例5に記載のものなど)、環境因子は無関係であると仮定することができる。いくつかの実施形態では、個体に関して組み込まれた環境因子は、(例えば実施例4に示されているような)個体のファミリー若しくは友人のものであるか、又は個体のファミリー又は友人の行動に起因するものであることもある。例えば、個体は、喫煙する友人又は家族と同居していることもあり、それによって、煙に晒されることが個体のEGCIに組み込まれている環境因子であることもある。
EGCIを作成するためにGCIに組み入れられた環境因子は、疾患又は症状に関して少なくとも約1.0の相対リスク因子を持ち得る。その相対リスク因子は、約1〜2の間、又は少なくとも約1.1、1.2、1.3、1.4、1.5、1.6、1.7、約1、8、若しくは1.9であり得る。いくつかの実施形態では、相対リスク因子は、少なくとも約2、3、4、5、6、7、8、9、又は10であり得る。さらに他の実施形態では、環境因子の相対リスク因子は、少なくとも約12、15、20、25、30、25、40、45、又は50であり得る。
いくつかの実施形態では、EGCIを作成するためにGCIに組み入れられた環境因子は、疾患又は症状に関して少なくとも約1.0のオッズ比(OR)を持ち得る。その相対リスク因子は、約1〜2の間、又は少なくとも約1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、若しくは1.9であり得る。いくつかの実施形態では、ORは、少なくとも約2、3、4,5、6、7、8、9、又は10であり得る。さらに他の実施形態では、環境因子のORは、少なくとも約12、15、20、25、30、35、40、45、又は50であり得る。
EGCIは、その疾患又は症状の遺伝率が約95%未満であり得る疾患又は症状に関して作成され得る。いくつかの実施形態では、EGCIは、約5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、又は90%未満の遺伝率を有する疾患又は症状に関して計算される。
個別の行動計画
本明細書中に開示された個別の行動計画は、個体のゲノムプロファイルに基づいた、個体の健康又はウェルネスを改善するために重要な対応可能な情報を提供する。行動計画は、特定の遺伝子型相関を考慮した個体にとって有益であり、そして治療療法の投与、処置の潜在的必要性又は処置の効果の観察、又は食生活、運動、及びその他の個人的な習慣/活動における生活習慣変更を含み得る行動指針を提供し、それらは、個体のゲノムプロファイルに基づいて個別の行動計画へと個別化され得る。あるいは、個体は、自身のゲノムプロファイルに基づいた特定の格付けを与えられ得るが、加えて、任意に他の情報、例えば家族歴、既存の生活習慣及び地理など、例えば労働条件、作業環境、個人的な人間関係、家庭環境、などを含むが、これだけに限定されるものではない。組み込まれ得るその他の因子には、民族性、性別、及び年齢がある。様々な食事的及び運動的予防策のオッズ比と、疾患又は症状のリスク減少とそれらの関連もまた格付けシステムに組み入れられる。
例えば、個別の行動計画は、個体のGCI又はEGCIスコアに基づいて作成され得る。さらに、個別の行動計画は、個体に関して修正又は更新され得る、例えば、個体に関する環境因子を修正又は更新し、そして更新されたEGCIスコアを作成し得る。個別の行動計画はまた、例えば、以前に知られていなかった疾患若しくは状態に関する新しい遺伝情報に関する新しい科学情報から作成された更新されたEGCIスコア、又は改訂若しくは更新されたGCIスコアに由来するものなどが、個体に関して修正又は更新され得る。
修正又は更新された個別の行動計画は、例えば、個体又は彼らのヘルスケア管理者が契約プランなどによって自動更新を最初に要求しておけ、個体又は彼らのヘルスケア管理者に自動的に送付され得る。あるいは、更新された個別の行動計画は、個体又は彼らのヘルスケア管理者が要求した場合にのみ送付され得る。個別の行動計画は、多くの因子に基づいて修正又は更新され得る。例えば、個体が、解析されたより多くの遺伝子相関、並びに結果は、初期の個別の行動計画に対する既存の推奨を修正するか、追加の推奨を加えるか、又は推奨を排除するのに使用した結果を持っていることもある。いくつかの実施形態では、個体は、特定の生活習慣/環境を変えたか、又は家族歴、既存の生活習慣、及び地理、例えば、これだけに限定されるものではないが、労働条件、作業環境、個人的な人間関係、住居環境などに関する詳しい情報を得たか、あるいは、自身の更新後の年齢を含めて、これらの変更を組み込んだ個別の行動計画を得たいと望む可能性もある。例えば、個体は、初期の個別の行動計画、例えば食生活の中でコレステロールを減らすといったことに従うことができ、それによって個別の行動計画の推奨が修正されることがあるか、又は心臓病に対する彼らリスク又は素因が低減した。
個別の行動計画はまた、個別の行動計画の推奨に従った個体、又は個体が行うか若しくは彼らに起こったその他の変更に基づいて今後の推奨を予測することもできる。例えば、個体の年齢の増加は、骨粗鬆症のリスクの増大につながるであろうが、カルシウムの量又はその他の生活習慣、例えば個別の行動などによってそのリスクは減少できる。
個別の行動計画は、個体の表現型プロファイル及び/又はゲノムプロファイルに関する単回の報告により個体又は彼らのヘルスケア管理者に報告され得る。あるいは、個別の行動計画は別々に報告され得る。そして、個体は、自身の個別の行動計画のお奨めの行動を続ける。個体は、自身の計画におけるいずれかの行動を続ける前に彼らのヘルスケア管理者と相談することを選ぶこともできる。
提供された個別の行動計画はまた、行動ステップの統合セットに多くの状態特定情報を統合する。個別の行動計画は、これだけに限定されるものではないが、各状態の有病率、各状態に伴う疼痛の相対量、及び各状態の処置のタイプを含めた因子を統合できる。例えば、個体が(例えば高いGCI又はGCIスコアとして表される)心筋梗塞の高いリスクを有する場合、個体は、果実、野菜、及び穀類の消費増強を含む個別の行動計画を有することができる。しかしながら、個体がまたセリアック病の素因も有するのであれば、コムギ・グルテンアレルギーを有する可能性がある。その結果、コムギの消費増強は禁忌であり、それが個別の行動計画に示される。
個別の行動計画は、医薬的推奨、非医薬的推奨又はその両方を提供できる。例えば、個別の行動計画は、心筋梗塞に罹りやすい傾向のある個体に関して予防薬として提案された医薬、例えばコレステロール降下剤などと、医師と相談することを含むことができる。個別の行動計画ではまた、非医薬的推奨、例えば個体のゲノムプロファイルに基づく運動レジメンと食生活計画を含めた個別のライフスタイル計画に従うことなどを提供することもできる。
個別の行動計画の推奨は、特定の格付け、標識、又は分類システムから成るものであり得る。各推奨は、数字、色、及び/又は文字スキーム又は値で格付け又は分類され得る。その推奨を分類し、さらに格付けされ得る。多数の改変、例えば(文字、数字又は色;文字、数字、及び/又は色の組み合わせ;1若しくは複数の格付けスキームの中の異なるタイプの推奨を使用した)異なる格付けスキームなどを使用できる。
例えば、個体のゲノムプロファイルが決定され、そして彼らのゲノムプロファイルに基づいて個別の行動計画の個体に関する推奨は3つの群に分類される:「A」は不利又はマイナスの効果を表し;「N」は中間又は有意でない効果を表し、そして「B」は有益又はプラスの効果を表す。例としてこのシステムを使用すると、個体に関して「A」と分類された治療薬には、個体が有害反応を持っている薬物が含まれるであろうし、「N」と分類されたものは、個体に対していずれの有意なプラス又はマイナス効果も持っていないであろうし、そして「B」と分類されたものは、個体の健康に有益であろう。同じ分類システムを使用すると、食事の計画もまたA、B、Nに分類できる。例えば、個体がアレルギーのある又は特に避けるべきである食品(例えば、個体が糖尿病又は虫歯に罹りやすいのであれば砂糖)は、Aに分類されるであろう。個体の健康に有意な影響を及ぼさない食品はNと分類できる。個体に特に有益な食品はBに分類できる、例えば、個体が高コレステロールであれば、低コレステロールの食品がBに分類されるであろう。個体のための運動レジメンもまた、同じシステムに基づくことができる。例えば、個体が心臓の疾患に罹りやすいかもしれないので、激しいトレーニングを避けるべきであれば、それにより、ランニングはAの行動になり得る一方で、一定のペースでのウォーキング又はジョギングはBに分類できる。しばらく立っていることは、ある個体に関してはNであるかもしれないが、静脈瘤に罹りやすい別の個体に関してはAである可能性がある。
さらに、A、N、又はBの各カテゴリー内で、最低の影響から最高の影響まで、例えば1〜5などの更なる分類レベルが存在し得る。例えば、A1と分類され得る治療薬は、例えば弱い吐き気などのわずかな負の効果を示し、それに対し、A2は治療薬が嘔吐を引き起こすであろうことを示し、さらに、A5の治療薬は、例えばアナフィラキシー性ショックなどの激しい有害反応を引き起こすであろう。逆に、B1は、個体に対してわずかな正の効果を持っているのに対して、B5は、個体に対して有意に正の影響を持っているであろう。例えば、個体が肺癌に罹りやすいか、又は成長する間に副流煙に晒されたのであれば、個体の禁煙はB5であるかもしれないが、肺癌に罹りやすくない個体はB4としてその因子を持ち得る。
異なるカテゴリーはまた異なる色でも表される、例えばAは赤色の明暗であり得、個体の健康に対する低い効果から高い効果までを表すために、色調は明るい赤色の明暗から暗い赤色の明暗、すなわち、個体の健康に対して低い負の影響を表す明るい色から重度の有害影響を表す暗い色におよぶ。そのシステムはまた、色、数字、又は文字の連続的な範囲である。例えば、分類は、A、N、及びB、及び/又はその中の下位カテゴリーを持つというよりは、むしろAからGまで存在することができ、ここで、Aが、個体の健康に重度の負の影響を与える食品、治療薬、生活習慣、環境、及びその他の因子を表すのに対し、Dは、正又は負の最小限の影響しかない因子を表し、そしてGは、個体の健康に非常に有益であることを表すであろう。あるいは、数又は色もまた、AからGまでを持つというよりは、むしろ個体の健康に影響を与える、食生活、治療薬、生活習慣、環境、及びその他の因子の連続した範囲を表すことができる。
いくつかの実施形態では、個別の行動計画の中の特定の治療法、医薬、又はその他のライフスタイル要素が、分類、標識、又は格付けされ得る。例えば、個体は、運動レジメンと食生活計画を含めた個別の行動計画を持つこともできる。その運動レジメンは、1若しくは複数の格付け又は分類を含んでいてもよい。例えば、運動レジメンに関する格付けは、例えば表1などのようにA〜Eにわたり、ここで、各文字は1若しくは複数の運動のタイプに対応していて、各レベル、ひいては個体に関するお奨めの運動レジメンに該当する活動のタイプ、時間の長さ、所定の時間枠単位での回数に関する情報を含んでいる。
Figure 2015007985
1つの実施形態では、個体のゲノムプロファイルに基づいて、個別の行動計画は、個体に関してAの格付けをすることができ、そのため個体のお勧め運動レジメンは、彼らの心臓血管トレーニングのために表1中のA行の選択肢から選択されることである。同様に、ウエイトトレーニングのための類似のシステムも個体の運動レジメンの一部であり得、そして、Aの格付け向けのウエイトトレーニングの選択肢が個体に関して推奨されるであろう。いくつかの実施形態では、因子、例えば、これだけに限定されるものではないが、個体の既存の食生活、運動、及びその他の個人的な習慣/活動など、任意にその他の情報、例えば家族歴、既存の生活習慣や地理、例えば、これだけに限定されるものではないが、労働条件、作業環境、個人的な人間関係、住居環境、民族性、性別、年齢、及びその他の因子などを、個体のゲノムプロファイルに組み込むことができ、個体の運動レジメンの格付けを決定する。さらに、個体のライフスタイルが変化した、又はより多くの因子が分かったので、それを組み入れる場合、個体の格付けは変化し得る、例えば個体が個別の行動計画におけるお勧めの活動に従った場合、Aの格付けからはじまり、個体は、個体が現在Bの格付けであることを評価し、決定する更新された個別の行動計画を要求することもできる。あるいは、個体の個別の行動計画は、個体が自身の健康を最大限に高めるためにAの格付けからBの格付けに移行することを検討すべき時期の期限を提供することもできる。
個別の行動計画はまた、食事計画の格付けシステムも持つことができる。例えば、食事計画の格付けは、1〜5におよぶシステムであることができ、ここで、各数字は、脂肪、繊維、タンパク質、糖、及び個体が自身の食生活で摂ることが示されたその他の栄養素から成る特定のグループ分け、特定の目安量、カロリー数、及び/又は個体が自身の食生活として摂るべきであるその他の食品のグループ分けに対応している。個体のゲノムプロファイルに基づいて、個別の行動計画は、個体に関する2つの格付けを与えることができ、そのため、個体のお勧めの食事計画は、2つの格付けの中で選ぶいくつかの食事の選択であろう。
他の実施形態では、個体の食生活を分類できる。例えば、2つの格付けが与えられた個体は、2に分類されもする特定の食生活を選択するべきである。例えば、特定の野菜、肉、果実、乳製品、及びその他のものは2に分類できるが、その他のものはできない。例えば、アスパラガスは野菜であって2であるが、ビートは3であり得、そのため個体は自身の食生活の中にビートに比べてより多くのアスパラガスを含むべきである。
他の実施形態では、個体には、続きとしてどの食生活タイプかを提案する格付け、すなわち彼らのゲノムプロファイルに基づいて彼らの食生活の中で摂るべきである食生活タイプの中の栄養素タイプの分析を個体に与える。この格付けは、形、色、数字、及び/又は文字を含めた可視化表現の形態であってもよい。例えば、個体が結腸癌及び糖尿病に罹りやすいとわかると、個体には、その固体が自身の食生活で摂るべきお勧めの食品タイプにおける異なる栄養素の比を表すシンボルが与えられる。異なるタイプの食品、例えば、これだけに限定されるものではないが、特定の果実、野菜、炭水化物、肉、乳製品なども同じスキームで表される。所定の個体と最もよく類似しているシンボルを用いた格付けを持つ食品が、個体のためのお奨めの食品であろう。
いくつかの実施形態では、因子、例えば、これだけに限定されるものではないが、個体の既存の食生活、運動、及びその他の個人的な習慣/活動など、任意にその他の情報、例えば家族歴、既存の生活習慣や地理、例えば、これだけに限定されるものではないが、労働条件、作業環境、個人的な人間関係、住居環境、民族性、性別、年齢、及びその他の因子などを、個体のゲノムプロファイルに組み込み、個別の行動計画を作成することができ、それによって個体の食事計画に与えられる格付けに影響を及ぼす。さらに、個体のライフスタイルが変化した、又はより多くの因子が分かったので、それを組み入れる場合、個体の格付けは変化し得る。例えば、個体が個別の行動計画におけるお勧めの活動に従った場合、非常に低いコレステロール食である食事計画に関する1の格付けからはじまり、個体は、生活習慣で変化を組み込んだ更新された個別の行動計画を要求できる、すなわち、その個体が、改善されたコレステロールレベルを持つほどであれば、更新された個別の行動計画は、格付け2の下の食事計画に個体が直ちに従うのがよりふさわしいこと、又は格付け1及び2の食事計画から選択できることを示し得る。あるいは、個体の初期の個別の行動計画は、個体が自身の健康を最大限に高めるために1の格付けから2の格付けに移行すること、又は異なる格付けの下、異なる食事計画の間でスケジュールに基づいて食事計画を変更することを検討すべき時期の期限を提供することができる。
個別の行動計画における格付けは、異なる格付けシステムの組み合わせのためのものであってもよい。例えば、格付けA〜Eの運動レジメンシステムと格付け1〜5の食事計画システムは、彼らの個別の行動計画においてA1の格付けを個体に与えるために使用できる。そのため、個体は、Aの格付けの運動レジメンと1の格付けの食事計画に従うことが推奨される。あるいは、単独の格付けシステムが、運動及び食事レジメンに使用されることができる。例えば、その個体に関して推奨される運動及び食事レジメンが共にCに分類されるような個別の行動計画における特定の格付け、例えばCの格付けなどが、個体に与えられ得る。他の実施形態では、他のタイプの推奨、例えば他のライフスタイル活動や習慣などもまた含まれる。例えば、運動及び食事レジメン以外の、他の推奨、例えば治療薬、作業環境のタイプ、社会活動のタイプなどもまた、単独の格付けシステム下で包含され得る。あるいは、異なる格付けシステムは他の推奨に使用されることができる。例えば、文字は、お勧めの運動レジメン、食事レジメンの数、及び医薬的推奨の色に使用されてもよい。
いくつかの実施形態では、推奨のタイプがペアに分類されているような2成分格付けシステムが使用される。そのシステムは、マイアーズ・ブリッグスタイプ指標(MBTI)システムに類似し得る。MBTIシステムでは、4組の選択又は二項分枝があって、個体は各ペアの一方に分類される。個体の選択は、1)外向又は内向、2)感覚又は直観、3)思考又は感情、4)判断又は知覚である。システムの改変は、個体のゲノムプロファイルに基づく健康及び精神衛生の改善のための個体に関する推奨の決定に使用され得る。
例えば、個体は、食生活に関してA又はBのいずれかであり得る、ここで、Aはあるタイプの栄養素ミックスを表し、そしてBは異なるミックスである。あるいは、ある食品タイプをA又はBに分類してもよい。個体は、運動レジメンに関して別の二項分岐分類、H又はLを持ち得る、この場合、Hは個体が高い負荷の運動に参加すべきであることを表す、Lは低い負荷の活動に参加すべきであることを表す。そういうものとして、個体はAHに分類できる。別の二項分岐分類は、社会的接触に関してであり得る。例えば、個体は、遺伝的に社交的(S)又は非社交的(U)である傾向を持ち、そうしたものとして、推奨は、ストレスを減らし彼らの健康と精神衛生を高めるためにその個体が避けるべき又は捜すべき人々の活動タイプ又はグループを含み得る。
個別の行動計画はまた、科学情報を含めて彼らに知られるようになった情報、又は個体からの情報、例えば「現場配置」メカニズム若しくは直接メカニズムなどに基づく因子を含むように更新されることもできる、例えば代謝物レベル、グルコースレベル、イオンレベル(例えばカルシウム、ナトリウム、カリウム、鉄)、ビタミン、血球数、ボディーマスインデックス(BMI)、タンパク質レベル、転写レベル、心拍数などが、容易に利用可能な方法によって決定でき、そして、彼らに知られたとき、及びリアルタイム追跡によるなどして彼らに知られるようになった場合、個別の行動計画中に織り込まれ得る。個別の行動計画は、例えば、個体が1若しくは複数の状態に関して持ち得る素因にも影響する可能性がある計画に従う個体に基づいて修正され得る。例えば、個体のGCIスコアを更新できる。
コミュニティーと動機づけ
本開示は、個体が自身の健康と精神衛生について十分に情報を得るような個体のゲノムプロファイルに基づく表現型プロファイル及び個別の行動計画、並びに個体が自身の健康を増進するに違いない専用オプションを提供する。個体に自身の個別の行動計画を続ける支援と動機を提供できるオンラインコミュニティーなどのコミュニティーもまた本明細書中に提供される。例えば、個別の行動計画に従うことによって自身の健康を増進しようとする個体の動機づけにはまた、報奨金も含むことができる。
個体は、コミュニティー、例えばオンラインコミュニティーなどに参加でき、そこで、個体又は彼らのヘルスケア管理者は個体のゲノムプロファイル、表現型プロファイル、及び/又は個別の行動計画にアクセスする。その個体は、個人的なオンラインポータルを通して、コミュニティーの全員、コミュニティーの小集団が見ることができる、又はコミュニティーのだれも見ることができないゲノムプロファイル、表現型プロファイル、及び/又は個別の行動計画を所有することを選ぶこともできる。友人、ファミリー、又は同僚が、オンラインコミュニティーの一部であってもよい。例えば、オンラインコミュニティー、例えばwww.enmeon.comやwww.changefire.comなどは、個体が目的を達成するように動機づけることで当該技術分野において知られている。本開示では、個体が、自身の表現型プロファイル、例えばGCIスコアをベースラインとして使用して、又は彼らの個別の行動計画における目標を達成することによって、自身の健康及び精神衛生を改善するように彼らを支援し、そして動機づけるオンラインコミュニティーのメンバーであるか、又はそれに参加する。オンラインコミュニティーは、その個体の友人、家族、若しくは同僚、又は友人、家族、及び同僚の組み合わせに限定することもできる。個体はまた、彼らが以前知らなかったオンラインコミュニティーのその他のメンバーを含むこともできる。オンラインコミュニティーはまた、雇用者が後援するコミュニティーであってもよい。個体は、自身の目的を果たすために互いに同じような表現型プロファイル、行動計画、及び動機づけを持つ他の人とグループを作ってもよい。個体は、彼らのGCIスコアを改善するために、及び/又は彼らの個別の行動計画の目標を達成するために、オンラインコミュニティー内で他の人とのコンペを手配してもよい。
例えば、個体の報告、例えば彼らのGCIスコアや個別の行動計画などは、オンラインコミュニティーにおいて個体の家族及び友人が見ることができる。個体は、だれが自身の報告を見ることができる、及び/又はアクセスできるかを選択することもできるか、又はそれを選択する選択肢を持つこともできる。オンラインバージョンは、チェックリスト又は個別の行動計画上の項目を含んだマイルストーン評価基準を含んでなることができ、そこで、個体は、自身の個別の行動計画の達成又は経過をチェックすることもできる。GCIスコアは、経過又は達成があれば更新され、そして報告オンライン上に反映され得る。個体はまた、個体に関する報告を変えることもある、変化した可能性がある因子、例えばライフスタイルの変化、運動レジメンの変更、食生活の変化などを入力してもよい。家族及び友人は、個体の経過、並びに個体の生活の変化、そしてそれらが個体のGCIスコアにどう反映されうるのか又はそれをどう変えうるのか見ることができる。オンラインポータルは、個体が初期の報告とその後の報告を見ることを可能にすることもできる。個体はまた、彼らの友人及び家族から反響とコメントを受け取ることもできる。家族及び友人は、支援及び動機づけするコメントを残すことができる。
オンラインコミュニティーはまた、自身の個別の行動計画を進展させることによって、及び/又は自身のGCIスコアを改善することによって自身の疾患のリスク又は素因を低減して、自身の健康を増進するインセンティブも個体に提供できる。インセンティブはまた、オンラインコミュニティーでないところでも個体に提供され得る。例えば、雇用者によって後援されたオンラインコミュニティーは、例えば疾患に関する自身のGCIスコアを改善し、その結果、自身の疾患の素因を低減するなどして個体が特定の目標に到達した場合に、雇用者がより多くの助成金を支給したり、追加の休暇を与えたり、又は個体の医療貯蓄口座に献金する健康計画を提供することもできる。あるいは、コミュニティーは、オンラインである必要はないので、個体は、雇用者に代わって健康計画を処理するように指名された人に自身の改善されたGCIスコアを提出する。
その他のインセンティブはまた、自身GCIスコアを改善することによって、及び/又は自身の個別の行動計画に従うことによって健康を増進するように個体を動機づけるのに使用できる。個体は、例えば特定の割合若しくは数値まで自身のGCIスコアを改善するなど特定の目標に到達したとき、又はあるカテゴリーから他のカテゴリー(すなわち、高リスクから低リスクに)移行したとき、あるいは個別の行動計画の特定の目標を達成することによって、賞品と交換するポイントを受けることもできる。例えば、個体は、特定の数値のGCIスコア減少を実現して、特定の時間枠内での疾患に対するリスクの最大の減少を達成するか、個別の行動計画における目標を達成するか、又は個別の行動計画の最大の目標を達成することもできる。
友人、家族、及び/又は雇用者はポイント及び/又は賞品を提供することもできるが、おそらく、自身のGCIスコアを改善した又は自身の個別の行動計画の目標を達成した個体に対して賞品としてそれらを購入し、そしてそれらを提供することによってなされる。個体はまた、別の人、例えば別の同僚、又は同じ目標を持つ友人のグループ、家族、若しくはオンラインコミュニティーのメンバーなどより前に目標に到達することでポイント/賞品を受け取ることもできる。例えば、一番最初に、特定の数値のGCIスコア減少を達成するか、特定の時間枠内に疾患に対するリスクの最大の減少を達成するか、個別の行動計画の目標を達成するか、又は個別の行動計画の最大の目標を達成する。個体は、現金、賞品としての現金と交換するポイントを受け取ることもできる。その他の賞品としては、医薬品、健康商品、ヘルスクラブ会員資格、温泉療法、医療、健康観察デバイス、遺伝子検査、旅行、及びその他のもの、例えば本明細書中に記載のサービスの契約、又は前述のアイテムに対する割引、補助金、又は還付などを挙げることもできる。
インセンティブは、友人、家族、及び雇用者によって援助できる。薬品会社、ヘルスクラブ、医療機器会社、温泉、及びその他のところもまた、インセンティブを援助できる。後援は、広告又は新規採用と引き換えであってもよい、例えば、薬学的組織は個体のゲノムプロファイルに関するデータを得ること、又は臨床試験に興味がある。さらに、インセンティブは、自身の健康を増進するように個体に動機づけするコミュニティー、例えば本明細書中に記載のオンラインコミュニティーなどに参加するよう個体を奨励するために使用できる。
プロファイル及び個別の行動計画へのアクセス
ゲノムプロファイル、表現型プロファイル、並びに表現型及びゲノムプロファイルに関連するその他の情報、例えば個別の行動計画などを含む報告が、個体に提供され得る。ヘルスケア管理者及び提供者、例えば介護者、医師、及び遺伝カウンセラーなどもまた、報告にアクセスできる。この報告は、印刷されるか、コンピューター上に保存されるか、又はオンラインで閲覧することができる。あるいは、プロファイル及び行動計画は、紙の形態で提供できる。それらは、ある時期に紙、コンピューターが読み取り可能な形式、又はオンラインによって提供されるその後の更新を伴った、紙又はコンピューターが読み取り可能な形式、例えばオンラインなどの状態で存在してもよい。結果は、コンピューターによって作り出され、そして出力できる。それらは、コンピューターが読み取り可能なメディアに保存できる。
ゲノムプロファイル、表現型プロファイル、並びに個別の行動計画には、オンラインポータル、コンピューターとインターネットウェブサイトの使用により個体によって容易にアクセスできる情報源、電話、又は情報への同様のアクセスを可能にするその他の手段によってアクセスできる。オンラインポータルは、任意にセキュリティーで保護されたオンラインポータル又はウェブサイトであり得る。それは他の安全及びセキュリティーで保護されていないウェブサイトへのリンク、例えば、個体の表現型プロファイルを有するセキュリティーで保護されたウェブサイト又はセキュリティーで保護されていないウェブサイト、例えば特定の表現型を共有する個体向けの掲示板などとのリンクを提供する。
報告は、個体のGCIスコア、GCIプラス、又はEGCIスコアの報告であってもよい(本明細書中に記載のとおり、報告のために、GCIスコアはまた、GCI、GCIプラス、及び/又はEGCIスコアの報告方法も包含する)。例えば、1若しくは複数の状態に関するスコアは、表示を用いて可視化できる。前記表示、例えば関連情報を含むパーソナルポータルなどを可視化するために、スクリーン(例えばコンピュータのモニター又はテレビジョンスクリーンなど)が使用できる。他の実施形態では、表示は、静止表示、例えば印刷されたページなどである。表示としては、以下の:bin(例えば1‐5、6‐10、11‐15、16‐20、21‐25、26‐30、31‐35、36‐40、41‐45、46‐50、51‐55、56‐60、61‐65、66‐70、71‐75、76‐80、81‐85、86‐90、91‐95、96‐100)、色若しくはグレースケール勾配、温度計、ゲージ、円グラフ、ヒストグラム又は棒グラフのうちの1若しくは複数が挙げられるが、これだけに限定されるものではない。他の実施形態では、温度計は、GCIスコア、並びに疾患/状態有病率を表示するために使用される。温度計は、報告されたGCIスコアに伴って変化するレベルを表示するために用いられ、例えば温度計はGCIスコアの増加するに従って比色的変化を表示できる(より低いGCIスコアに関する青色からより高いGCIスコアに関する赤色に漸進的に変化する)。関連する実施形態では、温度計は、報告されたGCIスコアに伴って変化するレベルと、リスクランクが増大する場合の比色変化の両方を表示する。
個体のGCIスコアはまた、聴覚的フィードバックを使用して個体に提供する。例えば、聴覚的フィードバックは、リスクランクが高いか又は低いことの言語化教示である。聴覚的フィードバックはまた、特定のGCIスコア、例えば数字、百分位数、範囲、四分位数、あるいは集団に関する平均又は中央値GCIスコアとの比較の口述である。一実施形態では、生身の人間が、自分で、あるいは遠距離通信デバイス上で、例えば電話(地上通信線、携帯電話又は衛星電話)で、又はパーソナルポータルを介して、聴覚的フィードバックを提供する。聴覚的フィードバックは、コンピューターなどの自動化システムによって提供され得る。聴覚的フィードバックは、通常電話呼び出しを使用してコンピューターに音声及びプッシュホンを検出させる技術である音声自動応答(IVR)システムの一部として提供される。個体は、IVRシステムを介して中央サーバーと交信し得る。IVRシステムは、記録済みの又は同時に作り出される音声信号と応答して、個体と交信し、彼らのリスクランクの聴覚的フィードバックを彼らに提供し得る。個体は、IVRシステムにより回答される数字を呼び出すこともできる。任意に、識別コード、セキュリティーコードを入力するか、又は音声認識プロトコールを受けた後、IVRシステムは、プッシュホン又は音声メニューなどのメニューから選択肢を選択するように個体に尋ねる。これらの選択肢のうちの1つは、個体に彼ら又は彼女らのリスクランクを提供することもできる。
個体のGCIスコアは、表示を使用して可視化され、聴覚的フィードバックを使用することで、例えば個人ポータル上で提供され得る。この組み合わせは、GCIスコアの視覚的表示、並びに個体の健康全般及び考え得る予防手段、例えば彼らの個別の行動計画などと、GCIスコアとの関連性について意見を交わす聴覚的フィードバックを包含し得る。
異なる報告オプションは、個体にとってアクセスできるものであり得る。例えば、オンラインアクセスポイント、例えばオンラインポータルなどは、彼らのゲノムプロファイルに基づいて、個体が1つの表現型又は2つ以上の表現型を表示することを可能にできる。契約者はまた、1つ又は複数の状態の簡単な症状を得るために、種々の視聴オプション、例えば「クイックビュー」オプションなどを持つこともできる。「総合ビュー」オプションもまた選択できる。ここでは、各カテゴリーのさらなる詳細が提供される。例えば、個体が表現型を発症する見込みについてのより詳細な統計、又は典型的な症状若しくは表現型、例えば医学的状態に関するサンプル症状、若しくは身長などの身体的な非医学的状態の範囲に関する詳しい情報、又は遺伝子及び遺伝子変異体についてのさらなる情報、例えば集団における発生率、例えば全世界、若しくは様々な国、様々な年齢範囲若しくは性別における発生率などについてさらなる情報があってもよい。例えば、多くの状態に関する推定生涯リスクの概要が、「クイックビュー」オプションの中にあってもよいが、その一方で、例えば前立腺癌又はクローン病などの特定の状態に関する追加情報は、他の視聴オプションであってもよい。違った組み合わせ及び変更が、違った視聴オプションに存在し得る。
個体によって選択された表現型が医学的状態である可能性があれば、報告中の別の処置及び症状は、その処置に関する詳細を含む他のウェブページにリンクするかもしれない。例えば、薬物の箇所をクリックすることによって、投薬量、費用、副作用、及び有効性に関する情報を含むウェブサイトに導かれる。その薬物を他の処置と比較することもできる。そのウェブサイトはさらに、その薬物の製造者のウェブサイトにつながるリンクを含むこともできる。別のリンクは、契約者が薬理ゲノム学的プロファイルを作成してもらうオプションを提供でき、そのプロファイルは、契約者のゲノムプロファイルに基づく該薬物に対して起こり得る彼らの応答などの情報を包含するであろう。予防処置、例えばフィットネスや減量などの、薬物の代替手段へのリンクもまた提供され、そしてダイエット用サプリメント、ダイエット計画、及び近隣のヘルスクラブ、診療所、健康及びウェルネス提供者、日帰り温泉等へのリンクも提供され得る。また、教育及び情報提供用ビデオ、利用可能な処置の概要、可能な治療法、及び一般的な提言もまた提供され得る。
オンライン報告はさらに、契約者に自身の表現型プロファイルに関するより多くの情報を求める機会を提供する、対面による医師又は遺伝カウンセリング予約をスケジュールに入れるためのリンク、又は遺伝カウンセラー又は医師にオンラインアクセスするためのリンクを提供できる。オンライン遺伝カウンセリング及び医師への質問へのリンクもまた、オンライン報告で提供されることもある。
他の実施形態では、この報告は「おもしろい」表現型についてのもの、例えば個体のゲノムプロファイルと有名人、例えばアルバート・アインシュタインのゲノムプロファイルの類似性についてのものであってもよい。この報告は、該個体のゲノムプロファイルとアインシュタインのものとの間の類似性パーセンテージを表示し、さらにアインシュタインと該個体の予測IQを表示することもできる。詳細には、一般集団のゲノムプロファイルと彼らのIQを該個体及びアインシュタインのものと比較する方法が含まれ得る。
他の実施形態では、報告は、個体のゲノムプロファイルと相関するすべての表現型を表示できる。他の実施形態では、その報告は、ある個体のゲノムプロファイルと正の相関がある表現型だけを表示できる。他の形式では、該個体は、ある表現型のサブグループ、例えば医学的表現型だけ、又は対処可能な医学的表現型だけを表示させることを選ぶことができる。例えば、対処可能な表現型及びそれらの関連遺伝子型には、クローン病(IL23R及びCARD15と相関)、1型糖尿病(HLA‐DR/DQと相関)、ループス(HLA‐DRR1と相関)、乾癬(HLA‐C)、多発性硬化症(HLA‐DQA1)、グレーブス病(HLA‐DRB1)、関節リウマチ(HLA‐DRB1)、2型糖尿病(TCF7L2)、乳癌(BRCA2)、結腸癌(APC)、エピソード記憶(KIBRA)、及び骨粗鬆症(COL1A1)がある。該個体は、報告に、表現型の下位カテゴリー、例えば医学的状態として炎症性疾患だけを、又は非医学的状態として身体的形質だけを表示させるように選ぶこともできる。いくつかの実施形態では、個体は、自身に関して推定リスクが算定された全状態を、それらの状態だけを強調することによって、高いリスクを有する状態だけを強調することによって、又は低いリスクを有する状態だけを強調することによって表示するように選ぶこともできる。
個体が提出する、及び個体に伝えられる情報は、安全且つ秘密とすることができ、そのような情報へのアクセスは該個体によって管理され得る。複雑なゲノムプロファイルから得られた情報は、監督官庁により承認された、理解可能な、医学関連の、及び/又は影響の大きいデータとして該個体に提供され得る。情報は、一般的に関心がもたれ、医学関連でないこともある。情報は、これだけに限定されるものではないが、ポータルインタフェース及び/又は郵送といったいくつかの手段によって安全に該個体まで伝達できる。より好ましくは、該個体が安全且つ秘密にアクセスできるポータルインタフェースによって、情報が該個体に安全に(もし該個体が選択すれば)提供される。そのようなインタフェースは、好ましくはオンライン、インターネットウェブサイトアクセスにより提供され、代替手段として、電話、又は個人的で安全且つ容易に利用可能なアクセスを可能にするその他の手段により提供される。ゲノムプロファイル、表現型プロファイル、及び報告は、ネットワーク上でのデータ送信により、個体又はそのヘルスケア管理者に提供される。
したがって、それにより報告が作成される論理回路の代表例であり、それは、ゲノムプロファイルを受信して保存し、遺伝子型相関を解析し、その遺伝子型相関解析に基づく規則を作成し、その規則をゲノムプロファイルに適用し、そして表現型プロファイル、個別の行動計画、及び報告を作成する、コンピュータシステム(又はデジタル装置)を含んでなる。コンピュータシステムは、メディア及び/又はネットワークポート(これは場合により、固定メディアを備えたサーバーに接続できる)からの指示を読み取ることのできる論理装置であると理解できる。システムは、CPU、ディスクドライブ、場合により入力装置、例えばキーボード及び/又はマウスなど、及び場合によりモニターを含む。データ通信は、示されたコミュニケーションメディアを通じてローカル又はリモート位置にあるサーバーへとおこなうことができる。通信メディアには、任意のデータ送信及び/又は受信手段が包含され得る。例えば、通信メディアは、ネットワーク接続、ワイヤレス接続又はインターネット接続とすることができる。そのような接続は、ワールドワイドウェブによる通信を提供できる。本開示に関するデータは、そのようなネットワーク又は接続上で、当事者が受信及び/又は検討するために送信できるということが想定されている。受信者は、個体、ヘルスケア提供者又はヘルスケア管理者であってよいが、これだけに限定されるものではない。一実施形態では、コンピューターが読み取り可能なメディアは、生体サンプル又は遺伝子型相関の解析結果の送信に好適なメディアを包含する。このメディアは、個体の表現型プロファイル及び/又は個体の行動計画に関する結果を内包でき、ここで、そのような結果は本明細書中に記載の方法を使用することで導き出され得る。
個人ポータルは、個体がゲノムデータを受信し評価するための一次インターフェイスとしての役割をもつ。ポータルは、サンプルの採集から検査及び結果に至る経過を個体が追跡するのを可能にする。ポータルへのアクセスにより、個体に、彼らのゲノムプロファイルに基づく共通の遺伝疾患に対する相対リスクが伝えられる。個体は、自身のゲノムプロファイルにどの規則を適用するかをポータルを通じて選ぶことができる。
一実施形態では、1若しくは複数のウェブページに表現型のリストがあり、各表現型の横に、契約者が自身の表現型プロファイルに含めることを選択できるボックスがある。表現型は、該表現型に関する情報にリンクしており、この情報は、契約者が自身の表現型プロファイルに含めることを望む表現型に関するインフォームド・チョイスをおこなう助けとなる。このウェブページはさらに、疾患群、例えば対処可能な又は不可能な疾患として、表現型を体系づけてあるかもしれない。例えば個体は、HLA‐DQA1やセリアック病などの対処可能な表現型しか選ぶことができない。契約者はまた、その表現型に関する発症前又は発症後の処置を表示させることができる。例えば、該個体は、セリアック病のための発症前処置(スクリーニング増大の他に)である、グルテン除去食という発症前処置のある対処可能な表現型を選ぶことができる。別の例は、スタチン、運動、ビタミン、及び精神活動というアルツハイマーの発症前処置である。血栓症がもう一つの例であり、経口避妊薬の回避及び長時間じっと座ることの回避という発症前処置がある。承認されている発症後処置のある表現型の一例は、CFHと関連する滲出型AMDであり、この場合、個体は該状態のためのレーザ治療を受けることができる。
表現型を疾患又は症状のタイプ又はクラス、例えば神経系、心臓血管系、内分泌系、免疫系などによって体系づけることもできる。表現型を医学的及び非医学的表現型としてグループ分けすることもできる。ウェブページ上にあるその他の表現型のグループ分けには、身体的形質、生理的特性、精神的形質、又は情緒的形質によるものがある。ウェブページはさらに、1つのボックスの選択により表現型の1グループが選ばれるセクションを提供できる。例えば、全表現型、医学関連表現型だけ、非医学関連表現型だけ、対処可能な表現型だけ、対処不可能な表現型だけ、異なる疾患群、又は「おもしろい」表現型を選択することである。「おもしろい」表現型は、著名人又はその他の有名な個体、又は他の動物若しくは他の生物との比較さえ包含できる。比較のために入手可能なゲノムプロファイルのリストもまた、個体が選択して自身のゲノムプロファイルと比較するために、ウェブページ上に提供され得る。
オンラインポータルは、個体がそのポータルをナビゲートし、特定の表現型を検索し、又は特定の用語若しくは彼らの表現型プロファイルか報告によって明らかになった情報を検索するのを助けるための検索エンジンも提供できる。パートナーサービス及び製品提供にアクセスするリンクもまたポータルにより提供され得る。共通の又は類似の表現型を有する個体のための支援グループ、掲示板、及びチャットルームへのさらなるリンクもまた提供され得る。オンラインポータルはまた、個体の表現型プロファイル中にある表現型に関する詳しい情報を記載する他のサイトへのリンクもまた提供できる。オンラインポータルはまた、個体が自身の表現型プロファイル及び報告を、友人、家族、同僚、又はヘルスケア管理者と共有できるサービスもまた提供できる。個体は、自身の表現型プロファイル中の明らかになっているどの表現型を友人、家族、同僚、又はヘルスケア管理者と共有したいかを選ぶことができる。
表現型プロファイル及び報告は、個体に個別の遺伝子型相関を提供する。個別の行動計画を作成するために使用される遺伝子型相関は、知識の増強と、自身の個人的なヘルスケア及びライフスタイル選択を決定する機会を個体に与える。遺伝子変異体及び処置が実行可能な疾患の間に強い相関が見出された場合、その遺伝子変異体の検出は、該疾患の処置及び/又はモニタリングを開始する個体の決定を助けるかもしれない。統計学的に有意な相関が存在しているが、強い相関ではないと思われる場合、個体はその情報をかかりつけの医師と共に検討し、適切で有益な行動方針を決定できる。特定の遺伝子型相関の観点から個体にとって有益であるかもしれない潜在的な行動指針には、治療処置の管理、処置の潜在的必要性若しくは処置の効果の観察、又は食生活、運動、及びその他の個人的な習慣/活動におけるライフスタイルの変更が包含され、それは、個体のゲノムプロファイルに基づいて個別の行動計画に個別化される。その他の個体情報、例えば既存の習慣及び活動などは、個別の行動計画に組み入れることができる。例えば、セリアック病などの対処可能な表現型には、グルテン除去食という発症前処置があるので、個別の行動計画の中に提供されることができる。同様に、遺伝子型相関情報を薬理ゲノム学を通じて適用し、特定の薬物又は薬物レジメンによる処置に対して個体に起こり得る応答、例えば特定の薬物処置の起こり得る有効性又は安全性を予測することができる。
遺伝子型相関情報を遺伝カウンセリングと連携させて利用し、生殖、並びに母親、父親、及び/又は子供に対する潜在的な遺伝学上の懸念を抱いているカップルに助言することができる。遺伝カウンセラーは情報を提供し、特定の状態又は疾患について高いリスクを示す表現型プロファイルを有する個体を支援することができる。彼らはその障害に関する情報を解釈して、遺伝パターン及び再発リスクを解析し、利用可能な選択肢を契約者と共に検討できる。遺伝カウンセラーはさらに、契約者をコミュニティー又は国の支援活動に紹介する、支持的カウンセリングを提供することもできる。遺伝カウンセリングには特別な契約プランが包含される。遺伝カウンセリングのオプションは依頼から24時間以内にスケジュールが決められ、従来とは異なる時間、例えば夜間、土曜日、日曜日、及び/又は休日などに利用可能でもあり得る。
個体のポータルはさらに、初期スクリーニングを超えたさらなる情報の送達を容易にする。個体は、自身の個人的な遺伝子プロファイルに関連する新しい科学的発見、例えば自身の現在の又は潜在的な状態に対する新たな処置又は予防策に関する情報などに関して知らされるであろう。この新しい発見はまた、彼らのヘルスケア管理者に送達されることもある。この新しい発見は、更新された又は改訂された個人的な行動画に組み入れられることもある。個体又は彼らの医療サービス提供者は、新しい遺伝子型相関及び個体の表現型プロファイル中の表現型に関する新たな研究について、eメールで知らされる。例えば、「おもしろい」表現型についてのeメールが個体に送信され、例えば、彼らのゲノムプロファイルがアブラハム・リンカーンのものと77%同一であり、そしてさらなる情報がオンラインポータルを介して入手できることがeメールで通知され得る。
契約者に、新規の又は改訂された相関、新規の又は改訂された規則、又は(例えば新たな予防及び健康情報、開発中の新たな治療法、若しくは利用可能な新たな処置を含めた)新規の又は改訂された報告について通知するためのコンピューターコードも提供される。本開示はさらに、新しい規則を作成し、規則を修正し、規則を組み合わせ、規則のセットを新しい規則によって定期的に更新し、ゲノムプロファイルのデータベースを安全に維持し、表現型プロファイルを決定するためにその規則をゲノムプロファイルに適用し、個別の行動計画を作成し、そして報告を作成するための(異なる契約の個体のために異なるレベルのアクセスとオプションを承諾するコンピューターコードを含めた)コンピューターコードのシステムを提供する。
契約
ゲノムプロファイル、表現型プロファイル、及び報告は、個別の行動計画を含めて、ヒト又はヒト以外の個体に関して作成できる。例えば、個体には、他の哺乳動物、例えばウシ、ウマ、ヒツジ、イヌ、又はネコなどが含まれ得る。個体とは、人のペットであるかもしれず、ペットの所有者が自身のペットの健康と寿命を増進する個別の行動計画を求めることもある。個体、又は彼らのヘルスケア管理者が契約者であることもある。本明細書中に記載したように、契約者とは、1若しくは複数のサービスに対する購買又は支払いによりサービスを契約する人間の個体である。サービスには、次のもののうち1若しくは複数が包含されるが、これだけに限定されるものではない:自身又は別の個体、例えば契約者の子供又はペットなどのゲノムプロファイルを決定させること、表現型プロファイルを入手させること、その表現型プロファイルを更新させること、並びに自身のゲノム及び表現型プロファイルに基づく(個別の行動計画を含めた)報告を入手すること。
契約者は、ゲノムと表現型プロファイル又は報告を、例えば医師又は遺伝カウンセラーなどの彼らのヘルスケア管理者に提供することを選ぶこともできる。ゲノムと表現型プロファイルは、ヘルスケア管理者によって、ヘルスケア管理者にわたすためにコピーを印刷した契約者によって直接的アクセスされ得るか、あるいは、オンラインポータル、例えばオンライン報告のリンクなどを通じてヘルスケア管理者にそれを直接送信することもできる。
ゲノムプロファイルは、契約者及び非契約者について作成されてデジタル保存されるが、この表現型プロファイル及び報告へのアクセスは、契約者に限定される。例えば、少なくとも1つのGCIスコアに対するアクセスは、契約者には提供されるが、非契約者には提供されない。別の変形形態では、契約者及び非契約者の両方が自身の遺伝子型及び表現型プロファイルにアクセスできるが、非契約者に対してはアクセスを制限されるか、又は限定された報告しか作成されず、一方、契約者は完全なアクセスができ、完全な報告が作成される。他の実施形態では、契約者及び非契約者の両方が初期には完全なアクセス又は完全な初期報告を入手できるが、契約者だけが、自身の預けられたゲノムプロファイルに基づく更新された報告にアクセスできる。例えば、アクセスは非契約者にも提供されるが、この場合、非契約者は自身のGCIスコアのうちの少なくとも1つへのアクセスに制限されるか、又は彼らは作成された自身のGCIスコアのうちの少なくとも1つに対する初期報告は入手できるが、更新された報告は契約した時にのみ作成される。ヘルスケア管理者及びヘルスケア提供者、例えば介護者、医師、及び遺伝カウンセラーなどもまた個体のGOIスコアのうちの少なくとも1つにアクセスできる。
いくつかの実施形態では、EGCIスコアへのアクセスは、様々な契約レベルによって制限されることもある。例えば、個体は、自身のGCIスコアに対する契約はできるが、自身のEGCIスコアへのアクセスは制限されるか、又はEGCIスコアを用いた具体的な状態又は疾患へのアクセスは制限されることもある。あるいは、GCIスコアは非契約者に提供され、そしてEGCIスコアが契約者に提供されることもある。契約レベルはさらに、彼らの環境因子を更新又は修正して、更新された又は改訂されたEGCIスコアを作成する個体によっても変わる。例えば、個体は、自身の環境因子を更新するためにシステムに無制限にアクセスするために進行中の契約を継続できる。あるいは、個体は、進行中の契約は継続しないが、彼らが自身の環境因子を更新して、新しいEGCIスコアを作成する回毎に支払いをすることを選ぶこともできる。EGCIスコアの更新はさらに、新しい科学情報、例えば遺伝的多型と疾患又は症状の間で発見された新しい相関、あるいは他の遺伝因子及び1若しくは複数の疾患又は症状とそれらとの関連などを組み込むこともできる。個体はさらに、彼らが変更を望み得る環境因子に基づいてEGCIスコアを作成するオプションを持つこともできる。例えば、個体は、ある都市への移動を企図していれば、該個体は、その都市に関連する特定の環境因子を入力又は選択して、それらのEGCIスコアに対する影響を見ることもできる。
他の契約モデルには表現型プロファイルを提供できるものが含まれるが、ここで、契約者は、自身のゲノムプロファイルに対して既存の全規則を適用するか、又は自身のゲノムプロファイルに対して既存の規則の小集団を適用するか選ぶことができる。例えば、彼らは、対処可能な疾病表現型に関する規則だけを適用することを選ぶことができる。契約は、1つの契約クラスの中にも異なるレベルが存在するようなクラスの契約であってもよい。例えば、異なるレベルは、契約者が自身のゲノムプロファイルに関連させたい表現型の数、又は自身の表現型プロファイルにアクセスできる人数に依存し得る。
契約の別のレベルでは、既知の表現型といった個体に特有の因子、例えば年齢、性別、又は病歴などを彼らの表現型プロファイルに組み込むことができる。基本契約のさらに別のレベルでは、個体が、ある疾患又は症状についての少なくとも1つのGCIスコアを作成できる。このレベルの変形では、個体は、少なくとも1つのGCIスコアの作成に使用された解析における変化のために、少なくとも1つのGCIスコアに何らかの変化があった場合に、その疾患又は症状について少なくとも1つのGCIスコアの自動更新がなされるような指示ができる。いくつかの実施形態では、その個体は、eメール、音声メッセージ、テキストメッセージ、郵便、又はファクシミリによって自動更新を通知され得る。
契約者はさらに、自身の表現型プロファイル及びその表現型に関する情報、例えばその表現型に関する遺伝的及び医学的情報などを含む報告を作成することができる。個体がアクセスできる情報量の違いは、彼らがした契約のレベルに依存する。例えば、個体が持ち得る異なる視聴オプションは、彼らの契約レベル、例えば非契約者のクイックビュー又はより基本的な契約などに依存するが、総合ビューは完全な契約を有する契約者にとってアクセス可能である。
異なるレベルの契約は、情報に対するアクセスしやすさの異なる変形又は組み合わせを持つ、例えばその集団における該表現型の有病率、相関に使用された遺伝子変異体、該表現型を引き起こす分子機序、該表現型の治療法、該表現型の処置選択肢、及び予防処置などが報告に含まれ得る。他の実施形態では、報告は、ある他個体の遺伝子型と別の個体、例えば著名人又はその他の著名人の遺伝子型の間の類似性などの情報を含むことができる。類似性に関する情報には、相同性パーセント、同一変異体の数、及び類似した表現型がある。これらの報告はさらに少なくとも1つのGCIスコアを含み得る。
契約レベルに基づく別のオプションは、報告がオンラインでアクセスされるのであれば、表現型に関するさらなる情報を有する他のサイトへのリンク、オンラインサポートグループ及び同じ表現型又は1若しくは複数の類似表現型を持つ人々の掲示板へのリンク、オンライン遺伝カウンセラー又は医師へのリンク、あるいは遺伝カウンセラー又は医師との電話若しくは対面予約のスケジュールへのリンクを含むことができる。報告が紙の形態である場合には、情報は、前記リンクのウェブサイトアドレス、又は遺伝カウンセラー若しくは医師の電話番号と住所であってもよい。契約者はまた、どの表現型を自身の表現型プロファイルに組み込み、どんな情報を自身の報告に含めたらよいか選ぶことができる。表現型プロファイル及び報告はさらに、個体のヘルスケア管理者又はヘルスケア提供者、例えば介護者、医師、精神医、心理士、セラピスト、又は遺伝カウンセラーなどによってアクセス可能であるかもしれない。契約者は、表現型プロファイル及び報告、又はその一部を、そのような個体のヘルスケア管理者又はヘルスケア提供者にアクセス可能とさせるかどうか選ぶことができる。
別のレベルの契約は、初期の表現型プロファイル及び報告の作成後も個体のゲノムプロファイルをデジタルで維持し、最新の研究により更新された相関を含む表現型プロファイル及び報告を作成する機会を契約者に提供する。契約者は、最新の研究により更新された相関を含むリスクプロファイル及び報告を作成する機会を有する。研究によって遺伝子型及び表現型、疾患又は症状の間に新しい相関が明らかなるとき、これらの新しい相関に基づいて新しい規則が作成され、既に保存され維持されているゲノムプロファイルに適用され得る。新しい規則は、以前にいずれの表現型とも相関しなかった遺伝子型を相関させるか、遺伝子型を新しい表現型と相関させるか、既存の相関を修正するか、又は遺伝子型と疾患又は症状との新たに発見された関連性に基づくGCIスコアの調整基準を提供できる。契約者は、eメール又は他の電子的手段により新しい相関に関して知らされ、その表現型が興味深いものであれば、自身の表現型プロファイルを新しい相関によって更新することを選ぶことができる。契約者は、更新毎に、いくつかの更新に対して、又は所定の期間(例えば3カ月、6カ月、又は1年間)の無制限な回数の更新に対して支払をおこなう契約を選ぶことができる。別の契約レベルは、個体が自身の表現型プロファイル又はリスクプロファイルをいつ更新するか選ぶ代わりに、新たな相関に基づいて新しい規則が作成されたときはいつでも契約者が自身の表現型プロファイル又はリスクプロファイルを自動更新させるというものである。
表現型と遺伝子型との相関に関する規則を作成し、個体のゲノムプロファイルを決定し、そのゲノムプロファイルに該規則を適用し、そして外個体の表現型プロファイルを作成するサービスを、契約者が非契約者に紹介することができる。契約者が紹介することにより契約者にはそのサービスの契約に割引料金が提供されるか、又は彼らの既存の契約がアップグレードされ得る。紹介された個体には、時間限定の無料アクセスか、又は割引契約料金が提供され得る。
以下の実施例は、本明細書中に記載の実施形態を例示及び説明するものである。本開示の範囲はこれらの実施例により制限されるものではない。
実施例1:GCIの評価
WTCCCデータ(Wellcome Trust Case Control Consortium,Nature.447:661‐678(2007))を使用して、GCIフレームワークを試験した。このデータセットは、疾病表現型に基づいて7つの下位集団に分割される約14000人の個体と、UK Blood Service Control Groupからの1500のサンプルから成る1つの非罹患対照下位集団の遺伝子型を含む。それらの遺伝率及び平均生涯リスクにおいて実質的に異なる3つの異なる疾患:2型糖尿病、クローン病、及び関節リウマチとの関連においてGCIを試験する。よって、分析は、2型糖尿病、クローン病、関節リウマチの下位集団、及びコントロール群に限られる。これらの状態の各々と有意に関連することが文献に報告されており、且つ、1セットの品質の基準(表2を参照のこと)を通過したSNPを使用した。
Figure 2015007985
これらのSNPの各々について、相対生涯リスクを、WTCCCデータセットにおいて見つけた対立遺伝子の実証的な分布に基づいて本明細書中に記載したように算定し、そしてGCI組成を使用して、個体ごとの推定リスクを算定した。既知のリスク変異体の一部は、WTCCCによって使用されているAffymetrix 500k GeneChipアレイ上に存在していないので、そのため、GCIの予測性は、以下の分析において提示されるものに比べてよくなりそうであると予想される。
受信者作動性曲線(ROC)(The Statistical Evaluation of Medical Tests for Classification and Prediction,MS Pepe.Oxford Statistical Science Series,Oxford University Press(2003))を状態の予測試験の役割を果たすGCIの能力を評価するために使用する。完全な試験のために、閾値tが、tより大きいスコアを有するすべての個体が状態を発症し、且つ、tより小さいスコアを有するすべての個体が状態を発症しないように選ばれる。しかしながら、実際には、どんな閾値についても、偽陽性及び偽陰性代入の一部が存在する。ROC曲線は、偽陽性率と真陽性率との相関を図によって描くので、そのため、それは試験感度と特異性の間のトレードオフを導くために使用される。異なるリスク推定スコアを比較するために、定量的な尺度としてROC曲線下面積(AUC)を使用する。AUCはさらに、状態の遺伝子的原因が完全に理解されている最適のシナリオと比較した場合のあらゆるスコアの相対的利益も示すことができる。一般に、AUCの値が大きいほど、分類のためにより良好なスコアである。分類がランダムにおこなわれるのであれば、AUCは0.5であると予想され、そして最適のスコア(すなわち、ある閾値にて、真陽性部分が1になり、且つ、偽陽性部分が0になるスコア関数)に関して、AUCは1と等価である。
比較のためのベースラインを得るために、データを適合させるためにSNP間の相互作用を利用する最適モデルを算定するロジスティック回帰を使用する。SNPがs1、s2、...、snである場合、その時のモデルはロジットがX=a11+a22+、...、+ann+a1212+、...、+a1212+、...、+an-1,nn-1,nである仮定され、この場合、sijがsiとsjの間の相互作用である。適合確率を、リスクに関する推定として使用し、これらのリスク推定のためにROC曲線を作成する。このモデルはSNP間の対相互作用を考慮に入れるため、GCIスコアと少なくとも同じくらい正確であるべきであるが、典型的にはそれらを考慮しない。さらに、一対のSNPの間に連鎖不平衡が存在する場合、ロジスティック回帰はこの相関に対応することに困難があるが、典型的にはGCIはそれを無視する。よって、ロジスティック回帰解析モデルを提案されたGCIスコアと比較することで、GCIの予測力に対して様々な仮定の効果を計測する能力を与えている。図1は3つの疾患シナリオのすべてに関するROC曲線を示し、そして表3はそれらのAUCを示す。GCI及びロジスティック回帰に関するAUCは、3つの疾患すべてについて全く同様であり(表3)、少なくともこれらの疾患及びこれらのSNPに関して、SNP‐SNP相互作用がリスク評価に関する実質的な情報を加えることはないという結論に至る。そのため、従来の研究からのそういった相互作用に関する証拠が存在しない限り、SNP‐SNP相互作用が無視できるという仮定は正当である。
Figure 2015007985
GCI ROC曲線は理論的状態モデルと比較される。この疾患モデルは、疾患が環境と遺伝子の両方の因子によって影響を受け、且つ、その2つの因子が独立していると仮定している。表現型PはP=G+Eによって表される。その場合、Gは遺伝的リスクであり、Eは環境リスクである。そして、また、連続モデルとも呼ばれる一次モデルは、通常、G及びEがそれぞれ標準偏差σG及びσEで分配され、且つ、固定値αに関してP>αの場合に、個体がその一生のうちに状態を発症する、と仮定する。遺伝率hが多くの複合疾患で知られているので、σG、σE、及びαは、h=σG 2/(σG 2+σE 2)、並びに平均生涯リスクがPr(P>α)であるという制約を使用して固定する。試験される状態の各々に関して遺伝率と平均生涯リスクが知られているので、モデルに関するパラメーターを疾患によって設定する。このモデルに基づく分布Pからの100000の無作為標本が作成される。Gは各個体に関して知られていると仮定し(E及び疾病状態は未知である)、そしてROC曲線をGに基づいて作成する。これは、遺伝的リスクがすべての個体に関して完全に理解されていて、且つ、正しく計測されている最適のシナリオを表している。この疾患モデルに関して、最適のシナリオに関するAUCは、疾患の遺伝率及び平均生涯リスクに依存するだけであり、σG、σE、又はαの選択に依存しない。
この一次モデルに関するROC曲線下の面積の理論的最大値は、疾患の平均生涯リスク(ALTR)と遺伝率だけに依存する。仮に、σeが環境変数の変化を意味し、σgが遺伝的変数の変化を意味することとする。このモデルでは、通常、遺伝的変数(G)及び環境変数(E)の両方が分配される。ROC曲線の理論的最大値は、遺伝的変数が正確に分かっている一方で、環境変量が未知である場合に得られる。個体は、G+E>αであれば真症例であり、そうでなければ真対照である。遺伝的変数に関して選ばれるカットオフ値に関して、そのカットオフ値より高い個体は症例とみなされ、残りは対照とみなされる。真陽性部分(TPF)は症例と呼ばれる真症例部分であり、偽陽性部分(FPF)は症例と呼ばれる真対照部分である。カットオフ値の異なる値に関してTPF対FPFは、ROC曲線を我々にもたらす。
個体の遺伝的変数が一部のカットオフ値(c)に比べて高い確率を、以下のとおり表す。
Figure 2015007985
個体の遺伝的変数がカットオフ値より高い確率、且つ、個体が真症例であるのは、以下の式:
Figure 2015007985
のとおりである。
非ゼロ平均生涯リスクに関して、αは以下の式:
Figure 2015007985
により直線的に増加するので、γは固定値である。
定義により、遺伝率は以下のとおりである。
Figure 2015007985
前記二重積分における大括弧内の積分は、誤差関数、erfの観点から表すことができる。正規分布の累積分布関数が以下の式:
Figure 2015007985
によって表されるので、前記大括弧内の積分は以下のとおりである。
Figure 2015007985
よって、個体が真症例であり、且つ、その遺伝的変数がcより大きい確率は、以下のとおりに表すことができ、
Figure 2015007985
その場合、f(h)及びg(h)は遺伝率の一部の関数である。この方程式に以下の式:
Figure 2015007985
を代入することで、我々は以下の式を見出すことができる。
Figure 2015007985
そのため、P(G>c且つG+E>α)は、以下のとおり表すことができる。
Figure 2015007985
同様に、個体が真対照であり、且つ、その遺伝的変数がcより大きい確率は、すなわち、以下のとおりである。
Figure 2015007985
そのため、TPF=P(G>c且つG+E>α)/ALTRなので、任意のβに関する真陽性部分は、h及びALTRにのみ依存する。
FPF=P(G>c且つG+E<=α)/[1‐ALTR]なので、偽陽性部分に関しても同じである。したがって、βのすべての起こり得る値におけるTPF及びFPFに基づく理論ROC曲線下総面積は、σe及びσgと無関係である。
二次モデル、又は離散モデル、従来モデルの変形では、G=Σλii+Yと仮定され、この場合、Yは、通常、標準偏差σYで分配され、且つ、Xi〜B(2,pi)は二項分布する。この場合、Xiは大きな影響のあるSNPに対応し、Yはその他の多くの小さな遺伝的影響を表す;小さな遺伝的影響が十分に存在すれば、それらの合計の漸近的挙動が正規分布に従うであろうことが予想できる。適切にパラメーターA、σY、及びpを設定することによって、大きな影響があるSNPの相対リスクを制御できる。これらのパラメーターは、相対リスクが実際のデータで観察された値に近づくように選ばれる(表4を参照されたい)。従来のモデルと同様に、Gが知られていて(Eは未知である)、且つ、大きな影響があるSNPの相対リスクとリスク対立遺伝子頻度が固定値である場合、離散モデルのROC曲線下面積は、疾患の遺伝率と平均生涯リスクにのみ依存する。
モデル1のそれに類似した結果が疾患モデル2に関しても得られた。特に、SNPの相対リスクが疾患に関連することが知られており、且つ、リスク対立遺伝子頻度(pi)が固定値である場合、そのとき、ROC曲線下総面積は疾患の遺伝率と平均生涯リスクにのみ依存する。このモデルでは、遺伝的変数は、G=Σλii+G1である。ここで、G1〜N(0,σg1)及びXiは二項分布B(2,pi)にしたがって分配され、この場合、piが位置iにおけるリスク対立遺伝子の対立遺伝子頻度である。B(2,pi)は、遺伝子座iにおける個体のリスク対立遺伝子コピー数を表す。Xi=0は、非リスク対立遺伝子の同型接合を意味し、Xi=1は、異型接合を意味し、そしてXi=2は、リスク対立遺伝子の同型接合を意味する。正規の変数は未知の遺伝子成分を表す。従来と同様、通常、環境変量Eは、平均0、且つ、標準偏差σeで分配される。表現型は、P=G+Eによって表され、P>αを有する個体は罹患しているのに対して、残りは対照である。αは、罹患した個体部分が該疾患の平均生涯リスクと等しくなるように選ばれる。
このモデルの遺伝率は、以下のとおりである。
Figure 2015007985
仮に、我々が、異型接合遺伝子型の既知のSNPの相対リスクが固定値であり、これらをRNiによって示すと仮定したとする。定義上、異型接合体の相対リスクは、以下の式:
Figure 2015007985
によって与えられ、この場合、W=Eλjjであり、すべてのjについてはiと等しくない。仮に、erfが誤差関数を意味し、且つ、erfcが相補誤差関数(すなわち1−erf(x))を意味するとする。以下:
Figure 2015007985
のとおりなので、相補誤差関数の観点で表された相対リスクは、以下の式:
Figure 2015007985
によって表される。よって、疾患カットオフ値α有するλiが、以下の式:
Figure 2015007985
(これらは独特であるかどうかわからない)の一部の選択に関するSNPの解を表す場合、そのとき、Lαのカットオフ値を有するLλiは、G1及びEの標準偏差がLの因数によって変えられたのであれば、必然的に解になる。zが常にλiの一次結合であるので、このことが結果として起こる。そのため、以下の:
Figure 2015007985
は、以下の:
Figure 2015007985
に無関係であり、且つ、単独で遺伝率とALTRに依存している。
定義上、以下のとおりである。
Figure 2015007985
そのため、これは以下の式を意味する。
Figure 2015007985
以下の式:
Figure 2015007985
及びpiが以下の式:
Figure 2015007985
とは無関係なので、以下の式は単独で、遺伝率とALTRの関数である。
Figure 2015007985
仮に、Z=Σλii及びVがXi値のベクターを意味するとする。そのとき、以下の式:
Figure 2015007985
が単独で遺伝率、ALTR、及びvの関数であり、且つ、以下の式:
Figure 2015007985
に無関係である。
真陽性部分は:Pr(G>c且つG+E>α)/Pr(G+E>α)と定義され、この場合、cは遺伝的変数のカットオフ値を意味する。仮に、β=c/σg1とする。TPFの分子は、以下のとおり算定される:
Figure 2015007985
正規分布の累積分布関数を表すために誤差関数を使用することで、Pr(G>c且つG+E>α)は、以下のとおりであり、
Figure 2015007985
その場合、r及びsはいくつかの関数である。この方程式に以下の式:
Figure 2015007985
を代入することで、我々は以下の式を理解することができる。
Figure 2015007985
そのため、P(G>c且つG+E>α)は以下のとおり表される。
Figure 2015007985
同様に、個体が真対照であり、且つ、その遺伝的変数がcより大きい確率は、すなわち、以下のとおりである。
Figure 2015007985
iが固定されていれば、ALTR=P(G+E>α)及びPr(V=v、Z=z)が固定される。そのため、任意のβに関する真陽性部分は、h及びALTRにのみ依存する。FPF=Pr(G>c且つG+E<=α)/[1−ALTR]であるので、同様のことが偽陽性部分に関しても真実である。それで、βのすべての起こり得る値でTPF及びFPFに基づいている、理論上ROC曲線下面積は、σe、σg1及びXiとは無関係である。
以下の式:
Figure 2015007985
を解くことにより、以下のとおりとなる。
Figure 2015007985
それで、LHSが常に1より小さいので、以下のとおりとなる。
Figure 2015007985
以下の式:
Figure 2015007985
の全体の解は、以下の反復手順を使用することによって同時に得ることができる。
最初に、各SNPに関して以下の式:
Figure 2015007985
を決定し、それが存在する唯一のSNPであると仮定する(すなわち、λj=0であり、すべてのjに関してiと等しくないと仮定する)。これは、0と以下の値:
Figure 2015007985
の間の二分探索を使用して行うことができる、なぜならば、RNiが以下のとおり増加するからである。
Figure 2015007985
これらの値は、以下の式:
Figure 2015007985
に関する初期推測値である。その時、1)決定:
Figure 2015007985
は他のSNPに関する式:
Figure 2015007985
が以前に算定されたものと等しいと仮定し、2)決定:
Figure 2015007985
は他のSNPに関する式:
Figure 2015007985
が以前に算定されたものと等しいと仮定し、3)決定:
Figure 2015007985
は他のSNPに関する式:
Figure 2015007985
が以前に算定されたものと等しいと仮定する。すべてのRNi値が、実際の値に十分に近ければ、終了する。そうでなければ、ステップ1に戻ること。
よって、すべての遺伝的変動性が知られており、モデル化されているが、環境的変動性はそうではない場合に、生じるであろう二セットの最適ROC曲線が提供される。一次モデルは、累積している多くの小さい遺伝的影響が存在すると仮定し(それにより、通常、遺伝的影響は分散確率変数によって表される)、それに対し、二次モデルは、小さな影響しか持たない多数のその他の遺伝子変異体に加え、大きな影響を持つ少数の遺伝子変異体が存在すると仮定している。両モデルは、状態の遺伝率と生涯リスクを考慮し、現在知られているものに基づいて未知の遺伝的リスク因子の現実的な推定につながった。図1は、これらのシナリオに関するROC曲線を示し、そして表3はそれらの面積を表す。GCIの曲線下面積は、最適な理論的包括モデル未満であり、それは、さらなる未知の遺伝子変異体、及び/又は相互作用がこれらの疾患に影響していると予想されることを示唆している。
図1に基づいて、予測モデリングの改善だけが、おそらく、本明細書中で検討した3つの状態に関する追加の遺伝子変異体の発見を成し遂げる。遺伝因子の何パーセンテージがこれまでにデータに捕らえられたのかを知るのは有用である。ROC曲線アプローチを使用したこの数量の推定は、主要な遺伝因子が既に発見され、且つ、低い相対リスクをもつその他の多数の未知の遺伝因子が存在するという大きな仮定を用いて開発されている。
さらなる独立した一般的(小規模な対立遺伝子頻度10%以下)変異体の潜在的な数は、そのような各変異体が、同型接合変異体に関して1.1の相対リスクに貢献し、異型接合変異体に関して1.05の相対リスクを寄付する場合に、指定され、その推定が、本質的には、理論的最適結合程度に大きなAUCを有するROC曲線を得るために十分である変異体の数をもたらす。
3つの状態の各々に関して、遺伝因子は、低い相対リスクをもつかなりの数の未知数k個の変異体に加えて、(表2にあるとおり)既知のものであると仮定する。100000人の個体から成るシミュレーションに基づいて、およそ1600の追加の変異体が、2型糖尿病の遺伝子変異体について説明するのに必要とされた。これは直感であるが、2型糖尿病のAUCは、64%の高い遺伝率値にもかかわらず、現在の知見によるとかなり低い。クローン病及び関節リウマチに関して、それぞれ13958個及び6237個のさらなる遺伝因子が見つかったと予想されるので、結果はよりいっそう衝撃的である。そのため、現在知られている遺伝子変異体は、これらの状態の総遺伝子変異の4%〜14%の割合を占める(表4を参照のこと)。しかしながら、これらの結果は、その他の大きな影響が存在しないと予想されるという事実を条件としているが、実際には、SNP‐SNP若しくはSNP‐環境相互作用、又はその他のそれほど研究されていない変異体(例えばコピー数変異体、希少変異体、エピジェネティック変異体)によるいくつかの大きな影響がまだ存在している可能性もある。
Figure 2015007985
実施例2:未知のSNP‐SNP相互作用の理論的影響
GCIスコアは、すべてのSNPが互いに無関係であり、且つ、それらが疾患に関するリスクに対して独立した影響をもつという仮定に基づいている。図1に示されているように、本明細書で研究した3つの例は、GCIモデルと、SNPの間の対依存性がロジスティック回帰を通して包含されているモデルの有意差を全く示していない。SNP‐SNP相互作用が他の疾患において存在していて、考慮されなければならないたくさんの既知の例がある(例えば、Zheng et al.,N Engl J Med.358:910‐919(2008))。これらの相互作用が知られていれば、それらを容易にGCIモデルに組み入れることができる。しかしながら、リスク推定に対する未知のSNP‐SNP相互作用の影響を理解することは重要である。
さらに詳細に相互作用の問題を調査するために、相対リスクがデータセット中の一対のSNPと無関係ではない相互作用モデルの下、データセットをシミュレートする。リスク評価のための2つのアプローチに基づいてROC曲線をプロットするために、シミュレートした症例‐対照データを使用する。最初に、相互作用モデルに従って個体の相対リスクを算定する。次に、GCIアプローチに従って相対リスクを割り当て、それが乗法的モデルを仮定する。図2及び表5で観察されたとおり、相互作用係数が非常に高いときにだけ、ROC曲線が実質的に異なる。
Figure 2015007985
しかしながら、SNP対の間のそのような強い相互作用は、ゲノムの広範な広い関連研究の中で発見されそうであり、しかも、そのような強い相互作用に参加する2つのSNPが検出可能な主な影響がないことを見つけることは、例外的であるであろう。特に、全ゲノム関連研究では、SNP‐SNP相互作用が試験されたが、有意であることがわからなかったと報告することが多い(例えば、Barrett et al.,Nature Genet.40:955‐962(2008))。そのため、1セットのSNPに関して、そのような相互作用が文献中で報告されていないとき、簡単な加法的試験の分類精度が、相互作用を含む正しいモデルの分類精度と劇的に違っていることはありそうもない。
未知のSNP‐SNP相互作用の影響を試験するために、以下のモデルに基づくデータをシミュレートする。仮に、λiが遺伝子型(gi)の特定の組み合わせに関する疾患を相対リスクを表し、pが疾患を発症する平均確率(すなわち、生涯リスク)を表すとする。相対リスクの定義上、λi=(疾患|gi)/P(疾患|g0)。ここで、g0は疾患を発症する最小機会を有する遺伝子型を意味する。簡単な乗法的モデルで、総相対リスクを得るために、遺伝子座全域の相対リスクを掛ける。よって、以下のとおりになり、
Figure 2015007985
この場合、λijがjth遺伝子座に関する相対リスクを意味する。相互作用モデルでは、ある組み合わせの遺伝子型に関する相対リスクの特定の対が、相対リスクの積より2倍又は10倍大きいと仮定する;この数は相互作用係数と呼ばれる。その他のすべてのSNPに関して、相対リスクは独立していると仮定する。例えば、SNPのxとyが相互作用する場合、そのとき、この対の相対リスクは(gix、giy)の特定の立体配置に関してK=2λixλiyであり、その他の組み合わせに関してK=λi1λi2である。この場合、総リスクは以下のとおりであろう。
Figure 2015007985
このモデルに基づいて、100000の無作為に読み出されたサンプルに関する疾病状態標識を割り当てる。個体に割り当てられる確率は、一症例でP(疾患|gi)=Cλiであり、この場合、Cが標準化因子であり、λiが相互作用モデルに基づく個体iの相対リスクである。Cは、症例部分が疾患の平均生涯リスクに近づくように選ばれる。これは、相互作用モデルの下、症例及び対照に関して大規模にシミュレートしたデータをもたらす。
実施例3:リスク推定における絶対誤差の計測
ROC曲線は、診断を評価するための1つの基準としての役割を果たす、つまり、それは、試験が健康と病気の個体を見分ける能力の定量的尺度を提供する。しかしながら、生涯リスクを推定するとき、正確な確率的推定が使用されていない場合、ROC曲線は理想的な尺度でない。特に、任意のスコア関数対に関して、f1がf2の単調な増加関数である限り、f1(G)及びf2(G)、すなわちROC曲線の関数が同一である。例えば、我々は平易にf2(G)=log(f1(G))を割り当てることができ、そしてこの際、リスクを推定するためにスコアf1及びf2を使用することで、我々はまさに同じROC曲線を得る。しかしながら、これらの2つの関数は、個体に対する大きく異なる確率論的リスク推定をもたらし得る。よって、ROC曲線は、必ずしも、確率論的リスクを報告する試験のための優れた尺度であるわけではない。確率論的リスク評価に関して、より有益な試験は、真のリスク確率と推定リスク確率の平均絶対差であろう。
病気を発症する真の確率が未知であるので、症例‐対照データがGCIパラメーター(すなわち、相対リスク)を算定するのに使用されるシナリオがシミュレートされ、その後、別の独立にシミュレートされた集団に対するGCIリスク推定が適用される。シミュレーションのための状態モデルは、(先に記載したように)疾患の遺伝因子が正規分布によって近似される少数の大きな影響があるものと多数の小さな影響しかないものに分解されると仮定する。ほとんどの疾患が生涯の後期で診断されるので、疾患の発病年齢がモデルに導入される。モデルに基づいて疾患を発症すると決定している各々の個体に関して、疾患の発病年齢は、発病年齢の一部の分布に基づいている(平均=50且つSD=13の正規分布)。よって、シミュレーションにおいて、一部の対照が、実際にある時点で診断されていない症例である可能性がある。年齢合致症例-対照試験の現実的シミュレーションを作成するために、遺伝的及び環境因子、並びに個体の発病年齢を反復してシミュレートした。個体の年齢は、0〜100の一様分布から選ばれる。10000の症例を入手するまで、これを反復する。これらの症例の各々に関して、それらのうちの1つが対照であることが分かるまで、それらの年齢を固定し、そして個体の遺伝的及び環境因子をシミュレートすることによって、年齢合致対照を作成する。このプロセスが、100000の症例及び100000の対照を含む年齢合致症例‐対照データセットをもたらす。この症例‐対照データに基づいて各SNPに関するオッズ比を推定し、次いで、本明細書中に記載のGCI方法論を使用した、疾患に関連する各SNPに関する相対リスクを算定するのに使用する。
これらのシミュレーションは、得られたリスク評価を試験するのに使用される。500の個体が、真の状態モデルにしたがって作成される。状態モデルが知られているので、これらの個体の各々に関して、状態を発症する正確なリスクを算定する。これらの「真のリスク推定」は、精度決定のためのベースラインとして使用される。GCIリスク推定は、このベースライン、並びに相対生涯リスクがオッズ比によって置き換えられたGCI変異体と比較される。
図3において、25%の平均生涯リスクと64%の遺伝率を有するシミュレートされた疾患(図3a)、及び42%の平均生涯リスクと57%の遺伝率を有する疾患(図3b)に関する相対誤差の絶対値の分布をプロットする。これらの値は、2型糖尿病及び心筋梗塞の生涯リスク及び遺伝率に大体対応している。相対リスクを使用するときとオッズ比を使用するときに、GCIの間に相違がある。ROC曲線をリスク推定の精度を定量するために使用するときには、この相違には気付かないであろう。GCIによって生じる誤差は、通常、5%を超えない。これは、すべての遺伝的リスクが知られていて、且つ、疾患モデルが的確に現実を表すという仮定の下で存在する。
実施例4:遺伝的リスク評価と家族歴
疾患リスクを評価するのに遺伝子型情報を使用するのとは対照的に、疾患リスクを評価するのに家族歴を使用することは、臨床現場で一般的に実施されている。付加価値に関して家族歴と比較されて遺伝子型情報を使用することについて、疑問が生じる。これらの疑問に対処するために、親の疾患状態情報が知られているシナリオをシミュレートし、そしてこの情報を、疾患に対する個体のリスクに関する試験として使用する。この試験の偽陽性率と真陽性率を、遺伝子型試験によって得られたものと比較する。
離散的状態モデルをシミュレーションに使用する。疾患に関する各SNP位置における対立遺伝子頻度による100000の母親‐父親対に関する無作為な遺伝子型を作成する。該遺伝子型は、遺伝子座全域で独立であると仮定する。三組のそれぞれに関して、各遺伝子座に関して各親から無作為に1つの対立遺伝子を選ぶことによって子供をもうける。その子供の遺伝子の通常の成分は、単純に両親の標準化平均であり、そして、環境因子は親の環境因子と独立した環境因子の組み合わせである。よって、父親と母親の表現型がそれぞれPFとPMであれば、この場合、PF=XF+GF+EF及びPM=XM+GM+EM(この場合、Xは二項式遺伝的分布であり、且つ、G〜N(0、σG)及びE〜N(0、σE)は正規分布した遺伝的及び環境因子である)であり、次いで、子供の表現型をPC=XC+(GF+GM)/√2+a(EF+EM)+bECであり、この場合、EC〜N(0、σE)は子供の独立した環境変量を表し、XCは大きな影響に貢献すると考えられる遺伝因子である。状態の遺伝率は、制約2a2+b2=1を強要する。よって、パラメーターbは、子供に対する親の環境の影響を決定する。b=1であれば、親の環境が子供に影響せず、b=0であるとき、子供の環境が親によって完全に決定される。これらのシミュレーションに基づいて、真陽性及び偽陽性の部分を単純分類試験に関して算定し、ここで、子供は、彼ら若しくは彼女らの親のいずれかが症例であれば、症例と標識され、そうでなければ、対照と見なされる。この試験は家族歴試験である。
先に記載のとおり、この試験は、遺伝子型ベースの試験の理論的限界に対応するROC曲線と比較される。図4に示されているように、家族歴試験の感度及び特異性は、パラメーターbの選択に大いに依存している。いくつかの結論がこれらのグラフから出ている。最初に、3つの状態モデルのすべてに関して、家族歴がGCI試験に劣っている場合と、家族歴が優れているその他の場合があり、bの値に依存していることが明確である。しかしながら、ほとんどの場合、2つの試験が全く同様の結果をもたらす。しかしながら、家族歴試験の感度と特異性の値はbに依存しており、それは集団で固定されている、それに対して、GCI試験は全範囲の特異性と感度の値を考慮する。例えば、クローン病に関する例では、さらにいくつかの偽陽性を許容することによって、当業者は、GCI試験を使用することで、真陽性の数を98%近くまで増やすことができるが、一方で、家族歴試験に関する真陽性率は、65%で限界を示した。
実施例5:既知の環境因子が予測を改善する
疾患予測に対する既知の環境因子の潜在的貢献を推定するために、環境データ及び遺伝データの両方を、リスクを推定するのに使用する。ここで、大きく異なる遺伝率及び平均生涯リスクの値をもつ2型糖尿病、クローン病及び関節リウマチの全般にわたる環境因子の有用性を実証する。リスクは、全SNP及び全環境因子にわたり独立していると仮定する。この仮定は必ずしも成り立つとは限らないが、以下でさらに記載するように、これは実質的に結果に影響しない。この仮定に基づいて、環境因子が考慮される症例に関して、GCIを一般化する。得られた方法をEGCIと呼ぶ。集団の遺伝子型及び表現型値に基づいて1セットの100000の個体に関して遺伝子型及び表現型頻度をシミュレートする。乗法的モデルに基づいてこれらの個体に対して疾病状態を割り当てる。
純粋な遺伝子ベースのGCIを、新しい一般化EGCIと比較する。2型糖尿病、クローン病及び関節リウマチのROC曲線を図5に見ることができる。環境因子の付加価値は、クローン病及び関節リウマチに関しては劇的ではなかったが、けれども、それは2型糖尿病に関しては大きかった。これは、ボディーマスインデックスが2型糖尿病のリスクに大きく影響する(BMI>35の場合に、42.1の相対リスクをもつ)という事実によって主張されている。クローン病などの疾患に関して、この状態の遺伝率がおよそ80%であるので、環境因子が大きな部分を占めると予想されなかったことに留意されたい。
実施例6:疾患の仮定生涯リスクにおける誤差
ヒトゲノム計画、HaPMapプロジェクト、及び関連する構想は、基準ヒトゲノム配列、一般的な遺伝子変異のカタログ、及びいくつかの基準集団のハプロタイプマップをもたらした。さらに、ゲノム及び特性、並びにあらゆる疾患を通じて変異の間の関連を試験するための費用対効果に優れた技術と組み合わせられた情報が、一般的な疾患のリスクに明確に統計学的に関連していることが示された多数の一般的な変異体をもたらした。これらの一般的な変異体は、疾患の確率的発症前リスクの評価において集団由来環境リスク因子データのように使用される。
GCIは、特定の数量のすべての推定のように、リスク推定に偏り得る仮定の設定を求める。特に、GCIスコアによってなされた仮定は、原因SNPの対立遺伝子頻度とエフェクトサイズが知られていること、且つ、SNP‐SNP相互作用が知られていることである。さらに、その仮定は、平均生涯リスクが知られているということである。これらの仮定は、実施において違反されるかもしれないが、本明細書中に記載したように、これらの仮定からのわずかな偏差がリスク推定を大きく変えることはない。特に、シミュレーション研究を通じて、及びWTCCCデータの解析によって先の実施例で示されているように、弱いSNP‐SNP相互作用は、GCIに対してほとんど影響が無く、生涯リスク推定におけるその偏差が、相対リスク推定の精度を変えることはない(図6もまた参照されたい)。
ROC曲線は、疾患の平均生涯リスクが知られており、且つ、この値が該疾患の理論モデルに疾病状態を割り当てるためのカットオフ値を算定するのに使用されるという仮定に基づいている。しかしながら、集団データから入手可能な推定は不正確である可能性があり、そのような誤差が、疾患に罹るGCIベースのリスクに大きく影響する。本明細書中の算定では、平均生涯リスクがこれらの推定(LTR’)と等しいと仮定している。
算定に使用する仮定されたリスクの関数として疾患のGCIベース平均生涯リスクと真の平均生涯リスクの間の誤差を、図6Aに示したようにプロットする。仮定した平均生涯リスクの関数としてGCIベースの平均生涯リスクと仮定した平均生涯リスクの間の絶対誤差を、図6Bに示したようにプロットする。
本開示の好ましい実施形態を本明細書中に示し説明してきたが、このような実施形態は例示のためにのみ提供されていることが当業者には明らかであろう。当業者にとっては、本開示から逸脱することなく、ここに多数の変形、変更、及び置換が存在するであろう。本明細書中に記載されている開示の実施形態に対する様々な代替手段を、実施形態の実施に際して利用できることを理解すべきである。以下の請求項は、本開示の範囲を定義するものであり、これらの実施形態の範囲内の方法及び構造、並びにその等価物は、それらによってカバーされることを意図している。

Claims (31)

  1. 個体の疾患又は症状に関する環境遺伝複合指数(EGCI)スコアの作成方法であって、以下のステップ:
    (a)前記個体の遺伝子サンプルからゲノムプロファイルを作成し;
    (b)前記個体から少なくとも1つの環境因子を入手し、この場合、前記の少なくとも1つの環境因子が前記疾患又は症状に関して少なくとも約1の相対リスクを有し;
    (c)コンピューターを使用して、前記ゲノムプロファイルと前記の少なくとも1つの環境因子からEGCIスコアを作成し;そして
    (d)前記コンピューターから入手し、出力した前記EGCIスコアを、前記個体又は前記個体のヘルスケア管理者に報告すること、
    を含む、方法。
  2. 前記相対リスクが、少なくとも約1.1、1.2、1.3、1.4、又は1.5である、請求項1に記載の方法。
  3. 前記相対リスクが、少なくとも約2、3、4、5、10、12、15、20、25、30、25、40、45、又は50である、請求項1に記載の方法。
  4. 前記の少なくとも1つの環境因子が、少なくとも約1のオッズ比(OR)を有する、請求項1に記載の方法。
  5. 前記ORが、少なくとも約1.1、1.2、1.3、1.4、又は1.5である、請求項4に記載の方法。
  6. 前記ORが、少なくとも約2、3、4、5、10、12、15、20、25、30、35、40、45、又は50である、請求項4に記載の方法。
  7. 前記の少なくとも1つの環境因子が、前記個体の出生地、居住場所、ライフスタイル状況;食生活、運動習慣、及び個人的な人間関係から成る群から選択される、請求項1に記載の方法。
  8. 前記ライフスタイル状況が、喫煙又はアルコール摂取である、請求項7に記載の方法。
  9. 前記の少なくとも1つの環境因子が、前記個体の身体計測値である、請求項1に記載の方法。
  10. 前記身体計測値が、前記個体のボディーマスインデックス、血圧、心拍数、グルコースレベル、代謝物レベル、イオンレベル、体重、身長、コレステロールレベル、ビタミンレベル、血球数、タンパク質レベル、及び転写物レベルから成る群から選択される、請求項9に記載の方法。
  11. 前記EGCIスコアを作成するために、少なくとも2つの環境因子を使用する、請求項1に記載の方法。
  12. 前記EGCIスコアを作成するために、前記の疾患又は症状に関する前記の少なくとも1つの環境因子が独立リスクファクターであると仮定する、請求項1に記載の方法。
  13. 前記の疾患又は症状が、約95%未満の遺伝率を有する、請求項1に記載の方法。
  14. 前記の疾患又は症状が、約5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、又は90%未満の遺伝率を有する、請求項1に記載の方法。
  15. 第三者が、前記遺伝子サンプルを入手する、請求項1に記載の方法。
  16. 前記ゲノムプロファイルを作成するのが第三者である、請求項1に記載の方法。
  17. 前記報告が、ネットワーク上での前記EGCIスコアの伝達を含む、請求項1に記載の方法。
  18. 前記報告が、オンラインポータルを通じてなされる、請求項1に記載の方法。
  19. 前記報告が、紙によるか、又はeメールによってなされる、請求項1に記載の方法。
  20. 前記報告が、セキュリティー保護された様式での報告を含む、請求項1に記載の方法。
  21. 前記報告が、セキュリティー保護されていない様式での報告を含む、請求項1に記載の方法。
  22. 前記遺伝子サンプルが、DNAである、請求項1に記載の方法。
  23. 前記遺伝子サンプルが、RNAである、請求項1に記載の方法。
  24. 前記遺伝子サンプルが、血液、毛髪、皮膚、唾液、精液、尿、糞便、汗、及び口腔粘膜サンプルから成る群から選択される生体サンプル由来である、請求項1に記載の方法。
  25. 前記個体のゲノムプロファイルが、セキュリティー保護されたデータベース又は金庫に預けられる、請求項1に記載の方法。
  26. 前記ゲノムプロファイルが、一塩基多型プロファイルである、請求項1に記載の方法。
  27. 前記ゲノムプロファイルが、トランケーション、挿入、欠失、又は反復を含んでなる、請求項1に記載の方法。
  28. 前記ゲノムプロファイルが、高密度DNAマイクロアレイを使用して作成される、請求項1に記載の方法。
  29. 前記ゲノムプロファイルが、RT‐PCRを使用して作成される、請求項1に記載の方法。
  30. 前記ゲノムプロファイルが、DNA配列決定法を使用して作成される、請求項1に記載の方法。
  31. (e)環境的因子の追加又は修正を伴って前記EGCIスコアを更新するステップをさらに含む、請求項1方法。
JP2014151568A 2008-09-12 2014-07-25 複数の環境的リスク因子及び遺伝的リスク因子を組み込む方法及びシステム Pending JP2015007985A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US9675808P 2008-09-12 2008-09-12
US61/096,758 2008-09-12

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2011527004A Division JP2012502398A (ja) 2008-09-12 2009-09-11 複数の環境的リスク因子及び遺伝的リスク因子を組み込む方法及びシステム

Publications (1)

Publication Number Publication Date
JP2015007985A true JP2015007985A (ja) 2015-01-15

Family

ID=41381854

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2011527004A Withdrawn JP2012502398A (ja) 2008-09-12 2009-09-11 複数の環境的リスク因子及び遺伝的リスク因子を組み込む方法及びシステム
JP2014151568A Pending JP2015007985A (ja) 2008-09-12 2014-07-25 複数の環境的リスク因子及び遺伝的リスク因子を組み込む方法及びシステム

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2011527004A Withdrawn JP2012502398A (ja) 2008-09-12 2009-09-11 複数の環境的リスク因子及び遺伝的リスク因子を組み込む方法及びシステム

Country Status (10)

Country Link
US (1) US20100070455A1 (ja)
EP (1) EP2335174A1 (ja)
JP (2) JP2012502398A (ja)
KR (1) KR20110074527A (ja)
CN (1) CN102187344A (ja)
AU (1) AU2009291577A1 (ja)
BR (1) BRPI0918889A2 (ja)
GB (1) GB2477868A (ja)
TW (1) TWI423151B (ja)
WO (1) WO2010030929A1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017073052A (ja) * 2015-10-09 2017-04-13 株式会社エムティーアイ 表現型推定システム及び表現型推定プログラム
WO2019054737A1 (ko) * 2017-09-13 2019-03-21 지니너스 주식회사 비만과 관련된 유전 정보를 이용한 개인 맞춤형 체지방 관리 방법
JP2022538078A (ja) * 2019-09-02 2022-08-31 クリノミックス インコーポレーテッド 被検査者と生物体間の遺伝子情報を用いた遺伝的干支提供システムおよびその方法
WO2022260129A1 (ja) * 2021-06-09 2022-12-15 国立大学法人京都大学 情報処理装置、情報処理方法、及びプログラム

Families Citing this family (85)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103710429B (zh) 2005-11-29 2016-03-30 剑桥企业有限公司 乳腺癌标志物
US20080131887A1 (en) * 2006-11-30 2008-06-05 Stephan Dietrich A Genetic Analysis Systems and Methods
US7844609B2 (en) 2007-03-16 2010-11-30 Expanse Networks, Inc. Attribute combination discovery
WO2009042975A1 (en) * 2007-09-26 2009-04-02 Navigenics, Inc. Methods and systems for genomic analysis using ancestral data
US9336177B2 (en) * 2007-10-15 2016-05-10 23Andme, Inc. Genome sharing
US10275569B2 (en) 2007-10-15 2019-04-30 22andMe, Inc. Family inheritance
US20090226912A1 (en) * 2007-12-21 2009-09-10 Wake Forest University Health Sciences Methods and compositions for correlating genetic markers with prostate cancer risk
US20100042438A1 (en) * 2008-08-08 2010-02-18 Navigenics, Inc. Methods and Systems for Personalized Action Plans
US8108406B2 (en) 2008-12-30 2012-01-31 Expanse Networks, Inc. Pangenetic web user behavior prediction system
EP3276526A1 (en) 2008-12-31 2018-01-31 23Andme, Inc. Finding relatives in a database
EP2438193B1 (en) * 2009-06-01 2015-07-22 Genetic Technologies Limited Methods for breast cancer risk assessment
EP2504448B1 (en) * 2009-11-25 2016-10-19 Bio-Rad Laboratories, Inc. Methods and compositions for detecting genetic material
KR20110136638A (ko) * 2010-06-15 2011-12-21 재단법인 게놈연구재단 게놈정보를 이용하여 온라인 상의 사회적 네트워크를 형성하는 시스템 및 그 형성방법
EP2611943B1 (en) 2010-09-03 2017-01-04 Wake Forest University Health Sciences Methods and compositions for correlating genetic markers with prostate cancer risk
TWI425928B (zh) * 2010-11-11 2014-02-11 E Da Hospital I Shou University 個人健康風險評估方法
US9534256B2 (en) 2011-01-06 2017-01-03 Wake Forest University Health Sciences Methods and compositions for correlating genetic markers with risk of aggressive prostate cancer
KR101268766B1 (ko) * 2011-01-20 2013-05-29 순천향대학교 산학협력단 중증 천식의 악화 진단용 기상 및 대기 오염 인자의 위험도 예측방법
EP3940084A1 (en) 2011-02-09 2022-01-19 Bio-Rad Laboratories, Inc. Analysis of nucleic acids
EP2761520B1 (en) * 2011-09-26 2020-05-13 Trakadis, John Diagnostic method and system for genetic disease search based on the phenotype and the genome of a human subject
US8990250B1 (en) 2011-10-11 2015-03-24 23Andme, Inc. Cohort selection with privacy protection
US10437858B2 (en) 2011-11-23 2019-10-08 23Andme, Inc. Database and data processing system for use with a network-based personal genetics services platform
US10025877B2 (en) 2012-06-06 2018-07-17 23Andme, Inc. Determining family connections of individuals in a database
TWI632518B (zh) * 2012-07-12 2018-08-11 基龍米克斯生物科技股份有限公司 建立性格與基因關聯性模型的方法及其應用
US9977708B1 (en) 2012-11-08 2018-05-22 23Andme, Inc. Error correction in ancestry classification
US9213947B1 (en) 2012-11-08 2015-12-15 23Andme, Inc. Scalable pipeline for local ancestry inference
JP6268184B2 (ja) * 2012-11-26 2018-01-24 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. 患患者固有の関連性評価を用いた変異と疾患の関連付けを使用する診断的遺伝子分析
US10102333B2 (en) * 2013-01-21 2018-10-16 International Business Machines Corporation Feature selection for efficient epistasis modeling for phenotype prediction
US9910962B1 (en) * 2013-01-22 2018-03-06 Basehealth, Inc. Genetic and environmental risk engine and methods thereof
US9152920B2 (en) * 2013-03-15 2015-10-06 Yahoo! Inc. System and method of event publication in a goal achievement platform
EP3054412A4 (en) * 2013-10-01 2017-03-01 Tohoku University Health information processing device, health information display device, and method
CN105981024B (zh) * 2013-12-12 2019-03-26 Ab生物股份有限公司 用于提供关于药物使用的个性化推荐的基于网络的计算机辅助方法和系统及计算机可读介质
US20150269345A1 (en) * 2014-03-19 2015-09-24 International Business Machines Corporation Environmental risk factor relevancy
MX2017004127A (es) 2014-09-30 2017-10-24 Genetic Tech Limited Metodos para evaluar el riesgo de desarrollar cancer de mama.
US10296993B2 (en) 2014-11-10 2019-05-21 Conduent Business Services, Llc Method and apparatus for defining performance milestone track for planned process
GB2561300B (en) * 2015-09-07 2021-03-10 Global Gene Corp Pte Ltd Method and system for diagnosing disease and generating treatment recommendations
EP3350721A4 (en) * 2015-09-18 2019-06-12 Fabric Genomics, Inc. PREDICTION OF DISEASE LOAD FROM GENOME VARIANTS
US20170161837A1 (en) * 2015-12-04 2017-06-08 Praedicat, Inc. User interface for latent risk assessment
EP3475911A1 (en) * 2016-06-22 2019-05-01 Swiss Reinsurance Company Ltd. Life insurance system with fully automated underwriting process for real-time underwriting and risk adjustment, and corresponding method thereof
US10998103B2 (en) 2016-10-06 2021-05-04 International Business Machines Corporation Medical risk factors evaluation
US10892057B2 (en) 2016-10-06 2021-01-12 International Business Machines Corporation Medical risk factors evaluation
TWI607332B (zh) * 2016-12-21 2017-12-01 國立臺灣師範大學 Correlation between persistent organic pollutants and microRNAs station
WO2018144320A1 (en) * 2017-01-31 2018-08-09 Counsyl, Inc. Systems and methods for automatically generating genetic risk assessments
US11404165B2 (en) * 2017-03-30 2022-08-02 Northeastern University Foodome platform
WO2018204414A1 (en) * 2017-05-02 2018-11-08 Human Longevity, Inc. Genomics-based, technology-driven medicine platforms, systems, media, and methods
CN107680685A (zh) * 2017-10-24 2018-02-09 山东浪潮云服务信息科技有限公司 一种疾病预警方法及系统
US11081217B2 (en) * 2017-12-21 2021-08-03 Basehealth, Inc. Systems and methods for optimal health assessment and optimal preventive program development in population health management
CN108346468B (zh) * 2017-12-27 2021-03-23 北京科迅生物技术有限公司 数据处理方法及装置
GB201801137D0 (en) * 2018-01-24 2018-03-07 Fitnessgenes Ltd Generating optimised workout plans using genetic and physiological data
CN112074910A (zh) * 2018-03-15 2020-12-11 Arm有限公司 用于组学和/或行为内容处理的系统、装置和/或过程
US10841299B2 (en) 2018-03-15 2020-11-17 Arm Ltd. Systems, devices, and/or processes for omic content processing and/or partitioning
US10841083B2 (en) 2018-03-15 2020-11-17 Arm Ltd. Systems, devices, and/or processes for OMIC content processing and/or communication
US20210254164A1 (en) * 2018-06-15 2021-08-19 Opti-Thera Inc. Polygenic risk scores for predicting disease complications and/or response to therapy
US11527331B2 (en) 2018-06-15 2022-12-13 Xact Laboratories, LLC System and method for determining the effectiveness of medications using genetics
US11380424B2 (en) 2018-06-15 2022-07-05 Xact Laboratories Llc System and method for genetic based efficacy testing
US11398312B2 (en) 2018-06-15 2022-07-26 Xact Laboratories, LLC Preventing the fill of ineffective or under-effective medications through integration of genetic efficacy testing results with legacy electronic patient records
US11227685B2 (en) 2018-06-15 2022-01-18 Xact Laboratories, LLC System and method for laboratory-based authorization of genetic testing
KR102188968B1 (ko) * 2018-08-24 2020-12-09 주식회사 클리노믹스 환경적 요인 변화에 따른 질병 발생 위험도 변동 시각화 장치 및 방법
US20200074313A1 (en) * 2018-08-29 2020-03-05 Koninklijke Philips N.V. Determining features to be included in a risk assessment instrument
AU2019370896A1 (en) 2018-10-31 2021-06-17 Ancestry.Com Dna, Llc Estimation of phenotypes using DNA, pedigree, and historical data
US10468141B1 (en) 2018-11-28 2019-11-05 Asia Genomics Pte. Ltd. Ancestry-specific genetic risk scores
KR102311269B1 (ko) * 2018-12-13 2021-10-12 주식회사 케이티 건강 정보 관리 서버, 이를 이용한 건강 정보 관리 방법 및 컴퓨터 프로그램
EP3935581A4 (en) 2019-03-04 2022-11-30 Iocurrents, Inc. DATA COMPRESSION AND COMMUNICATION USING MACHINE LEARNING
US11587651B2 (en) 2019-03-08 2023-02-21 Merative Us L.P. Person-centric genomic services framework and integrated genomics platform and systems
CN113905660A (zh) * 2019-03-19 2022-01-07 瑟姆巴股份有限公司 使用亲属的信息确定非孟德尔表型的遗传风险
CA3147888A1 (en) 2019-07-19 2021-01-28 23Andme, Inc. Phase-aware determination of identity-by-descent dna segments
CA3154157A1 (en) 2019-09-13 2021-03-18 23Andme, Inc. Methods and systems for determining and displaying pedigrees
TWI715250B (zh) 2019-10-17 2021-01-01 宏碁股份有限公司 特徵識別方法與電子裝置
JP7084658B2 (ja) * 2020-01-24 2022-06-15 株式会社ブーリアン 動物用遺伝子性疾患予防食品提案システム
JP7212640B2 (ja) * 2020-03-11 2023-01-25 日清食品ホールディングス株式会社 食品情報提供システム、装置、方法及びプログラム
US11289206B2 (en) * 2020-06-02 2022-03-29 Kpn Innovations, Llc. Artificial intelligence methods and systems for constitutional analysis using objective functions
US20220199259A1 (en) * 2020-06-02 2022-06-23 Kpn Innovations, Llc. Artificial intelligence methods and systems for constitutional analysis using objective functions
US11817176B2 (en) 2020-08-13 2023-11-14 23Andme, Inc. Ancestry composition determination
US11461193B2 (en) * 2020-09-24 2022-10-04 International Business Machines Corporation Data storage volume recovery management
CA3194288A1 (en) 2020-10-09 2022-04-14 23Andme, Inc. Formatting and storage of genetic markers
US20220189637A1 (en) * 2020-12-11 2022-06-16 Cerner Innovation, Inc. Automatic early prediction of neurodegenerative diseases
US12112244B2 (en) 2020-12-29 2024-10-08 Kpn Innovations, Llc. System and method for generating a procreant functional program
US11049603B1 (en) 2020-12-29 2021-06-29 Kpn Innovations, Llc. System and method for generating a procreant nourishment program
US11145401B1 (en) 2020-12-29 2021-10-12 Kpn Innovations, Llc. Systems and methods for generating a sustenance plan for managing genetic disorders
US11735310B2 (en) 2020-12-29 2023-08-22 Kpn Innovations, Llc. Systems and methods for generating a parasitic infection nutrition program
US11355229B1 (en) 2020-12-29 2022-06-07 Kpn Innovations, Llc. System and method for generating an ocular dysfunction nourishment program
US20220273233A1 (en) * 2021-02-26 2022-09-01 Hi Llc Brain Activity Derived Formulation of Target Sleep Routine for a User
US11935642B2 (en) 2021-03-01 2024-03-19 Kpn Innovations, Llc System and method for generating a neonatal disorder nourishment program
US11854685B2 (en) 2021-03-01 2023-12-26 Kpn Innovations, Llc. System and method for generating a gestational disorder nourishment program
CN113284622A (zh) * 2021-05-27 2021-08-20 四川大学华西医院 一种低龄儿童龋风险评估方法、系统及存储介质
WO2023102539A1 (en) * 2021-12-03 2023-06-08 Washington State University Dna methylation biomarkers for rheumatoid arthritis

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008067551A2 (en) * 2006-11-30 2008-06-05 Navigenics Inc. Genetic analysis systems and methods

Family Cites Families (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5192659A (en) * 1989-08-25 1993-03-09 Genetype Ag Intron sequence analysis method for detection of adjacent and remote locus alleles as haplotypes
US5958684A (en) * 1995-10-02 1999-09-28 Van Leeuwen; Frederik Willem Diagnosis of neurodegenerative disease
US6703228B1 (en) * 1998-09-25 2004-03-09 Massachusetts Institute Of Technology Methods and products related to genotyping and DNA analysis
US6730023B1 (en) * 1999-10-15 2004-05-04 Hemopet Animal genetic and health profile database management
US6640211B1 (en) * 1999-10-22 2003-10-28 First Genetic Trust Inc. Genetic profiling and banking system and method
US20020133495A1 (en) * 2000-03-16 2002-09-19 Rienhoff Hugh Y. Database system and method
US6660476B2 (en) * 2000-05-02 2003-12-09 City Of Hope Polymorphisms in the PNMT gene
WO2002033520A2 (en) * 2000-10-18 2002-04-25 Genomic Health, Inc. Genomic profile information systems and methods
US20080261220A1 (en) * 2000-11-30 2008-10-23 Third Wave Technologies, Inc. Nucleic Acid Detection Assays
US20020128860A1 (en) * 2001-01-04 2002-09-12 Leveque Joseph A. Collecting and managing clinical information
US20030054381A1 (en) * 2001-05-25 2003-03-20 Pfizer Inc. Genetic polymorphisms in the human neurokinin 1 receptor gene and their uses in diagnosis and treatment of diseases
US20040121320A1 (en) * 2001-08-07 2004-06-24 Genelink, Inc. Use of genetic information to detect a predisposition for bone density conditions
US20030040002A1 (en) * 2001-08-08 2003-02-27 Ledley Fred David Method for providing current assessments of genetic risk
US7072794B2 (en) * 2001-08-28 2006-07-04 Rockefeller University Statistical methods for multivariate ordinal data which are used for data base driven decision support
US7461006B2 (en) * 2001-08-29 2008-12-02 Victor Gogolak Method and system for the analysis and association of patient-specific and population-based genomic data with drug safety adverse event data
US20060188875A1 (en) * 2001-09-18 2006-08-24 Perlegen Sciences, Inc. Human genomic polymorphisms
AU2002363329A1 (en) * 2001-11-06 2003-05-19 Elizabeth Gray Pharmacogenomics-based system for clinical applications
US20030219776A1 (en) * 2001-12-18 2003-11-27 Jean-Marc Lalouel Molecular variants, haplotypes and linkage disequilibrium within the human angiotensinogen gene
US20040002818A1 (en) * 2001-12-21 2004-01-01 Affymetrix, Inc. Method, system and computer software for providing microarray probe data
US20060160074A1 (en) * 2001-12-27 2006-07-20 Third Wave Technologies, Inc. Pharmacogenetic DME detection assay methods and kits
WO2003074048A1 (en) * 2002-03-01 2003-09-12 Warner-Lambert Company Llc Method of treating osteoarthritis
US7135286B2 (en) * 2002-03-26 2006-11-14 Perlegen Sciences, Inc. Pharmaceutical and diagnostic business systems and methods
US20040115701A1 (en) * 2002-08-30 2004-06-17 Comings David E Method for risk assessment for polygenic disorders
EP1585433A4 (en) * 2002-09-25 2008-01-23 Ge Healthcare Sv Corp DETECTION METHODS
WO2004044225A2 (en) * 2002-11-11 2004-05-27 Affymetrix, Inc. Methods for identifying dna copy number changes
JP2004173505A (ja) * 2002-11-22 2004-06-24 Mitsuo Itakura 疾患感受性遺伝子の同定方法並びにそれに用いるプログラムおよびシステム
US20060257888A1 (en) * 2003-02-27 2006-11-16 Methexis Genomics, N.V. Genetic diagnosis using multiple sequence variant analysis
US20050037366A1 (en) * 2003-08-14 2005-02-17 Joseph Gut Individual drug safety
CA3048093A1 (en) * 2003-11-26 2005-06-23 Celera Corporation Single nucleotide polymorphisms associated with cardiovascular disorders and statin response, methods of detection and uses thereof
US20050214811A1 (en) * 2003-12-12 2005-09-29 Margulies David M Processing and managing genetic information
US20060046256A1 (en) * 2004-01-20 2006-03-02 Applera Corporation Identification of informative genetic markers
US7983932B2 (en) * 2004-02-17 2011-07-19 BodyBio, Inc Network and methods for integrating individualized clinical test results and nutritional treatment
US7127355B2 (en) * 2004-03-05 2006-10-24 Perlegen Sciences, Inc. Methods for genetic analysis
TWI364600B (en) * 2004-04-12 2012-05-21 Kuraray Co An illumination device an image display device using the illumination device and a light diffusing board used by the devices
US20060278241A1 (en) * 2004-12-14 2006-12-14 Gualberto Ruano Physiogenomic method for predicting clinical outcomes of treatments in patients
US20060184489A1 (en) * 2004-12-17 2006-08-17 General Electric Company Genetic knowledgebase creation for personalized analysis of medical conditions
US20060166224A1 (en) * 2005-01-24 2006-07-27 Norviel Vernon A Associations using genotypes and phenotypes
US20070122824A1 (en) * 2005-09-09 2007-05-31 Tucker Mark R Method and Kit for Assessing a Patient's Genetic Information, Lifestyle and Environment Conditions, and Providing a Tailored Therapeutic Regime
US7695911B2 (en) * 2005-10-26 2010-04-13 Celera Corporation Genetic polymorphisms associated with Alzheimer's Disease, methods of detection and uses thereof
US20070196344A1 (en) * 2006-01-20 2007-08-23 The Procter & Gamble Company Methods for identifying materials that can help regulate the condition of mammalian keratinous tissue
US8340950B2 (en) * 2006-02-10 2012-12-25 Affymetrix, Inc. Direct to consumer genotype-based products and services
US20080131887A1 (en) * 2006-11-30 2008-06-05 Stephan Dietrich A Genetic Analysis Systems and Methods
WO2009042975A1 (en) * 2007-09-26 2009-04-02 Navigenics, Inc. Methods and systems for genomic analysis using ancestral data
US20090182579A1 (en) * 2008-01-10 2009-07-16 Edison Liu Method of processing genomic information
US20090198519A1 (en) * 2008-01-31 2009-08-06 Mcnamar Richard Timothy System for gene testing and gene research while ensuring privacy
US20100042438A1 (en) * 2008-08-08 2010-02-18 Navigenics, Inc. Methods and Systems for Personalized Action Plans

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008067551A2 (en) * 2006-11-30 2008-06-05 Navigenics Inc. Genetic analysis systems and methods

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017073052A (ja) * 2015-10-09 2017-04-13 株式会社エムティーアイ 表現型推定システム及び表現型推定プログラム
WO2019054737A1 (ko) * 2017-09-13 2019-03-21 지니너스 주식회사 비만과 관련된 유전 정보를 이용한 개인 맞춤형 체지방 관리 방법
KR20190030025A (ko) * 2017-09-13 2019-03-21 지니너스 주식회사 비만과 관련된 유전 정보를 이용한 개인 맞춤형 체지방 관리 방법
KR102155776B1 (ko) * 2017-09-13 2020-09-15 지니너스 주식회사 비만과 관련된 유전 정보를 이용한 개인 맞춤형 체지방 관리 방법
JP2022538078A (ja) * 2019-09-02 2022-08-31 クリノミックス インコーポレーテッド 被検査者と生物体間の遺伝子情報を用いた遺伝的干支提供システムおよびその方法
WO2022260129A1 (ja) * 2021-06-09 2022-12-15 国立大学法人京都大学 情報処理装置、情報処理方法、及びプログラム

Also Published As

Publication number Publication date
EP2335174A1 (en) 2011-06-22
CN102187344A (zh) 2011-09-14
JP2012502398A (ja) 2012-01-26
GB2477868A (en) 2011-08-17
WO2010030929A1 (en) 2010-03-18
US20100070455A1 (en) 2010-03-18
GB201104128D0 (en) 2011-04-27
BRPI0918889A2 (pt) 2015-12-01
TWI423151B (zh) 2014-01-11
TW201033910A (en) 2010-09-16
KR20110074527A (ko) 2011-06-30
AU2009291577A1 (en) 2010-03-18

Similar Documents

Publication Publication Date Title
TWI423151B (zh) 結合多個環境及基因風險因子的方法及系統
TWI516969B (zh) 用於個人化行爲計劃之方法及系統
JP5491400B2 (ja) 祖先データを用いるゲノム解析の方法及びシステム
Strawbridge et al. Genome-wide analysis of self-reported risk-taking behaviour and cross-disorder genetic correlations in the UK Biobank cohort
TWI363309B (en) Genetic analysis systems, methods and on-line portal
US9092391B2 (en) Genetic analysis systems and methods
Zawatsky et al. Returning actionable genomic results in a research biobank: Analytic validity, clinical implementation, and resource utilization
Health Quality Ontario Pharmacogenomic testing for psychotropic medication selection: a systematic review of the Assurex GeneSight Psychotropic Test
Downs et al. Molecular testing for hereditary retinal disease as part of clinical care
Heinlen et al. Exploring genetic counselors’ perceptions of usefulness and intentions to use refined risk models in clinical care based on the Technology Acceptance Model (TAM)
Dupuis et al. Interpreting results of large-scale genetic association studies: separating gold from fool's gold
Abidha et al. A comprehensive lifestyle index and its associations with DNA methylation and type 2 diabetes among Ghanaian adults: the rodam study
Hartz et al. Genome-wide analysis of self-reported risk-taking behaviour and cross-disorder genetic correlations in the UK Biobank cohort
McWalter et al. Presented Abstracts from the Twenty-Ninth Annual Education Conference of the National Society of Genetic Counselors (Dallas, Texas, October 2010)
DClinPsy et al. Genome-wide analysis of self-reported risk-taking behaviour and cross-disorder genetic

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20151117

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160217

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20160322