JP2015007985A

JP2015007985A - 複数の環境的リスク因子及び遺伝的リスク因子を組み込む方法及びシステム

Info

Publication number: JP2015007985A
Application number: JP2014151568A
Authority: JP
Inventors: ハルペリン，エラン; Halperin Eran; ウェッセル，ジェニファー; Wessel Jennifer; カーギル，ミシェル; Cargill Michele; エー．スティーブン，ディートリッチ; A Stephan Dietrich
Original assignee: Navigenics Inc
Current assignee: Navigenics Inc
Priority date: 2008-09-12
Filing date: 2014-07-25
Publication date: 2015-01-15
Also published as: EP2335174A1; CN102187344A; JP2012502398A; GB2477868A; WO2010030929A1; US20100070455A1; GB201104128D0; BRPI0918889A2; TWI423151B; TW201033910A; KR20110074527A; AU2009291577A1

Abstract

【課題】個体の疾患又は症状に関する環境遺伝複合指数（ＥＧＣＩ）スコアの作成方法を提供する。【解決手段】個体の遺伝子サンプルからゲノムプロファイルを作成し、個体から少なくとも１つの環境因子を得て、ゲノムプロファイル及び少なくとも１つの環境因子からＥＧＣＩスコアを作成し、そして該個体又は該個体のヘルスケア管理者にＥＧＣＩスコアを報告する。追加の、又は修正した環境因子を用いて更新したＥＧＣＩスコアをさらに含む。ＥＧＣＩスコアは、コンピューターによって算定され、そしてその結果がコンピューターによって入手され、出力される。【選択図】図１

Description

関連出願の相互参照
本出願は、２００８年９月１２日出願の米国仮出願番号第６１／０９６７５８号に基づく優先権を主張するものであり、この仮出願全体を本明細書中に援用する。

背景
一般的な病気及び状態の病因は、典型的には、遺伝的因子と環境因子の両方の結果と考えられる。遺伝子型決定技術における最近の進歩は、そういった疾患に関する遺伝子の貢献に対する理解を大いに改善した。多くの全ゲノム関連研究が最近終了し、ゲノム全般にわたる一般的な病気と一般的な遺伝子変異体との新たな関連の発見を目指している。これらの研究は、疾患のメカニズム、及び彼らの遺伝的組成に基づいた、彼らが一生のうちで病気に罹る個体のリスクに光を当てた。生涯の早い時期に臨床的意志決定プロセスの中に遺伝性の遺伝的リスク情報を組み込むことは、疾患若しくは状態を改善する又はさらに、予防する際に重要な影響を持つ。

一般的な慢性非伝染性疾患の有病率は、典型的には、組み合わされる遺伝子疾患と感染症の両方の有病率を目立たなくする。一般的なＳＮＰ変異体は、一般的な疾患に関する生殖系列の遺伝的リスクの、全てでないが、かなりの数のうちの一部を占め、そして状況に応じて使用されるとき、十分に個別化され且つ集中的な暴露の緩和、早期検出及び個体に関する早期介入パラダイムを許容する。

ゲノム中の遺伝子変異、例えば一塩基多系（ＳＮＰ）、突然変異、欠失、挿入、反復、ミクロサテライトなどは、様々な表現型、例えば疾患又は症状などに関連する。個体の遺伝子変異は、異なる表現型に対する個体の素因又はリスクを決定するために特定され、関連づけられ、そして個別の表現型プロファイルが作成され得る。

小さいエフェクトサイズの一般的なＳＮＰ変異体、希少な及び個別の変異体、ＤＮＡコピー数変異体、及び後成的修正は、典型的には、遺伝性リスクの大部分を占めている。状態を発症する個体のリスクの正確な推定は、困難な課題である。そのリスクは、遺伝的リスク因子の負担、環境因子、性別、及び年齢を含めた多くの因子によって決定される。よって、ほとんどの状態に関して、最も正確なリスク評価は、確率論的リスク推定をもたらすにすぎない。因子としては、異なる関連変異体、それらのエフェクトサイズ、集団中のそれらの頻度、個体に影響する環境因子（例えば食生活、年齢、家族歴、及び民族的背景など）、並びにそれらの相互作用が挙げられる。すぐにこれらの因子のすべてを調査する大規模な研究は、実施に法外な費用がかかるので、我々が知る限り、なにも行われていない。

よって、遺伝子変異の影響を考慮に入れたリスク推定を含む個別の表現型プロファイルを作成する方法が必要とされている、けれども、同時に複数のリスクプロファイルを評価する大規模研究の結果を必要としているわけではない。さらに、例えば臨床的分類子として予測力を持っているような臨床的意志決定のためのさらなるツールを提供する、疾患によって変化するだけではなく、環境データと組み合わせることができるリスク推定を作成する必要性が存在する。本開示及び本明細書中に開示された実施形態は、これらのニーズを満たし、そしてまた関連した利益もまた提供する。

概要
本開示は、個体の疾患又は症状に関する環境遺伝複合指数（ＥＧＣＩ）スコアの作成方法を提供する。この方法は、該個体の遺伝子サンプルからゲノムプロファイルを作成し；該個体から少なくとも１つの環境因子を得；ゲノムプロファイル及び少なくとも１つの環境因子からＥＧＣＩスコアを作成し；そして該個体又は該個体のヘルスケア管理者にＥＧＣＩスコアを報告することを含み得る。その方法は、追加の又は修正した環境因子を用いて更新したＥＧＣＩスコアをさらに含むことができる。いくつかの実施形態では、その方法はコンピューターによって実施される。例えば、ＥＧＣＩスコアは、コンピューターによって算定され、そしてその結果がコンピューターによって入手され、出力される。

疾患又は症状に関する環境因子の相対リスクは、少なくとも約１である。いくつかの実施形態では、疾患又は症状に関する相対リスクは、少なくとも約１．１、１．２、１．３、１．４、又は１．５である。相対リスクは、少なくとも約２、３、４、５、１０、１２、１５、２０、２５、３０、２５、４０、４５、又は５０であり得る。いくつかの実施形態では、環境因子は、少なくとも約１のオッズ比（ＯＲ）をもつ。さらに他の実施形態では、ＯＲは、少なくとも約１．１、１．２、１．３、１．４、又は１．５である。ＯＲは、少なくとも約１．５、２、３、４、５、１０、１２、１５、２０、２５、３０、２５、４０、４５、又は５０であり得る。

別の実施形態では、環境因子は、以下の：個体の出生地、居住場所、ライフスタイルの状況；食生活、運動習慣、及び個人的な人間関係から成る群から選択されることができる。例えば、ライフスタイルの状況は、喫煙又はアルコール摂取であり得る。いくつかの実施形態では、環境因子は、個体の身体計測値、例えばボディーマスインデックス、血圧、心拍数、グルコースレベル、代謝レベル、イオンレベル、体重、身長、コレステロールレベル、ビタミンレベル、血球数、タンパク質レベル、又は転写物レベルなどである。

ＥＧＣＩスコアは、少なくとも２つの環境因子を使用して作成されてもよく、ＥＧＣＩスコアを作成することで、環境因子の少なくとも１つ、又はそれ以上が前述の疾患又は症状に関して独立なリスクプロファイルであると仮定することもできる。

いくつかの実施形態では、ＥＧＣＩスコアは、約９５％未満の遺伝率を有する疾患又は症状関して作成される。いくつかの実施形態では、前記疾患又は症状は、約５％、１０％、１５％、２０％、２５％、３０％、３５％、４０％、４５％、５０％、５５％、６０％、６５％、７０％、７５％、８０％、８５％、又は９０％未満の遺伝率を有する。

別の実施形態では、本明細書中に開示された方法は、個体の遺伝子サンプルを入手するか、又は個体のゲノムプロファイルを作成する第三者を含んでなる。前記遺伝子サンプルは、ＤＮＡ又はＲＮＡであり得、そして生体サンプル、例えば血液、毛髪、皮膚、唾液、精液、尿、糞便、汗、又は口腔粘膜サンプルなどから入手されうる。

前記方法はさらに、コンピューターの使用による、ネットワーク上でのＥＧＣＩスコアの伝達、オンラインポータルを通じた、紙による又はｅメールによるＥＧＣＩの報告も含んでなる。前記報告は、セキュリティー保護された又は保護されていない様式である。個体のゲノムプロファイルは、セキュリティー保護されたデータベース又は金庫に預けられることもでき、且つ、一塩基多型プロファイルであるか、又はトランケーション、挿入、欠失、若しくは反復を含むゲノムプロファイルであり得る。前記ゲノムプロファイルは、高密度ＤＮＡマイクロアレイ、ＲＴ‐ＰＣＲ、又はＤＮＡ配列決定法を使用して作成され得る。いくつかの実施形態では、ゲノムプロファイルは、対象又は個体から遺伝子サンプルを増幅することによって作成される。あるいは、ゲノムプロファイルは、遺伝子サンプルを増幅することなく作成され得る。

援用
この明細書中で言及された、すべての刊行物、特許、及び特許出願を、各々、個別の刊行物、特許、又は特許出願について、援用されるべきことが特異的に且つ個別に示されたのと同じように、本明細書中に援用する。

本明細書中に開示された実施形態の新規特徴を、添付の請求項中に詳細に説明する。本開示の特徴及び利点のより良い理解は、本明細書中に開示した原理が利用されている例示的な実施形態、及び添付図面を説明する以下の詳細な説明を参照することによって得られるであろう。

ａ）クローン病、Ｂ）２型糖尿病、及びＣ）関節リウマチのＲＯＣ曲線を例示する。各プロットにおいて、黒色線は、無作為期待値に対応し、紫色及び青色線は、遺伝的変数が既知の場合の理論的期待値に対応し（２つの状態モデル下、以下に詳述）、黄色線は、ＧＣＩに対応し、及び緑色線は、ロジスティック回帰に対応している。ａ）クローン病、Ｂ）関節リウマチ、及びＣ）２型糖尿病の相互作用に伴うモデル及び単純乗法的モデルに関するＲＯＣ曲線を例示する。各プロットにおいて、６４００の閾値ポイントを使用する。Ａ）２５％の生涯リスクと６４％の遺伝率を用いた２型糖尿病に関するオッズ比と相対リスクの比較、Ｂ）４２％の生涯リスクと５７％の遺伝率を用いた心筋梗塞に関するオッズ比と相対リスクの比較、及びＣ）２型糖尿病に関する平均二乗誤差対罹患確率、を描く。既知の遺伝的リスク対既知の家族歴を例示する。家族歴対理論的ＲＯＣ曲線、この場合、遺伝的リスクは、Ａ）２型糖尿病、Ｂ）クローン病、及びＣ）関節リウマチに関して完全に知られている。赤色の曲線は、単独家族歴に基づく適性検査のための異価ｂに関する真及び偽陽性部分を示す。Ａ）クローン病、Ｂ）２型糖尿病、及びＣ）関節リウマチに関する単独の既知の遺伝的因子及び環境因子対既知の遺伝因子の影響を例示する。クローン病に関して、２つの曲線のＡＵＣは０．６８及び０．７２である。遺伝因子に加えて、喫煙（相対リスク３）を環境変量とみなす。２型糖尿病に関して、２つの曲線のＡＵＣは、それぞれ０．５７及び０．７９である（Ｂ）。遺伝因子に加えて、ボディーマスインデックス（相対リスク４２．１）、アルコール摂取（相対リスク１．７５）及び喫煙頻度（相対リスク１．７０）を２型糖尿病の環境因子とみなす。関節リウマチに関して、２つの曲線のＡＵＣは、０．６８５及び０．６８８である（Ｃ）。遺伝因子に加えて、喫煙（相対リスク１．４）が環境変量である。Ａ）２型糖尿病におけるＧＣＩ算定に関するＧＣＩベースの平均生涯リスクと、仮定された生涯リスクの関数としての真の平均リスク（ＬＴＲ’）の間の誤差。Ｔ２Ｄの真の平均リスク＝０．２５。Ｂ）ＧＣＩベースの平均生涯リスクと生涯リスク（ＬＴＲ’）の間の誤差を仮定ＬＴＲ’の関数としてのＧＣＩ算定に関して仮定する。

詳細な説明
本開示は、個体（単独）の自身のゲノムプロファイルの遺伝的組成に基づくリスク推定の開発方法を提供する。いくつかの実施形態では、推定は、個体のゲノムプロファイル又は遺伝的組成のみに基づき、すべてのその他の因子が固定されている。本明細書中に記載のリスク推定又はリスクスコアは、遺伝複合指数（ＧＣＩ）とも呼ばれ、特徴の決定など臨床方針決定のガイドとなる任意型の遺伝的リスク因子の入力を伴って臨床現場で使用できる測定可能な尺度である。ＧＣＩは、平均生涯リスク、複数のリスク遺伝子座にわたるオッズ比情報、及び基準集団中の遺伝子型頻度の分布を伴う個体の遺伝子型に関する情報を、状態を発症する個体のリスクを表す１つの統合されたスコアに組み合わせる。より高いＧＣＩスコアは、状態に関するより高いリスクとして直観的に解釈され得る。ＧＣＩは、以下に詳述されるいくつかの仮定に基づく。異なる条件下、ＧＣＩのロバスト性を試験するためのシミュレート・データ、並びに実際の遺伝子型及び臨床データも本明細書中に記載されている。いくつかの実施形態では、ＳＮＰの影響は、文献の中で統計学的に有意であることが示されている既知のＳＮＰ‐ＳＮＰ相互作用が存在しない限り、独立している。弱いＳＮＰ‐ＳＮＰ相互作用は予測性に有意に影響しないので、独立に関するこの仮定は、典型的には、我々のモデルの一般性に影響しない。

現在のリスク評価法は、予防薬プログラムに役立つリスク評価手段の開発の出発点を提供している。しかしながら、これらの異なる方法の質と有効性は、それらの起源及び実施、それらの理論的制限、及びそれらの優劣に依存する。例えば、受信者行動特性（ＲＯＣ）曲線は、様々なリスク尺度の有効性を計測するのに使用される（例えばＬｕａｎｄＥｌｓｔｏｎ，Ａｍ．Ｊ．ｏｆＨｕｍａｎＧｅｎｅｔｉｃｓ，８２：６４１‐６５１（２００８）を参照のこと）。

例えばＧＣＩが理論的に最適な試験であり、そして他方がリスク評価法であることを示すことによって、ＲＯＣ曲線はさらに、ＧＣＩスコアを評価するためにも使用できる。例えば、異なる状態モデルは、すべての遺伝因子が既知である理想的な「最良の症例」シナリオ下で、そういった異なる方法（例えば、ＧＣＩ対他のモデル）の予測力を算定するためにシミュレートされ得る。この理想的なリスク評価は、いくつかの因子、中でも遺伝率及び状態を発症する平均生涯リスクに依存する。典型的には、遺伝率が高いほど、単独で遺伝子型情報のみに基づくリスク評価が良い。同様に、平均生涯リスクは、一般に、集団内のリスク確率の変動に影響するので、そのため、理想的なリスク評価シナリオの精度に影響する。さらに、本明細書中に記載したＧＣＩは、例えば遺伝因子又は環境因子などの多重因子が利用できない場合、例えば多重因子、例えば複数の一般的な病気などを同時に試験するように設計された大規模研究が利用できない場合などに使用できる。

ゲノムプロファイル
ＧＣＩは、個体のゲノムプロファイルに基づいて作成される。個体のゲノムプロファイルは、遺伝子変異又はマーカーに基づく個体の遺伝子に関する情報を含んでいる。遺伝子変異はゲノムプロファイルを構成する遺伝子型を形成し得る。このような遺伝子変異又はマーカーには、単一ヌクレオチド多型（ＳＮＰ）、単一及び／又は複数のヌクレオチド反復、単一及び／又は複数のヌクレオチド欠失、マイクロサテライト反復（典型的には５〜１０００反復単位を伴う少数のヌクレオチド反復）、ジヌクレオチド反復、トリヌクレオチド反復、配列再編成（転座及び複製を含む）、コピー数変異（特異的な遺伝子座の喪失と獲得の両方）等があるが、これだけに限定されるものではない。その他の遺伝子変異には、染色体複製及び転座、並びにセントロメア及びテロメア反復配列がある。

遺伝子型はまた、ハプロタイプとディプロタイプも包含し得る。いくつかの実施形態において、ゲノムプロファイルは少なくとも１０００００、３０００００、５０００００、又は１００００００の遺伝子型を持つことができる。いくつかの実施形態において、ゲノムプロファイルは個体の実質的に完全なゲノム配列であり得る。他の実施形態では、ゲノムプロファイルは個体の完全ゲノム配列の少なくとも６０％、８０％、又は９５％である。ゲノムプロファイルは個体の完全なゲノム配列のほぼ１００％であることができる。標的を含む遺伝子サンプルは、増幅されていないゲノムＤＮＡ若しくはＲＮＡサンプル又は増幅されたＤＮＡ（若しくはｃＤＮＡ）を包含するが、これだけに限定されるものではない。標的は、特に興味深い遺伝子マーカーを含むゲノムＤＮＡの特定領域であるかもしれない。

ゲノムプロファイルを得るために、個々の遺伝子サンプルを個体の生体サンプルから単離できる。生体サンプルには、ＲＮＡ及び／又はＤＮＡなどの遺伝物質を単離することが含まれる。そのような生体サンプルには、血液、毛髪、皮膚、唾液、精液、尿、糞便物質、汗、口腔粘膜、及び様々な身体組織が包含されるが、これだけに限定されるものではない。個体が組織サンプルを直接採取し、例えば口腔粘膜サンプルは個体が頬の内側に綿棒を当てることにより入手できる。唾液、精液、尿、糞便物質、又は汗などのその他のサンプルもまた、個体自身によって提供できる。その他の生体サンプルは、瀉血専門医、看護師又は医師などのヘルスケアの専門家によって採取され得る。例えば、血液サンプルは、看護師により個体から採血され得る。組織生検はヘルスケア専門家によって行われ、サンプルを効率的に入手するための市販キットもまたヘルスケア専門家に容易に入手できる。小円筒状の皮膚を採取することができ、又は針を使用して組織又は体液の少量サンプルを採取できる。

サンプル採集キットが個体に提供されることもある。このキットには個体の生体サンプルのためのサンプル採集コンテナが含まれ得る。このキットにはまた、個体が自身のサンプルを直接採集するための取扱説明書、例えばどのくらいの毛髪、尿、汗、又は唾液を提供するか、も個体に提供できる。キットにはまた、個体がヘルスケア専門家に組織サンプルの採取を要請するための取扱説明書が入っているかもしれない。キットには、サンプルが第三者により採取される場所が含まれており、例えば、キットがヘルスケア施設に提供され、次にその施設が個体からサンプルを集めることがある。キットはまた、サンプルがサンプル処理施設に送付されるための返送用梱包材をも提供でき、その施設で遺伝物質が生体サンプルから単離される。

いくつかの周知の生物化学的及び分子生物学的方法のいずれかに従ってＤＮＡ又はＲＮＡの遺伝子サンプルが生体サンプルから単離できる。例えば、Ｓａｍｂｒｏｏｋ，ｅｔａｌ．，ＭｏｌｅｃｕｌａｒＣｌｏｎｉｎｇ：ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ（ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＬａｂｏｒａｔｏｒｙ，ＮｅｗＹｏｒｋ）（１９８９）を参照のこと。生体サンプルからＤＮＡ又はＲＮＡを単離するための市販キット及び試薬もまたいくつかあり、例えば、ＤＮＡＧｅｎｏｔｅｋ、ＧｅｎｔｒａＳｙｓｔｅｍｓ、Ｑｉａｇｅｎ、Ａｍｂｉｏｎ、及びその他の供給業者から入手できるものがある。口腔粘膜サンプルキットは、ＥｐｉｃｅｎｔｒｅＢｉｏｔｅｃｈｎｏｌｏｇｉｅｓ製のＭａｓｔｅｒＡｍｐ（商標）ＢｕｃｃａｌＳｗａｂＤＮＡ抽出キットなどが容易に商業的に入手でき、ＳｉｇｍａＡｌｄｒｉｃｈ製のＥｘｔｒａｃｔ‐Ｎ‐Ａｍｐ（商標）などの血液サンプルからのＤＮＡ抽出用キットもまた同様である。他の組織からのＤＮＡは、組織をプロテアーゼと熱で消化し、サンプルを遠心分離し、フェノール‐クロロホルムを用いて不要物質を抽出し、水相にＤＮＡを残すことによって得ることができる。次いでこのＤＮＡをエタノール沈殿によってさらに単離できる。

例えば、ゲノムＤＮＡを、ＤＮＡＧｅｎｏｔｅｋ製のＤＮＡ自己採集キットを使用して唾液から単離できる。個体は、そのキットを使用して臨床処理のための唾液標本を採集でき、そして都合の良いことに、このサンプルは室温にて保存及び搬送することができる。サンプルが処理のための適当な検査所に送付された後、典型的には採集キットの供給業者によって供給された試薬を使用して、サンプルを５０℃にて少なくとも１時間熱変性及びプロテアーゼ消化することによってＤＮＡが単離される。次にこのサンプルを遠心分離し、上清をエタノール沈殿させる。このＤＮＡペレットを、その後の分析に適した緩衝液中に懸濁する。

遺伝子サンプルとしてＲＮＡを使用できる、例えば、発現される遺伝子変異はｍＲＮＡから特定できる。ｍＲＮＡは、プレｍＲＮＡ転写産物（群）、転写産物プロセシング中間体、翻訳の準備が整った成熟ｍＲＮＡ（群）及び、遺伝子若しくは遺伝子（群）の転写物、又はｍＲＮＡ転写物（群）から誘導される核酸を包含するが、これだけに限定されるものではない。転写プロセシングは、スプライシング、編集及び分解を含むことができる。本明細書中で使用する、ｍＲＮＡ転写物から引き出した核酸とは、その合成のためにｍＲＮＡ転写物又はその部分配列が最終的に鋳型として働く核酸を指す。よって、ｍＲＮＡから逆転写されたｃＤＮＡ、該ｃＤＮＡから増幅されたＤＮＡ、増幅されたＤＮＡから転写されたＲＮＡなどはすべてｍＲＮＡ転写物から誘導される。ＲＮＡは、当該技術分野で知られている方法、例えばＰｒｅＡｎａｌｙｔｉＸから入手可能なＰＡＸｇｅｎｅ（商標）ＢｌｏｏｄＲＮＡシステムを使用する未分画全血からのＲＮＡ単離などを使用して、いくつかの身体組織のいずれかから単離できる。典型的にはｍＲＮＡを用いてｃＤＮＡを逆転写し、次いでそれを遺伝子変異解析のために使用又は増幅する。

ゲノムプロファイルは遺伝子サンプルの増幅なしに遺伝子サンプルから作成されることもある。あるいは、ゲノムプロファイル解析に先立ち、遺伝子サンプルを、ＤＮＡ又はＲＮＡから逆転写されたｃＤＮＡのいずれかから増幅する。ＤＮＡはいくつかの方法で増幅でき、その多くはＰＣＲを使用する。例えば、ＰＣＲＴｅｃｈｎｏｌｏｇｙ：ＰｒｉｎｃｉｐｌｅｓａｎｄＡｐｐｌｉｃａｔｉｏｎｓｆｏｒＤＮＡＡｍｐｌｉｆｉｃａｔｉｏｎ（Ｅｄ．Ｈ．Ａ．Ｅｒｌｉｃｈ，ＦｒｅｅｍａｎＰｒｅｓｓ，ＮＹ，Ｎ．Ｙ．，１９９２）；ＰＣＲＰｒｏｔｏｃｏｌｓ：ＡＧｕｉｄｅｔｏＭｅｔｈｏｄｓａｎｄＡｐｐｌｉｃａｔｉｏｎｓ（Ｅｄｓ．Ｉｎｎｉｓ，ｅｌａｌ．，ＡｃａｄｅｍｉｃＰｒｅｓｓ，ＳａｎＤｉｅｇｏ，Ｃａｌｉｆ．，１９９０）；Ｍａｔｔｉｌａｅｔａｌ．，ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．１９，４９６７（１９９１）；Ｅｃｋｅｒｔｅｔａｌ．，ＰＣＲＭｅｔｈｏｄｓａｎｄＡｐｐｌｉｃａｔｉｏｎｓ１，１７（１９９１）；ＰＣＲ（Ｅｄｓ．ＭｃＰｈｅｒｓｏｎｅｔａｌ．，ＩＲＬＰｒｅｓｓ，Ｏｘｆｏｒｄ）；並びに米国特許番号第４６８３２０２号、同第４６８３１９５号、同第４８００１５９号、同第４９６５１８８号及び同第５３３３６７５号を参照のこと、あらゆる目的のためにこれらの各々の全文を本明細書中に援用する。

その他の好適な増幅法には、リガーゼ連鎖反応（ＬＣＲ）（例えば、ＷｕａｎｄＷａｌｌａｃｅ，Ｇｅｎｏｍｉｃｓ４，５６０（１９８９），Ｌａｎｄｅｇｒｅｎｅｔａｌ．，Ｓｃｉｅｎｃｅ２４１，１０７７（１９８８）及びＢａｒｒｉｎｇｅｒｅｔａｌ．，Ｇｅｎｅ８９：１１７（１９９０））、転写増幅（Ｋｗｏｈｅｔａｌ．，Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ８６：１１７３−１１７７（１９８９）及びＷＯ８８／１０３１５）、自己持続配列複製（Ｇｕａｔｅｉｌｉｅｔａｌ．，Ｐｒｏｃ．Ｎａｔ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ，８７：１８７４‐１８７８（１９９０）及びＷＯ９０／０６９９５）、標的ポリヌクレオチド配列の選択的増幅（米国特許番号第６４１０２７６号）、コンセンサス配列プライムドポリメラーゼ連鎖反応（ＣＰ‐ＰＣＲ）（米国特許番号第４４３７９７５号）、任意にプライムされるポリメラーゼ連鎖反応（ＡＰ‐ＰＣＲ）（米国特許番号第５４１３９０９号、同第５８６１２４５号）、核酸配列に基づく増幅（ＮＡＳＢＡ）、ローリングサークル増幅（ＲＣＡ）、多置換増幅（ＭＤＡ）（米国特許番号第６１２４１２０号及び同第６３２３００９号）、並びにサークル‐トゥー‐サークル増幅（Ｃ２ＣＡ）（Ｄａｈｌｅｔａｌ．，Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．１０１：４５４８‐４５５３（２００４））が挙げられる。（米国特許番号第５４０９８１８号、同第５５５４５１７号、及び同第６０６３６０３号を参照のこと、これらの各々を本明細書中に援用する。）利用できるその他の増幅法は、米国特許番号第５２４２７９４号、同第５４９４８１０号、同第５４０９８１８号、同第４９８８６１７号、同第６０６３６０３号及び同第５５５４５１７号、並びに米国特許出願番号第０９／８５４３１７号に記載されており、これらの各々を本明細書中に援用する。

ゲノムプロファイルの作成は、いくつかの方法のうちのいずれかを使用することで実施される。遺伝子変異を特定する方法は当該技術分野ではいくつか知られており、いくつかの方法のうちいずれかの方法によるＤＮＡ配列決定、ＰＣＲに基づく方法、断片長多型アッセイ（制限断片長多型（ＲＦＬＰ）、開裂断片長多型（ＣＦＬＰ））、鋳型として対立遺伝子特異的なオリゴヌクレオチドを使用するハイブリダイゼーション法（例えばＴａｑＭａｎアッセイ及びマイクロアレイ。本明細書中で後ほど述べる。）、プライマー伸長反応を使用する方法、質量分析（例えばＭＡＬＤＩ‐ＴＯＦ／ＭＳ法）などがあるが（例えばＫｗｏｋ，Ｐｈａｒｍｏｃｏｇｅｎｏｍｉｃｓ１：９５‐１００（２０００）に記載されている）、これだけに限定されるものではない。その他の方法には、インベーダー方法、例えばモノプレックス及びバイプレックスインベーダーアッセイ（例えば、ＴｈｉｒｄＷａｖｅＴｅｃｈｎｏｌｏｇｉｅｓ，Ｍａｄｉｓｏｎ，ＷＩより入手でき、Ｏｌｉｖｌｅｒｅｔａｌ．，Ｎｕｃｌ．ＡｃｉｄｓＲｅｓ．３０：ｅ５３（２００２）に記載されている）などが挙げられる。

例えば、ゲノムプロファイル作成に高密度ＤＮＡアレイを使用できる。そのようなアレイは、Ａｓｙｍｅｔｒｉｘ及びＩｌｌｕｍｉｎａ（ＡｆｆｙｍｅｔｒｉｘＧｅｎｅＣｈｉｐ（登録商標）５００ＫＡｓｓａｙＭａｎｕａｌ（Ａｆｆｙｍｅｔｒｉｘ，ＳａｎｔａＣｌａｒａ，ＣＡ）（本明細書中に援用する）；Ｓｅｎｔｒｉｘ（登録商標）ｈｕｍａｎＨａｐ６５０Ｙ遺伝子型決定ビーズチップ（Ｉｌｌｕｍｉｎａ，ＳａｎＤｉｅｇｏ，ＣＡ）を参照のこと）から市販されている。高密度アレイは、ＳＮＰであるところの遺伝子変異を包含するゲノムプロファイル作成に使用できる。
例えば、ＳＮＰプロファイルは、ＡｆｆｙｍｅｔｒｉｘＧｅｎｏｍｅＷｉｄｅＨｕｍａｎＳＮＰＡｒｒａｙ６．０を使用して９０００００以上のＳＮＰを遺伝子型決定することによって作成できる。あるいは、ＡｆｆｙｍｅｔｒｉｘＧｅｎｅＣｈｉｐＨｕｍａｎＭａｐｐｉｎｇ５００ＫＡｒｒａｙＳｅｔを使用することによって、全ゲノムサンプリング解析を通じて５０００００以上のＳＮＰを決定することができる。これらのアッセイでは、ヒトゲノムの小集団を、制限酵素消化され、アダプターライゲーションされたヒトゲノムＤＮＡを使用した単一プライマー増幅反応によって増幅する。典型的には、次いで、増幅されたＤＮＡを断片化し、サンプルの品質を決定した後、コートされた石英表面の特定位置にＤＮＡプローブを有するマイクロアレイへのハイブリダイゼーションのためにサンプルを変性させ、そして標識する。増幅されたＤＮＡ配列の関数として、それぞれのプローブにハイブリダイズする標識の量を監視し、それにより、配列情報及び得られるＳＮＰ遺伝子型を求める。

高密度アレイの使用は、当該技術分野で周知であるので、商業的に得られるのであれば、それを製造業者の指示とおりに実施する。例えば、ＡｆｆｙｍｅｔｒｉｘＧｅｎｅＣｈｉｐの使用は、単離されたゲノムＤＮＡをＮｓｐＩ又はＳｔｙＩ制限エンドヌクレアーゼのいずれかで消化することを伴う。次に、消化したＤＮＡを、それぞれＮｓｐＩ又はＳｔｙＩ制限消化されたＤＮＡのいずれかとアニーリングするＮｓｐＩ又はＳｔｙＩアダプターオリゴヌクレオチドとライゲーションする。次に、ライゲーション後のアダプター含有ＤＮＡをＰＣＲ増幅し、約２００〜１１００塩基対（ゲル電気泳動によって確認）の増幅ＤＮＡ断片を得る。増幅基準に合致するＰＣＲ産物を断片化のために精製及び定量化する。このＰＣＲ産物を、最適なＤＮＡチップハイブリダイゼーションのためにＤＮａｓｅＩで断片化する。断片化の後、ゲル電気泳動で確認したところ、ＤＮＡ断片は２５０塩基対未満であり、平均して約１８０塩基対である。次に、断片化基準に合致するサンプルをターミナルデオキシヌクレオチジルトランスフェラーゼを使用してビオチン化合物で標識する。次に、標識された断片を変性させ、ＧｅｎｅＣｈｉｐ２５ＯＫアレイにハイブリダイズさせる。ハイブリダイゼーション後、アレイを染色し、ストレプトアビジン・フィコエリスリン（ＳＡＰＥ）染色、次いでビオチン化抗ストレプトアビジン抗体（ヤギ）による抗体増幅ステップ、及びストレプトアビジン・フィコエリスリン（ＳＡＰＥ）による最終染色より成る三ステップ工程でスキャンする。標識後、アレイをアレイ保持緩衝液で被覆し、例えばＡｆｆｙｍｅｔｒｉｘＧｅｎｅＣｈｉｐＳｃａｎｎｅｒ３０００などのスキャナでスキャンする。

製造業者の指針に従い、高密度アレイのスキャンに従うデータ解析を実施する。例えば、ＡｆｆｙｍｅｔｒｉｘＧｅｎｅＣｈｉｐと共に、ＧｅｎｅＣｈｉｐＯｐｅｒａｔｉｎｇＳｏｆｔｗａｒｅ（ＧＣＯＳ）の使用によって、又はＡｆｆｙｍｅｔｒｉｘＧｅｎｅＣｈｉｐＣｏｍｍａｎｄＣｏｎｓｏｌｅ（商標）を使用することによって生データを獲得できる。生データを獲得した後、ＧｅｎｅＣｈｉｐＧｅｎｏｔｙｐｉｎｇＡｎａｌｙｓｉｓＳｏｆｔｗａｒｅ（ＧＴＹＰＥ）で解析をおこなう。特定のパーセンテージを下回るＧＴＹＰＥコールレートのサンプルを除外することもできる。例えば、約７０、７５、８０、８５、９０、又は９５％未満のコールレートを除外することもできる。次に、サンプルをＢＲＬＭＭ及び／又はＳＮｉＰｅｒアルゴリズム解析で調べる。９５％未満のＢＲＬＭＭコールレート又は９８％未満のＳＮｉＰｅｒコールレートのサンプルは除外する。最後に、関連性解析を実施し、０．４５未満のＳＮｉＰｅｒ品質指数及び／又は０．００００１未満のＨａｒｄｙ‐Ｗｅｉｎｂｅｒｇｐ値を有するサンプルを除外する。

マイクロアレイ解析に代わって、又はこれに加えて、他のハイブリダイゼーションに基づく方法、例えばＴａｑＭａｎ法及びその変法などを使用することによって、ＳＮＰや突然変異などの遺伝子変異が検出できる。ＴａｑＭａｎＰＣＲ、反復ＴａｑＭａｎ、及びリアルタイムＰＣＲ（ＲＴ‐ＰＣＲ）のその他の変法（例えばＬｉｖａｋｅｔａｌ．，ＮａｔｕｒｅＧｅｎｅｔ．，９，３４１‐３２（１９９５）及びＲａｎａｄｅｅｔａｌ．，ＧｅｎｏｍｅＲｅｓ．，１１，１２６２‐１２６８（２００１）に記載されている）を本明細書中に開示する方法に利用できる。いくつかの実施形態において、特定の遺伝子変異、例えばＳＮＰなどのためのプローブを標識してＴａｑＭａｎプローブを作製する。このプローブは典型的には少なくとも約１２、１５、１８又は２０塩基対の長さである。これらは約１０〜７０、１５〜６０、２０〜６０、又は１８〜２２塩基対長であってよい。このプローブを、レポーター標識、例えばフルオロフォアで５’末端を、そして３’末端を該標識のクエンチャーで標識する。レポーター標識は、クエンチャーに非常に接近すると、例えば該プローブの長さ程に接近するとその蛍光が阻害又はクエンチされる任意の蛍光分子であってもよい。例えば、レポーター標識は、６‐カルボキシフルオレセイン（ＦＡＭ）、テトラクロロフルオレセイン（ＴＥＴ）又はその誘導体などのフルオロフォアであってもよく、クエンチャーはテトラメチルローダミン（ＴＡＭＲＡ）、ジヒドロシクロピロロインドールトリペプチド（ＭＧＢ）又はその誘導体であってもよい。

レポーターフルオロフォア及びクエンチャーがプローブの長さ分だけ隔てられて接近すると、蛍光はクエンチされる。プローブが標的配列、例えばサンプル中のＳＮＰを含む配列とアニーリングするとき、５’から３’へのエキソヌクレアーゼ活性を有するＤＮＡポリメラーゼ、例えばＴａｑポリメラーゼなどがプライマーを伸長させ、エキソヌクレアーゼ活性がプローブを開裂させ、レポーターをクエンチャーから分離し、その結果レポーターが蛍光を発する。このプロセスは、例えばＲＴ‐ＰＣＲなどにおいて反復される。ＴａｑＭａｎプローブは、典型的には、配列を増幅するように設計された２つのプライマー間に位置する標的配列と相補的である。よって、各プローブが新たに作製されたＰＣＲ産物とハイブリダイズできるため、ＰＣＲ産物の蓄積が、放出されるフルオロフォアの蓄積と相関し得る。放出されるフルオロフォアを計測し、存在する標的配列の量を決定できる。高速大量処理遺伝子型決定のためのＲＴ‐ＰＣＲ法を利用できる。

遺伝子変異はまた、ＤＮＡ配列決定によっても特定できる。ＤＮＡ配列決定を利用して個体のゲノム配列のかなりの部分又は全体の配列決定ができる。伝統的には、一般的なＤＮＡ配列決定は、ポリアクリルアミドゲル分画化に基づいて鎖終止断片の集団を分解してきた（Ｓａｎｇｅｒｅｔａｌ．，Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ７４：５４６３‐５４６７（１９７７））。ＤＮＡ配列決定の速度及び容易さを高める代替法が開発されており、且つ、その開発が続いている。例えば、高速大量処理及び単分子配列決定プラットフォームが、４５４ＬｉｆｅＳｃｉｅｎｃｅｓ（Ｂｒａｎｆｏｒｄ，ＣＴ）（Ｍａｒｇｕｌｉｅｓｅｔａｌ．，Ｎａｔｕｒｅ４３７：３７６‐３８０（２００５））；Ｓｏｌｅｘａ／Ｉｌｌｕｍｉｎａ（Ｈａｙｗａｒｄ，ＣＡ）；ＨｅｌｉｃｏｓＢｉｏＳｃｉｅｎｃｅｓＣｏｒｐｏｒａｔｉｏｎ（Ｃａｍｂｒｉｄｇｅ，ＭＡ）（２００５年６月２３日付で出願された米国特許出願番号第１１／１６７０４６号）、及びＬｉ‐ＣｏｒＢｉｏｓｃｉｅｎｃｅｓ（Ｌｉｎｃｏｌｎ，ＮＥ）（２００５年４月２９日付で出願された米国特許出願番号第１１／１１８０３１号、）から市販されているか、又は開発中である。

個体のゲノムプロファイルを作成した後、このプロファイルを、例えばコンピューターが読み取り可能なメディアなどにデジタル保存する。このプロファイルをセキュリティーで保護された様式でデジタル保存することもできる。このゲノムプロファイルを、例えばコンピューターが読み取り可能なメディアなどにデータセットの一部として保存するためにコンピューターが読み取り可能な形式でコード化してデータベースとして保存するが、その場合、ゲノムプロファイルは「預けられ（ｂａｎｋｅｄ）」、後に再びアクセスすることができる。このデータセットは複数のデータ点を含んでなり、ここで各データ点はある個体に関連している。各データ点は複数のデータ要素を持つことができる。１個のデータ要素は一意的な識別子であり、個体のゲノムプロファイルの特定に利用される。その一意的な識別子はバーコードであってもよい。別のデータ要素は遺伝子型情報、例えばＳＮＰｓ又は個体のゲノムのヌクレオチド配列などである。遺伝子型情報に対応するデータ要素もまた、データ点に包含されていてもよい。例えば、遺伝子型情報がマイクロアレイ解析により特定されたＳＮＰを含む場合、他のデータ要素は、マイクロアレイＳＮＰ識別番号を包含し得る。あるいは、遺伝子型情報が他の手段、例えばＲＴ‐ＰＣＲ法（例えばＴａｑＭａｎアッセイなど）などによって特定された場合、データ要素は蛍光レベル、プライマー情報、及びプローブ配列を包含し得る。他のデータ要素は、ＳＮＰｒｓ番号、多型ヌクレオチド、遺伝子型情報の染色体位置、データの品質測定法、生データファイル、データの画像、及び抽出された強度スコアを包含し得るが、これだけに限定されるものではない。

例えば身体データ、医療データ、民族性、祖先、地理、性別、年齢、家族歴、既知の表現型、人口統計データ、暴露データ、ライフスタイルデータ、行動データ、及びその他の既知の表現型などの個体の特異的因子もまたデータ要素として組み込むことができる。例えば因子には、個体の出生地、両親及び／又は祖父母、血縁者の祖先、居住地、祖先の居住地、環境条件、既知の健康状態、既知の薬物相互作用、家族の健康状態、ライフスタイル状況、食生活、運動習慣、結婚歴、及び身体計測値、例えば、体重、身長、コレステロールレベル、心拍数、血圧、グルコースレベル、及び当該技術分野で知られているその他の測定値が包含されるがこれだけに限定されるものではない。個体の血縁者又は祖先、例えば両親や祖父母などについての上記因子をデータ要素として組み込み、表現型又は状態に関する個体のリスクを決定するために利用することもできる。

特別な因子がアンケート又は個体のヘルスケア管理者から得られることがある。その場合、「預けられた」プロファイルからの情報にアクセスし、所望により利用することができる。例えば、個体の遺伝子型相関を最初に評価する場合、その個体の全情報（典型的には、ゲノム全体にわたる又はゲノム全体から入手した、ＳＮＰ又はその他のゲノム配列）が遺伝子型相関について解析される。その後の解析では、保存された若しくは預けられたゲノムプロファイル由来の情報全体、又はその一部に、希望に応じて、又は必要に応じてアクセスすることができる。

相関と表現型プロファイル
ゲノムプロファイルは、表現型プロファイルを作成するのに使用される。このゲノムプロファイルは、典型的には、デジタル保存され、表現型プロファイルを作成する任意の時点で容易にアクセスされる。表現型プロファイルは、遺伝子型を表現型と相関させ又は関連づける規則を適用することによって作成される。典型的には、その規則はコンピュータを使用して適用される。規則は、遺伝子型と表現型との相関を実証する科学的研究に基づいて作成できる。相関は、１人又はそれ以上の専門家による委員会により監督又は検証される。個体のゲノムプロファイルに規則を適用することにより、個体の遺伝子型と表現型との関連性が決定できる。個体の表現型プロファイルはこの決定を有することになる。その決定は、該個体が所定の表現型を有する、又はその表現型を発現するであろうという、個体の遺伝子型及び所定の表現型の間の明らかな関連性であってもよい。あるいは、その個体が所定の表現型を持たない、又は発現しないであろう、という決定がなされてもよい。他の実施形態では、この決定は、個体がある表現型を有する、又は発現するであろうというリスク因子、推定、又は確率であってもよい。

この決定は、いくつかの規則に基づいておこなうことができ、例えば、複数の規則をゲノムプロファイルに適用して、個体の遺伝子型と特定の表現型の関連性を決定することができる。この決定はまた、個体に特有の因子、例えば民族性、性別、ライフスタイル（例えば食習慣や運動習慣）、年齢、環境（例えば居住地）、家族の既往歴、及びその他の既知の表現型などを組み込むこともできる。この特有の因子の組み入れは、これらの因子を包含する既存の規則を修正することによるものであってもよい。あるいは、これらの因子によって別個の規則を作成し、既存の規則を適用した後に個体の表現型決定に適用することもできる。

表現型には任意の計測可能な形質又は特徴、例えば特定の疾患への感受性若しくは薬物療法に対する応答などを包含することができる。包含され得るその他の表現型は、身体的及び精神的特徴、例えば身長、体重、毛髪の色、目の色、日焼けに対する感受性、体格、記憶、知性、楽観主義のレベル、及び一般気質などである。表現型はまた、他の個体又は生物との遺伝的比較をも包含し得る。例えば、個体は自身のゲノムプロファイルと著名人のゲノムプロファイルの類似性に興味を持つかもしれない。彼らのゲノムプロファイルはまた、細菌、植物又は他の動物などの他の生物と比較させることもできる。同時に、個体に関して決定される相関表現型のコレクションには、個体に関する表現型プロファイルが包含される。

遺伝子変異と表現型の相関を、科学文献から入手する。遺伝子変異についての相関を、着目の１若しくは複数の表現型形質の有無について、そしてそれらの遺伝子型プロファイルについて検査された個体集団の解析から決定する。それぞれの遺伝子変異の対立遺伝子又はそのプロファイル中の多型を再検討し、特定の対立遺伝子の有無が着目の形質と関連するかどうかを決定する。相関づけは標準的な統計学的方法によって実施でき、遺伝子変異と表現型の特徴の間の統計学的に有意な相関を記録する。例えば、多型Ａの対立遺伝子Ａ１の存在は心臓病と相関していることが決定づけられるかもしれない。更なる例として、多型Ａにおける、対立遺伝子Ａ１と多型Ｂにおける対立遺伝子Ｂ１の共存が、癌のリスク増加と相関することがわかるかもしれない。解析結果は専門家の検討する文献に発表され、他の研究グループによって検証され、及び／又は専門家、例えば遺伝学者、統計学者、疫学者及び医師などから成る委員会により解析され、さらには監督されることもある。例えば、米国特許公開番号第２００８０１３１８８７及びＰＣＴ公報第ＷＯ／２００８／０６７５５１号（両文献の全体を本明細書中に援用する）に開示されている相関を、本明細書中に記載の実施形態に使用することもできる。

あるいは、相関は保存されたゲノムプロファイルから作成されることもできる。例えば、保存されたゲノムプロファイルを持つ個体はまた、既知の表現型情報も同様に保存させることができる。この保存されたゲノムプロファイル及び既知表現型の解析が、遺伝子型相関を生じることもある。一例として、保存されたゲノムプロファイルを有する２５０人の個体が、過去に糖尿病と診断されたという保存された情報も持っている。それらのゲノムプロファイルの解析をおこない、糖尿病のなし対照個体群と比較する。次に、過去に糖尿病と診断された個体が、対照群と比較して特定の遺伝子変異体を有する率が高いことを決定づけ、その特定の遺伝子変異体と糖尿病の間に遺伝子型相関が作成され得る。

特定の表現型に対する遺伝子変異体の検証された相関に基づいて規則を作成する。規則は、米国特許公開番号第２００８０１３１８８７号及びＰＣＴ公報第ＷＯ／２００８／０６７５５１号に開示されているように、相関している遺伝子型と表現型に基づいて作成することもでき、そしていくつかの規則は、効果推定値を作成するため、その他の要素、例えば性別又は民族性などを組み込むであろう。規則から導かれる他の尺度は、相対リスク上昇推定値がある。効果推定値と相対リスク上昇推定値は、公表文献によるものであってよく、又はその公表文献から算出されるものであってもよい。あるいは、規則は、保存されているゲノムプロファイル及び過去に判明した表現型から作成される相関に基づいていてもよい。

遺伝子変異はＳＮＰを包含することもできる。ＳＮＰは単一の部位に存在するが、１ヶ所の部位に特定のＳＮＰ対立遺伝子を有する個体は他の部位に特定のＳＮＰ対立遺伝子を有すると予想されることが多い。ＳＮＰと、個体を疾患又は症状に陥らせ易くする対立遺伝子の相関は、連鎖不平衡によって起こり、その場合、２又はそれ以上の遺伝子座における対立遺伝子の非ランダムな関連性が、組み換えを介したランダムな形成から予想されるよりも、より頻繁に集団に起こる。

その他の遺伝子マーカー又は変異体、例えばヌクレオチド反復若しくは挿入などもまた、特定の表現型と関連していることが示されている遺伝子マーカーと連鎖不平衡であることがある。例えば、あるヌクレオチド挿入がある表現型に相関し、あるＳＮＰがあるヌクレオチド挿入と連鎖不平衡にある。このＳＮＰと表現型の間の相関に基づいて規則が作成できる。このヌクレオチド挿入と表現型の間の相関に基づく規則もまた作成できる。１個のＳＮＰの存在があるリスク因子を与え、別のＳＮＰの存在が別のリスク因子を与え、そしてそれらが組み合わせられると、リスクを増強し得るといったように、いずれかの規則又は両方の規則をゲノムプロファイルに適用できる。

連鎖不平衡を通じて、ある疾患にかかりやすくする対立遺伝子は、ＳＮＰの特定の対立遺伝子又はＳＮＰの特定の対立遺伝子の組み合わせと一緒に分離する。染色体に沿ったＳＮＰ対立遺伝子の特定の組み合わせをハプロタイプと呼び、それらが組み合わさって存在するＤＮＡ領域をハプロタイプブロックと呼ぶことができる。ハプロタイプブロックは、１個のＳＮＰで構成され得るが、典型的にはハプロタイプブロックは、個体間でのハプロタイプ多様性の低い、且つ一般に組み換え頻度の低い、連続した２又はそれ以上のＳＮＰを表す。ハプロタイプの特定は、あるハプロタイプブロックに存在する１若しくは複数のＳＮＰを特定することによっておこなうことができる。よって、典型的には、ＳＮＰプロファイルを使用して、所定のハプロタイプブロック中のすべてのＳＮＰの特定を必ずしも必要とせずに、ハプロタイプブロックを特定することができる。

ＳＮＰハプロタイプパターンと疾患、状態又は身体状態の間の遺伝子型相関が次第に判明しつつある。所定の疾患について、その疾患を患っているとわかっている人々の群のハプロタイプパターンを、該疾患を患っていない人々の群と比較する。多くの個体を解析することによって、集団における多型の頻度を決定し、次にこれらの頻度又は遺伝子型を特定の表現型、例えば疾患若しくは状態と関連づけることができる。既知のＳＮＰ‐疾患相関の例には、加齢性黄斑変性症における補体因子Ｈの多型（Ｋｌｅｉｎｅｔａｌ．，Ｓｃｉｅｎｃｅ：３０８：３８５‐３８９（２００５））及び肥満に関連するＩＮＳＩＧ２遺伝子近傍の変異体（Ｈｅｒｂｅｒｔｅｔａｌ．，Ｓｃｉｅｎｃｅ：３１２：２７９‐２８３（２００６））がある。その他の既知のＳＮＰ相関には、ＣＤＫＮ２Ａ及びＢを包含する９ｐ２１領域の多型、例えば心筋梗塞に相関するｒｓ１０７５７２７４、ｒｓ２３８３２０６、ｒｓ１３３３３０４０、ｒｓ２３８３２０７、及びｒｓ１０１１６２７７がある（Ｈｅｌｇａｄｏｔｔｉｒｅｔａｌ．，Ｓｃｉｅｎｃｅ３１６：１４９１‐１４９３（２００７）；ＭｃＰｈｅｒｓｏｎｅｔａｌ．，Ｓｃｉｅｎｃｅ３１６：１４８８‐１４９１（２００７））。

ＳＮＰは機能的であるか又は非機能的であるかもしれない。例えば、機能的なＳＮＰは、細胞機能に影響を及ぼし、その結果、表現型をもたらすが、それに対して非機能的なＳＮＰは、機能の点で沈黙しているが機能的なＳＮＰと連鎖不平衡にあることがある。ＳＮＰはまた、同義的であることも非同義的であることもある。同義的であるＳＮＰとは、異なった形態が同じポリペプチド配列を導くＳＮＰであり、そしてそれは非機能的なＳＮＰである。ＳＮＰが異なるポリペプチドを導く場合、そのＳＮＰは非同義的であり、機能的であることもそうでないこともある。２又はそれ以上のハプロタイプであるディプロタイプの中のハプロタイプを特定するのに用いられるＳＮＰ又はその他の遺伝子マーカーもまた、ディプロタイプに関連する表現型の相関づけに利用できる。個体のハプロタイプ、ディプロタイプ、及びＳＮＰプロファイルに関する情報は、その個体のゲノムプロファイルの中にあり得る。

典型的には、ある表現型と相関している別の遺伝子マーカーと連鎖不平衡にある遺伝子マーカーに基づいて規則が作成されるためには、その遺伝子マーカーは、当該技術分野において連鎖不平衡を決定するのに一般的に使用されるスコアである、ｒ²又はＤ’スコアが０．５より大きい。スコアは、約０．５、０．６、０．７、０．８、０．９０、０．９５又は０．９９超であり得る。その結果、個体のゲノムプロファイルに表現型を相関させるのに使用される遺伝子マーカーは、表現型と相関する機能的又は公表されたＳＮＰと同じであってもよいし異なっていてもよい。いくつかの実施形態では、試験ＳＮＰはまだ特定できていないが、公表されたＳＮＰ情報を使用して、対立遺伝子の相違又はＳＮＰを別のアッセイ、例えばＴａｑＭａｎなどに基づいて特定することもできる。例えば、公表されたＳＮＰはｒｓ１０６１１７０であるが、試験ＳＮＰは特定されていない。試験ＳＮＰは、公表されたＳＮＰを用いたＬＤ解析によって特定することもできる。あるいは、試験ＳＮＰを使用できず、代わりにＴａｑＭａｎ又はその他の類似のアッセイが試験ＳＮＰを持っている個体のゲノムを評価するのに使用される。

試験ＳＮＰは「直接的（ＤＩＲＥＣＴ）」又は「タグ（ＴＡＧ）」ＳＮＰであってもよい。直接的ＳＮＰは、公表されたか又は機能的なＳＮＰと同じ試験ＳＮＰである。例えば、直接的ＳＮＰは、ヨーロッパ人及びアジア人におけるＳＮＰｒｓ１０７３６４０（マイナーな対立遺伝子はＡであり、他の対立遺伝子はＧである）を利用して、ＦＧＦＲ２と乳癌の相関に使用にも利用できる（Ｅａｓｔｏｎｅｔａｌ．，Ｎａｔｕｒｅ４４７：１０８７‐１０９３（２００７））。ヨーロッパ人及びアジア人におけるＦＧＦＲ２と乳癌の相関に関する直接的ＳＮＰになりうるもう一つの公表された又は機能的なＳＮＰはｒｓ１２１９６４８である（Ｈｕｎｔｅｒｅｔａｌ．，Ｎａｔ．Ｇｅｎｅｔ．３９：８７０‐８７４（２００７））。タグＳＮＰは、試験ＳＮＰが機能的であるか又は公表されたＳＮＰのそれと異なっているところである。タグＳＮＰはまた、ＣＡＭＴＡ１（ｒｓ４９０８４４９）、９ｐ２１（ｒｓ１０７５７２７４、ｒｓ２３８３２０６、ｒｓ１３３３３０４０、ｒｓ２３８３２０７、ｒｓ１０１１６２７７）、ＣＯＬ１Ａ１（ｒｓ１８０００１２）、ＦＶＬ（ｒｓ６０２５）、ＨＬＡ‐ＤＱＡ１（ｒｓ４９８８８８９、ｒｓ２５８８３３１）、ｅＮＯＳ（ｒｓ１７９９９８３）、ＭＴＨＦＲ（ｒｓ８０１１３３）、及びＡＰＣ（ｒｓ２８９３３３８０）のＳＮＰなどのその他の遺伝子変異体にも利用できる。

ＳＮＰのデータベースは、例えば国際ＨａｐＭａｐプロジェクト（ｗｗｗ．ｈａｐｍａｐ．ｏｒｇ，ＴｈｅＩｎｔｅｒｎａｔｉｏｎａｌＨａｐＭａｐＣｏｎｓｏｒｔｉｕｍ，Ｎａｔｕｒｅ４２６：７８９‐７９６（２００３）、及びＴｈｅＩｎｔｅｒｎａｔｉｏｎａｌＨａｐＭａｐＣｏｎｓｏｒｔｉｕｍ，Ｎａｔｕｒｅ４３７：１２９９‐１３２０（２００５）を参照のこと）、ｔｈｅＨｕｍａｎＧｅｎｅＭｕｔａｔｉｏｎＤａｔａｂａｓｅ（ＨＧＭＤ）公開データベース（ｗｗｗ．ｈｇｍｄ．ｏｒｇを参照のこと）、及びＳｉｎｇｌｅＮｕｃｌｅｏｔｉｄｅＰｏｌｙｍｏｒｐｈｉｓｍデータベース（ｄｂＳＮＰ）（ｗｗｗ．ｎｃｂｉ．ｎｌｍ．ｎｉｈ．ｇｏｖ／ＳＮＰ／を参照されたい）から公的に入手可能である。これらのデータベースは、ＳＮＰハプロタイプを提供するか、又はＳＮＰハプロタイプパターンの決定を可能にする。したがって、これらのＳＮＰデータベースにより、広範囲の疾患及び状態、例えば癌、炎症性疾患、心臓血管疾患、神経変性疾患、及び感染症などの根底に存在する遺伝的リスク因子の調査を可能にする。その疾患又は症状は、処置及び治療法が現在存在する、対処可能なものであるかもしれない。処置には、予防的処置、並びにライフスタイルの変更を包含する、症状及び状態を改善する処置が包含され得る。

身体的形質、生理的形質、精神的形質、情緒的形質、民族性、祖先、及び年齢などのその他の多くの表現型もまた調べることができる。身体的形質には、身長、髪の色、目の色、身体、又は形質、例えば持久力、耐久力、及び敏捷性などがある。精神的形質には、知性、記憶力、又は学習能力がある。民族性及び祖先には、祖先若しくは民族性の特定、又は個体の祖先の起源がどこであるかが包含される。年齢は、個体の実年齢の決定であることもあり、又は個体の遺伝的特徴が一般集団に対して該個体を位置づける年齢の決定であることもある。例えば、個体の実年齢は３８歳であるが、その遺伝的特徴は、記憶力や身体の健康が平均２８歳のものであると決定づけることがある。もう一つの年齢形質は、個体の推定寿命であり得る。

他の表現型はまた、非医学的状態、例えば「おもしろい」表現型なども包含し得る。これらの表現型は、周知の個体、例えば外国の要人、政治家、著名人、発明家、運動選手、音楽家、芸術家、実業家など、及び悪名高い個体、例えば囚人などとの比較を包含し得る。その他の「おもしろい」表現型は、他の生物、例えば細菌、昆虫、植物、又はヒト以外の動物などとの比較を包含し得る。例えば、個体は、自身のゲノムプロファイルが自分たちのペットのイヌ、又は元大統領のゲノムプロファイルと比較してどうなのかを知ることに興味を持つかもしれない。

預けられたゲノムプロファイルに規則を適用して、表現型プロファイルを作成する。例えば、公表された源からの、又は預けられたゲノムプロファイルからの相関データは、個体のゲノムプロファイルに適用するための規則又は試験の基礎を形成する。この規則は、試験ＳＮＰ及び対立遺伝子に関する情報、及び効果推定値、例えばＯＲなど、又はオッズ比（９５％信頼区間）若しくは平均値を包含することもできる。効果推定値は、遺伝子型リスク、例えば同型接合体にとってのリスク（ｈｏｍｏｚ又はＲＲ）、異型接合体にとってのリスク（ｈｅｔｅｒｏｚ又はＲＮ）、及び同型接合体にとっての非リスク（ｈｏｍｏｚ又はＮＮ）などであってよい。効果推定値はまた、保因者のリスクであってもよく、それはＲＲ又はＲＮ対ＮＮである。効果推定値は、対立遺伝子、対立遺伝子リスク、例えばＲ対Ｎに基づいていてもよい。２、３、４つ、又はそれ以上の遺伝子座の遺伝子効果推定値（例えば二遺伝子座効果推定値のための９個の可能な遺伝子型組み合わせについては、ＲＲＲＲ、ＲＲＮＮなど）もまたあり得る。

ある状態についての推定リスクは、米国特許出願公開番号第２００８０１３１８８７号及びＰＣＴ公報第ＷＯ２００８／０６７５５１号に列挙されるＳＮＰに基づくものであってよい。いくつかの実施形態では、ある状態についてのリスクは少なくとも１個のＳＮＰに基づくものであってよい。例えば、アルツハイマー（ＡＤ）、結腸直腸癌（ＣＲＣ）、骨関節炎（ＯＡ）又は落屑緑内障（ＸＦＧ））についての個体リスク評価は１ＳＮＰに基づくものであり得る（例えば、ＡＤについてはｒｓ４４２０６３８、ＣＲＣについてはｒｓ６９８３２６７、ＯＡについてはｒｓ４９１１１７８、及びＸＦＧについてはｒｓ２１６５２４１）。肥満（ＢＭＩＯＢ）、バセドウ病（ＧＤ）、又は血色素症（ＨＥＭ）などのその他の状態については、個体の推定リスクは少なくとも１又は２個のＳＮＰに基づくものであり得る（例えば、ＢＭＩＯＢについてはｒｓ９９３９６０９及び／又はｒｓ９２９１１７１；ＧＤについてはＤＲＢ１^*０３０１ＤＱＡ１^*０５０１及び／又はｒｓ３０８７２４３；ＨＥＭについてはｒｓ１８００５６２及び／又はｒｓ１２９１２８）。心筋梗塞（ＭＩ）、多発性硬化症（ＭＳ）、又は乾癬（ＰＳ）など（これだけに限定されるものではない）の状態については、１、２又は３個のＳＮＰを使用してこれらの状態については個体リスクを評価できる（例えば、ＭＩについてはｒｓ１８６６３８９、ｒｓ１３３３０４９、及び／又はｒｓ６９２２２６９；ＭＳについてはｒｓ６８９７９３２、ｒｓ１２７２２４８９、及び／又はＤＲＢ１^*１５０１；ＰＳについてはｒｓ６８５９０１８、ｒｓ１１２０９０２６、及び／又はＨＬＡＣ^*０６０２）。ムズムズ脚症候群（ＲＬＳ）又はセリアック病（ＣｅｌＤ）の個体リスク評価には、１、２、３、又は４個のＳＮＰ（例えば、ＲＬＳについてはｒｓ６９０４７２３、ｒｓ２３００４７８、ｒｓ１０２６７３２、及び／又はｒｓ９２９６２４９；ＣｅｌＤについてはｒｓ６８４０９７８、ｒｓ１１５７１３１５、ｒｓ２１８７６６８、及び／又はＤＱＡ１^*０３０１ＤＱＢ１^*０３０２）。前立腺癌（ＰＣ）又はループス（ＳＬＥ）については、１、２、３、４、又は５個のＳＮＰを使用してＰＣ又はＳＬＥの個体リスクを評価できる（例えば、ＰＣについてはｒｓ４２４２３８４、ｒｓ６９８３２６７、ｒｓ１６９０１９７９、ｒｓ１７７６５３４４、及び／又はｒｓ４４３０７９６；ＳＬＥについてはｒｓ１２５３１７１１、ｒｓ１０９５４２１３、ｒｓ２００４６４０、ＤＲＢ１^*０３０１、及び／又はＤＲＢ１^*１５０１）。個体の黄斑変性症（ＡＭＤ）又は関節リウマチ（ＲＡ）についての生涯リスク）を評価するには、１、２、３、４、５、又は６個のＳＮＰを使用できる（例えば、ＡＭＤについてはｒｓ１０７３７６８０、ｒｓ１０４９０９２４、ｒｓ５４１８６２、ｒｓ２２３０１９９、ｒｓ１０６１１７０、及び／又はｒｓ９３３２７３９；ＲＡについてはｒｓ６６７９６７７、ｒｓ１１２０３３６７、ｒｓ６４５７６１７、ＤＲＢ^*０１０１、ＤＲＢ１^*０４０１、及び／又はＤＲＢ１^*０４０４）。個体の乳癌（ＢＣ）についての生涯リスクを評価するには、１、２、３、４，５、６又は７個のＳＮＰを使用できる（例えば、ｒｓ３８０３６６２、ｒｓ２９８１５８２、ｒｓ４７００４８５、ｒｓ３８１７１９８、ｒｓ１７４６８２７７、ｒｓ６７２１９９６、及び／又はｒｓ３８０３６６２）。個体のクローン病（ＣＤ）又は２型糖尿病（Ｔ２Ｄ）についての生涯リスクを評価するには、１、２、３、４、５、６、７、８、９、１０、又は１１個のＳＮＰを使用できる。（例えば、ＣＤについてはｒｓ２０６６８４５、ｒｓ５７４３２９３、ｒｓ１０８８３３６５、ｒｓ１７２３４６５７、ｒｓ１０２１０３０２、ｒｓ９８５８５４２、ｒｓ１１８０５３０３、ｒｓ１０００１１３、ｒｓ１７２２１４１７、ｒｓ２５４２１５１、及び／又はｒｓ１０７６１６５９；Ｔ２Ｄについてはｒｓ１３２６６６３４、ｒｓ４５０６５６５、ｒｓ１００１２９４６、ｒｓ７７５６９９２、ｒｓ１０８１１６６１、ｒｓ１２２８８７３８、ｒｓ８０５０１３６、ｒｓ１１１１８７５、ｒｓ４４０２９６０、ｒｓ５２１５、及び／又はｒｓ１８０１２８２）。いくつかの実施形態では、リスク決定の基礎として使用されるＳＮＰは、上記のＳＮＰ又は米国特許出願公開番号第２００８０１３１８８７号及びＰＣＴ公報第ＷＯ２００８／０６７５５１号に記載のようなその他のＳＮＰと連鎖不平衡にあることもある。

個体の表現型プロファイルはいくつかの表現型を含み得る。特に、本明細書中に開示された方法による、疾患又はその他の状態、例えば代謝、有効性及び／又は安全を包含する起こり得る薬物反応などについての患者のリスク評価は、症候のある、又は前駆症候のある、又は無症候の個体にかかわらず、１若しくは複数の疾患／状態誘発対立遺伝子の保因者を包含する個体において、症候のある、又は前駆症候のある、又は無症候の個体における、複数の無関係の疾患及び状態への感受性の予後又は診断的解析を可能にする。したがって、これらの方法は、特定の疾患又は症状の検査についての先入観なしに、疾患又は症状に対する個体の感受性の一般評価を提供する。例えば、本明細書中に開示した方法は、個体のゲノムプロファイルに基づいて、米国特許出願公開第２００８０１３１８８７号及びＰＣＴ公報第ＷＯ２００８／０６７５５１号で列挙されているいくつかの状態のいずれかに対する個体の感受性評価を可能にする。さらに、この方法は、１若しくは複数の表現型又は状態に関する個体の推定される生涯リスク又は相対リスクの評価を可能にする。

この評価は、これらの状態のうち２又はそれ以上、これらの状態のうちの少なくとも３、４、５、１０、１５、１８、２０、２５、３０、３５、４０、４５、５０、１００又はそれ以上に関する情報を提供する。表現型についての１個の規則を、単一遺伝子表現型に適用できる。２以上の規則を１個の表現型、例えば多遺伝子表現型又は単一遺伝子表現型などに適用することもでき、この場合、１個の遺伝子の中にある複数の遺伝子変異体がその表現型を持っている確率に影響する。

個々の患者のゲノムプロファイルの初期スクリーニングに続いて、さらなる遺伝子変異体が判明した場合、そのさらなる遺伝子変異体、例えばＳＮＰなどと比較することにより、個体の遺伝子型相関の更新をおこなう（又はそれが入手できる）。例えば、更新は、新しい遺伝子型相関について科学文献を精査する、遺伝学分野において通常の技量を有する１人又はそれ以上の人々が、定期的に、例えば、毎日、毎週、又は毎月実施することができる。次いで、この新しい遺伝子型相関を、１人又はそれ以上の当該技術分野の専門家がさらに検証できる。

新しい規則は、既存の規則を持たない遺伝子型又は表現型を包含することができる。例えば、いかなる表現型とも相関していない遺伝子型が、新たな又は既存の表現型と相関していることが発見される。新しい規則はまた、過去にいずれの遺伝子型も相関していなかった表現型との相関についてのものであってもよい。新しい規則はまた、既存の規則を持っている遺伝子型及び表現型について決定されることもできる。例えば、遺伝子型Ａ及び表現型Ａの間の相関に基づく規則が存在する。新たな研究により、遺伝子型Ｂが表現型Ａと相関することが明らかになり、この相関に基づいて新しい規則が作られる。別の例では、表現型Ｂが遺伝子型Ａに関連していることが発見され、それよって新しい規則を作成することができる。

既知の、但し公表された科学文献では当初特定できなかった相関に基づく発見に関しても規則が作られることもある。例えば、遺伝子型Ｃが表現型Ｃと相関していることが報告される。別の刊行物は、遺伝子型Ｄが表現型Ｄと相関していることを報告する。表現型Ｃ及びＤは関連症状、例えば表現型Ｃが息切れであり、表現型Ｄが小さい肺活量である。遺伝子型Ｃ及びＤ、並びに表現型Ｃ及びＤを持つ個体の既存の預けられたゲノムプロファイルを用いる統計学的手段によって、又はさらなる研究によって、遺伝子型Ｃと表現型Ｄ、又は遺伝子型Ｄと表現型Ｃの間の相関が発見され、検証され得る。そして、新しく発見され検証された相関に基づいて、新しい規則が作成できる。他の実施形態では、特定の又は関連する表現型を持ついくつかの個体の預けられたゲノムプロファイルを調査し、それらの個体に共通な遺伝子型を決定し、相関を決定することができる。この相関に基づいて新しい規則が作成され得る。

既存の規則を修正するためにも規則が作成されることもある。例えば、遺伝子型と表現型の間の相関は、既知の個々の特徴、例えば該個体の民族性、祖先、地理、性別、年齢、家族歴、又はその他の任意の既知表現型などによっても部分的に決定できる。これらの既知の個々の特徴に基づいて規則を作成し、既存の規則に組み入れ、修正された規則を提供することができる。適用されるべき修正された規則の選択は、個体の特定の個々の因子に依存するであろう。例えば、個体が遺伝子型Ｅを持っている場合、表現型Ｅを持っている個体が３５％であるという確率に基づいて規則を作成できる。しかしながら、ある個体が特定の民族性を有する場合、その確率は５％である。この結果に基づいて新しい規則を作成し、その特定の民族性を持つ個体に適用することができる。あるいは、３５％という決定を含む既存の規則は適用し、次に該表現型について、民族性に基づく別の規則を適用することもできる。既知の個々の特徴に基づく規則は、科学文献から決定するか、又は預けられたゲノムプロファイルの研究に基づいて決定することもできる。新しい規則が作成されたときに、新しい規則をゲノムプロファイルに追加し、且つ、適用してもよいし、それらを定期的に、例えば年に一度、適用してもよい。

科学技術の進歩がより洗練されたＳＮＰゲノムプロファイルの解明を可能にしているため、個体の疾患リスクに関する情報もまた拡大され得る。先に示したように、初期ＳＮＰゲノムプロファイルは５０００００個のＳＮＰをスキャンするマイクロアレイ技術を使用することで容易に作成できる。ハプロタイプブロックの性質を考慮すると、この数によって、個体ゲノム中のすべてのＳＮＰの代表的なプロファイルの入手が可能である。それにもかかわらず、ヒトゲノムには約１０００万個のＳＮＰがあると推定されている（国際ＨａｐＭａｐプロジェクト；ｗｗｗ．ｈａｐｍａｐ．ｏｒｇ）。１００００００、１５０００００、２００００００、３００００００個又はそれ以上のＳＮＰのマイクロアレイ、又は全ゲノム配列決定などのように、科学技術の進歩が、実用的で費用効率の高いＳＮＰの解析をより洗練された詳細度で可能にするため、より詳細なＳＮＰゲノムプロファイルが作成できる。同様に、費用効率の高い、より洗練されたＳＮＰゲノムプロファイル解析及びＳＮＰ‐疾患相関に関するマスターデータベースへの更新が、コンピュータ解析法の進歩によって可能になる。

いくつかの実施形態では、「現場配置（ｆｉｅｌｄ−ｄｅｐｌｏｙｅｄ）」メカニズムを個体から収集し、個体のための表現型プロファイルに組み入れることもできる。例えば、ある個体は遺伝情報に基づいて初期表現型プロファイルを作成させることができる。作成された初期表現型プロファイルには、種々の表現型についてのリスク因子及び個人の行動プランの中で報告される、推奨される処置又は予防措置が含まれる。そのプロファイルは、特定の状態のために利用可能な薬物療法に関する情報、及び／又は食生活の変更又は運動レジメンに関する提案）を含み得る。その個体は、自信の表現型プロファイルについて相談するために、医師又は遺伝カウンセラーに面会するか、又はウェブポータル若しくは電話により連絡を取るかを選ぶことができる。その個体は、例えば、特別な薬剤治療をする、食生活を変えるなど、いずれかの一連の行動を取る決意をすることもある。次に、その個体は、それに続いて自身の身体状態の変化及びリスク因子に起こり得る変化を評価するために生体サンプルを提出し得る。

個体は、ゲノムプロファイル及び表現型プロファイルを作成する設備（又は関連施設、例えば遺伝子プロファイル及び表現型プロファイルを作成する事業体と契約した施設など）に生体サンプルを直接提出することによって、変化を決定してもらうことができる。あるいは、その個体は、「現場配置」メカニズムを使用でき、その場合、個体は唾液、血液、又はその他の生体サンプルを自宅の検出装置にかけ、第三者に解析させ、そしてそのデータを送信して別の表現型プロファイルに組み入れることができる。例えば、ある個体が、遺伝データに基づいて心筋梗塞（ＭＩ）の生涯リスクが高いと報告する初期表現型報告を受け取ったかもしれない。その報告にはまた、ＭＩのリスクを低減するための予防措置についての提案、例えばコレステロール低下薬及び食物の変更なども記載されていることもある。その個体は、遺伝カウンセラー又は医師に連絡をとり、その報告と予防措置について相談することを選ぶことができ、そして食生活を変えようと決める。新たな食生活でしばらく過ごした後に、その個体は、かかりつけの医師の診察を受け、コレステロールレベルを計測してもらうことができる。ゲノム情報を持っている事業体に新しい情報（コレステロールレベル）が（例えばインターネットを介して）伝えられ、そしてこの新しい情報が、心筋梗塞及び／又はその他の状態に関する新しいリスク因子を伴う該個体の新しい表現型プロファイルの作成に利用される。

個体はまた、特定の薬剤に対する自身の個々の応答を決定するために「現場配置」メカニズム又は直接メカニズムを使用することもできる。例えば、個体は、ある薬物に対する自身の応答を計測してもらい、その情報を利用して、より効果的な処置を決定することができる。計測可能な情報には、代謝物レベル、グルコースレベル、イオンレベル（例えば、カルシウム、ナトリウム、カリウム、鉄）、ビタミン、血球数、ボディーマスインデックス（ＢＭＩ）、タンパク質レベル、転写物レベル、心拍数などがあり（但しこれだけに限定されるものではない）、これらをで容易に実施可能な方法で測定し、アルゴリズム上で要因として考慮して、初期ゲノムプロファイルと組み合わせて、修正された総合的なリスク推定スコアを決定することができる。このリスク推定スコアは、ＧＣＩスコアであってもよい。

遺伝複合指数（ＧＣＩ）
いくつかの実施形態では、多数の遺伝子マーカー又は変異体と１若しくは複数の疾患又は症状の関連性に関する情報を組み合わせ、解析して遺伝複合指数（ＧｅｎｅｔｉｃＣｏｍｐｏｓｉｔｅＩｎｄｅｘ）（ＧＣＩ）スコアを求める。例えば、ＧＣＩスコアには、１若しくは複数のオッズ比、又はある表現型に関して異なった遺伝子変異体の有無からの相対リスクを組み込むこともできる。ＧＣＩスコアには、様々な遺伝子変異体からの少なくとも２、３、４、５、６、７、８、９、又は１０のオッズ比又は相対リスクを組み込むこともできる。

このスコアは、既知のリスク因子、並びに他の情報及び仮定、例えば対立遺伝子頻度や疾患の有病率などを組み込んでいる。ＧＣＩを使用して、ある疾患又は症状と、一組の遺伝子マーカーの複合効果の関連性を定性的に推定することができる。ＧＣＩスコアを使用して、遺伝子の訓練を受けていない人々に、彼らの個人のいかなる疾患リスクが最新の科学的研究に基づいて関連集団と比較されているかについての、信頼できる（すなわちロバストな）、理解できる、及び／又は直感的な感覚を提供できる。

ＧＣＩプラススコアは、ＧＣＩスコアを使用して作成することができる。本明細書中に開示した方法は、ＧＣＩスコアを使用を包含するものなので、当業者は、本明細書中に記載のＧＣＩスコアに代わるＧＣＩプラススコア又はその変形の使用を容易に理解できるであろう。ＧＣＩプラススコアは、リスク（例えば生涯リスクなど）、年齢により定義される有病率、及び／又は年齢により定義される該状態の発生率を包含する、すべてのＧＣＩ仮定を含むことができる、そして、個体の生涯リスクをＧＣＩプラススコアとして算定できるが、それは、個体のＧＣＩスコアを平均ＧＣＩスコアで除したものに比例する。平均ＧＣＩスコアは、類似の祖先背景を持つ個体群、例えば、白人、アジア人、東インド人の群、又は共通の祖先背景を持つその他の群から決定することができる。群は少なくとも５、１０、１５、２０、２５、３０、３５、４０、４５、５０、５５、又は６０人の個体を含み得る。いくつかの実施形態では、平均値は、少なくとも７５、８０、９５、又は１００人の個体から決定され得る。ＧＣＩプラススコアは、個体のＧＣＩスコアを決定し、そのＧＣＩスコアを平均相対リスクで除し、そしてある状態又は表現型について生涯リスクを掛けることによって決定できる。例えば、米国特許出願公開第２００８０１３１８８７号及びＰＣＴ公報第ＷＯ２００８／０６７５５１からのデータを利用して、個人のＧＣＩ又はＧＣＩプラススコアを決定できる。このスコアを、個体の表現型プロファイルの中の１若しくは複数の状態に関する遺伝的リスク、例えば推定生涯リスクなどに関する情報を作成するのに使用できる。この方法は、推定生涯リスク、あるいは１若しくは複数の表現型又は状態に関する相対リスクの算定を可能にする。単一状態に関するリスクは、１若しくは複数のＳＮＰに基づくことができる。例えば、表現型又は状態に関する推定リスクは、少なくとも２、３、４、５、６、７、８、９、１０、１１、又は１２個のＳＮＰに基づき、この場合、リスクを推定するためのＳＮＰは、公表されたＳＮＰ、試験ＳＮＰ、又はその両方であり得る。

ＧＣＩスコアを、目的とする疾患又は症状の各々について作成する。これらのＧＣＩスコアを集めて、ある個体のリスクプロファイルを形成できる、ＧＣＩスコアは、リスクプロファイルを作成するため、いかなる時点においても容易にアクセスできるようにデジタル保存することができる。リスクプロファイルは、例えば癌、心臓病、代謝異常、精神障害、骨疾患、又は年齢発症障害などの広範な疾患クラスに分類できる。広範な疾患クラスはさらに下位カテゴリーに細分できる。例えば、癌などの広範なクラスでは、タイプ（肉腫、癌腫又は白血病など）又は組織特異性（神経、乳房、卵巣、精巣、前立腺、骨、リンパ節、膵臓、食道、胃、肝臓、脳、肺、腎臓など）による癌の下位カテゴリーを列挙できる。さらにリスクプロファイルは、個体の年齢又は様々なリスク因子を調節する時にＧＣＩスコアの変化をどう予測するかに関する情報を示すことができる。例えば、特定の疾患についてのＧＣＩスコアは、食生活の変化効果又は実行された予防措置（禁煙、薬物投与、定型的両側乳房切除術、子宮摘出術等）の効果を考慮に入れることができる。

ＧＣＩスコアが、ある個体のために作成され、それが少なくとも１つの疾患又は症状を獲得するその個体のリスク又は感受性について容易に理解できる情報を提供する。１若しくは複数のＧＣＩスコアが、たった一つの疾患、状態、多数の疾患又は症状について作成され得る。１若しくは複数のＧＣＩスコアがオンラインポータルによってアクセス可能である。あるいは、１若しくは複数のＧＣＩスコアが紙の形態で提供され、その後の更新もまた紙の形態で提供されることもできる。この紙の形態は、個体又は彼らのヘルスケア管理者にメールされるか、又は自分で提供できる。

異なる遺伝子座の組み合わせ効果に関するロバストなＧＣＩスコアを作成するための方法は、研究された各遺伝子座に関する報告された個体リスクに基づいている。例えば、目的とする疾患又は症状が同定され、次にその他のデータベース、特許公告、及び科学文献を含めた情報源は、１若しくは複数の遺伝子座と疾患又は症状の関連に関する情報を質問される。これらの情報提供源は、品質基準を使用して企画され、評価される。いくつかの実施形態では、評価プロセスは、多数のステップを伴う。他の実施形態では、情報源は、多数の品質基準に関して評価される。情報源から得られる情報は、目的とする疾患又は症状の各々に対する１若しくは複数の遺伝子座に関するオッズ比又は相対リスクを特定するのに使用される。

代替の実施形態では、少なくとも１つの遺伝子座に関するオッズ比（ＯＲ）又は相対リスク（ＲＲ）は、情報源から入手可能でないか又はアクセス可能でない。ＲＲはその場合、（１）同一遺伝子座の複対立遺伝子の報告されたＯＲ、（２）データセット、例えばＨａｐＭａｐデータセットからの対立遺伝子頻度、及び／又は（３）利用可能な情報源（例えばＣＤＣ、国立健康統計センターなど）からの疾患／状態有病率を使用することで算定され、目的とするすべての対立遺伝子のＲＲを得る。１つの実施形態では、同一遺伝子座の複対立遺伝子のＯＲは、別々に又は独立に推定される。好ましい実施形態では、同一遺伝子座の複対立遺伝子のＯＲは、異なる対立遺伝子のＯＲ間の依存関係を説明するために組み合わされる。いくつかの実施形態では、確立された疾患モデル（例えば乗法的、加法的、ハーバード修正型、優性効果などのモデルがあるが、これだけに限定されるものではない）を用いて、選ばれたモデルに従って個体のリスクを表す中間スコアを作成する。

目的とする疾患又は症状に関する多数のモデルを解析し、これらの異なるモデルから得られた結果を相関させる方法を使用する；これは、特定の状態モデルの選択により導入され得る可能性のある誤差を最小限にする。この方法は、相対リスクの算定に関する情報源から得られる有病率、対立遺伝子頻度、及びＯＲの推定における合理的な誤差の影響を最小限にする。ＲＲに及ぼす有病率推定の影響の「直線性」又は単調性のため、理論値によって制限されずに、最終ランクスコアに及ぼす不正確な有病率推定の影響はまずない；但し、同一モデルは、報告が作成されるすべての個体に一貫して適用される。

本明細書中に記載した方法はまた、追加的「遺伝子座」として環境／行動／人口統計のデータを考慮に入れることができる。関連方法では、そのようなデータは、医学又は科学文献又はデータベースなどの情報源から（例えば、喫煙と肺癌の関連、又は保険業界健康リスク評価から）得ることができる。１若しくは複数の複合疾患に関して示されるＧＣＩスコアもまた、本明細書中に開示される。複合疾患は、多遺伝子、環境因子、及びそれらの相互作用により影響を及ぼされ得る。多数の可能性のある相互作用は、複合疾患を研究する場合、解析される必要がある。ＧＣＩスコアを作成するために、多重比較に関して補正するために実行される手法、例えばボンフェローニ補正などを使用できる。あるいは、Simes検定を用いて検定が非依存的であるか又は特定の型の依存を示す場合、全体の有意水準（別名「族辺りの過誤率（ｆａｍｉｌｙｗｉｓｅｅｒｒｏｒｒａｔｅ）」）を制御するために使用できる（ＳａｒｋａｔＳ．，ＡｎｎＳｔａｔ２６：４９４‐５０４（１９９８））。Simes検定は、１、．．．、Ｋにおける任意のｋに関してｐ_(k)≦αｋ／Ｋである場合に、すべてのＫ検定特異的帰無仮説が正しいという、全体的帰無仮説を棄却する（Simes，Ｒ．Ｊ．，Ｂｉｏｍｅｔｒｉｋａ７３：７５１‐７５４（１９８６））。

多遺伝子及び多環境因子解析との関連で使用されるその他の実施形態は、誤り発見率（ｆａｌｓｅ‐ｄｉｓｃｏｖｅｒｙｒａｔｅ）‐すなわち、間違って棄却される棄却帰無仮説の予想比率、を制御する。このアプローチは、マイクロアレイ研究の場合と同様に、帰無仮説の一部が誤っていると推定される場合、特に有効である。Ｄｅｖｌｉｎら（Ｇｅｎｅｔ．Ｅｐｉｄｅｍｉｏｌ．２５：３６‐４７（２００３））は、多遺伝子座関連研究において多数の考え得る遺伝子×遺伝子相互作用を試験する場合、誤り発見率を制御するＢｅｎｊａｍｉｎｉ及びＨｏｃｈｂｅｒｇ（Ｊ．Ｒ．Ｓｔａｔ．Ｓｏｃ．Ｓｅｒ．Ｂ５７：２８９‐３００（１９９５））のステップアップ手法の変法を提唱した。Ｂｅｎｊａｍｉｎｉ及びＨｏｃｈｂｅｒｇ手法は、Simes検定と関連づけられる；ｐ_(k)≦αｋ／Ｋであるようにｋ^*＝ｍａｘｋと設定すると、それはｐ（１）、．．．、ｐ_(k ^* ₎に対応するすべてのｋ^*帰無仮説を棄却する。実際、Ｂｅｎｊａｍｉｎｉ及びＨｏｃｈｂｅｒｇの手法は、すべての帰無仮説が正しい場合、Simes検定と同じになる（ＢｅｎｊａｍｉｎｉａｎｄＹｅｋｕｔｉｅｌｉ，Ａｎｎ．Ｓｔａｔ．２９：１１６５‐１１８８（２００１））。

最終ランクスコアをつけるためにその中間スコアに基づく個体集団との比較において、個体がランクづけされる個体のランキングもまた本明細書中に提供される。これは、集団におけるランク、例えば９９^th百分位数、又は９９^th、９８^th、９７^th、９６^th、９５^th、９４^th、９３^th、９２^th、９１^th、９０^th、８９^th、８８^th、８７^th、８６^th、８５^th、８４^th、８３^th、８２^th、８１^th、８０^th、７９^th、７８^th、７７^th、７６^th、７５^th、７４^th、７３^th、７２^th、７１^th、７０^th、６９^th、６５^th、６０^th、５５^th、５０^th、４５^th、４０^th、４０^th、３５^th、３０^th、２５^th、２０^th、１５^th、１０^th、５^th、若しくは０^th百分位数などとして表され得る。ランクスコアは、１００^th〜９５^th百分位数、９５^th〜８５^th百分位数、８５^th〜６０^th百分位数、又は１００^th〜Ｏ^th百分位数の任意の下位範囲などの範囲として示され得る。個体はまた、四分位数、例えば最高７５^th四分位数、又は最低２５^th四分位数などでもランクづけできる。個体はまた、集団の平均又は中央値との比較においてもランクづけできる。

一実施形態では、個体が比較される集団は、様々な地理的及び民族的背景からの多くの人々、例えば世界的集団を包含する。あるいは、個体が比較される集団は、特定の地理、祖先、民族、性別、年齢（例えば胎児、新生児、小児、青年、ティーンエイジャー、成人、老人の個体）、疾患状態（例えば症候性、無症候性、保因性、早期発症、後期発症）に限定される。いくつかの実施形態では、個体が比較される集団は、公的及び／又は私的な情報源から報告された情報から得られる。

ＧＣＩスコアは、多段階プロセスを使用して作成される。例えば、最初に、試験されるべき各状態に関して、遺伝子マーカーの各々に関するオッズ比からの相対リスクが算定される。すべての有病率値ｐ＝０．０１、０．０２、．．．、０．５に関して、ＨａｐＭａｐＣＥＵ集団のＧＣＩスコアが、有病率に基づいて、そしてＨａｐＭａｐ対立遺伝子頻度に基づいて算定される。ＧＣＩスコアが種々の有病率下で不変である場合には、考慮される唯一の仮定は、乗法的モデルが存在するというものである。さもなければ、モデルは有病率に感受性である、ということが決定される。ＨａｐＭａｐ集団における相対リスクとスコアの分布が、無呼出値の任意の組み合わせに関しても得られる。各々の新規の個体にとって、個体のスコアがＨａｐＭａｐ分布と比較され、得られたスコアがこの集団における個体のランクである。プロセス中になされた仮定のため、報告されたスコアの解像度が低いことがある。集団は、変位値（３〜６ｂｉｎ）に分割され、報告されたｂｉｎは個体のランクが下がる場合のものである。ｂｉｎの数は、各疾患に関するスコアの解像度などの問題に基づいた異なる疾患に関しては異なり得る。異なるＨａｐＭａｐ個体のスコア間のつながりの場合、平均ランクが使用される。

ＧＣＩスコアが高いほど、状態又は疾患にかかっている又はそう診断されるリスクが増大する指標と解釈される。典型的には、数学的モデルを使用して、ＧＣＩスコアを得る。ＧＣＩスコアは、集団及び／又は疾患若しくは状態に関する基本的な情報の不完全性を説明する数学的モデルに基づいている。その数学的モデルは、ＧＣＩスコアを算定する基礎の一部として少なくとも１つの推定を包含するが、この場合、その推定としては、オッズ比値が与えられるという推定；状態の有病率が既知であるという推定；集団中の遺伝子型頻度が既知であるという推定；及び／又はカスタマーが試験に使用される集団と、そしてＨａｐＭａｐと同じ祖先背景から来ているという推定；合併リスクが個体の遺伝子マーカーの異なるリスク因子の積であるという推定があるが、これだけに限定されるものではない。ＧＣＩはまた、遺伝子型の多遺伝子型頻度がＳＮＰ又は個体の遺伝子マーカーの各々の対立遺伝子の頻度の積である（例えば異なるＳＮＰ又は遺伝子マーカーは集団全体で独立している）という推定も包含しうる。

乗法的モデル
ＧＣＩスコアは、遺伝子マーカーセットに起因すると考えられるリスクが個体の遺伝子マーカーに起因すると考えられるリスクの積である、という仮定の下で算定される。これは、異なる遺伝子マーカーが他の遺伝子マーカーとは独立して疾患のリスクに帰する、ことを意味する。形式的には、リスク対立遺伝子ｒ₁、．．．、ｒ_k及び非リスク対立遺伝子ｎ₁、．．．、ｎ_kを有するｋ遺伝子マーカーがある。ＳＮＰｉにおいて、３つの考え得る遺伝子型値をｒ_iｒ_i、ｎ_iｒ_i、及びｎ_iｎ_iとして示す。個体の遺伝子型情報は、位置ｉにおけるリスク対立遺伝子の数によって、ベクター（ｇ₁、．．．、ｇ_k）｛ここで、ｇｉは、０、１、又は２であり得る。｝により記述され得る。同一位置での同型非リスク対立遺伝子と比較した場合の位置ｉにおける異型遺伝子型の相対リスクをλⁱ ₁によって示す。言い換えれば、以下のとおりである。

同様に、ｒ_iｒ_i遺伝子型の相対リスクは、以下のように示す。

乗法的モデル下では、遺伝子型（ｇ１、．．．、ｇｋ）を有する個体のリスクは、以下：

であると、仮定する。

相対リスクの推定
他の実施形態では、異なる遺伝子マーカーに関する相対リスクは既知であり、乗法的モデルがリスク評価のために使用され得る。しかしながら、いくつかの実施形態では、関連研究を含めて、試験設計は相対リスクの報告を妨げている。いくつかの症例‐対照試験では、相対リスクは更なる仮定なしにはデータから直接算定できない。相対リスクを報告する代わりに、遺伝子型のオッズ比（ＯＲ）を報告することが通例であり、これは、リスク遺伝子型（ｒ_iｒ_i又はｎ_iｒ_iのいずれか）を付与された疾患を保有する確率対リスク遺伝子型を付与される疾患を保有しない確率である。式で表すと以下のとおりである。

オッズ比から相対リスクを知ることは、さらなる仮定を必要とする。例えば、全集団中の対立遺伝子頻度：

が既知であるか又は推定されている（これらは、１２０の染色体を含むＨａｐＭａｐデータセットなどの最新データセットから推定することができた）、という仮定、及び／又は疾患の有病率ｐ＝ｐ（Ｄ）が既知であるという仮定など。先の３つの方程式から、以下が導き出され得る。

相対リスクの定義により、項ｐＰ（Ｄ｜ｎ_iｎ_i）で割ると、第１方程式は以下のように書き直され、

そのため、後の２つの方程式は、以下のように書き直される。

ａ＝１（非リスク対立遺伝子頻度が１）である場合、方程式系１は、Ｚｈａｎｇ及びＹｕ（ＪＡＭＡ，２８０：１６９０‐１６９１（１９９８））（この文献の全体を本明細書中に援用する）中のＺｈａｎｇ及びＹｕの式と等価である、ということに留意されたい。Ｚｈａｎｇ及びＹｕの式と対比して、いくつかの実施形態は、集団中の対立遺伝子頻度を考慮するが、これは、相対リスクに影響を及ぼし得る。さらに、いくつかの実施形態は、相対リスクの相互依存性を考慮に入れ、計算とは対照的に、相対リスクの各々が独立している。

方程式系１は、多くて４つの考え得る解法を有する２つの二次方程式として書き直され得る。これらの方程式を解くために勾配下降アルゴリズムが使用されるが、この場合、開始点がオッズ比であるように設定される（例えば、λⁱ ₁＝ＯＲⁱ ₁、及びλⁱ ₂＝ＯＲⁱ ₂。

例えば、以下のとおりである。

これらの方程式の解法を見つけるのは、関数ｇ（λ₁，λ₂）＝ｆ₁（λ₁，λ₂）²＋ｆ₂（λ₁，λ₂）²の最小値を見つけることと同じである。よって、以下のとおりである。

この例では、ｘ₀＝ＯＲ₁、ｙ₀＝ＯＲ₂と設定することにより始める。値［イプシロン］＝１０^-10をアルゴリズムを通して、許容定数であると設定する。反復ｉにおいて、以下のように定義し、

次に、以下のように設定する。

その反復は、ｇ（ｘ_i，ｙ_i）＜許容範囲まで繰り返されるが、この場合、許容範囲は、供給コードで１０^-7に設定される。

この例では、これらの方程式は、ａ、ｂ、ｃ、ｐ、ＯＲ１、及びＯＲ₂の異なる値に関して正しい解を提供する。

相対リスク推定のロバスト性
いくつかの実施形態では、相対リスクの推定に及ぼす異なるパラメーター（有病率、対立遺伝子頻度、及びオッズ比誤差）の作用が計測される。相対リスク値に及ぼす対立遺伝子頻度及び有病率推定値の作用を計測するために、異なるオッズ比と異なる対立遺伝子頻度のセットの値からの相対リスクが（ＨＷＥ下で）算定され、そしてこれらの算定結果が、０〜１の範囲の有病率に関してプロットされる。加えて、有病率の固定値に関して、得られた相対リスクは、リスク‐対立遺伝子頻度の一関数としてプロットされ得る。ｐ＝０である場合、λ₁＝ＯＲ₁、λ₂＝ＯＲ₂であり、そしてｐ＝１である場合、λ₁＝λ₂＝０である。これは、前記方程式から直接算定され得る。さらに、いくつかの実施形態では、リスク対立遺伝子頻度が高い場合、λ₁は線形関数により近くなり、そしてλ₂は有界二次微分を伴う凹関数に近くなる。極限において、ｃ＝１である場合、λ₂＝ＯＲ₂＋ｐ（１‐ＯＲ₂）であり、そして以下のとおりである。

ＯＲ₁＝ＯＲ₂である場合、後者もまた線形関数に近くなる。リスク‐対立遺伝子頻度が低い場合、λ₁及びλ₂は、関数１／ｐの挙動に近づく。極限において、ｃ＝０である場合、以下のとおりである。

これは、高リスク‐対立遺伝子頻度に関して、有病率の不正確な推定が得られる相対リスクに有意に影響を及ぼさない、ということを示す。さらに、低リスク‐対立遺伝子頻度に関して、ｐ’＝αｐの有病率値が正確な有病率ｐに置換される場合には、得られた相対リスクは、多くても、

倍に下がる。

ＧＣＩスコアの算定
一実施形態では、ＧＣＩは、関連集団を表す基準セットを使用して算定される。この基準セットは、ＨａｐＭａｐ又は別の遺伝子型データセット中の集団の１つであってもよい。

この実施形態では、ＧＣＩは以下のとおり算定される：ｋリスク遺伝子座の各々に関して、相対リスクが方程式系１を使用して、オッズ比から算定されるか、又は以下に記載するように算定される。次に、基準セット中の各個体に関する乗法的スコアが算定され、これは、遺伝子座全体にわたる相対リスクの積である。この乗法的スコアは、異なるＳＮＰが疾患又は症状に独立した作用を持っていることを暗に仮定しているが、いくつかの相互作用が既知であるケースにも、このモデルが拡大適用され得る。ｓの乗法的スコアを有する個体のＧＣＩは、ｓ’≦ｓのスコアを有する基準データセット中のすべての個体の分数である。例えば基準セット中の個体の５０％がｓより小さい乗法的スコアを有する場合、個体の最終ＧＣＩスコアは０．５である。ＧＣＩは、オッズ比又は相対リスクが異なる遺伝子型又はハプロタイプの組み合わせで既知である場合（場合によって、これらは文献で見つけられる）、ＳＮＰ‐ＳＮＰ相互作用を明らかにするために一般化され得る。

本明細書中に記載のとおり、乗法的モデルがＧＣＩスコアに使用され得るが、しかしながら、ＧＣＩスコアを決定するために他のモデルが使用されることもある。その他の好適なモデルには、以下のものがあるが、これだけに限定されるものではない。

加法的モデル。加法的モデル下で、遺伝子型（ｇ₁、．．．、ｇ_k）を有する個体のリスクは以下のとおりであると推定される：

一般化加法的モデル。一般化加法的モデル下で、遺伝子型（ｇ₁、．．．ｇ_k）を有する個体のリスクが以下のとおりであるような一関数ｆが存在すると推定される。

ハーバード修正型スコア（Ｈｅｔ）。このスコアは、Ｃｏｌｄｉｔｚら（ＣａｎｃｅｒＣａｕｓｅｓａｎｄＣｏｎｔｒｏｌｓ，１１：４７７‐４８８（２０００））（この文献の全体を本明細書中に援用する）から得られる。Ｈｅｔスコアは、本質的には一般化加法的スコアであるが、しかし、関数ｆは相対リスクの代わりにオッズ比値に働く。これは、相対リスクを推定するのが難しい場合に有用であり得る。関数ｆを定義するために、中間関数ｇが以下のとおり定義される。

次に、数量が、以下のとおり：

｛式中、ｐⁱ _hetは、基準集団全体のＳＮＰｉにおける異型接合個体の頻度である。｝算定される。次に、関数ｆが、ｆ（ｘ）＝ｇ（ｘ）／ｈｅｔと定義され、そしてハーバード修正型スコア（Ｈｅｔ）が、以下のとおり平易に定義される。

ハーバード修正型スコア（Ｈｏｍ）。このスコアはＨｅｔスコアと類似しているが、但し、値Ｈｅｔは、以下の値：

｛式中、ｐⁱ _homは、同型接合リスク‐対立遺伝子を有する個体の頻度である。｝
により置き換えられる。

最大オッズ比。このモデルでは、遺伝子マーカーのうちの１つ（最大オッズ比を有するもの）は全パネルの組み合わせリスクに関して下限を示す、と推定される。数式で表すと、遺伝子型（ｇ₁、．．．、ｇ_k）を有する個体のスコアは、以下のとおりである。

スコアの比較は実施例１に記載されており、そしてＧＣＩスコアの評価は実施例２に記載されている。

随意数の変異体へのモデルの拡大
モデルは、随意数の考え得る変異体が生じる状況に拡大され得る。従来の考察は、３つの考え得る変異体（ｎｎ、ｎｒ、ｒｒ）が存在する状況に関係する。一般的に、多ＳＮＰ関連が知られている場合、随意数の変異体が集団中に見出され得る。例えば、２つの遺伝子マーカー間の相互作用が、ある状態と関連する場合、９つの考え得る変異体が存在する。これは、８つの異なるオッズ比値を生じる。

初期の式を作成するために、ｋ＋１の考え得る変異体ａ₀、．．．、ａ_kが存在し、頻度ｆ₀、ｆ₁、．．．、ｆ_k、測定オッズ比１、ＯＲ₁、．．．、ＯＲ_k、そして未知の相対リスク値１、λ₁、．．．、λ_kである、と考えられ得る。さらに、すべての相対リスク及びオッズ比はａ０に関して計測され、したがって以下のとおりであると考えられる。

以下の：

に基づいて、以下のとおり決定される。

さらに、以下：

と設定された場合、これは、以下の方程式：

を生じ、したがって、以下のとおりとなる。

後者は、１つの変数（Ｃ）を有する方程式である。この方程式は、多数の異なる解を生じ得る（本質的には、ｋ＋１までの異なる解）。典型的な最適化ツールは、例えば勾配降下などを用いて、以下の：

に最も近い解を見い出し得る。

また、リスク因子の定量化のためのロバストなスコアリング・フレームワークもまた本明細書中に提供される。異なる遺伝的モデルは異なるスコアを生じ得るが、通常、その結果は相関がある。そのため、リスク因子の定量化は、一般に、使用されるモデルに依存しない。

相対リスク症例対照試験の推定
症例-対照試験における複対立遺伝子のオッズ比から相対リスクを推定する方法はまた、本明細書中に開示される。従来のアプローチに対比して、本方法は対立遺伝子頻度、疾患の有病率、及び異なる対立遺伝子の相対リスク間の依存関係を考慮に入れる。シミュレートした症例-対照試験におけるアプローチの成果が計測され、非常に正確であることがわかった。

方法
特定のＳＮＰが疾患Ｄとの関連に関して試験される場合、Ｒ及びＮはこの特定のＳＮＰのリスク及び非リスク対立遺伝子を意味する。各々、人がリスク対立遺伝子に関して同型接合であり、非リスク対立遺伝子に関して異型接合又は同型接合であるとすると、Ｐ（ＲＲ｜Ｄ）、Ｐ（ＲＮ｜Ｄ）及びＰ（ＮＮ｜Ｄ）は、疾患により影響を受ける確率を意味する。ｆ_RR、ｆ_RN、及びｆ_NNは、集団中の３つの遺伝子型の頻度を意味するのに使用される。これらの定義を使用して、相対リスクは以下のとおりに定義される。

症例-対照試験では、値Ｐ（ＲＲ｜Ｄ）、Ｐ（ＲＲ｜〜Ｄ）、すなわち、症例及び対照の中のＲＲの頻度、並びにＰ（ＲＮ｜Ｄ）、Ｐ（ＲＮ｜〜Ｄ）、Ｐ（ＮＮ｜Ｄ）及びＰ（ＮＮ｜〜Ｄ）、すなわち、症例及び対照の中のＲＮ及びＮＮの頻度が推定され得る。相対リスクを推定するために、ベイズの法則を使用して、以下の式を得る。

よって、遺伝子型の頻度が既知である場合、相対リスクを算定するためにそれらを使用し得る。集団中の遺伝子型の頻度は、それらが集団中の疾患の有病率によるので、症例-対照試験それ自体から算定され得ない。特に、疾患の有病率がｐ（Ｄ）である場合には、以下のようになる：

ｐ（Ｄ）が十分に小さい場合、遺伝子型の頻度は対照集団中の遺伝子型の頻度により見積もられ得るが、しかしこれは、有病率が高い場合、正確な推定ではない。しかしながら、基準データセットが示された場合（例えばＨａｐＭａｐ［引用］）、基準データセットに基づく遺伝子型の頻度を推定し得る。

大部分の一般試験は、相対リスクを推定するために基準データセットを使用せず、そしてオッズ比だけが報告される。オッズ比は、以下のとおり書き表される。

通常は集団中の対立遺伝子頻度の推定を有する必要がないため、オッズ比は典型的には有益である；オッズ比を算定するために、典型的に必要とされるものは、奨励におけるそして対照における遺伝子型頻度である。

いくつかの状況では、遺伝子型データそれ自体は利用できないが、しかし要約データ、例えばオッズ比が入手可能である。これは、従来の症例-対照試験からの結果に基づいて、メタ分析が実施されている場合である。この場合、オッズ比から相対リスクを見い出す方法が実証される。以下の方程式：

が当てはまる、という事実を使用する。

この方程式を、Ｐ（Ｄ｜ＮＮ）で割ることで、我々は以下の式を得る。

これは、以下のようにオッズ比を書き表すことを可能にする。

同様の算定により、以下の連立方程式が生じる：

オッズ比、集団中の遺伝子型の頻度、及び疾患の有病率が既知である場合、相対リスクはこの方程式セットを解くことによって見出され得る。

これらは２つの二次方程式であり、よって、それらには最大で４つの解があることに留意されたい。しかしながら、以下に示されているように、典型的にはこの方程式には１つの考え得る解が存在する。

ｆ_NN＝１である場合、方程式系１は、Ｚｈａｎｇ及びＹｕの式と等価であることに留意されたい；しかしながら、ここで、集団中の対立遺伝子頻度が考慮される。さらに、２つの相対リスクが互いに依存するという事実を我々の方法は考慮するが、従来の方法は相対リスクを各々独立して算定することを示唆している。

複対立遺伝子遺伝子座に関する相対リスク。多マーカー又はその他の複対立遺伝子変異体が考察される場合、算定は少し複雑になる。ａ₀、ａ₁、．．．、ａ_kは、考え得るｋ＋１対立遺伝子によって示され、この場合、ａ₀は非リスク対立遺伝子である。ｋ＋１の考え得る対立遺伝子に関してする集団中の対立遺伝子頻度ｆ₀、ｆ₁、ｆ₂、．．．、ｆ_kが仮定される。対立遺伝子ｉに関して、相対リスク及びオッズ比は、以下のとおり定義される。

以下の方程式が疾患の有病率に当てはまる：

よって、方程式の両辺をｐ（Ｄ｜ａ₀）で割ると、我々は以下の式を得る。

以下の式を生じる。

以下の式：

を設定することにより、結果は以下のとおりである。

よって、Ｃの定義によると、以下のとおりである。

これは１つの変数Ｃを有する多項式である。Ｃがいったん決定されると、相対リスクが決定される。多項式は次数ｋ＋１のものであり、よって、我々は多くてｋ＋１の解を有すると予測する。しかしながら、方程式の右辺はＣの一関数として狭義の減少関数であるため、典型的にはこの方程式に対して１つの解のみが存在し得る。この解を見出すことは二分探索法を使用すると容易であるが、それは、解がＣ＝１と以下の式との間で設定されるためである。

相対リスク推定のロバスト性。相対リスクの推定に及ぼす異なるパラメーター（有病率、対立遺伝子頻度、及びオッズ比誤差）の各々の影響が計測された。相対リスク値に及ぼす対立遺伝子頻度と有病率推定の影響を計測するために、相対リスクは、１セットの異なるオッズ比、（ＨＷＥ下の）異なる対立遺伝子頻度の値のから算定され、そして、０〜１の範囲の有病率値に関するこれらの算定の結果をプロットした。

さらに、有病率の固定値に関して、リスク対立遺伝子頻度の一関数として得られた相対リスクがプロットされた。明らかに、ｐ（Ｄ）＝０であるすべての場合、λ_RR＝ＯＲ_RR及びλ_RN＝ＯＲ_RNであり、そしてｐ（Ｄ）＝１である場合、λ_RR＝λ_RN＝０である。これは、方程式１から直接算定され得る。さらに、リスク対立遺伝子頻度が高い場合、λ_RRは線形挙動に近づき、そしてλ_RNは有界二次微分を伴う凹関数に近くなる。リスク‐対立遺伝子頻度が低い場合、λ_RR及びλ_RNは関数１／ｐ（Ｄ）の挙動に近づく。これは、高リスク‐対立遺伝子頻度に関して、有病率の間違った推定が、典型的には、得られた相対リスクに大きく影響しないことを意味する。

オッズ比対相対リスク。疫学文献では、相対リスクはリスクの直感的で有益な基準であると見なされることが多い。しかしながら、相対リスクは、一般的に症例-対照試験及び全ゲノム関連試験に関連して直接算定できない。相対リスクは、通常、プロスペクティブ試験を通して推定され、この場合、一組の健常人が長期間にわたって研究される。対照的に、オッズ比は、通常、症例-対照試験において報告される。オッズ比は、症例対対照におけるリスク対立遺伝子を保有する確率の比である。希な病気に関して、オッズ比は、相対リスクの良好な近似であるが；しかしながら、ありふれた病気に関して、オッズ比はリスクの紛らわしい推定をもたらすかもしれず、そこでは、リスクの増大がわずかな場合であっても、オッズ比が著しく高いことがある。

相対生涯リスク対相対リスク。相対リスクは、対照のいずれもが現在疾患にかかっていないと暗に仮定している。疾患にかかる確率が推定されている場合、これが関連している。しかしながら、一生の間のリスク推定、又は個体が状態を発症する生涯リスクに関係させるのであれば、一部の対照が疾患を最終的に発症する事実が考慮される。相対生涯リスクは、リスク対立遺伝子ｒを保有する個体の生涯を通じて状態を発症するリスクと非リスク対立遺伝子を保有する個体の生涯を通じた状態を発症するリスクとの間の比と定義される。これは、症例-対照試験における相対リスクの典型的な使用とは異なっており、それは有病率情報に基づいている。

ａ₀、ａ₁、．．．、ａ_kによって意味されるものは考え得るｋ＋１対立遺伝子であり、この場合、ａ₀は非リスク対立遺伝子である。ｋ＋１の考え得る対立遺伝子に関する集団中の対立遺伝子頻度ｆ₀、ｆ₁、ｆ₂、．．．、ｆ_kが仮定される。さらに、試験された個体が３つの群：ＣＡ、Ｙ、及びＺに分割され得ると仮定する。ＣＡは症例を意味するのに対し、Ｙ及びＺは対照を意味する。Ｚの個体と対照的に、Ｙの個体が最終的に状態を発症すると思われる。同様に、ＣＯによって意味されるものはＹとＺの和集合であり、そしてＤによって意味されるものはＹとＣＡの和集合である。｜Ｙ｜＝α｜ＣＯ｜＝α（｜Ｙ｜＋｜Ｚ｜）と仮定され、この場合、αは一生の間に状態を発症する対照の割合である。αが平均生涯リスクを上限としていることに留意されたい。もしかすると、疾患の発病年齢、及び対照の年齢によって、αが平均寿命より小さいこともある。

相対リスク及びオッズ比は、ここで、以下のとおりに表される。

オッズ比は、以下のとおり書き表すことができる。

１行目から２行目までの微分はベイズの法則に基づいているが、３行目は、ＣＡ及びＹが本質的に同じ集団であるので、そのためＰ（ＣＡ｜ａ_i）＝Ｐ（Ｙ｜ａ_i）であるという事実に基づいている。ここで、Ｐ（Ｚ｜ａ_i）＝１‐Ｐ（ＣＡ｜ａ_i）という事実を使用することで、以下の式をもたらす。

すでに述べたように、以下のとおりであり：

この場合、ｐ（Ｄ）は平均生涯リスクである。よって、以下の等式：

を使用することで、オッズ比を以下のとおり書き直すことができる。

よって、Ｃが与えられている場合、相対生涯リスクは、以下の式：

を割り当てることによって見出される。

Ｃは、以下の方程式：

を解くことによって見出される。

当業者は、Ｃ及とオッズ比の定義であるＣ＞（２α‐１）ｐ（Ｄ）（ＯＲ_i‐１）によって確認することができる。そのため、右辺はＣの減少関数であり、それは二分探索法を適用することによって見出すことができる。

ＧＣＩに基づく生涯リスク推定。ＧＣＩは、すべての関連ＳＮＰ全体に非リスク対立遺伝子を有する個体と比較した個体の相対リスクを原則的に提供する。個体の生涯リスクを算定するために、平均生涯リスクを有する個体の生涯リスクの積が得られ、そしてこの積を集団全体の平均生涯リスクで割る。この算定は、平均生涯リスクと相対リスクの定義と一致している。平均生涯リスクを計算するために、すべての考え得る遺伝子型が列挙され、そして、単一ＳＮＰの各々の中のそれらの変異体の相対リスクの積として算定されるそれらの相対リスクがまとめられる。

環境遺伝複合指数（ＥＧＣＩ）
いくつかの実施形態では、環境因子は、環境遺伝複合指数（ＥＧＣＩ）スコアを作成するＧＣＩスコアの中に組み入れられる。ＥＧＣＩスコアは、コンピューターによって算定するか、又は決定することができる。環境因子には、非遺伝因子、例えば食生活因子、運動する習慣からの因子、及びその他のライフスタイルなど、又は個人的な選択、例えば個人的な人間関係、仕事や家庭状況などがあるが、これだけに限定されるものではない。例えば、喫煙（喫煙の頻度及び／又は量、ニコチン摂取レベル等）、薬物使用（薬物使用のタイプ、量、及び頻度）、並びにアルコール摂取（例えば量及び頻度）が、ＥＧＣＩスコアを作成するためにＧＣＩスコアに組み入れられる環境因子であり得る。その他の環境因子は、食生活のタイプ、摂取の量、及び頻度があってもよい。その他の因子は、個体の運動計画、例えば特定のタイプの身体的活動の強度、タイプ、長さ、及び頻度などである。

さらに、その他の環境因子には、個体の生活環境、例えば農村部、都会環境、又は特定の個体群密度若しくは汚染レベルの都市などが含まれ得る。個体の居住地、例えば個体の労働又は住居環境のスモッグレベル又は大気質などを考慮することもできる。個体の睡眠習慣、個人的な関係（例えば既婚若しくは未婚、親しい間柄の人の数、友人、家族関係）、社会的地位、雇用（高い／低いストレス、責任の度合い、職務の満足度、同僚や上司との関係等）を考慮することもできる。

よって、環境因子は、個体の出生地、居住場所、ライフスタイルの状態；食生活、運動習慣、及び個人的な関係であり得るが、これだけに限定されるものではない。環境因子はまた、個体の身体計測値、例えばボディーマスインデックス、血圧、心拍数、グルコースレベル、代謝物レベル、イオンレベル、体重、身長、コレステロールレベル、ビタミンレベル、血球数、タンパク質レベル、及び転写レベルなどでもあり得る。ＥＧＣＩはまた、２以上の環境因子、例えば少なくとも１、２、３、４、５、１０、１２、１５、２０、２５、又はそれ以上の環境因子を組み込むこともできる。

環境因子は、疾患又は症状のリスクの一因となっている１若しくは複数の遺伝因子とは無関係であることもある。環境因子はまた、疾患又は症状のリスクの一因となっている１若しくは複数のその他の環境因子とは無関係であることもある。いくつかの実施形態では、環境因子は１若しくは複数の遺伝因子とは無関係ではないこともある。さらに他の実施形態では、環境因子は、その他の環境因子とは無関係ではないこともある。環境因子はその他の遺伝因子又は環境因子と無関係ではないこともあるが、ＥＧＣＩスコアに組み入れられている場合、ＥＧＣＩスコアが算定されているときには（実施例５に記載のものなど）、環境因子は無関係であると仮定することができる。いくつかの実施形態では、個体に関して組み込まれた環境因子は、（例えば実施例４に示されているような）個体のファミリー若しくは友人のものであるか、又は個体のファミリー又は友人の行動に起因するものであることもある。例えば、個体は、喫煙する友人又は家族と同居していることもあり、それによって、煙に晒されることが個体のＥＧＣＩに組み込まれている環境因子であることもある。

ＥＧＣＩを作成するためにＧＣＩに組み入れられた環境因子は、疾患又は症状に関して少なくとも約１．０の相対リスク因子を持ち得る。その相対リスク因子は、約１〜２の間、又は少なくとも約１．１、１．２、１．３、１．４、１．５、１．６、１．７、約１、８、若しくは１．９であり得る。いくつかの実施形態では、相対リスク因子は、少なくとも約２、３、４、５、６、７、８、９、又は１０であり得る。さらに他の実施形態では、環境因子の相対リスク因子は、少なくとも約１２、１５、２０、２５、３０、２５、４０、４５、又は５０であり得る。

いくつかの実施形態では、ＥＧＣＩを作成するためにＧＣＩに組み入れられた環境因子は、疾患又は症状に関して少なくとも約１．０のオッズ比（ＯＲ）を持ち得る。その相対リスク因子は、約１〜２の間、又は少なくとも約１．１、１．２、１．３、１．４、１．５、１．６、１．７、１．８、若しくは１．９であり得る。いくつかの実施形態では、ＯＲは、少なくとも約２、３、４，５、６、７、８、９、又は１０であり得る。さらに他の実施形態では、環境因子のＯＲは、少なくとも約１２、１５、２０、２５、３０、３５、４０、４５、又は５０であり得る。

ＥＧＣＩは、その疾患又は症状の遺伝率が約９５％未満であり得る疾患又は症状に関して作成され得る。いくつかの実施形態では、ＥＧＣＩは、約５％、１０％、１５％、２０％、２５％、３０％、３５％、４０％、４５％、５０％、５５％、６０％、６５％、７０％、７５％、８０％、８５％、又は９０％未満の遺伝率を有する疾患又は症状に関して計算される。

個別の行動計画
本明細書中に開示された個別の行動計画は、個体のゲノムプロファイルに基づいた、個体の健康又はウェルネスを改善するために重要な対応可能な情報を提供する。行動計画は、特定の遺伝子型相関を考慮した個体にとって有益であり、そして治療療法の投与、処置の潜在的必要性又は処置の効果の観察、又は食生活、運動、及びその他の個人的な習慣／活動における生活習慣変更を含み得る行動指針を提供し、それらは、個体のゲノムプロファイルに基づいて個別の行動計画へと個別化され得る。あるいは、個体は、自身のゲノムプロファイルに基づいた特定の格付けを与えられ得るが、加えて、任意に他の情報、例えば家族歴、既存の生活習慣及び地理など、例えば労働条件、作業環境、個人的な人間関係、家庭環境、などを含むが、これだけに限定されるものではない。組み込まれ得るその他の因子には、民族性、性別、及び年齢がある。様々な食事的及び運動的予防策のオッズ比と、疾患又は症状のリスク減少とそれらの関連もまた格付けシステムに組み入れられる。

例えば、個別の行動計画は、個体のＧＣＩ又はＥＧＣＩスコアに基づいて作成され得る。さらに、個別の行動計画は、個体に関して修正又は更新され得る、例えば、個体に関する環境因子を修正又は更新し、そして更新されたＥＧＣＩスコアを作成し得る。個別の行動計画はまた、例えば、以前に知られていなかった疾患若しくは状態に関する新しい遺伝情報に関する新しい科学情報から作成された更新されたＥＧＣＩスコア、又は改訂若しくは更新されたＧＣＩスコアに由来するものなどが、個体に関して修正又は更新され得る。

修正又は更新された個別の行動計画は、例えば、個体又は彼らのヘルスケア管理者が契約プランなどによって自動更新を最初に要求しておけ、個体又は彼らのヘルスケア管理者に自動的に送付され得る。あるいは、更新された個別の行動計画は、個体又は彼らのヘルスケア管理者が要求した場合にのみ送付され得る。個別の行動計画は、多くの因子に基づいて修正又は更新され得る。例えば、個体が、解析されたより多くの遺伝子相関、並びに結果は、初期の個別の行動計画に対する既存の推奨を修正するか、追加の推奨を加えるか、又は推奨を排除するのに使用した結果を持っていることもある。いくつかの実施形態では、個体は、特定の生活習慣／環境を変えたか、又は家族歴、既存の生活習慣、及び地理、例えば、これだけに限定されるものではないが、労働条件、作業環境、個人的な人間関係、住居環境などに関する詳しい情報を得たか、あるいは、自身の更新後の年齢を含めて、これらの変更を組み込んだ個別の行動計画を得たいと望む可能性もある。例えば、個体は、初期の個別の行動計画、例えば食生活の中でコレステロールを減らすといったことに従うことができ、それによって個別の行動計画の推奨が修正されることがあるか、又は心臓病に対する彼らリスク又は素因が低減した。

個別の行動計画はまた、個別の行動計画の推奨に従った個体、又は個体が行うか若しくは彼らに起こったその他の変更に基づいて今後の推奨を予測することもできる。例えば、個体の年齢の増加は、骨粗鬆症のリスクの増大につながるであろうが、カルシウムの量又はその他の生活習慣、例えば個別の行動などによってそのリスクは減少できる。

個別の行動計画は、個体の表現型プロファイル及び／又はゲノムプロファイルに関する単回の報告により個体又は彼らのヘルスケア管理者に報告され得る。あるいは、個別の行動計画は別々に報告され得る。そして、個体は、自身の個別の行動計画のお奨めの行動を続ける。個体は、自身の計画におけるいずれかの行動を続ける前に彼らのヘルスケア管理者と相談することを選ぶこともできる。

提供された個別の行動計画はまた、行動ステップの統合セットに多くの状態特定情報を統合する。個別の行動計画は、これだけに限定されるものではないが、各状態の有病率、各状態に伴う疼痛の相対量、及び各状態の処置のタイプを含めた因子を統合できる。例えば、個体が（例えば高いＧＣＩ又はＧＣＩスコアとして表される）心筋梗塞の高いリスクを有する場合、個体は、果実、野菜、及び穀類の消費増強を含む個別の行動計画を有することができる。しかしながら、個体がまたセリアック病の素因も有するのであれば、コムギ・グルテンアレルギーを有する可能性がある。その結果、コムギの消費増強は禁忌であり、それが個別の行動計画に示される。

個別の行動計画は、医薬的推奨、非医薬的推奨又はその両方を提供できる。例えば、個別の行動計画は、心筋梗塞に罹りやすい傾向のある個体に関して予防薬として提案された医薬、例えばコレステロール降下剤などと、医師と相談することを含むことができる。個別の行動計画ではまた、非医薬的推奨、例えば個体のゲノムプロファイルに基づく運動レジメンと食生活計画を含めた個別のライフスタイル計画に従うことなどを提供することもできる。

個別の行動計画の推奨は、特定の格付け、標識、又は分類システムから成るものであり得る。各推奨は、数字、色、及び／又は文字スキーム又は値で格付け又は分類され得る。その推奨を分類し、さらに格付けされ得る。多数の改変、例えば（文字、数字又は色；文字、数字、及び／又は色の組み合わせ；１若しくは複数の格付けスキームの中の異なるタイプの推奨を使用した）異なる格付けスキームなどを使用できる。

例えば、個体のゲノムプロファイルが決定され、そして彼らのゲノムプロファイルに基づいて個別の行動計画の個体に関する推奨は３つの群に分類される：「Ａ」は不利又はマイナスの効果を表し；「Ｎ」は中間又は有意でない効果を表し、そして「Ｂ」は有益又はプラスの効果を表す。例としてこのシステムを使用すると、個体に関して「Ａ」と分類された治療薬には、個体が有害反応を持っている薬物が含まれるであろうし、「Ｎ」と分類されたものは、個体に対していずれの有意なプラス又はマイナス効果も持っていないであろうし、そして「Ｂ」と分類されたものは、個体の健康に有益であろう。同じ分類システムを使用すると、食事の計画もまたＡ、Ｂ、Ｎに分類できる。例えば、個体がアレルギーのある又は特に避けるべきである食品（例えば、個体が糖尿病又は虫歯に罹りやすいのであれば砂糖）は、Ａに分類されるであろう。個体の健康に有意な影響を及ぼさない食品はＮと分類できる。個体に特に有益な食品はＢに分類できる、例えば、個体が高コレステロールであれば、低コレステロールの食品がＢに分類されるであろう。個体のための運動レジメンもまた、同じシステムに基づくことができる。例えば、個体が心臓の疾患に罹りやすいかもしれないので、激しいトレーニングを避けるべきであれば、それにより、ランニングはＡの行動になり得る一方で、一定のペースでのウォーキング又はジョギングはＢに分類できる。しばらく立っていることは、ある個体に関してはＮであるかもしれないが、静脈瘤に罹りやすい別の個体に関してはＡである可能性がある。

さらに、Ａ、Ｎ、又はＢの各カテゴリー内で、最低の影響から最高の影響まで、例えば１〜５などの更なる分類レベルが存在し得る。例えば、Ａ１と分類され得る治療薬は、例えば弱い吐き気などのわずかな負の効果を示し、それに対し、Ａ２は治療薬が嘔吐を引き起こすであろうことを示し、さらに、Ａ５の治療薬は、例えばアナフィラキシー性ショックなどの激しい有害反応を引き起こすであろう。逆に、Ｂ１は、個体に対してわずかな正の効果を持っているのに対して、Ｂ５は、個体に対して有意に正の影響を持っているであろう。例えば、個体が肺癌に罹りやすいか、又は成長する間に副流煙に晒されたのであれば、個体の禁煙はＢ５であるかもしれないが、肺癌に罹りやすくない個体はＢ４としてその因子を持ち得る。

異なるカテゴリーはまた異なる色でも表される、例えばＡは赤色の明暗であり得、個体の健康に対する低い効果から高い効果までを表すために、色調は明るい赤色の明暗から暗い赤色の明暗、すなわち、個体の健康に対して低い負の影響を表す明るい色から重度の有害影響を表す暗い色におよぶ。そのシステムはまた、色、数字、又は文字の連続的な範囲である。例えば、分類は、Ａ、Ｎ、及びＢ、及び／又はその中の下位カテゴリーを持つというよりは、むしろＡからＧまで存在することができ、ここで、Ａが、個体の健康に重度の負の影響を与える食品、治療薬、生活習慣、環境、及びその他の因子を表すのに対し、Ｄは、正又は負の最小限の影響しかない因子を表し、そしてＧは、個体の健康に非常に有益であることを表すであろう。あるいは、数又は色もまた、ＡからＧまでを持つというよりは、むしろ個体の健康に影響を与える、食生活、治療薬、生活習慣、環境、及びその他の因子の連続した範囲を表すことができる。

いくつかの実施形態では、個別の行動計画の中の特定の治療法、医薬、又はその他のライフスタイル要素が、分類、標識、又は格付けされ得る。例えば、個体は、運動レジメンと食生活計画を含めた個別の行動計画を持つこともできる。その運動レジメンは、１若しくは複数の格付け又は分類を含んでいてもよい。例えば、運動レジメンに関する格付けは、例えば表１などのようにＡ〜Ｅにわたり、ここで、各文字は１若しくは複数の運動のタイプに対応していて、各レベル、ひいては個体に関するお奨めの運動レジメンに該当する活動のタイプ、時間の長さ、所定の時間枠単位での回数に関する情報を含んでいる。

１つの実施形態では、個体のゲノムプロファイルに基づいて、個別の行動計画は、個体に関してＡの格付けをすることができ、そのため個体のお勧め運動レジメンは、彼らの心臓血管トレーニングのために表１中のＡ行の選択肢から選択されることである。同様に、ウエイトトレーニングのための類似のシステムも個体の運動レジメンの一部であり得、そして、Ａの格付け向けのウエイトトレーニングの選択肢が個体に関して推奨されるであろう。いくつかの実施形態では、因子、例えば、これだけに限定されるものではないが、個体の既存の食生活、運動、及びその他の個人的な習慣／活動など、任意にその他の情報、例えば家族歴、既存の生活習慣や地理、例えば、これだけに限定されるものではないが、労働条件、作業環境、個人的な人間関係、住居環境、民族性、性別、年齢、及びその他の因子などを、個体のゲノムプロファイルに組み込むことができ、個体の運動レジメンの格付けを決定する。さらに、個体のライフスタイルが変化した、又はより多くの因子が分かったので、それを組み入れる場合、個体の格付けは変化し得る、例えば個体が個別の行動計画におけるお勧めの活動に従った場合、Ａの格付けからはじまり、個体は、個体が現在Ｂの格付けであることを評価し、決定する更新された個別の行動計画を要求することもできる。あるいは、個体の個別の行動計画は、個体が自身の健康を最大限に高めるためにＡの格付けからＢの格付けに移行することを検討すべき時期の期限を提供することもできる。

個別の行動計画はまた、食事計画の格付けシステムも持つことができる。例えば、食事計画の格付けは、１〜５におよぶシステムであることができ、ここで、各数字は、脂肪、繊維、タンパク質、糖、及び個体が自身の食生活で摂ることが示されたその他の栄養素から成る特定のグループ分け、特定の目安量、カロリー数、及び／又は個体が自身の食生活として摂るべきであるその他の食品のグループ分けに対応している。個体のゲノムプロファイルに基づいて、個別の行動計画は、個体に関する２つの格付けを与えることができ、そのため、個体のお勧めの食事計画は、２つの格付けの中で選ぶいくつかの食事の選択であろう。

他の実施形態では、個体の食生活を分類できる。例えば、２つの格付けが与えられた個体は、２に分類されもする特定の食生活を選択するべきである。例えば、特定の野菜、肉、果実、乳製品、及びその他のものは２に分類できるが、その他のものはできない。例えば、アスパラガスは野菜であって２であるが、ビートは３であり得、そのため個体は自身の食生活の中にビートに比べてより多くのアスパラガスを含むべきである。

他の実施形態では、個体には、続きとしてどの食生活タイプかを提案する格付け、すなわち彼らのゲノムプロファイルに基づいて彼らの食生活の中で摂るべきである食生活タイプの中の栄養素タイプの分析を個体に与える。この格付けは、形、色、数字、及び／又は文字を含めた可視化表現の形態であってもよい。例えば、個体が結腸癌及び糖尿病に罹りやすいとわかると、個体には、その固体が自身の食生活で摂るべきお勧めの食品タイプにおける異なる栄養素の比を表すシンボルが与えられる。異なるタイプの食品、例えば、これだけに限定されるものではないが、特定の果実、野菜、炭水化物、肉、乳製品なども同じスキームで表される。所定の個体と最もよく類似しているシンボルを用いた格付けを持つ食品が、個体のためのお奨めの食品であろう。

いくつかの実施形態では、因子、例えば、これだけに限定されるものではないが、個体の既存の食生活、運動、及びその他の個人的な習慣／活動など、任意にその他の情報、例えば家族歴、既存の生活習慣や地理、例えば、これだけに限定されるものではないが、労働条件、作業環境、個人的な人間関係、住居環境、民族性、性別、年齢、及びその他の因子などを、個体のゲノムプロファイルに組み込み、個別の行動計画を作成することができ、それによって個体の食事計画に与えられる格付けに影響を及ぼす。さらに、個体のライフスタイルが変化した、又はより多くの因子が分かったので、それを組み入れる場合、個体の格付けは変化し得る。例えば、個体が個別の行動計画におけるお勧めの活動に従った場合、非常に低いコレステロール食である食事計画に関する１の格付けからはじまり、個体は、生活習慣で変化を組み込んだ更新された個別の行動計画を要求できる、すなわち、その個体が、改善されたコレステロールレベルを持つほどであれば、更新された個別の行動計画は、格付け２の下の食事計画に個体が直ちに従うのがよりふさわしいこと、又は格付け１及び２の食事計画から選択できることを示し得る。あるいは、個体の初期の個別の行動計画は、個体が自身の健康を最大限に高めるために１の格付けから２の格付けに移行すること、又は異なる格付けの下、異なる食事計画の間でスケジュールに基づいて食事計画を変更することを検討すべき時期の期限を提供することができる。

個別の行動計画における格付けは、異なる格付けシステムの組み合わせのためのものであってもよい。例えば、格付けＡ〜Ｅの運動レジメンシステムと格付け１〜５の食事計画システムは、彼らの個別の行動計画においてＡ１の格付けを個体に与えるために使用できる。そのため、個体は、Ａの格付けの運動レジメンと１の格付けの食事計画に従うことが推奨される。あるいは、単独の格付けシステムが、運動及び食事レジメンに使用されることができる。例えば、その個体に関して推奨される運動及び食事レジメンが共にＣに分類されるような個別の行動計画における特定の格付け、例えばＣの格付けなどが、個体に与えられ得る。他の実施形態では、他のタイプの推奨、例えば他のライフスタイル活動や習慣などもまた含まれる。例えば、運動及び食事レジメン以外の、他の推奨、例えば治療薬、作業環境のタイプ、社会活動のタイプなどもまた、単独の格付けシステム下で包含され得る。あるいは、異なる格付けシステムは他の推奨に使用されることができる。例えば、文字は、お勧めの運動レジメン、食事レジメンの数、及び医薬的推奨の色に使用されてもよい。

いくつかの実施形態では、推奨のタイプがペアに分類されているような２成分格付けシステムが使用される。そのシステムは、マイアーズ・ブリッグスタイプ指標（ＭＢＴＩ）システムに類似し得る。ＭＢＴＩシステムでは、４組の選択又は二項分枝があって、個体は各ペアの一方に分類される。個体の選択は、１）外向又は内向、２）感覚又は直観、３）思考又は感情、４）判断又は知覚である。システムの改変は、個体のゲノムプロファイルに基づく健康及び精神衛生の改善のための個体に関する推奨の決定に使用され得る。

例えば、個体は、食生活に関してＡ又はＢのいずれかであり得る、ここで、Ａはあるタイプの栄養素ミックスを表し、そしてＢは異なるミックスである。あるいは、ある食品タイプをＡ又はＢに分類してもよい。個体は、運動レジメンに関して別の二項分岐分類、Ｈ又はＬを持ち得る、この場合、Ｈは個体が高い負荷の運動に参加すべきであることを表す、Ｌは低い負荷の活動に参加すべきであることを表す。そういうものとして、個体はＡＨに分類できる。別の二項分岐分類は、社会的接触に関してであり得る。例えば、個体は、遺伝的に社交的（Ｓ）又は非社交的（Ｕ）である傾向を持ち、そうしたものとして、推奨は、ストレスを減らし彼らの健康と精神衛生を高めるためにその個体が避けるべき又は捜すべき人々の活動タイプ又はグループを含み得る。

個別の行動計画はまた、科学情報を含めて彼らに知られるようになった情報、又は個体からの情報、例えば「現場配置」メカニズム若しくは直接メカニズムなどに基づく因子を含むように更新されることもできる、例えば代謝物レベル、グルコースレベル、イオンレベル（例えばカルシウム、ナトリウム、カリウム、鉄）、ビタミン、血球数、ボディーマスインデックス（ＢＭＩ）、タンパク質レベル、転写レベル、心拍数などが、容易に利用可能な方法によって決定でき、そして、彼らに知られたとき、及びリアルタイム追跡によるなどして彼らに知られるようになった場合、個別の行動計画中に織り込まれ得る。個別の行動計画は、例えば、個体が１若しくは複数の状態に関して持ち得る素因にも影響する可能性がある計画に従う個体に基づいて修正され得る。例えば、個体のＧＣＩスコアを更新できる。

コミュニティーと動機づけ
本開示は、個体が自身の健康と精神衛生について十分に情報を得るような個体のゲノムプロファイルに基づく表現型プロファイル及び個別の行動計画、並びに個体が自身の健康を増進するに違いない専用オプションを提供する。個体に自身の個別の行動計画を続ける支援と動機を提供できるオンラインコミュニティーなどのコミュニティーもまた本明細書中に提供される。例えば、個別の行動計画に従うことによって自身の健康を増進しようとする個体の動機づけにはまた、報奨金も含むことができる。

個体は、コミュニティー、例えばオンラインコミュニティーなどに参加でき、そこで、個体又は彼らのヘルスケア管理者は個体のゲノムプロファイル、表現型プロファイル、及び／又は個別の行動計画にアクセスする。その個体は、個人的なオンラインポータルを通して、コミュニティーの全員、コミュニティーの小集団が見ることができる、又はコミュニティーのだれも見ることができないゲノムプロファイル、表現型プロファイル、及び／又は個別の行動計画を所有することを選ぶこともできる。友人、ファミリー、又は同僚が、オンラインコミュニティーの一部であってもよい。例えば、オンラインコミュニティー、例えばｗｗｗ．ｅｎｍｅｏｎ．ｃｏｍやｗｗｗ．ｃｈａｎｇｅｆｉｒｅ．ｃｏｍなどは、個体が目的を達成するように動機づけることで当該技術分野において知られている。本開示では、個体が、自身の表現型プロファイル、例えばＧＣＩスコアをベースラインとして使用して、又は彼らの個別の行動計画における目標を達成することによって、自身の健康及び精神衛生を改善するように彼らを支援し、そして動機づけるオンラインコミュニティーのメンバーであるか、又はそれに参加する。オンラインコミュニティーは、その個体の友人、家族、若しくは同僚、又は友人、家族、及び同僚の組み合わせに限定することもできる。個体はまた、彼らが以前知らなかったオンラインコミュニティーのその他のメンバーを含むこともできる。オンラインコミュニティーはまた、雇用者が後援するコミュニティーであってもよい。個体は、自身の目的を果たすために互いに同じような表現型プロファイル、行動計画、及び動機づけを持つ他の人とグループを作ってもよい。個体は、彼らのＧＣＩスコアを改善するために、及び／又は彼らの個別の行動計画の目標を達成するために、オンラインコミュニティー内で他の人とのコンペを手配してもよい。

例えば、個体の報告、例えば彼らのＧＣＩスコアや個別の行動計画などは、オンラインコミュニティーにおいて個体の家族及び友人が見ることができる。個体は、だれが自身の報告を見ることができる、及び／又はアクセスできるかを選択することもできるか、又はそれを選択する選択肢を持つこともできる。オンラインバージョンは、チェックリスト又は個別の行動計画上の項目を含んだマイルストーン評価基準を含んでなることができ、そこで、個体は、自身の個別の行動計画の達成又は経過をチェックすることもできる。ＧＣＩスコアは、経過又は達成があれば更新され、そして報告オンライン上に反映され得る。個体はまた、個体に関する報告を変えることもある、変化した可能性がある因子、例えばライフスタイルの変化、運動レジメンの変更、食生活の変化などを入力してもよい。家族及び友人は、個体の経過、並びに個体の生活の変化、そしてそれらが個体のＧＣＩスコアにどう反映されうるのか又はそれをどう変えうるのか見ることができる。オンラインポータルは、個体が初期の報告とその後の報告を見ることを可能にすることもできる。個体はまた、彼らの友人及び家族から反響とコメントを受け取ることもできる。家族及び友人は、支援及び動機づけするコメントを残すことができる。

オンラインコミュニティーはまた、自身の個別の行動計画を進展させることによって、及び／又は自身のＧＣＩスコアを改善することによって自身の疾患のリスク又は素因を低減して、自身の健康を増進するインセンティブも個体に提供できる。インセンティブはまた、オンラインコミュニティーでないところでも個体に提供され得る。例えば、雇用者によって後援されたオンラインコミュニティーは、例えば疾患に関する自身のＧＣＩスコアを改善し、その結果、自身の疾患の素因を低減するなどして個体が特定の目標に到達した場合に、雇用者がより多くの助成金を支給したり、追加の休暇を与えたり、又は個体の医療貯蓄口座に献金する健康計画を提供することもできる。あるいは、コミュニティーは、オンラインである必要はないので、個体は、雇用者に代わって健康計画を処理するように指名された人に自身の改善されたＧＣＩスコアを提出する。

その他のインセンティブはまた、自身ＧＣＩスコアを改善することによって、及び／又は自身の個別の行動計画に従うことによって健康を増進するように個体を動機づけるのに使用できる。個体は、例えば特定の割合若しくは数値まで自身のＧＣＩスコアを改善するなど特定の目標に到達したとき、又はあるカテゴリーから他のカテゴリー（すなわち、高リスクから低リスクに）移行したとき、あるいは個別の行動計画の特定の目標を達成することによって、賞品と交換するポイントを受けることもできる。例えば、個体は、特定の数値のＧＣＩスコア減少を実現して、特定の時間枠内での疾患に対するリスクの最大の減少を達成するか、個別の行動計画における目標を達成するか、又は個別の行動計画の最大の目標を達成することもできる。

友人、家族、及び／又は雇用者はポイント及び／又は賞品を提供することもできるが、おそらく、自身のＧＣＩスコアを改善した又は自身の個別の行動計画の目標を達成した個体に対して賞品としてそれらを購入し、そしてそれらを提供することによってなされる。個体はまた、別の人、例えば別の同僚、又は同じ目標を持つ友人のグループ、家族、若しくはオンラインコミュニティーのメンバーなどより前に目標に到達することでポイント／賞品を受け取ることもできる。例えば、一番最初に、特定の数値のＧＣＩスコア減少を達成するか、特定の時間枠内に疾患に対するリスクの最大の減少を達成するか、個別の行動計画の目標を達成するか、又は個別の行動計画の最大の目標を達成する。個体は、現金、賞品としての現金と交換するポイントを受け取ることもできる。その他の賞品としては、医薬品、健康商品、ヘルスクラブ会員資格、温泉療法、医療、健康観察デバイス、遺伝子検査、旅行、及びその他のもの、例えば本明細書中に記載のサービスの契約、又は前述のアイテムに対する割引、補助金、又は還付などを挙げることもできる。

インセンティブは、友人、家族、及び雇用者によって援助できる。薬品会社、ヘルスクラブ、医療機器会社、温泉、及びその他のところもまた、インセンティブを援助できる。後援は、広告又は新規採用と引き換えであってもよい、例えば、薬学的組織は個体のゲノムプロファイルに関するデータを得ること、又は臨床試験に興味がある。さらに、インセンティブは、自身の健康を増進するように個体に動機づけするコミュニティー、例えば本明細書中に記載のオンラインコミュニティーなどに参加するよう個体を奨励するために使用できる。

プロファイル及び個別の行動計画へのアクセス
ゲノムプロファイル、表現型プロファイル、並びに表現型及びゲノムプロファイルに関連するその他の情報、例えば個別の行動計画などを含む報告が、個体に提供され得る。ヘルスケア管理者及び提供者、例えば介護者、医師、及び遺伝カウンセラーなどもまた、報告にアクセスできる。この報告は、印刷されるか、コンピューター上に保存されるか、又はオンラインで閲覧することができる。あるいは、プロファイル及び行動計画は、紙の形態で提供できる。それらは、ある時期に紙、コンピューターが読み取り可能な形式、又はオンラインによって提供されるその後の更新を伴った、紙又はコンピューターが読み取り可能な形式、例えばオンラインなどの状態で存在してもよい。結果は、コンピューターによって作り出され、そして出力できる。それらは、コンピューターが読み取り可能なメディアに保存できる。

ゲノムプロファイル、表現型プロファイル、並びに個別の行動計画には、オンラインポータル、コンピューターとインターネットウェブサイトの使用により個体によって容易にアクセスできる情報源、電話、又は情報への同様のアクセスを可能にするその他の手段によってアクセスできる。オンラインポータルは、任意にセキュリティーで保護されたオンラインポータル又はウェブサイトであり得る。それは他の安全及びセキュリティーで保護されていないウェブサイトへのリンク、例えば、個体の表現型プロファイルを有するセキュリティーで保護されたウェブサイト又はセキュリティーで保護されていないウェブサイト、例えば特定の表現型を共有する個体向けの掲示板などとのリンクを提供する。

報告は、個体のＧＣＩスコア、ＧＣＩプラス、又はＥＧＣＩスコアの報告であってもよい（本明細書中に記載のとおり、報告のために、ＧＣＩスコアはまた、ＧＣＩ、ＧＣＩプラス、及び／又はＥＧＣＩスコアの報告方法も包含する）。例えば、１若しくは複数の状態に関するスコアは、表示を用いて可視化できる。前記表示、例えば関連情報を含むパーソナルポータルなどを可視化するために、スクリーン（例えばコンピュータのモニター又はテレビジョンスクリーンなど）が使用できる。他の実施形態では、表示は、静止表示、例えば印刷されたページなどである。表示としては、以下の：ｂｉｎ（例えば１‐５、６‐１０、１１‐１５、１６‐２０、２１‐２５、２６‐３０、３１‐３５、３６‐４０、４１‐４５、４６‐５０、５１‐５５、５６‐６０、６１‐６５、６６‐７０、７１‐７５、７６‐８０、８１‐８５、８６‐９０、９１‐９５、９６‐１００）、色若しくはグレースケール勾配、温度計、ゲージ、円グラフ、ヒストグラム又は棒グラフのうちの１若しくは複数が挙げられるが、これだけに限定されるものではない。他の実施形態では、温度計は、ＧＣＩスコア、並びに疾患／状態有病率を表示するために使用される。温度計は、報告されたＧＣＩスコアに伴って変化するレベルを表示するために用いられ、例えば温度計はＧＣＩスコアの増加するに従って比色的変化を表示できる（より低いＧＣＩスコアに関する青色からより高いＧＣＩスコアに関する赤色に漸進的に変化する）。関連する実施形態では、温度計は、報告されたＧＣＩスコアに伴って変化するレベルと、リスクランクが増大する場合の比色変化の両方を表示する。

個体のＧＣＩスコアはまた、聴覚的フィードバックを使用して個体に提供する。例えば、聴覚的フィードバックは、リスクランクが高いか又は低いことの言語化教示である。聴覚的フィードバックはまた、特定のＧＣＩスコア、例えば数字、百分位数、範囲、四分位数、あるいは集団に関する平均又は中央値ＧＣＩスコアとの比較の口述である。一実施形態では、生身の人間が、自分で、あるいは遠距離通信デバイス上で、例えば電話（地上通信線、携帯電話又は衛星電話）で、又はパーソナルポータルを介して、聴覚的フィードバックを提供する。聴覚的フィードバックは、コンピューターなどの自動化システムによって提供され得る。聴覚的フィードバックは、通常電話呼び出しを使用してコンピューターに音声及びプッシュホンを検出させる技術である音声自動応答（ＩＶＲ）システムの一部として提供される。個体は、ＩＶＲシステムを介して中央サーバーと交信し得る。ＩＶＲシステムは、記録済みの又は同時に作り出される音声信号と応答して、個体と交信し、彼らのリスクランクの聴覚的フィードバックを彼らに提供し得る。個体は、ＩＶＲシステムにより回答される数字を呼び出すこともできる。任意に、識別コード、セキュリティーコードを入力するか、又は音声認識プロトコールを受けた後、ＩＶＲシステムは、プッシュホン又は音声メニューなどのメニューから選択肢を選択するように個体に尋ねる。これらの選択肢のうちの１つは、個体に彼ら又は彼女らのリスクランクを提供することもできる。

個体のＧＣＩスコアは、表示を使用して可視化され、聴覚的フィードバックを使用することで、例えば個人ポータル上で提供され得る。この組み合わせは、ＧＣＩスコアの視覚的表示、並びに個体の健康全般及び考え得る予防手段、例えば彼らの個別の行動計画などと、ＧＣＩスコアとの関連性について意見を交わす聴覚的フィードバックを包含し得る。

異なる報告オプションは、個体にとってアクセスできるものであり得る。例えば、オンラインアクセスポイント、例えばオンラインポータルなどは、彼らのゲノムプロファイルに基づいて、個体が１つの表現型又は２つ以上の表現型を表示することを可能にできる。契約者はまた、１つ又は複数の状態の簡単な症状を得るために、種々の視聴オプション、例えば「クイックビュー」オプションなどを持つこともできる。「総合ビュー」オプションもまた選択できる。ここでは、各カテゴリーのさらなる詳細が提供される。例えば、個体が表現型を発症する見込みについてのより詳細な統計、又は典型的な症状若しくは表現型、例えば医学的状態に関するサンプル症状、若しくは身長などの身体的な非医学的状態の範囲に関する詳しい情報、又は遺伝子及び遺伝子変異体についてのさらなる情報、例えば集団における発生率、例えば全世界、若しくは様々な国、様々な年齢範囲若しくは性別における発生率などについてさらなる情報があってもよい。例えば、多くの状態に関する推定生涯リスクの概要が、「クイックビュー」オプションの中にあってもよいが、その一方で、例えば前立腺癌又はクローン病などの特定の状態に関する追加情報は、他の視聴オプションであってもよい。違った組み合わせ及び変更が、違った視聴オプションに存在し得る。

個体によって選択された表現型が医学的状態である可能性があれば、報告中の別の処置及び症状は、その処置に関する詳細を含む他のウェブページにリンクするかもしれない。例えば、薬物の箇所をクリックすることによって、投薬量、費用、副作用、及び有効性に関する情報を含むウェブサイトに導かれる。その薬物を他の処置と比較することもできる。そのウェブサイトはさらに、その薬物の製造者のウェブサイトにつながるリンクを含むこともできる。別のリンクは、契約者が薬理ゲノム学的プロファイルを作成してもらうオプションを提供でき、そのプロファイルは、契約者のゲノムプロファイルに基づく該薬物に対して起こり得る彼らの応答などの情報を包含するであろう。予防処置、例えばフィットネスや減量などの、薬物の代替手段へのリンクもまた提供され、そしてダイエット用サプリメント、ダイエット計画、及び近隣のヘルスクラブ、診療所、健康及びウェルネス提供者、日帰り温泉等へのリンクも提供され得る。また、教育及び情報提供用ビデオ、利用可能な処置の概要、可能な治療法、及び一般的な提言もまた提供され得る。

オンライン報告はさらに、契約者に自身の表現型プロファイルに関するより多くの情報を求める機会を提供する、対面による医師又は遺伝カウンセリング予約をスケジュールに入れるためのリンク、又は遺伝カウンセラー又は医師にオンラインアクセスするためのリンクを提供できる。オンライン遺伝カウンセリング及び医師への質問へのリンクもまた、オンライン報告で提供されることもある。

他の実施形態では、この報告は「おもしろい」表現型についてのもの、例えば個体のゲノムプロファイルと有名人、例えばアルバート・アインシュタインのゲノムプロファイルの類似性についてのものであってもよい。この報告は、該個体のゲノムプロファイルとアインシュタインのものとの間の類似性パーセンテージを表示し、さらにアインシュタインと該個体の予測ＩＱを表示することもできる。詳細には、一般集団のゲノムプロファイルと彼らのＩＱを該個体及びアインシュタインのものと比較する方法が含まれ得る。

他の実施形態では、報告は、個体のゲノムプロファイルと相関するすべての表現型を表示できる。他の実施形態では、その報告は、ある個体のゲノムプロファイルと正の相関がある表現型だけを表示できる。他の形式では、該個体は、ある表現型のサブグループ、例えば医学的表現型だけ、又は対処可能な医学的表現型だけを表示させることを選ぶことができる。例えば、対処可能な表現型及びそれらの関連遺伝子型には、クローン病（ＩＬ２３Ｒ及びＣＡＲＤ１５と相関）、１型糖尿病（ＨＬＡ‐ＤＲ／ＤＱと相関）、ループス（ＨＬＡ‐ＤＲＲ１と相関）、乾癬（ＨＬＡ‐Ｃ）、多発性硬化症（ＨＬＡ‐ＤＱＡ１）、グレーブス病（ＨＬＡ‐ＤＲＢ１）、関節リウマチ（ＨＬＡ‐ＤＲＢ１）、２型糖尿病（ＴＣＦ７Ｌ２）、乳癌（ＢＲＣＡ２）、結腸癌（ＡＰＣ）、エピソード記憶（ＫＩＢＲＡ）、及び骨粗鬆症（ＣＯＬ１Ａ１）がある。該個体は、報告に、表現型の下位カテゴリー、例えば医学的状態として炎症性疾患だけを、又は非医学的状態として身体的形質だけを表示させるように選ぶこともできる。いくつかの実施形態では、個体は、自身に関して推定リスクが算定された全状態を、それらの状態だけを強調することによって、高いリスクを有する状態だけを強調することによって、又は低いリスクを有する状態だけを強調することによって表示するように選ぶこともできる。

個体が提出する、及び個体に伝えられる情報は、安全且つ秘密とすることができ、そのような情報へのアクセスは該個体によって管理され得る。複雑なゲノムプロファイルから得られた情報は、監督官庁により承認された、理解可能な、医学関連の、及び／又は影響の大きいデータとして該個体に提供され得る。情報は、一般的に関心がもたれ、医学関連でないこともある。情報は、これだけに限定されるものではないが、ポータルインタフェース及び／又は郵送といったいくつかの手段によって安全に該個体まで伝達できる。より好ましくは、該個体が安全且つ秘密にアクセスできるポータルインタフェースによって、情報が該個体に安全に（もし該個体が選択すれば）提供される。そのようなインタフェースは、好ましくはオンライン、インターネットウェブサイトアクセスにより提供され、代替手段として、電話、又は個人的で安全且つ容易に利用可能なアクセスを可能にするその他の手段により提供される。ゲノムプロファイル、表現型プロファイル、及び報告は、ネットワーク上でのデータ送信により、個体又はそのヘルスケア管理者に提供される。

したがって、それにより報告が作成される論理回路の代表例であり、それは、ゲノムプロファイルを受信して保存し、遺伝子型相関を解析し、その遺伝子型相関解析に基づく規則を作成し、その規則をゲノムプロファイルに適用し、そして表現型プロファイル、個別の行動計画、及び報告を作成する、コンピュータシステム（又はデジタル装置）を含んでなる。コンピュータシステムは、メディア及び／又はネットワークポート（これは場合により、固定メディアを備えたサーバーに接続できる）からの指示を読み取ることのできる論理装置であると理解できる。システムは、ＣＰＵ、ディスクドライブ、場合により入力装置、例えばキーボード及び／又はマウスなど、及び場合によりモニターを含む。データ通信は、示されたコミュニケーションメディアを通じてローカル又はリモート位置にあるサーバーへとおこなうことができる。通信メディアには、任意のデータ送信及び／又は受信手段が包含され得る。例えば、通信メディアは、ネットワーク接続、ワイヤレス接続又はインターネット接続とすることができる。そのような接続は、ワールドワイドウェブによる通信を提供できる。本開示に関するデータは、そのようなネットワーク又は接続上で、当事者が受信及び／又は検討するために送信できるということが想定されている。受信者は、個体、ヘルスケア提供者又はヘルスケア管理者であってよいが、これだけに限定されるものではない。一実施形態では、コンピューターが読み取り可能なメディアは、生体サンプル又は遺伝子型相関の解析結果の送信に好適なメディアを包含する。このメディアは、個体の表現型プロファイル及び／又は個体の行動計画に関する結果を内包でき、ここで、そのような結果は本明細書中に記載の方法を使用することで導き出され得る。

個人ポータルは、個体がゲノムデータを受信し評価するための一次インターフェイスとしての役割をもつ。ポータルは、サンプルの採集から検査及び結果に至る経過を個体が追跡するのを可能にする。ポータルへのアクセスにより、個体に、彼らのゲノムプロファイルに基づく共通の遺伝疾患に対する相対リスクが伝えられる。個体は、自身のゲノムプロファイルにどの規則を適用するかをポータルを通じて選ぶことができる。

一実施形態では、１若しくは複数のウェブページに表現型のリストがあり、各表現型の横に、契約者が自身の表現型プロファイルに含めることを選択できるボックスがある。表現型は、該表現型に関する情報にリンクしており、この情報は、契約者が自身の表現型プロファイルに含めることを望む表現型に関するインフォームド・チョイスをおこなう助けとなる。このウェブページはさらに、疾患群、例えば対処可能な又は不可能な疾患として、表現型を体系づけてあるかもしれない。例えば個体は、ＨＬＡ‐ＤＱＡ１やセリアック病などの対処可能な表現型しか選ぶことができない。契約者はまた、その表現型に関する発症前又は発症後の処置を表示させることができる。例えば、該個体は、セリアック病のための発症前処置（スクリーニング増大の他に）である、グルテン除去食という発症前処置のある対処可能な表現型を選ぶことができる。別の例は、スタチン、運動、ビタミン、及び精神活動というアルツハイマーの発症前処置である。血栓症がもう一つの例であり、経口避妊薬の回避及び長時間じっと座ることの回避という発症前処置がある。承認されている発症後処置のある表現型の一例は、ＣＦＨと関連する滲出型ＡＭＤであり、この場合、個体は該状態のためのレーザ治療を受けることができる。

表現型を疾患又は症状のタイプ又はクラス、例えば神経系、心臓血管系、内分泌系、免疫系などによって体系づけることもできる。表現型を医学的及び非医学的表現型としてグループ分けすることもできる。ウェブページ上にあるその他の表現型のグループ分けには、身体的形質、生理的特性、精神的形質、又は情緒的形質によるものがある。ウェブページはさらに、１つのボックスの選択により表現型の１グループが選ばれるセクションを提供できる。例えば、全表現型、医学関連表現型だけ、非医学関連表現型だけ、対処可能な表現型だけ、対処不可能な表現型だけ、異なる疾患群、又は「おもしろい」表現型を選択することである。「おもしろい」表現型は、著名人又はその他の有名な個体、又は他の動物若しくは他の生物との比較さえ包含できる。比較のために入手可能なゲノムプロファイルのリストもまた、個体が選択して自身のゲノムプロファイルと比較するために、ウェブページ上に提供され得る。

オンラインポータルは、個体がそのポータルをナビゲートし、特定の表現型を検索し、又は特定の用語若しくは彼らの表現型プロファイルか報告によって明らかになった情報を検索するのを助けるための検索エンジンも提供できる。パートナーサービス及び製品提供にアクセスするリンクもまたポータルにより提供され得る。共通の又は類似の表現型を有する個体のための支援グループ、掲示板、及びチャットルームへのさらなるリンクもまた提供され得る。オンラインポータルはまた、個体の表現型プロファイル中にある表現型に関する詳しい情報を記載する他のサイトへのリンクもまた提供できる。オンラインポータルはまた、個体が自身の表現型プロファイル及び報告を、友人、家族、同僚、又はヘルスケア管理者と共有できるサービスもまた提供できる。個体は、自身の表現型プロファイル中の明らかになっているどの表現型を友人、家族、同僚、又はヘルスケア管理者と共有したいかを選ぶことができる。

表現型プロファイル及び報告は、個体に個別の遺伝子型相関を提供する。個別の行動計画を作成するために使用される遺伝子型相関は、知識の増強と、自身の個人的なヘルスケア及びライフスタイル選択を決定する機会を個体に与える。遺伝子変異体及び処置が実行可能な疾患の間に強い相関が見出された場合、その遺伝子変異体の検出は、該疾患の処置及び／又はモニタリングを開始する個体の決定を助けるかもしれない。統計学的に有意な相関が存在しているが、強い相関ではないと思われる場合、個体はその情報をかかりつけの医師と共に検討し、適切で有益な行動方針を決定できる。特定の遺伝子型相関の観点から個体にとって有益であるかもしれない潜在的な行動指針には、治療処置の管理、処置の潜在的必要性若しくは処置の効果の観察、又は食生活、運動、及びその他の個人的な習慣／活動におけるライフスタイルの変更が包含され、それは、個体のゲノムプロファイルに基づいて個別の行動計画に個別化される。その他の個体情報、例えば既存の習慣及び活動などは、個別の行動計画に組み入れることができる。例えば、セリアック病などの対処可能な表現型には、グルテン除去食という発症前処置があるので、個別の行動計画の中に提供されることができる。同様に、遺伝子型相関情報を薬理ゲノム学を通じて適用し、特定の薬物又は薬物レジメンによる処置に対して個体に起こり得る応答、例えば特定の薬物処置の起こり得る有効性又は安全性を予測することができる。

遺伝子型相関情報を遺伝カウンセリングと連携させて利用し、生殖、並びに母親、父親、及び／又は子供に対する潜在的な遺伝学上の懸念を抱いているカップルに助言することができる。遺伝カウンセラーは情報を提供し、特定の状態又は疾患について高いリスクを示す表現型プロファイルを有する個体を支援することができる。彼らはその障害に関する情報を解釈して、遺伝パターン及び再発リスクを解析し、利用可能な選択肢を契約者と共に検討できる。遺伝カウンセラーはさらに、契約者をコミュニティー又は国の支援活動に紹介する、支持的カウンセリングを提供することもできる。遺伝カウンセリングには特別な契約プランが包含される。遺伝カウンセリングのオプションは依頼から２４時間以内にスケジュールが決められ、従来とは異なる時間、例えば夜間、土曜日、日曜日、及び／又は休日などに利用可能でもあり得る。

個体のポータルはさらに、初期スクリーニングを超えたさらなる情報の送達を容易にする。個体は、自身の個人的な遺伝子プロファイルに関連する新しい科学的発見、例えば自身の現在の又は潜在的な状態に対する新たな処置又は予防策に関する情報などに関して知らされるであろう。この新しい発見はまた、彼らのヘルスケア管理者に送達されることもある。この新しい発見は、更新された又は改訂された個人的な行動画に組み入れられることもある。個体又は彼らの医療サービス提供者は、新しい遺伝子型相関及び個体の表現型プロファイル中の表現型に関する新たな研究について、ｅメールで知らされる。例えば、「おもしろい」表現型についてのｅメールが個体に送信され、例えば、彼らのゲノムプロファイルがアブラハム・リンカーンのものと７７％同一であり、そしてさらなる情報がオンラインポータルを介して入手できることがｅメールで通知され得る。

契約者に、新規の又は改訂された相関、新規の又は改訂された規則、又は（例えば新たな予防及び健康情報、開発中の新たな治療法、若しくは利用可能な新たな処置を含めた）新規の又は改訂された報告について通知するためのコンピューターコードも提供される。本開示はさらに、新しい規則を作成し、規則を修正し、規則を組み合わせ、規則のセットを新しい規則によって定期的に更新し、ゲノムプロファイルのデータベースを安全に維持し、表現型プロファイルを決定するためにその規則をゲノムプロファイルに適用し、個別の行動計画を作成し、そして報告を作成するための（異なる契約の個体のために異なるレベルのアクセスとオプションを承諾するコンピューターコードを含めた）コンピューターコードのシステムを提供する。

契約
ゲノムプロファイル、表現型プロファイル、及び報告は、個別の行動計画を含めて、ヒト又はヒト以外の個体に関して作成できる。例えば、個体には、他の哺乳動物、例えばウシ、ウマ、ヒツジ、イヌ、又はネコなどが含まれ得る。個体とは、人のペットであるかもしれず、ペットの所有者が自身のペットの健康と寿命を増進する個別の行動計画を求めることもある。個体、又は彼らのヘルスケア管理者が契約者であることもある。本明細書中に記載したように、契約者とは、１若しくは複数のサービスに対する購買又は支払いによりサービスを契約する人間の個体である。サービスには、次のもののうち１若しくは複数が包含されるが、これだけに限定されるものではない：自身又は別の個体、例えば契約者の子供又はペットなどのゲノムプロファイルを決定させること、表現型プロファイルを入手させること、その表現型プロファイルを更新させること、並びに自身のゲノム及び表現型プロファイルに基づく（個別の行動計画を含めた）報告を入手すること。

契約者は、ゲノムと表現型プロファイル又は報告を、例えば医師又は遺伝カウンセラーなどの彼らのヘルスケア管理者に提供することを選ぶこともできる。ゲノムと表現型プロファイルは、ヘルスケア管理者によって、ヘルスケア管理者にわたすためにコピーを印刷した契約者によって直接的アクセスされ得るか、あるいは、オンラインポータル、例えばオンライン報告のリンクなどを通じてヘルスケア管理者にそれを直接送信することもできる。

ゲノムプロファイルは、契約者及び非契約者について作成されてデジタル保存されるが、この表現型プロファイル及び報告へのアクセスは、契約者に限定される。例えば、少なくとも１つのＧＣＩスコアに対するアクセスは、契約者には提供されるが、非契約者には提供されない。別の変形形態では、契約者及び非契約者の両方が自身の遺伝子型及び表現型プロファイルにアクセスできるが、非契約者に対してはアクセスを制限されるか、又は限定された報告しか作成されず、一方、契約者は完全なアクセスができ、完全な報告が作成される。他の実施形態では、契約者及び非契約者の両方が初期には完全なアクセス又は完全な初期報告を入手できるが、契約者だけが、自身の預けられたゲノムプロファイルに基づく更新された報告にアクセスできる。例えば、アクセスは非契約者にも提供されるが、この場合、非契約者は自身のＧＣＩスコアのうちの少なくとも１つへのアクセスに制限されるか、又は彼らは作成された自身のＧＣＩスコアのうちの少なくとも１つに対する初期報告は入手できるが、更新された報告は契約した時にのみ作成される。ヘルスケア管理者及びヘルスケア提供者、例えば介護者、医師、及び遺伝カウンセラーなどもまた個体のＧＯＩスコアのうちの少なくとも１つにアクセスできる。

いくつかの実施形態では、ＥＧＣＩスコアへのアクセスは、様々な契約レベルによって制限されることもある。例えば、個体は、自身のＧＣＩスコアに対する契約はできるが、自身のＥＧＣＩスコアへのアクセスは制限されるか、又はＥＧＣＩスコアを用いた具体的な状態又は疾患へのアクセスは制限されることもある。あるいは、ＧＣＩスコアは非契約者に提供され、そしてＥＧＣＩスコアが契約者に提供されることもある。契約レベルはさらに、彼らの環境因子を更新又は修正して、更新された又は改訂されたＥＧＣＩスコアを作成する個体によっても変わる。例えば、個体は、自身の環境因子を更新するためにシステムに無制限にアクセスするために進行中の契約を継続できる。あるいは、個体は、進行中の契約は継続しないが、彼らが自身の環境因子を更新して、新しいＥＧＣＩスコアを作成する回毎に支払いをすることを選ぶこともできる。ＥＧＣＩスコアの更新はさらに、新しい科学情報、例えば遺伝的多型と疾患又は症状の間で発見された新しい相関、あるいは他の遺伝因子及び１若しくは複数の疾患又は症状とそれらとの関連などを組み込むこともできる。個体はさらに、彼らが変更を望み得る環境因子に基づいてＥＧＣＩスコアを作成するオプションを持つこともできる。例えば、個体は、ある都市への移動を企図していれば、該個体は、その都市に関連する特定の環境因子を入力又は選択して、それらのＥＧＣＩスコアに対する影響を見ることもできる。

他の契約モデルには表現型プロファイルを提供できるものが含まれるが、ここで、契約者は、自身のゲノムプロファイルに対して既存の全規則を適用するか、又は自身のゲノムプロファイルに対して既存の規則の小集団を適用するか選ぶことができる。例えば、彼らは、対処可能な疾病表現型に関する規則だけを適用することを選ぶことができる。契約は、１つの契約クラスの中にも異なるレベルが存在するようなクラスの契約であってもよい。例えば、異なるレベルは、契約者が自身のゲノムプロファイルに関連させたい表現型の数、又は自身の表現型プロファイルにアクセスできる人数に依存し得る。

契約の別のレベルでは、既知の表現型といった個体に特有の因子、例えば年齢、性別、又は病歴などを彼らの表現型プロファイルに組み込むことができる。基本契約のさらに別のレベルでは、個体が、ある疾患又は症状についての少なくとも１つのＧＣＩスコアを作成できる。このレベルの変形では、個体は、少なくとも１つのＧＣＩスコアの作成に使用された解析における変化のために、少なくとも１つのＧＣＩスコアに何らかの変化があった場合に、その疾患又は症状について少なくとも１つのＧＣＩスコアの自動更新がなされるような指示ができる。いくつかの実施形態では、その個体は、ｅメール、音声メッセージ、テキストメッセージ、郵便、又はファクシミリによって自動更新を通知され得る。

契約者はさらに、自身の表現型プロファイル及びその表現型に関する情報、例えばその表現型に関する遺伝的及び医学的情報などを含む報告を作成することができる。個体がアクセスできる情報量の違いは、彼らがした契約のレベルに依存する。例えば、個体が持ち得る異なる視聴オプションは、彼らの契約レベル、例えば非契約者のクイックビュー又はより基本的な契約などに依存するが、総合ビューは完全な契約を有する契約者にとってアクセス可能である。

異なるレベルの契約は、情報に対するアクセスしやすさの異なる変形又は組み合わせを持つ、例えばその集団における該表現型の有病率、相関に使用された遺伝子変異体、該表現型を引き起こす分子機序、該表現型の治療法、該表現型の処置選択肢、及び予防処置などが報告に含まれ得る。他の実施形態では、報告は、ある他個体の遺伝子型と別の個体、例えば著名人又はその他の著名人の遺伝子型の間の類似性などの情報を含むことができる。類似性に関する情報には、相同性パーセント、同一変異体の数、及び類似した表現型がある。これらの報告はさらに少なくとも１つのＧＣＩスコアを含み得る。

契約レベルに基づく別のオプションは、報告がオンラインでアクセスされるのであれば、表現型に関するさらなる情報を有する他のサイトへのリンク、オンラインサポートグループ及び同じ表現型又は１若しくは複数の類似表現型を持つ人々の掲示板へのリンク、オンライン遺伝カウンセラー又は医師へのリンク、あるいは遺伝カウンセラー又は医師との電話若しくは対面予約のスケジュールへのリンクを含むことができる。報告が紙の形態である場合には、情報は、前記リンクのウェブサイトアドレス、又は遺伝カウンセラー若しくは医師の電話番号と住所であってもよい。契約者はまた、どの表現型を自身の表現型プロファイルに組み込み、どんな情報を自身の報告に含めたらよいか選ぶことができる。表現型プロファイル及び報告はさらに、個体のヘルスケア管理者又はヘルスケア提供者、例えば介護者、医師、精神医、心理士、セラピスト、又は遺伝カウンセラーなどによってアクセス可能であるかもしれない。契約者は、表現型プロファイル及び報告、又はその一部を、そのような個体のヘルスケア管理者又はヘルスケア提供者にアクセス可能とさせるかどうか選ぶことができる。

別のレベルの契約は、初期の表現型プロファイル及び報告の作成後も個体のゲノムプロファイルをデジタルで維持し、最新の研究により更新された相関を含む表現型プロファイル及び報告を作成する機会を契約者に提供する。契約者は、最新の研究により更新された相関を含むリスクプロファイル及び報告を作成する機会を有する。研究によって遺伝子型及び表現型、疾患又は症状の間に新しい相関が明らかなるとき、これらの新しい相関に基づいて新しい規則が作成され、既に保存され維持されているゲノムプロファイルに適用され得る。新しい規則は、以前にいずれの表現型とも相関しなかった遺伝子型を相関させるか、遺伝子型を新しい表現型と相関させるか、既存の相関を修正するか、又は遺伝子型と疾患又は症状との新たに発見された関連性に基づくＧＣＩスコアの調整基準を提供できる。契約者は、ｅメール又は他の電子的手段により新しい相関に関して知らされ、その表現型が興味深いものであれば、自身の表現型プロファイルを新しい相関によって更新することを選ぶことができる。契約者は、更新毎に、いくつかの更新に対して、又は所定の期間（例えば３カ月、６カ月、又は１年間）の無制限な回数の更新に対して支払をおこなう契約を選ぶことができる。別の契約レベルは、個体が自身の表現型プロファイル又はリスクプロファイルをいつ更新するか選ぶ代わりに、新たな相関に基づいて新しい規則が作成されたときはいつでも契約者が自身の表現型プロファイル又はリスクプロファイルを自動更新させるというものである。

表現型と遺伝子型との相関に関する規則を作成し、個体のゲノムプロファイルを決定し、そのゲノムプロファイルに該規則を適用し、そして外個体の表現型プロファイルを作成するサービスを、契約者が非契約者に紹介することができる。契約者が紹介することにより契約者にはそのサービスの契約に割引料金が提供されるか、又は彼らの既存の契約がアップグレードされ得る。紹介された個体には、時間限定の無料アクセスか、又は割引契約料金が提供され得る。

以下の実施例は、本明細書中に記載の実施形態を例示及び説明するものである。本開示の範囲はこれらの実施例により制限されるものではない。

実施例１：ＧＣＩの評価
ＷＴＣＣＣデータ（ＷｅｌｌｃｏｍｅＴｒｕｓｔＣａｓｅＣｏｎｔｒｏｌＣｏｎｓｏｒｔｉｕｍ，Ｎａｔｕｒｅ．４４７：６６１‐６７８（２００７））を使用して、ＧＣＩフレームワークを試験した。このデータセットは、疾病表現型に基づいて７つの下位集団に分割される約１４０００人の個体と、ＵＫＢｌｏｏｄＳｅｒｖｉｃｅＣｏｎｔｒｏｌＧｒｏｕｐからの１５００のサンプルから成る１つの非罹患対照下位集団の遺伝子型を含む。それらの遺伝率及び平均生涯リスクにおいて実質的に異なる３つの異なる疾患：２型糖尿病、クローン病、及び関節リウマチとの関連においてＧＣＩを試験する。よって、分析は、２型糖尿病、クローン病、関節リウマチの下位集団、及びコントロール群に限られる。これらの状態の各々と有意に関連することが文献に報告されており、且つ、１セットの品質の基準（表２を参照のこと）を通過したＳＮＰを使用した。

これらのＳＮＰの各々について、相対生涯リスクを、ＷＴＣＣＣデータセットにおいて見つけた対立遺伝子の実証的な分布に基づいて本明細書中に記載したように算定し、そしてＧＣＩ組成を使用して、個体ごとの推定リスクを算定した。既知のリスク変異体の一部は、ＷＴＣＣＣによって使用されているＡｆｆｙｍｅｔｒｉｘ５００ｋＧｅｎｅＣｈｉｐアレイ上に存在していないので、そのため、ＧＣＩの予測性は、以下の分析において提示されるものに比べてよくなりそうであると予想される。

受信者作動性曲線（ＲＯＣ）（ＴｈｅＳｔａｔｉｓｔｉｃａｌＥｖａｌｕａｔｉｏｎｏｆＭｅｄｉｃａｌＴｅｓｔｓｆｏｒＣｌａｓｓｉｆｉｃａｔｉｏｎａｎｄＰｒｅｄｉｃｔｉｏｎ，ＭＳＰｅｐｅ．ＯｘｆｏｒｄＳｔａｔｉｓｔｉｃａｌＳｃｉｅｎｃｅＳｅｒｉｅｓ，ＯｘｆｏｒｄＵｎｉｖｅｒｓｉｔｙＰｒｅｓｓ（２００３））を状態の予測試験の役割を果たすＧＣＩの能力を評価するために使用する。完全な試験のために、閾値ｔが、ｔより大きいスコアを有するすべての個体が状態を発症し、且つ、ｔより小さいスコアを有するすべての個体が状態を発症しないように選ばれる。しかしながら、実際には、どんな閾値についても、偽陽性及び偽陰性代入の一部が存在する。ＲＯＣ曲線は、偽陽性率と真陽性率との相関を図によって描くので、そのため、それは試験感度と特異性の間のトレードオフを導くために使用される。異なるリスク推定スコアを比較するために、定量的な尺度としてＲＯＣ曲線下面積（ＡＵＣ）を使用する。ＡＵＣはさらに、状態の遺伝子的原因が完全に理解されている最適のシナリオと比較した場合のあらゆるスコアの相対的利益も示すことができる。一般に、ＡＵＣの値が大きいほど、分類のためにより良好なスコアである。分類がランダムにおこなわれるのであれば、ＡＵＣは０．５であると予想され、そして最適のスコア（すなわち、ある閾値にて、真陽性部分が１になり、且つ、偽陽性部分が０になるスコア関数）に関して、ＡＵＣは１と等価である。

比較のためのベースラインを得るために、データを適合させるためにＳＮＰ間の相互作用を利用する最適モデルを算定するロジスティック回帰を使用する。ＳＮＰがｓ₁、ｓ₂、．．．、ｓ_nである場合、その時のモデルはロジットがＸ＝ａ₁ｓ₁＋ａ₂ｓ₂＋、．．．、＋ａ_nｓ_n＋ａ₁₂ｓ₁₂＋、．．．、＋ａ₁₂ｓ₁₂＋、．．．、＋ａ_n-1,nｓ_n-1,nである仮定され、この場合、ｓ_ijがｓ_iとｓ_jの間の相互作用である。適合確率を、リスクに関する推定として使用し、これらのリスク推定のためにＲＯＣ曲線を作成する。このモデルはＳＮＰ間の対相互作用を考慮に入れるため、ＧＣＩスコアと少なくとも同じくらい正確であるべきであるが、典型的にはそれらを考慮しない。さらに、一対のＳＮＰの間に連鎖不平衡が存在する場合、ロジスティック回帰はこの相関に対応することに困難があるが、典型的にはＧＣＩはそれを無視する。よって、ロジスティック回帰解析モデルを提案されたＧＣＩスコアと比較することで、ＧＣＩの予測力に対して様々な仮定の効果を計測する能力を与えている。図１は３つの疾患シナリオのすべてに関するＲＯＣ曲線を示し、そして表３はそれらのＡＵＣを示す。ＧＣＩ及びロジスティック回帰に関するＡＵＣは、３つの疾患すべてについて全く同様であり（表３）、少なくともこれらの疾患及びこれらのＳＮＰに関して、ＳＮＰ‐ＳＮＰ相互作用がリスク評価に関する実質的な情報を加えることはないという結論に至る。そのため、従来の研究からのそういった相互作用に関する証拠が存在しない限り、ＳＮＰ‐ＳＮＰ相互作用が無視できるという仮定は正当である。

ＧＣＩＲＯＣ曲線は理論的状態モデルと比較される。この疾患モデルは、疾患が環境と遺伝子の両方の因子によって影響を受け、且つ、その２つの因子が独立していると仮定している。表現型ＰはＰ＝Ｇ＋Ｅによって表される。その場合、Ｇは遺伝的リスクであり、Ｅは環境リスクである。そして、また、連続モデルとも呼ばれる一次モデルは、通常、Ｇ及びＥがそれぞれ標準偏差σ_G及びσ_Eで分配され、且つ、固定値αに関してＰ＞αの場合に、個体がその一生のうちに状態を発症する、と仮定する。遺伝率ｈが多くの複合疾患で知られているので、σ_G、σ_E、及びαは、ｈ＝σ_G ²／（σ_G ²＋σ_E ²）、並びに平均生涯リスクがＰｒ（Ｐ＞α）であるという制約を使用して固定する。試験される状態の各々に関して遺伝率と平均生涯リスクが知られているので、モデルに関するパラメーターを疾患によって設定する。このモデルに基づく分布Ｐからの１０００００の無作為標本が作成される。Ｇは各個体に関して知られていると仮定し（Ｅ及び疾病状態は未知である）、そしてＲＯＣ曲線をＧに基づいて作成する。これは、遺伝的リスクがすべての個体に関して完全に理解されていて、且つ、正しく計測されている最適のシナリオを表している。この疾患モデルに関して、最適のシナリオに関するＡＵＣは、疾患の遺伝率及び平均生涯リスクに依存するだけであり、σ_G、σ_E、又はαの選択に依存しない。

この一次モデルに関するＲＯＣ曲線下の面積の理論的最大値は、疾患の平均生涯リスク（ＡＬＴＲ）と遺伝率だけに依存する。仮に、σ_eが環境変数の変化を意味し、σ_gが遺伝的変数の変化を意味することとする。このモデルでは、通常、遺伝的変数（Ｇ）及び環境変数（Ｅ）の両方が分配される。ＲＯＣ曲線の理論的最大値は、遺伝的変数が正確に分かっている一方で、環境変量が未知である場合に得られる。個体は、Ｇ＋Ｅ＞αであれば真症例であり、そうでなければ真対照である。遺伝的変数に関して選ばれるカットオフ値に関して、そのカットオフ値より高い個体は症例とみなされ、残りは対照とみなされる。真陽性部分（ＴＰＦ）は症例と呼ばれる真症例部分であり、偽陽性部分（ＦＰＦ）は症例と呼ばれる真対照部分である。カットオフ値の異なる値に関してＴＰＦ対ＦＰＦは、ＲＯＣ曲線を我々にもたらす。

個体の遺伝的変数が一部のカットオフ値（ｃ）に比べて高い確率を、以下のとおり表す。

個体の遺伝的変数がカットオフ値より高い確率、且つ、個体が真症例であるのは、以下の式：

のとおりである。

非ゼロ平均生涯リスクに関して、αは以下の式：

により直線的に増加するので、γは固定値である。

定義により、遺伝率は以下のとおりである。

前記二重積分における大括弧内の積分は、誤差関数、ｅｒｆの観点から表すことができる。正規分布の累積分布関数が以下の式：

によって表されるので、前記大括弧内の積分は以下のとおりである。

よって、個体が真症例であり、且つ、その遺伝的変数がｃより大きい確率は、以下のとおりに表すことができ、

その場合、ｆ（ｈ）及びｇ（ｈ）は遺伝率の一部の関数である。この方程式に以下の式：

を代入することで、我々は以下の式を見出すことができる。

そのため、Ｐ（Ｇ＞ｃ且つＧ＋Ｅ＞α）は、以下のとおり表すことができる。

同様に、個体が真対照であり、且つ、その遺伝的変数がｃより大きい確率は、すなわち、以下のとおりである。

そのため、ＴＰＦ＝Ｐ（Ｇ＞ｃ且つＧ＋Ｅ＞α）／ＡＬＴＲなので、任意のβに関する真陽性部分は、ｈ及びＡＬＴＲにのみ依存する。

ＦＰＦ＝Ｐ（Ｇ＞ｃ且つＧ＋Ｅ＜＝α）／［１‐ＡＬＴＲ］なので、偽陽性部分に関しても同じである。したがって、βのすべての起こり得る値におけるＴＰＦ及びＦＰＦに基づく理論ＲＯＣ曲線下総面積は、σ_e及びσ_gと無関係である。

二次モデル、又は離散モデル、従来モデルの変形では、Ｇ＝Σλ_iＸ_i＋Ｙと仮定され、この場合、Ｙは、通常、標準偏差σ_Yで分配され、且つ、Ｘ_i〜Ｂ（２，ｐ_i）は二項分布する。この場合、Ｘ_iは大きな影響のあるＳＮＰに対応し、Ｙはその他の多くの小さな遺伝的影響を表す；小さな遺伝的影響が十分に存在すれば、それらの合計の漸近的挙動が正規分布に従うであろうことが予想できる。適切にパラメーターＡ、σ_Y、及びｐを設定することによって、大きな影響があるＳＮＰの相対リスクを制御できる。これらのパラメーターは、相対リスクが実際のデータで観察された値に近づくように選ばれる（表４を参照されたい）。従来のモデルと同様に、Ｇが知られていて（Ｅは未知である）、且つ、大きな影響があるＳＮＰの相対リスクとリスク対立遺伝子頻度が固定値である場合、離散モデルのＲＯＣ曲線下面積は、疾患の遺伝率と平均生涯リスクにのみ依存する。

モデル１のそれに類似した結果が疾患モデル２に関しても得られた。特に、ＳＮＰの相対リスクが疾患に関連することが知られており、且つ、リスク対立遺伝子頻度（ｐ_i）が固定値である場合、そのとき、ＲＯＣ曲線下総面積は疾患の遺伝率と平均生涯リスクにのみ依存する。このモデルでは、遺伝的変数は、Ｇ＝Σλ_iＸ_i＋Ｇ１である。ここで、Ｇ１〜Ｎ（０，σ_g1）及びＸ_iは二項分布Ｂ（２，ｐ_i）にしたがって分配され、この場合、ｐ_iが位置ｉにおけるリスク対立遺伝子の対立遺伝子頻度である。Ｂ（２，ｐ_i）は、遺伝子座ｉにおける個体のリスク対立遺伝子コピー数を表す。Ｘ_i＝０は、非リスク対立遺伝子の同型接合を意味し、Ｘ_i＝１は、異型接合を意味し、そしてＸ_i＝２は、リスク対立遺伝子の同型接合を意味する。正規の変数は未知の遺伝子成分を表す。従来と同様、通常、環境変量Ｅは、平均０、且つ、標準偏差σ_eで分配される。表現型は、Ｐ＝Ｇ＋Ｅによって表され、Ｐ＞αを有する個体は罹患しているのに対して、残りは対照である。αは、罹患した個体部分が該疾患の平均生涯リスクと等しくなるように選ばれる。

このモデルの遺伝率は、以下のとおりである。

仮に、我々が、異型接合遺伝子型の既知のＳＮＰの相対リスクが固定値であり、これらをＲＮ_iによって示すと仮定したとする。定義上、異型接合体の相対リスクは、以下の式：

によって与えられ、この場合、Ｗ＝Ｅλ_jＸ_jであり、すべてのｊについてはｉと等しくない。仮に、ｅｒｆが誤差関数を意味し、且つ、ｅｒｆｃが相補誤差関数（すなわち１−ｅｒｆ（ｘ））を意味するとする。以下：

のとおりなので、相補誤差関数の観点で表された相対リスクは、以下の式：

によって表される。よって、疾患カットオフ値α有するλ_iが、以下の式：

（これらは独特であるかどうかわからない）の一部の選択に関するＳＮＰの解を表す場合、そのとき、Ｌαのカットオフ値を有するＬλ_iは、Ｇ１及びＥの標準偏差がＬの因数によって変えられたのであれば、必然的に解になる。ｚが常にλ_iの一次結合であるので、このことが結果として起こる。そのため、以下の：

は、以下の：

に無関係であり、且つ、単独で遺伝率とＡＬＴＲに依存している。

定義上、以下のとおりである。

そのため、これは以下の式を意味する。

以下の式：

及びｐ_iが以下の式：

とは無関係なので、以下の式は単独で、遺伝率とＡＬＴＲの関数である。

仮に、Ｚ＝Σλ_iＸ_i及びＶがＸ_i値のベクターを意味するとする。そのとき、以下の式：

が単独で遺伝率、ＡＬＴＲ、及びｖの関数であり、且つ、以下の式：

に無関係である。

真陽性部分は：Ｐｒ（Ｇ＞ｃ且つＧ＋Ｅ＞α）／Ｐｒ（Ｇ＋Ｅ＞α）と定義され、この場合、ｃは遺伝的変数のカットオフ値を意味する。仮に、β＝ｃ／σ_g1とする。ＴＰＦの分子は、以下のとおり算定される：

正規分布の累積分布関数を表すために誤差関数を使用することで、Ｐｒ（Ｇ＞ｃ且つＧ＋Ｅ＞α）は、以下のとおりであり、

その場合、ｒ及びｓはいくつかの関数である。この方程式に以下の式：

を代入することで、我々は以下の式を理解することができる。

そのため、Ｐ（Ｇ＞ｃ且つＧ＋Ｅ＞α）は以下のとおり表される。

ｐ_iが固定されていれば、ＡＬＴＲ＝Ｐ（Ｇ＋Ｅ＞α）及びＰｒ（Ｖ＝ｖ、Ｚ＝ｚ）が固定される。そのため、任意のβに関する真陽性部分は、ｈ及びＡＬＴＲにのみ依存する。ＦＰＦ＝Ｐｒ（Ｇ＞ｃ且つＧ＋Ｅ＜＝α）／［１−ＡＬＴＲ］であるので、同様のことが偽陽性部分に関しても真実である。それで、βのすべての起こり得る値でＴＰＦ及びＦＰＦに基づいている、理論上ＲＯＣ曲線下面積は、σ_e、σ_g1及びＸ_iとは無関係である。

以下の式：

を解くことにより、以下のとおりとなる。

それで、ＬＨＳが常に１より小さいので、以下のとおりとなる。

以下の式：

の全体の解は、以下の反復手順を使用することによって同時に得ることができる。

最初に、各ＳＮＰに関して以下の式：

を決定し、それが存在する唯一のＳＮＰであると仮定する（すなわち、λ_j＝０であり、すべてのｊに関してｉと等しくないと仮定する）。これは、０と以下の値：

の間の二分探索を使用して行うことができる、なぜならば、ＲＮ_iが以下のとおり増加するからである。

これらの値は、以下の式：

に関する初期推測値である。その時、１）決定：

は他のＳＮＰに関する式：

が以前に算定されたものと等しいと仮定し、２）決定：

は他のＳＮＰに関する式：

が以前に算定されたものと等しいと仮定し、３）決定：

は他のＳＮＰに関する式：

が以前に算定されたものと等しいと仮定する。すべてのＲＮ_i値が、実際の値に十分に近ければ、終了する。そうでなければ、ステップ１に戻ること。

よって、すべての遺伝的変動性が知られており、モデル化されているが、環境的変動性はそうではない場合に、生じるであろう二セットの最適ＲＯＣ曲線が提供される。一次モデルは、累積している多くの小さい遺伝的影響が存在すると仮定し（それにより、通常、遺伝的影響は分散確率変数によって表される）、それに対し、二次モデルは、小さな影響しか持たない多数のその他の遺伝子変異体に加え、大きな影響を持つ少数の遺伝子変異体が存在すると仮定している。両モデルは、状態の遺伝率と生涯リスクを考慮し、現在知られているものに基づいて未知の遺伝的リスク因子の現実的な推定につながった。図１は、これらのシナリオに関するＲＯＣ曲線を示し、そして表３はそれらの面積を表す。ＧＣＩの曲線下面積は、最適な理論的包括モデル未満であり、それは、さらなる未知の遺伝子変異体、及び／又は相互作用がこれらの疾患に影響していると予想されることを示唆している。

図１に基づいて、予測モデリングの改善だけが、おそらく、本明細書中で検討した３つの状態に関する追加の遺伝子変異体の発見を成し遂げる。遺伝因子の何パーセンテージがこれまでにデータに捕らえられたのかを知るのは有用である。ＲＯＣ曲線アプローチを使用したこの数量の推定は、主要な遺伝因子が既に発見され、且つ、低い相対リスクをもつその他の多数の未知の遺伝因子が存在するという大きな仮定を用いて開発されている。

さらなる独立した一般的（小規模な対立遺伝子頻度１０％以下）変異体の潜在的な数は、そのような各変異体が、同型接合変異体に関して１．１の相対リスクに貢献し、異型接合変異体に関して１．０５の相対リスクを寄付する場合に、指定され、その推定が、本質的には、理論的最適結合程度に大きなＡＵＣを有するＲＯＣ曲線を得るために十分である変異体の数をもたらす。

３つの状態の各々に関して、遺伝因子は、低い相対リスクをもつかなりの数の未知数ｋ個の変異体に加えて、（表２にあるとおり）既知のものであると仮定する。１０００００人の個体から成るシミュレーションに基づいて、およそ１６００の追加の変異体が、２型糖尿病の遺伝子変異体について説明するのに必要とされた。これは直感であるが、２型糖尿病のＡＵＣは、６４％の高い遺伝率値にもかかわらず、現在の知見によるとかなり低い。クローン病及び関節リウマチに関して、それぞれ１３９５８個及び６２３７個のさらなる遺伝因子が見つかったと予想されるので、結果はよりいっそう衝撃的である。そのため、現在知られている遺伝子変異体は、これらの状態の総遺伝子変異の４％〜１４％の割合を占める（表４を参照のこと）。しかしながら、これらの結果は、その他の大きな影響が存在しないと予想されるという事実を条件としているが、実際には、ＳＮＰ‐ＳＮＰ若しくはＳＮＰ‐環境相互作用、又はその他のそれほど研究されていない変異体（例えばコピー数変異体、希少変異体、エピジェネティック変異体）によるいくつかの大きな影響がまだ存在している可能性もある。

実施例２：未知のＳＮＰ‐ＳＮＰ相互作用の理論的影響
ＧＣＩスコアは、すべてのＳＮＰが互いに無関係であり、且つ、それらが疾患に関するリスクに対して独立した影響をもつという仮定に基づいている。図１に示されているように、本明細書で研究した３つの例は、ＧＣＩモデルと、ＳＮＰの間の対依存性がロジスティック回帰を通して包含されているモデルの有意差を全く示していない。ＳＮＰ‐ＳＮＰ相互作用が他の疾患において存在していて、考慮されなければならないたくさんの既知の例がある（例えば、Ｚｈｅｎｇｅｔａｌ．，ＮＥｎｇｌＪＭｅｄ．３５８：９１０‐９１９（２００８））。これらの相互作用が知られていれば、それらを容易にＧＣＩモデルに組み入れることができる。しかしながら、リスク推定に対する未知のＳＮＰ‐ＳＮＰ相互作用の影響を理解することは重要である。

さらに詳細に相互作用の問題を調査するために、相対リスクがデータセット中の一対のＳＮＰと無関係ではない相互作用モデルの下、データセットをシミュレートする。リスク評価のための２つのアプローチに基づいてＲＯＣ曲線をプロットするために、シミュレートした症例‐対照データを使用する。最初に、相互作用モデルに従って個体の相対リスクを算定する。次に、ＧＣＩアプローチに従って相対リスクを割り当て、それが乗法的モデルを仮定する。図２及び表５で観察されたとおり、相互作用係数が非常に高いときにだけ、ＲＯＣ曲線が実質的に異なる。

しかしながら、ＳＮＰ対の間のそのような強い相互作用は、ゲノムの広範な広い関連研究の中で発見されそうであり、しかも、そのような強い相互作用に参加する２つのＳＮＰが検出可能な主な影響がないことを見つけることは、例外的であるであろう。特に、全ゲノム関連研究では、ＳＮＰ‐ＳＮＰ相互作用が試験されたが、有意であることがわからなかったと報告することが多い（例えば、Ｂａｒｒｅｔｔｅｔａｌ．，ＮａｔｕｒｅＧｅｎｅｔ．４０：９５５‐９６２（２００８））。そのため、１セットのＳＮＰに関して、そのような相互作用が文献中で報告されていないとき、簡単な加法的試験の分類精度が、相互作用を含む正しいモデルの分類精度と劇的に違っていることはありそうもない。

未知のＳＮＰ‐ＳＮＰ相互作用の影響を試験するために、以下のモデルに基づくデータをシミュレートする。仮に、λ_iが遺伝子型（ｇ_i）の特定の組み合わせに関する疾患を相対リスクを表し、ｐが疾患を発症する平均確率（すなわち、生涯リスク）を表すとする。相対リスクの定義上、λ_i＝（疾患｜ｇ_i）／Ｐ（疾患｜ｇ₀）。ここで、ｇ₀は疾患を発症する最小機会を有する遺伝子型を意味する。簡単な乗法的モデルで、総相対リスクを得るために、遺伝子座全域の相対リスクを掛ける。よって、以下のとおりになり、

この場合、λ_ijがｊ^th遺伝子座に関する相対リスクを意味する。相互作用モデルでは、ある組み合わせの遺伝子型に関する相対リスクの特定の対が、相対リスクの積より２倍又は１０倍大きいと仮定する；この数は相互作用係数と呼ばれる。その他のすべてのＳＮＰに関して、相対リスクは独立していると仮定する。例えば、ＳＮＰのｘとｙが相互作用する場合、そのとき、この対の相対リスクは（ｇ_ix、ｇ_iy）の特定の立体配置に関してＫ＝２λ_ixλ_iyであり、その他の組み合わせに関してＫ＝λ_i1λ_i2である。この場合、総リスクは以下のとおりであろう。

このモデルに基づいて、１０００００の無作為に読み出されたサンプルに関する疾病状態標識を割り当てる。個体に割り当てられる確率は、一症例でＰ（疾患｜ｇ_i）＝Ｃλ_iであり、この場合、Ｃが標準化因子であり、λ_iが相互作用モデルに基づく個体ｉの相対リスクである。Ｃは、症例部分が疾患の平均生涯リスクに近づくように選ばれる。これは、相互作用モデルの下、症例及び対照に関して大規模にシミュレートしたデータをもたらす。

実施例３：リスク推定における絶対誤差の計測
ＲＯＣ曲線は、診断を評価するための１つの基準としての役割を果たす、つまり、それは、試験が健康と病気の個体を見分ける能力の定量的尺度を提供する。しかしながら、生涯リスクを推定するとき、正確な確率的推定が使用されていない場合、ＲＯＣ曲線は理想的な尺度でない。特に、任意のスコア関数対に関して、ｆ₁がｆ₂の単調な増加関数である限り、ｆ₁（Ｇ）及びｆ₂（Ｇ）、すなわちＲＯＣ曲線の関数が同一である。例えば、我々は平易にｆ₂（Ｇ）＝ｌｏｇ（ｆ₁（Ｇ））を割り当てることができ、そしてこの際、リスクを推定するためにスコアｆ₁及びｆ₂を使用することで、我々はまさに同じＲＯＣ曲線を得る。しかしながら、これらの２つの関数は、個体に対する大きく異なる確率論的リスク推定をもたらし得る。よって、ＲＯＣ曲線は、必ずしも、確率論的リスクを報告する試験のための優れた尺度であるわけではない。確率論的リスク評価に関して、より有益な試験は、真のリスク確率と推定リスク確率の平均絶対差であろう。

病気を発症する真の確率が未知であるので、症例‐対照データがＧＣＩパラメーター（すなわち、相対リスク）を算定するのに使用されるシナリオがシミュレートされ、その後、別の独立にシミュレートされた集団に対するＧＣＩリスク推定が適用される。シミュレーションのための状態モデルは、（先に記載したように）疾患の遺伝因子が正規分布によって近似される少数の大きな影響があるものと多数の小さな影響しかないものに分解されると仮定する。ほとんどの疾患が生涯の後期で診断されるので、疾患の発病年齢がモデルに導入される。モデルに基づいて疾患を発症すると決定している各々の個体に関して、疾患の発病年齢は、発病年齢の一部の分布に基づいている（平均＝５０且つＳＤ＝１３の正規分布）。よって、シミュレーションにおいて、一部の対照が、実際にある時点で診断されていない症例である可能性がある。年齢合致症例-対照試験の現実的シミュレーションを作成するために、遺伝的及び環境因子、並びに個体の発病年齢を反復してシミュレートした。個体の年齢は、０〜１００の一様分布から選ばれる。１００００の症例を入手するまで、これを反復する。これらの症例の各々に関して、それらのうちの１つが対照であることが分かるまで、それらの年齢を固定し、そして個体の遺伝的及び環境因子をシミュレートすることによって、年齢合致対照を作成する。このプロセスが、１０００００の症例及び１０００００の対照を含む年齢合致症例‐対照データセットをもたらす。この症例‐対照データに基づいて各ＳＮＰに関するオッズ比を推定し、次いで、本明細書中に記載のＧＣＩ方法論を使用した、疾患に関連する各ＳＮＰに関する相対リスクを算定するのに使用する。

これらのシミュレーションは、得られたリスク評価を試験するのに使用される。５００の個体が、真の状態モデルにしたがって作成される。状態モデルが知られているので、これらの個体の各々に関して、状態を発症する正確なリスクを算定する。これらの「真のリスク推定」は、精度決定のためのベースラインとして使用される。ＧＣＩリスク推定は、このベースライン、並びに相対生涯リスクがオッズ比によって置き換えられたＧＣＩ変異体と比較される。

図３において、２５％の平均生涯リスクと６４％の遺伝率を有するシミュレートされた疾患（図３ａ）、及び４２％の平均生涯リスクと５７％の遺伝率を有する疾患（図３ｂ）に関する相対誤差の絶対値の分布をプロットする。これらの値は、２型糖尿病及び心筋梗塞の生涯リスク及び遺伝率に大体対応している。相対リスクを使用するときとオッズ比を使用するときに、ＧＣＩの間に相違がある。ＲＯＣ曲線をリスク推定の精度を定量するために使用するときには、この相違には気付かないであろう。ＧＣＩによって生じる誤差は、通常、５％を超えない。これは、すべての遺伝的リスクが知られていて、且つ、疾患モデルが的確に現実を表すという仮定の下で存在する。

実施例４：遺伝的リスク評価と家族歴
疾患リスクを評価するのに遺伝子型情報を使用するのとは対照的に、疾患リスクを評価するのに家族歴を使用することは、臨床現場で一般的に実施されている。付加価値に関して家族歴と比較されて遺伝子型情報を使用することについて、疑問が生じる。これらの疑問に対処するために、親の疾患状態情報が知られているシナリオをシミュレートし、そしてこの情報を、疾患に対する個体のリスクに関する試験として使用する。この試験の偽陽性率と真陽性率を、遺伝子型試験によって得られたものと比較する。

離散的状態モデルをシミュレーションに使用する。疾患に関する各ＳＮＰ位置における対立遺伝子頻度による１０００００の母親‐父親対に関する無作為な遺伝子型を作成する。該遺伝子型は、遺伝子座全域で独立であると仮定する。三組のそれぞれに関して、各遺伝子座に関して各親から無作為に１つの対立遺伝子を選ぶことによって子供をもうける。その子供の遺伝子の通常の成分は、単純に両親の標準化平均であり、そして、環境因子は親の環境因子と独立した環境因子の組み合わせである。よって、父親と母親の表現型がそれぞれＰ_FとＰ_Mであれば、この場合、Ｐ_F＝Ｘ_F＋Ｇ_F＋Ｅ_F及びＰ_M＝Ｘ_M＋Ｇ_M＋Ｅ_M（この場合、Ｘは二項式遺伝的分布であり、且つ、Ｇ〜Ｎ（０、σ_G）及びＥ〜Ｎ（０、σ_E）は正規分布した遺伝的及び環境因子である）であり、次いで、子供の表現型をＰ_C＝Ｘ_C＋（Ｇ_F＋Ｇ_M）／√２＋ａ（Ｅ_F＋Ｅ_M）＋ｂＥ_Cであり、この場合、Ｅ_C〜Ｎ（０、σ_E）は子供の独立した環境変量を表し、Ｘ_Cは大きな影響に貢献すると考えられる遺伝因子である。状態の遺伝率は、制約２ａ²＋ｂ²＝１を強要する。よって、パラメーターｂは、子供に対する親の環境の影響を決定する。ｂ＝１であれば、親の環境が子供に影響せず、ｂ＝０であるとき、子供の環境が親によって完全に決定される。これらのシミュレーションに基づいて、真陽性及び偽陽性の部分を単純分類試験に関して算定し、ここで、子供は、彼ら若しくは彼女らの親のいずれかが症例であれば、症例と標識され、そうでなければ、対照と見なされる。この試験は家族歴試験である。

先に記載のとおり、この試験は、遺伝子型ベースの試験の理論的限界に対応するＲＯＣ曲線と比較される。図４に示されているように、家族歴試験の感度及び特異性は、パラメーターｂの選択に大いに依存している。いくつかの結論がこれらのグラフから出ている。最初に、３つの状態モデルのすべてに関して、家族歴がＧＣＩ試験に劣っている場合と、家族歴が優れているその他の場合があり、ｂの値に依存していることが明確である。しかしながら、ほとんどの場合、２つの試験が全く同様の結果をもたらす。しかしながら、家族歴試験の感度と特異性の値はｂに依存しており、それは集団で固定されている、それに対して、ＧＣＩ試験は全範囲の特異性と感度の値を考慮する。例えば、クローン病に関する例では、さらにいくつかの偽陽性を許容することによって、当業者は、ＧＣＩ試験を使用することで、真陽性の数を９８％近くまで増やすことができるが、一方で、家族歴試験に関する真陽性率は、６５％で限界を示した。

実施例５：既知の環境因子が予測を改善する
疾患予測に対する既知の環境因子の潜在的貢献を推定するために、環境データ及び遺伝データの両方を、リスクを推定するのに使用する。ここで、大きく異なる遺伝率及び平均生涯リスクの値をもつ２型糖尿病、クローン病及び関節リウマチの全般にわたる環境因子の有用性を実証する。リスクは、全ＳＮＰ及び全環境因子にわたり独立していると仮定する。この仮定は必ずしも成り立つとは限らないが、以下でさらに記載するように、これは実質的に結果に影響しない。この仮定に基づいて、環境因子が考慮される症例に関して、ＧＣＩを一般化する。得られた方法をＥＧＣＩと呼ぶ。集団の遺伝子型及び表現型値に基づいて１セットの１０００００の個体に関して遺伝子型及び表現型頻度をシミュレートする。乗法的モデルに基づいてこれらの個体に対して疾病状態を割り当てる。

純粋な遺伝子ベースのＧＣＩを、新しい一般化ＥＧＣＩと比較する。２型糖尿病、クローン病及び関節リウマチのＲＯＣ曲線を図５に見ることができる。環境因子の付加価値は、クローン病及び関節リウマチに関しては劇的ではなかったが、けれども、それは２型糖尿病に関しては大きかった。これは、ボディーマスインデックスが２型糖尿病のリスクに大きく影響する（ＢＭＩ＞３５の場合に、４２．１の相対リスクをもつ）という事実によって主張されている。クローン病などの疾患に関して、この状態の遺伝率がおよそ８０％であるので、環境因子が大きな部分を占めると予想されなかったことに留意されたい。

実施例６：疾患の仮定生涯リスクにおける誤差
ヒトゲノム計画、ＨａＰＭａｐプロジェクト、及び関連する構想は、基準ヒトゲノム配列、一般的な遺伝子変異のカタログ、及びいくつかの基準集団のハプロタイプマップをもたらした。さらに、ゲノム及び特性、並びにあらゆる疾患を通じて変異の間の関連を試験するための費用対効果に優れた技術と組み合わせられた情報が、一般的な疾患のリスクに明確に統計学的に関連していることが示された多数の一般的な変異体をもたらした。これらの一般的な変異体は、疾患の確率的発症前リスクの評価において集団由来環境リスク因子データのように使用される。

ＧＣＩは、特定の数量のすべての推定のように、リスク推定に偏り得る仮定の設定を求める。特に、ＧＣＩスコアによってなされた仮定は、原因ＳＮＰの対立遺伝子頻度とエフェクトサイズが知られていること、且つ、ＳＮＰ‐ＳＮＰ相互作用が知られていることである。さらに、その仮定は、平均生涯リスクが知られているということである。これらの仮定は、実施において違反されるかもしれないが、本明細書中に記載したように、これらの仮定からのわずかな偏差がリスク推定を大きく変えることはない。特に、シミュレーション研究を通じて、及びＷＴＣＣＣデータの解析によって先の実施例で示されているように、弱いＳＮＰ‐ＳＮＰ相互作用は、ＧＣＩに対してほとんど影響が無く、生涯リスク推定におけるその偏差が、相対リスク推定の精度を変えることはない（図６もまた参照されたい）。

ＲＯＣ曲線は、疾患の平均生涯リスクが知られており、且つ、この値が該疾患の理論モデルに疾病状態を割り当てるためのカットオフ値を算定するのに使用されるという仮定に基づいている。しかしながら、集団データから入手可能な推定は不正確である可能性があり、そのような誤差が、疾患に罹るＧＣＩベースのリスクに大きく影響する。本明細書中の算定では、平均生涯リスクがこれらの推定（ＬＴＲ’）と等しいと仮定している。

算定に使用する仮定されたリスクの関数として疾患のＧＣＩベース平均生涯リスクと真の平均生涯リスクの間の誤差を、図６Ａに示したようにプロットする。仮定した平均生涯リスクの関数としてＧＣＩベースの平均生涯リスクと仮定した平均生涯リスクの間の絶対誤差を、図６Ｂに示したようにプロットする。

本開示の好ましい実施形態を本明細書中に示し説明してきたが、このような実施形態は例示のためにのみ提供されていることが当業者には明らかであろう。当業者にとっては、本開示から逸脱することなく、ここに多数の変形、変更、及び置換が存在するであろう。本明細書中に記載されている開示の実施形態に対する様々な代替手段を、実施形態の実施に際して利用できることを理解すべきである。以下の請求項は、本開示の範囲を定義するものであり、これらの実施形態の範囲内の方法及び構造、並びにその等価物は、それらによってカバーされることを意図している。

Claims

個体の疾患又は症状に関する環境遺伝複合指数（ＥＧＣＩ）スコアの作成方法であって、以下のステップ：
（ａ）前記個体の遺伝子サンプルからゲノムプロファイルを作成し；
（ｂ）前記個体から少なくとも１つの環境因子を入手し、この場合、前記の少なくとも１つの環境因子が前記疾患又は症状に関して少なくとも約１の相対リスクを有し；
（ｃ）コンピューターを使用して、前記ゲノムプロファイルと前記の少なくとも１つの環境因子からＥＧＣＩスコアを作成し；そして
（ｄ）前記コンピューターから入手し、出力した前記ＥＧＣＩスコアを、前記個体又は前記個体のヘルスケア管理者に報告すること、
を含む、方法。
前記相対リスクが、少なくとも約１．１、１．２、１．３、１．４、又は１．５である、請求項１に記載の方法。
前記相対リスクが、少なくとも約２、３、４、５、１０、１２、１５、２０、２５、３０、２５、４０、４５、又は５０である、請求項１に記載の方法。
前記の少なくとも１つの環境因子が、少なくとも約１のオッズ比（ＯＲ）を有する、請求項１に記載の方法。
前記ＯＲが、少なくとも約１．１、１．２、１．３、１．４、又は１．５である、請求項４に記載の方法。
前記ＯＲが、少なくとも約２、３、４、５、１０、１２、１５、２０、２５、３０、３５、４０、４５、又は５０である、請求項４に記載の方法。
前記の少なくとも１つの環境因子が、前記個体の出生地、居住場所、ライフスタイル状況；食生活、運動習慣、及び個人的な人間関係から成る群から選択される、請求項１に記載の方法。
前記ライフスタイル状況が、喫煙又はアルコール摂取である、請求項７に記載の方法。
前記の少なくとも１つの環境因子が、前記個体の身体計測値である、請求項１に記載の方法。
前記身体計測値が、前記個体のボディーマスインデックス、血圧、心拍数、グルコースレベル、代謝物レベル、イオンレベル、体重、身長、コレステロールレベル、ビタミンレベル、血球数、タンパク質レベル、及び転写物レベルから成る群から選択される、請求項９に記載の方法。
前記ＥＧＣＩスコアを作成するために、少なくとも２つの環境因子を使用する、請求項１に記載の方法。
前記ＥＧＣＩスコアを作成するために、前記の疾患又は症状に関する前記の少なくとも１つの環境因子が独立リスクファクターであると仮定する、請求項１に記載の方法。
前記の疾患又は症状が、約９５％未満の遺伝率を有する、請求項１に記載の方法。
前記の疾患又は症状が、約５％、１０％、１５％、２０％、２５％、３０％、３５％、４０％、４５％、５０％、５５％、６０％、６５％、７０％、７５％、８０％、８５％、又は９０％未満の遺伝率を有する、請求項１に記載の方法。
第三者が、前記遺伝子サンプルを入手する、請求項１に記載の方法。
前記ゲノムプロファイルを作成するのが第三者である、請求項１に記載の方法。
前記報告が、ネットワーク上での前記ＥＧＣＩスコアの伝達を含む、請求項１に記載の方法。
前記報告が、オンラインポータルを通じてなされる、請求項１に記載の方法。
前記報告が、紙によるか、又はｅメールによってなされる、請求項１に記載の方法。
前記報告が、セキュリティー保護された様式での報告を含む、請求項１に記載の方法。
前記報告が、セキュリティー保護されていない様式での報告を含む、請求項１に記載の方法。
前記遺伝子サンプルが、ＤＮＡである、請求項１に記載の方法。
前記遺伝子サンプルが、ＲＮＡである、請求項１に記載の方法。
前記遺伝子サンプルが、血液、毛髪、皮膚、唾液、精液、尿、糞便、汗、及び口腔粘膜サンプルから成る群から選択される生体サンプル由来である、請求項１に記載の方法。
前記個体のゲノムプロファイルが、セキュリティー保護されたデータベース又は金庫に預けられる、請求項１に記載の方法。
前記ゲノムプロファイルが、一塩基多型プロファイルである、請求項１に記載の方法。
前記ゲノムプロファイルが、トランケーション、挿入、欠失、又は反復を含んでなる、請求項１に記載の方法。
前記ゲノムプロファイルが、高密度ＤＮＡマイクロアレイを使用して作成される、請求項１に記載の方法。
前記ゲノムプロファイルが、ＲＴ‐ＰＣＲを使用して作成される、請求項１に記載の方法。
前記ゲノムプロファイルが、ＤＮＡ配列決定法を使用して作成される、請求項１に記載の方法。
（ｅ）環境的因子の追加又は修正を伴って前記ＥＧＣＩスコアを更新するステップをさらに含む、請求項１方法。