JP5976533B2

JP5976533B2 - 乳癌のリスク評価方法

Info

Publication number: JP5976533B2
Application number: JP2012513409A
Authority: JP
Inventors: ヒンズ，デイビッド，エー．; ウォルサー，ブライアン
Original assignee: ジェネティックテクノロジーズリミテッド
Priority date: 2009-06-01
Filing date: 2010-06-01
Publication date: 2016-08-23
Anticipated expiration: 2030-06-01
Also published as: CA2763500C; WO2010139006A1; CN102712949A; EP2438193B1; CN102712949B; AU2010256343A1; ES2546230T3; EP2438193A1; HK1168387A1; JP2012528573A; US11072830B2; BRPI1011979A2; CA2763500A1; US20180080089A1; US20110294681A1; AU2010256343B2; EP2438193A4; DK2438193T3; MX2011012913A; IL216627A

Description

発明の分野
本発明は、乳癌表現型の発症についてのヒト女性被験者の全体的なリスクを評価するための方法およびシステムに関する。特に、本発明は、臨床的リスク評価と遺伝的リスク評価を組み合わせてリスク分析を改善することに関する。

発明の背景
乳癌は、他の一般的な癌と同様に、家族内集積性(familial clustering)を示す。数多くの疫学的研究により、全体的に、この疾患は乳癌患者の一等親血縁者において約2倍多いことが実証されている。家族の研究、特に双子の研究は、この集積性のすべてとはいえないにしてもほとんどに遺伝的基礎があることを示唆している。例えば、PetoおよびMack (2000)は、罹患女性のMZ(一卵性)双子における乳癌のリスクが症例の姉妹へのリスクより約4倍高いと推定した。

いくつかの乳癌感受性遺伝子はすでに同定されており、最も重要なのがBRCA1とBRCA2である。これらの遺伝子の突然変異は乳癌のリスクを高くする(70歳までに、それぞれ65％および45％ほどのリスク)。乳癌症例の集団に基づくシリーズの変異スクリーニングは、乳癌の家族性リスクのほんの15％ほどがこれらの遺伝子の突然変異によって説明され得ることを示している。他の既知の乳癌感受性遺伝子(TP53、PTEN、ATM、CHEK2)は家族性リスクにごくわずかに寄与しているにすぎない(というのは、素因となる突然変異が稀であり、かつ/または小さなリスクしか与えないからである)。したがって、全体で、既知の乳癌感受性遺伝子は家族性リスクのせいぜい20％を占めるにすぎないと推定されている。

リスクの遺伝的変異は、稀な浸透率の高い突然変異(例えば、BRCA1およびBRCA2の変異)から、またはより中等度のリスクをもたらす変異体から生じる可能性がある。いくつかの証拠は、高浸透率の突然変異が乳癌の残りの家族性リスクの主原因ではないことを強く示唆している。第一に、多数の症例家族の変異スクリーニングによって、非常に強い家族歴(例えば、4人以上の罹患血縁者)のある症例の大多数はBRCA1またはBRCA2の突然変異をかかえていることがわかった。第二に、過去9年間にわたる広範な努力にもかかわらず、遺伝的連鎖研究はそれ以上の連鎖遺伝子座を同定しなかった。第三に、大規模シリーズの乳癌家族の分離比分析からは、BRCA1およびBRCA2について調整した後に、さらなる主要な優性の乳癌感受性対立遺伝子の証拠が見つからなかった。大規模な分析において、Antoniouら(2009)は、乳癌の最も節減のモデル(parsimonious model)が、相乗的に組み合わせる小さな効果の多数の遺伝子座に等しい、多座位遺伝子モデルであることを見いだした。

したがって、当技術分野で必要とされるものは、女性被験者の乳癌感受性を評価するためのさらなる方法である。

本発明は、乳癌表現型の発症についてのヒト女性被験者の全体的リスクを評価するための方法に関する。驚いたことに、本著者らは、一塩基多型を臨床的リスク評価と組み合わせることによって、臨床的リスク評価を単独で用いる場合に比べて、利点が得られることを見いだした。したがって、第1の態様において、本発明は、乳癌表現型の発症についてのヒト女性被験者の全体的リスクを評価する方法であって、以下のステップを含む方法を提供する：
女性被験者の臨床的リスク評価を行うステップ；
女性被験者の遺伝的リスク評価を行うステップであって、遺伝的リスク評価が、女性被験者由来の生物学的サンプル中で、乳癌表現型と関連することが知られている少なくとも2個の一塩基多型の存在を検出することを含む、ステップ；および
臨床的リスク評価を遺伝的リスク評価と組み合わせることによって、乳癌表現型の発症についてのヒト女性被験者の全体的リスクを取得するステップ。

本発明はまた、臨床的リスク評価を用いて分析されている被験者を再分類するのに有用である。したがって、さらなる態様において、本発明は、臨床的リスク評価によって分析された、乳癌表現型の発症についてのヒト女性被験者の全体的リスクが再分類されるべきかどうかを判定する方法であって、以下のステップを含む方法を提供する：
臨床的リスク評価を遺伝的リスク評価と組み合わせることによって、乳癌表現型の発症についてのヒト女性被験者の全体的リスクを取得するステップであって、遺伝的リスク評価が、女性被験者由来の生物学的サンプル中で、乳癌表現型と関連することが知られている少なくとも2個の一塩基多型の存在を検出することを含む、ステップ；および
臨床的リスク評価を遺伝的リスク評価と組み合わせることが、乳癌表現型の発症についての該被験者のリスクの再分類につながるかどうか、を判定するステップ。

一実施形態において、前記方法の純再分類改善(net reclassification improvement: NRI)は0.01より高く、より好ましくは0.05より高く、さらに好ましくは0.08より高い。さらなる実施形態では、NRIが約0.09である。

一実施形態においては、臨床的リスク評価により決定された5年リスクが約1.5％〜約2％である。この実施形態では、前記方法の純再分類改善(NRI)が0.1より高く、より好ましくは0.12より高く、さらに好ましくは0.15より高いことが好適である。さらなる実施形態では、NRIが約0.195である。

適切な臨床的リスク評価法の例としては、限定するものではないが、Gailモデル、Clausモデル、Clausテーブル、BOADICEA、Jonkerモデル、Claus拡張式、Tyrer-Cuzickモデル、およびManchesterスコアリングシステムが挙げられる。好ましくは、臨床的リスク評価がGailモデルを用いて得られる。

一実施形態において、臨床的リスク評価には、女性から以下の項目の1つ以上に関する情報を取得することが含まれる：乳癌、乳管癌または小葉癌の病歴、年齢、初潮年齢、初産年齢、乳癌の家族歴、以前の乳房生検の結果、および人種/民族。

好ましくは、前記方法は、乳癌表現型と関連することが知られている少なくとも3、4、5、6、7、8、9または10個の一塩基多型の存在を検出することを含む。より好ましくは、前記方法は、乳癌表現型と関連することが知られている7、8、9または10個の一塩基多型の存在を検出することを含む。

好ましい実施形態において、一塩基多型はrs2981582、rs3803662、rs889312、rs13387042、rs13281615、rs4415084、およびrs3817198、またはこれらの1つ以上と連鎖不平衡にある一塩基多型からなる群より選択される。他の好ましい実施形態では、一塩基多型がrs2981582、rs3803662、rs889312、rs13387042、rs13281615、rs4415084、rs3817198、rs4973768、rs6504950およびrs11249433、またはこれらの1つ以上と連鎖不平衡にある一塩基多型からなる群より選択される。これら2つの実施形態に関して、前記方法は少なくとも3、4、5、6、7、8、9または10個の一塩基多型、より好ましくは7、8、9または10個の一塩基多型、の存在を検出することを含む。

一実施形態において、一塩基多型は、共変量のない対数加法モデルの下でロジスティック回帰により、乳癌との関連性について個別に検定される。

別の実施形態では、一塩基多型が乳癌との関連性について組合せで検定される。

好ましくは、臨床的リスク評価を遺伝的リスク評価と組み合わせることが、これらのリスク評価を乗算することを含む。

女性はどのような人種であってもよく、例えば、白人（コーカソイド）、黒人（ネグロイド）、オーストラロイド、またはモンゴロイドであり得る。好ましい実施形態において、女性は白人である。好ましくは、女性は閉経後の女性である。

驚いたことに、本発明者らは、一塩基多型の解析を臨床的リスク評価と組み合わせると、以前に乳房の生検を受けている女性では明らかな利点が得られることを見いだした。したがって、好ましい実施形態において、女性は乳房の生検を受けたことがある女性である。

本発明者らはまた、一塩基多型解析を臨床的リスク評価と組み合わせることが、臨床的リスク評価によって乳癌発症リスクのあることが示された女性の予想される再分類に明らかな恩恵をもたらすことを見いだした。したがって、別の好ましい実施形態において、臨床的リスク評価の結果は、女性がより頻繁なスクリーニングおよび/または予防的抗乳癌療法を受けるべきであることを示す。

さらなる実施形態において、被験者が本発明の方法を用いて乳癌の発症リスクがあると判定される場合、その被験者は非応答性というよりもエストロゲン抑制に応答性である可能性が高い。

さらなる態様において、本発明は、乳癌表現型の発症についてのヒト女性被験者の全体的リスクを評価するためのシステムであって、以下を含むシステムを提供する：
女性被験者の臨床的リスク評価を行うためのシステム命令；
女性被験者の遺伝的リスク評価を行うためのシステム命令；および
乳癌表現型の発症についてのヒト女性被験者の全体的リスクを取得するために、臨床的リスク評価を遺伝的リスク評価と組み合わせるためのシステム命令。

好ましくは、前記システムはコンピュータにより実行されるシステムである。

一実施形態において、前記システムは以下をさらに含む：
女性被験者由来の生物学的サンプル中で、乳癌表現型と関連することが知られている少なくとも2個の一塩基多型の存在を検出するように構成されたマーカープローブもしくはプライマーのセット；
そのマーカープローブもしくはプライマーのセット、またはそのマーカープローブもしくはプライマーのセットから生成されたアンプリコンからの1以上の信号出力を検出し、それによって乳癌表現型と関連することが知られている少なくとも2個の一塩基多型の存在または非存在を識別するように構成された検出器。

一実施形態において、検出器は1以上の発光を検出するものであり、その発光が一塩基多型の存在または非存在を示す。

さらなる実施形態において、前記システムは女性被験者由来の生物学的サンプルを含む。さらなる実施形態では、そのサンプルはゲノムDNA、増幅ゲノムDNA、cDNA、増幅cDNA、RNAまたは増幅RNAを含む。

さらに別の態様において、本発明は、2つ以上の核酸を増幅するための少なくとも2つのプライマーセットを含むキットを提供し、ここにおいて、前記2つ以上の核酸は、rs2981582、rs3803662、rs889312、rs13387042、rs13281615、rs4415084、rs3817198、rs4973768、rs6504950およびrs11249433、またはこれらの1つ以上と連鎖不平衡にある一塩基多型からなる群より選択される一塩基多型を含む。

本発明のキットに適するプライマーの例は表6に提供される。

キットはさらに、増幅反応を行うのに必要な他の試薬類、例えばバッファー、ヌクレオチドおよび/またはポリメラーゼ、ならびにサンプルから核酸を抽出するための試薬を含むことができる。

さらなる態様において、本発明は、rs2981582、rs3803662、rs889312、rs13387042、rs13281615、rs4415084、rs3817198、rs4973768、rs6504950およびrs11249433、またはこれらの1つ以上と連鎖不平衡にある一塩基多型からなる群より選択される一塩基多型を独立して含む、少なくとも2つの核酸を含む遺伝子アレイを提供する。

好ましくは、前記アレイは各SNPのそれぞれの既知の対立遺伝子に相当する核酸を含む。

さらなる態様において、本発明は、本発明の方法を用いて、乳癌表現型の発症についてのヒト女性被験者の全体的リスクを評価することを含む、乳癌についてのヒト女性被験者の定期的診断検査の必要性を判定する方法を提供する。

さらに別の態様において、本発明は、ヒト女性被験者における乳癌のスクリーニング方法を提供し、この方法は、本発明の方法を用いて、乳癌表現型の発症についての女性被験者の全体的リスクを評価し、それらが乳癌の発症リスクをもつと評価される場合には、該被験者において乳癌を定期的にスクリーニングすることを含む。

適当な乳癌スクリーニング方法の例としては、手動による乳房検診およびマンモグラフィーが挙げられるが、これらに限定されない。

さらなる態様において、本発明は、本発明の方法を用いて、乳癌表現型の発症についてのヒト女性被験者の全体的リスクを評価することを含む、予防的抗乳癌療法についてのヒト女性被験者の必要性を判定する方法を提供する。

さらに別の態様において、本発明は、ヒト女性被験者における乳癌の予防方法を提供し、この方法は、本発明の方法を用いて、乳癌表現型の発症についての女性被験者の全体的リスクを評価し、それらが乳癌の発症リスクをもつと評価される場合には、該被験者に抗乳癌療法を行うことを含む。

適当な抗乳癌療法の例としては、タモキシフェンまたはラロキシフェンの投与が挙げられるが、これらに限定されない。

一実施形態では、前記療法がエストロゲンを抑制するものである。

さらなる態様において、本発明は、候補治療法の臨床試験のためにヒト女性被験者のグループを層別化する方法を提供し、この方法は、本発明の方法を用いて、乳癌表現型の発症についての各被験者の全体的リスクを評価し、その評価の結果を用いて該治療法に応答する可能性が高い被験者を選別することを含む。

明らかなように、本発明の方法、キットおよびシステムの少なくともいくつかの特徴は、組み合わせて一緒に使用することが可能である。例えば、モジュレーターを検出するためのシステムはモジュレーターの検出方法を実施するために使用できる。乳癌表現型の感受性と遺伝子多型との相関関係を調べるためのシステムは、本明細書に記載の方法を実施するために使用できる。キットは本明細書に記載の方法を実施するために使用可能である。したがって、前記システム、方法およびキットの記載した特徴は、本明細書に記載の異なるシステム、方法およびキットに応用することができる。

本明細書全体を通して、用語「含む」、または「含み」もしくは「含んでいる」などの変形は、記載した1つの要素、整数もしくはステップ、または要素、整数もしくはステップのグループを含めるが、その他の要素、整数もしくはステップ、または要素、整数もしくはステップのグループを除外するものでない、ことを意味すると解される。

本発明は、次の非限定的な実施例を用いて、また、添付の図面を参照して、以下に説明される。

10-SNPリスクスコアのキャリブレーションを評価するためのHosmer-Lemeshow検定の結果を示す。組合せ7-SNPおよび10-SNPリスクスコアについての受信者動作特性曲線(receiver operating characteristic curve)を示す。

発明の詳細な説明
一般的な技術および定義
特に他で定義しない限り、本明細書中で用いるすべての技術および科学用語は、当業者(例えば、細胞培養、乳癌解析、分子遺伝学、免疫学、免疫組織化学、タンパク質化学、および生化学の当業者)が一般に理解しているものと同じ意味をもつと解される。

特に指示がない限り、本発明において利用する組換えタンパク質、細胞培養、および免疫学的技法は、当業者によく知られている標準方法である。そうした技術は、例えば、以下の情報源の文献全体に記載され、かつ説明されている：J. Perbal, A Practical Guide to Molecular Cloning, John Wiley and Sons (1984); J. Sambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbour Laboratory Press (1989); T.A. Brown (編), Essential Molecular Biology: A Practical Approach, Volumes 1 and 2, IRL Press (1991); D.M. Glover and B.D. Hames (編), DNA Cloning: A Practical Approach, Volumes 1-4, IRL Press (1995 and 1996); およびF.M. Ausubel et al. (編), Current Protocols in Molecular Biology, Greene Pub. Associates and Wiley-Interscience (1988, 現在までのすべての改訂を含む); Ed Harlow and David Lane (編) Antibodies: A Laboratory Manual, Cold Spring Harbour Laboratory, (1988)；およびJ.E. Coligan et al. (編) Current Protocols in Immunology, John Wiley & Sons (現在までのすべての改訂を含む)。

本発明は、特定の実施形態に限定されず、当然変更可能であることを理解すべきである。また、本明細書中で用いる専門用語は、特定の実施形態のみを説明する目的のためであって、限定するためのものでないことを理解すべきである。本明細書および添付の特許請求の範囲で用いるとき、単数での用語および単数形「a」、「an」および「the」は、例えば、その内容が明らかに他に指示しない限り、場合により複数の指示対象を含むことがある。したがって、「プローブ」(単数)への言及は、場合により、複数のプローブ分子を含む；同様に、文脈の前後関係に応じて、用語「核酸」(単数)の使用は、実際問題として、その核酸分子の多コピーを、場合により含むことがある。

本明細書中で用いる「乳癌表現型」とは、個人において乳癌を発症しやすい素因を示す表現型のことである。乳癌の素因を示す表現型は、例えば、所定のセットの環境条件(食事、身体活動状況、地理的位置など)のもとで、関係する一般集団のメンバーよりも、その表現型をもつ個人において乳癌が発生する可能性が高いことを示す。

本明細書中で用いる「生物学的サンプル」とは、ヒト患者に由来する任意のサンプル、例えば、体液(血液、唾液、尿など)、生検材料、組織、および/または患者からの廃棄物をさす。したがって、組織生検、便、痰、唾液、血液、リンパ液、涙、汗、尿、膣分泌物などはSNPを容易にスクリーニングすることができ、適切な核酸を含む本質的にどのような対象の組織でも同様にスクリーニング可能である。こうしたサンプルは通常、インフォームド・コンセントを得てから、標準的な医療検査法によって患者から採取される。サンプルは、患者から直接採取した形態のものでもよいし、少なくとも一部の非核酸物質を除くために少なくとも部分的に処理(精製)したものでもよい。

「多型」とは可変性の座位である。すなわち、集団内で、多型のヌクレオチド配列は1つより多い型または対立遺伝子をもつ。多型の一例は、ゲノム中の一塩基の位置で多型となる「一塩基多型」である(特定位置の塩基が個人間または集団間で変化する)。

本明細書中で用いる「SNP」または「一塩基多型」とは、個人間の遺伝的変異をさす。例えば、生物のDNA中の単一窒素含有塩基位置は可変的である。本明細書中で用いる「SNPs（SNP）」はSNPの複数形である。当然のことながら、本明細書中でDNAに言及するとき、そうした言及は、アンプリコン、そのRNA転写産物などのDNAの誘導体を含むことがある。

用語「対立遺伝子」または「アレル」は、特定の座位に存在するまたはコード化される2つ以上の異なるヌクレオチド配列の1つ、あるいはそのような座位によってコードされた2つ以上の異なるポリペプチド配列の1つをさす。例えば、第1の対立遺伝子は一方の染色体上に存在し、同時に第2の対立遺伝子は第2の相同染色体上に存在すると考えられ、例えば、こうしたことはヘテロ接合個体の異なる染色体に起こるか、または集団内の異なるホモ接合もしくはヘテロ接合個体間に起こる。ある対立遺伝子がある形質に関連づけられる場合、そしてその対立遺伝子の存在が、該対立遺伝子を含む個人においてその形質または形質の形態が発生することの指標となる場合に、その対立遺伝子はその形質と「正」に相関している。ある対立遺伝子がある形質に関連づけられる場合、そしてその対立遺伝子の存在が、該対立遺伝子を含む個人においてその形質または形質の形態が発生しないことの指標となる場合に、その対立遺伝子はその形質と「負」に相関している。

マーカー多型または対立遺伝子は、それを特定の表現型と統計的に(正または負に)関連づけることができる場合に、その特定の表現型(乳癌感受性など)と「相関」または「関連」している。多型または対立遺伝子が統計的に関連づけられるかどうかを判定する方法は当業者に知られている。すなわち、特定の多型は、対照集団(例えば、乳癌でない個体)よりも症例集団(例えば、乳癌患者)に、より多く発生する。この相関関係はしばしば自然界で因果関係にあると推測されるが、それは、相関/関連が起こるのに十分な、その表現型の根底にある形質の座位への単純な遺伝的連鎖(該座位との関連)であるとは限らない。

用語「連鎖不平衡」(LD)は、2つの隣接する多型遺伝子型間の統計学的相関を説明するために用いられる。一般的には、LDは、配偶子間にHardy-Weinberg平衡(統計的独立性)があると仮定して、2座位における無作為配偶子の対立遺伝子間の相関をさす。LDはLewontinの関連パラメーター(D')またはPearsonの相関係数(r)のいずれかにより定量化される(Devlin and Risch, 1995)。LD値が1である2つの座位は完全LDにあるといわれる。もう一方の極端な場合で、LD値が0である2つの座位は連鎖平衡にあると呼ばれる。連鎖不平衡は、ハプロタイプ頻度を推定するための期待値最大化アルゴリズム(EM)の適用に従って計算される(Slatkin and Excoffier, 1996)。隣接する遺伝子型/座位についての本発明に係るLD値は、0.1以上、好ましくは0.2以上、より好ましくは0.5以上、より好ましくは0.6以上、さらに好ましくは0.7以上、好ましくは0.8以上、さらに好ましくは0.9以上、理想的には約1.0を選択される。

「対立遺伝子頻度」とは、個体内で、系列内で、または系列の集団内で、ある対立遺伝子がある座位に存在する頻度(割合またはパーセンテージ)をさす。例えば、対立遺伝子「A」について、遺伝子型「AA」、「Aa」または「aa」の二倍体個体はそれぞれ1.0、0.5または0.0の対立遺伝子頻度を有する。系列または集団(例えば、症例または対照)内での対立遺伝子頻度は、その系列または集団からの個体のサンプルの対立遺伝子頻度を平均化することによって推定され得る。同様に、系列の集団内での対立遺伝子頻度は、その集団を構成している系列の対立遺伝子頻度を平均化することによって算出することができる。

個体が所定の座位にただ1つの型の対立遺伝子をもつ場合、その個体は「ホモ接合」である(例えば、二倍体の個体は2つの相同染色体のそれぞれの座位に同じ対立遺伝子のコピーを有する)。1つより多い対立遺伝子型が所定の座位に存在する場合、その個体は「ヘテロ接合」である(例えば、二倍体の個体は2つの異なる対立遺伝子を1コピーずつ有する)。用語「同質性（homogeneity）」は、グループのメンバーが1以上の特定の座位に同じ遺伝子型をもつことを示している。これに対して、用語「異質性（heterogeneity）」は、グループ内の個体が1以上の特定の座位で遺伝子型が異なることを示すために用いられる。

「座位」(locus)は染色体の位置または領域である。例えば、多型座位は、多型の核酸、形質決定基、遺伝子またはマーカーが配置されている位置または領域である。別の例において、「遺伝子座」(gene locus)は、特定の遺伝子が存在する、生物種のゲノム中の特定の染色体位置(領域)である。

「マーカー」、「分子マーカー」または「マーカー核酸」とは、ある座位または連鎖座位を同定する際に基準として用いられるヌクレオチド配列またはそのコード化産物(例えば、タンパク質)をさす。マーカーはゲノムヌクレオチド配列もしくは発現されたヌクレオチド配列(例えば、RNA、nRNA、mRNA、cDNAなど)から、またはコードされたポリペプチドに由来し得る。この用語はまた、マーカー配列を増幅できるプローブまたはプライマー対として用いられる核酸など、マーカー配列に相補的なまたはマーカー配列に隣接する核酸配列をも意味する。「マーカープローブ」は、マーカー座位の存在を同定するために使用できる核酸配列または分子であり、例えば、マーカー座位配列に相補的な核酸プローブである。核酸は、例えばワトソン・クリック型塩基対形成規則に従って、それらが溶液中で特異的にハイブリダイズするとき「相補的」である。「マーカー座位」は、第2の連鎖座位(例えば、ある表現型形質の集団変異をコードするまたはそれに寄与する連鎖したまたは相関した座位)の存在を追跡するために使用できる座位である。例えば、マーカー座位は、そのマーカー座位と遺伝的にまたは物理的に連鎖している、QTLのような座位での対立遺伝子の分離をモニタリングするために使用できる。こうして、「マーカー対立遺伝子」、あるいは「マーカー座位の対立遺伝子」は、マーカー座位について多型である集団内でそのマーカー座位に見られる複数の多型ヌクレオチド配列のうちの1つである。一態様において、本発明は、対象の表現型(例えば、乳癌感受性/抵抗性)と相関するマーカー座位を提供する。同定されたマーカーのそれぞれは、関係する表現系に寄与する遺伝要素(例えば、QTL)に物理的および遺伝的に極めて近接している(物理的および/または遺伝的連鎖をもたらす)と期待される。集団のメンバー間の遺伝的多型に対応するマーカーは、当技術分野で十分に確立された方法によって検出することができる。それらには、例えば、以下の方法が含まれる：PCRに基づく配列特異的増幅法、制限断片長多型(RFLP)の検出、アイソザイムマーカーの検出、対立遺伝子特異的ハイブリダイゼーション(ASH)の検出、一塩基伸長の検出、ゲノムの増幅可変配列の検出、自己持続配列複製の検出、単純反復配列(SSR)の検出、一塩基多型(SNP)の検出、または増幅断片長多型(AFLP)の検出。

核酸増幅に関しての用語「増幅する」とは、選択された核酸(またはその転写形態)の追加のコピーが生成されるプロセスのことである。典型的な増幅法としては、ポリメラーゼ連鎖反応(PCR)を含むさまざまなポリメラーゼベースの複製法、リガーゼ連鎖反応(LCR)などのリガーゼが介在する方法、およびRNAポリメラーゼベースの増幅(例えば、転写による)方法が含まれる。

「アンプリコン」は増幅された核酸であり、例えば、いずれかの利用可能な増幅法(例えば、PCR、LCR、転写など)でテンプレート核酸を増幅することによって生成された核酸である。

特定の核酸が所定の核酸の配列を用いて構成されるとき、または特定の核酸が所定の核酸を用いて構成されるとき、特定の核酸はその所定の核酸に「由来する」ものである。

「遺伝子」は、1つ以上の発現分子(例えば、RNAまたはポリペプチド)を一緒になってコードする、ゲノム中の1つ以上のヌクレオチドの配列である。遺伝子はコード配列(RNAに転写され、続いてポリペプチド配列に翻訳される)を含むことができ、また、その遺伝子の複製または発現に役立つ、関連した構造または調節配列を含むことができる。

「遺伝子型」とは、1つ以上の遺伝子座での個体(または個体群)の遺伝的な構成のことである。遺伝子型は、個体の1つ以上の既知の座位の対立遺伝子により、典型的にはその両親から受け継いだ対立遺伝子の集まりにより、特定される。

「ハプロタイプ」とは、1本のDNA鎖上の複数の遺伝子座での個体の遺伝子型のことである。典型的には、ハプロタイプにより記述される遺伝子座は、物理的および遺伝的に連鎖しており、すなわち、同じ染色体鎖の上にある。

マーカー、プローブまたはプライマーの「セット」とは、共通の目的のために、例えば特定の遺伝子型(例えば、乳癌を発症するリスク)をもつ個体を識別するために、用いられるマーカー、プローブ、プライマー、もしくはそれから誘導されたデータ、のコレクションまたはグループをさす。多くの場合、マーカー、プローブもしくはプライマーに対応するデータ、つまりそれらの使用から誘導されたデータは、電子媒体に保存される。1セットの各メンバーは特定の目的に関して有用性がある一方で、そのセットならびにサブセット(マーカーの全部ではなく、一部を含む)から選択された個々のマーカーもまた、特定の目的を達成する上で有効である。

上記の多型および遺伝子、ならびに対応するマーカープローブ、アンプリコンまたはプライマーは、本明細書に記載の任意のシステムに、物理的な核酸の形でまたはその核酸の配列情報を含むシステム命令の形で、取り入れることができる。例えば、そのシステムは本明細書に記載する遺伝子もしくは多型に対応する(または遺伝子もしくは多型の一部を増幅する)プライマーまたはアンプリコンを含むことができる。上記の方法と同様に、マーカープローブまたはプライマーのセットは、必要に応じて、複数の前記遺伝子または遺伝子座における複数の多型を検出する。したがって、例えば、マーカープローブまたはプライマーのセットは、これらの多型もしくは遺伝子のそれぞれにおける少なくとも1つの多型、または本明細書中で定める他のいずれかの多型、遺伝子または座位を検出する。そのようなプローブまたはプライマーは、そのような多型もしくは遺伝子、その相補的核酸、またはその転写産物(例えば、ゲノム配列から、例えば転写またはスプライシングにより、生成されたnRNAまたはmRNAの形態)のヌクレオチド配列を含むことができる。

本明細書中で用いる「ロジスティック回帰」とは、ロジスティック曲線にデータを適合させることによってイベントの発生確率を予測するための方法をさす。当業者は、本発明との関連においてそうした方法をいかに利用すべきかを理解している。

本明細書中で用いる「Hosmer-Lemeshow検定」とは、適合性の欠如を測定するための統計学的方法をさす。そうした検定の使用方法は当技術分野で周知である(Hosmer DW, Lemeshow S. Applied Logistic Regression. New York: Wiley; 1989: Section 5.2.2)。

本明細書中で用いる「受信者動作特性曲線」とは、その識別閾値が変化するときのバイナリ分類子システム(binary classifier system)のための感度と(1−特異度)のグラフィカルなプロットをさす。このROCはまた、真陽性の割合(TPR＝真陽性率)と偽陽性の割合(FPR＝偽陽性率)をプロットすることによっても同等に表すことができる。それは基準変更としての2つの動作特性(TPR & FPR)の比較であるため、相対的動作特性曲線とも呼ばれている。ROC解析は、費用状況(cost context)またはクラス分布から独立して(かつそれを特定する前に)、できる限り最適なモデルを選択し、準最適なモデルを捨てるためのツールを提供する。ROC解析は診断意思決定の費用便益分析に直接的かつ自然な形で関係している。ROC曲線は、戦場で敵の物体を検出するために第二次世界大戦中に電気技師とレーダー技師によって最初に開発されたものであって、信号検出理論としても知られており、そして信号の知覚的検出を説明するために心理学にすぐに導入されたものである。それ以来、ROC解析は何十年にもわたり医学、放射線学、その他の分野で使用されてきており、比較的最近では、それが機械学習およびデータマイニングのような他の分野にも導入されている。本発明に関連した使用方法は、当業者には明らかだろう。

本明細書中で用いる「臨床的リスク評価を遺伝的リスク評価と組み合わせて全体的なリスクを取得する」とは、これら2つの評価の結果に依存する、いずれかの適切な数学的解析をさす。例えば、臨床的リスク評価と遺伝的リスク評価の結果が加算される、より好ましくは乗算される。

本明細書中で用いる「乳癌の定期的なスクリーニング」および「より頻繁なスクリーニング」という用語は相対的な用語であり、乳癌の発症リスクが確認されていない被験者に推奨されるスクリーニングのレベルとの比較に基づいている。

臨床的リスク評価
本発明では、任意の適切な臨床的リスク評価方法を使用することができる。好ましくは、臨床的リスク評価は1つ以上の座位で女性をジェノタイピングすることを含まない。一実施形態では、臨床的リスク評価方法が以下の項目の1つ以上に関して女性から情報を取得することを含む：乳癌、乳管癌または小葉癌の病歴、年齢、初潮年齢などの月経歴、初産年齢、乳癌や他の癌の家族歴(診断時の血縁者の年齢を含む)、以前の乳房生検の結果、経口避妊薬の使用、肥満度指数、飲酒歴、喫煙歴、運動歴および人種/民族。臨床的リスク評価方法の例としては、限定するものではないが、以下の方法が挙げられる：Gailモデル(Gail et al., 1989, 1999 and 2007; Costantino et al., 1999; Rockhill et al., 2001)、Clausモデル(Claus et al., 1994 and 1998)、Clausテーブル、BOADICEA (Antoniou et al., 2002 and 2004)、Jonkerモデル(Jonker et al., 2003)、Claus拡張式(van Asperen et al., 2004)、Tyrer-Cuzickモデル(Tyrer et al., 2004)、Manchesterスコアリングシステム(Evans et al., 2004)など。好ましい実施形態では、臨床的リスク評価方法がGailモデルである。

Gailモデルは、NCI癌疫学・遺伝学部門の生物統計学科の主任研究員であるMitchell Gail博士にちなんで名付けられた、乳癌リスク評価ツールの基礎を構成する統計学的モデルである。このモデルは、女性自身の個人的病歴(以前の乳房生検の数および以前の乳房生検標本における非定型過形成の存在)、女性自身の妊娠歴(月経開始年齢および初産年齢)、および女性の一等親血縁者(母親、姉妹、娘)間での乳癌歴を用いて、特定の期間にわたって浸潤性乳癌を発症するリスクを推定するものである。このモデルの開発には、35〜74歳の280,000人の女性が参加した米国国立癌研究所(NCI)と米国癌協会(American Cancer Society)との共同の乳癌スクリーニング研究であるBreast Cancer Detection Demonstration Project (BCDDP)からのデータと、NCIのSurveillance, Epidemiology, and End Results (SEER)プログラムからのデータが用いられた。アフリカ系アメリカ人女性の予測値は、Women's Contraceptive and Reproductive Experiences (CARE)研究からのデータとSEERからのデータがベースになった。CAREの参加者には、浸潤性乳癌に罹患した女性1,607人と非罹患女性1,637人が含まれていた。

Gailモデルは白人女性の大規模集団において試験されており、乳癌リスクの正確な推定値を提供することが示されている。言い換えれば、このモデルは白人女性に「妥当である」ことが確認されている。これはまた、アフリカ系アメリカ人女性についてもWomen's Health Initiativeからのデータで試験されており、このモデルは十分に機能するものの、以前に生検を受けたアフリカ系アメリカ人女性ではリスクを過小評価する可能性がある。このモデルはまだ、ヒスパニック系女性、アジア系女性および他のサブグループについての妥当性を検証する必要があり、また、特別な危険因子をもつ女性(例えば、胸部への放射線によりホジキン病の治療を受けた女性、および乳癌リスクを高める遺伝子変異の保持者など)については、その結果を医療供給者が解明する必要がある。研究者らは、より多くのデータを収集するために、また、このモデルを試験して改善するために、少数集団を用いる研究を含めて、さらなる研究を実施中である。

遺伝的リスク評価
遺伝的リスク評価は、乳癌表現型と関連することが知られている一塩基多型について、2つ以上の座位での被験者の遺伝子型を解析することによって行われる。当業者には理解されるように、各SNPは1.0より高い、より好ましくは1.02より高い、乳癌との関連性のオッズ比を有する。そのようなSNPの例としては、限定するものではないが、rs2981582、rs3803662、rs889312、rs13387042、rs13281615、rs4415084、rs3817198、rs4973768、rs6504950、rs11249433、rs10941679、rs2180341、rs3744448、rs16943468、rs1011970、rs2380205、rs10995190、rs704010およびrs614367と指定されたもの(表1参照)、またはそれらの1つ以上と連鎖不平衡にある一塩基多型が挙げられる。

好ましい実施形態において、一塩基多型はrs2981582、rs3803662、rs889312、rs13387042、rs13281615、rs4415084、およびrs3817198、またはそれらの1つ以上と連鎖不平衡にある一塩基多型からなる群より選択される。さらに好ましい実施形態では、一塩基多型はrs2981582、rs3803662、rs889312、rs13387042、rs13281615、rs4415084、rs3817198、rs4973768、rs6504950およびrs11249433、またはそれらの1つ以上と連鎖不平衡にある一塩基多型からなる群より選択される。

当業者は、本明細書中で特に挙げたものと連鎖不平衡にあるSNPを容易に同定することができる。そのようなSNPの例には、rs2981582と強い連鎖不平衡にあるrs1219648およびrs2420946(さらなる可能な例を表2に示す)、SNP rs3803662と強い連鎖不平衡にあるrs12443621およびrs8051542(さらなる可能な例を表3に示す)、ならびにSNP rs4415084と強い連鎖不平衡にあるrs10941679(さらなる可能な例を表4に示す)が含まれる。さらに、rs13387042と連鎖不平衡にあるSNPの例を表5に提供する。

好ましい実施形態において、2つ以上のSNPには、rs2981582またはそれと連鎖不平衡にあるSNP(rs1219648またはrs2420946など)が少なくとも含まれる。より好ましくは、2つ以上のSNPには、rs3803662およびrs889312、またはそれらと連鎖不平衡にあるSNPが少なくとも追加的に含まれる。より一層好ましくは、2つ以上のSNPには、rs13387042およびrs4415084、またはそれらと連鎖不平衡にあるSNPが少なくともさらに追加的に含まれる。

マーカー増幅戦略
マーカー(例えば、マーカー座位)を増幅するための増幅プライマー、およびそのようなマーカーを検出するための、または複数のマーカー対立遺伝子に関してサンプルをジェノタイピングするための適切なプローブが本発明で使用される。例えば、ロングレンジPCRのためのプライマー選択はUS 10/042,406およびUS 10/236,480に記載される；ショートレンジPCRについては、US 10/341,832がプライマー選択に関しての指針を提供する。さらに、プライマーの設計に利用できる「Oligo」のようなプログラムが一般に入手可能である。そうした入手可能なプライマー選択・設計ソフトウェア、公表されているヒトゲノム配列および多型位置を用いて、当業者は、本発明を実施するためにSNPを増幅するプライマーを構築することができる。さらに、SNPを含む核酸(例えば、SNPを含むアンプリコン)の検出に用いられる正確なプローブは異なることがあり、例えば、検出すべきマーカーアンプリコンの領域を同定できるプローブであれば、どれも本発明において使用できることが理解されるだろう。さらに、検出プローブの形状も当然異なっていてよい。したがって、本発明は本明細書に記載した配列に限定されない。

実際、増幅はマーカー検出のための必要条件ではなく、例えば、ゲノムDNAのサンプルについてサザンブロットを行うだけで非増幅ゲノムDNAを直接検出できる、ことが理解されるだろう。サザンブロッティング、標準的な増幅反応(PCR、LCRなど)および他の多くの核酸検出方法を行うための手順は十分に確立されており、例えばSambrook et al. (前出)に教示されている。

さらに、個別の検出プローブは、例えばリアルタイム増幅反応を行うことによって、省くことが可能であり、そのリアルタイム増幅反応では、産物の生成が、産物への取り込み時の関連する増幅プライマーの修飾により、アンプリコンへの標識ヌクレオチドの取り込みにより、または非増幅前駆体と比べたときのアンプリコンの分子回転特性の変化を(例えば、蛍光偏光により)モニタリングすることにより、検出される。

一般的に、分子マーカーは、当技術分野で利用可能な任意の確立された方法により検出され、そうした方法として、限定するものではないが、以下が挙げられる：対立遺伝子特異的ハイブリダイゼーション(ASH)、一塩基伸長の検出、アレイハイブリダイゼーション(場合によりASHを含む)、または一塩基多型(SNP)を検出するための他の方法、増幅断片長多型(AFLP)の検出、増幅可変配列の検出、ランダム増幅多型DNA (RAPD)の検出、制限断片長多型(RFLP)の検出、自己持続配列複製の検出、単純反復配列(SSR)の検出、一本鎖高次構造多型(SSCP)の検出、アイソザイムマーカーの検出、ノーザン分析(発現レベルをマーカーとして用いる)、mRNAまたはcDNAの定量的増幅など。

乳癌表現型と関連することが知られているSNPを含む核酸の増幅に有用なオリゴヌクレオチドプライマーの例は表6に提供される。当業者には理解されるように、これらのオリゴヌクレオチドがハイブリダイズするゲノム領域の配列は、以下のプライマーを設計するために使用することができる：5'および/または3'末端でより長い、あるいは(末端切断型がまだ増幅に使用できる限りでは)5'および/または3'末端でより短いプライマー、1個または数個のヌクレオチド差異を有する(しかし、それでもなお増幅に使用できる)プライマー、あるいは提供されたものと配列類似性を共有しないが、提供された特定のオリゴヌクレオチドがハイブリダイズする領域に近いゲノム配列に基づいて設計されて、依然として増幅に使用できるプライマー。

マーカー検出のための代表的技法
集団のメンバー間の遺伝的多型に対応するマーカーは、当技術分野で十分に確立された多数の方法によって検出することができ、例えば、PCRに基づく配列特異的増幅、制限断片長多型(RFLP)、アイソザイムマーカー、ノーザン分析、対立遺伝子特異的ハイブリダイゼーション(ASH)、アレイベースのハイブリダイゼーション、ゲノムの増幅された可変配列、自己持続配列複製、単純反復配列(SSR)、一塩基多型(SNP)、ランダム増幅多型DNA (「RAPD」)または増幅断片長多型(AFLP)などがある。さらなる実施形態では、分子マーカーの存在または非存在が、単に多型マーカー領域の塩基配列を解析することによって識別される。こうした方法はどれもハイスループット解析に容易に適合させることができる。

遺伝的マーカーを検出するための一部の技法は、遺伝的マーカーに対応する核酸(例えば、ゲノムDNAを鋳型として用いて生成された増幅核酸)へのプローブ核酸のハイブリダイゼーションを利用する。対立遺伝子の検出に有用なハイブリダイゼーションフォーマットとしては、限定するものではないが、以下が挙げられる：溶液相、固相、混合相、またはin situハイブリダイゼーションアッセイ。核酸ハイブリダイゼーションのための広範囲のガイドは、Tijssen (1993) Laboratory Techniques in Biochemistry and Molecular Biology--Hybridization with Nucleic Acid Probes Elsevier, New York、ならびにSambrook et al. (前出)に見いだせる。

例えば、制限断片長多型(RFLP)を含むマーカーは、例えば、検出される核酸の一般にサブフラグメント(またはサブフラグメントに対応する合成オリゴヌクレオチド)であるプローブを、制限消化ゲノムDNAにハイブリダイズすることによって、検出される。制限酵素は異なる個体または集団において少なくとも2つの異なる(または多型の)長さの制限断片をもたらすように選択される。マーカーの各対立遺伝子のための有益（informative）な断片を生成する1種以上の制限酵素を決定することは単純な手法であり、当技術分野でよく知られている。適切なマトリックス(例えば、アガロースまたはポリアクリルアミド)での長さによる分離と、膜(例えば、ニトロセルロース、ナイロンなど)への転写の後に、標識プローブがそのプローブの標的への平衡結合をもたらす条件下でハイブリダイズされ、続いて過剰のプローブが洗浄により除去される。

マーカー座位に対する核酸プローブはクローン化および/または合成することが可能である。任意の適切な標識を、本発明で使用するためのプローブと一緒に用いることができる。核酸プローブと一緒に使用するのに適した検出可能な標識には、例えば、分光学的、放射性同位体、光化学的、生化学的、免疫化学的、電気的、光学的または化学的手段により検出できる物質が含まれる。有用な標識としては、標識ストレプトアビジンコンジュゲートで染色するためのビオチン、磁性ビーズ、蛍光色素、放射性標識、酵素、および熱量測定標識が挙げられる。他の標識には、蛍光団、化学発光物質、および酵素で標識された抗体と結合するリガンドが含まれる。プローブはまた、放射性標識アンプリコンを生成するために用いられる放射性標識PCRプライマーを構成することもできる。核酸を標識するための標識戦略および対応する検出戦略は、例えば、Molecular Probes社(Eugene Oreg.)によるHaugland (2003) Handbook of Fluorescent Probes and Research Chemicals 第9版に見いだすことができる。マーカー検出戦略に関するさらなる詳細は以下に示される。

増幅に基づく検出方法
PCR、RT-PCRおよびLCRは、対象の核酸(例えば、マーカー座位を含むもの)を増幅し、対象の核酸の検出を容易にするための増幅方法および増幅-検出方法として、特に広く用いられている。これらの方法および他の増幅方法の使用に関する詳細は、例えばSambrook et al. (前出)を含めて、さまざまな標準テキストのいずれかに見いだすことができる。さらに、多くの利用可能な生物学のテキストには、PCR及び関連する増幅方法に関する幅広い説明が含まれている。当業者は、本質的にあらゆるRNAが、逆転写酵素とポリメラーゼ(「逆転写PCR」、つまり「RT-PCR」)を用いて、制限酵素消化、PCR増幅および配列決定に適する二本鎖DNAに変換され得ることを理解するだろう。

リアルタイム増幅/検出方法
一態様において、リアルタイムPCRまたはLCRは、例えば分子ビーコンまたはTaqMan(商標)プローブを用いて、本明細書に記載の増幅混合物に対して実施される。分子ビーコン(MB)は、適切なハイブリダイゼーション条件下で、自己ハイブリダイズしてステム-ループ構造を形成するオリゴヌクレオチドまたはPNAである。MBは、そのオリゴヌクレオチドまたはPNAの末端に標識とクエンチャーがある；したがって、分子内ハイブリダイゼーションを可能にする条件下では、一般的に標識がクエンチャーによって消光される(または少なくともその蛍光に変化が見られる)。MBが分子内ハイブリダイゼーションを示さない条件下(例えば、増幅中のアンプリコンの領域などの標的核酸と結合する場合)では、MB標識が消光されない。MBの標準的な作製および使用方法に関する詳細は文献中で十分に確立されており、また、MBはいくつかの商業的試薬供給源から入手可能である(例えば、Leone et al., 1995; Tyagi and Kramer, 1996; Blok and Kramer, 1997; Hsuih et al., 1997; Kostrikis et al., 1998; Sokol et al., 1998; Tyagi et al., 1998; Bonnet et al., 1999; Fang et al., 1999; Marras et al., 1999; およびVet et al., 1999をさらに参照されたい)。MBの構築および使用に関するさらなる詳細は、特許文献、例えばUS 5,925,517、US 6,150,097およびUS 6,037,130に見いだせる。

「TaqMan(商標)」プローブと一般的に呼ばれている、二重標識した発蛍光性オリゴヌクレオチドプローブを用いるPCR検出もまた、本発明に従って行うことができる。これらのプローブは、2つの異なる蛍光色素で標識された短い(例えば、20〜25塩基の)オリゴデオキシヌクレオチドで構成されている。各プローブの5'末端にはレポーター色素があり、各プローブの3'末端にはクエンチング色素が存在する。オリゴヌクレオチドプローブの配列はPCRアンプリコン中に存在する内部標的配列に相補的である。プローブがインタクトである場合には、これら2つのフルオロフォア間でエネルギー移動が起こり、レポーターからの発光がFRETによりクエンチャーによって消光される。PCRの伸長期では、そのプローブはこの反応に用いるポリメラーゼの5'ヌクレアーゼ活性により切断され、それによってレポーターをオリゴヌクレオチド-クエンチャーから解放して、レポーターの発光強度の増加をもたらす。したがって、TaqMan(商標)プローブは標識とクエンチャーをもつオリゴヌクレオチドであり、その標識は増幅に用いられるポリメラーゼのエキソヌクレアーゼ作用によって増幅中に放出される。これは合成中に増幅のリアルタイム測定を提供する。さまざまなTaqMan(商標)試薬が市販されており、例えば、Applied Biosystems社(カリフォルニア州Foster CityのDivision Headquarters)から、ならびにBiosearch Technologies社(例えば、black hole quencherプローブ)などのさまざまな専門業者から入手可能である。二重標識プローブ戦略についてのさらなる詳細は、例えばWO 92/02638に見いだすことができる。

その他の同様の方法には、例えばUS 6,174,670に記載される「LightCycler(登録商標)」フォーマットを用いる、2つの隣接ハイブリダイズしたプローブ間の蛍光共鳴エネルギー移動が含まれる。

アレイに基づくマーカー検出
アレイに基づく検出は、例えばAffymetrix社(Santa Clara, Calif.)や他のメーカーから入手できる、市販のアレイを用いて行うことができる。核酸アレイの操作に関するレビューとしては、Sapolsky et al., 1999; Lockhart, 1998; Fodor, 1997a; Fodor, 1997b および Chee et al., 1996が挙げられる。アレイに基づく検出は、アレイに基づく検出のもともとの高速大量処理の性質のため、サンプル中の本発明のマーカーを同定するための好ましい方法である。

多種多様なプローブアレイが文献に記載されており、本明細書に記載の表現型に相関し得るマーカーの検出のために本発明で使用することができる。例えば、DNAプローブアレイチップまたはより大型のDNAプローブアレイウエハー(さもなければウエハーを分割することによって個々のチップが得られる)が本発明の一実施形態において用いられる。DNAプローブアレイウエハーは一般的に、DNAプローブ(短いDNAセグメント)の高密度アレイが配置されているガラスウエハーで構成される。こうしたウエハーのそれぞれは、例えば、より長いサンプルDNA配列(例えば、個人または集団に由来し、例えば、対象のマーカーを含む)を認識するために用いられる約6000万個のDNAプローブを保持することができる。ガラスウエハー上のDNAプローブのセットによるサンプルDNAの認識は、DNAハイブリダイゼーションを介して行われる。DNAサンプルをDNAプローブのアレイとハイブリダイズさせると、そのサンプルはサンプルDNA配列に相補的なプローブに結合する。個人のサンプルDNAがどのプローブにより強くハイブリダイズするかを評価することによって、既知の核酸配列がサンプル中に存在するか否かを判定し、それによって核酸中に見られるマーカーが存在するかを確認することが可能である。さらに、このアプローチは、例えば、SNPの同定のために、また、1個以上のSNPについてサンプルをジェノタイピンクするために、一塩基識別を可能にするようにハイブリダイゼーション条件を制御することによって、ASHを行うために使用することができる。アレイは、複数の多型マーカーを同時に(または連続して)検出するための1つの便利な実施形態を提供する。例えば、乳癌感受性検出アレイの構築が可能であり、このアレイでは、本明細書に記載の多型(またはそれに連鎖している多型)のいずれかまたは全部が、乳癌感受性表現型を割り当てるために、同時に検出される。当然のことながら、任意の検出技術(PCR、LCR、リアルタイムPCRなど)を、例えば、多重増幅/検出反応と共に、または単にいくつかの別々の反応を同時にもしくは連続して実施することにより、同様に用いることができる。

対立遺伝子情報を得るためのDNAプローブアレイの使用は通常、次の一般的なステップを含む：DNAプローブアレイの設計および作製、サンプルの調製、サンプルDNAのアレイへのハイブリダイゼーション、ハイブリダイゼーション事象の検出、および配列を決定するためのデータ解析。好ましいウエハーは、コストパフォーマンスと高品質を達成するために半導体製造から改良された方法を用いて作製され、また、例えばカリフォルニア州Santa ClaraのAffymetrix社から入手可能である。

例えば、プローブアレイは光指向型(light-directed)化学合成法により作製することができ、この方法は、固相化学合成を、半導体産業で利用されるフォトリソグラフィ製造技術と組み合わせた方法である。チップ露光部位を規定するための一連のフォトリソグラフィマスクの使用と、これに続く特定の化学合成工程により、この方法は、アレイの所定の位置に各プローブを含む、オリゴヌクレオチドの高密度アレイを構築する。多数のプローブアレイを1枚の大きなガラスウエハー上に同時に合成することが可能である。この並行方法は再現性を高め、かつ規模の経済性を達成するのに役立つ。

いったん作製されると、DNAプローブアレイを用いて、対象のマーカーの存在および/または発現レベルに関するデータを取得することができる。DNAサンプルは、標準的な生化学的方法により、ビオチンおよび/または蛍光レポーター基で標識され得る。その標識サンプルをアレイと共にインキュベートすると、サンプルのセグメントがアレイ上の相補的配列と結合する、つまりハイブリダイズする。そのアレイを洗浄および/または染色してハイブリダイゼーションパターンを生じさせる。その後、アレイをスキャンして、ハイブリダイゼーションのパターンを蛍光レポーター基からの発光により検出する。これらの手法に関するさらなる詳細は以下の実施例に記載される。アレイ上の各プローブの正体と位置が分かっているので、アレイにアプライされたサンプル中のDNA配列の本性を突き止めることができる。こうしたアレイがジェノタイピング実験に用いられる場合には、それらをジェノタイピングアレイと呼ぶことがある。

分析される核酸サンプルは単離され、増幅され、そして一般的には、ビオチンおよび/または蛍光レポーター基で標識される。次に、標識した核酸サンプルは、フルイディクスステーション(fluidics station)とハイブリダイゼーションオーブンを用いて、アレイとインキュベートされる。アレイは、検出方法に応じて、洗浄および/または染色もしくは対比染色することができる。ハイブリダイゼーション、洗浄および染色の後、アレイをスキャナーに挿入し、そこでハイブリダイゼーションのパターンを検出する。ハイブリダイゼーションデータは、標識核酸(プローブアレイにもう結合されている)にすでに組み込まれた蛍光レポーター基から放出される光として収集される。標識核酸と最も明確にマッチするプローブは、ミスマッチがあるものより強いシグナルを発生する。アレイ上の各プローブの配列と位置が分かっているので、相補性により、プローブアレイにアプライされた核酸サンプルの正体を同定することができる。

一実施形態においては、2つのDNAサンプルを異なって標識し、設計したジェノタイピングアレイの単一のセットとハイブリダイズさせることができる。この方法では、2セットのデータが同じ物理アレイから得られる。使用可能な標識には、限定するものではないが、サイクロム(cychrome)、フルオレセイン、またはビオチン(ハイブリダイゼーション後にフィコエリスリン-ストレプトアビジンにより染色される)が挙げられる。2色標識はUS 6,342,355に記載されている。各アレイは、両標識からのシグナルが同時に検出されるようにスキャンしてもよいし、各シグナルを別々に検出するために2回スキャンしてもよい。

強度データは、マーカーの存在を試験される個人ごとにすべてのマーカーについてスキャナーで収集される。測定された強度は、所定の個人のサンプル中に存在する特定のマーカーの量(ゲノム核酸または発現核酸が分析されるかに応じて、個人に存在する対立遺伝子の発現レベルおよび/またはコピー数)を示す尺度である。それは、その個人が対象のマーカーについてホモ接合型であるかヘテロ接合型であるかを判定するために使用することができる。この強度データは、種々の強度に対応するマーカー情報を提供するように処理される。

核酸増幅に関するさらなる詳細
上で述べたように、PCRおよびLCRなどの核酸増幅技術は当技術分野で周知であり、マーカー座位を含む核酸などの、対象の核酸を増幅および/または検出するために本発明に応用することができる。当業者をそのようなin vitro方法(ポリメラーゼ連鎖反応(PCR)、リガーゼ連鎖反応(LCR)、Qβレプリカーゼ増幅および他のRNAポリメラーゼ介在技術(例：NASBA)を含む)へ誘導するのに十分な技術の例は、上記の参考文献、例えばSambrook et al.に記載されている。さらなる詳細は、US 4,683,202; Kwoh et al., 1989; Guatelli et al., 1990; Landegren et al., 1988; Van Brunt, 1990; Wu and Wallace, 1989; Barringer et al., 1990; およびSooknanan and Malek, 1995に見いだせる。本明細書に記載の多型に関連している遺伝子のポジショナルクローニングにおいて有用な、大きな核酸をPCRで増幅する改良方法はさらに、Cheng et al. (1994)とそこに引用された参考文献に要約されており、これらの方法では40kbまでのPCRアンプリコンが生成される。ロングレンジPCRの方法は、例えば、US 10/042,406; US 10/236,480; およびUS 6,740,510に開示されている。US 10/341,832はまた、ショートレンジPCRを行うためのプライマーピッキング法に関する詳細を提供する。

マーカーを含む核酸の増幅および/または検出に先立って、必要に応じて、核酸は、いずれかの利用可能な方法、例えば、Berger and Kimmel, Guide to Molecular Cloning Techniques, Methods in Enzymology 第152巻 Academic Press, Inc., San Diego, Calif.; Sambrook et al. (前出); および/またはAusubel et al. (前出)に教示される方法により、サンプルから精製される。細胞または他のサンプルから核酸を精製するための多数のキットが市販されている(例えば、EasyPrep(商標)、FlexiPrep(商標)、両方ともPharmacia Biotech社製; StrataClean(商標)、Stratagene社製; およびQIAprep(商標)、Qiagen社製を参照されたい)。あるいはまた、サンプルは単に、例えば分注(aliquotting)および/または希釈後に、増幅または検出に直接供することもできる。

マーカーの例としては、以下を挙げることができる：多型、一塩基多型、サンプル中の1つ以上の核酸の存在、サンプル中の1つ以上の核酸の非存在、1つ以上のゲノムDNA配列の存在、1つ以上のゲノムDNA配列の非存在、1つ以上のmRNAの存在、1つ以上のmRNAの非存在、1つ以上のmRNAの発現レベル、1つ以上のタンパク質の存在、1つ以上のタンパク質の発現レベル、および/または前述のいずれかもしくはそれらの組合せから誘導されるデータ。本質的にどのような数のマーカーでも、利用可能な方法を用いて、例えば高密度ハイスループットなマーカーマッピングを提供するアレイ技術を用いて、検出することができる。したがって、少なくとも約10、100、1,000、10,000、または100,000以上の遺伝的マーカーでさえも、第1および/または第2の集団において、関連表現型への相関について、同時にまたは連続的に(またはそれらの組合せで)試験することが可能である。さらに、マーカーの組合せが、例えば表現型に相関している集団内の遺伝的組合せまたは発現パターンの組合せを同定するために、都合よく試験され得る。

プローブ/プライマー合成方法
一般に、プローブ、プライマー、分子ビーコン、PNA、LNA(ロックド核酸)などのオリゴヌクレオチドを作製するための合成方法はよく知られている。例えば、オリゴヌクレオチドは、Beaucage and Caruthers (1981)に記載される固相ホスホロアミダイトトリエステル法に従って、例えばNeedham-VanDevanter et al. (1984)に記載されるような市販の自動合成装置を用いて、化学的に合成することができる。また、修飾したオリゴヌクレオチドを含めて、オリゴヌクレオチドは、当業者に知られているさまざまな商業的供給源に注文することが可能である。オリゴ合成サービスの商業的提供業者が数多く存在するので、これは広くアクセス可能な技術である。任意の核酸をさまざまな商業的供給源、例えば、Midland Certified Reagent Company社(mcrc@oligos.com)、Great American Gene Company社(www.genco.com)、ExpressGen社(www.expressgen.com)、Operon Technologies社(Alameda, Calif.)および他の多くの会社のいずれかに、特注品として注文することが可能である。同様に、PNAもさまざまな供給源、例えばPeptidoGenic社(pkim@ccnet.com)、HTI Bio-products社(htibio.com)、BMA Biomedicals社(英国)、Bio-Synthesis社および他の多くの会社のいずれかに特注することができる。

マーカー検出用の増幅プライマー
いくつかの好ましい実施形態では、SNPが適当なPCRベースの検出方法を用いて検出され、こうした方法ではPCRアンプリコンのサイズまたは配列がそのSNPの存在または非存在の指標となる。このタイプの方法では、PCRプライマーが多型部位に隣接する保存領域にハイブリダイズされる。

本発明で用いる適切なプライマーは、任意の適当な方法を用いて設計することができる。本発明は特定のプライマーまたはプライマー対に限定されることを意図しない。例えば、プライマーは、公開されて一般に入手可能な配列情報を考慮して、LASERGENE(登録商標)などの適当なソフトウェアプログラムを用いて設計できる。本明細書で規定する多型のフランキング配列は公開されて入手可能である；それゆえ、適切な増幅プライマーは十分に理解された塩基対合則に基づいて構築され得る。任意のアンプリコンの配列は、すでに上述したように、例えばハイブリダイゼーション、アレイハイブリダイゼーション、PCR、リアルタイムPCR、LCRなどによって、検出することができる。

いくつかの実施形態において、本発明のプライマーは放射性標識されるか、いずれか適当な手段により(例えば、非放射性の蛍光タグを用いて)標識され、結果的に、追加の標識ステップまたは可視化ステップなしに、増幅反応後に異なるサイズのアンプリコンの迅速可視化が可能である。いくつかの実施形態では、プライマーが標識されず、アンプリコンがそれらのサイズによる分割の後に、例えばアガロースまたはアクリルアミドゲル電気泳動の後に、可視化される。いくつかの実施形態では、サイズ分割後のPCRアンプリコンのエチジウムブロマイド染色によって異なるサイズのアンプリコンの可視化が可能である。

本発明のプライマーは特定のサイズのアンプリコンの生成に限定されることを意図していない。例えば、本明細書に記載のマーカー座位と対立遺伝子の増幅に用いるプライマーは、関連する座位の全領域またはそのいずれかの部分領域を増幅することに限定されない。プライマーは、検出に適切であればどのような長さのアンプリコンを生成してもよい。いくつかの実施形態では、マーカーの増幅が少なくとも20ヌクレオチドの長さ、あるいは少なくとも50ヌクレオチドの長さ、あるいはまた少なくとも100ヌクレオチドの長さ、あるいはまた少なくとも200ヌクレオチドの長さのアンプリコンをもたらす。どのようなサイズのアンプリコンでも本明細書に記載のさまざまな技術を用いて検出することができる。塩基組成やサイズの差異は電気泳動などの従来の方法によって検出することが可能である。

マーカーと表現型との相関
これらの相関関係は、対立遺伝子と表現型との、または対立遺伝子の組合せと表現型の組合せとの関係を確認できる任意の方法で実施することができる。例えば、本明細書で規定する遺伝子または座位の対立遺伝子は、1つ以上の乳癌表現型と相関し得る。最も一般的には、これらの方法は、多型の対立遺伝子と表現型との相関を含むルックアップテーブル(look up table)を参照することを含む。このテーブルは多数の対立遺伝子-表現型の関係についてのデータを含み、例えば主成分分析、ヒューリスティックアルゴリズムなどの統計的ツールを用いることによって、多数の対立遺伝子-表現型の関係の相加効果または他の高次効果を確かめることができる。

マーカーと表現型との相関には、必要に応じて、相関についての1つ以上の統計的検定を行うことが含まれる。多くの統計的検定が知られており、そのほとんどは分析を容易にするためにコンピュータで実行される。表現型形質と生物学的マーカー間の関連/相関を決定するさまざまな統計的手法が知られており、本発明に応用することができる。Hartl (1981) A Primer of Population Genetics, Washington大学, Saint Louis Sinauer Associates社, Sunderland, Mass. ISBN: 0-087893-271-2。各種の適切な統計的モデルは、Lynch and Walsh (1998) Genetics and Analysis of Quantitative Traits, Sinauer Associates社, Sunderland Mass. ISBN 0-87893-481-2に記載されている。これらのモデルでは、例えば、遺伝子型値と表現型値との相関を提供する、表現型に対する座位の影響を特徴づける、環境と遺伝子型との関係を明確にする、遺伝子の優性または浸透度を決定する、母方のおよび他の後成的な影響を判断する、分析(主成分分析、すなわち「PCA」による)での主成分を決定する、といったことが可能である。これらのテキストに引用された文献は、マーカーと表現型の相関を把握するための統計的モデルに関する多くのさらなる詳細を提供する。

相関を判定する標準的な統計的手法に加えて、パターン認識と訓練(例えば、遺伝的アルゴリズムの使用)により相関を判定する他の方法を用いて、マーカーと表現型との相関を決定することができる。これは、多数の対立遺伝子と多数の表現型との間の高次相関を確認するときに特に便利である。例として、ニューラルネットワーク手法が、遺伝情報と表現型結果との相関を決定する構造-機能データ空間モデルのヒューリスティックな開発のために、遺伝的アルゴリズム型プログラミングと連結され得る。例えば、NNUGA (遺伝的アルゴリズムを用いるニューラルネットワーク)は、ニューラルネットワークと遺伝的アルゴリズムを連結する(例えば、cs.bgu.ac.il/.about.omri/NNUGAのworld wide web上で)入手可能なプログラムである。ニューラルネットワークの概論は、例えばKevin Gurney, An Introduction to Neural Networks, UCL Press (1999)およびworld wide web上でshef.ac.uk/psychology/gurney/notes/index.htmlに見いだすことができる。さらなる有用なニューラルネットワークの文献には、遺伝的アルゴリズムに関して上述したもの、ならびに、例えばBishop, Neural Networks for Pattern Recognition, Oxford University Press (1995)、およびRipley et al., Pattern Recognition and Neural Networks, Cambridge University Press (1995)が含まれる。

相関、分析の主成分、ニューラルネットワークモデリングなどを使用して確立するためのデータ解析アプリケーションを理解する上で有用な追加の文献としては、例えば、Hinchliffe, Modelling Molecular Structures, John Wiley and Sons (1996); Gibas and Jambeck, Bioinformatics Computer Skills, O'Reilly (2001); Pevzner, Computational Molecular Biology and Algorithmic Approach, The MIT Press (2000)； Durbin et al., Biological Sequence Analysis: Probabilistic Models of Proteins and Nucleic Acids, Cambridge University Press (1998); およびRashidi and Buehler, Bioinformatic Basics: Applications in Biological Science and Medicine, CRC Press LLC (2000)が挙げられる。

いずれの場合にも、本質的にあらゆる統計的検定は、標準的なプログラミング法により、またはそのような統計解析を行うさまざまな「既製」ソフトウェアパッケージのいずれかを用いて、コンピュータ実装モデル(computer implemented model)において適用され得る。そうしたソフトウェアパッケージには、例えば、上述したものおよび市販品が含まれ、例えば、多変量データ解析、インタラクティブな視覚化、変数選択、ニューラルネットワークおよび統計的モデリングなどのための遺伝的アルゴリズムに適用できるパターン認識用のソフトウェアを提供する(例えば、Partek Pro 2000パターン認識ソフトウェアを提供する) Partek Incorporated社(St. Peters, Mo.; www.partek.com)から入手できる。関係は、例えば、主成分分析(PCA)マップ化散布図およびバイプロット、多次元尺度法(MDS)、多次元尺度法(MDS)マップ化散布図、スタープロット(star plots)などによって、解析することができる。相関分析を行うための入手可能なソフトウェアとしては、SAS、RおよびMathLabが挙げられる。

マーカーは、多型であろうと発現パターンであろうと、さまざまな遺伝的解析のいずれかに使用することができる。例えば、いったんマーカーが同定されたら、本ケースのように、それらは関連研究のためのいくつかの異なるアッセイで用いられる。例えば、プローブがこれらのマーカーを調べるマイクロアレイのために設計される。その他の代表的なアッセイには、例えば、上に記載したTaqmanアッセイおよび分子ビーコンアッセイ、ならびに従来のPCRおよび/または配列決定法が含まれる。

関連研究に関するさらなる詳細は、US 10/106,097、US 10/042,819、US 10/286,417、US 10/768,788、US 10/447,685、US 10/970,761、およびUS 7,127,355に見いだせる。

いくつかの実施形態では、マーカーのデータを用いて、マーカーと表現型との相関を示すために関連研究が実施される。これは、対象の表現型をもつ個人(すなわち、対象の表現型を示す個人または集団)におけるマーカー特性を測定し、これらの個人における該マーカーの対立遺伝子頻度または他の特性(発現レベルなど)を、対照群の個人におけるその対立遺伝子頻度または他の特性と比較することによって、達成し得る。そのようなマーカーの測定は、ゲノムワイドベースで行ってもよいし、ゲノムの特定の領域(例えば、対象のハプロタイプブロック)に集中していてもよい。一実施形態では、本明細書に規定する遺伝子または座位に連鎖しているマーカーが1つ以上の特定の乳癌感受性表現型への相関について評価される。

本明細書に開示する本発明の方法の他の実施形態に加えて、本方法はさらに表現型の「解剖」を可能にする。すなわち、ある特定の表現型は2つ以上の異なる遺伝的基礎に起因する可能性がある(一般的には、起因する)。例えば、1個人における感受性表現型は表1に規定する1個の遺伝子の「欠陥」(または単に、例えばその表現型が所定の環境でその個人に望ましかろうと望ましくなかろうと、感受性表現型に関する特定の対立遺伝子--「欠陥」は状況依存性(context dependent)である)の結果でありうる一方で、別の個人における同じ基本的表現型が複数の遺伝子の複数の「欠陥」の結果でありうる。したがって、複数のマーカーを(例えば、ゲノムまたはハプロタイプブロックのスキャニングのように)スキャンすることは、同様の(または段階的(graduated))表現型についてのさまざまな遺伝的基礎の解剖を可能にする。

前の段落に記載したように、関連研究を実施する1つの方法は、対象の表現型をもつ個人(「症例群」)におけるマーカーの対立遺伝子頻度(または発現レベル)を、対照群の個人におけるその対立遺伝子頻度と比較することである。1つの方法では、インフォーマティブ（informative）なSNPを用いてSNPハプロタイプパターンの比較を行う(「インフォーマティブSNP」とは、1つのSNPまたはゲノムもしくはハプロタイプのパターンを、他のSNP、ゲノムまたはハプロタイプのパターンから区別する傾向がある、1個のSNPまたはゲノムもしくはハプロタイプブロック中のSNPのサブセット(2個以上)などの遺伝的SNPマーカーのことである)。インフォーマティブSNPを用いるアプローチは、当技術分野で知られている他の全ゲノムスキャニングまたはジェノタイピング法と比べて有利であり、各個人のゲノムの全30億個の塩基を読み取る代わりに（または検出される可能性がある3〜400万個の共通のSNPを読み取る代わりに）サンプル集団からのインフォーマティブSNPだけを検出する必要があるにすぎない。こうした特定のインフォーマティブSNPを読み取ることは、上記のように、特定の実験集団から統計的に正確な関連データを抽出できるようにするための十分な情報を提供する。

こうして、遺伝的関連を判定する1つの方法の実施形態では、インフォーマティブSNPの対立遺伝子頻度が表現型を示さない対照集団のゲノムについて測定される。さらに、インフォーマティブSNPの対立遺伝子頻度は表現型を示す集団のゲノムについても測定される。これらのインフォーマティブSNPの対立遺伝子頻度が比較される。対立遺伝子頻度の比較は、例えば、各集団内の各インフォーマティブSNP位置の対立遺伝子頻度(集団内の特定の対立遺伝子の例数を対立遺伝子の総数で割った値)を決定し、これらの対立遺伝子頻度を比較することによって行うことができる。対照対症例集団/群において対立遺伝子の発生頻度間の差異を示すインフォーマティブSNPが分析のために選択される。いったんインフォーマティブSNPが選択されたら、インフォーマティブSNPを含む1つ以上のSNPハプロタイプブロックを特定し、続いて表現型と相関している対象のゲノム領域を特定する。そのゲノム領域は、当技術分野で公知の遺伝的または任意の生物学的手法によって、例えば創薬ターゲットまたは診断マーカーとしての使用について、分析され得る。

上記の相関を実施するためのシステムもまた本発明の特徴である。一般的に、そのシステムには、(直接検出されるか、または例えば発現レベルを介して検出されるかにかかわらず)対立遺伝子の存在または非存在を、予測される表現型と相関させるシステム命令が含まれる。

必要に応じて、そのシステム命令はさらに、検出された対立遺伝子情報と関連する診断情報、例えば関連する対立遺伝子をもつ被験者が特定の表現型を有するという診断、を受け入れるソフトウェアをも含むことができる。このソフトウェアはヒューリスティックな性質のものであってよく、そのような入力された関連を用いて、ルックアップテーブルの精度および/またはシステムによるルックアップテーブルの解釈を向上させることができる。そうしたアプローチとして、ニューラルネットワーク、マルコフ(Markov)モデリング、および他の統計的分析を含めて、多様なアプローチが上述される。

本発明は、1つ以上の検出可能な遺伝的マーカーを検出するためのデータ収集モジュール(例えば、1つ以上の生体分子プローブを含む1つ以上のアレイ、検出器、流体ハンドラーなど)を提供する。そうしたデータ収集モジュールの生体分子プローブは、生物学的マーカーを検出するのに適した任意のもの、例えばオリゴヌクレオチドプローブ、タンパク質、アプタマー、抗体などを含むことができる。これらは、例えばサンプルを取得する、サンプルを希釈または分注する、マーカー物質(例：核酸またはタンパク質)を精製する、マーカー核酸を増幅する、増幅したマーカー核酸を検出するなどのために、サンプルハンドラー(例：流体ハンドラー)、ロボティクス、マイクロ流体システム、核酸もしくはタンパク質精製モジュール、アレイ(例：核酸アレイ)、検出器、サーモサイクラー、またはそれらの組合せを含むことができる。

例えば、本明細書に記載のシステムに組み込むことができる自動装置は、さまざまな生物学的イベント、例えば、所定の刺激に応答する遺伝子の発現レベル(Service, 1998a)、ハイスループットDNAジェノタイピング(Zhang et al., 1999)、および他の多くのイベントを評価するために使用されている。同様に、混合実験、DNA増幅、DNA配列決定などを行うための統合システムも利用可能である(Service, 1998b)。さまざまな自動システムコンポーネントが、例えばCaliper Technologies社(Hopkinton, Mass.)から、入手可能であり、これらは、例えばロボティクスおよび流体ハンドリングモジュールを一般に含む、各種のZymateシステムを利用する。同様に、種々の実験室システムで例えばマイクロタイタートレイの操作のために用いられる一般的なORCA^RTMロボットも、例えばBeckman Coulter社(Fullerton, Calif.)から、販売されている。同様に、本発明においてシステムコンポーネントとして使用できる市販のマイクロ流体システムには、Agilent technologies社製およびCaliper Technologies社製のものが含まれる。さらに、特許および技術文献には、自動流体ハンドリングのためにマイクロウェルプレートと直接接続できるものを含めて、マイクロ流体システムの多数の例が含まれる。

さまざまな液体ハンドリングおよび/またはアレイ配置のどれもが本明細書に記載のシステムで使用され得る。本明細書に記載のシステムで用いるための1つの一般的なフォーマットはマイクロタイタープレートであり、その場合アレイまたは液体ハンドラーがマイクロタイタートレイを含む。そうしたトレイは市販されており、また、各種のウェルサイズおよびトレイあたりのウェル数のもの、ならびにアッセイまたはアレイ成分を結合させるための各種の官能化表面をもつものを注文できる。一般的なトレイには汎用96ウェルプレートが含まれ、384および1536ウェルプレートもよく用いられる。サンプルはこうしたトレイで処理することができ、処理ステップのすべてがトレイで実施される。また、サンプルはマイクロ流体装置、またはマイクロタイタートレイとマイクロ流体装置の組合せで処理することもできる。

液相アレイに加えて、固相アレイに成分を保存すること、または固相アレイ上で成分を分析することが可能である。こうしたアレイは、膜(例：ナイロンまたはニトロセルロース)、ポリマーまたはセラミック面、ガラスまたは修飾シリカ面、金属面などの固体基板上に空間的にアクセス可能なパターン(例えば、行と列のグリッド)で材料を固定する。成分は、例えばハイブリダイゼーションにより、局所再水和(例えば、ピペットや他の流体ハンドリング要素を使用)と流体移動により、またはアレイをこすり落とすか、アレイ上の対象の部位を切り出すことにより、アクセス可能となる。

前記システムはさらに、本明細書に記載するアプローチのいずれかを用いて対立遺伝子情報を検出するために用いる、検出装置を含むことができる。例えば、リアルタイムPCR産物を検出するように構成された検出器(例えば、蛍光検出器などの光検出器)またはアレイリーダーを前記システムに組み込むことが可能である。例えば、検出器は対象の対立遺伝子を含むハイブリダイゼーションまたは増幅反応からの発光を検出するように構成することができ、その場合には発光が対立遺伝子の存在または非存在の指標となる。必要に応じて、検出器と、上記のシステム命令を含むコンピュータとの間に操作可能な連結が設けられ、検出された対立遺伝子特異的情報のコンピュータへの自動入力を可能にする。そのコンピュータは、例えば、データベース情報を保存し、かつ/または検出された対立遺伝子特異的情報をルックアップテーブルと比較するシステム命令を実行することができる。

検出器により検出される情報を発するために用いられるプローブはまた、そのプローブを用いてアンプリコンを検出するための他のハードウェアまたはソフトウェアと共に、システム内に組み込むことが可能である。これらは、サーモサイクラー要素(例えば、プローブにより検出される対立遺伝子のPCRまたはLCR増幅を行うためのもの)、アレイ(その上にプローブが配置されかつ/またはハイブリダイズされる)などを含むことができる。サンプルを処理するための上記の流体ハンドリング要素は、サンプル材料(例えば、検出されるテンプレート核酸および/またはタンパク質)、プライマー、プローブ、アンプリコンなどを移動させて互いに接触させるために使用することができる。例えば、前記システムには、表現型と関連する1つ以上の遺伝子または連鎖遺伝子座の少なくとも1個の対立遺伝子を検出するように構成されたマーカープローブまたはプライマーのセットを含めることができる。検出器モジュールは、マーカープローブもしくはプライマーのセット、またはマーカープローブもしくはプライマーのセットから生成されたアンプリコンからの1つ以上の信号出力を検出し、それによって対立遺伝子の存在または非存在を識別するように構成される。

分析されるサンプルは、任意に前記システムの一部であるか、またはそれとは別とみなすことができる。サンプルには、必要に応じて、本明細書に記載するように、例えば、ゲノムDNA、増幅ゲノムDNA、cDNA、増幅cDNA、RNA、増幅RNA、タンパク質などが含まれる。

場合により、ユーザーとインターフェースで接続するためのシステムコンポーネントが設置される。例えば、前記システムには、コンピュータで実行されたシステム命令の出力を表示するためのユーザーが見ることのできるディスプレイ、ユーザーコマンドを入力しかつシステムを動かすためのユーザー入力デバイス(例えば、キーボードまたはマウスなどのポインティングデバイス)などが含まれる。一般的に、対象のシステムにはコンピュータが含まれ、その場合、コンピュータで実行されるさまざまなシステム命令がコンピュータソフトウェアの中に取り込まれ、例えば、コンピュータ読取可能媒体に保存される。

文書作成ソフト(例えば、Microsoft Word(商標)またはCorel WordPerfect(商標))、およびデータベースソフト(例えば、Microsoft Excel(商標)、Corel Quattro Pro(商標)などの表計算ソフト、またはMicrosoft Access(商標)もしくはSequel(商標)、Oracle(商標)、Paradox(商標)などのデータベースプログラム)などの、標準的なデスクトップアプリケーションは、本明細書に記載の対立遺伝子、または対立遺伝子と表現型との関連に対応する文字列を入力することによって、本発明に適合させることができる。例えば、前記システムは適切な文字列情報を有するソフトウェアを含むことができ、これは、例えば、文字列を操作するためのユーザーインターフェース(例えば、Windows(登録商標)、MacintoshまたはLINUX(登録商標)システムなどの標準オペレーティングシステムでのGUI)と共に用いられる。また、BLASTなどの特殊な配列アライメントプログラムを、核酸またはタンパク質(または対応する文字列)のアライメントのために、例えば複数の対立遺伝子を同定して関連付けるために、本発明のシステムに組み込むことも可能である。

上述したように、システムには、適切なデータベースと本発明の対立遺伝子配列または相関を含むコンピュータを含めることができる。配列アライメント用のソフトウェア、ならびに本明細書中の配列のいずれかを含むソフトウェアシステムに入力されたデータセットは、本発明の特徴であり得る。コンピュータは、例えばPC (Intel x86またはPentium(登録商標)チップ互換性DOS(商標)、OS2(商標)、WINDOWS(商標)、WINDOWS NT(商標)、WINDOWS95(商標)、WINDOWS98(商標)、WINDOWS2000、WINDOWSME、もしくはLINUXベースのマシン、MACINTOSH.TM.、Power PC、もしくはUNIX(登録商標)ベース(例：SUN(商標)ワークステーションまたはLINUXベースのマシン)または当業者に知られている他の市販コンピュータであってよい。配列を入力して、アライメントするか、他の方法で操作するためのソフトウェアは、入手可能であり(例えば、BLASTPおよびBLASTN)、またはVisualbasic、Fortran、Basic、Java(登録商標)などの標準的なプログラミング言語を用いて当業者が容易に構築することができる。

本発明は、本発明のSNPの1個以上での個人の多型プロファイルを判定する方法を提供する。そうしたSNPには表1〜5に示したものが含まれる。

多型プロファイルは、個人においてさまざまな多型部位を占めている多型の形態を構成している。二倍体のゲノムでは、同一または互いに異なる2つの多型形態が、通常、それぞれの多型部位を占めている。こうして、部位XおよびYでの多型プロファイルは形態X(x1, x1)およびY (y1, y2)で表すことができ、ここで、x1, x1は部位Xを占めている対立遺伝子x1の2つのコピーを表し、そしてy1, y2は部位Yを占めているヘテロ接合型の対立遺伝子を表す。

個人の多型プロファイルは、各部位で発生する乳癌表現型に対する抵抗性または感受性と関連した多型形態との比較によって、スコアとして記録することができる。そうした比較は、少なくとも例えば1、2、5、10、25、50またはすべての多型部位で、また必要に応じて、それらと連鎖不平衡にある部位で、実施される。これらの多型部位は他の多型部位と組み合わせて分析することができる。しかし、分析される多型部位の総数は通常10,000、1000、100、50または25より少なく、約10以下、約5以下、または約2以下であり得る。

特定個人に存在する抵抗性または感受性対立遺伝子の数は、その個人の乳癌表現型への遺伝的傾向の総合スコアを提供するために、相加的にまたは比率として組み合わせることができる(US 60/566,302、US 60/590,534、US 10/956,224、およびWO/2005/086770参照)。抵抗性対立遺伝子は任意にそれぞれ+1のスコア、感受性対立遺伝子は-1のスコア(またはその逆)として記録され得る。例えば、ある個人が本発明の100の多型部位でタイピングされ、それらのすべてで抵抗性についてホモ接合型である場合、その個人は、乳癌表現型抵抗性に100％の遺伝的傾向のスコア、または乳癌表現型感受性に0％の傾向のスコアを割り当てられる。その個人がすべての感受性対立遺伝子についてホモ接合型である場合は、その逆が当てはまる。より一般的には、個人は一部の座位で抵抗性対立遺伝子についてホモ接合型であり、一部の座位で感受性対立遺伝子についてホモ接合型であり、そして残りの座位では抵抗性/感受性対立遺伝子についてヘテロ接合型である。そのような個人の乳癌表現型の遺伝的傾向は、すべての抵抗性対立遺伝子に+1のスコアを、すべての感受性対立遺伝子に-1のスコア(またはその逆)を割り当てて、これらのスコアを組み合わせることによって、記録することができる。例えば、ある個人が102個の抵抗性対立遺伝子と204個の感受性対立遺伝子をもつ場合、その個人は抵抗性について33％の遺伝的傾向をもち、そして感受性について67％の遺伝的傾向をもつとして記録される。これとは別に、ホモ接合型の抵抗性対立遺伝子に+1のスコアを、ヘテロ接合型の対立遺伝子にゼロのスコアを、そしてホモ接合型の感受性対立遺伝子に-1のスコアを割り当てることができる。抵抗性対立遺伝子と感受性対立遺伝子の相対数をパーセンテージとして表すことも可能である。したがって、30の多型部位で抵抗性対立遺伝子についてホモ接合型であり、60の多型部位で感受性対立遺伝子についてホモ接合型であり、そして残りの63の部位でヘテロ接合型である個人は、抵抗性について33％の遺伝的傾向が割り当てられる。さらに別の方法として、感受性についてのホモ接合型を+2、ヘテロ接合型を+1、抵抗性についてのホモ接合型を0として記録することができる。

個人のスコア、および多型プロファイルのタイプは、乳癌表現型に対する個人の感受性の予後または診断に有用である。必要に応じて、患者は遺伝的プロファイルにより示された乳癌表現型への感受性について告知される。乳癌表現型への高い遺伝的傾向の存在は、予防的または治療的処置を開始するための警告として扱うことができる。例えば、乳癌表現型を発症するリスクが高い個人は、異なったモニタリング(例えば、より頻繁なマンモグラフィー)を受けたり、予防的処置(例えば、1種以上の薬剤による)を受けたりすることができる。乳癌表現型への高い傾向の存在はまた、生検および当技術分野で公知の他の方法などの、二次検査を行うことの有用性を示している。

多型プロファイリングは、例えば、所定の個人における乳癌表現型の治療または予防に影響を及ぼす薬剤を選択する上で有用である。同様の多型プロファイルをもつ個人は、薬剤に対して同様に応答する可能性が高い。

多型プロファイリングはまた、乳癌表現型または関連症状を治療する能力について検査される薬剤の臨床試験において個人を層別化するのに有用である。そうした試験は、類似のまたは同一の多型プロファイル(EP 99965095.5参照)、例えば個人が乳癌表現型の高い発症リスクを有することを示す多型プロファイル、をもつ治療集団または対照集団で実施される。遺伝的に一致した集団の使用は、遺伝的要因による治療成績のばらつきを排除または軽減し、潜在的な薬物の有効性のより正確な評価につながる。コンピュータで実行されるアルゴリズムを用いると、治療または予防がより不均質でより大きな集団では効果がないにもかかわらず、その治療または予防が顕著な効果を示す遺伝的により均質な亜集団を識別することができる。そのような方法では、乳癌表現型を示して、薬剤で治療された第1の集団と、やはり乳癌表現型を示すがプラセボで治療された第2の集団についてのデータが得られる。これら2つの集団内の個人の多型プロファイルは、表1〜5に示すSNPにより規定される領域の100kbまたは50kbまたは20kb以内にある少なくとも1つの多型部位で決定される。さらに、集団内の各患者が、治療または予防の成功を示す望ましいエンドポイントに達するかどうかについてのデータも得られる。その後、第1および第2集団のそれぞれの亜集団は、亜集団内の個人がもとの第1および第2集団内の個人よりも互いに多型プロファイルの高い類似性を有するように選択される。類似性を評価することができる、数多くの基準が存在する。例えば、1つの基準は、亜集団内の個人が上記遺伝子の少なくとも1つのそれぞれに少なくとも1つの感受性対立遺伝子をもつことを要求することである。別の基準は、亜集団内の個人が、多型プロファイルが決定される多型部位のそれぞれに対して少なくとも75％の感受性対立遺伝子をもつことである。類似性を評価するために用いた基準にかかわらず、亜集団のエンドポイントデータを比較して、治療または予防が亜集団において統計的に有意な結果を達成したかどうかを判定する。コンピュータで実行するため、何十億という類似性の基準を分析して、統計的有意性を示す1つまたは2〜3の亜集団を識別することが可能である。

多型プロファイリングはまた、乳癌表現型への素因をもたない個人を臨床試験から除くためにも有用である。臨床試験にそうした個人を含めると、統計的に有意な結果を達成するために必要とされる集団のサイズが大きくなる。乳癌表現型への素因をもたない個人は、上で説明した多型プロファイルで抵抗性および感受性対立遺伝子の数を調べることによって識別することができる。例えば、被験者が乳癌表現型と関連する本発明の10個の遺伝子の10の部位でジェノタイピングされる場合、全部で20個の対立遺伝子が判定される。これらの50％以上、好ましくは60％または75％以上が抵抗性遺伝子であるならば、その個体は乳癌表現型を発症する可能性が低く、臨床試験から除かれる。

他の実施形態では、多型プロファイリングを他の層別化方法と組み合わせることにより、臨床試験に参加する個人の層別化を行うことができる。他の層別化方法としては、限定するものではないが、家族歴、リスクモデル(例えば、Gailスコア、Clausモデル)、臨床表現型(例えば、非定型病変)、および特定の候補バイオマーカーが挙げられる。

多型プロファイルはまた、臨床試験の終了後に、所定の治療に対する応答の差異を解明するためにも使用される。例えば、多型のセットを用いて、参加した患者を疾患のサブタイプまたはクラスに層別化することができる。さらに、多型を用いて、同様の多型プロファイルを有する患者のうち、治療に対して異常な(高いまたは低い)応答を有する患者、またはまったく応答しない患者(非応答者)のサブセットを識別することも可能である。このようにして、治療への応答に影響を与える基本的な遺伝的要因についての情報は、治療の多くの開発局面(これらは新しい標的の同定から、新しい臨床試験の設計を通して、製品のラベリングおよび患者の標的化にまで及ぶ)において使用され得る。さらに、多型は、治療に対する有害反応(有害事象)に関与する遺伝的要因を同定するために用いることができる。例えば、有害反応を示す患者は、偶然で予想されるよりも類似した多型プロファイルをもつ可能性がある。これは、そのような個人の早期識別と、治療からの排除を可能にする。それはまた、有害事象の生物学的原因を理解するために、また、その治療を変更してそうした結果を避けるために使用し得る情報をも提供する。

多型プロファイルはさらに、US 6,525,185に記載されるような実父確定検査および法医学的分析を含めて、他の目的のためにも使用することができる。法医学的分析では、犯行現場のサンプルからの多型プロファイルが容疑者のものと比較される。両者の一致は、その容疑者が実際に犯罪を行ったという証拠であるのに対して、一致の欠如はその容疑者を除外する。本発明の多型部位は、ヒトゲノム中の他の多型部位と同様に、そのような方法において用いることができる。

Women's Health Initiativeからのネスティド・ケース・コントロール研究における乳癌リスク評価のためのSNPパネルの検討
論理的根拠
最近発見された乳癌(BCa)関連遺伝的変異がBCaリスク評価に役立つ程度ははっきりしていない。7個のBCa関連SNPのパネルからのリスク情報の追加がGailモデルによって提供されるリスク層別化に及ぼす効果を評価した。

方法
WHI臨床試験で無作為化後にBCaを発症した女性1664人と、適合したBCaフリーの対照者1636人を試験した。対照者は、ベースライン年齢、自己報告の民族性、臨床試験への参加、無作為化以来の年数、および子宮摘出の状況に基づいて適合していた。ゲノムワイド有意性(genome-wide significance)および複製の厳格な基準を満たす、発表された文献からの7個のSNPがジェノタイピングのために選択された(7-SNPパネル)。7個の選択されたパネルSNP間のSNPリスクをモデル化するために、以前に報告されたエフェクトサイズ推定値を、相対リスクのための乗法モデルと共に使用した。組合せ臨床的/遺伝的リスクを引き出すために、Gailモデルの絶対リスク推定値に複合SNP相対リスクを乗算して、組合せ臨床的/遺伝的リスクを引き出した。分類性能は、純再分類改善指数(NRI)を定量化するための再分類表と、受信者動作特性(ROC)曲線を用いて評価した。

結果
白人女性についてのBCaと個々のSNPとの関連は、以前の報告におおむね一致した。Gailの5年絶対リスクおよび7-SNP相対リスク推定値は、ロジスティック回帰により検定したとき、両方ともBCa発生率と関連していた；GailリスクとSNPリスクの間には、統計的に有意な(P＝0.01)、しかし非常に弱い(r＝0.044)、相関が認められた。

このコホートでは、Gailリスクの2倍増加が癌発生率の2倍より低い増加をもたらして、Gailリスクはこのデータセットであまりキャリブレートされていないことを示唆しており、これは以前の報告(Chiebowski et al., 2007)と一致する。組合せ予測因子は、GailリスクまたはSNP成分のいずれか単独よりも強く関連していた。ROC曲線分析において、GailおよびSNPリスクの組合せは、曲線下面積(AUC)が0.594 (95％ Cl: 0.576〜0.612)であったのに対して、Gailリスク単独では0.556 (95％ Cl: 0.537〜0.575)であった。このAUCの差は統計的に有意であった(95％ Cl: 0.025〜0.050、経験的P＜0.001)。再分類表の分析では、一次予防についての意思決定において潜在的に臨床的意義がある5年リスク閾値が選ばれた：＜1.5％(平均以下のリスク)、1.5〜2％(中等度のリスク)および＞2％(高いリスク)。白人女性における再分類は、組合せSNP×Gailスコア対Gailリスク単独について評価された。この背景でのNRIは0.09 (Z＝4.5, P＝0.033)であり、症例の6.4％および対照の2.6％に分類の改善がみられた。

以前に乳房生検を受けたことがある女性は、組合せSNP×Gailスコアを用いる再分類から特に恩恵を受けるサブグループのようである。

このサブセットにおいて、GailモデルでのAUCは0.514 (95％CI: 0.471〜0.561)であり、偶然と区別できなかった。全コホートと比較して、GailモデルでのAUCの差はボーダーラインすれすれの有意性であった(95％CI: -0.002〜0.081、経験的P＝0.06)。組合せモデルでのAUCは0.571 (95％CI: 0.526〜0.614)であった。組合せモデル対Gail単独でのAUCの差のブートストラップ推定値もまた有意であった(95％CI: 0.029〜0.085、P＜0.001)。

生検サブセットにおける再分類メトリクスはNRIが0.18であることを示し、これもまた、イベント数が少ないにもかかわらず、非常に有意であった(Z＝3.9、P＝4.9×10-5)。ここで、分類は対照の14.8％に改善がみられた(P＝1.5×10-5)が、症例のわずか2.8％しか改善しなかった(P＝0.16; 表7および8)。ブートストラップ・リサンプリングは、全コホートと生検サブセット間のNRIの差が統計的に有意であることを示した。1000回のブートストラップ反復推定値に基づくと、生検サブセットにおけるNRIの改善についての95％信頼区間は0.02から0.16までに拡大し、経験的P＝0.03であった。

考察
臨床的リスク因子(Gailリスク)と十分に検証された一般的な遺伝的リスク因子(7-SNPパネル)の両方を組み合わせる戦略は、閉経後の白人女性におけるBCaリスクの分類の改善をもたらす。これは一次予防および/またはスクリーニング戦略の情報を提供するのに大きな影響を及ぼす可能性がある。

乳癌リスク評価のためのSNPの使用：10-SNPモデル
SNPジェノタイピング
複数の大規模なサンプルセット間で高い統計的有意性でもって乳癌と関連することが報告されている10個のSNPを特定し、それらを表9に示す。

10個のうち7個のSNPのジェノタイピングは実施例1に記載される。残り3個のSNP (rs4973768、rs6504950、rs11249433)については、Sequenom MassArrayプラットフォームでジェノタイピングを行った。SNPのそれぞれについて相反する方向で2つのアッセイを設計した。これらのSNPのうち2個(rs6504950およびrs11249433)は、オリゴヌクレオチドアレイ上で同じサンプルで以前にジェノタイピングが実施されていた。以前のSequenomジェノタイピングで結果が良くなかったサンプルは、このデータセットでも良くなく、これら2個のSNPについて90％未満の一致であったのに対して、他のサンプルでは99.9％であった。その結果として、この同じセットの問題のあるサンプルのデータを除外した。

表10は、10個の乳癌関連SNPについてのジェノタイピングの結果をまとめたものである。

10個のSNPのうち不明遺伝子型(missing genotype)が2個より多かった264のサンプルを分析から除外した；分析に含めた残りのサンプルについては、96％が10 SNPについての完全なデータを有していた。

各SNPは、共変量のない対数加法モデルの下でロジスティック回帰により浸潤性乳癌との関連性について個別に検定した。白人女性についての結果は、表11に示すように、以前の報告とおおむね一致した。

新しいSNPはどれも乳癌と有意に関連していなかったが、これらの検定のすべてが予想された方向に向いており、また、信頼区間は以前に報告されたオッズ比にまたがっている。10個のSNP間で有意なペアワイズ相互作用は検出されなかった(45の異なる検定はP＜0.05となる2検定をもたらしたが、P＜0.01となるものはなかった)。

複合SNPリスクスコア
10個の選択した乳癌関連SNPを用いてSNPリスクをモデル化するために、以前に報告されたエフェクトサイズの推定値を用いた。SNP間の相対リスクのための乗法モデルを使用し、その場合に各SNPのリスク値は、3つの可能な二倍体遺伝子型の期待頻度に基づいて1の集団平均をもつようにスケールを合わせた。不明な遺伝子型にも1の相対リスクを割り当てた。

log変換リスク推定値を用いるロジスティック回帰による乳癌発生率との関連についてのGail 5年絶対リスクおよび10-SNP相対リスク推定値は、別々に検定した。表12に示すように、両方とも強く関連していた。

GailリスクとSNPリスクは、弱く、しかし有意に相関していた(r＝0.043、P＝0.010)。Gail絶対リスクにSNP相対リスクを乗ずることによって形成される組合せ予測因子は、いずれか一方の成分単独よりも強く関連していた。別項としてGailリスクとSNPリスクを含めることは、適合度をさらに改善する(P＝1.8×10-4)。交互作用項は乳癌状態の予測を改善しなかった(P＝0.50)。組合せ10-SNP×Gailスコアは、7 SNP×Gailスコアよりわずかにインフォーマティブ（informative）であるようにみえた：両方のスコアを用いるモデルでは、10-SNP×Gailスコアが7-SNPスコア単独に対して適合度を改善した(尤度比検定: P＝0.060)が、逆の場合はそうでなかった(P＝0.47)。

Hosmer-Lemeshow検定を用いて10-SNPリスクスコアのキャリブレーションを評価した。7-SNPスコアと同様に、10-SNPスコアはよくキャリブレートされているようである(P＝0.98、図1)。

分類性能
分類性能は受信者動作特性(ROC)曲線を用いて評価した。7-SNP×Gailスコアおよび10-SNP×GailスコアのAUCは本質的に変わらず(それぞれ0.599および0.600)、その差は有意でない(図2)。

さらに、再分類表(Cook et al., 2006)と、「純再分類改善」つまりNRI (Pencina et al., 2008)により定量化された分類の違いを用いて、分類の正確さを評価した。白人女性における組合せSNP×Gailスコア対Gailリスク単独についての1.5％(平均以下のリスクの場合)および2％(高リスクの場合)の5年リスク閾値、ならびに評価した再分類(表13)。

この表についてのNRIは0.095 (Z＝4.4、P＝6.1×10-6)である。分類は、症例の7.7％(P＝4.2×10-7)および対照の1.8％(P＝0.11)で改善した。これらの結果は7-SNPモデルからの結果よりわずかに良かったが、有意差はなかった。

さらに、7-SNPモデルに対する10-SNPモデルのもとでの再分類を直接評価した。10-SNPモデルについてのNRIは0.011であり、これは有意でなかった(Z＝0.72、P＝0.23)。症例の純再分類は2.6％(P＝0.007)改善したが、対照の1.6％(P＝0.94)で悪化した。NRIが多数の閾値を用いて評価される場合は、より多くの女性が新しいカテゴリーに彼女らを移動させるのに十分な大きさのスコアの変化を有するので、統計が改善する。例えば、リスクの4％分位点(quantile)で25の閾値を用いると、7-SNPモデルに対する10-SNPモデルについてのNRIは0.056 (Z＝1.8、P＝0.04)となり、100の閾値を用いると、NRIが0.069 (Z＝2.0、P＝0.02)に改善する。

結論
このデータセットでは、10-SNP分類子は、7-SNP分類子について実証されたのと本質的に同程度に予測的であり、よくキャリブレートされていることが実証される。WHIデータセットは、10-SNP分類子が7-SNP分類子よりすぐれていることを効果的に実証するのに十分な大きさではないようである。しかし、前記モデルにSNPを追加することから予想される小さな改善はおそらく、いくつかの状況において臨床的に意味があるだろう。

当業者には理解されるように、広く説明された本発明の精神または範囲から逸脱することなく、多くの変更および/または修飾を特定の実施形態で示された本発明に対して行うことが可能である。したがって、本実施形態はすべての点で例示的であって、限定的ではないとみなすべきである。

本明細書中で説明および/または参照したすべての刊行物は、それらの全体を本明細書に組み入れるものとする。

本出願は、2009年6月1日付けのUS 61/182,809および2009年11月5日付けのUS 61/258,420からの優先権を主張するものであり、これら両出願の全内容を参照により本明細書に組み入れる。

本明細書に含まれている文書、行為、材料、装置、物品などのあらゆる説明は、本発明のための状況を提供する目的のためだけのものである。これらの事項のすべては、それらが本出願の各クレームの優先日前に存在したという理由で、先行技術ベースの一部を形成すること、または本発明に関連する分野の一般常識であったこと、を容認するものとして解釈されるべきでない。

参考文献
Ahmed et al. (2009) Nature Genetics 41:585-590.
Antoniou et al. (2009) Hum Mol Genet 18:4442-4456.
Barringer et al. (1990) Gene 89:117-122.
Beaucage and Caruthers (1981) Tetrahedron Letts. 22:1859-1862.
Blok and Kramer (1997) Mol Cell Probes 11:187-194.
Bonnet et al. (1999) PNAS 96:6171-6176.
Chee et al. (1996) Science 274:610-614.
Cheng et al. (1994) Nature 369:684-685.
Chiebowski et al. (2007) J Natl Cancer Inst 99:1695-1705.
Cook et al. (2006) Ann Intern Med 145:21-29.
Costantino et al. (1999) J Natl Cancer Inst 91:1541-1548.
Devlin and Risch (1995) Genomics. 29: 311-322.
Easton et al. (2007) Nature 447: 1087-1093.
Fang et al. (1999) J. Am. Chem. Soc. 121:2921-2922.
Fodor (1997a) FASEB Journal 11:A879.
Fodor (1997b) Science 277: 393-395.
Gail et al. (1989) J Natl Cancer Inst 81:1879-1886.
Gail et al. (1999) J Natl Cancer Inst 91:1829-1846.
Gail et al. (2007) J Natl Cancer Inst 99(23):1782-1792.
Gold et al. (2008) PNAS 105: 4340-4345.
Guatelli et al. (1990) PNAS 87:1874-1878.
Hsuih et al. (1997) J Clin Microbiol 34:501-507.
Kelemen et al. (2009) Cancer Epidemiol Biomarkers Prev 18:1864-1868.
Kostrikis et al. (1998) Science 279:1228-1229.
Kwoh et al. (1989) PNAS 86:1173-1177.
Landegren et al. (1988) Science 241:1077-1080.
Leone et al. (1995) Nucleic Acids Res. 26:2150-2155.
Lockhart (1998) Nature Medicine 4:1235-1236.
Marras et al. (1999) Genet. Anal. Biomol. Eng. 14:151-156.
Needham Van Devanter et al. (1984) Nucleic Acids Res. 12:6159-6168.
Pencina et al. (2008) Stat Med 27:157-172.
Peto and Mako (2000) Nat Genet 26:411-414.
Rockhill et al. (2001) J Natl Cancer Inst 93(5):358-366.
Sapolsky et al. (1999) Genet Anal: Biomolec Engin 14:187-192.
Service (1998a) Science 282:396-399.
Service (1998b) Science 282: 399-401.
Slatkin and Excoffier (1996) Heredity 76: 377-383.
Sokol et al. (1998) PNAS 95:11538-11543.
Sooknanan and Malek (1995) Biotechnology 13: 563-564.
Stacey et al. (2007) Nature Genetics 39:965-869.
Stacey et al. (2008) Nature Genetics 40:703-706.
Thomas et al. (2009) Nature Genetics 41:579-584.
Turnbull et al. (2010) Nature Genetics 42: 504-509.
Tyagi and Kramer (1996) Nature Biotechnology 14:303-308.
Tyagi et al. (1998) Nature Biotechnology 16:49-53.
Van Brunt (1990) Biotechnology 8:291-294.
Vet et al. (1999) PNAS 96:6394-6399.
Wu and Wallace (1989) Gene 4:560-569.
Zhang et al. (1999) Anal. Chem. 71:1138-1145.
[１] 乳癌表現型の発症についてのヒト女性被験者の全体的リスクを評価する方法であって、以下のステップ：
女性被験者の臨床的リスク評価を行うステップ；
女性被験者の遺伝的リスク評価を行うステップであって、遺伝的リスク評価が、女性被験者由来の生物学的サンプル中で、乳癌表現型と関連することが知られている少なくとも2個の一塩基多型の存在を検出することを含む、ステップ；および
臨床的リスク評価を遺伝的リスク評価と組み合わせることによって、乳癌表現型の発症についてのヒト女性被験者の全体的リスクを取得するステップ
を含む方法。
[２] 臨床的リスク評価によって分析された、乳癌表現型の発症についてのヒト女性被験者の全体的リスクが再分類されるべきかどうかを判定する方法であって、以下のステップ：
臨床的リスク評価を遺伝的リスク評価と組み合わせることによって、乳癌表現型の発症についてのヒト女性被験者の全体的リスクを取得するステップであって、遺伝的リスク評価が、女性被験者由来の生物学的サンプル中で、乳癌表現型と関連することが知られている少なくとも2個の一塩基多型の存在を検出することを含む、ステップ；および
臨床的リスク評価を遺伝的リスク評価と組み合わせることが、乳癌表現型の発症についての該被験者の全体的リスクの再分類につながるかどうか、を判定するステップ
を含む方法。
[３] 前記方法の純再分類改善(NRI)が0.01より高い、請求項2記載の方法。
[４] 前記方法の純再分類改善(NRI)が0.05より高い、請求項2記載の方法。
[５] 臨床的リスク評価により判定された5年リスクが約1.5％〜約2％である、請求項2記載の方法。
[６] 前記方法の純再分類改善(NRI)が0.1より高い、請求項5記載の方法。
[７] 臨床的リスク評価を行うステップが、Gailモデル、Clausモデル、Clausテーブル、BOADICEA、Jonkerモデル、Claus拡張式、Tyrer-Cuzickモデル、およびManchesterスコアリングシステムからなる群より選択されるモデルを用いる、請求項1〜6のいずれか一項記載の方法。
[８] 臨床的リスク評価を行うステップが、次の項目：乳癌、乳管癌または小葉癌の病歴、年齢、初潮年齢、初産年齢、乳癌の家族歴、以前の乳房生検の結果、および人種/民族、の1つ以上に関する情報を前記女性から取得することを含む、請求項1〜7のいずれか一項記載の方法。
[９] 臨床的リスク評価がGailモデルを用いて得られる、請求項7または8記載の方法。
[１０] 乳癌表現型と関連することが知られている少なくとも3、4、5、6、7、8、9または10個の一塩基多型の存在を検出することを含む、請求項1〜9のいずれか一項記載の方法。
[１１] 乳癌表現型と関連することが知られている7、8、9または10個の一塩基多型の存在を検出することを含む、請求項1〜9のいずれか一項記載の方法。
[１２] 一塩基多型がrs2981582、rs3803662、rs889312、rs13387042、rs13281615、rs4415084、およびrs3817198、またはこれらの1つ以上と連鎖不平衡にある一塩基多型からなる群より選択される、請求項1〜11のいずれか一項記載の方法。
[１３] 一塩基多型がrs2981582、rs3803662、rs889312、rs13387042、rs13281615、rs4415084、rs3817198、rs4973768、rs6504950およびrs11249433、またはこれらの1つ以上と連鎖不平衡にある一塩基多型からなる群より選択される、請求項1〜11のいずれか一項記載の方法。
[１４] 前記一塩基多型のうち少なくとも3、4、5、6、7、8、9または10個の存在を検出することを含む、請求項12または13記載の方法。
[１５] 前記一塩基多型のうち7、8、9または10個の存在を検出することを含む、請求項12または13記載の方法。
[１６] 一塩基多型が、共変量のない対数加法モデルの下でロジスティック回帰により、乳癌との関連性について個別に検定される、請求項1〜15のいずれか一項記載の方法。
[１７] 一塩基多型が乳癌との関連性について組合せで検定される、請求項1〜16のいずれか一項記載の方法。
[１８] 臨床的リスク評価を遺伝的リスク評価と組み合わせるステップが、これらのリスク評価を乗算することを含む、請求項1〜17のいずれか一項記載の方法。
[１９] 前記女性が白人である、請求項1〜18のいずれか一項記載の方法。
[２０] 前記女性が乳房の生検を受けたことがある、請求項1〜19のいずれか一項記載の方法。
[２１] 臨床的リスク評価の結果が、女性はより頻繁なスクリーニングおよび/または予防的抗乳癌療法を受けるべきであることを示す、請求項1〜20のいずれか一項記載の方法。
[２２] 被験者が乳癌の発症リスクがあると判定される場合、その被験者は非応答性というよりもエストロゲン抑制に応答性である可能性が高い、請求項1〜21のいずれか一項記載の方法。
[２３] 乳癌表現型の発症についてのヒト女性被験者の全体的リスクを評価するためのシステムであって、以下：
女性被験者の臨床的リスク評価を行うためのシステム命令；
女性被験者の遺伝的リスク評価を行うためのシステム命令；および
乳癌表現型の発症についてのヒト女性被験者の全体的リスクを取得するために、臨床的リスク評価を遺伝的リスク評価と組み合わせるためのシステム命令
を含むシステム。
[２４] コンピュータにより実行されるシステムである、請求項23記載のシステム。
[２５] 女性被験者由来の生物学的サンプル中で、乳癌表現型と関連することが知られている少なくとも2個の一塩基多型の存在を検出するように構成されたマーカープローブもしくはプライマーのセット；
そのマーカープローブもしくはプライマーのセット、またはそのマーカープローブもしくはプライマーのセットから生成されたアンプリコンからの1以上の信号出力を検出し、それによって乳癌表現型と関連することが知られている少なくとも2個の一塩基多型の存在または非存在を識別するように構成された検出器
をさらに含む、請求項23または24記載のシステム。
[２６] 一塩基多型がrs2981582、rs3803662、rs889312、rs13387042、rs13281615、rs4415084、およびrs3817198、またはこれらの1つ以上と連鎖不平衡にある一塩基多型からなる群より選択される、請求項23〜25のいずれか一項記載のシステム。
[２７] 前記マーカープローブもしくはプライマーのセットが、rs2981582、rs3803662、rs889312、rs13387042、rs13281615、rs4415084、rs3817198、rs4973768、rs6504950およびrs11249433と指定された一塩基多型、またはこれらの1つ以上と連鎖不平衡にある一塩基多型のうち1つ以上を検出するものである、請求項23〜26のいずれか一項記載のシステム。
[２８] 前記検出器が1つ以上の発光を検出し、その発光が一塩基多型の存在または非存在を示す、請求項23〜27のいずれか一項記載のシステム。
[２９] 前記システムが女性被験者由来の生物学的サンプルを含む、請求項23〜28のいずれか一項記載のシステム。
[３０] 前記サンプルがゲノムDNA、増幅ゲノムDNA、cDNA、増幅cDNA、RNAまたは増幅RNAを含む、請求項29記載のシステム。
[３１] 2つ以上の核酸を増幅するための少なくとも2つのプライマーセットを含むキットであって、前記2つ以上の核酸がrs2981582、rs3803662、rs889312、rs13387042、rs13281615、rs4415084、rs3817198、rs4973768、rs6504950およびrs11249433、またはこれらの1つ以上と連鎖不平衡にある一塩基多型からなる群より選択される一塩基多型を含むものである、上記キット。
[３２] rs2981582、rs3803662、rs889312、rs13387042、rs13281615、rs4415084、rs3817198、rs4973768、rs6504950およびrs11249433、またはこれらの1つ以上と連鎖不平衡にある一塩基多型からなる群より選択される一塩基多型を独立して含む、少なくとも2つの核酸を含む遺伝子アレイ。
[３３] 請求項1〜22のいずれか一項記載の方法を用いて、乳癌表現型の発症についてのヒト女性被験者の全体的リスクを評価することを含む、乳癌についてのヒト女性被験者の定期的診断検査の必要性を判定する方法。
[３４] ヒト女性被験者における乳癌のスクリーニング方法であって、請求項1〜22のいずれか一項記載の方法を用いて、乳癌表現型の発症についての該被験者の全体的リスクを評価し、それらが乳癌の発症リスクをもつと評価される場合には、該被験者において乳癌を定期的にスクリーニングすることを含む、上記方法。
[３５] 請求項1〜22のいずれか一項記載の方法を用いて、乳癌表現型の発症についてのヒト女性被験者の全体的リスクを評価することを含む、予防的抗乳癌療法についてのヒト女性被験者の必要性を判定する方法。
[３６] ヒト女性被験者における乳癌の予防方法であって、請求項1〜22のいずれか一項記載の方法を用いて、乳癌表現型の発症についての該被験者の全体的リスクを評価し、それらが乳癌の発症リスクをもつと評価される場合には、該被験者に抗乳癌療法を行うことを含む、上記方法。
[３７] 前記療法がエストロゲンを抑制するものである、請求項36記載の方法。
[３８] 候補治療法の臨床試験のためにヒト女性被験者のグループを層別化する方法であって、請求項1〜22のいずれか一項記載の方法を用いて、乳癌表現型の発症についての各被験者の全体的リスクを評価し、その評価の結果を用いて該治療法に応答する可能性が高い被験者を選別することを含む、上記方法。

Claims

乳癌表現型の発症についてのヒト女性被験者のリスク評価を補助する方法であって、以下のステップ：
女性被験者の臨床的リスク評価を行うステップ；
女性被験者の遺伝的リスク評価を行うステップであって、遺伝的リスク評価が、女性被験者由来の生物学的サンプル中で、少なくとも5個の、rs2981582、rs3803662、rs889312、rs13387042、rs13281615、rs4415084、rs3817198、rs4973768、rs6504950およびrs11249433またはこれらの1以上と連鎖不平衡にある一塩基多型からなる群より選択される乳癌表現型と関連することが知られている一塩基多型の存在を検出することを含む、ステップ；および
臨床的リスク評価と遺伝的リスク評価とを乗算することによって、乳癌表現型の発症についてのヒト女性被験者のリスクを取得するステップ、
ここで前記少なくとも5個の一塩基多型は、少なくともrs2981582、rs3803662、rs889312、rs13387042およびrs4415084またはその1以上と連鎖不平衡にある一塩基多型を含むものである、
を含む方法。
臨床的リスク評価によって分析された、乳癌表現型の発症についてのヒト女性被験者のリスクが再分類されるべきかどうかの判定を補助する方法であって、以下のステップ：
臨床的リスク評価と遺伝的リスク評価とを乗算することによって、乳癌表現型の発症についてのヒト女性被験者のリスクを取得するステップであって、遺伝的リスク評価が、女性被験者由来の生物学的サンプル中で、少なくとも5個のrs2981582、rs3803662、rs889312、rs13387042、rs13281615、rs4415084、rs3817198、rs4973768、rs6504950およびrs11249433またはその1以上と連鎖不平衡にある一塩基多型からなる群より選択される乳癌表現型と関連することが知られている一塩基多型の存在を検出することを含む、ステップ；および
臨床的リスク評価と遺伝的リスク評価とを乗算することが、乳癌表現型の発症についての該被験者のリスクの再分類につながるかどうか、を判定するステップ、
ここで前記少なくとも5個の一塩基多型は、少なくとも、rs2981582、rs3803662、rs889312、rs13387042およびrs4415084またはその1以上と連鎖不平衡にある一塩基多型を含むものである、
を含む方法。
前記方法が0.01または0.05より高い純再分類改善(NRI)を有する、請求項2記載の方法。
臨床的リスク評価により判定された5年リスクが1.5％〜2％である、請求項2記載の方法。
臨床的リスク評価を行うステップが、Gailモデル、Clausモデル、Clausテーブル、BOADICEA、Jonkerモデル、Claus拡張式、Tyrer-Cuzickモデル、およびManchesterスコアリングシステムからなる群より選択されるモデルを用いる、請求項1〜4のいずれか一項記載の方法。
臨床的リスク評価を行うステップが、次の項目：乳癌、乳管癌または小葉癌の病歴、年齢、初潮年齢、初産年齢、乳癌の家族歴、以前の乳房生検の結果、および人種/民族、の1つ以上に関する情報を前記女性から取得することを含む、請求項1〜5のいずれか一項記載の方法。
臨床的リスク評価がGailモデルを用いて得られる、請求項5または6記載の方法。
一塩基多型がrs2981582、rs3803662、rs889312、rs13387042、rs13281615、rs4415084、およびrs3817198、またはこれらの1つ以上と連鎖不平衡にある一塩基多型からなる群より選択される、請求項1〜7のいずれか一項記載の方法。
一塩基多型がrs2981582、rs3803662、rs889312、rs13387042、rs13281615、rs4415084、rs3817198、rs4973768、rs6504950およびrs11249433、またはこれらの1つ以上と連鎖不平衡にある一塩基多型からなる群より選択される、請求項1〜7のいずれか一項記載の方法。
一塩基多型が、共変量のない対数加法モデルの下でロジスティック回帰により、乳癌との関連性について個別に検定される、請求項1〜9のいずれか一項記載の方法。
前記女性が白人である、請求項1〜10のいずれか一項記載の方法。
前記女性が乳房の生検を受けたことがある、請求項1〜11のいずれか一項記載の方法。
前記請求項1〜12のいずれか一項記載の方法の結果が、前記女性の乳癌表現型の発症リスクが高いことを示すものである場合、当該女性はより頻繁なスクリーニングおよび/または予防的抗乳癌療法を受けるべきであると評価されることが補助される、請求項1〜12のいずれか一項記載の方法。
請求項1〜13のいずれか一項記載の方法により被験者が乳癌の発症リスクがあると判定される場合、その被験者はエストロゲン抑制に非応答性であるよりも応答性である可能性が高いと評価されることが補助される、請求項1〜13のいずれか一項記載の方法。
5つ以上の核酸を増幅するための少なくとも5つのプライマーセットを含むキットであって、前記5つ以上の核酸が、独立して、rs2981582、rs3803662、rs889312、rs13387042、rs13281615、rs4415084、rs3817198、rs4973768、rs6504950およびrs11249433、またはこれらの1つ以上と連鎖不平衡にある一塩基多型からなる群より選択される少なくとも5つの一塩基多型のうちの1つを含むものであり、
ここで前記少なくとも5つの一塩基多型は、少なくともrs2981582、rs3803662、rs889312、rs13387042およびrs4415084、またはこれらの1つ以上と連鎖不平衡にある一塩基多型を含む、上記キット。
rs2981582、rs3803662、rs889312、rs13387042、rs13281615、rs4415084、rs3817198、rs4973768、rs6504950およびrs11249433、またはこれらの1つ以上と連鎖不平衡にある一塩基多型からなる群より選択される少なくとも5つの一塩基多型を独立して含む、少なくとも5つの核酸を含む遺伝子アレイ、
ここで前記少なくとも5つの一塩基多型は、少なくともrs2981582、rs3803662、rs889312、rs13387042およびrs4415084、またはこれらの1つ以上と連鎖不平衡にある一塩基多型を含む、前記遺伝子アレイ。
請求項1〜14のいずれか一項記載の方法を用いて、乳癌表現型の発症についてのヒト女性被験者のリスクを評価することを含む、乳癌についてのヒト女性被験者の定期的診断検査の必要性を判定することを補助する方法。
ヒト女性被験者における乳癌のスクリーニングを補助する方法であって、請求項1〜14のいずれか一項記載の方法を用いて、乳癌表現型の発症についての該被験者のリスクを評価し、それらが乳癌の発症リスクをもつと評価される場合には、該被験者において乳癌を定期的にスクリーニングすることを含む、上記方法。
請求項1〜14のいずれか一項記載の方法を用いて、乳癌表現型の発症についてのヒト女性被験者のリスクを評価することを含む、予防的抗乳癌療法についてのヒト女性被験者の必要性の判定を補助する方法。
候補治療法の臨床試験のためにヒト女性被験者のグループの層別化を補助する方法であって、請求項1〜14のいずれか一項記載の方法を用いて、乳癌表現型の発症についての各被験者のリスクを評価し、その評価の結果を用いて該治療法に応答する可能性が高い被験者を選別することを含む、上記方法。