本願明細書に記載されたリスク変異体を利用するコンピューターで実施されるシステムを図示する略図を提供する。
本発明は、乳癌に関連することが見出された多型の変異体およびハプロタイプを開示する。染色体9、10、11、14、18および22上の多型マーカーの特定の対立遺伝子は、乳癌の発生のリスクと関連することが見出された。このようなマーカーおよびハプロタイプは、診断目的、薬剤反応の予測方法および治療進行の予測方法に対して、本願明細書にさらに詳細に記載されるように、有用である。本発明のさらなる適用は、本発明の多型マーカーを利用した、手術または放射線による乳癌治療に対する反応を評価するための方法、および本発明の方法の使用のためのキットを含む。
(定義)
別段の表示がない限り、核酸配列は、左から右に、5’から3’方向に書かれる。本願明細書で挙げられる数値的範囲は、範囲を定める数字を含み、定義された範囲内の各整数またはいずれの非整数有理数を含む。別段の定義がない限り、本願明細書で使用される全ての技術用語および科学用語は、本発明が関与する技術分野の当業者によって通常理解されるものと同義である。
下記の用語は、本願の構成では、下記に示される意味を有するものとする。
「多型マーカー」は、「マーカー」と呼ばれることもあり、本願明細書に記載される場合、ゲノム多形性部位を意味する。各多型マーカーは、多形性部位の特定の対立遺伝子に特徴のある少なくとも2つの配列多様性を有する。従って、多型マーカーの遺伝的関連は、その特定の多型マーカーの少なくとも1つの特定の対立遺伝子に関連があることを意味する。当該マーカーは、一塩基多型(SNP)、ミニサテライトまたはマイクロサテライト、転座およびコピー数の変異(挿入、欠失、重複)を含む、ゲノム中に見出されるいずれの変異型のいずれの対立遺伝子をも含み得る。多型マーカーは、集団における測定可能な頻度のいずれであってもよい。疾病遺伝子のマッピングのためには、集団頻度が5〜10%よりも高い多型マーカーが一般的に最も有用である。しかし、多型マーカーもまた、特定のコピー数変異(CNV)について、より低い集団頻度(1〜5%頻度、またはさらに低い頻度など)を有するかも知れない。当該用語は、本願の構成においては、いずれの集団頻度の多型マーカーを含むように解釈されるものとする。
「対立遺伝子」は、染色体の所定の遺伝子座(位置)のヌクレオチド配列を意味する。多型マーカー対立遺伝子は、従って、染色体上のマーカーの構成(すなわち、配列)を意味する。個体のゲノムDNAは、各染色体上のマーカーの各コピーを代表する、いずれの所定の多型マーカーの2つの対立遺伝子を含む。本願明細書で使用されるヌクレオチドの配列コードは、A=1、C=2、G=3、T=4である。マイクロサテライト対立遺伝子のために、CEPH試料(ヒト多型研究センター、ゲノム貯蔵所、CEPH試料1347−02)を参照として使用し、試料中の各マイクロサテライトのより短い対立遺伝子を0と設定し、他の試料中の全ての他の対立遺伝子に、当該参照に関連して番号を付けた。従って、例えば、対立遺伝子1は、CEPH試料中のより短い対立遺伝子より1bp長く、対立遺伝子2は、CEPH試料中のより短い対立遺伝子より2bp長く、対立遺伝子3はCEPH試料中の下位の対立遺伝子より3bp長いなどであり、対立遺伝子−1は、CEPH試料中のより短い対立遺伝子よりも1bp短く、対立遺伝子−2は、CEPH試料中のより短い対立遺伝子より2bp短いなどである。
「一塩基多型」または「SNP」は、ゲノムの特異的な部位の1つのヌクレオチドが種のメンバー間または個体の対の染色体間で異なる場合に生じる、DNA配列の多様性である。大部分のSNP多型は、2つの対立遺伝子を有する。当該例では、各個体は、多型の1つの対立遺伝子のホモ接合(すなわち、個体の染色体のコピーの両方が、SNP部位の同一のヌクレオチドを有する)であるか、または、個体はヘテロ接合(すなわち、異なるヌクレオチドを含む個体の2つの姉妹染色体)である。本願明細書で報告されたSNPの命名は、国立バイオテクノロジー情報センター(NCBI)によって各特有のSNPに割り当てられた公式の参照SNP(rs)ID同定タグを意味する。
本願明細書記載の配列コヌクレオチド(conucleotide)の多義性は、IUPAC−IUBによって提唱される通りである。これらのコードは、EMBL、GenBank、およびPIRデータベースによって使用されるコードと両立する。
本願明細書中に与えられる配列表は、表1〜4の中で本願明細書に示される多型マーカーについての隣接配列を提供する。多形性部位は、上記の配列コヌクレオチドの多義コードを使用して当該配列の中に示されている。
1より大きい配列が集団(自然の集団または合成の集団(例えば、合成分子のライブラリー)のいずれか)において可能性のあるヌクレオチドの位置は、本願明細書では「多形性部位」と呼ばれる。
「変異」は、本願明細書に記載される場合、参照DNAと異なるDNAの分節を意味する。「マーカー」または「多型マーカー」は、本願明細書に定義されるように、変異である。参照と異なる対立遺伝子は、「変異」対立遺伝子と呼ばれる。
「マイクロサテライト」は、特定の部位の長さが2〜8ヌクレオチドの塩基の複数の小さい反復(CA反復など)を有する多型マーカーであり、反復長の数は一般的な集団において変化する。
「インデル」は、典型的にはわずか数ヌクレオチド長の小さな挿入または欠損を含む、多型性の一般的な形態である。
「ハプロタイプ」は、本願明細書に記載される場合、分節に沿って並んだ対立遺伝子の特定の組み合わせによって特徴付けられる一本鎖DNA内のゲノムDNAの分節を意味する。ヒトなどの2倍体の生物では、ハプロタイプは各多型マーカーまたは遺伝子座の対の対立遺伝子の1つのメンバーを含む。ある実施態様では、当該ハプロタイプは、2つ以上の対立遺伝子、3つ以上の対立遺伝子、4つ以上の対立遺伝子、または5つ以上の対立遺伝子を含み得る。
用語「感受性」は、本願明細書に記載されるように、増加した感受性および減少した感受性の両方を包含する。従って、本発明の特定の多型マーカーおよび/またはハプロタイプは、1よりも大きい相対リスク(RR)によって特徴付けられるように、または1よりも大きいオッズ比(OR)であるように、乳癌の増加した感受性(すなわち、増加したリスク)の特性を示していてもよい。あるいは、本発明のマーカーおよび/またはハプロタイプは、1未満の相対リスクまたは1未満のオッズ比によって特徴付けられるように、乳癌の減少した感受性(すなわち、減少したリスク)の特徴を表わす。ハプロタイプは、本願明細書では、マーカー名およびそのハプロタイプのマーカーの対立遺伝子に関連して記載され、例えば、「A rs9956546」は、そのハプロタイプ中のマーカーrs995654のA対立遺伝子を意味し、この命名は、「rs9956546対立遺伝子A」および「A−rs9956546」に等しい。さらに、ハプロタイプにおける対立形質のコードは、個体マーカーについてのものと同じようであり、すなわち、1=A、2=C、3=Gおよび4=Tである。
用語「感受性」は、本願明細書に記載される場合、ある状態(例えば、ある形質、表現型または疾病(例えば、乳癌))の発生または、平均的な個体よりも特定の状態に抵抗できないことに対する個体の易発性を意味する。当該用語は、増加した感受性および減少した感受性の両方を包含する。従って、本発明の多型マーカーにおける特定の対立遺伝子および/またはハプロタイプは、本願明細書に記載されるように、1より大きいその特定の対立遺伝子またはハプロタイプの相対リスク(RR)、またはオッズ比(OR)によって特徴付けられるように、乳癌の増加した感受性(すなわち、増加したリスク)に特徴があってもよい。あるいは、本発明のマーカーおよび/またはハプロタイプは、1未満の相対リスクによって特徴付けられるように、乳癌の減少した感受性(すなわち、減少したリスク)に特徴がある。
用語「および(ならびに、かつ)/または(もしくは)」は、本願の構成では、当該用語によって結合された項目のいずれかまたは両方が関連することを示すことが理解されるだろう。換言すれば、本願明細書におけるこの用語は、「いずれかまたは両方」を意味することが捉えられるだろう。
用語「検査表」は、本願明細書に記載される場合、データの一形態を別の形態と関連付ける表、または、1もしくは複数の形態のデータを、当該データが関連する予測される成果(表現型または形質など)と関連付ける表である。例えば、検査表は、少なくとも1つの多型マーカーの対立遺伝子のデータと、特定の対立遺伝子のデータを含む個体が示しやすいまたは特定の対立遺伝子のデータを含まない個体よりも示しやすい特定の形質もしくは表現型(特定の疾病診断など)との間の相関を含み得る。検査表は、多次元的であり得、すなわち、単一のマーカーの複数の対立遺伝子についての情報を同時に含み得、または、複数のマーカーについての情報を含み得、他の因子(疾病診断の特徴、人種の情報、バイオマーカー、生化学的測定、治療方法または薬剤など)も含んでいてもよい。
「コンピューター可読媒体」は、市販または特注のインターフェースを使用した、コンピューターによって接続され得る情報記憶媒体である。典型的なコンピューター可読媒体は、メモリ(例えば、RAM、ROM、フラッシュメモリなど)、光学式記憶媒体(例えば、CD−ROM)、磁気記憶媒体(例えば、コンピューターのハードドライブ、フロッピー(登録商標)ディスクなど)、パンチカードまたは他の市販の媒体を含む。情報は、興味のあるシステムと媒体との間、コンピューター間、またはコンピューターと、記憶した情報を保存または接続するコンピューター可読媒体との間で転送されてもよい。このような転送は、電気的であり得、または他の利用可能な方法(IRリンク、無線接続など)によってもよい。
「核酸試料」は、核酸(DNAまたはRNA)を含む個体から入手した試料である。ある実施態様、すなわち、特異的な多型マーカーの検出および/またはハプロタイプの検出では、当該核酸試料はゲノムDNAを含む。このような核酸試料は、ゲノムDNAを含むいずれの供給源(血液試料、羊水試料、脳脊髄液試料、または皮膚、筋肉、頬側粘膜もしくは結膜粘膜、胎盤、消化管もしくは他の器官から得た組織試料を含む)からも得られ得る。
用語「乳癌の治療薬」は、乳癌に関連する症候の寛解または予防に使用され得る薬剤を意味する。
用語「乳癌に関連した核酸」は、本願明細書に記載される場合、乳癌に関連することが見出された核酸を意味する。これは、本願明細書記載のマーカーおよびハプロタイプ、ならびにそれらと強い連鎖不平衡(LD)のマーカーおよびハプロタイプを含むが、これらに限定されない。
用語「乳癌」は、本願明細書に記載されるように、乳癌のいずれかの臨床的診断を意味し、乳癌の特定の亜表現型のいずれかおよび全てを含む。例えば、乳癌は、エストロゲン受容体(ER)陽性の乳癌またはエストロゲン受容体陰性の乳癌として分類されることがある。乳癌はまた、プロゲステロン受容体(PR)陽性または陰性として分類されることもある。乳癌は、さらに、浸潤性乳管癌として、浸潤性小葉癌として、管状癌として、または他の浸潤性乳癌または混合型浸潤性乳癌として診断されることがある。乳癌はまた、髄様DCIS(非浸潤性乳管癌)またはLCIS(非浸潤性小葉癌)、または他の非浸潤性乳癌として分類され得る。湿潤性乳癌はまた、ステージ0、ステージ1、ステージ2(ステージ2aおよびステージ2bを含む)、ステージ3(ステージ3a、ステージ3bおよびステージ3cを含む)またはステージ4乳癌として定められ得る。本願の構成においては、「乳癌」は、乳癌のこれらの亜表現型のいずれをも含むことができ、また、いずれの他の臨床的に適用できる乳癌の亜表現型をも含む。
用語「全ての乳癌」または「全てのBC」は、乳癌と診断された全ての個体を意味する。
用語「媒体素因の」乳癌または「MedPreの」乳癌は、乳癌の亜表現型を意味する。当該表現型の定義は、発端者が少なくとも1つの下記の判断基準を満たすことを必要とする。
当該発端者は、3減数分裂事象(meiotic events)(3M)の遺伝的距離内の、3人以上の罹患した近親者を含む乳癌の症例の集団の一員である。
当該発端者は、3M以内で関連する、罹患したペアの一員であり、ペアの一人は50歳以下のときに診断された。
当該発端者は、3M以内で関連する、罹患したペアの一員であり、ペアの一人はいずれかのタイプの続発性原発腫瘍であると診断された。
当該発端者は、いずれかのタイプの続発性原発腫瘍であると診断された。
用語「多発性原発性乳癌」、または「MPBC」は、本願明細書に記載される場合、最初の乳癌の診断に加えて少なくとも1つの原発性腫瘍が診断され、2つの腫瘍が臨床的に、かつ組織学的検査によって、別個の原発性腫瘍であることが確かめられ、最初の乳癌と同時に、またはその後に生じており、対側乳房または同側乳房に生じている症例を意味する。
用語「家族歴スコア」または「FHS」は、本願明細書に記載される場合、疾病の発端者の乳癌に罹患した近親者の数に基づいて定義される。各発端者について、スコア1は各罹患した第一度近親者に割り当てられ、0.5は各罹患した第二度近親者に割り当てられ、0.25は各第三度近親者に割り当てられる。従って、全ての罹患した近親者にわたって得られた累計は、合計された家族歴スコアまたはFHSを表す。
用語「エストロゲン受容体陽性の乳癌」、または「ER陽性の乳癌」は、本願明細書で定義される場合、エストロゲン受容体について陽性と判定された腫瘍を意味する。本願の構成においては、ERレベルが10fmol/mg以上、および/または免疫組織化学的な知見で陽性の核が10%以上であるときは、ER陽性であると考えられる。ER陽性であるという判断基準を満たさない乳癌は、本願明細書では、「ER陰性」または「エストロゲン受容体陰性」と定義される。
用語「プロゲステロン受容体陽性の乳癌」、または「PR陽性の乳癌」は、本願明細書に記載されるように、プロゲステロン受容体が陽性と判定された腫瘍を意味する。本願の構成においては、10fmol/mg以上のPRレベルおよび/または10%以上の陽性の核についての免疫組織化学的な知見は、PR陽性であると考えられる。PR陽性であるという判断基準を満たさない乳癌は、本願明細書では、「PR陰性」または「プロゲステロン受容体陰性」として定められる。
本願明細書に記載される用語「PAX5」または「PAX5遺伝子」は、ヒト染色体9p13上のBSAPとしても知られるPAIRED BOX GENE 5遺伝子を指す。
本願明細書に記載される用語「TUB」または「rd5遺伝子」は、ヒト染色体11p15.5上のTubby homolog(マウス)遺伝子を指す。
本願明細書に記載される用語「SERPINH1」は、ヒト染色体11上のセルピンペプチダーゼ阻害剤、clade H(ヒートショックタンパク質47)、member 1、(コラーゲン結合タンパク質1)遺伝子を指す。
また、本願明細書に記載される、「REC2;R51H2;hREC2;RAD51BまたはMGC34245」とも呼ばれる用語「RAD51L1 X遺伝子」は、ヒト染色体14q23−24上に位置するタンパク質コード遺伝子を指す。
さらに、本願明細書に記載される、「FHOS2遺伝子」または「Formactin2」としても知られる用語「FHOD3遺伝子」は、ヒト染色体18q12上に位置するタンパク質コード遺伝子であるformin homolog 2 domain containing 3遺伝子を表す。
最後に、本願明細書に記載される、「KIAA1093」としても知られる用語「TNRC6B」または「TNRC6B遺伝子」は、ヒト染色体22q13上に位置するタンパク質コード遺伝子である、trinucleotide repeat containing 6Bを指す。
本発明の乳癌と診断された個体の集団の関連分析を通じて、染色体9、10、11、14、18および22上のある多型マーカーのある対立遺伝子は、乳癌と関連することが発見された。癌と関連する変異体についてのゲノム全体での分析は、乳癌と、9つの染色体の領域、すなわち
染色体9、位置36,806,001〜36,859,001の間(LDブロックC09);
染色体10、位置8,643,001〜8,817,001の間(LDブロックC10A);
染色体10、位置9,077,001〜9,264,001の間(LDブロックC10B);
染色体11、位置8,053,258〜8,191,268の間(LDブロックC11A);
染色体11、位置74,886,341〜74,971,341の間(LDブロックC11B);
染色体14、位置68,035,712〜68,130,712の間(LDブロックC14);
染色体18、位置32,110,012〜32,145,012の間(LDブロックC18);
染色体22、位置38,704,907〜38,859,907の間(LDブロックC22A);
染色体22、位置38,859,907〜39,411,907の間(LDブロックC22B);
(すべての位置はNCBI ビルド36の座標に対応する)との関連を明らかにした。
これらの領域内の特定のマーカーは、これらの部位における乳癌の増加したリスクに関連することが見出された。
イルミナ ヒトHap300マイクロアレイ技術を使用した、約1840のアイスランド人の乳癌患者および30,350の対照の平均の遺伝子型の同定を通じて、いくつかの染色体部位上の多数のマーカーが、乳癌との関連を示すことが見出された(表1)。特に、9個のSNP;rs2005154、rs2184380、rs2224696、rs2242503、rs12291026、rs999737、rs9956546、rs11912922およびrs6001954は、乳癌の増加したリスクに関連することが見出された。
アイスランド、オランダ、スペインおよびスウェーデンからのさらなるコホートにおける追跡調査解析は、当該9つのマーカーの関連シグナルが実際有意であるということを示した(表3)。これらのマーカー、およびこれらのマーカーのうちのいずれか1つと連鎖不平衡の代用マーカーは、従って、個体における乳癌のリスクを予測するために有用である。代表的な代用マーカーは、本願明細書中の表4に与えられる。
従ってこれらのマーカーは、上記のマーカーのうちのいずれか1つとLDであるため乳癌を予測するマーカーを含むと特に予想される9つの染色体の領域を同定する。これらの領域は、本願明細書中では、LDブロックC09、LDブロックC10A、LDブロック10B、LDブロックC11A、LDブロックC11B、LDブロックC14、LDブロックC18、LDブロックC22A、およびLDブロックC22Bとも呼ばれる。
当業者なら、当該9つのアンカーマーカーrs2005154、rs2184380、rs2224696、rs2242503、rs12291026、rs999737、rs9956546、rs11912922およびrs6001954のうちのいずれかとLDのマーカーは、本願明細書で定義されるLDブロックの外側に位置し得るということはわかるであろう。これは、LDが、通常定められるLDブロックの見かけ上の物理的な境界(高組み換え率の領域によって通常定められる境界)を超えてひろがり得るという事実の結果である。これらの9つのマーカーとLDのこのような代用マーカーもまた、本発明のために有用であると特に企図され、従って本発明の範囲内にある。
(マーカーおよびハプロタイプの評価)
集団内のゲノム配列は、個体を比較すると同一ではない。ある程度、ゲノムは、ゲノム中の多くの部位で、個体間の配列変異性を呈する。このような配列の変異は、通常、多型性と呼ばれ、各ゲノム内に多くのこのような部位がある。例えば、ヒトゲノムは、平均500塩基対ごとに生じる配列多様性を呈する。最も一般的な配列変異は、ゲノム中の単一の塩基位置の塩基変異からなり、このような配列変異、または多型性は、通常、一塩基多型(「SNP」)と呼ばれる。これらのSNPは、単一の突然変異事象によって生じていると考えられ、従って、通常、各SNP部位において可能性を有する、2つの可能性のある対立遺伝子がある(本来の対立遺伝子および変異した(一方の)対立遺伝子)。自然の遺伝的浮動、および、おそらくまた、選択圧によって、最初の変異は、いずれの所定の集団におけるその対立遺伝子の特定の頻度によって特徴付けられる多型性をもたらす。配列変異の多くの他の型は、ヒトゲノムにおいて見出され、ミニサテライトおよびマイクロサテライト、ならびに挿入、欠損、逆位(コピー数多型(CNV)とも呼ばれる)を含む。多型のマイクロサテライトは、複数の小塩基反復(CA反復、相補鎖上のTGなど)を、反復長数が一般的な集団において異なる特定の部位に有する。一般論では、多形性部位に関する配列の各バージョンは、多形性部位の特定の対立遺伝子を表す。全ての配列変異は、問題になっている配列変異を特徴付ける特定の多形性部位に生じる、多型性と呼ばれ得る。各ヒト個体は、各多形性部位に2つの対立遺伝子 −1つの母系対立遺伝子および1つの父系対立遺伝子− を有するが、一般に、多型性は、当該集団内のあらゆる数の特定の対立遺伝子を含み得る。従って、本発明の1つの実施態様では、当該多型性は、集団における2つ以上の対立遺伝子の存在によって特徴付けられる。別の実施態様では、当該多型性は、3つ以上の対立遺伝子の存在によって特徴付けられる。他の実施態様では、当該多型性は、4つ以上の対立遺伝子、5つ以上の対立遺伝子、6つ以上の対立遺伝子、7つ以上の対立遺伝子、9つ以上の対立遺伝子、または10以上の対立遺伝子によって特徴付けられる。全てのこのような多型性は、本発明の方法およびキットに使用され得、従って、本発明の範囲内である。
その存在量によって、SNPは、ヒトゲノムの配列変異性の大部分について説明する。600万超のヒトのSNPが、現在までに確認されている(http://www.ncbi.nlm.nih.gov/projects/SNP/snp_summary.cgi)。しかし、CNVは、ますます注目されている。これらの大規模な多型性(典型的には、1kb以上)は、構築されたヒトゲノムの実質的な割合に影響する多型の変異性を説明する。公知のCNVはヒトゲノム配列の15%超にわたる(covery)(Estivill,X Armengol;L.、PIoS Genetics 3:1787−99(2007)。http://projects.tcag.ca/variation/)。しかし、これらの多型性のほとんどは、非常にまれであり、平均して、各個体のゲノム配列の一部分のみに影響する。CNVは、遺伝子量の撹乱による遺伝子発現、表現型の変異性および適応に影響することが知られ、また、疾病(微小欠失疾患および微小重複疾患)の原因となることも知られ、一般的な複合疾患(HIV−1感染および糸球体腎炎を含む)のリスクを与える(Redon,R.ら、Nature 23:444−454(2006))。従って、前述のCNVまたは未知のCNVのいずれかが、当該疾病と関連のある本願明細書に記載されたマーカーと連鎖不平衡の、原因となる変異体を表わす可能性がある。CNVの検出方法は、比較ゲノムハイブリダイゼーション(CGH)および遺伝子型の同定(Carter (Nature Genetics 39:S16〜S21(2007))によって記載されたように、遺伝子型の同定アレイの使用を含む)を含む。ゲノムの変異体のデータベース(http://projects.tcag.ca/variation/)は、記載されたCNVの位置、型および大きさについての最新の情報を含む。当該データベースは、現在、21,000超のCNVのデータを含む。
いくつかの例では、参照対立遺伝子を選択することなく、多形性部位の異なる対立遺伝子が参照される。あるいは、参照配列は、特定の多形性部位を意味し得る。参照対立遺伝子は、「野生型」の対立遺伝子と呼ばれることもあり、それは、第1に配列決定された対立遺伝子、または「非罹患の」個体(例えば、形質または疾病の表現型を示さない個体)からの対立遺伝子のいずれかとして通常は選択される。
本願明細書で述べられたSNPマーカーの対立遺伝子は、多形性部位に生じる場合、塩基A、C、GまたはTを意味する。本願明細書で使用されるSNPについての対立遺伝子コードは、下記の通りである;1=A、2=C、3=G、4=T。ヒトのDNAは二本鎖であるので、当業者は、逆のDNA鎖のアッセイまたは解読によって、相補的な対立遺伝子が各症例において判定され得ることを理解するだろう。従って、A/G多型性によって特徴付けられる多形性部位(多型マーカー)について、当該マーカーを検出するために使用される方法論は、可能性のある2つの塩基(すなわちAおよびG)のうち1つまたは両方の存在を特異的に検出するように設計されてもよい。あるいは、鋳型DNA上の逆ストランドを検出するように設計されたアッセイを設計することで、相補的塩基TおよびCの存在が判定され得る。(例えば、相対リスクに関して)量的に、同一の結果が、いずれかのDNA鎖(+鎖または−鎖)の判定から得られうる。
典型的には、参照配列は、特定の配列を意味する。当該参照と異なる対立遺伝子は、「変異」対立遺伝子と呼ばれることもある。変異配列は、本願明細書で使用されるように、参照配列と異なるが、その他の点では実質的に類似である配列を意味する。本願明細書記載の多型の遺伝子マーカーの対立遺伝子は変異体である。変異体は、ポリペプチドに影響する変化を含み得る。配列の相違は、参照ヌクレオチド配列と比較した場合、以下を含み得る;フレームシフトをもたらす、1つのヌクレオチドの挿入もしくは欠損、または1より多いヌクレオチドの挿入もしくは欠損;コードされるアミノ酸中の変化をもたらす、少なくとも1つのヌクレオチドの変化;中途終止コドンの生成をもたらす、少なくとも1つのヌクレオチドの変化;ヌクレオチドによってコードされた1つまたは複数のアミノ酸の欠損をもたらす、いくつかのヌクレオチドの欠損;読み枠のコード配列の中断をもたらす、不等組み換えまたは遺伝子変換などによる1つまたはいくつかのヌクレオチドの挿入;全てまたは一部の配列の重複;転座;またはヌクレオチド配列の再編成。このような配列変化は、核酸によってコードされたポリペプチドを変化させ得る。例えば、核酸配列の変化がフレームシフトを引き起こすと、当該フレームシフトはコードされたアミノ酸の変化をもたらし得、および/または、切断されたポリペプチドの生成をもたらす、中途終止コドンの生成をもたらし得る。あるいは、多型性は、1つまたは複数のヌクレオチドにおける同義の変化(すなわち、アミノ酸配列の変化をもたらさない変化)であり得る。このような多型性は、例えば、スプライス部位を変化させ得、mRNAの安定性または輸送に影響し得、またはそうでなければコードされたポリペプチドの転写または翻訳に影響し得る。このような多型性はまた、構造の変化(増幅または欠損など)が体細胞レベルで生じる可能性を増加させるようにDNAを変化させ得る。参照ヌクレオチド配列にコードされたポリペプチドは、特定の参照アミノ酸配列を有する「参照」ポリペプチドであり、変異対立遺伝子によってコードされたポリペプチドは、変異アミノ酸配列を有する「変異」ポリペプチドと呼ばれる。
ハプロタイプは、DNAの一本鎖の分節に沿って並んだ対立遺伝子の特定の組み合わせによって特徴付けられる、そのDNAの一本鎖の分節を意味する。2倍体の生物(ヒトなど)では、ハプロタイプは、各多型マーカーまたは遺伝子座の対の対立遺伝子のうちの1のメンバーを含む。ある実施態様では、当該ハプロタイプは、2つ以上の対立遺伝子、3つ以上の対立遺伝子、4つ以上の対立遺伝子、または5つ以上の対立遺伝子(各対立遺伝子は分節に沿った特定の多型マーカーに対応する)を含み得る。ハプロタイプは、多形性部位において特定の対立遺伝子を有する、様々な多型マーカーの組み合わせ(例えば、SNPとマイクロサテライト)を含み得る。従って、ハプロタイプは、様々な遺伝子マーカーの対立遺伝子の組み合わせを含む。
特定の多型マーカーおよび/またはハプロタイプの検出は、多形性部位の配列の検出のための、当該技術分野で公知の方法によって達成され得る。例えば、SNPおよび/またはマイクロサテライトマーカーの存在についての遺伝子型の同定の標準的な技術(PCR、LCR、ネステッドPCRおよび核酸増幅のための他の技術を用いた、蛍光に基づいた技術(Chen X.ら、Genome Res.9(5):492−98(1999))など)が使用され得る。SNP遺伝子型の同定について利用可能な特定の市販の方法論は、TaqMan遺伝子型の同定アッセイおよびSNPlexプラットフォーム(アプライドバイオシステムズ(Applied Biosystems))、ゲル電気泳動(アプライドバイオシステムズ)、質量分析(例えば、MassARRAYシステム、シーケノム(Sequenom))、ミニ配列分析法、リアルタイムPCR、Bio−Plexシステム(バイオラッド(BioRad))、CEQおよびSNPstreamシステム(ベックマン(Beckman))、アレイハイブリダイゼーション技術(例えば、Affymetrix遺伝子チップ、パーレジェン(Perlegen))、ビーズアレイ技術(例えば、イルミナ GoldenGateおよびInfiniumアッセイ)、アレイタグ技術(例えば、Parallele)、およびエンドヌクレアーゼに基づいた蛍光ハイブリダイゼーション技術(インベーダー法、サードウェイブ(Third Wave))を含むが、これらに限定されない。利用できるアレイプラットフォームのいくつか(アフィメトリクス(Affymetrix)SNPアレイ 6.0およびイルミナ CNV370−デュオ(Duo)および1M ビーズチップス(BeadChips)を含む)は、あるCNVをタグするSNPを含む。これにより、これらのプラットフォームに含まれた代用SNPによって、CNVの検出が可能となる。当業者に利用可能なこれらのまたは他の方法の使用によって、多型マーカー(マイクロサテライト、SNPまたは他のタイプの多型マーカーを含む)の1つまたは複数の対立遺伝子を同定し得る。
ある実施態様では、多型マーカーは、配列決定技術によって検出される。個体についての配列情報を入手することで、当該配列の構成の中の特定のヌクレオチドが特定される。SNPについては、その特定のSNPにおける対立遺伝子を特定するためには、1つの特有の配列部位についての配列情報で十分である。複数のヌクレオチドを含むマーカーについては、当該多形性部位を含む個体のヌクレオチドについての配列情報は、特定の部位について当該個体の対立遺伝子を特定する。この配列情報は、当該個体由来の試料から入手され得る。ある実施態様では、当該試料は核酸試料である。ある他の実施態様では、当該試料はタンパク質試料である。
核酸配列を得るための種々の方法が当業者に公知であり、すべてのこのような方法が本発明を実施するために有用である。Sanger配列決定は、核酸配列情報を生成するための周知の方法である。大量の配列データを入手するための最近の方法が開発され、このような方法もまた、配列情報を入手するために有用であると企図される。これらとしては、パイロシークエンス技術(Ronaghi,M.ら Anal Biochem 267:65−71(1999);Ronaghiら、Biotechniques 25:876−873(1998))、例えば 454 パイロシークエンス(Nyren,P.ら、Anal Biochem 208:171−175(1993))、Illumina/Solexa配列決定技術(http://www.illumina.com;Strausberg,RLら、 Drug Disc Today 13:569−577(2008)も参照)、およびSupported Oligonucleotide Ligation and Detection Platform(SOLiD)技術(アプライドバイオシステムズ、http://www.appliedbiosystems.com);Strausberg、RLら、 Drug Disc Today 13:569−577(2008)が挙げられる。
遺伝子型が同定された個体の遺伝子型が同定されていない近親者についての遺伝子型を帰属させるまたは予測することが可能である。遺伝子型が同定されていない症例すべてについて、その4つの可能性のある段階的な遺伝子型が与えられれば、その近親者の遺伝子型の可能性を算出することが可能である。実際面では、その症例の親、子供、兄弟姉妹、片親違いの兄弟姉妹(half−siblings)(およびその片親違いの兄弟姉妹の親)、祖父母、孫(およびその孫の親)ならびに配偶者の遺伝子型だけを含めることが好ましくあり得る。各症例の周りで作り上げられた小さい下位系統(sub−pedigree)の中の個体は、その系統に含まれないいずれの経路を介しても関連しないと仮定されるであろう。当該症例に伝えられていない対立遺伝子は、同じ頻度−集団対立遺伝子頻度−を有するということも仮定される。対立遺伝子AおよびGを有するSNPマーカーを考えよう。この症例の近親者の遺伝子型の確率は、
によって計算され得る。式中、θは当該症例におけるA対立遺伝子の頻度を表す。近親者の各組の遺伝子型が独立であると仮定すると、これよりθについての尤度関数を書き下すことができる;
この独立性の仮定は、通常は正しくない。個体間の依存性を考慮することは、困難で極めて高価になる可能性がある計算タスクである。(*)の尤度関数は、すべての依存性を適正に考慮するθについての全尤度関数(full likelihood function)の擬似尤度近似と考えられ得る。一般に、症例−対照関連研究における遺伝子型が同定された症例および対照は独立ではなく、症例および対照を関連付けるために症例−対照法を適用することは、同様の近似である。ゲノム制御の方法(Devlin,B.ら、Nat Genet 36、1129−30;著者による回答 1131(2004))は、関連性についての症例対照検定統計量を調整するうえで成功していることが判明している。従って出願人らは、本発明の擬似尤度における項目間の依存性を考慮するためにゲノム制御の方法を適用し、妥当な検定統計量を生成する。
遺伝子型が同定されていない症例に起因する擬似尤度の一部分の有効サンプルサイズを見積もるために、Fisher情報量が使用され得る。全Fisher情報量、I、を遺伝子型が同定された症例に起因する部分、I
g、および遺伝子型が同定されていない症例に起因する部分、I
uに分け、I=I
g+I
u、そして遺伝子型が同定された症例の数をNで表すと、遺伝子型が同定されていない症例に起因する有効サンプルサイズは、
によって評価される。
本発明の構成では、疾病に対して増加した感受性(すなわち、増加したリスク)を有する個体は、当該疾病について増加した感受性(増加したリスク)を与える1つもしくは複数の多型マーカーの少なくとも1つの特定の対立遺伝子またはハプロタイプが同定された(すなわち、リスクのあるマーカー対立遺伝子またはハプロタイプ)個体である。当該リスクのあるマーカーまたはハプロタイプは、当該疾病の増加したリスク(または感受性)を与えるものである。1つの実施態様では、マーカーまたはハプロタイプに関連する有意性は、相対リスク(RR)によって判定される。別の実施態様では、マーカーまたはハプロタイプに関連する有意性は、オッズ比(OR)によって判定される。さらなる実施態様では、当該有意性は、割合(%)によって判定される。1つの実施態様では、有意に増加したリスクは、少なくとも1.2のリスク(相対リスクおよび/またはオッズ比)(少なくとも1.2、少なくとも1.3、少なくとも1.4、少なくとも1.5、少なくとも1.6、少なくとも1.7、1.8、少なくとも1.9、少なくとも2.0、少なくとも2.5、少なくとも3.0、少なくとも4.0、および少なくとも5.0を含むがこれらに限定されない)として判定される。特定の実施態様では、少なくとも1.2のリスク(相対リスクおよび/またはオッズ比)が有意である。別の特定の実施態様では、少なくとも1.3のリスクが有意である。さらに別の実施態様では、少なくとも1.4のリスクが有意である。さらなる実施態様では、少なくとも約1.5の相対リスクが有意である。別のさらなる実施態様では、リスクの有意な増加は、少なくとも約1.7が有意である。しかし、他のカットオフもまた考えられ、例えば、少なくとも1.15、1.25、1.35など、およびこのようなカットオフもまた本発明の範囲内である。他の実施態様では、リスクの有意な増加は、少なくとも約20%(約25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、100%、150%、200%、300%、および500%を含むがこれらに限定されない)である。1つの特定の実施態様では、リスクの有意な増加は、少なくとも20%である。他の実施態様では、リスクの有意な増加は、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、および少なくとも100%である。本発明を特徴付ける、当業者によって適しているとみなされる他のカットオフまたは範囲も、しかしまた考えられ、それらもまた本発明の範囲内である。ある実施態様では、リスクの有意な増加は、p値が0.05未満、0.01未満、0.001未満、0.0001未満、0.00001未満、0.000001未満、0.0000001未満、0.00000001未満、または0.000000001未満などの、p値によって特徴付けられる。
本発明のリスクのある多型マーカーまたはハプロタイプは、少なくとも1つのマーカーの少なくとも1つの対立遺伝子またはハプロタイプが、比較群(対照)におけるその存在の頻度と比較して、疾病もしくは形質のリスクのある(罹患した)、または疾病もしくは形質と診断された個体においてより頻繁に存在するものであり、当該マーカーまたはハプロタイプの存在が疾病または形質(例えば、乳癌)に対する感受性を示す。1つの実施態様では、対照群は、集団の試料、すなわち一般的な集団から得た確率標本であってもよい。対照群は、別の実施態様では、疾病フリーの個体群(すなわち、乳癌と診断されていない個体)によって表される。このような疾病フリーの対照は、1つの実施態様では、1つまたは複数の特定の疾病に関連する症候の不存在によって特徴付けられてもよい。別の実施態様では、当該疾病フリーの対照群は、1つまたは複数の疾病特異的な危険因子の不存在によって特徴付けられる。このような危険因子は、1つの実施態様では、少なくとも1つの環境的な危険因子である。代表的な環境的因子は、特定の疾病または形質について発生のリスクに影響することが知られる、または影響すると考えられる天然物、鉱物または他の化学薬品である。他の環境的な危険因子は、生活スタイルに関連する危険因子である(飲食の習慣、主な居住環境の地理的な位置、および職業性危険因子を含むが、これらに限定されない)。別の実施態様では、危険因子は、少なくとも1つの遺伝的危険因子である。
相関についての簡易な試験の例は、2×2の表のフィッシャーの正確確率検定であり得る。所定の染色体コホートについて、マーカーまたはハプロタイプの両方を含む染色体数、マーカーまたはハプロタイプのうち片方のみを含むが、もう片方は含まない染色体数、およびマーカーまたはハプロタイプのどちらも含まない染色体数から、2×2の表が作成される。当業者に知られた他の関連の統計検定もまた考えられ、これらもまた本発明の範囲内である。
当業者は、2つの対立遺伝子を有する多型マーカーが、検討された集団に存在し(SNPなど)、1つの対立遺伝子が、当該集団において形質または疾病を有する個体群中で対照と比較して増加した頻度が見出されると、マーカーのもう1つの対立遺伝子は、形質または疾病を有する個体群中で、対照と比較して、減少した頻度で見出されることが理解するだろう。このような場合は、マーカーの1つの対立遺伝子(形質または疾病を有する個体中で増加した頻度で見出されたもの)は、リスクのある対立遺伝子であり、一方、もう1つの対立遺伝子は保護的対立遺伝子となるだろう。
従って、本発明の他の実施態様では、疾病または形質について減少した感受性(すなわち、減少したリスク)を有する個体は、疾病または形質について減少した感受性を与える1つまたは複数の多型マーカーの少なくとも1つの特定の対立遺伝子またはハプロタイプが同定された個体である。減少したリスクを与えるマーカー対立遺伝子および/またはハプロタイプはまた、保護的であると言える。1つの態様では、保護マーカーまたはハプロタイプは、疾病または形質の有意に減少したリスク(または感受性)を与えるものである。1つの実施態様では、有意に減少したリスクは、0.90未満の相対リスク(0.85未満、0.80未満、0.75未満、0.7未満、0.6未満、0.5未満、0.4未満、0.3未満、0.2未満および0.1未満を含むが、これらに限定されない)として判定される。1つの特定の実施態様では、有意に減少したリスクは0.90未満である。別の実施態様では、有意に減少したリスクは、0.85未満である。さらに別の実施態様では、有意に減少したリスクは、0.80未満である。別の実施態様では、リスク(または感受性)の減少は、少なくとも10%(少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%および少なくとも98%を含むが、これらに限定されない)である。1つの特定の実施態様では、リスクの有意な減少は、少なくとも約15%である。別の実施態様では、リスクの有意な減少は、少なくとも約20%である。別の実施態様では、リスクの減少は、少なくとも約25%である。本発明を特徴付ける、当業者によって適しているとみなされる他のカットオフまたは範囲も、しかしまた考えられ、それらもまた本発明の範囲内である。
疾病または形質(例えば、乳癌)に関連する遺伝的変異は、所定の遺伝子型についての疾病のリスクを予測するために、単独で使用され得る。2対立形質のマーカー(SNPなど)については、3つの可能性のある遺伝子型がある(リスク変異のホモ接合体、ヘテロ接合体、およびリスク変異の非保有者)。複数の座位の変異と関連するリスクは、全体のリスクの評価に使用され得る。複数のSNP変異については、k個の可能性のある遺伝子型(k=3n×2p)がある。nは、常染色体の座位数であり、pは、ゴノソーマルな(gonosomal)(性染色体の)座位数である。全体のリスクアセスメントの算出は、通常、異なる遺伝的変異の相対リスクが掛かる、すなわち、特定の遺伝子型の組み合わせと関連する全体のリスク(例えば、RRまたはOR)が、各遺伝子座の遺伝子型のリスク値の積であることを想定している。性別および民族性をマッチさせた参照集団と比較して、示されたリスクが、ヒトまたはヒトの特定の遺伝子型の相対リスクである場合は、複合リスクは遺伝子座特異的なリスク値の積であり、また、これは当該集団と比較した全体的のリスク推定値と一致する。ヒトのリスクが、リスク対立遺伝子の非保有者との比較に基づく場合、複合リスクは、全ての座位の遺伝子型の所定の組み合わせを有する個人を、これらの座位のいずれでもリスク変異を有さない個体群と比較した推定値と一致する。いずれのリスク変異も有さない非保有者群は、最も低いリスク推定値を有し、自身(すなわち、非保有者)と比較した複合リスクが1.0であるが、集団と比較した全体のリスクは1.0未満である。非保有者群は潜在的に、特に多数の座位について、非常に小さいものであり得ることに注意すべきであり、この場合、その関連性は同様に小さい。
複合モデルは、通常、複合形質のデータにまずまず適合する簡潔なモデルである。多重度からの偏差は、一般的な疾病の一般的な変異に関連してまれに記載され、報告されたとしても、座位間の統計的相互作用を示すことができるように、非常に大きなサンプルサイズが通常要求されることから、通常、示唆的であるのみである。
例として、全部で7つの変異が乳癌に関連付けられている場合を考えることにする。1つのそのような例は、マーカーrs13387042、rs4415084、rs1219648、rs3803662、rs13281615、rs3817198およびrs889312によって与えられ、それらのうちのすべては、乳癌感受性についての市販されているdeCODE BreastCancer試験で使用される(http://www.decodediagnostics.com)。理論上の遺伝子型の組み合わせの総数は、37=2187である。これらの遺伝子型のクラスのいくつかは非常にまれであるが、依然として可能性があり、全体のリスクアセスメントに考慮されるべきである。複数の遺伝的変異の場合に適用される複合モデルはまた、遺伝的変異が「環境的な」因子と明瞭には相関していないとすると、非遺伝的危険変異と合わせることが妥当であろうと思われる。換言すれば、遺伝的リスクおよび非遺伝的リスクのある変異は、非遺伝的危険因子および遺伝的危険因子が相互作用していないとすると、複合リスクを推定するために複合モデル下で評価し得る。
同様の定量的アプローチを使用し、乳癌に関連する多数のこれらのおよび他の変異に関連する複合または全体のリスクを評価してもよい。これは、乳癌のリスクを予測すると本願明細書中で示され主張される変異を含む。
(連鎖不平衡)
各減数分裂事象の間に各染色体対に平均1度生じる、組み換えの自然現象は、自然が配列変異(および、結果生じる生物学的機能)をもたらす1つの方法を表す。組み換えはゲノム中でランダムには生じないことが発見された。ある程度、組み換え率の頻度に大きな変異があり、高い組み換え頻度の小領域(組み換えホットスポットとも呼ばれる)、および、低い組み換え頻度のより大きな領域(通常、連鎖不平衡(LD)ブロックと呼ばれる)をもたらす(Myers,S.ら、Biochem Soc Trans 34:526−530(2006);Jeffreys,A.J.ら、Nature Genet 29:217−222(2001);May,C.A.ら、Nature Genet 31:272−275(2002))。
連鎖不平衡(LD)は、2つの遺伝因子の非ランダム分類を意味する。例えば、特定の遺伝因子(例えば、多型マーカーの対立遺伝子、またはハプロタイプ)が0.50(50%)の頻度で集団に生じ、別の因子が0.50(50%)の頻度で生じると、当該因子のランダム分布を仮定すると、ヒトが両因子を有すると予測される発生率は0.25(25%)である。しかし、2つの因子が0.125より高い頻度でともに生じることが発見されると、それらの別個の発生頻度(例えば、対立遺伝子またはハプロタイプの頻度)における予測よりも高い割合で、ともに遺伝する傾向にあるため、当該因子は、連鎖不平衡であると言える。大まかに言うと、LDは、一般的に、2つの因子間の組み換え事象の頻度と相関する。対立遺伝子またはハプロタイプの頻度は、集団内の個体の遺伝子型の同定、および集団の各対立遺伝子またはハプロタイプの発生頻度の測定によって、集団において判定し得る。二倍体の集団(例えば、ヒト集団)については、個体は、典型的に各遺伝因子(例えば、マーカー、ハプロタイプまたは遺伝子)について2つの対立遺伝子を有するだろう。
多くの異なる基準が、連鎖不平衡(LD;Devlin,B.およびRisch,N.、Genomics 29:311−22(1995)において概説されている)の強さの評価について提案されてきた。大部分は、対の2対立形質の部位間の関連の強さをとらえる。2つの重要な対のLDの基準は、r2(Δ2と表示されることもある)および|D’|である(Lewontin,R.、Genetics 49:49−67(1964);Hill,W.G.およびRobertson,A. Theor.Appl.Genet.22:226−231(1968))。両基準とも、0(不平衡がない)から1(「完全な」不平衡)の範囲であるが、それらの解釈は少し異なる。|D’|は、2つのマーカーについて2つまたは3つのみの可能性のあるハプロタイプが存在する場合1に等しく、全ての4つの可能性のあるハプロタイプが存在する場合に<1となるように定義される。従って、<1の|D’|値は、背景の組み換えが、2つの部位間(再発性変異もまた、|D’|を<1にし得るが、一塩基多型(SNP)については、これは通常、組み換えよりも可能性が少ないと考えられる)で起きたかも知れないことを示す。基準のr2は、2つの部位間の統計的相関を表し、2つのハプロタイプのみが存在する場合は、値は1である。
r2基準は、r2と、感受性座位とSNPとの間の関連を検出するのに必要な試料サイズとの間に単純な逆の関連性があるため、関連マッピングについてのほぼ間違いなく最も関連する基準である。これらの基準は、対の部位について定義されるが、いくつかの適用については、どの位強いLDが、多くの多形性部位を含む全体の領域をわたっているかについての判定が望ましいだろう(例えば、LDの強さが座位間もしくは集団にわたって有意に異なっているかについての試験、または特定のモデル下で、領域に、予測されるよりも多かれ少なかれLDがあるかについての試験)。大まかに言うと、rは、データに見られるLDを生じるため、特定の集団モデル下で、どの位の組み換えが必要とされるかを判定する。この型の方法はまた、潜在的に、LDデータが組み換えホットスポットの存在についてのエビデンスを提供するかどうかについての判定の問題に対する、統計的に厳密なアプローチを提供し得る。本願明細書記載の方法において、連鎖不平衡であるマーカーを示すマーカーの間の有意なr2値は、少なくとも0.1(少なくとも0.15、0.2、0.25、0.3、0.35、0.4、0.45、0.5、0.55、0.6、0.65、0.7、0.75、0.8、0.85、0.9、0.91、0.92、0.93、0.94、0.95、0.96、0.97、0.98、または少なくとも0.99など)であり得る。1つの好ましい実施態様では、有意なr2値は、少なくとも0.2であり得る。あるいは、連鎖不平衡のマーカーは、本願明細書に記載される場合、少なくとも0.2の|D’|値(0.3、0.4、0.5、0.6、0.7、0.8、0.85、0.9、0.95、0.96、0.97、0.98、または少なくとも0.99など)によって特徴付けられる。従って、連鎖不平衡は、異なるマーカーの対立遺伝子の間の相関を表す。ある実施態様では、連鎖不平衡は、r2および|D’|基準の両方についての値によって定義される。1つのこのような実施態様では、有意な連鎖不平衡はr2>0.1および|D’|>0.8として定義され、これらの基準を満たすマーカーは連鎖不平衡であると言われる。別の実施態様では、有意な連鎖不平衡は、r2>0.2および|D’|>0.9として定義される。連鎖不平衡を判定するためのr2および|D’|の値の他の組み合わせおよび順列(permutation)もまた企図され、それらも本発明の範囲内である。連鎖不平衡は、本願明細書で定義されたように、単一のヒト集団において判定し得、または1人より多いヒト集団からの個体を含む試料の収集物において判定し得る。本発明の1つの実施態様では、LDは、(http://www.hapmap.org)で定義されたように、1つまたは複数のHapMap集団(コーカサス人、アフリカ人(ヨルバ族)、日本人、中国人)から得られた試料で判定される。このような実施態様の1つでは、LDは、HapMap試料のCEU集団(北ヨーロッパおよび西ヨーロッパ出身の祖先を有するユタ州の居住者)で判定される。別の実施態様では、LDは、HapMap試料(ナイジェリア、イバダン(Ibadan)のヨルバ族)のYRI集団において判定される。別の実施態様では、LDは、HapMap試料(中国、北京出身の漢民族)のCHB集団において判定される。別の実施態様では、LDは、HapMap試料(日本、東京出身の日本人)のJPT集団において判定される。さらに別の実施態様では、LDは、アイスランド人の集団由来の試料において判定される。
ゲノム中の全ての多型性が、集団レベルで同一の場合、それらのことごとくが、関連研究において検討されることが必要だろう。しかし、多型間の連鎖不平衡により、密接に連鎖した多型は強く関連し、有意な関連を観察するために関連研究において検討される必要がある多型の数は減る。LDの別の結果は、多くの多型が、これらの多型が強く関連するという事実によって関連シグナルを与える可能性がある、ということである。
ゲノムLDマップは、ゲノムにわたって作成されてきており、このようなLDマップは、疾病遺伝子のマッピングのためのフレームワークとして役立つと提案されてきている(Risch N.およびMerkiangas K、Science 273:1516−1517(1996);Maniatis N.ら、Proc Natl Acad Sci USA 99:2228−2233(2002);Reich DEら、Nature 411:199−204(2001))。
今では、ヒトゲノムの多くの部分が、少数の共通のハプロタイプを含む一連の別々のハプロタイプブロックに切断され得ることが確立されている。これらのブロックについては、連鎖不平衡データは、組み換えを示すエビデンスをわずかに提供するにすぎない(例えば、Wall.、J.D.およびPritchard,J.K.、Nature Reviews Genetics 4:587−597(2003);Daly,M.ら、Nature Genet.29:229−232(2001);Gabriel,S.B.ら、Science 296:2225−2229(2002);Patil,N.ら、Science 294:1719−1723(2001);Dawson,E.ら、Nature 418:544−548(2002);Phillips,M.S.ら、Nature Genet.33:382−387(2003)を参照)。
これらのハプロタイプブロックを定義する2つの主な方法がある。ブロックは、限られたハプロタイプの多様性を有するDNAの領域(例えば、Daly,M.ら、Nature Genet.29:229−232(2001);Patil,N.ら、Science 294:1719−1723(2001);Dawson,E.ら、Nature 418:544−548(2002);Zhang,K.ら、Proc.Natl.Acad.Sci.USA 99:7335−7339(2002)参照)、または、連鎖不平衡を使用して同定された、広範な背景の組み換えを有する転位ゾーン間の領域(例えば、Gabriel,S.B.ら、Science 296:2225−2229(2002);Phillips,M.S.ら、Nature Genet.33:382−387(2003);Wang,N.ら、Am.J.Hum.Genet.71:1227−1234(2002);Stumpf,M.P.およびGoldstein,D.B.、Curr.Biol.13:1−8(2003)参照)として定義され得る。つい最近では、ヒトゲノムにわたる組み換え率および対応するホットスポットの、詳細なスケールのマップが、作成されてきている(Myers,S.ら、Science 310:321−32324(2005);Myers,S.ら、Biochem Soc Trans 34:526530(2006))。当該マップは、組み換え率が、ホットスポット中で10〜60cM/Mbほど高く、一方、介在性領域では0に近く、従って、限られたハプロタイプの多様性および高いLDの領域を表す、ゲノムにわたる組み換えにおける莫大な変異を明らかにした。従って、当該マップは、組み換えホットスポットに隣接した領域として、ハプロタイプブロック/LDブロックを定義することに使用され得る。本願明細書で使用されるように、用語「ハプロタイプブロック」または「LDブロック」は、上述の特性、またはこのような領域を定義するために当業者によって使用される他の別の方法のいずれかによって定義されるブロックを含む。
例えば本願明細書に記載される用語「LDブロックC09」は、NCBI(国立バイオテクノロジー情報センター)ビルド36の位置36,806,001〜36,859,001の間の染色体9上の連鎖不平衡(LD)ブロックを指す。以下の表は、本願中で言及される、NCBI ビルド36中の9つのLDブロックの染色体上の位置を定める。
ハプロタイプブロック(LDブロック)は、1つのマーカーまたは複数のマーカーを含むハプロタイプを使用して、表現型とハプロタイプ状態との間の関連をマッピングするために使用され得る。これらの主なハプロタイプは各ハプロタイプブロックにおいて特定され得、次いで一連の「タグした(tagging)」SNPまたはマーカー(当該ハプロタイプを区別するために必要とされるSNPまたはマーカーの最小の組)が同定され得る。これらのタグしたSNPまたはマーカーは、表現型とハプロタイプとの間の関連を特定するために、個体群由来の試料の評価で使用され得る。乳癌に関連すると本願明細書に示されるマーカーは、このようなタグしたマーカーである。当該ハプロタイプブロック間で連鎖不平衡が存在し得るため、所望の場合、隣接するハプロタイプブロックは、同時に評価され得る。
従って、ゲノム中の多型マーカーへの、所定の認められた関連のいずれについても、ゲノム中のさらなるマーカーもまた関連を示すことが明らかになって来た。このことは、組み換え率の大きな変動によって認められたように、ゲノムにわたるLDの不均等な分布の当然の結果である。従って、関連の検出のために使用されたマーカーは、ある意味では、所定の疾病または形質と関連する、ゲノム領域(すなわち、ハプロタイプブロックまたはLDブロック)の「タグ」を表す。1つまたは複数の原因である(機能的)変異体または変異は、疾病または形質に関連することが見出された領域内に属していてもよい。機能的な変異体は、別のSNP、タンデムリピート多型性(ミニサテライトまたはマイクロサテライトなど)、転位因子、またはコピー数の変異(逆位、欠損または挿入など)であってもよい。本願明細書に記載された変異体とLDにある、このような変異は、関連の検出のために使用されたタグしたマーカーについて認められたものより、高い相対リスク(RR)またはオッズ比(OR)を与えてもよい。従って、本発明は、本願明細書記載の疾病の関連の検出のために使用されたマーカー、および当該マーカーとの連鎖不平衡のマーカーを意味する。従って、本発明のある実施態様では、関連を検出するために最初に使用されたマーカーとLDのマーカーは、代用マーカーとして使用されてもよい。代用マーカーは、1つの実施態様では、相対リスク(RR)および/またはオッズ比(OR)の値が、最初に検出されたものより小さい。他の実施態様では、代用マーカーは、RRまたはOR値が、当該疾病に関連することが最初に見出されたマーカーで最初に判定されたものより大きい。このような実施態様の例は、当該疾病と関連することが最初に見出された、より一般的な変異体(>10%集団における頻度)とLDにある、まれ、または相対的にまれ(対立遺伝子の集団における頻度が<10%)な変異体であろう。関連の検出のためにこのようなマーカーを同定および使用することは、当業者に周知のルーチンの方法によって行われ得、従ってこれらは本発明の範囲である。
(ハプロタイプ頻度の測定)
患者および対照群におけるハプロタイプの頻度は、期待値最大化アルゴリズムを使用して評価され得る(Dempster A.ら、J.R.Stat.Soc.B、39:1−38(1977))。フェーズとともに、欠損した遺伝子型および不確定度を扱うことができる当該アルゴリズムの実行が使用され得る。帰無仮説下では、患者および対照は、同一の頻度を有すると想定される。尤度法を使用し、別の仮説が検討され、候補のリスクのあるハプロタイプ(本願明細書記載のマーカーを含み得る)は、対照よりも患者において高い頻度を有していてもよく、一方、他のハプロタイプの頻度の割合は、両群で同一であると想定される。尤度は、両仮説下で別々に最大化され、対応する1−dfの可能性の割合の統計量は、統計的有意性を評価するために使用される。
感受性領域内(例えば、LDブロック領域内)のリスクのあるマーカーおよび保護マーカーならびにハプロタイプを探索するため、当該領域内の遺伝子型を同定されたマーカーの全ての可能性のある組み合わせの関連が検討される。合わされた患者および対照群は、本来の患者群および対照群とサイズが等しい、ランダムに2つのセットに分けられ得る。次いで、マーカーおよびハプロタイプ分析は、繰り返され、最も有意な記載されたp値が判定される。当該ランダム化スキームは、例えば、実験に基づいたp値の分布を作成するために、100回を超えて繰り返され得る。好ましい実施態様では、p値が<0.05であることは、有意なマーカーおよび/またはハプロタイプの関連性を示す。
(ハプロタイプ分析)
ハプロタイプ分析の1つの一般的なアプローチは、ネステッド(NEsted)モデルに適用した尤度に基づいた推論の使用に関する(Gretarsdottir S.ら、Nat.Genet.35:131−38(2003))。当該方法は、多くの多型マーカー、SNPおよびマイクロサテライトに適用してもよい、プログラムNEMOで行われる。当該方法およびソフトウェアは、異なるリスクを与えるハプロタイプ群を同定することを目的とする、症例と対照の研究のために特に設計される。これはまた、LD構造を研究するためのツールである。NEMOでは、EMアルゴリズムを活用して、観察されたデータについて最尤推定値、尤度比およびp値が直接的に算出され、観察されたデータについては欠損データの問題として扱う。
フェーズにおける不確定度および欠損遺伝子型による情報の損失をとらえる、観察されたデータについて直接的に算出される尤度に基づく尤度比検定は、所定の妥当なp値を与えるために依存され得るが、情報が不完全であることでどの位の量の情報が失われているのかについて知ることは依然として興味深い。ハプロタイプ分析のための情報測定は、NicolaeおよびKong(Technical Report 537、シカゴ大学、統計大学(University of Statistics)、統計学科;Biometrics、60(2):368−75(2004))に、連鎖分析のために定義された情報測定の自然な伸長として記載され、NEMOにおいて実行される。
(関連分析)
疾病に関連する単一のマーカーについては、各個体の対立遺伝子の両側p値を算出するために、フィッシャーの直接確率検定が使用され得る。同胞群のためのこれまでに記載された分散調整の手順(Risch,N.およびTeng,J. Genome Res.、8:1273−1288(1998))を拡張することで、患者間の関連性の補正がなされ得、それは一般的な家族性の関連に適用され得る。ゲノム制御の方法(Devlin,B.およびRoeder,K. Biometrics 55:997(1999))はまた、個体および可能な層別化の関連性を調整するために使用され得る。
単一のマーカーおよびハプロタイプ分析の両方について、相対リスク(RR)および集団に起因するリスク(PAR)は、複合モデル(ハプロタイプの相対リスクモデル)を仮定して算出され得る(Terwilliger J.D.およびOtt,J.、Hum.Hered.42:337−46(1992)、ならびにFalk,C.T.およびRubinstein,P、Ann.Hum.Genet.51(Pt3):227−33(1987))。すなわち、ヒトが保有する2つの対立遺伝子/ハプロタイプのリスクは乗算で表される。例えば、RRが、aに関連するAのリスクである場合、ヒトホモ接合体AAのリスクは、ヘテロ接合体AaのリスクのRR倍となり、ホモ接合体aaのリスクのRR2倍となる。複合モデルは、分析および計算を単純化する良好な性質を有する。ハプロタイプは罹患した集団内で、対照集団内同様に別個であり、すなわち、ハーディ・ワインベルグ平衡にある。結果として、罹患者および対照のハプロタイプ数は、それぞれ多項分布を有するが、別の仮説下で異なるハプロタイプの頻度を有する。特に、2つのハプロタイプ(hiおよびhj)については、リスク(hi)/リスク(hj)=(fi/pi)/(fj/pj)であり、fおよびpは、それぞれ、罹患した集団における頻度および対照集団における頻度を表す。真のモデルが増殖性ではない場合、いくらかの検出力の損失がある一方で、当該損失は、極端な症例以外では、軽度である傾向がある。最も重要なのは、帰無仮説に関して算出されるため、p値が常に妥当であることである。
1つの関連研究で検出される関連シグナルは、理想的には、同一のまたは異なる民族性の、異なる集団(例えば、同一の国の異なる領域、または異なる国)からの、第2のコホートで再現されてもよい。追試の利点は、追試で実施される試験の数が通常は非常に小さく、従って、適用される必要がある統計的基準はより厳密ではないことである。例えば、300,000SNPを使用した特定の疾病または形質の感受性変異体のゲノム全体での検索に対し、実施される300,000試験(各SNPについて1つ)について補正を行うことができる。典型的に使用されるアレイ上の多くのSNPは、関連しているため(すなわち、LDにあるため)、これらは独立ではない。従って、この補正は、保守的である。それにもかかわらず、この補正因子の適用は、この保守的検定(conservative test)を単一の研究コホートから得た結果に適用するとき、そのシグナルが有意であるとみなされるためには、観察されたP値が、0.05/300,000=1.7×10−7未満であることを必要とする。P値がこの保守的な閾値未満である、ゲノム全体での関連研究で見出されたシグナルは、真の遺伝効果の基準であることは明らかであり、さらなるコホートでの再現は、必ずしも統計的な観点からのものではない。しかしながら重要なことには、この閾値よりも大きいP値を有するシグナルは、真の遺伝効果にも起因し得る。この第1の研究におけるサンプルサイズは、ゲノム全体での有意性についての保存的な閾値を満たす観察されたP値を与えるのに十分に大きくはなかったかも知れないし、または当該第1の研究は、サンプリングに起因する内在的なゆらぎに起因してゲノム全体での有意性に到達しなかったかも知れない。しかし、当該補正因子は、実施された統計検定の数に依存するため、最初の研究から得た1つのシグナル(1つのSNP)が、第2の症例−対照コホートで再現された場合、有意性についての適切な統計検定は、1回の統計検定についてのものであり、すなわち、P値が0.05未満である。1つまたはさらにいくつかの追加の症例−対照コホートでの追試は、さらなる集団における関連シグナルの評価を与えるという付加された利点を有し、従って、最初の発見を確認し、ヒト集団一般で試験される遺伝的変異(1つまたは複数)の全体の有意性の評価を与える。
いくつかの症例−対照コホートから得た結果は、根底にある効果の全体の評価を与えるために合わされてもよい。複数の遺伝関連研究から得た結果を合わせるために一般的に使用される方法論は、マンテル・ヘンツェルモデルである(MantelおよびHaenszel、J Natl Cancer Inst 22:719−48(1959))。当該モデルは、それぞれがおそらく遺伝的変異の異なる集団頻度を有する、異なる集団から得た関連結果が合わされる状況を扱うために設計されている。当該モデルは、ORまたはRRによって判定される当該疾病のリスクに対する変異体の効果は、全ての集団で同一であるが、当該変異体の頻度は集団間で異なっているかも知れないと仮定して結果を合わせる。いくつかの集団から得た結果を合わせることは、合わせられたコホートによって与えられる、増加した統計的検出力による、現実の根底にある関連シグナルの全体の検出力が増加するという、付加された利点を有する。さらに、個体研究のいずれの欠損(例えば、症例および対照の不均等な組み合わせまたは集団の層別化による)は、複数のコホートから得た結果が合わせられると、相殺される傾向があるだろうから、ここでも再度、真の根底にある遺伝効果のより良い評価を与えるだろう。
(リスクアセスメントおよび診断)
いずれの所定の集団内でも、疾病または形質が発生する絶対的なリスクがあり、特定の期間にわたってヒトが特定の疾病または形質を生じる可能性として定義される。例えば、乳癌についての女性の生涯の絶対的なリスクは9分の1である。つまり、9人のうち1人の女性は、その人生のある時点で乳癌を生じる。典型的には、リスクは、特定の個体を見るよりも、非常に多くの人々を見ることによって判定される。リスクはしばしば絶対的なリスク(AR)および相対リスク(RR)の観点から示される。相対リスクは、2つの変異に関連するリスクまたは人々の2つの異なる群のリスクを比較するために使用される。例えば、ある遺伝子型を有する人々の群を、異なる遺伝子型を有する別の群と比較するために使用され得る。疾病について、2の相対リスクは、1つの群が他の群に対して疾病を生じる2倍の可能性を有することを意味する。示されたリスクは、通常、性別および民族性をマッチさせた集団と比較した、ヒト、またはヒトの特定の遺伝子型についての相対リスクである。同一の性別および民族性の2個体のリスクは、簡潔な様式で比較され得る。例えば、集団と比較して、第1の個体の相対リスクが1.5であり、第2の個体の相対リスクが0.5である場合、第2の個体と比較した第1の個体のリスクは、1.5/0.5=3である。
(リスクの算出)
全体の遺伝的危険率を算出するためのモデルの創出には、2つの工程を伴う:i)1つの遺伝的変異についてのオッズ比を相対リスクに変換すること、およびii)異なる遺伝子座における複数の変異に由来するリスクを1つの相対リスク値へと組み合わせること。
(オッズ比からのリスクの誘導)
現在までに権威ある雑誌で刊行された、複合疾患についてのほとんどの遺伝子発見の研究は、それらのレトロスペクティブな設定のため、症例対照設計を用いてきた。これらの研究は、選択された組の症例(特定された病状を有する人々)および対照個体をサンプリングし、その遺伝子型を同定する。興味があるのは、症例および対照における頻度が有意に異なる遺伝的変異(対立遺伝子)である。
結果は、典型的には、オッズ比で報告される。これは、罹患者の群 対 対照におけるリスク変異体(保有者)対非リスク変異体(非保有者)の割合(確率)の間の比であり、すなわち当該罹患状態を条件とする確率によって表される:
OR=(Pr(c|A)/Pr(nc|A))/(Pr(c|C)/Pr(nc|C))
しかしながら、時には、出願人らが興味を持っているのは、当該疾病についての絶対的なリスク、すなわち当該疾病にかかる当該リスク変異体を保有する個体の割合、または換言すると当該疾病にかかる確率であるということもある。この数は、症例対照研究では直接判定され得ない。なぜなら、一部には、症例 対 対照の比は、典型的には、一般的な集団におけるものとは同じではないからである。しかしながら、ある仮定の下で、このオッズ比からリスクを評価し得る。
稀な疾病の仮定の下では、疾病の相対リスクはオッズ比によって近似し得るということは周知である。しかしながらこの仮定は、多くの一般的な疾病に対しては適用できないかもしれない。それでもなお、別の遺伝子型変異体に対する1つの遺伝子型変異体のリスクは、上で表されたオッズ比から評価され得るということは明らかである。対照が症例と同じ集団に由来する確率標本であり、厳密に罹患していない個体であるというよりは罹患した人々を含むランダム集団の対照という仮定の下では、算出は特に簡単である。サンプルサイズおよび検出力を高めるために、大きいゲノム全体での関連および再現研究の多くは、症例と年齢をマッチさせていない対照を使用し、かつその対照は、対照がその研究時に当該疾病を有していなかったということを確実にするために慎重に精査されてもいない。
従って、正確ではないが、それらは、一般的集団に由来する確率標本を近似することが多い。この仮定が正確に満足されるということは稀であると予想されるが、当該リスク評価は、この仮定からの少しのずれに対しては通常はロバストであるということに留意されたい。
リスク変異体保有者「c」、および非保有者「nc」を有する優性および劣性モデル(the dominant and the recessive model)について、個体のオッズ比はこれらの変異体間のリスク比と同じであるということが、算出によって示される:
OR=Pr(A|c)/Pr(A|nc)=r
また同様に、リスクが2つの対立遺伝子のコピーに関連するリスクの積である複合モデルについて、対立遺伝子のオッズ比は危険因子に等しい:
OR=Pr(A|aa)/Pr(A|ab)=Pr(A|ab)/Pr(A|bb)=r
ここで「a」はリスク対立遺伝子を表し、「b」は非リスク対立遺伝子を表す。従って因子「r」は、対立遺伝子のタイプの間の相対リスクである。
複合疾患に関連する一般的な変異を報告する過去数年に刊行された研究の多くについて、当該複合モデルは、当該効果を十分に要約し、かつ優性および劣性モデルなどの代替のモデルよりも優れた当該データに対する一致をもっとも頻繁に与えるということが見出された。
(平均的な集団のリスクに対するリスク)
平均的な集団に対する遺伝的変異のリスクを表すことがもっとも簡便である。なぜなら、それは、ベースラインの集団のリスクと比べて、当該疾病の発生についての生涯リスクを伝えることをより容易にするからである。例えば、複合モデルでは、変異体「aa」についての相対的な集団リスクは、
RR(aa)=Pr(A|aa)/Pr(A)=(Pr(A|aa)/Pr(A|bb))/(Pr(A)/Pr(A|bb))=
r2/(Pr(aa)r2+Pr(ab)r+Pr(bb))=r2/(p2r2+2pqr+q2)=r2/R
として算出され得る。
ここで「p」および「q」は、それぞれ「a」および「b」の対立遺伝子の頻度である。同様に、RR(ab)=r/RおよびRR(bb)=1/R が得られる。対立遺伝子の頻度の評価は、オッズ比を報告する刊行物から、およびHapMapデータベースから、入手され得る。個体の遺伝子型が不明である症例においては、その試験またはマーカーについての相対的な遺伝的危険率は単に1に等しいということに留意されたい。
一例として、染色体14上のマーカーrs999737について、対立遺伝子Cは、コーカサス人の集団では1.15の乳癌についての対立遺伝子のOR、および約0.76の頻度(p)を有する。遺伝子型TTと比較した当該遺伝子型の相対リスクは、上記複合モデルに基づき評価される。
CCについては、それは1.15×1.15=1.32である;CTについては、それは単にOR 1.15であり、TTについては定義によりそれは1.0である。
対立遺伝子Tの頻度は、q=1−p=1−0.76=0.24である。このマーカーにおけるこの3つの可能性のある遺伝子型の各々の集団頻度は、
Pr(CC)=p2=0.58、Pr(CT)=2pq=0.36、およびPr(TT)=q2=0.06
である。
遺伝子型TT(これは1のリスクを有すると定義されている)に対する平均的な集団リスクは、
R=0.50×1.32+0.36×1.15+0.06×1=1.13
である。
従って、このマーカーにおける以下の遺伝子型のうちの1つを有する個体についての一般的集団に対するリスク(RR)は、
RR(CC)=1.32/1.13=1.17、RR(CT)=1.15/1.13=1.02、RR(TT)=1/1.13=0.88
である。
複数のマーカーからのリスクの組み合わせ:
多くのSNP変異の遺伝子型が個体についてのリスクを評価するために使用される場合、リスクについての複合モデルが一般的に仮定され得る。これは、当該集団に対する合わせた遺伝的危険率が、個々のマーカーについて、例えば2つのマーカーg1およびg2についての対応する評価の積として算出される:
RR(g1,g2)=RR(g1)RR(g2)
ということを意味する。
根底にある仮定は、危険因子は独立に発生し振舞うということ、すなわち結合条件付き確率は積として表され得る:
Pr(A|g1,g2)=Pr(A|g1)Pr(A|g2)/Pr(A)およびPr(g1,g2)=Pr(g1)Pr(g2)
ということである。
この仮定に対する明白な違反は、2以上のリスク対立遺伝子の同時発生に相関性があるほどに、当該ゲノム上で密に間隔をあけられた、すなわち連鎖不平衡にあるマーカーである。このような場合では、相関性があるSNPのすべての対立遺伝子の組み合わせに対してオッズ比が定義されるいわゆるハプロタイプモデリングが使用され得る。
統計モデルが利用されるほとんどの場合のように、適用されるモデルは、まさに真実であるとは予想されない。なぜなら、それは、根底にある生物物理学的モデルに基づくからである。しかしながら、当該複合モデルは、今までのところ十分にデータに一致することが見出されている。すなわち多くのリスク変異体が発見されてきた多くの一般的な疾病について、著しいずれは検出されていない
一例として、各マーカーにおけるこの集団に対するリスクとともに、特定の疾病に関連する4つの仮定上のマーカーにおいて以下の遺伝子型を有する個体について:
合わせると、この個体についてのこの集団に対する全体のリスクは、1.03×1.30×0.88×1.54=1.81である。同様にして、いずれかの複数のマーカー(またはハプロタイプ)についての全体のリスクが評価され得る。
(調整された生涯リスク)
個体の生涯リスクは、集団に対する全体の遺伝的危険率に、同じ民族性および性別の一般的集団におけるおよび当該個体の地理的起源の領域における当該疾病の平均の生涯リスクを乗じることにより誘導される。一般的集団リスクを定める際に選択するためのいくつかの疫学的研究が通常は存在するので、遺伝的変異について使用されてきた疾病の定義のために十分に検討された(well−powered)研究を取り上げることにする。
例えば、特定の疾病について、集団に対する全体の遺伝的危険率が個体について1.8である場合、およびその個体の層(demographic)の個体についての当該疾病の平均的な生涯リスクが20%である場合、その個体についての調整された生涯リスクは20%×1.8=36%である。
集団についての平均RRは1であるため、この複合モデルは当該疾病の同じ平均的な調整された生涯リスクを与えるということに留意されたい。さらに、現実の生涯リスクは100%を超え得ないため、遺伝的RRに対して上限があるべきである。
(乳癌についてのリスクアセスメント)
本願明細書記載のように、このようなマーカーを含むある多型マーカーおよびハプロタイプは、乳癌のリスクアセスメントに有用であることが見出された。リスクアセスメントは、乳癌に対する感受性の診断のマーカーの使用に関連し得る。ある多型マーカーの特定の対立遺伝子は、乳癌と診断されていない個体と比較して、乳癌を有する個体において、より頻繁であることが見出された。従って、これらのマーカー対立遺伝子は、個体において、乳癌または乳癌に対する感受性の検出の予測値を有する。本願明細書記載のリスクのある変異体(または保護的変異体)と連鎖不平衡のタグしたマーカーは、これらのマーカー(および/またはハプロタイプ)の代替物として使用され得る。このような代用マーカーは、特定のハプロタイプブロックまたはLDブロック内に位置し得る。このような代用マーカーはまた、時には、当該LDブロック/ハプロタイプブロックのごく近傍のいずれかに、このようなハプロタイプブロックまたはLDブロックの物理的な境界の外側に位置し得るが、より遠く離れたゲノム位置に位置する可能性もある。
長距離のLDは、例えば、特定のゲノムの領域(例えば、遺伝子)が機能的に関連している場合に生じ得る。例えば、2つの遺伝子が共通の代謝経路において役割を果たすタンパク質をコードする場合、1つの遺伝子における特定の変異は、他の遺伝子についての観察された変異に対して直接的な影響を及ぼし得る。1つの遺伝子の中の変異が遺伝子産物の増加した発現につながるという場合を考えよう。この効果を弱めて特定の経路の全体のフラックスを保存するために、この変異体は、その遺伝子の減少した発現レベルを与える第2の遺伝子での1つ(以上)の変異の選択につながったかも知れない。これらの2つの遺伝子は、恐らく異なる染色体上の異なるゲノムの部位に位置し得るが、当該遺伝子内の変異は、高LDの領域内のそれらの共通の物理的な位置のためではなく、進化力により見かけ上LDである。このようなLDも本発明の範囲内で企図される。当業者なら、機能的な遺伝子−遺伝子相互作用の多くの他のシナリオが可能性を有し、本願明細書で論じられる特定の例は、1つのこのような可能性のあるシナリオを表しているに過ぎないということはわかるであろう。
r2値が1に等しいマーカーは、リスクのある変異体(アンカー変異体)の完全な代替物であり、すなわち、1つのマーカーの遺伝子型は、別の遺伝子型を完全に予測する。1より小さいr2値を有するマーカーはまた、リスクのある変異体の代替物となり得、あるいは、リスクのある変異体よりも高いかまたはさらに高い相対リスク値を有する変異体を表す。ある好ましい実施態様では、リスクのあるアンカー変異体に対してr2の値をもつマーカーは、有用な代用マーカーである。同定されたリスクのある変異体は、それ自体機能的変異体ではないかも知れないが、当該例では、真の機能的変異体と連鎖不平衡にある。機能的な変異体はSNPであってもよいが、例えば、タンデムリピート(ミニサテライトもしくはマイクロサテライトなど)、転位因子(例えば、Alu因子)、または構造上の変化(欠損、挿入または逆位(コピー数変異、またはCNVとも呼ばれることがある)など)であってもよい。本発明は、本願明細書で開示されたマーカーのこのような代用マーカーの評価を包含する。このようなマーカーは、当業者に周知のように、注解され、マッピングされ、および公的なデータベースに記載され、または、個体群における本発明のマーカーによって同定された領域または領域の一部の配列決定によって、代わりにすぐに同定され得、そして得られた配列群の多型性を同定する。結果として、当業者は、すぐに、かつ過度の実験をすることなく、本願明細書記載の、マーカーおよび/またはハプロタイプと連鎖不平衡の代用マーカーの遺伝子型を同定できる。検出されたリスクのある変異体とLDにあるこれらのタグしたマーカーまたは代用マーカーはまた、予測値を有する。
ある実施態様では、本発明は、乳癌に関連すると本願明細書に記載の変異体の存在についての、個体から入手したゲノムDNAを含む試料の評価によって行われ得る。このような評価は、当業者に周知の方法およびさらに本願明細書記載の方法を使用し、少なくとも1つの多型マーカーの少なくとも1つの対立遺伝子の存在または不存在を検出する工程を含み、このような評価の成果に基づき、試料の由来である個体が、乳癌の増加したリスクまたは減少したリスク(増加した感受性または減少した感受性)にあるかを判定する。あるいは、本発明は、乳癌に関連すると本願明細書に記載の少なくとも1つの多型マーカー(または乳癌に関連すると本願明細書で示された少なくとも1つのマーカーと連鎖不平衡のマーカー)の遺伝子型の状態についての情報を含むデータセットを利用して行われ得る。換言すれば、例えば、ある多型マーカーまたは多数のマーカーにおける遺伝子型の数の形態にあるこのような遺伝的状態についての情報(例えば、あるリスクのある対立遺伝子の存在または不存在の指標)を含むデータセット、または1つ以上のマーカーの実際の遺伝子型は、乳癌に関連すると本願発明者によって示された、ある多型マーカーのあるリスクのある対立遺伝子の存在または不存在についてクエリーされ得る。乳癌の増加したリスクに関連する変異体(例えば、マーカー対立遺伝子)についての陽性の結果は、本願明細書で示されたように、データセットの由来である個体が乳癌の増加した感受性(増加したリスク)にあることを示す。
本発明のある実施態様では、多型マーカーは、多型マーカーの遺伝子型のデータを、多型性の少なくとも1つの対立遺伝子と乳癌との間の相関データを含む検査表などのデータベースへ照会することによって、乳癌に関連付けられる。いくつかの実施態様では、その表は1つの多型性についての相関を含む。他の実施態様では、表は多数の多型性についての相関を含む。両方のシナリオで、マーカーと乳癌との間の相関の指標を与える検査表へ照会することによって、乳癌のリスク、または乳癌に対する感受性が試料の由来である個体において同定され得る。いくつかの実施態様では、相関は統計的測定として報告される。統計的測定はリスク判定基準(相対リスク(RR)、絶対的なリスク(AR)またはオッズ比(OR)など)として報告されてもよい。
リスクマーカーは、単独でまたは組合せて、リスクアセスメントおよび診断目的のために有用であり得る。本願明細書に記載されたマーカーに基づく疾病のリスクアセスメントの結果はまた、全体のリスクを確立するために、当該疾病についての他の遺伝子マーカーまたは危険因子についてのデータと合わされ得る。従って、個々のマーカーによるリスクの増加が相対的に少ない、例えば10〜30%の程度である場合でさえ、その関連は、他のリスクマーカーと合わされた場合には、重要な影響をもたらし得る。従って、相対的に共通の変異は、全体のリスクに対して重要な寄与をし得る(集団に起因するリスクが高い)か、またはマーカーの組み合わせは、当該マーカーの合わせたリスクに基づいて、当該疾病の発生の有意な合わせたリスクにある個体群を定義するために使用され得る。例えば、rs2005154、rs2184380、rs2224696、rs2242503、rs12291026、rs999737、rs9956546、rs11912922、およびrs6001954のうちのいずれか1つ、またはこれらの組み合わせについての遺伝子型の結果に基づいて、合わせたリスクが評価され得る。このような組み合わせは、乳癌についての他の感受性マーカー、例えば染色体5p12上のマーカーおよび染色体10q26上のマーカー、例えば、マーカーrs10941679およびマーカーrs1219648をも含み得る(Stacey,S.N.ら、Nat Genet 40:703−6(2008))。あるいは、これらのマーカーのうちのいずれか1つとLDのマーカーが評価され得る。乳癌のリスクを与えることが公知の他のマーカーもまた、染色体2q14上のマーカー(例えば、マーカーrs4848543またはそれらと連鎖不平衡のマーカー)、2q35上のマーカー(例えば、マーカーrs13387042、またはそれらと連鎖不平衡のマーカー)、および染色体16上のマーカー(例えば、マーカーrs3803662、またはそれらと連鎖不平衡のマーカー)などの本願明細書に記載されたマーカーと一緒に、評価され得る(Stacey,S.N.ら Nat Genet 39:865−9(2007))。
従って、本発明のある実施態様では、複数の変異体(マーカーおよび/またはハプロタイプ)は、全体のリスクアセスメントのために用いられる。これらの変異体は、1つの実施態様では、本願明細書に開示された変異体から選択される。他の実施態様は、乳癌に対する感受性の診断に有用であることが知られた他の変異体と組み合わせた本発明の変異体の使用を含む。このような実施態様では、多数のマーカーおよび/またはハプロタイプの遺伝子型の状態は、関連した変異体の集団における頻度、または臨床的に健康な被験者(年齢をマッチさせた被験者および性別をマッチさせた被験者など)の変異体の頻度と比較した、個体、および個体の状態について判定される。当該技術分野で公知の方法(本願明細書に記載されたものなどの多変量解析もしくは共同リスク解析、または当業者に知られた他の方法など)は、その後に、複数の部位の遺伝子型の状態に基づいて与えられた全体のリスクの判定のために使用されてもよい。このような分析に基づくリスクの評価は、本願明細書記載のように、その後に、本発明の方法、使用およびキットで使用されてもよい。
一般的な意味では、本願明細書に記載される方法およびキットは、いずれの供給源およびいずれの個体)由来の核酸物質(DNAもしくはRNA)を含む試料から、またはこのような試料由来の遺伝子型または配列データから利用され得る。好ましい実施態様では、個体はヒト個体である。当該個体は、成人、子供、または胎児であり得る。当該核酸供給源は、核酸物質を含むいずれの試料であってもよく、例としては生物学的試料、またはそれらに由来する核酸物質を含む試料が挙げられる。本発明はまた、標的集団のメンバーである個体のマーカーおよび/またはハプロタイプの評価について提供する。このような標的集団は、1つの実施態様では、他の遺伝要因、バイオマーカー、生物物理的なパラメータ(例えば、体重、BMD、血圧)、または一般的な健康および/または生活習慣のパラメータ(例えば、癌の履歴、乳癌の履歴、疾病の以前の診断、癌の家族歴、乳癌の家族歴)に基づく、疾病を発生させるリスクがある個体の集団または群である。
本発明は、特定の年齢亜群(40歳超、45歳超、または50、55、60、65、70、75、80、または85歳超など)からの個体を含む実施態様を提供する。本発明の他の実施態様は、他の年齢群(85歳未満の個体など、80歳未満、75歳未満、または70、65、60、55、50、45、40、35、または30歳未満など)に関する。他の実施態様は、乳癌の発生時の年齢が上述の年齢幅のいずれかである個体に関する。年齢幅は、ある実施態様では、発生時の年齢が45歳超だが60歳未満などであることに関連していてもよいことも考慮される。しかし、他の年齢幅もまた考慮され、上記の年齢の値によってひとまとめにされる全ての年齢幅を含む。本発明は、さらに、いずれかの性別(男性または女性)の個体に関する。
アイスランド人の集団は、北欧の系統のコーカサス人の集団である。アイスランド人の集団の遺伝的連鎖および関連の結果を報告する数多くの研究が、直近の数年間に発表されてきている。これらの研究の多くは、特定の疾病に関連しているとしてアイスランド人の集団で最初に同定された変異の再現を、他の集団でも示した(Sulem,P.ら Nat Genet 2009年5月17日(印刷物に先駆けた電子出版);Rafnar,T.ら Nat Genet 41:221−7(2009);Gretarsdottir,S.ら Ann Neurol 64:402−9(2008);Stacey,S.N.ら Nat Genet 40:1313−18(2008);Gudbjartsson,D.F.ら Nat Genet 40:886−91(2008);Styrkarsdottir,U.ら N Engl J Med 358:2355−65(2008);Thorgeirsson,T.ら Nature 452:638−42(2008);Gudmundsson,J.ら Nat Genet.40:281−3(2008);Stacey,S.N.ら、Nat Genet.39:865−69(2007);Helgadottir,A.ら、Science 316:1491−93(2007);Steinthorsdottir,V.ら、Nat Genet.39:770−75(2007);Gudmundsson,J.ら、Nat Genet.39:631−37(2007);Frayling,TM、Nature Reviews Genet 8:657−662(2007);Amundadottir,L.T.ら、Nat Genet.38:652−58(2006);Grant,S.F.ら、Nat Genet.38:320−23(2006))。従って、アイスランド人の集団における遺伝的発見は、一般的に、他の集団(アフリカ人の集団およびアジア人の集団を含む)において再現されている。
乳癌のリスクに関連すると本願明細書に記載されるマーカーは、他のヒト集団において同様の関連性を示すと考えられている。従って、ヒト個体集団を含む特定の実施態様もまた考慮され、本発明の範囲内である。このような実施態様は、コーカサス人の集団、ヨーロッパ人の集団、アメリカ人の集団、ユーラシア人の集団、アジア人の集団、中央/南アジア人の集団、東アジア人の集団、中東人の集団、アフリカ人の集団、スペイン系アメリカ人の集団、およびオセアニア人の集団を含む(しかしこれらに限定されない)1つ以上のヒト集団の出身であるヒト被験者に関する。ヨーロッパ人の集団は、スウェーデン人、ノルウェー人、フィンランド人、ロシア人、デンマーク人、アイスランド人、アイルランド人、ケルト人、英国人、スコットランド人、オランダ人、ベルギー人、フランス人、ドイツ人、スペイン人、ポルトガル人、イタリア人、ポーランド人、ブルガリア人、スラブ人、セルビア人、ボスニア人、チェコ人、ギリシャ人およびトルコ人集団を含むが、これらに限定されない。1つの実施態様では、本発明は、コーカサス人の血統の個体に関する。
個々の被験者における人種の寄与はまた、遺伝的分析によって判定されてもよい。系統の遺伝的分析は、非連鎖のマイクロサテライトマーカー(Smithら、Am J Hum Genet 74、1001−13(2004)に提示されるものなど)を使用して行ってもよい。
ある実施態様では、本発明は、上述のように、特定の集団で同定されたマーカーおよび/またはハプロタイプに関する。当業者は、連鎖不平衡(LD)の判定は、異なる集団に適用した場合は異なる結果を与えてもよいことを理解するだろう。このことは、特定のゲノム領域におけるLDの相違を引き起こしたかも知れない、異なるヒト集団の異なる集団歴および異なる選択圧による。あるマーカー(例えば、SNPマーカー)は、1つの集団では多型だが、別の集団ではそうではないこともまた、当業者に周知である。しかし、当業者は、いずれかの所定のヒト集団で本発明を実行するために、利用可能であり、本願明細書で教示された方法を適用するだろう。このことは、特定の集団内で最も強い関連を与えるこれらのマーカーを同定するための、本発明のLD領域における多型マーカーの評価を含んでいてもよい。従って、本発明のリスクのある変異体は、異なるハプロタイプの背景に、および様々なヒト集団において異なる頻度で属していてもよい。しかし、当該技術分野で公知の方法および本発明のマーカーを利用し、本発明は、所定のヒト集団いずれにおいても実行され得る。
(乳癌の遺伝するリスクを予測するモデル)
乳癌のリスクアセスメントの目的は、全ての女性に対して、高いリスクの女性においては生存期間および生活の質の増加のため、一方、低いリスクの女性においては費用、不要な介入および不安の最小化のための、個別化された医学的管理戦略の開発の合理的なフレームワークを提供することである。リスク予測モデルは、先天性リスク特性の所定のセット(例えば、家族歴、術前良性乳房病変、以前の乳腺腫瘍)を有する個体の乳癌のリスクを推定しようと試みる。診療において最も一般的に使用される乳癌のリスクアセスメントモデルは、家族歴を考慮して、遺伝する危険因子を評価する。リスク評価は、以前に乳癌と診断された1つ以上の近親者を有する個体の増加したリスクの観察に基づく。これらは、複雑な系統構造を考慮しない。これらのモデルは、乳癌になりやすい変異を有する遺伝子の保有者と非保有者とを区別できないというさらなる不利益を有する。
さらに洗練されたリスクモデルは、特定の家族歴を扱うためのより良い機構を有し、BRCA1変異およびBRCA2変異の保有者状態を考慮する能力を有する。例えば、疾病発生率についての乳房分析および卵巣分析ならびに保有者推定アルゴリズム(BOADICEA)(Antoniouら、2004)は、系統分析プログラムMENDELによる個体系統構造に基づく家族歴を考慮している。公知のBRCA1およびBRCA2の状態に関する情報もまた、考慮される。現在使用されているBOADICEAおよび全ての他の乳癌のリスクモデルの主な制限は、これらは他の素因遺伝子からの遺伝子型の情報を、取り込まないことである。現在のモデルは、リスクの非BRCA遺伝的判定要因についての知識の欠如を補うための代替物として作用する、家族歴に強く依存している。従って、利用可能なモデルは、疾病の家族歴が分かっている状況に制限される。より低い浸透率の乳癌素因遺伝子は、集団において相対的に一般的であるかも知れず、BRCA1およびBRCA2遺伝子のようには、家族性クラスター形成を促進するこのような強い傾向を示さないかも知れない。素因対立遺伝子について相対的に高い遺伝的負荷を有する患者は、ほとんど、または全く疾病の家族歴を示さないかも知れない。従って、遺伝子に基づいた試験を通じて、直接的に得られた遺伝する感受性データを取り込むモデルの構築についてニーズがある。モデルをより正確にすることに加えて、これは、家族歴パラメータへの依存性を減少させ、リスク特性を、家族歴がそれほど鍵因子とならないより幅広いリスクのある集団へ拡張することを支援するだろう。
(改善された遺伝的危険率モデルの乳癌一次予防の臨床的管理への統合)
臨床的一次予防の選択肢は、現在、化学予防(またはホルモン)治療および予防的手術に分類され得る。高いリスクと同定される患者は、長期コースの化学予防的治療を処方され得る。この構想は、循環器学の分野で広く受け入れられているが、臨床的腫瘍学では、今ようやく、影響を与え始めている。最も広く使用されている腫瘍学の化学予防は、タモキシフェン(選択的エストロゲン受容体調節物質(SERM))である。乳癌再発に対して向けられたアジュバント治療方法として最初に使用され、タモキシフェンは今、乳癌の予防的薬剤としての有効性が証明されている[Cuzickら、(2003)、Lancet、361、296−300][Martinoら、(2004)、Oncologist、9、116−25]。FDAは、ある高いリスクの女性の化学予防薬剤として、タモキシフェンの使用を承認した。
残念ながら、長期間のタモキシフェンの使用は、子宮内膜癌のリスクを約2.5倍増加させ、静脈血栓症のリスクを約2.0倍増加させる。肺塞栓症、脳卒中、および白内障のリスクもまた、増加する[Cuzickら、(2003)、Lancet、361、296−300]。従って、乳癌発生率を減少させるタモキシフェン使用の利益は、全体的な死亡率における対応する減少に簡単に解釈されないかも知れない。ラロキシフェンと呼ばれる別のSERMは、予防的方法においてより効果的であるかも知れず、子宮内膜の癌についての同様のリスクはもたらさない。しかし、血栓症のリスクは、ラロキシフェンで長期間治療された患者において、依然として上昇する[Cuzickら、(2003)、Lancet、361、296−300;Martinoら、(2004)、Oncologist、9、116−25]。さらに、タモキシフェンおよびラロキシフェンの両方が、それらに関連する生活の質の問題点を有する。化学予防的方法におけるSERM治療方法の合理的なリスク:利益分析を行うために、最も乳癌のリスクのある個体の同定について臨床的なニーズがある。乳癌のリスクの実質的な部分が遺伝的であるとすると、当該状況での個体のリスクを定量化するための遺伝的試験について明確な臨床的ニーズがある。利用可能になるかも知れない将来の癌の化学予防的治療(アロマターゼ阻害剤など)のいずれかから生じる同様の問題点について予測し得る。さらに、化学予防的治療が安全になるにつれ、遺伝的な傾向があるが、BRCA1および2変異の保有者に関連する、大量の上昇したリスクは有さない患者を同定するニーズが増加する。
乳癌について高いリスクを有すると同定された患者は、予防的手術(両側乳房切除術もしくは卵巣摘出術のいずれか、または両方)について考慮される。明らかにこのように強烈な治療は、極度に高いリスクが認知された患者に対してのみ推奨される。実際に、このようなリスクは、現在、BRCA1、BRCA2または、まれな乳癌素因の症候群に関連することが知られる遺伝子(リー・フラウメニ症候群におけるp53、カウデン症候群におけるPTENなど)の変異を有する個体のみ同定され得る。
BRCA1変異およびBRCA2変異の浸透率の評価は、集団に基づいた推定に由来している場合に比べて、複数の症例の家族に由来している場合に高い傾向にある。これは、異なる変異を有する家族は、乳癌に対して異なる浸透率を呈するからである(例えば、[Thorlaciusら、(1997)、Am J Hum Genet、60、1079−84]参照)。当該変異に寄与する主な因子の1つは、BRCA1変異およびBRCA2変異の浸透率を修飾する効果を有する、今までのところ未知の素因遺伝子の作用である。従って、BRCA1またはBRCA2遺伝子の変異を有する個体の絶対的なリスクは、修飾遺伝子の存在および作用についての知識がない場合では、正確に数量化されない。BRCA1およびBRCA2保有者の治療上の選択肢は、苛酷であり得るため、当該状況では、それぞれのBRCA保有者のリスクについて、できるだけ最大の正確性で定量化することが重要である。従って、BRCA1およびBRCA2保有者の乳癌の浸透率を修飾する効果を有する素因遺伝子を同定し、およびこれらの遺伝子に基づく改善されたリスクアセスメントモデルの開発についてニーズがある。
さらに、恐らく強い乳癌の家族歴が原因である、乳癌について非常に高いリスクが認知されたが、公知の素因遺伝子の変異は同定され得ないという個体がいる。高い浸透率の素因遺伝子を受け継いでいるかどうかを発見するために個体を試験することはできないため、このような症例において予防的手術の考慮は困難である。従って、個体のリスクは、正確に評価され得ない。従って、発見されていないままのいずれかの高い浸透率の素因遺伝子の同定、および一次予防戦略で使用するための関連する遺伝的試験の開発について、明確な臨床的ニーズがある。このような遺伝子は、例えば、乳癌のリスクと関連があると本願明細書で開示された遺伝子であってもよい。乳癌のリスクと関連があると本願明細書で示された変異体は極めて一般的であり、相対的に低い乳癌のリスクを与えるが、より高いリスク変異体が1つ以上のこれらの遺伝子の中に存在する可能性が十分にある。従って、PAX5、TUB、SERPINH1、RAD51L1、FHOD3および/またはTNRC6B遺伝子のうちの1つ以上の中の、またはこれらと関連する高いリスクの遺伝的変異は、個体が乳癌について高いリスクの(かつ高い浸透率の)遺伝要因の保有者であるかどうかを判定するのに有用であり得ると考えられる。
(早期診断)
大部分の西洋諸国における乳癌の臨床的スクリーニングは、定期的な臨床的な乳房の診察(CBE)およびX線マンモグラフィーからなる。CBEが、良好な乳房X線撮影によるスクリーニングプログラムに関連して使用されても、ほとんど利益が付加されないことを示す優れたエビデンスがある。イギリスでは、50〜70歳の女性は、3年ごとにスクリーニングマンモグラフィーを受けるように勧められる。米国における状況は医療提供者によって異なるが、しかし、アメリカ癌協会は、40歳からは年1回の乳房X線撮影によるスクリーニングを推奨している。乳房X線撮影によるスクリーニングは、50歳を超えたスクリーニングされた女性の間の死亡率の減少について証明された有効性を有する。
遺伝子検査が、既存の乳房X線撮影によるスクリーニングプログラムへのアクセスを減少させる手段として採用されることは、絶対にありそうにない。しかし、乳房X線撮影によるスクリーニングは、欠点がないわけではなく、遺伝子検査は、増強されたスクリーニングプログラムのための人々を選別するのに使用されるべきであると考えられる。乳房X線撮影によるスクリーニングの弱点の1つは、これまでは、50歳未満のスクリーニングされた女性の改善された生存について、著しい効果を示す可能性がないことである。
マンモグラフィーが50歳未満の女性において効果が少ない1つの理由は、乳房組織の密度は、より若い女性において高く、腫瘍の乳房X線撮影の検出をより困難にしていることかも知れない。しかし、遺伝的な傾向がある個体の乳癌は、若年齢群で生じる傾向があり、高い乳房密度と乳癌のリスクとの間の明確な関連がある。従って、最も高いリスク群において最適でなく行われる技術によって管理され得るため、高い素因を有する個体の乳房X線撮影によるスクリーニングの単純な増加に問題がある。近年の研究では、乳房X線撮影によるスクリーニングよりも、造影磁気共鳴画像(CE−MRI)が、当該高いリスク群において、より感度が高く、より早期の段階で腫瘍を検出することが示された[Warnerら、(2004)、Jama、292、1317−25;Leachら、(2005)、Lancet、365、1769−78]。CE−MRI戦略は、特に、ルーチンのX線マンモグラフィーと組み合わせて使用される場合に、よく役立つ[Leachら、(2005)、Lancet、365、1769−78]。CE−MRIは、高い費用がかかる専門家のセンターを必要とするため、50歳未満のスクリーニングは、最も高いリスクを有する個体に制限されなければならない。現在のCE−MRI試験は、エントリーをBRCA1、BRCA2もしくはp53変異ならびに疾病の非常に強い家族歴を有する個体に制限している。当該スクリーニング様式をより幅広い範囲の高いリスクの患者に拡張することは、遺伝子に基づいたリスクプロファイリングの手段の供給によって、大いに補助される。
早期発生の乳癌および遺伝的に傾向がある女性に生じる癌は、より高齢の、遺伝的な傾向が強くない女性の癌よりも増殖が早いという概念を支持する優れたエビデンスがある。これは、より若い女性における高率の中間期癌の観察に由来し、つまり、よくスクリーニングされた集団においてスクリーニング来診間の間隔で生じる癌は、より若い女性の間で高い。従って、スクリーニング間隔は、どんな方法によるものであれ、より若い女性については減少されるべきであることの示唆がある。ここに、より高価な方法論を用いたより頻繁なスクリーニングは、乳癌の全体的な割合が比較的低い年齢群に対して必要とされると思われるという逆説がある。ここに、早期の疾病を生じる最も強い遺伝的な傾向がある若い個体を同定し、彼らをより高価かつ広範なスクリーニング管理に導く、明確な臨床的ニーズがある。乳癌のリスクを与えると本願明細書で開示された変異体は、乳癌の発生について特に高いリスクにある個体の同定に有用であり得る。このような個体は、癌の早期の同定の尤度を最大にするための、初期の、かつ活発なスクリーニング計画からの恩恵を最も得られる可能性がある。
(治療)
現在、原発性乳癌は、手術、アジュバント化学療法、放射線療法、その後の長期間のホルモン療法によって治療される。しばしば、3つまたは4つの治療の組み合わせが使用される。
疾病の同様の段階の乳癌患者は、全体的な治療成果における広い変異をもたらす、アジュバント化学療法に対する非常に異なる反応を有し得る。総合指針(ザンクトガレン(St Galen)およびNIHの判断基準)が、アジュバント化学療法の治療に対する乳癌患者の適格性を判定するために開発された。しかし、転移の最も強い臨床的前兆および組織学的前兆さえも、正確に乳腺腫瘍の臨床的反応を予測するには至っていない[Goldhirschら、(1998)、J Natl Cancer Inst、90、1601−8;Eifelら、(2001)、J Natl Cancer Inst、93、979−89]。化学療法またはホルモン療法は、転移のリスクを約1/3しか減少させないが、しかし、70〜80%の当該治療を受けている患者は、それなくして生存している。従って、大部分の乳癌患者は、現在、無効または不要な治療のいずれかを提供されている。臨床医が、最善の利益を受ける者に対して治療をより適切に調整することができる予後診断の基準の開発の改善について、明確な臨床的ニーズがある。遺伝的素因についての個体の鑑定は、彼らの治療成果に関連する情報を明らかにし、それによって合理的な治療計画を助けるかも知れないと予期するのは合理的である。乳癌のリスクを与える本発明のマーカーは、この状況において有用であると考えられる。
いくつかの以前の研究は、当該概念を例証する。BRCA変異保有者の乳癌患者は、アジュバント化学治療で治療された場合、より良い臨床的反応の割合および生存を示すことが明らかとなった[Chappuisら、(2002)、J Med Genet、39、608−10;Goffinら、(2003)、Cancer、97、527−36]。BRCA変異保有者は、卵巣癌の白金化学療法に対して、非保有者よりも、改善された反応を示した[Cassら、(2003)、Cancer、97、2187−95]。同様の考察は、関連する遺伝子が未知である遺伝的な傾向がある患者に対しても当てはまるかも知れない。例えば、浸潤性小葉乳癌(ILBC)は、強い家族性要素を有することが知られるが、関連する遺伝的変異は未だ同定されていない。ILBCを有する患者は、一般的な化学療法管理に対して乏しい反応を示す[Mathieuら、(2004)、Eur J Cancer、40、342−51]。
遺伝的素因モデルは、治療戦略の個別化を補助するだけでなく、これらの戦略の設計において不可欠な役割を果たすかも知れない。例えば、BRCA1およびBRCA2変異の腫瘍細胞は、ポリ(ADPリボース)ポリメラーゼ(PARP)阻害剤に対し、その欠損したDNA修復経路の結果、深刻な感受性があることが見出された[Farmerら、(2005)、Nature、434、917−21]。これは、BRCA保有者である患者特異的な使用を目的とした、PARPを標的にした小分子薬剤の開発を刺激した。この例から、遺伝的素因の知識が、遺伝的危険率特性と組み合わせて使用される個別化された化学療法管理の開発を導く薬剤標的を同定するかも知れないことは明らかである。同様に、本発明のマーカーは、例えば、PAXS、TUB、SERPINH1、RAD51L1、FHOD3および/またはTNRC6B遺伝子のうち1つ以上を標的にする新規な薬物の同定の助けになるかも知れない。
癌化学療法は、周知の、通常の組織(特に、高増殖性ヘモポエティック(hemopoetic)細胞区画および腸上皮細胞区画)に対する用量制限副作用を有する。遺伝に基づいた個体差が、細胞障害性薬剤に対する通常の組織の感受性に存在することが予測され得る。これらの因子についての理解は、合理的な治療計画および通常の組織を化学療法の副作用から保護するように設計された薬剤開発を助けるかも知れない。
遺伝的特性はまた、改善された放射線療法のアプローチに寄与するかも知れない。標準的な放射線療法管理を受けている乳癌患者群内で、患者の一部は、通常は許容的な放射線量に対する有害反応を経験するだろう。急性反応は、紅斑、湿性落屑、浮腫および放射線気腫(radiation pneumatitis)を含む。毛細血管拡張症、浮腫、肺線維症および乳腺線維症を含む、長期間の反応は、放射線療法後何年も生じるかも知れない。急性反応および長期間の反応は両方とも罹患率の大きな原因であり、致死的であり得る。1つの研究では、11%は深刻な有害反応を有する一方で、87%の患者は、放射線療法に対するいくつかの有害な副作用を有することが見出された(LENT/SOMA 段階3〜4)[Hoellerら、(2003)、Int J Radiat Oncol Biol Phys、55、1013−8]。放射線療法に対する有害反応を経験する可能性は、主に通常の組織反応における恒常的な個体差によるものであり、これらは強い遺伝的要素を有するという疑いがある。いくつかの公知の乳癌素因遺伝子(例えば、BRCA1、BRCA2、ATM)は、DNA二本鎖の切断修復経路に影響する。DNA二本鎖の切断は、放射線療法によって引き起こされた原発性細胞障害性の病変である。これは、これらの経路に属する遺伝子の変異を保有することを通じて乳癌に遺伝的な傾向がある個体はまた、放射線療法から過剰な通常組織の障害を受ける高いリスクを有するかも知れないという懸念を導く。例えば、PAX5、TUB、SERPINH1、RAD51L1、FHOD3および/またはTNRC6B遺伝子のうち1つ以上を通じて乳癌のリスクを与えると本願明細書に記載された遺伝的変異体は、放射線療法に対する有害反応という特定のリスクを有する個体の同定に有用であるかも知れないと考えられる。
集団における恒常的に放射線感受性な個体の存在は、有害反応の頻度を容認できるレベルに維持するため、大部分の患者集団に対する放射線療法の線量率は制限されなければならないことを意味する。従って、放射線療法に対する有害反応に対する上昇したリスクを有する個体を同定できる信頼できる試験について臨床的ニーズがある。このような試験は、相対的に放射線抵抗性な大部分の患者に対する放射線治療量の増大を許容する一方で、放射線感受性の個体に対する保守的なまたは別の治療を示すだろう。用量の増大は、乳癌患者を単純に放射線感受性分類、中間分類および放射線抵抗性分類へトリアージ方式に分類するための試験によって可能となり、これは、局所的な腫瘍管理について約35%の増加、および結果的な生存率の改善をもたらし得ることが推定される[Burnetら、(1996)、Clin Oncol(R Coll Radiol)、8、25−34]。
電離放射線への曝露は、乳房における発癌に寄与する証明された因子である。[DumitrescuおよびCotarla、(2005)、J Cell Mol Med、9、208−21]。公知の乳癌素因遺伝子は、放射線誘発のDNA損傷に対する細胞応答の経路の要素をコードする[NarodおよびFoulkes、(2004)、Nat Rev Cancer、4、665−76]。従って、続発性原発性乳腺腫瘍のリスクが、放射線療法の領域内で通常の組織に対する照射によって増加するかも知れないという懸念がある。放射線療法によるBRCA保有者についてのいずれの判定可能な増加したリスクは明らかではないが、しかし、続発性原発腫瘍についてのそのリスクは、すでに例外的に高い。続発性原発腫瘍のリスクは、放射線療法で治療された、ATMおよびCHEK2遺伝子における乳癌になりやすい対立遺伝子の保有者で増加することを示唆するエビデンスがある[Bernsteinら、(2004)、Breast Cancer Res、6、R199−214;Broeksら、(2004)、Breast Cancer Res Treat、83、91−3]。放射線療法による(および、恐らく、集中的な乳房X線撮影によるスクリーニングによる)続発性原発腫瘍のリスクは、治療計画段階に間の患者の正確な遺伝的危険率特性を得ることによって、より良く定められるだろうことが予期される。
(再発予防)
ステージ1または2の乳癌と診断された患者の約30%は、それらの原発腫瘍の局所領域転移性再発または遠隔転移性再発のいずれかを経験するだろう。原発性乳癌を有していた患者はまた、乳房保存手術が行われた場合、対側乳房または同側乳房において、続発性原発腫瘍と診断される非常に増加したリスクを有する。再発予防は、再発予防または続発性原発腫瘍の発生の予防に使用される方法を意味する。現在使用される方法は、以下を含む。タモキシフェンもしくは別のSERM(単独またはアロマターゼ阻害剤と交互)による長期間の治療、リスクを減少する対側乳房の乳房切除術、ならびにリスクを減少する卵巣摘出術(家族性乳房癌および卵巣癌のリスクを有する患者)。タモキシフェンの使用に関する考察は上記で議論されている。リスクを減少する外科的選択肢について、費用:利益分析を知らせるために、できるだけリスクが数量化される必要があることは明らかである。
乳癌についての公知の遺伝的素因を有する患者が、大部分の患者よりも悪化したことについていくつかの指標がある。CHEK2遺伝子1100delC変異を有する患者は、非保有者と比較して、推定2.8倍の遠隔転移についての増加したリスク、3.9倍の疾病再発の増加したリスクを有する[de Bockら、(2004)、J Med Genet、41、731−5]。BRCA1リンパ節転移陰性の腫瘍を有する患者は、BRCA1変異を有さない同様の患者よりも、転移についてより大きなリスクを有する[Goffinら、(2003)、Cancer、97、527−36;Mollerら、(2002)、Int J Cancer、101、555−9;Eerolaら、(2001)、Int J Cancer、93、368−72]。従って、遺伝的特性は、局所的な再発および転移のリスクを評価するのを助けるために使用され得、それによって再発予防的な治療の選択を導く。本願明細書で記載された変異体に基づく遺伝的プロファイリングは、この状況において有用であるかも知れない。ある実施態様では、このようなプロファイリングは、本願明細書で記載された1つ以上の変異体に基づいていてもよい。他の実施態様では、このようなプロファイリングは、1つまたはいくつかの他の既知の、乳癌の遺伝的危険因子を含んでいてもよい。このような危険因子は、確立した高い浸透性の危険因子であってもよく、または、これらは前述の、1つ以上の、一般的な、より低い浸透率危険因子(例えば、染色体2q14上のマーカー(例えば、マーカーrs2005154、rs2184380、rs2224696、rs2242503、rs12291026、rs999737、rs9956546、rs11912922およびrs6001954、またはそれらと連鎖不平衡のマーカー、例えば表4のマーカー)であってもよい。
通常は、原発性腫瘍と診断された患者は、一定の年間発生率(0.7%)の続発性原発腫瘍のリスクを有する[PetoおよびMack、(2000)、Nat Genet、26、411−4]。BRCA変異を有する患者は、大部分の乳癌患者よりも、40〜60%の範囲の絶対的なリスクで、続発性原発腫瘍について著しく大きいリスクを有する[Easton、1999、Breast Cancer Res、1、14−7]。BRCA変異の保有者は、続発性原発腫瘍の非常に増加したリスクを有する[Staceyら、(2006)、PLoS Med、3、e217;Metcalfeら、(2004)、J Clin Oncol、22、2328−35]。CHEK2遺伝子変異の患者は、対側乳癌について、推定5.7倍の増加したリスクを有する[de Bockら、(2004)、J Med Genet、41、731−5]。BARD1 Cys557Ser変異の保有者は、続発性原発腫瘍と診断される傾向が2.7倍である[Staceyら、(2006)、PLoS Med、3、e217]。遺伝的危険率の特性は、患者における続発性原発腫瘍のリスクを評価するのに使用され得、予防措置がどの位激しいものであるべきかについての判定を知らせるだろう。
(方法)
疾病のリスクアセスメントおよびリスクマネジメントについての方法が本願明細書に記載され、本発明により包含される。本発明はまた、治療薬に対する反応の可能性について個体を評価する方法、治療薬、核酸、ポリペプチドおよび抗体およびコンピューターで実施される機能の有効性を予測する方法を包含する。本願明細書中に与えられる種々の方法で使用するためのキットも、本発明によって包含される。
(診断方法およびスクリーニング方法)
ある実施態様では、本発明は、乳癌の被験者もしくは乳癌に感受性がある被験者においてより頻繁に表れる遺伝子マーカーの特定の対立遺伝子を検出することよる、乳癌もしくは乳癌に対する感受性の診断方法、または診断の補助方法に関する。特定の実施態様では、本発明は、少なくとも1つの多型マーカー(例えば、本願明細書記載のマーカー)の少なくとも1つの対立遺伝子を検出することによる、乳癌に対する感受性の判定方法である。他の実施態様では、本発明は、少なくとも1つの多型マーカーの少なくとも1つの対立遺伝子を検出することによる、乳癌に対する感受性の診断方法に関する。本発明は、それによって特定のマーカーの特定の対立遺伝子またはハプロタイプの検出が乳癌に対する感受性を示す方法について記載する。このような予後診断のアッセイまたは予測的なアッセイはまた、乳癌に関連する症状の発生前の被験者の予防的な治療の判定に使用され得る。
本発明は、いくつかの実施態様では、診断の臨床的適用の方法、例えば、医療専門家によって行われる診断に関する。他の実施態様では、本発明は、素人によって行われる感受性の診断方法または判定方法に関する。当該素人は、遺伝子型の同定サービスの顧客であり得る。当該素人はまた、個体(すなわち、当該顧客)の遺伝子型の状態に基づく、特定の形質または疾病についての遺伝的危険因子に関するサービスを提供するための、当該個体から得たDNA試料上の遺伝子型分析を行う遺伝子型サービスの提供者であってもよい。遺伝子型の同定技術についての近年の技術的進歩(SNPマーカーの高処理の遺伝子型の同定(分子反転プローブアレイ技術(例えば、Affymetrix遺伝子チップ)など)、およびビーズアレイ技術(例えば、イルミナ(イルミナ)GoldenGateアッセイおよびInfiniumアッセイ)を含む)は、個体が、彼ら自身のゲノムが最大100万のSNPについて同時に、相対的に低い費用で、評価されることを可能にする。得られた遺伝子型の情報は、当該個体に利用可能となり、様々なSNPに関連する疾病または形質リスクについての情報(公的な文献および科学出版物からの情報)と比較され得る。従って、本願明細書記載の疾病に関連する対立遺伝子の診断の適用は、例えば、当該個体の遺伝子型のデータの分析を通じて当該個体、臨床試験の結果に基づいて医療従事者、または遺伝子型サービス提供者を含む第三者によって行われ得る。当該第三者は、特定の遺伝的危険因子(本願明細書に記載された遺伝子マーカーを含む)に関するサービスを提供するために当該顧客から得た遺伝子型情報を解釈するサービス提供者であってもよい。換言すれば、遺伝的危険率に基づく感受性の診断もしくは判定は、個体の遺伝子型の状態についての情報および特定の遺伝的危険因子(例えば、特定のSNP)によって与えられえるリスクについての知識に基づいて、医療従事者、遺伝的カウンセラー、遺伝子型の同定サービスを提供する第三者、リスクアセスメントサービスを提供する第三者、または素人(例えば、当該個体)によってされ得る。本願明細書の文脈では、用語「診断」、「感受性を診断する」および「感受性を判定する」とは、利用可能な診断方法(上記記載のものを含む)のいずれをも指すことを意味する。
ある実施態様では、個体から得たゲノムDNAを含む試料が集められる。このような試料は、例えば、さらに本願明細書に記載されるように、頬スワブ、唾液試料、血液試料、またはゲノムDNAを含む他の適した試料であり得る。次いで、当該ゲノムDNAは、当業者が利用できるいずれかの一般的な技術(高処理アレイ技術など)を使用して分析される。このような遺伝子型の同定から得た結果は、簡便なデータ保存ユニット(コンピューターデータベースを含むデータ保有物、データ保存ディスク、または他の簡便なデータ保存手段など)に保存される。ある実施態様では、当該コンピューターデータベースは、オブジェクトデータベース、リレーショナルデータベースまたはポストリレーショナルデータベースである。当該遺伝子型データは、引き続いて、特定のヒトの状態の感受性変異体であることが知られるある変異体(本願明細書で記載された遺伝的変異体など)の存在について分析される。遺伝子型データは、いずれの簡便なデータクエリ方法を使用して、データ保存ユニットから検索され得る。当該個体の特定の遺伝子型によって与えられるリスクの算出は、当該個体の遺伝子型を、当該遺伝子型について以前に測定されたリスク(例えば、相対リスク(RR)またはおよびオッズ比(OR)として表わされる)(例えば、特定の疾病または形質についてのリスクのある変異体のヘテロ接合性の保有者)と比較することに基づくことができる。当該個体について算出されたリスクは、性別および民族性がマッチされた平均的な集団と比較した、ヒトについての相対リスクまたはヒトの特定の遺伝子型の相対リスクであってもよい。当該平均的な集団のリスクは、参照集団から得た結果を使用して、異なる遺伝子型のリスクの加重平均として表わしてもよく、当該集団に対する遺伝子型群のリスクを算出するための適切な算出を行ってもよい。あるいは、個体のリスクは、特定の遺伝子型の比較、例えば、リスクのある対立遺伝子の非保有者と比較した、マーカーのリスクのある対立遺伝子のヘテロ接合性の保有者に基づく。集団平均の使用は、ある実施態様では、それが当該使用者にとって解釈しやすい基準、すなわち、当該集団の平均と比較して、当該個体の遺伝子型に基づき、個体のリスクを与える基準を供給するため、より簡便であることがある。評価され、算出されたリスクは、ウェブサイト、好ましくは安全なウェブサイトを通じて顧客が利用できるようになり得る。
ある実施態様では、サービス提供者は、顧客によって提供された試料から得たゲノムDNAの単離工程、単離されたDNAの遺伝子型の同定の実行工程、遺伝子型データに基づく遺伝的危険率の算出工程、および当該顧客にリスクを報告すること、の全工程を、提供されたサービスに含めるだろう。いくつかの他の実施態様では、当該サービス提供者は、当該個体についての遺伝子型データの解釈、すなわち、当該個体の遺伝子型データに基づく特定の遺伝的変異のリスク評価を、サービスに含めるだろう。いくつかの他の実施態様では、当該サービス提供者は、個体(顧客)から単離されたDNAの試料から開始した、遺伝子型の同定サービスおよび遺伝子型データの解釈を含むサービスを含めてもよい。
複数のリスク変異体についての全体のリスクは、標準的な方法論を使用して行われ得る。例えば、複合モデルの仮定、すなわち、全体の効果を確立するために個々のリスク変異体のリスクが乗算として表されるという仮定は、複数のマーカーについての全体のリスクの単純な算出を可能にする。
さらに、ある他の実施態様では、本発明は、乳癌と診断されていない個体もしくは一般的な集団よりも、乳癌患者に頻繁に表れていない特定の遺伝子マーカー対立遺伝子またはハプロタイプを検出することによる、乳癌に対する減少した感受性についての診断方法、または診断の補助方法に関する。
本願明細書において記載され例証されるように、特定のマーカー対立遺伝子またはハプロタイプは、乳癌のリスクに関連する。1つの実施態様では、マーカー対立遺伝子またはハプロタイプは、乳癌に対する有意なリスクまたは感受性を与えるものである。別の実施態様では、本発明はヒト個体の乳癌に対する感受性の判定方法に関し、当該方法は、当該個体から入手した核酸試料の、少なくとも1つの多型マーカーの少なくとも1つの対立遺伝子の存在または不存在の判定を含む。別の実施態様では、本発明は、本願明細書に記載された少なくとも1つのマーカー対立遺伝子もしくはハプロタイプについてのスクリーニングによる、ヒト個体の乳癌に対する感受性の診断方法に関する。別の実施態様では、マーカー対立遺伝子またはハプロタイプは、乳癌を有する、または乳癌に感受性がある被験者(罹患している)において、健康な被験者(集団対照などの対照)におけるその存在の頻度に比較して、より頻繁に存在する。ある実施態様では、少なくとも1つのマーカー対立遺伝子またはハプロタイプの関連の有意性は、p値<0.05によって特徴付けられる。他の実施態様では、関連の有意性は、より小さいp値(<0.01、<0.001、<0.0001、<0.00001、<0.000001、<0.0000001、<0.00000001つまたは<0.000000001など)によって特徴付けられる。
これらの実施態様では、少なくとも1つのマーカー対立遺伝子またはハプロタイプの存在は、乳癌に対する感受性を示す。これらの診断の方法は、乳癌に関連する少なくとも1つのマーカー対立遺伝子またはハプロタイプの存在または不存在の検出に関する。特定のハプロタイプを構成する特定の遺伝子マーカー対立遺伝子の検出は、本願明細書記載の様々な方法および/または当該技術分野で知られた方法によって行われ得る。例えば、遺伝子マーカーは、核酸レベル(例えば、直接のヌクレオチド配列決定、または当業者に知られた他の手段による)または、遺伝子マーカーが乳癌に関連する核酸にコードされたタンパク質のコード配列に影響する場合は、アミノ酸レベル(例えば、タンパク質配列決定またはこのようなタンパク質を認識する抗体を使用したイムノアッセイによる)で検出され得る。当該マーカー対立遺伝子またはハプロタイプは、乳癌に関連するゲノムDNA配列断片に対応する。このような断片は、問題となっている多型マーカーまたはハプロタイプのDNA配列を含むがまた、マーカーまたはハプロタイプと強いLD(連鎖不平衡)のDNA分節を含んでいてもよい。1つの実施態様では、このような分節は、(0.1超のr2値および/または|D’|>0.8によって判定されるような)当該マーカーまたはハプロタイプとLDにある分節を含む。
1つの実施態様では、乳癌に対する感受性の診断は、ハイブリダイゼーション法を使用して達成され得る(Current Protocols in Molecular Biology、Ausubel,F.ら、編集、John Wiley & Sons参照、全ての補遣を含む)。ゲノムDNA、RNA、もしくはcDNAの、試験の被験者もしくは個体から入手した生物学的試料(「試験試料」)は、乳癌を有する疑いのある被験者、乳癌に対する感受性がある疑いがある被験者、もしくは乳癌に遺伝的な傾向がある疑いがある被験者(「試験被験者」)から得られる。被験者は、成人、子供、または胎児であり得る。試験試料は、ゲノムDNAを含むいずれの供給源(血液試料、羊水試料、脳脊髄液試料、または皮膚、筋肉、頬側粘膜もしくは結膜粘膜、胎盤、消化管または他の器官などから得た組織試料)からでもあり得る。胎児の細胞または組織から得たDNAの試験試料は、適切な方法(羊水穿刺または絨毛採取などによる)によって得られうる。次いで、DNA、RNA、またはcDNA試料を試験した。特異的なマーカー対立遺伝子の存在は、特定の対立遺伝子に特異的な核酸プローブの配列特異的なハイブリダイゼーションによって示され得る。より多くの特定のマーカー対立遺伝子または特定のハプロタイプの存在は、それぞれ特定の対立遺伝子に特異的ないくつかの配列特異的な核酸プローブを使用することによって示され得る。1つの実施態様では、ハプロタイプは、特異的なハプロタイプに特異的な単一の核酸プローブ(すなわち、当該ハプロタイプの特徴を示す特定のマーカー対立遺伝子を含むDNA鎖に特異的にハイブリダイズする)によって示され得る。配列特異的なプローブは、ゲノムDNA、RNA、またはcDNAにハイブリダイズするように向けられ得る。「核酸プローブ」は、本願明細書で使用される場合、相補的配列にハイブリダイズするDNAプローブまたはRNAプローブであり得る。当業者であれば、配列特異的なハイブリダイゼーションが、特定の対立遺伝子が試験試料のゲノム配列に存在する場合のみに生じるように、このようなプローブを設計する方法を知っているだろう。本発明はまた、いずれの簡便な遺伝子型の同定方法(特定の多型マーカーの遺伝子型の同定のための市販の技術および方法を含む)を使用して、実行に移すことができる。
乳癌に対する感受性を判定するため、ハイブリダイゼーション試料は、試験試料(ゲノムDNA試料など)を、少なくとも1つの核酸プローブに接触させることで形成され得る。mRNAまたはゲノムDNAを検出するプローブの非限定的な例は、本願明細書記載のmRNAまたはゲノムDNA配列にハイブリダイズできる標識された核酸プローブである。核酸プローブは、例えば、全長の核酸分子、またはその部分(長さが少なくとも15、30、50、100、250または500ヌクレオチドの、適切なmRNAまたはゲノムDNAにストリンジェントな条件下で特異的にハイブリダイズするのに十分なオリゴヌクレオチドなど)であり得る。ある実施態様では、当該オリゴヌクレオチドは、長さが約15〜約100ヌクレオチドである。ある他の実施態様では、当該オリゴヌクレオチドは、長さが約20〜約50ヌクレオチドである。例えば、核酸プローブは、本願明細書に明記されるLDブロックC09、LDブロックC10A、LDブロック10B、LDブロックC11A、LDブロックC11B、LDブロックC14、LDブロックC18、LDブロックC22A、およびLDブロックC22Bのうちのいずれか1つの全てもしくは一部のヌクレオチド配列を含み得;あるいは、当該核酸プローブは、本願明細書中の表1および4(配列番号:1〜562)に記載されるマーカーを含むヌクレオチド配列の全てもしくは一部、または本願明細書に記載されたマーカーの少なくとも1つの対立遺伝子、もしくは本願明細書で記載された少なくとも1つのハプロタイプを任意に含む本願明細書記載のPAX5、TUB、SERPINH1、RAD51L1、FHOD3およびTNRC6B遺伝子のいずれか1つを含むヌクレオチド配列を含むことができ、または、当該プローブはこのような配列の相補的配列であり得る。特定の実施態様では、当該核酸プローブは、表1、2、3および4(配列番号:1〜562)のいずれか1つに記載されたマーカーを含むヌクレオチド配列一部、あるいは、本願明細書に記載されたマーカーの少なくとも1つの対立遺伝子、または1つの多型マーカーの少なくとも1つの対立遺伝子または本願明細書に記載された少なくとも1つの多型マーカーを含むハプロタイプを任意に含む本願明細書記載のPAX5、TUB、SERPINH1、RAD51L1、FHOD3およびTNRC6B遺伝子のいずれか1つもしくはその断片を含むヌクレオチド配列であるか、またはプローブは、このような配列の相補的配列であり得る。本発明の診断のアッセイの使用のための他の適したプローブは、本願明細書に記載される。ハイブリダイゼーションは、当業者に周知の方法(例えば、Current Protocols in Molecular Biology、Ausubel,F.ら、編集、John Wiley & Sonsを参照、全ての補遣を含む)によって行われ得る。1つの実施態様では、ハイブリダイゼーションは、特異的なハイブリダイゼーション、すなわち、ミスマッチのないハイブリダイゼーション(正確なハイブリダイゼーション)を意味する。1つの実施態様では、特異的なハイブリダイゼーションのハイブリダイゼーション条件は、高度にストリンジェンシーである。
特異的なハイブリダイゼーションは、存在する場合は、次いで、標準的な方法を使用して検出される。特異的なハイブリダイゼーションが、試験試料中で核酸プローブと核酸との間で生じた場合は、当該試料は当該核酸プローブに存在する当該ヌクレオチドに相補的な対立遺伝子を含む。この工程は、いずれの本発明のマーカー、または本発明のハプロタイプを構成するマーカーについて繰り返すことができ、または複数のプローブは1より多くのマーカー対立遺伝子を同時に検出するために、同時に使用され得る。特定のハプロタイプの1より多くのマーカー対立遺伝子を含む単一のプローブ(例えば、特定のハプロタイプを構成する2、3、4、5または全てのマーカーに相補的な対立遺伝子を含むプローブ)を設計することもまた、可能である。試料中の当該ハプロタイプの特定のマーカーの検出は、当該試料の供給源が特定のハプロタイプ(例えば、ハプロタイプ)を有し、従って、乳癌に感受性があることを示す。
1つの好ましい実施態様では、Kutyavinら(Nucleic Acid Res.34:e128(2006))によって記載されているように、その3’末端に蛍光部分または基、およびその5’末端に消光剤、およびエンハンサーオリゴヌクレオチドを含む、検出オリゴヌクレオチドプローブを利用する方法が使用される。蛍光部分は、Gig Harbor GreenまたはYakima Yellow、または他の適した蛍光部分であり得る。検出プローブは、検出されるSNP多型を含む短いヌクレオチド配列にハブリダイズするように設計される。好ましくは、SNPは、末端残基から、当該検出プローブの3’末端から−6残基のどこでもよい。エンハンサーは、当該検出プローブに対して3’の鋳型DNAにハイブリダイズする短いオリゴヌクレオチドプローブである。当該検出プローブと当該エンハンサーヌクレオチドプローブとが当該鋳型に結合すると、両方の間に1つのヌクレオチドの間隙が存在するように、当該プローブが設計される。間隙は、エンドヌクレアーゼ(エンドヌクレアーゼIVなど)によって認識される合成の脱塩基の部位を作る。酵素は、色素を完全に相補的な検出プローブから切断するが、ミスマッチを含む検出プローブを切断することはできない。従って、放出された蛍光部分の蛍光を測定することで、検出プローブのヌクレオチド配列によって定義される特定の対立遺伝子の存在の評価を行い得る。
検出プローブは、いずれの適したサイズでもあり得るが、好ましくは、当該プローブは相対的に短い。1つの実施態様では、当該プローブは長さが5〜100ヌクレオチドである。別の実施態様では、当該プローブは、長さが10〜50ヌクレオチドであり、別の実施態様では、当該プローブは、長さが12〜30ヌクレオチドである。プローブの他の長さも可能であり、当業者の技能の範囲内である。
好ましい実施態様では、SNP多型を含む鋳型DNAは、検出の前にポリメラーゼ連鎖反応(PCR)によって増幅される。このような実施態様では、増幅されたDNAは、当該検出プローブおよび当該エンハンサープローブの鋳型として役立つ。
検出プローブのある実施態様は、PCRによる鋳型の増幅に使用される当該エンハンサープローブおよび/または当該プライマーは、修飾塩基(修飾されたAおよび修飾されたGを含む)の使用を含む。修飾塩基の使用は、鋳型DNAへのヌクレオチド分子(プローブおよび/またはプライマー)の融解温度を調整することに対して有用であり得、例えば、低い割合のGもしくはC塩基を含む領域の融解温度を高めるため、その相補的Tに3つの水素結合を形成できる修飾されたAが使用され得、または、高い割合のGまたはC塩基を含む領域の融解温度を下げるため、例えば、二本鎖DNA分子中のその相補的C塩基に2つの水素結合のみを形成する修飾されたG塩基を使用することによって、有用であり得る。好ましい実施態様では、修飾塩基は、検出ヌクレオチドプローブの設計において使用される。当業者に知られたいずれの修飾塩基もこれらの方法において選択され得、適した塩基の選択は、本願明細書の教示および当業者に知られた市販の供給源から利用可能な公知の塩基に基づき、当業者の範囲内である。
さらに、または、あるいは、ペプチド核酸(PNA)プローブは、本願明細書記載のハイブリダイゼーション法の核酸プローブに加えて、またはそれの代わりに使用され得る。PNAは、ペプチド様の無機の主鎖(有機の塩基(A、G、C、TまたはU)が、メチレンカルボニルリンカーを介してグリシンの窒素に結合している、N−(2−アミノエチル)グリシンユニットなど)を有するDNA模倣体である(例えば、Nielsen,P.ら、Bioconjug.Chem.5:3−7(1994)参照)。PNAプローブは、乳癌に関連する1つ以上のマーカー対立遺伝子またはハプロタイプを含む疑いのある試料中の分子に特異的にハイブリダイズするように設計され得る。本発明の1つの実施態様では、被験者から入手されたゲノムDNAを含む試験試料は収集され、ポリメラーゼ連鎖反応(PCR)が、本発明の1つ以上のマーカーまたはハプロタイプを含む断片を増幅するために使用される。本願明細書記載のように、乳癌に関連する特定のマーカー対立遺伝子またはハプロタイプの同定は、様々な方法(例えば、配列分析、制限消化による分析、特異的なハイブリダイゼーション、一本鎖高次構造多型分析(SSCP)、電気泳動分析など)を使用して達成され得る。別の実施態様では、診断は、定量的PCR(動力学的熱サイクル)を使用した発現分析によって達成される。当該技術は、例えば、市販の技術(TaqMan(登録商標)(アプライドバイオシステムズ社(Applied Biosystems)、カリフォルニア州、フォスターシティーなど)を利用し得る。当該技術は、乳癌に関連する核酸によってコードされるポリペプチドもしくはスプライシング変異体(単数または複数)の発現もしくは構成における変化の存在を評価できる。さらに、変異体(単数または複数)の発現は、物理的に数量化され得るか、または機能的に異なり得る。
別の本発明の方法では、制限消化による分析は、対立遺伝子が参照配列に関連する制限部位の創造または除去をもたらす場合、特定の対立遺伝子の検出に使用され得る。制限断片長多型(RFLP)分析は、例えば、Current Protocols in Molecular Biology(上記参照)に記載のように行うことができる。関連するDNA断片の消化様式は、試料中の特定の対立遺伝子の存在または不存在を示す。
配列分析はまた、特定の対立遺伝子またはハプロタイプの検出に使用され得る。従って、1つの実施態様では、特定のマーカー対立遺伝子またはハプロタイプの存在または不存在の判定は、被験者または個体から入手したDNAまたはRNAの試験試料の配列分析を含む。PCRまたは他の適切な方法は、乳癌に関連する核酸の一部の増幅に使用され得、次いで、特定の対立遺伝子の存在は、試料中のゲノムDNAの多形性部位(またはハプロタイプの複数の多形性部位)の配列決定によって直接的に検出され得る。
別の実施態様では、被験者から得た標的の核酸配列の分節に相補的なオリゴヌクレオチドプローブのアレイは、多形性部位での特定の対立遺伝子を同定するために使用され得る。例えば、オリゴヌクレオチドアレイが使用され得る。オリゴヌクレオチドアレイは、典型的には、異なる公知の部位の基質の表面に結合される複数の異なるオリゴヌクレオチドプローブを含む。これらのアレイは、一般的に、フォトリソグラフィー法および固相オリゴヌクレオチド合成法の組み合わせを取り込んだ機械的合成法もしくは光指向合成法、または当業者に知られた他の方法(例えば、Bier,F.F.ら Adv Biochem Eng Biotechnol 109:433−53(2008);Hoheisel,J.D.、Nat RevGenet 7:200−10(2006);Fan,J.B.、ら Methods Enzymol 410:57−73(2006);Raqoussis,J.およびElvidge,G.、Expert Rev Mol Diagn 6:145−52(2006);Mockler,T.C.ら Genomics 85:1−15(2005)、およびそれらの参考文献を参照(それぞれの全体の教示を参照によって本願明細書に援用する))を使用して作製され得る。多型性の検出のためのオリゴヌクレオチドアレイの調製および使用についての多くの付加的な記載は、例えば、米国特許第6,858,394号明細書、米国特許第6,429,027号明細書、米国特許第5,445,934号明細書、米国特許第5,700,637号明細書、米国特許第5,744,305号明細書、米国特許第5,945,334号明細書、米国特許第6,054,270号明細書、米国特許第6,300,063号明細書、米国特許第6,733,977号明細書、米国特許第7,364,858号明細書、欧州特許第619 321号明細書、および欧州特許第373 203号明細書に見出すことができ、これらの全体の教示は、参照によって本願明細書に組み込まれる。
当業者に利用可能な核酸分析の他の方法は、乳癌に関連する多形性部位の特定の対立遺伝子を検出するために使用され得る。代表的な方法は、例えば、直接のマニュアル配列決定(ChurchおよびGilbert、Proc.Natl.Acad.Sci.USA、81:1991−1995(1988);Sanger F.ら、Proc.Natl.Acad.Sci.USA、74:5463−5467(1977);Beavisら、米国特許第5,288,644号明細書);自動化した蛍光配列決定;一本鎖高次構造多型性アッセイ(SSCP);クランプ変性ゲル電気泳動(clamped denaturing gel electrophoresis)(CDGE);変性剤濃度勾配ゲル電気泳動(DGGE)(Sheffield V.ら、Proc.Natl.Acad.Sci.USA、86:232−236(1989))、移動度シフトアッセイ(Orita M.ら、Proc.Natl.Acad.Sci.USA、86:2766−2770(1989))、制限酵素解析(Flavell R.ら、Cell、15:25−41(1978);Geever R.ら、Proc.Natl.Acad.Sci.USA、78:5081−5085(1981));ヘテロ二本鎖分析;化学的ミスマッチ切断(chemical mismatch cleavage)(CMC)(Cotton R.ら、Proc.Natl.Acad.Sci.USA、85:4397−4401(1985));リボヌクレアーゼプロテクションアッセイ(Myers R.ら、Science、230:1242−1246(1985);ヌクレオチドのミスマッチを認識するポリペプチド(E.coli mutSタンパク質など)の使用;および対立遺伝子特異的なPCRを含む。
本発明の別の実施態様では、乳癌に対する感受性の判定は、本発明の遺伝子マーカー(単数または複数)もしくはハプロタイプ(単数または複数)がポリペプチドの構成もしくは発現の変化をもたらすそれらの例における乳癌に関連した核酸によってコードされたポリペプチドの発現および/または構成を試験することでなされ得る。従って、乳癌に対する感受性の診断は、これらのポリペプチドの1つ、または、本発明の遺伝子マーカーもしくはハプロタイプが当該ポリペプチドの構成または発現の変化をもたらす例における、乳癌に関連した核酸(例えば、PAX5、TUB、SERPINH1、RAD51L1、FHOD3およびTNRC6B遺伝子のうち1つ以上)にコードされた別のポリペプチドの、発現および/または構成を試験することによってなされ得る。乳癌への関連を示す本願明細書記載のマーカーはまた、これらの近くの遺伝子の発現に影響を及ぼしているのかも知れない。遺伝子発現に影響する調節エレメントは、遺伝子のプロモーター領域から数十キロベースまたは数百キロベースでさえ離れて位置しているかも知れないことは周知である。本発明の少なくとも1つの多型マーカーの少なくとも1つの対立遺伝子の存在または不存在をアッセイすることによって、このような近くの遺伝子の発現レベルを評価できる。これらの遺伝子に影響する可能性のある機構は、例えば、転写への効果、RNAスプライシングへの効果、mRNAの別のスプライシングの形態の相対的な量の変化、RNAの安定性への効果、核から細胞質への輸送への効果、ならびに翻訳の効率および正確性への効果を含む。
酵素結合免疫吸着検定法(ELISA)、ウエスタンブロット、免疫沈降および免疫蛍光を含む、様々な方法がタンパク質発現レベルの検出に使用され得る。被験者から得た試験試料は、発現の変化および/または乳癌に関連した核酸にコードされたポリペプチドの構成の変化の存在について評価される。乳癌に関連した核酸にコードされたポリペプチドの発現の変化は、例えば、定量的ポリペプチドの発現(すなわち、産生されたポリペプチドの量)の変化であり得る。乳癌に関連した核酸によってコードされたポリペプチドの構成の変化は、定性的なポリペプチドの発現(例えば、変異ポリペプチドの発現または異なるスプライシング変異体の発現)の変化である。1つの実施態様では、乳癌に対する感受性の診断は、乳癌に関連する核酸によってコードされた特定のスプライシング変異体、またはスプライシング変異体(例えば、PAX5、TUB、SERPINH1、RAD51L1、FHOD3およびTNRC6B遺伝子をコードする核酸)の特定の様式の検出によってなされる。
このような変化の両方(定量的および定性的)もまた、存在し得る。ポリペプチドの発現または構成の「変化」は、本願明細書で使用される場合、対照試料のポリペプチドの発現または構成と比較した、試験試料の発現または構成の変化を意味する。対照試料は、試験試料に対応する試料(例えば、同様のタイプの細胞からもの)であり、乳癌に罹患していない被験者および/または乳癌に対する感受性を有さない被験者から得たものである。1つの実施態様では、対照試料は、本願明細書記載のマーカー対立遺伝子またはハプロタイプを有さない被験者から得たものである。同様に、対照試料と比較した、試験試料における1つ以上の異なるスプライシング変異体の存在、または試験試料における著しく異なる量の異なるスプライシング変異体の存在は、乳癌に対する感受性を示し得る。対照試料と比較した、試験試料におけるポリペプチドの発現または構成の変化は、対立遺伝子が対照試料における参照に関連するスプライシングの部位を変化させる例における、特定の対立遺伝子を示し得る。核酸によってコードされたポリペプチドの発現または構成を試験する様々な手段が当業者に知られ、かつ、使用され得、分光法、比色分析、電気泳動、等電点電気泳動、および、イムノブロッティング(例えば、Current Protocols in Molecular Biology、特に10章、上記参照)などの、イムノアッセイ(例えば、Davidら、米国特許第4,376,110号明細書)を含む。
例えば、1つの実施態様では、乳癌に関連した核酸にコードされたポリペプチドに結合できる抗体(例えば、検出可能な標識を有する抗体)が使用され得る。抗体は、ポリクローナル抗体またはモノクローナル抗体であり得る。インタクトな抗体、またはその断片(例えば、Fv、Fab、Fab’、F(ab’)2)が使用され得る。用語「標識された」は、プローブまたは抗体に関し、検出可能な物質をプローブまたは抗体に結合することによって(すなわち、物理的に連結することによって)プローブまたは抗体を直接的に標識すること、および直接的に標識された別の試薬との反応性によってプローブまたは抗体を間接的に標識することを含むことが意図される。間接的な標識の例は、標識された2次抗体(例えば、蛍光標識された2次抗体)を使用した1次抗体の検出、および蛍光標識されたストレプトアビジンによって検出され得るようにビオチンによるDNAプローブの末端標識を含む。
当該方法の1つの実施態様では、試験試料中の乳癌に関連する核酸(例えば、PAX5、TUB、SERPINH1、RAD51L1、FHOD3および/またはTNRC6B)にコードされたポリペプチドのレベルまたは量は、対照試料中のポリペプチドのレベルまたは量と比較される。対照試料中のポリペプチドのレベルまたは量よりもより高く、またはより低く、そのため、相違が統計的に有意な、試験試料中のポリペプチドのレベルまたは量は、核酸によってコードされたポリペプチドの発現の変化を示し、これは発現の相違を引き起こす原因となる特定の対立遺伝子またはハプロタイプであると診断される。あるいは、試験試料中のポリペプチドの構成は、対照試料中のポリペプチドの構成と比較される。別の実施態様では、ポリペプチドのレベルまたは量ならびに構成の両方は、試験試料および対照試料において評価され得る。
別の実施態様では、乳癌に対する感受性の判定は、本発明の少なくとも1つのマーカーまたはハプロタイプを、さらにタンパク質に基づいたアッセイ、RNAに基づいたアッセイまたはDNAに基づいたアッセイと組み合わせて検出することによってなされる。
(キット)
本発明の方法において有用なキットは、本願明細書記載の方法のいずれにおいても有用な要素を含み、例えば、核酸増幅のためのプライマー、ハイブリダイゼーションプローブ、制限酵素(例えば、RFLP分析のため)、対立遺伝子特異的なオリゴヌクレオチド、本願明細書記載の本発明の核酸(例えば、本発明の少なくとも1つの多型マーカーおよび/またはハプロタイプを含むゲノム分節)によってコードされた変化したポリペプチドに結合する抗体、または、本願明細書記載の本発明の核酸によってコードされた変化していない(ネイティブな)ポリペプチドに結合する抗体、乳癌に関連する核酸を増幅する手段、乳癌に関連する核酸の核酸配列を分析する手段、乳癌に関連する核酸によってコードされたポリペプチドのアミノ酸配列を分析する手段などを含む。当該キットは、例えば、必要なバッファー、本発明の核酸(例えば、本願明細書記載の1つ以上の多型マーカー)を増幅する核酸プライマー、ならびにこのようなプライマーおよび必要な酵素(例えば、DNAポリメラーゼ)を使用して増幅した断片の対立遺伝子特異的な検出のための試薬を含み得る。さらに、キットは、本発明の方法と組み合わせて使用されるアッセイのための試薬、例えば、乳癌の診断のアッセイと使用するための試薬を提供し得る。
1つの実施態様では、本発明は、被験者における乳癌または乳癌の感受性の存在を検出するために、被験者から入手した試料をアッセイするためのキットであり、当該キットは、当該個体のゲノムにおける本発明の少なくとも1つの多型の少なくとも1つの対立遺伝子を選択的に検出するために必要な試薬を含む。特定の実施態様では、当該試薬は、本発明の少なくとも1つの多型を含む当該個体のゲノムの断片にハイブリダイズする少なくとも1つの近接するオリゴヌクレオチドを含む。別の実施態様では、当該試薬は、被験者から入手したゲノム分節の逆ストランドにハイブリダイズする少なくとも1対のオリゴヌクレオチドを含み、各オリゴヌクレオチドプライマー対は、少なくとも1つの多型を含む当該個体のゲノムの断片を選択的に増幅するように設計され、当該多型は、表1および4(配列番号:1〜562)に記載された多型、ならびにそれらと連鎖不平衡の多型マーカーからなる群から選択される。さらに別の実施態様では、当該断片は、サイズが少なくとも20塩基対である。このようなオリゴヌクレオチドまたは核酸(例えば、オリゴヌクレオチドプライマー)は、乳癌を示す多型に隣接する核酸配列(例えば、SNPまたはマイクロサテライト)の部分を使用して設計され得る。別の実施態様では、当該キットは、乳癌に関連する1つ以上の特定の多型マーカーまたはハプロタイプを対立遺伝子特異的に検出できる1つ以上の標識された核酸、および当該標識の検出のための試薬を含む。適した標識は、例えば、放射性同位元素、蛍光標識、酵素標識、酵素共因子標識、磁性標識、スピン標識、エピトープ標識を含む。
特定の実施態様では、当該キットの試薬によって検出される当該多型マーカーまたはハプロタイプは、表1および4のマーカーからなる群から選択される1つ以上のマーカー、2つ以上のマーカー、3つ以上のマーカー、4つ以上のマーカーまたは5つ以上のマーカーを含む。別の実施態様では、検出されるマーカーまたはハプロタイプは、0.2より大きいr2値によって定義される、表1、2、3および4に記載されたマーカーからなるマーカー群の少なくとも1つと強い連鎖不平衡のマーカー群のうちの少なくとも1つのマーカーを含む。別の実施態様では、検出されるマーカーまたはハプロタイプは、マーカーrs2005154、rs2184380、rs2224696、rs2242503、rs12291026、rs999737、rs9956546、rs11912922およびrs6001954からなるマーカー群から選択される少なくとも1つのマーカーを含む。
好ましい実施態様では、SNP多型性を含むDNA鋳型は、検出の前にポリメラーゼ連鎖反応(PCR)によって増幅され、このような増幅のためのプライマーは、試薬キットに含まれる。このような実施態様では、増幅されたDNAは、当該検出プローブの鋳型および当該エンハンサープローブの鋳型として役立つ。
1つの実施態様では、当該DNA鋳型は、本願明細書に記載される特定の多型マーカーの存在についての評価に先立って、全ゲノム増幅(WGA)法によって増幅される。WGAを実施するための当業者に周知の標準的な方法が利用され得、それらは本発明の範囲内にある。1つのこのような実施態様では、WGAを実施するための試薬は試薬キットの中に含められる。
ある実施態様では、特定のマーカー対立遺伝子またはハプロタイプの存在の特定は、乳癌に対する感受性(増加した感受性または減少した感受性)を示す。別の実施態様では、当該マーカー対立遺伝子またはハプロタイプの存在の特定は、乳癌治療薬に対する反応を示す。別の実施態様では、マーカー対立遺伝子またはハプロタイプの存在は、乳癌の予後診断を示す。さらに別の実施態様では、対立遺伝子マーカーまたはハプロタイプの存在は、乳癌治療の進行を示す。このような治療は、手術、薬物療法、または他の手段(例えば、生活スタイルの変化)による介入を含んでいてもよい。
本発明のさらなる態様では、医薬品パック(キット)が提供され、当該パックは、本願明細書に開示される、治療薬および本発明の1以上の変異について診断上試験された当該治療薬のヒトへの投与のための一連の指示を含む。当該治療薬は、小分子薬物、抗体、ペプチド、アンチセンスもしくはrnai分子、または他の治療用分子であり得る。1つの実施態様では、本発明の少なくとも1つの変異体の保有者として同定された個体は、当該治療薬の処方される用量を摂取するように指示される。1つのこのような実施態様では、本発明の少なくとも1つの変異体のホモ接合保有者として同定された個体は、当該治療薬の処方される用量を摂取するように指示される。別の実施態様では、本発明の少なくとも1つの変異体の非保有者として同定された個体は、当該治療薬の処方される用量を摂取するように指示される。
ある実施態様では、当該キットはさらに、当該キットを含む試薬を使用するための一連の指示を含む。ある実施態様では、当該キットはさらに、当該キットにより評価される多型マーカーと乳癌に対する感受性との間の相関データを含むデータの収集物を含む。
(治療薬)
本願明細書に提示された乳癌についてのリスク変異体は、乳癌の新規な治療上の標的を同定するために有用であり得る。例えば、乳癌に関連する変異体(マーカーおよび/もしくはハプロタイプ)を含む遺伝子、もしくはこれらと連鎖不平衡の遺伝子(例えば、1つ以上のPAX5、TUB、SERPINH1、RAD51L1、FHOD3およびTNRC6B遺伝子)、またはこれらの生成物、ならびにこれらの変異遺伝子もしくはその産物によって直接的もしくは間接的に制御され、または相互作用する遺伝子またはこれらの産物は、乳癌の治療、または乳癌に関連する症候の発生の予防もしくは遅延のための治療薬の開発の標的にされ得る。治療薬は、1つ以上の、例えば、小さい非タンパク質分子および非核酸分子、タンパク質、ペプチド、タンパク質断片、核酸(DNA、RNA)、PNA(ペプチド核酸)、または標的遺伝子もしくはこれらの遺伝子産物の機能および/もしくはレベルを調節できるこれらの誘導体もしくは模倣薬を含んでいてもよい。
本願明細書に記載された核酸および/もしくは変異体、またはこれらの相補的な配列を含む核酸は、細胞、組織もしくは器官における遺伝子発現を制御するためのアンチセンス構築物として使用されてもよい。アンチセンス技術に関連する方法論は当業者に周知であり、例えばAntisenseDrug Technology: Principles、Strategies,and Applications、Crooke、編集、Marcel Dekker Inc.、New York(2001)において記載され、概説されている。通常は、アンチセンス薬剤(アンチセンスオリゴヌクレオチド)は、相補的なヌクレオチド分節に結合することができる一本鎖オリゴヌクレオチド(RNAまたはDNA)から構成される。この適切な標的配列を結合することにより、RNA−RNA、DNA−DNAまたはRNA−DNA二本鎖が形成される。当該アンチセンスオリゴヌクレオチドは、遺伝子のセンスまたはコード鎖に相補的である。当該アンチセンスオリゴヌクレオチドが二本鎖DNAに結合する三重らせんを形成することも可能である。
アンチセンスオリゴヌクレオチドのいくつかのクラスは当業者に公知であり、切断剤(cleaver)および遮断剤(blocker)を含む。前者は標的RNA部位に結合し、当該標的RNAを切断する細胞内ヌクレアーゼ(例えば、リボヌクレアーゼHまたはリボヌクレアーゼL)を活性化する。遮断剤は、標的RNAに結合し、リボソームの立体的な障害によってタンパク質の翻訳を阻害する。遮断剤の例は、核酸、モルホリノ化合物、ロックド核酸およびメチルホスホン酸を含む(Thompson、Drug Discovery Today、7:912−917(2002))。アンチセンスオリゴヌクレオチドは、治療薬として直接的に有用であり、また、例えば、遺伝子ノックアウトまたは遺伝子ノックダウン実験によって、遺伝子機能を判定し、検証するのにも有用である。アンチセンス技術は、さらに、Laveryら、Curr.Opin.Drug Discov.Devel.6:561−569(2003)、Stephensら、Curr.Opin.Mol.Ther.5:118−122(2003)、Kurreck、Eur.J.Biochem.270:1628−44(2003)、Diasら、Mol.Cancer Ter.1:347−55(2002)、Chen、Methods Mol.Med.75:621−636(2003)、Wangら、Curr.Cancer Drug Targets 1:177−96(2001)、およびBennett、Antisense Nucleic Acid Drug.Dev.12:215−24(2002)に記載される。
ある実施態様では、当該アンチセンス薬剤は、特定のヌクレオチド分節に結合することができるオリゴヌクレオチドである。ある実施態様では、当該ヌクレオチド分節は、PAX5、TUB、SERPINH1、RAD51L1、FHOD3およびTNRC6B遺伝子のいずれかを含む。ある他の実施態様では、当該アンチセンスヌクレオチドは配列番号:1〜562に記載されるヌクレオチド分節に結合することができる。アンチセンスヌクレオチドは、長さが5〜500ヌクレオチド(5〜200ヌクレオチド、5〜100ヌクレオチド、10〜50ヌクレオチド、および10〜30ヌクレオチドを含む)であり得る。ある好ましい実施態様では、当該アンチセンスヌクレオチドは、長さが14〜50ヌクレオチド(14〜40ヌクレオチドおよび14〜30ヌクレオチドを含む)である。本願明細書に記載された変異はまた、特定の変異に特異的なアンチセンス試薬の選択および設計のために使用され得る。本願明細書に記載された変異についての情報を使用して、本発明の1以上の変異を含むmRNA分子を特異的に標的とするアンチセンスオリゴヌクレオチドまたは他のアンチセンス分子が設計され得る。このようにして、本発明の1以上の変異体(すなわちあるマーカー対立遺伝子および/またはハプロタイプ)を含むmRNA分子の発現は、阻害され得またはブロックされ得る。1つの実施態様では、当該アンチセンス分子は、標的核酸の特定の対立遺伝子の形態(すなわち、1つまたはいくつかの変異(対立遺伝子および/またはハプロタイプ))に特異的に結合して、これによりこの特定の対立遺伝子またはハプロタイプに由来する産物の翻訳を阻害するが、当該アンチセンス分子は当該標的核酸分子の特定の多形性部位での他のまたは別の変異には結合しないように設計される。アンチセンス分子は、遺伝子発現、従ってタンパク質発現を阻害するようにmRNAを不活化するために使用され得るので、当該分子は疾病治療のために使用され得る。この方法論は、mRNAが翻訳される能力を減弱させるmRNAの中の1以上の領域に相補的なヌクレオチド配列を含むリボザイムによる切断を含み得る。このようなmRNA領域としては、例えば、タンパク質コード領域、特にタンパク質の触媒活性、基質および/もしくはリガンド結合部位、または他の機能ドメインに対応するタンパク質コード領域が挙げられる。
RNA干渉(RNAi)の現象は、C.elegans[Fireら、Nature 391:806−11(1998)]でのその最初の発見から、過去10年間で活発に研究されており、近年、ヒト疾病の治療におけるその有望な使用が、活発に探究されている(KimおよびRossi、Nature Rev.Genet.8:173−204(2007)における概説)。RNA干渉(RNAi)はまた、遺伝子サイレンシングとも呼ばれ、特定の遺伝子を遮断するための二本鎖RNA分子(dsRNA)の使用に基づく。細胞では、細胞質二本鎖RNA分子(dsRNA)は、細胞の複合体によって、低分子干渉RNA(siRNA)に処理される。siRNAは、標的mRNA上の特定の部位へとタンパク質とRNAの複合体のターゲティングを導き、mRNAの切断を引き起こす[Thompson、Drug Discovery Today、7:912−917(2002)]。siRNA分子は、典型的には、長さが約20、21、22または23ヌクレオチドである。従って、本発明の1つの態様は、単離した核酸分子、およびRNA干渉のためのこれらの分子の使用、すなわち低分子干渉RNA分子(siRNA)としての使用に関する。1つの実施態様では、単離された核酸分子は長さが18〜26ヌクレオチド、好ましくは長さが19〜25ヌクレオチド、より好ましくは長さが20〜24ヌクレオチド、およびより好ましくは長さが21、22または23ヌクレオチドである。
RNAiを介した遺伝子サイレンシングの別の経路は、miRNA前駆体(pre−miRNA)を生じるために細胞内で処理される、内因的にコードされたプライマリーマイクロRNA(pri−miRNA)転写物に始まる。これらのmiRNA分子は、核から細胞質に輸送され、そこでこれらは成熟したmiRNA分子(miRNA)を生じるための処理を経て、mRNAの3’の非翻訳領域の標的部位を認識することによって翻訳の阻害に方向付けられ、引き続いて、P体(P−bodies)の処理によってmRNAが分解する(KimおよびRossi、Nature Rev.Genet.8:173−204(2007)における概説)。
RNAiの臨床的適用は、好ましくはサイズが約20〜23ヌクレオチド、および好ましくは2ヌクレオチドの3’重複を有する合成二本鎖siRNAを組み入れることを含む。遺伝子発現のノックダウンは、標的mRNAの配列特異的な設計によって確立される。このような分子の至適な設計および合成のためのいくつかの市販の部位は、当業者に知られている。
他の適用は、より長いsiRNA分子(典型的には長さが25〜30ヌクレオチド、好ましくは約27ヌクレオチド)、および低分子ヘアピン型RNA(shRNA;典型的には長さが約29ヌクレオチド)を提供する。後者は、Amarzguiouiら(FEBS Lett.579:5974−81(2005))が記載しているように、自然に発現される。化学的に合成したsiRNAおよびshRNAは、in vivoでの処理のための基質であり、いくつかの場合では、より短い設計よりも、より強力な遺伝子サイレンシングを提供する[Kimら、Nature Biotechnol.23:222−226(2005);Siolasら、Nature Biotechnol.23:227−231(2005)]。一般的に、siRNAは、その細胞内濃度が、引き続く細胞分裂によって希釈されるため、遺伝子発現の一過性のサイレンシングを提供する。対照的に、発現されたshRNAは、shRNAの転写が起こっている限り、標的転写物の、長期間の安定したノックダウンを媒介する(Marquesら、Nature Biotechnol.23:559−565(2006);Brummelkampら、Science 296:550−553(2002))。
siRNA、miRNAおよびshRNAを含めたRNAi分子は、配列依存性様式で作用するため、本願明細書で提示された変異体は、特定の対立遺伝子および/またはハプロタイプ(例えば、本発明の対立遺伝子および/またはハプロタイプ)を含む特定の核酸分子を認識する一方、他の対立遺伝子またはハプロタイプを含む核酸分子を認識しないRNAi試薬を設計するために使用され得る。従って、これらのRNAi試薬は、標的核酸分子を認識し、破壊できる。アンチセンス試薬と同様に、RNAi試薬は治療薬として(すなわち、疾病に関連する遺伝子または疾病に関連する遺伝子変異を遮断するために)有用であり得るが、遺伝子機能を特徴付け、検証すること(例えば、遺伝子ノックアウト実験または遺伝子ノックダウン実験による)にもまた、有用であるかも知れない。
RNAiの送達は、当業者に知られた方法論の範囲によって行ってもよい。非ウイルスデリバリーを利用する方法は、コレステロール、安定した核酸脂質粒子(SNALP)、重鎖抗体の断片(Fab)、アプタマーおよびナノ粒子を含む。ウイルスデリバリー方法は、レンチウイルス、アデノウイルスおよびアデノ随伴ウイルスの使用を含む。siRNA分子は、いくつかの実施態様では、その安定性を増加するために化学的に修飾される。これは、2’−O−メチルプリンおよび2’−フルオロピリミジンを含む、リボースの2’位での修飾を含むことができ、リボヌクレアーゼ活性に対する抵抗性を提供する。他の化学的修飾も可能であり、当業者に知られている。
下記の参考文献は、さらなるRNAiの概略、およびRNAiを用いた特定の遺伝子のターゲティングの可能性を提供する:KimおよびRossi、Nat.Rev.Genet.8:173−184(2007)、ChenおよびRajewsky、Nat.Rev.Genet.8:93−103(2007)、Reynoldsら、Nat.Biotechnol.22:326−330(2004)、Chiら、Proc.Natl.Acad.Sci.USA 100:6343−6346(2003)、Vickersら、J.Biol.Chem.278:7108−7118(2003)、Agami、Curr.Opin.Chem.Biol.6:829−834(2002)、Laveryら、Curr.Opin.Drug Discov.Devel.6:561−569(2003)、Shi、Trends Genet.19:9−12(2003)、Shueyら、Drug Discov.Today 7:1040−46(2002)、McManusら、Nat.Rev.Genet.3:737−747(2002)、Xiaら、Nat.Biotechnol.20:1006−10(2002)、Plasterkら、curr.Opin.Genet.Dev.10:562−7(2000)、Bosherら、Nat.Cell Biol.2:E31−6(2000)、およびHunter、Curr.Biol.9:R440−442(1999)。
乳癌の発生について増加した素因またはリスクを引き起こす遺伝的欠陥、または乳癌の原因となる欠陥は、欠陥を有する被験者に、通常の/野生型のヌクレオチド(単数または複数)を遺伝的欠陥部位で提供する修復配列を取り込む核酸断片を投与することによって、持続的に矯正されるかも知れない。このような部位特異的な修復配列は、被験者のゲノムDNAの内因性修復を促進するように機能するRNA/DNAオリゴヌクレオチドを含んで(concompass)もよい。修復配列の投与は、アニオン性リポソームに被包されたポリエチレンイミンとの複合体、ウイルスベクター(アデノウイルスベクターなど)、または投与した核酸の細胞内吸収を促進するのに適した他の医薬組成物などの、適切な媒体によって行われてもよい。次いで、遺伝的欠陥は、キメラのオリゴヌクレオチドが被験者のゲノムへの、通常の配列の組み込みを引き起こし、通常の/野生型の遺伝子産物の発現を導くため、克服されるかも知れない。置換が増加し、従って、持続性の修復および疾病もしくは疾患に関連する症候の軽減を与える。
本発明は、乳癌の治療に使用され得る化合物または薬剤を同定するための方法を提供する。従って、本発明の変異体は、治療薬の同定および/または開発の標的として有用である。ある実施態様では、このような方法は、本発明の少なくとも1つの変異体(マーカーおよび/またはハプロタイプ)、または核酸のコードされた生成物を含む核酸の活性および/または発現を調節するための薬剤または化合物の能力のアッセイを含む。これは、例えば、1つ以上のFGF10、MRPS30、HCN1およびFGFR2遺伝子、ならびにそれらの遺伝子産物を含む。これは、次に、コードされた核酸産物の所望でない活性もしくは発現を、阻害もしくは変化させる薬剤または化合物を同定するために使用され得る。このような実験を行うためのアッセイは、当業者に知られているように、細胞系または無細胞系で行われ得る。細胞系は、興味ある核酸分子を自然に発現している細胞、または、ある所望の核酸分子を発現するために、遺伝的に修飾された組み換え細胞を含む。
患者における変異遺伝子の発現は、変異を含む核酸配列(例えば、少なくとも1つの変異を含むRNAに転写されることができ、次にタンパク質に翻訳されることができる、少なくとも1つの本発明の変異を含む遺伝子)の発現、または通常の転写物の発現のレベルもしくは様式に影響する変異(例えば、遺伝子の制御領域または調節領域における変異)によって、通常の/野生型の核酸配列が変化した発現によって評価され得る。遺伝子発現のアッセイは、直接の核酸アッセイ(mRNA)、発現したタンパク質レベルのアッセイ、または経路(例えば、シグナル経路)に関連する付随化合物のアッセイを含む。さらに、シグナル経路に反応して上方制御または下方制御される遺伝子の発現もまた、アッセイされ得る。1つの実施態様は、興味ある遺伝子(単数または複数)の制御領域に、レポーター遺伝子(ルシフェラーゼなど)を操作可能に結合すること含む。
遺伝子発現の調節因子は、1つの実施態様では、細胞が候補化合物または候補薬と接触された場合に同定されることができ、mRNAの発現が判定される。候補化合物または候補薬の存在下でのmRNAの発現レベルは、当該化合物または薬剤の不存在下での発現レベルと比較される。当該比較に基づき、乳癌の治療のための候補化合物または候補薬剤は、変異遺伝子の遺伝子発現を調節するものとして同定され得る。候補化合物または候補薬の存在下で、その不存在下よりも、mRNAまたはコード化タンパク質の発現が統計的に有意に大きい場合、当該候補化合物または候補薬は、核酸の発現の刺激剤または核酸の上方制御因子として同定される。候補化合物または候補薬の存在下で、その不存在下よりも、核酸の発現またはタンパク質レベルが統計的に有意に低い場合、その候補化合物は、核酸の発現の阻害剤または下方制御因子として同定される。
本発明は、さらに、遺伝子の修飾因子(すなわち、遺伝子発現の刺激剤および/または阻害剤)としての薬剤(drug)(化合物および/または薬剤(agent))スクリーニングを通じて同定される化合物を使用した治療方法を提供する。
(治療薬に対する反応の可能性の評価方法、治療の進展をモニターする方法および乳癌を治療する方法)
当該技術分野で公知のように、個体は、特定の治療(例えば、治療薬または治療方法、)に対する反応差を有しうる。反応差の基盤は、部分的に遺伝的に判定されてもよい。薬理ゲノミクスは、変化した薬剤処分および/または薬剤の異常な作用もしくは変化した作用によって、遺伝的変異(例えば、本発明の変異体(マーカーおよび/またはハプロタイプ))がどのように薬剤反応に影響するか、という問題点について取り組んでいる。従って、反応差の基盤は部分的に遺伝的に判定されてもよい。薬剤反応に影響する遺伝的変異に起因する臨床的成果は、ある個体(例えば、本発明の遺伝的変異の保有者または非保有者)における薬剤毒性、または当該薬剤の治療不全をもたらすかも知れない。従って、本発明の変異は、治療薬および/または方法が、身体に作用する様式、または身体が治療薬を代謝する方法を判定してもよい。
従って、1つの実施態様では、多形性部位またはハプロタイプの特定の対立遺伝子の存在は、特定の治療様式に対する異なる反応の速度を示す。これは、乳癌と診断され、本発明の、多型における特定の対立遺伝子またはハプロタイプ(例えば、本発明の、リスクがありかつ保護的な対立遺伝子および/またはハプロタイプ)を有する患者は、疾病の治療に使用される、特定の治療上の薬剤および/または他の治療に対して、より良好に、または悪化して反応することを意味する。従って、マーカー対立遺伝子またはハプロタイプの存在または不存在は、患者に対して使用されるべき治療の決定の助けとなり得る。例えば、新規に診断された患者について、本発明のマーカーまたはハプロタイプの存在が(例えば、本願明細書記載のように、血液試料由来のDNAの試験を通じて)評価されてもよい。患者が、マーカー対立遺伝子またはハプロタイプに対して陽性である場合(つまり、マーカーの少なくとも1つの特定の対立遺伝子、またはハプロタイプが存在している)、医師は、1つの特定の治療方法を推奨し、一方、患者がマーカーの少なくとも1つの対立遺伝子、またはハプロタイプに陰性である場合、異なるコースの治療方法が推奨されてもよい(疾病の進行の連続的なモニター以外は、緊急ではない治療方法が行われることを推奨することを含んでいてもよい)。従って、患者の保有者状態は、特定の治療様式が施されるべきかどうかを判定するのを補助するために使用され得る。その価値は、最も適切な治療を適用できるようにするため、早期の段階で疾病を診断でき、最も適切な治療を選択でき、疾病の予後診断/悪性度について臨床医に情報を提供できる可能性の中にある。
さらに本願明細書に記載のように、乳癌の現在の臨床予防的選択肢は、主に化学予防(化学療法、またはホルモン治療方法)および予防的手術である。最も一般的な化学予防は、タモキシフェンおよびラロキシフェンである。他の選択肢は、他の選択的エストロゲン受容体修飾因子(SERM)およびアロマターゼ阻害剤を含む。治療上の選択肢はまた、一部の患者が有害な症候を経験する放射線療法を含む。本発明のマーカーは、本願明細書記載のように、これらの治療上の選択肢に対する反応を評価するため、または、これらの治療上の選択肢のいずれか1つを使用した治療方法の進行を予測するために使用されてもよい。従って、遺伝的鑑定は、個体の遺伝的状態に基づいた適切な治療戦略の選択に使用され得、または特定の治療の選択肢の成果の予測に使用されてもよく、従って、治療上の選択肢または利用可能な治療上の選択肢の組み合わせの戦略的選択について有用であり得る。
本発明はまた、乳癌の治療の進行または有効性をモニターする方法に関する。これは、本発明のマーカーおよびハプロタイプの遺伝子型および/またはハプロタイプの状態に基づいて行われ得、すなわち、本願明細書で開示された少なくとも1つの多型マーカーの少なくとも1つの対立遺伝子の不存在または存在の評価、または本発明の変異体(マーカーおよびハプロタイプ)に関連する遺伝子の発現のモニターによってなされ得る。リスク遺伝子のmRNAまたはコードされたポリペプチドは、組織試料(例えば、抹消血試料、または生検試料)において測定され得る。従って、発現レベルおよび/またはmRNAレベルは、その有効性をモニターするために、治療の前および治療の間に判定され得る。代わりに、または同時に、本願明細書に示された乳癌の少なくとも1つのリスク変異の遺伝子型および/またはハプロタイプの状態は、その有効性をモニターするために、治療の前および治療の間に判定される。
あるいは、本発明のマーカーおよびハプロタイプに関連する生物学的ネットワークまたは代謝経路は、mRNAおよび/またはポリペプチドレベルの測定によってモニターされ得る。例えば、これは、治療前および治療後に得られた試料中の、ネットワークおよび/または経路に属するいくつかの遺伝子について、発現レベルまたはポリペプチドをモニターすることによってなされ得る。あるいは、生物学的ネットワークまたは代謝経路に属する代謝物を、治療前および治療後に測定してもよい。治療の有効性は、治療の間に、発現レベル/代謝物レベルで認められた変化を、健康な被験者から得た対応するデータと比較することによって判定される。
さらなる態様では、本発明のマーカーは、臨床試験の効力および有効性を増加するために使用され得る。従って、本発明のリスクのある変異の保有者である個体、すなわち、乳癌の発生について増加したリスクを与える少なくとも1つの多型マーカーの少なくとも1つの対立遺伝子の保有者である個体は、特定の治療様式に対し、より反応する可能性があってもよい。1つの実施態様では、特定の治療(例えば、小分子薬剤)が標的にしている経路および/または代謝ネットワークの遺伝子(単数または複数)についてリスクのある変異を保有する個体は、当該治療に対してより反応する可能性がある。別の実施態様では、発現および/または機能がリスクのある変異によって変化された遺伝子についてリスクのある変異を保有する個体は、その遺伝子、その発現またはその遺伝子産物を標的とした治療様式に対してより反応する可能性がある。
さらなる態様では、本発明のマーカーおよびハプロタイプは、特定の個体の医薬品の選択のターゲティングに使用され得る。治療様式の個別化された選択、生活習慣の変化、またはこれら2つの組み合わせは、本発明のリスクのある変異体の利用によって実現され得る。従って、本発明の特定のマーカーについての個体の状態の知識は、本発明のリスクのある変異によって影響される遺伝子または遺伝子産物を標的にする、治療上の選択肢の選択について有用であり得る。変異の特定の組み合わせは、治療上の選択肢の1つの選択に適してもよく、一方で他の遺伝子変異の組み合わせは他の治療上の選択肢を標的としてよい。治療要素の選択を臨床的に信頼できる正確性をもって判定するために必要に応じて、このような変異の組み合わせは、1つの変異、2つの変異、3つの変異、または4つ以上の変異を含んでもよい。
(コンピューターで実施される態様)
当業者が理解するとおり、本願明細書に記載される方法および情報は、全体がまたは一部が、公知のコンピューター可読媒体上のコンピューターが実行可能な命令として実施され得る。例えば、本願明細書に記載される方法は、ハードウェアで実施され得る。あるいは、当該方法は、例えば、1以上のメモリまたは他のコンピューター可読媒体に保存されたソフトウェアで実施され得、そして1以上のプロセッサ上で実施され得る。公知のように、当該プロセッサは、1以上の制御装置、計算ユニットおよび/またはコンピューターシステムの他のユニットに関連付けられ得るか、または所望に応じてファームウェアに埋め込まれ得る。ソフトウェアで実施される場合、ルーチンは、公知のようにRAM、ROM、フラッシュメモリ、磁気ディスク、レーザーディスク、または他の記憶媒体などのいずれかのコンピューター可読メモリの中に保存され得る。同様に、このソフトウェアは、いずれかの公知の配信方法を介して(例えば、電話線、インターネット、無線接続などの通信チャネルにわたることを含む)、またはコンピューター可読ディスク、フラッシュドライブなどの持ち運びできる媒体を介して計算装置へと配信され得る。
より一般的には、そして当業者が理解するように、上記の種々の工程は、種々のブロック、演算、ツール、モジュールおよび技術として実施され得、これらは、ひいてはハードウェア、ファームウェア、ソフトウェア、またはハードウェア、ファームウェア、および/もしくはソフトウェアのいずれかの組み合わせで実施され得る。ハードウェアで実施される場合、当該ブロック、演算、技術などのうちのいくつかまたはすべては、例えば、カスタム集積回路(IC)、特定用途向け集積回路(ASIC)、フィールドプログラマブル論理アレイ(FPGA)、プログラマブル論理アレイ(PLA)などで実施され得る。
ソフトウェアで実施される場合、当該ソフトウェアは、いずれかの公知のコンピューター可読媒体に、例えば磁気ディスク、光ディスク、もしくは他の記憶媒体上に、コンピューターのRAMまたはROMまたはフラッシュメモリに、プロセッサ、ハードディスクドライブ、光ディスクドライブ、テープドライブなどに保存され得る。同様に、当該ソフトウェアは、いずれかの公知の配信方法を介して(例えば、コンピューター可読ディスクまたは他の持ち運びできるコンピューター記憶装置上でなど)ユーザーまたはコンピューターシステムへと配信され得る。
図1は、請求項に係る方法および装置の工程のためのシステムが実施され得る、適したコンピューターシステム環境100の例を図示する。コンピューターシステム環境100は、適したコンピューター環境の1つの例に過ぎず、請求項の方法または装置の使用または機能性の範囲に関して何らかの限定を示唆することを意図するものではない。コンピューター環境100は、代表的な動作環境100に図示された構成要素のいずれか1つまたは組み合わせに関して何らかの依存性または必要条件を有すると解釈されるべきでもない。
請求項に係る方法およびシステムの工程は、多数の他の一般的な目的または特別の目的のコンピューターシステム環境または機器構成を用いて動作できる。請求項の方法またはシステムとの使用に適切であり得る周知のコンピューターシステム、環境、および/または機器構成の例としては、パーソナルコンピューター、サーバーコンピューター、携帯端末またはラップトップ型装置、マルチプロセッサシステム、マイクロプロセッサを用いるシステム、セットトップボックス、プログラムできる家庭用電化製品、ネットワークPC、ミニコンピューター、メインフレームコンピューター、上記のシステムまたは装置のいずれかを含む分散コンピューティング環境などが挙げられるが、これらに限定されない。
請求項に係る方法およびシステムの工程は、コンピューターによって実行される、プログラムモジュールなどのコンピューターが実行可能な命令の一般的なコンテクストで記述され得る。一般的に、プログラムモジュールは、特定のタスクを実行し、または特定の抽象データ型を実施するルーチン、プログラム、オブジェクト、構成要素、データ構造などを含む。当該方法および装置は、通信ネットワークを通してリンクされている遠隔の処理装置によってタスクが実行される、分散コンピューティング環境においても実行され得る。統合コンピューティング環境および分散コンピューティング環境の両方において、プログラムモジュールは、メモリ記憶装置を含むローカルのおよび遠隔のコンピューター記憶媒体の両方に位置し得る。
図1を参照して、請求項に係る方法およびシステムの工程を実施するための代表的なシステムは、コンピューター110の形態の一般的な目的の計算装置を含む。コンピューター110の構成要素としては、処理装置120、システムメモリ130、およびシステムメモリを含む種々のシステム構成要素を処理装置120に結合するシステムバス121が挙げられ得るが、これらに限定されない。システムバス121は、メモリバスまたはメモリコントローラ、周辺機器用バス、および様々なバスアーキテクチャのうちのいずれかを使用するローカルバスを含めたいくつかの種類のバス構造のいずれかであり得る。例として、このようなアーキテクチャとしては、業界標準アーキテクチャ(ISA)バス、マイクロ・チャネル・アーキテクチャ(MCA)バス、拡張ISA(EISA)バス、ビデオ・エレクトロニクス・スタンダーズ・アソシエーション(Video Electronics Standards Association)(VESA)ローカルバス、およびMezzanine(中二階)バスとしても知られるペリフェラル・コンポーネント・インターコネクト(Peripheral Component Interconnect)(PCI)バスが挙げられるが、これらに限定されない。
コンピューター110は、典型的には様々なコンピューター可読媒体を含む。コンピューター可読媒体は、コンピューター110によってアクセスされ得るいずれの利用可能な媒体であり得、例としては揮発性媒体および不揮発性媒体の両方、リムーバブル媒体および非リムーバブル媒体が挙げられる。例として、コンピューター可読媒体は、コンピューター記憶媒体および通信媒体を含み得るが、これらに限定されない。コンピューター記憶媒体としては、コンピューター可読命令、データ構造、プログラムモジュールまたは他のデータなどの情報の保存のためのいずれかの方法または技術で実施される、揮発性および不揮発性の両方の、リムーバブル媒体および非リムーバブル媒体が挙げられる。コンピューター記憶媒体としては、RAM、ROM、EEPROM、フラッシュメモリもしくは他のメモリ技術、CD−ROM、デジタルバーサタイルディスク(DVD)もしくは他の光ディスク記憶装置、磁気カセット、磁気テープ、磁気ディスク記憶装置または他の磁気記憶装置、あるいは所望の情報をするために使用され得かつコンピューター110によってアクセスされ得るいずれかの他の媒体が挙げられるが、これらに限定されない。通信媒体は、典型的には、搬送波または他の輸送機構などの変調されたデータ信号の中にコンピューター可読命令、データ構造、プログラムモジュールまたは他のデータを具現化し、いずれかの情報配信媒体を含む。用語「変調されたデータ信号」は、ある信号の特性集合のうちの1以上が、情報を当該信号の中でコード化するような様式で変更されている、その信号を意味する。例として、通信媒体としては、有線ネットワークまたは直接配線接続などの有線媒体、ならびに音響、RF、赤外線および他の無線媒体などの無線媒体が挙げられるが、これらに限定されない。上記のもののうちのいずれかの組み合わせも、コンピューター可読媒体の範囲内に包含されるはずである。
システムメモリ130は、読み出し専用メモリ(ROM)131およびランダムアクセスメモリ(RAM)132などの揮発性メモリおよび/または不揮発性メモリの形態のコンピューター記憶媒体を含む。起動中などにコンピューター110内の要素間で情報を転送することを助ける基本ルーチンを含む基本入出力システム133(BIOS)は、典型的にはROM 131に保存される。RAM 132は、典型的には、処理装置120が直ちにアクセス可能であり、かつ/または現在処理装置120が演算しているデータおよび/またはプログラムモジュールを含む。例として、図1は、オペレーティングシステム134、アプリケーションプログラム135、他のプログラムモジュール136、およびプログラムデータ137を図示するが、これらに限定されない。
コンピューター110はまた、他のリムーバブル/非リムーバブル、揮発性/不揮発性のコンピューター記憶媒体を含み得る。例に過ぎないが、図1は、非リムーバブルの、不揮発性の磁気媒体から読み取りまたは非リムーバブルの、不揮発性の磁気媒体に書き込むハードディスクドライブ140、リムーバブルの、不揮発性の磁気ディスク152から読み取りまたはリムーバブルの、不揮発性の磁気ディスク152に書き込む磁気ディスクドライブ151、およびCD ROMまたは他の光媒体などのリムーバブルの、不揮発性の光ディスク156から読み取りまたはリムーバブルの、不揮発性の光ディスク156に書き込む光ディスクドライブ155を図示する。代表的な動作環境で使用され得る他のリムーバブル/非リムーバブルの、揮発性/不揮発性のコンピューター記憶媒体としては、磁気テープカセット、フラッシュメモリカード、デジタルバーサタイルディスク、デジタルビデオテープ、ソリッドステートRAM、ソリッドステートROMなどが挙げられるが、これらに限定されない。ハードディスクドライブ141は、典型的には、非リムーバブルメモリインターフェース(インターフェース140など)を介してシステムバス121に接続され、磁気ディスクドライブ151および光ディスクドライブ155は、典型的にはリムーバブルメモリインターフェース(インターフェース150など)によってシステムバス121に接続される。
上で論じ図1に図示したドライブおよびそれらの関連するコンピューター記憶媒体は、コンピューター110のためのコンピューター可読命令、データ構造、プログラムモジュールおよび他のデータの保存をもたらす。図1では、例えば、ハードディスクドライブ141は、保存用(storing)オペレーティングシステム144、アプリケーションプログラム145、他のプログラムモジュール146、およびプログラムデータ147として図示されている。これらの構成要素は、オペレーティングシステム134、アプリケーションプログラム135、他のプログラムモジュール136、およびプログラムデータ137と同じであってもよいし、異なっていてもよいことに留意されたい。オペレーティングシステム144、アプリケーションプログラム145、他のプログラムモジュール146、およびプログラムデータ147は、最小限それらが異なるコピーであることを図示するために、ここでは異なる数が与えられている。ユーザーは、キーボード162およびポインティングデバイス161(一般にマウスと呼ばれる)、トラックボールまたはタッチパッドなどの入力装置を通して、コマンドおよび情報をコンピューター20へと入力し得る。他の入力装置(図示せず)は、マイクロホン、ジョイスティック、ゲームパッド、パラボラアンテナ、スキャナーなどを含み得る。これらおよび他の入力装置は、システムバスに結合されているユーザー入力インターフェース160を通して処理装置120に接続されることが多いが、パラレルポート、ゲームポートまたはユニバーサル・シリアル・バス(USB)などの他のインターフェースおよびバス構造によって接続されてもよい。モニター191または他の種類のディスプレイ装置はまた、ビデオインターフェース190などのインターフェースを介してシステムバス121に接続されている。モニターに加えて、コンピューターはまた、スピーカー197およびプリンタ196などの他の周辺出力装置を含み得、これらは出力用周辺インターフェース190を通して接続され得る。
コンピューター110は、リモートコンピューター180などの1以上のリモートコンピューターへの論理結合を使用して、ネットワーク化された環境の中で動作し得る。リモートコンピューター180は、パーソナルコンピューター、サーバー、ルーター、ネットワークPC、ピア装置(peer device)または他の共通のネットワークノードであり得、そして典型的には、コンピューター110に対する上記の要素のうちの多くまたはすべてを含むが、メモリ記憶装置181だけが図1に図示されている。図1に図示される論理結合は、ローカルエリアネットワーク(LAN)171および広域ネットワーク(WAN)173を含むが、他のネットワークも含み得る。このようなネットワーク環境は、オフィス、企業規模のコンピューターネットワーク、イントラネットおよびインターネット内では普通のものである。
LANネットワーク環境で使用される場合、コンピューター110は、ネットワークインターフェースまたはアダプター170を通してLAN171に接続される。WANネットワーク環境で使用される場合、コンピューター110は、典型的には、モデム172またはインターネットなどのWAN173にわたって通信を確立するための他の手段を含む。モデム172(内蔵モデムまたは外付けモデムであり得る)は、ユーザー入力インターフェース160、または他の適切な機構を介してシステムバス121に接続され得る。ネットワーク化された環境では、コンピューター110に対して示されたプログラムモジュール、またはその一部分は、遠隔のメモリ記憶装置に保存され得る。例として、図1は、遠隔のアプリケーションプログラム185をメモリ装置181上に存在するとして図示しているが、これに限定されない。示されるネットワーク接続は代表的なものであり、コンピューター間の通信リンクを確立するための他の手段が使用され得ることは分かるであろう。
上記の本文は本発明の多数の異なる実施態様の詳細な説明を記載するが、本発明の範囲は、添付の特許請求の範囲の文言によって定められるということを理解されたい。この詳細な説明は、代表的なものに過ぎないと解釈されるべきであり、あらゆる可能性のある本発明の実施態様を記載しているわけではない。なぜなら、あらゆる可能性のある実施態様を記載することは、不可能ではないかも知れないが、実益がないと思われるからである。多数の代替の実施態様が、現在の技術または本特許の出願日以後に開発される技術のいずれかを使用して実施され得、それらは、依然として本発明を画定する特許請求の範囲の範囲内に含まれることになる。
リスク評価システムおよび方法、ならびに他の要素が、好ましくはソフトウェアで実施されるとして記載されてきたが、それらはハードウェア、ファームウェアなどで実施され得、いずれかの他のプロセッサによって実施され得る。従って、本願明細書に記載された要素は、標準的な多目的CPUでまたは所望に応じて特定用途向け集積回路(ASIC)または他の配線接続された装置などの特定的に設計されたハードウェアまたはファームウェア(図1のコンピューター110が挙げられるが、これに限定されない)上で実施され得る。ソフトウェアで実施される場合、当該ソフトウェアルーチンは、磁気ディスク、レーザーディスク、または他の記憶媒体上などのいずれかのコンピューター可読メモリに、コンピューターまたはプロセッサのRAMまたはROMに、いずれかのデータベースなどに保存され得る。同様に、このソフトウェアは、例えばコンピューター可読ディスクもしくは他の持ち運びできるコンピューター記憶装置上、または電話線、インターネット、無線通信など通信チャネルにわたって(これらは、持ち運びできる記憶媒体を介してこのようなソフトウェアを提供することと同じまたは置き換え可能であると考えられる)、を含めた、いずれかの公知のまたは所望の配信方法を介してユーザーまたは診断システムに配信され得る。
従って、本発明の趣旨および範囲から逸脱せずに、本願明細書に記載および図示された技術および構造の中で、多くの改変態様および変更態様がなされ得る。従って、本願明細書に記載された方法および装置は例示的なものに過ぎず、本発明の範囲に対する限定にはならないということを理解されたい。
従って、本発明は、乳癌に関連すると本願明細書に記載された多型マーカーおよびハプロタイプのコンピューターで実施される応用例に関する。このような応用例は、本発明の方法で有用な遺伝子型データの保存、操作、または別の態様での分析のために有用であり得る。1つの例は、遺伝子型情報を第三者(例えば、個体、その個体の保護者、医療提供者または遺伝学的解析サービスの提供者)に提供することができるように、または例えば当該遺伝子型データを癌に対する増加した感受性に寄与する遺伝的危険因子についての情報と比較することにより、当該遺伝子型データから情報を誘導し、そしてこのような比較に基づいて結果を報告するために、個体由来の遺伝子型情報を可読媒体上に保存することに関する。
一般的に言えば、コンピューター可読媒体は、(i)本願明細書に記載された少なくとも1つの多型マーカーまたはハプロタイプの識別子の情報、(ii)当該疾病の個体における、当該少なくとも1つのマーカーの少なくとも1つの対立遺伝子の頻度の指標もしくはハプロタイプの頻度の指標、および参照集団における、当該少なくとも1つのマーカーの少なくとも1つの対立遺伝子の頻度の指標もしくはハプロタイプの頻度の指標、を保存する性能を有する。当該参照集団は、個体の疾病フリーの集団であり得る。あるいは、当該参照集団は、一般的な集団から得た確率標本であり、従って、集団全体を代表する。頻度の指標は、算出された頻度、対立遺伝子および/またはハプロタイプのコピーの数、または、特定の媒体に適した実際の頻度の規準化された値もしくは別の態様で操作された値であってもよい。
本願明細書で、乳癌の増加した感受性(増加したリスク)に関連すると記載されたマーカーおよびハプロタイプは、ある実施態様では、遺伝子型のデータの解釈および/または分析に有用である。従って、ある実施態様では、本願明細書で示された、乳癌のリスクのある対立遺伝子の存在の判定、またはいずれかのこのようなリスク対立遺伝子とLDである多型マーカーの対立遺伝子の存在の判定は、遺伝子型のデータの由来である個体が乳癌について増加したリスクを有することを示す。そのような1つの実施態様では、遺伝子型のデータは、本願明細書で乳癌に関連すると示された少なくとも1つの多型マーカー、またはそれらと連鎖不平衡のマーカーについて生じる。当該遺伝子型のデータは、例えば、インターネットに接続可能なユーザーインターフェースを介して、当該遺伝子型のデータの解釈とともに、例えば、疾病についてのリスク判定基準(絶対的なリスク(AR)、リスク比(RR)またはオッズ比(OR)など)の形態で、その後に、当該データの由来である個体、その個体の保護者または代表者、医師または医療従事者、遺伝子カウンセラー、または保険代理業者などの第三者に利用可能となる。別の実施態様では、個体由来の遺伝子型のデータセットで同定されたリスクのあるマーカーが評価され、当該データセットにおけるこのようなリスクのある変異体の存在によって与えられるリスク評価から得た結果は、例えば、安全なウェブインターフェースを介して、または他の伝達手段によって当該第三者に利用可能となる。このようなリスクアセスメントの結果は、数値的な形態(例えば、絶対的なリスク、相対リスク、および/もしくはオッズ比などのリスク値、または参照と比較したリスクの増加した割合による)、図面による方法、または当該遺伝子型のデータの由来である個体のリスクを図解するのに適した他の手段で報告され得る。
(核酸およびポリペプチド)
本願明細書記載の核酸およびポリペプチドは、上記に記載のように、本発明の方法およびキットで使用され得る。「単離された」核酸分子は、本願明細書で使用される場合、(ゲノム配列における)遺伝子またはヌクレオチド配列に通常に隣接した核酸から分離されたもの、および/または、(例えば、RNAライブラリーにおける)他の転写された配列から完全にもしくは部分的に精製したものである。例えば、本発明の単離された核酸は、自然に生じる複雑な細胞環境、または組み換え技術によって産生された場合の培養培地、または化学的に合成された場合の化学的前駆体または他の化学物質に対して実質的に単離され得る。いくつかの例では、単離された物質は、組成物(例えば、他の物質を含む粗抽出物)、バッファーシステムまたは試薬混合物の一部を形成するだろう。他の環境では、当該物質は、例えば、ポリアクリルアミドゲル電気泳動(PAGE)またはカラムクロマトグラフィー(例えば、HPLC)によって判定されるように、基本的に均一に精製され得る。本発明の単離された核酸分子は、存在する全ての高分子の種のうち、少なくとも約50%、少なくとも約80%または少なくとも約90%(モルベースによる)を構成し得る。ゲノムDNAに関しては、用語「単離された」はまた、当該ゲノムDNAが本来関連する染色体から分離される核酸分子も意味し得る。例えば、単離した核酸分子は、約250kb、200kb、150kb、100kb、75kb、50kb、25kb、10kb、5kb、4kb、3kb、2kb、1kb、0.5kbまたは0.1kb未満の、当該核酸分子が由来する細胞のゲノムDNAの核酸分子に隣接するヌクレオチドを含み得る。
当該核酸分子は、他のコード配列または制御配列に融合され得、依然として単離されたものとみなされ得る。従って、ベクターに包含された組み換えDNAは、本願明細書で使用される「単離された」の定義に含まれる。また、単離された核酸分子は、異種の宿主細胞もしくは異種生命体中の組み換えDNA分子、および部分的にもしくは実質的に精製された溶液中のDNA分子を含む。「単離された」核酸分子はまた、in vivoおよびin vitroでの本発明のDNA分子のRNA転写物を含む。単離した核酸分子またはヌクレオチド配列は、化学的に合成された、または組み換え手段によって合成された核酸分子またはヌクレオチド配列を含み得る。このような単離されたヌクレオチド配列は、例えば、コードされたポリペプチドの製造において、(例えば、他の哺乳類の種からの)相同配列の単離のため、(例えば、染色体とのインサイツハイブリダイゼーションによる)遺伝子マッピングのため、または組織(例えば、ヒト組織)中の遺伝子発現の検出(ノーザンブロット分析または他のハイブリダイゼーション技術などによる)のためのプローブとして有用である。
本発明はまた、高いストリンジェンシーハイブリダイゼーション条件下(選択的ハイブリダイゼーションなど)で、本願明細書記載のヌクレオチド配列(例えば、本願明細書記載のマーカーまたはハプロタイプに関連する多形性部位を含むヌクレオチド配列に特異的にハイブリダイズする核酸分子)にハイブリダイズする核酸分子に関する。このような核酸分子は、(例えば、高いストリンジェンシー条件下での)対立遺伝子特異的なハイブリダイゼーションまたは配列特異的なハイブリダイゼーションによって検出および/または単離され得る。核酸ハイブリダイゼーションのストリンジェンシー条件および方法は、当業者に周知(例えば、Current Protocols in Molecular Biology、Ausubel,F.ら、John Wiley & Sons、(1998)、およびKraus,M.およびAaronson,S.、Methods Enzymol.、200:546−556(1991)を参照、その全体の教示は参照によって本願明細書に援用する)である。
2つのヌクレオチドまたはアミノ酸配列の同一性(%)は、至適な比較目的で配列を整列することによって判定され得る(例えば、間隙は、第1の配列の配列に導入され得る)。対応する位置のヌクレオチドまたはアミノ酸は、次いで、比較され、2つの配列間の同一性(%)は、当該配列によって共有される同一の位置の数の関数である(すなわち、同一性(%)=同一の位置の数/位置の総数×100)。ある実施態様では、比較目的で整列させた配列の長さは、参照配列の長さのうち、少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、または少なくとも95%である。2つの配列の実際の比較は、周知の方法、例えば、数学的アルゴリズムを使用することによって達成され得る。このような数学的アルゴリズムの非限定的な例は、Karlin,S.およびAltschul,S.、Proc.Natl.Acad.Sci.USA、90:5873−5877(1993)に記載される。このようなアルゴリズムは、Altschul S.ら、Nucleic Acids Res.、25:3389−3402(1997)に記載されるように、NBLASTプログラムおよびXBLASTプログラム(バージョン2.0)に取り込まれる。BLASTプログラムおよびGapped BLASTプログラムを利用する場合、それぞれのプログラム(例えば、NBLAST)の初期状態のパラメータが使用され得る。ワールドワイドウェブ(ncbi.nlm.nih.gov.)上のウェブサイトを参照。1つの実施態様では、配列比較のパラメータはスコア=100、語長=12に設定し得るし、または、異なり得る(例えば、W=5またはW=20)。アルゴリズムの別の例はBLAT[Kent,W.J. Genome Res. 12:656−64(2002)]である。
他の例は、MyersおよびMiller、CABIOS(1989)のアルゴリズム、Torellis A.およびRobotti C.、Comput.Appl.Biosci.10:3−5(1994)に記載されたADVANCEおよびADAM、およびPearson W.およびLipman,D.、Proc.Natl.Acad.Sci.USA、85:2444−48(1988)に記載されたFASTAを含む。
別の実施態様では、2つのアミノ酸配列間の同一性(%)は、GCGソフトウェアパッケージ(アクセルリス(Accelrys)、英国、ケンブリッジ)におけるGAPプログラムを使用して達成され得る。
本発明はまた、本願明細書で定義されるLDブロックC09、LDブロックC10A、LDブロック10B、LDブロックC11A、LDブロックC11B、LDブロックC14、LDブロックC18、LDブロックC22A、およびLDブロックC22Bのすべてもしくは一部分を含むヌクレオチド配列を含む(またはこれらからなる)核酸;または本願明細書中の表4(配列番号:1〜562)に記載された多型マーカーのうちの少なくとも1つを含む核酸;またはPAXS、TUB、SERPINH1、RAD51L1、FHOD3およびTNRC6B遺伝子のうちのいずれか1つのヌクレオチド配列;あるいは本願明細書で定義されるLDブロックC09、LDブロックC10A、LDブロック10B、LDブロックC11A、LDブロックC11B、LDブロックC14、LDブロックC18、LDブロックC22A、およびLDブロックC22Bのすべてもしくは一部分を含むヌクレオチド配列の補完物;または本願明細書中の表4(配列番号:1〜562)に記載された多型マーカーのうちの少なくとも1つを含む核酸の補完物;またはPAXS、TUB、SERPINH1、RAD51L1、FHOD3およびTNRC6B遺伝子のうちのいずれか1つのヌクレオチド配列の補完物を含む(またはこれらから構成される)ヌクレオチド配列に、高度にストリンジェントな条件下でハイブリダイズする断片または部分を含む、単離した核酸分子を提供する。
本発明の核酸断片は、長さが少なくとも約15、少なくとも約18、20、23または25ヌクレオチドであり、30、40、50、100、200、500、1000、10,000またはこれより多いヌクレオチドであり得る。
本発明の核酸断片は、本願明細書記載のようなアッセイにおけるプローブまたはプライマーとして使用される。「プローブ」または「プライマー」は、塩基特異的様式で核酸分子の相補鎖にハイブリダイズする、オリゴヌクレオチドである。DNAおよびRNAに加えて、このようなプローブおよびプライマーは、Nielsen P.ら、Science 254:1497−1500(1991)において記載されたように、ポリペプチド核酸(PNA)を含む。プローブまたはプライマーは、核酸分子の少なくとも約15、典型的には約20〜25、およびある実施態様では約40、50または75の、核酸分子の連続的ヌクレオチドにハイブリダイズするヌクレオチド配列領域を含む。1つの実施態様では、当該プローブまたはプライマーは、本願明細書記載の少なくとも1つの多型マーカーの少なくとも1つの対立遺伝子もしくは少なくとも1つのハプロタイプ、またはその補完物を含む。特定の実施態様では、プローブまたはプライマーは、100またはより少ないヌクレオチド(例えば、ある実施態様では、6〜50ヌクレオチド、または、例えば、12〜30ヌクレオチド)を含み得る。他の実施態様では、当該プローブまたはプライマーは、近接するヌクレオチド配列もしくは当該近接するヌクレオチド配列の補完物と、少なくとも70%の同一性、少なくとも80%の同一性、少なくとも85%の同一性、少なくとも90%の同一性、または少なくとも95%の同一性である。別の実施態様では、当該プローブまたはプライマーは、近接するヌクレオチド配列または当該近接するヌクレオチド配列の補完物に、選択的にハイブリダイズできる。しばしば、当該プローブまたはプライマーは、さらに、標識(例えば、放射性同位元素、蛍光標識、酵素標識、酵素共因子標識、磁性標識、スピン標識、エピトープ標識)を含む。
上記などの本発明の核酸分子は、当業者に周知の標準的な分子生物学技術を使用して同定され、単離され得る。増幅したDNAは、標識(例えば、放射標識)され得、ヒト細胞由来のcDNAライブラリーのスクリーニングのためのプローブとして使用され得る。cDNAは、mRNA由来であり得、適したベクター中に含まれ得る。対応するクローンが単離され得、DNAはin vivoでの切除の後に得ることができ、クローン化された挿入断片は、一方向または両方向で、当該技術分野で承認されている方法によって、適切な分子量のポリペプチドをコードする正しい読み枠を同定し、配列決定され得る。これらの方法または同様の方法を使用して、ポリペプチドおよびポリペプチドをコードするDNAは単離され、配列決定され、さらに特徴付けられ得る。
(抗体)
本発明はまた、変異対立遺伝子によってコードされる変異アミノ酸配列(例えば、アミノ酸置換を含む)または対応する非変異対立遺伝子または野生型対立遺伝子によってコードされる参照アミノ酸配列のいずれかを含むエピトープに結合する抗体を提供する。用語「抗体」は、本願明細書で使用される場合、免疫グロブリン分子および免疫グロブリン分子の免疫学的に活性な部分、すなわち、特異的に抗原に結合する抗原結合部位を含む分子を意味する。本発明のポリペプチドに特異的に結合する分子は、そのポリペプチドまたはその断片に結合するが、試料中、例えば、自然に当該ポリペプチドを含む生物学的試料中の他の分子には実質的に結合しない分子である。免疫グロブリン分子の免疫学的に活性な部分の例は、抗体をペプシンなどの酵素で処理することによって生じ得るF(ab)およびF(ab’)2断片を含む。本発明は、本発明のポリペプチドに結合するポリクローナル抗体およびモノクローナル抗体を提供する。用語「モノクローナル抗体」または「モノクローナル抗体の組成物」は、本願明細書で使用される場合、本発明のポリペプチドの特定のエピトープと免疫反応できる1種のみの抗原結合部位を含む抗体分子の集団を意味する。従って、モノクローナル抗体の組成物は、典型的には、免疫反応する本発明の特定のポリペプチドに対する単一の結合アフィニティーを示す。
ポリクローナル抗体は、適した被験者に、所望の免疫原(例えば、本発明のポリペプチドまたはその断片)で免疫することによって、上記のように、調製され得る。免疫された被験者における抗体力価は、酵素結合免疫吸着検定法(ELISA)などの標準的な技術によって、固定化されたポリペプチドを使用して、経時的にモニターされ得る。所望であれば、ポリペプチドに対して作られた抗体分子は、哺乳類から(例えば、血液から)単離され得、さらに、IgG分画を得るために、プロテインAクロマトグラフィーなどの周知の技術によって精製され得る。免疫後の適切な時期に、例えば、抗体力価が最も高いときに、抗体産生細胞が被験者から入手され、標準的な技術(KohlerおよびMilstein、Nature 256:495−497(1975)に最初に記載された融合細胞法、ヒトB細胞の融合細胞法(Kozborら、Immunol.Today 4: 72(1983))、EBV融合細胞法(Coleら、Monoclonal Antibodies and Cancer Therapy、Alan R.Liss、1985、Inc.、77−96頁)またはトリオーマ(trioma)法など)によってモノクローナル抗体を調製するために使用され得る。融合細胞を産生する技術は周知である(概括的に、Current Protocols in Immunology(1994)Coliganら、(編集)John Wiley & Sons社、New York、NY参照)。簡潔に言えば、不死の株化細胞(典型的にはミエロ−マ)は、上記の免疫原で免疫された哺乳類から得たリンパ球(典型的には脾細胞)と融合され、得られた融合細胞の培養上清は、本発明のポリペプチドに結合するモノクローナル抗体を産生する融合細胞を同定するためにスクリーニングされる。
リンパ球および不死化株化細胞を融合するために使用される多くの周知の手順のいずれも、本発明のポリペプチドに対するモノクローナル抗体を生じる目的で適用され得る(例えば、Current Protocols in Immunology、前出;Galfreら、Nature 266:55052(1977);R.H.Kenneth、Monoclonal Antibodies:A New Dimension In Biological Analyses中、Plenum Publishing Corp.、New York、New York(1980);およびLerner、Yale J.Biol.Med.54:387−402(1981)参照)。さらに、当業者は、同様に有用であるこのような方法の多くのバリエーションがあることを理解するだろう。
モノクローナル抗体分泌融合細胞の調製の代わりに、本発明のポリペプチドに対するモノクローナル抗体が、当該ポリペプチドとの組み換えコンビナトリアル免疫グロブリンライブラリー(例えば、抗体ファージディスプレイライブラリー)をスクリーニングし、それにより、当該ポリペプチドに結合する免疫グロブリンライブラリーメンバーを単離することによって、同定および単離され得る。ファージディスプレイライブラリーを生じ、かつスクリーニングするためのキットは、市販されている(例えば、ファルマシア社(Pharmacia)組み換えファージ抗体システム、カタログ番号27−9400−01;およびストラタジーン社(Stratagene)SurfZAP(商標)ファージディスプレイキット、カタログ番号240612)。その上、方法および試薬の例、特に、抗体のディスプレイライブラリーの生成およびスクリーニングにおける使用において受け入れられる例は、例えば、米国特許第5,223,409号明細書、国際公開第92/18619号パンフレット、国際公開第91/17271号パンフレット、国際公開第92/20791号パンフレット、国際公開第92/15679号パンフレット、国際公開第93/01288号パンフレット、国際公開第92/01047号パンフレット、国際公開第92/09690号パンフレット、国際公開第90/02809号パンフレット;Fuchsら、Bio/Technology 9:1370−1372(1991);Hayら、Hum.Antibod.Hybridomas 3:81−85(1992);Huseら、Science 246:1275−1281(1989);およびGriffithsら、EMBO J.12:725−734(1993)において見出され得る。
その上、ヒト部分および非ヒト部分の両方を含み、標準的な組み換えDNA技術を使用して産生され得る組み換え抗体(キメラのモノクローナル抗体およびヒト化モノクローナル抗体など)は、本発明の範囲内である。このようなキメラのモノクローナル抗体およびヒト化モノクローナル抗体は、当該技術分野で公知の組み換えDNA技術によって産生され得る。
通常は、本発明の抗体(例えば、モノクローナル抗体)は、標準的な技術(アフィニティークロマトグラフィーまたは免疫沈降など)によって本発明のポリペプチド(例えばPAX5、TUB、SERPINH1、RAD51L1、FHOD3およびTNRC6B遺伝子のうちのいずれか1つによってコードされるポリペプチド)を単離するのに使用され得る。ポリペプチド特異的な抗体は、細胞からの自然のポリペプチドの精製および宿主細胞で発現した組み換えによって産生されたポリペプチドの精製を促進できる。さらに、本発明のポリペプチドに特異的な抗体は、当該ポリペプチドの存在量および発現様式を評価するために、(例えば、細胞溶解物、細胞上清、または組織試料中の)当該ポリペプチドを検出するのに使用され得る。抗体は、臨床試験過程の一部として、例えば、所定の治療計画の有効性の判定などのため、組織中のタンパク質レベルをモニターするために診断的に使用され得る。抗体は、その検出を促進するための検出可能な物質と結合され得る。検出可能な物質の例は、様々な酵素、補欠分子族、蛍光物質、発光物質、生物発光物質、および放射性物質を含む。適した酵素の例は、西洋わさびペルオキシダーゼ、アルカリホスファターゼ、βガラクトシダーゼ、またはアセチルコリンエステラーゼを含む。適した補欠分子族複合体の例は、ストレプトアビジン/ビオチンおよびアビジン/ビオチンを含む。適した蛍光物質の例は、ウンベリフェロン、フルオレセイン、フルオレセインイソチオシアネート、ローダミン、ジクロロトリアジニルアミンフルオレセイン(dichlorotriazinylamine fluorescein)、塩化ダンシルまたはフィコエリトリンを含む。発光物質の例は、ルミノールを含む。生物発光物質の例は、ルシフェラーゼ、ルシフェリン、およびエクオリンを含み、ならびに、適した放射性物質の例は125I、131I、35Sまたは3Hを含む。
抗体はまた、薬理ゲノミクス分析において有用であってもよい。このような実施態様では、本発明に関する核酸によってコードされた変異タンパク質に対する抗体(少なくとも1つの本発明の多型マーカーを含む核酸によってコードされた変異タンパク質など)は、改変された治療様式を必要とする個体の同定のために使用され得る。
抗体は、さらに、疾病の活性段階などの疾病の状態、またはタンパク質の機能に関連した疾病(特に乳癌)に対する素因のある個体における変異タンパク質の発現の評価のために有用であり得る。本願明細書記載の少なくとも1つの多型マーカーまたはハプロタイプを含む核酸によってコードされた本発明の変異タンパク質に特異的な抗体は、変異タンパク質の存在のスクリーニング、例えば、変異タンパク質の存在によって示された乳癌への素因についてのスクリーニング、に使用され得る。
抗体は他の方法で使用され得る。従って、抗体は、電気泳動の移動度、等電点、トリプシンまたは他のプロテアーゼ消化による分析と組み合わせて、タンパク質(本発明の変異タンパク質など)を評価するための診断の手段として、または当業者に知られた他の物理的なアッセイにおける使用において有用である。抗体はまた、組織適合試験に使用してもよい。そのような1つの実施態様では、特定の変異タンパク質は、特定の組織型の発現に関連し、変異タンパク質に特異的な抗体は、次いで、特定の組織型の同定に使用され得る。
変異タンパク質を含むタンパク質の細胞内局在はまた、抗体を使用して判定され得、様々な組織の細胞のタンパク質の異常な細胞内局在を評価するために適用され得る。このような使用は遺伝子検査に適用され得るが、特定の治療様式をモニターすることにも適用され得る。治療が、変異タンパク質の発現レベルもしくは存在または変異タンパク質の異常な組織分布もしくは発生上の発現を矯正することを目的にしている場合、当該変異タンパク質またはその断片に特異的な抗体は治療有効性をモニターするために使用され得る。
抗体は、さらに、例えば、結合分子またはパートナーへの、変異タンパク質の結合をブロックすることによる変異タンパク質の機能の阻害において有用である。このような使用はまた、治療が変異タンパク質の機能の阻害に関連する治療上の構成においても適用され得る。抗体は、例えば、結合をブロックまたは競合的に阻害し、それによりタンパク質の活性を調節(すなわち、刺激または拮抗)するのに使用され得る。抗体は、特定の機能に必要とされる部位を含む特定のタンパク質断片、または、細胞または細胞膜に関連するインタクトなタンパク質に対して調製され得る。in vivoにおける投与について、抗体はさらなる治療上の負荷量(放射性核種、酵素、免疫原性エピトープ、または細菌毒素(ジフテリアまたは、リシンなどの植物毒素)を含む細胞毒など)に関連してもよい。in vivoでの抗体またはその断片の半減期は、ポリエチレングリコールとの結合によるペグ化によって増加されてもよい。
本発明は、さらに、本願明細書記載の方法における抗体を使用するためのキットに関する。これは、試験試料における変異タンパク質の存在を検出するためのキットを含むが、これに限定されない。1つの好ましい実施態様は、抗体(標識された抗体または標識できる抗体など)および生物学的試料中の変異タンパク質を検出するための化合物もしくは薬剤、試料中の変異タンパク質の量もしくは存在および/もしくは不存在を判定する手段、ならびに試料中の変異タンパク質の量を標準物質と比較する手段、ならびに当該キットの使用についての説明書を含む。
本発明は、これから下記の非限定的な実施例によって例証される。