悪性細胞の制御されない増殖である癌は、現代医学時代の主たる健康問題であり、そして先進国における主たる死因の一つである。米国において、4人に1人は癌で死亡している(Jemal,A. et al., CA Cancer J. Clin. 52:23-47(2002)) 。
前立腺癌の発生率はこの十年で劇的に増加しており、そして前立腺癌は現在、米国及び西欧において主たる死亡原因である(Peschel, R.E. and J. W. Colberg, Lancet 4:233-41 (2003); Nelson, W.G. et al, N. Engl. J. Med. 349(4):366-81 (2003)) 。前立腺癌は、先進工業国の男性間で最も頻繁に診断される非皮膚性悪性腫瘍であり、及び米国において、8人の内1人が生涯の間に前立腺癌を発症するであろう(Simard, J. et al.,Endocrinology 143 (6):2029-40 (2002)) 。食事因子及び生活スタイル関連因子のような環境因子が前立腺癌のリスクに寄与するけれども、遺伝因子が重要な役割を果たすことも示されている。実際、陽性家族歴は、中でも最も強い前立腺癌の疫学的リスク因子であり、そして一卵性双生児における前立腺癌の一致した出現を比較している双生児研究は、いずれか他のタイプの癌におけるよりも前立腺癌のリスクにおけるより強い遺伝性成分を一貫して明らかにした (Nelson, W.G. et al., N. Engl. J. Med. 349(4):366-81 (2003); Lichtenstein P. et. al., N. Engl. J. Med. 343(2):78-85 (2000)) 。加えて、1955〜2003年にアイスランドで診断されたすべての癌症例の家族性についての全国的研究において、前立腺癌の増加したリスクが前立腺癌事例の1から5親等血縁者で観察された(Amundadottir et.al., PLoS Medicine 1(3):e65 (2004)) 。血縁者間の増加したリスクにより強調されたこの疾患についての遺伝的素地はさらに、特定の集団間の前立腺癌の研究により支持された:例えば、アフリカンアメリカ人は中でも、最も高い前立腺癌の発生率及びこの疾患に帰する死亡率を有する:ヨーロッパ系アメリカ人よりも1.6倍、前立腺癌を発生するようであり、及び2,4倍この疾患により死亡するようである(Ries, L.A.G. et al., NIH Pub. No. 99-4649 (1999)) 。
前立腺癌の男性では、余命において平均40%の減少がある。もし早期に検出されたら(転移及び被膜を超えた局所拡散に先立って)、前立腺癌を治癒させ得る(例えば、外科手術を使用して)。しかしながら、もし前立腺からの拡散及び転移後に診察されたら、前立腺癌は、典型的には、低い治癒率の致死的疾患である。前立腺特異的抗原(PSA)に基づいたスクリーニングが前立腺癌の早期診断を助けてきたが、それは高感度でもまた特異的でもない (Punglia et.al., N Engl J Med. 349(4):335-42 (2003)) 。このことは、高いパーセンテージの偽陰性及び偽陽性診断が試験に関連することを意味している。結果は、見逃された癌の多くの例及び癌を有しない例の不必要な引き続いてのバイオプシーの両方である。65〜85%(年齢の依存して)もの前立腺癌の個体が、正常PSAレベルの上限として慣用的に使用されてきた4.0ng/mLに等しいか又はそれ未満のPSA値を有する(Punglia et.al., N Engl J Med. 349(4):335-42 (2003); Cookston, M.S., Cancer Control 8(2): 133-40 (2001); Thompson, LM. et.al., N Engl J Med. 350:2239-46 (2004)) 。低PSAレベルを有する癌のかなりの部分が、進行性(aggressive)前立腺癌の尺度であるグリーソングレードで7又はそれ以上とスコア付けされる。上記文献。
上に概説した感度の問題に加え、PSA試験は特異性及び予後を予期することについての困難さも有している。PSAレベルは前立腺癌を有しないものにおいても異常である可能性がある。例えば、良性前立腺肥大(BPH)は、偽陽性PSA試験のよくある原因の一つである。加えて、尿貯留、前立腺炎、激しい前立腺マッサージ及び射精を含む多様な非癌状態は血清PSAレベルを上昇させることができる。上記文献。
それ故、早期段階前立腺癌検出及び予後を容易にするであろう改良された診断法、ならびに該疾患の予防的及び治癒的治療における補助に対する大きな要求が明白に存在する。加えて、前立腺癌の進行性形態を有する可能性がある患者を、前立腺内に局在して残り及び罹患率又は死亡率には有意に寄与しない、前立腺癌のより良性な形態を有する可能性が高い患者からより良好に識別するためのツールを開発することが要求されている。このことは、有意なリスクのない患者についての、侵襲的及び費用がかかる処置を避けることを助けるであろう。
前立腺癌の多様な形態に関連する座位
前立腺癌の発生は最近の10年で劇的に増加した。前立腺癌は、その病因論に遺伝的及び環境的要素が含まれる多因子性の疾患である。それはゆっくりと増殖する腫瘍から非常に急速で高度な転位性病変に及ぶ異質な増殖パターンにより特徴付けられる。
遺伝因子は、前立腺癌の疫学的リスク因子のうちで最も強いけれども、該疾患に関与する遺伝決定因子の探求は挑戦的であった。研究は前立腺癌に対する関連候補遺伝子マーカーが、乳癌、卵巣癌及び結腸癌のような他の癌についての感受性遺伝子を同定することよりもより困難であったことを明らかにした。この増加した困難さについて提案されたいくつかの理由には:前立腺癌がしばしば高齢で診察されるという事実は、二つ以上の世代の生存する患者個体からDNAサンプルを得ることを困難にしている:遺伝的及び散在的形態間の特色を区別することの欠如に不随する表現的模写の高リスク系統内の存在:及び前立腺癌の遺伝子不均一性及びこの複雑な疾患についての適切な統計学的伝達モデルを開発することの付随する困難さが含まれる(Simard, J. et al., Endocrinology 143 (6):2029-40 (2002))。
前立腺癌感受性遺伝子についての種々のゲノムスキャンが実施され、いくつかの前立腺癌感受性座位が報告されている。例えば、HPC1(1q24−q25)、PCAP(1q42−q43)、HCPX(Xq27−q28)、CAPB(1p36)、HPC20(20q13)、HPC2/ELAC2(17p11)及び16q23が前立腺癌感受性座位として提案されている(Simard, J. et al., Endocrinology 143 (6):2029-40 (2002); Nwosu, V. et al., Hum. Mol. Genet. 10(20):2313-18 (2001)) 。Smith et al., により行われたゲノムスキャンにおいて、連鎖の最も強い証拠はHPC1であったが、二点解析はD4S430での≧1.5のLODスコア及びXq27−28のマーカーを含むいくつかの座位での≧1.0のLODスコアも明らかにした(Ostrander E. A. and J.L. Stanford, Am. J. Hum. Genet. 67:1361-15 (2000)) 。別のゲノムスキャンは、遺伝の常染色体優性モデルを使用して染色体10q、12q及び14q、及び遺伝の劣性モデルを使用して染色体Iq、8q、10q及び16pについて>1.5の二点LODスコアを報告している。上記文献。さらに別のゲノムスキャンは、2q、12p、15q、16q及び16pの連鎖についての名目上の証拠を有する領域を同定した。上記文献。小さなユタハイリスク前立腺癌系統の組及び300多型性マーカーの組を使用した前立腺癌素因遺伝子座のゲノムスキャンは、染色体17p上の座位の連鎖についての証拠を提供した (Simard. J. et al., Endocrinology 143 (6):2029-40 (2002)) 。八つの新規連鎖分析が2003年の後半に公表され、それは著しい異種性を示した。2.0より高いLODスコアを有する11のピークが報告され、そのどれもが重複していなかった(Actane consortium, Schleutker et.al, Wiklund et.al., Witte et.al, Janer et.al., Xu et.al., Lange et.al., Cunningham et.al.; all of which appear in Prostate、 vol. 57(2003)を参照されたい) 。
上記のように、前立腺癌に関与する特定の遺伝子の同定は、挑戦的であった。関係付けられている一つの遺伝子は、ウイルス及び細胞RNAを分解すると信じられているインターフェロン誘導可能RNA崩壊経路に関与する、広範囲に発現されている不顕性エンドリボヌクレアーゼをコードし、HPC座位に連鎖しているRNASELである (Carpten, J. et al., Nat. Genet. 30:181-84 (2002); Casey, G. et al., Nat. Genet. 32(4):5Sl-S3 (2002))。RNASEL中の変異は、前立腺癌に対する増加した感受性と関係があった。例えば、一つの家族において、前立腺癌を有する4人の兄弟はRNASEL中にディスエイブリング変異を運んでおり、一方別の家族において、前立腺癌を有する6人の兄弟の内の4人が、RNASELの開始メチオニンコドンに影響する塩基置換を運んでいた。上記文献。他の研究は、家族性前立腺癌を有するフィンランド人男性及びアシュケナージ系ユダヤ人集団において、前立腺癌の増加したリスクに関連する変異体RNASELアレルを明らかにした (Rokman, A. et al., Am J. Hum. Genet. 70:1299-1304 (2002); Rennert, H. et al., Am J. Hum. Genet. 77:981-84 (2002)) 。加えて、Ser217Leu遺伝子型が、65歳よりも若い白色人種のアメリカ人におけるすべての孤発例のおよそ9%を占めると提案されている (Stanford, J.L., Cancer Epidemiol. Biomakers Prev. 12(9):876-81 (2003)) 。これらの陽性報告とは対照的に、いくつかの研究は、RNASELアレルと不活性化変異及び前立腺癌との間の何らかの関係を検出することに失敗している(Wang, L. et al., Am. J. Hum. Genet 71:116-23 (2002); Wiklund, F. et al., Clin. Cancer Res. 10(21):7150-56 (2004); Maier, C. et al., Br. J. Cancer 92(6):1159-64(2005)) 。
8p22に位置するマクロファージ捕捉剤レセプター1(MSRl)遺伝子も、候補前立腺癌感受性遺伝子として同定されている (Xu, J. et al., Nat. Genet. 32:321-25 (2002)) 。変異MSRlアレルは、非遺伝的な前立腺癌を有する男性のおよそ3%で検出されたが、罹患していない男性では0.4%しか検出されなかった。上記文献。しかしながら、すべての続いての報告がこれらの最初の発見を確認しているわけではない(例えば、Lindmark, F. et al., Prostate 59(2):132-40 (2004); Seppala, E.H. et al., Clin. Cancer Res. 9(14):5252-56 (2003); Wang, L. et al., Nat Genet. 35(2): 128-29 (2003); Miller、 D.C. et al., Cancer Res. 63(13):34S6-S9 (2003) を参照されたい) 。MSR1は、血清中の細菌性リポ多糖及びリポテイコ酸、及び酸化高比重リポタンパク及び低比重リポタンパクを含む多様なリガンドとの結合が可能であるマクロファージ捕捉剤レセプターのサブユニットをコードする (Nelson, W.G. et. al., N. Engl. J. Med. 349(4):366-8l (2003)) 。
Chrl7上のELAC2遺伝子は、ユタからのハイリスク前立腺癌家族においてクローン化されるべき最初の前立腺癌感受性遺伝子であった(Tavtigian, S. V., et al., Nat. Genet. 27(2): 172-80 (2001)) 。一つの系統においてフレームシフト変異(1641InsG)が発見された。3つの追加のミスセンス変化:Ser217Leu;Ala541Thr;及びArg781Hisが前立腺癌の増加したリスクと関係することも見いだされた。Ser217Leu及びAla541Thr両方を運んでいる男性における前立腺癌の相対的リスクは、前立腺癌の家族歴に基づいて選択されていないコホートにおいて2.37であることが見いだされた(Rebbeck, T.R., et al., Am. J. Hum. Genet. 67(4):1014-19 (2000)) 。別の研究は、一つの高発生前立腺癌家族において新規終結変異(Glu216X)を記載している(Wang, L., et al., Cancer Res. 61(17):6494-99 (2001)) 。他の報告は、これらのミスセンス変異との強い関連を示しておらず、及び最近のメタアナリシスは、これらの変異に関連する家族リスクが最初の報告に示されたよりもより控えめであることを示唆している(Vesprini, D., et al, Am. J. Hum. Genet. 68(4):912-11 (2001); Shea, P.R., et al., Hum. Genet. 111 (4-5):398-400 (2002); Suarez, B.K., et. al., Cancer Res. 61(13):4982-84 (2001); Severi, G., et al., J. Natl. Cancer Inst. 95 (11):818-24 (2003); Fujiwara, H., et al., J. Hum. Genet. 47(12):641-48(2002); Camp, NJ., et al., Am. J. Hum. Genet. 71 (6):1475-78 (2002)) 。
アンドロゲン作用に関与する遺伝子の多型性変異体(例えば、アンドロゲンレセプター(AR)遺伝子、チトクロームP−450c17(CYP17)遺伝子及びステロイド−5−α−レダクターゼ、タイプII(SRD5A2)遺伝子)も前立腺癌の増加したリスクに関係付けられてきた(Nelson, W.G. et. al., N. Engl. J. Med. 349(4):366-81 (2003)) 。 アンドロゲンレセプターをコードするARに関しては、いくつかの遺伝的疫学的研究が、前立腺癌の増加したリスクとアンドロゲンレセプターポリグルタミンリピートの存在間の相関を示しているが、一方、他の研究はこうした相関を検出することに失敗している。上記文献。連鎖データもCYP17の対立形質形(性ステロイド生合成において鍵となる反応を触媒する酵素)と前立腺癌を結びつけた(Chang, B. et al., Int. J. Cancer 95:354-59 (2001)) 。前立腺において5−−レダクターゼの主アイソザイムをコードし、テストステロンをより強力なジヒドロテストステロンに変換するように機能する、SRD5A2のアレル異型は、前立腺癌の増加したリスク及び前立腺癌を有する男性の予後不良と関係付けられてきた(Makridakis, N.M. et al., Lancet 354:975-78 (1999); Nam, R.K. et al., Urology 57:199-204 (2001)) 。
要するに、全世界の多くのグループの努力にもかかわらず、前立腺癌リスクの実質的一部分を説明する遺伝子は同定されていない。双生児の研究は、遺伝的因子が前立腺癌で優性であるらしいことを暗示したが、ほんの一握りの遺伝子しか前立腺癌の増加したリスクと関係していると同定されておらず、及びこれらの遺伝子は低いパーセンテージの場合しか説明していない。それ故、前立腺癌についての遺伝的リスク因子の大部分が見つかっていないことは明白である。これらの遺伝的リスク因子は比較的多くの数の低から中リスク遺伝子異型を含んでいるであろうと思われる。しかしながら、これらの低から中リスク遺伝子異型は前立腺癌の実質的一部分に関与することができ、それ故、それらの同定は公衆衛生にとって大きな利益である。さらに、公表された前立腺癌遺伝子はどれも、進行が遅い前立腺癌よりも進行性前立腺癌についてのより大きなリスクを予測するとは報告されていない。
癌患者を含む集団についての広範な系統学的情報が、最近の研究において強力な遺伝子近親度(gene sharing)法と結合され、癌(例えば、乳癌、前立腺癌、肺癌、黒色腫)において主要な役割を果たすことが示されている染色体8q24.21上の座位の地図を作製した。多様な癌患者及び彼らの親族を、3〜4cMの平均マーカー密度を有する1100のマイクロサテライトマーカーを含む、全ゲノムマーカーセットで遺伝子型を同定した。(Amundadottir L.T., Nature Genet. 38(6):652-658 (2006)) 。ユタCEPHハップマップ(HapMap)サンプル中の128.414及び128.506Mb(NCBI Build 34 34)位間の座位内の単一LDブロックとの関連が検出された。
乳癌は米国及び世界中の女性にとって、重大な健康問題である。該疾患の検出及び治療において進歩はあったが、乳癌は女性における癌関連死因の第2位で残っており、米国において180,000人以上の女性が罹患している。北アメリカの女性について、生涯で乳癌にかかる可能性は現在8人に1人である。
乳癌の治療又は予防について普遍的に成功している方法は、現在のところ得られていない。乳癌の管理は現在、早期診断(例えば、胸部スクリーニング法を介する)及び、外科手術、放射線療法、化学療法及びホルモン療法のような種々の治療の一つ又はそれより多くを含むことができる攻撃的治療の組み合わせである。特定の乳癌のための治療過程は、特異的腫瘍マーカーの分析を含む種々の予後パラメーターに基づいてしばしば選択される。例えば、Porter-Jordan and Lippman. Breast cancer 5:73-100 (1994) を参照されたい。
BRCAl及びBRCA2の発見は、乳癌に関与する鍵となる遺伝子因子の同定における重要な段階であったが、BRCA1及びBRCA2中の変異は乳癌への遺伝的感受性のほんの一部しか説明しないことが明らかになってきている(Nathanson. K.L. et al. Human Mol. Gen. 10(7):715- 720 (2001); Anglican Breast cancer Study Group. Br. J. Cancer 53(10):1301-08 (2000); 及びSyrjakoski K. et.al., J. Natl. Cancer Inst. 92: 1529-31 (2000)) 。乳癌に対する療法へのかなりの研究にもかかわらず、乳癌は診断及び有効に治療するのが困難なまま残されており、乳癌患者で観察される高い死亡率は、該疾患の診断、治療及び予防における改善を必要としている。
1955〜2003年にアイスランドで診断されたすべての癌の家族性の全国的な研究では、乳癌例の1〜5等親血縁者において、deCODEが乳癌の増加したリスクを示し(Amundadottir et.al., PLoS Med. 1(3):e65 (2004); Lichtenstein P. et.al., N. Engl. J. Med. 343(2):78-85 (2000)) 、乳癌が45,000に近い双生児のコホートで試験されたすべての癌の中でも最も高い遺伝可能性を有することを著者は示している。
女性においてすべての乳癌の5〜10%のみが、BRCAl、BRCA2、p53、pTEN及びSTK11/LKB1のような常染色体優性遺伝子中の変異による遺伝的感受性に関連する(Mincey, B. A. Oncologist 8:466-73 (2003)) 。染色体8p上の遺伝子座位が、散在性乳癌中のこの領域でのアレル喪失を記録する研究に基づいて、乳癌感受性遺伝子の座位であると提案された(Seitz, S. et al.,Br. J. Cancer 76:983-91 (1997); Kerangueven, F. et al., Oncogene 10:1023 (1995)) 。研究は、乳癌感受性遺伝子は13q21上に位置しているであろうことも示唆した(Kainu, T. et al., Proc. Natl. Acad. Sci. USA 97:9603-08 (2000)) 。 しかしながら、前立腺癌の場合のように、追加の乳癌−感受性遺伝子の同定は困難であった。
肺癌は、世界中でいずれか他の型の癌よりもより多くの死を引き起こす(Goodman, G.E., Thorax 57:994-999 (2002)) 。米国において、肺癌は、男性及び女性の両方で、癌死因の第1位である。2002年に、肺癌からの死亡率は134,900人と見積もられ、乳、前立腺及び結腸を合わせた総計を超えている。肺癌は、欧州の国々でも癌死因の1位であり、途上国において急速に増加している。生活スタイル因子(例えば、喫煙)及び食事要因のような環境因子が肺癌において重要な役割を果たしているが、遺伝的因子も該疾患に寄与している。例えば、発癌物質活性化の原因となる酵素のファミリー、分解及び続いてのDNA修復が肺癌への感受性に関係付けられている。研究により、p53及びRB/pl6の両方の経路における欠損が肺上皮細胞の悪性の形質転換に必須であることを明らかにした (Yokota, J. and T. Kohno, cancer Sci 95(3):197-204 (2004)) 。K−ras、PTEN及びMYO18Bのような他の遺伝子は、肺癌細胞においてp53及びRB/pl6ほど頻繁には一般には改変されておらず、これらの遺伝子はさらなる悪性進行又は肺癌細胞の下位集団における独特の表現型に関係していることを示唆している。p53変異及びRB/pl6欠失の部位で実施された分子フットプリント(footprint)研究は、DNA修復活性及びDNA二本鎖中断の非相同的末端結合化が、肺癌細胞における遺伝子変化の蓄積に重要であることを実証した。加えて、研究は、肺腺癌感受性遺伝子候補、例えば、NQO1(NAD(P)H:キノンオキシドレダクターゼ)及びGSTT1(グルタチオンSトランスフェラーゼT1)のような薬剤発癌物質代謝遺伝子、及びXRCCl(X線交叉相補的グループ1)のようなDNA修復遺伝子を同定した(Yanagitani, N. et al., Cancer Epidemiol. Biomakers Prev. 12:366-71 (2003); Lin, P. et al., J. Toxicol. Environ. Health A. 58:187-97(1999); Divine, K.K. et al., Mutat. Res. 461:273-78 (2001); Sunaga, N. et al., Cancer Epidemiol. Biomakers Prev. 11:730-38 (2002)) 。座位D19S246を包含する染色体19ql3.3の領域も、肺腺癌に関連する遺伝子(単数又は複数)を含有すると示唆された(Yanagitani, N. et al., Cancer Epidemiol. Biomarkers Prev. 12: 366-71 (2003)) 。48年を超えてアイスランドで診断されたすべての肺癌例を解析することにより、核家族の外側の家族メンバーへの増加したリスクがdeCODE遺伝学者により示された。この増加したリスクは喫煙では完全に説明することができず、遺伝子変異体が特定の個体を肺癌にかかりやすくしてもよいことを示している(Jonson et.al,, JAMA 292(24):2977-83 (2004); Amundadottir et.al., PLoS Med. 1(3):e65 (2004)) 。
診断時での疾患の段階に関わらず、すべての肺癌患者の5年生存率はただの13%である。このことは、疾患が未だ局在化している間に検出されたケースの46%の5年生存率と対照的である。しかしながら、16%のみの肺癌しか、疾患が広がる前に発見されていない。疾患が進行した段階に達するまではほとんど臨床的徴候が観察されないので、早期検出は困難である。現在、診断は胸X線、痰に含まれている細胞型の分析及び気管支通路の光ファイバー試験の使用により補助されている。治療計画は癌のタイプ及び段階により決定され、外科手術、放射線療法及び/又は化学療法が含まれる。この及び他の癌に対する療法へのかなりの研究にもかかわらず、肺癌は診断及び有効に治療するのが困難なまま残されている。従って、こうした癌を検出する及び治療するための改善された方法に対する大きな要求が存在する。
悪性黒色腫の発生は、北アメリカにおいてヒト癌のいずれの他の型よりも急速に増加している(Armstrong et al., Cancer Surv. 19- 20:219-240 (1994)) 。黒色腫は早期段階で同定された場合には治癒可能であるが、それが遠位の部位へ広がる前の検出及び原発性腫瘍の除去を必要とする。悪性黒色腫は転移する大きな性向を有し、化学療法及び−照射のような慣用的癌治療に抵抗することで有名である。一度転移が生じたら、予後は非常に悪い。それ故、黒色腫の早期検出は、黒色腫治療及び制御において極めて重要である。
研究は、正常色素細胞から異型母斑へ、それから侵襲的原発性黒色腫及び最後に進行性転移能を有する細胞への段階的進行に、遺伝的因子が重要な役割を果たしていることを実証した(Kim, C. J., et al., Cancer Control 9(1):49-53 (2002)) 。例えば、腫瘍抑制遺伝子を内部に有する染色体1上の再編成のような遺伝子異常が、悪性黒色腫で関係付けられている。上記文献。しかしながら、どのように成人皮膚の正常メラニン細胞が黒色腫細胞に形質転換するのかについての分子及び生物学的機構は明らかでないままである。
多様な研究が、黒色腫における遺伝的因子を意味づけてきた。例えば、早期発症黒色腫についての上昇した家族性リスクがユタ(Utah)集団データベースの検討により注目された(Cannon-Albright, L.A., et al., Cancer Res., 54(9):2378-85 (1994)) 。加えて、Swedish Family-Cancer Databaseは、罹患した親又は同胞を有する個体における皮膚悪性黒色腫(CMM)について、各々2.54及び2.98の家族性標準化罹患比(SIR)を報告した。多発性原発性黒色腫を有していた両親の子孫では、SIRは61.78に上昇した(Hemminki, K., et al., J. Invest. Dermatol. 120(2):217-23 (2003)) 。Amundadottir et al. (PLoS Med. 1(3):e65 (2004)) によるアイスランド人集団に基づいた研究において、匹敵するSIR値が観察された。形は変化しているが、CMMケースの約10%は家族性であることが報告されている(Hansen, C. B., et al., Lancet Oncol. 5(5):314-19 (2004)) 。黒色腫についての既知の環境リスク要因から判断すると、遺伝子に加えて共有環境がこれらの見積もりに組み入れられるようである。しかしながら、家族性のケースは多発性原発性腫瘍の低年齢での発症及び高いリスクを有する傾向があり、遺伝的要素を示唆している(例えば、Tucker M., Oncogene 22f20;:3042-52 (2003) を参照されたい)。しかしながら、どのようにして正常メラニン細胞が黒色腫細胞に形質転換するかについての分子的及び生物学的機構は明らかにされていない。
一連の連鎖に基づいた研究は、Chr9p21上のCDKN2aを主CMM感受性遺伝子として関連づけた(Bataille, V., Eur. J. Cancer 39(10): 1341-47(2003)) 。CDK4はそれらのすぐ後ろの経路候補として同定されているが、CDK4中の変異は世界中で数家族でのみしか観察されていない(Zuo, L., et al., Nat. Genet. 12(1):97-99 (1996)) 。CDKN2aはCDK4及びCDK6を阻害するサイクリン依存性キナーゼインヒビターp16をコードし、それによりG1からSへの細胞周期通過を防止する。CKDN2aの別の転写体は、MDM2−p53経路を介して作用する細胞周期阻害剤をコードするp14ARFを産生する。CDKN2a突然変異体メラニン細胞は、発生状態で又はDNA損傷に応答して、細胞周期制御又は老化の確立が欠損しているようである(Ohtani, N., et al., J. Med. Invest. 51(3-4):146-53 (2004)) 。家族性CMMケースにおけるCDKN2a突然変異体の全表現率は80歳で67%である。しかしながら、表現率は高黒色腫有病率の領域で増加している(Bishop, D.T.,et al., J. Natl. Cancer Inst. 94(12):894-903 (2002)) 。
Melanoma Genetics Consortium は、主としてオーストラリア人の、9p21又はCDK4非連鎖高リスク家族の組を使用して、CMMについての全ゲノムスキャンを完成した(Gillanders, E., et al., Am. J. Hum. Genet. 73(2):301-13 (2003)) 。10cM分解能スキャンは、1p22領域において2.06のノンパラメトリック多点LODスコアを与えた。染色体4、7、14、及び18上の他の位置は1.0を上回るLODを与えた。1p22に対する追加のマーカー及び発症年齢制限の適用により、5.0を上回るノンパラメトリックLODが観察された。証拠は腫瘍抑制遺伝子の高表現率変異がこの位置に存在することを示唆しているが、LOHのパターンは複雑である(Walker, G. J., et al., Genes Chromosomes Cancer, 41(1):56-64 (2004)) 。
CMMで関係付けられた別の遺伝子座は、メラノコルチン1レセプター(MC1R)をコードするものである。MC1Rはフェオメラニンからのユーメラニン合成のスイッチの促進に関与するGタンパク質結合レセプターである。MC1R遺伝子の多数のよく特徴付けられた変異体が、赤毛、青白肌、そばかすがちな表現型と関係付けられている。赤毛の個体の半分以上が、少なくとも一つのこれらのMC1R変異体を運んでいる(Valverde, P., et al., Nat. Genet. ll(3):328-30 (1995); Palmer, J.S., et al., Am. J. Hum. Genet. 66(1): 176-86 (2000)) 。その後、同一の変異体が、単一変異体について約2.0の、及び形成されたヘテロ接合体について約4.0のオッズ比でCMMに対するリスクを与えることが示された。最近の研究は、より強いMC1Rの変異体はCDKN2a突然変異の表現率を増加し、発症の年齢を低下させることを示した(Box, N.F., et al., Am. J. Hum. Genet. 69(4): 165-13 (2001); van der Velden, P. A., et al., Am. J. Hum. Genet, 69(4):774-79 (2001)) 。
多数の他の候補遺伝子がCMMにおいて関係付けられている。例えば、癌ゲノミクスにおける画期的な研究は、60%の黒色腫においてBRAF(v−rafマウス肉腫ウイルス腫瘍遺伝子のヒトBl相同体)中の体細胞突然変異を同定した(Davies, H., et al., Nature 417(6892):949-54 (2002)) 。変異は同胞でも共通であり(定型及び非定型の両方)、突然変異は早期の事象であることを示唆している。上記文献。生殖系列変異は報告されていないが、しかしながら、BRAFの生殖系列SNP変異体がCMMリスクと関係付けられている(Meyer, P., et al., J. Carcinog. 2(1):7(2003)) 。関連性研究を介して同定され、及びCMMリスクと関係付けられている他の候補遺伝子には、例えば、XRCC3、XPD、EGF、VDR、NBS1、CYP2D6及びGSTM1が含まれる(Hayward. N.K., Oncogene. 22(20):3053-62 (2003)) 。しかしながら、こうした関連性研究は、しばしば小さなサンプルサイズ、単一SNPsへの信頼性及び集団層別化可能性に悩まされる。
明らかに、特定の形態の癌(例えば、前立腺癌、乳癌、肺癌、黒色腫、結腸癌、精巣癌)への感受性の原因となるマーカー及び遺伝子の同定は、現在の腫瘍学が直面している一つの主要な挑戦である。癌の原因となっている経路のいくつかは、癌の異なった形態で共有されている。その結果、癌の一つの特定の形態について同定された遺伝的リスク因子は、他の癌タイプについてのリスク因子も示すことができる。これらのリスク因子を利用する診断及び治療法は、それ故共通の有用性も有することができる。従って、こうしたリスク因子を標的とするように開発された療法的尺度は、リスク因子が本来同定された癌のみでなく、一般に癌に意味を有することができる。癌の早期検出及び治療についてのより積極的スクリーニング及び治療介入計画が開始できるように、癌への遺伝的感受性を有する個体の早期検出のための手段を同定する必要がある。癌遺伝子は、操作することができる(例えば、小又は大分子量薬剤を使用して)鍵となる分子経路も明らかにし、及び特定の癌が最初に診断された時の癌段階に関わらず、より有効な治療に導くことができる。
発明の詳細な説明
定義
以下の用語は、本文脈において、示された意味を有する:
本明細書に記載した「多型マーカー」(「マーカー」と呼ばれることもある)とは、ゲノム多型部位を指す。各多型マーカーは、多型部位の特定のアレルに特徴的な少なくとも二つの配列変異を有する。それ故、多型マーカーへの遺伝的関連は、その特定の多型マーカーの少なくとも一つの特異的アレルとの関連があることを暗示する。該マーカーは、一塩基変異多型(SNPs)、マイクロサテライト、挿入、欠失、重複及び転座を含む、ゲノムで観察されるいずれかの変異体タイプのいずれかのアレルを含み得る。
「アレル」とは、染色体上の所与の座位(位置)のヌクレオチド配列を指す。多型マーカーアレルはそれ故、染色体上の該マーカーの組成(即ち、配列)を指す。個体からのゲノムDNAは、各染色体上の該マーカーの各コピーを代表する、いずれかの所与の多型マーカーについての二つのアレルを含有する。
集団(天然の集団か又は合成的集団、例えば、合成分子のライブラリー)中で一つより多くの配列が可能であるヌクレオチド位置が、本明細書中で「多型部位」と称される。
「単一ヌクレオチド多型」又は「SNP」は、種のメンバー間で又は個体中の対となった染色体間で、ゲノム中の特異的位置で単一ヌクレオチドが異なっている場合に生じるDNA配列変異である。ほとんどのSNP多型は二つのアレルを有する。各個体は、この場合、多型の一つのアレルについてホモ接合性であるか(即ち、個体の両方の染色体コピーはSNP位置で同一のヌクレオチドを有する)、又は該個体はヘテロ接合性である(即ち、該個体の二つの姉妹染色体は異ったヌクレオチドを含有する)。本明細書で報告されているSNP命名はNational Center for Biotechnology Information (NCBI)により、それぞれ独特のSNPと指定された公式Reference SNP(rs) ID 同定を指す。
本明細書に記載した「変異体」とは、参照DNAとは異なっているDNAのセグメントを指す。本明細書に記載した「マーカー」又は「多型マーカー」は変異体である。参照と異なっているアレルは「変異体」アレルと称される。
本明細書に記載したヌクレオチド又はタンパク質の「断片」は、ヌクレオチド又はタンパク質の全て又は一部を含んでなる。
本明細書に記載した「動物」とは、いずれの家庭動物(例えば、ネコ、イヌなど)、 農業動物(例えば、ウシ、ウマ、ヒツジ、ニワトリなど)又は試験種(例えば、ウサギ、マウス、ラットなど)を指し、そしてヒトも含む。
本明細書に記載した「マイクロサテライト」は、特定の部位に、2〜8ヌクレオチド長である多数の小さな塩基のリピートを有する(CAリピートのような)多型マーカーであり、母集団中でリピート長の数は変化する。
本明細書に記載した「インデル」は、典型的には数ヌクレオチド長である小さな挿入又は欠失を含んでなる多型の一般形態である。
本明細書に記載した「ハプロタイプ」とは、セグメントに沿って配置されたアレルの特異的組み合わせにより特徴付けされる、DNAの一つの鎖内のゲノムDNAのセグメントを指す。ヒトのような二倍体生物については、ハプロタイプは各多型マーカー又は座位について一対のアレルの一つのメンバーを含んでなる。特定の態様において、該ハプロタイプは二つ又はそれ以上のアレル、三つ又はそれ以上のアレル、四つ又はそれ以上のアレル、又は五つ又はれ以上のアレルを含み得る。
本明細書に記載した用語「感受性」とは、増加した感受性及び減少した感受性の両方を包含する。それ故、本発明の特定の多型マーカー及び/又はハプロタイプは、1より大きな相対リスク(RR)により特徴付けられるような、緑内障の増加した感受性(即ち、増加したリスク)により特徴付けることができる。もしくは、本発明の多型マーカー及び/又はハプロタイプは、1未満の相対リスクにより特徴付けられるような、緑内障の減少した感受性(即ち、減少したリスク)を特徴とする。
本明細書に記載した「核酸サンプル」は、核酸(DNA又はRNA)を含有する、個体から得られたサンプルである。特定の態様において、特異的多型マーカー及び/又はハプロタイプの検出において、該核酸サンプルはゲノムDNAを含んでなる。こうした核酸サンプルは、血液サンプル、羊水のサンプル、脳脊髄液のサンプル、又は皮膚、筋肉、頬側又は結膜粘膜(頬側スワブ)、胎盤、消化管又は他の器官からの組織サンプルを含む、ゲノムDNAを含有する任意の起源のものであることが可能である。
本明細書で使用される「Chr8q24.21」及び「8q24.21」とは、UCSC Build 34中のおおよそ127,200,001〜131,400,000bp位に相当する染色体バンド8q24.21を指す(www.genome.ucsc.edu のUCSC Genome browser Build 34から)。
本明細書で使用される「LDブロックC」とは、癌、即ち、前立腺癌、乳癌、肺癌及び黒色腫と変異体との関連が観察されたChr8q24.21上のLDブロックを指す。このLDブロックのNCBI Build 34位は128、032、278〜128、094、256bp(配列番号1)である。
本明細書で使用される「LDブロックC」とは、癌に関連した変異体の関連が好ましくは検出することができる、Chr8q24.21上のLDブロックを指す。このLDブロックのNCBI Build 34位は128、029、113〜128、126、447であり、その配列は配列番号2に示されている。
NCBI Build 35及び36において、該領域の位置は128、141、706〜128、239、040位である。Build 34、35及び36中のLDブロックC領域の配列は、97,335bpの全スパンにわたって同一である。
本明細書に記載した用語「アフリカ系先祖」とは、自己申告された個体のアフリカ系祖先を指す。
用語「癌療法剤」とは、癌(即ち、前立腺癌、肺癌、乳癌及び/又は黒色腫)と関連する症状を寛解又は予防するために使用し得る剤を指す。
用語「配列番号2と関連する」、「配列番号1と関連する」、「LDブロックCと関連する」及び「LDブロックC’と関連する」とは、配列番号2、配列番号1、LDブロックC及びLDブロックC’により表されるゲノムセグメントと連鎖不平衡(LD)にあるDNAセグメント(例えば、多型マーカー)を指す。特定の態様において、こうしたDNAセグメントは、0.8より大きな|D’|及び/又は0.2より大きなr2についての値で測定されるように、配列番号2、配列番号1、LDブロックC又はLDブロックC’内の一つ又はそれ以上のマーカーとLDにある。
Chr8q24.21との関連
上に議論したように、染色体8q24.21への連鎖及び連鎖領域領域内の連鎖不平衡(LD)ブロックとの関連が最近報告された。本明細書に記載したように、染色体8q24.21領域中の、広範囲LDの別のDNAセグメント(即ち、別のLDブロック)内に属する変異体(マーカー及び/又はハプロタイプ)も癌に関連することが、驚くべきことにここに発見された。検出された関連は、該領域中で以前に検出された関連とは独立しており、本発明者には驚くべき結果であった。本発明の一つの態様において、該関連は、マーカーrs1456314アレルG、rs17831626アレルT、rs7825414アレルG、rs6993569アレルG、rs6994316アレルA、rs6470494アレルT、rs1016342アレルC、rs1031588アレルG、rs1016343アレルT、rs1551510アレルG、rs1456306アレルC、rs1378897アレルG、rs1456305アレルT及びrs7816535アレルGを含んでなるハプロタイプHapCにより検出された。ヒト形質と関連する他の変異体のように、多数の代替変異体(マーカー及び/又はハプロタイプ)を記述し得る。HapCについての一つのこうした代替マーカーはrs16901979マーカーである。代替変異体を最も含む可能性が高い領域は、本明細書でさらに記述されるような、広範囲に及ぶ連鎖不平衡の領域と通常画定される(いわゆる連鎖不平衡ブロック(LDブロック)と称される)。一つの態様において、癌に関連する変異体を包含するLDブロックは、配列番号1に示した配列により特徴付けられるLDブロックCである。本発明者により元々検出されたシグナルのさらなる改善は、染色体8q24.21上の、二つの組換えホットポイント間の領域としてLDブロックC’を明らかにした。該ホットポイントは染色体8上のおよそ128,029,113位及び128,126,447位に位置しており、それ故、該領域は配列番号2に示されたように定義される。HapCの代替マーカー及び/又はハプロタイプ、rs16901979は明確にされているように両方のLDブロック(即ち、配列番号1及び配列番号2)に見いだすことができ、本明細書中で詳細にさらに記述される。
発明の多様な態様において、本明細書に記載した方法を使用して同定されたある種のマーカー及び/又はSNPは、癌(例えば、前立腺癌)への増加した感受性の診断のため、及び癌(例えば、前立腺癌)への減少した感受性の診断のため、即ち、癌(例えば、前立腺癌)に対して保護的である変異体の同定、にも使用し得る。以下に示される診断アッセイは、これらの特定の変異体の存在又は不存在を同定するために使用し得る。
グリーソンスコアは前立腺癌の最も頻繁に使用される類別システムである(DeMarzo, A.M. et al., Lancet 361:955-64 (2003)) 。本システムは、前立腺癌の予後が癌の最も優勢なパターン及び第二に優勢なパターン間の中間であるという発見に基づいている。これらの優勢な及び第二に最も優勢なパターンは前立腺腫瘍からの組織学的サンプル中で同定され、各々が1(最も分化された)から5(より少なく分化された)に類別され、そして二つのスコアが加えられる。グリーソン合計又はスコアとしても知られている、合計されたグリーソングレードはそれ故、2(パターン1の均一な腫瘍に対して)から10(未分化腫瘍に対して)の範囲である。多様なパターンのほとんどの場合、特に針バイオプシーにおいて、1パターンを超えて異なっていない。
グリーソンスコアは予後指標であり、主たる予後的シフトは6及び7の間であり、グリーソンスコア7腫瘍は、5又は6にスコア付けされた腫瘍よりもより悪く振る舞い、より多い罹患率及びより高い死亡率を導く。スコア7腫瘍は、さらに3+4又は4+3に副分類され(最初の数字はバイオプシーされたサンプル中の優性組織学的サブタイプであり、及び第二の数字は次ぎに優勢な組織学的サブタイプである)、4+3スコアはより悪い予後に関連している。患者のグリーソンスコアは治療見解にも影響しうる。例えば、針バイオプシーでグリーソンスコア5〜6及び低PSA濃度の限られた量のより若い男性は、単純にモニターすることができるが、7又はより高いグリーソンスコアの男性は通常積極的な管理を受ける。表1において、ハプロタイプの頻度及び進行性前立腺癌(即ち、7(4+3のみ)〜10の合計グリーソンスコアにより示される)及びより遅い進行性前立腺癌(即ち、2〜7(3+4のみ)の合計グリーソンスコアにより示される)の相関リスクが示されている。しかしながら、該グリーソンスコアは完全な予後の予測ではない。それ故、低グリーソンスコアの腫瘍を有する患者は、それにもかかわらずより進行性前立腺癌(局所的に前立腺を超えて又は遠位転移を介して広がっている腫瘍として定義される)を有していてもよい。
本明細書に記載されたある方法において、癌(例えば、前立腺癌)の危険性がある個体は、アットリスクマーカー又はハプロタイプが同定された個体である。一つの態様において、マーカー又はハプロタイプの関連の強度は、相対リスク(RR)により測定される。RRは、該マーカー又はハプロタイプの一つのコピーを運ぶ対象間の状態の発生の、該マーカー又はハプロタイプのコピーを運んでいない対象間の状態の発生に対する比である。この比は該マーカー又はハプロタイプの二つのコピーを運ぶ対象間の状態の発生の、該マーカー又はハプロタイプのコピーの一つのコピーを運ぶ対象間の状態の発生に対する比に等しい。
一つの態様において、本発明は前立腺癌(進行性又は高グリーソングレード前立腺癌、より遅い進行性又は低グリーソングレード前立腺癌)への感受性を診断する方法であり、LDブロックCに関連するマーカー又はハプロタイプ(例えば、表5に示されたマーカー又はハプロタイプ、疾患への増加した感受性/疾患の増加したリスクに関連する及びそれ故「アットリスク」変異体であるマーカーを示している、1より大きな相対リスク(RR)の値を有している;1未満の値を有するマーカー又はハプロタイプは、該マーカーが疾患への減少した感受性/疾患の減少したリスクに関連し、それ故、「保護的」変異体である)検出することを含んでなり、該マーカー又はハプロタイプの存在は、前立腺癌への感受性を示す。
別の態様において、本発明は前立腺癌(例えば、進行性又は高グリーソングレード前立腺癌、より遅い進行性又は低グリーソングレード前立腺癌)への感受性を診断する方法であり、マーカーrs16901979を検出することを含んでなる。一つの態様において、該感受性は増加した感受性であり、マーカーrs16901979での1アレルの存在は、前立腺癌への増加した感受性を示す。さらなる態様において、本発明はその祖先がアフリカ系祖先を含んでなる個体において、前立腺癌への増加した感受性を診断する方法であり、マーカーrs16901979を検出することを含んでなり、マーカーrs16901979での1アレルの存在は、前立腺癌への増加した感受性又は前立腺癌への増加したリスクを示す。特定の態様において、前立腺癌への感受性と関連しているマーカー又はハプロタイプは、少なくとも1.5又は少なくとも1.7又は少なくとも2.0のような少なくとも1.3の相対リスクを有する。別の態様において、該前立腺癌は、7(4+3)〜10の合計グリーソンスコア及び/又は前立腺癌の進行した段階(例えば、段階2〜4)により定義される進行性前立腺癌である。さらに別の態様において、該前立腺癌は、2〜7(3+4)の合計グリーソンスコア及び/又は前立腺癌の初期段階(例えば、段階1)により定義されるより遅い進行性前立腺癌である。別の態様において、LDブロックCと関連するマーカー又はハプロタイプの存在は(4ng/mlより大きなPSAレベルを有する対象と共に)、より進行性の前立腺癌及び/又はより悪い予後を示す。さらに別の態様において、正常PSAレベル(例えば、4ng/ml未満)を有する患者において、該マーカー又はハプロタイプの存在は、より進行性の前立腺癌及び/又はより悪い予後を示す。
他の態様において、本発明は前立腺癌への減少した感受性を診断する方法であり、LDブロックCに関連するマーカー又はハプロタイプを検出することを含んでなり、そのマーカー又はハプロタイプの存在は、前立腺癌への減少した感受性又は前立腺癌に対して保護的なマーカー又はハプロタイプを示す。それ故、一つの態様において、該感受性は減少した感受性であり、マーカーrs16901979での2アレルの存在は前立腺癌への減少した感受性を示す。さらなる態様において、本発明はその祖先がアフリカ系祖先を含んでなる個体において、前立腺癌への減少した感受性を診断する方法であり、マーカーrs16901979を検出することを含んでなり、マーカーrs16901979での2アレルの存在は、前立腺癌への減少した感受性又は前立腺癌への減少したリスクを示す。
本発明の染色体8q24.21上のセグメントは、癌の他の型、例えば、乳癌、結腸癌、肺癌及び黒色腫においても役割を果たすことが観察されている。該領域内の特異的DNAセグメント中の特定のマーカー及び/又はハプロタイプが乳癌患者において予期されるよりも高い頻度で存在することが発見された。それ故、一つの態様において、本発明は乳癌、肺癌、結腸癌及び黒色腫より選択される癌への増加した感受性を診断する方法であり、その配列が配列番号1又は配列番号2に示されているゲノムセグメントに関連するマーカー又はハプロタイプを検出することを含んでなり、該マーカー又はハプロタイプの存在は、癌(例えば、乳癌、結腸癌、肺癌及び黒色腫)への増加した感受性を示す。特定の態様において、癌(即ち、乳癌、肺癌及び黒色腫)への感受性に関連したマーカー又はハプロタイプは、少なくとも1.5又は少なくとも1.7又は少なくとも2.0のような少なくとも1.3の相対リスクを有する。他の態様において、本発明は癌(即ち、乳癌、肺癌及び黒色腫)への減少した感受性に関し、その配列が配列番号1又は配列番号2に示されているゲノムセグメントに関連するマーカー又はハプロタイプを検出することを含んでなり、該マーカー又はハプロタイプの存在は、癌への減少した感受性、又は乳癌に対して保護的な(癌(即ち、乳癌、肺癌及び黒色腫)に対して保護的な)マーカーを示す。特定の態様において、癌(即ち、乳癌、肺癌及び黒色腫)への減少した感受性と関連するマーカー又はハプロタイプは、0.8未満、0.7未満、0.6未満及び0.5未満のような0.9未満のの相対リスクを有する。別の態様において、黒色腫は悪性皮膚黒色腫である。
マーカー及びハプロタイプについての評価
個体が比較された場合、集団内のゲノム配列は同一ではない。むしろ、ゲノム中の多くの位置で、個体間の配列可変性を示す。配列中のこうした変異は多型と称され、各ゲノム内に多くのこうした部位がある。例えば、ヒトゲノムは、平均500塩基対毎に生じる配列変異を示す。最も普通の配列変異体は、ゲノム中の単一塩基位置での塩基変異から成り、こうした配列変異体、又は多型は一般に単一ヌクレオチド多型(「SNPs」)と称される。これらのSNPsは、単一突然変異事象で生じると信じられており、それ故、各SNP部位で可能な二つの可能なアレルがある;本来のアレル及び突然変異したアレル。自然の遺伝的浮動及び場合により選択圧のため、本来の突然変異は、いずれか所与の集団中の、そのアレルの特定の頻度により特徴付けられる多型を生じる。マイクロサテライト、挿入、欠失、逆位及びコピー数変異体を含む、配列変異体の多くの他のタイプがヒトゲノム中で観察されている。多型マイクロサテライトは、特定の部位に塩基の多数の小さなリピート(CAリピート、相補鎖上のTGのような)を有し、そこではリピート長の数は母集団中で変化する。一般論として、多型部位に関する配列の各バージョンは、多型部位の特異的アレルを表している。これらの配列変異体は、問題とする配列変異体に特徴的な特異的多型部位で生じている多型とすべて呼ぶことができる。一般論として、多型は任意の数の特異的アレルを含むことができる。それ故、本発明の一つの態様において、該多型はいずれの所与の集団においても二つ又はそれ以上のアレルの存在により特徴付けられる。別の態様において、該多型は三つ又はそれ以上のアレルの存在により特徴付けられる。他の態様において、該多型は四つ又はそれ以上のアレル、五つ又はそれ以上のアレル、六つ又はそれ以上のアレル、七つ又はそれ以上のアレル、九つ又はそれ以上のアレル、又は十又はそれ以上のアレルにより特徴付けられる。すべてのこうした多型が、本発明の方法及びキットにおいて利用することが可能であり、そしてそれ故、本発明の範囲内である。
いくつかの例において、基準アレルを選ぶことなく多型部位での異なったアレルに対して参照が行われる。もしくは、基準配列が特定の多型部位について参照される。基準アレルは時には「野生型」アレルと称され、それは通常第一の配列決定されたアレルと、又は「非罹患」個体(例えば、形質又は疾患表現型を示さない個体)からのアレルと通常選ばれる。
本明細書に記述したSNPマーカーについてのアレルは、用いられたSNPアッセイにおける多型部位で生じる場合、塩基A、C、G又はTを指す。本明細書で使用したSNPsについてのアレルコードは以下の通りである:1=A、2=C、3=G、4=T。しかしながら、当業者は反対のDNA鎖をアッセイすること又は読み取ることにより、相補的アレルを各ケースで測定し得ることを理解するであろう。それ故、A/G多型により特徴付けられる多型部位(多型マーカー)に対して、用いられるアッセイは、可能な二つの塩基(即ち、A及びG)の一つ又は両方の存在を特異的に検出するように設計される。もしくは、DNA鋳型の反対の鎖を検出するように設計されているアッセイを設計することにより、相補的塩基T及びCの存在を測定し得る。定量的には(例えば、相対リスクの点から)、同一の結果が両DNA鎖(+鎖/又は−鎖)の測定から得られるであろう。
典型的には、基準配列が特定の配列について参照される。基準から異なるアレルは「変異体」アレルと称される。本明細書で使用する変異体配列とは、基準配列とは異なっているが、それ以外は実質的に類似している配列を指す。本明細書に記載した多型遺伝子マーカーでのアレルは変異体である。追加の変異体は、ポリペプチドに影響する変化を含み得る。基準ヌクレオチド配列と比較した場合のこれらの配列相違は、本明細書に詳細に記載されている、フレームシフトを生じる単一又は1より多くのヌクレオチドの欠失;コードされたアミノ酸に変化を生じる少なくとも一つのヌクレオチド変化;早発性の終止コドンの発生を生じる少なくとも一つのヌクレオチド変化;ヌクレオチドによりコードされた一つまたはそれより多くのアミノ酸の欠失を生じるいくつかのヌクレオチドの欠失;読み取り枠のコード配列の中断を生じる、非等価組換え又は遺伝子変換によるような一つ又はいくつかのヌクレオチドの挿入;配列のすべて又は一部の重複;転座;又はヌクレオチド配列の再編成を含み得る。こうした斑列変化は、核酸によりコードされているポリペプチドを変化させる。例えば、もしヌクレオチド配列中の変化がフレームシフトを起こすとすれば、該フレームシフトはコードされたアミノ酸の変化を生じ得、及び/又は早発性の終止コドンを生じ得、端が切断されたポリペプチドの発生を起こす。もしくは、癌(例えば、前立腺癌(例えば、進行性前立腺癌)、乳癌、肺癌、メラノーマ)に関連する多型、又は癌への感受性は、一つまたはそれより多くのヌクレオチドの同義の変化であり得る(即ち、変化はアミノ酸配列の変化を生じさせない)。こうした多型は、例えば、スプライシング部位を変化し、mRNAの安定性又は輸送に影響し、又はさもなくばコードされたポリペプチドの転写又は翻訳に影響し得る。それは、増幅又は欠失のような構造変化が腫瘍の体細胞レベルで生じる可能性を増加させるようにDNAを変化させることもできる。基準ヌクレオチド配列によりコードされているポリペプチドは、特定の基準アミノ酸配列を有する「基準」ポリペプチドであり、及び変異体アレルによりコードされているポリペプチドは、変異体アミノ酸配列を有する「変異体」ポリペプチドと称される。
ハプロタイプとは、セグメントに沿って配置されたアレルの特異的組み合わせにより特徴付けられるDNAのセグメントを指す。ヒトのような二倍体生物では、ハプロタイプは各多型マーカー又は座位について対のアレルを有する一つのメンバーを含んでなる。ある態様において、該ハプロタイプは、各アレルがセグメントに沿った特異的多型マーカーに対応する二つ又はそれ以上のアレル、三つ又はそれ以上のアレル、四つ又はそれ以上のアレル、又は五つ又はれ以上のアレルを含んでなることが可能である。ハプロタイプは、多型部位に特定のアレルを有する多様な多型マーカー、例えば、SNPs及びマイクロサテライトの組み合わせを含んでなることが可能である。該ハプロタイプは、それ故、種々の遺伝子マーカーでのアレルの組み合わせを含んでなる。
特異的多型マーカー及び/又はハプロタイプの検出は、多型部位の配列を検出するための当該技術分野では公知の方法により達成し得る。例えば、核酸増幅のためにPCR、LCR、ネステッドPCR及び他の技術を利用する蛍光に基づいた技術(Chen, X. et al., Genome Res. 9(5): 492-98 (1999))のような、SNP及び/又はマイクロサテライトマーカーの存在について遺伝子型同定する標準技術を使用し得る。SNP遺伝子型同定に利用可能な具体的方法論には、限定されるわけではないが、TaqMan遺伝子型同定アッセイ及びSNPIex プラットフォーム(Applied Biosystems)、質量分析(例えば、Sequenom からのMassARRAY システム)、ミニシークエンシング法、リアルタイムPCR、Bio-Plex システム(BioRad)、CEQ及びSNPstream システム(Beckman)、Molecular Inversion Probe アレイ技術(例えば、Affymetrix GeneChip)及び BeadArray Technologies( 例えば、Illumina GoldenGate and lnfinium アッセイ)が挙げられる。これら又は当業者には利用可能な他の方法により、マイクロサテライト、SNP又は他のタイプの多型マーカーを含む、多型マーカーでの一つ又はそれ以上のアレルを同定し得る。
本明細書に記載したある方法において、研究下のいずれかの具体的疾患又は形質について増加した感受性(即ち、増加したリスク)にある個体は、疾患又は形質に増加した感受性を与える一つまたはそれより多くの多型マーカーで少なくとも一つの特異的アレルが同定されている(即ち、アットリスクマーカーアレル又はハプロタイプ)個体である。一つの側面において、該アットリスクマーカー又はハプロタイプは、疾患又は形質の有意に増加したリスク(又は感受性)を与えるものである。一つの態様において、マーカー又はハプロタイプに関連する有意性は相対リスク(RR)により測定される。別の態様において、マーカー又はハプロタイプに関連する有意性はオッズ比(OR)により測定される。さらなる態様において、有意性はパーセンテージにより測定される。一つの態様において、有意に増加したリスクは、限定されるわけではないが、少なくとも1.2、少なくとも1.3、少なくとも1.4、少なくとも1.5、少なくとも1.6、少なくとも1.7、少なくとも1.8、少なくとも1.9、少なくとも2.0、少なくとも2.5、少なくとも3.0、少なくとも4.0及び少なくとも5.0を含む、少なくとも1.2のリスク(相対リスク及び/又はオッズ比)として測定される。特定の態様において、少なくとも1.2のリスク(相対リスク及び/又はオッズ比)が有意である。別の特定の態様において、少なくとも1.3のリスクが有意である。さらに別の態様において、少なくとも1.4のリスクが有意である。さらなる態様において、少なくとも約1.5の相対リスクが有意である。別のさらなる態様において、少なくとも約1.7であるリスクの有意な増加が有意である。しかしながら、他のカットオフ、例えば、少なくとも1.15、1.25、1.35なども企図され、こうしたカットオフも本発明の範囲内である。他の態様において、リスクの有意な増加は、限定されるわけではないが、約25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、100%、150%、200%、300%及び500%を含む、少なくとも約20%である。一つの特定の態様において、リスクの有意な増加は少なくとも約20%である。他の態様において、リスクの有意な増加は少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%及び少なくとも100%である。しかしながら、本発明を特徴付けるため、当業者により適していると考えられた他のカットオフ又は範囲も企図され、それらも本発明の範囲内である。
本発明のアットリスク多型マーカー又はハプロタイプは、比較群(対照)におけるその存在の頻度と比較して、該疾患又は形質(罹患した)についてアットリスクである個体において、少なくとも一つのマーカー又はハプロタイプの少なくとも一つのアレルがより頻繁に存在しているものであり、該マーカー又はハプロタイプの存在は、該疾患又は形への質感受性を示す。一つの態様において、対照群は集団サンプル、即ち、母集団からのランダムサンプルであることができる。別の態様において、対照群は疾患を有していない個体の群により表される。こうした疾患を有していない対照は、一つの態様において、一つまたはそれより多くの特異的疾患関連症状が存在しないことにより特徴付けることができる。別の態様において、疾患を有していない対照は、一つ又はそれ以上の疾患特異的リスク因子が存在しないことにより特徴付けられる。一つの態様において、こうしたリスク因子は少なくとも一つの環境リスク因子である。代表的な環境要因は、特異的疾患又は形質に影響することが知られている、又は影響するように企図された天然産物、鉱物又は他の化学物質である。他の環境リスク因子は、限定されるわけではないが、食物及び飲酒習慣、主な生育地の地理的な位置、及び職業的リスク因子を含む、ライフスタイルに関連するリスク因子である。別の態様において、リスク因子は、少なくとも一つの遺伝的リスク因子である。
相関のための単純な検定の例は、2x2分割表でのフィッシャーの直接確率検定であろう。染色体のコホートを考えると、2x2分割表は、マーカー又はハプロタイプの両方を含む、マーカー又はハプロタイプの一つを含む(他方は含まない)及びマーカー又はハプロタイプを含まない染色体の数から構成される。
本発明の他の態様において、疾患又は形質について減少した感受性(即ち、減少したリスク)にある個体は、疾患又は形質に減少した感受性を与える一つまたはそれより多くの多型マーカーで少なくとも一つの特異的アレルが同定されている個体である。減少したリスクを与えるマーカーアレル及び/又はハプロタイプは保護的であるとも言われている。一つの側面において、該保護的マーカー又はハプロタイプは、疾患又は形質の有意に減少したリスク(又は感受性)を与えるものである。一つの態様において、有意に減少したリスクは、限定されるわけではないが、0.9未満、0.8未満、0.7未満、0.6未満、0.5未満、0.4未満、0.3未満、0.2未満及び0.1未満を含む、0.9未満の相対リスクとして測定される。一つの特定の態様において、有意に減少したリスクは0.7未満である。別の態様において、有意に減少したリスクは0.5未満である。さらに別の態様において、有意に減少したリスクは0.3未満である。別の態様において、リスクの減少(又は感受性)は、限定されるわけではないが、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%及び少なくとも98%を含む、少なくとも20%である。一つの特定の態様において、リスクの有意な減少は少なくとも約30%である。別の態様において、リスクの有意な減少は少なくとも約50%である。別の態様において、リスクの減少は少なくとも約70%である。しかしながら、本発明を特徴付けるため、当業者により適していると考えられた他のカットオフ又は範囲も企図され、それらも本発明の範囲内である。
当業者は、集団中に存在する二つのアレルを有するマーカーについて研究されていることを理解するであろうし(SNPのような)、ここで一つのアレルは、対照と比較して、集団中の形質又は疾患を有する個体の群において増加した頻度で観察され、該マーカーの他のアレルは、対照と比較して、集団中の形質又は疾患を有する個体の群において減少した頻度で観察されるであろう。こうしたケースにおいて、マーカーの一つのアレル(形質又は疾患を有する個体において増加した頻度で観察された方)がアットリスクアレルであろうし、一方、他のアレルは保護的アレルであろう。
連鎖不平衡
各減数分裂事象間に、各染色体対について平均一回起こる組換えの自然現象は、自然が配列(及び結果により生物学的機能)に変異を提供する一つの様式を代表している。ゲノム中では組換えがランダムに起こらないことが発見されており;組換え率の頻度には大きな変動があり、高組換え頻度の小さな領域(組換えホットスポットとも称される)及び低組換え頻度のより大きな領域が生じており、それは一般に連鎖不平衡(LD)ブロックと称されている(Myers, S. et al., Biochem Soc Trans 34:526-530 (2006); Jeffreys, A.J., et al.,Nature Genet 29:217-222 (2001); May, C.A., et al., Nature Genet 31:272-275(2002))。
連鎖不平衡(LD)とは二つの遺伝的要素の非ランダム分類を指す。例えば、もし一つの特定の遺伝的要素(例えば、多型マーカー又はハプロタイプのアレル)が集団中で0.50(50%)の頻度で生じ、及び別の要素が0.50(50%)の頻度で生じたとすれば、両方の要素を有するヒトでの予期される発生率は、要素のランダム分布を仮定すれば0.25(25%)である。しかしながら、もし二つの要素が0.25よりも高い頻度で一緒に生じるならば、それらは発生の独立した頻度(例えば、アレル又はハプロタイプ頻度)が予測されるであろうよりも高い比率で一緒に遺伝される傾向があるので、該要素は連鎖不平衡にあると言われている。大まかに言うと、LDは、二つの要素間の組換え事象の頻度に一般的に相関している。集団中の個体の遺伝子型を決定し、及び集団中の各アレルの出現率を決定することにより、集団中のアレル頻度を決定し得る。二倍体の集団(例えば、ヒト集団)では、個体は典型的には各遺伝的要素(例えば、マーカー、ハプロタイプ又は遺伝子)について二つのアレルを有しているであろう。
連鎖不平衡(LD)の強度を評価するため、多くの異なった尺度が提案されてきた。ほとんどは両アレル部位の対間の関連の強さを捕捉する。二つの重要なLDの対尺度はr2(しばしばΔ2で表示される)及び|D’|である。両方の尺度とも0(不平衡なし)から1(「完全」不平衡)の範囲であるが、それらの解釈はわずかに異なっている。|D’|は、もし二つ又は三つの可能なハプロタイプが存在するならば、それは1に等しく、及び四つの可能なハプロタイプが存在するならば、それは<1であるとように定義される。従って、<1である|D’|の値は、二つの部位で歴史的組換えが起こってもよいことを示している(反復性変異も<1である|D’|を生じ得るが、単一ヌクレオチド多型(SNPs)についてこのことは組換えよりも起こりにくいと通常考えられている)。尺度r2は、二つの部位間の統計的相関を表しており、もし二つのみのハプロタイプが存在すれば1の値をとる。
r2尺度は、r2間の単純な逆関係であり、及び感受性座位及びSNPs間の関連を検出するために少量の試料しか必要とされないので、関連マッピングについての間違いなく最もよい関連尺度である。これらの尺度は対の部位について定義されているが、いくつかの適用については、多くの多型部位を含有する全領域にわたり、LDがどれくらい強いかを決定することが望まれるであろう(例えば、LDの強度が座位間で又は集団にわたって有意に異なっているかどうか、又は特定のモデル下で予測されるよりも領域中でLDが大きいか又は小さいかどうかを試験すること)。領域にわたってLDを測定することは容易ではないが、一つのアプローチは集団遺伝学で開発された尺度rを使用するものである。大まかに言うと、rは、データに見られるLDを発生させるため、特定の集団モデル下でどのくらいの組換えが必要とされるであろうかを測定する。このタイプの方法は、LDデータが組換えホットスポットの存在についての証拠を提供するかどうかを決定することへの統計的に厳密なアプローチも提供できる可能性がある。本明細書で記載されている方法について、有意なr2値は、少なくとも、0.1、0.15、0.2、0.25、0.3、0.35、0.4、0.45、0.5、0.55、0.6、0.65、0.7、0.75、0.8、0.85、0.9、0.91、0.92、0.93、0.94、0.95、0.96、0.97、0.98、0.99又は1.0のように、少なくとも0.1であり得る。一つの好ましい態様において、有意なr2値は少なくとも、0.2であり得る。もしくは、本明細書に記載した連鎖不平衡は、0.3、0.4、0.5、0.6、0.7、0.8、0.85、0.9、0.95、0.96、0.97、0.98、0.99のような、少なくとも、0.2の|D’|の値により特徴付けられる連鎖不平衡を指す。それ故、連鎖不平衡は特有なマーカーのアレル間の相関を表す。それは相関係数又は|D’|(1.0までのr2及び1.0までの|D’|)により測定される。ある態様において、連鎖不平衡はr2及び|D’|尺度の両方についての値に関して定義される。一つのこうした態様において、有意な連鎖不平衡は、r2>0.1及び|D’|>0.8と定義される。別の態様において、有意な連鎖不平衡は、r2>0.2及び|D’|>0.9と定義される。連鎖不平衡を決定するためのr2及び|D’|の値についての他の組み合わせ及び順列も可能であり、本発明の範囲内である。連鎖不平衡は本明細書で定義した単一ヒト集団において決定することもできるし、又は一つより多くのヒト集団からの個体を含んでなるサンプルの集合においても決定し得る。本発明の一つの態様において、LDは、定義されているような(http://www.hapmap.org)、一つ又はそれ以上のHapMap集団(コーカサス人(CEU)、アフリカ人(YRI)、日本人(JPT)、中国人(CHB))からのサンプルにおいても決定される。一つのこうした態様において、HapMapサンプルのCEU集団においてLDが決定される。別の態様において、YRI集団においてLDが決定される。さらに別の態様において、アイスランド集団からのサンプルにおいてLDが決定される。
もしゲノム中のすべての多型が集団レベルで同一であれば、次ぎに、それらのことごとくが関連性研究で調査されるべきであろう。しかしながら、多型の連鎖不平衡のため、強固に連結した多型は強く相関し、それは有意な関連を観察するための関連性研究で調査されることを必要とする多型の数を減少させる。LDの別の結果は、これらの多型が強く相関性があるという事実のため、多くの多型が関連性シグナルを与えることができるということである。
ゲノムLD地図は、ゲノムの全域で作製されており、こうしたLD地図は疾患−遺伝子地図作製のための骨組みとして働くことが提案されてきた(Risch, N. & Merkiangas, K, Science 273:1516-1517 (1996); Maniatis, N., et al., Proc Natl Acad Sci USA 99:2228-2233 (2002); Reich, DE et al, Nature 411:199-204 (2001))。
ヒトゲノムの多くの部分が、少数の共通ハプロタイプを含有する、一連の分離したハプロタイプブロックに分解され得ることが確立されており;これらのブロックについて、連鎖不平衡データは組換えを示す証拠を提供しなかった(例えば、Wall., J. D. and Pritchard, J. K., Nature Reviews Genetics 4:587-597 (2003); Daly, M. et al., Nature Genet. 29:229-232 (2001); Gabriel, S.B. et al., Science 296:2225-2229 (2002); Patil, N. et al., Science 294:1719-1723 (2001); Dawson, E. et al., Nature 418:544-548 (2002); Phillips, M.S. et al., Nature Genet. 33:382-387 (2003) を参照されたい)。
これらのハプロタイプブロックを画定するための二つの主な方法がある:ブロックは、限定されたハプロタイプ多様性を有するDNAの領域として(例えば、Daly, M. et al., Nature Genet. 29:229- 232 (2001); Patil, N. et al., Science 294:1719-1723 (2001); Dawson, E. et al., Nature 418:544-548 (2002); Zhang, K. et al., Proc. Natl. Acad. Sci. USA 99:7335-7339 (2002) を参照されたい)、又は連鎖不平衡を使用して同定された、広範囲の歴史的組換えを有する遷移域間の領域として(例えば、Gabriel, S.B. et al., Science 296:2225-2229 (2002); Phillips, M.S. et al., Nature Genet. 33:382-387 (2003); Wang, N. et al., Am. J. Hum. Genet. 71:1227-1234 (2002); Stumpf, M.P., and Goldstein, D.B., Curr. Biol. 73:1-8 (2003) を参照されたい)画定し得る。さらに最近、組換え率の高精度地図及びヒトゲノム全域にわたった対応するホットスポットが作製された(Myers, S., et al., Science 310:321 -32324 (2005); Myers, S. et al., Biochem Soc Trans 34:526530 (2006))。該地図は、該ゲノム全域にわたった組換えでの膨大な変異を明らかにし、ホットスポット中では10〜60cM/Mbほど高い組換え率を有し、一方、介在領域では0に近く、それ故、それは限定されたハプロタイプ多様性及び高LDの領域を表している。該地図はそれ故、組換えホットスポットが隣接した領域としてのハプロタイプブロックs/LDブロックを画定するために使用し得る。本明細書で使用される用語「ハプロタイプブロック」又は「LDブロック」は、上記の特徴のいずれかにより、又はこうした領域を画定するために当業者により使用される代替法により画定されたブロックを含む。
ハプロタイプブロックの同定のためのいくつかの代表的方法が、例えば、米国公開特許出願番号20030099964、20030170665、20040023237及び20040146870 に示されている。ハプロタイプブロックは、単一マーカー又は複数のマーカーを含んでなるハプロタイプを使用し、表現型とハプロタイプ状態間の関連の地図作製に使用し得る。主ハプロタイプが各ハプロタイプブロックで同定でき、次ぎに「タグ付けされた」SNPs又はマーカーの組(SNP又はマーカーの最も小さな組がハプロタイプ間を区別するために必要とされる)を同定し得る。これらのタグ付けされたSNPs又はマーカーを次ぎに、表現型とハプロタイプ間との関連を同定するため、個体の群からのサンプルの評価に使用し得る。望むなら、隣接したハプロタイプブロックは、ハプロタイプブロック間の連鎖不平衡でも存在することができるので、同時に評価し得る。
ゲノム中の多型マーカーへのいずれかの所与の観察された関連について、ゲノム中の追加のマーカーも関連を示すようであることが明らかにされた。このことは、組換え率の大きな変動により観察されたように、ゲノム全域にわたるLDの一様でない分布の自然の結果である。関連を検出するために使用されたマーカーは、それ故、ある意味で、所与の疾患又は形質に関連するゲノム領域(即ち、ハプロタイプブロック又はLDブロック)のための「タグ」を表し、そのようであるので、本発明の方法及びキットでの使用に有用である。一つ又はそれ以上の原因となる(機能的)変異体又は突然変異は、該疾患又は形質へ関連していることが見いだされた領域内に属することができる。こうした変異体は、関連性を検出するために使用されたタグ付けマーカーで観察されたよりも高い相対リスク(RR)又はオッズ比(OR)を与えることができる。本発明はそれ故、本明細書に記載した該疾患への関連性を検出するために使用したマーカー、ならびに該マーカーと連鎖不平衡にあるマーカーについて言及する。それ故、本発明のある態様において、本明細書に記載した本発明のマーカー及び/又はハプロタイプとLDにあるマーカーを、代替マーカーとして使用することができる。該代替マーカーは、一つの態様において、本明細書に記載した、該疾患と関連していると最初に見いだされたマーカー又はハプロタイプよりも小さな相対リスク(RR)及び/又はオッズ比(OR)値を有する。他の態様において、該代替マーカーは、本明細書に記載した、該疾患と関連していると最初に見いだされたマーカーについて決定されたRR又はOR値よりも大きな値を有する。こうした態様の例は、本明細書に記載した変異体のような、該疾患に関連していると最初に発見された、より共通の変異体(>10%の集団頻度)を伴ったLD中の、希な又は相対的に希な変異体(<10%の集団頻度)であろう。本明細書に記載した、本発明者により発見された関連を検出するためにこうしたマーカーを同定すること及び使用することは、当業者には公知のルーチン法により実施することができ、そしてそれ故、本発明の範囲内である。
ハプロタイプ頻度の決定
患者及び対照群中のハプロタイプの頻度は期待値最大化(expectation-maximization)アルゴリズム(Dempster A. et al., J. R. Stat. Soc. B, 39:1-38 (1977)) を使用して見積もることが可能である。失われた遺伝子型及びフェーズの不確かさを取り扱うことが可能なこのアルゴリズムの実行を使用し得る。帰無仮説下、患者及び対照は同一の頻度を有すると仮定した。尤度アプローチを使用し、対立仮説を試験し、そこでは、本明細書に記載したマーカーを含むことができる候補アットリスクハプロタイプは対照よりも患者でより高い頻度にし、一方、他のハプロタイプの頻度は両群で同一とした。両方の仮説下で尤度を別々に最大化し、対応する1−df尤度比統計を、統計的有意性を評価するために使用した。
連鎖領域内のアットリスク及び保護的マーカー及び/ハプロタイプを探すため、例えば、これらのマーカーが実行領域に広がっていると仮定して、遺伝子型決定したマーカーのすべての可能な組み合わせの関連を研究した。合併した患者及び対照群を、患者及び対照の本来の群に等しいサイズで、二つの組にランダムに分割することができる。マーカー及び/ハプロタイプ分析を次ぎに繰り返し、登録された最も有意なP値を決定した。このランダム化スキームを例えば、100回以上繰り返すことができ、P値の実験的分布を構築した。好ましい態様において、<0.05のP値が有意なマーカー及び/又はハプロタイプの関連を示す。
ハプロタイプ分析
ハプロタイプ分析の一つの一般的アプローチはネステッドモデル(NEMO)(Gretarsdottir S., et al., Nat. Genet.35:131-38 (2003))に応用した尤度に基づいた推論を使用することを含んでいる。該方法は、多くの多型マーカー、SNPs及びマイクロサテライトを許容するプログラムNEMOで実行される。方法及びソフトウェアーは、患者対照研究について具体的に設計され、異なったリスクを与えるハプロタイプ群を同定することが目的である。それはLD構造を研究するためのツールでもある。NEMOにおいて、最大尤度見積もり、尤度比及びP値は、観察されたデータについてそれを失われたデータ問題として取り扱う、EMアルゴリズムの助けを借りて、直接的に計算される。
フェーズの不確かさ及び失われた遺伝子型による情報損失を取り込んだ観察データを直接計算される尤度に基づいた尤度比試験は信頼できて、有効なP値を与えるが、不完全である情報のため、どのくらいの情報が失われていたかを知ることはそれでも興味あることであろう。ハプロタイプ分析についての情報量は、連鎖分析について定義された情報量の自然な流れとしてNicolae and Kong (Technical Report 537, Department of Statistics, University of Statistics, University of Chicago ; Biometrics, 60(2):368-75 (2004)) により記載されており、NEMOで実行された。
疾患との単一マーカー関連について、フィッシャーの直接確率検定を使用することができ、各個体アレルの両側P値を計算した。通常、すべてのP値は特別に示されていない限り、複数比較のために調整されずに示されている。示された頻度(マイクロサテライト、SNPs及びハプロタイプについて)は、キャリアー頻度に対立するものとしてのアレル頻度である。連鎖分析のための家族として動員された患者の同系性による偏向を最小化するため、一等親及び二等親血縁者類は患者リストから除去し得る。さらに、Risch, N. & Teng, J.(Genome Res., 8: 1273-1288 (1998)) に記載されている分散調節法を拡大することにより、一般的家族関連性に適用できるように、及び比較のため調整及び未調整P値の両方に提示できるように同胞群についてDNAをプール化することにより(前記文献)、患者間に残った同系性を補正して関連について試験を繰り返し得る。相違は、予測されたごとく一般的に非常に小さかった。多重試験のために補正された単一マーカー関連の有意性を評価するため、同一の遺伝子型データを使用してランダム化試験を実施し得る。患者及び対照のコホートをランダム化でき、関連分析を複数回(例えば、500,000回まで)やり直し、及びP値は、本来の患者及び対照のコホートを使用して観察されたP値より低いか又は等しい、いくつかのマーカーアレルについてのP値を生み出す反復の一部である。
単一マーカー及び/ハプロタイプ両分析について、相対リスク(RR)及び集団寄与リスク(PAR)を乗法(multiplicative)モデル(ハプロタイプ相対リスクモデル)(Terwilliger, J.D. & Ott, J., Hum. Hered. 42:337-46 (1992) 及び Falk, CT. & Rubinstein, P, Ann. Hum. Genet. 51 (Pt 3):227-33 (1987)) 、即ち、二つのアレル/人が多数重なって運んでいるハプロタイプのリスク、を仮定して計算し得る。例えば、もしRRがaに対するAの相対リスクであるとしたら、ホモ接合体AAの人のリスクはヘテロ接合体AaのリスクのRR倍であり、ホモ接合体aaのそれのRR2倍であろう。乗法モデルは、分析及び計算を単純化する素晴らしい特性を有する−罹患した集団内ならびに対照集団内でハプロタイプは独立している(即ち、Hardy-Weinberg平衡で)。その結果、罹患者及び対照のハプロタイプ計算は各々多項分布を有するが、対立仮説下では異なったハプロタイプ頻度を有する。具体的には、二つのハプロタイプ、hi及びhjについて、リスク(hi)/リスク(hj)=(fi/pi)/(fj/pj)、式中、f及びpは、それぞれ患者集団及び対照集団中の頻度を表す。もし真のモデルが乗法的でないとしたら、いくらかのパワーの損失があるが、該損失は極端なケースを除いて軽度である傾向がある。最も重要なことは、P値は帰無仮説に関して計算されるので、常に有効である。
NEMOを使用する連鎖不平衡
マーカーの対間のLDは、D'及びR2の標準定義を使用して計算し得る(Lewontin, R., Genetics 49:49-67(1964); Hill, W.G. & Robertson, A. Theor. Appl Genet. 22:226-231 (1968)) 。NEMOを使用し、二つのマーカーアレルの組み合わせを、最大尤度により見積もり、及び連鎖平衡からの逸脱を尤度比試験により評価した。D'及びR2の定義を、辺縁アレル確率により加重した二つのマーカーのすべての可能なアレル組み合わせについての値を平均することによりマイクロサテライトを含むように拡張した。特定の領域中のLD構造を評価するためにすべてのマーカーの組み合わせをプロッティングする場合、D’を左上の隅に及びP値を右下隅にプロットした。LDプロットにおいて、もし望むなら、マーカーはそれらの物理的位置に従うよりもむしろ等距離にプロットし得る。
リスク評価及び診断
本明細書に記載したように、こうしたマーカーを含有するある種の多型マーカー及びハプロタイプは、癌(例えば、前立腺癌(例えば、進行性前立腺癌)、肺癌、結腸癌、乳癌、黒色腫)のリスク評価に有用であることが見いだされた。リスク評価は、癌への感受性を診断するためのマーカーの使用を含み得る。多型マーカーの特定のアレルが、癌と診断されていない個体よりも、癌を有する個体でより頻度高く観察された。従って、これらのマーカーアレルは、個体において癌の検出又は癌への感受性を予測することに役に立つ。本発明のマーカーのようなアットリスクマーカーを含んでなるハプロタイプブロック又はLDブロック内のタグ付けマーカーは、該ハプロタイプブロック又はLDブロック内の他のマーカー及び/又はハプロタイプの代替物として使用し得る。1に等しいr2の値を有するマーカーは該アットリスク変異体の完全な代替物である;即ち、一つのマーカーについての遺伝子型は、他についての遺伝子型を完全に予測する。1より小さなr2の値を有するマーカーも該アットリスク変異体の代替物であることができ、もしくは、アットリスク変異体と同じ高さの又はもしかするとさらにより高い相対リスク値を有する変異体を示す。同定されたアットリスク変異体は、それ自身が機能性変異体ではなくてもよいが、この例においては真の機能性変異体と連鎖不平衡にある。本発明は、本明細書に記載したマーカーのこうした代替マーカーの評価を包含する。こうしたマーカーは、当業者には公知であるように、注釈が付けられ、地図作製され、及び公開データベースに収載されるか、もしくは、個体のグループ中で本発明のマーカーにより同定された領域又は領域の一部を配列決定することにより容易に同定することができ、そして生じた配列群中の多型を同定する。その結果、当業者は容易に及び実験することなく、本明細書に記載したマーカー及び/又はハプロタイプと連鎖不平衡にある代替マーカーを遺伝子型同定し得る。検出されたアットリスク変異体とLDにあるタグ付け又は代替マーカーも、個体における癌への関連又は癌への感受性を検出することを予測することに役に立つ。本発明のマーカー及び/又はハプロタイプと連鎖不平衡にあるこれらのタグ付け又は代替マーカーは、ハプロタイプを識別する他のマーカーも含み得る(これらの類似性は癌への感受性を検出することを予測することに役に立つ)。
本発明のマーカー及びハプロタイプ、例えば、表4A、4B、5A、5B、5Cに示したマーカーは、単独で又は組み合わせて、リスク評価及び診断目的に有用である。それ故、個々のマーカーによるリスクの増加が比較的軽微(即ち、10〜30%程度)の場合においても、該関連性は有意な意味を有する。それ故、比較的共通の変異体が全リスクに対して有意に寄与し(集団寄与危険度(Population Attributable Risk )が高い)、マーカーの統合リスクに基づいて、疾患を発生する有意な統合リスクを有する個体の群を規定するために、マーカーの組み合わせを使用し得る。
それ故、本発明の一つの態様において、複数の変異体(遺伝子マーカー、バイオマーカー及び/又はハプロタイプ)が全リスク評価のために使用される。これらの変異体は、一つの態様において、本明細書に開示した変異体から選択される。他の態様には、癌への感受性を診断するために有用であることが知られている他の変異体と組み合わされた本発明の変異体の使用が含まれる。こうした態様において、複数のマーカー及び/又はハプロタイプの遺伝子型状態が個体において決定され、個体の状態を、関連変異体の集団頻度、又は年齢が一致した及び性が一致した対象のような臨床的に健康な対象における変異体の頻度と比較する。多変量分析又は結合リスク(joint risk)分析のような当該技術分野で公知である方法を、多座位での遺伝子型状態に基づいて、与えられた全リスクを決定するために引き続いて使用することができる。こうした分析に基づいたリスクの評価は、本明細書に記載した本発明の方法及びキットで引き続いて使用することができる。
上記のように、ヒトゲノムのハプロタイプブロック構造は、疾患又は形質と本来関連する変異体と連鎖不平衡にある多数の変異体(マーカー及び/又はハプロタイプ)が、該疾患又は形質との関連を評価するための代替マーカーとして使用することができる効果を有する。こうした代替マーカーの数は、領域中の歴史的組換え率、領域中の突然変異頻度(即ち、領域中の多型部位又はマーカーの数)、及び領域中のLDの程度(LDブロックのサイズ)のような因子に依存するであろう。これらのマーカーは、本明細書に記載した方法を使用して、又は当業者には公知の他の方法により画定された、問題とするLDブロック又はハプロタイプブロックの物理的境界内に通常位置する。しかしながら、時にはマーカー及びハプロタイプ関連性は、画定されたハプロタイプブロックの物理的境界を超えて拡大していることが観察される。こうしたマーカー及び/又はハプロタイプは、これらのケースにおいて、画定されたハプロタイプブロック内に物理的に属する該マーカー及び/又はハプロタイプの代替マーカー及び/又はハプロタイプとしても使用することができる。その結果、本明細書に記載したマーカー及びハプロタイプとLDにある(典型的には、0.3より大きなr2を含む、0.4より大きなr2も含んだ0.2より大きなr2のような、0.1より大きなr2により特徴付けられる)マーカー及びハプロタイプは、たとえそれらが画定されたハプロタイプブロックの境界を超えて位置してしても、本発明の範囲内である。本発明はそれ故、本明細書に記載されているマーカー(例えば、表4A、4B、5A、5B、5C)に関するが、本明細書にリストされたマーカーの一つ又はそれより多くと強いLD(例えば、0.1又は0.2より大きなr2及び/又は|D’|>0.8により特徴付けられる)にある他のマーカーも包含する。
本明細書に記載したSNPマーカーについては、特定の癌(例えば、前立腺癌)を有する患者で発現していることが観察されたアレル(アットリスクアレル)と逆のアレルは、癌を有する患者において減少した頻度で観察された。LDにある及び/又はこうしたマーカーを含んでなるこれらのマーカー及びハプロタイプは、それ故癌に対して保護的であり、即ち、それらは癌を発生するマーカー及び/又はハプロタイプを運んでいる個体の減少したリスク又は感受性を与える。他の態様において、少なくとも二つの多型マーカーを含んでなるハプロタイプは、特定の癌を有する個体において減少した頻度で観察され、それ故、癌に保護的である。こうしたマーカー及びハプロタイプは、個体における減少した癌への感受性を診断するために有用である。
ある種のハプロタイプを含んだ本発明のある種の変異体は、いくつかのケースにおいて、種々の遺伝子マーカー(例えば、SNP及びマイクロサテライト)の組み合わせを含んでなる。ハプロタイプを検出することは、多型部位の配列を検出するために当該技術分野で公知である及び/又は本明細書に記載された方法により達成し得る。さらに、ある種のハプロタイプ又はマーカーの組と疾患表現型間の相関は、標準技術を使用して検証し得る。相関についての単純な試験の代表的例は、2x2表でのフィッシャーの直接確率検定であろう。
具体的態様において、癌と関連することが観察されたアレル又はハプロタイプマーカー(例えば、表1、2、3、4A及び4Bにリストしたマーカーアレル)は、健常な個体(対照)におけるその存在の頻度と比較し、癌のリスクがある個体(患者)においてより高頻度で存在するアレル又はハプロタイプマーカーであり、該アレル又はハプロタイプマーカーの存在は癌又は癌への感受性を示す。他の態様において、癌と関連することが観察された一つ又はそれ以上のマーカーと連鎖不平衡にあるアットリスクマーカーは、健常な個体(対照)におけるそれらの存在の頻度と比較して、癌のリスクがある個体(患者)により高頻度で存在するタグ付けマーカーであり、該タグ付けマーカーの存在は癌への感受性を示す。さらなる態様において、癌と関連することが観察された一つ又はそれ以上のマーカー(例えば、表4A、4B、5A、5B及び5Cにリストしたマーカーアレル)と連鎖不平衡にあるアットリスクマーカーアレル(即ち、増加した感受性を与える)は、健常な個体(対照)におけるそれらの存在の頻度と比較して、癌のリスクがある個体(患者)により高頻度で存在する一つ又はそれ以上のアレルを含んでなるマーカーであり、該マーカーの存在は癌への感受性を示す。
調査対象集団
一般的な意味において、本発明の方法及びキットは、いずれの起源(即ち、いずれの個体)からのゲノムDNA含有サンプルにも利用し得る。好ましい態様において、該個体はヒト個体である。該個体は、大人、子供、又は胎児であり得る。本発明は、標的集団のメンバーである個体中のマーカー及び/又はハプロタイプを評価するためにも提供される。こうした標的集団は、一つの態様において、他の遺伝因子、バイオマーカー、生物物理的パラメーター(例えば、体重、BMD、血圧)又は一般健康及び/又はライフスタイルパラメーター(例えば、疾患又は関連疾患の病歴、疾患の診断歴、疾患の家族歴)に基づいて疾患を発生するリスクを有する個体の集団又は群である。
本発明は、40歳以上、45歳以上、又は50歳、55歳、60歳、65歳、70歳、75歳、80歳又は85歳以上のような特異的年齢副群からの個体を含む態様を提供する。本発明の他の態様は、80歳未満、75歳未満、又は70歳、65歳、60歳、55歳、50歳、45歳、40歳、35歳、又は30歳未満のような、85歳未満の年齢の個体のような他の年齢群に関する。他の態様は、いずれかの上記の年齢範囲に疾患の発症年齢を有する個体に関する。45歳より上で60歳未満での発症年齢のような年齢範囲がある種の態様で関連することができることも企図される。しかしながら、上にリストした年齢値によりひとくくりにされたすべての年齢範囲を含む、他の年齢範囲も企図される。本発明はさらに両方の性(男性又は女性)の個体に関する。
アイスランド人集団は、北ヨーロッパ祖先のコーカサス人集団である。アイスランド人集団における遺伝子連鎖及び関連性の結果を報告している多数の研究が、ここ数年公開されてきた。これらの研究の多くは、他の集団において、特定の疾患に関連しているとして元々アイスランド人集団で同定された変異体の複製を示した(Stacey, S. N., et al., Nat Genet. May 27 2007 (Epub ahead of print; Helgadottir, A., et al., Science 316:1491-93 (2007); Steinthorsdottir, V., et al., Nat Genet. 39:770-75 (2007); Gudmundsson, J., et al., Nat Genet. 39:631-37 (2007); Amundadottir, L.T., et al., Nat Genet. 38:652-58 (2006); Grant, S.F., et al., Nat Genet. 38:320-23 (2006))。それ故、アイスランド人集団における遺伝的発見は、アフリカ及びアジアからの集団を含む他の集団においても一般に複製されてきた。
本発明のマーカーは、癌(例えば、前立腺癌)に関連していることが見いだされ、他のヒト集団においても同様の関連を示すと信じられる。個々のヒト集団を含んでなる特定の態様もそれ故企図され、本発明の範囲内である。こうした態様は、限定されるわけではないが、コーカサス人、ヨーロッパ人集団、アメリカ人集団、ユーラシア人集団、アジア人集団、中央/南アジア人集団、東アジア人集団、中東人集団、アフリカ人集団、ラテンアメリカ人系集団及びオセアニア人集団を含む、一つ又はそれ以上のヒト集団であるヒト対象に関する。ヨーロッパ人集団には、限定されるわけではないが、スウェーデン人、ノルウェー人、フィンランド人、ロシア人、デンマーク人、アイスランド人、アイルランド人、ケルト人、イギリス人、スコットランド人、オランダ人、ベルギー人、フランス人、ドイツ人、スペイン人、ポルトガル人、イタリア人、ポーランド人、ブルガリア人、スラブ人、セルビア人、ボスニア人、チェチェン人、ギリシア人及びトルコ人集団が含まれる。他の態様において、本発明はさらに、バンツー、マンデンカ、ヨルバ、サン、ムブティピグミー、オルカディアン、エディゲル、ロシア、サルジニア、トスカナ、ムザブ、ベドウィン、ドルーズ、パレスティナ、バローチ、ブラフイ、マクラーニー、シンド、パターン、ブルーショー、ハザラ、ウィグル、カラーシュ、ハン、ダイ、ダフール、ホジェン、ラフ、ミャオ、オロチョン、シ、エ、トゥチャ、トウ、シボ、イー、モンゴル、ナシ、カンボジア、ジャパニーズ、ヤクート、メラネシア、パプア、カリティアナ、スルイ、コロンビア、マヤ及びピマを含む特異的ヒト集団においても実施し得る。
一つの好ましい態様において、本発明は、アフリカ系家系又は血統の人々を含んでなる集団のようなブラックアフリカ人祖先を含む集団に関する。ブラックアフリカ人祖先は自己申告により、ブラック人種のメンバーである又はネグロ人種のメンバーである、アフリカンアメリカ人、アフロアメリカ人、ブラックアメリカ人として決定することができる。例えば、アフリカンアメリカ人又はブラックアメリカ人は北アメリカに住み、そしてアフリカのブラック人種群のいずれかに起源を有する人々である。別の例において、ブラックアフリカ人祖先の自己申告をした人々は、少なくとも一人のブラックアフリカ人祖先の親又は少なくとも一人のブラックアフリカ人祖先の祖父母を有している。
個々の対象における人種的寄与も遺伝子分析により決定することができる。祖先の遺伝子分析は、Smith et al. (Am J Hum Genet 74, 1001 -13 (2004))により示されているような非連鎖マイクロサテライトマーカーを使用して実施することができる。一つの態様において、遺伝的祖先は、多民族コホートを使用し、以前に記述されている研究(Pritchard, J. K. et al., Genetics 115:945-59 (2000))で遺伝子型が決定された約2000のマイクロサテライトから選択されるマイクロサテライトマーカーの組を使用して推定された。一つのこうした態様において、本明細書に記載したように、ヨーロッパ系アメリカ人35人、アフリカンアメリカ人88人、中国人34人、及びメキシコ系アメリカ人29人のコホートを使用した。この組から遺伝子祖先を推定することに有用な一つの特定の態様は、30の非連鎖マイクロサテライトマーカーを含んでなる。選択された組は、Prichard et al. により記述された2000マーカーの、ヨーロッパ系アメリカ人、アフリカンアメリカ人及びアジア人間の最も有意な相違を示し、良好な質及び収率も有する。それ故、一つの態様において、遺伝子祖先は、D1S2630、D1S2847、D1S466、D1S493、D2S166、D3S1583、D3S4011、D3S4559、D4S2460、D4S3014、D5S1967、DG5S802、D6S1037、D8S1719、D8S1746、D9S1777、 D9S1839、D9S2168、D10S1698、D11S1321、D11S4206、D12S1723、D13S152、D14S588、D17S1799、D17S745、D18S464、D19S113、D20S878及びD22S1172から成るマイクロサテライトマーカーの組を遺伝子型同定することにより決定した。マーカーDG5S802を含んでなるセグメントを増幅するために適切なプライマー対は配列番号4及び配列番号5に示されている。当業者は、マイクロサテライトマーカーの他の組み合わせ、又は他のタイプの多型マーカー(例えば、SNPs)も、遺伝子祖先を推定するために使用できることを理解するであろう。
ある態様において、本発明は上記の特異的集団で同定されたマーカー及び/又はハプロタイプに関する。当業者は、連鎖不平衡(LD)の尺度は、異なった集団に適応された場合に異なった結果を与えることを認識するであろう。このことは、異なったヒト集団の異なった集団歴史、ならびに特異的ゲノム領域中のLDの相違を導くことができる異なった選択圧による。ある種のマーカー(例えば、SNPマーカー)は、異なった集団中で異なった集団頻度を有し、又は一つの集団では多型であるが、別の集団ではそうではないことも、当業者には公知である。しかしながら、当業者はいずれの所与のヒト集団においても本発明を実施するため、利用可能な及び本明細書で考えられた方法を適用するであろう。このことは、特異的集団内で最も強い関連性を与えるマーカーを同定するための、本発明のLD領域中の多型マーカーの評価が含まれる。それ故、本発明のアットリスク変異体は、多様なヒト集団において異なったハプロタイプバックグラウンド上に、及び異なった頻度で存在することができる。しかしながら、当該技術分野で公知である方法及び本発明のマーカーを利用し、本発明はいずれの所与のヒト集団においても実行し得る。
遺伝子検査の有用性
当業者は、本明細書に記載した変異体は一般に、それ自身では特定の癌、例えば、前立腺癌を発症するであろう個体の絶対的同定を提供しないことを認識及び理解するであろう。しかしながら、本明細書に記載した変異体は、本発明のアットリスク又は保護的変異体を運んでいる個体が癌に関連する症状に付随した癌の特定の形態を発症するであろう、増加した又は減少した可能性を示す。しかしながら、この情報は例えば、初期段階で治療を応用することが可能なように、早期段階で予防的測定を開始するため、定期的な身体的及び/又は精神的試験を実施して症状の進行及び/又は出現をモニターするため、又は該癌の早期兆候を同定するため定期的な間隔での試験を計画するために使用し得るので、以下により詳細に概説するように、それ自身非常に有益である。
癌を発生するリスクを与える遺伝子変異体についての知識は、癌を発生する増加したリスクを有する個体(即ち、アットリスク変異体のキャリアー)及び癌を発生する減少したリスクを有する個体(即ち、保護的変異体のキャリアー)間を区別するための遺伝子試験を適用する機会を与える。上記の群の両方に属する個体についての遺伝子試験の中核的意義は、早期段階で癌を診断することができる可能性であり、最も適切な治療を適用することが可能であるように癌の予後/進行性について、臨床医に情報を提供することである。例えば、癌(例えば、前立腺癌(進行性又は高グリーソングレード前立腺癌、より進行性の遅い又は低グリーソングレード前立腺癌))についての遺伝子試験の適用は、早期段階での療法的尺度の適用を導くことができる、早期段階での疾患の検出の機会を提供することができ、そしてそれ故、癌により受ける症状の有害な効果及び深刻な健康状態を最小にし得る。癌の遺伝子試験のいくつかの利点には次のものが含まれる:
1.早期検出を助けるため
前立腺癌についての遺伝子試験の適用は、もし局所的に発見されたら、より高い治癒率を導き、腫瘍の局所及び遠位伝搬を最小化することにより生存率を増加させる、早期段階での疾患の検出の機会を提供し得る。
前立腺癌については、遺伝子試験は、すでに一般的に適用されている前立腺特異的抗原(PSA)試験及び直腸診(DRE)の感度及び特異性を増加させる可能性が高いであろう。このことは、偽陽性(それ故、針バイオプシーのような不必要な過程を最小にする)及び偽陰性(それ故、潜在性疾患の検出を増加させ、PCAによる罹患率及び死亡率を最小化する)の率を低下させることを導く。
2.進行性を決定するため
遺伝子試験は、前診断予後指標についての情報を提供し得、スクリーニング戦略の修正を導くことが可能な、進行性腫瘍タイプについて高リスク又は低リスクの個体の同定を可能にする。例えば、進行性前立腺癌の発生について高リスクアレルのキャリアであると決定された個体は、より頻繁なPSA試験、検査を受けるであろうし、異常PSA値の存在での針バイオプシーに対してより低い閾値を有する。
さらに、進行性腫瘍タイプについて高リスク又は低リスクアレルのキャリアである個体を同定することは、治療戦略の修正を導くであろう。例えば、もし、前立腺癌の進行性形態を発生させる増加したリスクを与えるアレルのキャリアである個体で前立腺癌が診断されたら、臨床医は攻撃性が低い治療戦略の代わりに、前立腺切除術のようなより攻撃的な治療戦略を勧めるであろう。
当該技術分野で既知であるように、前立腺特異的抗原(PSA)は、癌細胞を含む前立腺の上皮細胞により分泌されるタンパク質である。血中の上昇したレベルは、良性にせよ又は悪性にせよ、前立腺の異常状態を示している。PSAは前立腺中の潜在的問題を検出するため、及び前立腺癌療法の進行を追跡するために使用される。4ng/ml以上のPSAレベルは前立腺癌の存在を示す(当該技術分野で公知であるように及び本明細書に記載したように、本試験は非常に特異的でも高感度でもないが)。
一つの態様において、本本発明の方法はPSAアッセイと併用して(先だって、同時に又は後で)実施される。特定の態様において、対象が4ng/mlより高いレベルを有していることと組み合わされた、マーカー又はハプロタイプの存在は、より進行性の前立腺癌及び/又はより悪い予後を示す。本明細書に記載したごとく、特定のマーカー及び/ハプロタイプは高いグリーソン(即ち、より進行性)前立腺癌と関連している。別の態様において、正常PSAレベル(例えば、4ng/ml未満)を有する患者におけるマーカー又はハプロタイプの存在は、高いグリーソン(即ち、より進行性)前立腺癌及び/又はより悪い予後を示す。「より悪い予後」又は「悪い予後」は、癌が前立腺の境界を超えて増殖し、転移し、療法を逃れ及び/又は宿主を殺すことが起こりそうな時に生じる。
一つの態様において、マーカー又はハプロタイプの存在は、腫瘍又はその前駆体中のChr8q24.21の体細胞再構成(例えば、一つまたはそれより多くの増幅、転座、挿入及び/又は欠失)の素因を示す。体細胞再構成それ自身、続いて前立腺癌のより進行性形態(例えば、より高いグリーソンスコア又はより高い診断段階を反映したより高い組織学的グレード)、前立腺癌の増加した進行(例えば、より高い段階へ)、より悪い結果(例えば、罹患率、合併症又は死に関して)を導くことができる。当該技術分野で公知であるように、グリーソングレードは、正常腺構築物(サイズ、形状及び腺の分化)の損失の程度について前立腺癌を分類するために広く使用されている方法である。
1〜5のグレードが、試験された組織サンプル中に存在する二つの最も主な組織パターンの各々に連続的に帰属され、一緒に足し合わされて合計又は合併グリーソングレード(スケール2〜10)を生じる。高い数字は弱い分化を示し、それ故より進行性の癌を示す。
進行性前立腺癌は、前立腺を超えて増殖し、転移し、そして最終的には患者を殺す癌である。本明細書に記載したごとく、攻撃性の一つの代用尺度は高い合併グリーソングレードである。2〜10のスケール上のグレードが高いほど、患者は進行性疾患を有しているであろう。
本明細書に使用したごとく、及び別に注意しない限り、用語「段階(stage)」は癌(例えば、前立腺癌)のサイズ及び物理的範囲を定義するために使用される。多様な癌を段階分けする一つの方法は、TNM法であり、TNM頭字語において、Tは腫瘍サイズ及び侵襲度(例えば、前立腺中の原発性腫瘍)を表し;Nは節関与(例えば、リンパ節に広がった前立腺癌)に関係し;及びMは転移(遠い部位への伝搬)の存在又は不存在を示す。
本発明はさらに、癌(例えば、前立腺癌)のリスク評価に関し、個体が癌を発生するリスクにあるかどうかを診断することを含んでいる。本発明の多型マーカーは、単独で又は組み合わせて、ならびに他の遺伝的又は非遺伝的リスク因子又はバイオマーカー(例えば、PSA)を含む他の因子と組み合わせて、特定の癌(例えば、前立腺癌)についての個体の評価のために使用し得る。癌を発生するリスクを発生させることに対する個体の素因に影響する多くの因子が当業者には知られており、こうした評価に利用し得る。これらには、限定されるわけではないが、年齢、性、喫煙歴及び喫煙状態、身体活動性、ウエストヒップ外周比、癌の家族歴、以前に診断された癌、肥満、高トリグリセリド血症、低HDLコレステロール、高血圧、血圧上昇、コレステロールレベル、HDLコレステロール、LDLコレステロール、トリグリセリド、アポリポタンパク質AI及びBレベル、フィブリノーゲン、フェリチン、C反応性タンパク質及びロイコトリエンレベルが含まれる。多変量解析又はロジスティック回帰分析を含む、当該技術分野で公知である方法をこうした 全リスク評価に使用し得る。
本発明の方法
癌(例えば、前立腺癌(例えば、進行性前立腺癌)、乳癌、肺癌、黒色腫)への感受性を診断する方法が本明細書に記載されており、本発明に包含される。癌(例えば、前立腺癌(例えば、進行性前立腺癌)、乳癌、肺癌、黒色腫)への感受性を検出するため、対象からのサンプルをアッセイするためのキットも本発明に包含される。
診断及びスクリーニングアッセイ
ある態様において、本発明は、癌対象又は癌に感受性である対象により高頻度で出現する遺伝子マーカーでの特定のアレルを検出することにより、癌又は癌への感受性を診断する又は診断を助ける方法に関する。特定の態様において、本発明は、一つまたはそれより多くの特定の多型マーカー(例えば、本明細書に記載したマーカー又はハプロタイプ)を検出することによる、前立腺癌(例えば、進行性前立腺癌)、乳癌、結腸癌、肺癌及び/又は黒色腫への感受性を診断する方法である。本発明は、特定のマーカー又はハプロタイプの検出が癌(例えば、前立腺癌(例えば、進行性前立腺癌)、乳癌、肺癌、黒色腫)への感受性を示す方法を記載する。こうした予後又は予測的アッセイは、こうした癌に関連する症状の発病に先立って、対象の予防的治療を決定するために使用し得る。
加えて、ある他の態様において、本発明は、癌においてより低い頻度で出現する特定の遺伝子マーカーアレル又はハプロタイプを検出することによる、癌への減少した感受性を診断する、又は診断を助ける方法に関する。特定の態様において、本発明は、一つまたはそれより多くの特定の遺伝子マーカー(例えば、本明細書に記載したマーカー又はハプロタイプ)を検出することにより、前立腺癌(例えば、進行性前立腺癌)、乳癌、肺癌及び/又は黒色腫への感受性を診断する方法である。本発明は、特定のマーカー又はハプロタイプの検出が、減少した癌(例えば、前立腺癌(例えば、進行性前立腺癌)、乳癌、結腸癌、肺癌、黒色腫)への感受性、又は癌に対する保護的マーカー又はハプロタイプを示す方法を記載する。
本明細書に記載した及び例示したごとく、Chr8q24.21 LDブロックC(配列番号1)及びLDブロックC(配列番号2)に関連する特定のマーカー又はハプロタイプ(例えば、ハプロタイプ)は癌(例えば、前立腺癌(例えば、進行性前立腺癌)、乳癌、肺癌、黒色腫)と関係がある。一つの態様において、該マーカー又はハプロタイプは前立腺癌、乳癌、肺癌及び/又は黒色腫への感受性の有意なリスクを与えるものである。別の態様において、本発明は、健常対象(対照)における存在と比較して、癌を有している又は癌が疑われる対象(患者)におけるその存在がより高頻度である、配列番号2(例えば、5A、5B及び5Cに示されたマーカー、及びそれらと連鎖不平衡にあるマーカー)に関連するマーカー又はハプロタイプについてスクリーニングすることによる、対象における癌(例えば、前立腺癌(例えば、進行性前立腺癌)、乳癌、肺癌、黒色腫)への感受性を診断する方法に関する。ある態様において、該マーカー又はハプロタイプは、p値<0.05を有する。他の態様において、関連の有意性は、<0.01、<0.001、<0.0001、<0.00001、0.000001、<0.0000001、<0.00000001又は0.000000001のようなより小さいp値により特徴付けられる。
これらの態様において、該マーカー又はハプロタイプの存在は、癌(例えば、前立腺癌(例えば、進行性前立腺癌)、乳癌、肺癌、黒色腫)への感受性を示す。これらの診断法は、本明細書に記載した、癌に関連しているマーカー又はハプロタイプの存在又は不存在を検出することを含む。本明細書に記載したハプロタイプは、多様な遺伝子マーカー(例えば、SNPs、マイクロサテライト)の組み合わせを含む。特定のハプロタイプを作り上げる特定の遺伝子マーカーの検出は、本明細書に記載した及び/又は当該技術分野で既知の多様な方法により実行し得る。例えば、遺伝子マーカーは、核酸レベルで(例えば、直接ヌクレオチド配列決定により)又は、もし遺伝子マーカーが癌関連核酸(例えば、その配列が配列番号1又は配列番号2に示されている核酸)によりコードされたタンパク質のコード配列に影響するならばアミノ酸レベルで(例えば、タンパク質配列決定により、又はこうしたタンパク質を認識する抗体を使用するイムノアッセイにより)検出し得る。本発明のマーカーアレル又はハプロタイプは、癌(例えば、前立腺癌)と関連するゲノムDNA配列の断片に相当する。こうした断片は、問題とする多型マーカー又は ハプロタイプのDNA配列を包含するが、該マーカー又はハプロタイプと強いLD(連鎖不平衡)にあるDNAセグメントも含む。一つの態様において、こうしたセグメントは、0.2より大きなr2及び/又は|D’|>0.8の値により決定される、該マーカー又はハプロタイプとLDにあるゲノムセグメントを含んでなる。該マーカー又はハプロタイプとLDにあるこうしたセグメントの例は、配列番号1又は配列番号2に示されている。
一つの態様において、癌(例えば、前立腺癌(例えば、進行性前立腺癌)、乳癌、肺癌、黒色腫)への感受性の診断は、サザン分析、ノーザン分析及び/又はインサイツハイブリダイゼーションのようなハイブリダイゼーション法(Current Protocols in Molecular Biology, Ausubel, F. et al, eds., John Wiley & Sons 、すべての補足を含んで、を参照されたい)を使用して達成し得る。ゲノムDNA、RNA又はcDNAの試験対象又は個体からの生物学的サンプル(「試験サンプル」)は癌を有すると疑われた、かかりやすい、又は素因がある対象(「試験対象」)から得られた。対象は成人、小児又は胎児であり得る。該試験サンプルは、血液サンプル、羊水のサンプル、脳脊髄液のサンプル、又は皮膚、筋肉、頬側又は結膜粘膜、胎盤、胃腸管又は他の器官からの組織サンプルのような、ゲノムDNAを含有するいずれかの起源からであり得る。胎児細胞又は組織からのDNAの試験サンプルは、羊水穿刺又は絨毛膜絨毛サンプリングによるような適切な方法により得ることが可能である。次ぎにDNA、RNA又はcDNAサンプルを試験する。特異的マーカーアレルの存在は、該特定のアレルに特異的である核酸プローブの配列特異的ハイブリダイゼーションにより示し得る。特異的マーカーアレル又は特異的ハプロタイプを超える存在は、それぞれが特定のアレルに特異的である、いくつかの配列特異的核酸プローブを使用することにより示し得る。一つの態様において、ハプロタイプは、特定のハプロタイプに特異的である(即ち、該ハプロタイプに特徴的な特異的マーカーアレルを含んでなるDNA鎖に特異的にハイブリダイズする)単一核酸プローブにより示し得る。配列特異的プローブは、ゲノムDNA、RNA又はcDNAへハイブリダイズするように方向付け得る。本明細書で使用される「核酸プローブ」は、相補的配列にハイブリダイズするDNAプローブ又はRNAプローブであり得る。当業者は、特定のアレルが試験サンプルからのゲノムDNA中に存在する場合にのみ配列特異的ハイブリダイゼーションが起こるように、こうしたプローブをどのように設計するのかを承知しているであろう。
癌(例えば、前立腺癌(例えば、進行性前立腺癌)、乳癌、肺癌、黒色腫)への感受性を診断するため、癌関連核酸を含有する試験サンプルと少なくとも一つの核酸プローブを接触させることによりハイブリダイゼーションサンプルを形成させる。mRNA又はゲノムDNAを検出するためのプローブの非制限例は、本明細書に記載したmRNA又はゲノムDNA配列にハイブリダイズすることができる標識核酸プローブである。該核酸プローブは完全長核酸分子、又は例えば、ストリンジェント条件下で適切なmRNA又はゲノムDNAに特異的にハイブリダイズするのに十分である、少なくとも15、30、50、100、250又は500ヌクレオチド長のオリゴヌクレオチドのようなそれらの一部であり得る。例えば、該核酸プローブは配列番号:1のすべて又は一部又は配列番号:2のすべて又は一部であることが可能であり、本明細書に記載したハプロタイプ中に含まれる少なくとも一つのアレルを含んでいてもよく、又は該プローブはこうした配列の相補配列であることが可能である。特定の態様において、該核酸プローブは配列番号:1の一部、又は配列番号:2の一部であり、ハプロタイプ中に含まれる少なくとも一つのアレルを含んでいてもよく、又は該プローブはこうした配列の相補配列であり得る。本発明の診断アッセイに使用するための他の適したプローブは本明細書に記載されている。
ハイブリダイゼーションは当業者には公知の方法により実施し得る(例えば、Current Protocols in Molecular Biology,Ausubel、 F. et al.、 eds., John Wiley & Sons、 including all supplements、すべての補足を含んで、を参照されたい)。一つの態様において、ハイブリダイゼーションは特異的ハイブリダイゼーション、即ち、ミスマッチのないハイブリダイゼーション(正確なハイブリダイゼーション)を指す。一つの態様において、特異的ハイブリダイゼーションのためのハイブリダイゼーション条件は高ストリンジェンシーである。
特異的ハイブリダイゼーションは、もし存在するならば、標準法を使用して検出される。もし特異的ハイブリダイゼーションが、該核酸プローブと試験サンプル中の核酸との間で起こったら、該サンプルは、該核酸プローブ中に存在するヌクレオチドに相補的であるアレルを含有する。該プロセスは、本発明のいずれのマーカー、本発明のハプロタイプを作り上げるマーカーについても繰り返すことができ、一つまたはそれより多くのマーカーアレルを検出するために複数のプローブを同時に使用し得る。特定のハプロタイプの一つより多くのマーカーアレルを含有する単一プローブ(例えば、特定のハプロタイプを作り上げる2、3、4、5又はすべてのマーカーに相補的なアレルを含有するプローブ)を設計することが可能である。該サンプル中のハプロタイプ特定のマーカーの検出は、サンプルの起源が特定のハプロタイプ(例えば、一つのハプロタイプ)を有し、それ故、癌(例えば、前立腺癌)へ感受性であることを示す。
一つの好ましい態様において、一つの方法は、Kutyavin et al.,(Nucleic Acids Res. 34:e128 (2006))により記載されているように、
蛍光部分を3’末端に、及びクエンチャーを5’末端に、及びエンハンサーオリゴヌクレオチドを含んでなるオリゴヌクレオチドプローブの検出を利用する。該蛍光成分はGig Harbor Green又はYakima Yellow 又は他の適した蛍光成分であり得る。該検出プローブは、検出されるべきSNP多型を含む短い核酸配列へハイブリダイズするように設計されている。好ましくは、該SNPは末端残基から検出プローブの3’末端から6残基の間のいずれかにある。該エンハンサーは、検出プローブに関して3’のDNA鋳型へハイブリダイズする短いオリゴヌクレオチドプローブである。該プローブは、検出プローブ及びエンハンサーヌクレオチドプローブの両方が鋳型に結合された場合、両者間に単一ヌクレオチドギャップが存在するように設計されている。該ギャップは、エンドヌクレアーゼIVのようなエンドヌクレアーゼにより認識される合成塩基脱落部位を創造する。該酵素は、完全に相補的な検出プローブの染料を切断するが、ミスマッチを含有する検出プローブを切断できない。それ故、放出された蛍光部分の蛍光を測定することにより、検出プローブの核酸配列により規定された特定のアレルの存在の評価を実施し得る。
検出プローブはどのようなサイズでもよいが、好ましくは、該プローブは比較的短い。一つの態様において、該プローブは5〜100ヌクレオチド長である。別の態様において、該プローブは10〜50ヌクレオチド長である。別の態様において、該プローブは12〜30ヌクレオチド長である。該プローブの他の長さも可能であり、当業者の範囲内である。
好ましい態様において、SNP多型を含有する該DNA鋳型は、検出に先立ってポリメラーゼ連鎖反応(PCR)により増幅される。こうした態様において、該増幅されたDNAは、該検出プローブ及び該エンハンサープローブのための鋳型として働く。
該検出プローブ、該エンハンサープローブ及び/又はPCRによる鋳型の増幅に使用されたプライマーのある種の態様は、修飾A及び修飾Gを含む修飾塩基の使用を含む。修飾塩基の使用は、鋳型DNAに対するヌクレオチド分子(プローブ及び/又はプライマー)の融点を調節するために、例えば、低パーセンテージのG又はCを含有する領域の融点を上昇させるために(その相補的Tと三つの水素結合を形成する能力を有する修飾Aを使用し得る)、又は高パーセンテージのG又はCを含有する領域の融点を低下させるために(例えば、二本鎖DNA分子中で、その相補的Cと二つの水素結合しか形成しない修飾G塩基を使用することにより)、有用であり得る。好ましい態様において、修飾塩基は、検出ヌクレオチドプローブの設計に使用される。当業者には既知のいずれの修飾塩基もこれらの方法において選択することができ、適した塩基の選択は、本明細書の教示に基づくと当業者の範囲内であり、及び当業者には公知のように既知の塩基が商業的供給源から入手可能である。
別のハイブリダイゼーション法において、ノーザン分析 (Current Protocols in Molecular Biology, Ausubel、F. et al., eds., John Wiley & Sons 、上記文献、を参照されたい) を、癌に関連する多型の存在又は癌への感受性(例えば、前立腺癌(例えば、進行性前立腺癌)、乳癌、肺癌、黒色腫)を同定するために使用する。ノーザン分析のためには、適切な手段により対象からRNAの試験サンプルを得る。本明細書に記載したごとく、対象からのRNAへの核酸プローブの特異的ハイブリダイゼーションは、プローブに相補的な特定のアレルを示す。核酸プローブの使用の代表的な例は、例えば、米国特許番号5,288,611及び4,851,330を参照されたい。
さらに、又はもしくは、ペプチド核酸(PNA)プローブを、本明細書に記載したハイブリダイゼーション法の核酸プローブに加えて、又は代わりに使用し得る。PNAは、N−(2−アミノエチル)グリシンユニットのような、ペプチド様無機主鎖を有し、メチレンカルボニルリンカーを介して該グリシン窒素に有機塩基(A、G、C、T又はU)が結合されているDNA模倣物である(例えば、Nielsen, P., et al, Bioconjug. Chem. 5:3-7(1994) を参照されたい) 。PNAプローブは、癌(例えば、前立腺癌(例えば、進行性前立腺癌)、乳癌、肺癌、黒色腫)に関連するハプロタイプの一つまたはそれより多くの遺伝子マーカーを含有すると疑われるサンプル中の分子に特異的にハイブリダイズするように設計し得る。PNAプローブのハイブリダイゼーションは、癌又は癌への感受性を診断するものである。
本発明の一つの態様において、対象から得られたゲノムDNAを含有する試験サンプルが集められ、本発明の一つまたはそれより多くのマーカー又はハプロタイプを含んでなる断片を増幅するためポリメラーゼ連鎖反応(PCR)が使用される。本明細書に記載したように、癌に関連する特定のアレル又はハプロタイプマーカーの同定は種々の方法(例えば、配列分析、制限消化による分析、特異的ハイブリダイゼーション、一本鎖コンホメーション多型アッセイ(SSCP)、電気泳動分析など)により達成し得る。別の態様において、診断は定量的PCR(動力学的熱サイクリング)を使用する発現分析により達成される。この技術は、例えば、TaqMan(登録商標)(Applied Biosystems、 Foster City、 CA) のような商業的に入手可能な技術を利用することができる。該技術は、癌に関連する核酸(例えば、その配列が配列番号1又は配列番号2に示された配列すべて又は断片を含んでなる核酸)によりコードされているポリペプチドの発現又は組成又はスプライシング変異体(単数又は複数)の発現の変化の存在を評価し得る。さらに、変異体(単数又は複数)の発現を物理的に又は機能的に異なったものとして定量し得る。
本発明の別の方法において、もしアレルが基準配列と比べて制限部位の創造又は除去を生じていたら、制限消化による分析を、特定のアレルを検出するために使用し得る。ゲノムDNAを含有する試験サンプルは対象から得ることが可能である。試験対象からの試験サンプル中の、配列番号1又は配列番号2の特定の領域を増幅するためにPCRを使用し得る。例えば、Current Protocols in Molecular Biology、上記文献、に記載されている、制限断片長多型(RFLP)分析を実行し得る。関連DNA断片の消化パターンは、サンプル中の特定のアレルの存在又は不存在を示す。
配列分析も使用することができ、配列番号1又は配列番号2に関連する多型部位での特異的アレルを検出する。それ故、一つの態様において、特定のマーカーアレル又はハプロタイプの存在又は不存在の決定は、対象又は個体から得たDNA又はRNAの試験サンプルの配列分析を含んでなる。PCR又は他の適切な方法を配列番号1又は配列番号2の一部を増幅するために使用することができ、そして特異的アレルの存在を、サンプル中のゲノムDNAの多型部位(又は、もしくはハプロタイプ中の多くの多型部位)を配列決定することにより直接的に検出し得る。
アレル特異的オリゴヌクレオチドも、増幅されたオリゴヌクレオチドとアレル特異的オリゴヌクレオチド(ASO)プローブのドット−ブロットハイブリダイゼーションの使用を介して、癌に関連する多型部位での特定のアレルの存在を検出するために使用し得る(例えば、Saiki、 R. et al、 Nature、 324:163-166 (1986)を参照されたい) 。「アレル特異的オリゴヌクレオチド」(「アレル特異的オリゴヌクレオチドプローブ」とも称される)は、配列番号1又は配列番号2の領域に特異的にハイブリダイズし、多型部位(例えば、本明細書に記載した多型)に特異的アレルを含む、およそ10〜50塩基対又はおよそ15〜30塩基対のオリゴヌクレオチドである。配列番号1又は配列番号2に関連する一つまたはそれより多くの特定の多型に特異的であるアレル特異的オリゴヌクレオチドプローブは、標準法を使用して製造し得る(例えば、Current Protocols in Molecular Biology、 上記文献、を参照されたい) 。PCRを、配列番号1又は配列番号2の所望の領域を増幅するために使用し得る。増幅されたLDブロックC領域を含有するDNAは、標準法を使用してドット−ブロットすることができ(例えば、Current Protocols in Molecular Biology、 上記文献、を参照されたい) 、該ブロットを該オリゴヌクレオチドと接触させ得る。増幅された領域への該プローブの特異的ハイブリダイゼーションの存在を次ぎに検出し得る。対象からのDNAへのアレル特異的オリゴヌクレオチドプローブの特異的ハイブリダイゼーションは、癌に関連する多型部位での特異的アレルを示す(例えば、Gibbs, R. et al., Nucleic Acids Res., 17:2437-2448 (1989)及びWO93/22456 を参照されたい)。
ロックト核酸(LNA)のような類似体の添加により、プライマー及びプローブのサイズをわずか8塩基に減少させ得る。LNAは二環式DNA類似体の新規クラスであり、フラノース環の2’及び4’位がO−メチレン(オキシLNA)、S−メチレンチオLNA)又はアミノメチレン(アミノLNA)部分により結合されている。これらLNA変異体のすべてに共通していることは、相補的核酸に対する親和性であり、DNA類似体について報告されている中で飛び抜けて高いことである。例えば、特定のすべてのオキシLNA九量体は、対応するDNA九量体についてDNA及びRNAの両方が28℃であるのに対し、相補的DNA又はRNAと複合体形成した場合、それぞれ64℃及び74℃の融解温度(Tm)を有することが示されている。Tmの実質的な増加は、LNAの単量体が標準DNA又はRNA単量体と組み合わせて使用された場合にも得られる。プライマー及びプローブについては、どこにLNA単量体が含まれているかに依存して(例えば、3’末端、5’末端又は中央)、Tmをかなり上昇させることができた。
別の態様において、対象からの標的核酸配列セグメントに相補的であるオリゴヌクレオチドプローブのアレイを、癌関連核酸中の多型を同定するために使用し得る。例えば、オリゴヌクレオチドアレイを使用し得る。オリゴヌクレオチドアレイは典型的には、異なった既知の位置で基質の表面に結合する複数の異なったオリゴヌクレオチドプローブを含んでなる。「Genechips(商標)」とも記述されているこれらのオリゴヌクレオチドアレイは、当該技術分野で一般的に記載されている(例えば、米国特許番号5,143,854、PCT特許出願番号WO90/15070及び92/10092を参照されたい)。これらのアレイは一般的には、機械的合成法又は光リソグラフ法及び固相オリゴヌクレオチド合成を取り込んだ光指向(light directed)合成法を使用して製造される(Fodor,S. et al., Science,251:767-773 (1991);Pirrung et al., 米国特許番号5,143,854(公開PCT出願番号WO90/15070も参照されたい);及びFodor. S. et al., 公開PCT出願番号WO92/10092 及び米国特許番号5,424,186 、これらの各々の全教示が本明細書において援用される) 。機械的合成法を使用したこれらのアレイの合成のための技術については、例えば、米国特許番号5,384,261 (その全教示が本明細書において援用される)に記載されている。別の例においては、リニアアレイを利用し得る。
オリゴヌクレオチドアレイが製造されたら、目的の核酸を該アレイとハイブリダイズさせる。ハイブリダイゼーションの検出は、目的の核酸中の、特定のアレルの検出である。ハイブリダイゼーション及びスキャニングは一般に本明細書に記載した、及び、例えば、公開PCT出願番号WO92/10092及びWO95/11995及び米国特許番号5,424,186 (各々の全教示は本明細書において援用される)にも記載されている方法により実施する。簡単には、一つ又はそれ以上の以前に同定された多型マーカーを含む標的核酸配列を公知の増幅技術(例えば、PCR)により増幅する。典型的には、このことは、多型部位からの標的配列の二つの鎖(上流及び下流の両方)に相補的であるプライマー配列の使用を含む、非対称PCR技術も使用し得る。一般には標識を取り込んでいる増幅された標的を次ぎに、配列特異的ハイブリダイゼーションを可能にする適切な条件下、アレイとハイブリダイズさせる。アレイのハイブリダイゼーション及び洗浄が完了したら、アレイをスキャンし、標的配列がハイブリダイズしたアレイ上の位置を決定する。該スキャンから得られたハイブリダイゼーションデータは、典型的にはアレイ上の位置の関数としての蛍光強度の形態である。
主として、例えば、単一多型部位の検出のための単一検出ブロックに関して記載したけれども、アレイは多重検出ブロックを含むことが可能であり、そしてそれ故、多重特異的多型(例えば、特定のハプロタイプの多くの多型(例えば、一つのハプロタイプ))を分析し得る。別の配置において、アレイへの標的のハイブリダイゼーション間に使用することが可能な最適条件を変動できるように、検出ブロックを単一アレイ又は多重分離アレイにグループ化し得る。例えば、A−T富化セグメントに含まれるものから切り離されたゲノム配列のG−C富化ストレッチに含まれる多型の検出を提供することがしばしば望まれるであろう。このことは、各状況についての別々のハイブリダイゼーション条件の最適化を可能にする。
多型の検出のためのオリゴヌクレオチドアレイの使用の追加の記述は、例えば、米国特許番号5,858,659 及び5,837,832 (両方の全教示が本明細書において援用される)に見ることができる。
核酸分析の他の方法が癌に関連する多型(例えば、その核酸配列が配列番号1及び配列番号2に示された配列により表される、Chr8q24.21上のゲノムセグメントに関連する多型部位)での特定のアレルを検出するために使用し得る。代表的な方法には、例えば、直接マニュアルシークエンシング(Church and Gilbert, Proc. Natl. Acad. Sci. USA, 81: 1991-1995 (1988);Sanger, F.,et al., Proc.Natl.Acad.Sci.USA,74:5463-5467(1977);Beavis、 et al.,米国特許番号5,288,644);自動化蛍光シークエンシング;一本鎖コンホメーション多型アッセイ(SSCP);クランプト変性ゲル電気泳動(CDGE);変性剤濃度勾配ゲル電気泳動(DGGE)(Sheffield, V., et al., Proc. Natl. Acad. Sci. USA, 86:232-236 (1989))、移動度シフト分析 (Orita, M., et al., Proc. Natl Acad. Sci. USA, 86:2766- 2770 (1989))、制限酵素分析 (Flavell, R., et al, Cell, 15:25-41 (1978); Geever, R., et al, Proc. Natl. Acad. Sci. USA, 78:5081-5085 (1981));ヘテロ二重鎖分析;化学ミスマッチ切断(CMC) (Cotton, R., et al, Proc. Natl Acad. Sci USA, 85:4397-4401 (1985));RNase保護アッセイ (Myers, R., et al, Science, 230:1242-1246 (1985)) ;大腸菌mutSタンパク質のようなヌクレオチドミスマッチを認識するポリペプチドの使用;及びアレル特異的PCRが含まれる。
本発明の別の態様において、癌又は癌への感受性(例えば、前立腺癌(例えば、進行性前立腺癌)、乳癌、肺癌、黒色腫)の診断は、癌関連核酸によりコードされたポリペプチドの発現及び/又は組成を試験することによって行うことができ、これらの例において、本明細書に記載した遺伝子マーカー(単数又は複数)又はハプロタイプはポリペプチドの組成又は発現に変化をもたらす。それ故、癌への感受性(例えば、前立腺癌(例えば、進行性前立腺癌)、乳癌、肺癌、黒色腫)の診断は、これらのポリペプチドの一つ、又は癌関連核酸によりコードされた別のポリペプチドの発現及び/又は組成を試験することにより行うことができ、これらの例において、本明細書に記載した遺伝子マーカー又はハプロタイプはポリペプチドは、ポリペプチドの組成又は発現に変化をもたらす。癌への関連を示す本明細書に記載したハプロタイプ又はマーカーは、これらの近隣の遺伝子の一つまたはそれより多くに、その効果を介して関与することができる。これらの遺伝子に影響することが可能な機構には、例えば、転写への影響、RNAスプライシングへの影響、mRNAの別のスプライス形の相対量の変化、RNA安定性への影響、核から細胞質への輸送に対する影響、及び翻訳の効率及び正確さに対する影響が含まれる。
Chr8q24.21上のc−myc遺伝子は、トリ骨髄球腫症レトロウイルスのウイルス癌遺伝子v−mycの細胞性対応物として20年以上前に同定されたc−MYCタンパク質をコードする(Vennstrom et al., J. Virology 42:113-19 (1982)) 。c−MYCタンパク質は、分裂促進刺激による細胞の処置で迅速に誘導される転写因子である。c−MYCはMAXと称されるタンパク質とのヘテロ二量体複合体中のEボックス(CACGTG)と結合することにより多くの遺伝子の発現を調節する。c−MYCにより調節されている多くの遺伝子は細胞周期制御に関与している。c−MYCは細胞周期進行を促進し、細胞分化を抑制し及びアポトーシスを誘導する。c−MYCは二本鎖DNA修復に対して負の効果も有している(Karlsson, A, et al., Proc. Natl. Acad. Sci. USA 100(17): 9974-79 (2003)) 。c−MYCは血管新生も促進する(Ngo, C.V., et al, Cell Growth Differ. 11(4):2O1-10(2000); Baudino T.A., et al, Genes Dev. 16(19):2530-43 (2002)) 。
c−myc遺伝子はインビトロ及びインビボで高度に腫瘍発生的である。c−MYCはBCL、BCL−XLのようなアポトーシスを抑制するタンパク質と、又はトランスジェニックマウスのリンパ腫発生におけるp53又はARFの喪失に協力する(Strasser et al, Nature 348:331-333 (1990); Blyth, K., et al., Oncogene 10:1717-23 (1990); Elson、 A., et al., Oncogene 11:181-90 (1995); Eischen, CM., et al、 Genes Dev. 13:2658-69 (1999)) 。
c−myc遺伝子の増幅及び過剰発現は前立腺癌で観察され、進行性腫瘍、ホルモン非依存性及び予後不良としばしば関連している(Jenkins, R.B., et al, Cancer Res. 57(3):524-3l (1997); El Gedaily, A., et al, Prostate 46(3):l84-90 (2001); Saramaki, O., et al, Am. J. Pathol. 159(6):2089-94 (2001); Bubendorf、 L., et al.,Cancer Res. 59(4):803-06 (1999)) 。c−myc及びChr8q24.21領域は前立腺、乳及び及び肺癌及び黒色腫においてさらに増している(Blancato J., et al., Br. J. Cancer 90(8): 1612-9 (2004); Kubokura, H., et al., Ann. Thorac. Cardiovasc. Surg. 7(4):197-203 (2001); Treszl, A., et al, Cytometry 60B(l):37-46 (2004); Kraehn, G.M., et al, Br. J. Cancer 84(1):72-79 (2001)) 。加えて、多くの他の腫瘍タイプはこの領域の獲得を示しており、結腸、肝臓、卵巣、胃、腸管及び膀胱癌が含まれる。すべての腫瘍タイプをまとめると、Chr8q24.21は最も頻繁に獲得される染色体領域であり、すべての腫瘍タイプのおよそ17%で獲得されている(www.progenetix.com) 。
c−mycを免疫グロブリンエンハンサーに並置し、それにより該遺伝子の発現を活性化する転座の結果として、癌遺伝子はバーキットリンパ腫に関与する(Dalla-Favera, R., et al, Proc. Natl. Acad. Sci USA 79(24:7824-27(1982); Taub, R., et al, Proc. Natl. Acad. Sci. USA 79(24):7837-41 (1982))。それは、該遺伝子の近くへのヒトパピローマウイルス(HPV)組込みによる子宮頚部癌にも関与する。ほとんどのケースにおいて、HPV組込みは、c−myc遺伝子の500kb動原体及び200kbテロメアにまたがる領域で生じる(Ferber, J.M.,et al., Cancer Genetics CytoGenetics 154:1-9 (2004); Ferber, M.J., et al., Oncogene 22:7233-7242 (2003)) 。
二つの脆弱な部位FRA8C及びFRA8Dが、それぞれChr8q24.21のc−mycの動原体及びテロメアにある。脆弱な部位は、DNA合成を停止させる剤の存在下で破損しがちである。脆弱な部位の複製は、S期の後期及び誘導事象後に起こると考えられている。染色体増幅、転座及び/又はウイルス挿入における脆弱な部位の関与は、これらの部位の遅い複製及び破壊が複製フォークの停止で又は近接して開始されることに関係する (Hellman, A., et al,Cancer Cell 1 : 89-97(2002)) 。
LDブロックC(配列番号1)又はLDブロックC’(配列番号2)内の、又はLDブロックC(配列番号1)又はLDブロックC’(配列番号2)と強いLD(0.2を超えるr2及び/又は|D’|>0.8により測定される)にある本明細書に記載したマーカー又はハプロタイプはc−myc遺伝子及び他の近傍の遺伝子の遺伝子増幅を導く領域の安定性に影響することができることも可能である。即ち、人は配列番号1又は配列番号2に示された領域の特定の変異体形を一人又は両方の親から受け継ぐことができ、及びそれにより一つまたはそれより多くの細胞において体細胞突然変異事象を後で有する可能性が高くなり、より攻撃的形態への癌の進行を導いている。それ故、一つの態様において、本発明のマーカー又はハプロタイプ(例えば、配列番号2又は配列番号1に関連するマーカー又はハプロタイプ)の同定は、より攻撃的形態への癌の進行を導き得る体細胞突然変異事象への感受性を診断するために使用することができる。
一つの態様において、該マーカー又はハプロタイプは、c−myc読み取り枠(即ち、NCBI Build 34中のchr8:128,705,092〜128,710,260bp)内に位置しているマーカーを含んでいない。別の態様において、該マーカー又はハプロタイプは、c−mycプロモーター又は読み取り枠内に位置しているマーカーを含んでいない。さらに別の態様において、該マーカー又はハプロタイプは、c−mycプロモーター、エンハンサー又は読み取り枠内に位置しているマーカーを含んでいない。さらに別の態様において、該マーカー又はハプロタイプは、c−myc読み取り枠の1kb、2kb、5kb、10kb、15kb、20kb又は25kb以内に位置しているマーカーを含んでいない。
酵素連結免疫吸着アッセイ(ELISA)、ウェスタンブロット、免疫沈降及び免疫蛍光を含む多様な方法をこうした検出を行うために使用し得る。対象からの試験サンプルは、Chr8q24.21関連核酸及び/又はLDブロックC(配列番号1)又はLDブロックC’(配列番号2)関連核酸によりコードされたポリペプチドの発現の変化及び/又は組成の変化の存在について評価される。こうした核酸によりコードされたポリペプチドの発現における変化は、例えば、定量的ポリペプチド発現(即ち、産生されたポリペプチドの量)であろう。該核酸によりコードされたポリペプチドの組成における変化は、定量的ポリペプチド発現(突然変異体ポリペプチドの又は異なったスプライシング変異体の発現)である。一つの態様において、癌(例えば、前立腺癌(例えば、進行性前立腺癌)、乳癌、結腸癌、肺癌、黒色腫)への感受性の診断は、本明細書に記載した癌関連核酸(例えば、Chr8q24.21関連核酸、LDブロックC(配列番号1)関連核酸及び/又はLDブロックC’(配列番号2)関連核酸)によりコードされた特定のスプライシング変異体、又はスプライシング変異体の特定のパターンを検出することにより行われる。
こうした変化の両方(定量的及び定性的)が存在し得る。本明細書で使用されるポリペプチド発現又は組成における「変化」とは、対照サンプル中のポリペプチドの発現又は組成と比較して、試験サンプル中のポリペプチドの発現又は組成の変化を指す。対照サンプルは、試験サンプルに対応するサンプル(例えば、同一タイプの細胞から)であり、及び癌に罹患していない及び/又は癌への感受性を有していない対象(例えば、本明細書に記載したマーカー又はハプロタイプを有していない対象)からのものである。同様に、対照サンプルと比較して、試験サンプル中の一つ又はそれ以上の異ったスプライシング変異体の存在、又は試験サンプル中の異なったスプライシング変異体の有意に異なった量での存在は、癌への感受性(例えば、前立腺癌(例えば、進行性前立腺癌)、乳癌、結腸癌、肺癌、黒色腫)を示し得る。対照サンプルと比較して、試験サンプル中のポリペプチドの発現又は組成における変化は、変異体が対照サンプル中の基準に関連したスプライス部位を変化させている例においては、特異変異体(例えば、アレル又はハプロタイプマーカー)を示す。核酸によりコードされたポリペプチドの発現又は組成を試験する多様な手段が当業者には知られ、及び使用することができ、分光法、比色分析法、電気泳動法、等電点電気泳動及びイムノブロッティングのような免疫アッセイ(例えば、David et al., 米国特許番号4,376,110)が含まれる(例えば、Current Protocols in Molecular Biology, 特に10章 、上記文献、を参照されたい)。
例えば、一つの態様において、本明細書に記載した癌に関連する核酸によりコードされたポリペプチドに結合することが可能である抗体(例えば、検出可能な標識を有する抗体)を使用し得る。抗体はポリクローナルでもモノクローナルでもよい。無傷の抗体、又はそれらの断片(例えば、Fv、Fab、Fab',F(ab')2)を使用し得る。プローブ又は抗体に関する用語「標識された」とは、プローブ又は抗体へ検出可能物質をカップリング(即ち、物理的連結)させることによるプローブ又は抗体の直接標識化、ならびに直接的に標識された別の試薬との反応性によるプローブ又は抗体の間接標識を包含することが意図される。間接標識の例には、標識二次抗体(例えば、蛍光標識二次抗体)を使用する一次抗体の検出、及び蛍光性標識ストレプトアビジンで検出できるような、ビオチンによるDNAプローブの末端標識が含まれる。
この方法の一つの態様において、試験サンプル中の癌関連核酸によりコードされたポリペプチドのレベル又は量が、対照サンプル中の該ポリペプチドのレベル又は量と比較される。対照サンプル中のポリペプチドのレベル又は量よりも高い又は低い試験サンプル中のポリペプチドのレベル又は量(相違が統計的に有意であるような)は、該核酸によりコードされたポリペプチドの発現における変化を示し、発現に相違を起こすことの原因となる特定のアレルについての診断である。もしくは、試験サンプル中の該ポリペプチドの組成が対照サンプル中の該ポリペプチドの組成と比較される。別の態様において、該ポリペプチドのレベル及び量の両方を試験サンプル中及び対照サンプル中で評価し得る。
別の態様において、癌(例えば、前立腺癌(例えば、進行性前立腺癌)、乳癌、結腸癌、肺癌、黒色腫)への感受性の診断は、追加のタンパク質に基づいた、RNAに基づいた、又はDNAに基づいたアッセイ(例えば、限定されるわけではないが、PSAアッセイ、癌胎児性抗原(CEA)アッセイ、BRCA1アッセイ、BRCA2アッセイを含む他の癌診断アッセイ)と組み合わされた、本発明の少なくとも一つのマーカー又はハプロタイプ(例えば、表5A、5B及び5Cに示されたマーカー及びそれらと連鎖不平衡にあるマーカー又はハプロタイプ)を検出することにより行われる。こうした癌診断アッセイは当該技術分野では公知であり、当業者には公知である癌についての他の遺伝的リスク因子も含まれる。本発明の方法は、対象の家族履歴及びリスク因子(例えば、環境リスク因子、生活習慣リスク因子)の分析と組み合わせても使用し得る。
当該技術分野で公知のように、及び本明細書に記載されているように、PSA試験が前立腺癌の早期診断を助けてきたが、それは高感度でもそして特異的でもない(Punglia et al., N. Engl. J. Med. 349(4):335-42 (2003)) 。従って、PSA試験単独では、多くの癌の見逃し及び癌のない対象の不必要な続いてのバイオプシーの両方を生じる、高いパーセンテージの偽陰性及び偽陽性診断を導く。一つの態様において、前立腺癌又は前立腺癌への感受性の診断は、PSAアッセイと組み合わせて、少なくとも一つのChr8q24.21関連アレル及び/又はLDブロックC関連アレルを検出することにより行われる。
キット
本発明の方法に有用なキットは、例えば、ハイブリダイゼーションプローブ、制限酵素(例えば、RFLP分析)、アレル特異的オリゴヌクレオチド、本明細書に記載した核酸(例えば、本発明の少なくとも一つの多型マーカー及び/又はハプロタイプを含んでなるゲノムセグメント)によりコードされた変化したポリペプチド、又は本明細書に記載した本発明の核酸によりコードされた変化していない(天然の)ポリペプチドに結合する抗体、を含む本明細書に記載したいずれかの方法、癌と関連する核酸の増幅のための手段、癌と関連する核酸の核酸配列を分析するための手段、癌と関連する核酸によりコードされたポリペプチドのアミノ酸配列を分析するための手段、その他、に有用な成分を含んでなる。該キットは、例えば、必要な緩衝液、本発明の核酸(例えば、一つ又はそれ以上の癌に関連した多型マーカー、例えば、表5A、5B及び5Cに示されたマーカーセット)を増幅するための核酸プライマー、及びこうしたプライマー及び必要な酵素(例えば、DNAポリメラーゼ)を使用して増幅された断片のアレル特異的検出のための試薬を含んでいる。加えて、キットは、本本発明の方法と組み合わせて使用されるべきアッセイのための試薬、例えば、他の癌診断アッセイで使用するための試薬を提供し得る。
一つの態様において、本発明は対象における特定の癌(例えば、前立腺癌(例えば、進行性前立腺癌)、肺癌、結腸癌、乳癌、黒色腫)又は癌(例えば、前立腺癌、肺癌、結腸癌、乳癌、黒色腫)への感受性の検出を助けるため、対象からのサンプルをアッセイするためのキットであり、該キットは、個体のゲノム中の、本発明の少なくとも一つの多型の少なくとも一つのアレルを選択的に検出するために必要な試薬を含んでなる。特定の態様において、該試薬は、少なくとも一つの本発明の多型を含んでなる個体のゲノムの断片にハイブリダイズする、少なくとも一つの近接するオリゴヌクレオチドを含んでなる。別の態様において、該試薬は、対象から得られたゲノムセグメントの反対鎖にハイブリダイズする少なくとも一つの対のオリゴヌクレオチドを含んでなり、各オリゴヌクレオチドプライマー対は、少なくとも一つの多型を含む個体のゲノムの断片を選択的に増幅するように設計されており、該多型は、表5A、5B及び5Cに示された多型、及びそれらと連鎖不平衡にある多型マーカーから成る群より選択される。さらに別の態様において、該断片は少なくとも20塩基対のサイズである。こうしたオリゴヌクレオチド又は核酸(例えば、オリゴヌクレオチドプライマー)は、癌を示す多型(例えば、SNP又はマイクロサテライト)に隣接する核酸配列の一部を使用して設計し得る。別の態様において、該キットは、癌に関連する一つ又はそれ以上の特異的多型マーカー又はハプロタイプのアレル特異的検出が可能な一つ又はそれ以上の標識核酸、及び標識を検出するための試薬を含んでなる。適した標識には、例えば、放射性同位元素、蛍光標識、酵素標識、酵素補因子標識、磁気標識、スピン標識、エピトープラベルが含まれる。
特定の態様において、本キットの試薬により検出されるべき多型マーカー又はハプロタイプは、表5A、表5B及び表5Cに示されたマーカーから成る群より選択される一つ又はそれ以上のマーカー、二つ又はそれ以上のマーカー、三つ又はそれ以上のマーカー、四つ又はそれ以上のマーカー、五つ又はそれ以上のマーカーを含んでなる。別の態様において、検出されるべきマーカー又はハプロタイプは、表4A及び表4Bに示されたマーカーを含んでなる。別の態様において、検出されるべきマーカー又はハプロタイプは、表4A及び表4Bにリストしたマーカーから成る群の少なくとも一つに、0.2より大きなr2の値により定義される強い連鎖不平衡にあるマーカーの群からの少なくとも一つのマーカーを含んでなる。好ましい態様において、検出されるべきマーカー又はハプロタイプはrs16901979及びそれと連鎖不平衡にあるマーカーを含んでなる。別の好ましい態様において、検出されるべきマーカー又はハプロタイプは、HapC(rs1456314アレルG、rs17831626アレルT、rs7825414アレルG、rs6993569アレルG、rs6994316アレルA、rs6470494アレルT、rs1016342アレルC、rs1031588アレルG、rs1016343アレルT、rs1551510アレルG、rs1456306アレルC、rs1378897アレルG、rs1456305アレルT、及びrs7816535アレルG)を含んでなる。
一つの好ましい態様において、本発明のマーカーを検出するためのキットは、検出されるべきSNP多型を鋳型DNAのセグメントにハイブリダイズする検出オリゴヌクレオチドプローブ、エンハンサーオリゴヌクレオチドプローブ及びエンドヌクレアーゼを含んでなる。上で説明したように、該検出オリゴヌクレオチドプローブは、蛍光成分又は基を3’末端に、及びクエンチャーをその5’末端に含んでなり、及びKutyavin et al. (Nucleic Acids Res. 34:e128 (2006))に記載されているエンハンサーオリゴヌクレオチドが用いられている。該蛍光成分はGig Harbor Green又はYakima Yellow 又は他の適した蛍光成分であり得る。該検出プローブは、検出されるべきSNP多型を含む短い核酸配列へハイブリダイズするように設計されている。好ましくは、該SNPは末端残基から検出プローブの3’末端から6残基の間のいずれかにある。該エンハンサーは、検出プローブに関して3’のDNA鋳型へハイブリダイズする短いオリゴヌクレオチドプローブである。該プローブは、検出プローブ及びエンハンサーヌクレオチドプローブの両方が鋳型に結合された場合、両者間に単一ヌクレオチドギャップが存在するように設計されている。該ギャップは、エンドヌクレアーゼIVのようなエンドヌクレアーゼにより認識される合成塩基脱落部位を創造する。該酵素は、完全に相補的な検出プローブの染料を切断するが、ミスマッチを含有する検出プローブを切断できない。それ故、放出された蛍光部分の蛍光を測定することにより、検出プローブの核酸配列により規定された特定のアレルの存在の評価を実施し得る。
検出プローブはどのようなサイズでもよいが、好ましくは、該プローブは比較的短い。一つの態様において、該プローブは5〜100ヌクレオチド長である。別の態様において、該プローブは10〜50ヌクレオチド長である。別の態様において、該プローブは12〜30ヌクレオチド長である。該プローブの他の長さも可能であり、当業者の範囲内である。
好ましい態様において、SNP多型を含有する該DNA鋳型は、検出に先立ってポリメラーゼ連鎖反応(PCR)により増幅され、そしてこうした増幅のためのプライマーは、該試薬キットに含まれている。こうした態様において、該増幅されたDNAは、該検出プローブ及び該エンハンサープローブのための鋳型として働く。
好ましい態様において、SNP多型を含有する該DNA鋳型は、検出に先立ってポリメラーゼ連鎖反応(PCR)により増幅される。こうした態様において、該増幅されたDNAは、該検出プローブ及び該エンハンサープローブのための鋳型として働く。
該検出プローブ、該エンハンサープローブ及び/又はPCRによる鋳型の増幅に使用されたプライマーのある種の態様は、修飾A及び修飾Gを含む修飾塩基の使用を含む。修飾塩基の使用は、鋳型DNAに対するヌクレオチド分子(プローブ及び/又はプライマー)の融点を調節するために、例えば、低パーセンテージのG又はCを含有する領域の融点を上昇させるために(その相補的Tと三つの水素結合を形成する能力を有する修飾Aを使用し得る)、又は高パーセンテージのG又はCを含有する領域の融点を低下させるために(例えば、二本鎖DNA分子中で、その相補的Cと二つの水素結合しか形成しない修飾G塩基を使用することにより)、有用であり得る。好ましい態様において、修飾塩基は、検出ヌクレオチドプローブの設計に使用される。当業者には既知のいずれの修飾塩基もこれらの方法において選択することができ、適した塩基の選択は、本明細書の教示に基づくと当業者の範囲内であり、及び当業者には公知のように既知の塩基が商業的供給源から入手可能である。
こうした態様の一つにおいて、該マーカー又はハプロタイプの存在は、癌(例えば、前立腺癌(例えば、進行性前立腺癌)、肺癌、結腸癌、乳癌、黒色腫)への感受性(増加した感受性又は減少した感受性)を示す。別の態様において、該マーカー又はハプロタイプの存在は、癌の療法剤への応答を示す。別の態様において、該マーカー又はハプロタイプの存在は、個体における癌予後を示す。さらに別の態様において、該マーカー又はハプロタイプの存在は、癌治療の進行を示す。こうした治療は、手術による、投薬又は他の手段(例えば、ライフスタイル変更)による介入を含むことができる。
本発明の変異体に関連する疾患の診断
本発明の方法は癌(例えば、前立腺癌)への感受性を診断することとの関連においてほとんどの場合記述されてきたが、本方法は、本発明の多型マーカーと関連する癌を診断することにも使用し得る。例えば、癌を有する又は癌を発生するリスクにある個体は、個体における本発明の多型又はハプロタイプの存在が、個体の癌を診断することに寄与しているかどうかを決定することにより評価し得る。一つの態様において、本発明のマーカー及び/又はハプロタイプに関連する癌の同定は、治療計画を容易にする。例えば、癌を発生する個体の発生を最少化する予防的治療を与えることができる。こうした予防的治療は、本発明の変異体が冠動脈疾患及び心筋梗塞の低い発症年齢と関連していることが示されているので、(i)個体がアットリスク変異体についてヘテロ接合性又はホモ接合性であるかどうか;(ii)個体の年齢;及び(iii)個体の性;の評価も含む。本発明の他の態様において、療法を計画することができ、及び本発明の多型及び/又はハプロタイプに関連する適切な遺伝子又はタンパク質を標的とするように治療学が選択される。
本発明の一つの態様において、本発明のマーカー及び/又はハプロタイプに関連する癌の診断は、本発明の多型又はハプロタイプを検出することにより行われる。特定の多型が本明細書に記載されている。特定の態様において、検出されるべき多型マーカー又はハプロタイプは、表5A、表5B及び表5Cに示されたマーカーから成る群より選択される、一つ又はそれ以上のマーカー、二つ又はそれ以上のマーカーs, 三つ又はそれ以上のマーカー、四つ又はそれ以上のマーカー、又は五つ又はそれ以上のマーカーを含んでなる。別の態様において、検出されるべきマーカー又はハプロタイプは、表4A及び表4Bに示されたマーカーを含んでなる。別の態様において、検出されるべきマーカー又はハプロタイプは、表4A及び表4Bにリストしたマーカーから成るマーカーの群からの少なくとも一つのと、0.2より大きなr2の値により定義される強い連鎖不平衡にあるマーカーの群からの少なくとも一つのマーカーを含んでなる。好ましい態様において、検出されるべきマーカー又はハプロタイプは、rs16901979及びそれと連鎖不平衡にあるマーカーを含んでなる。別の好ましい態様において、検出されるべきマーカー又はハプロタイプは、HapC(rs1456314アレルG、rs17831626アレルT、rs7825414アレルG、rs6993569アレルG、rs6994316アレルA、rs6470494アレルT、rs1016342アレルC、rs1031588アレルG、rs1016343アレルT、rs1551510アレルG、rs1456306アレルC、rs1378897アレルG、rs1456305アレルT及びrs7816535アレルG)を含んでなる。
ゲノムDNA、RNA又はcDNAの試験サンプルは、癌を有している対象から得られ、疾患が本発明の一つ又はそれ以上の多型と関連しているかどうかが決定される。DNA、RNA又はcDNAサンプルは次ぎに、本発明の多型又は特異的ハプロタイプの特異的アレルが、サンプル中に存在していることが観察されるかどうかを決定するために試験される。もし、該核酸サンプルが該多型又は特異的ハプロタイプの特異的アレルを含有することが観察されたら、該アレル又はハプロタイプの存在は、癌が該多型及び/又はハプロタイプと関連していることを示す。
本発明の方法及びキットにおいてさらに詳細に記述される当業者には既知の方法が、該多型を検出するために使用できる。
療法剤
本発明の変異体(例えば、本発明のマーカー及び/又はハプロタイプ、例えば、表5A、5B及び5Cにリストしたマーカー、及びそれらの連鎖不平衡にあるマーカー、例えば、表4A及び4Bにリストしたマーカー)は、癌(例えば、前立腺癌)の新規療法的標的を同定するために使用し得る。例えば、癌に関連する変異体(マーカー及び/又はハプロタイプ)、又は連鎖不平衡にある変異体を含有する遺伝子、又はそれらの産物、ならびにこれらの変異体遺伝子又はそれらの産物により直接的に又は間接的に調節されている、又はそれらと相互作用する遺伝子又はそれらの産物は、癌を治療する、又は癌に関連する症状の発症を予防する又は遅延するための、療法剤の開発の標的であり得る。一つの態様において、該遺伝子はc−mycである。療法剤は、一つ又はそれ以上の、例えば、小さな非タンパク質及び非核酸分子、タンパク質、ペプチド、タンパク質断片、核酸(DNA、RNA)、PNA(ペプチド核酸)又は標的遺伝子又はそれらの遺伝子産物の機能及び/又はレベルを変調し得るそれらの誘導体又は模倣物を含んでなることができる。
本発明の核酸及び/又は変異体、又はそれらの相補的配列を含んでなる核酸は、アンチセンス構築物として使用することができ、細胞、組織又は器官中の遺伝子発現を制御する。アンチセンス技術に関連する方法論は当業者には公知であり、Antisense Drug Technology: Principles, Strategies, and Applications, Crooke, ed., Marcel Dekker Inc., New York (2001) 、に記述及び概説されている。一般に、アンチセンス分子がmRNAにハイブリダイズし、タンパク質へのmRNAの翻訳を阻止するように、アンチセンス核酸分子は、遺伝子により発現されるmRNAの領域と相補的であるように設計される。切断剤及び阻止剤を含むいくつかのクラスのアンチセンスオリゴヌクレオチドが当業者において公知である。前者は標的RNA部位に結合し、標的RNAを切断する細胞内ヌクレアーゼ(例えば、RnaseH又はRnaseL)を活性化する。阻止剤は標的RNAに結合し、リボソームの立体障害によりタンパク質翻訳を阻害する。阻止剤の例には、核酸、モルホリノ化合物、ロックト核酸及びメチルホスホン酸が含まれる(Thompson, Drug Discovery Today, 7:912-917 (2002))。アンチセンスオリゴヌクレオチドは、直接的に療法剤として有用であり、遺伝子機能を決定する及び検証するためにも(例えば、遺伝子ノックアウト又は遺伝子ノックダウン実験により)有用である。アンチセンス技術はさらに、Lavery et al., Curr. Opin. Drug Discov. Devel. 6:561-569 (2003), Stephens et al., Curr. Opin. Mol. Ther. 5:118-122 (2003), Kurreck, Eur. J. Biochem. 270:1628-44 (2003), Dias et al., Mol. Cancer Ter. 1:347-55 (2002), Chen, Methods Mol. Med. 75:621-636 (2003), Wang et al., Curr. Cancer Drug Targets 1:177-96 (2001) 及びBennett, Antisense Nucleic Acid Drug.Dev. 12:215-24 (2002) 、に記述されている。
本明細書に記載した変異体は、特定の変異体に特異的であるアンチセンス試薬の選択及び設計に使用し得る。本明細書に記載した変異体についての情報を使用し、本発明の一つ又は以上の変異体を含有するmRNA分子を特異的に標的とするアンチセンスオリゴヌクレオチド又は他のアンチセンス分子を設計し得る。この様式において、一つ又はそれ以上の本発明の変異体(マーカー及び/又はハプロタイプ)を含有するmRNA分子の発現を、阻害又は阻止することができる。一つの態様において、該アンチセンス分子は標的核酸の特定のアレル形(即ち、一つ又は数個の変異体(マーカー及び/又はハプロタイプ))に特異的に結合するように設計され、それによりこの特異的アレル又はハプロタイプに由来する産物の翻訳を阻害するが、標的核酸分子の特異的多型部位で他の又は代わりの変異体へは結合しない。
アンチセンス分子は、遺伝子発現を阻害するために、mRNAを不活性化するように使用することができるので、該分子は、前立腺癌(例えば、進行性前立腺癌)、肺癌、結腸癌、乳癌、黒色腫を含む癌のような疾患を治療するために使用し得る。方法論は、翻訳されるべきmRNAの能力を弱める、mRNA中の一つ又はそれ以上の領域に相補的なヌクレオチド配列を含有するリボザイムによる切断を含み得る。こうしたmRNA領域には、例えば、タンパク質コード領域、特に触媒活性に対応するタンパク質コード領域、基質及び/又はリガンド結合部位、又はタンパク質の他の機能性領域が含まれる。
RNA干渉(RNAi)の現象は、C.エレガンスでのその最初の発見(Fire et al., Nature 391 :806-11 (1998))以来、ここ十年間活発に研究されてきており、ヒト疾患の治療における使用可能性が活発に追求されている(Kim & Rossi,Nature Rev. Genet. 8:173-204 (2007) に概説されている)。RNA干渉(RNAi)は遺伝子サイレンシングとも称され、特異的遺伝子をオフにするための二本鎖RNA分子(dsRNA)を使用することに基づいている。細胞内で、細胞性二本鎖RNA分子(dsRNA)は細胞性複合体により小さな干渉RNA(siRNA)にプロセッシングされる。siRNAは、タンパク質−−RNA複合体の標的を標的mRNA上の特異的部位へと導く(Thompson, Drug Discovery Today, 7:912-917 (2002))。siRNA分子は典型的には、約20、21、22又は23ヌクレオチド長である。それ故、本発明の一つの側面は、単離された核酸分子、及びRNA干渉へのこれらの分子の使用(即ち、小さな干渉RNA分子(siRNA)としての)に関する。一つの態様において、該単離された核酸分子は18〜26ヌクレオチド長、好ましくは19〜25ヌクレオチド長、より好ましくは20〜24ヌクレオチド長、及びより好ましくは21、22又は23ヌクレオチド長である。
RNAi仲介遺伝子サイレンシングの別の経路は、細胞中でプロセッシングされて前駆体miRNA(pre−miRNA)を発生し、内因的にコードされている一次マイクロRNA(pri−miRNA)転写体に由来する。これらのmiRNA分子は、核から細胞質へ輸送され、プロセッシングを受けて成熟miRNA分子(miRNA)を発生し、それはmRNAの3’非翻訳領域中の標的部位を認識することによる翻訳阻害及びPボディーをプロセッシングすることによる続いてのmRNA分解を指示する(Kim & Rossi, Nature Rev. Genet. 8:173-204 (2007) により概説されている)。
RNAiの臨床応用には、およそ20〜23ヌクレオチドのサイズであり、そして好ましくは2ヌクレオチドの3’オーバーラップを有する合成siRNA二重鎖の取り込みが含まれる。遺伝子発現のノックダウンは、標的mRNAのための配列特異的設計により確立されている。こうした分子の最適化設計及び合成についてのいくつかの商業的サイトが当業者には知られている。
他の応用は、より長いsiRNA分子(典型的には、25〜30ヌクレオチド長、好ましくは約27ヌクレオチド)、ならびに小さなヘアピンRNA(shRNA; 典型的には約29ヌクレオチド長)を提供する。後者は、Amarzguioui et al., (FEBS Lett. 579:5974-81 (2005))により記載されているように、天然に発現される。化学合成siRNA及びshRNAは、インビボプロセッシングの基質であり、いくつかの場合、より短い設計よりも強力な遺伝子サイレンシングを提供する(Kim et al., Nature Biotechnol. 23:222-226 (2005); Siolas et al., Nature Biotechnol. 23:227-231 (2005))。一般に、siRNAは、それらの細胞内濃度が続いての細胞分裂により希釈されるので、遺伝子発現の一時的サイレンシングしか提供しない。対称的に、発現されたshRNAは、shRNAの転写が起こる限り、標的転写体の長期、安定なノックダウンを仲介する(Marques et al., Nature Biotechnol. 23:559-565 (2006); Brummelkamp et al., Science 296: 550-553 (2002))。
siRNA、miRNA及びshRNAを含むRNAi分子は配列依存性様式で働くので、本発明の変異体(例えば、表5A、5B及び5Cに示したマーカー、及びそれらの連鎖不平衡にあるマーカー、例えば、表4A及び4Bに示したマーカーのヌクレオチド配列)は、特異的アレル及び/又はハプロタイプ(例えば、本発明のアレル及び/又はハプロタイプ)を含んでなる特異的核酸分子を認識するが、一方、他のアレル又はハプロタイプを含んでなる核酸分子は認識しないRNAi試薬を設計するために使用し得る。これらのRNAi試薬は、それ故、標的核酸分子を認識し及び破壊できる。アンチセンス試薬と同様に、RNAi試薬は療法剤として有用であり得るが(即ち、疾患関連遺伝子又は疾患関連遺伝子変異体をオフにする)、遺伝子機能を特徴付ける及び検証するためにも有用であることができる(例えば、遺伝子ノックアウト又は遺伝子ノックダウン実験により)。
RNAiの送達は、当業者には公知のさまざまな方法論により実行することができる。非ウイルス送達を利用する方法には、コレステロール、安定核酸−リピッド粒子(SNALP)、重鎖抗体断片(Fab)、アプタマー及びナノ粒子が含まれる。ウイルス送達法には、レンチウイルス、アデノウイルス及びアデノ随伴ウイルスの使用が含まれる。siRNA分子はいくつかの態様において、それらの安定性を増加させるため、化学的に修飾される。このことには、RNAse活性への耐性を提供する、2’−O−メチルプリン及び2’−フルオロピリミジンを含むリボースの2’での修飾が含まれる。他の化学的修飾が可能であり、当業者には公知である。
以下の参照文献はRNAiのさらなる要約であり、RNAiを使用する特異的遺伝子標的化の可能性である:Kim & Rossi, Nat. Rev. Genet. 8:173-184 (2007), Chen & Rajewsky, Nat. Rev. Genet. 8:93-103 (2007), Reynolds, et al., Nat. Biotechnol. 22:326-330 (2004), Chi et al., Proc. Natl. Acad. Sci USA 100:6343-6346 (2003), Vickers et al., J. Biol. Chem. 278:7108-7118 (2003), Agami, Curr. Opin. Chem. Biol. 6:829-834 (2002), Lavery, et al., Curr. Opin. Drug Discov. Devel. 6:561- 569 (2003), Shi, Trends Genet. 19:9-12 (2003), Shuey et al., Drug Discov. Today 7:1040-46 (2002), McManus et al., Nat. Rev. Genet. 3:737-747 (2002), Xia et al., Nat. Biotechnol. 20:1006-10 (2002), Plasterk et al., Curr. Opin. Genet. Dev. 10:562-7 (2000), Bosher et al., Nat. Cell Biol. 2:E31-6 (2000), 及びHunter, Curr. Biol. 9:R440-442 (1999).
癌を含む疾患の発生について増加した素因又はリスクを導く遺伝的欠陥、又は該疾患を起こす欠陥は、該遺伝的欠陥の部位で正常/野生型ヌクレオチド(単数又は複数)を供給する、修復配列を組み入れる核酸断片を欠陥を運んでいる対象に投与することにより永久に修正することができる。こうした部位特異的修復配列は、対象のゲノムDNAの内因性修復を促進するように作用するRNA/DNAオリゴヌクレオチドを包含することができる。配列修復の投与は、ポリエチレンイミンとの複合体、陰イオン性リポソームでのカプセル化、アデノウイルスベクターのようなウイルスベクター、又は投与された核酸の細胞内取り込みを促進するために適した他の医薬組成物のような適切なビヒクルにより実施することができる。キメラオリゴヌクレオチドが対象のゲノム内への正常配列の組み入れを誘導し、正常/野生型遺伝子産物の発現を導くので、遺伝的欠陥を克服することができる。置き換えが伝搬され、それ故、恒久的修復及び疾患又は状態に関連する症状の緩和を与える。
本発明は、癌を治療するために使用できる化合物又は剤を同定する方法を提供する。それ故、本発明の変異体は療法剤の同定及び/又は開発のための標的として有用である。こうした方法は、本発明の少なくとも一つの変異体(マーカー及び/又はハプロタイプ)を含む核酸、又は核酸がコードする産物の活性及び/又は発現を変調する剤又は化合物の能力をアッセイすることを含むことができる。このことは順に、コードされた核酸産物の望まれない活性又は発現を阻害する又は改変する剤又は化合物を同定するために使用し得る。こうした実験を実施するためのアッセイは、当業者には公知のように、細胞に基づいたシステム又は無細胞システムで実施し得る。細胞に基づいたシステムには、問題とする核酸分子を天然で発現している細胞、又はある種の所望の核酸分子を発現するように遺伝子修飾されている組換え細胞が含まれる。
患者における変異体遺伝子発現は、変異体含有核酸配列(例えば、少なくとも一つの本発明の変異体を含有する遺伝子、それは少なくとも一つの変異体を含有するRNAに転写することができ、順にタンパク質に翻訳される)の発現により、又は正常転写体の発現のレベル又はパターンに影響する変異体(例えば、遺伝子の調節又は制御領域中の変異体)のため、正常/野生型核酸配列の発現の変化により評価し得る。遺伝子発現についてのアッセイには、直接核酸アッセイ(mRNA)、発現されたタンパク質レベルについてのアッセイ、又は経路、例えば、シグナル経路に関与する傍系化合物のアッセイが含まれる。さらに、シグナル経路に応答して上方又は下方制御される遺伝子の発現もアッセイし得る。一つの態様は、問題とする遺伝子(単数又は複数)の調節領域に動作可能なように連結された、ルシフェラーゼのようなレポーター遺伝子を含む。
遺伝子発現の変調剤は、一つの態様において、細胞を候補化合物又は剤と接触させ、そしてmRNAの発現が決定された時に同定し得る。候補化合物又は剤の存在下でのmRNAの発現レベルが、該化合物又は剤の不存在下での発現レベルと比較される。この比較に基づき、癌を治療するための候補化合物又は剤を、該変異体遺伝子の遺伝子発現を変調するものとして同定し得る。mRNA又はコードされたタンパク質の発現が、候補化合物又は剤の存在下でその不存在下よりも統計的に有意に高い場合、該候補化合物又は剤は該核酸の発現の刺激剤又は上方調節剤として同定される。核酸発現又はタンパク質レベルが、候補化合物又は剤の存在下でその不存在下よりも統計的に有意に低い場合、該候補化合物は該核酸発現の抑制剤又は下方調節剤として同定される。
本発明はさらに、遺伝子変調剤(即ち、遺伝子発現の刺激剤及び/又は抑制剤)の薬剤(化合物又は剤)スクリーニングを介して同定された化合物を使用する治療の方法も提供する。
本発明のさらなる側面において、医薬パック(キット)が提供され、該パックは療法剤、及び本明細書に記載した本発明の一つ又はそれ以上の変異体について診断的に試験されるヒトへの療法剤の投与に関する説明書のセットを含んでなる。該療法剤は、低分子薬剤、抗体、ペプチド、アンチセンス又はRNAi分子、又は他の療法的分子であり得る。一つの態様において、本発明の少なくとも一つの変異体のキャリアと同定された個体は、該療法剤の処方された用量を服用するように指示される。一つのこうした態様において、本発明の少なくとも一つの変異体のホモ接合性キャリアと同定された個体は、該療法剤の処方された用量を服用するように指示される。別の態様において、本発明の少なくとも一つの変異体の非キャリアと同定された個体は、該療法剤の処方された用量を服用するように指示される。
療法剤への応答の可能性を評価する方法、治療の進行をモニタリングする方法、及び治療の方法
当該技術分野で既知であるように、個体は特定の療法(例えば、療法剤又は治療法)に対して異なった応答を有し得る。薬理ゲノミクスは、薬剤の体内動態の変化及び/又は異常な又は変化した薬剤の作用のため、どのように遺伝子変異体(例えば、本発明の変異体(マーカー及び/又はハプロタイプ))が薬剤応答に影響するかの問題について取り組んだ。そのため、異なった応答の基礎が一部遺伝学的に決定された。薬剤応答に影響する遺伝子変異体による臨床的結果は、ある種の個体(例えば、遺伝子変異体のキャリア又は非キャリア)において薬剤の毒性、又は薬剤の治療不全を生じてもよい。それ故、本発明の変異体は、療法剤及び/又は方法が体に作用する様式、又は体が療法剤を代謝する経路を決定することができる。
従って、一つの態様において、多型部位又はハプロタイプでの特定のアレルの存在は、特定の治療モダリティー(modality)に対して異なった応答、例えば、異なった奏功率を示す。このことは、癌(例えば、前立腺癌(例えば、進行性前立腺癌)、乳癌、肺癌、結腸癌、黒色腫)と診断され、及び本発明の多型又はハプロタイプにある種のアレル(例えば、アットリスク及び保護的アレル及び/又は発明のハプロタイプ)を運んでいる患者は、癌を治療するために使用された特定の療法、薬剤及び/又は他の療法により良好に、又はより悪く応答するであろう。それ故、該アレル又はハプロタイプマーカーの存在又は不存在は、該患者に対してどのような治療を使用すべきかの決定において助けとなることができる。例えば、新規に診断された患者に対して、本発明のマーカー又はハプロタイプの存在を評価することができる(例えば、本明細書に記載したように、血液サンプルに由来するDNAを試験することを介して)。もし患者がマーカーアレル又はハプロタイプについて陽性であれば(即ち、マーカーの少なくとも一つの特異的アレル又はハプロタイプが存在)、医者は一つの特定の療法を推奨し、一方、もし患者がマーカーの少なくとも一つのアレルについて陰性であれば、療法の異なったコースが推奨される(疾患の進行について連続的にモニターすること以外は、即時の療法を実施することは推奨しないことを含むことができる)。それ故、患者のキャリア状態を、特定の治療モダリティーを与えるべきかどうかを決定するのを助けるために使用できる。最も適切な治療を選択するために早期段階で疾患を診断することが可能であること、及び最も適切な治療を適用することが可能なように疾患の予後/進行性度について臨床医に情報を提供する可能性にも意義がある。
本発明は、特定の癌(例えば、前立腺癌(例えば、進行性前立腺癌)、乳癌、肺癌、結腸癌、黒色腫)についての治療の進行又は有効性をモニタリングする方法にも関する。このことは本発明のマーカー及び/ハプロタイプの遺伝子型及び/又はハプロタイプ状態に基づいて、即ち、本明細書に記載した少なくとも一つの多型マーカーの少なくとも一つのアレルの存在又は不存在を評価することにより、又は本発明の変異体(マーカー及び/ハプロタイプ)に関連している遺伝子の発現をモニタリングすることにより行い得る。リスク遺伝子mRNA又はコードされたポリペプチドは、組織サンプル(例えば、末梢血液サンプル又は生検サンプル)で測定し得る。発現レベル及び/又はmRNAレベルは、それ故、その有効性をモニターするため、治療前及び治療間に決定される。もしくは、又は同時に 、本明細書で示された、癌についての少なくとも一つのリスク変異体の遺伝子型及び/又はハプロタイプ状態が、その有効性をモニターするため、治療前及び治療間に決定される。
もしくは、本発明のマーカー及び/ハプロタイプに関連する生物学的ネットワーク又は代謝経路を、mRNA及び/又はポリペプチドを決定することによりモニターし得る。このことは、例えば、治療前及び治療間に採取されたサンプル中の、該ネットワーク又は経路に属しているいくつかの遺伝子の発現レベル又はポリペプチドをモニターすることにより行い得る。もしくは、治療前及び治療間に、生物学的ネットワーク又は代謝経路に属している代謝産物を決定し得る。治療の有効性は、治療の間に観察された発現レベル/代謝レベルの変化を、健常対象からの対応するデータと比較することにより決定される。
さらなる側面において、本発明のマーカーは、臨床試行の能力及び有効性を増加させるために使用し得る。それ故、本発明の少なくとも一つのアットリスク変異体のキャリアである個体、即ち、癌を発生する増加したリスクを与える少なくとも一つの多型マーカーの少なくとも一つのアレル又はハプロタイプのキャリアである個体は、特定の治療モダリティーにより応答し易いようである。一つの態様において、特定の治療(例えば、低分子薬剤)が標的としている、経路及び/又は代謝ネットワーク中の遺伝子(単数又は複数)のアットリスク変異体を運んでいる個体は、該治療のレスポンダーである可能性が高い。別の態様において、一つの遺伝子のアットリスク変異体を運んでいる個体(発現及び機能がアットリスク変異体により変化している)は、該遺伝子、その発現又はその遺伝子産物を標的とする治療モダリティーのレスポンダーである可能性が高い。この応用は、臨床試行の安全性を改善し得るが、臨床試行が統計的に有意な効力を示すであろう機会を高めることもでき、それはある種の集団の副群に限定されるであろう。それ故、こうした試行の起こり得る結果は、ある種の遺伝子変異体(例えば、本発明のマーカー及び/ハプロタイプ)のキャリアは、該療法剤に正の応答を統計的に有意に示し易い、即ち、処方された療法剤又は薬剤を服用した場合、癌に関連する症状の緩和を経験することである。
さらなる側面において、本発明のマーカー及び/ハプロタイプは、特定の個体のための医薬品の選択を目標に使用し得る。治療モダリティーの個別化選択、ライフスタイル変化又は二つの組み合わせは、本発明のアットリスク変異体の利用により実現し得る。それ故、本発明の特定のマーカーについての個体の状態は、本発明のアットリスク変異体により影響される標的遺伝子又は遺伝子産物を標的とする治療オプションの選択に有用であり得る。変異体のある種の組み合わせは、治療オプションの一つの選択に適していることができ、一方、他の遺伝子変異体の組み合わせは、他の治療オプションを目的とすることができる。こうした変異体の組み合わせは、臨床的に信頼できる正確さで治療モジュールの選択を決定するのに必要とされる場合、一つの変異体、二つの変異体、三つの変異体、又は 四つ又はそれ以上の変異体を含むことができる。
本発明の変異体の診断的及び療法的使用に加えて、該変異体(マーカー及び/ハプロタイプ)は人物同定に有用なマーカーでもあり、そのため法医学、親子鑑定及びバイオメトリクスにおいても有用である。法医学目的のためのSNPsの具体的使用は、Gill (Int. J. Legal Med. 114:204-10 (2001) )により概説されている。個体間のゲノムDNA中の遺伝子変異は、個体を同定するため及び生物学的サンプルと個体を結びつけるための遺伝子マーカーとして使用し得る。SNPs及びマイクロサテライトを含む遺伝子マーカーは、個体を識別するために有用であり得る。より多くのマーカーが分析されると、いずれかの所与の個体中のマーカーのアレル組み合わせが無関連個体と同一である可能性を低くする(マーカーは相関していないこと、即ち、該マーカーは完全連鎖平衡にあることを仮定して)。それ故、好ましいマーカーは、本発明のマーカーのような利用可能なマーカーから選択することができ、選択されたマーカーは、異なった染色体上のマーカーを含む、ヒトゲノム中の異なった領域からのマーカーを含んでなることができる。
ある種の応用において、法医学試験に有用なSNPsは縮重コドン位置からのものである(即ち、SNPの変異がコドンによりコードされているアミノ酸に影響しないように、ある種のコドンの三番目の位置)。人種、祖先又は物理的特色を含む表現型特徴を予想するための応用のような他の応用において、コードされたタンパク質のアミノ酸配列に影響するSNPsを利用するのがより有用であり及び望ましいであろう。他のこうした態様において、該変異体(SNP又は他の多型マーカー)は近隣の遺伝子の発現レベルに影響し、それ故、変化したタンパク質発現を導く。
核酸及びポリペプチド
本明細書に記載した核酸及びポリペプチドは、上記のように、本発明の方法及びキットに使用し得る。
本明細書で使用される「単離された」核酸分子とは、通常は遺伝子又はヌクレオチド配列が隣接する核酸(ゲノム配列のように)から分離された及び/又は他の転写された配列から完全に又は部分的に精製された(例えば、RNAライブラリー中のように)ものである。例えば、本発明の単離された核酸は、それが自然に生じる複雑な細胞環境、又は組換え技術により産生された場合の培養培地、又は化学的に合成された場合の化学前駆体又は他の化学薬品に関して実質的に単離し得る。いくつかの例において、単離された物質は組成物(例えば、他の物質を含む粗抽出物)、緩衝液系又は試薬混合物の一部を形成するであろう。他の状況下では、該物質は、例えば、ポリアクリルアミドゲル電気泳動(PAGE)又はカラムクロマトグラフィー(例えば、HPLC)により決定されるように、本質的に均一にまで精製し得る。本発明の単離された核酸分子は、存在するすべての巨大分子の少なくとも約50%、少なくとも約80%又は少なくとも約90%(モルに基づいて)含まれている。ゲノムDNAに関しては、用語「単離された」は、ゲノムDNAが天然に付随していた染色体から分離された核酸分子を指す。例えば、単離された核酸分子は、該核酸分子が由来した細胞のゲノムDNA中の該核酸分子に隣接する、約250kb、200kb、150kb、100kb、75kb、50kb、25kb、10kb、5kb、4kb、3kb、2kb、1kb、0.5kb又は0.1kb未満のヌクレオチドを含み得る。
該核酸分子は、他のコード又は調節配列と融合することが可能であり、それでも単離されたと考えられる。それ故、ベクター中に含まれている組換えDNAは、本明細書で使用した「単離された」の定義に含まれる。また、単離された核酸分子には、異種宿主細胞又は異種生物体中の組換えDNA分子、ならびに溶液中の部分的に又は実質的に精製されたDNA分子も含まれる。「単離された」核酸分子は本発明のDNA分子のインビボ又はインビトロRNA転写体も包含する。単離された核酸分子又はヌクレオチド配列は、化学的に合成された又は組換え手段による核酸分子又はヌクレオチド配列を含み得る。こうした単離されたヌクレオチド配列は、例えば、コードされたポリペプチドの製造における、相同的配列(例えば、他の哺乳類種からの)を単離するためのプローブとして、遺伝子地図作製のために(例えば、染色体とのインサイツハイブリダイゼーションによる)、又はノーザンブロット分析又は他のハイブリダイゼーション技術によるような組織中の(例えば、ヒト組織)遺伝子発現を検出するために有用である。
本発明は、本明細書に記載したヌクレオチド配列に、選択的ハイブリダイゼーションのためのような高ストリンジェンシーハイブリダイゼーション条件下でハイブリダイズする核酸分子にも関する(例えば、本明細書に記載したハプロタイプに関連する多型を含有するヌクレオチド配列に特異的にハイブリダイズする核酸分子)。こうした核酸分子はアレル又は配列特異的ハイブリダイゼーションにより検出及び/又は単離し得る(例えば、高ストリンジェンシー条件下)。核酸ハイブリダイゼーションのためのストリンジェンシー条件及び方法は、当業者には公知である(例えば、その全教示が本明細書において援用される、Current Protocols in Molecular Biology, Ausubel, F. et al, John Wiley & Sons, (1998)、及びKraus, M. and Aaronson, S., Methods Enzymol., 200:546-556 (1991) を参照されたい)。
二つのヌクレオチド又はアミノ酸配列のパーセント同一性は、最適比較目的のために配列をアラインすることにより決定し得る(例えば、ギャップを第一の配列中に導入し得る)。対応する位置でのヌクレオチド又はアミノ酸を次ぎに比較し、二つの配列間のパーセント同一性は、配列により共有されている同一位置の数の関数である(即ち、%同一性=同一位置の数/位置の総数x100)。ある態様において、比較目的のためにアラインされた配列の長さは、基準配列の長さの少なくとも30%、少なくとも40%、少なくとも50%、少なくとも60%、少なくとも70%、少なくとも80%、少なくとも90%、又は少なくとも95%である。二つの配列の正確な比較は、例えば、数学的アルゴリズムを使用する公知の方法により達成し得る。こうした数学的アルゴリズムの非制限例は、Karlin, S. and Altschul, S., Proc. Natl. Acad. Sci. USA, 90:5873-5877 (1993) に記載されている。Altschul, S. et al, Nucleic Acids Res., 25:3389-3402 (1997) に記載されているように、こうしたアルゴリズムはNBLAST及びXBLASTプログラム(バージョン2.0)に組み込まれている。BLAST及びGapped BLASTプログラムを利用する場合、それぞれのプログラム(例えば、NBLAST)のデフォルトパラメーターを使用し得る。ncbi.nlm.nih.gov. のワ−ルドワイドウェブ上のウェブサイトを参照されたい。一つの態様において、配列比較のためのパラメーターは、スコア=100、ワードレングス=12にセットすることができるが、あるいは変化させることも可能である(例えば、W=5又はW=20)。
他の例には、Myers and Miller, CABIOS (1989)、のアルゴリズム、Torellis, A. and Robotti, C1 Comput. Appl. Biosci. 10:3-5 (1994) に記載されているADVANCE及びADAM;及びPearson, W. and Lipman, D., Proc. Natl. Acad. Sci. USA, 85:2444-48 (1988) に記載されているFASTAが含まれる。
別の態様において、二つのアミノ酸配列間のパーセント同一性はGCGソフトウェアパッケージ(Accelrys, Cambridge, UK)中のGAPプログラムを使用して達成し得る。
本発明は、高ストリンジェント条件下で配列番号1又は配列番号2に示したヌクレオチド配列を含んでなる又は、から成る核酸(配列番号1又は配列番号2の相補体を含んでなる又はから成るヌクレオチド配列)にハイブリダイズする断片又は部分を含有する単離された核酸分子も提供し、該ヌクレオチド配列は、本明細書に記載したマーカー又はハプロタイプ中に含有される少なくとも一つの多型アレルを含んでなる。本発明の核酸断片は、少なくとも約15、少なくとも約18、20、23又は25ヌクレオチドであり、30、40、50、100、200、500、1000、10,000又はそれ以上のヌクレオチド長でもあり得る。
本発明の核酸断片は、本明細書に記載したアッセイにおいてプローブ又はプライマーとして使用される。「プローブ」又は「プライマー」は、核酸分子の相補鎖に塩基特異的様式でハイブリダイズするオリゴヌクレオチドである。DNA及びRNAに加え、こうしたプローブ及びプライマーには、Nielsen, P. et al, Science 254:1497-1500(1991) に記載されているポリペプチド核酸(PNA)が含まれる。プローブ又はプライマーは、核酸分子の少なくとも約15、典型的には約20〜25、及びある態様において約40、50又は75の連続したヌクレオチドにハイブリダイズするヌクレオチド配列の領域を含んでなる。一つの態様において、該プローブ又はプライマーは、本明細書に記載した少なくとも一つの多型マーカーの少なくとも一つのアレル又は少なくとも一つのハプロタイプ、又はそれらの相補体を含んでなる。特定の態様において、プローブ又はプライマーは、100又はより少ないヌクレオチド;例えば、ある態様において6〜50ヌクレオチド、又は、例えば、12〜30ヌクレオチドを含み得る。他の態様において、該プローブ又はプライマーは、該連続したヌクレオチド配列と、又は該連続したヌクレオチド配列の相補体と少なくとも70%同一、少なくとも80%同一、少なくとも85%同一、少なくとも90%同一又は少なくとも95%同一である。別の態様において、該プローブ又はプライマーは、該連続したヌクレオチド配列に、又は該連続したヌクレオチド配列の相補体に選択的にハイブリダイズすることが可能である。しばしば、該プローブ又はプライマーはさらに、標識、例えば、ラジオアイソトープ、蛍光標識、酵素標識、酵素補因子標識、磁気標識、スピン標識、エピトープ標識を含んでなる。
上記の本発明の核酸分子は、当業者には公知の標準分子生物学技術を使用して同定する及び単離することができる。増幅されたDNAは標識することができ(例えば、放射性標識)、ヒト細胞から誘導されるcDNAをスクリーニングするためのプローブとして使用する。cDNAはmRNAから誘導することができ、適したベクターに含ませることができる。対応するクローンを単離することが可能であり、DNAはインビボ切り出しに続いて得ることが可能であり、そしてクローン化した挿入物は当該技術分野で認識されている方法で片方又は両方の向きで配列決定できて、適切な分子量のポリペプチドをコードする正しい読み取り枠を同定する。これら又は類似の方法を使用し、ポリペプチド及びポリペプチドをコードするDNAを単離する、配列決定する及びさらに特徴付け得る。
一般に、本発明の単離された核酸配列は、サザンゲル上の分子量マーカーとして、及び関連する遺伝子位置を地図作製するために標識された染色体マーカーとして使用し得る。該核酸配列は癌(例えば、前立腺癌)又は癌(例えば、前立腺癌)への感受性を同定するため、患者の内在性DNA配列と比較するため、及び関連DNA配列をハイブリダイズする及び発見するための、又はサンプルから既知の配列を差し引くための(例えば、サブトラクティブハイブリダイゼーション)プローブとしても使用し得る。該核酸配列はさらに、遺伝子フィンガープリンティングのためにプライマーを誘導するため、免疫化技術を使用する抗ポリペプチド抗体を上昇させるため、及び/又は抗DNA抗体を上昇させる又は免疫応答を惹起するために使用し得る。
抗体
遺伝子産物の一つの形態に特異的に結合するが、遺伝子産物の他の形態には結合しないポリクローナル抗体及び/又はモノクローナル抗体も提供される。変異体又は多型部位(単数又は複数)を含有する基準遺伝子産物の一部を結合する抗体も提供される。本明細書で使用する用語「抗体」は、免疫グロブリン分子及び免疫グロブリン分子の免疫学的に活性な部分、即ち、抗原を特異的に結合する抗原結合部位を含有する分子を指す。本発明のポリペプチドに特異的に結合する分子は、そのポリペプチド又はそれらの断片に結合するが、サンプル、例えば、天然に該ポリペプチドを含有する生物学的サンプル中の他の分子には実質的に結合しない分子である。免疫グロブリン分子の免疫学的に活性な部分の例には、該抗体をペプシンのような酵素で処理することにより発生し得る、F(ab)及びF(ab’)2断片が含まれる。本発明は、本発明のポリペプチドに結合するポリクローナル抗体及びモノクローナル抗体を提供する。本明細書で使用する用語「モノクローナル抗体」又は「モノクローナル抗体組成物」は、本発明のポリペプチドの特定のエピトープと免疫反応することが可能である抗原結合部位のただ一つの種を含有する、抗体分子の集団を指す。モノクローナル抗体組成物は、それ故典型的には、それが免疫反応する本発明の特定のポリペプチドに対する単一の結合親和性を示す。
ポリクローナル抗体は、所望の免疫原、例えば、本発明のポリペプチド又はそれらの断片で、適した対象を免疫化することにより、上記のように調製し得る。免疫化対象中の抗体力価は、固定化ポリペプチドを使用する、酵素連結免疫吸着アッセイ(ELISA)のような標準技術により、時間を通してモニターし得る。もし望むなら、該ポリペプチドに対して方向付けられた抗体分子を、哺乳動物から(例えば、血液から)単離することが可能であり、そしてプロテインAクロマトグラフィーのような公知の技術によりさらに精製できて、IgG分画を得る。免疫化後の適切な時点で(例えば、抗体力価が最も高い時)、対象から抗体産生細胞を得ることが可能であり、Kohler and Milstein, Nature 256:495-497 (1975) により最初に記載されたハイブリドーマ技術、ヒトB細胞ハイブリドーマ技術(Kozbor et al, Immunol. Today 4: 72 (1983))、EBV−ハイブリドーマ技術 (Cole et al., Monoclonal Antibodys and Cancer Therapy, Alan R. Liss,1985, Inc., pp. 77-96) 及びトリオーマ技術のような標準的技術によりモノクローナル抗体を調製するために使用する。ハイブリドーマを産生するテクノロジーは公知である(一般的には、Current Protocols in Immunology (1994) Coligan et al (eds.) John Wiley & Sons, Inc., New York, NY を参照されたい)。簡潔には、不死細胞株(典型的には骨髄腫)を、上記のように免疫原で免疫した哺乳動物からのリンパ球(典型的には脾細胞)と融合させ、生じたハイブリドーマ細胞の培養上清を、本発明のポリペプチドに結合するモノクローナル抗体を産生するハイブリドーマを同定するためにスクリーニングする。
リンパ球及び不死細胞株を融合させるために使用される多くの公知のプロトコールのいずれもが、本発明のポリペプチドに対するモノクローナル抗体を発生させる目的に応用し得る(例えば、Current Protocols in Immunology, 上記文献; Galfre et al., Nature 266:55052 (1977); R.H. Kenneth, in Monoclonal Antibodies : A New Dimension In Biological Analyses, Plenum Publishing Corp., New York, New York (1980); 及び Lerner, YaIe J. Biol. Med. 54:387-402 (1981)を参照されたい)。さらに、当業者は、有用であろう、こうした方法の多くの変形があることを理解するであろう。
モノクローナル抗体分泌ハイブリドーマを調製する代案として、本発明のポリペプチドに対するモノクローナル抗体は、該ポリペプチドを結合する免疫グロブリンライブラリーメンバーを単離するために該ポリペプチドで組換えコンビナトリアル免疫グロブリンライブラリー(例えば、抗体ファージディスプレイライブラリー)をスクリーニングすることにより同定する又は単離することが可能である。ファージディスプレイライブラリーを発生する及びスクリーニングするためのキットは商業的に入手可能である(例えば、Pharmacia Recombinant Phage Antibody System, カタログ番号27-9400-01 ;及びStratagene SurfZAP(商標) Phage Display Kit, カタログ番号240612 )。加えて、抗体ファージディスプレイライブラリーを発生する及びスクリーニングするために特に受け入れられる方法及び試薬の例は、例えば、米国特許第5,223,409号;PCT公開番号WO92/18619;PCT公開番号WO91/17271;PCT公開番号WO92/20791;PCT公開番号WO92/15679;PCT公開番号WO93/01288;PCT公開番号WO92/01047;PCT公開番号WO92/09690;PCT公開番号WO90/02809; Fuchs et al., Bio/Technology 9:1370-1372 (1991); Hay et al., Hum. Antibod. Hybridomas 3:81-85 (1992); Huse et al., Science 246: 1275-1281 (1989); 及び Griffiths et al, EMBO J. 12:725-734 (1993) に見ることができる。
加えて、キメラ及びヒト化モノクローナル抗体のような組換え抗体は、ヒト及び非ヒト部分を含んでなり、標準組換えDNA技術を使用して作製でき、本発明の範囲内である。こうしたキメラ及びヒト化モノクローナル抗体は、当該技術分野では既知の組換えDNA技術により製造し得る。
一般に、本発明の抗体(例えば、モノクローナル抗体)は、アフィニティークロマトグラフィー又は免疫沈降のような標準技術による本発明のポリペプチドの単離に使用し得る。ポリペプチド特異的抗体は、細胞からの天然のポリペプチドの、又は宿主細胞中で発現された組換え的に産生されたポリペプチドの精製を容易にすることができる。さらに、本発明のポリペプチドに特異的な抗体は、該ポリペプチドの発現の存在量及びパターンを評価するため、該ポリペプチド(例えば、細胞溶解物、細胞上清又は組織サンプル中の)を検出することに使用し得る。抗体は、臨床試験法の一部として、例えば、所与の治療計画の効力を決定するために組織中のタンパク質レベルをモニターするように、診断的に使用し得る。該抗体はその検出を容易にするため、検出可能な物質に結合させることができる。検出可能な物質の例には、多様な酵素、補欠分子族、蛍光物質、化学発光物質、生物化学発光物質及び放射性物質が含まれる。適した酵素の例には、西洋わさびペルオキシダーゼ、アルカリホスファターゼ、ベータガラクトシダーゼ又はアセチルコリンエステラーゼが含まれ、適した補欠分子族複合体の例には、ストレプトアビジン/ビオチン及びアビジン/ビオチンが含まれ;適した蛍光物質の例には、ウンベリフェロン、フルオレセイン、フルオレセインイソチオシアネート、ローダミン、ジクロロトリアジニルアミンフルオレセイン、塩化ダンシル又はフィコエリトリン;適した化学発光物質の例にはルミノールが含まれ;生物化学発光物質の例には、ルシフェラーゼ、ルシフェリン及びエクオリンが含まれ、及び適した放射性物質の例には125I、131I、35S又は3Hが含まれる。
抗体は、薬理ゲノミクスの解析においても有用であることができる。こうした態様において、本発明の少なくとも一つの多型マーカーを含有する核酸によりコードされている変異体タンパク質のような、本発明に従った核酸によりコードされている変異体タンパク質に対する抗体は、修飾治療モダリティーを必要とする個体を同定するために使用し得る。
抗体はさらに、癌(例えば、前立腺癌)の活性段階のような疾患状態における、又はタンパク質の機能に関係する癌、特に前立腺癌、の素因を有する個体における変異体タンパク質の発現を評価するためにも有用であり得る。本明細書に記載した少なくとも一つの多型マーカー又はハプロタイプを含んでなる核酸によりコードされている本発明の変異体タンパク質に特異的な抗体は、該変異体タンパク質の存在をスクリーニングするために、例えば、該変異体タンパク質の存在により示される癌(例えば、前立腺癌)の素因についてスクリーニングするために使用することができる。
抗体は他の方法においても使用し得る。それ故、電気泳動移動度、等電点、トリプシン又は他のプロテアーゼ消化による分析と併用して、又は当業者には既知の他の物理的アッセイで使用するため、本発明の変異体タンパク質のようなタンパク質を評価する診断ツールとして抗体は有用である。抗体は組織分類にも使用することができる。一つのこうした態様において、特異的変異体タンパク質は特定の組織タイプでの発現と相関しており、変異体タンパク質に特異的な抗体は、特定の組織タイプを同定するために使用し得る。
変異体タンパク質を含むタンパク質の細胞内局在性も抗体を使用して決定することができ、そして多様な組織中の細胞における該タンパク質の異常な細胞内局在性を評価するために応用し得る。こうした使用は遺伝子試験におけるのみではなく、特定の治療モダリティーのモニタリングにおいても応用し得る。治療が、該変異体タンパク質の発現レベル又は存在を、又は該変異体タンパク質の異常な組織分布又は発生過程での発現を是正することを目的とする場合、該変異体タンパク質又はそれらの断片に特異的な抗体は、治療効率をモニターするために使用し得る。
抗体はさらに、例えば、結合分子又は相手への変異体タンパク質の結合を阻止することにより変異体タンパク質機能を阻害するために有用である。こうした使用は、治療が変異体タンパク質の機能を阻害することを含む療法状況にも応用し得る。抗体は、例えば、結合を阻止する又は競合的に阻害するために使用でき、それにより該タンパク質の活性を変調する(即ち、刺激する又は拮抗する)。抗体は、特異的機能に必要な部位を含有する特定のタンパク質断片に対して、又は細胞又は細胞膜に関連している無傷のタンパク質に対して調製し得る。インビボでの投与のため、抗体を放射性核種、酵素、免疫原性エピトープ、又は細菌毒素(リシンのようなジフテリア又は植物毒素)を含む細胞毒のような追加の療法的ペイロード(payload)と連結させることができる。抗体又はそれらの断片のインビボ半減期は、ポリエチレングリコールへのコンジュゲーションを経たペグ化により増加させることができる。
本発明は、さらに、本明細書に記載された方法において抗体を使用するためのキットに関する。これには、限定されるわけではないが、試験サンプル中の変異体タンパク質の存在を検出するためのキットが含まれる。一つの好ましい態様は、標識又は標識可能抗体のような抗体、及び生物学的サンプル中の変異体タンパク質を検出するための化合物又は剤、サンプル中の変異体タンパク質の量又は存在及び/又は不存在を決定するための手段、及びサンプル中の変異体タンパク質の量を標品と比較するための手段、ならびにキットの使用のための説明書を含んでなる。
本発明はここで、いかようにも制限されることは意図されていない以下の実施例により例示される。
実施例1.前立腺癌に関連するLDブロックC領域の同定
遺伝的研究に関与した患者
1955年〜2005年にアイスランドにおいて前立腺癌と診断された全前立腺癌患者の集団に基づいたリストが、この研究の基礎である。患者は、2001年から継続的に研究に参加するよう招かれた。2006年10月現在で、1564人の前立腺癌患者からの血液サンプルが集められた。そのコレクションの内の1455人の前立腺癌患者に加えて4182人の対照個体がイルミナ(lllumina)317Kビーズチップで遺伝子型が同定された。
関連性及びハプロタイプ分析についての統計法
該疾患への単一マーカー関連性については、フィッシャーの直接確率検定を各個体アレルの両側p値を計算するために使用した。結果の提示には、SNPs及びハプロタイプについてはキャリア頻度よりもむしろアレル頻度を使用した。ハプロタイプ分析は、NEMO(ネステッドモデル)と呼ぶdeCODE で開発されたコンピュタープログラムを使用して実行した(Gretarsdottir, et al., Nat Genet. 2003 Oct;35(2):131-8) 。NEMOは、マーカー−マーカー関連を研究するため及びマーカー間の連鎖不平衡(LD)を計算するための両方に、及びケースコントロールハプロタイプ分析のために使用した。NEMOでは、ハプロタイプ頻度は、患者及び対照間の最大尤度及び相違により見積もられ、及び一般化尤度比試験を使用して試験される。最大尤度見積値、尤度比及びP値は、直接的に観察されたデータについて、EMアルゴリズムの助けにより計算され、及びそれ故、フェースの不確かさによる情報の損失及び失われた遺伝子型は自動的に尤度比により捕捉され、及びほとんどの状況下で大サンプル理論を、統計的有意さを確実に決定するために使用し得る。アレル又はハプロタイプの相対リスク(RR)、即ち、同一のマーカーのすべての他のアレルと比較したアレルのリスク、は集団寄与リスク(PAR)と一緒に乗法モデル(Terwilliger, J.D. & Ott, J. A haplotype -based‘Haplotype relative risk’ Approach to detecting allelic associations. Hum. Hered. 42, 337-46 (1992) and FaIk, CT. & Rubinstein, P .Haplotype relative risks: an easy reliable way to construct a proper control sample for risk calculations. Ann. Hum. Genet. 51 ( Pt 3), 227-33 (1987))を仮定することにより計算される。
ハプロタイプ分析においては、ハプロタイプを一緒にグループ化し、そしてグループを全体として疾患について試験するのが有用であろう。このことはNEMOで行うことが可能である。モデルはすべての可能なハプロタイプの組の分配により定義され、ここで同一グループ中のハプロタイプは同一のリスクを与えることが仮定され、一方、異なったグループ中のハプロタイプは異なったリスクを与え得る。帰無仮説及び代替仮説は、後者が前者よりも細かい分配に対応している場合、入れ子状態である(ネステッド)と称される。NEMOはハプロタイプスペースの分配において完全な融通性を提供する。このようにして、関連について多ハプロタイプを連帯して試験すること及び異なったハプロタイプが異なったリスクを与えるかどうか試験することが可能である。LDの一つの尺度として、LDの量についての相補的情報を与える、LDの二つの標準定義、D’及びR2(Lewontin, R., Genetics, 49:49-67(1964) and Hill, W.G. and A. Robertson、 Theor. Appl. Genet、 22:226-231 (1968)) を使用した。D’及びR2を見積もる目的のため、最大尤度法を使用してすべての2−マーカーアレル組み合わせの頻度を見積り、尤度比試験を使用して連鎖不平衡空の逸脱を評価した。辺縁のアレル確率により重み付けされた二つのマーカーのすべての可能な組み合わせについての値を平均することにより、D’及びR2の標準定義をマイクロサテライトが含まれるように拡大した。
全ゲノムにわたって遺伝子型同定されたマーカーの密な組の外側で構築しうる可能なハプロタイプの数は非常に多く、患者及び対照コホート中に実際に観察されるハプロタイプの数はよりかなり小さいにしても、疾患との関連についてすべてのこれらのハプロタイプを試験することは大変な仕事である。いくつかのマーカーは非常に変異可能であることができ、及び取り巻いているマーカーの外側で構築された、さもなければ非常に保存されたハプロタイプを分割するかもしれないので、我々の分析を、連続したマーカーの組から構築されたハプロタイプに制限するものではないことに気づくべきである。
結果
本明細書に記載したように、特定の癌(例えば、前立腺癌)に増加したリスクを与える染色体8q24.21(LDブロックC)上の領域が同定された。前立腺癌の増加したリスクに関連する特定のハプロタイプ及びマーカーが表1に示されている。表1に示したように、該ハプロタイプ(HapC)には以下のマーカー(例えば、SNPs)及びアレルが含まれる:rs1456314 3アレル、rs17831626 4アレル、rs7825414 3アレル、rs6993569 3アレル、rs6994316 1アレル、rs6470494 4アレル、rs1016342 2アレル、rs1031588 3アレル、rs1016343 4アレル、rs1551510 3アレル、rs1456306 2アレル、rs1378897 3アレル、rs1456305 4アレル、rs7816535 3アレル。HapMapプロジェクト中のコーカサス人(CEU)サンプルについての結果を試験することにより、SNPマーカーrs16901979のアレル1が、HapCと強い相関にあることが示された(D’=1、r2=1)。アイスランドサンプル中のrs16901979の遺伝子型同定で、HapCとのその相関を確認した(対照においてD’=0.98、r2=0.70)。該マーカー及び/ハプロタイプは、128,032,278及び128,094,256bp位(NCBI Build 34)間の我々がLDブロックCと呼ぶ所に位置しており、個々のマーカーの位置が表2に示されている。SNPsについてのアレルコードは次の通りである:1=A、2=C、3=G、4=T。全ての前立腺癌と比較して、進行性前立腺癌において増加したリスクが見られたことに注目されたい。進行性表現型は、7又はそれより高い合計グリーソングレード及び/又はT3又はそれより高い段階及び/又はリンパ節陽性及び/又は転移陽性疾患及び/又は前立腺癌による死亡を有する前立腺癌により決定される。進行性前立腺癌であると決定されるには、これらの判定基準の一つを有することで十分であることに注意されたい。これらの臨床的指標は、増加した疾患の悪性度の代替指標であることが
よく知られている。
表1に示したように、マーカーrs16901979で 1アレル及び14マーカーHapCハプロタイプの両方が前立腺癌と有意な関連性を与えた。ハプロタイプの集団頻度は、rs16901979で 1アレルの頻度よりもわずかに低く、対応する相対リスクは幾分より高かった。アイスランドにおけるこれらの変異体の集団寄与リスクは、全前立腺癌中で5.9〜6.4%であり、進行性前立腺癌患者中ではわずかに高く、6.7〜7.6%であった。
SNPマーカーrs16901979の逆アレル又はアレル2は、キャリアにおいて前立腺癌に対する有意な保護を示した。これらの結果は表2に示されている。
試験されたマーカー及びハプロタイプに見られるような、及び表1に示したようなLDブロックCのこの関連を見い出すため、単一チップ上におよそ317,000の一塩基変異多型(SNPs)をアッセイするための、Illumina からのlnfinium ヒトHap300SNPチップを使用して全ゲノムスキャンを実施した。我々はこの様式で1455人の患者及び4182人の対照の遺伝子型を同定した。対照は非罹患アイスランド集団サンプルであった。関連性分析は、ヒトゲノム中の各々及びすべてのLDブロック内のすべての連続したマーカーを表している単一マーカー、二つのマーカー及びハプロタイプで行った。SNPマーカーrs16901979 1アレルが前立腺癌と高度に有意な関連性を与えることが見いだされた。マーカーrs16901979はIllumina Hap300 チップ上にはないので、独立して遺伝子型が同定された。LDブロックC内のマーカーの、二つのマーカーハプロタイプが前立腺癌と高度に有意な関連性を与えた。全ゲノムを通して各LDブロック内のすべての連続したSNPマーカーから成るハプロタイプを前立腺癌との関連について試験した場合(LDブロックハプロタイプ)、最も有意なハプロタイプは128.414−128.506Mb(NCBI Build 34 )位でのChr8q24上にあった。この発見は我々によりすでに記述されている(Amundadottir et al. Nat Genet. 2006 Jun;38(6):652-8)。驚くことに、2番目に良いLDブロックハプロタイプはChr8q24上でほんの数十万塩基対しか離れておらず、128.032−128.095 Mb(NCBI Build 34)に位置していた。我々はこのハプロタイプ及びLDブロックをハプロタイプC(HapC)及びLDブロックCと称する。ヒトゲノムのLDブロック(ハプロタイプブロック)構造のため、rs16901979が属するLDブロックCの探求を続行した。
rs16901979と強いLDにある30のSNPsがあり、そしてそれ故、本明細書に記載した前立腺癌への関連を検出することにおいて同じ程度に良好である。r2により測定されたこれらのSNP及びrs16901979間のLDは、0.5より大きな。これらのマーカーは表4Aにリストされている。表4Bは、異なったHapMap集団中でrs16901979とLDにあるマーカーをリストしており、その集団中で少なくとも0.2のrs16901979とのr2の値を有している。
前立腺癌と関連するマーカー及び/ハプロタイプのLDブロックC領域のLD構造が図1に示されている。該構造はHAPMAPデータリリース19から誘導された。このLDブロック(LDブロックC)は128,032,278bpに位置するマーカーrs1456314と128,094,256bp位(NCBI Build 34)に位置するrs7816535間に位置しており、ほぼ65kb長である。図に示されているように、マーカー間で高いr2及び|D’|を有するDNAのブロックとしてLD構造が見られる。マーカーは等距離で示されており、即ち、いずれの二つのマーカー間も同一距離である。
LDブロックC領域内にある他のマーカーも前立腺癌と関連することが可能である(こうしたマーカーはrs16901979と連鎖不平衡にあるので)。表5Aは、LDブロックCにまたがった(NCBI Build 34中の128032278〜128094256bp位)LDブロックC中の公知のSNPマーカーのリストを提供している。表5BはLDブロックC’(配列番号2に示された配列に対応する)中のすべての公知のSNPマーカーのリストを提供しており、及び表5Cはその領域内のすべてのマイクロサテライトマーカーのリストを提供している。
ヒトゲノムの染色体8q24.21上のLDブロックCに位置する遺伝子及び予想遺伝子には、Chr1p36上のSRRM1遺伝子のイントロンがないコピーであるレトロトランスポーズされた(retrotransposed)遺伝子(Genbank寄託番号BC017315)、ならびに、予測遺伝子(例えば、NT_008046.701、chr8_1173.1、chr8.129.001.a、vugee.bDecO3、kloger、keebly))が含まれる。LDブロックC領域及び癌に関連するマーカー又はハプロタイプ中に内在する変異は、LDブロックC内の遺伝子のみではなく、NSE2、POU5FLC20、c−MYC、PVT1のような近隣の遺伝子、及び/又は該領域中の他の既知の、未知の又は予測遺伝子にも影響することができる。さらに、こうした変異は、該領域はハプロタイプキャリアにおいてより体細胞再構成する傾向があるので、RNA又はタンパク質安定性に影響することができ、又は構造的影響を有することができる。このことは、大きな割合の癌(限定されるわけではないが、前立腺癌を含んで)で増幅されるLDブロックCと一致している(www.progenetix.com)。実際、Chr8q21〜24はすべての合計の癌(約17%)で及び前立腺癌(約20%)で、最も頻繁に増える染色体領域である(www.progenetix.com)。それ故、内在する変異は、本明細書に記載したハプロタイプに直接連結された特徴付けられていない遺伝子に影響し、本明細書に記載したハプロタイプに直接連結されていない近隣遺伝子にも影響することができる。
議論
本明細書に記載したように、染色体8q24.21上の座位が癌(例えば、前立腺癌(例えば、進行性前立腺癌))において役割を果たすことが実証された。特定のマーカー及びハプロタイプ(例えば、HapC、表3に示した一つ又はそれ以上のマーカーを含有するハプロタイプ)は、前立腺癌を有する対象中で予想された頻度よりも高く存在する。本明細書に記載したハプロタイプに基づくと、それらは癌の特定の形態に対する傾向に関連し、遺伝子感受性アッセイ(例えば、診断的スクリーニング試験)を癌のリスクがある個体を同定するために使用し得る。
本明細書に記載したマーカー及び/ハプロタイプは、全前立腺癌群と比較して進行性前立腺癌においてより高い相対リスクを有しており(表1)、それにより、進行性、急速に増殖する前立腺癌についての増加したリスクを示している。もし前立腺癌の有意なパーセンテージが非進行形形態であるなら、それは前立腺を超えて広がらず、罹患率又は死亡率を上げないであろうし、及び前立腺切除術、放射線及び化学療法を含む前立腺癌の治療はすべて副作用を有し及び著しい費用かかることから、より進行性ではない形態と比較して進行性前立腺癌についてより大きなリスクを示す、本明細書に記載したような診断マーカーを有することは価値がある。
実施例2:いくつかのコホートにおける前立腺癌との関連の検証
追加の分析は、染色体8q24上の、癌と関連する変異体の存在をさらに支持する。表7に示したように、rs16901979 1 アレル及びHapCの両方が、コーカサス人祖先の二つのコホート及びアフリカ人祖先の一つのコホートにおいて前立腺癌と関連していることが見いだされた。
前立腺癌とLDブロックC内の単一マーカー及び/ハプロタイプの関係の反復研究。コホートは、シカゴ、米国(Northwestern University)及びスペイン(Zaragoza University Hospital)に由来するコーカサス人のサンプル、及び米国ミシガン(University of Michigan)からのアフリカンアメリカ人コホートから成っている。SNPsについてのアレルコードは次の通りである:1=A、2=C、3=G、4=T、及びX=任意のアレル
コーカサス人サンプルにおけるアットリスク変異体の集団頻度(対照における頻度から概算された)は、アイスランド集団のものに匹敵する。しかしながら、アフリカンアメリカ人における集団頻度はかなり大きいことが注目された。アフリカンアメリカ人コホートにおいての集団寄与リスクは、それ故、2つのコーカサス人起源コホートでの約5〜6%と比較して、かなり高く約24%である。このことは、コーカサス人よりアフリカンアメリカ人においてより大きな前立腺癌のパーセンテージは、本発明のアットリスク変異体により説明し得る。
材料及び方法
コーカサス人米国研究集団は、Urology Department of Northwestern Memorial Hospital 、シカゴ、で手術を受けた419人の前立腺癌患者(ICD10 C61)、及びDepartment of Human Genetics, University of Chicago で登録された237人の集団に基づいた対照から成っている。段階及び生検グリーソンスコアを含む臨床情報を取り出すために医学記録を検査した。診断時での平均年齢は患者について59歳であった。患者及び対照は自己申告ヨーロッパ系アメリカ人民族性であった。このことは、ゲノムを通してランダムに分布した30のマイクロサテライトマーカーを使用する、遺伝子祖先の判断により確認した(以下参照)。このコホート中のヨーロッパ系祖先の平均及び中央値は両方とも0.99より大きかった(詳細に以下に記載した方法を参照されたい)。研究プロトコールはInstitutional Review Boards of Northwestern University 及びUniversity of Chicago により承認された。すべての対象からインフォームドコンセント書類を得た。
スペイン人研究集団は、2005年6月から2006年6月、Oncology Department of Zaragoza Hospital で集められた390人の前立腺癌から成っていた。患者はDr. Jose I. Mayordomo 及びDivision of Medical Oncology, University Hospital in Zaragoza, スペイン、の腫瘍学者により集められた。研究サンプルが集められた12ヶ月の間に、700人の患者が適格であった。これらの内約600人の(〜85%)患者に申し入れ、440人が登録された(関与率73%)。すべての患者がコーカサス人民族性であった。前立腺癌診断から血液サンプルの採取までの時間間隔の中央値は5ヶ月(平均7ヶ月、1〜67ヶ月の範囲)であった。発症年齢、グレード及び段階を含む臨床情報は、医療記録から集められた。患者の発症での平均年齢は69歳(中央値71歳)であり、範囲は45〜83歳である。892人のスペイン人対照は、University Hospital in Zaragoza、スペイン、で申し入れ、すべて癌以外の疾患であり、血液サンプル採取前に、質問により以前に癌を患った人を除外した。研究プロトコールはInstitutional Review Boards of Zaragoza University Hospital により承認された。すべての対象からインフォームドコンセント書類を得た。
遺伝子祖先の評価
プログラムStructure(Pritchard, J.K. et al., Genetics 115:945-59 (2000)) を、個体の遺伝子祖先を推定するために使用した。Structureは、個体の組及びKの使用者特定値からの多座位遺伝子型に基づいてK祖先集団のアレル頻度を与え、及び与えられたK集団の各々からの祖先の集団を各個体に帰属させる。データセットの分析は、各個体のアフリカ人及びヨーロッパ人祖先の比率を同定することを目的として、K=3で行った。アフリカンアメリカ人患者及び対照間の平均ヨーロッパ人祖先における相違の統計的有意性は、10000ランダム化データセットから誘導されるヌル分布を基準にして評価した。
米国からの研究集団の遺伝的に推定される祖先を評価するため、以前に記載した(Pritchard, J.K. et al, Genetics 115:945-59(2000)) 35ヨーロッパ系アメリカ人、88アフリカンアメリカ人、34中国人、及び29メキシコ系アメリカ人の多民族コホートで遺伝子型同定した約2000のマイクロサテライトから30の非連鎖マイクロサテライトマーカーを選択した。2000のマイクロサテライトの内の選択された組は、ヨーロッパ人系アメリカ人、アフリカンアメリカ人及びアジア人間で最も有意な相違を示し、良好な質及び収率も有していた:D1S2630、D1S2847、D1S466、D1S493、D2S166、D3S1583、D3S4011、D3S4559、D4S2460、D4S3014、D5S1967、DG5S802、D6S1037、D8S1719、D8S1746、D9S1777、D9S1839、D9S2168、D10S1698、D11S1321、D11S4206、D12S1723、D13S152、D14S588、D17S1799、D17S745、D18S464、D19S113、D20S878及びD22S1172。以下のプライマー対をDG5S802に対して使用した:DG5S802−F:CAAGTTTAGCTGTGATGTACAGGTTT(配列番号46)及びDG5S802−R:TTCCAGAACCAAAGCCAAAT(配列番号47)。
議論
要約すると、rs16901979の1アレルに対する前立腺癌リスクの有意な関連が、アイスランド、スペイン及びシカゴからのヨーロッパ人祖先の3つのコホートで示された。対応する集団寄与リスク(PAR)は、3集団でのすべての前立腺癌を考慮した場合は約5〜6%の範囲であり、進行性前立腺癌においては約7〜8%へわずかに増加した。アフリカンアメリカ人コホートにおいて、1.35(P=0.005)の相対リスクの前立腺癌及びrs16901979の1アレルの関連が反復された。フリカンアメリカ人サンプルにおけるこれらの変異体の増加した頻度のため、この集団のPARはコーカサス人サンプルと比較して約24%高かった。
本明細書に記載した変異体は、ゲノムワイド関連分析を介して同定された。1455人の前立腺癌患者及び4182人の対照において300,000を超えるSNPsが分類された。この領域が2番目に有意なハプロタイプを全ゲノム中の個々のLDブロック内で含んでいるので、我々はこの領域に注目した(LDブロックハプロタイプ)。
重要なことは、コーカサス人と比較してアフリカンアメリカ人においてこのハプロタイプの頻度が非常に増加していることであり、それにより、この群における前立腺癌のより高い発生率を説明することができる。