[用語の定義]
以下の定義は下記に用いる特定の用語のために示すものである。
本明細書で用いられるように、用語「増幅された(amplified)」は、核酸配列に用いた場合には、核酸の鋳型配列から特定の核酸配列の一又は二以上の複製物が生成される工程を示し、好ましくはポリメラーゼ連鎖反応法によることをさす。反応混合物はdNTP(4種のデオキシリボヌクレオチド、dATP、dCTP、dGTP、dTTPのそれぞれ)、プライマー、緩衝液、DNA複製酵素、及び核酸鋳型を含有する。PCR反応は(a)標的となる核酸配列のセンス鎖と相補する配列を有し、相補的な第二のDNA鎖の合成を開始する第一のプライマー、及び標的となる核酸配列のアンチセンス鎖と相補する配列を有し、アンチセンス鎖と相補的なDNA鎖の合成を開始する第二のプライマーからなる"プライマーの組"を添加し、(b)核酸重合酵素を用いて核酸の鋳型配列を増幅するものでもよい。PCR反応において核酸鋳型を増幅するために通常Taqポリメラーゼが使用される。増幅のための他の方法、すなわちリガーゼ連鎖反応(LCR)、ポリヌクレオチドベース配列増幅法、又は公知の他の方法であってもよく、またこれらに限定されない。
本明細書で用いられるように、用語「生物マーカー(biomarker)」は、(a)示差的にメチル化されているゲノム領域、(b)又は示差的に発現している遺伝子、若しくは(c)DNA配列の変異若しくは一塩基変異(SNP)であって、がんを有さない対象に比べ、よりがん又はがんの段階を有する対象に関連するものをさす。
本明細書で用いられるように用語「組成物(composition)」はあらゆる混合物をさす。すなわち溶液、懸濁液、液体、粉末、糊状のもの、水溶性のもの、水溶性でないもの、又はこれらのいかなる組み合わせでもよい。
本明細書で用いられる用語「CpG部位(CpG position)」はシトシンヌクレオチドがグアニンヌクレオチドの5’の側に隣接する位置にある直鎖状の塩基配列であってその長さのものをさす。「CpG」は「C−phosphate−G」を簡略に表記したものであり、リン酸はシトシン及びグアニンを隔てているものであり、二ヌクレオチドを互いに連結しDNAとしているものである。二ヌクレオチドCpG中のシトシンはメチル化されて5−メチルシトシンとなる。
本明細書で用いられるように、単語「診断(diagnosis)」は、がん、例えば前立腺がん(PCa)又は浸潤性乳がん(IBC)の、その発達のあらゆる段階における特定であって、その対象がその疾病を発症する傾向の判断を含む。
本明細書で用いられる用語「予測(予後、prognosis)」は、臨床状態又は疾病のとり得る経過及び結果の予想をさす。通常、患者に関する予測は、好ましい又は好ましくない、疾病の経過又は結果を示している要因、マーカー、及び/又は疾病の症状を評価することで得られる。
本明細書で用いられる「予測の判断(determining the prognosis)」の句は、患者の状態の経過又は結果を予測できる当業者によって実行される過程をさす。用語「予測」は100%の正確さで経過又は結果を予想する能力をさすものではない。かわりに、当業者であれば、用語「予測」は、ある経過又は結果が起こる確率の増加をさすと理解でき、ある経過又は結果とは所定の状態にある患者に起こることが、かかる状態にない個人と比べた時に、より期待される経過又は結果である。予測は患者の生存が予測できる時間で表現できる。あるいは予測は疾病が寛解する見込みをさすものでもよく、疾病の寛解が持続すると期待される時間をさすものでもよい。予測はさまざまな表現で表すことが出来るため、予測は例えば、患者が1年後、5年後、10年後等に生存している確率の百分率で表してもよい。あるいは、予測は患者の状態又は疾病の結果として生存することが期待される平均年数で表してもよい。患者に対する予測は、最終的な結果に影響を及ぼす多くの要因に関し、患者に応じて表現を行うものであると考えられる。例えば、特定の状態の患者に対しては、治療可能な若しくは治癒可能な状態の見込み、又は疾病が寛解に向かう見込みとして、予測を表現することが適切であるのに対し、より重症の患者には、予測は特定の期間の生存の見込みとして表現することがより適切である。
本明細書で用いられるように、用語「示差的なメチル化(differential methylation)」はがん陰性の試料におけるDNAメチル化水準と比べた時のがん陽性の試料におけるDNA/シトシンメチル化水準の差異をさす。また手術によりがんの寛解した患者と、寛解しない患者と間の水準の差異をさす。示差的なメチル化及び特定のDNAメチル化の水準又はパターンは、一旦、正しい閾値(cut-off)又は予測的な特徴が定義されることで、予後と予測に関する生物マーカーとして用いることが出来る。「DNAメチル化状態」は用語「DNAメチル化水準」に置き換えることが出来、ゲノム領域又はそれらの一部においてメチル化及び非メチル化DNAの比率を測定することで評価することが出来、百分率で見積もることが出来る。ここでメチル化状態は、上昇としても低下としても分類され、同様の観察期間内に再発を経験しなかった対照となる人に比べ、がんの再発する人とより関係する場合がある。あるいは得られたマーカー遺伝子におけるDNAメチル化の上昇又は低下は、好ましい結果となる可能性が高い、悪性度の低いがんの人に比べ、病理学的に悪性度の高い()がんと診断され、より高い進行の危険性があるとされる人により関係する場合がある。
本明細書で「閾値(cut-off value)」は次のように定義され、すなわち特定のDNAメチル化水準であって、これより高い場合、陽性とみなされる結果となり(または逆相関する遺伝子において陰性とみなされる)、反対にメチル化水準が閾値より低い場合、陰性とみなされる結果となる(または逆相関する遺伝子において陽性とみなされる)。ここにおける値の範囲及び全ての閾値が、プラスマイナス15%、プラスマイナス10%で、好ましくはプラスマイナス5%のみで変更可能とすることで、ヒト又は他の生物を初めとする、全ての活動している生命システムの特徴として知られる生物学的利用能(biological variability)を合理的に説明することができる。
本明細書で用いられる用語「メチル化状態を分析する(analyzing the methylation status)」は、メチル化状態を評価するのに有用な手段及び方法と関係する。有用な方法としては、重亜硫酸塩に基づく方法、すなわち重亜硫酸塩に基づく質量分析、又は重亜硫酸塩に基づく配列決定法がある。
本明細書で用いられる用語「ゲノム領域特異的なプライマー(genomic region specific primers)」は、本発明におけるゲノム領域の近傍にある配列と相補するプライマーの組をさし、本発明にかかるゲノム領域と相補する二本鎖DNAを増幅する方法で作製することができる。
本明細書で用いられる用語「ゲノム領域特異的プローブ(genomic region specific probe)」は、ゲノム領域のDNA産物に対し選択的にハイブリッド形成するプローブをさす。一態様においてゲノム領域特異的プローブは標識プローブでもよく、例えば発蛍光団及び失活剤を用いるものでもよく、例としてTaqMan(登録商標)プローブ又はMolecular Beaconプローブがある。
本明細書で用いられるように、用語「にハイブリッド形成する(hybridizing to)」及び「ハイブリダイゼーション(hybridization)」は用語「に特異的」に言い換えることが出来、例えば標的核酸配列と標的特異的核酸プライマー又はプローブと間の相互作用のような、相補的な核酸との非共有結合による配列特異的な相互作用をさす。好ましい態様において、核酸であってハイブリッド形成するもののハイブリッド形成の選択性は、70%よりも大きく、80%よりも大きく、90%よりも大きく、又は最も好ましくは100%である(すなわち他の種類のDNAとのクロスハイブリダイゼーションが起きることは好ましくは30%よりも少なく、20%よりも少なく、10%よりも少ない)。当業者に理解されるとおり、核酸であって本発明にかかるゲノム領域のDNA産物に「ハイブリッド形成」するものは、長さ及び塩基組成(composition)を考慮に入れて決定できる。
本明細書で用いられるように、核酸の参照のために用いられた場合、「単離された(isolated)」は天然起源の配列が、その通常の細胞環境(例えば染色体)から除去され、または非天然環境で合成(例えば人工合成)されることを意味する。このため、「単離された」配列は無細胞液中にあったり、又は異なる細胞環境に置かれたりする場合がある。
本明細書で用いられるように、「キット(kit)」とは梱包された組み合わせであり、上記組み合わせを使用するための説明書、並びに/又は、そのような使用のための他の反応試薬及び要素を任意に含むものである。
本明細書で用いられるように、「核酸(nucleic acid(s))」又は「核酸分子(nucleic acid molecule)」とは一般的にあらゆるリボ核酸又はデオキシリボ核酸をさし、非修飾の又は修飾された、DNA又はRNAでもよい。「核酸」には一本鎖及び二本鎖の核酸を含み、特に限定されない。さらに本明細書で用いられるように、用語「核酸」には、上記のとおり一又は二以上の修飾塩基を有するDNAを含む。このため、安定性や他の理由のために修飾された骨格を有するDNAは「核酸」である。本明細書で用いられる用語「核酸」は、化学的に、酵素的に、又は代謝的に修飾等された形態の核酸を包含し、その形態はウィルス及び例えば単純な細胞や複雑な細胞を含む細胞のDNAの特徴を表す化学形態と同様である。
本明細書で用いられる用語「プライマー(プライマー)」は核酸をさし、精製された制限消化を受ける天然起源のものか、又は人工的に合成されたものかに関わらず、プライマー伸長産物を合成する環境において、合成の開始点として作用することが出来、プライマー伸長産物は核酸配列と相補的であり、誘導されるものである、すなわち核酸及びDNA重合酵素のような誘導剤の存在下、並びに好適な温度及びpH下で誘導されるものである。プライマーは一本鎖でも二本鎖でもよいが、誘導剤の存在下で所望の伸長産物の合成を開始するために十分に長いものでなければならない。プライマーの正確な長さは温度、プライマーの原料、及び用いられる手法を含む多くの要因によって異なる。例えば診断への応用であれば、標的配列の複雑さにもよるが、核酸プライマーは15−25又はそれ以上のヌクレオチドを有することが典型的であり、より少ないヌクレオチドを有するものでよい。
本明細書で用いられるように、用語「プローブ(probe)」は核酸及びその類縁体を意味し、標的配列のヌクレオチド塩基との水素結合による相互作用を通してポリヌクレオチドの標的配列を認識するさまざまな化学種をさす。プローブ又は標的配列は一本鎖又は二本鎖のDNAでもよい。プローブは少なくとも長さ8ヌクレオチドであり、完全な標的配列のポリヌクレオチドの完全長よりも短い。プローブ長さは10、20、30、50、75、100、150、200、250、400、500ヌクレオチドでもよく、10,000ヌクレオチド以下でもよい。プローブは、一又は二以上の、蛍光、化学発光、及びその他により識別される標識を有するように修飾された核酸(標識プローブ)でもよい。さらに標識プローブは、一又は二以上の識別用の標識、及び一又は二以上の失活用分子を同時に有するように修飾されていてもよく、例えばTaqmanプローブやMolecular Beaconでもよい。核酸及びその類縁体はDNA又はDNAの類縁体でもよく、一般にアンチセンスオリゴマー又はアンチセンス核酸と呼ばれるものでよい。上記DNA類縁体は2−’O−アルキル修飾糖、メチルホスホン酸、ホスホロチオエート、ジチオリン酸、formacetal、3′-thioformacetal、スルホン、スルファミン酸、及び窒素酸化物による骨格の修飾及び類縁体、及び塩基の一部が修飾された類縁体を含むが、これに限定されない。さらにオリゴマーの類縁体は糖の一部が修飾された、又は他の好適な一部により置換された重合体でもよく、重合体はモルフォリノ類縁体及びペプチド核酸(PNA)類縁体(Egholm, et al. Peptide Nucleic Acids (PNA)-Oligonucleotide Analogues with an Achiral Peptide Backbone, (1992))を含んでもよいがこれに限定されない。
用語「試料(sample)」は本明細書で用いられ、組織それ自体、がん組織、潜在的ながん組織、前立腺若しくは胸部組織、血液、尿、精液、前立腺分泌物、乳、胸部滲出液、針穿刺吸引物、前立腺又は胸部の単離細胞、対象を起源とする細胞をさし、好ましくは前立腺組織、胸部組織、前立腺分泌物、胸部分泌物、又は前立腺若しくは胸部の単離細胞、最も好ましくは前立腺組織、若しくは胸部組織をさす。
用語「重亜硫酸配列決定(bisulphite sequencing)」は当業者によく知られる方法をさし、以下の工程を含むものであり、(a)興味のあるDNAを重亜硫酸で処理し、これにより、非メチル化シトシンをウラシルに変換し、メチル化シトシンに影響を与えないように残し、(b)処理されたDNAの配列を決定し、変換されていないシトシンを検出することで、メチル化シトシンの存在することが明らかになり、ウラシルを検出することで、メチル化シトシンの存在しないことが明らかになる。
本明細書で用いられるように、「ストリンジェントな条件でのハイブリダイゼーション(stringent conditions for hybridization)」は当業者に知られるものであり、Current Protocols in Molecular Biology, John Wiley & Sons, N.Y., 6.3.1-6.3.6, 1991.で開示されるものである。ストリンジェントな条件は45℃、6X 塩化ナトリウム/クエン酸ナトリウム(SSC)中でのハイブリダイゼーションの後、65℃、0.2 X SSC、0.1% SDS中で洗浄することと同等なものと定義される。
本明細書で用いられるように、用語「対象(subject)」及び「患者(patient)」の用語は同じ意味で用いられ、ヒト又は動物(例えば哺乳類、魚類、両生類、爬虫類、鳥類、及び昆虫類)をさす。特定の態様においては、対象は哺乳類(例えば、ヒトを除く哺乳類、及びヒト)である。他の態様において対象はペット(例えば、犬、猫、モルモット、猿、及び鳥)、家畜(例えば、馬、牛、豚、山羊、及び鶏)、又は実験動物(例えば、マウス及びラット)である。他の態様において、対象は霊長類(例えば、チンパンジー及びヒト)。である。他の態様において対象はヒトである。他の態様において対象は男性又は女性である。
本明細書で用いられるように、用語「ゲノム領域の近傍で(in the vicinity of a genomic region)」は該ゲノム領域の外側又は内側の位置をさす。当業者に理解される範囲において、ゲノム領域の5’又は3’末端からかかる位置までの距離は、1000nt以下、好ましくは500nt以下、より好ましくは200nt以下である。さらに好ましくは、かかる位置は、該ゲノム領域の5’又は3’末端にある。本発明の他の態様においてはかかる位置は、該ゲノム領域の中にある。
[発明の詳細な記述]
ここに開示する本発明は悪性度の高いがんの診断に有用なゲノム領域を特定する。これらは予測マーカーでもある。
定義より、特定されたゲノム領域は悪性度の高いがんの生物マーカーである。これらのゲノム領域を(生物マーカーとして)利用するために、本発明はかかるゲノム領域のDNAメチル化状態の分析方法を開示する。本発明はさらにゲノム領域特異的な核酸を含む。本発明はさらに、かかるゲノム領域特定的な核酸を用いてゲノム領域のDNAメチル化状態を分析し、かかる分析は直接に又は間接に当業者に知られた方法及び本明細書で説明する方法により行うものである。本発明はさらに上記核酸を有する組成物及びキットであってPCa及びIBCの診断のためのものを開示する。
発明者らは異常なメチル化状態にあるゲノム領域を見出した。腫瘍と関連することを見出した。したがって、本発明は、がんを有する患者由来の試料中で示差的にメチル化された、これらのゲノム領域の分析法を開示するものである。上記発明はゲノム領域を開示するが、最も驚くべきことは4個以下のゲノム領域の組み合わせが非常によく機能することであり、このため現行の診断方法に比べ優れる。
このため、本発明はがんの診断及び/又は予測方法に関連し、(a)対象の試料中の(i)配列番号1に記載のSFN、(ii)配列番号2に記載のSLIT2、(iii)配列番号3に記載のSERPINB5、(iv)配列番号4に記載のTWIST1からなる群から選ばれる一以上のゲノム領域のDNAメチル化状態を分析する工程を含むものであって;(i)SFNにおいてメチル化の閾値80%より大きく、かつ/又は(ii)SLIT2においてメチル化の閾値45%よりも大きく、かつ/又は(iii)SERPBINB5のメチル化の閾値70%よりも大きく、かつ/又はTWIST1はメチル化の度合いが15%未満に、好ましくは10%未満に、最も好ましくは5%未満に低下していれば、前記試料は予後不良ながんの患者の試料に分類される(表1)。
受入番号(Accession numbers)は以下の通りである(表2)。
したがって、本発明は、前立腺がん(PCa)又は乳がん(IBC)のような、がん又は悪性度の高いがんの診断及び/又は予測方法に関するが、これに限定されない。
本発明は、好ましくは対象の試料中の以下のゲノム領域、(i)配列番号1に記載のSFN、(ii)配列番号2に記載のSLIT2、(iii)配列番号3に記載のSERPINB5、(iv)配列番号4に記載のTWIST1、のDNAメチル化状態を分析する工程を備えるがんの診断及び/又は予測方法に関連し;(i)SFNにおいてメチル化の閾値80%より大きく、かつ/又は(ii)SLIT2におていメチル化の閾値45%よりも大きく、かつ/又は(iii)SERPBINB5においてメチル化の閾値70%よりも大きく、かつ/又はTWIST1はメチル化の度合いが15%未満に、好ましくは10%未満に、最も好ましくは5%未満に低下していれば、前記試料はがん患者、又は予後不良ながん患者の試料として分類される。本実施形態では、4個の領域をそれぞれの閾値及びメチル化の尺度でいずれも分析し、データを相加的なリスク算出式に用い、試料を予後不良か否かに分類する唯一の臨床的な閾値を作製する。
本発明の好ましい態様において、症状が表れるよりも前にがんの診断は行われる。悪性度の高い疾病を発症するリスクのより高い対象が特に重要である。本発明の診断方法はまた、がん又は悪性度の高いがんの疑いのある対象において、がんを確認することができる。
上記方法は前立腺がん(PCa)又は乳がん(IBC)の早期診断に特に有用である。上記方法はさらに、特定の大きさの前立腺を有する、または前立腺に関わる症状、例えば異常に高いPSAの水準などを有する患者を診断するのに有用である。上記方法はまた
乳がんと診断された又はマンモグラフの異常があった女性であって、上記遺伝子のメチル化状態を評価するために生検、組織提供、吸引、又は他の組織液の提供をできる女性の追跡試験に有用である。本発明の方法はさらに前立腺がんまたは乳がんの高い発生リスクを有する患者(例えば前立腺がん又は乳がんの家族歴を有する患者、及び変異したがん遺伝子又は他のリスク要因のあることを特定できた患者)に対して特定の使い方ができる。本発明の方法はさらに前立腺がん及び乳がんの患者に対する処置の効果(例えば、化学療法の効果)をモニターするために特定の使い方ができる。
上記方法の一態様において、試料には患者から得られた細胞を含む。かかる細胞は回収した前立腺組織試料、又は胸部試料中から得てもよく、例えば組織生検又は組織切片でもよい。他の態様において、患者の試料は前立腺又は胸部に関わる体液でもよい。かかる液には、例えば血液、リンパ、尿、前立腺液、精液、胸部吸引液、滲出液、又は乳汁があり、またかかる液は、不均一な臨床標本から分離され、単離されたがん細胞を含んでいてもよく、単離には、免疫による選択、流路による選別、又は所望のがん細胞を濃縮する他の方法といった分離・抽出方法を用いてもよい。DNAは超音波処理及び/又は酵素消化による、細胞の破壊又は細胞の可溶化、界面活性剤による処理による細胞膜脂質の除去、並びにアルコールを用いたDNAの沈殿によって、試料から単離することができる。例えば血清試料から極微量の細胞を含有する液体から細胞の含まれていないDNAを回収し精製してもよい。上記工程の後、かかるDNAを分析法に用いることができる。
ゲノム領域のメチル化水準の状態を分析するために、通常の、定量的な、又は半定量的な技術を用いることができる。
最初に抽出した目的のDNAを濃縮してもよく、例えばメチル化DNA免疫沈降(MeDIP)を行ってもよい。その後、直接、又は重亜硫酸塩処理後にDNAのメチル化状態を分析してもよい。一態様において、重亜硫酸塩による手法はメチル化情報を保存するために用いる。このため、DNAを重亜硫酸塩で処理し、これにより非メチル化シトシン残基をウラシルに変換する一方で、メチル化シトシンは無影響のままとする。この選択的な変換によりメチル化は容易に識別及び定量化できるが、かかる変換は目的のDNAにおいてDNA(シトシン)メチル化の有無を明らかにする古典的な方法によるものである。必要であれば検出前に目的のDNAを増幅できる。かかる検出は質量分析により行うことが出来る。目的のDNAを配列決定することが好ましい。適切な配列決定法としては直接配列決定及びピロシーケンスがある。本発明の他の態様において、目的のDNAをゲノム領域特異的なプローブによって検出してもよく、プローブは配列中でシトシンが変換されていてもいなくとも、定量的かつ選択的なものであってもよい。重亜硫酸塩処理の後に応用可能な他の技術としては、メチル化感受性一本鎖構造分析(MS−SSCA)、高分解能融解分析(HRM)、メチル化感受性単一ヌクレオチドプライマー伸長法(MS−SnuPE)及び塩基特異的切断、並びにepiTYPER法がある。その他の方法はSensitive digital quantification of DNA methylation in clinical samples” Nat Biotechnol. 2009 September; 27(9): 858?863に開示されている。これはMethyl-BEAMingと呼ばれる。
これに替わる態様においては、重硫酸塩処理をせずにDNAのメチル化状態を分析してもよく、例えばDNAメチル化水準に鋭敏な酵素により切断したのち、メチル化特異的PCR又はゲノム領域特異的プローブの使用をしてもよく、かかるプローブは、かかる切断によりシトシンのメチル化が示されている場合もいない場合も、かかる配列に対し選択的であってよい。
検出試験により得た生のデータ(例えばヌクレオチド配列)を臨床医の利用する、予想値データに変換するために、コンピュータによるリスク解析のプログラムを用いることができる。
治療を行う臨床医が解釈するのに適した形式の特性データを生成することができる。例えば、生のヌクレオチド配列データ又はメチル化状態を提供するよりも、上記用意された形式の方が、対象に対して、推奨される個別の治療の選択肢に沿った、診断又はリスク評価(例えば現在のがん又はがんのサブタイプの見込み)を表すと考えられる。
いくつかの態様において、上記の結果を臨床的に更なる方針を決定するために用いる。他の態様において、治療方針を決定するために結果を用いる(例えば、治療又は慎重な経過観察)。
上記以外のゲノム領域のメチル化状態、及び/又は上記以外の生物マーカーを分析することが好ましく、下記からなる群から選ばれてもよい。
配列番号5に記載のAPC
配列番号6に記載のHLAa及び/又は
配列番号7に記載のNKX2−5
試料は上記同様に分類され、閾値は以下である。
配列番号5に記載のAPCについては3%であり、
配列番号6に記載のHLAaについては35%であり、かつ/又は
配列番号7に記載のNKX2−5については5%である。
標本中、APC及びHLAaについてメチル化の百分率が閾値よりも高い患者は悪性度の高いがんのリスクが高いと考えられ、これとは逆にメチル化の百分率がNKX2−5の閾値よりも低い患者は悪性度の高いがんのリスクがより高いと考えられる(表3)。
受入番号(Accession numbers)は以下の通りである(表4)。
好ましい態様において本発明は、配列番号1、2及び3、並びに配列番号4、5、6及び/又は7のいかなる組み合わせについても関連する。例えば、配列番号1、2、3及び4;配列番号1、2、3及び5;配列番号1、2、3及び6;配列番号1、2、3及び7;配列番号1、2、3、4及び5;配列番号1、2、3、4及び6;並びに配列番号1、2、3及び4を用いた他のいかなる組み合わせ、でもよい。
ゲノム領域のメチル化状態の分析とは、少なくともゲノム領域ごとのCpG部位のメチル化状態の分析を意味する。
発明者らは、驚くべきことに、本発明におけるゲノム領域中のメチル化状態はほぼ一定であり、かかるゲノム領域内でメチル化水準は一様な分布を示すことを見出した。本発明の一態様においては、ゲノム領域の全てのCpG部位を分析する。特定の態様においては、ゲノム領域の一部におけるCpG部位を分析してもよい。その他の態様においては、ゲノム領域中のCpG部位の部分集合を分析してもよい。理想的にはゲノム領域の1、2、3、4、5、6、7、8、9、10個のCpG部位を分析してもよい。このため、方法に関する本発明の好ましい態様においては、ゲノム領域のメチル化状態を分析することは、
ゲノム領域あたり少なくとも一以上のCpG部位のメチル状態を分析することを意味する。
発明者らは、侵襲性で悪性度の高いものを、非侵襲性で悪性度の高いものと、また同様に良性の組織と正確に区別するには、最小で一つのゲノム領域だけでも、予測には十分であることを見出せたことは、非常に重要であると考える。ゲノム領域の追加による拡張はまたマーカーの組の潜在的な区別する力を増加させる。このため、他の態様において、本発明は、上記以外のゲノム領域のメチル化状態及び/又は上記以外の生物マーカーを分析する方法に関連する。
本発明の一態様においては、がんの生物マーカーをさらに分析する。PCaに関して、これらは例えば、GSTP1、多剤耐性タンパク質1遺伝子(multidrug resistance protein, MDR1)、O-6-メチルグアニン-DNAメチル化酵素遺伝子(O-6-methylguanine-DNA methyltransferase, MGMT)、Ras association domain family member 1(RASSF1)、レチノイン酸受容体ベータ遺伝子(retinoic acid receptor beta, RARB)、腺腫様多発結腸ポリープ遺伝子(adenomatous polyposis coli, APC)、アンドロゲン受容体遺伝子(AR)、サイクリン依存性キナーゼ阻害因子2A遺伝子(cyclin-dependent kinase inhibitor 2A, CDKN2A)、E−カドヘリン遺伝子(E-cadherin, CDH1)、及びCD44遺伝子である。かかる生物マーカーもまた遺伝子発現に基づく、例えばコード化遺伝子である。好ましい態様において前立腺特異的抗原(PSA)の濃度又は活性は免疫測定法により決定される。上述の生物マーカーによる分析法はメチル化状態の分析、遺伝子発現の分析、又はタンパク質の量若しくは濃度又は活性の分析でもよい。
乳がんに対しては、これらはER、PR、HER2といった典型的な胸部マーカー、Ki67といった増殖マーカー、又はOncotypeDx、Mammaprint若しくはPAM-50といったRNAパネルでもよい。
他の態様において、さらに本発明にかかるゲノム領域を分析してもよい。
メチル化状態を、例えば非メチル化特異的PCRに基づく方法、メチル化に基づく方法又はマイクロアレイに基づく方法によって分析する。
本発明の好ましい態様においては、メチル化状態の分析にピロシーケンスを用いてもよい。比較的単純でかつ定量的であることからepiTYPER法又はHRM法もまた好ましい。
上述の通り、DNAメチル化状態の分析にはゲノム領域の一部の配列の増幅のためゲノム領域特異的プライマーが必要な場合がある。
さらに、メチル化状態を直接又は間接に検出するためにゲノム領域特異的プローブを必要とする場合がある。上記核酸は例えばSYBR Green(SYBRは登録商標)を用いた定量的リアルタイムPCRといった技術、又はTaqMan若しくはMolecular Beacon技術に用いてもよく、核酸はゲノム領域特異的プライマー、又はTaqman標識プローブ若しくはMolecular Beacon標識プローブといったゲノム領域特異的プローブの形態で用いられる。本発明の範囲において、核酸は、上述の定義のとおりゲノム領域の一部に対し選択的にハイブリッド形成する。最も好ましくは目的のゲノム領域中で選択的にハイブリッド形成する。本発明の一態様において、一のゲノム領域特異的核酸を用いる。好ましい態様におて、核酸は組にして用い、第1の拡散はゲノム領域の一部のDNA配列のセンス鎖に特異的であり、第2の拡散はこれのアンチセンス鎖に特異的である。
このため、本発明はストリンジェントな条件で、配列番号1から7までのうちの一のゲノム領域の一部とハイブリッド形成する核酸分子に関連し、かかる一部は本明細書で定義する部位に関連する。
一態様において、かかる核酸の長さは15から100ntである。好ましい態様において、かかる核酸の長さは15から50ntであり、最も好ましい態様において15から40ntである。
一態様においてかかる核酸はプライマーである。
本発明の範囲において、ゲノム領域特異的プライマーを、DNAメチル化状態の分析方法の一部分として、PCR法によってゲノム領域の一部のDNA配列を選択的に増幅するために用いる。このため本発明の一態様において、また本明細書で定義される意味においてプライマーは一のゲノム領域に特異的であり、その一部とハイブリッド形成する。
ゲノム領域のメチル化状態は、ゲノム領域特異的プローブを用いて直接又は間接に検出してもよい。このため、本発明の一態様においてかかる核酸はかかる領域の一部とハイブリッド形成するプローブである。プローブはメチル化部位特異的でもよい。
本発明の好ましい態様において、プローブをラベル化する。
メチル化状態を分析するための現行の方法には、経験的に重亜硫酸塩処理が必要であり、これにより非メチル化シトシンをウラシルに変換する。本発明にかかるゲノム領域特異的核酸が、重亜硫酸塩処理したDNAに確実にハイブリッド形成するには、核酸の核酸配列を適応させるのがよい。例えば、シトシンが示差的にメチル化されているとわかる配列に特異的な核酸を設計することが必要であればゲノム領域特異的核酸は2つの配列を有してもよく:第1の配列はアデニンを有してもよく、第2の配列はグアニンを有していてもよく、かかる部位において、ゲノム領域の配列中のシトシンヌクレオチドと相補的でもよい。ゲノム領域のメチル化状態を分析するための試験において、メチル化及び非メチル化シトシンを識別可能な2つの形状を用いることができる。分析方法及び核酸の種類(プライマー/プローブ)によって、一形状のみ又は両方の形状のゲノム領域特異的核酸を試験で用いることができる。このため、本発明の他の態様において、核酸はストリンジェントな条件でも、上述の重亜硫酸塩処理後の一のゲノム領域の一部とハイブリッド形成する。このため重亜硫酸塩処理されたCpG部位とハイブリッド形成してもよい。一つの選択肢においては、メチル化された形態対して、他の選択肢においては、非メチル化形態に対して、上記部位にハイブリッド形成してもよい。
本発明の手段及び方法は、悪性度の高いがん、とりわけPCa又はIBCの診断及び/又は予測のため、ゲノム領域特異的核酸を使用することを含む。
また分析は配列決定により行う。歴史的に、DNA配列を決定するための2つの優れた手法がある:例えばSanger et al, Proc. Natl. Acad. Sci., 74: 5463-5467 (1977)に示すジデオキシ鎖終結法(Sanger法);及び例えばe.g. Maxam et al, Proc. Natl. Acad. Sci. , 74: 560-564 (1977)に示す化学分解法である。しかしながら、より処理効率及び費用効果の高い配列決定法が必要なときは、次世代の配列決定法を用いてもよく、例としてはMetzker, Genome Research 15:1767-1776 (2005)やNext-Genration Genome Sequencing, edited by M. Janitz, Wiley-VCH Verlag, Weinheim/Germany, 2008に紹介されているものがある。
最新の方法の中には、「合成による配列決定」の手法に基づくものがある。このような方法には例えばピロシーケンス(「454シーケンシング」、Roche Diagnostics)技術
があり、かかる技術はピロリン酸の遊離、これのATPへの変換及びホタルルシフェラーゼによる可視光の生成を基盤にしている(EP 0 932 700 B1;Ronaghi, Genome Research 11:3-11 (2001))。これも利用することが出来る。
SOLiDTM法(「Sequencing by Oligonucleotide Ligation and Detection」オリゴヌクレオチドの連結及び検出による配列決定法)(Life Technologies;WO 06/084132 A2)は万能なアダプター配列を介した磁性粒子への鋳型核酸のPCR増幅断片の付着、及びこれに続くアダプター配列にハイブリッド形成するプライマーへの標識プローブの連結を介した断片配列の検出に基づく。読み出しのために4種で蛍光標識された二塩基プローブ一式を用いる。読み出しの後、プローブの一部を切断し、新しい連結、検出及び切断のサイクルを実施する。二塩基プローブを使用することから、各鋳型配列に対し2回の配列決定を実施する必要がある。本方法を用いることもでき、また本方法は本発明において好ましい。
他の、連結による配列決定法としてはCycLiC (Cyclic Ligation and Cleavage、環状連結及び切断法)がある。CycLicは、1ヌクレオチドを除くすべてのヌクレオチドが変性しているオリゴヌクレオチドライブラリを用いる。この方法では標識オリゴヌクレオチドを用いた連続的な連結及び検出工程により、プライマー伸長サイクルを反復し、逐次塩基鎖が伸長する(Mir et al, Nucleic Acids Research 37(1), e5 (2009))。本方法も利用可能である。
Illumina Solexa(登録商標)配列決定法は合成化学による配列決定に基づく(Bentley, Curr Opin Genet Dev. 16(6):545-552 (2006))。独特な「polonies」(重合酵素により作られた集団)が生成され同時に配列決定される。これらの反応は「フローセル」の表面上で平行して起こり、かかるフローセルは数千の平行して起こる化学反応のための大きな表面を供給する
WO 2007/133831は核酸の配列決定方法を開示しており、連結する工程及びアダプターライブラリを含んでいる。配列決定する鋳型は一の配列の繰り返しが大きな鎖状体になっている。これも選択肢とすることができる。
US-A1 6 013 445は上記以外の配列決定方法に関連する。
本発明による方法を実施するための核酸は安定した組成物として調製するのが好都合である。したがって本発明は悪性度の高いがんの診断及び/又は予測に必要な組成物に関連し、上記核酸を含有する。
組成物は他の物質、例えばEGTA等の安定剤、核酸を保護する担体、その他を含んでいてもよい。
本発明は悪性度の高いがん、特にPCa又はIBCの診断及び/又は予測のためのキットを含み、キットは上述の本発明の核酸を有する。
キットは第1のゲノム領域特異的プライマー一式の容器を有していてもよい。好ましい態様において、キットは第2のゲノム領域特異的プライマー一式の容器を有していてもよい。より好ましい態様において、キットは第3のゲノム領域特異的プライマー一式の容器を有していてもよい。さらに好ましい態様において、キットは第4のゲノム領域特異的プライマー一式の容器を有していてもよい。以下同様である。
キットは重亜硫酸塩の容器を有していてもよく、これを用いて目的のゲノム領域の重亜硫酸塩処理をするものでもよい。
キットはまたゲノム領域特異的プローブを有していてもよい。
キットはまた増幅反応を行うための物質の容器を有していてもよく、例えばdNTP(4種のデオキシリボヌクレオチド、dATP、dCTP、dGTP、dTTPのそれぞれ)、緩衝液及びDNAポリメラーゼの容器でもよい。
キットはまた陽性対照及び/又は陰性対照の反応のための核酸の鋳型及び標的の正確な定量を行うために用量反応曲線を構築するための、すでに濃度の分かっていて互いに異なる濃度を有する核酸を含むバイアルを有してもよい。一態様において、重合酵素は核酸鋳型をPCR反応で増幅するために用いる。増幅の他の態様としてリガーゼ連鎖反応(LCR)、ポリヌクレオチドベース配列増幅法(polynucleotide-specific based amplification (NSBA))、又は当業者に知られる他のいかなる方法も含むが、これに限定されない。
キットは配列決定反応を行うための物質の容器を含んでもよく、かかる容器は例えばピロシーケンス用の、DNAポリメラーゼ、ATPスルフリラーゼ、ルシフェラーゼ、アピラーゼ、4つのデオキシヌクレオチド三リン酸(dNTPs)及びルシフェリン等のものでもよい。
表5(原文においてTable 1):
4つの主要なリスク遺伝子関する単変量生存率分析及び本明細書で定義される閾値で高メチル化集団又は低メチル化集団に分割した各リスク集団;全女性数はNで表し、乳がんが再発した女性は(Events)で表す。P値は対数順位検定に基づく(示されている全てのP値はαが0.05より小さく有意である)。
[ヒト前立腺組織標本]
各研究は77人の患者の新鮮な冷凍前立腺組織について行われ、48はがんと診断され、29は前立腺肥大(BPH)と診断されたものである。標本は根治的前立腺全摘除術、経尿道的前立腺切除術(TURP)又はがん患者におけるTURP(channel TURP)により収集された。標本は3つの異なる場所、中国、上海の上海病院、ロンドンのWhipps Cross病院、及びロンドンのSt Bartholomew病院から1996年から2008年にわたって集められた。全ての標本は泌尿生殖器の病理学の専門家により一元的に再調査することで診断を確定した。グリソンスコアの評価は最新の統一基準に基づいて行った。
説明に基づく同意は全ての患者から得られた。イギリスの国家承認はNorthern Multi-Research Ethics Committeeより得られ、その後、共同で作業にあたる各病院の信託を受けた各地の倫理委員会の承認も得られた。中国における標本については上海病院倫理委員会の倫理承認を得られた。
[DNA抽出及び重亜硫酸塩による変換]
ゲノムDNAは新鮮な冷凍材料から得た2−3個の10μmの切片より、QIAamp DNA Mini Kit (Qiagen Inc., Hilden, Germany)を用いて抽出し、UV吸光で定量したところ、概して標本あたり全量で1μgを上回る量のgDNAを得られた。製造者の指示書に従い、EpiTect Bisulfiteキット(Qiagen)を用いて120−300ngのgDNAに対し重亜硫酸塩の転換反応を行い、非メチル化シトシンをウラシルに変換した。短時間のうちにDNAを水、DNA保護緩衝液及び重亜硫酸塩の混合物に混合し、推奨されるサイクル条件にて、サーマルサイクラー(Biometra, Goettingen, Germany)で変換を行った。変換されたDNAをスピンカラムで精製し、全量で40μlのバッファーEBにて二回溶出した。
PCR及びピロシーケンス:本研究ではDNAメチル化遺伝子の候補28個を分析した。1個のビオチンで標識をしたプライマーを有するプライマーの組を重亜硫酸塩により変換されたDNAを増幅するために用いた。各28遺伝子(遺伝子は下記に示す、遺伝子名はUCSC遺伝子命名システムhttp://genome.ucsc.edu/に従う。)に対し新しいプライマーを、PyroMark Assay Design ソフトウェア バージョン 2.0.1.15(Qiagen)を用いて設計し;可能な限り増幅産物の長さを短めの90から140塩基対(bp)とするようプライマーを設計し、後のホルマリン固定パラフィン包埋(FFPE)標本の研究を効率化した。
増幅産物の大きさは最大で210bpに制限した。プライマーが好適なものになるよう試験の設計が許される限り、全てのプライマーは、MethPrimerで特定したプロモーター又は第1エキソンのCpGアイランド内に位置するようにした。いずれのプライマーもCG二塩基で重複することを避け、増幅の偏りのないようにするために注意を払った。増幅産物の中央値は104bpであった。以前他の方法で調べた遺伝子に対し、同一かつ複数のCG、又は近接する部分にある各単数のCGを調べるために、プライマーの位置をとった。ある遺伝子、例えばCDH1、GSTP1において、発明者らはCpGアイランド内にあり数百塩基対離れた二か所の相異なる部位を調べた。全ての重亜硫酸変換に対する内部標準とするため、可能な場所では、ピロシーケンスのための領域内の非CGシトシンを含むものとした。
200細胞に相当する、変換されたgDNAを用いてPyroMark PCRキット(Qiagen)によりPCRを行った。細胞とゲノムのDNAの等価量は計算により二倍体細胞あたり6pgと想定した。短時間のうちに各反応液に対して12.5μlのマスターミックス、2.5μlのCoral red、5pmolの各プライマー、7μlの水及び2μlの試料を混合し、以下の熱サイクル条件を与えた:95℃、15分の後、45サイクル:94℃で30秒;最適化されたプライマーに特異的なアニーリング温度で30秒;72℃で30秒及び最後の伸長のために72℃で10分。DNAが正確に増幅されたことを、TBE緩衝液中と2%の低融点アガロースゲル(Sigma-Aldrich, Steinheim, Germany)又はQiaExelキャピラリ電気泳動装置(Qiagen)にて電気泳動して確認した。
標準的なピロシーケンス試料の調製手順を用いた。3μlのストレプトアビジン粒子(GE Healthcare, Buckinghamshire, UK)、37μlのPyroMark 結合緩衝液(Qiagen)、20μlのPCR産物及び20μlの水を混合し、1300rpmの振動台上で10分間保温した。Biotage Q96 Vaccum Workstationを用い、増幅産物を分離し、変性し、洗浄し、0.33μMのピロシーケンス用プライマーを含有する45μlのアニーリング緩衝液に添加した。プライマーのアニーリングはピロシーケンス前にサンプルを80℃で2分間保温し、室温まで冷却することで行った。PyroGold試薬をピロシーケンス反応に用い、シグナルをPSQ 96MAシステム(Biotage, Uppsala, Sweden)を用いて分析した。ピログラム(pyrograms)をピーク高さの数値に変換し、C/T比のように各塩基ごとのメチル化比率を算出する、装置のソフトウェア(PSQ96MA 2.1)で標的となるCGを評価した。全ての試料において標準曲線を含むように実行し、異なるプライマーの組み合わせの間で標準化し直接比較できるように、標準曲線には対照となるメチル化DNA(0%、25%、50%、75%及び100%)の範囲を含ませた。標準曲線のために、300ngのの非メチル化(Qiagen)及び高度メチル化(Millipore, Billerica, MA, USA)DNAを混合し、DNAメチル化の異なる比率のものを得、その後、上述の通り、重亜硫酸塩により変換した。
[統計解析]
主要な解析は分析した全てのCGの平均値に基づいて行った。解析したCGの数は、ソフトウェアによって定義される変数として許容されるように、遺伝子ごとに2から6の間で異なるものとした。試験の実行数及びコストを限定するため、BPHとがんとの間で、又はグリソンスコアの高低による示差が見込まれない遺伝子は、より少ない標本で調査した。
組織間におけるメチル化の差異をマンホイットニー検定にて調べた。同一のデータにおいて試験された遺伝子の数が大きいことを説明するために、偽陽性率(FDR)を抑制するため、ベンジャミン及びホッホバーグの段階的な方法を利用し、FDRを1%とした。
遺伝子メチル化と年齢との間の関係を調査するため、メチル化をz値で標準化し、生のメチル化から試料の平均値を減算したものを試料の標準偏差により分離した。メチル化と年齢との間の関係をスピアマン試験で調査し、一方でメチル化とグリソンスコアとの対について、Cuzick傾向試験を用いた。PSA測定を伴う場合、メチル化との関連はスピアマンの階級試験を用いた。さらに、全てのがんにおける生の遺伝子メチル化の順位付けに基づくスピアマン係数を算出し、遺伝子間のメチル化相互関係を調査した。真の陽性率(TP、正しく分類されたがんの比率)及び偽陽性率(FP、誤ってフラグされたがんではない比率)を示すために遺伝子によって選ばれる閾値を全ての遺伝子に対して同一の費用関数を用いて遺伝子によって選んだ、すなわちFP−TPを最小化した。
高グリソンスコアを伴うメチル化の調査を補うためRandom Forest分類アルゴリズムを用いた。Random Forestにより特定した遺伝子を詳しく調べるため、線形判別分析から足し合わせた分類境界とともに、プロット(plots)を用いた。グリソンスコア分類の正確性信頼区間(CI)95%をノンパラメトリックなブートストラップ法に基づき1000件再標本化した。全ての統計計算はソフトウェアRバージョン2.9.2を用いて行った。帰無仮説の棄却はα<0.05により推測した。
[候補遺伝子のメチル化の記述統計]
初めに、3件の独立事象においてGSTP1のメチル化を測定することでPSQ法の再現性を調査した。同一のサンプル中で得られたメチル化の最大値と最小値との差の平均は、BPHの事例において7%であり、がんにおいて13%であった;ピアソンの相関は第1の試行と第2の試行との対比では0.90であった一方で、第1から第3の試行の間では0.97であった。上記を一致とみなすのは許容できると考え、その後に続くすべてのデータは各一回の測定に基づいている。
各プライマーの組み合わせについて得た中央値の標準曲線を用いて、各遺伝子のメチル化の測定値の大きさを変更することで、メチル化データをプライマーによる偏りに合わせて調整した。遺伝子に対する補正をすることによるメチル化示差の中央値に対する影響は小さく、また相異なる遺伝子間で比較することが可能になる。28個の遺伝子について調査したところ、20個の遺伝子:RARB、HIN1、BCL2、GSTP1、CCND2、EGFR5、APC、RASSF1A、MDR1、NKX2-5、CDH13、DPYS、PTGS2、EDNRB、MAL、PDLIM4、SERPINB5、HLAa、ESR1、TIG1において、前立腺がんをBPHの組織と区別することが出来、偽発見率は1%であった。閾値を算出し、メチル化示差の診断利用の可能性を評価した。これによりデータを分離でき、RARBにおいては21%メチル化を閾値とすると、すべてのがんが100%の正確性でBPHと分離され、すなわちTP=100%であり、FP=0%であった。
BPH標本では、EGFR5、DPYS、ESR1、MDR1、SERPINB5及びSFNは10%を超えるメチル化の中央値を示しており、大部分の遺伝子はメチル化されていなかった(メチル化の中央値が約2%)ことと対照をなす。BPHにおいて特にSERPINB5及びSFNは約50%メチル化されていた。さらにSERPINB5はがんに比べBPHにおいて有意に高いメチル化状態である唯一の遺伝子であった(p < 0.001)。MCAM、CDKN2A、THRB、TWIST1、CDH1及びDAPK1のメチル化はBPH及びPCaの双方において10%よりも低かった。
[人口統計学的かつ臨床的な共変動と遺伝子メチル化の関係]
PCaにおいて遺伝子メチル化水準、年齢、グリソンスコア、及びPSA水準の関係を調べた。グリソンスコアと、年齢(p < 0.001)及びPSA水準(p = 0.0013)との間には正の相関がみられた。PSAと年齢との間には相関がみられなかった(p = 0.22)。
全体的なメチル化状態と同様、いずれの事例においても、全ての遺伝子にわたって、年齢と標準化したメチル化の平均値との間には正の傾向が見られた(ピアソン相関0.51、p < 0.0001)。さらにP値の分布の点検により全ての遺伝子のメチル化に共通して、年齢の効果を緩和する作用があったことが示されたが、グリソンスコアはいくつかの遺伝子にしかその効果を示さなかった。NKX2-5とAPC(p = 0.009)、TIG1, ESR1, GSTP(p = 0.01)、CDH13、EGFR5(p = 0.02)及びSLIT2(p = 0.04)とは正の相関を示した。Cuzick傾向試験によればSFNSFN (p = 0.01)、TIG1(p = 0.02)、 PDLIM4、APC及びSERPINB5 (p = 0.04)のメチル化はグリソンスコアとの相関を示した。さらにRandom Forest分類によれば、SFN、SLIT2及びSERPINB5の高いメチル化はグリソンスコアの低いがんを、高いものから分離することが出来た(図1)。線形判別境界はRandom Forest分類に基づいて見出された構造を表す。SFN及びSERPINB5のメチル化水準の複合的な基準では、高グリソンスコアのものは正しく分類されていたのとは対照的に、23%(9−47)の低グリソンスコアのものは誤分類されていた。同様にSFN及びSLIT2のメチル化がグリソンスコアの高い62%(47−81)を検出し、低い12%(9−47)を誤分類し、またSERPINB5及びSLIT2のメチル化はグリソンスコアの高い62%(47−81)を検出し、低い13%(3−31)を誤分類した。
17個の遺伝子:HIN1、TWIST1、GSTP1、RARB(p < 0.001)、HLAa、BCL2、APC、PDLIM4、PTGS2、DPYS、CDH13(p < 0.01)及びRASSF1A、MDR1、EGFR5、EDNRB、TIG1、CCND2(p < 0.05)のメチル化水準はPSAと正の相関を示した。さらにBPHとがんとを区別可能だった大部分の遺伝子、例えばRARB、APC、EGFR5、HIN1、RASSF1A、PTGS2及びCDH13は緩やかに相関した。
PSAの他はいずれも制限があるため、前立腺がんの診断又は治療上の予測に現在利用可能で、一般的に受け入れられていて検証された生物マーカーは他にない。PCA3、TMPRSS-ERG、Ki-67、HSP27及びその他といった、いくつかの新しいマーカーが知られているにも関わらず、普及のための確証は得られておらず、このためグリソンスコアおよびPSAは他の臨床情報という面でPCaにおける意思決定において欠かすことが出来ない。
調査した遺伝子20個、すなわちRARB、HIN1、BCL2、GSTP1、CCND2、EGFR5、APC、RASSF1A、MDR1、NKX2-5、CDH13、DPYS、PTGS2、EDNRB、MAL、PDLIM4、SERPINB5、HLAa、ESR1及びTIG1はBPHの組織よりもがんにおいてより高いメチル化がされている一方で、偽発見リスク(FDR)は1%より小さい。発明者らの知る限り、前立腺組織においてMAL、HLAa、SERPINB5、THRB、TWIST1及びSLIT2のメチル化は、ここで初めて示された。THRB及びTWIST1は全体としてメチル化されていない一方で、HLAa及びMALは低いメチル化を示し、それぞれ中央値において15%及び7%の差異で、組織と組織とを相応に区別可能であった。HLAaのメチル化状態はPSAの水準と相関したが、年齢、グリソンスコア又は他の遺伝子のメチル化状態と相関しなかった。SLIT2のメチル化は低かったが、メチル化の中央値はがんにおいて6%まで上昇したのに対し、BPHでは2%以下であり、さらにSLIT2のメチル化レベルでグリソンスコアの高いがんと低いがんを分けることが出来た。
SERPINB5及びSFNのメチル化の平均値はがんにおいてBPHよりも低かく、それぞれ15%(p < 0.001)及び12%(p = 0.05)であった。
調査した標本においてMCAMはメチル化されていなかったが、以前、PCaにおいてMCAMプロモーターの異常なメチル化が報告されていた。
DAPK1、CDH1及びCDKN2Aのメチル化は報告と一致しなかった。発明者らの観察ではBPHにおいて、これらの遺伝子の等しく低メチル化となっていた(中央値<10%)が、小規模ながらも有意な差異は観察されなかった。CDH1に関して、上記観察結果は、以前にメチル化の示差が報告されたいずれのプロモーター領域においても当てはまった。かかる不一致は有意でない差異を、半定量的な方法で増幅したため、メチル化の比率を歪めてしまったものと考えられる。また、これらの遺伝子を見る限りグリソンスコア及びPSAの水準とほとんど相関していなかった。
ベースラインとなるPSAのデータは35のがんのみしか得られなかった点もあるが、HIN1のメチル化がPSA(p < 0.001)と正に相関していたにもかかわらず、年齢及びグリソンスコアと相関が一致する証拠はなかった。TWIST1を除き、16個の遺伝子はがんとBPHとの間で差異を示し、またPSAと正に相関していた(p < 0.05)
乳がん患者、病理標本、及び取扱い:
Dong-A University Medical Centre、Busan、Republic of Koreaにおける124人の乳がん患者について2004年1月から2006年12月まで調査研究した。本研究において、手術時に新鮮な乳がん腫瘍及び隣接する正常な組織標本(それぞれ約0.5×0.5cmで測った)の提供に同意した手術可能な乳がん治療継続患者の全員について、臨床診断及び臨床管理が危険にさらされることなく、かかる試料の収集、速やかな試料の冷凍、及び70℃の超低温冷凍庫での保管ができた。患者は術前化学療法(NACT)を受けたものが含まれる。2又はそれ以上の臨床病理学的なデータのない患者は除外し(n=3)、適格な参加者は121人となった。
全ての標本を乳房の専門医(breast pathologist)(DCK)が一元的に再調査することで診断を確定した。組織病理学的な評価並びにER (DAKO, Clone 1D5, 1:50)、PgR (DAKO, PgR 636, 1:100)、HER2 (Neomarkers、Clone e2-4001/3B5、Fremont、CA、USA,1:200)について製造者の推奨し、国際標準に適合する手順に沿った免疫組織化学試験を実施した。組織学的異型度をNottingham Modification of Richardson Bloom Score (RBS)によって判定した。HER2の発現は免疫組織化学(IHC)で評価を行い、HER2のFISH(PathVisionR HER2 DNA probe kit、Vysis Inc.、Downers Grove、IL、USA)を実施し確認をとったものであり、IHCで2+又は3+(10%を超える腫瘍細胞において強いメンブレン染色あり)の患者に対し行ったところ、これら確認のとれた女性のみではあるがHER2陽性であった。臨床病理学的かつ治療にかかる変量として、年齢、腫瘍の大きさ(病理学的にのみ)、種類、病理組織の悪性度、リンパ節の状態、ER、PgR、HER2、手術の種類、術前/術後処置の詳細(例えば化学療法の種類、サイクル数、放射線療法の分割数、腫瘍母地への追加照射(tumour bed boost)及びその他)を適格のあるすべての患者について本研究のデータベースに記録した。腫瘍の大きさにかかるデータには臨床学的な腫瘍の大きさと、病理学的な腫瘍の大きさとが混ざっており、また何人かの患者はNACTを受けていた。上記変量について不均一なデータであることから、全ての分析は腫瘍の大きさの変量を除外して行った。患者は通常6か月ごとに追跡調査した。
本研究はDong-A University Medical Centreの施設内審査委員会により許可され、また全ての患者より説明に基づく書面での同意を得た。
DNA抽出前に組織片の解体を単純な非顕微鏡下(macrodissection)で行い、がんの領域を濃縮したが、用いた方法は速やかに完了するものであり(1件につき約10分)、また平均的な検査技師が容易に習得できるものであった。標本ごとに5個の連続する切片を、がん組織を凍結切片とすることにより(厚み10μm)を得て、最初と5番目の切片をH&Eで染色し、組織病理学的再検査を行って、がんの領域を確定し、また中央の3個の切片を先導するものとした。ゲノムDNAをQIAamp DNA Mini Kit (Qiagen Inc.、Hilden、Germany)を用いて3片の組織試料から抽出し、またUV吸光度を定量したところ(Nanodrop、Thermo Scientific、Wilmington、Delaware、USA)、大部分の切片からは、切片をひとまとめにして、標本あたり1μgより多いgDNAを得た。120−300ngのgDNAを重亜硫酸塩による転換反応に用い、製造者の手順書に従いEpiTect Bisulfite kit (Qiagen)によって非メチル化シトシンをウラシルに変換した。短時間のうちにDNAを水、DNA保護緩衝液及び重亜硫酸塩の混合物に混合し、推奨されるサイクル条件にて、サーマルサイクラー(Biometra, Goettingen, Germany)で変換を行った。変換されたDNAをスピンカラムで精製し、全量で40μlのバッファーEBにて二回溶出し、さらに20μlの分量に溶出し、100細胞/μl相当とした。(細胞の算出は二倍体細胞あたりDNA6pgと想定した)。
1個のビオチンで標識をしたプライマーを有するプライマーの組を重亜硫酸塩により変換されたDNAを増幅するために用いた。上述の通り、文献より30個の遺伝子を本研究の候補遺伝子として特定した。30個の遺伝子に対し新しいプライマーを、PyroMark Assay Design ソフトウェア バージョン 2.0.1.15(Qiagen)を用いて設計し、可能な限り増幅産物の長さを短めの90から140塩基対(bp)とするようプライマーを設計し、後のホルマリン固定パラフィン包埋(FFPE)標本の研究を効率化した。増幅産物の大きさは最大で210bpに制限した。CG二塩基がいかなる順方向、逆方向又は配列決定プライマーの位置とも重複することを避け、増幅の偏りのないようにするために注意を払った。増幅産物の平均値は117bpであった。以前他の方法で調べた遺伝子に対し、同一かつ複数のCG、又は近接する部分にある各単数のCGを調べるために、プライマーの位置をとった。全ての重亜硫酸変換に対する内部標準とするため、可能な場所では、ピロシーケンスのための領域内の非CGシトシンを含むものとした。各遺伝子に対して3から6のCG位置を調べた。
200から400細胞に相当する、重亜硫酸塩で変換されたgDNAを用いてPyroMark PCRキット(Qiagen)によりPCRを行った。短時間のうちに各反応液に対して12.5μlのマスターミックス、2.5μlのCoral red、5pmolの各プライマー、7μlの水及び2μlの試料を混合し、以下の熱サイクル条件を与えた:95℃、15分の後、45サイクル:94℃で30秒;最適化されたプライマーに特異的なアニーリング温度で30秒;72℃で30秒及び最後の伸長のために72℃で10分。DNAが正確に増幅されたことを、TBE緩衝液中と2%の低融点アガロースゲル(Sigma-Aldrich, Steinheim, Germany)又はQiaExelキャピラリ電気泳動装置(Qiagen)にて電気泳動して確認した。標準的なピロシーケンス試料の調製手順を用いた。3μlのストレプトアビジン粒子(GE Healthcare, Buckinghamshire, UK)、37μlのPyroMark 結合緩衝液(Qiagen)、20μlのPCR産物及び20μlの水を混合し、1300rpmの振動台上で10分間保温した。Biotage Q96 Vaccum Workstationを用い、増幅産物を分離し、変性し、洗浄し、0.33μMのピロシーケンス用プライマーを含有する45μlのアニーリング緩衝液に添加した。プライマーのアニーリングはピロシーケンス前にサンプルを80℃で2分間保温し、室温まで冷却することで行った。PyroGold試薬をピロシーケンス反応に用い、シグナルをPSQ 96MAシステム(Biotage, Uppsala, Sweden)を用いて分析した。標準曲線のために、300ngの非メチル化(Qiagen)及び高度メチル化(Millipore, Billerica, MA, USA)DNAを混合し、DNAメチル化の異なる比率のものを得、その後、上述の通り、重亜硫酸塩により変換した。
最初の30の候補遺伝子から、さらに好ましい遺伝子を選択することを30個の試料を処理した後に行った。年齢、瘤の状態、組織学的異型度、ER、PgR、HER2に関連する(p < 0.1)遺伝子(n=20)を好ましいものとして選択した。残った10遺伝子のメチル化頻度及び水準はとても低かったため、生物マーカーとして機能する見込みがなかった。このため、これらの遺伝子は本研究においてこれ以上調査しなかったので;発明者らは選ばれた好ましい遺伝子20個の発見について説明する。
最初の試験を通過しなかった試料を除き、全ての試料は一回試験した。かかる資料はもう一回試験し、試料が2回目も不成功で失われた場合も同様にデータを記録した。失敗した試料は、調査した試料中でとても低い割合であった。
主な分析は個別のC/T比データを、全てのCGの平均値に変換し、遺伝子断片ごとに分析することであった。分析したCGの数は遺伝子ごとに2から6まで増減があった。各プライマーの組み合わせに対して対照混合物を用いて得た中央値の標準曲線を用いて、各遺伝子のメチル化の測定値の大きさを変更することで、メチル化データをプライマーによる偏りに合わせて調整した。
スピアマン試験を用いて、年齢、瘤の状態、悪性度、ER、PgR、HER2、遺伝子のメチル化の百分率(MeC%)(連続的な尺度)のような種々の臨床組織病理的な変量(分類上)間の関係を調べることで、相関分析を行った。
瘤の状態、悪性度、ER、PgR及びHER2の間の関係を調べることを終点として、再発のない生存事例(RFS)について対数順位検定を用いた単変量分析を行った。カプラン・マイヤーの生存推定線を作成した。生物マーカーの評価及び結果に基づく境界点の最適化には様々な手法が用いられ、X-Tileはそのような手法の一つに過ぎない。しかしながら閾値の決定はX-Tileによる手法の対象となる。発明者らは目的の変量の閾値を判定する同様の手法を用いた。1%の工程における、0%から99%のMeC%からなる異なる閾値は、対数順位検定による単変量解析にて用いられた。閾値により全ての調査の人数(例えば12)の少なくとも10%よりも少ない一の集団を得られることは考慮しなかった。最小のp値をもたらす閾値を選んだ(p値法による好適な閾値)。複数の閾値が同じ最も低いp値となる場合、二集団中の数字が最大の示差となる閾値が選択され(閾値よりも低い一の集団及び上記他のもの);基本的に、相当する閾値が50%よりも小さい場合であれば同一の閾値が、それらが50%よりも大きい場合であればより高い閾値が選択された。
5%よりも小さい、又は90%よりも大きい閾値では、試験の読取り値の微小な差異に対しても敏感なため、試料の分類が不正確になる。再現性の観点から、閾値は、異なる試験ごとの微小な変化に影響されないことが必要である。このため、付加的な条件として、5%以上(≧5%)かつ(≦90%)の閾値を用いてから、遺伝子を多変量分析及び他に付加的に分析するのがよいので;5%よりも小さい又は90%よりも大きい閾値が最も良好であった遺伝子は本研究ではそれ以上調べなかった。
全ての統計計算はソフトウェアRバージョン2.9.2又はSAS10.0を用いて行った。別途指定しない限り、全てのp値は両側でありα<0.05であった。
121人の患者に本調査の組み入れ基準を適用した。全患者が乳房温存手術又は乳房切除術を経験していた。腋窩の管理は腋窩の完全な除去、又はセンチネルリンパ節の生検(SNB)により行った(SNBにより一又は複数の転移節が見つかった者は腋窩の完全な除去を行った)。16人の患者が乳房温存手術を経験し、104人が全乳房切除術を行い、1人の患者で根治的乳房切断を行った。腋窩の最初の進行度診断の手順として49人の患者がSNBを経験した。13人の患者が何らかのNACTを受け、一方で99人の患者が術後のみに化学療法を受けた。9人患者は化学療法を何も受けず、46人がメトトレキサートによる化学療法(CMF)を受け、19人がアントラサイクリンによる化学療法(FAC又はFEC)を受け、かつ32人が逐次組み合わせたアントラサイクリン及びタキサンの処方を受けた(AC/EC後にパクリタキセル又はドセタキセル)。23人の患者が標準的な術後補助化学療法の終了後さらにドキシフルリジンの処方を受けた。60人の患者が放射線療法を受け(乳房温存手術を受けた患者全員が含まれる)、このうち16人が腫瘍母地への追加照射を受けた。ホルモン受容体陽性の閉経前の患者には全員タモキシフェンが5年間処方され、閉経後の患者にはアロマターゼ阻害剤が処方された。中央値で5.1年間(4.87-5.4)の追跡調査の後、25人の患者が再発を経験し、また3人が亡くなった。1人の患者はCMF化学療法の最初のサイクルの後、化学療法に関連する合併症により亡くなり、他の2人の患者の死因は不明であった。5年間の調査機関中に亡くなった患者は生物マーカーのモデル分析から今回は除外した。
大部分の患者(n=112)は浸潤性乳管がん(IDC)を有しており、このうち10人は骨髄に特徴があり;4人が浸潤性小葉がん(ILC)を有しており、また5人の腫瘍は粘液がんや管状がんのような他の形態であった。
各種の組織学的な因子における関連性、遺伝子と臨床病理学的因子との間の関連性、及び遺伝子の中での関連性を調査した。ERはPRとの強い正の相関(Spearman’s Rho = 0.79, p < 0.001)、及びHER2と負の相関(Rho = -0.172、p < 0.042)、並びに悪性度との相関(ERの陽性が小さいほど悪性度が高い;Rho = -0.361、p < 0.001)があった。PgRもまた同様の関連性を有していた;HER2(Rho = -0.252, p = 0.004)、悪性度(Rho = -0.366、p < 0.001)。HER2及び悪性度は互いに関連しておらず、瘤の状態は他のいかなる変量とも関連性が無かった。
図2及び3はIBCにおいて適度に測定可能で示差的にメチル化されていた20遺伝子それぞれについてDNAメチル化の百分率の箱ひげ図を示す。年齢に関連する遺伝子は無かった。SERPINB5及びPDLIM4だけが、悪性度および瘤の状態とそれぞれ正に相関していた。HER2はPDLIM4、RARβ及びRASSF1Aと正に相関していた。大部分の相関は各遺伝子とER又はPgRとの間で見られた。ER及びPgRはCDH13、EDNRB、EGFR5、HIN1、RASSF1Aと正に相関し、RARβ及びSERPINB5と負に相関していた。ER単独でSLIT2と正に相関していた。ほとんどの遺伝子が弱いか、中程度の正の相関を有する一方で、負の相関もいくつか見られ、特にSERPINB5、SFN及び TWIST1で見られた。SERPINB5はEGFR5、MAL、SLIT2、HIN1、CDH13、EDNRB及びRASSF1Aと負に相関した。SFN、SERPINB5及びEGFR5が他の遺伝子に比べ非常に高いMeC%を有するのに対し、DAPK1、HLAa及びRARβではとても低いのは興味深いことであった。
年齢、組織学的異型度、瘤の状態、ER、PgR、HER2及びRFSの間での関連性を単変量生存率分析により探索した。瘤の状態(p = 0.004)だけがRFSと有意に相関していた。組織学的異型度は傾向があったRFSと相関した(p = 0.086)。いずれの変量も多変量分析で検討した。
単変量生存率分析に基づき、上述のスライド式p値最小化(sliding p-value minimization)法を用いて、全20遺伝子において閾値を判定した。選択した閾値において11遺伝子がRFSと有意に相関していたが、7遺伝子(HLAa、NKX2-5、APC、SERPINB5、SFN、SLIT2及びTWIST1)を選びさらに分析したのは、主として最小p値に基づくが、PSQ試験のデータの頑健性も考慮したとき、最も有望な統計的特徴があったからである。カプラン・マイヤーの生存率プロットは異なる女性の集合におけるIBCの再発率を示し、TWIST1、SLIT2、SFN、SERPINB5並びにSFN及びTWIST1の組み合わせが図4、5、6、7及び8のそれぞれに表されている。