関連出願に対するクロスリファレンス
本出願は、本書にその全体が参考として内含されている2003年6月23日付け米国特許出願第10/603,138号の一部継続出願である2003年10月3日付けの米国特許出願第10/679,662号;2003年6月23日付けの米国特許出願第10/602,494号;2004年5月6日付けの欧州特許出願EP04090175,3号;及び2004年2月27日付けの欧州特許出願EP04090072.2号に基づく優先権の利益を請求するものである。
発明の分野
本発明は、正常に比べて疾病状態では改変されたCpGメチル化パターンを示すゲノムDNA配列に関する。特定の実施形態は、結腸直腸細胞増殖障害を検出するため又は検出しかつそれらの間又は中での弁別を行なうために有用である方法、核酸、核酸アレイ及びキットを提供している。
配列リスト
37C.F.R§1.52(e)(5)に従った配列リストが、本書にその全体が参考として内含されている「47675−75.txt.用の配列リスト」という題の4.17MBテキストファイルとしてコンパクトディスク(1中1)上で提供されている。
背景技術
病原性状態の病因論は、個々の遺伝子又はゲノムの修飾されたメチル化パターンが関与するものとして知られている。CpGジヌクレオチド配列の状況下で5−メチルシトシンは、真核細胞のDNA中で最も頻度の高い共有結合により修飾された塩基であり、転写調節、遺伝子インプリンティング及び腫瘍形成において1つの役割を果たしている。特定の標本内又は複数の標本の間又は中の5−メチルシトシン部位の同定及び定量化はかくして、研究においてのみならず、特にさまざまな疾病の分子診断にとって著しく有利なものである。
異常なDNAメチル化と癌の相関関係。CpG「アイランド」内の異常なDNAメチル化は、広範囲の遺伝子スペクトルの解除又は過剰発現を導くCpGジヌクレオチド配列の高メチル化又は低メチル化によって特徴づけされ、ヒトの急性腫瘍の中に見られそれと相関される最も早期で最も一般的な改変の1つである。さらに、或る種の腫瘍については遺伝子のイントロン及びコーディング部分内のCpG富有調節要素の中で、異常なメチル化が発生することが示されてきた。例えば、結腸癌内では、異常なDNAメチル化が最も顕著な改変の1つを構成し、P14ARF、P16INK4a、THBS1、MINT2及びMINT31といったような数多くの腫瘍抑制遺伝子及びhMLH1といったようなDNAミスマッチ修復遺伝子を不活性化する。
腫瘍抑制遺伝子の特異的高メチル化とは対照的に、DNAの全体的低メチル化が腫瘍細胞に観察できる。この包括的メチル化の減少は、明白な腫瘍形成の発生よりはるかに前の早期に検出することができる。数多くの腫瘍遺伝子について、低メチル化と遺伝子発現の増加の間に相関関係が見極められてきた。
米国では、結腸直腸癌の年間発生は、約150,000例であり、毎年56,600人が結腸直腸癌で死亡している。人口全般における結腸直腸癌の生涯リスクは、約5〜6パーセントである。結腸癌のスクリーニング及び早期検出における近年の集中的な取り組みにもかかわらず、今日まで大部分の症例は、局所的又は遠位転移を伴う進行期に診断される。治療の選択肢としては外科手術及びアシュバント又は苦痛緩和的化学療法が含まれるものの、大部分の患者は、数カ月以内でその癌の進行によって死亡する。結腸癌の発生の根底にある分子変化を同定することは、これらの患者の全体的に不良な予後を改善できる新しい管理、スクリーニング、診断及び治療選択肢の開発の一助となるかもしれない。
米国癌協会による結腸直腸スクリーニングのための現行の指針は、50歳以上の平均リスク個体におけるスクリーニングのための5つの異なる選択肢のうちの1つを利用している。これらの選択肢には、1)年一回の糞便潜血検査(FOBT)、2)5年に一回のファイバスコープS状結腸鏡検査、3)年一回のFPBTと5年に一回のファイバスコープS状結腸鏡検査、4)5年に1回の二重造影バリウム注腸(DCBE)又は5)10年に1回の結腸鏡検査が含まれる。これらの処置は医学界で充分受け入れられているにせよ、結腸直腸癌のための広く行き渡ったスクリーニングの実施は、実現されていない。これらの処置に付随する不快又は不便さに起因して使用が限定されている主たる要因は患者のコンプライアンスにある。FOBT検査は、非侵襲的処置であるものの、検査の3〜5日前に規定食及びその他の制約が求められる。この検査の検出感度レベルも又、結腸直腸腺癌については非常に低く、試行によって広く変動する。腺腫の検出のための感度測定値は、大部分の腺腫が出血しないことから、さらに低くなる。これとは対照的に、S状結腸検査、結腸鏡検査といったようなより侵襲的処置についての感度は、結腸の内腔の直接的視覚化のためきわめて高い。無作為化試験のいずれもこれらの技術の有効性を評価しなかったが、ケースコントロールスタディからのデータ及び米国ポリープ研究(National Polyp Study)からのデータを用いて、腺腫ポリープを取除くと結果としてCRC発生が76〜90%低減されるということが示されてきた。S状結腸鏡検査法は、結腸の左側だけを視覚化して右側結腸内の病巣を未検出のままに残すという限界をもつ。内視鏡検査処置は両方共費用が高く、下剤による前処理を必要とし、罹病及び死亡リスクが高い。結腸直腸癌の一般的に広く行きわたったスクリーニングが日常的になるには、感度、特異性、使用し易さが高まり、コストが低くなった改良型の検査が明らかに必要である。
早期結腸直腸癌検出は一般に、無症候性の個体に対し年に一回実施される糞便潜血検査(FOBT)に基づいている。米国癌協会を含めた複数の健康管理機構によって適合化された現行の推奨事項は、50才から始めて、患者にとってもはやスクリーニングが有効でなくなる時期まで年一回の割合でくり返し糞便潜血検査を行なうことを求めている。FOBTが陽性となった場合に、腸の結腸鏡検査を行うことになるが、これは、高価で侵襲的な処置であり、5000回に1回の割合で検査の重大な合併症が伴う。排泄物がヘム陽性である患者の12%のみが、結腸鏡検査の時点で癌又は大きなポリープをもつと診断される。FOBTスクリーニングが癌関連死亡率又は全体的生存率を改善することはないということは、数多くの研究が示している。潜血検査に対するコンプライアンスは低いものであった。オファーを受けるか又は推奨されている通りにFOBTを実施する国民は全体の20パーセント未満である。FOBTが適切に行なわれるならば、患者は、連続する3回の便通から糞便試料を収集する。試料は、患者が規定食指針を順守しかつ潜在的な胃腸出血を誘発するものとして知られている投薬を回避している間に得られる。現実には、医師は、患者に適切に指示を与えずにいることが多く又、患者はプロトコルを順守しないことが多く、又一部の患者は、糞便試料の収集という作業が困難又は不快なものであると考えており、かくして年一回の潜血検査についてのコンプライアンスは低い。検査の感度及び特異性を現行の方法よりも改善できれば、検査の頻度を削減することができ、連続した試料の収集が無くなり規定食及び投薬計画の修正も無くなり、患者のコンプライアンスも強まることになるだろう。コンプライアンスの問題との折合いをつけると、FOBTの感度及び特異性は低くなる。低い検査特異性は不必要な結腸鏡検査を導き、結腸癌のスクリーニングに多大な出費を追加する。
FOBTの特異性は、43%(腺腫)及び50%(結腸直腸癌)の感度で、最高で96%であるものと計算されてきた。「In SureTM」という商品名の下で生産されているもののような免疫検定FOBTを用いて、感度を改善することが可能であり、感度の改善は77%(腺腫)及び88.9%(結腸直腸癌腫)である。
分子疾病マーカーは、他のタイプのマーカーに比べいくつかの利点を提供し、1つの利点は、組織アーキテクチャが維持されていない試料及び/又は非常に小さい試料でもかなり効率良く分析可能であるという点にある。過去10年間に、正常と結腸癌腫の間で数多くの遺伝子は異なる形で発現されることが示されてきた。しかしながら、どの単一のマーカーもマーカー組合せも、結腸癌腫の診断には充分であることは示されていない。高次元mRNAベースのアプローチは最近、異なる腫瘍タイプ及び良性及び悪性病巣を区別する、より優れた手段を提供できることが示されてきた。しかしながら、臨床環境内での日常的診断ツールとしてのその応用は、mRNAの極度の不安定さ、或る一定の誘因(例えば試料収集)の後の急速に発生する発現変化及び最も重要なことには、日常的生検から得ることができないことが多い、分析に必要とされる大量のmRNA(Lipshutz, R. J. et al., Nature Genetics 21:20-24, 1999; Bowtall, D. D. L. Nature genetics suppl. 21:25-32, 1999)により妨げられている。
FOBTの感度及び特異性をさらに改善するための生物学的マーカーの使用は、これまで提案されてきており、かかる検査の例としては、20%(腺腫)及び52%(結腸直腸癌腫)の感度及び両方のケースにおいて95%の特異性をもつEXACTSciencesから入手可能なPre Gen-PlusTM検便検定が含まれる。この検査は、結腸新生物の発生に付随する23のDNA突然変異の存在について検定する。DNAメチル化を結腸癌マーカーとして使用することは、既知である。例えば、Sabbioni et al., (Molecular Diagnosis 7:201-207, 2003)は、結腸癌腫患者の98%において末梢血中にTREF、HIC1、DAPK及びMGMTから成る遺伝子パネルの高メチル化を検出した。しかしながら、かかる検査の特異性は、同様に充分高いものであると考えられることから、これはまさに商業的に市場性の高い検査のための適切な基礎を提供する。
結腸直腸の病因論の現行モデルは、異形成そして最終的に、侵襲性癌の兆候の発生を含む腺腫の段階的進行に有利に作用する。この腺腫−癌腫シーケンスの基礎を成す分子変化には、腫瘍抑制遺伝子(APC、p53、DCC)の遺伝的及びエピジェネティック改変、腫瘍遺伝子の活性化(K−ras)及びDNAミスマッチ修復遺伝子の不活性化が含まれる。最近、さらなる分子変化及び遺伝子欠陥が明らかにされてきた。かくして、Wntシグナリング経路の活性化には、APC遺伝子の改変が含まれるばかりでなく、β−カテニン突然変異の結果としてももたらされ得る。さらに、そのシグナルトランスジューサSMAD4及びSMAD2と合わせてTGF−βシグナリング経路内の改変が、結腸癌の発生に結びつけられてきた。
結腸腺腫及び癌腫の病因論及びその遺伝的及び分子的変化の理解が近年進歩してきたにもかかわらず、転移の発生の基礎を成す遺伝的及びエピジェネティック変化はさほど理解されていない。しかしながら、細胞外マトリクスの侵入及びタンパク質分解プロセスならびに血管基底膜の浸透には、接着タンパク質例えば、インテグリン受容体ファミリの成員、カドヘリン、免疫グロブリンスーパーファミリー、ラミニン結合タンパク質及びCD44受容体が関与するということは一般に充分受入れられている。接着以外に、転移形成プロセスは同様に、血管形成の誘発及び調節(VEGF、bFGF、細胞増殖の誘発(BGF、HGF、IGF)及びタンパク質分解酵素の活性化(MMP、TIMP、uPAR)ならびにアポトーシスの阻害(Bcl−2、Bcl−X)を内含する。より近年では、その他のグループが、転移病巣中の遺伝的及び分子的変化を原発性結腸直腸癌内に見られる変化と比較した。かくして、Kleeff et al.,は、原発性及び転移性の両方の結腸直腸癌における腫瘍抑制遺伝子候補であるDOC−2の損失について報告している。さらにZavber et al.は、彼らの42の結腸直腸癌シリーズ内で原発性癌におけるKi−ras突然変異か42の対合した原発性及び同期的転移性病巣の全てにおいて同一であることを報告した。同様にして、APC遺伝子座における異型接合性の喪失は、39の対合した癌腫及び同期的転移について同一であった。著者らは、Ki−ras及びAPC遺伝子について、転移内の遺伝的変化が原発性結腸直腸癌と同一であるという結論を下した。しかしながら、その他のグループは、原発性癌内に存在しない遺伝的及び分子的変化を転移性癌内に発見した。かくして、結腸直腸転移内の染色性3PのLOHの発生が報告されてきた。さらに、比較用ゲノムハイブリダイゼーションを用いて、転移性病巣に独特のいくつかの改変が肝臓転移内に発見された(−9q、−11q及び−17q)。
突然変異とは別に、CpGアイランドの異常なメチル化が、以前はさまざまな癌の病因論に結びつけられてきた或る種の遺伝子の転写サイレンシングを導くことが示されてきた。CpGアイランドというのは、CpGジヌクレオチド内に豊富であって通常全てのヒト遺伝子の約50%の5’領域内に発見され得る短い配列である。これらのアイランド内でのシトシンのメチル化は遺伝子発現の喪失を導き、X染色体の不活性化及びゲノミックインプリンティングにおいて報告されてきた。
最近、複数のグループが同様に、結腸直腸癌におけるさまざまな遺伝子のメチル化を分析し、なかでもp16INK4、p14ARF、p15INK4b、MGMT、hMLH1、GSTP1、DAPK、CDH1、TIMP−3及びAPCについてのプロモータメチル化による転写サイレンシングを報告した。かくして或る種の遺伝子の突然変異不活性化とは別に、これらの遺伝子の高メチル化も又、この疾病の病因に著しく寄与している。
近年、MS−APPCRにより、結腸癌においてメチル化されるいくつかの遺伝子が同定されてきた。この遺伝子群には、なかでも、結腸癌内で頻繁にメチル化されMS−APPCR方法を用いて2つの異なるグループにより独立して同定されたTPEF/HPP1が含まれる(Young J, Biden KG, Simm LA, Huggard P, Karamatic R, Eyre HJ, Sutherland GR, Herath N, Barker M, Anderson GJ, Fitzpatrick DR, Ramm GA, Jass JR, Leggtt BA, HPP1:結腸直腸ポリープ及び癌において一般にメチル化される膜内外タンパク質コーディング遺伝子。Proc Natl Acad Sci USA 98:265-270, 2001)。
多因子アプローチ。癌の診断は、従来、単一の分子マーカーの検出に依存していた(例えば遺伝子突然変異、高いPSAレベル)。残念なことに、癌は、単一のマーカーが標準的にその数多くの形態を検出又は弁別することができないでいる1つの疾病状態である。かくして、単一のマーカーのみを認識する検定は、予測的価値の低いものであることが示されてきた。本発明の基本的な1面は、メチル化に基づく癌診断及びかかる疾病のスクリーニング、診断及び治療用管理が、選抜された多数のマーカーを使用することにより、単一のマーカーの分析を用いる技術的現状に比べて著しい改善を提供することになるという点にある。癌は単純な病気ではないことから、多重化された分析アプローチは、癌の診断のために特に適しており、この多因子「パネル」アプローチは、細胞学的にも臨床的にも癌の不均一性と一貫性をもつ。
メチル化に基づく診断学的検査に対するパネルアプローチ実施の成功の鍵は、疾病状態を特徴づけし区別できる最適化されたマーカーパネルの設計及び開発にある。
医学的検査の開発。あらゆる医学的スクリーニング又は診断学的検査の2つの主要な評価尺度は、例外なく、かつ標的疾患をもたない個体を誤って内含することなく、罹患した個体全てを正確に検出するようにその検査がいかに優れた性能を示すかを測定する、その感度と特異性である(予測値)。歴史的には、数多くの診断学的検査が、感度及び特異性の低さのために批判を受けてきた。
真陽性(TP)は、検査が陽性であり病気が存在する場合である。偽陽性(FP)結果は、検査は陽性であるものの病気が存在しない場合である。真陰性(TN)は、検査は陰性であり、病気が存在しない場合である。偽陰性(FN)は、検査は陰性であるが病気が存在しない場合である。この状況下で、感度=TP/(TP+FN);特異性=TN/(FP+TN);そして予測値=TP/(TP+FP)である。
感度は、検査されている個体の体内の標的疾患を正しく検出する検査の能力の1つの尺度である。感度の低い検査は、高い率で偽陰性すなわちその疾病を有するもののその特定の疾病を有していないものとして誤って同定されている個体を生成する。偽陰性の潜在的危険性は、罹患した個体が一定の期間診断も治療もされずにとどまり、その間に該疾病が、治療方法があってもその効力が低くなっている可能性のあるより後期まで進行するかもしれないという点にある。感度が低い検査の一例は、HIVについてのタンパク質ベースの血液検査である。このタイプの検査は、その疾病が充分に確立されてウイルスが実質的な数で血流に侵入してしまうまでウイルスの存在を検出できないことから、低い感度を示す。これとは対照的に、高い感度をもつ検査の一例は、ポリメラーゼ連鎖反応(PCR)を用いたウイルス量検出である。高感度は、このタイプの検査が非常に少量のウイルスを検出できるという理由で達成される。高感度は、特に診断ミスの結果が重大である場合に重要である。
一方、特異性は、疾病状態をもたない患者を正確に同定する検査の能力の尺度である。特異性の低い検査は、高い率の偽陽性すなわち、疾病を有するものとして誤って同定される個体を生成する。偽陽性の不利益は、それにより患者は強制的に不要な医療処置を受けさせられ、それにはリスク、情緒的ストレスが付随し、患者の健康に対し不利な影響を与える可能性がある、ということにある。高い特異性をもつ診断的検査の開発を困難にしている疾病の特長は、特に癌における疾病のメカニズムに往々にして複数の遺伝子及びタンパク質が関与する、ということにある。さらに、疾病状態とは無関係の理由で或る種のタンパク質が高くなる可能性がある。高い特異性をもつ検査の一例は、p53突然変異を検出できる遺伝子ベースの検査である。さらなる診断的処置又はさらなる医療的介入に付随するコスト又はリスクが非常に高い場合、特異性が重要である。
当該技術分野における顕著なニーズ。結腸癌スクリーニング特異性を増大させることができるならば、不必要な結腸鏡検査に導く偽陽性の検査結果の問題は低減され、コストの節約及び安全性の改善が導かれることになるだろう。
結腸癌の発生率及び現行の結腸直腸細胞増殖障害スクリーニング方法に付随する欠点を考慮して、現在利用可能な検定に加えて又はその代替として使用されるように結腸細胞増殖障害特に結腸癌の早期検出のための改良型方法に対する実質的にニーズが、当該技術分野において存在している。
発明の要約
本発明のさまざまな態様が、効率の良い独特の遺伝子パネルを提供しており、これによると該パネルの成員の1つ又はそれらの組合せのメチル化分析が、特に高い感度、特異性及び/又は予測値で前立腺の細胞増殖障害の検出を可能にしている。本発明の結腸直腸癌細胞検査方法は、高いリスク集団のスクリーニングにとって特に有用である。本発明の方法は、感度、特異性及び確率の高い患者のコンプライアンスが改善されていることから、先行技術の方法(業界標準FOBTを含む)に比べた利点を有する。
本発明は、結腸直腸細胞増殖障害の検出又はそれらの間の区別のための新規方法を提供する。前記方法は、最も好ましくは、結腸直腸癌腫、結腸腺腫、炎症性結腸組織、1cm未満の悪性度2の異形成結腸腺腫、1cmより大きい悪性度3の異形成結腸腺腫、正常な結腸組織、非結腸正常組織、体液及び非結腸癌組織のうちの単数又は複数のものを検出するため又は検出してそれらの間で区別するために利用される。
該発明のさらなる−実施形態においては、該発明に従った方法は、気道消化器細胞増殖障害の検出のために使用される。
1実施形態においては、該発明は、対象の体内の結腸直腸細胞増殖障害を検出するため及び/又は検出しかつそれらの間又は中で区別を行なうための方法を提供する。前記方法は、i)血漿、血清、全血、単離された血液細胞、対象から得た血液から単離された細胞から単離されたゲノムDNAを、該ゲノムDNAの少なくとも1つの標的領域内のメチル化及び非メチル化CpGジヌクレオチドを区別する少なくとも1つの試薬又は一連の試薬と接触させる段階であって、前記標的領域のヌクレオチド配列が少なくとも1つのCpGジヌクレオチド配列を含んでいる段階、ii)80%以上の感度及び80%以上の特異性で提供される、結腸直腸細胞増殖障害を検出するか又は検出しかつそれらの間又は中での区別を行なう段階、を含んで成る。
好ましくは、感度は、約75%〜約96%又は約80%〜約90%、又は約80%〜約85%である。好ましくは、特異性は約75%〜約96%又は約80%〜約90%又は約80%〜約85%である。
規制機関が認可した市販の検定において使用するのに充分なほど高い感度及び特異性をもつ、体液分析による結腸癌の検出を可能にする方法が現在全く存在しないことから、該方法は新規のものである。結腸直腸細胞増殖障害を検出し診断するのに使用される現行の方法には、結腸鏡検査、S状結腸鏡検査法及び糞便潜血結腸癌が含まれる。これらの方法に比べると、開示されている発明は、結腸鏡検査よりも侵襲度が低く、S状結腸鏡検査法及びFOBTに比べより感度が高いとはいわないまでも同等の感度を示す。体液検定の開発は、単一の体液ベースの検査に対する患者のコンプライアンスが、現在FOBTについて推奨されている排泄物の3重分析に比べて高くなることが予想されるという点で、当該技術分野において既知の現行の方法に比べて明白な技術的利点を表わす。
特定の実施形態においては、該発明は、結腸直腸細胞増殖障害の弁別、検出及び区別のためのマーカーとしての、配列番号1〜3、14、16、21、22、23、44〜46、48、50、59〜64、COX7B、CST5、EYA3、FTH1、RNF4、SOX21、RNF4、ALX4、ONC2、NGFR、DLX−5、HVIAAT、BTF3相同体1、ADCY9、BCL−5、BCOR、TAFII28、HOMEOBOX PROTEIN SIX6、GSK−3BETA、ELK−L、HLA−F、TGFBR2、AR、RNF30及びDUX4から成る群から選択された単数又は複数の遺伝子又はゲノム配列の使用を含んで成る。
遺伝子の前記使用は、遺伝子の発現のあらゆる分析、mRNA発現分析又はタンパク質発現分析を用いて可能にすることができる。しかしながら、該発明の最も好ましい実施形態においては、結腸直腸細胞増殖障害の検出、弁別及び区別は、配列番号1〜3、14、16、21、22、23、44〜46、48、50、59〜64、COX7B、CST5、EYA3、FTH1、RNF4、SOX21、RNF4、ALX4、ONC2、NGFR、DLX−5、HVIAAT、BTF3相同体1、ADCY9、BCL−5、BCOR、TAFII28、HOMEOBOX PROTEIN SIX6、GSK−3BETA、ELK−L、HLA−F、TGFBR2、AR、RNF30、DUX4から成る群から選択された単数又は複数の遺伝子又はゲノム配列及びそれらのプロモータ又は調節要素の「メチル化状況」の分析を用いて可能となる。
該発明は、結腸直腸細胞増殖障害の発生に付随する特長について生体試料を分析するための方法において、配列番号1〜配列番号535から成る群からの少なくとも1つの核酸又はそのフラグメントを、ゲノム配列又は問題の配列内のメチル化された及びメチル化されていないCpGジヌクレオチドの間の区別を行なう能力をもつ試薬又は一連の試薬と接触させることを特徴とする方法を提供している。
本発明は、ゲノムDNAの遺伝的及び/又はエピジェネティックパラメータを確認する方法を提供する。該方法は、より特定的に言うと、結腸直腸細胞増殖障害のサブクラスの同定及びその間の弁別の改善を可能にすることによって、この障害の診断、治療及び管理を改善するのに有用である。該発明は、結腸直腸細胞増殖障害のきわめて特異的な分類を可能にしかくして患者の改善されたインフォームド治療を可能にするという点で、技術的現状に比べて改善を呈する。
好ましくは、検査試料の供給源は、細胞又は細胞系列、組織学的スライド、生検材料、パラフィン包埋組織、体液、射精精液、排泄物、尿、血液及びそれらの組合せから成る群から選択される。好ましくは、該供給源は、排泄物、血漿、血清、全血、単離血球、対象から得た血液から単離された細胞から成る群から選択される。
特定的には、本発明は、結腸直腸細胞増殖障害の検出方法において、ゲノム核酸(単複)を含む生体試料を得る段階;該核酸の標的配列内のメチル化及び非メチル化CpGジヌクレオチド配列の間の区別を行なうのに充分な1つの試薬又は複数の試薬と、該核酸(単複)又はそのフラグメントを接触させる段階であって、該標的配列が配列番号1〜64の少なくとも16の隣接ヌクレオチドを含む配列を含むか又はストリンジェント条件下でそれにハイブリッド形成し、前記隣接ヌクレオチドが少なくとも1つのCpGジヌクレオチド配列を含んでいる、段階;及び、少なくとも部分的に前記区別段階に基づいて、少なくとも1つの標的CpGジヌクレオチド配列のメチル化状態又は、複数の標的CpGジヌクレオチド配列の平均メチル化状態、又はその平均メチル化状態を示す値を決定する段階を含んで成る方法を提供している。好ましくは、標的配列内でメチル化CpGジヌクレオチド配列と非メチル化CpGジヌクレオチド配列を区別する段階には、配列番号304〜配列番号535及び配列番号65〜配列番号88及び標的配列に対応するその隣接領域から成る群から選択された配列内の対応する転換済み又は未転換ジヌクレオチド配列への、少なくとも1つのかかるCpGジヌクレオチド配列のメチル化状態依存性転換又は非転換が含まれている。
付加的な実施形態は、結腸直腸細胞増殖障害の検出のための方法において、対象のゲノムDNAを有する生体試料を得る段階;ゲノムDNAを抽出する段階;その5位置でメチル化されていないシトシン塩基をウラシル又はハイブリダイゼーション特性に関してシトシンと検出可能な形で異なっているもう1つの塩基に転換するべく、a)のゲノムDNA又はそのフラグメントを単数又は複数の試薬で処理する段階;処理済みゲノムDNA又はその処理済みフラグメントを、各々の場合において配列番号304〜配列番号535及び配列番号65〜配列番号88又はその補体から成る群から選択された1配列と相補的であるか又はそれに対して穏やかにストリンジェントな又はストリンジェントな条件下でハイブリッド形成する長さが少なくとも9ヌクレオチドの隣接配列を含む少なくとも2つのプライマ及び1つの増幅酵素と接触させる段階であって、ここで処理済みゲノムDNA又はそのフラグメントが増幅物を産生するべく増幅されるか、または増幅されていない、段階;及び前記増幅物の存在又は不在又はその特性に基づいて、配列番号1〜配列番号64から成る群から選択された1配列の少なくとも1つのCpGジヌクレオチドのメチル化状態、又はその複数のCpGジヌクレオチド配列の平均メチル化状態又はその平均メチル化状態を示す値を決定する段階を含んで成る方法を提供している。好ましくは、少なくとも1つのこのようなハイブリッド形成する核酸分子又はペプチド核酸分子は、固相に結合されている。好ましくは、決定段階には、配列番号304〜配列番号535及び配列番号65〜配列番号88又はその補体から成る群から選択された1配列と相補的であるか又はそれに対して穏やかにストリンジェントな又はストリンジェントな条件下でハイブリッド形成する長さが少なくとも9ヌクレオチドの隣接配列を含む少なくとも1つの核酸分子をハイブリッド形成すること;配列番号304〜配列番号535及び配列番号65〜配列番号88又はその補体から成る群から選択された1配列と相補的であるか又はそれに対して穏やかにストリンジェントな又はストリンジェントな条件下でハイブリッド形成する長さが少なくとも9ヌクレオチドの隣接配列を含む、固相に結合された少なくとも1つの核酸分子をハイブリッド形成すること;配列番号304〜配列番号535及び配列番号65〜配列番号88又はその補体から成る群から選択された1配列と相補的であるか又はそれに対して穏やかにストリンジェントな又はストリンジェントな条件下でハイブリッド形成する長さが少なくとも9ヌクレオチドの隣接配列を含む少なくとも1つの核酸分子をハイブリッド形成し、少なくとも1つのヌクレオチド塩基だけ少なくとも1つのかかるハイブリッド形成された核酸分子を拡張させること;及び増幅物の配列決定、から成る群から選択された少なくとも1つの方法の使用が含まれている。
さらなる実施形態は、結腸直腸細胞増殖障害を分析するための方法において、対象のゲノムDNAを有する生体試料を得る段階;ゲノムDNAを抽出する段階;配列番号1〜配列番号64又はそれに対してストリンジェント条件下でハイブリッド形成する配列から成る群から選択された単数又は複数の配列を含むゲノムDNA又はそのフラグメントを、単数又は複数のメチル化感応性制限酵素と接触させる段階であって、ゲノムDNAが、それによって消化されて消化済みフラグメントを形成するか又はそれによって消化されない段階;及び少なくとも1つのかかる分割フラグメントの存在又は不在又はその特性に基づいて、配列番号1〜配列番号64から成る群から選択された単数又は複数の配列の少なくとも1つのCpGジヌクレオチド配列のメチル化状態、又はその複数のCpGジヌクレオチド配列の平均メチル化状態又はその平均メチル化状態を示す値を決定する段階を含んで成る方法を提供する。好ましくは、消化された又は未消化のゲノムDNAは、前記決定段階の前に増幅される。
付加的な実施形態は、配列番号1〜配列番号64から成る群から選択された配列内のシトシンメチル化パターンの分析のための新規のゲノム及び化学修飾済みの核酸配列、ならびにオリゴマーヌクレオチド及び/又はPNAオリゴマーを提供する。
発明の詳細な説明
定義
「観察/予想比」(「O/E比」)というのは、特定のDNA配列内のCpGジヌクレオチドの頻度を意味し、[CpG部位の数/(C塩基の数×G塩基の数)]×各フラグメントについてのバンド長に対応する。
「CpGアイランド」という語は、(1)「観察/予想比」>0.6に対応するCpGジヌクレオチドの頻度を有する、及び(2)「GC含有量」>0.5を有する、という基準を満たすゲノムDNAの隣接領域を意味する。CpGアイランドは標準的には約0.2から約1kb又は約2kbまでの間の長さを有するが、つねにそうであるとはかぎらない。
「メチル化状態」又は「メチル化状況」という用語は、DNA配列内の単数又は複数のCpGジヌクレオチドにおける5−メチルシトシン(「5−mCyt」)の存在又は不在を意味する。DNA配列内の単数又は複数の特定のCpGジヌクレオチド(各々2つのCpGCpGジヌクレオチド配列を有する)におけるメチル化状態は、「未メチル化」「完全−メチル化」及び「半−メチル化」を含む。
「半メチル化」又は「半−メチル化」という用語は、パリンドロームCpGメチル化部位の2つのCpGジヌクレオチドのうちの1つの中の単一のシトシンのみがメチル化されている(例えば5’CCMGG−3’(最上部ストランド):3’−GGCC−5’(最下部ストランド)パリンドロームCpGメチル化部位のメチル化状態を意味する。
本書で使用されている通りの「AUC」という用語は、曲線下の面積の省略形である。特にそれは受信者動作特性(ROC)曲線より下の面積を意味する。ROC曲線は、診断学的検査の考えられる異なるカットポイントについての偽陽性率に対する真正陽性率のプロットである。それは、選択されたカットポイントに応じた感度と特異性の間のトレードオフを示す(感度の増大にはことごとく、特異性の減少が伴うことになる)。ROC曲線下の面積(AUC)は、診断学的検査の精度のための1つの尺度である(この面積が広くなればなるほど、精度はよくなり、最適は1であり、無作為検査は、0.5の面積をもつ対角線上に存在するROC曲線を有することになる;参考としてJ.P.Egan.シグナル検出理論及びROC分析、Academic Press, New York,1975)。
「高メチル化」という用語は、正常な対照DNA試料内の対応するCpGジヌクレオチドで発見される5−mCytの量との関係における検査用DNA試料のDNA配列内の単数又は複数のCpGジヌクレオチドにおける5−mCytの存在の増加に対応する平均メチル化状態を意味する。
「低メチル化」という用語は、正常な対照DNA試料内の対応するCpGジヌクレオチドで発見される5−mCytの量との関係における検査用DNA試料のDNA配列内の単数又は複数のCpGジヌクレオチドにおける5−mCytの存在の減少に対応する平均メチル化状態を意味する。
「マイクロアレイ」という用語は広義には、当該技術分野において認められている通りの「DNAマイクロアレイ」及び「DNAチップ(単複)」の両方を意味し、全ての当該技術分野で認められた固体支持体を包含し、それに対する核酸分子の添加又はその上への核酸の合成のための全ての方法を包含する。
「遺伝的パラメータ」というのは、その調節のためにさらに必要とされる遺伝子及び配列の突然変異及び多型性である。突然変異として指定されるべきものは、特に挿入、欠失、点突然変異、逆位及び多型であり、特に好ましいのはSNP(単一ヌクレオチド多型)である。
「エピジェネティックパラメータ」は、特にシトシンメチル化である。さらなるエピジェネティックパラメータとしては、例えばヒストンのアセチル化が含まれるが、これは、記述された方法を用いて直接分析され得ず、それ自体DNAメチル化と相関関係をもつ。
「重亜硫酸塩試薬」という用語は、本書で開示されているようにメチル化及び未メチル化CpGジヌクレオチド配列を区別するのに有用である重亜硫酸塩、二亜硫酸塩、亜硫酸水素又はそれらの組合せを含む試薬を意味する。
「メチル化検定」という語は、DNA配列内の単数又は複数のCpGジヌクレオチド配列のメチル化状態を決定するためのあらゆる検定を意味する。
「MS.AP−PCR」(メチル化感応性任意プライマポリメラーゼ連鎖反応)という用語は、Gonzalgo et al., Cancer Research 57:594-599, 1997によって記述されている、CpGジヌクレオチドを含有している確率が最も高い領域に焦点をあてるためCG富有プライマを用いてゲノムを包括的に走査できるようにする当該技術分野において認められている技術を意味する。
「Methy LightTM」という用語は、Eads et al., Cancer Res. 59:2302-2306, 1999によって記述されている当該技術分野で認められた蛍光に基づく実時間PCR技術を意味する。
本書で実施されているその実施形態において、「Heavy MethylTM」検定という用語は、増幅プライマの間のCpG位置をカバーする又は増幅プライマによりカバーされているメチル化特異的遮断用プローブ(本書ではブロッカとも呼ばれている)が核酸試料のメチル化特異的選択的増幅を可能にする検定を意味する。
本書で実施されている実施形態において、「Heavy MethylTM Methy LightTM」検定という語は、Methy LightTM検定が、増幅プライマ間のCpG位置をカバーするメチル化特異的遮断プローブと組合せられるMethy LightTM検定の一変形形態であるHeavy MethylTM Methy LightTM検定を意味する。
「Ms−配列番号uPE」(メチル化感応性単一ヌクレオチドプライマ拡張)という用語は、Gonzalgo & Jones, Nucleic Acids Res. 25:2529-2531, 1997によって記述されている当該技術分野により認められている検定を意味する。
「MSP」(メチル化特異的PCR)という用語は、Herman et al. Proc. Notl. Acad. Sci. USA 93:9821-9826, 1996, 及び米国特許第5、786、146号により記述されている当該技術分野で認められたメチル化検定を意味する。
「COBRA」(組合せ型重亜硫酸塩制限分析)という用語は、Xiong & Laird, Nucleic Acids Res. 25:2532-2534, 1997により記述されている当該技術分野で認められたメチル化検定を意味する。
「MCA」(メチル化CpGアイランド増幅)という用語は、Toyota et al., Cancer Res. 59:2307-12, 1999, 及び国際公開第00/26401A1号に記載のメチル化検定を意味する。
「ハイブリダイゼーション」という用語は、2重鎖構造を形成する、サンプルDNA内のWatson-Crick塩基対合のラインに沿った相補的配列に対するオリゴマーヌクレオチドの結合として理解されなくてはならない。
本書で定義されている「ストリンジェントなハイブリダイゼーション条件」という表現には、5×SSC/5×Denhardt溶液/1.0%のSDS中で68℃でのハイブリッド形成及び室温で0.2×SSC/0.1%SDSでの洗浄が関与するか又は、その当該技術分野により認められた等価物(例えばハイブリダイゼーションが2.5×SSC緩衝液中で60℃で実施されその後低い緩衝液濃度での37℃の数回の洗浄段階が行なわれ、安定した状態にとどまっている条件)が関与している。本書で定義される穏やかにストリンジェントな条件には42℃で3×SSC中での洗浄の内含又は当該技術分野により認められているその等価物が関与している。塩濃度及び温度のパラメータは、プローブと標的核酸の間の最適な同一性レベルを達成するように変動させることができる。かかる条件に関する指針は、例えばSambrook et al., 1989, 分子クローニング、その実験室マニュアル、Cold Spring Harbor Press, N.Y.;及びAusubel et al. (eds.), 1995, 分子生物学の最新プロトコル(John Wiley & Sons, N.Y.)ユニット2.10によって、当該技術分野において入手可能である。
「アレイ配列番号」、「複合アレイ配列番号」又は「複合アレイ配列」という用語は、対象アレイの全ての個々の隣接配列の頭部から尾部への(5’→3’)線形複合物(例えばその順序での配列1−71の頭部−尾部複合物)から成る仮説に基づく又はその他の形での配列を意味する。
「アレイ配列番号ノード」、「複合アレイ配列番号ノード」又は「複合アレイ配列ノード」という用語は、「アレイ配列番号」、「複合アレイ配列番号」又は「複合アレイ配列」の任意の2つの個々の隣接配列の間の接合部を意味する。
複合アレイ配列に関して、「隣接ヌクレオチド」という語句は、複合アレイの任意の個々の隣接配列の隣接配列領域を意味するが、以上で定義されているように「ノード」を内含する複合アレイ配列の1領域を内含しない。
概要:
本発明は、結腸直腸細胞増殖障害の発生と結びつけられるメチル化パターンの分析用として新規の有用性を有する分子遺伝学的マーカーを提供する。前記マーカーは、結腸直腸細胞増殖障害を検出しそれらの間の区別を行なうために用いることができ、かくして、前記障害の分類及び治療のための改善された手段を提供する。1変形実施形態においては、前記分子遺伝的マーカーは、気道消化器細胞増殖障害の検出のために使用可能である。
DNAの重亜硫酸塩修飾は、CpGメチル化状況を査定するのに使用される当該技術分野で認められた手段である。5−メチルシトシンは、真核細胞のDNA中で最も頻度の高い電子対共有塩基修飾である。それは、例えば、転写の調節、遺伝子インプリンティング及び腫瘍形成において1つの役割を果たす。従って、遺伝情報の一構成要素としての5−メチルシトシンの同定は、著しく有利なことである。しかしながら、5−メチルシトシン位置は、5−メチルシトシンがシトシンと同じ塩基対合挙動を有することから、配列決定によって同定できない。その上、5−メチルシトシンが担持しているエピジェネティック情報は、例えばPCR増幅中に完全に失なわれる。
5−メチルシトシンの存在についてDNAを分析するための最も頻繁に用いられる方法は、シトシンと重亜硫酸塩の特異的反応に基づいており、かくして、その後のアルカリ加水分解の時点で、シトシンは、その塩基対合挙動においてチミンに対応するウラシルへと転換される。しかしながら、有意なことに、5−メチルシトシンは、これらの条件下で未修飾状態にとどまる。その結果、もとのDNAは、当初そのハイブリダイゼーション挙動によりシトシンと区別され得なかったメチルシトシンが今や例えば増幅及びハイブリッド形成によって又は配列決定によってといったように当該技術分野で認められた分子生物学技術を用いて唯一の残留シトシンとして検出され得るような形で、転換される。これらの技術は全て、今や充分に活用可能である示差的な塩基対合特性に基づいている。
先行技術は、感度に関しては、分析すべきDNAをアガロースマトリクス内に閉じ込め、かくしてDNAの拡散及び再生を妨げ(重亜硫酸塩は1本鎖DNAとのみ反応する)、全ての沈降及び精製段階を高速透析で置換することを含む方法によって定義される(Olek A, et al., 重亜硫酸塩ベースのシトシンメチル化分析のための修正され改善された方法、Nucleic Acids Res. 24:5064-6, 1996)。かくして、メチル化状況について個々の細胞を分析して該方法の有用性及び感度を例示することが可能である。5−メチルシトシンを検出するための当該技術分野により認められた方法の概要は、Rein, T, et al., Nucleic Acids Res., 26:2255, 1998によって提供されている。
わずかな例外(例えばZeschnigk M, et al., Eur J Hum Genet. 5:94-98, 1997)を除いて、重亜硫酸塩技術は、現在研究のみに使用されている。全てのケースにおいて、既知の遺伝子の短かい特異的フラグメントが、重亜硫酸塩処理の後に増幅され、完全に配列決定され(Olek & Walter, Nat Genet. 1997 17:275-6, 1997)、単数又は複数のプライマ拡張反応に付されて(Gonzalgo & Jones, Nucleic Acids Res., 25:2529-31, 1997; 国際公開第95/00669号;及び米国特許第6,251,594号)個々のシトシン位置を分析するか、そうでなければ、酵素消化(Xiong & Laird, Nucleic Acids Res., 25:2532-4, 1997)により処理される。ハイブリダイゼーションによる検出についても同様に、当該技術分野において記述されている(Olek et al., 国際公開第99/28498号)。さらに、個々の遺伝子に関するメチル化の検出のための重亜硫酸塩技術の使用が記述されてきた(Grigg & Clark, Bioessays, 16:431-6, 1994; Zeschnigk M, et al., Hum Mol Genet., 6:387-95, 1997; Feil R. et al., Nucleic Acids Res., 22:695-, 1994; Martin V, et al., Gene, 157:261-4, 1995; 国際公開第9746705号及び国際公開第9515373号)。
本発明は、配列番号1〜配列番号64から成る群からの配列内のCpGジヌクレオチド配列のメチル化状況の決定のための、単数又は複数のメチル化検定と組合わせた形の重亜硫酸塩技術の使用を提供している。本発明に従うと、配列番号1〜配列番号64から成る群からの配列内のCpGジヌクレオチドのメチル化状況の決定は、診断及び予後診断上の有用性を有している。
メチル化検定手順。当該技術分野においてはさまざまなメチル化検定手順が知られており、本発明と併用することができる。これらの検定は、DNA配列内の単数又は複数のCpGジヌクレオチド(例えばCpGアイランド)のメチル化状態の決定を可能にする。かかる検定には、その他の技術のなかでも、重亜硫酸塩処理されたDNAのDNA配列決定、PCR(配列特異的増幅用)、サザンブロット分析及びメチル化感応性制限酵素の使用が関与している。
例えば、重亜硫酸塩処理を用いることによるDNAメチル化パターン及び5−メチルシトシン分布の分析のために、ゲノム配列決定が単純化されてきた(Frommer et al., Proc. Natl. Acad. Sci. USA 89:1827-1831, 1992)。さらに、重亜硫酸塩転換されたDNAから増幅されたPCR産物の制限酵素消化、例えばSadri & Hornsby (Nucl. Acids Res. 24:5058-5059, 1996)、又はCOBRA(組合せ型重亜硫酸塩制限分析)(Xiong & Laird, Nucleic Acids Res. 25:2532-2534, 1997)によって記述された方法が使用される。
COBRA。COBRATM分析は、少量のゲノムDNA内で特定の遺伝子座におけるDNAメチル化レベルを決定するために有用である定量的メチル化検定である(Xiong & Laird, Nucleic Acids Res. 25:2532-2534, 1997)。簡単に言うと、重亜硫酸ナトリウムで処理されたDNAのPCR産物のメチル化依存性配列差異を明らかにするために、制限酵素消化が用いられる。メチル化依存性配列差異はまず最初に、Frommer et al. (Proc. Natl. Acad. Sci. USA 89:1827-1831, 1992)により記述された手順に従った標準的重亜硫酸塩処理によって、ゲノムDNA内に導入される。重亜硫酸塩転換されたDNAのPCR増幅が次に、問題のCpGアイランドに特異的なプライマを用いて実施され、その後制限エンドヌクレアーゼ消化、ゲル電気泳動及び特異的な標識づけされたハイブリダイゼーションプローブを用いた検出が行なわれる。当初のDNA試料中のメチル化レベルは、DNAメチル化レベルの広いスペクトルを横断して線形定量的に、消化された及び未消化のPCR産物の相対的量によって表わされる。さらに、この技術は、顕微解剖されたパラフィン包埋組織試料から得たDNAに対して、高い信頼性で応用することができる。
COBRATM分析のための標準的試薬(例えば、標準的なCOBRATMベースのキットの中に見られるようなもの)には、特異的遺伝子用のPCRプライマ(又は重亜硫酸塩処理されたDNA配列又はCpGアイランド);制限酵素及び適切な緩衝液;遺伝子−ハイブリダイゼーションオリゴ;対照ハイブリダイゼーションオリゴ;オリゴプローブ用のキナーゼ標識キット及び標識されたヌクレオチドが含まれ得るがこれに制限されるわけではない。付加的には、重亜硫酸塩転換試薬は、DNA変性緩衝液;スルフォン化緩衝液;DNA回収試薬及びキット(例えば、沈降、限外ろ過、アフィニティカラム);脱スルホン化緩衝液;及びDNA回収成分、が含まれる可能性がある。
好ましくは、「Methy LightTM」(蛍光ベースの実時間PCR技術)(Eads et al., Cancer Res. 59:2302-2306, 1999),Ms-SNuPETM(メチル化感応性単一ヌクレオチドプライマ拡張)反応(Gonzalgo & Jones, Nucleic Acids Res. 25:2529-2531, 1997)、メチル化特異的PCR("MSP"; Herman et al., Proc. Natl. Acad. Sci. USA 93:9821-9826, 1996; 米国特許第5,786,146号)及びメチル化CpGアイランド増幅("MCA"; Toyota et al., Cancer Res. 59:2307-12, 1999)といったような検定が、単独で又はこれらの方法のうちのその他のものと組合せた形で使用される。
Methy LightTM。Methy LightTM検定は、PCR段階の後にさらなる操作を全く必要としない蛍光ベースの実時間PCR(Taq ManTM)技術を利用する高生産性の定量的メチル化検定である(Eads et al., Cancer Res. 59:2302-2306, 1999)。簡単に言うと、Methy LightTMプロセスは、標準的手順に従ってメチル化依存性配列差異をもつ混合プールへと重亜硫酸ナトリウム反応において転換されるゲノムDNAの混合試料から始まる。次に蛍光ベースのPCRが、(既知のCpGメチル化部位と重複しないプライマでの「不偏」PCR反応又は(既知のCpGジヌクレオチドと重複するPCRプライマでの)「偏向」反応のいずれかで実施される。配列の識別は、増幅プロセスのレベル又は蛍光検出プロセスのレベルのいずれかで、又はその両方で行なわれ得る。
ゲノムDNA試料内のメチル化パターンについての定量的検査としてMethy LightTMを使用することができ、ここで配列の識別は、プローブハイブリダイゼーションのレベルで行なわれる。この定量的バージョンでは、PCR反応は、特定の推定上のメチル化部位と重複する蛍光プローブの存在下で不偏増幅を提供する。投入されたDNAの量についての不偏対照が、プライマもプローブもどのCpGジヌクレオチドにも重複していない反応によって提供される。代替的には、既知のメチル化部位を「カバー」しない対照オリゴマーヌクレオチド(「MSP」技術の蛍光ベースのバージョン)又は潜在的メチル化部位をカバーするオリゴマーヌクレオチドのいずれかでの偏向PCRプールのプロービングによって、ゲノムメチル化についての定量的検査が達成される。
Methy LightTMプロセスを、増幅プロセス内で「Taq Man(登録商標)」プローブを用いて使用することができる。例えば2本鎖ゲノムDNAが、重亜硫酸ナトリウムで処理され、例えば偏向プライマ及びTaq Man(登録商標)プローブか又は不偏プライマとTaq Man(登録商標)プローブのいずれかといったようにTaq Man(登録商標)プローブを用いた2組のPCR反応のうちの1つに付される。Taq Man(登録商標)プローブは、蛍光「リポータ」及び「消光剤」分子で2重標識され、順方向又は逆方向プライマよりもPCRサイクルで約10℃高い温度で融解してしまうような形で、比較的高いGC含有量の領域に特異的なものとなるように設計される。こうして、Taq Man(登録商標)プローブはPCRアニール/拡張段階の間充分ハイブリッド形成された状態にとどまることができる。TaqポリメラーゼはPCR中新しいストランドを酵素的に合成することから、それは最終的にアニールされたTaq Man(登録商標)プローブに到達することになる。Taqポリメラーゼ5’→3’エンドヌクレアーゼ活性はこのとき、実時間蛍光検出システムを用いて、その現在消光されていないシグナルを定量的に検出するため蛍光リポータ分子を放出するように消化することによってTaq Man(登録商標)プローブを変位させることになる。
Methy LightTM分析のための標準的試薬(例えば標準的Methy LightTMベースのキットの中に見られるようなもの)には、特異的遺伝子用のPCRプライマ(又は重亜硫酸塩処理されたDNA配列又はCpGアイランド);Taq Man(登録商標)プローブ;最適化されたPCR緩衝液及びデオキシヌクレオチド;及びTaqポリメラーゼが含まれ得るが、これに制限されるわけではない。
Ms−SNuPETM技術は、DNAの重亜硫酸塩処理とそれに続く単一ヌクレオチドプライマ拡張に基づく特異的CpG部位におけるメチル化差異を査定するための定量的方法である(Gonzalgo & Jones, Nucleic Acids Res. 25:2529-2531, 1997)。簡単に言うと、5−メチルシトシンを変化しないままに残しながら未メチル化シトシンをウラシルに転換させるべくゲノムDNAが重亜硫酸ナトリウムと反応させられる。次に、重亜硫酸塩で転換されたDNAに特異的なPCRプライマを用いて所望の標的配列の増幅が実施され、結果としての産物は単離され、問題のCpG部位(単複)におけるメチル化分析用の鋳型として使用される。少量のDNAを分析することができ(例えば、顕微解剖された病理切片)、これにより、CpG部分でのメチル化状況を決定するための制限酵素を利用する必要が無くなる。
Ms−SNuPETM分析のための標準的試薬(例えば、標準的なMs−SNuPETMベースのキットの中に見られるようなもの)には、特異的遺伝子用のPCRプライマ(又は重亜硫酸塩処理されたDNA配列又はCpGアイランド);最適化されたPCR緩衝液及びデオキシヌクレオチド;ゲル抽出キット;正の対照プライマ;特異的遺伝子のためのMs−SNuPETMプライマ;反応緩衝液(Ms−SNuPE反応用);及び標識されたヌクレオチドが含まれ得るがこれに制限されるわけではない。付加的には、重亜硫酸塩転換試薬は、DNA変性緩衝液;スルフォン化緩衝液;DNA回収試薬及びキット(例えば、沈降、限外ろ過、アフィニティカラム);脱スルホン化緩衝液;及びDNA回収成分、が含まれる可能性がある。
MSP。MSP(メチル化特異的PCR)は、メチル化感応性制限酵素の使用とは無関係に、CpGアイランド内のほぼあらゆるCpG部位群のメチル化状況を査定できるようにする(Herman et al. Proc. Natl. Acad. Sci. USA 93:9821-9826, 1996; 米国特許第5,786,146号)。簡単に言うと、DNAは、メチル化シトシンではなく全ての未メチル化シトシンをウラシルへと重亜硫酸ナトリウムで転換させることによって修飾され、その後、未メチル化DNAに比べメチル化DNAに特異的なプライマで増幅される。MSPは、少量のDNAしか必要とせず、一定の与えられたCpGアイランド遺伝子座の0.1%のメチル化対立遺伝子に対し感応し、パラフィン包埋試料から抽出されたDNAについて実施され得る。MSP分析のための標準的試薬(例えば、標準的なMSPベースのキットの中に見られるようなもの)には、特異的遺伝子用のPCRプライマメチル化及び未メチル化(又は重亜硫酸塩処理されたDNA配列又はCpGアイランド)、最適化されたPCR緩衝液及び特異的プローブが含まれ得るが、これに制限されるわけではない。
MCA。MCA技術は、ゲノムDNA内の改変されたメチル化パターンについてスクリーニングしこれらの変化に付随する特異的配列を単離するために使用できる方法である(Toyota et al., Cancer Res. 59:2307-12, 1999)。簡単に言うと、任意プライミングされたPCR増幅に先立って、原発性腫瘍、細胞系列及び正常な組織からのゲノムDNAを消化するために、その認識部位内のシトシンメチル化に対し異なる感度を有する制限酵素が使用される。示差的メチル化を示すフラグメントが、高分解能のポリアクリルアミドゲル上でのPCR産物の分解の後にクローニングされ配列決定される。クローニングされたフラグメントはその後、これらの領域の示差的メチル化を確認するためサザン分析のためのプローブとして用いられる。MCR分析のための標準的試薬(例えば、標準的なMCAベースのキットの中に見られるようなもの)には、ゲノムDNAの任意プライミングのためのPCRプライマ;PCR緩衝液及びヌクレオチド、制限酵素及び適切な緩衝液;遺伝子−ハイブリダイゼーションオリゴ又はプローブ;対照ハイブリダイゼーションオリゴ又はプローブが含まれ得るがこれに制限されるわけではない。
配列番号1〜配列番号64に従ったゲノム配列及び配列番号304〜配列番号535及び配列番号65〜配列番号88に従ったその自然に発生しない処理済み変異体が、結腸直腸細胞増殖障害の検出、分類及び/又は治療のために新たな有用性をもつことが見極められた。
1実施形態において、本発明は、対象の体内で結腸細胞増殖障害を検出するため及び/又は検出しそれらの間又は中での区別を行なうための方法を提供している。1実施形態においては、該発明は、i)血漿、血清、全血、単離された血液細胞、対象から得た血液から単離された細胞から単離されたゲノムDNAを、該ゲノムDNAの少なくとも1つの標的領域内のメチル化及び非メチル化CpGジヌクレオチドを区別する少なくとも1つの試薬又は一連の試薬と接触させる段階であって、前記隣接ヌクレオチドが少なくとも1つのCpGジヌクレオチド配列を含んでいる段階、ii)80%以上の感度及び80%以上の特異性で提供される、結腸細胞増殖障害を検出するか又は検出しかつそれらの間又は中での区別を行なう段階、を含んで成る。
好ましくは、感度は、約75%〜約96%又は約80%〜約90%、又は約80%〜約85%である。好ましくは、特異性は約75%〜約96%又は約80%〜約90%又は約80%〜約85%である。
ゲノムDNAは、市販のキットの使用を含め、当該技術分野において標準的なあらゆる手段により単離可能である。簡単に言うと、問題のDNAは細胞膜によってカプセル封入されており、生体試料は酵素、化学又は機械的手段により分断され溶解されなくてはならない。このときDNA溶液から、例えばプロティナーゼKでの消化により、タンパク質及びその他の汚染物質を一掃することができる。ゲノムDNAはこのとき溶液から回収される。これは、塩析、有機抽出又は固相支持体に対するDNAの結合を含めたさまざまな方法を用いて実施可能である。方法の選択は、時間、出費及びDNA所要量を含めた複数の要因により影響されることになる。体液が、好ましいDNA供給源であり、特に好ましいのは血漿、血清、全血、単離された血液細胞及び血液から単離された細胞である。
このとき、ゲノムDNA試料は、5’位置でメチル化されていないシトシン塩基がハイブリダイゼーション挙動に関してシトシンと異なっているウラシル、チミン又はもう1つの塩基へと転換されるような形で処理される。これは、本書では「処理」として理解されることになる。
ゲノムDNAの上述の処理は好ましくは、重亜硫酸塩(亜硫酸水素、二亜硫酸塩)及びその後のアルカリ加水分解を用いて実施され、この加水分解は、ウラシル又は塩基対合挙動に関してシトシンと異なっているもう1つの塩基への非メチル化シトシン核酸塩基の転換を結果としてもたらす。
処理済みDNAは次に、結腸直腸癌腫の発生に結びつけられる単数又は複数の標的遺伝子配列のメチル化状態(処理以前の)を見極めるために分析される。標的領域が、表1に列挙されている通りの遺伝子及び配列から成る群から選択される少なくとも1つの遺伝子又は配列の少なくとも16の隣接ヌクレオチドを含むか又はストリンジェント条件下でこれに対しハイブリッド形成することが特に好ましい。添付の配列表に記述されている通りの表3内の前記遺伝子の配列が分析されることがさらに好ましい。分析方法は、本書に列挙されているものを含めて、当該技術分野において既知のものから選択可能である。特に好ましいのは、本書で記述されるようなMethy-Light, MSP及び遮断用オリゴマーヌクレオチドの使用である。かかる分析で使用されるあらゆるオリゴマーヌクレオチド(プライマ、遮断用オリゴマーヌクレオチド及び検出プローブ)が配列番号(IDBISEQFIRST)〜配列番号及び(IDBISEQLAST)及びそれに相補的な配列のうちの単数又は複数のものの塩基配列の少なくとも16塩基対の長さのセグメントに対し逆相補的であるか、同一であるか又はストリンジェント条件下又は極めてストリンジェントな条件下でこれに対しハイブリッド形成すべきであるとするのが好ましい。
より好ましくは、配列番号1〜3、14、16、21、22、23、44〜46、48、50、59〜64、COX7B、CST5、EYA3、FTH1、RNF4、SOX21、RNF4、ALX4、ONC2、NGFR、DLX−5、HVIAAT、BTF3相同体1、ADCY9、BCL−5、BCOR、TAFII28、HOMEOBOX PROTEIN SIX6、GSK−3BETA、ELK−L、HLA−F、TGFBR2、AR、RNF30及びDUX4から成る群から取られた単数又は複数の遺伝子又はゲノム配列の異常なメチル化、より好ましくは高メチル化は、結腸直腸癌腫の存在と結びつけられる。
配列のうちの単数又は複数のものの分析は、80%以上の感度及び80%以上の特異性での結腸細胞増殖障害の検出及び検出とそれらの間又は中での区別の提供を初めて可能にする。感度は、{検出された結腸新生組織形成/全ての結腸新生組織形成}として計算され、特異性は(検出されない陰性/全陰性)として計算される。
好ましくは、感度は、約75%〜約96%又は約80%〜約90%、又は約80%〜約85%である。好ましくは、特異性は約75%〜約96%又は約80%〜約90%又は約80%〜約85%である。
結腸新生組織形成は、全ての結腸悪性腫瘍又は結腸悪性腫瘍と大きい(>1cm)腺腫又はそれらのサブセットとして定義できる。陽性は、結腸悪性腫瘍及び腺腫以外のあらゆる疾病又は健康な個体として定義できる。
1実施形態においては、該方法は、結腸細胞増殖障害の弁別、検出及び区別のためのマーカーとしての、配列番号1〜3、14、16、21、22、23、44〜46、48、50、59〜64、COX7B、CST5、EYA3、FTH1、RNF4、SOX21、RNF4、ALX4、ONC2、NGFR、DLX−5、HVIAAT、BTF3相同体1、ADCY9、BCL−5、BCOR、TAFII28、HOMEOBOX PROTEIN SIX6、GSK−3BETA、ELK−L、HLA−F、TGFBR2、AR、RNF30及びDUX4から成る群から選択された単数又は複数の遺伝子又はゲノム配列の使用を開示している。
mRNA発現分析又はタンパク質発現分析を用いた遺伝子の発現のあらゆる分析を用いて、遺伝子の前記使用を可能にすることができる。ただし、該発明の最も好ましい実施形態においては、結腸細胞増殖障害の検出、弁別及び区別は、配列番号1〜3、14、16、21、22、23、44〜46、48、50、59〜64、COX7B、CST5、EYA3、FTH1、RNF4、SOX21、RNF4、ALX4、ONC2、NGFR、DLX−5、HVIAAT、BTF3相同体1、ADCY9、BCL−5、BCOR、TAFII28、HOMEOBOX PROTEIN SIX6、GSK−3BETA、ELK−L、HLA−F、TGFBR2、AR、RNF30及びDUX4及びそれらのプロモータ又は調節要素から成る群から選択された単数又は複数の遺伝子又はゲノム配列のメチル化状況の分析を用いて可能になる。遺伝子のメチル化分析の方法が、本書で記述されている。
表3に基づく配列番号1〜3、14、16、21、22、23、44〜46、48、50、59〜64、COX7B、CST5、EYA3、FTH1、RNF4、SOX21、RNF4、ALX4、ONC2、NGFR、DLX−5、HVIAAT、BTF3相同体1、ADCY9、BCL−5、BCOR、TAFII28、HOMEOBOX PROTEIN SIX6、GSK−3BETA、ELK−L、HLA−F、TGFBR2、AR、RNF30及びDUX4に従ったゲノム配列により調節された遺伝子、ゲノム配列又は遺伝子のmRNA発現の異常なレベルが、結腸直腸癌に結びつけられる。
従って、前記遺伝子又は配列の発現レベルの増大又は低減は、結腸直腸癌腫及びその他の結腸直腸細胞増殖障害の発生と結びつけることができる。
結腸癌用の検出システムにおいて、遺伝子又はゲノム配列をコードするmRNAの存在を検出するためには、患者から試料を得る。この試料は、組織生検試料又は血液、血漿、血清などの試料であり得る。中に含有されている核酸を抽出するために試料を処理することが可能である。試料からの結果として得られた核酸は、ゲル電気泳動法又はその他の分離技術に付される。検出には、ハイブリッド2重鎖を形成するべくプローブとして役立つDNA配列と、核酸特に試料のmRNAを接触させる段階が関与されている。ハイブリダイゼーションのストリンジェンシーは、温度、イオン強度、時間的長さ及びホルムアミド濃度を含めた、ハイブリダイゼーション中及び洗浄手順中の一定数の要因により決定される。これらの要因は、例えばSambrook et al(分子クローニング:実験室マニュアル、第2版、1989)の中で概略的に記されている。結果として得られる2重鎖の検出は、通常、標識されたプローブを用いることによって達成される。代替的には、プローブは、標識されていなくてもよいが、直接的に又は間接的に、標識されているリガンドとの特異的結合によって検出可能であり得る。プローブ及びリガンドを標識するための適切な標識及び方法は、当該技術分野において既知であり、例えば、既知の方法(例えばニックトランスレーション又はキナーゼ化)により取込まれ得る放射性標識、ビオチン、蛍光基、化学発光基(例えばジオキセタン、特定的にトリガーされるジオキセタン)、酵素、抗体などを内含する。
遺伝子又はゲノム配列から転写されたmRNAの試料中の検出の感度を増大させるために、mRNAから転写されたcDNAを増幅するべく、逆転写/重合連鎖反応の技術を使用することができる。逆転写/PCRの方法は、当該技術分野において周知である(例えば前出のWatson及びFlemingを参照のこと)。
以下の通りに逆転写/PCR方法を実施することができる。全細胞RNAが、例えば標準イソチオシアン酸グアニジウム方法によって単離され、全RNAが逆転写される。逆転写方法には、逆転写酵素及び3’末端プライマを用いたRNA鋳型上のDNAの合成が関与する。標準的には、プライマはオリゴ(dT)配列を含有する。かくして産生されたcDNAは次に、PCR方法及びEYA4特異的プライマを用いて増幅される(参考として内含されているBelyavaky et al., Nuel Acid Res 17:2919-2932, 1989; Krug及びBerger, 酵素学方法、Academic Press, N.Y.,第150巻、pp. 316-325, 1987中)。
本発明は、一部の実施形態においては、生体試料の検査を通して結腸癌疾病状態を検出する上で使用するためのキットとして記述される可能性もある。代表的キットは、単数又は複数の核酸セグメントの各々について1つのコンテナとmRNAに対し選択的にハイブリッド形成する単数又は複数の核酸セグメントを含み得る。或る種の実施形態においては、単一の管内で複数の核酸セグメントを組合わせることができる。さらなる実施形態においては、核酸セグメントは、標的mRNAを増幅するためのプライマ対をも内含し得る。かかるキットは、同様に、ハイブリダイゼーション、増幅又は検出反応のためのあらゆる緩衝液、溶液、溶剤、酵素、ヌクレオチド又はその他の構成要素も内含し得る。好ましいキット構成要素には、逆転写−PCR、インサイチュハイブリッド形成、ノーザン分析及び/又はRPA用の試薬が含まれる。
本発明はさらに、患者から得られた試料中の前記遺伝子又は遺伝子配列によりコードされるポリペプチドの存在を検出するための方法を提供する。
表3に基づく配列番号:1〜3、14、16、21、22、23、44〜46、48、50、59〜64、COX7B、CST5、EYA3、FTH1、RNF4、SOX21、RNF4、ALX4、ONC2、NGFR、DLX−5、HVIAAT、BTF3相同体1、ADCY9、BCL−5、BCOR、TAFII28、HOMEOBOX PROTEIN SIX6、GSK−3BETA、ELK−L、HLA−F、TGFBR2、AR、RNF30及びDUX4に従った遺伝子、ゲノム配列又はゲノム配列により調節された遺伝子によりコードされたポリペプチドの異常なポリペプチド発現レベルが、結腸直腸癌腫と結びつけられる。
従って、前記ポリペプチドの過剰又は過小発現を、結腸直腸癌腫及びその他の結腸直腸細胞増殖障害の発生と結びつけることが可能である。
タンパク質を検出するための当該技術分野において既知のあらゆる方法を使用することができる。かかる方法には、免疫拡散、免疫電気泳動、免疫化学方法、結合剤−リガンド検定、免疫組織化学技術、凝集及び補体検定が含まれるがこれに制限されるわけではない。例えば、参考として内含されている基礎及び臨床免疫学、Sites and Terr, eds., Appleton & Lange, Norwalk, Conn. Pp 217-262, 1991を参照のこと)。好適なのは、抗体をエピトープ(単複)と反応させ、標識されたタンパク質又はその誘導体を競合的に変位させることを含む結合剤−リガンド免疫検定法である。
本発明の或る種の実施形態は配列番号1〜3、14、16、21、22、23、44〜46、48、50、59〜64、COX7B、CST5、EYA3、FTH1、RNF4、SOX21、RNF4、ALX4、ONC2、NGFR、DLX−5、HVIAAT、BTF3相同体1、ADCY9、BCL−5、BCOR、TAFII28、HOMEOBOX PROTEIN SIX6、GSK−3BETA、ELK−L、HLA−F、TGFBR2、AR、RNF30及びDUX4から成る群の遺伝子又はゲノミック配列によりコードされたポリペプチドに特異的な抗体の使用を含んで成る。
かかる抗体は、患者の結腸疾患マーカー発現レベルを正常な個体における同じマーカーの発現と比較することにより、疾病状態を検出する上で診断及び予後診断の利用分野のために有用であり得る。或る種の実施形態においては、コードされたポリペプチドを抗原として使用することによって、モノクローナル又はポリクローナル抗体の産生を誘発することができる。かかる抗体は、それ自体、ヒト疾病状態のためのマーカーとして、発現済みタンパク質を検出するために使用することができる。患者の末梢血又は組織試料中に存在するこのようなタンパク質のレベルは、従来の方法により定量化され得る。蛍光又は放射性リガンドでの標識といったような、当該技術分野において既知のさまざまな手段により、抗体−タンパク質結合を検出し定量化することができる。該発明はさらに、調査中のポリペプチドに特異的な抗体を収納する、上述の処置を実施するためのキットをも含んで成る。
数多くの競合及び非競合的タンパク質結合免疫検定が、当該技術分野において周知である。このような検定において利用される抗体は、例えば凝集検査の中で使用されるように標識されていなくてもよいし、又は多種多様な検定方法を使用するために標識されていてもよい。使用可能な標識には、放射免疫測定(RIA)、例えば酵素免疫測定吸着法(ELISA)といった酵素免疫検定、蛍光免疫検定などで使用するための放射性核種、酵素、蛍光剤、化学発光剤、酵素基質又は共同因子、酵素阻害物質、粒子、染料などが含まれる。当該技術分野において既知の数多くの方法のいずれかにより免疫検定において使用するため、ポリクローナル又はモノクローナル抗体又はそのエピトープを作ることができる。
1つのタンパク質を調製するための1つのアプローチは、タンパク質の全て又は一部分のアミノ酸配列の選択及び調製であり、該配列を化学的に合成しそれを通常はウサギ又はマウスである適切な動物の体内に注入する(参考として内含されているMilstein及びKohler, Nature 256:495-497, 1975; Gulfre及びMilstein, 酵素学方法;免疫化学技術73:1-46, Langone and Banatis eds., Academic Press, 1981)。ポリペプチド又はそのエピトープの調製方法には、化学合成、組換え型DNA技術又は生体試料からの単離が含まれるがこれに制限されるわけではない。
表3に基づいた、配列番号1〜3、14、16、21、22、23、44〜46、48、50、59〜64、COX7B、CST5、EYA3、FTH1、RNF4、SOX21、RNF4、ALX4、ONC2、NGFR、DLX−5、HVIAAT、BTF3相同体1、ADCY9、BCL−5、BCOR、TAFII28、HOMEOBOX PROTEIN SIX6、GSK−3BETA、ELK−L、HLA−F、TGFBR2、AR、RNF30及びDUX4から成る群から選択された遺伝子又はゲノム配列のメチル化分析が行なわれる上述の実施形態に加えて、該発明は、結腸直腸癌の検出のための新しい有用性をもつ2つのさらなる遺伝子パネルを提示している。
第1のさらなる実施形態において、本発明は、表3に基づいた、配列番号1〜3、14、16、21、22、23、44〜46、48、50、59〜64、COX7B、CST5、EYA3、FTH1、RNF4、SOX21、RNF4、ALX4、ONC2、NGFR、DLX−5、HVIAAT、BTF3相同体1、ADCY9、BCL−5、BCOR、TAFII28、HOMEOBOX PROTEIN SIX6、GSK−3BETA、ELK−L、HLA−F、TGFBR2、AR、RNF30、DUX4、SMAD7、GTMBP、EYA4及びTCF1−ALPHA及び/又はそれらの調節配列から成る群から取られた単数又は複数の遺伝子又はゲノム配列内のメチル化レベルの分析に基づいている。
前記遺伝子又はゲノム配列が表3に基づくようなものであることがさらに好ましい。
さらなる実施形態においては、本発明は、表3に従った全ての遺伝子及びゲノム配列及び/又はそれらの調節配列から成る群から取られた2つ以上の遺伝子又はゲノム配列内のメチル化レベルの分析に基づいている。前記遺伝子又はゲノム配列の配列は配列番号1〜配列番号64に従ったようなものであることがさらに好ましい。
本発明の特定の実施形態は、結腸直腸細胞増殖障害の精確な検出、特徴づけ及び/又は治療を可能にする前記配列内のメチル化レベル及び/又はパターンの分析の新規の応用を提供している。結腸直腸細胞増殖障害の早期検出は、疾病の予後診断と直接結びつけられ、開示された方法はかくして医師及び患者がより優れた及びよりインフォームドされた治療決定を行なえるようにする。配列番号20、41、35、3、39、33&27から成る群の配列は、さらに、気道消化器細胞増殖障害の検出のためにさらに有用である。
さらなる改良
本発明は、配列番号1〜配列番号64から成る群から選択されたゲノム配列のための新規用途を提供している。付加的な実施形態は、配列番号1〜配列番号64の修飾された変異体ならびに配列番号1〜配列番号64内のシトシンメチル化パターンの分析のためのオリゴマーヌクレオチド及び/又はPNA−オリゴマーを提供する。
該発明の目的には、配列番号1〜配列番号64及びそれに対し相補的な配列から成る群から選択されたゲノム配列のうちの少なくとも1つの中の単数又は複数のCpGジヌクレオチドのメチル化状態の分析が含まれている。
開示された発明は、配列番号1〜配列番号64から誘導された処理済み核酸において、該処理がゲノムDNA配列の少なくとも1つの未メチル化シトシン塩基をウラシル又はハイブリダイゼーションに関してシトシンと検出可能な形で異なるもう1つの塩基に転換するのに適している核酸を提供している。問題のゲノム配列は単数又は複数の連続した又は無作為のメチル化CpG位置を含み得る。前記処理は好ましくは、重亜硫酸塩、亜硫酸水素、重亜硫酸塩及びそれらの組合せから成る群から選択された試薬の使用を含む。該発明の好ましい実施形態では、該目的には、配列番号304〜配列番号535及び配列番号65〜配列番号88から成る群から選択された配列の長さが少なくとも16隣接ヌクレオチド塩基である配列を含む非自然発生の修飾済み核酸の分析において、前記配列が少なくとも1つCpG、TpA又はCpAジヌクレオチド及びそれに相補的な配列を含む分析が含まれている。配列番号304〜配列番号535及び配列番号65〜配列番号88の配列は、配列番号1〜配列番号64に従った核酸の非自然発生の修飾済みバージョンを提供し、ここで、各々のゲノム配列の修飾は、以下の通りの前記ゲノム配列とは全く異なる独特の配列をもつ核酸の合成を結果としてもたらしている。各々のセンスストランドゲノムDNA、例えば配列番号1について、4つの転換済みバージョンが開示されている。第1のバージョンでは「C」→「T」であるが「CpG」は「CpG」にとどまっている(すなわち、ゲノム配列についてCpGジヌクレオチド配列の全ての「C」残基がメチル化され、かくして転換されていないケースに対応する);第2のバージョンは、「C」→「T」であるが「CpG」が「CpG」にとどまっている(すなわちCpGジヌクレオチド配列の全ての「C」残基がメチル化され、かくして転換されていないケースに対応する)、開示されたゲノムDNA配列(すなわちアンチセンスストランド)の補体を開示している。配列番号1〜配列番号64の「アップメチル化」された転換済み配列は、配列番号65〜76及び配列番号304〜配列番号419に対応する。「CpG」ジヌクレオチド配列を含め全ての「C」残基について「C」→「T」である(すなわちゲノム配列について、CpGジヌクレオチド配列の全ての「C」残基がメチル化されていないケースに対応する)各々のゲノム配列の第3の化学的に転換されたバージョンが提供されており、各配列の最終的な化学的に転換されたバージョンは、「CpG」ジヌクレオチド配列のものを含め、全ての「C」残基について「C」→「T」である(すなわち各ゲノム配列の補体(アンチセンスストランド)についてCpGジヌクレオチド配列の全ての「C」残基がメチル化されていないケースに対応する)、開示されたゲノムDNA配列の補体(すなわちアンチセンスストランド)を開示している。配列番号1〜配列番号64の「ダウンメチル化された」転換済み配列は、配列番号77〜88及び配列番号420〜配列番号535に対応する。
有意にも、これまで、配列番号1〜7、9〜11、14〜23、27、31、32、40〜42、44〜46、48、50〜55及び59〜64に従った核酸配列及び分子は、結腸直腸細胞増殖障害又は気道・消化管細胞増殖障害の検出、分類又は処置に関与しておらず、又それと関連づけされることもなかった。
代替的な好ましい実施形態においては、かかる分析には、配列番号1〜配列番号535に従ったゲノム又は処理済み(化学的に修飾された)DNA内で、シトシンメチル化状態を検出するためのオリゴマーヌクレオチド又はオリゴマーの使用が含まれる。前記オリゴマーヌクレオチド又はオリゴマーは、穏やかにストリンジェントな又はストリンジェントな条件(以上で定義した通り)下で配列番号65〜配列番号88及び配列番号304〜配列番号535に従った処理済み核酸配列及び/又はそれに相補的な配列に対して又は、配列番号1〜配列番号64に従ったゲノム配列及び/又はそれに相補的な配列に対してハイブリッド形成する少なくとも9個のヌクレオチドという長さをもつ核酸配列を含む。
かくして、本発明は、穏やかにストリンジェントな及び/又はストリンジェントなハイブリダイゼーション条件下で配列番号1〜配列番号535の配列の全て又は一部分又はその補体に対してハイブリッド形成する核酸分子(例えばオリゴマーヌクレオチド及びペプチド核酸(PNA)分子(PNA−オリゴマ)を内含する。ハイブリッド形成する核酸のハイブリッド形成部分は、標準的には長さが少なくとも9、15、20、25、30又は35ヌクレオチドである。しかしながら、より長い分子は発明力ある有用性を示し、かくして本発明の範囲内に入る。
好ましくは、発明力あるハイブリッド形成核酸のハイブリッド形成部分は、配列番号1〜配列番号535の配列又はその一部分、又はその補体と少なくとも95%又は少なくとも98%又は100%同一である。
本書で記述されているタイプのハイブリッド形成核酸は例えば、プライマ(例えばPCRプライマ)又は診断及び/又は予後診断プローブ又はプライマとして使用可能である。好ましくは、核酸試料に対するオリゴマーヌクレオチドプローブのハイブリダイゼーションは、ストリンジェント条件下で実施され、プローブは標的配列に対する100%の同一性をもつ。核酸2重鎖又はハイブリッド安定性は、プローブが標的DNAから解離する温度である融解温度又はTmとして表わされる。この融解温度は、必要とされるストリンジェンシー条件を定義するために用いられる。
配列番号1〜配列番号64の対応する配列(例えば対立遺伝子変異体及びSNPに対し同一ではなくむしろ関係している及び実質的に同一である標的配列については、特定の濃度の塩(例えばSSC又はSSPE)との相同なハイブリダイゼーションのみが発生する最低温度を最初に設定することが有用である。次に、1%のミスマッチがTmの1℃の低下を結果としてもたらすものと仮定すると、ハイブリダイゼーション反応における最終的洗浄液温度は、それに相応して低下する(例えば、プローブとの同一性が95%を上回る配列が求められる場合、最終洗浄液温度は5℃低下させられる)。実際には、Tmの変化は、ミスマッチ1%あたり0.5℃〜1.5℃の間であり得る。
例えば配列番号1を基準とするポリヌクレオチド位置によって表わされるとおりの長さX(ヌクレオチド数で)の発明力あるオリゴマーヌクレオチドの例には、各々の連続的に重複するセット(一定の与えられたX値に対応する)内のオリゴマーヌクレオチドが、n〜(n+(X−1))というヌクレオチド位置からのZ個のオリゴマーヌクレオチドの有限セットとして定義されるものとして、長さXの連続して重複するオリゴマーヌクレオチドのセット(センス及びアンチセンスセット)に対応するものが含まれる。なお式中、
n=1,2,3…(Y−(X−1))であり;
Yは、配列番号1(2,280)の長さ(ヌクレオチド又は塩基対)に等しく;
Xは、該セット内の各オリゴマーヌクレオチドの共通の長さ(ヌクレオチド数での)に等しく(例えば、連続して重複する20量体のセットについてはX=20);かつ
長さYの一定の与えられた配列番号についての長さXの連続的に重複するオリゴマー−の数(Z)はY−(X−1)に等しい。例えばX=20の場合、配列番号1のセンス又はアンチセンスのいずれかのセットについてZ=2,280−19=2,261である。
好ましくは、該セットは、少なくとも1つのCpG、TpG又はCpAジヌクレオチドを含むオリゴマーに制限される。
発明力ある20量体オリゴマーヌクレオチドの例としては、配列番号1を基準にしてポリヌクレオチド位置により表わされた、2,261個のオリゴマーの以下のセット(及びそれに対し相補的なアンチセンスセット)が含まれる:
1−20、2−21、3−22、4−23、5−24、…2259−2278、2260−2279及び2261−2280。
好ましくは、該セットは、少なくとも1つのCpG、TpG又はCpAジヌクレオチドを含むようなオリゴマーに制限される。
同様にして、発明力ある25量体オリゴマーヌクレオチドには、配列番号1を基準にしたポリヌクレオチド位置で表わされた2,256オリゴマーの以下のセット(及びそれに相補的なアンチセンスセット)が含まれる:
1−25、2−26、3−27、4−28、5−29、…2254−2278、2255−2279及び2256−2280。
好ましくは、該セットは、少なくとも1つのCpG、TpG又はCpAジヌクレオチドを含むようなオリゴマーに制限される。
本発明は、配列番号1〜配列番号535の各々について(センス及びアンチセンス)、例えばX=9、10、17、20、22、23、25、27、30又は35ヌクレオチドである、長さXのオリゴマーヌクレオチド又は修飾済みオリゴマーヌクレオチドの多数の連続的に重複するセットを包含する。
本発明に従ったオリゴマーヌクレオチド又はオリゴマーは、配列番号1〜配列番号64に対応するゲノム配列の遺伝的及びエピジェネティックパラメータを確認するのに有用な有効な手段を構成する。長さXのこのようなオリゴマーヌクレオチド又は修飾済みオリゴマーヌクレオチドの好ましいセットは、配列番号1〜配列番号535(及びその補体)に対応するような連続的に重複するオリゴマーセットである。好ましくは、前記オリゴマーは、少なくとも1つのCpG、TpG又はCpAジヌクレオチドを含む。
本発明に従った特に好ましいオリゴマーヌクレオチド又はオリゴマーは、CpGジヌクレオチド(又は対応する転換されたTpG又はCpAジヌクレオチド)配列のシトシンがオリゴマーヌクレオチドの中央第3番目以内にあるようなものである。すなわち、オリゴマーヌクレオチドが例えば長さが13塩基である場合、CpG、TpG及びCpAジヌクレオチドは、5’末端から5〜9番目のヌクレオチド以内に位置づけされている。
該発明のオリゴマーヌクレオチドは、同様に、オリゴマーヌクレオチドの活性、安定性又は検出を増強させるべく、単数又は複数の部分又は接合体にオリゴマーヌクレオチドを化学的に連結させることによっても修飾され得る。かかる部分又は接合体には、例えば米国特許第5,514,758号、5,565,552号、5,567,810号、5,574,142号、5,585,481号、5,587,371号、5,597,696号及び5,958,773号の中に開示されているような発色団、フルオロフォア、脂質例えばコレステロール、コリン酸、チオエーテル、脂肪酸鎖、リン脂質、ポリアミン、ポリエチレングリコール(PEG)、パルミチル部分その他が含まれる。プローブは同様に、特に好ましい対合特性をもつPNA(ペプチド核酸)の形でも存在し得る。かくしてオリゴマーヌクレオチドは、ペプチドといったようなその他の追加基を内含することができ、又ハイブリダイゼーショントリガー型分割剤(Krol et al., Bio Techniques 6:958-976, 1988)又は挿入剤(Zon, Pharm. Res. 5:539-549, 1988)を内含し得る。この目的で、オリゴマーヌクレオチドは、例えば発色団、フルオロフォア、ペプチド、ハイブリダイゼーションでトリガー型架橋剤、輸送剤、ハイブリダイゼーションでトリガーされた分割剤などのもう1つの分子に接合され得る。
オリゴマーヌクレオチドは、少なくとも1つの当該技術分野で認められた修飾済みの糖及び/又は塩基部分をも含むことができ、或いは又修飾された主鎖又は非天然ヌクレオシド連結を含むことができる。
本発明の特定の実施形態に従ったオリゴマーヌクレオチド又はオリゴマーは、標準的に、ゲノム配列配列番号1〜配列番号64及びそれに相補的な配列、又は配列番号304〜配列番号535に従った処理済み核酸の配列及びそれに相補的な配列内の対応するCpG、TpG又はCpAジヌクレオチドの各々の分析のための少なくとも1つのオリゴマーを含有する「セット」の形で使用される。しかしながら、経済的要因又はその他の要因のため、前記配列内のCpGジヌクレオチドの制限されたセレクションを分析することが好ましい可能性があると予想され、オリゴマーヌクレオチドセットの中味はそれに従って、改変される。
従って、特定の実施形態においては、本発明は、処理済みゲノムDNA(配列番号304〜配列番号535)内、又はゲノムDNA(配列番号1〜配列番号64及びそれに相補的な配列)内のシトシンメチル化状態を検出するのに有用な少なくとも2つ(2)(オリゴマーヌクレオチド及び/又はPNA−オリゴマー)のセットを提供している。これらのプローブは、結腸直腸細胞増殖障害の遺伝子的及びエピジェネティックパラメータの診断、分類及び/又は療法を可能にする。処理済みゲノムDNA(配列番号304〜配列番号535)内又はゲノムDNA(配列番号1〜配列番号64及びそれに相補的な配列)内の単一のヌクレオチド多型(SNP)を検出するためにも、該オリゴマーセットを使用することができる。
好ましい実施形態では、オリゴマーヌクレオチドセットのうちの少なくとも1つ及びより好ましくは全ての成員が固相に結合される。
さらなる実施形態においては、本発明は、配列番号1〜配列番号535及びそれに相補的な配列の1つ又はそのセグメントのDNA配列を増幅させるための「プライマ」オリゴマーヌクレオチドとして使用される少なくとも2つのオリゴマーヌクレオチドのセットを提供する。
オリゴマーヌクレオチドは、「アレイ」又は「DNAチップ」(すなわち固相に結合された異なるオリゴマーヌクレオチド及び/又はPNA−オリゴマーの配置)の全て又は一部分を構成しうると予想されている。異なるオリゴマーヌクレオチド及び/又はPNA−オリゴマー配列のこのようなアレイは、例えば、矩形又は六角形格子の形で固相上に配置されていることを特徴とする。固相表面は、シリコン、ガラス、ポリスチレン、アルミニウム、鋼、鉄、銅、ニッケル、銀又は金で構成され得る。ペレットの形で又は樹肢マトリクスとして存在し得るニトロセルロースならびにナイロンといったようなプラスチックも同じく使用可能である。オリゴマアレイ製造における先行技術の概要は、Nature Genetics (Nature Genetics追補、第21巻、1999年1月)及びその中で引用されている文献から収集することができる。蛍光標識されたプローブを、固定化したDNAアレイの走査のために使用することが多い。特異的プローブの5’−OHに対するCy3及びCy5染料の単純な付着が、蛍光標識に特に適している。ハイブリッド形成されたプローブの蛍光の検出は、例えば、共焦点顕微鏡を介して実施可能である。Cy3及びCy5染料は、その他の数多くのもの以外に、市販されている。
オリゴマーヌクレオチド又はその特定の配列は、分析物の複合混合物を分析するため一意的標識されたプローブのさまざまな集団の一部として又はそれと組合せた形での「指定子」などとしてオリゴマーヌクレオチド又はその特定の配列が使用される「仮想アレイ」の全部又は一部を構成し得るということも予想されている。かかる方法は、例えば米国特許第2003/0013091号(2003年1月16日付けで公示された米国第09/898,743号)の中で記述されている。かかる方法においては、複合混合物(すなわち各々の被分析物)内の各々の核酸が一意的標識によって一意的に結合されかくして検出され得るような形で、充分な標識が生成される(各標識は、直接計数され、その結果、混合物中の各々の分子種のデジタル読取りが結果としてもたらされる)。
該発明に従ったオリゴマーは、結腸直腸細胞増殖障害の検出;そのサブクラスの検出及びその間又は中での弁別;その診断;その予後診断;その治療;その管理;そしてその治療と管理のために利用されることが特に好ましい。これは、結腸直腸癌腫、結腸腺腫、炎症性結腸組織、1cm未満の悪性度2の異形成結腸腺腫、1cmより大きい悪性度3の異形成結腸腺腫、正常な結腸組織、非結腸健常組織及び非結腸癌組織といった組織クラスのうちの単数又は複数のものの検出又は検出と弁別のための前記セットの使用によって可能となる。
特に好ましいのは、以下のオリゴマーヌクレオチドセットのうちの1つから選択された少なくとも2つのオリゴマーヌクレオチドを含むようなオリゴマーセットである。
該方法の1実施形態においては、結腸直腸癌腫組織又は結腸腺腫のうちの少なくとも1つが、炎症性結腸組織及び正常な結腸組織から成る群から選択された少なくとも1つの組織から区別される。これは、配列番号1〜12、15〜20、22、25〜36、38〜49、51〜58及びその補体から成る群から選択された1配列の少なくとも16の隣接ヌクレオチドを含むか又はこれに対しストリンジェント条件下でハイブリッド形成する少なくとも1つの標的配列のメチル化状況の分析により達成される。これは、好ましくは、以下のものから成る群のうちの1つから選択された少なくとも1つのオリゴマーヌクレオチドそしてより好ましくは少なくとも2つのオリゴマーヌクレオチドから成るセットを使用することによってか又は、以下のものから成る群のうちの1つから選択された少なくとも2つのオリゴマーヌクレオチドで構成されたセットを使用することによって達成される。
該方法の1実施形態においては、結腸直腸癌腫が、非結腸健常組織、末梢血リンパ球及び非結腸癌から成る群から選択された少なくとも1つの組織から区別される。1実施形態においては、これは、配列番号1〜23、26〜36、38〜43、45〜49、51〜58から成る群から選択された1配列の少なくとも16の隣接ヌクレオチドを含むか又はこれに対しストリンジェント条件下でハイブリッド形成する少なくとも1つの標的配列のメチル化状況の分析により達成される。これは、好ましくは、以下のものから成る群のうちの1つから選択された少なくとも1つのオリゴマーヌクレオチド、そしてより好ましくは少なくとも2つのオリゴマーヌクレオチドから成るセットを使用することによって達成される:
該方法の1実施形態においては、結腸直腸癌腫が、炎症性結腸組織、正常な結腸組織、非結腸健常組織、末梢血リンパ球、結腸腺腫及び非結腸癌組織から成る群から選択された少なくとも1つの組織から区別される。これは、配列番号1〜3、5〜13、15〜23、26〜36、38〜43、45〜49、51〜58及びその補体から成る群から選択された1配列の少なくとも16の隣接ヌクレオチドを含むか又はこれに対しストリンジェント条件下でハイブリッド形成する少なくとも1つの標的配列のメチル化状況の分析により達成される。これは、好ましくは、以下のものから成る群のうちの1つから選択された少なくとも1つのオリゴマーヌクレオチド、そしてより好ましくは少なくとも2つのオリゴマーヌクレオチドから成るセットを使用することによってか又は、以下のものから成る群のうちの1つから選択された少なくとも2つのオリゴマーヌクレオチドを含むオリゴマーセットを使用することによって達成される:
該方法の1実施形態においては、結腸直腸癌腫は、結腸腺腫から区別される。これは、配列番号11、25、27、38、40、45、53及びその補体から成る群から選択された1配列の少なくとも16の隣接ヌクレオチドを含むか又はこれに対しストリンジェント条件下でハイブリッド形成する少なくとも1つの標的配列のメチル化状況の分析により達成される。これは、好ましくは、以下のものから成る群のうちの1つから選択された少なくとも1つのオリゴマーヌクレオチド、そしてより好ましくは少なくとも2つのオリゴマーヌクレオチドから成るセットを使用することによって達成される。
該方法の1実施形態においては、結腸直腸癌腫組織又は結腸腺腫のうちの少なくとも1つが、炎症性結腸組織及び正常な結腸組織から成る群から選択された少なくとも1つの組織から区別される。これは、配列番号1〜64及びその補体から成る群から選択された1配列の少なくとも16の隣接ヌクレオチドを含むか又はこれに対しストリンジェント条件下でハイブリッド形成する少なくとも1つの標的配列のメチル化状況の分析により達成される。これは、好ましくは、以下のものから成る群のうちの1つから選択された少なくとも1つのオリゴマーヌクレオチド、そしてより好ましくは少なくとも2つのオリゴマーヌクレオチドを含む少なくとも2つのオリゴマーから成るセットを用いることによって達成される:
該方法の1実施形態においては、結腸直腸癌腫組織が、炎症性結腸組織及び正常な結腸組織のうちの少なくとも1つから区別される。これは、配列番号1〜3、5〜23、25〜36、38〜49、51〜58及びその補体から成る群から選択された、1配列の少なくとも16の隣接ヌクレオチドを含むか又はこれに対しストリンジェント条件下でハイブリッド形成する少なくとも1つの標的配列のメチル化状況の分析により達成される。これは、好ましくは、以下のものから成る群のうちの1つから選択された少なくとも1つのオリゴマーヌクレオチド、そしてより好ましくは少なくとも2つのオリゴマーヌクレオチドを含む少なくとも2つのオリゴマーから成るセットを使用することによって達成される。
該方法の1実施形態においては、結腸直腸癌腫組織又は結腸線種の少なくとも1つが、炎症性結腸組織、正常な結腸組織、非結腸健常組織、末梢血リンパ球及び非結腸癌組織から成る群から選択された少なくとも1つの組織から区別される。これは、配列番号1〜36、38〜43、45〜58、及びその補体から成る群から選択された1配列の少なくとも16の隣接ヌクレオチドを含むか又はこれに対しストリンジェント条件下でハイブリッド形成する少なくとも1つの標的配列のメチル化状況の分析により達成される。これは、好ましくは、以下のものから成る群のうちの1つから選択された少なくとも1つのオリゴマーヌクレオチド、そしてより好ましくは少なくとも2つのオリゴマーヌクレオチドを含む少なくとも2つのオリゴマーから成るセットを使用することによって達成される:
該方法の1実施形態においては、結腸に由来する組織は、以下のものから成る群のうちの1つから選択された少なくとも2つのオリゴマーヌクレオチドを含むオリゴマーセットを使用することによって、非結腸由来の組織から区別される。
該方法の1実施形態においては、細胞増殖障害は、以下のものから成る群のうちの1つから選択された少なくとも2つのオリゴマーヌクレオチドを含むオリゴマーセットを使用することによって、健常組織から区別される:
該方法のさらなる1実施形態においては、肺、肝臓、膵臓、胆管、胃及び結腸癌から成る群の気道・消化管細胞増殖障害が検出される。これは、配列番号20、41、35、3、39、33及びその補体から成る群から選択された1配列の少なくとも16の隣接ヌクレオチドを含むか又はこれに対しストリンジェント条件下でハイブリッド形成する少なくとも1つの標的配列のメチル化状況の分析によって達成される。本発明はさらに、シトシンメチル化及び単一ヌクレオチド多型を分析することにより対象の体内で配列番号1〜配列番号64に従ったゲノム配列の遺伝的及び/又はエピジェネティックパラメータを確認するための方法を提供している。前記方法は、前記対象から得た生体試料中の配列番号1〜配列番号64のうちの単数又は複数のものを含む核酸を少なくとも1つの試薬又は一連の試薬と接触させる段階を含み、ここで前記試薬又は一連の試薬が標的核酸内のメチル化されたCpGジヌクレオチドと非メチル化CpGジヌクレオチドを区別する。
好ましくは、前記方法は、以下の段階を含んで成る。すなわち第1の段階では、分析すべき組織の試料が得られる。供給源は、細胞系列、組織学的スライド、生検材料、パラフィン包埋組織、体液、排泄物、結腸洗浄廃液、尿、血漿、血清、全血、単離血液細胞、血液から単離された細胞及び、考えられる全てのそれらの組合せといったような適切な任意の供給源であり得る。前記DNA供給源が、結腸洗浄廃液、尿、血漿、血清、全血、単離血液細胞、血液から単離された細胞から成る群から選択された排泄物又は体液であることが好ましい。
ゲノムDNAは次に試料から単離される。ゲノムDNAは、市販のキットの使用を含め、当該技術分野において標準的なあらゆる手段によっても単離され得る。簡単に言うと、問題のDNAが細胞膜によりカプセル封入されている場合、生体試料は、酵素的、化学的又は機械的手段により分断され分解されなくてはならない。このとき、プロティナーゼKでの消化などによりDNA溶液からタンパク質及びその他の汚染物を一掃することができる。その後ゲノムDNAを該溶液から回収する。これは、塩析、有機抽出又は固相支持体へのDNAの結合を含めたさまざまな方法を用いて実施可能である。方法の選択は、時間、支出及びDNA所要量を含めた複数の要因によって影響されることになる。
ひとたび核酸が抽出されたならば、分析中でゲノム2本鎖DNAを使用する。
該方法の第2段階においては、5’位置においてメチル化されていないシトシン塩基がウラシル、チミン又はハイブリダイゼーション挙動に関してシトシンと異なっているもう1つの塩基へと転換されるような形で、ゲノムDNA試料を処理する。これは、本書では「前処理」又は「処理」として理解される。
ゲノムDNAの上述の処理は、好ましくは、重亜硫酸塩(亜硫酸水素、重亜硫酸)及び、ウラシル又は塩基対合挙動に関してシトシンと異なっているもう1つの塩基への非メチル化シトシン核酸塩基の転換を結果としてもたらすその後のアルカリ加水分解を用いて実施される。
該方法の第3段階では、本発明に従ったプライマオリゴマーヌクレオチドセット及び増幅酵素を用いて、処理済みDNAのフラグメントが増幅される。複数のDNAセグメントの増幅を1つの同じ反応容器内で同時に実施できる。標準的には、増幅は、ポリメラーゼ連鎖反応(PCR)を用いて実施される。プライマオリゴマーヌクレオチドのセットには、その配列が各々逆相補的、であるか、同一であるか又は配列番号304〜配列番号535及びそれに相補的な配列のうちの1つの塩基配列の少なくとも16塩基対という長さのセグメントに対しストリンジェントな又はきわめてストリンジェントな条件下でハイブリッド形成する少なくとも2つのオリゴマーヌクレオチドが含まれる。
該方法の代替的実施形態においては、配列番号1〜配列番号64のうちの単数又は複数のものを含む核酸配列内の予め選択されたCpG位置のメチル化状況は、メチル化特異的プライマオリゴマーヌクレオチドを使用することによって検出可能である。この技術(MSP)はHarmanに対する米国特許第6,265,171号の中で記述されてきた。重亜硫酸塩で処理されたDNAの増幅のためにメチル化状況特異的プライマを使用することにより、メチル化核酸と非メチル化核酸の弁別を行なうことができる。MSPプライマ対は、重亜硫酸塩処理されたCpGジヌクレオチドに対しハイブリッド形成する少なくとも1つのプライマを含有する。従って前記プライマの配列は少なくとも1つのCpGジヌクレオチドを含む。非メチル化DNAに特異的なMSPプライマがCpG内のC位置の位置に「T」を含有している。従って、好ましくは、前記プライマの塩基配列は、配列番号304〜配列番号535及びそれに相補的な配列の1つに従った処理済み核酸配列に対しハイブリッド形成する少なくとも9ヌクレオチドの長さをもつ配列を含むことが必要とされ、ここで前記オリゴマーの塩基配列は少なくとも1つのCpGジヌクレオチドを含む。
該方法のさらなる好ましい実施形態においては、MSPプライマは、以下のものから成る群から選択される:
該方法のさらなる好ましい実施形態は、ブロッカーオリゴマーヌクレオチドの使用を含む。かかるブロッカーオリゴマーヌクレオチドの使用については、Yu et al., Bio Techniques 23: 714-720, 1997によって記述されている。遮断用プローブオリゴマーヌクレオチドはPCRプライマと同時に重亜硫酸塩処理された核酸に対してハイブリッド形成される。核酸のPCR増幅は、遮断用プローブの5’位置で終結され、かくして核酸の増幅は、該遮断用ブロックに相補的な配列が存在する場合に抑制されることになる。プローブは、メチル化状況に特異的な要領で重亜硫酸塩で処理された核酸に対しハイブリッド形成するように設計され得る。例えば、未メチル化核酸の集団内のメチル化核酸の検出のためには、メチル化核酸の増幅の抑制が望まれている場合の「CpG」とは異なり、問題の位置で「CpA」又は「TpA」を含む遮断用プローブを使用することによって問題の位置でメチル化されていない核酸の増幅の抑制が実施されることになる。
ブロッカーオリゴマーヌクレオチドを用いたPCR方法については、ポリメラーゼを媒介とした増幅の効率の良い分断には、ブロッカーオリゴマーヌクレオチドがポリメラーゼにより伸長されていないことが必要である。好ましくは、これは、「遊離」、ヒドロキシル基以外のもので3’位置で誘導体化されたオリゴマーヌクレオチド又は3’−デオキシオリゴマーヌクレオチドであるブロッカーの使用を通して達成される。例えば、3’−0−アセチルオリゴマーヌクレオチドが、好ましいクラスのブロッカー分子の代表である。
付加的には、ブロッカーオリゴマーヌクレオチドのポリメラーゼが媒介分解を排除すべきである。好ましくは、このような排除には、5’−3’エキソヌクレアーゼ活性が欠如したポリメラーゼの使用又は、例えばブロッカー分子にヌクレアーゼ耐性を付与するチオアート架橋をその5’末端に有する修飾されたブロッカーオリゴマーヌクレオチドの使用のいずれかが含まれる。特定の利用分野では、ブロッカーのかかる5’修飾が必要とされない可能性がある。例えば、ブロッカー及びプライマ結合部位が重複しかくしてプライマの結合が(例えば余剰のブロッカーで)排除される場合、ブロッカーオリゴマーヌクレオチドの分解が実質的に排除されることになる。これは、ポリメラーゼがプライマをブロッカーに向かって及びブロッカーを通して(5’−3’方向に)拡張しない(これは、通常ハイブリッド形成されたブロッカーオリゴマーヌクレオチドの分解を結果としてもたらすプロセスである)からである。
本発明では、本書にて実施されているように、特に好ましいブロッカー/PCR実施形態には、遮断用オリゴマーヌクレオチドとしてペプチド核酸(PNA)の使用が含まれる。このようなPNAブロッカーオリゴマーは、ポリメラーゼによって分解されることも拡張されることもないことから、理想的に適している。
従って好ましくは、前記遮断用オリゴマーヌクレオチドの塩基配列は、配列番号304〜配列番号535及びそれに相補的な配列のうちの1つに従った処理済み核酸配列に対しハイブリッド形成する少なくとも9ヌクレオチドの長さを有する1配列を含むことが必要とされ、ここで、前記オリゴマーヌクレオチドの塩基配列は少なくとも1つのCpG、TpG又はCpAジヌクレオチドを含む。
該方法のさらに好ましい実施形態では、該遮断用オリゴマーヌクレオチドは
から成る群から選択される。
増幅を用いて得られたフラグメントは、直接的又は間接的に検出可能な標識を担持することができる。好ましいのは、質量分析計内で検出可能である標準的な質量をもつ離脱可能な分子フラグメント又は蛍光標識、放射性核種の形をした標識である。前記標識が質量標識である場合、標識された増幅物が単一の正又は負の正味電荷を有し、質量分析計内でのより優れた検出を可能にすることが好まれる。検出は、例えばマトリクスサポートレーザー脱離/イオン化質量分析(MALDI)を用いてか又は電子噴霧質量分析(ESI)を用いて実施及び視覚化され得る。
マトリクスサポートレーザー脱離/イオン化質量分析法(MALDI−TOF)は、生体分子の分析のための非常に効率の高い開発である(Karas & Hillenkamp, Anal Chem., 60: 2299-301, 1988)。吸光マトリクス内に、被分析物が包埋される。該マトリクスは短レーザーパルスにより蒸発され、かくして被分析物分子をフラグメント化されない形で蒸気相内に輸送する。被分析物は、マトリクス分子との衝突によってイオン化される。印加された電圧が、イオンを自由空間飛行管内に加速させる。その異なる質量のため、イオンは異なる速度で加速される。イオンは小さくなればなるほど、大きいものに比べ早く検出器に到達する。MALDI−TOF分光分析は、ペプチド及びタンパク質の分析に極めて適している。核酸分析は、幾分かむずかしい(Gut & Beck、現行の改革及び将来の傾向、1: 147-57, 1995)。核酸分析に関する感度はペプチドの場合より約100分の1低く、フラグメントサイズが大きくなるにつれて不均衡な形で減少する。その上、多重に負に帯電した主鎖をもつ核酸については、マトリクスを介したイオン化プロセスは著しく効率が悪い。MALDI−TOF分光分析においては、マトリクスの選択が著しく重要な役割を果たす。ペプチドの脱離については、非常に細かい結晶化を生成するいくつかの非常に効率の良いマトリクスが発見されてきた。現在、DNAのためのいくつかの応答性マトリクスが存在するが、ペプチドと核酸の間の感度の差異は減少されていない。しかしながら、この感度差は、ペプチドにさらに類似するような形でDNAを化学的に修飾することによって低減させることができる。例えば、主鎖の通常のリン酸塩がチオリン酸塩によって置換されているホスホチオアート核酸を単純なアルキル化学反応を用いて電荷中性DNAへと転換させることができる(Gut & Beck, Nucleic Acids Res. 23: 1367-73, 1995)。この修飾されたDNAに対する電荷タグのカップリングは、ペプチドについて発見されるものと同レベルまでのMALDI−TOF感度の増大を結果としてもたらす。電荷タグ付けのさらなる利点は、修飾されていない基質の検出をはるかに困難にする、不純物に対する分析の安定性の増大にある。
該方法の第4段階では、該方法の第3段階中に得られた増幅物は、処理に先立ちCpGジヌクレオチドのメチル化状況を確認する目的で分析される。
増幅物がMSP増幅を用いて得られる実施形態においては、増幅物の有無はそれ自体プライマの塩基配列に従って、該プライマによりカバーされるCpG位置のメチル化状態を表わしている。
標準PCR及びメチル化特異的PCRの両方を用いて得られた増幅物は、アレイ技術及びプローブベースの技術といったように(ただしこれに制限されるわけではない)ハイブリダイゼーションベースの方法を用いて、ならびに配列決定及び鋳型誘導型拡張といったような技術を用いて、さらに分析可能である。
該方法の1実施形態においては、段階3で合成された増幅物は、その後オリゴマーヌクレオチド及び/又はPNAプローブのアレイ又はセットにハイブリッド形成される。この状況下で、ハイブリダイゼーションは、以下の要領で行なわれる。すなわちハイブリダイゼーション中に使用されるプローブセットは好ましくは少なくとも2つのオリゴマーヌクレオチド又はPNA−オリゴマーから成る。該プロセスにおいて、増幅物は、固相に予め結合されたオリゴマーヌクレオチドに対しハイブリッド形成するプローブとして役立つ。ハイブリッド形成されていないフラグメントはその後除去される。前記オリゴマーヌクレオチドは、該配列リスト内で特定された塩基配列のセグメントと逆相補的な又は同一の少なくとも9ヌクレオチドの長さを有する少なくとも1つの塩基配列を含有する。そして、該セグメントは、少なくとも1つのCpG、TpG又はCpAジヌクレオチドを含む。
好ましい1実施形態においては、前記ジヌクレオチドは、オリゴマーの中央の3分の1に存在する。例えば、オリゴマーが1つのCpGジヌクレオチドを含む場合、前記ジヌクレオチドは好ましくは13量体の5’末端から5番目乃至9番目のヌクレオチドである。1つのオリゴマーヌクレオチドが、配列番号1〜配列番号64に従った配列内の各々のCpGジヌクレオチド及び配列番号304〜配列番号535内の同等の位置の分析のために存在している。前記オリゴマーヌクレオチドは同様に、ペプチド核酸の形でも存在し得る。このとき、ハイブリッド形成されていない増幅物は除去される。その後ハイブリッド形成された増幅物は検出される。このような状況下で、増幅物に付着された標識を、オリゴマーヌクレオチド配列が位置設定されている固相の各位置で固定できることが好ましい。
該方法のさらなる実施形態においては、CpG位置のゲノムメチル化状況は、PCR増幅プライマと同時に重亜硫酸塩処理されたDNAに対しハイブリッド形成するオリゴマーヌクレオチドプローブを用いて確認することができる(ここで前記プライマはメチル化特異的であっても標準のものであってもよい)。
この方法の特に好ましい実施形態は、2重標識された蛍光オリゴマーヌクレオチドプローブを利用する(ABIプリズム7700配列検出システム、Perkin Elmer Applied Biosystems、カリフォルニア州フォスターシティを用いたTaq ManTM PCR)、蛍光ベースの実時間定量的PCR(Heid et al., Genome Res. 6: 986-994, 1996;米国特許第6,331,393号も参照のこと)の使用である。Taq ManTM PCR反応は、好ましい実施形態において順方向増幅プライマと逆方向増幅プライマの間にあるGpC−富有配列に対しハイブリッド形成するように設計されているTaq ManTM プローブと呼ばれる非拡張性の問合せオリゴマーヌクレオチドの使用という方法を利用する。Taq ManTM プローブはさらに、Taq ManTMオリゴマーヌクレオチドのヌクレオチドに付着されたリンカー部分(例えばホスホルアミダイト)に共有結合された蛍光「レポータ部分」及び「消光剤部分」を含む。重亜硫酸塩処理に続く核酸内のメチル化の分析のためには、プローブが、Methyl Light TM検定としても知られている米国特許第6,331,393号(本書にその全体が参考として内含されている)の中で記述されている通り、メチル化特異的であることが必要とされる。記述されている発明と共に使用するのに同じく適しているTaq ManTM 検出方法の変形形態としては、2重プローブ技術(LightcyclerTM)又は蛍光増幅プライマ(SunriseTM技術)の使用が含まれる。これらの技術は両方共、重亜硫酸塩で処理されたDNAで使用するため、そしてさらにCpGジヌクレオチド内でのメチル化分析のために適した要領で適合させることが可能である。
重亜硫酸塩で処理された核酸の分析によるメチル化の査定のためのプローブオリゴマーヌクレオチドの使用のためのさらなる適切な方法。該方法のさらなる好ましい実施形態においては、該方法の第5段階は、Gonzalgo & Jones, Nucleic Acids Res. 25: 2529-2531, 1997によって記述されているようなMS−SNuPEといったような鋳型誘導型オリゴマーヌクレオチド拡張の使用を含んで成る。
該方法のさらにもう1つの実施形態においては、該方法の第5段階は、該方法の第3段階において生成される増幅物の配列決定及びその後の配列分析を含んで成る(Sanger F., et al., Proc Natl Acad Sci USA 74: 5463-5467, 1977)。
最良の形態
該方法の最も好ましい実施形態においては、ゲノム核酸は以上で概略説明した方法の最初の3段階すなわち、
a) 対象のゲノムDNAを有する生体試料を対象から得る段階;
b) ゲノムDNAを抽出する、又はその他の形で単離する段階;
c) その5位置で非メチル化されているシトシン塩基をウラシル又はハイブリダイゼーション特性に関してシトシンと検出可能な形で異なっているもう1つの塩基に転換するべく、b)のゲノムDNA又はそのフラグメントを単数又は複数の試薬で処理する段階;
に従って単離され処理され、ここで
d) c)にある処理の後の増幅が、メチル化特異的な要領で、すなわちメチル化特異的プライマ又は遮断用オリゴマーヌクレオチドを用いて実施されており、さらにここで
e) 増幅物の検出は、上述の通り実時間検出プローブを用いて実施される。
好ましくは、d)のその後の増幅が上述のようにメチル化特異的プライマを用いて実施される場合、前記メチル化特異的プライマは、配列番号304〜配列番号535及びそれに相補的な配列のうちの1つに従って、処理済み核酸配列にハイブリッド形成する少なくとも9ヌクレオチドの長さをもつ配列を含み、ここで前記オリゴマーの塩基配列は少なくとも1つのCpGジヌクレオチドを含む。
該方法のさらなる好ましい実施形態においては、MSPプライマは以下のものから成る群から選択される:
該方法のStep e)、すなわち配列番号1〜配列番号64に従った単数又は複数のCpG位置のメチル化状況を表わす特異的増幅物の検出は、上述の通りの実時間検出方法を用いて実施され、ここで前記ハイブリダイゼーションプローブの配列は以下のものから成る群から選択される:
列挙された各々のゲノム配列について、配列リスト中に詳述されている通りの以下のオリゴマーヌクレオチドを、組合せ型MSP−実時間分析のために使用することができる:
Taqman実時間単一プローブ検出検定:
配列番号41
該方法の代替的な最も好ましい実施形態においては、d)のその後の増幅は、上述のとおり、遮断用オリゴマーヌクレオチドの存在下で実施される。前記遮断用オリゴマーヌクレオチドは、配列番号304〜配列番号535及びそれに相補的な配列のうちの1つに従った処理済み核酸配列に対しハイブリッド形成する少なくとも9ヌクレオチドの長さをもつ配列を含んで成り、ここで前記オリゴマーの塩基配列は少なくとも1つのCpG、TpG又はCpAジヌクレオチドを含む。該方法のSTe)すなわち、配列番号1〜配列番号4に従った単数又は複数のCpG位置のメチル化状況を表わす特異的増幅物の検出は、上述の通りの実時間検出を用いて実施される。
該方法のさらなる好ましい実施形態においては、遮断用オリゴマーヌクレオチドの配列(単複)は以下のものから成る群から選択される:
該方法の段階e)、すなわち、配列番号1〜配列番号4に従った単数又は複数のCpG位置のメチル化状況を表わす特異的増幅物の検出は、上述の通りの実時間検出方法を用いて実施され、ここで前記ハイブリダイゼーションプローブの配列は以下のものから成る群から選択される:
列挙されている各々のゲノム配列については、組合せ型遮断用オリゴマーヌクレオチド実時間分析のために、配列リスト中に詳述された通りの以下のオリゴマーヌクレオチドを使用することができる:
該発明の付加的な実施形態は、前処理の必要の無い該発明に従ったゲノムDNA(S1〜S64及びその補体)のメチル化状況の分析のための方法を提供している。
このような付加的な実施形態の第1段階においてゲノムDNA試料は、組織又は細胞供給源から単離される。好ましくは、かかる供給源には、細胞系列、組織学的スライド、体液又はパラフィンに包埋された組織が含まれる。第2段階において、ゲノムDNAは抽出される。抽出は、洗浄剤溶解物の使用、音波処理及びガラスビーズを伴うボルテックスを含めた(ただしこれに制限されるわけではない)当業者にとって標準的である手段によるものであってよい。
好ましい実施形態においては、DNAは、処理に先立って分割され得、これは、技術的現状において標準的なあらゆる手段によるもの、特にメチル化感応性制限エンドヌクレアーゼを用いたものであり得る。
第3段階で、DNAは次に単数又は複数のメチル化感応性制限酵素で消化される。消化は、制限部位におけるDNAの加水分解が特異的CpGジヌクレオチドのメチル化状況の情報を提供することになるような形で実施される。
任意のただし好ましい実施形態である第4段階で、制御フラグメントは増幅される。これは、好ましくは、ポリメラーゼ連鎖反応を用いて実施され、前記増幅物は、上述のような適切な検出可能な標識、すなわちフルオロフォア標識、放射性核種及び質量標識を担持し得る。
第5段階で、増幅物は検出される。該検出は、当該技術分野において標準的なあらゆる手段例えばゲル電気泳動分析、ハイブリダイゼーション分析、PCR産物内の検出可能なタグの取込み、DNAアレイ分析、MALDI又はESI分析(ただしこれに制限されるわけではない)によるものであってよい。
ゲノム核酸のメチル化状態の決定の後、配列番号1〜配列番号64の少なくとも1つのCpGジヌクレオチドのメチル化状態又は配列番号1〜S64の複数のCpGジヌクレオチド配列の平均メチル化状態又はこの平均メチル化状態を示す値に基づいて、結腸直腸細胞増殖障害の存在、不在又はサブクラスが演繹される。1変形実施形態においては、群から選択された気道消化器細胞増殖障害の存在又は不在は、配列番号20、41、35、3、39、33のうちの少なくとも1つのCpGジヌクレオチド配列のメチル化状態又は配列番号20、41、35、3、39、33の複数のCpGジヌクレオチド配列の平均メチル化状態又はそれを示す値に基づいて演繹される。
結腸直腸細胞増殖障害のための診断学的検定
本発明は、配列番号1〜配列番号64のうちの単数又は複数のものの中の重要な遺伝的及び/又はエピジェネティックパラメータをマーカーとして使用できる、患者又は個体にとって不利である事象の診断を可能にする。本発明を用いて得られる前記パラメータを、もう1つの遺伝的及び/又はエピジェネティックパラメータセットと比較することができ、その差異は、患者又は個体にとって不利である事象の診断及び/又は予後診断のためのベースとして役立つ。
より特定的に言うと、本発明は、結腸直腸癌腫の早期検出のための高リスク集団のスクリーニングを可能にする。その上、本発明の特定の実施形態は、気道消化器癌の検出を可能にし、かくしてさらにこの目的に適している。該方法のさらなる実施形態は同様に、例えば結腸ポリープといったその他の結腸細胞増殖障害から結腸直腸癌腫を弁別するための細胞学的スクリーニングに対する代替案としても使用可能である。
特定的には、本発明は、S1〜S64の単数又は複数のCpGジヌクレオチド配列又はこのようなCpGジヌクレオチド配列を含むそのサブ領域の示差的メチル化の測定に基づく診断学的癌検定を提供する。標準的には、かかる検定には、検査用組織から組織試料を得る段階、対照試料又は既知の標準との関係において、該組織試料から誘導されたS1〜S64の単数又は複数のCpGジヌクレオチド配列の少なくとも1つのメチル化状況を測定するための検定を実施する段階、及びそれに基づいて診断又は予後診断を行なう段階が関与する。
特定の好ましい実施形態においては、配列番号1〜配列番号535又はそのアレイに基づくものならびにそれに基づきかつ結腸直腸細胞増殖障害の診断及び/又は予後診断のために有用であるキット内のものといった発明力あるオリゴマーが、CpGジヌクレオチドメチル化状況を査定するために使用される。
キット
その上、本発明の付加的な態様は、例えば重亜硫酸塩含有試薬;各ケースにおいてその配列が配列番号1〜配列番号535といった配列の長さ16塩基のセグメントに対し相補的であるか又はストリンジェントな又は極めてストリンジェントな条件下でハイブリッド形成する少なくとも2つのオリゴマーヌクレオチドを含有する1組のプライマオリゴマーヌクレオチド;オリゴマーヌクレオチド及び/又はPNAオリゴマー;ならびに上述の方法を実施し評価するための使用説明書を含むキットである。さらに好ましい実施形態においては、前記キットはさらに、MS−SNuPE、MSP、MethyLightTM、HeavyMethylTM、COBRA及び核酸配列決定といった技術のうちの単数又は複数のものを含むCpG位置特定的メチル化分析を実施するための標準的試薬を含むことができる。
本発明は、その好ましい実施形態のいくつかに従って特定的に記述されてきたものの、以下の実施例は、該発明を例示するためにのみ役立ち、本発明をその最も広い解釈及びその同等の構成の原理及び範囲内に制限することを意図したものではない。
実施例
試料を、凍結した組織又は抽出されたゲノムDNAのいずれかとして受取った。ゲノムDNAの単離のためQiagen及びRoche磁気分離キットから溶解緩衝液を用いてDNA試料を抽出した。同じく、Qiagen Genomic Tip-100カラムならびにMagna Pure装置及びRoche試薬を用いても、DNA試料を抽出した。全ての試料を、分光分析法又は蛍光分析法を用いかつ試料サブセットについてアガロースゲル上で定量化した。
重亜硫酸塩処理及びmPCR
全ての試料の全ゲノムDNAを重亜硫酸塩で処理し、未メチル化シトシンをウラシルに転換した。メチル化シトシンは保存状態のままにしておいた。重亜硫酸塩処理を、Olek et al., (1996)に記述されたプロトコルに従ってわずかな修正を加えて実施した。同じ生物学的背景をもつ全ての試料を合わせて処理しその結果後日データ内に潜在的なプロセス−偏向をもたらすのを避けるために、試料を無作為に処理用バッチにグループ分けした。重亜硫酸塩処理のために、我々は、性別、診断及び組織について任意抽出した50の試料のバッチを作成した。1個のDNA試料につき2つの独立した重亜硫酸塩反応を実施した。重亜硫酸塩化の後、各DNA試料10ngを、6〜8個のプライマ対を含有するその後のmPCR反応において使用した。
各反応は、以下のものを含有していた:
各dNTPS 0.4mM
Taqポリメラーゼ 1ユニット
PCR緩衝液 2.5μl
MgCl2 3.5mM
プライマセット80nM(12〜16プライマ)
DNA 11.25ng(重亜硫酸塩処理済み)。
プライマのさらなる詳細は、表1に示されている。
以下の要領で40サイクルを実施した:15分間95℃での変性とそれ続く45秒55℃でのアニーリング、2分間65℃でのプライマ伸長。65℃での最終伸長は、10分間実施した。
1.1.2,ハイブリダイゼーション
各々の個々の試料からの全てのPCR産物を次に、分析中の各CpG位置について一対の固定化されたオリゴマーヌクレオチドを担持するガラススライドに対しハイブリッド形成させた。これらの検出オリゴマーヌクレオチドの各々は、当初未メチル化(TG)又はメチル化(CG)状態のいずれかであった1つのCpG部位のまわりで重亜硫酸塩転換済み配列にハイブリッド形成するように設計されていた。使用された全てのハイブリダイゼーションオリゴマーヌクレオチドのさらなる詳細(情報を提供するもの又はそうでないものの両方)については、表2を参照のこと。TG及びCG変異体の間の単一ヌクレオチドの差異の検出を可能にするように、ハイブリダイゼーション条件を選択した。
各々の多重PCR産物5μl体積を10×Ssarc緩衝液中で希釈させた(10×Ssarc:dH2Oで1000mlまで希釈した230mlの20×SSC、180mlのラウロイルサルコシンナトリウム溶液20%)。反応混合物を次に、以下の通り、検出オリゴマーヌクレオチドに対しハイブリッド形成した:95℃での変性、10℃までの冷却、42℃で一晩のハイブリダイゼーションとそれに続く42℃で10×SsarcとdH2Oでの洗浄。
ハイブリダイゼーションオリゴマーヌクレオチドのさらなる詳細が表2に示されている。
各々のハイブリッド形成されたオリゴマーヌクレオチドからの蛍光シグナルを、genepixスキャナ及びソフトウェアを用いて検出した。(各CpG位置を分析するのに使用されるCGオリゴマーヌクレオチド及びTGオリゴマーヌクレオチドからの)2つのシグナルについての比を、蛍光シグナルの強度の比較に基づいて計算した。
性別、診断、組織及び重亜硫酸塩バッチについて任意抽出された80個の試料のバッチ内で試料を処理した。各々の重亜硫酸塩処理済みDNA試料について、ハイブリダイゼーションを実施した。このことはすなわち、各試料について、合計4つのチップが処理されたことを意味している。
データ分析方法
チップデータの分析:
未処理ハイブリダイゼーション強度からメチル化比まで;
各々のCpG位置でのログメチル化比(log(CG/TG))は、以下の段階を含む標準化された予備処理パイプラインに従って決定される:
各スポットについて、前景画素強度中央値から背景画素強度中央値を減算する(こうして、背景補正されたハイブリダイゼーション強度の優れた推定値が得られる):
各CpG位置のCG及びTGの両方の検出オリゴマーヌクレオチドについて、4つの冗長スポット強度の背景補正済み中央値を取る;
各チップ及び各々のCpG位置について、log(CG/TG)比を計算する;
各々の試料について、冗長チップ反復全体にわたるlog(CG/TG)強度の中央値を取る。
この比は、ハイブリダイゼーションノイズが、考えられるメチル化率の全範囲にわたりおおよそ恒常な分散を有するという特性をもつ(Huber et al., 2002)。
主成分分析
主成分分析(PCA)は、測定ベクトル(例えばチップデータ、複数のCpGs上のメチル化プロフィールなど)を新しい座標系上に投影する。新しい座標軸は、主成分と呼ばれる。第1の主成分は、データの最大の分散の方向に広がる。その後の成分は、分散を減少させることによって順序づけされ、互いに直交する。異なるCpG位置は、異なる重みで、異なる成分に沿ったデータクラウドの拡張に寄与する。PCAは、管理の無い技術である、すなわちそれはデータポイントの標識を考慮に入れない(さらなる詳細については、例えばRipley(1996)を参照のこと)。
PCAは、標準的には、データから高い分散でフィーチャを視覚化又は抽出する目的でより低い次元のサブ空間上に高次元データ(我々の場合、メチル化アレイデータ)を投射するのに用いられる。本報告書では、我々は、データの統計的品質管理のために2次元投射を使用している。
単一の異常値チップを検出し、これらをさらなる分析から排除するため、PCAのロバストバージョンが使用される(Model et al., 2002)。
仮説検証
主たるタスクは、2つのクラス間の平均メチル化度の有意な差を示すマーカーを同定することにある。有意な差異は、2つのクラスの平均メチル化が同一であるというヌル仮説がP<0.05で拒絶され得る場合に検出される。我々はこの検査を潜在的マーカー全セットに応用することから、多重検査のためにP値を補正しなければならない。これは、誤発見率(FDR)方法を適用することによって行なわれた(Dudoit et al., 2002)。
2つのクラス内のメチル化レベルが同一であるというヌル仮説を検査するために、我々は、ロジスティック回帰モデルについての尤度比検定を使用した(Venable 及びRipley, 2002)。単一マーカーについてのロジスティック回帰モデルは、それぞれのゲノムの関心領域(ROI)内の全てのCpG位置からのメチル化測定の線形組合せである。1つのマーカーの有意なP値は、このROIが、2つのクラスによって与えられるような関心のある問題に対して幾分かの系統的相関関係を有することを意味している。しかしながら、少なくとも正式には、それはそのマーカーの実際の予想力についていかなる供述も行なっていない。
管理された学習によるクラス予測
選択されたマーカーのCpG集合が異なる組織クラス間でいかにうまく弁別を行えるかの信頼性の高い推定を提供するためには、分類によるその予測精度を決定することができる。その目的で、我々は、そのクラス標識を伴う或る一定の組織試料セットを使用してメチル化プロフィールベースの予測関数を計算する。この段階は、トレーニングと呼ばれ、データ標識により表わされる先行知識を活用する。この関数の予測精度は、このとき、クロス確認によって又は独立した試料セットについて検査される。選択方法として、我々は、サポートベクトルマシン(SVMアルゴリズム(Duda (2001),Christianmni (2000))を使用している。相反する供述のないかぎり、この報告書のためには、偽陽性又は偽陰性分類に付随するリスクは、それぞれのクラスサイズとの関係において等しくなるように設定される。そのため、学習アルゴリズムは、独立した検査試料セットについての精度を最適化するという目的でクラス予測関数を獲得することになる。従って、結果として得られる分類子の感度及び特異性はほぼ等しいものと予想できる。
組織クラス予測の性能の推定:クロス確認
限られた試料サイズで、クロス確認は、識別子関数の予測精度についての有効かつ信頼性の高い推定値を提供し、従ってマーカーの有意性に加えて、我々はクロス確認精度、感度及び特異性の推定値を提供する。各々の分類タスクについて、試料をおよそ等しいサイズの5つのグループに区分化した。その後、学習アルゴリズムをこれら5つの試料グループのうちの4つについてトレーニングした。この方法によって得られた予測子を次に、独立した検査試料の残りのグループについて検査した。正しい陽性及び陰性分類の数を、先行する実行から得たいかなる知識も使用せずに独立した検査グループの考えられる全ての選択肢について該学習アルゴリズムについて5回の実行全体にわたり計数した。この手順を試料セットの最高10の無作為順列についてくり返した。上述のクロス確認が、トレーニング及び独立した検査セットの考えられる事実上全ての組合せを用いて精度、感度及び特異性を評価するという点に留意されたい。従ってこれは、単に試料を1つのトレーニング試料セットと1つの独立した検査セットに分割するよりも優れた予測性能の推定値を提供する。
結果
図1、5、9、13、16、20、24、28及び32は、1つのアルゴリズムを用いて2つの組織クラス間のCpGメチル化差異に従って、実施例1及び2に従って得られたデータのランク付けされたマトリクスを示している。図はグレースケールで示され、ここで最も有意なCpG位置はマトリクスの最下部にあり、最上部に向かって有意性が低下する。黒色は、一定の与えられたCpG位置における完全なメチル化を表わし、白色は特定の位置においてメチル化が全くないことを表わし、メチル化度が、明灰色(メチル化の割合が低い)から暗灰色(メチル化の割合が高い)までの灰色で表わされている。各行は、遺伝子内の特定のCpG位置を表わし、各列は、1つの試料のための異なるCpGsについてのメチル化プロフィールを示す。右側には、個々のCpG位置についてのP値が示されている。P値は、観察された分布がデータセット内で偶然発生した確率である。
図96は、アルゴリズムを用いた2つのクラスの組織(左側の気道消化器癌及び右側の健常気道消化器組織)間のCpGメチル化の差異に従った、実施例1及び2に従って得られたランク付けされたデータマトリクスを示す。最も有意なCpG位置はマトリクスの最下部にあり、有意性は最上部に向かって低下する。赤色は一定の与えられたCpG位置での完全メチル化を示し、緑色は特定の位置において全くメチル化が無いことを表わす。各行は、1つの遺伝子内の1つの特異的CpG位置を表わし、各列は、1つの試料についての異なるCpGsのメチル化プロフィールを示している。
図2、6、10、17、21、25、29及び33は、各々の比較についての補正されていない多変量LogReg検査結果を示す。各々の個々のゲノム関心領域は、1つの点として表わされ、破線は、25%の誤発見率についてのカットオフ点を表わす。
図3、7、11、14、18、22、26、30及び34は、最高の性能のマーカーについて、2つのクラスの組織の間のGenewise線形サポートベクトルマシンクロス確認の精度の実施例1及び2に従って得られたランク付けされたデータマトリクスを示す。図はグレースケールで示され、ここで最も有意なCpG位置はマトリクスの最下部にあり、最上部に向かって有意性が低下する。黒色は、一定の与えられたCpG位置における完全なメチル化を表わし、白色は特定の位置においてメチル化が全くないことを表わし、メチル化度が、明灰色(メチル化の割合が低い)から暗灰色(メチル化の割合が高い)までの灰色で表わされている。各行は、遺伝子内の特定のCpG位置を表わし、各列は、1つの試料のための異なるCpGsについてのメチル化プロフィールを示す。右側には、各々個々のゲノムの関心領域についての精度値が示されている。
図4、8、12、15、18、23、27、31及び35は、各分類の全てのゲノム領域のためのGenewise線形サポートベクトルマシンの精度を示す。各々のゲノム領域の精度は黒色正方形として表わされ、特異性は白抜き菱形として、又感度は白抜き正方形として表わされている。X軸上に測定される通りの精度は、正しく分類された試料の分数を示す。
正常な結腸対結腸直腸癌
第1の比較102においては、結腸直腸癌腫試料が、結腸ポリープ及び結腸炎症性障害を含む正常な結腸からの73の試料に比較された。
図1は、保守的Bonferroni補正済みLogReg検査を用いた12の最も性能の高いマーカーの多変量検査結果を示す。
図2は、各比較についての未補正多変量LogReg検査結果を示す。各々のゲノム関心領域は、点として表わされ、破線は25%の誤発見率についてのカットオフ点を表わす。
図3は、12の最高の性能のマーカーの精度を示す。
図4は、各分類の全てのゲノム領域についてのGenewise線形サポートベクトルマシンクロス確認の精度を示す。
以下のゲノムマーカーが有意であるものとして評価された:配列番号1〜12、15〜20、22、25〜36、38〜49、51〜58及びその補体。
その他の組織対結腸直腸癌
この分類では、73の結腸直腸癌腫試料が、非結腸直腸癌腫、末梢血リンパ球そして非結腸直腸由来のその他の正常な組織からの140の試料から成る「その他の組織」クラスと比較される。従ってこれらのマーカーは、例えば血清といったような体液内での結腸直腸癌腫細胞の検出を可能にする。
図5は、保守的Bonferroni補正済みLogReg検査を用いた12の最も性能の高いマーカーの多変量検査結果を示す。
図6は、各比較についての未補正多変量LogReg検査結果を示す。各々のゲノム関心領域は、点として表わされ、破線は25%の誤発見率についてのカットオフ点を表わす。
図7は、12の最高の性能のマーカーの精度を示す。
図8は、各分類の全てのゲノム領域についてのGenewise線形サポートベクトルマシンクロス確認の精度を示す。
以下のゲノムマーカーが有意であるものとして評価された:配列番号1〜23、26〜36、38〜43、45〜49、51〜58及びその補体。
正常な結腸及びその他の組織対結腸癌
この分類では、73の結腸直腸癌腫試料が242の正常な結腸及び「その他の組織」試料に比較された。正常な結腸クラスは健常結腸、結腸ポリープ及び炎症性障害結腸組織試料から成り、「その他の組織」は、非結腸直腸癌腫、末梢血リンパ球及び非結腸直腸由来のその他の正常な組織から成っていた。
図9は、保守的Bonferroni補正済みLogReg検査を用いた12の最も性能の高いマーカーの多変量検査結果を示す。
図10は、各比較についての未補正多変量LogReg検査結果を示す。各々のゲノム関心領域は、点として表わされ、破線は25%の誤発見率についてのカットオフ点を表わす。
図11は、12の最高の性能のマーカーの精度を示す。
図12は、各分類の全てのゲノム領域についてのGenewise線形サポートベクトルマシンクロス確認の精度を示す。
以下のゲノムマーカーが有意であるものとして評価された:配列番号1〜3、5〜13、15〜23、26〜36、38〜43、45〜49、51〜58及びその補体。
ポリープ対結腸直腸癌
この分類では、73の結腸直腸癌腫試料が51の結腸ポリープ試料と比較された。
図13は、保守的Bonferroni補正済みLogReg検査を用いた12の最も性能の高いマーカーの多変量検査結果を示す。
図14は、12の最高の性能のマーカーの精度を示す。
図15は、各分類の全てのゲノム領域についてのGenewise線形サポートベクトルマシンクロス確認の精度を示す。
以下のゲノムマーカーが有意であるものとして評価された:配列番号11、25、27、38、40、45、53及びその補体。
正常な結腸対結腸直腸細胞増殖障害
この分類では、124の結腸直腸細胞増殖障害試料(結腸ポリープと結腸直腸癌腫から成る)を、健常な結腸試料及び炎症性障害の結腸組織の両方から成る51の「正常な結腸」試料に比較した。
図16は、保守的Bonferroni補正済みLogReg検査を用いた12の最も性能の高いマーカーの多変量検査結果を示す。
図17は、各比較についての未補正多変量LogReg検査結果を示す。各々のゲノム関心領域は、点として表わされ、破線は25%の誤発見率についてのカットオフ点を表わす。
図18は、12の最高の性能のマーカーの精度を示す。
図19は、各分類の全てのゲノム領域についてのGenewise線形サポートベクトルマシンクロス確認の精度を示す。
以下のゲノムマーカーが有意であるものとして評価された:配列番号1〜58及びその補体。
正常な結腸対結腸直腸癌
この分類では、73の結腸直腸癌腫試料が、炎症性障害の健常な結腸試料と結腸組織の両方から成る51の「正常な結腸」試料と比較された。
図20は、保守的Bonferroni補正済みLogReg検査を用いた12の最も性能の高いマーカーの多変量検査結果を示す。
図21は、各比較についての未補正多変量LogReg検査結果を示す。各々のゲノム関心領域は、点として表わされ、破線は25%の誤発見率についてのカットオフ点を表わす。
図22は、12の最高の性能のマーカーの精度を示す。
図23は、各分類の全てのゲノム領域についてのGenewise線形サポートベクトルマシンクロス確認の精度を示す。
以下のゲノムマーカーが有意であるものとして評価された:配列番号1〜3、5〜23、25〜36、38〜49、51〜58及びその補体。
正常な結腸及びその他の組織対結腸直腸細胞増殖障害
この分類においては、124の結腸直腸細胞増殖障害試料(結腸ポリープと結腸直腸癌腫から成る)が「正常な結腸」及び「その他の組織」試料から成るクラスと比較された。正常な結腸試料は、健常な結腸試料と炎症性障害の細胞組織の両方から成り、「その他の組織」は、非結腸直腸癌腫からの試料、末梢血リンパ球及び非結腸直腸由来のその他の正常な組織で構成されていた。
図24は、保守的Bonferroni補正済みLogReg検査を用いた12の最も性能の高いマーカーの多変量検査結果を示す。
図25は、各比較についての未補正多変量LogReg検査結果を示す。各々のゲノム関心領域は、点として表わされ、破線は25%の誤発見率についてのカットオフ点を表わす。
図26は、12の最高の性能のマーカーの精度を示す。
図27は、各分類の全てのゲノム領域についてのGenewise線形サポートベクトルマシンクロス確認の精度を示す。
以下のゲノムマーカーが有意であるものとして評価された:配列番号1〜36、38〜43、45〜58及びその補体。
その他の組織対結腸組織
以下の比較は、特に体液中で腫瘍進行マーカーとして、遊離浮動結腸DNAの高いレベルを見分ける能力をもつマーカーを同定する目的で実施された。この分類では、「結腸組織」クラスは、結腸直腸癌腫、結腸ポリープ、炎症性障害の結腸組織及び健常結腸組織で構成されていた。「その他の組織」クラスは、非結腸直腸癌腫、末梢血リンパ球及びその他の非結腸直腸由来の正常な組織から成っていた。
図28は、保守的Bonferroni補正済みLogReg検査を用いた12の最も性能の高いマーカーの多変量検査結果を示す。
図29は、各比較についての未補正多変量LogReg検査結果を示す。各々のゲノム関心領域は、点として表わされ、破線は25%の誤発見率についてのカットオフ点を表わす。
図30は、12の最高の性能のマーカーの精度を示す。
図31は、各分類の全てのゲノム領域についてのGenewise線形サポートベクトルマシンクロス確認の精度を示す。
以下のゲノムマーカーが有意であるものとして評価された:配列番号1〜58及びその補体。
正常な組織対細胞増殖障害組織
この分類においては、細胞増殖障害試料を結腸直腸癌腫、結腸ポリープ及び非結腸由来癌の両方からの細胞増殖障害試料を、「正常な組織」すなわち健常結腸試料、炎症性障害の結腸組織、末梢血リンパ球、非結腸直腸由来のその他の正常な組織から正確に識別するその能力について、遺伝子パネルを査定した。
図32は、保守的Bonferroni補正済みLogReg検査を用いた12の最も性能の高いマーカーの多変量検査結果を示す。
図33は、各比較についての未補正多変量LogReg検査結果を示す。各々のゲノム関心領域は、点として表わされ、破線は25%の誤発見率についてのカットオフ点を表わす。
図34は、12の最高の性能のマーカーの精度を示す。
図35は、各分類の全てのゲノム領域についてのGenewise線形サポートベクトルマシンクロス確認の精度を示す。
以下のゲノムマーカーが有意であるものとして評価された:配列番号1〜36、38〜43、45〜49、51〜58及びその補体。
気道消化器癌対健常気道消化器組織
この分類では、「気道消化器」という用語は、肺、肝臓、膵臓、胆管、胃、及び結腸から成る組織の試料セットを表わしている。図96は、1つのアルゴリズムを用いて、2つのクラスの組織の間のCpGメチル化差異に従った、実施例1及び2に従って得られたデータのランク付けされたマトリクスを示している(マトリクスの左側の癌組織がマトリクス右側の正常組織と比較された)。最も有意なCpG位置は、マトリクスの最下部にあり、有意性は最上部に向かって減少する。赤色は、一定の与えられたCpG位置で完全なメチル化を表わし、緑色は特定の位置にメチル化が全くないことを表わしている。各々の行は、遺伝子内の1つの特定のCpG位置を表わし、各列は、1つの試料についての異なるCpGsのメチル化プロフィールを示す。以下のゲノムマーカーは、有意であるとみなされる; 配列番号20、41、35、3、39及び33。
以下の実施例は、健常な及び病気の結腸直腸細胞増殖障害試料内のゲノム配列、配列番号35、配列34、配列番号39、配列番号29のメチル化状況の分析について記述している。前記遺伝子と結腸直腸細胞増殖障害の間の初期結びつきは、最初、実施例1で記述されている通りのハイブリダイゼーション分析を用いて実施された。配列は、その後、前記実施例内で分析された遺伝子のより大きなセットから選択され、メチル化状況と結腸直腸細胞増殖障害の間の相関関係は、その他のメチル化分析技術、すなわちMSP−Methy LightTM及びHeavy MethylTMMethy LightTM検定を用いて、試料の分析により妥当性検査された。「Methy Light」という用語は、TaqmanTM(単一プローブ)及びLightcyclerTM(2重プローブ)の両方の技術のプローブを用いる重亜硫酸塩処理されたDNAの実時間PCR分析を記述するために使用されるという点に留意されたい。
実施例2
Qiagen抽出キットを用いて33の結腸腺癌試料及び43の正常結腸隣接組織から、MSP−MethyLight検定(配列番号35)DNAを使用した結腸癌内部のメチル化の分析を抽出した。各試料からのDNAを、アガロースビーズ方法(Olek et al1996)に従って、重亜硫酸塩溶液(亜硫酸水素、二亜硫酸塩)を用いて処理した。該処理は、試料内部の全ての非メチル化シトシンがチミジンに転換される形のものである。換言すると、試料内の5メチル化シトシンが未修飾状態にとどまっている。
メチル化状況は、ベータアクチン遺伝子からの対照フラグメント及び関心の対象であるCpGアイランドのために設計されたMSP−MethyLight検定で決定された(Eads et al., 2001)。CpGアイランド検定は、プライマ及びTaqman型式のプローブの両方においてCpG部位をカバーするが、対照遺伝子はカバーしない。対照遺伝子は、合計DNA濃度の尺度として使用され、CpGアイランド検定(メチル化検定)は、その部位におけるメチル化レベルを決定する。
方法: 以下のプライマ及びプローブを用いて、配列番号35遺伝子CpGアイランド検定を実施した:
順方向プライマ
逆方向プライマ
順方向プライマ:CGGAGGGTACGGAGATTACG(配列番号14387);
逆方向プライマ:CGACGACGCGCGAAA(配列番号14388);及び
プローブ:CGAAACCCTAAATATCCCGAATAACGCCG(配列番号14389。対応する対照検定は、以下のプライマ及びプローブを用いて実施された:
プライマ:TGGTGATGGAGGAGGTTTAGTAAGT(配列番号14390);
プライマ:AACCAATAAAACCTACTCCTCCCTTAA(配列番号14391);及び
プローブ:ACCACCACCCAACACACAATAACAAACACA(配列番号14392)。
反応は、各DNA試料についてトリプリケートで、以下の検定条件で行なわれた: 反応溶液:(20μlの最終反応体積中、900mMのプライマ;300nMのプローブ;3.5mMの塩化マグネシウム;1単位のtaqポリメラーゼ;200μMのdNTPs;7μlのDNA);サイクル条件;(10分間95℃;次に15秒間95℃、1分間60℃のサイクル50回)。
文献(Eads et al 2001)中で前述されたPMR計算を用いてデータを分析した。結果。正常な試料のための平均PMRは0.15であり、標準偏差は0.18であった。腫瘍試料のための平均PMRは17.98であり、標準偏差は18.18であった。腫瘍と正常な試料の間のメチル化レベルの全体的差異は、t−検査において有意である(p=0.00000312)。結果は図36に示されている。検体の受信者動作特性曲線(ROC曲線)も同様に決定された。ROCは、診断的検査の異なる可能なカットポイントについての偽陽性率に対する真陽性率のプロットである。これは、選択されたカットポイントに応じた感度と特異性の間のトレードオフを示す(感度の増加はすべて特異性の減少により達成されることになる)。ROC曲線下の面積(AUC)は、診断学的検査の精度の尺度である(面積が大きくなればなるほど良くなり、最適は1であり、無作為検査は、0.5の面積で対角線上にあるROC曲線を有することになる;参考;J.P.Egan.シグナル検出理論及びROC分析、Academic Press, New York, 1975)。MSP−Methyl LightTM検定のためのAUCは、0.94(図37)である。
実施例3
結腸癌内部の配列番号35のメチル化は、Heavy Methyl MethyLightTM検定を用いて分析された。Heavy MethylTM検定とも呼ばれるHeavy Methyl MethyLightTM(又はHM Methy LightTM)でCpGアイランドのメチル化を分析するためにも同じDNA試料を使用した。メチル化状況を、関心の対象であるCpGアイランド及び上述のものと同じ対照遺伝子検定のために設計されたHM MethyLightTM検定で決定した。CpGアイランド検定は、ブロッカー及びTaqmanTM型式のプローブの両方においてCpG部位をカバーするが、一方対照遺伝子はカバーしない。
方法。CpGアイランド検定(メチル化検定)を以下のプライマ及びプローブを用いて実施した:
順方向プライマ:GGTGATTGTTTATTGTTATGGTTTG(配列番号14393)
逆方向プライマ:CCCCTCAACCTAAAAACTACAAC(配列番号14394)
順方向ブロッカ:GTTATGGTTTGTGATTTTGTGTGGG(配列番号14395)
逆方向ブロッカ:AAACTACAACCACTCAAATCAACCCA(配列番号14396)
プローブ:AAAATTACGACGACGCCACCCGAAA(配列番号14397)
以下の検定条件で、各DNA試料上でトリプリケートで反応を各々実施した:
反応溶液: (20μlの最終反応体積中、400nMのプライマ;400nMのプローブ;10μMの両方のブロッカー;3.5mMの塩化マグネシウム;1×ABI Taqman緩衝液;1単位のABI TaqGoldポリメラーゼ;200μMのdNTP;及び7μlのDNA);
サイクル条件:(10分間95℃):(15秒間95℃、1分間64℃(2サイクル));(15秒間95℃、1分間62℃(2サイクル);(15秒間95℃、1分間60℃(2サイクル));及び(15秒間95℃、1分間58℃、40秒間60℃(41サイクル))。
結果。正常な試料のための平均PMRは、1.45の標準偏差で1.12であった。腫瘍試料についての平均PMRは、33.22の標準偏差で38.23であった。腫瘍と正常な試料の間のメチル化レベルの全体的差異は、t−検査において有意である(p=0.000000326)。結果は図36に示されている。
検定のROC曲線も同様に決定された。MSP−Methyl-Light検定のAUCは0.91(図38)である。
付加的な結腸試料セット(25の腺癌、33の正常、及び13の腺腫)について検定を検査した。結果は再び有意な差異を示した(図39)。ROCは、図40〜42に示されている。
Methyl Light検定のMSP及びHeavy Methyl変形形態は、配列番号35におけるメチル化の分析と等価であることが見極められた。図48は、2つの方法を用いた各試料中で検出されたメチル化百分率の回帰プロットを示している。
実施例4
配列35−Heavy Methyl-Methy Light検定は同様に、その他の組織のパネルに対しても検査された(図43)。結腸癌試料以外に、2つの乳癌組織のうちの1つのみがメチル化された。しかしながら、21の付加的な乳癌腫瘍(異なる病期)のパネル上では、1つしかメチル化されなかった(図44)。従ってマーカーは結腸腫瘍試料に特異的である。全てのプライマ、プローブ、ブロッカー及び反応条件は、結腸癌試料の分析で使用されたものと同一であった(実施例3)。
実施例5
実時間PCRにより分析された結腸組織のうち12個も、外科手術の前に取った血清と対合した。我々は、Qiagen UltraSens DNA抽出キットを用いてその血清1mlからDNAを抽出し、DNA試料を重亜硫酸塩処理し、これらの試料上で配列番号35−Heavy MethyMethyLightTM検定を実行した。対照遺伝子は癌血清試料のうちの3つについて及び正常な血清試料の3つについて増幅しなかったことから、我々は、試料調製物がこれらのケースでは作用しなかったと結論づけすることができる。その他のケースでは、正常な試料よりも高い癌試料中のメチル化の証拠が存在した(図45)。
実施例6
配列番号34−MSP−Methy LightTM検定を用いた結腸癌内でのメチル化の分析。実施例2内で記述された結腸癌試料を、Taqman(登録商標)型式のプローブを伴う配列番号34−MSP−Methy LightTM検定を用いて分析した。試料の調製は上述の通りに(実施例1)実施した。以下のプライマ及びプローブを用いて検定を実施した。
順方向プライマ:TGGGATTAAGATTTTCGGTTAGTTTC(配列番号14398)
逆方向プライマ:CACTACAACGCTACGCGACTAAA(配列番号14399)
プローブ:TCGACGTTACCCAAACGAATCACATAAAAAAC(配列番号14400)
対応する対照検定を上述の通りに実施した(実施例2)。
以下の検定条件で各々のDNA試料上で反応をトリプリケートで実施した:
反応溶液:(20μlの最終反応溶液中900nMのプライマ;300nMのプローブ;3.5mMの塩化マグネシウム;1単位のtaqポリメラーゼ;200μMのdNTPs、5μMのブロッカー及び7μlのDNA);
サイクル条件;10分間95℃;(15秒間95℃、1分間60℃)50サイクル。
文献中で以前に記述された(Eads et al 2001)PMR計算を用いてデータを分析した。
結果。結果は図36に示されている。正常な試料のための平均PMRは、3.57の標準偏差で3.93であった。腫瘍試料についての平均PMRは、20.23の標準偏差で23.06であった。腫瘍と正常な試料の間のメチル化レベルの全体的な差は、t−検査において有意である(p=0.000003063)。検定のROC曲線は、図46で示されている。AUCは、0.84である。
これは、2重LightcyclerTMプローブを用いる配列番号34−Heavy Methyl Methy LightTM検定を使用してさらに確認された。
方法。以下のプライマ及びプローブを用いて、CpGアイランド検定(メチル化検定)を実施した:
順方向プライマ:TGGATAGGAGTTGGGATTAAGATTTT(配列番号14401)
逆方向プライマ:CTTATTACAATTTAAAAAAAAAATTCACTACAA(配列番号14402);
ブロッカ:AAATTCACTACAACACTACACAACTAAATTCAACATTAC(配列番号14403);
プローブ:TTTTCGTATTTTTTTTCGGGTTATTACGTTTT−フッ素(配列番号14404);
プローブ:LC640−ATGTGATTCGTTTGGGTAACGTCGA−リン(配列番号14405。
反応は、各々トリプリケートで、以下の検定条件で各DNA試料について実施された:
反応条件: 500mMのプライマ:10μMのブロッカー;250nMのプローブ;4mMの塩化マグネシウム
サイクリングプロフィール:10分間95℃の変性;10秒間95℃、30秒間57℃、20秒間72℃のサイクル50回。
実施例7
配列番号29−MSP−Methy LightTM検定を用いた結腸癌内でのメチル化の分析。実施例2内で記述された結腸癌試料を、Taqman(登録商標)型式のプローブを伴う配列番号29−MSP−Methy LightTM検定を用いて分析した。試料の調製は上述の通りに(実施例1)実施した。以下のプライマ及びプローブを用いて検定を実施した。
順方向プライマ:TTTTTTTTTCGGACGTCGTTG(配列番号14406)
逆方向プライマ:CCTCTACATACGCCGCGAAT(配列番号14407)
プローブ:AATTACCGAAAACATCGACCGA(配列番号14408)
以下の検定条件で各々のDNA試料上で反応をトリプリケートで実施した:
反応溶液:(20μlの最終反応溶液中900nMのプライマ;300nMのプローブ;3.5mMの塩化マグネシウム;1単位のtaqポリメラーゼ;200μMのdNTPs、50μMのブロッカー及び7μlのDNA);
サイクル条件;10分間95℃;(15秒間95℃、1分間60℃)50サイクル。
対応する対照検定を上述の通りに実施した(実施例2)。
文献中で以前に記述された(Eads et al 2001)PMR計算を用いてデータを分析した。
結果。結果は図36に示されている。正常な試料のための平均PMRは、4.21の標準偏差で3.04であった。腫瘍試料についての平均PMRは、24.08の標準偏差で21.38であった。腫瘍と正常な試料の間のメチル化レベルの全体的な差は、t−検査において有意である(p=0.0000101973)。検定のROC曲線は、図47で示されている。AUCは、0.80である。
これは、2重標識されたLightcyclerTMプローブを用いる配列番号29−Heavy Methyl Methy LightTM検定を使用してさらに確認された。
方法。以下のプライマ及びプローブを用いて、CpGアイランド検定(メチル化検定)を実施した:
順方向プライマ:GTAGGGTTATTGTTTGGGTTAATAAAT(配列番号14409)
逆方向プライマ:TAAAAAAAAAAAAAAAACTCCTCTACATAC(配列番号14410)
ブロッカ:AACTCCTCTACATACACCACAAATAAATT(配列番号14411)
プローブ:CGAAAACATCGACCGAACAACG−Fluor(配列番号14412)
プローブ:LC640−GTCCGAAAAAAAAAAAACGAACTCC−Phos(配列番号14413)
反応は、各々トリプリケートで、以下の検定条件で各DNA試料について実施された:
反応条件: 順方向プライマ:600nM;逆方向プライマ;30nM;ブロッカー;10μM;プローブ;500nM;Tagポリメラーゼ;0.1U/μl;dNTPs;各々0.2mM;塩化マグネシウム;4mM;BSA;0.25mg/ml;MgCl2を含まないRoche緩衝液;1×。
サイクル条件:10分間95℃の変性;10秒間95℃、25秒間57℃、10秒間72℃のサイクル50回。
実施例8
配列番号29−MSP−Methy LightTM検定を用いた結腸癌内でのメチル化の分析。配列番号29についての付加的な検定を結腸試料について検査した。各々12の結腸腺癌及び12の正常な隣接組織試料を伴う2つの組織セットについて検定を検査した。
試料の調製は上述の通りに(実施例2)実施した。以下のプライマ及びプローブを用いて検定を実施した。
順方向プライマ:GGACGTTTTTTATCGAAGGCG(配列番号14414)
逆方向プライマ:GCCACCCAACCGCGA(配列番号14415)
プローブ:ACCCGAAATCACGCGCGAAAAA(配列番号14416)
以下の検定条件で各々のDNA試料上で反応をトリプリケートで実施した:
反応溶液:(20μlの最終反応溶液中900nMのプライマ;300nMのプローブ;3.5mMの塩化マグネシウム;1単位のtaqポリメラーゼ;200μMのdNTPs、50μMのブロッカー及び7μlのDNA);
サイクル条件;10分間95℃;(15秒間95℃、1分間60℃)50サイクル。対応する対照検定を上述の通りに実施した(実施例2)。
文献中で以前に記述された(Eads et al 2001)PMR計算を用いてデータを分析した。両方のケースにおいて、配列番号29は、癌試料中で有意により多くメチル化されていた。検定のROC曲線は、図49及び50内に示されている。AUCは、0.93及び1である。
実施例9
配列番号39−MSP−Methy LightTM検定を用いた結腸癌内でのメチル化の分析。
実施例2内で記述された結腸癌試料を、配列番号39−MSP−Methy LightTM検定を用いて分析した。試料の調製は上述の通りに(実施例2)実施した。以下のプライマ及びプローブを用いて検定を実施した。
順方向プライマ:GACGGATTTTTTTTTAACGTTTTTTC(配列番号14417)
逆方向プライマ:AAATAAAATACCACCTCCGCGA(配列番号14418)
プローブ:GCTCCTCGCGAAATACTCACCCCG(配列番号14419)
以下の検定条件で各々のDNA試料上で反応をトリプリケートで実施した:
反応溶液:(20μlの最終反応溶液中900nMのプライマ;300nMのプローブ;3.5mMの塩化マグネシウム;1単位のtaqポリメラーゼ;200μMのdNTPs、50μMのブロッカー及び7μlのDNA);
サイクル条件;10分間95℃;(15秒間95℃、1分間60℃)50サイクル。
対応する対照検定を上述の通りに実施した(実施例2)。
文献中で以前に記述された(Eads et al 2001)PMR計算を用いてデータを分析した。
結果。結果は図36に示されている。正常な試料のための平均PMRは、2.42の標準偏差で2.25であった。腫瘍試料についての平均PMRは、17.57の標準偏差で25.67であった。腫瘍と正常な試料の間のメチル化レベルの全体的な差は、t−検査において有意である(p=0.00000000118)。検定のROC曲線は、図52で示されている。AUCは、0.94である。
これは、Lightcycler形式の2重プローブ技術を使用した2重LightcyclerTMプローブを用いる配列番号39−Heavy Methyl Methy LightTM検定を使用してさらに確認された。
方法。以下のプライマ及びプローブを用いて、CpGアイランド検定(メチル化検定)を実施した:
<成26>
順方向プライマ:GTTAGTTAGTTAATTTTTTAAATAGATTAGTAG(配列番号14420)
逆方向プライマ:CAAAAAAACAAATAAAATACCACCTCC(配列番号14421)
ブロッカ:CCTCCACAAAACTCACTCCTCACAAAATAC(配列番号14422)
プローブ:red640 TTTCGTTTTGTATGGTAGATACGGGGTGA−ホスファート(配列番号14423)
プローブ:ATTAATGGTTTTATAAGACGGATTTTTTTTTAACGT−フルオレシン(配列番号14424)
反応は、各々トリプリケートで、以下の検定条件で各DNA試料について実施された:
反応条件: 順方向プライマ:600nM;逆方向プライマ:30nM;ブロッカー:10μM;プローブ:500nM;Tagポリメラーゼ:0.1U/μl;dNTPs:各々0.2mM;塩化マグネシウム;4mM;BSA;0.25mg/ml;MgCl2を含まないRoche緩衝液:1×。
サイクル条件:10分間95℃の変性;10秒間95℃、25秒間57℃、10秒間72℃のサイクル50回。
実験10: メチル化マーカーの排泄物分析
排泄物試料に由来するDNAからのメチル化マーカーの実施可能性(結腸細胞増殖障害の検出のため)を立証するために、以下の実験を行なった。従って、各々排泄物のみ(対照)又は結腸癌細胞系列SW620からの制御された量の細胞が付加された排泄物(25、000個の細胞当量−0.5μg)のいずれかを含む一連の試料を調製し、調製した試料を次に冷凍した。3つの異なる排泄物試料を使用した。末梢血リンパ球(PBL)及び結腸癌細胞系列からの制御された量の細胞を含むさらなる試料を調製した。
試料は以下の通りであった:
クラス1:排泄物試料No.1
クラス2:排泄物試料No.1+0.15ug
クラス3:排泄物試料No.2
クラス4:排泄物試料No.2+0.15ug
クラス5:排泄物試料No.3
クラス6:排泄物試料No.3+0.15ug
クラス7:PBS+25,000細胞当量(0.15ug)
クラス8:H2O
各クラスにおいて多数の試料を調製した。各試料中に300ngの排泄物DNAが存在した。次に各々の試料を、以下の通りの遺伝子EPHB65のためのMSPTaqMan検定を用いてメチル化について分析した。
プライマ順方向:TTTTTTTTTCGGACGTCGTTG(配列番号14455)
プライマ逆方向:CCTCTACATACGCCGCGAAT(配列番号14456)
プローブ:AATTACCGAAAACATCGACCGA(配列番号14457)
サイクル条件は以下の通りであった:
Taq Manの反応条件:
初期変性 95oC 10分
変性 95oC 15秒
アニーリング/拡張 60oC 60秒
PCR反応の増幅曲線は、図52〜58に従ったものであった。
クラス1:図52
クラス2:図53
クラス3:図54
クラス4:図55
クラス5:図56
クラス6:該当せず(下記参照)
クラス7:図57
クラス8:図58
X軸は、ポリメラーゼ連鎖反応のサイクル数を示し、Y軸は背景全体にわたる蛍光強度であるデルタRnを示し、水平線(A)は較正曲線(B)の閾値レベルを表わし、この曲線が(A)より上に達した場合メチル化が検出されたことになる。
ここでわかるように、メチル化された直腸癌DNAは、クラス2及び5で検出可能であった。排泄物試料(クラス5)中にメチル化されたDNAが検出されたことから、クラス6は分析されなかった。
排泄物試料内のメチル化DNA検出の絶対的感度を見極めるため、排泄物試料 No.2を、さまざまな量のSW620DNAでスパイクした。上述のMSP検定を用いて5つのクラスの試料を分析した。
クラスB: 250mgの排泄物中の細胞当量25,000
クラスC: 250mgの排泄物中の細胞当量2,500
クラスD: 250mgの排泄物中の細胞当量250
クラスE: 250mgの排泄物中の細胞当量25
クラスF: 250mgの排泄物中の細胞当量0
増幅曲線は図59を見ればわかる。X軸は、ポリメラーゼ連鎖反応のサイクル数を示し、Y軸は背景全体にわたる蛍光強度であるデルタRnを示し、水平線(A)は較正曲線(B−F)の閾値レベルを表わし、曲線が(A)より上に達した場合にメチル化が検出されたことになる。曲線B、C、D、E及びFは、それぞれクラスB、C、D、E及びFの増幅曲線である。従って、メチル化されたDNAは、250mgの排泄物あたり25個の細胞レベルで排泄物試料内に検出され得ることがわかる。
実施例11:
メチル化感応性制限の実時間分析
10個の結腸腫瘍試料及び10個の正常な隣接組織試料からDNAを調製した。DNAの単離は、専門家にとって既知の標準的方法を用いて実施された。
以下の試薬を用いて37℃でのインキュベーションにより、消化反応を実施した。
1μgのゲノムDN;
25Uの酵素(10U/μl);
Yt/Tango緩衝液。
全ての試料について並行して以下の段階を実施した。すなわち、1μgのDNAを、0.2mlのPCR管内で190μlのY+/Tango緩衝液(Fermentas)中に溶解させた。95μlの反応溶液(全体積の半分)を、対照として清潔なPCR管内にピペットで取った。最初の管の中の残りの試薬に対して1.25μlのHpaII及び1.25μlのHin6I制限エンドヌクレアーゼ(共にFermentasからのもの)を添加した。
第2の管には、グリセロール及び水の混合物(v:v=1:1)2.5μlを添加した。5時間、エッペンドルフサーモサイクラ内で37℃で40本の管全てをインキュベートした後、次に制限酵素又は水−グリセロール混合物のもう1つのアリコートを各管に添加し、インキュベーションを10時間延長した。この時間の後、10分間65℃で加熱することにより制限酵素を不活性化した。
その後、各管から20μlずつ平板内に移送し80μlの水を添加することにより、96ウェルの平板内で各管の希釈物を結集させた。
最後に、定量的実時間PCRにより、各試料の対照及び制限産物の両方を分析した。この実施例では、表4に従ったプライマの1つを含有するPCRマスターミックスを含むSybrGreen12μlを96ウェルのTaqman平板内にピペットで取り込み、その後(各々デュプリケートで)制限済み試料とブランクの対応する希釈物8μlを取込んだ。
以下の温度プロフィールを応用してABI7700計器上で実時間PCRを実施した:95℃で15分;15秒間95℃、45秒間65℃、75秒間72℃;15秒間95℃とその後の1時間50℃のサイクル50回。
上述のプライマ及び条件を用いて、メチル化感応性制限がPCRより前に実施された場、この段階中に未メチル化コピーが消化されることから、(表4に従った)分析済み配列)のメチル化されたコピーについてのみ増幅が観察される。制限後のメチル化されたDNAの量は、同じ試料のブランクの実時間定量化により得られる制限以前に存在するDNAの合計量に対し正規化される。
1.ΔCt=Ct blank−Ct restricted
という等式は、DNA試料中に存在する未メチル化DNAの相対的量のための1つの尺度を表わす。ゼロという値は、DNAが完全にメチル化されていることを意味する。0.5という値は、最適化されたPCR反応の場合の約50%のメチル化に対応し、一方さらに大きい値は、低いメチル化レベルに対応している。試料中に存在するメチル化された配列の相対量は、
(2) M=E-ΔCt
という式から得られ、ここでEはPCR効率である。PCR効率は、専門家にとって既知の方法により容易に得られる。
結果は図60〜71に示されている。各個別試料は、x軸上で「正常」を表わす「n」又は腫瘍を表わす「t」として記されている。一部の検定においては、気管支組織試料が偶発的に分析されており、これらには矢印が付され、本発明には無関係である。Y軸は、試料内のメチル化のレベル(「メチル化率」)を示す。メチル化率{メチル化/(メチル化+未メチル化)は、表4中のプライマ対に対応するフラグメントについて示されている。以上の公式(2)は、E=2というPCR効率を仮定した計算のために用いられた。
該データは、複数のフラグメントについて、腫瘍試料の大部分が対応する正常な隣接組織に比べて著しく高いメチル化率を示すということを実証している。
実施例12
mRNA発現分析
1.RNA試料
正常な結腸(n=1)と結腸癌(腺癌;n=1)からの全RNAをAmbion(Huntingdon, 英国)から入手した。各々のRNA試料は単一のドナーに由来していた。ToTALLY RNAキット(Ambion, Huntingdon, 英国)を用いて全細胞RNAを調製し、汚染を最小限におさえるためにDnase−処理を実施した。Agilent Bioanalyzer(Agilent Technologies, Inc, Palo Alto, CA)上で37℃で14時間のインキュベーションの前後に、RNAの無欠性を査定した。
2.マイクロアレイ実験
メーカーのプロトコル(Affymetrix, Inc., Santa Clara, CA)に従って標的調製及び標識、マイクロアレイハイブリダイゼーション、洗浄及び走査を実施した。簡単に言うと、T7−結合したオリゴ−dTプライマを用いて、10μgの全RNAを逆転写し、その後第2のストランド合成を行なった。T7RNAポリメラーゼ及びビオチニル化されたリボヌクレオチド(UTP、CTP)を用いて、2本鎖cDNAからビオチン標識されたcRNA標的を調製した。94℃で35分間フラグメント化を実施した。15μgのフラグメント化されたビオチニル化cRNAを、0.5mg/mlのアセチル化ウシ血清アルブミンを含有するMES緩衝液(2−(N−モルフォリノ)エタンスルホン酸)と混合させ、45℃で16時間Affymetrix Genechip HG−U133Aアレイ(Santa clara, CA)に対しハイブリッド形成させた。ストレプトアビジンフィコエリスリン接合体を用いてマイクロアレイを染色した(Molecular Probes, Inc., Eugene, OR)。シグナル増幅のためには、ビオチニル化された抗−ストレプトアビジン抗体(Vector Laboratories, Burlingame, CA)を使用した。
Affymetrix Gene Chipスキャナ上でアレイを走査した。各々のプローブセット(遺伝子を表わす)のための発現値を、Bioconductor Rパッケージ(http://www.bioconductor.org, 以下参照)を用いて生データから計算した。
3.データ分析
Affymetrixスキャナーから得た生発現データ(いわゆるcel−ファイル)を、BioconductorRパッケージリリース1.4(Gautier L., Cope L, Bolstad BM,Irizarry RA:プローブレベルでのAffymetrix Gene Chipデータのaffy−分析、Bioinformatics, 2004Feb 12;20(3):307−150)内で実装されているようなRMA正規化手順(Irizarry RA, Hobbs B, Collin F, Beazer-Barclay YD, Antonellis KJ, Scherf U, Speed TP:高密度オリゴマーヌクレオチドアレイプローブレベルデータの探査、正規化及び要約Biostatistics, 2003 Apr.4(2):249−64)のデフォルト設定を用いて背景補正し正規化した。生データ処理は、Affymetrix Gene Chip HG U133Aチップ上で利用可能な22、293のプローブセットの各々について、シグナル強度値を結果としてもたらす。
示差的に発現されたプローブセットを同定するために、結腸正常組織と結腸腫瘍組織の間の正規化されたシグナル強度の変化倍率を計算した。2を超える(又は0.5より小さい)変化倍率をもつ遺伝子を、示差的に発現されたものとして同定した。示差的に発現された遺伝子は表5に示されている。ここでわかるように、高メチル化は、全てのケースにおいて過小発現と相関関係をもたない。
実施例13
血清試料中のTREF(TMEFF2)メチル化分析。
以下の実施例では、結腸直腸癌患者及び健常な結腸の個体からの血清の3つの異なる試料セットを、遺伝子TMEFF2のMSP検定「4」及びHM検定「6」を用いて分析した。健常な結腸は、結腸の悪性腫瘍又はポリープが全く存在しないものとして結腸鏡検査により確認されているものとして定義された。検定は、比較目的で2つの異なる計器バージョンすなわちバージョン「1,2」及び「2,0」を用いて、Light Cyclerプラットフォーム(Roche Diagnostics)上で実行された。以下ではこれらを、それぞれ「LC1.2」及び「LC2.0」と呼ぶ。
試料セット
試料セット1:
30の結腸直腸癌、結腸鏡検査で結腸悪性腫瘍又はポリープ無しとして確認された30個、
試料セット2:
15の結腸直腸癌、結腸鏡検査で結腸悪性腫瘍又はポリープ無しとして確認された15個、
試料セット3:
30の結腸直腸癌、結腸鏡検査で結腸悪性腫瘍又はポリープ無しとして確認された30個、
各々のケースにおいて、約1.8mlsの血清当量をPCRによって分析した。
反応条件
検定「4」は、以下の通りに実施された。
順方向プライマ:agggcgttttgttggcg(配列番号14482)
逆方向プライマ:ctacaacctaaacgacgcgcT(配列番号14483)
Taqmanプローブ:atcggcgttttagcgtgcggg(FAM/BHQ1標識されたもの)(配列番号14484)
Lightcyclerプログラム:
活性化: 95°10分
3サイクル 95°15秒(20°/秒)
66° 45秒(20°/秒)検出
3サイクル 95°15 秒 (20°/秒)
64°45秒 (20°/秒)検出
50サイクル 95°15 秒(20°/秒)
62° 45秒(20°/秒)検出
結果
検定「4」
試料セット1:
AUC=0.95[0.86、0.99](信頼区間95%)LC2.0
試料セット2:
AUC=0.65[0.44、0.80]LC2.0
AUC=0.57[0.37、0.75]LC1.2
試料セット3:
AUC=0.83[0.71、0.92]LC2.0
AUC=0.83[0.71、0.92]LC1.2
検定「6」
順方向プライマ:aaaaaaaaaaaactcctctacataC(配列番号14485)
逆方向プライマ:ggttattgtttgggttaataaatg (配列番号14486)
試料セット2:
AUC=0.70〔0.51、0.85〕LC2.0
試料セット3 :
AUC=0.69〔0.55、0.80〕LC2.0
AUC=0.71〔0.53、0.83〕LC1.2(一部の試料が失なわれ、約20の癌血清試料、20の健常な結腸血清試料が分析された)。
実施例14
表6(下記)に従った遺伝子のMSP分析
以下の分析においては、表3に従った遺伝子の選択のメチル化状況を、表6(下記)に従ったプライマを用いたメチル化特異的増幅を使用することによって分析した。
研究は、結腸、乳房及び肝臓癌腫、正常な組織(末梢血リンパ球、健常な結腸及び結腸癌腫に隣接する健常組織)、結腸ポリープ及びその他の結腸疾患由来の約140の試料について行なわれた。陽性クラスは、結腸癌及び結腸ポリープから成っていた。陰性クラスは、PBL(末梢血リンパ球)、結腸−正常、結腸−NAT及び結腸−炎症性であった。カッコ内のAUC値については(下表7参照)、乳癌及び肝臓癌も同様に陰性クラス内に含まれていた。
重亜硫酸塩転換後MSP技術を用いてゲノムDNAを分析した。全ての試料の合計ゲノムDNAを重亜硫酸塩で処理し、未メチル化シトシンをウラシルに転換させた。メチル化シトシンは、保存状態のままにしておいた。重亜硫酸塩処理は、Olek et al.(1996)で記述されているプロトコルに従って、わずかに修正した上で実施された。
問題の配列をこのときメチル化特異的プライマを用いて増幅させた。このとき、増幅物は、メチル化特異的Taqmanプローブを用いて検出される。
TaqmanPCRプログラムのための反応条件: 10分間95℃での変性。
50サイクル: 15秒間95℃での変性。
1分間62℃でのアニーリング。ただし、60℃のアニーリング温度を有する検定15を除く。
各検定についての増幅曲線は、図72〜86(表6に従う)に示されている。
一連の代替的検定の技術的性能は、鋳型として精子DNAを用いて以下の各々を検査することによって妥当性検査される。
遺伝子配列番号34(MSP検定)
プライマ:cgtacgaacgcaacaaccg(配列番号14535)及びgttcggcgttgtttaggc(配列番号14536)
プローブ:gcatcttccaacaccgtcccg(配列番号14537)−Fluo及びLC640−ctccgcatccttccccgaa−p(配列番号14538)Lightcyclerプローブ)
Lightcyclerプログラム:
95°10 分
55 サイクル 95°15 秒 (20°/秒)
62°45秒 (20°/秒) 検出
72°15 秒 (20°/秒)
遺伝子配列番号:28(MSP検定)
プライマ:ccgaacaaacgtaatacgcg(配列番号14539)及びacggcgtgaaggagcg(配列番号14540)
プローブ:tacgcgcggtagtcgtgcgc(配列番号14541)(FAM/BHQ1標識されたTaqmanプローブ)
Lightcyclerプログラム:
95°10分
55サイクル 95°15秒(20°/秒)
60°45秒(20°/秒)検出
遺伝子配列番号10(MSP 検定)
プライマ:cgacaaaatcctcatcgcg(配列番号14542)及びgtcgtttagcgttgggaagC(配列番号14543)
プローブ:tacgtacgagtttcgtacgcgtattatttcgtcg(配列番号14544)(FAM/BHQ1標識されたTaqmanプローブ)
Lightcyclerプログラム:
95°10分
55サイクル 95°15秒(20°/秒)
62°45秒(20°/秒)検出
遺伝子配列番号9(MSP検定)
プライマ:acttaaaaatcgccgaatcg(配列番号14545)及びagttttatagttaattagggtagttgtcgtcg(配列番号14546)
プローブ:tcctatcatcgctcacgaacg(配列番号14547)−フッ素及びLC640−cgacaacgactatccttactattataa−p(配列番号14548)(Lightcyclerプローブ)
LCプログラム:
95°10分
55サイクル 95°15秒(20°/秒)
60°30秒(20°/秒)検出
72°15秒(20°/秒)
結果
感度及び特異性を、SVM及び10倍クロス確認で算出した。
管理された学習によるクラス予測
異なる組織クラス間で、選択されたマーカーセットのCpG集会をいかにうまく弁別できるかの信頼性の高い推定値を提供するために、我々は、分類によりその予測精度を決定した。その目的で、我々は、メチル化プロフィールベースの予測機能を計算した。この段階は、トレーニングと呼ばれ、データ標識で代表される先行する知識を活用する。その関数の予測精度はこのときクロス確認によってか又は一組の独立した試料について検査される。好ましい方法として、我々は、予測関数を学習するためにサポートベクトルマシン(SVM)アルゴリズム(Duda(2001)、Christiannini(2001))を使用した。相反する記述のないかぎり、本報告書では、偽陽性又は偽陰性分類に付随するリスクは、それぞれのクラスサイズとの関係において等しくセットされる。そのため、学習アルゴリズムは、独立した検査試料セットについて精度を最適化する目的でクラス予測関数を得ることになる。従って、結果としての分類子の感度及び特異性はほぼ等しくなると予想できる。図87及び95は、以下の検定を用いて全データセットについてトレーニングされた二次SVMを示す。
図87:検定12及び9
図88:検定12及び11
図89:検定12及び15
図90:検定7及び6
図91:検定11及び5
図92:検定7及び5
図93:検定6及び4
図94:検定12及び7
図95:検定12及び6
実施例15
Heavy Methyl分析
以下では、遺伝子配列番号7、8及び17に従った遺伝子/ゲノム配列のメチル化が、15の結腸直腸癌試料(表7では「結腸(colon)」と呼ばれている)及び8個の末梢血リンパ球試料(表7では「PBL」と呼ばれている)の中で分析された。
全ての試料の全ゲノムDNAは、重亜硫酸塩処理され、未メチル化シトシンをウラシルに転換した。メチル化シトシンは、保存状態のままにしておいた。重亜硫酸塩処理は、Olek et al.(1996)で記述されているプロトコルに従って、わずかに修正した上で実施された。
問題の配列は次に、非メチル化DNAの増幅を抑制する目的で、重亜硫酸塩処理されたDNA及び遮断用オリゴマーヌクレオチドに特異的なプライマを用いて増幅された。遮断用オリゴマーヌクレオチドの3′OH末端は、PCR反応中にポリメラーゼがプライマを拡張するのを防げるべくリン酸塩基により「キャッピング」された。増幅物はこのとき5’red640で標識され、キャッピングされた3’OH末端を有し、もう一方のプローブは3’フルオレセインで標識された。
反応は。Light Cycler装置(Roche Diagnostics)を用いて20μlの合計体積で実施された。実時間PCR反応混合物は、10μlの鋳型DNA、ハイブリダイゼーションプローブのための2μlのFast Start Light Cycler反応混合物(Roche Diagnostics, Renzberg)、を含有していた。
太字の数字は、増幅曲線が平坦であったことから、陽性として分類されたものを表わす。
実施例15
配列番号7、30、28及び8に従った遺伝子の血清分析
実施例13(MSP及び14(Heavy Methyl)において以上で記述されたとおりの検定を次に、32個の結腸直腸癌腫血清試料から成る1組の血清試料に適用し、54個の正常な血清試料、良性結腸病巣からの11の血清試料及び炎症性結腸疾患からの6つの血清試料から成るセットに比較した。1回の検定につき130μlの血清を使用し、結果を陽性又は陰性として定量的に報告した。
図1は、実施例1及び2に従って及び適切なアルゴリズムを用いて2つの組織クラス間のCpGメチル化差異に従って得られたランク付けされたデータマトリクスを示す。図は、グレースケールで示されており、ここで最も有意なCpG位置はマトリクスの最下部にあり、有意性は最上部に向かって減少する。黒色は一定の与えられたCpG位置における完全メチル化を表わし、白色は特定の位置にメチル化が全くないことを表わし、メチル化度は、明(低い割合のメチル化)から暗(高い割合のメチル化)の灰色で表わされている。各行は、1つの遺伝子内の1つの特異的CpG位置を表わし、各列は1つの試料についての異なるCpGのメチル化プロフィールを示す。個々のCpG位置のためのp値は右側に示されている。p値は、観察された分布がデータセット内で偶然発生した確率である。
図2は、各々の比較のための補正されていない多変量Log Reg検査結果を示す。問題の各々個々のゲノム領域は、1つの点として表わされ、破線は25%の誤発見率についてのカットオフポイントを表わす。
図3は、最も性能の良いマーカーについての、2クラスの組織の間のGenewise線形サポートベクトルマシンクロス確認の精度の、ランク付けされたデータマトリクスを示す。図は、グレースケールで示されており、ここで最も有意なCpG位置はマトリクスの最下部にあり、有意性は最上部に向かって減少する。黒色は一定の与えられたCpG位置における完全メチル化を表わし、白色は特定の位置にメチル化が全くないことを表わし、メチル化度は、明(低い割合のメチル化)から暗(高い割合のメチル化)の灰色で表わされている。各行は、1つの遺伝子内の1つの特異的CpG位置を表わし、各列は1つの試料についての異なるCpGのメチル化プロフィールを示す。問題の各々個々のゲノム領域についての精度値が、右側に示されている。
図4は、各分類の全てのゲノム領域についてのGenewise線形サポートベクトルマシンクロス確認の精度を示す。各々のゲノム領域の精度は、黒色正方形で表わされ、特異性は白抜き菱形で、感度は白抜き正方形で表わされている。X軸上で測定された通りの精度は、適正に分類された試料の画分を示す。
図5は、実施例1及び2に従って及び適切なアルゴリズムを用いて2つの組織クラス間のCpGメチル化差異に従って得られたランク付けされたデータマトリクスを示す。図は、グレースケールで示されており、ここで最も有意なCpG位置はマトリクスの最下部にあり、有意性は最上部に向かって減少する。黒色は一定の与えられたCpG位置における完全メチル化を表わし、白色は特定の位置にメチル化が全くないことを表わし、メチル化度は、明(低い割合のメチル化)から暗(高い割合のメチル化)の灰色で表わされている。各行は、1つの遺伝子内の1つの特異的CpG位置を表わし、各列は1つの試料についての異なるCpGのメチル化プロフィールを示す。個々のCpG位置のためのp値は右側に示されている。p値は、観察された分布がデータセット内で偶然発生した確率である。
図6は、各々の比較のための補正されていない多変量Log Reg検査結果を示す。問題の各々個々のゲノム領域は、1つの点として表わされ、破線は25%の誤発見率についてのカットオフポイントを表わす。
図7は、最も性能の良いマーカーについての、2クラスの組織の間のGenewise線形サポートベクトルマシンクロス確認の精度の、ランク付けされたデータマトリクスを示す。図は、グレースケールで示されており、ここで最も有意なCpG位置はマトリクスの最下部にあり、有意性は最上部に向かって減少する。黒色は一定の与えられたCpG位置における完全メチル化を表わし、白色は特定の位置にメチル化が全くないことを表わし、メチル化度は、明(低い割合のメチル化)から暗(高い割合のメチル化)の灰色で表わされている。各行は、1つの遺伝子内の1つの特異的CpG位置を表わし、各列は1つの試料についての異なるCpGのメチル化プロフィールを示す。問題の各々個々のゲノム領域についての精度値が、右側に示されている。
図8は、各分類の全てのゲノム領域についてのGenewise線形サポートベクトルマシンクロス確認の精度を示す。各々のゲノム領域の精度は、黒色正方形で表わされ、特異性は白抜き菱形で、感度は白抜き正方形で表わされている。X軸上で測定された通りの精度は、適正に分類された試料の画分を示す。
図9は、実施例1及び2に従って及び適切なアルゴリズムを用いて2つの組織クラス間のCpGメチル化差異に従って得られたランク付けされたデータマトリクスを示す。図は、グレースケールで示されており、ここで最も有意なCpG位置はマトリクスの最下部にあり、有意性は最上部に向かって減少する。黒色は一定の与えられたCpG位置における完全メチル化を表わし、白色は特定の位置にメチル化が全くないことを表わし、メチル化度は、明(低い割合のメチル化)から暗(高い割合のメチル化)の灰色で表わされている。各行は、1つの遺伝子内の1つの特異的CpG位置を表わし、各列は1つの試料についての異なるCpGのメチル化プロフィールを示す。個々のCpG位置のためのp値は右側に示されている。p値は、観察された分布がデータセット内で偶然発生した確率である。
図10は、各々の比較のための補正されていない多変量Log Reg検査結果を示す。問題の各々個々のゲノム領域は、1つの点として表わされ、破線は25%の誤発見率についてのカットオフポイントを表わす。
図11は、最も性能の良いマーカーについての、2クラスの組織の間のGenewise線形サポートベクトルマシンクロス確認の精度の、ランク付けされたデータマトリクスを示す。図は、グレースケールで示されており、ここで最も有意なCpG位置はマトリクスの最下部にあり、有意性は最上部に向かって減少する。黒色は一定の与えられたCpG位置における完全メチル化を表わし、白色は特定の位置にメチル化が全くないことを表わし、メチル化度は、明(低い割合のメチル化)から暗(高い割合のメチル化)の灰色で表わされている。各行は、1つの遺伝子内の1つの特異的CpG位置を表わし、各列は1つの試料についての異なるCpGのメチル化プロフィールを示す。問題の各々個々のゲノム領域についての精度値が、右側に示されている。
図12は、各分類の全てのゲノム領域についてのGenewise線形サポートベクトルマシンクロス確認の精度を示す。各々のゲノム領域の精度は、黒色正方形で表わされ、特異性は白抜き菱形で、感度は白抜き正方形で表わされている。X軸上で測定された通りの精度は、適正に分類された試料の画分を示す。
図13は、実施例1及び2に従って及び適切なアルゴリズムを用いて2つの組織クラス間のCpGメチル化差異に従って得られたランク付けされたデータマトリクスを示す。図は、グレースケールで示されており、ここで最も有意なCpG位置はマトリクスの最下部にあり、有意性は最上部に向かって減少する。黒色は一定の与えられたCpG位置における完全メチル化を表わし、白色は特定の位置にメチル化が全くないことを表わし、メチル化度は、明(低い割合のメチル化)から暗(高い割合のメチル化)の灰色で表わされている。各行は、1つの遺伝子内の1つの特異的CpG位置を表わし、各列は1つの試料についての異なるCpGのメチル化プロフィールを示す。個々のCpG位置のためのp値は右側に示されている。p値は、観察された分布がデータセット内で偶然発生した確率である。
図14は、最も性能の良いマーカーについての、2クラスの組織の間のGenewise線形サポートベクトルマシンクロス確認の精度の、ランク付けされたデータマトリクスを示す。図は、グレースケールで示されており、ここで最も有意なCpG位置はマトリクスの最下部にあり、有意性は最上部に向かって減少する。黒色は一定の与えられたCpG位置における完全メチル化を表わし、白色は特定の位置にメチル化が全くないことを表わし、メチル化度は、明(低い割合のメチル化)から暗(高い割合のメチル化)の灰色で表わされている。各行は、1つの遺伝子内の1つの特異的CpG位置を表わし、各列は1つの試料についての異なるCpGのメチル化プロフィールを示す。問題の各々個々のゲノム領域についての精度値が、右側に示されている。
図15は、各分類の全てのゲノム領域についてのGenewise線形サポートベクトルマシンクロス確認の精度を示す。各々のゲノム領域の精度は、黒色正方形で表わされ、特異性は白抜き菱形で、感度は白抜き正方形で表わされている。X軸上で測定された通りの精度は、適正に分類された試料の画分を示す。
図16は、実施例1及び2に従って及び適切なアルゴリズムを用いて2つの組織クラス間のCpGメチル化差異に従って得られたランク付けされたデータマトリクスを示す。図は、グレースケールで示されており、ここで最も有意なCpG位置はマトリクスの最下部にあり、有意性は最上部に向かって減少する。黒色は一定の与えられたCpG位置における完全メチル化を表わし、白色は特定の位置にメチル化が全くないことを表わし、メチル化度は、明(低い割合のメチル化)から暗(高い割合のメチル化)の灰色で表わされている。各行は、1つの遺伝子内の1つの特異的CpG位置を表わし、各列は1つの試料についての異なるCpGのメチル化プロフィールを示す。個々のCpG位置のためのp値は右側に示されている。p値は、観察された分布がデータセット内で偶然発生した確率である。
図17は、各々の比較のための補正されていない多変量Log Reg検査結果を示す。問題の各々個々のゲノム領域は、1つの点として表わされ、破線は25%の誤発見率についてのカットオフポイントを表わす。
図18は、最も性能の良いマーカーについての、2クラスの組織の間のGenewise線形サポートベクトルマシンクロス確認の精度の、ランク付けされたデータマトリクスを示す。図は、グレースケールで示されており、ここで最も有意なCpG位置はマトリクスの最下部にあり、有意性は最上部に向かって減少する。黒色は一定の与えられたCpG位置における完全メチル化を表わし、白色は特定の位置にメチル化が全くないことを表わし、メチル化度は、明(低い割合のメチル化)から暗(高い割合のメチル化)の灰色で表わされている。各行は、1つの遺伝子内の1つの特異的CpG位置を表わし、各列は1つの試料についての異なるCpGのメチル化プロフィールを示す。問題の各々個々のゲノム領域についての精度値が、右側に示されている。
図19は、各分類の全てのゲノム領域についてのGenewise線形サポートベクトルマシンクロス確認の精度を示す。各々のゲノム領域の精度は、黒色正方形で表わされ、特異性は白抜き菱形で、感度は白抜き正方形で表わされている。X軸上で測定された通りの精度は、適正に分類された試料の画分を示す。
図20は、実施例1及び2に従って及び適切なアルゴリズムを用いて2つの組織クラス間のCpGメチル化差異に従って得られたランク付けされたデータマトリクスを示す。図は、グレースケールで示されており、ここで最も有意なCpG位置はマトリクスの最下部にあり、有意性は最上部に向かって減少する。黒色は一定の与えられたCpG位置における完全メチル化を表わし、白色は特定の位置にメチル化が全くないことを表わし、メチル化度は、明(低い割合のメチル化)から暗(高い割合のメチル化)の灰色で表わされている。各行は、1つの遺伝子内の1つの特異的CpG位置を表わし、各列は1つの試料についての異なるCpGのメチル化プロフィールを示す。個々のCpG位置のためのp値は右側に示されている。p値は、観察された分布がデータセット内で偶然発生した確率である。
図21は、各々の比較のための補正されていない多変量Log Reg検査結果を示す。問題の各々個々のゲノム領域は、1つの点として表わされ、破線は25%の誤発見率についてのカットオフポイントを表わす。
図22は、最も性能の良いマーカーについての、2クラスの組織の間のGenewise線形サポートベクトルマシンクロス確認の精度の、ランク付けされたデータマトリクスを示す。図は、グレースケールで示されており、ここで最も有意なCpG位置はマトリクスの最下部にあり、有意性は最上部に向かって減少する。黒色は一定の与えられたCpG位置における完全メチル化を表わし、白色は特定の位置にメチル化が全くないことを表わし、メチル化度は、明(低い割合のメチル化)から暗(高い割合のメチル化)の灰色で表わされている。各行は、1つの遺伝子内の1つの特異的CpG位置を表わし、各列は1つの試料についての異なるCpGのメチル化プロフィールを示す。問題の各々個々のゲノム領域についての精度値が、右側に示されている。
図23は、各分類の全てのゲノム領域についてのGenewise線形サポートベクトルマシンクロス確認の精度を示す。各々のゲノム領域の精度は、黒色正方形で表わされ、特異性は白抜き菱形で、感度は白抜き正方形で表わされている。X軸上で測定された通りの精度は、適正に分類された試料の画分を示す。
図24は、実施例1及び2に従って及び適切なアルゴリズムを用いて2つの組織クラス間のCpGメチル化差異に従って得られたランク付けされたデータマトリクスを示す。図は、グレースケールで示されており、ここで最も有意なCpG位置はマトリクスの最下部にあり、有意性は最上部に向かって減少する。黒色は一定の与えられたCpG位置における完全メチル化を表わし、白色は特定の位置にメチル化が全くないことを表わし、メチル化度は、明(低い割合のメチル化)から暗(高い割合のメチル化)の灰色で表わされている。各行は、1つの遺伝子内の1つの特異的CpG位置を表わし、各列は1つの試料についての異なるCpGのメチル化プロフィールを示す。個々のCpG位置のためのp値は右側に示されている。p値は、観察された分布がデータセット内で偶然発生した確率である。
図25は、各々の比較のための補正されていない多変量Log Reg検査結果を示す。問題の各々個々のゲノム領域は、1つの点として表わされ、破線は25%の誤発見率についてのカットオフポイントを表わす。
図26は、最も性能の良いマーカーについての、2クラスの組織の間のGenewise線形サポートベクトルマシンクロス確認の精度の、ランク付けされたデータマトリクスを示す。図は、グレースケールで示されており、ここで最も有意なCpG位置はマトリクスの最下部にあり、有意性は最上部に向かって減少する。黒色は一定の与えられたCpG位置における完全メチル化を表わし、白色は特定の位置にメチル化が全くないことを表わし、メチル化度は、明(低い割合のメチル化)から暗(高い割合のメチル化)の灰色で表わされている。各行は、1つの遺伝子内の1つの特異的CpG位置を表わし、各列は1つの試料についての異なるCpGのメチル化プロフィールを示す。問題の各々個々のゲノム領域についての精度値が、右側に示されている。
図27は、各分類の全てのゲノム領域についてのGenewise線形サポートベクトルマシンクロス確認の精度を示す。各々のゲノム領域の精度は、黒色正方形で表わされ、特異性は白抜き菱形で、感度は白抜き正方形で表わされている。X軸上で測定された通りの精度は、適正に分類された試料の画分を示す。
図28は、実施例1及び2に従って及び適切なアルゴリズムを用いて2つの組織クラス間のCpGメチル化差異に従って得られたランク付けされたデータマトリクスを示す。図は、グレースケールで示されており、ここで最も有意なCpG位置はマトリクスの最下部にあり、有意性は最上部に向かって減少する。黒色は一定の与えられたCpG位置における完全メチル化を表わし、白色は特定の位置にメチル化が全くないことを表わし、メチル化度は、明(低い割合のメチル化)から暗(高い割合のメチル化)の灰色で表わされている。各行は、1つの遺伝子内の1つの特異的CpG位置を表わし、各列は1つの試料についての異なるCpGのメチル化プロフィールを示す。個々のCpG位置のためのp値は右側に示されている。p値は、観察された分布がデータセット内で偶然発生した確率である。
図29は、各々の比較のための補正されていない多変量Log Reg検査結果を示す。問題の各々個々のゲノム領域は、1つの点として表わされ、破線は25%の誤発見率についてのカットオフポイントを表わす。
図30は、最も性能の良いマーカーについての、2クラスの組織の間のGenewise線形サポートベクトルマシンクロス確認の精度の、ランク付けされたデータマトリクスを示す。図は、グレースケールで示されており、ここで最も有意なCpG位置はマトリクスの最下部にあり、有意性は最上部に向かって減少する。黒色は一定の与えられたCpG位置における完全メチル化を表わし、白色は特定の位置にメチル化が全くないことを表わし、メチル化度は、明(低い割合のメチル化)から暗(高い割合のメチル化)の灰色で表わされている。各行は、1つの遺伝子内の1つの特異的CpG位置を表わし、各列は1つの試料についての異なるCpGのメチル化プロフィールを示す。問題の各々個々のゲノム領域についての精度値が、右側に示されている。
図31は、各分類の全てのゲノム領域についてのGenewise線形サポートベクトルマシンクロス確認の精度を示す。各々のゲノム領域の精度は、黒色正方形で表わされ、特異性は白抜き菱形で、感度は白抜き正方形で表わされている。X軸上で測定された通りの精度は、適正に分類された試料の画分を示す。
図32は、実施例1及び2に従って及び適切なアルゴリズムを用いて2つの組織クラス間のCpGメチル化差異に従って得られたランク付けされたデータマトリクスを示す。図は、グレースケールで示されており、ここで最も有意なCpG位置はマトリクスの最下部にあり、有意性は最上部に向かって減少する。黒色は一定の与えられたCpG位置における完全メチル化を表わし、白色は特定の位置にメチル化が全くないことを表わし、メチル化度は、明(低い割合のメチル化)から暗(高い割合のメチル化)の灰色で表わされている。各行は、1つの遺伝子内の1つの特異的CpG位置を表わし、各列は1つの試料についての異なるCpGのメチル化プロフィールを示す。個々のCpG位置のためのp値は右側に示されている。p値は、観察された分布がデータセット内で偶然発生した確率である。
図33は、各々の比較のための補正されていない多変量Log Reg検査結果を示す。問題の各々個々のゲノム領域は、1つの点として表わされ、破線は25%の誤発見率についてのカットオフポイントを表わす。
図34は、最も性能の良いマーカーについての、2クラスの組織の間のGenewise線形サポートベクトルマシンクロス確認の精度の、ランク付けされたデータマトリクスを示す。図は、グレースケールで示されており、ここで最も有意なCpG位置はマトリクスの最下部にあり、有意性は最上部に向かって減少する。黒色は一定の与えられたCpG位置における完全メチル化を表わし、白色は特定の位置にメチル化が全くないことを表わし、メチル化度は、明(低い割合のメチル化)から暗(高い割合のメチル化)の灰色で表わされている。各行は、1つの遺伝子内の1つの特異的CpG位置を表わし、各列は1つの試料についての異なるCpGのメチル化プロフィールを示す。問題の各々個々のゲノム領域についての精度値が、右側に示されている。
図35は、各分類の全てのゲノム領域についてのGenewise線形サポートベクトルマシンクロス確認の精度を示す。各々のゲノム領域の精度は、黒色正方形で表わされ、特異性は白抜き菱形で、感度は白抜き正方形で表わされている。X軸上で測定された通りの精度は、適正に分類された試料の画分を示す。
図36は、異なるMSPMethy LightTM検定及びHeavy MethylTM Methy LightTM検定により決定されるメチル化レベルを示す。Y軸は、メチル化度を示す。腫瘍試料は白色点により表わされ、正常な結腸組織試料は黒色点で表わされている。腫瘍試料中では、健常な組織試料に比べ著しく高いメチル化度が観察された。
図37は、実施例2に従った腺癌についての配列番号35−MSP−Methyl LightTM検定の受信者動作特性曲線(ROC曲線)を示す。MSP−Methyl LightTM検定についてのAUCは0.94である。
図38は、実施例3に従った腺癌についての配列番号35−MSP−Methyl LightTM検定の受信者動作特性曲線(ROC曲線)を示す。MSP−Methyl LightTM検定についてのAUCは0.91である。
図39は、さらなる1組の結腸試料(腺癌25、正常33、腺腫13)をテストする、実施例3に従った配列番号35−Heavy MethylTM Methy LightTM検定によって決定されたメチル化レベルを示す。Y軸は、調査された配列番号35遺伝子の領域内のメチル化度を示す。腺癌試料は、白色正方形で表わされ、正常な結腸組織試料は黒色菱形で表わされている。腫瘍試料内では、健常な組織試料に比べて著しく高いメチル化度が観察された。t−検定を用いて測定される通りの有意性レベルは0.00424であった。
図40は、実施例3に従った腺癌及び腺腫についての配列番号35−HM−Methyl LightTM−検定の受信者動作特性曲線(ROC曲線)を示す(付加的な試料セット)。ROC曲線(AUC)より下の面積は、診断学的検査の精度のための1つの尺度である。HM−Methyl LightTM−検定についてのAUCは0.81である。
図41は、実施例2に従った腺癌のみについての配列番号35−HM−Methyl LightTM−検定の受信者動作特性曲線(ROC曲線)を示す(付加的な試料セット)。ROC曲線(AUC)より下の面積は、診断学的検査の精度のための1つの尺度である。HM−Methyl−Light−検定についてのAUCは0.844である。
図42は、実施例2に従った腺腫についての配列番号35−HM−Methyl LightTM−検定の受信者動作特性曲線(ROC曲線)を示す(付加的な試料セット)。ROC曲線(AUC)より下の面積は、診断学的検査の精度のための1つの尺度である。HM−MethylLightTM検定についてのAUCは0.748である。
図43は、実施例4に従った配列番号35−Heavy MethylTM Methy LightTM検定によって決定された異なる腫瘍及び健康組織内のメチル化レベルを示す。Y軸は、調査された配列番号35遺伝子の領域内のメチル化度を示す。結腸癌試料以外に、2つの乳癌組織のうちの1つのみがメチル化された。
図44は、実施例4に従った配列番号35−Heavy MethylTM Methy LightTM検定によって決定された異なる乳癌組織内のメチル化レベルを示す。1つのみがメチル化された。
図45は、実施例4に従った配列番号35−Heavy MethylTM Methy LightTMにより決定された血清試料内のメチル化レベルを示す。Y軸は、調査された配列番号35遺伝子の領域内のメチル化度を示す。
図46は、実施例9に従った配列番号34−MSP−Methyl LightTM−検定のROC曲線を示す。AUCは0.84である。
図47は、実施例10に従った配列番号29−MSP−Methyl LightTM−検定のROC曲線を示す。AUCは0.80である。
図48は、Methyl LightTM検定のMSP及びHeavy MethylTM 変形型を用いた各試料内で計算された配列番号35内のメチル化百分率の回帰プロットを示す。
図49は、実施例8に従った配列番号29−、MSP−MethyLight検定のROC曲線を示す(第1の試料セット)。AUCは0.93である。
図50は、実施例8に従った配列番号29−、MSP−MethyLight検定のROC曲線を示す(第2の試料セット)。AUCは1である。
図51は、実施例9に従った配列番号39−、MSP−MethyLight検定のROC曲線を示す。AUCは0.94である。
実施例10に従った排泄物試料の増幅を示す。X軸はポリメラーゼ連鎖反応のサイクル数を示し、Y軸は背景全体にわたる蛍光強度であるデルタRnを示し、水平線(A)は、較正曲線(B)の閾値レベルを表わし、該曲線が(A)より上に達している場合メチル化が検出されたことになる。
実施例10に従った排泄物試料の増幅を示す。X軸はポリメラーゼ連鎖反応のサイクル数を示し、Y軸は背景全体にわたる蛍光強度であるデルタRnを示し、水平線(A)は、較正曲線(B)の閾値レベルを表わし、該曲線が(A)より上に達している場合メチル化が検出されたことになる。
実施例10に従った排泄物試料の増幅を示す。X軸はポリメラーゼ連鎖反応のサイクル数を示し、Y軸は背景全体にわたる蛍光強度であるデルタRnを示し、水平線(A)は、較正曲線(B)の閾値レベルを表わし、該曲線が(A)より上に達している場合メチル化が検出されたことになる。
実施例10に従った排泄物試料の増幅を示す。X軸はポリメラーゼ連鎖反応のサイクル数を示し、Y軸は背景全体にわたる蛍光強度であるデルタRnを示し、水平線(A)は、較正曲線(B)の閾値レベルを表わし、該曲線が(A)より上に達している場合メチル化が検出されたことになる。
実施例10に従った排泄物試料の増幅を示す。X軸はポリメラーゼ連鎖反応のサイクル数を示し、Y軸は背景全体にわたる蛍光強度であるデルタRnを示し、水平線(A)は、較正曲線(B)の閾値レベルを表わし、該曲線が(A)より上に達している場合メチル化が検出されたことになる。
実施例10に従った排泄物試料の増幅を示す。X軸はポリメラーゼ連鎖反応のサイクル数を示し、Y軸は背景全体にわたる蛍光強度であるデルタRnを示し、水平線(A)は、較正曲線(B)の閾値レベルを表わし、該曲線が(A)より上に達している場合メチル化が検出されたことになる。
実施例10に従った排泄物試料の増幅を示す。X軸はポリメラーゼ連鎖反応のサイクル数を示し、Y軸は背景全体にわたる蛍光強度であるデルタRnを示し、水平線(A)は、較正曲線(B)の閾値レベルを表わし、該曲線が(A)より上に達している場合メチル化が検出されたことになる。
実施例10に従った排泄物試料の増幅を示す。X軸はポリメラーゼ連鎖反応のサイクル数を示し、Y軸は背景全体にわたる蛍光強度であるデルタRnを示し、水平線(A)は、較正曲線(B)の閾値レベルを表わし、該曲線が(A)より上に達している場合メチル化が検出されたことになる。
実施例11に従った試料のPCR増幅を示す。各々の個々の試料は、正常を示す「n」又は腫瘍を示す「t」としてX軸上で注釈が付されている。気管支組織試料が一部の検定中で偶発的に分析された。これらは矢印で注釈付けされ、本発明の中では無意味である。Y軸は、試料中のメチル化レベル(「メチル化率」)を示す。メチル化率(メチル化/(メチル化+未メチル化)は、表4内のプライマ対に対応するフラグメントについて示されている。
実施例11に従った試料のPCR増幅を示す。各々の個々の試料は、正常を示す「n」又は腫瘍を示す「t」としてX軸上で注釈が付されている。気管支組織試料が一部の検定中で偶発的に分析された。これらは矢印で注釈付けされ、本発明の中では無意味である。Y軸は、試料中のメチル化レベル(「メチル化率」)を示す。メチル化率(メチル化/(メチル化+未メチル化)は、表4内のプライマ対に対応するフラグメントについて示されている。
実施例11に従った試料のPCR増幅を示す。各々の個々の試料は、正常を示す「n」又は腫瘍を示す「t」としてX軸上で注釈が付されている。気管支組織試料が一部の検定中で偶発的に分析された。これらは矢印で注釈付けされ、本発明の中では無意味である。Y軸は、試料中のメチル化レベル(「メチル化率」)を示す。メチル化率(メチル化/(メチル化+未メチル化)は、表4内のプライマ対に対応するフラグメントについて示されている。
実施例11に従った試料のPCR増幅を示す。各々の個々の試料は、正常を示す「n」又は腫瘍を示す「t」としてX軸上で注釈が付されている。気管支組織試料が一部の検定中で偶発的に分析された。これらは矢印で注釈付けされ、本発明の中では無意味である。Y軸は、試料中のメチル化レベル(「メチル化率」)を示す。メチル化率(メチル化/(メチル化+未メチル化)は、表4内のプライマ対に対応するフラグメントについて示されている。
実施例11に従った試料のPCR増幅を示す。各々の個々の試料は、正常を示す「n」又は腫瘍を示す「t」としてX軸上で注釈が付されている。気管支組織試料が一部の検定中で偶発的に分析された。これらは矢印で注釈付けされ、本発明の中では無意味である。Y軸は、試料中のメチル化レベル(「メチル化率」)を示す。メチル化率(メチル化/(メチル化+未メチル化)は、表4内のプライマ対に対応するフラグメントについて示されている。
実施例11に従った試料のPCR増幅を示す。各々の個々の試料は、正常を示す「n」又は腫瘍を示す「t」としてX軸上で注釈が付されている。気管支組織試料が一部の検定中で偶発的に分析された。これらは矢印で注釈付けされ、本発明の中では無意味である。Y軸は、試料中のメチル化レベル(「メチル化率」)を示す。メチル化率(メチル化/(メチル化+未メチル化)は、表4内のプライマ対に対応するフラグメントについて示されている。
実施例11に従った試料のPCR増幅を示す。各々の個々の試料は、正常を示す「n」又は腫瘍を示す「t」としてX軸上で注釈が付されている。気管支組織試料が一部の検定中で偶発的に分析された。これらは矢印で注釈付けされ、本発明の中では無意味である。Y軸は、試料中のメチル化レベル(「メチル化率」)を示す。メチル化率(メチル化/(メチル化+未メチル化)は、表4内のプライマ対に対応するフラグメントについて示されている。
実施例11に従った試料のPCR増幅を示す。各々の個々の試料は、正常を示す「n」又は腫瘍を示す「t」としてX軸上で注釈が付されている。気管支組織試料が一部の検定中で偶発的に分析された。これらは矢印で注釈付けされ、本発明の中では無意味である。Y軸は、試料中のメチル化レベル(「メチル化率」)を示す。メチル化率(メチル化/(メチル化+未メチル化)は、表4内のプライマ対に対応するフラグメントについて示されている。
実施例11に従った試料のPCR増幅を示す。各々の個々の試料は、正常を示す「n」又は腫瘍を示す「t」としてX軸上で注釈が付されている。気管支組織試料が一部の検定中で偶発的に分析された。これらは矢印で注釈付けされ、本発明の中では無意味である。Y軸は、試料中のメチル化レベル(「メチル化率」)を示す。メチル化率(メチル化/(メチル化+未メチル化)は、表4内のプライマ対に対応するフラグメントについて示されている。
実施例11に従った試料のPCR増幅を示す。各々の個々の試料は、正常を示す「n」又は腫瘍を示す「t」としてX軸上で注釈が付されている。気管支組織試料が一部の検定中で偶発的に分析された。これらは矢印で注釈付けされ、本発明の中では無意味である。Y軸は、試料中のメチル化レベル(「メチル化率」)を示す。メチル化率(メチル化/(メチル化+未メチル化)は、表4内のプライマ対に対応するフラグメントについて示されている。
実施例11に従った試料のPCR増幅を示す。各々の個々の試料は、正常を示す「n」又は腫瘍を示す「t」としてX軸上で注釈が付されている。気管支組織試料が一部の検定中で偶発的に分析された。これらは矢印で注釈付けされ、本発明の中では無意味である。Y軸は、試料中のメチル化レベル(「メチル化率」)を示す。メチル化率(メチル化/(メチル化+未メチル化)は、表4内のプライマ対に対応するフラグメントについて示されている。
実施例11に従った試料のPCR増幅を示す。各々の個々の試料は、正常を示す「n」又は腫瘍を示す「t」としてX軸上で注釈が付されている。気管支組織試料が一部の検定中で偶発的に分析された。これらは矢印で注釈付けされ、本発明の中では無意味である。Y軸は、試料中のメチル化レベル(「メチル化率」)を示す。メチル化率(メチル化/(メチル化+未メチル化)は、表4内のプライマ対に対応するフラグメントについて示されている。
実施例14の検定1〜15に従った試料のPCR増幅を示す。X軸は、ポリメラーゼ連鎖反応のサイクル数を示す。Y軸は、背景全体にわたる蛍光強度を示す。図72は、検定1の増幅曲線を示す。
図73は、検定2の増幅曲線を示す。
図74は、検定3の増幅曲線を示す。
図75は、検定4の増幅曲線を示す。
図76は、検定5の増幅曲線を示す。
図77は、検定6の増幅曲線を示す。
図78は、検定7の増幅曲線を示す。
図79は、検定8の増幅曲線を示す。
図80は、検定9の増幅曲線を示す。
図81は、検定10の増幅曲線を示す。
図82は、検定11の増幅曲線を示す。
図83は、検定12の増幅曲線を示す。
図84は、検定13の増幅曲線を示す。
図85は、検定14の増幅曲線を示す。
図86は、検定15の増幅曲線を示す。
実施例14に従ったデータセットについてトレーニングされた二次SVMのクラス予測性能を示す。囲んだ点は、より明るい及びより暗い斜線付き部域間の境界線(白色)を画定するサポートベクトルである。図87は、検定12及び19を用いてトレーニングされたSVMを示す。
図88は、検定12及び11を用いてトレーニングされたSVMを示す。
図89は、検定12及び15を用いてトレーニングされたSVMを示す。
図90は、検定7及び6を用いてトレーニングされたSVMを示す。
図91は、検定11及び5を用いてトレーニングされたSVMを示す。
図92は、検定7及び5を用いてトレーニングされたSVMを示す。
図93は、検定6及び4を用いてトレーニングされたSVMを示す。
図94は、検定12及び7を用いてトレーニングされたSVMを示す。
図95は、検定12及び6を用いてトレーニングされたSVMを示す。
図96は、1つのアルゴリズムを用いた2種類の組織(左側の気道消化器の癌及び右側の健常な気道消化器組織)の間のCpGメチル化の差異に従った実施例1及び2に従って得られたランク付けされたデータマトリクスを示す。最も有意なCpG位置は、マトリクスの最下部にあり、有意性は最上部に向かって減少する。赤は、一定の与えられたCpG位置での全体的メチル化を表わし、緑は特定の位置でメチル化が全く無いことを表わす。各行は、遺伝子内部の特異的CpG位置を表わし、各列は、1つの試料についての異なるCpGsのメチル化プロフィールを示す。