JP6954964B2 - エピジェネティックドメインの安定性の全般的な損失を通して癌を検出する方法およびその組成物 - Google Patents

エピジェネティックドメインの安定性の全般的な損失を通して癌を検出する方法およびその組成物 Download PDF

Info

Publication number
JP6954964B2
JP6954964B2 JP2019166951A JP2019166951A JP6954964B2 JP 6954964 B2 JP6954964 B2 JP 6954964B2 JP 2019166951 A JP2019166951 A JP 2019166951A JP 2019166951 A JP2019166951 A JP 2019166951A JP 6954964 B2 JP6954964 B2 JP 6954964B2
Authority
JP
Japan
Prior art keywords
cancer
methylation
nucleic acid
acid sequences
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019166951A
Other languages
English (en)
Other versions
JP2020010700A (ja
Inventor
アンドリュー ピー. フェインベルク
アンドリュー ピー. フェインベルク
ラファエル アイ. イリザリー
ラファエル アイ. イリザリー
Original Assignee
ザ・ジョンズ・ホプキンス・ユニバーシティー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ザ・ジョンズ・ホプキンス・ユニバーシティー filed Critical ザ・ジョンズ・ホプキンス・ユニバーシティー
Publication of JP2020010700A publication Critical patent/JP2020010700A/ja
Application granted granted Critical
Publication of JP6954964B2 publication Critical patent/JP6954964B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/154Methylation markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Hospice & Palliative Care (AREA)
  • Biophysics (AREA)
  • Oncology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)

Description

発明の分野
本発明は、概して、メチローム解析、より具体的にはゲノムのエピジェネティックドメインの安定性の全般的な損失を通して癌を検出するための方法に関する。
背景情報
エピジェネティックスは、細胞分裂および分化中の染色体DNAの非配列情報の研究である。エピジェネティックスの分子基盤は複雑であり、特定の遺伝子の活性化または不活性化の修飾を伴う。加えて、DNAに関連するクロマチンタンパク質は、活性化されるか、または発現停止され得る。エピジェネティック変化は、細胞が分裂するときに保存される。ほとんどのエピジェネティック変化は1個体生物の寿命の過程内でのみ生じるが、一部のエピジェネティック変化は1つの世代から次の世代に受け継がれる。
エピジェネティック機構の一例は、ヌクレオチドシトシンの共有結合による修飾であるDNAメチル化(DNAm)である。特に、シトシンを5−メチルシトシンに変換させるために、メチル基をDNAのシトシンヌクレオチドに付加することを伴う。DNAのメチル化は、一部の遺伝子が発現するか否かを決定する重要な役割を果たす。異常なDNAメチル化は、加齢および多くの癌の発症で観察される変化の根底にあることが知られている機構のうちの1つである。
癌は歴史的にDNA配列突然変異等の遺伝的変化に関連してきた。今では、比較的多くの数の癌が突然変異ではなく、不適切なDNAメチル化等のエピジェネティック変化から生じることを証拠が裏付けている。いくつかの場合では、DNAの高メチル化は、腫瘍抑制因子遺伝子またはDNA修復遺伝子等の重要な遺伝子の発現の阻害をもたらし、癌が発症可能となる。他の場合では、遺伝子の低メチル化は発現を調節し、これが癌の発症の一因となる。
癌は、一般的に、200を超える別個の、異常な細胞成長の器官特異的疾患と見なされ、一連の突然変異によって大部分は制御されるが、同じ遺伝子セットを伴う可能性があるエピジェネティック変化、即ち、非配列変化に基づく変化も伴う。CpGジヌクレオチドでのDNAメチル化は特に癌において広く研究されており、一部の遺伝子での低メチル化、他の遺伝子での高メチル化、通常メチル化される反復DNA要素と見なされるDNAメチル化の全体的な損失が報告されてきた。
ヒト癌における変更されたDNAメチル化の発見以来、癌エピジェネティックスの焦点は、高密度CpGアイランド、遺伝子プロモータ、または分散反復要素2,3のいずれかのゲノムの候補領域に置かれたが、癌および正常な分化におけるDNAメチル化の損失と増加との間の関係は、包括的なゲノムスケールで理解されていない。
本発明は、エピジェネティックドメインの安定性の全般的な損失が様々な癌の種類にわたる特性であると決定された発見に基づく。癌のゲノムスケールの亜硫酸水素塩配列決定は、CpGアイランドとショアの両方、ならびにゲノムの半分超に影響を及ぼす低メチル化の大型(最大数メガベース)ブロックを伴う癌メチロームにおけるメチル化の安定性の意外な損失を明らかにし、遺伝子発現において確率的変動が付随する。
そのようなものとして、一態様では、対象における癌または癌のリスクを診断する方法が提供される。本方法は、(i)非癌性生体サンプルからの複数のゲノム核酸配列、および対象からの試験サンプルの対応する複数のゲノム核酸配列のメチル化状態を決定することと、(ii)試験サンプルのメチル化状態における、非癌性サンプルのメチル化状態からの偏差を検出することと、(iii)非癌性サンプルと比較して、試験サンプルにおけるメチル化の分散の増加を検出することと、(iv)統計解析を行うことによってメチル化分散スコアを決定し、それによって対象における癌を診断することを含む、対象からのサンプルにおける抗プロファイルを特定することを含む。一実施形態では、本方法は、表6、表7、表16、または表17に記載されるものから選択される1つ以上の核酸配列のメチル化状態を検出することを含む。一実施形態では、本方法は、図16A、図16B、表3、または表5に記載される1つ以上の遺伝子の発現を検出することをさらに含む。
別の態様では、癌の予後を提供するための方法が提供される。本方法は、(a)癌と診断された、または癌の治療を受けている対象からのサンプルにおける1つ以上の核酸配列のメチル化状態を、癌細胞の1つ以上の核酸配列のメチル化状態と比較することと、(b)(i)(a)のメチル化状態における、非癌性であることが分かっているサンプル由来のゲノムの対応する複数の核酸配列のメチル化状態からの偏差を検出することと、(ii)非癌性サンプルと比較して、サンプルにおけるメチル化の分散の増加を検出することと、(iii)少なくとも25個の核酸が解析される統計解析を行うことによって、メチル化分散スコアを決定することとを含む、(a)のメチル化状態を使用して、メチル化抗プロファイルを特定することと、(c)(b)の抗プロファイルを予後と相関させ、それによって対象における癌の予後を提供することとを含む。一実施形態では、1つ以上の核酸配列は、表6、表7、表16、または表17に記載される核酸配列からなる群より選択され、それによって癌の予後を提供する。一実施形態では、本方法は、図16A、図16B、表3、または表5に記載される1つ以上の遺伝子の発現を検出することをさらに含む。
別の態様では、メチル化境界の移動または損失の検出を利用することにより、対象において癌を診断する方法が提供される。本方法は、(i)非癌性生体サンプルからの複数のゲノム核酸配列、および対象からの試験サンプルにおける対応する複数のゲノム核酸配列のメチル化状態を決定することと、(ii)試験サンプルのメチル化状態における、非癌性サンプルのメチル化状態からの偏差を検出することとを含み、メチル化状態の偏差が、非癌性生体サンプルからの対応する複数の核酸配列と比較して、試験サンプルにおける複数の核酸配列のうちの1つ以上におけるメチル化境界の移動または損失を含み、それによって対象における癌を診断する。一実施形態では、複数の核酸配列は、表6、表7、表16、または表17に記載されるものから選択される。様々な実施形態では、偏差は、少なくとも約10個、15個、25個、50個、100個、または1000個の核酸配列において検出される。
別の態様では、メチル化境界の移動または損失の検出を利用することにより、対象における癌の予後を提供するための方法が提供される。本方法は、(a)癌と診断された、または癌の治療を受けている対象からのサンプルにおいて複数の核酸配列のメチル化状態を検出することと、(b)非癌性であることが分かっているサンプルからのゲノムの対応する複数の核酸配列と比較して、(a)のメチル化状態の偏差を検出することであって、メチル化状態の偏差が、非癌性であることが分かっているサンプルからの対応する複数の核酸配列と比較して、癌と診断された、または癌の治療を受けている対象からのサンプルにおいて複数の核酸配列のメチル化境界の移動または損失を含む、前記検出することと、(c)(b)の偏差を予後と相関させ、それによって対象における癌の予後を提供することとを含む。一実施形態では、複数の核酸配列は、表6、表7、表16、または表17に記載されるものから選択される。様々な実施形態では、偏差は、少なくとも約10個、15個、25個、50個、100個、または1000個の核酸配列において検出される。
別の態様では、低メチル化ゲノムブロック領域の検出を利用することにより、対象における癌を診断する方法が提供される。本方法は、(i)非癌性生体サンプルからの複数のゲノム核酸配列、および対象からの試験サンプルの対応する複数のゲノム核酸配列のメチル化状態を決定することと、(ii)試験サンプルのメチル化状態における、非癌性サンプルのメチル化状態からの偏差を検出することとを含み、メチル化状態の偏差が、非癌性生体サンプルからの対応する複数の核酸配列と比較して、試験サンプルにおいて複数の核酸配列の低メチル化の増加を含み、複数の核酸配列が、表6[ゲノムブロック配列]に記載されるものから選択され、それによって対象における癌を診断する。様々な実施形態では、偏差は、少なくとも約10個、15個、25個、50個、100個、または1000個の核酸配列において検出される。
別の態様では、低メチル化ゲノムブロック領域の検出を利用することにより、対象における癌の予後を提供するための方法が提供される。本方法は、(a)癌と診断された、または癌の治療を受けている対象からのサンプルにおいて複数の核酸配列のメチル化状態を検出することと、(b)非癌性であることが分かっているサンプルからのゲノムの対応する複数の核酸配列と比較して、(a)のメチル化状態の偏差を検出することであって、メチル化状態の偏差が、非癌性であることが分かっているサンプルからの対応する複数の核酸配列と比較して、対象からのサンプルにおいて複数の核酸配列の低メチル化の増加を含み、複数の核酸配列が表6[ゲノムブロック配列]に記載されるものから選択される、前記検出することと、(c)(b)の偏差を予後と相関させ、それによって対象における癌の予後を提供することとを含む。様々な実施形態では、偏差は、少なくとも約10個、15個、25個、50個、100個、または1000個の核酸配列において検出される。
別の態様では、複数の核酸配列が提供される。核酸配列は、表17に記載される癌特異的差次的メチル化領域(cDMR)から選択される核酸配列と選択的にハイブリダイズすることができ、cDMRは癌において確率的にメチル化される。一実施形態では、それぞれの核酸配列の長さは、約10〜55塩基対である。
別の態様では、本明細書に記載される複数の核酸配列を含むマイクロアレイが提供される。
別の態様では、細胞から単離されたゲノムDNAのメチル化解析を行う方法。本方法は、本明細書に記載されるマイクロアレイを使用して、細胞から単離された、標識されかつ消化されたゲノムDNAのサンプルに対して相対的メチル化に関する包括的な高処理アレイ(CHARM)解析を行い、それによってメチル化解析を行うことを含む。
別の態様では、対象の治療レジメンを決定する方法が提供される。本方法は、(a)決定されたメチル化プロファイルを解析することと、(b)解析に基づき適切な治療レジメンを決定し、それによって対象の治療レジメンを決定することとを含む。
[本発明1001]
(a)対象からのサンプルにおける抗プロファイルを特定すること
を含む、対象における癌を診断する方法であって、
前記特定することが、
(i)非癌性生体サンプルからの複数のゲノム核酸配列、および前記対象からの試験サンプルにおける対応する複数のゲノム核酸配列のメチル化状態を決定することと、
(ii)前記試験サンプルのメチル化状態における、前記非癌性サンプルの前記メチル化状態からの偏差を検出することと、
(iii)前記非癌性サンプルと比較して、前記試験サンプルにおけるメチル化の分散の増加を検出することと、
(iv)少なくとも25個の核酸が解析される統計解析を行うことによって、メチル化分散スコアを決定し、それによって前記対象における癌を診断することと
を含む、方法。
[本発明1002]
前記複数の核酸配列が、表6、表7、表16、または表17に記載されるものから選択される、本発明1001の方法。
[本発明1003]
前記複数の核酸配列が、表6に記載される低メチル化ゲノムブロックからなる群より選択される低メチル化ゲノムブロックである、本発明1001の方法。
[本発明1004]
前記複数の核酸配列が、表7に記載される小差次的メチル化領域(sDMR)である、本発明1001の方法。
[本発明1005]
前記sDMRが、前記非癌性生体サンプルにおける対応する領域のメチル化と比較して、sDMRのCpGアイランドにおけるメチル化の増加、およびCpGアイランドから最大約2kbの距離[隣接するショアを定義する]の核酸配列におけるメチル化の減少を含むメチル化境界の損失である、本発明1004の方法。
[本発明1006]
前記sDMRが、前記非癌性生体サンプルにおける対応する領域と比較して、類似するメチル化レベルを含むメチル化境界の移動である、本発明1004の方法。
[本発明1007]
前記sDMRが、前記非癌性生体サンプルにおける対応する領域と比較して、メチル化レベルの増加を含む、本発明1004の方法。
[本発明1008]
メチル化分散スコアの決定が、主成分分析、統計F検定、またはそれらの組み合わせを行うことを含む、本発明1001の方法。
[本発明1009]
前記複数の核酸配列が、少なくとも約50個の核酸配列を含む、本発明1002の方法。
[本発明1010]
前記複数の核酸配列が、少なくとも約100個の核酸配列を含む、本発明1002の方法。
[本発明1011]
前記複数の核酸配列が、少なくとも約1000個の核酸配列を含む、本発明1002の方法。
[本発明1012]
前記複数の核酸配列が、表16または表17に記載される差次的メチル化領域(DMR)からなる群より選択される、本発明1002の方法。
[本発明1013]
前記複数の核酸配列が、遺伝子のプロモータ領域の外側および/またはCpGアイランドの外側に位置する、本発明1001の方法。
[本発明1014]
前記メチル化状態が、高メチル化または高メチル化である、本発明1001の方法。
[本発明1015]
前記非癌性生体サンプルにおける前記対応する複数の核酸配列と比較して、前記複数の核酸配列のうちの1つ以上においてメチル化境界の移動または損失を検出することをさらに含む、本発明1002の方法。
[本発明1016]
前記癌が、結腸直腸癌、食道癌、胃癌、白血病/リンパ腫、肺癌、前立腺癌、子宮癌、乳癌、皮膚癌、内分泌癌、泌尿器癌、肝臓癌、甲状腺癌、腎臓癌、膵臓癌、他の胃腸癌、卵巣癌、子宮頸癌、頭部癌、頸部癌、および腺腫からなる群より選択される、本発明1001の方法。
[本発明1017]
前記メチル化状態の決定が、核酸増幅、ポリメラーゼ連鎖反応(PCR)、メチル化特異的PCR、亜硫酸水素塩ピロシーケンス、1本鎖高次構造多型(SSCP)分析、限定解析、およびマイクロアレイ技術からなる群より選択される1つ以上の技術によって行われる、本発明1001の方法。
[本発明1018]
図16A、図16B、表14、または表15に記載される1つ以上の遺伝子の発現を検出することをさらに含む、本発明1001の方法。
[本発明1019]
前記1つ以上の遺伝子が、非癌性であることが分かっているサンプルからの1つ以上の対応する遺伝子の発現と比較して、過剰発現している、本発明1018の方法。
[本発明1020]
前記1つ以上の遺伝子が、非癌性であることが分かっているサンプルからの1つ以上の対応する遺伝子の発現と比較して、差次的発現している、本発明1018の方法。
[本発明1021]
メチル化抗プロファイルを特定するために、対象からのサンプルのゲノムDNAの複数の核酸配列のメチル化解析を行うことを含む、対象における癌または癌のリスクを検出するための方法であって、
前記メチル化抗プロファイルの特定が、
(a)前記ゲノムの前記複数の核酸配列のメチル化状態における、正常なサンプルのゲノムの対応する複数の核酸配列のメチル化状態からの偏差を検出すること、
(b)非癌性サンプルと比較して、前記サンプルにおけるメチル化の分散の増加を検出すること、および
(c)少なくとも25個の核酸が解析される統計解析を行うことによって、メチル化分散スコアを決定し、それによって前記対象における癌をまたは癌のリスクを検出すること
を含む、方法。
[本発明1022]
前記複数の核酸配列が、表6、表7、表16、または表17に記載されるものから選択される、本発明1021の方法。
[本発明1023]
前記複数の核酸配列が、表6に記載される低メチル化ゲノムブロックからなる群より選択される低メチル化ゲノムブロックである、本発明1021の方法。
[本発明1024]
前記複数の核酸配列が、表7に記載される小差次的メチル化領域(sDMR)である、本発明1021の方法。
[本発明1025]
前記sDMRが、前記非癌性生体サンプルにおける対応する領域のメチル化と比較して、sDMRのCpGアイランドにおけるメチル化の増加、およびCpGアイランドから最大約2kbの距離[隣接するショアを定義する]の核酸配列におけるメチル化の減少を含むメチル化境界の損失である、本発明1024の方法。
[本発明1026]
前記sDMRが、前記非癌性生体サンプルにおける対応する領域と比較して、類似するメチル化レベルを含むメチル化境界の移動である、本発明1024の方法。
[本発明1027]
前記sDMRが、前記非癌性生体サンプルにおける対応する領域と比較して、メチル化レベルの増加を含む、本発明1024の方法。
[本発明1028]
メチル化分散スコアの決定が、主成分分析、統計F検定、またはそれらの組み合わせを行うことを含む、本発明1021の方法。
[本発明1029]
前記複数の核酸配列が、少なくとも50個の核酸配列を含む、本発明1022の方法。
[本発明1030]
前記複数の核酸配列が、少なくとも100個の核酸配列を含む、本発明1022の方法。
[本発明1031]
前記複数の核酸配列が、少なくとも1000個の核酸配列を含む、本発明1022の方法。
[本発明1032]
前記複数の核酸配列が、表16または表17に記載される差次的メチル化領域(DMR)からなる群より選択される、本発明1022の方法。
[本発明1033]
前記複数の核酸配列が、遺伝子のプロモータ領域の外側およびCpGアイランドの外側に位置する、本発明1021の方法。
[本発明1034]
前記メチル化状態が、高メチル化または低メチル化である、本発明1021の方法。
[本発明1035]
前記非癌性生体サンプルにおける前記対応する複数の核酸配列と比較して、前記複数の核酸配列のうちの1つ以上においてメチル化境界の移動または損失を検出することをさらに含む、本発明1022の方法。
[本発明1036]
前記癌が、結腸直腸癌、食道癌、胃癌、白血病/リンパ腫、肺癌、前立腺癌、子宮癌、乳癌、皮膚癌、内分泌癌、泌尿器癌、肝臓癌、甲状腺癌、腎臓癌、膵臓癌、他の胃腸癌、卵巣癌、子宮頸癌、頭部癌、頸部癌、および腺腫からなる群より選択される、本発明1021の方法。
[本発明1037]
前記メチル化状態の決定が、核酸増幅、ポリメラーゼ連鎖反応(PCR)、メチル化特異的PCR、亜硫酸水素塩ピロシーケンス、1本鎖高次構造多型(SSCP)分析、限定解析、およびマイクロアレイ技術からなる群より選択される1つ以上の技術によって行われる、本発明1021の方法。
[本発明1038]
図16A、図16B、表14、または表15に記載される1つ以上の遺伝子の発現を検出することをさらに含む、本発明1021の方法。
[本発明1039]
前記1つ以上の遺伝子が、非癌性であることが分かっているサンプルからの1つ以上の対応する遺伝子の発現と比較して、過剰発現している、本発明1038の方法。
[本発明1040]
前記1つ以上の遺伝子が、非癌性であることが分かっているサンプルからの1つ以上の対応する遺伝子の発現と比較して、差次的発現している、本発明1038の方法。
[本発明1041]
対象における癌の予後を提供する方法であって、
(a)癌と診断された、または癌の治療を受けている対象からのサンプルにおいて、複数の核酸配列のメチル化状態を検出すること、
(b)(a)のメチル化状態を使用して、メチル化抗プロファイルを特定することであって、
(i)(a)のメチル化状態における、非癌性であることが分かっているサンプル由来のゲノムの対応する複数の核酸配列のメチル化状態からの偏差を検出することと、
(ii)非癌性サンプルと比較して、前記サンプルにおけるメチル化の分散の増加を検出することと、
(iii)少なくとも25個の核酸が解析される統計解析を行うことによって、メチル化分散スコアを決定することと
を含む、前記特定すること、および
(c)(b)の抗プロファイルを予後と相関させ、それによって前記対象における癌の予後を提供すること
を含む、方法。
[本発明1042]
前記複数の核酸配列が、表6、表7、表16、または表17に記載されるものから選択される、本発明1041の方法。
[本発明1043]
メチル化分散スコアの決定が、主成分分析、統計F検定、またはそれらの組み合わせを行うことを含む、本発明1041の方法。
[本発明1044]
前記複数の核酸配列が、少なくとも約50個の核酸配列を含む、本発明1042の方法。
[本発明1045]
前記複数の核酸配列が、少なくとも約100個の核酸配列を含む、本発明1042の方法。
[本発明1046]
前記メチル化状態が、高メチル化または低メチル化である、本発明1041の方法。
[本発明1047]
前記非癌性生体サンプルにおける前記対応する複数の核酸配列と比較して、前記複数の核酸配列のうちの1つ以上においてメチル化境界の移動または損失を検出することをさらに含む、本発明1042の方法。
[本発明1048]
前記癌が、結腸直腸癌、食道癌、胃癌、白血病/リンパ腫、肺癌、前立腺癌、子宮癌、乳癌、皮膚癌、内分泌癌、泌尿器癌、肝臓癌、甲状腺癌、腎臓癌(ウィルムス)、膵臓癌、他の胃腸癌、卵巣癌、子宮頸癌、頭部癌、頸部癌、および腺腫からなる群より選択される、本発明1041の方法。
[本発明1049]
前記メチル化状態の決定が、核酸増幅、ポリメラーゼ連鎖反応(PCR)、メチル化特異的PCR、亜硫酸水素塩ピロシーケンス、1本鎖高次構造多型(SSCP)分析、限定解析、およびマイクロアレイ技術からなる群より選択される1つ以上の技術によって行われる、本発明1041の方法。
[本発明1050]
図16A、図16B、表14、または表15に記載される1つ以上の遺伝子の発現を検出することをさらに含む、本発明1041の方法。
[本発明1051]
特定された前記抗プロファイルに基づき、化学療法レジメンに対する臨床応答を予測することをさらに含む、本発明1041の方法。
[本発明1052]
前記臨床応答が、腫瘍退縮の可能性の増加であるか、全体的な生存率を増加させるか、または無病生存率の増加である、本発明1050の方法。
[本発明1053]
表17に記載される癌特異的差次的メチル化領域(cDMR)からなる群より選択される核酸配列と選択的にハイブリダイズする複数の核酸配列。
[本発明1054]
それぞれの核酸配列の長さが、約10〜55塩基対である、本発明1053の複数の核酸配列。
[本発明1055]
それぞれの核酸配列の長さが、約25〜35塩基対である、本発明1053の複数の核酸配列。
[本発明1056]
それぞれの核酸配列の長さが、約35〜45塩基対である、本発明1053の複数の核酸配列。
[本発明1057]
それぞれの核酸配列の長さが、約45〜55塩基対である、本発明1053の複数の核酸配列。
[本発明1058]
本発明1053の複数の配列を含む、マイクロアレイ。
[本発明1059]
細胞から単離されたゲノムDNAのメチル化解析を行う方法であって、
本発明1053のマイクロアレイを使用して前記細胞から単離された、標識されかつ消化されたゲノムDNAのサンプルに対して相対的メチル化に関する包括的な高処理アレイ(CHARM)解析を行い、それによってメチル化解析を行うことを含む、方法。
[本発明1060]
前記複数の核酸配列のメチル化データを解析するために、主成分分析を行うことをさらに含む、本発明1059の方法。
[本発明1061]
(a)表6、表7、または表16に記載されるものから選択される複数のゲノム核酸配列のメチル化状態を決定すること、および
(b)前記メチル化状態における、非癌性であることが分かっているサンプル由来のゲノムの対応する複数の核酸配列のメチル化状態からの偏差を検出することにより、前記メチル化状態を使用して、癌を示すメチル化抗プロファイルを特定すること
をさらに含む、本発明1059の方法。
[本発明1062]
(a)本発明1061の抗プロファイルを解析すること、および
(b)(a)の解析に基づき治療レジメンを決定し、それによって前記対象の治療レジメンを決定すること
を含む、対象の治療レジメンを決定する方法。
[本発明1063]
前記抗プロファイルを前記対象の既知の抗プロファイルと比較することをさらに含む、本発明1062の方法。
[本発明1064]
(i)非癌性生体サンプルからの複数のゲノム核酸配列、および対象からの試験サンプルにおける対応する複数のゲノム核酸配列のメチル化状態を決定すること、ならびに
(ii)前記試験サンプルの前記メチル化状態における、前記非癌性サンプルの前記メチル化状態からの偏差を検出すること
を含む、対象における癌を診断する方法であって、
前記メチル化状態の前記偏差が、前記非癌性生体サンプルからの前記対応する複数の核酸配列と比較して、前記試験サンプルの前記複数の核酸配列のうちの1つ以上においてメチル化境界の移動または損失を含み、それによって前記対象における癌を診断する、方法。
[本発明1065]
前記複数の核酸配列が、表6、表7、表16、または表17に記載されるものから選択される、本発明1064の方法。
[本発明1066]
前記複数の核酸配列が、少なくとも約10個の核酸配列を含む、本発明1064の方法。
[本発明1067]
前記複数の核酸配列が、少なくとも約25個の核酸配列を含む、本発明1064の方法。
[本発明1068]
前記複数の核酸配列が、少なくとも約50個の核酸配列を含む、本発明1064の方法。
[本発明1069]
(a)癌と診断された、または癌の治療を受けている対象からのサンプルにおいて、複数の核酸配列のメチル化状態を検出すること、
(b)非癌性であることが分かっているサンプル由来のゲノムの対応する複数の核酸配列と比較して、(a)のメチル化状態の偏差を検出することであって、
前記メチル化状態の前記偏差が、非癌性であることが分かっている前記サンプルからの前記対応する複数の核酸配列と比較して、癌と診断された、または癌の治療を受けている前記対象からの前記サンプルにおいて、前記複数の核酸配列のメチル化境界の移動または損失を含む、前記検出すること、および
(c)(b)の偏差を予後と相関させ、それによって前記対象における癌の予後を提供すること
を含む、対象における癌の予後を提供する方法。
[本発明1070]
前記複数の核酸配列が、表6、表7、表16、または表17に記載されるものから選択される、本発明1069の方法。
[本発明1071]
前記複数の核酸配列が、少なくとも約10個の核酸配列を含む、本発明1069の方法。
[本発明1072]
前記複数の核酸配列が、少なくとも約25個の核酸配列を含む、本発明1069の方法。
[本発明1073]
前記複数の核酸配列が、少なくとも約50個の核酸配列を含む、本発明1069の方法。
[本発明1074]
(i)非癌性生体サンプルからの複数のゲノム核酸配列、および対象からの試験サンプルにおける対応する複数のゲノム核酸配列のメチル化状態を決定すること、ならびに
(ii)前記試験サンプルの前記メチル化状態における、前記非癌性サンプルの前記メチル化状態からの偏差を検出すること
を含む、対象における癌を診断する方法であって、
前記メチル化状態の前記偏差が、非癌性生体サンプルからの前記対応する複数の核酸配列と比較して、前記試験サンプルの前記複数の核酸配列において低メチル化の増加を含み、かつ前記複数の核酸配列が、表6[ゲノムブロック配列]に記載されるものから選択され、それによって前記対象における癌を診断する、方法。
[本発明1075]
前記複数の核酸配列が、少なくとも約10個の核酸配列を含む、本発明1074の方法。
[本発明1076]
前記複数の核酸配列が、少なくとも約25個の核酸配列を含む、本発明1074の方法。
[本発明1077]
前記複数の核酸配列が、少なくとも約50個の核酸配列を含む、本発明1074の方法。
[本発明1078]
(a)癌と診断された、または癌の治療を受けている対象からのサンプルにおいて、複数の核酸配列のメチル化状態を検出すること、
(b)非癌性であることが分かっているサンプルからのゲノムの対応する複数の核酸配列と比較して、(a)のメチル化状態の偏差を検出することであって、
前記メチル化状態の前記偏差が、非癌性であることが分かっている前記サンプルからの前記対応する複数の核酸配列と比較して、前記対象からの前記サンプルにおいて、前記複数の核酸配列の低メチル化の増加を含み、かつ前記複数の核酸配列が、表6[ゲノムブロック配列]に記載されるものから選択される、前記検出すること、および
(c)(b)の偏差を予後と相関させ、それによって前記対象における癌の予後を提供すること
を含む、対象における癌の予後を提供する方法。
[本発明1079]
前記複数の核酸配列が、少なくとも約10個の核酸配列を含む、本発明1078の方法。
[本発明1080]
前記複数の核酸配列が、少なくとも約25個の核酸配列を含む、本発明1078の方法。
[本発明1081]
前記複数の核酸配列が、少なくとも約50個の核酸配列を含む、本発明1078の方法。
亜硫酸水素塩配列決定から得た読み取り値およびアライメントの数のグラフィカルプロットである。 推定された非メチル化シトシン変換率のグラフィカルプロットである。 メチル化の証拠となる亜硫酸水素塩読み取り位置バイアスのグラフィカル表示である。 高周波数の平滑化により得たメチル化推定値のグラフィカル表示である。 メチル化パターンの一連のグラフィカル表示である。図5(a)は、正常なサンプル3つ(中央ボックスの上の線3本)、および一致する癌(中央ボックスの下の線3本)の解析を表す。 ヒトの癌の種類にわたって共通のCpG部位のメチル化の分散の一連のグラフィカルプロットである。図6(a)は、結腸癌における共通のCpG部位のメチル化の分散をプロットする。図6(b)は、結腸癌における共通のCpG部位のメチル化の分散をプロットする。図6(b)は、肺癌における共通のCpG部位のメチル化の分散をプロットする。図6(c)は、乳癌における共通のCpG部位のメチル化の分散をプロットする。図6(d)は、甲状腺癌における共通のCpG部位のメチル化の分散をプロットする。図6(e)は、腎臓(ウィルムス)癌における共通のCpG部位のメチル化の分散をプロットする。図6(f)は、組織の種類を明確に区別するCpGに関するメチル化値のヒートマップである。 正常なサンプルおよび癌サンプルに関するゲノム位置に対してプロットされたメチル化の推定値の一連のグラフィカルプロットである。小DMR位置は網掛けされる。灰色の棒は、ブロック、CpGアイランド、および遺伝子エクソンの位置を示す。下の軸線に沿ったチェックマークはCpGの位置を示す。図7(a)は、外向きに移動したメチル化境界のグラフィカルプロットである(正常−網掛け領域の上の線、癌−網掛け領域の下の線)。図7(b)は、内向きに移動したメチル化境界のグラフィカルプロットである(癌−網掛け領域の上の線、正常−網掛け領域の下の線)。図7(c)は、メチル化境界の損失のグラフィカルプロットである(癌−網掛け領域の上の線、正常−網掛け領域の下の線)。図7(d)は、新規低メチル化DMRのグラフィカルプロットである(正常−網掛け領域の上の線、癌−網掛け領域の下の線)。 (a)メチル化の相違、(b)コピー数の変化、および(c)コピー数の相違に対してプロットされたメチル化の相違の一連のグラフィカルプロットである。 ユークリッド距離を使用したメチル化プロファイルの一連のクラスタである。図9(a)は、正常な組織および結腸組織のクラスタ化である。 ユークリッド距離を使用したメチル化プロファイルの一連のクラスタである。図9(b)は、正常な組織および肺組織のクラスタ化である。 ユークリッド距離を使用したメチル化プロファイルの一連のクラスタである。図9(c)は、正常な組織および乳房組織のクラスタ化である。 ユークリッド距離を使用したメチル化プロファイルの一連のクラスタである。図9(d)は、正常な組織および甲状腺組織のクラスタ化である。 ユークリッド距離を使用したメチル化プロファイルの一連のクラスタである。図9(e)は、正常な組織および腎臓(ウィルムス)組織のクラスタ化である。 一連のグラフィカル表示である。図10(a)は、癌サンプルおよび正常なサンプルに関する亜硫酸水素塩配列決定データからの平滑化したメチル化値のプロットである。図10(b)は、癌サンプルおよび正常なサンプルに関する亜硫酸水素塩配列決定データからの平滑化したメチル化値である。図10(c)は、正常なサンプル対癌サンプルに関するメチル化値の分布のプロットである。図10(d)は、正常なサンプルおよび癌サンプルに関するブロック内(実線)およびブロックの外側(破線)のメチル化値の分布のプロットである。図10(e)は、反復DNAおよびブロックに含まれることによって層別化される癌サンプルと正常なサンプルとの間のメチル化の相違の分布のプロットである。 反復ファミリーおよびブロックに含まれることによって層別化される癌サンプルと正常なサンプルとの間のメチル化の相違の分布の一連のグラフィカルプロットである。 (a)正常なサンプルおよび(b)癌サンプルにおけるメチル化の測定に関してCHARMマイクロアレイデータと亜硫酸水素塩配列決定を比較した一連のグラフィカルプロットである。 一連のグラフィカルプロットである。図12(a)は、特注のアレイ上でアッセイされたメチル化レベルから導かれたペアワイズ距離の多次元尺度である。図13(b)は、亜硫酸水素塩配列決定を介して特定されたブロックにおける平均メチル化値から導かれたペアワイズ距離の多次元尺度である。図13(c)は、正常なサンプル、癌サンプル、および2つの腺腫サンプルに関するメチル化値のプロットである。 小DMR付近のメチル化における平均的な相違に対してプロットされた、GEOデータセットGSE8671から得た平均log遺伝子発現のグラフィカルプロットである。 正常なサンプル対癌サンプルのそれぞれのブロックに関するメチル化レベルの相互サンプル標準偏差のグラフィカルプロットである。平均メチル化レベルは、高周波数平滑化SOLiD(商標)亜硫酸水素塩配列決定データを使用して、それぞれのブロックに関して計算された。実線は識別線であり、この線より上のCpGは癌においてより大きい変動を有する。 一連のグラフィカルプロットである。図16(a)は、ゲノム位置に対してプロットされた、低メチル化ブロック位置が強調される(網掛け)癌サンプルおよび正常なサンプルに関するメチル化値のプロットである。図16(b)は、低メチル化ブロック領域内に位置する癌における、26個の超可変遺伝子に関する標準化したlog発現値をプロットする。 低メチル化ブロック領域内に位置する癌における、26個の超可変遺伝子に関する標準化したlog発現値のグラフィカルプロットである。
発明の詳細な説明
本発明は、エピジェネティックドメインの安定性の全般的な損失が様々な癌の種類にわたる特性であると決定された発見に基づく。癌エピジェネティックスに対する異なった、より一般的なアプローチは、本明細書において、一部、ショアと呼ばれるアイランド付近の低シトシン密度CpG領域の結腸癌における頻繁なメチル化変化についての近年の観察、ならびにこれらの癌特異的差次的メチル化領域(cDMR)が正常な脾臓、肝臓、および脳の間でDNAメチル化変動または組織特異的DMR(tDMR)を示す同じ領域に大部分が対応するという観察に基づき論じられる。さらに、これらの同じcDMRは、誘発された多能性幹(iPS)細胞の幹細胞リプログラミング中に差次的にメチル化された領域の間で高度に濃縮される。よって、それらは正常な組織分化に関与するが、少なくとも1つの癌の種類(結腸)において異常なメチル化を示すため、全く同じ部位は全般的cDMRであり得ると判断された。
本組成物および方法を説明する前に、本発明は、記載される特定の組成物、方法、および実験条件に制限されないことが理解され、そのような組成物、方法、および条件は変動し得る。本発明の範囲は添付の特許請求の範囲によってのみ限定されるため、本明細書で使用される用語は、単に特定の実施形態を説明する目的のためであり、制限することが意図されないことも理解する。
本明細書および添付の特許請求の範囲で使用される、単数形「a」、「an」、および「the」は、特に内容が明確に記載しない限り複数の参照を含む。よって、例えば「本方法」に対する参照は、本開示を読んだときに当業者に明らかになるであろう1つ以上の方法、および/または本明細書に記載される種類の工程などを含む。
特に定義されない限り、本明細書で使用される全ての技術的および科学的用語は、本発明が属する当業者によって一般的に理解されるのと同じ意味を有する。本明細書に記載されるものと類似するまたは同等の任意の方法および材料が本発明の実践または試験で使用することができるが、ここでは好ましい方法および材料が記載される。
結腸癌にわたって一貫して変化したcDMRのメチル化解析用の半定量的な特注のアレイを設計し、結腸、乳房、肺、甲状腺、およびウィルムス腫瘍からの一致する正常および癌を含む290のサンプルにおいてこれらの部位を解析することによって、仮説が試験された。以下に説明されるように、ほぼ全てのcDMRが試験をした全ての癌にわたって変更されたことが意外にも分かった。具体的には、cDMRはメチル化レベルにおいて確率的変動の増加を表すように思われ、癌エピゲノムの一体性の全般的な破壊を示唆する。この考えをさらに検証するために、3つの結腸直腸癌、一致する正常な結腸粘膜、および2つの腺腫性ポリープのゲノムスケールの亜硫酸水素塩配列決定が行われた。これらの実験は、CpGアイランドとショアの両方、ならびにゲノムの半分超に影響を及ぼす低メチル化の大型(最大数メガベース)ブロックを伴う結腸癌におけるメチル化の安定性の意外な損失を明らかにし、遺伝子発現において確率的変動が付随する。
そのようなものとして、一態様では、対象における癌または癌のリスクを検出する方法が提供される。本方法は、対象からのサンプルを含有する核酸由来のゲノムのメチル化状態を検出することを含み、ゲノムの少なくとも50%以上の低メチル化または高メチル化は、癌または癌のリスクを示し、それによって癌またはそのリスクを検出する。
一実施形態では、ゲノムの少なくとも50%以上の低メチル化は癌を示す。例えば、少なくとも50、55、60、65、70、75、80、85、90、95以上の低メチル化は癌を示す。
様々な実施形態では、表16または表17に記載される差次的メチル化領域(DMR)から選択される1つ以上の核酸配列のメチル化状態が決定され、前記1つ以上の核酸配列は癌において確率的にメチル化される。別の実施形態では、本方法は、表10に記載される差次的メチル化領域(DMR)から選択される1つ以上の核酸配列のメチル化状態を検出することを含み、前記1つ以上の核酸配列は癌において確率的にメチル化される。一実施形態では、本方法は、表4に記載されるゲノムブロック領域から選択される1つ以上の核酸配列のメチル化状態を検出することを含み、前記1つ以上の核酸配列は癌において確率的にメチル化される。
低メチル化は、メチル化の減少が測定可能であるときに存在する。いくつかの実施形態では、DMRまたはブロックは、解析されたメチル化部位の50%未満がメチル化されないときに低メチル化であると判断され得る。高メチル化は、メチル化の増加が測定可能であるときに存在する。いくつかの実施形態では、DMRまたはブロックは、解析されたメチル化部位の50%超がメチル化されるときに高メチル化であると判断され得る。メチル化状態を決定するための方法は、本明細書に提供され、当該技術分野において既知である。いくつかの実施形態では、メチル化状態はM値に変換される。本明細書で使用されるM値は、総(Cy3)およびMcrBC分画されたDNA(Cy5)からの強度のlog比であり得る。正および負のM値は、それぞれ、メチル化部位および非メチル化部位に定量的に関連する。M値は、実施例に記載されるように計算される。いくつかの実施形態では、−0.5〜0.5の範囲であるM値は、対照プローブによって定義されるように、非メチル化部位を表し、0.5〜1.5の値は、メチル化の基準レベルを表す。
様々な実施形態では、ゲノムは、対照から採取した生体サンプルに存在する。生体サンプルは、実質的にあらゆる生体サンプル、具体的には対象からのRNAまたはDNAを含有するサンプルであり得る。生体サンプルは、約1〜約10,000,000、約1000〜約10,000,000、または約1,000,000〜約10,000,000の体細胞を含有する組織サンプルであり得る。しかしながら、PCR等の増幅プロトコルを利用する実施形態では、少数の細胞、もっと言えば単一細胞を含有するサンプルを得ることが可能である。サンプルは、1つ以上のDMRのメチル化状態を評価するのに十分な生体試料(例えばRNAまたはDNA等のタンパク質または遺伝物質)を含有する限り、任意の無傷細胞を含有する必要はない。
いくつかの実施形態では、生体サンプルまたは組織サンプルは、癌に対して感受性の任意の組織から得ることができる。生体サンプルまたは組織サンプルは、外科手術、生検、スワブ、便、または他の収集方法によって得ることができる。いくつかの実施形態では、サンプルは、血液、血漿、血清、リンパ液、神経細胞含有組織、脳脊髄液、生検材料、腫瘍組織、骨髄、神経組織、皮膚、毛髪、涙、胎児物質、羊水穿刺物質、子宮組織、唾液、糞便、または精子から得られる。特定の実施形態では、本発明の方法の生体サンプルは、例えば結腸直腸組織からのサンプルであり得るか、またはある実施形態では、血液サンプルもしくは末梢血リンパ球(PBL)画分等の血液サンプルの画分であり得る。PBLを全血から単離するための方法は当該技術分野において周知である。加えて、血液サンプルを使用し、例えば当該技術分野に既知の方法を使用して、例えば結腸、乳房、肺、前立腺、頭頸部等の関心の組織から少量の循環細胞を濃縮することが可能である。
上記に開示されるように、生体サンプルは血液サンプルであり得る。血液サンプルは、指穿刺または静脈切開等の当該技術分野において既知の方法を使用して得ることができる。適切には、血液サンプルは、約0.1〜20ml、または代替的に約1〜15mlであり、血液の容量は約10mlである。
一実施形態では、特定される癌のリスクは結腸直腸癌に関してであり、生体サンプルは、結腸、血液、または便サンプルから得た組織サンプルである。別の実施形態では、特定される癌のリスクは胃癌または食道癌に関してであり、組織は、内視鏡生検もしくは吸引、または便サンプルもしくは唾液サンプルによって得ることができる。別の実施形態では、特定される癌のリスクは食道癌であり、組織は、内視鏡生検、吸引、または経口もしくは唾液サンプルによって得られる。別の実施形態では、特定される癌のリスクは白血病/リンパ腫であり、組織サンプルは血液である。別の実施形態では、特定される癌のリスクは乳癌であり、組織は、乳房、血液、または乳頭吸引サンプルによって得られる。別の実施形態では、特定される癌のリスクは乳癌であり、組織は、乳房、血液、乳頭液、または吸引サンプルによって得られる。別の実施形態では、特定される癌のリスクは肺癌であり、組織は、肺、血液、内視鏡生検、または吸引サンプルによって得られる。別の実施形態では、特定される癌のリスクは甲状腺癌であり、組織は、甲状腺、血液、または内視鏡生検サンプルによって得られる。別の実施形態では、特定される癌のリスクは腎臓癌であり、組織は、甲状腺、血液、または内視鏡生検サンプルによって得られる。
本発明では、対象は典型的にはヒトであるが、イヌ、ネコ、ウサギ、ウシ、鳥、ラット、ウマ、ブタ、またはサルを含むがこれらに限定されない任意の哺乳類でもあり得る。
上述のように、本発明のある実施形態では、本方法は定期的な検査の一部として行われる。したがって、これらの方法に関して、対象は癌とは診断されず、典型的にこれらの本実施形態に関して、対象が癌等の過剰増殖性障害を有するかは分からない。
本発明の方法は、対象に関する癌を発症するリスクを特定する。癌は、結腸直腸癌、食道癌、胃癌、白血病/リンパ腫、肺癌、前立腺癌、子宮癌、乳癌、皮膚癌、内分泌癌、泌尿器癌、肝臓癌、甲状腺癌、腎臓癌(ウィルムス)、膵臓癌、他の胃腸癌、卵巣癌、子宮頸癌、頭部癌、頸部癌、および腺腫を含み得るが、これらに限定されない。
過剰増殖性障害は、腹部、骨、乳房、消化器系、肝臓、腎臓、膵臓、腹膜、内分泌腺(副腎、副甲状腺、下垂体、精巣、卵巣、胸腺、甲状腺)、眼、頭頸部、神経(中央および末梢)、リンパ系、骨盤、皮膚、軟組織、脾臓、胸部、および泌尿生殖器に位置する新生物を含むが、これらに限定されない。ある実施形態では、過剰増殖性障害は癌である。
別の実施形態では、本発明は対象の健康を管理するための方法を提供する。本方法は、上述の癌を発症するリスクの増加を特定するための方法を行うことと、従来の癌検出方法を行うこととを含む。例えば、従来の癌検出方法は、癌のリスクを特定するための方法が、対象が癌を発症する高いリスクにあることを示す場合に、行われ得る。多くの従来の癌検出方法は既知であり、本発明の本態様に含まれ得る。従来の癌検出方法は、例えば、胸部X線、癌胎児抗原(CEA)レベル測定、結腸直腸検査、内視鏡検査、MRI、CATスキャン、またはガリウムスキャンおよびバリウム撮像等の他の撮像、ならびにS字結腸鏡検査/大腸内視鏡検査、乳房検査、または前立腺特異的抗原(PSA)アッセイのうちの1つ以上を含み得る。
別の実施形態では、癌の予後を提供するための方法が提供される。本方法は、(a)癌と診断された、または癌の治療を受けている対象からのサンプルにおける1つ以上の核酸配列のメチル化状態を、癌細胞の1つ以上の核酸配列のメチル化状態と比較することと、(b)(a)の比較に基づき予後を決定することとを含み、前記1つ以上の核酸配列は、表4、表10、表16、および表17に記載される核酸配列からなる群より選択され、それによって癌の予後を提供する。一実施形態では、本方法は、図16A、図16B、表3、または表5に記載される1つ以上の遺伝子の発現を検出することをさらに含む。
別の態様では、癌のプロファイルを提供するための方法が提供される。本方法は、(a)対象からの推定癌細胞における1つ以上の核酸配列のメチル化状態を、癌細胞の1つ以上の核酸配列の既知のメチル化状態と比較することと、(b)(a)の比較に基づき推定癌細胞に関するメチル化プロファイルを決定することとを含み、メチル化状態における確率的変動が、推定癌細胞が癌性であることを示し、さらに前記1つ以上の核酸配列が表4、表10、表16、および表17に記載される核酸配列から選択される。一実施形態では、本方法は、図16A、図16B、表3、または表5に記載される1つ以上の遺伝子の発現を検出することをさらに含む。
遺伝子のメチル化状態を解析するための多くの方法が当該技術分野において既知であり、ゲノム領域の低メチル化または高メチル化のいずれかを特定するための本発明の方法に使用され得る。いくつかの実施形態では、メチル化状態の決定は、核酸増幅、ポリメラーゼ連鎖反応(PCR)、メチル化特異的PCR、亜硫酸水素塩ピロシーケンス、1本鎖高次構造多型(SSCP)分析、限定解析、およびマイクロアレイ技術からなる群より選択される1つ以上の技術によって行われる。本明細書の実施例に説明されるように、メチル化の解析は亜硫酸水素塩ゲノム配列決定によって行われ得る。亜硫酸水素塩処理は、メチル化ではなく非メチル化シトシンをウラシルに変換することでDNAを修飾する。亜硫酸水素塩処理は、METHYLEASY亜硫酸水素塩修飾キット(Human Genetic Signatures)を用いて実行することができる。
いくつかの実施形態では、高正確度および再現性で個々に複数の連続するCpG部位を定量的に測定するDNAメチル化の配列決定に基づく解析である亜硫酸水素塩ピロシーケンスが使用され得る。そのような解析用の核酸プライマーまたはプローブは、本明細書に含まれるいずれかの表、または任意の他の既知のゲノム配列に由来し得る。
プライマーによって結合される部位およびプライマーからの伸長の方向により、上に列挙されるプライマーは異なる対で使用され得ることが認識される。さらに、追加のプライマー、特に本明細書に開示されるプライマーに対応するプライマーまたは任意の他の既知のゲノム配列で解析されたものと同じメチル化部位の解析を可能にするプライマーが、表において特定されるゲノム領域内で特定され得ることが認識される。
メチル化の変更は、メチル化において検出可能な相違を特定することによって特定することができる。例えば、低メチル化は、亜硫酸水素塩処理後、ウラシルまたはシトシンが特定の位置で存在するか否かを特定することによって決定することができる。亜硫酸水素塩処理後にウラシルが存在する場合、残基は非メチル化される。低メチル化は、メチル化における減少が測定可能であるときに存在する。
代替的な実施形態では、メチル化を解析するための方法は、DMRまたはブロック等のゲノム領域内のメチル化残基に特異的なプライマー対を用いた増幅を含み得る。これらの実施形態では、プライマーのうちの少なくとも1つの選択的ハイブリダイズまたは結合は、標的DNA配列のメチル化状態に依存する(Herman et al.,Proc.Natl.Acad.Sci.USA,93:9821(1996))。例えば、増幅反応は亜硫酸水素塩処理に先行してもよく、プライマーは亜硫酸水素塩処理に依存する様式で標的配列と選択的にハイブリダイズしてもよい。例えば、1つのプライマーは、標的配列のうちの1つ以上の塩基が亜硫酸水素塩処理によって変更されるときのみ、標的配列に選択的に結合することができ、それによってメチル化された標的配列に特異的である。
アレイに基づくメチル化解析およびサザンブロット解析を含むがこれらに限定されない、メチル化状態を決定するための他の方法が、当該技術分野において既知である。
増幅反応を用いる方法、例えば低メチル化または高メチル化を検出するための上記の方法は、リアルタイム検出増幅手順を利用することができる。例えば、本方法は、分子標識技術(Tyagi S.,et al.,Nature Biotechnology,14:303(1996))またはTaqman(商標)技術(Holland,P.M.,et al.,Proc.Natl.Acad.Sci.USA,88:7276(1991))を利用することができる。
methyl light(Trinh BN,Long TI,Laird PW.MethyLight technology,Methods,25(4):456−62(2001)(参照によりその全体が本明細書に組み込まれる)、Methyl Heavy(Epigenomics,Berlin,Germany)、またはSNuPE(単一ヌクレオチドプライマー伸長法)(例えば、Watson D.,et al.,Genet Res.75(3):269−74(2000)を参照)によるDNAメチル化解析もDMRの変更されたメチル化の特定に関する本発明の方法に使用することができる。
本明細書で使用される、用語「選択的ハイブリダイズ」または「選択的にハイブリダイズする」とは、関連するヌクレオチド配列を非関連ヌクレオチド配列と区別することができる、適度に厳密なまたは高度に厳密な生理学的条件下でのハイブリダイズを指す。
当該技術分野において既知であるように、核酸ハイブリダイズ反応において、特定の厳密性レベルを達成するために使用される条件は、ハイブリダイズされる核酸の性質により変動する。例えば、長さ、相補性の程度、ヌクレオチド配列組成(例えば相対的GC:AT含量)、および核酸の種類、即ちオリゴヌクレオチドまたは標的核酸配列がDNAまたはRNAであるかがハイブリダイズ条件の選択に考慮され得る。加えて、核酸のうちの1つが例えばフィルタ上に固定されるか否かが考慮される。適切な厳密性条件を選択するための方法は、経験的に判断することができるか、または様々な式を用いて推定することができ、当該技術分野において周知である(例えば、Sambrook et al.上記、1989)。
漸進的に高くなる厳密性条件の例は、次の通りである:ほぼ室温で2×SSC/0.1%SDS(ハイブリダイズ条件)、ほぼ室温で0.2×SSC/0.1%SDS(低厳密性条件)、約42℃で0.2×SSC/0.1%SDS(適度な厳密性条件)、および約68℃で0.1×SSC(高厳密性条件)。洗浄はこれらの条件のうちの1つのみ、例えば高厳密性条件を使用して行われるか、または条件のそれぞれが、上に列挙する順番で、例えばそれぞれ10〜15分間使用することができ、列挙する工程のいずれかまたは全てを繰り返すことができる。
評価されるDNAにおけるメチル化の程度は、ゲノムDNAを特定し、それらを区別するプローブによって蛍光インサイチューハイブリダイゼーション(FISH)により測定することができ、異なる程度のDNAメチル化を呈する関連領域が評価される。FISHは、Human chromosomes:principles and techniques(Editors,Ram S.Verma,Arvind Babu Verma,Ram S.)2nd ed.,New York:McGraw−Hill,1995、およびde Capoa A.,Di Leandro M.,Grappelli C.,Menendez F.,Poggesi I.,Giancotti P.,Marotta,M.R.,Spano A.,Rocchi M.,Archidiacono N.,Niveleau A.Computer−assisted analysis of methylation status of individual interphase nuclei in human cultured cells.Cytometry.31:85−92,1998に記載されており、参照により本明細書に組み込まれる。この場合、生体サンプルは、典型的には、短期培養を行うのに十分な全細胞または細胞核を含有するいずれかである。通常、サンプルは、10〜10,000、または例えば100〜10,000の全体細胞を含有する組織サンプルである。
加えて、上記のように、methyl light、methyl heavy、およびアレイに基づくメチル化解析は、後にPCR増幅される亜硫酸水素塩処理されたDNAを使用することにより、非メチル化およびメチル化DNAに対応する様々な形態を有するオリゴヌクレオチド標的配列のマイクロアレイに対して行うことができる。
用語「核酸分子」とは、本明細書においてリン酸ジエステル結合によって一緒に連結されるデオキシリボヌクレオチドまたはリボヌクレオチドの配列を意味するように広く使用される。そのようなものとして、用語「核酸分子」とは、1本鎖または2本鎖であり得るDNAおよびRNAならびにDNA/RNAハイブリッドを含むことを意味する。さらに、本明細書で使用される用語「核酸分子」は、細胞から単離することができる天然に存在する核酸分子、ならびに例えば化学合成の方法によって、またはポリメラーゼ連鎖反応(PCR)等の酵素的方法によって調製され得る合成分子を含み、様々な実施形態では、ヌクレオチド類似体またはリン酸ジエステル結合以外の主鎖結合を含有することができる。
本明細書において、用語「ポリヌクレオチド」および「オリゴヌクレオチド」も核酸分子を指すように使用される。それらの用語を使用することによる、互いとのまたは「核酸分子」との具体的な区別は意図されないが、用語「ポリヌクレオチド」は、一般にポリペプチドまたはそのペプチドタンパク質をコードする核酸分子に関して使用され、一方、用語「オリゴヌクレオチド」は、一般にプローブ、PCRプライマー、アンチセンス分子等として有用なヌクレオチド配列に関して使用される。勿論、「オリゴヌクレオチド」はペプチドもコードすることができることが認識される。そのようなものとして、異なる用語は主として考察の便宜上使用される。
天然に存在するヌクレオチドおよびリン酸ジエステル結合を含むポリヌクレオチドまたはオリゴヌクレオチドは、化学的に合成されるか、またはテンプレートとして適切なポリヌクレオチドを使用して、組み換えDNA方法を使用して生成され得る。比較として、ヌクレオチド類似体またはリン酸ジエステル結合以外の共有結合を含むポリヌクレオチドは、一般に化学的に合成されるが、T7ポリメラーゼ等の酵素は、ある種類のヌクレオチド類似体をポリヌクレオチドの中に組み込むことができ、したがって、適切なテンプレートからそのようなポリヌクレオチドを組み換えにより生成するために使用され得る。
別の態様では、本発明は、本発明の方法を実行するのに有用であるキットを含む。キットに含まれる構成要素は、メチル化を検出する、またはメチル化の程度もしくはメチル化における変化を測定するために使用される特定の解析技法、およびメチル化状態に関して評価される1つ以上のゲノム領域を含むいくつかの因子に依存する。
別の態様では、プライマーまたはプローブとして有用な複数の核酸配列が提供される。核酸配列は、表17に記載される癌特異的差次的メチル化領域(cDMR)から選択される核酸配列と選択的にハイブリダイズすることができ、cDMRは癌において確率的にメチル化される。一実施形態では、それぞれの核酸配列の長さは、約10〜55塩基対である。
ゲノム規模スケールでDNAmを検査するために、遺伝子およびCpG含量に対する位置を含むDNAmについての予測にとらわれないマイクロアレイに基づく方法である包括的な高処理アレイに基づく相対的メチル化(CHARM)解析が実行された。結腸癌において一貫して差次的にメチル化された領域を含む、Irizarryらで特定される、および表14および15に示されるcDMRは、包括的な高処理アレイに基づくメチル化(CHARM)解析によって研究された。プローブは、品質管理測定基準をパスし、CHARMにおいて一貫して相違を示すCpGの周囲に設計された。得られたプローブは、1領域につき1〜7個のプローブを有する139の領域を網羅した。プローブの大部分は、規範的に定義された高CpG密度アイランドの端部から2kb未満として定義されるCpGアイランドショア(66%)にあった。残りのプローブは、CpGアイランドの内側(11%)か>2kb離れる(23%)かのいずれかであった。得られたDNAmの定量的測定値(Mで表される)は、総(Cy3)およびMcrBC分画されたDNA(Cy5)からの強度のlog比である。正および負のM値は、それぞれ、メチル化部位および非メチル化部位に定量的に関連する。CHARMの結果は、定量的亜硫酸水素塩ピロシーケンス解析によっても広く確認された。
そのようなものとして、別の態様では、本明細書に記載される複数の核酸配列を含むマイクロアレイが提供される。さらに、別の態様では、細胞から単離されたゲノムDNAのメチル化解析を行う方法。当該方法は、本明細書に記載されるマイクロアレイを使用して細胞から単離された、標識されかつ消化されたゲノムDNAのサンプルの相対的メチル化に関する包括的な高処理アレイ(CHARM)解析を行い、それによってメチル化解析を行うことを含む。
本明細書において、様々な癌細胞のDNAメチル化のゲノム規模の解析を提供し、いくつかの意外なエピゲノミックの観察を明らかにする。意外にも、結腸癌における全てのメチル化変化の3分の2は、ゲノムの半分超を含む大型ブロックの低メチル化を伴う。癌において最も可変的に発現した遺伝子はブロックにおいて異常に濃縮され、それらは、MMP3、MMP7、およびMMP10の3つのマトリックスメタロプロテイナーゼ遺伝子、ならびにメタロプロテイナーゼを通して腫瘍浸潤を促進するように作用する4つ目のSIM2を含む、腫瘍の不均一性および進行に関連する遺伝子を伴う。別のSTC1は、腫瘍代謝のリプログラミングのワールブルグ効果の媒介を補助する。CHI3L1は、結腸を含む複数の腫瘍の種類において炎症性応答および予後不良に関連する分泌性糖タンパク質をコードする。WISP遺伝子はWnt−1の標的であり、乳癌および結腸癌における組織浸潤の一因であると考えられる。これらの知見により提起される注意点の1つは、非特異的DNAメチル化阻害剤による癌患者の処置が低メチル化ブロックにおける腫瘍促進遺伝子の活性化において意図されない結果を有する可能性があるということである。
以下の実施例は、本発明の利点および特徴をさらに説明するために提供されるが、本発明の範囲を制限することを意図しない。それらは使用することが可能であるものの典型であるが、当業者に既知の他の手順、方法、または技術が代替的に使用され得る。
実施例1
癌の種類にわたるエピジェネティックドメインの安定性の全般的な損失
以下の実験プロトコルおよび材料が利用された。
特注アレイの設計
特注のビーズアレイは、イルミナ(Illumina)プロトコルを使用して良好な設計プローブを設計することができる、Irizarryらにおいて特定された151の最も統計的に有意なcDMRに基づき作製された。IRBにより承認された同意放棄のもと、低温で保存された新しく凍結されたサンプルをCooperative Human Tissue Network(NCI,Bethesda,MD)、National Wilms Tumor Study tissue bank(Edmonton,Alberta,Canada)、およびJohns Hopkins Hospitalから得た。病理学者が全サンプルの分類を個別にかつ盲検的に認証した。サンプルはDNAの精製に使用され、得られたDNAは亜硫酸水素塩処理され、特注のGoldenGateアッセイが行われた。未加工強度データは、分位標準化28を使用して処理され、Leekら29により説明される手順に従いバッチ効果を除外した。分散における相違は標準的なF検定を使用して試験された。
特注メチル化アレイ処理および解析
メチル化および非メチル化DNAを表すCy5およびCy3チャネルからの未加工強度データは別個に分位標準化され、メチル化レベルは両方のチャネルからの強度の合計に対するCy5強度の比として計算された。アレイの品質を管理するために、2つのチャネルからの中央log強度の平均が小さい(<7)、または全体的なメチル化シグナルの中央絶対偏差が小さい(<1.9)アレイはデータセットから除かれた。メチル化変動の相違がF検定を使用して測定され、試験された。平均メチル化レベルの相違は、t検定を使用して測定され、試験された。有意性は0.01と見なされる。
Illumina HumanMethylation27k(商標)アレイ解析
Illumina’s HumanMethylation27K(商標)アレイ(Gene Expression Omnibus受入番号GSE17648)を使用してアッセイされた22の一致する結腸の正常/腫瘍サンプルのメチル化レベルの公的に利用可能なデータセットをダウンロードした。メチル化測定値はさらに処理することなく使用された。メチル化変動の相違は、F検定を使用して測定され、試験された。平均メチル化レベルの相違は、t検定を使用して測定され、試験された。有意性は0.01と見なされる。
全ゲノム亜硫酸水素塩配列決定
亜硫酸水素塩配列決定ライブラリは、Bormann Chungら30により前に説明されるアプローチを使用して調製されたが、いくつかの修正を伴うため全プロトコルをここで詳細に提供する。Covaris E2音波処理器を使用して、5ugのゲノムDNAをせん断した。亜硫酸水素塩変換の効率を監視するために、40ngのAlul消化された非メチル化A DNAをそれぞれのサンプルに添加した。次いで、1×末端部研磨緩衝液(End Polish Buffer)、dATP、dGTP、およびdTTP(dCTPを除く)各400nM、40Uの末端部研磨酵素(End Polishing Enzyme)1(Life Tech)、および80Uの末端部研磨酵素(End Polishing Enzyme)2(Life Tech)を使用して、サンプルのDNAの末端部を修復した。次いで、Bormann Chungらにより詳述されるアダプター配列は、IXT4リガーゼ緩衝液、4.5uMのメチル保護PIアダプター、4.5uMのP2アダプター、および50UのT4リガーゼを使用して、サンプル上に連結された。16℃で1時間、IX Exo−Klenow緩衝液、0.5mMのdNTP含有メチルdCTPおよび20単位のExo−Klenow−Fragment(Ambion)中で、ニックトランスレーションを行った。次いで、追加の変性剤としてホルムアミドを使用して、得られた生成物の500ngのアリコートを亜硫酸水素塩変換した。24uLのホルムアミドを等容量のDNAに添加し、95℃で5分間インキュベートした。その後、100uLのZymo Gold亜硫酸水素塩変換試薬(Zymo)を添加し、混合物を50℃で8時間インキュベートした。次いで、サンプルを脱スルホン化し、EZ−DNA Zymo Methylation−Goldプロトコルに従い、スピンカラムを用いて精製した。5uLの亜硫酸水素塩変換ライブラリをIX PCR緩衝液、0.2mMのdNTP、標準SOLiD(商標)断片ライブラリプライマー各1mM、5UのTaq(Denville)、および0.25UのPfu Turbo Taq(Stratagene)中で増幅した。DNAは8サイクルのPCRを受け、得られた生成物はAMpure(商標)SPRIビーズ(Beckman Genomics)を用いて精製された。次いで、ライブラリをSOLiD(商標)3+プラットホーム上で配列決定し、50塩基対の読み取り値を得た。対応する結腸癌および正常な粘膜サンプルが隣接したフローセルにおいて同時に配列決定された。
亜硫酸水素塩処理されたDNAからのSOLiD(商標)配列決定読み取り値のアライメント
SOLiD(商標)読み取り値用の特注のアライメントツールが亜硫酸水素塩処理されたDNAから開発された。SOLiD(商標)3Plus機器からの読み取り値と連動するように、前に説明されるCpG31におけるメチル化されたシトシンの方向にも、それに対してもバイアスされないが、読み取り値はゲノムの離れたシード(spaced−seed)インデックスの補助によりアライメントされる。アライナは、非メチル化されたC(Tになる)がゲノムにおいてCへのアライメントを受けるときにバイアスを導入することができるが、メチル化されたC(Cに留まる)はアライメントを受けないことに留意する。例えば全てのCpGがアライメント前に参照においてTpGに変換される場合、反対のバイアスも生じ得る。他のプロジェクトは、読み取り値においてさらにCをTに変換することにより、部分的にこれに対処している。しかし、このアプローチは、Cをコードするヌクレオチド位置をアライメント前に正確に決定できないSOLiD(商標)によって生成された色空間(colorspace)読み取り値に適用できない。ここで使用されるアライナはそれぞれの読み取り値をそのままにしておくが、CpGにおいてC対Cの部分アライメントもT対Cの部分アライメントも受けない。
アライメントに関して、BSMAPツールによって取られたアプローチが拡張された。使用されたアプローチは、広範囲の離れたシード設計に対応し、BSMAPアプローチを拡張して、追加のSOLiD(商標)色空間読み取り値のアライメントを可能にする。CおよびTのサブ配列に存在するゲノムCまたはCpGへのそれぞれの明確な割り当てに対してコピーは1つである、インデックスされたそれぞれの参照サブ配列の複数のコピー(潜在的に)を作製し、選別することにより、C/Tのバイアスを回避する。色空間読み取り値に関して、アルゴリズムはサブ配列の色(ヌクレオチドではなく)を抽出し、コピーは抽出されたサブ配列において任意の色によって重複する任意のヌクレオチドに存在するCおよびTのゲノムCへの全ての明確な割り当てに対して作製される。
これらの実験に関して、アライメントアルゴリズムは、CpGのCとアライメントするCまたはTのいずれかに関連するペナルティを取り除き、ゲノムにおいて非CpGのCをTとして処理するように構成される。この手段はCpGメチル化測定値からバイアスを取り除くが、非CpGシトシンのメチル化がほとんどない、またはないと仮定する。非CpGシトシンのメチル化が生じる場合、このアプローチはメチル化されたシトシンに重複するアライメントを見つけることができない可能性が高く、得られる一致はメチル化されたシトシンで抗メチル化バイアスを含有する。
アルゴリズムは、GRCh37ヒトゲノムアセンブリ(ミトコンドリアDNAおよび「定置されていない(unplaced)コンティグ」を含む)+急上昇した\ファージゲノムの配列からなる参照配列収集物に対してSOLiD(商標)3Plus機器を8回実行することにより得た合計77億9千万の読み取り値をアライメントするために使用された。SOLiD(商標)3Plus機器から得たそれぞれの読み取り値は、プライマーヌクレオチド、続いてそれぞれの色がSOLiD(商標)色空間コードスキームによるジヌクレオチドのクラスをコードする50「色」の文字列からなる。アライメントの前に、初期のプライマー塩基および最も5’の色を全ての入力読み取り値から除き、49色の文字列を得た。アライメントの手段は、最大3色が不一致の全てのアライメントが見つかり、4〜6色が不一致の全てではないが一部のアライメントが見つかることが保証されるように選択された。TまたはCのCpGのCへのアライメントは、不一致ペナルティを生じない(配列決定誤差も存在するいくつかの場合を除く)。手段は、一意的にアライメントする読み取り値と非一意的にアライメントする読み取り値を区別するようにも設定された。
色対色のアライメントは、ビタビのようなアルゴリズムによりヌクレオチドアライメントに解読される。ヌクレオチドで発現するとき、最終アライメントは入力読み取り値より文字が1つ短い、即ち、ヌクレオチドの長さは48個である。非一意的にアライメントする読み取り値のアライメントは、後続の段階で無視される。アライメントの結果は表1および図1に要約される。
表1のデータに関して、アライメントは、ミトコンドリアDNAおよび「定置されていない(unplaced)」コンティグを含むGRCh37ヒトゲノムアセンブリ+急上昇したA DNAの配列からなる参照配列の集合体に対して行われた。読み取り値は、アライメント手段による参照に対して厳密に1つの有効なアライメントを有する場合、「一意的」にアライメントすると言われる。読み取り値は、アライメント手段により2つ以上の有効なアライメントを有する場合、「非一意的」にアライメントすると言われる。有効なアライメントが0の場合、読み取り値はアライメント「されない」。シトシン変換率は、メチル化の欠如を示す一意的なAファージアライメントからの高品質の証拠の割合として推定される。
図1はSOLiD(商標)3+亜硫酸水素塩配列決定から得た読み取り値およびアライメントの数を示す。積み重ね棒チャートは、フローセル当りの配列決定された読み取り値の数を図示し、色は一意的な読み取り値、アライメントされなかった読み取り値、および非一意的にアライメントされた読み取り値を示す。合計77億9千万の読み取り値がSOLiD(商標)3+機器を8回(16個のフローセル)実行することにより得られた。
アライメント後、一連のスクリプトを抽出し、一意的なアライメントに存在するCpGメチル化の証拠を要約する。証拠は一式のサンプル毎の染色体毎の証拠表にまとめられる。Aファージゲノムに対するアライメントも別個の表にまとめられる。CpG「証拠」の一部は、アライメントが参照においてCpGのシトシン位置と重複し、アライメントにおいて重複するヌクレオチドがT(メチル化の欠如を示す)またはC(メチル化の存在を示す)のいずれかであるときに作製される。証拠の一部が一旦一意的なアライメントから抽出されたら、フィルタにかけられる。フィルタは元の読み取り値から重複する色のうちの1つまたは両方によって否定されるか、またはヌクレオチドアライメントのいずれかの末端部から4位置以内にあるいずれかの証拠を取り除く。フィルタを通過する全ての証拠はCpG要約表に加えられる。表の記録は、所与のCpGに関して、それとアライメントされたフィルタ処理された証拠ヌクレオチド、それとアライメントされたフィルタ処理された品質値(即ち、証拠ヌクレオチドと重複する2色の)、フィルタ処理された証拠が取られた明確なアライメント位置の数、CpGおよび周囲塩基の「マッピング可能性」(即ち、最大3不一致まで一意的であるCpGと重複する50−merの数)、(e)CpGを囲む塩基の局所CG含量を要約する。それぞれのゲノム位置に関するマッピング可能性基準は、Bowtieを用いて予め計算される。
表2はそれぞれの段階で抽出された証拠の量および種類を要約する。表2に関して、CpG証拠の一部は、アライメントが参照配列においてCpGのシトシン位置と重複し、重複するアライメントヌクレオチドがT(メチル化の欠如を示す)またはC(メチル化の存在を示す)のいずれかであるときに生じる。(a)が元の読み取り値から重複する色のうちの1つまたは両方によって否定されるか、または(b)ヌクレオチドアライメントのいずれかの末端部から4位置以内にあるヌクレオチド証拠を取り除くために、フィルタが適用される。
表3は、それぞれのサンプルのGRCh37ヒトゲノムアセンブリに関して得られたCpG証拠被覆率を要約する。表3に関して、それぞれのサンプルはSOLiD(商標)3+機器の2つのフローセル上で配列決定される。ここで、結果は2つのフローセルから証拠を統合した後に計算される。
最後に、表4はゲノム規模およびCpGシトシンの両方のサンプル毎の平均被覆率を要約する。表4に関して、マッピング可能なCpGシトシン(縦列3)の平均被覆率は、フィルタ処理後CpGシトシンとアライメントするCおよびTヌクレオチド証拠の要素の総数(縦列2)を、実験において「マッピング可能」であるGRCh37におけるCpGジヌクレオチドの総数で割ることにより計算される:2090万。CpGは、少なくとも1つの非曖昧参照の50bp部分文字列によって重複される場合、「マッピング可能」であると考慮される。非曖昧部分文字列は他の50bp参照部分文字列が3不一致以内に存在しないものである。
λゲノムと一意的にアライメントした読み取り値からの証拠は、非メチル化シトシンの亜硫酸水素塩変換率を推定するために使用された。変換率は、メチル化の欠如を示すλファージゲノムと一意的にアライメントする読み取り値からの高品質証拠の割合として推定される。図2および表2の最終縦列は、全てが99.7%〜99.8%の間にある推定値を示す。
図2は、サンプル毎の推定された非メチル化シトシン変換率を示す。亜硫酸水素塩の変換効率はSOLiD(商標)3+フローセル毎にプロットされる。変換効率は、メチル化の欠如を示す非メチル化されたλファージゲノムにおいてCpGシトシンとアライメントする高品質証拠の割合として推定される。
非CpGシトシンメチル化の全体的な有病率を測定するために、ヒト参照ゲノムにおいて非CpGシトシン位置と重複する全てのフィルタ処理されたヌクレオチド証拠を検査した。フィルタ処理されたヌクレオチド証拠は、(a)一意的にアライメントした読み取り値からの、(b)元の読み取り値からの両方の重複する色が解読されたヌクレオチドと一致する、および(c)アライメントのいずれかの末端部から4位置以内のヌクレオチドが除かれる証拠からなる。それぞれの対象に関して、重複するヌクレオチドがTまたはCであるCpGシトシン位置での証拠の全体的な割合。同様のことが非CpGシトシン位置に関して行われた測定された。表5はその結果を要約し、それらをλファージゲノムとアライメントするフィルタ処理された証拠から推定したシトシン非変換率と比較する。
表5に関して、結腸癌サンプルを正常なサンプルと比較して差次的に発現する遺伝子は、低メチル化境界の移動に関連するものとその残りとの2つの群に分けられた。表は統計的に有意な濃縮を有する5つのカテゴリーを示す(FDRO.01)。全ての対象に関して、非CpGシトシンと重複する観察されたCの割合が非変換されたシトシンから予測されたおおよその割合を超えないことが観察された。
図3は、ヒトゲノムと一意的にアライメントした読み取り値からのフィルタ処理された証拠の基本的な正確度を評価するための単純な診断の結果を示す。図3はメチル化の証拠となるSOLiD(商標)3+読み取り位置のバイアスを示す。水平軸線は、5’端からヌクレオチドアライメントへの変化を表す。垂直軸線はメチル化が存在することを示すその変化からのフィルタ処理されたCpGメチル化の証拠の割合を表す。GRCh37ヒトゲノムアセンブリと一意的にアライメントする読み取り値のみが考慮される。
診断は、それぞれのアライメント位置(1〜48)に関して、メチル化が存在することを示すその位置から取られたフィルタ処理された証拠の比率を計算することである。完全なアッセイでは、この比率は位置と無関係であるべきであり、プロットは真っ直ぐな水平線をたどるはずである。実践では、サンプル調製およびアライメントから生じる配列決定誤差および他のノイズにより、線は平坦ではない。サンプルに関して得た線の相対的な平坦度は、得られたシグナルが配列決定誤差等のノイズによって実質的に影響されないというある程度の確信を我々に思わせる。このプロットは全てのアライメント位置における比率を示すが、アライメントの最初の4つと最後の4つの位置からの証拠はさらにフィルタ処理されたことに留意する。
アライメント後、10以下の品質スコアの読み取り値は、メチル化データを平滑化する(次の項)前に除外される。
読み取り値をCpGにマッピングし、それらがメチル化または非メチル化シトシンに関する証拠であったかを決定した。次いで、これらのデータは、0.97、0.96、および0.96の3つの正常なサンプルに関するメチル化の推定値間のペアワイズ相関をもたらした局所尤度アプローチを用いて処理される。
DMRの検出
平滑化アプローチは、隣り合うCpGのメチル化状態がメチル化測定の精度を大幅に向上するように高度に相関される34という事実を利用した、局所尤度推定33に基づき開発された。ブロックに関するものと小DMRに関するものの2つの関連するアプローチが開発された。
前項に記載されるアライメントアルゴリズムは、メチル化の存在を示すフィルタ処理された証拠の要素の数(M)と非メチル化を示すフィルタ処理された証拠の要素の数(U)の、それぞれのCpGの2つの数値を提供した。これら2つの数値の合計は被覆率Nであった。それぞれのCpGに関して、Mは真のメチル化レベルに等しい成功確率pおよびN試行を有する2項分布に従うと仮定された。よって、M/Nは標準誤差(M/N)×(1−M/N)/VNを伴うpの未処理推定値をもたらした。被覆率Nは0〜18,090の範囲であり、サンプル平均は5.8〜6.2(全てのサンプルにおいて被覆率がないCpGを除外した後)であったことに留意する。近位CpGが類似するメチル化レベルを有するという事実を利用し、CHARMで使用されたものと同様の平滑化技法を使用することによって、精度は大幅に向上した。
データは2項式に分布されたため、局所尤度推定が使用された。このアプローチは、ゲノム位置Lでのメチル化レベルp(L)がLの平滑関数である、換言すれば、近いCpGは類似するメチル化レベルを有すると仮定する。局所尤度アプローチは、推定値p(L)までの既定の大きさの枠内のデータ、およびLまでの距離に基づく坪量データ(トリキューブカーネル(tricube kernel)に基づく)を使用する。加えて、2項式モデルは高被覆率を有するデータ点がより大きい重みを受けることを確実にする。2つの枠の大きさは、2つの異なる種類のDMRを検出するように画定される。ブロックに関して、大きい枠は低周波数差を検出するように画定され、小DMRに関して、より小さい枠は高周波数差を検出するように画定される。
それぞれのサンプルに関して、平滑化されたデータは、少なくとも2つの正常なサンプルが少なくとも2の被覆率を有するそれらのCpGからなる「被覆されたCpG」と称されるデータ点の同じグリッド上で評価された。
小DMRに関して、高周波解析は、70CpGまたは1,000bpのどちらかより大きい領域を生成する大きさの枠を使用した。ブロックに関して、低周波解析は、同様に500CpGまたは2,000塩基対のどちらかより大きい大きさの枠を使用した。トリキューブカーネルの使用は枠の中心から遠いデータ点がより小さい重みを受けることを確実にすることに留意する。このアプローチは、それぞれのサンプルに関して、高度に正確なCpGメチル化レベルp(L)の推定値をもたらした。標準誤差は、高周波平滑化において0〜0.11(平均0.04)、低周波において0.01〜0.04(平均0.02)の範囲であった。高周波平滑化の結果の例は図4に提供される。図4は、高周波平滑化によって得られた正確なメチル化推定値を示す。円はCpG位置に対してプロットされるメチル化の単一CpG推定値を表す。円の領域は被覆率に比例する。高周波平滑値(方法において詳細に記載される)は実線としてプロットされる。破線は95%点別信頼区間を表す。下のパネルに示される領域は統計アプローチを図示する。
その結果、生物学的変動を考慮するt統計に基づく相違を見つけるための方法が開発された。それぞれのCpG位置Lでのそれぞれのサンプルiに関する高度に正確なpi(L)の推定値から開始した。d(L)と称される3つの腫瘍サンプルと3つの正常なサンプルとの間の平均的な相違を得た。生物学的変動を適切に説明するために(図5)、正常なサンプルを使用してd(L)の標準誤差を推定した。
図5はDMRを検出するための生物学的複製の必要性を図示する。図5(a)の左側のパネルにおいて、3つの正常なサンプル(上の線)および一致する癌(下)のメチル化パターンが示される。検出されたDMRはピンクで網掛けされる。右のパネルにおいて、3つの対合サンプルに関するDMR内の平均メチル化値が示される(正常は青、癌は赤、一致するサンプル対は数字によって示される)。正常と癌との間の相違に関するt検定が行われ、0.0056のp値を得た。図5(b)は、正常−癌組3(太線)のみが解析された場合、癌と正常との間のメチル化の相違があるように思われる領域に関する(a)と同じ解析を示す。しかしながら、3つ全てのサンプルが比較されるとき、p値は0.52である。メチル化推定値は非常に正確である(右側パネルの点の標準誤差は<0.02である)ことに留意する。したがって、見られる相違は、技術的なものではなく生物学的なものであり、測定技術に関わらず見られるだろう。
示されるように、癌サンプルは大きく変動する傾向があるため、正常なサンプルのみが使用された(図6)。図6は、ヒトの癌の種類にわたって共通のCpG部位のメチル化の分散の増加を示す。特注のイルミナ(Illumina)アレイを使用して384のCpG部位で測定したメチル化レベルは、(a)結腸、(b)肺、(c)乳房、(d)甲状腺、および(e)腎臓(ウィルムス腫瘍)癌における全サンプルの変動の増加を呈する。それぞれのパネルは、正常および一致する癌サンプルにおけるそれぞれのCpGのメチル化レベルの全サンプルの標準偏差を示す。実線は識別線であり、この線より上のCpGは癌においてより大きい変動を有する。破線は、メチル化の分散における相違が有意となる閾値を示す(99%レベルのF検定)。5つ全ての組織の種類において、大部分のCpGは実線の上であり、変動は正常なサンプルより癌サンプルで大きいことを示す。色は標準注釈付きCpGアイランドに関するそれぞれのCpGの位置を示す。(f)変動において最も大きい増加を示したCpGを使用して、階層的クラスタリングが正常なサンプルに対して行われた。これらのCpGに関するメチル化値のヒートマップは組織の種類を明確に区別し、癌におけるこれらの部位のメチル化の不均一性の増加が組織特異的DMRであることを示す。
したがって、標準偏差se[d(L)]はσ(L)V(2/3)として推定され、σ(L)は3つの正常なサンプルに関してPi(L)の標準偏差である。標準誤差の推定値を向上するために、それらは101の観察結果の大きさ枠を有する移動平均を使用して平滑化された。人工的に低い分散の結果としての誇張されたt統計を避けるために、平滑化された結果を計算する前に、その75パーセンタイルの標準偏差の閾値が設定された。標準偏差を設置することにより、t統計t(L)=d(L)/se[d(L)]が構築された。
高周波解析に関して、t統計は低周波変化に関してさらに補正された。これは、高メチル化小DMR、内側の全体的な特徴、即ち、低または高メチル化ブロック等の局所特徴の発見を可能にした。この補正因子は、ゲノムにおいて2,000bp離れた位置の固定グリッドを形成し、これらの位置での測定値を得るために隣り合うt統計を線形に補間し、次いでHuberファミリー10に基づく強固なスムーザ(smoother)および25,000bpの帯域幅によりこのデータセットを平滑化することにより計算された。次いで、小DMRは、互いに300bp以内の隣接するCpGと定義され、t統計は4.6を上回るか−4.6を下回り(t統計の実験的分布の95番目の変位値に相当する)、全ての相違は同じ方向である。低周波解析に関して、t統計のカットオフ値は2であり、隣接するCpGは互いから10,000bp以内と定義された。
これらの領域一式は、後に以下の基準に従いフィルタ処理され、処理された小DMRおよびブロックを形成した。1)小DMRは少なくとも3つの被覆されたCpGを含有し、300bp当り少なくとも1つの被覆されたCpGを有する必要がある。さらに、小DMRにわたる腫瘍と正常との間のメチル化パーセンテージの平均差は0.1を超えなければならない。2)ブロックは5kbより長い必要がある。正常なサンプルにおいて0.25未満の平均メチル化を伴うCpGアイランドを含有するブロックは2つに分けられた。5kbより短い推定上のブロックは小DMRとして含まれるが、但し、それらが上記の小DMRフィルタを満たすことを条件とする。
フィルタ処理後、小DMRの組は、それらが1kb未満離れた、同じ方向に変化した(両方とも高メチル化された、または両方とも低メチル化された)、およびそれらを分離する領域において被覆されたCpGがない場合、統合された。ブロックの一部のリストが表6として、小DMRの一部のリストが表7として示される。表6および7に示されない追加のブロックおよび小DMRが決定された。
腺腫サンプルからのデータを同じ方法で平滑化した。
DMRの分類
DMR内および2つの隣接する領域(800bp以内)の腫瘍および正常なサンプルのメチル化プロファイルに基づき、小DMRをカテゴリーに分類した。これらの結果に基づき、データ調査から分かったDMRをメチル化境界の損失、メチル化境界の移動、および新規低メチル化と称される3つの種類に分類することができる(図7)。図7は小DMRでのエピジェネティック安定性の損失を示す。メチル化の推定値は正常なサンプルおよび癌サンプルに関するゲノム位置に対してプロットされる。小DMR位置は網掛けされる。灰色の棒は、ブロック、CpGアイランド、および遺伝子エクソンの位置を示す。下の軸線に沿ったチェックマークはCpGの位置を示す。(a)メチル化境界の外向きへの移動(正常−網掛け領域において上の線、癌−網掛け領域において下の線)、(b)メチル化境界の内向きへの移動(癌−網掛け領域において上の線、正常−網掛け領域において下の線)、(c)メチル化境界の損失(癌−網掛け領域において上の線、正常−網掛け領域において下の線)、および(d)新規低メチル化DMR(正常−網掛け領域において上の線、癌−網掛け領域において下の線)の例が描かれる。
DMRを自動的に分類するために数学的アルゴリズムが使用された。簡潔に、DMR内ならびに上流および下流の両方のDMRに隣接する腫瘍および正常なサンプルの両方に関して、平均メチル化を計算した。これは、6つのサンプルのそれぞれに関して3つの数字をもたらした。全ての正常なサンプルが隣接する領域において高メチル化値(>50%)および低メチル化値(<0.25%)を示し、腫瘍サンプル全てがDMRおよび隣接する領域にわたって中間値を示した場合、DMRはメチル化境界の損失として分類された。隣接する領域のうちの1つが正常および腫瘍のサンプルの両方において低メチル化値を有した場合、領域はメチル化境界の移動として分類された。最後に、全ての正常なサンプルがDMRおよび隣接する領域において高メチル化値を示し、一方腫瘍サンプルがDMRにおいて低メチル化値を示した場合、領域は新規低メチル化として分類された。アルゴリズムの詳細は、コンピュータコードを見ることにより(要求に応じて入手可能)最も良く理解される。
ブロックおよび反復領域における低メチル化
反復領域はUCSC repeatMaskerトラック11に基づき特定された。反復および/またはブロックに基づき、ゲノムは、両方が反復およびブロックの領域、反復だがブロックではない領域、反復ではないがブロックである領域、および反復でもブロックでもない領域に分けられた。メチル化レベルは4つの異なる領域における全てのCpGの高周波平滑化されたメチル化レベルの平均として計算された。密度推定値は同じ分布から計算された。
異なるゲノムドメイン間の重複の濃縮
異なるゲノムドメイン(ブロックおよびLOCKのような)のそれぞれの組に関して、2つのゲノムドメインの内側および外側(内側ブロックおよび内側LOCK、内側ブロックおよび外側LOCKなどのような)のCpGの数を含む2×2の表を作成する。オッズ比およびp値はフィッシャーの正確確率検定を使用して計算された。
コピー数解析
コピー数の推定値は、アライメント後に得られる塩基当りの被覆率に基づいた。開発されたフィルタは特にメチル化測定のために適用されなかった(亜硫酸水素塩アライメントの項に記載)。本明細書において考慮される被覆率はCpGに特有ではなく、全てのゲノム位置が被覆率の値を割り当てられることに留意する。次いで、それぞれのサンプルに関して、非重複10,000bp枠における平均被覆率を計算し、cov(T)およびcov(N)で表されるそれぞれの腫瘍−正常組に関する2つの被覆率ベクターを得る。それぞれの腫瘍−正常組に関して、補正されたlog比:log2(CN)=log2(cov(T))−log2(cov(N))+cが定義された。ここで、cはそれぞれの配列決定作業における異なる収率を考慮するための補正係数であり、cは正常なサンプルの総配列決定収率を腫瘍サンプルの総収率で割ったlogとして定義される。コピー数log比は円形バイナリセグメンテーション(circular binary segmentation)(CBS)12を使用して分けられた。説明の目的のため、染色体20に対するコピー数log比および関連するセグメンテーションが示される(図8a)。
コピー数がメチル化推定値に対して作用があったかを判断するために、CBSによってもたらされたそれぞれのセグメントをlOOkb領域に分けた。これらの領域のそれぞれに関して、平均コピー数比ならびに平均メチル化比を計算した。次いで、これらはプロットされたが(図8b)、CNVとメチル化ブロックとの間に関係は観察されなかった。
図8はブロックおよび小DMR検出がコピー数の変動により影響を受けなかったことを示す。染色体20(1〜25MB)の25メガベース領域に関する図8(a)において、染色体に沿ってプロットされた3つ全ての正常−癌組間のメチル化の相違が示され、赤線はブロックにおける平均値を表す。ブロックの位置は3つ全ての正常−癌組にわたって一致していることが分かる。説明の目的のため、強調部分(網掛け)は最も大きいブロック7つである。それぞれの正常−癌組に関する図8(b)において、(a)と同じ領域に関して、正常なサンプルの被覆率に対する癌サンプルの被覆率のlog比(基数2)によって定量化されるコピー数の変化が示される。0のlog比は癌におけるコピー数の変化の欠如に関連し、一方、log(3/2)以上の値(破線)は癌におけるコピー数の増加に関連する。赤線はCBSアルゴリズムにより得たセグメントを表す(方法で記載)。それぞれのサンプルは異なるコピー数の変化を示すことが分かる。図8(c)に関して、メチル化における相違が全ゲノムのコピー数の相違(log比)に対してプロットされる。具体的には、CBSによって検出されたセグメントのそれぞれに関して、メチル化の平均的な相違およびコピー数の変化に関連する平均log比が計算された。これはそれぞれのサンプルに関して行われ、全ての点は1つの散布図にまとめられた。
亜硫酸水素塩配列決定の捕捉
前に記載される方法32を使用して、亜硫酸水素塩変換されたgDNAを捕捉するために亜硫酸水素塩Padlockプローブ(BSPP)を使用した。配列決定ライブラリは捕捉したDNAから生成され、Illumina(商標)GA II機器上で配列決定され、7930万の読み取り値を生成した。全ゲノム亜硫酸水素塩読み取り値と同じ方法を使用したが、色空間の代わりにヌクレオチド空間で機能するように適応させて、捕捉読み取り値をアライメントした。
大型組織化クロマチンK9修飾(LOCK)のアッセイ
一次ヒト肺動脈線維芽細胞(HPF)はScienCell Research Laboratories (San Diego,CA)から購入した。細胞培養は、ScienCellにより推奨される培地およびプロトコルを用いて行われた。二次継代の一次細胞はH3K9Me2 LOCK解析に使用された。ChIP−on−chip実験およびマイクロアレイデータ解析は前述12のように行われた。
遺伝子発現解析
発現データは遺伝子発現バーコード(rafalab.jhsph.edu/barcode)から得た。この情報源は、発現した、または発現しなかったと遺伝子を呼ぶことができるようにデータを意図的に標準化するために、公共の保管所からの全発現データを組み合わせる。この情報源から、2つの独立した結腸癌データセット(GSE867135およびGSE41833637)を使用した。超可変遺伝子を定義するために、元のlog発現から計算された腫瘍および正常なサンプルにおいて全サンプルの分散を使用するF検定が行われた。遺伝子は、2.54(p=0.01)を上回る遺伝子発現バーコード標準化値を有する場合、発現すると定義された。線維芽細胞解析に関しては、データセット(GSE789038、GSE1141839、GSE1191940)をダウンロードした。これらのデータセットからのこれらの発現値も、遺伝子発現バーコードを用いて標準化された。標準化された値は、それぞれのサンプルにおいて遺伝子が発現したか、しなかったかを判断するために使用された。
小DMRと発現との間の相関関係を決定するために、遺伝子および小DMRは、DMRが遺伝子の転写開始部位から2,000bp以内であった場合に関連すると考えられ、6,869の遺伝子がこの方法でDMRにマッピングされた。
データ注釈
注釈はhgl9に基づきUCSCゲノムブラウザから得た。データトラックがhgl8またはhgl7に関してのみ利用可能である場合は、ヒトゲノムのビルド間でマッピングするためにUCSC liftOverツールを使用した。具体的には、repeatMaskerトラック、RefSeq mRNAトラック、およびUCSC公知の遺伝子トラックが使用された。
ラミニン関連ドメイン(LAD)配位は、線維芽細胞のマイクロアレイから生成された、UCSCのNKI LADトラックから得た。PMDは、線維芽細胞の亜硫酸水素塩配列決定から生成された、Listerら11から得た。DNase I高感受性部位は、狭幅および広範なピークの両方のHies、Caco2repl、およびCaco2rep2を使用して、UCSC ENCODEトラックから得た。
結果
癌の種類にわたる定義的特徴としてのDNAメチル化における確率的変動
Irizarryらからの151の結腸cDMRを解析する、CHARM(相対的メチル化に関する包括的な高処理アレイ)と称される従来のタイリングアレイに基づくアプローチに対してDNAの精度を増加することが望ましかった。特注のヌクレオチド特異的ビーズアレイ(方法を参照)は、前にDNAメチル化の6%以内の定量的であると示された、Illumina GoldenGate(商標)プラットホームの種類に対して設計された。得られた384のプローブは、1領域につき1〜7のプローブを有する139の領域を網羅した。腫瘍の種類にわたるDNAメチル化の変化の普遍性を試験するために、それらの122の癌のうちの111に対して一致する正常組織と共に、結腸(10)、肺(24)、乳房(27)、甲状腺(36)、および腎臓(ウィルムス)(25)からの癌、ならびに30の結腸前悪性腺腫、および追加の18の正常な結腸ならびに9の正常な乳房サンプルを含む290のサンプルを研究した。サンプリングから生じる遺伝的不均一性のリスクを最小にするために、病理組織検査によって検証された小片(0.5cm×0.2cm)からの複数のクローンDNAを精製した。
DNAメチル化値のクラスタ解析は、結腸癌cDMRが腫瘍の種類にわたって癌を正常と大いに区別したことを明らかにした(図9)。
図9は、結腸癌において差次的にメチル化されたCpGのメチル化レベルが結腸(a)、肺(b)、乳房(c)、甲状腺(d)、および腎臓(e)(ウィルムス)組織において癌を正常と大いに区別することを示す。それぞれのパネルの縦列と横列は、ユークリッド距離を使用して、メチル化プロファイルの階層的クラスタリングにより順序付けされる。正常なサンプル間より腫瘍サンプル間で大きいデンドログラムの枝の高さは、全ての組織の大部分のCpGで見られる癌における全サンプルの変動の増加を図示する。
癌と正常との間の平均メチル化における相違よりもさらに顕著なのは、それぞれの種類内の正常と比較した癌サンプルにおける全サンプルのメチル化の変動の増加であるが、一般的に全ての癌の種類にわたって生じる(図9)。したがって、それぞれのCpG部位での5つ全ての腫瘍/正常組織の種類における、正常および癌のサンプル内の全サンプルの分散が計算された。それぞれの組織の種類に関して、これらの部位は結腸癌における平均値の相違に関して選択されたが、大部分のCpGが正常より癌においてより大きい分散を呈した(図6(a)〜(e))。この増加は、結腸、肺、乳房、甲状腺、およびウィルムス腫瘍において、それぞれ、81%、92%、81%、70%、および80%のCpG部位に関して統計的に有意であった(p<0.01、F検定を使用)。さらに、157のCpG部位は、試験された全ての癌の種類において、統計的に有意な増加した変動を有した。この確率的変動の増加は、CpGアイランド、CpGアイランドショア、およびアイランドから離れた領域で見られた(図6(a)〜(e))。癌は変動において正常なサンプルにおいてとられる予測される2項分布から著しい離脱を示すため、癌におけるこのメチル化の変動の増加はそれ自体平均差によるものではない。これらのデータは、腫瘍不均一性の潜在的な機構、つまり、試験されたそれぞれの腫瘍の種類内の正常と比較して、癌におけるDNAメチル化の確率的変動の増加を示唆する(考察を参照)。
正常と比較した癌における細胞の種類のより大きな不均一性の程度により生じる人為的なメチル化の不均一性を除外するために、公認の腫瘍病理学者によって全ての結腸および腎臓の腫瘍および正常なサンプル内の細胞サブタイプに関する慎重な組織学解析が行われた。正常なサンプルは、平均して、細胞組成において腫瘍サンプルよりはるかに不均一であった。よって、癌においてより大きなメチル化の変動を示すデータは、正常と比較して、癌における細胞不均一性の増加によるものではない。大部分のサンプルは正常/腫瘍整合され、年齢補正された解析の結果は変わらなかったため、この変動の増加は患者の年齢によるものではなかった。
データの根底にあるかもしれない遺伝的不均一性とエピジェネティック不均一性との間の関連の可能性に対処するために、2つの実験が行われた。第1に、マイクロアレイに基づくコピー数解析により腫瘍間の遺伝的変動をほとんどまたは全く示さなかった5つのウィルムス腫瘍サンプルを選択し、比較的高量のコピー数の変動を示した5つの結腸癌とそれらを比較した。コピー数の変動の相違にも関わらず、類似するレベルのメチル化の超可変性が両方の種類の癌に存在した。第2に、p53発現はこれらの種類の癌の両方において染色体不安定性のマーカーであるため、異常p53発現に関して、ウィルムス腫瘍および結腸癌(それぞれ7つのサンプル)から取った部分に対して免疫組織化学染色が行われた。試験した7つ全ての結腸サンプルは異常p53に関して陽性であり、一方、ウィルムス腫瘍のいずれも陽性ではなかった。特注のGoldenGate(商標)アレイによるそれらの同じサンプルの解析は、p53の差次的発現にも関わらず、これらの癌の種類の両方において類似するレベルのメチル化の超可変性を示した。
癌において変動の増加を示すそれらの同じ遺伝子座は正常な組織を互いに区別することもできるが、これは、クラスタ解析から明らかであるが、変動移動ではなく平均移動である。興味深いことに、癌において最も可変である少ない25の部位一式を使用しても、5つの正常な組織の種類は互いに明確に区別される(図6(f))。この結果は正常な組織の分化と癌DNAメチル化における確率的変動との間の生物学的関係の概念を強化する。
変動の増加が癌におけるシトシンメチル化の一般的性質であるか、または特注のアレイのために選択されたCpGの特異的性質であるかを決定するために、Illumina HumanMethylation(商標)27kビーズチップアレイ上で結腸直腸癌を一致する正常な粘膜と比較する公的に利用可能なメチル化データセットを対照として使用した。このデータセットにおいて、特注のアレイ(p<0.01)の81%と比較して、部位の42%のみがメチル化の変動において統計的に有意な増加を示したことが分かり、特注のアレイに含まれる癌DMRの特異性を確認した。CpGアイランドに対する位置に関する変動を検査することにより、確率的変動の増加はショア(44%)またはアイランド(31%)よりアイランドから遠いCpG(57%)においてより一般的であり、アイランドに遠位(26.4%)、ショア(31.6%)、およびアイランド(42%)に分けられる27kアレイ上のこれらの位置の相対的表示と対照をなすことが留意された(方法を参照)。癌において、CpGアイランドとの関係以外の何かが変更されたDNAメチル化の部位の最も大きな割合を定義している可能性があることを示唆したため、これは興味ある結果であった。
結腸癌における大型DNAメチル化ブロックの低メチル化
上述のメチル化の確率は癌の一般的な性質のように思え、試験した5つ全ての癌の種類において、アイランドおよび非アイランドの領域の両方のcDMRに影響を及ぼす。癌におけるこのDNAメチル化パターンの一体性の明らかな共通の損失をさらに検証し、アレイに基づく方法によって前に検査されなかった低CpG存在度領域を解析するために、ABI SOLiD(商標)プラットホームを用いて、3つの結腸直腸癌およびこれら3人の患者からの一致する正常な結腸粘膜に対してショットガン亜硫酸水素塩ゲノム配列決定を行った。10%ほどのメチル化の相違を検出するのに十分な精度を有するメチル化推定値が望ましかった。隣り合うCpGからの情報を統合し、3つの生体複写物からのデータを組み合わせた局所尤度アプローチが使用されたため、4×被覆率は最大でも3%の標準誤差(詳細は方法を参照)での所望の精度でメチル化値を推定するのに十分であろうと判断された。したがって、品質管理フィルタ処理(方法を参照)後、亜硫酸水素塩変換読み取り値をアライメントした後のそれぞれのCpGに関して約5×被覆率を提供した、それぞれのサンプルに関する12.5〜13.5のギガベースのデータを得た(表4)。統計処理後、0.97、0.96、および0.96の3つの正常なサンプルに関するメチル化推定値間のペアワイズ相関関係を得、配列決定被覆率の妥当性を確認した。マッピングおよび統計アルゴリズムの詳細は方法の項で得られる。
局所尤度アプローチを介して得たメチル化値の正確度を検証するために、>30×の被覆率で39.3k〜125.6kのCpGをもたらした39,262の領域に関して配列決定された同じ6つのサンプルに対して捕捉亜硫酸水素塩配列決定を行った。これらの結果は局所尤度アプローチと捕捉亜硫酸水素塩配列決定との間に0.82〜0.91の相関関係を示し、実験が異なる配列決定プラットホームおよび異なるプロトコルを用いて異なる研究所で行われたことを考えると驚くべき一致である。個々の遺伝子座の精密な検査は、メチル化推定値が高被覆率捕捉データを密接にたどったことを示した。捕捉亜硫酸水素塩配列決定ははるかに網羅的であり、CpG包括的であるが、従来の亜硫酸水素塩ピロシーケンスがさらに行われ、これもこのアプローチの正確度を確認した。
亜硫酸水素塩配列決定解析は、正常と比較して、癌において隣接する相対的低メチル化の大型ブロックの驚くべき存在を明らかにした(図10(a)〜(b))。図10は、ヒト結腸癌において大型低メチル化ゲノムブロックの存在を示す。2つのゲノム領域の癌サンプル(赤)および正常なサンプル(青)に関する亜硫酸水素塩配列決定データからの平滑化されたメチル化値を(a)および(b)に示す。低メチル化ブロックはピンクの網掛けで示される。灰色の棒は、PMD、LOCKs、LAD、CpGアイランド、および遺伝子エクソンの位置を示す。ブロックは、パネル(a)では、PMD、LOCKS、およびLADと一致するが、パネル(b)では一致しないことに留意する。(c)正常なサンプル(青)対癌サンプル(赤)に関するメチル化値の分布は、正常と比較して癌の全体的な低メチル化を示す。(d)正常なサンプル(青)および癌サンプル(赤)に関するブロック内(実線)およびブロックの外側(破線)のメチル化値の分布である。正常および癌の分布はブロックの外側で類似するが、ブロック内の癌のメチル化値は一般的な移動を呈することに留意する。(e)反復DNAおよびブロックに含まれることによって層別化される癌サンプルと正常なサンプルとの間メチル化の相違の分布である。ブロックの内側では、反復領域および非反復領域の両方において、平均的な相違は約−20%であった。ブロックの外側では、反復領域および非反復領域において、平均的な相違は約0%であり、反復ではなくブロックがDNAメチル化において観察された相違の主な原因であることを示す。
5kb〜10MBまで変動するメジアン径39kbの13,540のそのような領域が特定された(表6および8に一部列挙する)。全ブロックを通した平均DNAメチル化の全癌平均損失は12%〜23%であった(表6に一部のリストを示す)。際立って、癌におけるこれらの低メチル化ブロックは、ブロック内のCpG部位の数を考慮しても、ゲノムの半分以上に相当する(表8)。解析は、これらのブロックが3つ全ての癌にわたって共通することを示し、個々の腫瘍対正常なプロファイルの解析は一貫性のあるブロック境界位置を示す(図10、図2、および方法を参照)。癌における高メチル化ブロックの小さな画分(全ての差次的にメチル化されたブロックの3%)の存在にも留意する。例は、図10(a)および図10(b)の最も右端に見られる(表8)。平滑化されたメチル化値のヒストグラムは全体的なDNAメチル化の分布における移動を示す(図10(c))。完全な非メチル化または完全なメチル化の比較的小さい区画は、正常と癌との間の集合体においてほとんど変化がなかった。代わりに、癌におけるブロックメチル化の主な変化は、中間メチル化レベル(全サンプルの平均73%)のより多くの区画における、著しく少ないメチル化レベル(50〜61%)への損失であった。ブロックおよび非ブロック領域によって層別化されたメチル化密度分布を検査することにより、この調査結果が支持された(図10(d))。コピー数の変動はここに提示される結果を導かないことに留意しておくことが重要である。第1に、データにおいて観察される癌におけるコピー数の変動の変化の位置は、上記で特定されたブロックにおけるメチル化の変化の一貫性のある位置とは対照的に、対象にわたって一貫性がない。第2に、統計的アプローチにより提供されたメチル化相違推定値はコピー数値と相関しない。
癌における全体的な定量的低メチル化は、通常メチル化される反復要素の存在に広く起因し、LINE−1要素の低メチル化が結腸癌における予後不良に関連するため10、結腸癌に関連し得る。正常な組織において、反復要素は非反復領域よりメチル化されたことが観察された(76%対66%)。そのような反復要素がブロックの低メチル化に関与するか否かを判断するために、ブロックの内側および外側の両方の反復要素の内側および外側のメチル化レベルの相違(方法を参照)を比較した。全体的な低メチル化の大半が低メチル化ブロック(図10(e))によるのものであり、反復要素の存在によるものではないことは、この解析から明らかであった。反復要素はブロックにおいてわずかに濃縮されるため(オッズ比1.4)、明らかな反復関連メチル化の多くは、実際ブロックによる可能性がある。全ての反復がマッピング可能ではないため、この結果は反復関連低メチル化を排除しない。しかしながら、57%のL1要素、94%のL2要素、95%のMIR配列、および18%のAlu要素がデータによって被覆されるが(図11)、反復特異的低メチル化を示さない(図4)。データによって被覆されないAlu配列が何らかの形で被覆されたAlu配列より低メチル化され、よって全体的な低メチル化の一因となることが可能であることに留意しておくことが重要である。
図11は選択された反復DNAファミリーのメチル化の変化を示す。反復ファミリーおよびブロックに含まれることによって層別化される癌サンプルと正常なサンプルとの間のメチル化の相違の分布である。全反復要素の外側のCpGは対照として使用された。それぞれのグラフは、それぞれの反復ファミリーにおいてマッピング可能なCpGのパーセンテージである。
Listerらは、最近、IMR90線維芽細胞系と比較したH1ヒト胚性幹細胞系の亜硫酸水素塩配列決定解析を行い、線維芽細胞においてES細胞よりあまりメチル化されない大きい領域のゲノム(部分的にメチル化されたドメイン(PMD)と称される)を特定した11。上記で特定された中間メチル化レベル領域はPMDと非常に一致し、PMDの内側に85%のCpGを含有する(オッズ比6.5、P<2×10−16、表9)。正常なマウス細胞においてゲノム規模の、構成および組織特異的遺伝子発現停止に関連する大型組織化クロマチンリジン(K)修飾もしくはLOCKは、前に説明した12。したがって、一次ヒト細胞におけるLOCK(方法を参照)がマッピングされ、LOCKが低メチル化ブロックとも一致するか否かを判断した。際立って、89%のLOCKがブロック内に含まれた(オッズ比6.8、P<2×10−16)。LOCKは核ラミナ関連ドメインまたはLADと重複することも知られている12。LOCKと同様に、およそ83%のLADもブロック内に含まれた(オッズ比4.9、P<2×10−16)。加えて、調節領域の構造シグナルであるDNaseI高感受性部位13は、ブロック境界および小DMRの1kb以内で濃縮された(両方ともp<2×10−16)。よって、癌において特定された大型低メチル化ブロックは、正常な細胞において、いくつかの相補的方法によって特定されたゲノム組織と一致する。PMDおよび低メチル化ブロックは大部分が重複するが、非重複ブロックとPMDとの間の癌における遺伝子発現の有意な相違は後で示されることに留意する。
さらに、上述の特注のIllumina(商標)アレイからの全ての癌の種類にわたる超可変CpGと、全ゲノム亜硫酸水素塩配列決定により特定された低メチル化ブロックとの関係が観察された。特注のアレイは、低メチル化および高メチル化の両方を含むように設計されたため、CpG部位は低メチル化ブロックおよび少数の高メチル化ブロックにおけるそれらの超可変の157のCpG部位の濃縮に関して試験した。63%の低メチル化された超可変CpGは実際低メチル化ブロック内にあり、37%の高メチル化された超可変CpGは高メチル化ブロック内にあることが分かった。統計的有意性を試験するために、これらのパーセンテージは、癌および正常において差次的に変動しないHumanMethylation27KアレイCpGのCpGに関して見られるものと比較された。これらのパーセンテージは、低メチル化および高メチル化ブロックに関して、それぞれ、13%および1.5%であり、ブロックにおける超可変的にメチル化されたCpGの濃縮に関して高度な統計的有意性を示した(p<2x10−16、表10)。
癌における小DMRはDNAメチル化境界の安定性の損失を伴う
次いで、ブロックより小さい領域(≦5kb)における一貫したDNAメチル化の変化を検出するために統計アルゴリズム(方法を参照)が開発された。一組の癌−正常のみが利用可能な場合、正常なサンプルにおける全対象の可変性を示す領域はそうでなければDMRと容易に混同されるため、このアルゴリズムの基準は生体複写物の解析であった(図5)。これらの小領域におけるメチル化測定値は、前のCHARMに基づくマイクロアレイ解析におけるメチル化測定値と良好な一致を呈した(図12)。
図12は、(a)正常サンプルおよび(b)癌サンプルにおけるメチル化を測定するための、CHARMマイクロアレイデータおよび亜硫酸水素塩配列決定の比較を示す。以前公開されたCHARMマイクロアレイデータ(Irizarryら(2009))からの平均メチル化レベル(y軸)は、高周波平滑化された亜硫酸水素塩配列決定データから得た平均メチル化に対してプロットされた。それぞれの点は、最初に(Irizarryら(2009))において特定されたcDMR領域のうちの1つを表す。CHARMと配列決定との間の高度な相関関係に留意する。
これらは、上述の大型(>5kb)の差次的にメチル化されたブロックとそれらを区別するために小DMRと称される。CHARMおよび他の公開されたアレイに基づく解析に対する配列決定の包括性の増加は、我々に、5,810の高メチル化および4,315の低メチル化小DMR(DMRの一部のリストを表7に示す)の以前の報告より多くの小DMRを検出することを可能にする。高メチル化cDMRがCpGアイランドで濃縮され、一方、低メチル化cDMRがCpGアイランドショアで濃縮される以前の知見も確認された(表8)。
配列決定の包括性の増加は、我々が具体的にCpGアイランドでの異なる種類のメチル化の変化を定量化することも可能にする(表11)。(1)61%のアイランドが正常な結腸において非メチル化され、これらのうちの17%が癌におけるメチル化において>10%の絶対増加を示した、(2)20%のアイライドが正常な結腸において完全にメチル化され、これらのうちの24%が癌における絶対メチル化において>10%の減少を示したことが分かった、および(3)18%のアイランドが正常な結腸において部分メチル化を示し、これらのうちの17%が増加を示し、36%が癌において、メチル化の減少を示したことが分かった。CpGアイランドと重複する3907の高メチル化された小DMRのうち、63.7%が境界の移動または損失のいずれかの変化を伴う。加えて、同じパターンがプロモータに関して当てはまるかを判断するために、表11の遺伝子、遺伝子間、および反復CpGアイランド解析が層別化された。正常なサンプルにおいて、プロモータCpGアイランドは大部分が非メチル化されるが、上記の知見は依然として有効であることが分かった。逆に、癌において45%が低メチル化された、メチル化および非メチル化の遺伝子間CpGアイランドの平衡のとれた比率(35%対26%)が観察された(表1)。
小DMRの構造が検査されたとき、最も共通する特性は、CpGアイランドのDNAメチル化境界のうちの1つまたは両方における、アイランドから隣接する領域(図7(a))への、またはアイランドの内部(図7(b))への移動であった。境界移動が観察される場所では、境界がアイランドの中に移動する場合、同じ領域が高メチル化アイランドとしてアレイに基づくデータ上に現れるか、または境界がアイランドの外に移動する場合、低メチル化ショアに現れる。
小DMRの次に最も頻度の高いカテゴリーはCpGアイランドのメチル化境界の損失を伴う。例えば、多くの高メチル化されたcDMRの構成は、正常なサンプルにおいて、約100bp幅の境界を有する高度にメチル化された領域(75〜95%のメチル化)によって包囲される非メチル化領域(<10%のメチル化)により画定された。癌において、これらの領域は、全体を通して、およそ40〜60%のほぼ一定のメチル化レベルを呈した(表8、図7(c))。メチル化境界の損失を伴うこれらの領域は、癌において高メチル化アイランドとして典型的に分類されるものと大部分が一致する。
ブロックの外側の高度にメチル化された領域において新たに生じた低メチル化cDMRも発見された。これらの場合において、正常な結腸組織が75〜95%メチル化された領域は、癌においてより低いレベル(20〜40%)に低下した(図7(d))。これらの領域は新規低メチル化DMRと称され、それらは通常従来のアイランドではないCpG豊富領域と一致した(表8)。要約すると、低メチル化ブロックに加えて、10,125の小DMRが発見され、そのうちの5,494は、明らかにメチル化境界の移動、メチル化境界の損失、および新規低メチル化の3つのカテゴリーに入った。全ての小DMRが、3つ全てのサンプル組にわたって一貫したパターンに従ったわけではなく、したがってそれらの分類が不可能であったことに留意する(表8)。
メチル化に基づくユークリッド距離は正常と癌との間の結腸腺腫の中間を示す
それぞれの結腸サンプルにおいて特注のアレイを介して測定されたメチル化値の多次元尺度を行うことにより、正常なサンプルは、癌サンプルにおいて測定された分散されたメチル化値とは対照的に、密接にクラスタ化したことが観察された(図13(a))。これは、前述の癌で見られたメチル化の可変性における観察された増加と一致する。30の結腸腺腫も特注のアレイ上でメチル化に関して解析され、腺腫がサンプル内の可変性および正常なサンプルのクラスタまでの距離の両方において中間であることが分かった(図13(a))。
図13は、腺腫が中間メチル化の可変性を示すことを示す。(a)特注のアレイ上でアッセイされたメチル化レベルから導かれたペアワイズ距離の多次元尺度である。癌サンプル(赤)は正常なサンプル(青)の密接したクラスタから非常に遠く、一方、腺腫サンプル(黒)は様々な距離を呈し、いくつかは他の正常なサンプルほど近く、他は癌サンプルほど遠く、多くは中間距離にあることに留意する。(b)亜硫酸水素塩配列決定を介して特定されたブロックにおける平均メチル化値から導かれたペアワイズ距離の多次元尺度である。一致する配列決定された腺腫サンプル(1および2と表示される)は、(a)および(b)の両方における正常なサンプルのクラスタに対して同じ位置に現れる。(c)正常(青)、癌(赤)、および2つの腺腫サンプル(黒)に関するメチル化値である。多次元尺度解析(a)において正常なサンプルにより近く現れた腺腫1は、正常なサンプルと類似するメチル化パターンをたどる。しかしながら、いくつかの領域では(ピンクの網掛け)、腺腫1と正常なサンプルとの間の相違が観察された。腺腫2は癌と類似するパターンを示す。
次いで、全ゲノム亜硫酸水素塩配列決定は、これらの腺腫のうちの2つ、正常な結腸まで比較的短いメチル化に基づく距離を有する前悪性結腸腺腫、および癌サンプルに類似する正常な結腸まで遠いメチル化に基づく距離を有する腺腫に対して行われた。次いで、ペアワイズユークリッド距離を計算するために、それぞれの腺腫に関して、それぞれのブロックにおける平均メチル化レベルおよび使用されたそれらの値が計算された。低メチル化ブロックからの測定値に基づくこれらの結果は、ビーズアレイデータに関する上述の特性を確認する:腺腫を伴う正常と比較して、癌におけるゲノム規模の可変性の増加は中間値を呈する(図13)。
癌における低メチル化ショアに関連する細胞周期遺伝子の発現
全てのゲノムメチル化解析は、特に転写開始部位で、遺伝子発現とメチル化との間の逆相関を示してきた14。小DMRにおけるメチル化と遺伝子発現との間の関係を研究するために、公的なマイクロアレイ遺伝子発現データを癌および正常な結腸サンプル(方法の項を参照)から得、配列決定データからの結果と比較した。発現マイクロアレイにおいて示されるそれぞれの遺伝子は最も近いDMRにマッピングされた。遺伝子およびDMRは、DMRが遺伝子の転写開始部位から2kb以内であった場合に関連すると考えられ、6,869の遺伝子がこの方法でDMRにマッピングされた。DNAメチル化と遺伝子発現との間の予測された逆相関が観察された(r=−0.27、p<2×10−16、図14)。
図14は、小DMRでメチル化を伴う遺伝子発現の逆相関を示す。小DMR付近のメチル化における平均的な相違に対してプロットされた、GEOデータセットGSE8671から得た平均log遺伝子発現である。遺伝子および小DMRは、DMRが遺伝子の転写開始部位から2,000bp以内であった場合に関連すると考えられ、6,869の遺伝子がこの方法でDMRにマッピングされた。異なる種類の小DMRは、色、境界移動(緑)、境界損失(オレンジ)、新規低メチル化(紫)、およびその他(ピンク)で示される。破線は、遺伝子発現比較において、2の倍率変化を表す。
小DMRのそれぞれのカテゴリーに関するメチル化と遺伝子発現との間の逆相関を別個に検査することにより、メチル化境界の移動による低メチル化ショアに関する最も強い関係(表12)が分かる。差次的に発現する遺伝子(FDR<0.05)に関して、遺伝子オントロジー濃縮解析(Gene ontology enrichment analysis)が行われ、低メチル化境界の移動に関連するものを他のカテゴリーと比較した。これらのカテゴリー(表13)は、特に細胞周期関連遺伝子であるCEP55、CCNB1、CDCA2、PRC1、CDC2、FBXO5、AURKA、CDK1、CDKN3、CDK7、およびCDC20Bに関してとりわけ強く濃縮された(表14)。
低メチル化ブロックおよびDMRにおける遺伝子発現の変動の増加
特注のビーズアレイにより分かった癌におけるDNAメチル化の可変性の増加を考えて図6(a)〜(e))、ブロックにおけるメチル化パターンが検査され、癌における可変性の増加も分かった。具体的には、癌および正常におけるブロック内の全対象のメチル化の可変性のレベルが比較され、上述のIllumina特注ビーズアレイにより分かった結果との顕著な類似性が分かった(図15と比較して図6(a)〜(e))。
図15はブロックにおける正常なサンプルと癌サンプルとの間のメチル化の変動の増加を示す。正常なサンプル対癌サンプルのそれぞれのブロックに関するメチル化レベルの全サンプル標準偏差である。平均メチル化レベルは、高周波数平滑化SOLiD(商標)亜硫酸水素塩配列決定データを使用して、それぞれのブロックに関して計算された。実線は識別線であり、この線より上のCpGは癌においてより大きい可変性を有する。図6のように、大半のブロックは正常なサンプルと比較して、癌において変動の増加を示す。
結腸癌における遺伝子発現に対する関係を研究するために、公的な遺伝子発現データを癌サンプルおよび正常なサンプルから得た(方法の項を参照)。発現データは、発現停止された遺伝子に関する発現値が標準正規分布(平均0および標準偏差1)をたどる方法で、数千の公的に利用可能なデータセットから標準化された発現測定値までの情報を利用する統計アルゴリズムである遺伝子発現バーコード16で処理された。公的なデータベースにおいて報告される発現値は遺伝子を発現停止または発現と呼ぶために使用することができないが、バーコードアプローチは発現停止に関する統計試験の構築を可能にすることに留意する。ブロックの遺伝子は、正常なサンプルおよび癌サンプルの両方において一般に発現停止された(全サンプルにおいて80%の遺伝子が発現停止した)。正常な組織において一貫して転写される遺伝子のうち、例えば低レベルでも、偶然予測された15%と比較して、36%が癌のブロックにおいて発現停止する。これは、文献、例えばFrigolaら17における他の報告と一致する。
遺伝子発現停止における微妙な相違より顕著に、正常なサンプルと比較して癌における発現の可変性の増加を呈する遺伝子の実質的な濃縮が低メチル化ブロックにおいて発見された。第1に、組織特異的遺伝子とブロックの外側の癌の可変性との間の関連性の欠如に気付くことにより、この観察された可変性の増加が、ブロックにおいて過剰に示される組織特異的遺伝子、および癌の潜在的な高い細胞不均一性によるものであった可能性が除外された。その結果、遺伝子の発現における可変性の増加と低メチル化ブロック内のその位置との間の明らかな関連性に気付いた。例えば、発現の可変性における最も大きな増加を呈する50の遺伝子のうちの26は、ブロックの内側にあり、偶然に予測された17%と比較して52%であり(p=3×10−9)、アレイ上およびブロック内に4,940の遺伝子のうちの最大1,000の遺伝子ほどの有意な濃縮がP=0.01で存在する。これらの26の最も超可変遺伝子のうちの25に関する発現レベルは、興味深いパターンを呈した。正常なサンプルにおいて決して発現しなかったが、それらは癌において確率的発現を呈した(図16および17)。例えば、MMP3、MMP7、MMP10、SIM2、CHI3L1、STC1、およびWISPの遺伝子(考察で記載)は、それぞれ、96%、100%、67%、8%、79%、50%、および17%の癌サンプルにおいて発現したが、正常なサンプルにおいて決して発現しなかった(表14)。
図16は、ブロックに関連する遺伝子発現の高い可変性を示す。(a)MMP7、MMP10、およびMMP3(赤)の超可変的に発現した遺伝子の例はブロック内に含まれた。低メチル化ブロック位置が強調される(ピンクの網掛け)癌サンプル(赤)および正常なサンプル(青)に関するメチル化値がゲノム位置に対してプロットされた。灰色の棒は図8の通りである。(b)癌における26の超可変遺伝子に関する標準化されたlog発現値は低メチル化ブロック領域内に位置した(正常なサンプルは青、癌サンプルは赤)。標準化は遺伝子発現バーコードを用いて行われた。2.54を下回る標準化された発現値を有するまたは正常分布の99.5番目のパーセンタイル(水平の破線)の遺伝子は、バーコード法15により発現停止されたと判断される。垂直の破線は異なる遺伝子の値を分ける。癌サンプルにおける超可変発現と比較して、正常なサンプルにおいて一貫した発現の発現停止が存在することに留意する。
図17は、低メチル化ブロックにおける癌の超可変遺伝子発現を示す。癌において低メチル化ブロック領域内にある50の最も超可変遺伝子のうちの26に関する標準化された(遺伝子発現バーコードを用いた)発現値である。2.54を下回る標準化された発現値を有する遺伝子(水平の点線)はバーコード法(Zilliox and Irizarry,2007)によって発現停止されたと判断される。データセットGSE4183から垂直の点線によって分けられるそれぞれの遺伝子に関する発現値は、正常(青)および癌(赤)のサンプルに関してプロットされる。癌サンプルにおける可変発現と比較して、正常なサンプルにおいて一貫した発現の発現停止が存在することに留意する。
低メチル化ブロックとPMDとの間の機能的相違
上述のように、観察された低メチル化ブロックは、実質的に、Listerら11によって線維芽細胞系において前に報告されたPMDと重複した。したがって、ブロックとPMDとの間で重複しなかったゲノム領域は、それらの間の潜在的な機能的相違を特定するために検査された。それらは、1)低メチル化ブロック内にあるがPMDにない領域(B+P−)、および2)PMD内にあるが低メチル化ブロックにない対応領域(B−P+)の2つの組に分類された。それらの領域内の遺伝子の発現を検査するために、線維芽細胞サンプルからの公的なマイクロアレイ遺伝子発現データを得た(方法の項を参照)。予測通り、線維芽細胞PMDの遺伝子は線維芽細胞サンプルにおいて比較的発現停止され、遺伝子のうちの79%は、PMDの外側の49%と比較して、全てのサンプルにおいて、PMD内で発現停止された、p<2×10−16)。さらに、線維芽細胞サンプルにおいて発現停止され、結腸において一貫して発現した遺伝子はB−P+領域において濃縮され(3.2のオッズ比、p<2×10−16)、一方、結腸において一貫して発現停止され、線維芽細胞サンプルにおいて一貫して発現した遺伝子はB+P−領域において濃縮された(2.8のオッズ比、p=0.0004)。次いで、B+P−およびB−P+遺伝子は、上述の50の超可変遺伝子に重点を置いて、癌における発現の可変性に関して検査された。これらの遺伝子はB+P−領域において顕著に濃縮されたが(p=0.00013)、B−P+領域において濃縮を示さなかった。これらの結果は、結腸癌における超可変遺伝子発現が低メチル化ブロックにおけるそれらの存在に具体的に関係することを示唆する。
考察
要約すると、結腸癌のcDMRは、一般に成人期の一般的な固形腫瘍である肺癌、乳癌、甲状腺癌、および結腸癌に関与し、幼児期の最も一般的な固形腫瘍であるウィルムス腫瘍に関与し、正常組織においてメチル化レベルの密接なクラスタ化、および癌において著しい確率的変動を伴うことが示された。癌のスクリーニングに関するDNAメチル化を利用する現在の試みは癌特異的プロファイルの特定に重点を置いているが18、ここに示されるデータはエピジェネティックの可変性自体が癌に特徴的であり得ることを示唆する。さらなる試みは、狭義の正常なプロファイルから離れ、むしろ具体的な狭義の癌プロファイルを特定するように、癌のエピゲノムを定義することに向けられてもよい。
意外にも、結腸癌における全てのメチル化の変化の3分の2は、サンプルにわたって一貫した位置で大型ブロックの低メチル化を伴い、ゲノムの半分超を含む。癌において最も可変的に発現した遺伝子はブロックにおいて異常に濃縮され、それらは、MMP3、MMP7、およびMMP1019の3つのマトリックスメタロプロテイナーゼ遺伝子、ならびにメタロプロテイナーゼを通して腫瘍浸潤を促進するように作用する4つ目のSIM2を含む、腫瘍の不均一性および進行に関連する遺伝子を伴う20。別のSTC1は、腫瘍代謝のリプログラミングのワールブルグ効果の媒介を補助する21。CHI3L1は、結腸を含む複数の腫瘍の種類において炎症性応答および予後不良に関連する分泌性糖タンパク質をコードする22。WISP遺伝子はWnt−1の標的であり、乳癌および結腸癌における組織浸潤の一因であると考えられる23。細胞外マトリックス再モデル化遺伝子を含むカテゴリーの実質的な濃縮を示した、ブロックにおいて超可変発現(FDR<0.05)に関連する遺伝子に関して、遺伝子オントロジー濃縮解析(Gene ontology enrichment analysis)15が行われた(表13)。これらの知見により提起される注意点の1つは、非特異的DNAメチル化阻害剤による癌患者の処置が低メチル化ブロックにおける腫瘍促進遺伝子の活性化において意図されない結果を有する可能性があるということである。本研究は全ゲノム亜硫酸水素塩配列決定に基づくが、以前の研究24、25は、大型領域の高メチル化を示すか、または局所メチル化変化がないことを示してきたことに留意することも重要である。
比較的小さい割合のゲノム(0.3%)を表すが、小DMRは数が多く(10,125)、CpGアイランドの端部でのDNAメチル化境界の損失、DNAメチル化境界の移動、または基準アイランドではないCGの密度が高い領域における新規低メチル化領域の生成を頻繁に伴う。これらのデータは、癌において低メチル化CpGアイランドショアの重要性を強調する。特に、癌における低メチル化および遺伝子過剰発現に関連する多くのショアは、細胞周期関連遺伝子に関して濃縮され、癌を特徴付ける未制御の成長における役割を示唆する。
癌における組織特異的DMRと異常なメチル化の可変性の部位との間の関係を説明するのに役立つ可能性があるモデルを提案する。多能性自体は、いくつかの遺伝子座である程度の確率的遺伝子発現を必要とする場合があり、外部刺激に応答して代替えの経路に沿った、またはさらには一部ランダムな分化を可能にする。分散は極端から離れて増加するため、エピゲノムは、ほぼ100%および0%の極端から離れてエピジェネティックマークの厳密性を緩和するためにその物理的構成を変更することにより協働することができる。エピゲノムがこれを行うことができる可能な方法の1つは、既知の機能的に重要なドメインであるLOCKおよびLADと重複し、よってクロマチン充填密度における変化または核ラミナへの近接を伴う可能性がある、癌における大型ブロックのメチル化を減少させることによる。同様に、CpGアイランド付近のDNAメチル化境界における微妙な移動は、クロマチン構成ならびに正常な組織特異的および異常な癌特異的遺伝子発現を導く可能性がある。この考えと一致して、メチル化境界における移動は、X不活性化にかからない遺伝子を差次的に調節することが示された26。したがって、将来、ここに提示されるデータを大規模なクロマチン構成ならびにDNAメチル化およびクロマチンにおける正常な発達的変化と関連付けること、ならびにブロックの境界およびCpGアイランドショアに対する今後のエピジェネティック調査を広げることが重要であろう。
癌におけるエピジェネティック変化は遺伝的変化とは無関係に生じるとは主張されない。両方とも明らかに重要であり、それらは高度に相関関係にある。しかしながら、正常なサンプルと比較して、それぞれの癌の種類におけるメチル化の増加および発現の可変性は、最初に進化のために提案されたが、様々な酸素分圧または遠位部位への転移等の癌が成長する、強いが可変の選択圧に等しく適用可能である、様々な環境におけるエピジェネティック可変性の増加の潜在的な淘汰値と一致する27。よって、cDMR(tDMRとしても示される)での癌におけるエピジェネティック不均一性の増加は、癌細胞が血管新生による酸素の増加、ひいては壊死による酸素の減少、または新しい細胞間環境への転移等の変化する環境に迅速に適応する能力の根底にある可能性がある。
参考文献
Figure 0006954964
Figure 0006954964
Figure 0006954964
Figure 0006954964
Figure 0006954964

以下は、本明細書の一部を形成する表のリストである。
(表1)SOLiD(商標)3+機器の8回の実行(16個のフローセル)から得た77億9千万の亜硫酸水素塩読み取り値の配列決定およびアライメントの結果
Figure 0006954964
(表2)GRCh37ヒトゲノムアセンブリに一意的にアライメントし、少なくとも1つのCpGシトシンと重複した8億3100万の亜硫酸水素塩読み取り値のメチル化証拠の結果
Figure 0006954964
(表3)フィルタ処理された証拠の少なくとも1〜10の断片により被覆されたGRCh37ヒトゲノムアセンブリにおけるCpGの割合に関するサンプル当りの被覆率
Figure 0006954964
(表4)ゲノム規模およびCpGシトシンの両方のサンプル毎の総被覆率
Figure 0006954964
(表5)低メチル化境界の移動に関連する差次的に発現した遺伝子の遺伝子オントロジー濃縮解析
Figure 0006954964
(表6)全てのブロックの部分的なリスト
Figure 0006954964
Figure 0006954964
Figure 0006954964
Figure 0006954964
Figure 0006954964
Figure 0006954964
Figure 0006954964
Figure 0006954964
(表7)小DMRの部分的なリスト縦列の説明を含む詳細は補足的な方法に含まれる−境界の損失
Figure 0006954964
Figure 0006954964
Figure 0006954964
Figure 0006954964
Figure 0006954964
(表8)結腸癌における差次的メチル化領域(DMR)のゲノム特徴
Figure 0006954964
*本文に記載されるように、境界DMRの損失は、CpGアイランドにおけるメチル化の増加および隣接するショアにおけるメチル化の減少に関連する。ショアよりアイランドにおいてより多くのCpGが存在するため、本明細書において、これらは単一事象として記録され、それらを分類する。
(表9)結腸癌における差次的メチル化領域を有する様々なゲノムドメインの重複
Figure 0006954964
ゲノムドメインの大きさをギガベースで縦列1に、CpGの数を縦列2に示す。縦列3はギガベースでの重複、そして縦列4はCpGの数を示す。縦列5は偶然に予測されたオッズ比に対する観察されたオッズ比を示す。全ての重複は統計的に有意であった(p<2.2×10〜16)。
(表10)亜硫酸水素塩配列決定により特定されたブロックにおける特注のIlluminaアレイにより特定された超可変的にメチル化された遺伝子座の濃縮
Figure 0006954964
(表11)正常なサンプルと比較して、癌におけるCpGアイランドで観察されたメチル化値
Figure 0006954964
*次いで、それぞれのアイランドにおける平均メチル化値は、癌および正常なサンプルに関して別個に対象にわたって平均化された。
(表12)遺伝子発現は小DMRにおいてメチル化と負に相関する
Figure 0006954964
マイクロアレイ実験に示されるそれぞれの遺伝子は最も近い小DMRにマッピングされ、DMRが遺伝子の転写開始部位から2kbp以内であった場合、遺伝子およびDMRは関連すると考えられ、6,869の遺伝子がマッピングされ、表に示される。小DMRクラスのそれぞれに関して、本文に定義されるように、差次的に発現し(FDR<0.05)、逆相関を有する関連する遺伝子の数が計算された。
(表13)低メチル化境界の移動に関連する差次的に発現した遺伝子の遺伝子オントロジー濃縮解析
Figure 0006954964
結腸癌サンプルを正常なサンプルと比較して差次的に発現する遺伝子は、低メチル化境界の移動に関連するものとその残りとの2つの群に分けられた。表は統計的に有意な濃縮(FDRO.01)を有する5つのカテゴリーを示す。
(表14)正常なサンプルと比較して、癌において統計的に有意な過剰発現を示し、外向きのメチル化境界の移動から2,000bp以内の遺伝子のリスト
Figure 0006954964
Figure 0006954964
Figure 0006954964
Figure 0006954964
Figure 0006954964
Figure 0006954964
Figure 0006954964
Figure 0006954964
Figure 0006954964
Figure 0006954964
Figure 0006954964
Figure 0006954964
Figure 0006954964
Figure 0006954964
Figure 0006954964
Figure 0006954964
Figure 0006954964
Figure 0006954964
Figure 0006954964
Figure 0006954964
Figure 0006954964
Figure 0006954964
Figure 0006954964
Figure 0006954964
Figure 0006954964
Figure 0006954964
Figure 0006954964
Figure 0006954964
(表15)正常と比較して癌において高い発現可変性を有する遺伝子
Figure 0006954964
Figure 0006954964
Figure 0006954964
Figure 0006954964
Figure 0006954964
Figure 0006954964
Figure 0006954964
Figure 0006954964
Figure 0006954964
Figure 0006954964
Figure 0006954964
Figure 0006954964
Figure 0006954964
Figure 0006954964
Figure 0006954964
Figure 0006954964
(表16)5%のFDRでの癌特異的差次的メチル化(C−DMR)を伴う領域の部分的なリスト
Figure 0006954964
Figure 0006954964
Figure 0006954964
Figure 0006954964
(表17)5%のFDRで一貫して癌特異的差次的メチル化(C−DMR)を伴う領域
δMは癌から正常を引く。FDRは、偽発見率である。
縦列は、染色体、開始、終了、δM、fdr、遺伝子、遺伝子に対する関係、TSSまでの距離、CGIに対する関係、CGIまでの距離である。
Figure 0006954964
Figure 0006954964
Figure 0006954964
Figure 0006954964
Figure 0006954964
Figure 0006954964
Figure 0006954964
本願は、35USC§119(e)のもと、米国仮出願第61/518,892号に対して優先権を主張し、その全内容は参照により組み込まれる。
本発明は、上記の実施例を参照に説明されたが、修正および変形が本発明の趣旨および範囲内に包含されることを理解する。したがって、本発明は添付の特許請求の範囲によってのみ制限される。

Claims (8)

  1. 対象における癌の検出を補助する方法であって、
    (i)核酸増幅、ポリメラーゼ連鎖反応(PCR)、メチル化特異的PCR、亜硫酸水素塩ピロシーケンス、1本鎖高次構造多型(SSCP)分析、限定解析、およびマイクロアレイ技術からなる群より選択される1つ以上の技術を使用して、前記対象からの試験サンプルにおける複数のゲノム核酸配列のメチル化状態、および対照としての非癌性生体サンプルにおける対応する複数のゲノム核酸配列のメチル化状態を決定することであって、前記メチル化状態を決定することが、メチル化および非メチル化核酸からの未加工強度データを分位標準化すること、および、メチル化状態をメチル化および非メチル化核酸強度の合計に対するメチル化核酸強度の比として計算することを含む、前記決定すること
    (ii)前記試験サンプルにおけるメチル化状態における、前記非癌性サンプルにおけるメチル化状態からの偏差を検出すること、
    (iii)前記非癌性サンプルと比較して、前記試験サンプルにおけるメチル化の分散の増加を検出すること、および
    (iv)前記複数のゲノム核酸配列について主成分分析、統計F検定、またはそれらの組み合わせによってメチル化分散スコアを決定し、前記メチル化分散スコアの増加が前記対象における癌の検出を示すこと
    を含み、
    前記複数のゲノム核酸配列が以下に記載された全てのものである、前記方法。
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
  2. 対象における癌または癌のリスクの検出を補助するための方法であって、
    (a)核酸増幅、ポリメラーゼ連鎖反応(PCR)、メチル化特異的PCR、亜硫酸水素塩ピロシーケンス、1本鎖高次構造多型(SSCP)分析、限定解析、およびマイクロアレイ技術からなる群より選択される1つ以上の技術を使用して、前記対象からの試験サンプルにおける複数のゲノム核酸配列のメチル化状態、および対照としての非癌性生体サンプルにおける対応する複数のゲノム核酸配列のメチル化状態を決定することであって、前記メチル化状態を決定することが、メチル化および非メチル化核酸からの未加工強度データを分位標準化すること、および、メチル化状態をメチル化および非メチル化核酸強度の合計に対するメチル化核酸強度の比として計算することを含む、前記決定すること
    (b)前記対象からの試験サンプルにおける前記複数のゲノム核酸配列のメチル化状態における、対照としての非癌性生体サンプルにおける前記対応する複数のゲノム核酸配列のメチル化状態からの偏差を検出すること、
    (c)前記非癌性サンプルと比較して、前記試験サンプルにおけるメチル化の分散の増加を検出すること、および
    (d)前記複数のゲノム核酸配列について主成分分析、統計F検定、またはそれらの組み合わせによって、メチル化分散スコアを決定し、前記メチル化分散スコアの増加が前記対象における癌または癌のリスクの存在を示すこと
    を含み、
    前記複数のゲノム核酸配列が以下に記載された全てのものである、前記方法。
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
  3. 対象における癌の予後の検出を補助する方法であって、
    (a)核酸増幅、ポリメラーゼ連鎖反応(PCR)、メチル化特異的PCR、亜硫酸水素塩ピロシーケンス、1本鎖高次構造多型(SSCP)分析、限定解析、およびマイクロアレイ技術からなる群より選択される1つ以上の技術を使用して、癌と診断された、または癌の治療を受けている対象からのサンプルにおいて、複数の核酸配列のメチル化状態を検出することであって、前記メチル化状態を検出することが、メチル化および非メチル化核酸からの未加工強度データを分位標準化すること、および、メチル化状態をメチル化および非メチル化核酸強度の合計に対するメチル化核酸強度の比として計算することを含む、前記検出すること
    (b)(a)のメチル化状態における、対照としての非癌性であることが分かっているサンプル由来のゲノムの対応する複数の核酸配列のメチル化状態からの偏差を検出すること、
    (c)前記非癌性サンプルと比較して、前記対象からのサンプルにおけるメチル化の分散の増加を検出すること、
    (d)前記複数の核酸配列について主成分分析、統計F検定、またはそれらの組み合わせによって、メチル化分散スコアを決定すること、および
    (e)(d)のメチル化分散スコアを予後と相関させ、前記メチル化分散スコアの増加が前記対象における癌の予後が不良であることを示すこと
    を含み、
    前記複数の核酸配列が以下に記載された全てのものである、前記方法。
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
    Figure 0006954964
  4. 前記メチル化状態が、高メチル化または低メチル化である、請求項1−3のいずれか一項に記載の方法。
  5. 前記非癌性生体サンプルにおける前記対応する複数の核酸配列と比較して、前記複数の核酸配列のうちの1つ以上においてメチル化境界の移動または損失を検出することをさらに含む、請求項1−3のいずれか一項に記載の方法。
  6. 前記癌が、結腸直腸癌、食道癌、胃癌、白血病/リンパ腫、肺癌、前立腺癌、子宮癌、乳癌、皮膚癌、内分泌癌、泌尿器癌、肝臓癌、甲状腺癌、腎臓癌、腎臓癌(ウィルムス)、膵臓癌、他の胃腸癌、卵巣癌、子宮頸癌、頭部癌、頸部癌、および腺腫からなる群より選択される、請求項1−3のいずれか一項に記載の方法。
  7. 特定された前記メチル化分散スコアに基づき、化学療法レジメンに対する臨床応答を予測することをさらに含む、請求項3に記載の方法。
  8. 前記臨床応答が、腫瘍退縮の可能性の増加であるか、全体的な生存率を増加させるか、または無病生存率の増加である、請求項7に記載の方法。
JP2019166951A 2011-05-12 2019-09-13 エピジェネティックドメインの安定性の全般的な損失を通して癌を検出する方法およびその組成物 Active JP6954964B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161518892P 2011-05-12 2011-05-12
US61/518,892 2011-05-12
JP2014510472A JP2014519319A (ja) 2011-05-12 2012-05-10 エピジェネティックドメインの安定性の全般的な損失を通して癌を検出する方法およびその組成物

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2014510472A Division JP2014519319A (ja) 2011-05-12 2012-05-10 エピジェネティックドメインの安定性の全般的な損失を通して癌を検出する方法およびその組成物

Publications (2)

Publication Number Publication Date
JP2020010700A JP2020010700A (ja) 2020-01-23
JP6954964B2 true JP6954964B2 (ja) 2021-10-27

Family

ID=47140012

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2014510472A Withdrawn JP2014519319A (ja) 2011-05-12 2012-05-10 エピジェネティックドメインの安定性の全般的な損失を通して癌を検出する方法およびその組成物
JP2019166951A Active JP6954964B2 (ja) 2011-05-12 2019-09-13 エピジェネティックドメインの安定性の全般的な損失を通して癌を検出する方法およびその組成物

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2014510472A Withdrawn JP2014519319A (ja) 2011-05-12 2012-05-10 エピジェネティックドメインの安定性の全般的な損失を通して癌を検出する方法およびその組成物

Country Status (5)

Country Link
US (2) US10752953B2 (ja)
EP (1) EP2707506B1 (ja)
JP (2) JP2014519319A (ja)
AU (1) AU2012253414B2 (ja)
WO (1) WO2012154979A2 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA3004478A1 (en) * 2015-11-06 2017-05-11 University Of Southern California Development of prognostic markers dsg-3 from the saliva of oral cancer patients
ES2897550T3 (es) * 2016-06-16 2022-03-01 Univ Johns Hopkins Métodos y sistema de análisis epigenético
WO2018067840A1 (en) * 2016-10-06 2018-04-12 The Johns Hopkins University Large-scale epigenomic reprogramming links anabolic glucose metabolism to distant metastasis during the evolution of pancreatic caner progression
GB201703406D0 (en) * 2017-03-02 2017-04-19 Ucl Business Plc Diagnostic and prognostic methods
CN108796079B (zh) * 2018-06-06 2021-07-27 天津医科大学肿瘤医院 一种逆转录转座基因l1-fggy及其作为肺鳞癌标志物的用途
GB201819452D0 (en) * 2018-11-29 2019-01-16 Ucl Business Plc Differential methylation
US11001898B2 (en) 2019-05-31 2021-05-11 Universal Diagnostics, S.L. Detection of colorectal cancer
US11396679B2 (en) * 2019-05-31 2022-07-26 Universal Diagnostics, S.L. Detection of colorectal cancer
US11898199B2 (en) 2019-11-11 2024-02-13 Universal Diagnostics, S.A. Detection of colorectal cancer and/or advanced adenomas
US11530453B2 (en) 2020-06-30 2022-12-20 Universal Diagnostics, S.L. Systems and methods for detection of multiple cancer types
WO2023106415A1 (ja) * 2021-12-09 2023-06-15 国立大学法人北海道大学 リンパ腫に罹患したイヌの化学療法後の予後予測方法
JP2023174077A (ja) * 2022-05-27 2023-12-07 株式会社日立製作所 Dnaのメチル化レベルの測定方法、疾患予測システム、及び検査システム

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6582908B2 (en) * 1990-12-06 2003-06-24 Affymetrix, Inc. Oligonucleotides
EP1373564A2 (de) * 2000-09-01 2004-01-02 Epigenomics AG Diagnose von bestehenden erkrankungen oder der prädisposition für bestimmte erkrankungen
WO2002068694A1 (en) * 2001-02-23 2002-09-06 The Johns Hopkins University School Of Medicine Differentially methylated sequences in pancreatic cancer
EP1442129B1 (en) * 2001-10-18 2008-09-10 Lovelace Respiratory Research Institute Cancer monitoring by aberrant promotor methylation of the transcription factor genes pax5 alpha pax5 beta, novel loop helix loop protein, novel gene 2, and beta3 genes
AU2004237861B2 (en) 2003-12-11 2010-04-29 Epigenomics Ag Prognostic markers for prediction of treatment response and/or survival of breast cell proliferative disorder patients
WO2009021141A1 (en) * 2007-08-07 2009-02-12 The Johns Hopkins University Comprehensive high throughput arrays for relative methylation
US8399193B2 (en) 2007-08-30 2013-03-19 City Of Hope DNA methylation biomarkers for lung cancer
WO2009113771A1 (ko) * 2008-03-14 2009-09-17 (주)지노믹트리 폐암특이적 메틸화 마커 유전자를 이용한 폐암 검출방법
WO2010062914A1 (en) * 2008-11-26 2010-06-03 The Johns Hopkins University Methods for identifying cancer risk

Also Published As

Publication number Publication date
US20210071262A1 (en) 2021-03-11
US10752953B2 (en) 2020-08-25
EP2707506A2 (en) 2014-03-19
JP2014519319A (ja) 2014-08-14
AU2012253414A1 (en) 2013-11-21
WO2012154979A2 (en) 2012-11-15
US20140128283A1 (en) 2014-05-08
WO2012154979A3 (en) 2013-03-28
AU2012253414B2 (en) 2016-03-17
JP2020010700A (ja) 2020-01-23
EP2707506B1 (en) 2018-07-11
EP2707506A4 (en) 2014-12-24

Similar Documents

Publication Publication Date Title
JP6954964B2 (ja) エピジェネティックドメインの安定性の全般的な損失を通して癌を検出する方法およびその組成物
JP7168247B2 (ja) 癌スクリーニング及び胎児分析のための変異検出
CN110603329B (zh) 用于诊断肝细胞癌和肺癌的甲基化标志物
CN106795562B (zh) Dna混合物中的组织甲基化模式分析
TWI640634B (zh) 來自血漿之胚胎或腫瘤甲基化模式組(methylome)之非侵入性測定
US10370726B2 (en) Detecting colorectal neoplasia
WO2017087560A1 (en) Nucleic acids and methods for detecting methylation status
US9663826B2 (en) System and method of genomic profiling
EP3541950A1 (en) Multimodal assay for detecting nucleic acid aberrations
CN114729399A (zh) 检测卵巢癌
JP2024020392A (ja) 特定の遺伝子のcpgメチル化変化を利用した肝癌診断用組成物およびその使用
US20220025466A1 (en) Differential methylation
WO2023226939A1 (zh) 用于检测结直肠癌淋巴结转移的甲基化生物标记物及其应用
EP4234720A1 (en) Epigenetic biomarkers for the diagnosis of thyroid cancer
Huang Cell-free DNA Methylation Signatures in Cancer Detection and Classification
WO2022178108A1 (en) Cell-free dna methylation test
CN115772566A (zh) 用于辅助检测肺癌体细胞erbb2基因突变的甲基化生物标记物及其应用
CN115851957A (zh) 一种用于肺腺癌辅助诊断的甲基化位点标志物及其应用
CN115772567A (zh) 用于辅助检测肺癌体细胞tp53基因突变的甲基化位点及其应用
WO2020109820A1 (en) Molecular signature

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191011

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20191011

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191122

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201109

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20210208

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210507

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20210702

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210906

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210930

R150 Certificate of patent or registration of utility model

Ref document number: 6954964

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150