JP2024511425A - 免疫細胞dnaを定量するための方法および組成物 - Google Patents

免疫細胞dnaを定量するための方法および組成物 Download PDF

Info

Publication number
JP2024511425A
JP2024511425A JP2023558179A JP2023558179A JP2024511425A JP 2024511425 A JP2024511425 A JP 2024511425A JP 2023558179 A JP2023558179 A JP 2023558179A JP 2023558179 A JP2023558179 A JP 2023558179A JP 2024511425 A JP2024511425 A JP 2024511425A
Authority
JP
Japan
Prior art keywords
dna
cancer
immune cell
methylation
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023558179A
Other languages
English (en)
Inventor
ユペン ヘ,
アリエル ジャイモビッチ,
アンドリュー ケネディ,
メロミット シンガー,
エミリー キャサリン ツァン,
ウィリアム ジェイ. グリーンリーフ,
Original Assignee
ガーダント ヘルス, インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ガーダント ヘルス, インコーポレイテッド filed Critical ガーダント ヘルス, インコーポレイテッド
Publication of JP2024511425A publication Critical patent/JP2024511425A/ja
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Physics & Mathematics (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

Figure 2024511425000001
DNAが起源とする免疫細胞タイプを検出し定量するためのDNA解析方法が、本明細書で提供される。対象が疾患または状態、例えば、がんを有する可能性を決定するための方法もまた、本明細書で提供される。本明細書の方法は、メチル化の程度に基づいてDNAを分配し、次世代DNAシーケンシングすることによって生成されたDNAメチル化データに基づいて、異なる免疫細胞タイプに由来する循環無細胞DNA(cfDNA)のレベルを定量するためのアプローチを提供する。

Description

関連出願への相互参照
本出願は、その全体が任意の目的に関して参照により本明細書に組み込まれる、2021年3月25日に出願された米国仮出願第63/166,200号に基づく優先権の利益を主張する。
発明の分野
本開示は、免疫細胞中に本来存在するDNA、例えば、無細胞DNAを解析することに関連する方法および組成物を提供する。一部の実施形態では、DNAは、疾患または障害、例えば、がんを有するまたは有することが疑われる対象に由来する。一部の実施形態では、DNAが起源とする免疫細胞タイプが、同定および定量される。
導入および要旨
生検を含む、侵襲性の診断手順は、病気が起こり得る部位からの細胞または組織の解析が、関連する特色に関して解析される、がん、潰瘍、肝臓疾患、感染症、移植片拒絶、ならびに他の疾患および障害を検出または診断するために一般的に使用される。体液、例えば、血液の解析(「リキッドバイオプシー」)に基づく疾患および障害の検出は、魅力的な代替法である。リキッドバイオプシーは、非侵襲性であり、採血だけを要求する場合がある。しかし、解析可能な形態でのそのような液体からの核酸の回収の場合、体液中に放出される核酸の量は低くかつ可変であるので、リキッドバイオプシー材料を解析するための正確かつ感度のよい方法を開発することは難題であった。例えば、初期がんからの循環腫瘍DNA(ctDNA)の存在を検出することは、その低い存在量に起因して、困難である。
代替的または補足的なアプローチは、疾患、例えば、がんの存在の二次的効果に関連するシグナルを検出することである。二次的効果の1つのそのようなシグナルは、腫瘍発生に対する免疫応答からのシグナルである。腫瘍細胞の存在下では、免疫細胞は、健康な対象におけるよりも速い速度で、増殖し、分化し、潜在的にターンオーバーする。そのような現象は、血流中への免疫細胞DNAの脱落の増加をもたらし得る。したがって、二次的免疫シグナルは、少なくとも一部の状況において改善された感度で、疾患または障害、例えば、がんを検出するために有用であり得る。
さらに、異なる血液細胞タイプの定量は、疾患状態に関する情報に加えて、対象の健康全般に関する重要な情報を提供する。密接に関連する細胞タイプを含む、異なる細胞タイプ間を識別する能力は、異なるタイプの疾患および障害間を識別するために重要であり得る。いくつかの研究は、血漿中のcfDNAが、正常状態では血液細胞(骨髄性細胞)に主に由来することを報告している。しかし、疾患状態では、疾患の指標として使用され得る免疫細胞タイプからのcfDNAは、上昇し得る。いくつかのゲノム領域では、異なる免疫細胞タイプにおけるDNAメチル化シグネチャーは、骨髄性細胞および他の免疫細胞タイプから識別可能である。既存の方法、例えば、cfDNAの差次的にメチル化された領域の全血球計算およびマイクロアレイに基づくプロファイリングは、多くの細胞タイプの検出を可能にするが、ある特定のタイプの免疫細胞、例えば、ナイーブリンパ球と活性化されたリンパ球との間を判別せず、したがって、対象の免疫系の状態に関する重要な情報を提供しない。
本明細書の方法は、メチル化の程度に基づいてDNAを分配し、次世代DNAシーケンシングすることによって生成されたDNAメチル化データに基づいて、異なる免疫細胞タイプに由来する循環無細胞DNA(cfDNA)のレベルを定量するためのアプローチを提供する。一部の実施形態では、本明細書の方法は、特定の免疫細胞タイプと他の血液細胞との間で差次的にメチル化されるゲノム領域、ならびにこれらの領域からのcfDNA断片のメチル化状態をプロファイリングするためのメチル結合アッセイを使用し、1つまたは複数の特定の免疫細胞タイプの存在の定量を容易にする。このアプローチの応用としては、腫瘍誘導性の免疫細胞増殖を検出することによるがん検出が挙げられる。
本明細書の方法は、これに限定されないが、配列変異を含む、他のDNA変異および改変に関する組み合わされた情報もまた提供することができる。
本開示は、まれな免疫細胞タイプ、例えば、活性化されたリンパ球およびナイーブリンパ球を含む、異なる免疫細胞タイプを起源とするDNAの改善された解析に関する必要性を満たすことを目的とする。免疫細胞タイプ間を判別しない既存の方法、例えば、全血球計算(CBC)またはDNAメチル化に基づく方法を超える、免疫細胞タイプの改善された区別は、障害のより正確な検出(診断)およびしたがって、改善された処置を可能にする。したがって、以下の例示的な実施形態が提供される。
実施形態1 試料中のcfDNAを解析する方法であって、
a)前記cfDNAをシーケンシングし、複数の免疫細胞タイプにおいて差次的にメチル化されるDNA配列を含む複数の標的領域を含むエピジェネティック標的領域セットに関して、メチル化レベルを決定するステップ;ならびに
b)前記メチル化レベルに基づいて、前記cfDNAが起源とする複数の免疫細胞タイプの各々の量を決定するステップであって、前記複数の免疫細胞タイプが、
i.ナイーブリンパ球および活性化されたリンパ球;
ii.単球およびマクロファージ;または
iii.骨髄球、好中球、および好酸球
を含む、ステップ
を含む、方法。
実施形態2 試料中のcfDNAを解析する方法であって、
a)前記cfDNAまたはその部分試料から、少なくとも1つのエピジェネティック標的領域セットを捕捉するステップであって、前記cfDNAまたはその部分試料を、前記少なくとも1つのエピジェネティック標的領域セットに対して特異的な標的特異的プローブと接触させることを含み、前記エピジェネティック標的領域セットが、複数の免疫細胞タイプにおいて差次的にメチル化されるDNA配列を含む標的領域を含む、ステップ;
b)前記標的領域に関してメチル化レベルを決定するステップ;ならびに
c)前記DNAが起源とする前記複数の免疫細胞タイプの各々の量を決定するステップであって、前記複数の免疫細胞タイプが、
i.ナイーブリンパ球および活性化されたリンパ球;
ii.単球およびマクロファージ;または
iii.骨髄球、好中球、および好酸球
を含む、ステップ
を含む、方法。
実施形態3 試料中のcfDNAを解析する方法であって、
a)前記cfDNAをシーケンシングし、複数の免疫細胞タイプにおいて差次的に低メチル化されるDNA配列を含む複数の低メチル化可変標的領域を含むエピジェネティック標的領域セットに関して、メチル化レベルを決定するステップ;および
b)前記メチル化レベルに基づいて、前記cfDNAが起源とする複数の免疫細胞タイプの各々の量を決定するステップ
を含む、方法。
実施形態4 試料中のcfDNAを解析する方法であって、
a)前記cfDNAまたはその部分試料から、少なくとも1つのエピジェネティック標的領域セットを捕捉するステップであって、前記cfDNAまたはその部分試料を、前記少なくとも1つのエピジェネティック標的領域セットに対して特異的な標的特異的プローブと接触させることを含み、前記エピジェネティック標的領域セットが、複数の免疫細胞タイプにおいて差次的に低メチル化されるDNA配列を含む低メチル化可変標的領域を含む、ステップ;
b)前記標的領域に関してメチル化レベルを決定するステップ;および
c)前記DNAが起源とする前記複数の免疫細胞タイプの各々の量を決定するステップ
を含む、方法。
実施形態5 試料中のDNAを解析する方法であって、
a)前記DNAを、前記DNA中の改変シトシンを認識する作用剤と接触させることによって、前記試料を複数の部分試料に分配するステップであって、前記複数が、第1の部分試料および第2の部分試料を含み、前記第1の部分試料が、前記第2の部分試料よりも大きい割合で前記改変シトシンを有するDNAを含む、ステップ;
b)前記複数の部分試料のうちの1つまたは複数からのDNAをシーケンシングするステップ;ならびに
c)DNA配列のレベルを検出して、前記DNAが起源とする複数の免疫細胞タイプの各々の量を決定するステップであって、前記複数の免疫細胞タイプが、
i.ナイーブリンパ球および活性化されたリンパ球;
ii.単球およびマクロファージ;または
iii.骨髄球、好中球、および好酸球
を含む、ステップ
を含む、方法。
実施形態6 試料中のDNAを解析する方法であって、
a)前記DNAを、前記DNA中の改変シトシンを認識する作用剤と接触させることによって、前記試料を複数の部分試料に分配するステップであって、前記複数が、第1の部分試料および第2の部分試料を含み、前記第1の部分試料が、前記第2の部分試料よりも大きい割合で前記改変シトシンを有するDNAを含む、ステップ;
b)前記第1および第2の部分試料のうち少なくとも一方から、DNAの少なくとも1つのエピジェネティック標的領域セットを捕捉するステップであって、前記DNAを、前記少なくとも1つのエピジェネティック標的領域セットに対して特異的な標的特異的プローブと接触させることを含み、前記エピジェネティック標的領域セットの前記標的領域が、複数の免疫細胞タイプにおいて差次的にメチル化されるDNA配列を含み、前記複数の免疫細胞タイプが、
iv.ナイーブリンパ球および活性化されたリンパ球;
v.単球およびマクロファージ;または
vi.骨髄球、好中球、および好酸球
を含み、
vii.それによって、捕捉されたDNAを提供する、ステップ;ならびに
c)前記捕捉されたDNAをシーケンシングし、前記DNAが起源とする複数の免疫細胞タイプの各々のレベルを決定するステップ
を含む、方法。
実施形態7 試料中のDNAを解析する方法であって、
a)前記DNAを、前記DNA中の改変シトシンを認識する作用剤と接触させることによって、前記試料を複数の部分試料に分配するステップであって、前記複数が、第1の部分試料および第2の部分試料を含み、前記第1の部分試料が、前記第2の部分試料よりも大きい割合で前記改変シトシンを有するDNAを含む、ステップ;
b)前記第1および第2の部分試料のうち少なくとも一方から、DNAの少なくとも1つのエピジェネティック標的領域セットを捕捉するステップであって、少なくとも1つのエピジェネティック標的領域セットが、低メチル化可変標的領域セットを含み、それによって、捕捉されたDNAを提供する、ステップ;
c)前記捕捉されたDNAをシーケンシングするステップ;ならびに
d)捕捉されたDNA配列のレベルを検出し、前記DNAが起源とする複数の免疫細胞タイプの各々のレベルを決定するステップ
を含む、方法。
実施形態8 試料中のDNAを解析する方法であって、
a)前記DNAを、前記DNA中の改変シトシンを認識する作用剤と接触させることによって、前記試料を複数の部分試料に分配するステップであって、前記複数が、第1の部分試料および第2の部分試料を含み、前記第1の部分試料が、前記第2の部分試料よりも大きい割合で前記改変シトシンを有するDNAを含む、ステップ;
b)前記第1および第2の部分試料のうち少なくとも一方から、DNAの少なくとも1つのエピジェネティック標的領域セットを捕捉するステップであって、前記DNAを、前記少なくとも1つのエピジェネティック標的領域セットに対して特異的な標的特異的プローブと接触させることを含み、前記エピジェネティック標的領域セットの前記標的領域が、複数の免疫細胞タイプにおいて低メチル化されたDNA配列を含み、それによって、捕捉されたDNAを提供する、ステップ;ならびに
c)前記捕捉されたDNAをシーケンシングするステップ
を含む、方法。
実施形態9 前記第1および第2の部分試料のうち少なくとも一方から、DNAの少なくとも1つのエピジェネティック標的領域セットを捕捉するステップであって、前記エピジェネティック標的領域セットの前記標的領域が、複数の免疫細胞タイプにおいて差次的にメチル化されるDNA配列を含み、前記捕捉するステップが、前記シーケンシングするステップの前に実施される、ステップ、を含む、実施形態5または7に記載の方法。
実施形態10 前記エピジェネティック標的領域セットが、高メチル化可変標的領域セットおよび低メチル化可変標的領域セットを含む、先行する実施形態のいずれか一項に記載の方法。
実施形態11 前記複数の免疫細胞タイプが、ナイーブリンパ球および活性化されたリンパ球を含む、先行する実施形態のいずれか一項に記載の方法。
実施形態12 前記複数の免疫細胞タイプが、ナイーブT細胞、ナイーブB細胞、エフェクターCD4 T細胞、エフェクターCD8 T細胞、Treg細胞、形質細胞、およびメモリー細胞を含む、直前に先行する実施形態に記載の方法。
実施形態13 前記エフェクターCD4 T細胞が、エフェクターメモリーCD4 T細胞およびセントラルメモリーCD4 T細胞を含み、前記エフェクターCD8 T細胞が、エフェクターメモリーCD8 T細胞およびセントラルメモリーCD8 T細胞を含む、直前に先行する実施形態に記載の方法。
実施形態14 前記複数の免疫細胞タイプが、単球およびマクロファージを含む、先行する実施形態のいずれか一項に記載の方法。
実施形態15 前記複数の免疫細胞タイプが、骨髄球、好中球、および好酸球を含む、先行する実施形態のいずれか一項に記載の方法。
実施形態16 前記複数の免疫細胞タイプが、後骨髄球を含む、直前に先行する実施形態のいずれか一項に記載の方法。
実施形態17 前記複数の免疫細胞タイプが、ナチュラルキラー(NK)細胞を含む、先行する実施形態のいずれか一項に記載の方法。
実施形態18 前記複数の免疫細胞タイプの各々のレベルが、総血液細胞のレベルと比較して決定される、先行する実施形態のいずれか一項に記載の方法。
実施形態19 前記試料が血液試料である、先行する実施形態のいずれか一項に記載の方法。
実施形態20 前記試料が血漿試料である、先行する実施形態のいずれか一項に記載の方法。
実施形態21 前記試料が、組織試料から得られる、先行する実施形態のいずれか一項に記載の方法。
実施形態22 前記組織試料が、生検、微細針吸引物、またはホルマリン固定パラフィン包埋組織試料である、直前に先行する実施形態に記載の方法。
実施形態23 前記DNAが、無細胞DNA(cfDNA)を含む、先行する実施形態のいずれか一項に記載の方法。
実施形態24 前記DNAが、前記試料中に本来存在するインタクトな細胞から単離されたDNAを含む、実施形態5~23のいずれか一項に記載の方法。
実施形態25 前記複数の免疫細胞タイプの前記決定されたレベルまたは量に基づいて、免疫細胞タイプのレベルまたは量の比率を決定するステップを含む、先行する実施形態のいずれか一項に記載の方法。
実施形態26 前記比率の分子が、好中球、単球、または好中球および単球の両方のレベルまたは量を含む、直前に先行する実施形態に記載の方法。
実施形態27 前記比率の分母が、T細胞、B細胞、NK細胞、または総リンパ球のレベルまたは量を含む、実施形態25または26に記載の方法。
実施形態28 前記比率の分子が、好中球のレベルまたは量を含み、前記比率の分母が、総リンパ球のレベルまたは量を含む、実施形態25~27のいずれか一項に記載の方法。
実施形態29 前記比率の分子が、単球のレベルまたは量を含み、前記比率の分母が、T細胞のレベルまたは量を含む、実施形態25~27のいずれか一項に記載の方法。
実施形態30 前記複数の免疫細胞タイプのうち少なくとも1つのターンオーバーの頻度を決定するステップを含む、先行する実施形態のいずれか一項に記載の方法。
実施形態31 前記ターンオーバーが、増殖を含む、直前に先行する実施形態に記載の方法。
実施形態32 前記ターンオーバーが、アポトーシスを含む、実施形態30に記載の方法。
実施形態33 前記DNAが起源とする免疫細胞タイプ以外の少なくとも1つの細胞タイプのレベルを決定するステップを含む、先行する実施形態のいずれか一項に記載の方法。
実施形態34 前記試料または部分試料中の全ての他の細胞タイプを起源とするDNA中の同じ標的領域と比較して、免疫細胞タイプ以外の前記細胞タイプを起源とするDNA中の標的領域において配列非依存的な差を含む少なくとも1つのエピジェネティック標的領域セットを捕捉するステップを含む、直前に先行する実施形態に記載の方法。
実施形態35 免疫細胞タイプ以外の前記細胞タイプが、血液細胞タイプではない、実施形態33または34に記載の方法。
実施形態36 免疫細胞タイプ以外の前記細胞タイプが、結腸直腸、肺、乳房、前立腺、皮膚、胃、膀胱、肝臓、卵巣、膵臓、扁平上皮、唾液腺、喉頭、下咽頭、鼻、副鼻腔、鼻咽頭、または腎臓である、直前に先行する実施形態に記載の方法。
実施形態37 前記試料が、対象から得られる、先行する実施形態のいずれか一項に記載の方法。
実施形態38 前記対象ががんまたは前がんを有する可能性を決定するステップを含む、直前に先行する実施形態に記載の方法。
実施形態39 前記対象ががんを有する可能性を決定するステップを含む、直前に先行する実施形態に記載の方法。
実施形態40 前記がんが、免疫細胞タイプのがんである、直前に先行する実施形態に記載の方法。
実施形態41 前記がんがリンパ球性がんである、直前に先行する実施形態に記載の方法。
実施形態42 前記がんが、白血病、リンパ腫、または骨髄腫である、直前に先行する実施形態に記載の方法。
実施形態43 前記がんが骨髄性がんである、実施形態38~40のいずれか一項に記載の方法。
実施形態44 前記がんが、免疫細胞タイプ以外の細胞または組織タイプのがんである、実施形態38または39に記載の方法。
実施形態45 前記がんもしくは前がんが、血液学的がんもしくは前がん以外のがんもしくは前がんであるか、または前記がんもしくは前がんが固形腫瘍がんであり、必要に応じて、前記固形腫瘍がんが、癌腫または肉腫である、実施形態38、39または44のいずれか一項に記載の方法。
実施形態46 前記がんが、結腸直腸がん、肺がん、乳がん、前立腺がん、皮膚がん、胃がん、膀胱がん、肝臓がん、卵巣がん、膵臓がん、頭頸部がん、または腎臓がんである、実施形態44または45に記載の方法。
実施形態46.1 がんが結腸直腸がんである、実施形態46に記載の方法。
実施形態46.2 がんが肺がんである、実施形態46に記載の方法。
実施形態46.3 がんが乳がんである、実施形態46に記載の方法。
実施形態46.4 がんが前立腺がんである、実施形態46に記載の方法。
実施形態46.5 がんが皮膚がんである、実施形態46に記載の方法。
実施形態46.6 がんが胃がんである、実施形態46に記載の方法。
実施形態46.7 がんが膀胱がんである、実施形態46に記載の方法。
実施形態46.8 がんが肝臓がんである、実施形態46に記載の方法。
実施形態46.9 がんが卵巣がんである、実施形態46に記載の方法。
実施形態46.10 がんが膵臓がんである、実施形態46に記載の方法。
実施形態46.11 がんが頭頸部がんである、実施形態46に記載の方法。
実施形態46.12 がんが腎臓がんである、実施形態46に記載の方法。
実施形態47 前記対象が前がんを有する可能性を決定するステップを含む、実施形態38に記載の方法。
実施形態48 前記前がんが腺腫である、直前に先行する実施形態に記載の方法。
実施形態49 前記腺腫が、進行した腺腫である、直前に先行する実施形態に記載の方法。
実施形態50 前記前がんが、結腸直腸前がん、肺前がん、乳房前がん、前立腺前がん、皮膚前がん、胃前がん、膀胱前がん、肝臓前がん、卵巣前がん、膵臓前がん、頭頸部前がん、または腎臓前がんである、実施形態47~49のいずれか一項に記載の方法。
実施形態51 前記対象が感染症を有する可能性を決定するステップを含む、実施形態37~50のいずれか一項に記載の方法。
実施形態52 前記対象が移植片拒絶を有する可能性を決定するステップを含む、実施形態37~51のいずれか一項に記載の方法。
実施形態53 前記複数の免疫細胞タイプの各々の量を決定する前記ステップまたは前記シーケンシングするステップが、複数のシーケンシング読み取りデータを生成することを含み、前記方法が、前記複数の配列読み取りデータを、1つまたは複数の参照配列にマッピングして、マッピングされた配列読み取りデータを生成するステップ、ならびに前記マッピングされた配列読み取りデータをプロセシングして、前記対象ががん、前がん、感染症または移植片拒絶を有する可能性を決定するステップをさらに含む、実施形態38~52のいずれか一項に記載の方法。
実施形態54 前記試料が、がんを有すると以前に診断されており、1つまたは複数の以前のがん処置を受けている対象から得られ、必要に応じて、前記試料が、前記1つまたは複数の以前のがん処置後の1つまたは複数の事前に選択された時点で得られる、先行する実施形態のいずれか一項に記載の方法。
実施形態55 がん再発スコアを決定するステップをさらに含み、必要に応じて、前記対象のがん再発ステータスが、前記がん再発スコアが既定の閾値もしくはそれより上であると決定される場合にがん再発のリスクがあると決定されるか、または前記対象の前記がん再発ステータスが、前記がん再発スコアが前記既定の閾値より下である場合にがん再発のリスクがより低いと決定される、直前に先行する実施形態に記載の方法。
実施形態56 前記対象の前記がん再発スコアを、既定のがん再発閾値と比較するステップをさらに含み、前記対象が、前記がん再発スコアが前記がん再発閾値より上である場合、その後のがん処置の候補であると分類され、前記がん再発スコアが前記がん再発閾値より下である場合、その後のがん処置の候補ではないと分類される、直前に先行する実施形態に記載の方法。
実施形態57 前記捕捉するステップが、配列可変標的領域を捕捉することを含む、実施形態2、4、6または8~56のいずれか一項に記載の方法。
実施形態57.1 配列可変標的領域が、参照配列と比較して単一ヌクレオチド変異を含む、実施形態57に記載の方法。
実施形態57.2 配列可変標的領域が、参照配列と比較してインデルを含む、実施形態57または57.1に記載の方法。
実施形態58 前記捕捉するステップが、前記DNAを、前記少なくとも1つのエピジェネティック標的領域セットに対して特異的な標的特異的プローブおよび前記配列可変標的領域に対して特異的な標的特異的プローブと接触させることを含む、直前に先行する実施形態に記載の方法。
実施形態59 前記改変シトシンがメチルシトシンである、実施形態5~58のいずれか一項に記載の方法。
実施形態60 改変シトシンを認識する前記作用剤がメチル結合試薬である、実施形態5~58のいずれか一項に記載の方法。
実施形態61 前記メチル結合試薬が抗体である、直前に先行する実施形態に記載の方法。
実施形態62 改変シトシンを認識する前記作用剤が、メチル結合タンパク質であるか、またはメチル結合ドメインを含む、実施形態60に記載の方法。
実施形態63 前記メチル結合試薬が、5-メチルシトシンを特異的に認識する、実施形態60~62に記載の方法。
実施形態64 前記メチル結合試薬が、固体支持体上に固定化される、実施形態60~63に記載の方法。
実施形態65 前記分配するステップが、メチル化DNAの免疫沈降を含む、実施形態5~64のいずれか一項に記載の方法。
実施形態66 前記分配するステップが、タンパク質への結合に基づいて分配することを含み、必要に応じて、前記タンパク質が、メチル化されたタンパク質、アセチル化されたタンパク質、非メチル化タンパク質、非アセチル化タンパク質であり;および/または必要に応じて、前記タンパク質がヒストンである、実施形態5~58のいずれか一項に記載の方法。
実施形態67 前記分配するステップが、前記試料の前記DNAを、前記タンパク質に対して特異的であり、固体支持体上に固定化された結合試薬と接触させることを含む、直前に先行する実施形態に記載の方法。
実施形態68 少なくとも1つの部分試料を、前記捕捉するステップまたは前記シーケンシングするステップの前に、制限酵素と接触させるステップを含み、必要に応じて、前記接触させるステップが、前記試料を前記複数の部分試料に分配した後に行われる、実施形態5~67のいずれか一項に記載の方法。
実施形態69 前記制限酵素がMDREである、直前に先行する実施形態に記載の方法。
実施形態70 前記第2の部分試料が、前記MDREと接触させられる、直前に先行する実施形態に記載の方法。
実施形態71 前記制限酵素がMSREである、実施形態68~70のいずれか一項に記載の方法。
実施形態72 前記第1の部分試料が、前記MSREと接触させられる、直前に先行する実施形態に記載の方法。
実施形態73 アダプターを前記DNAにライゲーションし、それによって、アダプターライゲーションしたDNAを産生するステップを含む、先行する実施形態のいずれか一項に記載の方法。
実施形態74 前記アダプターライゲーションしたDNAが、前記シーケンシングするステップの前に増幅される、直前に先行する実施形態に記載の方法。
実施形態75 前記部分試料が、前記シーケンシングするステップの前にプールされる、実施形態5~74のいずれか一項に記載の方法。
実施形態76 前記エピジェネティック標的領域セットが、複数の免疫細胞タイプにおいて差次的に低メチル化されるDNA配列を含む低メチル化可変標的領域を含む、実施形態1~4または6~75のいずれか一項に記載の方法。
実施形態77 前記低メチル化可変標的領域が、複数の免疫細胞タイプにおいて差次的に低メチル化されるDNA配列を含む、実施形態3、4、7または10~76のいずれか一項に記載の方法。
実施形態78 複数の免疫細胞タイプにおいて差次的に低メチル化される前記DNA配列が、少なくとも1つの免疫細胞タイプにおいて、前記試料中の任意の他の免疫細胞タイプにおける同じ配列のメチル化の程度よりも検出可能に低い程度のメチル化を含む、実施形態3、4、76または77のいずれか一項に記載の方法。
実施形態79 複数の免疫細胞タイプにおいて差次的に低メチル化される前記DNA配列が、少なくとも1つの免疫細胞タイプにおいて、任意の他の免疫細胞タイプにおける同じ配列のメチル化の程度よりも検出可能に低い程度のメチル化を含む、実施形態3、4、76または77のいずれか一項に記載の方法。
実施形態80 複数の免疫細胞タイプにおいて差次的に低メチル化される前記DNA配列が、1つの免疫細胞タイプにおいて、前記試料中の任意の他の免疫細胞タイプにおける同じ配列のメチル化の程度よりも検出可能に低い程度のメチル化を含む、実施形態3、4、76または77のいずれか一項に記載の方法。
実施形態81 複数の免疫細胞タイプにおいて差次的に低メチル化される前記DNA配列が、1つの免疫細胞タイプにおいて、任意の他の免疫細胞タイプにおける同じ配列のメチル化の程度よりも検出可能に低い程度のメチル化を含む、実施形態3、4、76または77のいずれか一項に記載の方法。
実施形態82 複数の免疫細胞タイプにおいて差次的に低メチル化される前記DNA配列が、少なくとも1つの免疫細胞タイプにおいて、少なくとも1つの他の免疫細胞タイプにおける同じ配列のメチル化の程度よりも検出可能に低い程度のメチル化を含み、前記試料中の少なくとも1つの非免疫細胞タイプにおける同じ配列のメチル化の程度よりも検出可能に低い程度のメチル化を含む、実施形態3、4、76または77のいずれか一項に記載の方法。
実施形態83 複数の免疫細胞タイプにおいて差次的に低メチル化される前記DNA配列が、少なくとも1つの免疫細胞タイプにおいて、少なくとも1つの他の免疫細胞タイプにおける同じ配列のメチル化の程度よりも検出可能に低い程度のメチル化を含み、前記試料中の任意の非免疫細胞タイプにおける同じ配列のメチル化の程度よりも検出可能に低い程度のメチル化を含む、実施形態3、4、76または77のいずれか一項に記載の方法。
実施形態83.1 差次的に低メチル化されたDNAが、1つまたは複数の他の細胞タイプにおける同じ遺伝情報を含むDNAと比較して、1つの細胞タイプにおいて減少したレベルまたは程度のメチル化を含む、実施形態3、4、7または10~77のいずれか1つに記載の方法。
実施形態83.2 差次的に低メチル化されたDNAが、全ての他の免疫細胞タイプにおける同じ遺伝情報を含むDNAと比較して、1つまたは複数の免疫細胞タイプにおいて減少したレベルまたは程度のメチル化を含む、実施形態3、4、7または10~77のいずれか1つに記載の方法。
実施形態83.3 差次的に低メチル化されたDNAが、全ての他の血液細胞タイプにおける同じ遺伝情報を含むDNAと比較して、1つまたは複数の免疫細胞タイプにおいて減少したレベルまたは程度のメチル化を含み、必要に応じて、全ての他の血液細胞タイプのDNAにおけるメチル化のレベルまたは程度が、細胞タイプからのDNAの存在量に従って、加重平均として表される、実施形態3、4、7または10~77のいずれか1つに記載の方法。
実施形態84 前記検出可能に低い程度のメチル化が、前記他の細胞タイプにおける同じ配列よりも1つ少ないメチル化シトシンである、実施形態78~83のいずれか一項に記載の方法。
実施形態85 前記検出可能に低い程度のメチル化が、前記他の細胞タイプにおける同じ配列よりも2つ少ないメチル化シトシンである、実施形態78~83のいずれか一項に記載の方法。
実施形態86 前記検出可能に低い程度のメチル化が、前記他の細胞タイプにおける同じ配列よりも3つ少ないメチル化シトシンである、実施形態78~83のいずれか一項に記載の方法。
実施形態87 前記検出可能に低い程度のメチル化が、前記他の細胞タイプにおける同じ配列よりも4つ少ないメチル化シトシンである、実施形態78~83のいずれか一項に記載の方法。
実施形態88 前記検出可能に低い程度のメチル化が、前記他の細胞タイプにおける同じ配列よりも5つまたはそれよりも少ないメチル化シトシンである、実施形態78~83のいずれか一項に記載の方法。
実施形態89 前記エピジェネティック標的領域セットが、複数の免疫細胞タイプにおいて差次的に高メチル化されるDNA配列を含む高メチル化可変標的領域を含む、実施形態1~4または6~88のいずれか一項に記載の方法。
実施形態90 複数の免疫細胞タイプにおいて差次的に高メチル化される前記DNA配列が、少なくとも1つの免疫細胞タイプにおいて、前記試料中の任意の他の免疫細胞タイプにおける同じ配列のメチル化の程度よりも検出可能に高い程度のメチル化を含む、実施形態89に記載の方法。
実施形態91 複数の免疫細胞タイプにおいて差次的に高メチル化される前記DNA配列が、少なくとも1つの免疫細胞タイプにおいて、任意の他の免疫細胞タイプにおける同じ配列のメチル化の程度よりも検出可能に高い程度のメチル化を含む、実施形態89に記載の方法。
実施形態92 複数の免疫細胞タイプにおいて差次的に高メチル化される前記DNA配列が、1つの免疫細胞タイプにおいて、前記試料中の任意の他の免疫細胞タイプにおける同じ配列のメチル化の程度よりも検出可能に高い程度のメチル化を含む、実施形態89に記載の方法。
実施形態93 複数の免疫細胞タイプにおいて差次的に高メチル化される前記DNA配列が、1つの免疫細胞タイプにおいて、任意の他の免疫細胞タイプにおける同じ配列のメチル化の程度よりも検出可能に高い程度のメチル化を含む、実施形態89に記載の方法。
実施形態94 複数の免疫細胞タイプにおいて差次的に高メチル化される前記DNA配列が、少なくとも1つの免疫細胞タイプにおいて、少なくとも1つの他の免疫細胞タイプにおける同じ配列のメチル化の程度よりも検出可能に高い程度のメチル化を含み、前記試料中の少なくとも1つの非免疫細胞タイプにおける同じ配列のメチル化の程度よりも検出可能に低い程度のメチル化を含む、実施形態89に記載の方法。
実施形態95 複数の免疫細胞タイプにおいて差次的に高メチル化される前記DNA配列が、少なくとも1つの免疫細胞タイプにおいて、少なくとも1つの他の免疫細胞タイプにおける同じ配列のメチル化の程度よりも検出可能に高い程度のメチル化を含み、前記試料中の任意の非免疫細胞タイプにおける同じ配列のメチル化の程度よりも検出可能に低い程度のメチル化を含む、実施形態89に記載の方法。
実施形態95.1 差次的に高メチル化されたDNAが、1つまたは複数の他の細胞タイプにおける同じ遺伝情報を含むDNAと比較して、1つの細胞タイプにおいて増加したレベルまたは程度のメチル化を含む、実施形態89に記載の方法。
実施形態95.2 差次的に高メチル化されたDNAが、全ての他の免疫細胞タイプにおける同じ遺伝情報を含むDNAと比較して、1つまたは複数の免疫細胞タイプにおいて増加したレベルまたは程度のメチル化を含む、実施形態89に記載の方法。
実施形態95.3 差次的に高メチル化されたDNAが、全ての他の血液細胞タイプにおける同じ遺伝情報を含むDNAと比較して、1つまたは複数の免疫細胞タイプにおいて増加したレベルまたは程度のメチル化を含み、必要に応じて、全ての他の血液細胞タイプのDNAにおけるメチル化のレベルまたは程度が、細胞タイプからのDNAの存在量に従って、加重平均として表される、実施形態89に記載の方法。
実施形態96 前記検出可能に高い程度のメチル化が、前記他の細胞タイプにおける同じ配列よりも1つ多いシトシンメチル化である、実施形態90~95のいずれか一項に記載の方法。
実施形態97 前記検出可能に高い程度のメチル化が、前記他の細胞タイプにおける同じ配列よりも2つ多いシトシンメチル化である、実施形態90~95のいずれか一項に記載の方法。
実施形態98 前記検出可能に高い程度のメチル化が、前記他の細胞タイプにおける同じ配列よりも3つ多いシトシンメチル化である、実施形態90~95のいずれか一項に記載の方法。
実施形態99 前記検出可能に高い程度のメチル化が、前記他の細胞タイプにおける同じ配列よりも4つ多いシトシンメチル化である、実施形態90~95のいずれか一項に記載の方法。
実施形態100 前記検出可能に高い程度のメチル化が、前記他の細胞タイプにおける同じ配列よりも5つ多いまたは5つよりも多いシトシンメチル化である、実施形態90~95のいずれか一項に記載の方法。
実施形態101 赤血球または赤血球前駆体を起源とする前記試料中のDNAの量を決定するステップ、またはそのレベルを検出するステップを含む、先行する実施形態のいずれか一項に記載の方法。
実施形態102 顆粒細胞を起源とする前記試料中のDNAの量を決定するステップ、またはそのレベルを検出するステップを含む、先行する実施形態のいずれか一項に記載の方法。
実施形態103 前記検出可能に低いまたは高い程度のメチル化が、別の群のドナーと比較して、少なくとも1つの群のドナー由来の試料中に存在し、必要に応じて、前記少なくとも1つの群のドナーが、治療に応答するがんを有し、前記別の群のドナーが、前記治療に応答しないがんを有する、実施形態3、4または76~102のいずれか一項に記載の方法。
図1Aは、本明細書に開示されるある特定の実施形態に従う例示的なワークフローを示す。 同上。
図1Bは、細胞タイプまたは細胞クラスターの関数としての、細胞タイプ特異的または細胞クラスター特異的な差次的メチル化を有すると同定された遺伝子座のメチル化レベルを示すヒートマップである。DMSおよびDMRは、差次的にメチル化された部位(例えば、個々のCpG)および差次的にメチル化された領域(複数のDMSを含む)を示す。
図1Cは、箱ひげ図としての、結腸直腸がん(CRC)を有する個体由来の試料およびがんなしの個体由来の試料中の示された細胞タイプおよび細胞クラスターに関して同定された例示的な高メチル化領域の相対的メチル化を示す。箱ひげ図は、CRC試料およびがんなしの試料におけるメチル化スコアの分布を示す。メチル化スコアは、入力cfDNAによって正規化した、メチル化分画(高メチル化分配および中間分配)中の総分子である。箱ひげ図中の各箱では、右端の線、中央の線および左端の線は、試料にわたるメチル化スコアの75%分位点(Q75)、50%分位点または中央値(Q50)および25%分位点(Q25)に対応する。右端のひげおよび左端のひげは、Q75+1.5*四分位範囲(IQR)およびQ25-1.5IQRに対応し、IQRは、Q75-Q25である。ドットは、ひげによってマークされる範囲の外にその値がある、外れ値である。 同上。
図1Dは、箱ひげ図としての、示されたタイプの初期がんを有する個体由来の試料およびがんなしの個体由来の試料中の示された細胞タイプおよび細胞クラスターに関して同定された例示的な高メチル化領域の相対的メチル化を示す。箱ひげ図は、試料におけるメチル化スコアの分布を示す。メチル化スコアは、入力cfDNAによって正規化した、メチル化分画(高メチル化分配および中間分配)中の総分子である。箱ひげ図中の各箱では、右端の線、中央の線および左端の線は、試料にわたるメチル化スコアの75%分位点(Q75)、50%分位点または中央値(Q50)および25%分位点(Q25)に対応する。右端のひげおよび左端のひげは、Q75+1.5*四分位範囲(IQR)およびQ25-1.5IQRに対応し、IQRは、Q75-Q25である。ドットは、ひげによってマークされる範囲の外にその値がある、外れ値である。 同上。
図1Eは、箱ひげ図としての、示されたタイプの後期がんを有する個体由来の試料およびがんなしの個体由来の試料中の示された細胞タイプおよび細胞クラスターに関して同定された例示的な高メチル化領域の相対的メチル化を示す。箱ひげ図は、試料におけるメチル化スコアの分布を示す。メチル化スコアは、入力cfDNAによって正規化した、メチル化分画(高メチル化分配および中間分配)中の総分子である。箱ひげ図中の各箱では、右端の線、中央の線および左端の線は、試料にわたるメチル化スコアの75%分位点(Q75)、50%分位点または中央値(Q50)および25%分位点(Q25)に対応する。右端のひげおよび左端のひげは、Q75+1.5*四分位範囲(IQR)およびQ25-1.5IQRに対応し、IQRは、Q75-Q25である。ドットは、ひげによってマークされる範囲の外にその値がある、外れ値である。 同上。
図2は、本開示の一部の実施形態による使用にとって好適なシステムの例の概略図である。
図3は、がんなしの対象および結腸直腸がん(crc)を有する対象由来の血液試料中のcfDNAへの寄与因子としての、B細胞、顆粒細胞、NK細胞、T細胞、および赤血球前駆体の推定されたパーセンテージを示す。 同上。
ある特定の実施形態の詳細な説明
本発明のある特定の実施形態に対する参照が、ここで詳細になされる。本発明は、そのような実施形態と併せて説明されるが、それらは本発明をそれらの実施形態に限定すると意図されないことが理解される。逆に、本発明は、添付の特許請求の範囲によって定義される本発明内に含まれ得る全ての代替物、改変、および等価物を網羅することが意図される。
本教示を詳細に説明する前に、本開示が具体的な組成物にもプロセスステップにも限定されず、したがって、異なり得ることを理解されたい。本明細書および添付の特許請求の範囲で使用される場合、単数形「1つの(a)」、「1つの(an)」、および「その(the)」は、文脈が特に明白に指示していない限り、複数の参照物を含むことに留意すべきである。このように、例えば、「1つの核酸」への言及は、複数の核酸を含み、「1つの細胞」への言及は、複数の細胞を含む、などとなる。
数値範囲は、範囲を定義する数値を含む。測定されたおよび測定可能な値は、有効数字および測定に関連する誤差を考慮に入れて、近似値であると理解される。同様に、「含む(comprise)」、「含む(comprises)」、「含むこと(comprising)」、「含有する(contain)」、「含有する(contains)」、「含有すること(containing)」、「含む(include)」、「含む(includes)」、および「含むこと(including)」の使用は、限定することを意図しない。前述の一般的な説明および詳細な説明は共に単に例示的で説明的であり、教示を制限するものではないことを理解されたい。
上記の明細書に具体的に記載していない限り、様々な構成要素を「含む」ことを列挙する本明細書における実施形態は、列挙された構成要素「からなる」、またはそれ「から本質的になる」とも企図され、様々な構成要素「からなる」ことを列挙する本明細書における実施形態は、列挙された構成要素を「含む」、またはそれ「から本質的になる」とも企図され、様々な構成要素「から本質的になる」ことを列挙する本明細書中の実施形態は、列挙された構成要素「からなる」またはそれを「含む」とも企図される(この互換性は、特許請求の範囲におけるこれらの用語の使用には当てはまらない)。
本明細書で使用されるセクションの見出しは、構成目的のためであり、開示された主題をいかなるようにも制限すると解釈されるべきではない。参照により組み込まれるいずれかの文書または他の資料が、本明細書のいずれかの明白な内容と矛盾する場合、定義を含む本明細書が優先する。
定義
「無細胞DNA」、「cfDNA分子」または単に「cfDNA」は、細胞外形態で対象中に(例えば、血液、血清、血漿、または他の体液、例えば、リンパ、脳脊髄液、尿、もしくは喀痰中に)天然に存在するDNA分子を含む。cfDNAは、大きい複雑な生物、例えば、哺乳動物中の細胞(単数または複数)中に以前には存在していたが、生物中で見出される液体中への細胞からの放出を受けており、in vitro細胞溶解ステップを実施する必要なしに、液体の試料から得られ得る。cfDNA分子は、DNA断片として存在し得る。
本明細書で使用される場合、核酸、例えば、DNA分子の「分配」は、複数の部分試料または部分集団の各々中に異なる割合で存在する1つまたは複数の改変または特色に基づいて、核酸の試料または集団を、核酸の複数の部分試料または部分集団に分離、分画、分別、または富化することを意味する。分配は、1つまたは複数のメチル化核酸塩基の存在または非存在に基づいて、核酸分子を物理的に分配することを含み得る。試料または集団は、遺伝子変化もしくはエピジェネティック変化または疾患状態を示す特徴に基づいて、1つまたは複数の分配された部分試料または部分集団に分配され得る。
本明細書で使用される場合、改変または他の特色を有するヌクレオチドの分画が、第2の集団中よりも第1の試料または集団中で高い場合、その改変または他の特色は、核酸の第2の試料または集団中よりも、第1の試料または集団中に「より大きい割合」で存在する。例えば、第1の試料において、ヌクレオチドの10分の1がmCであり、第2の試料において、ヌクレオチドの20分の1がmCである場合には、第1の試料は、第2の試料よりも大きい割合で、5-メチル化のシトシン改変を含む。
本明細書で使用される場合、「本来単離された」試料の形態は、それが単離された時点の、単離された試料の化学構造を変化させる任意の手順を受ける前の、試料の組成または化学構造を指す。同様に、DNA分子に「本来存在する」特色は、DNA分子がDNA分子の化学構造を変化させる手順を受ける前の、「元のDNA分子」に存在する特色、またはその特色を「本来含む」DNA分子に存在する特色を指す。
本明細書で使用される場合、所定の核酸塩基の「塩基対形成特異性を実質的に変更させることがない」は、シーケンシングされ得る核酸塩基を含む分子の大部分が、本来単離された試料中にそれがあったときのその塩基対形成特異性と比較して、所定の核酸塩基の塩基対形成特異性の変更を有さないことを意味する。一部の実施形態では、シーケンシングされ得る核酸塩基を含む分子の75%、90%、95%、または99%は、本来単離された試料中にそれがあったときのその塩基対形成特異性と比較して、塩基対形成特異性の変更を有さない。本明細書で使用される場合、所定の核酸塩基の「変更された塩基対形成特異性」は、シーケンシングされ得る核酸塩基を含む分子の大部分が、本来単離された試料中のその塩基対形成特異性と比較して、その核酸塩基において塩基対形成特異性を有することを意味する。
本明細書で使用される場合、「塩基対形成特異性」は、所定の塩基が最も優先的に対形成する標準的なDNA塩基(A、C、G、またはT)を指す。例えば、非改変シトシンおよび5-メチルシトシンは、同じ塩基対形成特異性(すなわち、Gに対する特異性)を有するが、一方で、ウラシルはAに対する塩基対形成特異性を有するが、シトシンはGに対する塩基対形成特異性を有するので、ウラシルおよびシトシンは、異なる塩基対形成特異性を有する。Gと不安定な対を形成するウラシルの能力は、ウラシルがそれにもかかわらず4つの標準的なDNA塩基のうちAと最も優先的に対形成するので、無関係である。
本明細書で使用される場合、複数のメンバーを含む「組合せ」は、例えば、より大きい容器、例えば、マルチウェルプレート、チューブラック、冷蔵庫、冷凍庫、インキュベーター、水浴、アイスバケット、機械、または貯蔵の他の形態内の個別の容器または区画中の、それらのメンバーを含む単一の組成物、または近接した組成物のセットのいずれかを指す。
所定の標的セットのプローブのコレクションの「捕捉収率」は、典型的な条件下でプローブのコレクションが捕捉する標的セットに対応する核酸の量(例えば、別の標的セットと比較した量、または絶対量)を指す。例示的な典型的な捕捉条件は、ストリンジェントなハイブリダイゼーション緩衝液を含有する小さい反応体積(約20μL)における65℃で10~18時間の、試料核酸とプローブとのインキュベーションである。捕捉収率は、絶対的な用語で、またはプローブの複数のコレクションに関しては、相対的な用語で、表され得る。標的領域の複数のセットに関しての捕捉収率が比較される場合、それらは、標的領域セットのフットプリントサイズに関して正規化される(例えば、1キロ塩基あたりを基準にする)。このように、例えば、第1および第2の標的領域のフットプリントサイズがそれぞれ50kbおよび500kbである場合(0.1の正規化係数を与える)には、第1の標的領域セットに対応するDNAは、第1の標的領域セットに対応する捕捉されたDNAの体積濃度あたりの質量が、第2の標的領域セットに対応する捕捉されたDNAの体積濃度あたりの質量の0.1倍よりも高い場合、第2の標的領域セットに対応するDNAよりも高い収率で捕捉される。さらなる例として、同じフットプリントサイズを使用する場合、第1の標的領域セットに対応する捕捉されたDNAが、第2の標的領域セットに対応する捕捉されたDNAの体積濃度あたりの質量の0.2倍の体積濃度あたりの質量を有する場合には、第1の標的領域セットに対応するDNAは、第2の標的領域セットに対応するDNAよりも2倍高い捕捉収率で捕捉された。
1つもしくは複数の標的核酸、または少なくとも1つの標的領域を含む1つもしくは複数の核酸を「捕捉すること」は、1つもしくは複数の標的核酸、または少なくとも1つの標的領域を含む1つもしくは複数の核酸を、非標的核酸から、または少なくとも1つの標的領域を含まない核酸から優先的に単離または分離することを指す。
核酸の「捕捉されたセット」または「捕捉された」核酸は、捕捉を受けた核酸を指す。
本明細書で使用される場合、「捕捉部分」は、捕捉部分を欠如する分子からの、捕捉部分に連結された分子、例えば、核酸の親和性分離を可能にする分子である。例示的な捕捉部分としては、固相に連結されたもしくは連結可能なストレプトアビジンに結合することによって親和性分離を可能にするビオチン、または固相に連結されたもしくは連結可能な相補的オリゴヌクレオチドに結合することを通して親和性分離を可能にするオリゴヌクレオチドが挙げられる。
本明細書で使用される場合、「細胞クラスター」または「クラスター」は、複数の関連する細胞タイプ、例えば、免疫細胞タイプである。一部の実施形態では、クラスター内の細胞タイプは、例えば、複数の高メチル化可変標的領域および/または低メチル化可変標的領域において、類似のDNAメチル化プロファイルを有する。
「標的領域」は、例えば、プローブを使用することによる(例えば、配列相補性を介した)同定および/または捕捉のために標的とされるゲノム遺伝子座を指す。「標的領域セット」または「標的領域のセット」は、例えば、プローブのセットを使用することによる(例えば、配列相補性を介した)同定および/または捕捉のために標的とされる複数のゲノム遺伝子座を指す。
プライマー、プローブ、または他のオリゴヌクレオチドおよび標的配列の文脈における「特異的に結合する」は、適切なハイブリダイゼーション条件下で、プライマー、オリゴヌクレオチド、またはプローブが、その標的配列またはその複製物にハイブリダイズして安定なハイブリッドを形成するが、同時に、安定な非標的ハイブリッドの形成が最小限であることを意味する。このように、プライマーまたはプローブは、非標的配列に対してよりも十分に大きい程度に標的配列またはその複製物にハイブリダイズして、標的配列の捕捉または検出を最終的に可能にする。適切なハイブリダイゼーション条件は、当技術分野で周知であり、配列組成に基づいて予測され得るか、または通常の試験方法を使用することにより決定され得る(例えば、参照により本明細書に組み込まれる、Sambrook et al., Molecular Cloning, A Laboratory Manual, 2nd ed. (Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989)§§ 1.90-1.91, 7.37-7.57, 9.47-9.51および11.47-11.57、特に、§§ 9.50-9.51, 11.12-11.13, 11.45-11.47 および11.55-11.57を参照されたい)。
「配列可変標的領域」は、正常細胞と比較した、新生物細胞(例えば、腫瘍細胞およびがん細胞)における、ヌクレオチド置換(すなわち、単一ヌクレオチド変異)、挿入、欠失、または遺伝子融合もしくは転位などの配列の変化を示し得る標的領域を指す。配列可変標的領域セットは、配列可変標的領域のセットである。一部の実施形態では、配列可変標的領域は、50未満もしくはそれに等しい連続ヌクレオチド、例えば、40未満もしくはそれに等しい、30未満もしくはそれに等しい、20未満もしくはそれに等しい、10未満もしくはそれに等しい、5未満もしくはそれに等しい、4未満もしくはそれに等しい、3未満もしくはそれに等しい、2未満もしくはそれに等しい、または1未満もしくはそれに等しいヌクレオチドに影響を及ぼす変化を示し得る標的領域である。
「エピジェネティック標的領域」は、異なる細胞もしくは組織タイプ(例えば、異なるタイプの免疫細胞)において、または正常細胞と比較して、新生物細胞(例えば、腫瘍細胞およびがん細胞)において、配列非依存的な差を示し得る;あるいは異なる細胞タイプからの、もしくは健康な対象からのDNA、例えば、cfDNAと比較して、がんを有する対象からのDNA、例えば、cfDNAにおける、または背景cfDNA(例えば、造血細胞を起源とするcfDNA)と比較して、cfDNAに通常は実質的に寄与しない異なる細胞もしくは組織タイプ(例えば、免疫、肺、結腸など)を起源とするcfDNAにおける、配列非依存的な差(すなわち、このとき、ヌクレオチド配列に対する変化、例えば、メチル化、ヌクレオソーム分布、または他のエピジェネティック特色における差は存在しない)を示し得る、標的領域を指す。配列非依存的な変化の例としては、これらに限定されないが、メチル化(増加または減少)、ヌクレオソーム分布、cfDNA断片化パターン、CCCTC結合因子(「CTCF」)結合、転写開始部位(例えば、RNAポリメラーゼ構成要素の結合、調節タンパク質の結合、断片化特徴、およびヌクレオソーム分布のうちのいずれか1つまたは複数に関して)、および調節タンパク質結合領域における変化が挙げられる。したがって、エピジェネティック標的領域セットとしては、これらに限定されないが、高メチル化可変標的領域セット、低メチル化可変標的領域セット、および断片化可変標的領域セット、例えば、CTCF結合部位および転写開始部位が挙げられる。本目的に関して、新生物、腫瘍、もしくはがん関連の局所増幅および/または遺伝子融合を受けやすい遺伝子座もまた、エピジェネティック標的領域セットに含まれ得るが、それは、例えば、その検出が1つまたは少数の個々の位置でのベースコールの精度に依存しないので、局所増幅および/または遺伝子融合が比較的浅いシーケンシング深度で検出され得るという点で、シーケンシングによるコピー数の変化または参照ゲノムにおける1つより多くの遺伝子座にマッピングされる融合配列の検出が、ヌクレオチド置換、挿入、または欠失の検出よりも、上記で考察した例示的なエピジェネティック変化の検出に類似する傾向があるからである。エピジェネティック標的領域セットは、エピジェネティック標的領域のセットである。
本明細書で使用される場合、「差次的にメチル化された領域」は、少なくとも1つの他の細胞もしくは組織タイプからのDNAの同じ領域中のメチル化の程度と比較して、少なくとも1つの細胞もしくは組織タイプにおいて、検出可能に異なる程度のメチル化を有する;または健康な対象から得られた同じ細胞もしくは組織タイプにおけるDNAの同じ領域中のメチル化の程度と比較して、疾患もしくは障害を有する対象から得られた少なくとも1つの細胞もしくは組織タイプにおいて、検出可能に異なる程度のメチル化を有する、DNAの領域を指す。一部の実施形態では、差次的にメチル化された領域は、少なくとも1つの他の細胞もしくは組織タイプ、例えば、健康な個体におけるcfDNAに寄与する他の免疫細胞タイプおよび/もしくは細胞タイプからの、または健康な対象由来の同じ細胞もしくは組織タイプからの、DNAの同じ領域中のメチル化の程度と比較して、少なくとも1つの細胞または組織タイプ、例えば、少なくとも1つの免疫細胞タイプにおいて、検出可能に高い程度のメチル化を有する(例えば、高メチル化領域)。一部の実施形態では、差次的にメチル化された領域は、少なくとも1つの他の細胞もしくは組織タイプ、例えば、健康な個体におけるcfDNAに寄与する他の免疫細胞タイプおよび/もしくは細胞タイプからの、または健康な対象由来の同じ細胞もしくは組織タイプからの、DNAの同じ領域中のメチル化の程度と比較して、少なくとも1つの細胞または組織タイプ、例えば、少なくとも1つの免疫細胞タイプにおいて、検出可能に低い程度のメチル化を有する(例えば、低メチル化領域)。
核酸は、腫瘍細胞を起源とする場合、「腫瘍によって産生される」、または「循環腫瘍DNA」(「ctDNA」)である。腫瘍細胞は、それらが腫瘍中に残存しているか腫瘍から分離される(例えば、転移性がん細胞および循環腫瘍細胞の場合のように)かにかかわらず、腫瘍を起源とする新生物細胞である。本明細書で使用される場合、「前がん」または「前がん様状態」は、がんになる潜在力を有する異常であり、がんになる潜在力は、異常が存在しなかった場合、すなわち、正常だった場合の潜在力よりも高い。前がんの例としては、これらに限定されないが、腺腫、過形成、異形成、形成異常、良性新生物(良性腫瘍)、前悪性上皮内癌、およびポリープが挙げられる。ある特定のタイプの上皮内癌は、前悪性とは対照的に、がん様、例えば、ステージ0のがんとして当技術分野で認識されることに留意すべきである。
「メチル化」または「DNAメチル化」という用語は、核酸分子中の核酸塩基へのメチル基の付加を指す。一部の実施形態では、メチル化は、CpG部位(シトシン-リン酸-グアニン部位、すなわち、核酸配列の5’→3’方向でシトシンの後にグアニン)でのシトシンへのメチル基の付加を指す。一部の実施形態では、DNAメチル化は、アデニンへのメチル基の付加、例えば、N6-メチルアデニンにおけるものを指す。一部の実施形態では、DNAメチル化は、5-メチル化(シトシンの6-炭素環の5番目の炭素の改変)である。一部の実施形態では、5-メチル化は、5-メチルシトシン(5mC)を作製するための、シトシンの5C位へのメチル基の付加を指す。一部の実施形態では、メチル化は、5mCの誘導体を含む。5mCの誘導体としては、これらに限定されないが、5-ヒドロキシメチルシトシン(5-hmC)、5-ホルミルシトシン(5-fC)、および5-カルボキシルシトシン(caryboxylcytosine)(5-caC)が挙げられる。一部の実施形態では、DNAメチル化は、3Cメチル化(シトシンの6-炭素環の3番目の炭素の改変)である。一部の実施形態では、3Cメチル化は、3-メチルシトシン(3mC)を生成するための、シトシンの3C位へのメチル基の付加を含む。メチル化は、非CpG部位でも起こり得、例えば、メチル化は、CpA、CpT、またはCpC部位で起こり得る。DNAメチル化は、メチル化DNA領域の活性を変化させ得る。例えば、プロモーター領域のDNAがメチル化されると、遺伝子の転写は抑制され得る。DNAメチル化は、正常な発達にとって極めて重要であり、メチル化の異常は、エピジェネティック調節を破壊し得る。エピジェネティック調節の破壊、例えば抑制は、がんなどの疾患を引き起こし得る。DNAにおけるプロモーターメチル化は、がんを示し得る。
「高メチル化」という用語は、核酸分子の集団(例えば、試料)内の同じ遺伝情報を含む他の核酸分子と比較した、増加したレベルまたは程度の核酸分子のメチル化を指す。一部の実施形態では、高メチル化DNAは、少なくとも1個のメチル化された残基、少なくとも2個のメチル化された残基、少なくとも3個のメチル化された残基、少なくとも5個のメチル化された残基、または少なくとも10個のメチル化された残基を含むDNA分子を含み得る。
「低メチル化」という用語は、核酸分子の集団(例えば、試料)内の同じ遺伝情報を含む他の核酸分子と比較した、減少したレベルまたは程度の核酸分子のメチル化を指す。一部の実施形態では、低メチル化DNAは、非メチル化DNA分子を含む。一部の実施形態では、低メチル化DNAは、0個のメチル化された残基、多くて1個のメチル化された残基、多くて2個のメチル化された残基、多くて3個のメチル化された残基、多くて4個のメチル化された残基、または多くて5個のメチル化された残基を含むDNA分子を含み得る。
「DNA中の改変核酸塩基を認識する作用剤」、例えば、「DNA中の改変シトシンを認識する作用剤」という用語は、DNA中の1つまたは複数の改変核酸塩基、例えば、メチルシトシンに結合するまたはそれを検出する、分子または試薬を指す。「改変核酸塩基」は、化学構造において非改変核酸塩基からの差を含む核酸塩基である。DNAの場合、非改変核酸塩基は、アデニン、シトシン、グアニン、またはチミンである。一部の実施形態では、改変核酸塩基は、改変シトシンである。一部の実施形態では、改変核酸塩基は、メチル化核酸塩基である。一部の実施形態では、改変シトシンは、メチルシトシン、例えば、5-メチルシトシンである。そのような実施形態では、シトシン改変は、メチルである。DNA中のメチルシトシンを認識する作用剤としては、これらに限定されないが、本明細書でメチルシトシンに結合する試薬を指す「メチル結合試薬」が挙げられる。メチル結合試薬としては、これらに限定されないが、メチル結合ドメイン(MBD)およびメチル結合タンパク質(MBP)、ならびにメチルシトシンに対して特異的な抗体が挙げられる。一部の実施形態では、そのような抗体は、DNA中の5-メチルシトシンに結合する。一部のそのような実施形態では、DNAは、一本鎖または二本鎖であり得る。好適な作用剤としては、二本鎖DNA、一本鎖DNA、ならびに二本鎖DNAおよび一本鎖DNAの両方中の改変ヌクレオチドを認識する作用剤が挙げられる。
「またはそれらの組合せ(単数および複数)」という用語は、本明細書で使用される場合、用語の前に列挙される用語のあらゆる全ての順列および組合せを指す。例えば、「A、B、C、またはそれらの組合せ」は、A、B、C、AB、AC、BC、またはABCのうちの少なくとも1つを含むと意図され、特定の文脈において順序が重要である場合、BA、CA、CB、ACB、CBA、BCA、BAC、またはCABも含むと意図される。この例を続けると、1つまたは複数の項目または用語の反復を含有する組合せ、例えばBB、AAA、AAB、BBC、AAABCCCC、CBBAAA、CABABBなどが明白に含まれる。当業者は、文脈から特に明白でない限り、典型的には、任意の組合せ中の項目または用語の数に制限がないことを理解するであろう。
「または」は、包括的な意味で使用される、すなわち、文脈が特に必要としていない限り、「および/または」と等価である。
例示的な方法
a.免疫細胞タイプの同定および定量
一部の実施形態では、本明細書に開示される方法は、試料からのcfDNAをシーケンシングし、複数の免疫細胞タイプにおいて差次的にメチル化されるDNA配列を含む複数の標的領域に関してメチル化レベルを決定するステップを含む。一部の実施形態では、本明細書に開示される方法は、cfDNAまたはその部分試料から、少なくとも1つのエピジェネティック標的領域セットを捕捉するステップであって、cfDNAまたはその部分試料を、少なくとも1つのエピジェネティック標的領域セットに対して特異的な標的特異的プローブと接触させることを含み、エピジェネティック標的領域セットが、複数の免疫細胞タイプにおいて差次的にメチル化されるDNA配列を含む標的領域を含む、ステップ、および標的領域に関してメチル化レベルを決定するステップ、を含む。一部の実施形態では、本明細書に開示される方法は、cfDNAをシーケンシングし、複数の免疫細胞タイプにおいて差次的に低メチル化されるDNA配列を含む複数の低メチル化可変標的領域に関して、メチル化レベルを決定するステップを含む。複数の免疫細胞タイプにおいて差次的に低メチル化される標的領域は、他の細胞タイプよりも、複数の免疫細胞タイプにおいて、低いレベルのメチル化を示す。一部の実施形態では、本明細書に開示される方法は、cfDNAまたはその部分試料から、少なくとも1つのエピジェネティック標的領域セットを捕捉するステップであって、cfDNAまたはその部分試料を、少なくとも1つのエピジェネティック標的領域セットに対して特異的な標的特異的プローブと接触させることを含み、エピジェネティック標的領域セットが、複数の免疫細胞タイプにおいて差次的に低メチル化されるDNA配列を含む低メチル化可変標的領域を含む、ステップ、および標的領域に関してメチル化レベルを決定するステップ、を含む。これらの実施形態のいずれかでは、メチル化レベルは、分配、メチル化感受性変換、例えば、バイサルファイト変換、シーケンシングの間の直接的検出、または任意の他の好適なアプローチを使用して決定され得る。様々なアプローチが本明細書に記載される。
メチル化レベルは、cfDNAが起源とする複数の免疫細胞タイプの各々の量を決定するために使用され得る。これは、例えば、がんもしくは前がん、または他の状態(例えば、感染症、移植片拒絶)の存在を検出するために有用であり得るが、それは、cfDNAに寄与する細胞タイプの分布に反映される免疫系の状態が、そのような状態の結果として変化し得るという点においてである。一部の実施形態では、cfDNAは、腫瘍細胞を起源とし、がんは、血液学的がんである。一部の実施形態では、cfDNAは、腫瘍細胞を起源としなかった。一部のそのような実施形態では、がんは、血液学的がんではない。一部のそのような実施形態では、がんは、固形腫瘍がん、例えば、癌腫または肉腫である。理論に拘束されることを望まないが、固形腫瘍がん、例えば、癌腫および肉腫を含むがんは、健康な対象またはがんを有さない対象における免疫細胞分布と比較して、分化した免疫細胞タイプおよび免疫細胞活性化状態に関するものを含む、免疫細胞タイプ分布に対する変化を引き起こし得る。そのような変化は、本明細書の方法で検出され得、がんを検出するために、ならびにがん予後および/または処置選択肢を決定するために、有用であり得る。
一部の実施形態では、本明細書に開示される方法は、DNAを、DNA中の改変シトシンを認識する作用剤と接触させることによって、DNAを含む試料を分配するステップ、DNAをシーケンシングするステップ、およびDNAが起源とする複数の免疫細胞タイプの各々のレベルを決定するステップ、を含む。免疫細胞タイプのレベルは、例えば、定量されている各細胞タイプに関しての相対的な量またはパーセンテージとして表され得る。そのような決定は、例えば、実施例3に例証される。一部の実施形態では、方法は、シーケンシングするステップの前に、1つまたは複数の分配された部分試料からのDNAのエピジェネティック標的領域セットを捕捉または富化するステップを含む。一部の実施形態では、改変シトシンは、メチルシトシンである。
したがって、本明細書の方法は、試料中のDNAが起源とする異なる免疫細胞タイプを同定および定量するために使用され得る、免疫特異的な差次的にメチル化されたゲノム領域の検出および/または同定を可能にする。免疫細胞タイプは、異なる分化タイプ、異なる活性化タイプ、または異なる分化タイプおよび異なる活性化タイプの両方の、免疫細胞を含み得る。実際、分化ステータスおよび活性化ステータスは、かなり重複し、所定の免疫細胞では、しばしば一緒に変化する。例えば、免疫細胞の活性化は、細胞の分化を誘導し得る。異なる活性化タイプの免疫細胞としては、活性化された細胞、例えば、炎症性サイトカインまたは抗原によって活性化された細胞、および抑制された細胞、例えば、Tregによって抑制された細胞が挙げられる。免疫細胞タイプとしては、活性化されたB細胞(メモリーB細胞および形質細胞を含む)、活性化されたT細胞(調節性T細胞(Treg)、CD4エフェクターメモリーT細胞、CD4セントラルメモリーT細胞、CD8エフェクターメモリーT細胞、およびCD8セントラルメモリーT細胞を含む)、およびナチュラルキラー(NK)細胞が挙げられる。そのような細胞タイプからのDNAは、健康な個体由来の試料、例えば、cfDNA試料ではまれであり得るが、疾患または障害、例えば、がんまたは前がん様状態を有する個体由来の試料、例えば、cfDNA試料ではより一般的であり得る。一部の実施形態では、密接に関連する細胞タイプ、例えば、ナイーブB細胞および活性化されたB細胞、ナイーブT細胞および活性化されたT細胞、または異なるステージの骨髄系列からのDNAを識別するために、高メチル化領域および低メチル化領域の両方が検出され得る。一部の実施形態では、差次的にメチル化された領域のうち少なくとも一部は、1つの細胞タイプのみにおいて、またはクラスター内の1つの細胞タイプのみにおいて、排他的に高メチル化されるかまたは排他的に低メチル化される。一部の実施形態では、少なくとも2個、少なくとも3個、少なくとも4個、少なくとも5個、少なくとも6個、少なくとも7個、少なくとも8個、少なくとも9個、または少なくとも10個の差次的にメチル化された領域が、クラスター内の同定または定量されている1つの細胞タイプのみにおいて、排他的に高メチル化されるかまたは排他的に低メチル化される。
一部の実施形態では、試料中のDNAが起源とする異なる免疫細胞タイプのレベルを決定することは、疾患診断または適切な処置の同定を容易にする。一部の実施形態では、1つまたは複数の免疫細胞タイプのレベルにおける変化は、対象における疾患または障害、例えば、がん、前がん、感染症、移植片拒絶、または健康な対象中に存在する量と比較したある特定の免疫細胞タイプの相対量における変化を引き起こす他の障害の存在を示す。一部の実施形態では、エピジェネティック標的領域における配列非依存的な変化と組み合わせた、1つまたは複数の免疫細胞タイプのレベルの両方における変化は、対象における疾患または障害、例えば、がん、前がん、感染症、移植片拒絶、または健康な対象と比較したある特定の免疫細胞タイプの相対量における変化およびエピジェネティック変化を引き起こす他の障害の存在を示す。一部の実施形態では、方法は、対象が処置に応答する可能性に基づく適切な処置の同定を容易にする。一部のそのような実施形態では、ある特定のがんタイプを有する対象由来の試料中の1つまたは複数の免疫細胞タイプからのDNAのレベルを決定することは、対象における免疫療法の臨床転帰の予測を容易にする。異なる免疫細胞タイプのレベルを決定することが、疾患診断、適切な処置の同定、および治療応答との関連付けを容易にする場合、疾患診断および適切な処置の同定のための閾値は、同じであっても異なっていてもよい。レベルは、異なる免疫細胞タイプに対応する分子の数、あるいはそのような分子の相対頻度、または、1つもしくは複数の異なる免疫細胞タイプに対応する分子の数に基づく任意の値もしくは比率に基づいて決定され得る。
b.試料を複数の部分試料に分配する
本明細書に記載される一部の実施形態では、異なる形態のDNA(例えば、高メチル化DNAおよび低メチル化DNA)は、DNAの1つまたは複数の特徴に基づいて、物理的に分配される。このアプローチは、例えば、ある特定の部位または領域が高メチル化されているか低メチル化されているかを決定するために使用され得る。分配は、例えば、アダプター中に分配タグを含めることを容易にするために、試料中のDNA分子にアダプターを付着させる前に実施され得る。分配タグは、分子が見出された分配がどれかを同定するために使用され得る。分配(および該当する場合はアダプターの付着)の後、さらなるステップ、例えば、増幅、標的捕捉、およびシーケンシングが実施され得る。
メチル化プロファイリングは、ゲノムの異なる領域にわたってメチル化パターンを決定することを伴い得る。例えば、メチル化の程度(例えば、1分子あたりのメチル化核酸塩基の相対数)に基づいて分子を分配すること、およびシーケンシングすることを含む上記で考察したさらなるステップの後、異なる分配中の分子の配列は、参照ゲノムにマッピングされ得る。これは、他の領域と比較してより高度にメチル化されているか、またはあまり高度にメチル化されていないゲノムの領域を示すことができる。このようにして、ゲノム領域は、個々の分子とは対照的に、それらのメチル化の程度が異なり得る。
試料中の核酸分子を分配することは、例えば、試料の1つの分配においてより量が多いまれな核酸分子を富化することによって、まれなシグナルを増加させることができる。例えば、高メチル化DNA中には存在するが、低メチル化DNA中にはあまり存在しない(または存在しない)遺伝的変異は、試料を高メチル化核酸分子および低メチル化核酸分子に分配することによって、より容易に検出され得る。試料の複数の分配を解析することによって、単一の分子の多次元解析を実施することができ、したがって、より高い感度を達成することができる。分配は、1つまたは複数のメチル化核酸塩基の存在または非存在に基づいて、核酸分子を分配または部分試料に物理的に分配することを含み得る。試料は、差次的遺伝子発現または疾患状態を示す特徴に基づいて、分配または部分試料に分配され得る。試料は、核酸、例えば、無細胞DNA(cfDNA)、非cfDNA、腫瘍DNA、循環腫瘍DNA(ctDNA)および無細胞核酸(cfNA)の解析の間に、正常と病的状態との間のシグナルの差を提供する特徴またはそれらの組合せに基づいて分配され得る。
一部の実施形態では、高メチル化および/または低メチル化可変エピジェネティック標的領域は、特定の免疫細胞タイプ、例えば、まれな免疫細胞タイプ、腫瘍細胞、または解析されているDNA試料(例えば、cfDNA)に通常は寄与しないタイプの細胞の差次的メチル化特徴をそれらが示すかどうかを決定するために解析される。
一部の例では、試料中の不均一なDNAは、2つまたはそれより多くの分配(例えば、少なくとも3、4、5、6または7つの分配)に分配される。一部の実施形態では、各分配は、差次的にタグ付けされる。次いで、タグ付けされた分配は、集合的試料調製および/またはシーケンシングのために共にプールすることができる。分配-タグ付け-プーリングステップは、1回より多く行うことができ、分配の各ラウンドは、異なる特徴(本明細書に提供される例)に基づいて行われ、他の分配および分配手段とは識別される差次的タグを使用してタグ付けされる。他の例では、差次的にタグ付けされた分配は、個別にシーケンシングされる。
一部の実施形態では、差次的にタグ付けされプールされたDNAからの配列読み取りデータが得られ、in silicoで解析される。タグは、異なる分配からの読み取りデータを選別するために使用される。遺伝的変異体を検出するための解析を、分配毎のレベル、ならびに全核酸集団レベルで実施することができる。例えば、解析は、各分配中の核酸における遺伝的変異体、例えば、CNV、SNV、インデル、融合を決定するためのin silico解析を含み得る。一部の例では、in silico解析は、クロマチン構造を決定することを含み得る。例えば、配列読み取りデータのカバレッジは、クロマチンにおけるヌクレオソームの位置付けを決定するために使用され得る。より高いカバレッジは、ゲノム領域におけるより高いヌクレオソーム占有率と相関し得るが、より低いカバレッジは、より低いヌクレオソーム占有率またはヌクレオソーム枯渇領域(NDR)と相関し得る。
一部の実施形態では、分配は、1つまたは複数の特徴、例えば、メチル化に基づく。分子は、データ解析または該当する場合には分配の一部として適切な技術を使用して、他の特徴、例えば、配列長さ、ヌクレオソーム結合、配列ミスマッチ、免疫沈降、および/またはDNAに結合するタンパク質に従って選別され得る。得られた分配は、以下の核酸形態のうちの1つまたは複数を含み得る:一本鎖DNA(ssDNA)、二本鎖DNA(dsDNA)、より短いDNA断片、およびより長いDNA断片。一部の実施形態では、シトシン改変(例えば、シトシンメチル化)またはメチル化に基づく分配が、一般的には実施され、必要に応じて、DNAの前述の特徴または形態のいずれかに基づき得る少なくとも1つの追加の分配ステップと組み合わされる。一部の実施形態では、核酸の不均一な集団は、1つまたは複数のエピジェネティック改変を有する核酸および1つまたは複数のエピジェネティック改変を有さない核酸に分配される。エピジェネティック改変の例としては、メチル化の存在または非存在;メチル化のレベル;メチル化のタイプ(例えば、5-メチルシトシン対他のタイプのメチル化、例えば、アデニンメチル化および/またはシトシンヒドロキシメチル化);ならびに1つまたは複数のタンパク質、例えば、ヒストンとの会合および会合のレベルが挙げられる。あるいはまたはさらに、核酸の不均一な集団は、ヌクレオソームと会合した核酸分子およびヌクレオソームを欠く核酸分子に分配することができる。あるいはまたはさらに、核酸の不均一な集団は、一本鎖DNA(ssDNA)および二本鎖DNA(dsDNA)に分配され得る。あるいはまたはさらに、核酸の不均一な集団は、核酸の長さ(例えば、最大160bpの分子および160bpより長い長さを有する分子)に基づいて分配してもよい。
試料内の核酸の集団を分配するために使用される作用剤は、親和性作用剤、例えば、所望の特異性を有する抗体、天然の結合パートナーもしくはそれらの変異体(Bock et al., Nat Biotech 28: 1106-1114 (2010);Song et al., Nat Biotech 29: 68-72 (2011))、または所定の標的に対する特異性を有するように、例えばファージディスプレイによって選択された人工ペプチドであり得る。一部の実施形態では、分配において使用される作用剤は、改変核酸塩基を認識する作用剤である。一部の実施形態では、作用剤によって認識される改変核酸塩基は、改変シトシン、例えば、メチルシトシン(例えば、5-メチルシトシン)である。一部の実施形態では、作用剤によって認識される改変核酸塩基は、試料のDNA中の第2の核酸塩基とは異なるようにDNA中の第1の核酸塩基に影響を及ぼす手順の生成物である。一部の実施形態では、改変核酸塩基は、「変換された核酸塩基」であり得、これは、その塩基対形成特異性が手順によって変化されたことを意味する。例えば、ある特定の手順は、非メチル化もしくは非改変シトシンをジヒドロウラシルに変換する、またはより一般的には、少なくとも1つの改変もしくは非改変形態のシトシンは、脱アミノ化を受け、ウラシル(DNAの文脈では、改変核酸塩基とみなされる)もしくはさらに改変された形態のウラシルをもたらす。分配剤の例としては、抗体、例えば、改変シトシン、例えば、メチルシトシン(例えば、5-メチルシトシン)であり得る改変核酸塩基を認識する抗体が挙げられる。一部の実施形態では、分配剤は、5-メチルシトシン以外の改変シトシン、例えば、5-カルボキシルシトシン(5caC)を認識する抗体である。代替的分配剤としては、MeCP2などのタンパク質を含む、本明細書に記載されるメチル結合ドメイン(MBD)およびメチル結合タンパク質(MBP)が挙げられる。
分配剤の追加の非限定的な例は、遊離または非結合核酸から、ヒストンに結合した核酸を分離することができる、ヒストン結合タンパク質である。本明細書に開示される方法において使用され得るヒストン結合タンパク質の例としては、RBBP4、RbAp48およびSANTドメインペプチドが挙げられる。
特定の核酸への分配剤の結合および部分試料への核酸の分配は、ある特定の程度まで行われ得る、または本質的にバイナリな様式で行われ得る。一部の例では、より大きい割合のある特定の改変を含む核酸は、より小さい割合の改変を含む核酸よりも高い程度で作用剤に結合する。同様に、分配は、ある特定の改変を含む核酸をより大きい割合およびより小さい割合で含む部分試料を産生し得る。あるいは、分配は、改変を含む核酸の本質的に全てを含む部分試料またはそのような核酸を含まない部分試料を産生し得る。全ての例では、様々なレベルの改変が、分配剤から逐次的に溶出され得る。
一部の実施形態では、分配は、バイナリ分配および改変の程度/レベルに基づく分配の両方を含み得る。例えば、メチル化断片は、メチル化DNA免疫沈降(MeDIP)によって分配され得、または全てのメチル化断片は、メチル結合ドメインタンパク質(例えば、MethylMinder Methylated DNA Enrichment Kit(ThermoFisher Scientific))を使用して、非メチル化断片から分配され得る。その後、追加の分配は、メチル結合ドメインおよび結合した断片を含有する溶液中の塩濃度を調整することによって、異なるレベルのメチル化を有する断片を溶出させることを伴い得る。塩濃度が増加するにつれ、より高いメチル化レベルを有する断片が溶出される。
一部の例では、最終的な分配は、異なる程度の改変(改変の過剰出現または過少出現)を有する核酸が富化されている。過剰出現および過少出現は、集団における鎖あたりの改変の中央値数と比較した、核酸が有する改変の数によって定義することができる。例えば、試料中の核酸における5-メチルシトシン残基の中央値数が2である場合、2つより多くの5-メチルシトシン残基を含む核酸はこの改変が過剰出現し、1またはゼロ個の5-メチルシトシン残基を含む核酸は過少出現している。親和性分離の効果は、結合相において改変が過剰出現した核酸に関して、および非結合相(すなわち溶液中)において改変が過少出現した核酸に関して富化することである。結合相の核酸は、その後のプロセシングの前に溶出させることができる。
MeDIPまたはMethylMiner(登録商標)Methylated DNA Enrichment Kit(ThermoFisher Scientific)を使用する場合、様々なレベルのメチル化を、逐次溶出を使用して分配することができる。例えば、低メチル化分配(メチル化なし)は、核酸集団を、磁気ビーズに付着したキットからのMBDと接触させることによって、メチル化分配から分離することができる。ビーズは、メチル化核酸を非メチル化核酸から分離するために使用される。その後、1つまたは複数の溶出ステップが、異なるレベルのメチル化を有する核酸を溶出させるために、逐次的に実施される。例えば、メチル化核酸の第1のセットは、160mMまたはそれより高い、例えば、少なくとも150mM、少なくとも200mM、300mM、400mM、500mM、600mM、700mM、800mM、900mM、1000mM、または2000mMの塩濃度で溶出され得る。そのようなメチル化核酸が溶出された後、磁気分離が、より高いレベルのメチル化核酸を、より低いレベルのメチル化を有する核酸から分離するために、もう一度使用される。溶出ステップおよび磁気分離ステップは、様々な分配、例えば、低メチル化分配(メチル化を含まない核酸が富化されている)、メチル化分配(低レベルのメチル化を含む核酸が富化されている)、および高メチル化分配(高レベルのメチル化を含む核酸が富化されている)を作製するために繰り返され得る。
一部の方法では、親和性分離に基づく分配に使用される作用剤に結合した核酸は、洗浄ステップに供される。洗浄ステップは、親和性作用剤に弱く結合した核酸を洗い流す。そのような核酸は、改変を有する核酸が、平均値または中央値(すなわち、試料と作用剤との初回接触時に、固相に結合して残存する核酸と、固相に結合していない核酸との間の中間)に近い程度に富化され得る。
親和性分離は、異なる程度の改変を有する核酸の少なくとも2つ、時に3つまたはそれより多くの分配をもたらす。分配はなおも個別であるが、少なくとも1つの分配、および通常2つまたは3つの(またはそれより多くの)分配の核酸は、アダプターの構成要素として通常提供される核酸タグに連結され、異なる分配中の核酸には、1つの分配のメンバーを別の分配のメンバーと識別する異なるタグが与えられる。同じ分配の核酸分子に連結されるタグは、互いに同じであっても異なっていてもよい。しかし、互いに異なる場合、タグは、それらが付着する分子を特定の分配の分子であると同定するためにそれらのコードの一部を共通に有し得る。
メチル化などの特徴に基づいて核酸試料を分けることに関するさらなる詳細に関しては、参照により本明細書に組み込まれるWO2018/119452を参照されたい。
一部の実施形態では、核酸分子は、特定のタンパク質またはその断片に結合した核酸分子およびその特定のタンパク質またはその断片に結合していない核酸分子に基づいて、異なる分配に分画され得る。
核酸分子は、DNA-タンパク質結合に基づいて分画され得る。タンパク質-DNA複合体は、タンパク質の特定の特性に基づいて分画することができる。そのような特性の例としては、様々なエピトープ、改変(例えば、ヒストンメチル化またはアセチル化)または酵素活性が挙げられる。DNAに結合し、分画のための基礎として役立ち得るタンパク質の例としては、これらに限定されないが、プロテインAおよびプロテインGが挙げられ得る。任意の好適な方法が、タンパク質結合領域に基づいて核酸分子を分画するために使用され得る。タンパク質結合領域に基づいて核酸分子を分画するために使用される方法の例としては、これらに限定されないが、SDS-PAGE、クロマチン免疫沈降(ChIP)、ヘパリンクロマトグラフィー、および非対称流れ流動場分離法(AF4)が挙げられる。
一部の実施形態では、複数の部分試料への試料の分配は、核酸を、改変シトシン、または試料のDNA中の第2の核酸塩基とは異なるようにDNA中の第1の核酸塩基に影響を及ぼす手順の生成物であり得る、DNA中の改変核酸塩基を認識する抗体と接触させることによって実施される。一部の実施形態では、改変核酸塩基は、5mCである。一部の実施形態では、改変核酸塩基は、5caCである。一部の実施形態では、改変核酸塩基は、ジヒドロウラシル(DHU)である。一部の実施形態では、DNA中の改変核酸塩基を認識する抗体は、一本鎖DNAを分配するために使用される。
一部の実施形態では、分配は、核酸を、メチル結合タンパク質(「MBP」)のメチル結合ドメイン(「MBD」)と接触させることによって実施される。一部のそのような実施形態では、核酸を、全MBPと接触させる。一部の実施形態では、MBDは、5-メチルシトシン(5mC)に結合し、MBPは、MBDを含み、メチル結合タンパク質またはメチル結合ドメインタンパク質と、本明細書で互換的に呼ばれる。一部の実施形態では、MBDは、5mCおよび5hmCに結合する。一部の実施形態では、MBDは、ビオチンリンカーを介して、常磁性ビーズ、例えば、Dynabeads(登録商標)M-280ストレプトアビジンにカップリングされる。異なる程度のメチル化を有する分画への分配は、NaCl濃度を増加させることによって分画を溶出させることによって実施され得る。
一部の実施形態では、結合DNAは、抗体またはMBDを、プロテアーゼ、例えば、プロテイナーゼKと接触させることによって溶出される。これは、上記で考察したように、NaClを使用する溶出ステップの代わりに、またはそれに加えて、実施され得る。
本明細書で企図される改変核酸塩基を認識する作用剤の例としては、これらに限定されないが、以下が挙げられる:
(a)MeCP2は、非改変シトシンよりも5-メチル-シトシンに優先的に結合するタンパク質である。
(b)RPL26、PRP8およびDNAミスマッチ修復タンパク質MHS6は、非改変シトシンよりも5-ヒドロキシメチル-シトシンに優先的に結合する。
(c)FOXK1、FOXK2、FOXP1、FOXP4およびFOXI3は、好ましくは、非改変シトシンよりも5-ホルミル-シトシンに結合する(Iurlaro et al., Genome Biol. 14: R119 (2013))。
(d)1つまたは複数のメチル化核酸塩基もしくは改変核酸塩基またはその変換生成物、例えば、5mC、5caC、もしくはDHUに対して特異的な抗体。
一般的に、溶出は、改変の数、例えば、分子あたりのメチル化部位の数の関数であり、より多くのメチル化を有する分子は、増加した塩濃度の下で溶出する。DNAを、メチル化の程度に基づいて別個の集団に溶出させるために、漸増NaCl濃度の一連の溶出緩衝液を使用することができる。塩濃度は、約100nm~約2500mM NaClの範囲であり得る。一実施形態では、プロセスは、3つの分配をもたらす。分子は、改変核酸塩基を認識する作用剤を含む分子を含む第1の塩濃度の溶液と接触されられ、この分子は、ストレプトアビジンなどの捕捉部分に付着させることができる。第1の塩濃度では、分子のある集団は作用剤に結合し、ある集団は非結合のままである。非結合集団を、「低メチル化」集団として分離することができる。例えば、DNAの低メチル化形態が富化された第1の分配は、低い塩濃度、例えば100mMまたは160mMで非結合のままである分配である。中間メチル化DNAが富化された第2の分配は、中間の塩濃度、例えば100mM~2000mMの間の濃度を使用して溶出される。これもまた、試料から分離される。DNAの高メチル化形態が富化された第3の分配は、高い塩濃度、例えば、少なくとも約2000mMを使用して溶出される。
一部の実施形態では、5-メチルシチジン(5mC)に対するモノクローナル抗体は、メチル化DNAを精製するために使用される。DNAは、一本鎖DNA断片を得るために、例えば、95℃で変性される。抗5mC抗体とのインキュベーション後の、標準的または磁気ビーズにカップリングされたプロテインGならびに洗浄が、抗体に結合したDNAを免疫沈降させるために使用される。次いで、そのようなDNAは溶出され得る。分配は、非沈殿DNA、およびビーズから溶出された1つまたは複数の分配を含み得る。
一部の実施形態では、試料DNA(例えば、5~200ngの間)は、メチル結合ドメイン(MBD)緩衝液、およびMBDタンパク質とコンジュゲートされた磁気ビーズと混合され、一晩インキュベートされる。メチル化DNA(高メチル化DNA)は、このインキュベーションの間に、磁気ビーズ上のMBDタンパク質に結合する。非メチル化(低メチル化DNA)またはより少ないメチル化DNA(中間メチル化)は、漸増濃度の塩を含有する緩衝液を用いてビーズから洗い流される。例えば、非メチル化、低メチル化、および/または中間メチル化DNAを含有する1つ、2つ、またはそれより多くの分画が、そのような洗浄から得られ得る。最後に、高塩緩衝液を使用して、高度メチル化DNA(高メチル化DNA)をMBDタンパク質から溶出させる。一部の実施形態では、これらの洗浄は、漸増メチル化レベルを有するDNAの3つの分配(低メチル化分配、中間メチル化分画、および高メチル化分配)をもたらす。
一部の実施形態では、分配手順は、部分試料の間でのDNA分子の不完全な選別をもたらし得る。例えば、非メチル化もしくは低メチル化部分試料における少数の分子が高度に改変されてもよく(例えば、高メチル化)、および/または高メチル化部分試料における少数の分子が、非改変であっても大部分が非改変(例えば、非メチル化または大部分が非メチル化)であってもよい。そのような分子は、非特異的に分配されているとみなされる。
一部の実施形態では、非特異的に分配された分子は、メチル化依存性ヌクレアーゼ、例えば、制限酵素(RE)認識部位がメチル化ヌクレオチドを含有する場合にはDNAを消化/切断するが、制限酵素(RE)認識部位が非メチル化ヌクレオチドを含有する場合にはDNAを切断しないメチル化依存性制限酵素(MDRE)を使用して除去される。一部の実施形態では、非特異的に分配された分子は、メチル化感受性ヌクレアーゼ、例えば、制限酵素(RE)認識部位が非メチル化ヌクレオチドを含有する場合にはDNAを消化/切断するが、制限酵素(RE)認識部位がメチル化ヌクレオチドを含有する場合にはDNAを切断しないメチル化感受性制限酵素(MSRE)を使用して除去される。例えば、一部の実施形態では、低メチル化部分試料を、メチル化依存性ヌクレアーゼ、例えば、メチル化依存性制限酵素と接触させて、それによって、部分試料中の非特異的に分配されたDNA、例えば、メチル化DNAを分解する。あるいはまたはさらに、高メチル化部分試料を、メチル化感受性エンドヌクレアーゼ、例えば、メチル化感受性制限酵素と接触させて、それによって、部分試料中の非特異的に分配されたDNAを分解する。
1つまたは複数の分配された部分試料中の非特異的に分配されたDNAの分解は、シトシン改変に基づくDNAの正確な分配に依存する方法の性能を改善し得る。例えば、そのような分解は、改善された感度を提供し得る、および/または下流の解析を単純にし得る。一部の実施形態では、改変、例えば、メチル化に基づいてDNAを分配し、次いで、本明細書に記載されるMDREおよび/またはMSREを使用して、非特異的に分配されたDNAを除去することは、第2の核酸塩基とは異なるように第1の核酸塩基に影響を及ぼす手順、例えば、バイサルファイトシーケンシングまたはバイサルファイト変換を含むDNA解析方法よりも改善された効率および/または費用を提供する。
一部の実施形態では、1つまたは複数のヌクレアーゼが、非特異的に分配されたDNA分子を分解するために使用される。一部の実施形態では、部分試料は、複数のヌクレアーゼと接触させられる。部分試料は、ヌクレアーゼと、逐次的にまたは同時に接触させられ得る。ヌクレアーゼの同時使用は、試料の不要な操作を回避するために、ヌクレアーゼが類似の条件(例えば、緩衝液組成)下で活性である場合に有利であり得る。部分試料を1つより多くのメチル化依存性制限酵素と接触させることにより、非特異的に分配された高メチル化DNAをより完全に分解することができる。部分試料を1つより多くのメチル化感受性制限酵素と接触させることにより、非特異的に分配された低メチル化および/または非メチル化DNAをより完全に分解することができる。
一部の実施形態では、メチル化依存性ヌクレアーゼは、MspJI、LpnPI、FspEI、またはMcrBCのうちの1つまたは複数を含む。一部の実施形態では、少なくとも2つのメチル化依存性ヌクレアーゼが使用される。一部の実施形態では、少なくとも3つのメチル化依存性ヌクレアーゼが使用される。
一部の実施形態では、メチル化感受性ヌクレアーゼは、AatII、AccII、AciI、Aor13HI、Aor15HI、BspT104I、BssHII、BstUI、Cfr10I、ClaI、CpoI、Eco52I、HaeII、HapII、HhaI、Hin6I、HpaII、HpyCH4IV、MluI、MspI、NaeI、NotI、NruI、NsbI、PmaCI、Psp1406I、PvuI、SacII、SalI、SmaI、およびSnaBIのうちの1つまたは複数を含む。一部の実施形態では、少なくとも2つのメチル化感受性ヌクレアーゼが使用される。一部の実施形態では、少なくとも3つのメチル化感受性ヌクレアーゼが使用される。一部の実施形態では、メチル化感受性ヌクレアーゼは、BstUIおよびHpaIIを含む。一部の実施形態では、2つのメチル化感受性ヌクレアーゼは、HhaIおよびAccIIを含む。一部の実施形態では、メチル化感受性ヌクレアーゼは、BstUI、HpaIIおよびHin6Iを含む。
一部の実施形態では、DNAの分配は、ライブラリー調製の酵素ステップの準備において脱塩および濃縮される。
c.アダプターのライゲーションまたは付加
一部の実施形態では、アダプターがDNAに付加される。これは、例えば、プライマーの5’部分にアダプターを提供することによって、増幅手順と同時に行われ得る(PCRが使用される場合、これは、ライブラリーprep-PCRまたはLP-PCRと呼ばれ得る)。一部の実施形態では、アダプターは、他のアプローチ、例えば、ライゲーションによって付加される。一部のそのような方法では、分配する前または捕捉する前に、第1のアダプターが、一本鎖DNAへのライゲーションが含まれ得る、その3’末端へのライゲーションによって、核酸に付加される。アダプターは、例えば、ユニバーサルプライマーおよびDNAポリメラーゼを使用する第2鎖合成のためのプライミング部位として使用され得る。次いで、第2のアダプターが、今度は二本鎖分子の第2の鎖の少なくとも3’末端にライゲーションされ得る。一部の実施形態では、第1のアダプターは、親和性タグ、例えば、ビオチンを含み、第1のアダプターにライゲーションされた核酸は、親和性タグに対する結合パートナー、例えば、ストレプトアビジンを含み得る固体支持体(例えば、ビーズ)に結合される。関連手順のさらなる考察に関しては、Gansauge et al., Nature Protocols 8:737-748 (2013)を参照されたい。一本鎖核酸と適合性のシーケンシングライブラリー調製のための市販のキット、例えば、Swift BiosciencesのAccel-NGS(登録商標)Methyl-Seq DNA Library Kitが利用可能である。一部の実施形態では、アダプターライゲーションの後、核酸は増幅される。
好ましくは、アダプターは、タグの組合せの数が、同じ組合せのタグを与えられる同じ開始点および終止点を有する2つの核酸の低い確率、例えば、95、99または99.9%をもたらすのに十分な数の異なるタグを含む。アダプターは、同じタグを有するものであれ異なるタグを有するものであれ、同じまたは異なるプライマー結合部位を含み得るが、好ましくは、アダプターは、同じプライマー結合部位を含む。
一部の実施形態では、アダプターの付着の後、核酸は、増幅に供される。増幅は、例えば、アダプター中のプライマー結合部位を認識するユニバーサルプライマーを使用し得る。
一部の実施形態では、アダプターの付着の後、DNAを、エピジェネティック改変を有する核酸に優先的に結合する作用剤と接触させることを含む、DNAが分配される。核酸は、作用剤への結合から、核酸が改変を有する程度が異なる少なくとも2つの部分試料に分配される。例えば、作用剤が、改変を有する核酸に対する親和性を有する場合、(集団における中央値出現と比較して)改変が過剰出現する核酸は、作用剤に優先的に結合するが、改変が過少出現する核酸は、作用剤に結合しないか、または作用剤からより容易に溶出される。次いで、核酸は、アダプター内のプライマー結合部位に結合しているプライマーから増幅され得る。その代わり、分配は、アダプター付着の前に実施され得、その場合、アダプターは、分子が存在する分配がどれであるかを同定する構成要素を含む差次的タグを含み得る。
一部の実施形態では、核酸は、両方の末端で、プライマー結合部位およびタグを含むY字形状アダプターに連結される。分子は増幅される。
d.タグ付け
DNA分子を「タグ付けすること」は、タグがDNA分子に付着されるかまたはそれと会合される手順である。タグは、タグが会合する分子の特色を示す情報を含有する分子、例えば、核酸であり得る。例えば、分子は、試料タグ(1つの試料中の分子を異なる試料中の分子と識別する)、または分子タグ/分子バーコード/バーコード(異なる分子を互いに識別する(一意的および非一意的タグ付けシナリオの両方において))を有し得る。分配ステップを伴う方法に関しては、分配タグ(1つの分配中の分子を異なる分配中の分子と識別する)が含められ得る。一部の実施形態では、DNA分子に付加されるアダプターは、タグを含む。ある特定の実施形態では、タグは、1つのバーコードまたはバーコードの組合せを含み得る。本明細書で使用される場合、「バーコード」という用語は、文脈に依存して、特定のヌクレオチド配列を有する核酸分子、またはヌクレオチド配列そのものを指す。バーコードは、例えば、10~100個の間のヌクレオチドを有し得る。バーコードのコレクションは、縮重配列を有し得るか、または特定の目的にとって望ましいある特定のハミング距離を有する配列を有し得る。そのため、例えば、分子バーコードは、1つのバーコード、または各々が分子の異なる末端に付着する2つのバーコードの組合せから構成され得る。さらにまたはあるいは、異なる分配および/または試料に関して、バーコードがその個々の配列を通して分子タグとして役立つように、また、それらがメンバーであるセットに基づいてそれらが対応する分配および/または試料を同定するために役立つように、異なるセットの分子バーコード、または分子タグを使用することができる。
一部の実施形態では、2つまたはそれより多くの分配、例えば、各分配が、差次的にタグ付けされる。タグは、タグ(または複数のタグ)を特定の分配と相関させるように個々のポリヌクレオチド集団分配を標識するために使用され得る。あるいは、タグは、分配ステップを用いない実施形態において使用することができる。一部の実施形態では、単一のタグが、特定の分配を標識するために使用され得る。一部の実施形態では、複数の異なるタグが、特定の分配を標識するために使用され得る。特定の分配を標識するために複数の異なるタグを用いる実施形態では、1つの分配を標識するために使用されるタグのセットは、他の分配を標識するために使用されるタグのセットとは容易に区別することができる。一部の実施形態では、タグは、追加の機能を有し得る、例えば、タグは、試料の起源に索引を付けるために使用するか、または一意的分子識別子(例えば、Kinde et al., Proc Nat'l Acad Sci USA 108: 9530-9535 (2011)、Kou et al., PLoS ONE,11: e0146638 (2016)にあるように、シーケンシングエラーを突然変異から区別することによってシーケンシングデータの品質を改善するために使用することができる)として使用するか、または例えば、米国特許第9,598,731号に記載されるように、非一意的分子識別子として使用することができる。同様に、一部の実施形態では、タグは、追加の機能を有し得、例えば、タグは、試料の起源に索引を付けるために使用するか、または非一意的分子識別子(シーケンシングエラーを突然変異から区別することによってシーケンシングデータの品質を改善するために使用することができる)として使用することができる。
一部の実施形態では、分配タグ付けは、各分配中の分子を分配タグによってタグ付けすることを含む。分配を再度組み合わせ(例えば、必要なシーケンシング実行数を低減させ、不要な費用を回避するため)、分子をシーケンシングした後、分配タグは、起源の分配を同定する。一部の実施形態では、分配タグは、起源の分配および分子の識別子として役立ち得る、すなわち、異なる分配は、例えば、バーコードの対から構成される分子タグの異なるセットでタグ付けされる。このようにして、分子に付着した1つまたは複数の分子バーコードは、起源の分配、ならびに分配内の分子を識別するために有用であることを示す。例えば、35個のバーコードの第1のセットが、第1の分配中の分子にタグ付けするために使用され得、35個のバーコードの第2のセットが、第2の分配中の分子にタグ付けするために使用され得る。
一部の実施形態では、分配し、分配タグでタグ付けした後に、分子は、単一の実行でのシーケンシングのためにプールされ得る。一部の実施形態では、試料タグが、例えば、分配タグの付加およびプーリングの後のステップで、分子に付加される。試料タグは、単一のシーケンシング実行でのシーケンシングのために複数の試料から生成された材料をプールすることを容易にし得る。
あるいは、一部の実施形態では、分配タグは、試料ならびに分配と相関され得る。単純な例として、第1のタグは、第1の試料の第1の分配を示すことができ、第2のタグは、第1の試料の第2の分配を示すことができ、第3のタグは、第2の試料の第1の分配を示すことができ、第4のタグは、第2の試料の第2の分配を示すことができる。
タグは、1つまたは複数の特徴に基づいて既に分配された分子に付着され得るが、ライブラリー中の最終のタグ付けされた分子は、その特徴をもはや保有しなくてもよい。例えば、一本鎖DNA分子が分配およびタグ付けされ得るが、ライブラリー中の最終のタグ付けされた分子は、二本鎖である可能性が高い。同様に、DNAは、異なるレベルのメチル化に基づく分配に供してもよいが、最終ライブラリー中、これらの分子に由来するタグ付けされた分子は、非メチル化である可能性が高い。したがって、ライブラリー中の分子に付着するタグは、典型的には、最終的なタグ付けされた分子が由来する「親分子」の特徴を示し、タグ付けされた分子そのものの特徴を必ずしも示さない。
一例として、バーコード1、2、3、4などは、第1の分配中の分子をタグ付けおよび標識するために使用される;バーコードA、B、C、Dなどは、第2の分配中の分子をタグ付けおよび標識するために使用される;ならびにバーコードa、b、c、dなどは、第3の分配中の分子をタグ付けおよび標識するために使用される。差次的にタグ付けされた分配は、シーケンシングする前にプールされ得る。差次的にタグ付けされた分配は、個別にシーケンシングするか、または例えばIlluminaシーケンサーの同じフローセルにおいて、共に同時にシーケンシングすることができる。
シーケンシングの後、読み取りデータの解析は、分配毎のレベルならびに全DNA集団のレベルで実施することができる。タグは、異なる分配からの読み取りデータを選別するために使用される。解析は、配列情報、ゲノム座標の長さ、カバレッジ、および/またはコピー数を使用して、遺伝的変異およびエピジェネティック変異(メチル化、クロマチン構造などのうちの1つまたは複数)を決定するためのin silico解析を含み得る。一部の実施形態では、より高いカバレッジは、ゲノム領域におけるより高いヌクレオソーム占有率と相関し得るが、より低いカバレッジは、より低いヌクレオソーム占有率またはヌクレオソーム枯渇領域(NDR)と相関し得る。
e.富化/捕捉するステップ;増幅
本明細書に開示される方法は、DNA、例えば、cfDNA標的領域を捕捉するステップを含み得る。一部の実施形態では、捕捉するステップは、DNAを、標的領域に対して特異的なプローブ(例えば、オリゴヌクレオチド)と接触させることを含む。富化または捕捉は、当技術分野で公知の任意の好適なアプローチを使用して、本明細書に記載される任意の試料または部分試料について実施され得る。
一部の実施形態では、富化または捕捉は、試料分子へのアダプターの付着後に実施される。一部の実施形態では、富化または捕捉は、分配ステップの後に実施される。一部の実施形態では、富化または捕捉は、増幅ステップの後に実施される。一部の実施形態では、試料分子が分配され、次いで、アダプターが付着され、次いで、試料分子が増幅され、次いで、増幅された分子が富化または捕捉に供される。次いで、富化または捕捉された分子は、別の増幅に供され、次いでシーケンシングされ得る。
一部の実施形態では、標的領域に対して特異的なプローブは、プローブにハイブリダイズしたDNAの富化または捕捉を容易にする捕捉部分を含む。一部の実施形態では、捕捉部分は、ビオチンである。一部のそのような実施形態では、固体支持体、例えば、磁気ビーズに付着するストレプトアビジンは、ビオチンに結合するために使用される。標的領域を含まない非特異的に結合したDNAは、捕捉されたDNAから洗い流される。一部の実施形態では、DNAは次いで、プローブから解離され、塩洗浄、または別のDNA変性剤を含む緩衝液を使用して、固体支持体から溶出される。一部の実施形態では、プローブは、例えば、ビオチン-ストレプトアビジン相互作用を破壊することによっても、固体支持体から溶出される。一部の実施形態では、捕捉されたDNAは、固体支持体からの溶出後に増幅される。一部のそのような実施形態では、アダプターを含むDNAは、アダプターにアニーリングするPCRプライマーを使用して増幅される。一部の実施形態では、捕捉されたDNAは、固体支持体に付着したままで増幅される。一部のそのような実施形態では、増幅は、アダプター内の配列にアニーリングするPCRプライマーおよびDNAの標的領域にアニーリングしたプローブ内の配列にアニーリングするPCRプライマーの使用を含む。
一部の実施形態では、本明細書の方法は、エピジェネティックおよび/または配列可変標的領域を含むDNAに関して富化するステップまたはそのようなDNAを捕捉するステップを含む。そのような領域は、試料(例えば、アダプターの付着および増幅を受けた試料)のアリコートから捕捉され得るが、改変シトシン、例えば、メチルシトシンを認識する作用剤を用いてDNAを分配するステップは、試料の個別のアリコートについて実施される。エピジェネティックおよび/または配列可変標的領域を含むDNAに関して富化するステップまたはそのようなDNAを捕捉するステップは、DNAを、標的特異的プローブの第1または第2のセットと接触させることを含み得る。そのような標的特異的プローブは、これらに限定されないが、上記の実施形態およびプローブに関連する以下のセクション中を含め、標的特異的プローブのセットに関して本明細書に記載される特色のいずれかを有し得る。捕捉するステップは、本明細書に開示される方法の間に調製される1つまたは複数の部分試料について実施され得る。一部の実施形態では、DNAは、第1の部分試料または第2の部分試料、例えば、第1の部分試料および第2の部分試料から捕捉される。一部の実施形態では、部分試料は、差次的にタグ付けされ(例えば、本明細書に記載される通りに)、次いで、捕捉を受ける前にプールされる。エピジェネティックおよび/または配列可変標的領域を含むDNAを捕捉するための例示的な方法は、例えば、これにより参照により本明細書に組み込まれるWO2020/160414中で見出すことができる。
捕捉するステップは、一般的には、長さ、塩基組成などのプローブの特色にある程度依存する、特異的核酸ハイブリダイゼーションにとって好適な条件を使用して実施され得る。当業者は、核酸ハイブリダイゼーションに関して当技術分野で一般的な知識を考慮して、適切な条件を熟知している。一部の実施形態では、標的特異的プローブおよびDNAの複合体が形成される。
一部の実施形態では、本明細書に記載される方法は、対象から得られたcfDNAの標的領域の複数のセットを捕捉するステップを含む。標的領域は、それらが腫瘍を起源とするか、または健康な細胞を起源とするか、またはある特定の細胞タイプを起源とするか、に依存して、差を含み得る。捕捉するステップは、cfDNA分子の捕捉されたセットを産生する。一部の実施形態では、配列可変標的領域セットに対応するcfDNA分子は、エピジェネティック標的領域セットに対応するcfDNA分子よりも、cfDNA分子の捕捉されたセットにおいて高い捕捉収率で捕捉される。一部の実施形態では、本明細書に記載される方法は、対象から得られたcfDNAを、標的特異的プローブのセットと接触させることを含み、標的特異的プローブのセットは、配列可変標的領域セットに対応するcfDNAを、エピジェネティック標的領域セットに対応するcfDNAよりも高い捕捉収率で捕捉するように構成される。捕捉するステップ、捕捉収率、および関連の態様の追加の考察に関しては、全ての目的のために参照により本明細書に組み込まれるWO2020/160414を参照されたい。
配列可変標的領域を十分な信頼度または精度で解析するためには、エピジェネティック標的領域を解析するために必要であり得るよりも大きいシーケンシング深度が必要であり得るので、配列可変標的領域セットに対応するcfDNAを、エピジェネティック標的領域セットに対応するcfDNAよりも高い捕捉収率で捕捉することは、有益であり得る。断片化パターン(例えば、転写開始部位またはCTCF結合部位の乱れに関して試験するために)または断片の存在量(例えば、高メチル化および低メチル化分配における)を決定するために必要なデータ量は、一般的に、がん関連配列突然変異の存在または非存在を決定するために必要なデータ量よりも少ない。異なる収率で標的領域セットを捕捉することは、同じシーケンシング実行において異なるシーケンシング深度まで標的領域をシーケンシングすることを容易にし得る(例えば、プールした混合物を使用して、および/または同じシーケンシングセル中で)。
一部の実施形態では、DNAが増幅される。一部の実施形態では、増幅は、捕捉するステップの前に実施される。一部の実施形態では、増幅は、捕捉するステップの後に実施される。一部の実施形態では、増幅は、捕捉するステップの前および後に実施される。様々な実施形態では、方法は、本明細書における考察と一致して、捕捉されたDNAを、例えば、エピジェネティックおよび配列可変標的領域セットに関して様々な程度のシーケンシング深度までシーケンシングするステップをさらに含む。
一部の実施形態では、捕捉するステップは、同じ容器で同時に、配列可変標的領域セットのプローブおよびエピジェネティック標的領域セットのプローブを用いて実施され、例えば、配列可変標的領域セットおよびエピジェネティック標的領域セットのプローブは、同じ組成物中にある。このアプローチは、比較的合理化されたワークフローを提供する。一部の実施形態では、配列可変標的領域セットのプローブの濃度は、エピジェネティック標的領域セットのプローブの濃度よりも高い。
あるいは、捕捉するステップは、第1の容器中で配列可変標的領域プローブセットを用いて、および第2の容器中でエピジェネティック標的領域プローブセットを用いて実施されるか、または接触させるステップは、第1の時点および第1の容器で配列可変標的領域プローブセットを用いて、ならびに第1の時点の前もしくは後の第2の時点でエピジェネティック標的領域プローブセットを用いて実施される。このアプローチは、配列可変標的領域セットに対応する捕捉されたDNAおよびエピジェネティック標的領域セットに対応する捕捉されたDNAを含む個別の第1および第2の組成物の調製を可能にする。組成物は、さらなるプロセシング、およびシーケンシングなどの解析のための材料を提供するために、所望のように個別にプロセシングされ(例えば、本明細書に記載されるようにメチル化に基づいて分配するために)、適切な割合でプールされ得る。
一部の実施形態では、本明細書に記載されるように、アダプターは、DNA中に含まれる。一部の実施形態では、バーコードであり得るまたはバーコードを含み得るタグは、DNA中に含まれる。一部の実施形態では、そのようなタグは、アダプター中に含まれる。タグは、核酸の起源の同定を容易にし得る。例えば、バーコードは、並列シーケンシングのための複数の試料のプーリング後にDNAが由来する起源(例えば、対象)が同定されるのを可能にするために、使用され得る。これは、例えば本明細書に記載されるように、例えば、プライマーの5’部分にバーコードを提供することによって、増幅手順と同時に行われ得る。一部の実施形態では、アダプターおよびタグ/バーコードは、同じプライマーまたはプライマーセットによって提供される。例えば、バーコードは、アダプターの3’およびプライマーの標的にハイブリダイズする部分の5’に位置し得る。あるいは、バーコードは、他のアプローチ、例えば、ライゲーションによって、必要に応じて同じライゲーション基質において、アダプターと共に付加することができる。
増幅、タグ、およびバーコードに関する追加の詳細は、本明細書で考察され、それらは、これらの実施形態のいずれかと実践可能な程度に組み合わせることができる。
f.DNA中の第2の核酸塩基とは異なるようにDNA中の第1の核酸塩基に影響を及ぼす手順
一部の実施形態では、本明細書に開示される方法は、DNAを、DNA中の第2の核酸塩基とは異なるようにDNA中の第1の核酸塩基に影響を及ぼす手順に供するステップであって、第1の核酸塩基が改変または非改変核酸塩基であり、第2の核酸塩基が、第1の核酸塩基とは異なる改変または非改変核酸塩基であり、第1の核酸塩基および第2の核酸塩基が同じ塩基対形成特異性を有する、ステップを含む。一部の実施形態では、手順は、変換された核酸塩基の塩基対形成特異性が変更されるように、第1または第2の核酸塩基を化学的に変換する。一部の実施形態では、第1の核酸塩基が改変または非改変アデニンである場合には、第2の核酸塩基は改変または非改変アデニンであり、第1の核酸塩基が改変または非改変シトシンである場合には、第2の核酸塩基は改変または非改変シトシンであり、第1の核酸塩基が改変または非改変グアニンである場合には、第2の核酸塩基は改変または非改変グアニンであり、第1の核酸塩基が改変または非改変チミンである場合には、第2の核酸塩基は改変または非改変チミンである(このとき、改変および非改変ウラシルは、このステップの目的のために、改変チミン内に包含される)。
一部の実施形態では、第1の核酸塩基が改変または非改変シトシンである場合には、第2の核酸塩基は、改変または非改変シトシンである。例えば、第1の核酸塩基は、非改変シトシン(C)を含み得、第2の核酸塩基は、5-メチルシトシン(mC)および5-ヒドロキシメチルシトシン(hmC)のうちの1つまたは複数を含み得る。あるいは、第2の核酸塩基は、Cを含み得、第1の核酸塩基は、mCおよびhmCのうちの1つまたは複数を含み得る。例えば、上記の概要および以下の考察に示されているように、第1および第2の核酸塩基のうちの一方がmCを含み、他方がhmCを含む場合などの他の組合せもまた可能である。
一部の実施形態では、DNA中の第2の核酸塩基とは異なるようにDNA中の第1の核酸塩基に影響を及ぼす手順は、バイサルファイト変換を含む。バイサルファイトによる処置は、非改変シトシンおよびある特定の改変シトシン(例えば、5-ホルミルシトシン(fC)または5-カルボキシルシトシン(caC))をウラシルに変換するが、他の改変シトシン(例えば、5-メチルシトシン、5-ヒドロキシルメチルシトシン(5-hydroxylmethylcystosine))は変換されない。バイサルファイト変換を実施することは、配列読み取りデータを使用してmCまたはhmCを含有する位置を同定することを容易にし得る。バイサルファイト変換の例示的な説明に関しては、例えば、Moss et al., Nat Commun. 2018; 9: 5068を参照されたい。
一部の実施形態では、DNA中の第2の核酸塩基とは異なるようにDNA中の第1の核酸塩基に影響を及ぼす手順は、酸化的バイサルファイト(Ox-BS)変換を含む。Ox-BS変換を実施することは、配列読み取りデータを使用してmCを含有する位置を同定することを容易にし得る。酸化的バイサルファイト変換の例示的な説明に関しては、例えば、Booth et al., Science 2012; 336: 934-937を参照されたい。
一部の実施形態では、DNA中の第2の核酸塩基とは異なるようにDNA中の第1の核酸塩基に影響を及ぼす手順は、Tet補助バイサルファイト(TAB)変換を含む。例えば、Yu et al., Cell 2012; 149: 1368-80に記載されるように、β-グルコシルトランスフェラーゼが、hmCを保護するために使用され得(5-グルコシルヒドロキシメチルシトシン(ghmC)を形成する)、次いで、TETタンパク質、例えば、mTet1が、mCをcaCに変換するために使用され得、次いで、バイサルファイト処置が、CおよびcaCをUに変換するために使用され得るが、ghmCは影響を受けないままである。このように、TAB変換が使用される場合、第1の核酸塩基は、非改変シトシン、fC、caC、mC、またはバイサルファイトによって影響を受ける他のシトシン形態のうちの1つまたは複数を含み、第2の核酸塩基は、hmCを含む。TAB変換を実施することは、配列読み取りデータを使用してhmCを含有する位置を同定することを容易にし得る。
一部の実施形態では、DNA中の第2の核酸塩基とは異なるようにDNA中の第1の核酸塩基に影響を及ぼす手順は、置換ボラン還元剤を用いたTet補助変換を含み、必要に応じて、置換ボラン還元剤は、2-ピコリンボラン、ボランピリジン、tert-ブチルアミンボラン、またはアンモニアボランである。例えば、Liu et al., Nature Biotechnology 2019; 37:424-429(例えば、補足図1および補足注釈7)を参照されたい。TAP変換を実施することは、配列読み取りデータを使用して非改変Cを含有する位置を同定することを容易にし得る。この手順は、前記Liu et al. 2019にさらに詳細に記載されるTet補助ピリジンボランシーケンシング(TAPS)を包含する。
あるいは、hmCの保護(例えば、βGTを使用する)が、置換ボラン還元剤を用いたTet補助変換と組み合わされ得る。そのようなTAPSβ変換を実施することは、配列読み取りデータを使用して、一方の非改変CまたはhmCを含有する位置を、mCを含有する位置と識別することを容易にし得る。このタイプの変換の例示的な説明に関しては、例えば、Liu et al., Nature Biotechnology 2019; 37:424-429を参照されたい。
一部の実施形態では、DNA中の第2の核酸塩基とは異なるようにDNA中の第1の核酸塩基に影響を及ぼす手順は、APOBECカップリングエピジェネティック(ACE)変換を含む。ACE変換を実施することは、配列読み取りデータを使用して、hmCを含有する位置を、mCまたは非改変Cを含有する位置と識別することを容易にし得る。ACE変換の例示的な説明に関しては、例えば、Schutsky et al., Nature Biotechnology 2018; 36: 1083-1090を参照されたい。
一部の実施形態では、DNA中の第2の核酸塩基とは異なるようにDNA中の第1の核酸塩基に影響を及ぼす手順は、例えばEM-Seqにおけるような、第1の核酸塩基の酵素的変換を含む。例えば、www.biorxiv.org/content/10.1101/2019.12.20.884692v1において利用可能な、Vaisvila R, et al. (2019) EM-seq: Detection of DNA methylation at single base resolution from picograms of DNA. bioRxiv; DOI: 10.1101/2019.12.20.884692を参照されたい。
一部の実施形態では、第1の核酸塩基は、改変または非改変アデニンであり、第2の核酸塩基は、改変または非改変アデニンである。一部の実施形態では、改変アデニンは、N6-メチルアデニン(mA)である。一部の実施形態では、改変アデニンは、N-メチルアデニン(mA)、N-ヒドロキシメチルアデニン(hmA)、またはN-ホルミルアデニン(fA)のうちの1つまたは複数である。
g.捕捉されたセット;標的領域
一部の実施形態では、本明細書に記載される方法を使用して捕捉または富化された核酸は、捕捉されたDNA、例えば、DNAの1つまたは複数の捕捉されたセットを含む。一部の実施形態では、捕捉されたDNAは、異なる免疫細胞タイプにおいて差次的にメチル化される標的領域を含む。一部の実施形態では、免疫細胞タイプは、まれなまたは密接に関連する免疫細胞タイプ、例えば、活性化されたリンパ球およびナイーブリンパ球、または分化の異なるステージにある骨髄性細胞を含む。
一部の実施形態では、試料または第1の部分試料から捕捉された、捕捉されたエピジェネティック標的領域セットは、高メチル化可変標的領域を含む。一部の実施形態では、高メチル化可変標的領域は、1つの細胞タイプにおいてもしくは1つの免疫細胞タイプにおいて、またはクラスター内の1つの免疫細胞タイプにおいて、差次的または排他的に高メチル化される。一部の実施形態では、高メチル化可変標的領域は、1つの細胞タイプもしくは1つの免疫細胞タイプ、またはクラスター内の1つの免疫細胞タイプにおいて、識別可能により高くまたは排他的に存在する程度に、高メチル化される。そのような高メチル化可変標的領域は、他の細胞タイプにおいて高メチル化され得るが、1つの細胞タイプにおいて観察される程度にではない。一部の実施形態では、高メチル化可変標的領域は、少なくとも1つの他の組織タイプよりも、健康なcfDNAにおいて、低いメチル化を示す。
一部の実施形態では、試料または第2の部分試料から捕捉された、捕捉されたエピジェネティック標的領域セットは、低メチル化可変標的領域を含む。一部の実施形態では、低メチル化可変標的領域は、1つの細胞タイプにおいてもしくは1つの免疫細胞タイプにおいて、またはクラスター内の1つの免疫細胞タイプにおいて、排他的に低メチル化される。一部の実施形態では、低メチル化可変標的領域は、1つの細胞タイプもしくは1つの免疫細胞タイプにおいて、またはクラスター内の1つの免疫細胞タイプにおいて、排他的に存在する程度に、低メチル化される。そのような低メチル化可変標的領域は、他の細胞タイプにおいて低メチル化され得るが、1つの細胞タイプにおいて観察される程度にではない。一部の実施形態では、低メチル化可変標的領域は、少なくとも1つの他の組織タイプよりも、健康なcfDNAにおいて、高いメチル化を示す。
いかなる特定の理論にも拘束されることを望まないが、がんを有する個体では、増殖中のまたは活性化された免疫細胞(および潜在的にはがん細胞も)は、健康な個体(およびそれぞれ、同じ組織タイプの健康な細胞)における免疫細胞よりも多くのDNAを血流中に脱落させ得る。そのため、cfDNAの起源の細胞タイプおよび/または組織の分布は、発癌の際に変化し得る。例えば、起源の免疫細胞タイプの分布は、がん、前がん、感染症、移植片拒絶、または免疫系に直接的もしくは間接的に影響を及ぼす他の疾患もしくは障害を有する対象において変化し得る。同様に、ある特定の免疫細胞タイプのエピジェネティック標的領域のステータスは、健康な対象と比較して、または疾患もしくは障害を有する前の同じ対象と比較して、そのような疾患を有する対象において変化し得る。このように、高メチル化および/または低メチル化における変異は、疾患の指標であり得る。例えば、分配ステップの後の部分試料における高メチル化可変標的領域および/または低メチル化可変標的領域のレベルの増加は、がんの存在(または対象の既往に応じて再発)の指標であり得る。
これらに限定されないが免疫細胞タイプが挙げられる様々な細胞タイプ間を識別するために有用な例示的な高メチル化可変標的領域および低メチル化可変標的領域は、例えば、Stunnenberg, H. G. et al., "The International Human Epigenome Consortium: A Blueprint for Scientific Collaboration and Discovery," Cell 167, 1145 (2016) (doi.org/10.1186/s13059-020-02065-5)に記載されるように、様々な細胞タイプから得られたDNAを、全ゲノムバイサルファイトシーケンシングを介して解析することによって同定されている。全ゲノムバイサルファイトシーケンシングデータは、dcc.blueprint-epigenome.euにおいてインターネット上で利用可能なBlueprintコンソーシアムから利用可能である。
一部の実施形態では、第1および第2の捕捉された標的領域セットは、例えば、WO2020/160414に記載されるように、それぞれ、配列可変標的領域セットに対応するDNAおよびエピジェネティック標的領域セットに対応するDNAを含む。第1および第2の捕捉されたセットは、組合せの捕捉されたセットを提供するために組み合わされ得る。
DNA(例えば、試料または部分試料)が、手順、例えば、バイサルファイト変換、デアミナーゼによる処置、またはある特定の塩基の塩基対形成特異性を変更する本明細書で言及される他のそのような手順のいずれかに供されている場合、富化または捕捉は、所望により、変更されたまたは非変更の配列に対して特異的なオリゴヌクレオチド(例えば、プライマーまたはプローブ)を使用し得る。
配列可変標的領域セットおよびエピジェネティック標的領域セットに対応するDNAを含む捕捉されたセットが上記で考察したような組合せの捕捉されたセットを含む一部の実施形態では、配列可変標的領域セットに対応するDNAは、エピジェネティック標的領域セットに対応するDNAよりも高い濃度、例えば、1.1倍~1.2倍高い濃度、1.2倍~1.4倍高い濃度、1.4倍~1.6倍高い濃度、1.6倍~1.8倍高い濃度、1.8倍~2.0倍高い濃度、2.0倍~2.2倍高い濃度、2.2倍~2.4倍高い濃度、2.4倍~2.6倍高い濃度、2.6倍~2.8倍高い濃度、2.8倍~3.0倍高い濃度、3.0倍~3.5倍高い濃度、3.5倍~4.0、4.0倍~4.5倍高い濃度、4.5倍~5.0倍高い濃度、5.0倍~5.5倍高い濃度、5.5倍~6.0倍高い濃度、6.0倍~6.5倍高い濃度、6.5倍~7.0倍高い、7.0倍~7.5倍高い濃度、7.5倍~8.0倍高い濃度、8.0倍~8.5倍高い濃度、8.5倍~9.0倍高い濃度、9.0倍~9.5倍高い濃度、9.5倍~10.0倍高い濃度、10倍~11倍高い濃度、11倍~12倍高い濃度、12倍~13倍高い濃度、13倍~14倍高い濃度、14倍~15倍高い濃度、15倍~16倍高い濃度、16倍~17倍高い濃度、17倍~18倍高い濃度、18倍~19倍高い濃度、19倍~20倍高い濃度、20倍~30倍高い濃度、30倍~40倍高い濃度、40倍~50倍高い濃度、50倍~60倍高い濃度、60倍~70倍高い濃度、70倍~80倍高い濃度、80倍~90倍高い濃度、または90倍~100倍高い濃度で存在し得る。濃度の差の程度は、定義のセクションで考察するように、標的領域のフットプリントサイズに関する正規化を説明する。
(a)エピジェネティック標的領域セット
一部の実施形態では、エピジェネティック標的領域セットは、異なる免疫細胞タイプおよび他の非免疫細胞タイプからのDNAを区別するならびに/または新生物(例えば、腫瘍またはがん)細胞を、健康な細胞、例えば、非新生物循環細胞から区別する可能性が高い1つまたは複数のタイプの標的領域を含み得る。そのような領域の例示的なタイプは、本明細書で詳細に考察される。エピジェネティック標的領域セットは、例えば、本明細書に記載されるように、1つまたは複数の対照領域もまた含み得る。
一部の実施形態では、エピジェネティック標的領域セットは、少なくとも100kb、例えば、少なくとも200kb、少なくとも300kb、または少なくとも400kbのフットプリントを有する。一部の実施形態では、エピジェネティック標的領域セットは、100~1000kb、例えば、100~200kb、200~300kb、300~400kb、400~500kb、500~600kb、600~700kb、700~800kb、800~900kb、および900~1,000kbの範囲のフットプリントを有する。
1.高メチル化可変標的領域
一部の実施形態では、エピジェネティック標的領域セットは、1つまたは複数の高メチル化可変標的領域を含む。一部の実施形態では、高メチル化可変標的領域は、1つの免疫細胞タイプにおいて排他的に高メチル化されるか、または任意の他の免疫細胞タイプにおいてよりも、もしくは同じ免疫細胞クラスター内の任意の他の免疫細胞タイプにおいてよりも、1つの免疫細胞タイプにおいて高い程度に高メチル化される。一部のそのような実施形態では、高メチル化可変標的領域は、まれな免疫細胞タイプ、例えば、活性化されたB細胞(メモリーB細胞および形質細胞を含む)、活性化されたT細胞(調節性T細胞(Treg)、CD4エフェクターメモリーT細胞、CD4セントラルメモリーT細胞、CD8エフェクターメモリーT細胞、およびCD8セントラルメモリーT細胞を含む)、およびナチュラルキラー(NK)細胞を含む、DNAが起源とする特定の免疫細胞タイプのレベルを示す。免疫細胞タイプをデコンボリュートするために有用な高メチル化可変標的領域のメチル化パターンは、ある特定の疾患状態、例えば、がんにおいてさらに変化し得る。このように、一部の実施形態では、免疫細胞タイプをデコンボリュートするために有用な高メチル化可変標的領域は、試料を得た対象ががんまたは前がんを有する可能性を決定するためにも有用である。一部のそのような実施形態では、高メチル化可変標的領域は、特定の免疫細胞タイプのレベルが異常であるかどうか、およびそのような異常なレベルががんもしくは前がんの存在に関連する可能性が高いかどうか、またはそれらががんもしくは前がん以外の異なる疾患もしくは状態に関連するかどうかを決定するために有用である。
一部の実施形態では、ある特定の高メチル化可変標的領域は、新生物細胞、例えば、腫瘍またはがん細胞によって産生されるDNAにおいて、観察されたメチル化のレベルの増加を示す、例えば、高メチル化される。例えば、免疫細胞タイプを示す高メチル化可変標的領域の検出と併せた、そのような高メチル化可変標的領域の検出は、本明細書に記載される方法の特異度および/または感度をさらに増加させ得る。一部の実施形態では、高メチル化可変標的領域における観察されたメチル化のそのような増加は、試料(例えば、cfDNAの)ががんを有する対象から得られた可能性の増加を示す。例えば、腫瘍抑制遺伝子のプロモーターの高メチル化は、繰り返し観察されている。例えば、Kang et al., Genome Biol. 18:53 (2017)およびそこで引用されている参考文献を参照されたい。別の例では、上記で考察したように、高メチル化可変標的領域は、同じタイプの健康な組織からのDNAと比較してがん様組織におけるメチル化が必ずしも異ならないが、健康な対象において典型的であるcfDNAと比較するとメチル化が異なる(例えば、より多くのメチル化を有する)領域を含み得る。例えば、がんの存在が、がんに対応する組織タイプの細胞のアポトーシスなどの細胞死の増加をもたらす場合、そのようながんは、そのような高メチル化可変標的領域を使用して少なくとも部分的に検出することができる。一部の実施形態では、対象ががんを有する可能性を決定するために有用な高メチル化可変標的領域は、特定の免疫細胞タイプのレベルを決定するために有用な高メチル化可変標的領域とは異なる。一部の実施形態では、対象ががんを有する可能性を決定するために有用な高メチル化可変標的領域の少なくとも一部は、特定の免疫細胞タイプのレベルを決定するために有用な高メチル化可変標的領域と同じである。
結腸直腸がんにおけるメチル化可変標的領域の広範な考察は、Lam et al., Biochim Biophys Acta. 1866:106-20 (2016)に提供されている。これらとしては、VIM、SEPT9、ITGA4、OSM4、GATA4およびNDRG4が挙げられる。結腸直腸がん(CRC)研究に基づく高メチル化可変標的領域の例示的なセットを表1に提供する。これらの遺伝子の多くは、結腸直腸がん以外のがんに対する関連性を有する可能性が高く、例えば、TP53は、極めて重要な腫瘍抑制因子であると広く認識されており、この遺伝子の高メチル化に基づく不活化は、一般的な発癌機序であり得る。
表1. CRC研究に基づく例示的な高メチル化標的領域
一部の実施形態では、高メチル化可変標的領域は、表1に列挙される複数の遺伝子座、例えば、表1に列挙される遺伝子座の少なくとも10%、20%、30%、40%、50%、60%、70%、80%、90%、または100%を含む。例えば、標的領域として含まれる各遺伝子座に関して、遺伝子の転写開始部位と終止コドン(選択的にスプライシングされる遺伝子の最後の終止コドン)との間に、または遺伝子のプロモーター領域中に結合するハイブリダイゼーション部位を有する1つまたは複数のプローブが存在し得る。一部の実施形態では、1つまたは複数のプローブは、表1中の遺伝子の転写開始部位の300bp以内、例えば200または100bp以内で結合する。
様々なタイプの肺がんにおけるメチル化可変標的領域は、例えば、Ooki et al., Clin. Cancer Res. 23:7141-52 (2017);Belinksy, Annu. Rev. Physiol. 77:453-74 (2015);Hulbert et al., Clin. Cancer Res. 23:1998-2005 (2017);Shi et al., BMC Genomics 18:901 (2017);Schneider et al., BMC Cancer. 11:102 (2011);Lissa et al., Transl Lung Cancer Res 5(5):492-504 (2016);Skvortsova et al., Br. J. Cancer. 94(10):1492-1495 (2006);Kim et al., Cancer Res. 61:3419-3424 (2001);Furonaka et al., Pathology International 55:303-309 (2005);Gomes et al., Rev. Port. Pneumol. 20:20-30 (2014);Kim et al., Oncogene. 20:1765-70 (2001);Hopkins-Donaldson et al., Cell Death Differ. 10:356-64 (2003);Kikuchi et al., Clin. Cancer Res. 11:2954-61 (2005);Heller et al., Oncogene 25:959-968 (2006);Licchesi et al., Carcinogenesis. 29:895-904 (2008);Guo et al., Clin. Cancer Res. 10:7917-24 (2004);Palmisano et al., Cancer Res. 63:4620-4625 (2003);およびToyooka et al., Cancer Res. 61:4556-4560, (2001)において詳細に考察されている。
肺がん研究に基づく高メチル化可変標的領域の例示的なセットを表2に提供する。これらの遺伝子の多くは、肺がん以外のがんに対する関連性を有する可能性が高く、例えば、Casp8(カスパーゼ8)は、プログラム細胞死における重要な酵素であり、この遺伝子の高メチル化に基づく不活化は、肺がんに限定されない一般的な発癌機序であり得る。さらに、いくつかの遺伝子は、表1および表2の両方に現れ、全般性を示している。
表2. 肺がん研究に基づく例示的な高メチル化標的領域

表2において同定された標的領域に関する前述の実施形態のいずれかを、表1で同定された標的領域に関する上記の実施形態のいずれかと組み合わせてもよい。一部の実施形態では、高メチル化可変標的領域は、表1または表2に列挙される複数の遺伝子座、例えば、表1または表2に列挙される遺伝子座の少なくとも10%、20%、30%、40%、50%、60%、70%、80%、90%、または100%を含む。
一部の実施形態では、高メチル化可変標的領域は、表2bに列挙される1つまたは複数の遺伝子、例えば、表2bに列挙される少なくとも5、10、20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1000、1100、1150または1200個の遺伝子の領域を含む。これらの遺伝子の高メチル化は、DNA試料への免疫細胞からの寄与を検出するために有用であり得る。一部の実施形態では、高メチル化可変標的領域は、表2bに列挙される複数の遺伝子、例えば、表2bに列挙される遺伝子の少なくとも10%、20%、30%、40%、50%、60%、70%、80%、90%、または100%の領域を含む。一部の実施形態では、高メチル化可変標的領域は、表2bに列挙される遺伝子の全ての領域を含む。
表2b. 例示的な高メチル化可変標的領域を含む例示的な遺伝子





追加の高メチル化標的領域は、例えば、the Cancer Genome Atlasから得てもよい。Kang et al., Genome Biology 18:53 (2017)は、乳房、結腸、腎臓、肝臓、および肺からの高メチル化標的領域を使用するCancerLocatorと呼ばれる確率論的方法の構築を記載している。一部の実施形態では、高メチル化標的領域は、1つまたは複数のタイプのがんに特異的であり得る。したがって、一部の実施形態では、高メチル化標的領域は、乳がん、結腸がん、腎臓がん、肝臓がん、および肺がんのうちの1、2、3、4、または5つにおいて高メチル化を集合的に示す高メチル化標的領域の1、2、3、4、または5つのサブセットを含む。
一部の実施形態では、異なるエピジェネティック標的領域が第1および第2の部分試料から捕捉される場合、第1の部分試料から捕捉されたエピジェネティック標的領域は、高メチル化可変標的領域を含む。
a.低メチル化可変標的領域
一部の実施形態では、エピジェネティック標的領域セットは、1つまたは複数の低メチル化可変標的領域を含む。一部の実施形態では、低メチル化可変標的領域は、1つの免疫細胞タイプにおいて排他的に低メチル化されるか、または任意の他の免疫細胞タイプにおいてもしくは同じ免疫細胞クラスター内の任意の他の免疫細胞タイプにおいてよりも、1つの免疫細胞タイプにおいて高い程度に低メチル化される。一部のそのような実施形態では、低メチル化可変標的領域は、まれな免疫細胞タイプ、例えば、活性化されたB細胞(メモリーB細胞および形質細胞を含む)、活性化されたT細胞(調節性T細胞(Treg)、CD4エフェクターメモリーT細胞、CD4セントラルメモリーT細胞、CD8エフェクターメモリーT細胞、およびCD8セントラルメモリーT細胞を含む)、およびナチュラルキラー(NK)細胞を含む、DNAが起源とする特定の免疫細胞タイプのレベルを示す。免疫細胞タイプをデコンボリュートするために有用な低メチル化可変標的領域のメチル化パターンは、ある特定の疾患状態、例えば、がんにおいてさらに変化し得る。このように、一部の実施形態では、免疫細胞タイプをデコンボリュートするために有用な低メチル化可変標的領域は、試料を得た対象ががんまたは前がんを有する可能性を決定するためにも有用である。一部のそのような実施形態では、低メチル化可変標的領域は、特定の免疫細胞タイプのレベルが異常であるかどうか、およびそのような異常なレベルががんもしくは前がんの存在に関連する可能性が高いかどうか、またはそれらががんもしくは前がん以外の異なる疾患もしくは状態に関連するかどうかを決定するために有用である。
さらに、全体的な低メチル化は、様々ながんにおいて一般的に観察される現象である。例えば、Hon et al., Genome Res. 22:246-258 (2012)(乳がん);Ehrlich, Epigenomics 1:239-259 (2009)(結腸がん、卵巣がん、前立腺がん、白血病、肝細胞がん、および子宮頸がんにおける低メチル化の観察に言及した総説論文)を参照されたい。例えば、反復エレメント、例えば、LINE1エレメント、Aluエレメント、セントロメアタンデムリピート、ペリセントロメアタンデムリピート、およびサテライトDNAなどの領域、ならびに健康な細胞において通常メチル化される遺伝子間領域は、腫瘍細胞において低減されたメチル化を示し得る。したがって、一部の実施形態では、エピジェネティック標的領域セットは、低メチル化可変標的領域を含み、観察されたメチル化のレベルの減少は、がんの存在の可能性の増加を示す。例えば、免疫細胞タイプを示す低メチル化可変標的領域の検出と併せた、そのような低メチル化可変標的領域の検出は、本明細書に記載される方法の特異度および/または感度をさらに増加させ得る。別の例では、上記で考察したように、低メチル化可変標的領域は、同じタイプの健康な組織からのDNAと比較してがん様組織におけるメチル化が必ずしも異ならないが、健康な対象において典型的であるcfDNAと比較するとメチル化が異なる(例えば、より少ないメチル化)領域を含み得る。例えば、がんの存在が、がんに対応する組織タイプの細胞のアポトーシスなどの細胞死の増加をもたらす場合、そのようながんは、そのような低メチル化可変標的領域を使用して少なくとも部分的に検出することができる。一部の実施形態では、対象ががんを有する可能性を決定するために有用な低メチル化可変標的領域は、特定の免疫細胞タイプのレベルを決定するために有用な低メチル化可変標的領域とは異なる。一部の実施形態では、対象ががんを有する可能性を決定するために有用な低メチル化可変標的領域の少なくとも一部は、特定の免疫細胞タイプのレベルを決定するために有用な低メチル化可変標的領域と同じである。
一部の実施形態では、低メチル化可変標的領域は、反復エレメントおよび/または遺伝子間領域を含む。一部の実施形態では、反復エレメントは、LINE1エレメント、Aluエレメント、セントロメアタンデムリピート、ペリセントロメアタンデムリピート、および/またはサテライトDNAのうちの1、2、3、4、または5つを含む。
がん関連の低メチル化を示す例示的な特定のゲノム領域は、ヒト第1染色体のヌクレオチド8403565~8953708および151104701~151106035を含む。一部の実施形態では、低メチル化可変標的領域は、これらの領域の一方もしくは両方と重複するか、またはこれらの領域の一方もしくは両方を含む。
さらに、低メチル化標的領域は、例えば、Fox-Fisher et al., Elife Nov 29;10 (2021)、EpiDISH Rパッケージ、Moss et al., Nat Commun 9:1 (2018)、およびLoyfer et al. bioRxiv https://doi.org/10.1101/2022.01.24.477547 (2022)から得られ得る。一部の実施形態では、低メチル化標的領域は、1つまたは複数のタイプの免疫細胞に特異的であり得る。
一部の実施形態では、異なるエピジェネティック標的領域が第1および第2の部分試料から捕捉される場合、第2の部分試料から捕捉されたエピジェネティック標的領域は、低メチル化可変標的領域を含む。一部の実施形態では、第2の部分試料から捕捉されたエピジェネティック標的領域は、低メチル化可変標的領域を含み、第1の部分試料から捕捉されたエピジェネティック標的領域は、高メチル化可変標的領域を含む。
b.CTCF結合領域
CTCFは、クロマチン構成に寄与し、しばしばコヒーシンと共局在化する、DNA結合タンパク質である。CTCF結合部位の乱れは、多様な異なるがんにおいて報告されている。例えば、Katainen et al., Nature Genetics, doi:10.1038/ng.3335、2015年6月8日にオンラインで公開;Guo et al., Nat. Commun. 9:1520 (2018)を参照されたい。CTCF結合は、例えば断片長解析を通して、シーケンシングによって検出することができるcfDNAの認識可能なパターンをもたらす。シーケンシングに基づく断片長解析に関する詳細は、その各々が参照により本明細書に組み込まれる、Snyder et al., Cell 164:57-68 (2016);WO2018/009723;およびUS20170211143A1に提供される。
このように、CTCF結合の乱れは、cfDNAの断片化パターンの変異をもたらす。そのため、CTCF結合部位は、断片化可変標的領域の1つのタイプである。
多くの公知のCTCF結合部位が存在する。例えば、その各々が参照により組み込まれる、insulatordb.uthsc.edu/においてインターネット上で利用可能なCTCFBSDB(CTCF Binding Site Database);Cuddapah et al., Genome Res. 19:24-32 (2009);Martin et al., Nat. Struct. Mol. Biol. 18:708-14 (2011);Rhee et al., Cell. 147:1408-19 (2011)を参照されたい。例示的なCTCF結合部位は、第8染色体上のヌクレオチド56014955~56016161および第13染色体上のヌクレオチド95359169~95360473にある。
したがって、一部の実施形態では、エピジェネティック標的領域セットは、CTCF結合領域を含む。一部の実施形態では、CTCF結合領域は、少なくとも10、20、50、100、200、もしくは500個のCTCF結合領域、または10~20、20~50、50~100、100~200、200~500、もしくは500~1000個のCTCF結合領域、例えば、上記の、あるいは上記で引用したCTCFBSDB、またはCuddapah et al.、Martin et al.、もしくはRhee et al.の論文の1つまたは複数に記載のCTCF結合領域などを含む。
一部の実施形態では、CTCF部位の少なくとも一部は、メチル化または非メチル化であり得、メチル化状態は、細胞ががん細胞であるか否かと相関する。一部の実施形態では、エピジェネティック標的領域セットは、CTCF結合部位の少なくとも100bp、少なくとも200bp、少なくとも300bp、少なくとも400bp、少なくとも500bp、少なくとも750bp、少なくとも1000bp上流および下流の領域を含む。
c.転写開始部位
転写開始部位もまた、新生物細胞において乱れを示し得る。例えば、健康な個体におけるcfDNAに実質的に寄与する造血系列の健康な細胞における様々な転写開始部位でのヌクレオソーム構成は、新生物細胞におけるそれらの転写開始部位でのヌクレオソーム構成とは異なり得る。これは、Snyder et al., Cell 164:57-68 (2016);WO2018/009723:およびUS20170211143A1において一般的に考察されるように、シーケンシングによって検出することができる異なるcfDNAパターンをもたらす。別の例では、転写開始部位は、同じタイプの健康な組織からのDNAと比較してがん様組織中で必ずしもエピジェネティックに異ならない場合があるが、健康な対象において典型的であるcfDNAと比較するとエピジェネティックに異なる(例えば、ヌクレオソーム構成に関して)。例えば、がんの存在が、がんに対応する組織タイプの細胞のアポトーシスなどの細胞死の増加をもたらす場合、そのようながんは、転写開始部位におけるそのような差を使用して少なくとも部分的に検出することができる。
このように、転写開始部位の乱れもまた、cfDNAの断片化パターンの変異をもたらす。そのため、転写開始部位もまた、断片化可変標的領域の1つのタイプである。
ヒト転写開始部位は、dbtss.hgc.jpにおいてインターネット上で利用可能なDBTSS(DataBase of Human Transcription Start Sites)から利用可能であり、参照により本明細書に組み込まれるYamashita et al., Nucleic Acids Res. 34(Database issue): D86-D89 (2006)に記載されている。
したがって、一部の実施形態では、エピジェネティック標的領域セットは、転写開始部位を含む。一部の実施形態では、転写開始部位は、少なくとも10、20、50、100、200、もしくは500個の転写開始部位、または10~20、20~50、50~100、100~200、200~500、もしくは500~1000個の転写開始部位、例えば、DBTSSに列挙された転写開始部位などを含む。一部の実施形態では、転写開始部位の少なくとも一部は、メチル化または非メチル化であり得、メチル化状態は、細胞ががん細胞であるか否かと相関する。一部の実施形態では、エピジェネティック標的領域セットは、転写開始部位の少なくとも100bp、少なくとも200bp、少なくとも300bp、少なくとも400bp、少なくとも500bp、少なくとも750bp、少なくとも1000bp上流および下流の領域を含む。
d.局所増幅
局所増幅は体細胞突然変異であるが、それらは、メチル化の変化などのある特定のエピジェネティック変化を検出するためのアプローチと類似の様式で、読み取りデータの頻度に基づくシーケンシングによって検出することができる。そのため、がんにおいて局所増幅を示し得る領域は、エピジェネティック標的領域セットに含まれ得、AR、BRAF、CCND1、CCND2、CCNE1、CDK4、CDK6、EGFR、ERBB2、FGFR1、FGFR2、KIT、KRAS、MET、MYC、PDGFRA、PIK3CA、およびRAF1のうちの1つまたは複数を含み得る。例えば、一部の実施形態では、エピジェネティック標的領域セットは、前述の標的の少なくとも2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、または18個を含む。
e.メチル化対照領域
データの検証を容易にするために対照領域を含めることは有用であり得る。一部の実施形態では、エピジェネティック標的領域セットは、DNAががん細胞に由来するか正常細胞に由来するかによらず、本質的に全ての試料においてメチル化または非メチル化であると予想される対照領域を含む。一部の実施形態では、エピジェネティック標的領域セットは、本質的に全ての試料において低メチル化であると予想される対照低メチル化領域を含む。一部の実施形態では、エピジェネティック標的領域セットは、本質的に全ての試料において高メチル化であると予想される対照高メチル化領域を含む。
2.配列可変標的領域セット
一部の実施形態では、配列可変標的領域セットは、がんにおいて体細胞突然変異(例えば、単一ヌクレオチド変異および/またはインデル)を受けることが公知である複数の領域を含む。単一ヌクレオチド変異および/またはインデルは、参照配列、例えば、公開されたヒトゲノム配列、例えば、GRCh38ヒトゲノムアセンブリとの比較であり得る。
一部の態様では、配列可変標的領域セットは、がんを有する対象の既定の割合が、パネルにおける1つまたは複数の異なる遺伝子またはゲノム領域において遺伝的変異体または腫瘍マーカーを示すように選択された、複数の異なる遺伝子またはゲノム領域(「パネル」)を標的とする。パネルは、シーケンシングの領域を固定数の塩基対に限定するように選択され得る。パネルは、例えば、本明細書の他所で記載されるようにプローブの親和性および/または量を調整することによって、所望の量のDNAをシーケンシングするように選択され得る。パネルはさらに、所望の配列読み取りデータ深度を達成するように選択され得る。パネルは、シーケンシングされた塩基対の量に関して所望の配列読み取りデータ深度または配列読み取りデータカバレッジを達成するように選択され得る。パネルは、試料中の1つまたは複数の遺伝的変異体を検出するための理論的感度、理論的特異度、および/または理論的精度を達成するように選択され得る。
領域のパネルを検出するためのプローブは、目的のゲノム領域(ホットスポット領域)を検出するためのプローブを含み得る。プローブを設計する際に、クロマチン構造に関する情報を考慮に入れることができ、および/またはプローブは、特定の部位(例えば、KRASコドン12および13)が捕捉され得る可能性を最大にするように設計され得、ヌクレオソーム結合パターンおよびGC配列組成によって影響を受けるcfDNAカバレッジおよび断片サイズ変異の解析に基づいて捕捉を最適化するように設計され得る。本明細書で使用される領域はまた、ヌクレオソーム位置およびGCモデルに基づいて最適化される非ホットスポット領域も含み得る。
目的のゲノムの場所の一覧の例は、表3および表4に見出され得る。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表3の遺伝子の少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも55、少なくとも60、少なくとも65、または70個の少なくとも一部を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表3のSNVの少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも55、少なくとも60、少なくとも65、または70個を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表3の融合体の少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、または6個を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表3のインデルの少なくとも1、少なくとも2、または3個の少なくとも一部を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表4の遺伝子の少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも55、少なくとも60、少なくとも65、少なくとも70、または73個の少なくとも一部を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表4のSNVの少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも55、少なくとも60、少なくとも65、少なくとも70、または73個を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表4の融合体の少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、または6個を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表4のインデルの少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、または18個の少なくとも一部を含む。目的のこれらのゲノムの場所の各々は、所定のパネルに関して骨格領域またはホットスポット領域として同定され得る。目的のホットスポットゲノムの場所の一覧の例は、表5に見出され得る。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表5の遺伝子の少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、または少なくとも20個の少なくとも一部を含む。各ホットスポットゲノム領域は、関連する遺伝子、それが存在する染色体、遺伝子の遺伝子座を表すゲノムの開始および終止位置、塩基対での遺伝子の遺伝子座の長さ、遺伝子によってカバーされるエクソン、ならびに目的の所定のゲノム領域が捕捉しようとし得る極めて重要な特色(例えば、突然変異のタイプ)を含む、いくつかの特徴と共に列挙される。
表3


表4

表5


さらにまたはあるいは、好適な標的領域セットは、文献から入手可能である。例えば、参照により本明細書に組み込まれるGale et al., PLoS One 13: e0194630 (2018)は、配列可変標的領域セットの一部または全てとして使用することができる35個のがん関連遺伝子標的のパネルを記載している。これらの35個の標的は、AKT1、ALK、BRAF、CCND1、CDK2A、CTNNB1、EGFR、ERBB2、ESR1、FGFR1、FGFR2、FGFR3、FOXL2、GATA3、GNA11、GNAQ、GNAS、HRAS、IDH1、IDH2、KIT、KRAS、MED12、MET、MYC、NFE2L2、NRAS、PDGFRA、PIK3CA、PPP2R1A、PTEN、RET、STK11、TP53、およびU2AF1である。
一部の実施形態では、配列可変標的領域セットは、上に列挙されたがん関連遺伝子などの少なくとも10、20、30、または35個のがん関連遺伝子からの標的領域を含む。
B.対象
一部の実施形態では、DNA(例えば、cfDNA)は、がんもしくは前がん、感染症、移植片拒絶、または免疫系に直接的もしくは間接的に影響を及ぼす他の疾患を有する対象から得られる。一部の実施形態では、DNA(例えば、cfDNA)は、がんもしくは前がん、感染症、移植片拒絶、または免疫系に直接的もしくは間接的に影響を及ぼす他の疾患を有することが疑われる対象から得られる。一部の実施形態では、DNA(例えば、cfDNA)は、腫瘍を有する対象から得られる。一部の実施形態では、DNA(例えば、cfDNA)は、腫瘍を有することが疑われる対象から得られる。一部の実施形態では、DNA(例えば、cfDNA)は、新生物を有する対象から得られる。一部の実施形態では、DNA(例えば、cfDNA)は、新生物を有することが疑われる対象から得られる。一部の実施形態では、DNA(例えば、cfDNA)は、腫瘍、がん、または新生物からの寛解期にある(例えば、化学療法、外科的切除、放射線照射、またはそれらの組合せの後の)対象から得られる。前述の実施形態のいずれかでは、がん、腫瘍、もしくは新生物または疑われるがん、腫瘍、もしくは新生物は、肺、結腸、直腸、腎臓、乳房、前立腺、または肝臓のものであり得る。一部の実施形態では、がん、腫瘍、もしくは新生物または疑われるがん、腫瘍、もしくは新生物は、肺のものである。一部の実施形態では、がん、腫瘍、もしくは新生物または疑われるがん、腫瘍、もしくは新生物は、結腸または直腸のものである。一部の実施形態では、がん、腫瘍、もしくは新生物または疑われるがん、腫瘍、もしくは新生物は、乳房のものである。一部の実施形態では、がん、腫瘍、もしくは新生物または疑われるがん、腫瘍、もしくは新生物は、前立腺のものである。前述の実施形態のいずれかでは、対象は、ヒト対象であり得る。
C.試料もしくは部分試料またはその一部からのDNAのプーリング
一部の実施形態では、本明細書の方法は、複数の分配された部分試料からのタグ付けされたDNAを含む1つまたは複数のプールを調製するステップを含む。一部の実施形態では、プールは、低メチル化分配のDNAの少なくとも一部および高メチル化分配のDNAの少なくとも一部を含む。例えば、エピジェネティック標的領域および/または配列可変標的領域を含む標的領域は、プールから捕捉され得る。本明細書の他所で記載される試料または部分試料の少なくとも1つのアリコートまたは部分から標的領域セットを捕捉するステップは、第1および第2の部分試料からのDNAを含むプールについて実施される捕捉ステップを包含する。プール中のDNAを増幅するステップは、プールから標的領域を捕捉するステップの前に実施され得る。捕捉するステップは、本明細書の他所で捕捉するステップに関して記載される特色のいずれかを有し得る。
一部の実施形態では、方法は、低メチル化分配のDNAの少なくとも一部を含む第1のプールを調製するステップを含む。一部の実施形態では、方法は、高メチル化分配のDNAの少なくとも一部を含む第2のプールを調製するステップを含む。一部の実施形態では、方法は、第1のプールから標的領域の少なくとも第1のセットを捕捉するステップを含み、第1のセットは、配列可変標的領域を含む。第1のプール中のDNAを増幅するステップは、この捕捉ステップの前に実施され得る。一部の実施形態では、第1のプールから標的領域の第1のセットを捕捉するステップは、第1のプールのDNAを、標的特異的プローブの第1のセットと接触させることを含み、標的特異的プローブの第1のセットは、配列可変標的領域に対して特異的な標的結合プローブを含む。一部の実施形態では、方法は、第2のプールから標的領域の第2の複数のセットを捕捉するステップを含み、第2の複数は、配列可変標的領域およびエピジェネティック標的領域を含む。第2のプール中のDNAを増幅するステップは、この捕捉ステップの前に実施され得る。一部の実施形態では、第2のプールから標的領域の第2の複数のセットを捕捉するステップは、第1のプールのDNAを、標的特異的プローブの第2のセットと接触させることを含み、標的特異的プローブの第2のセットは、配列可変標的領域に対して特異的な標的結合プローブおよびエピジェネティック標的領域に対して特異的な標的結合プローブを含む。
一部の実施形態では、配列可変標的領域は、分配された部分試料の第2の部分から捕捉される。第2の部分は、プール中に含まれなかった部分試料のDNAの一部、大部分、実質的に全て、または全てを含み得る。プールからおよび部分試料から捕捉された領域は、組み合わされ、並行して解析され得る。
エピジェネティック標的領域は、本明細書の他所で考察したように、それらが特定の細胞もしくは組織タイプを起源とするか、または腫瘍を起源とするか、または健康な細胞を起源とするかに依存して、メチル化レベルおよび/または断片化パターンの差を示し得る。配列可変標的領域は、それらが腫瘍を起源とするかまたは健康な細胞を起源とするかに依存して、配列の差を示し得る。
低メチル化分配からのエピジェネティック標的領域の解析は、一部の応用では、高メチル化および低メチル化分配からの配列可変標的領域の、ならびに高メチル化分配からのエピジェネティック標的領域の解析よりも情報量が少ないことがあり得る。そのため、配列可変標的領域およびエピジェネティック標的領域が捕捉される方法では、後者は、配列可変標的領域の1つもしくは複数が高メチル化および低メチル化分配から捕捉される場合よりも低い程度に、ならびに/またはエピジェネティック標的領域が高メチル化分配から捕捉される場合よりも低い程度に、捕捉され得る。例えば、配列可変標的領域は、高メチル化分配と共にプールされない低メチル化分配の一部から捕捉することができ、プールは、高メチル化分配からのDNAの一部(例えば、大部分、実質的に全て、または全て)および低メチル化分配からのDNAなしまたはその一部(例えば、少数)によって調製することができる。そのようなアプローチは、低メチル化分配からのエピジェネティック標的領域のシーケンシングを低減または排除し、それによってさらなる解析にとって十分であるシーケンシングデータの量を低減することができる。
一部の実施形態では、プール中の低メチル化分配のDNAの少数部分を含むことは、1つまたは複数のエピジェネティック特色(例えば、本明細書の他所で詳細に考察されているメチル化または他のエピジェネティック特色)の、例えば相対的な定量を容易にする。
一部の実施形態では、プールは、例えば、低メチル化分配のDNAの約50%未満、例えば、低メチル化分配のDNAの約45%未満もしくはそれに等しい、40%未満もしくはそれに等しい、35%未満もしくはそれに等しい、30%未満もしくはそれに等しい、25%未満もしくはそれに等しい、20%未満もしくはそれに等しい、15%未満もしくはそれに等しい、10%未満もしくはそれに等しい、または5%未満もしくはそれに等しい、低メチル化分配のDNAの少数部分を含む。一部の実施形態では、プールは、低メチル化分配のDNAの約5%~25%を含む。一部の実施形態では、プールは、低メチル化分配のDNAの約10%~20%を含む。一部の実施形態では、プールは、低メチル化分配のDNAの約10%を含む。一部の実施形態では、プールは、低メチル化分配のDNAの約15%を含む。一部の実施形態では、プールは、低メチル化分配のDNAの約20%を含む。
一部の実施形態では、プールは、高メチル化分配のDNAの少なくとも50%であり得る、高メチル化分配の一部を含む。例えば、プールは、高メチル化分配のDNAの少なくとも約55%、60%、65%、70%、75%、80%、85%、90%、または95%を含み得る。一部の実施形態では、プールは、高メチル化分配のDNAの50~55%、55~60%、60~65%、65~70%、70~75%、75~80%、80~85%、85~90%、90~95%、または95~100%を含む。一部の実施形態では、第2のプールは、高メチル化分配のDNAの全てまたは実質的に全てを含む。
一部の実施形態では、第1のプールは、低メチル化分配のDNAの実質的に全てまたは全てを含む(例えば、第2のプールは、低メチル化分配のDNAを含まない)。一部の実施形態では、第2のプールは、低メチル化分配のDNAを含まない(例えば、第1のプールは、低メチル化分配のDNAの実質的に全てまたは全てを含む)。
一部の実施形態では、第2のプールは、低メチル化分配に関して上記された値および範囲のいずれかであり得る、高メチル化分配の一部を含む。一部の実施形態では、第2のプールは、高メチル化分配のDNAの全てまたは実質的に全てを含む。
例示的な実施形態では、分配の後、分配は、末端修復、および分子バーコードを含むアダプターへのライゲーションを個別に受け、次いで、個別に増幅される。増幅の後、増幅された分子は、富化される(分配をなおも個別に維持する)。富化後、富化されたDNAは、本明細書に記載される実施形態のいずれかに従ってプールされ、次いで、再度増幅される。増幅の後、分子はシーケンシングされる。
様々な実施形態では、方法は、上記考察と一致して、例えば、エピジェネティックおよび配列可変標的領域セットに関する異なる程度のシーケンシング深度まで、捕捉されたDNAをシーケンシングするステップをさらに含む。
D.シーケンシング
一般的に、アダプターが隣接している核酸を含む試料核酸は、事前の増幅ありまたはなしで、シーケンシングに供され得る。シーケンシング方法としては、例えば、サンガーシーケンシング、ハイスループットシーケンシング、パイロシーケンシング、合成によるシーケンシング、一分子シーケンシング、ナノポアシーケンシング、半導体シーケンシング、ライゲーションによるシーケンシング、ハイブリダイゼーションによるシーケンシング、デジタル遺伝子発現(Helicos)、次世代シーケンシング(NGS)、合成による一分子シーケンシング(SMSS)(Helicos)、大規模並列シーケンシング、クローン単一分子アレイ(Solexa)、ショットガンシーケンシング、Ion Torrent、Oxford Nanopore、Roche Genia、マキサム-ギルバートシーケンシング、プライマーウォーキング、およびPacBio、SOLiD、Ion Torrent、またはNanoporeプラットフォームを使用するシーケンシングが挙げられる。
一部の実施形態では、シーケンシングは、非改変核酸塩基および改変核酸塩基を検出および/または識別することを含む。例えば、PacBioシーケンシング(例えば、一分子リアルタイム(SMRT)シーケンシング)は、例えば、5-メチルシトシンおよび5-ヒドロキシメチルシトシンならびに非改変シトシンを直接検出する能力を提供する。例えば、Schatz., Nature Methods. 14(4): 347-348 (2017);およびUS9,150,918を参照されたい。また、DNAのメチル化(例えば、5-メチルシトシンおよび5-ヒドロキシメチルシトシン)を直接的に検出することができるOxford nanoporeシーケンシングシステム(例えば、MinIONシーケンサー)が、本明細書で使用され得る。シーケンシング反応は、複数のレーン、複数のチャネル、複数のウェル、または複数の試料セットを実質的に同時にプロセシングする他の手段を含み得る多様な試料プロセシングユニットにおいて実施することができる。試料プロセシングユニットはまた、複数の実行のプロセシングを同時に可能にするために複数の試料チャンバーを含み得る。同様に、Ion Torrentシーケンシングもまた、メチル化を直接的に検出するために使用され得る。このように、一部の実施形態では、メチル化状態は、例えば、分配ステップまたは変換手順、例えば、バイサルファイト処置なしに、またはそれとは独立して、シーケンシングの間に決定され得る。
シーケンシング反応は、がんのマーカーまたは他の疾患のマーカーを含有することが公知のものなどの、核酸の1つまたは複数の形態について実施することができる。シーケンシング反応は、試料中に存在する任意の核酸断片についても実施することができる。一部の実施形態では、ゲノムの配列カバレッジは、5%未満、10%未満、15%未満、20%未満、25%未満、30%未満、40%未満、50%未満、60%未満、70%未満、80%未満、90%未満、95%未満、99%未満、99.9%未満または100%未満であり得る。一部の実施形態では、配列反応は、ゲノムの少なくとも5%、10%、15%、20%、25%、30%、40%、50%、60%、70%、または80%の配列カバレッジを提供し得る。配列カバレッジは、少なくとも5、10、20、70、100、200もしくは500個の異なる遺伝子、または多くて5000、2500、1000、500もしくは100個の異なる遺伝子について実施することができる。
同時のシーケンシング反応は、多重シーケンシングを使用して実施され得る。一部の例では、無細胞核酸は、少なくとも1000回、2000回、3000回、4000回、5000回、6000回、7000回、8000回、9000回、10000回、50000回、100,000回のシーケンシング反応によってシーケンシングされ得る。他の例では、無細胞核酸は、1000回未満、2000回未満、3000回未満、4000回未満、5000回未満、6000回未満、7000回未満、8000回未満、9000回未満、10000回未満、50000回未満、100,000回未満のシーケンシング反応によってシーケンシングされ得る。シーケンシング反応は、逐次的または同時に実施され得る。その後のデータ解析は、シーケンシング反応の全てまたは一部について実施され得る。一部の例では、データ解析は、少なくとも1000回、2000回、3000回、4000回、5000回、6000回、7000回、8000回、9000回、10000回、50000回、100,000回のシーケンシング反応について実施され得る。他の例では、データ解析は、1000回未満、2000回未満、3000回未満、4000回未満、5000回未満、6000回未満、7000回未満、8000回未満、9000回未満、10000回未満、50000回未満、100,000回未満のシーケンシング反応について実施され得る。例示的な読み取りデータ深度は、遺伝子座(塩基)あたり1000~50000個の読み取りデータである。
1.シーケンシングの差次的深度
一部の実施形態では、配列可変標的領域セットに対応する核酸は、エピジェネティック標的領域セットに対応する核酸よりも大きいシーケンシング深度までシーケンシングされる。例えば、配列変異体標的領域セットに対応する核酸に関するシーケンシング深度は、エピジェネティック標的領域セットに対応する核酸に関するシーケンシング深度よりも少なくとも1.25倍、1.5倍、1.75倍、2倍、2.25倍、2.5倍、2.75倍、3倍、3.5倍、4倍、4.5倍、5倍、6倍、7倍、8倍、9倍、10倍、11倍、12倍、13倍、14倍、もしくは15倍大きく、または1.25倍~1.5倍、1.5倍~1.75倍、1.75倍~2倍、2倍~2.25倍、2.25倍~2.5倍、2.5倍~2.75倍、2.75倍~3倍、3倍~3.5倍、3.5倍~4倍、4倍~4.5倍、4.5倍~5倍、5倍~5.5倍、5.5倍~6倍、6倍~7倍、7倍~8倍、8倍~9倍、9倍~10倍、10倍~11倍、11倍~12倍、13倍~14倍、14倍~15倍、もしくは15倍~100倍大きくなり得る。一部の実施形態では、前記シーケンシング深度は、少なくとも2倍大きい。一部の実施形態では、前記シーケンシング深度は、少なくとも5倍大きい。一部の実施形態では、前記シーケンシング深度は、少なくとも10倍大きい。一部の実施形態では、前記シーケンシング深度は、4倍~10倍大きい。一部の実施形態では、前記シーケンシング深度は、4倍~100倍大きい。
一部の実施形態では、配列可変標的領域セットに対応するDNAおよび/またはエピジェネティック標的領域セットに対応するDNAは、例えば、同じシーケンシングセル(例えば、Illuminaシーケンサーのフローセル)において、ならびに/あるいは捕捉されたセットを個別に組み換えることから得られる組み合わされたもしくはプールされた組成物、または例えば、同じ容器中で配列可変標的領域セットに対応するcfDNA、および/もしくはエピジェネティック標的領域セットに対応する捕捉されたcfDNAを捕捉することによって得られた組成物であり得る同じ組成物において、同時にシーケンシングされる。
E.解析
一部の実施形態では、本明細書に記載される方法は、DNAが起源とする特定の免疫細胞タイプのレベルを決定するステップを含む。免疫細胞タイプは、ナイーブリンパ球および活性化されたリンパ球、分化の異なる時点にある骨髄性細胞、ならびに/または本明細書の他所で記載される他のタイプを含み得る。一部の方法では、免疫細胞タイプのレベルの決定は、DNAを得た対象が免疫系に関連する疾患または障害、例えば、感染症、移植片拒絶、またはがんもしくは前がんを有する可能性の決定を容易にする。
一部の実施形態では、本明細書に記載される方法は、腫瘍(または新生物細胞、またはがん細胞)によってまたは前がん細胞によって産生されるDNAの存在を同定するステップを含む。一部の実施形態では、本明細書に記載される方法は、腫瘍細胞でもがん細胞でも前がん細胞でもない免疫細胞によって産生されるDNAの存在を同定するステップを含む。一部のそのような実施形態では、免疫細胞分布の決定は、がんもしくは前がんの検出もしくは診断、またはがん予後もしくはがん処置選択肢の決定を容易にする。例えば、異なる免疫細胞タイプの比率を決定することは、そのような検出または決定を容易にし得る。一部の実施形態では、比率の分子は、好中球、単球、またはそれら両方の数または相対数であり、比率の分母は、T細胞、B細胞、NK細胞、または全てのリンパ球の数または相対数である。一部の実施形態では、比率の分子は、好中球の数または相対数であり、比率の分母は、T細胞、B細胞、NK細胞、または全てのリンパ球の数または相対数である。一部の実施形態では、比率の分子は、単球の数または相対数であり、比率の分母は、T細胞、B細胞、NK細胞、または全てのリンパ球の数または相対数である。一部の実施形態では、比率の分子は、好中球および単球の数または相対数であり、比率の分母は、T細胞、B細胞、NK細胞、または全てのリンパ球の数または相対数である。一部の実施形態では、比率は、好中球のリンパ球に対する比率である。一部の実施形態では、比率は、単球のT細胞に対する比率である。一部の実施形態では、そのような比率の上昇は、がんに関連する。他の実施形態では、そのような比率の低減は、がんに関連する。
本方法は、対象における状態、特にがんまたは前がんの存在を診断するため、状態を特徴付ける(例えば、がんをステージ分類するまたはがんの不均一性を決定する)、状態の処置に対する応答をモニタリングする、状態を発症するリスクまたは状態のその後の経過の予後判定を行うために使用され得る。本開示はまた、特定の処置選択肢の有効性を決定するためにも有用であり得る。処置が成功すればより多くのがんが死滅し、DNAを脱落させ得ることから、処置選択肢の成功は、対象の血液中で検出されるコピー数変異またはまれな突然変異の量を増加させ得る。他の例では、これは起こらなくてもよい。別の例では、おそらくある特定の処置選択肢は、経時的ながんの遺伝的プロファイルと相関し得る。この相関は、治療を選択するために有用であり得る。
さらに、がんが処置後に寛解期にあることが観察される場合、本方法を使用して、残存疾患または疾患の再発をモニタリングすることができる。
検出され得るがんのタイプおよび数としては、血液がん、脳がん、肺がん、皮膚がん、鼻のがん、喉のがん、肝臓がん、骨がん、リンパ腫、膵臓がん、皮膚がん、腸がん、直腸がん、甲状腺がん、膀胱がん、腎臓がん、口腔がん、胃がん、固形状態の腫瘍、不均一な腫瘍、均一な腫瘍などが挙げられ得る。がんのタイプおよび/またはステージは、突然変異、まれな突然変異、インデル、コピー数変異、塩基転換、転座、組換え、逆位、欠失、異数性、部分的異数性、倍数性、染色体不安定性、染色体構造の変更、遺伝子融合、染色体融合、遺伝子トランケーション、遺伝子増幅、遺伝子重複、染色体病変、DNA病変、核酸化学修飾の異常な変化、エピジェネティックパターンの異常な変化、および核酸5-メチルシトシンの異常な変化を含む遺伝的変異から検出することができる。
遺伝子データはまた、がんの特定の形態を特徴付けるためにも使用することができる。がんはしばしば、組成およびステージ分類の両方が不均一である。遺伝的プロファイルデータは、その特定のサブタイプの診断または処置において重要であり得るがんの特定のサブタイプの特徴付けを可能にし得る。この情報はまた、特定のタイプのがんの予後に関する手がかりを対象または従事者に提供し、対象または従事者のいずれかが、疾患の進行に従って処置選択肢を適合させることを可能にし得る。一部のがんは、進行してより侵襲性となり、遺伝的に不安定となり得る。他のがんは、良性、不活性、または休眠中のままであり得る。本開示のシステムおよび方法は、疾患進行を決定するために有用であり得る。
さらに、本開示の方法は、対象における異常な状態の不均一性を特徴付けるために使用され得る。そのような方法は、例えば、対象に由来する細胞外ポリヌクレオチドの遺伝的プロファイルを作成するステップであって、遺伝的プロファイルが、コピー数変異およびまれな突然変異の解析から得られる複数のデータを含む、ステップを含み得る。一部の実施形態では、異常な状態は、がんまたは前がんである。一部の実施形態では、異常な状態は、不均一なゲノム集団をもたらす状態であり得る。がんの例では、一部の腫瘍は、がんの異なるステージの腫瘍細胞を含むことが公知である。他の例では、不均一性は、疾患の複数の病巣を構成し得る。この場合も、がんの例では、複数の腫瘍病巣が存在してもよく、おそらく1つまたは複数の病巣は、原発部位から広がった転移の結果である。
本方法は、不均一な疾患における異なる細胞に由来する遺伝情報の要約であるデータのフィンガープリントまたはセットを作成またはプロファイリングするために使用され得る。このデータのセットは、コピー数変異、エピジェネティック変異、または他の突然変異の解析を単独でまたは組み合わせて含み得る。
本方法は、がん、または他の疾患を診断、予後判定、モニタリング、または観察するために使用され得る。一部の実施形態では、本明細書の方法は、胎児を診断することも予後判定することもモニタリングすることも伴わず、そのため、非侵襲性の出生前検査を対象としない。他の実施形態では、これらの方法論を、妊娠中の対象に用いて、そのDNAおよび他のポリヌクレオチドが母体の分子と共循環し得る、まだ生まれていない対象におけるがんまたは他の疾患を診断、予後判定、モニタリング、または観察してもよい。
NGSを介した免疫細胞タイプの同定のための例示的な方法は、以下のステップを含む:
1.分子タグを含むアダプターをDNAにライゲーションすることによって、抽出されたDNA試料(例えば、ヒト試料から抽出された血漿DNA)を調製するステップ。
2.DNAを、DNA中の改変シトシン、例えば、メチルシトシンを認識する作用剤と接触させることによって、アダプターライゲーションしたDNAを複数の差次的にメチル化された部分試料に分配するステップ。
4.部分試料を標的特異的プローブと接触させることによって、分配された部分試料から高メチル化可変標的領域および低メチル化可変標的領域を捕捉するステップ。
5.標的領域を含むDNAを富化および/または溶出させるステップ。
6.DNAを増幅し、NGS機器で多重でアッセイするステップ。
7.NGSデータを解析するステップであって、一意的分子を同定するために分子タグが使用される、ステップ。
例示的なワークフローは図1Aに示され、図中、試料から得られたcfDNAは、cfDNA分子のメチル化のレベルに基づいて分配される。次いで、分子バーコードが、各分配のcfDNA分子に付加され、次いで、エピジェネティックおよび必要に応じて配列可変標的領域が、分配された部分試料から次いで捕捉され、標的化ライブラリーを提供する。エピジェネティック標的領域は、ある特定のタイプの免疫細胞において差次的にメチル化される高メチル化可変標的領域および/または低メチル化可変標的領域を含む。標的化ライブラリーは、シーケンシング前に増幅され得、次いで、シーケンシングは、免疫細胞タイプのレベルおよび/または疾患もしくは障害の存在の可能性を決定するために使用される配列情報を提供する。
本明細書に記載される方法の一部の実施形態では、分子タグは、DNA中の第2の核酸塩基とは異なるようにDNA中の第1の核酸塩基に影響を及ぼす手順、例えば、本明細書に記載されるもののいずれかによって変更されないヌクレオチドからなる(例えば、手順が、バイサルファイト変換またはmCに影響を及ぼさない任意の他の変換である場合、A、T、およびGと共にmC;手順がhmCに影響を及ぼさない変換である場合、A、T、およびGと共にhmC、など)。本明細書に記載される方法の一部の実施形態では、分子タグは、DNA中の第2の核酸塩基とは異なるようにDNA中の第1の核酸塩基に影響を及ぼす手順、例えば、本明細書に記載されるもののいずれかによって変更されるヌクレオチドを含まない(例えば、手順が、バイサルファイト変換またはCに影響を及ぼす任意の他の変換である場合、タグは、非改変Cを含まない;手順がmCに影響を及ぼす変換である場合、タグは、mCを含まない;手順がhmCに影響を及ぼす変換である場合、タグは、hmCを含まない、など)。
II.ある特定の開示された方法の追加の特色
A.試料
試料は、対象から単離された任意の生体試料であり得る。試料は、身体試料であり得る。試料としては、体組織、例えば、既知のまたは疑われる固形腫瘍、全血、血小板、血清、血漿、糞便、赤血球、白血球(white blood cell)または白血球(leucocyte)、内皮細胞、組織生検、脳脊髄液、滑液、リンパ液、腹水、間質液または細胞外液、歯肉溝滲出液を含む細胞の間の空隙中の液体、骨髄、胸水、脳脊髄液、唾液、粘液、喀痰、精液、汗、尿が挙げられ得る。試料は、好ましくは、体液、特に血液およびその分画、ならびに尿である。試料は、対象から本来単離された形態であってもよく、あるいは構成要素、例えば細胞を除去もしくは添加する、または別の構成要素と比較して1つの構成要素に関して富化する、さらなるプロセシングに供されていてもよい。このように、解析のための好ましい体液は、無細胞核酸を含有する血漿または血清である。
一部の実施形態では、核酸の集団は、新生物、腫瘍、前がん、もしくはがんを有することが疑われるか、または新生物、腫瘍、前がん、もしくはがんを有すると以前に診断された対象由来の血清、血漿または血液試料から得られる。集団は、異なるレベルの、配列変異、エピジェネティック変異、および/または複製後もしくは転写後改変を有する核酸を含む。複製後改変としては、特に核酸塩基の5位でのシトシンの改変、例えば、5-メチルシトシン、5-ヒドロキシメチルシトシン、5-ホルミルシトシンおよび5-カルボキシルシトシンが挙げられる。
試料は、対象から単離されるかまたは得られ、試料解析の現場へと輸送され得る。試料は、望ましい温度、例えば、室温、4℃、-20℃、および/または-80℃で保存および発送され得る。試料は、試料解析の現場において、対象から単離されるかまたは得られ得る。対象は、ヒト、哺乳動物、動物、コンパニオン動物、介助動物、または愛玩動物であり得る。対象は、がん、前がん、感染症、移植片拒絶、または免疫系の変化に関連する他の疾患もしくは障害を有し得る。対象は、がんまたは検出可能ながんの症状を有さなくてもよい。対象は、1つまたは複数のがん治療、例えば、化学療法、抗体、ワクチンまたは生物製剤のうちのいずれか1つまたは複数によって処置されていてもよい。対象は寛解期にあってもよい。対象は、がんまたは任意のがん関連の遺伝的突然変異/障害に罹りやすいと診断されても診断されなくてもよい。
一部の実施形態では、試料は、血漿を含む。得られた血漿の体積は、シーケンシングされる領域の所望の読み取り深度に依存し得る。例示的な体積は、0.4~40ml、5~20ml、10~20mlである。例えば、体積は、0.5mL、1mL、5mL、10mL、20mL、30mL、または40mLであり得る。試料採取した血漿の体積は、5~20mLであり得る。
試料は、様々な量の、ゲノム等価物を含有する核酸を含み得る。例えば、約30ngのDNAの試料は、約10,000(10)個の半数体ヒトゲノム等価物を含有し得、cfDNAの場合、約2000億(2×1011)個の個々のポリヌクレオチド分子を含有し得る。同様に、約100ngのDNAの試料は、約30,000個の半数体ヒトゲノム等価物を含有し得、cfDNAの場合、約6000億個の個々の分子を含有し得る。
試料は、異なる起源から、例えば、同じ対象の細胞および無細胞から、異なる対象の細胞および無細胞からの核酸を含み得る。試料は、突然変異を有する核酸を含み得る。例えば、試料は、生殖系列突然変異および/または体細胞突然変異を有するDNAを含み得る。生殖系列突然変異は、対象の生殖系列DNA中に存在する突然変異を指す。体細胞突然変異は、対象の体細胞、例えば、前がん細胞またはがん細胞に起源する突然変異を指す。試料は、がん関連突然変異(例えば、がん関連体細胞突然変異)を有するDNAを含み得る。試料は、エピジェネティック変異体(すなわち、化学改変またはタンパク質改変)を含み得、エピジェネティック変異体は、遺伝的変異体、例えば、がん関連突然変異の存在に関連する。一部の実施形態では、試料は、遺伝的変異体の存在に関連するエピジェネティック変異体を含み、試料は、遺伝的変異体を含まない。
増幅前の試料中の無細胞核酸の例示的な量は、約1fg~約1μg、例えば、1pg~200ng、1ng~100ng、10ng~1000ngの範囲である。例えば、量は、最大約600ng、最大約500ng、最大約400ng、最大約300ng、最大約200ng、最大約100ng、最大約50ng、または最大約20ngの無細胞核酸分子であり得る。量は、少なくとも1fg、少なくとも10fg、少なくとも100fg、少なくとも1pg、少なくとも10pg、少なくとも100pg、少なくとも1ng、少なくとも10ng、少なくとも100ng、少なくとも150ng、または少なくとも200ngの無細胞核酸分子であり得る。量は、最大1フェムトグラム(fg)、10fg、100fg、1ピコグラム(pg)、10pg、100pg、1ng、10ng、100ng、150ng、または200ngの無細胞核酸分子であり得る。方法は、1フェムトグラム(fg)~200ngを得るステップを含み得る。
無細胞核酸は、細胞内に含有されてもそれ以外の方法で細胞に結合してもいない核酸、または言い換えれば、インタクトな細胞の除去後に試料に残存している核酸である。無細胞核酸としては、ゲノムDNA、ミトコンドリアDNA、siRNA、miRNA、循環RNA(cRNA)、tRNA、rRNA、核小体低分子RNA(snoRNA)、Piwi相互作用RNA(piRNA)、長鎖非コードRNA(長鎖ncRNA)、またはこれらのいずれかの断片を含む、DNA、RNA、およびそれらのハイブリッドが挙げられる。無細胞核酸は、二本鎖、一本鎖、またはそれらのハイブリッドであり得る。無細胞核酸は、分泌または細胞死のプロセス、例えば、細胞の壊死およびアポトーシスを通じて体液中に放出され得る。一部の無細胞核酸は、がん細胞、例えば循環腫瘍DNA(ctDNA)から体液中に放出される。他は、健康な細胞から放出される。一部の実施形態では、cfDNAは、無細胞胎児DNA(cffDNA)である。一部の実施形態では、無細胞核酸は、腫瘍細胞によって産生される。一部の実施形態では、無細胞核酸は、腫瘍細胞および非腫瘍細胞の混合物によって産生される。
無細胞核酸は、約100~500ヌクレオチドの例示的なサイズ分布を有し、110~約230ヌクレオチドの分子が、分子の約90%を占め、最頻値は、約168ヌクレオチドであり、第2の小さいピークは、240ヌクレオチド~440ヌクレオチドの間の範囲にある。
無細胞核酸は、溶液中で見出される無細胞核酸がインタクトな細胞および体液の他の不溶性構成要素から分離される、分画ステップを通して体液から単離され得る。分配は、遠心分離または濾過などの技術を含み得る。あるいは、体液中の細胞は、溶解され得、無細胞核酸および細胞核酸は共にプロセシングされ得る。一般的に、緩衝液の添加および洗浄ステップの後、核酸は、アルコールで沈殿され得る。さらなるクリーンアップステップ、例えばシリカに基づくカラムが、夾雑物または塩を除去するために使用され得る。バイサルファイトシーケンシング、ハイブリダイゼーション、および/またはライゲーションのための非特異的バルク担体核酸、例えば、C1 DNA、DNAまたはタンパク質は、収率などの、手順のある特定の態様を最適にするために、反応全体を通して添加され得る。
そのようなプロセシングの後、試料は、二本鎖DNA、一本鎖DNA、および一本鎖RNAを含む、様々な形態の核酸を含み得る。一部の実施形態では、一本鎖DNAおよびRNAは、それらがその後のプロセシングおよび解析ステップに含まれるように、二本鎖形態に変換され得る。
DNA分子は、いずれか一方の末端または両方の末端で、アダプターに連結することができる。典型的には、二本鎖分子は、4つ全ての標準的なヌクレオチドの存在下での、5’-3’ポリメラーゼおよび3’-5’エキソヌクレアーゼ(またはプルーフリーディング機能)を有するポリメラーゼによる処置によって、平滑末端化される。クレノウラージ断片およびT4ポリメラーゼは、好適なポリメラーゼの例である。平滑末端化したDNA分子は、少なくとも部分的に二本鎖のアダプター(例えば、Y字形状またはベル形状のアダプター)とライゲーションされ得る。あるいは、相補的ヌクレオチドが、ライゲーションを容易にするために、試料核酸およびアダプターの平滑末端に付加され得る。平滑末端ライゲーションおよび付着末端ライゲーションの両方が本明細書で企図される。平滑末端ライゲーションでは、核酸分子およびアダプタータグの両方が平滑末端を有する。付着末端ライゲーションでは、典型的には、核酸分子は「A」オーバーハングを有し、アダプターは「T」オーバーハングを有する。
B.増幅
アダプターが隣接している試料核酸は、PCRおよび他の増幅方法によって増幅され得る。増幅は、典型的には、増幅されるDNA分子に隣接しているアダプター中のプライマー結合部位にアニーリングまたは結合するプライマーによってプライムされる。増幅方法は、サーモサイクリングから生じる変性、アニーリングおよび伸長のサイクルを伴い得るか、または転写媒介増幅におけるように等温であり得る。他の増幅方法としては、リガーゼ連鎖反応、鎖置換増幅、核酸配列に基づく増幅、および自家持続配列に基づく複製が挙げられる。一部の実施形態では、本方法は、TテールおよびCテールアダプターによるdsDNAライゲーションを実施し、これは、アダプターへの連結前に二本鎖核酸の少なくとも50、60、70、または80%の増幅をもたらす。好ましくは、本方法は、Tテールアダプター単独によって実施した対照方法と比較して、増幅された分子の量または数を少なくとも10、15、または20%増加させる。
C.タグ
バーコードを含むタグは、アダプターに取り込まれるか、またはそれ以外の方法で接合され得る。タグは、他の方法の中でも、ライゲーション、オーバーラップ伸長PCRによって取り込まれ得る。
1.分子タグ付け戦略
分子タグ付けは、配列読み取りデータが起源とするDNA分子間を区別することを可能にするタグ付け実施を指す。タグ付け戦略は、一意的タグ付けおよび非一意的タグ付け戦略に分けることができる。一意的タグ付けでは、試料中の全てまたは実質的に全ての分子が異なるタグを有し、それによって読み取りデータを、タグ情報のみに基づいて元の分子に割り当てることができる。そのような方法で使用されるタグは、時に「一意的タグ」と呼ばれる。非一意的タグ付けでは、同じ試料中の異なる分子が、同じタグを有することができ、それによってタグ情報に加えて他の情報を使用して、配列読み取りデータを元の分子に割り当てる。そのような情報は、開始および終止座標、分子がマッピングされる座標、開始または終止座標のみなどを含み得る。そのような方法において使用されるタグは時に、「非一意的タグ」と呼ばれる。したがって、試料中のあらゆる分子を必ずしも一意的にタグ付けする必要はない。試料内の同定可能なクラス内に入る分子を一意的にタグ付けすることで十分である。このように、異なる同定可能なファミリー中の分子は、タグ付けされた分子の同一性に関する情報を失うことなく、同じタグを有することができる。
非一意的タグ付けのある特定の実施形態では、使用される異なるタグの数は、特定の群の全てのDNA分子が異なるタグを有する非常に高い可能性(例えば、少なくとも99%、少なくとも99.9%、少なくとも99.99%、または少なくとも99.999%)であれば、十分であり得る。バーコードをタグとして使用する場合、およびバーコードが例えばランダムに分子の両方の末端に付着している場合、バーコードの組合せは共にタグを構成し得ることに留意されたい。この数は、明確にコールに入る分子の数の関数である。例えば、クラスは、参照ゲノム上の同じ開始-終止位置にマッピングされる全ての分子であり得る。クラスは、特定の遺伝子座、例えば特定の塩基または特定の領域(例えば、最大100塩基または遺伝子または遺伝子のエクソン)にわたってマッピングされる全ての分子であり得る。ある特定の実施形態では、クラスにおける分子の数zを一意的に同定するために使用される異なるタグの数は、2*z、3*z、4*z、5*z、6*z、7*z、8*z、9*z、10*z、11*z、12*z、13*z、14*z、15*z、16*z、17*z、18*z、19*z、20*z、または100*zのいずれか(例えば、下限)と、100,000*z、10,000*z、1000*z、または100*zのいずれか(例えば、上限)との間であり得る。
例えば、約5ng~30ngの無細胞DNAの試料において、およそ3000個の分子が特定のヌクレオチド座標にマッピングされ、任意の開始座標を有する約3~10個の間の分子が同じ終止座標を共有すると予想される。したがって、約50~約50,000個の異なるタグ(例えば、約6~220個の間のバーコードの組合せ)は、全てのそのような分子を一意的にタグ付けするために十分であり得る。ヌクレオチド座標にわたってマッピングされる全ての3000個の分子を一意的にタグ付けするためには、約100万個~約2000万個の異なるタグが必要であろう。
一般的に、反応における一意的または非一意的タグバーコードの割当ては、米国特許出願第20010053519号、第20030152490号、第20110160078号、および米国特許第6,582,908号および米国特許第7,537,898号および米国特許第9,598,731号に記載される方法およびシステムに従う。タグは、試料核酸にランダムまたは非ランダムに連結することができる。
一意的タグは、約1個より多く、2個より多く、3個より多く、4個より多く、5個より多く、6個より多く、7個より多く、8個より多く、9個より多く、10個より多く、20個より多く、50個より多く、100個より多く、500個より多く、1000個より多く、5000個より多く、10000個より多く、50,000個より多く、100,000個より多く、500,000個より多く、1,000,000個より多く、10,000,000個より多く、50,000,000個より多く、または1,000,000,000個より多くの一意的タグが、ゲノム試料あたりにロードされるようにロードされ得る。一部の例では、一意的タグは、約2個未満、3個未満、4個未満、5個未満、6個未満、7個未満、8個未満、9個未満、10個未満、20個未満、50個未満、100個未満、500個未満、1000個未満、5000個未満、10000個未満、50,000個未満、100,000個未満、500,000個未満、1,000,000個未満、10,000,000個未満、50,000,000個未満、または1,000,000,000個未満の一意的タグがゲノム試料あたりにロードされるようにロードされ得る。一部の例では、試料ゲノムあたりにロードされる一意的タグの平均数は、ゲノム試料あたり約1個未満もしくはそれより多くの、2個未満もしくはそれより多くの、3個未満もしくはそれより多くの、4個未満もしくはそれより多くの、5個未満もしくはそれより多くの、6個未満もしくはそれより多くの、7個未満もしくはそれより多くの、8個未満もしくはそれより多くの、9個未満もしくはそれより多くの、10個未満もしくはそれより多くの、20個未満もしくはそれより多くの、50個未満もしくはそれより多くの、100個未満もしくはそれより多くの、500個未満もしくはそれより多くの、1000個未満もしくはそれより多くの、5000個未満もしくはそれより多くの、10000個未満もしくはそれより多くの、50,000個未満もしくはそれより多くの、100,000個未満もしくはそれより多くの、500,000個未満もしくはそれより多くの、1,000,000個未満もしくはそれより多くの、10,000,000個未満もしくはそれより多くの、50,000,000個未満もしくはそれより多くの、または1,000,000,000個未満もしくはそれより多くの一意的タグである。
好ましいフォーマットは、標的核酸の両方の末端にライゲーションされた20~50個の異なるタグ(例えば、バーコード)を使用する。例えば、35個の異なるタグ(例えば、バーコード)が標的分子の両方の末端にライゲーションすると、35×35個の順列を作製し、これは35個のタグに関して1225個に等しい。そのような数のタグは、同じ開始および終止点を有する異なる分子が、高い確率(例えば、少なくとも94%、99.5%、99.99%、99.999%)で異なる組合せのタグを受容するために十分である。他のバーコードの組合せは、10~500個の間の任意の数、例えば、約15×15、約35×35、約75×75、約100×100、約250×250、約500×500個を含む。
一部の例では、一意的タグは、既定の、またはランダムもしくは半ランダム配列オリゴヌクレオチドであり得る。他の例では、バーコードが複数の中で必ずしも互いに一意的ではないように、複数のバーコードを使用してもよい。この例では、バーコードは、バーコードとそれがライゲーションされ得る配列の組合せが、個々に追跡され得る一意的配列を作製するように、個々の分子にライゲーションされ得る。本明細書で記載される場合、配列読み取りデータの始まり(開始)および終わり(終止)の部分の配列データと組み合わせた非一意的バーコードの検出は、特定の分子に対する一意的同一性の割当てを可能にし得る。個々の配列読み取りデータの塩基対の長さまたは数もまた使用して、そのような分子に一意的同一性を割り当ててもよい。本明細書に記載されるように、一意的同一性が割り当てられている核酸の一本鎖からの断片はそれによって、親の鎖からの断片のその後の同定を可能にし得る。
D.捕捉部分
上記で考察したように、試料中の核酸は、標的領域を有する分子がその後の解析のために捕捉される、捕捉ステップに供され得る。標的捕捉は、捕捉部分、例えば、ビオチンで標識したプローブ(例えば、オリゴヌクレオチド)、および捕捉部分に結合する第2の部分または結合パートナー、例えば、ストレプトアビジンの使用を伴い得る。一部の実施形態では、捕捉部分および結合パートナーは、本明細書の他所で考察したように、標的領域の異なるセットに関してより高いおよびより低い捕捉収率、例えばそれぞれ、配列可変標的領域セットおよびエピジェネティック標的領域セットの捕捉収率を有し得る。捕捉部分を含む方法は、例えば、参照により本明細書に組み込まれる、2017年12月26日に発行された米国特許第9,850,523号にさらに記載されている。
捕捉部分としては、これらに限定されないが、ビオチン、アビジン、ストレプトアビジン、特定のヌクレオチド配列を含む核酸、抗体によって認識されるハプテン、および磁気吸着可能な粒子が挙げられる。抽出部分は、結合対、例えば、ビオチン/ストレプトアビジンまたはハプテン/抗体のメンバーであり得る。一部の実施形態では、検体に付着した捕捉部分は、単離可能な部分、例えば、磁気吸着可能な粒子または遠心分離を通して沈降させることができる大きい粒子に付着したその結合対によって捕捉される。捕捉部分は、捕捉部分を欠如する核酸からの、捕捉部分を有する核酸の親和性分離を可能にする、任意のタイプの分子であり得る。例示的な捕捉部分は、固相に連結されたもしくは連結可能なストレプトアビジンに結合することによって親和性分離を可能にするビオチン、または固相に連結されたもしくは連結可能な相補的オリゴヌクレオチドに結合することを通して親和性分離を可能にするオリゴヌクレオチドである。
E.標的特異的プローブのコレクション
一部の実施形態では、標的特異的プローブのコレクションは、本明細書に記載されるように、エピジェネティック標的領域セットおよび/または配列可変標的領域セットを含む方法において使用される。一部の実施形態では、標的特異的プローブのコレクションは、配列可変標的領域セットに対して特異的な標的結合プローブおよびエピジェネティック標的領域セットに対して特異的な標的結合プローブを含む。一部の実施形態では、配列可変標的領域セットに対して特異的な標的結合プローブの捕捉収率は、エピジェネティック標的領域セットに対して特異的な標的結合プローブの捕捉収率よりも高い(例えば、少なくとも2倍高い)。一部の実施形態では、標的特異的プローブのコレクションは、エピジェネティック標的領域セットに対して特異的なその捕捉収率よりも高い(例えば、少なくとも2倍高い)配列可変標的領域セットに対して特異的な捕捉収率を有するように構成される。
一部の実施形態では、配列可変標的領域セットに対して特異的な標的結合プローブの捕捉収率は、エピジェネティック標的領域セットに対して特異的な標的結合プローブの捕捉収率よりも少なくとも1.25倍、1.5倍、1.75倍、2倍、2.25倍、2.5倍、2.75倍、3倍、3.5倍、4倍、4.5倍、5倍、6倍、7倍、8倍、9倍、10倍、11倍、12倍、13倍、14倍、または15倍高い。一部の実施形態では、配列可変標的領域セットに対して特異的な標的結合プローブの捕捉収率は、エピジェネティック標的領域セットに対して特異的な標的結合プローブの捕捉収率よりも1.25倍~1.5倍、1.5倍~1.75倍、1.75倍~2倍、2倍~2.25倍、2.25倍~2.5倍、2.5倍~2.75倍、2.75倍~3倍、3倍~3.5倍、3.5倍~4倍、4倍~4.5倍、4.5倍~5倍、5倍~5.5倍、5.5倍~6倍、6倍~7倍、7倍~8倍、8倍~9倍、9倍~10倍、10倍~11倍、11倍~12倍、13倍~14倍、または14倍~15倍高い。
一部の実施形態では、標的特異的プローブのコレクションは、エピジェネティック標的領域セットに対するその捕捉収率よりも少なくとも1.25倍、1.5倍、1.75倍、2倍、2.25倍、2.5倍、2.75倍、3倍、3.5倍、4倍、4.5倍、5倍、6倍、7倍、8倍、9倍、10倍、11倍、12倍、13倍、14倍、または15倍高い、配列可変標的領域セットに対して特異的な捕捉収率を有するように構成される。一部の実施形態では、標的特異的プローブのコレクションは、エピジェネティック標的領域セットに対して特異的なその捕捉収率よりも1.25倍~1.5倍、1.5倍~1.75倍、1.75倍~2倍、2倍~2.25倍、2.25倍~2.5倍、2.5倍~2.75倍、2.75倍~3倍、3倍~3.5倍、3.5倍~4倍、4倍~4.5倍、4.5倍~5倍、5倍~5.5倍、5.5倍~6倍、6倍~7倍、7倍~8倍、8倍~9倍、9倍~10倍、10倍~11倍、11倍~12倍、13倍~14倍、または14倍~15倍高い、配列可変標的領域セットに対して特異的な捕捉収率を有するように構成される。
プローブのコレクションは、濃度、様々な長さ、および/または化学(例えば、親和性に影響を及ぼす)、ならびにそれらの組合せを含む様々な方法で配列可変標的領域セットに対してより高い捕捉収率を提供するように構成され得る。親和性は、以下に考察するように、プローブの長さを調整する、および/またはヌクレオチド改変を含めることによってモジュレートすることができる。
一部の実施形態では、配列可変標的領域セットに対して特異的な標的特異的プローブは、エピジェネティック標的領域セットに対して特異的な標的特異的プローブよりも高い濃度で存在する。一部の実施形態では、配列可変標的領域セットに対して特異的な標的結合プローブの濃度は、エピジェネティック標的領域セットに対して特異的な標的結合プローブの濃度よりも少なくとも1.25倍、1.5倍、1.75倍、2倍、2.25倍、2.5倍、2.75倍、3倍、3.5倍、4倍、4.5倍、5倍、6倍、7倍、8倍、9倍、10倍、11倍、12倍、13倍、14倍、または15倍高い。一部の実施形態では、配列可変標的領域セットに対して特異的な標的結合プローブの濃度は、エピジェネティック標的領域セットに対して特異的な標的結合プローブの濃度よりも1.25倍~1.5倍、1.5倍~1.75倍、1.75倍~2倍、2倍~2.25倍、2.25倍~2.5倍、2.5倍~2.75倍、2.75倍~3倍、3倍~3.5倍、3.5倍~4倍、4倍~4.5倍、4.5倍~5倍、5倍~5.5倍、5.5倍~6倍、6倍~7倍、7倍~8倍、8倍~9倍、9倍~10倍、10倍~11倍、11倍~12倍、13倍~14倍、または14倍~15倍高い。そのような実施形態では、濃度は、各セット中の個々のプローブの体積濃度あたりの平均質量を指し得る。
一部の実施形態では、配列可変標的領域セットに対して特異的な標的特異的プローブは、エピジェネティック標的領域セットに対して特異的な標的特異的プローブよりもそれらの標的に対する高い親和性を有する。親和性は、異なるプローブ化学を使用することによってを含む、当業者に公知の任意の方法でモジュレートすることができる。ある特定のヌクレオチド改変、例えばシトシン5-メチル化(ある特定の配列の文脈において)、糖の2’位でヘテロ原子を提供する改変、およびLNAヌクレオチドは、二本鎖核酸の安定性を増加させることができ、そのような改変を有するオリゴヌクレオチドが、その相補的配列に関して比較的高い親和性を有することを示している。例えば、Severin et al., Nucleic Acids Res. 39: 8740-8751 (2011); Freier et al., Nucleic Acids Res. 25: 4429-4443 (1997);米国特許第9,738,894号を参照されたい。同様に、より長い配列長は、一般的に親和性の増加を提供する。他のヌクレオチド改変、例えば、核酸塩基ヒポキサンチンをグアニンの代わりに置換すると、オリゴヌクレオチドとその相補配列の間の水素結合の量を低減させることによって親和性を低減する。一部の実施形態では、配列可変標的領域セットに対して特異的な標的特異的プローブは、その標的に対するその親和性を増加させる改変を有する。一部の実施形態では、あるいはまたはさらに、エピジェネティック標的領域セットに対して特異的な標的特異的プローブは、その標的に対するその親和性を減少させる改変を有する。一部の実施形態では、配列可変標的領域セットに対して特異的な標的特異的プローブは、エピジェネティック標的領域セットに対して特異的な標的特異的プローブよりも長い平均長および/または高い平均融解温度を有する。これらの実施形態を互いに、および/または上記で考察した濃度の差と組み合わせて、上記の任意の倍率の差またはその範囲などの、捕捉収率の所望の倍率の差を達成してもよい。
一部の実施形態では、標的特異的プローブは、捕捉部分を含む。捕捉部分は、本明細書に記載される捕捉分子のいずれか、例えばビオチンであってもよい。一部の実施形態では、標的特異的プローブは、固体支持体に、例えば捕捉部分の結合対の相互作用などを通して共有結合または非共有結合により連結される。一部の実施形態では、固体支持体はビーズ、例えば磁気ビーズである。
一部の実施形態では、配列可変標的領域セットに対して特異的な標的特異的プローブおよび/またはエピジェネティック標的領域セットに対して特異的な標的特異的プローブは、上記で考察した捕捉部分、例えば、捕捉部分および遺伝子などの領域のパネルにわたってタイリングするために選択された配列を含むプローブを含む。
一部の実施形態では、標的特異的プローブは、単一の組成物中で提供される。単一の組成物は溶液(液体または凍結)であり得る。あるいは、これは凍結乾燥物であり得る。
あるいは、標的特異的プローブは、例えば、エピジェネティック標的領域セットに対して特異的なプローブを含む第1の組成物、および配列可変標的領域セットに対して特異的なプローブを含む第2の組成物を含む、複数の組成物として提供され得る。これらのプローブを適切な割合で混合して、濃度および/または捕捉収率の前述の倍率の差のいずれかを有する組み合わせたプローブ組成物を提供してもよい。あるいは、それらを個別の捕捉手順(例えば、試料のアリコートを用いて、または同じ試料で逐次的に)で使用して、捕捉されたエピジェネティック標的領域および配列可変標的領域をそれぞれ含む第1および第2の組成物を提供してもよい。
1.エピジェネティック標的領域に対して特異的なプローブ
エピジェネティック標的領域セットのプローブは、まれな免疫細胞タイプを含む異なるタイプの免疫細胞を起源とするDNAを区別する、および/または前がん様もしくは新生物(例えば、腫瘍またはがん)細胞からのDNAを、健康な細胞、例えば、非新生物循環細胞から区別する可能性が高い、1つまたは複数のタイプの標的領域に対して特異的なプローブを含み得る。そのような領域の例示的なタイプは、本明細書において詳細に考察されている。エピジェネティック標的領域セットのプローブはまた、例えば本明細書に記載されるように、1つまたは複数の対照領域のプローブを含み得る。
一部の実施形態では、エピジェネティック標的領域プローブセットのプローブは、少なくとも100kb、例えば、少なくとも200kb、少なくとも300kb、または少なくとも400kbのフットプリントを有する。一部の実施形態では、エピジェネティック標的領域セットのプローブは、100~1000kb、例えば、100~200kb、200~300kb、300~400kb、400~500kb、500~600kb、600~700kb、700~800kb、800~900kb、および900~1,000kbの範囲のフットプリントを有する。一部の実施形態では、エピジェネティック標的領域プローブセットのプローブは、少なくとも5kb、例えば、少なくとも10、20、または50kbのフットプリントを有する。
a.高メチル化可変標的領域
一部の実施形態では、エピジェネティック標的領域セットのプローブは、1つまたは複数の高メチル化可変標的領域に対して特異的なプローブを含む。高メチル化可変標的領域は、上記のそれらのいずれかであり得る。例えば、一部の実施形態では、高メチル化可変標的領域に対して特異的なプローブは、異なる免疫細胞タイプにおいて差次的にメチル化される複数の遺伝子座に対して特異的なプローブを含む。一部の実施形態では、各免疫細胞タイプ特異的な高メチル化可変標的領域は、1つの免疫細胞タイプにおいて0.3よりも高いもしくはそれに等しい、0.4よりも高いもしくはそれに等しい、0.5よりも高いもしくはそれに等しい、または0.6よりも高いもしくはそれに等しい頻度で、全ての他の免疫細胞タイプにおいて0.1未満もしくはそれに等しい、0.2未満もしくはそれに等しい、または0.3未満もしくはそれに等しい頻度でメチル化される少なくとも1つのCpG部位を含む。一部の実施形態では、各免疫細胞タイプ特異的な高メチル化可変標的領域は、1つの免疫細胞タイプにおいて0.3よりも高いもしくはそれに等しい、0.4よりも高いもしくはそれに等しい、0.5よりも高いもしくはそれに等しい、または0.6よりも高いもしくはそれに等しい頻度で、全ての他の免疫細胞タイプにおいて0.1未満もしくはそれに等しい、0.2未満もしくはそれに等しい、または0.3未満またはそれに等しい頻度で各々メチル化された、互いに100塩基対以内の少なくとも2つのCpG部位を含む。一部のそのような実施形態では、各免疫細胞タイプ特異的な高メチル化可変標的領域は、150塩基対以内または200塩基対以内に、合計で少なくとも2、3、4、5、6、7、8、9、または10個のCpG部位を含み、少なくとも2、3、4、5、6、7、8、9、または10個のCpG部位のうちの3つ未満は、任意の正常組織タイプにおいて、0.1よりも高い、0.2よりも高い、または0.3よりも高い頻度でメチル化される。一部の実施形態では、各免疫細胞タイプ特異的なエピジェネティック標的領域セットは、方法において同定される免疫細胞タイプの各1つにおいて一意的に高メチル化される少なくとも3、少なくとも5、少なくとも10、少なくとも20、または少なくとも30個の高メチル化可変標的領域を含む。
一部の実施形態では、高メチル化可変標的領域に対して特異的なプローブは、表1に列挙される複数の遺伝子座、例えば、表1に列挙される遺伝子座の少なくとも10%、20%、30%、40%、50%、60%、70%、80%、90%、または100%に対して特異的なプローブを含む。一部の実施形態では、高メチル化可変標的領域に対して特異的なプローブは、表2に列挙される複数の遺伝子座、例えば、表2に列挙される遺伝子座の少なくとも10%、20%、30%、40%、50%、60%、70%、80%、90%、または100%に対して特異的なプローブを含む。一部の実施形態では、高メチル化可変標的領域に対して特異的なプローブは、表1または表2に列挙される複数の遺伝子座、例えば、表1または表2に列挙される遺伝子座の少なくとも10%、20%、30%、40%、50%、60%、70%、80%、90%、または100%に対して特異的なプローブを含む。
一部の実施形態では、標的領域として含まれる各座に関して、遺伝子の転写開始部位と終止コドン(選択的にスプライシングされる遺伝子の場合は最後の終止コドン)の間に結合するハイブリダイゼーション部位を有する1つまたは複数のプローブが存在し得る。一部の実施形態では、1つまたは複数のプローブは、列挙された位置の300bp以内、例えば200または100bp以内に結合する。一部の実施形態では、プローブは、上に列挙された位置と重複するハイブリダイゼーション部位を有する。一部の実施形態では、高メチル化標的領域に対して特異的なプローブは、乳がん、結腸がん、腎臓がん、肝臓がん、および肺がんのうちの1、2、3、4、または5つにおいて集合的に高メチル化を示す高メチル化標的領域の1、2、3、4、または5つのサブセットに対して特異的なプローブを含む。
b.低メチル化可変標的領域
一部の実施形態では、エピジェネティック標的領域セットのプローブは、1つまたは複数の低メチル化可変標的領域に対して特異的なプローブを含む。低メチル化可変標的領域は、上記のそれらのいずれかであり得る。例えば、一部の実施形態では、低メチル化可変標的領域に対して特異的なプローブは、異なる免疫細胞タイプにおいて差次的にメチル化される複数の遺伝子座に対して特異的なプローブを含む。一部の実施形態では、各免疫細胞タイプ特異的な低メチル化可変標的領域は、1つの免疫細胞タイプにおいて0.1未満もしくはそれに等しい、0.2未満もしくはそれに等しい、または0.3未満もしくはそれに等しい頻度で、全ての他の免疫細胞タイプにおいて0.3よりも高いもしくはそれに等しい、0.4よりも高いもしくはそれに等しい、0.5よりも高いもしくはそれに等しい、または0.6よりも高いもしくはそれに等しい頻度でメチル化される少なくとも1つのCpG部位を含む。一部の実施形態では、各免疫細胞タイプ特異的な低メチル化可変標的領域は、1つの免疫細胞タイプにおいて0.1未満もしくはそれに等しい、0.2未満もしくはそれに等しい、または0.3未満もしくはそれに等しい頻度で、全ての他の免疫細胞タイプにおいて0.3よりも高いもしくはそれに等しい、0.4よりも高いもしくはそれに等しい、0.5よりも高いもしくはそれに等しい、または0.6よりも高いもしくはそれに等しい頻度で各々メチル化された、互いに100塩基対以内の少なくとも2つのCpG部位を含む。一部のそのような実施形態では、各免疫細胞タイプ特異的な低メチル化可変標的領域は、150塩基対以内または200塩基対以内に、合計で少なくとも2、3、4、5、6、7、8、9、または10個のCpG部位を含み、少なくとも2、3、4、5、6、7、8、9、または10個のCpG部位のうちの3つ未満は、任意の正常組織タイプにおいて、0.1未満、0.2未満、または0.3未満の頻度でメチル化される。一部の実施形態では、各免疫細胞タイプ特異的なエピジェネティック標的領域セットは、方法において同定される免疫細胞タイプの各1つにおいて一意的に低メチル化される少なくとも3、少なくとも5、少なくとも10、少なくとも20、または少なくとも30個の低メチル化可変標的領域を含む。
一部の実施形態では、1つまたは複数の低メチル化可変標的領域に対して特異的なプローブは、反復エレメント、例えば、LINE1エレメント、Aluエレメント、セントロメアタンデムリピート、ペリセントロメアタンデムリピート、およびサテライトDNAなどの領域のプローブを含んでもよく、健康な細胞において通常メチル化される遺伝子間領域は、腫瘍細胞において低減されたメチル化を示し得る。
一部の実施形態では、低メチル化可変標的領域に対して特異的なプローブは、反復エレメントおよび/または遺伝子間領域に対して特異的なプローブを含む。一部の実施形態では、反復エレメントに対して特異的なプローブは、LINE1エレメント、Aluエレメント、セントロメアタンデムリピート、ペリセントロメアタンデムリピート、および/またはサテライトDNAのうちの1、2、3、4、または5個に対して特異的なプローブを含む。
がん関連低メチル化を示すゲノム領域に対して特異的な例示的なプローブは、ヒト第1染色体のヌクレオチド8403565~8953708および/または151104701~151106035に対して特異的なプローブを含む。一部の実施形態では、低メチル化可変標的領域に対して特異的なプローブは、ヒト第1染色体のヌクレオチド8403565~8953708および/または151104701~151106035と重複するまたはそれらを含む領域に対して特異的なプローブを含む。
c.CTCF結合領域
一部の実施形態では、エピジェネティック標的領域セットのプローブは、CTCF結合領域に対して特異的なプローブを含む。一部の実施形態では、CTCF結合領域に対して特異的なプローブは、少なくとも10、20、50、100、200、もしくは500個のCTCF結合領域、または10~20、20~50、50~100、100~200、200~500、もしくは500~1000個のCTCF結合領域、例えば上記の、またはCTCFBSDBの1つもしくは複数、または上記で引用したCuddapahら、Martinら、もしくはRheeらの論文におけるCTCF結合領域などに対して特異的なプローブを含む。一部の実施形態では、エピジェネティック標的領域セットのプローブは、CTCF結合部位の少なくとも100bp、少なくとも200bp、少なくとも300bp、少なくとも400bp、少なくとも500bp、少なくとも750bp、または少なくとも1000bp上流および下流の領域を含む。
d.転写開始部位
一部の実施形態では、エピジェネティック標的領域セットのプローブは、転写開始部位
に対して特異的なプローブを含む。一部の実施形態では、転写開始部位に対して特異的なプローブは、少なくとも10、20、50、100、200、もしくは500個の転写開始部位、または10~20、20~50、50~100、100~200、200~500、もしくは500~1000個の転写開始部位、例えばDBTSSに列挙される転写開始部位などに対して特異的なプローブを含む。一部の実施形態では、エピジェネティック標的領域セットのプローブは、転写開始部位の少なくとも100bp、少なくとも200bp、少なくとも300bp、少なくとも400bp、少なくとも500bp、少なくとも750bp、または少なくとも1000bp上流および下流の配列のプローブを含む。e.局所増幅
上記のように、局所増幅が体細胞突然変異であるが、それらは、メチル化の変化などのある特定のエピジェネティック変化を検出するためのアプローチと類似の方法で読み取りデータの頻度に基づいてシーケンシングすることによって検出することができる。そのため、がんにおいて局所増幅を示し得る領域を、上記で考察したようにエピジェネティック標的領域セットに含めることができる。一部の実施形態では、エピジェネティック標的領域セットに対して特異的なプローブは、局所増幅に対して特異的なプローブを含む。一部の実施形態では、局所増幅に対して特異的なプローブは、AR、BRAF、CCND1、CCND2、CCNE1、CDK4、CDK6、EGFR、ERBB2、FGFR1、FGFR2、KIT、KRAS、MET、MYC、PDGFRA、PIK3CA、およびRAF1のうちの1つまたは複数に対して特異的なプローブを含む。例えば、一部の実施形態では、局所増幅に対して特異的なプローブは、前述の標的の少なくとも2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、または18個のうちの1つまたは複数に対して特異的なプローブを含む。
f.対照領域
データ検証を容易にするために対照領域を含めることは有用であり得る。一部の実施形態では、エピジェネティック標的領域セットに対して特異的なプローブは、本質的に全ての試料においてメチル化されると予想される対照メチル化領域に対して特異的なプローブを含む。一部の実施形態では、エピジェネティック標的領域セットに対して特異的なプローブは、本質的に全ての試料において低メチル化であると予想される対照低メチル化領域に対して特異的なプローブを含む。
ii.配列可変標的領域に対して特異的なプローブ
配列可変標的領域セットのプローブは、がんにおいて体細胞突然変異を受けることが公知である複数の領域に対して特異的なプローブを含み得る。プローブは、本明細書に記載される任意の配列可変標的領域セットに対して特異的であり得る。例示的な配列可変標的領域セットは、本明細書において、例えば捕捉されたセットに関する上記の節で詳細に考察される。
一部の実施形態では、配列可変標的領域プローブセットは、少なくとも0.5kb、例えば、少なくとも1kb、少なくとも2kb、少なくとも5kb、少なくとも10kb、少なくとも20kb、少なくとも30kb、または少なくとも40kbのフットプリントを有する。一部の実施形態では、エピジェネティック標的領域プローブセットは、0.5~100kb、例えば、0.5~2kb、2~10kb、10~20kb、20~30kb、30~40kb、40~50kb、50~60kb、60~70kb、70~80kb、80~90kb、および90~100kbの範囲のフットプリントを有する。
一部の実施形態では、配列可変標的領域セットに対して特異的なプローブは、表3の遺伝子の少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも55、少なくとも60、少なくとも65、または70個の少なくとも一部に対して特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに対して特異的なプローブは、表3のSNVの少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも55、少なくとも60、少なくとも65、または70個に対して特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに対して特異的なプローブは、表3の融合体の少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、または6個に対して特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに対して特異的なプローブは、表3のインデルの少なくとも1、少なくとも2、または3個の少なくとも一部に対して特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに対して特異的なプローブは、表4の遺伝子の少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも55、少なくとも60、少なくとも65、少なくとも70、または73個の少なくとも一部に対して特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに対して特異的なプローブは、表4のSNVの少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも55、少なくとも60、少なくとも65、少なくとも70、または73個に対して特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに対して特異的なプローブは、表4の融合体の少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、または6個に対して特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに対して特異的なプローブは、表4のインデルの少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、または18個の少なくとも一部に対して特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに対して特異的なプローブは、表5の遺伝子の少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、または少なくとも20個の少なくとも一部に対して特異的なプローブを含む。
一部の実施形態では、配列可変標的領域セットに対して特異的なプローブは、少なくとも10、20、30、または35個のがん関連遺伝子、例えばAKT1、ALK、BRAF、CCND1、CDK2A、CTNNB1、EGFR、ERBB2、ESR1、FGFR1、FGFR2、FGFR3、FOXL2、GATA3、GNA11、GNAQ、GNAS、HRAS、IDH1、IDH2、KIT、KRAS、MED12、MET、MYC、NFE2L2、NRAS、PDGFRA、PIK3CA、PPP2R1A、PTEN、RET、STK11、TP53、およびU2AF1からの標的領域に対して特異的なプローブを含む。
F.コンピュータシステム
本開示の方法は、コンピュータシステムを使用してまたはその助けを借りてインプリメントすることができる。図2は、本開示の方法をインプリメントするようにプログラムされたまたはそれ以外の方法で構成されたコンピュータシステム201を示す。コンピュータシステム201は、試料調製、シーケンシング、および/または解析の様々な態様を調節することができる。一部の例では、コンピュータシステム201は、例えば、本明細書に開示される方法のいずれかに従って、試料調製、および核酸シーケンシングが含まれる試料解析を実施するように構成される。
コンピュータシステム201は、シングルコアもしくはマルチコアプロセッサー、または並列プロセシングのための複数のプロセッサーであり得る中央処理装置(CPU、また本明細書において「プロセッサー」および「コンピュータプロセッサー」)205を含む。コンピュータシステム201は、メモリーまたはメモリー場所210(例えば、ランダムアクセスメモリー、読み取り専用メモリー、フラッシュメモリー)、電子ストレージユニット215(例えば、ハードディスク)、1つまたは複数の他のシステムと通信するための通信インターフェース220(例えば、ネットワークアダプター)、ならびに周辺デバイス225、例えば、キャッシュ、他のメモリー、データストレージ、および/または電子ディスプレイアダプターもまた含む。メモリー210、ストレージユニット215、インターフェース220、および周辺デバイス225は、マザーボードなどの通信ネットワークまたはバス(実線)を通してCPU205と通信する。ストレージユニット215は、データを保存するためのデータストレージユニット(またはデータレポジトリ)であり得る。コンピュータシステム201は、通信インターフェース220の助けを借りてコンピュータネットワーク230に作動可能にカップリングすることができる。コンピュータネットワーク230は、Internet、インターネットおよび/もエクストラネット、またはInternetと通信するイントラネットおよび/もしくはエクストラネットであり得る。コンピュータネットワーク230は、一部の例では、電気通信および/またはデータネットワークである。コンピュータネットワーク230は、クラウドコンピューティングなどの分散コンピューティングを可能にし得る1つまたは複数のコンピュータサーバーを含み得る。コンピュータネットワーク230は、一部の例では、コンピュータシステム0の助けを借りて、コンピュータシステム201にカップリングさせたデバイスがクライアントまたはサーバーとして挙動することを可能にし得るピアツーピアネットワークをインプリメントすることができる。
CPU205は、プログラムまたはソフトウェアにおいて具体化することができる機械可読命令のシーケンスを実行することができる。命令は、メモリー210などのメモリー場所に保存され得る。CPU205によって実施される操作の例としては、フェッチ、復号、実行、およびライトバックが挙げられ得る。
ストレージユニット215は、ドライバー、ライブラリー、およびセーブしたプログラムなどのファイルを保存することができる。ストレージユニット215は、ユーザーが作成したプログラム、および記録されたセッション、ならびにプログラムに関連する出力を保存することができる。ストレージユニット215は、ユーザーデータ、例えばユーザーの好みおよびユーザープログラムを保存することができる。コンピュータシステム201は、一部の例では、例えば、イントラネットまたはInternetを通してコンピュータシステム201と通信するリモートサーバー上に位置する、コンピュータシステム201に外付けの1つまたは複数の追加のデータストレージユニットを含み得る。データは、例えば、通信ネットワークまたは物理的データ転送を使用して(例えば、ハードドライブ、サムドライブ、または他のデータストレージ機構を使用して)1つの場所から別の場所へと転送され得る。
コンピュータシステム201は、ネットワーク230を通して1つまたは複数のリモートコンピュータシステムと通信することができる。実施形態に関して、コンピュータシステム201は、ユーザー(例えば、オペレーター)のリモートコンピュータシステムと通信することができる。リモートコンピュータシステムの例としては、パーソナルコンピュータ(例えば、携帯型PC)、スレートもしくはタブレットPC(例えば、Apple(登録商標)iPad(登録商標)、Samsung(登録商標)Galaxy Tab)、電話、スマートフォン(例えば、Apple(登録商標)iPhone(登録商標)、Android(登録商標)可能デバイス、Blackberry(登録商標))、またはパーソナルデジタルアシスタントが挙げられる。ユーザーは、ネットワーク230を介してコンピュータシステム201にアクセスすることができる。
本明細書に記載される方法は、コンピュータシステム201の電子ストレージ場所、例えばメモリー210または電子ストレージユニット215などに保存された機械(例えば、コンピュータプロセッサー)実行可能コードによってインプリメントすることができる。機械実行可能または機械可読コードは、ソフトウェアの形態で提供することができる。使用の間、コードは、プロセッサー205によって実行され得る。一部の例では、コードを、ストレージユニット215から読み出し、プロセッサー205が容易にアクセスするためにメモリー210に保存することができる。一部の状況では、電子ストレージユニット215を除外することができ、機械実行可能命令はメモリー210に保存される。
一態様では、本開示は、少なくとも1つの電子プロセッサーによって実行される場合に、試料または対象からcfDNAを収集するステップ;cfDNAから標的領域の複数のセットを捕捉するステップであって、複数の標的領域セットが、配列可変標的領域セット、および/またはエピジェネティック標的領域セットを含む、ステップ;捕捉されたcfDNA分子をシーケンシングするステップであって、配列可変標的領域セットの捕捉されたcfDNA分子が、エピジェネティック標的領域セットの捕捉されたcfDNA分子よりも大きいシーケンシング深度までシーケンシングされる、ステップ;捕捉されたcfDNA分子のシーケンシングから核酸シーケンサーによって生成された複数の配列読み取りデータを得るステップ;複数の配列読み取りデータを1つまたは複数の参照配列にマッピングして、マッピングされた配列読み取りデータを生成するステップ;ならびに配列可変標的領域セットに対応するマッピングされた配列読み取りデータおよびエピジェネティック標的領域セットに対応するマッピングされた配列読み取りデータをプロセシングして、複数の免疫細胞タイプのレベルおよび/または対象ががんを有する可能性を決定するステップ、を含む方法の少なくとも一部を実施するコンピュータ実行可能命令を含む非一時的コンピュータ可読媒体を提供する。
コードは、事前にコンパイルされ、コードを実行するように適合させたプロセッサーを有する機械と共に使用するように構成することができ、または実行時間の間にコンパイルすることができる。コードは、コードが、事前にコンパイルされた、またはコンパイルされた通りに実行することが可能となるように選択することができるプログラミング言語で供給することができる。
本明細書に提供されるシステムおよび方法の態様、例えばコンピュータシステム201は、プログラミングにおいて具体化することができる。テクノロジーの様々な態様は、典型的に、機械可読媒体の1つのタイプにおいて実行または具体化される機械(またはプロセッサー)実行可能コードおよび/または関連データの形態の「生成物」または「製造品」であると考えられ得る。機械実行可能コードは、電子ストレージユニット、そのようなメモリー(例えば、読み取り専用メモリー、ランダムアクセスメモリー、フラッシュメモリー)またはハードディスクに保存することができる。「ストレージ」型の媒体は、ソフトウェアプログラミングのためにいついかなる時にも非一時的ストレージを提供し得るコンピュータの有形メモリー、プロセッサーなど、またはその関連するモジュール、例えば様々な半導体メモリー、テープドライブ、ディスクドライブなどのいずれかまたは全てを含み得る。
ソフトウェアの全てまたは一部は、時に、Internetまたは様々な他の電気通信ネットワークを通して通信され得る。そのような通信は、例えば、1つのコンピュータまたはプロセッサーからのソフトウェアを別のコンピュータまたはプロセッサーにロードすること、例えば管理サーバーまたはホストコンピュータからアプリケーションサーバーのコンピュータプラットフォームにロードすることを可能にし得る。このように、ソフトウェア要素を有し得る別のタイプの媒体は、光波、電波、および電磁波、例えば有線および光学的固定電話ネットワーク、ならびに様々なエアリンクを通してローカルデバイス間の物理的インターフェースを越えて使用される媒体を含む。そのような波動を伝える物理的要素、例えば有線または無線リンク、光学的リンクなどもまた、ソフトウェアを有する媒体であると考えられ得る。本明細書で使用される場合、非一時的有形「ストレージ」媒体に限定されない限り、コンピュータまたは機械「可読媒体」などの用語は、実行のためにプロセッサーに命令を提供することに関与する任意の媒体を指す。
したがって、機械可読媒体、例えばコンピュータ実行可能コードは、これらに限定されないが有形ストレージ媒体、搬送波媒体、または物理的伝送媒体を含む多くの形態をとり得る。不揮発性ストレージ媒体は、図面に示されるように、例えば、光学または磁気ディスク、例えば任意のコンピュータなどにおけるストレージデバイスのいずれか、例えばデータベースをインプリメントするために使用され得るものなどを含む。揮発性ストレージ媒体は、ダイナミックメモリー、例えばそのようなコンピュータプラットフォームのメインメモリーを含む。有形伝送媒体は、同軸ケーブル;コンピュータシステム内のバスを含むワイヤーを含む銅線および光ファイバーを含む。搬送波伝送媒体は、電気もしくは電磁シグナル、または音波もしくは光波の形態、例えば高周波(RF)および赤外線(IR)データ通信の間に生成される形態をとり得る。したがって、コンピュータ可読媒体の一般的な形態は、例えば、フロッピー(登録商標)ディスク、フレキシブルディスク、ハードディスク、磁気テープ、任意の他の磁気媒体、CD-ROM、DVDもしくはDVD-ROM、任意の他の光学媒体、パンチカード、紙テープ、穴パターンを有する任意の他の物理的ストレージ媒体、RAM、ROM、PROMおよびEPROM、FLASH(登録商標)-EPROM、任意の他のメモリーチップもしくはカートリッジ、搬送波輸送データもしくは命令、そのような搬送波を輸送するケーブルもしくはリンク、またはそこからコンピュータがプログラミングコードおよび/もしくはデータを読み取り得る任意の他の媒体を含む。コンピュータ可読媒体のこれらの形態の多くは、実行のためにプロセッサーに1つまたは複数の命令の1つまたは複数のシーケンスを伝えることに関係し得る。
コンピュータシステム201は、例えば、試料解析の1つまたは複数の結果を提供するためのユーザーインターフェース(UI)を含む電子ディスプレイを含むか、またはそれと通信することができる。UIの例としては、これらに限定されないが、グラフィカルユーザーインターフェース(GUI)およびウェブに基づくユーザーインターフェースが挙げられる。
コンピュータシステムおよびネットワーク、データベース、ならびにコンピュータプログラム生成物に関する追加の詳細はまた、例えば、その各々の全体がこれにより参照により本明細書に組み込まれる、Peterson, Computer Networks: A Systems Approach, Morgan Kaufmann, 5th Ed. (2011), Kurose, Computer Networking: A Top-Down Approach, Pearson, 7th Ed. (2016), Elmasri, Fundamentals of Database Systems, Addison Wesley, 6th Ed. (2010), Coronel, Database Systems: Design, Implementation, & Management, Cengage Learning, 11th Ed. (2014),
Tucker, Programming Languages, McGraw-Hill Science/Engineering/Math, 2nd Ed. (2006)、およびRhoton, Cloud Computing Architected: Solution Design Handbook, Recursive Press(2011)にも提供されている。
G.応用
1.免疫細胞タイプの定量、がん、および他の疾患
本方法は、まれな免疫細胞タイプ、例えば、活性化されたリンパ球、および分化の特定のステージにある骨髄性細胞を含む異なる免疫細胞タイプのレベルを定量するために使用され得る。そのような定量は、試料中の所定の細胞タイプに対応する分子の数に基づき得る。例えば、実施例2および3は、それぞれ、高メチル化可変標的領域および低メチル化可変標的領域に基づく定量を例証する。本方法で得られる配列情報は、核酸シーケンサーによって生成された核酸の配列読み取りデータを含み得る。一部の実施形態では、核酸シーケンサーは、核酸に対してパイロシーケンシング、一分子シーケンシング、ナノポアシーケンシング、半導体シーケンシング、合成によるシーケンシング、ライゲーションによるシーケンシングまたはハイブリダイゼーションによるシーケンシングを実施して、シーケンシング読み取りデータを生成する。一部の実施形態では、方法は、配列読み取りデータを配列読み取りデータのファミリーにグループ分けするステップをさらに含み、各ファミリーは、試料中の核酸から生成された配列読み取りデータを含む。一部の実施形態では、方法は、試料を得た対象ががん、前がん、感染症、移植片拒絶、または免疫細胞のタイプの割合の変化に関連する他の疾患もしくは障害を有する可能性を決定するステップを含む。
本方法は、対象における状態、特にがんまたは前がんの存在を診断するため、状態を特徴付ける(例えば、がんをステージ分類するまたはがんの不均一性を決定する)、状態の処置に対する応答をモニタリングする、状態を発症するリスクまたは状態のその後の経過の予後判定を行うために使用され得る。本開示はまた、特定の処置選択肢の有効性を決定するためにも有用であり得る。処置が成功すればより多くのがんが死滅し、DNAを脱落させ得ることから、処置選択肢の成功は、対象の血液中で検出されるコピー数変異またはまれな突然変異の量を増加させ得る。他の例では、これは起こらなくてもよい。別の例では、おそらくある特定の処置選択肢は、経時的ながんの遺伝的プロファイルと相関し得る。この相関は、治療を選択するために有用であり得る。
さらに、がんが処置後に寛解期にあることが観察される場合、本方法を使用して、残存疾患または疾患の再発をモニタリングすることができる。
一部の実施形態では、本明細書に開示される方法およびシステムを使用して、核酸変異体が体細胞または生殖系列起源であるという分類に基づいて、患者における所定の疾患または状態を処置するためのカスタマイズされたまたは標的化治療を同定してもよい。典型的に、検討中の疾患は、あるタイプのがんである。そのようながんの非限定的な例としては、胆管がん、膀胱がん、移行上皮癌、尿路上皮癌、脳がん、神経膠腫、星細胞腫、乳癌、化生癌、子宮頸がん、子宮頸部扁平上皮癌、直腸がん、結腸直腸癌、結腸がん、遺伝性非ポリポーシス大腸がん、結腸直腸腺癌、消化管間質腫瘍(GIST)、子宮内膜癌、子宮内膜間質肉腫、食道がん、食道扁平上皮癌、食道腺癌、眼内黒色腫、ぶどう膜黒色腫、胆嚢癌、胆嚢腺癌、腎細胞癌、明細胞腎細胞癌、移行上皮癌、尿路上皮癌、ウィルムス腫瘍、白血病、急性リンパ球性白血病(ALL)、急性骨髄性白血病(AML)、慢性リンパ球性白血病(CLL)、慢性骨髄性白血病(CML)、慢性骨髄単球性白血病(CMML)、肝臓がん、肝臓癌、肝腫、肝細胞癌、胆管癌、肝芽腫、肺がん、非小細胞肺がん(NSCLC)、中皮腫、B細胞リンパ腫、非ホジキンリンパ腫、びまん性大細胞型B細胞リンパ腫、マントル細胞リンパ腫、T細胞リンパ腫、非ホジキンリンパ腫、前駆Tリンパ芽球性リンパ腫/白血病、末梢性T細胞リンパ腫、多発性骨髄腫、鼻咽頭癌(NPC)、神経芽腫、中咽頭がん、口腔扁平上皮癌、骨肉腫、卵巣癌、膵臓がん、膵管腺癌、偽乳頭状腫瘍、膵腺房細胞癌、前立腺がん、前立腺腺癌、皮膚がん、黒色腫、悪性黒色腫、皮膚黒色腫、小腸癌、胃がん、胃癌、消化管間質腫瘍(GIST)、子宮がん、または子宮肉腫が挙げられる。一部の実施形態では、がんは、血液学的がんではないがんのタイプ、例えば、固形腫瘍がん、例えば、癌腫または肉腫である。がんのタイプおよび/またはステージは、突然変異、まれな突然変異、インデル、再編成、コピー数変異、塩基転換、転座、組換え、逆位、欠失、異数性、部分的異数性、倍数性、染色体不安定性、染色体構造の変更、遺伝子融合、染色体融合、遺伝子トランケーション、遺伝子増幅、遺伝子重複、染色体病変、DNA病変、核酸化学修飾の異常な変化、エピジェネティックパターンの異常な変化、および核酸5-メチルシトシンの異常な変化を含む遺伝的変異から検出することができる。
遺伝子データはまた、がんの特定の形態を特徴付けるためにも使用することができる。がんはしばしば、組成およびステージ分類の両方が不均一である。遺伝子プロファイルデータは、その特定のサブタイプの診断または処置において重要であり得るがんの特定のサブタイプの特徴付けを可能にし得る。この情報はまた、がんの特定のタイプの予後に関する手がかりを対象または従事者に提供し、対象または従事者は、疾患の進行に従って処置選択肢を適合させることを可能にし得る。一部のがんは、進行してより侵襲性となり、遺伝的に不安定となり得る。他のがんは、良性、不活性、または休眠中のままであり得る。本開示のシステムおよび方法は、疾患進行を決定するために有用であり得る。
さらに、本開示の方法を使用して、対象における異常な状態の不均一性を特徴付けてもよい。そのような方法は、例えば、対象に由来する細胞外ポリヌクレオチドの遺伝的プロファイルを作成するステップであって、遺伝的プロファイルが、コピー数変異およびまれな突然変異の解析に起因する複数のデータを含む、ステップを含み得る。一部の実施形態では、異常な状態はがんである。一部の実施形態では、異常な状態は、不均一なゲノム集団をもたらす状態であり得る。がんの例では、一部の腫瘍は、がんの異なるステージの腫瘍細胞を含むことが公知である。他の例では、不均一性は、疾患の複数の病巣を構成し得る。この場合も、がんの例では、複数の腫瘍病巣が存在してもよく、おそらく1つまたは複数の病巣は、原発部位から広がった転移の結果である。
本方法を使用して、不均一な疾患における異なる細胞に由来する遺伝情報の要約であるデータのフィンガープリントまたはセットを作成またはプロファイリングすることができる。このデータのセットは、コピー数変異、エピジェネティック変異、および突然変異解析を単独または組み合わせて含み得る。
本方法は、がん、前がん、または他の疾患を診断、予後判定、モニタリング、または観察するために使用され得る。一部の実施形態では、本明細書の方法は、胎児を診断することも予後判定することもモニタリングすることも伴わず、そのため、非侵襲性の出生前検査を対象としない。他の実施形態では、これらの方法論を、妊娠中の対象に用いて、そのDNAおよび他のポリヌクレオチドが母体の分子と共循環し得る、まだ生まれていない対象におけるがんまたは他の疾患を診断、予後判定、モニタリング、または観察してもよい。
本明細書に開示される方法およびシステムを使用して必要に応じて評価される他の遺伝子に基づく疾患、障害、または状態の非限定的な例としては、軟骨無形成症、アルファ-1アンチトリプシン欠乏症、抗リン脂質抗体症候群、自閉症、常染色体優性多発性嚢胞腎、シャルコー-マリー-トゥース病(CMT)、クリデュチャット病、クローン病、嚢胞性線維症、ダーカム病、ダウン症候群、デュアン症候群、デュシェンヌ型筋ジストロフィー、第V因子ライデン血栓形成傾向、家族性高コレステロール血症、家族性地中海熱、脆弱X症候群、ゴーシェ病、ヘモクロマトーシス、血友病、全前脳胞症、ハンチントン病、クラインフェルター症候群、マルファン症候群、筋強直性ジストロフィー、神経線維腫症、ヌーナン症候群、骨形成不全症、パーキンソン病、フェニルケトン尿症、ポーランド症候群、ポルフィリン症、早老症、網膜色素変性症、重度複合免疫不全(SCID)、鎌状赤血球症、脊髄性筋萎縮症、テイサックス病、サラセミア、トリメチルアミン尿症、ターナー症候群、口蓋心臓顔面症候群、WAGR症候群、ウィルソン病などが挙げられる。
一部の実施形態では、本明細書に記載される方法は、本明細書に記載されるように得られた配列情報のセットを使用してがんを有することが以前に診断された対象の以前のがん処置後の予め選択した時点で、腫瘍細胞を起源とするまたは腫瘍細胞に由来するDNAの存在または非存在を検出するステップを含む。方法は、対象に関して腫瘍細胞を起源とするまたは腫瘍細胞に由来するDNAの存在または非存在を示すがん再発スコアを決定するステップをさらに含み得る。
がん再発スコアが決定される場合、これをさらに使用してがん再発ステータスを決定してもよい。例えば、がん再発スコアが既定の閾値より上である場合、がん再発ステータスは、がん再発のリスクがあり得る。例えば、がん再発スコアが既定の閾値より上である場合、がん再発ステータスは、がん再発のリスクが低いまたはより低いリスクであり得る。特定の実施形態では、既定の閾値に等しいがん再発スコアは、がん再発のリスクがあるか、またはがん再発のリスクが低いもしくはより低いリスクであるのいずれかのがん再発ステータスをもたらし得る。
一部の実施形態では、がん再発スコアを既定のがん再発閾値と比較し、がん再発スコアががん再発閾値より上である場合、対象はその後のがん処置の候補であると分類され、がん再発スコアががん再発閾値より下である場合、試験対象は治療の候補ではないと分類される。特定の実施形態では、がん再発閾値に等しいがん再発スコアは、その後のがん処置の候補であるか、または治療の候補ではないといういずれかの分類をもたらし得る。
上記で考察した方法は、対象におけるがん再発のリスクを決定するおよび/または対象がその後のがん処置の候補であると分類する方法に関する節を含む、本明細書の他所で記載した任意の適合性の特色(単数または複数)をさらに含み得る。
2.対象におけるがん再発のリスクを決定するおよび/または対象がその後のがん処置の候補であると分類する方法
一部の実施形態では、本明細書に提供される方法は、対象におけるがん再発のリスクを決定する方法である。一部の実施形態では、本明細書に提供される方法は、対象をその後のがん処置の候補であると分類する方法である。
そのような方法のいずれかは、対象に対する1つまたは複数の以前のがん処置の後の1つまたは複数の事前に選択された時点で、がんを有すると診断された対象からDNA(例えば、腫瘍細胞を起源とするまたは腫瘍細胞に由来する)を収集するステップを含み得る。対象は、本明細書に記載される対象のいずれかであり得る。DNAはcfDNAであり得る。DNAは、組織試料から得られ得る。
そのような方法のいずれかは、対象のDNAから複数の標的領域のセットを捕捉するステップであって、複数の標的領域セットが、配列可変標的領域セットおよび/またはエピジェネティック標的領域セットを含み、それによって捕捉されたDNA分子のセットが産生される、ステップを含み得る。捕捉するステップは、本明細書の他所で記載される実施形態のいずれかに従って実施され得る。
そのような方法のいずれかにおいて、以前のがん処置は、手術、治療組成物の投与、および/または化学療法を含み得る。
そのような方法のいずれかは、捕捉されたDNA分子をシーケンシングすることであって、それによって配列情報のセットが産生されることを含み得る。配列可変標的領域セットの捕捉されたDNA分子は、エピジェネティック標的領域セットの捕捉されたDNA分子よりもシーケンシングの大きい深度までシーケンシングされ得る。
そのような方法のいずれかは、配列情報のセットを使用して事前に選択した時点で腫瘍細胞を起源とするまたは腫瘍細胞に由来するDNAの存在または非存在を検出するステップを含み得る。腫瘍細胞を起源とするまたは腫瘍細胞に由来するDNAの存在または非存在の検出は、本明細書の他所で記載されるその実施形態のいずれかに従って実施され得る。
対象においてがん再発のリスクを決定する方法は、対象の腫瘍細胞を起源とするまたは腫瘍細胞に由来するDNAの存在もしくは非存在、または量を示すがん再発スコアを決定するステップを含み得る。がん再発スコアをさらに使用して、がん再発ステータスを決定してもよい。例えば、がん再発スコアが既定の閾値より上である場合、がん再発ステータスは、がん再発のリスクがあり得る。例えば、がん再発スコアが既定の閾値より上である場合、がん再発ステータスは、がん再発のリスクが低いまたはより低いリスクであり得る。特定の実施形態では、既定の閾値に等しいがん再発スコアは、がん再発のリスクがあるか、またはがん再発のリスクが低いもしくはより低いリスクであるのいずれかのがん再発ステータスをもたらし得る。
対象をその後のがん処置の候補であると分類する方法は、対象のがん再発スコアを既定のがん再発閾値と比較して、それによってがん再発スコアががん再発閾値より上である場合、対象をその後のがん処置の候補であると分類するステップ、またはがん再発スコアががん再発閾値より下である場合、治療の候補ではないと分類するステップを含み得る。特定の実施形態では、がん再発閾値に等しいがん再発スコアは、その後のがん処置の候補であるか、または治療の候補ではないといういずれかの分類をもたらし得る。一部の実施形態では、その後のがん処置は、化学療法または治療組成物の投与を含む。
そのような方法のいずれかは、がん再発スコアに基づいて対象の無病生存(DFS)期間を決定するステップを含み得、例えば、DFS期間は、1年、2年、3年、4年、5年、または10年であり得る。
一部の実施形態では、配列情報のセットは、配列可変標的領域配列を含み、がん再発スコアを決定するステップは、特定の免疫細胞タイプのレベル、配列可変標的領域配列に存在するSNV、挿入/欠失、CNVおよび/または融合を示す少なくとも第1のサブスコアを決定するステップを含み得る。
一部の実施形態では、1個、2個、3個、4個、または5個から選択される配列可変標的領域における突然変異の数は、第1のサブスコアが、がん再発に関して陽性であると分類されるがん再発スコアをもたらすために十分である。一部の実施形態では、突然変異の数は、1個、2個、または3個から選択される。
一部の実施形態では、配列情報のセットは、エピジェネティック標的領域配列を含み、がん再発スコアを決定するステップは、健康な対象由来の対応する試料中で見出されるDNA(例えば、健康な対象由来の血液試料中で見出されるcfDNA、または組織試料が、対象から得られたものと同じタイプの組織のものである場合、健康な対象由来の組織試料中で見出されるDNA)とは異なるエピジェネティック状態を示す分子(エピジェネティック標的領域配列から得られた)の量を示す第2のサブスコアを決定するステップを含む。これらの異常な分子(すなわち、健康な対象由来の対応する試料中で見出されるDNAとは異なるエピジェネティック状態を有する分子)は、がんに関連するエピジェネティック変化、例えば、高メチル化可変標的領域のメチル化および/または断片化可変標的領域の乱れた断片化と一致し得、ここで、「乱れた」は、健康な対象由来の対応する試料中で見出されるDNAとは異なることを意味する。
一部の実施形態では、高メチル化可変標的領域セットにおける高メチル化および/または断片化可変標的領域セットにおける異常な断片化を示す、高メチル化可変標的領域セットおよび/または断片化可変標的領域セットに対応する分子の割合が0.001%~10%の範囲の値よりも大きいまたはそれに等しいことは、第2のサブスコアががん再発に関して陽性であると分類されるために十分である。範囲は、0.001%~1%、0.005%~1%、0.01%~5%、0.01%~2%、または0.01%~1%であり得る。
一部の実施形態では、そのような方法のいずれかは、腫瘍細胞からの起源を示す1つまたは複数の特色を示す配列情報のセット中の分子の分画から腫瘍DNAの分画を決定するステップを含み得る。これは、例えば、高メチル化可変標的領域、低メチル化可変標的領域および断片化可変標的領域(高メチル化可変標的領域の高メチル化および/または断片化可変標的領域の異常な断片化は、腫瘍細胞からの起源を示すと考えられ得る)の一方または両方を含む、標的領域の一部または全てに対応する分子について行われ得る。これは、配列可変標的領域に対応する分子、例えばがんと一貫する変更、例えばSNV、インデル、CNV、および/また融合を含む分子について行われ得る。腫瘍DNAの分画は、エピジェネティック標的領域に対応する分子および配列可変標的領域に対応する分子の組合せに基づいて決定され得る。
がん再発スコアの決定は、腫瘍DNAの分画に少なくとも部分的に基づき得、10-11~1または10-10~1の範囲の閾値よりも大きい腫瘍DNAの分画は、がん再発スコアががん再発に関して陽性であると分類されるために十分である。一部の実施形態では、10-10~10-9、10-9~10-8、10-8~10-7、10-7~10-6、10-6~10-5、10-5~10-4、10-4~10-3、10-3~10-2、または10-2~10-1の範囲の閾値よりも大きいまたはそれに等しい腫瘍DNAの分画は、がん再発スコアが、がん再発に関して陽性であると分類されるために十分である。一部の実施形態では、少なくとも10-7の閾値よりも大きい腫瘍DNAの分画は、がん再発スコアが、がん再発に関して陽性であると分類されるために十分である。腫瘍DNAの分画が閾値、例えば前述の実施形態のいずれかに対応する閾値よりも大きいという決定は、累積確率に基づいて行われ得る。例えば、試料は、腫瘍分画が前述の範囲のいずれかにおける閾値よりも大きい累積確率が、少なくとも0.5、0.75、0.9、0.95、0.98、0.99、0.995、または0.999の確率閾値を超える場合に陽性であるとみなされた。一部の実施形態では、確率閾値は、少なくとも0.95、例えば0.99である。
一部の実施形態では、配列情報のセットは、配列可変標的領域配列およびエピジェネティック標的領域配列を含み、がん再発スコアを決定するステップは、特定の免疫細胞タイプのレベルを示す第1のサブスコア、配列可変標的領域配列に存在するSNV、挿入/欠失、CNVおよび/または融合の量を示す第2のサブスコアならびにエピジェネティック標的領域配列中の異常な分子の量を示す第3のサブスコアを決定するステップ、ならびに第1、第2、および第3のサブスコアを組み合わせてがん再発スコアを提供するステップを含む。サブスコアが組み合わされる場合、それらは、それぞれ配列可変標的領域中の、エピジェネティック標的領域中の異常な分子(すなわち、健康な対象由来の対応する試料中で見出されるDNAとは異なるエピジェネティック状態を有する分子;例えば、腫瘍)の既定の分画よりも大きい)各サブスコアに独立して閾値を適用するか、または機械学習分類器を訓練して、複数の陽性および陰性訓練試料に基づいてステータスを決定することによって、組み合わされ得る。
一部の実施形態では、-4~2または-3~1の範囲の組み合わせたスコアの値は、がん再発スコアががん再発に関して陽性であると分類されるために十分である。
がん再発スコアががん再発に関して陽性であると分類される任意の実施形態では、対象のがん再発ステータスはがん再発のリスクがあり得る、および/または対象はその後のがん処置の候補であると分類され得る。
一部の実施形態では、がんは、本明細書の他所で記載されるがんのタイプのいずれか1つ、例えば結腸直腸がんである。
3.治療および関連する投与
ある特定の実施形態では、本明細書に開示される方法は、カスタマイズされた治療などの治療を同定すること、およびそれを患者または対象に投与することに関する。一部の実施形態では、まれな免疫細胞タイプを含む特定の免疫細胞タイプのレベルの決定は、適切な処置の選択を容易にする。一部の実施形態では、患者または対象は、所定の疾患、障害または状態を有する。本質的に任意のがん治療(例えば、外科治療、放射線治療、化学療法、および/またはそれと同様のもの)を、これらの方法の一部として含めてもよい。ある特定の実施形態では、対象に投与される治療は、少なくとも1つの化学療法薬を含む。一部の実施形態では、化学療法薬は、アルキル化剤(例えば、これらに限定されないが、クロラムブシル、シクロホスファミド、シスプラチンおよびカルボプラチン)、ニトロソウレア(例えば、これらに限定されないが、カルムスチンおよびロムスチン)、代謝拮抗薬(例えば、これらに限定されないが、フルオロウラシル(Fluorauracil)、メトトレキセートおよびフルダラビン)、植物アルカロイドおよび天然の生成物(例えば、これらに限定されないが、ビンクリスチン、パクリタキセルおよびトポテカン)、抗腫瘍抗生物質(例えば、これらに限定されないが、ブレオマイシン、ドキソルビシンおよびミトキサントロン)、ホルモン剤(例えば、これらに限定されないが、プレドニゾン、デキサメタゾン、タモキシフェンおよびリュープロリド)ならびに生物応答改変剤(例えば、これらに限定されないが、HerceptinおよびAvastin、ErbituxおよびRituxan)を含み得る。一部の実施形態では、対象に投与される化学療法は、FOLFOXまたはFOLFIRIを含み得る。ある特定の実施形態では、少なくとも1つのPARP阻害剤を含む治療が、対象に投与され得る。ある特定の実施形態では、PARP阻害剤としては、とりわけ、オラパリブ、タラゾパリブ、ルカパリブ、ニラパリブ(商品名ZEJULA)が挙げられ得る。典型的には、治療は、少なくとも1つの免疫療法(または免疫療法剤)を含む。免疫療法は、所定のがんタイプに対する免疫応答を増強する方法を一般的に指す。ある特定の実施形態では、免疫療法は、腫瘍またはがんに対するT細胞応答を増強する方法を指す。
一部の実施形態では、治療は、体細胞または生殖系列起源であるという核酸変異体のステータスに基づいてカスタマイズされる。一部の実施形態では、本質的に任意のがん治療(例えば、外科治療、放射線治療、化学療法、および/またはそれと同様のもの)が、これらの方法の一部として含まれ得る。典型的には、カスタマイズされた治療は、少なくとも1つの免疫療法(または免疫療法剤)を含む。免疫療法は、所定のがんタイプに対する免疫応答を増強する方法を一般的に指す。ある特定の実施形態では、免疫療法は、腫瘍またはがんに対するT細胞応答を増強する方法を指す。
一部の実施形態では、免疫療法または免疫療法剤は、免疫チェックポイント分子を標的とする。ある特定の腫瘍は、免疫チェックポイント経路を利用することによって免疫系を避けることができる。このように、免疫チェックポイントを標的とすることが、腫瘍が免疫系を避ける能力に対抗し、ある特定のがんに対する抗腫瘍免疫を活性化するための有効なアプローチとして出現した。Pardoll, Nature Reviews Cancer, 2012, 12:252-264。
ある特定の実施形態では、免疫チェックポイント分子は、抗原に対するT細胞応答に関与するシグナルを低減させる阻害性分子である。例えば、CTLA4は、T細胞上で発現され、抗原提示細胞上のCD80(B7.1としても公知)またはCD86(B7.2としても公知)への結合によって、T細胞活性化を下方調節することにおいて役割を果たす。PD-1は、T細胞上で発現される別の阻害性チェックポイント分子である。PD-1は、炎症応答の間の末梢組織におけるT細胞の活性を制限する。さらに、PD-1のリガンド(PD-L1またはPD-L2)は、多くの異なる腫瘍の表面上で共通して上方調節され、腫瘍微小環境における抗腫瘍免疫応答の下方調節をもたらす。ある特定の実施形態では、阻害性免疫チェックポイント分子は、CTLA4またはPD-1である。他の実施形態では、阻害性免疫チェックポイント分子は、PD-1のリガンド、例えば、PD-L1またはPD-L2である。他の実施形態では、阻害性免疫チェックポイント分子は、CTLA4のリガンド、例えば、CD80またはCD86である。他の実施形態では、阻害性免疫チェックポイント分子は、リンパ球活性化遺伝子3(LAG3)、キラー細胞免疫グロブリン様受容体(KIR)、T細胞膜タンパク質3(TIM3)、ガレクチン9(GAL9)、またはアデノシンA2a受容体(A2aR)である。
これらの免疫チェックポイント分子を標的とするアンタゴニストは、ある特定のがんに対する抗原特異的T細胞応答を増強するために使用され得る。したがって、ある特定の実施形態では、免疫療法または免疫療法剤は、阻害性免疫チェックポイント分子のアンタゴニストである。ある特定の実施形態では、阻害性免疫チェックポイント分子は、PD-1である。ある特定の実施形態では、阻害性免疫チェックポイント分子は、PD-L1である。ある特定の実施形態では、阻害性免疫チェックポイント分子のアンタゴニストは、抗体(例えば、モノクローナル抗体)である。ある特定の実施形態では、抗体またはモノクローナル抗体は、抗CTLA4、抗PD-1、抗PD-L1、または抗PD-L2抗体である。ある特定の実施形態では、抗体は、モノクローナル抗PD-1抗体である。一部の実施形態では、抗体は、モノクローナル抗PD-L1抗体である。ある特定の実施形態では、モノクローナル抗体は、抗CTLA4抗体および抗PD-1抗体、抗CTLA4抗体および抗PD-L1抗体、または抗PD-L1抗体および抗PD-1抗体の組合せである。ある特定の実施形態では、抗PD-1抗体は、ペムブロリズマブ(Keytruda(登録商標))またはニボルマブ(Opdivo(登録商標))のうちの1つまたは複数である。ある特定の実施形態では、抗CTLA4抗体は、イピリムマブ(Yervoy(登録商標))である。ある特定の実施形態では、抗PD-L1抗体は、アテゾリズマブ(Tecentriq(登録商標))、アベルマブ(Bavencio(登録商標))、またはデュルバルマブ(Imfinzi(登録商標))のうちの1つまたは複数である。
ある特定の実施形態では、免疫療法または免疫療法剤は、CD80、CD86、LAG3、KIR、TIM3、GAL9、またはA2aRに対するアンタゴニスト(例えば、抗体)である。他の実施形態では、アンタゴニストは、阻害性免疫チェックポイント分子の可溶性バージョン、例えば、阻害性免疫チェックポイント分子の細胞外ドメインおよび抗体のFcドメインを含む可溶性融合タンパク質である。ある特定の実施形態では、可溶性融合タンパク質は、CTLA4、PD-1、PD-L1、またはPD-L2の細胞外ドメインを含む。一部の実施形態では、可溶性融合タンパク質は、CD80、CD86、LAG3、KIR、TIM3、GAL9、またはA2aRの細胞外ドメインを含む。一実施形態では、可溶性融合タンパク質は、PD-L2またはLAG3の細胞外ドメインを含む。
ある特定の実施形態では、免疫チェックポイント分子は、抗原に対するT細胞応答に関与するシグナルを増幅する共刺激分子である。例えば、CD28は、T細胞上で発現される共刺激受容体である。T細胞がそのT細胞受容体を介して抗原に結合する場合、CD28は、抗原提示細胞上のCD80(B7.1としても公知)またはCD86(B7.2としても公知)に結合して、T細胞受容体シグナル伝達を増幅し、T細胞活性化を促進する。CD28は、CTLA4と同じリガンド(CD80およびCD86)に結合するので、CTLA4は、CD28によって媒介される共刺激シグナル伝達に対抗することまたはそれを調節することができる。ある特定の実施形態では、免疫チェックポイント分子は、CD28、誘導性T細胞共刺激剤(ICOS)、CD137、OX40、またはCD27から選択される共刺激分子である。他の実施形態では、免疫チェックポイント分子は、例えば、CD80、CD86、B7RP1、B7-H3、B7-H4、CD137L、OX40L、またはCD70を含む共刺激分子のリガンドである。
これらの共刺激チェックポイント分子を標的とするアゴニストは、ある特定のがんに対する抗原特異的T細胞応答を増強するために使用され得る。したがって、ある特定の実施形態では、免疫療法または免疫療法剤は、共刺激チェックポイント分子のアゴニストである。ある特定の実施形態では、共刺激チェックポイント分子のアゴニストは、アゴニスト抗体であり、好ましくは、モノクローナル抗体である。ある特定の実施形態では、アゴニスト抗体またはモノクローナル抗体は、抗CD28抗体である。他の実施形態では、アゴニスト抗体またはモノクローナル抗体は、抗ICOS、抗CD137、抗OX40、または抗CD27抗体である。他の実施形態では、アゴニスト抗体またはモノクローナル抗体は、抗CD80、抗CD86、抗B7RP1、抗B7-H3、抗B7-H4、抗CD137L、抗OX40L、または抗CD70抗体である。
ある特定の実施形態では、体細胞または生殖系列起源である対象由来の試料からの核酸変異体の状態を、その対象のカスタマイズされたまたは標的化治療を同定するために参照集団からの比較器の結果のデータベースと比較してもよい。典型的に、参照集団は、対象と同じがんもしくは疾患タイプを有する患者、ならびに/または試験対象と同じ治療を受けているもしくは受けたことがある患者を含む。カスタマイズされたまたは標的化治療(または複数の治療)は、核酸変異体および比較器の結果がある特定の分類基準(例えば、実質的またはおおよそマッチする)を満たす場合に同定され得る。
ある特定の実施形態では、本明細書に記載されるカスタマイズされた治療は、典型的に非経口(例えば、静脈内、または皮下)投与される。免疫療法剤を含有する医薬組成物は、典型的に静脈内投与される。ある特定の治療剤は経口投与される。しかし、カスタマイズされた治療(例えば、免疫療法剤など)はまた、例えば口腔内、舌下、直腸、膣、尿道内、局所、眼内、鼻腔内、および/または耳介内などの当該分野で公知の任意の方法によって投与されてもよく、投与は、錠剤、カプセル剤、顆粒剤、水性懸濁剤、ゲル剤、スプレー剤、坐剤、塗擦剤、軟膏剤などを含み得る。
がん以外の特定の遺伝子に基づく疾患、障害、または状態を処置するための治療選択肢は、当業者に一般的に周知であり、検討される特定の疾患、障害、または状態を考慮して明らかとなる。
III.キット
本明細書に記載される組成物を含むキットもまた提供される。キットは、本明細書に記載される方法を実施するために有用であり得る。一部の実施形態では、キットは、DNA中のメチルシトシンを認識する作用剤を含む。一部のそのような実施形態では、作用剤は、抗体またはメチル結合タンパク質またはメチル結合ドメインである。一部の実施形態では、キットは、エピジェネティックおよび/または配列可変標的領域セットに特異的に結合する標的特異的プローブを含み、少なくとも1つのエピジェネティック標的領域セットの標的特異的プローブは、異なる免疫細胞タイプにおいて差次的にメチル化される標的領域に結合する。一部のそのような実施形態では、標的特異的プローブは、捕捉部分を含む。一部の実施形態では、キットは、捕捉部分の結合パートナーに連結された固体支持体を含む。一部の実施形態では、キットは、アダプターを含む。一部の実施形態では、キットは、PCRプライマーを含み、PCRプライマーは、標的領域またはアダプターにアニーリングする。一部の実施形態では、キットは、本明細書の他所の追加のエレメントを含む。一部の実施形態では、キットは、本明細書に記載される方法を実施するための使用説明書を含む。
キットは、さらに、ALK、APC、BRAF、CDKN2A、EGFR、ERBB2、FBXW7、KRAS、MYC、NOTCH1、NRAS、PIK3CA、PTEN、RBI、TP53、MET、AR、ABLl、AKTl、ATM、CDHl、CSFIR、CTNNBl、ERBB4、EZH2、FGFRl、FGFR2、FGFR3、FLT3、GNA11、GNAQ、GNAS、HNF1A、HRAS、IDH1、IDH2、JAK2、JAK3、KDR、KIT、MLH1、MPL、NPM1、PDGFRA、PROC、PTPN11、RET、SMAD4、SMARCB1、SMO、SRC、STK11、VHL、TERT、CCND1、CDK4、CDKN2B、RAF1、BRCA1、CCND2、CDK6、NF1、TP53、ARID 1 A、BRCA2、CCNE1、ESR1、RIT1、GATA3、MAP2K1、RHEB、ROS1、ARAF、MAP2K2、NFE2L2、RHOA、およびNTRKlからなる群から選択される少なくとも5個、6個、7個、8個、9個、10個、20個、30個、40個または全ての遺伝子に選択的にハイブリダイズする複数のオリゴヌクレオチドプローブを含み得る。オリゴヌクレオチドプローブが選択的にハイブリダイズすることができる遺伝子の数は、異なり得る。例えば、遺伝子の数は、1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個、13個、14個、15個、16個、17個、18個、19個、20個、21個、22個、23個、24個、25個、26個、27個、28個、29個、30個、31個、32個、33個、34個、35個、36個、37個、38個、39個、40個、41個、42個、43個、44個、45個、46個、47個、48個、49個、50個、51個、52個、53個、または54個を含み得る。キットは、本明細書に記載される方法のいずれかを実施するための複数のオリゴヌクレオチドプローブを含む容器および使用説明書を含み得る。
オリゴヌクレオチドプローブは、遺伝子、例えば少なくとも5個の遺伝子のエクソン領域に選択的にハイブリダイズすることができる。一部の例では、オリゴヌクレオチドプローブは、遺伝子、例えば少なくとも5個の遺伝子の少なくとも30個のエクソンに選択的にハイブリダイズすることができる。一部の例では、複数のプローブは、少なくとも30個のエクソンの各々に選択的にハイブリダイズすることができる。各エクソンにハイブリダイズするプローブは、少なくとも1つの他のプローブと重複する配列を有し得る。一部の実施形態では、オリゴプローブは、本明細書に開示される遺伝子の非コード領域、例えば遺伝子のイントロン領域に選択的にハイブリダイズすることができる。オリゴプローブはまた、本明細書に開示される遺伝子のエクソンおよびイントロン領域の両方を含む遺伝子の領域に選択的にハイブリダイズすることもできる。
任意の数のエクソンを、オリゴヌクレオチドプローブによって標的化することができる。例えば、少なくとも1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個、13個、14個、15個、16個、17個、18個、19個、20個、21個、22個、23個、24個、25個、30個、35個、40個、45個、50個、55個、60個、65個、70個、75個、80個、85個、90個、95個、100個、105個、110個、115個、120個、125個、130個、135個、140個、145個、150個、155個、160個、165個、170個、175個、180個、185個、190個、195個、200個、205個、210個、215個、220個、225個、230個、235個、240個、245個、250個、255個、260個、265個、270個、275個、280個、285個、290個、295個、300個、400個、500個、600個、700個、800個、900個、1,000個、またはそれより多くのエクソンを標的化することができる。
キットは、別個の分子バーコードおよび同一の試料バーコードを有する少なくとも4個、5個、6個、7個、または8個の異なるライブラリーアダプターを含み得る。ライブラリーアダプターは、シーケンシングアダプターでなくてもよい。例えば、ライブラリーアダプターは、フローセル配列またはシーケンシングのためのヘアピンループの形成を可能にする配列を含まない。異なる変異ならびに分子バーコードおよび試料バーコードの組合せが、本明細書全体を通して記載されており、キットに応用可能である。さらに、一部の例では、アダプターは、シーケンシングアダプターではない。さらに、キットに提供されるアダプターはまた、シーケンシングアダプターも含み得る。シーケンシングアダプターは、1つまたは複数のシーケンシングプライマーにハイブリダイズする配列を含み得る。シーケンシングアダプターはさらに、固体支持体にハイブリダイズする配列、例えばフローセル配列も含み得る。例えば、シーケンシングアダプターはフローセルアダプターであり得る。シーケンシングアダプターを、ポリヌクレオチド断片の一方または両方の末端に付着させることができる。一部の例では、キットは、別個の分子バーコードおよび同一の試料バーコードを有する少なくとも8個の異なるライブラリーアダプターを含み得る。ライブラリーアダプターは、シーケンシングアダプターでなくてもよい。キットはさらに、ライブラリーアダプターに選択的にハイブリダイズする第1の配列およびフローセル配列に選択的にハイブリダイズする第2の配列を有するシーケンシングアダプターも含み得る。別の例では、シーケンシングアダプターは、ヘアピン形状であり得る。例えば、ヘアピン形状のアダプターは、相補的二本鎖部分およびループ部分を含み得、二本鎖部分は、二本鎖ポリヌクレオチドに付着(例えば、ライゲーション)することができる。ヘアピン形状のシーケンシングアダプターを、ポリヌクレオチド断片の両方の末端に付着させて、環状分子を生成することができ、これを複数回シーケンシングすることができる。シーケンシングアダプターは、末端から末端まで最大10個、11個、12個、13個、14個、15個、16個、17個、18個、19個、20個、21個、22個、23個、24個、25個、26個、27個、28個、29個、30個、31個、32個、33個、34個、35個、36個、37個、38個、39個、40個、41個、42個、43個、44個、45個、46個、47個、48個、49個、50個、51個、52個、53個、54個、55個、56個、57個、58個、59個、60個、61個、62個、63個、64個、65個、66個、67個、68個、69個、70個、71個、72個、73個、74個、75個、76個、77個、78個、79個、80個、81個、82個、83個、84個、85個、86個、87個、88個、89個、90個、91個、92個、93個、94個、95個、96個、97個、98個、99個、100個、またはそれより多くの塩基であり得る。シーケンシングアダプターは、末端から末端まで20~30個、20~40個、30~50個、30~60個、40~60個、40~70個、50~60個、50~70個の塩基を含み得る。特定の例では、シーケンシングアダプターは、末端から末端まで20~30個の塩基を含み得る。別の例では、シーケンシングアダプターは、末端から末端まで50~60個の塩基を含み得る。シーケンシングアダプターは、1つまたは複数のバーコードを含み得る。例えば、シーケンシングアダプターは、試料バーコードを含み得る。試料バーコードは既定の配列を含み得る。試料バーコードを使用してポリヌクレオチドの起源を同定することができる。試料バーコードは、少なくとも1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個、13個、14個、15個、16個、17個、18個、19個、20個、21個、22個、23個、24個、25個、またはそれより多くの(または本明細書全体を通して記載される任意の長さの)核酸塩基、例えば少なくとも8個の塩基であり得る。バーコードは、上記のように連続または不連続配列であり得る。
ライブラリーアダプターは、平滑末端化され、Y字形状であり得、40核酸塩基未満またはそれに等しい長さであり得る。他の変形形態は、全体を通して見出すことができ、キットに応用可能である。
本発明の好ましい実施形態を本明細書に示し、記載してきたが、そのような実施形態が単なる例として提供されていることは、当業者には明白である。本発明は、本明細書内に提供された具体的な例に限定されることは意図されない。本発明を上記の明細書を参照して説明してきたが、本明細書の実施形態の説明および例証は、限定的な意味で解釈されることを意味しない。多数の変形形態、変化、および置換が、本発明から逸脱することなく当業者に想起されるであろう。さらに、本発明の全ての態様は、多様な条件および変数に依存する、本明細書に記載される具体的な説明、構成、または相対的割合に限定されないと理解すべきである。本明細書に記載される本開示の実施形態に対する様々な代替物が、本発明の実践において用いられ得ると理解すべきである。したがって、本開示はまた、任意のそのような代替物、改変、変形形態または等価物を網羅するものとすることが企図される。以下の特許請求の範囲が本発明の範囲を定義すること、ならびにこれらの特許請求の範囲内に入る方法および構造、ならびにそれらの等価物がそれによって網羅されることが意図される。
前述の開示は、明快にするためおよび理解目的のために、例証および例によっていくらか詳細に記載されてきたが、当業者には、本開示を読むことによって、形態および詳細の様々な変化が、本開示の真の範囲から逸脱することなく行われ得ること、および添付の特許請求の範囲内で実践され得ることが明白になる。例えば、全ての方法、システム、コンピュータ可読媒体、および/またはその構成要素の特色、ステップ、要素、もしくは他の態様は、様々な組合せで使用することができる。
本明細書で引用される全ての特許、特許出願、ウェブサイト、他の刊行物または文書、受託番号などは、各個々の項目が具体的かつ個々に参照により組み込まれることが示されているのと同程度に、全ての目的のためにその全体が参照によりに組み込まれる。配列の異なるバージョンが異なる時点における受託番号に関連している場合、本出願の有効な出願日における受託番号に関連するバージョンを意味する。有効な出願日とは、実際の出願日、または該当する場合、受託番号に言及する優先出願の出願日の早いほうを意味する。同様に、異なるバージョンの刊行物、ウェブサイトなどが異なる時点において公開されている場合、特に示していない限り、本出願の有効な出願日において直近に公開されたバージョンを意味する。
(実施例1)
特定の免疫細胞タイプに限定される差次的にメチル化された領域を同定するためのメチル化データの解析
dcc.blueprint-epigenome.euにおいてインターネット上で利用可能なBlueprintコンソーシアムからの全ゲノムバイサルファイトシーケンシングデータを、パネル設計において使用した。データセットは、ナイーブおよび活性化されたTおよびB細胞を含む造血系列からの数百の細胞タイプのメチル化プロファイルを含有する。まれな免疫細胞タイプは、疾患状態では上昇したターンオーバーを有する可能性が高く、したがって、メモリーB細胞、形質細胞、Treg、CD4エフェクターメモリーT細胞、CD4セントラルメモリーT細胞、CD8エフェクターメモリーT細胞、CD8セントラルメモリーT細胞、NK細胞、および様々な骨髄性細胞タイプを含め、パネルにおいて標的とされる。
Blueprintデータセットは、単一CpGレベルのメチル化レベルを含有する。CpG部位は、それが少なくとも1つの試料中に存在する場合に検出されたとみなされ、10^7個よりも多くの検出されたCpG部位に関してデータを有さない試料は、さらなる解析から排除した。少なくとも5つの試料から失われているCpG部位は、フィルタリングして除いた。類似の結果を有する細胞タイプを、骨髄性細胞、ナイーブB細胞、活性化されたB細胞、ナイーブT細胞、活性化されたT細胞、およびNK細胞を含むクラスターへと最初にグループ分けした。
ゲノムを、50塩基対幅で200の塩基対ビンに分割した。その中で7つよりも少ないCpG部位が検出された全てのビンを、下流の解析から排除した。各試料中の各ビンのメチル化レベルを、CpGメチル化レベルの平均として計算した。
細胞クラスターあたり1ビンあたりの平均メチル化レベルを計算した。ビンを、DMRに関するクラスター中のメチル化レベルが任意の他のクラスター中の領域の最大メチル化を超えた程度(高メチル化領域)、またはメチル化レベルが他のクラスターの最小メチル化レベル未満であった程度(低メチル化領域)に基づいて、クラスターに関して差次的にメチル化された領域(DMR)として同定した。目的は、各クラスターに関して、25個の高メチル化領域および25個の低メチル化領域を同定することであった。一部のクラスターでは、高メチル化領域に関して目的は達成されなかったが、25個よりも多い低メチル化領域は容易に同定された;したがって、高メチル化領域に関して目的が達成されなかった場合、追加の低メチル化領域を同定した。結果を以下の表に示す。クラスターに関して同定された領域のパネルの総フットプリントは、33.9kbであった。
表6
次いで、細胞タイプあたり1ビンあたりの平均メチル化レベルを計算した。クラスター内の全ての細胞タイプにおいて、1つの細胞タイプを同じクラスター内の他の細胞タイプから区別することができるDMRが同定された。ビンを、DMRに関する細胞タイプにおけるメチル化レベルが、クラスター内の任意の他の細胞タイプにおける領域の平均メチル化を超えた程度(高メチル化領域)、またはメチル化レベルがクラスター内の他の細胞タイプの平均メチル化レベル未満であった程度(低メチル化領域)に基づいて、細胞タイプDMRとして同定した。目的は、各細胞タイプに関して、25個の高メチル化領域および25個の低メチル化領域を同定することであった。結果を以下の表に示す。細胞タイプに関して同定された領域のパネルの総フットプリントは、63.75kbであった。
表7
ビンから同定された重複したDMRを、領域へとマージさせ、Blueprintデータセットからのhg38座標を、liftover(genome.ucsc.edu/cgi-bin/hgLiftOverを参照されたい)を使用して、hg19座標に変換した。DMRの得られたパネルの総フットプリントは、hg19に関して95.9kbであった。結果を以下の表に示す。
表8
細胞タイプまたはクラスターにおいて差次的メチル化を示す遺伝子座を、図1Bにおいて、メチル化レベルを細胞タイプまたはクラスターの関数として示すヒートマップ中にプロットした。
(実施例2)
がんを検出するためのある特定の免疫細胞タイプに関連する高メチル化シグナルを検出するためのcfDNAの解析
健康な対象、および初期結腸直腸がん(図1C)、図1Dに示される初期がんのタイプ、または図1Eに示される後期がんのタイプを有する対象由来の試料のセットを、血液に基づくアッセイによって解析して、ある特定の免疫細胞タイプに関連する高メチル化シグナルを検出し、そのようなシグナルが結腸直腸がんを予測するかどうかを試験した。cfDNAを、これらの患者の血漿から抽出し、次いで、MBDでコーティングされたビーズと組み合わせて、高メチル化DNAを低メチル化DNAから分配した。任意の非メチル化またはより少ないメチル化DNAを、漸増濃度の塩を含有する緩衝液を用いてビーズから最初に溶出させた。最後に、高塩緩衝液を使用して、高度メチル化DNAを、メチルシトシンに対して特異的な抗体から洗い流した。非結合DNAおよびこれらの洗浄によって、メチル化が増加するcfDNAの3つの分配(低メチル化分配、残留メチル化分配および高メチル化分配)がもたらされた。ライブラリー調製の酵素ステップの準備において、分配中のcfDNA分子を清浄して塩を除去し、濃縮した。
分配中のcfDNAを濃縮した後、第1のアダプターを、その3’末端へのライゲーションによって、cfDNAに付加した。アダプターを、ユニバーサルプライマーおよびDNAポリメラーゼを使用する第2鎖合成のためのプライミング部位として使用した。第1のアダプターは、ビオチンを含み、第1のアダプターにライゲーションされた核酸は、ストレプトアビジンを含むビーズに結合させた。次いで、第2のアダプターを、今度は二本鎖分子の第2の鎖の3’末端にライゲーションした。これらのアダプターは、非一意的分子バーコードを含有し、各分配を、他の分配において使用されるアダプター中のバーコードから識別可能な非一意的分子バーコードを有するアダプターとライゲーションした。ライゲーション後、高メチル化および残留メチル化分配を、メチル化感受性制限酵素で処置して、誤分配された非メチル化DNAを分解した。分配を共にプールし、PCRによって増幅した。
PCR後、増幅されたDNAを洗浄し、富化の前に濃縮した。濃縮したら、増幅されたDNAを、塩緩衝液、および実施例1の解析に使用したある特定の免疫細胞タイプにおける高メチル化DMRのビオチン化RNA標的特異的プローブと組み合わせ、この混合物を一晩インキュベートした。
ビオチン化RNA標的特異的プローブ(DNAにハイブリダイズした)を、ストレプトアビジン磁気ビーズによって捕捉し、塩に基づく一連の洗浄によって、捕捉されなかった増幅されたDNAから分離し、それによって試料を富化した。富化後、富化された試料のアリコートを、Illumina NovaSeqシーケンサーを使用してシーケンシングした。次いで、シーケンサーによって生成された配列読み取りデータを、バイオインフォマティックツール/アルゴリズムを使用して解析した。分子バーコードを、一意的分子を同定するため、ならびに差次的に分配された分子への試料のデコンボリューションのために使用した。高メチル化標的領域配列を解析して、実施例1で使用した領域においてメチル化されたcfDNA分子を検出した。相対的メチル化頻度を、入力cfDNAの量によって正規化した、メチル化分画(高メチル化分配および中間分配)中の分子の総数として決定した。図1C~1Eに示される結果は、免疫細胞タイプに特異的な高メチル化DMRのランダムに選択された例のサブセットが、CRC試料と健康な試料との間で変異および分離を示したことを示しており、これは、免疫細胞タイプ特異的DMRががんステータスの情報を与え得るという結論を支持している。
(実施例3)
初期結腸直腸がんを検出するためのある特定の免疫細胞タイプに関連する低メチル化シグナルを検出するためのcfDNAの解析
健康な対象および初期結腸直腸がんを有する対象由来の試料のセットを、血液に基づくアッセイによって解析して、ある特定の免疫細胞タイプに関連する低メチル化シグナルを検出し、そのようなシグナルが結腸直腸がんを予測するかどうかを試験した。cfDNAを、これらの患者の血漿から抽出し、次いで、MBDと接触させ、低メチル化分配、中間分配、および高メチル化分配に分配した。低メチル化分配を、メチル化依存性制限酵素(MDRE)消化に供して、誤分配された分子を分解した。ライブラリー調製の酵素ステップの準備において、分配中のcfDNA分子を清浄して塩を除去し、濃縮した。分子バーコードを含むアダプターを、cfDNA分子にライゲーションした。cfDNA分子を、ビオチンで標識したオリゴヌクレオチドを使用して目的の領域に関して富化し、増幅し、シーケンシングした。
得られた分子配列をフィルタリングして、細胞タイプ特異的低メチル化(すなわち、目的の1つの細胞タイプにおいて<10%のメチル化、および他の細胞タイプにおいて>90%のメチル化)(公開されたデータ、例えば、Loyfer et al., 2022, doi.org/10.1101/2022.01.24.477547;Fox-Fisher et al., eLife 2021, 10:e70520;Moss et al., Nature Communications 2021, 9:5068;およびwww.bioconductor.org/packages/release/bioc/html/EpiDISH.htmlにおいて利用可能なEpiDISH Rパッケージによる)、少なくとも1つのMDRE制限部位の存在を要求するようにした。目的の細胞タイプは、B細胞、顆粒細胞、NK細胞、T細胞、および赤血球前駆体であった。低い分子カバレッジを有する部位もまた、フィルタリングして除いた。
目的の各細胞タイプが寄与するcfDNAの分画を、以下のように決定した。その細胞タイプに特異的な低メチル化を示す各部位に関して、低メチル化DNAの割合を決定し、これらの値を平均して、細胞タイプが寄与するcfDNAの画分を得た。結果は図3に示され、健康な対象よりも、CRCを有する対象からのcfDNAへの、B細胞、NK細胞、およびT細胞からの高い寄与、ならびに顆粒細胞からの低い寄与と一致している。
(実施例4)
免疫細胞タイプを定量するためおよび対象におけるがんの存在または非存在を検出するためのcfDNAの解析
健康な対象、初期結腸直腸がんを有する対象、およびがん患者由来の試料のセットを、血液に基づくアッセイによって解析して、免疫細胞タイプのレベルおよび突然変異の存在/非存在を検出する。cfDNAを、これらの患者の血漿から抽出し、次いで、メチルシトシンに対して特異的な抗体と組み合わせる。プロテインGとコンジュゲートした磁気ビーズを使用して、抗体およびそれに結合したDNAを免疫沈降させ、こうして、高メチル化DNAを低メチル化DNAから分配する。任意の非メチル化またはより少ないメチル化DNAを、漸増濃度の塩を含有する緩衝液を用いてビーズから最初に溶出させる。最後に、高塩緩衝液を使用して、高度メチル化DNAを、メチルシトシンに対して特異的な抗体から洗い流す。非結合DNAおよびこれらの洗浄により、メチル化が増加するcfDNAの少なくとも3つの分配(低メチル化分配、残留メチル化分配および高メチル化分配)がもたらされる。ライブラリー調製の酵素ステップの準備において、分配中のcfDNA分子を清浄して塩を除去し、濃縮する。
分配中のcfDNAを濃縮した後、第1のアダプターを、その3’末端へのライゲーションによって、cfDNAに付加する。アダプターを、ユニバーサルプライマーおよびDNAポリメラーゼを使用する第2鎖合成のためのプライミング部位として使用する。第1のアダプターは、ビオチンを含み、第1のアダプターにライゲーションされた核酸は、ストレプトアビジンを含むビーズに結合させる。次いで、第2のアダプターを、今度は二本鎖分子の第2の鎖の3’末端にライゲーションする。これらのアダプターは、非一意的分子バーコードを含有し、各分配を、他の分配において使用されるアダプター中のバーコードから識別可能な非一意的分子バーコードを有するアダプターとライゲーションする。ライゲーション後、分配を共にプールし、PCRによって増幅する。
PCR後、増幅されたDNAを洗浄し、富化の前に濃縮する。濃縮したら、増幅されたDNAを、塩緩衝液、ならびに配列可変標的領域セットのプローブおよびエピジェネティック標的領域セットのプローブを含むビオチン化RNA標的特異的プローブと組み合わせ、この混合物を一晩インキュベートする。配列可変領域セットのプローブは、約50kbのフットプリントを有し、エピジェネティック標的領域セットのプローブは、約500kbのフットプリントを有する。配列可変標的領域セットのプローブは、表3~5で同定した遺伝子の少なくとも1つのサブセットを標的とするオリゴヌクレオチドを含み、エピジェネティック標的領域セットのプローブは、少なくとも高メチル化可変標的領域および低メチル化可変標的領域を含み、CTCF結合標的領域、転写開始部位標的領域、局所増幅標的領域およびメチル化対照領域を必要に応じて含む選択を標的とするオリゴヌクレオチドを含む。高メチル化可変標的領域および低メチル化可変標的領域は、表8に列挙されたものから選択される複数のクラスターおよび/または免疫細胞タイプに特異的な領域を含む。
ビオチン化RNA標的特異的プローブ(DNAにハイブリダイズした)を、ストレプトアビジン磁気ビーズによって捕捉し、塩に基づく一連の洗浄によって、捕捉されない増幅されたDNAから分離し、それによって試料を富化する。富化後、富化された試料のアリコートを、Illumina NovaSeqシーケンサーを使用してシーケンシングする。次いで、シーケンサーによって生成された配列読み取りデータを、バイオインフォマティックツール/アルゴリズムを使用して解析する。分子バーコードを、一意的分子を同定するため、ならびに差次的に分配された分子への試料のデコンボリューションのために使用する。配列可変標的領域配列を、真の腫瘍変異体を技術的エラー(例えば、PCRエラー、シーケンシングエラー)から区別する十分な根拠でコールすることができるゲノム変更、例えば、SNV、挿入、欠失および融合を検出することによって解析する。エピジェネティック標的領域配列を、独立して解析して、正常細胞と比較して異なる免疫細胞においておよびがんにおいて差次的にメチル化されることが示された領域におけるメチル化cfDNA分子を検出する。最後に、両方の解析の結果を組み合わせて、試料が得られる対象におけるがんまたは前がんの可能性の最終的決定を生成する。

Claims (103)

  1. 試料中のcfDNAを解析する方法であって、
    a)前記cfDNAをシーケンシングし、複数の免疫細胞タイプにおいて差次的にメチル化されるDNA配列を含む複数の標的領域を含むエピジェネティック標的領域セットに関して、メチル化レベルを決定するステップ;ならびに
    b)前記メチル化レベルに基づいて、前記cfDNAが起源とする複数の免疫細胞タイプの各々の量を決定するステップであって、前記複数の免疫細胞タイプが、
    i.ナイーブリンパ球および活性化されたリンパ球;
    ii.単球およびマクロファージ;または
    iii.骨髄球、好中球、および好酸球
    を含む、ステップ
    を含む、方法。
  2. 試料中のcfDNAを解析する方法であって、
    a)前記cfDNAまたはその部分試料から、少なくとも1つのエピジェネティック標的領域セットを捕捉するステップであって、前記cfDNAまたはその部分試料を、前記少なくとも1つのエピジェネティック標的領域セットに対して特異的な標的特異的プローブと接触させることを含み、前記エピジェネティック標的領域セットが、複数の免疫細胞タイプにおいて差次的にメチル化されるDNA配列を含む標的領域を含む、ステップ;
    b)前記標的領域に関してメチル化レベルを決定するステップ;ならびに
    c)前記DNAが起源とする前記複数の免疫細胞タイプの各々の量を決定するステップであって、前記複数の免疫細胞タイプが、
    i.ナイーブリンパ球および活性化されたリンパ球;
    ii.単球およびマクロファージ;または
    iii.骨髄球、好中球、および好酸球
    を含む、ステップ
    を含む、方法。
  3. 試料中のcfDNAを解析する方法であって、
    a)前記cfDNAをシーケンシングし、複数の免疫細胞タイプにおいて差次的に低メチル化されるDNA配列を含む複数の低メチル化可変標的領域を含むエピジェネティック標的領域セットに関して、メチル化レベルを決定するステップ;および
    b)前記メチル化レベルに基づいて、前記cfDNAが起源とする複数の免疫細胞タイプの各々の量を決定するステップ
    を含む、方法。
  4. 試料中のcfDNAを解析する方法であって、
    a)前記cfDNAまたはその部分試料から、少なくとも1つのエピジェネティック標的領域セットを捕捉するステップであって、前記cfDNAまたはその部分試料を、前記少なくとも1つのエピジェネティック標的領域セットに対して特異的な標的特異的プローブと接触させることを含み、前記エピジェネティック標的領域セットが、複数の免疫細胞タイプにおいて差次的に低メチル化されるDNA配列を含む低メチル化可変標的領域を含む、ステップ;
    b)前記標的領域に関してメチル化レベルを決定するステップ;および
    c)前記DNAが起源とする前記複数の免疫細胞タイプの各々の量を決定するステップ
    を含む、方法。
  5. 試料中のDNAを解析する方法であって、
    a)前記DNAを、前記DNA中の改変シトシンを認識する作用剤と接触させることによって、前記試料を複数の部分試料に分配するステップであって、前記複数が、第1の部分試料および第2の部分試料を含み、前記第1の部分試料が、前記第2の部分試料よりも大きい割合で前記改変シトシンを有するDNAを含む、ステップ;
    b)前記複数の部分試料のうちの1つまたは複数からのDNAをシーケンシングするステップ;ならびに
    c)DNA配列のレベルを検出して、前記DNAが起源とする複数の免疫細胞タイプの各々の量を決定するステップであって、前記複数の免疫細胞タイプが、
    i.ナイーブリンパ球および活性化されたリンパ球;
    ii.単球およびマクロファージ;または
    iii.骨髄球、好中球、および好酸球
    を含む、ステップ
    を含む、方法。
  6. 試料中のDNAを解析する方法であって、
    a)前記DNAを、前記DNA中の改変シトシンを認識する作用剤と接触させることによって、前記試料を複数の部分試料に分配するステップであって、前記複数が、第1の部分試料および第2の部分試料を含み、前記第1の部分試料が、前記第2の部分試料よりも大きい割合で前記改変シトシンを有するDNAを含む、ステップ;
    b)前記第1および第2の部分試料のうち少なくとも一方から、DNAの少なくとも1つのエピジェネティック標的領域セットを捕捉するステップであって、前記DNAを、前記少なくとも1つのエピジェネティック標的領域セットに対して特異的な標的特異的プローブと接触させることを含み、前記エピジェネティック標的領域セットの前記標的領域が、複数の免疫細胞タイプにおいて差次的にメチル化されるDNA配列を含み、前記複数の免疫細胞タイプが、
    i.ナイーブリンパ球および活性化されたリンパ球;
    ii.単球およびマクロファージ;または
    iii.骨髄球、好中球、および好酸球
    を含み、それによって、捕捉されたDNAを提供する、ステップ;ならびに
    c)前記捕捉されたDNAをシーケンシングし、前記DNAが起源とする複数の免疫細胞タイプの各々のレベルを決定するステップ
    を含む、方法。
  7. 試料中のDNAを解析する方法であって、
    a)前記DNAを、前記DNA中の改変シトシンを認識する作用剤と接触させることによって、前記試料を複数の部分試料に分配するステップであって、前記複数が、第1の部分試料および第2の部分試料を含み、前記第1の部分試料が、前記第2の部分試料よりも大きい割合で前記改変シトシンを有するDNAを含む、ステップ;
    b)前記第1および第2の部分試料のうち少なくとも一方から、DNAの少なくとも1つのエピジェネティック標的領域セットを捕捉するステップであって、少なくとも1つのエピジェネティック標的領域セットが、低メチル化可変標的領域セットを含み、それによって、捕捉されたDNAを提供する、ステップ;
    c)前記捕捉されたDNAをシーケンシングするステップ;ならびに
    d)捕捉されたDNA配列のレベルを検出し、前記DNAが起源とする複数の免疫細胞タイプの各々のレベルを決定するステップ
    を含む、方法。
  8. 試料中のDNAを解析する方法であって、
    a)前記DNAを、前記DNA中の改変シトシンを認識する作用剤と接触させることによって、前記試料を複数の部分試料に分配するステップであって、前記複数が、第1の部分試料および第2の部分試料を含み、前記第1の部分試料が、前記第2の部分試料よりも大きい割合で前記改変シトシンを有するDNAを含む、ステップ;
    b)前記第1および第2の部分試料のうち少なくとも一方から、DNAの少なくとも1つのエピジェネティック標的領域セットを捕捉するステップであって、前記DNAを、前記少なくとも1つのエピジェネティック標的領域セットに対して特異的な標的特異的プローブと接触させることを含み、前記エピジェネティック標的領域セットの前記標的領域が、複数の免疫細胞タイプにおいて低メチル化されたDNA配列を含み、それによって、捕捉されたDNAを提供する、ステップ;ならびに
    c)前記捕捉されたDNAをシーケンシングするステップ
    を含む、方法。
  9. 前記第1および第2の部分試料のうち少なくとも一方から、DNAの少なくとも1つのエピジェネティック標的領域セットを捕捉するステップであって、前記エピジェネティック標的領域セットの前記標的領域が、複数の免疫細胞タイプにおいて差次的にメチル化されるDNA配列を含み、前記捕捉するステップが、前記シーケンシングするステップの前に実施される、ステップ、を含む、請求項5または7に記載の方法。
  10. 前記エピジェネティック標的領域セットが、高メチル化可変標的領域セットおよび低メチル化可変標的領域セットを含む、先行する請求項のいずれか一項に記載の方法。
  11. 前記複数の免疫細胞タイプが、ナイーブリンパ球および活性化されたリンパ球を含む、先行する請求項のいずれか一項に記載の方法。
  12. 前記複数の免疫細胞タイプが、ナイーブT細胞、ナイーブB細胞、エフェクターCD4 T細胞、エフェクターCD8 T細胞、Treg細胞、形質細胞、およびメモリー細胞を含む、直前に先行する請求項に記載の方法。
  13. 前記エフェクターCD4 T細胞が、エフェクターメモリーCD4 T細胞およびセントラルメモリーCD4 T細胞を含み、前記エフェクターCD8 T細胞が、エフェクターメモリーCD8 T細胞およびセントラルメモリーCD8 T細胞を含む、直前に先行する請求項に記載の方法。
  14. 前記複数の免疫細胞タイプが、単球およびマクロファージを含む、先行する請求項のいずれか一項に記載の方法。
  15. 前記複数の免疫細胞タイプが、骨髄球、好中球、および好酸球を含む、先行する請求項のいずれか一項に記載の方法。
  16. 前記複数の免疫細胞タイプが、後骨髄球を含む、直前に先行する請求項のいずれか一項に記載の方法。
  17. 前記複数の免疫細胞タイプが、ナチュラルキラー(NK)細胞を含む、先行する請求項のいずれか一項に記載の方法。
  18. 前記複数の免疫細胞タイプの各々のレベルが、総血液細胞のレベルと比較して決定される、先行する請求項のいずれか一項に記載の方法。
  19. 前記試料が血液試料である、先行する請求項のいずれか一項に記載の方法。
  20. 前記試料が血漿試料である、先行する請求項のいずれか一項に記載の方法。
  21. 前記試料が、組織試料から得られる、先行する請求項のいずれか一項に記載の方法。
  22. 前記組織試料が、生検、微細針吸引物、またはホルマリン固定パラフィン包埋組織試料である、直前に先行する請求項に記載の方法。
  23. 前記DNAが、無細胞DNA(cfDNA)を含む、先行する請求項のいずれか一項に記載の方法。
  24. 前記DNAが、前記試料中に本来存在するインタクトな細胞から単離されたDNAを含む、請求項5~23のいずれか一項に記載の方法。
  25. 前記複数の免疫細胞タイプの前記決定されたレベルまたは量に基づいて、免疫細胞タイプのレベルまたは量の比率を決定するステップを含む、先行する請求項のいずれか一項に記載の方法。
  26. 前記比率の分子が、好中球、単球、または好中球および単球の両方のレベルまたは量を含む、直前に先行する請求項に記載の方法。
  27. 前記比率の分母が、T細胞、B細胞、NK細胞、または総リンパ球のレベルまたは量を含む、請求項25または26に記載の方法。
  28. 前記比率の分子が、好中球のレベルまたは量を含み、前記比率の分母が、総リンパ球のレベルまたは量を含む、請求項25~27のいずれか一項に記載の方法。
  29. 前記比率の分子が、単球のレベルまたは量を含み、前記比率の分母が、T細胞のレベルまたは量を含む、請求項25~27のいずれか一項に記載の方法。
  30. 前記複数の免疫細胞タイプのうち少なくとも1つのターンオーバーの頻度を決定するステップを含む、先行する請求項のいずれか一項に記載の方法。
  31. 前記ターンオーバーが、増殖を含む、直前に先行する請求項に記載の方法。
  32. 前記ターンオーバーが、アポトーシスを含む、請求項30に記載の方法。
  33. 前記DNAが起源とする免疫細胞タイプ以外の少なくとも1つの細胞タイプのレベルを決定するステップを含む、先行する請求項のいずれか一項に記載の方法。
  34. 前記試料または部分試料中の全ての他の細胞タイプを起源とするDNA中の同じ標的領域と比較して、免疫細胞タイプ以外の前記細胞タイプを起源とするDNA中の標的領域において配列非依存的な差を含む少なくとも1つのエピジェネティック標的領域セットを捕捉するステップを含む、直前に先行する請求項に記載の方法。
  35. 免疫細胞タイプ以外の前記細胞タイプが、血液細胞タイプではない、請求項33または34に記載の方法。
  36. 免疫細胞タイプ以外の前記細胞タイプが、結腸直腸、肺、乳房、前立腺、皮膚、胃、膀胱、肝臓、卵巣、膵臓、扁平上皮、唾液腺、喉頭、下咽頭、鼻、副鼻腔、鼻咽頭、または腎臓である、直前に先行する請求項に記載の方法。
  37. 前記試料が、対象から得られる、先行する請求項のいずれか一項に記載の方法。
  38. 前記対象ががんまたは前がんを有する可能性を決定するステップを含む、直前に先行する請求項に記載の方法。
  39. 前記対象ががんを有する可能性を決定するステップを含む、直前に先行する請求項に記載の方法。
  40. 前記がんが、免疫細胞タイプのがんである、直前に先行する請求項に記載の方法。
  41. 前記がんがリンパ球性がんである、直前に先行する請求項に記載の方法。
  42. 前記がんが、白血病、リンパ腫、または骨髄腫である、直前に先行する請求項に記載の方法。
  43. 前記がんが骨髄性がんである、請求項38~40のいずれか一項に記載の方法。
  44. 前記がんが、免疫細胞タイプ以外の細胞または組織タイプのがんである、請求項38または39に記載の方法。
  45. 前記がんもしくは前がんが、血液学的がんもしくは前がん以外のがんもしくは前がんであるか、または前記がんもしくは前がんが固形腫瘍がんであり、必要に応じて、前記固形腫瘍がんが、癌腫または肉腫である、請求項38、39または44のいずれか一項に記載の方法。
  46. 前記がんが、結腸直腸がん、肺がん、乳がん、前立腺がん、皮膚がん、胃がん、膀胱がん、肝臓がん、卵巣がん、膵臓がん、頭頸部がん、または腎臓がんである、請求項44または45に記載の方法。
  47. 前記対象が前がんを有する可能性を決定するステップを含む、請求項38に記載の方法。
  48. 前記前がんが腺腫である、直前に先行する請求項に記載の方法。
  49. 前記腺腫が、進行した腺腫である、直前に先行する請求項に記載の方法。
  50. 前記前がんが、結腸直腸前がん、肺前がん、乳房前がん、前立腺前がん、皮膚前がん、胃前がん、膀胱前がん、肝臓前がん、卵巣前がん、膵臓前がん、頭頸部前がん、または腎臓前がんである、請求項47~49のいずれか一項に記載の方法。
  51. 前記対象が感染症を有する可能性を決定するステップを含む、請求項37~50のいずれか一項に記載の方法。
  52. 前記対象が移植片拒絶を有する可能性を決定するステップを含む、請求項37~51のいずれか一項に記載の方法。
  53. 前記複数の免疫細胞タイプの各々の量を決定する前記ステップまたは前記シーケンシングするステップが、複数のシーケンシング読み取りデータを生成することを含み、前記方法が、前記複数の配列読み取りデータを、1つまたは複数の参照配列にマッピングして、マッピングされた配列読み取りデータを生成するステップ、ならびに前記マッピングされた配列読み取りデータをプロセシングして、前記対象ががん、前がん、感染症または移植片拒絶を有する可能性を決定するステップをさらに含む、請求項38~52のいずれか一項に記載の方法。
  54. 前記試料が、がんを有すると以前に診断されており、1つまたは複数の以前のがん処置を受けている対象から得られ、必要に応じて、前記試料が、前記1つまたは複数の以前のがん処置後の1つまたは複数の事前に選択された時点で得られる、先行する請求項のいずれか一項に記載の方法。
  55. がん再発スコアを決定するステップをさらに含み、必要に応じて、前記対象のがん再発ステータスが、前記がん再発スコアが既定の閾値もしくはそれより上であると決定される場合にがん再発のリスクがあると決定されるか、または前記対象の前記がん再発ステータスが、前記がん再発スコアが前記既定の閾値より下である場合にがん再発のリスクがより低いと決定される、直前に先行する請求項に記載の方法。
  56. 前記対象の前記がん再発スコアを、既定のがん再発閾値と比較するステップをさらに含み、前記対象が、前記がん再発スコアが前記がん再発閾値より上である場合、その後のがん処置の候補であると分類され、前記がん再発スコアが前記がん再発閾値より下である場合、その後のがん処置の候補ではないと分類される、直前に先行する請求項に記載の方法。
  57. 前記捕捉するステップが、配列可変標的領域を捕捉することを含む、請求項2、4、6または8~56のいずれか一項に記載の方法。
  58. 前記捕捉するステップが、前記DNAを、前記少なくとも1つのエピジェネティック標的領域セットに対して特異的な標的特異的プローブおよび前記配列可変標的領域に対して特異的な標的特異的プローブと接触させることを含む、直前に先行する請求項に記載の方法。
  59. 前記改変シトシンがメチルシトシンである、請求項5~58のいずれか一項に記載の方法。
  60. 改変シトシンを認識する前記作用剤がメチル結合試薬である、請求項5~58のいずれか一項に記載の方法。
  61. 前記メチル結合試薬が抗体である、直前に先行する請求項に記載の方法。
  62. 改変シトシンを認識する前記作用剤が、メチル結合タンパク質であるか、またはメチル結合ドメインを含む、請求項60に記載の方法。
  63. 前記メチル結合試薬が、5-メチルシトシンを特異的に認識する、請求項60~62に記載の方法。
  64. 前記メチル結合試薬が、固体支持体上に固定化される、請求項60~63に記載の方法。
  65. 前記分配するステップが、メチル化DNAの免疫沈降を含む、請求項5~64のいずれか一項に記載の方法。
  66. 前記分配するステップが、タンパク質への結合に基づいて分配することを含み、必要に応じて、前記タンパク質が、メチル化されたタンパク質、アセチル化されたタンパク質、非メチル化タンパク質、非アセチル化タンパク質であり;および/または必要に応じて、前記タンパク質がヒストンである、請求項5~58のいずれか一項に記載の方法。
  67. 前記分配するステップが、前記試料の前記DNAを、前記タンパク質に対して特異的であり、固体支持体上に固定化された結合試薬と接触させることを含む、直前に先行する請求項に記載の方法。
  68. 少なくとも1つの部分試料を、前記捕捉するステップまたは前記シーケンシングするステップの前に、制限酵素と接触させるステップを含み、必要に応じて、前記接触させるステップが、前記試料を前記複数の部分試料に分配した後に行われる、請求項5~67のいずれか一項に記載の方法。
  69. 前記制限酵素がMDREである、直前に先行する請求項に記載の方法。
  70. 前記第2の部分試料が、前記MDREと接触させられる、直前に先行する請求項に記載の方法。
  71. 前記制限酵素がMSREである、請求項68~70のいずれか一項に記載の方法。
  72. 前記第1の部分試料が、前記MSREと接触させられる、直前に先行する請求項に記載の方法。
  73. アダプターを前記DNAにライゲーションし、それによって、アダプターライゲーションしたDNAを産生するステップを含む、先行する請求項のいずれか一項に記載の方法。
  74. 前記アダプターライゲーションしたDNAが、前記シーケンシングするステップの前に増幅される、直前に先行する請求項に記載の方法。
  75. 前記部分試料が、前記シーケンシングするステップの前にプールされる、請求項5~74のいずれか一項に記載の方法。
  76. 前記エピジェネティック標的領域セットが、複数の免疫細胞タイプにおいて差次的に低メチル化されるDNA配列を含む低メチル化可変標的領域を含む、請求項1~4または6~75のいずれか一項に記載の方法。
  77. 前記低メチル化可変標的領域が、複数の免疫細胞タイプにおいて差次的に低メチル化されるDNA配列を含む、請求項3、4、7または10~76のいずれか一項に記載の方法。
  78. 複数の免疫細胞タイプにおいて差次的に低メチル化される前記DNA配列が、少なくとも1つの免疫細胞タイプにおいて、前記試料中の任意の他の免疫細胞タイプにおける同じ配列のメチル化の程度よりも検出可能に低い程度のメチル化を含む、請求項3、4、76または77のいずれか一項に記載の方法。
  79. 複数の免疫細胞タイプにおいて差次的に低メチル化される前記DNA配列が、少なくとも1つの免疫細胞タイプにおいて、任意の他の免疫細胞タイプにおける同じ配列のメチル化の程度よりも検出可能に低い程度のメチル化を含む、請求項3、4、76または77のいずれか一項に記載の方法。
  80. 複数の免疫細胞タイプにおいて差次的に低メチル化される前記DNA配列が、1つの免疫細胞タイプにおいて、前記試料中の任意の他の免疫細胞タイプにおける同じ配列のメチル化の程度よりも検出可能に低い程度のメチル化を含む、請求項3、4、76または77のいずれか一項に記載の方法。
  81. 複数の免疫細胞タイプにおいて差次的に低メチル化される前記DNA配列が、1つの免疫細胞タイプにおいて、任意の他の免疫細胞タイプにおける同じ配列のメチル化の程度よりも検出可能に低い程度のメチル化を含む、請求項3、4、76または77のいずれか一項に記載の方法。
  82. 複数の免疫細胞タイプにおいて差次的に低メチル化される前記DNA配列が、少なくとも1つの免疫細胞タイプにおいて、少なくとも1つの他の免疫細胞タイプにおける同じ配列のメチル化の程度よりも検出可能に低い程度のメチル化を含み、前記試料中の少なくとも1つの非免疫細胞タイプにおける同じ配列のメチル化の程度よりも検出可能に低い程度のメチル化を含む、請求項3、4、76または77のいずれか一項に記載の方法。
  83. 複数の免疫細胞タイプにおいて差次的に低メチル化される前記DNA配列が、少なくとも1つの免疫細胞タイプにおいて、少なくとも1つの他の免疫細胞タイプにおける同じ配列のメチル化の程度よりも検出可能に低い程度のメチル化を含み、前記試料中の任意の非免疫細胞タイプにおける同じ配列のメチル化の程度よりも検出可能に低い程度のメチル化を含む、請求項3、4、76または77のいずれか一項に記載の方法。
  84. 前記検出可能に低い程度のメチル化が、前記他の細胞タイプにおける同じ配列よりも1つ少ないメチル化シトシンである、請求項78~83のいずれか一項に記載の方法。
  85. 前記検出可能に低い程度のメチル化が、前記他の細胞タイプにおける同じ配列よりも2つ少ないメチル化シトシンである、請求項78~83のいずれか一項に記載の方法。
  86. 前記検出可能に低い程度のメチル化が、前記他の細胞タイプにおける同じ配列よりも3つ少ないメチル化シトシンである、請求項78~83のいずれか一項に記載の方法。
  87. 前記検出可能に低い程度のメチル化が、前記他の細胞タイプにおける同じ配列よりも4つ少ないメチル化シトシンである、請求項78~83のいずれか一項に記載の方法。
  88. 前記検出可能に低い程度のメチル化が、前記他の細胞タイプにおける同じ配列よりも5つまたはそれよりも少ないメチル化シトシンである、請求項78~83のいずれか一項に記載の方法。
  89. 前記エピジェネティック標的領域セットが、複数の免疫細胞タイプにおいて差次的に高メチル化されるDNA配列を含む高メチル化可変標的領域を含む、請求項1~4または6~88のいずれか一項に記載の方法。
  90. 複数の免疫細胞タイプにおいて差次的に高メチル化される前記DNA配列が、少なくとも1つの免疫細胞タイプにおいて、前記試料中の任意の他の免疫細胞タイプにおける同じ配列のメチル化の程度よりも検出可能に高い程度のメチル化を含む、請求項89に記載の方法。
  91. 複数の免疫細胞タイプにおいて差次的に高メチル化される前記DNA配列が、少なくとも1つの免疫細胞タイプにおいて、任意の他の免疫細胞タイプにおける同じ配列のメチル化の程度よりも検出可能に高い程度のメチル化を含む、請求項89に記載の方法。
  92. 複数の免疫細胞タイプにおいて差次的に高メチル化される前記DNA配列が、1つの免疫細胞タイプにおいて、前記試料中の任意の他の免疫細胞タイプにおける同じ配列のメチル化の程度よりも検出可能に高い程度のメチル化を含む、請求項89に記載の方法。
  93. 複数の免疫細胞タイプにおいて差次的に高メチル化される前記DNA配列が、1つの免疫細胞タイプにおいて、任意の他の免疫細胞タイプにおける同じ配列のメチル化の程度よりも検出可能に高い程度のメチル化を含む、請求項89に記載の方法。
  94. 複数の免疫細胞タイプにおいて差次的に高メチル化される前記DNA配列が、少なくとも1つの免疫細胞タイプにおいて、少なくとも1つの他の免疫細胞タイプにおける同じ配列のメチル化の程度よりも検出可能に高い程度のメチル化を含み、前記試料中の少なくとも1つの非免疫細胞タイプにおける同じ配列のメチル化の程度よりも検出可能に低い程度のメチル化を含む、請求項89に記載の方法。
  95. 複数の免疫細胞タイプにおいて差次的に高メチル化される前記DNA配列が、少なくとも1つの免疫細胞タイプにおいて、少なくとも1つの他の免疫細胞タイプにおける同じ配列のメチル化の程度よりも検出可能に高い程度のメチル化を含み、前記試料中の任意の非免疫細胞タイプにおける同じ配列のメチル化の程度よりも検出可能に低い程度のメチル化を含む、請求項89に記載の方法。
  96. 前記検出可能に高い程度のメチル化が、前記他の細胞タイプにおける同じ配列よりも1つ多いシトシンメチル化である、請求項90~95のいずれか一項に記載の方法。
  97. 前記検出可能に高い程度のメチル化が、前記他の細胞タイプにおける同じ配列よりも2つ多いシトシンメチル化である、請求項90~95のいずれか一項に記載の方法。
  98. 前記検出可能に高い程度のメチル化が、前記他の細胞タイプにおける同じ配列よりも3つ多いシトシンメチル化である、請求項90~95のいずれか一項に記載の方法。
  99. 前記検出可能に高い程度のメチル化が、前記他の細胞タイプにおける同じ配列よりも4つ多いシトシンメチル化である、請求項90~95のいずれか一項に記載の方法。
  100. 前記検出可能に高い程度のメチル化が、前記他の細胞タイプにおける同じ配列よりも5つ多いまたは5つよりも多いシトシンメチル化である、請求項90~95のいずれか一項に記載の方法。
  101. 赤血球または赤血球前駆体を起源とする前記試料中のDNAの量を決定するステップ、またはそのレベルを検出するステップを含む、先行する請求項のいずれか一項に記載の方法。
  102. 顆粒細胞を起源とする前記試料中のDNAの量を決定するステップ、またはそのレベルを検出するステップを含む、先行する請求項のいずれか一項に記載の方法。
  103. 前記検出可能に低いまたは高い程度のメチル化が、別の群のドナーと比較して、少なくとも1つの群のドナー由来の試料中に存在し、必要に応じて、前記少なくとも1つの群のドナーが、治療に応答するがんを有し、前記別の群のドナーが、前記治療に応答しないがんを有する、請求項3、4または76~102のいずれか一項に記載の方法。
JP2023558179A 2021-03-25 2022-03-25 免疫細胞dnaを定量するための方法および組成物 Pending JP2024511425A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202163166200P 2021-03-25 2021-03-25
US63/166,200 2021-03-25
PCT/US2022/071365 WO2022204730A1 (en) 2021-03-25 2022-03-25 Methods and compositions for quantifying immune cell dna

Publications (1)

Publication Number Publication Date
JP2024511425A true JP2024511425A (ja) 2024-03-13

Family

ID=81346077

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023558179A Pending JP2024511425A (ja) 2021-03-25 2022-03-25 免疫細胞dnaを定量するための方法および組成物

Country Status (3)

Country Link
EP (1) EP4314329A1 (ja)
JP (1) JP2024511425A (ja)
WO (1) WO2022204730A1 (ja)

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6582908B2 (en) 1990-12-06 2003-06-24 Affymetrix, Inc. Oligonucleotides
US20030017081A1 (en) 1994-02-10 2003-01-23 Affymetrix, Inc. Method and apparatus for imaging a sample on a device
DE60234464D1 (de) 2001-11-28 2009-12-31 Applied Biosystems Llc Zusammensetzungen und Verfahren zur selektiven Nukleinsäureisolierung
DE602004023279D1 (de) 2003-03-21 2009-11-05 Santaris Pharma As Analoga kurzer interferierender rna (sirna)
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
WO2013185137A1 (en) 2012-06-08 2013-12-12 Pacific Biosciences Of California, Inc. Modified base detection with nanopore sequencing
EP2893040B1 (en) 2012-09-04 2019-01-02 Guardant Health, Inc. Methods to detect rare mutations and copy number variation
AU2015292311B2 (en) 2014-07-25 2022-01-20 University Of Washington Methods of determining tissues and/or cell types giving rise to cell-free DNA, and methods of identifying a disease or disorder using same
KR102610098B1 (ko) 2016-07-06 2023-12-04 가던트 헬쓰, 인크. 무세포 핵산의 프래그멘톰 프로파일링을 위한 방법
US9850523B1 (en) 2016-09-30 2017-12-26 Guardant Health, Inc. Methods for multi-resolution analysis of cell-free nucleic acids
MX2019007444A (es) 2016-12-22 2019-08-16 Guardant Health Inc Metodos y sistemas para analisis de moleculas de acido nucleico.
WO2020160414A1 (en) 2019-01-31 2020-08-06 Guardant Health, Inc. Compositions and methods for isolating cell-free dna

Also Published As

Publication number Publication date
WO2022204730A1 (en) 2022-09-29
EP4314329A1 (en) 2024-02-07

Similar Documents

Publication Publication Date Title
US11891653B2 (en) Compositions and methods for analyzing cell-free DNA in methylation partitioning assays
US20220154285A1 (en) Analysis of methylated dna comprising methylation-sensitive or methylation-dependent restrictions
US20240167099A1 (en) Detection of epigenetic status using sequence-specific degradation
US20220154286A1 (en) Compositions and methods for analyzing dna using partitioning and base conversion
US20240229113A1 (en) Methods and compositions for detecting nucleic acid variants
US20240150844A1 (en) Compositions and methods for enriching methylated polynucleotides
WO2024006908A1 (en) Enrichment of aberrantly methylated dna
JP2024511425A (ja) 免疫細胞dnaを定量するための方法および組成物
US20240093292A1 (en) Quality control method
US20240263241A1 (en) Methods and compositions for copy-number informed tissue-of-origin analysis
US20240191290A1 (en) Methods for detection and reduction of sample preparation-induced methylation artifacts
WO2024073508A2 (en) Methods and compositions for quantifying immune cell dna
WO2023056065A1 (en) Compositions and methods for synthesis and use of probes targeting nucleic acid rearrangements
WO2023122623A1 (en) Methods and systems for combinatorial chromatin-ip sequencing
WO2023168300A1 (en) Methods for analyzing cytosine methylation and hydroxymethylation
WO2024163478A1 (en) Non-invasive monitoring of genomic alterations induced by gene-editing therapies
WO2024159053A1 (en) Nucleic acid methylation profiling method
JP2024520422A (ja) 循環分子をアッセイするための組成物および方法
WO2024138180A2 (en) Integrated targeted and whole genome somatic and dna methylation sequencing workflows