JP2023551292A - メチル化されたポリヌクレオチドを富化するための組成物および方法 - Google Patents

メチル化されたポリヌクレオチドを富化するための組成物および方法 Download PDF

Info

Publication number
JP2023551292A
JP2023551292A JP2023532507A JP2023532507A JP2023551292A JP 2023551292 A JP2023551292 A JP 2023551292A JP 2023532507 A JP2023532507 A JP 2023532507A JP 2023532507 A JP2023532507 A JP 2023532507A JP 2023551292 A JP2023551292 A JP 2023551292A
Authority
JP
Japan
Prior art keywords
nucleobase
dna
modified
sample
cancer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2023532507A
Other languages
English (en)
Inventor
アンドリュー ケネディ,
Original Assignee
ガーダント ヘルス, インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ガーダント ヘルス, インコーポレイテッド filed Critical ガーダント ヘルス, インコーポレイテッド
Publication of JP2023551292A publication Critical patent/JP2023551292A/ja
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing

Abstract

第1の部分試料のDNA中の第2のヌクレオベースとは異なるようにDNA中の第1のヌクレオベースに影響を与える手順;試料を少なくとも第1の部分試料および第2の部分試料へと分配するステップであって、第1の部分試料が第2の部分試料とは異なる割合でヌクレオベース改変を有するDNA(例えば無細胞DNA)を含む、ステップを含み;DNAが配列決定されて、第1のヌクレオベースを第2のヌクレオベースから識別する、DNA分析法が、本明細書で提供される。捕捉されたDNAの第1および第2の集団を含む組合せ物であって、第1の集団が第2の集団とは異なる割合でヌクレオベース改変を有するDNAを含むか、またはそれに由来したものであり、第1の集団が変更された塩基対合特異性を有する、DNA中に元々存在する第1のヌクレオベースの形態と変更された塩基対合特異性を有さない第2のヌクレオベースとを含む組合せ物もまた提供される。

Description

関連出願に対する相互参照
本出願は、全ての目的のためにその全体がこれにより参照により本明細書に組み込まれる、2020年11月30日出願の米国仮特許出願第63/119,520号の優先権の利益を主張する。
発明の分野
本開示は、DNA、例えば、無細胞DNAを分析することに関する組成物および方法を提供する。一部の実施形態では、無細胞DNAは、がんを有するもしくは有すると疑われる対象由来であり、および/または無細胞DNAには、がん細胞由来のDNAが含まれる。一部の実施形態では、DNAは、DNA中の第2のヌクレオベースとは異なるようにDNA中の第1のヌクレオベースに影響を与える手順に供され、DNAは、第1の部分試料および第2の部分試料へと分配され、第1の部分試料は、第2の部分試料よりも高い割合でヌクレオベース改変(例えば、シトシン改変)を有するDNAを含み、DNAは、第1のヌクレオベースを第2のヌクレオベースから識別する様式で配列決定される。
導入および概要
がんは、世界中で1年当たり数百万の死亡の原因である。初期ステージのがんは、処置に対してより感受性が高い傾向があるので、がんの早期検出は、改善された転帰を生じ得る。
不適切に制御された細胞成長は、遺伝子変化およびエピジェネティック変化、例えば、コピー数バリエーション(CNV)、単一ヌクレオチドバリエーション(SNV)、遺伝子融合、挿入および/または欠失(インデル)、シトシンの改変(例えば、5-メチルシトシン、5-ヒドロキシメチルシトシン、および他のより酸化された形態)が含まれるエピジェネティックバリエーションの蓄積、ならびにDNAとクロマチンタンパク質および転写因子との会合から一般に生じる、がんの顕著な特徴である。
生検は、細胞または組織ががんのあり得る部位から抽出され、関連する表現型および/または遺伝子型特色について分析される、がんを検出または診断するための従来のアプローチを示す。生検は、侵襲性であるという欠点を有する。
血液などの体液の分析(「液体生検」)に基づくがんの検出は、がん細胞由来のDNAが体液中に放出されるという観察に基づく興味深い代替法である。液体生検は、非侵襲性である(ときどき、採血のみを必要とする)。しかし、無細胞DNAの低い濃度および不均一性を考慮してヌクレオベース改変に関する詳細な情報を提供する、液体生検材料を分析するための正確かつ高感度な方法を開発することは困難であった。液体生検手順におけるさらなる分析のために有用な無細胞DNAの画分を単離および処理することは、これらの方法の重要な部分である。したがって、例えば、液体生検中の無細胞DNAを分析するための改善された方法および組成物が必要とされている。
いずれの特定の理論によっても束縛されることを望まないが、がんまたは新生物の中またはその周囲の細胞は、健康な対象における同じ組織型の細胞よりも多くのDNAを脱落させ得る。したがって、ある特定のDNA試料、例えば、無細胞DNA(cfDNA)の起源である組織の分布は、癌発生の際に変化し得る。したがって、例えば、少なくとも1つの他の組織型中よりも、健康なcfDNAにおいてより低いメチル化を示す高メチル化可変標的領域のレベルにおける増加は、がんの存在(または対象の病歴に依存して、再発)の指標であり得る。同様に、試料中の低メチル化可変標的領域のレベルにおける増加は、がんの存在(または対象の病歴に依存して、再発)の指標であり得る。
さらに、がんは、非配列改変、例えば、メチル化によって示され得る。がんにおけるメチル化変化の例としては、正常な成長制御、DNA修復、細胞周期調節および/または細胞分化に関与する遺伝子のTSSにおける、CpG島中のDNAメチル化の局所的獲得が挙げられる。この高メチル化は、関与する遺伝子の転写能の異常な喪失に関連し得、変更された遺伝子発現の原因として、点突然変異および欠失と少なくとも同様の頻度で生じる。
したがって、DNAメチル化プロファイリングは、試料のDNA中の異常なメチル化を検出するために使用され得る。DNAは、例えば、試料の型への、組織の異常に増加した寄与に起因して(例えば、新生物またはがんの中またはその周囲でのDNAの脱落の増加に起因して)、および/あるいは発生の間に変更される、または疾患、例えば、がんもしくは任意のがん関連疾患によって乱されるゲノムのメチル化の程度から、所与の試料型(例えば、血流由来のcfDNA)において通常は高メチル化または低メチル化されているが、新生物またはがんと相関する異常な程度のメチル化を示し得る、ある特定のゲノム領域(「差次的にメチル化された領域」、または「DMR」)に対応し得る。
一部の実施形態では、DNAメチル化は、CpG部位(シトシン-リン酸-グアニン部位(すなわち、核酸配列の5’→3’方向での、シトシンとその後のグアニン))における、シトシン残基へのメチル基の付加を含む。一部の実施形態では、DNAメチル化は、例えば、N6-メチルアデニンにおける、アデニン残基へのメチル基の付加を含む。一部の実施形態では、DNAメチル化は、5-メチル化(シトシンの6-炭素環の5番目の炭素の改変)である。一部の実施形態では、5-メチル化は、5-メチルシトシン(m5cまたは5-mCまたは5mC)を創出する、シトシン残基の5C位へのメチル基の付加を含む。一部の実施形態では、メチル化は、m5cの誘導体を含む。m5cの誘導体としては、これらに限定されないが、5-ヒドロキシメチルシトシン(5-hmCまたは5hmC)、5-ホルミルシトシン(5-fC)および5-カルボキシルシトシン(5-caryboxylcytosine)(5-caC)が挙げられる。一部の実施形態では、DNAメチル化は、3Cメチル化(シトシン残基の6-炭素環の3番目の炭素の改変)である。一部の実施形態では、3Cメチル化は、3-メチルシトシン(3mC)を生成する、シトシン残基の3C位へのメチル基の付加を含む。メチル化は、非CpG部位においても生じ得、例えば、メチル化は、CpA、CpTまたはCpC部位において生じ得る。DNAメチル化は、メチル化されたDNA領域の活性を変化させ得る。例えば、プロモーター領域中のDNAがメチル化されている場合、遺伝子の転写は、抑制され得る。DNAメチル化は、正常な発生のために重要であり、メチル化における異常は、エピジェネティック調節を破壊し得る。エピジェネティック調節における破壊、例えば、抑制は、疾患、例えば、がんを引き起こし得る。DNAにおけるプロモーターメチル化は、がんを示し得る。
本開示は、以下の認識に一部基づく。他の処理ステップ、例えば、メチル化の程度に基づく分配、および配列決定に従ってヌクレオベース改変(とりわけ、シトシンのメチル化および/またはヒドロキシメチル化が含まれる)を分析することは、有益であり得る。例えば、例示的な実施形態では、DNA試料(例えば、cfDNA試料)は、異なる形態の所与のヌクレオベース(例えば、未改変のシトシンおよびメチル化されたシトシン、またはヒドロキシメチル化されたシトシンおよびメチル化されたシトシン)に差次的に影響を与える手順に供され、次いで、(例えば、メチルシトシンに特異的な抗体への結合に基づいて)異なる量のシトシンメチル化を有する複数の部分試料へと分配される。次いで、配列決定が、複数の部分試料中の配列を同定するため、および/または特定の種のヌクレオベースが存在した特定の部分試料由来のDNA中の位置を同定するために実施され得る。本開示に従うかかる方法は、既存のアプローチ、例えば、MeDIP-seq、MBD-seq、BS-seq、Ox-BS-seq、TAP-seq、ACE-seq、hmC-sealおよびTAB-seqよりも、cfDNAなどのDNA中のエピジェネティック改変についてのより多くの情報を提供することができる。例えば、Schutsky, E.K. et al. Nondestructive, base-resolution sequencing of 5-hydroxymethylcytosine using a DNA deaminase. Nature Biotech, 2018; doi.10.1038/nbt.4204 (ACE-Seq);Yu, Miao et al. Base-resolution analysis of 5-hydroxymethylcytosine in the Mammalian Genome. Cell, 2012; 149(6):1368-80 (TAB-Seq);Han, D. A highly sensitive and robust method for genome-wide 5hmC profiling of rare cell populations. Mol Cell. 2016; 63(4):711-719 (5hmC-Seal);Shen, S.Y. et al. Sensitive tumour detection and classification using plasma cell-free DNA methylomes. Nature. 2018; 563(7732):579-583 (cfMeDIP);Nair, SS et al. Comparison of methyl-DNA immunoprecipitation (MeDIP) and methyl-CpG binding domain (MBD) protein capture for genome-wide DNA. Epigenetics. 2011; 6(1):34-44を参照されたい。かかる既存の方法とは異なり、本開示に従う方法は、分配するステップによる、第1の改変、例えば、メチル化レベルについての情報と、異なる形態の所与のヌクレオベースに差次的に影響を与える手順による、特定の改変および/またはその位置についての追加の情報との組合せを提供することができる。かかる手順の例としては、バイサルファイト、置換されたボラン、塩基改変酵素、またはヌクレオベースのクラスの異なる種間を区別する改変された塩基特異的抗体を使用する種々の変換または分離ステップを含む、異なるヌクレオベースに差次的に影響を与える手順が含まれる。一部の実施形態では、本明細書に記載される方法は、(i)分子の改変(例えば、シトシン改変)の全体的レベル(例えば、その分配に基づく)、ならびに(ii)特定の改変の正体および/または位置についてのより高い解像度の情報(例えば、本明細書で詳細に議論されるような、特定の改変されたもしくは未改変のヌクレオベースの特異的変換、または特定の型の改変間を識別するさらなる分配と、その後の配列決定とに基づく)、についての情報の組合せを提供する。本発明の方法は、例えば、低メチル化された分子が、部分試料間でのDNA分子の不完全な選別に起因して、高メチル化された分配中に存在する場合に、誤分配された分子の同定を容易にすることもできる。例えば、DNAがバイサルファイト変換に供された場合、分子からの配列データにおける未変換のCpGジヌクレオチドの存在は、それが不完全に選別されたかどうかにかかわらず、メチル化を示す。
本発明の方法は、DNAから、標的領域の2つのセットを捕捉するステップをさらに含み得る。一部の実施形態では、標的領域のこれらのセットは、配列可変標的領域セットおよびエピジェネティック標的領域セットを含む。これらのセットの各々は、試料ががん細胞由来のDNAを含有する可能性を決定する際に有用な情報を提供することができる。一部の実施形態では、配列可変標的領域セットの捕捉収量は、エピジェネティック標的領域セットの捕捉収量よりも高い。捕捉収量における差異は、例えば、同じ配列決定セルにおける、または配列決定される材料の同じプールなどにおける並列配列決定の間などに、配列可変標的領域セットにおける深い、したがってより正確な配列決定、およびエピジェネティック標的領域セットにおける浅く広いカバレッジを可能にし得る。
エピジェネティック標的領域セットは、種々の方法で分析され得る。例えば、特定の位置の改変に関する許容可能な程度の信頼度が、配列可変標的領域セットにおける精度に関する許容可能な程度の信頼度よりも低い場合(例えば、目的が、種々の遺伝子座における異なる型の改変の頻度を理解することであり、改変される正確な位置を理解することでは必ずしもない場合)、分析は、標的内の特定のヌクレオチドの配列決定における高い程度の精度に依存しない方法を使用し得る。例としては、改変、例えば、メチル化の程度、ならびに/または断片がそこから得られた細胞における正常もしくは異常なクロマチン構造を示し得る断片の分布およびサイズを決定することが挙げられる。かかる分析は、配列決定によって実施され得、配列突然変異、例えば、塩基置換、挿入または欠失の存在または非存在を決定する場合よりも少ないデータ(例えば、配列読み取りの数または配列決定カバレッジの深度)を要求する。
本開示は、無細胞DNAの改善された分析の必要性を満たし、および/または他の利益を提供することを目的とする。したがって、以下の例示的な実施形態が提供される。
実施形態1は、試料中のDNAを分析する方法であって、
a)上記試料を、上記試料の上記DNA中の第2のヌクレオベースとは異なるように上記DNA中の第1のヌクレオベースに影響を与える手順に供するステップであって、上記第1のヌクレオベースが、改変されたまたは未改変のヌクレオベースであり、上記第2のヌクレオベースが、上記第1のヌクレオベースとは異なる改変されたまたは未改変のヌクレオベースであり、上記第1のヌクレオベースと上記第2のヌクレオベースとが、同じ塩基対合特異性を有する、ステップ;
b)上記DNAを、上記DNA中の改変されたヌクレオベースを認識する薬剤と接触させることによって、上記試料を複数の部分試料へと分配するステップであって、上記複数が、第1の部分試料および第2の部分試料を含み、上記第1の部分試料が、上記第2の部分試料よりも高い割合でシトシン改変を有するDNAを含み、上記薬剤によって認識される上記改変されたヌクレオベースが、改変されたシトシン、または上記試料の上記DNA中の上記第2のヌクレオベースとは異なるように上記DNA中の上記第1のヌクレオベースに影響を与える上記手順の産物である、ステップ;ならびに
c)上記第1のヌクレオベースを上記第2のヌクレオベースから識別する様式で、上記第1および第2の部分試料のうち少なくとも一方中のDNAを配列決定するステップ
を含む方法である。
実施形態2は、ステップc)が、少なくとも上記第1の部分試料中のDNAを配列決定するステップを含む、実施形態1に記載の方法である。
実施形態3は、ステップc)が、上記第2の部分試料中のDNAを配列決定するステップを含む、先行する実施形態のいずれか1つに記載の方法である。
実施形態4は、試料中のDNAを分析する方法であって、
a)上記試料を、上記試料の上記DNA中の第2のヌクレオベースとは異なるように上記DNA中の第1のヌクレオベースに影響を与える手順に供するステップであって、上記第1のヌクレオベースが、改変されたまたは未改変のヌクレオベースであり、上記第2のヌクレオベースが、上記第1のヌクレオベースとは異なる改変されたまたは未改変のヌクレオベースであり、上記第1のヌクレオベースと上記第2のヌクレオベースとが、同じ塩基対合特異性を有する、ステップ;ならびに
b)上記DNAを、上記DNA中の改変されたヌクレオベースを認識する薬剤と接触させることによって、上記試料を複数の部分試料へと分配するステップであって、上記複数が、第1の部分試料および第2の部分試料を含み、上記第1の部分試料が、上記第2の部分試料よりも高い割合でシトシン改変を有するDNAを含み、上記薬剤によって認識される上記改変されたヌクレオベースが、改変されたシトシン、または上記試料の上記DNA中の上記第2のヌクレオベースとは異なるように上記DNA中の上記第1のヌクレオベースに影響を与える上記手順の産物である、ステップ;
c)上記第1および第2の部分試料から、DNAの少なくともエピジェネティック標的領域セットを捕捉し、それによって、捕捉されたDNAを提供するステップ;ならびに
d)上記第1のヌクレオベースを上記第2のヌクレオベースから識別する様式で、上記捕捉されたDNAを配列決定するステップ
を含む方法である。
実施形態5は、試料中のDNAを分析する方法であって、
a)上記試料を、上記試料の上記DNA中の第2のヌクレオベースとは異なるように上記DNA中の第1のヌクレオベースに影響を与える手順に供するステップであって、上記第1のヌクレオベースが、改変されたまたは未改変のヌクレオベースであり、上記第2のヌクレオベースが、上記第1のヌクレオベースとは異なる改変されたまたは未改変のヌクレオベースであり、上記第1のヌクレオベースと上記第2のヌクレオベースとが、同じ塩基対合特異性を有する、ステップ;ならびに
b)上記DNAを、上記DNA中の改変されたヌクレオベースを認識する薬剤と接触させることによって、上記試料を複数の部分試料へと分配するステップであって、上記複数が、第1の部分試料および第2の部分試料を含み、上記第1の部分試料が、上記第2の部分試料よりも高い割合でシトシン改変を有するDNAを含み、上記薬剤によって認識される上記改変されたヌクレオベースが、改変されたシトシン、または上記試料の上記DNA中の上記第2のヌクレオベースとは異なるように上記DNA中の上記第1のヌクレオベースに影響を与える上記手順の産物である、ステップ;
c)上記第1および第2の部分試料から、DNAの標的領域の複数のセットを捕捉するステップであって、標的領域の上記複数のセットが、配列可変標的領域セットおよびエピジェネティック標的領域セットを含み、それによって、捕捉されたDNAを提供する、ステップ;ならびに
d)上記第1のヌクレオベースを上記第2のヌクレオベースから識別する様式で、上記捕捉されたDNAを配列決定するステップ
を含む方法である。
実施形態6は、上記配列可変標的領域セットに対応する無細胞DNA(cfDNA)分子が、上記エピジェネティック標的領域セットに対応するcfDNA分子よりも高い捕捉収量で、上記試料中で捕捉される、実施形態5に記載の方法である。
実施形態7は、標的領域の上記複数のセットを捕捉するステップが、上記第1および第2の部分試料の上記DNAを、標的特異的プローブのセットと接触させるステップであって、
標的特異的プローブの上記セットが、配列可変標的セットに特異的な標的結合性プローブおよびエピジェネティック標的セットに特異的な標的結合性プローブを含み、
それによって、標的特異的プローブとcfDNAとの複合体が形成される、ステップ;ならびに
上記複合体を、標的特異的プローブに結合していないcfDNAから分離し、それによって、上記配列可変標的セットに対応する捕捉されたcfDNAおよび上記エピジェネティック標的セットに対応する捕捉されたcfDNAを提供するステップ
を含む、実施形態5または6に記載の方法である。
実施形態8は、上記エピジェネティック標的領域セットが、高メチル化可変標的領域セットを含む、実施形態4から7のいずれか1つに記載の方法である。
実施形態9は、上記高メチル化可変標的領域セットが、健康な対象由来の無細胞DNA中のメチル化の程度よりも、少なくとも1つの型の組織において、より高い程度のメチル化を有する領域を含む、直前に先行する実施形態に記載の方法である。
実施形態10は、上記エピジェネティック標的領域セットが、低メチル化可変標的領域セットを含む、実施形態4から9のいずれか1つに記載の方法である。
実施形態11は、上記低メチル化可変標的領域セットが、健康な対象由来の無細胞DNA中のメチル化の程度よりも、少なくとも1つの型の組織において、より低い程度のメチル化を有する領域を含む、直前に先行する実施形態に記載の方法である。
実施形態12は、上記エピジェネティック標的領域セットが、メチル化対照標的領域セットを含む、実施形態4から11のいずれか1つに記載の方法である。
実施形態13は、上記エピジェネティック標的領域セットが、断片化可変標的領域セットを含む、実施形態4から12のいずれか1つに記載の方法である。
実施形態14は、上記断片化可変標的領域セットが、転写開始部位領域を含む、実施形態13に記載の方法である。
実施形態15は、上記断片化可変標的領域セットが、CTCF結合領域を含む、実施形態13または14に記載の方法である。
実施形態16は、上記DNAが、試験対象から得られる、先行する実施形態のいずれか1つに記載の方法である。
実施形態17は、上記DNAが、試験対象から得られた無細胞DNA(cfDNA)を含む、先行する実施形態のいずれか1つに記載の方法である。
実施形態18は、上記DNAが、試験対象の組織試料から得られたDNAを含む、実施形態1から16のいずれか1つに記載の方法である。
実施形態19は、上記組織試料が、生検、微細針吸引物またはホルマリン固定パラフィン包埋組織試料である、直前に先行する実施形態に記載の方法である。
実施形態20は、捕捉前に、バーコード含有アダプターを上記DNAにライゲーションさせるステップをさらに含み、必要に応じて、上記ライゲーションさせるステップが、増幅の前にまたはそれと同時に実施される、実施形態5から18に記載の方法である。
実施形態21は、上記第1の部分試料由来のDNA分子と上記第2の部分試料由来のDNA分子とが、差次的にタグ化される、先行する実施形態のいずれか1つに記載の方法である。
実施形態22は、上記第1の部分試料由来のDNA分子と上記第2の部分試料由来のDNA分子とが、同じ配列決定セルにおいて配列決定される、先行する実施形態のいずれか1つに記載の方法である。
実施形態23は、上記DNAが、配列決定するステップの前に増幅される、または方法が捕捉ステップを含み、上記DNAが、上記捕捉ステップの前に増幅される、先行する実施形態のいずれか1つに記載の方法である。
実施形態24は、上記試料を複数の部分試料へと分配するステップが、メチル化レベルに基づいて分配するステップを含む、先行する実施形態のいずれか1つに記載の方法である。
実施形態25は、上記DNA中の改変されたヌクレオベースを認識する上記薬剤が、メチル結合試薬である、実施形態24に記載の方法である。
実施形態26は、上記メチル結合試薬が抗体である、実施形態25に記載の方法である。
実施形態27は、上記メチル結合試薬が、5-メチルシトシンを特異的に認識する、実施形態25または26に記載の方法である。
実施形態28は、上記メチル結合試薬が、固体支持体上に固定化される、実施形態25から27のいずれか1つに記載の方法である。
実施形態29は、上記試料を複数の部分試料へと分配するステップが、メチル化されたDNAの免疫沈降を含む、実施形態24から28のいずれか1つに記載の方法である。
実施形態30は、上記試料を複数の部分試料へと分配するステップが、タンパク質への結合に基づいて分配するステップを含み、必要に応じて、上記タンパク質が、メチル化されたタンパク質、アセチル化されたタンパク質、メチル化されていないタンパク質、アセチル化されていないタンパク質であり;および/または必要に応じて、上記タンパク質がヒストンである、先行する実施形態のいずれか1つに記載の方法である。
実施形態31は、上記分配するステップが、上記試料の上記DNAを、上記タンパク質に特異的でありかつ固体支持体に固定化された結合試薬と接触させるステップを含む、実施形態30に記載の方法である。
実施形態32は、上記第1の部分試料と第2の部分試料とを差次的にタグ化しプールするステップを含む、先行する実施形態のいずれか1つに記載の方法である。
実施形態33は、上記複数の部分試料が、上記第2の部分試料よりも高い割合であるが、上記第1の部分試料よりも低い割合でシトシン改変を有するDNAを含む第3の部分試料を含む、先行する実施形態のいずれか1つに記載の方法である。
実施形態34は、上記第3の部分試料を差次的にタグ化するステップをさらに含む、実施形態33に記載の方法である。
実施形態35は、上記第1、第2および第3の部分試料が、上記第1の部分試料を、上記第1の部分試料の上記DNA中の上記第2のヌクレオベースとは異なるように上記DNA中の上記第1のヌクレオベースに影響を与える上記手順に供するステップの後に組み合わさっており、必要に応じて、上記第1、第2および第3の部分試料が、同じ配列決定セルにおいて配列決定される、実施形態34に記載の方法である。
実施形態36は、上記試料が供される上記手順が、上記第2のヌクレオベースの塩基対合特異性を実質的に変更することなしに、上記第1のヌクレオベースの塩基対合特異性を変更する、先行する実施形態のいずれか1つに記載の方法である。
実施形態37は、上記第1のヌクレオベースが、改変されたまたは未改変のシトシンであり、上記第2のヌクレオベースが、改変されたまたは未改変のシトシンである、先行する実施形態のいずれか1つに記載の方法である。
実施形態38は、上記第1のヌクレオベースが、未改変のシトシン(C)を含む、先行する実施形態のいずれか1つに記載の方法である。
実施形態39は、上記第2のヌクレオベースが、5-メチルシトシン(mC)を含む、先行する実施形態のいずれか1つに記載の方法である。
実施形態40は、上記試料が供される上記手順が、バイサルファイト変換を含む、先行する実施形態のいずれか1つに記載の方法である。
実施形態41は、上記第1のヌクレオベースが、mCを含む、実施形態1から38のいずれか1つに記載の方法である。
実施形態42は、上記第2のヌクレオベースが、5-ヒドロキシメチルシトシン(hmC)を含む、先行する実施形態のいずれか1つに記載の方法である。
実施形態43は、上記試料が供される上記手順が、5hmCの保護を含む、実施形態42に記載の方法である。
実施形態44は、上記試料が供される上記手順が、Tet補助バイサルファイト変換(Tet-assisted bisulfite conversion)を含む、実施形態42に記載の方法である。
実施形態45は、上記試料が供される上記手順が、置換されたボラン還元剤を用いた、Tet補助変換を含み、必要に応じて、上記置換されたボラン還元剤が、2-ピコリンボラン、ボランピリジン、tert-ブチルアミンボランまたはアンモニアボランである、実施形態42に記載の方法である。
実施形態46は、上記置換されたボラン還元剤が、2-ピコリンボランまたはボランピリジンである、実施形態45に記載の方法である。
実施形態47は、上記第2のヌクレオベースが、Cを含む、実施形態41から43または45から46のいずれか1つに記載の方法である。
実施形態48は、上記試料が供される上記手順が、hmCの保護と、その後の、置換されたボラン還元剤を用いた、Tet補助変換とを含み、必要に応じて、上記置換されたボラン還元剤が、2-ピコリンボラン、ボランピリジン、tert-ブチルアミンボランまたはアンモニアボランである、実施形態41から43または47のいずれか1つに記載の方法である。
実施形態49は、上記置換されたボラン還元剤が、2-ピコリンボランまたはボランピリジンである、実施形態48に記載の方法である。
実施形態50は、上記試料が供される上記手順が、hmCの保護と、その後の、mCおよび/またはCの脱アミノ化とを含む、実施形態38、39、41から43または47のいずれか1つに記載の方法である。
実施形態51は、mCおよび/またはCの上記脱アミノ化が、AID/APOBECファミリーのDNAデアミナーゼ酵素による処理を含む、実施形態50に記載の方法である。
実施形態52は、hmCの保護が、hmCのグルコシル化を含む、実施形態43または47から51のいずれか1つに記載の方法である。
実施形態53は、上記試料が供される上記手順が、置換されたボラン還元剤を用いた、化学物質補助変換(chemical-assisted conversion)を含み、必要に応じて、上記置換されたボラン還元剤が、2-ピコリンボラン、ボランピリジン、tert-ブチルアミンボランまたはアンモニアボランである、実施形態1から37、39、41または47のいずれか1つに記載の方法である。
実施形態54は、上記置換されたボラン還元剤が、2-ピコリンボランまたはボランピリジンである、実施形態53に記載の方法である。
実施形態55は、上記第1のヌクレオベースが、hmCを含む、実施形態1から37、39、41、47または53から54のいずれか1つに記載の方法である。
実施形態56は、上記第1のヌクレオベースが、改変されたまたは未改変のアデニンであり、上記第2のヌクレオベースが、改変されたまたは未改変のアデニンである、実施形態1から36のいずれか1つに記載の方法である。
実施形態57は、上記第1のヌクレオベースが、改変されたまたは未改変のグアニンであり、上記第2のヌクレオベースが、改変されたまたは未改変のグアニンである、実施形態1から36のいずれか1つに記載の方法である。
実施形態58は、上記第1のヌクレオベースが、改変されたまたは未改変のチミンであり、上記第2のヌクレオベースが、改変されたまたは未改変のチミンである、実施形態1から36のいずれか1つに記載の方法である。
実施形態59は、上記薬剤によって認識される上記改変されたヌクレオベースが、改変されたシトシンである、先行する実施形態のいずれか1つに記載の方法である。
実施形態60は、上記薬剤によって認識される上記改変されたヌクレオベースが、メチル化されたシトシンである、先行する実施形態のいずれか1つに記載の方法である。
実施形態61は、上記薬剤によって認識される上記改変されたヌクレオベースが、変換されたヌクレオベースである、先行する実施形態のいずれか1つに記載の方法である。
実施形態61.01は、少なくとも1つの部分試料を複数のさらなる部分試料へと分配するステップをさらに含む、先行する実施形態のいずれか1つに記載の方法である。
実施形態61.02は、上記第1の部分試料が、複数のさらなる部分試料へと分配されている、実施形態61.01に記載の方法である。
実施形態61.03は、上記第2の部分試料が、複数のさらなる部分試料へと分配されている、実施形態61.01または61.02に記載の方法である。
実施形態61.04は、上記試料が、ウラシルを含むDNA、mCを含むDNA、およびシトシン5-メチレンスルホネート(CMS)、hmCまたは5-グルコシルヒドロキシメチルシトシン(ghmC)のうち1つまたは複数を含むDNAを含む、実施形態61.01から61.03のいずれか1つに記載の方法である。
実施形態61.05は、上記試料が、CMSを含むDNAを含む、実施形態61.04に記載の方法である。
実施形態61.06は、上記試料が、hmCを含むDNAを含む、実施形態61.04に記載の方法である。
実施形態61.07は、上記試料が、ghmCを含むDNAを含む、実施形態61.04に記載の方法である。
実施形態61.08は、少なくとも1つの部分試料を複数のさらなる部分試料へと分配するステップが、上記少なくとも1つの部分試料を、ghmC、hmCまたはmCを認識するさらなる薬剤と接触させるステップを含む、実施形態61.01から61.07のいずれか1つに記載の方法である。
実施形態61.09は、上記さらなる薬剤が、ghmCを認識する、実施形態61.08に記載の方法である。
実施形態61.10は、上記さらなる薬剤が、hmCを認識する、実施形態61.08に記載の方法である。
実施形態61.11は、上記さらなる薬剤が、mCを認識する、実施形態61.08に記載の方法である。
実施形態61.12は、上記さらなる薬剤が抗体である、実施形態61.01から61.07のいずれか1つに記載の方法である。
実施形態61.13は、上記さらなる部分試料が、第2のさらなる部分試料よりも高い割合でmCを有するDNAを含む第1のさらなる部分試料を含む、実施形態61.01から61.12のいずれか1つに記載の方法である。
実施形態61.14は、上記さらなる部分試料が、上記第2のさらなる部分試料よりも高い割合でmCを有するDNAを含む第1のさらなる部分試料を含む、実施形態61.01から61.13のいずれか1つに記載の方法である。
実施形態61.15は、上記第1の部分試料が、上記さらなる部分試料よりも高い割合でCMSを有するDNAを含む、実施形態61.01から61.14のいずれか1つに記載の方法である。
実施形態61.16は、上記第1の部分試料が、上記さらなる部分試料よりも高い割合でhmCまたはghmCを有するDNAを含む、実施形態61.01から61.15のいずれか1つに記載の方法である。
実施形態62は、捕捉されたDNAの第1および第2の集団を含む組合せ物であって、上記第1の集団が、上記第2の集団よりも高い割合でシトシン改変を有するDNAを含むか、またはそれに由来したものであり、上記第1の集団および上記第2の集団が各々、変更された塩基対合特異性を有する、上記DNA中に元々存在する第1のヌクレオベースの形態と、変更された塩基対合特異性を有さない第2のヌクレオベースとを含み、塩基対合特異性の変更前の上記DNA中に元々存在する上記第1のヌクレオベースの上記形態が、改変されたまたは未改変のヌクレオベースであり、上記第2のヌクレオベースが、上記第1のヌクレオベースとは異なる改変されたまたは未改変のヌクレオベースであり、塩基対合特異性の変更前の上記DNA中に元々存在する上記第1のヌクレオベースの上記形態と上記第2のヌクレオベースとが、同じ塩基対合特異性を有する、組合せ物である。
実施形態63は、上記第1の集団が、1つまたは複数の配列タグの第1のセットから選択される配列タグを含み、上記第2の集団が、1つまたは複数の配列タグの第2のセットから選択される配列タグを含み、配列タグの上記第2のセットが、配列タグの上記第1のセットとは異なる、実施形態62に記載の組合せ物である。
実施形態64は、上記配列タグが、バーコードを含む、実施形態63に記載の組合せ物である。
実施形態65は、上記シトシン改変がメチル化である、実施形態62から64のいずれか1つに記載の組合せ物である。
実施形態66は、上記第1のヌクレオベースが、改変されたまたは未改変のシトシンであり、上記第2のヌクレオベースが、改変されたまたは未改変のシトシンである、実施形態62から65のいずれか1つに記載の組合せ物である。
実施形態67は、上記第1のヌクレオベースが、未改変のシトシン(C)を含む、実施形態62から66のいずれか1つに記載の組合せ物である。
実施形態68は、上記第2のヌクレオベースが、5-メチルシトシン(mC)および5-ヒドロキシメチルシトシン(hmC)のうち一方または両方を含む、実施形態62から67のいずれか1つに記載の組合せ物である。
実施形態69は、第1の集団が、バイサルファイト変換に供されている、実施形態62から68のいずれか1つに記載の組合せ物である。
実施形態70は、上記第1のヌクレオベースが、mCを含む、実施形態62から68のいずれか1つに記載の組合せ物である。
実施形態71は、上記第2のヌクレオベースが、hmCを含む、実施形態62から70のいずれか1つに記載の組合せ物である。
実施形態72は、上記第1の集団が、保護されたhmCを含む、実施形態62から71のいずれか1つに記載の組合せ物である。
実施形態73は、上記第1の集団が、Tet補助バイサルファイト変換に供されている、実施形態66または72に記載の組合せ物である。
実施形態74は、上記第1の集団が、置換されたボラン還元剤を用いた、Tet補助変換に供されており、必要に応じて、上記置換されたボラン還元剤が、2-ピコリンボラン、ボランピリジン、tert-ブチルアミンボランまたはアンモニアボランである、実施形態66または72に記載の組合せ物である。
実施形態75は、上記第1の集団が、hmCの保護と、その後の、置換されたボラン還元剤を用いた、Tet補助変換とに供されており、必要に応じて、上記置換されたボラン還元剤が、2-ピコリンボラン、ボランピリジン、tert-ブチルアミンボランまたはアンモニアボランである、実施形態72に記載の組合せ物である。
実施形態76は、上記第2のヌクレオベースが、Cを含む、実施形態72から74、68、70から72または74から75のいずれか1つに記載の組合せ物である。
実施形態77は、上記第1の集団が、hmCの保護と、その後の、mCおよび/またはCの脱アミノ化とに供されている、実施形態72に記載の組合せ物である。
実施形態78は、保護されたhmCが、グルコシル化されたhmCを含む、実施形態72から77のいずれか1つに記載の組合せ物である。
実施形態79は、上記第1のヌクレオベースが、hmCを含む、実施形態72から75のいずれか1つに記載の組合せ物である。
実施形態80は、上記第2のヌクレオベースが、mCを含む、実施形態72から75または79のいずれか1つに記載の組合せ物である。
実施形態81は、上記第2のヌクレオベースが、Cを含む、実施形態72から75または79から80のいずれか1つに記載の組合せ物である。
実施形態82は、上記第1の集団が、置換されたボラン還元剤を用いた、化学物質補助変換に供されており、必要に応じて、上記置換されたボラン還元剤が、2-ピコリンボラン、ボランピリジン、tert-ブチルアミンボランまたはアンモニアボランである、実施形態72から75または79から81のいずれか1つに記載の組合せ物である。
実施形態83は、上記第1のヌクレオベースが、改変されたまたは未改変のアデニンであり、上記第2のヌクレオベースが、改変されたまたは未改変のアデニンである、実施形態72から75のいずれか1つに記載の組合せ物である。
実施形態84は、上記第1のヌクレオベースが、改変されたまたは未改変のグアニンであり、上記第2のヌクレオベースが、改変されたまたは未改変のグアニンである、実施形態72から75のいずれか1つに記載の組合せ物である。
実施形態85は、上記第1のヌクレオベースが、改変されたまたは未改変のチミンであり、上記第2のヌクレオベースが、改変されたまたは未改変のチミンである、実施形態72から75のいずれか1つに記載の組合せ物である。
実施形態86は、上記捕捉されたDNAが、cfDNAを含む、実施形態72から85のいずれか1つに記載の組合せ物である。
実施形態87は、上記捕捉されたDNAが、配列可変標的領域およびエピジェネティック標的領域を含み、上記配列可変標的領域の濃度が、上記エピジェネティック標的領域の濃度よりも高く、上記濃度が、上記配列可変標的領域およびエピジェネティック標的領域のフットプリントサイズに関して標準化される、実施形態72から86のいずれか1つに記載の組合せ物である。
実施形態88は、実施形態1から61.16のいずれか1つに記載の方法に従って生産される、実施形態62から87のいずれか1つに記載の組合せ物である。
実施形態89は、上記第1の部分試料の上記DNAと上記第2の部分試料の上記DNAとが、差次的にタグ化され;差次的タグ化後に、上記第2の部分試料由来のDNAの一部分が、上記第1の部分試料またはその少なくとも一部分に添加され、それによって、プールを形成し;配列可変標的領域およびエピジェネティック標的領域が、上記プールから捕捉される、実施形態1から61.16のいずれか1つに記載の方法である。
実施形態90は、上記プールが、上記第2の部分試料の上記DNAの約45%、40%、35%、30%、25%、20%、15%、10%もしくは5%未満、またはそれと等しい%を含む、直前に先行する実施形態に記載の方法である。
実施形態91は、上記プールが、上記第2の部分試料の上記DNAの約70~90%、約75~85%または約80%を含む、実施形態89に記載の方法である。
実施形態92は、上記プールが、上記第1の部分試料の上記DNAの実質的に全てを含む、実施形態89から91のいずれか1つに記載の方法である。
実施形態93は、配列可変標的領域が、上記第2の部分試料由来のDNAの第2の部分から捕捉される、実施形態89から92のいずれか1つに記載の方法である。
実施形態94は、上記対象ががんを有する可能性を決定するステップをさらに含む、実施形態1から61.16または89から93のいずれか1つに記載の方法である。
実施形態95は、上記配列決定するステップが、複数の配列決定読み取りを生成し;方法が、上記複数の配列読み取りを、1つまたは複数の参照配列にマッピングして、マッピングされた配列読み取りを生成するステップ、ならびに上記配列可変標的領域セットに対応する上記マッピングされた配列読み取りおよび上記エピジェネティック標的領域セットに対応する上記マッピングされた配列読み取りを処理して、上記対象ががんを有する可能性を決定するステップをさらに含む、直前に先行する実施形態に記載の方法である。
実施形態96は、上記試験対象が、がんと以前に診断されており、1つまたは複数の以前のがん処置を受けており、必要に応じて、上記DNAが、上記1つまたは複数の以前のがん処置の後の1つまたは複数の予め選択された時点において得られ、DNA分子の捕捉されたセットが配列決定され、それによって、配列情報のセットが生成される、実施形態1から61.16または89から95のいずれか1つに記載の方法である。
実施形態97は、配列情報の上記セットを使用して、予め選択された時点における、腫瘍細胞に起源するまたはそれに由来するDNAの存在または非存在を検出するステップをさらに含む、直前に先行する実施形態に記載の方法である。
実施形態98は、上記試験対象について、上記腫瘍細胞に起源するまたはそれに由来する上記DNAの上記存在または非存在を示すがん再発スコアを決定するステップをさらに含み、必要に応じて、上記がん再発スコアに基づいて、がん再発ステータスを決定するステップをさらに含み、がん再発スコアが所定の閾値であるもしくはそれを上回ると決定される場合に、上記試験対象の上記がん再発ステータスが、がん再発のリスク状態にあると決定される、または上記がん再発スコアが上記所定の閾値を下回る場合に、上記試験対象の上記がん再発ステータスが、がん再発のより低いリスク状態にあると決定される、直前に先行する実施形態に記載の方法である。
実施形態99は、上記試験対象の上記がん再発スコアを、所定のがん再発閾値と比較するステップをさらに含み、上記試験対象が、上記がん再発スコアが上記がん再発閾値を上回る場合には、引き続くがん処置のための候補として分類される、または上記がん再発スコアが上記がん再発閾値を下回る場合には、引き続くがん処置のための候補として分類されない、直前に先行する実施形態に記載の方法である。
図1は、cfDNAが血液試料から単離される、血液試料で開始する、本開示のある特定の実施形態に従う例示的なワークフローを示す;cfDNAは、CをUに変換するバイサルファイト(BS)で処理され、次いで、メチルシトシンに特異的な抗体を使用して、低い、中間、または高いメチル化の部分試料へと分配される;各部分試料は、低い、中間、または高いメチル化の部分試料由来のDNAを識別可能にタグ化するための分子バーコード化に供される;試料は、(任意の適切な順序で)プールされ、捕捉され、増幅され、配列決定される。バイサルファイト変換を含むこの例示的な方法と概して類似した方法は、どのシトシン位置がmCまたはhmCに対して未改変のシトシンであったかなかったかを、変換またはその非存在を介して示す。 同上。
図2は、本開示の一部の実施形態での使用に適切な系の一例の概略図である。
図3A~Bは、本開示のある特定の実施形態に従う例示的なワークフローを示す。 同上。
ある特定の実施形態の詳細な説明
本発明のある特定の実施形態に対する言及が、ここで詳細になされる。本発明は、かかる実施形態と併せて記載されるが、かかる実施形態は、本発明をそれらの実施形態に限定することを意図しないことが理解される。対照的に、本発明は、添付の特許請求の範囲によって定義される発明の範囲内に含まれ得る全ての代替法、改変および等価物をカバーする意図である。
本発明の教示を詳細に記載する前に、本開示は、特定の組成物にも処理ステップにも限定されず、それ自体変動し得ることを理解すべきである。本明細書および添付の特許請求の範囲において使用される場合、単数形「1つの(a)」、「1つの(an)」および「その(the)」は、文脈が明確に他を示さない限り、複数形の言及を含むことに留意すべきである。したがって、例えば、「1つの(a)核酸」に対する言及は、複数の核酸を含み、「1つの(a)細胞」に対する言及は、複数の細胞を含むなどである。
数値範囲は、その範囲を規定する数字を含む。測定されたおよび測定可能な値は、有効数字、および測定に関連する誤差を考慮して、近似であることが理解される。また、「含む(comprise)」、「含む(comprises)」、「含む(comprising)」、「含有する(contain)」、「含有する(contains)」、「含有する(containing)」、「含む(include)」、「含む(includes)」および「含む(including)」の使用は、限定を意図しない。上述の一般的な記載および詳細な記載は共に、例示的かつ説明的なものであるに過ぎず、教示の限定ではないことを理解すべきである。
上記明細書で具体的に留意されない限り、種々の構成要素を「含む」を列挙する明細書中の実施形態は、列挙された構成要素「からなる」またはそれ「から本質的になる」とも考えられる;種々の構成要素「からなる」を列挙する明細書中の実施形態は、列挙された構成要素を「含む」またはそれ「から本質的になる」とも考えられる;種々の構成要素「から本質的になる」を列挙する明細書中の実施形態は、列挙された構成要素「からなる」またはそれを「含む」とも考えられる(この互換性は、特許請求の範囲中でのこれらの用語の使用には適用されない)。
本明細書で使用されるセクション見出しは、構成を目的としたものであり、開示された主題を決して限定しないと解釈すべきである。参照により組み込まれる任意の文書または他の資料が、定義を含む本明細書の任意の明確な内容と矛盾する場合には、本明細書が支配する。
I.定義
「無細胞DNA」、「cfDNA分子」または単に「cfDNA」には、細胞外形態で対象中に(例えば、血液、血清、血漿、または他の体液、例えば、リンパ、脳脊髄液、尿もしくは痰中に)天然に存在するDNA分子が含まれる。cfDNAは、以前には、大きい複雑な生物、例えば、哺乳動物中の細胞(単数または複数)中に存在していたが、細胞から、生物において見出される液中への放出を受けており、in vitro細胞溶解ステップを実施する必要なしに、液の試料から得られ得る。cfDNA分子は、DNA断片として存在し得る。
本明細書で使用される場合、核酸、例えば、DNA分子の「分配」は、複数の部分試料またはサブ集団の各々中に異なる割合で存在する1つまたは複数の改変または特色に基づいて、核酸の試料または集団を、核酸の複数の部分試料またはサブ集団へと分離、分画、選別または富化することを意味する。分配は、1つまたは複数のメチル化されたヌクレオベースの存在または非存在に基づいて、核酸分子を物理的に分配することを含み得る。試料または集団は、遺伝子変化もしくはエピジェネティック変化または疾患状態を示す特徴に基づいて、1つまたは複数の分配された部分試料またはサブ集団へと分配され得る。
本明細書で使用される場合、改変または他の特色を有するヌクレオチドの分率が、第2の集団中よりも、第1の試料または集団中でより高い場合、改変または他の特色は、第2の試料または集団中よりも、核酸の第1の試料または集団中に「より高い割合」で存在する。例えば、第1の試料中で、ヌクレオチドの10分の1がmCであり、第2の試料中で、ヌクレオチドの20分の1がmCである場合、第1の試料は、第2の試料よりも高い割合で、5-メチル化のシトシン改変を含む。
本明細書で使用される場合、「元々単離された」試料の形態は、それが単離された時点における、および単離された試料の化学構造を変化させる任意の手順を受ける前の、試料の組成または化学構造を指す。同様に、DNA分子中に「元々存在する」特色は、「元のDNA分子」中に存在する、またはDNA分子の化学構造を変化させる手順をDNA分子が受ける前の特色を「元々含む」DNA分子中に存在する特色を指す。
本明細書で使用される場合、所与のヌクレオベースの「塩基対合特異性を実質的に変更することなしに」とは、配列決定され得るそのヌクレオベースを含む分子の大部分が、それが元々単離された試料中にあったときのその塩基対合特異性と比較して、その所与のヌクレオベースの塩基対合特異性の変更を有さないことを意味する。一部の実施形態では、配列決定され得るそのヌクレオベースを含む分子の75%、90%、95%または99%が、それが元々単離された試料中にあったときのその塩基対合特異性と比較して、塩基対合特異性の変更を有さない。本明細書で使用される場合、所与のヌクレオベースの「変更された塩基対合特異性」とは、配列決定され得るそのヌクレオベースを含む分子の大部分が、元々単離された試料中でのその塩基対合特異性と比較して、そのヌクレオベースにおいて塩基対合特異性を有することを意味する。
本明細書で使用される場合、「塩基対合特異性」は、所与の塩基が最も優先的に対合する標準的なDNA塩基(A、C、GまたはT)を指す。例えば、未改変のシトシンおよび5-メチルシトシンは、同じ塩基対合特異性(すなわち、Gに対する特異性)を有するが、ウラシルはAに対する塩基対合特異性を有し、一方でシトシンは、Gに対する塩基対合特異性を有するので、ウラシルおよびシトシンは、異なる塩基対合特異性を有する。ウラシルがGと揺らぎのある対を形成する能力は、ウラシルがそれにもかかわらず4つの標準的なDNA塩基の中でAと最も優先的に対合するので、重要ではない。
本明細書で使用される場合、複数のメンバーを含む「組合せ物」は、例えば、別々のコンテナ、またはより大きいコンテナ内の区画、例えば、マルチウェルプレート、チューブラック、冷蔵庫、冷凍庫、インキュベーター、水浴、アイスバケット、機械、もしくは他の貯蔵形態中の、これらのメンバーを含む単一の組成物、または近接した組成物のセットのいずれかを指す。
所与の標的セットに対するプローブの収集の「捕捉収量」は、プローブの収集が典型的な条件下で捕捉する標的セットに対応する核酸の量(例えば、別の標的セットと比較した量、または絶対量)を指す。例示的な典型的な捕捉条件は、ストリンジェントなハイブリダイゼーション緩衝液を含有する小さい反応体積(約20μL)中で10~18時間にわたる、65℃での試料核酸およびプローブのインキュベーションである。捕捉収量は、絶対的な用語で、またはプローブの複数の収集については、相対的な用語で表現され得る。標的領域の複数のセットについての捕捉収量が比較される場合、それらは、標的領域セットのフットプリントサイズに関して(例えば、1キロ塩基当たりに基づいて)標準化される。したがって、例えば、第1および第2の標的領域のフットプリントサイズがそれぞれ50kbおよび500kbである(0.1の標準化因数(normalization factor)を与える)場合、第1の標的領域セットに対応する捕捉されたDNAの体積当たりの質量濃度が、第2の標的領域セットに対応する捕捉されたDNAの体積当たりの質量濃度の0.1倍よりも高いとき、第1の標的領域セットに対応するDNAは、第2の標的領域セットに対応するDNAよりも高い収量で捕捉される。さらなる例として、同じフットプリントサイズを使用すると、第1の標的領域セットに対応する捕捉されたDNAが、第2の標的領域セットに対応する捕捉されたDNAの体積当たりの質量濃度の0.2倍の体積当たりの質量濃度を有する場合、第1の標的領域セットに対応するDNAは、第2の標的領域セットに対応するDNAよりも2倍高い捕捉収量で捕捉されたことになる。
1つまたは複数の標的核酸を「捕捉する」は、1つまたは複数の標的核酸を非標的核酸から優先的に単離または分離することを指す。
核酸の「捕捉されたセット」または「捕捉された」核酸は、捕捉を受けた核酸を指す。
「標的領域セット」または「標的領域のセット」は、捕捉のために標的化されるおよび/またはプローブのセットによって(例えば、配列相補性を介して)標的化される複数のゲノム遺伝子座を指す。
「標的領域セットに対応する」とは、核酸、例えば、cfDNAが、標的領域セット中の遺伝子座に起源したこと、または標的領域セットに対する1つもしくは複数のプローブに特異的に結合することを意味する。
プローブまたは他のオリゴヌクレオチドおよび標的配列の文脈で「特異的に結合する」とは、適切なハイブリダイゼーション条件下で、オリゴヌクレオチドまたはプローブが、その標的配列またはその複製にハイブリダイズして、安定なプローブ:標的ハイブリッドを形成するが、同時に、安定なプローブ:非標的ハイブリッドの形成が最小化されることを意味する。したがって、プローブは、非標的配列に対する場合よりも十分に高い程度まで、標的配列またはその複製にハイブリダイズして、標的配列の捕捉または検出を可能にする。適切なハイブリダイゼーション条件は、当該分野で周知であり、配列組成に基づいて予測され得、または慣用的な試験法を使用して決定され得る(例えば、これにより参照により本明細書に組み込まれる、Sambrook et al., Molecular Cloning, A Laboratory Manual, 2nd ed. (Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989)の§§1.90~1.91、7.37~7.57、9.47~9.51および11.47~11.57、特に、§§9.50~9.51、11.12~11.13、11.45~11.47および11.55~11.57を参照されたい)。
「配列可変標的領域セット」は、正常細胞と比較して、新生物細胞(例えば、腫瘍細胞およびがん細胞)において、配列における変化、例えば、ヌクレオチド置換(すなわち、単一ヌクレオチドバリエーション)、挿入、欠失、または遺伝子融合もしくは転位を示し得る、標的領域のセットを指す。
「エピジェネティック標的領域セット」は、正常細胞と比較して、新生物細胞(例えば、腫瘍細胞およびがん細胞)において、配列非依存的な変化を示し得る、または健康な対象由来のcfDNAと比較して、がんを有する対象由来のcfDNAにおいて、配列非依存的な変化を示し得る、標的領域のセットを指す。配列非依存的な変化の例としては、これらに限定されないが、メチル化における変化(増加または減少)、ヌクレオソーム分布、cfDNA断片化パターン、CCCTC結合因子(「CTCF」)結合、転写開始部位および調節タンパク質結合領域が挙げられる。したがって、エピジェネティック標的領域セットとしては、これらに限定されないが、高メチル化可変標的領域セット、低メチル化可変標的領域セット、ならびに断片化可変標的領域セット、例えば、CTCF結合部位および転写開始部位が挙げられる。本発明の目的のために、新生物関連、腫瘍関連もしくはがん関連の限局的増幅および/または遺伝子融合に対して感受性の遺伝子座もまた、エピジェネティック標的領域セット中に含まれ得るが、それは、配列決定による、または参照ゲノム中の1つよりも多くの遺伝子座にマッピングされる融合された配列による、コピー数における変化の検出が、例えば、それらの検出は1つまたは数個の個々の位置における塩基コールの精度に依存しないので、限局的増幅および/または遺伝子融合が、配列決定の比較的浅い深度において検出され得るという点で、ヌクレオチド置換、挿入、または欠失の検出よりも、上で議論した例示的なエピジェネティック変化の検出とより類似している傾向があるからである。
核酸は、それが腫瘍細胞に起源する場合、「腫瘍によって産生される」または「循環腫瘍DNA」(「ctDNA」)である。腫瘍細胞は、それらが腫瘍中に残存しているか、腫瘍から分離されるか(例えば、転移性がん細胞および循環腫瘍細胞の場合にあてはまる)にかかわらず、腫瘍に起源する新生物細胞である。
用語「メチル化」または「DNAメチル化」は、核酸分子中のヌクレオベースへのメチル基の付加を指す。一部の実施形態では、メチル化は、CpG部位(シトシン-リン酸-グアニン部位(すなわち、核酸配列の5’→3’方向での、シトシンとその後のグアニン))における、シトシンへのメチル基の付加を指す。一部の実施形態では、DNAメチル化は、例えば、N-メチルアデニンにおける、アデニンへのメチル基の付加を指す。一部の実施形態では、DNAメチル化は、5-メチル化(シトシンの6-炭素環の5番目の炭素の改変)である。一部の実施形態では、5-メチル化は、5-メチルシトシン(5mC)を創出する、シトシンの5C位へのメチル基の付加を指す。一部の実施形態では、メチル化は、5mCの誘導体を含む。5mCの誘導体としては、これらに限定されないが、5-ヒドロキシメチルシトシン(5-hmC)、5-ホルミルシトシン(5-fC)および5-カルボキシルシトシン(5-caC)が挙げられる。一部の実施形態では、DNAメチル化は、3Cメチル化(シトシンの6-炭素環の3番目の炭素の改変)である。一部の実施形態では、3Cメチル化は、3-メチルシトシン(3mC)を生成する、シトシンの3C位へのメチル基の付加を含む。メチル化は、非CpG部位においても生じ得る、例えば、メチル化は、CpA、CpTまたはCpC部位において生じ得る。DNAメチル化は、メチル化されたDNA領域の活性を変化させ得る。例えば、プロモーター領域中のDNAがメチル化されている場合、遺伝子の転写は、抑制され得る。DNAメチル化は、正常な発生のために重要であり、メチル化における異常は、エピジェネティック調節を破壊し得る。エピジェネティック調節における破壊、例えば、抑制は、疾患、例えば、がんを引き起こし得る。DNAにおけるプロモーターメチル化は、がんを示し得る。
用語「高メチル化」は、核酸分子の集団(例えば、試料)内の他の核酸分子と比較して増加した、核酸分子のメチル化のレベルまたは程度を指す。一部の実施形態では、高メチル化されたDNAには、少なくとも1つのメチル化された残基、少なくとも2つのメチル化された残基、少なくとも3つのメチル化された残基、少なくとも5つのメチル化された残基または少なくとも10個のメチル化された残基を含むDNA分子が含まれ得る。
用語「低メチル化」は、核酸分子の集団(例えば、試料)内の他の核酸分子と比較して減少した、核酸分子のメチル化のレベルまたは程度を指す。一部の実施形態では、低メチル化されたDNAには、メチル化されていないDNA分子が含まれる。一部の実施形態では、低メチル化されたDNAには、0個のメチル化された残基、多くても1つのメチル化された残基、多くても2つのメチル化された残基、多くても3つのメチル化された残基、多くても4つのメチル化された残基または多くても5つのメチル化された残基を含むDNA分子が含まれ得る。
用語「DNA中の改変されたヌクレオベースを認識する薬剤」は、DNA中の1つまたは複数の改変されたヌクレオベースに結合するまたはそれを検出する分子または試薬を指す。「改変されたヌクレオベース」は、未改変のヌクレオベースと比較して、化学構造における差異を含むヌクレオベースである。DNAの場合、未改変のヌクレオベースは、アデニン、シトシン、グアニンまたはチミンである。一部の実施形態では、改変されたヌクレオベースは、改変されたシトシンである。一部の実施形態では、改変されたヌクレオベースは、メチル化されたヌクレオベースである。一部の実施形態では、改変されたシトシンは、メチルシトシン、例えば、5-メチルシトシンである。かかる実施形態では、シトシン改変は、メチルである。DNA中のメチルシトシンを認識する薬剤には、これに限定されないが、メチルシトシンに結合する試薬を本明細書で指す「メチル結合試薬」が含まれる。メチル結合試薬には、これらに限定されないが、メチル結合ドメイン(MBD)およびメチル結合タンパク質(MBP)、ならびにメチルシトシンに特異的な抗体が含まれる。一部の実施形態では、かかる抗体は、DNA中の5-メチルシトシンに結合する。一部のかかる実施形態では、DNAは、一本鎖または二本鎖であり得る。
用語「またはそれらの組合せ(単数)」および「またはそれらの組合せ(複数)」は、本明細書で使用される場合、この用語に先行する列挙された用語の任意のおよび全ての順列および組合せを指す。例えば、「A、B、C、またはそれらの組合せ」は、以下のうち少なくとも1つを含む意図である:A、B、C、AB、AC、BCまたはABC、および特定の文脈において順序が重要な場合には、BA、CA、CB、ACB、CBA、BCA、BACまたはCABも含む意図である。この例を敷衍すると、1つまたは複数の項目または用語の反復を含有する組合せ、例えば、BB、AAA、AAB、BBC、AAABCCCC、CBBAAA、CABABBなどが、明示的に含まれる。当業者は、文脈から他が明らかでない限り、任意の組合せ中の項目または用語の数に関して、典型的には限定が存在しないことを理解する。
「または」は、文脈が他を要求しない限り、包括的な意味で、すなわち、「および/または」と等価な意味で使用される。
II.例示的な方法
A.DNA中の第2のヌクレオベースとは異なるようにDNA中の第1のヌクレオベースに影響を与える手順
本明細書で開示される方法は、DNAを、DNA中の第2のヌクレオベースとは異なるようにDNA中の第1のヌクレオベースに影響を与える手順に供するステップであって、第1のヌクレオベースが、改変されたまたは未改変のヌクレオベースであり、第2のヌクレオベースが、第1のヌクレオベースとは異なる改変されたまたは未改変のヌクレオベースであり、第1のヌクレオベースと第2のヌクレオベースとが、同じ塩基対合特異性を有する、ステップを含む。一部の実施形態では、この手順は、変換されたヌクレオベースの塩基対合特異性が変更されるように、第1または第2のヌクレオベースを化学的に変換する。一部の実施形態では、第1のヌクレオベースが、改変されたまたは未改変のアデニンである場合、第2のヌクレオベースは、改変されたまたは未改変のアデニンであり;第1のヌクレオベースが、改変されたまたは未改変のシトシンである場合、第2のヌクレオベースは、改変されたまたは未改変のシトシンであり;第1のヌクレオベースが、改変されたまたは未改変のグアニンである場合、第2のヌクレオベースは、改変されたまたは未改変のグアニンであり;第1のヌクレオベースが、改変されたまたは未改変のチミンである場合、第2のヌクレオベースは、改変されたまたは未改変のチミンである(このとき、改変されたおよび未改変のウラシルは、このステップの目的のために、改変されたチミン内に包含される)。
一部の実施形態では、第1のヌクレオベースは、改変されたまたは未改変のシトシンであり、次いで、第2のヌクレオベースは、改変されたまたは未改変のシトシンである。例えば、第1のヌクレオベースは、未改変のシトシン(C)を含み得、第2のヌクレオベースは、5-メチルシトシン(mC)および5-ヒドロキシメチルシトシン(hmC)のうち1つまたは複数を含み得る。あるいは、第2のヌクレオベースは、Cを含み得、第1のヌクレオベースは、mCおよびhmCのうち1つまたは複数を含み得る。例えば、上記概要および以下の議論に示されるように、第1のヌクレオベースおよび第2のヌクレオベースのうち一方がmCを含み、他方がhmCを含む場合など、他の組合せもまた可能である。
一部の実施形態では、DNA中の第2のヌクレオベースとは異なるようにDNA中の第1のヌクレオベースに影響を与える手順は、バイサルファイト変換を含む。バイサルファイトによる処理は、未改変のシトシンおよびある特定の改変されたシトシン(例えば、5-ホルミルシトシン(fC)または5-カルボキシルシトシン(caC))をウラシルに変換するが、他の改変されたシトシン(例えば、5-メチルシトシン、5-ヒドロキシルメチルシトシン(5-hydroxylmethylcystosine))は変換されない。したがって、バイサルファイト変換が使用される場合、第1のヌクレオベースは、未改変のシトシン、5-ホルミルシトシン、5-カルボキシルシトシン、またはバイサルファイトによって影響を与えられる他のシトシン形態のうち1つまたは複数を含むかまたはそれらからなり、第2のヌクレオベースは、mCおよびhmCのうち1つまたは複数、例えば、mCおよび必要に応じてhmCを含み得る。バイサルファイト処理されたDNAの配列決定は、シトシンと読まれる位置を、mCまたはhmC位置であると同定する。一方で、Tと読まれる位置は、Tまたはバイサルファイト感受性形態のC、例えば、未改変のシトシン、5-ホルミルシトシンもしくは5-カルボキシルシトシンであると同定される。したがって、本明細書に記載されるようにバイサルファイト変換を実施することは、配列読み取りを使用してmCまたはhmCを含有する位置を同定することを容易にする。バイサルファイト変換の例示的な記載については、例えば、Moss et al., Nat Commun. 2018; 9: 5068を参照されたい。バイサルファイト変換が実施される例示的なワークフローは、図1に示される。
一部の実施形態では、DNA中の第2のヌクレオベースとは異なるようにDNA中の第1のヌクレオベースに影響を与える手順は、酸化的バイサルファイト(Ox-BS)変換を含む。この手順は、hmCを、バイサルファイト感受性のfCに最初に変換し、その後バイサルファイト変換を実施する。したがって、酸化的バイサルファイト変換が使用される場合、第1のヌクレオベースは、未改変のシトシン、fC、caC、hmC、またはバイサルファイトによって影響を与えられる他のシトシン形態のうち1つまたは複数を含み、第2のヌクレオベースは、mCを含む。Ox-BS変換されたDNAの配列決定は、シトシンと読まれる位置を、mC位置であると同定する。一方で、Tと読まれる位置は、T、hmC、またはバイサルファイト感受性形態のC、例えば、未改変のシトシン、fCまたはhmCであると同定される。したがって、本明細書に記載されるようにOx-BS変換を実施することは、配列読み取りを使用してmCを含有する位置を同定することを容易にする。酸化的バイサルファイト変換の例示的な記載については、例えば、Booth et al., Science 2012; 336: 934-937を参照されたい。
一部の実施形態では、DNA中の第2のヌクレオベースとは異なるようにDNA中の第1のヌクレオベースに影響を与える手順は、Tet補助バイサルファイト(TAB)変換を含む。TAB変換では、hmCは、変換から保護され、mCは、バイサルファイト処理に先立って酸化され、その結果、mCによって元々占められていた位置は、Uに変換されるが、hmCによって元々占められていた位置は、保護された形態のシトシンのままである。例えば、Yu et al., Cell 2012; 149: 1368-80に記載されるように、β-グルコシルトランスフェラーゼが、hmCを保護するために使用され得(5-グルコシルヒドロキシメチルシトシン(ghmC)を形成する)、次いで、TETタンパク質、例えば、mTet1が、mCをcaCに変換するために使用され得、次いで、バイサルファイト処理が、CおよびcaCをUに変換するために使用され得るが、ghmCは、影響を与えられないままである。したがって、TAB変換が使用される場合、第1のヌクレオベースは、未改変のシトシン、fC、caC、mC、またはバイサルファイトによって影響を与えられる他のシトシン形態のうち1つまたは複数を含み、第2のヌクレオベースは、hmCを含む。TAB変換されたDNAの配列決定は、シトシンと読まれる位置を、hmC位置であると同定する。一方で、Tと読まれる位置は、T、mC、またはバイサルファイト感受性形態のC、例えば、未改変のシトシン、fCもしくはcaCであると同定される。したがって、本明細書に記載されるようにTAB変換を実施することは、配列読み取りを使用してhmCを含有する位置を同定することを容易にする。
一部の実施形態では、DNA中の第2のヌクレオベースとは異なるようにDNA中の第1のヌクレオベースに影響を与える手順は、置換されたボラン還元剤を用いた、Tet補助変換を含み、必要に応じて、置換されたボラン還元剤は、2-ピコリンボラン、ボランピリジン、tert-ブチルアミンボランまたはアンモニアボランである。置換されたボラン還元剤変換を用いた、Tet補助pic-ボラン変換では、TETタンパク質が、未改変のCに影響を与えることなしにmCおよびhmCをcaCに変換するために使用される。次いで、caC、および存在する場合にはfCが、これもまた未改変のCに影響を与えることなしに、2-ピコリンボラン(pic-ボラン)または別の置換されたボラン還元剤、例えば、ボランピリジン、tert-ブチルアミンボランもしくはアンモニアボランによる処理によって、ジヒドロウラシル(DHU)に変換される。例えば、Liu et al., Nature Biotechnology 2019; 37:424-429(例えば、補足図1および補足注釈7)を参照されたい。DHUは、配列決定においてTと読まれる。したがって、この型の変換が使用される場合、第1のヌクレオベースは、mC、fC、caCまたはhmCのうち1つまたは複数を含み、第2のヌクレオベースは、未改変のシトシンを含む。変換されたDNAの配列決定は、シトシンと読まれる位置を、未改変のC位置であると同定する。一方で、Tと読まれる位置は、T、mC、fC、caCまたはhmCであると同定される。したがって、本明細書に記載されるようにTAP変換を実施することは、配列読み取りを使用して未改変のCを含有する位置を同定することを容易にする。この手順は、Liu et al. 2019、上記にさらに詳細に記載される、Tet補助ピリジンボラン配列決定(TAPS)を包含する。
あるいは、hmCの保護(例えば、βGTを使用する)が、置換されたボラン還元剤を用いた、Tet補助変換と組み合わされ得る。hmCは、ghmCを形成する、βGTを使用するグルコシル化を介して、上記のように保護され得る。次いで、TETタンパク質、例えば、mTet1による処理は、mCをcaCに変換するが、CもghmCも変換しない。次いで、caCは、これもまた未改変のCにもghmCにも影響を与えることなしに、pic-ボランまたは別の置換されたボラン還元剤、例えば、ボランピリジン、tert-ブチルアミンボランもしくはアンモニアボランによる処理によって、DHUに変換される。したがって、置換されたボラン還元剤を用いた、Tet補助変換が使用される場合、第1のヌクレオベースは、mCを含み、第2のヌクレオベースは、未改変のシトシンまたはhmCのうち1つまたは複数、例えば、未改変のシトシンならびに必要に応じてhmC、fCおよび/またはcaCを含む。変換されたDNAの配列決定は、シトシンと読まれる位置を、hmCまたは未改変のC位置のいずれかであると同定する。一方で、Tと読まれる位置は、T、fC、caCまたはmCであると同定される。したがって、本明細書に記載されるようにTAPSβ変換を実施することは、配列読み取りを使用して、未改変のCまたはhmCを含有する位置を、一方では、mCを含有する位置から識別することを容易にする。この型の変換の例示的な記載については、例えば、Liu et al., Nature Biotechnology 2019; 37:424-429を参照されたい。
一部の実施形態では、DNA中の第2のヌクレオベースとは異なるようにDNA中の第1のヌクレオベースに影響を与える手順は、置換されたボラン還元剤を用いた、化学物質補助変換を含み、必要に応じて、置換されたボラン還元剤は、2-ピコリンボラン、ボランピリジン、tert-ブチルアミンボランまたはアンモニアボランである。置換されたボラン還元剤を用いた、化学物質補助変換では、酸化剤、例えば、過ルテニウム酸カリウム(KRuO)(ox-BS変換での使用にも適切である)が、hmCをfCに特異的に酸化するために使用される。pic-ボランまたは別の置換されたボラン還元剤、例えば、ボランピリジン、tert-ブチルアミンボランもしくはアンモニアボランによる処理は、fCおよびcaCをDHUに変換するが、mCにも未改変のCにも影響を与えない。したがって、この型の変換が使用される場合、第1のヌクレオベースは、hmC、fCおよびcaCのうち1つまたは複数を含み、第2のヌクレオベースは、未改変のシトシンまたはmCのうち1つまたは複数、例えば、未改変のシトシンおよび必要に応じてmCを含む。変換されたDNAの配列決定は、シトシンと読まれる位置を、mCまたは未改変のC位置のいずれかであると同定する。一方で、Tと読まれる位置は、T、fC、caCまたはhmCであると同定される。したがって、本明細書に記載されるようにこの型の変換を実施することは、配列読み取りを使用して、未改変のC、またはmCを含有する位置を、一方では、hmCを含有する位置から識別することを容易にする。この型の変換の例示的な記載については、例えば、Liu et al., Nature Biotechnology 2019; 37:424-429を参照されたい。
一部の実施形態では、DNA中の第2のヌクレオベースとは異なるようにDNA中の第1のヌクレオベースに影響を与える手順は、APOBECカップリングされたエピジェネティック(ACE)変換を含む。ACE変換では、AID/APOBECファミリーのDNAデアミナーゼ酵素、例えば、APOBEC3A(A3A)が、hmCもfCもcaCも脱アミノ化することなしに、未改変のシトシンおよびmCを脱アミノ化するために使用される。したがって、ACE変換が使用される場合、第1のヌクレオベースは、未改変のCおよび/またはmC(例えば、未改変のCおよび必要に応じてmC)を含み、第2のヌクレオベースは、hmCを含む。ACE変換されたDNAの配列決定は、シトシンと読まれる位置を、hmC、fCまたはcaC位置であると同定する。一方で、Tと読まれる位置は、T、未改変のC、またはmCであると同定される。したがって、本明細書に記載されるようにACE変換を実施することは、配列読み取りを使用して、hmCを含有する位置を、mCまたは未改変のCを含有する位置から識別することを容易にする。ACE変換の例示的な記載については、例えば、Schutsky et al., Nature Biotechnology 2018; 36: 1083-1090を参照されたい。
一部の実施形態では、DNA中の第2のヌクレオベースとは異なるようにDNA中の第1のヌクレオベースに影響を与える手順は、例えば、EM-Seq中と同様の、第1のヌクレオベースの酵素的変換を含む。例えば、www.biorxiv.org/content/10.1101/2019.12.20.884692v1において入手可能なVaisvila R, et al. (2019) EM-seq: Detection of DNA methylation at single base resolution from picograms of DNA. bioRxiv; DOI: 10.1101/2019.12.20.884692を参照されたい。例えば、TET2および必要に応じてT4-βGTが、5mCおよび5hmCを、デアミナーゼ(例えば、APOBEC3A)によって脱アミノ化することができない基質へと変換するために使用され得、次いで、デアミナーゼ(例えば、APOBEC3A)が、未改変のシトシンを脱アミノ化して、それらをウラシルに変換するために使用され得る。一部の実施形態では、5mCおよび/または5hmCが、(例えば、Tet2を使用して)5caCに変換され、次いで、未改変のCが、(例えば、APOBEC3Aを使用して)Uに変換される。次いで、5caC含有DNA(5mCおよび/または5hmCを元々含有するDNAから生成された)が、例えば、抗caC抗体を使用して分配され得る。
一部の実施形態では、第1のヌクレオベースは、改変されたまたは未改変のアデニンであり、第2のヌクレオベースは、改変されたまたは未改変のアデニンである。一部の実施形態では、改変されたアデニンは、N-メチルアデニン(mA)である。一部の実施形態では、改変されたアデニンは、N-メチルアデニン(mA)、N-ヒドロキシメチルアデニン(hmA)またはN-ホルミルアデニン(fA)のうち1つまたは複数である。
メチル化DNA免疫沈降(MeDIP)を含む技法が、改変された塩基、例えば、mC、mA、caC(これは、例えば、デアミナーゼ、例えば、APOBEC3Aを使用する、例えば、未改変のCのUへの酵素的変換の前に、Tet2によるmCまたはhmCの酸化によって生成され得る)またはジヒドロウラシルを含有するDNAを、他のDNAから分離するために使用され得る。例えば、Kumar et al., Frontiers Genet. 2018; 9: 640;Greer et al., Cell 2015; 161: 868-878を参照されたい。mAに特異的な抗体は、Sun et al., Bioessays 2015; 37:1155-62に記載されている。種々の改変されたヌクレオベース、例えば、mC、caC、およびジヒドロウラシルまたはハロゲン化された形態、例えば、5-ブロモウラシルが含まれるチミン/ウラシルの形態に対する抗体は、市販されている。種々の改変された塩基もまた、それらの塩基対合特異性における変更に基づいて検出され得る。例えば、ヒポキサンチンは、脱アミノ化から生じ得るアデニンの改変された形態であり、配列決定ではGと読まれる。例えば、米国特許第8,486,630号;Brown, Genomes, 2nd Ed., John Wiley & Sons, Inc., New York, N.Y., 2002, chapter 14, "Mutation, Repair, and Recombination."を参照されたい。
B.試料を複数の部分試料へと分配するステップ;試料の態様;エピジェネティック特徴の分析
本明細書に記載されるある特定の実施形態では、第1のヌクレオベースと第2のヌクレオベースとに異なるように影響を与える手順の後に、異なる形態の核酸(例えば、高メチル化されたDNAおよび低メチル化されたDNA)の集団は、さらなる分析、例えば、ヌクレオベースをさらに差次的に改変もしくは単離すること、タグ化すること、および/または配列決定することの前に、核酸の1つまたは複数の特徴に基づいて物理的に分配され得る。このアプローチは、例えば、ある特定の配列が高メチル化されているか低メチル化されているかを決定するために使用され得る。一部の実施形態では、分配は、第1のヌクレオベースと第2のヌクレオベースとに異なるように影響を与える手順に供される前の試料中に元々存在した異なる形態の核酸に基づく。一部の実施形態では、分配は、試料の核酸中の、第1のヌクレオベースと第2のヌクレオベースとに異なるように影響を与える手順によって生産された異なる形態の核酸に基づく。
メチル化プロファイリングは、ゲノムの異なる領域にわたってメチル化パターンを決定することを含み得る。例えば、メチル化の程度(例えば、分子1つ当たりのメチル化されたヌクレオベースの相対数)に基づいて分子を分配し、配列決定した後に、異なる分配中の分子の配列は、参照ゲノムにマッピングされ得る。これは、他の領域と比較して、より高度にメチル化されたまたはあまり高度にメチル化されていないゲノムの領域を示し得る。この方法では、ゲノム領域は、個々の分子とは対照的に、メチル化の程度において異なり得る。
一部の実施形態では、メチル化プロファイリングから得られたシグナルを、体細胞バリエーション(例えば、SNV、インデル、CNVおよび遺伝子融合)から得られたシグナルと組み合わせることは、がんの検出を容易にする。
試料中の核酸分子は、核酸分子のメチル化ステータスに基づいて分画または分配され得る。試料中の核酸分子を分配することは、稀なシグナルを増加させることができる。例えば、高メチル化されたDNA中には存在するが、低メチル化されたDNA中にはあまり存在しない(または存在しない)遺伝子バリエーションは、試料を、高メチル化された核酸分子および低メチル化された核酸分子へと分配することによって、より容易に検出することができる。試料の複数の画分を分析することによって、単一の分子の多次元分析を実施することができ、したがって、より高い感度を達成することができる。分配は、1つまたは複数のメチル化されたヌクレオベースの存在または非存在に基づいて、核酸分子をサブセットまたは群へと物理的に分配することを含み得る。試料は、差次的遺伝子発現または疾患状態を示す特徴に基づいて、1つまたは複数の分配されたセットへと分画または分配され得る。試料は、核酸、例えば、無細胞DNA(cfDNA)、非cfDNA、腫瘍DNA、循環腫瘍DNA(ctDNA)および無細胞核酸(cfNA)の分析の間に、正常状態と罹患状態との間でのシグナルにおける差異を提供する特徴またはそれらの組合せに基づいて、分画され得る。
一部の実施形態では、高メチル化可変エピジェネティック標的領域は、腫瘍細胞、もしくは分析されているDNA試料(例えば、cfDNA)に通常は寄与しない型の細胞の高メチル化特徴をそれらが示すかどうかを決定するために分析され、および/または低メチル化可変エピジェネティック標的領域は、腫瘍細胞、もしくは分析されているDNA試料(例えば、cfDNA)に通常は寄与しない型の細胞の低メチル化特徴をそれらが示すかどうかを決定するために分析される。さらに、不均一な核酸集団を分配することによって、例えば、集団の1つの画分(または分配)中でより一般的な、稀な核酸分子を富化することによって、稀なシグナルを増加させ得る。例えば、高メチル化されたDNA中には存在するが、低メチル化されたDNA中にはあまり存在しない(または存在しない)遺伝子バリエーションは、試料を、高メチル化された核酸分子および低メチル化された核酸分子へと分配することによって、より容易に検出することができる。試料の複数の画分を分析することによって、ゲノムの単一の遺伝子座または核酸の種の多次元分析を実施することができ、したがって、より高い感度を達成することができる。
一部の例では、不均一な核酸試料は、2つまたはそれよりも多くの分配(例えば、少なくとも3、4、5、6または7つの分配)へと分配される。一部の実施形態では、各分配は、差次的にタグ化される。次いで、タグ化された分配は、収集的試料調製および/または配列決定のために、一緒にプールされ得る。分配するステップ-タグ化するステップ-プールするステップは、1回よりも多く実施され得、分配の各ラウンドは、異なる特徴(本明細書で提供される例)に基づいて実施され、他の分配から識別される差次的タグと分配手段とを使用してタグ化される。
分配のために使用され得る特徴の例としては、配列長さ、メチル化レベル、ヌクレオソーム結合、配列ミスマッチ、免疫沈降、および/またはDNAに結合するタンパク質が挙げられる。得られた分配は、以下の核酸形態のうち1つまたは複数を含み得る:一本鎖DNA(ssDNA)、二本鎖DNA(dsDNA)、より短いDNA断片およびより長いDNA断片。一部の実施形態では、シトシン改変(例えば、シトシンメチル化)またはメチル化に基づいて分配するステップが一般に実施され、必要に応じて、DNAの上述の特徴または形態のいずれかに基づき得る、少なくとも1回の追加の分配ステップと組み合わされる。一部の実施形態では、核酸の不均一な集団は、1つまたは複数のエピジェネティック改変を有する核酸および1つまたは複数のエピジェネティック改変を有さない核酸へと分配される。エピジェネティック改変の例としては、メチル化の存在または非存在;メチル化のレベル;メチル化の型(例えば、5-メチルシトシン対他の型のメチル化、例えば、アデニンメチル化および/またはシトシンヒドロキシメチル化);ならびに1つまたは複数のタンパク質、例えば、ヒストンとの会合および会合のレベルが挙げられる。あるいはまたはさらに、核酸の不均一な集団は、ヌクレオソームと会合した核酸分子およびヌクレオソームを持たない核酸分子へと分配され得る。あるいはまたはさらに、核酸の不均一な集団は、一本鎖DNA(ssDNA)および二本鎖DNA(dsDNA)へと分配され得る。あるいはまたはさらに、核酸の不均一な集団は、核酸長さ(例えば、最大で160bpの分子、および160bpよりも長い長さを有する分子)に基づいて分配され得る。
一部の例では、各分配(特定の核酸形態が富化された部分試料)は、差次的にタグ化され、分配は、配列決定する前に一緒にプールされる。他の例では、異なる形態は、別々に配列決定される。
一部の実施形態では、異なる核酸の集団は、DNA中の第2のヌクレオベースとは異なるようにDNA中の第1のヌクレオベースに影響を与える手順に供され、第1のヌクレオベースは、改変されたまたは未改変のヌクレオベースであり、第2のヌクレオベースは、第1のヌクレオベースとは異なる改変されたまたは未改変のヌクレオベースであり、第1のヌクレオベースと第2のヌクレオベースとは、同じ塩基対合特異性を有する。次いで、集団は、2つまたはそれよりも多くの異なる分配へと分配される。各分配は、異なる核酸形態で富化され、第1の分配(部分試料とも呼ばれる)は、第2の部分試料よりも高い割合でシトシン改変を有するDNAを含む。各分配は、別個にタグ化される。タグ化された核酸は、配列決定する前に一緒にプールされる。第1および第2の部分試料のうち少なくとも1つのDNA中の第1のヌクレオベースを第2のヌクレオベースからin silicoで識別するためを含めて、配列読み取りが得られ分析される。タグは、異なる分配からの読み取りを選別するために使用される。遺伝的バリアントを検出するための分析は、分配毎のレベルで、および核酸集団全体レベルで実施され得る。例えば、分析には、各分配中の核酸中の遺伝的バリアント、例えば、CNV、SNV、インデル、融合を決定するためのin silico分析が含まれ得る。一部の例では、in silico分析は、クロマチン構造を決定することを含み得る。例えば、配列読み取りのカバレッジは、クロマチン中のヌクレオソームのポジショニングを決定するために使用され得る。より高いカバレッジは、ゲノム領域中のより高いヌクレオソーム占有と相関し得るが、より低いカバレッジは、より低いヌクレオソーム占有またはヌクレオソーム枯渇領域(NDR)と相関し得る。
試料は、ヌクレオチドに対する複製後改変が含まれる改変、および1つまたは複数のタンパク質への、通常は非共有結合的な結合が変動する核酸を含み得る。
ある実施形態では、核酸の集団は、新生物、腫瘍もしくはがんを有すると疑われる対象、または新生物、腫瘍もしくはがんと以前に診断された対象由来の血清、血漿または血液試料から得られる。核酸の集団は、変動するレベルのメチル化を有する核酸を含む。メチル化は、任意の1つまたは複数の複製後または転写後改変から生じ得る。複製後改変としては、特に、ヌクレオベースの5位におけるシトシンの改変、例えば、5-メチルシトシン、5-ヒドロキシメチルシトシン、5-ホルミルシトシンおよび5-カルボキシルシトシンが挙げられる。試料内の核酸の集団を分配するために使用される薬剤は、親和性薬剤、例えば、所望の特異性を有する抗体、天然の結合パートナーもしくはそれらのバリアント(Bock et al., Nat Biotech 28: 1106-1114 (2010);Song et al., Nat Biotech 29: 68-72 (2011))、または所与の標的に対する特異性を有するように、例えばファージディスプレイによって選択された人工ペプチドであり得る。一部の実施形態では、分配において使用される薬剤は、改変されたヌクレオベースを認識する薬剤である。一部の実施形態では、薬剤によって認識される改変されたヌクレオベースは、改変されたシトシン、例えば、メチルシトシン(例えば、5-メチルシトシン)である。一部の実施形態では、薬剤によって認識される改変されたヌクレオベースは、試料のDNA中の第2のヌクレオベースとは異なるようにDNA中の第1のヌクレオベースに影響を与える手順の産物である。一部の実施形態では、改変されたヌクレオベースは、「変換されたヌクレオベース」であり得、これは、その塩基対合特異性が手順によって変化させられたことを意味する。例えば、ある特定の手順は、メチル化されていないもしくは未改変のシトシンをジヒドロウラシルに変換し、またはより一般には、少なくとも1つの改変されたもしくは未改変の形態のシトシンが、脱アミノ化を受けて、ウラシル(DNAの文脈では改変されたヌクレオベースとみなされる)もしくはさらなる改変された形態のウラシルを生じる。分配剤の例としては、抗体、例えば、改変されたシトシン、例えば、メチルシトシン(例えば、5-メチルシトシン)であり得る改変されたヌクレオベースを認識する抗体が挙げられる。一部の実施形態では、分配剤は、5-メチルシトシン以外の改変されたシトシン、例えば、5-カルボキシルシトシン(5caC)を認識する抗体である。代替的分配剤としては、メチル結合ドメイン(MBD)、例えば、MBD2、およびMeCP2などのタンパク質が含まれる、本明細書に記載されるメチル結合タンパク質(MBP)が挙げられる。
分配剤の追加の非限定的な例は、ヒストンに結合した核酸を、遊離核酸または未結合の核酸から分離することができる、ヒストン結合タンパク質である。本明細書で開示される方法において使用され得るヒストン結合タンパク質の例としては、RBBP4、RbAp48およびSANTドメインペプチドが挙げられる。
特定の核酸への分配剤の結合、および部分試料への核酸の分配は、ある特定の程度まで生じ得る、または本質的に二元(binary)の様式で生じ得る。一部の例では、より高い割合のある特定の改変を含む核酸は、より低い割合の改変を含む核酸よりも高い程度まで、この薬剤に結合する。同様に、分配は、ある特定の改変を含む核酸のより高い割合およびより低い割合を含む、部分試料を生成し得る。あるいは、分配は、改変を含む核酸の本質的に全てを含むまたはかかる核酸を含まない部分試料を生成し得る。全ての例では、種々のレベルの改変が、分配剤から順次溶出され得る。
一部の実施形態では、分配は、二元分配および改変の程度/レベルに基づく分配の両方を含み得る。例えば、メチル化された断片は、メチル化DNA免疫沈降(MeDIP)によって分配され得、または全てのメチル化された断片は、メチル結合ドメインタンパク質(例えば、MethylMinder Methylated DNA Enrichment Kit(ThermoFisher Scientific))を使用して、メチル化されていない断片から分配され得る。引き続いて、追加の分配は、メチル結合ドメインおよび結合した断片を含む溶液中の塩濃度を調整することによって、異なるレベルのメチル化を有する断片を溶出させることを含み得る。塩濃度が増加すると、より高いメチル化レベルを有する断片が溶出される。
一部の例では、最終分配は、異なる程度の改変(改変を過剰提示するまたは過少提示する)を有する核酸が富化されている。過剰提示および過少提示は、集団中の鎖1つ当たりの改変の中央値数と比較した、核酸によって生み出された改変の数によって定義され得る。例えば、試料中の核酸中の5-メチルシトシン残基の中央値数が2である場合、2つよりも多くの5-メチルシトシン残基を含む核酸は、この改変が過剰提示され、1またはゼロ個の5-メチルシトシン残基を有する核酸は、過少提示される。親和性分離の効果は、結合相中の改変が過剰提示された核酸および未結合相中(すなわち、溶液中)の改変が過少提示された核酸を富化することである。結合相中の核酸は、引き続く処理の前に溶出され得る。
MeDIPまたはMethylMiner Methylated DNA Enrichment Kit(ThermoFisher Scientific)を使用する場合、種々のレベルのメチル化が、順次の溶出を使用して分配され得る。例えば、低メチル化された分配(メチル化なし)は、核酸集団を、磁気ビーズに結合された、このキット由来のMBDと接触させることによって、メチル化された分配から分離され得る。ビーズが、メチル化された核酸を非メチル化核酸から分離するために使用される。引き続いて、1回または複数の溶出ステップが、異なるレベルのメチル化を有する核酸を溶出させるために、順次実施される。例えば、メチル化された核酸の第1のセットは、160mMまたはそれよりも高い塩濃度、例えば、少なくとも150mM、少なくとも200mM、300mM、400mM、500mM、600mM、700mM、800mM、900mM、1000mMまたは2000mMの塩濃度で溶出され得る。かかるメチル化された核酸が溶出された後、磁気分離が、より高いレベルのメチル化された核酸を、より低いレベルのメチル化を有する核酸から分離するために、もう一度使用される。溶出ステップおよび磁気分離ステップは、種々の分配、例えば、低メチル化された分配(メチル化を含まない核酸が富化されている)、メチル化された分配(低レベルのメチル化を含む核酸が富化されている)、および高メチル化された分配(高レベルのメチル化を含む核酸が富化されている)を創出するために反復され得る。
一部の方法では、親和性分離ベースの分配に使用される薬剤に結合した核酸は、洗浄ステップに供される。洗浄ステップは、親和性薬剤に弱く結合した核酸を洗浄して除く。かかる核酸は、平均または中央値(すなわち、試料と薬剤との最初の接触の際の、固相に結合したままの核酸と固相に結合していない核酸との間の中間)に近い程度まで改変を有する核酸が富化され得る。
親和性分離は、異なる程度の改変を有する核酸の、少なくとも2つ、ときどきは3つまたはそれよりも多くの分配を生じる。これらの分配はまだ別々であるが、少なくとも1つの分配の核酸、通常は2つもしくは3つ(またはそれよりも多くの)分配の核酸は、アダプターの構成要素として通常は提供される核酸タグに連結され、異なる分配中の核酸は、1つの分配のメンバーを別の分配から識別する異なるタグを受ける。同じ分配の核酸分子に連結されたタグは、互いに同じまたは異なり得る。しかし、互いに異なる場合、これらのタグは、それらが結合される分子を特定の分配のものであると同定するために、それらのコードの一部を共通して有し得る。
メチル化などの特徴に基づいて核酸試料を分割することに関するさらなる詳細については、これにより参照により本明細書に組み込まれるWO2018/119452を参照されたい。
一部の実施形態では、核酸分子は、特異的タンパク質またはその断片に結合している核酸分子およびその特異的タンパク質またはその断片に結合していない核酸分子に基づいて、異なる分配へと分画され得る。
核酸分子は、DNA-タンパク質結合に基づいて分画され得る。タンパク質-DNA複合体は、タンパク質の特定の特性に基づいて分画され得る。かかる特性の例としては、種々のエピトープ、改変(例えば、ヒストンメチル化またはアセチル化)または酵素活性が挙げられる。DNAに結合し得、分画のための基礎として機能し得るタンパク質の例としては、これらに限定されないが、プロテインAおよびプロテインGが挙げられ得る。任意の適切な方法が、タンパク質結合した領域に基づいて核酸分子を分画するために使用され得る。タンパク質結合した領域に基づいて核酸分子を分画するために使用される方法の例としては、これらに限定されないが、SDS-PAGE、クロマチン-免疫沈降(ChIP)、ヘパリンクロマトグラフィーおよび非対称フィールドフロー分画(asymmetrical field flow fractionation)(AF4)が挙げられる。
一部の実施形態では、複数の部分試料への試料の分配は、核酸を、DNA中の、改変されたシトシン、または試料のDNA中の第2のヌクレオベースとは異なるようにDNA中の第1のヌクレオベースに影響を与える手順の産物であり得る、改変されたヌクレオベースを認識する抗体と接触させることによって、実施される。一部の実施形態では、改変されたヌクレオベースは、5mCである。一部の実施形態では、改変されたヌクレオベースは、5caCである。一部の実施形態では、改変されたヌクレオベースは、ジヒドロウラシル(DHU)である。一部の実施形態では、DNA中の改変されたヌクレオベースを認識する抗体は、一本鎖DNAを分配するために使用される。
一部の実施形態では、分配は、核酸を、メチル結合タンパク質(「MBP」)のメチル結合ドメイン(「MBD」)と接触させることによって実施される。一部のかかる実施形態では、核酸は、MBP全体と接触させられる。一部の実施形態では、MBDは、5-メチルシトシン(5mC)に結合し、MBPは、MBDを含み、本明細書で相互交換可能に、メチル結合タンパク質またはメチル結合ドメインタンパク質と呼ばれる。一部の実施形態では、MBDは、ビオチンリンカーを介して、常磁性ビーズ、例えば、Dynabeads(登録商標)M-280ストレプトアビジンにカップリングされる。異なる程度のメチル化を有する画分への分配は、NaCl濃度を増加させることによって画分を溶出させることによって実施され得る。
一部の実施形態では、結合したDNAは、抗体またはMBDを、プロテアーゼ、例えば、プロテイナーゼKと接触させることによって、溶出される。これは、上で議論したNaClを使用する溶出ステップの代わりに、またはかかる溶出ステップに加えて、実施され得る。
本明細書で企図される改変されたヌクレオベースを認識する薬剤の例としては、これらに限定されないが、以下が挙げられる:
(a)MeCP2は、未改変のシトシンよりも5-メチル-シトシンに優先的に結合するタンパク質である。
(b)RPL26、PRP8およびDNAミスマッチ修復タンパク質MHS6は、未改変のシトシンよりも5-ヒドロキシメチル-シトシンに優先的に結合する。
(c)FOXK1、FOXK2、FOXP1、FOXP4およびFOXI3は、好ましくは、未改変のシトシンよりも5-ホルミル-シトシンに結合する(Iurlaro et al., Genome Biol. 14: R119 (2013))。
(d)1つもしくは複数のメチル化されたもしくは改変されたヌクレオベースまたはそれらの変換産物、例えば、5mC、5caCもしくはDHUに特異的な抗体。
一般に、溶出は、1分子当たりのメチル化された部位の数の関数であり、より多くのメチル化を有する分子は、増加した塩濃度の下で溶出する。メチル化の程度に基づいてDNAを別個の集団へと溶出させるために、漸増するNaCl濃度の一連の溶出緩衝液を使用することができる。塩濃度は、約100nm~約2500mMのNaClの範囲であり得る。一実施形態では、処理は、3つの分配を生じる。分子は、第1の塩濃度の、改変されたヌクレオベースを認識する薬剤を含む分子を含む溶液と接触させられ、この分子は、捕捉部分、例えば、ストレプトアビジンに結合され得る。第1の塩濃度では、分子のある集団が薬剤に結合し、ある集団は未結合のままである。未結合の集団は、「低メチル化された」集団として分離され得る。例えば、低メチル化された形態のDNAが富化された第1の分配は、低い塩濃度、例えば、100mMまたは160mMで未結合のままである分配である。中間のメチル化されたDNAが富化された第2の分配は、中間の塩濃度、例えば、100mMと2000mMとの間の濃度を使用して溶出される。これもまた、試料から分離される。高メチル化された形態のDNAが富化された第3の分配は、高い塩濃度、例えば、少なくとも約2000mMを使用して溶出される。
一部の実施形態では、本明細書に記載される方法は、少なくとも1つの部分試料を複数のさらなる部分試料へと分配するステップをさらに含む。例えば、バイサルファイト変換の後、試料が、ウラシルを含むDNA、mCを含むDNA、およびシトシン5-メチレンスルホネート(CMS)を含むDNAを含む場合、この方法は、試料のDNAがCMSを認識する薬剤と接触させられる第1の分配ステップ、および第2の部分試料のDNAがmCを認識する薬剤(例えば、抗体)と接触させられる第2の分配ステップを含み得る。図3Aを参照されたい。かかる試料は、mCおよびhmCを含むDNAを、5mCに影響を与えることなしにhmCをCMSに変換し、メチル化されていないCをUに変換するバイサルファイト変換に供することによって、調製され得る。かかる実施形態では、第1の部分試料、第1のさらなる部分試料および第2のさらなる部分試料が提供され(このとき、第1のさらなる部分試料と第2のさらなる部分試料とは、一緒になって第2の部分試料を構成する)、第1の部分試料は、さらなる部分試料よりも高い割合でCMSを有するDNAを含み、第1のさらなる部分試料は、第2のさらなる部分試料よりも高い割合でmCを有するDNAを含む。かかる実施形態では、1つまたは複数のさらなる部分試料(または全てのさらなる部分試料)のDNAを配列決定することは、第2の部分試料のDNAを配列決定することとみなされる。
別の例では、T4-βGTグリコシル化およびバイサルファイト変換の後、試料が、ウラシルを含むDNA、mCを含むDNA、およびhmCまたはghmCを含むDNAを含む場合、この方法は、試料のDNAがhmCおよびghmCを認識する薬剤(例えば、抗体)と接触させられる第1の分配ステップ、および第2の部分試料のDNAがmCを認識する薬剤と接触させられる第2の分配ステップを含み得る。図3Bを参照されたい。かかる試料は、5mCおよび5hmCを含むDNAを、T4-βGTグリコシル化ステップとその後のバイサルファイト変換とに供することによって、調製され得る。かかる実施形態では、第1の部分試料、第1のさらなる部分試料および第2のさらなる部分試料が提供され(このとき、第1のさらなる部分試料と第2のさらなる部分試料とは、一緒になって第2の部分試料を構成する)、第1の部分試料は、さらなる部分試料よりも高い割合でhmCまたはghmCを有するDNAを含み、第1のさらなる部分試料は、第2のさらなる部分試料よりも高い割合でmCを有するDNAを含む。かかる実施形態では、1つまたは複数のさらなる部分試料(または全てのさらなる部分試料)のDNAを配列決定することは、第2の部分試料のDNAを配列決定することとみなされる。
C.分配のタグ化
一部の実施形態では、2つまたはそれよりも多くの分配、例えば、各分配は、差次的にタグ化される。DNA分子を「タグ化すること」は、タグがDNA分子に結合されるまたはそれと会合される手順である。タグは、タグが会合した分子の特色を示す情報を含む、核酸などの分子であり得る。例えば、分子は、試料タグ(これは、1つの試料中の分子を異なる試料中の分子から識別する)、分配タグ(これは、1つの分配中の分子を異なる分配中の分子から識別する)または分子タグ/分子バーコード/バーコード(これは、異なる分子を互いから識別する(独自のタグ化シナリオおよび非独自のタグ化シナリオの両方において))を保有し得る。ある特定の実施形態では、タグは、バーコードのうち1つまたは組合せを含み得る。本明細書で使用される場合、用語「バーコード」は、文脈に依存して、特定のヌクレオチド配列を有する核酸分子、またはヌクレオチド配列自体を指す。バーコードは、例えば、10ヌクレオチドと100ヌクレオチドとの間を有し得る。バーコードの収集は、特定の目的のために所望される場合、縮重配列を有し得る、またはある特定のハミング距離を有する配列を有し得る。したがって、例えば、分子バーコードは、1つのバーコード、または各々が分子の異なる末端に結合した2つのバーコードの組合せから構成され得る。さらにまたはあるいは、異なる分配および/または試料について、バーコードが、それらの個々の配列を介して分子タグとして機能し、それらがそのメンバーであるセット基づいて、それらが対応する分配および/または試料を同定するようにも機能するように、分子バーコードまたは分子タグの異なるセットが使用され得る。バーコードを含むタグは、アダプター中に取り込まれ得るまたはアダプターに他の方法で接続され得る。タグは、他の方法の中でも、ライゲーション、重複伸長PCRによって取り込まれ得る。
タグ化戦略は、独自のタグ化戦略および非独自のタグ化戦略へと分割され得る。独自のタグ化では、試料中の分子の全てまたは実質的に全てが、異なるタグを保有し、その結果、読み取りは、タグ情報単独に基づいて、元の分子に割り当てられ得る。かかる方法において使用されるタグは、ときどき、「独自のタグ」と呼ばれる。非独自のタグ化では、同じ試料中の異なる分子は、同じタグを保有し得、その結果、タグ情報に加えた他の情報が、配列読み取りを元の分子に割り当てるために使用される。かかる情報には、開始および停止座標、分子がマッピングされる座標、開始または停止座標単独などが含まれ得る。かかる方法において使用されるタグは、ときどき、「非独自のタグ」と呼ばれる。したがって、試料中の全ての分子を独自にタグ化する必要はない。これは、試料内の、同定可能なクラス内に入る分子を独自にタグ化するのに十分である。したがって、異なる同定可能なファミリー中の分子は、タグ化された分子の正体についての情報の喪失なしに、同じタグを保有することができる。
非独自のタグ化のある特定の実施形態では、使用される異なるタグの数は、特定の群の全ての分子が異なるタグを保有する非常に高い可能性(例えば、少なくとも99%、少なくとも99.9%、少なくとも99.99%または少なくとも99.999%)が存在するのに十分であり得る。バーコードがタグとして使用される場合、およびバーコードが、分子の両方の末端に、例えばランダムに結合される場合、バーコードの組合せが一緒になってタグを構成し得ることに留意すべきである。項中のこの数は、コールに入る分子の数の関数である。例えば、クラスは、参照ゲノム上の同じ開始-停止位置にマッピングされる全ての分子であり得る。クラスは、特定の遺伝子座、例えば、特定の塩基または特定の領域(例えば、最大で100塩基、または遺伝子、または遺伝子のエクソン)にわたってマッピングされる全ての分子であり得る。ある特定の実施形態では、クラス中のいくつかの分子を独自に同定するために使用される異なるタグの数zは、2z、3z、4z、5z、6z、7z、8z、9z、10z、11z、12z、13z、14z、15z、16z、17z、18z、19z、20zまたは100zのいずれか(例えば、下限)と100,000z、10,000z、1000zまたは100zのいずれか(例えば、上限)との間であり得る。
例えば、約5ng~30ngの無細胞DNAの試料中、おおよそ3000個の分子が特定のヌクレオチド座標にマッピングされ、約3個と10個との間の分子が、同じ停止座標を共有するように、任意の開始座標を有すると予想される。したがって、約50~約50,000個の異なるタグ(例えば、約6個と220個との間のバーコード組合せ)が、全てのかかる分子を独自にタグ化するのに十分であり得る。ヌクレオチド座標にわたってマッピングされる3000個全ての分子を独自にタグ化するために、約百万~約2千万個の異なるタグが要求される。
一般に、反応における独自のまたは非独自のタグバーコードの割り当ては、米国特許出願第20010053519号、同第20030152490号、同第20110160078号ならびに米国特許第6,582,908号および米国特許第7,537,898号および米国特許第
9,598,731号によって記載される方法および系に従う。タグは、試料核酸に、ランダムにまたは非ランダムに連結され得る。
一部の実施形態では、タグ化された核酸は、マイクロウェルプレート中に充填した後に配列決定される。マイクロウェルプレートは、96、384または1536個のマイクロウェルを有し得る。一部の場合には、これらは、独自のタグのマイクロウェルに対する予想された比で、導入される。例えば、約1、2、3、4、5、6、7、8、9、10、20、50、100、500、1000、5000、10000、50,000、100,000、500,000、1,000,000、10,000,000、50,000,000または1,000,000,000個よりも多くの独自のタグがゲノム試料1つ当たり充填されるように、独自のタグが充填され得る。一部の場合には、約2、3、4、5、6、7、8、9、10、20、50、100、500、1000、5000、10000、50,000、100,000、500,000、1,000,000、10,000,000、50,000,000または1,000,000,000個未満の独自のタグがゲノム試料1つ当たり充填されるように、独自のタグが充填され得る。一部の場合には、試料ゲノム1つ当たり充填される独自のタグの平均数は、ゲノム試料1つ当たり、約1、2、3、4、5、6、7、8、9、10、20、50、100、500、1000、5000、10000、50,000、100,000、500,000、1,000,000、10,000,000、50,000,000もしくは1,000,000,000個未満のまたはそれよりも多い、独自のタグである。
好ましい形式は、標的核酸の両方の末端にライゲーションされた20~50個の異なるタグ(例えば、バーコード)を使用する。例えば、標的分子の両方の末端にライゲーションされた35個の異なるタグ(例えば、バーコード)は、35×35の順列を創出し、これは、35個のタグについて1225と等しい。同じ開始点および停止点を有する異なる分子が、タグの異なる組合せを受ける高い確率(例えば、少なくとも94%、99.5%、99.99%、99.999%)を有するには、かかる数のタグが十分である。他のバーコード組合せには、10と500との間の任意の数、例えば、約15×15、約35×35、約75×75、約100×100、約250×250、約500×500が含まれる。
一部の場合には、独自のタグは、所定のまたはランダムなまたは半ランダムな配列オリゴヌクレオチドであり得る。他の場合には、バーコードがその複数中で互いに独自である必要が必ずしもない、複数のバーコードが使用され得る。この例では、バーコードとそれがライゲーションされ得る配列との組合せが、個々に追跡され得る独自の配列を創出するように、バーコードは、個々の分子にライゲーションされ得る。本明細書に記載されるように、配列読み取りの始まり(開始)および終わり(停止)の位置の配列データと組み合わせた非独自のバーコードの検出は、特定の分子への独自の正体の割り当てを可能にし得る。個々の配列読み取りの長さまたは塩基対の数もまた、独自の正体をかかる分子に割り当てるために使用され得る。それにより、本明細書に記載されるように、独自の正体が割り当てられた核酸の単一の鎖由来の断片は、親鎖由来の断片の引き続く同定を可能にし得る。
タグは、タグ(単数または複数)を特定の分配に相関付けるように個々のポリヌクレオチド集団分配を標識するために使用され得る。あるいは、タグは、分配するステップを用いない本発明の実施形態において使用され得る。一部の実施形態では、単一のタグが、特定の分配を標識するために使用され得る。一部の実施形態では、複数の異なるタグが、特定の分配を標識するために使用され得る。特定の分配を標識するために複数の異なるタグを用いる実施形態では、1つの分配を標識するために使用されるタグのセットは、他の分配を標識するために使用されるタグのセットについて容易に差別化され得る。一部の実施形態では、タグは、追加の機能を有し得る、例えば、タグは、試料供給源にインデックスを付けるために使用され得、または独自の分子識別子(これは、例えば、Kinde et al., Proc Nat'l Acad Sci USA 108: 9530-9535 (2011)、Kou et al., PLoS ONE,11: e0146638 (2016)にあるように、配列決定エラーを突然変異から差別化することによって、配列決定データの品質を改善するために使用され得る)として使用され得、または例えば米国特許第9,598,731号に記載されるように、非独自の分子識別子として使用され得る。同様に、一部の実施形態では、タグは、追加の機能を有し得、例えば、タグは、試料供給源にインデックスを付けるために使用され得る、または非独自の分子識別子(これは、配列決定エラーを突然変異から差別化することによって、配列決定データの品質を改善するために使用され得る)として使用され得る。
一実施形態では、分配のタグ化は、各分配中の分子を分配タグでタグ化することを含む。分配を再度組み合わせ(例えば、必要な配列決定ランの数を低減させ、不必要なコストを回避するため)、分子を配列決定した後に、分配タグは、供給源分配を同定する。別の実施形態では、異なる分配は、例えば、バーコードの対から構成される、分子タグの異なるセットでタグ化される。この方法では、各分子バーコードは、供給源分配を示すだけでなく、分配内の分子を識別するためにも有用である。例えば、35個のバーコードの第1のセットが、第1の分配中の分子をタグ化するために使用され得、35個のバーコードの第2のセットが、第2の分配中の分子をタグ化するために使用され得る。
一部の実施形態では、分配し、分配タグでタグ化した後、分子は、単一のランでの配列決定のためにプールされ得る。一部の実施形態では、試料タグが、例えば、分配タグの付加およびプールに引き続くステップにおいて、分子に付加される。試料タグは、単一の配列決定ランでの配列決定のために、複数の試料から生成された材料をプールすることを容易にし得る。
あるいは、一部の実施形態では、分配タグは、試料ならびに分配に相関付けられ得る。単純な例として、第1のタグは、第1の試料の第1の分配を示し得;第2のタグは、第1の試料の第2の分配を示し得;第3のタグは、第2の試料の第1の分配を示し得;第4のタグは、第2の試料の第2の分配を示し得る。
タグは、1つまたは複数の特徴に基づいて既に分配された分子に結合され得るが、ライブラリー中の最終的なタグ化された分子は、その特徴をもはや有さない場合がある。例えば、一本鎖DNA分子が分配およびタグ化され得るが、ライブラリー中の最終的なタグ化された分子は、二本鎖である可能性が高い。同様に、DNAは、異なるレベルのメチル化に基づいた分配に供され得るが、最終ライブラリー中では、これらの分子に由来するタグ化された分子は、メチル化されていない可能性が高い。したがって、ライブラリー中の分子に結合されたタグは、典型的には、最終的なタグ化された分子が由来する「親分子」の特徴を示すが、タグ化された分子自体の特徴は必ずしも示さない。
一例として、バーコード1、2、3、4などは、第1の分配中の分子をタグ化および標識化するために使用され;バーコードA、B、C、Dなどは、第2の分配中の分子をタグ化および標識化するために使用され;バーコードa、b、c、dなどは、第3の分配中の分子をタグ化および標識化するために使用される。差次的にタグ化された分配は、配列決定前にプールされ得る。差次的にタグ化された分配は、別々に配列決定され得る、または例えばIlluminaシーケンサーの同じフローセルにおいて並列で一緒に配列決定され得る。
配列決定後、遺伝的バリアントを検出するための読み取りの分析は、分配毎のレベルで、ならびに核酸集団全体レベルで実施され得る。タグは、異なる分配からの読み取りを選別するために使用される。分析には、配列情報、ゲノム座標長さ、カバレッジおよび/またはコピー数を使用して遺伝子バリエーションおよびエピジェネティックバリエーション(メチル化、クロマチン構造などのうち1つまたは複数)を決定するためのin silico分析が含まれ得る。一部の実施形態では、より高いカバレッジは、ゲノム領域中のより高いヌクレオソーム占有と相関し得るが、より低いカバレッジは、より低いヌクレオソーム占有またはヌクレオソーム枯渇領域(NDR)と相関し得る。
分配手順は、部分試料間でのDNA分子の不完全な選別を生じ得る。例えば、第2の部分試料中の分子の少数は、高度に改変され得(例えば、高メチル化され得)、および/または第1の部分試料中の分子の少数は、未改変または大部分が未改変であり得る(例えば、メチル化されていないまたは大部分がメチル化されていない場合がある)。第2の部分試料中の高度に改変された分子および第1の部分試料中の未改変または大部分が未改変の分子は、非特異的に分配されたとみなされる。本明細書に記載される方法は、例えば、非特異的に分配されたDNAが配列決定後に同定され得るようにある特定の塩基を変換することによって、および/またはそれを分解することによって、非特異的に分配されたDNAからの技術的ノイズを低減させることができるステップを含む。したがって、本明細書に記載される方法は、改善された感度および/または能率化された分析を提供することができる。
D.改変された核酸の分析の代替的方法
一部の実施形態では、アダプターは、核酸を分配した後に核酸に付加され、他の実施形態では、アダプターは、核酸を分配する前に核酸に付加され得る。一部のかかる方法では、分配する前に、核酸は、DNA中の第2のヌクレオベースとは異なるようにDNA中の第1のヌクレオベースに影響を与える手順に供され、第1のヌクレオベースは、改変されたまたは未改変のヌクレオベースであり、第2のヌクレオベースは、第1のヌクレオベースとは異なる改変されたまたは未改変のヌクレオベースであり、第1のヌクレオベースと第2のヌクレオベースとは、同じ塩基対合特異性を有する。
一部の実施形態では、試料を、第2のヌクレオベースとは異なるようにDNA中の第1のヌクレオベースに影響を与える手順に供するステップ、および試料を複数の部分試料へと分配するステップの後に、第1のアダプターが、一本鎖DNAへのライゲーションが含まれ得る、その3’末端へのライゲーションによって、核酸に付加される。アダプターは、例えば、ユニバーサルプライマーおよびDNAポリメラーゼを使用する第2鎖合成のためのプライミング部位として使用され得る。次いで、第2のアダプターは、今度は二本鎖分子の第2鎖の少なくとも3’末端にライゲーションされ得る。一部の実施形態では、第1のアダプターは、親和性タグ、例えば、ビオチンを含み、第1のアダプターにライゲーションされた核酸は、親和性タグに対する結合パートナー、例えば、ストレプトアビジンを含み得る固体支持体(例えば、ビーズ)に結合される。かかる手順のさらなる議論については、Gansauge et al., Nature Protocols 8:737-748 (2013)を参照されたい。一本鎖核酸と適合性のライブラリー調製物を配列決定するための市販のキット、例えば、Swift BiosciencesのAccel-NGS(登録商標)Methyl-Seq DNA Library Kitが、入手可能である。一部の実施形態では、アダプターライゲーションの後、核酸は増幅される。一部の実施形態では、アダプターライゲーションの後、部分試料の核酸はプールされ;使用される場合には、増幅が、プールするステップの前または後に実施され得る。
一部の方法では、異なる程度までの改変(例えば、核酸分子1つ当たり0、1、2、3、4、5つまたはそれよりも多くのメチル基)を保有する核酸の集団は、改変の程度に依存して、集団の分画前にアダプターと接触させられる。アダプターは、集団中の核酸分子の一方の末端または両方の末端のいずれかに結合する。
好ましくは、アダプター(分配の前に添加されても後に添加されても)は、タグの組合せの数が低い確率を生じるのに十分な数の異なるタグを含み、例えば、同じ開始点および停止点を有する2つの核酸の95、99または99.9%が、タグの同じ組合せを受ける。アダプターは、同じタグを保有していても異なるタグを保有していても、同じまたは異なるプライマー結合部位を含み得るが、好ましくは、アダプターは、同じプライマー結合部位を含む。
一部の実施形態では、アダプターの結合の後、核酸は、改変を保有する核酸に優先的に結合する薬剤(例えば、以前に記載されたかかる薬剤)と接触させられる。核酸は、核酸が薬剤への結合からの改変を保有する程度が異なる少なくとも2つの部分試料へと分配される。例えば、薬剤が、改変を保有する核酸に対して親和性を有する場合、(集団における中央値提示と比較して)改変が過剰提示される核酸は、薬剤に優先的に結合するが、改変が過少提示される核酸は、薬剤に結合しない、または薬剤からより容易に溶出される。次いで、核酸は、アダプター内のプライマー結合部位に結合するプライマーから増幅される。次いで、増幅の後、異なる分配は、さらなる(例えば、クローン性)増幅、および並行してはいるが別々の配列分析が典型的には含まれる、さらなる処理ステップに供され得る。次いで、異なる分配からの配列データが比較され得る。
別の実施形態では、分配スキームは、以下の例示的な手順を使用して実施され得る。核酸は、DNA中の第2のヌクレオベースとは異なるようにDNA中の第1のヌクレオベースに影響を与える手順に供され、第1のヌクレオベースは、改変されたまたは未改変のヌクレオベースであり、第2のヌクレオベースは、第1のヌクレオベースとは異なる改変されたまたは未改変のヌクレオベースであり、第1のヌクレオベースと第2のヌクレオベースとは、同じ塩基対合特異性を有する。核酸は、プライマー結合部位およびタグを含むY型アダプターに、両方の末端において連結される。分子は増幅される。次いで、増幅された分子は、5-メチルシトシンに優先的に結合する抗体との接触によって分画されて、2つの分配を生産する。一方の分配は、メチル化を欠如する元の分子と、メチル化が喪失された増幅コピーとを含む。他方の分配は、メチル化を有する元のDNA分子を含む。次いで、2つの分配は、メチル化された分配のさらなる増幅を伴って、別々に処理および配列決定される。次いで、2つの分配の配列データが比較され得る。この例では、同じ開始点および停止点を有する読み取りが同じ分子に基づくか異なる分子に基づくかを決定することができるように、タグは、メチル化されたDNAとメチル化されていないDNAとの間を識別するためには使用されないが、これらの分配内の異なる分子間を識別するためには使用される。
本開示は、核酸の少なくとも一部が、1つまたは複数の改変されたシトシン残基、例えば、5-メチルシトシン、および以前に記載された他の改変のいずれかを含む、核酸の集団を分析するためのさらなる方法を提供する。これらの方法では、核酸分子は、DNA中の第2のヌクレオベースとは異なるようにDNA中の第1のヌクレオベースに影響を与える手順に供され、第1のヌクレオベースは、5位において改変されたシトシンを含み、第2のヌクレオベースは、未改変のシトシンを含む。この手順は、バイサルファイト処理、または未改変のシトシンをウラシルに変換する別の手順であり得る。次いで、手順に供された核酸は分配され、次いで、核酸の部分試料は、5C位において改変された1つまたは複数のシトシン残基、例えば、5-メチルシトシンを含むアダプターと接触させられる。好ましくは、かかるアダプター中の全てのシトシン残基もまた改変され、またはアダプターのプライマー結合領域中の全てのかかるシトシンが改変される。アダプターは、集団中の核酸分子の両方の末端に結合する。好ましくは、アダプターは、タグの組合せの数が低い確率を生じるのに十分な数の異なるタグを含み、例えば、同じ開始点および停止点を有する2つの核酸の95、99または99.9%が、タグの同じ組合せを受ける。かかるアダプター中のプライマー結合部位は、同じでも異なってもよいが、好ましくは同じである。アダプターの結合の後、核酸は、アダプターのプライマー結合部位に結合するプライマーから増幅される。増幅された核酸は、第1および第2のアリコートへと分割される。第1のアリコートは、さらなる処理ありまたはなしで、配列データについてアッセイされる。したがって、第1のアリコート中の分子に関する配列データは、核酸分子の初期のメチル化状態とは無関係に決定される。アダプターに元々連結された核酸分子のみが(その増幅産物とは別個のものとして)ここで増幅可能であるが、それは、これらの核酸は、アダプターのプライマー結合部位中にシトシンを保持するが、増幅産物は、これらのシトシン残基のメチル化を喪失し、バイサルファイト処理においてウラシルへの変換を受けているからである。したがって、その少なくとも一部がメチル化された、集団中の元の分子のみが、増幅を受ける。増幅後、これらの核酸は、配列分析に供される。第1および第2のアリコートから決定された配列の比較は、とりわけ、核酸集団中のどのシトシンがメチル化に供されたかを示し得る。
かかる分析は、以下の例示的な手順を使用して実施され得る。分配の後、メチル化されたDNAは、プライマー結合部位およびタグを含むY型アダプターに、両方の末端において連結される。アダプターの結合の後、DNA分子は増幅される。増幅産物は、変換ありまたはなしでの配列決定のために、2つのアリコートへと分割される。変換に供されていないアリコートは、さらなる処理ありまたはなしで、配列分析に供され得る。他方のアリコートは、DNA中の第2のヌクレオベースとは異なるようにDNA中の第1のヌクレオベースに影響を与える手順に供され、第1のヌクレオベースは、5位において改変されたシトシンを含み、第2のヌクレオベースは、未改変のシトシンを含む。この手順は、バイサルファイト処理、または未改変のシトシンをウラシルに変換する別の手順であり得る。元のプライマー結合部位に特異的なプライマーと接触させられた場合、シトシンの改変によって保護されたプライマー結合部位のみが、増幅を支持し得る。したがって、第1の増幅からのコピーではなく元の分子のみが、さらなる増幅に供される。次いで、さらに増幅された分子は、配列分析に供される。次いで、2つのアリコートからの配列が比較され得る。上で議論した分離スキームと同様に、アダプター中の核酸タグは、メチル化されたDNAとメチル化されていないDNAとの間を識別するためには使用されないが、同じ分配内の核酸分子を識別するためには使用される。
E.富化/捕捉するステップ;増幅;アダプター;バーコード
一部の実施形態では、本明細書で開示される方法は、DNA、例えば、cfDNAの標的領域の1つまたは複数のセットを捕捉するステップを含む。捕捉は、当該分野で公知の任意の適切なアプローチを使用して実施され得る。
一部の実施形態では、捕捉するステップは、捕捉されるDNAを標的特異的プローブのセットと接触させるステップを含む。標的特異的プローブのセットは、上に示される実施形態および以下のプローブに関するセクション中が含まれるがこれらに限定されない、標的特異的プローブのセットについての本明細書に記載される特色のいずれかを有し得る。捕捉するステップは、本明細書で開示される方法の間に調製される1つまたは複数の部分試料に対して実施され得る。一部の実施形態では、DNAは、少なくとも第1の部分試料または第2の部分試料、例えば、少なくとも第1の部分試料および第2の部分試料から捕捉される。一部の実施形態では、部分試料は、差次的にタグ化され(例えば、本明細書に記載されるように)、次いで、捕捉を受ける前にプールされる。
捕捉するステップは、プローブの特色、例えば、長さ、塩基組成などにある程度まで一般に依存する、特異的核酸ハイブリダイゼーションに適切な条件を使用して、実施され得る。当業者は、核酸ハイブリダイゼーションに関する当該分野における一般的知識を考慮して、適切な条件に精通している。一部の実施形態では、標的特異的プローブとDNAとの複合体が形成される。
一部の実施形態では、本明細書に記載される方法は、試験対象から得られたcfDNAの標的領域の複数のセットを捕捉するステップを含む。標的領域は、それらが腫瘍に起源するか健康な細胞に起源するかに依存してメチル化レベルおよび/または断片化パターンにおける差異を示し得るエピジェネティック標的領域を含む。標的領域は、それらが腫瘍に起源するか健康な細胞に起源するかに依存して配列における差異を示し得る配列可変標的領域もまた含む。捕捉するステップは、cfDNA分子の捕捉されたセットを生成し、配列可変標的領域セットに対応するcfDNA分子は、エピジェネティック標的領域セットに対応するcfDNA分子よりも、cfDNA分子の捕捉されたセットにおいてより高い捕捉収量で捕捉される。捕捉するステップ、捕捉収量および関連の態様の追加の議論については、全ての目的のためにこれにより参照により本明細書に組み込まれるWO2020/160414を参照されたい。
一部の実施形態では、本明細書に記載される方法は、試験対象から得られたcfDNAを、標的特異的プローブのセットと接触させるステップを含み、標的特異的プローブのセットは、エピジェネティック標的領域セットに対応するcfDNAよりも高い捕捉収量で配列可変標的領域セットに対応するcfDNAを捕捉するように構成される。
エピジェネティック標的領域を分析する場合に必要であり得るものよりも深い配列決定の深度が、十分な信頼度または精度で配列可変標的領域を分析するために必要であり得るので、エピジェネティック標的領域セットに対応するcfDNAよりも高い捕捉収量で配列可変標的領域セットに対応するcfDNAを捕捉することは、有益であり得る。断片化パターン(例えば、転写開始部位またはCTCF結合部位の乱れについて試験するため)または断片存在量(例えば、高メチル化された分配および低メチル化された分配中の)を決定するために必要なデータのボリュームは、がん関連の配列突然変異の存在または非存在を決定するために必要なデータのボリュームよりも、一般に小さい。異なる収量で標的領域セットを捕捉することは、同じ配列決定ラン(例えば、プールされた混合物を使用する、および/または同じ配列決定セルにおける)における配列決定の異なる深度まで標的領域を配列決定することを容易にし得る。
種々の実施形態では、これらの方法は、本明細書の議論と一致して、例えば、エピジェネティック標的領域セットおよび配列可変標的領域セットについての配列決定深度の異なる程度まで、捕捉されたcfDNAを配列決定するステップをさらに含む。
一部の実施形態では、標的特異的プローブとDNAとの複合体は、標的特異的プローブに結合していないDNAから分離される。例えば、標的特異的プローブが、固体支持体に共有結合的または非共有結合的に結合している場合、洗浄または吸引ステップが、未結合の材料を分離するために使用され得る。あるいは、複合体が、未結合の材料とは別個のクロマトグラフィー特性を有する場合(例えば、プローブが、クロマトグラフィー樹脂に結合するリガンドを含む場合)、クロマトグラフィーが使用され得る。
本明細書の他の場所で詳細に議論されるように、標的特異的プローブのセットは、複数のセット、例えば、配列可変標的領域セットに対するプローブおよびエピジェネティック標的領域セットに対するプローブを含み得る。一部のかかる実施形態では、捕捉するステップは、配列可変標的領域セットに対するプローブおよびエピジェネティック標的領域セットに対するプローブを用いて、同じ容器中で同時に実施される、例えば、配列可変標的領域セットに対するプローブおよびエピジェネティック標的領域セットに対するプローブは、同じ組成物中にある。このアプローチは、比較的能率化されたワークフローを提供する。一部の実施形態では、配列可変標的領域セットに対するプローブの濃度は、エピジェネティック標的領域セットに対するプローブの濃度よりも高い。
あるいは、捕捉するステップは、第1の容器中で配列可変標的領域プローブセットを用いて、第2の容器中でエピジェネティック標的領域プローブセットを用いて実施され、または接触させるステップは、第1の時点および第1の容器において、配列可変標的領域プローブセットを用いて実施され、第1の時点の前または後の第2の時点において、エピジェネティック標的領域プローブセットを用いて実施される。このアプローチは、配列可変標的領域セットに対応する捕捉されたDNAおよびエピジェネティック標的領域セットに対応する捕捉されたDNAを含む別々の第1および第2の組成物の調製を可能にする。これらの組成物は、所望により別々に処理され得(例えば、本明細書の他の箇所に記載されるように、メチル化に基づいて分画するために)、さらなる処理および分析、例えば、配列決定のための材料を提供するために、適切な割合で再度組み合わされ得る。
一部の実施形態では、DNAが増幅される。一部の実施形態では、増幅は、捕捉するステップの前に実施される。一部の実施形態では、増幅は、捕捉するステップの後に実施される。
一部の実施形態では、アダプターは、DNA中に含まれる。これは、例えば、上記のように、例えば、プライマーの5’部分中にアダプターを提供することによって、増幅手順と並列で実施され得る。あるいは、アダプターは、他のアプローチ、例えば、ライゲーションによって付加され得る。
一部の実施形態では、バーコードであり得るまたはバーコードを含み得るタグは、DNA中に含まれる。タグは、核酸の起源の同定を容易にし得る。例えば、バーコードは、並列配列決定のために複数の試料をプールした後に、DNAが由来した起源(例えば、対象)が同定されるのを可能にするために使用され得る。これは、例えば、上記のように、例えば、プライマーの5’部分中にバーコードを提供することによって、増幅手順と並列で実施され得る。一部の実施形態では、アダプターおよびタグ/バーコードは、同じプライマーまたはプライマーセットによって提供される。例えば、バーコードは、アダプターの3’側およびプライマーの標的ハイブリダイズ部分の5’側に位置し得る。あるいは、バーコードは、他のアプローチ、例えば、必要に応じて、同じライゲーション基質中のアダプターと一緒の、ライゲーションによって付加され得る。
上述の実施形態ならびに導入および概要のセクションにおいて示される実施形態のいずれかを用いて実施可能な程度まで組み合わされ得る、増幅、タグおよびバーコードに関する追加の詳細は、以下の「方法の一般的特色」のセクションで議論される。
F.捕捉されたセット
一部の実施形態では、DNA(例えば、cfDNA)の捕捉されたセットが提供される。開示された方法に関して、DNAの捕捉されたセットは、例えば、本明細書に記載されるように、分配するステップの後に捕捉するステップを実施することによって、提供され得る。捕捉されたセットは、配列可変標的領域セット、エピジェネティック標的領域セット、またはそれらの組合せに対応するDNAを含み得る。一部の実施形態では、捕捉された配列可変標的領域DNAの量は、標的化された領域のサイズ(フットプリントサイズ)における差異に関して標準化される場合、捕捉されたエピジェネティック標的領域DNAの量よりも多い。
一部の実施形態では、第1の標的領域セットは、少なくともエピジェネティック標的領域を含む第1の部分試料から捕捉される。第1の部分試料から捕捉されたエピジェネティック標的領域は、高メチル化可変標的領域を含み得る。一部の実施形態では、高メチル化可変標的領域は、健康な対象由来のcfDNA中の、メチル化されていないまたは低いメチル化(例えば、バルクcfDNAと比較して平均を下回るメチル化)を有する、CpG含有領域である。一部の実施形態では、高メチル化可変標的領域は、少なくとも1つの他の組織型中よりも低いメチル化を示す、健康なcfDNA中の領域である。いずれの特定の理論によっても束縛されることを望まないが、がん細胞は、同じ組織型の健康な細胞よりも多くのDNAを、血流中に脱落させ得る。したがって、cfDNAの起源である組織の分布は、癌発生の際に変化し得る。したがって、第1の部分試料中の高メチル化可変標的領域のレベルにおける増加は、がんの存在(または対象の病歴に依存して、再発)の指標であり得る。
一部の実施形態では、第2の標的領域セットは、少なくともエピジェネティック標的領域を含む第2の部分試料から捕捉される。エピジェネティック標的領域は、低メチル化可変標的領域を含み得る。一部の実施形態では、低メチル化可変標的領域は、健康な対象由来のcfDNA中の、メチル化されたまたは高いメチル化(例えば、バルクcfDNAと比較して平均を上回るメチル化)を有する、CpG含有領域である。一部の実施形態では、低メチル化可変標的領域は、少なくとも1つの他の組織型中よりも高いメチル化を示す、健康なcfDNA中の領域である。いずれの特定の理論によっても束縛されることを望まないが、がん細胞は、同じ組織型の健康な細胞よりも多くのDNAを、血流中に脱落させ得る。したがって、cfDNAの起源である組織の分布は、癌発生の際に変化し得る。したがって、第2の部分試料中の低メチル化可変標的領域のレベルにおける増加は、がんの存在(または対象の病歴に依存して、再発)の指標であり得る。
あるいは、配列可変標的領域セットに対応するDNAおよびエピジェネティック標的領域セットに対応するDNAをそれぞれ含む、第1および第2の捕捉されたセットが提供され得る。第1および第2の捕捉されたセットは、組み合わされた捕捉されたセットを提供するために組み合わされ得る。
配列可変標的領域セットに対応するDNAおよびエピジェネティック標的領域セットに対応するDNAを含む捕捉されたセットが、上で議論した組み合わされた捕捉されたセットを含む一部の実施形態では、配列可変標的領域セットに対応するDNAは、エピジェネティック標的領域セットに対応するDNAよりも高い濃度、例えば、1.1倍~1.2倍高い濃度、1.2倍~1.4倍高い濃度、1.4倍~1.6倍高い濃度、1.6倍~1.8倍高い濃度、1.8倍~2.0倍高い濃度、2.0倍~2.2倍高い濃度、2.2倍~2.4倍高い濃度 2.4倍~2.6倍高い濃度、2.6倍~2.8倍高い濃度、2.8倍~3.0倍高い濃度、3.0倍~3.5倍高い濃度、3.5倍~4.0、4.0倍~4.5倍高い濃度、4.5倍~5.0倍高い濃度、5.0倍~5.5倍高い濃度、5.5倍~6.0倍高い濃度、6.0倍~6.5倍高い濃度、6.5倍~7.0倍高い、7.0倍~7.5倍高い濃度、7.5倍~8.0倍高い濃度、8.0倍~8.5倍高い濃度、8.5倍~9.0倍高い濃度、9.0倍~9.5倍高い濃度、9.5倍~10.0倍高い濃度、10倍~11倍高い濃度、11倍~12倍高い濃度 12倍~13倍高い濃度、13倍~14倍高い濃度、14倍~15倍高い濃度、15倍~16倍高い濃度、16倍~17倍高い濃度、17倍~18倍高い濃度、18倍~19倍高い濃度、19倍~20倍高い濃度、20倍~30倍高い濃度、30倍~40倍高い濃度、40倍~50倍高い濃度、50倍~60倍高い濃度、60倍~70倍高い濃度、70倍~80倍高い濃度、80倍~90倍高い濃度または90倍~100倍高い濃度で存在し得る。濃度における差異の程度は、定義のセクションで議論されるように、標的領域のフットプリントサイズに関する標準化の主な原因である。
1.エピジェネティック標的領域セット
エピジェネティック標的領域セットは、新生物(例えば、腫瘍またはがん)細胞由来のDNAと健康な細胞、例えば、非新生物性循環細胞由来のDNAを差別化する可能性が高い1つまたは複数の型の標的領域を含み得る。かかる領域の例示的な型は、本明細書で詳細に議論される。エピジェネティック標的領域セットは、例えば、本明細書に記載されるように、1つまたは複数の対照領域もまた含み得る。
一部の実施形態では、エピジェネティック標的領域セットは、少なくとも100kbp、例えば、少なくとも200kbp、少なくとも300kbpまたは少なくとも400kbpのフットプリントを有する。一部の実施形態では、エピジェネティック標的領域セットは、100~20Mbp、例えば、100~200kbp、200~300kbp、300~400kbp、400~500kbp、500~600kbp、600~700kbp、700~800kbp、800~900kbp、900~1,000kbp、1~1.5Mbp、1.5~2Mbp、2~3Mbp、3~4Mbp、4~5Mbp、5~6Mbp、6~7Mbp、7~8Mbp、8~9Mbp、9~10Mbpまたは10~20Mbpの範囲のフットプリントを有する。一部の実施形態では、エピジェネティック標的領域セットは、少なくとも20Mbpのフットプリントを有する。
a.高メチル化可変標的領域
一部の実施形態では、エピジェネティック標的領域セットは、1つまたは複数の高メチル化可変標的領域を含む。一般に、高メチル化可変標的領域は、例えば、cfDNA試料中の観察されたメチル化のレベルにおける増加が、試料(例えば、cfDNAの)が新生物細胞、例えば、腫瘍またはがん細胞によって産生されたDNAを含有する可能性の増加を示す、領域を指す。例えば、腫瘍サプレッサー遺伝子のプロモーターの高メチル化が、繰り返し観察されてきた。例えば、Kang et al., Genome Biol. 18:53 (2017)およびそこで引用された参考文献を参照されたい。別の例では、上で議論されるように、高メチル化可変標的領域には、同じ型の健康な組織由来のDNAと比較して、がん性組織中のメチル化が必ずしも異ならないが、健康な対象において典型的なcfDNAと比較して、メチル化が異なる(例えば、より多くのメチル化を有する)、領域が含まれ得る。例えば、がんの存在が、がんに対応する組織型の細胞の細胞死、例えば、アポトーシスの増加を生じる場合、かかるがんは、かかる高メチル化可変標的領域を少なくとも一部使用して、検出され得る。
結腸直腸がんにおけるメチル化可変標的領域の広範な議論は、Lam et al., Biochim Biophys Acta. 1866:106-20 (2016)に提供されている。これらには、VIM、SEPT9、ITGA4、OSM4、GATA4およびNDRG4が含まれる。結腸直腸がん(CRC)研究に基づく高メチル化可変標的領域の例示的なセットは、表1に提供される。これらの遺伝子の多くは、結腸直腸がんを超えて、がんとの関連性を有する可能性が高い;例えば、TP53は、決定的に重要な腫瘍サプレッサーとして広く認識され、この遺伝子の高メチル化ベースの不活性化は、共通の発癌機構であり得る。
表1. CRC研究に基づく例示的な高メチル化標的領域
一部の実施形態では、高メチル化可変標的領域は、表1に列挙された複数の遺伝子座、例えば、表1に列挙された遺伝子座の少なくとも10%、20%、30%、40%、50%、60%、70%、80%、90%または100%を含む。例えば、標的領域として含まれる各遺伝子座について、遺伝子の転写開始部位と停止コドン(選択的スプライシングされる遺伝子については、最後の停止コドン)との間、または遺伝子のプロモーター領域中に結合するハイブリダイゼーション部位を有する1つまたは複数のプローブが存在し得る。一部の実施形態では、1つまたは複数のプローブは、表1中の遺伝子の転写開始部位の300bp以内、例えば、200または100bp以内に結合する。
種々の型の肺がんにおけるメチル化可変標的領域は、例えば、Ooki et al., Clin. Cancer Res. 23:7141-52 (2017);Belinksy, Annu. Rev. Physiol. 77:453-74 (2015);Hulbert et al., Clin. Cancer Res. 23:1998-2005 (2017);Shi et al., BMC Genomics 18:901 (2017);Schneider et al., BMC Cancer. 11:102 (2011);Lissa et al., Transl Lung Cancer Res 5(5):492-504 (2016);Skvortsova et al., Br. J. Cancer. 94(10):1492-1495 (2006);Kim et al., Cancer Res. 61:3419-3424 (2001);Furonaka et al., Pathology International 55:303-309 (2005);Gomes et al., Rev. Port. Pneumol. 20:20-30 (2014);Kim et al., Oncogene. 20:1765-70 (2001);Hopkins-Donaldson et al., Cell Death Differ. 10:356-64 (2003);Kikuchi et al., Clin. Cancer Res. 11:2954-61 (2005);Heller et al., Oncogene 25:959-968 (2006);Licchesi et al., Carcinogenesis. 29:895-904 (2008);Guo et al., Clin. Cancer Res. 10:7917-24 (2004);Palmisano et al., Cancer Res. 63:4620-4625 (2003);およびToyooka et al., Cancer Res. 61:4556-4560, (2001)において詳細に議論される。
肺がん研究に基づく高メチル化可変標的領域の例示的なセットは、表2に提供される。これらの遺伝子の多くは、肺がんを超えて、がんとの関連性を有する可能性が高い;例えば、Casp8(カスパーゼ8)は、プログラム細胞死における重要な酵素であり、この遺伝子の高メチル化ベースの不活性化は、肺がんに限定されない共通の発癌機構であり得る。さらに、いくつかの遺伝子は、表1および2の両方に出現し、普遍性を示す。
表2. 肺がん研究に基づく例示的な高メチル化標的領域
表2で同定された標的領域に関する上述の実施形態のいずれかは、表1で同定された標的領域に関する上記実施形態のいずれかと組み合わされ得る。一部の実施形態では、高メチル化可変標的領域は、表1または表2に列挙された複数の遺伝子座、例えば、表1または表2に列挙された遺伝子座の少なくとも10%、20%、30%、40%、50%、60%、70%、80%、90%または100%を含む。
追加の高メチル化標的領域は、例えば、Cancer Genome Atlasから得られ得る。Kang et al., Genome Biology 18:53 (2017)は、乳房、結腸、腎臓、肝臓および肺由来の高メチル化標的領域を使用する、CancerLocatorと呼ばれる確率的方法の構築を記載している。一部の実施形態では、高メチル化標的領域は、1つまたは複数の型のがんに特異的であり得る。したがって、一部の実施形態では、高メチル化標的領域は、乳房、結腸、腎臓、肝臓および肺がんのうち1、2、3、4または5つにおいて高メチル化を集合的に示す高メチル化標的領域の1、2、3、4または5つのサブセットを含む。
一部の実施形態では、異なるエピジェネティック標的領域が第1および第2の部分試料から捕捉される場合、第1の部分試料から捕捉されたエピジェネティック標的領域は、高メチル化可変標的領域を含む。
b.低メチル化可変標的領域
グローバル低メチル化は、種々のがんにおいて一般に観察される現象である。例えば、Hon et al., Genome Res. 22:246-258 (2012)(乳房がん);Ehrlich, Epigenomics 1:239-259 (2009)(結腸、卵巣、前立腺、白血病、肝細胞および子宮頸がんにおける低メチル化の観察に注目した総説論文)を参照されたい。例えば、領域、例えば、反復エレメント、例えば、LINE1エレメント、Aluエレメント、セントロメアタンデムリピート、動原体周囲タンデムリピートおよびサテライトDNA、ならびに健康な細胞では通常メチル化されている遺伝子間領域は、腫瘍細胞において低減されたメチル化を示し得る。したがって、一部の実施形態では、エピジェネティック標的領域セットは、低メチル化可変標的領域を含み、このとき、観察されたメチル化のレベルにおける減少は、試料(例えば、cfDNAの)が新生物細胞、例えば、腫瘍またはがん細胞によって産生されたDNAを含有する可能性の増加を示す。別の例では、上で議論されるように、低メチル化可変標的領域には、同じ型の健康な組織由来のDNAと比較して、がん性組織中のメチル化が必ずしも異ならないが、健康な対象において典型的なcfDNAと比較して、メチル化が異なる(例えば、あまりメチル化されていない)、領域が含まれ得る。例えば、がんの存在が、がんに対応する組織型の細胞の細胞死、例えば、アポトーシスの増加を生じる場合、かかるがんは、かかる低メチル化可変標的領域を少なくとも一部使用して、検出され得る。
一部の実施形態では、低メチル化可変標的領域には、反復エレメントおよび/または遺伝子間領域が含まれる。一部の実施形態では、反復エレメントは、LINE1エレメント、Aluエレメント、セントロメアタンデムリピート、動原体周囲タンデムリピートおよび/またはサテライトDNAのうち1、2、3、4または5つを含む。
がん関連の低メチル化を示す例示的な特定のゲノム領域には、ヒト第1染色体のヌクレオチド8403565~8953708および151104701~151106035が含まれる。一部の実施形態では、低メチル化可変標的領域は、これらの領域のうち一方または両方と重複するまたはそれを含む。
一部の実施形態では、異なるエピジェネティック標的領域が第1および第2の部分試料から捕捉される場合、第2の部分試料から捕捉されたエピジェネティック標的領域は、低メチル化可変標的領域を含む。一部の実施形態では、第2の部分試料から捕捉されたエピジェネティック標的領域は、低メチル化可変標的領域を含み、第1の部分試料から捕捉されたエピジェネティック標的領域は、高メチル化可変標的領域を含む。
c.CTCF結合領域
CTCFは、クロマチン組織化に寄与し、コヒーシンと共に共局在化する場合が多い、DNA結合タンパク質である。CTCF結合部位の乱れは、種々の異なるがんにおいて報告されている。例えば、Katainen et al., Nature Genetics, doi:10.1038/ng.3335、2015年6月8日にオンライン公開;Guo et al., Nat. Commun. 9:1520 (2018)を参照されたい。CTCF結合は、例えば、断片長分析を介して配列決定によって検出され得る認識可能なパターンを、cfDNA中に生じる。配列決定ベースの断片長分析に関する詳細は、Snyder et al., Cell 164:57-68 (2016);WO2018/009723;およびUS20170211143A1に提供され、これらは各々、これにより参照により本明細書に組み込まれる。
このように、CTCF結合の乱れは、cfDNAの断片化パターンにおけるバリエーションを生じる。したがって、CTCF結合部位は、断片化可変標的領域の1つの型である。
多くの公知のCTCF結合部位が存在する。例えば、insulatordb.uthsc.edu/においてインターネット上で入手可能なCTCFBSDB(CTCF Binding Site Database);Cuddapah et al., Genome Res. 19:24-32 (2009);Martin et al., Nat. Struct. Mol. Biol. 18:708-14 (2011);Rhee et al., Cell. 147:1408-19 (2011)を参照されたい。これらは各々、参照により組み込まれる。例示的なCTCF結合部位は、第8染色体上のヌクレオチド56014955~56016161および第13染色体上のヌクレオチド95359169~95360473に存在する。
したがって、一部の実施形態では、エピジェネティック標的領域セットは、CTCF結合領域を含む。一部の実施形態では、CTCF結合領域は、少なくとも10、20、50、100、200もしくは500個のCTCF結合領域、または10~20、20~50、50~100、100~200、200~500もしくは500~1000個のCTCF結合領域、例えば、上記の、あるいは上で引用したCTCFBSDBまたはCuddapah et al.、Martin et al.もしくはRhee et al.の論文のうち1つまたは複数に記載されるCTCF結合領域などを含む。
一部の実施形態では、CTCF部位の少なくとも一部は、メチル化されていることまたはメチル化されていないことができ、メチル化状態は、細胞ががん細胞であるかどうかと相関する。一部の実施形態では、エピジェネティック標的領域セットは、CTCF結合部位の少なくとも100bp、少なくとも200bp、少なくとも300bp、少なくとも400bp、少なくとも500bp、少なくとも750bp、少なくとも1000bp上流および下流の領域を含む。
d.転写開始部位
転写開始部位もまた、新生物細胞において乱れを示し得る。例えば、造血系統は、健康な個体におけるcfDNAに実質的に寄与するが、その健康な細胞における種々の転写開始部位におけるヌクレオソーム組織化は、新生物細胞におけるその転写開始部位におけるヌクレオソーム組織化とは異なり得る。これは、Snyder et al., Cell 164:57-68 (2016);WO2018/009723;およびUS20170211143A1で一般に議論されるように、配列決定によって検出され得る異なるcfDNAパターンを生じる。別の例では、転写開始部位は、同じ型の健康な組織由来のDNAと比較して、がん性組織において必ずしもエピジェネティックに異ならなくてもよいが、健康な対象において典型的なcfDNAと比較して、エピジェネティックに異なる(例えば、ヌクレオソーム組織化に関して)。例えば、がんの存在が、がんに対応する組織型の細胞の細胞死、例えば、アポトーシスの増加を生じる場合、かかるがんは、転写開始部位におけるかかる差異を少なくとも一部使用して、検出され得る。
したがって、転写開始部位の乱れもまた、cfDNAの断片化パターンにおけるバリエーションを生じる。したがって、転写開始部位もまた、断片化可変標的領域の1つの型である。
ヒト転写開始部位は、dbtss.hgc.jpにおいてインターネット上で入手可能であり、これにより参照により本明細書に組み込まれるYamashita et al., Nucleic Acids Res. 34(Database issue): D86-D89 (2006)に記載されるDBTSS(DataBase of Human Transcription Start Sites)から入手可能である。
したがって、一部の実施形態では、エピジェネティック標的領域セットは、転写開始部位を含む。一部の実施形態では、転写開始部位は、少なくとも10、20、50、100、200もしくは500個の転写開始部位、または10~20、20~50、50~100、100~200、200~500もしくは500~1000個の転写開始部位、例えば、DBTSSに列挙された転写開始部位などを含む。一部の実施形態では、転写開始部位の少なくとも一部は、メチル化されていることまたはメチル化されていないことができ、メチル化状態は、細胞ががん細胞であるかどうかと相関する。一部の実施形態では、エピジェネティック標的領域セットは、転写開始部位の少なくとも100bp、少なくとも200bp、少なくとも300bp、少なくとも400bp、少なくとも500bp、少なくとも750bp、少なくとも1000bp上流および下流の領域を含む。
e.限局的増幅
限局的増幅は、体細胞突然変異であるが、これらは、ある特定のエピジェネティック変化、例えば、メチル化における変化を検出するためのアプローチと類似の様式で、読み取り頻度に基づいて配列決定することによって検出され得る。したがって、がんにおいて限局的増幅を示し得る領域は、エピジェネティック標的領域セット中に含まれ得、AR、BRAF、CCND1、CCND2、CCNE1、CDK4、CDK6、EGFR、ERBB2、FGFR1、FGFR2、KIT、KRAS、MET、MYC、PDGFRA、PIK3CAおよびRAF1のうち1つまたは複数を含み得る。例えば、一部の実施形態では、エピジェネティック標的領域セットは、上述の標的のうち少なくとも2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17または18個を含む。
f.メチル化対照領域
データ検証を容易にするために、対照領域を含むことが有用であり得る。一部の実施形態では、エピジェネティック標的領域セットは、DNAががん細胞に由来するか正常細胞に由来するかにかかわらず、本質的に全ての試料においてメチル化されているまたはメチル化されていないと予想される対照領域を含む。一部の実施形態では、エピジェネティック標的領域セットは、本質的に全ての試料において低メチル化されていると予想される、低メチル化された対照領域を含む。一部の実施形態では、エピジェネティック標的領域セットは、本質的に全ての試料において高メチル化されていると予想される、高メチル化された対照領域を含む。
2.配列可変標的領域セット
一部の実施形態では、配列可変標的領域セットは、がんにおいて体細胞突然変異を受けることが公知の複数の領域を含む。
一部の態様では、配列可変標的領域セットは、がんを有する対象の決定された割合が、パネル中の1つまたは複数の異なる遺伝子またはゲノム領域において遺伝的バリアントまたは腫瘍マーカーを示すように選択された、複数の異なる遺伝子またはゲノム領域(「パネル」)を標的化する。パネルは、固定数の塩基対まで配列決定するために領域を限定するために選択され得る。パネルは、例えば、本明細書の他の場所に記載されるように、プローブの親和性および/または量を調整することによって、所望の量のDNAを配列決定するために選択され得る。パネルは、所望の配列読み取り深度を達成するためにさらに選択され得る。パネルは、ある量の配列決定される塩基対について、所望の配列読み取り深度または配列読み取りカバレッジを達成するために選択され得る。パネルは、試料中の1つまたは複数の遺伝的バリアントを検出するための理論的感度、理論的特異性および/または理論的精度を達成するために選択され得る。
領域のパネルを検出するためのプローブは、目的のゲノム領域(ホットスポット領域)を検出するためのプローブならびにヌクレオソーム認識プローブ(例えば、KRASコドン12および13)を含み得、ヌクレオソーム結合パターンおよびGC配列組成によって影響されるcfDNAカバレッジおよび断片サイズバリエーションの分析に基づいて捕捉を最適化するように設計され得る。本明細書で使用される領域は、ヌクレオソーム位置およびGCモデルに基づいて最適化された、非ホットスポット領域もまた含み得る。
目的のゲノム位置の列挙の例は、表3および表4で見出され得る。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表3の遺伝子のうち少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも55、少なくとも60、少なくとも65または70個の少なくとも一部分を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表3のSNVのうち少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも55、少なくとも60、少なくとも65または70個を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表3の融合のうち少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5または6個を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表3のインデルのうち少なくとも1、少なくとも2または3個の少なくとも一部分を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表4の遺伝子のうち少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも55、少なくとも60、少なくとも65、少なくとも70または73個の少なくとも一部分を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表4のSNVのうち少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも55、少なくとも60、少なくとも65、少なくとも70または73個を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表4の融合のうち少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5または6個を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表4のインデルのうち少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17または18個の少なくとも一部分を含む。目的のこれらのゲノム位置の各々は、所与のパネルについて、骨格領域またはホットスポット領域として同定され得る。目的のホットスポットゲノム位置の列挙の例は、表5で見出され得る。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表5の遺伝子のうち少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19または少なくとも20個の少なくとも一部分を含む。各ホットスポットゲノム領域は、関連する遺伝子、それが存在する染色体、遺伝子座を示すゲノムの開始位置および停止位置、塩基対での遺伝子座の長さ、遺伝子によってカバーされるエクソン、ならびに目的の所与のゲノム領域が捕捉しようとし得る重要な特色(例えば、突然変異の型)が含まれる、いくつかの特徴と共に列挙される。
表3
表4
表5
さらにまたはあるいは、適切な標的領域セットは、文献から入手可能である。例えば、これにより参照により本明細書に組み込まれるGale et al., PLoS One 13: e0194630 (2018)は、配列可変標的領域セットの一部または全てとして使用され得る、35個のがん関連遺伝子標的のパネルを記載している。これら35個の標的は、AKT1、ALK、BRAF、CCND1、CDK2A、CTNNB1、EGFR、ERBB2、ESR1、FGFR1、FGFR2、FGFR3、FOXL2、GATA3、GNA11、GNAQ、GNAS、HRAS、IDH1、IDH2、KIT、KRAS、MED12、MET、MYC、NFE2L2、NRAS、PDGFRA、PIK3CA、PPP2R1A、PTEN、RET、STK11、TP53およびU2AF1である。
一部の実施形態では、配列可変標的領域セットは、少なくとも10、20、30または35個のがん関連遺伝子、例えば、上で列挙されたがん関連遺伝子由来の標的領域を含む。
一部の実施形態では、配列可変標的領域セットは、少なくとも50kbp、例えば、少なくとも100kbp、少なくとも200kbp、少なくとも300kbpまたは少なくとも400kbpのフットプリントを有する。一部の実施形態では、配列可変標的領域セットは、100~2000kbp、例えば、100~200kbp、200~300kbp、300~400kbp、400~500kbp、500~600kbp、600~700kbp、700~800kbp、800~900kbp、900~1,000kbp、1~1.5Mbpまたは1.5~2Mbpの範囲のフットプリントを有する。一部の実施形態では、配列可変標的領域セットは、少なくとも2Mbpのフットプリントを有する。
G.対象
一部の実施形態では、DNA(例えば、cfDNA)は、がんを有する対象から得られる。一部の実施形態では、DNA(例えば、cfDNA)は、がんを有すると疑われる対象から得られる。一部の実施形態では、DNA(例えば、cfDNA)は、腫瘍を有する対象から得られる。一部の実施形態では、DNA(例えば、cfDNA)は、腫瘍を有すると疑われる対象から得られる。一部の実施形態では、DNA(例えば、cfDNA)は、新生物を有する対象から得られる。一部の実施形態では、DNA(例えば、cfDNA)は、新生物を有すると疑われる対象から得られる。一部の実施形態では、DNA(例えば、cfDNA)は、(例えば、化学療法、外科的切除、放射線、またはそれらの組合せ後に)腫瘍、がんまたは新生物からの緩解状態にある対象から得られる。上述の実施形態のいずれかでは、がん、腫瘍もしくは新生物または疑われるがん、腫瘍もしくは新生物は、肺、結腸、直腸、腎臓、乳房、前立腺または肝臓のものであり得る。一部の実施形態では、がん、腫瘍もしくは新生物または疑われるがん、腫瘍もしくは新生物は、肺のものである。一部の実施形態では、がん、腫瘍もしくは新生物または疑われるがん、腫瘍もしくは新生物は、結腸または直腸のものである。一部の実施形態では、がん、腫瘍もしくは新生物または疑われるがん、腫瘍もしくは新生物は、乳房のものである。一部の実施形態では、がん、腫瘍もしくは新生物または疑われるがん、腫瘍もしくは新生物は、前立腺のものである。上述の実施形態のいずれかでは、対象は、ヒト対象であり得る。
H.第1および第2の部分試料またはそれらの部分由来のDNAをプールする
一部の実施形態では、これらの方法は、第2の部分試料(低メチル化された分配とも呼ばれる)のDNAの少なくとも一部分および第1の部分試料(高メチル化された分配とも呼ばれる)のDNAの少なくとも一部分を含むプールを調製するステップを含む。例えば、エピジェネティック標的領域および/または配列可変標的領域が含まれる標的領域は、プールから捕捉され得る。本明細書の他の場所に記載される部分試料の少なくとも一部分から標的領域セットを捕捉するステップは、第1および第2の部分試料由来のDNAを含むプールに対して実施される捕捉ステップを包含する。プール中のDNAを増幅するステップは、プールから標的領域を捕捉するステップの前に実施され得る。捕捉するステップは、本明細書の他の場所の、捕捉するステップについて記載された特色のいずれかを有し得る。
一部の実施形態では、配列可変標的領域は、第2の部分試料の第2の部分から捕捉される。第2の部分試料の第2の部分は、プール中に含まれなかった第2の部分試料のDNAの一部、大部分、実質的に全てまたは全てを含み得る。プールから捕捉された領域と第2の部分試料から捕捉された領域とは、組み合わされ得、並行して分析され得る。
エピジェネティック標的領域は、本明細書の他の場所で議論されるように、それらが腫瘍に起源するか健康な細胞に起源するか、またはそれらが起源する組織の型が何かに依存して、メチル化レベルおよび/または断片化パターンにおける差異を示し得る。配列可変標的領域は、それらが腫瘍に起源するか健康な細胞に起源するかに依存して、配列における差異を示し得る。
低メチル化された分配からのエピジェネティック標的領域の分析は、一部の適用では、高メチル化された分配および低メチル化された分配からの配列可変標的領域ならびに高メチル化された分配からのエピジェネティック標的領域の分析よりも、情報量が少ない場合がある。したがって、配列可変標的領域およびエピジェネティック標的領域が捕捉されている方法では、後者は、高メチル化された分配および低メチル化された分配からの配列可変標的領域ならびに高メチル化された分配からのエピジェネティック標的領域のうち1つまたは複数よりも、低い程度まで捕捉され得る。例えば、配列可変標的領域は、高メチル化された分配と共にプールされていない低メチル化された分配の部分から捕捉され得、高メチル化された分配からのDNAの一部(例えば、大部分、実質的に全てまたは全て)を有し、低メチル化された分配からのDNAを有さないまたはその一部(例えば、少数)を有するプールが、調製され得る。かかるアプローチは、低メチル化された分配からのエピジェネティック標的領域の配列決定を低減または排除し、それによって、さらなる分析のために十分な配列決定データの量を低減させることができる。
一部の実施形態では、プール中に低メチル化された分配のDNAの少数を含むことは、例えば、相対基準での、1つまたは複数のエピジェネティック特色(例えば、本明細書の他の場所で詳細に議論されるメチル化または他のエピジェネティック特色)の定量化を容易にする。
一部の実施形態では、プールは、低メチル化された分配のDNAの少数、例えば、低メチル化された分配のDNAの約50%未満、例えば、低メチル化された分配のDNAの約45%、40%、35%、30%、25%、20%、15%、10%もしくは5%未満、またはそれと等しい%を含み得る。一部の実施形態では、プールは、低メチル化された分配のDNAの約5%~25%を含む。一部の実施形態では、プールは、低メチル化された分配のDNAの約10%~20%を含む。一部の実施形態では、プールは、低メチル化された分配のDNAの約10%を含む。一部の実施形態では、プールは、低メチル化された分配のDNAの約15%を含む。一部の実施形態では、プールは、低メチル化された分配のDNAの約20%を含む。
一部の実施形態では、プールは、高メチル化された分配のDNAの少なくとも約50%であり得る、高メチル化された分配の一部分を含む。例えば、プールは、高メチル化された分配のDNAの少なくとも約55%、60%、65%、70%、75%、80%、85%、90%または95%を含み得る。一部の実施形態では、プールは、高メチル化された分配のDNAの50~55%、55~60%、60~65%、65~70%、70~75%、75~80%、80~85%、85~90%、90~95%または95~100%を含む。一部の実施形態では、第2のプールは、高メチル化された分配の全てまたは実質的に全てを含む。
一部の実施形態では、これらの方法は、低メチル化された分配のDNAの少なくとも一部分を含む第1のプールを調製するステップを含む。一部の実施形態では、これらの方法は、高メチル化された分配のDNAの少なくとも一部分を含む第2のプールを調製するステップを含む。一部の実施形態では、第1のプールは、高メチル化された分配のDNAの一部分をさらに含む。一部の実施形態では、第2のプールは、低メチル化された分配のDNAの一部分をさらに含む。一部の実施形態では、第1のプールは、低メチル化された分配のDNAの大部分、および必要に応じて、高メチル化された分配のDNAの少数を含む。一部の実施形態では、第2のプールは、高メチル化された分配のDNAの大部分および低メチル化された分配のDNAの少数を含む。中間にメチル化された分配が関与する一部の実施形態では、第2のプールは、中間にメチル化された分配のDNAの少なくとも一部分、例えば、中間にメチル化された分配のDNAの大部分を含む。一部の実施形態では、第1のプールは、低メチル化された分配のDNAの大部分を含み、第2のプールは、高メチル化された分配のDNAの大部分および中間にメチル化された分配のDNAの大部分を含む。
一部の実施形態では、これらの方法は、第1のプールから標的領域の少なくとも第1のセットを捕捉するステップを含み、例えば、第1のプールは、上記実施形態のいずれかに示されるとおりである。一部の実施形態では、第1のセットは、配列可変標的領域を含む。一部の実施形態では、第1のセットは、低メチル化可変標的領域および/または断片化可変標的領域を含む。一部の実施形態では、第1のセットは、配列可変標的領域および断片化可変標的領域を含む。一部の実施形態では、第1のセットは、配列可変標的領域、低メチル化可変標的領域および断片化可変標的領域を含む。第1のプール中のDNAを増幅するステップは、この捕捉ステップの前に実施され得る。一部の実施形態では、第1のプールから標的領域の第1のセットを捕捉するステップは、第1のプールのDNAを、標的特異的プローブの第1のセットと接触させるステップを含む。一部の実施形態では、標的特異的プローブの第1のセットは、配列可変標的領域に特異的な標的結合性プローブを含む。一部の実施形態では、標的特異的プローブの第1のセットは、配列可変標的領域、低メチル化可変標的領域および/または断片化可変標的領域に特異的な標的結合性プローブを含む。
一部の実施形態では、これらの方法は、第2のプールから標的領域の第2のセットまたは標的領域の複数のセットを捕捉するステップを含み、例えば、第1のプールは、上記実施形態のいずれかに示されるとおりである。一部の実施形態では、第2の複数は、エピジェネティック標的領域、例えば、高メチル化可変標的領域および/または断片化可変標的領域を含む。一部の実施形態では、第2の複数は、配列可変標的領域ならびにエピジェネティック標的領域、例えば、高メチル化可変標的領域および/または断片化可変標的領域を含む。第2のプール中のDNAを増幅するステップは、この捕捉ステップの前に実施され得る。一部の実施形態では、第2のプールから標的領域の第2の複数のセットを捕捉するステップは、第1のプールのDNAを、標的特異的プローブの第2のセットと接触させるステップを含み、標的特異的プローブの第2のセットは、配列可変標的領域に特異的な標的結合性プローブおよびエピジェネティック標的領域に特異的な標的結合性プローブを含む。一部の実施形態では、標的領域の第1のセットと標的領域の第2のセットとは、同一ではない。例えば、標的領域の第1のセットは、標的領域の第2のセット中には存在しない1つまたは複数の標的領域を含み得る。あるいはまたはさらに、標的領域の第2のセットは、標的領域の第1のセット中には存在しない1つまたは複数の標的領域を含み得る。一部の実施形態では、少なくとも1つの高メチル化可変標的領域は、第2のプールから捕捉されるが、第1のプールからは捕捉されない。一部の実施形態では、複数の高メチル化可変標的領域は、第2のプールから捕捉されるが、第1のプールからは捕捉されない。一部の実施形態では、標的領域の第1のセットは、配列可変標的領域を含み、および/または標的領域の第2のセットは、エピジェネティック標的領域を含む。一部の実施形態では、標的領域の第1のセットは、配列可変標的領域および断片化可変標的領域を含み;標的領域の第2のセットは、エピジェネティック標的領域、例えば、高メチル化可変標的領域および断片化可変標的領域を含む。一部の実施形態では、標的領域の第1のセットは、配列可変標的領域、断片化可変標的領域を含み、低メチル化可変標的領域を含み;標的領域の第2のセットは、エピジェネティック標的領域、例えば、高メチル化可変標的領域および断片化可変標的領域を含む。
一部の実施形態では、第1のプールは、低メチル化された分配のDNAの大部分および高メチル化された分配のDNAの一部分(例えば、約半分)を含み、第2のプールは、高メチル化された分配のDNAの一部分(例えば、約半分)を含む。一部のかかる実施形態では、標的領域の第1のセットは、配列可変標的領域を含み、および/または標的領域の第2のセットは、エピジェネティック標的領域を含む。配列可変標的領域および/またはエピジェネティック標的領域は、本明細書の他の場所に記載される実施形態のいずれかにおいて示されるとおりであり得る。
I.配列決定
一般に、アダプターが隣接する試料核酸は、事前の増幅ありまたはなしで、配列決定に供され得る。配列決定法には、例えば、Sanger配列決定、ハイスループット配列決定、パイロシーケンシング、合成による配列決定、単一分子配列決定、nanopore配列決定、半導体配列決定、ライゲーションによる配列決定、ハイブリダイゼーションによる配列決定、デジタル遺伝子発現(Helicos)、次世代配列決定(NGS)、合成による単一分子配列決定(SMSS)(Helicos)、超並列配列決定、クローン性単一分子アレイ(Solexa)、ショットガン配列決定、Ion Torrent、Oxford Nanopore、Roche Genia、Maxim-Gilbert配列決定、プライマーウォーキング、ならびにPacBio、SOLiD、Ion TorrentまたはNanoporeプラットフォームを使用する配列決定が含まれる。配列決定反応は、複数のレーン、複数のチャネル、複数のウェル、または複数の試料セットを実質的に同時に処理する他の手段であり得る、種々の試料処理ユニットにおいて実施され得る。試料処理ユニットには、複数のランを同時に処理することができる複数の試料チャンバもまた含まれ得る。
配列決定反応は、そのうち少なくとも1つが、がんまたは他の疾患のマーカーを含有することが公知である、1つまたは複数の形態の核酸に対して実施され得る。配列決定反応は、試料中に存在する任意の核酸断片に対しても実施され得る。一部の実施形態では、ゲノムの配列カバレッジは、5%、10%、15%、20%、25%、30%、40%、50%、60%、70%、80%、90%、95%、99%、99.9%または100%未満であり得る。一部の実施形態では、配列反応は、ゲノムの少なくとも5%、10%、15%、20%、25%、30%、40%、50%、60%、70%または80%の配列カバレッジを提供し得る。配列カバレッジは、少なくとも5、10、20、70、100、200もしくは500個の異なる遺伝子、または多くても5000、2500、1000、500もしくは100個の異なる遺伝子に対して実施され得る。
同時配列決定反応は、多重配列決定を使用して実施され得る。一部の場合には、無細胞核酸は、少なくとも1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、50000、100,000の配列決定反応で配列決定され得る。他の場合には、無細胞核酸は、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、50000、100,000未満の配列決定反応で配列決定され得る。配列決定反応は、順次または同時に実施され得る。引き続くデータ分析は、配列決定反応の全てまたは一部に対して実施され得る。一部の場合には、データ分析は、少なくとも1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、50000、100,000の配列決定反応に対して実施され得る。他の場合には、データ分析は、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、50000、100,000未満の配列決定反応に対して実施され得る。例示的な読み取り深度は、遺伝子座(塩基)1つ当たり1000~50000の読み取りである。
1.配列決定の差次的深度
一部の実施形態では、配列可変標的領域セットに対応する核酸は、エピジェネティック標的領域セットに対応する核酸よりも深い配列決定の深度まで、配列決定される。例えば、配列バリアント標的領域セットに対応する核酸についての配列決定の深度は、エピジェネティック標的領域セットに対応する核酸についての配列決定の深度よりも、少なくとも1.25倍、1.5倍、1.75倍、2倍、2.25倍、2.5倍、2.75倍、3倍、3.5倍、4倍、4.5倍、5倍、6倍、7倍、8倍、9倍、10倍、11倍、12倍、13倍、14倍もしくは15倍深くてもよい、または1.25倍~1.5倍、1.5倍~1.75倍、1.75倍~2倍、2倍~2.25倍、2.25倍~2.5倍、2.5倍~2.75倍、2.75倍~3倍、3倍~3.5倍、3.5倍~4倍、4倍~4.5倍、4.5倍~5倍、5倍~5.5倍、5.5倍~6倍、6倍~7倍、7倍~8倍、8倍~9倍、9倍~10倍、10倍~11倍、11倍~12倍、13倍~14倍、14倍~15倍もしくは15倍~100倍深くてもよい。一部の実施形態では、配列決定の当該深度は、少なくとも2倍深い。一部の実施形態では、配列決定の当該深度は、少なくとも5倍深い。一部の実施形態では、配列決定の当該深度は、少なくとも10倍深い。一部の実施形態では、配列決定の当該深度は、4倍~10倍深い。一部の実施形態では、配列決定の当該深度は、4倍~100倍深い。これらの実施形態の各々は、配列可変標的領域セットに対応する核酸が、エピジェネティック標的領域セットに対応する核酸よりも深い配列決定の深度まで配列決定される、程度を指す。
一部の実施形態では、配列可変標的領域セットに対応する捕捉されたcfDNAおよびエピジェネティック標的領域セットに対応する捕捉されたcfDNAは、並列で、例えば、同じ配列決定セル(例えば、Illuminaシーケンサーのフローセル)において、ならびに/または別々に捕捉されたセットを再度組み合わせることから生じるプールされた組成物、もしくは配列可変標的領域セットに対応するcfDNAおよびエピジェネティック標的領域セットに対応する捕捉されたcfDNAを同じ容器中に捕捉することによって得られた組成物であり得る同じ組成物において、配列決定される。
J.分析
一部の実施形態では、本明細書に記載される方法は、腫瘍(または新生物細胞もしくはがん細胞)によって産生されたDNAの存在を同定するステップを含む。
本発明の方法は、対象における状態、特にがんの存在を診断するため、状態を特徴付ける(例えば、がんをステージングするまたはがんの不均一性を決定する)ため、処置に対する状態の応答をモニタリングするため、状態または状態の引き続く過程を発症する予後リスクをもたらすために、使用され得る。本開示は、特定の処置選択肢の有効性を決定する際にも有用であり得る。処置が首尾よい場合、より多くのがんが死に、DNAを脱落させ得るので、首尾よい処置選択肢は、対象の血液中で検出されるコピー数バリエーションまたは稀な突然変異の量を増加させ得る。他の例では、これは生じない場合がある。別の例では、おそらくはある特定の処置選択肢は、がんの遺伝的プロファイルと経時的に相関付けられ得る。この相関は、治療を選択する際に有用であり得る。
さらに、がんが処置後に緩解状態にあることが観察される場合、本発明の方法は、残留疾患または疾患の再発をモニタリングするために使用され得る。
検出され得るがんの型および数には、血液がん、脳がん、肺がん、皮膚がん、鼻がん、喉がん、肝臓がん、骨がん、リンパ腫、膵がん、皮膚がん、腸がん、直腸がん、甲状腺がん、膀胱がん、腎臓がん、口腔がん、胃がん、固形状態腫瘍、不均一な腫瘍、均一な腫瘍などが含まれ得る。がんの型および/またはステージは、突然変異、稀な突然変異、インデル、コピー数バリエーション、トランスバージョン、転座、逆位、欠失、異数性、部分的異数性、倍数性、染色体不安定性、染色体構造変更、遺伝子融合、染色体融合、遺伝子トランケーション、遺伝子増幅、遺伝子重複、染色体損傷、DNA損傷、核酸の化学改変における異常な変化、エピジェネティックパターンにおける異常な変化、および核酸の5-メチルシトシンにおける異常な変化が含まれる遺伝子バリエーションから検出され得る。
遺伝的データは、特定の形態のがんを特徴付けるためにも使用され得る。がんは、組成およびステージングの両方において不均一である場合が多い。遺伝的プロファイルデータは、その特定のサブタイプの診断または処置において重要であり得る、がんの特定のサブタイプの特徴付けを可能にし得る。この情報はまた、特定の型のがんの予後に関する手掛かりを対象または実務者に提供し得、疾患の進行に従って対象または実務者のいずれかが処置選択肢を適応させるのを可能にし得る。一部のがんは、進行して、より悪性度が高くかつ遺伝的に不安定になり得る。他のがんは、良性、不活性または休眠状態のままであり得る。本開示の系および方法は、疾患進行を決定する際に有用であり得る。
さらに、本開示の方法は、対象における異常な状態の不均一性を特徴付けるために使用され得る。かかる方法は、例えば、対象に由来する細胞外ポリヌクレオチドの遺伝的プロファイルを生成するステップを含み得、遺伝的プロファイルは、コピー数バリエーションおよび稀な突然変異の分析から生じる複数のデータを含む。一部の実施形態では、異常な状態は、がんである。一部の実施形態では、異常な状態は、不均一なゲノム集団を生じるものであり得る。がんの例では、一部の腫瘍は、がんの異なるステージにある腫瘍細胞を含むことが公知である。他の例では、不均一性は、疾患の複数の病巣を含み得る。再び、がんの例では、複数の腫瘍病巣が存在し得、おそらくはこのとき、1つまたは複数の病巣は、原発部位から広がった転移の結果である。
本発明の方法は、不均一な疾患中の異なる細胞に由来する遺伝情報の総計であるフィンガープリントまたはデータのセットを生成またはプロファイリングするために使用され得る。データのこのセットは、コピー数バリエーション、エピジェネティックバリエーションおよび突然変異の分析を、単独でまたは組み合わせて含み得る。
本発明の方法は、がんまたは他の疾患を診断、予後判定、モニタリングまたは観察するために使用され得る。一部の実施形態では、本明細書の方法は、胎児を診断することにも予後判定することにもモニタリングすることにも関与せず、したがって、非侵襲性出生前試験に関するものではない。他の実施形態では、これらの方法論は、そのDNAおよび他のポリヌクレオチドが母方分子と共に共循環し得る誕生前の対象におけるがんまたは他の疾患を診断、予後判定、モニタリングまたは観察するために、妊娠対象において用いられ得る。
試料を、試料のDNA中の第2のヌクレオベースとは異なるようにDNA中の第1のヌクレオベースに影響を与える手順に供するステップを含む、NGSを介した、分配されたライブラリーの分子タグ同定のための例示的な方法は、以下のとおりである:
1.抽出されたDNA試料(例えば、本明細書に記載される標的捕捉に必要に応じて供された、ヒト試料から抽出された血漿DNA)を、DNA中の第2のヌクレオベースとは異なるようにDNA中の第1のヌクレオベースに影響を与える手順、例えば、本明細書に記載されるもののいずれかに供する。
2.全ての分配を下流の処理のためのプロセスから守る、メチル結合抗体を使用したDNA試料の物理的分配。
3.各分配への、差次的分子タグおよびNGSを可能にするアダプター配列の並行適用。例えば、高メチル化された、残留メチル化(「洗浄」)および低メチル化された分配は、分子タグと共にNGS-アダプターとライゲーションされる。
4.全ての分子タグ化された分配を再度組み合わせ、アダプター特異的DNAプライマー配列を使用して引き続いて増幅する。
5.目的のゲノム領域(例えば、がん特異的遺伝的バリアントおよび差次的にメチル化された領域)を標的化する、再度組み合わされ増幅された総ライブラリーの捕捉/ハイブリダイゼーション。
6.試料タグを付加する、捕捉されたDNAライブラリーの再増幅。異なる試料がプールされ、NGS機器上で多重でアッセイされる。
7.NGSデータのバイオインフォマティクス分析であって、分子タグは、独自の分子を同定するため、ならびに差次的にMBD分配された分子への試料のデコンボリューションのために使用される。この分析は、標準的な遺伝子配列決定/バリアント検出と並列して、ゲノム領域についての関連する5-メチルシトシンについての情報を生じ得る。
上に示された方法が含まれるがそれに限定されない、本明細書に記載される方法の一部の実施形態では、分子タグは、DNA中の第2のヌクレオベースとは異なるようにDNA中の第1のヌクレオベースに影響を与える手順、例えば、本明細書に記載される手順のいずれによっても変更されないヌクレオチド(例えば、手順が、バイサルファイト変換、またはmCに影響を与えない任意の他の変換である場合、A、TおよびGと共にmC;手順が、hmCに影響を与えない変換である場合、A、TおよびGと共にhmC;など)からなる。上に示された方法が含まれるがそれに限定されない、本明細書に記載される方法の一部の実施形態では、分子タグは、DNA中の第2のヌクレオベースとは異なるようにDNA中の第1のヌクレオベースに影響を与える手順、例えば、本明細書に記載される手順のいずれかによって変更されるヌクレオチドを含まない(例えば、手順が、バイサルファイト変換、またはCに影響を与える任意の他の変換である場合、タグは、未改変のCを含まない;手順が、mCに影響を与える変換である場合、タグは、mCを含まない;手順が、hmCに影響を与える変換である場合、タグは、hmCを含まない;など)。一般に、DNA中の第2のヌクレオベースとは異なるようにDNA中の第1のヌクレオベースに影響を与える手順は、各分配への、差次的分子タグおよびNGSを可能にするアダプター配列の並行適用のステップの前に実施され得る。
K.例示的なワークフロー
分配およびライブラリー調製のための例示的なワークフローは、本明細書で提供される。試料を、試料のDNA中の第2のヌクレオベースとは異なるようにDNA中の第1のヌクレオベースに影響を与える手順に供するステップ(例えば、分配前に実施される)の記載は、上記および実施例に提供される。一部の実施形態では、分配およびライブラリー調製ワークフローの一部または全ての特色は、組み合わせて使用され得る。
1.分配
一部の実施形態では、5-メチルシチジン(5mC)に対するモノクローナル抗体が、メチル化されたDNAを精製するために使用される。DNAは、一本鎖DNA断片を得るために、例えば、95℃で変性される。標準的なビーズまたは磁気ビーズにカップリングされたプロテインG、ならびに抗5mC抗体とのインキュベーション後の洗浄が、抗体に結合したDNAを免疫沈降させるために使用される。次いで、かかるDNAは、溶出され得る。分配は、沈降していないDNAを含み得、1つまたは複数の分配は、ビーズから溶出され得る。
一部の実施形態では、試料DNA(例えば、5ngと200ngとの間)は、メチル結合ドメイン(MBD)緩衝液、およびMBDタンパク質とコンジュゲートした磁気ビーズと混合され、一晩インキュベートされる。メチル化されたDNA(高メチル化されたDNA)は、このインキュベーションの間に、磁気ビーズ上のMBDタンパク質に結合する。非メチル化DNA(低メチル化されたDNA)またはあまりメチル化されていないDNA(中間にメチル化された)は、漸増濃度の塩を含有する緩衝液を用いて、ビーズから洗浄して除かれる。例えば、非メチル化、低メチル化された、および/または中間にメチル化されたDNAを含有する1、2つまたはそれよりも多くの画分が、かかる洗浄から得られ得る。最後に、高塩緩衝液が、強くメチル化されたDNA(高メチル化されたDNA)をMBDタンパク質から溶出させるために使用される。一部の実施形態では、これらの洗浄は、漸増レベルのメチル化を有するDNAの3つの分配(低メチル化された分配、中間にメチル化された画分および高メチル化された分配)を生じる。
一部の実施形態では、DNAの分配は、脱塩され、ライブラリー調製の酵素的ステップのために調製物中で濃縮される。
2.ライブラリー調製
一部の実施形態(例えば、分配中のDNAを濃縮した後の)では、分配されたDNAは、例えば、DNA分子の末端オーバーハングを伸長させ、アデノシン残基を断片の3’末端に付加し、各DNA断片の5’末端をリン酸化することによって、ライゲーション可能にされる。DNAリガーゼおよびアダプターが、各分配されたDNA分子を各末端上でアダプターとライゲーションさせるために添加される。これらのアダプターは、他の分配において使用されるアダプター中の分配タグから識別可能な分配タグ(例えば、非ランダムな非独自のバーコード)を含有する。次いで、2つ、3つ(またはそれよりも多く)の分配が一緒にプールされ、(例えば、アダプターに特異的なプライマーなどを用いたPCRによって)増幅される。
PCRの後、増幅されたDNAは、富化前に浄化され、濃縮され得る。増幅されたDNAは、目的の特定の領域を標的化する本明細書に記載されるプローブ(これは、例えば、ビオチン化されたRNAプローブであり得る)の収集と接触させられる。混合物は、例えば、塩緩衝液中で、例えば一晩、インキュベートされる。プローブは、(例えば、ストレプトアビジン磁気ビーズを使用して)捕捉され、例えば、一連の塩洗浄によって、捕捉されなかった増幅されたDNAから分離され、それによって、試料が富化される。富化の後、富化された試料は、PCRによって増幅される。一部の実施形態では、PCRプライマーは、試料タグを含有し、それによって、試料タグをDNA分子中に取り込む。一部の実施形態では、異なる試料由来のDNAが一緒にプールされ、次いで、例えば、Illumina NovaSeqシーケンサーを使用して、多重配列決定される。
III.ある特定の開示された方法の追加の特色
A.試料
試料は、対象から単離された任意の生体試料であり得る。試料は、身体試料であり得る。試料には、身体組織、例えば、既知のまたは疑われる固形腫瘍、全血、血小板、血清、血漿、糞便、赤血球、白血球(white blood cell)または白血球(leucocyte)、内皮細胞、組織生検、脳脊髄液 滑液、リンパ液、腹水、間質または細胞外液、歯肉溝滲出液が含まれる細胞間の空間中の液、骨髄、胸水、脳脊髄液、唾液、粘液、痰、精液、汗、尿が含まれ得る。試料は、好ましくは、体液、特に、血液およびその画分、ならびに尿である。試料は、対象から元々単離された形態であり得、あるいは構成要素、例えば、細胞を除去もしくは添加するため、または別の構成要素に対して1つの構成要素を富化するためのさらなる処理に供されていることができる。したがって、分析のための好ましい体液は、無細胞核酸を含有する血漿または血清である。試料は、対象から単離され得または得られ得、試料分析の場所に輸送され得る。試料は、望ましい温度、例えば、室温、4℃、-20℃および/または-80℃で保存および発送され得る。試料は、試料分析の場所において、対象から単離され得または得られ得る。対象は、ヒト、哺乳動物、動物、コンパニオン動物、サービス動物またはペットであり得る。対象は、がんを有し得る。対象は、がんも検出可能ながん症状も有さない場合がある。対象は、1つまたは複数のがん治療、例えば、化学療法、抗体、ワクチンまたは生物製剤(biologies)のうちいずれか1つまたは複数で処置されていてもよい。対象は、緩解状態にあり得る。対象は、がんまたは任意のがん関連の遺伝的突然変異/障害に対して感受性であると診断されてもされなくてもよい。
血漿の体積は、配列決定される領域についての所望の読み取り深度に依存し得る。例示的な体積は、0.4~40ml、5~20ml、10~20mlである。例えば、体積は、0.5mL、1mL、5mL 10mL、20mL、30mLまたは40mLであり得る。試料採取された血漿の体積は、5~20mLであり得る。
試料は、ゲノム当量を含有する、種々の量の核酸を含み得る。例えば、約30ngのDNAの試料は、約10,000(10)の一倍体ヒトゲノム当量、およびcfDNAの場合には、約2000億(2×1011)個の個々のポリヌクレオチド分子を含有し得る。同様に、約100ngのDNAの試料は、約30,000の一倍体ヒトゲノム当量、およびcfDNAの場合には、約6000億個の個々の分子を含有し得る。
試料は、異なる供給源から、例えば、同じ対象の細胞および無細胞から、異なる対象の細胞および無細胞からの核酸を含み得る。試料は、突然変異を保有する核酸を含み得る。例えば、試料は、生殖系列突然変異および/または体細胞突然変異を保有するDNAを含み得る。生殖系列突然変異は、対象の生殖系列DNA中に存在する突然変異を指す。体細胞突然変異は、対象の体細胞、例えば、がん細胞に起源する突然変異を指す。試料は、がん関連の突然変異(例えば、がん関連の体細胞突然変異)を保有するDNAを含み得る。試料は、エピジェネティックバリアント(すなわち、化学的またはタンパク質改変)を含み得、エピジェネティックバリアントは、遺伝的バリアント、例えば、がん関連の突然変異の存在に関連する。一部の実施形態では、試料は、遺伝的バリアントの存在に関連するエピジェネティックバリアントを含み、試料は、その遺伝的バリアントを含まない。
増幅前の試料中の無細胞核酸の例示的な量は、約1fg~約1μg、例えば、1pg~200ng、1ng~100ng、10ng~1000ngの範囲である。例えば、量は、最大で約600ng、最大で約500ng、最大で約400ng、最大で約300ng、最大で約200ng、最大で約100ng、最大で約50ngまたは最大で約20ngの無細胞核酸分子であり得る。量は、少なくとも1fg、少なくとも10fg、少なくとも100fg、少なくとも1pg、少なくとも10pg、少なくとも100pg、少なくとも1ng、少なくとも10ng、少なくとも100ng、少なくとも150ngまたは少なくとも200ngの無細胞核酸分子であり得る。量は、最大で1フェムトグラム(fg)、10fg、100fg、1ピコグラム(pg)、10pg、100pg、1ng、10ng、100ng、150ngまたは200ngの無細胞核酸分子であり得る。方法は、1フェムトグラム(fg)~200ng-を得ることを含み得る。
無細胞核酸は、細胞内に含有されることもなく細胞に他の方法で結合してもいない核酸、または言い換えると、インタクトな細胞を除去した後に試料中に残存している核酸である。無細胞核酸には、ゲノムDNA、ミトコンドリアDNA、siRNA、miRNA、循環RNA(cRNA)、tRNA、rRNA、核小体低分子RNA(snoRNA)、Piwi相互作用性RNA(piRNA)、長い非コードRNA(長ncRNA)、またはこれらのうちいずれかの断片が含まれる、DNA、RNA、およびそれらのハイブリッドが含まれる。無細胞核酸は、二本鎖、一本鎖、またはそれらのハイブリッドであり得る。無細胞核酸は、分泌または細胞死プロセス、例えば、細胞の壊死およびアポトーシスを介して、体液中に放出され得る。一部の無細胞核酸、例えば、循環腫瘍DNA(ctDNA)は、がん細胞から体液中に放出される。他は、健康な細胞から放出される。一部の実施形態では、cfDNAは、無細胞胎児DNA(cffDNA)である。一部の実施形態では、無細胞核酸は、腫瘍細胞によって産生される。一部の実施形態では、無細胞核酸は、腫瘍細胞および非腫瘍細胞の混合物によって産生される。
無細胞核酸は、約100~500ヌクレオチドの例示的なサイズ分布を有し、110~約230ヌクレオチドの分子が、分子の約90%を占め、最頻値は約168ヌクレオチドであり、第2の小さいピークは、240~440ヌクレオチドの間の範囲である。
無細胞核酸は、溶液中で見出される無細胞核酸が、インタクトな細胞および体液の他の非可溶性構成要素から分離される、分画または分配ステップを介して、体液から単離され得る。分配は、遠心分離または濾過などの技法を含み得る。あるいは、体液中の細胞は溶解され得、無細胞および細胞性核酸が一緒に処理され得る。一般に、緩衝液の添加および洗浄ステップの後に、核酸は、アルコールを用いて沈殿され得る。夾雑物または塩を除去するためのシリカベースのカラムなどのさらなる清浄化ステップが使用され得る。バイサルファイト配列決定、ハイブリダイゼーションおよび/またはライゲーションのための非特異的バルク担体核酸、例えば、C 1 DNA、DNAまたはタンパク質が、手順のある特定の態様、例えば収量を最適化するために、反応を通じて添加され得る。
かかる処理の後、試料は、二本鎖DNA、一本鎖DNAおよび一本鎖RNAが含まれる種々の形態の核酸を含み得る。一部の実施形態では、一本鎖DNAおよびRNAは、二本鎖形態に変換され得、そうして、これらは、引き続く処理ステップおよび分析ステップに含められる。
試料中の二本鎖DNA分子、および二本鎖DNA分子に変換された一本鎖核酸分子は、一方の末端または両方の末端のいずれかにおいて、アダプターに連結され得る。典型的には、二本鎖分子は、4種全ての標準的なヌクレオチドの存在下で、5’-3’ポリメラーゼおよび3’-5’エキソヌクレアーゼ(またはプルーフリーディング機能)を有するポリメラーゼによる処理によって平滑末端化される。Klenow大断片およびT4ポリメラーゼが、適切なポリメラーゼの例である。平滑末端化されたDNA分子は、少なくとも部分的に二本鎖のアダプター(例えば、Y型またはベル型アダプター)とライゲーションされ得る。あるいは、相補的ヌクレオチドが、ライゲーションを容易にするために、試料核酸およびアダプターの平滑末端に付加され得る。平滑末端ライゲーションおよび粘着末端ライゲーションの両方が、本明細書で企図される。平滑末端ライゲーションでは、核酸分子およびアダプタータグの両方が、平滑末端を有する。粘着末端ライゲーションでは、典型的には、核酸分子が「A」オーバーハングを保有し、アダプターが「T」オーバーハングを保有する。
B.増幅
アダプターが隣接する試料核酸は、PCRおよび他の増幅法によって増幅され得る。増幅は、増幅されるDNA分子に隣接するアダプター中のプライマー結合部位に結合するプライマーによって、典型的にはプライムされる。増幅法は、サーモサイクリングから生じる変性、アニーリングおよび伸長のサイクルを含み得、または転写媒介増幅では等温であり得る。他の増幅法には、リガーゼ連鎖反応、鎖置換増幅、核酸配列ベースの増幅、および自家持続配列ベースの複製が含まれる。
一部の実施形態では、本発明の方法は、アダプターに連結させる前に二本鎖核酸の少なくとも50、60、70または80%の増幅を生じる、Tテイル付きアダプターおよびCテイル付きアダプターとのdsDNAライゲーションを実施する。好ましくは、本発明の方法は、Tテイル付きアダプター単独で実施される対照法と比較して、増幅された分子の量または数を、少なくとも10、15または20%増加させる。
C.ベイトセット;捕捉部分
上で議論されるように、試料中の核酸は、標的配列を有する分子が、引き続く分析のために捕捉される、捕捉ステップに供され得る。標的捕捉は、捕捉部分、例えば、ビオチンまたは以下で注目される他の例で標識されたオリゴヌクレオチドベイトを含むベイトセットの使用を含み得る。プローブは、領域、例えば、遺伝子のパネルにわたってタイリングするように選択された配列を有し得る。一部の実施形態では、ベイトセットは、本明細書の他の場所で議論されるように、それぞれ、標的領域のセット、例えば、配列可変標的領域セットおよびエピジェネティック標的領域セットのものについて、より高いおよびより低い捕捉収量を有し得る。かかるベイトセットは、標的分子とベイトとのハイブリダイゼーションを可能にする条件下で、試料と組み合わせされる。次いで、捕捉された分子は、捕捉部分を使用して単離される。例えば、ビーズベースのストレプトアビジンによるビオチン捕捉部分。かかる方法は、例えば、これにより参照により本明細書に組み込まれる、2017年12月26日に発行した米国特許第9,850,523号にさらに記載される。
捕捉部分には、ビオチン、アビジン、ストレプトアビジン、特定のヌクレオチド配列を含む核酸、抗体によって認識されるハプテン、および磁気的に誘引可能な粒子が含まれるがこれらに限定されない。抽出部分は、結合対、例えば、ビオチン/ストレプトアビジンまたはハプテン/抗体のメンバーであり得る。一部の実施形態では、分析物に結合された捕捉部分は、単離可能な部分、例えば、磁気的に誘引可能な粒子、または遠心分離を介して沈降され得る大きい粒子に結合されたその結合対によって捕捉される。捕捉部分は、捕捉部分を欠如する核酸からの、捕捉部分を保有する核酸の親和性分離を可能にする、任意の型の分子であり得る。例示的な捕捉部分は、固相に連結されたもしくは連結可能なストレプトアビジンへの結合によって親和性分離を可能にするビオチン、または固相に連結されたもしくは連結可能な相補的オリゴヌクレオチドへの結合を介した親和性分離を可能にするオリゴヌクレオチドである。
D.標的特異的プローブの収集
一部の実施形態では、標的特異的プローブの収集が、本明細書に記載される方法において使用される。一部の実施形態では、標的特異的プローブの収集は、配列可変標的領域セットに特異的な標的結合性プローブおよびエピジェネティック標的領域セットに特異的な標的結合性プローブを含む。一部の実施形態では、配列可変標的領域セットに特異的な標的結合性プローブの捕捉収量は、エピジェネティック標的領域セットに特異的な標的結合性プローブの捕捉収量よりも高い(例えば、少なくとも2倍高い)。一部の実施形態では、標的特異的プローブの収集は、エピジェネティック標的領域セットに特異的なその捕捉収量よりも高い(例えば、少なくとも2倍高い)、配列可変標的領域セットに特異的な捕捉収量を有するように構成される。
一部の実施形態では、配列可変標的領域セットに特異的な標的結合性プローブの捕捉収量は、エピジェネティック標的領域セットに特異的な標的結合性プローブの捕捉収量よりも、少なくとも1.25倍、1.5倍、1.75倍、2倍、2.25倍、2.5倍、2.75倍、3倍、3.5倍、4倍、4.5倍、5倍、6倍、7倍、8倍、9倍、10倍、11倍、12倍、13倍、14倍または15倍高い。一部の実施形態では、配列可変標的領域セットに特異的な標的結合性プローブの捕捉収量は、エピジェネティック標的領域セットに特異的な標的結合性プローブの捕捉収量よりも、1.25倍~1.5倍、1.5倍~1.75倍、1.75倍~2倍、2倍~2.25倍、2.25倍~2.5倍、2.5倍~2.75倍、2.75倍~3倍、3倍~3.5倍、3.5倍~4倍、4倍~4.5倍、4.5倍~5倍、5倍~5.5倍、5.5倍~6倍、6倍~7倍、7倍~8倍、8倍~9倍、9倍~10倍、10倍~11倍、11倍~12倍、13倍~14倍または14倍~15倍高い。
一部の実施形態では、標的特異的プローブの収集は、エピジェネティック標的領域セットについてのその捕捉収量よりも少なくとも1.25倍、1.5倍、1.75倍、2倍、2.25倍、2.5倍、2.75倍、3倍、3.5倍、4倍、4.5倍、5倍、6倍、7倍、8倍、9倍、10倍、11倍、12倍、13倍、14倍または15倍高い、配列可変標的領域セットに特異的な捕捉収量を有するように構成される。一部の実施形態では、標的特異的プローブの収集は、エピジェネティック標的領域セットに特異的なその捕捉収量よりも1.25倍~1.5倍、1.5倍~1.75倍、1.75倍~2倍、2倍~2.25倍、2.25倍~2.5倍、2.5倍~2.75倍、2.75倍~3倍、3倍~3.5倍、3.5倍~4倍、4倍~4.5倍、4.5倍~5倍、5倍~5.5倍、5.5倍~6倍、6倍~7倍、7倍~8倍、8倍~9倍、9倍~10倍、10倍~11倍、11倍~12倍、13倍~14倍または14倍~15倍高い、配列可変標的領域セットに特異的な捕捉収量を有するように構成される。
プローブの収集は、濃度、異なる長さおよび/または化学(例えば、親和性に影響を与える)、ならびにそれらの組合せが含まれる種々の方法で、配列可変標的領域セットについてより高い捕捉収量を提供するように構成され得る。親和性は、以下で議論されるように、プローブ長さを調整すること、および/またはヌクレオチド改変を含めることによって、モジュレートされ得る。
一部の実施形態では、配列可変標的領域セットに特異的な標的特異的プローブは、エピジェネティック標的領域セットに特異的な標的特異的プローブよりも高い濃度で存在する。一部の実施形態では、配列可変標的領域セットに特異的な標的結合性プローブの濃度は、エピジェネティック標的領域セットに特異的な標的結合性プローブの濃度よりも少なくとも1.25倍、1.5倍、1.75倍、2倍、2.25倍、2.5倍、2.75倍、3倍、3.5倍、4倍、4.5倍、5倍、6倍、7倍、8倍、9倍、10倍、11倍、12倍、13倍、14倍または15倍高い。一部の実施形態では、配列可変標的領域セットに特異的な標的結合性プローブの濃度は、エピジェネティック標的領域セットに特異的な標的結合性プローブの濃度よりも1.25倍~1.5倍、1.5倍~1.75倍、1.75倍~2倍、2倍~2.25倍、2.25倍~2.5倍、2.5倍~2.75倍、2.75倍~3倍、3倍~3.5倍、3.5倍~4倍、4倍~4.5倍、4.5倍~5倍、5倍~5.5倍、5.5倍~6倍、6倍~7倍、7倍~8倍、8倍~9倍、9倍~10倍、10倍~11倍、11倍~12倍、13倍~14倍または14倍~15倍高い。かかる実施形態では、濃度は、各セット中の個々のプローブの、平均の、体積当たりの質量濃度を指し得る。
一部の実施形態では、配列可変標的領域セットに特異的な標的特異的プローブは、エピジェネティック標的領域セットに特異的な標的特異的プローブよりも高い、それらの標的に対する親和性を有する。親和性は、異なるプローブ化学を使用することによるものが含まれる、当業者に公知の任意の方法でモジュレートされ得る。例えば、ある特定のヌクレオチド改変、例えば、シトシン5-メチル化(ある特定の配列の文脈では)、2’の糖位置においてヘテロ原子を提供する改変、およびLNAヌクレオチドは、二本鎖核酸の安定性を増加させ得、これは、かかる改変を有するオリゴヌクレオチドがそれらの相補的配列に対して相対的に高い親和性を有することを示す。例えば、Severin et al., Nucleic Acids Res. 39: 8740-8751 (2011);Freier et al., Nucleic Acids Res. 25: 4429-4443 (1997);米国特許第9,738,894号を参照されたい。また、より長い配列長さは、増加した親和性を一般に提供する。他のヌクレオチド改変、例えば、ヌクレオベースヒポキサンチンによるグアニンの置換は、オリゴヌクレオチドとその相補的配列との間の水素結合の量を低減させることによって、親和性を低減させる。一部の実施形態では、配列可変標的領域セットに特異的な標的特異的プローブは、それらの標的に対するそれらの親和性を増加させる改変を有する。一部の実施形態では、あるいはまたはさらに、エピジェネティック標的領域セットに特異的な標的特異的プローブは、それらの標的に対するそれらの親和性を減少させる改変を有する。一部の実施形態では、配列可変標的領域セットに特異的な標的特異的プローブは、エピジェネティック標的領域セットに特異的な標的特異的プローブよりも長い平均長さおよび/または高い平均融解温度を有する。これらの実施形態は、捕捉収量における所望の倍率の差異、例えば、上記任意の倍率の差異またはその範囲を達成するために、互いに、および/または上で議論される濃度における差異と組み合わされ得る。
一部の実施形態では、標的特異的プローブは、捕捉部分を含む。捕捉部分は、本明細書に記載される捕捉部分のいずれか、例えば、ビオチンであり得る。一部の実施形態では、標的特異的プローブは、例えば、捕捉部分の結合対の相互作用を介して、固体支持体に、例えば、共有結合的または非共有結合的に連結される。一部の実施形態では、固体支持体は、ビーズ、例えば、磁気ビーズである。
一部の実施形態では、配列可変標的領域セットに特異的な標的特異的プローブおよび/またはエピジェネティック標的領域セットに特異的な標的特異的プローブは、上で議論されるベイトセット、例えば、捕捉部分と、領域、例えば、遺伝子のパネルにわたってタイリングするように選択された配列とを含むプローブである。
一部の実施形態では、標的特異的プローブは、単一の組成物で提供される。単一の組成物は、溶液(液体または凍結された)であり得る。あるいは、単一の組成物は、凍結乾燥物であり得る。
あるいは、標的特異的プローブは、例えば、エピジェネティック標的領域セットに特異的なプローブを含む第1の組成物および配列可変標的領域セットに特異的なプローブを含む第2の組成物を含む、複数の組成物として提供され得る。これらのプローブは、組み合わされたプローブ組成物に、濃度および/または捕捉収量における上述の倍率の差異のいずれかを提供するのに適切な割合で、混合され得る。あるいは、これらは、それぞれ捕捉されたエピジェネティック標的領域および配列可変標的領域を含む第1および第2の組成物を提供するために、別々の捕捉手順(例えば、試料のアリコートを用いて、または同じ試料を用いて順次)において使用され得る。
1.エピジェネティック標的領域に特異的なプローブ
エピジェネティック標的領域セットに対するプローブは、新生物(例えば、腫瘍またはがん)細胞由来のDNAを、健康な細胞、例えば、非新生物性循環細胞から差別化する可能性が高い、1つまたは複数の型の標的領域に特異的なプローブを含み得る。かかる領域の例示的な型は、例えば、捕捉されたセットに関する上記セクションにおいて、本明細書で詳細に議論される。エピジェネティック標的領域セットに対するプローブは、例えば、本明細書に記載されるような、1つまたは複数の対照領域に対するプローブもまた含み得る。
一部の実施形態では、エピジェネティック標的領域セットに対するプローブは、少なくとも100kbp、例えば、少なくとも200kbp、少なくとも300kbpまたは少なくとも400kbpのフットプリントを有する。一部の実施形態では、エピジェネティック標的領域セットは、100~20Mbp、例えば、100~200kbp、200~300kbp、300~400kbp、400~500kbp、500~600kbp、600~700kbp、700~800kbp、800~900kbp、900~1,000kbp、1~1.5Mbp、1.5~2Mbp、2~3Mbp、3~4Mbp、4~5Mbp、5~6Mbp、6~7Mbp、7~8Mbp、8~9Mbp、9~10Mbpまたは10~20Mbpの範囲のフットプリントを有する。一部の実施形態では、エピジェネティック標的領域セットは、少なくとも20Mbpのフットプリントを有する。
a.高メチル化可変標的領域
一部の実施形態では、エピジェネティック標的領域セットに対するプローブは、1つまたは複数の高メチル化可変標的領域に特異的なプローブを含む。高メチル化可変標的領域は、上に示されたもののいずれかであり得る。例えば、一部の実施形態では、高メチル化可変標的領域に特異的なプローブは、表1に列挙された複数の遺伝子座、例えば、表1に列挙された遺伝子座の少なくとも10%、20%、30%、40%、50%、60%、70%、80%、90%または100%に特異的なプローブを含む。一部の実施形態では、高メチル化可変標的領域に特異的なプローブは、表2に列挙された複数の遺伝子座、例えば、表2に列挙された遺伝子座の少なくとも10%、20%、30%、40%、50%、60%、70%、80%、90%または100%に特異的なプローブを含む。一部の実施形態では、高メチル化可変標的領域に特異的なプローブは、表1または表2に列挙された複数の遺伝子座、例えば、表1または表2に列挙された遺伝子座の少なくとも10%、20%、30%、40%、50%、60%、70%、80%、90%または100%に特異的なプローブを含む。一部の実施形態では、標的領域として含まれる各遺伝子座について、遺伝子の転写開始部位と停止コドン(選択的スプライシングされる遺伝子については、最後の停止コドン)との間に結合するハイブリダイゼーション部位を有する1つまたは複数のプローブが存在し得る。一部の実施形態では、1つまたは複数のプローブは、列挙された位置の300bp以内、例えば、200または100bp以内に結合する。一部の実施形態では、プローブは、上に列挙された位置と重複するハイブリダイゼーション部位を有する。一部の実施形態では、高メチル化標的領域に特異的なプローブには、乳房、結腸、腎臓、肝臓および肺がんのうち1、2、3、4または5つにおいて高メチル化を集合的に示す高メチル化標的領域の1、2、3、4または5つのサブセットに特異的なプローブが含まれる。
b.低メチル化可変標的領域
一部の実施形態では、エピジェネティック標的領域セットに対するプローブは、1つまたは複数の低メチル化可変標的領域に特異的なプローブを含む。低メチル化可変標的領域は、上に示されたもののいずれかであり得る。例えば、1つまたは複数の低メチル化可変標的領域に特異的なプローブには、腫瘍細胞において低減されたメチル化を示し得る領域、例えば、反復エレメント、例えば、LINE1エレメント、Aluエレメント、セントロメアタンデムリピート、動原体周囲タンデムリピートおよびサテライトDNA、ならびに健康な細胞では通常メチル化されている遺伝子間領域に対するプローブが含まれ得る。
一部の実施形態では、低メチル化可変標的領域に特異的なプローブには、反復エレメントおよび/または遺伝子間領域に特異的なプローブが含まれる。一部の実施形態では、反復エレメントに特異的なプローブには、LINE1エレメント、Aluエレメント、セントロメアタンデムリピート、動原体周囲タンデムリピートおよび/またはサテライトDNAのうち1、2、3、4または5つに特異的なプローブが含まれる。
がん関連の低メチル化を示すゲノム領域に特異的な例示的なプローブには、ヒト第1染色体のヌクレオチド8403565~8953708および/または151104701~151106035に特異的なプローブが含まれる。一部の実施形態では、低メチル化可変標的領域に特異的なプローブには、ヒト第1染色体のヌクレオチド8403565~8953708および/または151104701~151106035と重複するまたはそれを含む領域に特異的なプローブが含まれる。
c.CTCF結合領域
一部の実施形態では、エピジェネティック標的領域セットに対するプローブには、CTCF結合領域に特異的なプローブが含まれる。一部の実施形態では、CTCF結合領域に特異的なプローブは、少なくとも10、20、50、100、200もしくは500個のCTCF結合領域、または10~20、20~50、50~100、100~200、200~500もしくは500~1000個のCTCF結合領域、例えば、上記の、あるいは上で引用したCTCFBSDBまたはCuddapah et al.、Martin et al.もしくはRhee et al.の論文のうち1つまたは複数に記載されるCTCF結合領域などに特異的なプローブを含む。一部の実施形態では、エピジェネティック標的領域セットに対するプローブは、CTCF結合部位の少なくとも100bp、少なくとも200bp少なくとも300bp、少なくとも400bp、少なくとも500bp、少なくとも750bpまたは少なくとも1000bp上流および下流の領域を含む。
d.転写開始部位
一部の実施形態では、エピジェネティック標的領域セットに対するプローブには、転写開始部位に特異的なプローブが含まれる。一部の実施形態では、転写開始部位に特異的なプローブは、少なくとも10、20、50、100、200もしくは500個の転写開始部位、または10~20、20~50、50~100、100~200、200~500もしくは500~1000個の転写開始部位、例えば、DBTSSに列挙された転写開始部位などに特異的なプローブを含む。一部の実施形態では、エピジェネティック標的領域セットに対するプローブは、転写開始部位の少なくとも100bp、少なくとも200bp、少なくとも300bp、少なくとも400bp、少なくとも500bp、少なくとも750bpまたは少なくとも1000bp上流および下流の配列に対するプローブを含む。
e.限局的増幅
上で注目したように、限局的増幅は、体細胞突然変異であるが、これらは、ある特定のエピジェネティック変化、例えば、メチル化における変化を検出するためのアプローチと類似の様式で、読み取り頻度に基づいて配列決定することによって検出され得る。したがって、がんにおいて限局的増幅を示し得る領域は、上で議論されるように、エピジェネティック標的領域セット中に含まれ得る。一部の実施形態では、エピジェネティック標的領域セットに特異的なプローブには、限局的増幅に特異的なプローブが含まれる。一部の実施形態では、限局的増幅に特異的なプローブには、AR、BRAF、CCND1、CCND2、CCNE1、CDK4、CDK6、EGFR、ERBB2、FGFR1、FGFR2、KIT、KRAS、MET、MYC、PDGFRA、PIK3CAおよびRAF1のうち1つまたは複数に特異的なプローブが含まれる。例えば、一部の実施形態では、限局的増幅に特異的なプローブには、上述の標的のうち少なくとも2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17または18個のうち1つまたは複数に特異的なプローブが含まれる。
f.対照領域
データ検証を容易にするために、対照領域を含むことが有用であり得る。一部の実施形態では、エピジェネティック標的領域セットに特異的なプローブには、本質的に全ての試料においてメチル化されていると予想される、メチル化された対照領域に特異的なプローブが含まれる。一部の実施形態では、エピジェネティック標的領域セットに特異的なプローブには、本質的に全ての試料において低メチル化されていると予想される、低メチル化された対照領域に特異的なプローブが含まれる。
2.配列可変標的領域に特異的なプローブ
配列可変標的領域セットに対するプローブは、がんにおいて体細胞突然変異を受けることが公知の複数の領域に特異的なプローブを含み得る。プローブは、本明細書に記載される任意の配列可変標的領域セットに特異的であり得る。例示的な配列可変標的領域セットは、例えば、捕捉されたセットに関する上記セクションにおいて、本明細書で詳細に議論される。
一部の実施形態では、配列可変標的領域プローブセットは、少なくとも0.5kb、例えば、少なくとも1kb、少なくとも2kb、少なくとも5kb、少なくとも10kb、少なくとも20kb、少なくとも30kbまたは少なくとも40kbのフットプリントを有する。一部の実施形態では、エピジェネティック標的領域プローブセットは、0.5~100kb、例えば、0.5~2kb、2~10kb、10~20kb、20~30kb、30~40kb、40~50kb、50~60kb、60~70kb、70~80kb、80~90kbおよび90~100kbの範囲のフットプリントを有する。一部の実施形態では、配列可変標的領域プローブセットは、少なくとも50kbp、例えば、少なくとも100kbp、少なくとも200kbp、少なくとも300kbpまたは少なくとも400kbpのフットプリントを有する。一部の実施形態では、配列可変標的領域プローブセットは、100~2000kbp、例えば、100~200kbp、200~300kbp、300~400kbp、400~500kbp、500~600kbp、600~700kbp、700~800kbp、800~900kbp、900~1,000kbp、1~1.5Mbpまたは1.5~2Mbpの範囲のフットプリントを有する。一部の実施形態では、配列可変標的領域セットは、少なくとも2Mbpのフットプリントを有する。
一部の実施形態では、配列可変標的領域セットに特異的なプローブは、表3の遺伝子のうち少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも55、少なくとも60、少なくとも65または70個の少なくとも一部分に特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに特異的なプローブは、表3のSNVのうち少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも55、少なくとも60、少なくとも65または70個に特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに特異的なプローブは、表3の融合のうち少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5または6個に特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに特異的なプローブは、表3のインデルのうち少なくとも1、少なくとも2または3個の少なくとも一部分に特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに特異的なプローブは、表4の遺伝子のうち少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも55、少なくとも60、少なくとも65、少なくとも70または73個の少なくとも一部分に特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに特異的なプローブは、表4のSNVのうち少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも55、少なくとも60、少なくとも65、少なくとも70または73個に特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに特異的なプローブは、表4の融合のうち少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5または6個に特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに特異的なプローブは、表4のインデルのうち少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17または18個の少なくとも一部分に特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに特異的なプローブは、表5の遺伝子のうち少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19または少なくとも20個の少なくとも一部分に特異的なプローブを含む。
一部の実施形態では、配列可変標的領域セットに特異的なプローブは、少なくとも10、20、30または35個のがん関連遺伝子、例えば、AKT1、ALK、BRAF、CCND1、CDK2A、CTNNB1、EGFR、ERBB2、ESR1、FGFR1、FGFR2、FGFR3、FOXL2、GATA3、GNA11、GNAQ、GNAS、HRAS、IDH1、IDH2、KIT、KRAS、MED12、MET、MYC、NFE2L2、NRAS、PDGFRA、PIK3CA、PPP2R1A、PTEN、RET、STK11、TP53およびU2AF1由来の標的領域に特異的なプローブを含む。
E.捕捉されたDNAを含む組成物
捕捉されたDNAの第1および第2の集団を含む組合せ物が、本明細書で提供される。第1の集団は、第2の集団よりも高い割合でヌクレオベース改変、例えば、シトシン改変を有するDNAを含み得るまたはそれに由来し得る。第1の集団は、変更された塩基対合特異性を有する、DNA中に元々存在する第1のヌクレオベースの形態と、変更された塩基対合特異性を有さない第2のヌクレオベースとを含み得、塩基対合特異性の変更前のDNA中に元々存在する第1のヌクレオベースの形態は、改変されたまたは未改変のヌクレオベースであり、第2のヌクレオベースは、第1のヌクレオベースとは異なる改変されたまたは未改変のヌクレオベースであり、塩基対合特異性の変更前のDNA中に元々存在する第1のヌクレオベースの形態と第2のヌクレオベースとは、同じ塩基対合特異性を有する。第2の集団は、変更された塩基対合特異性を有する、DNA中に元々存在する第1のヌクレオベースの形態を含まない。一部の実施形態では、第1の集団中により高い割合で存在するヌクレオベース改変は、シトシン改変である。一部のかかる実施形態では、シトシン改変は、シトシンメチル化である。一部の実施形態では、第1のヌクレオベースは、改変されたまたは未改変のシトシンであり、第2のヌクレオベースは、改変されたまたは未改変のシトシンである。第1および第2のヌクレオベースは、本明細書で議論されるもののいずれかであり得る。一部の実施形態では、第1の集団中により高い割合で存在する改変されたヌクレオベースは、DNA中に元々存在するヌクレオベースの形態である。一部の実施形態では、第1の集団中により高い割合で存在する改変されたヌクレオベースは、第1のヌクレオベースと第2のヌクレオベースとに異なるように影響を与える手順によって生成されたヌクレオベースの形態である。
一部の実施形態では、第1の集団は、1つまたは複数の配列タグの第1のセットから選択される配列タグを含み、第2の集団は、1つまたは複数の配列タグの第2のセットから選択される配列タグを含み、配列タグの第2のセットは、配列タグの第1のセットとは異なる。配列タグは、バーコードを含み得る。
一部の実施形態では、第1の集団は、保護されたhmC、例えば、グルコシル化されたhmCを含む。
一部の実施形態では、第1の集団は、本明細書で議論される変換手順、例えば、バイサルファイト変換、Ox-BS変換、TAB変換、ACE変換、TAP変換、TAPSβ変換またはCAP変換のいずれかに供されている。一部の実施形態では、第1の集団は、hmCの保護と、その後の、mCおよび/またはCの脱アミノ化とに供されている。
組合せ物の一部の実施形態では、第1の集団は、第2の集団よりも高い割合でシトシン改変を有するDNAを含むか、またはそれに由来したものであり、第1の集団は、第1および第2のサブ集団を含み、第1のヌクレオベースは、改変されたまたは未改変のヌクレオベースであり、第2のヌクレオベースは、第1のヌクレオベースとは異なる改変されたまたは未改変のヌクレオベースであり、第1のヌクレオベースと第2のヌクレオベースとは、同じ塩基対合特異性を有する。一部の実施形態では、第2の集団は、第1のヌクレオベースを含まない。一部の実施形態では、第1のヌクレオベースは、改変されたまたは未改変のシトシンであり、第2のヌクレオベースは、改変されたまたは未改変のシトシンであり、必要に応じて、改変されたシトシンは、mCまたはhmCである。一部の実施形態では、第1のヌクレオベースは、改変されたまたは未改変のアデニンであり、第2のヌクレオベースは、改変されたまたは未改変のアデニンであり、必要に応じて、改変されたアデニンは、mAである。
一部の実施形態では、第1のヌクレオベース(例えば、改変されたシトシン)は、ビオチン化される。一部の実施形態では、第1のヌクレオベース(例えば、改変されたシトシン)は、親和性標識(例えば、ビオチン)を含む、β-6-アジド-グルコシル-5-ヒドロキシメチルシトシンへのヒュスゲン環化付加の産物である。
本明細書に記載される組合せ物のいずれかでは、捕捉されたDNAは、cfDNAを含み得る。
捕捉されたDNAは、例えば、エピジェネティック標的領域セットに対応するDNAの濃度よりも高い、配列可変標的領域セットに対応するDNAの濃度(上で議論されるようにフットプリントサイズに関して標準化された)が含まれる、捕捉されたセットに関する本明細書に記載される特色のいずれかを有し得る。一部の実施形態では、捕捉されたセットのDNAは、本明細書に記載されるようにDNAに付加され得る配列タグを含む。一般に、配列タグを含めることは、それらの天然に存在するタグ化されていない形態とは異なるDNA分子を生じる。
組合せ物は、本明細書に記載されるプローブセットまたは配列決定プライマーをさらに含み得、その各々は、天然に存在する核酸分子とは異なり得る。例えば、本明細書に記載されるプローブセットは、捕捉部分を含み得、配列決定プライマーは、天然に存在しない標識を含み得る。
F.コンピューターシステム
本開示の方法は、コンピューターシステムを使用して、またはその助けにより、実行され得る。例えば、かかる方法は、試料を、試料のDNA中の第2のヌクレオベースとは異なるようにDNA中の第1のヌクレオベースに影響を与える手順に供するステップであって、第1のヌクレオベースが、改変されたまたは未改変のヌクレオベースであり、第2のヌクレオベースが、第1のヌクレオベースとは異なる改変されたまたは未改変のヌクレオベースであり、第1のヌクレオベースと第2のヌクレオベースとが、同じ塩基対合特異性を有する、ステップ;DNAを、DNA中の改変されたヌクレオベースを認識する薬剤と接触させることによって、試料を、第1の部分試料および第2の部分試料が含まれる複数の部分試料へと分配するステップであって、第1の部分試料が、第2の部分試料よりも高い割合でシトシン改変を有するDNAを含み、薬剤によって認識される改変されたヌクレオベースが、改変されたシトシン、または試料のDNA中の第2のヌクレオベースとは異なるようにDNA中の第1のヌクレオベースに影響を与える手順の産物である、ステップ;ならびに第1のヌクレオベースを第2のヌクレオベースから識別する様式で、第1および第2の部分試料のうち少なくとも一方中のDNAを配列決定するステップ、を含み得る。
図2は、本開示の方法を実行するようにプログラムされたまたは他の方法で構成されたコンピューターシステム201を示す。コンピューターシステム201は、種々の態様の試料調製、配列決定および/または分析を調節することができる。一部の例では、コンピューターシステム201は、例えば、本明細書で開示される方法のいずれかに従って、核酸配列決定が含まれる、試料調製および試料分析を実施するように構成される。
コンピューターシステム201は、シングルコアもしくはマルチコアプロセッサー、または並行処理のための複数のプロセッサーであり得る、中央処理装置(CPU、また、本明細書で「プロセッサー」および「コンピュータープロセッサー」)205を含む。コンピューターシステム201は、メモリまたはメモリロケーション210(例えば、ランダムアクセスメモリ、リードオンリーメモリ、フラッシュメモリ)、電子記憶装置215(例えば、ハードディスク)、1つまたは複数の他のシステムと通信するための通信インターフェース220(例えば、ネットワークアダプター)、ならびに周辺デバイス225、例えば、キャッシュ、他のメモリ、データ記憶および/または電子ディスプレイアダプターもまた含む。メモリ210、記憶装置215、インターフェース220および周辺デバイス225は、通信ネットワークまたはバス(実線)、例えば、マザーボードを介して、CPU 205と通信している。記憶装置215は、データを記憶するためのデータ記憶装置(またはデータリポジトリ)であり得る。コンピューターシステム201は、通信インターフェース220の助けによって、コンピューターネットワーク230に動作可能に連結され得る。コンピューターネットワーク230は、インターネット、インターネットおよび/もしくはエクストラネット、またはインターネットと通信したイントラネットおよび/もしくはエクストラネットであり得る。コンピューターネットワーク230は、一部の場合には、遠隔通信および/またはデータネットワークである。コンピューターネットワーク230は、分散コンピューティング、例えば、クラウドコンピューティングを可能にし得る、1つまたは複数のコンピューターサーバーを含み得る。コンピューターネットワーク230は、一部の場合には、コンピューターシステム0の助けにより、コンピューターシステム201に連結されたデバイスがクライアントまたはサーバーとして挙動するのを可能にし得るピアツーピアネットワークを実行することができる。
CPU 205は、プログラムまたはソフトウェアで具体化され得る機械可読命令のシーケンスを実行することができる。これらの命令は、メモリロケーション、例えば、メモリ210中に記憶され得る。CPU 205によって実行される演算の例としては、フェッチ、デコード、実行およびライトバックが挙げられ得る。
記憶装置215は、ファイル、例えば、ドライバー、ライブラリーおよび保存されたプログラムを記憶することができる。記憶装置215は、ユーザーによって生成されたプログラム、および記録されたセッション、ならびにプログラムに関連する出力を記憶することができる。記憶装置215は、ユーザーデータ、例えば、ユーザー選好およびユーザープログラムを記憶することができる。コンピューターシステム201は、一部の場合には、コンピューターシステム201に対して外部の、例えば、イントラネットまたはインターネットを介してコンピューターシステム201と通信したリモートサーバー上に位置する、1つまたは複数の追加のデータ記憶装置を含み得る。データは、例えば、通信ネットワークまたは物理的データ転送を使用して(例えば、ハードドライブ、サムドライブまたは他のデータ記憶機構を使用して)、1つの場所から別の場所へと転送され得る。
コンピューターシステム201は、ネットワーク230を介して、1つまたは複数のリモートコンピューターシステムと通信することができる。実施形態について、コンピューターシステム201は、ユーザー(例えば、オペレーター)のリモートコンピューターシステムと通信することができる。リモートコンピューターシステムの例としては、パーソナルコンピューター(例えば、携帯型PC)、スレートもしくはタブレットPC(例えば、Apple(登録商標)iPad(登録商標)、Samsung(登録商標)Galaxy Tab)、電話、スマートフォン(例えば、Apple(登録商標)iPhone(登録商標)、Android(登録商標)使用可能デバイス、Blackberry(登録商標))、またはパーソナルデジタルアシスタントが挙げられる。ユーザーは、ネットワーク230を介してコンピューターシステム201にアクセスすることができる。
本明細書に記載される方法は、コンピューターシステム201の電子記憶場所上、例えば、メモリ210または電子記憶装置215などの上に記憶された機械(例えば、コンピュータープロセッサー)実行可能コードによって実行され得る。機械実行可能または機械可読コードは、ソフトウェアの形態で提供され得る。使用の間、コードは、プロセッサー205によって実行され得る。一部の場合には、コードは、記憶装置215から検索され得、プロセッサー205による即座のアクセスのために、メモリ210上に記憶され得る。一部の状況では、電子記憶装置215は除外され得、機械実行可能命令は、メモリ210上に記憶される。
ある態様では、本開示は、少なくとも1つの電子プロセッサーによって実行される場合に、試料を、試料のDNA中の第2のヌクレオベースとは異なるようにDNA中の第1のヌクレオベースに影響を与える手順に供するステップであって、第1のヌクレオベースが、改変されたまたは未改変のヌクレオベースであり、第2のヌクレオベースが、第1のヌクレオベースとは異なる改変されたまたは未改変のヌクレオベースであり、第1のヌクレオベースと第2のヌクレオベースとが、同じ塩基対合特異性を有する、ステップ;DNAを、DNA中の改変されたヌクレオベースを認識する薬剤と接触させることによって、試料を複数の部分試料へと分配するステップであって、複数が、第1の部分試料および第2の部分試料を含み、第1の部分試料が、第2の部分試料よりも高い割合でシトシン改変を有するDNAを含み、薬剤によって認識される改変されたヌクレオベースが、改変されたシトシン、または試料のDNA中の第2のヌクレオベースとは異なるようにDNA中の第1のヌクレオベースに影響を与える手順の産物である、ステップ;ならびに第1のヌクレオベースを第2のヌクレオベースから識別する様式で、第1および第2の部分試料のうち少なくとも一方中のDNAを配列決定するステップ、を含む方法の少なくとも一部分を実行するコンピューター実行可能命令を含む、非一時的コンピューター可読媒体を提供する。
コードは、コードを実行するように適応させたプロセッサーを有する機械との使用のために事前コンパイルおよび構成され得、またはランタイムの間にコンパイルされ得る。コードは、事前コンパイルされたまたはアズコンパイルされた(as-compiled)様式でコードを実行することを可能にするように選択され得るプログラム言語で提供され得る。
本明細書で提供される系および方法の態様、例えば、コンピューターシステム201は、プログラミングで具体化され得る。種々の態様の技術が、典型的には、ある型の機械可読媒体上で運搬されるまたはかかる機械可読媒体中で具体化される機械(またはプロセッサー)実行可能コードおよび/または関連のデータの形態の、「製品」または「製造品」と考えられ得る。機械実行可能コードは、電子記憶装置、例えば、メモリ(例えば、リードオンリーメモリ、ランダムアクセスメモリ、フラッシュメモリ)またはハードディスク上に記憶され得る。「記憶」型媒体には、ソフトウェアプログラミングのための非一時的記憶をいつでも提供し得る、コンピューター、プロセッサーなどの有形メモリのいずれかもしくは全て、またはその関連のモジュール、例えば、種々の半導体メモリ、テープドライブ、ディスクドライブなどが含まれ得る。
ソフトウェアの全てのまたは部分は、インターネットまたは種々の他の遠隔通信ネットワークを介して折々通信され得る。かかる通信は、例えば、1つのコンピューターまたはプロセッサーから別のコンピューターまたはプロセッサー中への、例えば、管理サーバーまたはホストコンピューターから、アプリケーションサーバーのコンピュータープラットフォーム中への、ソフトウェアのローディングを可能にし得る。したがって、ソフトウェアエレメントを保有し得る別の型の媒体には、ローカルデバイス間の物理的インターフェースを横断して、有線および光学固定電話回線ネットワークを介して、ならびに種々のエアリンク(air-link)を通じて使用されるものなどの、光波、電波および電磁波が含まれる。かかる波を運搬する物理的エレメント、例えば、有線または無線リンク、光学リンクなどもまた、ソフトウェアを保有する媒体とみなされ得る。本明細書で使用される場合、非一時的な有形「記憶」媒体に限定されない限り、コンピューターまたは機械「可読媒体」などの用語は、実行のために命令をプロセッサーに提供することに関与する任意の媒体を指す。
したがって、機械可読媒体、例えば、コンピューター実行可能コードは、有形記憶媒体、搬送波媒体または物理的伝送媒体が含まれるがこれらに限定されない多くの形態を取り得る。非揮発性記憶媒体には、例えば、図面に示される、データベースを実行するためなどに使用され得る、例えば、光学または磁気ディスク、例えば、任意のコンピューターなど中の記憶デバイスのいずれかが含まれる。揮発性記憶媒体には、ダイナミックメモリ、例えば、かかるコンピュータープラットフォームのメインメモリが含まれる。有形伝送媒体には、同軸ケーブル;コンピューターシステム内のバスを含むワイヤが含まれる、銅ワイヤおよび光ファイバーが含まれる。搬送波伝送媒体は、電気もしくは電磁気シグナル、または音波もしくは光波、例えば、無線周波数(RF)および赤外線(IR)データ通信の間に生成されるものの形態を取り得る。したがって、コンピューター可読媒体の一般的形態には、例えば、フロッピー(登録商標)ディスク、フレキシブルディスク、ハードディスク、磁気テープ、任意の他の磁気媒体、CD-ROM、DVDもしくはDVD-ROM、任意の他の光学媒体、パンチカード、紙テープ、穴のパターンを有する任意の他の物理的記憶媒体、RAM、ROM、PROMおよびEPROM、FLASH(登録商標)-EPROM、任意の他のメモリチップもしくはカートリッジ、データもしくは命令を運ぶ搬送波、かかる搬送波を運ぶケーブルもしくはリンク、またはコンピューターがそこからプログラミングコードおよび/もしくはデータを読み取り得る任意の他の媒体が含まれる。コンピューター可読媒体のこれらの形態の多くは、1つまたは複数の命令の1つまたは複数のシーケンスを実行のためにプロセッサーに運搬することに関与し得る。
コンピューターシステム201は、例えば、試料分析の1つまたは複数の結果を提供するためのユーザーインターフェース(UI)を含む電子ディスプレイを含み得る、またはそれと通信し得る。UIの例としては、これらに限定されないが、グラフィカルユーザーインターフェース(GUI)およびウェブベースのユーザーインターフェースが挙げられる。
コンピューターシステムおよびネットワーク、データベース、ならびにコンピュータープログラム製品に関する追加の詳細は、例えば、Peterson, Computer Networks: A Systems Approach, Morgan Kaufmann, 5th Ed. (2011)、Kurose, Computer Networking: A Top-Down Approach, Pearson, 7th Ed. (2016)、Elmasri, Fundamentals of Database Systems, Addison Wesley, 6th Ed. (2010)、Coronel, Database Systems: Design, Implementation, & Management, Cengage Learning, 11th Ed. (2014)、Tucker, Programming Languages, McGraw-Hill Science/Engineering/Math, 2nd Ed. (2006)およびRhoton, Cloud Computing Architected: Solution Design Handbook, Recursive Press (2011)中にも提供され、これらは各々、その全体がこれにより参照により本明細書に組み込まれる。
G.適用
1.がんおよび他の疾患
本発明の方法は、対象における状態、特にがんの存在を診断するため、状態を特徴付ける(例えば、がんをステージングするまたはがんの不均一性を決定する)ため、処置に対する状態の応答をモニタリングするため、状態または状態の引き続く過程を発症する予後リスクをもたらすために、使用され得る。本開示は、特定の処置選択肢の有効性を決定する際にも有用であり得る。処置が首尾よい場合、より多くのがんが死に、DNAを脱落させ得るので、首尾よい処置選択肢は、対象の血液中で検出されるコピー数バリエーションまたは稀な突然変異の量を増加させ得る。他の例では、これは生じない場合がある。別の例では、おそらくはある特定の処置選択肢は、がんの遺伝的プロファイルと経時的に相関付けられ得る。この相関は、治療を選択する際に有用であり得る。
さらに、がんが処置後に緩解状態にあることが観察される場合、本発明の方法は、残留疾患または疾患の再発をモニタリングするために使用され得る。
一部の実施形態では、本明細書で開示される方法および系は、体細胞または生殖系列起源であるという核酸バリアントの分類に基づいて、患者において所与の疾患または状態を処置するためのカスタマイズされたまたは標的化された治療を同定するために使用され得る。典型的には、考慮される疾患は、ある型のがんである。かかるがんの非限定的な例としては、胆道がん、膀胱がん、移行上皮癌、尿路上皮癌、脳がん、神経膠腫、星細胞腫、乳房癌、化生癌、子宮頸がん、子宮頸扁平上皮癌、直腸がん、結腸直腸癌、結腸がん、遺伝性非ポリポーシス結腸直腸がん、結腸直腸腺癌、消化管間質腫瘍(GIST)、子宮内膜癌、子宮内膜間質肉腫、食道がん、食道扁平上皮癌、食道腺癌、眼黒色腫、ブドウ膜黒色腫、胆嚢癌、胆嚢腺癌、腎細胞癌、淡明細胞型腎細胞癌、移行上皮癌、尿路上皮癌、ウィルムス腫瘍、白血病、急性リンパ球性白血病(ALL)、急性骨髄性白血病(AML)、慢性リンパ球性白血病(CLL)、慢性骨髄性白血病(CML)、慢性骨髄単球性白血病(CMML)、肝臓がん、肝臓癌、ヘパトーマ、肝細胞癌、胆管細胞癌、肝芽腫、肺がん、非小細胞肺がん(NSCLC)、中皮腫、B細胞リンパ腫、非ホジキンリンパ腫、びまん性大細胞型B細胞リンパ腫、マントル細胞リンパ腫、T細胞リンパ腫、非ホジキンリンパ腫、前駆Tリンパ芽球性リンパ腫/白血病、末梢性T細胞リンパ腫、多発性骨髄腫、鼻咽頭癌(NPC)、神経芽腫、中咽頭がん、口腔扁平上皮癌、骨肉腫、卵巣癌、膵がん、膵管腺癌、偽乳頭状新生物、腺房細胞癌、前立腺がん、前立腺腺癌、皮膚がん、黒色腫、悪性黒色腫、皮膚黒色腫、小腸癌、胃がん、胃癌、消化管間質腫瘍(GIST)、子宮がんまたは子宮肉腫が挙げられる。がんの型および/またはステージは、突然変異、稀な突然変異、インデル、コピー数バリエーション、トランスバージョン、転座、逆位、欠失、異数性、部分的異数性、倍数性、染色体不安定性、染色体構造変更、遺伝子融合、染色体融合、遺伝子トランケーション、遺伝子増幅、遺伝子重複、染色体損傷、DNA損傷、核酸の化学改変における異常な変化、エピジェネティックパターンにおける異常な変化、および核酸の5-メチルシトシンにおける異常な変化が含まれる遺伝子バリエーションから検出され得る。
遺伝的データは、特定の形態のがんを特徴付けるためにも使用され得る。がんは、組成およびステージングの両方において不均一である場合が多い。遺伝的プロファイルデータは、その特定のサブタイプの診断または処置において重要であり得る、がんの特定のサブタイプの特徴付けを可能にし得る。この情報はまた、特定の型のがんの予後に関する手掛かりを対象または実務者に提供し得、疾患の進行に従って対象または実務者のいずれかが処置選択肢を適応させるのを可能にし得る。一部のがんは、進行して、より悪性度が高くかつ遺伝的に不安定になり得る。他のがんは、良性、不活性または休眠状態のままであり得る。本開示の系および方法は、疾患進行を決定する際に有用であり得る。
さらに、本開示の方法は、対象における異常な状態の不均一性を特徴付けるために使用され得る。かかる方法は、例えば、対象に由来する細胞外ポリヌクレオチドの遺伝的プロファイルを生成するステップを含み得、遺伝的プロファイルは、コピー数バリエーションおよび稀な突然変異の分析から生じる複数のデータを含む。一部の実施形態では、異常な状態は、がんである。一部の実施形態では、異常な状態は、不均一なゲノム集団を生じるものであり得る。がんの例では、一部の腫瘍は、がんの異なるステージにある腫瘍細胞を含むことが公知である。他の例では、不均一性は、疾患の複数の病巣を含み得る。再び、がんの例では、複数の腫瘍病巣が存在し得、おそらくはこのとき、1つまたは複数の病巣は、原発部位から広がった転移の結果である。
本発明の方法は、不均一な疾患中の異なる細胞に由来する遺伝情報の総計であるフィンガープリントまたはデータのセットを生成またはプロファイリングするために使用され得る。データのこのセットは、コピー数バリエーション、エピジェネティックバリエーションおよび突然変異の分析を、単独でまたは組み合わせて含み得る。
本発明の方法は、がんまたは他の疾患を診断、予後判定、モニタリングまたは観察するために使用され得る。一部の実施形態では、本明細書の方法は、胎児を診断することにも予後判定することにもモニタリングすることにも関与せず、したがって、非侵襲性出生前試験に関するものではない。他の実施形態では、これらの方法論は、そのDNAおよび他のポリヌクレオチドが母方分子と共に共循環し得る誕生前の対象におけるがんまたは他の疾患を診断、予後判定、モニタリングまたは観察するために、妊娠対象において用いられ得る。
本明細書で開示される方法および系を使用して必要に応じて評価される他の遺伝子ベースの疾患、障害または状態の非限定的な例としては、軟骨無形成症、アルファ1アンチトリプシン欠損症、抗リン脂質抗体症候群、自閉症、常染色体優性多発性嚢胞腎、シャルコー・マリー・トゥース(CMT)、ネコ鳴き、クローン病、嚢胞性線維症、ダーカム病、ダウン症候群、デュアン症候群、デュシェンヌ型筋ジストロフィー、第V因子ライデン血栓性素因、家族性高コレステロール血症、家族性地中海熱、脆弱X症候群、ゴーシェ病、ヘモクロマトーシス、血友病、全前脳胞症、ハンチントン病、クラインフェルター症候群、マルファン症候群、筋強直性ジストロフィー、神経線維腫症、ヌーナン症候群、骨形成不全症、パーキンソン病、フェニルケトン尿症、ポーランド異常(Poland anomaly)、ポルフィリン症、早老症、網膜色素変性、重症複合免疫不全症(SCID)、鎌状赤血球症、脊髄性筋萎縮症、テイ・サックス、サラセミア、トリメチルアミン尿症、ターナー症候群、口蓋心臓顔面症候群、WAGR症候群、ウィルソン病などが挙げられる。
一部の実施形態では、本明細書に記載される方法は、本明細書に記載されるように得られた配列情報のセットを使用して、がんと以前に診断された対象の以前のがん処置の後の予め選択された時点における、腫瘍細胞に起源するまたはそれに由来するDNAの存在または非存在を検出するステップを含む。この方法は、試験対象について、腫瘍細胞に起源するまたはそれに由来するDNAの存在または非存在を示すがん再発スコアを決定するステップをさらに含み得る。
がん再発スコアが決定される場合、それは、がん再発ステータスを決定するためにさらに使用され得る。がん再発ステータスは、例えば、がん再発スコアが所定の閾値を上回る場合には、がん再発のリスク状態にあり得る。がん再発ステータスは、例えば、がん再発スコアが所定の閾値を上回る場合には、がん再発の低いまたはより低いリスク状態にあり得る。特定の実施形態では、所定の閾値と等しいがん再発スコアは、がん再発のリスク状態にあるかまたはがん再発の低いもしくはより低いリスク状態にあるかのいずれかの、がん再発ステータスを生じ得る。
一部の実施形態では、がん再発スコアは、所定のがん再発閾値と比較され、試験対象が、がん再発スコアががん再発閾値を上回る場合には、引き続くがん処置のための候補として分類される、またはがん再発スコアががん再発閾値を下回る場合には、治療のための候補として分類されない。特定の実施形態では、がん再発閾値と等しいがん再発スコアは、引き続くがん処置のための候補としての分類または治療のための候補でないとしての分類のいずれかを生じ得る。
上で議論した方法は、試験対象におけるがん再発のリスクを決定する方法および/または試験対象を引き続くがん処置のための候補として分類する方法に関するセクション中が含まれる、本明細書の他の場所に示された任意の適合性の特色(単数または複数)をさらに含み得る。
2.試験対象におけるがん再発のリスクを決定する方法および/または試験対象を引き続くがん処置のための候補として分類する方法
一部の実施形態では、本明細書で提供される方法は、試験対象におけるがん再発のリスクを決定する方法である。一部の実施形態では、本明細書で提供される方法は、試験対象を引き続くがん処置のための候補として分類する方法である。
かかる方法のいずれかは、試験対象への1つまたは複数の以前のがん処置の後の1つまたは複数の予め選択された時点において、がんと診断された試験対象からDNA(例えば、腫瘍細胞に起源するまたはそれに由来する)を収集するステップを含み得る。対象は、本明細書に記載される対象のいずれかであり得る。DNAは、cfDNAであり得る。DNAは、組織試料から得られ得る。
かかる方法のいずれかは、対象由来のDNAから、標的領域の複数のセットを捕捉するステップを含み得、複数の標的領域セットは、配列可変標的領域セットおよびエピジェネティック標的領域セットを含み、それによって、DNA分子の捕捉されたセットが生産される。捕捉するステップは、本明細書の他の場所に記載される実施形態のいずれかに従って実施され得る。
かかる方法のいずれかでは、以前のがん処置は、手術、治療的組成物の投与、および/または化学療法を含み得る。
かかる方法のいずれかは、捕捉されたDNA分子を配列決定するステップを含み、それによって、配列情報のセットが生産される。配列可変標的領域セットの捕捉されたDNA分子は、エピジェネティック標的領域セットの捕捉されたDNA分子よりも深い配列決定の深度まで配列決定され得る。
かかる方法のいずれかは、配列情報のセットを使用して、予め選択された時点における、腫瘍細胞に起源するまたはそれに由来するDNAの存在または非存在を検出するステップを含み得る。腫瘍細胞に起源するまたはそれに由来するDNAの存在または非存在の検出は、本明細書の他の場所に記載されるその実施形態のいずれかに従って実施され得る。
試験対象におけるがん再発のリスクを決定する方法は、試験対象について、腫瘍細胞に起源するまたはそれに由来するDNAの存在もしくは非存在または量を示すがん再発スコアを決定するステップを含み得る。がん再発スコアは、がん再発ステータスを決定するためにさらに使用され得る。がん再発ステータスは、例えば、がん再発スコアが所定の閾値を上回る場合には、がん再発のリスク状態にあり得る。がん再発ステータスは、例えば、がん再発スコアが所定の閾値を上回る場合には、がん再発の低いまたはより低いリスク状態にあり得る。特定の実施形態では、所定の閾値と等しいがん再発スコアは、がん再発のリスク状態にあるかまたはがん再発の低いもしくはより低いリスク状態にあるかのいずれかの、がん再発ステータスを生じ得る。
試験対象を引き続くがん処置のための候補として分類する方法は、試験対象のがん再発スコアを、所定のがん再発閾値と比較するステップを含み得、それによって、試験対象が、がん再発スコアががん再発閾値を上回る場合には、引き続くがん処置のための候補として分類される、またはがん再発スコアががん再発閾値を下回る場合には、治療のための候補として分類されない。特定の実施形態では、がん再発閾値と等しいがん再発スコアは、引き続くがん処置のための候補としての分類または治療のための候補でないとしての分類のいずれかを生じ得る。一部の実施形態では、引き続くがん処置は、化学療法、または治療的組成物の投与を含む。
かかる方法のいずれかは、がん再発スコアに基づいて、試験対象について無病生存(DFS)期間を決定するステップを含み得る;例えば、DFS期間は、1年間、2年間、3年間、4年間、5年間または10年間であり得る。
一部の実施形態では、配列情報のセットは、配列可変標的領域配列を含み、がん再発スコアを決定するステップは、配列可変標的領域配列中に存在するSNV、挿入/欠失、CNVおよび/または融合の量を示す少なくとも第1のサブスコアを決定するステップを含み得る。
一部の実施形態では、1、2、3、4または5から選択される配列可変標的領域中の突然変異の数が、第1のサブスコアが、がん再発について陽性と分類されるがん再発スコアを生じるのに十分である。一部の実施形態では、突然変異の数は、1、2または3から選択される。
一部の実施形態では、配列情報のセットは、エピジェネティック標的領域配列を含み、がん再発スコアを決定するステップは、健康な対象由来の対応する試料中で見出されるDNA(例えば、健康な対象由来の血液試料中で見出されるcfDNA、または組織試料が、試験対象から得られたものと同じ型の組織である場合には、健康な対象由来の組織試料において見出されるDNA)とは異なるエピジェネティック状態を示す分子(エピジェネティック標的領域配列から得られた)の量を示す第2のサブスコアを決定するステップを含む。これらの異常な分子(すなわち、健康な対象由来の対応する試料中で見出されるDNAとは異なるエピジェネティック状態を有する分子)は、がんに関連するエピジェネティック変化、例えば、高メチル化可変標的領域のメチル化および/または断片化可変標的領域の乱れた断片化と一致し得、ここで、「乱れた」とは、健康な対象由来の対応する試料中で見出されるDNAとは異なることを意味する。
一部の実施形態では、0.001%~10%の範囲内の値よりも大きいまたはそれと等しい、高メチル化可変標的領域セット中の高メチル化および/または断片化可変標的領域セット中の異常な断片化を示す高メチル化可変標的領域セットおよび/または断片化可変標的領域セットに対応する分子の割合が、第2のサブスコアががん再発について陽性と分類されるのに十分である。この範囲は、0.001%~1%、0.005%~1%、0.01%~5%、0.01%~2%または0.01%~1%であり得る。
一部の実施形態では、かかる方法のいずれかは、腫瘍細胞由来の起源を示す1つまたは複数の特色を示す配列情報のセット中の分子の画分から、腫瘍DNAの分率を決定するステップを含み得る。これは、例えば、高メチル化可変標的領域および断片化可変標的領域のうち一方または両方が含まれるエピジェネティック標的領域の一部または全てに対応する分子のために実施され得る(高メチル化可変標的領域の高メチル化および/または断片化可変標的領域の異常な断片化は、腫瘍細胞由来の起源を示すとみなされ得る)。これは、配列可変標的領域に対応する分子、例えば、がんと一致する変更、例えば、SNV、インデル、CNVおよび/または融合を含む分子のために実施され得る。腫瘍DNAの分率は、エピジェネティック標的領域に対応する分子と配列可変標的領域に対応する分子との組合せに基づいて決定され得る。
がん再発スコアの決定は、腫瘍DNAの分率に少なくとも一部基づき得、10-11~1または10-10~1の範囲内の閾値よりも大きい腫瘍DNAの分率が、がん再発スコアががん再発について陽性と分類されるのに十分である。一部の実施形態では、10-10~10-9、10-9~10-8、10-8~10-7、10-7~10-6、10-6~10-5、10-5~10-4、10-4~10-3、10-3~10-2または10-2~10-1の範囲内の閾値よりも大きいまたはそれと等しい腫瘍DNAの分率が、がん再発スコアががん再発について陽性と分類されるのに十分である。一部の実施形態では、少なくとも10-7の閾値よりも大きい腫瘍DNAの分率が、がん再発スコアががん再発について陽性と分類されるのに十分である。腫瘍DNAの分率が、閾値、例えば、上述の実施形態のいずれかに対応する閾値よりも大きいという決定は、累積確率に基づいてなされ得る。例えば、試料は、腫瘍分率が上述の範囲のいずれか内の閾値よりも大きかった累積確率が、少なくとも0.5、0.75、0.9、0.95、0.98、0.99、0.995または0.999の確率閾値を超える場合、陽性とみなされた。一部の実施形態では、確率閾値は、少なくとも0.95、例えば、0.99である。
一部の実施形態では、配列情報のセットは、配列可変標的領域配列およびエピジェネティック標的領域配列を含み、がん再発スコアを決定するステップは、配列可変標的領域配列中に存在するSNV、挿入/欠失、CNVおよび/または融合の量を示す第1のサブスコア、ならびにエピジェネティック標的領域配列中の異常な分子の量を示す第2のサブスコアを決定するステップ、ならびに第1および第2のサブスコアを組み合わせて、がん再発スコアを提供するステップを含む。第1および第2のサブスコアが組み合わされる場合、これらは、閾値(例えば、配列可変標的領域では、突然変異の所定の数よりも大きい(例えば、>1)、およびエピジェネティック標的領域では、異常な分子(すなわち、健康な対象由来の対応する試料中で見出されるDNAとは異なるエピジェネティック状態を有する分子;例えば、腫瘍)の所定の分率よりも大きい)を各サブスコアに独立して適用すること、または複数の陽性および陰性トレーニングサンプルに基づいてステータスを決定するために機械学習分類子をトレーニングすることによって、組み合わされ得る。
一部の実施形態では、-4~2または-3~1の範囲の、組み合わされたスコアについての値が、がん再発スコアががん再発について陽性と分類されるのに十分である。
がん再発スコアががん再発について陽性と分類される任意の実施形態では、対象のがん再発ステータスは、がん再発のリスク状態にあり得、および/または対象は、引き続くがん処置のための候補として分類され得る。
一部の実施形態では、がんは、本明細書の他の場所に記載されるがんの型のうちいずれか1つ、例えば、結腸直腸がんである。
3.治療および関連の投与
ある特定の実施形態では、本明細書で開示される方法は、体細胞または生殖系列起源であるという核酸バリアントのステータスが与えられた患者を同定し、カスタマイズされた治療をかかる患者に投与することに関する。一部の実施形態では、本質的に任意のがん治療(例えば、外科的治療、放射線治療、化学療法など)が、これらの方法の一部として含まれ得る。典型的には、カスタマイズされた治療は、少なくとも1つの免疫療法(または免疫療法剤)を含む。免疫療法は、所与のがん型に対する免疫応答を増強する方法を一般に指す。ある特定の実施形態では、免疫療法は、腫瘍またはがんに対するT細胞応答を増強する方法を指す。
ある特定の実施形態では、体細胞または生殖系列起源であるという、対象由来の試料からの核酸バリアントのステータスは、その対象のためのカスタマイズされたまたは標的化された治療を同定するために、参照集団からの比較対象結果のデータベースと比較され得る。典型的には、参照集団は、試験対象と同じがんもしくは疾患型を有する患者および/または試験対象と同じ治療を受けているもしくは受けたことがある患者を含む。カスタマイズされたまたは標的化された治療(単数または複数)は、核バリアントおよび比較対象結果がある特定の分類基準を満たす(例えば、実質的なまたは近似のマッチである)場合に、同定され得る。
ある特定の実施形態では、本明細書に記載されるカスタマイズされた治療は、典型的には、非経口(例えば、静脈内または皮下)投与される。免疫療法剤を含有する医薬組成物は、典型的には、静脈内投与される。ある特定の治療剤は、経口投与される。しかし、カスタマイズされた治療(例えば、免疫療法剤など)は、例えば、頬側、舌下、直腸、膣、尿道内、外用、眼内、鼻腔内および/または耳介内(intraauricular)などの方法によっても投与され得、その投与には、錠剤、カプセル剤、顆粒剤、水性懸濁物、ゲル剤、スプレー剤、坐剤、膏薬、軟膏などが含まれ得る。
本発明の好ましい実施形態が、本明細書に示され記載されてきたが、かかる実施形態が例のみとして提供されていることは、当業者に明らかである。本発明は、本明細書内に提供される具体的な例によって限定されない意図である。本発明は、上述の明細書を参照して記載されてきたが、本明細書の実施形態の記載および例示は、限定の意味で解釈されることを意味しない。多数のバリエーション、変化および置換が、本発明から逸脱することなしに、当業者にここで想起される。さらに、本発明の全ての態様は、種々の条件および変数に依存する本明細書に示される具体的な描写にも構成にも相対的割合にも限定されないことを理解すべきである。本明細書に記載される本開示の実施形態に対する種々の代替法が、本発明を実施する際に用いられ得ることを理解すべきである。したがって、本開示が、任意のかかる代替法、改変、バリエーションまたは等価物もまた当然カバーすることが企図される。以下の特許請求の範囲が、本発明の範囲を規定すること、ならびにこれらの特許請求の範囲内の方法および構造ならびにそれらの等価物がそれによってカバーされることが意図される。
上述の開示は、明確さおよび理解を目的とした例示および例として、いくらか詳細に記載されてきたが、形式上の、および詳細な種々の変化が、本開示の真の範囲から逸脱することなしになされ得、添付の特許請求の範囲内で実施され得ることは、本開示を読めば、当業者に明らかである。例えば、全ての方法、系、コンピューター可読媒体、および/もしくは構成要素特色、ステップ、要素、またはそれらの他の態様は、種々の組合せで使用され得る。
IV.キット
本明細書に記載される組成物を含むキットもまた提供される。キットは、本明細書に記載される方法を実施する際に有用であり得る。一部の実施形態では、キットは、複数の試料を、DNA中の第2のヌクレオベースとは異なるようにDNA中の第1のヌクレオベースに影響を与える手順に供するための第1の試薬(例えば、ヌクレオベース、例えば、シトシンまたはメチル化されたシトシンを異なるヌクレオベースに変換するための、本明細書の他の場所に記載される試薬のいずれか)を含み、第1のヌクレオベースは、改変されたまたは未改変のヌクレオベースであり、第2のヌクレオベースは、第1のヌクレオベースとは異なる改変されたまたは未改変のヌクレオベースであり、第1のヌクレオベースと第2のヌクレオベースとは、同じ塩基対合特異性を有する。一部の実施形態では、キットは、各試料を、本明細書に記載されるように、複数の部分試料へと分配するための第2の試薬、例えば、本明細書の他の場所に記載される分配試薬のいずれかを含む。一部の実施形態では、各試料を分配するための試薬は、DNA中の改変されたヌクレオベースを認識する薬剤である。一部の実施形態では、DNA中の改変されたヌクレオベースを認識する薬剤は、抗体である。一部の実施形態では、改変されたヌクレオベースは、改変されたシトシン、例えば、メチルシトシンである。一部の実施形態では、DNA中の改変されたヌクレオベースを認識する薬剤は、DNA中のメチルシトシンに特異的な抗体である。キットは、以下および/または本明細書の他の場所で議論されるように、第1および第2の試薬ならびに追加の要素を含み得る。一部の実施形態では、キットは、本明細書に記載される方法を実施するための使用説明書を含む。
キットは、ALK、APC、BRAF、CDKN2A、EGFR、ERBB2、FBXW7、KRAS、MYC、NOTCH1、NRAS、PIK3CA、PTEN、RBI、TP53、MET、AR、ABL1、AKT1、ATM、CDH1、CSFIR、CTNNB1、ERBB4、EZH2、FGFR1、FGFR2、FGFR3、FLT3、GNA11、GNAQ、GNAS、HNF1A、HRAS、IDH1、IDH2、JAK2、JAK3、KDR、KIT、MLH1、MPL、NPM1、PDGFRA、PROC、PTPN11、RET、SMAD4、SMARCB1、SMO、SRC、STK11、VHL、TERT、CCND1、CDK4、CDKN2B、RAF1、BRCA1、CCND2、CDK6、NF1、TP53、ARID1A、BRCA2、CCNE1、ESR1、RIT1、GATA3、MAP2K1、RHEB、ROS1、ARAF、MAP2K2、NFE2L2、RHOAおよびNTRK1からなる群から選択される少なくとも5、6、7、8、9、10、20、30、40個または全ての遺伝子に選択的にハイブリダイズする複数のオリゴヌクレオチドプローブをさらに含み得る。オリゴヌクレオチドプローブが選択的にハイブリダイズすることができる遺伝子の数は、変動し得る。例えば、遺伝子の数は、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53または54を含み得る。キットは、複数のオリゴヌクレオチドプローブを含むコンテナと、本明細書に記載される方法のいずれかを実施するための使用説明書とを含み得る。
オリゴヌクレオチドプローブは、遺伝子の、例えば、少なくとも5つの遺伝子のエクソン領域に、選択的にハイブリダイズすることができる。一部の場合には、オリゴヌクレオチドプローブは、遺伝子の、例えば、少なくとも5つの遺伝子の少なくとも30個のエクソンに、選択的にハイブリダイズすることができる。一部の場合には、複数のプローブは、少なくとも30個のエクソンの各々に選択的にハイブリダイズすることができる。各エクソンにハイブリダイズするプローブは、少なくとも1つの他のプローブと重複する配列を有し得る。一部の実施形態では、オリゴプローブは、本明細書で開示される遺伝子の非コード領域、例えば、遺伝子のイントロン領域に、選択的にハイブリダイズすることができる。オリゴプローブは、本明細書で開示される遺伝子のエクソン領域およびイントロン領域の両方を含む遺伝子の領域にも、選択的にハイブリダイズすることができる。
任意の数のエクソンが、オリゴヌクレオチドプローブによって標的化され得る。例えば、少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、130、135、140、145、150、155、160、165、170、175、180、185、190、195、200、205、210、215、220、225、230、235、240、245、250、255、260、265、270、275、280、285、290、295、300、400、500、600、700、800、900、1,000個またはそれよりも多くのエクソンが、標的化され得る。
キットは、別個の分子バーコードおよび同一の試料バーコードを有する少なくとも4、5、6、7または8つの異なるライブラリーアダプターを含み得る。ライブラリーアダプターは、配列決定アダプターでなくてもよい。例えば、ライブラリーアダプターは、フローセル配列も、配列決定のためのヘアピンループの形成を可能にする配列も含まない。分子バーコードおよび試料バーコードの異なるバリエーションおよび組合せが、全体を通じて記載され、キットに適用可能である。さらに、一部の場合には、アダプターは、配列決定アダプターではない。さらに、キットで提供されるアダプターは、配列決定アダプターもまた含み得る。配列決定アダプターは、1つまたは複数の配列決定プライマーにハイブリダイズする配列を含み得る。配列決定アダプターは、固体支持体にハイブリダイズする配列、例えば、フローセル配列をさらに含み得る。例えば、配列決定アダプターは、フローセルアダプターであり得る。配列決定アダプターは、ポリヌクレオチド断片の一方または両方の末端に結合され得る。一部の場合には、キットは、別個の分子バーコードおよび同一の試料バーコードを有する少なくとも8つの異なるライブラリーアダプターを含み得る。ライブラリーアダプターは、配列決定アダプターでなくてもよい。キットは、ライブラリーアダプターに選択的にハイブリダイズする第1の配列およびフローセル配列に選択的にハイブリダイズする第2の配列を有する配列決定アダプターをさらに含み得る。別の例では、配列決定アダプターは、ヘアピン型であり得る。例えば、ヘアピン型アダプターは、相補的二本鎖部分およびループ部分を含み得、二本鎖部分は、二本鎖ポリヌクレオチドに結合{例えば、ライゲーション)され得る。ヘアピン型配列決定アダプターは、複数回配列決定され得る環状分子を生成するために、ポリヌクレオチド断片の両方の末端に結合され得る。配列決定アダプターは、末端から末端まで、最大で10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100またはそれよりも多くの塩基であり得る。配列決定アダプターは、末端から末端まで、20~30、20~40、30~50、30~60、40~60、40~70、50~60、50~70塩基を含み得る。特定の例では、配列決定アダプターは、末端から末端まで、20~30塩基を含み得る。別の例では、配列決定アダプターは、末端から末端まで、50~60塩基を含み得る。配列決定アダプターは、1つまたは複数のバーコードを含み得る。例えば、配列決定アダプターは、試料バーコードを含み得る。試料バーコードは、所定の配列を含み得る。試料バーコードは、ポリヌクレオチドの供給源を同定するために使用され得る。試料バーコードは、少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25またはそれよりも多くの(または全体を通じて記載されるような任意の長さの)核酸塩基、例えば、少なくとも8塩基であり得る。バーコードは、上記のように、連続または非連続配列であり得る。
ライブラリーアダプターは、平滑末端化されY型であり得、長さが40核酸塩基よりも短いまたはそれと等しいことができる。その他のバリエーションは、全体を通じて見出され得、キットに適用可能である。
本明細書で引用される全ての特許、特許出願、ウェブサイト、他の刊行物または文書、受託番号などは、各個々の項目がそのように参照により組み込まれると具体的かつ個々に示されたのと同じ程度まで、全ての目的のためにその全体が参照により組み込まれる。異なるバージョンの配列が異なる時点において1つの受託番号に関連する場合、本出願の有効出願日の時点でその受託番号に関連するバージョンを意味する。有効出願日とは、該当する場合、実際の出願日、またはその受託番号に言及する優先出願の出願日のいずれか早い方を意味する。同様に、異なるバージョンの刊行物、ウェブサイトなどが異なる時点において公開されている場合、他に示さない限り、本出願の有効出願日の時点で最も新しく公開されたバージョンを意味する。
(実施例1)
対象における腫瘍の存在/非存在を検出するためのcfDNAの分析
患者試料のセットを、Guardant Health(Redwood City、CA、USA)において血液ベースのNGSアッセイによって分析して、がんの存在/非存在を検出する。cfDNAを、これらの患者の血漿から抽出する。次いで、患者試料のcfDNAを、2つのヌクレオベースが、バイサルファイト変換などの手順の後に異なる塩基対合特異性を有するように、DNA中の、異なってはいるが、同じ塩基対合特異性を有する2つのヌクレオベースに異なるように影響を与える手段に供する。次いで、患者試料のcfDNAを、メチルシトシンに特異的な抗体と組み合わせる。プロテインGにコンジュゲートした磁気ビーズを使用して、抗体およびそれに結合したDNAを免疫沈降させ、そうして、高メチル化されたDNAを低メチル化されたDNAから分配する。任意の非メチル化DNAまたはあまりメチル化されていないDNAを、漸増濃度の塩を含有する緩衝液を用いて、ビーズから洗浄して除く。最後に、高塩緩衝液を使用して、強くメチル化されたDNAを、メチルシトシンに特異的な抗体から洗浄して除く。未結合のDNAおよびこれらの洗浄は、漸増的にメチル化されたcfDNAの少なくとも3つの分配(低メチル化された、残留メチル化および高メチル化された分配)を生じる。分配中のcfDNA分子を浄化して塩を除去し、ライブラリー調製の酵素的ステップのために調製物中で濃縮する。
分配中のcfDNAを濃縮した後、第1のアダプターを、その3’末端へのライゲーションによって、cfDNAに付加する。アダプターを、ユニバーサルプライマーおよびDNAポリメラーゼを使用する第2鎖合成のためのプライミング部位として使用する。第1のアダプターは、ビオチンを含み、第1のアダプターにライゲーションされた核酸を、ストレプトアビジンを含むビーズに結合させる。次いで、第2のアダプターを、今度は二本鎖分子の第2鎖の3’末端にライゲーションさせる。これらのアダプターは、非独自の分子バーコードを含有し、各分配を、他の分配において使用されるアダプター中のバーコードから識別可能な非独自の分子バーコードを有するアダプターとライゲーションさせる。ライゲーションの後、分配を一緒にプールし、PCRによって増幅する。
PCRの後、増幅されたDNAを、富化前に洗浄し、濃縮する。濃縮したら、増幅されたDNAを、塩緩衝液、ならびに配列可変標的領域セットに対するプローブおよびエピジェネティック標的領域セットに対するプローブを含むビオチン化されたRNAプローブと組み合わせ、この混合物を一晩インキュベートする。配列可変領域セットに対するプローブは、約50kbのフットプリントを有し、エピジェネティック標的領域セットに対するプローブは、約500kbのフットプリントを有する。配列可変標的領域セットに対するプローブは、表3~5で同定された遺伝子の少なくともサブセットを標的化するオリゴヌクレオチドを含み、エピジェネティック標的領域セットに対するプローブは、高メチル化可変標的領域、低メチル化可変標的領域、CTCF結合標的領域、転写開始部位標的領域、限局的増幅標的領域およびメチル化対照領域の選択を標的化するオリゴヌクレオチドを含む。
ビオチン化されたRNAプローブ(DNAにハイブリダイズした)を、ストレプトアビジン磁気ビーズによって捕捉し、一連の塩ベースの洗浄によって、捕捉されていない増幅されたDNAから分離し、それによって、試料を富化する。富化の後、富化された試料のアリコートを、Illumina NovaSeqシーケンサーを使用して配列決定する。次いで、シーケンサーによって生成された配列読み取りを、バイオインフォマティクスのツール/アルゴリズムを使用して分析する。独自の分子を同定するため、ならびに差次的に分配された分子への試料のデコンボリューションのために、分子バーコードを使用する。この実施例に記載される方法は、その分配に基づいて分子のメチル化(すなわち、メチル化されたシトシン残基)の全体的レベルについての情報を提供することとは別に、メチル化されたシトシンの正体および/またはその型の位置についてのより高い解像度の情報を提供することもできる。配列可変標的領域配列を、実在の腫瘍バリアントを技術的エラー(例えば、PCRエラー、配列決定エラー)から差別化する十分なサポートを伴ってコールされ得るゲノム変更、例えば、SNV、挿入、欠失および融合を検出することによって分析する。エピジェネティック標的領域配列を独立して分析して、正常細胞と比較してがんにおいて差次的にメチル化されることが示された領域においてメチル化されたcfDNA分子を検出する。最後に、両方の分析の結果を組み合わせて、最終的な腫瘍の存在/非存在コールを生成する。
(実施例2)
健康な対象および初期ステージの結腸直腸がんを有する対象由来のcfDNA試料における単一ヌクレオチド解像度でのメチル化の分析
健康な対象および初期ステージの結腸直腸がんを有する対象由来のcfDNAの試料を、以下のように分析する。次いで、対象試料のcfDNAを、2つのヌクレオベースが、改変されたEM-seq変換手順などの手順の後に異なる塩基対合特異性を有するように、DNA中の、異なってはいるが、同じ塩基対合特異性を有する2つのヌクレオベースに異なるように影響を与える手段に供し、それによって、mCおよびhmCではなく未改変のシトシンが、脱アミノ化を受ける。特に、Tet2酸化を使用して、5mCおよび5hmCを5caCに変換する(β-グルコシルトランスフェラーゼによる処理なしに)。APOBEC3Aによる処理は、未改変のシトシンをウラシルに脱アミノ化するが、5caCは、APOBEC3Aの基質ではない。次いで、対象試料のcfDNAを、抗体が5caC(元々存在する5mCおよび5hmCから生成された変換産物)を認識することを除き、実施例1に本質的に記載したように抗体を使用して分配し、その後、プロテインGにコンジュゲートした磁気ビーズで免疫沈降させ、そうして、高メチル化されたDNA(今度は5caCを含有する)を、低メチル化されたDNAから分配する。任意の非メチル化DNAまたはあまりメチル化されていないDNAを、漸増濃度の塩を含有する緩衝液を用いて、ビーズから洗浄して除く。最後に、高塩緩衝液を使用して、強くメチル化された(すなわち、5caC含有)DNAを、5caCに特異的な抗体から洗浄して除いて、高メチル化された分配、中間の分配および低メチル化された分配を提供する。各分配の分配されたDNAを、アダプターにライゲーションさせる。分配を、配列決定のために調製し、ホールゲノム配列決定に供する。各分配を、別々に配列決定するが、代替的手順では、分配は、差次的にタグ化し(例えば、EM-seq変換および分配の後、ならびに配列決定のためのさらなる調製の前に)、プールし、並行して配列決定することができる。
高メチル化可変標的領域からの配列データを、バイオインフォマティクスにより単離するが、代替的手順では、標的領域を、配列決定の前にin vitroで富化することができる。高メチル化可変標的領域についての塩基毎のメチル化を定量化して、高メチル化された分配からの高メチル化可変標的領域中の分子当たりのメチル化されたCpGの数を示す。メチル化を、単一塩基の解像度で分析し、分配された材料の塩基毎のメチル化および部分的分子メチル化を定量化する。結腸直腸がんを有する対象由来の試料は、健康な対象由来の試料中の対応する領域においてよりも、これらの領域において、さらに高い全体的メチル化を示す。

Claims (99)

  1. 試料中のDNAを分析する方法であって、
    a)前記試料を、前記試料の前記DNA中の第2のヌクレオベースとは異なるように前記DNA中の第1のヌクレオベースに影響を与える手順に供するステップであって、前記第1のヌクレオベースが、改変されたまたは未改変のヌクレオベースであり、前記第2のヌクレオベースが、前記第1のヌクレオベースとは異なる改変されたまたは未改変のヌクレオベースであり、前記第1のヌクレオベースと前記第2のヌクレオベースとが、同じ塩基対合特異性を有する、ステップ;
    b)前記DNAを、前記DNA中の改変されたヌクレオベースを認識する薬剤と接触させることによって、前記試料を複数の部分試料へと分配するステップであって、前記複数が、第1の部分試料および第2の部分試料を含み、前記第1の部分試料が、前記第2の部分試料よりも高い割合でシトシン改変を有するDNAを含み、前記薬剤によって認識される前記改変されたヌクレオベースが、改変されたシトシン、または前記試料の前記DNA中の前記第2のヌクレオベースとは異なるように前記DNA中の前記第1のヌクレオベースに影響を与える前記手順の産物である、ステップ;ならびに
    c)前記第1のヌクレオベースを前記第2のヌクレオベースから識別する様式で、前記第1および第2の部分試料のうち少なくとも一方中のDNAを配列決定するステップ
    を含む、方法。
  2. ステップc)が、少なくとも前記第1の部分試料中のDNAを配列決定するステップを含む、請求項1に記載の方法。
  3. ステップc)が、前記第2の部分試料中のDNAを配列決定するステップを含む、先行する請求項のいずれか一項に記載の方法。
  4. 試料中のDNAを分析する方法であって、
    a)前記試料を、前記試料の前記DNA中の第2のヌクレオベースとは異なるように前記DNA中の第1のヌクレオベースに影響を与える手順に供するステップであって、前記第1のヌクレオベースが、改変されたまたは未改変のヌクレオベースであり、前記第2のヌクレオベースが、前記第1のヌクレオベースとは異なる改変されたまたは未改変のヌクレオベースであり、前記第1のヌクレオベースと前記第2のヌクレオベースとが、同じ塩基対合特異性を有する、ステップ;ならびに
    b)前記DNAを、前記DNA中の改変されたヌクレオベースを認識する薬剤と接触させることによって、前記試料を複数の部分試料へと分配するステップであって、前記複数が、第1の部分試料および第2の部分試料を含み、前記第1の部分試料が、前記第2の部分試料よりも高い割合でシトシン改変を有するDNAを含み、前記薬剤によって認識される前記改変されたヌクレオベースが、改変されたシトシン、または前記試料の前記DNA中の前記第2のヌクレオベースとは異なるように前記DNA中の前記第1のヌクレオベースに影響を与える前記手順の産物である、ステップ;
    c)前記第1および第2の部分試料から、DNAの少なくともエピジェネティック標的領域セットを捕捉し、それによって、捕捉されたDNAを提供するステップ;ならびに
    d)前記第1のヌクレオベースを前記第2のヌクレオベースから識別する様式で、前記捕捉されたDNAを配列決定するステップ
    を含む、方法。
  5. 試料中のDNAを分析する方法であって、
    a)前記試料を、前記試料の前記DNA中の第2のヌクレオベースとは異なるように前記DNA中の第1のヌクレオベースに影響を与える手順に供するステップであって、前記第1のヌクレオベースが、改変されたまたは未改変のヌクレオベースであり、前記第2のヌクレオベースが、前記第1のヌクレオベースとは異なる改変されたまたは未改変のヌクレオベースであり、前記第1のヌクレオベースと前記第2のヌクレオベースとが、同じ塩基対合特異性を有する、ステップ;ならびに
    b)前記DNAを、前記DNA中の改変されたヌクレオベースを認識する薬剤と接触させることによって、前記試料を複数の部分試料へと分配するステップであって、前記複数が、第1の部分試料および第2の部分試料を含み、前記第1の部分試料が、前記第2の部分試料よりも高い割合でシトシン改変を有するDNAを含み、前記薬剤によって認識される前記改変されたヌクレオベースが、改変されたシトシン、または前記試料の前記DNA中の前記第2のヌクレオベースとは異なるように前記DNA中の前記第1のヌクレオベースに影響を与える前記手順の産物である、ステップ;
    c)前記第1および第2の部分試料から、DNAの標的領域の複数のセットを捕捉するステップであって、標的領域の前記複数のセットが、配列可変標的領域セットおよびエピジェネティック標的領域セットを含み、それによって、捕捉されたDNAを提供する、ステップ;ならびに
    d)前記第1のヌクレオベースを前記第2のヌクレオベースから識別する様式で、前記捕捉されたDNAを配列決定するステップ
    を含む、方法。
  6. 前記配列可変標的領域セットに対応する無細胞DNA(cfDNA)分子が、前記エピジェネティック標的領域セットに対応するcfDNA分子よりも高い捕捉収量で、前記試料中で捕捉される、請求項5に記載の方法。
  7. 標的領域の前記複数のセットを捕捉するステップが、前記第1および第2の部分試料の前記DNAを、標的特異的プローブのセットと接触させることであって、
    標的特異的プローブの前記セットが、配列可変標的セットに特異的な標的結合性プローブおよびエピジェネティック標的セットに特異的な標的結合性プローブを含み、
    それによって、標的特異的プローブとcfDNAとの複合体が形成される、こと;ならびに
    前記複合体を、標的特異的プローブに結合していないcfDNAから分離し、それによって、前記配列可変標的セットに対応する捕捉されたcfDNAおよび前記エピジェネティック標的セットに対応する捕捉されたcfDNAを提供すること
    を含む、請求項5または6に記載の方法。
  8. 前記エピジェネティック標的領域セットが、高メチル化可変標的領域セットを含む、請求項4から7のいずれか一項に記載の方法。
  9. 前記高メチル化可変標的領域セットが、健康な対象由来の無細胞DNA中のメチル化の程度よりも、少なくとも1つの型の組織において、より高い程度のメチル化を有する領域を含む、直前に先行する請求項に記載の方法。
  10. 前記エピジェネティック標的領域セットが、低メチル化可変標的領域セットを含む、請求項4から9のいずれか一項に記載の方法。
  11. 前記低メチル化可変標的領域セットが、健康な対象由来の無細胞DNA中のメチル化の程度よりも、少なくとも1つの型の組織において、より低い程度のメチル化を有する領域を含む、直前に先行する請求項に記載の方法。
  12. 前記エピジェネティック標的領域セットが、メチル化対照標的領域セットを含む、請求項4から11のいずれか一項に記載の方法。
  13. 前記エピジェネティック標的領域セットが、断片化可変標的領域セットを含む、請求項4から12のいずれか一項に記載の方法。
  14. 前記断片化可変標的領域セットが、転写開始部位領域を含む、請求項13に記載の方法。
  15. 前記断片化可変標的領域セットが、CTCF結合領域を含む、請求項13または14に記載の方法。
  16. 前記DNAが、試験対象から得られる、先行する請求項のいずれか一項に記載の方法。
  17. 前記DNAが、試験対象から得られた無細胞DNA(cfDNA)を含む、先行する請求項のいずれか一項に記載の方法。
  18. 前記DNAが、試験対象の組織試料から得られたDNAを含む、請求項1から16のいずれか一項に記載の方法。
  19. 前記組織試料が、生検、微細針吸引物またはホルマリン固定パラフィン包埋組織試料である、直前に先行する請求項に記載の方法。
  20. 捕捉前に、バーコード含有アダプターを前記DNAにライゲーションさせるステップをさらに含み、必要に応じて、前記ライゲーションさせるステップが、増幅の前にまたはそれと同時に実施される、請求項5から18に記載の方法。
  21. 前記第1の部分試料由来のDNA分子と前記第2の部分試料由来のDNA分子とが、差次的にタグ化される、先行する請求項のいずれか一項に記載の方法。
  22. 前記第1の部分試料由来のDNA分子と前記第2の部分試料由来のDNA分子とが、同じ配列決定セルにおいて配列決定される、先行する請求項のいずれか一項に記載の方法。
  23. 前記DNAが、配列決定するステップの前に増幅される、または方法が捕捉ステップを含み、前記DNAが、前記捕捉ステップの前に増幅される、先行する請求項のいずれか一項に記載の方法。
  24. 前記試料を複数の部分試料へと分配するステップが、メチル化レベルに基づいて分配するステップを含む、先行する請求項のいずれか一項に記載の方法。
  25. 前記DNA中の改変されたヌクレオベースを認識する前記薬剤が、メチル結合試薬である、請求項24に記載の方法。
  26. 前記メチル結合試薬が抗体である、請求項25に記載の方法。
  27. 前記メチル結合試薬が、5-メチルシトシンを特異的に認識する、請求項25または26に記載の方法。
  28. 前記メチル結合試薬が、固体支持体上に固定化される、請求項25から27のいずれか一項に記載の方法。
  29. 前記試料を複数の部分試料へと分配するステップが、メチル化されたDNAの免疫沈降を含む、請求項24から28のいずれか一項に記載の方法。
  30. 前記試料を複数の部分試料へと分配するステップが、タンパク質への結合に基づいて分配するステップを含み、必要に応じて、前記タンパク質が、メチル化されたタンパク質、アセチル化されたタンパク質、メチル化されていないタンパク質、アセチル化されていないタンパク質であり;および/または必要に応じて、前記タンパク質がヒストンである、先行する請求項のいずれか一項に記載の方法。
  31. 前記分配するステップが、前記試料の前記DNAを、前記タンパク質に特異的でありかつ固体支持体に固定化された結合試薬と接触させるステップを含む、請求項30に記載の方法。
  32. 前記第1の部分試料と第2の部分試料とを差次的にタグ化しプールするステップを含む、先行する請求項のいずれか一項に記載の方法。
  33. 前記複数の部分試料が、前記第2の部分試料よりも高い割合であるが、前記第1の部分試料よりも低い割合でシトシン改変を有するDNAを含む第3の部分試料を含む、先行する請求項のいずれか一項に記載の方法。
  34. 前記第3の部分試料を差次的にタグ化するステップをさらに含む、請求項33に記載の方法。
  35. 前記第1、第2および第3の部分試料が、前記第1の部分試料を、前記第1の部分試料の前記DNA中の前記第2のヌクレオベースとは異なるように前記DNA中の前記第1のヌクレオベースに影響を与える前記手順に供するステップの後に組み合わさっており、必要に応じて、前記第1、第2および第3の部分試料が、同じ配列決定セルにおいて配列決定される、請求項34に記載の方法。
  36. 前記試料が供される前記手順が、前記第2のヌクレオベースの塩基対合特異性を実質的に変更することなしに、前記第1のヌクレオベースの塩基対合特異性を変更する、先行する請求項のいずれか一項に記載の方法。
  37. 前記第1のヌクレオベースが、改変されたまたは未改変のシトシンであり、前記第2のヌクレオベースが、改変されたまたは未改変のシトシンである、先行する請求項のいずれか一項に記載の方法。
  38. 前記第1のヌクレオベースが、未改変のシトシン(C)を含む、先行する請求項のいずれか一項に記載の方法。
  39. 前記第2のヌクレオベースが、5-メチルシトシン(mC)を含む、先行する請求項のいずれか一項に記載の方法。
  40. 前記試料が供される前記手順が、バイサルファイト変換を含む、先行する請求項のいずれか一項に記載の方法。
  41. 前記第1のヌクレオベースが、mCを含む、請求項1から38のいずれか一項に記載の方法。
  42. 前記第2のヌクレオベースが、5-ヒドロキシメチルシトシン(hmC)を含む、先行する請求項のいずれか一項に記載の方法。
  43. 前記試料が供される前記手順が、5hmCの保護を含む、請求項42に記載の方法。
  44. 前記試料が供される前記手順が、Tet補助バイサルファイト変換を含む、請求項42に記載の方法。
  45. 前記試料が供される前記手順が、置換されたボラン還元剤を用いた、Tet補助変換を含み、必要に応じて、前記置換されたボラン還元剤が、2-ピコリンボラン、ボランピリジン、tert-ブチルアミンボランまたはアンモニアボランである、請求項42に記載の方法。
  46. 前記置換されたボラン還元剤が、2-ピコリンボランまたはボランピリジンである、請求項45に記載の方法。
  47. 前記第2のヌクレオベースが、Cを含む、請求項41から43または45から46のいずれか一項に記載の方法。
  48. 前記試料が供される前記手順が、hmCの保護と、その後の、置換されたボラン還元剤を用いた、Tet補助変換とを含み、必要に応じて、前記置換されたボラン還元剤が、2-ピコリンボラン、ボランピリジン、tert-ブチルアミンボランまたはアンモニアボランである、請求項41から43または47のいずれか一項に記載の方法。
  49. 前記置換されたボラン還元剤が、2-ピコリンボランまたはボランピリジンである、請求項48に記載の方法。
  50. 前記試料が供される前記手順が、hmCの保護と、その後の、mCおよび/またはCの脱アミノ化とを含む、請求項38、39、41から43または47のいずれか一項に記載の方法。
  51. mCおよび/またはCの前記脱アミノ化が、AID/APOBECファミリーのDNAデアミナーゼ酵素による処理を含む、請求項50に記載の方法。
  52. hmCの保護が、hmCのグルコシル化を含む、請求項43または47から51のいずれか一項に記載の方法。
  53. 前記試料が供される前記手順が、置換されたボラン還元剤を用いた、化学物質補助変換を含み、必要に応じて、前記置換されたボラン還元剤が、2-ピコリンボラン、ボランピリジン、tert-ブチルアミンボランまたはアンモニアボランである、請求項1から37、39、41または47のいずれか一項に記載の方法。
  54. 前記置換されたボラン還元剤が、2-ピコリンボランまたはボランピリジンである、請求項53に記載の方法。
  55. 前記第1のヌクレオベースが、hmCを含む、請求項1から37、39、41、47または53から54のいずれか一項に記載の方法。
  56. 前記第1のヌクレオベースが、改変されたまたは未改変のアデニンであり、前記第2のヌクレオベースが、改変されたまたは未改変のアデニンである、請求項1から36のいずれか一項に記載の方法。
  57. 前記第1のヌクレオベースが、改変されたまたは未改変のグアニンであり、前記第2のヌクレオベースが、改変されたまたは未改変のグアニンである、請求項1から36のいずれか一項に記載の方法。
  58. 前記第1のヌクレオベースが、改変されたまたは未改変のチミンであり、前記第2のヌクレオベースが、改変されたまたは未改変のチミンである、請求項1から36のいずれか一項に記載の方法。
  59. 前記薬剤によって認識される前記改変されたヌクレオベースが、改変されたシトシンである、先行する請求項のいずれか一項に記載の方法。
  60. 前記薬剤によって認識される前記改変されたヌクレオベースが、メチル化されたシトシンである、先行する請求項のいずれか一項に記載の方法。
  61. 前記薬剤によって認識される前記改変されたヌクレオベースが、変換されたヌクレオベースである、先行する請求項のいずれか一項に記載の方法。
  62. 捕捉されたDNAの第1および第2の集団を含む組合せ物であって、前記第1の集団が、前記第2の集団よりも高い割合でシトシン改変を有するDNAを含むか、またはそれに由来したものであり、前記第1の集団および前記第2の集団が各々、変更された塩基対合特異性を有する、前記DNA中に元々存在する第1のヌクレオベースの形態と、変更された塩基対合特異性を有さない第2のヌクレオベースとを含み、塩基対合特異性の変更前の前記DNA中に元々存在する前記第1のヌクレオベースの前記形態が、改変されたまたは未改変のヌクレオベースであり、前記第2のヌクレオベースが、前記第1のヌクレオベースとは異なる改変されたまたは未改変のヌクレオベースであり、塩基対合特異性の変更前の前記DNA中に元々存在する前記第1のヌクレオベースの前記形態と前記第2のヌクレオベースとが、同じ塩基対合特異性を有する、組合せ物。
  63. 前記第1の集団が、1つまたは複数の配列タグの第1のセットから選択される配列タグを含み、前記第2の集団が、1つまたは複数の配列タグの第2のセットから選択される配列タグを含み、配列タグの前記第2のセットが、配列タグの前記第1のセットとは異なる、請求項62に記載の組合せ物。
  64. 前記配列タグが、バーコードを含む、請求項63に記載の組合せ物。
  65. 前記シトシン改変がメチル化である、請求項62から64のいずれか一項に記載の組合せ物。
  66. 前記第1のヌクレオベースが、改変されたまたは未改変のシトシンであり、前記第2のヌクレオベースが、改変されたまたは未改変のシトシンである、請求項62から65のいずれか一項に記載の組合せ物。
  67. 前記第1のヌクレオベースが、未改変のシトシン(C)を含む、請求項62から66のいずれか一項に記載の組合せ物。
  68. 前記第2のヌクレオベースが、5-メチルシトシン(mC)および5-ヒドロキシメチルシトシン(hmC)のうち一方または両方を含む、請求項62から67のいずれか一項に記載の組合せ物。
  69. 前記第1および第2の集団が、バイサルファイト変換に供されている、請求項62から68のいずれか一項に記載の組合せ物。
  70. 前記第1のヌクレオベースが、mCを含む、請求項62から68のいずれか一項に記載の組合せ物。
  71. 前記第2のヌクレオベースが、hmCを含む、請求項62から70のいずれか一項に記載の組合せ物。
  72. 前記第1の集団が、保護されたhmCを含む、請求項62から71のいずれか一項に記載の組合せ物。
  73. 前記第1および第2の集団が、Tet補助バイサルファイト変換に供されている、請求項66または72に記載の組合せ物。
  74. 前記第1および第2の集団が、置換されたボラン還元剤を用いた、Tet補助変換に供されており、必要に応じて、前記置換されたボラン還元剤が、2-ピコリンボラン、ボランピリジン、tert-ブチルアミンボランまたはアンモニアボランである、請求項66または72に記載の組合せ物。
  75. 前記第1および第2の集団が、hmCの保護と、その後の、置換されたボラン還元剤を用いた、Tet補助変換とに供されており、必要に応じて、前記置換されたボラン還元剤が、2-ピコリンボラン、ボランピリジン、tert-ブチルアミンボランまたはアンモニアボランである、請求項72に記載の組合せ物。
  76. 前記第2のヌクレオベースが、Cを含む、請求項72から74、68、70から72または74から75のいずれか一項に記載の組合せ物。
  77. 前記第1および第2の集団が、hmCの保護と、その後の、mCおよび/またはCの脱アミノ化とに供されている、請求項72に記載の組合せ物。
  78. 保護されたhmCが、グルコシル化されたhmCを含む、請求項72から77のいずれか一項に記載の組合せ物。
  79. 前記第1のヌクレオベースが、hmCを含む、請求項72から75のいずれか一項に記載の組合せ物。
  80. 前記第2のヌクレオベースが、mCを含む、請求項72から75または79のいずれか一項に記載の組合せ物。
  81. 前記第2のヌクレオベースが、Cを含む、請求項72から75または79から80のいずれか一項に記載の組合せ物。
  82. 前記第1および第2の集団が、置換されたボラン還元剤を用いた、化学物質補助変換に供されており、必要に応じて、前記置換されたボラン還元剤が、2-ピコリンボラン、ボランピリジン、tert-ブチルアミンボランまたはアンモニアボランである、請求項72から75または79から81のいずれか一項に記載の組合せ物。
  83. 前記第1のヌクレオベースが、改変されたまたは未改変のアデニンであり、前記第2のヌクレオベースが、改変されたまたは未改変のアデニンである、請求項72から75のいずれか一項に記載の組合せ物。
  84. 前記第1のヌクレオベースが、改変されたまたは未改変のグアニンであり、前記第2のヌクレオベースが、改変されたまたは未改変のグアニンである、請求項72から75のいずれか一項に記載の組合せ物。
  85. 前記第1のヌクレオベースが、改変されたまたは未改変のチミンであり、前記第2のヌクレオベースが、改変されたまたは未改変のチミンである、請求項72から75のいずれか一項に記載の組合せ物。
  86. 前記捕捉されたDNAが、cfDNAを含む、請求項72から85いずれか一項に記載の組合せ物。
  87. 前記捕捉されたDNAが、配列可変標的領域およびエピジェネティック標的領域を含み、前記配列可変標的領域の濃度が、前記エピジェネティック標的領域の濃度よりも高く、前記濃度が、前記配列可変標的領域およびエピジェネティック標的領域のフットプリントサイズに関して標準化される、請求項72から86のいずれか一項に記載の組合せ物。
  88. 請求項1から58のいずれか一項に記載の方法に従って生産される、請求項62から87のいずれか一項に記載の組合せ物。
  89. 前記第1の部分試料の前記DNAと前記第2の部分試料の前記DNAとが、差次的にタグ化され;差次的タグ化後に、前記第2の部分試料由来のDNAの一部分が、前記第1の部分試料またはその少なくとも一部分に添加され、それによって、プールを形成し;配列可変標的領域およびエピジェネティック標的領域が、前記プールから捕捉される、請求項1から58のいずれか一項に記載の方法。
  90. 前記プールが、前記第2の部分試料の前記DNAの約45%、40%、35%、30%、25%、20%、15%、10%もしくは5%未満、またはそれと等しい%を含む、直前に先行する請求項に記載の方法。
  91. 前記プールが、前記第2の部分試料の前記DNAの約70~90%、約75~85%または約80%を含む、請求項89に記載の方法。
  92. 前記プールが、前記第1の部分試料の前記DNAの実質的に全てを含む、請求項89から91のいずれか一項に記載の方法。
  93. 配列可変標的領域が、前記第2の部分試料由来のDNAの第2の部分から捕捉される、請求項89から92のいずれか一項に記載の方法。
  94. 前記対象ががんを有する可能性を決定するステップをさらに含む、請求項1から58または89から93のいずれか一項に記載の方法。
  95. 前記配列決定するステップが、複数の配列決定読み取りを生成し;前記方法が、前記複数の配列読み取りを、1つまたは複数の参照配列にマッピングして、マッピングされた配列読み取りを生成すること、ならびに前記配列可変標的領域セットに対応する前記マッピングされた配列読み取りおよび前記エピジェネティック標的領域セットに対応する前記マッピングされた配列読み取りを処理して、前記対象ががんを有する可能性を決定することをさらに含む、直前に先行する請求項に記載の方法。
  96. 前記試験対象が、がんと以前に診断されており、1つまたは複数の以前のがん処置を受けており、必要に応じて、前記DNAが、前記1つまたは複数の以前のがん処置の後の1つまたは複数の予め選択された時点において得られ、DNA分子の捕捉されたセットが配列決定され、それによって、配列情報のセットが生成される、請求項1から58または89から95のいずれか一項に記載の方法。
  97. 配列情報の前記セットを使用して、予め選択された時点における、腫瘍細胞に起源するまたはそれに由来するDNAの存在または非存在を検出するステップをさらに含む、直前に先行する請求項に記載の方法。
  98. 前記試験対象について、前記腫瘍細胞に起源するまたはそれに由来する前記DNAの前記存在または非存在を示すがん再発スコアを決定するステップをさらに含み、必要に応じて、前記がん再発スコアに基づいて、がん再発ステータスを決定するステップをさらに含み、がん再発スコアが所定の閾値であるもしくはそれを上回ると決定される場合に、前記試験対象の前記がん再発ステータスが、がん再発のリスク状態にあると決定される、または前記がん再発スコアが前記所定の閾値を下回る場合に、前記試験対象の前記がん再発ステータスが、がん再発のより低いリスク状態にあると決定される、直前に先行する請求項に記載の方法。
  99. 前記試験対象の前記がん再発スコアを、所定のがん再発閾値と比較するステップをさらに含み、前記試験対象が、前記がん再発スコアが前記がん再発閾値を上回る場合には、引き続くがん処置のための候補として分類される、または前記がん再発スコアが前記がん再発閾値を下回る場合には、引き続くがん処置のための候補として分類されない、直前に先行する請求項に記載の方法。
JP2023532507A 2020-11-30 2021-11-30 メチル化されたポリヌクレオチドを富化するための組成物および方法 Pending JP2023551292A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063119520P 2020-11-30 2020-11-30
US63/119,520 2020-11-30
PCT/US2021/061280 WO2022115810A1 (en) 2020-11-30 2021-11-30 Compositions and methods for enriching methylated polynucleotides

Publications (1)

Publication Number Publication Date
JP2023551292A true JP2023551292A (ja) 2023-12-07

Family

ID=79164721

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023532507A Pending JP2023551292A (ja) 2020-11-30 2021-11-30 メチル化されたポリヌクレオチドを富化するための組成物および方法

Country Status (4)

Country Link
EP (1) EP4251765A1 (ja)
JP (1) JP2023551292A (ja)
CA (1) CA3199829A1 (ja)
WO (1) WO2022115810A1 (ja)

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6582908B2 (en) 1990-12-06 2003-06-24 Affymetrix, Inc. Oligonucleotides
US20030017081A1 (en) 1994-02-10 2003-01-23 Affymetrix, Inc. Method and apparatus for imaging a sample on a device
AU2002359522A1 (en) 2001-11-28 2003-06-10 Applera Corporation Compositions and methods of selective nucleic acid isolation
DK2141234T3 (en) 2003-03-21 2016-06-20 Roche Innovation Ct Copenhagen As Short interfering RNA (siRNA) analogues
US8486630B2 (en) 2008-11-07 2013-07-16 Industrial Technology Research Institute Methods for accurate sequence data and modified base position determination
US20110237444A1 (en) * 2009-11-20 2011-09-29 Life Technologies Corporation Methods of mapping genomic methylation patterns
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
WO2012054730A1 (en) * 2010-10-22 2012-04-26 Oslo Universitetssykehus Hf Methods and kits for detection of 5-hydroxymethylcytosine
DE202013012824U1 (de) 2012-09-04 2020-03-10 Guardant Health, Inc. Systeme zum Erfassen von seltenen Mutationen und einer Kopienzahlvariation
KR102441391B1 (ko) 2014-07-25 2022-09-07 유니버시티 오브 워싱톤 무세포 dna를 생성하는 조직 및/또는 세포 유형을 결정하는 방법 및 이를 사용하여 질환 또는 장애를 확인하는 방법
WO2018009723A1 (en) 2016-07-06 2018-01-11 Guardant Health, Inc. Methods for fragmentome profiling of cell-free nucleic acids
US9850523B1 (en) 2016-09-30 2017-12-26 Guardant Health, Inc. Methods for multi-resolution analysis of cell-free nucleic acids
CA3046007A1 (en) 2016-12-22 2018-06-28 Guardant Health, Inc. Methods and systems for analyzing nucleic acid molecules
EP3918089A1 (en) 2019-01-31 2021-12-08 Guardant Health, Inc. Compositions and methods for isolating cell-free dna

Also Published As

Publication number Publication date
WO2022115810A1 (en) 2022-06-02
EP4251765A1 (en) 2023-10-04
CA3199829A1 (en) 2022-06-02

Similar Documents

Publication Publication Date Title
US20230323474A1 (en) Compositions and methods for isolating cell-free dna
US11891653B2 (en) Compositions and methods for analyzing cell-free DNA in methylation partitioning assays
US20220154285A1 (en) Analysis of methylated dna comprising methylation-sensitive or methylation-dependent restrictions
US20220154286A1 (en) Compositions and methods for analyzing dna using partitioning and base conversion
EP4271835A1 (en) Detection of epigenetic status using sequence-specific degradation
WO2022174109A1 (en) Methods and compositions for detecting nucleic acid variants
JP2023551292A (ja) メチル化されたポリヌクレオチドを富化するための組成物および方法
US20240150844A1 (en) Compositions and methods for enriching methylated polynucleotides
US20240093292A1 (en) Quality control method
JP2024511425A (ja) 免疫細胞dnaを定量するための方法および組成物
WO2023056065A1 (en) Compositions and methods for synthesis and use of probes targeting nucleic acid rearrangements
JP2023524681A (ja) 分配された核酸を使用した配列決定のための方法
WO2024073508A2 (en) Methods and compositions for quantifying immune cell dna
CN116529394A (zh) 使用分区和甲基化依赖性核酸酶分析dna的组合物和方法
WO2024020573A1 (en) Methods for detection and reduction of sample preparation-induced methylation artifacts
WO2023122623A1 (en) Methods and systems for combinatorial chromatin-ip sequencing
EP4359562A1 (en) Methods and compositions for copy-number informed tissue-of-origin analysis
WO2023168300A1 (en) Methods for analyzing cytosine methylation and hydroxymethylation