JP2023551292A

JP2023551292A - メチル化されたポリヌクレオチドを富化するための組成物および方法

Info

Publication number: JP2023551292A
Application number: JP2023532507A
Authority: JP
Inventors: アンドリューケネディ，
Original assignee: ガーダントヘルス，インコーポレイテッド
Priority date: 2020-11-30
Filing date: 2021-11-30
Publication date: 2023-12-07
Also published as: WO2022115810A1; EP4251765A1; CA3199829A1

Abstract

第1の部分試料のDNA中の第2のヌクレオベースとは異なるようにDNA中の第1のヌクレオベースに影響を与える手順；試料を少なくとも第1の部分試料および第2の部分試料へと分配するステップであって、第1の部分試料が第2の部分試料とは異なる割合でヌクレオベース改変を有するDNA（例えば無細胞DNA）を含む、ステップを含み；DNAが配列決定されて、第1のヌクレオベースを第2のヌクレオベースから識別する、DNA分析法が、本明細書で提供される。捕捉されたDNAの第1および第2の集団を含む組合せ物であって、第1の集団が第2の集団とは異なる割合でヌクレオベース改変を有するDNAを含むか、またはそれに由来したものであり、第1の集団が変更された塩基対合特異性を有する、DNA中に元々存在する第1のヌクレオベースの形態と変更された塩基対合特異性を有さない第2のヌクレオベースとを含む組合せ物もまた提供される。

Description

関連出願に対する相互参照
本出願は、全ての目的のためにその全体がこれにより参照により本明細書に組み込まれる、２０２０年１１月３０日出願の米国仮特許出願第６３／１１９，５２０号の優先権の利益を主張する。

発明の分野
本開示は、ＤＮＡ、例えば、無細胞ＤＮＡを分析することに関する組成物および方法を提供する。一部の実施形態では、無細胞ＤＮＡは、がんを有するもしくは有すると疑われる対象由来であり、および／または無細胞ＤＮＡには、がん細胞由来のＤＮＡが含まれる。一部の実施形態では、ＤＮＡは、ＤＮＡ中の第２のヌクレオベースとは異なるようにＤＮＡ中の第１のヌクレオベースに影響を与える手順に供され、ＤＮＡは、第１の部分試料および第２の部分試料へと分配され、第１の部分試料は、第２の部分試料よりも高い割合でヌクレオベース改変（例えば、シトシン改変）を有するＤＮＡを含み、ＤＮＡは、第１のヌクレオベースを第２のヌクレオベースから識別する様式で配列決定される。

導入および概要
がんは、世界中で１年当たり数百万の死亡の原因である。初期ステージのがんは、処置に対してより感受性が高い傾向があるので、がんの早期検出は、改善された転帰を生じ得る。

不適切に制御された細胞成長は、遺伝子変化およびエピジェネティック変化、例えば、コピー数バリエーション（ＣＮＶ）、単一ヌクレオチドバリエーション（ＳＮＶ）、遺伝子融合、挿入および／または欠失（インデル）、シトシンの改変（例えば、５－メチルシトシン、５－ヒドロキシメチルシトシン、および他のより酸化された形態）が含まれるエピジェネティックバリエーションの蓄積、ならびにＤＮＡとクロマチンタンパク質および転写因子との会合から一般に生じる、がんの顕著な特徴である。

生検は、細胞または組織ががんのあり得る部位から抽出され、関連する表現型および／または遺伝子型特色について分析される、がんを検出または診断するための従来のアプローチを示す。生検は、侵襲性であるという欠点を有する。

血液などの体液の分析（「液体生検」）に基づくがんの検出は、がん細胞由来のＤＮＡが体液中に放出されるという観察に基づく興味深い代替法である。液体生検は、非侵襲性である（ときどき、採血のみを必要とする）。しかし、無細胞ＤＮＡの低い濃度および不均一性を考慮してヌクレオベース改変に関する詳細な情報を提供する、液体生検材料を分析するための正確かつ高感度な方法を開発することは困難であった。液体生検手順におけるさらなる分析のために有用な無細胞ＤＮＡの画分を単離および処理することは、これらの方法の重要な部分である。したがって、例えば、液体生検中の無細胞ＤＮＡを分析するための改善された方法および組成物が必要とされている。

いずれの特定の理論によっても束縛されることを望まないが、がんまたは新生物の中またはその周囲の細胞は、健康な対象における同じ組織型の細胞よりも多くのＤＮＡを脱落させ得る。したがって、ある特定のＤＮＡ試料、例えば、無細胞ＤＮＡ（ｃｆＤＮＡ）の起源である組織の分布は、癌発生の際に変化し得る。したがって、例えば、少なくとも１つの他の組織型中よりも、健康なｃｆＤＮＡにおいてより低いメチル化を示す高メチル化可変標的領域のレベルにおける増加は、がんの存在（または対象の病歴に依存して、再発）の指標であり得る。同様に、試料中の低メチル化可変標的領域のレベルにおける増加は、がんの存在（または対象の病歴に依存して、再発）の指標であり得る。

さらに、がんは、非配列改変、例えば、メチル化によって示され得る。がんにおけるメチル化変化の例としては、正常な成長制御、ＤＮＡ修復、細胞周期調節および／または細胞分化に関与する遺伝子のＴＳＳにおける、ＣｐＧ島中のＤＮＡメチル化の局所的獲得が挙げられる。この高メチル化は、関与する遺伝子の転写能の異常な喪失に関連し得、変更された遺伝子発現の原因として、点突然変異および欠失と少なくとも同様の頻度で生じる。

したがって、ＤＮＡメチル化プロファイリングは、試料のＤＮＡ中の異常なメチル化を検出するために使用され得る。ＤＮＡは、例えば、試料の型への、組織の異常に増加した寄与に起因して（例えば、新生物またはがんの中またはその周囲でのＤＮＡの脱落の増加に起因して）、および／あるいは発生の間に変更される、または疾患、例えば、がんもしくは任意のがん関連疾患によって乱されるゲノムのメチル化の程度から、所与の試料型（例えば、血流由来のｃｆＤＮＡ）において通常は高メチル化または低メチル化されているが、新生物またはがんと相関する異常な程度のメチル化を示し得る、ある特定のゲノム領域（「差次的にメチル化された領域」、または「ＤＭＲ」）に対応し得る。

一部の実施形態では、ＤＮＡメチル化は、ＣｐＧ部位（シトシン－リン酸－グアニン部位（すなわち、核酸配列の５’→３’方向での、シトシンとその後のグアニン））における、シトシン残基へのメチル基の付加を含む。一部の実施形態では、ＤＮＡメチル化は、例えば、Ｎ６－メチルアデニンにおける、アデニン残基へのメチル基の付加を含む。一部の実施形態では、ＤＮＡメチル化は、５－メチル化（シトシンの６－炭素環の５番目の炭素の改変）である。一部の実施形態では、５－メチル化は、５－メチルシトシン（ｍ５ｃまたは５－ｍＣまたは５ｍＣ）を創出する、シトシン残基の５Ｃ位へのメチル基の付加を含む。一部の実施形態では、メチル化は、ｍ５ｃの誘導体を含む。ｍ５ｃの誘導体としては、これらに限定されないが、５－ヒドロキシメチルシトシン（５－ｈｍＣまたは５ｈｍＣ）、５－ホルミルシトシン（５－ｆＣ）および５－カルボキシルシトシン（5-caryboxylcytosine）（５－ｃａＣ）が挙げられる。一部の実施形態では、ＤＮＡメチル化は、３Ｃメチル化（シトシン残基の６－炭素環の３番目の炭素の改変）である。一部の実施形態では、３Ｃメチル化は、３－メチルシトシン（３ｍＣ）を生成する、シトシン残基の３Ｃ位へのメチル基の付加を含む。メチル化は、非ＣｐＧ部位においても生じ得、例えば、メチル化は、ＣｐＡ、ＣｐＴまたはＣｐＣ部位において生じ得る。ＤＮＡメチル化は、メチル化されたＤＮＡ領域の活性を変化させ得る。例えば、プロモーター領域中のＤＮＡがメチル化されている場合、遺伝子の転写は、抑制され得る。ＤＮＡメチル化は、正常な発生のために重要であり、メチル化における異常は、エピジェネティック調節を破壊し得る。エピジェネティック調節における破壊、例えば、抑制は、疾患、例えば、がんを引き起こし得る。ＤＮＡにおけるプロモーターメチル化は、がんを示し得る。

本開示は、以下の認識に一部基づく。他の処理ステップ、例えば、メチル化の程度に基づく分配、および配列決定に従ってヌクレオベース改変（とりわけ、シトシンのメチル化および／またはヒドロキシメチル化が含まれる）を分析することは、有益であり得る。例えば、例示的な実施形態では、ＤＮＡ試料（例えば、ｃｆＤＮＡ試料）は、異なる形態の所与のヌクレオベース（例えば、未改変のシトシンおよびメチル化されたシトシン、またはヒドロキシメチル化されたシトシンおよびメチル化されたシトシン）に差次的に影響を与える手順に供され、次いで、（例えば、メチルシトシンに特異的な抗体への結合に基づいて）異なる量のシトシンメチル化を有する複数の部分試料へと分配される。次いで、配列決定が、複数の部分試料中の配列を同定するため、および／または特定の種のヌクレオベースが存在した特定の部分試料由来のＤＮＡ中の位置を同定するために実施され得る。本開示に従うかかる方法は、既存のアプローチ、例えば、ＭｅＤＩＰ－ｓｅｑ、ＭＢＤ－ｓｅｑ、ＢＳ－ｓｅｑ、Ｏｘ－ＢＳ－ｓｅｑ、ＴＡＰ－ｓｅｑ、ＡＣＥ－ｓｅｑ、ｈｍＣ－ｓｅａｌおよびＴＡＢ－ｓｅｑよりも、ｃｆＤＮＡなどのＤＮＡ中のエピジェネティック改変についてのより多くの情報を提供することができる。例えば、Schutsky, E.K. et al. Nondestructive, base-resolution sequencing of 5-hydroxymethylcytosine using a DNA deaminase. Nature Biotech, 2018; doi.10.1038/nbt.4204 (ACE-Seq)；Yu, Miao et al. Base-resolution analysis of 5-hydroxymethylcytosine in the Mammalian Genome. Cell, 2012; 149(6):1368-80 (TAB-Seq)；Han, D. A highly sensitive and robust method for genome-wide 5hmC profiling of rare cell populations. Mol Cell. 2016; 63(4):711-719 (5hmC-Seal)；Shen, S.Y. et al. Sensitive tumour detection and classification using plasma cell-free DNA methylomes. Nature. 2018; 563(7732):579-583 (cfMeDIP)；Nair, SS et al. Comparison of methyl-DNA immunoprecipitation (MeDIP) and methyl-CpG binding domain (MBD) protein capture for genome-wide DNA. Epigenetics. 2011; 6(1):34-44を参照されたい。かかる既存の方法とは異なり、本開示に従う方法は、分配するステップによる、第１の改変、例えば、メチル化レベルについての情報と、異なる形態の所与のヌクレオベースに差次的に影響を与える手順による、特定の改変および／またはその位置についての追加の情報との組合せを提供することができる。かかる手順の例としては、バイサルファイト、置換されたボラン、塩基改変酵素、またはヌクレオベースのクラスの異なる種間を区別する改変された塩基特異的抗体を使用する種々の変換または分離ステップを含む、異なるヌクレオベースに差次的に影響を与える手順が含まれる。一部の実施形態では、本明細書に記載される方法は、（ｉ）分子の改変（例えば、シトシン改変）の全体的レベル（例えば、その分配に基づく）、ならびに（ｉｉ）特定の改変の正体および／または位置についてのより高い解像度の情報（例えば、本明細書で詳細に議論されるような、特定の改変されたもしくは未改変のヌクレオベースの特異的変換、または特定の型の改変間を識別するさらなる分配と、その後の配列決定とに基づく）、についての情報の組合せを提供する。本発明の方法は、例えば、低メチル化された分子が、部分試料間でのＤＮＡ分子の不完全な選別に起因して、高メチル化された分配中に存在する場合に、誤分配された分子の同定を容易にすることもできる。例えば、ＤＮＡがバイサルファイト変換に供された場合、分子からの配列データにおける未変換のＣｐＧジヌクレオチドの存在は、それが不完全に選別されたかどうかにかかわらず、メチル化を示す。

本発明の方法は、ＤＮＡから、標的領域の２つのセットを捕捉するステップをさらに含み得る。一部の実施形態では、標的領域のこれらのセットは、配列可変標的領域セットおよびエピジェネティック標的領域セットを含む。これらのセットの各々は、試料ががん細胞由来のＤＮＡを含有する可能性を決定する際に有用な情報を提供することができる。一部の実施形態では、配列可変標的領域セットの捕捉収量は、エピジェネティック標的領域セットの捕捉収量よりも高い。捕捉収量における差異は、例えば、同じ配列決定セルにおける、または配列決定される材料の同じプールなどにおける並列配列決定の間などに、配列可変標的領域セットにおける深い、したがってより正確な配列決定、およびエピジェネティック標的領域セットにおける浅く広いカバレッジを可能にし得る。

エピジェネティック標的領域セットは、種々の方法で分析され得る。例えば、特定の位置の改変に関する許容可能な程度の信頼度が、配列可変標的領域セットにおける精度に関する許容可能な程度の信頼度よりも低い場合（例えば、目的が、種々の遺伝子座における異なる型の改変の頻度を理解することであり、改変される正確な位置を理解することでは必ずしもない場合）、分析は、標的内の特定のヌクレオチドの配列決定における高い程度の精度に依存しない方法を使用し得る。例としては、改変、例えば、メチル化の程度、ならびに／または断片がそこから得られた細胞における正常もしくは異常なクロマチン構造を示し得る断片の分布およびサイズを決定することが挙げられる。かかる分析は、配列決定によって実施され得、配列突然変異、例えば、塩基置換、挿入または欠失の存在または非存在を決定する場合よりも少ないデータ（例えば、配列読み取りの数または配列決定カバレッジの深度）を要求する。

本開示は、無細胞ＤＮＡの改善された分析の必要性を満たし、および／または他の利益を提供することを目的とする。したがって、以下の例示的な実施形態が提供される。

実施形態１は、試料中のＤＮＡを分析する方法であって、
ａ）上記試料を、上記試料の上記ＤＮＡ中の第２のヌクレオベースとは異なるように上記ＤＮＡ中の第１のヌクレオベースに影響を与える手順に供するステップであって、上記第１のヌクレオベースが、改変されたまたは未改変のヌクレオベースであり、上記第２のヌクレオベースが、上記第１のヌクレオベースとは異なる改変されたまたは未改変のヌクレオベースであり、上記第１のヌクレオベースと上記第２のヌクレオベースとが、同じ塩基対合特異性を有する、ステップ；
ｂ）上記ＤＮＡを、上記ＤＮＡ中の改変されたヌクレオベースを認識する薬剤と接触させることによって、上記試料を複数の部分試料へと分配するステップであって、上記複数が、第１の部分試料および第２の部分試料を含み、上記第１の部分試料が、上記第２の部分試料よりも高い割合でシトシン改変を有するＤＮＡを含み、上記薬剤によって認識される上記改変されたヌクレオベースが、改変されたシトシン、または上記試料の上記ＤＮＡ中の上記第２のヌクレオベースとは異なるように上記ＤＮＡ中の上記第１のヌクレオベースに影響を与える上記手順の産物である、ステップ；ならびに
ｃ）上記第１のヌクレオベースを上記第２のヌクレオベースから識別する様式で、上記第１および第２の部分試料のうち少なくとも一方中のＤＮＡを配列決定するステップ
を含む方法である。

実施形態２は、ステップｃ）が、少なくとも上記第１の部分試料中のＤＮＡを配列決定するステップを含む、実施形態１に記載の方法である。

実施形態３は、ステップｃ）が、上記第２の部分試料中のＤＮＡを配列決定するステップを含む、先行する実施形態のいずれか１つに記載の方法である。

実施形態４は、試料中のＤＮＡを分析する方法であって、
ａ）上記試料を、上記試料の上記ＤＮＡ中の第２のヌクレオベースとは異なるように上記ＤＮＡ中の第１のヌクレオベースに影響を与える手順に供するステップであって、上記第１のヌクレオベースが、改変されたまたは未改変のヌクレオベースであり、上記第２のヌクレオベースが、上記第１のヌクレオベースとは異なる改変されたまたは未改変のヌクレオベースであり、上記第１のヌクレオベースと上記第２のヌクレオベースとが、同じ塩基対合特異性を有する、ステップ；ならびに
ｂ）上記ＤＮＡを、上記ＤＮＡ中の改変されたヌクレオベースを認識する薬剤と接触させることによって、上記試料を複数の部分試料へと分配するステップであって、上記複数が、第１の部分試料および第２の部分試料を含み、上記第１の部分試料が、上記第２の部分試料よりも高い割合でシトシン改変を有するＤＮＡを含み、上記薬剤によって認識される上記改変されたヌクレオベースが、改変されたシトシン、または上記試料の上記ＤＮＡ中の上記第２のヌクレオベースとは異なるように上記ＤＮＡ中の上記第１のヌクレオベースに影響を与える上記手順の産物である、ステップ；
ｃ）上記第１および第２の部分試料から、ＤＮＡの少なくともエピジェネティック標的領域セットを捕捉し、それによって、捕捉されたＤＮＡを提供するステップ；ならびに
ｄ）上記第１のヌクレオベースを上記第２のヌクレオベースから識別する様式で、上記捕捉されたＤＮＡを配列決定するステップ
を含む方法である。

実施形態５は、試料中のＤＮＡを分析する方法であって、
ａ）上記試料を、上記試料の上記ＤＮＡ中の第２のヌクレオベースとは異なるように上記ＤＮＡ中の第１のヌクレオベースに影響を与える手順に供するステップであって、上記第１のヌクレオベースが、改変されたまたは未改変のヌクレオベースであり、上記第２のヌクレオベースが、上記第１のヌクレオベースとは異なる改変されたまたは未改変のヌクレオベースであり、上記第１のヌクレオベースと上記第２のヌクレオベースとが、同じ塩基対合特異性を有する、ステップ；ならびに
ｂ）上記ＤＮＡを、上記ＤＮＡ中の改変されたヌクレオベースを認識する薬剤と接触させることによって、上記試料を複数の部分試料へと分配するステップであって、上記複数が、第１の部分試料および第２の部分試料を含み、上記第１の部分試料が、上記第２の部分試料よりも高い割合でシトシン改変を有するＤＮＡを含み、上記薬剤によって認識される上記改変されたヌクレオベースが、改変されたシトシン、または上記試料の上記ＤＮＡ中の上記第２のヌクレオベースとは異なるように上記ＤＮＡ中の上記第１のヌクレオベースに影響を与える上記手順の産物である、ステップ；
ｃ）上記第１および第２の部分試料から、ＤＮＡの標的領域の複数のセットを捕捉するステップであって、標的領域の上記複数のセットが、配列可変標的領域セットおよびエピジェネティック標的領域セットを含み、それによって、捕捉されたＤＮＡを提供する、ステップ；ならびに
ｄ）上記第１のヌクレオベースを上記第２のヌクレオベースから識別する様式で、上記捕捉されたＤＮＡを配列決定するステップ
を含む方法である。

実施形態６は、上記配列可変標的領域セットに対応する無細胞ＤＮＡ（ｃｆＤＮＡ）分子が、上記エピジェネティック標的領域セットに対応するｃｆＤＮＡ分子よりも高い捕捉収量で、上記試料中で捕捉される、実施形態５に記載の方法である。

実施形態７は、標的領域の上記複数のセットを捕捉するステップが、上記第１および第２の部分試料の上記ＤＮＡを、標的特異的プローブのセットと接触させるステップであって、
標的特異的プローブの上記セットが、配列可変標的セットに特異的な標的結合性プローブおよびエピジェネティック標的セットに特異的な標的結合性プローブを含み、
それによって、標的特異的プローブとｃｆＤＮＡとの複合体が形成される、ステップ；ならびに
上記複合体を、標的特異的プローブに結合していないｃｆＤＮＡから分離し、それによって、上記配列可変標的セットに対応する捕捉されたｃｆＤＮＡおよび上記エピジェネティック標的セットに対応する捕捉されたｃｆＤＮＡを提供するステップ
を含む、実施形態５または６に記載の方法である。

実施形態８は、上記エピジェネティック標的領域セットが、高メチル化可変標的領域セットを含む、実施形態４から７のいずれか１つに記載の方法である。

実施形態９は、上記高メチル化可変標的領域セットが、健康な対象由来の無細胞ＤＮＡ中のメチル化の程度よりも、少なくとも１つの型の組織において、より高い程度のメチル化を有する領域を含む、直前に先行する実施形態に記載の方法である。

実施形態１０は、上記エピジェネティック標的領域セットが、低メチル化可変標的領域セットを含む、実施形態４から９のいずれか１つに記載の方法である。

実施形態１１は、上記低メチル化可変標的領域セットが、健康な対象由来の無細胞ＤＮＡ中のメチル化の程度よりも、少なくとも１つの型の組織において、より低い程度のメチル化を有する領域を含む、直前に先行する実施形態に記載の方法である。

実施形態１２は、上記エピジェネティック標的領域セットが、メチル化対照標的領域セットを含む、実施形態４から１１のいずれか１つに記載の方法である。

実施形態１３は、上記エピジェネティック標的領域セットが、断片化可変標的領域セットを含む、実施形態４から１２のいずれか１つに記載の方法である。

実施形態１４は、上記断片化可変標的領域セットが、転写開始部位領域を含む、実施形態１３に記載の方法である。

実施形態１５は、上記断片化可変標的領域セットが、ＣＴＣＦ結合領域を含む、実施形態１３または１４に記載の方法である。

実施形態１６は、上記ＤＮＡが、試験対象から得られる、先行する実施形態のいずれか１つに記載の方法である。

実施形態１７は、上記ＤＮＡが、試験対象から得られた無細胞ＤＮＡ（ｃｆＤＮＡ）を含む、先行する実施形態のいずれか１つに記載の方法である。

実施形態１８は、上記ＤＮＡが、試験対象の組織試料から得られたＤＮＡを含む、実施形態１から１６のいずれか１つに記載の方法である。

実施形態１９は、上記組織試料が、生検、微細針吸引物またはホルマリン固定パラフィン包埋組織試料である、直前に先行する実施形態に記載の方法である。

実施形態２０は、捕捉前に、バーコード含有アダプターを上記ＤＮＡにライゲーションさせるステップをさらに含み、必要に応じて、上記ライゲーションさせるステップが、増幅の前にまたはそれと同時に実施される、実施形態５から１８に記載の方法である。

実施形態２１は、上記第１の部分試料由来のＤＮＡ分子と上記第２の部分試料由来のＤＮＡ分子とが、差次的にタグ化される、先行する実施形態のいずれか１つに記載の方法である。

実施形態２２は、上記第１の部分試料由来のＤＮＡ分子と上記第２の部分試料由来のＤＮＡ分子とが、同じ配列決定セルにおいて配列決定される、先行する実施形態のいずれか１つに記載の方法である。

実施形態２３は、上記ＤＮＡが、配列決定するステップの前に増幅される、または方法が捕捉ステップを含み、上記ＤＮＡが、上記捕捉ステップの前に増幅される、先行する実施形態のいずれか１つに記載の方法である。

実施形態２４は、上記試料を複数の部分試料へと分配するステップが、メチル化レベルに基づいて分配するステップを含む、先行する実施形態のいずれか１つに記載の方法である。

実施形態２５は、上記ＤＮＡ中の改変されたヌクレオベースを認識する上記薬剤が、メチル結合試薬である、実施形態２４に記載の方法である。

実施形態２６は、上記メチル結合試薬が抗体である、実施形態２５に記載の方法である。

実施形態２７は、上記メチル結合試薬が、５－メチルシトシンを特異的に認識する、実施形態２５または２６に記載の方法である。

実施形態２８は、上記メチル結合試薬が、固体支持体上に固定化される、実施形態２５から２７のいずれか１つに記載の方法である。

実施形態２９は、上記試料を複数の部分試料へと分配するステップが、メチル化されたＤＮＡの免疫沈降を含む、実施形態２４から２８のいずれか１つに記載の方法である。

実施形態３０は、上記試料を複数の部分試料へと分配するステップが、タンパク質への結合に基づいて分配するステップを含み、必要に応じて、上記タンパク質が、メチル化されたタンパク質、アセチル化されたタンパク質、メチル化されていないタンパク質、アセチル化されていないタンパク質であり；および／または必要に応じて、上記タンパク質がヒストンである、先行する実施形態のいずれか１つに記載の方法である。

実施形態３１は、上記分配するステップが、上記試料の上記ＤＮＡを、上記タンパク質に特異的でありかつ固体支持体に固定化された結合試薬と接触させるステップを含む、実施形態３０に記載の方法である。

実施形態３２は、上記第１の部分試料と第２の部分試料とを差次的にタグ化しプールするステップを含む、先行する実施形態のいずれか１つに記載の方法である。

実施形態３３は、上記複数の部分試料が、上記第２の部分試料よりも高い割合であるが、上記第１の部分試料よりも低い割合でシトシン改変を有するＤＮＡを含む第３の部分試料を含む、先行する実施形態のいずれか１つに記載の方法である。

実施形態３４は、上記第３の部分試料を差次的にタグ化するステップをさらに含む、実施形態３３に記載の方法である。

実施形態３５は、上記第１、第２および第３の部分試料が、上記第１の部分試料を、上記第１の部分試料の上記ＤＮＡ中の上記第２のヌクレオベースとは異なるように上記ＤＮＡ中の上記第１のヌクレオベースに影響を与える上記手順に供するステップの後に組み合わさっており、必要に応じて、上記第１、第２および第３の部分試料が、同じ配列決定セルにおいて配列決定される、実施形態３４に記載の方法である。

実施形態３６は、上記試料が供される上記手順が、上記第２のヌクレオベースの塩基対合特異性を実質的に変更することなしに、上記第１のヌクレオベースの塩基対合特異性を変更する、先行する実施形態のいずれか１つに記載の方法である。

実施形態３７は、上記第１のヌクレオベースが、改変されたまたは未改変のシトシンであり、上記第２のヌクレオベースが、改変されたまたは未改変のシトシンである、先行する実施形態のいずれか１つに記載の方法である。

実施形態３８は、上記第１のヌクレオベースが、未改変のシトシン（Ｃ）を含む、先行する実施形態のいずれか１つに記載の方法である。

実施形態３９は、上記第２のヌクレオベースが、５－メチルシトシン（ｍＣ）を含む、先行する実施形態のいずれか１つに記載の方法である。

実施形態４０は、上記試料が供される上記手順が、バイサルファイト変換を含む、先行する実施形態のいずれか１つに記載の方法である。

実施形態４１は、上記第１のヌクレオベースが、ｍＣを含む、実施形態１から３８のいずれか１つに記載の方法である。

実施形態４２は、上記第２のヌクレオベースが、５－ヒドロキシメチルシトシン（ｈｍＣ）を含む、先行する実施形態のいずれか１つに記載の方法である。

実施形態４３は、上記試料が供される上記手順が、５ｈｍＣの保護を含む、実施形態４２に記載の方法である。

実施形態４４は、上記試料が供される上記手順が、Ｔｅｔ補助バイサルファイト変換（Tet-assisted bisulfite conversion）を含む、実施形態４２に記載の方法である。

実施形態４５は、上記試料が供される上記手順が、置換されたボラン還元剤を用いた、Ｔｅｔ補助変換を含み、必要に応じて、上記置換されたボラン還元剤が、２－ピコリンボラン、ボランピリジン、ｔｅｒｔ－ブチルアミンボランまたはアンモニアボランである、実施形態４２に記載の方法である。

実施形態４６は、上記置換されたボラン還元剤が、２－ピコリンボランまたはボランピリジンである、実施形態４５に記載の方法である。

実施形態４７は、上記第２のヌクレオベースが、Ｃを含む、実施形態４１から４３または４５から４６のいずれか１つに記載の方法である。

実施形態４８は、上記試料が供される上記手順が、ｈｍＣの保護と、その後の、置換されたボラン還元剤を用いた、Ｔｅｔ補助変換とを含み、必要に応じて、上記置換されたボラン還元剤が、２－ピコリンボラン、ボランピリジン、ｔｅｒｔ－ブチルアミンボランまたはアンモニアボランである、実施形態４１から４３または４７のいずれか１つに記載の方法である。

実施形態４９は、上記置換されたボラン還元剤が、２－ピコリンボランまたはボランピリジンである、実施形態４８に記載の方法である。

実施形態５０は、上記試料が供される上記手順が、ｈｍＣの保護と、その後の、ｍＣおよび／またはＣの脱アミノ化とを含む、実施形態３８、３９、４１から４３または４７のいずれか１つに記載の方法である。

実施形態５１は、ｍＣおよび／またはＣの上記脱アミノ化が、ＡＩＤ／ＡＰＯＢＥＣファミリーのＤＮＡデアミナーゼ酵素による処理を含む、実施形態５０に記載の方法である。

実施形態５２は、ｈｍＣの保護が、ｈｍＣのグルコシル化を含む、実施形態４３または４７から５１のいずれか１つに記載の方法である。

実施形態５３は、上記試料が供される上記手順が、置換されたボラン還元剤を用いた、化学物質補助変換（chemical-assisted conversion）を含み、必要に応じて、上記置換されたボラン還元剤が、２－ピコリンボラン、ボランピリジン、ｔｅｒｔ－ブチルアミンボランまたはアンモニアボランである、実施形態１から３７、３９、４１または４７のいずれか１つに記載の方法である。

実施形態５４は、上記置換されたボラン還元剤が、２－ピコリンボランまたはボランピリジンである、実施形態５３に記載の方法である。

実施形態５５は、上記第１のヌクレオベースが、ｈｍＣを含む、実施形態１から３７、３９、４１、４７または５３から５４のいずれか１つに記載の方法である。

実施形態５６は、上記第１のヌクレオベースが、改変されたまたは未改変のアデニンであり、上記第２のヌクレオベースが、改変されたまたは未改変のアデニンである、実施形態１から３６のいずれか１つに記載の方法である。

実施形態５７は、上記第１のヌクレオベースが、改変されたまたは未改変のグアニンであり、上記第２のヌクレオベースが、改変されたまたは未改変のグアニンである、実施形態１から３６のいずれか１つに記載の方法である。

実施形態５８は、上記第１のヌクレオベースが、改変されたまたは未改変のチミンであり、上記第２のヌクレオベースが、改変されたまたは未改変のチミンである、実施形態１から３６のいずれか１つに記載の方法である。

実施形態５９は、上記薬剤によって認識される上記改変されたヌクレオベースが、改変されたシトシンである、先行する実施形態のいずれか１つに記載の方法である。

実施形態６０は、上記薬剤によって認識される上記改変されたヌクレオベースが、メチル化されたシトシンである、先行する実施形態のいずれか１つに記載の方法である。

実施形態６１は、上記薬剤によって認識される上記改変されたヌクレオベースが、変換されたヌクレオベースである、先行する実施形態のいずれか１つに記載の方法である。

実施形態６１．０１は、少なくとも１つの部分試料を複数のさらなる部分試料へと分配するステップをさらに含む、先行する実施形態のいずれか１つに記載の方法である。

実施形態６１．０２は、上記第１の部分試料が、複数のさらなる部分試料へと分配されている、実施形態６１．０１に記載の方法である。

実施形態６１．０３は、上記第２の部分試料が、複数のさらなる部分試料へと分配されている、実施形態６１．０１または６１．０２に記載の方法である。

実施形態６１．０４は、上記試料が、ウラシルを含むＤＮＡ、ｍＣを含むＤＮＡ、およびシトシン５－メチレンスルホネート（ＣＭＳ）、ｈｍＣまたは５－グルコシルヒドロキシメチルシトシン（ｇｈｍＣ）のうち１つまたは複数を含むＤＮＡを含む、実施形態６１．０１から６１．０３のいずれか１つに記載の方法である。

実施形態６１．０５は、上記試料が、ＣＭＳを含むＤＮＡを含む、実施形態６１．０４に記載の方法である。

実施形態６１．０６は、上記試料が、ｈｍＣを含むＤＮＡを含む、実施形態６１．０４に記載の方法である。

実施形態６１．０７は、上記試料が、ｇｈｍＣを含むＤＮＡを含む、実施形態６１．０４に記載の方法である。

実施形態６１．０８は、少なくとも１つの部分試料を複数のさらなる部分試料へと分配するステップが、上記少なくとも１つの部分試料を、ｇｈｍＣ、ｈｍＣまたはｍＣを認識するさらなる薬剤と接触させるステップを含む、実施形態６１．０１から６１．０７のいずれか１つに記載の方法である。

実施形態６１．０９は、上記さらなる薬剤が、ｇｈｍＣを認識する、実施形態６１．０８に記載の方法である。

実施形態６１．１０は、上記さらなる薬剤が、ｈｍＣを認識する、実施形態６１．０８に記載の方法である。

実施形態６１．１１は、上記さらなる薬剤が、ｍＣを認識する、実施形態６１．０８に記載の方法である。

実施形態６１．１２は、上記さらなる薬剤が抗体である、実施形態６１．０１から６１．０７のいずれか１つに記載の方法である。

実施形態６１．１３は、上記さらなる部分試料が、第２のさらなる部分試料よりも高い割合でｍＣを有するＤＮＡを含む第１のさらなる部分試料を含む、実施形態６１．０１から６１．１２のいずれか１つに記載の方法である。

実施形態６１．１４は、上記さらなる部分試料が、上記第２のさらなる部分試料よりも高い割合でｍＣを有するＤＮＡを含む第１のさらなる部分試料を含む、実施形態６１．０１から６１．１３のいずれか１つに記載の方法である。

実施形態６１．１５は、上記第１の部分試料が、上記さらなる部分試料よりも高い割合でＣＭＳを有するＤＮＡを含む、実施形態６１．０１から６１．１４のいずれか１つに記載の方法である。

実施形態６１．１６は、上記第１の部分試料が、上記さらなる部分試料よりも高い割合でｈｍＣまたはｇｈｍＣを有するＤＮＡを含む、実施形態６１．０１から６１．１５のいずれか１つに記載の方法である。

実施形態６２は、捕捉されたＤＮＡの第１および第２の集団を含む組合せ物であって、上記第１の集団が、上記第２の集団よりも高い割合でシトシン改変を有するＤＮＡを含むか、またはそれに由来したものであり、上記第１の集団および上記第２の集団が各々、変更された塩基対合特異性を有する、上記ＤＮＡ中に元々存在する第１のヌクレオベースの形態と、変更された塩基対合特異性を有さない第２のヌクレオベースとを含み、塩基対合特異性の変更前の上記ＤＮＡ中に元々存在する上記第１のヌクレオベースの上記形態が、改変されたまたは未改変のヌクレオベースであり、上記第２のヌクレオベースが、上記第１のヌクレオベースとは異なる改変されたまたは未改変のヌクレオベースであり、塩基対合特異性の変更前の上記ＤＮＡ中に元々存在する上記第１のヌクレオベースの上記形態と上記第２のヌクレオベースとが、同じ塩基対合特異性を有する、組合せ物である。

実施形態６３は、上記第１の集団が、１つまたは複数の配列タグの第１のセットから選択される配列タグを含み、上記第２の集団が、１つまたは複数の配列タグの第２のセットから選択される配列タグを含み、配列タグの上記第２のセットが、配列タグの上記第１のセットとは異なる、実施形態６２に記載の組合せ物である。

実施形態６４は、上記配列タグが、バーコードを含む、実施形態６３に記載の組合せ物である。

実施形態６５は、上記シトシン改変がメチル化である、実施形態６２から６４のいずれか１つに記載の組合せ物である。

実施形態６６は、上記第１のヌクレオベースが、改変されたまたは未改変のシトシンであり、上記第２のヌクレオベースが、改変されたまたは未改変のシトシンである、実施形態６２から６５のいずれか１つに記載の組合せ物である。

実施形態６７は、上記第１のヌクレオベースが、未改変のシトシン（Ｃ）を含む、実施形態６２から６６のいずれか１つに記載の組合せ物である。

実施形態６８は、上記第２のヌクレオベースが、５－メチルシトシン（ｍＣ）および５－ヒドロキシメチルシトシン（ｈｍＣ）のうち一方または両方を含む、実施形態６２から６７のいずれか１つに記載の組合せ物である。

実施形態６９は、第１の集団が、バイサルファイト変換に供されている、実施形態６２から６８のいずれか１つに記載の組合せ物である。

実施形態７０は、上記第１のヌクレオベースが、ｍＣを含む、実施形態６２から６８のいずれか１つに記載の組合せ物である。

実施形態７１は、上記第２のヌクレオベースが、ｈｍＣを含む、実施形態６２から７０のいずれか１つに記載の組合せ物である。

実施形態７２は、上記第１の集団が、保護されたｈｍＣを含む、実施形態６２から７１のいずれか１つに記載の組合せ物である。

実施形態７３は、上記第１の集団が、Ｔｅｔ補助バイサルファイト変換に供されている、実施形態６６または７２に記載の組合せ物である。

実施形態７４は、上記第１の集団が、置換されたボラン還元剤を用いた、Ｔｅｔ補助変換に供されており、必要に応じて、上記置換されたボラン還元剤が、２－ピコリンボラン、ボランピリジン、ｔｅｒｔ－ブチルアミンボランまたはアンモニアボランである、実施形態６６または７２に記載の組合せ物である。

実施形態７５は、上記第１の集団が、ｈｍＣの保護と、その後の、置換されたボラン還元剤を用いた、Ｔｅｔ補助変換とに供されており、必要に応じて、上記置換されたボラン還元剤が、２－ピコリンボラン、ボランピリジン、ｔｅｒｔ－ブチルアミンボランまたはアンモニアボランである、実施形態７２に記載の組合せ物である。

実施形態７６は、上記第２のヌクレオベースが、Ｃを含む、実施形態７２から７４、６８、７０から７２または７４から７５のいずれか１つに記載の組合せ物である。

実施形態７７は、上記第１の集団が、ｈｍＣの保護と、その後の、ｍＣおよび／またはＣの脱アミノ化とに供されている、実施形態７２に記載の組合せ物である。

実施形態７８は、保護されたｈｍＣが、グルコシル化されたｈｍＣを含む、実施形態７２から７７のいずれか１つに記載の組合せ物である。

実施形態７９は、上記第１のヌクレオベースが、ｈｍＣを含む、実施形態７２から７５のいずれか１つに記載の組合せ物である。

実施形態８０は、上記第２のヌクレオベースが、ｍＣを含む、実施形態７２から７５または７９のいずれか１つに記載の組合せ物である。

実施形態８１は、上記第２のヌクレオベースが、Ｃを含む、実施形態７２から７５または７９から８０のいずれか１つに記載の組合せ物である。

実施形態８２は、上記第１の集団が、置換されたボラン還元剤を用いた、化学物質補助変換に供されており、必要に応じて、上記置換されたボラン還元剤が、２－ピコリンボラン、ボランピリジン、ｔｅｒｔ－ブチルアミンボランまたはアンモニアボランである、実施形態７２から７５または７９から８１のいずれか１つに記載の組合せ物である。

実施形態８３は、上記第１のヌクレオベースが、改変されたまたは未改変のアデニンであり、上記第２のヌクレオベースが、改変されたまたは未改変のアデニンである、実施形態７２から７５のいずれか１つに記載の組合せ物である。

実施形態８４は、上記第１のヌクレオベースが、改変されたまたは未改変のグアニンであり、上記第２のヌクレオベースが、改変されたまたは未改変のグアニンである、実施形態７２から７５のいずれか１つに記載の組合せ物である。

実施形態８５は、上記第１のヌクレオベースが、改変されたまたは未改変のチミンであり、上記第２のヌクレオベースが、改変されたまたは未改変のチミンである、実施形態７２から７５のいずれか１つに記載の組合せ物である。

実施形態８６は、上記捕捉されたＤＮＡが、ｃｆＤＮＡを含む、実施形態７２から８５のいずれか１つに記載の組合せ物である。

実施形態８７は、上記捕捉されたＤＮＡが、配列可変標的領域およびエピジェネティック標的領域を含み、上記配列可変標的領域の濃度が、上記エピジェネティック標的領域の濃度よりも高く、上記濃度が、上記配列可変標的領域およびエピジェネティック標的領域のフットプリントサイズに関して標準化される、実施形態７２から８６のいずれか１つに記載の組合せ物である。

実施形態８８は、実施形態１から６１．１６のいずれか１つに記載の方法に従って生産される、実施形態６２から８７のいずれか１つに記載の組合せ物である。

実施形態８９は、上記第１の部分試料の上記ＤＮＡと上記第２の部分試料の上記ＤＮＡとが、差次的にタグ化され；差次的タグ化後に、上記第２の部分試料由来のＤＮＡの一部分が、上記第１の部分試料またはその少なくとも一部分に添加され、それによって、プールを形成し；配列可変標的領域およびエピジェネティック標的領域が、上記プールから捕捉される、実施形態１から６１．１６のいずれか１つに記載の方法である。

実施形態９０は、上記プールが、上記第２の部分試料の上記ＤＮＡの約４５％、４０％、３５％、３０％、２５％、２０％、１５％、１０％もしくは５％未満、またはそれと等しい％を含む、直前に先行する実施形態に記載の方法である。

実施形態９１は、上記プールが、上記第２の部分試料の上記ＤＮＡの約７０～９０％、約７５～８５％または約８０％を含む、実施形態８９に記載の方法である。

実施形態９２は、上記プールが、上記第１の部分試料の上記ＤＮＡの実質的に全てを含む、実施形態８９から９１のいずれか１つに記載の方法である。

実施形態９３は、配列可変標的領域が、上記第２の部分試料由来のＤＮＡの第２の部分から捕捉される、実施形態８９から９２のいずれか１つに記載の方法である。

実施形態９４は、上記対象ががんを有する可能性を決定するステップをさらに含む、実施形態１から６１．１６または８９から９３のいずれか１つに記載の方法である。

実施形態９５は、上記配列決定するステップが、複数の配列決定読み取りを生成し；方法が、上記複数の配列読み取りを、１つまたは複数の参照配列にマッピングして、マッピングされた配列読み取りを生成するステップ、ならびに上記配列可変標的領域セットに対応する上記マッピングされた配列読み取りおよび上記エピジェネティック標的領域セットに対応する上記マッピングされた配列読み取りを処理して、上記対象ががんを有する可能性を決定するステップをさらに含む、直前に先行する実施形態に記載の方法である。

実施形態９６は、上記試験対象が、がんと以前に診断されており、１つまたは複数の以前のがん処置を受けており、必要に応じて、上記ＤＮＡが、上記１つまたは複数の以前のがん処置の後の１つまたは複数の予め選択された時点において得られ、ＤＮＡ分子の捕捉されたセットが配列決定され、それによって、配列情報のセットが生成される、実施形態１から６１．１６または８９から９５のいずれか１つに記載の方法である。

実施形態９７は、配列情報の上記セットを使用して、予め選択された時点における、腫瘍細胞に起源するまたはそれに由来するＤＮＡの存在または非存在を検出するステップをさらに含む、直前に先行する実施形態に記載の方法である。

実施形態９８は、上記試験対象について、上記腫瘍細胞に起源するまたはそれに由来する上記ＤＮＡの上記存在または非存在を示すがん再発スコアを決定するステップをさらに含み、必要に応じて、上記がん再発スコアに基づいて、がん再発ステータスを決定するステップをさらに含み、がん再発スコアが所定の閾値であるもしくはそれを上回ると決定される場合に、上記試験対象の上記がん再発ステータスが、がん再発のリスク状態にあると決定される、または上記がん再発スコアが上記所定の閾値を下回る場合に、上記試験対象の上記がん再発ステータスが、がん再発のより低いリスク状態にあると決定される、直前に先行する実施形態に記載の方法である。

実施形態９９は、上記試験対象の上記がん再発スコアを、所定のがん再発閾値と比較するステップをさらに含み、上記試験対象が、上記がん再発スコアが上記がん再発閾値を上回る場合には、引き続くがん処置のための候補として分類される、または上記がん再発スコアが上記がん再発閾値を下回る場合には、引き続くがん処置のための候補として分類されない、直前に先行する実施形態に記載の方法である。

図１は、ｃｆＤＮＡが血液試料から単離される、血液試料で開始する、本開示のある特定の実施形態に従う例示的なワークフローを示す；ｃｆＤＮＡは、ＣをＵに変換するバイサルファイト（ＢＳ）で処理され、次いで、メチルシトシンに特異的な抗体を使用して、低い、中間、または高いメチル化の部分試料へと分配される；各部分試料は、低い、中間、または高いメチル化の部分試料由来のＤＮＡを識別可能にタグ化するための分子バーコード化に供される；試料は、（任意の適切な順序で）プールされ、捕捉され、増幅され、配列決定される。バイサルファイト変換を含むこの例示的な方法と概して類似した方法は、どのシトシン位置がｍＣまたはｈｍＣに対して未改変のシトシンであったかなかったかを、変換またはその非存在を介して示す。同上。

図２は、本開示の一部の実施形態での使用に適切な系の一例の概略図である。

図３Ａ～Ｂは、本開示のある特定の実施形態に従う例示的なワークフローを示す。同上。

ある特定の実施形態の詳細な説明
本発明のある特定の実施形態に対する言及が、ここで詳細になされる。本発明は、かかる実施形態と併せて記載されるが、かかる実施形態は、本発明をそれらの実施形態に限定することを意図しないことが理解される。対照的に、本発明は、添付の特許請求の範囲によって定義される発明の範囲内に含まれ得る全ての代替法、改変および等価物をカバーする意図である。

本発明の教示を詳細に記載する前に、本開示は、特定の組成物にも処理ステップにも限定されず、それ自体変動し得ることを理解すべきである。本明細書および添付の特許請求の範囲において使用される場合、単数形「１つの（ａ）」、「１つの（ａｎ）」および「その（ｔｈｅ）」は、文脈が明確に他を示さない限り、複数形の言及を含むことに留意すべきである。したがって、例えば、「１つの（ａ）核酸」に対する言及は、複数の核酸を含み、「１つの（ａ）細胞」に対する言及は、複数の細胞を含むなどである。

数値範囲は、その範囲を規定する数字を含む。測定されたおよび測定可能な値は、有効数字、および測定に関連する誤差を考慮して、近似であることが理解される。また、「含む（ｃｏｍｐｒｉｓｅ）」、「含む（ｃｏｍｐｒｉｓｅｓ）」、「含む（ｃｏｍｐｒｉｓｉｎｇ）」、「含有する（ｃｏｎｔａｉｎ）」、「含有する（ｃｏｎｔａｉｎｓ）」、「含有する（ｃｏｎｔａｉｎｉｎｇ）」、「含む（ｉｎｃｌｕｄｅ）」、「含む（ｉｎｃｌｕｄｅｓ）」および「含む（ｉｎｃｌｕｄｉｎｇ）」の使用は、限定を意図しない。上述の一般的な記載および詳細な記載は共に、例示的かつ説明的なものであるに過ぎず、教示の限定ではないことを理解すべきである。

上記明細書で具体的に留意されない限り、種々の構成要素を「含む」を列挙する明細書中の実施形態は、列挙された構成要素「からなる」またはそれ「から本質的になる」とも考えられる；種々の構成要素「からなる」を列挙する明細書中の実施形態は、列挙された構成要素を「含む」またはそれ「から本質的になる」とも考えられる；種々の構成要素「から本質的になる」を列挙する明細書中の実施形態は、列挙された構成要素「からなる」またはそれを「含む」とも考えられる（この互換性は、特許請求の範囲中でのこれらの用語の使用には適用されない）。

本明細書で使用されるセクション見出しは、構成を目的としたものであり、開示された主題を決して限定しないと解釈すべきである。参照により組み込まれる任意の文書または他の資料が、定義を含む本明細書の任意の明確な内容と矛盾する場合には、本明細書が支配する。
Ｉ．定義

「無細胞ＤＮＡ」、「ｃｆＤＮＡ分子」または単に「ｃｆＤＮＡ」には、細胞外形態で対象中に（例えば、血液、血清、血漿、または他の体液、例えば、リンパ、脳脊髄液、尿もしくは痰中に）天然に存在するＤＮＡ分子が含まれる。ｃｆＤＮＡは、以前には、大きい複雑な生物、例えば、哺乳動物中の細胞（単数または複数）中に存在していたが、細胞から、生物において見出される液中への放出を受けており、ｉｎｖｉｔｒｏ細胞溶解ステップを実施する必要なしに、液の試料から得られ得る。ｃｆＤＮＡ分子は、ＤＮＡ断片として存在し得る。

本明細書で使用される場合、核酸、例えば、ＤＮＡ分子の「分配」は、複数の部分試料またはサブ集団の各々中に異なる割合で存在する１つまたは複数の改変または特色に基づいて、核酸の試料または集団を、核酸の複数の部分試料またはサブ集団へと分離、分画、選別または富化することを意味する。分配は、１つまたは複数のメチル化されたヌクレオベースの存在または非存在に基づいて、核酸分子を物理的に分配することを含み得る。試料または集団は、遺伝子変化もしくはエピジェネティック変化または疾患状態を示す特徴に基づいて、１つまたは複数の分配された部分試料またはサブ集団へと分配され得る。

本明細書で使用される場合、改変または他の特色を有するヌクレオチドの分率が、第２の集団中よりも、第１の試料または集団中でより高い場合、改変または他の特色は、第２の試料または集団中よりも、核酸の第１の試料または集団中に「より高い割合」で存在する。例えば、第１の試料中で、ヌクレオチドの１０分の１がｍＣであり、第２の試料中で、ヌクレオチドの２０分の１がｍＣである場合、第１の試料は、第２の試料よりも高い割合で、５－メチル化のシトシン改変を含む。

本明細書で使用される場合、「元々単離された」試料の形態は、それが単離された時点における、および単離された試料の化学構造を変化させる任意の手順を受ける前の、試料の組成または化学構造を指す。同様に、ＤＮＡ分子中に「元々存在する」特色は、「元のＤＮＡ分子」中に存在する、またはＤＮＡ分子の化学構造を変化させる手順をＤＮＡ分子が受ける前の特色を「元々含む」ＤＮＡ分子中に存在する特色を指す。

本明細書で使用される場合、所与のヌクレオベースの「塩基対合特異性を実質的に変更することなしに」とは、配列決定され得るそのヌクレオベースを含む分子の大部分が、それが元々単離された試料中にあったときのその塩基対合特異性と比較して、その所与のヌクレオベースの塩基対合特異性の変更を有さないことを意味する。一部の実施形態では、配列決定され得るそのヌクレオベースを含む分子の７５％、９０％、９５％または９９％が、それが元々単離された試料中にあったときのその塩基対合特異性と比較して、塩基対合特異性の変更を有さない。本明細書で使用される場合、所与のヌクレオベースの「変更された塩基対合特異性」とは、配列決定され得るそのヌクレオベースを含む分子の大部分が、元々単離された試料中でのその塩基対合特異性と比較して、そのヌクレオベースにおいて塩基対合特異性を有することを意味する。

本明細書で使用される場合、「塩基対合特異性」は、所与の塩基が最も優先的に対合する標準的なＤＮＡ塩基（Ａ、Ｃ、ＧまたはＴ）を指す。例えば、未改変のシトシンおよび５－メチルシトシンは、同じ塩基対合特異性（すなわち、Ｇに対する特異性）を有するが、ウラシルはＡに対する塩基対合特異性を有し、一方でシトシンは、Ｇに対する塩基対合特異性を有するので、ウラシルおよびシトシンは、異なる塩基対合特異性を有する。ウラシルがＧと揺らぎのある対を形成する能力は、ウラシルがそれにもかかわらず４つの標準的なＤＮＡ塩基の中でＡと最も優先的に対合するので、重要ではない。

本明細書で使用される場合、複数のメンバーを含む「組合せ物」は、例えば、別々のコンテナ、またはより大きいコンテナ内の区画、例えば、マルチウェルプレート、チューブラック、冷蔵庫、冷凍庫、インキュベーター、水浴、アイスバケット、機械、もしくは他の貯蔵形態中の、これらのメンバーを含む単一の組成物、または近接した組成物のセットのいずれかを指す。

所与の標的セットに対するプローブの収集の「捕捉収量」は、プローブの収集が典型的な条件下で捕捉する標的セットに対応する核酸の量（例えば、別の標的セットと比較した量、または絶対量）を指す。例示的な典型的な捕捉条件は、ストリンジェントなハイブリダイゼーション緩衝液を含有する小さい反応体積（約２０μＬ）中で１０～１８時間にわたる、６５℃での試料核酸およびプローブのインキュベーションである。捕捉収量は、絶対的な用語で、またはプローブの複数の収集については、相対的な用語で表現され得る。標的領域の複数のセットについての捕捉収量が比較される場合、それらは、標的領域セットのフットプリントサイズに関して（例えば、１キロ塩基当たりに基づいて）標準化される。したがって、例えば、第１および第２の標的領域のフットプリントサイズがそれぞれ５０ｋｂおよび５００ｋｂである（０．１の標準化因数（ｎｏｒｍａｌｉｚａｔｉｏｎｆａｃｔｏｒ）を与える）場合、第１の標的領域セットに対応する捕捉されたＤＮＡの体積当たりの質量濃度が、第２の標的領域セットに対応する捕捉されたＤＮＡの体積当たりの質量濃度の０．１倍よりも高いとき、第１の標的領域セットに対応するＤＮＡは、第２の標的領域セットに対応するＤＮＡよりも高い収量で捕捉される。さらなる例として、同じフットプリントサイズを使用すると、第１の標的領域セットに対応する捕捉されたＤＮＡが、第２の標的領域セットに対応する捕捉されたＤＮＡの体積当たりの質量濃度の０．２倍の体積当たりの質量濃度を有する場合、第１の標的領域セットに対応するＤＮＡは、第２の標的領域セットに対応するＤＮＡよりも２倍高い捕捉収量で捕捉されたことになる。

１つまたは複数の標的核酸を「捕捉する」は、１つまたは複数の標的核酸を非標的核酸から優先的に単離または分離することを指す。

核酸の「捕捉されたセット」または「捕捉された」核酸は、捕捉を受けた核酸を指す。

「標的領域セット」または「標的領域のセット」は、捕捉のために標的化されるおよび／またはプローブのセットによって（例えば、配列相補性を介して）標的化される複数のゲノム遺伝子座を指す。

「標的領域セットに対応する」とは、核酸、例えば、ｃｆＤＮＡが、標的領域セット中の遺伝子座に起源したこと、または標的領域セットに対する１つもしくは複数のプローブに特異的に結合することを意味する。

プローブまたは他のオリゴヌクレオチドおよび標的配列の文脈で「特異的に結合する」とは、適切なハイブリダイゼーション条件下で、オリゴヌクレオチドまたはプローブが、その標的配列またはその複製にハイブリダイズして、安定なプローブ：標的ハイブリッドを形成するが、同時に、安定なプローブ：非標的ハイブリッドの形成が最小化されることを意味する。したがって、プローブは、非標的配列に対する場合よりも十分に高い程度まで、標的配列またはその複製にハイブリダイズして、標的配列の捕捉または検出を可能にする。適切なハイブリダイゼーション条件は、当該分野で周知であり、配列組成に基づいて予測され得、または慣用的な試験法を使用して決定され得る（例えば、これにより参照により本明細書に組み込まれる、Sambrook et al., Molecular Cloning, A Laboratory Manual, 2nd ed. (Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989)の§§１．９０～１．９１、７．３７～７．５７、９．４７～９．５１および１１．４７～１１．５７、特に、§§９．５０～９．５１、１１．１２～１１．１３、１１．４５～１１．４７および１１．５５～１１．５７を参照されたい）。

「配列可変標的領域セット」は、正常細胞と比較して、新生物細胞（例えば、腫瘍細胞およびがん細胞）において、配列における変化、例えば、ヌクレオチド置換（すなわち、単一ヌクレオチドバリエーション）、挿入、欠失、または遺伝子融合もしくは転位を示し得る、標的領域のセットを指す。

「エピジェネティック標的領域セット」は、正常細胞と比較して、新生物細胞（例えば、腫瘍細胞およびがん細胞）において、配列非依存的な変化を示し得る、または健康な対象由来のｃｆＤＮＡと比較して、がんを有する対象由来のｃｆＤＮＡにおいて、配列非依存的な変化を示し得る、標的領域のセットを指す。配列非依存的な変化の例としては、これらに限定されないが、メチル化における変化（増加または減少）、ヌクレオソーム分布、ｃｆＤＮＡ断片化パターン、ＣＣＣＴＣ結合因子（「ＣＴＣＦ」）結合、転写開始部位および調節タンパク質結合領域が挙げられる。したがって、エピジェネティック標的領域セットとしては、これらに限定されないが、高メチル化可変標的領域セット、低メチル化可変標的領域セット、ならびに断片化可変標的領域セット、例えば、ＣＴＣＦ結合部位および転写開始部位が挙げられる。本発明の目的のために、新生物関連、腫瘍関連もしくはがん関連の限局的増幅および／または遺伝子融合に対して感受性の遺伝子座もまた、エピジェネティック標的領域セット中に含まれ得るが、それは、配列決定による、または参照ゲノム中の１つよりも多くの遺伝子座にマッピングされる融合された配列による、コピー数における変化の検出が、例えば、それらの検出は１つまたは数個の個々の位置における塩基コールの精度に依存しないので、限局的増幅および／または遺伝子融合が、配列決定の比較的浅い深度において検出され得るという点で、ヌクレオチド置換、挿入、または欠失の検出よりも、上で議論した例示的なエピジェネティック変化の検出とより類似している傾向があるからである。

核酸は、それが腫瘍細胞に起源する場合、「腫瘍によって産生される」または「循環腫瘍ＤＮＡ」（「ｃｔＤＮＡ」）である。腫瘍細胞は、それらが腫瘍中に残存しているか、腫瘍から分離されるか（例えば、転移性がん細胞および循環腫瘍細胞の場合にあてはまる）にかかわらず、腫瘍に起源する新生物細胞である。

用語「メチル化」または「ＤＮＡメチル化」は、核酸分子中のヌクレオベースへのメチル基の付加を指す。一部の実施形態では、メチル化は、ＣｐＧ部位（シトシン－リン酸－グアニン部位（すなわち、核酸配列の５’→３’方向での、シトシンとその後のグアニン））における、シトシンへのメチル基の付加を指す。一部の実施形態では、ＤＮＡメチル化は、例えば、Ｎ^６－メチルアデニンにおける、アデニンへのメチル基の付加を指す。一部の実施形態では、ＤＮＡメチル化は、５－メチル化（シトシンの６－炭素環の５番目の炭素の改変）である。一部の実施形態では、５－メチル化は、５－メチルシトシン（５ｍＣ）を創出する、シトシンの５Ｃ位へのメチル基の付加を指す。一部の実施形態では、メチル化は、５ｍＣの誘導体を含む。５ｍＣの誘導体としては、これらに限定されないが、５－ヒドロキシメチルシトシン（５－ｈｍＣ）、５－ホルミルシトシン（５－ｆＣ）および５－カルボキシルシトシン（５－ｃａＣ）が挙げられる。一部の実施形態では、ＤＮＡメチル化は、３Ｃメチル化（シトシンの６－炭素環の３番目の炭素の改変）である。一部の実施形態では、３Ｃメチル化は、３－メチルシトシン（３ｍＣ）を生成する、シトシンの３Ｃ位へのメチル基の付加を含む。メチル化は、非ＣｐＧ部位においても生じ得る、例えば、メチル化は、ＣｐＡ、ＣｐＴまたはＣｐＣ部位において生じ得る。ＤＮＡメチル化は、メチル化されたＤＮＡ領域の活性を変化させ得る。例えば、プロモーター領域中のＤＮＡがメチル化されている場合、遺伝子の転写は、抑制され得る。ＤＮＡメチル化は、正常な発生のために重要であり、メチル化における異常は、エピジェネティック調節を破壊し得る。エピジェネティック調節における破壊、例えば、抑制は、疾患、例えば、がんを引き起こし得る。ＤＮＡにおけるプロモーターメチル化は、がんを示し得る。

用語「高メチル化」は、核酸分子の集団（例えば、試料）内の他の核酸分子と比較して増加した、核酸分子のメチル化のレベルまたは程度を指す。一部の実施形態では、高メチル化されたＤＮＡには、少なくとも１つのメチル化された残基、少なくとも２つのメチル化された残基、少なくとも３つのメチル化された残基、少なくとも５つのメチル化された残基または少なくとも１０個のメチル化された残基を含むＤＮＡ分子が含まれ得る。

用語「低メチル化」は、核酸分子の集団（例えば、試料）内の他の核酸分子と比較して減少した、核酸分子のメチル化のレベルまたは程度を指す。一部の実施形態では、低メチル化されたＤＮＡには、メチル化されていないＤＮＡ分子が含まれる。一部の実施形態では、低メチル化されたＤＮＡには、０個のメチル化された残基、多くても１つのメチル化された残基、多くても２つのメチル化された残基、多くても３つのメチル化された残基、多くても４つのメチル化された残基または多くても５つのメチル化された残基を含むＤＮＡ分子が含まれ得る。

用語「ＤＮＡ中の改変されたヌクレオベースを認識する薬剤」は、ＤＮＡ中の１つまたは複数の改変されたヌクレオベースに結合するまたはそれを検出する分子または試薬を指す。「改変されたヌクレオベース」は、未改変のヌクレオベースと比較して、化学構造における差異を含むヌクレオベースである。ＤＮＡの場合、未改変のヌクレオベースは、アデニン、シトシン、グアニンまたはチミンである。一部の実施形態では、改変されたヌクレオベースは、改変されたシトシンである。一部の実施形態では、改変されたヌクレオベースは、メチル化されたヌクレオベースである。一部の実施形態では、改変されたシトシンは、メチルシトシン、例えば、５－メチルシトシンである。かかる実施形態では、シトシン改変は、メチルである。ＤＮＡ中のメチルシトシンを認識する薬剤には、これに限定されないが、メチルシトシンに結合する試薬を本明細書で指す「メチル結合試薬」が含まれる。メチル結合試薬には、これらに限定されないが、メチル結合ドメイン（ＭＢＤ）およびメチル結合タンパク質（ＭＢＰ）、ならびにメチルシトシンに特異的な抗体が含まれる。一部の実施形態では、かかる抗体は、ＤＮＡ中の５－メチルシトシンに結合する。一部のかかる実施形態では、ＤＮＡは、一本鎖または二本鎖であり得る。

用語「またはそれらの組合せ（単数）」および「またはそれらの組合せ（複数）」は、本明細書で使用される場合、この用語に先行する列挙された用語の任意のおよび全ての順列および組合せを指す。例えば、「Ａ、Ｂ、Ｃ、またはそれらの組合せ」は、以下のうち少なくとも１つを含む意図である：Ａ、Ｂ、Ｃ、ＡＢ、ＡＣ、ＢＣまたはＡＢＣ、および特定の文脈において順序が重要な場合には、ＢＡ、ＣＡ、ＣＢ、ＡＣＢ、ＣＢＡ、ＢＣＡ、ＢＡＣまたはＣＡＢも含む意図である。この例を敷衍すると、１つまたは複数の項目または用語の反復を含有する組合せ、例えば、ＢＢ、ＡＡＡ、ＡＡＢ、ＢＢＣ、ＡＡＡＢＣＣＣＣ、ＣＢＢＡＡＡ、ＣＡＢＡＢＢなどが、明示的に含まれる。当業者は、文脈から他が明らかでない限り、任意の組合せ中の項目または用語の数に関して、典型的には限定が存在しないことを理解する。

「または」は、文脈が他を要求しない限り、包括的な意味で、すなわち、「および／または」と等価な意味で使用される。
ＩＩ．例示的な方法
Ａ．ＤＮＡ中の第２のヌクレオベースとは異なるようにＤＮＡ中の第１のヌクレオベースに影響を与える手順

本明細書で開示される方法は、ＤＮＡを、ＤＮＡ中の第２のヌクレオベースとは異なるようにＤＮＡ中の第１のヌクレオベースに影響を与える手順に供するステップであって、第１のヌクレオベースが、改変されたまたは未改変のヌクレオベースであり、第２のヌクレオベースが、第１のヌクレオベースとは異なる改変されたまたは未改変のヌクレオベースであり、第１のヌクレオベースと第２のヌクレオベースとが、同じ塩基対合特異性を有する、ステップを含む。一部の実施形態では、この手順は、変換されたヌクレオベースの塩基対合特異性が変更されるように、第１または第２のヌクレオベースを化学的に変換する。一部の実施形態では、第１のヌクレオベースが、改変されたまたは未改変のアデニンである場合、第２のヌクレオベースは、改変されたまたは未改変のアデニンであり；第１のヌクレオベースが、改変されたまたは未改変のシトシンである場合、第２のヌクレオベースは、改変されたまたは未改変のシトシンであり；第１のヌクレオベースが、改変されたまたは未改変のグアニンである場合、第２のヌクレオベースは、改変されたまたは未改変のグアニンであり；第１のヌクレオベースが、改変されたまたは未改変のチミンである場合、第２のヌクレオベースは、改変されたまたは未改変のチミンである（このとき、改変されたおよび未改変のウラシルは、このステップの目的のために、改変されたチミン内に包含される）。

一部の実施形態では、第１のヌクレオベースは、改変されたまたは未改変のシトシンであり、次いで、第２のヌクレオベースは、改変されたまたは未改変のシトシンである。例えば、第１のヌクレオベースは、未改変のシトシン（Ｃ）を含み得、第２のヌクレオベースは、５－メチルシトシン（ｍＣ）および５－ヒドロキシメチルシトシン（ｈｍＣ）のうち１つまたは複数を含み得る。あるいは、第２のヌクレオベースは、Ｃを含み得、第１のヌクレオベースは、ｍＣおよびｈｍＣのうち１つまたは複数を含み得る。例えば、上記概要および以下の議論に示されるように、第１のヌクレオベースおよび第２のヌクレオベースのうち一方がｍＣを含み、他方がｈｍＣを含む場合など、他の組合せもまた可能である。

一部の実施形態では、ＤＮＡ中の第２のヌクレオベースとは異なるようにＤＮＡ中の第１のヌクレオベースに影響を与える手順は、バイサルファイト変換を含む。バイサルファイトによる処理は、未改変のシトシンおよびある特定の改変されたシトシン（例えば、５－ホルミルシトシン（ｆＣ）または５－カルボキシルシトシン（ｃａＣ））をウラシルに変換するが、他の改変されたシトシン（例えば、５－メチルシトシン、５－ヒドロキシルメチルシトシン（5-hydroxylmethylcystosine））は変換されない。したがって、バイサルファイト変換が使用される場合、第１のヌクレオベースは、未改変のシトシン、５－ホルミルシトシン、５－カルボキシルシトシン、またはバイサルファイトによって影響を与えられる他のシトシン形態のうち１つまたは複数を含むかまたはそれらからなり、第２のヌクレオベースは、ｍＣおよびｈｍＣのうち１つまたは複数、例えば、ｍＣおよび必要に応じてｈｍＣを含み得る。バイサルファイト処理されたＤＮＡの配列決定は、シトシンと読まれる位置を、ｍＣまたはｈｍＣ位置であると同定する。一方で、Ｔと読まれる位置は、Ｔまたはバイサルファイト感受性形態のＣ、例えば、未改変のシトシン、５－ホルミルシトシンもしくは５－カルボキシルシトシンであると同定される。したがって、本明細書に記載されるようにバイサルファイト変換を実施することは、配列読み取りを使用してｍＣまたはｈｍＣを含有する位置を同定することを容易にする。バイサルファイト変換の例示的な記載については、例えば、Moss et al., Nat Commun. 2018; 9: 5068を参照されたい。バイサルファイト変換が実施される例示的なワークフローは、図１に示される。

一部の実施形態では、ＤＮＡ中の第２のヌクレオベースとは異なるようにＤＮＡ中の第１のヌクレオベースに影響を与える手順は、酸化的バイサルファイト（Ｏｘ－ＢＳ）変換を含む。この手順は、ｈｍＣを、バイサルファイト感受性のｆＣに最初に変換し、その後バイサルファイト変換を実施する。したがって、酸化的バイサルファイト変換が使用される場合、第１のヌクレオベースは、未改変のシトシン、ｆＣ、ｃａＣ、ｈｍＣ、またはバイサルファイトによって影響を与えられる他のシトシン形態のうち１つまたは複数を含み、第２のヌクレオベースは、ｍＣを含む。Ｏｘ－ＢＳ変換されたＤＮＡの配列決定は、シトシンと読まれる位置を、ｍＣ位置であると同定する。一方で、Ｔと読まれる位置は、Ｔ、ｈｍＣ、またはバイサルファイト感受性形態のＣ、例えば、未改変のシトシン、ｆＣまたはｈｍＣであると同定される。したがって、本明細書に記載されるようにＯｘ－ＢＳ変換を実施することは、配列読み取りを使用してｍＣを含有する位置を同定することを容易にする。酸化的バイサルファイト変換の例示的な記載については、例えば、Booth et al., Science 2012; 336: 934-937を参照されたい。

一部の実施形態では、ＤＮＡ中の第２のヌクレオベースとは異なるようにＤＮＡ中の第１のヌクレオベースに影響を与える手順は、Ｔｅｔ補助バイサルファイト（ＴＡＢ）変換を含む。ＴＡＢ変換では、ｈｍＣは、変換から保護され、ｍＣは、バイサルファイト処理に先立って酸化され、その結果、ｍＣによって元々占められていた位置は、Ｕに変換されるが、ｈｍＣによって元々占められていた位置は、保護された形態のシトシンのままである。例えば、Yu et al., Cell 2012; 149: 1368-80に記載されるように、β－グルコシルトランスフェラーゼが、ｈｍＣを保護するために使用され得（５－グルコシルヒドロキシメチルシトシン（ｇｈｍＣ）を形成する）、次いで、ＴＥＴタンパク質、例えば、ｍＴｅｔ１が、ｍＣをｃａＣに変換するために使用され得、次いで、バイサルファイト処理が、ＣおよびｃａＣをＵに変換するために使用され得るが、ｇｈｍＣは、影響を与えられないままである。したがって、ＴＡＢ変換が使用される場合、第１のヌクレオベースは、未改変のシトシン、ｆＣ、ｃａＣ、ｍＣ、またはバイサルファイトによって影響を与えられる他のシトシン形態のうち１つまたは複数を含み、第２のヌクレオベースは、ｈｍＣを含む。ＴＡＢ変換されたＤＮＡの配列決定は、シトシンと読まれる位置を、ｈｍＣ位置であると同定する。一方で、Ｔと読まれる位置は、Ｔ、ｍＣ、またはバイサルファイト感受性形態のＣ、例えば、未改変のシトシン、ｆＣもしくはｃａＣであると同定される。したがって、本明細書に記載されるようにＴＡＢ変換を実施することは、配列読み取りを使用してｈｍＣを含有する位置を同定することを容易にする。

一部の実施形態では、ＤＮＡ中の第２のヌクレオベースとは異なるようにＤＮＡ中の第１のヌクレオベースに影響を与える手順は、置換されたボラン還元剤を用いた、Ｔｅｔ補助変換を含み、必要に応じて、置換されたボラン還元剤は、２－ピコリンボラン、ボランピリジン、ｔｅｒｔ－ブチルアミンボランまたはアンモニアボランである。置換されたボラン還元剤変換を用いた、Ｔｅｔ補助ｐｉｃ－ボラン変換では、ＴＥＴタンパク質が、未改変のＣに影響を与えることなしにｍＣおよびｈｍＣをｃａＣに変換するために使用される。次いで、ｃａＣ、および存在する場合にはｆＣが、これもまた未改変のＣに影響を与えることなしに、２－ピコリンボラン（ｐｉｃ－ボラン）または別の置換されたボラン還元剤、例えば、ボランピリジン、ｔｅｒｔ－ブチルアミンボランもしくはアンモニアボランによる処理によって、ジヒドロウラシル（ＤＨＵ）に変換される。例えば、Liu et al., Nature Biotechnology 2019; 37:424-429（例えば、補足図１および補足注釈７）を参照されたい。ＤＨＵは、配列決定においてＴと読まれる。したがって、この型の変換が使用される場合、第１のヌクレオベースは、ｍＣ、ｆＣ、ｃａＣまたはｈｍＣのうち１つまたは複数を含み、第２のヌクレオベースは、未改変のシトシンを含む。変換されたＤＮＡの配列決定は、シトシンと読まれる位置を、未改変のＣ位置であると同定する。一方で、Ｔと読まれる位置は、Ｔ、ｍＣ、ｆＣ、ｃａＣまたはｈｍＣであると同定される。したがって、本明細書に記載されるようにＴＡＰ変換を実施することは、配列読み取りを使用して未改変のＣを含有する位置を同定することを容易にする。この手順は、Liu et al. 2019、上記にさらに詳細に記載される、Ｔｅｔ補助ピリジンボラン配列決定（ＴＡＰＳ）を包含する。

あるいは、ｈｍＣの保護（例えば、βＧＴを使用する）が、置換されたボラン還元剤を用いた、Ｔｅｔ補助変換と組み合わされ得る。ｈｍＣは、ｇｈｍＣを形成する、βＧＴを使用するグルコシル化を介して、上記のように保護され得る。次いで、ＴＥＴタンパク質、例えば、ｍＴｅｔ１による処理は、ｍＣをｃａＣに変換するが、ＣもｇｈｍＣも変換しない。次いで、ｃａＣは、これもまた未改変のＣにもｇｈｍＣにも影響を与えることなしに、ｐｉｃ－ボランまたは別の置換されたボラン還元剤、例えば、ボランピリジン、ｔｅｒｔ－ブチルアミンボランもしくはアンモニアボランによる処理によって、ＤＨＵに変換される。したがって、置換されたボラン還元剤を用いた、Ｔｅｔ補助変換が使用される場合、第１のヌクレオベースは、ｍＣを含み、第２のヌクレオベースは、未改変のシトシンまたはｈｍＣのうち１つまたは複数、例えば、未改変のシトシンならびに必要に応じてｈｍＣ、ｆＣおよび／またはｃａＣを含む。変換されたＤＮＡの配列決定は、シトシンと読まれる位置を、ｈｍＣまたは未改変のＣ位置のいずれかであると同定する。一方で、Ｔと読まれる位置は、Ｔ、ｆＣ、ｃａＣまたはｍＣであると同定される。したがって、本明細書に記載されるようにＴＡＰＳβ変換を実施することは、配列読み取りを使用して、未改変のＣまたはｈｍＣを含有する位置を、一方では、ｍＣを含有する位置から識別することを容易にする。この型の変換の例示的な記載については、例えば、Liu et al., Nature Biotechnology 2019; 37:424-429を参照されたい。

一部の実施形態では、ＤＮＡ中の第２のヌクレオベースとは異なるようにＤＮＡ中の第１のヌクレオベースに影響を与える手順は、置換されたボラン還元剤を用いた、化学物質補助変換を含み、必要に応じて、置換されたボラン還元剤は、２－ピコリンボラン、ボランピリジン、ｔｅｒｔ－ブチルアミンボランまたはアンモニアボランである。置換されたボラン還元剤を用いた、化学物質補助変換では、酸化剤、例えば、過ルテニウム酸カリウム（ＫＲｕＯ_４）（ｏｘ－ＢＳ変換での使用にも適切である）が、ｈｍＣをｆＣに特異的に酸化するために使用される。ｐｉｃ－ボランまたは別の置換されたボラン還元剤、例えば、ボランピリジン、ｔｅｒｔ－ブチルアミンボランもしくはアンモニアボランによる処理は、ｆＣおよびｃａＣをＤＨＵに変換するが、ｍＣにも未改変のＣにも影響を与えない。したがって、この型の変換が使用される場合、第１のヌクレオベースは、ｈｍＣ、ｆＣおよびｃａＣのうち１つまたは複数を含み、第２のヌクレオベースは、未改変のシトシンまたはｍＣのうち１つまたは複数、例えば、未改変のシトシンおよび必要に応じてｍＣを含む。変換されたＤＮＡの配列決定は、シトシンと読まれる位置を、ｍＣまたは未改変のＣ位置のいずれかであると同定する。一方で、Ｔと読まれる位置は、Ｔ、ｆＣ、ｃａＣまたはｈｍＣであると同定される。したがって、本明細書に記載されるようにこの型の変換を実施することは、配列読み取りを使用して、未改変のＣ、またはｍＣを含有する位置を、一方では、ｈｍＣを含有する位置から識別することを容易にする。この型の変換の例示的な記載については、例えば、Liu et al., Nature Biotechnology 2019; 37:424-429を参照されたい。

一部の実施形態では、ＤＮＡ中の第２のヌクレオベースとは異なるようにＤＮＡ中の第１のヌクレオベースに影響を与える手順は、ＡＰＯＢＥＣカップリングされたエピジェネティック（ＡＣＥ）変換を含む。ＡＣＥ変換では、ＡＩＤ／ＡＰＯＢＥＣファミリーのＤＮＡデアミナーゼ酵素、例えば、ＡＰＯＢＥＣ３Ａ（Ａ３Ａ）が、ｈｍＣもｆＣもｃａＣも脱アミノ化することなしに、未改変のシトシンおよびｍＣを脱アミノ化するために使用される。したがって、ＡＣＥ変換が使用される場合、第１のヌクレオベースは、未改変のＣおよび／またはｍＣ（例えば、未改変のＣおよび必要に応じてｍＣ）を含み、第２のヌクレオベースは、ｈｍＣを含む。ＡＣＥ変換されたＤＮＡの配列決定は、シトシンと読まれる位置を、ｈｍＣ、ｆＣまたはｃａＣ位置であると同定する。一方で、Ｔと読まれる位置は、Ｔ、未改変のＣ、またはｍＣであると同定される。したがって、本明細書に記載されるようにＡＣＥ変換を実施することは、配列読み取りを使用して、ｈｍＣを含有する位置を、ｍＣまたは未改変のＣを含有する位置から識別することを容易にする。ＡＣＥ変換の例示的な記載については、例えば、Schutsky et al., Nature Biotechnology 2018; 36: 1083-1090を参照されたい。

一部の実施形態では、ＤＮＡ中の第２のヌクレオベースとは異なるようにＤＮＡ中の第１のヌクレオベースに影響を与える手順は、例えば、ＥＭ－Ｓｅｑ中と同様の、第１のヌクレオベースの酵素的変換を含む。例えば、ｗｗｗ．ｂｉｏｒｘｉｖ．ｏｒｇ／ｃｏｎｔｅｎｔ／１０．１１０１／２０１９．１２．２０．８８４６９２ｖ１において入手可能なVaisvila R, et al. (2019) EM-seq: Detection of DNA methylation at single base resolution from picograms of DNA. bioRxiv; DOI: 10.1101/2019.12.20.884692を参照されたい。例えば、ＴＥＴ２および必要に応じてＴ４－βＧＴが、５ｍＣおよび５ｈｍＣを、デアミナーゼ（例えば、ＡＰＯＢＥＣ３Ａ）によって脱アミノ化することができない基質へと変換するために使用され得、次いで、デアミナーゼ（例えば、ＡＰＯＢＥＣ３Ａ）が、未改変のシトシンを脱アミノ化して、それらをウラシルに変換するために使用され得る。一部の実施形態では、５ｍＣおよび／または５ｈｍＣが、（例えば、Ｔｅｔ２を使用して）５ｃａＣに変換され、次いで、未改変のＣが、（例えば、ＡＰＯＢＥＣ３Ａを使用して）Ｕに変換される。次いで、５ｃａＣ含有ＤＮＡ（５ｍＣおよび／または５ｈｍＣを元々含有するＤＮＡから生成された）が、例えば、抗ｃａＣ抗体を使用して分配され得る。

一部の実施形態では、第１のヌクレオベースは、改変されたまたは未改変のアデニンであり、第２のヌクレオベースは、改変されたまたは未改変のアデニンである。一部の実施形態では、改変されたアデニンは、Ｎ^６－メチルアデニン（ｍＡ）である。一部の実施形態では、改変されたアデニンは、Ｎ^６－メチルアデニン（ｍＡ）、Ｎ^６－ヒドロキシメチルアデニン（ｈｍＡ）またはＮ^６－ホルミルアデニン（ｆＡ）のうち１つまたは複数である。

メチル化ＤＮＡ免疫沈降（ＭｅＤＩＰ）を含む技法が、改変された塩基、例えば、ｍＣ、ｍＡ、ｃａＣ（これは、例えば、デアミナーゼ、例えば、ＡＰＯＢＥＣ３Ａを使用する、例えば、未改変のＣのＵへの酵素的変換の前に、Ｔｅｔ２によるｍＣまたはｈｍＣの酸化によって生成され得る）またはジヒドロウラシルを含有するＤＮＡを、他のＤＮＡから分離するために使用され得る。例えば、Kumar et al., Frontiers Genet. 2018; 9: 640；Greer et al., Cell 2015; 161: 868-878を参照されたい。ｍＡに特異的な抗体は、Sun et al., Bioessays 2015; 37:1155-62に記載されている。種々の改変されたヌクレオベース、例えば、ｍＣ、ｃａＣ、およびジヒドロウラシルまたはハロゲン化された形態、例えば、５－ブロモウラシルが含まれるチミン／ウラシルの形態に対する抗体は、市販されている。種々の改変された塩基もまた、それらの塩基対合特異性における変更に基づいて検出され得る。例えば、ヒポキサンチンは、脱アミノ化から生じ得るアデニンの改変された形態であり、配列決定ではＧと読まれる。例えば、米国特許第８，４８６，６３０号；Brown, Genomes, 2^nd Ed., John Wiley & Sons, Inc., New York, N.Y., 2002, chapter 14, "Mutation, Repair, and Recombination."を参照されたい。
Ｂ．試料を複数の部分試料へと分配するステップ；試料の態様；エピジェネティック特徴の分析

本明細書に記載されるある特定の実施形態では、第１のヌクレオベースと第２のヌクレオベースとに異なるように影響を与える手順の後に、異なる形態の核酸（例えば、高メチル化されたＤＮＡおよび低メチル化されたＤＮＡ）の集団は、さらなる分析、例えば、ヌクレオベースをさらに差次的に改変もしくは単離すること、タグ化すること、および／または配列決定することの前に、核酸の１つまたは複数の特徴に基づいて物理的に分配され得る。このアプローチは、例えば、ある特定の配列が高メチル化されているか低メチル化されているかを決定するために使用され得る。一部の実施形態では、分配は、第１のヌクレオベースと第２のヌクレオベースとに異なるように影響を与える手順に供される前の試料中に元々存在した異なる形態の核酸に基づく。一部の実施形態では、分配は、試料の核酸中の、第１のヌクレオベースと第２のヌクレオベースとに異なるように影響を与える手順によって生産された異なる形態の核酸に基づく。

メチル化プロファイリングは、ゲノムの異なる領域にわたってメチル化パターンを決定することを含み得る。例えば、メチル化の程度（例えば、分子１つ当たりのメチル化されたヌクレオベースの相対数）に基づいて分子を分配し、配列決定した後に、異なる分配中の分子の配列は、参照ゲノムにマッピングされ得る。これは、他の領域と比較して、より高度にメチル化されたまたはあまり高度にメチル化されていないゲノムの領域を示し得る。この方法では、ゲノム領域は、個々の分子とは対照的に、メチル化の程度において異なり得る。

一部の実施形態では、メチル化プロファイリングから得られたシグナルを、体細胞バリエーション（例えば、ＳＮＶ、インデル、ＣＮＶおよび遺伝子融合）から得られたシグナルと組み合わせることは、がんの検出を容易にする。

試料中の核酸分子は、核酸分子のメチル化ステータスに基づいて分画または分配され得る。試料中の核酸分子を分配することは、稀なシグナルを増加させることができる。例えば、高メチル化されたＤＮＡ中には存在するが、低メチル化されたＤＮＡ中にはあまり存在しない（または存在しない）遺伝子バリエーションは、試料を、高メチル化された核酸分子および低メチル化された核酸分子へと分配することによって、より容易に検出することができる。試料の複数の画分を分析することによって、単一の分子の多次元分析を実施することができ、したがって、より高い感度を達成することができる。分配は、１つまたは複数のメチル化されたヌクレオベースの存在または非存在に基づいて、核酸分子をサブセットまたは群へと物理的に分配することを含み得る。試料は、差次的遺伝子発現または疾患状態を示す特徴に基づいて、１つまたは複数の分配されたセットへと分画または分配され得る。試料は、核酸、例えば、無細胞ＤＮＡ（ｃｆＤＮＡ）、非ｃｆＤＮＡ、腫瘍ＤＮＡ、循環腫瘍ＤＮＡ（ｃｔＤＮＡ）および無細胞核酸（ｃｆＮＡ）の分析の間に、正常状態と罹患状態との間でのシグナルにおける差異を提供する特徴またはそれらの組合せに基づいて、分画され得る。

一部の実施形態では、高メチル化可変エピジェネティック標的領域は、腫瘍細胞、もしくは分析されているＤＮＡ試料（例えば、ｃｆＤＮＡ）に通常は寄与しない型の細胞の高メチル化特徴をそれらが示すかどうかを決定するために分析され、および／または低メチル化可変エピジェネティック標的領域は、腫瘍細胞、もしくは分析されているＤＮＡ試料（例えば、ｃｆＤＮＡ）に通常は寄与しない型の細胞の低メチル化特徴をそれらが示すかどうかを決定するために分析される。さらに、不均一な核酸集団を分配することによって、例えば、集団の１つの画分（または分配）中でより一般的な、稀な核酸分子を富化することによって、稀なシグナルを増加させ得る。例えば、高メチル化されたＤＮＡ中には存在するが、低メチル化されたＤＮＡ中にはあまり存在しない（または存在しない）遺伝子バリエーションは、試料を、高メチル化された核酸分子および低メチル化された核酸分子へと分配することによって、より容易に検出することができる。試料の複数の画分を分析することによって、ゲノムの単一の遺伝子座または核酸の種の多次元分析を実施することができ、したがって、より高い感度を達成することができる。

一部の例では、不均一な核酸試料は、２つまたはそれよりも多くの分配（例えば、少なくとも３、４、５、６または７つの分配）へと分配される。一部の実施形態では、各分配は、差次的にタグ化される。次いで、タグ化された分配は、収集的試料調製および／または配列決定のために、一緒にプールされ得る。分配するステップ－タグ化するステップ－プールするステップは、１回よりも多く実施され得、分配の各ラウンドは、異なる特徴（本明細書で提供される例）に基づいて実施され、他の分配から識別される差次的タグと分配手段とを使用してタグ化される。

分配のために使用され得る特徴の例としては、配列長さ、メチル化レベル、ヌクレオソーム結合、配列ミスマッチ、免疫沈降、および／またはＤＮＡに結合するタンパク質が挙げられる。得られた分配は、以下の核酸形態のうち１つまたは複数を含み得る：一本鎖ＤＮＡ（ｓｓＤＮＡ）、二本鎖ＤＮＡ（ｄｓＤＮＡ）、より短いＤＮＡ断片およびより長いＤＮＡ断片。一部の実施形態では、シトシン改変（例えば、シトシンメチル化）またはメチル化に基づいて分配するステップが一般に実施され、必要に応じて、ＤＮＡの上述の特徴または形態のいずれかに基づき得る、少なくとも１回の追加の分配ステップと組み合わされる。一部の実施形態では、核酸の不均一な集団は、１つまたは複数のエピジェネティック改変を有する核酸および１つまたは複数のエピジェネティック改変を有さない核酸へと分配される。エピジェネティック改変の例としては、メチル化の存在または非存在；メチル化のレベル；メチル化の型（例えば、５－メチルシトシン対他の型のメチル化、例えば、アデニンメチル化および／またはシトシンヒドロキシメチル化）；ならびに１つまたは複数のタンパク質、例えば、ヒストンとの会合および会合のレベルが挙げられる。あるいはまたはさらに、核酸の不均一な集団は、ヌクレオソームと会合した核酸分子およびヌクレオソームを持たない核酸分子へと分配され得る。あるいはまたはさらに、核酸の不均一な集団は、一本鎖ＤＮＡ（ｓｓＤＮＡ）および二本鎖ＤＮＡ（ｄｓＤＮＡ）へと分配され得る。あるいはまたはさらに、核酸の不均一な集団は、核酸長さ（例えば、最大で１６０ｂｐの分子、および１６０ｂｐよりも長い長さを有する分子）に基づいて分配され得る。

一部の例では、各分配（特定の核酸形態が富化された部分試料）は、差次的にタグ化され、分配は、配列決定する前に一緒にプールされる。他の例では、異なる形態は、別々に配列決定される。

一部の実施形態では、異なる核酸の集団は、ＤＮＡ中の第２のヌクレオベースとは異なるようにＤＮＡ中の第１のヌクレオベースに影響を与える手順に供され、第１のヌクレオベースは、改変されたまたは未改変のヌクレオベースであり、第２のヌクレオベースは、第１のヌクレオベースとは異なる改変されたまたは未改変のヌクレオベースであり、第１のヌクレオベースと第２のヌクレオベースとは、同じ塩基対合特異性を有する。次いで、集団は、２つまたはそれよりも多くの異なる分配へと分配される。各分配は、異なる核酸形態で富化され、第１の分配（部分試料とも呼ばれる）は、第２の部分試料よりも高い割合でシトシン改変を有するＤＮＡを含む。各分配は、別個にタグ化される。タグ化された核酸は、配列決定する前に一緒にプールされる。第１および第２の部分試料のうち少なくとも１つのＤＮＡ中の第１のヌクレオベースを第２のヌクレオベースからｉｎｓｉｌｉｃｏで識別するためを含めて、配列読み取りが得られ分析される。タグは、異なる分配からの読み取りを選別するために使用される。遺伝的バリアントを検出するための分析は、分配毎のレベルで、および核酸集団全体レベルで実施され得る。例えば、分析には、各分配中の核酸中の遺伝的バリアント、例えば、ＣＮＶ、ＳＮＶ、インデル、融合を決定するためのｉｎｓｉｌｉｃｏ分析が含まれ得る。一部の例では、ｉｎｓｉｌｉｃｏ分析は、クロマチン構造を決定することを含み得る。例えば、配列読み取りのカバレッジは、クロマチン中のヌクレオソームのポジショニングを決定するために使用され得る。より高いカバレッジは、ゲノム領域中のより高いヌクレオソーム占有と相関し得るが、より低いカバレッジは、より低いヌクレオソーム占有またはヌクレオソーム枯渇領域（ＮＤＲ）と相関し得る。

試料は、ヌクレオチドに対する複製後改変が含まれる改変、および１つまたは複数のタンパク質への、通常は非共有結合的な結合が変動する核酸を含み得る。

ある実施形態では、核酸の集団は、新生物、腫瘍もしくはがんを有すると疑われる対象、または新生物、腫瘍もしくはがんと以前に診断された対象由来の血清、血漿または血液試料から得られる。核酸の集団は、変動するレベルのメチル化を有する核酸を含む。メチル化は、任意の１つまたは複数の複製後または転写後改変から生じ得る。複製後改変としては、特に、ヌクレオベースの５位におけるシトシンの改変、例えば、５－メチルシトシン、５－ヒドロキシメチルシトシン、５－ホルミルシトシンおよび５－カルボキシルシトシンが挙げられる。試料内の核酸の集団を分配するために使用される薬剤は、親和性薬剤、例えば、所望の特異性を有する抗体、天然の結合パートナーもしくはそれらのバリアント（Bock et al., Nat Biotech 28: 1106-1114 (2010)；Song et al., Nat Biotech 29: 68-72 (2011)）、または所与の標的に対する特異性を有するように、例えばファージディスプレイによって選択された人工ペプチドであり得る。一部の実施形態では、分配において使用される薬剤は、改変されたヌクレオベースを認識する薬剤である。一部の実施形態では、薬剤によって認識される改変されたヌクレオベースは、改変されたシトシン、例えば、メチルシトシン（例えば、５－メチルシトシン）である。一部の実施形態では、薬剤によって認識される改変されたヌクレオベースは、試料のＤＮＡ中の第２のヌクレオベースとは異なるようにＤＮＡ中の第１のヌクレオベースに影響を与える手順の産物である。一部の実施形態では、改変されたヌクレオベースは、「変換されたヌクレオベース」であり得、これは、その塩基対合特異性が手順によって変化させられたことを意味する。例えば、ある特定の手順は、メチル化されていないもしくは未改変のシトシンをジヒドロウラシルに変換し、またはより一般には、少なくとも１つの改変されたもしくは未改変の形態のシトシンが、脱アミノ化を受けて、ウラシル（ＤＮＡの文脈では改変されたヌクレオベースとみなされる）もしくはさらなる改変された形態のウラシルを生じる。分配剤の例としては、抗体、例えば、改変されたシトシン、例えば、メチルシトシン（例えば、５－メチルシトシン）であり得る改変されたヌクレオベースを認識する抗体が挙げられる。一部の実施形態では、分配剤は、５－メチルシトシン以外の改変されたシトシン、例えば、５－カルボキシルシトシン（５ｃａＣ）を認識する抗体である。代替的分配剤としては、メチル結合ドメイン（ＭＢＤ）、例えば、ＭＢＤ２、およびＭｅＣＰ２などのタンパク質が含まれる、本明細書に記載されるメチル結合タンパク質（ＭＢＰ）が挙げられる。

分配剤の追加の非限定的な例は、ヒストンに結合した核酸を、遊離核酸または未結合の核酸から分離することができる、ヒストン結合タンパク質である。本明細書で開示される方法において使用され得るヒストン結合タンパク質の例としては、ＲＢＢＰ４、ＲｂＡｐ４８およびＳＡＮＴドメインペプチドが挙げられる。

特定の核酸への分配剤の結合、および部分試料への核酸の分配は、ある特定の程度まで生じ得る、または本質的に二元（ｂｉｎａｒｙ）の様式で生じ得る。一部の例では、より高い割合のある特定の改変を含む核酸は、より低い割合の改変を含む核酸よりも高い程度まで、この薬剤に結合する。同様に、分配は、ある特定の改変を含む核酸のより高い割合およびより低い割合を含む、部分試料を生成し得る。あるいは、分配は、改変を含む核酸の本質的に全てを含むまたはかかる核酸を含まない部分試料を生成し得る。全ての例では、種々のレベルの改変が、分配剤から順次溶出され得る。

一部の実施形態では、分配は、二元分配および改変の程度／レベルに基づく分配の両方を含み得る。例えば、メチル化された断片は、メチル化ＤＮＡ免疫沈降（ＭｅＤＩＰ）によって分配され得、または全てのメチル化された断片は、メチル結合ドメインタンパク質（例えば、ＭｅｔｈｙｌＭｉｎｄｅｒＭｅｔｈｙｌａｔｅｄＤＮＡＥｎｒｉｃｈｍｅｎｔＫｉｔ（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ））を使用して、メチル化されていない断片から分配され得る。引き続いて、追加の分配は、メチル結合ドメインおよび結合した断片を含む溶液中の塩濃度を調整することによって、異なるレベルのメチル化を有する断片を溶出させることを含み得る。塩濃度が増加すると、より高いメチル化レベルを有する断片が溶出される。

一部の例では、最終分配は、異なる程度の改変（改変を過剰提示するまたは過少提示する）を有する核酸が富化されている。過剰提示および過少提示は、集団中の鎖１つ当たりの改変の中央値数と比較した、核酸によって生み出された改変の数によって定義され得る。例えば、試料中の核酸中の５－メチルシトシン残基の中央値数が２である場合、２つよりも多くの５－メチルシトシン残基を含む核酸は、この改変が過剰提示され、１またはゼロ個の５－メチルシトシン残基を有する核酸は、過少提示される。親和性分離の効果は、結合相中の改変が過剰提示された核酸および未結合相中（すなわち、溶液中）の改変が過少提示された核酸を富化することである。結合相中の核酸は、引き続く処理の前に溶出され得る。

ＭｅＤＩＰまたはＭｅｔｈｙｌＭｉｎｅｒＭｅｔｈｙｌａｔｅｄＤＮＡＥｎｒｉｃｈｍｅｎｔＫｉｔ（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ）を使用する場合、種々のレベルのメチル化が、順次の溶出を使用して分配され得る。例えば、低メチル化された分配（メチル化なし）は、核酸集団を、磁気ビーズに結合された、このキット由来のＭＢＤと接触させることによって、メチル化された分配から分離され得る。ビーズが、メチル化された核酸を非メチル化核酸から分離するために使用される。引き続いて、１回または複数の溶出ステップが、異なるレベルのメチル化を有する核酸を溶出させるために、順次実施される。例えば、メチル化された核酸の第１のセットは、１６０ｍＭまたはそれよりも高い塩濃度、例えば、少なくとも１５０ｍＭ、少なくとも２００ｍＭ、３００ｍＭ、４００ｍＭ、５００ｍＭ、６００ｍＭ、７００ｍＭ、８００ｍＭ、９００ｍＭ、１０００ｍＭまたは２０００ｍＭの塩濃度で溶出され得る。かかるメチル化された核酸が溶出された後、磁気分離が、より高いレベルのメチル化された核酸を、より低いレベルのメチル化を有する核酸から分離するために、もう一度使用される。溶出ステップおよび磁気分離ステップは、種々の分配、例えば、低メチル化された分配（メチル化を含まない核酸が富化されている）、メチル化された分配（低レベルのメチル化を含む核酸が富化されている）、および高メチル化された分配（高レベルのメチル化を含む核酸が富化されている）を創出するために反復され得る。

一部の方法では、親和性分離ベースの分配に使用される薬剤に結合した核酸は、洗浄ステップに供される。洗浄ステップは、親和性薬剤に弱く結合した核酸を洗浄して除く。かかる核酸は、平均または中央値（すなわち、試料と薬剤との最初の接触の際の、固相に結合したままの核酸と固相に結合していない核酸との間の中間）に近い程度まで改変を有する核酸が富化され得る。

親和性分離は、異なる程度の改変を有する核酸の、少なくとも２つ、ときどきは３つまたはそれよりも多くの分配を生じる。これらの分配はまだ別々であるが、少なくとも１つの分配の核酸、通常は２つもしくは３つ（またはそれよりも多くの）分配の核酸は、アダプターの構成要素として通常は提供される核酸タグに連結され、異なる分配中の核酸は、１つの分配のメンバーを別の分配から識別する異なるタグを受ける。同じ分配の核酸分子に連結されたタグは、互いに同じまたは異なり得る。しかし、互いに異なる場合、これらのタグは、それらが結合される分子を特定の分配のものであると同定するために、それらのコードの一部を共通して有し得る。

メチル化などの特徴に基づいて核酸試料を分割することに関するさらなる詳細については、これにより参照により本明細書に組み込まれるＷＯ２０１８／１１９４５２を参照されたい。

一部の実施形態では、核酸分子は、特異的タンパク質またはその断片に結合している核酸分子およびその特異的タンパク質またはその断片に結合していない核酸分子に基づいて、異なる分配へと分画され得る。

核酸分子は、ＤＮＡ－タンパク質結合に基づいて分画され得る。タンパク質－ＤＮＡ複合体は、タンパク質の特定の特性に基づいて分画され得る。かかる特性の例としては、種々のエピトープ、改変（例えば、ヒストンメチル化またはアセチル化）または酵素活性が挙げられる。ＤＮＡに結合し得、分画のための基礎として機能し得るタンパク質の例としては、これらに限定されないが、プロテインＡおよびプロテインＧが挙げられ得る。任意の適切な方法が、タンパク質結合した領域に基づいて核酸分子を分画するために使用され得る。タンパク質結合した領域に基づいて核酸分子を分画するために使用される方法の例としては、これらに限定されないが、ＳＤＳ－ＰＡＧＥ、クロマチン－免疫沈降（ＣｈＩＰ）、ヘパリンクロマトグラフィーおよび非対称フィールドフロー分画（ａｓｙｍｍｅｔｒｉｃａｌｆｉｅｌｄｆｌｏｗｆｒａｃｔｉｏｎａｔｉｏｎ）（ＡＦ４）が挙げられる。

一部の実施形態では、複数の部分試料への試料の分配は、核酸を、ＤＮＡ中の、改変されたシトシン、または試料のＤＮＡ中の第２のヌクレオベースとは異なるようにＤＮＡ中の第１のヌクレオベースに影響を与える手順の産物であり得る、改変されたヌクレオベースを認識する抗体と接触させることによって、実施される。一部の実施形態では、改変されたヌクレオベースは、５ｍＣである。一部の実施形態では、改変されたヌクレオベースは、５ｃａＣである。一部の実施形態では、改変されたヌクレオベースは、ジヒドロウラシル（ＤＨＵ）である。一部の実施形態では、ＤＮＡ中の改変されたヌクレオベースを認識する抗体は、一本鎖ＤＮＡを分配するために使用される。

一部の実施形態では、分配は、核酸を、メチル結合タンパク質（「ＭＢＰ」）のメチル結合ドメイン（「ＭＢＤ」）と接触させることによって実施される。一部のかかる実施形態では、核酸は、ＭＢＰ全体と接触させられる。一部の実施形態では、ＭＢＤは、５－メチルシトシン（５ｍＣ）に結合し、ＭＢＰは、ＭＢＤを含み、本明細書で相互交換可能に、メチル結合タンパク質またはメチル結合ドメインタンパク質と呼ばれる。一部の実施形態では、ＭＢＤは、ビオチンリンカーを介して、常磁性ビーズ、例えば、Ｄｙｎａｂｅａｄｓ（登録商標）Ｍ－２８０ストレプトアビジンにカップリングされる。異なる程度のメチル化を有する画分への分配は、ＮａＣｌ濃度を増加させることによって画分を溶出させることによって実施され得る。

一部の実施形態では、結合したＤＮＡは、抗体またはＭＢＤを、プロテアーゼ、例えば、プロテイナーゼＫと接触させることによって、溶出される。これは、上で議論したＮａＣｌを使用する溶出ステップの代わりに、またはかかる溶出ステップに加えて、実施され得る。

本明細書で企図される改変されたヌクレオベースを認識する薬剤の例としては、これらに限定されないが、以下が挙げられる：
（ａ）ＭｅＣＰ２は、未改変のシトシンよりも５－メチル－シトシンに優先的に結合するタンパク質である。
（ｂ）ＲＰＬ２６、ＰＲＰ８およびＤＮＡミスマッチ修復タンパク質ＭＨＳ６は、未改変のシトシンよりも５－ヒドロキシメチル－シトシンに優先的に結合する。
（ｃ）ＦＯＸＫ１、ＦＯＸＫ２、ＦＯＸＰ１、ＦＯＸＰ４およびＦＯＸＩ３は、好ましくは、未改変のシトシンよりも５－ホルミル－シトシンに結合する（Iurlaro et al., Genome Biol. 14: R119 (2013)）。
（ｄ）１つもしくは複数のメチル化されたもしくは改変されたヌクレオベースまたはそれらの変換産物、例えば、５ｍＣ、５ｃａＣもしくはＤＨＵに特異的な抗体。

一般に、溶出は、１分子当たりのメチル化された部位の数の関数であり、より多くのメチル化を有する分子は、増加した塩濃度の下で溶出する。メチル化の程度に基づいてＤＮＡを別個の集団へと溶出させるために、漸増するＮａＣｌ濃度の一連の溶出緩衝液を使用することができる。塩濃度は、約１００ｎｍ～約２５００ｍＭのＮａＣｌの範囲であり得る。一実施形態では、処理は、３つの分配を生じる。分子は、第１の塩濃度の、改変されたヌクレオベースを認識する薬剤を含む分子を含む溶液と接触させられ、この分子は、捕捉部分、例えば、ストレプトアビジンに結合され得る。第１の塩濃度では、分子のある集団が薬剤に結合し、ある集団は未結合のままである。未結合の集団は、「低メチル化された」集団として分離され得る。例えば、低メチル化された形態のＤＮＡが富化された第１の分配は、低い塩濃度、例えば、１００ｍＭまたは１６０ｍＭで未結合のままである分配である。中間のメチル化されたＤＮＡが富化された第２の分配は、中間の塩濃度、例えば、１００ｍＭと２０００ｍＭとの間の濃度を使用して溶出される。これもまた、試料から分離される。高メチル化された形態のＤＮＡが富化された第３の分配は、高い塩濃度、例えば、少なくとも約２０００ｍＭを使用して溶出される。

一部の実施形態では、本明細書に記載される方法は、少なくとも１つの部分試料を複数のさらなる部分試料へと分配するステップをさらに含む。例えば、バイサルファイト変換の後、試料が、ウラシルを含むＤＮＡ、ｍＣを含むＤＮＡ、およびシトシン５－メチレンスルホネート（ＣＭＳ）を含むＤＮＡを含む場合、この方法は、試料のＤＮＡがＣＭＳを認識する薬剤と接触させられる第１の分配ステップ、および第２の部分試料のＤＮＡがｍＣを認識する薬剤（例えば、抗体）と接触させられる第２の分配ステップを含み得る。図３Ａを参照されたい。かかる試料は、ｍＣおよびｈｍＣを含むＤＮＡを、５ｍＣに影響を与えることなしにｈｍＣをＣＭＳに変換し、メチル化されていないＣをＵに変換するバイサルファイト変換に供することによって、調製され得る。かかる実施形態では、第１の部分試料、第１のさらなる部分試料および第２のさらなる部分試料が提供され（このとき、第１のさらなる部分試料と第２のさらなる部分試料とは、一緒になって第２の部分試料を構成する）、第１の部分試料は、さらなる部分試料よりも高い割合でＣＭＳを有するＤＮＡを含み、第１のさらなる部分試料は、第２のさらなる部分試料よりも高い割合でｍＣを有するＤＮＡを含む。かかる実施形態では、１つまたは複数のさらなる部分試料（または全てのさらなる部分試料）のＤＮＡを配列決定することは、第２の部分試料のＤＮＡを配列決定することとみなされる。

別の例では、Ｔ４－βＧＴグリコシル化およびバイサルファイト変換の後、試料が、ウラシルを含むＤＮＡ、ｍＣを含むＤＮＡ、およびｈｍＣまたはｇｈｍＣを含むＤＮＡを含む場合、この方法は、試料のＤＮＡがｈｍＣおよびｇｈｍＣを認識する薬剤（例えば、抗体）と接触させられる第１の分配ステップ、および第２の部分試料のＤＮＡがｍＣを認識する薬剤と接触させられる第２の分配ステップを含み得る。図３Ｂを参照されたい。かかる試料は、５ｍＣおよび５ｈｍＣを含むＤＮＡを、Ｔ４－βＧＴグリコシル化ステップとその後のバイサルファイト変換とに供することによって、調製され得る。かかる実施形態では、第１の部分試料、第１のさらなる部分試料および第２のさらなる部分試料が提供され（このとき、第１のさらなる部分試料と第２のさらなる部分試料とは、一緒になって第２の部分試料を構成する）、第１の部分試料は、さらなる部分試料よりも高い割合でｈｍＣまたはｇｈｍＣを有するＤＮＡを含み、第１のさらなる部分試料は、第２のさらなる部分試料よりも高い割合でｍＣを有するＤＮＡを含む。かかる実施形態では、１つまたは複数のさらなる部分試料（または全てのさらなる部分試料）のＤＮＡを配列決定することは、第２の部分試料のＤＮＡを配列決定することとみなされる。
Ｃ．分配のタグ化

一部の実施形態では、２つまたはそれよりも多くの分配、例えば、各分配は、差次的にタグ化される。ＤＮＡ分子を「タグ化すること」は、タグがＤＮＡ分子に結合されるまたはそれと会合される手順である。タグは、タグが会合した分子の特色を示す情報を含む、核酸などの分子であり得る。例えば、分子は、試料タグ（これは、１つの試料中の分子を異なる試料中の分子から識別する）、分配タグ（これは、１つの分配中の分子を異なる分配中の分子から識別する）または分子タグ／分子バーコード／バーコード（これは、異なる分子を互いから識別する（独自のタグ化シナリオおよび非独自のタグ化シナリオの両方において））を保有し得る。ある特定の実施形態では、タグは、バーコードのうち１つまたは組合せを含み得る。本明細書で使用される場合、用語「バーコード」は、文脈に依存して、特定のヌクレオチド配列を有する核酸分子、またはヌクレオチド配列自体を指す。バーコードは、例えば、１０ヌクレオチドと１００ヌクレオチドとの間を有し得る。バーコードの収集は、特定の目的のために所望される場合、縮重配列を有し得る、またはある特定のハミング距離を有する配列を有し得る。したがって、例えば、分子バーコードは、１つのバーコード、または各々が分子の異なる末端に結合した２つのバーコードの組合せから構成され得る。さらにまたはあるいは、異なる分配および／または試料について、バーコードが、それらの個々の配列を介して分子タグとして機能し、それらがそのメンバーであるセット基づいて、それらが対応する分配および／または試料を同定するようにも機能するように、分子バーコードまたは分子タグの異なるセットが使用され得る。バーコードを含むタグは、アダプター中に取り込まれ得るまたはアダプターに他の方法で接続され得る。タグは、他の方法の中でも、ライゲーション、重複伸長ＰＣＲによって取り込まれ得る。

タグ化戦略は、独自のタグ化戦略および非独自のタグ化戦略へと分割され得る。独自のタグ化では、試料中の分子の全てまたは実質的に全てが、異なるタグを保有し、その結果、読み取りは、タグ情報単独に基づいて、元の分子に割り当てられ得る。かかる方法において使用されるタグは、ときどき、「独自のタグ」と呼ばれる。非独自のタグ化では、同じ試料中の異なる分子は、同じタグを保有し得、その結果、タグ情報に加えた他の情報が、配列読み取りを元の分子に割り当てるために使用される。かかる情報には、開始および停止座標、分子がマッピングされる座標、開始または停止座標単独などが含まれ得る。かかる方法において使用されるタグは、ときどき、「非独自のタグ」と呼ばれる。したがって、試料中の全ての分子を独自にタグ化する必要はない。これは、試料内の、同定可能なクラス内に入る分子を独自にタグ化するのに十分である。したがって、異なる同定可能なファミリー中の分子は、タグ化された分子の正体についての情報の喪失なしに、同じタグを保有することができる。

非独自のタグ化のある特定の実施形態では、使用される異なるタグの数は、特定の群の全ての分子が異なるタグを保有する非常に高い可能性（例えば、少なくとも９９％、少なくとも９９．９％、少なくとも９９．９９％または少なくとも９９．９９９％）が存在するのに十分であり得る。バーコードがタグとして使用される場合、およびバーコードが、分子の両方の末端に、例えばランダムに結合される場合、バーコードの組合せが一緒になってタグを構成し得ることに留意すべきである。項中のこの数は、コールに入る分子の数の関数である。例えば、クラスは、参照ゲノム上の同じ開始－停止位置にマッピングされる全ての分子であり得る。クラスは、特定の遺伝子座、例えば、特定の塩基または特定の領域（例えば、最大で１００塩基、または遺伝子、または遺伝子のエクソン）にわたってマッピングされる全ての分子であり得る。ある特定の実施形態では、クラス中のいくつかの分子を独自に同定するために使用される異なるタグの数ｚは、２^＊ｚ、３^＊ｚ、４^＊ｚ、５^＊ｚ、６^＊ｚ、７^＊ｚ、８^＊ｚ、９^＊ｚ、１０^＊ｚ、１１^＊ｚ、１２^＊ｚ、１３^＊ｚ、１４^＊ｚ、１５^＊ｚ、１６^＊ｚ、１７^＊ｚ、１８^＊ｚ、１９^＊ｚ、２０^＊ｚまたは１００^＊ｚのいずれか（例えば、下限）と１００，０００^＊ｚ、１０，０００^＊ｚ、１０００^＊ｚまたは１００^＊ｚのいずれか（例えば、上限）との間であり得る。

例えば、約５ｎｇ～３０ｎｇの無細胞ＤＮＡの試料中、おおよそ３０００個の分子が特定のヌクレオチド座標にマッピングされ、約３個と１０個との間の分子が、同じ停止座標を共有するように、任意の開始座標を有すると予想される。したがって、約５０～約５０，０００個の異なるタグ（例えば、約６個と２２０個との間のバーコード組合せ）が、全てのかかる分子を独自にタグ化するのに十分であり得る。ヌクレオチド座標にわたってマッピングされる３０００個全ての分子を独自にタグ化するために、約百万～約２千万個の異なるタグが要求される。

一般に、反応における独自のまたは非独自のタグバーコードの割り当ては、米国特許出願第２００１００５３５１９号、同第２００３０１５２４９０号、同第２０１１０１６００７８号ならびに米国特許第６，５８２，９０８号および米国特許第７，５３７，８９８号および米国特許第

９，５９８，７３１号によって記載される方法および系に従う。タグは、試料核酸に、ランダムにまたは非ランダムに連結され得る。

一部の実施形態では、タグ化された核酸は、マイクロウェルプレート中に充填した後に配列決定される。マイクロウェルプレートは、９６、３８４または１５３６個のマイクロウェルを有し得る。一部の場合には、これらは、独自のタグのマイクロウェルに対する予想された比で、導入される。例えば、約１、２、３、４、５、６、７、８、９、１０、２０、５０、１００、５００、１０００、５０００、１００００、５０，０００、１００，０００、５００，０００、１，０００，０００、１０，０００，０００、５０，０００，０００または１，０００，０００，０００個よりも多くの独自のタグがゲノム試料１つ当たり充填されるように、独自のタグが充填され得る。一部の場合には、約２、３、４、５、６、７、８、９、１０、２０、５０、１００、５００、１０００、５０００、１００００、５０，０００、１００，０００、５００，０００、１，０００，０００、１０，０００，０００、５０，０００，０００または１，０００，０００，０００個未満の独自のタグがゲノム試料１つ当たり充填されるように、独自のタグが充填され得る。一部の場合には、試料ゲノム１つ当たり充填される独自のタグの平均数は、ゲノム試料１つ当たり、約１、２、３、４、５、６、７、８、９、１０、２０、５０、１００、５００、１０００、５０００、１００００、５０，０００、１００，０００、５００，０００、１，０００，０００、１０，０００，０００、５０，０００，０００もしくは１，０００，０００，０００個未満のまたはそれよりも多い、独自のタグである。

好ましい形式は、標的核酸の両方の末端にライゲーションされた２０～５０個の異なるタグ（例えば、バーコード）を使用する。例えば、標的分子の両方の末端にライゲーションされた３５個の異なるタグ（例えば、バーコード）は、３５×３５の順列を創出し、これは、３５個のタグについて１２２５と等しい。同じ開始点および停止点を有する異なる分子が、タグの異なる組合せを受ける高い確率（例えば、少なくとも９４％、９９．５％、９９．９９％、９９．９９９％）を有するには、かかる数のタグが十分である。他のバーコード組合せには、１０と５００との間の任意の数、例えば、約１５×１５、約３５×３５、約７５×７５、約１００×１００、約２５０×２５０、約５００×５００が含まれる。

一部の場合には、独自のタグは、所定のまたはランダムなまたは半ランダムな配列オリゴヌクレオチドであり得る。他の場合には、バーコードがその複数中で互いに独自である必要が必ずしもない、複数のバーコードが使用され得る。この例では、バーコードとそれがライゲーションされ得る配列との組合せが、個々に追跡され得る独自の配列を創出するように、バーコードは、個々の分子にライゲーションされ得る。本明細書に記載されるように、配列読み取りの始まり（開始）および終わり（停止）の位置の配列データと組み合わせた非独自のバーコードの検出は、特定の分子への独自の正体の割り当てを可能にし得る。個々の配列読み取りの長さまたは塩基対の数もまた、独自の正体をかかる分子に割り当てるために使用され得る。それにより、本明細書に記載されるように、独自の正体が割り当てられた核酸の単一の鎖由来の断片は、親鎖由来の断片の引き続く同定を可能にし得る。

タグは、タグ（単数または複数）を特定の分配に相関付けるように個々のポリヌクレオチド集団分配を標識するために使用され得る。あるいは、タグは、分配するステップを用いない本発明の実施形態において使用され得る。一部の実施形態では、単一のタグが、特定の分配を標識するために使用され得る。一部の実施形態では、複数の異なるタグが、特定の分配を標識するために使用され得る。特定の分配を標識するために複数の異なるタグを用いる実施形態では、１つの分配を標識するために使用されるタグのセットは、他の分配を標識するために使用されるタグのセットについて容易に差別化され得る。一部の実施形態では、タグは、追加の機能を有し得る、例えば、タグは、試料供給源にインデックスを付けるために使用され得、または独自の分子識別子（これは、例えば、Kinde et al., Proc Nat'l Acad Sci USA 108: 9530-9535 (2011)、Kou et al., PLoS ONE,11: e0146638 (2016)にあるように、配列決定エラーを突然変異から差別化することによって、配列決定データの品質を改善するために使用され得る）として使用され得、または例えば米国特許第９，５９８，７３１号に記載されるように、非独自の分子識別子として使用され得る。同様に、一部の実施形態では、タグは、追加の機能を有し得、例えば、タグは、試料供給源にインデックスを付けるために使用され得る、または非独自の分子識別子（これは、配列決定エラーを突然変異から差別化することによって、配列決定データの品質を改善するために使用され得る）として使用され得る。

一実施形態では、分配のタグ化は、各分配中の分子を分配タグでタグ化することを含む。分配を再度組み合わせ（例えば、必要な配列決定ランの数を低減させ、不必要なコストを回避するため）、分子を配列決定した後に、分配タグは、供給源分配を同定する。別の実施形態では、異なる分配は、例えば、バーコードの対から構成される、分子タグの異なるセットでタグ化される。この方法では、各分子バーコードは、供給源分配を示すだけでなく、分配内の分子を識別するためにも有用である。例えば、３５個のバーコードの第１のセットが、第１の分配中の分子をタグ化するために使用され得、３５個のバーコードの第２のセットが、第２の分配中の分子をタグ化するために使用され得る。

一部の実施形態では、分配し、分配タグでタグ化した後、分子は、単一のランでの配列決定のためにプールされ得る。一部の実施形態では、試料タグが、例えば、分配タグの付加およびプールに引き続くステップにおいて、分子に付加される。試料タグは、単一の配列決定ランでの配列決定のために、複数の試料から生成された材料をプールすることを容易にし得る。

あるいは、一部の実施形態では、分配タグは、試料ならびに分配に相関付けられ得る。単純な例として、第１のタグは、第１の試料の第１の分配を示し得；第２のタグは、第１の試料の第２の分配を示し得；第３のタグは、第２の試料の第１の分配を示し得；第４のタグは、第２の試料の第２の分配を示し得る。

タグは、１つまたは複数の特徴に基づいて既に分配された分子に結合され得るが、ライブラリー中の最終的なタグ化された分子は、その特徴をもはや有さない場合がある。例えば、一本鎖ＤＮＡ分子が分配およびタグ化され得るが、ライブラリー中の最終的なタグ化された分子は、二本鎖である可能性が高い。同様に、ＤＮＡは、異なるレベルのメチル化に基づいた分配に供され得るが、最終ライブラリー中では、これらの分子に由来するタグ化された分子は、メチル化されていない可能性が高い。したがって、ライブラリー中の分子に結合されたタグは、典型的には、最終的なタグ化された分子が由来する「親分子」の特徴を示すが、タグ化された分子自体の特徴は必ずしも示さない。

一例として、バーコード１、２、３、４などは、第１の分配中の分子をタグ化および標識化するために使用され；バーコードＡ、Ｂ、Ｃ、Ｄなどは、第２の分配中の分子をタグ化および標識化するために使用され；バーコードａ、ｂ、ｃ、ｄなどは、第３の分配中の分子をタグ化および標識化するために使用される。差次的にタグ化された分配は、配列決定前にプールされ得る。差次的にタグ化された分配は、別々に配列決定され得る、または例えばＩｌｌｕｍｉｎａシーケンサーの同じフローセルにおいて並列で一緒に配列決定され得る。

配列決定後、遺伝的バリアントを検出するための読み取りの分析は、分配毎のレベルで、ならびに核酸集団全体レベルで実施され得る。タグは、異なる分配からの読み取りを選別するために使用される。分析には、配列情報、ゲノム座標長さ、カバレッジおよび／またはコピー数を使用して遺伝子バリエーションおよびエピジェネティックバリエーション（メチル化、クロマチン構造などのうち１つまたは複数）を決定するためのｉｎｓｉｌｉｃｏ分析が含まれ得る。一部の実施形態では、より高いカバレッジは、ゲノム領域中のより高いヌクレオソーム占有と相関し得るが、より低いカバレッジは、より低いヌクレオソーム占有またはヌクレオソーム枯渇領域（ＮＤＲ）と相関し得る。

分配手順は、部分試料間でのＤＮＡ分子の不完全な選別を生じ得る。例えば、第２の部分試料中の分子の少数は、高度に改変され得（例えば、高メチル化され得）、および／または第１の部分試料中の分子の少数は、未改変または大部分が未改変であり得る（例えば、メチル化されていないまたは大部分がメチル化されていない場合がある）。第２の部分試料中の高度に改変された分子および第１の部分試料中の未改変または大部分が未改変の分子は、非特異的に分配されたとみなされる。本明細書に記載される方法は、例えば、非特異的に分配されたＤＮＡが配列決定後に同定され得るようにある特定の塩基を変換することによって、および／またはそれを分解することによって、非特異的に分配されたＤＮＡからの技術的ノイズを低減させることができるステップを含む。したがって、本明細書に記載される方法は、改善された感度および／または能率化された分析を提供することができる。
Ｄ．改変された核酸の分析の代替的方法

一部の実施形態では、アダプターは、核酸を分配した後に核酸に付加され、他の実施形態では、アダプターは、核酸を分配する前に核酸に付加され得る。一部のかかる方法では、分配する前に、核酸は、ＤＮＡ中の第２のヌクレオベースとは異なるようにＤＮＡ中の第１のヌクレオベースに影響を与える手順に供され、第１のヌクレオベースは、改変されたまたは未改変のヌクレオベースであり、第２のヌクレオベースは、第１のヌクレオベースとは異なる改変されたまたは未改変のヌクレオベースであり、第１のヌクレオベースと第２のヌクレオベースとは、同じ塩基対合特異性を有する。

一部の実施形態では、試料を、第２のヌクレオベースとは異なるようにＤＮＡ中の第１のヌクレオベースに影響を与える手順に供するステップ、および試料を複数の部分試料へと分配するステップの後に、第１のアダプターが、一本鎖ＤＮＡへのライゲーションが含まれ得る、その３’末端へのライゲーションによって、核酸に付加される。アダプターは、例えば、ユニバーサルプライマーおよびＤＮＡポリメラーゼを使用する第２鎖合成のためのプライミング部位として使用され得る。次いで、第２のアダプターは、今度は二本鎖分子の第２鎖の少なくとも３’末端にライゲーションされ得る。一部の実施形態では、第１のアダプターは、親和性タグ、例えば、ビオチンを含み、第１のアダプターにライゲーションされた核酸は、親和性タグに対する結合パートナー、例えば、ストレプトアビジンを含み得る固体支持体（例えば、ビーズ）に結合される。かかる手順のさらなる議論については、Gansauge et al., Nature Protocols 8:737-748 (2013)を参照されたい。一本鎖核酸と適合性のライブラリー調製物を配列決定するための市販のキット、例えば、ＳｗｉｆｔＢｉｏｓｃｉｅｎｃｅｓのＡｃｃｅｌ－ＮＧＳ（登録商標）Ｍｅｔｈｙｌ－ＳｅｑＤＮＡＬｉｂｒａｒｙＫｉｔが、入手可能である。一部の実施形態では、アダプターライゲーションの後、核酸は増幅される。一部の実施形態では、アダプターライゲーションの後、部分試料の核酸はプールされ；使用される場合には、増幅が、プールするステップの前または後に実施され得る。

一部の方法では、異なる程度までの改変（例えば、核酸分子１つ当たり０、１、２、３、４、５つまたはそれよりも多くのメチル基）を保有する核酸の集団は、改変の程度に依存して、集団の分画前にアダプターと接触させられる。アダプターは、集団中の核酸分子の一方の末端または両方の末端のいずれかに結合する。

好ましくは、アダプター（分配の前に添加されても後に添加されても）は、タグの組合せの数が低い確率を生じるのに十分な数の異なるタグを含み、例えば、同じ開始点および停止点を有する２つの核酸の９５、９９または９９．９％が、タグの同じ組合せを受ける。アダプターは、同じタグを保有していても異なるタグを保有していても、同じまたは異なるプライマー結合部位を含み得るが、好ましくは、アダプターは、同じプライマー結合部位を含む。

一部の実施形態では、アダプターの結合の後、核酸は、改変を保有する核酸に優先的に結合する薬剤（例えば、以前に記載されたかかる薬剤）と接触させられる。核酸は、核酸が薬剤への結合からの改変を保有する程度が異なる少なくとも２つの部分試料へと分配される。例えば、薬剤が、改変を保有する核酸に対して親和性を有する場合、（集団における中央値提示と比較して）改変が過剰提示される核酸は、薬剤に優先的に結合するが、改変が過少提示される核酸は、薬剤に結合しない、または薬剤からより容易に溶出される。次いで、核酸は、アダプター内のプライマー結合部位に結合するプライマーから増幅される。次いで、増幅の後、異なる分配は、さらなる（例えば、クローン性）増幅、および並行してはいるが別々の配列分析が典型的には含まれる、さらなる処理ステップに供され得る。次いで、異なる分配からの配列データが比較され得る。

別の実施形態では、分配スキームは、以下の例示的な手順を使用して実施され得る。核酸は、ＤＮＡ中の第２のヌクレオベースとは異なるようにＤＮＡ中の第１のヌクレオベースに影響を与える手順に供され、第１のヌクレオベースは、改変されたまたは未改変のヌクレオベースであり、第２のヌクレオベースは、第１のヌクレオベースとは異なる改変されたまたは未改変のヌクレオベースであり、第１のヌクレオベースと第２のヌクレオベースとは、同じ塩基対合特異性を有する。核酸は、プライマー結合部位およびタグを含むＹ型アダプターに、両方の末端において連結される。分子は増幅される。次いで、増幅された分子は、５－メチルシトシンに優先的に結合する抗体との接触によって分画されて、２つの分配を生産する。一方の分配は、メチル化を欠如する元の分子と、メチル化が喪失された増幅コピーとを含む。他方の分配は、メチル化を有する元のＤＮＡ分子を含む。次いで、２つの分配は、メチル化された分配のさらなる増幅を伴って、別々に処理および配列決定される。次いで、２つの分配の配列データが比較され得る。この例では、同じ開始点および停止点を有する読み取りが同じ分子に基づくか異なる分子に基づくかを決定することができるように、タグは、メチル化されたＤＮＡとメチル化されていないＤＮＡとの間を識別するためには使用されないが、これらの分配内の異なる分子間を識別するためには使用される。

本開示は、核酸の少なくとも一部が、１つまたは複数の改変されたシトシン残基、例えば、５－メチルシトシン、および以前に記載された他の改変のいずれかを含む、核酸の集団を分析するためのさらなる方法を提供する。これらの方法では、核酸分子は、ＤＮＡ中の第２のヌクレオベースとは異なるようにＤＮＡ中の第１のヌクレオベースに影響を与える手順に供され、第１のヌクレオベースは、５位において改変されたシトシンを含み、第２のヌクレオベースは、未改変のシトシンを含む。この手順は、バイサルファイト処理、または未改変のシトシンをウラシルに変換する別の手順であり得る。次いで、手順に供された核酸は分配され、次いで、核酸の部分試料は、５Ｃ位において改変された１つまたは複数のシトシン残基、例えば、５－メチルシトシンを含むアダプターと接触させられる。好ましくは、かかるアダプター中の全てのシトシン残基もまた改変され、またはアダプターのプライマー結合領域中の全てのかかるシトシンが改変される。アダプターは、集団中の核酸分子の両方の末端に結合する。好ましくは、アダプターは、タグの組合せの数が低い確率を生じるのに十分な数の異なるタグを含み、例えば、同じ開始点および停止点を有する２つの核酸の９５、９９または９９．９％が、タグの同じ組合せを受ける。かかるアダプター中のプライマー結合部位は、同じでも異なってもよいが、好ましくは同じである。アダプターの結合の後、核酸は、アダプターのプライマー結合部位に結合するプライマーから増幅される。増幅された核酸は、第１および第２のアリコートへと分割される。第１のアリコートは、さらなる処理ありまたはなしで、配列データについてアッセイされる。したがって、第１のアリコート中の分子に関する配列データは、核酸分子の初期のメチル化状態とは無関係に決定される。アダプターに元々連結された核酸分子のみが（その増幅産物とは別個のものとして）ここで増幅可能であるが、それは、これらの核酸は、アダプターのプライマー結合部位中にシトシンを保持するが、増幅産物は、これらのシトシン残基のメチル化を喪失し、バイサルファイト処理においてウラシルへの変換を受けているからである。したがって、その少なくとも一部がメチル化された、集団中の元の分子のみが、増幅を受ける。増幅後、これらの核酸は、配列分析に供される。第１および第２のアリコートから決定された配列の比較は、とりわけ、核酸集団中のどのシトシンがメチル化に供されたかを示し得る。

かかる分析は、以下の例示的な手順を使用して実施され得る。分配の後、メチル化されたＤＮＡは、プライマー結合部位およびタグを含むＹ型アダプターに、両方の末端において連結される。アダプターの結合の後、ＤＮＡ分子は増幅される。増幅産物は、変換ありまたはなしでの配列決定のために、２つのアリコートへと分割される。変換に供されていないアリコートは、さらなる処理ありまたはなしで、配列分析に供され得る。他方のアリコートは、ＤＮＡ中の第２のヌクレオベースとは異なるようにＤＮＡ中の第１のヌクレオベースに影響を与える手順に供され、第１のヌクレオベースは、５位において改変されたシトシンを含み、第２のヌクレオベースは、未改変のシトシンを含む。この手順は、バイサルファイト処理、または未改変のシトシンをウラシルに変換する別の手順であり得る。元のプライマー結合部位に特異的なプライマーと接触させられた場合、シトシンの改変によって保護されたプライマー結合部位のみが、増幅を支持し得る。したがって、第１の増幅からのコピーではなく元の分子のみが、さらなる増幅に供される。次いで、さらに増幅された分子は、配列分析に供される。次いで、２つのアリコートからの配列が比較され得る。上で議論した分離スキームと同様に、アダプター中の核酸タグは、メチル化されたＤＮＡとメチル化されていないＤＮＡとの間を識別するためには使用されないが、同じ分配内の核酸分子を識別するためには使用される。
Ｅ．富化／捕捉するステップ；増幅；アダプター；バーコード

一部の実施形態では、本明細書で開示される方法は、ＤＮＡ、例えば、ｃｆＤＮＡの標的領域の１つまたは複数のセットを捕捉するステップを含む。捕捉は、当該分野で公知の任意の適切なアプローチを使用して実施され得る。

一部の実施形態では、捕捉するステップは、捕捉されるＤＮＡを標的特異的プローブのセットと接触させるステップを含む。標的特異的プローブのセットは、上に示される実施形態および以下のプローブに関するセクション中が含まれるがこれらに限定されない、標的特異的プローブのセットについての本明細書に記載される特色のいずれかを有し得る。捕捉するステップは、本明細書で開示される方法の間に調製される１つまたは複数の部分試料に対して実施され得る。一部の実施形態では、ＤＮＡは、少なくとも第１の部分試料または第２の部分試料、例えば、少なくとも第１の部分試料および第２の部分試料から捕捉される。一部の実施形態では、部分試料は、差次的にタグ化され（例えば、本明細書に記載されるように）、次いで、捕捉を受ける前にプールされる。

捕捉するステップは、プローブの特色、例えば、長さ、塩基組成などにある程度まで一般に依存する、特異的核酸ハイブリダイゼーションに適切な条件を使用して、実施され得る。当業者は、核酸ハイブリダイゼーションに関する当該分野における一般的知識を考慮して、適切な条件に精通している。一部の実施形態では、標的特異的プローブとＤＮＡとの複合体が形成される。

一部の実施形態では、本明細書に記載される方法は、試験対象から得られたｃｆＤＮＡの標的領域の複数のセットを捕捉するステップを含む。標的領域は、それらが腫瘍に起源するか健康な細胞に起源するかに依存してメチル化レベルおよび／または断片化パターンにおける差異を示し得るエピジェネティック標的領域を含む。標的領域は、それらが腫瘍に起源するか健康な細胞に起源するかに依存して配列における差異を示し得る配列可変標的領域もまた含む。捕捉するステップは、ｃｆＤＮＡ分子の捕捉されたセットを生成し、配列可変標的領域セットに対応するｃｆＤＮＡ分子は、エピジェネティック標的領域セットに対応するｃｆＤＮＡ分子よりも、ｃｆＤＮＡ分子の捕捉されたセットにおいてより高い捕捉収量で捕捉される。捕捉するステップ、捕捉収量および関連の態様の追加の議論については、全ての目的のためにこれにより参照により本明細書に組み込まれるＷＯ２０２０／１６０４１４を参照されたい。

一部の実施形態では、本明細書に記載される方法は、試験対象から得られたｃｆＤＮＡを、標的特異的プローブのセットと接触させるステップを含み、標的特異的プローブのセットは、エピジェネティック標的領域セットに対応するｃｆＤＮＡよりも高い捕捉収量で配列可変標的領域セットに対応するｃｆＤＮＡを捕捉するように構成される。

エピジェネティック標的領域を分析する場合に必要であり得るものよりも深い配列決定の深度が、十分な信頼度または精度で配列可変標的領域を分析するために必要であり得るので、エピジェネティック標的領域セットに対応するｃｆＤＮＡよりも高い捕捉収量で配列可変標的領域セットに対応するｃｆＤＮＡを捕捉することは、有益であり得る。断片化パターン（例えば、転写開始部位またはＣＴＣＦ結合部位の乱れについて試験するため）または断片存在量（例えば、高メチル化された分配および低メチル化された分配中の）を決定するために必要なデータのボリュームは、がん関連の配列突然変異の存在または非存在を決定するために必要なデータのボリュームよりも、一般に小さい。異なる収量で標的領域セットを捕捉することは、同じ配列決定ラン（例えば、プールされた混合物を使用する、および／または同じ配列決定セルにおける）における配列決定の異なる深度まで標的領域を配列決定することを容易にし得る。

種々の実施形態では、これらの方法は、本明細書の議論と一致して、例えば、エピジェネティック標的領域セットおよび配列可変標的領域セットについての配列決定深度の異なる程度まで、捕捉されたｃｆＤＮＡを配列決定するステップをさらに含む。

一部の実施形態では、標的特異的プローブとＤＮＡとの複合体は、標的特異的プローブに結合していないＤＮＡから分離される。例えば、標的特異的プローブが、固体支持体に共有結合的または非共有結合的に結合している場合、洗浄または吸引ステップが、未結合の材料を分離するために使用され得る。あるいは、複合体が、未結合の材料とは別個のクロマトグラフィー特性を有する場合（例えば、プローブが、クロマトグラフィー樹脂に結合するリガンドを含む場合）、クロマトグラフィーが使用され得る。

本明細書の他の場所で詳細に議論されるように、標的特異的プローブのセットは、複数のセット、例えば、配列可変標的領域セットに対するプローブおよびエピジェネティック標的領域セットに対するプローブを含み得る。一部のかかる実施形態では、捕捉するステップは、配列可変標的領域セットに対するプローブおよびエピジェネティック標的領域セットに対するプローブを用いて、同じ容器中で同時に実施される、例えば、配列可変標的領域セットに対するプローブおよびエピジェネティック標的領域セットに対するプローブは、同じ組成物中にある。このアプローチは、比較的能率化されたワークフローを提供する。一部の実施形態では、配列可変標的領域セットに対するプローブの濃度は、エピジェネティック標的領域セットに対するプローブの濃度よりも高い。

あるいは、捕捉するステップは、第１の容器中で配列可変標的領域プローブセットを用いて、第２の容器中でエピジェネティック標的領域プローブセットを用いて実施され、または接触させるステップは、第１の時点および第１の容器において、配列可変標的領域プローブセットを用いて実施され、第１の時点の前または後の第２の時点において、エピジェネティック標的領域プローブセットを用いて実施される。このアプローチは、配列可変標的領域セットに対応する捕捉されたＤＮＡおよびエピジェネティック標的領域セットに対応する捕捉されたＤＮＡを含む別々の第１および第２の組成物の調製を可能にする。これらの組成物は、所望により別々に処理され得（例えば、本明細書の他の箇所に記載されるように、メチル化に基づいて分画するために）、さらなる処理および分析、例えば、配列決定のための材料を提供するために、適切な割合で再度組み合わされ得る。

一部の実施形態では、ＤＮＡが増幅される。一部の実施形態では、増幅は、捕捉するステップの前に実施される。一部の実施形態では、増幅は、捕捉するステップの後に実施される。

一部の実施形態では、アダプターは、ＤＮＡ中に含まれる。これは、例えば、上記のように、例えば、プライマーの５’部分中にアダプターを提供することによって、増幅手順と並列で実施され得る。あるいは、アダプターは、他のアプローチ、例えば、ライゲーションによって付加され得る。

一部の実施形態では、バーコードであり得るまたはバーコードを含み得るタグは、ＤＮＡ中に含まれる。タグは、核酸の起源の同定を容易にし得る。例えば、バーコードは、並列配列決定のために複数の試料をプールした後に、ＤＮＡが由来した起源（例えば、対象）が同定されるのを可能にするために使用され得る。これは、例えば、上記のように、例えば、プライマーの５’部分中にバーコードを提供することによって、増幅手順と並列で実施され得る。一部の実施形態では、アダプターおよびタグ／バーコードは、同じプライマーまたはプライマーセットによって提供される。例えば、バーコードは、アダプターの３’側およびプライマーの標的ハイブリダイズ部分の５’側に位置し得る。あるいは、バーコードは、他のアプローチ、例えば、必要に応じて、同じライゲーション基質中のアダプターと一緒の、ライゲーションによって付加され得る。

上述の実施形態ならびに導入および概要のセクションにおいて示される実施形態のいずれかを用いて実施可能な程度まで組み合わされ得る、増幅、タグおよびバーコードに関する追加の詳細は、以下の「方法の一般的特色」のセクションで議論される。
Ｆ．捕捉されたセット

一部の実施形態では、ＤＮＡ（例えば、ｃｆＤＮＡ）の捕捉されたセットが提供される。開示された方法に関して、ＤＮＡの捕捉されたセットは、例えば、本明細書に記載されるように、分配するステップの後に捕捉するステップを実施することによって、提供され得る。捕捉されたセットは、配列可変標的領域セット、エピジェネティック標的領域セット、またはそれらの組合せに対応するＤＮＡを含み得る。一部の実施形態では、捕捉された配列可変標的領域ＤＮＡの量は、標的化された領域のサイズ（フットプリントサイズ）における差異に関して標準化される場合、捕捉されたエピジェネティック標的領域ＤＮＡの量よりも多い。

一部の実施形態では、第１の標的領域セットは、少なくともエピジェネティック標的領域を含む第１の部分試料から捕捉される。第１の部分試料から捕捉されたエピジェネティック標的領域は、高メチル化可変標的領域を含み得る。一部の実施形態では、高メチル化可変標的領域は、健康な対象由来のｃｆＤＮＡ中の、メチル化されていないまたは低いメチル化（例えば、バルクｃｆＤＮＡと比較して平均を下回るメチル化）を有する、ＣｐＧ含有領域である。一部の実施形態では、高メチル化可変標的領域は、少なくとも１つの他の組織型中よりも低いメチル化を示す、健康なｃｆＤＮＡ中の領域である。いずれの特定の理論によっても束縛されることを望まないが、がん細胞は、同じ組織型の健康な細胞よりも多くのＤＮＡを、血流中に脱落させ得る。したがって、ｃｆＤＮＡの起源である組織の分布は、癌発生の際に変化し得る。したがって、第１の部分試料中の高メチル化可変標的領域のレベルにおける増加は、がんの存在（または対象の病歴に依存して、再発）の指標であり得る。

一部の実施形態では、第２の標的領域セットは、少なくともエピジェネティック標的領域を含む第２の部分試料から捕捉される。エピジェネティック標的領域は、低メチル化可変標的領域を含み得る。一部の実施形態では、低メチル化可変標的領域は、健康な対象由来のｃｆＤＮＡ中の、メチル化されたまたは高いメチル化（例えば、バルクｃｆＤＮＡと比較して平均を上回るメチル化）を有する、ＣｐＧ含有領域である。一部の実施形態では、低メチル化可変標的領域は、少なくとも１つの他の組織型中よりも高いメチル化を示す、健康なｃｆＤＮＡ中の領域である。いずれの特定の理論によっても束縛されることを望まないが、がん細胞は、同じ組織型の健康な細胞よりも多くのＤＮＡを、血流中に脱落させ得る。したがって、ｃｆＤＮＡの起源である組織の分布は、癌発生の際に変化し得る。したがって、第２の部分試料中の低メチル化可変標的領域のレベルにおける増加は、がんの存在（または対象の病歴に依存して、再発）の指標であり得る。

あるいは、配列可変標的領域セットに対応するＤＮＡおよびエピジェネティック標的領域セットに対応するＤＮＡをそれぞれ含む、第１および第２の捕捉されたセットが提供され得る。第１および第２の捕捉されたセットは、組み合わされた捕捉されたセットを提供するために組み合わされ得る。

配列可変標的領域セットに対応するＤＮＡおよびエピジェネティック標的領域セットに対応するＤＮＡを含む捕捉されたセットが、上で議論した組み合わされた捕捉されたセットを含む一部の実施形態では、配列可変標的領域セットに対応するＤＮＡは、エピジェネティック標的領域セットに対応するＤＮＡよりも高い濃度、例えば、１．１倍～１．２倍高い濃度、１．２倍～１．４倍高い濃度、１．４倍～１．６倍高い濃度、１．６倍～１．８倍高い濃度、１．８倍～２．０倍高い濃度、２．０倍～２．２倍高い濃度、２．２倍～２．４倍高い濃度２．４倍～２．６倍高い濃度、２．６倍～２．８倍高い濃度、２．８倍～３．０倍高い濃度、３．０倍～３．５倍高い濃度、３．５倍～４．０、４．０倍～４．５倍高い濃度、４．５倍～５．０倍高い濃度、５．０倍～５．５倍高い濃度、５．５倍～６．０倍高い濃度、６．０倍～６．５倍高い濃度、６．５倍～７．０倍高い、７．０倍～７．５倍高い濃度、７．５倍～８．０倍高い濃度、８．０倍～８．５倍高い濃度、８．５倍～９．０倍高い濃度、９．０倍～９．５倍高い濃度、９．５倍～１０．０倍高い濃度、１０倍～１１倍高い濃度、１１倍～１２倍高い濃度１２倍～１３倍高い濃度、１３倍～１４倍高い濃度、１４倍～１５倍高い濃度、１５倍～１６倍高い濃度、１６倍～１７倍高い濃度、１７倍～１８倍高い濃度、１８倍～１９倍高い濃度、１９倍～２０倍高い濃度、２０倍～３０倍高い濃度、３０倍～４０倍高い濃度、４０倍～５０倍高い濃度、５０倍～６０倍高い濃度、６０倍～７０倍高い濃度、７０倍～８０倍高い濃度、８０倍～９０倍高い濃度または９０倍～１００倍高い濃度で存在し得る。濃度における差異の程度は、定義のセクションで議論されるように、標的領域のフットプリントサイズに関する標準化の主な原因である。
１．エピジェネティック標的領域セット

エピジェネティック標的領域セットは、新生物（例えば、腫瘍またはがん）細胞由来のＤＮＡと健康な細胞、例えば、非新生物性循環細胞由来のＤＮＡを差別化する可能性が高い１つまたは複数の型の標的領域を含み得る。かかる領域の例示的な型は、本明細書で詳細に議論される。エピジェネティック標的領域セットは、例えば、本明細書に記載されるように、１つまたは複数の対照領域もまた含み得る。

一部の実施形態では、エピジェネティック標的領域セットは、少なくとも１００ｋｂｐ、例えば、少なくとも２００ｋｂｐ、少なくとも３００ｋｂｐまたは少なくとも４００ｋｂｐのフットプリントを有する。一部の実施形態では、エピジェネティック標的領域セットは、１００～２０Ｍｂｐ、例えば、１００～２００ｋｂｐ、２００～３００ｋｂｐ、３００～４００ｋｂｐ、４００～５００ｋｂｐ、５００～６００ｋｂｐ、６００～７００ｋｂｐ、７００～８００ｋｂｐ、８００～９００ｋｂｐ、９００～１，０００ｋｂｐ、１～１．５Ｍｂｐ、１．５～２Ｍｂｐ、２～３Ｍｂｐ、３～４Ｍｂｐ、４～５Ｍｂｐ、５～６Ｍｂｐ、６～７Ｍｂｐ、７～８Ｍｂｐ、８～９Ｍｂｐ、９～１０Ｍｂｐまたは１０～２０Ｍｂｐの範囲のフットプリントを有する。一部の実施形態では、エピジェネティック標的領域セットは、少なくとも２０Ｍｂｐのフットプリントを有する。
ａ．高メチル化可変標的領域

一部の実施形態では、エピジェネティック標的領域セットは、１つまたは複数の高メチル化可変標的領域を含む。一般に、高メチル化可変標的領域は、例えば、ｃｆＤＮＡ試料中の観察されたメチル化のレベルにおける増加が、試料（例えば、ｃｆＤＮＡの）が新生物細胞、例えば、腫瘍またはがん細胞によって産生されたＤＮＡを含有する可能性の増加を示す、領域を指す。例えば、腫瘍サプレッサー遺伝子のプロモーターの高メチル化が、繰り返し観察されてきた。例えば、Kang et al., Genome Biol. 18:53 (2017)およびそこで引用された参考文献を参照されたい。別の例では、上で議論されるように、高メチル化可変標的領域には、同じ型の健康な組織由来のＤＮＡと比較して、がん性組織中のメチル化が必ずしも異ならないが、健康な対象において典型的なｃｆＤＮＡと比較して、メチル化が異なる（例えば、より多くのメチル化を有する）、領域が含まれ得る。例えば、がんの存在が、がんに対応する組織型の細胞の細胞死、例えば、アポトーシスの増加を生じる場合、かかるがんは、かかる高メチル化可変標的領域を少なくとも一部使用して、検出され得る。

結腸直腸がんにおけるメチル化可変標的領域の広範な議論は、Lam et al., Biochim Biophys Acta. 1866:106-20 (2016)に提供されている。これらには、ＶＩＭ、ＳＥＰＴ９、ＩＴＧＡ４、ＯＳＭ４、ＧＡＴＡ４およびＮＤＲＧ４が含まれる。結腸直腸がん（ＣＲＣ）研究に基づく高メチル化可変標的領域の例示的なセットは、表１に提供される。これらの遺伝子の多くは、結腸直腸がんを超えて、がんとの関連性を有する可能性が高い；例えば、ＴＰ５３は、決定的に重要な腫瘍サプレッサーとして広く認識され、この遺伝子の高メチル化ベースの不活性化は、共通の発癌機構であり得る。
表1. CRC研究に基づく例示的な高メチル化標的領域

一部の実施形態では、高メチル化可変標的領域は、表１に列挙された複数の遺伝子座、例えば、表１に列挙された遺伝子座の少なくとも１０％、２０％、３０％、４０％、５０％、６０％、７０％、８０％、９０％または１００％を含む。例えば、標的領域として含まれる各遺伝子座について、遺伝子の転写開始部位と停止コドン（選択的スプライシングされる遺伝子については、最後の停止コドン）との間、または遺伝子のプロモーター領域中に結合するハイブリダイゼーション部位を有する１つまたは複数のプローブが存在し得る。一部の実施形態では、１つまたは複数のプローブは、表１中の遺伝子の転写開始部位の３００ｂｐ以内、例えば、２００または１００ｂｐ以内に結合する。

種々の型の肺がんにおけるメチル化可変標的領域は、例えば、Ooki et al., Clin. Cancer Res. 23:7141-52 (2017)；Belinksy, Annu. Rev. Physiol. 77:453-74 (2015)；Hulbert et al., Clin. Cancer Res. 23:1998-2005 (2017)；Shi et al., BMC Genomics 18:901 (2017)；Schneider et al., BMC Cancer. 11:102 (2011)；Lissa et al., Transl Lung Cancer Res 5(5):492-504 (2016)；Skvortsova et al., Br. J. Cancer. 94(10):1492-1495 (2006)；Kim et al., Cancer Res. 61:3419-3424 (2001)；Furonaka et al., Pathology International 55:303-309 (2005)；Gomes et al., Rev. Port. Pneumol. 20:20-30 (2014)；Kim et al., Oncogene. 20:1765-70 (2001)；Hopkins-Donaldson et al., Cell Death Differ. 10:356-64 (2003)；Kikuchi et al., Clin. Cancer Res. 11:2954-61 (2005)；Heller et al., Oncogene 25:959-968 (2006)；Licchesi et al., Carcinogenesis. 29:895-904 (2008)；Guo et al., Clin. Cancer Res. 10:7917-24 (2004)；Palmisano et al., Cancer Res. 63:4620-4625 (2003)；およびToyooka et al., Cancer Res. 61:4556-4560, (2001)において詳細に議論される。

肺がん研究に基づく高メチル化可変標的領域の例示的なセットは、表２に提供される。これらの遺伝子の多くは、肺がんを超えて、がんとの関連性を有する可能性が高い；例えば、Ｃａｓｐ８（カスパーゼ８）は、プログラム細胞死における重要な酵素であり、この遺伝子の高メチル化ベースの不活性化は、肺がんに限定されない共通の発癌機構であり得る。さらに、いくつかの遺伝子は、表１および２の両方に出現し、普遍性を示す。
表2. 肺がん研究に基づく例示的な高メチル化標的領域

表２で同定された標的領域に関する上述の実施形態のいずれかは、表１で同定された標的領域に関する上記実施形態のいずれかと組み合わされ得る。一部の実施形態では、高メチル化可変標的領域は、表１または表２に列挙された複数の遺伝子座、例えば、表１または表２に列挙された遺伝子座の少なくとも１０％、２０％、３０％、４０％、５０％、６０％、７０％、８０％、９０％または１００％を含む。

追加の高メチル化標的領域は、例えば、ＣａｎｃｅｒＧｅｎｏｍｅＡｔｌａｓから得られ得る。Kang et al., Genome Biology 18:53 (2017)は、乳房、結腸、腎臓、肝臓および肺由来の高メチル化標的領域を使用する、ＣａｎｃｅｒＬｏｃａｔｏｒと呼ばれる確率的方法の構築を記載している。一部の実施形態では、高メチル化標的領域は、１つまたは複数の型のがんに特異的であり得る。したがって、一部の実施形態では、高メチル化標的領域は、乳房、結腸、腎臓、肝臓および肺がんのうち１、２、３、４または５つにおいて高メチル化を集合的に示す高メチル化標的領域の１、２、３、４または５つのサブセットを含む。

一部の実施形態では、異なるエピジェネティック標的領域が第１および第２の部分試料から捕捉される場合、第１の部分試料から捕捉されたエピジェネティック標的領域は、高メチル化可変標的領域を含む。
ｂ．低メチル化可変標的領域

グローバル低メチル化は、種々のがんにおいて一般に観察される現象である。例えば、Hon et al., Genome Res. 22:246-258 (2012)（乳房がん）；Ehrlich, Epigenomics 1:239-259 (2009)（結腸、卵巣、前立腺、白血病、肝細胞および子宮頸がんにおける低メチル化の観察に注目した総説論文）を参照されたい。例えば、領域、例えば、反復エレメント、例えば、ＬＩＮＥ１エレメント、Ａｌｕエレメント、セントロメアタンデムリピート、動原体周囲タンデムリピートおよびサテライトＤＮＡ、ならびに健康な細胞では通常メチル化されている遺伝子間領域は、腫瘍細胞において低減されたメチル化を示し得る。したがって、一部の実施形態では、エピジェネティック標的領域セットは、低メチル化可変標的領域を含み、このとき、観察されたメチル化のレベルにおける減少は、試料（例えば、ｃｆＤＮＡの）が新生物細胞、例えば、腫瘍またはがん細胞によって産生されたＤＮＡを含有する可能性の増加を示す。別の例では、上で議論されるように、低メチル化可変標的領域には、同じ型の健康な組織由来のＤＮＡと比較して、がん性組織中のメチル化が必ずしも異ならないが、健康な対象において典型的なｃｆＤＮＡと比較して、メチル化が異なる（例えば、あまりメチル化されていない）、領域が含まれ得る。例えば、がんの存在が、がんに対応する組織型の細胞の細胞死、例えば、アポトーシスの増加を生じる場合、かかるがんは、かかる低メチル化可変標的領域を少なくとも一部使用して、検出され得る。

一部の実施形態では、低メチル化可変標的領域には、反復エレメントおよび／または遺伝子間領域が含まれる。一部の実施形態では、反復エレメントは、ＬＩＮＥ１エレメント、Ａｌｕエレメント、セントロメアタンデムリピート、動原体周囲タンデムリピートおよび／またはサテライトＤＮＡのうち１、２、３、４または５つを含む。

がん関連の低メチル化を示す例示的な特定のゲノム領域には、ヒト第１染色体のヌクレオチド８４０３５６５～８９５３７０８および１５１１０４７０１～１５１１０６０３５が含まれる。一部の実施形態では、低メチル化可変標的領域は、これらの領域のうち一方または両方と重複するまたはそれを含む。

一部の実施形態では、異なるエピジェネティック標的領域が第１および第２の部分試料から捕捉される場合、第２の部分試料から捕捉されたエピジェネティック標的領域は、低メチル化可変標的領域を含む。一部の実施形態では、第２の部分試料から捕捉されたエピジェネティック標的領域は、低メチル化可変標的領域を含み、第１の部分試料から捕捉されたエピジェネティック標的領域は、高メチル化可変標的領域を含む。
ｃ．ＣＴＣＦ結合領域

ＣＴＣＦは、クロマチン組織化に寄与し、コヒーシンと共に共局在化する場合が多い、ＤＮＡ結合タンパク質である。ＣＴＣＦ結合部位の乱れは、種々の異なるがんにおいて報告されている。例えば、Katainen et al., Nature Genetics, doi:10.1038/ng.3335、２０１５年６月８日にオンライン公開；Guo et al., Nat. Commun. 9:1520 (2018)を参照されたい。ＣＴＣＦ結合は、例えば、断片長分析を介して配列決定によって検出され得る認識可能なパターンを、ｃｆＤＮＡ中に生じる。配列決定ベースの断片長分析に関する詳細は、Snyder et al., Cell 164:57-68 (2016)；ＷＯ２０１８／００９７２３；およびＵＳ２０１７０２１１１４３Ａ１に提供され、これらは各々、これにより参照により本明細書に組み込まれる。

このように、ＣＴＣＦ結合の乱れは、ｃｆＤＮＡの断片化パターンにおけるバリエーションを生じる。したがって、ＣＴＣＦ結合部位は、断片化可変標的領域の１つの型である。

多くの公知のＣＴＣＦ結合部位が存在する。例えば、ｉｎｓｕｌａｔｏｒｄｂ．ｕｔｈｓｃ．ｅｄｕ／においてインターネット上で入手可能なＣＴＣＦＢＳＤＢ（ＣＴＣＦＢｉｎｄｉｎｇＳｉｔｅＤａｔａｂａｓｅ）；Cuddapah et al., Genome Res. 19:24-32 (2009)；Martin et al., Nat. Struct. Mol. Biol. 18:708-14 (2011)；Rhee et al., Cell. 147:1408-19 (2011)を参照されたい。これらは各々、参照により組み込まれる。例示的なＣＴＣＦ結合部位は、第８染色体上のヌクレオチド５６０１４９５５～５６０１６１６１および第１３染色体上のヌクレオチド９５３５９１６９～９５３６０４７３に存在する。

したがって、一部の実施形態では、エピジェネティック標的領域セットは、ＣＴＣＦ結合領域を含む。一部の実施形態では、ＣＴＣＦ結合領域は、少なくとも１０、２０、５０、１００、２００もしくは５００個のＣＴＣＦ結合領域、または１０～２０、２０～５０、５０～１００、１００～２００、２００～５００もしくは５００～１０００個のＣＴＣＦ結合領域、例えば、上記の、あるいは上で引用したＣＴＣＦＢＳＤＢまたはCuddapah et al.、Martin et al.もしくはRhee et al.の論文のうち１つまたは複数に記載されるＣＴＣＦ結合領域などを含む。

一部の実施形態では、ＣＴＣＦ部位の少なくとも一部は、メチル化されていることまたはメチル化されていないことができ、メチル化状態は、細胞ががん細胞であるかどうかと相関する。一部の実施形態では、エピジェネティック標的領域セットは、ＣＴＣＦ結合部位の少なくとも１００ｂｐ、少なくとも２００ｂｐ、少なくとも３００ｂｐ、少なくとも４００ｂｐ、少なくとも５００ｂｐ、少なくとも７５０ｂｐ、少なくとも１０００ｂｐ上流および下流の領域を含む。
ｄ．転写開始部位

転写開始部位もまた、新生物細胞において乱れを示し得る。例えば、造血系統は、健康な個体におけるｃｆＤＮＡに実質的に寄与するが、その健康な細胞における種々の転写開始部位におけるヌクレオソーム組織化は、新生物細胞におけるその転写開始部位におけるヌクレオソーム組織化とは異なり得る。これは、Snyder et al., Cell 164:57-68 (2016)；ＷＯ２０１８／００９７２３；およびＵＳ２０１７０２１１１４３Ａ１で一般に議論されるように、配列決定によって検出され得る異なるｃｆＤＮＡパターンを生じる。別の例では、転写開始部位は、同じ型の健康な組織由来のＤＮＡと比較して、がん性組織において必ずしもエピジェネティックに異ならなくてもよいが、健康な対象において典型的なｃｆＤＮＡと比較して、エピジェネティックに異なる（例えば、ヌクレオソーム組織化に関して）。例えば、がんの存在が、がんに対応する組織型の細胞の細胞死、例えば、アポトーシスの増加を生じる場合、かかるがんは、転写開始部位におけるかかる差異を少なくとも一部使用して、検出され得る。

したがって、転写開始部位の乱れもまた、ｃｆＤＮＡの断片化パターンにおけるバリエーションを生じる。したがって、転写開始部位もまた、断片化可変標的領域の１つの型である。

ヒト転写開始部位は、ｄｂｔｓｓ．ｈｇｃ．ｊｐにおいてインターネット上で入手可能であり、これにより参照により本明細書に組み込まれるYamashita et al., Nucleic Acids Res. 34(Database issue): D86-D89 (2006)に記載されるＤＢＴＳＳ（ＤａｔａＢａｓｅｏｆＨｕｍａｎＴｒａｎｓｃｒｉｐｔｉｏｎＳｔａｒｔＳｉｔｅｓ）から入手可能である。

したがって、一部の実施形態では、エピジェネティック標的領域セットは、転写開始部位を含む。一部の実施形態では、転写開始部位は、少なくとも１０、２０、５０、１００、２００もしくは５００個の転写開始部位、または１０～２０、２０～５０、５０～１００、１００～２００、２００～５００もしくは５００～１０００個の転写開始部位、例えば、ＤＢＴＳＳに列挙された転写開始部位などを含む。一部の実施形態では、転写開始部位の少なくとも一部は、メチル化されていることまたはメチル化されていないことができ、メチル化状態は、細胞ががん細胞であるかどうかと相関する。一部の実施形態では、エピジェネティック標的領域セットは、転写開始部位の少なくとも１００ｂｐ、少なくとも２００ｂｐ、少なくとも３００ｂｐ、少なくとも４００ｂｐ、少なくとも５００ｂｐ、少なくとも７５０ｂｐ、少なくとも１０００ｂｐ上流および下流の領域を含む。
ｅ．限局的増幅

限局的増幅は、体細胞突然変異であるが、これらは、ある特定のエピジェネティック変化、例えば、メチル化における変化を検出するためのアプローチと類似の様式で、読み取り頻度に基づいて配列決定することによって検出され得る。したがって、がんにおいて限局的増幅を示し得る領域は、エピジェネティック標的領域セット中に含まれ得、ＡＲ、ＢＲＡＦ、ＣＣＮＤ１、ＣＣＮＤ２、ＣＣＮＥ１、ＣＤＫ４、ＣＤＫ６、ＥＧＦＲ、ＥＲＢＢ２、ＦＧＦＲ１、ＦＧＦＲ２、ＫＩＴ、ＫＲＡＳ、ＭＥＴ、ＭＹＣ、ＰＤＧＦＲＡ、ＰＩＫ３ＣＡおよびＲＡＦ１のうち１つまたは複数を含み得る。例えば、一部の実施形態では、エピジェネティック標的領域セットは、上述の標的のうち少なくとも２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７または１８個を含む。
ｆ．メチル化対照領域

データ検証を容易にするために、対照領域を含むことが有用であり得る。一部の実施形態では、エピジェネティック標的領域セットは、ＤＮＡががん細胞に由来するか正常細胞に由来するかにかかわらず、本質的に全ての試料においてメチル化されているまたはメチル化されていないと予想される対照領域を含む。一部の実施形態では、エピジェネティック標的領域セットは、本質的に全ての試料において低メチル化されていると予想される、低メチル化された対照領域を含む。一部の実施形態では、エピジェネティック標的領域セットは、本質的に全ての試料において高メチル化されていると予想される、高メチル化された対照領域を含む。
２．配列可変標的領域セット

一部の実施形態では、配列可変標的領域セットは、がんにおいて体細胞突然変異を受けることが公知の複数の領域を含む。

一部の態様では、配列可変標的領域セットは、がんを有する対象の決定された割合が、パネル中の１つまたは複数の異なる遺伝子またはゲノム領域において遺伝的バリアントまたは腫瘍マーカーを示すように選択された、複数の異なる遺伝子またはゲノム領域（「パネル」）を標的化する。パネルは、固定数の塩基対まで配列決定するために領域を限定するために選択され得る。パネルは、例えば、本明細書の他の場所に記載されるように、プローブの親和性および／または量を調整することによって、所望の量のＤＮＡを配列決定するために選択され得る。パネルは、所望の配列読み取り深度を達成するためにさらに選択され得る。パネルは、ある量の配列決定される塩基対について、所望の配列読み取り深度または配列読み取りカバレッジを達成するために選択され得る。パネルは、試料中の１つまたは複数の遺伝的バリアントを検出するための理論的感度、理論的特異性および／または理論的精度を達成するために選択され得る。

領域のパネルを検出するためのプローブは、目的のゲノム領域（ホットスポット領域）を検出するためのプローブならびにヌクレオソーム認識プローブ（例えば、ＫＲＡＳコドン１２および１３）を含み得、ヌクレオソーム結合パターンおよびＧＣ配列組成によって影響されるｃｆＤＮＡカバレッジおよび断片サイズバリエーションの分析に基づいて捕捉を最適化するように設計され得る。本明細書で使用される領域は、ヌクレオソーム位置およびＧＣモデルに基づいて最適化された、非ホットスポット領域もまた含み得る。

目的のゲノム位置の列挙の例は、表３および表４で見出され得る。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表３の遺伝子のうち少なくとも５、少なくとも１０、少なくとも１５、少なくとも２０、少なくとも２５、少なくとも３０、少なくとも３５、少なくとも４０、少なくとも４５、少なくとも５０、少なくとも５５、少なくとも６０、少なくとも６５または７０個の少なくとも一部分を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表３のＳＮＶのうち少なくとも５、少なくとも１０、少なくとも１５、少なくとも２０、少なくとも２５、少なくとも３０、少なくとも３５、少なくとも４０、少なくとも４５、少なくとも５０、少なくとも５５、少なくとも６０、少なくとも６５または７０個を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表３の融合のうち少なくとも１、少なくとも２、少なくとも３、少なくとも４、少なくとも５または６個を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表３のインデルのうち少なくとも１、少なくとも２または３個の少なくとも一部分を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表４の遺伝子のうち少なくとも５、少なくとも１０、少なくとも１５、少なくとも２０、少なくとも２５、少なくとも３０、少なくとも３５、少なくとも４０、少なくとも４５、少なくとも５０、少なくとも５５、少なくとも６０、少なくとも６５、少なくとも７０または７３個の少なくとも一部分を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表４のＳＮＶのうち少なくとも５、少なくとも１０、少なくとも１５、少なくとも２０、少なくとも２５、少なくとも３０、少なくとも３５、少なくとも４０、少なくとも４５、少なくとも５０、少なくとも５５、少なくとも６０、少なくとも６５、少なくとも７０または７３個を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表４の融合のうち少なくとも１、少なくとも２、少なくとも３、少なくとも４、少なくとも５または６個を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表４のインデルのうち少なくとも１、少なくとも２、少なくとも３、少なくとも４、少なくとも５、少なくとも６、少なくとも７、少なくとも８、少なくとも９、少なくとも１０、少なくとも１１、少なくとも１２、少なくとも１３、少なくとも１４、少なくとも１５、少なくとも１６、少なくとも１７または１８個の少なくとも一部分を含む。目的のこれらのゲノム位置の各々は、所与のパネルについて、骨格領域またはホットスポット領域として同定され得る。目的のホットスポットゲノム位置の列挙の例は、表５で見出され得る。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表５の遺伝子のうち少なくとも１、少なくとも２、少なくとも３、少なくとも４、少なくとも５、少なくとも６、少なくとも７、少なくとも８、少なくとも９、少なくとも１０、少なくとも１１、少なくとも１２、少なくとも１３、少なくとも１４、少なくとも１５、少なくとも１６、少なくとも１７、少なくとも１８、少なくとも１９または少なくとも２０個の少なくとも一部分を含む。各ホットスポットゲノム領域は、関連する遺伝子、それが存在する染色体、遺伝子座を示すゲノムの開始位置および停止位置、塩基対での遺伝子座の長さ、遺伝子によってカバーされるエクソン、ならびに目的の所与のゲノム領域が捕捉しようとし得る重要な特色（例えば、突然変異の型）が含まれる、いくつかの特徴と共に列挙される。
表3
表4
表5

さらにまたはあるいは、適切な標的領域セットは、文献から入手可能である。例えば、これにより参照により本明細書に組み込まれるGale et al., PLoS One 13: e0194630 (2018)は、配列可変標的領域セットの一部または全てとして使用され得る、３５個のがん関連遺伝子標的のパネルを記載している。これら３５個の標的は、ＡＫＴ１、ＡＬＫ、ＢＲＡＦ、ＣＣＮＤ１、ＣＤＫ２Ａ、ＣＴＮＮＢ１、ＥＧＦＲ、ＥＲＢＢ２、ＥＳＲ１、ＦＧＦＲ１、ＦＧＦＲ２、ＦＧＦＲ３、ＦＯＸＬ２、ＧＡＴＡ３、ＧＮＡ１１、ＧＮＡＱ、ＧＮＡＳ、ＨＲＡＳ、ＩＤＨ１、ＩＤＨ２、ＫＩＴ、ＫＲＡＳ、ＭＥＤ１２、ＭＥＴ、ＭＹＣ、ＮＦＥ２Ｌ２、ＮＲＡＳ、ＰＤＧＦＲＡ、ＰＩＫ３ＣＡ、ＰＰＰ２Ｒ１Ａ、ＰＴＥＮ、ＲＥＴ、ＳＴＫ１１、ＴＰ５３およびＵ２ＡＦ１である。

一部の実施形態では、配列可変標的領域セットは、少なくとも１０、２０、３０または３５個のがん関連遺伝子、例えば、上で列挙されたがん関連遺伝子由来の標的領域を含む。

一部の実施形態では、配列可変標的領域セットは、少なくとも５０ｋｂｐ、例えば、少なくとも１００ｋｂｐ、少なくとも２００ｋｂｐ、少なくとも３００ｋｂｐまたは少なくとも４００ｋｂｐのフットプリントを有する。一部の実施形態では、配列可変標的領域セットは、１００～２０００ｋｂｐ、例えば、１００～２００ｋｂｐ、２００～３００ｋｂｐ、３００～４００ｋｂｐ、４００～５００ｋｂｐ、５００～６００ｋｂｐ、６００～７００ｋｂｐ、７００～８００ｋｂｐ、８００～９００ｋｂｐ、９００～１，０００ｋｂｐ、１～１．５Ｍｂｐまたは１．５～２Ｍｂｐの範囲のフットプリントを有する。一部の実施形態では、配列可変標的領域セットは、少なくとも２Ｍｂｐのフットプリントを有する。
Ｇ．対象

一部の実施形態では、ＤＮＡ（例えば、ｃｆＤＮＡ）は、がんを有する対象から得られる。一部の実施形態では、ＤＮＡ（例えば、ｃｆＤＮＡ）は、がんを有すると疑われる対象から得られる。一部の実施形態では、ＤＮＡ（例えば、ｃｆＤＮＡ）は、腫瘍を有する対象から得られる。一部の実施形態では、ＤＮＡ（例えば、ｃｆＤＮＡ）は、腫瘍を有すると疑われる対象から得られる。一部の実施形態では、ＤＮＡ（例えば、ｃｆＤＮＡ）は、新生物を有する対象から得られる。一部の実施形態では、ＤＮＡ（例えば、ｃｆＤＮＡ）は、新生物を有すると疑われる対象から得られる。一部の実施形態では、ＤＮＡ（例えば、ｃｆＤＮＡ）は、（例えば、化学療法、外科的切除、放射線、またはそれらの組合せ後に）腫瘍、がんまたは新生物からの緩解状態にある対象から得られる。上述の実施形態のいずれかでは、がん、腫瘍もしくは新生物または疑われるがん、腫瘍もしくは新生物は、肺、結腸、直腸、腎臓、乳房、前立腺または肝臓のものであり得る。一部の実施形態では、がん、腫瘍もしくは新生物または疑われるがん、腫瘍もしくは新生物は、肺のものである。一部の実施形態では、がん、腫瘍もしくは新生物または疑われるがん、腫瘍もしくは新生物は、結腸または直腸のものである。一部の実施形態では、がん、腫瘍もしくは新生物または疑われるがん、腫瘍もしくは新生物は、乳房のものである。一部の実施形態では、がん、腫瘍もしくは新生物または疑われるがん、腫瘍もしくは新生物は、前立腺のものである。上述の実施形態のいずれかでは、対象は、ヒト対象であり得る。
Ｈ．第１および第２の部分試料またはそれらの部分由来のＤＮＡをプールする

一部の実施形態では、これらの方法は、第２の部分試料（低メチル化された分配とも呼ばれる）のＤＮＡの少なくとも一部分および第１の部分試料（高メチル化された分配とも呼ばれる）のＤＮＡの少なくとも一部分を含むプールを調製するステップを含む。例えば、エピジェネティック標的領域および／または配列可変標的領域が含まれる標的領域は、プールから捕捉され得る。本明細書の他の場所に記載される部分試料の少なくとも一部分から標的領域セットを捕捉するステップは、第１および第２の部分試料由来のＤＮＡを含むプールに対して実施される捕捉ステップを包含する。プール中のＤＮＡを増幅するステップは、プールから標的領域を捕捉するステップの前に実施され得る。捕捉するステップは、本明細書の他の場所の、捕捉するステップについて記載された特色のいずれかを有し得る。

一部の実施形態では、配列可変標的領域は、第２の部分試料の第２の部分から捕捉される。第２の部分試料の第２の部分は、プール中に含まれなかった第２の部分試料のＤＮＡの一部、大部分、実質的に全てまたは全てを含み得る。プールから捕捉された領域と第２の部分試料から捕捉された領域とは、組み合わされ得、並行して分析され得る。

エピジェネティック標的領域は、本明細書の他の場所で議論されるように、それらが腫瘍に起源するか健康な細胞に起源するか、またはそれらが起源する組織の型が何かに依存して、メチル化レベルおよび／または断片化パターンにおける差異を示し得る。配列可変標的領域は、それらが腫瘍に起源するか健康な細胞に起源するかに依存して、配列における差異を示し得る。

低メチル化された分配からのエピジェネティック標的領域の分析は、一部の適用では、高メチル化された分配および低メチル化された分配からの配列可変標的領域ならびに高メチル化された分配からのエピジェネティック標的領域の分析よりも、情報量が少ない場合がある。したがって、配列可変標的領域およびエピジェネティック標的領域が捕捉されている方法では、後者は、高メチル化された分配および低メチル化された分配からの配列可変標的領域ならびに高メチル化された分配からのエピジェネティック標的領域のうち１つまたは複数よりも、低い程度まで捕捉され得る。例えば、配列可変標的領域は、高メチル化された分配と共にプールされていない低メチル化された分配の部分から捕捉され得、高メチル化された分配からのＤＮＡの一部（例えば、大部分、実質的に全てまたは全て）を有し、低メチル化された分配からのＤＮＡを有さないまたはその一部（例えば、少数）を有するプールが、調製され得る。かかるアプローチは、低メチル化された分配からのエピジェネティック標的領域の配列決定を低減または排除し、それによって、さらなる分析のために十分な配列決定データの量を低減させることができる。

一部の実施形態では、プール中に低メチル化された分配のＤＮＡの少数を含むことは、例えば、相対基準での、１つまたは複数のエピジェネティック特色（例えば、本明細書の他の場所で詳細に議論されるメチル化または他のエピジェネティック特色）の定量化を容易にする。

一部の実施形態では、プールは、低メチル化された分配のＤＮＡの少数、例えば、低メチル化された分配のＤＮＡの約５０％未満、例えば、低メチル化された分配のＤＮＡの約４５％、４０％、３５％、３０％、２５％、２０％、１５％、１０％もしくは５％未満、またはそれと等しい％を含み得る。一部の実施形態では、プールは、低メチル化された分配のＤＮＡの約５％～２５％を含む。一部の実施形態では、プールは、低メチル化された分配のＤＮＡの約１０％～２０％を含む。一部の実施形態では、プールは、低メチル化された分配のＤＮＡの約１０％を含む。一部の実施形態では、プールは、低メチル化された分配のＤＮＡの約１５％を含む。一部の実施形態では、プールは、低メチル化された分配のＤＮＡの約２０％を含む。

一部の実施形態では、プールは、高メチル化された分配のＤＮＡの少なくとも約５０％であり得る、高メチル化された分配の一部分を含む。例えば、プールは、高メチル化された分配のＤＮＡの少なくとも約５５％、６０％、６５％、７０％、７５％、８０％、８５％、９０％または９５％を含み得る。一部の実施形態では、プールは、高メチル化された分配のＤＮＡの５０～５５％、５５～６０％、６０～６５％、６５～７０％、７０～７５％、７５～８０％、８０～８５％、８５～９０％、９０～９５％または９５～１００％を含む。一部の実施形態では、第２のプールは、高メチル化された分配の全てまたは実質的に全てを含む。

一部の実施形態では、これらの方法は、低メチル化された分配のＤＮＡの少なくとも一部分を含む第１のプールを調製するステップを含む。一部の実施形態では、これらの方法は、高メチル化された分配のＤＮＡの少なくとも一部分を含む第２のプールを調製するステップを含む。一部の実施形態では、第１のプールは、高メチル化された分配のＤＮＡの一部分をさらに含む。一部の実施形態では、第２のプールは、低メチル化された分配のＤＮＡの一部分をさらに含む。一部の実施形態では、第１のプールは、低メチル化された分配のＤＮＡの大部分、および必要に応じて、高メチル化された分配のＤＮＡの少数を含む。一部の実施形態では、第２のプールは、高メチル化された分配のＤＮＡの大部分および低メチル化された分配のＤＮＡの少数を含む。中間にメチル化された分配が関与する一部の実施形態では、第２のプールは、中間にメチル化された分配のＤＮＡの少なくとも一部分、例えば、中間にメチル化された分配のＤＮＡの大部分を含む。一部の実施形態では、第１のプールは、低メチル化された分配のＤＮＡの大部分を含み、第２のプールは、高メチル化された分配のＤＮＡの大部分および中間にメチル化された分配のＤＮＡの大部分を含む。

一部の実施形態では、これらの方法は、第１のプールから標的領域の少なくとも第１のセットを捕捉するステップを含み、例えば、第１のプールは、上記実施形態のいずれかに示されるとおりである。一部の実施形態では、第１のセットは、配列可変標的領域を含む。一部の実施形態では、第１のセットは、低メチル化可変標的領域および／または断片化可変標的領域を含む。一部の実施形態では、第１のセットは、配列可変標的領域および断片化可変標的領域を含む。一部の実施形態では、第１のセットは、配列可変標的領域、低メチル化可変標的領域および断片化可変標的領域を含む。第１のプール中のＤＮＡを増幅するステップは、この捕捉ステップの前に実施され得る。一部の実施形態では、第１のプールから標的領域の第１のセットを捕捉するステップは、第１のプールのＤＮＡを、標的特異的プローブの第１のセットと接触させるステップを含む。一部の実施形態では、標的特異的プローブの第１のセットは、配列可変標的領域に特異的な標的結合性プローブを含む。一部の実施形態では、標的特異的プローブの第１のセットは、配列可変標的領域、低メチル化可変標的領域および／または断片化可変標的領域に特異的な標的結合性プローブを含む。

一部の実施形態では、これらの方法は、第２のプールから標的領域の第２のセットまたは標的領域の複数のセットを捕捉するステップを含み、例えば、第１のプールは、上記実施形態のいずれかに示されるとおりである。一部の実施形態では、第２の複数は、エピジェネティック標的領域、例えば、高メチル化可変標的領域および／または断片化可変標的領域を含む。一部の実施形態では、第２の複数は、配列可変標的領域ならびにエピジェネティック標的領域、例えば、高メチル化可変標的領域および／または断片化可変標的領域を含む。第２のプール中のＤＮＡを増幅するステップは、この捕捉ステップの前に実施され得る。一部の実施形態では、第２のプールから標的領域の第２の複数のセットを捕捉するステップは、第１のプールのＤＮＡを、標的特異的プローブの第２のセットと接触させるステップを含み、標的特異的プローブの第２のセットは、配列可変標的領域に特異的な標的結合性プローブおよびエピジェネティック標的領域に特異的な標的結合性プローブを含む。一部の実施形態では、標的領域の第１のセットと標的領域の第２のセットとは、同一ではない。例えば、標的領域の第１のセットは、標的領域の第２のセット中には存在しない１つまたは複数の標的領域を含み得る。あるいはまたはさらに、標的領域の第２のセットは、標的領域の第１のセット中には存在しない１つまたは複数の標的領域を含み得る。一部の実施形態では、少なくとも１つの高メチル化可変標的領域は、第２のプールから捕捉されるが、第１のプールからは捕捉されない。一部の実施形態では、複数の高メチル化可変標的領域は、第２のプールから捕捉されるが、第１のプールからは捕捉されない。一部の実施形態では、標的領域の第１のセットは、配列可変標的領域を含み、および／または標的領域の第２のセットは、エピジェネティック標的領域を含む。一部の実施形態では、標的領域の第１のセットは、配列可変標的領域および断片化可変標的領域を含み；標的領域の第２のセットは、エピジェネティック標的領域、例えば、高メチル化可変標的領域および断片化可変標的領域を含む。一部の実施形態では、標的領域の第１のセットは、配列可変標的領域、断片化可変標的領域を含み、低メチル化可変標的領域を含み；標的領域の第２のセットは、エピジェネティック標的領域、例えば、高メチル化可変標的領域および断片化可変標的領域を含む。

一部の実施形態では、第１のプールは、低メチル化された分配のＤＮＡの大部分および高メチル化された分配のＤＮＡの一部分（例えば、約半分）を含み、第２のプールは、高メチル化された分配のＤＮＡの一部分（例えば、約半分）を含む。一部のかかる実施形態では、標的領域の第１のセットは、配列可変標的領域を含み、および／または標的領域の第２のセットは、エピジェネティック標的領域を含む。配列可変標的領域および／またはエピジェネティック標的領域は、本明細書の他の場所に記載される実施形態のいずれかにおいて示されるとおりであり得る。
Ｉ．配列決定

一般に、アダプターが隣接する試料核酸は、事前の増幅ありまたはなしで、配列決定に供され得る。配列決定法には、例えば、Ｓａｎｇｅｒ配列決定、ハイスループット配列決定、パイロシーケンシング、合成による配列決定、単一分子配列決定、ｎａｎｏｐｏｒｅ配列決定、半導体配列決定、ライゲーションによる配列決定、ハイブリダイゼーションによる配列決定、デジタル遺伝子発現（Ｈｅｌｉｃｏｓ）、次世代配列決定（ＮＧＳ）、合成による単一分子配列決定（ＳＭＳＳ）（Ｈｅｌｉｃｏｓ）、超並列配列決定、クローン性単一分子アレイ（Ｓｏｌｅｘａ）、ショットガン配列決定、ＩｏｎＴｏｒｒｅｎｔ、ＯｘｆｏｒｄＮａｎｏｐｏｒｅ、ＲｏｃｈｅＧｅｎｉａ、Ｍａｘｉｍ－Ｇｉｌｂｅｒｔ配列決定、プライマーウォーキング、ならびにＰａｃＢｉｏ、ＳＯＬｉＤ、ＩｏｎＴｏｒｒｅｎｔまたはＮａｎｏｐｏｒｅプラットフォームを使用する配列決定が含まれる。配列決定反応は、複数のレーン、複数のチャネル、複数のウェル、または複数の試料セットを実質的に同時に処理する他の手段であり得る、種々の試料処理ユニットにおいて実施され得る。試料処理ユニットには、複数のランを同時に処理することができる複数の試料チャンバもまた含まれ得る。

配列決定反応は、そのうち少なくとも１つが、がんまたは他の疾患のマーカーを含有することが公知である、１つまたは複数の形態の核酸に対して実施され得る。配列決定反応は、試料中に存在する任意の核酸断片に対しても実施され得る。一部の実施形態では、ゲノムの配列カバレッジは、５％、１０％、１５％、２０％、２５％、３０％、４０％、５０％、６０％、７０％、８０％、９０％、９５％、９９％、９９．９％または１００％未満であり得る。一部の実施形態では、配列反応は、ゲノムの少なくとも５％、１０％、１５％、２０％、２５％、３０％、４０％、５０％、６０％、７０％または８０％の配列カバレッジを提供し得る。配列カバレッジは、少なくとも５、１０、２０、７０、１００、２００もしくは５００個の異なる遺伝子、または多くても５０００、２５００、１０００、５００もしくは１００個の異なる遺伝子に対して実施され得る。

同時配列決定反応は、多重配列決定を使用して実施され得る。一部の場合には、無細胞核酸は、少なくとも１０００、２０００、３０００、４０００、５０００、６０００、７０００、８０００、９０００、１００００、５００００、１００，０００の配列決定反応で配列決定され得る。他の場合には、無細胞核酸は、１０００、２０００、３０００、４０００、５０００、６０００、７０００、８０００、９０００、１００００、５００００、１００，０００未満の配列決定反応で配列決定され得る。配列決定反応は、順次または同時に実施され得る。引き続くデータ分析は、配列決定反応の全てまたは一部に対して実施され得る。一部の場合には、データ分析は、少なくとも１０００、２０００、３０００、４０００、５０００、６０００、７０００、８０００、９０００、１００００、５００００、１００，０００の配列決定反応に対して実施され得る。他の場合には、データ分析は、１０００、２０００、３０００、４０００、５０００、６０００、７０００、８０００、９０００、１００００、５００００、１００，０００未満の配列決定反応に対して実施され得る。例示的な読み取り深度は、遺伝子座（塩基）１つ当たり１０００～５００００の読み取りである。
１．配列決定の差次的深度

一部の実施形態では、配列可変標的領域セットに対応する核酸は、エピジェネティック標的領域セットに対応する核酸よりも深い配列決定の深度まで、配列決定される。例えば、配列バリアント標的領域セットに対応する核酸についての配列決定の深度は、エピジェネティック標的領域セットに対応する核酸についての配列決定の深度よりも、少なくとも１．２５倍、１．５倍、１．７５倍、２倍、２．２５倍、２．５倍、２．７５倍、３倍、３．５倍、４倍、４．５倍、５倍、６倍、７倍、８倍、９倍、１０倍、１１倍、１２倍、１３倍、１４倍もしくは１５倍深くてもよい、または１．２５倍～１．５倍、１．５倍～１．７５倍、１．７５倍～２倍、２倍～２．２５倍、２．２５倍～２．５倍、２．５倍～２．７５倍、２．７５倍～３倍、３倍～３．５倍、３．５倍～４倍、４倍～４．５倍、４．５倍～５倍、５倍～５．５倍、５．５倍～６倍、６倍～７倍、７倍～８倍、８倍～９倍、９倍～１０倍、１０倍～１１倍、１１倍～１２倍、１３倍～１４倍、１４倍～１５倍もしくは１５倍～１００倍深くてもよい。一部の実施形態では、配列決定の当該深度は、少なくとも２倍深い。一部の実施形態では、配列決定の当該深度は、少なくとも５倍深い。一部の実施形態では、配列決定の当該深度は、少なくとも１０倍深い。一部の実施形態では、配列決定の当該深度は、４倍～１０倍深い。一部の実施形態では、配列決定の当該深度は、４倍～１００倍深い。これらの実施形態の各々は、配列可変標的領域セットに対応する核酸が、エピジェネティック標的領域セットに対応する核酸よりも深い配列決定の深度まで配列決定される、程度を指す。

一部の実施形態では、配列可変標的領域セットに対応する捕捉されたｃｆＤＮＡおよびエピジェネティック標的領域セットに対応する捕捉されたｃｆＤＮＡは、並列で、例えば、同じ配列決定セル（例えば、Ｉｌｌｕｍｉｎａシーケンサーのフローセル）において、ならびに／または別々に捕捉されたセットを再度組み合わせることから生じるプールされた組成物、もしくは配列可変標的領域セットに対応するｃｆＤＮＡおよびエピジェネティック標的領域セットに対応する捕捉されたｃｆＤＮＡを同じ容器中に捕捉することによって得られた組成物であり得る同じ組成物において、配列決定される。
Ｊ．分析

一部の実施形態では、本明細書に記載される方法は、腫瘍（または新生物細胞もしくはがん細胞）によって産生されたＤＮＡの存在を同定するステップを含む。

本発明の方法は、対象における状態、特にがんの存在を診断するため、状態を特徴付ける（例えば、がんをステージングするまたはがんの不均一性を決定する）ため、処置に対する状態の応答をモニタリングするため、状態または状態の引き続く過程を発症する予後リスクをもたらすために、使用され得る。本開示は、特定の処置選択肢の有効性を決定する際にも有用であり得る。処置が首尾よい場合、より多くのがんが死に、ＤＮＡを脱落させ得るので、首尾よい処置選択肢は、対象の血液中で検出されるコピー数バリエーションまたは稀な突然変異の量を増加させ得る。他の例では、これは生じない場合がある。別の例では、おそらくはある特定の処置選択肢は、がんの遺伝的プロファイルと経時的に相関付けられ得る。この相関は、治療を選択する際に有用であり得る。

さらに、がんが処置後に緩解状態にあることが観察される場合、本発明の方法は、残留疾患または疾患の再発をモニタリングするために使用され得る。

検出され得るがんの型および数には、血液がん、脳がん、肺がん、皮膚がん、鼻がん、喉がん、肝臓がん、骨がん、リンパ腫、膵がん、皮膚がん、腸がん、直腸がん、甲状腺がん、膀胱がん、腎臓がん、口腔がん、胃がん、固形状態腫瘍、不均一な腫瘍、均一な腫瘍などが含まれ得る。がんの型および／またはステージは、突然変異、稀な突然変異、インデル、コピー数バリエーション、トランスバージョン、転座、逆位、欠失、異数性、部分的異数性、倍数性、染色体不安定性、染色体構造変更、遺伝子融合、染色体融合、遺伝子トランケーション、遺伝子増幅、遺伝子重複、染色体損傷、ＤＮＡ損傷、核酸の化学改変における異常な変化、エピジェネティックパターンにおける異常な変化、および核酸の５－メチルシトシンにおける異常な変化が含まれる遺伝子バリエーションから検出され得る。

遺伝的データは、特定の形態のがんを特徴付けるためにも使用され得る。がんは、組成およびステージングの両方において不均一である場合が多い。遺伝的プロファイルデータは、その特定のサブタイプの診断または処置において重要であり得る、がんの特定のサブタイプの特徴付けを可能にし得る。この情報はまた、特定の型のがんの予後に関する手掛かりを対象または実務者に提供し得、疾患の進行に従って対象または実務者のいずれかが処置選択肢を適応させるのを可能にし得る。一部のがんは、進行して、より悪性度が高くかつ遺伝的に不安定になり得る。他のがんは、良性、不活性または休眠状態のままであり得る。本開示の系および方法は、疾患進行を決定する際に有用であり得る。

さらに、本開示の方法は、対象における異常な状態の不均一性を特徴付けるために使用され得る。かかる方法は、例えば、対象に由来する細胞外ポリヌクレオチドの遺伝的プロファイルを生成するステップを含み得、遺伝的プロファイルは、コピー数バリエーションおよび稀な突然変異の分析から生じる複数のデータを含む。一部の実施形態では、異常な状態は、がんである。一部の実施形態では、異常な状態は、不均一なゲノム集団を生じるものであり得る。がんの例では、一部の腫瘍は、がんの異なるステージにある腫瘍細胞を含むことが公知である。他の例では、不均一性は、疾患の複数の病巣を含み得る。再び、がんの例では、複数の腫瘍病巣が存在し得、おそらくはこのとき、１つまたは複数の病巣は、原発部位から広がった転移の結果である。

本発明の方法は、不均一な疾患中の異なる細胞に由来する遺伝情報の総計であるフィンガープリントまたはデータのセットを生成またはプロファイリングするために使用され得る。データのこのセットは、コピー数バリエーション、エピジェネティックバリエーションおよび突然変異の分析を、単独でまたは組み合わせて含み得る。

本発明の方法は、がんまたは他の疾患を診断、予後判定、モニタリングまたは観察するために使用され得る。一部の実施形態では、本明細書の方法は、胎児を診断することにも予後判定することにもモニタリングすることにも関与せず、したがって、非侵襲性出生前試験に関するものではない。他の実施形態では、これらの方法論は、そのＤＮＡおよび他のポリヌクレオチドが母方分子と共に共循環し得る誕生前の対象におけるがんまたは他の疾患を診断、予後判定、モニタリングまたは観察するために、妊娠対象において用いられ得る。

試料を、試料のＤＮＡ中の第２のヌクレオベースとは異なるようにＤＮＡ中の第１のヌクレオベースに影響を与える手順に供するステップを含む、ＮＧＳを介した、分配されたライブラリーの分子タグ同定のための例示的な方法は、以下のとおりである：
１．抽出されたＤＮＡ試料（例えば、本明細書に記載される標的捕捉に必要に応じて供された、ヒト試料から抽出された血漿ＤＮＡ）を、ＤＮＡ中の第２のヌクレオベースとは異なるようにＤＮＡ中の第１のヌクレオベースに影響を与える手順、例えば、本明細書に記載されるもののいずれかに供する。
２．全ての分配を下流の処理のためのプロセスから守る、メチル結合抗体を使用したＤＮＡ試料の物理的分配。
３．各分配への、差次的分子タグおよびＮＧＳを可能にするアダプター配列の並行適用。例えば、高メチル化された、残留メチル化（「洗浄」）および低メチル化された分配は、分子タグと共にＮＧＳ－アダプターとライゲーションされる。
４．全ての分子タグ化された分配を再度組み合わせ、アダプター特異的ＤＮＡプライマー配列を使用して引き続いて増幅する。
５．目的のゲノム領域（例えば、がん特異的遺伝的バリアントおよび差次的にメチル化された領域）を標的化する、再度組み合わされ増幅された総ライブラリーの捕捉／ハイブリダイゼーション。
６．試料タグを付加する、捕捉されたＤＮＡライブラリーの再増幅。異なる試料がプールされ、ＮＧＳ機器上で多重でアッセイされる。
７．ＮＧＳデータのバイオインフォマティクス分析であって、分子タグは、独自の分子を同定するため、ならびに差次的にＭＢＤ分配された分子への試料のデコンボリューションのために使用される。この分析は、標準的な遺伝子配列決定／バリアント検出と並列して、ゲノム領域についての関連する５－メチルシトシンについての情報を生じ得る。

上に示された方法が含まれるがそれに限定されない、本明細書に記載される方法の一部の実施形態では、分子タグは、ＤＮＡ中の第２のヌクレオベースとは異なるようにＤＮＡ中の第１のヌクレオベースに影響を与える手順、例えば、本明細書に記載される手順のいずれによっても変更されないヌクレオチド（例えば、手順が、バイサルファイト変換、またはｍＣに影響を与えない任意の他の変換である場合、Ａ、ＴおよびＧと共にｍＣ；手順が、ｈｍＣに影響を与えない変換である場合、Ａ、ＴおよびＧと共にｈｍＣ；など）からなる。上に示された方法が含まれるがそれに限定されない、本明細書に記載される方法の一部の実施形態では、分子タグは、ＤＮＡ中の第２のヌクレオベースとは異なるようにＤＮＡ中の第１のヌクレオベースに影響を与える手順、例えば、本明細書に記載される手順のいずれかによって変更されるヌクレオチドを含まない（例えば、手順が、バイサルファイト変換、またはＣに影響を与える任意の他の変換である場合、タグは、未改変のＣを含まない；手順が、ｍＣに影響を与える変換である場合、タグは、ｍＣを含まない；手順が、ｈｍＣに影響を与える変換である場合、タグは、ｈｍＣを含まない；など）。一般に、ＤＮＡ中の第２のヌクレオベースとは異なるようにＤＮＡ中の第１のヌクレオベースに影響を与える手順は、各分配への、差次的分子タグおよびＮＧＳを可能にするアダプター配列の並行適用のステップの前に実施され得る。
Ｋ．例示的なワークフロー

分配およびライブラリー調製のための例示的なワークフローは、本明細書で提供される。試料を、試料のＤＮＡ中の第２のヌクレオベースとは異なるようにＤＮＡ中の第１のヌクレオベースに影響を与える手順に供するステップ（例えば、分配前に実施される）の記載は、上記および実施例に提供される。一部の実施形態では、分配およびライブラリー調製ワークフローの一部または全ての特色は、組み合わせて使用され得る。
１．分配

一部の実施形態では、５－メチルシチジン（５ｍＣ）に対するモノクローナル抗体が、メチル化されたＤＮＡを精製するために使用される。ＤＮＡは、一本鎖ＤＮＡ断片を得るために、例えば、９５℃で変性される。標準的なビーズまたは磁気ビーズにカップリングされたプロテインＧ、ならびに抗５ｍＣ抗体とのインキュベーション後の洗浄が、抗体に結合したＤＮＡを免疫沈降させるために使用される。次いで、かかるＤＮＡは、溶出され得る。分配は、沈降していないＤＮＡを含み得、１つまたは複数の分配は、ビーズから溶出され得る。

一部の実施形態では、試料ＤＮＡ（例えば、５ｎｇと２００ｎｇとの間）は、メチル結合ドメイン（ＭＢＤ）緩衝液、およびＭＢＤタンパク質とコンジュゲートした磁気ビーズと混合され、一晩インキュベートされる。メチル化されたＤＮＡ（高メチル化されたＤＮＡ）は、このインキュベーションの間に、磁気ビーズ上のＭＢＤタンパク質に結合する。非メチル化ＤＮＡ（低メチル化されたＤＮＡ）またはあまりメチル化されていないＤＮＡ（中間にメチル化された）は、漸増濃度の塩を含有する緩衝液を用いて、ビーズから洗浄して除かれる。例えば、非メチル化、低メチル化された、および／または中間にメチル化されたＤＮＡを含有する１、２つまたはそれよりも多くの画分が、かかる洗浄から得られ得る。最後に、高塩緩衝液が、強くメチル化されたＤＮＡ（高メチル化されたＤＮＡ）をＭＢＤタンパク質から溶出させるために使用される。一部の実施形態では、これらの洗浄は、漸増レベルのメチル化を有するＤＮＡの３つの分配（低メチル化された分配、中間にメチル化された画分および高メチル化された分配）を生じる。

一部の実施形態では、ＤＮＡの分配は、脱塩され、ライブラリー調製の酵素的ステップのために調製物中で濃縮される。
２．ライブラリー調製

一部の実施形態（例えば、分配中のＤＮＡを濃縮した後の）では、分配されたＤＮＡは、例えば、ＤＮＡ分子の末端オーバーハングを伸長させ、アデノシン残基を断片の３’末端に付加し、各ＤＮＡ断片の５’末端をリン酸化することによって、ライゲーション可能にされる。ＤＮＡリガーゼおよびアダプターが、各分配されたＤＮＡ分子を各末端上でアダプターとライゲーションさせるために添加される。これらのアダプターは、他の分配において使用されるアダプター中の分配タグから識別可能な分配タグ（例えば、非ランダムな非独自のバーコード）を含有する。次いで、２つ、３つ（またはそれよりも多く）の分配が一緒にプールされ、（例えば、アダプターに特異的なプライマーなどを用いたＰＣＲによって）増幅される。

ＰＣＲの後、増幅されたＤＮＡは、富化前に浄化され、濃縮され得る。増幅されたＤＮＡは、目的の特定の領域を標的化する本明細書に記載されるプローブ（これは、例えば、ビオチン化されたＲＮＡプローブであり得る）の収集と接触させられる。混合物は、例えば、塩緩衝液中で、例えば一晩、インキュベートされる。プローブは、（例えば、ストレプトアビジン磁気ビーズを使用して）捕捉され、例えば、一連の塩洗浄によって、捕捉されなかった増幅されたＤＮＡから分離され、それによって、試料が富化される。富化の後、富化された試料は、ＰＣＲによって増幅される。一部の実施形態では、ＰＣＲプライマーは、試料タグを含有し、それによって、試料タグをＤＮＡ分子中に取り込む。一部の実施形態では、異なる試料由来のＤＮＡが一緒にプールされ、次いで、例えば、ＩｌｌｕｍｉｎａＮｏｖａＳｅｑシーケンサーを使用して、多重配列決定される。
ＩＩＩ．ある特定の開示された方法の追加の特色
Ａ．試料

試料は、対象から単離された任意の生体試料であり得る。試料は、身体試料であり得る。試料には、身体組織、例えば、既知のまたは疑われる固形腫瘍、全血、血小板、血清、血漿、糞便、赤血球、白血球（ｗｈｉｔｅｂｌｏｏｄｃｅｌｌ）または白血球（ｌｅｕｃｏｃｙｔｅ）、内皮細胞、組織生検、脳脊髄液滑液、リンパ液、腹水、間質または細胞外液、歯肉溝滲出液が含まれる細胞間の空間中の液、骨髄、胸水、脳脊髄液、唾液、粘液、痰、精液、汗、尿が含まれ得る。試料は、好ましくは、体液、特に、血液およびその画分、ならびに尿である。試料は、対象から元々単離された形態であり得、あるいは構成要素、例えば、細胞を除去もしくは添加するため、または別の構成要素に対して１つの構成要素を富化するためのさらなる処理に供されていることができる。したがって、分析のための好ましい体液は、無細胞核酸を含有する血漿または血清である。試料は、対象から単離され得または得られ得、試料分析の場所に輸送され得る。試料は、望ましい温度、例えば、室温、４℃、－２０℃および／または－８０℃で保存および発送され得る。試料は、試料分析の場所において、対象から単離され得または得られ得る。対象は、ヒト、哺乳動物、動物、コンパニオン動物、サービス動物またはペットであり得る。対象は、がんを有し得る。対象は、がんも検出可能ながん症状も有さない場合がある。対象は、１つまたは複数のがん治療、例えば、化学療法、抗体、ワクチンまたは生物製剤（biologies）のうちいずれか１つまたは複数で処置されていてもよい。対象は、緩解状態にあり得る。対象は、がんまたは任意のがん関連の遺伝的突然変異／障害に対して感受性であると診断されてもされなくてもよい。

血漿の体積は、配列決定される領域についての所望の読み取り深度に依存し得る。例示的な体積は、０．４～４０ｍｌ、５～２０ｍｌ、１０～２０ｍｌである。例えば、体積は、０．５ｍＬ、１ｍＬ、５ｍＬ１０ｍＬ、２０ｍＬ、３０ｍＬまたは４０ｍＬであり得る。試料採取された血漿の体積は、５～２０ｍＬであり得る。

試料は、ゲノム当量を含有する、種々の量の核酸を含み得る。例えば、約３０ｎｇのＤＮＡの試料は、約１０，０００（１０^４）の一倍体ヒトゲノム当量、およびｃｆＤＮＡの場合には、約２０００億（２×１０^１１）個の個々のポリヌクレオチド分子を含有し得る。同様に、約１００ｎｇのＤＮＡの試料は、約３０，０００の一倍体ヒトゲノム当量、およびｃｆＤＮＡの場合には、約６０００億個の個々の分子を含有し得る。

試料は、異なる供給源から、例えば、同じ対象の細胞および無細胞から、異なる対象の細胞および無細胞からの核酸を含み得る。試料は、突然変異を保有する核酸を含み得る。例えば、試料は、生殖系列突然変異および／または体細胞突然変異を保有するＤＮＡを含み得る。生殖系列突然変異は、対象の生殖系列ＤＮＡ中に存在する突然変異を指す。体細胞突然変異は、対象の体細胞、例えば、がん細胞に起源する突然変異を指す。試料は、がん関連の突然変異（例えば、がん関連の体細胞突然変異）を保有するＤＮＡを含み得る。試料は、エピジェネティックバリアント（すなわち、化学的またはタンパク質改変）を含み得、エピジェネティックバリアントは、遺伝的バリアント、例えば、がん関連の突然変異の存在に関連する。一部の実施形態では、試料は、遺伝的バリアントの存在に関連するエピジェネティックバリアントを含み、試料は、その遺伝的バリアントを含まない。

増幅前の試料中の無細胞核酸の例示的な量は、約１ｆｇ～約１μｇ、例えば、１ｐｇ～２００ｎｇ、１ｎｇ～１００ｎｇ、１０ｎｇ～１０００ｎｇの範囲である。例えば、量は、最大で約６００ｎｇ、最大で約５００ｎｇ、最大で約４００ｎｇ、最大で約３００ｎｇ、最大で約２００ｎｇ、最大で約１００ｎｇ、最大で約５０ｎｇまたは最大で約２０ｎｇの無細胞核酸分子であり得る。量は、少なくとも１ｆｇ、少なくとも１０ｆｇ、少なくとも１００ｆｇ、少なくとも１ｐｇ、少なくとも１０ｐｇ、少なくとも１００ｐｇ、少なくとも１ｎｇ、少なくとも１０ｎｇ、少なくとも１００ｎｇ、少なくとも１５０ｎｇまたは少なくとも２００ｎｇの無細胞核酸分子であり得る。量は、最大で１フェムトグラム（ｆｇ）、１０ｆｇ、１００ｆｇ、１ピコグラム（ｐｇ）、１０ｐｇ、１００ｐｇ、１ｎｇ、１０ｎｇ、１００ｎｇ、１５０ｎｇまたは２００ｎｇの無細胞核酸分子であり得る。方法は、１フェムトグラム（ｆｇ）～２００ｎｇ－を得ることを含み得る。

無細胞核酸は、細胞内に含有されることもなく細胞に他の方法で結合してもいない核酸、または言い換えると、インタクトな細胞を除去した後に試料中に残存している核酸である。無細胞核酸には、ゲノムＤＮＡ、ミトコンドリアＤＮＡ、ｓｉＲＮＡ、ｍｉＲＮＡ、循環ＲＮＡ（ｃＲＮＡ）、ｔＲＮＡ、ｒＲＮＡ、核小体低分子ＲＮＡ（ｓｎｏＲＮＡ）、Ｐｉｗｉ相互作用性ＲＮＡ（ｐｉＲＮＡ）、長い非コードＲＮＡ（長ｎｃＲＮＡ）、またはこれらのうちいずれかの断片が含まれる、ＤＮＡ、ＲＮＡ、およびそれらのハイブリッドが含まれる。無細胞核酸は、二本鎖、一本鎖、またはそれらのハイブリッドであり得る。無細胞核酸は、分泌または細胞死プロセス、例えば、細胞の壊死およびアポトーシスを介して、体液中に放出され得る。一部の無細胞核酸、例えば、循環腫瘍ＤＮＡ（ｃｔＤＮＡ）は、がん細胞から体液中に放出される。他は、健康な細胞から放出される。一部の実施形態では、ｃｆＤＮＡは、無細胞胎児ＤＮＡ（ｃｆｆＤＮＡ）である。一部の実施形態では、無細胞核酸は、腫瘍細胞によって産生される。一部の実施形態では、無細胞核酸は、腫瘍細胞および非腫瘍細胞の混合物によって産生される。

無細胞核酸は、約１００～５００ヌクレオチドの例示的なサイズ分布を有し、１１０～約２３０ヌクレオチドの分子が、分子の約９０％を占め、最頻値は約１６８ヌクレオチドであり、第２の小さいピークは、２４０～４４０ヌクレオチドの間の範囲である。

無細胞核酸は、溶液中で見出される無細胞核酸が、インタクトな細胞および体液の他の非可溶性構成要素から分離される、分画または分配ステップを介して、体液から単離され得る。分配は、遠心分離または濾過などの技法を含み得る。あるいは、体液中の細胞は溶解され得、無細胞および細胞性核酸が一緒に処理され得る。一般に、緩衝液の添加および洗浄ステップの後に、核酸は、アルコールを用いて沈殿され得る。夾雑物または塩を除去するためのシリカベースのカラムなどのさらなる清浄化ステップが使用され得る。バイサルファイト配列決定、ハイブリダイゼーションおよび／またはライゲーションのための非特異的バルク担体核酸、例えば、Ｃ１ＤＮＡ、ＤＮＡまたはタンパク質が、手順のある特定の態様、例えば収量を最適化するために、反応を通じて添加され得る。

かかる処理の後、試料は、二本鎖ＤＮＡ、一本鎖ＤＮＡおよび一本鎖ＲＮＡが含まれる種々の形態の核酸を含み得る。一部の実施形態では、一本鎖ＤＮＡおよびＲＮＡは、二本鎖形態に変換され得、そうして、これらは、引き続く処理ステップおよび分析ステップに含められる。

試料中の二本鎖ＤＮＡ分子、および二本鎖ＤＮＡ分子に変換された一本鎖核酸分子は、一方の末端または両方の末端のいずれかにおいて、アダプターに連結され得る。典型的には、二本鎖分子は、４種全ての標準的なヌクレオチドの存在下で、５’－３’ポリメラーゼおよび３’－５’エキソヌクレアーゼ（またはプルーフリーディング機能）を有するポリメラーゼによる処理によって平滑末端化される。Ｋｌｅｎｏｗ大断片およびＴ４ポリメラーゼが、適切なポリメラーゼの例である。平滑末端化されたＤＮＡ分子は、少なくとも部分的に二本鎖のアダプター（例えば、Ｙ型またはベル型アダプター）とライゲーションされ得る。あるいは、相補的ヌクレオチドが、ライゲーションを容易にするために、試料核酸およびアダプターの平滑末端に付加され得る。平滑末端ライゲーションおよび粘着末端ライゲーションの両方が、本明細書で企図される。平滑末端ライゲーションでは、核酸分子およびアダプタータグの両方が、平滑末端を有する。粘着末端ライゲーションでは、典型的には、核酸分子が「Ａ」オーバーハングを保有し、アダプターが「Ｔ」オーバーハングを保有する。
Ｂ．増幅

アダプターが隣接する試料核酸は、ＰＣＲおよび他の増幅法によって増幅され得る。増幅は、増幅されるＤＮＡ分子に隣接するアダプター中のプライマー結合部位に結合するプライマーによって、典型的にはプライムされる。増幅法は、サーモサイクリングから生じる変性、アニーリングおよび伸長のサイクルを含み得、または転写媒介増幅では等温であり得る。他の増幅法には、リガーゼ連鎖反応、鎖置換増幅、核酸配列ベースの増幅、および自家持続配列ベースの複製が含まれる。

一部の実施形態では、本発明の方法は、アダプターに連結させる前に二本鎖核酸の少なくとも５０、６０、７０または８０％の増幅を生じる、Ｔテイル付きアダプターおよびＣテイル付きアダプターとのｄｓＤＮＡライゲーションを実施する。好ましくは、本発明の方法は、Ｔテイル付きアダプター単独で実施される対照法と比較して、増幅された分子の量または数を、少なくとも１０、１５または２０％増加させる。
Ｃ．ベイトセット；捕捉部分

上で議論されるように、試料中の核酸は、標的配列を有する分子が、引き続く分析のために捕捉される、捕捉ステップに供され得る。標的捕捉は、捕捉部分、例えば、ビオチンまたは以下で注目される他の例で標識されたオリゴヌクレオチドベイトを含むベイトセットの使用を含み得る。プローブは、領域、例えば、遺伝子のパネルにわたってタイリングするように選択された配列を有し得る。一部の実施形態では、ベイトセットは、本明細書の他の場所で議論されるように、それぞれ、標的領域のセット、例えば、配列可変標的領域セットおよびエピジェネティック標的領域セットのものについて、より高いおよびより低い捕捉収量を有し得る。かかるベイトセットは、標的分子とベイトとのハイブリダイゼーションを可能にする条件下で、試料と組み合わせされる。次いで、捕捉された分子は、捕捉部分を使用して単離される。例えば、ビーズベースのストレプトアビジンによるビオチン捕捉部分。かかる方法は、例えば、これにより参照により本明細書に組み込まれる、２０１７年１２月２６日に発行した米国特許第９，８５０，５２３号にさらに記載される。

捕捉部分には、ビオチン、アビジン、ストレプトアビジン、特定のヌクレオチド配列を含む核酸、抗体によって認識されるハプテン、および磁気的に誘引可能な粒子が含まれるがこれらに限定されない。抽出部分は、結合対、例えば、ビオチン／ストレプトアビジンまたはハプテン／抗体のメンバーであり得る。一部の実施形態では、分析物に結合された捕捉部分は、単離可能な部分、例えば、磁気的に誘引可能な粒子、または遠心分離を介して沈降され得る大きい粒子に結合されたその結合対によって捕捉される。捕捉部分は、捕捉部分を欠如する核酸からの、捕捉部分を保有する核酸の親和性分離を可能にする、任意の型の分子であり得る。例示的な捕捉部分は、固相に連結されたもしくは連結可能なストレプトアビジンへの結合によって親和性分離を可能にするビオチン、または固相に連結されたもしくは連結可能な相補的オリゴヌクレオチドへの結合を介した親和性分離を可能にするオリゴヌクレオチドである。
Ｄ．標的特異的プローブの収集

一部の実施形態では、標的特異的プローブの収集が、本明細書に記載される方法において使用される。一部の実施形態では、標的特異的プローブの収集は、配列可変標的領域セットに特異的な標的結合性プローブおよびエピジェネティック標的領域セットに特異的な標的結合性プローブを含む。一部の実施形態では、配列可変標的領域セットに特異的な標的結合性プローブの捕捉収量は、エピジェネティック標的領域セットに特異的な標的結合性プローブの捕捉収量よりも高い（例えば、少なくとも２倍高い）。一部の実施形態では、標的特異的プローブの収集は、エピジェネティック標的領域セットに特異的なその捕捉収量よりも高い（例えば、少なくとも２倍高い）、配列可変標的領域セットに特異的な捕捉収量を有するように構成される。

一部の実施形態では、配列可変標的領域セットに特異的な標的結合性プローブの捕捉収量は、エピジェネティック標的領域セットに特異的な標的結合性プローブの捕捉収量よりも、少なくとも１．２５倍、１．５倍、１．７５倍、２倍、２．２５倍、２．５倍、２．７５倍、３倍、３．５倍、４倍、４．５倍、５倍、６倍、７倍、８倍、９倍、１０倍、１１倍、１２倍、１３倍、１４倍または１５倍高い。一部の実施形態では、配列可変標的領域セットに特異的な標的結合性プローブの捕捉収量は、エピジェネティック標的領域セットに特異的な標的結合性プローブの捕捉収量よりも、１．２５倍～１．５倍、１．５倍～１．７５倍、１．７５倍～２倍、２倍～２．２５倍、２．２５倍～２．５倍、２．５倍～２．７５倍、２．７５倍～３倍、３倍～３．５倍、３．５倍～４倍、４倍～４．５倍、４．５倍～５倍、５倍～５．５倍、５．５倍～６倍、６倍～７倍、７倍～８倍、８倍～９倍、９倍～１０倍、１０倍～１１倍、１１倍～１２倍、１３倍～１４倍または１４倍～１５倍高い。

一部の実施形態では、標的特異的プローブの収集は、エピジェネティック標的領域セットについてのその捕捉収量よりも少なくとも１．２５倍、１．５倍、１．７５倍、２倍、２．２５倍、２．５倍、２．７５倍、３倍、３．５倍、４倍、４．５倍、５倍、６倍、７倍、８倍、９倍、１０倍、１１倍、１２倍、１３倍、１４倍または１５倍高い、配列可変標的領域セットに特異的な捕捉収量を有するように構成される。一部の実施形態では、標的特異的プローブの収集は、エピジェネティック標的領域セットに特異的なその捕捉収量よりも１．２５倍～１．５倍、１．５倍～１．７５倍、１．７５倍～２倍、２倍～２．２５倍、２．２５倍～２．５倍、２．５倍～２．７５倍、２．７５倍～３倍、３倍～３．５倍、３．５倍～４倍、４倍～４．５倍、４．５倍～５倍、５倍～５．５倍、５．５倍～６倍、６倍～７倍、７倍～８倍、８倍～９倍、９倍～１０倍、１０倍～１１倍、１１倍～１２倍、１３倍～１４倍または１４倍～１５倍高い、配列可変標的領域セットに特異的な捕捉収量を有するように構成される。

プローブの収集は、濃度、異なる長さおよび／または化学（例えば、親和性に影響を与える）、ならびにそれらの組合せが含まれる種々の方法で、配列可変標的領域セットについてより高い捕捉収量を提供するように構成され得る。親和性は、以下で議論されるように、プローブ長さを調整すること、および／またはヌクレオチド改変を含めることによって、モジュレートされ得る。

一部の実施形態では、配列可変標的領域セットに特異的な標的特異的プローブは、エピジェネティック標的領域セットに特異的な標的特異的プローブよりも高い濃度で存在する。一部の実施形態では、配列可変標的領域セットに特異的な標的結合性プローブの濃度は、エピジェネティック標的領域セットに特異的な標的結合性プローブの濃度よりも少なくとも１．２５倍、１．５倍、１．７５倍、２倍、２．２５倍、２．５倍、２．７５倍、３倍、３．５倍、４倍、４．５倍、５倍、６倍、７倍、８倍、９倍、１０倍、１１倍、１２倍、１３倍、１４倍または１５倍高い。一部の実施形態では、配列可変標的領域セットに特異的な標的結合性プローブの濃度は、エピジェネティック標的領域セットに特異的な標的結合性プローブの濃度よりも１．２５倍～１．５倍、１．５倍～１．７５倍、１．７５倍～２倍、２倍～２．２５倍、２．２５倍～２．５倍、２．５倍～２．７５倍、２．７５倍～３倍、３倍～３．５倍、３．５倍～４倍、４倍～４．５倍、４．５倍～５倍、５倍～５．５倍、５．５倍～６倍、６倍～７倍、７倍～８倍、８倍～９倍、９倍～１０倍、１０倍～１１倍、１１倍～１２倍、１３倍～１４倍または１４倍～１５倍高い。かかる実施形態では、濃度は、各セット中の個々のプローブの、平均の、体積当たりの質量濃度を指し得る。

一部の実施形態では、配列可変標的領域セットに特異的な標的特異的プローブは、エピジェネティック標的領域セットに特異的な標的特異的プローブよりも高い、それらの標的に対する親和性を有する。親和性は、異なるプローブ化学を使用することによるものが含まれる、当業者に公知の任意の方法でモジュレートされ得る。例えば、ある特定のヌクレオチド改変、例えば、シトシン５－メチル化（ある特定の配列の文脈では）、２’の糖位置においてヘテロ原子を提供する改変、およびＬＮＡヌクレオチドは、二本鎖核酸の安定性を増加させ得、これは、かかる改変を有するオリゴヌクレオチドがそれらの相補的配列に対して相対的に高い親和性を有することを示す。例えば、Severin et al., Nucleic Acids Res. 39: 8740-8751 (2011)；Freier et al., Nucleic Acids Res. 25: 4429-4443 (1997)；米国特許第９，７３８，８９４号を参照されたい。また、より長い配列長さは、増加した親和性を一般に提供する。他のヌクレオチド改変、例えば、ヌクレオベースヒポキサンチンによるグアニンの置換は、オリゴヌクレオチドとその相補的配列との間の水素結合の量を低減させることによって、親和性を低減させる。一部の実施形態では、配列可変標的領域セットに特異的な標的特異的プローブは、それらの標的に対するそれらの親和性を増加させる改変を有する。一部の実施形態では、あるいはまたはさらに、エピジェネティック標的領域セットに特異的な標的特異的プローブは、それらの標的に対するそれらの親和性を減少させる改変を有する。一部の実施形態では、配列可変標的領域セットに特異的な標的特異的プローブは、エピジェネティック標的領域セットに特異的な標的特異的プローブよりも長い平均長さおよび／または高い平均融解温度を有する。これらの実施形態は、捕捉収量における所望の倍率の差異、例えば、上記任意の倍率の差異またはその範囲を達成するために、互いに、および／または上で議論される濃度における差異と組み合わされ得る。

一部の実施形態では、標的特異的プローブは、捕捉部分を含む。捕捉部分は、本明細書に記載される捕捉部分のいずれか、例えば、ビオチンであり得る。一部の実施形態では、標的特異的プローブは、例えば、捕捉部分の結合対の相互作用を介して、固体支持体に、例えば、共有結合的または非共有結合的に連結される。一部の実施形態では、固体支持体は、ビーズ、例えば、磁気ビーズである。

一部の実施形態では、配列可変標的領域セットに特異的な標的特異的プローブおよび／またはエピジェネティック標的領域セットに特異的な標的特異的プローブは、上で議論されるベイトセット、例えば、捕捉部分と、領域、例えば、遺伝子のパネルにわたってタイリングするように選択された配列とを含むプローブである。

一部の実施形態では、標的特異的プローブは、単一の組成物で提供される。単一の組成物は、溶液（液体または凍結された）であり得る。あるいは、単一の組成物は、凍結乾燥物であり得る。

あるいは、標的特異的プローブは、例えば、エピジェネティック標的領域セットに特異的なプローブを含む第１の組成物および配列可変標的領域セットに特異的なプローブを含む第２の組成物を含む、複数の組成物として提供され得る。これらのプローブは、組み合わされたプローブ組成物に、濃度および／または捕捉収量における上述の倍率の差異のいずれかを提供するのに適切な割合で、混合され得る。あるいは、これらは、それぞれ捕捉されたエピジェネティック標的領域および配列可変標的領域を含む第１および第２の組成物を提供するために、別々の捕捉手順（例えば、試料のアリコートを用いて、または同じ試料を用いて順次）において使用され得る。
１．エピジェネティック標的領域に特異的なプローブ

エピジェネティック標的領域セットに対するプローブは、新生物（例えば、腫瘍またはがん）細胞由来のＤＮＡを、健康な細胞、例えば、非新生物性循環細胞から差別化する可能性が高い、１つまたは複数の型の標的領域に特異的なプローブを含み得る。かかる領域の例示的な型は、例えば、捕捉されたセットに関する上記セクションにおいて、本明細書で詳細に議論される。エピジェネティック標的領域セットに対するプローブは、例えば、本明細書に記載されるような、１つまたは複数の対照領域に対するプローブもまた含み得る。

一部の実施形態では、エピジェネティック標的領域セットに対するプローブは、少なくとも１００ｋｂｐ、例えば、少なくとも２００ｋｂｐ、少なくとも３００ｋｂｐまたは少なくとも４００ｋｂｐのフットプリントを有する。一部の実施形態では、エピジェネティック標的領域セットは、１００～２０Ｍｂｐ、例えば、１００～２００ｋｂｐ、２００～３００ｋｂｐ、３００～４００ｋｂｐ、４００～５００ｋｂｐ、５００～６００ｋｂｐ、６００～７００ｋｂｐ、７００～８００ｋｂｐ、８００～９００ｋｂｐ、９００～１，０００ｋｂｐ、１～１．５Ｍｂｐ、１．５～２Ｍｂｐ、２～３Ｍｂｐ、３～４Ｍｂｐ、４～５Ｍｂｐ、５～６Ｍｂｐ、６～７Ｍｂｐ、７～８Ｍｂｐ、８～９Ｍｂｐ、９～１０Ｍｂｐまたは１０～２０Ｍｂｐの範囲のフットプリントを有する。一部の実施形態では、エピジェネティック標的領域セットは、少なくとも２０Ｍｂｐのフットプリントを有する。
ａ．高メチル化可変標的領域

一部の実施形態では、エピジェネティック標的領域セットに対するプローブは、１つまたは複数の高メチル化可変標的領域に特異的なプローブを含む。高メチル化可変標的領域は、上に示されたもののいずれかであり得る。例えば、一部の実施形態では、高メチル化可変標的領域に特異的なプローブは、表１に列挙された複数の遺伝子座、例えば、表１に列挙された遺伝子座の少なくとも１０％、２０％、３０％、４０％、５０％、６０％、７０％、８０％、９０％または１００％に特異的なプローブを含む。一部の実施形態では、高メチル化可変標的領域に特異的なプローブは、表２に列挙された複数の遺伝子座、例えば、表２に列挙された遺伝子座の少なくとも１０％、２０％、３０％、４０％、５０％、６０％、７０％、８０％、９０％または１００％に特異的なプローブを含む。一部の実施形態では、高メチル化可変標的領域に特異的なプローブは、表１または表２に列挙された複数の遺伝子座、例えば、表１または表２に列挙された遺伝子座の少なくとも１０％、２０％、３０％、４０％、５０％、６０％、７０％、８０％、９０％または１００％に特異的なプローブを含む。一部の実施形態では、標的領域として含まれる各遺伝子座について、遺伝子の転写開始部位と停止コドン（選択的スプライシングされる遺伝子については、最後の停止コドン）との間に結合するハイブリダイゼーション部位を有する１つまたは複数のプローブが存在し得る。一部の実施形態では、１つまたは複数のプローブは、列挙された位置の３００ｂｐ以内、例えば、２００または１００ｂｐ以内に結合する。一部の実施形態では、プローブは、上に列挙された位置と重複するハイブリダイゼーション部位を有する。一部の実施形態では、高メチル化標的領域に特異的なプローブには、乳房、結腸、腎臓、肝臓および肺がんのうち１、２、３、４または５つにおいて高メチル化を集合的に示す高メチル化標的領域の１、２、３、４または５つのサブセットに特異的なプローブが含まれる。
ｂ．低メチル化可変標的領域

一部の実施形態では、エピジェネティック標的領域セットに対するプローブは、１つまたは複数の低メチル化可変標的領域に特異的なプローブを含む。低メチル化可変標的領域は、上に示されたもののいずれかであり得る。例えば、１つまたは複数の低メチル化可変標的領域に特異的なプローブには、腫瘍細胞において低減されたメチル化を示し得る領域、例えば、反復エレメント、例えば、ＬＩＮＥ１エレメント、Ａｌｕエレメント、セントロメアタンデムリピート、動原体周囲タンデムリピートおよびサテライトＤＮＡ、ならびに健康な細胞では通常メチル化されている遺伝子間領域に対するプローブが含まれ得る。

一部の実施形態では、低メチル化可変標的領域に特異的なプローブには、反復エレメントおよび／または遺伝子間領域に特異的なプローブが含まれる。一部の実施形態では、反復エレメントに特異的なプローブには、ＬＩＮＥ１エレメント、Ａｌｕエレメント、セントロメアタンデムリピート、動原体周囲タンデムリピートおよび／またはサテライトＤＮＡのうち１、２、３、４または５つに特異的なプローブが含まれる。

がん関連の低メチル化を示すゲノム領域に特異的な例示的なプローブには、ヒト第１染色体のヌクレオチド８４０３５６５～８９５３７０８および／または１５１１０４７０１～１５１１０６０３５に特異的なプローブが含まれる。一部の実施形態では、低メチル化可変標的領域に特異的なプローブには、ヒト第１染色体のヌクレオチド８４０３５６５～８９５３７０８および／または１５１１０４７０１～１５１１０６０３５と重複するまたはそれを含む領域に特異的なプローブが含まれる。
ｃ．ＣＴＣＦ結合領域

一部の実施形態では、エピジェネティック標的領域セットに対するプローブには、ＣＴＣＦ結合領域に特異的なプローブが含まれる。一部の実施形態では、ＣＴＣＦ結合領域に特異的なプローブは、少なくとも１０、２０、５０、１００、２００もしくは５００個のＣＴＣＦ結合領域、または１０～２０、２０～５０、５０～１００、１００～２００、２００～５００もしくは５００～１０００個のＣＴＣＦ結合領域、例えば、上記の、あるいは上で引用したＣＴＣＦＢＳＤＢまたはCuddapah et al.、Martin et al.もしくはRhee et al.の論文のうち１つまたは複数に記載されるＣＴＣＦ結合領域などに特異的なプローブを含む。一部の実施形態では、エピジェネティック標的領域セットに対するプローブは、ＣＴＣＦ結合部位の少なくとも１００ｂｐ、少なくとも２００ｂｐ少なくとも３００ｂｐ、少なくとも４００ｂｐ、少なくとも５００ｂｐ、少なくとも７５０ｂｐまたは少なくとも１０００ｂｐ上流および下流の領域を含む。
ｄ．転写開始部位

一部の実施形態では、エピジェネティック標的領域セットに対するプローブには、転写開始部位に特異的なプローブが含まれる。一部の実施形態では、転写開始部位に特異的なプローブは、少なくとも１０、２０、５０、１００、２００もしくは５００個の転写開始部位、または１０～２０、２０～５０、５０～１００、１００～２００、２００～５００もしくは５００～１０００個の転写開始部位、例えば、ＤＢＴＳＳに列挙された転写開始部位などに特異的なプローブを含む。一部の実施形態では、エピジェネティック標的領域セットに対するプローブは、転写開始部位の少なくとも１００ｂｐ、少なくとも２００ｂｐ、少なくとも３００ｂｐ、少なくとも４００ｂｐ、少なくとも５００ｂｐ、少なくとも７５０ｂｐまたは少なくとも１０００ｂｐ上流および下流の配列に対するプローブを含む。
ｅ．限局的増幅

上で注目したように、限局的増幅は、体細胞突然変異であるが、これらは、ある特定のエピジェネティック変化、例えば、メチル化における変化を検出するためのアプローチと類似の様式で、読み取り頻度に基づいて配列決定することによって検出され得る。したがって、がんにおいて限局的増幅を示し得る領域は、上で議論されるように、エピジェネティック標的領域セット中に含まれ得る。一部の実施形態では、エピジェネティック標的領域セットに特異的なプローブには、限局的増幅に特異的なプローブが含まれる。一部の実施形態では、限局的増幅に特異的なプローブには、ＡＲ、ＢＲＡＦ、ＣＣＮＤ１、ＣＣＮＤ２、ＣＣＮＥ１、ＣＤＫ４、ＣＤＫ６、ＥＧＦＲ、ＥＲＢＢ２、ＦＧＦＲ１、ＦＧＦＲ２、ＫＩＴ、ＫＲＡＳ、ＭＥＴ、ＭＹＣ、ＰＤＧＦＲＡ、ＰＩＫ３ＣＡおよびＲＡＦ１のうち１つまたは複数に特異的なプローブが含まれる。例えば、一部の実施形態では、限局的増幅に特異的なプローブには、上述の標的のうち少なくとも２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７または１８個のうち１つまたは複数に特異的なプローブが含まれる。
ｆ．対照領域

データ検証を容易にするために、対照領域を含むことが有用であり得る。一部の実施形態では、エピジェネティック標的領域セットに特異的なプローブには、本質的に全ての試料においてメチル化されていると予想される、メチル化された対照領域に特異的なプローブが含まれる。一部の実施形態では、エピジェネティック標的領域セットに特異的なプローブには、本質的に全ての試料において低メチル化されていると予想される、低メチル化された対照領域に特異的なプローブが含まれる。
２．配列可変標的領域に特異的なプローブ

配列可変標的領域セットに対するプローブは、がんにおいて体細胞突然変異を受けることが公知の複数の領域に特異的なプローブを含み得る。プローブは、本明細書に記載される任意の配列可変標的領域セットに特異的であり得る。例示的な配列可変標的領域セットは、例えば、捕捉されたセットに関する上記セクションにおいて、本明細書で詳細に議論される。

一部の実施形態では、配列可変標的領域プローブセットは、少なくとも０．５ｋｂ、例えば、少なくとも１ｋｂ、少なくとも２ｋｂ、少なくとも５ｋｂ、少なくとも１０ｋｂ、少なくとも２０ｋｂ、少なくとも３０ｋｂまたは少なくとも４０ｋｂのフットプリントを有する。一部の実施形態では、エピジェネティック標的領域プローブセットは、０．５～１００ｋｂ、例えば、０．５～２ｋｂ、２～１０ｋｂ、１０～２０ｋｂ、２０～３０ｋｂ、３０～４０ｋｂ、４０～５０ｋｂ、５０～６０ｋｂ、６０～７０ｋｂ、７０～８０ｋｂ、８０～９０ｋｂおよび９０～１００ｋｂの範囲のフットプリントを有する。一部の実施形態では、配列可変標的領域プローブセットは、少なくとも５０ｋｂｐ、例えば、少なくとも１００ｋｂｐ、少なくとも２００ｋｂｐ、少なくとも３００ｋｂｐまたは少なくとも４００ｋｂｐのフットプリントを有する。一部の実施形態では、配列可変標的領域プローブセットは、１００～２０００ｋｂｐ、例えば、１００～２００ｋｂｐ、２００～３００ｋｂｐ、３００～４００ｋｂｐ、４００～５００ｋｂｐ、５００～６００ｋｂｐ、６００～７００ｋｂｐ、７００～８００ｋｂｐ、８００～９００ｋｂｐ、９００～１，０００ｋｂｐ、１～１．５Ｍｂｐまたは１．５～２Ｍｂｐの範囲のフットプリントを有する。一部の実施形態では、配列可変標的領域セットは、少なくとも２Ｍｂｐのフットプリントを有する。

一部の実施形態では、配列可変標的領域セットに特異的なプローブは、表３の遺伝子のうち少なくとも５、少なくとも１０、少なくとも１５、少なくとも２０、少なくとも２５、少なくとも３０、少なくとも３５、少なくとも４０、少なくとも４５、少なくとも５０、少なくとも５５、少なくとも６０、少なくとも６５または７０個の少なくとも一部分に特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに特異的なプローブは、表３のＳＮＶのうち少なくとも５、少なくとも１０、少なくとも１５、少なくとも２０、少なくとも２５、少なくとも３０、少なくとも３５、少なくとも４０、少なくとも４５、少なくとも５０、少なくとも５５、少なくとも６０、少なくとも６５または７０個に特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに特異的なプローブは、表３の融合のうち少なくとも１、少なくとも２、少なくとも３、少なくとも４、少なくとも５または６個に特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに特異的なプローブは、表３のインデルのうち少なくとも１、少なくとも２または３個の少なくとも一部分に特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに特異的なプローブは、表４の遺伝子のうち少なくとも５、少なくとも１０、少なくとも１５、少なくとも２０、少なくとも２５、少なくとも３０、少なくとも３５、少なくとも４０、少なくとも４５、少なくとも５０、少なくとも５５、少なくとも６０、少なくとも６５、少なくとも７０または７３個の少なくとも一部分に特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに特異的なプローブは、表４のＳＮＶのうち少なくとも５、少なくとも１０、少なくとも１５、少なくとも２０、少なくとも２５、少なくとも３０、少なくとも３５、少なくとも４０、少なくとも４５、少なくとも５０、少なくとも５５、少なくとも６０、少なくとも６５、少なくとも７０または７３個に特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに特異的なプローブは、表４の融合のうち少なくとも１、少なくとも２、少なくとも３、少なくとも４、少なくとも５または６個に特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに特異的なプローブは、表４のインデルのうち少なくとも１、少なくとも２、少なくとも３、少なくとも４、少なくとも５、少なくとも６、少なくとも７、少なくとも８、少なくとも９、少なくとも１０、少なくとも１１、少なくとも１２、少なくとも１３、少なくとも１４、少なくとも１５、少なくとも１６、少なくとも１７または１８個の少なくとも一部分に特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに特異的なプローブは、表５の遺伝子のうち少なくとも１、少なくとも２、少なくとも３、少なくとも４、少なくとも５、少なくとも６、少なくとも７、少なくとも８、少なくとも９、少なくとも１０、少なくとも１１、少なくとも１２、少なくとも１３、少なくとも１４、少なくとも１５、少なくとも１６、少なくとも１７、少なくとも１８、少なくとも１９または少なくとも２０個の少なくとも一部分に特異的なプローブを含む。

一部の実施形態では、配列可変標的領域セットに特異的なプローブは、少なくとも１０、２０、３０または３５個のがん関連遺伝子、例えば、ＡＫＴ１、ＡＬＫ、ＢＲＡＦ、ＣＣＮＤ１、ＣＤＫ２Ａ、ＣＴＮＮＢ１、ＥＧＦＲ、ＥＲＢＢ２、ＥＳＲ１、ＦＧＦＲ１、ＦＧＦＲ２、ＦＧＦＲ３、ＦＯＸＬ２、ＧＡＴＡ３、ＧＮＡ１１、ＧＮＡＱ、ＧＮＡＳ、ＨＲＡＳ、ＩＤＨ１、ＩＤＨ２、ＫＩＴ、ＫＲＡＳ、ＭＥＤ１２、ＭＥＴ、ＭＹＣ、ＮＦＥ２Ｌ２、ＮＲＡＳ、ＰＤＧＦＲＡ、ＰＩＫ３ＣＡ、ＰＰＰ２Ｒ１Ａ、ＰＴＥＮ、ＲＥＴ、ＳＴＫ１１、ＴＰ５３およびＵ２ＡＦ１由来の標的領域に特異的なプローブを含む。
Ｅ．捕捉されたＤＮＡを含む組成物

捕捉されたＤＮＡの第１および第２の集団を含む組合せ物が、本明細書で提供される。第１の集団は、第２の集団よりも高い割合でヌクレオベース改変、例えば、シトシン改変を有するＤＮＡを含み得るまたはそれに由来し得る。第１の集団は、変更された塩基対合特異性を有する、ＤＮＡ中に元々存在する第１のヌクレオベースの形態と、変更された塩基対合特異性を有さない第２のヌクレオベースとを含み得、塩基対合特異性の変更前のＤＮＡ中に元々存在する第１のヌクレオベースの形態は、改変されたまたは未改変のヌクレオベースであり、第２のヌクレオベースは、第１のヌクレオベースとは異なる改変されたまたは未改変のヌクレオベースであり、塩基対合特異性の変更前のＤＮＡ中に元々存在する第１のヌクレオベースの形態と第２のヌクレオベースとは、同じ塩基対合特異性を有する。第２の集団は、変更された塩基対合特異性を有する、ＤＮＡ中に元々存在する第１のヌクレオベースの形態を含まない。一部の実施形態では、第１の集団中により高い割合で存在するヌクレオベース改変は、シトシン改変である。一部のかかる実施形態では、シトシン改変は、シトシンメチル化である。一部の実施形態では、第１のヌクレオベースは、改変されたまたは未改変のシトシンであり、第２のヌクレオベースは、改変されたまたは未改変のシトシンである。第１および第２のヌクレオベースは、本明細書で議論されるもののいずれかであり得る。一部の実施形態では、第１の集団中により高い割合で存在する改変されたヌクレオベースは、ＤＮＡ中に元々存在するヌクレオベースの形態である。一部の実施形態では、第１の集団中により高い割合で存在する改変されたヌクレオベースは、第１のヌクレオベースと第２のヌクレオベースとに異なるように影響を与える手順によって生成されたヌクレオベースの形態である。

一部の実施形態では、第１の集団は、１つまたは複数の配列タグの第１のセットから選択される配列タグを含み、第２の集団は、１つまたは複数の配列タグの第２のセットから選択される配列タグを含み、配列タグの第２のセットは、配列タグの第１のセットとは異なる。配列タグは、バーコードを含み得る。

一部の実施形態では、第１の集団は、保護されたｈｍＣ、例えば、グルコシル化されたｈｍＣを含む。

一部の実施形態では、第１の集団は、本明細書で議論される変換手順、例えば、バイサルファイト変換、Ｏｘ－ＢＳ変換、ＴＡＢ変換、ＡＣＥ変換、ＴＡＰ変換、ＴＡＰＳβ変換またはＣＡＰ変換のいずれかに供されている。一部の実施形態では、第１の集団は、ｈｍＣの保護と、その後の、ｍＣおよび／またはＣの脱アミノ化とに供されている。

組合せ物の一部の実施形態では、第１の集団は、第２の集団よりも高い割合でシトシン改変を有するＤＮＡを含むか、またはそれに由来したものであり、第１の集団は、第１および第２のサブ集団を含み、第１のヌクレオベースは、改変されたまたは未改変のヌクレオベースであり、第２のヌクレオベースは、第１のヌクレオベースとは異なる改変されたまたは未改変のヌクレオベースであり、第１のヌクレオベースと第２のヌクレオベースとは、同じ塩基対合特異性を有する。一部の実施形態では、第２の集団は、第１のヌクレオベースを含まない。一部の実施形態では、第１のヌクレオベースは、改変されたまたは未改変のシトシンであり、第２のヌクレオベースは、改変されたまたは未改変のシトシンであり、必要に応じて、改変されたシトシンは、ｍＣまたはｈｍＣである。一部の実施形態では、第１のヌクレオベースは、改変されたまたは未改変のアデニンであり、第２のヌクレオベースは、改変されたまたは未改変のアデニンであり、必要に応じて、改変されたアデニンは、ｍＡである。

一部の実施形態では、第１のヌクレオベース（例えば、改変されたシトシン）は、ビオチン化される。一部の実施形態では、第１のヌクレオベース（例えば、改変されたシトシン）は、親和性標識（例えば、ビオチン）を含む、β－６－アジド－グルコシル－５－ヒドロキシメチルシトシンへのヒュスゲン環化付加の産物である。

本明細書に記載される組合せ物のいずれかでは、捕捉されたＤＮＡは、ｃｆＤＮＡを含み得る。

捕捉されたＤＮＡは、例えば、エピジェネティック標的領域セットに対応するＤＮＡの濃度よりも高い、配列可変標的領域セットに対応するＤＮＡの濃度（上で議論されるようにフットプリントサイズに関して標準化された）が含まれる、捕捉されたセットに関する本明細書に記載される特色のいずれかを有し得る。一部の実施形態では、捕捉されたセットのＤＮＡは、本明細書に記載されるようにＤＮＡに付加され得る配列タグを含む。一般に、配列タグを含めることは、それらの天然に存在するタグ化されていない形態とは異なるＤＮＡ分子を生じる。

組合せ物は、本明細書に記載されるプローブセットまたは配列決定プライマーをさらに含み得、その各々は、天然に存在する核酸分子とは異なり得る。例えば、本明細書に記載されるプローブセットは、捕捉部分を含み得、配列決定プライマーは、天然に存在しない標識を含み得る。
Ｆ．コンピューターシステム

本開示の方法は、コンピューターシステムを使用して、またはその助けにより、実行され得る。例えば、かかる方法は、試料を、試料のＤＮＡ中の第２のヌクレオベースとは異なるようにＤＮＡ中の第１のヌクレオベースに影響を与える手順に供するステップであって、第１のヌクレオベースが、改変されたまたは未改変のヌクレオベースであり、第２のヌクレオベースが、第１のヌクレオベースとは異なる改変されたまたは未改変のヌクレオベースであり、第１のヌクレオベースと第２のヌクレオベースとが、同じ塩基対合特異性を有する、ステップ；ＤＮＡを、ＤＮＡ中の改変されたヌクレオベースを認識する薬剤と接触させることによって、試料を、第１の部分試料および第２の部分試料が含まれる複数の部分試料へと分配するステップであって、第１の部分試料が、第２の部分試料よりも高い割合でシトシン改変を有するＤＮＡを含み、薬剤によって認識される改変されたヌクレオベースが、改変されたシトシン、または試料のＤＮＡ中の第２のヌクレオベースとは異なるようにＤＮＡ中の第１のヌクレオベースに影響を与える手順の産物である、ステップ；ならびに第１のヌクレオベースを第２のヌクレオベースから識別する様式で、第１および第２の部分試料のうち少なくとも一方中のＤＮＡを配列決定するステップ、を含み得る。

図２は、本開示の方法を実行するようにプログラムされたまたは他の方法で構成されたコンピューターシステム２０１を示す。コンピューターシステム２０１は、種々の態様の試料調製、配列決定および／または分析を調節することができる。一部の例では、コンピューターシステム２０１は、例えば、本明細書で開示される方法のいずれかに従って、核酸配列決定が含まれる、試料調製および試料分析を実施するように構成される。

コンピューターシステム２０１は、シングルコアもしくはマルチコアプロセッサー、または並行処理のための複数のプロセッサーであり得る、中央処理装置（ＣＰＵ、また、本明細書で「プロセッサー」および「コンピュータープロセッサー」）２０５を含む。コンピューターシステム２０１は、メモリまたはメモリロケーション２１０（例えば、ランダムアクセスメモリ、リードオンリーメモリ、フラッシュメモリ）、電子記憶装置２１５（例えば、ハードディスク）、１つまたは複数の他のシステムと通信するための通信インターフェース２２０（例えば、ネットワークアダプター）、ならびに周辺デバイス２２５、例えば、キャッシュ、他のメモリ、データ記憶および／または電子ディスプレイアダプターもまた含む。メモリ２１０、記憶装置２１５、インターフェース２２０および周辺デバイス２２５は、通信ネットワークまたはバス（実線）、例えば、マザーボードを介して、ＣＰＵ２０５と通信している。記憶装置２１５は、データを記憶するためのデータ記憶装置（またはデータリポジトリ）であり得る。コンピューターシステム２０１は、通信インターフェース２２０の助けによって、コンピューターネットワーク２３０に動作可能に連結され得る。コンピューターネットワーク２３０は、インターネット、インターネットおよび／もしくはエクストラネット、またはインターネットと通信したイントラネットおよび／もしくはエクストラネットであり得る。コンピューターネットワーク２３０は、一部の場合には、遠隔通信および／またはデータネットワークである。コンピューターネットワーク２３０は、分散コンピューティング、例えば、クラウドコンピューティングを可能にし得る、１つまたは複数のコンピューターサーバーを含み得る。コンピューターネットワーク２３０は、一部の場合には、コンピューターシステム０の助けにより、コンピューターシステム２０１に連結されたデバイスがクライアントまたはサーバーとして挙動するのを可能にし得るピアツーピアネットワークを実行することができる。

ＣＰＵ２０５は、プログラムまたはソフトウェアで具体化され得る機械可読命令のシーケンスを実行することができる。これらの命令は、メモリロケーション、例えば、メモリ２１０中に記憶され得る。ＣＰＵ２０５によって実行される演算の例としては、フェッチ、デコード、実行およびライトバックが挙げられ得る。

記憶装置２１５は、ファイル、例えば、ドライバー、ライブラリーおよび保存されたプログラムを記憶することができる。記憶装置２１５は、ユーザーによって生成されたプログラム、および記録されたセッション、ならびにプログラムに関連する出力を記憶することができる。記憶装置２１５は、ユーザーデータ、例えば、ユーザー選好およびユーザープログラムを記憶することができる。コンピューターシステム２０１は、一部の場合には、コンピューターシステム２０１に対して外部の、例えば、イントラネットまたはインターネットを介してコンピューターシステム２０１と通信したリモートサーバー上に位置する、１つまたは複数の追加のデータ記憶装置を含み得る。データは、例えば、通信ネットワークまたは物理的データ転送を使用して（例えば、ハードドライブ、サムドライブまたは他のデータ記憶機構を使用して）、１つの場所から別の場所へと転送され得る。

コンピューターシステム２０１は、ネットワーク２３０を介して、１つまたは複数のリモートコンピューターシステムと通信することができる。実施形態について、コンピューターシステム２０１は、ユーザー（例えば、オペレーター）のリモートコンピューターシステムと通信することができる。リモートコンピューターシステムの例としては、パーソナルコンピューター（例えば、携帯型ＰＣ）、スレートもしくはタブレットＰＣ（例えば、Ａｐｐｌｅ（登録商標）ｉＰａｄ（登録商標）、Ｓａｍｓｕｎｇ（登録商標）ＧａｌａｘｙＴａｂ）、電話、スマートフォン（例えば、Ａｐｐｌｅ（登録商標）ｉＰｈｏｎｅ（登録商標）、Ａｎｄｒｏｉｄ（登録商標）使用可能デバイス、Ｂｌａｃｋｂｅｒｒｙ（登録商標））、またはパーソナルデジタルアシスタントが挙げられる。ユーザーは、ネットワーク２３０を介してコンピューターシステム２０１にアクセスすることができる。

本明細書に記載される方法は、コンピューターシステム２０１の電子記憶場所上、例えば、メモリ２１０または電子記憶装置２１５などの上に記憶された機械（例えば、コンピュータープロセッサー）実行可能コードによって実行され得る。機械実行可能または機械可読コードは、ソフトウェアの形態で提供され得る。使用の間、コードは、プロセッサー２０５によって実行され得る。一部の場合には、コードは、記憶装置２１５から検索され得、プロセッサー２０５による即座のアクセスのために、メモリ２１０上に記憶され得る。一部の状況では、電子記憶装置２１５は除外され得、機械実行可能命令は、メモリ２１０上に記憶される。

ある態様では、本開示は、少なくとも１つの電子プロセッサーによって実行される場合に、試料を、試料のＤＮＡ中の第２のヌクレオベースとは異なるようにＤＮＡ中の第１のヌクレオベースに影響を与える手順に供するステップであって、第１のヌクレオベースが、改変されたまたは未改変のヌクレオベースであり、第２のヌクレオベースが、第１のヌクレオベースとは異なる改変されたまたは未改変のヌクレオベースであり、第１のヌクレオベースと第２のヌクレオベースとが、同じ塩基対合特異性を有する、ステップ；ＤＮＡを、ＤＮＡ中の改変されたヌクレオベースを認識する薬剤と接触させることによって、試料を複数の部分試料へと分配するステップであって、複数が、第１の部分試料および第２の部分試料を含み、第１の部分試料が、第２の部分試料よりも高い割合でシトシン改変を有するＤＮＡを含み、薬剤によって認識される改変されたヌクレオベースが、改変されたシトシン、または試料のＤＮＡ中の第２のヌクレオベースとは異なるようにＤＮＡ中の第１のヌクレオベースに影響を与える手順の産物である、ステップ；ならびに第１のヌクレオベースを第２のヌクレオベースから識別する様式で、第１および第２の部分試料のうち少なくとも一方中のＤＮＡを配列決定するステップ、を含む方法の少なくとも一部分を実行するコンピューター実行可能命令を含む、非一時的コンピューター可読媒体を提供する。

コードは、コードを実行するように適応させたプロセッサーを有する機械との使用のために事前コンパイルおよび構成され得、またはランタイムの間にコンパイルされ得る。コードは、事前コンパイルされたまたはアズコンパイルされた（ａｓ－ｃｏｍｐｉｌｅｄ）様式でコードを実行することを可能にするように選択され得るプログラム言語で提供され得る。

本明細書で提供される系および方法の態様、例えば、コンピューターシステム２０１は、プログラミングで具体化され得る。種々の態様の技術が、典型的には、ある型の機械可読媒体上で運搬されるまたはかかる機械可読媒体中で具体化される機械（またはプロセッサー）実行可能コードおよび／または関連のデータの形態の、「製品」または「製造品」と考えられ得る。機械実行可能コードは、電子記憶装置、例えば、メモリ（例えば、リードオンリーメモリ、ランダムアクセスメモリ、フラッシュメモリ）またはハードディスク上に記憶され得る。「記憶」型媒体には、ソフトウェアプログラミングのための非一時的記憶をいつでも提供し得る、コンピューター、プロセッサーなどの有形メモリのいずれかもしくは全て、またはその関連のモジュール、例えば、種々の半導体メモリ、テープドライブ、ディスクドライブなどが含まれ得る。

ソフトウェアの全てのまたは部分は、インターネットまたは種々の他の遠隔通信ネットワークを介して折々通信され得る。かかる通信は、例えば、１つのコンピューターまたはプロセッサーから別のコンピューターまたはプロセッサー中への、例えば、管理サーバーまたはホストコンピューターから、アプリケーションサーバーのコンピュータープラットフォーム中への、ソフトウェアのローディングを可能にし得る。したがって、ソフトウェアエレメントを保有し得る別の型の媒体には、ローカルデバイス間の物理的インターフェースを横断して、有線および光学固定電話回線ネットワークを介して、ならびに種々のエアリンク（ａｉｒ－ｌｉｎｋ）を通じて使用されるものなどの、光波、電波および電磁波が含まれる。かかる波を運搬する物理的エレメント、例えば、有線または無線リンク、光学リンクなどもまた、ソフトウェアを保有する媒体とみなされ得る。本明細書で使用される場合、非一時的な有形「記憶」媒体に限定されない限り、コンピューターまたは機械「可読媒体」などの用語は、実行のために命令をプロセッサーに提供することに関与する任意の媒体を指す。

したがって、機械可読媒体、例えば、コンピューター実行可能コードは、有形記憶媒体、搬送波媒体または物理的伝送媒体が含まれるがこれらに限定されない多くの形態を取り得る。非揮発性記憶媒体には、例えば、図面に示される、データベースを実行するためなどに使用され得る、例えば、光学または磁気ディスク、例えば、任意のコンピューターなど中の記憶デバイスのいずれかが含まれる。揮発性記憶媒体には、ダイナミックメモリ、例えば、かかるコンピュータープラットフォームのメインメモリが含まれる。有形伝送媒体には、同軸ケーブル；コンピューターシステム内のバスを含むワイヤが含まれる、銅ワイヤおよび光ファイバーが含まれる。搬送波伝送媒体は、電気もしくは電磁気シグナル、または音波もしくは光波、例えば、無線周波数（ＲＦ）および赤外線（ＩＲ）データ通信の間に生成されるものの形態を取り得る。したがって、コンピューター可読媒体の一般的形態には、例えば、フロッピー（登録商標）ディスク、フレキシブルディスク、ハードディスク、磁気テープ、任意の他の磁気媒体、ＣＤ－ＲＯＭ、ＤＶＤもしくはＤＶＤ－ＲＯＭ、任意の他の光学媒体、パンチカード、紙テープ、穴のパターンを有する任意の他の物理的記憶媒体、ＲＡＭ、ＲＯＭ、ＰＲＯＭおよびＥＰＲＯＭ、ＦＬＡＳＨ（登録商標）－ＥＰＲＯＭ、任意の他のメモリチップもしくはカートリッジ、データもしくは命令を運ぶ搬送波、かかる搬送波を運ぶケーブルもしくはリンク、またはコンピューターがそこからプログラミングコードおよび／もしくはデータを読み取り得る任意の他の媒体が含まれる。コンピューター可読媒体のこれらの形態の多くは、１つまたは複数の命令の１つまたは複数のシーケンスを実行のためにプロセッサーに運搬することに関与し得る。

コンピューターシステム２０１は、例えば、試料分析の１つまたは複数の結果を提供するためのユーザーインターフェース（ＵＩ）を含む電子ディスプレイを含み得る、またはそれと通信し得る。ＵＩの例としては、これらに限定されないが、グラフィカルユーザーインターフェース（ＧＵＩ）およびウェブベースのユーザーインターフェースが挙げられる。

コンピューターシステムおよびネットワーク、データベース、ならびにコンピュータープログラム製品に関する追加の詳細は、例えば、Peterson, Computer Networks: A Systems Approach, Morgan Kaufmann, 5th Ed. (2011)、Kurose, Computer Networking: A Top-Down Approach, Pearson, 7^th Ed. (2016)、Elmasri, Fundamentals of Database Systems, Addison Wesley, 6th Ed. (2010)、Coronel, Database Systems: Design, Implementation, & Management, Cengage Learning, 11^th Ed. (2014)、Tucker, Programming Languages, McGraw-Hill Science/Engineering/Math, 2nd Ed. (2006)およびRhoton, Cloud Computing Architected: Solution Design Handbook, Recursive Press (2011)中にも提供され、これらは各々、その全体がこれにより参照により本明細書に組み込まれる。
Ｇ．適用
１．がんおよび他の疾患

一部の実施形態では、本明細書で開示される方法および系は、体細胞または生殖系列起源であるという核酸バリアントの分類に基づいて、患者において所与の疾患または状態を処置するためのカスタマイズされたまたは標的化された治療を同定するために使用され得る。典型的には、考慮される疾患は、ある型のがんである。かかるがんの非限定的な例としては、胆道がん、膀胱がん、移行上皮癌、尿路上皮癌、脳がん、神経膠腫、星細胞腫、乳房癌、化生癌、子宮頸がん、子宮頸扁平上皮癌、直腸がん、結腸直腸癌、結腸がん、遺伝性非ポリポーシス結腸直腸がん、結腸直腸腺癌、消化管間質腫瘍（ＧＩＳＴ）、子宮内膜癌、子宮内膜間質肉腫、食道がん、食道扁平上皮癌、食道腺癌、眼黒色腫、ブドウ膜黒色腫、胆嚢癌、胆嚢腺癌、腎細胞癌、淡明細胞型腎細胞癌、移行上皮癌、尿路上皮癌、ウィルムス腫瘍、白血病、急性リンパ球性白血病（ＡＬＬ）、急性骨髄性白血病（ＡＭＬ）、慢性リンパ球性白血病（ＣＬＬ）、慢性骨髄性白血病（ＣＭＬ）、慢性骨髄単球性白血病（ＣＭＭＬ）、肝臓がん、肝臓癌、ヘパトーマ、肝細胞癌、胆管細胞癌、肝芽腫、肺がん、非小細胞肺がん（ＮＳＣＬＣ）、中皮腫、Ｂ細胞リンパ腫、非ホジキンリンパ腫、びまん性大細胞型Ｂ細胞リンパ腫、マントル細胞リンパ腫、Ｔ細胞リンパ腫、非ホジキンリンパ腫、前駆Ｔリンパ芽球性リンパ腫／白血病、末梢性Ｔ細胞リンパ腫、多発性骨髄腫、鼻咽頭癌（ＮＰＣ）、神経芽腫、中咽頭がん、口腔扁平上皮癌、骨肉腫、卵巣癌、膵がん、膵管腺癌、偽乳頭状新生物、腺房細胞癌、前立腺がん、前立腺腺癌、皮膚がん、黒色腫、悪性黒色腫、皮膚黒色腫、小腸癌、胃がん、胃癌、消化管間質腫瘍（ＧＩＳＴ）、子宮がんまたは子宮肉腫が挙げられる。がんの型および／またはステージは、突然変異、稀な突然変異、インデル、コピー数バリエーション、トランスバージョン、転座、逆位、欠失、異数性、部分的異数性、倍数性、染色体不安定性、染色体構造変更、遺伝子融合、染色体融合、遺伝子トランケーション、遺伝子増幅、遺伝子重複、染色体損傷、ＤＮＡ損傷、核酸の化学改変における異常な変化、エピジェネティックパターンにおける異常な変化、および核酸の５－メチルシトシンにおける異常な変化が含まれる遺伝子バリエーションから検出され得る。

本明細書で開示される方法および系を使用して必要に応じて評価される他の遺伝子ベースの疾患、障害または状態の非限定的な例としては、軟骨無形成症、アルファ１アンチトリプシン欠損症、抗リン脂質抗体症候群、自閉症、常染色体優性多発性嚢胞腎、シャルコー・マリー・トゥース（ＣＭＴ）、ネコ鳴き、クローン病、嚢胞性線維症、ダーカム病、ダウン症候群、デュアン症候群、デュシェンヌ型筋ジストロフィー、第Ｖ因子ライデン血栓性素因、家族性高コレステロール血症、家族性地中海熱、脆弱Ｘ症候群、ゴーシェ病、ヘモクロマトーシス、血友病、全前脳胞症、ハンチントン病、クラインフェルター症候群、マルファン症候群、筋強直性ジストロフィー、神経線維腫症、ヌーナン症候群、骨形成不全症、パーキンソン病、フェニルケトン尿症、ポーランド異常（Ｐｏｌａｎｄａｎｏｍａｌｙ）、ポルフィリン症、早老症、網膜色素変性、重症複合免疫不全症（ＳＣＩＤ）、鎌状赤血球症、脊髄性筋萎縮症、テイ・サックス、サラセミア、トリメチルアミン尿症、ターナー症候群、口蓋心臓顔面症候群、ＷＡＧＲ症候群、ウィルソン病などが挙げられる。

一部の実施形態では、本明細書に記載される方法は、本明細書に記載されるように得られた配列情報のセットを使用して、がんと以前に診断された対象の以前のがん処置の後の予め選択された時点における、腫瘍細胞に起源するまたはそれに由来するＤＮＡの存在または非存在を検出するステップを含む。この方法は、試験対象について、腫瘍細胞に起源するまたはそれに由来するＤＮＡの存在または非存在を示すがん再発スコアを決定するステップをさらに含み得る。

がん再発スコアが決定される場合、それは、がん再発ステータスを決定するためにさらに使用され得る。がん再発ステータスは、例えば、がん再発スコアが所定の閾値を上回る場合には、がん再発のリスク状態にあり得る。がん再発ステータスは、例えば、がん再発スコアが所定の閾値を上回る場合には、がん再発の低いまたはより低いリスク状態にあり得る。特定の実施形態では、所定の閾値と等しいがん再発スコアは、がん再発のリスク状態にあるかまたはがん再発の低いもしくはより低いリスク状態にあるかのいずれかの、がん再発ステータスを生じ得る。

一部の実施形態では、がん再発スコアは、所定のがん再発閾値と比較され、試験対象が、がん再発スコアががん再発閾値を上回る場合には、引き続くがん処置のための候補として分類される、またはがん再発スコアががん再発閾値を下回る場合には、治療のための候補として分類されない。特定の実施形態では、がん再発閾値と等しいがん再発スコアは、引き続くがん処置のための候補としての分類または治療のための候補でないとしての分類のいずれかを生じ得る。

上で議論した方法は、試験対象におけるがん再発のリスクを決定する方法および／または試験対象を引き続くがん処置のための候補として分類する方法に関するセクション中が含まれる、本明細書の他の場所に示された任意の適合性の特色（単数または複数）をさらに含み得る。
２．試験対象におけるがん再発のリスクを決定する方法および／または試験対象を引き続くがん処置のための候補として分類する方法

一部の実施形態では、本明細書で提供される方法は、試験対象におけるがん再発のリスクを決定する方法である。一部の実施形態では、本明細書で提供される方法は、試験対象を引き続くがん処置のための候補として分類する方法である。

かかる方法のいずれかは、試験対象への１つまたは複数の以前のがん処置の後の１つまたは複数の予め選択された時点において、がんと診断された試験対象からＤＮＡ（例えば、腫瘍細胞に起源するまたはそれに由来する）を収集するステップを含み得る。対象は、本明細書に記載される対象のいずれかであり得る。ＤＮＡは、ｃｆＤＮＡであり得る。ＤＮＡは、組織試料から得られ得る。

かかる方法のいずれかは、対象由来のＤＮＡから、標的領域の複数のセットを捕捉するステップを含み得、複数の標的領域セットは、配列可変標的領域セットおよびエピジェネティック標的領域セットを含み、それによって、ＤＮＡ分子の捕捉されたセットが生産される。捕捉するステップは、本明細書の他の場所に記載される実施形態のいずれかに従って実施され得る。

かかる方法のいずれかでは、以前のがん処置は、手術、治療的組成物の投与、および／または化学療法を含み得る。

かかる方法のいずれかは、捕捉されたＤＮＡ分子を配列決定するステップを含み、それによって、配列情報のセットが生産される。配列可変標的領域セットの捕捉されたＤＮＡ分子は、エピジェネティック標的領域セットの捕捉されたＤＮＡ分子よりも深い配列決定の深度まで配列決定され得る。

かかる方法のいずれかは、配列情報のセットを使用して、予め選択された時点における、腫瘍細胞に起源するまたはそれに由来するＤＮＡの存在または非存在を検出するステップを含み得る。腫瘍細胞に起源するまたはそれに由来するＤＮＡの存在または非存在の検出は、本明細書の他の場所に記載されるその実施形態のいずれかに従って実施され得る。

試験対象におけるがん再発のリスクを決定する方法は、試験対象について、腫瘍細胞に起源するまたはそれに由来するＤＮＡの存在もしくは非存在または量を示すがん再発スコアを決定するステップを含み得る。がん再発スコアは、がん再発ステータスを決定するためにさらに使用され得る。がん再発ステータスは、例えば、がん再発スコアが所定の閾値を上回る場合には、がん再発のリスク状態にあり得る。がん再発ステータスは、例えば、がん再発スコアが所定の閾値を上回る場合には、がん再発の低いまたはより低いリスク状態にあり得る。特定の実施形態では、所定の閾値と等しいがん再発スコアは、がん再発のリスク状態にあるかまたはがん再発の低いもしくはより低いリスク状態にあるかのいずれかの、がん再発ステータスを生じ得る。

試験対象を引き続くがん処置のための候補として分類する方法は、試験対象のがん再発スコアを、所定のがん再発閾値と比較するステップを含み得、それによって、試験対象が、がん再発スコアががん再発閾値を上回る場合には、引き続くがん処置のための候補として分類される、またはがん再発スコアががん再発閾値を下回る場合には、治療のための候補として分類されない。特定の実施形態では、がん再発閾値と等しいがん再発スコアは、引き続くがん処置のための候補としての分類または治療のための候補でないとしての分類のいずれかを生じ得る。一部の実施形態では、引き続くがん処置は、化学療法、または治療的組成物の投与を含む。

かかる方法のいずれかは、がん再発スコアに基づいて、試験対象について無病生存（ＤＦＳ）期間を決定するステップを含み得る；例えば、ＤＦＳ期間は、１年間、２年間、３年間、４年間、５年間または１０年間であり得る。

一部の実施形態では、配列情報のセットは、配列可変標的領域配列を含み、がん再発スコアを決定するステップは、配列可変標的領域配列中に存在するＳＮＶ、挿入／欠失、ＣＮＶおよび／または融合の量を示す少なくとも第１のサブスコアを決定するステップを含み得る。

一部の実施形態では、１、２、３、４または５から選択される配列可変標的領域中の突然変異の数が、第１のサブスコアが、がん再発について陽性と分類されるがん再発スコアを生じるのに十分である。一部の実施形態では、突然変異の数は、１、２または３から選択される。

一部の実施形態では、配列情報のセットは、エピジェネティック標的領域配列を含み、がん再発スコアを決定するステップは、健康な対象由来の対応する試料中で見出されるＤＮＡ（例えば、健康な対象由来の血液試料中で見出されるｃｆＤＮＡ、または組織試料が、試験対象から得られたものと同じ型の組織である場合には、健康な対象由来の組織試料において見出されるＤＮＡ）とは異なるエピジェネティック状態を示す分子（エピジェネティック標的領域配列から得られた）の量を示す第２のサブスコアを決定するステップを含む。これらの異常な分子（すなわち、健康な対象由来の対応する試料中で見出されるＤＮＡとは異なるエピジェネティック状態を有する分子）は、がんに関連するエピジェネティック変化、例えば、高メチル化可変標的領域のメチル化および／または断片化可変標的領域の乱れた断片化と一致し得、ここで、「乱れた」とは、健康な対象由来の対応する試料中で見出されるＤＮＡとは異なることを意味する。

一部の実施形態では、０．００１％～１０％の範囲内の値よりも大きいまたはそれと等しい、高メチル化可変標的領域セット中の高メチル化および／または断片化可変標的領域セット中の異常な断片化を示す高メチル化可変標的領域セットおよび／または断片化可変標的領域セットに対応する分子の割合が、第２のサブスコアががん再発について陽性と分類されるのに十分である。この範囲は、０．００１％～１％、０．００５％～１％、０．０１％～５％、０．０１％～２％または０．０１％～１％であり得る。

一部の実施形態では、かかる方法のいずれかは、腫瘍細胞由来の起源を示す１つまたは複数の特色を示す配列情報のセット中の分子の画分から、腫瘍ＤＮＡの分率を決定するステップを含み得る。これは、例えば、高メチル化可変標的領域および断片化可変標的領域のうち一方または両方が含まれるエピジェネティック標的領域の一部または全てに対応する分子のために実施され得る（高メチル化可変標的領域の高メチル化および／または断片化可変標的領域の異常な断片化は、腫瘍細胞由来の起源を示すとみなされ得る）。これは、配列可変標的領域に対応する分子、例えば、がんと一致する変更、例えば、ＳＮＶ、インデル、ＣＮＶおよび／または融合を含む分子のために実施され得る。腫瘍ＤＮＡの分率は、エピジェネティック標的領域に対応する分子と配列可変標的領域に対応する分子との組合せに基づいて決定され得る。

がん再発スコアの決定は、腫瘍ＤＮＡの分率に少なくとも一部基づき得、１０^－１１～１または１０^－１０～１の範囲内の閾値よりも大きい腫瘍ＤＮＡの分率が、がん再発スコアががん再発について陽性と分類されるのに十分である。一部の実施形態では、１０^－１０～１０^－９、１０^－９～１０^－８、１０^－８～１０^－７、１０^－７～１０^－６、１０^－６～１０^－５、１０^－５～１０^－４、１０^－４～１０^－３、１０^－３～１０^－２または１０^－２～１０^－１の範囲内の閾値よりも大きいまたはそれと等しい腫瘍ＤＮＡの分率が、がん再発スコアががん再発について陽性と分類されるのに十分である。一部の実施形態では、少なくとも１０^－７の閾値よりも大きい腫瘍ＤＮＡの分率が、がん再発スコアががん再発について陽性と分類されるのに十分である。腫瘍ＤＮＡの分率が、閾値、例えば、上述の実施形態のいずれかに対応する閾値よりも大きいという決定は、累積確率に基づいてなされ得る。例えば、試料は、腫瘍分率が上述の範囲のいずれか内の閾値よりも大きかった累積確率が、少なくとも０．５、０．７５、０．９、０．９５、０．９８、０．９９、０．９９５または０．９９９の確率閾値を超える場合、陽性とみなされた。一部の実施形態では、確率閾値は、少なくとも０．９５、例えば、０．９９である。

一部の実施形態では、配列情報のセットは、配列可変標的領域配列およびエピジェネティック標的領域配列を含み、がん再発スコアを決定するステップは、配列可変標的領域配列中に存在するＳＮＶ、挿入／欠失、ＣＮＶおよび／または融合の量を示す第１のサブスコア、ならびにエピジェネティック標的領域配列中の異常な分子の量を示す第２のサブスコアを決定するステップ、ならびに第１および第２のサブスコアを組み合わせて、がん再発スコアを提供するステップを含む。第１および第２のサブスコアが組み合わされる場合、これらは、閾値（例えば、配列可変標的領域では、突然変異の所定の数よりも大きい（例えば、＞１）、およびエピジェネティック標的領域では、異常な分子（すなわち、健康な対象由来の対応する試料中で見出されるＤＮＡとは異なるエピジェネティック状態を有する分子；例えば、腫瘍）の所定の分率よりも大きい）を各サブスコアに独立して適用すること、または複数の陽性および陰性トレーニングサンプルに基づいてステータスを決定するために機械学習分類子をトレーニングすることによって、組み合わされ得る。

一部の実施形態では、－４～２または－３～１の範囲の、組み合わされたスコアについての値が、がん再発スコアががん再発について陽性と分類されるのに十分である。

がん再発スコアががん再発について陽性と分類される任意の実施形態では、対象のがん再発ステータスは、がん再発のリスク状態にあり得、および／または対象は、引き続くがん処置のための候補として分類され得る。

一部の実施形態では、がんは、本明細書の他の場所に記載されるがんの型のうちいずれか１つ、例えば、結腸直腸がんである。
３．治療および関連の投与

ある特定の実施形態では、本明細書で開示される方法は、体細胞または生殖系列起源であるという核酸バリアントのステータスが与えられた患者を同定し、カスタマイズされた治療をかかる患者に投与することに関する。一部の実施形態では、本質的に任意のがん治療（例えば、外科的治療、放射線治療、化学療法など）が、これらの方法の一部として含まれ得る。典型的には、カスタマイズされた治療は、少なくとも１つの免疫療法（または免疫療法剤）を含む。免疫療法は、所与のがん型に対する免疫応答を増強する方法を一般に指す。ある特定の実施形態では、免疫療法は、腫瘍またはがんに対するＴ細胞応答を増強する方法を指す。

ある特定の実施形態では、体細胞または生殖系列起源であるという、対象由来の試料からの核酸バリアントのステータスは、その対象のためのカスタマイズされたまたは標的化された治療を同定するために、参照集団からの比較対象結果のデータベースと比較され得る。典型的には、参照集団は、試験対象と同じがんもしくは疾患型を有する患者および／または試験対象と同じ治療を受けているもしくは受けたことがある患者を含む。カスタマイズされたまたは標的化された治療（単数または複数）は、核バリアントおよび比較対象結果がある特定の分類基準を満たす（例えば、実質的なまたは近似のマッチである）場合に、同定され得る。

ある特定の実施形態では、本明細書に記載されるカスタマイズされた治療は、典型的には、非経口（例えば、静脈内または皮下）投与される。免疫療法剤を含有する医薬組成物は、典型的には、静脈内投与される。ある特定の治療剤は、経口投与される。しかし、カスタマイズされた治療（例えば、免疫療法剤など）は、例えば、頬側、舌下、直腸、膣、尿道内、外用、眼内、鼻腔内および／または耳介内（ｉｎｔｒａａｕｒｉｃｕｌａｒ）などの方法によっても投与され得、その投与には、錠剤、カプセル剤、顆粒剤、水性懸濁物、ゲル剤、スプレー剤、坐剤、膏薬、軟膏などが含まれ得る。

本発明の好ましい実施形態が、本明細書に示され記載されてきたが、かかる実施形態が例のみとして提供されていることは、当業者に明らかである。本発明は、本明細書内に提供される具体的な例によって限定されない意図である。本発明は、上述の明細書を参照して記載されてきたが、本明細書の実施形態の記載および例示は、限定の意味で解釈されることを意味しない。多数のバリエーション、変化および置換が、本発明から逸脱することなしに、当業者にここで想起される。さらに、本発明の全ての態様は、種々の条件および変数に依存する本明細書に示される具体的な描写にも構成にも相対的割合にも限定されないことを理解すべきである。本明細書に記載される本開示の実施形態に対する種々の代替法が、本発明を実施する際に用いられ得ることを理解すべきである。したがって、本開示が、任意のかかる代替法、改変、バリエーションまたは等価物もまた当然カバーすることが企図される。以下の特許請求の範囲が、本発明の範囲を規定すること、ならびにこれらの特許請求の範囲内の方法および構造ならびにそれらの等価物がそれによってカバーされることが意図される。

上述の開示は、明確さおよび理解を目的とした例示および例として、いくらか詳細に記載されてきたが、形式上の、および詳細な種々の変化が、本開示の真の範囲から逸脱することなしになされ得、添付の特許請求の範囲内で実施され得ることは、本開示を読めば、当業者に明らかである。例えば、全ての方法、系、コンピューター可読媒体、および／もしくは構成要素特色、ステップ、要素、またはそれらの他の態様は、種々の組合せで使用され得る。
ＩＶ．キット

本明細書に記載される組成物を含むキットもまた提供される。キットは、本明細書に記載される方法を実施する際に有用であり得る。一部の実施形態では、キットは、複数の試料を、ＤＮＡ中の第２のヌクレオベースとは異なるようにＤＮＡ中の第１のヌクレオベースに影響を与える手順に供するための第１の試薬（例えば、ヌクレオベース、例えば、シトシンまたはメチル化されたシトシンを異なるヌクレオベースに変換するための、本明細書の他の場所に記載される試薬のいずれか）を含み、第１のヌクレオベースは、改変されたまたは未改変のヌクレオベースであり、第２のヌクレオベースは、第１のヌクレオベースとは異なる改変されたまたは未改変のヌクレオベースであり、第１のヌクレオベースと第２のヌクレオベースとは、同じ塩基対合特異性を有する。一部の実施形態では、キットは、各試料を、本明細書に記載されるように、複数の部分試料へと分配するための第２の試薬、例えば、本明細書の他の場所に記載される分配試薬のいずれかを含む。一部の実施形態では、各試料を分配するための試薬は、ＤＮＡ中の改変されたヌクレオベースを認識する薬剤である。一部の実施形態では、ＤＮＡ中の改変されたヌクレオベースを認識する薬剤は、抗体である。一部の実施形態では、改変されたヌクレオベースは、改変されたシトシン、例えば、メチルシトシンである。一部の実施形態では、ＤＮＡ中の改変されたヌクレオベースを認識する薬剤は、ＤＮＡ中のメチルシトシンに特異的な抗体である。キットは、以下および／または本明細書の他の場所で議論されるように、第１および第２の試薬ならびに追加の要素を含み得る。一部の実施形態では、キットは、本明細書に記載される方法を実施するための使用説明書を含む。

キットは、ＡＬＫ、ＡＰＣ、ＢＲＡＦ、ＣＤＫＮ２Ａ、ＥＧＦＲ、ＥＲＢＢ２、ＦＢＸＷ７、ＫＲＡＳ、ＭＹＣ、ＮＯＴＣＨ１、ＮＲＡＳ、ＰＩＫ３ＣＡ、ＰＴＥＮ、ＲＢＩ、ＴＰ５３、ＭＥＴ、ＡＲ、ＡＢＬ１、ＡＫＴ１、ＡＴＭ、ＣＤＨ１、ＣＳＦＩＲ、ＣＴＮＮＢ１、ＥＲＢＢ４、ＥＺＨ２、ＦＧＦＲ１、ＦＧＦＲ２、ＦＧＦＲ３、ＦＬＴ３、ＧＮＡ１１、ＧＮＡＱ、ＧＮＡＳ、ＨＮＦ１Ａ、ＨＲＡＳ、ＩＤＨ１、ＩＤＨ２、ＪＡＫ２、ＪＡＫ３、ＫＤＲ、ＫＩＴ、ＭＬＨ１、ＭＰＬ、ＮＰＭ１、ＰＤＧＦＲＡ、ＰＲＯＣ、ＰＴＰＮ１１、ＲＥＴ、ＳＭＡＤ４、ＳＭＡＲＣＢ１、ＳＭＯ、ＳＲＣ、ＳＴＫ１１、ＶＨＬ、ＴＥＲＴ、ＣＣＮＤ１、ＣＤＫ４、ＣＤＫＮ２Ｂ、ＲＡＦ１、ＢＲＣＡ１、ＣＣＮＤ２、ＣＤＫ６、ＮＦ１、ＴＰ５３、ＡＲＩＤ１Ａ、ＢＲＣＡ２、ＣＣＮＥ１、ＥＳＲ１、ＲＩＴ１、ＧＡＴＡ３、ＭＡＰ２Ｋ１、ＲＨＥＢ、ＲＯＳ１、ＡＲＡＦ、ＭＡＰ２Ｋ２、ＮＦＥ２Ｌ２、ＲＨＯＡおよびＮＴＲＫ１からなる群から選択される少なくとも５、６、７、８、９、１０、２０、３０、４０個または全ての遺伝子に選択的にハイブリダイズする複数のオリゴヌクレオチドプローブをさらに含み得る。オリゴヌクレオチドプローブが選択的にハイブリダイズすることができる遺伝子の数は、変動し得る。例えば、遺伝子の数は、１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、５０、５１、５２、５３または５４を含み得る。キットは、複数のオリゴヌクレオチドプローブを含むコンテナと、本明細書に記載される方法のいずれかを実施するための使用説明書とを含み得る。

オリゴヌクレオチドプローブは、遺伝子の、例えば、少なくとも５つの遺伝子のエクソン領域に、選択的にハイブリダイズすることができる。一部の場合には、オリゴヌクレオチドプローブは、遺伝子の、例えば、少なくとも５つの遺伝子の少なくとも３０個のエクソンに、選択的にハイブリダイズすることができる。一部の場合には、複数のプローブは、少なくとも３０個のエクソンの各々に選択的にハイブリダイズすることができる。各エクソンにハイブリダイズするプローブは、少なくとも１つの他のプローブと重複する配列を有し得る。一部の実施形態では、オリゴプローブは、本明細書で開示される遺伝子の非コード領域、例えば、遺伝子のイントロン領域に、選択的にハイブリダイズすることができる。オリゴプローブは、本明細書で開示される遺伝子のエクソン領域およびイントロン領域の両方を含む遺伝子の領域にも、選択的にハイブリダイズすることができる。

任意の数のエクソンが、オリゴヌクレオチドプローブによって標的化され得る。例えば、少なくとも１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、３０、３５、４０、４５、５０、５５、６０、６５、７０、７５、８０、８５、９０、９５、１００、１０５、１１０、１１５、１２０、１２５、１３０、１３５、１４０、１４５、１５０、１５５、１６０、１６５、１７０、１７５、１８０、１８５、１９０、１９５、２００、２０５、２１０、２１５、２２０、２２５、２３０、２３５、２４０、２４５、２５０、２５５、２６０、２６５、２７０、２７５、２８０、２８５、２９０、２９５、３００、４００、５００、６００、７００、８００、９００、１，０００個またはそれよりも多くのエクソンが、標的化され得る。

キットは、別個の分子バーコードおよび同一の試料バーコードを有する少なくとも４、５、６、７または８つの異なるライブラリーアダプターを含み得る。ライブラリーアダプターは、配列決定アダプターでなくてもよい。例えば、ライブラリーアダプターは、フローセル配列も、配列決定のためのヘアピンループの形成を可能にする配列も含まない。分子バーコードおよび試料バーコードの異なるバリエーションおよび組合せが、全体を通じて記載され、キットに適用可能である。さらに、一部の場合には、アダプターは、配列決定アダプターではない。さらに、キットで提供されるアダプターは、配列決定アダプターもまた含み得る。配列決定アダプターは、１つまたは複数の配列決定プライマーにハイブリダイズする配列を含み得る。配列決定アダプターは、固体支持体にハイブリダイズする配列、例えば、フローセル配列をさらに含み得る。例えば、配列決定アダプターは、フローセルアダプターであり得る。配列決定アダプターは、ポリヌクレオチド断片の一方または両方の末端に結合され得る。一部の場合には、キットは、別個の分子バーコードおよび同一の試料バーコードを有する少なくとも８つの異なるライブラリーアダプターを含み得る。ライブラリーアダプターは、配列決定アダプターでなくてもよい。キットは、ライブラリーアダプターに選択的にハイブリダイズする第１の配列およびフローセル配列に選択的にハイブリダイズする第２の配列を有する配列決定アダプターをさらに含み得る。別の例では、配列決定アダプターは、ヘアピン型であり得る。例えば、ヘアピン型アダプターは、相補的二本鎖部分およびループ部分を含み得、二本鎖部分は、二本鎖ポリヌクレオチドに結合｛例えば、ライゲーション）され得る。ヘアピン型配列決定アダプターは、複数回配列決定され得る環状分子を生成するために、ポリヌクレオチド断片の両方の末端に結合され得る。配列決定アダプターは、末端から末端まで、最大で１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、５０、５１、５２、５３、５４、５５、５６、５７、５８、５９、６０、６１、６２、６３、６４、６５、６６、６７、６８、６９、７０、７１、７２、７３、７４、７５、７６、７７、７８、７９、８０、８１、８２、８３、８４、８５、８６、８７、８８、８９、９０、９１、９２、９３、９４、９５、９６、９７、９８、９９、１００またはそれよりも多くの塩基であり得る。配列決定アダプターは、末端から末端まで、２０～３０、２０～４０、３０～５０、３０～６０、４０～６０、４０～７０、５０～６０、５０～７０塩基を含み得る。特定の例では、配列決定アダプターは、末端から末端まで、２０～３０塩基を含み得る。別の例では、配列決定アダプターは、末端から末端まで、５０～６０塩基を含み得る。配列決定アダプターは、１つまたは複数のバーコードを含み得る。例えば、配列決定アダプターは、試料バーコードを含み得る。試料バーコードは、所定の配列を含み得る。試料バーコードは、ポリヌクレオチドの供給源を同定するために使用され得る。試料バーコードは、少なくとも１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５またはそれよりも多くの（または全体を通じて記載されるような任意の長さの）核酸塩基、例えば、少なくとも８塩基であり得る。バーコードは、上記のように、連続または非連続配列であり得る。

ライブラリーアダプターは、平滑末端化されＹ型であり得、長さが４０核酸塩基よりも短いまたはそれと等しいことができる。その他のバリエーションは、全体を通じて見出され得、キットに適用可能である。

本明細書で引用される全ての特許、特許出願、ウェブサイト、他の刊行物または文書、受託番号などは、各個々の項目がそのように参照により組み込まれると具体的かつ個々に示されたのと同じ程度まで、全ての目的のためにその全体が参照により組み込まれる。異なるバージョンの配列が異なる時点において１つの受託番号に関連する場合、本出願の有効出願日の時点でその受託番号に関連するバージョンを意味する。有効出願日とは、該当する場合、実際の出願日、またはその受託番号に言及する優先出願の出願日のいずれか早い方を意味する。同様に、異なるバージョンの刊行物、ウェブサイトなどが異なる時点において公開されている場合、他に示さない限り、本出願の有効出願日の時点で最も新しく公開されたバージョンを意味する。

（実施例１）
対象における腫瘍の存在／非存在を検出するためのｃｆＤＮＡの分析
患者試料のセットを、ＧｕａｒｄａｎｔＨｅａｌｔｈ（ＲｅｄｗｏｏｄＣｉｔｙ、ＣＡ、ＵＳＡ）において血液ベースのＮＧＳアッセイによって分析して、がんの存在／非存在を検出する。ｃｆＤＮＡを、これらの患者の血漿から抽出する。次いで、患者試料のｃｆＤＮＡを、２つのヌクレオベースが、バイサルファイト変換などの手順の後に異なる塩基対合特異性を有するように、ＤＮＡ中の、異なってはいるが、同じ塩基対合特異性を有する２つのヌクレオベースに異なるように影響を与える手段に供する。次いで、患者試料のｃｆＤＮＡを、メチルシトシンに特異的な抗体と組み合わせる。プロテインＧにコンジュゲートした磁気ビーズを使用して、抗体およびそれに結合したＤＮＡを免疫沈降させ、そうして、高メチル化されたＤＮＡを低メチル化されたＤＮＡから分配する。任意の非メチル化ＤＮＡまたはあまりメチル化されていないＤＮＡを、漸増濃度の塩を含有する緩衝液を用いて、ビーズから洗浄して除く。最後に、高塩緩衝液を使用して、強くメチル化されたＤＮＡを、メチルシトシンに特異的な抗体から洗浄して除く。未結合のＤＮＡおよびこれらの洗浄は、漸増的にメチル化されたｃｆＤＮＡの少なくとも３つの分配（低メチル化された、残留メチル化および高メチル化された分配）を生じる。分配中のｃｆＤＮＡ分子を浄化して塩を除去し、ライブラリー調製の酵素的ステップのために調製物中で濃縮する。

分配中のｃｆＤＮＡを濃縮した後、第１のアダプターを、その３’末端へのライゲーションによって、ｃｆＤＮＡに付加する。アダプターを、ユニバーサルプライマーおよびＤＮＡポリメラーゼを使用する第２鎖合成のためのプライミング部位として使用する。第１のアダプターは、ビオチンを含み、第１のアダプターにライゲーションされた核酸を、ストレプトアビジンを含むビーズに結合させる。次いで、第２のアダプターを、今度は二本鎖分子の第２鎖の３’末端にライゲーションさせる。これらのアダプターは、非独自の分子バーコードを含有し、各分配を、他の分配において使用されるアダプター中のバーコードから識別可能な非独自の分子バーコードを有するアダプターとライゲーションさせる。ライゲーションの後、分配を一緒にプールし、ＰＣＲによって増幅する。

ＰＣＲの後、増幅されたＤＮＡを、富化前に洗浄し、濃縮する。濃縮したら、増幅されたＤＮＡを、塩緩衝液、ならびに配列可変標的領域セットに対するプローブおよびエピジェネティック標的領域セットに対するプローブを含むビオチン化されたＲＮＡプローブと組み合わせ、この混合物を一晩インキュベートする。配列可変領域セットに対するプローブは、約５０ｋｂのフットプリントを有し、エピジェネティック標的領域セットに対するプローブは、約５００ｋｂのフットプリントを有する。配列可変標的領域セットに対するプローブは、表３～５で同定された遺伝子の少なくともサブセットを標的化するオリゴヌクレオチドを含み、エピジェネティック標的領域セットに対するプローブは、高メチル化可変標的領域、低メチル化可変標的領域、ＣＴＣＦ結合標的領域、転写開始部位標的領域、限局的増幅標的領域およびメチル化対照領域の選択を標的化するオリゴヌクレオチドを含む。

ビオチン化されたＲＮＡプローブ（ＤＮＡにハイブリダイズした）を、ストレプトアビジン磁気ビーズによって捕捉し、一連の塩ベースの洗浄によって、捕捉されていない増幅されたＤＮＡから分離し、それによって、試料を富化する。富化の後、富化された試料のアリコートを、ＩｌｌｕｍｉｎａＮｏｖａＳｅｑシーケンサーを使用して配列決定する。次いで、シーケンサーによって生成された配列読み取りを、バイオインフォマティクスのツール／アルゴリズムを使用して分析する。独自の分子を同定するため、ならびに差次的に分配された分子への試料のデコンボリューションのために、分子バーコードを使用する。この実施例に記載される方法は、その分配に基づいて分子のメチル化（すなわち、メチル化されたシトシン残基）の全体的レベルについての情報を提供することとは別に、メチル化されたシトシンの正体および／またはその型の位置についてのより高い解像度の情報を提供することもできる。配列可変標的領域配列を、実在の腫瘍バリアントを技術的エラー（例えば、ＰＣＲエラー、配列決定エラー）から差別化する十分なサポートを伴ってコールされ得るゲノム変更、例えば、ＳＮＶ、挿入、欠失および融合を検出することによって分析する。エピジェネティック標的領域配列を独立して分析して、正常細胞と比較してがんにおいて差次的にメチル化されることが示された領域においてメチル化されたｃｆＤＮＡ分子を検出する。最後に、両方の分析の結果を組み合わせて、最終的な腫瘍の存在／非存在コールを生成する。
（実施例２）
健康な対象および初期ステージの結腸直腸がんを有する対象由来のｃｆＤＮＡ試料における単一ヌクレオチド解像度でのメチル化の分析

健康な対象および初期ステージの結腸直腸がんを有する対象由来のｃｆＤＮＡの試料を、以下のように分析する。次いで、対象試料のｃｆＤＮＡを、２つのヌクレオベースが、改変されたＥＭ－ｓｅｑ変換手順などの手順の後に異なる塩基対合特異性を有するように、ＤＮＡ中の、異なってはいるが、同じ塩基対合特異性を有する２つのヌクレオベースに異なるように影響を与える手段に供し、それによって、ｍＣおよびｈｍＣではなく未改変のシトシンが、脱アミノ化を受ける。特に、Ｔｅｔ２酸化を使用して、５ｍＣおよび５ｈｍＣを５ｃａＣに変換する（β－グルコシルトランスフェラーゼによる処理なしに）。ＡＰＯＢＥＣ３Ａによる処理は、未改変のシトシンをウラシルに脱アミノ化するが、５ｃａＣは、ＡＰＯＢＥＣ３Ａの基質ではない。次いで、対象試料のｃｆＤＮＡを、抗体が５ｃａＣ（元々存在する５ｍＣおよび５ｈｍＣから生成された変換産物）を認識することを除き、実施例１に本質的に記載したように抗体を使用して分配し、その後、プロテインＧにコンジュゲートした磁気ビーズで免疫沈降させ、そうして、高メチル化されたＤＮＡ（今度は５ｃａＣを含有する）を、低メチル化されたＤＮＡから分配する。任意の非メチル化ＤＮＡまたはあまりメチル化されていないＤＮＡを、漸増濃度の塩を含有する緩衝液を用いて、ビーズから洗浄して除く。最後に、高塩緩衝液を使用して、強くメチル化された（すなわち、５ｃａＣ含有）ＤＮＡを、５ｃａＣに特異的な抗体から洗浄して除いて、高メチル化された分配、中間の分配および低メチル化された分配を提供する。各分配の分配されたＤＮＡを、アダプターにライゲーションさせる。分配を、配列決定のために調製し、ホールゲノム配列決定に供する。各分配を、別々に配列決定するが、代替的手順では、分配は、差次的にタグ化し（例えば、ＥＭ－ｓｅｑ変換および分配の後、ならびに配列決定のためのさらなる調製の前に）、プールし、並行して配列決定することができる。

高メチル化可変標的領域からの配列データを、バイオインフォマティクスにより単離するが、代替的手順では、標的領域を、配列決定の前にｉｎｖｉｔｒｏで富化することができる。高メチル化可変標的領域についての塩基毎のメチル化を定量化して、高メチル化された分配からの高メチル化可変標的領域中の分子当たりのメチル化されたＣｐＧの数を示す。メチル化を、単一塩基の解像度で分析し、分配された材料の塩基毎のメチル化および部分的分子メチル化を定量化する。結腸直腸がんを有する対象由来の試料は、健康な対象由来の試料中の対応する領域においてよりも、これらの領域において、さらに高い全体的メチル化を示す。

Claims

試料中のＤＮＡを分析する方法であって、
ａ）前記試料を、前記試料の前記ＤＮＡ中の第２のヌクレオベースとは異なるように前記ＤＮＡ中の第１のヌクレオベースに影響を与える手順に供するステップであって、前記第１のヌクレオベースが、改変されたまたは未改変のヌクレオベースであり、前記第２のヌクレオベースが、前記第１のヌクレオベースとは異なる改変されたまたは未改変のヌクレオベースであり、前記第１のヌクレオベースと前記第２のヌクレオベースとが、同じ塩基対合特異性を有する、ステップ；
ｂ）前記ＤＮＡを、前記ＤＮＡ中の改変されたヌクレオベースを認識する薬剤と接触させることによって、前記試料を複数の部分試料へと分配するステップであって、前記複数が、第１の部分試料および第２の部分試料を含み、前記第１の部分試料が、前記第２の部分試料よりも高い割合でシトシン改変を有するＤＮＡを含み、前記薬剤によって認識される前記改変されたヌクレオベースが、改変されたシトシン、または前記試料の前記ＤＮＡ中の前記第２のヌクレオベースとは異なるように前記ＤＮＡ中の前記第１のヌクレオベースに影響を与える前記手順の産物である、ステップ；ならびに
ｃ）前記第１のヌクレオベースを前記第２のヌクレオベースから識別する様式で、前記第１および第２の部分試料のうち少なくとも一方中のＤＮＡを配列決定するステップ
を含む、方法。
ステップｃ）が、少なくとも前記第１の部分試料中のＤＮＡを配列決定するステップを含む、請求項１に記載の方法。
ステップｃ）が、前記第２の部分試料中のＤＮＡを配列決定するステップを含む、先行する請求項のいずれか一項に記載の方法。
試料中のＤＮＡを分析する方法であって、
ａ）前記試料を、前記試料の前記ＤＮＡ中の第２のヌクレオベースとは異なるように前記ＤＮＡ中の第１のヌクレオベースに影響を与える手順に供するステップであって、前記第１のヌクレオベースが、改変されたまたは未改変のヌクレオベースであり、前記第２のヌクレオベースが、前記第１のヌクレオベースとは異なる改変されたまたは未改変のヌクレオベースであり、前記第１のヌクレオベースと前記第２のヌクレオベースとが、同じ塩基対合特異性を有する、ステップ；ならびに
ｂ）前記ＤＮＡを、前記ＤＮＡ中の改変されたヌクレオベースを認識する薬剤と接触させることによって、前記試料を複数の部分試料へと分配するステップであって、前記複数が、第１の部分試料および第２の部分試料を含み、前記第１の部分試料が、前記第２の部分試料よりも高い割合でシトシン改変を有するＤＮＡを含み、前記薬剤によって認識される前記改変されたヌクレオベースが、改変されたシトシン、または前記試料の前記ＤＮＡ中の前記第２のヌクレオベースとは異なるように前記ＤＮＡ中の前記第１のヌクレオベースに影響を与える前記手順の産物である、ステップ；
ｃ）前記第１および第２の部分試料から、ＤＮＡの少なくともエピジェネティック標的領域セットを捕捉し、それによって、捕捉されたＤＮＡを提供するステップ；ならびに
ｄ）前記第１のヌクレオベースを前記第２のヌクレオベースから識別する様式で、前記捕捉されたＤＮＡを配列決定するステップ
を含む、方法。
試料中のＤＮＡを分析する方法であって、
ａ）前記試料を、前記試料の前記ＤＮＡ中の第２のヌクレオベースとは異なるように前記ＤＮＡ中の第１のヌクレオベースに影響を与える手順に供するステップであって、前記第１のヌクレオベースが、改変されたまたは未改変のヌクレオベースであり、前記第２のヌクレオベースが、前記第１のヌクレオベースとは異なる改変されたまたは未改変のヌクレオベースであり、前記第１のヌクレオベースと前記第２のヌクレオベースとが、同じ塩基対合特異性を有する、ステップ；ならびに
ｂ）前記ＤＮＡを、前記ＤＮＡ中の改変されたヌクレオベースを認識する薬剤と接触させることによって、前記試料を複数の部分試料へと分配するステップであって、前記複数が、第１の部分試料および第２の部分試料を含み、前記第１の部分試料が、前記第２の部分試料よりも高い割合でシトシン改変を有するＤＮＡを含み、前記薬剤によって認識される前記改変されたヌクレオベースが、改変されたシトシン、または前記試料の前記ＤＮＡ中の前記第２のヌクレオベースとは異なるように前記ＤＮＡ中の前記第１のヌクレオベースに影響を与える前記手順の産物である、ステップ；
ｃ）前記第１および第２の部分試料から、ＤＮＡの標的領域の複数のセットを捕捉するステップであって、標的領域の前記複数のセットが、配列可変標的領域セットおよびエピジェネティック標的領域セットを含み、それによって、捕捉されたＤＮＡを提供する、ステップ；ならびに
ｄ）前記第１のヌクレオベースを前記第２のヌクレオベースから識別する様式で、前記捕捉されたＤＮＡを配列決定するステップ
を含む、方法。
前記配列可変標的領域セットに対応する無細胞ＤＮＡ（ｃｆＤＮＡ）分子が、前記エピジェネティック標的領域セットに対応するｃｆＤＮＡ分子よりも高い捕捉収量で、前記試料中で捕捉される、請求項５に記載の方法。
標的領域の前記複数のセットを捕捉するステップが、前記第１および第２の部分試料の前記ＤＮＡを、標的特異的プローブのセットと接触させることであって、
標的特異的プローブの前記セットが、配列可変標的セットに特異的な標的結合性プローブおよびエピジェネティック標的セットに特異的な標的結合性プローブを含み、
それによって、標的特異的プローブとｃｆＤＮＡとの複合体が形成される、こと；ならびに
前記複合体を、標的特異的プローブに結合していないｃｆＤＮＡから分離し、それによって、前記配列可変標的セットに対応する捕捉されたｃｆＤＮＡおよび前記エピジェネティック標的セットに対応する捕捉されたｃｆＤＮＡを提供すること
を含む、請求項５または６に記載の方法。
前記エピジェネティック標的領域セットが、高メチル化可変標的領域セットを含む、請求項４から７のいずれか一項に記載の方法。
前記高メチル化可変標的領域セットが、健康な対象由来の無細胞ＤＮＡ中のメチル化の程度よりも、少なくとも１つの型の組織において、より高い程度のメチル化を有する領域を含む、直前に先行する請求項に記載の方法。
前記エピジェネティック標的領域セットが、低メチル化可変標的領域セットを含む、請求項４から９のいずれか一項に記載の方法。
前記低メチル化可変標的領域セットが、健康な対象由来の無細胞ＤＮＡ中のメチル化の程度よりも、少なくとも１つの型の組織において、より低い程度のメチル化を有する領域を含む、直前に先行する請求項に記載の方法。
前記エピジェネティック標的領域セットが、メチル化対照標的領域セットを含む、請求項４から１１のいずれか一項に記載の方法。
前記エピジェネティック標的領域セットが、断片化可変標的領域セットを含む、請求項４から１２のいずれか一項に記載の方法。
前記断片化可変標的領域セットが、転写開始部位領域を含む、請求項１３に記載の方法。
前記断片化可変標的領域セットが、ＣＴＣＦ結合領域を含む、請求項１３または１４に記載の方法。
前記ＤＮＡが、試験対象から得られる、先行する請求項のいずれか一項に記載の方法。
前記ＤＮＡが、試験対象から得られた無細胞ＤＮＡ（ｃｆＤＮＡ）を含む、先行する請求項のいずれか一項に記載の方法。
前記ＤＮＡが、試験対象の組織試料から得られたＤＮＡを含む、請求項１から１６のいずれか一項に記載の方法。
前記組織試料が、生検、微細針吸引物またはホルマリン固定パラフィン包埋組織試料である、直前に先行する請求項に記載の方法。
捕捉前に、バーコード含有アダプターを前記ＤＮＡにライゲーションさせるステップをさらに含み、必要に応じて、前記ライゲーションさせるステップが、増幅の前にまたはそれと同時に実施される、請求項５から１８に記載の方法。
前記第１の部分試料由来のＤＮＡ分子と前記第２の部分試料由来のＤＮＡ分子とが、差次的にタグ化される、先行する請求項のいずれか一項に記載の方法。
前記第１の部分試料由来のＤＮＡ分子と前記第２の部分試料由来のＤＮＡ分子とが、同じ配列決定セルにおいて配列決定される、先行する請求項のいずれか一項に記載の方法。
前記ＤＮＡが、配列決定するステップの前に増幅される、または方法が捕捉ステップを含み、前記ＤＮＡが、前記捕捉ステップの前に増幅される、先行する請求項のいずれか一項に記載の方法。
前記試料を複数の部分試料へと分配するステップが、メチル化レベルに基づいて分配するステップを含む、先行する請求項のいずれか一項に記載の方法。
前記ＤＮＡ中の改変されたヌクレオベースを認識する前記薬剤が、メチル結合試薬である、請求項２４に記載の方法。
前記メチル結合試薬が抗体である、請求項２５に記載の方法。
前記メチル結合試薬が、５－メチルシトシンを特異的に認識する、請求項２５または２６に記載の方法。
前記メチル結合試薬が、固体支持体上に固定化される、請求項２５から２７のいずれか一項に記載の方法。
前記試料を複数の部分試料へと分配するステップが、メチル化されたＤＮＡの免疫沈降を含む、請求項２４から２８のいずれか一項に記載の方法。
前記試料を複数の部分試料へと分配するステップが、タンパク質への結合に基づいて分配するステップを含み、必要に応じて、前記タンパク質が、メチル化されたタンパク質、アセチル化されたタンパク質、メチル化されていないタンパク質、アセチル化されていないタンパク質であり；および／または必要に応じて、前記タンパク質がヒストンである、先行する請求項のいずれか一項に記載の方法。
前記分配するステップが、前記試料の前記ＤＮＡを、前記タンパク質に特異的でありかつ固体支持体に固定化された結合試薬と接触させるステップを含む、請求項３０に記載の方法。
前記第１の部分試料と第２の部分試料とを差次的にタグ化しプールするステップを含む、先行する請求項のいずれか一項に記載の方法。
前記複数の部分試料が、前記第２の部分試料よりも高い割合であるが、前記第１の部分試料よりも低い割合でシトシン改変を有するＤＮＡを含む第３の部分試料を含む、先行する請求項のいずれか一項に記載の方法。
前記第３の部分試料を差次的にタグ化するステップをさらに含む、請求項３３に記載の方法。
前記第１、第２および第３の部分試料が、前記第１の部分試料を、前記第１の部分試料の前記ＤＮＡ中の前記第２のヌクレオベースとは異なるように前記ＤＮＡ中の前記第１のヌクレオベースに影響を与える前記手順に供するステップの後に組み合わさっており、必要に応じて、前記第１、第２および第３の部分試料が、同じ配列決定セルにおいて配列決定される、請求項３４に記載の方法。
前記試料が供される前記手順が、前記第２のヌクレオベースの塩基対合特異性を実質的に変更することなしに、前記第１のヌクレオベースの塩基対合特異性を変更する、先行する請求項のいずれか一項に記載の方法。
前記第１のヌクレオベースが、改変されたまたは未改変のシトシンであり、前記第２のヌクレオベースが、改変されたまたは未改変のシトシンである、先行する請求項のいずれか一項に記載の方法。
前記第１のヌクレオベースが、未改変のシトシン（Ｃ）を含む、先行する請求項のいずれか一項に記載の方法。
前記第２のヌクレオベースが、５－メチルシトシン（ｍＣ）を含む、先行する請求項のいずれか一項に記載の方法。
前記試料が供される前記手順が、バイサルファイト変換を含む、先行する請求項のいずれか一項に記載の方法。
前記第１のヌクレオベースが、ｍＣを含む、請求項１から３８のいずれか一項に記載の方法。
前記第２のヌクレオベースが、５－ヒドロキシメチルシトシン（ｈｍＣ）を含む、先行する請求項のいずれか一項に記載の方法。
前記試料が供される前記手順が、５ｈｍＣの保護を含む、請求項４２に記載の方法。
前記試料が供される前記手順が、Ｔｅｔ補助バイサルファイト変換を含む、請求項４２に記載の方法。
前記試料が供される前記手順が、置換されたボラン還元剤を用いた、Ｔｅｔ補助変換を含み、必要に応じて、前記置換されたボラン還元剤が、２－ピコリンボラン、ボランピリジン、ｔｅｒｔ－ブチルアミンボランまたはアンモニアボランである、請求項４２に記載の方法。
前記置換されたボラン還元剤が、２－ピコリンボランまたはボランピリジンである、請求項４５に記載の方法。
前記第２のヌクレオベースが、Ｃを含む、請求項４１から４３または４５から４６のいずれか一項に記載の方法。
前記試料が供される前記手順が、ｈｍＣの保護と、その後の、置換されたボラン還元剤を用いた、Ｔｅｔ補助変換とを含み、必要に応じて、前記置換されたボラン還元剤が、２－ピコリンボラン、ボランピリジン、ｔｅｒｔ－ブチルアミンボランまたはアンモニアボランである、請求項４１から４３または４７のいずれか一項に記載の方法。
前記置換されたボラン還元剤が、２－ピコリンボランまたはボランピリジンである、請求項４８に記載の方法。
前記試料が供される前記手順が、ｈｍＣの保護と、その後の、ｍＣおよび／またはＣの脱アミノ化とを含む、請求項３８、３９、４１から４３または４７のいずれか一項に記載の方法。
ｍＣおよび／またはＣの前記脱アミノ化が、ＡＩＤ／ＡＰＯＢＥＣファミリーのＤＮＡデアミナーゼ酵素による処理を含む、請求項５０に記載の方法。
ｈｍＣの保護が、ｈｍＣのグルコシル化を含む、請求項４３または４７から５１のいずれか一項に記載の方法。
前記試料が供される前記手順が、置換されたボラン還元剤を用いた、化学物質補助変換を含み、必要に応じて、前記置換されたボラン還元剤が、２－ピコリンボラン、ボランピリジン、ｔｅｒｔ－ブチルアミンボランまたはアンモニアボランである、請求項１から３７、３９、４１または４７のいずれか一項に記載の方法。
前記置換されたボラン還元剤が、２－ピコリンボランまたはボランピリジンである、請求項５３に記載の方法。
前記第１のヌクレオベースが、ｈｍＣを含む、請求項１から３７、３９、４１、４７または５３から５４のいずれか一項に記載の方法。
前記第１のヌクレオベースが、改変されたまたは未改変のアデニンであり、前記第２のヌクレオベースが、改変されたまたは未改変のアデニンである、請求項１から３６のいずれか一項に記載の方法。
前記第１のヌクレオベースが、改変されたまたは未改変のグアニンであり、前記第２のヌクレオベースが、改変されたまたは未改変のグアニンである、請求項１から３６のいずれか一項に記載の方法。
前記第１のヌクレオベースが、改変されたまたは未改変のチミンであり、前記第２のヌクレオベースが、改変されたまたは未改変のチミンである、請求項１から３６のいずれか一項に記載の方法。
前記薬剤によって認識される前記改変されたヌクレオベースが、改変されたシトシンである、先行する請求項のいずれか一項に記載の方法。
前記薬剤によって認識される前記改変されたヌクレオベースが、メチル化されたシトシンである、先行する請求項のいずれか一項に記載の方法。
前記薬剤によって認識される前記改変されたヌクレオベースが、変換されたヌクレオベースである、先行する請求項のいずれか一項に記載の方法。
捕捉されたＤＮＡの第１および第２の集団を含む組合せ物であって、前記第１の集団が、前記第２の集団よりも高い割合でシトシン改変を有するＤＮＡを含むか、またはそれに由来したものであり、前記第１の集団および前記第２の集団が各々、変更された塩基対合特異性を有する、前記ＤＮＡ中に元々存在する第１のヌクレオベースの形態と、変更された塩基対合特異性を有さない第２のヌクレオベースとを含み、塩基対合特異性の変更前の前記ＤＮＡ中に元々存在する前記第１のヌクレオベースの前記形態が、改変されたまたは未改変のヌクレオベースであり、前記第２のヌクレオベースが、前記第１のヌクレオベースとは異なる改変されたまたは未改変のヌクレオベースであり、塩基対合特異性の変更前の前記ＤＮＡ中に元々存在する前記第１のヌクレオベースの前記形態と前記第２のヌクレオベースとが、同じ塩基対合特異性を有する、組合せ物。
前記第１の集団が、１つまたは複数の配列タグの第１のセットから選択される配列タグを含み、前記第２の集団が、１つまたは複数の配列タグの第２のセットから選択される配列タグを含み、配列タグの前記第２のセットが、配列タグの前記第１のセットとは異なる、請求項６２に記載の組合せ物。
前記配列タグが、バーコードを含む、請求項６３に記載の組合せ物。
前記シトシン改変がメチル化である、請求項６２から６４のいずれか一項に記載の組合せ物。
前記第１のヌクレオベースが、改変されたまたは未改変のシトシンであり、前記第２のヌクレオベースが、改変されたまたは未改変のシトシンである、請求項６２から６５のいずれか一項に記載の組合せ物。
前記第１のヌクレオベースが、未改変のシトシン（Ｃ）を含む、請求項６２から６６のいずれか一項に記載の組合せ物。
前記第２のヌクレオベースが、５－メチルシトシン（ｍＣ）および５－ヒドロキシメチルシトシン（ｈｍＣ）のうち一方または両方を含む、請求項６２から６７のいずれか一項に記載の組合せ物。
前記第１および第２の集団が、バイサルファイト変換に供されている、請求項６２から６８のいずれか一項に記載の組合せ物。
前記第１のヌクレオベースが、ｍＣを含む、請求項６２から６８のいずれか一項に記載の組合せ物。
前記第２のヌクレオベースが、ｈｍＣを含む、請求項６２から７０のいずれか一項に記載の組合せ物。
前記第１の集団が、保護されたｈｍＣを含む、請求項６２から７１のいずれか一項に記載の組合せ物。
前記第１および第２の集団が、Ｔｅｔ補助バイサルファイト変換に供されている、請求項６６または７２に記載の組合せ物。
前記第１および第２の集団が、置換されたボラン還元剤を用いた、Ｔｅｔ補助変換に供されており、必要に応じて、前記置換されたボラン還元剤が、２－ピコリンボラン、ボランピリジン、ｔｅｒｔ－ブチルアミンボランまたはアンモニアボランである、請求項６６または７２に記載の組合せ物。
前記第１および第２の集団が、ｈｍＣの保護と、その後の、置換されたボラン還元剤を用いた、Ｔｅｔ補助変換とに供されており、必要に応じて、前記置換されたボラン還元剤が、２－ピコリンボラン、ボランピリジン、ｔｅｒｔ－ブチルアミンボランまたはアンモニアボランである、請求項７２に記載の組合せ物。
前記第２のヌクレオベースが、Ｃを含む、請求項７２から７４、６８、７０から７２または７４から７５のいずれか一項に記載の組合せ物。
前記第１および第２の集団が、ｈｍＣの保護と、その後の、ｍＣおよび／またはＣの脱アミノ化とに供されている、請求項７２に記載の組合せ物。
保護されたｈｍＣが、グルコシル化されたｈｍＣを含む、請求項７２から７７のいずれか一項に記載の組合せ物。
前記第１のヌクレオベースが、ｈｍＣを含む、請求項７２から７５のいずれか一項に記載の組合せ物。
前記第２のヌクレオベースが、ｍＣを含む、請求項７２から７５または７９のいずれか一項に記載の組合せ物。
前記第２のヌクレオベースが、Ｃを含む、請求項７２から７５または７９から８０のいずれか一項に記載の組合せ物。
前記第１および第２の集団が、置換されたボラン還元剤を用いた、化学物質補助変換に供されており、必要に応じて、前記置換されたボラン還元剤が、２－ピコリンボラン、ボランピリジン、ｔｅｒｔ－ブチルアミンボランまたはアンモニアボランである、請求項７２から７５または７９から８１のいずれか一項に記載の組合せ物。
前記第１のヌクレオベースが、改変されたまたは未改変のアデニンであり、前記第２のヌクレオベースが、改変されたまたは未改変のアデニンである、請求項７２から７５のいずれか一項に記載の組合せ物。
前記第１のヌクレオベースが、改変されたまたは未改変のグアニンであり、前記第２のヌクレオベースが、改変されたまたは未改変のグアニンである、請求項７２から７５のいずれか一項に記載の組合せ物。
前記第１のヌクレオベースが、改変されたまたは未改変のチミンであり、前記第２のヌクレオベースが、改変されたまたは未改変のチミンである、請求項７２から７５のいずれか一項に記載の組合せ物。
前記捕捉されたＤＮＡが、ｃｆＤＮＡを含む、請求項７２から８５いずれか一項に記載の組合せ物。
前記捕捉されたＤＮＡが、配列可変標的領域およびエピジェネティック標的領域を含み、前記配列可変標的領域の濃度が、前記エピジェネティック標的領域の濃度よりも高く、前記濃度が、前記配列可変標的領域およびエピジェネティック標的領域のフットプリントサイズに関して標準化される、請求項７２から８６のいずれか一項に記載の組合せ物。
請求項１から５８のいずれか一項に記載の方法に従って生産される、請求項６２から８７のいずれか一項に記載の組合せ物。
前記第１の部分試料の前記ＤＮＡと前記第２の部分試料の前記ＤＮＡとが、差次的にタグ化され；差次的タグ化後に、前記第２の部分試料由来のＤＮＡの一部分が、前記第１の部分試料またはその少なくとも一部分に添加され、それによって、プールを形成し；配列可変標的領域およびエピジェネティック標的領域が、前記プールから捕捉される、請求項１から５８のいずれか一項に記載の方法。
前記プールが、前記第２の部分試料の前記ＤＮＡの約４５％、４０％、３５％、３０％、２５％、２０％、１５％、１０％もしくは５％未満、またはそれと等しい％を含む、直前に先行する請求項に記載の方法。
前記プールが、前記第２の部分試料の前記ＤＮＡの約７０～９０％、約７５～８５％または約８０％を含む、請求項８９に記載の方法。
前記プールが、前記第１の部分試料の前記ＤＮＡの実質的に全てを含む、請求項８９から９１のいずれか一項に記載の方法。
配列可変標的領域が、前記第２の部分試料由来のＤＮＡの第２の部分から捕捉される、請求項８９から９２のいずれか一項に記載の方法。
前記対象ががんを有する可能性を決定するステップをさらに含む、請求項１から５８または８９から９３のいずれか一項に記載の方法。
前記配列決定するステップが、複数の配列決定読み取りを生成し；前記方法が、前記複数の配列読み取りを、１つまたは複数の参照配列にマッピングして、マッピングされた配列読み取りを生成すること、ならびに前記配列可変標的領域セットに対応する前記マッピングされた配列読み取りおよび前記エピジェネティック標的領域セットに対応する前記マッピングされた配列読み取りを処理して、前記対象ががんを有する可能性を決定することをさらに含む、直前に先行する請求項に記載の方法。
前記試験対象が、がんと以前に診断されており、１つまたは複数の以前のがん処置を受けており、必要に応じて、前記ＤＮＡが、前記１つまたは複数の以前のがん処置の後の１つまたは複数の予め選択された時点において得られ、ＤＮＡ分子の捕捉されたセットが配列決定され、それによって、配列情報のセットが生成される、請求項１から５８または８９から９５のいずれか一項に記載の方法。
配列情報の前記セットを使用して、予め選択された時点における、腫瘍細胞に起源するまたはそれに由来するＤＮＡの存在または非存在を検出するステップをさらに含む、直前に先行する請求項に記載の方法。
前記試験対象について、前記腫瘍細胞に起源するまたはそれに由来する前記ＤＮＡの前記存在または非存在を示すがん再発スコアを決定するステップをさらに含み、必要に応じて、前記がん再発スコアに基づいて、がん再発ステータスを決定するステップをさらに含み、がん再発スコアが所定の閾値であるもしくはそれを上回ると決定される場合に、前記試験対象の前記がん再発ステータスが、がん再発のリスク状態にあると決定される、または前記がん再発スコアが前記所定の閾値を下回る場合に、前記試験対象の前記がん再発ステータスが、がん再発のより低いリスク状態にあると決定される、直前に先行する請求項に記載の方法。
前記試験対象の前記がん再発スコアを、所定のがん再発閾値と比較するステップをさらに含み、前記試験対象が、前記がん再発スコアが前記がん再発閾値を上回る場合には、引き続くがん処置のための候補として分類される、または前記がん再発スコアが前記がん再発閾値を下回る場合には、引き続くがん処置のための候補として分類されない、直前に先行する請求項に記載の方法。