JP2023547620A

JP2023547620A - 分配および塩基変換を使用してｄｎａを解析するための組成物および方法

Info

Publication number: JP2023547620A
Application number: JP2023524623A
Authority: JP
Inventors: アンドリューケネディ，; ウィリアムジェイ．グリーンリーフ，
Original assignee: ガーダントヘルス，インコーポレイテッド
Priority date: 2020-10-23
Filing date: 2021-10-21
Publication date: 2023-11-13
Also published as: US20220154286A1; CA3195797A1; WO2022087309A1; EP4232599A1

Abstract

本開示は、ＤＮＡ、例えば、無細胞ＤＮＡを解析することに関連する組成物および方法を提供する。一部の実施形態では、無細胞ＤＮＡは、がんを有するかもしくはがんを有することが疑われる対象に由来する、かつ／または無細胞ＤＮＡは、がん細胞に由来するＤＮＡを含む。一部の実施形態では、ＤＮＡは、第１の部分試料および第２の部分試料に分配され、第１の部分試料は、第２の部分試料よりも高い割合でヌクレオチド改変（例えば、シトシン改変）を有するＤＮＡを含み、第２の部分試料は、第１の部分試料のＤＮＡ内の第１の核酸塩基に対してＤＮＡ内の第２の核酸塩基とは異なって影響を及ぼす手順に供され、ＤＮＡは、第２の部分試料のＤＮＡ内の第１の核酸塩基を第２の核酸塩基と識別する様式でシーケンシングされる。

Description

関連出願への相互参照
本出願は、２０２０年１０月２３日に出願された米国仮特許出願第６３／１０５，１８４号に基づく優先権を主張し、この仮特許出願は、あらゆる目的で参照によりその全体が本明細書に組み込まれる。

発明の分野
本開示は、ＤＮＡ、例えば、無細胞ＤＮＡを解析することに関連する組成物および方法を提供する。一部の実施形態では、無細胞ＤＮＡは、がんを有するかもしくはがんを有することが疑われる対象に由来する、かつ／または無細胞ＤＮＡは、がん細胞に由来するＤＮＡを含む。一部の実施形態では、ＤＮＡは、第１の部分試料および第２の部分試料に分配され、第１の部分試料は、第２の部分試料よりも高い割合でヌクレオチド改変（例えば、シトシン改変）を有するＤＮＡを含み、第２の部分試料は、第１の部分試料のＤＮＡ内の第１の核酸塩基に対してＤＮＡ内の第２の核酸塩基とは異なって影響を及ぼす手順に供され、ＤＮＡは、第２の部分試料のＤＮＡ内の第１の核酸塩基を第２の核酸塩基と識別する様式でシーケンシングされる。

序説および要旨
がんは、世界中で年間数百万人もの死亡の原因となっている。がんの早期検出は、初期のがんが処置に対してより感受性となる傾向があるため、転帰の改善をもたらす可能性がある。

不適切に制御された細胞成長は、遺伝子変化およびエピジェネティック変化、例えば、コピー数変異（ＣＮＶ）、単一ヌクレオチド変異（ＳＮＶ）、遺伝子融合、挿入、および／または欠失（インデル）、シトシンの改変を含むエピジェネティック変異（例えば、５－メチルシトシン、５－ヒドロキシメチルシトシン、および他のより酸化した形態）、ならびにＤＮＡのクロマチンタンパク質および転写因子との会合の蓄積により一般的に生じる、がんの顕著な特徴である。

生検は、可能性のあるがんの部位から細胞または組織を抽出し、関連する表現型および／または遺伝子型特色について解析する、がんを検出または診断するための従来的なアプローチを表す。生検は、侵襲的であるという欠点を有する。

体液（「液体生検」）、例えば、血液の解析に基づくがんの検出は、がん細胞に由来するＤＮＡが体液中に放出されるという観察に基づく興味深い代替法である。液体生検は、非侵襲的である（採血だけは必要な場合がある）。無細胞核酸（例えば、無細胞ＤＮＡまたは無細胞ＲＮＡ）のがん診断アッセイの現在の方法は、単一ヌクレオチド変異体（ＳＮＶ）、コピー数変異（ＣＮＶ）、融合、およびインデル（すなわち、挿入または欠失）を含む、腫瘍関連の体細胞変異体の検出に焦点を当てている可能性があり、これらは全て、液体生検の主流の標的である。無細胞ＤＮＡにおけるメチル化状態およびフラグメントームシグナルなどの非配列改変が、無細胞ＤＮＡの起源および疾患レベルに関する情報を提供し得るという根拠が増えてきている。無細胞ＤＮＡの非配列改変は、体細胞突然変異のコーリングと組み合わせた場合に、いずれかのアプローチ単独で入手可能なものよりも包括的な腫瘍状態評価を得ることができる。しかしながら、無細胞ＤＮＡの低い濃度および不均一性を考えると、核酸塩基改変に関する詳細な情報を提供する液体生検材料を解析するための正確かつ感度の高い方法を開発することは、困難となっている。

液体生検手順におけるさらなる解析に有用な無細胞ＤＮＡの分画を単離しプロセシングすることは、これらの方法の重要な部分である。したがって、例えば、液体生検において、無細胞ＤＮＡを解析するための改善された方法および組成物が、必要とされている。

本開示は、無細胞ＤＮＡの改善された解析の必要性を満たすこと、および／または他の利点を提供することを目的としている。したがって、以下の例示的な実施形態を提供する。

実施形態１は、試料中のＤＮＡを解析する方法であって、
ａ）試料を、第１の部分試料および第２の部分試料を含む複数の部分試料に分配するステップであって、第１の部分試料が、第２の部分試料よりも高い割合で、シトシン改変を有するＤＮＡを含む、ステップと、
ｂ）第２の部分試料を、第２の部分試料のＤＮＡ内の第１の核酸塩基に対してＤＮＡ内の第２の核酸塩基とは異なって影響を及ぼす手順に供するステップであって、第１の核酸塩基が改変または非改変核酸塩基であり、第２の核酸塩基が第１の核酸塩基とは異なる改変または非改変核酸塩基であり、第１の核酸塩基および第２の核酸塩基が同じ塩基対形成特異性を有し、それによって処置された部分試料を産生するステップと、
ｃ）処置された部分試料から、エピジェネティック標的領域を含む標的領域セットを捕捉するステップと、
ｄ）標的領域セット中のＤＮＡおよび第１の部分試料に由来するＤＮＡをシーケンシングするステップであって、第２の部分試料に由来するＤＮＡが、標的領域セットのＤＮＡ内の第１の核酸塩基を第２の核酸塩基と識別する様式でシーケンシングされる、ステップと
を含む、方法である。

実施形態２は、試料中のＤＮＡを解析する方法であって、
ａ）試料から、エピジェネティック標的領域を含む標的領域セットを捕捉するステップと、
ｂ）標的領域セットを、第１の部分試料および第２の部分試料を含む複数の部分試料に分配するステップであって、第１の部分試料が、第２の部分試料よりも高い割合で、シトシン改変を有するＤＮＡを含む、ステップと、
ｃ）第２の部分試料を、第２の部分試料のＤＮＡ内の第１の核酸塩基に対してＤＮＡ内の第２の核酸塩基とは異なって影響を及ぼす手順に供するステップであって、ステップであって、第１の核酸塩基が改変または非改変核酸塩基であり、第２の核酸塩基が第１の核酸塩基とは異なる改変または非改変核酸塩基であり、第１の核酸塩基および第２の核酸塩基が同じ塩基対形成特異性を有し、それによって処置された部分試料を産生するステップと、
ｄ）第１の部分試料に由来するＤＮＡおよび第２の部分試料に由来するＤＮＡをシーケンシングするステップであって、第２の部分試料に由来するＤＮＡが、標的領域セットのＤＮＡ内の第１の核酸塩基を第２の核酸塩基と識別する様式でシーケンシングされる、ステップと
を含む、方法である。

実施形態３は、標的領域セットが、低メチル化可変標的領域セットを含む、先行する実施形態のいずれか１つに記載の方法である。

実施形態４は、低メチル化可変標的領域セットが、少なくとも１つのタイプの組織において、健康な対象に由来する無細胞ＤＮＡにおけるメチル化の程度よりも低い程度のメチル化を有する領域を含む、直前の実施形態に記載の方法である。

実施形態５は、標的領域セットが、メチル化対照標的領域セットを含む、実施形態３または４に記載の方法である。

実施形態６は、標的領域セットが、断片化可変標的領域セットを含む、先行する実施形態のいずれか１つに記載の方法である。

実施形態７は、断片化可変標的領域セットが、転写開始部位領域を含む、直前の実施形態に記載の方法である。

実施形態８は、断片化可変標的領域セットが、ＣＴＣＦ結合領域を含む、実施形態６または７に記載の方法である。

実施形態９は、標的領域セットが、配列可変標的領域をさらに含む、先行する実施形態のいずれか１つに記載の方法である。

実施形態１０は、配列可変標的領域セットに対応するＤＮＡ分子が、エピジェネティック標的領域セットに対応するＤＮＡ分子よりも高い捕捉収率で捕捉される、直前の実施形態に記載の方法である。

実施形態１１は、試料中のＤＮＡを解析する方法であって、
ａ）試料を、第１の部分試料および第２の部分試料を含む複数の部分試料に分配するステップであって、第１の部分試料が、第２の部分試料よりも高い割合で、シトシン改変を有するＤＮＡを含む、ステップと、
ｂ）第２の部分試料を、第２の部分試料のＤＮＡ内の第１の核酸塩基に対してＤＮＡ内の第２の核酸塩基とは異なって影響を及ぼす手順に供するステップであって、第１の核酸塩基が改変または非改変核酸塩基であり、第２の核酸塩基が第１の核酸塩基とは異なる改変または非改変核酸塩基であり、第１の核酸塩基および第２の核酸塩基が同じ塩基対形成特異性を有し、それによって処置された部分試料を産生するステップと、
ｃ）処置された部分試料に由来するＤＮＡおよび第１の部分試料に由来するＤＮＡを、標的領域セットのＤＮＡ内の第１の核酸塩基を第２の核酸塩基と識別する様式でシーケンシングするステップと
を含む、方法である。

実施形態１２は、第１の部分試料のＤＮＡを、メチル化感受性ヌクレアーゼと接触させ、それによって第１の部分試料中の非特異的に分配されたＤＮＡを分解する、先行する実施形態のいずれか１つに記載の方法である。

実施形態１３は、ＤＮＡが、試験対象から得られた無細胞ＤＮＡ（ｃｆＤＮＡ）を含む、先行する実施形態のいずれか１つに記載の方法である。

実施形態１４は、第１の部分試料から、追加の標的領域セットを捕捉するステップをさらに含み、シーケンシングされる第１の部分試料に由来するＤＮＡが、追加の標的領域セットを含む、先行する実施形態のいずれか１つに記載の方法。

実施形態１５は、第１の部分試料を、第２の部分試料のＤＮＡ内の第１の核酸塩基に対してＤＮＡ内の第２の核酸塩基とは異なって影響を及ぼす手順に供するステップであって、第１の核酸塩基が改変または非改変核酸塩基であり、第２の核酸塩基が第１の核酸塩基とは異なる改変または非改変核酸塩基であり、第１の核酸塩基および第２の核酸塩基が同じ塩基対形成特異性を有し、それによって追加の処置された部分試料を産生するステップをさらに含む、先行する実施形態のいずれか１つに記載の方法である。

実施形態１６は、追加の処置された部分試料から、追加の標的領域セットを捕捉するステップをさらに含む、直前の実施形態に記載の方法である。

実施形態１７は、追加の標的領域セットが、高メチル化可変標的領域セットを含む、実施形態１４または１６に記載の方法である。

実施形態１８は、高メチル化可変標的領域セットが、少なくとも１つのタイプの組織において、健康な対象に由来する無細胞ＤＮＡにおけるメチル化の程度よりも高い程度のメチル化を有する領域を含む、直前の実施形態に記載の方法である。

実施形態１９は、追加の標的領域セットが、メチル化対照標的領域セットを含む、実施形態１８または１９に記載の方法である。

実施形態２０は、追加の標的領域セットが、断片化可変標的領域セットを含む、実施形態１６～１９のいずれか１つに記載の方法である。

実施形態２１は、断片化可変標的領域セットが、転写開始部位領域を含む、直前の実施形態に記載の方法である。

実施形態２２は、断片化可変標的領域セットが、ＣＴＣＦ結合領域を含む、実施形態２０または２１に記載の方法である。

実施形態２３は、追加の標的領域セットが、配列可変標的領域をさらに含む、実施形態１６～２２のいずれか１つに記載の方法である。

実施形態２４は、配列可変標的領域セットに対応するＤＮＡ分子が、エピジェネティック標的領域セットに対応するＤＮＡ分子よりも高い捕捉収率で捕捉される、直前の実施形態に記載の方法である。

実施形態２５は、捕捉するステップが、捕捉しようとするＤＮＡを、標的特異的プローブのセットと接触させることを含み、それによって標的特異的プローブとＤＮＡとの複合体が形成される、先行する実施形態のいずれか１つに記載の方法である。

実施形態２６は、捕捉するステップが、複合体を、標的特異的プローブに結合していないＤＮＡから分離させ、それによって捕捉されたＤＮＡを得ることをさらに含む、直前の実施形態に記載の方法である。

実施形態２７は、標的特異的プローブのセットが、エピジェネティック標的領域セットに対応するＤＮＡよりも高い捕捉収率で配列可変標的領域セットに対応するＤＮＡを捕捉するように構成される、実施形態２５または２６に記載の方法である。

実施形態２８は、エピジェネティック標的領域セットに対応するＤＮＡ分子よりも大きいシーケンシング深度まで、配列可変標的領域セットに対応するＤＮＡ分子をシーケンシングするステップを含む、実施形態９～２２のいずれか１つに記載の方法である。

実施形態２９は、ＤＮＡが、シーケンシングするステップの前に増幅されるか、またはＤＮＡが、捕捉するステップの前に増幅される、先行する実施形態のいずれか１つに記載の方法である。

実施形態３０は、捕捉の前にＤＮＡにバーコード含有アダプターをライゲーションするステップをさらに含み、必要に応じて、ライゲーションするステップが、増幅の前または増幅と同時に生じる、先行する実施形態のいずれか１つに記載の方法である。

実施形態３１は、試料を複数の部分試料に分配するステップが、メチル化レベルに基づいて分配することを含む、先行する実施形態のいずれか１つに記載の方法である。

実施形態３２は、分配するステップが、収集したｃｆＤＮＡを、固体支持体に固定化されたメチル結合試薬と接触させることを含む、直前の実施形態に記載の方法である。

実施形態３３は、第１の部分試料および第２の部分試料または第１の部分試料および処置された部分試料を、差次的にタグ付けするステップを含む、先行する実施形態のいずれか１つに記載の方法である。

実施形態３４は、第１の部分試料および標的領域セットまたは第２の部分試料に由来するＤＮＡが、プールされる、直前の実施形態に記載の方法である。

実施形態３５は、第１の部分試料および標的領域セットまたは第２の部分試料に由来するＤＮＡが、同じシーケンシングセルにおいてシーケンシングされる、実施形態３３～３４のいずれか１つに記載の方法である。

実施形態３６は、複数の部分試料が、第２部分試料よりも高い割合であるが第１の部分試料よりも低い割合でシトシン改変を有するＤＮＡを含む、第３の部分試料を含む、先行する実施形態のいずれか１つに記載の方法である。

実施形態３７は、第３の部分試料を差次的にタグ付けするステップをさらに含む、直前の実施形態に記載の方法である。

実施形態３８は、第１の部分試料に由来するＤＮＡ、第３の試料に由来するＤＮＡ、および標的領域セットが、プールされ、必要に応じて、第１、第２、および第３の部分試料に由来するＤＮＡが、同じシーケンシングセルにおいてシーケンシングされる、直前の実施形態に記載の方法である。

実施形態３９は、対象ががんを有する可能性を決定するステップをさらに含む、先行する実施形態のいずれか１つに記載の方法である。

実施形態４０は、シーケンシングするステップが、複数のシーケンシング読み取りデータを生成し、方法が、複数の配列読み取りデータを１つまたは複数の参照配列にマッピングして、マッピングされた配列読み取りデータを生成するステップと、配列可変標的領域セットおよびエピジェネティック標的領域セットに対応するマッピングされた配列読み取りデータをプロセシングして、対象ががんを有する可能性を決定するステップとをさらに含む、直前の実施形態に記載の方法である。

実施形態４１は、試験対象が、以前にがんと診断され、１つまたは複数の以前のがん処置を受けており、必要に応じて、ｃｆＤＮＡが、１つまたは複数の以前のがん処置の後の１つまたは複数の事前に選択された時点で取得され、ｃｆＤＮＡ分子の捕捉されたセットをシーケンシングし、それによって配列情報のセットが産生される、実施形態１～３８のいずれか１つに記載の方法である。

実施形態４２は、配列情報のセットを使用して、事前に選択された時点において、腫瘍細胞を起源とするかまたはそれに由来するＤＮＡの存在または非存在を検出するステップをさらに含む、直前の実施形態に記載の方法である。

実施形態４３は、試験対象について、腫瘍細胞を起源とするかまたはそれに由来するＤＮＡの存在または非存在を示すがん再発スコアを決定するステップをさらに含み、必要に応じて、がん再発スコアに基づいて、がん再発ステータスを決定するステップをさらに含み、試験対象のがん再発ステータスが、がん再発スコアが所定の閾値であるかもしくはそれを上回ると決定された場合にがん再発のリスクがあると決定されるか、または試験対象のがん再発ステータスが、がん再発スコアが所定の閾値よりも低い場合にがん再発のリスクが低いと決定される、直前の実施形態に記載の方法である。

実施形態４４は、試験対象のがん再発スコアを所定のがん再発閾値と比較するステップをさらに含み、試験対象が、がん再発スコアががん再発閾値を上回る場合に後続のがん処置の候補として分類されるか、またはがん再発スコアががん再発閾値よりも低い場合に後続のがん処置の候補ではないとして分類される、直前の実施形態に記載の方法である。

実施形態４５は、シトシン改変が、メチル化である、先行する実施形態のいずれか１つに記載の方法である。

実施形態４６は、シトシン改変が、シトシンの５位におけるメチル化である、先行する実施形態のいずれか１つに記載の方法である。

実施形態４７は、第２の部分試料が供される手順が、第２の核酸塩基の塩基対形成特異性を実質的に変化させることなく、第１の核酸塩基の塩基対形成特異性を変化させる、先行する実施形態のいずれか１つに記載の方法である。

実施形態４８は、第１の核酸塩基が、改変または非改変シトシンであり、第２の核酸塩基が、改変または非改変シトシンである、先行する実施形態のいずれか１つに記載の方法。

実施形態４９は、第１の核酸塩基が、非改変シトシン（Ｃ）を含む、先行する実施形態のいずれか１つに記載の方法である。

実施形態５０は、第２の核酸塩基が、５－メチルシトシン（ｍＣ）を含む、先行する実施形態のいずれか１つに記載の方法である。

実施形態５１は、第１の部分試料が供される手順が、バイサルファイト変換を含む、先行する実施形態のいずれか１つに記載の方法である。

実施形態５２は、第１の核酸塩基が、ｍＣを含む、実施形態１～４９のいずれか１つに記載の方法である。

実施形態５３は、第２の核酸塩基が、５－ヒドロキシメチルシトシン（ｈｍＣ）を含む、先行する実施形態のいずれか１つに記載の方法である。

実施形態５４は、第２の部分試料が供される手順が、５ｈｍＣの保護を含む、実施形態５３に記載の方法である。

実施形態５５は、第２の部分試料が供される手順が、Ｔｅｔ補助バイサルファイト変換を含む、実施形態５３に記載の方法である。

実施形態５６は、第２の部分試料が供される手順が、置換ボラン還元剤を用いたＴｅｔ補助変換を含み、必要に応じて、置換ボラン還元剤が、２－ピコリンボラン、ボランピリジン、ｔｅｒｔ－ブチルアミンボラン、またはアンモニアボランである、実施形態５３に記載の方法である。

実施形態５７は、置換ボラン還元剤が、２－ピコリンボランまたはボランピリジンである、実施形態５６に記載の方法である。

実施形態５８は、第２の核酸塩基が、Ｃを含む、実施形態５２～５４または５６～５７のいずれか１つに記載の方法である。

実施形態５９は、第２の部分試料が供される手順が、ｈｍＣの保護、続いて置換ボラン還元剤を用いたＴｅｔ補助変換を含み、必要に応じて、置換ボラン還元剤が、２－ピコリンボラン、ボランピリジン、ｔｅｒｔ－ブチルアミンボラン、またはアンモニアボランである、実施形態５２～５４、または５８のいずれか１つに記載の方法である。

実施形態６０は、置換ボラン還元剤が、２－ピコリンボランまたはボランピリジンである、実施形態５９に記載の方法である。

実施形態６１は、第１の部分試料が供される手順が、ｈｍＣの保護、続いてｍＣおよび／またはＣの脱アミノ化を含む、実施形態４９、５０、５２～５４、または５８のいずれか１つに記載の方法である。

実施形態６２は、ｍＣおよび／またはＣの脱アミノ化が、ＡＩＤ／ＡＰＯＢＥＣファミリーＤＮＡデアミナーゼ酵素での処置を含む、実施形態６１に記載の方法である。

実施形態６３は、ｈｍＣの保護が、ｈｍＣのグルコシル化を含む、実施形態５４または５８～６２のいずれか１つに記載の方法である。

実施形態６４は、第１の部分試料が供される手順が、置換ボラン還元剤を用いた化学物質補助変換を含み、必要に応じて、置換ボラン還元剤が、２－ピコリンボラン、ボランピリジン、ｔｅｒｔ－ブチルアミンボラン、またはアンモニアボランである、実施形態１～４８、５０、５２、または５８のいずれか１つに記載の方法である。

実施形態６５は、置換ボラン還元剤が、２－ピコリンボランまたはボランピリジンである、実施形態６４に記載の方法である。

実施形態６６は、第１の核酸塩基が、ｈｍＣを含む、実施形態１～４８、５０、５２、５８、または６４～６５のいずれか１つに記載の方法である。

実施形態６７は、第１の部分試料のＤＮＡおよび第２の部分試料のＤＮＡが、差次的にタグ付けされ、差次的タグ付けの後に、第２の部分試料または処置された部分試料に由来するＤＮＡの一部分が、第１の部分試料または追加の処置された部分試料またはその少なくとも一部分に添加され、それによってプールが形成され、配列可変標的領域およびエピジェネティック標的領域が、プールから捕捉される、先行する実施形態のいずれか１つに記載の方法である。

実施形態６８は、プールが、第２の部分試料のＤＮＡのうちの約４５％未満もしくはそれに等しい、４０％未満もしくはそれに等しい、３５％未満もしくはそれに等しい、３０％未満もしくはそれに等しい、２５％未満もしくはそれに等しい、２０％未満もしくはそれに等しい、１５％未満もしくはそれに等しい、１０％未満もしくはそれに等しい、または５％未満もしくはそれに等しいを含む、直前の実施形態に記載の方法である。

実施形態６９は、プールが、第２の部分試料のＤＮＡのうちの約７０～９０％、約７５～８５％、または約８０％を含む、直前の実施形態に記載の方法である。

実施形態７０は、プールが、第１の部分試料のＤＮＡの実質的に全てを含む、実施形態６７～６９のいずれか１つに記載の方法である。

実施形態７１は、プールが、第１の部分試料または処置された第１の部分試料のＤＮＡの実質的に全てを含む、実施形態６７～７０のいずれか１つに記載の方法である。

実施形態７２は、第１の標的領域セットが、プールの形成後に、第１の部分試料または処置された第１の部分試料の少なくとも一部分から捕捉される、実施形態６７～７２のいずれか１つに記載の方法である。

実施形態７３は、第１の部分試料を、第２の部分試料のＤＮＡ内の第１の核酸塩基に対してＤＮＡ内の第２の核酸塩基とは異なって影響を及ぼす手順に供するステップであって、第１の部分試料が供される手順が、第２の部分試料が供される手順と同じである、ステップをさらに含む、実施形態４７～７２のいずれか１つに記載の方法である。

実施形態７４は、第１の部分試料を、第２の部分試料のＤＮＡ内の第１の核酸塩基に対してＤＮＡ内の第２の核酸塩基とは異なって影響を及ぼす手順に供するステップであって、第１の部分試料が供される手順が、第２の部分試料が供される手順とは異なる、ステップをさらに含む、実施形態４７～７２のいずれか１つに記載の方法である。
Ｉ．図面の簡単な説明

図１は、血液試料で開始する、本開示のある特定の実施形態による、例示的なワークフローを図示し、ここで、ｃｆＤＮＡを、血液試料から単離し、ｃｆＤＮＡは、メチル結合ドメインタンパク質（ＭＢＤ）を使用して低メチル化部分試料および高メチル化部分試料に分配され、低メチル化部分試料（および必要に応じて高メチル化部分試料）は、非特異的に分配された分子の同定を容易にするために、ある特定のヌクレオチド形態に差次的に変換する（例えば、メチル化シトシンのチミンへの変換）手順（例えば、ＴＡＰ）に供される。部分試料は、次いで、ライブラリー調製、ならびに高メチル化の差次的にメチル化された領域および低メチル化の差次的にメチル化された領域（それぞれ、高メチル化部分試料および低メチル化部分試料に関して）に関して富化を受け、続いてシーケンシングおよび解析を受ける。図１は、血液試料で開始する、本開示のある特定の実施形態による、例示的なワークフローを図示し、ここで、ｃｆＤＮＡを、血液試料から単離し、ｃｆＤＮＡは、メチル結合ドメインタンパク質（ＭＢＤ）を使用して低メチル化部分試料および高メチル化部分試料に分配され、低メチル化部分試料（および必要に応じて高メチル化部分試料）は、非特異的に分配された分子の同定を容易にするために、ある特定のヌクレオチド形態に差次的に変換する（例えば、メチル化シトシンのチミンへの変換）手順（例えば、ＴＡＰ）に供される。部分試料は、次いで、ライブラリー調製、ならびに高メチル化の差次的にメチル化された領域および低メチル化の差次的にメチル化された領域（それぞれ、高メチル化部分試料および低メチル化部分試料に関して）に関して富化を受け、続いてシーケンシングおよび解析を受ける。

図２は、本開示の実施形態による、対象から得られたポリヌクレオチド試料中の核酸分子のメチル化状態を決定するための方法のフローチャート図である。

図３は、本開示の実施形態による、対象から得られたポリヌクレオチド試料中の核酸分子のメチル化状態を決定するための方法のフローチャート図である。

図４は、本開示の一部の実施形態での使用に好適なシステムの例の概略図である。

図５は、初期結腸直腸がん（「初期ＣＲＣ」）を有する対象に由来する３つの試料および３つの健康な対象（「正常」）について実施例２に記載されるように得られたＣｐＧメチル化定量結果を示す。初期ＣＲＣプロットに関して、ＭＡＦは、突然変異体対立遺伝子分画を示す。

図６は、正常試料および希釈ＣＲＣ試料においてＭＳＲＥ処置ありおよびなしの３つの分配における分子カウントを示す。

ＩＩ．ある特定の実施形態の詳細な説明
ここで、本発明のある特定の実施形態への詳細な参照がなされる。本発明は、そのような実施形態と関連して記載されているが、それらが、本発明をそれらの実施形態に制限することを意図するものではないことが理解される。逆に、本発明は、全ての代替形態、改変形態、および等価物を網羅することを意図し、それらは、添付の特許請求の範囲によって定義される本発明内に含まれ得る。

本教示を詳細に説明する前に、本開示が、特定の組成物またはプロセスステップに限定されるものではなく、それが変動し得ることを理解されたい。本明細書および添付の特許請求の範囲において使用されるとき、単数形の「１つの（a）」、「１つの（an）」、および「その（the）」は、文脈により別途明確に示されない限り、複数形の参照物を含むことに留意すべきである。したがって、例えば、「核酸（a nucleic acid）」への言及は、複数の核酸を含み、「細胞（a cell）」への言及は、複数の細胞を含むなどである。

数値範囲は、その範囲を定める数を含む。測定値および測定可能な値は、測定と関連する有効桁および誤差を考慮した、近似値であるとして理解される。また、「含む（comprise）」、「含む（comprises）」、「含むこと（comprising）」、「含有する（contain）」、「含有する（contains）」、「含有すること（containing）」、「含む（include）」、「含む（includes）」、および「含むこと（including）」の使用は、制限することを意図するものではない。前述の一般的な説明および詳細な説明は、いずれも、例示的および説明的であるにすぎず、教示を制限するものではないことを理解されたい。

上記の明細書に具体的に言及されていない限り、様々な構成要素を「含む」と列挙した本明細書における実施形態はまた、列挙された構成要素「からなる」または「から本質的になる」ことも企図され、様々な構成要素「からなる」と列挙した本明細書における実施形態はまた、列挙された構成要素を「含む」またはそれ「から本質的になる」ことも企図され、様々な構成要素「から本質的になる」と列挙した本明細書における実施形態はまた、列挙された構成要素「からなる」またはそれを「含む」ことも企図される（この互換可能性は、特許請求の範囲におけるこれらの用語の使用には適用されない）。

本明細書において使用される節の見出しは、構成上の目的のためのものであり、決して開示される主題を制限するものと解釈されるべきではない。参照によって組み込まれる任意の文書または他の材料が、本明細書の任意の明示的な内容と相反する場合、定義を含め、本明細書が優先される。
Ａ．定義

「無細胞ＤＮＡ」、「ｃｆＤＮＡ分子」、または単純に「ｃｆＤＮＡ」は、対象において細胞外形態で（例えば、血液、血清、血漿、または他の体液、例えば、リンパ液、脳脊髄液、尿、もしくは喀痰中に）天然に存在するＤＮＡ分子を含む。ｃｆＤＮＡは、大型の複合生物体、例えば、哺乳動物の細胞（単数または複数）においてもともと存在していたが、細胞から生物において見出される流体中への放出を受けており、ｉｎｖｉｔｒｏ細胞溶解ステップを行う必要なしに、流体の試料から得ることができる。

本明細書で使用される場合、「細胞核酸」とは、核酸が後に所与の解析プロセスの一部として取り出される（例えば、細胞溶解によって）としても、少なくとも試料が対象から採取または収集された時点において、核酸が起源とする１つまたは複数の細胞内に配置されている、核酸を意味する。

本明細書で使用される場合、改変または他の特色は、改変または他の特色を有するヌクレオチドの分画が、第１の試料または集団において、第２の集団におけるよりも高い場合に、第１の試料または核酸の集団において第２の試料または集団よりも「高い割合」で存在する。例えば、第１の試料において、ヌクレオチドのうちの１０分の１がｍＣであり、第２の試料において、ヌクレオチドのうちの２０分の１がｍＣである場合には、第１の試料は、第２の試料よりも高い割合で、シトシンの５－メチル化改変を含む。

本明細書で使用される場合、所与の核酸塩基の「塩基対形成特異性を実質的に変化させることなく」とは、シーケンシングすることができるその核酸塩基を含む分子の大部分が、それがもともと単離された試料中にあったときのその塩基対形成特異性と比べて、第２の核酸塩基の塩基対形成特異性の変更を有さないことを意味する。一部の実施形態では、シーケンシングすることができるその核酸塩基を含む分子のうちの７５％、９０％、９５％、または９９％が、それがもともと単離された試料中にあったときのその塩基対形成特異性と比べて、第２の核酸塩基の塩基対形成特異性の変更を有さない。

本明細書で使用される場合、「塩基対形成特異性」とは、所与の塩基がもっとも優先的に対を形成する標準的なＤＮＡ塩基（Ａ、Ｃ、Ｇ、またはＴ）を指す。したがって、例えば、非改変シトシンおよび５－メチルシトシンは、同じ塩基対形成特異性（すなわち、Ｇに対する特異性）を有するが、ウラシルおよびシトシンは、ウラシルがＡに対する塩基対形成特異性を有する一方でシトシンがＧに対する塩基対形成特異性を有するため、異なる塩基対形成特異性を有する。ウラシルは、いずれにせよ、４つの標準的なＤＮＡ塩基の中でもＡともっとも優先的に対を形成するため、ウラシルがＧと不安定な対を形成する能力は、無関係である。

本明細書で使用される場合、複数のメンバーを含む「組合せ」は、メンバーを含む単一の組成物、または近傍にある、例えば、より大きな容器、例えば、マルチウェルプレート、チューブラック、冷蔵庫、冷凍庫、インキュベーター、水浴、アイスバケット、機械、もしくは他の保管形態内の別個の容器もしくはコンパートメント内にある組成物のセットのいずれかを指す。

所与の標的セットに対するプローブのコレクションの「捕捉収率」とは、典型的な条件下においてプローブのコレクションが捕捉する標的セットに対応する核酸の量（例えば、別の標的セットと比べた量または絶対量）を指す。例示的な典型的な捕捉条件は、試料核酸およびプローブの、ストリンジェントなハイブリダイゼーション緩衝液を含有する小さな反応体積（約２０μＬ）における、６５℃で１０～１８時間のインキュベーションである。捕捉収率は、絶対値で、または複数のプローブのコレクションについては、相対値で表され得る。複数の標的領域のセットの捕捉収率を比較する場合、それらは、標的領域セットのフットプリントサイズに関して（例えば、キロ塩基に基づいて）正規化される。したがって、例えば、第１および第２の標的領域のフットプリントサイズが、それぞれ、５０ｋｂおよび５００ｋｂである場合（正規化係数０．１となる）には、第１の標的領域セットに対応するＤＮＡは、第１の標的領域セットに対応する捕捉されたＤＮＡの体積濃度あたりの質量が、第２の標的領域セットに対応する捕捉されたＤＮＡの体積濃度あたりの質量の０．１倍を上回る場合に、第２の標的領域セットに対応するＤＮＡよりも高い収率で捕捉される。さらなる例として、同じフットプリントサイズを使用すると、第１の標的領域セットに対応する捕捉されたＤＮＡが、第２の標的領域セットに対応する捕捉されたＤＮＡの体積濃度あたりの質量の０．２倍の体積濃度あたりの質量を有する場合には、第１の標的領域セットに対応するＤＮＡは、第２の標的領域セットに対応するＤＮＡよりも２倍高い捕捉収率で捕捉されている。

１つまたは複数の標的核酸を「捕捉する」とは、１つまたは複数の標的核酸を、非標的核酸から優先的に単離または分離することを指す。

核酸の「捕捉されたセット」とは、捕捉を受けた核酸を指す。

「標的領域セット」または「標的領域のセット」とは、捕捉の標的とされる、かつ／またはプローブのセットによって標的とされる（例えば、配列相補性を通じて）、複数のゲノム座を指す。

「標的領域セットに対応する」とは、核酸、例えば、ｃｆＤＮＡが、標的領域セット中の座を起源としているか、または標的領域セットに対する１つまたは複数のプローブに特異的に結合することを意味する。

プローブまたは他のオリゴヌクレオチドおよび標的配列の文脈における「特異的に結合する」とは、適切なハイブリダイゼーション条件下において、オリゴヌクレオチドまたはプローブが、その標的配列またはその複製物にハイブリダイズして、安定なプローブ：標的ハイブリッドを形成し、同時に、安定なプローブ：非標的ハイブリッドの形成を最小限に抑えることを意味する。したがって、プローブは、非標的配列よりも十分に高い程度で、標的配列またはその複製物にハイブリダイズして、標的配列の捕捉または検出を可能にする。適切なハイブリダイゼーション条件は、当技術分野において周知であり、配列組成物に基づいて予測され得るか、または慣例的な試験方法を使用することによって決定することができる（例えば、参照により本明細書に組み込まれる、Sambrook et al., Molecular Cloning, A Laboratory Manual, 2nd ed. (Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989)、§§ 1.90-1.91, 7.37-7.57, 9.47-9.51および11.47-11.57、特に、§§ 9.50-9.51, 11.12-11.13, 11.45-11.47および11.55-11.57を参照されたい）。

「配列可変標的領域セット」とは、新生物細胞（例えば、腫瘍細胞およびがん細胞）において、配列の変化、例えば、ヌクレオチド置換（すなわち、単一ヌクレオチド変異）、挿入、欠失、または遺伝子融合もしくは転位を示し得る、標的領域のセットを指す。

「エピジェネティック標的領域セット」とは、新生物細胞（例えば、腫瘍細胞およびがん細胞）において、配列とは独立した変化を示し得るか、または健康な対象に由来するｃｆＤＮＡと比べて、がんを有する対象に由来するｃｆＤＮＡにおいて配列とは独立した変化を示し得る、標的領域のセットを指す。配列とは独立した変化の例としては、メチル化（増加または減少）、ヌクレオソーム分布、ＣＴＣＦ結合、転写開始部位、および制御性タンパク質結合領域における変化が挙げられるが、これらに限定されない。本目的のために、新生物、腫瘍、またはがんに関連する局所増幅および／または遺伝子融合を受けやすい座もまた、エピジェネティック標的領域セットに含まれ得るが、これは、シーケンシングによるコピー数変化の検出または参照ゲノム内の１つを上回る座にマッピングする融合配列が、例えば、局所増幅および／または遺伝子融合の検出は１つまたは数個の個別の位置における塩基コールの正確度に依存しないため比較的浅いシーケンシング深度で検出することができるという点において、ヌクレオチド置換、挿入、または欠失の検出よりも、上記で考察された例示的なエピジェネティック変化の検出に類似する傾向にあるためである。

核酸は、腫瘍細胞を起源とする場合、「腫瘍によって産生される」またはｃｔＤＮＡもしくは循環腫瘍ＤＮＡによって産生される。腫瘍細胞は、それらが、腫瘍内にとどまっているか、または腫瘍から分離されているか（例えば、転移がん細胞および循環腫瘍細胞の場合にあるような）にかかわらず、腫瘍を起源とする新生物細胞である。

「メチル化」または「ＤＮＡメチル化」という用語は、核酸分子におけるヌクレオチド塩基へのメチル基の付加を指す。一部の実施形態では、メチル化は、ＣｐＧ部位（シトシン－リン酸－グアニン部位（すなわち、核酸配列の５’→３’方向でシトシンの後にグアニンがある）におけるシトシンへのメチル基の付加を指す。一部の実施形態では、ＤＮＡメチル化は、アデニンへのメチル基の付加、例えば、Ｎ^６－メチルアデニンにおけるものを指す。一部の実施形態では、ＤＮＡメチル化は、５－メチル化（シトシンの６炭素環の５番目の炭素の改変）である。一部の実施形態では、５－メチル化は、５－メチルシトシン（５ｍＣ）を作製するためのシトシンの５Ｃ位へのメチル基の付加を指す。一部の実施形態では、メチル化は、５ｍＣの誘導体を含む。５ｍＣの誘導体としては、５－ヒドロキシメチルシトシン（５－ｈｍＣ）、５－ホルミルシトシン（５－ｆＣ）、および５－カルボキシルシトシン（caryboxylcytosine）（５－ｃａＣ）が挙げられるが、これらに限定されない。一部の実施形態では、ＤＮＡメチル化は、３Ｃメチル化（シトシンの６炭素環の３番目の炭素の改変）である。一部の実施形態では、３Ｃメチル化は、３－メチルシトシン（３ｍＣ）を生成するためのシトシンの３Ｃ位へのメチル基の付加を含む。メチル化はまた、非ＣｐＧ部位でも生じ得、例えば、メチル化は、ＣｐＡ、ＣｐＴ、またはＣｐＣ部位で生じ得る。ＤＮＡメチル化は、メチル化ＤＮＡ領域の活性を変化させ得る。例えば、プロモーター領域内のＤＮＡがメチル化された場合、遺伝子の転写が抑制され得る。ＤＮＡメチル化は、正常な発達に極めて重要であり、メチル化の異常は、エピジェネティック調節を破壊し得る。エピジェネティック調節における破壊、例えば、抑制は、疾患、例えば、がんを引き起こし得る。ＤＮＡにおけるプロモーターメチル化は、がんを示し得る。

「高メチル化」という用語は、核酸分子の集団（例えば、試料）内の他の核酸分子と比べて、増加したレベルまたは程度の核酸分子のメチル化を指す。一部の実施形態では、高メチル化ＤＮＡは、少なくとも１個のメチル化された残基、少なくとも２個のメチル化された残基、少なくとも３個のメチル化された残基、少なくとも５個のメチル化された残基、または少なくとも１０個のメチル化された残基を含む、ＤＮＡ分子を含み得る。

「低メチル化」という用語は、核酸分子の集団（例えば、試料）内の他の核酸分子と比べて、減少したレベルまたは程度の核酸分子のメチル化を指す。一部の実施形態では、低メチル化ＤＮＡには、非メチル化ＤＮＡ分子が含まれる。一部の実施形態では、低メチル化ＤＮＡは、０個のメチル化された残基、多くとも１個のメチル化された残基、多くとも２個のメチル化された残基、多くとも３個のメチル化された残基、多くとも４個のメチル化された残基、または多くとも５個のメチル化された残基を含む、ＤＮＡ分子を含み得る。

「メチル化感受性ヌクレアーゼ」という用語は、メチル化ＤＮＡと比べて、非メチル化ＤＮＡを優先的に切断する、ヌクレアーゼを指す。例えば、メチル化感受性ヌクレアーゼは、認識配列内の核酸塩基のうちの少なくとも１つ、例えば、シトシンのメチル化の欠如に依存する様式で、制限部位などの認識配列においてまたはその近傍で、切断し得る。一部の実施形態では、メチル化感受性ヌクレアーゼの核酸溶解活性は、標準的な核酸溶解アッセイにおいて、非メチル化認識配列に対して、メチル化対照と比べて少なくとも１０倍、２０倍、５０倍、または１００倍高い。メチル化感受性ヌクレアーゼは、メチル化感受性制限酵素を含む。

本明細書で使用される場合、「メチル化感受性制限酵素」または「ＭＳＲＥ」は、ＤＮＡのメチル化状態（例えば、シトシンメチル化）に感受性である、制限酵素を指し、すなわち、ヌクレオチド塩基におけるメチル基の存在または非存在により、酵素が標的ＤＮＡを切断する割合が変化する。一部の実施形態では、メチル化感受性制限酵素は、特定のヌクレオチド塩基が、認識配列においてメチル化されている場合、ＤＮＡを切断しない。例えば、ＨｐａＩＩは、認識配列「ＣＣＧＧ」を有するメチル化感受性制限酵素であり、認識配列内の第２のシトシンがメチル化されている場合、ＤＮＡを切断しない。

本明細書で使用される場合、「メチル化状態」は、核酸分子中の特定のゲノム位置のＤＮＡ塩基（例えばシトシン）上のメチル基の存在または非存在を指すことができる。これはまた、核酸配列中のメチル化の程度（例えば、高メチル化、低メチル化、中間メチル化、または非メチル化核酸分子）も指し得る。メチル化状態はまた、特定の核酸分子においてメチル化されたヌクレオチドの数も指し得る。

本明細書で使用される場合、「突然変異」は、公知の参照配列からの変異を指し、例えば単一ヌクレオチド変異体（ＳＮＶ）、および挿入または欠失（インデル）などの突然変異を含む。突然変異は、生殖系列または体細胞突然変異であり得る。一部の実施形態では、比較目的のための参照配列は、試験試料を提供する対象の種の野生型ゲノム配列、典型的にヒトゲノムである。

本明細書で使用される場合、「新生物」および「腫瘍」という用語は、互換的に使用される。それらは、対象における細胞の異常な成長を指す。新生物または腫瘍は、良性、おそらく悪性、または悪性であり得る。悪性腫瘍は、がんまたはがん様腫瘍と呼ばれる。

本明細書で使用される場合、「次世代シーケンシング」または「ＮＧＳ」は、従来のサンガーおよびキャピラリー電気泳動に基づくアプローチと比較して増加した処理能力を有する、例えば一度に何十万もの比較的小さい配列読み取りデータを生成する能力を有するシーケンシングテクノロジーを指す。次世代シーケンシング技術の一部の例としては、これらに限定されないが、合成によるシーケンシング、ライゲーションによるシーケンシング、およびハイブリダイゼーションによるシーケンシングが挙げられる。一部の実施形態では、次世代シーケンシングは、単一の分子をシーケンシングすることが可能な機器の使用を含む。次世代シーケンシングを実施するための市販の機器の例としては、これらに限定されないが、ＮｅｘｔＳｅｑ、ＨｉＳｅｑ、ＮｏｖａＳｅｑ、ＭｉＳｅｑ、ＩｏｎＰＧＭ、およびＩｏｎＧｅｎｅＳｔｕｄｉｏＳ５が挙げられる。

本明細書で使用される場合、「核酸タグ」は、異なる試料からの核酸（例えば、試料インデックスを表す）を識別するため、異なる分配からの核酸（例えば、分配タグを表す）、または異なるタイプのもしくは異なるプロセシングを受けている同じ試料中の異なる核酸分子（例えば、分子バーコードを表す）を識別するために使用される短い核酸（例えば、長さが約５００ヌクレオチド未満、約１００ヌクレオチド未満、約５０ヌクレオチド未満、または約１０ヌクレオチド未満）を指す。核酸タグは、既定の、固定された、非ランダム、ランダム、または半ランダムオリゴヌクレオチド配列を含む。そのような核酸タグは、異なる核酸分子または異なる核酸試料もしくは部分試料を標識するために使用され得る。核酸タグは、一本鎖、二本鎖、または少なくとも部分的に二本鎖であり得る。核酸タグは、必要に応じて同じ長さまたは多様な長さを有する。核酸タグはまた、１つもしくは複数の平滑末端を有する二本鎖分子を含み、５’もしくは３’一本鎖領域（例えば、オーバーハング）を含み、および／または所定の分子内の他の場所で１つもしくは複数の他の一本鎖領域を含み得る。核酸タグは、他の核酸（例えば、増幅および／またはシーケンシングされる試料核酸）の１つの末端または両方の末端に付着させることができる。核酸タグは、所定の核酸の起源の試料、形態、またはプロセシングなどの情報を明らかにするために復号することができる。例えば、核酸タグはまた、核酸タグを検出する（例えば、読み取る）ことによって核酸がその後にデコンボリュートされる、異なる分子バーコードおよび／または試料インデックスを有する核酸を含む複数の試料のプールおよび／または並列プロセシングを可能にするためにも使用することができる。核酸タグはまた、識別子（例えば、分子識別子、試料識別子）とも呼ばれ得る。さらに、またはあるいは、核酸タグは分子識別子（例えば、異なる分子、または同じ試料もしくは部分試料中の異なる親分子のアンプリコンの間を識別するために）として使用することができる。これは、例えば、所定の試料中の異なる核酸分子を一意的にタグ付けすること、またはそのような分子を非一意的にタグ付けすることを含む。非一意的タグ付け応用の場合、限定数のタグ（すなわち、分子バーコード）を使用して、異なる分子を、少なくとも１つの分子バーコードと組み合わせてその内因性の配列情報（例えば、それらが選択された参照ゲノムにマッピングされる開始および／もしくは終止位置、配列の一方もしくは両方の末端の部分配列、ならびに／または配列の長さ）に基づいて識別することができるように、各核酸分子をタグ付けしてもよい。典型的に、任意の２つの分子が同じ内因性の配列情報（例えば、開始および／もしくは終止位置、配列の一方もしくは両方の末端の部分配列、ならびに／または長さ）を有し得る確率、同様に同じ分子バーコードを有し得る確率が低くなるように（例えば、約１０％未満、約５％未満、約１％未満、または約０．１％未満の見込み）、十分数の異なる分子バーコードを使用する。

本明細書で使用される場合、「分配すること」とは、核酸分子の特徴に基づいて、試料中の核酸分子の混合物を物理的に分離または分画することを指す。分配は、分子の物理的分配であり得る。分配は、核酸分子を、エピジェネティック特色（例えば、メチル化に関する）のレベルに基づいて、群またはセットに分離することを含み得る。例えば、核酸分子は、核酸分子のメチル化のレベルに基づいて、分配することができる。一部の実施形態では、分配に使用される方法およびシステムは、ＰＣＴ特許出願第ＰＣＴ／ＵＳ２０１７／０６８３２９号に見出すことができ、これは、参照によりその全体が本明細書に組み込まれる。

本明細書で使用される場合、「分配セット」または「分配」は、核酸分子または核酸分子と会合したタンパク質の結合剤への差次的結合親和性に基づいてセットまたは群に分配された、核酸分子のセットを指す。分配セットはまた、部分試料とも称され得る。結合剤は、エピジェネティック改変を有するヌクレオチドを含む核酸分子に優先的に結合する。例えば、エピジェネティック改変がメチル化である場合、結合剤は、メチル結合ドメイン（ＭＢＤ）タンパク質であり得る。一部の実施形態では、分配セットは、特定のエピジェネティック特色（例えば、メチル化）のレベルまたは程度に属する核酸分子を含み得る。例えば、核酸分子は、高度メチル化核酸分子の１つのセット（第１の部分試料、高分配、高分配セット、または高メチル化分配セット）、低メチル化核酸分子の第２のセット（第２の部分試料、低分配、低分配セット、または低メチル化分配セット）、および中間メチル化核酸分子の第３のセット（第３の部分試料、中間分配セット、中間メチル化分配セット、残留分配セット、または残留分配）の３つのセットに分配され得る。別の例では、核酸分子は、メチル化ヌクレオチドの数に基づいて、分配され得、１つの分配セットは、９個のメチル化ヌクレオチドを有する核酸分子を有し得、別の分配セットは、非メチル化核酸分子（０個のメチル化ヌクレオチド）を有し得る。

本明細書で使用される場合、「ポリヌクレオチド」、「核酸」、「核酸分子」、または「オリゴヌクレオチド」は、ヌクレオシド間の連結によって接合したヌクレオシド（デオキシリボヌクレオシド、リボヌクレオシド、またはそのアナログを含む）の線形ポリマーを指す。典型的に、ポリヌクレオチドは、少なくとも３つのヌクレオシドを含む。オリゴヌクレオチドはしばしば、少数の単量体単位、例えば３～４から数百もの単量体単位のサイズの範囲である。ポリヌクレオチドが文字の配列、例えば「ＡＴＧＣＣＴＧ」によって表される場合は必ず、ヌクレオチドは、左から右に５’→３’の順であり、ＤＮＡの場合、特に記載されていない限り、「Ａ」はデオキシアデノシンを示し、「Ｃ」は、デオキシシチジンを示し、「Ｇ」は、デオキシグアノシンを示し、「Ｔ」は、デオキシチミジンを示す。文字Ａ、Ｃ、Ｇ、およびＴは、塩基そのもの、ヌクレオシド、または塩基を含むヌクレオチドを指すために使用され得る。

本明細書で使用される場合、「プロセシング」は、シーケンシングにとって好適である核酸のライブラリーを生成するために使用されるステップのセットを指す。ステップのセットは、これらに限定されないが、分配するステップ、末端修復するステップ、シーケンシングアダプターの付加、タグ付けするステップ、および／または核酸のＰＣＲ増幅を含み得る。

本明細書で使用される場合、「定量的測定」は、絶対的または相対的測定を指す。定量的測定は、これらに限定されないが、数、統計学的測定（例えば、頻度、平均値、中央値、標準偏差、または分位数）、または程度もしくは相対的数量（例えば、高、中、および低）であり得る。定量的測定は、２つの定量的測定の比であり得る。定量的測定は、定量的測定の線形の組合せであり得る。定量的測定は正規化した測定であり得る。

本明細書で使用される場合、「参照配列」は、実験によって決定した配列と比較する目的のために使用される公知の配列を指す。例えば、公知の配列は、全ゲノム、染色体、またはその任意のセグメントであり得る。参照配列は、ゲノム、もしくは染色体、もしくは染色体アームの単一の連続する配列と整列することができるか、またはゲノムもしくは染色体の異なる領域と整列する非連続セグメントを含み得る。参照配列の例としては、例えばヒトゲノム、例えばｈｇ１９およびｈｇ３８が挙げられる。

本明細書で使用される場合、「制限酵素」は、特異的認識部位またはその付近でＤＮＡを認識し、切断する酵素である。

本明細書で使用される場合、「試料」は、本明細書に開示される方法および／またはシステムによって解析されることが可能な任意のものを意味する。

本明細書で使用される場合、「シーケンシング」は、生体分子、例えばＤＮＡまたはＲＮＡなどの核酸の配列（例えば、同一性および単量体単位の順序）を決定するために使用されるいくつかのテクノロジーのいずれかを指す。シーケンシング方法の例としては、これらに限定されないが、標的化シーケンシング、一分子リアルタイムシーケンシング、エクソンまたはエクソームシーケンシング、イントロンシーケンシング、電子顕微鏡に基づくシーケンシング、パネルシーケンシング、トランジスタ媒介シーケンシング、直接シーケンシング、ランダムショットガンシーケンシング、サンガージデオキシターミネーションシーケンシング、全ゲノムシーケンシング、ハイブリダイゼーションによるシーケンシング、パイロシーケンシング、二重鎖シーケンシング、サイクルシーケンシング、一塩基伸長シーケンシング、固相シーケンシング、ハイスループットシーケンシング、超並列シグネチャーシーケンシング、エマルジョンＰＣＲ、より低い変性温度での同時増幅－ＰＣＲ（ＣＯＬＤ－ＰＣＲ）、マルチプレックスＰＣＲ、可逆的色素ターミネーターによるシーケンシング、ペアードエンドシーケンシング、ニアターム（near-term）シーケンシング、エキソヌクレアーゼシーケンシング、ライゲーションによるシーケンシング、ショートリードシーケンシング、一分子シーケンシング、合成によるシーケンシング、リアルタイムシーケンシング、リバースターミネーターシーケンシング、ナノポアシーケンシング、４５４シーケンシング、ＳｏｌｅｘａＧｅｎｏｍｅＡｎａｌｙｚｅｒシーケンシング、ＳＯＬｉＤ（商標）シーケンシング、ＭＳ－ＰＥＴシーケンシング、およびそれらの組合せが挙げられる。一部の実施形態では、シーケンシングは、遺伝子アナライザー、数ある中でも例えばＩｌｌｕｍｉｎａ，Ｉｎｃ．、ＰａｃｉｆｉｃＢｉｏｓｃｉｅｎｃｅｓ，Ｉｎｃ．、またはＡｐｐｌｉｅｄＢｉｏｓｙｓｔｅｍｓ／ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃなどから市販されている遺伝子アナライザーによって実施され得る。

本明細書で使用される場合、核酸ポリマーの文脈における「配列情報」は、そのポリマーにおける単量体単位（例えば、ヌクレオチドなど）の順序および同一性を意味する。

本明細書で使用される場合、「配列可変標的領域セット」とは、新生物細胞（例えば、腫瘍細胞およびがん細胞）において、配列の変化、例えば、ヌクレオチド置換、挿入、欠失、または遺伝子融合もしくは転位を示し得る、標的領域のセットを指す。

本明細書で使用される場合、「体細胞突然変異」または「体細胞変異」という用語は、互換的に使用される。それらは、受胎後に起こるゲノムの突然変異を指す。体細胞突然変異は、生殖細胞を除く体の任意の細胞で起こり得、したがって子孫に受け継がれない。

本明細書で使用される場合、プローブまたは他のオリゴヌクレオチドおよび標的配列の文脈における「特異的に結合する」は、適切なハイブリダイゼーション条件下で、オリゴヌクレオチドまたはプローブがその標的配列またはその複製物にハイブリダイズして安定なプローブ：標的ハイブリッドを形成するが、同時に安定なプローブ：非標的ハイブリッドの形成は最小限であることを意味する。このように、プローブは、非標的配列に対してよりも十分に大きい程度に標的配列またはその複製物にハイブリダイズして、標的配列の捕捉または検出を可能にする。適切なハイブリダイゼーション条件は、当技術分野で周知であり、配列組成に基づいて予測され得るか、または通常の試験方法を使用することにより決定され得る（例えば、参照により本明細書に組み込まれる、Sambrook et al., Molecular Cloning, A Laboratory Manual, 2nd ed.(Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989)§§ 1.90-1.91, 7.37-7.57, 9.47-9.51および11.47-11.57、特に§§ 9.50-9.51, 11.12-11.13, 11.45-11.47および11.55-11.57を参照されたい）。

本明細書で使用される場合、「対象」は、動物、例えば哺乳動物種（例えば、ヒト）、または鳥類（例えば、鳥）種、または他の生物、例えば植物を指す。より具体的には、対象は脊椎動物、例えば哺乳動物、例えばマウス、霊長類、サル、またはヒトであり得る。動物は、農場動物（例えば、肉牛、乳牛、家禽、ウマ、ブタなど）、競技用動物、およびコンパニオン動物（例えば、ペットまたは介助動物）を含む。対象は、健康な個体、疾患もしくは疾患に対する素因を有するもしくは有することが疑われる個体、または治療を必要とするもしくは治療を必要とすることが疑われる個体であり得る。「個体」または「患者」という用語は、「対象」と互換的であると意図される。例えば、対象は、がんを有すると診断されている、がん治療を受ける予定である、および／または少なくとも１つのがん治療を受けたことがある個体であり得る。対象はがんの寛解期にあり得る。別の例として、対象は、自己免疫疾患を有すると診断された個体であり得る。別の例として、対象は、疾患、例えばがん、自己免疫疾患を有すると診断されているまたは有することが疑われ得る、妊娠中であるまたは妊娠を計画している女性個体であり得る。

本明細書で使用される場合、「標的領域セット」または「標的領域のセット」、または「標的領域」、または「目的の標的領域」、または「目的の領域」、または「目的のゲノム領域」は、捕捉のために標的化されるおよび／またはプローブのセットによって標的化される（例えば、配列相補性を通して）複数のゲノム座または複数のゲノム領域を指す。

本明細書で使用される場合、「腫瘍分画」は、所定の試料または試料－領域対に関する、腫瘍細胞を起源とするｃｆＤＮＡ分子の割合を指す。

「またはその組合せ」（単数および複数）という用語は、本明細書で使用される場合、用語の前に列挙される用語のあらゆる全ての順列および組合せを指す。例えば、「Ａ、Ｂ、Ｃ、またはそれらの組合せ」は、Ａ、Ｂ、Ｃ、ＡＢ、ＡＣ、ＢＣ、またはＡＢＣのうちの少なくとも１つを含むと意図され、特定の文脈において順序が重要である場合、ＢＡ、ＣＡ、ＣＢ、ＡＣＢ、ＣＢＡ、ＢＣＡ、ＢＡＣ、またはＣＡＢも含むと意図される。この例を続けると、１つまたは複数の項目または用語の反復、例えばＢＢ、ＡＡＡ、ＡＡＢ、ＢＢＣ、ＡＡＡＢＣＣＣＣ、ＣＢＢＡＡＡ、ＣＡＢＡＢＢなどを含有する組合せが明白に含まれる。当業者は、文脈から特に明白でない限り、典型的に任意の組合せにおける項目または用語の数に制限はないことを理解するであろう。

「または」は、包括的な意味で使用され、すなわち文脈が特に必要としていない限り、「および／または」と等価である。
Ｂ．例示的な方法
１．概要

がんの形成および進行は、デオキシリボ核酸（ＤＮＡ）の遺伝子改変およびエピジェネティック特色の両方から生じ得る。本開示は、無細胞ＤＮＡ（ｃｆＤＮＡ）などのＤＮＡを解析するための方法およびシステムを提供する。本開示は、メチル化分配アッセイのシグナル対ノイズ比を低減するための方法およびシステムを提供する。

いかなる特定の理論にも拘束されることを望まないが、がんまたは新生物におけるまたはその周囲の細胞は、健康な対象における同じ組織タイプの細胞よりも多くのＤＮＡを脱落させ得る。そのため、ある特定のＤＮＡ試料、例えばｃｆＤＮＡの起源の組織の分布は、発癌の際に変化し得る。このため、例えば、少なくとも１つの他の組織タイプよりも健康なｃｆＤＮＡにおいて低いメチル化を示す高メチル化可変標的領域のレベルの増加は、がんの存在（または対象の既往に応じて再発）の指標であり得る。同様に、試料中の低メチル化可変標的領域のレベルの増加は、がんの存在（または対象の既往に応じて再発）の指標であり得る。

さらに、がんは、メチル化などの非配列改変によって示され得る。がんにおけるメチル化変化の例としては、正常な成長の制御、ＤＮＡ修復、細胞周期調節、および／または細胞分化に関係する遺伝子のＴＳＳでＣｐＧアイランドにおけるＤＮＡメチル化の局所増加が挙げられる。この高メチル化は、関係する遺伝子の転写能の異常な喪失に関連し得、変更された遺伝子発現の原因としての点突然変異および欠失と少なくとも同程度の頻度で起こる。

したがって、ＤＮＡメチル化プロファイリングを使用して、試料のＤＮＡにおける異常なメチル化を検出することができる。ＤＮＡは、所与の試料タイプ（例えば、血流に由来するｃｆＤＮＡ）において通常高メチル化または低メチル化されているが、例えば、その試料タイプへの組織の寄与が異常に増加しているために（例えば、新生物もしくはがんにおけるまたはその周囲のＤＮＡの脱落の増加に起因して）、および／または発達中に変更されるか、もしくは疾患、例えば、がんもしくは任意のがん関連疾患によって乱れる、ゲノムのメチル化の程度から、新生物またはがんと相関する異常なメチル化の程度を示し得る、ある特定のゲノム領域（「差次的にメチル化された領域」または「ＤＭＲ」）に対応し得る。

一部の実施形態では、ＤＮＡメチル化は、ＣｐＧ部位（シトシン－リン酸－グアニン部位（すなわち、核酸配列の５’→３’方向にシトシンの後にグアニン）でのシトシン残基へのメチル基の付加を含む。一部の実施形態では、ＤＮＡメチル化は、例えばＮ^６－メチルアデニンの場合のように、アデニン残基へのメチル基の付加を含む。一部の実施形態では、ＤＮＡメチル化は５－メチル化（シトシンの６－炭素環の５番目の炭素の改変）である。一部の実施形態では、５－メチル化は、５－メチルシトシン（ｍ５ｃまたは５－ｍＣまたは５ｍＣ）を作製するためのシトシン残基の５Ｃ位へのメチル基の付加を含む。一部の実施形態では、メチル化は、ｍ５ｃの誘導体を含む。ｍ５ｃの誘導体としては、これらに限定されないが、５－ヒドロキシメチルシトシン（５－ｈｍＣまたは５ｈｍＣ）、５－ホルミルシトシン（５－ｆＣ）、および５－カルボキシルシトシン（５－ｃａＣ）が挙げられる。一部の実施形態では、ＤＮＡメチル化は３Ｃメチル化（シトシン残基の６－炭素環の３番目の炭素の改変）である。一部の実施形態では、３Ｃメチル化は、３－メチルシトシン（３ｍＣ）を生成するためのシトシン残基の３Ｃ位へのメチル基の付加を含む。メチル化はまた、非ＣｐＧ部位でも起こり得、例えばメチル化は、ＣｐＡ、ＣｐＴ、またはＣｐＣ部位で起こり得る。ＤＮＡメチル化は、メチル化ＤＮＡ領域の活性を変化させることができる。例えば、プロモーター領域のＤＮＡがメチル化される場合、遺伝子の転写は抑制され得る。ＤＮＡメチル化は、正常な発達にとって極めて重要であり、メチル化の異常はエピジェネティック調節を破壊し得る。エピジェネティック調節の破壊、例えば抑制は、がんなどの疾患を引き起こし得る。ＤＮＡにおけるプロモーターのメチル化はがんを示し得る。

メチル化プロファイリングは、ゲノムの異なる領域にわたるメチル化パターンを決定することを含み得る。例えば、メチル化の程度（例えば、分子あたりのメチル化ヌクレオチドの相対数）に基づいて分子を分配およびシーケンシングした後、異なる分配中の分子の配列を参照ゲノムにマッピングすることができる。これは、他の領域と比較してより高度にメチル化されるか、またはあまり高度にメチル化されないゲノムの領域を示すことができる。このようにして、ゲノム領域は、個々の分子と対比するとメチル化の程度が異なり得る。

一部の実施形態では、メチル化プロファイリングから得られたシグナルを、体細胞変異（例えば、ＳＮＶ、インデル、ＣＮＶ、および遺伝子融合）から得られたシグナルと組み合わせることにより、がんの検出が容易となる。

試料中の核酸分子は、核酸分子のメチル化状態に基づいて、分画または分配され得る。試料中の核酸分子を分配することにより、希少なシグナルが増加し得る。例えば、高メチル化ＤＮＡに存在するが、低メチル化ＤＮＡにはあまり（またはまったく）存在しない、遺伝的変異は、試料を、高メチル化核酸分子と低メチル化核酸分子とに分配することによって、より容易に検出することができる。試料の複数の分画を解析することによって、単一分子の多次元解析を行うことができ、したがって、より高い感度を達成することができる。分配は、核酸分子を、１つまたは複数のメチル化ヌクレオチドの存在または非存在に基づいて、サブセットまたは群に物理的に分配することを含み得る。試料は、差次的遺伝子発現または疾患状態を示す特徴に基づいて、１つまたは複数の分配セットに分画または分配され得る。試料は、核酸、例えば、無細胞ＤＮＡ（「ｃｆＤＮＡ」）、非ｃｆＤＮＡ、腫瘍ＤＮＡ、循環腫瘍ＤＮＡ（「ｃｔＤＮＡ」）、および無細胞核酸（「ｃｆＮＡ」）の解析中に、正常状態および罹患状態の間でシグナルに相違をもたらす特徴またはその組合せに基づいて、分画され得る。

分配する手順は、部分試料間で、ＤＮＡ分子の不完全な選別をもたらす場合がある。例えば、第２の部分試料中の分子のうちの少数部分は、高度に改変されていてもよく（例えば、高メチル化）、および／または第１の部分試料中の分子のうちの少数部分は、改変されていないかもしくはほとんど改変されていなくてもよい（例えば、非メチル化であるかもしくはほとんど非メチル化である）。第２の部分試料中の高度に改変された分子および第１の部分試料中の改変されていないかほとんど改変されていない分子は、非特異的に分配されると考えられる。本明細書に記載される方法は、非特異的に分配されたＤＮＡに由来する技術的ノイズを、例えば、非特異的に分配されたＤＮＡをシーケンシングの後に同定することができるようにある特定の塩基を変換することによって、および／またはそれを分解することによって、低減させることができるステップを含む。したがって、本明細書に記載される方法は、改善された感度および／または合理化された解析を提供し得る。

図１は、例えば、ｃｆＤＮＡ試料で開始する、本開示のある特定の実施形態による、がんの存在または非存在を検出するための例示的なワークフローを図示し、ここで、ｃｆＤＮＡを、血液試料から単離し、ｃｆＤＮＡ試料は、高メチル化可変標的領域（高ＤＭＲ）に属するｃｆＤＮＡ分子および低メチル化可変標的領域（低ＤＭＲ）に属するｃｆＤＮＡ分子、ならびに非メチル化対照領域に属するｃｆＤＮＡ分子を含む。ｃｆＤＮＡは、メチル結合ドメインタンパク質（ＭＢＤ）を使用して、低メチル化部分試料および高メチル化部分試料に分配され、各部分試料を、分子バーコード化に供して、部分試料に由来するＤＮＡを識別可能にタグ付けし、低部分試料、および必要に応じて高部分試料を、変換手順に供して、非特異的に分配された分子の同定を容易にし、次いで、分配セットをプールし、捕捉し、増幅させ、シーケンシングする。低部分試料で使用される変換手順は、ｍＣの塩基対形成特異性を変化させるが、非メチル化Ｃには影響を及ぼさない変換手順、例えば、ＴＡＰであり得る。使用される場合、高試料の変換手順は、Ｃの塩基対形成特異性を変化させるが、ｍＣには影響を及ぼさない変換手順、例えば、ＥＭであり得る。

図２は、対象から得られた試料中の核酸分子のメチル化状態を決定するための方法２００の例としての実施形態を図示する。２０２において、ポリヌクレオチド試料を、対象から得る。一部の実施形態では、試料は、腫瘍組織生検から得られたＤＮＡ試料である。一部の実施形態では、試料は、血液から得られた無細胞ＤＮＡ（ｃｆＤＮＡ）試料である。２０４において、ポリヌクレオチド試料を、少なくとも２つの分配セット（部分試料）に分配する。一部の実施形態では、分配は、メチル化ヌクレオチドを含むポリヌクレオチドに優先的に結合する結合剤に対するポリヌクレオチドの差次的結合親和性に基づいて、核酸分子を分配することを含む。

２０６において、少なくとも１つの分配セット、例えば、第２の部分試料（低メチル化分配）内の核酸分子は、塩基変換手順、すなわち、第２の部分試料のＤＮＡ内の第１の核酸塩基に対してＤＮＡ内の第２の核酸塩基とは異なって影響を及ぼす手順に供され、第１の核酸塩基は改変または非改変核酸塩基であり、第２の核酸塩基は第１の核酸塩基とは異なる改変または非改変核酸塩基であり、第１の核酸塩基および第２の核酸塩基は同じ塩基対形成特異性を有し、それによって処置された部分試料を産生する。様々な変換手順が、本明細書に記載されている。一部の実施形態では、変換手順は、メチル化シトシンを異なる核酸塩基に変換する。第１および第２の部分試料が変換手順に供される場合、手順は、同じであっても異なってもよい。一部の実施形態では、第１の部分試料は、メチル化シトシンを異なる核酸塩基に変換する手順に供され、第２の部分試料は、非メチル化シトシンを異なる核酸塩基に変換する手順に供される。

一部の実施形態では、変換の前に、少なくとも１つのアダプターを、核酸分子の少なくとも一方の末端（すなわち、ＤＮＡ分子の５’および／または３’末端）に付着させる。他の実施形態では、消化の後であるが、２０８において富化する前に、少なくとも１つのアダプターを、核酸分子の少なくとも一方の末端に付着させる。一部の実施形態では、アダプターは、例えば、非メチル化であるヌクレオチドまたは適切なヌクレオチドアナログの存在に起因して、変換手順による変換に抵抗性である。

２０８において、変換の後に、１つまたは複数の分配セット中の核酸分子は、目的のゲノム領域に関して富化することができる。あるいは、富化ステップは、分配するステップの前に行うことができる。一部の実施形態では、目的のゲノム領域は、がんの検出のために差次的にメチル化された領域（例えば、高メチル化可変標的領域セットおよび／または低メチル化可変標的領域セット）を含み得る。２１０において、富化された分子の少なくともサブセットを、次世代シーケンサーによってシーケンシングする。２１２において、シーケンサーによって生成されたシーケンシング読み取りデータを、次いで、バイオインフォマティックツール／アルゴリズムを使用して解析して、１つまたは複数の分配セット中の分子の数を決定し、次にこれを使用して、少なくとも１つの分配セット中の核酸分子の１つまたは複数の遺伝子座でのメチル化状態を決定する。一部の実施形態では、１つまたは複数の遺伝子座は、複数の遺伝子座を含み得る。一部の実施形態では、１つまたは複数の遺伝子座は、１つまたは複数のゲノム領域を含み得る。一部の実施形態では、ゲノム領域は、遺伝子のプロモーター領域であり得る。一部の実施形態では、シーケンシングの前に、核酸分子を、ＰＣＲ増幅によって増幅することができる。一部の実施形態では、増幅において使用されるプライマーは、少なくとも１つの試料インデックスを含み得る。

図３は、本開示の実施形態による、対象から得られた試料中の核酸分子のメチル化状態を決定するための方法３００の例としての実施形態を図示する。３０２において、ポリヌクレオチド試料を、対象から得る。一部の実施形態では、ポリヌクレオチド試料は、腫瘍組織生検から得られたＤＮＡ試料である。一部の実施形態では、ポリヌクレオチド試料は、血液から得られた無細胞ＤＮＡ（ｃｆＤＮＡ）試料である。３０４において、ポリヌクレオチド試料を、少なくとも２つの分配セットに分配する。一部の実施形態では、分配は、メチル化ヌクレオチドを含むポリヌクレオチドに優先的に結合する結合剤に対するポリヌクレオチドの差次的結合親和性に基づいて、核酸分子を分配することを含む。結合剤の例としては、メチル結合ドメイン（ＭＢＤ）、メチル結合タンパク質（ＭＢＰ）、およびメチル化ヌクレオチドに対する抗体が挙げられるがこれらに限定されず、これらは、本明細書の他の箇所において詳細に考察されている。

３０６において、１つまたは複数の分配セット中の核酸分子を、アダプターに付着させ、アダプターは、少なくとも１つのタグを含み、核酸分子の少なくとも一方の末端（すなわち、ＤＮＡ分子の５’および／３’末端）に付着させられる。一部の実施形態では、タグが、アダプターの構成要素として提供され得る。一部の実施形態では、タグは、分子バーコード（すなわち、分子識別子）を含む。一部の実施形態では、一方の分配セット中の核酸分子に付着させられるタグは、他方の分配セット中の核酸分子に付着させられるタグとは異なる。一部の実施形態では、一方の分配セットは、他方の分配セットとは差次的にタグ付けされる。分配セットの差次的タグ付けは、特定の分配セットに属する核酸分子を追跡し続けるのを補助する。異なる分配セット中の核酸分子は、一方の分配セットのメンバーを別のものと識別することが可能な異なるタグを受容する。同じ分配セットの核酸分子に連結されるタグは、互いに同じであっても、異なってもよい。しかし、互いに異なる場合、タグは、それらが付着した分子を、特定の分配セットのものであるとして同定するように、共通した配列の部分を有し得る。例えば、試料の分子が、Ｐ１およびＰ２の２つの分配セットに分配される場合には、Ｐ１内の分子は、Ａ１、Ａ２、Ａ３などでタグ付けされ得、Ｐ２内の分子は、Ｂ１、Ｂ２、Ｂ３、などでタグ付けされ得る。そのようなタグ付けシステムにより、分配セット、および分配セット内の分子間で、識別することが可能となる。一部の実施形態では、タグは、分配タグ（すなわち、分配識別子）を含む。そのような実施形態では、分配セット内の核酸分子は、同じ分配タグを受容し、これは、他の分配セットの核酸分子に付着させられる分配タグとは異なる。

３０８において、少なくとも１つの分配セット、例えば、第２の部分試料（低メチル化分配）内の核酸分子は、塩基変換手順、すなわち、第２の部分試料のＤＮＡ内の第１の核酸塩基に対してＤＮＡ内の第２の核酸塩基とは異なって影響を及ぼす手順に供され、第１の核酸塩基は改変または非改変核酸塩基であり、第２の核酸塩基は第１の核酸塩基とは異なる改変または非改変核酸塩基であり、第１の核酸塩基および第２の核酸塩基は同じ塩基対形成特異性を有し、それによって処置された部分試料を産生する。様々な変換手順が、本明細書に記載されている。一部の実施形態では、変換手順は、メチル化シトシンを異なる核酸塩基に変換する。第１および第２の部分試料が変換手順に供される場合、手順は、同じであっても異なってもよい。一部の実施形態では、第１の部分試料は、メチル化シトシンを異なる核酸塩基に変換する手順に供され、第２の部分試料は、非メチル化シトシンを異なる核酸塩基に変換する手順に供される。

一部の実施形態では、アダプターは、塩基変換手順による変換に対して抵抗性である。一部の実施形態では、第２の部分試料に付着したアダプターは、非メチル化であるヌクレオチドを含むか、またはそれからなる。一部の実施形態では、第１の部分試料に付着したアダプターは、メチル化ヌクレオチドを含む。一部の実施形態では、アダプターは、メチル化依存性制限酵素に対して抵抗性の１つまたは複数のヌクレオチドアナログを含む。

３１０において、変換の後に、１つまたは複数の分配セット中の核酸分子は、目的のゲノム領域に関して富化することができる。あるいは、富化ステップは、分配するステップの前に行うことができる。一部の実施形態では、目的のゲノム領域は、がん検出のために差次的にメチル化された領域を含み得る。３１２において、富化された分子の少なくともサブセットを、次世代シーケンサーによってシーケンシングする。３１４において、シーケンサーによって生成されたシーケンシング読み取りデータを、次いで、バイオインフォマティックツール／アルゴリズムを使用して解析して、１つまたは複数の分配セット中の分子の数を決定し、次にこれを使用して、少なくとも１つの分配セット中の核酸分子の１つまたは複数の遺伝子座でのメチル化状態を決定する。一部の実施形態では、１つまたは複数の遺伝子座は、複数の遺伝子座を含み得る。一部の実施形態では、１つまたは複数の遺伝子座は、１つまたは複数のゲノム領域を含み得る。一部の実施形態では、ゲノム領域は、遺伝子のプロモーター領域であり得る。一部の実施形態では、シーケンシングの前に、核酸分子を、ＰＣＲ増幅によって増幅することができる。一部の実施形態では、増幅において使用されるプライマーは、少なくとも１つの試料インデックスを含み得る。

一部の実施形態では、方法は、例えば、少なくとも１つの分配セット中の核酸分子の１つまたは複数の遺伝子座でのメチル化状態に基づいて、対象におけるがんの存在または非存在を検出するステップをさらに含み得る。一部の実施形態では、方法は、ポリヌクレオチド試料における腫瘍細胞に由来するＤＮＡのレベルを決定するステップをさらに含む。
２．試料を複数の部分試料に分配する；試料の態様

本明細書に記載されるある特定の実施形態では、異なる形態の核酸の集団（例えば、試料中の高メチル化および低メチル化ＤＮＡ、例えば、ｃｆＤＮＡ）は、さらなる解析、例えば、ヌクレアーゼと接触させ、核酸塩基を差次的に改変もしくは単離し、タグ付けし、および／またはシーケンシングする前に、核酸の１つまたは複数の特徴に基づいて、物理的に分配され得る。このアプローチを使用して、例えば、ある特定の配列が、高メチル化であるかまたは低メチル化であるかを決定することができる。さらに、不均一な核酸集団を分配することによって、例えば、集団の１つの分画（または分配）により多く存在する希少な核酸分子を富化することにより、希少なシグナルを増加させることができる。例えば、高メチル化ＤＮＡに存在するが、低メチル化ＤＮＡにはあまり（またはまったく）存在しない、遺伝的変異は、試料を、高メチル化核酸分子と低メチル化核酸分子とに分配することによって、より容易に検出することができる。試料の複数の分画を解析することによって、核酸のゲノムまたは種の単一の座の多次元解析を行うことができ、したがって、より高い感度を達成することができる。

一部の例では、不均一な核酸試料は、２つまたはそれよりも多くの分配（例えば、少なくとも３つ、４つ、５つ、６つ、または７つの分配）に分配される。試料の分配は、本明細書において、部分試料とも称される。一部の実施形態では、各分配は、差次的にタグ付けされる。タグ付けされた分配は、次いで、集合的試料調製および／またはシーケンシングのために、一緒にプールされ得る。分配－タグ付け－プーリングのステップは、１回を上回って行われ得、各回の分配は、異なる特徴（例は本明細書に提供されている）に基づいて行われ、他の分配および分配手段と識別される差次的タグを使用してタグ付けされる。

分配に使用することができる特徴の例としては、配列の長さ、メチル化レベル、ヌクレオソーム結合、配列ミスマッチ、免疫沈降、および／またはＤＮＡに結合するタンパク質が挙げられる。結果として得られる分配は、以下の核酸形態のうちの１つまたは複数を含み得る：一本鎖ＤＮＡ（ｓｓＤＮＡ）、二本鎖ＤＮＡ（ｄｓＤＮＡ）、より短いＤＮＡ断片、およびより長いＤＮＡ断片。一部の実施形態では、シトシン改変（例えば、シトシンメチル化）またはメチル化に基づく分配が一般に行われ、必要に応じて、前述のＤＮＡの特徴または形態のうちのいずれかに基づき得る少なくとも１つの追加の分配するステップと組み合わされる。一部の実施形態では、不均一な核酸集団は、１つまたは複数のエピジェネティック改変を有する核酸および１つまたは複数のエピジェネティック改変を有さない核酸に分配される。エピジェネティック改変の例としては、メチル化の存在または非存在；メチル化のレベル；メチル化のタイプ（例えば、５－メチルシトシン対他のタイプのメチル化、例えば、アデニンメチル化および／またはシトシンヒドロキシメチル化）、ならびに１つまたは複数のタンパク質、例えばヒストンとの会合および会合のレベルが挙げられる。あるいはまたはさらに、不均一な核酸集団は、ヌクレオソームと会合した核酸分子およびヌクレオソームが欠如した核酸分子に分配され得る。あるいはまたはさらに、不均一な核酸集団は、一本鎖ＤＮＡ（ｓｓＤＮＡ）および二本鎖ＤＮＡ（ｄｓＤＮＡ）に分配してもよい。あるいはまたはさらに、不均一な核酸集団は、核酸の長さ（例えば、最大で１６０ｂｐの分子および１６０ｂｐより長い長さを有する分子）に基づいて分配してもよい。

一部の例では、各分配（異なる核酸形態を表す）は、差次的に標識され、分配は、シーケンシングする前に一緒にプールされる。他の例では、異なる形態は、別個にシーケンシングされる。

一部の実施形態では、異なる核酸の集団は、２つまたはそれよりも多くの異なる分配に分配される。各分配は、異なる核酸形態を表し、第１の分配（部分試料とも称される）は、第２の部分試料よりも高い割合でシトシン改変を有するＤＮＡを含む。各分配は、明確にタグ付けされる。第１の部分試料は、第１の部分試料のＤＮＡ内の第１の核酸塩基に対してＤＮＡ内の第２の核酸塩基とは異なって影響を及ぼす手順に供され、第１の核酸塩基は、改変または非改変核酸塩基であり、第２の核酸塩基は、第１の核酸塩基とは異なる改変または非改変核酸塩基であり、第１の核酸塩基および第２の核酸塩基は、同じ塩基対形成特異性を有する。タグ付けされた核酸は、シーケンシングの前に一緒にプールされる。配列読み取りデータを得、例えば、第１の部分試料のＤＮＡにおいて第１の核酸塩基を第２の核酸塩基と識別するために、ｉｎｓｉｌｉｃｏで解析する。タグを使用して、異なる分配に由来する読み取りデータを選別する。遺伝的変異体を検出するための解析は、分配ごとのレベル、ならびに全核酸集団レベルで行われ得る。例えば、解析は、各分配中の核酸における遺伝的変異体、例えば、ＣＮＶ、ＳＮＶ、インデル、融合を決定するためのｉｎｓｉｌｉｃｏ解析を含み得る。一部の例では、ｉｎｓｉｌｉｃｏ解析は、クロマチン構造を決定することを含み得る。例えば、配列読み取りデータのカバレッジを使用して、クロマチンにおけるヌクレオソームの位置付けを決定することができる。より高いカバレッジは、ゲノム領域におけるより高いヌクレオソーム占有率と相関し、一方でより低いカバレッジは、より低いヌクレオソーム占有率またはヌクレオソーム枯渇領域（ＮＤＲ）と相関し得る。

試料は、ヌクレオチドに対する複製後改変を含む改変、および通常は非共有結合による１つまたは複数のタンパク質への結合が異なる核酸を含み得る。

一実施形態では、核酸の集団は、新生物、腫瘍、もしくはがんを有することが疑われる対象、または新生物、腫瘍、もしくはがんを有すると以前に診断されている対象に由来する血清、血漿、または血液試料から得られたものである。核酸の集団は、様々なレベルのメチル化を有する核酸を含む。メチル化は、任意の１つまたは複数の複製後または転写改変により生じ得る。複製後改変は、ヌクレオチドシトシンの改変、特に、核酸塩基の５位におけるもの、例えば、５－メチルシトシン、５－ヒドロキシメチルシトシン、５－ホルミルシトシン、および５－カルボキシルシトシンを含む。

親和性剤は、所望の特異性を有する抗体、天然の結合パートナーもしくはその変異体（Bock et al., Nat Biotech 28: 1106-1114 (2010)、Song et al., Nat Biotech 29: 68-72 (2011)）、または例えばファージディスプレイによって所与の標的に対する特異性を有するように選択された人工ペプチドであり得る。

本明細書において企図される捕捉部分の例としては、本明細書に記載されるメチル結合ドメイン（ＭＢＤ）およびメチル結合タンパク質（ＭＢＰ）が挙げられ、これには、タンパク質、例えば、ＭｅＣＰ２、ＭＢＤ、例えば、ＭＢＤ２、ならびに５－メチルシトシンに優先的に結合する抗体が挙げられる。抗体を使用してメチル化ＤＮＡを免疫沈降する場合、メチル化ＤＮＡは、一本鎖形態で回収され得る。そのような実施形態では、第２の鎖を合成することができる。高メチル化（および必要に応じて中間メチル化）部分試料は、次いで、半メチル化ＤＮＡを切断しないメチル化感受性ヌクレアーゼ、例えば、ＨｐａＩＩ、ＢｓｔＵＩ、またはＨｉｎ６ｉと接触させられ得る。あるいはまたはさらに、低メチル化（および必要に応じて、中間メチル化）部分試料は、次いで、半メチル化ＤＮＡを切断するメチル化依存性ヌクレアーゼと接触させられ得る。

同様に、異なる形態の核酸を分配するステップは、ヒストンに結合した核酸を遊離または非結合の核酸から分離することができるヒストン結合タンパク質を使用して行うことができる。本明細書に開示される方法において使用することができるヒストン結合タンパク質の例としては、ＲＢＢＰ４、ＲｂＡｐ４８、およびＳＡＮＴドメインペプチドが挙げられる。

一部の親和性剤および改変に関して、作用剤への結合は、核酸が改変を有するかどうかに応じて、本質的に全か無かの様式で生じ得るが、分離は、程度に応じたものであってもよい。そのような例では、改変が過剰発現する核酸は、改変が過少発現する核酸よりも高い程度で、作用剤に結合する。あるいは、改変を有する核酸は、全か無かの様式で結合し得る。しかし、次いで、様々なレベルの改変は、結合剤から逐次的に溶出されてもよい。

例えば、一部の実施形態では、分配は、バイナリであり得るか、または改変の程度／レベルに基づき得る。例えば、全てのメチル化断片は、メチル結合ドメインタンパク質（例えば、ＭｅｔｈｙｌＭｉｎｄｅｒＭｅｔｈｙｌａｔｅｄＤＮＡＥｎｒｉｃｈｍｅｎｔＫｉｔ（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ）を使用して、非メチル化断片から分配することができる。続いて、さらなる分配には、メチル結合ドメインおよび結合断片を有する溶液中の塩濃度を調整することによって、異なるレベルのメチル化を有する断片を溶出することが含まれ得る。塩濃度が増加するにつれ、より高いメチル化レベルを有する断片が溶出される。

一部の例では、最終的な分配は、異なる程度の改変（改変の過剰発現または過少発現）を有する核酸を表す。過剰発現および過少発現は、集団において鎖あたりの改変の中央値数と比べた、核酸が有する改変の数によって定義され得る。例えば、試料中の核酸における５－メチルシトシン残基の中央値数が２である場合、２つより多くの５－メチルシトシン残基を含む核酸は、この改変が過剰発現しており、１または０個の５－メチルシトシン残基を有する核酸は、過少発現している。親和性分離の効果は、結合相で改変が過剰発現している核酸および非結合相（すなわち、溶液中）で改変が過少発現している核酸を富化することである。結合相内の核酸は、後続のプロセシングの前に溶出することができる。

ＭｅｔｈｙｌＭｉｎｅｒＭｅｔｈｙｌａｔｅｄＤＮＡＥｎｒｉｃｈｍｅｎｔＫｉｔ（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ）を使用する場合、様々なレベルのメチル化を、逐次溶出を使用して分配することができる。例えば、低メチル化分配（メチル化なし）は、核酸集団を、磁気ビーズに付着した、キットからのＭＢＤと接触させることによって、メチル化分配から分離することができる。ビーズを使用して、メチル化核酸を、非メチル化核酸から分離する。続いて、１つまたは複数の溶出ステップを逐次的に行って、異なるレベルのメチル化を有する核酸を溶出させる。例えば、メチル化核酸の第１のセットを、１６０ｍＭまたはそれよりも高い、例えば、少なくとも１５０ｍＭ、少なくとも２００ｍＭ、３００ｍＭ、４００ｍＭ、５００ｍＭ、６００ｍＭ、７００ｍＭ、８００ｍＭ、９００ｍＭ、１０００ｍＭ、または２０００ｍＭの塩濃度で溶出させることができる。そのようなメチル化核酸を溶出させた後、磁気分離を、もう一度使用して、より高いレベルのメチル化核酸を、より低いレベルのメチル化を有するものから分離する。溶出および磁気分離ステップ自体を反復して、様々な分配、例えば、低メチル化分配（メチル化がないことを表す）、メチル化分配（低いレベルのメチル化を表す）、および高メチル化分配（高いレベルのメチル化を表す）を作成することができる。

一部の方法において、親和性分離に使用される作用剤に結合した核酸を、洗浄ステップに供する。洗浄ステップは、親和性剤に弱く結合した核酸を洗い流す。そのような核酸は、平均または中央値に近い程度（すなわち、試料を作用剤と最初に接触させたときに固相に結合したままの核酸と、固相に結合していない核酸との中間値）に近い程度に改変を有する核酸を富化することができる。

親和性分離は、異なる程度の改変を有する核酸の少なくとも２つ、ときには３つまたはそれよりも多くの分配をもたらす。分配は、依然として、別個であるが、少なくとも１つの分配の核酸、および通常は２つまたは３つ（またはそれよりも多く）の分配を、通常はアダプターの構成要素として提供される核酸タグに連結させ、異なる分配中の核酸は、１つ分配のメンバーを別のものと識別する異なるタグを受容する。同じ分配の核酸分子に連結されるタグは、互いに同じであっても異なっていてもよい。しかし、互いに異なる場合、タグは、それらが付着した分子を、特定の分配のものであるとして同定するように、共通したコードの部分を有し得る。

メチル化などの特徴に基づいて核酸試料を分配することに関するさらなる詳細については、参照により本明細書に組み込まれるＷＯ２０１８／１１９４５２を参照されたい。

一部の実施形態では、核酸分子は、特定のタンパク質またはその断片に結合している核酸分子およびその特定のタンパク質またはその断片に結合していないものに基づいて、異なる分配に分配され得る。

核酸分子は、ＤＮＡ－タンパク質結合に基づいて分配され得る。タンパク質－ＤＮＡ複合体は、タンパク質の特定の特性に基づいて分配され得る。そのような特性の例としては、様々なエピトープ、改変（例えば、ヒストンメチル化またはアセチル化）、または酵素活性が挙げられる。ＤＮＡに結合することができ、分画の基準としての機能を果たし得るタンパク質の例としては、プロテインＡおよびプロテインＧが挙げられ得るが、これらに限定されない。任意の好適な方法を使用して、タンパク質結合領域に基づいて、核酸分子を分配することができる。タンパク質結合領域に基づいて核酸分子を分配するために使用される方法の例としては、ＳＤＳ－ＰＡＧＥ、クロマチン免疫沈降（ＣｈＩＰ）、ヘパリンクロマトグラフィー、および非対称流れ流動場分離法（ＡＦ４）が挙げられるが、これらに限定されない。

一部の実施形態では、核酸を分配するステップは、核酸を、メチル化結合タンパク質（「ＭＢＰ」）のメチル化結合ドメイン（「ＭＢＤ」）と接触させることによって行われる。ＭＢＤは、５－メチルシトシン（５ｍＣ）に結合する。ＭＢＤは、常磁性ビーズ、例えば、Ｄｙｎａｂｅａｄｓ（登録商標）Ｍ－２８０ストレプトアビジンにビオチンリンカーを介してカップリングされる。異なる程度のメチル化を有する分画への分配は、ＮａＣｌ濃度を増加させることによって分画を溶出させることにより行うことができる。

本明細書において企図されるＭＢＰの例としては、以下のものが挙げられるが、これらに限定されない：
（ａ）ＭｅＣＰ２およびＭＢＤ２は、非改変シトシンよりも、５－メチル－シトシンに優先的に結合するタンパク質である。
（ｂ）ＲＰＬ２６、ＰＲＰ８、およびＤＮＡミスマッチ修復タンパク質ＭＨＳ６は、非改変シトシンよりも、５－ヒドロキシメチル－シトシンに優先的に結合する。
（ｃ）ＦＯＸＫ１、ＦＯＸＫ２、ＦＯＸＰ１、ＦＯＸＰ４、およびＦＯＸＩ３は、好ましくは、非改変シトシンよりも、５－ホルミル－シトシンに結合する（Iurlaro et al., Genome Biol. 14: R119 (2013)）。
（ｄ）１つまたは複数のメチル化ヌクレオチド塩基に特異的な抗体（例えば、ＭｅＤＩＰ）。

一部の実施形態では、分配は、メチル化ＤＮＡ免疫沈降を含む。例えば、メチル化ＤＮＡ免疫沈降による分配は、標的領域セットが分配が生じる前に捕捉される方法において、使用され得る。

一般に、溶出は、分子あたりのメチル化部位の数の関数であり、高い塩濃度下では、より多くのメチル化を有する分子が溶出する。ＤＮＡを、メチル化の程度にも基づいて、別個の集団に溶出させるために、漸増ＮａＣｌ濃度の一連の溶出緩衝液を使用することができる。塩濃度は、約１００ｎｍ～約２５００ｍＭのＮａＣｌの範囲であり得る。一実施形態では、プロセスにより、３つの分配が得られる。分子を、第１の塩濃度で、メチル結合ドメインを含む分子を含む溶液と接触させ、分子が、捕捉部分、例えば、ストレプトアビジンに付着し得る。第１の塩濃度において、ある分子集団は、ＭＢＤに結合し、ある集団は、結合しないままとなる。非結合の集団を、「低メチル化」集団として分離することができる。例えば、ＤＮＡの低メチル化形態を表す第１の分配は、低い塩濃度、例えば、１００ｍＭまたは１６０ｍＭにおいて、非結合のままであるものである。中間メチル化ＤＮＡを表す第２の分配は、中間の塩濃度、例えば、１００ｍＭ～２０００ｍＭの間の濃度を使用して溶出される。これもまた、試料から分離される。ＤＮＡの高メチル化形態を表す第３の分配は、高い塩濃度、例えば、少なくとも約２０００ｍＭを使用して溶出される。
ａ．分配のタグ付け

一部の実施形態では、２つまたはそれよりも多くの分配、例えば、各分配は、差次的にタグ付けされる。タグまたはインデックスは、タグが会合する分子の特色を示す情報を含有する、分子、例えば、核酸であり得る。タグは、配列読み取りデータの起源である分子を区別することを可能にし得る。例えば、分子は、試料タグまたは試料インデックス（これにより、１つの試料中の分子を、異なる試料中ものと識別する）、分配タグ（これにより、１つの分配中の分子を、異なる分配中のものと識別する）、または分子タグ／分子バーコード／バーコード（これにより、異なる分子を、互いに識別する（一意的および非一意的タグ付けシナリオの両方で）を有し得る。ある特定の実施形態では、タグは、１つのバーコードまたはバーコードの組合せを含み得る。本明細書で使用される場合、「バーコード」という用語は、文脈に応じて、特定のヌクレオチド配列を有する核酸分子、またはヌクレオチド配列自体を指す。バーコードは、例えば、１０～１００個の間のヌクレオチドを有し得る。バーコードのコレクションは、具体的な目的に所望されるように、縮重配列を有し得るか、またはある特定のハミング距離を有する配列を有し得る。そのため、例えば、分子バーコードは、１つのバーコード、または各々が分子の異なる末端に付着する２つのバーコードの組合せから構成され得る。さらにまたはあるいは、異なる分配および／または試料について、バーコードが、個々の配列を通じて分子タグとしての機能を果たし、それらがメンバーであるセットに基づいて対応する分配および／または試料を同定する機能も果たすように、異なるセットの分子バーコード、分子タグ、または分子インデックスが、使用され得る。バーコードを含むタグは、アダプターに組み込まれ得るか、またはそうでなければ、アダプターに接合され得る。タグは、他の方法の中でもとりわけ、ライゲーション、オーバーラップ伸長ＰＣＲによって、組み込まれ得る。

タグ付け戦略は、一意的タグ付け戦略および非一意的タグ付け戦略に分けることができる。一意的タグ付けでは、試料中の全てまたは実質的に全ての分子が、異なるタグを有し、そのため、読み取りデータは、タグ情報単独に基づいて、もともとの分子に割り当てることができる。そのような方法において使用されるタグは、「一意的タグ」と称される場合がある。非一意的タグ付けでは、同じ試料中の異なる分子が同じタグを有し得、そのため、タグ情報に加えて他の情報を使用して、配列読み取りデータがもともとの分子に割り当てられる。そのような情報としては、開始および終止座標、分子がマッピングされる座標、開始または終止座標単独などを挙げることができる。そのような方法において使用されるタグは、「非一意的タグ」と称される場合がある。したがって、必ずしも、試料中の全ての分子を一意的にタグ付けするわけではない。試料内の同定可能なクラス内に含まれる分子を一意的にタグ付けすることで十分である。したがって、異なる同定可能なファミリー内の分子は、タグ付けされた分子の同一性に関する情報を失うことなく、同じタグを有し得る。

非一意的タグ付けのある特定の実施形態では、使用される異なるタグの数は、特定の群の全ての分子が異なるタグを有する非常に高い可能性（例えば、少なくとも９９％、少なくとも９９．９％、少なくとも９９．９９％、または少なくとも９９．９９９％）であれば、十分であり得る。バーコードをタグとして使用する場合、およびバーコードが、例えば、ランダムに分子の両方の末端に付着している場合、バーコードの組合せが、一緒に、タグを構成し得ることに留意されたい。この数は、明確にコールに含まれる分子の数の関数である。例えば、クラスは、参照ゲノム上の同じ開始－終止位置にマッピングされる全ての分子であり得る。クラスは、特定の遺伝子座、例えば、特定の塩基または特定の領域（例えば、最大１００個の塩基または遺伝子または遺伝子のエクソン）にわたってマッピングする全ての分子であり得る。ある特定の実施形態では、クラス内の分子の数ｚを一意的に同定するために使用される異なるタグの数は、２^＊ｚ、３^＊ｚ、４^＊ｚ、５^＊ｚ、６^＊ｚ、７^＊ｚ、８^＊ｚ、９^＊ｚ、１０^＊ｚ、１１^＊ｚ、１２^＊ｚ、１３^＊ｚ、１４^＊ｚ、１５^＊ｚ、１６^＊ｚ、１７^＊ｚ、１８^＊ｚ、１９^＊ｚ、２０^＊ｚ、または１００^＊ｚのうちのいずれか（例えば、下限）と、１００，０００^＊ｚ、１０，０００^＊ｚ、１０００^＊ｚ、または１００^＊ｚのうちのいずれか（例えば、上限）との間であり得る。

例えば、約５ｎｇ～３０ｎｇの無細胞ＤＮＡの試料において、およそ３０００個の分子が、特定のヌクレオチド座標にマッピングされ、任意の開始座標を有する約３～１０個の間の分子が、同じ終止座標を共有することが予測される。したがって、約５０～約５０，０００個の異なるタグ（例えば、約６～２２０個の間のバーコードの組合せ）が、全てのそのような分子を一意的にタグ付けするのに十分であり得る。ヌクレオチド座標全体にマッピングされる３０００個全ての分子を一意的にタグ付けするためには、約１００万個～約２０００万個の異なるタグが必要となるであろう。

一般に、反応における一意的または非一意的タグバーコードの割り当ては、米国特許出願第２００１００５３５１９号、同第２００３０１５２４９０号、同第２０１１０１６００７８号、ならびに米国特許第６，５８２，９０８号および米国特許第７，５３７，８９８号および米国特許第９，５９８，７３１号によって記載される方法およびシステムに従う。

タグは、ランダムまたは非ランダムに、試料核酸に連結され得る。

一部の実施形態では、タグ付けされた核酸は、マイクロウェルプレートにロードした後にシーケンシングされる。マイクロウェルプレートは、９６、３８４、または１５３６個のマイクロウェルを有し得る。一部の場合には、それらは、予想される、一意的タグのマイクロウェルに対する比で、導入される。例えば、一意的タグは、ゲノム試料あたり約１個を上回る、２個を上回る、３個を上回る、４個を上回る、５個を上回る、６個を上回る、７個を上回る、８個を上回る、９個を上回る、１０個を上回る、２０個を上回る、５０個を上回る、１００個を上回る、５００個を上回る、１０００個を上回る、５０００個を上回る、１００００個を上回る、５０，０００個を上回る、１００，０００個を上回る、５００，０００個を上回る、１，０００，０００個を上回る、１０，０００，０００個を上回る、５０，０００，０００個を上回る、または１，０００，０００，０００個を上回る一意的タグがロードされるように、ロードされ得る。一部の場合には、一意的タグは、ゲノム試料あたり約２個を下回る、３個を下回る、４個を下回る、５個を下回る、６個を下回る、７個を下回る、８個を下回る、９個を下回る、１０個を下回る、２０個を下回る、５０個を下回る、１００個を下回る、５００個を下回る、１０００個を下回る、５０００個を下回る、１００００個を下回る、５０，０００個を下回る、１００，０００個を下回る、５００，０００個を下回る、１，０００，０００個を下回る、１０，０００，０００個を下回る、５０，０００，０００個を下回る、または１，０００，０００，０００個を下回る一意的タグがロードされるように、ロードされ得る。一部の場合には、試料ゲノムあたりのロードされる一意的タグの平均数は、ゲノム試料あたり約１個未満もしくはそれより多くの、２個未満もしくはそれより多くの、３個未満もしくはそれより多くの、４個未満もしくはそれより多くの、５個未満もしくはそれより多くの、６個未満もしくはそれより多くの、７個未満もしくはそれより多くの、８個未満もしくはそれより多くの、９個未満もしくはそれより多くの、１０個未満もしくはそれより多くの、２０個未満もしくはそれより多くの、５０個未満もしくはそれより多くの、１００個未満もしくはそれより多くの、５００個未満もしくはそれより多くの、１０００個未満もしくはそれより多くの、５０００個未満もしくはそれより多くの、１００００個未満もしくはそれより多くの、５０，０００個未満もしくはそれより多くの、１００，０００個未満もしくはそれより多くの、５００，０００個未満もしくはそれより多くの、１，０００，０００個未満もしくはそれより多くの、１０，０００，０００個未満もしくはそれより多くの、５０，０００，０００個未満もしくはそれより多くの、または１，０００，０００，０００個未満もしくはそれより多くの一意的タグである。

好ましいフォーマットは、標的核酸の両方の末端にライゲーションされた２０～５０個の異なるタグ（例えば、バーコード）を使用する。例えば、標的分子の両方の末端に、３５個の異なるタグ（例えば、バーコード）をライゲーションすると、３５×３５の順列を作製し、これは、３５個のタグについて１２２５個に等しい。そのような数のタグは、同じ開始点および終止点を有する異なる分子が、高い確率（例えば、少なくとも９４％、９９．５％、９９．９９％、９９．９９９％）で異なる組合せのタグを受容するのに十分である。他のバーコードの組合せとしては、１０～５００の間の任意の数、例えば、約１５×１５、約３５×３５、約７５×７５、約１００×１００、約２５０×２５０、約５００×５００が挙げられる。

一部の場合には、一意的タグは、所定のまたはランダムなまたは半ランダムな配列のオリゴヌクレオチドであり得る。他の場合には、バーコードが複数の中で必ずしも互いに一意的とならないような、複数のバーコードが使用されてもよい。この例では、バーコードは、バーコードおよびそれがライゲーションされ得る配列の組合せが、個個々に追跡され得る一意的配列を作製するように、個々の分子にライゲーションされ得る。本明細書に記載されるように、配列読み取りデータの始まり（開始）および終わり（終止）の部分の配列データと組み合わせた非一意的バーコードの検出により、特定の分子に対する一意的同一性の割り当てが可能となり得る。個々の配列読み取りデータの長さまたは塩基対の数もまた、そのような分子に一意的同一性を割り当てるために使用することができる。本明細書に記載されるように、一意的同一性が割り当てられた核酸の一本鎖に由来する断片は、それによって、後続の親鎖に由来する断片の同定を可能にし得る。

タグ（単数または複数）を特定の分配と相関付けるために、タグを使用して、個々のポリヌクレオチド集団分配を標識することができる。あるいは、タグは、分配するステップを用いない本発明の実施形態において使用することができる。一部の実施形態では、単一のタグを使用して、特定の分配を標識することができる。一部の実施形態では、複数の異なるタグを使用して、特定の分配を標識することができる。複数のタグを用いて特定の分配を標識する実施形態では、１つの分配を標識するために使用されるタグのセットは、他の分配を標識するために使用されるタグのセットと容易に区別することができる。一部の実施形態では、タグは、追加の機能を有してもよく、例えば、タグを、試料の起源に索引を付けるために使用するか、または一意的分子識別子（これは、例えば、Kinde et al., Proc Nat'l Acad Sci USA 108: 9530-9535 (2011)、Kou et al., PLoS ONE,11: e0146638 (2016)にあるように、シーケンシングエラーを突然変異とは区別することによって、シーケンシングデータの品質を改善するために使用することができる）として使用するか、または例えば、米国特許第９，５９８，７３１号に記載されるように、非一意的分子識別子として使用することができる。同様に、一部の実施形態では、タグは、追加の機能を有し得、例えば、タグを、試料の起源に索引を付けるために使用するか、または非一意的分子識別子（これは、シーケンシングエラーを突然変異とは区別することによって、シーケンシングデータの品質を改善するために使用することができる）として使用することができる。

一実施形態では、分配のタグ付けは、各分配における分子を、分配タグでタグ付けすることを含む。分配を再度組み合わせ（例えば、必要とされるシーケンシング実行数を低減させ、不必要な費用を回避するため）、分子をシーケンシングした後に、分配タグにより、起源の分配が同定される。別の実施形態では、異なる分配は、例えば、バーコード対から構成される、分子タグの異なるセットでタグ付けされる。このようにして、各分子バーコードは、起源の分配、ならびに分配内の分子を識別するのに有用であることを示す。例えば、３５個のバーコードの第１のセットを使用して、第１の分配における分子をタグ付けすることができ、一方で、３５個のバーコードの第２のセットを使用して、第２の分配中の分子をタグ付けすることができる。

一部の実施形態では、分配および分配タグでのタグ付けの後に、分子は、単回でのシーケンシングのためにプールされ得る。一部の実施形態では、試料タグは、例えば、分配タグの付加およびプールの後のステップにおいて、分子に付加される。試料タグは、単回シーケンシングでのシーケンシングのために複数の試料から生成された材料をプールすることを容易にし得る。

あるいは、一部の実施形態では、分配タグは、試料ならびに分配と相関付けられてもよい。単純な例として、第１のタグは、第１の試料の第１の分配を示し得、第２のタグは、第１の試料の第２の分配を示し得、第３のタグは、第２の試料の第１の分配を示し得、第４のタグは、第２の試料の第２の分配を示し得る。

タグは、１つまたは複数の特徴に基づいて、既に分配された分子に付着され得るが、ライブラリー内の最終的なタグ付けされた分子は、もはやその特徴を有さない場合がある。例えば、一本鎖ＤＮＡ分子が、分配されタグ付けされ得るが、ライブラリー内の最終的なタグ付けされた分子は、二本鎖である可能性が高い。同様に、ＤＮＡは、異なるレベルのメチル化に基づく分配に供され得るが、最終的なライブラリーにおいて、これらの分子に由来するタグ付けされた分子は、非メチル化である可能性が高い。したがって、ライブラリー内の分子に付着したタグは、典型的には、必ずしもタグ付けされた分子自体の特徴ではなく、最終的なタグ付けされた分子が由来する「親分子」の特徴を示す。

一例として、バーコード１、２、３、４などを使用して、第１の分配中の分子をタグ付けおよび標識し、バーコードＡ、Ｂ、Ｃ、Ｄなどを使用して、第２の分配中の分子をタグ付けおよび標識し、バーコードａ、ｂ、ｃ、ｄなどを使用して、第３の分配中の分子をタグ付けおよび標識する。差次的にタグ付けされた分配は、シーケンシングの前にプールされ得る。差次的にタグ付けされた分配は、別個にシーケンシングされるか、または例えば、Ｉｌｌｕｍｉｎａシーケンサーの同じフローセルにおいて、一緒に同時にシーケンシングされてもよい。

シーケンシングした後に、遺伝的変異体を検出するための読み取りデータの解析は、分配ごとのレベル、ならびに全核酸集団レベルで行われ得る。タグを使用して、異なる分配に由来する読み取りデータを選別する。解析には、配列情報、ゲノム座標の長さ、カバレッジ、および／またはコピー数を使用して、遺伝的変異およびエピジェネティック変異（メチル化、クロマチン構造などのうちの１つまたは複数）を決定するためのｉｎｓｉｌｉｃｏ解析が含まれ得る。一部の実施形態では、より高いカバレッジは、ゲノム領域におけるより高いヌクレオソーム占有率と相関し得、一方でより低いカバレッジは、より低いヌクレオソーム占有率またはヌクレオソーム枯渇領域（ＮＤＲ）と相関し得る。

一部の実施形態では、方法において使用されるヌクレアーゼによって認識される配列を含まない、および／または例えば、ヌクレオチド改変、例えば、連結改変（例えば、ホスホロチオエート）の存在に起因して、切断に対して抵抗性である、アダプターが使用される。一部の実施形態では、方法において使用されるヌクレアーゼによって認識される配列を含まない、および／または例えば、ヌクレオチド改変、例えば、連結改変（例えば、ホスホロチオエート）の存在に起因して、切断に対して抵抗性である、タグが使用される。１つまたは複数のメチル化依存性制限酵素および１つまたは複数のメチル化感受性制限酵素の両方が使用される場合、アダプターおよび／またはタグは、それらが、使用される制限酵素のうちのいずれかによる切断の基質とはならないように、メチル化が欠如し得、１つまたは複数のメチル化感受性制限酵素の認識配列が欠如し得る。
ｂ．改変された核酸解析の代替的な方法

一部の実施形態では、アダプターは、核酸を分配した後に核酸に付加され、他の実施形態では、アダプターは、核酸を分配する前に核酸に付加され得る。一部のそのような方法では、異なる程度で改変（例えば、核酸分子あたり０個、１個、２個、３個、４個、５個、またはそれよりも多くのメチル基）を有する核酸の集団を、改変の程度に応じて、集団の分画の前に、アダプターと接触させる。アダプターは、集団内の核酸分子の一方の末端または両方の末端に付着する。好ましくは、アダプターは、タグの組合せ数が、同じ開始および終止点を有する２つの核酸が同じタグの組合せを受容する低い確率、例えば、９５、９９、または９９．９％をもたらすのに十分な数の異なるタグを含む。アダプターは、同じタグを有するかまたは異なるタグを有するかに関係なく、同じかまたは異なるプライマー結合部位を含み得るが、好ましくは、アダプターは、同じプライマー結合部位を含む。アダプターの付着後に、核酸を、改変を有する核酸に優先的に結合する作用剤（例えば、以前に説明されたそのような作用剤）と接触させる。核酸を、作用剤への結合から、核酸が改変を有する程度が異なる少なくとも２つの部分試料に分配する。例えば、作用剤が、改変を有する核酸に対する親和性を有する場合、改変が過剰発現した核酸（集団内の中央値出現と比較して）は、作用剤に優先的に結合し、一方で、改変が過少発現する核酸は、結合しないか、または作用剤からより容易に溶出される。分配した後に、第１の部分試料は、第１の部分試料のＤＮＡ内の第１の核酸塩基に対してＤＮＡ内の第２の核酸塩基とは異なって影響を及ぼす手順に供され、第１の核酸塩基は、改変または非改変核酸塩基であり、第２の核酸塩基は、第１の核酸塩基とは異なる改変または非改変核酸塩基であり、第１の核酸塩基および第２の核酸塩基は、同じ塩基対形成特異性を有する。核酸を、次いで、アダプター内のプライマー結合部位に結合するプライマーから増幅させる。増幅の後に、異なる分配は、次いで、さらなるプロセシングステップに供され得るが、これには、典型的に、並行であるが別個での、さらなる（例えば、クローン）増幅、および配列解析が含まれる。異なる分配からの配列データを、次いで、比較することができる。

別の実施形態では、以下の例示的な手順を使用して、分配するスキームを行うことができる。核酸を、プライマー結合部位およびタグを含む、Ｙ字形状アダプターの両方の末端に連結させる。分子を増幅させる。増幅させた分子を、次いで、５－メチルシトシンに優先的に結合する抗体との接触によって分画して、２つの分配を産生する。一方の分配には、メチル化が欠如したもともとの分子、およびメチル化が失われた増幅コピーが含まれる。他方の分配には、メチル化を有するもともとのＤＮＡ分子が含まれる。メチル化を有するもともとのＤＮＡ分子を含む分配を、第１の部分試料のＤＮＡ内の第１の核酸塩基に対してＤＮＡ内の第２の核酸塩基とは異なって影響を及ぼす手順に供し、ここで、第１の核酸塩基は、改変または非改変核酸塩基であり、第２の核酸塩基は、第１の核酸塩基とは異なる改変または非改変核酸塩基であり、第１の核酸塩基および第２の核酸塩基は、同じ塩基対形成特異性を有する。２つの分配を、次いで、メチル化分配のさらなる増幅とは別個に、プロセシングおよびシーケンシングする。２つの分配の配列データを、次いで、比較することができる。この例では、タグは、メチル化ＤＮＡと非メチル化ＤＮＡとを識別するためではなく、同じ開始および終止点を有する読み取りデータが、同じ分子に基づくか異なる分子に基づくかを決定するこができるように、これらの分配内の異なる分子間での識別するために使用される。

本開示はさらに、核酸のうちの少なくとも一部が５－メチルシトシンなどの１つまたは複数の改変シトシン残基および前述の他の改変のうちのいずれかを含む、核酸の集団を解析するための方法を提供する。これらの方法において、分配した後に、核酸の部分試料を、５Ｃ位置において改変された１つまたは複数のシトシン残基、例えば、５－メチルシトシンを含むアダプターと接触させる。好ましくは、そのようなアダプター内の全てのシトシン残基も改変されているか、またはアダプターのプライマー結合領域内の全てのそのようなシトシンが改変されている。アダプターは、集団内の核酸分子の両方の末端に付着する。好ましくは、アダプターは、タグの組合せ数が、同じ開始および終止点を有する２つの核酸が同じタグの組合せを受容する低い確率、例えば、９５、９９、または９９．９％をもたらすのに十分な数の異なるタグを含む。そのようなアダプター内のプライマー結合部位は、同じであっても異なってもよいが、好ましくは、同じである。アダプターの付着後に、核酸を、アダプターのプライマー結合部位に結合するプライマーから増幅させる。増幅させた核酸を、第１のアリコートおよび第２のアリコートに分ける。第１のアリコートを、さらなるプロセシングありまたはなしで、配列データに関してアッセイする。第１のアリコート内の分子の配列データは、したがって、核酸分子の初期メチル化状態に関係なく、決定される。第２のアリコート内の核酸分子を、ＤＮＡ内の第１の核酸塩基に対してＤＮＡ内の第２の核酸塩基とは異なって影響を及ぼす手順に供し、ここで、第１の核酸塩基は、５位で改変されたシトシンを含み、第２の核酸塩基は、非改変シトシンを含む。この手順は、バイサルファイト処置または非改変シトシンをウラシルに変換する別の手順であり得る。手順に供した核酸を、次いで、核酸に連結したアダプターのもともとのプライマー結合部位に対するプライマーで増幅させる。これらの核酸は、アダプターのプライマー結合部位にシトシンを保持しているが、一方で増幅産物は、バイサルファイト処置においてウラシルへの変換を受けてこれらのシトシン残基のメチル化が失われているため、アダプターにもともと連結していた核酸分子（その増幅産物とは異なる）のみが、ここで増幅可能である。したがって、少なくとも一部がメチル化されている集団内のもともとの分子のみが、増幅を受ける。増幅後に、これらの核酸は、配列解析に供される。第１のアリコートおよび第２のアリコートから決定された配列の比較は、とりわけ、核酸集団内のどのシトシンがメチル化に供されたかを示し得る。

そのような解析は、以下の例示的な手順を使用して行うことができる。分配した後に、メチル化ＤＮＡは、プライマー結合部位およびタグを含むＹ形状アダプターの両方の末端に連結される。アダプター内のシトシンは、５位において改変されている（例えば、５－メチル化）。アダプターの改変は、後続の変換ステップ（例えば、バイサルファイト処置、ＴＡＰ変換、または改変シトシンには影響を及ぼさないが、非改変シトシンに影響を及ぼす任意の他の変換）においてプライマー結合部位を保護するように機能する。アダプターの付着後に、ＤＮＡ分子を増幅させる。増幅産物を、変換ありおよび変換なしでのシーケンシングのために２つのアリコートに分ける。変換に供さないアリコートは、さらなるプロセシングありまたはなしで、配列解析に供され得る。他方のアリコートは、ＤＮＡ内の第１の核酸塩基に対してＤＮＡ内の第２の核酸塩基とは異なって影響を及ぼす手順に供され、ここで、第１の核酸塩基は、５位で改変されたシトシンを含み、第２の核酸塩基は、非改変シトシンを含む。この手順は、バイサルファイト処置または非改変シトシンをウラシルに変換する別の手順であり得る。もともとのプライマー結合部位に特異的なプライマーと接触させた場合に、シトシンの改変によって保護されたプライマー結合部位のみが、増幅を補助し得る。したがって、第１の増幅に由来するコピーではなく、もともとの分子のみが、さらなる増幅に供される。さらに増幅された分子を、次いで、配列解析に供する。配列を、次いで２つのアリコートから比較することができる。上記で考察される分離スキームにあるように、アダプター内の核酸タグは、メチル化ＤＮＡと非メチル化ＤＮＡとを識別するためではなく、同じ分配内の核酸分子を識別するために使用される。
３．第１の部分試料を、第１の部分試料のＤＮＡ内の第１の核酸塩基に対してＤＮＡ内の第２の核酸塩基とは異なって影響を及ぼす手順に供する

第２の部分試料を、第２の部分試料のＤＮＡ内の第１の核酸塩基に対してＤＮＡ内の第２の核酸塩基とは異なって影響を及ぼす手順に供するステップであって、第１の核酸塩基が、改変または非改変核酸塩基であり、第２の核酸塩基が、第１の核酸塩基とは異なる改変または非改変核酸塩基であり、第１の核酸塩基および第２の核酸塩基が、同じ塩基対形成特異性を有する、ステップを含む、方法が、本明細書において開示される。一部の実施形態では、第１の核酸塩基が、改変または非改変アデニンである場合には、第２の核酸塩基は、改変または非改変アデニンであり、第１の核酸塩基が、改変または非改変シトシンである場合には、第２の核酸塩基は、改変または非改変シトシンであり、第１の核酸塩基が、改変または非改変グアニンである場合には、第２の核酸塩基は、改変または非改変グアニンであり、第１の核酸塩基が、改変または非改変チミンである場合には、第２の核酸塩基は、改変および非改変チミンである（改変および非改変ウラシルは、このステップの目的で、改変チミン内に包含される）。方法はまた、第１の部分試料を、第１の部分試料のＤＮＡ内の第１の核酸塩基に対してＤＮＡ内の第２の核酸塩基とは異なって影響を及ぼす手順に供するステップであって、第１の核酸塩基が、改変または非改変核酸塩基であり、第２の核酸塩基が、第１の核酸塩基とは異なる改変または非改変核酸塩基であり、第１の核酸塩基および第２の核酸塩基が、同じ塩基対形成特異性を有する、ステップを含み得る。そのような実施形態では、同じかまたは異なる手順が、第１および第２の部分試料に対して使用され得る。そのような手順を使用して、ある特定の改変、例えば、メチル化を有するかまたはそれが欠如した、部分試料中のヌクレオチドを同定することができる。

第２の部分試料が供される手順に関して、一部の実施形態では、第１の核酸塩基は、改変または非改変シトシンであり、そして第２の核酸塩基は、改変または非改変シトシンである。例えば、第１の核酸塩基は、非改変シトシン（Ｃ）を含み得、第２の核酸塩基は、５－メチルシトシン（ｍＣ）および５－ヒドロキシメチルシトシン（ｈｍＣ）のうちの１つまたは複数を含み得る。あるいは、第２の核酸塩基は、Ｃを含み得、第１の核酸塩基は、ｍＣおよびｈｍＣのうちの１つまたは複数を含み得る。例えば、上記の発明の概要および以下の考察において示されるように、第１および第２の核酸塩基のうちの一方がｍＣを含み、他方がｈｍＣを含む場合など、他の組合せもまた可能である。第１の部分試料もそのような手順に供される場合、前述のもののいずれも、第１の部分試料が供される手順に適用され得る。

一部の実施形態では、第１および／または第２の部分試料が供される、第１の部分試料のＤＮＡ内の第１の核酸塩基に対してＤＮＡ内の第２の核酸塩基とは異なって影響を及ぼす手順は、バイサルファイト変換を含む。バイサルファイトでの処置により、非改変シトシンおよびある特定の改変シトシンヌクレオチド（例えば、５－ホルミルシトシン（ｆＣ）または５－カルボキシルシトシン（ｃａＣ））を、ウラシルに変換し、一方で他の改変シトシン（例えば、５－メチルシトシン、５－ヒドロキシルメチルシトシン）は変換されない。したがって、バイサルファイト変換が使用される場合、第１の核酸塩基は、非改変シトシン、５－ホルミルシトシン、５－カルボキシルシトシン、またはバイサルファイトによって影響を受ける他のシトシン形態のうちの１つまたは複数を含み、第２の核酸塩基は、ｍＣおよびｈｍＣのうちの１つまたは複数、例えば、ｍＣおよび必要に応じてｈｍＣを含み得る。バイサルファイトで処置したＤＮＡのシーケンシングは、シトシンとして読み取られる位置を、ｍＣまたはｈｍＣ位置であるとして同定する。一方、Ｔとして読み取られる位置は、Ｔ、またはＣのバイサルファイト感受性形態、例えば、非改変シトシン、５－ホルミルシトシン、または５－カルボキシルシトシンであるとして同定される。本明細書に記載されるように第１の部分試料にバイサルファイト変換を行うことは、したがって、第１の部分試料から得られた配列読み取りデータを使用して、ｍＣまたはｈｍＣを含有する位置を同定することを容易にする。バイサルファイト変換の例示的な説明については、例えば、Moss et al., Nat Commun. 2018; 9: 5068を参照されたい。

一部の実施形態では、第１および／または第２の部分試料が供される、第１の部分試料のＤＮＡ内の第１の核酸塩基に対してＤＮＡ内の第２の核酸塩基とは異なって影響を及ぼす手順は、酸化的バイサルファイト（Ｏｘ－ＢＳ）変換を含む。この手順は、まず、ｈｍＣを、バイサルファイト感受性であるｆＣに変換し、続いて、バイサルファイト変換を行う。したがって、酸化的バイサルファイト変換が使用される場合、第１の核酸塩基は、非改変シトシン、ｆＣ、ｃａＣ、ｈｍＣ、またはバイサルファイトによって影響を受ける他のシトシン形態のうちの１つまたは複数を含み、第２の核酸塩基は、ｍＣを含む。Ｏｘ－ＢＳで変換されたＤＮＡのシーケンシングは、シトシンとして読み取られる位置を、ｍＣ位置であるとして同定する。一方、Ｔとして読み取られる位置は、Ｔ、ｈｍＣ、またはＣのバイサルファイト感受性形態、例えば、非改変シトシン、ｆＣ、またはｈｍＣであるとして同定される。本明細書に記載されるように第１の部分試料にＯｘ－ＢＳ変換を行うことは、したがって、第１の部分試料から得られた配列読み取りデータを使用して、ｍＣを含有する位置を同定することを容易にする。酸化的バイサルファイト変換の例示的な説明については、例えば、Booth et al., Science 2012; 336: 934-937を参照されたい。

一部の実施形態では、第１および／または第２の部分試料が供される、第１の部分試料のＤＮＡ内の第１の核酸塩基に対してＤＮＡ内の第２の核酸塩基とは異なって影響を及ぼす手順は、Ｔｅｔ補助バイサルファイト（ＴＡＢ）変換を含む。ＴＡＢ変換において、ｈｍＣは、変換から保護され、ｍＣは、バイサルファイト処置に先立って酸化され、その結果、もともとｍＣによって占有されていた位置が、Ｕに変換され、もともとｈｍＣによって占有されていた位置が、シトシンの保護形態として残る。例えば、Yu et al., Cell 2012; 149: 1368-80に記載されるように、β－グルコシルトランスフェラーゼを使用して、ｈｍＣを保護することができ（５－グルコシルヒドロキシメチルシトシン（ｇｈｍＣ）を形成する）、次いで、ＴＥＴタンパク質、例えば、ｍＴｅｔ１を使用して、ｍＣをｃａＣに変換することができ、次いで、バイサルファイト処置を使用して、ＣおよびｃａＣをＵに変換することができるが、ｇｈｍＣは影響を受けないままである。したがって、ＴＡＢ変換が使用される場合、第１の核酸塩基は、非改変シトシン、ｆＣ、ｃａＣ、ｍＣ、またはバイサルファイトによって影響を受ける他のシトシン形態のうちの１つまたは複数を含み、第２の核酸塩基は、ｈｍＣを含む。ＴＡＢで変換されたＤＮＡのシーケンシングは、シトシンとして読み取られる位置を、ｈｍＣ位置であるとして同定する。一方、Ｔとして読み取られる位置は、Ｔ、ｍＣ、またはＣのバイサルファイト感受性形態、例えば、非改変シトシン、ｆＣ、またはｃａＣであるとして同定される。本明細書に記載されるように第１の部分試料にＴＡＢ変換を行うことは、したがって、第１の部分試料から得られた配列読み取りデータを使用して、ｈｍＣを含有する位置を同定することを容易にする。

一部の実施形態では、第１および／または第２の部分試料が供される、第１の部分試料のＤＮＡ内の第１の核酸塩基に対してＤＮＡ内の第２の核酸塩基とは異なって影響を及ぼす手順は、置換ボラン還元剤を用いたＴｅｔ補助変換を含み、必要に応じて、置換ボラン還元剤は、２－ピコリンボラン、ボランピリジン、ｔｅｒｔ－ブチルアミンボラン、またはアンモニアボランである。置換ボラン還元剤を用いたＴｅｔ補助ｐｉｃ－ボラン変換（例えば、ＴＡＰ）では、ＴＥＴタンパク質を使用して、非改変Ｃに影響を及ぼすことなく、ｍＣおよびｈｍＣをｃａＣに変換する。ｃａＣおよび存在する場合にはｆＣは、次いで、２－ピコリンボラン（ｐｉｃ－ボラン）または別の置換ボラン還元剤、例えば、ボランピリジン、ｔｅｒｔ－ブチルアミンボラン、またはアンモニアボランでの処置によって、これもまた非改変Ｃに影響を及ぼすことなく、ジヒドロウラシル（ＤＨＵ）に変換される。例えば、Liu et al., Nature Biotechnology 2019; 37:424-429（例えば、補足の図１および補足説明７）を参照されたい。ＤＨＵは、シーケンシングにおいてＴとして読み取られる。したがって、このタイプの変換が使用される場合、第１の核酸塩基は、ｍＣ、ｆＣ、ｃａＣ、またはｈｍＣのうちの１つまたは複数を含み、第２の核酸塩基は、非改変シトシンを含む。変換されたＤＮＡのシーケンシングは、シトシンとして読み取られる位置を、非改変Ｃ位置であるとして同定する。一方、Ｔとして読み取られる位置は、Ｔ、ｍＣ、ｆＣ、ｃａＣ、またはｈｍＣであるとして同定される。本明細書に記載されるように第１の部分試料にＴＡＰ変換を行うことは、したがって、第１の部分試料から得られた配列読み取りデータを使用して、非改変Ｃを含有する位置を同定することを容易にする。この手順は、Liu et al. 2019（上記）にさらに詳細に記載されているＴｅｔ補助ピリジンボランシーケンシング（ＴＡＰＳ）を包含する。一部の実施形態では、第２の部分試料が供される手順は、置換ボラン還元剤を用いたＴｅｔ補助ｐｉｃ－ボラン変換であるが、一方で、第１の部分試料が供される手順は、本明細書に記載されるもののうちのいずれかなど、非メチル化シトシンを変換する手順である。この手順の組合せは、高メチル化分配内の高メチル化分子および低メチル化分配内の低メチル化分子に対する影響を最小限に抑えながら、非特異的に分配された分子の同定を容易するはずである。

あるいは、ｈｍＣの保護（例えば、βＧＴを使用）は、置換ボラン還元剤を用いたＴｅｔ補助変換と組み合わせることができる。ｈｍＣは、βＧＴを使用したグルコシル化を通じて上述のように保護して、ｇｈｍＣを形成することができる。ＴＥＴタンパク質、例えば、ｍＴｅｔ１での処置は、次いで、ｍＣをｃａＣに変換するが、ＣもｇｈｍＣも変換しない。ｃａＣは、次いで、ｐｉｃ－ボランまたは別の置換ボラン還元剤、例えば、ボランピリジン、ｔｅｒｔ－ブチルアミンボラン、またはアンモニアボランでの処置によって、これもまた非改変ＣまたはｇｈｍＣに影響を及ぼすことなく、ＤＨＵに変換される。したがって、置換ボラン還元剤を用いたＴｅｔ補助変換が使用される場合、第１の核酸塩基は、ｍＣを含み、第２の核酸塩基は、非改変シトシンまたはｈｍＣのうちの１つまたは複数、例えば、非改変シトシン、ならびに必要に応じてｈｍＣ、ｆＣ、および／またはｃａＣを含む。変換されたＤＮＡのシーケンシングは、シトシンとして読み取られる位置を、ｈｍＣまたは非改変Ｃ位置であるとして同定する。一方、Ｔとして読み取られる位置は、Ｔ、ｆＣ、ｃａＣ、またはｍＣであるとして同定される。本明細書に記載されるように第１の部分試料にＴＡＰＳβ変換を行うことは、したがって、第１の部分試料から得られた配列読み取りデータを使用して、一方で非改変のＣまたはｈｍＣを含有する位置をｍＣを含有する位置と識別することを容易にする。このタイプの変換の例示的な説明については、例えば、Liu et al., Nature Biotechnology 2019; 37:424-429を参照されたい。

一部の実施形態では、第１の部分試料のＤＮＡ内の第１の核酸塩基に対してＤＮＡ内の第２の核酸塩基とは異なって影響を及ぼす手順は、置換ボラン還元剤を用いた化学物質補助変換を含み、必要に応じて、置換ボラン還元剤は、２－ピコリンボラン、ボランピリジン、ｔｅｒｔ－ブチルアミンボラン、またはアンモニアボランである。置換ボラン還元剤を用いた化学物質補助変換において、酸化剤、例えば、過ルテニウム酸カリウム（ＫＲｕＯ_４）（ｏｘ－ＢＳ変換における使用にも好適である）を使用して、特異的にｈｍＣをｆＣに酸化させる。ｐｉｃ－ボランまたは他の置換ボラン還元剤、例えば、ボランピリジン、ｔｅｒｔ－ブチルアミンボラン、またはアンモニアボランでの処置は、ｆＣおよびｃａＣをＤＨＵに変換させるが、ｍＣにも非改変Ｃにも影響を及ぼさない。したがって、このタイプの変換が使用される場合、第１の核酸塩基は、ｈｍＣ、ｆＣ、およびｃａＣのうちの１つまたは複数を含み、第２の核酸塩基は、非改変シトシンまたはｍＣのうちの１つまたは複数、例えば、非改変シトシンおよび必要に応じてｍＣを含む。変換されたＤＮＡのシーケンシングは、シトシンとして読み取られる位置を、ｍＣまたは非改変Ｃ位置であるとして同定する。一方、Ｔとして読み取られる位置は、Ｔ、ｆＣ、ｃａＣ、またはｈｍＣであるとして同定される。本明細書に記載されるように第１の部分試料にこのタイプの変換を行うことは、したがって、第１の部分試料から得られた配列読み取りデータを使用して、一方で非改変のＣまたはｍＣを含有する位置をｈｍＣを含有する位置と識別することを容易にする。このタイプの変換の例示的な説明については、例えば、Liu et al., Nature Biotechnology 2019; 37:424-429を参照されたい。

一部の実施形態では、第１の部分試料のＤＮＡ内の第１の核酸塩基に対してＤＮＡ内の第２の核酸塩基とは異なって影響を及ぼす手順は、ＡＰＯＢＥＣカップリングエピジェネティック（ＡＣＥ）変換を含む。ＡＣＥ変換において、ＡＩＤ／ＡＰＯＢＥＣファミリーＤＮＡデアミナーゼ酵素、例えば、ＡＰＯＢＥＣ３Ａ（Ａ３Ａ）を使用して、ｈｍＣ、ｆＣ、またはｃａＣを脱アミノ化することなく、非改変シトシンおよびｍＣを脱アミノ化する。したがって、ＡＣＥ変換が使用される場合、第１の核酸塩基は、非改変Ｃおよび／またはｍＣ（例えば、非改変Ｃおよび必要に応じてｍＣ）を含み、第２の核酸塩基は、ｈｍＣを含む。ＡＣＥ変換ＤＮＡのシーケンシングは、シトシンとして読み取られる位置を、ｈｍＣ、ｆＣ、またはｃａＣ位置であるとして同定する。一方、Ｔとして読み取られる位置は、Ｔ、非改変Ｃ、またはｍＣであるとして同定される。本明細書に記載されるように第１の部分試料にＡＣＥ変換を行うことは、したがって、第１の部分試料から得られた配列読み取りデータを使用して、ｈｍＣを含有する位置を、ｍＣまたは非改変Ｃを含有する位置と識別することを容易にする。ＡＣＥ変換の例示的な説明については、例えば、Schutsky et al., Nature Biotechnology 2018; 36: 1083-1090を参照されたい。

一部の実施形態では、第１の部分試料のＤＮＡ内の第１の核酸塩基に対してＤＮＡ内の第２の核酸塩基とは異なって影響を及ぼす手順は、例えば、ＥＭ－Ｓｅｑにあるように、第１の核酸塩基の酵素的変換を含む。例えばwww.biorxiv.org/content/10.1101/2019.12.20.884692v1において利用可能な、Vaisvila R, et al. (2019) EM-seq: Detection of DNA methylation at single base resolution from picograms of DNA. bioRxiv; DOI: 10.1101/2019.12.20.884692を参照されたい。例えば、ＴＥＴ２およびＴ４－βＧＴを使用して、５ｍＣおよび５ｈｍＣを、デアミナーゼ（例えば、ＡＰＯＢＥＣ３Ａ）によって脱アミノ化することができない基質に変換することができ、次いで、デアミナーゼ（例えば、ＡＰＯＢＥＣ３Ａ）を使用して、非改変シトシンを脱アミノ化してウラシルに変換することができる。

一部の実施形態では、第１の部分試料のＤＮＡ内の第１の核酸塩基に対してＤＮＡ内の第２の核酸塩基とは異なって影響を及ぼす手順は、もともと第１の核酸塩基を含むＤＮＡを、もともと第１の核酸塩基を含んでいないＤＮＡから分離することを含む。一部のそのような実施形態では、第１の核酸塩基は、ｈｍＣである。もともと第１の核酸塩基を含むＤＮＡは、もともと第１の核酸塩基を含んでいた位置をビオチン化することを含む標識化手順を使用して、他のＤＮＡから分離され得る。一部の実施形態では、第１の核酸塩基は、まず、アジド含有部分、例えば、グルコシル－アジド含有部分で誘導体化される。アジド含有部分は、次いで、例えば、ヒュスゲン環化付加化学反応を通じてビオチンを付着させるための試薬としての機能を果たし得る。次いで、ここでビオチン化されたもともと第１の核酸塩基を含むＤＮＡは、ビオチン結合剤、例えば、アビジン、ニュートラアビジン（約６．３の等電点を有する脱グリコシル化アビジン）、またはストレプトアビジンを使用して、もともと第１の核酸塩基を含まないＤＮＡから分離され得る。もともと第１の核酸塩基を含むＤＮＡを、もともと第１の核酸塩基を含まないＤＮＡから分離するための手順の例は、ｈｍＣ－シールであり、これは、ｈｍＣを標識して、β－６－アジド－グルコシル－５－ヒドロキシメチルシトシンを形成し、次いで、ヒュスゲン環化付加を通じてビオチン部分を付着させ、続いて、ビオチン結合剤を使用して、ビオチン化ＤＮＡを他のＤＮＡから分離する。ｈｍＣ－シールの例示的な説明については、例えば、Han et al., Mol. Cell 2016; 63: 711-719を参照されたい。このアプローチは、１つまたは複数のｈｍＣ核酸塩基を含む断片を特定するのに有用である。

一部の実施形態では、そのような分離に続いて、方法は、もともと第１の核酸塩基を含むＤＮＡの各々を、もともと第１の核酸塩基を含まないＤＮＡおよび第２の部分試料のＤＮＡとは差次的にタグ付けするステップをさらに含む。方法は、差次的タグ付けの後に、もともと第１の核酸塩基を含むＤＮＡ、もともと第１の核酸塩基を含まないＤＮＡ、および第２の部分試料のＤＮＡをプールするステップをさらに含む。もともと第１の核酸塩基を含むＤＮＡ、もともと第１の核酸塩基を含まないＤＮＡ、および第２の部分試料のＤＮＡは、次いで、同じシーケンシングセルにおいてシーケンシングされ得るが、差次的タグを使用して、所与の読み取りデータが、もともと第１の核酸塩基を含むＤＮＡ、もともと第１の核酸塩基を含まないＤＮＡ、または第２の部分試料のＤＮＡの分子に由来するかを解明する能力は保持する。

一部の実施形態では、第１の核酸塩基は、改変または非改変アデニンであり、第２の核酸塩基は、改変または非改変アデニンである。一部の実施形態では、改変アデニンは、Ｎ^６－メチルアデニン（ｍＡ）である。一部の実施形態では、改変アデニンは、Ｎ^６－メチルアデニン（ｍＡ）、Ｎ^６－ヒドロキシメチルアデニン（ｈｍＡ）、またはＮ^６－ホルミルアデニン（ｆＡ）のうちの１つまたは複数である。

メチル化ＤＮＡ免疫沈降（ＭｅＤＩＰ）を含む技術を使用して、改変塩基、例えば、ｍＡを含有するＤＮＡを、他のＤＮＡから分離することができる。例えば、Kumar et al., Frontiers Genet. 2018; 9: 640; Greer et al., Cell 2015; 161: 868-878を参照されたい。ｍＡに特異的な抗体は、Sun et al., Bioessays 2015; 37:1155-62に記載されている。様々な改変核酸塩基、例えば、ハロゲン化形態、例えば、５－ブロモウラシルを含むチミン／ウラシルの形態に対する抗体が、市販されている。様々な改変塩基はまた、その塩基対形成特異性における変化に基づいて検出することができる。例えば、ヒポキサンチンは、脱アミノ化により生じ得るアデニンの改変形態であり、シーケンシングにおいてＧとして読み取られる。例えば、米国特許第８，４８６，６３０号、Brown, Genomes, 2^ndEd., John Wiley & Sons, Inc., New York, N.Y., 2002, chapter 14, "Mutation, Repair, and Recombination"を参照されたい。
４．部分試料を、メチル化感受性ヌクレアーゼと接触させる

一部の実施形態では、部分試料（例えば、本明細書に記載されるように、例えば、シトシン改変、例えば、メチル化、例えば、５－メチル化のレベルに基づいて、試料を分配することによって調製された、第１および／または第３の部分試料）を、メチル化感受性ヌクレアーゼと接触させる。別途示されない限り、分配が、シトシン改変に基づいて行われる場合、第１の部分試料は、より高いレベルの改変を有する部分試料であり、第２の部分試料は、より低いレベルの改変を有する部分試料であり、存在する場合、第３の部分試料は、第１の部分試料と第２の部分試料との間の中間のレベルの改変を有する。

上記で考察されるように、分配する手順は、部分試料間で、ＤＮＡ分子の不完全な選別をもたらす場合がある。メチル化感受性ヌクレアーゼを使用して、第１または第３の部分試料中の非特異的に分配されたＤＮＡ（例えば、低メチル化ＤＮＡ）を分解することができる。一部の実施形態では、第１の部分試料を、メチル化感受性エンドヌクレアーゼ、例えば、メチル化感受性制限酵素と接触させ、それによって第１の部分試料中の非特異的に分配されたＤＮＡを分解して、処置された第１の部分試料を産生することができる。非特異的に分配されたＤＮＡの分解は、例えば、試料中の異常に改変されたＤＮＡの存在を検出するため、ＤＮＡの起源である組織を決定するため、および／または対象ががんを有するかどうかを決定するために、シトシン改変に基づくＤＮＡの正確な分配に依存する方法の性能の改善として、提案される。例えば、そのような分解は、改善された感度をもたらし、かつ／または下流の解析を単純化し得る。

部分試料をヌクレアーゼと接触させるとき、１つまたは複数のヌクレアーゼを使用することができる。一部の実施形態では、部分試料を、複数のヌクレアーゼと接触させる。部分試料は、逐次的または同時に、ヌクレアーゼと接触させてもよい。ヌクレアーゼの同時使用は、ヌクレアーゼが、類似の条件（例えば、緩衝液組成）下において活性である場合に、不必要な試料操作を回避するため有益であり得る。第２の部分試料を、１つを上回るメチル化依存性制限酵素と接触させることにより、非特異的に分配された高メチル化ＤＮＡをより完全に分解することができる。同様に、第１の部分試料を、１つを上回るメチル化感受性制限酵素と接触させることにより、非特異的に分配された低メチル化ＤＮＡおよび／または非メチル化ＤＮＡをより完全に分解することができる。

一部の実施形態では、メチル化感受性ヌクレアーゼは、ＡａｔＩＩ、ＡｃｃＩＩ、ＡｃｉＩ、Ａｏｒ１３ＨＩ、Ａｏｒ１５ＨＩ、ＢｓｐＴ１０４Ｉ、ＢｓｓＨＩＩ、ＢｓｔＵＩ、Ｃｆｒ１０Ｉ、ＣｌａＩ、ＣｐｏＩ、Ｅｃｏ５２Ｉ、ＨａｅＩＩ、ＨａｐＩＩ、ＨｈａＩ、Ｈｉｎ６Ｉ、ＨｐａＩＩ、ＨｐｙＣＨ４ＩＶ、ＭｌｕＩ、ＭｓｐＩ、ＮａｅＩ、ＮｏｔＩ、ＮｒｕＩ、ＮｓｂＩ、ＰｍａＣＩ、Ｐｓｐ１４０６Ｉ、ＰｖｕＩ、ＳａｃＩＩ、ＳａｌＩ、ＳｍａＩ、およびＳｎａＢＩのうちの１つまたは複数を含む。一部の実施形態では、少なくとも２つのメチル化感受性ヌクレアーゼが使用される。一部の実施形態では、少なくとも３つのメチル化感受性ヌクレアーゼが使用される。一部の実施形態では、メチル化感受性ヌクレアーゼは、ＢｓｔＵＩおよびＨｐａＩＩを含む。一部の実施形態では、２つのメチル化感受性ヌクレアーゼは、ＨｈａＩおよびＡｃｃＩＩを含む。一部の実施形態では、メチル化感受性ヌクレアーゼは、ＢｓｔＵＩ、ＨｐａＩＩ、およびＨｉｎ６Ｉを含む。

第３の部分試料（例えば、中間メチル化分配）を含む実施形態では、その中の核酸分子は、メチル化感受性ヌクレアーゼで消化され得る。一部の実施形態では、第３の部分試料（例えば、中間メチル化分配）中の核酸分子は、第１の部分試料（例えば、高メチル化分配）と同じヌクレアーゼで消化される。例えば、第３の部分試料（例えば、中間メチル化分配）は、第１の部分試料（例えば、高メチル化分配）とともにプールされてもよく、次いで、プールされた分配を、消化に供してもよい。

一部の実施形態では、部分試料を、ＤＮＡの両方の末端へタグ付けするまたはアダプターを付着するステップの後に、上述のようにヌクレアーゼと接触させる。タグまたはアダプターは、上述のアプローチのうちのいずれかを使用したヌクレアーゼによる切断に対して抵抗性であり得る。このアプローチにおいて、切断は、非特異的に分配された分子が解析まで持ち込まれることを防止し得るが、これは、切断産物が、両方の末端においてタグまたはアダプターが欠如しているためである。

あるいは、タグ付けするまたはアダプターを付着するステップは、上述のようにヌクレアーゼによる切断の後に行うことができる。切断された分子を、次いで、ヌクレアーゼ認識部位に対応する末端（タグまたはアダプターへの付着点）を有することに基づいて、配列読み取りデータ内で同定することができる。このようにして分子をプロセシングすることによっても、切断された分子、例えば、体細胞突然変異の観察からの情報の獲得が可能となり得る。部分試料をヌクレアーゼと接触させた後にタグ付けするまたはアダプターを付着し、低分子量ＤＮＡ、例えば、ｃｆＤＮＡを解析する場合、接触させるステップの前に、試料から高分子量ＤＮＡ（例えば、混入しているゲノムＤＮＡ）を除去することが望ましい場合がある。また、変性は後続のライゲーションステップを妨害し得るという点で、比較的低い温度（例えば、６５℃もしくはそれ未満、または６０℃もしくはそれ未満）で熱不活化することができるヌクレアーゼを使用して、ＤＮＡの変性を回避することが望ましい場合もある。

試料を、中間メチル化分子を含有する第３の部分試料を含む、３つの部分試料に分配する場合、第３の部分試料は、一部の実施形態では、メチル化感受性ヌクレアーゼと接触させられる。そのようなステップは、接触させるステップと関連する本明細書の他の箇所に記載される特色のうちのいずれかを有し得、上記で考察されるように、タグ付けするまたはアダプターを付着するステップの前または後に行われ得る。一部の実施形態では、第１および第３の部分試料は、メチル化感受性ヌクレアーゼと接触させる前に、組み合わされる。そのようなステップは、接触させるステップと関連する本明細書の他の箇所に記載される特色のうちのいずれかを有し得、上記で考察されるように、タグ付けするまたはアダプターを付着するステップの前または後に行われ得る。一部の実施形態では、第１および第３の部分試料は、組み合わせる前に、差次的にタグ付けされる。

一部の実施形態では、ＤＮＡは、ヌクレアーゼと接触させた後、例えば、ＳＰＲＩビーズを使用して精製される。そのような精製は、ヌクレアーゼの熱不活化後に行われ得る。あるいは、精製は、省略されてもよく、したがって、例えば、増幅などの後続のステップが、熱不活化されたヌクレアーゼを含有する部分試料に行われ得る。別の実施形態では、接触ステップは、例えば、チューブ移送と関連する消失が最小限となるように、精製試薬、例えば、ＳＰＲＩビーズの存在下で行われ得る。切断および熱不活化後に、ＳＰＲＩビーズは、分子クラウディング試薬（例えば、ＰＥＧ）および塩を添加することによるクリーンアップに再利用され得る。
５．富化／捕捉ステップ；増幅、アダプター、バーコード

一部の実施形態では、本明細書に開示される方法は、ＤＮＡ、例えば、ｃｆＤＮＡの標的領域の１つまたは複数のセットを捕捉するステップを含む。捕捉は、当技術分野において公知の任意の好適なアプローチを使用して行われ得る。

一部の実施形態では、捕捉するステップは、捕捉しようとするＤＮＡを、標的特異的プローブのセットと接触させることを含む。標的特異的プローブのセットは、上述の実施形態および下記のプローブに関連する節におけるものを含むがこれらに限定されない、標的特異的プローブのセットに関して本明細書に記載される特色のうちのいずれかを有し得る。捕捉するステップは、本明細書において開示される方法の間に調製される１つまたは複数の部分試料に行われ得る。一部の実施形態では、ＤＮＡは、少なくとも第１の部分試料または第２の部分試料、例えば、少なくとも第１の部分試料および第２の部分試料から、捕捉される。一部の実施形態では、部分試料は、差次的にタグ付けされ（例えば、本明細書に記載されるように）、次いで、プールされた後、捕捉を受ける。

捕捉するステップは、一般的に長さ、塩基組成などのプローブの特色にある程度依存する特異的核酸ハイブリダイゼーションにとって好適な条件を使用して実施され得る。当業者は、核酸ハイブリダイゼーションに関して当技術分野で一般的な知識を考慮して適切な条件を熟知している。一部の実施形態では、標的特異的プローブおよびＤＮＡの複合体が形成される。

一部の実施形態では、本明細書に記載される方法は、複数の標的領域のセットに関して、試験対象から得られたｃｆＤＮＡを捕捉するステップを含む。標的領域は、エピジェネティック標的領域を含み、これは、それらが腫瘍を起源とするか、健康な細胞を起源とするかに応じて、メチル化レベルおよび／または断片化パターンに相違を示し得る。標的領域はまた、配列可変標的領域を含み、これは、それらが腫瘍を起源とするか、健康な細胞を起源とするかに応じて、配列に相違を示し得る。捕捉するステップは、ｃｆＤＮＡ分子の捕捉されたセットを産生し、配列可変標的領域セットに対応するｃｆＤＮＡ分子は、ｃｆＤＮＡ分子の捕捉されたセットにおいて、エピジェネティック標的領域セットに対応するｃｆＤＮＡ分子よりも高い捕捉収率で捕捉される。捕捉するステップ、捕捉収率、および関連する態様に関するさらなる考察については、全ての目的に関して参照により本明細書に組み込まれる、ＷＯ２０２０／１６０４１４を参照されたい。

一部の実施形態では、本明細書に記載される方法は、試験対象から得られたｃｆＤＮＡを、標的特異的プローブのセットと接触させることを含み、標的特異的プローブのセットは、エピジェネティック標的領域セットに対応するｃｆＤＮＡよりも高い捕捉収率で配列可変標的領域セットに対応するｃｆＤＮＡを捕捉するように構成される。

配列可変標的領域を十分な信頼度または精度で解析するためには、エピジェネティック標的領域を解析するために必要であり得るよりも大きい深度のシーケンシングが必要であり得ることから、配列可変標的領域セットに対応するｃｆＤＮＡを、エピジェネティック標的領域セットに対応するｃｆＤＮＡよりも高い捕捉収率で捕捉することは有益であり得る。断片化パターン（例えば、転写開始部位またはＣＴＣＦ結合部位の乱れに関して試験するために）または断片の存在量（例えば、高メチル化および低メチル化分配における）を決定するために必要なデータ量は、一般的に、がん関連配列突然変異の存在または非存在を決定するために必要なデータ量よりも少ない。異なる収率で標的領域セットを捕捉することは、同じシーケンシングの実行においてシーケンシングの異なる深度まで標的領域をシーケンシングすることを容易にし得る（例えば、プールした混合物を使用しておよび／または同じシーケンシングセル中で）。

様々な実施形態では、方法は、本明細書における考察と一貫して、捕捉されたｃｆＤＮＡを、例えば、エピジェネティックおよび配列可変標的領域セットに関して様々な程度のシーケンシング深度までシーケンシングするステップをさらに含む。

一部の実施形態では、標的特異的プローブおよびＤＮＡの複合体を、標的特異的プローブに結合していないＤＮＡから分離する。例えば、標的特異的プローブが共有結合または非共有結合によって固体支持体に結合している場合、洗浄または吸引ステップを使用して非結合材料を分離することができる。あるいは、複合体が、非結合材料とは別個のクロマトグラフィー特性を有する場合（例えば、プローブが、クロマトグラフィー樹脂に結合するリガンドを含む場合）、クロマトグラフィーを使用することができる。

本明細書において他所で詳細に考察するように、標的特異的プローブのセットは、配列可変標的領域セットのプローブおよびエピジェネティック標的領域セットのプローブなどの複数のセットを含み得る。一部のそのような実施形態では、捕捉するステップは、同じ容器で同時に、配列可変標的領域セットのプローブおよびエピジェネティック標的領域セットのプローブについて実施され、例えば配列可変標的領域セットおよびエピジェネティック標的領域セットのプローブは、同じ組成物中にある。このアプローチは、比較的合理化されたワークフローを提供する。一部の実施形態では、配列可変標的領域セットのプローブの濃度は、エピジェネティック標的領域セットのプローブの濃度よりも高い。

あるいは、捕捉するステップは、第１の容器中で配列可変標的領域プローブセットについて、および第２の容器中でエピジェネティック標的領域プローブセットについて実施されるか、または接触させることは、第１の時間および第１の容器で配列可変標的領域プローブセットについて、ならびに第１の時間の前もしくは後の第２の時間でエピジェネティック標的領域プローブセットについて実施される。このアプローチは、配列可変標的領域セットに対応する捕捉されたＤＮＡおよびエピジェネティック標的領域セットに対応する捕捉されたＤＮＡを含む個別の第１および第２の組成物の調製を可能にする。組成物を、所望のように個別にプロセシングし（例えば、本明細書において他所で記載されるようにメチル化に基づいて分画するために）、適切な割合で組み換えて、さらなるプロセシングおよびシーケンシングなどの解析のための材料を提供することができる。

一部の実施形態では、ＤＮＡは増幅される。一部の実施形態では、増幅は、捕捉するステップの前に実施される。一部の実施形態では、増幅は、捕捉するステップの後に実施される。

一部の実施形態では、アダプターは、ＤＮＡに含まれる。これは、例えば上記のように、例えばプライマーの５’部分にアダプターを提供することによって、増幅手順と同時に行われ得る。あるいは、アダプターは、ライゲーションなどの他のアプローチによって付加され得る。

一部の実施形態では、バーコードであり得るかまたはそれを含み得るタグは、ＤＮＡに含まれる。タグは、核酸の起源の同定を容易にし得る。例えば、並列シーケンシングのために複数の試料をプールした後に、バーコードを使用して、ＤＮＡが由来する起源（例えば、対象）を同定することが可能であり得る。これは、例えば、上述のように、例えば、プライマーの５’部分にバーコードを提供することによって、増幅手順と同時に行うことができる。一部の実施形態では、アダプターおよびタグ／バーコードは、同じプライマーまたはプライマーセットによって提供される。例えば、バーコードは、アダプターの３’およびプライマーの標的にハイブリダイズする部分の５’に位置付けられ得る。あるいは、バーコードは、他のアプローチ、例えば、ライゲーションによって、必要に応じて同じライゲーション基質においてアダプターと一緒に、付加され得る。

増幅、タグ、およびバーコードに関するさらなる詳細は、以下の「方法の全般的特色」の節において考察されており、これは、実用的な程度で、前述の実施形態ならびに序説および概要の節に記載される実施形態のいずれかと組み合わせることができる。
６．捕捉されたセット

一部の実施形態では、ＤＮＡ（例えば、ｃｆＤＮＡ）の捕捉されたセットが提供される。開示される方法に関して、ＤＮＡの捕捉されたセットは、例えば、本明細書に記載されるように分配するステップの後に捕捉するステップを行うことによって、提供され得る。捕捉されたセットは、配列可変標的領域セット、エピジェネティック標的領域セット、またはこれらの組合せに対応するＤＮＡを含み得る。

一部の実施形態では、第１の標的領域セットは、少なくともエピジェネティック標的領域を含む、第１の部分試料から捕捉される。第１の部分試料から捕捉されるエピジェネティック標的領域は、高メチル化可変標的領域を含み得る。一部の実施形態では、高メチル化可変標的領域は、健康な対象に由来するｃｆＤＮＡにおいて、非メチル化であるか、または低いメチル化（例えば、バルクｃｆＤＮＡと比べて、平均を下回るメチル化）を有するＣｐＧを含有領域である。一部の実施形態では、高メチル化可変標的領域は、健康なｃｆＤＮＡにおいて、少なくとも１つの他の組織タイプにおけるものよりも低いメチル化を示す、領域である。いずれの特定の理論によっても束縛されることを望むものではないが、がん細胞は、同じ組織タイプの健康な細胞よりも多くのＤＮＡを、血流中に脱落させ得る。そのため、ｃｆＤＮＡの起源の組織の分布は、発癌の際に変化し得る。したがって、第１の部分試料における高メチル化可変標的領域のレベルの増加は、がんの存在（または対象の既往に応じて、再発）を示し得る。

一部の実施形態では、第２の標的領域セットは、少なくともエピジェネティック標的領域を含む、第２の部分試料から捕捉される。エピジェネティック標的領域は、低メチル化可変標的領域を含み得る。一部の実施形態では、低メチル化可変標的領域は、健康な対象に由来するｃｆＤＮＡにおいて、メチル化されているか、または高いメチル化（例えば、バルクｃｆＤＮＡと比べて、平均を上回るメチル化）を有するＣｐＧ含有領域である。一部の実施形態では、低メチル化可変標的領域は、健康なｃｆＤＮＡにおいて、少なくとも１つの他の組織タイプにおけるものよりも高いメチル化を示す、領域である。いずれの特定の理論によっても束縛されることを望むものではないが、がん細胞は、同じ組織タイプの健康な細胞よりも多くのＤＮＡを、血流中に脱落させ得る。そのため、ｃｆＤＮＡの起源の組織の分布は、発癌の際に変化し得る。したがって、第２の部分試料における低メチル化可変標的領域のレベルの増加は、がんの存在（または対象の既往に応じて、再発）を示し得る。

一部の実施形態では、捕捉された配列可変標的領域ＤＮＡの数量は、標的とされる領域のサイズ（フットプリントサイズ）の差に関して正規化した場合、捕捉されたエピジェネティック標的領域ＤＮＡの数量よりも多い。

あるいは、それぞれ、配列可変標的領域セットに対応するＤＮＡおよびエピジェネティック標的領域セットに対応するＤＮＡを含む、第１および第２の捕捉されたセットが提供されてもよい。第１および第２の捕捉されたセットを組み合わせて、組合せの捕捉されたセットを提供してもよい。

配列可変標的領域セットおよびエピジェネティック標的領域セットに対応するＤＮＡを含む捕捉されたセットが、上記で考察したように組合せの捕捉されたセットを含む一部の実施形態では、配列可変標的領域セットに対応するＤＮＡは、エピジェネティック標的領域セットに対応するＤＮＡよりも高い濃度、例えば、１．１倍～１．２倍高い濃度、１．２倍～１．４倍高い濃度、１．４倍～１．６倍高い濃度、１．６倍～１．８倍高い濃度、１．８倍～２．０倍高い濃度、２．０倍～２．２倍高い濃度、２．２倍～２．４倍高い濃度、２．４倍～２．６倍高い濃度、２．６倍～２．８倍高い濃度、２．８倍～３．０倍高い濃度、３．０倍～３．５倍高い濃度、３．５倍～４．０、４．０倍～４．５倍高い濃度、４．５倍～５．０倍高い濃度、５．０倍～５．５倍高い濃度、５．５倍～６．０倍高い濃度、６．０倍～６．５倍高い濃度、６．５倍～７．０倍高い、７．０倍～７．５倍高い濃度、７．５倍～８．０倍高い濃度、８．０倍～８．５倍高い濃度、８．５倍～９．０倍高い濃度、９．０倍～９．５倍高い濃度、９．５倍～１０．０倍高い濃度、１０倍～１１倍高い濃度、１１倍～１２倍高い濃度、１２倍～１３倍高い濃度、１３倍～１４倍高い濃度、１４倍～１５倍高い濃度、１５倍～１６倍高い濃度、１６倍～１７倍高い濃度、１７倍～１８倍高い濃度、１８倍～１９倍高い濃度、１９倍～２０倍高い濃度、２０倍～３０倍高い濃度、３０倍～４０倍高い濃度、４０倍～５０倍高い濃度、５０倍～６０倍高い濃度、６０倍～７０倍高い濃度、７０倍～８０倍高い濃度、８０倍～９０倍高い濃度、または９０倍～１００倍高い濃度で存在し得る。濃度の差の程度は、定義の節において考察されるように、標的領域のフットプリントサイズに関する正規化を説明する。
ａ．エピジェネティック標的領域セット

エピジェネティック標的領域セットは、新生物（例えば、腫瘍またはがん）細胞に由来するＤＮＡと、健康な細胞、例えば、非新生物循環細胞に由来するものとを区別する可能性が高い１つまたは複数のタイプの標的領域を含み得る。そのような領域の例示的なタイプは、本明細書において詳細に考察されている。エピジェネティック標的領域セットはまた、例えば、本明細書に記載されるように、１つまたは複数の対照領域も含み得る。

一部の実施形態では、エピジェネティック標的領域セットは、少なくとも１００ｋｂｐ、例えば、少なくとも２００ｋｂｐ、少なくとも３００ｋｂｐ、または少なくとも４００ｋｂｐのフットプリントを有する。一部の実施形態では、エピジェネティック標的領域セットは、１００～２０Ｍｂｐ、例えば、１００～２００ｋｂｐ、２００～３００ｋｂｐ、３００～４００ｋｂｐ、４００～５００ｋｂｐ、５００～６００ｋｂｐ、６００～７００ｋｂｐ、７００～８００ｋｂｐ、８００～９００ｋｂｐ、９００～１，０００ｋｂｐ、１～１．５Ｍｂｐ、１．５～２Ｍｂｐ、２～３Ｍｂｐ、３～４Ｍｂｐ、４～５Ｍｂｐ、５～６Ｍｂｐ、６～７Ｍｂｐ、７～８Ｍｂｐ、８～９Ｍｂｐ、９～１０Ｍｂｐ、または１０～２０Ｍｂｐの範囲のフットプリントを有する。一部の実施形態では、エピジェネティック標的領域セットは、少なくとも２０Ｍｂｐのフットプリントを有する。
ｉ．高メチル化可変標的領域

一部の実施形態では、エピジェネティック標的領域セットは、１つまたは複数の高メチル化可変標的領域を含む。一般に、高メチル化可変標的領域は、例えば、ｃｆＤＮＡ試料において観察されるメチル化のレベルの増加が、（例えば、ｃｆＤＮＡの）試料が新生物細胞、例えば、腫瘍細胞またはがん細胞によって産生されるＤＮＡを含有する可能性の増加を示す、領域を指す。例えば、腫瘍抑制遺伝子のプロモーターの高メチル化は、反復的に観察されている。例えば、Kang et al., Genome Biol. 18:53 (2017)およびそこに引用されている参考文献を参照されたい。別の例では、上記で考察されるように、高メチル化可変標的領域は、がん性組織において、必ずしも、同じタイプの健康な組織に由来するＤＮＡと比べてメチル化が異なるわけではないが、健康な対象において典型的なｃｆＤＮＡと比べてメチル化が異なる（例えば、より多くのメチル化を有する）、領域を含み得る。例えば、がんの存在が、細胞死、例えば、がんに対応する組織タイプの細胞のアポトーシスの増加をもたらす場合、そのようながんは、少なくとも部分的に、そのような高メチル化可変標的領域を使用して検出することができる。

結腸直腸がんにおけるメチル化可変標的領域に関する広範な考察は、Lam et al., Biochim Biophys Acta. 1866:106-20 (2016)に提供されている。これらには、ＶＩＭ、ＳＥＰＴ９、ＩＴＧＡ４、ＯＳＭ４、ＧＡＴＡ４、およびＮＤＲＧ４が含まれる。結腸直腸がん（ＣＲＣ）研究に基づく高メチル化可変標的領域の例示的なセットは、表１に提供されている。これらの遺伝子の多くは、結腸直腸がん以外のがんにも関連性を有する可能性が高く、例えば、ＴＰ５３は、極めて重要な腫瘍抑制因子として広く認識されており、この遺伝子の高メチル化に基づく不活化は、一般的な発癌機序であり得る。

一部の実施形態では、高メチル化可変標的領域は、表１に列挙される座のうちの複数、例えば、表１に列挙される座のうちの少なくとも１０％、２０％、３０％、４０％、５０％、６０％、７０％、８０％、９０％、または１００％を含む。例えば、標的領域として含まれる各座に関して、遺伝子の転写開始部位と終止コドン（選択的にスプライシングされる遺伝子の最後の終止コドン）との間または遺伝子のプロモーター領域に結合するハイブリダイゼーション部位を有する１つまたは複数のプローブが存在し得る。一部の実施形態では、１つまたは複数のプローブは、表１における遺伝子の転写開始部位から３００ｂｐ以内、例えば、２００または１００ｂｐ以内に結合する。

様々なタイプの肺がんにおけるメチル化可変標的領域は、例えば、Ooki et al., Clin. Cancer Res. 23:7141-52 (2017)、Belinksy, Annu. Rev. Physiol. 77:453-74 (2015)、Hulbert et al., Clin. Cancer Res. 23:1998-2005 (2017)、Shi et al., BMC Genomics 18:901 (2017)、Schneider et al., BMC Cancer. 11:102 (2011)、Lissa et al., Transl Lung Cancer Res 5(5):492-504 (2016)、Skvortsova et al., Br. J. Cancer. 94(10):1492-1495 (2006)、Kim et al., Cancer Res. 61:3419-3424 (2001)、Furonaka et al., Pathology International 55:303-309 (2005)、Gomes et al., Rev. Port. Pneumol. 20:20-30 (2014)、Kim et al., Oncogene. 20:1765-70 (2001)、Hopkins-Donaldson et al., Cell Death Differ. 10:356-64 (2003)、Kikuchi et al., Clin. Cancer Res. 11:2954-61 (2005)、Heller et al., Oncogene 25:959-968 (2006)、Licchesi et al., Carcinogenesis. 29:895-904 (2008)、Guo et al., Clin. Cancer Res. 10:7917-24 (2004)、Palmisano et al., Cancer Res. 63:4620-4625 (2003)、およびToyooka et al., Cancer Res. 61:4556-4560, (2001)において詳細に考察されている。

肺がん研究に基づく高メチル化可変標的領域の例示的なセットは、表２に提供されている。これらの遺伝子の多くは、肺がん以外のがんにも関連性を有する可能性が高く、例えば、Ｃａｓｐ８（カスパーゼ８）は、プログラム細胞死における鍵となる酵素であり、この遺伝子の高メチル化に基づく不活化は、肺がんに限定されない一般的な発癌機序であり得る。さらに、いくつかの遺伝子は、表１および２の両方に出現し、一般性を示す。

表２において同定される標的領域に関する前述の実施形態のうちのいずれかを、表１において同定される標的領域に関して上述された実施形態のうちのいずれかと組み合わせてもよい。一部の実施形態では、高メチル化可変標的領域は、表１または表２に列挙される座のうちの複数、例えば、表１または表２に列挙される座のうちの少なくとも１０％、２０％、３０％、４０％、５０％、６０％、７０％、８０％、９０％、または１００％を含む。

さらなる高メチル化標的領域は、例えば、ＣａｎｃｅｒＧｅｎｏｍｅＡｔｌａｓから得ることができる。Kang et al., Genome Biology 18:53 (2017)は、乳房、結腸、腎臓、肝臓、および肺に由来する高メチル化標的領域を使用したＣａｎｃｅｒＬｏｃａｔｏｒと称される確率的方法の構築について記載している。一部の実施形態では、高メチル化標的領域は、がんの１つまたは複数のタイプに特異的であり得る。したがって、一部の実施形態では、高メチル化標的領域は、乳がん、結腸がん、腎臓がん、肝臓がん、および肺がんのうちの１つ、２つ、３つ、４つ、または５つにおいて高メチル化を集合的に示す高メチル化標的領域の１つ、２つ、３つ、４つ、または５つのサブセットを含む。

一部の実施形態では、異なるエピジェネティック標的領域が、第１および第２の部分試料から捕捉される場合、第１の部分試料から捕捉されるエピジェネティック標的領域は、高メチル化可変標的領域を含む。
ｉｉ．低メチル化可変標的領域

全体的な低メチル化は、様々ながんにおいて共通して観察される現象である。例えば、Hon et al., Genome Res. 22:246-258 (2012)（乳がん）、Ehrlich, Epigenomics 1:239-259 (2009)（結腸がん、卵巣がん、前立腺がん、白血病、肝細胞がん、および子宮頸がんにおける低メチル化の観察に言及した総説論文）を参照されたい。例えば、反復エレメント、例えば、ＬＩＮＥ１エレメント、Ａｌｕエレメント、セントロメアタンデムリピート、ペリセントロメアタンデムリピート、およびサテライトＤＮＡなどの領域、ならびに健康な細胞において通常メチル化されている遺伝子間領域は、腫瘍細胞において、低減されたメチル化を示し得る。したがって、一部の実施形態では、エピジェネティック標的領域セットは、観察されるメチル化のレベルの減少が、（例えば、ｃｆＤＮＡの）試料が新生物細胞、例えば、腫瘍細胞またはがん細胞によって産生されるＤＮＡを含有する可能性の増加を示す、低メチル化可変標的領域を含む。別の例では、上記で考察されるように、低メチル化可変標的領域は、がん性組織において、必ずしも、同じタイプの健康な組織に由来するＤＮＡと比べてメチル化が異なるわけではないが、健康な対象において典型的なｃｆＤＮＡと比べてメチル化が異なる（例えば、あまり非メチル化である）、領域を含み得る。例えば、がんの存在が、細胞死、例えば、がんに対応する組織タイプの細胞のアポトーシスの増加をもたらす場合、そのようながんは、少なくとも部分的に、そのような低メチル化可変標的領域を使用して検出することができる。

一部の実施形態では、低メチル化可変標的領域は、反復エレメントおよび／または遺伝子間領域を含む。一部の実施形態では、反復エレメントは、ＬＩＮＥ１エレメント、Ａｌｕエレメント、セントロメアタンデムリピート、ペリセントロメアタンデムリピート、および／またはサテライトＤＮＡのうちの１つ、２つ、３つ、４つ、または５つを含む。

がんに関連する低メチル化を示す例示的な特定のゲノム領域としては、ヒト第１染色体のヌクレオチド８４０３５６５～８９５３７０８および１５１１０４７０１～１５１１０６０３５が挙げられる。一部の実施形態では、低メチル化可変標的領域は、これらの領域のうちの一方または両方と重複するか、またはそれを含む。

一部の実施形態では、異なるエピジェネティック標的領域が、第１および第２の部分試料から捕捉される場合、第２の部分試料から捕捉されるエピジェネティック標的領域は、低メチル化可変標的領域を含む。一部の実施形態では、第２の部分試料から捕捉されるエピジェネティック標的領域は、低メチル化可変標的領域を含み、第１の部分試料から捕捉されるエピジェネティック標的領域は、高メチル化可変標的領域を含む。
ｉｉｉ．ＣＴＣＦ結合領域

ＣＴＣＦは、クロマチン構成に寄与し、しばしば、コヒーシンと共局在化する、ＤＮＡ結合タンパク質である。ＣＴＣＦ結合部位の乱れが、様々な異なるがんにおいて報告されている。例えば、Katainen et al., Nature Genetics, doi:10.1038/ng.3335, published online 8 June 2015、Guo et al., Nat. Commun. 9:1520 (2018)を参照されたい。ＣＴＣＦ結合は、シーケンシングによって、例えば、断片長解析を通じて検出することができる、ｃｆＤＮＡにおける認識可能なパターンをもたらす。シーケンシングに基づく断片長解析に関する詳細は、Snyder et al., Cell 164:57-68 (2016)、ＷＯ２０１８／００９７２３、およびＵＳ２０１７０２１１１４３Ａ１において提供されており、これらのそれぞれは、参照により本明細書に組み込まれる。

したがって、ＣＴＣＦ結合の乱れは、ｃｆＤＮＡの断片化パターンに変動をもたらす。そのため、ＣＴＣＦ結合部位は、断片化可変標的領域の１つのタイプを表す。

多数の公知のＣＴＣＦ結合部位が存在する。例えば、例えばその各々が参照により組み込まれる、insulatordb.uthsc.edu/においてインターネット上で利用可能なＣＴＣＦＢＳＤＢ（ＣＴＣＦ結合部位データベース）、Cuddapah et al., Genome Res. 19:24-32 (2009)、Martin et al., Nat. Struct. Mol. Biol. 18:708-14 (2011)、Rhee et al., Cell. 147:1408-19 (2011)を参照されたい。例示的なＣＴＣＦ結合部位は、第８染色体のヌクレオチド５６０１４９５５～５６０１６１６１、および第１３染色体のヌクレオチド９５３５９１６９～９５３６０４７３である。

したがって、一部の実施形態では、エピジェネティック標的領域セットは、ＣＴＣＦ結合領域を含む。一部の実施形態では、ＣＴＣＦ結合領域は、少なくとも１０個、２０個、５０個、１００個、２００個、もしくは５００個のＣＴＣＦ結合領域、または１０～２０個、２０～５０個、５０～１００個、１００～２００個、２００～５００個、もしくは５００～１０００個のＣＴＣＦ結合領域、例えば、上述または上記に列挙されたＣＴＣＦＢＳＤＢもしくはＣｕｄｄａｐａｈら、Ｍａｒｔｉｎら、もしくはＲｈｅｅらの論文のうちの１つもしくは複数に記載されるＣＴＣＦ結合領域などを含む。

一部の実施形態では、ＣＴＣＦ部位のうちの少なくともいくつかは、メチル化されていても、メチル化されていなくてもよく、ここで、メチル化状態は、細胞ががん細胞であるかそうでないかと相関する。一部の実施形態では、エピジェネティック標的領域セットは、ＣＴＣＦ結合部位の少なくとも１００ｂｐ、少なくとも２００ｂｐ、少なくとも３００ｂｐ、少なくとも４００ｂｐ、少なくとも５００ｂｐ、少なくとも７５０ｂｐ、少なくとも１０００ｂｐ上流および下流の領域を含む。
ｉｖ．転写開始部位

転写開始部位もまた、新生物細胞において、乱れを示し得る。例えば、造血系列の健康な細胞における様々な転写開始部位におけるヌクレオソーム構成（これは、健康な個体におけるｃｆＤＮＡに実質的に寄与する）は、新生物細胞におけるそれらの転写開始部位では、ヌクレオソーム構成が異なり得る。これは、Snyder et al., Cell 164:57-68 (2016)、ＷＯ２０１８／００９７２３、およびＵＳ２０１７０２１１１４３Ａ１において一般に考察されているように、シーケンシングによって検出することができる異なるｃｆＤＮＡパターンをもたらす。別の例では、転写開始部位は、がん性組織において、必ずしも、同じタイプの健康な組織に由来するＤＮＡと比べてエピジェネティックに異なるわけではないが、健康な対象において典型的であるｃｆＤＮＡと比べてエピジェネティックに異なる（例えば、ヌクレオソーム構成に関して）。例えば、がんの存在が、細胞死、例えば、がんに対応する組織タイプの細胞のアポトーシスの増加をもたらす場合、そのようながんは、少なくとも部分的に、そのような転写開始部位を使用して検出することができる。

したがって、転写開始部位の乱れもまた、ｃｆＤＮＡの断片化パターンに変動をもたらす。そのため、転写開始部位もまた、断片化可変標的領域の１つのタイプを表す。

ヒト転写開始部位は、btss.hgc.jpにおいてインターネット上で利用可能なＤＢＴＳＳ（ＤａｔａＢａｓｅｏｆＨｕｍａｎＴｒａｎｓｃｒｉｐｔｉｏｎＳｔａｒｔＳｉｔｅｓ）から利用可能であり、Yamashita et al., Nucleic Acids Res. 34(Database issue): D86-D89 (2006)において記載されており、これは、参照により本明細書に組み込まれる。

したがって、一部の実施形態では、エピジェネティック標的領域セットは、転写開始部位を含む。一部の実施形態では、転写開始部位は、少なくとも１０個、２０個、５０個、１００個、２００個、もしくは５００個の転写開始部位、または１０～２０個、２０～５０個、５０～１００個、１００～２００個、２００～５００個、もしくは５００～１０００個の転写開始部位、例えば、ＤＢＴＳＳにおいて列挙されている転写開始部位などを含む。一部の実施形態では、転写開始部位のうちの少なくともいくつかは、メチル化されていても、メチル化されていなくてもよく、ここで、メチル化状態は、細胞ががん細胞であるかそうでないかと相関する。一部の実施形態では、エピジェネティック標的領域セットは、転写開始部位の少なくとも１００ｂｐ、少なくとも２００ｂｐ、少なくとも３００ｂｐ、少なくとも４００ｂｐ、少なくとも５００ｂｐ、少なくとも７５０ｂｐ、少なくとも１０００ｂｐ上流および下流の領域を含む。
ｖ．局所増幅

局所増幅は、体細胞突然変異であるが、それらは、ある特定のエピジェネティック変化、例えば、メチル化の変化を検出するためのアプローチと類似の様式で、読み取りデータの頻度に基づいてシーケンシングすることによって検出することができる。そのため、がんにおいて局所増幅を示し得る領域は、エピジェネティック標的領域セットに含まれ得、ＡＲ、ＢＲＡＦ、ＣＣＮＤ１、ＣＣＮＤ２、ＣＣＮＥ１、ＣＤＫ４、ＣＤＫ６、ＥＧＦＲ、ＥＲＢＢ２、ＦＧＦＲ１、ＦＧＦＲ２、ＫＩＴ、ＫＲＡＳ、ＭＥＴ、ＭＹＣ、ＰＤＧＦＲＡ、ＰＩＫ３ＣＡ、およびＲＡＦ１のうちの１つまたは複数を含み得る。例えば、一部の実施形態では、エピジェネティック標的領域セットは、前述の標的のうちの少なくとも２個、３個、４個、５個、６個、７個、８個、９個、１０個、１１個、１２個、１３個、１４個、１５個、１６個、１７個、または１８個を含む。
ｖｉ．メチル化対照領域

データの検証を容易にするために対照領域を含めることは有用であり得る。一部の実施形態では、エピジェネティック標的領域セットは、ＤＮＡががん細胞または正常細胞に由来するか否かによらず、本質的に全ての試料においてメチル化または非メチル化であると予想される対照領域を含む。一部の実施形態では、エピジェネティック標的領域セットは、本質的に全ての試料において低メチル化であると予想される対照低メチル化領域を含む。一部の実施形態では、エピジェネティック標的領域セットは、本質的に全ての試料において高メチル化であると予想される対照高メチル化領域を含む。
ｂ．配列可変標的領域セット

一部の実施形態では、配列可変標的領域セットは、がんにおいて体細胞突然変異を受けることが公知の複数の領域を含む。

一部の態様では、配列可変標的領域セットは、がんを有する対象のうちの決定された割合が、パネル内の１つまたは複数の異なる遺伝子またはゲノム領域において遺伝的変異体または腫瘍マーカーを示すように選択された、複数の異なる遺伝子またはゲノム領域（「パネル」）を標的とする。パネルは、シーケンシングのための領域を、固定数の塩基対に限定するように選択され得る。パネルは、本明細書の他の箇所に記載されるように、例えば、プローブの親和性および／または量を調整することによって、所望の量のＤＮＡをシーケンシングするように選択され得る。パネルは、さらに、所望の配列読み取りデータ深度を達成するように選択され得る。パネルは、シーケンシングされる塩基対の量に所望される配列読み取りデータ深度または配列読み取りデータカバレッジを達成するように選択され得る。パネルは、試料中の１つまたは複数の遺伝的変異体を検出するための理論上の感度、理論上の特異度、および／または理論上の正確度を達成するように選択され得る。

領域のパネルを検出するためのプローブとしては、目的のゲノム領域（ホットスポット領域）を検出するためのもの、ならびにヌクレオソーム認識プローブ（例えば、ＫＲＡＳコドン１２および１３）を挙げることができ、ヌクレオソーム結合パターンおよびＧＣ配列組成によって影響を受けるｃｆＤＮＡカバレッジおよび断片サイズ変動の解析に基づいて捕捉を最適化するように設計され得る。本明細書において使用される領域としては、ヌクレオソーム位置およびＧＣモデルに基づいて最適化された非ホットスポット領域も含まれ得る。

目的のゲノムの場所の一覧の例は、表３および表４に見出すことができる。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表３の遺伝子のうちの少なくとも５個、少なくとも１０個、少なくとも１５個、少なくとも２０個、少なくとも２５個、少なくとも３０個、少なくとも３５個、少なくとも４０個、少なくとも４５個、少なくとも５０個、少なくとも５５個、少なくとも６０個、少なくとも６５個、または７０個の少なくとも一部分を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表３のＳＮＶのうちの少なくとも５個、少なくとも１０個、少なくとも１５個、少なくとも２０個、少なくとも２５個、少なくとも３０個、少なくとも３５個、少なくとも４０個、少なくとも４５個、少なくとも５０個、少なくとも５５個、少なくとも６０個、少なくとも６５個、または７０個を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表３の融合体のうちの少なくとも１個、少なくとも２個、少なくとも３個、少なくとも４個、少なくとも５個、または６個を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表３のインデルのうちの少なくとも１個、少なくとも２個、または３個の少なくとも一部分を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表４の遺伝子のうちの少なくとも５個、少なくとも１０個、少なくとも１５個、少なくとも２０個、少なくとも２５個、少なくとも３０個、少なくとも３５個、少なくとも４０個、少なくとも４５個、少なくとも５０個、少なくとも５５個、少なくとも６０個、少なくとも６５個、少なくとも７０個、または７３個の少なくとも一部分を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表４のＳＮＶのうちの少なくとも５個、少なくとも１０個、少なくとも１５個、少なくとも２０個、少なくとも２５個、少なくとも３０個、少なくとも３５個、少なくとも４０個、少なくとも４５個、少なくとも５０個、少なくとも５５個、少なくとも６０個、少なくとも６５個、少なくとも７０個、または７３個を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表４の融合体のうちの少なくとも１個、少なくとも２個、少なくとも３個、少なくとも４個、少なくとも５個、または６個を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは表４のインデルのうちの少なくとも１個、少なくとも２個、少なくとも３個、少なくとも４個、少なくとも５個、少なくとも６個、少なくとも７個、少なくとも８個、少なくとも９個、少なくとも１０個、少なくとも１１個、少なくとも１２個、少なくとも１３個、少なくとも１４個、少なくとも１５個、少なくとも１６個、少なくとも１７個、または１８個の少なくとも一部分を含む。これらの目的のゲノムの場所の各々は、所与のパネルの骨格領域またはホットスポット領域として同定され得る。目的のホットスポットゲノムの場所の一覧の例は、表５に見出すことができる。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表５の遺伝子のうちの少なくとも１個、少なくとも２個、少なくとも３個、少なくとも４個、少なくとも５個、少なくとも６個、少なくとも７個、少なくとも８個、少なくとも９個、少なくとも１０個、少なくとも１１個、少なくとも１２個、少なくとも１３個、少なくとも１４個、少なくとも１５個、少なくとも１６個、少なくとも１７個、少なくとも１８個、少なくとも１９個、または少なくとも２０個の少なくとも一部分を含む。各ホットスポットゲノム領域は、関連する遺伝子、それが存在する染色体、遺伝子の座を表すゲノムの開始位置および終止位置、塩基対における遺伝子の座の長さ、遺伝子によってカバーされるエクソン、および目的の所与のゲノム領域が捕捉しようとし得る重要な特色（例えば、突然変異のタイプ）を含む、いくつかの特徴とともに列挙されている。

さらに、またはあるいは、好適な標的領域セットは、文献から入手可能である。例えば、参照により本明細書に組み込まれる、Gale et al., PLoS One 13: e0194630 (2018)は、配列可変標的領域セットの一部または全てとして使用することができる３５個のがん関連遺伝子標的のパネルを記載する。これらの３５個の標的は、ＡＫＴ１、ＡＬＫ、ＢＲＡＦ、ＣＣＮＤ１、ＣＤＫ２Ａ、ＣＴＮＮＢ１、ＥＧＦＲ、ＥＲＢＢ２、ＥＳＲ１、ＦＧＦＲ１、ＦＧＦＲ２、ＦＧＦＲ３、ＦＯＸＬ２、ＧＡＴＡ３、ＧＮＡ１１、ＧＮＡＱ、ＧＮＡＳ、ＨＲＡＳ、ＩＤＨ１、ＩＤＨ２、ＫＩＴ、ＫＲＡＳ、ＭＥＤ１２、ＭＥＴ、ＭＹＣ、ＮＦＥ２Ｌ２、ＮＲＡＳ、ＰＤＧＦＲＡ、ＰＩＫ３ＣＡ、ＰＰＰ２Ｒ１Ａ、ＰＴＥＮ、ＲＥＴ、ＳＴＫ１１、ＴＰ５３、およびＵ２ＡＦ１である。

一部の実施形態では、配列可変標的領域セットは、上に列挙されたがん関連遺伝子などの少なくとも１０、２０、３０、または３５個のがん関連遺伝子からの標的領域を含む。

一部の実施形態では、配列可変標的領域セットは、少なくとも５０ｋｂｐ、例えば、少なくとも１００ｋｂｐ、少なくとも２００ｋｂｐ、少なくとも３００ｋｂｐ、または少なくとも４００ｋｂｐのフットプリントを有する。一部の実施形態では、配列可変標的領域セットは、１００～２０００ｋｂｐ、例えば、１００～２００ｋｂｐ、２００～３００ｋｂｐ、３００～４００ｋｂｐ、４００～５００ｋｂｐ、５００～６００ｋｂｐ、６００～７００ｋｂｐ、７００～８００ｋｂｐ、８００～９００ｋｂｐ、９００～１，０００ｋｂｐ、１～１．５Ｍｂｐ、または１．５～２Ｍｂｐの範囲のフットプリントを有する。一部の実施形態では、配列可変標的領域セットは、少なくとも２Ｍｂｐのフットプリントを有する。
７．対象

一部の実施形態では、ＤＮＡ（例えば、ｃｆＤＮＡ）は、がんを有する対象から得られる。一部の実施形態では、ＤＮＡ（例えば、ｃｆＤＮＡ）は、がんを有することが疑われる対象から得られる。一部の実施形態では、ＤＮＡ（例えば、ｃｆＤＮＡ）は、腫瘍を有する対象から得られる。一部の実施形態では、ＤＮＡ（例えば、ｃｆＤＮＡ）は、腫瘍を有することが疑われる対象から得られる。一部の実施形態では、ＤＮＡ（例えば、ｃｆＤＮＡ）は、新生物を有する対象から得られる。一部の実施形態では、ＤＮＡ（例えば、ｃｆＤＮＡ）は、新生物を有することが疑われる対象から得られる。一部の実施形態では、ＤＮＡ（例えば、ｃｆＤＮＡ）は、（例えば、化学療法、外科的切除、放射線照射、またはこれらの組合せの後に）腫瘍、がん、または新生物から寛解した対象から得られる。前述の実施形態のいずれかでは、がん、腫瘍、もしくは新生物、または疑われるがん、腫瘍、もしくは新生物は、肺、結腸、直腸、腎臓、乳房、前立腺、または肝臓のものであり得る。一部の実施形態では、がん、腫瘍、もしくは新生物、または疑われるがん、腫瘍、もしくは新生物は、肺のものである。一部の実施形態では、がん、腫瘍、もしくは新生物、または疑われるがん、腫瘍、もしくは新生物は、結腸または直腸のものである。一部の実施形態では、がん、腫瘍、もしくは新生物、または疑われるがん、腫瘍、もしくは新生物は、乳房のものである。一部の実施形態では、がん、腫瘍、もしくは新生物、または疑われるがん、腫瘍、もしくは新生物は、前立腺のものである。前述の実施形態のいずれかでは、対象は、ヒト対象であり得る。
８．第１および第２の部分試料またはその一部分に由来するＤＮＡのプール

一部の実施形態では、方法は、処置された部分試料または第２の部分試料のＤＮＡの少なくとも一部分（低メチル化分配とも称される）および第１の部分試料または追加の処置された部分試料のＤＮＡの少なくとも一部分（高メチル化分配とも称される）を含むプールを調製するステップを含む。例えば、エピジェネティック標的領域および／または配列可変標的領域を含む、標的領域は、プールから捕捉され得る。本明細書の他の箇所に記載される部分試料の少なくとも一部分から標的領域セットを捕捉するステップは、第１および第２の部分試料に由来するＤＮＡを含むプールに対して行われる捕捉ステップを包含する。プール内のＤＮＡを増幅させるステップは、プールから標的領域を捕捉する前に行われ得る。捕捉するステップは、本明細書の他の箇所で捕捉ステップに関して記載される特色のうちのいずれかを有し得る。

エピジェネティック標的領域は、本明細書の他の箇所で考察されるように、それらが、腫瘍を起源とするかもしくは健康な細胞を起源とするか、またはどの組織タイプを起源とするかに応じて、メチル化レベルおよび／または断片化パターンに相違を示し得る。配列可変標的領域は、それらが腫瘍を起源とするか、健康な細胞を起源とするかに応じて、配列に相違を示し得る。

低メチル化分配に由来するエピジェネティック標的領域の解析は、一部の適用において、高メチル化および低メチル化分配に由来する配列可変標的領域ならびに高メチル化分配に由来するエピジェネティック標的領域の解析よりも、情報量が少ない場合がある。そのため、配列可変標的領域およびエピジェネティック標的領域を捕捉する方法では、後者は、高メチル化および低メチル化分配に由来する配列可変標的領域ならびに高メチル化分配に由来するエピジェネティック標的領域のうちの１つまたは複数よりも、低い程度で捕捉され得る。例えば、配列可変標的領域は、高メチル化分配とともにプールされていない低メチル化分配の部分から捕捉され得、プールは、高メチル化分配に由来するＤＮＡの一部（例えば、大部分、実質的に全て、または全て）および低メチル化分配に由来するＤＮＡなしまたはその一部（例えば、少数）を用いて調製され得る。そのようなアプローチにより、低メチル化分配に由来するエピジェネティック標的領域のシーケンシングを低減または排除し、それによって、さらなる解析にとって十分であるシーケンシングデータの量を低減することができる。

一部の実施形態では、プール内の低メチル化分配のＤＮＡのうちの少数部分を含めることで、１つまたは複数のエピジェネティック特色（例えば、メチル化または本明細書の他の箇所において考察されている他のエピジェネティック特色）の定量が、例えば、相対的に、容易になる。

一部の実施形態では、プールは、例えば、低メチル化分配のＤＮＡのうちの約５０％未満、例えば、低メチル化分配のＤＮＡのうちの約４５％未満もしくはそれに等しい、４０％未満もしくはそれに等しい、３５％未満もしくはそれに等しい、３０％未満もしくはそれに等しい、２５％未満もしくはそれに等しい、２０％未満もしくはそれに等しい、１５％未満もしくはそれに等しい、１０％未満もしくはそれに等しい、または５％未満もしくはそれに等しい、低メチル化分配のＤＮＡの少数部分を含む。一部の実施形態では、プールは、低メチル化分配のＤＮＡのうちの約５％～２５％を含む。一部の実施形態では、プールは、低メチル化分配のＤＮＡのうちの約１０％～２０％を含む。一部の実施形態では、プールは、低メチル化分配のＤＮＡのうちの約１０％を含む。一部の実施形態では、プールは、低メチル化分配のＤＮＡのうちの約１５％を含む。一部の実施形態では、プールは、低メチル化分配のＤＮＡのうちの約２０％を含む。

一部の実施形態では、プールは、高メチル化分配の一部分を含み、これは、高メチル化分配のＤＮＡのうちの少なくとも約５０％であり得る。例えば、プールは、高メチル化分配のＤＮＡのうちの少なくとも約５５％、６０％、６５％、７０％、７５％、８０％、８５％、９０％、または９５％を含み得る。一部の実施形態では、プールは、高メチル化分配のＤＮＡのうちの５０～５５％、５５～６０％、６０～６５％、６５～７０％、７０～７５％、７５～８０％、８０～８５％、８５～９０％、９０～９５％、または９５～１００％を含む。一部の実施形態では、第２のプールは、高メチル化分配の全てまたは実質的に全てを含む。

一部の実施形態では、方法は、低メチル化分配のＤＮＡのうちの少なくとも一部分を含む、第１のプールを調製するステップを含む。一部の実施形態では、方法は、高メチル化分配のＤＮＡのうちの少なくとも一部分を含む、第２のプールを調製するステップを含む。一部の実施形態では、第１のプールは、高メチル化分配のＤＮＡのうちの一部分をさらに含む。一部の実施形態では、第２のプールは、低メチル化分配のＤＮＡのうちの一部分をさらに含む。一部の実施形態では、第１のプールは、低メチル化分配のＤＮＡのうちの大部分を含み、必要に応じて、高メチル化分配のＤＮＡのうちの少数部分を含む。一部の実施形態では、第２のプールは、高メチル化分配のＤＮＡのうちの大部分を含み、低メチル化分配のＤＮＡのうちの少数部分を含む。中間メチル化分配を含む一部の実施形態では、第２のプールは、中間メチル化分配のＤＮＡのうちの少なくとも一部分、例えば、中間メチル化分配のＤＮＡのうちの大部分を含む。一部の実施形態では、第１のプールは、低メチル化分配のＤＮＡのうちの大部分を含み、第２のプールは、高メチル化分配のＤＮＡのうちの大部分および中間メチル化分配のＤＮＡのうちの大部分を含む。

一部の実施形態では、方法は、第１のプールから少なくとも標的領域の第１のセットを捕捉するステップを含み、例えば、第１のプールは、上述の実施形態のうちのいずれかに記載される通りである。一部の実施形態では、第１のセットは、配列可変標的領域を含む。一部の実施形態では、第１のセットは、低メチル化可変標的領域および／または断片化可変標的領域を含む。一部の実施形態では、第１のセットは、配列可変標的領域および断片化可変標的領域を含む。一部の実施形態では、第１のセットは、配列可変標的領域、低メチル化可変標的領域、および断片化可変標的領域を含む。第１のプール内のＤＮＡを増幅させるステップは、この捕捉ステップの前に行われ得る。一部の実施形態では、第１のプールから標的領域の第１のセットを捕捉するステップは、第１のプールのＤＮＡを、標的特異的プローブの第１のセットと接触させることを含む。一部の実施形態では、標的特異的プローブの第１のセットは、配列可変標的領域に特異的な標的結合プローブを含む。一部の実施形態では、標的特異的プローブの第１のセットは、配列可変標的領域、低メチル化可変標的領域、および／または断片化可変標的領域に特異的な標的結合プローブを含む。

一部の実施形態では、方法は、第２のプールから、標的領域の第２のセットまたは標的領域の複数のセットを捕捉するステップを含み、例えば、第１のプールは、上述の実施形態のうちのいずれかに記載される通りである。一部の実施形態では、第２の複数物は、エピジェネティック標的領域、例えば、高メチル化可変標的領域および／または断片化可変標的領域を含む。一部の実施形態では、第２の複数物は、配列可変標的領域およびエピジェネティック標的領域、例えば、高メチル化可変標的領域および／または断片化可変標的領域を含む。第２のプール内のＤＮＡを増幅させるステップは、この捕捉ステップの前に行われ得る。一部の実施形態では、第２のプールから標的領域の第２の複数のセットを捕捉するステップは、第１のプールのＤＮＡを、標的特異的プローブの第２のセットと接触させることを含み、標的特異的プローブの第２のセットは、配列可変標的領域に特異的な標的結合プローブおよびエピジェネティック標的領域に特異的な標的結合プローブを含む。一部の実施形態では、標的領域の第１のセットおよび標的領域の第２のセットは、同一ではない。例えば、標的領域の第１のセットは、標的領域の第２のセットには存在しない１つまたは複数の標的領域を含み得る。あるいは、または追加として、標的領域の第２のセットは、標的領域の第１のセットには存在しない１つまたは複数の標的領域を含み得る。一部の実施形態では、少なくとも１つの高メチル化可変標的領域は、第１のプールからではなく、第２のプールから捕捉される。一部の実施形態では、複数の高メチル化可変標的領域は、第１のプールからではなく、第２のプールから捕捉される。一部の実施形態では、標的領域の第１のセットは、配列可変標的領域を含み、および／または標的領域の第２のセットは、エピジェネティック標的領域を含む。一部の実施形態では、標的領域の第１のセットは、配列可変標的領域および断片化可変標的領域を含み、標的領域の第２のセットは、エピジェネティック標的領域、例えば、高メチル化可変標的領域および断片化可変標的領域を含む。一部の実施形態では、標的領域の第１のセットは、配列可変標的領域、断片化可変標的領域を含み、および低メチル化可変標的領域を含み、標的領域の第２のセットは、エピジェネティック標的領域、例えば、高メチル化可変標的領域、および断片化可変標的領域を含む。

一部の実施形態では、第１のプールは、低メチル化分配のＤＮＡのうちの大部分、および高メチル化分配のＤＮＡのうちの一部分（例えば、約半分）を含み、第２のプールは、高メチル化分配のＤＮＡのうちの一部分（例えば、約半分）を含む。一部のそのような実施形態では、標的領域の第１のセットは、配列可変標的領域を含み、および／または標的領域の第２のセットは、エピジェネティック標的領域を含む。配列可変標的領域および／またはエピジェネティック標的領域は、本明細書の他の箇所に記載される実施形態のうちのいずれかに記載される通りであり得る。
９．シーケンシング

一般に、以前の増幅の有無にかかわらず、アダプターが隣接している試料核酸は、シーケンシングに供することができる。シーケンシング方法としては、例えば、サンガーシーケンシング、ハイスループットシーケンシング、パイロシーケンシング、合成によるシーケンシング、一分子シーケンシング、ナノポアシーケンシング、半導体シーケンシング、ライゲーションによるシーケンシング、ハイブリダイゼーションによるシーケンシング、デジタル遺伝子発現（Ｈｅｌｉｃｏｓ）、次世代シーケンシング（ＮＧＳ）、合成による一分子シーケンシング（ＳＭＳＳ）（Ｈｅｌｉｃｏｓ）、大規模並列シーケンシング、クローン単一分子アレイ（Ｓｏｌｅｘａ）、ショットガンシーケンシング、ＩｏｎＴｏｒｒｅｎｔ、ＯｘｆｏｒｄＮａｎｏｐｏｒｅ、ＲｏｃｈｅＧｅｎｉａ、マキサム－ギルバートシーケンシング、プライマーウォーキング、およびＰａｃＢｉｏ、ＳＯＬｉＤ、ＩｏｎＴｏｒｒｅｎｔ、またはＮａｎｏｐｏｒｅプラットフォームを使用したシーケンシングが挙げられる。シーケンシング反応は、様々な試料プロセシングユニットにおいて行うことができ、これは、複数のレーン、複数のチャネル、複数のウェル、または複数の試料セットを実質的に同時にプロセシングする他の手段を含み得る。試料プロセシングユニットにはまた、複数の実行のプロセシングを同時に可能にする複数の試料チャンバーが含まれ得る。

一部の実施形態では、シーケンシングするステップは、捕捉された標的領域のセットを含むライブラリーに行われ、これは、本明細書に記載される標的領域セットのうちのいずれかを含み得る。一部の実施形態では、シーケンシングするステップは、捕捉／富化を受けていない部分試料（例えば、全ゲノム部分試料）を含むライブラリーに行われる。例えば、標的領域は、第１の部分試料および第２の試料から捕捉され、次いでシーケンシングされ得るか、または標的領域は、第１の部分試料から捕捉され、接触させるステップおよびタグ付けするステップなどのプロセシングの後に、第２の部分試料と組み合わされ得るか、または標的領域は、第２の部分試料から捕捉され、接触させるステップおよびタグ付けするステップなどのプロセシングの後に、第１の部分試料と組み合わされ得るか、または第１および第２の部分試料の両方が、捕捉／富化を受けることなく、プロセシングされ組み合わされ得る。

シーケンシング反応は、少なくとも１つががんまたは他の疾患のマーカーを含有することが公知である、核酸の１つまたは複数の形態に行うことができる。シーケンシング反応はまた、試料中に存在する任意の核酸断片に行うこともできる。一部の実施形態では、ゲノムの配列カバレッジは、５％を下回る、１０％を下回る、１５％を下回る、２０％を下回る、２５％を下回る、３０％を下回る、４０％を下回る、５０％を下回る、６０％を下回る、７０％を下回る、８０％を下回る、９０％を下回る、９５％を下回る、９９％を下回る、９９．９％を下回る、または１００％を下回り得る。一部の実施形態では、配列反応は、ゲノムの少なくとも５％、１０％、１５％、２０％、２５％、３０％、４０％、５０％、６０％、７０％、または８０％の配列カバレッジを提供し得る。配列カバレッジは、少なくとも５個、１０個、２０個、７０個、１００個、２００個、もしくは５００個の異なる遺伝子、または多くとも５０００個、２５００個、１０００個、５００個、もしくは１００個の異なる遺伝子に行うことができる。

多重シーケンシングを使用して、同時のシーケンシング反応を行ってもよい。一部の場合には、無細胞核酸は、少なくとも１０００回、２０００回、３０００回、４０００回、５０００回、６０００回、７０００回、８０００回、９０００回、１００００回、５００００回、１００，０００回のシーケンシング反応でシーケンシングされ得る。他の場合には、無細胞核酸は、１０００回を下回る、２０００回を下回る、３０００回を下回る、４０００回を下回る、５０００回を下回る、６０００回を下回る、７０００回を下回る、８０００回を下回る、９０００回を下回る、１００００回を下回る、５００００回を下回る、１００，０００回を下回るシーケンシング反応でシーケンシングされ得る。シーケンシング反応は、逐次的に、または同時に行われてもよい。後続のデータ解析は、シーケンシング反応の全てまたは一部で行われ得る。一部の場合には、データ解析は、少なくとも１０００回、２０００回、３０００回、４０００回、５０００回、６０００回、７０００回、８０００回、９０００回、１００００回、５００００回、１００，０００回のシーケンシング反応で行われ得る。他の場合には、データ解析は、１０００回を下回る、２０００回を下回る、３０００回を下回る、４０００回を下回る、５０００回を下回る、６０００回を下回る、７０００回を下回る、８０００回を下回る、９０００回を下回る、１００００回を下回る、５００００回を下回る、１００，０００回を下回るシーケンシング反応で行われ得る。例示的な読み取りデータ深度は、座（塩基）１つあたり１０００～５００００読み取りデータである。
ａ．シーケンシングの差次的深度

一部の実施形態では、配列可変標的領域セットに対応する核酸は、エピジェネティック標的領域セットに対応する核酸よりも大きいシーケンシング深度までシーケンシングされる。例えば、配列変異体標的領域セットに対応する核酸のシーケンシング深度は、エピジェネティック標的領域セットに対応する核酸のシーケンシング深度よりも、少なくとも１．２５倍、１．５倍、１．７５倍、２倍、２．２５倍、２．５倍、２．７５倍、３倍、３．５倍、４倍、４．５倍、５倍、６倍、７倍、８倍、９倍、１０倍、１１倍、１２倍、１３倍、１４倍、もしくは１５倍大きいか、または１．２５倍～１．５倍、１．５倍～１．７５倍、１．７５倍～２倍、２倍～２．２５倍、２．２５倍～２．５倍、２．５倍～２．７５倍、２．７５倍～３倍、３倍～３．５倍、３．５倍～４倍、４倍～４．５倍、４．５倍～５倍、５倍～５．５倍、５．５倍～６倍、６倍～７倍、７倍～８倍、８倍～９倍、９倍～１０倍、１０倍～１１倍、１１倍～１２倍、１３倍～１４倍、１４倍～１５倍、もしくは１５倍～１００倍大きくあり得る。一部の実施形態では、前記シーケンシング深度は、少なくとも２倍大きい。一部の実施形態では、前記シーケンシング深度は、少なくとも５倍大きい。一部の実施形態では、前記シーケンシング深度は、少なくとも１０倍大きい。一部の実施形態では、前記シーケンシング深度は、４～１０倍大きい。一部の実施形態では、前記シーケンシング深度は、４～１００倍大きい。これらの実施形態の各々は、配列可変標的領域セットに対応する核酸が、エピジェネティック標的領域セットに対応する核酸よりも大きいシーケンシング深度までシーケンシングされる程度に言及している。

一部の実施形態では、配列可変標的領域セットに対応する捕捉されたｃｆＤＮＡ、およびエピジェネティック標的領域セットに対応する捕捉されたｃｆＤＮＡは、同時に、例えば、同じシーケンシングセル（例えば、Ｉｌｌｕｍｉｎａシーケンサーのフローセル）において、ならびに／または別個に捕捉されたセットを組み換えることに起因するプールされた組成物もしくは配列可変標的領域セットに対応するｃｆＤＮＡおよびエピジェネティック標的領域セットに対応する捕捉されたｃｆＤＮＡを同じ容器に捕捉することによって得られた組成物であり得る同じ組成物において、シーケンシングされる。
１０．解析

一部の実施形態では、本明細書に記載される方法は、腫瘍（または新生物細胞もしくはがん細胞）によって産生されるＤＮＡの存在を同定するステップを含む。

本方法は、対象における状態、特に、がんの存在を診断するため、状態を特徴付ける（例えば、がんをステージ分類するまたはがんの不均一性を決定する）ため、状態の処置に対する応答をモニタリングするため、状態を発症するリスクまたは状態の後続の経過の予後判定を行うために、使用することができる。本開示はまた、特定の処置選択肢の有効性を決定するのにも有用であり得る。奏功した処置選択肢では、処置が成功している場合、より多くのがんが死滅し、ＤＮＡが脱落し得るため、対象の血液中で検出されるコピー数変異または希少な突然変異の量が増加し得る。他の例では、これは生じない場合がある。別の例では、おそらくはある特定の処置選択肢は、経時的に、がんの遺伝子プロファイルと相関付けられ得る。この相関性は、治療を選択するのに有用であり得る。

加えて、がんが、処置後に寛解期にあることが観察された場合、本方法を使用して、残存疾患または疾患の再発をモニタリングすることができる。

検出することができるがんのタイプおよび数としては、血液のがん、脳のがん、肺がん、皮膚がん、鼻のがん、喉のがん、肝臓がん、骨がん、リンパ腫、膵臓がん、皮膚がん、腸がん、直腸がん、甲状腺がん、膀胱がん、腎臓がん、口腔がん、胃がん、固形状態の腫瘍、不均一な腫瘍、均一な腫瘍などを挙げることができる。がんのタイプおよび／またはステージは、突然変異、希少な突然変異、インデル、コピー数変異、塩基転換、転座、逆位、欠失、異数性、部分異数性、倍数性、染色体不安定性、染色体構造の変更、遺伝子融合、染色体融合、遺伝子トランケーション、遺伝子増幅、遺伝子重複、染色体病変、ＤＮＡ病変、核酸化学修飾の異常な変化、エピジェネティックパターンの異常な変化、および核酸５－メチルシトシンの異常な変化を含む、遺伝的変異から検出することができる。

遺伝子データはまた、がんの特定の形態を特徴付けるためにも使用することができる。がんは、組成およびステージ分類の両方において、不均一であることが多い。遺伝子プロファイルデータにより、その特定のサブタイプの診断または処置に重要であり得る特定のサブタイプのがんの特徴付けが可能となり得る。この情報はまた、対象または従事者に特定のがんタイプの予後に関する手がかりを提供し、対象または従事者のいずれかが、疾患の進行に合わせて処置選択肢を適合させることを可能にし得る。一部のがんは、進行すると、より侵襲性かつ遺伝子的に不安定になり得る。他のがんは、良性、不活性、または休眠中のままであり得る。本開示のシステムおよび方法は、疾患の進行を決定するのに有用であり得る。

さらに、本開示の方法は、対象における異常な状態の不均一性を特徴付けるために使用され得る。そのような方法には、例えば、対象に由来する細胞外ポリヌクレオチドの遺伝子プロファイルを生成するステップが含まれ得、ここで、遺伝子プロファイルは、コピー数変異および希少な突然変異の解析により得られる複数のデータを含む。一部の実施形態では、異常な状態は、がんである。一部の実施形態では、異常な状態は、不均一なゲノム集団をもたらすものであり得る。がんの例では、一部の腫瘍は、がんの異なるステージにある腫瘍細胞を含むことが公知である。他の例では、不均一性は、複数の疾患病巣を構成し得る。さらに、がんの例では、おそらくは１つまたは複数の病巣が原発部位から拡がった転移の結果である複数の腫瘍病巣が、存在し得る。

本方法は、不均一な疾患における異なる細胞に由来する遺伝子情報をまとめたものであるデータのプロファイル、フィンガープリント、またはセットを生成するために使用することができる。このデータのセットは、コピー数変異、エピジェネティック変異、および突然変異の解析を、単独または組合せで含み得る。

本方法を使用して、がんまたは他の疾患を診断、予後判定、モニタリング、または観察することができる。一部の実施形態では、本明細書の方法は、胎児を診断することも、予後判定することも、モニタリングすることも含まず、そのため、非侵襲性の出生前検査を対象としない。他の実施形態では、これらの方法論は、ＤＮＡおよび他のポリヌクレオチドが母体分子と共循環し得る、出生前の対象におけるがんまたは他の疾患を診断、予後判定、モニタリング、または観察するために、妊娠している対象において用いられ得る。

第２の部分試料を、第１の部分試料のＤＮＡ内の第１の核酸塩基に対してＤＮＡ内の第２の核酸塩基とは異なって影響を及ぼす手順に供するステップを含む、ＮＧＳを通じてＭＢＤビーズにより分配されるライブラリーの分子タグ同定のための例示的な方法は、以下の通りである。
１．メチル結合ドメインタンパク質－ビーズ精製キットを使用して、抽出されたＤＮＡ試料（例えば、ヒト試料に由来する抽出された血液血漿ＤＮＡ、これは、必要に応じて、本明細書に記載される標的捕捉に供されている）を物理的に分配し、下流プロセシングのためにプロセスからの全ての溶出物を保管すること。
２．差次的分子タグおよびＮＧＳにより実行されるアダプター配列の各分配への並行した適用。例えば、高メチル化、残留メチル化（「ウォッシュ」）、および低メチル化分配を、分子タグを有するＮＧＳ－アダプターとライゲーションする。
３．低メチル化分配を、本明細書に記載されるもののうちのいずれかなど、ＤＮＡ内の第１の核酸塩基に対してＤＮＡ内の第２の核酸塩基とは異なって影響を及ぼす手順に供する。
４．全ての分子タグ付けした分配を組み換え、続いて、アダプター特異的ＤＮＡプライマー配列を使用して増幅させる。
５．目的のゲノム領域（例えば、がん特異的遺伝的変異体および差次的にメチル化された領域）を標的とする、組み換え、増幅させた全ライブラリーの捕捉／ハイブリダイゼーション。
６．捕捉されたＤＮＡライブラリーを再増幅させ、試料タグを付加する。異なる試料をプールし、ＮＧＳ機器で多重にアッセイする。
７．分子タグを使用して一意的分子を同定する、ＮＧＳデータのバイオインフォマティクス解析、ならびに試料の差次的にＭＢＤ分配された分子へのデコンボリューション。この解析により、標準的な遺伝子シーケンシング／変異体検出と同時に、ゲノム領域に関して相対的５－メチルシトシンの情報を得ることができる。

上に示される方法を含むがこれらに限定されない本明細書に記載される方法のうちの一部の実施形態では、分子タグは、ＤＮＡ内の第１の核酸塩基に対してＤＮＡ内の第２の核酸塩基とは異なって影響を及ぼす手順によって変更されないヌクレオチド、例えば、本明細書に記載されるもののうちのいずれか（例えば、手順がバイサルファイト変換またはｍＣに影響を及ぼさない任意の他の変換である場合、Ａ、Ｔ、およびＧとともにｍＣ、手順がｈｍＣに影響を及ぼさない変換である場合、Ａ、Ｔ、およびＧとともにｈｍＣなど）からなる。上に示される方法を含むがこれらに限定されない本明細書に記載される方法のうちの一部の実施形態では、分子タグは、ＤＮＡ内の第１の核酸塩基に対してＤＮＡ内の第２の核酸塩基とは異なって影響を及ぼす手順によって変更されるヌクレオチド、例えば、本明細書に記載されるもののうちのいずれかを含まない（例えば、手順がバイサルファイト変換またはＣに影響を及ぼす任意の他の変換である場合、タグは、改変されていないＣを含まず、手順がｍＣに影響を及ぼす変換である場合、タグは、ｍＣを含まず、手順がｈｍＣに影響を及ぼす変換である場合、ｈｍＣを含まないなど）。

一般に、ＤＮＡ内の第１の核酸塩基に対してＤＮＡの内の第２の核酸塩基とは異なって影響を及ぼす手順は、代わりに、差次的分子タグおよびＮＧＳにより実行されるアダプター配列の各分配への並行した適用のステップの前に、行われてもよい。例えば、これは、ＤＮＡ内の第１の核酸塩基に対してＤＮＡ内の第２の核酸塩基とは異なって影響を及ぼす手順が、分離、例えば、ｈｍＣ－シールである場合に行われてもよく、そのような場合には、分離された集団は、それら自体が、互いに対して差次的にタグ付けされていてもよい。そのような例示的な方法は、以下の通りである。
１．メチル結合ドメインタンパク質－ビーズ精製キットを使用して、抽出されたＤＮＡ試料（例えば、ヒト試料に由来する抽出された血液血漿ＤＮＡ、これは、必要に応じて、本明細書に記載される標的捕捉に供されている）を物理的に分配し、下流プロセシングのためにプロセスからの全ての溶出物を保管すること。
２．低メチル化分配を、本明細書に記載されるもののうちのいずれかなど、ＤＮＡ内の第１の核酸塩基に対してＤＮＡ内の第２の核酸塩基とは異なって影響を及ぼす手順に供する。
３．差次的分子タグおよびＮＧＳにより実行されるアダプター配列の各分配への並行した適用。例えば、高メチル化分配（または該当する場合には、高メチル化分配の２つもしくはそれよりも多くの部分分配）、残留メチル化（「ウォッシュ」）分配、および低メチル化分配を、分子タグを有するＮＧＳ－アダプターとライゲーションする。
４．全ての分子タグ付けした分配を組み換え、続いて、アダプター特異的ＤＮＡプライマー配列を使用して増幅させる。
５．目的のゲノム領域（例えば、がん特異的遺伝的変異体および差次的にメチル化された領域）を標的とする、組み換え、増幅させた全ライブラリーの捕捉／ハイブリダイゼーション。
６．捕捉されたＤＮＡライブラリーを再増幅させ、試料タグを付加する。異なる試料をプールし、ＮＧＳ機器で多重にアッセイする。
７．分子タグを使用して一意的分子を同定する、ＮＧＳデータのバイオインフォマティクス解析、ならびに試料の差次的にＭＢＤ分配された分子へのデコンボリューション。この解析により、標準的な遺伝子シーケンシング／変異体検出と同時に、ゲノム領域に関して相対的５－メチルシトシンの情報を得ることができる。
１１．例示的なワークフロー

分配およびライブラリー調製の例示的なワークフローが、本明細書に提供される。一部の実施形態では、分配およびライブラリー調製ワークフローの一部または全ての特色は、組み合わせて使用され得る。
ａ．分配

一部の実施形態では、試料ＤＮＡ（例えば、５～２００ｎｇの間）を、メチル結合ドメイン（ＭＢＤ）緩衝液と混合し、磁気ビーズをＭＢＤタンパク質とコンジュゲートさせ、一晩インキュベートする。メチル化ＤＮＡ（高メチル化ＤＮＡ）は、このインキュベーション中に磁気ビーズ上のＭＢＤタンパク質に結合する。非メチル化である（低メチル化ＤＮＡ）またはあまり非メチル化であるＤＮＡ（中間メチル化）は、漸増濃度の塩を含有する緩衝液で、ビーズから洗い流される。例えば、非メチル化、低メチル化、および／または中間メチル化ＤＮＡを含有する、１つ、２つ、またはそれよりも多くの分画が、そのような洗浄から得られ得る。最終的に、高塩緩衝液を使用して、ＭＢＤタンパク質から、高度メチル化ＤＮＡ（高メチル化ＤＮＡ）を溶出させる。一部の実施形態では、これらの洗浄により、漸増メチル化レベルを有するＤＮＡの３つの分配（低メチル化分配、中間メチル化分画、および高メチル化分配）が得られる。

一部の実施形態では、ＤＮＡの３つの分配は、ライブラリー調製の酵素ステップの準備において脱塩および濃縮される。
ｂ．ライブラリーの調製

一部の実施形態では（例えば、分配中のＤＮＡを濃縮した後）、分配されたＤＮＡは、例えば、ＤＮＡ分子の末端オーバーハングを伸長させ、断片の３’末端にアデノシン残基を付加し、各ＤＮＡ断片の５’末端をリン酸化することによって、ライゲーション可能となる。ＤＮＡリガーゼおよびアダプターを添加して、各分配されたＤＮＡ分子を、各末端でアダプターとライゲーションさせる。これらのアダプターは、他の分配において使用されるアダプターの分配タグと識別可能な分配タグ（例えば、非ランダム、非一意的バーコード）を含有する。小分けにしたＤＮＡをライゲーション可能にすることおよびライゲーションを行うことの前または後のいずれかで、低メチル化分配を、本明細書に記載されるもののうちのいずれかなど、ＤＮＡ内の第１の核酸塩基に対してＤＮＡ内の第２の核酸塩基とは異なって影響を及ぼす手順に供する。ＤＮＡ内の第１の核酸塩基に対してＤＮＡ内の第２の核酸塩基とは異なって影響を及ぼす手順により、さらに、低メチル化分配を分配する場合、アダプターのライゲーションは、低メチル化分配の部分分配が差次的にタグ付けされ得るように、この手順の後に行うべきである。必要に応じて、高メチル化分配は、メチル化感受性ヌクレアーゼ、例えば、メチル化感受性制限酵素（例えば、ＨｐａＩＩ、ＢｓｔＵＩ、およびＨｉｎ６ｉのうちの１つもしくは複数、または各々）で消化させてもよい。必要に応じて、高メチル化分配は、本明細書に記載されるもののうちのいずれかなど、ＤＮＡ内の第１の核酸塩基に対してＤＮＡ内の第２の核酸塩基とは異なって影響を及ぼす手順に供され得る。ＤＮＡ内の第１の核酸塩基に対してＤＮＡ内の第２の核酸塩基とは異なって影響を及ぼす手順により、さらに、高メチル化分配を分配する場合、アダプターのライゲーションは、高メチル化分配の部分分配が差示的にタグ付けされ得るように、この手順の後に行うべきである。次いで、２つ、３つ、またはそれよりも多くの分配が、一緒にプールされ、増幅される（例えば、ＰＣＲによって、例えば、アダプターに特異的なプライマーを用いて）。

ＰＣＲ後、増幅されたＤＮＡは、富化の前に、清浄され、濃縮され得る。増幅されたＤＮＡは、目的の特定の領域を標的とする、本明細書に記載されるプローブのコレクション（これは、例えば、ビオチン化ＲＮＡプローブであり得る）と接触させられる。混合物を、例えば、塩緩衝液中で、例えば、一晩インキュベートする。プローブを捕捉し（例えば、ストレプトアビジン磁気ビーズを使用して）、捕捉されなかった増幅されたＤＮＡから、例えば、一連の塩洗浄によって分離させ、それによって、試料を富化する。富化後に、富化させた試料を、ＰＣＲによって増幅させる。一部の実施形態では、ＰＣＲプライマーは、試料タグを含有し、それによって、試料タグをＤＮＡ分子に組み込む。一部の実施形態では、異なる試料に由来するＤＮＡが一緒にプールされ、次いで、例えば、ＩｌｌｕｍｉｎａＮｏｖａＳｅｑシーケンサーを使用して、多重シーケンシングされる。
Ｃ．ある特定の開示される方法のさらなる特色
１．試料

試料は、対象から単離された任意の生体試料であり得る。試料は、身体試料であり得る。試料としては、体組織、例えば、判明しているかまたは疑われる固形腫瘍、全血、血小板、血清、血漿、糞便、赤血球、白血球（white blood cell）または白血球（leucocyte）、内皮細胞、組織生検、脳脊髄液滑液、リンパ液、腹水、間質液または細胞外液、細胞間の空間の流体が挙げられ得、歯肉溝滲出液、骨髄、胸水、脳脊髄液、唾液、粘液、喀痰、精液、汗、尿が挙げられる。試料は、好ましくは、体液、特に、血液およびその分画、ならびに尿である。試料は、対象からもともと単離されている形態であってもよく、または成分、例えば、細胞を除去もしくは追加するため、または１つの構成要素を別の構成要素と比べて富化するために、さらなるプロセシングに供されていてもよい。したがって、解析のための好ましい体液は、無細胞核酸を含有する血漿または血清である。試料は、対象から単離または取得することができ、試料解析の現場へと輸送され得る。試料は、望ましい温度、例えば、室温、４℃、－２０℃、および／または－８０℃で保存または発送され得る。試料は、試料解析の現場で、対象から単離または取得することができる。対象は、ヒト、哺乳動物、動物、コンパニオン動物、介助動物、または愛玩動物であり得る。対象は、がんを有し得る。対象は、がんまたは検出可能ながんの症状を有さない場合がある。対象は、１つまたは複数のがん治療、例えば、化学療法、抗体、ワクチン、または生物学のうちのいずれか１つまたは複数で処置されていてもよい。対象は、寛解期にあってもよい。対象は、がんまたは任意のがん関連遺伝子突然変異／障害に罹患しやすいと診断されていてもよく、またはされていなくてもよい。

血漿の体積は、シーケンシングされる領域の所望の読み取りデータ深度に依存し得る。例示的な体積は、０．４～４０ｍｌ、５～２０ｍｌ、１０～２０ｍｌである。例えば、体積は、０．５ｍＬ、１ｍＬ、５ｍＬ、１０ｍＬ、２０ｍＬ、３０ｍＬ、または４０ｍＬであり得る。試料採取される血漿の体積は、５～２０ｍＬであり得る。

試料は、ゲノム等価物を含有する様々な量の核酸を含み得る。例えば、約３０ｎｇのＤＮＡの試料は、約１０，０００（１０^４）個の半数体ヒトゲノム等価物を含有し、ｃｆＤＮＡの場合、約２０００億（２×１０^１１）個の個々のポリヌクレオチド分子を含有し得る。同様に、約１００ｎｇのＤＮＡの試料は、約３０，０００個の半数体ヒトゲノム等価物を含有し、ｃｆＤＮＡの場合、約６０００億個の個々の分子を含有し得る。

試料は、異なる起源、例えば、同じ対象の細胞および無細胞、異なる対象の細胞および無細胞に由来する核酸を含み得る。試料は、突然変異を有する核酸を含み得る。例えば、試料は、生殖系列突然変異および／または体細胞突然変異を有するＤＮＡを含み得る。生殖系列突然変異は、対象の生殖系列ＤＮＡに存在する突然変異を指す。体細胞突然変異は、対象の体細胞、例えば、がん細胞を起源とする突然変異を指す。試料は、がん関連突然変異（例えば、がん関連体細胞突然変異）を有するＤＮＡを含み得る。試料は、エピジェネティック変異体（すなわち、化学的またはタンパク質改変）を含み得、ここで、エピジェネティック変異体は、遺伝的変異体、例えば、がん関連突然変異の存在と関連付けられる。一部の実施形態では、試料は、遺伝的変異体の存在と関連するエピジェネティック変異体を含み、ここで、試料は、遺伝的変異体を含まない。

増幅前の試料中の無細胞核酸の例示的な量は、約１ｆｇ～約１μｇ、例えば、１ｐｇ～２００ｎｇ、１ｎｇ～１００ｎｇ、１０ｎｇ～１０００ｎｇの範囲である。例えば、量は、最大約６００ｎｇ、最大約５００ｎｇ、最大約４００ｎｇ、最大約３００ｎｇ、最大約２００ｎｇ、最大約１００ｎｇ、最大約５０ｎｇ、または最大約２０ｎｇの無細胞核酸分子であり得る。量は、少なくとも１ｆｇ、少なくとも１０ｆｇ、少なくとも１００ｆｇ、少なくとも１ｐｇ、少なくとも１０ｐｇ、少なくとも１００ｐｇ、少なくとも１ｎｇ、少なくとも１０ｎｇ、少なくとも１００ｎｇ、少なくとも１５０ｎｇ、または少なくとも２００ｎｇの無細胞核酸分子であり得る。量は、最大１フェムトグラム（ｆｇ）、１０ｆｇ、１００ｆｇ、１ピコグラム（ｐｇ）、１０ｐｇ、１００ｐｇ、１ｎｇ、１０ｎｇ、１００ｎｇ、１５０ｎｇ、または２００ｎｇの無細胞核酸分子であり得る。方法は、１フェムトグラム（ｆｇ）～２００ｎｇを得ることを含み得る。

無細胞ＤＮＡは、対象からのその単離の時点において、細胞内に含有されていないＤＮＡを指す。例えば、ｃｆＤＮＡは、細胞を溶解することも、それ以外では細胞内ＤＮＡを抽出することもなしに、インタクトな細胞を除去した後に試料中に残留しているＤＮＡとして、試料から単離され得る。無細胞核酸としては、ＤＮＡ、ＲＮＡ、およびそれらのハイブリッドが挙げられ、これには、ゲノムＤＮＡ、ミトコンドリアＤＮＡ、ｓｉＲＮＡ、ｍｉＲＮＡ、循環ＲＮＡ（ｃＲＮＡ）、ｔＲＮＡ、ｒＲＮＡ、核小体低分子ＲＮＡ（ｓｎｏＲＮＡ）、Ｐｉｗｉ相互作用ＲＮＡ（ｐｉＲＮＡ）、長鎖非コードＲＮＡ（長鎖ｎｃＲＮＡ）、またはこれらのうちのいずれかの断片が含まれる。無細胞核酸は、二本鎖、一本鎖、またはそれらのハイブリッドであり得る。無細胞核酸は、分泌または細胞死プロセス、例えば、細胞壊死およびアポトーシスを通じて、体液中に放出され得る。一部の無細胞核酸は、がん細胞、例えば、循環腫瘍ＤＮＡ（ｃｔＤＮＡ）から、体液中に放出される。その他のものは、健康な細胞から放出される。一部の実施形態では、ｃｆＤＮＡは、無細胞胎児ＤＮＡ（ｃｆｆＤＮＡ）である。一部の実施形態では、無細胞核酸は、腫瘍細胞によって産生される。一部の実施形態では、無細胞核酸は、腫瘍細胞と非腫瘍細胞との混合物によって産生される。

無細胞核酸は、約１００～５００ヌクレオチドの例示的なサイズ分布を有し、１１０～約２３０ヌクレオチドの分子が、分子の約９０％に相当し、最頻値は約１６８ヌクレオチドであり、第２のマイナーピークは、２４０～４４０ヌクレオチドの間の範囲にある。

無細胞核酸は、溶液中に見出される無細胞核酸を、インタクトな細胞および体液の他の不溶性構成要素から分離する、分画または分配ステップによって、体液から単離することができる。分配するステップには、遠心分離または濾過などの技術が含まれ得る。あるいは、体液中の細胞を、溶解し、無細胞核酸および細胞核酸を、一緒にプロセシングしてもよい。一般に、緩衝液の添加および洗浄ステップの後に、核酸は、アルコールで沈殿させることができる。シリカに基づくカラムなどのさらなる洗浄ステップを使用して、夾雑物または塩を除去してもよい。バイサルファイトシーケンシング、ハイブリダイゼーション、および／またはライゲーションのための非特異的バルク担体核酸、例えば、Ｃ１ＤＮＡ、ＤＮＡ、またはタンパク質を、手順のある特定の態様、例えば、収量を最適化するために、反応全体にわたって添加してもよい。

そのようなプロセシングの後、試料は、二本鎖ＤＮＡ、一本鎖ＤＮＡ、および一本鎖ＲＮＡを含む、様々な形態の核酸を含み得る。一部の実施形態では、一本鎖ＤＮＡおよびＲＮＡは、後続のプロセシングおよび解析ステップに含められるように、二本鎖形態に変換してもよい。

試料中の二本鎖ＤＮＡ分子および二本鎖ＤＮＡ分子に変換される一本鎖核酸分子は、一方の末端または両方の末端において、アダプターに連結され得る。典型的には、二本鎖分子は、４つ全ての標準的なヌクレオチドの存在下において、５’－３’ポリメラーゼおよび３’－５’エクソヌクレアーゼ（またはプルーフリーディング機能）を有するポリメラーゼでの処置によって、平滑末端化される。クレノウラージ断片およびＴ４ポリメラーゼが、好適なポリメラーゼの例である。平滑末端化されたＤＮＡ分子は、少なくとも部分的に二本鎖のアダプター（例えば、Ｙ字形状またはベル形状のアダプター）とライゲーションされ得る。あるいは、ライゲーションを容易にするために、相補的なヌクレオチドが、試料核酸およびアダプターの平滑末端に付加されてもよい。平滑末端ライゲーションおよび付着末端ライゲーションの両方が、本明細書において企図される。平滑末端ライゲーションでは、核酸分子およびアダプタータグの両方が、平滑末端を有する。付着末端ライゲーションでは、典型的には、核酸分子は、「Ａ」オーバーハングを有し、アダプターは、「Ｔ」オーバーハングを有する。
２．増幅

アダプターが隣接する試料核酸は、ＰＣＲおよび他の増幅方法によって増幅され得る。増幅は、典型的には、増幅させようとするＤＮＡ分子に隣接するアダプター内のプライマー結合部位にプライマーが結合することによって、プライミングされる。増幅方法は、サーモサイクリングの結果としての変性、アニーリング、および伸長のサイクルを含み得るか、または転写媒介増幅におけるような等温のものであってもよい。他の増幅方法としては、リガーゼ連鎖反応、鎖置換増幅、核酸配列に基づく増幅、および自家持続性配列に基づく複製法が挙げられる。

一部の実施形態では、本方法は、ＴテールおよびＣテールアダプターを用いてｄｓＤＮＡライゲーションを行い、これにより、アダプターへ連結する前に、二本鎖核酸のうちの少なくとも５０、６０、７０、または８０％の増幅がもたらされる。好ましくは、本方法は、Ｔテールアダプターを単独で用いて行われる対照方法と比べて、増幅される分子の量または数を、少なくとも１０、１５、または２０％増加させる。
３．ベイトセット；捕捉部分

上記で考察されるように、試料中の核酸は、捕捉ステップに供することができ、ここで、標的配列を有する分子が、後続の解析のために捕捉される。標的の捕捉は、捕捉部分、例えば、ビオチンまたは以下に記載される他の例で標識されたオリゴヌクレオチドベイトを含むベイトセットの使用を伴い得る。プローブは、遺伝子など、領域のパネルにわたってタイリングするように選択された配列を有し得る。一部の実施形態では、ベイトセットは、本明細書の他の箇所において考察されるように、標的領域のセット、例えば、それぞれ、配列可変標的領域セットおよびエピジェネティック標的領域セットに関して、より高い捕捉収率およびより低い捕捉収率を有し得る。そのようなベイトセットは、標的分子のベイトとのハイブリダイゼーションを可能にする条件下において、試料と組み合わされる。次いで、捕捉された分子は、捕捉部分を使用して単離される。例えば、ビーズに基づくストレプトアビジンによるビオチン捕捉部分。そのような方法は、例えば、２０１７年１２月２６日に発行された米国特許第９，８５０，５２３号において、さらに説明されており、これは、参照により本明細書に組み込まれる。

捕捉部分としては、限定することなく、ビオチン、アビジン、ストレプトアビジン、特定のヌクレオチド配列を含む核酸、抗体によって認識されるハプテン、および磁気吸着可能な粒子が挙げられる。抽出部分は、結合ペア、例えば、ビオチン／ストレプトアビジンまたはハプテン／抗体のメンバーであり得る。一部の実施形態では、検体に付着した捕捉部分は、単離可能な部分、例えば、磁気吸着可能な粒子または遠心分離によって沈降させることができる大きい粒子に付着した、その結合ペアによって捕捉される。捕捉部分は、捕捉部分を有する核酸の、捕捉部分が欠如した核酸からの親和性分離を可能にする、任意のタイプの分子であり得る。例示的な捕捉部分は、固相に連結しているかもしくは連結可能なストレプトアビジンへの結合による親和性分離を可能にするビオチン、または固相に連結しているかもしくは連結可能な相補的なオリゴヌクレオチドへの結合を通じた親和性分離を可能にするオリゴヌクレオチドである。
Ｄ．標的特異的プローブのコレクション

一部の実施形態では、標的特異的プローブのコレクションを、本明細書に記載される方法において使用する。一部の実施形態では、標的特異的プローブのコレクションは、配列可変標的領域セットに対して特異的な標的結合プローブおよびエピジェネティック標的領域セットに対して特異的な標的結合プローブを含む。一部の実施形態では、配列可変標的領域セットに対して特異的な標的結合プローブの捕捉収率は、エピジェネティック標的領域セットに対して特異的な標的結合プローブの捕捉収率よりも高い（例えば、少なくとも２倍高い）。一部の実施形態では、標的特異的プローブのコレクションは、エピジェネティック標的領域セットに対して特異的なその捕捉収率よりも高い（例えば、少なくとも２倍高い）配列可変標的領域セットに対して特異的な捕捉収率を有するように構成される。

一部の実施形態では、配列可変標的領域セットに対して特異的な標的結合プローブの捕捉収率は、エピジェネティック標的領域セットに対して特異的な標的結合プローブの捕捉収率よりも少なくとも１．２５倍、１．５倍、１．７５倍、２倍、２．２５倍、２．５倍、２．７５倍、３倍、３．５倍、４倍、４．５倍、５倍、６倍、７倍、８倍、９倍、１０倍、１１倍、１２倍、１３倍、１４倍、または１５倍高い。一部の実施形態では、配列可変標的領域セットに対して特異的な標的結合プローブの捕捉収率は、エピジェネティック標的領域セットに対して特異的な標的結合プローブの捕捉収率よりも１．２５倍～１．５倍、１．５倍～１．７５倍、１．７５倍～２倍、２倍～２．２５倍、２．２５倍～２．５倍、２．５倍～２．７５倍、２．７５倍～３倍、３倍～３．５倍、３．５倍～４倍、４倍～４．５倍、４．５倍～５倍、５倍～５．５倍、５．５倍～６倍、６倍～７倍、７倍～８倍、８倍～９倍、９倍～１０倍、１０倍～１１倍、１１倍～１２倍、１３倍～１４倍、または１４倍～１５倍高い。

一部の実施形態では、標的特異的プローブのコレクションは、エピジェネティック標的領域セットに対するその捕捉収率よりも少なくとも１．２５倍、１．５倍、１．７５倍、２倍、２．２５倍、２．５倍、２．７５倍、３倍、３．５倍、４倍、４．５倍、５倍、６倍、７倍、８倍、９倍、１０倍、１１倍、１２倍、１３倍、１４倍、または１５倍高い、配列可変標的領域セットに対して特異的な捕捉収率を有するように構成される。一部の実施形態では、標的特異的プローブのコレクションは、エピジェネティック標的領域セットに対して特異的なその捕捉収率よりも１．２５倍～１．５倍、１．５倍～１．７５倍、１．７５倍～２倍、２倍～２．２５倍、２．２５倍～２．５倍、２．５倍～２．７５倍、２．７５倍～３倍、３倍～３．５倍、３．５倍～４倍、４倍～４．５倍、４．５倍～５倍、５倍～５．５倍、５．５倍～６倍、６倍～７倍、７倍～８倍、８倍～９倍、９倍～１０倍、１０倍～１１倍、１１倍～１２倍、１３倍～１４倍、または１４倍～１５倍高い、配列可変標的領域セットに対して特異的な捕捉収率を有するように構成される。

プローブのコレクションは、濃度、様々な長さ、および／または化学（例えば、親和性に影響を及ぼす）、ならびにそれらの組合せを含む様々な方法で配列可変標的領域セットに対してより高い捕捉収率を提供するように構成され得る。親和性は、以下に考察するように、プローブの長さを調整する、および／またはヌクレオチド改変を含めることによってモジュレートすることができる。

一部の実施形態では、配列可変標的領域セットに対して特異的な標的特異的プローブは、エピジェネティック標的領域セットに対して特異的な標的特異的プローブよりも高い濃度で存在する。一部の実施形態では、配列可変標的領域セットに対して特異的な標的結合プローブの濃度は、エピジェネティック標的領域セットに対して特異的な標的結合プローブの濃度よりも少なくとも１．２５倍、１．５倍、１．７５倍、２倍、２．２５倍、２．５倍、２．７５倍、３倍、３．５倍、４倍、４．５倍、５倍、６倍、７倍、８倍、９倍、１０倍、１１倍、１２倍、１３倍、１４倍、または１５倍高い。一部の実施形態では、配列可変標的領域セットに対して特異的な標的結合プローブの濃度は、エピジェネティック標的領域セットに対して特異的な標的結合プローブの濃度よりも１．２５倍～１．５倍、１．５倍～１．７５倍、１．７５倍～２倍、２倍～２．２５倍、２．２５倍～２．５倍、２．５倍～２．７５倍、２．７５倍～３倍、３倍～３．５倍、３．５倍～４倍、４倍～４．５倍、４．５倍～５倍、５倍～５．５倍、５．５倍～６倍、６倍～７倍、７倍～８倍、８倍～９倍、９倍～１０倍、１０倍～１１倍、１１倍～１２倍、１３倍～１４倍、または１４倍～１５倍高い。そのような実施形態では、濃度は、各セット中の個々のプローブの体積濃度あたりの平均質量を指し得る。

一部の実施形態では、配列可変標的領域セットに対して特異的な標的特異的プローブは、エピジェネティック標的領域セットに対して特異的な標的特異的プローブよりもそれらの標的に対する高い親和性を有する。親和性は、異なるプローブ化学を使用することによってを含む、当業者に公知の任意の方法でモジュレートすることができる。ある特定のヌクレオチド改変、例えばシトシン５－メチル化（ある特定の配列の文脈において）、糖の２’位でヘテロ原子を提供する改変、およびＬＮＡヌクレオチドは、二本鎖核酸の安定性を増加させることができ、そのような改変を有するオリゴヌクレオチドが、その相補的配列に関して比較的高い親和性を有することを示している。例えば、Severin et al., Nucleic Acids Res. 39: 8740-8751 (2011); Freier et al., Nucleic Acids Res. 25: 4429-4443 (1997)；米国特許第９，７３８，８９４号を参照されたい。同様に、より長い配列長は、一般的に親和性の増加を提供する。他のヌクレオチド改変、例えば、核酸塩基ヒポキサンチンをグアニンの代わりに置換すると、オリゴヌクレオチドとその相補配列の間の水素結合の量を低減させることによって親和性を低減する。一部の実施形態では、配列可変標的領域セットに対して特異的な標的特異的プローブは、その標的に対するその親和性を増加させる改変を有する。一部の実施形態では、あるいはまたはさらに、エピジェネティック標的領域セットに対して特異的な標的特異的プローブは、その標的に対するその親和性を減少させる改変を有する。一部の実施形態では、配列可変標的領域セットに対して特異的な標的特異的プローブは、エピジェネティック標的領域セットに対して特異的な標的特異的プローブよりも長い平均長および／または高い平均融解温度を有する。これらの実施形態を互いに、および／または上記で考察した濃度の差と組み合わせて、上記の任意の倍率の差またはその範囲などの、捕捉収率の所望の倍率の差を達成してもよい。

一部の実施形態では、標的特異的プローブは、捕捉部分を含む。捕捉部分は、本明細書に記載される捕捉分子のいずれか、例えばビオチンであってもよい。一部の実施形態では、標的特異的プローブは、固体支持体に、例えば捕捉部分の結合対の相互作用などを通して共有結合または非共有結合により連結される。一部の実施形態では、固体支持体はビーズ、例えば磁気ビーズである。

一部の実施形態では、配列可変標的領域セットに対して特異的な標的特異的プローブおよび／またはエピジェネティック標的領域セットに対して特異的な標的特異的プローブは、上記で考察したようにベイトセット、例えば、捕捉部分および遺伝子などの領域のパネルにわたってタイリングするために選択された配列を含むプローブである。

一部の実施形態では、標的特異的プローブは、単一の組成物中で提供される。単一の組成物は溶液（液体または凍結）であり得る。あるいは、これは凍結乾燥物であり得る。

あるいは、標的特異的プローブは、例えば、エピジェネティック標的領域セットに対して特異的なプローブを含む第１の組成物、および配列可変標的領域セットに対して特異的なプローブを含む第２の組成物を含む、複数の組成物として提供され得る。これらのプローブを適切な割合で混合して、濃度および／または捕捉収率の前述の倍率の差のいずれかを有する組み合わせたプローブ組成物を提供してもよい。あるいは、それらを個別の捕捉手順（例えば、試料のアリコートを用いて、または同じ試料で逐次的に）で使用して、捕捉されたエピジェネティック標的領域および配列可変標的領域をそれぞれ含む第１および第２の組成物を提供してもよい。
１．エピジェネティック標的領域に対して特異的なプローブ

エピジェネティック標的領域セットのプローブは、新生物（例えば、腫瘍またはがん）細胞からのＤＮＡを、健康な細胞、例えば非新生物の循環細胞と区別する可能性が高い１つまたは複数のタイプの標的領域に対して特異的なプローブを含み得る。そのような領域の例示的なタイプは、本明細書において、例えば捕捉されたセットに関する上記の節に詳細に考察されている。エピジェネティック標的領域セットのプローブはまた、例えば本明細書に記載される１つまたは複数の対照領域のプローブも含み得る。

一部の実施形態では、エピジェネティック標的領域セットのプローブは、少なくとも１００ｋｂｐ、例えば、少なくとも２００ｋｂｐ、少なくとも３００ｋｂｐ、または少なくとも４００ｋｂｐのフットプリントを有する。一部の実施形態では、エピジェネティック標的領域セットは、１００～２０Ｍｂｐ、例えば、１００～２００ｋｂｐ、２００～３００ｋｂｐ、３００～４００ｋｂｐ、４００～５００ｋｂｐ、５００～６００ｋｂｐ、６００～７００ｋｂｐ、７００～８００ｋｂｐ、８００～９００ｋｂｐ、９００～１，０００ｋｂｐ、１～１．５Ｍｂｐ、１．５～２Ｍｂｐ、２～３Ｍｂｐ、３～４Ｍｂｐ、４～５Ｍｂｐ、５～６Ｍｂｐ、６～７Ｍｂｐ、７～８Ｍｂｐ、８～９Ｍｂｐ、９～１０Ｍｂｐ、または１０～２０Ｍｂｐの範囲のフットプリントを有する。一部の実施形態では、エピジェネティック標的領域セットは、少なくとも２０Ｍｂｐのフットプリントを有する。
ａ．高メチル化可変標的領域

一部の実施形態では、エピジェネティック標的領域セットのプローブは、１つまたは複数の高メチル化可変標的領域に対して特異的なプローブを含む。高メチル化可変標的領域はまた、本明細書において高メチル化ＤＭＲ（差次的にメチル化された領域）とも呼ばれ得る。高メチル化可変標的領域は、上記のそれらのいずれかであり得る。例えば、一部の実施形態では、高メチル化可変標的領域に対して特異的なプローブは、表１に列挙される複数の座、例えば表１に列挙される座の少なくとも１０％、２０％、３０％、４０％、５０％、６０％、７０％、８０％、９０％、または１００％に対して特異的なプローブを含む。一部の実施形態では、高メチル化可変標的領域に対して特異的なプローブは、表２に列挙される複数の座、例えば表２に列挙される座の少なくとも１０％、２０％、３０％、４０％、５０％、６０％、７０％、８０％、９０％、または１００％に対して特異的なプローブを含む。一部の実施形態では、高メチル化可変標的領域に対して特異的なプローブは、表１または表２に列挙される複数の座、例えば表１または表２に列挙される座の少なくとも１０％、２０％、３０％、４０％、５０％、６０％、７０％、８０％、９０％、または１００％に対して特異的なプローブを含む。一部の実施形態では、標的領域として含まれる各座に関して、遺伝子の転写開始部位と終止コドン（選択的にスプライシングされる遺伝子の場合は最後の終止コドン）の間に結合するハイブリダイゼーション部位を有する１つまたは複数のプローブが存在し得る。一部の実施形態では、１つまたは複数のプローブは、列挙された位置の３００ｂｐ以内、例えば２００または１００ｂｐ以内に結合する。一部の実施形態では、プローブは、上に列挙された位置と重複するハイブリダイゼーション部位を有する。一部の実施形態では、高メチル化標的領域に対して特異的なプローブは、乳がん、結腸がん、腎臓がん、肝臓がん、および肺がんのうちの１、２、３、４、または５つにおいて集合的に高メチル化を示す高メチル化標的領域の１、２、３、４、または５つのサブセットに対して特異的なプローブを含む。
ｂ．低メチル化可変標的領域

一部の実施形態では、エピジェネティック標的領域セットのプローブは、１つまたは複数の低メチル化可変標的領域に対して特異的なプローブを含む。低メチル化可変標的領域はまた、本明細書において低メチル化ＤＭＲ（差次的にメチル化された領域）とも呼ばれ得る。低メチル化可変標的領域は、上記のそれらのいずれかであり得る。例えば、１つまたは複数の低メチル化可変標的領域に対して特異的なプローブは、反復エレメント、例えば、ＬＩＮＥ１エレメント、Ａｌｕエレメント、セントロメアタンデムリピート、ペリセントロメアタンデムリピート、およびサテライトＤＮＡなどの領域のプローブを含んでもよく、健康な細胞において通常メチル化される遺伝子間領域は、腫瘍細胞において低減されたメチル化を示し得る。

一部の実施形態では、低メチル化可変標的領域に対して特異的なプローブは、反復エレメントおよび／または遺伝子間領域に対して特異的なプローブを含む。一部の実施形態では、反復エレメントに対して特異的なプローブは、ＬＩＮＥ１エレメント、Ａｌｕエレメント、セントロメアタンデムリピート、ペリセントロメアタンデムリピート、および／またはサテライトＤＮＡのうちの１、２、３、４、または５個に対して特異的なプローブを含む。

がん関連低メチル化を示すゲノム領域に対して特異的な例示的なプローブは、ヒト第１染色体のヌクレオチド８４０３５６５～８９５３７０８および／または１５１１０４７０１～１５１１０６０３５に対して特異的なプローブを含む。一部の実施形態では、低メチル化可変標的領域に対して特異的なプローブは、ヒト第１染色体のヌクレオチド８４０３５６５～８９５３７０８および／または１５１１０４７０１～１５１１０６０３５と重複するまたはそれらを含む領域に対して特異的なプローブを含む。
ｃ．ＣＴＣＦ結合領域

一部の実施形態では、エピジェネティック標的領域セットのプローブは、ＣＴＣＦ結合領域に対して特異的なプローブを含む。一部の実施形態では、ＣＴＣＦ結合領域に対して特異的なプローブは、少なくとも１０、２０、５０、１００、２００、もしくは５００個のＣＴＣＦ結合領域、または１０～２０、２０～５０、５０～１００、１００～２００、２００～５００、もしくは５００～１０００個のＣＴＣＦ結合領域、例えば上記の、またはＣＴＣＦＢＳＤＢの１つもしくは複数、または上記で引用したＣｕｄｄａｐａｈら、Ｍａｒｔｉｎら、もしくはＲｈｅｅらの論文におけるＣＴＣＦ結合領域などに対して特異的なプローブを含む。一部の実施形態では、エピジェネティック標的領域セットのプローブは、ＣＴＣＦ結合部位の少なくとも１００ｂｐ、少なくとも２００ｂｐ、少なくとも３００ｂｐ、少なくとも４００ｂｐ、少なくとも５００ｂｐ、少なくとも７５０ｂｐ、または少なくとも１０００ｂｐ上流および下流の領域を含む。
ｄ．転写開始部位

一部の実施形態では、エピジェネティック標的領域セットのプローブは、転写開始部位に対して特異的なプローブを含む。一部の実施形態では、転写開始部位に対して特異的なプローブは、少なくとも１０、２０、５０、１００、２００、もしくは５００個の転写開始部位、または１０～２０、２０～５０、５０～１００、１００～２００、２００～５００、もしくは５００～１０００個の転写開始部位、例えばＤＢＴＳＳに列挙される転写開始部位などに対して特異的なプローブを含む。一部の実施形態では、エピジェネティック標的領域セットのプローブは、転写開始部位の少なくとも１００ｂｐ、少なくとも２００ｂｐ、少なくとも３００ｂｐ、少なくとも４００ｂｐ、少なくとも５００ｂｐ、少なくとも７５０ｂｐ、または少なくとも１０００ｂｐ上流および下流の配列のプローブを含む。
ｅ．局所増幅

上記のように、局所増幅が体細胞突然変異であるが、それらは、メチル化の変化などのある特定のエピジェネティック変化を検出するためのアプローチと類似の方法で読み取りデータの頻度に基づいてシーケンシングすることによって検出することができる。そのため、がんにおいて局所増幅を示し得る領域を、上記で考察したようにエピジェネティック標的領域セットに含めることができる。一部の実施形態では、エピジェネティック標的領域セットに対して特異的なプローブは、局所増幅に対して特異的なプローブを含む。一部の実施形態では、局所増幅に対して特異的なプローブは、ＡＲ、ＢＲＡＦ、ＣＣＮＤ１、ＣＣＮＤ２、ＣＣＮＥ１、ＣＤＫ４、ＣＤＫ６、ＥＧＦＲ、ＥＲＢＢ２、ＦＧＦＲ１、ＦＧＦＲ２、ＫＩＴ、ＫＲＡＳ、ＭＥＴ、ＭＹＣ、ＰＤＧＦＲＡ、ＰＩＫ３ＣＡ、およびＲＡＦ１のうちの１つまたは複数に対して特異的なプローブを含む。例えば、一部の実施形態では、局所増幅に対して特異的なプローブは、前述の標的の少なくとも２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、または１８個のうちの１つまたは複数に対して特異的なプローブを含む。
ｆ．対照領域

データ検証を容易にするために対照領域を含めることは有用であり得る。一部の実施形態では、エピジェネティック標的領域セットに対して特異的なプローブは、本質的に全ての試料においてメチル化されると予想される対照メチル化領域に対して特異的なプローブを含む。一部の実施形態では、エピジェネティック標的領域セットに対して特異的なプローブは、本質的に全ての試料において低メチル化であると予想される対照低メチル化領域に対して特異的なプローブを含む。
２．配列可変標的領域に対して特異的なプローブ

配列可変標的領域セットのプローブは、がんにおいて体細胞突然変異を受けることが公知である複数の領域に対して特異的なプローブを含み得る。プローブは、本明細書に記載される任意の配列可変標的領域セットに対して特異的であり得る。例示的な配列可変標的領域セットは、本明細書において、例えば捕捉されたセットに関する上記の節で詳細に考察される。

一部の実施形態では、配列可変標的領域プローブセットは、少なくとも０．５ｋｂ、例えば、少なくとも１ｋｂ、少なくとも２ｋｂ、少なくとも５ｋｂ、少なくとも１０ｋｂ、少なくとも２０ｋｂ、少なくとも３０ｋｂ、または少なくとも４０ｋｂのフットプリントを有する。一部の実施形態では、エピジェネティック標的領域プローブセットは、０．５～１００ｋｂ、例えば、０．５～２ｋｂ、２～１０ｋｂ、１０～２０ｋｂ、２０～３０ｋｂ、３０～４０ｋｂ、４０～５０ｋｂ、５０～６０ｋｂ、６０～７０ｋｂ、７０～８０ｋｂ、８０～９０ｋｂ、および９０～１００ｋｂの範囲のフットプリントを有する。一部の実施形態では、配列可変標的領域プローブセットは、少なくとも５０ｋｂｐ、例えば、少なくとも１００ｋｂｐ、少なくとも２００ｋｂｐ、少なくとも３００ｋｂｐ、または少なくとも４００ｋｂｐのフットプリントを有する。一部の実施形態では、配列可変標的領域プローブセットは、１００～２０００ｋｂｐ、例えば、１００～２００ｋｂｐ、２００～３００ｋｂｐ、３００～４００ｋｂｐ、４００～５００ｋｂｐ、５００～６００ｋｂｐ、６００～７００ｋｂｐ、７００～８００ｋｂｐ、８００～９００ｋｂｐ、９００～１，０００ｋｂｐ、１～１．５Ｍｂｐ、または１．５～２Ｍｂｐの範囲のフットプリントを有する。一部の実施形態では、配列可変標的領域セットは、少なくとも２Ｍｂｐのフットプリントを有する。

一部の実施形態では、配列可変標的領域セットに特異的なプローブは、表３の遺伝子のうちの少なくとも５個、少なくとも１０個、少なくとも１５個、少なくとも２０個、少なくとも２５個、少なくとも３０個、少なくとも３５個、少なくとも４０個、少なくとも４５個、少なくとも５０個、少なくとも５５個、少なくとも６０個、少なくとも６５個、または７０個の少なくとも一部分に特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに特異的なプローブは、表３のＳＮＶのうちの少なくとも５個、少なくとも１０個、少なくとも１５個、少なくとも２０個、少なくとも２５個、少なくとも３０個、少なくとも３５個、少なくとも４０個、少なくとも４５個、少なくとも５０個、少なくとも５５個、少なくとも６０個、少なくとも６５個、または７０個に特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに特異的なプローブは、表３の融合体のうちの少なくとも１個、少なくとも２個、少なくとも３個、少なくとも４個、少なくとも５個、または６個に特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに特異的なプローブは、表３のインデルのうちの少なくとも１個、少なくとも２個、または３個の少なくとも一部分に特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに特異的なプローブは、表４の遺伝子のうちの少なくとも５個、少なくとも１０個、少なくとも１５個、少なくとも２０個、少なくとも２５個、少なくとも３０個、少なくとも３５個、少なくとも４０個、少なくとも４５個、少なくとも５０個、少なくとも５５個、少なくとも６０個、少なくとも６５個、少なくとも７０個、または７３個の少なくとも一部分に特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに特異的なプローブは、表４のＳＮＶのうちの少なくとも５個、少なくとも１０個、少なくとも１５個、少なくとも２０個、少なくとも２５個、少なくとも３０個、少なくとも３５個、少なくとも４０個、少なくとも４５個、少なくとも５０個、少なくとも５５個、少なくとも６０個、少なくとも６５個、少なくとも７０個、または７３個に特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに特異的なプローブは、表４の融合体のうちの少なくとも１個、少なくとも２個、少なくとも３個、少なくとも４個、少なくとも５個、または６個に特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに特異的なプローブは、表４のインデルのうちの少なくとも１個、少なくとも２個、少なくとも３個、少なくとも４個、少なくとも５個、少なくとも６個、少なくとも７個、少なくとも８個、少なくとも９個、少なくとも１０個、少なくとも１１個、少なくとも１２個、少なくとも１３個、少なくとも１４個、少なくとも１５個、少なくとも１６個、少なくとも１７個、または１８個の少なくとも一部分に特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに特異的なプローブは、表５の遺伝子のうちの少なくとも１個、少なくとも２個、少なくとも３個、少なくとも４個、少なくとも５個、少なくとも６個、少なくとも７個、少なくとも８個、少なくとも９個、少なくとも１０個、少なくとも１１個、少なくとも１２個、少なくとも１３個、少なくとも１４個、少なくとも１５個、少なくとも１６個、少なくとも１７個、少なくとも１８個、少なくとも１９個、または少なくとも２０個の少なくとも一部分に特異的なプローブを含む。

一部の実施形態では、配列可変標的領域セットに対して特異的なプローブは、少なくとも１０、２０、３０、または３５個のがん関連遺伝子、例えばＡＫＴ１、ＡＬＫ、ＢＲＡＦ、ＣＣＮＤ１、ＣＤＫ２Ａ、ＣＴＮＮＢ１、ＥＧＦＲ、ＥＲＢＢ２、ＥＳＲ１、ＦＧＦＲ１、ＦＧＦＲ２、ＦＧＦＲ３、ＦＯＸＬ２、ＧＡＴＡ３、ＧＮＡ１１、ＧＮＡＱ、ＧＮＡＳ、ＨＲＡＳ、ＩＤＨ１、ＩＤＨ２、ＫＩＴ、ＫＲＡＳ、ＭＥＤ１２、ＭＥＴ、ＭＹＣ、ＮＦＥ２Ｌ２、ＮＲＡＳ、ＰＤＧＦＲＡ、ＰＩＫ３ＣＡ、ＰＰＰ２Ｒ１Ａ、ＰＴＥＮ、ＲＥＴ、ＳＴＫ１１、ＴＰ５３、およびＵ２ＡＦ１からの標的領域に対して特異的なプローブを含む。
Ｅ．捕捉されたＤＮＡを含む組成物

ＤＮＡの第１および第２の集団を含む組合せであって、第２の集団が、ＤＮＡの断片を含み、第１の核酸塩基が、変換手順、例えば、本明細書に記載される変換手順のうちのいずれかを受けている、組合せが、本明細書において提供される。例えば、ＤＮＡは、メチル化シトシンから別の核酸塩基、例えば、チミンに変換された塩基を含み得る。一部の実施形態では、第１および第２の集団は、差次的にタグ付けされる。ＤＮＡの第１および第２の集団を含む組合せであって、第２の集団が、変更された塩基対形成特異性を有するＤＮＡにもともと存在していた第１の核酸塩基の形態および変更された塩基対形成特異性を有さない第２の核酸塩基を含み得、塩基対形成特異性の変更前にＤＮＡにもともと存在する第１の核酸塩基の形態が、改変または非改変核酸塩基であり、第２の核酸塩基が、第１の核酸塩基とは異なる改変または非改変核酸塩基であり、塩基対形成特異性の変更前にＤＮＡにもともと存在する第１の核酸塩基の形態および第２の核酸塩基が、同じ塩基対形成特異性を有する、組合せが、本明細書において提供される。第１の集団は、第２の集団よりも高い割合でシトシン改変（例えば、シトシンメチル化）を有するＤＮＡを含むか、またはそれに由来し得る。第１の集団は、変更された塩基対形成特異性を有するＤＮＡにもともと存在していた第１の核酸塩基の形態および変更された塩基対形成特異性を有さない第２の核酸塩基を含み得、ここで、塩基対形成特異性の変更前にＤＮＡにもともと存在する第１の核酸塩基の形態は、改変または非改変核酸塩基であり、第２の核酸塩基は、第１の核酸塩基とは異なる改変または非改変核酸塩基であり、塩基対形成特異性の変更前にＤＮＡにもともと存在する第１の核酸塩基の形態および第２の核酸塩基は、同じ塩基対形成特異性を有する。一部の実施形態では、シトシン改変は、シトシンメチル化である。一部の実施形態では、第１の核酸塩基は、改変または非改変シトシンであり、第２の核酸塩基は、改変または非改変シトシンである。第１および第２の核酸塩基は、本明細書において発明の概要で、または第１の部分試料を、第１の部分試料のＤＮＡ内の第１の核酸塩基に対してＤＮＡ内の第２の核酸塩基とは異なって影響を及ぼす手順に供することに関して、考察されているもののうちのいずれかであり得る。一部の実施形態では、第１の集団は、本明細書に記載されるメチル化感受性ヌクレアーゼのうちのいずれか１つまたは任意の組合せであり得る少なくとも１つのメチル化感受性ヌクレアーゼの認識部位において、末端、または付着したタグもしくはアダプターを有するＤＮＡの断片を含む。

一部の実施形態では、第１の集団は、１つまたは複数の配列タグの第１のセットから選択される配列タグを含み、第２の集団は、１つまたは複数の配列タグの第２のセットから選択される配列タグを含み、配列タグの第２のセットは、配列タグの第１のセットとは異なる。配列タグは、バーコードを含み得る。

一部の実施形態では、第１の集団は、保護されたｈｍＣ、例えばグルコシル化ｈｍＣを含む。

一部の実施形態では、第１の集団は、本明細書で考察される変換手順、例えばバイサルファイト変換、Ｏｘ－ＢＳ変換、ＴＡＢ変換、ＡＣＥ変換、ＴＡＰ変換、ＴＡＰＳβ変換、またはＣＡＰ変換のいずれかに供された。一部の実施形態では、第１の集団は、ｈｍＣの保護後にｍＣおよび／またはＣの脱アミノ化に供された。

組合せの一部の実施形態では、第１の集団は、第２の集団よりも大きい割合でシトシン改変を有するＤＮＡを含むかまたはそれに由来し、第１の集団は、第１および第２の部分集団を含み、第１の核酸塩基は、改変または非改変核酸塩基であり、第２の核酸塩基は、第１の核酸塩基とは異なる改変または非改変核酸塩基であり、第１の核酸塩基および第２の核酸塩基は同じ塩基対形成特異性を有する。一部の実施形態では、第２の集団は、第１の核酸塩基を含まない。一部の実施形態では、第１の核酸塩基は、改変または非改変シトシンであり、第２の核酸塩基は、改変または非改変シトシンであり、必要に応じて改変シトシンはｍＣまたはｈｍＣである。一部の実施形態では、第１の核酸塩基は、改変または非改変アデニンであり、第２の核酸塩基は改変または非改変アデニンであり、必要に応じて改変アデニンはｍＡである。

一部の実施形態では、第１の核酸塩基（例えば、改変シトシン）はビオチン化される。一部の実施形態では、第１の核酸塩基（例えば、改変シトシン）は親和性標識（例えば、ビオチン）を含むβ－６－アジド－グルコシル－５－ヒドロキシメチルシトシンに対するヒュスゲン環化付加の生成物である。

本明細書に記載される組合せのいずれかでは、捕捉されたＤＮＡは、ｃｆＤＮＡを含み得る。

捕捉されたＤＮＡは、例えばエピジェネティック標的領域セットに対応するＤＮＡの濃度よりも配列可変標的領域セット（上記で考察したようにフットプリントサイズに関して正規化）に対応するＤＮＡの高い濃度を含む、捕捉セットに関する本明細書に記載される特色のいずれかを有し得る。一部の実施形態では、捕捉セットのＤＮＡは、本明細書に記載されるＤＮＡに付加され得る配列タグを含む。一般的に、配列タグを含めることは、その天然に存在する非タグ付け形態とは異なるＤＮＡ分子をもたらす。

組合せはさらに、その各々が、天然に存在する核酸分子とは異なり得る、本明細書に記載されるプローブセットまたはシーケンシングプライマーを含み得る。例えば、本明細書に記載されるプローブセットは、捕捉部分を含み得、シーケンシングプライマーは、天然に存在しない標識を含み得る。
Ｆ．コンピュータシステム

本開示の方法は、コンピュータシステムを使用して、またはその補助を用いて、実装することができる。例えば、そのような方法は、試料を、第１の部分試料および第２の部分試料を含む複数の部分試料に分配するステップであって、第１の部分試料が、第２の部分試料よりも高い割合でシトシン改変を有するＤＮＡを含む、ステップと、第２の部分試料を、第２の部分試料のＤＮＡ内の第１の核酸塩基に対してＤＮＡ内の第２の核酸塩基とは異なって影響を及ぼす手順に供するステップであって、第１の核酸塩基が改変または非改変核酸塩基であり、第２の核酸塩基が第１の核酸塩基とは異なる改変または非改変核酸塩基であり、第１の核酸塩基および第２の核酸塩基が同じ塩基対形成特異性を有し、それによって処置された部分試料を産生するステップと、処置された部分試料から、エピジェネティック標的領域を含む標的領域セットを捕捉するステップと、標的領域セット中のＤＮＡおよび第１の部分試料に由来するＤＮＡをシーケンシングするステップであって、第２の部分試料に由来するＤＮＡが、標的領域セットのＤＮＡ内の第１の核酸塩基を第２の核酸塩基と識別する様式でシーケンシングされる、ステップとを含み得る。

図４は、本開示の方法を実装するようにプログラミングされるか、またはそうでなければそのように構成される、コンピュータシステム４０１を示す。コンピュータシステム４０１は、試料調製、シーケンシング、および／または解析の様々な態様を調節することができる。一部の例では、コンピュータシステム４０１は、試料調製、および核酸シーケンシングを含む試料解析を行うように構成される。

コンピュータシステム４０１は、中央処理装置（ＣＰＵ、本明細書において「プロセッサー」および「コンピュータプロセッサー」とも）４０５を含み、これは、シングルコアもしくはマルチコアプロセッサー、または並列処理のための複数のプロセッサーであり得る。コンピュータシステム４０１はまた、メモリーまたはメモリー場所４１０（例えば、ランダムアクセスメモリー、読み取り専用メモリー、フラッシュメモリー）、電子ストレージユニット４１５（例えば、ハードディスク）、１つまたは複数の他のシステムと通信するための通信インターフェース４２０（例えば、ネットワークアダプター）、ならびに周辺デバイス４２５、例えば、キャッシュ、他のメモリー、データストレージ、および／もしくは電子ディスプレイアダプターも含む。メモリー４１０、ストレージユニット４１５、インターフェース４２０、および周辺デバイス４２５は、通信ネットワークまたはバス（実線）、例えば、マザーボードを通じて、ＣＰＵ４０５と通信する。ストレージユニット４１５は、データを保存するためのデータストレージユニット（またはデータリポジトリ）であり得る。コンピュータシステム４０１は、通信インターフェース４２０を利用して、コンピュータネットワーク４３０に作動可能にカップリングされ得る。コンピュータネットワーク４３０は、Ｉｎｔｅｒｎｅｔ、インターネットおよび／もしくはエクストラネット、またはＩｎｔｅｒｎｅｔと通信するイントラネットおよび／もしくはエクストラネットであり得る。コンピュータネットワーク４３０は、一部の場合には、電気通信および／またはデータネットワークである。コンピュータネットワーク４３０は、クラウドコンピューティングなどの分散型コンピューティングを可能にすることができる、１つまたは複数のコンピュータサーバーを含み得る。コンピュータネットワーク４３０は、一部の場合には、コンピュータシステム４０１を利用して、コンピュータシステム４０１にカップリングされたデバイスが、クライアントまたはサーバーとして挙動することを可能にし得る、ピアツーピアネットワークを実装することができる。

ＣＰＵ４０５は、プログラムまたはソフトウェアで具現化され得る、一連の機械可読命令を実行することができる。命令は、メモリー４１０などのメモリー場所に保存され得る。ＣＰＵ４０５によって実施される操作の例としては、フェッチ、復号、実行、およびライトバックを挙げることができる。

ストレージユニット４１５は、ドライバー、ライブラリー、およびセーブしたプログラムなど、ファイルを保存することができる。ストレージユニット４１５は、ユーザーによって生成されたプログラムおよび記録されたセッション、ならびにプログラムと関連する出力を保存することができる。ストレージユニット４１５は、ユーザーデータ、例えば、ユーザーの好みおよびユーザープログラムを保存することができる。コンピュータシステム４０１は、一部の場合には、コンピュータシステム４０１に対して外部にある、例えば、イントラネットまたはＩｎｔｅｒｎｅｔを通じてコンピュータシステム４０１と通信するリモートサーバーに位置付けられた、１つまたは複数の追加のデータストレージユニットを含み得る。データは、例えば、通信ネットワークまたは物理的データ転送を使用して（例えば、ハードドライブ、サムドライブ、または他のデータストレージ機構を使用して）、１つの場所から別の場所へと転送され得る。

コンピュータシステム４０１は、ネットワーク４３０を通じて、１つまたは複数のリモートコンピュータシステムと通信することができる。実施形態について、コンピュータシステム４０１は、ユーザー（例えば、オペレーター）のリモートコンピュータシステムと通信し得る。リモートコンピュータシステムの例としては、パーソナルコンピュータ（例えば、携帯型ＰＣ）、スレートもしくはタブレットＰＣ（例えば、Ａｐｐｌｅ（登録商標）のｉＰａｄ（登録商標）、Ｓａｍｓｕｎｇ（登録商標）のＧａｌａｘｙＴａｂ）、電話、スマートフォン（例えば、Ａｐｐｌｅ（登録商標）のｉＰｈｏｎｅ（登録商標）、Ａｎｄｒｏｉｄ（登録商標）対応デバイス、Ｂｌａｃｋｂｅｒｒｙ（登録商標））、または携帯情報端末が挙げられる。ユーザーは、ネットワーク４３０を介して、コンピュータシステム４０１にアクセスすることができる。

本明細書に記載される方法は、コンピュータシステム４０１の電子ストレージ場所、例えば、メモリー４１０または電子ストレージユニット４１５などに保存された、機械（例えば、コンピュータプロセッサー）実行可能なコードを用いて実装され得る。機械実行可能または機械可読コードは、ソフトウェアの形態で提供され得る。使用の際、コードが、プロセッサー４０５によって実行され得る。一部の場合では、コードは、ストレージユニット４１５から取り出され、プロセッサー４０５による即時アクセスのために、メモリー４１０に保存され得る。一部の状況では、電子ストレージユニット４１５は、除外され得、機械実行可能命令は、メモリー４１０に保存される。

ある態様では、本開示は、少なくとも１つの電子プロセッサーによって実行されると、ａ）試料を、第１の部分試料および第２の部分試料を含む複数の部分試料に分配するステップであって、第１の部分試料が、第２の部分試料よりも高い割合でシトシン改変を有するＤＮＡを含む、ステップと、ｂ）第２の部分試料を、第２の部分試料のＤＮＡ内の第１の核酸塩基に対してＤＮＡ内の第２の核酸塩基とは異なって影響を及ぼす手順に供するステップであって、第１の核酸塩基が改変または非改変核酸塩基であり、第２の核酸塩基が第１の核酸塩基とは異なる改変または非改変核酸塩基であり、第１の核酸塩基および第２の核酸塩基が同じ塩基対形成特異性を有し、それによって処置された部分試料を産生するステップと、ｃ）処置された部分試料から、エピジェネティック標的領域を含む標的領域セットを捕捉するステップと、ｄ）標的領域セット中のＤＮＡおよび第１の部分試料に由来するＤＮＡをシーケンシングするステップであって、第２の部分試料に由来するＤＮＡが、標的領域セットのＤＮＡ内の第１の核酸塩基を第２の核酸塩基と識別する様式でシーケンシングされる、ステップとを含む方法の少なくとも一部分を実行するコンピュータ実行可能命令を含む、非一時的コンピュータ可読媒体を提供する。ある態様では、本開示は、少なくとも１つの電子プロセッサーによって実行されると、ａ）試料から、エピジェネティック標的領域を含む標的領域セットを捕捉するステップと、ｂ）標的領域セットを、第１の部分試料および第２の部分試料を含む複数の部分試料に分配するステップであって、第１の部分試料が、第２の部分試料よりも高い割合でシトシン改変を有するＤＮＡを含む、ステップと、ｃ）第２の部分試料を、第２の部分試料のＤＮＡ内の第１の核酸塩基に対してＤＮＡ内の第２の核酸塩基とは異なって影響を及ぼす手順に供するステップであって、第１の核酸塩基が改変または非改変核酸塩基であり、第２の核酸塩基が第１の核酸塩基とは異なる改変または非改変核酸塩基であり、第１の核酸塩基および第２の核酸塩基が、同じ塩基対形成特異性を有し、それによって処置された部分試料を産生するステップと、ｄ）第１の部分試料に由来するＤＮＡおよび第２の部分試料に由来するＤＮＡをシーケンシングするステップであって、第２の部分試料に由来するＤＮＡが、標的領域セットのＤＮＡ内の第１の核酸塩基を第２の核酸塩基と識別する様式でシーケンシングされる、ステップとを含む方法の少なくとも一部分を実行するコンピュータ実行可能命令を含む、非一時的コンピュータ可読媒体を提供する。ある態様では、本開示は、少なくとも１つの電子プロセッサーによって実行されると、ａ）試料を、第１の部分試料および第２の部分試料を含む複数の部分試料に分配するステップであって、第１の部分試料が、第２の部分試料よりも高い割合でシトシン改変を有するＤＮＡを含む、ステップと、ｂ）第２の部分試料を、第２の部分試料のＤＮＡ内の第１の核酸塩基に対してＤＮＡ内の第２の核酸塩基とは異なって影響を及ぼす手順に供するステップであって、第１の核酸塩基が改変または非改変核酸塩基であり、第２の核酸塩基が第１の核酸塩基とは異なる改変または非改変核酸塩基であり、第１の核酸塩基および第２の核酸塩基が同じ塩基対形成特異性を有し、それによって処置された部分試料を産生するステップと、ｃ）処置された部分試料に由来するＤＮＡおよび第１の部分試料に由来するＤＮＡを、標的領域セットのＤＮＡ内の第１の核酸塩基を第２の核酸塩基と識別する様式でシーケンシングするステップとを含む方法の少なくとも一部分を実行するコンピュータ実行可能命令を含む、非一時的コンピュータ可読媒体を提供する。一部の実施形態では、方法は、核酸シーケンサーによってシーケンシングから生成された複数の配列読み取りデータを取得するステップと、複数の配列読み取りデータを、１つまたは複数の参照配列にマッピングして、マッピングされた配列読み取りデータを生成するステップと、マッピングされた配列読み取りデータをプロセシングして、対象ががんを有する可能性を決定するステップとをさらに含む。

コードは、事前にコンパイルされ、コードを実行するように適合させたプロセッサーを有する機械と共に使用するように構成することができ、または実行時間の間にコンパイルすることができる。コードは、コードが、事前にコンパイルされた、またはコンパイルされた通りに実行することが可能となるように選択することができるプログラミング言語で供給することができる。

本明細書に提供されるシステムおよび方法の態様、例えばコンピュータシステム４０１は、プログラミングにおいて具体化することができる。テクノロジーの様々な態様は、典型的に、機械可読媒体の１つのタイプにおいて実行または具体化される機械（またはプロセッサー）実行可能コードおよび／または関連データの形態の「生成物」または「製造品」であると考えられ得る。機械実行可能コードは、電子ストレージユニット、そのようなメモリー（例えば、読み取り専用メモリー、ランダムアクセスメモリー、フラッシュメモリー）またはハードディスクに保存することができる。「ストレージ」型の媒体は、ソフトウェアプログラミングのためにいついかなる時にも非一時的ストレージを提供し得るコンピュータの有形メモリー、プロセッサーなど、またはその関連するモジュール、例えば様々な半導体メモリー、テープドライブ、ディスクドライブなどのいずれかまたは全てを含み得る。

ソフトウェアの全てまたは一部は、時に、Ｉｎｔｅｒｎｅｔまたは様々な他の電気通信ネットワークを通して通信され得る。そのような通信は、例えば、１つのコンピュータまたはプロセッサーからのソフトウェアを別のコンピュータまたはプロセッサーにロードすること、例えば管理サーバーまたはホストコンピュータからアプリケーションサーバーのコンピュータプラットフォームにロードすることを可能にし得る。このように、ソフトウェア要素を有し得る別のタイプの媒体は、光波、電波、および電磁波、例えば有線および光学的固定電話ネットワーク、ならびに様々なエアリンクを通してローカルデバイス間の物理的インターフェースを越えて使用される媒体を含む。そのような波動を伝える物理的要素、例えば有線または無線リンク、光学的リンクなどもまた、ソフトウェアを有する媒体であると考えられ得る。本明細書で使用される場合、非一時的有形「ストレージ」媒体に限定されない限り、コンピュータまたは機械「可読媒体」などの用語は、実行のためにプロセッサーに命令を提供することに関与する任意の媒体を指す。

したがって、機械可読媒体、例えばコンピュータ実行可能コードは、これらに限定されないが有形ストレージ媒体、搬送波媒体、または物理的伝送媒体を含む多くの形態をとり得る。不揮発性ストレージ媒体は、図面に示されるように、例えば、光学または磁気ディスク、例えば任意のコンピュータなどにおけるストレージデバイスのいずれか、例えばデータベースをインプリメントするために使用され得るものなどを含む。揮発性ストレージ媒体は、ダイナミックメモリー、例えばそのようなコンピュータプラットフォームのメインメモリーを含む。有形伝送媒体は、同軸ケーブル；コンピュータシステム内のバスを含むワイヤーを含む銅線および光ファイバーを含む。搬送波伝送媒体は、電気もしくは電磁シグナル、または音波もしくは光波の形態、例えば高周波（ＲＦ）および赤外線（ＩＲ）データ通信の間に生成される形態をとり得る。したがって、コンピュータ可読媒体の一般的な形態は、例えば、フロッピー（登録商標）ディスク、フレキシブルディスク、ハードディスク、磁気テープ、任意の他の磁気媒体、ＣＤ－ＲＯＭ、ＤＶＤもしくはＤＶＤ－ＲＯＭ、任意の他の光学媒体、パンチカード、紙テープ、穴パターンを有する任意の他の物理的ストレージ媒体、ＲＡＭ、ＲＯＭ、ＰＲＯＭおよびＥＰＲＯＭ、ＦＬＡＳＨ－ＥＰＲＯＭ、任意の他のメモリーチップもしくはカートリッジ、搬送波輸送データもしくは命令、そのような搬送波を輸送するケーブルもしくはリンク、またはそこからコンピュータがプログラミングコードおよび／もしくはデータを読み取り得る任意の他の媒体を含む。コンピュータ可読媒体のこれらの形態の多くは、実行のためにプロセッサーに１つまたは複数の命令の１つまたは複数のシーケンスを伝えることに関係し得る。

コンピュータシステム４０１は、例えば、試料解析の１つまたは複数の結果を提供するための、ユーザーインターフェース（ＵＩ）４４０を含む、電子ディスプレイ４３５を含むか、またはそれと通信し得る。ＵＩの例としては、グラフィカルユーザーインターフェース（ＧＵＩ）およびウェブに基づくユーザーインターフェースが挙げられるが、これらに限定されない。

コンピュータシステムおよびネットワーク、データベース、ならびにコンピュータプログラム生成物に関する追加の詳細はまた、例えば、その各々の全体がこれにより参照により本明細書に組み込まれる、Peterson, Computer Networks: A Systems Approach, Morgan Kaufmann, 5th Ed. (2011), Kurose, Computer Networking: A Top-Down Approach, Pearson, 7^th Ed. (2016), Elmasri, Fundamentals of Database Systems, Addison Wesley, 6th Ed. (2010), Coronel, Database Systems: Design, Implementation, & Management, Cengage Learning, 11^th Ed. (2014), Tucker, Programming Languages, McGraw-Hill Science/Engineering/Math, 2nd Ed. (2006)、およびRhoton, Cloud Computing Architected: Solution Design Handbook, Recursive Press(2011)にも提供されている。
Ｇ．応用
１．がんおよび他の疾患

本方法は、対象における状態、特に、がんの存在を診断するため、状態を特徴付ける（例えば、がんをステージ分類するかまたはがんの不均一性を決定する）ため、状態の処置に対する応答をモニタリングするため、状態を発症するリスクまたは状態の後続の経過の予後判定を達成するために、使用することができる。本開示はまた、特定の処置選択肢の有効性を決定するのにも有用であり得る。奏功した処置選択肢では、処置が成功している場合、より多くのがんが死滅し、ＤＮＡが脱落し得るため、対象の血液中で検出されるコピー数変異または希少な突然変異の量が増加し得る。他の例では、これは生じない場合がある。別の例では、おそらくはある特定の処置選択肢は、経時的に、がんの遺伝子プロファイルと相関付けられ得る。この相関性は、治療を選択するのに有用であり得る。一部の実施形態では、高メチル化可変エピジェネティック標的領域は、それらが、腫瘍細胞もしくは通常はｃｆＤＮＡに有意に寄与しない細胞の高メチル化特徴を示すかどうかを決定する、および／または低メチル化可変エピジェネティック標的領域は、それらが、腫瘍細胞もしくは通常はｃｆＤＮＡに有意に寄与しない細胞の低メチル化特徴を示すかどうかを決定するために解析される。

さらに、がんが処置後に寛解期にあることが観察される場合、本方法を使用して、残存疾患または疾患の再発をモニタリングすることができる。

一部の実施形態では、本明細書に開示される方法およびシステムを使用して、核酸変異体が体細胞または生殖系列起源であるという分類に基づいて、患者における所定の疾患または状態を処置するためのカスタマイズされたまたは標的化治療を同定してもよい。典型的に、検討中の疾患は、あるタイプのがんである。そのようながんの非限定的な例としては、胆管がん、膀胱がん、移行上皮癌、尿路上皮癌、脳がん、神経膠腫、星細胞腫、乳癌、化生癌、子宮頸がん、子宮頸部扁平上皮癌、直腸がん、結腸直腸癌、結腸がん、遺伝性非ポリポーシス大腸がん、結腸直腸腺癌、消化管間質腫瘍（ＧＩＳＴ）、子宮内膜癌、子宮内膜間質肉腫、食道がん、食道扁平上皮癌、食道腺癌、眼内黒色腫、ぶどう膜黒色腫、胆嚢癌、胆嚢腺癌、腎細胞癌、明細胞腎細胞癌、移行上皮癌、尿路上皮癌、ウィルムス腫瘍、白血病、急性リンパ球性白血病（ＡＬＬ）、急性骨髄性白血病（ＡＭＬ）、慢性リンパ球性白血病（ＣＬＬ）、慢性骨髄性白血病（ＣＭＬ）、慢性骨髄単球性白血病（ＣＭＭＬ）、肝臓がん、肝臓癌、肝腫、肝細胞癌、胆管癌、肝芽腫、肺がん、非小細胞肺がん（ＮＳＣＬＣ）、中皮腫、Ｂ細胞リンパ腫、非ホジキンリンパ腫、びまん性大細胞型Ｂ細胞リンパ腫、マントル細胞リンパ腫、Ｔ細胞リンパ腫、非ホジキンリンパ腫、前駆Ｔリンパ芽球性リンパ腫／白血病、末梢性Ｔ細胞リンパ腫、多発性骨髄腫、鼻咽頭癌（ＮＰＣ）、神経芽腫、中咽頭がん、口腔扁平上皮癌、骨肉腫、卵巣癌、膵臓がん、膵管腺癌、偽乳頭状腫瘍、膵腺房細胞癌、前立腺がん、前立腺腺癌、皮膚がん、黒色腫、悪性黒色腫、皮膚黒色腫、小腸癌、胃がん、胃癌、消化管間質腫瘍（ＧＩＳＴ）、子宮がん、または子宮肉腫が挙げられる。がんのタイプおよび／またはステージは、突然変異、まれな突然変異、インデル、コピー数変異、塩基転換、転座、逆位、欠失、異数性、部分的異数性、倍数性、染色体不安定性、染色体構造の変更、遺伝子融合、染色体融合、遺伝子トランケーション、遺伝子増幅、遺伝子重複、染色体病変、ＤＮＡ病変、核酸化学修飾の異常な変化、エピジェネティックパターンの異常な変化、および核酸５－メチルシトシンの異常な変化を含む遺伝的変異から検出することができる。

遺伝子データはまた、がんの特定の形態を特徴付けるためにも使用することができる。がんはしばしば、組成およびステージ分類の両方が不均一である。遺伝子プロファイルデータは、その特定のサブタイプの診断または処置において重要であり得るがんの特定のサブタイプの特徴付けを可能にし得る。この情報はまた、がんの特定のタイプの予後に関する手がかりを対象または従事者に提供し、対象または従事者は、疾患の進行に従って処置選択肢を適合させることを可能にし得る。一部のがんは、進行してより侵襲性となり、遺伝的に不安定となり得る。他のがんは、良性、不活性、または休眠中のままであり得る。本開示のシステムおよび方法は、疾患進行を決定するために有用であり得る。

本方法を使用して、不均一な疾患における異なる細胞に由来する遺伝情報の要約であるデータのフィンガープリントまたはセットを作成またはプロファイリングすることができる。このデータのセットは、コピー数変異、エピジェネティック変異、および突然変異解析を単独または組み合わせて含み得る。

本方法を使用して、がんまたは他の疾患を診断、予後判定、モニタリング、または観察することができる。一部の実施形態では、本明細書の方法は、胎児を診断することも、予後判定することも、モニタリングすることも伴わず、そのため、非侵襲性の出生前検査を対象としない。他の実施形態では、これらの方法論を、妊娠中の対象に用いて、そのＤＮＡおよび他のポリヌクレオチドが、母体の分子と共循環し得るまだ生まれていない対象におけるがんまたは他の疾患を診断、予後判定、モニタリング、または観察してもよい。

本明細書に開示される方法およびシステムを使用して必要に応じて評価される他の遺伝子に基づく疾患、障害、または状態の非限定的な例としては、軟骨無形成症、アルファ－１アンチトリプシン欠乏症、抗リン脂質抗体症候群、自閉症、常染色体優性多発性嚢胞腎、シャルコー－マリー－トゥース病（ＣＭＴ）、クリデュチャット病、クローン病、嚢胞性線維症、ダーカム病、ダウン症候群、デュアン症候群、デュシェンヌ型筋ジストロフィー、第Ｖ因子ライデン血栓形成傾向、家族性高コレステロール血症、家族性地中海熱、脆弱Ｘ症候群、ゴーシェ病、ヘモクロマトーシス、血友病、全前脳胞症、ハンチントン病、クラインフェルター症候群、マルファン症候群、筋強直性ジストロフィー、神経線維腫症、ヌーナン症候群、骨形成不全症、パーキンソン病、フェニルケトン尿症、ポーランド症候群、ポルフィリン症、早老症、網膜色素変性症、重度複合免疫不全（ＳＣＩＤ）、鎌状赤血球症、脊髄性筋萎縮症、テイサックス病、サラセミア、トリメチルアミン尿症、ターナー症候群、口蓋心臓顔面症候群、ＷＡＧＲ症候群、ウィルソン病などが挙げられる。

一部の実施形態では、本明細書に記載される方法は、本明細書に記載されるように得られた配列情報のセットを使用してがんを有することが以前に診断された対象の以前のがん処置後の予め選択した時点で、腫瘍細胞を起源とするまたは腫瘍細胞に由来するＤＮＡの存在または非存在を検出するステップを含む。方法は、試験対象に関して腫瘍細胞を起源とするまたは腫瘍細胞に由来するＤＮＡの存在または非存在を示すがん再発スコアを決定するステップをさらに含み得る。

がん再発スコアが決定される場合、これをさらに使用してがん再発ステータスを決定してもよい。例えば、がん再発スコアが既定の閾値より上である場合、がん再発ステータスは、がん再発のリスクがあり得る。例えば、がん再発スコアが既定の閾値より上である場合、がん再発ステータスは、がんの再発のリスクが低いまたはより低いリスクであり得る。特定の実施形態では、既定の閾値に等しいがん再発スコアは、がん再発のリスクがあるか、またはがん再発のリスクが低いもしくはより低いリスクであるいずれかのがん再発ステータスをもたらし得る。

一部の実施形態では、がん再発スコアを既定のがん再発閾値と比較し、がん再発スコアががん再発閾値より上である場合、試験対象はその後のがん処置の候補であると分類され、がん再発スコアががん再発閾値より下である場合、試験対象は治療の候補ではないと分類される。特定の実施形態では、がん再発閾値に等しいがん再発スコアは、その後のがん処置の候補であるか、または治療の候補ではないといういずれかの分類をもたらし得る。

上記で考察した方法は、試験対象におけるがん再発のリスクを決定するおよび／または試験対象がその後のがん処置の候補であると分類する方法に関する節を含む、本明細書の他所で記載した任意の適合性の特色（単数または複数）をさらに含み得る。
２．試験対象におけるがん再発のリスクを決定するおよび／または試験対象がその後のがん処置の候補であると分類する方法

一部の実施形態では、本明細書に提供される方法は、試験対象におけるがん再発のリスクを決定する方法である。一部の実施形態では、本明細書に提供される方法は、試験対象をその後のがん処置の候補であると分類する方法である。

そのような方法のいずれかは、試験対象に対する１つまたは複数の以前のがん処置の後の１つまたは複数の事前に選択された時点で、がんを有すると診断された試験対象からＤＮＡ（例えば、腫瘍細胞を起源とするまたは腫瘍細胞に由来する）を収集するステップを含み得る。対象は、本明細書に記載される対象のいずれかであり得る。ＤＮＡはｃｆＤＮＡであり得る。ＤＮＡは、組織試料から得られ得る。

そのような方法のいずれかは、対象のＤＮＡから複数の標的領域のセットを捕捉するステップであって、複数の標的領域セットが、配列可変標的領域セットおよびエピジェネティック標的領域セットを含み、それによって捕捉されたＤＮＡ分子のセットが産生される、ステップを含み得る。捕捉するステップは、本明細書の他所で記載される実施形態のいずれかに従って実施され得る。

そのような方法のいずれかにおいて、以前のがん処置は、手術、治療組成物の投与、および／または化学療法を含み得る。

そのような方法のいずれかは、捕捉されたＤＮＡ分子をシーケンシングすることであって、それによって配列情報のセットが産生されることを含み得る。配列可変標的領域セットの捕捉されたＤＮＡ分子は、エピジェネティック標的領域セットの捕捉されたＤＮＡ分子よりもシーケンシングの大きい深度までシーケンシングされ得る。

そのような方法のいずれかは、配列情報のセットを使用して事前に選択した時点で腫瘍細胞を起源とするまたは腫瘍細胞に由来するＤＮＡの存在または非存在を検出するステップを含み得る。腫瘍細胞を起源とするまたは腫瘍細胞に由来するＤＮＡの存在または非存在の検出は、本明細書の他所で記載されるその実施形態のいずれかに従って実施され得る。

試験対象においてがん再発のリスクを決定する方法は、試験対象の腫瘍細胞を起源とするまたは腫瘍細胞に由来するＤＮＡの存在もしくは非存在、または量を示すがん再発スコアを決定するステップを含み得る。がん再発スコアをさらに使用して、がん再発ステータスを決定してもよい。がん再発ステータスは、例えばがん再発スコアが既定の閾値より上である場合、がん再発のリスクがあり得る。がん再発ステータスは、例えばがん再発スコアが既定の閾値より上である場合、がん再発のリスクが低いまたはより低いリスクであり得る。特定の実施形態では、既定の閾値に等しいがん再発スコアは、がん再発のリスクがあるか、またはがん再発のリスクが低いもしくはより低いリスクであるいずれかのがん再発ステータスをもたらし得る。

試験対象をその後のがん処置の候補であると分類する方法は、試験対象のがん再発スコアを既定のがん再発閾値と比較して、それによってがん再発スコアががん再発閾値より上である場合、試験対象をその後のがん処置の候補であると分類するステップ、またはがん再発スコアががん再発閾値より下である場合、治療の候補ではないと分類するステップを含み得る。特定の実施形態では、がん再発閾値に等しいがん再発スコアは、その後のがん処置の候補であるか、または治療の候補ではないといういずれかの分類をもたらし得る。一部の実施形態では、その後のがん処置は、化学療法または治療組成物の投与を含む。

そのような方法のいずれかは、がん再発スコアに基づいて試験対象の無病生存（ＤＦＳ）期間を決定するステップを含み得、例えば、ＤＦＳ期間は、１年、２年、３年、４年、５年、または１０年であり得る。

一部の実施形態では、配列情報のセットは、配列可変標的領域配列を含み、がん再発スコアを決定するステップは、配列可変標的領域配列に存在するＳＮＶ、挿入／欠失、ＣＮＶ、および／または融合の量を示す少なくとも第１のサブスコアを決定するステップを含み得る。

一部の実施形態では、１個、２個、３個、４個、または５個から選択される配列可変標的領域における突然変異の数は、第１のサブスコアが、がん再発に関して陽性であると分類されるがん再発スコアをもたらすために十分である。一部の実施形態では、突然変異の数は、１個、２個、または３個から選択される。

一部の実施形態では、配列情報のセットは、エピジェネティック標的領域配列を含み、がん再発スコアを決定することは、健康な対象に由来する対応する試料において見出されるＤＮＡ（例えば、健康な対象に由来する血液試料において見出されるｃｆＤＮＡ、または健康な対象に由来する組織試料において見出されるＤＮＡ、組織試料は、試験対象から得られたものと同じタイプの組織のものである）とは異なるエピジェネティック状態を表す分子（エピジェネティック標的領域配列から得られる）の量を示す、第２の部分スコアを決定することを含む。これらの異常な分子（すなわち、健康な対象に由来する対応する試料において見出されるＤＮＡとは異なるエピジェネティック状態を有する分子）は、がんと関連するエピジェネティック変化、例えば、高メチル化可変標的領域のメチル化、および／または断片化可変標的領域の断片化の乱れと一致し得、ここで、「乱れ」は、健康な対象に由来する対応する試料において見出されるＤＮＡとは異なることを意味する。

一部の実施形態では、０．００１％～１０％の範囲の値よりも大きいまたはそれに等し、高メチル化可変標的領域セットにおける高メチル化および／または断片化可変標的領域セットにおける異常な断片化を示す高メチル化可変標的領域セットおよび／または断片化可変標的領域セットに対応する分子の割合は、第２の部分スコアががん再発に関して陽性として分類されるのに十分である。範囲は、０．００１％～１％、０．００５％～１％、０．０１％～５％、０．０１％～２％、または０．０１％～１％であり得る。

一部の実施形態では、そのような方法のいずれかは、腫瘍細胞からの起源を示す１つまたは複数の特色を示す配列情報のセット中の分子の分画から腫瘍ＤＮＡの分画を決定するステップを含み得る。これは、例えば、高メチル化可変標的領域および断片化可変標的領域（高メチル化可変標的領域の高メチル化および／または断片化可変標的領域の異常な断片化は、腫瘍細胞からの起源を示すと考えられ得る）の一方または両方を含む、エピジェネティック標的領域の一部または全てに対応する分子について行われ得る。これは、配列可変標的領域に対応する分子、例えばがんと一貫する変更、例えばＳＮＶ、インデル、ＣＮＶ、および／また融合を含む分子について行われ得る。腫瘍ＤＮＡの分画は、エピジェネティック標的領域に対応する分子および配列可変標的領域に対応する分子の組合せに基づいて決定され得る。

がん再発スコアの決定は、腫瘍ＤＮＡの分画に少なくとも部分的に基づき得、１０^－１１～１または１０^－１０～１の範囲の閾値よりも大きい腫瘍ＤＮＡの分画は、がん再発スコアががん再発に関して陽性であると分類されるために十分である。一部の実施形態では、１０^－１０～１０^－９、１０^－９～１０^－８、１０^－８～１０^－７、１０^－７～１０^－６、１０^－６～１０^－５、１０^－５～１０^－４、１０^－４～１０^－３、１０^－３～１０^－２、または１０^－２～１０^－１の範囲の閾値よりも大きいまたはそれに等しい腫瘍ＤＮＡの分画は、がん再発スコアが、がん再発に関して陽性であると分類されるために十分である。一部の実施形態では、少なくとも１０^－７の閾値よりも大きい腫瘍ＤＮＡの分画は、がん再発スコアが、がん再発に関して陽性であると分類されるために十分である。腫瘍ＤＮＡの分画が閾値、例えば前述の実施形態のいずれかに対応する閾値よりも大きいという決定は、累積確率に基づいて行われ得る。例えば、試料は、腫瘍分画が前述の範囲のいずれかにおける閾値よりも大きい累積確率が、少なくとも０．５、０．７５、０．９、０．９５、０．９８、０．９９、０．９９５、または０．９９９の確率閾値を超える場合に陽性であるとみなされた。一部の実施形態では、確率閾値は、少なくとも０．９５、例えば０．９９である。

一部の実施形態では、配列情報のセットは、配列可変標的領域配列およびエピジェネティック標的領域配列を含み、がん再発スコアを決定するステップは、配列可変標的領域配列に存在するＳＮＶ、挿入／欠失、ＣＮＶおよび／または融合の量を示す第１のサブスコア、ならびにエピジェネティック標的領域配列中の異常な分子の量を示す第２のサブスコアを決定するステップ、ならびに第１および第２のサブスコアを組み合わせてがん再発スコアを提供するステップを含む。第１および第２のサブスコアを組み合わせる場合、それらを、独立して各サブスコア（例えば、配列可変標的領域における既定の数の突然変異（例えば、＞１）よりも大きく、エピジェネティック標的領域中の異常な分子（すなわち、健康な対象からの対応する試料中で見出されるＤＮＡとは異なるエピジェネティック状態を有する分子、例えば腫瘍）の既定の分画よりも大きい）に閾値を適用するか、または機械学習分類器を訓練して、複数の陽性および陰性訓練試料に基づいて状態を決定することによって組み合わせてもよい。

一部の実施形態では、－４～２または－３～１の範囲の組み合わせたスコアの値は、がん再発スコアががん再発に関して陽性であると分類されるために十分である。

がん再発スコアががん再発に関して陽性であると分類される任意の実施形態では、対象のがん再発ステータスはがん再発のリスクがあり得る、および／または対象はその後のがん処置の候補であると分類され得る。

一部の実施形態では、がんは、本明細書の他所で記載されるがんのタイプのいずれか１つ、例えば結腸直腸がんである。
３．治療および関連する投与

ある特定の実施形態では、本明細書に開示される方法は、核酸変異体の状態が体細胞または生殖系列起源であることを考慮して、カスタマイズされた治療を同定すること、およびそれを患者に投与することに関する。一部の実施形態では、本質的に任意のがん治療（例えば、外科治療、放射線治療、化学療法および／またはそれと同様のもの）を、これらの方法の一部として含めてもよい。典型的に、カスタマイズされた治療は、少なくとも１つの免疫療法（または免疫療法剤）を含む。免疫療法は一般的に、所定のがんタイプに対する免疫応答を増強する方法を指す。ある特定の実施形態では、免疫療法は、腫瘍またはがんに対するＴ細胞応答を増強する方法を指す。

ある特定の実施形態では、体細胞または生殖系列起源である対象由来の試料からの核酸変異体の状態を、その対象のカスタマイズされたまたは標的化治療を同定するために参照集団からの比較器の結果のデータベースと比較してもよい。典型的に、参照集団は、試験対象と同じがんもしくは疾患タイプを有する患者、ならびに／または試験対象と同じ治療を受けているもしくは受けたことがある患者を含む。カスタマイズされたまたは標的化治療（または複数の治療）は、核酸変異体および比較器の結果がある特定の分類基準（例えば、実質的またはおおよそマッチする）を満たす場合に同定され得る。

ある特定の実施形態では、本明細書に記載されるカスタマイズされた治療は、典型的に非経口（例えば、静脈内、または皮下）投与される。免疫療法剤を含有する医薬組成物は、典型的に静脈内投与される。ある特定の治療剤は経口投与される。しかし、カスタマイズされた治療（例えば、免疫療法剤など）はまた、例えば口腔内、舌下、直腸、膣、尿道内、局所、眼内、鼻腔内、および／または耳介内などの方法によって投与されてもよく、投与は、錠剤、カプセル剤、顆粒剤、水性懸濁剤、ゲル剤、スプレー剤、坐剤、塗擦剤、軟膏剤などを含み得る。

本発明の好ましい実施形態が本明細書において示され、説明されているが、そのような実施形態が単なる例として提供されることは、当業者には明らかであろう。本発明が本明細書内に提供されている具体的な例によって制限されることは、意図されない。本発明は、前述の明細書を参照して記載されているが、本明細書における実施形態の説明および例示は、制限的な意味で解釈されることを意味するものではない。当業者であれば、本発明から逸脱することなく、多数の変化形、変更、および置換を想起するであろう。さらに、本発明の全ての態様は、本明細書において記載されている具体的な説明、構成、または相対的割合に制限されず、それらは、様々な条件および変数に依存することを理解すべきである。本明細書に記載される本開示の実施形態に対する様々な代替形態を、本開示の実施に用いることができることを理解すべきである。したがって、本開示はまた、任意のそのような代替形態、改変形態、変動形態、または等価物を網羅するものとすることが企図される。以下の特許請求の範囲が本発明の範囲を定めること、ならびにこれらの特許請求の範囲内の方法および構造、ならびにそれらの等価物が、それによって網羅されることが意図される。

前述の開示は、明確さおよび理解の目的で、例証および例によって一部詳細に説明されているが、当業者には、本開示を読むことによって、形態および細部における様々な変化が、本開示の真の範囲から逸脱することなく行われ得、添付の特許請求の範囲内で実施され得ることは明白である。例えば、全ての方法、システム、コンピュータ可読媒体、および／または構成要素の特色、ステップ、要素、もしくはこれらの他の態様を、様々な組合せで使用することができる。
Ｈ．キット

また、本明細書に記載される組成物を含む、キットも提供される。キットは、本明細書に記載される方法を行うのに有用であり得る。一部の実施形態では、キットは、本明細書に記載されるように、試料を複数の部分試料に分配するための第１の試薬、例えば、本明細書の他の箇所に記載される分配試薬のいずれかを含む。一部の実施形態では、キットは、第１の部分試料を、第１の部分試料のＤＮＡ内の第１の核酸塩基に対してＤＮＡ内の第２の核酸塩基とは異なって影響を及ぼす手順に供するための第２の試薬を含み、ここで、第１の核酸塩基は、改変または非改変核酸塩基であり、第２の核酸塩基は、第１の核酸塩基とは異なる改変または非改変核酸塩基であり、第１の核酸塩基および第２の核酸塩基は、同じ塩基対形成特異性を有する（例えば、核酸塩基、例えば、シトシンまたはメチル化シトシンを異なる核酸塩基に変換するための本明細書の他の箇所に記載される試薬のうちのいずれか）。キットは、第１および第２の試薬、ならびに以下および／または本明細書の他の箇所において考察される追加のエレメントを含み得る。

キットは、ＡＬＫ、ＡＰＣ、ＢＲＡＦ、ＣＤＫＮ２Ａ、ＥＧＦＲ、ＥＲＢＢ２、ＦＢＸＷ７、ＫＲＡＳ、ＭＹＣ、ＮＯＴＣＨ１、ＮＲＡＳ、ＰＩＫ３ＣＡ、ＰＴＥＮ、ＲＢＩ、ＴＰ５３、ＭＥＴ、ＡＲ、ＡＢＬｌ、ＡＫＴｌ、ＡＴＭ、ＣＤＨｌ、ＣＳＦＩＲ、ＣＴＮＮＢｌ、ＥＲＢＢ４、ＥＺＨ２、ＦＧＦＲｌ、ＦＧＦＲ２、ＦＧＦＲ３、ＦＬＴ３、ＧＮＡ１１、ＧＮＡＱ、ＧＮＡＳ、ＨＮＦ１Ａ、ＨＲＡＳ、ＩＤＨ１、ＩＤＨ２、ＪＡＫ２、ＪＡＫ３、ＫＤＲ、ＫＩＴ、ＭＬＨ１、ＭＰＬ、ＮＰＭ１、ＰＤＧＦＲＡ、ＰＲＯＣ、ＰＴＰＮ１１、ＲＥＴ，ＳＭＡＤ４、ＳＭＡＲＣＢ１、ＳＭＯ、ＳＲＣ、ＳＴＫ１１、ＶＨＬ、ＴＥＲＴ、ＣＣＮＤ１、ＣＤＫ４、ＣＤＫＮ２Ｂ、ＲＡＦ１、ＢＲＣＡ１、ＣＣＮＤ２、ＣＤＫ６、ＮＦ１、ＴＰ５３、ＡＲＩＤ１Ａ、ＢＲＣＡ２、ＣＣＮＥ１、ＥＳＲ１、ＲＩＴ１、ＧＡＴＡ３、ＭＡＰ２Ｋ１、ＲＨＥＢ、ＲＯＳ１、ＡＲＡＦ、ＭＡＰ２Ｋ２、ＮＦＥ２Ｌ２、ＲＨＯＡ、およびＮＴＲＫｌからなる群から選択される少なくとも５個、６個、７個、８個、９個、１０個、２０個、３０個、４０個、または全ての遺伝子に選択的にハイブリダイズする、複数のオリゴヌクレオチドプローブをさらに含み得る。オリゴヌクレオチドプローブが選択的にハイブリダイズすることができる遺伝子の数は、変動し得る。例えば、遺伝子の数は、１個、２個、３個、４個、５個、６個、７個、８個、９個、１０個、１１個、１２個、１３個、１４個、１５個、１６個、１７個、１８個、１９個、２０個、２１個、２２個、２３個、２４個、２５個、２６個、２７個、２８個、２９個、３０個、３１個、３２個、３３個、３４個、３５個、３６個、３７個、３８個、３９個、４０個、４１個、４２個、４３個、４４個、４５個、４６個、４７個、４８個、４９個、５０個、５１個、５２個、５３個、または５４個を含み得る。キットは、複数のオリゴヌクレオチドプローブ、および本明細書に記載される方法のうちのいずれかを行うための使用説明書を含む、容器を含み得る。

オリゴヌクレオチドプローブは、遺伝子、例えば、少なくとも５個の遺伝子のエクソン領域に選択的にハイブリダイズし得る。一部の場合では、オリゴヌクレオチドプローブは、遺伝子、例えば、少なくとも５個の遺伝子の少なくとも３０個のエクソンに選択的にハイブリダイズし得る。一部の場合では、複数のプローブが、少なくとも３０個のエクソンの各々に選択的にハイブリダイズし得る。各エクソンにハイブリダイズするプローブは、少なくとも１つの他のプローブとオーバーラップする配列を有し得る。一部の実施形態では、オリゴプローブは、本明細書に開示される遺伝子の非コード領域、例えば、遺伝子のイントロン領域に選択的にハイブリダイズし得る。オリゴプローブはまた、本明細書に開示される遺伝子のエクソン領域およびイントロン領域の両方を含む遺伝子の領域に選択的にハイブリダイズし得る。

任意の数のエクソンが、オリゴヌクレオチドプローブによって標的とされ得る。例えば、少なくとも１個、２個、３個、４個、５個、６個、７個、８個、９個、１０個、１１個、１２個、１３個、１４個、１５個、１６個、１７個、１８個、１９個、２０個、２１個、２２個、２３個、２４個、２５個、３０個、３５個、４０個、４５個、５０個、５５個、６０個、６５個、７０個、７５個、８０個、８５個、９０個、９５個、１００個、１０５個、１１０個、１１５個、１２０個、１２５個、１３０個、１３５個、１４０個、１４５個、１５０個、１５５個、１６０個、１６５個、１７０個、１７５個、１８０個、１８５個、１９０個、１９５個、２００個、２０５個、２１０個、２１５個、２２０個、２２５個、２３０個、２３５個、２４０個、２４５個、２５０個、２５５個、２６０個、２６５個、２７０個、２７５個、２８０個、２８５個、２９０個、２９５個、３００個、４００個、５００個、６００個、７００個、８００個、９００個、１，０００個、またはそれよりも多くのエクソンが、標的とされ得る。

キットは、別個の分子バーコードおよび同一の試料バーコードを有する少なくとも４個、５個、６個、７個、または８個の異なるライブラリーアダプターを含み得る。ライブラリーアダプターは、シーケンシングアダプターでなくてもよい。例えば、ライブラリーアダプターは、フローセル配列またはシーケンシングのためのヘアピンループの形成を可能にする配列を含まない。異なる変異ならびに分子バーコードおよび試料バーコードの組合せが、本明細書全体を通して記載されており、キットに応用可能である。さらに、一部の例では、アダプターは、シーケンシングアダプターではない。さらに、キットに提供されるアダプターはまた、シーケンシングアダプターも含み得る。シーケンシングアダプターは、１つまたは複数のシーケンシングプライマーにハイブリダイズする配列を含み得る。シーケンシングアダプターはさらに、固体支持体にハイブリダイズする配列、例えばフローセル配列も含み得る。例えば、シーケンシングアダプターはフローセルアダプターであり得る。シーケンシングアダプターを、ポリヌクレオチド断片の一方または両方の末端に付着させることができる。一部の例では、キットは、別個の分子バーコードおよび同一の試料バーコードを有する少なくとも８個の異なるライブラリーアダプターを含み得る。ライブラリーアダプターは、シーケンシングアダプターでなくてもよい。キットはさらに、ライブラリーアダプターに選択的にハイブリダイズする第１の配列およびフローセル配列に選択的にハイブリダイズする第２の配列を有するシーケンシングアダプターも含み得る。別の例では、シーケンシングアダプターは、ヘアピン形状であり得る。例えば、ヘアピン形状のアダプターは、相補的二本鎖部分およびループ部分を含み得、二本鎖部分は、二本鎖ポリヌクレオチドに付着（例えば、ライゲーション）することができる。ヘアピン形状のシーケンシングアダプターを、ポリヌクレオチド断片の両方の末端に付着させて、環状分子を生成することができ、これを複数回シーケンシングすることができる。シーケンシングアダプターは、末端から末端まで最大１０個、１１個、１２個、１３個、１４個、１５個、１６個、１７個、１８個、１９個、２０個、２１個、２２個、２３個、２４個、２５個、２６個、２７個、２８個、２９個、３０個、３１個、３２個、３３個、３４個、３５個、３６個、３７個、３８個、３９個、４０個、４１個、４２個、４３個、４４個、４５個、４６個、４７個、４８個、４９個、５０個、５１個、５２個、５３個、５４個、５５個、５６個、５７個、５８個、５９個、６０個、６１個、６２個、６３個、６４個、６５個、６６個、６７個、６８個、６９個、７０個、７１個、７２個、７３個、７４個、７５個、７６個、７７個、７８個、７９個、８０個、８１個、８２個、８３個、８４個、８５個、８６個、８７個、８８個、８９個、９０個、９１個、９２個、９３個、９４個、９５個、９６個、９７個、９８個、９９個、１００個、またはそれより多くの塩基であり得る。シーケンシングアダプターは、末端から末端まで２０～３０個、２０～４０個、３０～５０個、３０～６０個、４０～６０個、４０～７０個、５０～６０個、５０～７０個の塩基を含み得る。特定の例では、シーケンシングアダプターは、末端から末端まで２０～３０個の塩基を含み得る。別の例では、シーケンシングアダプターは、末端から末端まで５０～６０個の塩基を含み得る。シーケンシングアダプターは、１つまたは複数のバーコードを含み得る。例えば、シーケンシングアダプターは、試料バーコードを含み得る。試料バーコードは既定の配列を含み得る。試料バーコードを使用してポリヌクレオチドの起源を同定することができる。試料バーコードは、少なくとも１個、２個、３個、４個、５個、６個、７個、８個、９個、１０個、１１個、１２個、１３個、１４個、１５個、１６個、１７個、１８個、１９個、２０個、２１個、２２個、２３個、２４個、２５個、またはそれより多くの（または本明細書全体を通して記載される任意の長さの）核酸塩基、例えば少なくとも８個の塩基であり得る。バーコードは、上記のように連続または不連続配列であり得る。

ライブラリーアダプターは、平滑末端化され、Ｙ字形状であり得、４０核酸塩基未満またはそれに等しい長さであり得る。他の変形形態は、全体を通して見出すことができ、キットに応用可能である。

本明細書に引用される全ての特許、特許出願、ウェブサイト、他の刊行物、または文書、受託番号などは、各々の個々の項目が、具体的かつ個別に、参照により組み込まれると示されるのと同程度に、あらゆる目的で、参照によりその全体が組み込まれる。配列の異なるバージョンが、異なる時間で、１つの受託番号と関連付けられている場合、本出願の有効出願日で受託番号と関連付けられているバージョンを意味する。有効出願日は、実際の出願日、または該当する場合には受託番号に言及している優先出願の出願日のうちの早い方を意味する。同様に、刊行物、ウェブサイトなどの異なるバージョンが、異なる時期に公開されている場合、別途示されない限り、本出願の有効出願日でもっとも新しく公開されているバージョンを意味する。

ＩＩＩ．実施例
以下の実施例は、開示される方法のある特定の態様を例示するために提供される。実施例は、本開示を限定するものではない。
（実施例１）
腫瘍の存在／非存在を検出するためのｃｆＤＮＡの解析

患者試料のセットを、がんの存在／非存在を検出するために、ＧｕａｒｄａｎｔＨｅａｌｔｈ（ＲｅｄｗｏｏｄＣｉｔｙ、ＣＡ、ＵＳＡ）において血液に基づくＮＧＳアッセイによって解析する。ｃｆＤＮＡを、これらの患者の血漿から抽出する。患者試料のｃｆＤＮＡを、次いで、メチル結合ドメイン（ＭＢＤ）緩衝液と組み合わせ、磁気ビーズをＭＢＤタンパク質とコンジュゲートさせ、一晩インキュベートする。メチル化ｃｆＤＮＡ（存在する場合、ｃｆＤＮＡ試料中）は、このインキュベーション中に、ＭＢＤタンパク質に結合する。非メチル化であるか、またはあまり非メチル化であるＤＮＡは、漸増濃度の塩を含有する緩衝液で、ビーズから洗い流される。最終的に、高塩緩衝液を使用して、ＭＢＤタンパク質から、高度メチル化ＤＮＡを洗い流す。これらの洗浄により、漸増メチル化ｃｆＤＮＡの３つの分配（低メチル化、残留メチル化、および高メチル化分配）が得られる。

低メチル化分配内のｃｆＤＮＡ分子は、ｍＣを、シーケンシングにおいてＴとして読み取られる塩基（ＴＡＰの場合にはＤＨＵ）に変換する、ＴＡＰなどの変換手順に供される。したがって、低メチル化分配における非特異的に分配されたＤＮＡは、中間メチル化から低メチル化を示す塩基変換を示すであろう。

必要に応じて、高メチル化分配中のｃｆＤＮＡ分子を、酵素的改変（ＥＭ）に供し、それによって、非改変シトシンは、脱アミノ化を受けるが、ｍＣおよびｈｍＣはそれを受けず、それによって、非改変シトシンからウラシルへの変換により、第１の部分試料中の非特異的に分配された低メチル化分子に印を付ける。

必要に応じて、残留分配におけるｃｆＤＮＡは、メチル化Ｃ残基を非メチル化Ｃ残基と識別し、非特異的に分配された分子（低メチル化または高メチル化分子）を同定する変換手順に供されてもよい。

３つの分配中のｃｆＤＮＡ分子は、清浄されて、塩が除去され、ライブラリー調製の酵素ステップの準備において濃縮される。分配中のｃｆＤＮＡを濃縮した後、分配されたｃｆＤＮＡの末端オーバーハングを伸長させ、アデノシン残基を、伸長中にポリメラーゼによってｃｆＤＮＡ断片の３’末端に付加する。各断片の５’末端を、リン酸化する。これらの改変により、分配されたｃｆＤＮＡがライゲーション可能となる。ＤＮＡリガーゼおよびアダプターを添加して、各分配されたｃｆＤＮＡ分子を、各末端でアダプターとライゲーションさせる。これらのアダプターは、非一意的分子バーコードを含有し、各分配を、他の分配において使用されるアダプター内のバーコードと識別可能な非一意的分子バーコードを有するアダプターとライゲーションさせる。ライゲーションの後に、４つの分配を一緒にプールし、ＰＣＲによって増幅させる。

ＰＣＲ後、増幅したＤＮＡを、富化の前に、洗浄し、濃縮する。濃縮した後、増幅したＤＮＡを、塩緩衝液ならびに配列可変標的領域セットのプローブおよびエピジェネティック標的領域セットのプローブを含むビオチン化ＲＮＡプローブと組み合わせ、この混合物を、一晩インキュベートする。配列可変領域セットのプローブは、約５０ｋｂのフットプリントを有し、エピジェネティック標的領域セットのプローブは、約５００ｋｂのフットプリントを有する。配列可変標的領域セットのプローブは、表３～５において同定される遺伝子の少なくともサブセットを標的とするオリゴヌクレオチドを含み、エピジェネティック標的領域セットのプローブは、高メチル化可変標的領域、低メチル化可変標的領域、ＣＴＣＦ結合標的領域、転写開始部位標的領域、局所増幅標的領域、およびメチル化対照領域の選択物を標的とするオリゴヌクレオチドを含む。

ビオチン化ＲＮＡプローブ（ＤＮＡにハイブリダイズしている）を、ストレプトアビジン磁気ビーズによって捕捉し、一連の塩に基づく洗浄によって捕捉されない増幅されたＤＮＡから分離し、それによって試料を富化する。富化後に、富化した試料のアリコートを、ＩｌｌｕｍｉｎａＮｏｖａＳｅｑシーケンサーを使用してシーケンシングする。シーケンサーによって生成された配列読み取りデータを、次いで、バイオインフォマティックツール／アルゴリズムを使用して解析する。分子バーコードは、一意的分子を同定するため、ならびに試料の差次的にＭＢＤ分配された分子へのデコンボリューションのために、使用する。この実施例に記載される方法は、その分配に基づく分子の全体的なメチル化（すなわち、メチル化されたシトシン残基）レベルに関する情報を提供することとは別に、メチル化シトシン（すなわち、ｍＣまたはｈｍＣ）の同一性および／または位置に関するより高い分解能の情報も提供し、それらが出現する分配との塩基変換の不一致性を示す非特異的に分配された分子の同定も可能にし得る。配列可変標的領域配列を、実際の腫瘍変異体を技術的エラー（例えば、ＰＣＲエラー、シーケンシングエラー）とは区別する十分な根拠でコールすることができるゲノム変更、例えば、ＳＮＶ、挿入、欠失、および融合を検出することによって、解析する。エピジェネティック標的領域配列を独立して解析して、例えば、可能性としてがん性の組織において、健康なｃｆＤＮＡと比較して、差次的にメチル化されることが示されている領域において、ｃｆＤＮＡ分子のメチル化状態を検出する。非特異的分配を示す塩基変換を示す分子は、正確度および／または感度を増加させるために、この解析から除外され得る。最後に、両方の解析の結果を組み合わせて、最終的な腫瘍の存在／非存在のコールを生成する。
（実施例２）
健康な対象および初期結腸直腸がんを有する対象に由来するｃｆＤＮＡ試料における単一ヌクレオチド分解能におけるメチル化の解析

健康な対象および初期結腸直腸がんを有する対象に由来するｃｆＤＮＡの試料を、以下のように解析した。ｃｆＤＮＡを、ＭＢＤを使用して分配して、高メチル化分配、中間分配、および低メチル化分配を得た。各分配の分配されたＤＮＡを、アダプターにライゲーションし、それによって非改変シトシンは脱アミノ化を受けるが、ｍＣおよびｈｍＣは受けないＥＭ－ｓｅｑ変換手順に供したが、代替的な手順では、低メチル化分配のｃｆＤＮＡ分子は、低メチル化分配における非特異的に分配されたＤＮＡが中間メチル化から高メチル化を示す塩基変換を示すように、ｍＣをシーケンシングにおいてＴとして読み取られる塩基（ＴＡＰの場合にはＤＨＵ）に変換する変換手順、例えば、ＴＡＰに供してもよい。脱アミノ化の後に、分配を、シーケンシングのために調製し、全ゲノムシーケンシングに供した。各分配を、別個にシーケンシングしたが、代替的な手順では、分配は、差次的にタグ付し（例えば、分配後でＥＭ－ｓｅｑ変換前、または分配およびＥＭ－ｓｅｑ変換後でシーケンシングのためのさらなる調製の前に）、プールし、プロセシングされ、並列してシーケンシングしてもよい。

高メチル化可変標的領域からの配列データを、バイオインフォマティクスによって単離したが、代替的な手順では、標的領域は、シーケンシングの前にｉｎｖｉｔｒｏで富化してもよい。高メチル化可変標的領域の塩基あたりのメチル化を、図５に示されるように定量し、これは、高メチル化分配に由来する高メチル化可変標的領域内の分子あたりのメチル化ＣｐＧの数を示す。ｘ軸は、分子あたりのＣｐＧの総数を示し、そのため、対角線に沿った点は、ＣｐＧごとにメチル化を有する分子を表す。したがって、メチル化を、単一塩基分解能で解析し、ＭＢＤ分配材料の塩基あたりのメチル化および部分的な分子メチル化を定量することが可能であった。結腸直腸がんを有する対象に由来する試料は、これらの領域において、健康な対象に由来する試料よりもはるかに高い全体的なメチル化を示した。
（実施例３）
非特異的に分配されたＤＮＡの消化による技術的ノイズの低減

２つの健康な正常試料に由来するｃｆＤＮＡのプールを組み合わせて、そこから１８．６ｎｇを、本明細書に記載されるＭＢＤ分配アッセイへの入力として使用した。試料のサブセットに対して、結腸直腸がん試料（ＣＲＣ）に由来するｃｆＤＮＡを、０．５％のＭＡＦ（変異型アレル分画）で添加し、０．１６％のＭＡＦを有する希釈ＣＲＣ試料を得た。正常試料および希釈ＣＲＣ試料の３つのセットを、アッセイにおいて使用した。３つのセットの試料を、次いで、ＭＢＤタンパク質を使用して、３つの分配（高分配、残留分配、および低分配）に分配した。クリーンアップ後に、各分配中のｃｆＤＮＡ分子を、分子バーコードを含む分配特異的アダプターとライゲーションさせた。

高分配および残留分配に使用する分子バーコードは、ＭＳＲＥ認識部位を有さず、そのため下流のプロセシング（ｃｆＤＮＡメチル化状態とは無関係）において消化されないように、選択する。ライゲーション後に、ライゲーションクリーンアップを行った。ライゲーションクリーンアップの後に、高および残留分配を、ＭＳＲＥ消化反応に供した。第１の試料セット（正常試料および希釈ＣＲＣ試料）を、ＢｓｔＵＩおよびＨｐａＩＩで処置し、別の試料セットを、ＢｓｔＵＩ、ＨｐａＩＩ、およびＨｉｎ６Ｉ酵素で処置した。第３の試料セットに、対照として、ＭＢＤ分配アッセイにおいて疑消化（ＭＳＲＥなし）を行った。ＭＳＲＥ消化後に、酵素を、熱不活化させ（６５℃、２０分間）、ＳＰＲＩビーズを使用してクリーンアップした。消化クリーンアップ後に、高、残留、および（非消化）低分配（アダプターライゲーションしたｃｆＤＮＡ）を組み合わせ、ＰＣＲ増幅、目的のゲノム領域における分子の富化、試料をプールし、それよって、ＮｏｖａＳｅｑを使用したプールした試料の多重シーケンシングおよびシーケンシングを可能にすることを含む、ＮＧＳアッセイワークフローを進めた。

図６は、ＭＳＲＥ消化を適用した場合に、正常試料中の非メチル化分子からの技術的ノイズと比較してＤＭＲでのがんメチル化シグナルの増加を明らかに示す。図６で示される陰性対照領域（ＤＮＡ分子が疾患状態によらず、ほぼ全ての時間で非メチル化である）では、「ａ」は、ＭＳＲＥ消化が高分配に誤って分配された非メチル化分子を除去することが明白であったことを明らかに示し、すなわち９０個の分子が、偽消化では高分配に分配されたが、ＢｓｔＵＩ、ＨｐａＩＩ、およびＨｉｎ６Ｉ消化では、分子数は１０個に低減された。図６に示される分類ＤＭＲでは、ｃｆＤＮＡ分子は、ＭＳＲＥによる消化により正常試料（ｂ；３５０→１００）では希釈したＣＲＣ試料（ｃ；１５００→１１００）よりもかなり高い割合で除去された。

本明細書の他の箇所に記載されるように、低分配（第２の部分試料）は、例えば、低メチル化分配における非特異的に分配されたＤＮＡが、中間メチル化から高メチル化を示す塩基変換を示すように、ｍＣを、シーケンシングにおいてＴとして読み取られる塩基（ＴＡＰの場合にはＤＨＵ）に変換するＴＡＰなど、第２の部分試料のＤＮＡ内の第１の核酸塩基に対してＤＮＡ内の第２の核酸塩基とは異なって影響を及ぼす手順に供され得、第１の核酸塩基は、改変または非改変核酸塩基であり、第２の核酸塩基は、第１の核酸塩基とは異なる改変または非改変核酸塩基であり、第１の核酸塩基および第２の核酸塩基は、同じ塩基対形成特異性を有する。手順は、例えば、分配の後および／もしくは分配特異的アダプターのライゲーションの前、または本明細書の他の箇所に記載される任意の他の適切な段階で、使用され得る。

本発明の好ましい実施形態が本明細書において示され、説明されているが、そのような実施形態が単なる例として提供されることは、当業者には明らかであろう。本発明が本明細書内に提供されている具体的な実施例によって制限されることは、意図されない。本発明は、前述の明細書を参照して記載されているが、本明細書における実施形態の説明および例示は、制限的な意味で解釈されることを意味するものではない。当業者であれば、本発明から逸脱することなく、多数の変化形、変更、および置換を想起するであろう。さらに、本発明の全ての態様は、本明細書において記載されている具体的な説明、構成、または相対的割合に制限されず、それらは、様々な条件および変数に依存することを理解すべきである。本明細書に記載される本開示の実施形態に対する様々な代替形態を、本開示の実施に用いることができることを理解すべきである。したがって、本開示はまた、任意のそのような代替形態、改変形態、変動形態、または等価物を網羅するものとすることが企図される。以下の特許請求の範囲が本発明の範囲を定めること、ならびにこれらの特許請求の範囲内の方法および構造、ならびにそれらの等価物が、それによって網羅されることが意図される。

前述の開示は、明快にするためおよび理解目的のために、例証および例によって一部詳細に記載されているが、当業者には、本開示を読むことによって、形態および詳細の様々な変化が、本発明の真の範囲から逸脱することなく行われ得ること、ならびに添付の特許請求の範囲内で実践され得ることは明白である。例えば、全ての方法、システム、コンピュータ可読媒体、および／またはその構成要素の特色、ステップ、要素、もしくは他の態様は、様々な組合せで使用することができる。

本明細書で引用される全ての特許、特許出願、ウェブサイト、他の刊行物または文書、受託番号などは、各々の個々の項目が具体的かつ個々に参照により組み込まれることが示されているのと同程度に全ての目的に関してその全体が参照によりに組み込まれる。配列の異なるバージョンが異なる時間で受託番号に関連している場合、本出願の有効な提出日で受託番号に関連するバージョンを意味する。有効な提出日は、実際の提出日、または該当する場合、受託番号を参照する優先権出願の提出日の早いほうを意味する。同様に、異なるバージョンの刊行物、ウェブサイトなどが異なる時期に公開されている場合、特に示していない限り、出願の有効な提出日で公開された最新のバージョンを意味する。

Claims

試料中のＤＮＡを解析する方法であって、
ａ）前記試料を、第１の部分試料および第２の部分試料を含む複数の部分試料に分配するステップであって、前記第１の部分試料が、前記第２の部分試料よりも高い割合で、シトシン改変を有するＤＮＡを含む、ステップと、
ｂ）前記第２の部分試料を、前記第２の部分試料の前記ＤＮＡ内の第１の核酸塩基に対して前記ＤＮＡ内の第２の核酸塩基とは異なって影響を及ぼす手順に供するステップであって、前記第１の核酸塩基が改変または非改変核酸塩基であり、前記第２の核酸塩基が前記第１の核酸塩基とは異なる改変または非改変核酸塩基であり、前記第１の核酸塩基および前記第２の核酸塩基が同じ塩基対形成特異性を有し、それによって処置された部分試料を産生するステップと、
ｃ）前記処置された部分試料から、エピジェネティック標的領域を含む標的領域セットを捕捉するステップと、
ｄ）前記標的領域セット中のＤＮＡおよび前記第１の部分試料に由来するＤＮＡをシーケンシングするステップであって、前記第２の部分試料に由来するＤＮＡが、前記標的領域セットの前記ＤＮＡ内の前記第１の核酸塩基を前記第２の核酸塩基と識別する様式でシーケンシングされる、ステップと
を含む、方法。
試料中のＤＮＡを解析する方法であって、
ａ）前記試料から、エピジェネティック標的領域を含む標的領域セットを捕捉するステップと、
ｂ）前記標的領域セットを、第１の部分試料および第２の部分試料を含む複数の部分試料に分配するステップであって、前記第１の部分試料が、前記第２の部分試料よりも高い割合で、シトシン改変を有するＤＮＡを含む、ステップと、
ｃ）前記第２の部分試料を、前記第２の部分試料の前記ＤＮＡ内の第１の核酸塩基に対して前記ＤＮＡ内の第２の核酸塩基とは異なって影響を及ぼす手順に供するステップであって、前記第１の核酸塩基が改変または非改変核酸塩基であり、前記第２の核酸塩基が前記第１の核酸塩基とは異なる改変または非改変核酸塩基であり、前記第１の核酸塩基および前記第２の核酸塩基が同じ塩基対形成特異性を有し、それによって処置された部分試料を産生するステップと、
ｄ）前記第１の部分試料に由来するＤＮＡおよび前記第２の部分試料に由来するＤＮＡをシーケンシングするステップであって、前記第２の部分試料に由来するＤＮＡが、前記標的領域セットの前記ＤＮＡ内の前記第１の核酸塩基を前記第２の核酸塩基と識別する様式でシーケンシングされる、ステップと
を含む、方法。
前記標的領域セットが、低メチル化可変標的領域セットを含む、上記請求項のいずれか一項に記載の方法。
前記低メチル化可変標的領域セットが、少なくとも１つのタイプの組織において、健康な対象に由来する無細胞ＤＮＡにおけるメチル化の程度よりも低い程度のメチル化を有する領域を含む、直前の請求項に記載の方法。
前記標的領域セットが、メチル化対照標的領域セットを含む、請求項３または４に記載の方法。
前記標的領域セットが、断片化可変標的領域セットを含む、上記請求項のいずれか一項に記載の方法。
前記断片化可変標的領域セットが、転写開始部位領域を含む、直前の請求項に記載の方法。
前記断片化可変標的領域セットが、ＣＴＣＦ結合領域を含む、請求項６または７に記載の方法。
前記標的領域セットが、配列可変標的領域をさらに含む、上記請求項のいずれか一項に記載の方法。
前記配列可変標的領域セットに対応するＤＮＡ分子が、前記エピジェネティック標的領域セットに対応するＤＮＡ分子よりも高い捕捉収率で捕捉される、直前の請求項に記載の方法。
試料中のＤＮＡを解析する方法であって、
ａ）前記試料を、第１の部分試料および第２の部分試料を含む複数の部分試料に分配するステップであって、前記第１の部分試料が、前記第２の部分試料よりも高い割合で、シトシン改変を有するＤＮＡを含む、ステップと、
ｂ）前記第２の部分試料を、前記第２の部分試料の前記ＤＮＡ内の第１の核酸塩基に対して前記ＤＮＡ内の第２の核酸塩基とは異なって影響を及ぼす手順に供するステップであって、前記第１の核酸塩基が改変または非改変核酸塩基であり、前記第２の核酸塩基が前記第１の核酸塩基とは異なる改変または非改変核酸塩基であり、前記第１の核酸塩基および前記第２の核酸塩基が同じ塩基対形成特異性を有し、それによって処置された部分試料を産生するステップと、
ｃ）前記処置された部分試料に由来するＤＮＡおよび前記第１の部分試料に由来するＤＮＡを、前記標的領域セットの前記ＤＮＡ内の前記第１の核酸塩基を前記第２の核酸塩基と識別する様式でシーケンシングするステップと
を含む、方法。
前記第１の部分試料のＤＮＡが、メチル化感受性ヌクレアーゼと接触させられ、それによって前記第１の部分試料中の非特異的に分配されたＤＮＡを分解する、上記請求項のいずれか一項に記載の方法。
前記ＤＮＡが、試験対象から得られた無細胞ＤＮＡ（ｃｆＤＮＡ）を含む、上記請求項のいずれか一項に記載の方法。
前記第１の部分試料から、追加の標的領域セットを捕捉するステップをさらに含み、シーケンシングされる前記第１の部分試料に由来するＤＮＡが、前記追加の標的領域セットを含む、上記請求項のいずれか一項に記載の方法。
前記第１の部分試料を、前記第２の部分試料の前記ＤＮＡ内の第１の核酸塩基に対して前記ＤＮＡ内の第２の核酸塩基とは異なって影響を及ぼす手順に供するステップであって、前記第１の核酸塩基が改変または非改変核酸塩基であり、前記第２の核酸塩基が前記第１の核酸塩基とは異なる改変または非改変核酸塩基であり、前記第１の核酸塩基および前記第２の核酸塩基が同じ塩基対形成特異性を有し、それによって追加の処置された部分試料を産生するステップをさらに含む、上記請求項のいずれか一項に記載の方法。
前記追加の処置された部分試料から、追加の標的領域セットを捕捉するステップをさらに含む、直前の請求項に記載の方法。
前記追加の標的領域セットが、高メチル化可変標的領域セットを含む、請求項１４または１６に記載の方法。
前記高メチル化可変標的領域セットが、少なくとも１つのタイプの組織において、健康な対象に由来する無細胞ＤＮＡにおけるメチル化の程度よりも高い程度のメチル化を有する領域を含む、直前の請求項に記載の方法。
前記追加の標的領域セットが、メチル化対照標的領域セットを含む、請求項１７または１８に記載の方法。
前記追加の標的領域セットが、断片化可変標的領域セットを含む、請求項１６～１９のいずれか一項に記載の方法。
前記断片化可変標的領域セットが、転写開始部位領域を含む、直前の請求項に記載の方法。
前記断片化可変標的領域セットが、ＣＴＣＦ結合領域を含む、請求項２０または２１に記載の方法。
前記追加の標的領域セットが、配列可変標的領域をさらに含む、請求項１６～２２のいずれか一項に記載の方法。
前記配列可変標的領域セットに対応するＤＮＡ分子が、前記エピジェネティック標的領域セットに対応するＤＮＡ分子よりも高い捕捉収率で捕捉される、直前の請求項に記載の方法。
捕捉するステップが、捕捉しようとするＤＮＡを、標的特異的プローブのセットと接触させることを含み、それによって標的特異的プローブとＤＮＡとの複合体が形成される、上記請求項のいずれか一項に記載の方法。
捕捉するステップが、前記複合体を、標的特異的プローブに結合していないＤＮＡから分離させ、それによって捕捉されたＤＮＡを得ることをさらに含む、直前の請求項に記載の方法。
前記標的特異的プローブのセットが、前記エピジェネティック標的領域セットに対応するＤＮＡよりも高い捕捉収率で前記配列可変標的領域セットに対応するＤＮＡを捕捉するように構成される、請求項２５または２６に記載の方法。
前記エピジェネティック標的領域セットに対応するＤＮＡ分子よりも大きいシーケンシング深度まで、前記配列可変標的領域セットに対応するＤＮＡ分子をシーケンシングするステップを含む、請求項９～２２のいずれか一項に記載の方法。
前記ＤＮＡが、前記シーケンシングするステップの前に増幅されるか、または前記ＤＮＡが、前記捕捉するステップの前に増幅される、上記請求項のいずれか一項に記載の方法。
捕捉の前に前記ＤＮＡにバーコード含有アダプターをライゲーションするステップをさらに含み、必要に応じて、前記ライゲーションするステップが、増幅の前または増幅と同時に生じる、上記請求項のいずれか一項に記載の方法。
前記試料を複数の部分試料に分配するステップが、メチル化レベルに基づいて分配することを含む、上記請求項のいずれか一項に記載の方法。
前記分配するステップが、収集したｃｆＤＮＡを、固体支持体に固定化されたメチル結合試薬と接触させることを含む、直前の請求項に記載の方法。
前記第１の部分試料および第２の部分試料または前記第１の部分試料および前記処置された部分試料を、差次的にタグ付けするステップを含む、上記請求項のいずれか一項に記載の方法。
前記第１の部分試料および前記標的領域セットまたは第２の部分試料に由来するＤＮＡが、プールされる、直前の請求項に記載の方法。
前記第１の部分試料および前記標的領域セットまたは第２の部分試料に由来するＤＮＡが、同じシーケンシングセルにおいてシーケンシングされる、請求項３３～３４のいずれか一項に記載の方法。
前記複数の部分試料が、前記第２の部分試料よりも高い割合であるが前記第１の部分試料よりも低い割合でシトシン改変を有するＤＮＡを含む、第３の部分試料を含む、上記請求項のいずれか一項に記載の方法。
前記第３の部分試料を差次的にタグ付けするステップをさらに含む、直前の請求項に記載の方法。
前記第１の部分試料に由来するＤＮＡ、前記第３の部分試料に由来するＤＮＡ、および前記標的領域セットが、プールされ、必要に応じて、前記第１、第２、および第３の部分試料に由来するＤＮＡが、同じシーケンシングセルにおいてシーケンシングされる、直前の請求項に記載の方法。
前記対象ががんを有する可能性を決定するステップをさらに含む、上記請求項のいずれか一項に記載の方法。
前記シーケンシングするステップが、複数のシーケンシング読み取りデータを生成し、前記方法が、前記複数の配列読み取りデータを１つまたは複数の参照配列にマッピングして、マッピングされた配列読み取りデータを生成するステップ、ならびに前記配列可変標的領域セットおよび前記エピジェネティック標的領域セットに対応する前記マッピングされた配列読み取りデータをプロセシングして、前記対象ががんを有する可能性を決定するステップをさらに含む、直前の請求項に記載の方法。
前記試験対象が、以前にがんと診断され、１つまたは複数の以前のがん処置を受けており、必要に応じて、前記ｃｆＤＮＡが、前記１つまたは複数の以前のがん処置の後の１つまたは複数の事前に選択された時点で取得され、前記ｃｆＤＮＡ分子の捕捉されたセットをシーケンシングし、それによって列情報のセットが産生される、請求項１～３８のいずれか一項に記載の方法。
前記配列情報のセットを使用して、事前に選択された時点において、腫瘍細胞を起源とするかまたはそれに由来するＤＮＡの存在または非存在を検出するステップをさらに含む、直前の請求項に記載の方法。
前記試験対象について、前記腫瘍細胞を起源とするかまたはそれに由来する前記ＤＮＡの存在または非存在を示すがん再発スコアを決定するステップをさらに含み、必要に応じて、前記がん再発スコアに基づいて、がん再発ステータスを決定するステップをさらに含み、前記試験対象の前記がん再発ステータスが、がん再発スコアが所定の閾値であるかもしくはそれを上回ると決定された場合にがん再発のリスクがあると決定されるか、または前記試験対象の前記がん再発ステータスが、前記がん再発スコアが前記所定の閾値よりも低い場合にがん再発のリスクが低いと決定される、直前の請求項に記載の方法。
前記試験対象の前記がん再発スコアを所定のがん再発閾値と比較するステップをさらに含み、前記試験対象が、前記がん再発スコアが前記がん再発閾値を上回る場合に後続のがん処置の候補として分類されるか、または前記がん再発スコアが前記がん再発閾値よりも低い場合に後続のがん処置の候補ではないとして分類される、直前の請求項に記載の方法。
前記シトシン改変が、メチル化である、上記請求項のいずれか一項に記載の方法。
前記シトシン改変が、シトシンの５位におけるメチル化である、上記請求項のいずれか一項に記載の方法。
前記第２の部分試料が供される前記手順が、前記第２の核酸塩基の塩基対形成特異性を実質的に変化させることなく、前記第１の核酸塩基の塩基対形成特異性を変化させる、上記請求項のいずれか一項に記載の方法。
前記第１の核酸塩基が、改変または非改変シトシンであり、前記第２の核酸塩基が、改変または非改変シトシンである、上記請求項のいずれか一項に記載の方法。
前記第１の核酸塩基が、非改変シトシン（Ｃ）を含む、上記請求項のいずれか一項に記載の方法。
前記第２の核酸塩基が、５－メチルシトシン（ｍＣ）を含む、上記請求項のいずれか一項に記載の方法。
前記第１の部分試料が供される前記手順が、バイサルファイト変換を含む、上記請求項のいずれか一項に記載の方法。
前記第１の核酸塩基が、ｍＣを含む、請求項１～４９のいずれか一項に記載の方法。
前記第２の核酸塩基が、５－ヒドロキシメチルシトシン（ｈｍＣ）を含む、上記請求項のいずれか一項に記載の方法。
前記第２の部分試料が供される前記手順が、５ｈｍＣの保護を含む、請求項５３に記載の方法。
前記第２の部分試料が供される前記手順が、Ｔｅｔ補助バイサルファイト変換を含む、請求項５３に記載の方法。
前記第２の部分試料が供される前記手順が、置換ボラン還元剤を用いたＴｅｔ補助変換を含み、必要に応じて、前記置換ボラン還元剤が、２－ピコリンボラン、ボランピリジン、ｔｅｒｔ－ブチルアミンボラン、またはアンモニアボランである、請求項５３に記載の方法。
前記置換ボラン還元剤が、２－ピコリンボランまたはボランピリジンである、請求項５６に記載の方法。
前記第２の核酸塩基が、Ｃを含む、請求項５２～５４または５６～５７のいずれか一項に記載の方法。
前記第２の部分試料が供される前記手順が、ｈｍＣの保護、続いて置換ボラン還元剤を用いたＴｅｔ補助変換を含み、必要に応じて、前記置換ボラン還元剤が、２－ピコリンボラン、ボランピリジン、ｔｅｒｔ－ブチルアミンボラン、またはアンモニアボランである、請求項５２～５４、または５８のいずれか一項に記載の方法。
前記置換ボラン還元剤が、２－ピコリンボランまたはボランピリジンである、請求項５９に記載の方法。
前記第１の部分試料が供される前記手順が、ｈｍＣの保護、続いてｍＣおよび／またはＣの脱アミノ化を含む、請求項４９、５０、５２～５４、または５８のいずれか一項に記載の方法。
前記ｍＣおよび／またはＣの脱アミノ化が、ＡＩＤ／ＡＰＯＢＥＣファミリーＤＮＡデアミナーゼ酵素での処置を含む、請求項６１に記載の方法。
ｈｍＣの保護が、ｈｍＣのグルコシル化を含む、請求項５４または５８～６２のいずれか一項に記載の方法。
前記第１の部分試料が供される前記手順が、置換ボラン還元剤を用いた化学物質補助変換を含み、必要に応じて、前記置換ボラン還元剤が、２－ピコリンボラン、ボランピリジン、ｔｅｒｔ－ブチルアミンボラン、またはアンモニアボランである、請求項１～４８、５０、５２、または５８のいずれか一項に記載の方法。
前記置換ボラン還元剤が、２－ピコリンボランまたはボランピリジンである、請求項６４に記載の方法。
前記第１の核酸塩基が、ｈｍＣを含む、請求項１～４８、５０、５２、５８、または６４～６５のいずれか一項に記載の方法。
前記第１の部分試料のＤＮＡおよび前記第２の部分試料のＤＮＡが、差次的にタグ付けされ、差次的タグ付けの後に、前記第２の部分試料または処置された部分試料に由来するＤＮＡの一部分が、前記第１の部分試料または追加の処置された部分試料またはその少なくとも一部分に添加され、それによってプールが形成され、配列可変標的領域およびエピジェネティック標的領域が、前記プールから捕捉される、上記請求項のいずれか一項に記載の方法。
前記プールが、前記第２の部分試料のＤＮＡのうちの約４５％未満もしくはそれに等しい、４０％未満もしくはそれに等しい、３５％未満もしくはそれに等しい、３０％未満もしくはそれに等しい、２５％未満もしくはそれに等しい、２０％未満もしくはそれに等しい、１５％未満もしくはそれに等しい、１０％未満もしくはそれに等しい、または５％未満もしくはそれに等しいを含む、直前の請求項に記載の方法。
前記プールが、前記第２の部分試料のＤＮＡのうちの約７０～９０％、約７５～８５％、または約８０％を含む、直前の請求項に記載の方法。
前記プールが、前記第１の部分試料のＤＮＡの実質的に全てを含む、請求項６７～６９のいずれか一項に記載の方法。
前記プールが、前記第１の部分試料または処置された第１の部分試料のＤＮＡの実質的に全てを含む、請求項６７～７０のいずれか一項に記載の方法。
前記第１の標的領域セットが、前記プールの形成後に、前記第１の部分試料または処置された第１の部分試料の少なくとも一部分から捕捉される、請求項６７～７２のいずれか一項に記載の方法。
前記第１の部分試料を、前記第２の部分試料の前記ＤＮＡ内の第１の核酸塩基に対して前記ＤＮＡ内の第２の核酸塩基とは異なって影響を及ぼす手順に供するステップであって、前記第１の部分試料が供される前記手順が、前記第２の部分試料が供される手順と同じである、ステップをさらに含む、請求項４７～７２のいずれか一項に記載の方法。
前記第１の部分試料を、前記第２の部分試料の前記ＤＮＡ内の第１の核酸塩基に対して前記ＤＮＡ内の第２の核酸塩基とは異なって影響を及ぼす手順に供するステップであって、前記第１の部分試料が供される前記手順が、前記第２の部分試料が供される手順とは異なる、ステップをさらに含む、請求項４７～７２のいずれか一項に記載の方法。