JP2023524681A

JP2023524681A - 分配された核酸を使用した配列決定のための方法

Info

Publication number: JP2023524681A
Application number: JP2022566054A
Authority: JP
Inventors: カルロアルティエリ，; ユーコン，; アリエルジャイモビッチ，; ジェシカクラタ，
Original assignee: ガーダントヘルス，インコーポレイテッド
Priority date: 2020-04-30
Filing date: 2021-04-30
Publication date: 2023-06-13
Also published as: WO2021222828A1; US20230313288A1; CA3177127A1; EP4143338A1

Abstract

ＤＮＡ損傷（例えば、シトシン脱アミノ化）は、ＤＮＡ（例えば、無細胞ＤＮＡ）試料の高メチル化画分において、低メチル化画分よりも高頻度で出現することができる。実施形態は、高メチル化画分および低メチル化画分をシーケンシングするステップを含み、高メチル化画分由来の分子の配列に基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップは、低メチル化画分由来の分子の配列に基づき参照配列と比べたＣからＴへのもしくはＧからＡへのトランジション変異をコールするステップよりも多い数の分子におけるトランジション変異の観察を要求するか、またはＣからＴへのもしくはＧからＡへのトランジション変異は、高メチル化画分の分子の配列に基づき参照配列と比べてコールされない。

Description

本出願は、すべての目的に関してその全体が参照により本明細書に組み込まれる、２０２０年４月３０日に提出された米国仮特許出願第６３／０１８，３６３号の利益を主張する。

背景
がんは、世界中で年間数百万名の死亡の原因である。初期のがんは、処置に対する感受性がより高くなる傾向があるため、がんの早期検出は、転帰改善をもたらし得る。

不適切に制御された細胞成長は、コピー数変異（ＣＮＶ）、一塩基変異（single nucleotide variation）（ＳＮＶ）、遺伝子融合、挿入および／または欠失（インデル）、シトシンの５－メチル化（５－メチルシトシン）等のＤＮＡメチル化ならびにＤＮＡとクロマチンタンパク質および転写因子との会合を含むエピジェネティックバリエーション等、遺伝的なおよびエピジェネティックな変化の蓄積に一般に起因するがんの特徴である。

生検は、細胞または組織が、がんの可能性がある部位から摘出され、関連性のある表現型および／または遺伝子型特色について解析される、がんを検出または診断するための伝統的なアプローチを表す。生検は、侵襲性であるという弱点を有する。

血液等の体液の解析（「リキッドバイオプシー」）に基づくがんの検出は、がん細胞由来のＤＮＡが体液中に放出されることの観察に基づく興味深い代替法である。リキッドバイオプシーは、非侵襲性である（おそらく採血のみを要求する）。しかし、無細胞ＤＮＡの低い濃度および不均一性を考慮すると、リキッドバイオプシー材料を解析するための正確かつ高感度な方法を開発することは困難な課題であった。高度のメチル化を示すＤＮＡは、他のＤＮＡよりも大きい頻度で、実際のゲノム配列とは無関係に脱アミノ化塩基等の損傷された塩基を有し得ることが今や決定されており、このことは配列決定の精度に有害な影響を与え得るため、上述の困難な課題は、高メチル化および低メチル化画分のシーケンシングによってＤＮＡメチル化を含むエピジェネティック変化が解析される手順に特に当てはまる。したがって、分配された核酸を使用した配列決定のための改善された方法の必要がある。

要旨
本開示は、無細胞ＤＮＡ（ｃｆＤＮＡ）等のＤＮＡの試料を解析する方法であって、試料が、高メチル化画分(partition)および低メチル化画分を含む複数の画分に分配される、方法を含む実施形態を提供する。本開示は、一部には、次の具現化に基づく。高メチル化画分において、ＤＮＡ（例えば、ｃｆＤＮＡ）は、ＤＮＡが起源を持つ細胞における実際の変異を反映しない、シトシン脱アミノ化等の損傷をより多い量で有することができる。そのようなＤＮＡ損傷は、見かけ上の、ただし偽陽性のＣからＴへのおよび相補的なＧからＡへのトランジション変異の頻度増加をもたらすことができる。したがって、高メチル化画分由来の配列に基づきそのようなトランジション変異を同定するために、低メチル化画分由来の配列に基づきそのようなトランジション変異を同定するための場合よりも厳密な要件を使用することが有益となり得る。したがって、次の実施形態が提供される。実施形態１は、ＤＮＡの試料を解析する方法であって、
ＤＮＡの試料を複数の画分に分配するステップであって、複数の画分が、高メチル化画分および低メチル化画分を含む、ステップ；
高メチル化および低メチル化画分におけるＤＮＡをタグ付けして、タグ付けされた核酸を生成するステップであって、タグ付けされた核酸が、分子バーコードを含む、ステップ；
高メチル化画分由来の分子の配列リードおよび低メチル化画分由来の分子の配列リードを得るステップであって、配列リードが、分子バーコード配列および試料配列を含む、ステップ；
（ａ）分子バーコード配列ならびに（ｂ）試料配列の最初および最後のヌクレオチドに対応するゲノム位置のうち少なくとも１つに基づき、配列リードをファミリーに群分けするステップであって、ファミリーが、試料における単一のＤＮＡ分子に由来する配列リードを含む、ステップ；
高メチル化画分由来の分子の配列の第１のセットおよび低メチル化画分由来の分子の配列の第２のセットを決定するステップ；ならびに
配列の第１および第２のセットに基づき複数の塩基をコールするステップであって、
（ｉ）第１のセットの分子の配列に基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップが、第２のセットの分子の配列に基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップよりも多い数の分子におけるトランジション変異の観察を要求する、；あるいは
（ｉｉ）ＣからＴへのもしくはＧからＡへのトランジション変異が、第１のセットの分子の配列に基づき参照配列と比べてコールされない、またはＣからＴへのもしくはＧからＡへのトランジション変異が、第１のセットの分子の配列を使用せずに第２のセットの分子の配列に基づき参照配列と比べてコールされる、または第２のセットの分子の少なくとも１つの配列が、ＣからＴへのもしくはＧからＡへのトランジション変異を含む場合に限り、ＣからＴへのもしくはＧからＡへのトランジション変異が、参照配列と比べてコールされる、ステップを含む方法である。

実施形態２は、第１のセットの分子の配列に基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップが、第２のセットの分子の配列に基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップよりも多い数の分子におけるトランジション変異の観察を要求する、直前の実施形態に記載の方法である。

実施形態３は、第１のセットの分子の配列に基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップが、少なくとも３つの分子におけるトランジション変異の観察を要求する、先行する実施形態のいずれか１つに記載の方法である。

実施形態４は、第１のセットの分子の配列に基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップが、少なくとも４つの分子におけるトランジション変異の観察を要求する、直前の実施形態に記載の方法である。

実施形態５は、第１のセットの分子の配列に基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップが、少なくとも５つの分子におけるトランジション変異の観察を要求する、直前の実施形態に記載の方法である。

実施形態６は、第２のセットの分子の配列に基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップが、少なくとも２つの分子におけるトランジション変異の観察を要求する、先行する実施形態のいずれか１つに記載の方法である。

実施形態７は、第２のセットの分子の配列に基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップが、少なくとも３つの分子におけるトランジション変異の観察を要求する、直前の実施形態に記載の方法である。

実施形態８は、第１のセットの分子の配列に基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップが、第２のセットの分子の配列に基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップよりも少なくとも２つ多い分子におけるトランジション変異の観察を要求する、先行する実施形態のいずれか１つに記載の方法である。

実施形態９は、第１の閾値が、第１のセットの分子の配列に基づきＣからＴへのまたはＧからＡへのトランジションをコールするために使用され、第２の閾値が、第２のセットの分子の配列に基づきＣからＴへのまたはＧからＡへのトランジションをコールするために使用され；第１の閾値が、ＣからＴへのまたはＧからＡへのトランジションをコールするための特異度の第１のレベルを提供し；第２の閾値が、ＣからＴへのまたはＧからＡへのトランジションをコールするための特異度の第２のレベルを提供し；特異度の第１のレベルが、特異度の第２のレベルにほぼ等しいか、または特異度の第１のレベルが、特異度の第２のレベルの１０％、５％、４％、３％、２％、１％、０．５％、０．２％もしくは０．１％以内である、先行する実施形態のいずれか１つに記載の方法である。

実施形態１０は、第１および第２の閾値が、ＣからＴへのおよび／またはＧからＡへのトランジションに特異的である、直前の実施形態に記載の方法である。

実施形態１１は、第１および第２の閾値が、少なくとも１つの対照試料または複数の対照試料から決定され、必要に応じて、少なくとも１つの対照試料または複数の対照試料が、がんを有すると疑われていない個体に由来する、実施形態９または１０に記載の方法である。

実施形態１２は、位置特異的バックグラウンド誤り率の第１の群が、第１のセットの分子の配列のための複数の位置のために使用され；位置特異的バックグラウンド誤り率の第２の群が、第２のセットの分子の配列のための複数の位置のために使用され；第２の群が、第１の群の対応する位置特異的バックグラウンド誤り率よりも高い位置特異的バックグラウンド誤り率を含み；第１のセットの分子の配列に基づきＣからＴへのまたはＧからＡへのトランジション変異をコールするステップが、位置特異的バックグラウンド誤り率の第１の群由来の対応する率を超える頻度での、ＣからＴへのまたはＧからＡへのトランジション変異の観察を要求する、実施形態１～８のいずれか１つに記載の方法である。

実施形態１３は、第１のセットの分子の配列に基づきＣからＴへのまたはＧからＡへのトランジション変異をコールするステップが、少なくとも２、３、４または５倍、位置特異的バックグラウンド誤り率の第１の群由来の対応する率を超える頻度での、ＣからＴへのまたはＧからＡへのトランジション変異の観察を要求する、直前の実施形態に記載の方法である。

実施形態１４は、第１のセットの分子の配列に基づきＣからＴへのまたはＧからＡへのトランジション変異をコールするステップが、少なくとも９５％、９８％、９９％、９９．５％または９９．９％の信頼水準と一致する量だけ、位置特異的バックグラウンド誤り率の第１の群由来の対応する率を超える頻度での、ＣからＴへのまたはＧからＡへのトランジション変異の観察を要求する、直前の実施形態に記載の方法である。

実施形態１５は、位置特異的バックグラウンド誤り率の第１および第２の群が、複数の対照試料から決定され、必要に応じて、対照試料が、がんを有すると疑われていない個体に由来する、実施形態１２～１４のいずれか１つに記載の方法である。

実施形態１６は、位置特異的バックグラウンド誤り率の第１および第２の群が、複数の対照試料を使用して決定されており、必要に応じて、対照試料が、がんを有すると疑われていない個体に由来する、実施形態１２～１４のいずれか１つに記載の方法である。

実施形態１７は、位置特異的バックグラウンド誤り率の第１および第２の群が、病歴データを使用して決定された、実施形態１２～１４のいずれか１つに記載の方法である。

実施形態１８は、位置特異的バックグラウンド誤り率の第１および第２の群が、それぞれ高メチル化および低メチル化画分由来の分子のリードおよび／または配列を使用して決定された、実施形態１２～１４のいずれか１つに記載の方法である。

実施形態１９は、中等度画分由来の分子の配列リードを得るステップ；
中等度画分由来の分子の配列の第３のセットを決定するステップ；および
配列の第３のセットに基づき複数の塩基をコールするステップをさらに含む、先行する実施形態のいずれか１つに記載の方法である。

実施形態２０は、ＣからＴへのおよびＧからＡへのトランジション変異が第１のセットの分子の配列に基づきコールされるよりも低い厳密性で、ＣからＴへのおよびＧからＡへのトランジション変異が第３のセットの配列に基づきコールされる、直前の実施形態に記載の方法である。

実施形態２１は、ＣからＴへのおよびＧからＡへのトランジション変異が第２のセットの配列に基づきコールされるのと同じ仕方で、またはＣからＴへのおよびＧからＡへのトランジション変異が第２のセットの配列に基づきコールされるよりも高い厳密性で、ＣからＴへのおよびＧからＡへのトランジション変異が第３のセットの配列に基づきコールされる、直前の実施形態に記載の方法である。

実施形態２２は、ＤＮＡの試料を解析する方法であって、
それぞれ試料の高メチル化および低メチル化画分由来の配列リードの第１および第２のセットを得るステップ；ならびに
配列リードの第１および第２のセット由来の配列を決定するステップであって、
（ｉ）第１のセットのリードに基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップが、第２のセットのリードに基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップよりも多い数のリードにおけるトランジション変異の観察を要求する；あるいは
（ｉｉ）ＣからＴへのまたはＧからＡへのトランジション変異が、第１のセットのリードに基づき参照配列と比べてコールされない、またはＣからＴへのもしくはＧからＡへのトランジション変異が、第１のセットの分子の配列を使用せずに第２のセットの分子の配列に基づき参照配列と比べてコールされる、または第２のセットの分子の少なくとも１つの配列が、ＣからＴへのもしくはＧからＡへのトランジション変異を含む場合に限り、ＣからＴへのもしくはＧからＡへのトランジション変異が、参照配列と比べてコールされる、ステップを含む方法である。

実施形態２３は、第１のセットのリードに基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップが、第２のセットのリードに基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップよりも多い数のリードにおけるトランジション変異の観察を要求する、直前の実施形態に記載の方法である。

実施形態２４は、第１のセットのリードに基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップが、少なくとも３つのリードにおけるトランジション変異の観察を要求する、実施形態２２または２３のいずれか１つに記載の方法である。

実施形態２５は、第１のセットのリードに基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップが、少なくとも４つのリードにおけるトランジション変異の観察を要求する、直前の実施形態に記載の方法である。

実施形態２６は、第１のセットのリードに基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップが、少なくとも５つのリードにおけるトランジション変異の観察を要求する、直前の実施形態に記載の方法である。

実施形態２７は、第２のセットのリードに基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップが、少なくとも２つのリードにおけるトランジション変異の観察を要求する、実施形態２２～２６のいずれか１つに記載の方法である。

実施形態２８は、第２のセットのリードに基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップが、少なくとも３つのリードにおけるトランジション変異の観察を要求する、直前の実施形態に記載の方法である。

実施形態２９は、第１のセットのリードに基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップが、第２のセットのリードに基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップよりも少なくとも２つ多いリードにおけるトランジション変異の観察を要求する、実施形態２２～２８のいずれか１つに記載の方法である。

実施形態３０は、中等度画分由来の配列リードの第３のセットを得るステップをさらに含み、配列が、第１および第２のセットに加えて第３のセットから決定される、先行する実施形態のいずれか１つに記載の方法である。

実施形態３１は、ＣからＴへのおよびＧからＡへのトランジション変異が第１のセットのリードに基づきコールされるよりも低い厳密性で、ＣからＴへのおよびＧからＡへのトランジション変異が第３のセットのリードに基づきコールされる、直前の実施形態に記載の方法である。

実施形態３２は、ＣからＴへのおよびＧからＡへのトランジション変異が第２のセットのリードに基づきコールされるのと同じ仕方で、ＣからＴへのおよびＧからＡへのトランジション変異が第３のセットのリードに基づきコールされる、直前の実施形態に記載の方法である。

実施形態３３は、高メチル化画分のＤＮＡおよび低メチル化画分のＤＮＡが、示差的にタグ付けされている、先行する実施形態のいずれか１つに記載の方法である。

実施形態３４は、高メチル化画分のＤＮＡおよび低メチル化画分のＤＮＡが、バーコードを含む配列タグで示差的にタグ付けされている、先行する実施形態のいずれか１つに記載の方法である。

実施形態３５は、高メチル化および低メチル化画分が、試料のＤＮＡを、固体支持体に固定化されたメチル結合試薬と接触させることにより調製された、先行する実施形態のいずれか１つに記載の方法である。

実施形態３６は、メチル結合試薬が、ＭＢＤを含む、直前の実施形態に記載の方法である。

実施形態３７は、メチル結合試薬が、ＭｅＣＰを含む、実施形態３６に記載の方法である。

実施形態３８は、メチル結合試薬が、メチル化ヌクレオチドに結合する抗体を含み、必要に応じて、メチル化ヌクレオチドが、メチル化シトシンである、実施形態３６に記載の方法である。

実施形態３９は、試料のＤＮＡを、固体支持体に固定化されたメチル結合試薬と接触させ、メチル結合試薬への示差的結合に基づき低メチル化画分および高メチル化画分を得るステップを含む、実施形態３５～３８のいずれか１つに記載の方法である。

実施形態４０は、シーケンシング前に高メチル化画分のＤＮＡおよび低メチル化画分のＤＮＡに示差的タグを付加するステップを含む、実施形態３５～３９のいずれか１つに記載の方法である。

実施形態４１は、配列を決定するステップが、配列リードの第１および第２のセットを参照配列にマッピングして、マッピングされた配列リードを産生するステップを含む、先行する実施形態のいずれか１つに記載の方法である。

実施形態４２は、試料のまたは高メチル化および低メチル化画分のＤＮＡが、富化または捕捉された目的の領域を含む、先行する実施形態のいずれか１つに記載の方法である。

実施形態４３は、目的の領域について試料のもしくは高メチル化および低メチル化画分のＤＮＡを富化するステップ、または試料または高メチル化および低メチル化画分から目的の領域を捕捉するステップを含む、先行する実施形態のいずれか１つに記載の方法である。

実施形態４４は、富化または捕捉するステップが、ＤＮＡを標的特異的プローブのセットと接触させ、それによって、ＤＮＡ分子の捕捉されたセットが産生される、ステップを含む、直前の実施形態に記載の方法である。

実施形態４５は、目的の領域が、配列可変標的領域を含む、実施形態４２～４４のいずれか１つに記載の方法である。

実施形態４６は、標的特異的プローブのセットが、配列可変標的セットに特異的な標的結合プローブを含む、直前の実施形態に記載の方法である。

実施形態４７は、配列可変標的領域セットのフットプリントが、少なくとも２５ｋＢまたは少なくとも５０ｋＢである、直前の実施形態に記載の方法である。

実施形態４８は、目的の領域が、エピジェネティック標的領域を含む、実施形態４２～４７のいずれか１つに記載の方法である。

実施形態４９は、標的特異的プローブのセットが、エピジェネティック標的セットに特異的な標的結合プローブを含む、直前の実施形態に記載の方法である。

実施形態５０は、目的の領域が、配列可変標的領域セットおよびエピジェネティック標的領域セットを含む、実施形態４２～４９のいずれか１つに記載の方法である。

実施形態５１は、配列可変標的領域セットに少なくとも１０個の領域、およびエピジェネティック標的領域セットに少なくとも１００個の領域が存在する、直前の実施形態に記載の方法である。

実施形態５２は、エピジェネティック標的領域セットのフットプリントが、配列可変標的領域セットのサイズよりも少なくとも２倍大きい、実施形態５０～５１のいずれか１つに記載の方法である。

実施形態５３は、エピジェネティック標的領域セットのフットプリントが、配列可変標的領域セットのサイズよりも少なくとも１０倍大きい、直前の実施形態に記載の方法である。

実施形態５４は、標的特異的プローブのセットが、エピジェネティック標的セットに対応するｃｆＤＮＡよりも大きい捕捉収量で、配列可変標的セットに対応するｃｆＤＮＡを捕捉するように構成されている、実施形態５２または５３に記載の方法である。

実施形態５５は、配列可変標的領域セットが、１０～３０キロベースの範囲内のフットプリントを有する、実施形態５０～５４のいずれか１つに記載の方法である。

実施形態５６は、配列可変標的領域セットが、３０～６０キロベースの範囲内のフットプリントを有する、実施形態５０～５４のいずれか１つに記載の方法である。

実施形態５７は、配列可変標的領域セットが、６０キロベース～１メガベースの範囲内のフットプリントを有する、実施形態５０～５４のいずれか１つに記載の方法である。

実施形態５８は、配列可変標的領域セットが、１～２メガベースの範囲内のフットプリントを有する、実施形態５０～５４のいずれか１つに記載の方法である。

実施形態５９は、エピジェネティック標的領域セットが、０．２～０．８メガベースの範囲内のフットプリントを有する、実施形態５０～５８のいずれか１つに記載の方法である。

実施形態６０は、エピジェネティック標的領域セットが、０．８～１．５メガベースの範囲内のフットプリントを有する、実施形態５０～５８のいずれか１つに記載の方法である。

実施形態６１は、エピジェネティック標的領域セットが、１．５～３メガベースの範囲内のフットプリントを有する、実施形態５０～５８のいずれか１つに記載の方法である。

実施形態６２は、エピジェネティック標的領域セットが、３～８メガベースの範囲内のフットプリントを有する、実施形態５０～５８のいずれか１つに記載の方法である。

実施形態６３は、エピジェネティック標的領域セットが、高メチル化可変標的領域セットを含む、実施形態５０～６２のいずれか１つに記載の方法である。

実施形態６４は、エピジェネティック標的領域セットが、低メチル化可変標的領域セットを含む、実施形態５０～６３のいずれか１つに記載の方法である。

実施形態６５は、エピジェネティック標的領域セットが、断片化可変標的領域セットを含む、実施形態５０～６４のいずれか１つに記載の方法である。

実施形態６６は、断片化可変標的領域セットが、転写開始部位領域を含む、直前の実施形態に記載の方法である。

実施形態６７は、断片化可変標的領域セットが、ＣＴＣＦ結合領域を含む、実施形態６５または６６に記載の方法である。

実施形態６８は、配列可変標的セットの捕捉されたＤＮＡが、エピジェネティック標的領域セットの捕捉されたＤＮＡよりも高いシーケンシング深度までシーケンシングされる、実施形態５０～６７のいずれか１つに記載の方法である。

実施形態６９は、配列可変標的セットの捕捉されたＤＮＡが、エピジェネティック標的領域セットの捕捉されたｃｆＤＮＡ分子よりも、少なくとも２倍、３倍もしくは４倍高いシーケンシング深度までシーケンシングされる、または４～１０倍もしくは４～１００倍高いシーケンシング深度までシーケンシングされる、直前の実施形態に記載の方法である。

実施形態７０は、配列可変標的セットの捕捉されたＤＮＡが、シーケンシング前に、エピジェネティック標的領域セットの捕捉されたＤＮＡと共にプールされる、実施形態５０～６９のいずれか１つに記載の方法である。

実施形態７１は、配列可変標的セットの捕捉されたＤＮＡおよびエピジェネティック標的領域セットの捕捉されたＤＮＡが、同じシーケンシングセルにおいてシーケンシングされる、実施形態５０～７０のいずれか１つに記載の方法である。

実施形態７２は、高メチル化および低メチル化画分のＤＮＡが、捕捉前に増幅される、実施形態５０～７１のいずれか１つに記載の方法である。

実施形態７３は、試料が、生体組織または生体液から得られた、先行する実施形態のいずれか１つに記載の方法である。

実施形態７４は、試料が、血液から得られた、先行する実施形態のいずれか１つに記載の方法である。

実施形態７５は、試料のＤＮＡが、無細胞ＤＮＡを含む、先行する実施形態のいずれか１つに記載の方法である。

実施形態７６は、試料のＤＮＡが、無細胞ＤＮＡから本質的になる、先行する実施形態のいずれか１つに記載の方法である。

実施形態７７は、試料が、増殖性障害または固形腫瘍を有するまたはこれを有すると疑われる対象に由来する、先行する実施形態のいずれか１つに記載の方法である。

実施形態７８は、試料が、増殖性障害または固形腫瘍のための処置を受けているまたはこれを受けたことがある対象に由来する、先行する実施形態のいずれか１つに記載の方法である。

実施形態７９は、配列リードから決定された配列に基づき、対象が増殖性障害または固形腫瘍を有する可能性を決定するステップをさらに含む、先行する実施形態のいずれか１つに記載の方法である。

実施形態８０は、増殖性障害または固形腫瘍が、がんである、直前の３つの実施形態のいずれか１つに記載の方法である。

一部の実施形態では、本明細書に開示されている方法の結果は、報告を生成するための入力として使用される。報告は、紙または電子書式であり得る。例えば、本明細書に開示されている方法によって得られるＣからＴへのまたはＧからＡへのトランジション変異の分類は、そのような報告において直接表示することができる。その代わりにまたはその上、ＣからＴへのまたはＧからＡへのトランジション変異が存在するか否かに関する分類に基づく診断情報または治療推奨が、報告に含まれてよい。

本明細書に開示されている方法の様々なステップは、同じもしくは異なる時点で、同じもしくは異なる地理的な位置、例えば、国において、および／または同じもしくは異なる人々によって実行され得る。

本明細書に組み込まれ、その一部を構成する添付の図面はある特定の実施形態を説明し、記述した説明とともに、本明細書に開示した方法、コンピュータ可読媒体、およびシステムのある特定の原理を説明するために役立つ。本明細書で提供する説明は、例として含まれ、限定するものではない添付の図面と併せて読めば、より良く理解される。文脈が他を指示しない限り、同様の参照番号は図面全体で同様の成分を特定することが理解されよう。図面のいくつかまたはすべては説明目的の概略図であり、必ずしも示された要素の実際の相対的寸法または位置を描いているのではないことも理解されよう。

図１は、分配方法体系の要約を示す。

図２は、本開示の一部の実施形態における使用に適したシステムの例の概略図である。

図３は、特定のヌクレオチド置換に応じた塩基あたりの一塩基変異（ＳＮＶ）誤り率を示す。

詳細な説明
次に、本発明のある特定の実施形態を詳細に参照する。そのような実施形態と併せて本発明について説明するが、本発明をこれらの実施形態に限定することを意図するものではないことが理解されるであろう。それとは反対に、本発明は、添付の特許請求の範囲によって定義される本発明の内に含まれ得るあらゆる代替、修正および均等物を網羅することを意図する。

本教示について詳細に説明する前に、特定の組成物またはプロセスステップは変動し得るため、本開示は、そのようなものに限定されないことを理解されたい。本明細書および添付の特許請求の範囲において使用される場合、文脈がそれ以外のことを明らかに指示しない限り、単数形「１つの（a）」、「１つの（an）」および「その（the）」は、複数の参照を含むことに留意されたい。よって、例えば、「１つの核酸（a nucleic acid）」の参照は、複数の核酸を含み、「１つの細胞（a cell）」の参照は、複数の細胞を含む、等々。

数的範囲は、範囲を定義する数を包括する。測定された値および測定可能な値は、測定に関連する有効桁および誤差を考慮に入れた、近似値であることが理解される。また、「を含む（comprise）」、「を含む（comprises）」、「を含む（comprising）」、「を含有する（contain）」、「を含有する（contains）」、「を含有する（containing）」、「を含む（include）」、「を含む（includes）」および「を含む（including）」の使用は、限定を意図するものではない。前述の概略的な説明および詳細な説明は両者共に、単に例示的かつ説明的なものであり、教示を制限するものではないことを理解されたい。

上述の明細書に特に記されていない限り、様々な構成成分「を含む」ものを列挙する本明細書における実施形態はまた、列挙されている構成成分「からなる」または「から本質的になる」ものとして考慮され；様々な構成成分「からなる」ものを列挙する本明細書における実施形態はまた、列挙されている構成成分「を含む」または「から本質的になる」ものとして考慮され；様々な構成成分「から本質的になる」ものを列挙する本明細書における実施形態はまた、列挙されている構成成分「からなる」または「を含む」ものとして考慮される（この互換性は、特許請求の範囲におけるこれらの用語の使用には適用されない）。

本明細書で使用されているセクションの見出しは、秩序立てることを目的としており、決して開示されている主題の限定として解釈されるべきではない。参照により本明細書に組み込まれるいずれかの文書または他の材料が、定義を含む本明細書のいずれかの明確な内容と矛盾する場合、本明細書が優先される。
Ｉ．定義

「参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップ」は、試料由来の配列リードが、許容される信頼度で、参照配列と比べて、シーケンシングされている核酸の所与の位置における変異の存在を支持するという結論を下すステップを指す。一部の実施形態では、結論は、配列品質の尺度（例えば、Ｐｈｒｅｄ品質スコア）等の他のパラメーターと必要に応じて組み合わせて、コンピューターにより下される、および／または当該位置に差が出現するリードの数に基づく。一部の実施形態では、結論は、例えば、病歴データもしくは健康なコホート等の対照群由来のデータから推定され得る変異対立遺伝子分率および／もしくはバックグラウンド誤り率の尺度等の他のパラメーターと必要に応じて組み合わせて、コンピューターにより下される、ならびに／または当該位置に差が出現する分子の数に基づく。これらの実施形態では、分子計数は、配列リードの分子バーコードおよび／またはゲノム座標（co-ordinate）を使用して推定される。変異を含むアセンブルされた配列を生成するステップ、および変異を収載する報告を生成するステップは、変異をコールするステップの非限定的な例である。アセンブルされた配列または報告は、利用者または他の個体に対して表示、印刷、または他の仕方で伝達され得る。

「無細胞ＤＮＡ」、「ｃｆＤＮＡ分子」または単純に「ｃｆＤＮＡ」は、対象におい細胞外形態で（例えば、血液、血清、血漿中に、またはリンパ液、脳脊髄液、尿もしくは痰等の他の体液中に）発生するＤＮＡ分子を含み、細胞内に含有されることも他の仕方で細胞に結合されることもないＤＮＡを含む。ＤＮＡは、大型の複雑な生命体、例えば、哺乳動物の細胞（単数または複数）に本来存在したが、ＤＮＡは、細胞（複数可）から生物中に見出される流体への放出を受けた。典型的に、ｃｆＤＮＡは、ｉｎｖｉｔｒｏ細胞溶解ステップを行う必要なく流体の試料を得ることにより得ることができ、これは、流体中に存在する細胞の除去（例えば、細胞を除去するための血液の遠心分離）も含む。

所与の標的領域セットに対するプローブの収集物の「捕捉収量」は、典型的な条件下で収集物が捕捉する標的領域セットに対応する核酸の量（例えば、別の標的領域セットと比べた量、または絶対量）を指す。例示的で典型的な捕捉条件は、６５℃で１０～１８時間にわたる、厳密なハイブリダイゼーション用の緩衝剤を含有する少ない反応体積（約２０μＬ）における試料核酸およびプローブのインキュベーションである。捕捉収量は、絶対的な用語で、またはプローブの複数の収集物については、相対的な用語で表現することができる。標的領域の複数のセットに対する捕捉収量が比較される場合、収量は、標的領域セットのフットプリントサイズに対して正規化される（例えば、１キロベースあたりの基盤で）。よって、例えば、第１および第２の標的領域のフットプリントサイズが、それぞれ５０ｋｂおよび５００ｋｂである場合（０．１の正規化因数（normalization factor）を生じる）、第１の標的領域セットに対応する捕捉されたＤＮＡの体積あたりの質量の濃度が、第２の標的領域セットに対応する捕捉されたＤＮＡの体積あたりの質量の濃度の０．１倍を超えるときに、第１の標的領域セットに対応するＤＮＡは、第２の標的領域セットに対応するＤＮＡよりも多い収量で捕捉される。さらに別の例として、同じフットプリントサイズを使用して、第１の標的領域セットに対応する捕捉されたＤＮＡが、第２の標的領域セットに対応する捕捉されたＤＮＡの体積あたりの質量の濃度の０．２倍の体積あたりの質量の濃度を有する場合、第１の標的領域セットに対応するＤＮＡは、第２の標的領域セットに対応するＤＮＡの２倍の大きさの捕捉収量で捕捉された。

１つまたは複数の標的核酸を「捕捉する」または「富化する」ステップは、非標的核酸から１つまたは複数の標的核酸を優先的に単離または分離するステップを指す。

核酸の「捕捉されたセット」は、捕捉を受けた核酸を指す。

「標的領域セット」または「標的領域のセット」または「標的領域」は、捕捉のために標的化されたおよび／またはプローブのセットによって標的化された（例えば、配列相補性により）複数のゲノム遺伝子座または複数のゲノム領域を指す。

「標的領域セットに対応する」は、ｃｆＤＮＡ等の核酸が、標的領域セットにおける遺伝子座に起源を持つこと、または標的領域セットに対する１つもしくは複数のプローブに特異的に結合することを意味する。

プローブまたは他のオリゴヌクレオチドと標的配列との文脈における「特異的に結合する」は、適切なハイブリダイゼーション条件下で、オリゴヌクレオチドまたはプローブが、その標的配列またはその複製にハイブリダイズして、安定したプローブ：標的ハイブリッドを形成し、一方でそれと同時に、安定したプローブ：非標的ハイブリッドの形成が最小化されることを意味する。よって、プローブは、非標的配列よりも十分に大きい程度まで、標的配列またはその複製にハイブリダイズして、標的配列の捕捉または検出を可能にする。適切なハイブリダイゼーション条件は、当技術分野で周知である、配列組成に基づき予測することができる、またはルーチンの検査方法を使用することにより決定することができる（例えば、参照により本明細書に組み込まれるSambrook et al., Molecular Cloning, A Laboratory Manual, 2nd ed. (Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989)の§§１．９０～１．９１、７．３７～７．５７、９．４７～９．５１および１１．４７～１１．５７、特に、§§９．５０～９．５１、１１．１２～１１．１３、１１．４５～１１．４７および１１．５５～１１．５７を参照）。

「配列可変標的領域セット」は、新生物細胞（例えば、腫瘍細胞およびがん細胞）におけるヌクレオチド置換、挿入、欠失または遺伝子融合もしくは転位等の配列の変化を示すことができる標的領域のセットを指す。

「エピジェネティック標的領域セット」は、新生物細胞（例えば、腫瘍細胞およびがん細胞）および非腫瘍細胞（例えば、免疫細胞、腫瘍微小環境由来の細胞）における非配列修飾を顕在化することができる標的領域のセットを指す。このような修飾は、ＤＮＡの配列を変化させない。非配列修飾変化の例は、メチル化（増加または減少）、ヌクレオソーム分布、ＣＴＣＦ結合、転写開始部位、調節性タンパク質結合領域、およびＤＮＡに結合することができる他のいずれかのタンパク質の変化を含むがこれらに限定されない。本目的のため、新生物、腫瘍またはがん関連の限局的増幅および／または遺伝子融合に対して感受性である遺伝子座もまた、エピジェネティック標的領域セットに含まれ得るが、その理由として次のことが挙げられる：例えば、限局的増幅および／または遺伝子融合は、それらの検出が１個または数個の個々の位置における塩基コールの精度に依存しないため、相対的に浅いシーケンシング深度で検出され得るという点において、シーケンシングによるコピー数の変化の検出または参照ゲノムにおける２つ以上の遺伝子座にマッピングする融合された配列の検出は、ヌクレオチド置換、挿入または欠失の検出よりも、上に記述される例示的なエピジェネティック変化の検出に類似する傾向がある。例えば、エピジェネティック標的領域セットは、断片長または断片終点位置分布を解析するための標的領域のセットを含むことができる。

循環する腫瘍ＤＮＡまたはｃｔＤＮＡは、腫瘍細胞またはがん細胞に起源を持つｃｆＤＮＡの構成成分である。一部の実施形態では、ｃｆＤＮＡは、正常細胞に起源を持つＤＮＡおよび腫瘍細胞に起源を持つＤＮＡ（すなわち、ｃｔＤＮＡ）を含む。腫瘍細胞は、それが腫瘍内に留まっているか腫瘍から離れたか（例えば、転移性がん細胞および循環する腫瘍細胞の場合のように）に関係なく、腫瘍に起源を持つ新生物細胞である。

用語「高メチル化」は、核酸分子の集団（例えば、試料）内の他の核酸分子と比べて核酸分子（複数可）の増加したレベルまたは程度のメチル化を指す。一部の実施形態では、高メチル化ＤＮＡは、少なくとも１個のメチル化残基、少なくとも２個のメチル化残基、少なくとも３個のメチル化残基、少なくとも５個のメチル化残基、少なくとも１０個のメチル化残基、少なくとも２０個のメチル化残基、少なくとも２５個のメチル化残基または少なくとも３０個のメチル化残基を含むＤＮＡ分子を含むことができる。

用語「低メチル化」は、核酸分子の集団（例えば、試料）内の他の核酸分子と比べて核酸分子（複数可）の減少したレベルまたは程度のメチル化を指す。一部の実施形態では、低メチル化ＤＮＡは、非メチル化ＤＮＡ分子を含む。一部の実施形態では、低メチル化ＤＮＡは、０個のメチル化残基、多くても１個のメチル化残基、多くても２個のメチル化残基、多くても３個のメチル化残基、多くても４個のメチル化残基または多くても５個のメチル化残基を含むＤＮＡ分子を含むことができる。

用語「メチル化ヌクレオチド」は、チミンのピリミジン環に取り付けられたメチル以外の、メチル基が取り付けられたヌクレオチドを指す。メチル化ヌクレオチドの例は、５－メチルシトシンまたは７－メチルグアニンを含むヌクレオチドである。

本明細書で使用される場合、「分子の配列」およびその文法的なバリアントは、同じ本来の試料分子に由来する分子由来のリードを含む複数のリードから決定される配列を指す。リードは、例えば、タグまたはバーコードの配列；試料配列の最初および最後のヌクレオチドに対応するゲノム位置；ならびに／または５’タグ配列の直後のおよび／もしくは３’タグ配列の直前の複数の塩基の配列（複数可）のうち１つまたは複数に基づき、同じ本来の試料分子に由来すると決定することができる。一部の実施形態では、分子の配列における各塩基は、当該位置におけるリードの最小数の一致に基づき決定される、例えば、少なくとも２、３、４、５、６、７、８、９または１０個のリード；要求されるリードの数は、コールが、ＤＮＡの両方の鎖または一方の鎖のみのリードによって支持されるか否かに依存することができる、例えば、分子の配列の両方の鎖のためのリードが存在する場合と比べて、配列の一方の鎖のみのためのリードが存在する場合、要求されるリードの数は、１、２、３、４または５個のリードだけ増加することができる。

用語「またはこれらの組合せ（単数）」および「またはこれらの組合せ（複数）」は、本明細書で使用される場合、この用語に先行する、収載されている用語のありとあらゆる並べ替えおよび組合せを指す。例えば、「Ａ、Ｂ、Ｃまたはこれらの組合せ」は、Ａ、Ｂ、Ｃ、ＡＢ、ＡＣ、ＢＣまたはＡＢＣのうち少なくとも１つを含むことを意図し、特定の文脈における順序が重要である場合、ＢＡ、ＣＡ、ＣＢ、ＡＣＢ、ＣＢＡ、ＢＣＡ、ＢＡＣまたはＣＡＢも含むことを意図する。この例に続けて、ＢＢ、ＡＡＡ、ＡＡＢ、ＢＢＣ、ＡＡＡＢＣＣＣＣ、ＣＢＢＡＡＡ、ＣＡＢＡＢＢその他等、１つまたは複数の項目または用語の反復を含有する組合せが明確に含まれる。当業者であれば、典型的に、文脈からそれ以外のことが明らかとならない限り、いずれかの組合せにおける項目または用語の数には限界がないことを理解するであろう。

「または」は、文脈がそれ以外を要求しない限り、包括的な意味で使用される、すなわち、「および／または」と均等である。
ＩＩ．例示的な方法

ＤＮＡの試料を解析する方法が本明細書に提供される。一部の実施形態では、方法は、それぞれ高メチル化および低メチル化画分由来の配列リードの第１および第２のセットを得るステップを含む。一部の実施形態では、方法は、それぞれ高メチル化および低メチル化画分由来の分子の配列の第１および第２のセットを得るステップを含む。分子の配列は、例えば、ＤＮＡの試料を複数の画分に分配するステップであって、複数の画分が、高メチル化画分および低メチル化画分を含む、ステップ；高メチル化および低メチル化画分におけるＤＮＡをタグ付けして、分子バーコードを含むタグ付けされた核酸を生成するステップ；高メチル化画分由来の分子の配列リードおよび低メチル化画分由来の分子の配列リードを得るステップであって、配列リードが、分子バーコード配列および試料配列を含む、ステップ；ならびに（ａ）分子バーコード配列ならびに（ｂ）試料配列の最初および最後のヌクレオチドに対応するゲノム位置のうち少なくとも１つに基づき、配列リードをファミリーに群分けするステップであって、ファミリーが、試料における単一のＤＮＡ分子に由来する配列リードを含む、ステップによって得ることができる。一部の実施形態では、方法は、配列リードまたは分子の配列の第１および第２のセット由来の配列を決定するステップを含む。用語「配列」は、集団的な意味で使用されており、１つの連続的な配列を必ずしも暗示しない。すなわち、これは、全ゲノム配列（例えば、複数の染色体配列を含む）、ゲノム遺伝子座もしくは遺伝子のセット、配列の他のいずれかのセット、個々の位置における塩基の同一性、またはこれらの組合せを指すことができる。一部の実施形態では、方法は、高メチル化画分由来の分子の配列の第１のセットおよび低メチル化画分由来の分子の配列の第２のセットを決定するステップを含む。一部の実施形態では、方法は、低メチル化画分由来の分子の配列のセットを得るステップを含む。分子の配列は、例えば、ＤＮＡ試料を複数の画分に分配するステップであって、複数の画分が、高メチル化画分および低メチル化画分を含む、ステップ；低メチル化画分におけるＤＮＡをタグ付けして、分子バーコードを含むタグ付けされた核酸を生成するステップ；低メチル化画分由来の分子の配列リードを得るステップであって、配列リードが、分子バーコード配列および試料配列を含む、ステップ；ならびに（ａ）分子バーコード配列ならびに（ｂ）試料配列の最初および最後のヌクレオチドに対応するゲノム位置のうち少なくとも１つに基づき、配列リードをファミリーに群分けするステップであって、ファミリーが、試料における単一のＤＮＡ分子に由来する配列リードを含む、ステップによって得ることができる。一部の実施形態では、方法は、配列リードまたは分子の配列のセット由来の配列を決定するステップを含む。

方法は、参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップを含むことができる。参照配列は、試料が得られた生物（例えば、ヒト等の哺乳動物）のための標準ゲノム配列であり得る。その代わりに、参照配列は、試料が得られた同じ対象由来の別の配列であり得る；そのような場合、参照配列は、例えば、健康な組織またはより初期の時点に由来し得る。

一部の実施形態では、第１のセットのリードに基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップは、第２のセットのリードに基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップよりも多い数のリードにおけるトランジション変異の観察を要求する。一部の実施形態では、第１のセットの分子の配列に基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップは、第２のセットの分子の配列に基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップよりも多い数の分子の配列におけるトランジション変異の観察を要求する。本明細書の他の箇所に記載されている通り、高メチル化画分（例えば、ｃｆＤＮＡの）が、低メチル化画分よりも損傷された（例えば、脱アミノ化された）ＤＮＡを高頻度で含有することが決定され、これにより、ＤＮＡが起源を持つ細胞における実際の配列に対応しない、見かけ上のＣからＴへのまたはＧからＡへのトランジション変異を有する配列リードがもたらされる。参照配列と比べた実際のｉｎｖｉｖｏ変異に対応しない脱アミノ化塩基は、人為現象的脱アミノ化と称することができる。いずれか特定の理論に制約されることは望まないが、例えば、高メチル化ＤＮＡは、脱アミノ化等の損傷に対してより感受性であり得る、または脱アミノ化剤等の損傷剤へとより曝露され得ることが可能であるため、損傷された（例えば、脱アミノ化された）ＤＮＡは、高メチル化画分に優先的に分配され得る。したがって、人為現象的脱アミノ化のリスクが増加する可能性があり、したがって、高メチル化画分由来のＤＮＡをシーケンシングする場合に偽陽性のＣからＴへのまたはＧからＡへのトランジション変異をコールする可能性がある。第１のセットのリードまたは分子に基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするための、より多い数のリードまたは分子におけるトランジション変異の観察の要求は、人為現象的脱アミノ化の頻度の増加を代償し、高メチル化画分から決定された配列におけるトランジション変異の偽陽性コールの上昇のリスクを低下または排除することができる。

例えば、第１のセットのリードに基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップは、少なくとも３つのリードにおけるトランジション変異の観察を要求することができる。そのような実施形態では、第１のセットのリードに基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップは、１または２つのリード、例えば、２つのリードにおけるトランジション変異の観察を要求することができる。一部の実施形態では、第１のセットのリードに基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップは、その塩基を含むリードの少なくとも部分におけるトランジション変異の観察を要求することができる。部分は、例えば、その塩基を含む１０，０００個のリードあたり３個のリード、またはその塩基を含むリードの少なくとも０．１％、０．５％、１％、２％、５％、１０％、２０％、３０％もしくは４０％であり得る。一部の実施形態では、リードの部分は、その塩基を含むリードの０．１％未満であり得る。一部の実施形態では、リードの部分は、その塩基を含むリードの少なくとも４０％であり得る。必要に応じて、第２のセットのリードに基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップは、その塩基を含む１０，０００個のリードあたり１もしくは２個のリード、例えば、その塩基を含む１０，０００個のリードあたり２個のリード、またはその塩基を含むリードの少なくとも０．１％、０．５％、１％、２％、５％、１０％、２０％もしくは３０％におけるトランジション変異の観察を要求することができ、要求される観察の数は、第１のセットのリードに基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップに要求される数よりも少ない。

別の例では、第１のセットの分子の配列に基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップは、少なくとも３つの分子におけるトランジション変異の観察を要求することができる。そのような実施形態では、第１のセットの分子の配列に基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップは、１または２つの分子、例えば、２つの分子におけるトランジション変異の観察を要求することができる。一部の実施形態では、第１のセットの分子の配列に基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップは、その塩基を含む１０，０００個の分子あたり少なくとも３個の分子の配列、またはその塩基を含む分子の配列の少なくとも０．１％、０．５％、１％、２％、５％、１０％、２０％、３０％もしくは４０％におけるトランジション変異の観察を要求することができる。必要に応じて、第１のセットの分子の配列に基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップは、その塩基を含む１０，０００個の分子あたり１もしくは２個の分子の配列、例えば、その塩基を含む１０，０００個の分子あたり２個の分子の配列、または１０，０００個あたり少なくとも３個、その塩基を含む分子の配列の０．１％、０．５％、１％、２％、５％、１０％、２０％もしくは３０％におけるトランジション変異の観察を要求することができ、要求される観察の数は、第１のセットの分子の配列に基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップに要求される数よりも少ない。

別の例では、第１のセットのリードに基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップは、少なくとも４つのリードにおけるトランジション変異の観察を要求することができる。そのような実施形態では、第１のセットのリードに基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップは、１、２または３つのリード、例えば、２または３つのリードにおけるトランジション変異の観察を要求することができる。

別の例では、第１のセットの分子の配列に基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップは、少なくとも４つの分子におけるトランジション変異の観察を要求することができる。そのような実施形態では、第１のセットの分子の配列に基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップは、１、２または３つの分子、例えば、２または３つの分子におけるトランジション変異の観察を要求することができる。

別の例では、第１のセットのリードに基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップは、少なくとも５つのリードにおけるトランジション変異の観察を要求することができる。そのような実施形態では、第１のセットのリードに基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップは、１、２、３もしくは４つのリード、例えば、２、３もしくは４つのリード、またはより具体的には、２もしくは３つのリードにおけるトランジション変異の観察を要求することができる。

別の例では、第１のセットの分子の配列に基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップは、少なくとも５つの分子におけるトランジション変異の観察を要求することができる。そのような実施形態では、第１のセットの分子の配列に基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップは、１、２、３もしくは４つの分子、例えば、２、３もしくは４つの分子、またはより具体的には、２もしくは３つの分子におけるトランジション変異の観察を要求することができる。より一般には、ＣからＴへのまたはＧからＡへのトランジション変異をコールするステップに要求される観察の数は、次の表１に示す通りであり得る。

適切な値は、試料の品質、配列データの深度、ならびに特異度（偽陽性を回避）および感度（偽陰性を回避）の相対的な重要性のうち１つもしくは複数、または全てに基づき選択することができる。一部の実施形態では、第１のセットのリードに基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップは、第２のセットのリードに基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップよりも少なくとも２つ多いリードにおけるトランジション変異の観察を要求する。一部の実施形態では、第１のセットの分子の配列に基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップは、第２のセットの分子の配列に基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップよりも少なくとも２つ多い分子におけるトランジション変異の観察を要求する。

一部の実施形態では、ＣからＴへのまたはＧからＡへのトランジション変異は、第１のセットのリードに基づき参照配列と比べてコールされない。一部の実施形態では、ＣからＴへのまたはＧからＡへのトランジション変異は、第１のセットの分子の配列に基づき参照配列と比べてコールされない。一部の実施形態では、ＣからＴへのまたはＧからＡへのトランジション変異は、第１のセットのリードを使用せずに第２のセットのリードに基づき参照配列と比べてコールされる。一部の実施形態では、ＣからＴへのまたはＧからＡへのトランジション変異は、第１のセットの分子の配列を使用せずに第２のセットの分子の配列に基づき参照配列と比べてコールされる。例えば、ＣからＴへのまたはＧからＡへのトランジション変異がコールされる限りにおいて、それらは、低メチル化画分からの、または低メチル化画分および本明細書の他の箇所において考察される１つもしくは複数の中等度画分からの証拠にのみ基づきコールされ得る。そのような実施形態は、高メチル化画分中の損傷を受けた（例えば、脱アミノ化された）ＤＮＡに起因する偽陽性のＣからＴへのまたはＧからＡへのトランジション変異をコールするリスクを除外する。一部の実施形態では、ＣからＴへのまたはＧからＡへのトランジション変異は、第２のセットの分子の少なくとも１つの配列（例えば、第２のセットの分子の少なくとも２つの配列）が、ＣからＴへのまたはＧからＡへのトランジション変異を含む場合に限り、参照配列と比べてコールされる。一部の実施形態では、ＣからＴへのまたはＧからＡへのトランジション変異は、第２のセットの少なくとも１つのリード（例えば、第２のセットの少なくとも２つのリード）が、ＣからＴへのまたはＧからＡへのトランジション変異を含む場合に限り、参照配列と比べてコールされる。

一部の実施形態では、中等度画分由来の配列リードの第３のセットが得られ、それから、中等度画分由来の分子の配列の第３のセットが決定され得る。これらの実施形態の一部では、ＣからＴへのおよびＧからＡへのトランジション変異が第１のセットの分子の配列に基づきコールされるよりも低い厳密性で、ＣからＴへのまたはＧからＡへのトランジション変異が第３のセットの分子の配列に基づきコールされ得る。これらの実施形態の一部では、ＣからＴへのおよびＧからＡへのトランジション変異が第２のセットの分子の配列に基づきコールされるのと同じ仕方で、ＣからＴへのおよびＧからＡへのトランジション変異が第３のセットの分子の配列に基づきコールされ得る。一部の実施形態では、ＣからＴへのおよびＧからＡへのトランジション変異が第２のセットの分子の配列に基づきコールされるよりも高い厳密性で、ＣからＴへのおよびＧからＡへのトランジション変異が第３のセットの分子の配列に基づきコールされ得る。

一部の実施形態では、中等度画分由来の配列リードの第３のセットが得られ、それから、中等度画分由来の配列リードの第３のセットが、第１および第２のセットに加えて決定され得る。一部の実施形態では、ＣからＴへのおよびＧからＡへのトランジション変異が第１のセットのリードに基づきコールされるよりも低い厳密性で、ＣからＴへのまたはＧからＡへのトランジション変異が第３のセットのリードに基づきコールされ得る。一部の実施形態では、ＣからＴへのおよびＧからＡへのトランジション変異が第２のセットのリードに基づきコールされるのと同じ仕方で、ＣからＴへのおよびＧからＡへのトランジション変異が第３のセットのリードに基づきコールされる。一部の実施形態では、ＣからＴへのおよびＧからＡへのトランジション変異が第２のセットのリードに基づきコールされるよりも高い厳密性で、ＣからＴへのおよびＧからＡへのトランジション変異が第３のセットのリードに基づきコールされる。

一部の実施形態では、閾値が、分子の配列に基づきＣからＴへのまたはＧからＡへのトランジションをコールするために使用され得る。例えば、一部の実施形態では、第１の閾値は、第１のセットの分子の配列に基づきＣからＴへのまたはＧからＡへのトランジションをコールするために使用され、第２の閾値は、第２のセットの分子の配列に基づきＣからＴへのまたはＧからＡへのトランジションをコールするために使用される。一部の実施形態では、第１の閾値は、ＣからＴへのまたはＧからＡへのトランジションをコールするための特異度の第１のレベルを提供し、第２の閾値は、ＣからＴへのまたはＧからＡへのトランジションをコールするための特異度の第２のレベルを提供する。一部の実施形態では、特異度の第１のレベルは、特異度の第２のレベルにほぼ等しい。他の実施形態では、特異度の第１のレベルは、特異度の第２のレベルの１０％、５％、４％、３％、２％、１％、０．５％、０．２％または０．１％以内である。一部の実施形態では、第１および第２の閾値は、ＣからＴへのおよび／またはＧからＡへのトランジションに特異的である。

一部の実施形態では、第１および第２の閾値は、複数の対照試料から決定され得る。一部の実施形態では、第１および第２の閾値は、少なくとも１つの対照試料から決定される。これらの実施形態の一部では、対照試料は、がんを有すると疑われていない個体由来であってもよい。

一部の実施形態では、バックグラウンドシーケンシング誤り率は、本開示の方法に組み込まれ得る。例えば、位置特異的バックグラウンド誤り率の第１の群は、第１のセットの配列の第１のセットの配列のための複数の位置のために使用され得る。一部の例は、第２のセットの配列のための複数の位置のために使用される位置特異的バックグラウンド誤り率の第２の群をさらに含む。これらの例では、第２の群は、第１の群の対応する位置特異的バックグラウンド誤り率よりも高い位置特異的バックグラウンド誤り率を含む。これらの実施形態の一部では、第１のセットの分子の配列に基づきＣからＴへのまたはＧからＡへのトランジション変異をコールするステップは、位置特異的バックグラウンド誤り率の第１の群由来の対応する率を超える頻度での、ＣからＴへのまたはＧからＡへのトランジション変異の観察を要求する。

一部の実施形態では、第１のセットの分子の配列に基づきＣからＴへのまたはＧからＡへのトランジション変異をコールするステップは、少なくとも２、３、４または５倍、位置特異的バックグラウンド誤り率の第１の群由来の対応する率を超える頻度での、ＣからＴへのまたはＧからＡへのトランジション変異の観察を要求する。

一部の実施形態では、第１のセットの分子の配列に基づきＣからＴへのまたはＧからＡへのトランジション変異をコールするステップは、少なくとも９５％、９８％、９９％、９９．５％または９９．９％の信頼水準と一致する量だけ、位置特異的バックグラウンド誤り率の第１の群由来の対応する率を超える頻度での、ＣからＴへのまたはＧからＡへのトランジション変異の観察を要求する。信頼水準は、例えば、標準偏差、平均の標準誤差、信頼区間、ｔスコアおよびＺスコアを含み得る統計的尺度を使用して、適切な統計学に基づき決定され得る。一部の実施形態では、位置特異的バックグラウンド誤り率の第１および第２の群は、複数の対照試料から決定された。一部の実施形態では、対照試料は、がんを有すると疑われていない個体由来であってもよい。一部の実施形態では、位置特異的バックグラウンド誤り率の第１および第２の群は、病歴データ、例えば、以前に得られた配列データのセットにおける所定の信頼閾値に適合しない明らかな変異の頻度を使用して決定された。一部の実施形態では、位置特異的バックグラウンド誤り率の第１および第２の群は、例えば実行時に、それぞれ高メチル化および低メチル化画分由来の分子のリードおよび／または配列を使用して決定された。
１．分配するステップ；エピジェネティック特徴の分析

本明細書に記載されるある特定の実施形態では、本方法は、例えば高メチル化および低メチル化画分、ならびに必要に応じて、１つまたは複数の追加の（例えば、中等度にメチル化された）画分ならびに／または高メチル化および低メチル化画分のサブ画分を提供するために、ＤＮＡの試料を分配するステップを含む。一般的に、試料中のＤＮＡ、例えば、本明細書の他の箇所に記載したｃｆＤＮＡの捕捉されたセットは、解析、例えば、シーケンシング、またはタグ付けおよびシーケンシングの前に、核酸の１つまたは複数の特徴（例えば、メチル化）に基づき物理的に分配され得る。このアプローチは、例えば、高メチル化可変エピジェネティック標的領域が腫瘍細胞に特徴的な高メチル化を示すかどうか、または低メチル化可変エピジェネティック標的領域が腫瘍細胞に特徴的な低メチル化を示すかどうかを決定するために使用され得る。加えて、不均一な核酸集団を分配することによって、例えば、集団の１つの分画（または画分）中により多く存在するまれな核酸分子を富化することによって、まれなシグナルを増加させてもよい。例えば、高メチル化ＤＮＡ中に存在するが、低メチル化ＤＮＡ中には存在が少ない（または存在しない）遺伝的バリエーション（例えば、ＣからＴへのまたはＧからＡへのトランジション変異以外の遺伝的バリエーション）は、試料を高メチル化核酸分子および低メチル化核酸分子に分配することによって、より容易に検出することができる。試料の複数の分画を解析することによって、ゲノムの単一の遺伝子座または核酸の種の多次元解析を実施することができ、したがってより高い感度を達成することができる。

一部の例では、不均一な核酸試料は、２つまたはそれよりも多くの画分（例えば、少なくとも３、４、５、６または７つの画分）に分配される。一部の実施形態では、各分画は、示差的にタグ付けされる。次いで、タグ付けされた画分は、集合的な試料調製および／またはシーケンシングのために共にプールされ得る。分配－タグ付け－プールするステップは、１回よりも多く行われ得、分配の各ラウンドは、異なる特徴に基づき行われ（本明細書に提供される実施例）、他の画分および分配手段とは区別される示差的タグを使用してタグ付けされる。

分配のために使用され得る特徴の例には、配列長さ、メチル化レベル、ヌクレオソーム結合、配列ミスマッチ、免疫沈殿、および／またはＤＮＡに結合するタンパク質が含まれる。得られた画分は、以下の核酸形態のうち１つまたは複数を含み得る：一本鎖ＤＮＡ（ｓｓＤＮＡ）、二本鎖ＤＮＡ（ｄｓＤＮＡ）、短いＤＮＡ断片および長いＤＮＡ断片。一部の実施形態では、核酸の不均一な集団は、１つまたは複数のエピジェネティック改変を有する核酸と、１つまたは複数のエピジェネティック改変を有さない核酸とに分配される。エピジェネティック改変の例には、メチル化の存在または非存在；メチル化のレベル；メチル化の型（例えば、５－メチルシトシン対他の型のメチル化、例えば、アデニンメチル化および／またはシトシンヒドロキシメチル化）；ならびに１つまたは複数のタンパク質、例えばヒストンとの会合および会合のレベルが含まれる。あるいはまたは加えて、核酸の不均一な集団は、ヌクレオソームに関連する核酸分子と、ヌクレオソームを欠く核酸分子とに分配され得る。あるいはまたは加えて、核酸の不均一な集団は、一本鎖ＤＮＡ（ｓｓＤＮＡ）と二本鎖ＤＮＡ（ｄｓＤＮＡ）とに分配され得る。あるいはまたは加えて、核酸の不均一な集団は、核酸長さに基づいて分配してもよい（例えば、最大１６０ｂｐの分子および１６０ｂｐよりも長い長さを有する分子）。

一部の例では、各分画（異なる核酸形態を代表する）は、示差的に標識され、画分は、シーケンシングの前に共にプールされる。他の例では、異なる形態は、別個にシーケンシングされる。

図１は、分配するステップを含む例示的なスキームを示す。異なる核酸（１０１）の集団は、２つまたはそれよりも多くの異なる画分（１０３ａ、ｂ）に分配される（１０２）。各分画（１０３ａ、ｂ）は、異なる核酸形態の代表である。各分画は、明確にタグ付けされる（１０４）。タグ付けされた核酸は、シーケンシング（１０８）の前に共にプールされる（１０７）。リードは、ｉｎｓｉｌｉｃｏで解析される。タグを使用して、異なる画分からのリードを選別する。遺伝子バリアントを検出するための解析を、画分毎のレベルおよび全核酸集団レベルで実施することができる。明らかなＣからＴへのまたはＧからＡへのトランジション変異は、本明細書の他の箇所に詳細に記載したより厳密なパラメーター、またはＣからＴへのもしくはＧからＡへのトランジション変異をコールするために簡単に使用することができない高メチル化画分由来の分子のリードもしくは配列を使用して、高メチル化画分について別個に解析され得る。例示的な解析には、遺伝子バリアント、例えば、ＣＮＶ、ＳＮＶ、インデル、各分画中の核酸の融合を決定するためのｉｎｓｉｌｉｃｏ解析が含まれ得る。一部の例では、ｉｎｓｉｌｉｃｏ解析には、クロマチン構造を決定することが含まれ得る。例えば、配列リードのカバレッジが、クロマチンのヌクレオソーム画分を決定するために使用され得る。より高いカバレッジは、ゲノム領域におけるより高いヌクレオソーム占有率と相関し得るが、より低いカバレッジは、より低いヌクレオソーム占有率またはヌクレオソーム枯渇領域（ＮＤＲ）と相関し得る。

試料には、ヌクレオチド、および通常は非共有結合的な１つまたは複数のタンパク質への結合に対する複製後改変を含む改変が異なる核酸を含み得る。

本明細書の他の箇所に記載した任意のタイプの試料が使用され得る。ある実施形態では、核酸の集団は、新生物、腫瘍もしくはがんを有すると疑われる対象、または新生物、腫瘍もしくはがんと以前に診断された対象由来の組織、血清、血漿または血液試料から得られるものである。核酸の集団は、メチル化の異なるレベルを有する核酸を含む。メチル化は、いずれか１つまたは複数の複製後改変または転写改変から生じ得る。複製後改変には、ヌクレオチドのシトシン、特に、核酸塩基の５位でのシトシンの改変、例えば、５－メチルシトシン、５－ヒドロキシメチルシトシン、５－ホルミルシトシンおよび５－カルボキシルシトシンが含まれる。

一部の実施形態では、元の集団中の核酸は、一本鎖および／または二本鎖であり得る。核酸の一本鎖性対二本鎖性に基づく分配は、例えば、ｓｓＤＮＡを分配するために標識された捕捉プローブを使用すること、およびｄｓＤＮＡを分配するために二本鎖アダプターを使用することによって成し遂げられ得る。

分配するステップは、特徴の相違に基づき核酸に選択的に結合するか、または核酸を分離する、任意の適切な試薬、例えば、本明細書の他の箇所に記載した試薬のいずれかを使用して実施することができる。試薬は、所望の特異性を有する抗体、天然結合パートナーもしくはそのバリアント（Bock et al., Nat Biotech 28: 1106-1114 (2010)；Song et al., Nat Biotech 29: 68-72 (2011)）、または例えば、所与の標的に対する特異性を有するファージディスプレイによって選択された人工ペプチドであり得る。

本明細書で企図される試薬の例には、本明細書に記載されるメチル結合ドメイン（ＭＢＤ）およびメチル結合タンパク質（ＭＢＰ）が含まれる。

同様に、異なる形態の核酸を分配するステップは、遊離または未結合核酸からヒストンに結合した核酸を分離することができるヒストン結合タンパク質を使用して実施することができる。本明細書に開示される方法において使用され得るヒストン結合タンパク質の例には、ＲＢＢＰ４（ＲｂＡｐ４８）およびＳＡＮＴドメインペプチドが含まれる。

一部の試薬および改変に関して、試薬への結合は、核酸が改変を有するか否かに応じて本質的に全か無かの様式で起こり得るが、分離は程度の問題であり得る。そのような例では、改変で過剰出現する核酸は、改変で過少出現する核酸より大きい程度に試薬に結合する。あるいは、改変を有する核酸は、全か無かの様式で結合し得る。しかし、様々なレベルの改変が結合剤から逐次的に溶出され得る。

例えば、一部の実施形態では、分配は、バイナリであるか、または改変の程度／レベルに基づき得る。例えばすべてのメチル化断片は、メチル結合ドメインタンパク質（例えば、ＭｅｔｈｙｌＭｉｎｅｒメチル化ＤＮＡ富化キット（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ））を使用して非メチル化断片から分配することができる。次いで、追加の分配は、メチル結合ドメインおよび結合した断片を含む溶液中の塩濃度を調節することによって、異なるレベルのメチル化を有する断片を溶出するステップを伴い得る。塩濃度が増加すると、より大きいメチル化レベルを有する断片が溶出される。

一部の例では、最終画分は、異なる程度の改変（改変の過剰出現または過少出現）を有する核酸の代表である。過剰出現および過少出現は、集団における鎖あたりの改変の数の中央値と比較した、核酸が有する改変の数によって定義することができる。例えば、試料中の核酸中の５－メチルシトシン残基の数の中央値が２である場合、２つよりも多くの５－メチルシトシン残基を含む核酸はこの改変では過剰出現され、１またはゼロ個の５－メチルシトシン残基を有する核酸は過少出現される。親和性分離の効果は、結合相で改変において過剰出現される核酸および非結合相（すなわち、溶液中）で改変において過少出現される核酸を富化することである。結合相における核酸は、その後の処理の前に溶出させることができる。

ＭｅｔｈｙｌＭｉｎｅｒメチル化ＤＮＡ富化キット（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ）を使用する場合、様々なレベルのメチル化を、逐次的溶出を使用して分配することができる。例えば、低メチル化画分（例えば、メチル化なし）を、核酸集団に、磁気ビーズに結合したキットからのＭＢＤを接触させることによってメチル化画分から分離することができる。ビーズを使用して、非メチル化核酸からメチル化核酸を分離する。次いで、１つまたは複数の溶出ステップを逐次的に実施して、異なるレベルのメチル化を有する核酸を溶出する。例えば、メチル化核酸の第１のセットを、１６０ｍＭまたはそれよりも高い塩濃度、例えば、少なくとも２００ｍＭ、３００ｍＭ、４００ｍＭ、５００ｍＭ、６００ｍＭ、７００ｍＭ、８００ｍＭ、９００ｍＭ、１０００ｍＭまたは２０００ｍＭで溶出することができる。そのようなメチル化核酸を溶出後、磁気分離を再度使用して、高レベルのメチル化核酸を低レベルのメチル化を有する核酸から分離する。溶出および磁気分離ステップを繰り返して、低メチル化画分（例えば、メチル化なしの代表）、メチル化画分（低レベルのメチル化の代表）、および高メチル化画分（高レベルのメチル化の代表）等の様々な画分を作製することができる。

一部の方法では、親和性分離のために使用した作用剤に結合した核酸を、洗浄ステップに供する。洗浄ステップは、親和性剤に弱く結合した核酸を洗い流す。そのような核酸を、平均値または中央値に近い程度まで改変を有する核酸（すなわち、固相に結合したままである核酸と、試料に作用剤を最初に接触させた場合に固相に結合しない核酸との間の中等度）において富化することができる。

親和性分離は、異なる程度の改変を有する核酸の少なくとも２つ、時に３つまたはそれよりも多くの画分をもたらす。画分は依然として別個であるが、少なくとも１つの画分、通常は２つまたは３つ（またはそれよりも多く）の画分の核酸は、通常、アダプターの成分として提供される核酸タグに連結され、異なる画分中の核酸は、１つの画分のメンバーを別の画分のメンバーから区別する異なるタグを受ける。同じ画分の核酸分子に連結されたタグは、互いに同じまたは異なり得る。しかし、互いに異なる場合、タグは、それらが結合される分子を、特定の画分のものであると同定するために、それらのコードの一部を共通して有することができる。

メチル化等の特徴に基づく核酸試料の分割に関するさらなる詳細に関して、参照により本明細書に組み込まれるＷＯ２０１８／１１９４５２号を参照されたい。

一部の実施形態では、核酸分子は、特異的タンパク質またはその断片に結合する核酸分子およびその特異的タンパク質またはその断片に結合しない核酸分子に基づき、異なる画分に分画され得る。

核酸分子は、ＤＮＡ結合タンパク質に基づき分画され得る。タンパク質－ＤＮＡ複合体は、タンパク質の特異的性質に基づき分画され得る。そのような性質の例には、様々なエピトープ、改変（例えば、ヒストンのメチル化またはアセチル化）または酵素活性が含まれる。ＤＮＡに結合し得、分画のための基礎としての役割を果たし得るタンパク質の例には、プロテインＡおよびプロテインＧが含まれ得るがこれらに限定されない。任意の好適な方法が、タンパク質結合領域に基づき核酸分子を分画するために使用され得る。タンパク質結合領域に基づき核酸分子を分画するために使用される方法の例には、ＳＤＳ－ＰＡＧＥ、クロマチン免疫沈降（ＣｈＩＰ）、ヘパリンクロマトグラフィーおよび非対称フィールドフロー分画（ＡＦ４）が含まれるがこれらに限定されない。

一部の実施形態では、核酸の分配は、核酸を、メチル化結合タンパク質（「ＭＢＰ」）のメチル化結合ドメイン（「ＭＢＤ」）と接触させることによって実施される。ＭＢＤは、５－メチルシトシン（５ｍＣ）に結合する。ＭＢＤは、ビオチンリンカーを介して、常磁性ビーズ、例えば、Ｄｙｎａｂｅａｄｓ（登録商標）Ｍ－２８０ストレプトアビジンにカップリングされる。異なる程度のメチル化を有する分画への分配は、ＮａＣｌ濃度を増加させることにより分画を溶出させることによって実施され得る。

本明細書で企図されるＭＢＰの例には、以下が含まれるがこれらに限定されない：
（ａ）ＭｅＣＰ２は、未改変のシトシンよりも５－メチル－シトシンに優先的に結合するタンパク質である；
（ｂ）ＲＰＬ２６、ＰＲＰ８およびＤＮＡミスマッチ修復タンパク質ＭＨＳ６は、未改変のシトシンよりも５－ヒドロキシメチル－シトシンに優先的に結合する；
（ｃ）ＦＯＸＫ１、ＦＯＸＫ２、ＦＯＸＰ１、ＦＯＸＰ４およびＦＯＸＩ３は、未改変のシトシンよりも５－ホルミル－シトシンに好適に結合する（Iurlaro et al., Genome Biol. 14: R119 (2013)）；
（ｄ）１つまたは複数のメチル化ヌクレオチド塩基に対して特異的な抗体。

一般的に、溶出は、分子あたりのメチル化部位の数の関数であり、より多くのメチル化を有する分子は、増加した塩濃度下で溶出する。メチル化の程度に基づきＤＮＡを別個の集団に溶出させるために、増加するＮａＣｌ濃度の一連の溶出緩衝液を使用することができる。塩濃度は、約１００ｍＭ～約２５００ｍＭのＮａＣｌの範囲であり得る。一実施形態では、処理は、３つの画分をもたらす。分子は、第１の塩濃度の溶液と接触され、含まれる分子はメチル結合ドメインを含み、この分子は、ストレプトアビジン等の捕捉部分に結合され得る。第１の塩濃度で、分子の集団はＭＢＤに結合し、集団は非結合のままである。非結合集団は、「低メチル化」集団として分離され得る。例えば、ＤＮＡの低メチル化形態を代表する第１の画分は、低い塩濃度、例えば、１００ｍＭまたは１６０ｍＭで非結合のままの画分である。中等度にメチル化されたＤＮＡを代表する第２の画分は、中等度の塩濃度、例えば、１００ｍＭ～２０００ｍＭの濃度を使用して溶出される。これは、試料からも分離される。ＤＮＡの高メチル化形態を代表する第３の画分は、高い塩濃度、例えば、少なくとも約２０００ｍＭを使用して溶出される。
ａ．画分のタグ付け

一部の実施形態では、ＤＮＡの試料の２つまたはそれよりも多くの画分、例えば、各分画は、示差的にタグ付けされているか、または示差的にタグ付けされる。タグは、核酸等の分子であり得、タグが関連する分子の特色を示す情報を含む。例えば、分子は、試料タグ（１つの試料中の分子を異なる試料中の分子から区別する）、画分タグ（１つの画分中の分子を異なる画分中の分子から区別する）または分子タグ（互いから異なる分子を区別する（一意的および非一意的なタグ付けシナリオの両方で））を有し得る。ある特定の実施形態では、タグは、１つのバーコードまたはバーコードの組合せを含み得る。本明細書で使用される場合、用語「バーコード」は、文脈に応じて、特定のヌクレオチド配列を有する核酸分子、またはヌクレオチド配列自体を指す。バーコードは、例えば、１０～１００ヌクレオチドを有し得る。バーコードのコレクションは、特定の目的で所望される通り、変性配列を有し得るか、またはある特定のハミング距離を有する配列を有し得る。そのため、例えば、試料インデックス、画分インデックスまたは分子インデックスは、分子の異なる末端にそれぞれ結合した１つのバーコードまたは２つのバーコードの組合せから構成され得る。

タグは、タグ（または複数のタグ）を特定の画分と相関させるために、個々のポリヌクレオチド集団画分を標識するために使用され得る。あるいは、タグは、分配するステップを用いない本発明の実施形態において使用され得る。一部の実施形態では、単一のタグが、特異的画分を標識するために使用され得る。一部の実施形態では、複数の異なるタグが、特異的画分を標識するために使用され得る。特異的画分を標識するために複数の異なるタグを使用する実施形態では、１つの画分を標識するために使用されるタグのセットは、他の画分を標識するために使用されるタグのセットに関して容易に識別することができる。一部の実施形態では、タグは、追加の機能を有し得、例えば、タグは、試料供給源をインデックスするために使用され得るか、または一意的分子識別子として使用され得るか（例えば、Kinde et al., Proc Nat'l Acad Sci USA 108: 9530-9535 (2011)、Kou et al., PLoS ONE,11: e0146638 (2016)におけるように、シーケンシング誤差を変異から識別することによってシーケンシングデータの品質を改善するために使用され得る）、または例えば、米国特許第９，５９８，７３１号に記載されるように、非一意的分子識別子として使用され得る。同様に、一部の実施形態では、タグは、追加の機能を有し得、例えば、タグは、試料供給源をインデックスするために使用され得るか、または非一意的分子識別子として使用され得る（シーケンシング誤差を変異から識別することによってシーケンシングデータの品質を改善するために使用され得る）。

一実施形態では、画分タグ付けは、各画分中の分子を画分タグでタグ付けすることを含む。画分を再び合わせ、分子をシーケンシングした後、画分タグは供給源画分を同定する。別の実施形態では、異なる画分は、例えばバーコードの対から構成される異なるセットの分子タグでタグ付けされる。このように、各分子バーコードは、供給源画分、および画分内の分子を区別するために有用であることを示す。例えば、３５個のバーコードの第１のセットは、第１の画分中の分子をタグ付けするために使用され得、一方で、３５個のバーコードの第２のセットは、第２の画分中の分子をタグ付けするために使用され得る。

一部の実施形態では、分配および画分タグでのタグ付けの後に、分子を単一の試行でのシーケンシングのためにプールしてもよい。一部の実施形態では、試料タグを、例えば、画分タグの付加およびプールの後のステップにおいて分子に付加する。試料タグは、単一のシーケンシング試行におけるシーケンシングのために複数の試料から生成された材料をプールすることを容易にすることができる。

あるいは、一部の実施形態では、画分タグは、試料および画分と相関し得る。単純な例として、第１のタグは、第１の試料の第１の画分を示し得；第２のタグは、第１の試料の第２の画分を示し得；第３のタグは、第２の試料の第１の画分を示し得；第４のタグは、第２の試料の第２の画分を示し得る。

タグは、１つまたは複数の特徴に基づき既に分配された分子に結合してもよいが、ライブラリ中の最終のタグ付けされた分子は、もはやその特徴を保有していなくてもよい。例えば、一本鎖ＤＮＡ分子が分配およびタグ付けされ得るが、ライブラリ中の最終のタグ付けされた分子は、おそらく二本鎖である。同様に、ＤＮＡをメチル化の異なるレベルに基づき分配に供してもよいが、最終のライブラリでは、これらの分子に由来するタグ付けされた分子はおそらくメチル化されていない。したがって、ライブラリ中の分子に結合したタグは典型的には、最終的なタグ付けされた分子が由来する「親分子」の特徴を示し、必ずしもタグ付けされた分子自体の特徴ではない。

一例として、バーコード１、２、３、４等を使用して第１の画分中の分子をタグ付けおよび標識し；バーコードＡ、Ｂ、Ｃ、Ｄ等を使用して第２の画分中の分子をタグ付けおよび標識し；ならびにバーコードａ、ｂ、ｃ、ｄ等を使用して第３の画分中の分子をタグ付けおよび標識する。示差的にタグ付けされた画分を、シーケンシング前にプールすることができる。示差的にタグ付けされた画分を、別個にシーケンシングすることができ、または例えば、Ｉｌｌｕｍｉｎａシーケンサーの同じフローセルにおいて、共に同時にシーケンシングすることができる。

シーケンシング後、遺伝子バリアントを検出するためのリードの解析を、画分毎のレベルおよび全核酸集団レベルで実施することができる。タグを使用して、異なる画分からのリードを選別する。解析には、配列情報、ゲノム座標の長さ、カバレッジおよび／またはコピー数を使用して遺伝的およびエピジェネティックバリエーション（メチル化、クロマチン構造等のうち１つまたは複数）を決定するためのｉｎｓｉｌｉｃｏ解析が含まれ得る。一部の実施形態では、より高いカバレッジは、ゲノム領域におけるより高いヌクレオソーム占有率と相関し得るが、より低いカバレッジは、より低いヌクレオソーム占有率またはヌクレオソーム枯渇領域（ＮＤＲ）と相関し得る。
ｂ．核酸の５－メチルシトシンパターンの決定；バイサルファイトシーケンシング

バイサルファイトに基づくシーケンシングおよびその異形は、メチル化状態に関する単一塩基分解能情報を提供し得る核酸のメチル化パターンを決定する手段を提供する。一部の実施形態では、メチル化パターンを決定するステップは、５－メチルシトシン（５ｍＣ）を非メチル化シトシンから区別するステップを含む。一部の実施形態では、メチル化パターンを決定するステップは、Ｎ－メチルアデニンを非メチル化アデニンから区別するステップを含む。一部の実施形態では、メチル化パターンを決定するステップは、５－ヒドロキシメチルシトシン（５ｈｍＣ）、５－ホルミルシトシン（５ｆＣ）および５－カルボキシルシトシン（５ｃａＣ）を非メチル化シトシンから区別するステップを含む。バイサルファイトシーケンシングの例には、酸化的バイサルファイトシーケンシング（ＯＸ－ＢＳ－ｓｅｑ）、Ｔｅｔ支援バイサルファイトシーケンシング（ＴＡＢ－ｓｅｑ）および還元バイサルファイトシーケンシング（ｒｅｄＢＳ－ｓｅｑ）が含まれるがこれらに限定されない。

酸化的バイサルファイトシーケンシング（ＯＸ－ＢＳ－ｓｅｑ）は、最初に５ｈｍＣを５ｆＣに変換し、次いで、バイサルファイトシーケンシングによって進行することによって、５ｍＣと５ｈｍＣとの間を区別するために使用される。Ｔｅｔ支援バイサルファイトシーケンシング（ＴＡＢ－ｓｅｑ）も、５ｍｃと５ｈｍＣとを区別するために使用され得る。ＴＡＢ－ｓｅｑでは、５ｈｍＣは、グルコシル化によって保護される。次いで、Ｔｅｔ酵素が、バイサルファイトシーケンシングによって進行する前に、５ｍＣを５ｃａＣに変換するために使用される。還元バイサルファイトシーケンシングは、５ｆＣを改変シトシンと区別するために使用される。

一般的に、バイサルファイトシーケンシングでは、核酸試料を２つのアリコートに分割し、１つのアリコートがバイサルファイトで処置される。一部の実施形態では、高メチル化画分は、そのような２つのアリコートに分割される。バイサルファイトは、ネイティブのシトシンおよびある特定の改変シトシンヌクレオチド（例えば、５－ホルミルシトシンまたは５－カルボキシルシトシン）をウラシルに変換するが、他の改変シトシン（例えば、５－メチルシトシン、５－ヒドロキシルメチルシトシン）は変換されない。２つのアリコートからの分子の核酸配列の比較は、どのシトシンがウラシルに変換されたかおよび変換されなかったかを示す。その結果として、改変されたおよび改変されなかったシトシンが決定され得る。試料の２つのアリコートへの最初の分割は、少量の核酸のみを含む試料、および／または無細胞ＤＮＡを含む体液等の不均一な細胞／組織起源から構成される試料にとって不利である。

したがって、一部の実施形態では、バイサルファイトシーケンシングは、例えば以下のように、試料を２つのアリコートに最初に分割することなく実施される。一部の実施形態では、集団中の核酸は、本明細書に記載される部分のいずれか等の捕捉部分、すなわち、捕捉または固定され得る標識に連結される。捕捉部分の試料核酸への連結後、試料核酸は、増幅のための鋳型としての役割を果たす。増幅後、元の鋳型は、捕捉部分に連結されたままであるが、アンプリコンは、捕捉部分に連結されない。

捕捉部分は、増幅および／またはシーケンシングプライマー結合部位も提供し得るアダプターの成分として試料核酸に連結され得る。一部の方法では、試料核酸は、両端でアダプターに連結され、両方のアダプターは捕捉部分を有する。好ましくは、アダプター中の任意のシトシン残基は、バイサルファイトの作用に対して保護するために、例えば、５－メチルシトシンによって改変される。一部の例では、捕捉部分は、切断可能な連結（例えば、光切断可能なデスチオビオチン－ＴＥＧ、またはＵＳＥＲ（商標）酵素、Chem. Commun. (Camb). 51: 3266-3269 (2015)で切断可能なウラシル残基）によって元の鋳型に連結され、この場合では、捕捉部分は、所望により除去され得る。

アンプリコンは、変性され、捕捉タグに対する親和性試薬と接触させる。元の鋳型は親和性試薬に結合するが、増幅に起因する核酸分子は結合しない。したがって、元の鋳型は、増幅に起因する核酸分子から分離され得る。

増幅に起因する核酸分子からの元の鋳型の分離後、元の鋳型は、バイサルファイト処置に供され得る。あるいは、増幅産物は、バイサルファイト処置に供され得るが、元の鋳型集団は供されない。そのような処置後、それぞれの集団が増幅され得る（元の鋳型集団の場合では、ウラシルをチミンに変換する）。集団は、捕捉のためのビオチンプローブハイブリダイゼーションにも供され得る。次いで、それぞれの集団が解析され、配列を比較して、元の試料中のどのシトシンが５－メチル化（または５－ヒドロキシルメチル化）されたかを決定する。鋳型集団におけるＴヌクレオチド（ウラシルに変換された非メチル化シトシンに対応する）および増幅集団の対応する位置でのＣヌクレオチドの検出は、非改変Ｃを示す。元の鋳型および増幅集団の対応する位置でのＣの存在は、元の試料中の改変Ｃを示す。

一部の実施形態では、方法は、分子タグ付けされたＤＮＡライブラリの逐次的ＤＮＡ－ｓｅｑおよびバイサルファイト－ｓｅｑ（ＢＩＳ－ｓｅｑ）ＮＧＳライブラリ調製を使用する（ＷＯ２０１８／１１９４５２号、例えば、図４を参照されたい）。このプロセスは、アダプター（例えば、ビオチン）の標識化、ライブラリ全体のＤＮＡ－ｓｅｑ増幅、親分子の回収（例えば、ストレプトアビジンビーズプルダウン）、バイサルファイト変換およびＢＩＳ－ｓｅｑによって実施される。一部の実施形態では、方法は、バイサルファイト処置を伴っておよび伴わずに、親ライブラリ分子の逐次的ＮＧＳ－分取増幅による単一塩基分解能で５－メチルシトシンを同定する。これは、２つのアダプター鎖の１つに標識（例えば、ビオチン）を有するＢＩＳ－ｓｅｑにおいて使用される５－メチル化ＮＧＳ－アダプター（方向性を有するアダプター；５－メチルシトシン置換を伴うＹ字形／フォーク形）を改変することによって達成され得る。試料ＤＮＡ分子は、アダプターをライゲーションされ、増幅される（例えば、ＰＣＲによって）。親分子のみが標識されたアダプター末端を有するので、それらは、標識特異的捕捉法（例えば、ストレプトアビジン－磁気ビーズ）によってそれらの増幅された子孫から選択的に回収され得る。親分子は、５－メチル化マークを保持するので、捕捉されたライブラリにおけるバイサルファイト変換は、ＢＩＳ－ｓｅｑにおいて単一塩基分解能の５－メチル化状態を生じ、対応するＤＮＡ－ｓｅｑに対する分子情報を保持する。一部の実施形態では、バイサルファイト処置されたライブラリは、標準的なマルチプレックスＮＧＳワークフローにおいて試料タグＤＮＡ配列の添加によって、捕捉／ＮＧＳの前に処置されていないライブラリと組み合わされ得る。ＢＩＳ－ｓｅｑワークフローでのように、バイオインフォマティクス解析は、ゲノムのアラインメントおよび５－メチル化塩基の同定に関して実施され得る。つまり、この方法は、ライブラリの増幅後に５－メチルシトシンマークを有する親のライゲーションされた分子を選択的に回収する能力を提供し、それによってバイサルファイト変換されたＤＮＡを並行して処理することを可能にする。これは、ワークフローから抽出されたＤＮＡ－ｓｅｑの情報の品質／感度におけるバイサルファイト処置の破壊的特質を克服する。この方法を用いて、回収されたライゲーションされた親ＤＮＡ分子（標識アダプターを介して）は、完全なＤＮＡライブラリの増幅を可能にし、エピジェネティックＤＮＡ改変を誘発する処置の並行適用を可能にする。本開示は、シトシン－５－メチル化（５－メチルシトシン）を同定するためのＢＩＳ－ｓｅｑ法の使用を考察するが、ＢＩＳ－ｓｅｑ法の使用は、多くの実施形態で必要ではない。ＢＩＳ－ｓｅｑの異形は、ヒドロキシメチル化シトシン（５ｈｍＣ；ＯＸ－ＢＳ－ｓｅｑ、ＴＡＢ－ｓｅｑ）、ホルミルシトシン（５ｆＣ；ｒｅｄＢＳ－ｓｅｑ）およびカルボキシルシトシンを同定するために開発されている。これらの方法論は、本明細書に記載される逐次的な／並行したライブラリ調製と共に実行され得る。
ｃ．改変核酸解析の代替法

一部のそのような方法では、異なる程度の改変（例えば、核酸分子あたり０、１、２、３、４、５つまたはそれよりも多くのメチル基）を有する核酸の集団を、改変の程度に応じて、集団の分画前にアダプターと接触させる。アダプターは、集団中の核酸分子の一端または両端のいずれかに結合する。好ましくは、アダプターは、タグの組合せの数が、低い確率をもたらす十分な数の異なるタグを含み、例えば、同じ開始点および終止点を有する２つの核酸の９５、９９または９９．９％が、同じタグの組合せを受ける。アダプターの結合後、核酸は、アダプター内のプライマー結合部位に結合するプライマーから増幅される。アダプターは、同じまたは異なるタグ（例えば、同じまたは異なる配列のタグ）を有するかにかかわらず、同じまたは異なるプライマー結合部位を含み得るが、好ましくは、アダプターは同じプライマー結合部位を含む。増幅後、核酸は、改変を有する核酸に好ましくは結合する作用剤（例えば、以前に記載されたそのような作用剤）と接触させる。核酸は、作用剤への結合から核酸が改変を有する程度が異なる少なくとも２つの画分（例えば、高メチル化画分および低メチル化画分）に分離される。例えば、作用剤が改変を有する核酸に対して親和性を有する場合、改変で過剰出現する核酸（集団における中央値の出現と比較して）は、優先的に作用剤に結合するが、改変で過小出現する核酸は、作用剤に結合しないか、または作用剤から、より容易に溶出される。分離後、異なる画分は、次いでさらなる処理ステップに供され得、これは、典型的には、別個にであるが並行して、さらなる増幅、および本明細書の他の箇所に記載した配列解析を含む。次いで、異なる画分からの配列データが比較され得る。

そのような分離スキームは、以下の例示的な手順を使用して実施され得る。核酸は、プライマー結合部位およびタグを含むＹ字形のアダプターの両端に連結される。分子が増幅される。次いで、増幅された分子は、５－メチルシトシンに優先的に結合する抗体と接触させることによって分画されて、２つの画分が生じる。一方の画分は、メチル化が欠如している元の分子およびメチル化を失っている増幅コピーを含む。他方の画分は、メチル化を有する元のＤＮＡ分子を含む。次いで、２つの画分は、処理され、メチル化画分のさらなる増幅と共に別個にシーケンシングされる。次いで、２つの画分の配列データが比較され得る。この例では、タグは、メチル化ＤＮＡと非メチル化ＤＮＡとの間を区別するために使用されないが、同じ開始点および終止点を有するリードが同じまたは異なる分子に基づくか否かを決定することができるように、これらの画分内の異なる分子間を区別するために使用される。

本明細書に記載される方法は、核酸の少なくとも一部が１つまたは複数の改変シトシン残基、例えば、５－メチルシトシンおよび以前に記載された他の改変のいずれかを含む核酸の集団（例えば、高メチル化画分）を解析するステップをさらに含んでいてもよい。これらの方法では、核酸の集団を、５Ｃ位置で改変された１つまたは複数のシトシン残基、例えば、５－メチルシトシンを含むアダプターと接触させる。好ましくは、そのようなアダプター中のすべてのシトシン残基もまた改変されるか、またはアダプターのプライマー結合領域中のすべてのそのようなシトシンが改変される。アダプターは、集団中の核酸分子の両端に結合する。好ましくは、アダプターは、タグの組合せの数が、低い確率をもたらす十分な数の異なるタグを含み、例えば、同じ開始点および終止点を有する２つの核酸の９５、９９または９９．９％が、同じタグの組合せを受ける。そのようなアダプターにおけるプライマー結合部位は、同じまたは異なり得るが、好ましくは、同じである。アダプターの結合後、核酸は、アダプターのプライマー結合部位に結合するプライマーから増幅される。増幅された核酸は、第１および第２のアリコートに分割される。第１のアリコートは、さらなる処理を伴いまたは伴わずに、配列データに関してアッセイされる。第１のアリコート中の分子の配列データは、このようにして、核酸分子の最初のメチル化状態にかかわらず決定される。第２のアリコート中の核酸分子は、バイサルファイトで処置される。この処置は、非改変シトシンをウラシルに変換する。次いで、バイサルファイト処置された核酸は、核酸に連結されたアダプターの元のプライマー結合部位に対するプライマーによってプライムされる増幅に供される。これらの核酸はアダプターのプライマー結合部位にシトシンを保持するが、増幅産物がバイサルファイト処置においてウラシルへの変換を受けているこれらのシトシン残基のメチル化を失っているので、アダプターに元々連結された核酸分子（その増幅産物とは異なる）のみがここで増幅可能である。このようにして、少なくともその一部がメチル化されている集団中の元の分子のみが増幅を受ける。増幅後、これらの核酸は、配列解析に供される。第１および第２のアリコートから決定される配列の比較は、数ある中でも、核酸集団中のシトシンがメチル化に供されたことを示し得る。

そのような解析は、以下の例示的な手順を使用して実施され得る。メチル化ＤＮＡは、プライマー結合部位およびタグを含む両端でＹ字形のアダプターに連結される。アダプター中のシトシンは、５－メチル化される。プライマーのメチル化は、その後のバイサルファイトステップにおいてプライマー結合部位を保護する働きをする。アダプターの結合後、ＤＮＡ分子が増幅される。増幅産物は、バイサルファイト処置を伴っておよび伴わずに、シーケンシングのために２つのアリコートに分割される。バイサルファイトシーケンシングに供されないアリコートは、さらなる処理を伴ってまたは伴わずに、配列解析に供され得る。他のアリコートは、バイサルファイトによって処置され、これは、非メチル化シトシンをウラシルに変換する。シトシンのメチル化によって保護されたプライマー結合部位のみが、元のプライマー結合部位に特異的なプライマーと接触した場合に増幅を支持し得る。このようにして、第１の増幅からのコピーではない元の分子のみが、さらなる増幅に供される。次いで、さらに増幅された分子が、配列解析に供される。次いで、２つのアリコートからの配列が比較され得る。上記で考察された分離スキームにおけるように、アダプター中の核酸タグは、メチル化ＤＮＡと非メチル化ＤＮＡとの間を区別するために使用されないが、同じ画分内の核酸分子を区別するために使用される。
２．標的領域；示差的捕捉およびシーケンシング深度

一部の実施形態では、本方法は、標的領域の複数のセットのための試験対象から得られるｃｆＤＮＡを捕捉するステップを含む。標的領域は、エピジェネティック標的領域を含み、これは、それらが腫瘍または健康な細胞が起源であるか否かに応じて、メチル化レベルおよび／または断片化パターンの差異を示し得る。標的領域は、配列可変標的領域も含み、これは、それらが腫瘍または健康な細胞が起源であるか否かに応じて、配列の差異を示し得る。捕捉するステップは、ｃｆＤＮＡ分子の捕捉されたセットを生じ、配列可変標的領域セットに対応するｃｆＤＮＡ分子は、エピジェネティック標的領域セットに対応するｃｆＤＮＡ分子よりもｃｆＤＮＡ分子の捕捉されたセットの高い捕捉収量で捕捉される。

一部の実施形態では、本方法は、試験対象から得られたｃｆＤＮＡを、標的特異的プローブのセットと接触させるステップを含み、標的特異的プローブのセットは、エピジェネティック標的領域セットに対応するｃｆＤＮＡよりも高い捕捉収量で配列可変標的領域セットに対応するｃｆＤＮＡを捕捉するように構成される。

より高いシーケンシング深度が、エピジェネティック標的領域を解析するために必要であり得るよりも十分な信頼性または精度で配列可変標的領域を解析するために必要であり得るので、エピジェネティック標的領域セットに対応するｃｆＤＮＡよりも高い捕捉収量で、配列可変標的領域セットに対応するｃｆＤＮＡを捕捉することが有益であり得る。より高いシーケンシング深度は、ＤＮＡ分子あたりより多くのリードをもたらし得、領域あたりより多くの一意的分子を捕捉することによって容易になり得る。断片化パターン（例えば、転写開始部位またはＣＴＣＦ結合部位の摂動について試験するため）または断片の存在量（例えば、高メチル化画分および低メチル化画分中の）を決定するために必要なデータの容量は、一般的に、がんに関係する配列の変異の存在または非存在を決定するために必要なデータの容量よりも少ない。標的領域セットを異なる収量で捕捉することにより、同じシーケンシング実行（例えば、プールされた混合物を使用して、および／または同じシーケンシングセルにおいて）における異なるシーケンシング深度まで標的領域をシーケンシングすることを容易にし得る。

様々な実施形態では、本方法は、上記の考察と一致して、捕捉されたｃｆＤＮＡを、例えば、エピジェネティックおよび配列可変標的領域セットに関して異なる程度のシーケンシング深度までシーケンシングするステップをさらに含む。
ａ．捕捉されたセット；示差的捕捉およびシーケンシング深度

一部の実施形態では、ＤＮＡ（例えば、ｃｆＤＮＡ）の捕捉されたセットが提供される。開示される方法に関して、例えば、本明細書に記載される捕捉するステップおよび／または分配するステップの後、ＤＮＡの捕捉されたセットが提供され得る。捕捉されたセットは、配列可変標的領域セットおよびエピジェネティック標的領域セットに対応するＤＮＡを含み得る。一部の実施形態では、捕捉された配列可変標的領域ＤＮＡの量は、標的化された領域のサイズ（フットプリントサイズ）の差異について正規化した場合、捕捉されたエピジェネティック標的領域ＤＮＡの量よりも多い。

あるいは、配列可変標的領域セットに対応するＤＮＡおよびエピジェネティック標的領域セットに対応するＤＮＡをそれぞれ含む、第１および第２の捕捉されたセットを提供してもよい。第１および第２の捕捉されたセットを組み合わせて、組み合わせた捕捉されたセットを提供してもよい。

上記で考察された組み合わせた捕捉されたセットを含む、配列可変標的領域セットおよびエピジェネティック標的領域セットに対応するＤＮＡを含む捕捉されたセットにおいて、配列可変標的領域セットに対応するＤＮＡは、エピジェネティック標的領域セットに対応するＤＮＡよりも高い濃度で、例えば１．１～１．２倍高い濃度、１．２～１．４倍高い濃度、１．４～１．６倍高い濃度、１．６～１．８倍高い濃度、１．８～２．０倍高い濃度、２．０～２．２倍高い濃度、２．２～２．４倍高い濃度、２．４～２．６倍高い濃度、２．６～２．８倍高い濃度、２．８～３．０倍高い濃度、３．０～３．５倍高い濃度、３．５～４．０、４．０～４．５倍高い濃度、４．５～５．０倍高い濃度、５．０～５．５倍高い濃度、５．５～６．０倍高い濃度、６．０～６．５倍高い濃度、６．５～７．０倍高い、７．０～７．５倍高い濃度、７．５～８．０倍高い濃度、８．０～８．５倍高い濃度、８．５～９．０倍高い濃度、９．０～９．５倍高い濃度、９．５～１０．０倍高い濃度、１０～１１倍高い濃度、１１～１２倍高い濃度、１２～１３倍高い濃度、１３～１４倍高い濃度、１４～１５倍高い濃度、１５～１６倍高い濃度、１６～１７倍高い濃度、１７～１８倍高い濃度、１８～１９倍高い濃度、または１９～２０倍高い濃度で存在し得る。濃度の差の程度は、定義の節で考察したように、標的領域のフットプリントサイズに関する正規化を説明する。
ｉ．エピジェネティック標的領域セット

エピジェネティック標的領域セットは、新生物（例えば、腫瘍またはがん）細胞からのＤＮＡと、健康な細胞、例えば非新生物循環細胞からのＤＮＡとを識別する可能性がある１つまたは複数のタイプの標的領域を含み得る。そのような領域の例示的なタイプを、本明細書において詳細に考察する。エピジェネティック標的領域セットはまた、例えば本明細書に記載される１つまたは複数の対照領域も含み得る。

一部の実施形態では、エピジェネティック標的領域セットは、少なくとも１００ｋｂ、例えば、少なくとも２００ｋｂ、少なくとも３００ｋｂ、または少なくとも４００ｋｂのフットプリントを有する。一部の実施形態では、エピジェネティック標的領域セットは、１００～１０００ｋｂ、例えば、１００～２００ｋｂ、２００～３００ｋｂ、３００～４００ｋｂ、４００～５００ｋｂ、５００～６００ｋｂ、６００～７００ｋｂ、７００～８００ｋｂ、８００～９００ｋｂ、および９００～１，０００ｋｂの範囲のフットプリントを有する。
一部の実施形態では、エピジェネティック標的領域セットは、少なくとも１０００ｋｂ、少なくとも２０００ｋｂ、少なくとも３０００ｋｂ、少なくとも４０００ｋｂ、少なくとも５０００ｋｂ、少なくとも６０００ｋｂ、少なくとも７０００ｋｂ、少なくとも８０００ｋｂ、少なくとも９０００ｋｂ、または少なくとも１Ｍｂのフットプリントを有する。一部の実施形態では、エピジェネティック標的領域セットは、１Ｍｂ～２０Ｍｂ、例えば、１～１．２Ｍｂ、１．２～１．４Ｍｂ、１．４～１．６Ｍｂ、１．６～１．８Ｍｂ、１．８～２Ｍｂ、２～２．２５Ｍｂ、２．２５～２．５Ｍｂ、２．５～２．７５Ｍｂ、２．７５～３Ｍｂ、３～３．２５Ｍｂ、３．２５～３．５Ｍｂ、３．５～３．７５Ｍｂ、３．７５～４Ｍｂ、４．～４．２５Ｍｂ、４．２５～４．５Ｍｂ、４．５～４．７５Ｍｂ、４．７５～５Ｍｂ、５～５．５Ｍｂ、５．５～６Ｍｂ、６～６．５Ｍｂ、６．５～７Ｍｂ、７～７．５Ｍｂ、７．５～８Ｍｂ、８～８．５Ｍｂ、８．５～９Ｍｂ、９～９．５Ｍｂ、９．５～１０Ｍｂ、１０～１２Ｍｂ、１２～１４Ｍｂ、１４～１６Ｍｂ、１６～１８Ｍｂおよび１８～２０Ｍｂの範囲内のフットプリントを有する。一部の実施形態では、エピジェネティック標的領域セットは、０．２～０．８メガベース、０．８～１．５メガベース、１．５～３メガベースまたは３～８メガベースの範囲内のフットプリントを有する。

（ａ）高メチル化可変標的領域
一部の実施形態では、エピジェネティック標的領域セットは、１つまたは複数の高メチル化可変標的領域を含む。一般的に、高メチル化可変標的領域は、観察されたメチル化レベルの増加が、試料（例えば、ｃｆＤＮＡの試料）が新生物細胞、例えば腫瘍またはがん細胞によって産生されるＤＮＡを含有する可能性の増加を示す領域を指す。例えば、腫瘍抑制遺伝子のプロモーターの高メチル化は、繰り返し観察されている。例えば、Ｋａｎｇｅｔａｌ．，ＧｅｎｏｍｅＢｉｏｌ．１８：５３（２０１７）およびそこに引用されている参考文献を参照されたい。

結腸直腸がんにおけるメチル化可変標的領域に関する広範な考察は、Ｌａｍｅｔａｌ．，ＢｉｏｃｈｉｍＢｉｏｐｈｙｓＡｃｔａ．１８６６：１０６－２０（２０１６）に提供される。これらは、ＶＩＭ、ＳＥＰＴ９、ＩＴＧＡ４、ＯＳＭ４、ＧＡＴＡ４、およびＮＤＲＧ４を含む。結腸直腸がん（ＣＲＣ）の研究に基づく遺伝子またはその一部を含む高メチル化可変標的領域の例示的なセットを表２Ａに提供する。これらの遺伝子の多くはおそらく、結腸直腸がん以外のがんに対しても関連を有し、例えばＴＰ５３は、極めて重要な腫瘍抑制因子として広く認識されており、この遺伝子の高メチル化に基づく不活化は、共通の腫瘍形成機構であり得る。

一部の実施形態では、高メチル化可変標的領域は、表２Ａに記載の複数の遺伝子またはその一部、例えば、表２Ａに記載の遺伝子またはその一部の少なくとも１０％、２０％、３０％、４０％、５０％、６０％、７０％、８０％、９０％、または１００％を含む。例えば、標的領域として含まれる各々の遺伝子座に関して、遺伝子の転写開始部位と終止コドン（代替的にスプライシングされる遺伝子に関しては最後の終止コドン）との間に結合するハイブリダイゼーション部位を有する１つまたは複数のプローブが存在し得る。一部の実施形態では、この１つまたは複数のプローブは、表２Ａに記載の遺伝子またはその一部の上流および／または下流の３００ｂｐ以内、例えば、２００または１００ｂｐ以内に結合する。

様々なタイプの肺がんにおけるメチル化可変標的領域は、例えば、Ｏｏｋｉｅｔａｌ．，Ｃｌｉｎ．ＣａｎｃｅｒＲｅｓ．２３：７１４１－５２（２０１７）；Ｂｅｌｉｎｋｓｙ，Ａｎｎｕ．Ｒｅｖ．Ｐｈｙｓｉｏｌ．７７：４５３－７４（２０１５）；Ｈｕｌｂｅｒｔｅｔａｌ．，Ｃｌｉｎ．ＣａｎｃｅｒＲｅｓ．２３：１９９８－２００５（２０１７）；Ｓｈｉｅｔａｌ．，ＢＭＣＧｅｎｏｍｉｃｓ１８：９０１（２０１７）；Ｓｃｈｎｅｉｄｅｒｅｔａｌ．，ＢＭＣＣａｎｃｅｒ．１１：１０２（２０１１）；Ｌｉｓｓａｅｔａｌ．，ＴｒａｎｓｌＬｕｎｇＣａｎｃｅｒＲｅｓ５（５）：４９２－５０４（２０１６）；Ｓｋｖｏｒｔｓｏｖａｅｔａｌ．，Ｂｒ．Ｊ．Ｃａｎｃｅｒ．９４（１０）：１４９２－１４９５（２００６）；Ｋｉｍｅｔａｌ．，ＣａｎｃｅｒＲｅｓ．６１：３４１９－３４２４（２００１）；Ｆｕｒｏｎａｋａｅｔａｌ．，ＰａｔｈｏｌｏｇｙＩｎｔｅｒｎａｔｉｏｎａｌ５５：３０３－３０９（２００５）；Ｇｏｍｅｓｅｔａｌ．，Ｒｅｖ．Ｐｏｒｔ．Ｐｎｅｕｍｏｌ．２０：２０－３０（２０１４）；Ｋｉｍｅｔａｌ．，Ｏｎｃｏｇｅｎｅ．２０：１７６５－７０（２００１）；Ｈｏｐｋｉｎｓ－Ｄｏｎａｌｄｓｏｎｅｔａｌ．，ＣｅｌｌＤｅａｔｈＤｉｆｆｅｒ．１０：３５６－６４（２００３）；Ｋｉｋｕｃｈｉｅｔａｌ．，Ｃｌｉｎ．ＣａｎｃｅｒＲｅｓ．１１：２９５４－６１（２００５）；Ｈｅｌｌｅｒｅｔａｌ．，Ｏｎｃｏｇｅｎｅ２５：９５９－９６８（２００６）；Ｌｉｃｃｈｅｓｉｅｔａｌ．，Ｃａｒｃｉｎｏｇｅｎｅｓｉｓ．２９：８９５－９０４（２００８）；Ｇｕｏｅｔａｌ．，Ｃｌｉｎ．ＣａｎｃｅｒＲｅｓ．１０：７９１７－２４（２００４）；Ｐａｌｍｉｓａｎｏｅｔａｌ．，ＣａｎｃｅｒＲｅｓ．６３：４６２０－４６２５（２００３）；およびＴｏｙｏｏｋａｅｔａｌ．，ＣａｎｃｅｒＲｅｓ．６１：４５５６－４５６０，（２００１）において詳細に考察されている。

肺がんの研究に基づく遺伝子またはその一部を含む例示的な高メチル化可変標的領域セットを表２Ｂに提供する。これらの遺伝子の多くはおそらく、肺がん以外のがんに対しても関連を有する可能性があり、例えばＣａｓｐ８（カスパーゼ８）は、プログラム細胞死における重要な酵素であり、この遺伝子の高メチル化に基づく不活化は、肺がんに限定されない共通の腫瘍形成機構であり得る。加えて、いくつかの遺伝子が表２Ａおよび表２Ｂの両方に出現し、一般性を示している。

表２Ｂにおいて同定された標的領域に関する前述の実施形態のいずれかを、表２Ａにおいて同定された標的領域に関する上記の実施形態のいずれかと組み合わせてもよい。一部の実施形態では、高メチル化可変標的領域は、表２Ａまたは表２Ｂに記載される複数の遺伝子またはその一部、例えば表２Ａまたは表２Ｂに記載される遺伝子またはその一部の少なくとも１０％、２０％、３０％、４０％、５０％、６０％、７０％、８０％、９０％、または１００％を含む。

追加の高メチル化標的領域を、例えばがんゲノムアトラス（ＣａｎｃｅｒＧｅｎｏｍｅＡｔｌａｓ）から得てもよい。Ｋａｎｇｅｔａｌ．，ＧｅｎｏｍｅＢｉｏｌｏｇｙ１８：５３（２０１７）は、乳房、結腸、腎臓、肝臓、および肺からの高メチル化標的領域を使用してＣａｎｃｅｒＬｏｃａｔｏｒと呼ばれる確率論的方法の構築を記載している。一部の実施形態では、高メチル化標的領域は、１つまたは複数のタイプのがんに対して特異的であり得る。したがって一部の実施形態では、高メチル化標的領域は、乳がん、結腸がん、腎臓がん、肝臓がん、および肺がんのうちの１つ、２つ、３つ、４つ、または５つにおいて高メチル化を集合的に示す高メチル化標的領域の１つ、２つ、３つ、４つ、または５つのサブセットを含む。

（ｂ）低メチル化可変標的領域
グローバルな低メチル化は、様々ながんにおいて共通して観察される現象である。例えば、Ｈｏｎｅｔａｌ．，ＧｅｎｏｍｅＲｅｓ．２２：２４６－２５８（２０１２）（乳がん）；Ｅｈｒｌｉｃｈ，Ｅｐｉｇｅｎｏｍｉｃｓ１：２３９－２５９（２００９）（結腸がん、卵巣がん、前立腺がん、白血病、肝細胞がん、および子宮頸がんにおける低メチル化に関する知見を記載する総説論文）を参照されたい。例えば、反復エレメント、例えばＬＩＮＥ１エレメント、Ａｌｕエレメント、セントロメアタンデムリピート、傍セントロメアタンデムリピート、およびサテライトＤＮＡ等の領域、ならびに通常は健康な細胞中でメチル化されている遺伝子間領域は、腫瘍細胞中ではメチル化の低減を示し得る。したがって一部の実施形態では、エピジェネティック標的領域セットは、低メチル化可変標的領域を含み、観察されたメチル化レベルの減少は、試料（例えば、ｃｆＤＮＡの試料）が、新生物細胞、例えば腫瘍細胞またはがん細胞によって産生されたＤＮＡを含有する可能性の増加を示している。

一部の実施形態では、低メチル化可変標的領域は、反復エレメントおよび／または遺伝子間領域を含む。一部の実施形態では、反復エレメントは、ＬＩＮＥ１エレメント、Ａｌｕエレメント、セントロメアタンデムリピート、傍セントロメアタンデムリピート、および／またはサテライトＤＮＡのうちの１つ、２つ、３つ、４つ、または５つを含む。

がん関連低メチル化を示す例示的な特定のゲノム領域は、例えばｈｇ１９ヒトゲノム構築物に従って、ヒト第１染色体のヌクレオチド８４０３５６５～８９５３７０８および１５１１０４７０１～１５１１０６０３５を含む。一部の実施形態では、低メチル化可変標的領域は、重複するか、またはこれらの領域の１つもしくは両方を含む。

（ｃ）ＣＴＣＦ結合領域
ＣＴＣＦは、クロマチンの組織化に寄与し、しばしばコヒーシンと共局在するＤＮＡ結合タンパク質である。ＣＴＣＦ結合部位の摂動は、多様な異なるがんにおいて報告されている。例えば、２０１５年６月８日にオンライン発行された、Ｋａｔａｉｎｅｎｅｔａｌ．，ＮａｔｕｒｅＧｅｎｅｔｉｃｓ，ｄｏｉ：１０．１０３８／ｎｇ．３３３５；Ｇｕｏｅｔａｌ．，Ｎａｔ．Ｃｏｍｍｕｎ．９：１５２０（２０１８）を参照されたい。ＣＴＣＦ結合は、シーケンシングによって、例えば断片長解析を通して検出することができる、ｃｆＤＮＡの認識可能なパターンをもたらす。例えば、シーケンシングに基づく断片長解析に関する詳細は、その各々が参照により本明細書に組み込まれる、Ｓｎｙｄｅｒｅｔａｌ．，Ｃｅｌｌ１６４：５７－６８（２０１６）；ＷＯ２０１８／００９７２３号；および米国特許出願公開第２０１７０２１１１４３Ａ１号に提供されている。

このように、ＣＴＣＦ結合の摂動は、ｃｆＤＮＡの断片化パターンの変動をもたらす。そのため、ＣＴＣＦ結合部位は、１つのタイプの断片化可変標的領域を表す。

多くの公知のＣＴＣＦ結合部位が存在する。例えば、インターネット上のｉｎｓｕｌａｔｏｒｄｂ．ｕｔｈｓｃ．ｅｄｕ／で入手可能であるＣＴＣＦＢＳＤＢ（ＣＴＣＦＢｉｎｄｉｎｇＳｉｔｅＤａｔａｂａｓｅ）；Ｃｕｄｄａｐａｈｅｔａｌ．，ＧｅｎｏｍｅＲｅｓ．１９：２４－３２（２００９）；Ｍａｒｔｉｎｅｔａｌ．，Ｎａｔ．Ｓｔｒｕｃｔ．Ｍｏｌ．Ｂｉｏｌ．１８：７０８－１４（２０１１）；Ｒｈｅｅｅｔａｌ．，Ｃｅｌｌ．１４７：１４０８－１９（２０１１）を参照されたく、それらはその各々が参照により本明細書に組み込まれる。例示的なＣＴＣＦ結合部位は、ｈｇ１９またはｈｇ３８ヒトゲノム構築物に従って、第８染色体上のヌクレオチド５６０１４９５５～５６０１６１６１および第１３染色体上のヌクレオチド９５３５９１６９～９５３６０４７３である。

したがって、一部の実施形態では、エピジェネティック標的領域セットは、ＣＴＣＦ結合領域を含む。一部の実施形態では、ＣＴＣＦ結合領域は、少なくとも１０、２０、５０、１００、２００、もしくは５００個のＣＴＣＦ結合領域、または１０～２０、２０～５０、５０～１００、１００～２００、２００～５００、もしくは５００～１０００個のＣＴＣＦ結合領域、例えば上記のまたはＣＴＣＦＢＳＤＢもしくは上記で引用したＣｕｄｄａｐａｈら、Ｍａｒｔｉｎら、もしくはＲｈｅｅらの論文の１つもしくは複数におけるＣＴＣＦ結合領域を含む。

一部の実施形態では、ＣＴＣＦ部位の少なくとも一部はメチル化されていてもメチル化されていなくてもよく、メチル化状態は、細胞ががん細胞であるか否かと相関する。一部の実施形態では、エピジェネティック標的領域セットは、ＣＴＣＦ結合部位の少なくとも１００ｂｐ、少なくとも２００ｂｐ、少なくとも３００ｂｐ、少なくとも４００ｂｐ、少なくとも５００ｂｐ、少なくとも７５０ｂｐ、少なくとも１０００ｂｐ上流および／または下流の領域を含む。

（ｄ）転写開始部位
転写開始部位もまた、新生物細胞において摂動を示し得る。例えば、造血系列の健康な細胞における様々な転写開始部位でのヌクレオソーム組織化は、健康な個体におけるｃｆＤＮＡに実質的に寄与するが、新生物細胞におけるそれらの転写開始部位でのヌクレオソーム組織化とは異なり得る。これは、異なるｃｆＤＮＡパターンをもたらすが、これらは例えば、一般的にＳｎｙｄｅｒｅｔａｌ．，Ｃｅｌｌ１６４：５７－６８（２０１６）；ＷＯ２０１８／００９７２３号；および米国特許出願公開第２０１７０２１１１４３Ａ１号において考察されるように、シーケンシングによって検出することができる。

このように、転写開始部位の摂動もまた、ｃｆＤＮＡの断片化パターンの変動をもたらす。そのため、転写開始部位もまた、１つのタイプの断片化可変標的領域を表す。

ヒト転写開始部位は、インターネット上のｄｂｔｓｓ．ｈｇｃ．ｊｐで利用可能なＤＢＴＳＳ（ＤａｔａＢａｓｅｏｆＨｕｍａｎＴｒａｎｓｃｒｉｐｔｉｏｎＳｔａｒｔＳｉｔｅｓ）から入手可能であり、参照により本明細書に組み込まれる、Ｙａｍａｓｈｉｔａｅｔａｌ．，ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．３４（Ｄａｔａｂａｓｅｉｓｓｕｅ）：Ｄ８６－Ｄ８９（２００６）に記載されている。

したがって、一部の実施形態では、エピジェネティック標的領域セットは、転写開始部位を含む。一部の実施形態では、転写開始部位は、少なくとも１０、２０、５０、１００、２００、もしくは５００個の転写開始部位、または１０～２０、２０～５０、５０～１００、１００～２００、２００～５００、もしくは５００～１０００個の転写開始部位、例えばＤＢＴＳＳに記載される転写開始部位を含む。一部の実施形態では、転写開始部位の少なくとも一部はメチル化されていてもメチル化されていなくてもよく、メチル化状態は、細胞ががん細胞であるか否かと相関する。一部の実施形態では、エピジェネティック標的領域セットは、転写開始部位の少なくとも１００ｂｐ、少なくとも２００ｂｐ、少なくとも３００ｂｐ、少なくとも４００ｂｐ、少なくとも５００ｂｐ、少なくとも７５０ｂｐ、少なくとも１０００ｂｐ上流および／または下流の領域を含む。
（ｅ）局所的増幅

局所的増幅は、体細胞変異であるが、これらは、メチル化の変化等のある特定のエピジェネティック変化を検出するためのアプローチと類似の様式でリード頻度に基づきシーケンシングによって検出することができる。そのため、がんにおける局所的増幅を示し得る領域を、エピジェネティック標的領域セットに含めることができ、そうした領域は、ＡＲ、ＢＲＡＦ、ＣＣＮＤ１、ＣＣＮＤ２、ＣＣＮＥ１、ＣＤＫ４、ＣＤＫ６、ＥＧＦＲ、ＥＲＢＢ２、ＦＧＦＲ１、ＦＧＦＲ２、ＫＩＴ、ＫＲＡＳ、ＭＥＴ、ＭＹＣ、ＰＤＧＦＲＡ、ＰＩＫ３ＣＡ、およびＲＡＦ１のうちの１つまたは複数を含み得る。例えば一部の実施形態では、エピジェネティック標的領域セットは、前述の標的の少なくとも２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、または１８個を含む。

（ｆ）メチル化対照領域
データの検証を容易にするために対照領域を含めることは有用であり得る。一部の実施形態では、エピジェネティック標的領域セットは、ＤＮＡががん細胞または正常細胞に由来するか否かにかかわらず、本質的に全ての試料においてメチル化されているまたはメチル化されていないと予想される対照領域を含む。一部の実施形態では、エピジェネティック標的領域セットは、本質的に全ての試料において低メチル化されると予想される対照低メチル化領域を含む。一部の実施形態では、エピジェネティック標的領域セットは、本質的に全ての試料において高メチル化されると予想される対照高メチル化領域を含む。
ｉｉ．配列可変標的領域セット

一部の実施形態では、配列可変標的領域セットは、がんにおいて体細胞変異を受けることが公知である複数の領域を含む。

一部の実施形態では、配列可変標的領域セットは、がんを有する対象の既定の比率が、パネルにおける１つまたは複数の異なる遺伝子またはゲノム領域において遺伝子バリアントまたは腫瘍マーカーを示すように選択される複数の異なる遺伝子またはゲノム領域（「パネル」）を標的とする。パネルは、シーケンシング領域を固定数の塩基対に限定するように選択され得る。パネルは、例えば、本明細書において他所で記載されるようにプローブの親和性および／または量を調節することによって、ＤＮＡの所望の量をシーケンシングするように選択され得る。パネルはさらに、所望の配列リードの深度を達成するように選択され得る。パネルは、シーケンシングされた塩基対の量に関して所望の配列リード深度または配列リードカバレッジを達成するように選択され得る。パネルは、試料中の１つまたは複数の遺伝子バリアントの検出に関して、理論的感度、理論的特異度、および／または理論的精度を達成するように選択され得る。

領域のパネルを検出するためのプローブは、目的のゲノム領域（ホットスポット領域）ならびにヌクレオソーム認識プローブ（例えば、ＫＲＡＳコドン１２および１３）を検出するためのプローブを含み得、ヌクレオソーム結合パターンおよびＧＣ配列組成によって影響を受けるｃｆＤＮＡカバレッジおよび断片サイズ変動の解析に基づいて捕捉を最適化するように設計され得る。本明細書において使用される領域はまた、ヌクレオソーム位置およびＧＣモデルに基づいて最適化された非ホットスポット領域も含み得る。

目的のゲノム位置の一覧の例は、表３および表４に見出され得る。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表３の遺伝子の少なくとも５個、少なくとも１０個、少なくとも１５個、少なくとも２０個、少なくとも２５個、少なくとも３０個、少なくとも３５個、少なくとも４０個、少なくとも４５個、少なくとも５０個、少なくとも５５個、少なくとも６０個、少なくとも６５個、または７０個のうちの少なくとも一部を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表３のＳＮＶの少なくとも５個、少なくとも１０個、少なくとも１５個、少なくとも２０個、少なくとも２５個、少なくとも３０個、少なくとも３５個、少なくとも４０個、少なくとも４５個、少なくとも５０個、少なくとも５５個、少なくとも６０個、少なくとも６５個、または７０個を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表３の融合の少なくとも１個、少なくとも２個、少なくとも３個、少なくとも４個、少なくとも５個、または６個を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表３のインデルの少なくとも１個、少なくとも２個、または３個のうちの少なくとも一部を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表４の遺伝子の少なくとも５個、少なくとも１０個、少なくとも１５個、少なくとも２０個、少なくとも２５個、少なくとも３０個、少なくとも３５個、少なくとも４０個、少なくとも４５個、少なくとも５０個、少なくとも５５個、少なくとも６０個、少なくとも６５個、少なくとも７０個、または７３個のうちの少なくとも一部を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表４のＳＮＶの少なくとも５個、少なくとも１０個、少なくとも１５個、少なくとも２０個、少なくとも２５個、少なくとも３０個、少なくとも３５個、少なくとも４０個、少なくとも４５個、少なくとも５０個、少なくとも５５個、少なくとも６０個、少なくとも６５個、少なくとも７０個、または７３個を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表４の融合の少なくとも１個、少なくとも２個、少なくとも３個、少なくとも４個、少なくとも５個、または６個を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表４のインデルの少なくとも１個、少なくとも２個、少なくとも３個、少なくとも４個、少なくとも５個、少なくとも６個、少なくとも７個、少なくとも８個、少なくとも９個、少なくとも１０個、少なくとも１１個、少なくとも１２個、少なくとも１３個、少なくとも１４個、少なくとも１５個、少なくとも１６個、少なくとも１７個、または１８個のうちの少なくとも一部を含む。目的のこれらのゲノム位置の各々は、所与のパネルに関する骨格領域またはホットスポット領域として同定され得る。目的のホットスポットゲノム位置の一覧の例は、表５に見出され得る。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表５の遺伝子の少なくとも１個、少なくとも２個、少なくとも３個、少なくとも４個、少なくとも５個、少なくとも６個、少なくとも７個、少なくとも８個、少なくとも９個、少なくとも１０個、少なくとも１１個、少なくとも１２個、少なくとも１３個、少なくとも１４個、少なくとも１５個、少なくとも１６個、少なくとも１７個、少なくとも１８個、少なくとも１９個、または少なくとも２０個のうちの少なくとも一部を含む。各々のホットスポットゲノム領域を、関連する遺伝子、それが存在する染色体、遺伝子座を表すゲノムの開始位置および終止位置、遺伝子座の塩基対の長さ、遺伝子によってカバーされるエクソン、ならびに目的の所与のゲノム領域が捉えようとし得る重要な特色（例えば、変異のタイプ）を含むいくつかの特徴と共に記載する。

加えてまたはあるいは、適した標的領域セットは、文献から入手可能である。例えば、参照により本明細書に組み込まれる、Ｇａｌｅｅｔａｌ．，ＰＬｏＳＯｎｅ１３：ｅ０１９４６３０（２０１８）は、配列可変標的領域セットの一部または全てとして使用することができる３５個のがんに関係する遺伝子標的のパネルを記載している。これらの３５個の標的は、ＡＫＴ１、ＡＬＫ、ＢＲＡＦ、ＣＣＮＤ１、ＣＤＫ２Ａ、ＣＴＮＮＢ１、ＥＧＦＲ、ＥＲＢＢ２、ＥＳＲ１、ＦＧＦＲ１、ＦＧＦＲ２、ＦＧＦＲ３、ＦＯＸＬ２、ＧＡＴＡ３、ＧＮＡ１１、ＧＮＡＱ、ＧＮＡＳ、ＨＲＡＳ、ＩＤＨ１、ＩＤＨ２、ＫＩＴ、ＫＲＡＳ、ＭＥＤ１２、ＭＥＴ、ＭＹＣ、ＮＦＥ２Ｌ２、ＮＲＡＳ、ＰＤＧＦＲＡ、ＰＩＫ３ＣＡ、ＰＰＰ２Ｒ１Ａ、ＰＴＥＮ、ＲＥＴ、ＳＴＫ１１、ＴＰ５３、およびＵ２ＡＦ１である。

一部の実施形態では、配列可変標的領域セットは、少なくとも１０、２０、３０、または３５個のがんに関係する遺伝子、例えば上記のがんに関係する遺伝子からの標的領域を含む。一部の実施形態では、配列可変標的領域セットは、少なくとも１０ｋｂ、少なくとも２０ｋｂ、少なくとも３０ｋｂ、少なくとも４０ｋｂ、少なくとも５０ｋｂ、少なくとも７５ｋｂ、少なくとも１００ｋｂ、少なくとも２００ｋｂ、少なくとも３００ｋｂ、または少なくとも４００ｋｂのフットプリントを有する。一部の実施形態では、配列可変標的領域セットは、１００～１０００ｋｂ、例えば、１００～２００ｋｂ、２００～３００ｋｂ、３００～４００ｋｂ、４００～５００ｋｂ、５００～６００ｋｂ、６００～７００ｋｂ、７００～８００ｋｂ、８００～９００ｋｂ、および９００～１０００ｋｂの範囲内のフットプリントを有する。一部の実施形態では、配列可変標的領域セットは、少なくとも１０００ｋｂ、少なくとも２０００ｋｂ、少なくとも３０００ｋｂ、少なくとも４０００ｋｂ、少なくとも５０００ｋｂ、少なくとも６０００ｋｂ、少なくとも７０００ｋｂ、少なくとも８０００ｋｂ、少なくとも９０００ｋｂ、または少なくとも１Ｍｂのフットプリントを有する。一部の実施形態では、配列可変標的領域セットは、１Ｍｂ～１０Ｍｂ、例えば１～１．２Ｍｂ、１．２～１．４Ｍｂ、１．４～１．６Ｍｂ、１．６～１．８Ｍｂ、１．８～２Ｍｂ、２～２．２５Ｍｂ、２．２５～２．５Ｍｂ、２．５～２．７５Ｍｂ、２．７５～３Ｍｂ、３～３．２５Ｍｂ、３．２５～３．５Ｍｂ、３．５～３．７５Ｍｂ、３．７５～４Ｍｂ、４．～４．２５Ｍｂ、４．２５～４．５Ｍｂ、４．５～４．７５Ｍｂ、４．７５～５Ｍｂ、５～５．５Ｍｂ、５．５～６Ｍｂ、６～６．５Ｍｂ、６．５～７Ｍｂ、７～７．５Ｍｂ、７．５～８Ｍｂ、８～８．５Ｍｂ、８．５～９Ｍｂ、９～９．５Ｍｂおよび９．５～１０Ｍｂの範囲内のフットプリントを有する。一部の実施形態では、配列可変標的領域セットは、１０～３０キロベース、３０～６０キロベース、６０キロベース～１メガベースまたは１～２メガベースの範囲内のフットプリントを有する。
３．対象；試料タイプ／供給源

一部の実施形態では、ＤＮＡ（例えば、ｃｆＤＮＡまたは組織試料から得られたＤＮＡ）は、がんを有する対象から得られる。一部の実施形態では、ＤＮＡ（例えば、ｃｆＤＮＡまたは組織試料から得られたＤＮＡ）は、がんを有すると疑われる対象から得られる。一部の実施形態では、ＤＮＡ（例えば、ｃｆＤＮＡまたは組織試料から得られたＤＮＡ）は、腫瘍を有する対象から得られる。一部の実施形態では、ＤＮＡ（例えば、ｃｆＤＮＡまたは組織試料から得られたＤＮＡ）は、腫瘍を有すると疑われる対象から得られる。一部の実施形態では、ＤＮＡ（例えば、ｃｆＤＮＡまたは組織試料から得られたＤＮＡ）は、新生物を有する対象から得られる。一部の実施形態では、ＤＮＡ（例えば、ｃｆＤＮＡまたは組織試料から得られたＤＮＡ）は、新生物を有すると疑われる対象から得られる。一部の実施形態では、ＤＮＡ（例えば、ｃｆＤＮＡまたは組織試料から得られたＤＮＡ）は、腫瘍、がんまたは新生物から寛解状態にある対象（例えば、化学療法、外科的切除、放射線またはそれらの組合せ後）から得られる。前述の実施形態のいずれかでは、がん、腫瘍もしくは新生物、または疑われるがん、腫瘍もしくは新生物は、肺、結腸、直腸、腎臓、乳房、前立腺または肝臓のものであり得る。一部の実施形態では、がん、腫瘍もしくは新生物、または疑われるがん、腫瘍もしくは新生物は、肺のものである。一部の実施形態では、がん、腫瘍もしくは新生物、または疑われるがん、腫瘍もしくは新生物は、結腸または直腸のものである。一部の実施形態では、がん、腫瘍もしくは新生物、または疑われるがん、腫瘍もしくは新生物は、乳房のものである。一部の実施形態では、がん、腫瘍もしくは新生物、または疑われるがん、腫瘍もしくは新生物は、前立腺のものである。前述の実施形態のいずれかでは、対象は、ヒト対象であり得る。

一部の実施形態では、対象は、がん、例えば本明細書において上記のまたは他の箇所で述べたがんのいずれかを有すると以前に診断された。そのような対象は、１つまたは複数の以前のがん処置、例えば、外科手術、化学療法、放射線および／または免疫療法を以前に受けていてもよい。一部の実施形態では、試料（例えば、ｃｆＤＮＡまたは組織試料から得られたＤＮＡ）は、以前に診断され、１つまたは複数の以前のがん処置後の１つまたは複数の予め選択された時点で処置された対象から得られる。

対象から得られた試料（例えば、ｃｆＤＮＡまたは組織試料から得られたＤＮＡ）は、配列情報セットを提供するためにシーケンシングされ得、これは、配列可変標的領域セットの捕捉されたＤＮＡ分子を、本明細書において他の箇所で詳細に記載されているように、エピジェネティック標的領域セットの捕捉されたＤＮＡ分子よりも高いシーケンシング深度までシーケンシングすることを含み得る。
４．標的特異的プローブのコレクション

一部の実施形態では、本明細書に開示される方法において使用される標的特異的プローブのコレクションは、配列可変標的領域セットに特異的な標的結合プローブおよびエピジェネティック標的領域セットに特異的な標的結合プローブを含む。一部の実施形態では、配列可変標的領域セットに特異的な標的結合プローブの捕捉収量は、エピジェネティック標的領域セットに特異的な標的結合プローブの捕捉収量よりも高い（例えば、少なくとも２倍高い）。一部の実施形態では、標的特異的プローブのコレクションは、エピジェネティック標的領域セットに特異的なその捕捉収量よりも高い（例えば少なくとも２倍高い）配列可変標的領域セットに特異的な捕捉収量を有するように構成される。

一部の実施形態では、配列可変標的領域セットに特異的な標的結合プローブの捕捉収量は、エピジェネティック標的領域セットに特異的な標的結合プローブの捕捉収量よりも少なくとも１．２５、１．５、１．７５、２、２．２５、２．５、２．７５、３、３．５、４、４．５、５、６、７、８、９、１０、１１、１２、１３、１４または１５倍高い。一部の実施形態では、配列可変標的領域セットに特異的な標的結合プローブの捕捉収量は、エピジェネティック標的領域セットに特異的な標的結合プローブの捕捉収量よりも１．２５～１．５、１．５～１．７５、１．７５～２、２～２．２５、２．２５～２．５、２．５～２．７５、２．７５～３、３～３．５、３．５～４、４～４．５、４．５～５、５～５．５、５．５～６、６～７、７～８、８～９、９～１０、１０～１１、１１～１２、１３～１４または１４～１５倍高い。一部の実施形態では、配列可変標的領域セットに特異的な標的結合プローブの捕捉収量は、エピジェネティック標的領域セットに特異的な標的結合プローブの捕捉収量よりも少なくとも５倍高い。一部の実施形態では、配列可変標的領域セットに特異的な標的結合プローブの捕捉収量は、エピジェネティック標的領域セットに特異的な標的結合プローブの捕捉収量よりも５～１０倍高い。

一部の実施形態では、標的特異的プローブのコレクションは、エピジェネティック標的領域セットについてのその捕捉収量よりも少なくとも１．２５、１．５、１．７５、２、２．２５、２．５、２．７５、３、３．５、４、４．５、５、６、７、８、９、１０、１１、１２、１３、１４または１５倍高い配列可変標的領域セットに特異的な捕捉収量を有するように構成される。一部の実施形態では、標的特異的プローブのコレクションは、エピジェネティック標的領域セットに特異的なその捕捉収量よりも１．２５～１．５、１．５～１．７５、１．７５～２、２～２．２５、２．２５～２．５、２．５～２．７５、２．７５～３、３～３．５、３．５～４、４～４．５、４．５～５、５～５．５、５．５～６、６～７、７～８、８～９、９～１０、１０～１１、１１～１２、１３～１４または１４～１５倍高い配列可変標的領域セットに特異的な捕捉収量を有するように構成される。一部の実施形態では、標的特異的プローブのコレクションは、エピジェネティック標的領域セットに特異的な標的結合プローブの捕捉収量よりも少なくとも５倍高い配列可変標的領域セットに特異的な捕捉収量を有するように構成される。一部の実施形態では、標的特異的プローブのコレクションは、エピジェネティック標的領域セットに特異的な標的結合プローブの捕捉収量よりも５～１０倍高い配列可変標的領域セットに特異的な捕捉収量を有するように構成される。

プローブのコレクションは、濃度、異なる長さおよび／または化学（例えば、親和性に影響を及ぼす）ならびにそれらの組合せを含む様々な方法で、配列可変標的領域セットについてのより高い捕捉収量を提供するように構成され得る。親和性は、プローブの長さを調節することによって、および／または以下で考察されるヌクレオチド改変を含めることによって、モジュレートされ得る。

一部の実施形態では、配列可変標的領域セットに特異的な標的特異的プローブは、エピジェネティック標的領域セットに特異的な標的結合プローブよりも高濃度で存在する。一部の実施形態では、配列可変標的領域セットに特異的な標的結合プローブの濃度は、エピジェネティック標的領域セットに特異的な標的結合プローブの濃度よりも少なくとも１．２５、１．５、１．７５、２、２．２５、２．５、２．７５、３、３．５、４、４．５、５、６、７、８、９、１０、１１、１２、１３、１４または１５倍高い。一部の実施形態では、配列可変標的領域セットに特異的な標的結合プローブの濃度は、エピジェネティック標的領域セットに特異的な標的結合プローブの濃度よりも１．２５～１．５、１．５～１．７５、１．７５～２、２～２．２５、２．２５～２．５、２．５～２．７５、２．７５～３、３～３．５、３．５～４、４～４．５、４．５～５、５～５．５、５．５～６、６～７、７～８、８～９、９～１０、１０～１１、１１～１２、１３～１４または１４～１５倍高い。一部の実施形態では、配列可変標的領域セットに特異的な標的結合プローブの濃度は、エピジェネティック標的領域セットに特異的な標的結合プローブの濃度よりも少なくとも２倍高い。そのような実施形態では、濃度は、各セットの中の個々のプローブの体積あたりの質量の平均濃度を指し得る。一部の実施形態では、配列可変標的領域セットに特異的な標的結合プローブの濃度は、エピジェネティック標的領域セットに特異的な標的結合プローブの濃度よりも少なくとも５倍高い。一部の実施形態では、配列可変標的領域セットに特異的な標的結合プローブの濃度は、エピジェネティック標的領域セットに特異的な標的結合プローブの濃度よりも５～１０倍高い。

一部の実施形態では、配列可変標的領域セットに特異的な標的特異的プローブは、エピジェネティック標的領域セットに特異的な標的結合プローブよりもそれらの標的に対する高親和性を有する。親和性は、異なるプローブ化学を使用することによるのを含む当業者には公知の任意の方法でモジュレートされ得る。例えば、（ある特定の配列の文脈における）シトシン５－メチル化等のある特定のヌクレオチド改変、２’糖位置にヘテロ原子を提供する改変、およびＬＮＡヌクレオチドは、二本鎖核酸の安定性を増加させることができ、そのような改変を有するオリゴヌクレオチドはそれらの相補的配列に対する比較的高い親和性を有することを示す。例えば、Severin et al., Nucleic Acids Res. 39: 8740-8751 (2011)；Freier et al., Nucleic Acids Res. 25: 4429-4443 (1997)；米国特許第９，７３８，８９４号を参照されたい。また、より長い配列長さは、一般的に増加した親和性を提供する。核酸塩基のヒポキサンチンによるグアニンの置換等の他のヌクレオチド改変は、オリゴヌクレオチドとその相補的配列との間の水素結合の量を低減することによって、親和性を低減させる。一部の実施形態では、配列可変標的領域セットに特異的な標的特異的プローブは、それらの標的に対するそれらの親和性を増加させる改変を有する。一部の実施形態では、あるいはまたは加えて、エピジェネティック標的領域セットに特異的な標的特異的プローブは、それらの標的に対するそれらの親和性を減少させる改変を有する。一部の実施形態では、配列可変標的領域セットに特異的な標的特異的プローブは、エピジェネティック標的領域セットに特異的な標的特異的プローブよりも長い平均長さおよび／または高い平均融解温度を有する。これらの実施形態は、捕捉収量における所望の倍数差、例えば、上記の任意の倍数差またはその範囲を達成するために、上記で考察されたように相互におよび／または濃度の差異と組み合わされ得る。

一部の実施形態では、標的特異的プローブは、捕捉部分を含む。捕捉部分は、本明細書に記載される捕捉部分のいずれか、例えば、ビオチンであってもよい。一部の実施形態では、標的特異的プローブは、例えば、共有結合的に、または捕捉部分の結合対の相互作用等を通して非共有結合的に、固体支持体に連結される。一部の実施形態では、固体支持体は、磁気ビーズ等のビーズである。

一部の実施形態では、配列可変標的領域セットに特異的な標的特異的プローブおよび／またはエピジェネティック標的領域セットに特異的な標的特異的プローブは、上記で考察されたベイトセット、例えば、遺伝子等の領域のパネルにわたって敷き詰められるように選択された捕捉部分および配列を含むプローブである。

一部の実施形態では、標的特異的プローブは、単一の組成物で提供される。単一の組成物は、溶液（液体または凍結）であってもよい。あるいは、組成物は、凍結乾燥物であってもよい。

あるいは、標的特異的プローブは、複数の組成物として、例えば、エピジェネティック標的領域セットに特異的なプローブを含む第１の組成物および配列可変標的領域セットに特異的なプローブを含む第２の組成物を含む複数の組成物として提供され得る。これらのプローブは、濃度および／または捕捉収量の前述の倍数差のいずれかを有する組み合わされたプローブ組成物を提供するために、適切な比率で混合され得る。あるいは、それらは、それぞれ、捕捉されたエピジェネティック標的領域および配列可変標的領域を含む第１および第２の組成物を提供するために、別個の捕捉手順で（例えば、試料のアリコートで、または同じ試料で逐次的に）使用され得る。
ａ．エピジェネティック標的領域に特異的なプローブ

エピジェネティック標的領域セットに対するプローブは、新生物（例えば、腫瘍またはがん）細胞からのＤＮＡと、健康な細胞、例えば非新生物循環細胞からのＤＮＡとを識別する可能性がある１つまたは複数のタイプの標的領域に特異的なプローブを含み得る。そのような領域の例示的なタイプは、本明細書において、例えば、捕捉されたセットに関する上記のセクションにおいて詳細に考察される。エピジェネティック標的領域セットに対するプローブはまた、例えば本明細書に記載される１つまたは複数の対照領域に対するプローブも含み得る。

一部の実施形態では、エピジェネティック標的領域プローブセットに対するプローブは、少なくとも１００ｋｂ、例えば、少なくとも２００ｋｂ、少なくとも３００ｋｂ、または少なくとも４００ｋｂのフットプリントを有する。一部の実施形態では、エピジェネティック標的領域セットに対するプローブは、１００～１０００ｋｂ、例えば、１００～２００ｋｂ、２００～３００ｋｂ、３００～４００ｋｂ、４００～５００ｋｂ、５００～６００ｋｂ、６００～７００ｋｂ、７００～８００ｋｂ、８００～９００ｋｂ、および９００～１，０００ｋｂの範囲内のフットプリントを有する。一部の実施形態では、エピジェネティック標的領域セットに対するプローブは、少なくとも１０００ｋｂ、少なくとも２０００ｋｂ、少なくとも３０００ｋｂ、少なくとも４０００ｋｂ、少なくとも５０００ｋｂ、少なくとも６０００ｋｂ、少なくとも７０００ｋｂ、少なくとも８０００ｋｂ、少なくとも９０００ｋｂ、または少なくとも１Ｍｂのフットプリントを有する。一部の実施形態では、エピジェネティック標的領域セットに対するプローブは、１Ｍｂ～２０Ｍｂ、例えば、１～１．２Ｍｂ、１．２～１．４Ｍｂ、１．４～１．６Ｍｂ、１．６～１．８Ｍｂ、１．８～２Ｍｂ、２～２．２５Ｍｂ、２．２５～２．５Ｍｂ、２．５～２．７５Ｍｂ、２．７５～３Ｍｂ、３～３．２５Ｍｂ、３．２５～３．５Ｍｂ、３．５～３．７５Ｍｂ、３．７５～４Ｍｂ、４．～４．２５Ｍｂ、４．２５～４．５Ｍｂ、４．５～４．７５Ｍｂ、４．７５～５Ｍｂ、５～５．５Ｍｂ、５．５～６Ｍｂ、６～６．５Ｍｂ、６．５～７Ｍｂ、７～７．５Ｍｂ、７．５～８Ｍｂ、８～８．５Ｍｂ、８．５～９Ｍｂ、９～９．５Ｍｂ、９．５～１０Ｍｂ、１０～１２Ｍｂ、１２～１４Ｍｂ、１４～１６Ｍｂ、１６～１８Ｍｂおよび１８～２０Ｍｂの範囲内のフットプリントを有する。
ｉ．高メチル化可変標的領域

一部の実施形態では、エピジェネティック標的領域セットに対するプローブは、１つまたは複数の高メチル化可変標的領域に特異的なプローブを含む。高メチル化可変標的領域は、上述の標的領域のいずれかであり得る。例えば、一部の実施形態では、高メチル化可変標的領域に特異的なプローブは、表１に記載の複数の遺伝子座、例えば表１に記載の遺伝子座の少なくとも１０％、２０％、３０％、４０％、５０％、６０％、７０％、８０％、９０％または１００％に特異的なプローブを含む。一部の実施形態では、高メチル化可変標的領域に特異的なプローブは、表２に記載の複数の遺伝子座、例えば表２に記載の遺伝子座の少なくとも１０％、２０％、３０％、４０％、５０％、６０％、７０％、８０％、９０％または１００％に特異的なプローブを含む。一部の実施形態では、高メチル化可変標的領域に特異的なプローブは、表１または表２に記載の複数の遺伝子座、例えば表１または表２に記載の遺伝子座の少なくとも１０％、２０％、３０％、４０％、５０％、６０％、７０％、８０％、９０％または１００％に特異的なプローブを含む。一部の実施形態では、標的領域として含まれる各遺伝子座に関して、遺伝子の転写開始部位と終止コドン（代替的にスプライシングされる遺伝子に関しては最後の終止コドン）との間に結合するハイブリダイゼーション部位を有する１つまたは複数のプローブが存在し得る。一部の実施形態では、１つまたは複数のプローブは、記載した位置の３００ｂｐ以内、例えば２００または１００ｂｐ以内で結合する。一部の実施形態では、プローブは、上記に記載した位置と重複するハイブリダイゼーション部位を有する。一部の実施形態では、高メチル化標的領域に特異的なプローブは、乳がん、結腸がん、腎臓がん、肝臓がん、および肺がんのうちの１つ、２つ、３つ、４つ、または５つにおいて高メチル化を集合的に示す高メチル化標的領域のうちの１つ、２つ、３つ、４つ、または５つのサブセットに特異的なプローブを含む。
ｉｉ．低メチル化可変標的領域

一部の実施形態では、エピジェネティック標的領域セットに対するプローブは、１つまたは複数の低メチル化可変標的領域に特異的なプローブを含む。低メチル化可変標的領域は、上述の標的領域のいずれかであり得る。例えば、１つまたは複数の低メチル化可変標的領域に特異的なプローブは、反復エレメント、例えばＬＩＮＥ１エレメント、Ａｌｕエレメント、セントロメアタンデムリピート、傍セントロメアタンデムリピート、およびサテライトＤＮＡ等の領域に対するプローブを含み得、通常は健康な細胞中でメチル化されている遺伝子間領域は、腫瘍細胞中ではメチル化の低減を示し得る。

一部の実施形態では、低メチル化可変標的領域に特異的なプローブは、反復エレメントおよび／または遺伝子間領域に特異的なプローブを含む。一部の実施形態では、反復エレメントに特異的なプローブは、ＬＩＮＥ１エレメント、Ａｌｕエレメント、セントロメアタンデムリピート、傍セントロメアタンデムリピート、および／またはサテライトＤＮＡのうちの１つ、２つ、３つ、４つ、または５つに特異的なプローブを含む。

がん関連低メチル化を示すゲノム領域に特異的な例示的なプローブは、ヒト第１染色体のヌクレオチド８４０３５６５～８９５３７０８および／または１５１１０４７０１～１５１１０６０３５に特異的なプローブを含む。一部の実施形態では、低メチル化可変標的領域に特異的なプローブは、ヒト第１染色体のヌクレオチド８４０３５６５～８９５３７０８および／または１５１１０４７０１～１５１１０６０３５と重複する領域またはそれを含む領域に特異的なプローブを含む。
ｉｉｉ．ＣＴＣＦ結合領域

一部の実施形態では、エピジェネティック標的領域セットに対するプローブは、ＣＴＣＦ結合領域に特異的なプローブを含む。一部の実施形態では、ＣＴＣＦ結合領域に特異的なプローブは、少なくとも１０、２０、５０、１００、２００、もしくは５００個のＣＴＣＦ結合領域、または１０～２０、２０～５０、５０～１００、１００～２００、２００～５００、もしくは５００～１０００個のＣＴＣＦ結合領域、例えば上記のまたはＣＴＣＦＢＳＤＢもしくは上記で引用したCuddapah et al.、Martin et al.、もしくはRhee et al.の論文等の１つもしくは複数におけるＣＴＣＦ結合領域に特異的なプローブを含む。一部の実施形態では、エピジェネティック標的領域セットに対するプローブは、ＣＴＣＦ結合部位の少なくとも１００ｂｐ、少なくとも２００ｂｐ、少なくとも３００ｂｐ、少なくとも４００ｂｐ、少なくとも５００ｂｐ、少なくとも７５０ｂｐまたは少なくとも１０００ｂｐ上流および下流の領域を含む。
ｉｖ．転写開始部位

一部の実施形態では、エピジェネティック標的領域セットに対するプローブは、転写開始部位に特異的なプローブを含む。一部の実施形態では、転写開始部位に特異的なプローブは、少なくとも１０、２０、５０、１００、２００、もしくは５００個の転写開始部位、または１０～２０、２０～５０、５０～１００、１００～２００、２００～５００、もしくは５００～１０００個の転写開始部位、例えばＤＢＴＳＳに記載される転写開始部位等に特異的なプローブを含む。一部の実施形態では、エピジェネティック標的領域セットに対するプローブは、転写開始部位の少なくとも１００ｂｐ、少なくとも２００ｂｐ、少なくとも３００ｂｐ、少なくとも４００ｂｐ、少なくとも５００ｂｐ、少なくとも７５０ｂｐまたは少なくとも１０００ｂｐ上流および下流の配列に対するプローブを含む。
ｖ．局所的増幅

上記で述べたように、局所的増幅は、体細胞変異であるが、これらは、メチル化の変化等のある特定のエピジェネティック変化を検出するためのアプローチと類似の様式でリード頻度に基づきシーケンシングによって検出することができる。そのため、上記で考察されたように、がんにおいて局所的増幅を示し得る領域を、エピジェネティック標的領域セットに含めることができる。一部の実施形態では、エピジェネティック標的領域セットに特異的なプローブは、局所的増幅に特異的なプローブを含む。一部の実施形態では、局所的増幅に特異的なプローブは、ＡＲ、ＢＲＡＦ、ＣＣＮＤ１、ＣＣＮＤ２、ＣＣＮＥ１、ＣＤＫ４、ＣＤＫ６、ＥＧＦＲ、ＥＲＢＢ２、ＦＧＦＲ１、ＦＧＦＲ２、ＫＩＴ、ＫＲＡＳ、ＭＥＴ、ＭＹＣ、ＰＤＧＦＲＡ、ＰＩＫ３ＣＡおよびＲＡＦ１のうちの１つまたは複数に特異的なプローブを含む。例えば、一部の実施形態では、局所的増幅に特異的なプローブは、前述の標的の少なくとも２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７または１８のうちの１つまたは複数に特異的なプローブを含む。
ｖｉ．対照領域

データの検証を容易にするために対照領域を含めることは有用であり得る。一部の実施形態では、エピジェネティック標的領域セットに特異的なプローブは、本質的に全ての試料においてメチル化されると予想される対照メチル化領域に特異的なプローブを含む。一部の実施形態では、エピジェネティック標的領域セットに特異的なプローブは、本質的に全ての試料において低メチル化されると予想される対照低メチル化領域に特異的なプローブを含む。
ｂ．配列可変標的領域に特異的なプローブ

配列可変標的領域セットに対するプローブは、がんにおいて体細胞変異を受けることが公知である複数の領域に特異的なプローブを含み得る。プローブは、本明細書に記載される任意の配列可変標的領域セットに対して特異的であり得る。例示的な配列可変標的領域セットは、本明細書において、例えば、捕捉されたセットに関する上記のセクションにおいて詳細に考察される。

一部の実施形態では、配列可変標的領域プローブセットは、少なくとも１０ｋｂ、例えば、少なくとも２０ｋｂ、少なくとも３０ｋｂまたは少なくとも４０ｋｂのフットプリントを有する。一部の実施形態では、配列可変標的領域プローブセットは、１０～１００ｋｂ、例えば、１０～２０ｋｂ、２０～３０ｋｂ、３０～４０ｋｂ、４０～５０ｋｂ、５０～６０ｋｂ、６０～７０ｋｂ、７０～８０ｋｂ、８０～９０ｋｂおよび９０～１００ｋｂの範囲内のフットプリントを有する。一部の実施形態では、配列可変標的領域プローブセットは、少なくとも１０ｋｂ、少なくとも２０ｋｂ、少なくとも３０ｋｂ、少なくとも４０ｋｂ、少なくとも５０ｋｂ、少なくとも７５ｋｂ、少なくとも１００ｋｂ、少なくとも２００ｋｂ、少なくとも３００ｋｂ、または少なくとも４００ｋｂのフットプリントを有する。一部の実施形態では、配列可変標的領域プローブセットは、１００～１０００ｋｂ、例えば、１００～２００ｋｂ、２００～３００ｋｂ、３００～４００ｋｂ、４００～５００ｋｂ、５００～６００ｋｂ、６００～７００ｋｂ、７００～８００ｋｂ、８００～９００ｋｂ、および９００～１０００ｋｂの範囲内のフットプリントを有する。一部の実施形態では、配列可変標的領域プローブセットは、少なくとも１０００ｋｂ、少なくとも２０００ｋｂ、少なくとも３０００ｋｂ、少なくとも４０００ｋｂ、少なくとも５０００ｋｂ、少なくとも６０００ｋｂ、少なくとも７０００ｋｂ、少なくとも８０００ｋｂ、少なくとも９０００ｋｂ、または少なくとも１Ｍｂのフットプリントを有する。一部の実施形態では、配列可変標的領域プローブセットは、１Ｍｂ～１０Ｍｂ、例えば１～１．２Ｍｂ、１．２～１．４Ｍｂ、１．４～１．６Ｍｂ、１．６～１．８Ｍｂ、１．８～２Ｍｂ、２～２．２５Ｍｂ、２．２５～２．５Ｍｂ、２．５～２．７５Ｍｂ、２．７５～３Ｍｂ、３～３．２５Ｍｂ、３．２５～３．５Ｍｂ、３．５～３．７５Ｍｂ、３．７５～４Ｍｂ、４．～４．２５Ｍｂ、４．２５～４．５Ｍｂ、４．５～４．７５Ｍｂ、４．７５～５Ｍｂ、５～５．５Ｍｂ、５．５～６Ｍｂ、６～６．５Ｍｂ、６．５～７Ｍｂ、７～７．５Ｍｂ、７．５～８Ｍｂ、８～８．５Ｍｂ、８．５～９Ｍｂ、９～９．５Ｍｂおよび９．５～１０Ｍｂの範囲内のフットプリントを有する。

一部の実施形態では、配列可変標的領域セットに特異的なプローブは、表３の遺伝子の少なくとも５個、少なくとも１０個、少なくとも１５個、少なくとも２０個、少なくとも２５個、少なくとも３０個、少なくとも３５個、少なくとも４０個、少なくとも４５個、少なくとも５０個、少なくとも５５個、少なくとも６０個、少なくとも６５個、または７０個のうちの少なくとも一部に特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに特異的なプローブは、表３のＳＮＶの少なくとも５個、少なくとも１０個、少なくとも１５個、少なくとも２０個、少なくとも２５個、少なくとも３０個、少なくとも３５個、少なくとも４０個、少なくとも４５個、少なくとも５０個、少なくとも５５個、少なくとも６０個、少なくとも６５個、または７０個に特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに特異的なプローブは、表３の融合の少なくとも１個、少なくとも２個、少なくとも３個、少なくとも４個、少なくとも５個、または６個に特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに特異的なプローブは、表３のインデルの少なくとも１個、少なくとも２個、または３個のうちの少なくとも一部に特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに特異的なプローブは、表４の遺伝子の少なくとも５個、少なくとも１０個、少なくとも１５個、少なくとも２０個、少なくとも２５個、少なくとも３０個、少なくとも３５個、少なくとも４０個、少なくとも４５個、少なくとも５０個、少なくとも５５個、少なくとも６０個、少なくとも６５個、少なくとも７０個、または７３個のうちの少なくとも一部に特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに特異的なプローブは、表４のＳＮＶの少なくとも５個、少なくとも１０個、少なくとも１５個、少なくとも２０個、少なくとも２５個、少なくとも３０個、少なくとも３５個、少なくとも４０個、少なくとも４５個、少なくとも５０個、少なくとも５５個、少なくとも６０個、少なくとも６５個、少なくとも７０個、または７３個に特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに特異的なプローブは、表４の融合の少なくとも１個、少なくとも２個、少なくとも３個、少なくとも４個、少なくとも５個、または６個に特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに特異的なプローブは、表４のインデルの少なくとも１個、少なくとも２個、少なくとも３個、少なくとも４個、少なくとも５個、少なくとも６個、少なくとも７個、少なくとも８個、少なくとも９個、少なくとも１０個、少なくとも１１個、少なくとも１２個、少なくとも１３個、少なくとも１４個、少なくとも１５個、少なくとも１６個、少なくとも１７個、または１８個のうちの少なくとも一部に特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに特異的なプローブは、表５の遺伝子の少なくとも１個、少なくとも２個、少なくとも３個、少なくとも４個、少なくとも５個、少なくとも６個、少なくとも７個、少なくとも８個、少なくとも９個、少なくとも１０個、少なくとも１１個、少なくとも１２個、少なくとも１３個、少なくとも１４個、少なくとも１５個、少なくとも１６個、少なくとも１７個、少なくとも１８個、少なくとも１９個、または少なくとも２０個のうちの少なくとも一部に特異的なプローブを含む。

一部の実施形態では、配列可変標的領域セットに特異的なプローブは、少なくとも１０、２０、３０または３５のがんに関係する遺伝子、例えば、ＡＫＴ１、ＡＬＫ、ＢＲＡＦ、ＣＣＮＤ１、ＣＤＫ２Ａ、ＣＴＮＮＢ１、ＥＧＦＲ、ＥＲＢＢ２、ＥＳＲ１、ＦＧＦＲ１、ＦＧＦＲ２、ＦＧＦＲ３、ＦＯＸＬ２、ＧＡＴＡ３、ＧＮＡ１１、ＧＮＡＱ、ＧＮＡＳ、ＨＲＡＳ、ＩＤＨ１、ＩＤＨ２、ＫＩＴ、ＫＲＡＳ、ＭＥＤ１２、ＭＥＴ、ＭＹＣ、ＮＦＥ２Ｌ２、ＮＲＡＳ、ＰＤＧＦＲＡ、ＰＩＫ３ＣＡ、ＰＰＰ２Ｒ１Ａ、ＰＴＥＮ、ＲＥＴ、ＳＴＫ１１、ＴＰ５３およびＵ２ＡＦ１からの標的領域に特異的なプローブを含む。
ｃ．プローブの組成物

一部の実施形態では、配列可変標的領域セットに対するプローブおよびエピジェネティック標的領域セットに対するプローブを含む単一の組成物が使用される。プローブは、本明細書に記載される任意の濃度比でそのような組成物の中に提供され得る。

一部の実施形態では、エピジェネティック標的領域セットに対するプローブを含む第１の組成物および配列可変標的領域セットに対するプローブを含む第２の組成物が提供される。第１の組成物中のプローブの濃度の第２の組成物中のプローブの濃度に対する比は、本明細書に記載される比のいずれかであり得る。
５．捕捉されたｃｆＤＮＡを含む組成物

一部の実施形態では、捕捉されたｃｆＤＮＡを含む組成物が生成され、および／または本明細書に開示される方法において使用される。捕捉されたｃｆＤＮＡは、例えば、エピジェネティック標的領域セットに対応するＤＮＡの濃度よりも高い配列可変標的領域セットに対応するＤＮＡの濃度（上記で考察されたフットプリントのサイズについて正規化される）を含む、捕捉されたセットに関する本明細書に記載される特色のいずれかを有し得る。一部の実施形態では、捕捉されたセットのｃｆＤＮＡは配列タグを含み、これは、本明細書に記載されるように、ｃｆＤＮＡに付加され得る。一般的に、配列タグを含めることによって、それらの天然に存在するタグ付けされていない形態とは異なるｃｆＤＮＡ分子がもたらされる。

そのような組成物は、本明細書に記載されるプローブセットまたはシーケンシングプライマーをさらに含んでいてもよく、これらのそれぞれは、天然に存在する核酸分子とは異なっていてもよい。例えば、本明細書に記載されるプローブセットは捕捉部分を含んでいてもよく、シーケンシングプライマーは天然に存在しない標識を含んでいてもよい。
６．ＭＢＤビーズ分配ライブラリの分子タグ識別のための例示的な方法

ＮＧＳによるＭＢＤビーズ分配ライブラリの分子タグ同定のための例示的な方法は、以下の通りである。
ｉ）メチル結合ドメインタンパク質－ビーズ精製キットを使用する、抽出されたＤＮＡ試料（例えば、必要に応じて本明細書に記載される標的捕捉に供されたヒト試料から抽出された血漿ＤＮＡ）の物理的分配であり、下流の処理のためにプロセスからのすべての溶出を保存する。
ｉｉ）示差的分子タグおよびＮＧＳ可能なアダプター配列の各分画への並行適用。例えば、高メチル化画分、残留メチル化（「洗浄」）画分および低メチル化画分が、分子タグを有するＮＧＳ－アダプターにライゲーションされる。
ｉｉｉ）すべての分子タグ付けされた画分を再び合わせる、およびその後のアダプター特異的ＤＮＡプライマー配列を使用する増幅。
ｉｖ）目的のゲノム領域（例えば、がん特異的遺伝子バリアントおよび示差的にメチル化された領域）を標的にする、再び合わせ増幅した総ライブラリの捕捉／ハイブリダイゼーション。
ｖ）試料タグを付け加える、捕捉されたＤＮＡライブラリの再増幅。異なる試料がプールされ、ＮＧＳ機器において多重的にアッセイされる。
ｖｉ）分子タグが一意的分子を同定するために使用されるＮＧＳデータのバイオインフォマティクス解析、および示差的にＭＢＤ分配された分子への試料のデコンボリューション。この解析は、標準的な遺伝子シーケンシング／バリアント検出と同時にゲノム領域について相対的な５－メチルシトシンに対する情報を生じさせ得る。本明細書の他の箇所で詳細に考察されるように、解析は、配列リードの第１および第２のセットから配列を決定することを含み、（ｉ）第１のセットのリードまたは分子の配列に基づく参照配列に対するＣからＴへのまたはＧからＡへのトランジション変異をコールするステップは、第２のセットのリードまたは分子の配列に基づく参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップよりも多い数のリードにおけるトランジション変異の観察を要求するか、あるいは（ｉｉ）ＣからＴへのまたはＧからＡへのトランジション変異は、第１のセットのリードまたは分子の配列に基づき参照配列と比べてコールされない。

上記の例示的な方法は、本明細書の他の箇所において記載される本開示による方法の任意の適合性の特色をさらに含み得る。
７．例示的なワークフロー

分配およびライブラリ調製のための例示的なワークフローが、本明細書に提供される。一部の実施形態では、分配およびライブラリ調製のワークフローの一部またはすべての特色は、組み合わせて使用されてもよい。上記の例示的なワークフローは、本明細書の他の箇所において記載される本開示による方法の任意の適合性の特色をさらに含み得る。
ａ．分配するステップ

一部の実施形態では、試料ＤＮＡ（例えば、１ｎｇと３００ｎｇとの間）を、適切な量のメチル結合ドメイン（ＭＢＤ）緩衝液（ＭＢＤ緩衝液の量は使用されるＤＮＡの量に依存する）およびＭＢＤタンパク質にコンジュゲートされた磁気ビーズと混合し、一晩インキュベートする。メチル化ＤＮＡ（高メチル化ＤＮＡ）は、このインキュベーションの間に磁気ビーズ上のＭＢＤタンパク質に結合する。非メチル化（低メチル化ＤＮＡ）またはメチル化が少ないＤＮＡ（中等度にメチル化）は、増加する塩の濃度を含有する緩衝液によってビーズから洗い流される。例えば、非メチル化、低メチル化および／または中等度のメチル化ＤＮＡを含有する１つ、２つ、またはそれより多くの分画が、そのような洗浄から得られ得る。最終的に、高い塩濃度の緩衝液を使用して、高度にメチル化されたＤＮＡ（高メチル化ＤＮＡ）をＭＢＤタンパク質から溶出させる。一部の実施形態では、これらの洗浄は、増加するメチル化レベルを有するＤＮＡの３つの画分（低メチル化画分、中等度メチル化分画、および高メチル化画分）をもたらす。

一部の実施形態では、ＤＮＡの３つの画分は、ライブラリ調製の酵素的ステップのための調製において脱塩され、濃縮される。
ｂ．ライブラリ調製

一部の実施形態では（例えば、画分中のＤＮＡを濃縮した後）、分配されたＤＮＡを、例えば、ＤＮＡ分子の末端オーバーハングを伸張させることによってライゲーション可能にし、アデノシン残基を断片の３’末端に付加し、および各ＤＮＡ断片の５’末端をリン酸化する。ＤＮＡリガーゼおよびアダプターを添加して、各分配ＤＮＡ分子に各末端でアダプターをライゲーションする。これらのアダプターは、他の画分において使用されるアダプター中の画分タグから区別可能である画分タグ（例えば、非ランダム、非一意的バーコード）を含有する。ライゲーション後、３つの画分は、一緒にプールされて、増幅される（例えばアダプターに特異的なプライマーを用いる、例えばＰＣＲによって）。

ＰＣＲ後、増幅されたＤＮＡは、捕捉前に洗浄および濃縮され得る。増幅されたＤＮＡを、目的の特異的領域を標的にする本明細書に記載されるプローブのコレクション（例えば、ビオチン化ＲＮＡプローブまたはｓｓＤＮＡプローブまたはｄｓＤＮＡプローブであり得る）と接触させる。混合物は、例えば塩緩衝液中で、例えば一晩インキュベートされる。プローブは、捕捉され（例えば、ストレプトアビジン磁気ビーズを使用して）、例えば一連の塩洗浄によって、捕捉されなかった増幅されたＤＮＡから分離し、それによって捕捉されたＤＮＡセットを提供する。捕捉後、捕捉されたセットのＤＮＡは、ＰＣＲによって増幅される。一部の実施形態では、ＰＣＲプライマーは、試料タグを含有し、それによって試料タグをＤＮＡ分子に組み込む。一部の実施形態では、異なる試料からのＤＮＡは、一緒にプールされ、次いで、例えばＩｌｌｕｍｉｎａＮｏｖａＳｅｑシーケンサーを使用して、多重シーケンシングされる。
ＩＩＩ．本方法の一般的な特色
１．試料

試料は、対象から単離した任意の生体試料であってよい。試料は身体試料であってよい。試料には、身体組織、例えば、既知のまたは疑われる固形腫瘍、全血、血小板、血清、血漿、糞便、赤血球、白血球（ｗｈｉｔｅｂｌｏｏｄｃｅｌｌ）または白血球（ｌｅｕｃｏｃｙｔｅ）、内皮細胞、組織生検材料、脳脊髄液、滑液、リンパ液、腹水、間質または細胞外の流体、歯肉溝滲出液を含む細胞間の空間内の流体、骨髄、胸水、脳脊髄液、唾液、粘液、痰、精液、汗、尿が含まれ得る。試料は、体液、特に、血液およびその分画、ならびに尿であることが好ましい。試料は、もともと対象から単離した形態であってよく、あるいは細胞等の成分を除去もしくは添加する、またはある成分を別の成分に対して富化するように、さらに処理に供されたものであってもよい。したがって、解析のための好ましい体液は、無細胞核酸を含有する血漿または血清である。試料を対象から単離または入手し、試料分析の場所に移送することができる。試料を望ましい温度、例えば、室温、４℃、－２０℃、および／または－８０℃で保存し、輸送することができる。試料を試料分析の場所で対象から単離または入手することができる。対象は、ヒト、哺乳動物、動物、コンパニオン動物、奉仕動物、またはペットであり得る。対象はがんを有し得る。対象は、がんまたは検出可能ながん症状を有していなくてもよい。対象は、１つまたは複数のがん治療、例えば、化学療法、抗体、ワクチンまたは生物学的製剤のうちの任意の１つまたは複数で処置されたことがあり得る。対象は、寛解の状態にあり得る。対象は、がんまたは任意のがんに関連する遺伝子変異／障害にかかりやすいと診断されていてもよく診断されていなくてもよい。

血漿の体積は、シーケンシングされる領域の所望のリード深度に依存する。例示的な体積は、０．４～４０ｍｌ、５～２０ｍｌ、１０～２０ｍｌである。例えば、体積は、０．５ｍＬ、１ｍＬ、５ｍＬ、１０ｍＬ、２０ｍＬ、３０ｍＬ、または４０ｍＬであり得る。試料採取される血漿の体積は５～２０ｍＬであり得る。

一部の実施形態では、試料は、組織から得たＤＮＡ試料であり得る。そのような実施形態では、組織試料から得たＤＮＡを、酵素的手段（例えば、フラグメンターゼ（ｆｒａｇｍｅｎｔａｓｅ））または機械的手段（例えば、超音波処理によるせん断）によって断片化することができる。

試料は、ゲノム等価物を含有する種々の量の核酸を含み得る。例えば、ＤＮＡ約３０ｎｇの試料は、約１０，０００（１０^４）個のハプロイドヒトゲノム等価物を含有し得、ｃｆＤＮＡの場合には約２０００億（２×１０^１１）個の個々のポリヌクレオチド分子を含有し得る。同様に、ＤＮＡ約１００ｎｇの試料は、約３０，０００個のハプロイドヒトゲノム等価物を含有し得、ｃｆＤＮＡの場合には約６０００億個の個々の分子を含有し得る。

試料は、異なる供給源から、例えば、同じ対象の細胞および無細胞供給源から、異なる対象の細胞および無細胞供給源からの核酸を含み得る。試料は、変異を有する核酸を含み得る。例えば、試料は、生殖細胞系変異および／または体細胞変異を有するＤＮＡを含み得る。生殖細胞系変異とは、対象の生殖細胞系ＤＮＡに存在する変異を指す。体細胞変異とは、対象の体細胞を起源とする変異、例えば、がん細胞を指す。試料は、がん関連変異（例えば、がん関連体細胞変異）を有するＤＮＡを含み得る。試料は、エピジェネティックバリアント（すなわち、化学的またはタンパク質改変）を含み得、ここで、エピジェネティックバリアントは、がん関連変異等の遺伝子バリアントの存在に関連する。一部の実施形態では、試料は、遺伝子バリアントの存在に関連するエピジェネティックバリアントを含み、ここで、試料は、遺伝子バリアントを含まない。

増幅前の試料中の無細胞核酸の例示的な量は、約１ｆｇ～約１μｇ、例えば、１ｐｇ～２００ｎｇ、１ｎｇ～１００ｎｇ、１０ｎｇ～１０００ｎｇの範囲である。例えば、量は、最大約６００ｎｇ、最大約５００ｎｇ、最大約４００ｎｇ、最大約３００ｎｇ、最大約２００ｎｇ、最大約１００ｎｇ、最大約５０ｎｇ、または最大約２０ｎｇの無細胞核酸分子であり得る。量は、少なくとも１ｆｇ、少なくとも１０ｆｇ、少なくとも１００ｆｇ、少なくとも１ｐｇ、少なくとも１０ｐｇ、少なくとも１００ｐｇ、少なくとも１ｎｇ、少なくとも１０ｎｇ、少なくとも１００ｎｇ、少なくとも１５０ｎｇ、または少なくとも２００ｎｇの無細胞核酸分子であり得る。量は、最大１フェムトグラム（ｆｇ）、１０ｆｇ、１００ｆｇ、１ピコグラム（ｐｇ）、１０ｐｇ、１００ｐｇ、１ｎｇ、１０ｎｇ、１００ｎｇ、１５０ｎｇ、２００ｎｇ、２５０ｎｇまたは３００ｎｇの無細胞核酸分子であり得る。方法は、１フェムトグラム（ｆｇ）～２００ｎｇを得るステップを含み得る。一部の実施形態では、使用されるＤＮＡの量は、１ｆｇから１μｇの間であり得る。

無細胞核酸は、細胞に含まれることも、他の方法で細胞に結合していることもない核酸、または、言い換えれば、インタクトな細胞の除去後に試料中に残存する核酸である。無細胞核酸には、ゲノムＤＮＡ、ミトコンドリアＤＮＡ、ｓｉＲＮＡ、ｍｉＲＮＡ、循環ＲＮＡ（ｃＲＮＡ）、ｔＲＮＡ、ｒＲＮＡ、核小体低分子ＲＮＡ（ｓｎｏＲＮＡ）、Ｐｉｗｉ相互作用ＲＮＡ（ｐｉＲＮＡ）、長鎖非コードＲＮＡ（長鎖ｎｃＲＮＡ）、またはこれらのいずれかの断片を含む、ＤＮＡ、ＲＮＡ、およびそれらのハイブリッドが含まれる。無細胞核酸は、二本鎖、一本鎖、またはそれらのハイブリッドであり得る。無細胞核酸は、分泌または細胞死プロセス、例えば、細胞壊死およびアポトーシスを経て体液中に放出され得る。一部の無細胞核酸、例えば循環腫瘍ＤＮＡ（ｃｔＤＮＡ）は、がん細胞から体液中に放出される。その他は、健康な細胞から放出される。一部の実施形態では、ｃｆＤＮＡは、無細胞胎児ＤＮＡ（ｃｆｆＤＮＡ）である。一部の実施形態では、無細胞核酸は、腫瘍細胞によって産生される。一部の実施形態では、無細胞核酸は、腫瘍細胞と非腫瘍細胞の混合物によって産生される。

無細胞核酸は、約１００～５００ヌクレオチドの例示的なサイズ分布を有し、１１０～約２３０ヌクレオチドの分子が、分子の約９０％に相当し、最頻値は約１６８ヌクレオチドであり、第２の小さなピークは２４０～４４０ヌクレオチドの間の範囲である。

一部の実施形態では、試料中のＤＮＡは、無細胞ＤＮＡから本質的になる。これは、試料中のＤＮＡすべてまたはほぼすべて、例えば、重量またはモル分率で少なくとも９０％のＤＮＡがｃｆＤＮＡであることを意味する。一部の実施形態では、重量またはモル分率で試料中の少なくとも９５％、９７％、９８％、９９％、９９．５％、または９９．９％のＤＮＡがｃｆＤＮＡである。一部の実施形態では、試料中のＤＮＡは無細胞ＤＮＡからなる。

無細胞核酸は、分画または分配ステップを経て体液から単離され得、ここでは、溶液中に見出される無細胞核酸が、インタクトな細胞および体液の他の不溶性成分から分離される。分配は、遠心分離または濾過等の手法を含み得る。あるいは、体液中の細胞を溶解し、無細胞および細胞の核酸を共に処理することができる。一般に、緩衝液の添加および洗浄ステップの後、核酸をアルコールで沈殿させることができる。夾雑物または塩を除去するためのシリカ系カラム等のさらなる清浄ステップを使用することができる。手順のある特定の態様、例えば収量を最適化するために、非特異的バルク担体核酸、例えば、バイサルファイトシーケンシング、ハイブリダイゼーション、および／またはライゲーションのためのＣ１ＤＮＡ、ＤＮＡまたはタンパク質を反応全体にわたって添加することができる。

そのような処理の後、試料は、二本鎖ＤＮＡ、一本鎖ＤＮＡおよび一本鎖ＲＮＡを含む種々の形態の核酸を含み得る。一部の実施形態では、それらをその後の処理および分析のステップに含めることができるように、一本鎖ＤＮＡおよびＲＮＡを二本鎖形態に変換することができる。

試料中の二本鎖ＤＮＡ分子および二本鎖ＤＮＡ分子に変換された一本鎖核酸分子を一方の末端または両末端のいずれかでアダプターと連結することができる。典型的には、二本鎖分子を、４種すべての標準のヌクレオチドの存在下で５’－３’ポリメラーゼおよび３’－５’エキソヌクレアーゼ（またはプルーフリーディング機能）を有するポリメラーゼで処理することにより、平滑末端化する。Ｋｌｅｎｏｗ大断片およびＴ４ポリメラーゼは適切なポリメラーゼの例である。平滑末端化ＤＮＡ分子を少なくとも部分的に二本鎖のアダプター（例えば、Ｙ字形またはベル形のアダプター）とライゲーションすることができる。あるいは、試料核酸およびアダプターの平滑末端に相補的ヌクレオチドを付加して、ライゲーションを容易にすることができる。本明細書では、平滑末端ライゲーションおよび粘着末端ライゲーションのどちらも意図されている。平滑末端ライゲーションでは、核酸分子およびアダプタータグの両方が平滑末端を有する。粘着末端ライゲーションでは、典型的には、核酸分子は「Ａ」オーバーハングを有し、アダプターは「Ｔ」オーバーハングを有する。
２．タグ

バーコードを含むタグをアダプターに組み込むまたは他の方法で結合することができる。タグは、他の方法の中でも、ライゲーション、重複伸長ＰＣＲによって組み込むことができる。
ａ．分子タグ付け戦略

分子タグ付けとは、配列リードの起源である分子を弁別することを可能にするタグ付けの慣例を指す。タグ付け戦略は、一意的タグ付けおよび非一意的タグ付け戦略に分けることができる。一意的タグ付けでは、試料中の分子のすべてまたは実質的にすべてが異なるタグを有し、したがって、タグ情報だけに基づいてリードを元の分子に割り当てることができる。そのような方法に使用されるタグは、時には「一意的タグ」と称される。非一意的タグ付けでは、同じ試料中の異なる分子が同じタグを有し得、したがって、配列リードを元の分子に割り当てるために、タグ情報に加えて他の情報が使用される。そのような情報には、開始および終止座標、分子がマッピングされる座標、開始座標または終止座標単独等が含まれ得る。そのような方法に使用されるタグは、時には「非一意的タグ」と称される。したがって、試料中のすべての分子に一意的なタグを付ける必要はない。試料内の同定可能なクラスの範囲内に入る分子に一意的なタグを付けることで十分である。したがって、異なる同定可能なファミリーの分子は、タグ付けされた分子の正体に関する情報を失うことなく、同じタグを有し得る。

非一意的タグ付けのある特定の実施形態では、使用される異なるタグの数は、特定の群のすべての分子が異なるタグを有する可能性が非常に高くなるようにする（例えば、少なくとも９９％、少なくとも９９．９％、少なくとも９９．９９％または少なくとも９９．９９９％）ために十分であり得る。バーコードをタグとして使用する場合、およびバーコードを分子の両末端に、例えばランダムに付着させる場合、バーコードの組合せも一緒になってタグを構成し得ることに留意すべきである。この数は次いで、クラス内に入る分子の数に応じたものになる。例えば、クラスは、参照ゲノム内の同じ開始－終止位置にマッピングされるすべての分子であり得る。クラスは、特定の遺伝子座、例えば、特定の塩基または特定の領域（例えば、最大１００塩基または遺伝子または遺伝子のエクソン）にわたってマッピングされるすべての分子であり得る。ある特定の実施形態では、クラスの中の分子の数ｚを一意的に同定するために使用される異なるタグの数は、２^＊ｚ、３^＊ｚ、４^＊ｚ、５^＊ｚ、６^＊ｚ、７^＊ｚ、８^＊ｚ、９^＊ｚ、１０^＊ｚ、１１^＊ｚ、１２^＊ｚ、１３^＊ｚ、１４^＊ｚ、１５^＊ｚ、１６^＊ｚ、１７^＊ｚ、１８^＊ｚ、１９^＊ｚ、２０^＊ｚまたは１００^＊ｚのいずれか（例えば、下限）と１００，０００^＊ｚ、１０，０００^＊ｚ、１０００^＊ｚまたは１００^＊ｚのいずれか（例えば、上限）との間であってよい。

例えば、ヒト無細胞ＤＮＡ約３ｎｇ～３０ｎｇの試料中、およそ１０^３～１０^４個の分子が特定のヌクレオチド座標にマッピングされ、約３～１０個の分子が任意の開始座標を同じ終止座標と共有することが予想される。したがって、そのような分子のすべてに一意的なタグを付けるためには約５０～約５０，０００種の異なるタグ（例えば、約６～２２０種のバーコード組合せ）で十分であり得る。１つのヌクレオチド座標にマッピングされる１０^３～１０^４個の分子すべてに一意的なタグを付けるためには、約１００万～約２０００万種の異なるタグが必要になる。

一般に、反応における一意的または非一意的タグバーコードの割り当ては、米国特許出願第２００１００５３５１９号、同第２００３０１５２４９０号、同第２０１１０１６００７８号、ならびに米国特許第６，５８２，９０８号および米国特許第７，５３７，８９８号および米国特許第９，５９８，７３１号に記載されている方法およびシステムに従う。タグは、試料核酸にランダムにまたは非ランダムに連結され得る。

一部の実施形態では、タグ付けされた核酸をマイクロウェルプレートにローディングした後、シーケンシングする。マイクロウェルプレートは、９６、３８４、または１５３６マイクロウェルを有してよい。一部の場合には、一意的タグ対マイクロウェルの予測される比で導入される。例えば、一意的タグを、ゲノム試料あたり約１個よりも多く、約２個よりも多く、約３個よりも多く、約４個よりも多く、約５個よりも多く、約６個よりも多く、約７個よりも多く、約８個よりも多く、約９個よりも多く、約１０個よりも多く、約２０個よりも多く、約５０個よりも多く、約１００個よりも多く、約５００個よりも多く、約１０００個よりも多く、約５０００個よりも多く、約１００００個よりも多く、約５０，０００個よりも多く、約１００，０００個よりも多く、約５００，０００個よりも多く、約１，０００，０００個よりも多く、約１０，０００，０００個よりも多く、約５０，０００，０００個よりも多くまたは約１，０００，０００，０００個よりも多くの一意的タグがローディングされるように、ローディングすることができる。一部の場合には、一意的タグを、ゲノム試料あたり約２個未満、約３個未満、約４個未満、約５個未満、約６個未満、約７個未満、約８個未満、約９個未満、約１０個未満、約２０個未満、約５０個未満、約１００個未満、約５００個未満、約１０００個未満、約５０００個未満、約１００００個未満、約５０，０００個未満、約１００，０００個未満、約５００，０００個未満、約１，０００，０００個未満、約１０，０００，０００個未満、約５０，０００，０００個未満または約１，０００，０００，０００個未満の一意的タグがローディングされるように、ローディングすることができる。一部の場合には、試料ゲノムあたりにローディングされる一意的タグの平均数は、ゲノム試料あたり約１個未満、約２個未満、約３個未満、約４個未満、約５個未満、約６個未満、約７個未満、約８個未満、約９個未満、約１０個未満、約２０個未満、約５０個未満、約１００個未満、約５００個未満、約１０００個未満、約５０００個未満、約１００００個未満、約５０，０００個未満、約１００，０００個未満、約５００，０００個未満、約１，０００，０００個未満、約１０，０００，０００個未満、約５０，０００，０００個未満もしくは約１，０００，０００，０００個未満、または、約１個よりも多く、約２個よりも多く、約３個よりも多く、約４個よりも多く、約５個よりも多く、約６個よりも多く、約７個よりも多く、約８個よりも多く、約９個よりも多く、約１０個よりも多く、約２０個よりも多く、約５０個よりも多く、約１００個よりも多く、約５００個よりも多く、約１０００個よりも多く、約５０００個よりも多く、約１００００個よりも多く、約５０，０００個よりも多く、約１００，０００個よりも多く、約５００，０００個よりも多く、約１，０００，０００個よりも多く、約１０，０００，０００個よりも多く、約５０，０００，０００個よりも多くもしくは約１，０００，０００，０００個よりも多くの一意的タグである。

好ましいフォーマットは、標的核酸の両末端にライゲーションされる、２０～５０個の異なるタグ（例えば、バーコード）を使用する。例えば、標的分子の両末端にライゲーションされる３５個の異なるタグ（例えば、バーコード）により３５×３５の順列が創出され、これは、３５個のタグに対して１２２５種のタグ組合せと等しい。そのようなタグの数は、同じ開始および終止点を有する異なる分子が、異なる組合せのタグを受ける高い確率（例えば、少なくとも９４％、９９．５％、９９．９９％、９９．９９９％）を有するために十分である。他のバーコード組合せには、１０から５００の間の任意の数、例えば、約１５×１５、約３５×３５、約７５×７５、約１００×１００、約２５０×２５０、約５００×５００が含まれる。

一部の場合には、一意的タグは、所定のまたはランダムなまたは半ランダムな配列オリゴヌクレオチドであり得る。他の場合には、複数のバーコードを使用することができ、したがって、複数内のバーコードは互いに必ずしも一意的ではない。この例では、バーコードを個々の分子にライゲーションすることができ、したがって、バーコードとそれがライゲーションされる配列との組合せにより、個別に追跡することができる一意的配列が創出される。本明細書に記載されるように、非一意的バーコードと、配列リードの出発（開始）および終了（終止）部分の配列データを組み合わせて検出することにより、一意的正体を特定の分子に割り当てることが可能になる。個々の配列リードの塩基対の長さまたは数も、そのような分子に一意的正体を割り当てるために使用することができる。本明細書に記載されるように、一意的正体が割り当てられた核酸の単一ストランドからの断片によって、親ストランドからの断片のその後の同定が可能になり得る。
３．増幅

アダプターが隣接する試料核酸を、ＰＣＲおよび他の増幅方法によって増幅することができる。増幅は、典型的には、増幅すべきＤＮＡ分子に隣接するアダプター内のプライマー結合部位に結合するプライマーによってプライミングされる。増幅方法は、熱サイクリングから生じる変性、アニーリングおよび伸長のサイクルを伴うか、または転写媒介増幅におけるように定温であってもよい。他の増幅方法には、リガーゼ連鎖反応、鎖置換増幅（ｓｔｒａｎｄｄｉｓｐｌａｃｅｍｅｎｔａｍｐｌｉｆｉｃａｔｉｏｎ）、核酸配列に基づく増幅、および配列に基づく自己持続複製が含まれる。

本方法では、アダプターへの連結前に二本鎖核酸の少なくとも５０％、６０％、７０％または８０％の増幅がもたらされる、Ｔテイル付きおよびＣテイル付きアダプターを用いたｄｓＤＮＡライゲーションを実施することが好ましい。本方法では、Ｔテイル付きアダプター単独で実施される対照方法と比べて増幅される分子の量または数が少なくとも１０％、１５％または２０％増加することが好ましい。
４．ベイトセット；捕捉部分；富化

上記のように、試料中の核酸を捕捉ステップに供することができ、ここでは、標的配列を有する分子がその後の分析のために捕捉される。標的捕捉は、ビオチンまたは以下に言及される他の例等の捕捉部分で標識されたオリゴヌクレオチドベイトを含むベイトセットの使用を伴い得る。プローブは、遺伝子等の領域のパネルにわたってタイリングするために選択される配列を有し得る。一部の実施形態では、ベイトセットは、それぞれ本明細書の他の箇所で考察されている配列可変標的領域セットおよびエピジェネティック標的領域セットのもの等の標的領域のセットについてより高いおよびより低い捕捉収率を有し得る。一部の実施形態では、ベイト（すなわち、プローブ）は、ＲＮＡ、ｓｓＤＮＡまたはｄｓＤＮＡであり得る。ベイトセットを試料と、ベイトを有する標的分子のハイブリダイゼーションを可能にする条件下で組み合わせる。次いで、捕捉された分子を、捕捉部分を使用して単離する。例えば、ビオチン捕捉部分をビーズベースのストレプトアビジンによって。そのような方法は、例えば、参照により本明細書に組み込まれる、２０１７年１２月２６日発行の米国特許第９，８５０，５２３号にさらに記載されている。

捕捉部分には、限定なく、ビオチン、アビジン、ストレプトアビジン、特定のヌクレオチド配列を含む核酸、抗体によって認識されるハプテン、および磁気的に誘引可能な粒子が含まれる。抽出部分は、ビオチン／ストレプトアビジンまたはハプテン／抗体等の結合対のメンバーであり得る。一部の実施形態では、分析物に付着した捕捉部分を、単離可能な部分に付着したその結合対、例えば、磁気的に誘引可能な粒子または遠心分離によって沈降させることができる大きな粒子等によって捕捉する。捕捉部分は、捕捉部分を有する核酸の捕捉部分を欠く核酸からの親和性分離を可能にする任意の型の分子であってよい。例示的な捕捉部分は、固相に連結したもしくは連結可能なストレプトアビジンに結合することによって親和性分離を可能にするビオチン、または固相に連結したもしくは連結可能な相補的オリゴヌクレオチドに結合することによって親和性分離を可能にするオリゴヌクレオチドである。
５．シーケンシング

必要に応じてアダプターが隣接する試料核酸は、事前の増幅を伴いまたは伴わずに、一般にシーケンシングに供される。シーケンシング法または必要に応じて利用される市販のフォーマットには、例えばＳａｎｇｅｒシーケンシング、ハイスループットシーケンシング、パイロシーケンシング、合成によるシーケンシング、単分子シーケンシング、ナノポアに基づくシーケンシング、半導体シーケンシング、ライゲーションによるシーケンシング、ハイブリダイゼーションによるシーケンシング、ＲＮＡ－Ｓｅｑ（Ｉｌｌｕｍｉｎａ）、ＤｉｇｉｔａｌＧｅｎｅＥｘｐｒｅｓｓｉｏｎ（Ｈｅｌｉｃｏｓ）、次世代シーケンシング（ＮＧＳ）、合成による単分子シーケンシング（ＳＭＳＳ）（Ｈｅｌｉｃｏｓ）、大規模並列シーケンシング、ＣｌｏｎａｌＳｉｎｇｌｅＭｏｌｅｃｕｌｅＡｒｒａｙ（Ｓｏｌｅｘａ）、ショットガンシーケンシング、ＩｏｎＴｏｒｒｅｎｔ、ＯｘｆｏｒｄＮａｎｏｐｏｒｅ、ＲｏｃｈｅＧｅｎｉａ、マキサム－ギルバートシーケンシング、プライマーウォーキング、ＰａｃＢｉｏを、ＳＯＬｉＤを、ＩｏｎＴｏｒｒｅｎｔを、またはＮａｎｏｐｏｒｅプラットフォームを使用するシーケンシングが含まれる。高メチル化画分由来の分子のリードまたは配列から検出されるＣからＴへのまたはＧからＡへのトランジション変異をより高い厳密性でコールすることを含む本明細書に記載した原理は、当業者により、メチル化を直接検出するシーケンシング手法、例えば、ＯｘｆｏｒｄＮａｎｏｐｏｒｅまたはＰａｃＢｉｏを使用するシーケンシングに適用され得る。シーケンシング反応は種々の試料処理ユニットで実施することができ、その中には複数のレーン、複数のチャネル、複数のウェル、または実質的に同時に複数の試料のセットを処理するその他の手段が含まれ得る。試料処理ユニットには、複数の試行を同時に処理することができる複数の試料チャンバーも含まれ得る。

シーケンシング反応は、がんのまたは他の疾患のマーカーを含有する１つまたは複数の核酸断片型または領域に対して実施され得る。シーケンシング反応は、試料中に存在する任意の核酸断片に対しても実施され得る。配列反応は、ゲノムの少なくとも約５％、１０％、１５％、２０％、２５％、３０％、４０％、５０％、６０％、７０％、８０％、９０％、９５％、９９％、９９．９％、または１００％に対して実施され得る。他の場合では、配列反応は、ゲノムの約５％未満、約１０％未満、約１５％未満、約２０％未満、約２５％未満、約３０％未満、約４０％未満、約５０％未満、約６０％未満、約７０％未満、約８０％未満、約９０％未満、約９５％未満、約９９％未満、約９９．９％未満、または約１００％未満に対して実施され得る。

同時シーケンシング反応は、多重シーケンシング手法を使用して実施してよい。一部の実施形態では、無細胞ポリヌクレオチドは、少なくとも約１０００、２０００、３０００、４０００、５０００、６０００、７０００、８０００、９０００、１００００、５００００、または１００，０００回のシーケンシング反応によってシーケンシングされる。他の実施形態では、無細胞ポリヌクレオチドは、約１０００、２０００、３０００、４０００、５０００、６０００、７０００、８０００、９０００、１００００、５００００、または１００，０００回未満のシーケンシング反応によってシーケンシングされる。シーケンシング反応は、典型的には逐次的にまたは同時に実施される。その後のデータ解析は一般にシーケンシング反応の全部または一部について実施される。一部の実施形態では、データ解析は少なくとも約１０００、２０００、３０００、４０００、５０００、６０００、７０００、８０００、９０００、１００００、５００００、または１００，０００回のシーケンシング反応について実施される。他の実施形態では、データ解析は約１０００、２０００、３０００、４０００、５０００、６０００、７０００、８０００、９０００、１００００、５００００、または１００，０００回未満のシーケンシング反応について実施してよい。リード深度の例は、遺伝子座（例えば塩基の位置）あたり約１０００～約５００００リードである。
ａ．示差的なシーケンシング深度

一部の実施形態では、配列可変標的領域セットに対応する核酸は、エピジェネティック標的領域セットに対応する核酸よりも高いシーケンシング深度までシーケンシングされる。例えば、配列バリアント標的領域セットに対応する核酸についてのシーケンシング深度は、エピジェネティック標的領域セットに対応する核酸についてのシーケンシング深度の少なくとも１．２５倍、１．５倍、１．７５倍、２倍、２．２５倍、２．５倍、２．７５倍、３倍、３．５倍、４倍、４．５倍、５倍、６倍、７倍、８倍、９倍、１０倍、１１倍、１２倍、１３倍、１４倍、もしくは１５倍、または１．２５倍～１．５倍、１．５倍～１．７５倍、１．７５倍～２倍、２倍～２．２５倍、２．２５倍～２．５倍、２．５倍～２．７５倍、２．７５倍～３倍、３倍～３．５倍、３．５倍～４倍、４倍～４．５倍、４．５倍～５倍、５倍～５．５倍、５．５倍～６倍、６倍～７倍、７倍～８倍、８倍～９倍、９倍～１０倍、１０倍～１１倍、１１倍～１２倍、１３倍～１４倍、１４倍～１５倍、もしくは１５倍～１００倍であり得る。一部の実施形態では、前記シーケンシング深度は少なくとも２倍である。一部の実施形態では、前記シーケンシング深度は少なくとも５倍である。一部の実施形態では、前記シーケンシング深度は少なくとも１０倍である。一部の実施形態では、前記シーケンシング深度は４倍～１０倍である。一部の実施形態では、前記シーケンシング深度は４倍～１００倍である。これらの実施形態のそれぞれは、配列可変標的領域セットに対応する核酸がエピジェネティック標的領域セットに対応する核酸よりも高いシーケンシング深度までシーケンシングされる程度を指す。

一部の実施形態では、配列可変標的領域セットに対応する捕捉されたｃｆＤＮＡおよびエピジェネティック標的領域セットに対応する捕捉されたｃｆＤＮＡを、例えば、同じシーケンシングセル（例えば、Ｉｌｌｕｍｉｎａシーケンサーのフローセル等）中、および／または別々に捕捉されたセットの組換えによって生じたプールされた組成物もしくは同じ容器中の配列可変標的領域セットに対応するｃｆＤＮＡおよびエピジェネティック標的領域セットに対応する捕捉されたｃｆＤＮＡの捕捉によって得られた組成物であり得る同じ組成物中で同時にシーケンシングする。
ｂ．シーケンシングのための調製

一部の実施形態では、一方または両方の末端に一本鎖のオーバーハングを有する二本鎖核酸に平滑末端を酵素的に形成することによるシーケンシングのための核酸の集団が調製される。これらの実施形態では、集団は典型的にはヌクレオチド（例えばＡ、Ｃ、Ｇ、およびＴまたはＵ）の存在下に５’－３’ＤＮＡポリメラーゼ活性および３’－５’エキソヌクレアーゼ活性を有する酵素で処理される。必要に応じて使用され得る酵素またはその触媒断片の例には、Ｋｌｅｎｏｗ大断片およびＴ４ポリメラーゼが含まれる。５’オーバーハングでは、酵素は典型的には対向するストランドの上の後退した３’末端を、それが５’末端と重なって平滑末端を生成するまで伸長する。３’オーバーハングでは、酵素は一般に３’末端から対向するストランドの５’末端まで、時にはそれを越えて、消化する。この消化が対向するストランドの５’末端を越えて進めば、ギャップは５’オーバーハングに使用する同じポリメラーゼ活性を有する酵素によってフィルインされ得る。二本鎖核酸における平滑末端の形成により、例えばアダプターの結合およびその後の増幅が容易になる。

一部の実施形態では、核酸の集団はさらなる処理、例えば一本鎖核酸から二本鎖核酸への変換および／またはＲＮＡからＤＮＡ（例えば相補的ＤＮＡ、即ちｃＤＮＡ）への変換に供される。これらの形態の核酸も、必要に応じてアダプターに連結され、増幅される。

事前の増幅ありとなしで、上記の平滑末端を形成するプロセスに供する核酸、および必要に応じて試料中の他の核酸をシーケンシングして、シーケンシングされた核酸を産生することができる。シーケンシングされた核酸は、核酸の配列（例えば配列情報）、またはその配列が決定された核酸と称し得る。シーケンシングは、試料中の個々の核酸分子の増幅産物のコンセンサス配列から直接または間接的に試料中の個々の核酸分子の配列データを提供するように、実施することができる。

一部の実施形態では、平滑末端の形成の後の試料中の一本鎖オーバーハングを有する二本鎖核酸は、バーコードを含むアダプターに両末端で連結され、シーケンシングは核酸配列およびアダプターによって導入されたインラインバーコードを決定する。平滑末端ＤＮＡ分子は、必要に応じて、少なくとも部分的に二本鎖のアダプター（例えばＹ字形またはベル形のアダプター）の平滑末端にライゲーションされる。あるいは、試料核酸およびアダプターの平滑末端に相補的ヌクレオチドのテイルを付けてライゲーションを容易にする（例えば付着末端ライゲーションのため）ことができる。

核酸試料は、典型的には同じ核酸の任意の２つのコピーが両末端に連結されたアダプターからの同じアダプターバーコードの組合せを受ける確率が低くなる（例えば約１または０．１％未満）ように、十分な数のアダプターと接触させられる。このようにしてアダプターを使用することにより、参照核酸上の同じ出発点および停止点を有し、同じバーコードの組合せに連結された核酸配列のファミリーの特定が可能になる。そのようなファミリーは、増幅前の試料中の核酸の増幅産物の配列を表わし得る。ファミリーメンバーの配列をコンパイルして、平滑末端の形成およびアダプターの結合によって改変された元の試料中の核酸分子のコンセンサスヌクレオチドまたは完全なコンセンサス配列を誘導することができる。換言すれば、試料中の核酸の特定された位置を占めるヌクレオチドは、ファミリーメンバー配列における対応する位置を占めるヌクレオチドのコンセンサスであると決定することができる。ファミリーには、二本鎖核酸の一方または両方のストランドの配列が含まれ得る。ファミリーのメンバーが二本鎖核酸からの両方のストランドの配列を含むならば、配列をコンパイルしてコンセンサスヌクレオチドまたは配列を誘導する目的のために、１つのストランドの配列をその相補体に変換することができる。いくつかのファミリーは単一メンバーの配列のみを含む。この場合には、この配列は増幅前の試料中の核酸の配列とみなすことができる。あるいは、単一メンバー配列のみを有するファミリーを、その後の解析から除外してもよい。

シーケンシングされた核酸におけるヌクレオチドの変動（例えばＳＮＶまたはインデル）は、シーケンシングされた核酸を参照配列と比較することによって決定することができる。参照配列は既知の配列、例えば対象からの既知の全部または一部のゲノム配列（例えばヒト対象の全ゲノム配列）であることが多い。参照配列は、例えばｈＧ１９またはｈＧ３８であってよい。上記のように、シーケンシングされた核酸は、試料中の核酸について直接決定された配列、またはそのような核酸の増幅産物の配列のコンセンサスを表わし得る。比較は、参照配列の１つまたは複数の指定された位置で実施することができる。シーケンシングされた核酸のサブセットは、それぞれの配列が最大限にアラインメントされた場合に、参照配列の指定された位置に対応する位置を含んで特定することができる。そのようなサブセットの中で、シーケンシングされた核酸がもしあれば、指定された位置にヌクレオチドの変動を含むか、必要に応じてもしあれば、参照ヌクレオチドを含む（例えば参照配列と同じ）かを、決定することができる。ヌクレオチドバリアントを含むサブセット中のシーケンシングされた核酸の数が選択した閾値を超えれば、バリアントヌクレオチドを指定された位置においてコールすることができる。閾値は、他の可能性の中でも、ヌクレオチドバリアントを含むサブセットの中の少なくとも１、２、３、４、５、６、７、８、９、もしくは１０個等のシーケンシングされた核酸の単純な数であってもよく、またはヌクレオチドバリアントを含むサブセットの中のシーケンシングされた核酸の少なくとも０．５、１、２、３、４、５、１０、１５、もしくは２０等の比であってもよい。参照配列の中の任意の指定された目的の位置について、比較を繰り返すことができる。時には、参照配列の少なくとも約２０、１００、２００、または３００の隣接する位置、例えば約２０～５００、または約５０～３００の隣接する位置を占める指定された位置について、比較を実施してもよい。

本明細書に記載したフォーマットおよび適用を含む核酸シーケンシングに関するさらなる詳細は、例えば、そのそれぞれがこれにより全体が参照により本明細書に組み込まれる、Ｌｅｖｙｅｔａｌ．，ＡｎｎｕａｌＲｅｖｉｅｗｏｆＧｅｎｏｍｉｃｓａｎｄＨｕｍａｎＧｅｎｅｔｉｃｓ，１７：９５－１１５（２０１６）、Ｌｉｕｅｔａｌ．，Ｊ．ｏｆＢｉｏｍｅｄｉｃｉｎｅａｎｄＢｉｏｔｅｃｈｎｏｌｏｇｙ，Ｖｏｌｕｍｅ２０１２，ＡｒｔｉｃｌｅＩＤ２５１３６４：１－１１（２０１２）、Ｖｏｅｌｋｅｒｄｉｎｇｅｔａｌ．，ＣｌｉｎｉｃａｌＣｈｅｍ．，５５：６４１－６５８（２００９）、ＭａｃＬｅａｎｅｔａｌ．，ＮａｔｕｒｅＲｅｖ．Ｍｉｃｒｏｂｉｏｌ．，７：２８７－２９６（２００９）、Ａｓｔｉｅｒｅｔａｌ．，ＪＡｍＣｈｅｍＳｏｃ．，１２８（５）：１７０５－１０（２００６）、米国特許第６，２１０，８９１号、米国特許第６，２５８，５６８号、米国特許第６，８３３，２４６号、米国特許第７，１１５，４００号、米国特許第６，９６９，４８８号、米国特許第５，９１２，１４８号、米国特許第６，１３０，０７３号、米国特許第７，１６９，５６０号、米国特許第７，２８２，３３７号、米国特許第７，４８２，１２０号、米国特許第７，５０１，２４５号、米国特許第６，８１８，３９５号、米国特許第６，９１１，３４５号、米国特許第７，５０１，２４５号、米国特許第７，３２９，４９２号、米国特許第７，１７０，０５０号、米国特許第７，３０２，１４６号、米国特許第７，３１３，３０８号、および米国特許第７，４７６，５０３号にも提供されている。
６．解析

シーケンシングにより、複数の配列リードまたはリードが生成し得る。配列リードまたはリードは、長さが約１５０塩基未満または長さが約９０塩基未満のヌクレオチドデータの配列を含み得る。一部の実施形態では、リードは、長さが約８０塩基と約９０塩基との間、例えば、約８５塩基である。一部の実施形態では、本開示の方法は、例えば、長さが約５０塩基未満または約３０塩基未満の非常に短いリードに適用される。配列リードデータは、配列データならびにメタ情報を含み得る。配列リードデータは、例えば、ＶＣＦファイル、ＦＡＳＴＡファイル、またはＦＡＳＴＱファイルを含む任意の適切なファイルフォーマットで記憶することができる。

ＦＡＳＴＡは、配列データベースを検索するためのコンピュータプログラムを指し得、ＦＡＳＴＡという名称は標準ファイルフォーマットも指し得る。例えば、ＦＡＳＴＡは、これによりその全体が参照により本明細書に組み込まれるPearson & Lipman, 1988, Improved tools for biological sequence comparison, PNAS 85:2444-2448に記載されている。ＦＡＳＴＡフォーマットにおける配列は１行の説明で始まり、複数行の配列データが続く。説明行は第１欄における「より大（＞）」符号によって配列データから区別される。「＞」符号に続く単語は配列の識別子であり、行の残りは説明である（いずれも任意）。「＞」と識別子の第１文字との間にスペースはなくてもよい。テキストのすべての行は８０文字よりも短いことが推奨されている。「＞」で始まる別の行が現れた場合には配列は終了する。これは別の配列の始まりを示す。

ＦＡＳＴＱフォーマットは、生物学的配列（通常、ヌクレオチド配列）とそれに対応する品質スコアとの両方を記憶するための、テキストに基づくフォーマットである。これはＦＡＳＴＡフォーマットに類似しているが、配列データに続く品質スコアを有する。簡潔のため、配列文字と品質スコアの両方が単一のＡＳＣＩＩ文字によって符号化されている。ＦＡＳＴＱフォーマットは、例えば、これによりその全体が参照により本明細書に組み込まれる、Cock et al. ("The Sanger FASTQ file format for sequences with quality scores, and the Solexa/Illumina FASTQ variants," Nucleic Acids Res 38 (6): 1767-1771, 2009）に記載されているＩｌｌｕｍｉｎａのＧｅｎｏｍｅＡｎａｌｙｚｅｒ等のハイスループットシーケンシング装置の出力を記憶するための事実上の標準である。

ＦＡＳＴＡおよびＦＡＳＴＱファイルについて、メタ情報は説明行を含み、配列データの行を含まない。一部の実施形態では、ＦＡＳＴＱファイルについて、メタ情報は品質スコアを含む。ＦＡＳＴＡおよびＦＡＳＴＱファイルについて、配列データは説明行の後に始まり、典型的には必要に応じて「－」を有するＩＵＰＡＣ多義コードのあるサブセットを使用して存在する。ある実施形態では、配列データには、必要に応じて任意に「－」またはＵ（例えば、ギャップまたはウラシルを表す）を含むＡ、Ｔ、Ｃ、Ｇ、およびＮ文字が使用され得る。

一部の実施形態では、少なくとも１つのマスター配列リードファイルおよび出力ファイルが、（例えば、ＡＳＣＩＩ；ＩＳＯ／ＩＥＣ６４６；ＥＢＣＤＩＣ；ＵＴＦ－８；またはＵＴＦ－１６等の符号化を使用して）プレインテキストファイルとして記憶される。本開示によって提供されるコンピュータシステムは、プレインテキストファイルを開くことができるテキストエディタープログラムを含み得る。テキストエディタープログラムは、コンピュータスクリーン上にテキストファイル（例えばプレインテキストファイル等）の内容を提示して、（例えばモニター、キーボード、およびマウスを使用して）人がテキストを編集することを可能にすることができるコンピュータプログラムを指し得る。テキストエディターの例には、限定なくＭｉｃｒｏｓｏｆｔＷｏｒｄ、ｅｍａｃｓ、ｐｉｃｏ、ｖｉ、ＢＢＥｄｉｔ、およびＴｅｘｔＷｒａｎｇｌｅｒが含まれる。テキストエディタープログラムは、コンピュータスクリーン上にプレインテキストファイルを表示し、メタ情報および配列リードを、ヒトが読める（例えば、バイナリ符号化ではなく、その代わりに印刷または手書きで使用され得るような英数字を使用する）フォーマットで示すことを可能とし得る。

ＦＡＳＴＡまたはＦＡＳＴＱファイルを参照して方法を論じたが、本開示の方法およびシステムは、例えば、ＶａｒｉａｎｔＣａｌｌＦｏｒｍａｔ（ＶＣＦ）フォーマットのファイルを含む任意の適切な配列ファイルフォーマットを圧縮するために使用され得る。典型的なＶＣＦファイルは、ヘッダーセクションとデータセクションとを含み得る。ヘッダーは、それぞれが文字「＃＃」で始まる任意の数のメタ情報行、および単一の「＃」文字で始まるＴＡＢで区切られたフィールド定義行を含有する。フィールド定義行は必須の８個の欄を命名し、ボディセクションはフィールド定義行によって定義された欄を埋めるデータの行を含有する。ＶＣＦフォーマットは、例えばこれによりその全体が参照により本明細書に組み込まれるDanecek et al. ("The variant call format and VCF tools," Bioinformatics 27 (15): 2156-2158, 2011）に記載されている。ヘッダーセクションは圧縮されたファイルに書き込むメタ情報として処理され得、データセクションはそのそれぞれが固有のものであった場合のみにマスターファイルに記憶され得る行として処理され得る。

一部の実施形態は、配列リードのアセンブリを提供する。アラインメントによるアセンブリでは、例えば、配列リードは相互にアラインメントされるか、または参照配列に対してアラインメントされる。それぞれのリードを今度は参照ゲノムに対してアラインメントすることによって、リードのすべてが相互の関係において位置決めされてアセンブリが生成される。さらに、配列リードを参照配列に対してアラインメントする、またはマッピングすることは、配列リード内のバリアント配列を同定するためにも使用され得る。本明細書に記載した方法およびシステムと組み合わせてバリアント配列を同定することを使用して、疾患もしくは状態の診断または予後判定をさらに助け、または処置の決定を導くことができる。

一部の実施形態では、ステップのいずれかまたはすべてが自動化される。あるいは、本開示の方法は、全体としてまたは部分的に、例えばそれぞれが必要に応じてＣ＋＋等のコンパイラ型言語で書かれ、次いでコンパイルされバイナリとして配布される１つまたは複数の専用プログラムに具現化してもよい。本開示の方法は、全体としてまたは部分的に、既存の配列解析プラットフォーム内のモジュールとして、またはそのプラットフォーム内の機能性を呼び出すことによって、実装されてもよい。一部の実施形態では、本開示の方法は、すべてが単一の開始キュー（例えば、人の活動、別のコンピュータプログラム、または機械に起因する誘発事象の１つまたは組合せ）に応答して自動的に呼び出されるいくつかのステップを含む。したがって、本開示は、ステップのいずれかまたはステップの任意の組合せがキューに応答して自動的に起こり得る方法を提供する。「自動的に」は一般に、介在する人の入力、影響、または相互作用がないこと（例えば、元のまたはキュー以前の人の活動にのみ応答すること）を意味する。

本開示の方法は、対象の核酸試料の正確なかつ感度の良い解釈を含む種々の形態の出力も包含し得る。検索の出力はコンピュータファイルのフォーマットで提供され得る。一部の実施形態では、出力はＦＡＳＴＡファイル、ＦＡＳＴＱファイル、またはＶＣＦファイルである。出力を処理してテキストファイル、または、例えば、核酸の配列を参照ゲノムの配列にアラインメントさせた配列データを含有するＸＭＬファイルを生成させてもよい。他の実施形態では、処理により、参照ゲノムに対する対象核酸の１つまたは複数の変異を記述する座標またはストリングを含有する出力が得られる。アラインメントストリングには、ＳｉｍｐｌｅＵｎＧａｐｐｅｄＡｌｉｇｎｍｅｎｔＲｅｐｏｒｔ（ＳＵＧＡＲ）、ＶｅｒｂｏｓｅＵｓｅｆｕｌＬａｂｅｌｅｄＧａｐｐｅｄＡｌｉｇｎｍｅｎｔＲｅｐｏｒｔ（ＶＵＬＧＡＲ）、およびＣｏｍｐａｃｔＩｄｉｏｓｙｎｃｒａｔｉｃＧａｐｐｅｄＡｌｉｇｎｍｅｎｔＲｅｐｏｒｔ（ＣＩＧＡＲ）（例えばこれによりその全体が参照により本明細書に組み込まれるNing et al., Genome Research 11(10):1725-9, 2001に記載されている）が含まれ得る。これらのストリングは、例えば、ＥｕｒｏｐｅａｎＢｉｏｉｎｆｏｒｍａｔｉｃｓＩｎｓｔｉｔｕｔｅ（Ｈｉｎｘｔｏｎ、ＵＫ）のＥｘｏｎｅｒａｔｅ配列アラインメントソフトウェアで実装され得る。

一部の実施形態では、例えばＣＩＧＡＲストリングを含む配列アラインメントマップ（ＳＡＭ）またはバイナリアラインメントマップ（ＢＡＭ）ファイル等の配列アラインメントが生成される（ＳＡＭフォーマットは、例えば、これによりその全体が参照により本明細書に組み込まれる、Li et al., "The Sequence Alignment/Map format and SAMtools," Bioinformatics, 25(16):2078-9, 2009に記載されている）。一部の実施形態では、ＣＩＧＡＲは、１行あたり１個のギャップアラインメントを呈示するまたは含む。ＣＩＧＡＲは、ＣＩＧＡＲストリングとして報告される圧縮されたペアワイズアラインメントフォーマットである。ＣＩＧＡＲストリングは、長い（例えば、ゲノムの）ペアワイズアラインメントを表すのに有用であり得る。ＣＩＧＡＲストリングは、参照ゲノム配列に対するリードのアラインメントを表すＳＡＭフォーマットで使用され得る。

ＣＩＧＡＲストリングは、確立されたモチーフに従い得る。それぞれの文字の前には事象のベースカウントを与える数字がある。使用する文字にはＭ、Ｉ、Ｄ、Ｎ、およびＳが含まれ得る（Ｍ＝マッチ；Ｉ＝挿入；Ｄ＝欠失；Ｎ＝ギャップ；Ｓ＝置換）。ＣＩＧＡＲストリングは、マッチおよび／またはミスマッチおよび欠失（またはギャップ）の配列を定義する。例えば、ＣＩＧＡＲストリング２ＭＤ３Ｍ２Ｄ２Ｍは、アラインメントが２つのマッチ、１つの欠失（いくらかスペースを節約するため、数字１は省略する）、３つのマッチ、２つの欠失、および２つのマッチを含有することを示し得る。
ＩＶ．コンピュータシステム

本開示の方法は、コンピュータシステムを使用して、またはその助けによって、実装することができる。例えば、そのような方法は、ＤＮＡ試料を複数の画分に分配するステップであって、複数の画分が、高メチル化画分および低メチル化画分を含む、ステップ；高メチル化および低メチル化画分におけるＤＮＡをタグ付けして、タグ付けされた核酸を生成するステップであって、タグ付けされた核酸が、分子バーコードを含む、ステップ；高メチル化画分由来の分子の配列リードおよび低メチル化画分由来の分子の配列リードを得るステップであって、配列リードが、分子バーコード配列および試料配列を含む、ステップ；（ａ）分子バーコード配列ならびに（ｂ）試料配列の最初および最後のヌクレオチドに対応するゲノム位置のうちの少なくとも１つに基づき、配列リードをファミリーに群分けするステップであって、ファミリーが、試料における単一のＤＮＡ分子に由来する配列リードを含む、ステップ；高メチル化画分由来の分子の配列の第１のセットおよび低メチル化画分由来の分子の配列の第２のセットを決定するステップ；ならびに配列の第１および第２のセットに基づき複数の塩基をコールするステップであって、（ｉ）第１のセットの分子の配列に基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップが、第２のセットの分子の配列に基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップよりも多い数の分子におけるトランジション変異の観察を要求する；あるいは（ｉｉ）ＣからＴへのもしくはＧからＡへのトランジション変異が、第１のセットの分子の配列に基づき参照配列と比べてコールされない、またはＣからＴへのもしくはＧからＡへのトランジション変異が、第１のセットの分子の配列を使用せずに第２のセットの分子の配列に基づき参照配列と比べてコールされる、またはＣからＴへのもしくはＧからＡへのトランジション変異が、第２のセットの分子の少なくとも１つの配列が、ＣからＴへのもしくはＧからＡへのトランジション変異を含む場合に限り、参照配列と比べてコールされる、ステップを含み得る。

図２は、本開示の方法を実装するようにプログラムされるか、または他の方法で構成されたコンピュータシステム２０１を示す。コンピュータシステム２０１は種々の態様の試料調製、シーケンシング、および／または解析を制御することができる。一部の例では、コンピュータシステム２０１は、核酸のシーケンシングを含む試料調製および試料解析を実施するように構成されている。

コンピュータシステム２０１は、中央処理ユニット（ＣＰＵ、本明細書では「プロセッサー」および「コンピュータプロセッサー」ともいう）２０５を含み、これは、シングルコアもしくはマルチコアプロセッサーでよく、または並列処理のための複数のプロセッサーでもよい。コンピュータシステム２０１が、メモリーまたはメモリーロケーション２１０（例えば、ランダムアクセスメモリー、リードオンリーメモリー、フラッシュメモリー）、電子的記憶ユニット２１５（例えば、ハードディスク）、１つまたは複数の他のシステムと通信するための通信インターフェース２２０（例えば、ネットワークアダプター）、ならびに周辺機器２２５、例えば、キャッシュ、他のメモリー、データストレージ、および／または電子ディスプレイアダプターも含む。メモリー２１０、記憶ユニット２１５、インターフェース２２０、および周辺機器２２５は、マザーボード等の通信ネットワークまたはバス（実線）を通じてＣＰＵ２０５と通信する。記憶ユニット２１５は、データを記憶するためのデータ記憶ユニット（またはデータリポジトリ）であってよい。コンピュータシステム２０１は、通信インターフェース２２０の助けによってコンピュータネットワーク２３０に作動可能に連結することができる。コンピュータネットワーク２３０は、インターネット（Ｉｎｔｅｒｎｅｔ）、インターネット（ｉｎｔｅｒｎｅｔ）および／もしくはエクストラネット、またはインターネットと通信するイントラネットおよび／またはエクストラネットであってよい。コンピュータネットワーク２３０は、一部の場合には、遠隔通信および／またはデータネットワークである。コンピュータネットワーク２３０は、１つまたは複数のコンピュータサーバを含んでよく、分散コンピューティング、例えばクラウドコンピューティングを可能にすることができる。コンピュータネットワーク２３０は、コンピュータシステム２０１の助けがある一部の場合には、ピアツーピアネットワークを実装することができ、これは、デバイスがコンピュータシステム２０１に連結されてクライアントまたはサーバとして挙動することを可能にし得る。

ＣＰＵ２０５は機械可読命令のシーケンスを実行することができ、これはプログラムまたはソフトウェアに具現化することができる。命令はメモリーロケーション、例えばメモリー２１０に記憶してよい。ＣＰＵ２０５によって実施される演算の例には、フェッチ、解読、実行、およびライトバック（ｗｒｉｔｅｂａｃｋ）が含まれ得る。

記憶ユニット２１５は、ファイル、例えばドライバー、ライブラリ、および保存されたプログラムを記憶することができる。記憶ユニット２１５は、ユーザによって生成されたプログラムおよび記録されたセッション、ならびにプログラムに関連する出力を記憶することができる。記憶ユニット２１５は、ユーザデータ、例えば、ユーザの選好およびユーザプログラムを記憶することができる。一部の場合におけるコンピュータシステム２０１は、コンピュータシステム２０１の外部の、例えばイントラネットまたはインターネットを通じてコンピュータシステム２０１と通信するリモートサーバ上に位置するような１つまたは複数の追加的なデータ記憶ユニットを含み得る。データは、例えば通信ネットワークまたは物理的なデータ転送を使用して（例えば、ハードドライブ、サムドライブ、または他のデータ記憶機構を使用して）ある場所から別の場所に転送してよい。

コンピュータシステム２０１は、ネットワーク２３０を通じて１つまたは複数のリモートコンピュータシステムと通信することができる。実施形態について、コンピュータシステム２０１は、ユーザ（例えば、オペレータ）のリモートコンピュータシステムと通信することができる。リモートコンピュータシステムの例には、パーソナルコンピュータ（例えば、携帯ＰＣ）、スレートまたはタブレットＰＣ（例えば、Ａｐｐｌｅ（登録商標）ｉＰａｄ（登録商標）、Ｓａｍｓｕｎｇ（登録商標）ＧａｌａｘｙＴａｂ）、電話、スマートフォン（例えば、Ａｐｐｌｅ（登録商標）ｉＰｈｏｎｅ（登録商標）、Ａｎｄｒｏｉｄ（登録商標）可能デバイス、Ｂｌａｃｋｂｅｒｒｙ（登録商標））、またはパーソナルデジタルアシスタントが含まれる。ユーザは、ネットワーク２３０を介してコンピュータシステム２０１にアクセスすることができる。

本明細書に記載した方法は、コンピュータシステム２０１の電子的記憶場所、例えば、メモリー２１０または電子的記憶ユニット２１５等に記憶された機械（例えば、コンピュータプロセッサー）実行可能なコードによって実装することができる。機械実行可能または機械可読なコードは、ソフトウェアの形態で提供され得る。使用の間、コードはプロセッサー２０５によって実行され得る。一部の場合には、コードは記憶ユニット２１５から取り出され、プロセッサー２０５による容易なアクセスのためにメモリー２１０に記憶される。一部の状況では、電子的記憶ユニット２１５を除外することができ、機械実行可能な命令がメモリー２１０に記憶される。

ある態様では、本開示は、少なくとも１つの電子プロセッサーによって実行された場合に、ＤＮＡ試料を複数の画分に分配するステップであって、複数の画分が、高メチル化画分および低メチル化画分を含む、ステップ；高メチル化および低メチル化画分におけるＤＮＡをタグ付けして、タグ付けされた核酸を生成するステップであって、タグ付けされた核酸が、分子バーコードを含む、ステップ；高メチル化画分由来の分子の配列リードおよび低メチル化画分由来の分子の配列リードを得るステップであって、配列リードが、分子バーコード配列および試料配列を含む、ステップ；（ａ）分子バーコード配列ならびに（ｂ）試料配列の最初および最後のヌクレオチドに対応するゲノム位置のうちの少なくとも１つに基づき、配列リードをファミリーに群分けするステップであって、ファミリーが、試料における単一のＤＮＡ分子に由来する配列リードを含む、ステップ；高メチル化画分由来の分子の配列の第１のセットおよび低メチル化画分由来の分子の配列の第２のセットを決定するステップ；ならびに配列の第１および第２のセットに基づき複数の塩基をコールするステップであって、（ｉ）第１のセットの分子の配列に基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップが、第２のセットの分子の配列に基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップよりも多い数の分子におけるトランジション変異の観察を要求する；あるいは（ｉｉ）ＣからＴへのもしくはＧからＡへのトランジション変異が、第１のセットの分子の配列に基づき参照配列と比べてコールされない、またはＣからＴへのもしくはＧからＡへのトランジション変異が、第１のセットの分子の配列を使用せずに第２のセットの分子の配列に基づき参照配列と比べてコールされる、またはＣからＴへのもしくはＧからＡへのトランジション変異が、第２のセットの分子の少なくとも１つの配列が、ＣからＴへのもしくはＧからＡへのトランジション変異を含む場合に限り、参照配列と比べてコールされる、ステップを含む方法の少なくとも一部分を実施するコンピュータ実行可能命令を含む非一過性コンピュータ可読媒体を提供する。

コードは、コードを実行するように適合されたプロセッサーを有する機械で使用するためにプリコンパイルされ、かつ構成され得るか、または実行時にコンパイルすることができる。コードは、プリコンパイルされたものとして、またはコンパイルしつつコードを実行することを可能にするように選択され得るプログラミング言語で記述して供給することができる。

本明細書で提供するシステムおよび方法の態様、例えばコンピュータシステム２０１は、プログラミング中に具現化し得る。本技術の種々の態様は、典型的には機械（またはプロセッサー）実行可能なコードおよび／または機械可読媒体の型に含まれまたは具現化される関連するデータの形態で「製品」または「製造物品」として考えることができる。機械実行可能なコードは、電子的記憶ユニット、例えばメモリー（例えばリードオンリーメモリー、ランダムアクセスメモリー、フラッシュメモリー）またはハードディスクに記憶することができる。「記憶」型媒体には、コンピュータの有形のメモリー、プロセッサーもしくは同様のもの、またはその関連するモジュール、例えば種々の半導体メモリー、テープドライブ、ディスクドライブおよび同様のもののいずれかまたはすべてが含まれ、これらはソフトウェアプログラミングのため、いつでも非一過性記憶を提供し得る。

ソフトウェアの全部または一部は、時にはインターネットまたは他の種々の遠隔通信ネットワークを通じて通信してよい。そのような通信は、例えば１つのコンピュータまたはプロセッサーから別のコンピュータまたはプロセッサーへ、例えばマネージメントサーバまたはホストコンピュータからアプリケーションサーバのコンピュータプラットフォームへのソフトウェアのローディングを可能にし得る。したがって、ソフトウェアエレメントを有し得る別の型の媒体には、ローカルデバイスの間で物理的インターフェースにわたって、有線および光地上通信のネットワークを通じて、種々のエアリンクを介して使用されるもののような光、電気、および電磁波が含まれる。そのような波を運搬する物理的エレメント、例えば有線または無線のリンク、光リンク、または同様のものも、ソフトウェアを有する媒体と考えてよい。本明細書で使用される場合、非一過性な有形「記憶」媒体に制限しなければ、コンピュータまたは機械「可読媒体」等の用語は、実行のための命令をプロセッサーに提供することに寄与する任意の媒体を意味する。

したがって、機械可読媒体、例えばコンピュータ実行可能なコードは、有形記憶媒体、搬送波媒体、または物理的送信媒体を含むがこれらに限定されない多くの形態をとり得る。非揮発性記憶媒体には、例えば図に示すデータベース等を実装するために使用されるような任意のコンピュータ等の記憶デバイスのいずれか等の光または磁気のディスクが含まれる。揮発性記憶媒体には、そのようなコンピュータプラットフォームの主メモリー等のダイナミックメモリーが含まれる。有形送信媒体には、共軸ケーブル、銅線および光ファイバ（コンピュータシステム中のバスを含むワイヤを含む）が含まれる。搬送波送信媒体は、電気的もしくは電磁気的な信号、またはラジオ周波数（ＲＦ）および赤外（ＩＲ）データ通信中に生成されるもののような音響もしくは光の波の形態をとり得る。したがってコンピュータ可読媒体の一般的な形態には、例えばフロッピー（登録商標）ディスク、フレキシブルディスク、ハードディスク、磁気テープ、他の任意の磁気媒体、ＣＤ－ＲＯＭ、ＤＶＤもしくはＤＶＤ－ＲＯＭ、他の任意の光学媒体、パンチカード、紙テープ、穴のパターンを有する他の任意の物理的記憶媒体、ＲＡＭ、ＲＯＭ、ＰＲＯＭおよびＥＰＲＯＭ、ＦＬＡＳＨ（登録商標）－ＥＰＲＯＭ、他の任意のメモリーチップまたはカートリッジ、搬送波輸送データもしくは命令、そのような搬送波を輸送するケーブルもしくはリンク、またはそれからコンピュータがプログラミングコードおよび／またはデータを読み取ることができる他の任意の媒体が含まれる。コンピュータ可読媒体のこれらの形態の多くは、１つまたは複数の命令の１つまたは複数のシーケンスを実行のためにプロセッサーに搬送することに関与し得る。

コンピュータシステム２０１は、例えば試料分析の１つまたは複数の結果を提供するためのユーザインターフェース（ＵＩ）を含む電子的ディスプレイを含むか、またはそれと通信し得る。ＵＩの例には、限定なくグラフィカルユーザインターフェース（ＧＵＩ）およびウェブベースユーザインターフェースが含まれる。

コンピュータシステムおよびネットワーク、データベース、ならびにコンピュータプログラム製品に関するさらなる詳細は、例えば、そのそれぞれがこれにより全体が参照により本明細書に組み込まれるＰｅｔｅｒｓｏｎ，ＣｏｍｐｕｔｅｒＮｅｔｗｏｒｋｓ：ＡＳｙｓｔｅｍｓＡｐｐｒｏａｃｈ，ＭｏｒｇａｎＫａｕｆｍａｎｎ，５ｔｈＥｄ．（２０１１）、Ｋｕｒｏｓｅ，ＣｏｍｐｕｔｅｒＮｅｔｗｏｒｋｉｎｇ：ＡＴｏｐ－ＤｏｗｎＡｐｐｒｏａｃｈ，Ｐｅａｒｓｏｎ，７^ｔｈＥｄ．（２０１６）、Ｅｌｍａｓｒｉ，ＦｕｎｄａｍｅｎｔａｌｓｏｆＤａｔａｂａｓｅＳｙｓｔｅｍｓ，ＡｄｄｉｓｏｎＷｅｓｌｅｙ，６ｔｈＥｄ．（２０１０）、Ｃｏｒｏｎｅｌ，ＤａｔａｂａｓｅＳｙｓｔｅｍｓ：Ｄｅｓｉｇｎ，Ｉｍｐｌｅｍｅｎｔａｔｉｏｎ，＆Ｍａｎａｇｅｍｅｎｔ，ＣｅｎｇａｇｅＬｅａｒｎｉｎｇ，１１^ｔｈＥｄ．（２０１４）、Ｔｕｃｋｅｒ，ＰｒｏｇｒａｍｍｉｎｇＬａｎｇｕａｇｅｓ，ＭｃＧｒａｗ－ＨｉｌｌＳｃｉｅｎｃｅ／Ｅｎｇｉｎｅｅｒｉｎｇ／Ｍａｔｈ，２ｎｄＥｄ．（２００６）、およびＲｈｏｔｏｎ，ＣｌｏｕｄＣｏｍｐｕｔｉｎｇＡｒｃｈｉｔｅｃｔｅｄ：ＳｏｌｕｔｉｏｎＤｅｓｉｇｎＨａｎｄｂｏｏｋ，ＲｅｃｕｒｓｉｖｅＰｒｅｓｓ（２０１１）にも提供されている。
Ｖ．適用
１．がんおよび他の疾患

本方法は、対象における状態、特にがんの存在を診断するため、状態を特徴付ける（例えば、がんをステージ分類するまたはがんの不均一性を決定する）ため、状態の処置に対する応答をモニタリングするため、状態が発生するリスクまたは状態のその後の経過の予後判定をもたらすために、使用され得る。本開示は、特定の処置選択肢の有効性の決定においても有用であり得る。処置が上首尾であれば、より多くのがんが死滅し、ＤＮＡが脱落するので、上首尾の処置選択肢では対象の血液において検出されるコピー数変動またはまれな変異の量が増加し得る。他の例では、これは起こらない場合がある。別の例では、おそらく、ある特定の処置選択肢は、がんの遺伝子プロファイルと経時的に相関し得る。この相関は、治療の選択において有用であり得る。

さらに、処置後にがんが寛解することが観察される場合、本方法を使用して、残留疾患または疾患の再発をモニタリングすることができる。

一部の実施形態では、本明細書に開示した方法およびシステムは、患者における所与の疾患または状態を核酸バリアントが体細胞または生殖細胞系列の起源であるという分類に基づいて処置するための、カスタマイズされたまたは標的化された療法を同定するために使用され得る。典型的には、考慮される疾患は、ある型のがんである。そのようながんの非限定的な例には、胆道がん、膀胱がん、頭頸部がん、移行上皮癌、尿路上皮癌、脳がん、神経膠腫、星状細胞腫、乳癌、化生性癌、子宮頸がん、子宮頸部扁平上皮癌、直腸がん、結腸直腸癌、結腸がん、遺伝性非ポリポーシス大腸がん、結腸直腸腺癌、消化管間質腫瘍（ＧＩＳＴ）、子宮内膜癌、子宮内膜間質肉腫、食道がん、食道扁平上皮癌、食道腺癌、眼黒色腫、ブドウ膜黒色腫、胆嚢癌、胆嚢腺癌、腎細胞癌、明細胞腎細胞癌、移行上皮癌、尿路上皮癌、ウィルムス腫瘍、白血病、急性リンパ性白血病（ＡＬＬ）、急性骨髄性白血病（ＡＭＬ）、慢性リンパ性白血病（ＣＬＬ）、慢性骨髄性白血病（ＣＭＬ）、慢性骨髄単球性白血病（ＣＭＭＬ）、肝がん、肝癌、ヘパトーマ、肝細胞癌、胆管細胞癌、肝芽腫、肺がん、非小細胞肺がん（ＮＳＣＬＣ）、中皮腫、Ｂ細胞リンパ腫、非ホジキンリンパ腫、びまん性大細胞型Ｂ細胞性リンパ腫、マントル細胞リンパ腫、Ｔ細胞リンパ腫、非ホジキンリンパ腫、前駆Ｔリンパ芽球性リンパ腫／白血病、末梢性Ｔ細胞リンパ腫、多発性骨髄腫、上咽頭癌（ＮＰＣ）、神経芽細胞腫、中咽頭がん、口腔扁平上皮癌、骨肉腫、卵巣癌、膵がん、膵管腺癌、偽乳頭状新生物、腺房細胞癌、前立腺がん、前立腺腺癌、皮膚がん、黒色腫、悪性黒色腫、皮膚黒色腫、小腸癌、胃がん、胃癌、消化管間質腫瘍（ＧＩＳＴ）、子宮がん、または子宮肉腫が含まれる。がんの型および／またはステージは、変異、まれな変異、インデル、コピー数変動、トランスバージョン、転座、逆位、欠失、異数性、部分的な異数性、倍数性、染色体の不安定性、染色体の構造変更、遺伝子融合、染色体融合、遺伝子短縮、遺伝子増幅、遺伝子重複、染色体病変、ＤＮＡ病変、核酸化学修飾の異常な変化、エピジェネティックパターンの異常な変化、および核酸５－メチルシトシンの異常な変化を含む遺伝的バリエーションから検出され得る。

遺伝的データも、がんの特定の形態を特徴付けるために使用され得る。がんは、多くの場合、組成およびステージ分類の両方が不均一である。遺伝子プロファイルデータにより、がんの特定の亜型について特徴付けることが可能になり得、それは、その特定の亜型の診断または処置において重要であり得る。この情報により、対象または実践者に特定の型のがんの予後判定に関する手がかりがもたらされ得、また、対象または実践者のいずれかが疾患の進行に応じて処置選択肢を適合させることも可能になる。一部のがんは、進行してより侵攻性かつ遺伝的に不安定なものになり得る。他のがんは、良性、非活動性または休止状態のままであり得る。本開示のシステムおよび方法は、疾患進行の決定において有用であり得る。

さらに、本開示の方法は、対象における異常な状態の不均一性を特徴付けるために使用され得る。そのような方法には、例えば対象に由来する細胞外ポリヌクレオチドの遺伝子プロファイルを生成することが含まれ得、ここで、遺伝子プロファイルは、コピー数変動およびまれな変異の解析から得られた複数のデータを含む。一部の実施形態では、異常な状態は、がんである。一部の実施形態では、異常な状態は、不均一なゲノム集団をもたらするものであり得る。がんの例では、一部の腫瘍が異なるがんのステージにある腫瘍細胞を含むことが分かっている。他の例では、不均一性は、多数の疾患病巣を含み得る。重ねて、がんの例では、多数の腫瘍病巣が存在し得、その場合、おそらく、１つまたは複数の病巣は主要部位から拡散した転移の結果である。

本方法は、不均一な疾患における異なる細胞に由来する遺伝情報の合計である指紋またはデータのセットを生成するまたはプロファイリングするために使用され得る。このデータのセットは、コピー数変動、エピジェネティックバリエーション、および変異の解析を単独でまたは組合せで含み得る。

本方法は、がん、または他の疾患を診断、予後判定、モニタリングまたは観察するために使用され得る。一部の実施形態では、本発明の方法は、胎児の診断、予後判定またはモニタリングは伴わず、したがって、非侵襲性出生前検査は対象としない。他の実施形態では、これらの方法体系は、妊娠中の対象に対して、ＤＮＡおよび他のポリヌクレオチドが母体分子と共循環し得るまだ生まれていない対象のがんまたは他の疾患を診断、予後判定、モニタリングまたは観察するために使用され得る。

本明細書に開示した方法およびシステムを使用して必要に応じて評価される他の遺伝に基づく疾患、障害、または状態の非限定的な例には、軟骨形成不全症、アルファ１アンチトリプシン欠損症、抗リン脂質症候群、自閉症、常染色体優性多発性嚢胞腎疾患、シャルコー・マリー・トゥース（ＣＭＴ）、ネコなき症、クローン病、嚢胞性線維症、ダーカム病、ダウン症候群、デュアン症候群、デュシェンヌ型筋ジストロフィー、第Ｖ因子ライデン栓友病、家族性高コレステロール血症、家族性地中海熱、脆弱性Ｘ症候群、ゴーシェ病、ヘモクロマトーシス、血友病、全前脳症、ハンチントン病、クラインフェルター症候群、マルファン症候群、筋強直性ジストロフィー、神経線維腫症、ヌーナン症候群、骨形成不全症、パーキンソン病、フェニルケトン尿症、ポーランド異常、ポルフィリン症、早老症、網膜色素変性、重症複合型免疫不全症（ＳＣＩＤ）、鎌状赤血球症、脊髄性筋萎縮症、テイ・サックス病、サラセミア、トリメチルアミン尿症、ターナー症候群、口蓋心臓顔面症候群、ＷＡＧＲ症候群、ウィルソン病、または同様のものが含まれる。

一部の実施形態では、本明細書に記載した方法は、本明細書に記載されるように得られた配列情報のセットを使用して、がんを有すると以前に診断された対象の以前のがん処置後の予め選択した時点で腫瘍細胞を起源とするまたはそれに由来するＤＮＡの存在または非存在を検出するステップを含む。方法は、試験対象について腫瘍細胞を起源とするまたはそれに由来するＤＮＡの存在または非存在を示すがん再発スコアを決定するステップをさらに含み得る。

がん再発スコアを決定する場合、がん再発スコアは、がん再発状態を決定するためにさらに使用され得る。がん再発状態は、例えばがん再発スコアが既定の閾値より上である場合にがん再発のリスクがあり得る。がん再発状態は、例えばがん再発スコアが既定の閾値より上である場合にがん再発のリスクが低いまたはより低いことがあり得る。特定の実施形態では、既定の閾値に等しいがん再発スコアは、がん再発のリスクがある、またはがん再発の低いもしくはより低いリスクがあるがん再発状態をもたらし得る。

一部の実施形態では、がん再発スコアを既定のがん再発閾値と比較し、がん再発スコアががん再発閾値より上である場合、試験対象をその後のがん処置の候補として分類するか、またはがん再発スコアががん再発閾値より下である場合、治療の候補ではないと分類する。特定の実施形態では、がん再発閾値と等しいがん再発スコアは、その後のがん処置の候補であるか、または治療の候補ではないという分類をもたらし得る。

上記の方法は、試験対象におけるがん再発のリスクを決定する方法および／または試験対象をその後のがん処置の候補として分類する方法に関する節を含む本明細書の他の箇所に記載される任意の適合性の特色（１つまたは複数）をさらに含み得る。
２．試験対象におけるがん再発のリスクを決定する方法および／または試験対象をその後のがん処置の候補として分類する方法

一部の実施形態では、本明細書で提供する方法は、試験対象におけるがん再発のリスクを決定する方法である。一部の実施形態では、本明細書で提供する方法は、試験対象をその後のがん処置の候補として分類する方法である。

そのような方法のいずれかは、がんを有すると診断された試験対象から試験対象に対する１つまたは複数の以前のがん処置後の１つまたは複数の予め選択した時点においてＤＮＡ（例えば、腫瘍細胞を起源とするまたはそれに由来する）を収集するステップを含み得る。対象は本明細書に記載した対象のいずれでもよい。ＤＮＡはｃｆＤＮＡであってよい。ＤＮＡは組織試料から得ることができる。

そのような方法のいずれかは、対象由来のＤＮＡから複数の標的領域のセットを捕捉するステップであって、複数の標的領域セットが配列可変標的領域セットおよびエピジェネティック標的領域セットを含み、捕捉されたＤＮＡ分子のセットが産生されるステップを含み得る。捕捉するステップは、本明細書の他の箇所に記載した実施形態のいずれかに従って実施され得る。

そのような方法のいずれにおいても、以前のがん処置は手術、治療組成物の投与、および／または化学療法を含み得る。

そのような方法のいずれかは、捕捉されたＤＮＡ分子をシーケンシングするステップを含み得、それにより配列情報のセットが産生される。配列可変標的領域セットの捕捉されたＤＮＡ分子は、エピジェネティック標的領域セットの捕捉されたＤＮＡ分子よりも高いシーケンシング深度までシーケンシングされ得る。

そのような方法のいずれかは、配列情報のセットを使用して、予め選択した時点で腫瘍細胞を起源とするまたはそれに由来するＤＮＡの存在または非存在を検出するステップを含み得る。腫瘍細胞を起源とするまたはそれに由来するＤＮＡの存在または非存在の検出は、本明細書の他の箇所に記載したそれらの実施形態のいずれかに従って実施され得る。

試験対象におけるがん再発のリスクを決定する方法は、その試験対象について腫瘍細胞を起源とするまたはそれに由来するＤＮＡの存在もしくは非存在、または量を示すがん再発スコアを決定するステップを含み得る。がん再発スコアは、がん再発状態を決定するためにさらに使用され得る。がん再発状態は、例えばがん再発スコアが既定の閾値より上である場合にがん再発のリスクがあり得る。がん再発状態は、例えばがん再発スコアが既定の閾値より上である場合にがん再発のリスクが低いまたはより低いことがあり得る。特定の実施形態では、既定の閾値に等しいがん再発スコアは、がん再発のリスクがある、またはがん再発の低いもしくはより低いリスクがあるがん再発状態をもたらし得る。

試験対象をその後のがん処置の候補であると分類する方法は、その試験対象のがん再発スコアを既定のがん再発閾値と比較するステップを含み、がん再発スコアががん再発閾値より上である場合、その試験対象をその後のがん処置の候補であると分類するか、またはがん再発スコアががん再発閾値より下である場合、治療の候補ではないと分類する。特定の実施形態では、がん再発閾値と等しいがん再発スコアは、その後のがん処置の候補であるか、または治療の候補でないという分類をもたらし得る。一部の実施形態では、その後のがん処置は、化学療法または治療組成物の投与を含む。

そのような方法のいずれかは、がん再発スコアに基づいて試験対象の無病生存（ＤＦＳ）期間を決定するステップを含み得、例えばＤＦＳ期間は１年、２年、３年、４年、５年、または１０年であってよい。

一部の実施形態では、配列情報セットは配列可変標的領域配列を含み、がん再発スコアを決定するステップは、配列可変標的領域配列に存在するＳＮＶ、挿入／欠失、ＣＮＶ、および／または融合の量を示す少なくとも第１のサブスコアを決定するステップを含み得る。

一部の実施形態では、１、２、３、４、または５から選択される配列可変標的領域における変異の数は、第１のサブスコアががん再発について陽性であると分類されるがん再発スコアをもたらすために十分である。一部の実施形態では、変異の数は１、２、または３から選択される。

一部の実施形態では、配列情報のセットは、エピジェネティック標的領域配列を含み、がん再発スコアを決定するステップは、エピジェネティック標的領域配列中の異常な配列リードの量を示す第２のサブスコアを決定するステップを含む。異常な配列リードは、健康な対象由来の対応する試料中に見出されるＤＮＡ（例えば、健康な対象由来の血液試料中に見出されるｃｆＤＮＡ、または組織試料が試験対象から得たものと同じ型の組織である場合に健康な対象由来の組織試料中に見出されるＤＮＡ）とは異なるエピジェネティック状態を示すリードであり得る。異常なリードは、がんに関連するエピジェネティック変化、例えば、高メチル化可変標的領域のメチル化および／または断片化可変標的領域の摂動を受けた断片化と合致し得、「摂動を受けた」は、健康な対象由来の対応する試料中に見出されるＤＮＡとは異なることを意味する。

一部の実施形態では、高メチル化可変標的領域セットにおける高メチル化および／または断片化可変標的領域セットにおける異常な断片化が０．００１％～１０％の範囲に入る値よりも大きいまたはそれと等しいことを示す高メチル化可変標的領域セットおよび／または断片化可変標的領域セットに対応するリードの割合で、第２のサブスコアががん再発について陽性として分類されるのに十分である。範囲は、０．００１％～１％、０．００５％～１％、０．０１％～５％、０．０１％～２％、または０．０１％～１％であり得る。

一部の実施形態では、そのような方法のいずれも、腫瘍細胞を起源とすることを示す１つまたは複数の特色を示す配列情報のセット中のリードの割合からの腫瘍ＤＮＡの割合を決定するステップを含み得る。これは、例えば高メチル化可変標的領域および断片化可変標的領域の一方または両方を含むエピジェネティック標的領域の一部または全部に対応するリードについて行われ得る（高メチル化可変標的領域の高メチル化および／または断片化可変標的領域の異常な断片化を、腫瘍細胞を起源とすることを示すものと考えることができる）。これは、配列可変標的領域に対応するリード、例えば、ＳＮＶ、インデル、ＣＮＶ、および／または融合等のがんと合致する変更を含むリードについて行われ得る。腫瘍ＤＮＡの割合は、エピジェネティック標的領域に対応するリードと配列可変標的領域に対応するリードの組合せに基づいて決定され得る。

がん再発スコアの決定は、少なくとも一部において腫瘍ＤＮＡの割合に基づき得、１０^－１１～１または１０^－１０～１の範囲の閾値よりも大きい腫瘍ＤＮＡの割合で、がん再発スコアががん再発について陽性であると分類されるのに十分である。一部の実施形態では、１０^－１０～１０^－９、１０^－９～１０^－８、１０^－８～１０^－７、１０^－７～１０^－６、１０^－６～１０^－５、１０^－５～１０^－４、１０^－４～１０^－３、１０^－３～１０^－２、または１０^－２～１０^－１の範囲の閾値よりも大きいまたはそれと等しい腫瘍ＤＮＡの割合で、がん再発スコアががん再発について陽性であると分類されるのに十分である。一部の実施形態では、少なくとも１０^－７の閾値よりも大きい腫瘍ＤＮＡの割合で、がん再発スコアががん再発について陽性であると分類されるのに十分である。腫瘍ＤＮＡの割合が、前述の実施形態のいずれかに対応する閾値等の閾値よりも大きいことの決定は、累積確率に基づいてなされ得る。例えば、腫瘍の割合が前述の範囲のいずれかの閾値よりも大きい累積確率が少なくとも０．５、０．７５、０．９、０．９５、０．９８、０．９９、０．９９５、または０．９９９の確率閾値を超える場合、試料は陽性であるとみなされる。一部の実施形態では、確率閾値は、少なくとも０．９５、例えば０．９９である。

一部の実施形態では、配列情報のセットは、配列可変標的領域配列およびエピジェネティック標的領域配列を含み、がん再発スコアを決定するステップは、配列可変標的領域配列中に存在するＳＮＶ、挿入／欠失、ＣＮＶおよび／または融合の量を示す第１のサブスコアならびにエピジェネティック標的領域配列中の異常な配列リードの量を示す第２のサブスコアを決定し、第１のサブスコアと第２のサブスコアを組み合わせてがん再発スコアをもたらすステップを含む。第１のサブスコアと第２のサブスコアを組み合わせる場合、各サブスコアに独立に閾値を適用すること（例えば、配列可変標的領域中の変異の既定数よりも大きい（例えば、＞１）、かつエピジェネティック標的領域中の異常な（例えば、腫瘍）リードの既定の割合よりも大きい）、または、機械学習分類器を訓練して、複数の陽性および陰性訓練試料に基づいて状態を決定することによって、組み合わせることができる。

一部の実施形態では、組み合わせたスコアの値が－４～２または－３～１の範囲に入っていれば、がん再発スコアががん再発について陽性であると分類されるのに十分である。

がん再発スコアががんの再発について陽性であると分類されるいずれかの実施形態では、対象のがん再発状態はがん再発のリスクがある、および／または対象はその後のがん処置の候補として分類され得る。

一部の実施形態では、がんは本明細書の他の箇所に記載したがんの型のいずれか１つ、例えば結腸直腸がんである。

３．治療および関連する投与
ある特定の実施形態では、本明細書に開示した方法は、体細胞または生殖細胞系列の起源である核酸バリアントの状態を与えられた患者にカスタマイズされた療法を特定し投与することに関する。一部の実施形態では、本質的にいずれのがん療法（例えば手術療法、放射線療法、化学療法、および／または同様のもの）も、これらの方法の一部として含まれ得る。典型的には、カスタマイズされた療法には少なくとも１つの免疫療法（または免疫療法剤）が含まれる。免疫療法は一般に、所与のがんの型に対する免疫応答を増強する方法を意味する。ある特定の実施形態では、免疫療法は腫瘍またはがんに対するＴ細胞の応答を増強する方法を意味する。

ある特定の実施形態では、体細胞または生殖細胞系列の起源である対象からの試料の核酸バリアントの状態は、参照集団からのコンパレータの結果のデータベースと比較され、その対象のためのカスタマイズされたまたは標的化された療法が特定される。典型的には、参照集団は試験対象と同じがんまたは疾患の型を有する患者、および／または試験対象と同じ療法を受けている、または受けた患者を含む。核酸バリアントとコンパレータの結果がある特定の分類基準を満たせば（例えば実質的にまたは近似的に一致すれば）、カスタマイズされたまたは標的化された療法（１つまたは複数の療法）が特定され得る。

ある特定の実施形態では、本明細書に記載したカスタマイズされた療法は、典型的には、非経口的（例えば、静脈内または皮下）に投与される。免疫療法剤を含有する医薬組成物は、典型的には、静脈内投与される。ある特定の治療剤は、経口投与される。しかし、カスタマイズされた療法（例えば、免疫療法剤等）は、例えば、頬側の、舌下、直腸、膣、尿道内、局所、眼内、鼻内および／または耳介内等の方法によっても投与され得、投与は、錠剤、カプセル剤、顆粒剤、水性懸濁剤、ゲル剤、スプレー剤、坐剤、軟膏剤（ｓａｌｖｅ）、軟膏剤（ｏｉｎｔｍｅｎｔ）、または同様のものを含み得る。

本発明の好ましい実施形態を本明細書に示し、記載したが、そのような実施形態は例としてのみ提供されることは当業者には明白になる。本発明は本明細書内で提供される特定の実施例によって限定されることを意図していない。本発明は上述の明細書を参照して記載しているが、本明細書の実施形態の記述および説明は限定する意味で解釈することを意味していない。ここで多くの変形、変化、および置換が、本発明から逸脱することなく当業者には生じるであろう。さらに、本発明のすべての態様は、種々の条件および変数に依存する本明細書で説明した特定の描写、構成、または相対的な比率に限定されないことを理解されたい。本発明の実施において本明細書に記載した開示の実施形態に対して種々の代替選択肢が採用され得ることを理解されたい。したがって、本開示はいずれのそのような選択肢、改変、変形、または均等物をも包含すべきであることが意図されている。以下の特許請求の範囲が本発明の範囲を定義すること、ならびにこれらの特許請求の範囲およびその均等物の範囲内の方法および構造がそれによって包含されることが意図されている。

上記の開示は明確さおよび理解の目的のために説明および例としていくらか詳細に記載しているが、本開示を読んで、本開示の真の範囲から逸脱することなく形態および詳細において種々の変化を加えることができ、添付の特許請求の範囲内で実施できることは、当業者には明白になる。例えば、すべての方法、システム、コンピュータ可読媒体、および／または成分の特色、ステップ、エレメント、またはその他の態様を、種々の組合せで使用することができる。

本明細書で引用したすべての特許、特許出願、ウェブサイト、その他の刊行物および書類、受託番号、および同様のものは、それぞれの別個の項目が参照により組み込まれると具体的かつ別個に指示されているかのように、同程度にあらゆる目的のために全体が参照により組み込まれる。異なるバージョンの配列が異なる時の受託番号に関連している場合には、本出願の有効な出願日における受託番号に関連するバージョンが意味される。有効な出願日は、実際の出願日、または適用される場合には受託番号に言及する優先出願の提出日のいずれか早い方を意味する。同様に、異なるバージョンの刊行物、ウェブサイト、または同様のものが異なる時に公開された場合には、他に指示されなければ、本出願の有効な出願日に最も近く公開されたバージョンが意味される。

ＶＩ．実施例
ｉ）高メチル化画分のｃｆＤＮＡにおける人為的なＣからＴへのおよびＧからＡへのトランジション変異の頻度の増加の観察
この実施例では、無細胞ＤＮＡの高メチル化分画が、予測されるよりも多数の、見かけのＣからＴへのおよびＧからＡへのトランジション変異を含有することを実証する。自己宣言した健康な個体３０名からの試料を収集し、各試料を、高メチル化ＤＮＡ画分および低メチル化ＤＮＡ画分を含む少なくとも２つの画分に分画した。画分（高メチル化ＤＮＡ画分および低メチル化ＤＮＡ画分を含む）をシーケンシングし、誤り率について解析した。ここで、各分子についての誤り率は、両方のＤＮＡ鎖を表す少なくとも２つの配列リードを有するリード－レベルでの塩基の間での８０％一致閾値を満たす。図３は、塩基あたりのＳＮＶ誤り率を特定のヌクレオチド置換、すなわち、ＡからＣ、ＡからＧ、ＡからＴ、ＣからＡ、ＣからＧ、ＣからＴ、ＧからＡ、ＧからＣ、ＧからＴ、ＴからＡ、ＴからＣ、およびＴからＧに応じて示す。バーの高さは平均ＳＮＶ誤り率を表し、誤りバーはその標準誤差を表す。薄い灰色のバーは高メチル化ＤＮＡ画分からの結果を表し、濃い灰色のバーは低メチル化ＤＮＡ画分からの結果を表す。ＣからＴ置換および相補的なＧからＡ置換の誤り率が最もよく見られた誤りであった。高メチル化分画ではＣからＴおよびＧからＡ置換が上昇し、これにより、高メチル化分子における化学的損傷の率がより高いことが示される。

表６は、ＣからＴまたはＧからＡヌクレオチド置換を有する高メチル化分子および低メチル化分子の、他のすべての置換に対する数を示す２×２分割表である。上記のように、置換を、両方の鎖を表す少なくとも２つの配列リードを有する８０％一致閾値を満たすリード－レベルでの塩基によって決定した。表６において、決定された置換の数が、行の計と列の計を掛け、それを総計（ｎ）で割ることによって決定された算出された予測置換と比較されている。自由度１を用いたカイ二乗検定によって決定された通り、高メチル化分子において、低メチル化分子におけるよりも、偶然と予想されるものより有意に多いＣからＴまたはＧからＡ置換を有する分子が存在する（ｐ値８．１６×１０^－１９６）。

ｉｉ）高メチル化画分由来の分子の配列に基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップが、低メチル化画分由来の分子の配列に基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップよりも多い数のリードにおけるトランジション変異の観察を要求する、シーケンシング法

この実施例では、高メチル化画分における人為的な脱アミノ化の配列決定の精度に対する影響を軽減する方法の実施形態を記載する。

本明細書に記載されるように、対象由来のＤＮＡ試料（例えばヒトｃｆＤＮＡ等のｃｆＤＮＡ）を得、それから高メチル化画分および低メチル化画分を含む少なくとも２つの画分を調製する。画分（高メチル化画分および低メチル化画分を含む）を、示差的にタグ付けし、次いで、プールする。目的の標的領域（例えば、配列可変標的領域およびエピジェネティック標的領域）を、捕捉用プローブを使用して捕捉し、次いで、例えば次世代および／または合成によるシーケンシング技法を使用して増幅およびシーケンシングする。

配列リードを、それらのタグ配列に基づき、高メチル化画分または低メチル化画分に由来するものとして分類し、タグ配列、試料配列の最初および最後のヌクレオチドに対応するゲノム位置、ならびに／または５’タグ配列の直後および３’タグ配列の直前の複数の塩基の配列のうちの１つまたは複数に従って、それらが起源とする元の試料分子に応じて群分けする。リードの各群について、それらが起源とする分子の配列を決定する。低メチル化画分由来の分子の配列を参照ゲノム配列にマッピングし、ＣからＴおよびＧからＡ変異を同定し、ここで、変異を少なくとも２つまたは３つの分子の配列において観察する。高メチル化画分由来の配列を参照ゲノム配列にマッピングし、ＣからＴおよびＧからＡ変異を同定し、ここで、変異を少なくとも３つ、４つ、または５つの分子の配列において観察し、要求される分子の配列の数は、低メチル化画分由来の分子の配列に基づきＣからＴまたはＧからＡ変異を同定するために要求されるリードの数よりも多い。

このように決定された結果は、偽陽性のＣからＴおよびＧからＡ変異が、低メチル化画分由来の分子の配列に基づきＣからＴまたはＧからＡ変異を同定するために要求される分子の配列の数と低メチル化画分由来の分子の配列に基づきＣからＴまたはＧからＡ変異を同定するために要求される分子の配列の数が等しい対照配列決定よりも少ない。
ｉｉｉ）ＣからＴへのまたはＧからＡへのトランジション変異をコールするために高メチル化画分由来の分子の配列を使用しないシーケンシング法

この実施例では、高メチル化画分における人為的な脱アミノ化の配列決定の精度に対する影響を軽減する方法の別の実施形態を記載する。

配列リードを、それらのタグ配列に基づき、高メチル化画分または低メチル化画分に由来するものとして分類し、タグ配列、５’および３’タグ配列の直後および直前の塩基が対応するゲノム座標、ならびに／または５’および３’タグ配列の直後および直前の複数の塩基の配列のうちの１つまたは複数に従って、それらが起源とする元の試料分子に応じて群分けする。リードの各群について、それらが起源とする分子の配列を決定する。低メチル化画分由来の分子の配列を参照ゲノム配列にマッピングし、ＣからＴおよびＧからＡ変異を同定し、ここで、変異を少なくとも２つまたは３つの分子の配列において観察する。高メチル化画分由来の配列を参照ゲノム配列にマッピングし、参照ゲノム配列と比べたＣからＴおよびＧからＡ変異のコールには使用しない。

このように決定された結果は、偽陽性のＣからＴおよびＧからＡ変異が、低メチル化画分由来の分子の配列に基づきＣからＴまたはＧからＡ変異を同定するために要求される分子の配列の数と低メチル化画分由来の分子の配列に基づきＣからＴまたはＧからＡ変異を同定するために要求される分子の配列の数が等しい対照配列決定よりも少ない。
ｉｖ）高メチル化画分由来のリードに基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップが、低メチル化画分由来のリードに基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップよりも多い数のリードにおけるトランジション変異の観察を要求するシーケンシング法

配列リードを、それらのタグ配列に基づき、高メチル化画分または低メチル化画分に由来するものとして分類する。低メチル化画分由来の配列を参照ゲノム配列にマッピングし、ＣからＴおよびＧからＡ変異を同定し、ここで、変異を少なくとも２つまたは３つのリードにおいて観察する。高メチル化画分由来の配列を参照ゲノム配列にマッピングし、ＣからＴおよびＧからＡ変異を同定し、ここで、変異を少なくとも３つ、４つ、または５つのリードにおいて観察し、ここで、要求されるリードの数は、低メチル化画分由来の配列に基づきＣからＴまたはＧからＡ変異を同定するために要求されるリードの数よりも多い。

得られた配列に含有される偽陽性のＣからＴおよびＧからＡ変異は、低メチル化画分由来の配列に基づきＣからＴまたはＧからＡ変異を同定するために要求されるリードの数と低メチル化画分由来の配列に基づきＣからＴまたはＧからＡ変異を同定するために要求されるリードの数が等しい対照配列決定よりも少ない。
ｖ）ＣからＴへのまたはＧからＡへのトランジション変異をコールするために高メチル化画分由来のリードを使用しないシーケンシング法

配列リードを、それらのタグ配列に基づき、高メチル化画分または低メチル化画分に由来するものとして分類する。低メチル化画分由来の配列を参照ゲノム配列にマッピングし、見かけのＣからＴおよびＧからＡ変異を同定し、ここで、変異を少なくとも２つまたは３つのリードにおいて観察する。高メチル化画分由来の配列を参照ゲノム配列にマッピングし、これらのリードを参照ゲノム配列と比べたＣからＴおよびＧからＡ変異のコールには使用しない。

得られた配列に含有される偽陽性のＣからＴおよびＧからＡ変異は、低メチル化画分由来の配列に基づきＣからＴまたはＧからＡ変異を同定するために要求されるリードの数と低メチル化画分由来の配列に基づきＣからＴまたはＧからＡ変異を同定するために要求されるリードの数が等しい対照配列決定よりも少ない。
ｖｉ）配列可変標的領域セットに対するプローブの濃度とエピジェネティック標的領域セットに対するプローブの濃度が異なる標的領域プローブセットの特徴付け

この実施例では、リキッドバイオプシーｃｆＤＮＡのエピジェネティック解析と遺伝子型解析を組み合わせる取り組みの一部として、配列可変標的領域セットに対するプローブおよびエピジェネティック標的領域セットに対するプローブを含有するプローブセットの性能の評価を記載する。

ｃｆＤＮＡの試料を、メチル化の状態に基づく分配（したがって、高メチル化画分および低メチル化画分を含む複数の画分の生成）、末端修復、アダプターとのライゲーション、およびＰＣＲによる増幅（例えば、アダプターを標的とするプライマーを使用する）を実施することによって処理した後、標的領域プローブセットと接触させた。

処理した試料を、配列可変標的領域セットに対するプローブおよびエピジェネティック標的領域セットに対するプローブを含む標的領域プローブセットと接触させた。標的領域プローブは、目的の領域をタイリングするために設計されたビオチン化オリゴヌクレオチドの形態であった。配列可変標的領域セットに対するプローブは約５０ｋｂのフットプリントを有し、エピジェネティック標的領域セットに対するプローブは約５００ｋｂの標的領域フットプリントを有した。配列可変標的領域セットに対するプローブには、表３～５において識別される選択された領域を標的とするオリゴヌクレオチドを含め、エピジェネティック標的領域セットに対するプローブには、選択された高メチル化可変標的領域、低メチル化可変標的領域、ＣＴＣＦ結合標的領域、転写開始部位標的領域、局所的増幅標的領域、およびメチル化対照領域を標的とするオリゴヌクレオチドを含めた。

次いで、このように単離された捕捉されたｃｆＤＮＡをシーケンシングのために調製し、ＩｌｌｕｍｉｎａＨｉＳｅｑまたはＮｏｖａＳｅｑシーケンサーを使用してシーケンシングした。結果を、配列可変標的領域セットに対するプローブおよびエピジェネティック標的領域セットに対するプローブに対応する配列リードの多様性（配列リードの固有のファミリーの数）およびリードファミリーサイズ（各ファミリー内の個々のリードの数）に関して解析した。以下に報告する値は、７０ｎｇの入力ＤＮＡを使用して得たものである。７０ｎｇの入力は比較的高い量であると考えられ、所望のレベルの多様性およびファミリーサイズを維持する難易度が高い条件を表す。

配列可変標的領域セットに対するプローブおよびエピジェネティック標的領域セットに対するプローブを１：１の比（すなわち、２つのセットにおける個々のオリゴヌクレオチドの体積あたりの質量の濃度が等しい）で使用した場合、多様性は、配列可変標的領域について入力量に基づき予測されたものよりも約５～１０％低かった。これにより、シーケンシングデータが予測された数の異なるリードファミリーを含まなかったことが示される。

プローブ比２：１および５：１（エピジェネティック：配列可変プローブセット）により、配列可変標的領域についての理論値と比べた多様性のより大きな低下がもたらされた。

プローブ比１：２または１：５（エピジェネティック：配列可変プローブセット）により、配列可変標的領域について高レベルの多様性がもたらされ、これは、概して理論値と近く、これにより、これらの比では、エピジェネティック標的領域の存在は配列可変標的領域からの予測される数の別個のリードファミリーの生成に実質的に干渉する量では存在しなかったことが示される。

エピジェネティック標的領域に関しては、すべての比で理論値よりも実質的に低い多様性レベルがもたらされた。しかし、エピジェネティック標的領域についてのメチル化、コピー数、および同様のものの解析には、配列可変領域について意図されているヌクレオチド置換またはインデルの存在または非存在の決定と同じ程度までの高密度および深度のシーケンシングカバレッジは要求されないこと考慮すると、これは問題のあるものとは考えられない。

高メチル化画分に対応するリードまたは分子の配列に基づき偽陽性のＣからＴおよびＧからＡ変異がコールされる頻度を減少させることによって精度を改善するために、上の実施例ｉｉ）～ｖ）のいずれか１つに基本的に記載されているように配列リードを使用して配列または分子の配列を決定し、変異をコールすることができる。
ｖｉｉ）エピジェネティック標的領域セットと配列可変標的領域セットの組合せを使用したがんの検出

ＩからＩＶＡまで（全部で７つのステージ）の異なるステージのがんを有するがん患者由来のｃｆＤＮＡ試料のコホートを、プローブを１：５（エピジェネティック：配列可変プローブセット）の比で使用して、上の例ｖｉ）に記載のように処理し、シーケンシングする。配列可変標的領域配列は、実際の腫瘍バリアントを技術的誤りと区別するための十分な支持を伴ってコールされ得るＳＮＶ、挿入、欠失および融合等のゲノムの変更を検出することによって解析される。エピジェネティック標的領域配列を独立に解析して、がんにおいて血液細胞と比較して示差的にメチル化されることが示されている領域内のメチル化断片を検出する。最後に、９５％の特異度でがんと合致するプロファイルが示されたかどうかを決定するために、両方の解析の結果を組み合わせて最終的な腫瘍の存在／非存在コールを生成する。

がんの検出は、ステージＩＩＩＡおよびＩＩＩＣコホートについてはいずれかの手法単独で１００％の感度であった。エピジェネティック標的領域配列の解析を含む他のコホートの１つを除いてすべてで感度が約１０～３０％増大した。１つの例外はステージＩＩＢコホートであり、すべての試料が両方の手法に従って真陽性であったかまたは両方の手法に従って偽陰性であった。

したがって、本開示の方法および組成物は、配列に基づいたがんの検出とエピジェネティックながんの検出を組み合わせた、エピジェネティック標的領域および配列可変標的領域の異なるシーケンシング深度の感度までのシーケンシングに同時に使用可能な捕捉されたｃｆＤＮＡを提供し得る。

高メチル化画分に対応するリードまたは分子の配列に基づいたＣからＴおよびＧからＡ変異の偽陽性の頻度を減少させることによって精度を改善するために、基本的に上の実施例ｉｉ）～ｖ）のいずれか１つに記載のように、配列リードを使用して配列を決定することができる。

Claims

ＤＮＡの試料を解析する方法であって、
前記ＤＮＡの試料を複数の画分に分配するステップであって、前記複数の画分が、高メチル化画分および低メチル化画分を含む、ステップ；
前記高メチル化および低メチル化画分における前記ＤＮＡをタグ付けして、タグ付けされた核酸を生成するステップであって、前記タグ付けされた核酸が、分子バーコードを含む、ステップ；
前記高メチル化画分由来の分子の配列リードおよび前記低メチル化画分由来の分子の配列リードを得るステップであって、前記配列リードが、分子バーコード配列および試料配列を含む、ステップ；
（ａ）前記分子バーコード配列ならびに（ｂ）前記試料配列の最初および最後のヌクレオチドに対応するゲノム位置のうち少なくとも１つに基づき、配列リードをファミリーに群分けするステップであって、前記ファミリーが、前記試料における単一のＤＮＡ分子に由来する配列リードを含む、ステップ；
前記高メチル化画分由来の分子の配列の第１のセットおよび前記低メチル化画分由来の分子の配列の第２のセットを決定するステップ；ならびに
配列の前記第１および第２のセットに基づき複数の塩基をコールするステップであって、
（ｉ）前記第１のセットの分子の配列に基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップが、前記第２のセットの分子の配列に基づき前記参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップよりも多い数の分子における前記トランジション変異の観察を要求する；あるいは
（ｉｉ）ＣからＴへのもしくはＧからＡへのトランジション変異が、前記第１のセットの分子の配列に基づき参照配列と比べてコールされない、またはＣからＴへのもしくはＧからＡへのトランジション変異が、前記第１のセットの分子の配列を使用せずに前記第２のセットの分子の配列に基づき参照配列と比べてコールされる、または前記第２のセットの分子の少なくとも１つの配列が、前記ＣからＴへのもしくはＧからＡへのトランジション変異を含む場合に限り、ＣからＴへのもしくはＧからＡへのトランジション変異が、参照配列と比べてコールされる、ステップを含む、方法。
前記第１のセットの分子の配列に基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップが、前記第２のセットの分子の配列に基づき前記参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップよりも多い数の分子における前記トランジション変異の観察を要求する、直前の請求項に記載の方法。
前記第１のセットの分子の配列に基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップが、少なくとも３つの分子における前記トランジション変異の観察を要求する、先行する請求項のいずれか一項に記載の方法。
前記第１のセットの分子の配列に基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップが、少なくとも４つの分子における前記トランジション変異の観察を要求する、直前の請求項に記載の方法。
前記第１のセットの分子の配列に基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップが、少なくとも５つの分子における前記トランジション変異の観察を要求する、直前の請求項に記載の方法。
前記第２のセットの分子の配列に基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップが、少なくとも２つの分子における前記トランジション変異の観察を要求する、先行する請求項のいずれか一項に記載の方法。
前記第２のセットの分子の配列に基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップが、少なくとも３つの分子における前記トランジション変異の観察を要求する、直前の請求項に記載の方法。
前記第１のセットの分子の配列に基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップが、前記第２のセットの分子の配列に基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップよりも少なくとも２つ多い分子における前記トランジション変異の観察を要求する、先行する請求項のいずれか一項に記載の方法。
第１の閾値が、前記第１のセットの分子の配列に基づきＣからＴへのまたはＧからＡへのトランジションをコールするために使用され、第２の閾値が、前記第２のセットの分子の配列に基づきＣからＴへのまたはＧからＡへのトランジションをコールするために使用され；前記第１の閾値が、ＣからＴへのまたはＧからＡへのトランジションをコールするための特異度の第１のレベルを提供し；前記第２の閾値が、ＣからＴへのまたはＧからＡへのトランジションをコールするための特異度の第２のレベルを提供し；前記特異度の第１のレベルが、前記特異度の第２のレベルにほぼ等しいか、または前記特異度の第１のレベルが、前記特異度の第２のレベルの１０％、５％、４％、３％、２％、１％、０．５％、０．２％もしくは０．１％以内である、先行する請求項のいずれか一項に記載の方法。
前記第１および第２の閾値が、ＣからＴへのおよび／またはＧからＡへのトランジションに特異的である、直前の請求項に記載の方法。
前記第１および第２の閾値が、少なくとも１つの対照試料または複数の対照試料から決定され、必要に応じて、前記少なくとも１つの対照試料または複数の対照試料が、がんを有すると疑われていない個体に由来する、請求項９または１０に記載の方法。
位置特異的バックグラウンド誤り率の第１の群が、前記第１のセットの分子の配列のための複数の位置のために使用され；位置特異的バックグラウンド誤り率の第２の群が、前記第２のセットの分子の配列のための複数の位置のために使用され；前記第２の群が、前記第１の群の対応する位置特異的バックグラウンド誤り率よりも高い位置特異的バックグラウンド誤り率を含み；前記第１のセットの分子の配列に基づきＣからＴへのまたはＧからＡへのトランジション変異をコールするステップが、前記位置特異的バックグラウンド誤り率の第１の群由来の対応する率を超える頻度での、前記ＣからＴへのまたはＧからＡへのトランジション変異の観察を要求する、請求項１から８のいずれか一項に記載の方法。
前記第１のセットの分子の配列に基づきＣからＴへのまたはＧからＡへのトランジション変異をコールするステップが、少なくとも２、３、４または５倍、前記位置特異的バックグラウンド誤り率の第１の群由来の対応する率を超える頻度での、前記ＣからＴへのまたはＧからＡへのトランジション変異の観察を要求する、直前の請求項に記載の方法。
前記第１のセットの分子の配列に基づきＣからＴへのまたはＧからＡへのトランジション変異をコールするステップが、少なくとも９５％、９８％、９９％、９９．５％または９９．９％の信頼水準と一致する量だけ、前記位置特異的バックグラウンド誤り率の第１の群由来の対応する率を超える頻度での、前記ＣからＴへのまたはＧからＡへのトランジション変異の観察を要求する、直前の請求項に記載の方法。
位置特異的バックグラウンド誤り率の前記第１および第２の群が、複数の対照試料から決定され、必要に応じて、前記対照試料が、がんを有すると疑われていない個体に由来する、請求項１２から１４のいずれか一項に記載の方法。
位置特異的バックグラウンド誤り率の前記第１および第２の群が、複数の対照試料を使用して決定されており、必要に応じて、前記対照試料が、がんを有すると疑われていない個体に由来する、請求項１２から１４のいずれか一項に記載の方法。
位置特異的バックグラウンド誤り率の前記第１および第２の群が、病歴データを使用して決定された、請求項１２から１４のいずれか一項に記載の方法。
位置特異的バックグラウンド誤り率の前記第１および第２の群が、それぞれ前記高メチル化および低メチル化画分由来の分子のリードおよび／または配列を使用して決定された、請求項１２から１４のいずれか一項に記載の方法。
中等度画分由来の分子の配列リードを得るステップ；
前記中等度画分由来の分子の配列の第３のセットを決定するステップ；および
前記配列の第３のセットに基づき複数の塩基をコールするステップをさらに含む、先行する請求項のいずれか一項に記載の方法。
ＣからＴへのおよびＧからＡへのトランジション変異が前記第１のセットの分子の配列に基づきコールされるよりも低い厳密性で、ＣからＴへのおよびＧからＡへのトランジション変異が前記第３のセットの配列に基づきコールされる、直前の請求項に記載の方法。
ＣからＴへのおよびＧからＡへのトランジション変異が前記第２のセットの配列に基づきコールされるのと同じ仕方で、またはＣからＴへのおよびＧからＡへのトランジション変異が前記第２のセットの配列に基づきコールされるよりも高い厳密性で、ＣからＴへのおよびＧからＡへのトランジション変異が前記第３のセットの配列に基づきコールされる、直前の請求項に記載の方法。
ＤＮＡの試料を解析する方法であって、
それぞれ前記試料の高メチル化および低メチル化画分由来の配列リードの第１および第２のセットを得るステップ；ならびに
前記配列リードの第１および第２のセット由来の配列を決定するステップであって、
（ｉ）前記第１のセットのリードに基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップが、第２のセットのリードに基づき前記参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップよりも多い数のリードにおける前記トランジション変異の観察を要求する；あるいは
（ｉｉ）ＣからＴへのもしくはＧからＡへのトランジション変異が、前記第１のセットのリードに基づき参照配列と比べてコールされない、またはＣからＴへのもしくはＧからＡへのトランジション変異が、前記第１のセットの分子の配列を使用せずに前記第２のセットの分子の配列に基づき参照配列と比べてコールされる、または前記第２のセットの分子の少なくとも１つの配列が、前記ＣからＴへのもしくはＧからＡへのトランジション変異を含む場合に限り、ＣからＴへのもしくはＧからＡへのトランジション変異が、参照配列と比べてコールされる、ステップを含む、方法。
前記第１のセットのリードに基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップが、前記第２のセットのリードに基づき前記参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップよりも多い数のリードにおける前記トランジション変異の観察を要求する、直前の請求項に記載の方法。
前記第１のセットのリードに基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップが、少なくとも３つのリードにおける前記トランジション変異の観察を要求する、請求項２２または２３のいずれか一項に記載の方法。
前記第１のセットのリードに基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップが、少なくとも４つのリードにおける前記トランジション変異の観察を要求する、直前の請求項に記載の方法。
前記第１のセットのリードに基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップが、少なくとも５つのリードにおける前記トランジション変異の観察を要求する、直前の請求項に記載の方法。
前記第２のセットのリードに基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップが、少なくとも２つのリードにおける前記トランジション変異の観察を要求する、請求項２２から２６のいずれか一項に記載の方法。
前記第２のセットのリードに基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップが、少なくとも３つのリードにおける前記トランジション変異の観察を要求する、直前の請求項に記載の方法。
前記第１のセットのリードに基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップが、前記第２のセットのリードに基づき参照配列と比べたＣからＴへのまたはＧからＡへのトランジション変異をコールするステップよりも少なくとも２つ多いリードにおける前記トランジション変異の観察を要求する、請求項２２から２８のいずれか一項に記載の方法。
中等度画分由来の配列リードの第３のセットを得るステップをさらに含み、前記配列が、前記第１および第２のセットに加えて前記第３のセットから決定される、先行する請求項のいずれか一項に記載の方法。
ＣからＴへのおよびＧからＡへのトランジション変異が前記第１のセットのリードに基づきコールされるよりも低い厳密性で、ＣからＴへのおよびＧからＡへのトランジション変異が前記第３のセットのリードに基づきコールされる、直前の請求項に記載の方法。
ＣからＴへのおよびＧからＡへのトランジション変異が前記第２のセットのリードに基づきコールされるのと同じ仕方で、ＣからＴへのおよびＧからＡへのトランジション変異が前記第３のセットのリードに基づきコールされる、直前の請求項に記載の方法。
前記高メチル化画分の前記ＤＮＡおよび前記低メチル化画分の前記ＤＮＡが、示差的にタグ付けされている、先行する請求項のいずれか一項に記載の方法。
前記高メチル化画分の前記ＤＮＡおよび前記低メチル化画分の前記ＤＮＡが、バーコードを含む配列タグで示差的にタグ付けされている、先行する請求項のいずれか一項に記載の方法。
前記高メチル化および低メチル化画分が、前記試料の前記ＤＮＡを、固体支持体に固定化されたメチル結合試薬と接触させることにより調製された、先行する請求項のいずれか一項に記載の方法。
前記メチル結合試薬が、ＭＢＤを含む、直前の請求項に記載の方法。
前記メチル結合試薬が、ＭｅＣＰを含む、請求項３６に記載の方法。
前記メチル結合試薬が、メチル化ヌクレオチドに結合する抗体を含み、必要に応じて、前記メチル化ヌクレオチドが、メチル化シトシンである、請求項３６に記載の方法。
前記試料の前記ＤＮＡを、前記固体支持体に固定化された前記メチル結合試薬と接触させ、前記メチル結合試薬への示差的結合に基づき前記低メチル化画分および高メチル化画分を得るステップを含む、請求項３５から３８のいずれか一項に記載の方法。
シーケンシング前に前記高メチル化画分の前記ＤＮＡおよび前記低メチル化画分の前記ＤＮＡに示差的タグを付加するステップを含む、請求項３５から３９のいずれか一項に記載の方法。
前記配列を決定するステップが、前記配列リードの第１および第２のセットを参照配列にマッピングして、マッピングされた配列リードを産生するステップを含む、先行する請求項のいずれか一項に記載の方法。
前記試料のまたは前記高メチル化および低メチル化画分の前記ＤＮＡが、富化または捕捉された目的の領域を含む、先行する請求項のいずれか一項に記載の方法。
目的の領域について前記試料のもしくは前記高メチル化および低メチル化画分の前記ＤＮＡを富化するステップ、または前記試料もしくは前記高メチル化および低メチル化画分から目的の領域を捕捉するステップを含む、先行する請求項のいずれか一項に記載の方法。
富化または捕捉するステップが、前記ＤＮＡを標的特異的プローブのセットと接触させ、それによって、ＤＮＡ分子の捕捉されたセットが産生されるステップを含む、直前の請求項に記載の方法。
前記目的の領域が、配列可変標的領域を含む、請求項４２から４４のいずれか一項に記載の方法。
前記標的特異的プローブのセットが、配列可変標的セットに特異的な標的結合プローブを含む、直前の請求項に記載の方法。
配列可変標的領域セットのフットプリントが、少なくとも２５ｋＢまたは少なくとも５０ｋＢである、直前の請求項に記載の方法。
前記目的の領域が、エピジェネティック標的領域を含む、請求項４２から４７のいずれか一項に記載の方法。
前記標的特異的プローブのセットが、エピジェネティック標的セットに特異的な標的結合プローブを含む、直前の請求項に記載の方法。
前記目的の領域が、配列可変標的領域セットおよびエピジェネティック標的領域セットを含む、請求項４２から４９のいずれか一項に記載の方法。
前記配列可変標的領域セットに少なくとも１０個の領域、および前記エピジェネティック標的領域セットに少なくとも１００個の領域が存在する、直前の請求項に記載の方法。
前記エピジェネティック標的領域セットの前記フットプリントが、前記配列可変標的領域セットのサイズよりも少なくとも２倍大きい、請求項５０から５１のいずれか一項に記載の方法。
前記エピジェネティック標的領域セットの前記フットプリントが、前記配列可変標的領域セットのサイズよりも少なくとも１０倍大きい、直前の請求項に記載の方法。
前記標的特異的プローブのセットが、前記エピジェネティック標的セットに対応するｃｆＤＮＡよりも大きい捕捉収量で、前記配列可変標的セットに対応するｃｆＤＮＡを捕捉するように構成されている、請求項５２または５３に記載の方法。
前記配列可変標的領域セットが、１０～３０キロベースの範囲内のフットプリントを有する、請求項５０から５４のいずれか一項に記載の方法。
前記配列可変標的領域セットが、３０～６０キロベースの範囲内のフットプリントを有する、請求項５０から５４のいずれか一項に記載の方法。
前記配列可変標的領域セットが、６０キロベース～１メガベースの範囲内のフットプリントを有する、請求項５０から５４のいずれか一項に記載の方法。
前記配列可変標的領域セットが、１～２メガベースの範囲内のフットプリントを有する、請求項５０から５４のいずれか一項に記載の方法。
前記エピジェネティック標的領域セットが、０．２～０．８メガベースの範囲内のフットプリントを有する、請求項５０から５８のいずれか一項に記載の方法。
前記エピジェネティック標的領域セットが、０．８～１．５メガベースの範囲内のフットプリントを有する、請求項５０から５８のいずれか一項に記載の方法。
前記エピジェネティック標的領域セットが、１．５～３メガベースの範囲内のフットプリントを有する、請求項５０から５８のいずれか一項に記載の方法。
前記エピジェネティック標的領域セットが、３～８メガベースの範囲内のフットプリントを有する、請求項５０から５８のいずれか一項に記載の方法。
前記エピジェネティック標的領域セットが、高メチル化可変標的領域セットを含む、請求項５０から６２のいずれか一項に記載の方法。
前記エピジェネティック標的領域セットが、低メチル化可変標的領域セットを含む、請求項５０から６３のいずれか一項に記載の方法。
前記エピジェネティック標的領域セットが、断片化可変標的領域セットを含む、請求項５０から６４のいずれか一項に記載の方法。
前記断片化可変標的領域セットが、転写開始部位領域を含む、直前の請求項に記載の方法。
前記断片化可変標的領域セットが、ＣＴＣＦ結合領域を含む、請求項６５または６６に記載の方法。
前記配列可変標的セットの前記捕捉されたＤＮＡが、前記エピジェネティック標的領域セットの前記捕捉されたＤＮＡよりも高いシーケンシング深度までシーケンシングされる、請求項５０から６７のいずれか一項に記載の方法。
前記配列可変標的セットの前記捕捉されたＤＮＡが、前記エピジェネティック標的領域セットの前記捕捉されたｃｆＤＮＡ分子よりも、少なくとも２倍、３倍もしくは４倍高いシーケンシング深度までシーケンシングされる、または４～１０倍もしくは４～１００倍高いシーケンシング深度までシーケンシングされる、直前の請求項に記載の方法。
前記配列可変標的セットの前記捕捉されたＤＮＡが、シーケンシング前に、前記エピジェネティック標的領域セットの前記捕捉されたＤＮＡと共にプールされる、請求項５０から６９のいずれか一項に記載の方法。
前記配列可変標的セットの前記捕捉されたＤＮＡおよび前記エピジェネティック標的領域セットの前記捕捉されたＤＮＡが、同じシーケンシングセルにおいてシーケンシングされる、請求項５０から７０のいずれか一項に記載の方法。
前記高メチル化および低メチル化画分の前記ＤＮＡが、捕捉前に増幅される、請求項５０から７１のいずれか一項に記載の方法。
前記試料が、生体組織または生体液から得られた、先行する請求項のいずれか一項に記載の方法。
前記試料が、血液から得られた、先行する請求項のいずれか一項に記載の方法。
前記試料の前記ＤＮＡが、無細胞ＤＮＡを含む、先行する請求項のいずれか一項に記載の方法。
前記試料の前記ＤＮＡが、無細胞ＤＮＡから本質的になる、先行する請求項のいずれか一項に記載の方法。
前記試料が、増殖性障害または固形腫瘍を有するまたはこれを有すると疑われる対象に由来する、先行する請求項のいずれか一項に記載の方法。
前記試料が、増殖性障害または固形腫瘍のための処置を受けているまたはこれを受けたことがある対象に由来する、先行する請求項のいずれか一項に記載の方法。
前記配列リードから決定された配列に基づき、前記対象が増殖性障害または固形腫瘍を有する可能性を決定するステップをさらに含む、先行する請求項のいずれか一項に記載の方法。
前記増殖性障害または固形腫瘍が、がんである、直前の３つの請求項のいずれか一項に記載の方法。