JP2023502752A

JP2023502752A - メチル化ポリヌクレオチドの結合を改善するための方法、組成物およびシステム

Info

Publication number: JP2023502752A
Application number: JP2022529847A
Authority: JP
Inventors: ダスティンハワードハイト，; ファルシードガディリ，; ステファニーアンウォードモーティマー，
Original assignee: ガーダントヘルス，インコーポレイテッド
Priority date: 2019-11-26
Filing date: 2020-11-25
Publication date: 2023-01-25
Also published as: WO2021108708A1; CN114746560A; US20210214800A1; EP4065725A1; CA3157560A1

Abstract

ある態様では、対象から得られたポリヌクレオチド試料において腫瘍の存在または非存在を検出するための方法であって、（ｉ）担体核酸分子をポリヌクレオチド試料に添加して、第１の試料を生成するステップであって、担体核酸分子のセットが、非メチル化担体核酸分子の少なくとも１つのサブセットおよび／またはメチル化担体核酸分子の少なくとも１つのサブセットを含み、担体核酸分子の少なくとも一方の末端が、ライゲーションを防止するように改変される、ステップ；（ｉｉ）第１の試料を、メチル化ポリヌクレオチドに選択的に結合する捕捉剤を使用して、少なくとも２つの分配されたセットに分配するステップ；（ｉｉｉ）分配された試料を処理して、処理された試料を生成するステップであって、この処理は、タグ付けするステップ、増幅するステップおよび富化するステップを含む、ステップ；（ｉｖ）処理された試料をシーケンシングして、シーケンシングリードのセットを生成するステップ；および（ｖ）複数のシーケンシングリードを解析して、腫瘍の存在または非存在を検出するステップを含む、方法。

Description

関連出願の相互参照
本出願は、すべての目的に関して参照により本明細書に組み込まれる、２０１９年１１月２６日に提出された米国仮特許出願第６２／９４０，８５３号への優先権の利益を主張する。

背景
がんは、世界全体で疾患の主要な原因である。毎年、数千万人が世界中でがんと診断され、その半分よりも多くが最終的にがんで死亡する。多くの国では、がんは、心血管疾患に次いで２番目に一般的な死亡原因としてランク付けされている。早期検出は、多くのがんについての転帰改善に関連する。

がんは、そのうち少なくとも一部が不適切に調節された細胞分裂を生じる、個体の正常細胞内での遺伝的バリエーションの蓄積によって引き起こされ得る。そのようなバリエーションには、コピー数変動（ＣＮＶ）、一塩基変異（ｓｉｎｇｌｅｎｕｃｌｅｏｔｉｄｅｖａｒｉａｔｉｏｎ）（ＳＮＶ）、遺伝子融合、挿入および／または欠失（インデル）が一般に含まれ、エピジェネティックバリエーションには、シトシンの５－メチル化（５－メチルシトシン）ならびにＤＮＡとクロマチンおよび転写因子との会合が含まれる。

がんは、腫瘍の生検と、その後の細胞、マーカー、または細胞から抽出されたＤＮＡの解析によって検出される場合が多い。しかしより最近、血液または尿等の体液中の無細胞核酸からもがんを検出することができることが提唱されている。そのような試験は、非侵襲性であるという利点を有し、生検中の疑われるがん細胞を同定することなしに実施することができる。しかし、そのようなリキッドバイオプシー試験は、体液中の核酸の量が非常に少なく、存在する核酸が不均一な形態（例えば、ＲＮＡおよびＤＮＡ、一本鎖および二本鎖、ならびに様々な状態の複製後改変およびヒストン等のタンパク質との会合）であるという事実によって複雑になる。

概要
ある態様では、本開示は、対象における腫瘍の存在または非存在を検出する方法であって、（ｉ）対象からポリヌクレオチド試料を得るステップ；（ｉｉ）担体核酸分子のセットをポリヌクレオチド試料に添加して、第１の試料を生成するステップであって、担体核酸分子のセットが、（ａ）非メチル化担体核酸分子の少なくとも１つのサブセット；および／または（ｂ）メチル化担体核酸分子の少なくとも１つのサブセットを含み、担体核酸分子の少なくとも一方の末端が、ライゲーションを防止するように改変され、非メチル化担体核酸分子が、メチル化ヌクレオチドを含まず、メチル化担体核酸分子が、１つまたは複数のメチル化ヌクレオチドを含む、ステップ；（ｉｉｉ）第１の試料を、メチル化ポリヌクレオチドに選択的に結合する捕捉剤を使用して、少なくとも２つの分配されたセットに分配し、それにより、分配された試料を生成するステップ；（ｉｖ）分配された試料の少なくとも一部を処理して、処理された試料を生成するステップであって、この処理は、以下：（ａ）タグ付けするステップ、（ｂ）増幅するステップ、および（ｃ）目的の特異的領域について分子を富化するステップ、のうち少なくとも１つを含む、ステップ；（ｖ）処理された試料の少なくとも一部をシーケンシングして、シーケンシングリードのセットを生成するステップ；および（ｖｉ）シーケンシングリードのセットの少なくとも一部を解析して、腫瘍の存在または非存在を検出するステップを含む方法を提供する。一部の実施形態では、シーケンシングするステップは、少なくとも２つの分配されたセット由来の処理された試料の少なくとも一部をシーケンシングするステップを含む。

別の態様では、本開示は、ポリヌクレオチドを解析するための方法であって、（ｉ）対象からポリヌクレオチド試料を得るステップ；（ｉｉ）担体核酸分子のセットをポリヌクレオチド試料に添加して、第１の試料を生成するステップであって、担体核酸分子のセットが、（ａ）非メチル化担体核酸分子の少なくとも１つのサブセット；および／または（ｂ）メチル化担体核酸分子の少なくとも１つのサブセットを含み、担体核酸分子の少なくとも一方の末端が、ライゲーションを防止するように改変され、非メチル化担体核酸分子が、メチル化ヌクレオチドを含まず、メチル化担体核酸分子が、１つまたは複数のメチル化ヌクレオチドを含む、ステップ；（ｉｉｉ）第１の試料を、メチル化ポリヌクレオチドに選択的に結合する捕捉剤を使用して、少なくとも２つの分配されたセットに分配し、それにより、分配された試料を生成するステップ；（ｉｖ）分配された試料の少なくとも一部を処理して、処理された試料を生成するステップであって、この処理は、以下：（ａ）タグ付けするステップ、（ｂ）増幅するステップ、および（ｃ）目的の特異的領域について分子を富化するステップのうち少なくとも１つを含む、ステップ；（ｖ）処理された試料の少なくとも一部をシーケンシングして、シーケンシングリードのセットを生成するステップ；および（ｖｉ）シーケンシングリードのセットの少なくとも一部を解析して、腫瘍の存在または非存在を検出するステップを含む方法を提供する。一部の実施形態では、シーケンシングするステップは、少なくとも２つの分配されたセット由来の処理された試料の少なくとも一部をシーケンシングするステップを含む。

別の態様では、本開示は、ポリヌクレオチドを解析するための方法であって、（ｉ）担体核酸分子のセットを対象由来のポリヌクレオチド試料に添加して、第１の試料を生成するステップであって、担体核酸分子のセットが、（ａ）非メチル化担体核酸分子の少なくとも１つのサブセット；および／または（ｂ）メチル化担体核酸分子の少なくとも１つのサブセットを含み、担体核酸分子の少なくとも一方の末端が、ライゲーションを防止するように改変され、非メチル化担体核酸分子が、メチル化ヌクレオチドを含まず、メチル化担体核酸分子が、１つまたは複数のメチル化ヌクレオチドを含む、ステップ；（ｉｉｉ）第１の試料を、メチル化ポリヌクレオチドに選択的に結合する捕捉剤を使用して、少なくとも２つの分配されたセットに分配し、それにより、分配された試料を生成するステップ；（ｉｖ）分配された試料の少なくとも一部を処理して、処理された試料を生成するステップであって、この処理は、以下：（ａ）タグ付けするステップ、（ｂ）増幅するステップ、および（ｃ）目的の特異的領域について分子を富化するステップのうち少なくとも１つを含む、ステップ；（ｖ）処理された試料の少なくとも一部をシーケンシングして、シーケンシングリードのセットを生成するステップ；および（ｖｉ）シーケンシングリードのセットの少なくとも一部を解析して、腫瘍の存在または非存在を検出するステップを含む方法を提供する。一部の実施形態では、シーケンシングするステップは、少なくとも２つの分配されたセット由来の処理された試料の少なくとも一部をシーケンシングするステップを含む。

別の態様では、本開示は、ポリヌクレオチドを解析するための方法であって、（ｉ）対象からポリヌクレオチド試料を得るステップ；（ｉｉ）担体核酸分子のセットをポリヌクレオチド試料に添加して、第１の試料を生成するステップであって、担体核酸分子のセットが、（ａ）非メチル化担体核酸分子の少なくとも１つのサブセット；および／または（ｂ）メチル化担体核酸分子の少なくとも１つのサブセットを含み、担体核酸分子の少なくとも一方の末端が、ライゲーションを防止するように改変され、非メチル化担体核酸分子が、メチル化ヌクレオチドを含まず、メチル化担体核酸分子が、１つまたは複数のメチル化ヌクレオチドを含む、ステップ；（ｉｉｉ）第１の試料を、メチル化ポリヌクレオチドに選択的に結合する捕捉剤を使用して、少なくとも２つの分配されたセットに分配し、それにより、分配された試料を生成するステップ；（ｉｖ）分配された試料の少なくとも一部を処理して、処理された試料を生成するステップであって、この処理は、以下：（ａ）タグ付けするステップ、および（ｂ）ポリヌクレオチドを増幅するステップのうち少なくとも１つを含む、ステップ；（ｖ）処理された試料の少なくとも一部をシーケンシングして、シーケンシングリードのセットを生成するステップ；および（ｖｉ）シーケンシングリードのセットの少なくとも一部を解析して、腫瘍の存在または非存在を検出するステップを含む方法を提供する。一部の実施形態では、シーケンシングするステップは、少なくとも２つの分配されたセット由来の処理された試料の少なくとも一部をシーケンシングするステップを含む。一部の実施形態では、処理するステップは、目的の特異的領域についてポリヌクレオチドを富化するステップをさらに含む。

別の態様では、本開示は、ポリヌクレオチドのメチル化状態を検出する方法であって、（ｉ）対象からポリヌクレオチド試料を得るステップ；（ｉｉ）担体核酸分子のセットをポリヌクレオチド試料に添加して、第１の試料を生成するステップであって、担体核酸分子のセットが、（ａ）非メチル化担体核酸分子の少なくとも１つのサブセット；および／または（ｂ）メチル化担体核酸分子の少なくとも１つのサブセットを含み、担体核酸分子の少なくとも一方の末端が、ライゲーションを防止するように改変され、非メチル化担体核酸分子が、メチル化ヌクレオチドを含まず、メチル化担体核酸分子が、１つまたは複数のメチル化ヌクレオチドを含む、ステップ；（ｉｉｉ）第１の試料を、メチル化ポリヌクレオチドに選択的に結合する捕捉剤を使用して、少なくとも２つの分配されたセットに分配し、それにより、分配された試料を生成するステップ；（ｉｖ）分配された試料の少なくとも一部を処理して、処理された試料を生成するステップであって、この処理は、以下：（ａ）タグ付けするステップ、（ｂ）増幅するステップ、および（ｃ）目的の特異的領域について分子を富化するステップのうち少なくとも１つを含む、ステップ；（ｖ）処理された試料の少なくとも一部をシーケンシングして、シーケンシングリードのセットを生成するステップ；および（ｖｉ）シーケンシングリードのセットの少なくとも一部を解析して、腫瘍の存在または非存在を検出するステップを含む方法を提供する。一部の実施形態では、シーケンシングするステップは、少なくとも２つの分配されたセット由来の処理された試料の少なくとも一部をシーケンシングするステップを含む。

一部の実施形態では、シーケンシングリードのセットの少なくとも一部を解析するステップは、１つまたは複数の体細胞バリエーションを検出するステップを含む。一部の実施形態では、シーケンシングリードのセットの少なくとも一部を解析するステップは、ＣｐＧ残基（または別のメチル化ヌクレオチド）の数、およびポリヌクレオチドが分配される分配されたセットに基づいて、ポリヌクレオチドのメチル化状態（即ち、ポリヌクレオチドがメチル化されているか否か）を決定するステップを含む。一部の実施形態では、シーケンシングするステップの前に、少なくとも２つの分配されたセット中のポリヌクレオチドは、ヌクレオチド塩基の改変（例えば、メチル化）の情報を提供するようにヌクレオチド塩基を選択的に変換する化学的手順に供され得る。これらの実施形態では、化学的手順は、バイサルファイト処置、ＴＡＢ－Ｓｅｑ、ＡＣＥ－Ｓｅｑ、ＥＭ－Ｓｅｑ、ｈｍＣ－Ｓｅａｌ、ＴＡＰＳまたはＴＡＰＳＢであり得る。これらの実施形態では、シーケンシングリードのセットの少なくとも一部を解析するステップは、ヌクレオチド塩基変換に依存してヌクレオチド塩基の改変を決定するステップを含む。一部の実施形態では、分配のために使用される方法およびシステムは、その全体が参照により本明細書に組み込まれるＰＣＴ特許出願番号ＰＣＴ／ＵＳ２０２０／０５３６１０において見出され得る。

別の態様では、本開示は、（ｉ）非メチル化担体核酸分子の少なくとも１つのサブセット；および／または（ｉｉ）メチル化担体核酸分子の少なくとも１つのサブセットを含む担体核酸分子のセットであって、担体核酸分子の少なくとも一方の末端が、ライゲーションを防止するように改変され、非メチル化担体核酸分子が、メチル化ヌクレオチドを含まず、メチル化担体核酸分子が、１つまたは複数のメチル化ヌクレオチドを含む、担体核酸分子のセットを提供する。

別の態様では、本開示は、（ｉ）（ａ）非メチル化担体核酸分子の少なくとも１つのサブセット；および／または（ｂ）メチル化担体核酸分子の少なくとも１つのサブセットを含む担体核酸分子のセットであって、担体核酸分子の少なくとも一方の末端が、ライゲーションを防止するように改変され、非メチル化担体核酸分子が、メチル化ヌクレオチドを含まず、メチル化担体核酸分子が、１つまたは複数のメチル化ヌクレオチドを含む、担体核酸分子のセット；および（ｉｉ）対象から得られたポリヌクレオチド試料を含む核酸の集団を提供する。

別の態様では、本開示は、少なくとも１つの電子プロセッサーによって実行された場合に、（ｉ）担体核酸分子のセットをポリヌクレオチド試料に添加して、第１の試料を生成するステップであって、担体核酸分子のセットが、（ａ）非メチル化担体核酸分子の少なくとも１つのサブセット；および／または（ｂ）メチル化担体核酸分子の少なくとも１つのサブセットを含み、担体核酸分子の少なくとも一方の末端が、ライゲーションを防止するように改変され、非メチル化担体核酸分子が、メチル化ヌクレオチドを含まず、メチル化担体核酸分子が、１つまたは複数のメチル化ヌクレオチドを含む、ステップ；（ｉｉ）第１の試料を、メチル化ポリヌクレオチドに選択的に結合する捕捉剤を使用して、少なくとも２つの分配されたセットに分配し、それにより、分配された試料を生成するステップ；（ｉｉｉ）分配された試料の少なくとも一部を処理して、処理された試料を生成するステップであって、この処理は、以下：（ａ）タグ付けするステップ、（ｂ）増幅するステップ、および（ｃ）目的の特異的領域について分子を富化するステップのうち少なくとも１つを含む、ステップ；（ｉｖ）処理された試料の少なくとも一部をシーケンシングして、シーケンシングリードのセットを生成するステップ；および（ｖ）シーケンシングリードのセットの少なくとも一部を解析して、腫瘍の存在または非存在を検出するステップを含む方法を実行する非一過性コンピュータ実行可能命令を含むコンピュータ可読媒体を含むかまたはそれにアクセスすることが可能なコントローラーを含むシステムを提供する。

一部の実施形態では、担体核酸分子は、長さが２５ｂｐと３２５ｂｐとの間である。一部の実施形態では、非メチル化担体核酸分子の少なくとも１つのサブセットの第１のサブセットおよび第２のサブセットは、同じヌクレオチド配列を含む。一部の実施形態では、非メチル化担体核酸分子の少なくとも１つのサブセットの第１のサブセットおよび第２のサブセットは、異なるヌクレオチド配列を含む。

一部の実施形態では、非メチル化担体核酸分子の少なくとも１つのサブセットの第１のサブセットおよび第２のサブセットは、ヌクレオチド配列中に、１つまたは複数のＣｐＧジヌクレオチドを含む。一部の実施形態では、非メチル化担体核酸分子の少なくとも１つのサブセットの第１のサブセット中の１つまたは複数のＣｐＧジヌクレオチドの位置は、第２のサブセット中の１つまたは複数のＣｐＧジヌクレオチドの位置とは異なる。一部の実施形態では、非メチル化担体核酸分子の少なくとも１つのサブセットの第１のサブセット中のＣｐＧジヌクレオチドの数は、第２のサブセット中のＣｐＧジヌクレオチドの数とは異なる。一部の実施形態では、非メチル化担体核酸分子の少なくとも１つのサブセットの第１のサブセット中の１つまたは複数のＣｐＧジヌクレオチドに隣接するヌクレオチドの配列は、第２のサブセット中の１つまたは複数のＣｐＧジヌクレオチドに隣接するヌクレオチドの配列とは異なる。一部の実施形態では、第１のサブセットおよび／または第２のサブセット中の１つまたは複数のメチル化ヌクレオチドに隣接するヌクレオチドの配列は、１つまたは複数のメチル化ヌクレオチドに隣接する１ヌクレオチド、２ヌクレオチド、３ヌクレオチド、４ヌクレオチドまたは５ヌクレオチドの配列であり得る。一部の実施形態では、非メチル化担体核酸分子の少なくとも１つのサブセットの第１のサブセットおよび第２のサブセットは、異なる長さのものである。

一部の実施形態では、１つまたは複数のメチル化ヌクレオチドは、（ｉ）５－メチルシトシン、（ｉｉ）６－メチルアデニン、（ｉｉｉ）ヒドロキシメチルシトシン、（ｉｖ）メチルウラシル、および（ｖ）任意の他のメチル化ヌクレオチドからなる群より選択される。一部の実施形態では、メチル化ヌクレオチドの数は、１、２、３、４、５、６、７、８、９、１０、１２、１４、１５、１６、１７、１８、１９または少なくとも２０である。

一部の実施形態では、メチル化担体核酸分子の少なくとも１つのサブセットの第１のサブセットおよび第２のサブセットは、同じヌクレオチド配列を含む。一部の実施形態では、メチル化担体核酸分子の少なくとも１つのサブセットの第１のサブセットおよび第２のサブセットは、異なるヌクレオチド配列を含む。

一部の実施形態では、メチル化担体核酸分子の少なくとも１つのサブセットの第１のサブセットおよび第２のサブセットは、ヌクレオチド配列中に、１つまたは複数のＣｐＧジヌクレオチドを含む。一部の実施形態では、１つまたは複数のＣｐＧジヌクレオチドは、１つまたは複数のメチル化シトシンを含む。

一部の実施形態では、メチル化担体核酸分子の少なくとも１つのサブセットの第１のサブセット中の１つまたは複数のメチル化ヌクレオチドの位置は、第２のサブセット中の１つまたは複数のメチル化ヌクレオチドの位置とは異なる。一部の実施形態では、メチル化担体核酸分子の少なくとも１つのサブセットの第１のサブセット中のメチル化ヌクレオチドの数は、第２のサブセット中のメチル化ヌクレオチドの数とは異なる。一部の実施形態では、メチル化担体核酸分子の少なくとも１つのサブセットの第１のサブセット中の１つまたは複数のメチル化ヌクレオチドに隣接するヌクレオチドの配列は、第２のサブセット中の１つまたは複数のメチル化ヌクレオチドに隣接するヌクレオチドの配列とは異なる。一部の実施形態では、第１のサブセットおよび／または第２のサブセット中の１つまたは複数のメチル化ヌクレオチドに隣接するヌクレオチドの配列は、１つまたは複数のメチル化ヌクレオチドに隣接する１ヌクレオチド、２ヌクレオチド、３ヌクレオチド、４ヌクレオチドまたは５ヌクレオチドの配列であり得る。

一部の実施形態では、メチル化担体核酸分子の少なくとも１つのサブセットの第１のサブセットおよび第２のサブセットは、異なる長さのものである。

一部の実施形態では、メチル化担体核酸分子の少なくとも１つのサブセットの、非メチル化担体核酸分子の少なくとも１つのサブセットに対する量は、約０：１、０．１：９９．９、０．５：９９．５、０．７５：９９．２５、１：９９、１：９５、１：９０、１：８０、１：７５、１：７０、１：６０、１：５０、１：４０、１：３０、１：２５、１：２０、１：１０、１：５、１：２、１：１．１５、１：１、１．１５：１、２：１、５：１、１０：１、２０：１、２５：１、３０：１、４０：１、５０：１、６０：１、７０：１、７５：１、８０：１、９０：１、９５：１、９９：１、９９．２５：０．７５、９９．５：０．５、９９．９：０．１または１：０の比である。一部の実施形態では、メチル化担体核酸分子の少なくとも１つのサブセットの、非メチル化担体核酸分子の少なくとも１つのサブセットに対する量は、約１：１の比である。一部の実施形態では、メチル化担体核酸分子の少なくとも１つのサブセットの、非メチル化担体核酸分子の少なくとも１つのサブセットに対する量は、約２：１の比である。一部の実施形態では、メチル化担体核酸分子の少なくとも１つのサブセットの、非メチル化担体核酸分子の少なくとも１つのサブセットに対する量は、約１：２の比である。一部の実施形態では、ポリヌクレオチド試料の、担体核酸分子のセットに対する量は、約１：０．１；１：０．２、１：０．３、１：４、１：０．５、１：６、１：７、１：８、１：０．９、１：１、１：１、１：２、１：３、１：４、１：５、１：６、１：７、１：８、１：９、１：１０の比、１：２０、１：３０、１：４０、１：５０、１：６０、１：７０、１：８０、１：９０、１：１００、１：２００、１：３００；１：４００、１：５００、１：６００、１：７００、１：８００、１：９００、１：１０００、１：５０００、１：１０，０００、１：１００，０００、１：５００，０００、１：１０６、１：１０７、１：１０８または１：１０９である。一部の実施形態では、量は、質量を単位とする。一部の実施形態では、量は、モル濃度を単位とする。一部の実施形態では、ポリヌクレオチド試料は、最大１μｇである。一部の実施形態では、ポリヌクレオチド試料は、最大２００ｎｇである。一部の実施形態では、ポリヌクレオチド試料は、最大１５０ｎｇである。一部の実施形態では、ポリヌクレオチド試料は、最大１００ｎｇである。

一部の実施形態では、担体核酸分子のセットは、ポリヌクレオチド試料と担体核酸分子のセットとの総量が約１７５ｎｇ、２００ｎｇ、２２５ｎｇ、２５０ｎｇ、２７５ｎｇ、３００ｎｇ、３５０ｎｇ、４００ｎｇ、４５０ｎｇ、５００ｎｇ、６００ｎｇ、７００ｎｇ、７５０ｎｇ、８００ｎｇ、９００ｎｇ、１μｇ、１．１μｇ、１．２５μｇまたは１．５μｇになるように十分な量で添加される。

一部の実施形態では、担体核酸分子の配列は、（ｉ）ウイルスゲノム由来の配列、（ｉｉ）細菌ゲノム由来の配列、（ｉｉｉ）ラムダゲノム由来の配列、および（ｉｖ）非ヒトゲノム由来の配列からなる群より選択される。一部の実施形態では、担体核酸分子は、合成ＤＮＡである。一部の実施形態では、担体核酸分子は、ウラシルヌクレオシドを含む。一部の実施形態では、この方法は、増幅前に、ウラシルデグリコシラーゼおよびＤＮＡグリコシラーゼ－リアーゼを添加するステップをさらに含む（Kropachev KT et al., Biochemistry (2006); 45(39):12039-12049）。一部の実施形態では、担体ＤＮＡ分子は、ＰＣＲによって生成され得る。一部の実施形態では、ＰＣＲによって生成された担体核酸分子は、担体核酸分子中の１つまたは複数のヌクレオチドにメチル基を組み込むために、メチルトランスフェラーゼによる処置によってさらに改変され得る。一部の実施形態では、担体核酸分子は、アダプターへの担体核酸分子のライゲーションを防止するように改変ヌクレオシドを組み込むために、ポリメラーゼで末端標識され得る。一部の実施形態では、担体核酸分子は、天然に存在しないヌクレオシド誘導体を含む。一部の実施形態では、担体核酸分子は、ビオチンまたはフルオロフォアで標識され得る。

一部の実施形態では、担体核酸分子の少なくとも一方の末端は、Ｃ３（プロピル基）スペーサーを含む。Ｃ３スペーサーは、ライゲーションの遮断を助ける。一部の実施形態では、担体核酸分子の少なくとも一方の末端は、ジデオキシヌクレオチドを含む。一部の実施形態では、担体核酸分子の少なくとも一方の末端は、ヒドロキシル基が求核試薬として作用することを阻止する任意の化学的改変を含む。一部の実施形態では、担体核酸分子の５’末端は、以下の改変：（ｉ）反転（５’－５’）－ジデオキシチミン、ジデオキシシトシン、ジデオキシグアニンまたはジデオキシアデニン；（ｉｉ）プロピル基、または（ｉｉｉ）例えば、ベンジル、エチルもしくはメチルであるがこれらに限定されない他の有機官能基のうち少なくとも１つを含む。一部の実施形態では、担体核酸分子の３’末端は、以下の改変：（ｉ）酵素的に、または合成の間に付加され得る任意のジデオキシ塩基、例えば、ジデオキシチミン、ジデオキシシトシン、ジデオキシグアニンまたはジデオキシアデニン；（ｉｉ）プロピル基、または（ｉｉｉ）例えば、ベンジル、エチルもしくはメチルに限定されない他の有機官能基のうち少なくとも１つを含む。

一部の実施形態では、ポリヌクレオチド試料は、組織、血液、血漿、血清、尿、唾液、糞便、脳脊髄液、頬内スワブまたは胸腔穿刺から得られる。一部の実施形態では、ポリヌクレオチド試料は、組織から得られる。一部の実施形態では、組織から得られたポリヌクレオチド試料は、酵素的手段または機械的手段によって断片化される。一部の実施形態では、ポリヌクレオチド試料は、血液から得られる。一部の実施形態では、血液由来のポリヌクレオチド試料は、無細胞ＤＮＡ試料である。一部の実施形態では、ポリヌクレオチド試料は、無細胞ＤＮＡ試料である。一部の実施形態では、担体核酸分子は、二本鎖分子である。一部の実施形態では、本明細書に開示される方法は、アダプターのライゲーション前に変性させるステップを有さない。即ち、第１の試料は、変性させるステップに供されない（言い換えると、二本鎖担体核酸分子がライゲーションに供される）。

一部の実施形態では、本明細書に開示されるシステムおよび／または方法の結果を入力として使用して報告書を作成する。報告書は紙または電子フォーマットであり得る。例えば、本明細書に開示される方法またはシステムによって決定された核酸分子の分配に関する情報および／またはその核酸分子の分配に由来する情報を、そのような報告書に示すことができる。本明細書に開示される方法またはシステムは、第３者、例えば試料を得た対象または医療従事者に報告書を伝えるステップをさらに含み得る。

本明細書に開示される方法の様々なステップまたは本明細書に開示されるシステムによって実施されるステップは、同じ時期もしくは異なる時期、および／または同じ地理的場所もしくは異なる地理的場所、例えば国において実施され得る。本明細書に開示される方法の様々なステップは、同じ人または異なる人々によって実施することができる。

他の実施形態では、本発明は、対象方法を実施するためのキットを含む。このキットは、（ａ）（ｉ）非メチル化担体核酸分子の少なくとも１つのサブセット；および／または（ｉｉ）メチル化担体核酸分子の少なくとも１つのサブセットを含む担体核酸分子のセットであって、担体核酸分子の少なくとも一方の末端が、ライゲーションを防止するように改変され、非メチル化担体核酸分子が、メチル化ヌクレオチドを含まず、メチル化担体核酸分子が、１つまたは複数のメチル化ヌクレオチドを含む、担体核酸分子のセット；および（ｂ）メチル化ポリヌクレオチドに選択的に結合する捕捉剤を含む。

本開示の追加の態様および利点は、本開示の例示的な実施形態のみが示され記載される以下の詳細な説明から当業者に容易に明らかになろう。認識されるように、本開示は、他のおよび異なる実施形態が可能であり、そのいくつかの詳細は、すべて本開示から逸脱することなしに、様々な明らかな点において改変が可能である。したがって、図面および説明は、限定ではなく、事実上例示とみなすべきである。

本明細書に組み込まれ、その一部を構成する添付の図面はある特定の実施形態を説明し、記述した説明とともに、本明細書に開示した方法、コンピュータ可読媒体、およびシステムのある特定の原理を説明するために役立つ。本明細書で提供する説明は、例として含まれ、限定するものではない添付の図面と併せて読めば、より良く理解される。文脈が他を指示しない限り、同様の参照番号は図面全体で同様の成分を特定することが理解されよう。図面のいくつかまたはすべては説明目的の概略図であり、必ずしも示された要素の実際の相対的寸法または位置を描いているのではないことも理解されよう。

図１は、本開示の一実施形態に従う、対象における腫瘍の存在または非存在を検出するための方法のフローチャート図である。

図２は、本開示の一部の実施形態における使用に適した担体核酸分子の概略図である。

図３は、本開示の一部の実施形態における使用に適した担体核酸分子のセットの概略図である。

図４は、本開示の一部の実施形態における使用に適した担体核酸分子のセットの概略図である。

図５は、本開示の一部の実施形態における使用に適した担体核酸分子のセットの概略図である。

図６は、本開示の一部の実施形態における使用に適した担体核酸分子のセットの概略図である。

図７は、本開示の一部の実施形態における使用に適したシステムの例の概略図である。

図８Ａおよび図８Ｂは、高度に分配されたセット（hyper partitioned set）中の担体ＤＮＡ分子の存在下および非存在下での、試料由来の無細胞ＤＮＡ分子のグラフ図である。

定義
本開示がより容易に理解されるように、ある特定の用語を以下で最初に定義する。以下の用語および他の用語についての追加の定義が、本明細書を通じて記載され得る。以下に記載される用語の定義が、参照により組み込まれる出願または特許における定義と矛盾する場合、その用語の意味を理解するために本出願中に記載される定義を使用すべきである。

本明細書および添付の特許請求の範囲で使用される場合、単数形「１つの（ａ）」、「１つの（ａｎ）」および「その（ｔｈｅ）」は、文脈がそれ以外であることを明らかに示していない限り、複数形を含む。このように、例えば、「１つの方法」という言及は、本明細書に記載されるおよび／または本開示を読んだ当業者に明らかになる型の１つまたは複数の方法および／またはステップ等を含む。

本明細書で使用される専門用語が、特定の実施形態を記載することのみを目的としており、限定を意図しないことも理解すべきである。さらに、それ以外であることが定義されていない限り、本明細書で使用されるすべての技術用語および科学用語は、本開示が属する分野の当業者によって一般に理解される意味と同じ意味を有する。方法、コンピュータ可読媒体およびシステムを記載し特許請求する際には、以下の専門用語およびそれらの文法的異形が、以下に記載される定義に従って使用されよう。

約：本明細書で使用される場合、「約」または「およそ」は、目的の１つまたは複数の値または要素に適用される場合、述べられた参照値または要素と類似している値または要素を指す。ある特定の実施形態では、用語「約」または「およそ」は、それ以外であることが述べられていない限りまたはそれ以外であることが文脈から明らかでない限り、いずれかの方向（それよりも大きいまたはそれよりも小さい）で、述べられた参照値または要素の２５％、２０％、１９％、１８％、１７％、１６％、１５％、１４％、１３％、１２％、１１％、１０％、９％、８％、７％、６％、５％、４％、３％、２％、１％以内またはそれよりも小さい％以内に入る、値または要素の範囲を指す（そのような数が、可能な値または要素の１００％を超える場合を除く）。

アダプター：本明細書で使用される場合、「アダプター」は、典型的には少なくとも部分的に二本鎖であり、所与の試料核酸分子のいずれかの末端または両方の末端に結合される、短い核酸（例えば、長さが約５００ヌクレオチド未満、約１００ヌクレオチド未満または約５０ヌクレオチド未満）を指す。アダプターは、両方の末端でアダプターが隣接する核酸分子の増幅を可能にする核酸プライマー結合部位、および／または様々な次世代シーケンシング（ＮＧＳ）適用等のシーケンシング適用のためのプライマー結合部位を含むシーケンシングプライマー結合部位を含み得る。アダプターは、フローセル支持体等に結合されたオリゴヌクレオチド等の捕捉用プローブのための結合部位もまた含み得る。アダプターは、本明細書に記載される核酸タグもまた含み得る。核酸タグは、典型的には、核酸タグが所与の核酸分子のアンプリコンおよび配列リード中に含まれるように、増幅プライマーおよびシーケンシングプライマー結合部位に対して位置決めされる。同じまたは異なる配列のアダプターが、核酸分子のそれぞれの末端に連結され得る。一部の実施形態では、核酸タグが異なっている点を除いて同じ配列のアダプターが、核酸分子のそれぞれの末端に連結される。一部の実施形態では、アダプターは、これもまた平滑末端であるか、または１つもしくは複数の相補的ヌクレオチドのテイルが付いた核酸分子への結合のために、一方の末端が、本明細書に記載されるように平滑末端であるか、またはテイルが付けられる、Ｙ字形状のアダプターである。さらに他の例示的実施形態では、アダプターは、解析される核酸分子への結合のための平滑末端またはテイル付き末端（ｔａｉｌｅｄｅｎｄ）を含むベル形状のアダプターである。アダプターの他の例には、Ｔテイル付きおよびＣテイル付きのアダプターが含まれる。

増幅する：本明細書で使用される場合、核酸の文脈において、「増幅する」または「増幅」は、少量のポリヌクレオチド（例えば、単一のポリヌクレオチド分子）から典型的には開始する、複数コピーのポリヌクレオチド、またはポリヌクレオチドの一部の産生を指し、増幅産物またはアンプリコンは、一般には検出可能である。ポリヌクレオチドの増幅は、種々の化学的プロセスおよび酵素的プロセスを包含する。増幅には、ポリメラーゼ連鎖反応（ＰＣＲ）が含まれるがこれに限定されない。

バーコード：本明細書で使用される場合、核酸の文脈において、「バーコード」または「分子バーコード」は、分子識別子として機能することができる配列を含む核酸分子を指す。バーコードまたは分子バーコードは、核酸タグの１つの型である。例えば、典型的には、シーケンシングリードを最終データ解析前に同定および選別することができるように、個々の「バーコード」配列が、次世代シーケンシング（ＮＧＳ）ライブラリ調製の間にＤＮＡ断片に付加される。

がん型：本明細書で使用される場合、「がん型」は、例えば組織病理学によって定義される、がんの型またはサブタイプを指す。がん型は、所与の組織における存在（例えば、血液がん、中枢神経系（ＣＮＳ）、脳がん、肺がん（小細胞および非小細胞）、皮膚がん、鼻がん、咽喉がん、肝臓がん、骨がん、リンパ腫、膵がん、腸（ｂｏｗｅｌ）がん、直腸がん、甲状腺がん、膀胱がん、腎臓がん、口腔がん、胃がん、乳がん、前立腺がん、卵巣がん、肺がん、腸（ｉｎｔｅｓｔｉｎａｌ）がん、軟部組織がん、神経内分泌がん、胃食道がん、頭頸部がん、婦人科がん、結腸直腸がん、尿路上皮がん、固形がん、不均一ながん、均一ながん）、原発不明起源等に基づく、ならびに／または同じ細胞系列（例えば、癌腫、肉腫、リンパ腫、胆管癌、白血病、中皮腫、黒色腫または神経膠芽腫）ならびに／または例えばＨｅｒ２、ＣＡ１５－３、ＣＡ１９－９、ＣＡ－１２５、ＣＥＡ、ＡＦＰ、ＰＳＡ、ＨＣＧ、ホルモン受容体およびＮＭＰ－２２であるがこれらに限定されないがんマーカーを示すがんに基づく、任意の従来の基準によって定義され得る。がんは、ステージ（例えば、ステージ１、２、３または４）、および原発性の起源であるか続発性の起源であるかによっても分類され得る。

担体核酸分子：本明細書で使用される場合、「担体核酸分子」は、対象における腫瘍の存在または非存在の検出を改善するために、対象から得られたポリヌクレオチド試料に添加され得る核酸分子のセットを指す。一部の実施形態では、担体核酸分子は、一本鎖または二本鎖であり得る。一部の実施形態では、担体核酸分子は、ＤＮＡまたはＲＮＡであり得る。一部の実施形態では、担体核酸分子は、合成オリゴヌクレオチドであり得る。一部の実施形態では、担体核酸分子は、ゲノム由来の目的の１つまたは複数の特異的領域を増幅することを介して、ＰＣＲによって生成され得る。一部の実施形態では、ＰＣＲによって生成された担体核酸分子は、担体核酸分子中の１つまたは複数のヌクレオチドにメチル基を組み込むために、メチルトランスフェラーゼによる処置によってさらに改変され得る。一部の実施形態では、担体核酸分子は、アダプターへの担体核酸分子のライゲーションを防止するように改変ヌクレオシドを組み込むために、ポリメラーゼで末端標識され得る。一部の実施形態では、担体核酸分子は、天然に存在しない核酸配列を有し得る。一部の実施形態では、担体核酸分子は、天然に存在する核酸配列を有し得る。一部の実施形態では、担体核酸分子は、非ヒトゲノムに対応する核酸配列を有し得る。非限定的な例として、これらの担体核酸分子は、（ｉ）ラムダファージＤＮＡもしくはヒトゲノムの領域に対応する配列、（ｉｉ）ウイルスゲノムの領域に対応する配列、（ｉｉｉ）細菌ゲノムの領域に対応する配列、（ｉｖ）天然に存在しない配列、および／または（ｖ）上記のいずれかの組合せのいずれかを有し得る。一部の実施形態では、担体核酸分子は、天然に存在しないヌクレオシド誘導体を含む。一部の実施形態では、担体ＤＮＡ分子は、ＰＣＲによって生成され得る。一部の実施形態では、ＰＣＲによって生成された担体核酸分子は、担体核酸分子中の１つまたは複数のヌクレオチドにメチル基を組み込むために、メチルトランスフェラーゼによる処置によってさらに改変され得る。一部の実施形態では、担体核酸分子は、アダプターへの担体核酸分子のライゲーションを防止するように改変ヌクレオシドを組み込むために、ポリメラーゼで末端標識され得る。一部の実施形態では、担体核酸分子は、天然に存在しないヌクレオシド誘導体を含む。一部の実施形態では、担体核酸分子は、ビオチンまたはフルオロフォアで標識され得る。

無細胞核酸：本明細書で使用される場合、「無細胞核酸」は、細胞内に含まれることも、他の方法で細胞に結合していることもない核酸、または一部の実施形態では、インタクトな細胞の除去後に試料中に残存する核酸を指す。無細胞核酸には、例えば、対象由来の体液（例えば、血液、血漿、血清、尿、脳脊髄液（ＣＳＦ）等）から供給されるすべての非封入核酸が含まれ得る。無細胞核酸には、ゲノムＤＮＡ、ミトコンドリアＤＮＡ、循環ＤＮＡ、ｓｉＲＮＡ、ｍｉＲＮＡ、循環ＲＮＡ（ｃＲＮＡ）、ｔＲＮＡ、ｒＲＮＡ、核小体低分子ＲＮＡ（ｓｎｏＲＮＡ）、Ｐｉｗｉ相互作用ＲＮＡ（ｐｉＲＮＡ）、長鎖非コードＲＮＡ（長鎖ｎｃＲＮＡ）、ならびに／またはこれらのいずれかの断片を含む、ＤＮＡ（ｃｆＤＮＡ）、ＲＮＡ（ｃｆＲＮＡ）、およびそれらのハイブリッドが含まれる。無細胞核酸は、二本鎖、一本鎖、またはそれらのハイブリッドであり得る。無細胞核酸は、分泌または細胞死プロセス、例えば、細胞壊死、アポトーシス等を経て体液中に放出され得る。循環腫瘍ＤＮＡ（ｃｔＤＮＡ）等の一部の無細胞核酸は、がん細胞から体液中に放出される。その他は、健康な細胞から放出される。ｃｔＤＮＡは、非封入の腫瘍由来の断片化されたＤＮＡであり得る。無細胞核酸は、１つまたは複数のエピジェネティック改変を有し得る、例えば、無細胞核酸は、アセチル化、５－メチル化および／またはヒドロキシメチル化され得る。

細胞の核酸：本明細書で使用される場合、「細胞の核酸」は、そのような核酸が所与の解析プロセスの一部として次いで（例えば、細胞溶解を介して）取り出される場合であっても、少なくとも、試料が対象から採取または収集された時点において、核酸が起源する１つまたは複数の細胞内に存在する核酸を意味する。

カバレッジ（coverage）：本明細書で使用される場合、用語「カバレッジ」、「総分子カウント」または「総対立遺伝子カウント」は、互換的に使用される。これらは、所与の試料中の、特定のゲノム位置にあるＤＮＡ分子の総数を指す。

デオキシリボ核酸またはリボ核酸：本明細書で使用される場合、「デオキシリボ核酸」または「ＤＮＡ」は、糖部分の２’－位置に水素基を有する天然または改変ヌクレオチドを指す。ＤＮＡは、典型的には、４つの型のヌクレオチド塩基；アデニン（Ａ）、チミン（Ｔ）、シトシン（Ｃ）およびグアニン（Ｇ）を含むヌクレオチドの鎖を含む。本明細書で使用される場合、「リボ核酸」または「ＲＮＡ」は、糖部分の２’－位置にヒドロキシル基を有する天然または改変ヌクレオチドを指す。ＲＮＡは、典型的には、４つの型のヌクレオチド塩基；Ａ、ウラシル（Ｕ）、ＧおよびＣを含むヌクレオチドの鎖を含む。本明細書で使用される場合、用語「ヌクレオチド」は、天然ヌクレオチドまたは改変ヌクレオチドを指す。ヌクレオチドのある特定の対は、相補的様式で互いに特異的に結合する（相補的塩基対合と呼ばれる）。ＤＮＡでは、アデニン（Ａ）はチミン（Ｔ）と対合し、シトシン（Ｃ）はグアニン（Ｇ）と対合する。ＲＮＡでは、アデニン（Ａ）はウラシル（Ｕ）と対合し、シトシン（Ｃ）はグアニン（Ｇ）と対合する。第１の核酸鎖が、第１の鎖中のヌクレオチドと相補的であるヌクレオチドから構成される第２の核酸鎖に結合する場合、これら２つの鎖は結合して、二本鎖を形成する。本明細書で使用される場合、「核酸シーケンシングデータ」、「核酸シーケンシング情報」、「配列情報」、「核酸配列」、「ヌクレオチド配列」、「ゲノム配列」、「遺伝子配列」または「断片配列」または「核酸シーケンシングリード」は、ＤＮＡまたはＲＮＡ等の核酸の分子（例えば、全ゲノム、全トランスクリプトーム、エクソーム、オリゴヌクレオチド、ポリヌクレオチドまたは断片）中のヌクレオチド塩基（例えば、アデニン、グアニン、シトシン、およびチミンまたはウラシル）の順序および／または正体を示す任意の情報またはデータを示す。本教示は、キャピラリー電気泳動、マイクロアレイ、ライゲーションに基づくシステム、ポリメラーゼに基づくシステム、ハイブリダイゼーションに基づくシステム、直接的または間接的なヌクレオチド同定システム、パイロシーケンシング、イオンまたはｐＨに基づく検出システム、および電子シグネチャーに基づくシステムが含まれるがこれらに限定されないすべての利用可能な種々の手法、プラットフォームまたは技術を使用して得られた配列情報を企図することを理解すべきである。

変異：本明細書で使用される場合、「変異」は、既知の参照配列からのバリエーションを指し、例えば、一塩基バリアント（ＳＮＶ）、および挿入または欠失（インデル）等の変異を含む。変異は、生殖細胞系列変異または体細胞変異であり得る。一部の実施形態では、比較を目的とした参照配列は、試験試料を提供している対象の種の野生型ゲノム配列、典型的にはヒトゲノムである。

変異コーラー（mutation caller）：本明細書で使用される場合、「変異コーラー」は、試験試料データ（例えば、対象から得られる配列情報）中の変異を同定するために使用されるアルゴリズム（典型的には、ソフトウェアで具現化されたまたはそれ以外の方法でコンピュータ実装されたもの）を意味する。

新生物：本明細書で使用される場合、用語「新生物」および「腫瘍」は、互換的に使用される。これらは、対象中の細胞の異常な成長を指す。新生物または腫瘍は、良性、潜在的に悪性または悪性であり得る。悪性腫瘍は、がんまたはがん性腫瘍と呼ばれる。

次世代シーケンシング：本明細書で使用される場合、「次世代シーケンシング」または「ＮＧＳ」は、伝統的なＳａｎｇｅｒに基づくアプローチおよびキャピラリー電気泳動に基づくアプローチと比較して増加したスループットを有する、例えば、数十万の比較的小さい配列リードを一度に生成する能力を有するシーケンシング技術を指す。次世代シーケンシング手法の一部の例には、合成によるシーケンシング、ライゲーションによるシーケンシング、およびハイブリダイゼーションによるシーケンシングが含まれるがこれらに限定されない。一部の実施形態では、次世代シーケンシングは、単一の分子をシーケンシングすることが可能な機器の使用を含む。

核酸タグ：本明細書で使用される場合、「核酸タグ」は、異なる試料由来の核酸を区別するために使用される（例えば、試料インデックスを示す）、または異なる型の、もしくは異なる処理を受けた同じ試料中の異なる核酸分子を区別するために使用される（例えば、分子バーコードを示す）、短い核酸（例えば、長さが約５００ヌクレオチド、約１００ヌクレオチド、約５０ヌクレオチドまたは約１０ヌクレオチド未満）を指す。核酸タグは、既定の、固定された、非ランダムな、ランダムなまたは半ランダムなオリゴヌクレオチド配列を含む。そのような核酸タグは、異なる核酸分子または異なる核酸試料もしくはサブ試料を標識するために使用され得る。核酸タグは、一本鎖、二本鎖、または少なくとも部分的に二本鎖であり得る。核酸タグは、必要に応じて、同じ長さまたは変動した長さを有する。核酸タグはまた、１つもしくは複数の平滑末端を有する二本鎖分子を含み得、５’もしくは３’一本鎖領域（例えば、オーバーハング）を含み得、および／または所与の分子内の他の場所において１つもしくは複数の他の一本鎖領域を含み得る。核酸タグは、他の核酸（例えば、増幅および／またはシーケンシングされる試料核酸）の一方の末端または両方の末端に結合され得る。核酸タグは、情報、例えば、所与の核酸の起源となる試料、形態または処理を明らかにするために解読され得る。例えば、核酸タグは、異なる分子バーコードおよび／または試料インデックスを有する核酸を含む複数の試料のプールおよび／または並行処理を可能にするためにも使用され得、ここで、核酸は、核酸タグを検出する（例えば、読み取る）ことによって、次いでデコンボリューションされている。核酸タグは、識別子（例えば、分子識別子、試料識別子）とも呼ばれ得る。加えてまたはあるいは、核酸タグは、分子識別子（例えば、同じ試料またはサブ試料中の異なる分子間または異なる親分子のアンプリコン間を区別するため）として使用され得る。これは、例えば、所与の試料中の異なる核酸分子を一意的にタグ付けするステップ、またはそのような分子を非一意的にタグ付けするステップを含む。非一意的タグ付け適用の場合、異なる分子が、少なくとも１つの分子バーコードと組み合わせて、それらの内因性配列情報（例えば、それらが選択された参照ゲノムにマッピングされる場合には開始および／もしくは終止位置、配列の一方もしくは両方の末端のサブ配列、および／または配列の長さ）に基づいて区別され得るように、限定数のタグ（即ち、分子バーコード）が、各核酸分子をタグ付けするために使用され得る。典型的には、任意の２つの分子が同じ内因性配列情報（例えば、開始および／もしくは終止位置、配列の一方もしくは両方の末端のサブ配列、および／または長さ）を有し得、同じ分子バーコードもまた有する確率が低く（例えば、約１０％未満、約５％未満、約１％未満または約０．１％未満の可能性）なるように、十分な数の異なる分子バーコードが使用される。

分配：本明細書で使用される場合、「分配」および「エピジェネティック分配」は、互換的に使用される。これは、核酸分子の特徴（例えば、エピジェネティック改変のレベル／程度）に基づいて核酸分子を分離または分画することを指す。分配は、分子の物理的分配であり得る。分配には、エピジェネティック改変（例えば、メチル化）のレベルに基づいて、核酸分子を群またはセットに分離することが関与し得る。例えば、核酸分子は、核酸分子のメチル化のレベルに基づいて分配され得る。一部の実施形態では、分配に使用される方法およびシステムは、その全体が参照により本明細書に組み込まれる、ＰＣＴ特許出願番号ＰＣＴ／ＵＳ２０１７／０６８３２９において見出され得る。また、方法、システムおよび組成物は、ＰＣＴ特許出願番号ＰＣＴ／ＵＳ２０１９／０５９２１７およびＰＣＴ／ＵＳ２０２０／０１６１２０において見出され得、これらの各々は、その全体が参照により本明細書に組み込まれる。

分配されたセット：本明細書で使用される場合、「分配されたセット」は、結合剤への核酸分子の示差的結合親和性に基づいてセット／群に分配された核酸分子のセットを指す。結合剤は、エピジェネティック改変を有するヌクレオチドを含む核酸分子に優先的に結合する。例えば、エピジェネティック改変がメチル化である場合、結合剤は、メチル結合ドメイン（ＭＢＤ）タンパク質であり得る。一部の実施形態では、分配されたセットは、特定のレベル／程度のエピジェネティック改変に属する核酸分子を含み得る。例えば、核酸分子は、以下の３つのセットに分配され得る：１つのセットは、高メチル化された分配されたセットまたは高度に分配されたセットと呼ばれ得る、高度にメチル化された核酸分子（または高メチル化核酸分子）であり、別のセットは、低メチル化された分配されたセットまたは低度に分配されたセットと呼ばれ得る、低度にメチル化された核酸分子（または低メチル化核酸分子）であり、第３のセットは、中等度にメチル化された分配されたセットまたは中等度の分配されたセットと呼ばれ得る、中等度メチル化核酸分子である。別の例では、核酸分子は、メチル化ヌクレオチドの数に基づいて分配され得る－１つの分配されたセットは、９個のメチル化ヌクレオチドを有する核酸分子を有し得、別の分配されたセットは、非メチル化核酸分子を有し得る（即ち、０個のメチル化ヌクレオチド）。

ポリヌクレオチド：本明細書で使用される場合、「ポリヌクレオチド」、「核酸」、「核酸分子」または「オリゴヌクレオチド」は、ヌクレオシド間連結によって結合されたヌクレオシド（デオキシリボヌクレオシド、リボヌクレオシド、またはそれらのアナログを含む）の直鎖ポリマーを指す。典型的には、ポリヌクレオチドは、少なくとも３つのヌクレオシドを含む。オリゴヌクレオチドは、数個のモノマー単位、例えば、３～４個のモノマー単位から、数百のモノマー単位までのサイズ範囲である場合が多い。ポリヌクレオチドが、「ＡＴＧＣＣＴＧ」等の文字の配列によって示される場合、ヌクレオチドは、左から右に５’→３’の順序であること、およびＤＮＡの場合には、それ以外であることが記載されていない限り、「Ａ」はデオキシアデノシンを示し、「Ｃ」はデオキシシチジンを示し、「Ｇ」はデオキシグアノシンを示し、「Ｔ」はデオキシチミジンを示すことが理解されよう。文字Ａ、Ｃ、ＧおよびＴは、当技術分野で標準的なように、塩基自体、ヌクレオシド、または塩基を含むヌクレオチドを指すために使用され得る。

参照配列：本明細書で使用される場合、「参照配列」は、実験的に決定された配列との比較を目的として使用される既知の配列を指す。例えば、既知の配列は、ゲノム全体、染色体、またはそれらの任意のセグメントであり得る。参照は、典型的には、少なくとも約２０、少なくとも約５０、少なくとも約１００、少なくとも約２００、少なくとも約２５０、少なくとも約３００、少なくとも約３５０、少なくとも約４００、少なくとも約４５０、少なくとも約５００、少なくとも約１０００、または１０００よりも多くのヌクレオチドを含む。一部の実施形態では、参照配列は、ヒトゲノムであり得る。参照配列は、ゲノムもしくは染色体の単一の連続配列とアラインメントし得る、またはゲノムもしくは染色体の異なる領域とアラインメントする非連続セグメントを含み得る。参照配列の例には、例えば、ヒトゲノム、例えば、ｈＧ１９およびｈＧ３８が含まれる。

試料：本明細書で使用される場合、「試料」は、本明細書に開示される方法および／またはシステムによって解析されることが可能なものを意味する。

シーケンシング：本明細書で使用される場合、「シーケンシング」は、生体分子、例えば、ＤＮＡまたはＲＮＡ等の核酸の配列（例えば、モノマー単位の正体および／または順序）を決定するために使用されるいくつかの技術のいずれかを指す。シーケンシング方法の例には、標的化シーケンシング、単分子リアルタイムシーケンシング、エクソンまたはエクソームシーケンシング、イントロンシーケンシング、電子顕微鏡に基づくシーケンシング、パネルシーケンシング、トランジスタ媒介シーケンシング、ダイレクトシーケンシング、ランダムショットガンシーケンシング、Ｓａｎｇｅｒジデオキシターミネーションシーケンシング、全ゲノムシーケンシング、ハイブリダイゼーションによるシーケンシング、パイロシーケンシング、キャピラリー電気泳動、ゲル電気泳動、二重鎖シーケンシング、サイクルシーケンシング、一塩基伸長シーケンシング、固相シーケンシング、ハイスループットシーケンシング、大規模並列シグネチャーシーケンシング、エマルジョンＰＣＲ、より低い変性温度での共増幅－ＰＣＲ（ＣＯＬＤ－ＰＣＲ）、多重ＰＣＲ、可逆的ダイターミネーターによるシーケンシング、ペアードエンドシーケンシング、ニアターム（ｎｅａｒ－ｔｅｒｍ）シーケンシング、エキソヌクレアーゼシーケンシング、ライゲーションによるシーケンシング、ショートリードシーケンシング、単分子シーケンシング、合成によるシーケンシング、リアルタイムシーケンシング、リバース－ターミネーターシーケンシング、ナノポアシーケンシング、４５４シーケンシング、ＳｏｌｅｘａＧｅｎｏｍｅＡｎａｌｙｚｅｒシーケンシング、ＳＯＬｉＤ（商標）シーケンシング、ＭＳ－ＰＥＴシーケンシング、およびそれらの組合せが含まれるがこれらに限定されない。一部の実施形態では、シーケンシングは、遺伝子解析装置、例えば、多くの他のものの中で、Ｉｌｌｕｍｉｎａ，Ｉｎｃ．、ＰａｃｉｆｉｃＢｉｏｓｃｉｅｎｃｅｓ，Ｉｎｃ．またはＡｐｐｌｉｅｄＢｉｏｓｙｓｔｅｍｓ／ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃから市販されている遺伝子解析装置等によって実施され得る。

配列情報：本明細書で使用される場合、「配列情報」は、核酸分子の文脈において、その分子中のモノマー単位（例えば、ヌクレオチド等）の順序および／または正体を意味し、参照配列への核酸分子マッピングの開始ゲノム座標および終止ゲノム座標もまた含み得る。

体細胞変異：本明細書で使用される場合、用語「体細胞変異」または「体細胞バリエーション」は、互換的に使用される。これらは、受胎後に生じるゲノム中の変異を指す。体細胞変異は、胚細胞を除く身体の任意の細胞において生じ得、したがって、子孫には受け継がれない。

対象：本明細書で使用される場合、「対象」は、動物、例えば、哺乳動物種（例えば、ヒト）もしくはトリ（例えば、鳥類）種、または他の生物、例えば植物を指す。より具体的には、対象は、脊椎動物、例えば、哺乳動物、例えば、マウス、霊長類、サルまたはヒトであり得る。動物には、家畜（例えば、生産牛（ｐｒｏｄｕｃｔｉｏｎｃａｔｔｌｅ）、乳牛、家禽、ウマ、ブタ等）、スポーツ動物、およびコンパニオン動物（例えば、ペットまたは支援動物）が含まれる。対象は、健康な個体、疾患もしくはその疾患の素因を有するもしくは有することが疑われる個体、または治療を必要とするもしくは治療を必要とすることが疑われる個体であり得る。用語「個体」または「患者」は、「対象」と互換性がある意図である。

例えば、対象は、がんを有すると診断された個体、がん治療を受けることになっている個体、および／または少なくとも１つのがん治療を受けたことがある個体であり得る。対象は、がんの寛解状態にあり得る。別の例として、対象は、自己免疫疾患を有すると診断された個体であり得る。別の例として、対象は、疾患、例えば、がん、自己免疫疾患を有すると診断されていてもよいまたはそれを有することが疑われていてもよい、妊娠しているまたは妊娠する計画を立てている雌性個体であり得る。

詳細な説明
Ｉ．概観
ゲノム／エピジェネティック分配に基づく方法は、１つのアッセイでの多検体同時シグナル検出を可能にし得る。しかし、分配に基づく検体の検出されたシグナルは、低い分解能を有し得、シグナルの感度および特異度を変更させる可変性のアッセイ条件に供される。プロセスにおける無細胞核酸（元の材料）またはデータの喪失を低減させつつ、リキッドバイオプシーアッセイの感度を増加させることが望ましい。本明細書に記載されるように１つまたは複数の対照を使用することによってアッセイ可変性について対照を取ること（controlling）によって、異なる実験にわたって結果を比較する能力を提供することもまた望ましい。

本開示は、分配アッセイにおいてポリヌクレオチドを解析するための方法、組成物およびシステムを提供する。本発明は、担体核酸分子のセットを使用することを含む。一部の実施形態では、担体核酸分子の使用は、メチル化核酸分子に選択的に結合する捕捉剤への非メチル化核酸分子の非特異的結合を防止することによって、メチル化核酸分子の分配の特異性を増加させることができる。

核酸分子、例えば、無細胞ポリヌクレオチドは、メチル化等のエピジェネティック特徴に基づいて異なり得る。核酸は、異なるヌクレオチド配列、例えば、特異的遺伝子または遺伝子座を有し得る。特徴は、程度に関して異なり得る。例えば、ＤＮＡ分子は、エピジェネティック改変の程度が異なり得る。改変の程度は、分子が供されたいくつかの改変事象、例えば、メチル化基の数（メチル化の程度）または他のエピジェネティック変化の数を指し得る。例えば、ＤＮＡは、低メチル化または高メチル化され得る。

核酸分子の特徴は、様々な化学的改変（即ち、エピジェネティック改変）が含まれ得る改変であり得る。化学的改変の非限定的な例には、ＤＮＡメチル化を含む共有結合的ＤＮＡ改変が含まれ得るがこれらに限定されない。一部の実施形態では、ＤＮＡメチル化は、ＣｐＧ部位（シトシン－リン酸－グアニン部位（即ち、核酸配列の５’→３’方向でのシトシンとその後のグアニン））におけるシトシンへのメチル基の付加を含む。一部の実施形態では、ＤＮＡメチル化は、アデニンへのメチル基の付加、例えば、Ｎ^６－メチルアデニンを含む。一部の実施形態では、ＤＮＡメチル化は、５－メチル化（シトシンの６員環中の５位における炭素の改変）である。一部の実施形態では、５－メチル化は、５－メチルシトシン（ｍ５ｃ）を生成する、シトシンの５Ｃ位へのメチル基の付加を含む。一部の実施形態では、メチル化は、ｍ５ｃの誘導体を含む。ｍ５ｃの誘導体には、５－ヒドロキシメチルシトシン（５－ｈｍＣ）、５－ホルミルシトシン（５－ｆＣ）および５－カルボキシルシトシン（caryboxylcytosine）（５－ｃａＣ）が含まれるがこれらに限定されない。一部の実施形態では、ＤＮＡメチル化は、３Ｃメチル化（シトシンの６員環中の３位における炭素の改変）である。一部の実施形態では、３Ｃメチル化は、３－メチルシトシン（３ｍＣ）を生成する、シトシンの３Ｃ位へのメチル基の付加を含む。メチル化は、非ＣｐＧ部位においても生じ得、例えば、メチル化は、ＣｐＡ、ＣｐＴまたはＣｐＣ部位において生じ得る。ＤＮＡメチル化は、メチル化ＤＮＡ領域の活性を変化させることができる。例えば、プロモーター領域中のＤＮＡがメチル化されている場合、遺伝子の転写は抑制され得る。ＤＮＡメチル化は、正常な発生にとって重要であり、メチル化における異常は、エピジェネティック調節を破壊し得る。エピジェネティック調節における破壊、例えば抑制は、がん等の疾患を引き起こし得る。ＤＮＡにおけるプロモーターメチル化は、がんを示し得る。

ＣｐＧダイアドは、二本鎖ＤＮＡ分子のセンス鎖上のジヌクレオチドＣｐＧ（シトシン－リン酸－グアニン、即ち、核酸配列の５’→３’方向でのシトシンとその後のグアニン）と、アンチセンス鎖上のその相補的ＣｐＧとである。ＣｐＧダイアドは、完全にメチル化されているか半メチル化されている（一方の鎖のみがメチル化されている）かのいずれかであり得る。

ＣｐＧジヌクレオチドは、正常なヒトゲノムでは過小出現し、ＣｐＧジヌクレオチド配列の大多数は、転写的に不活性であり（例えば、染色体の動原体周囲部分中のおよび反復エレメント中のＤＮＡヘテロクロマチン領域）、メチル化されている。しかし、多くのＣｐＧアイランドは、特に転写開始部位（ＴＳＳ）周囲では、そのようなメチル化から保護される。

がんは、エピジェネティックバリエーション、例えばメチル化によって示され得る。がんにおけるメチル化変化の例には、正常な成長制御、ＤＮＡ修復、細胞周期調節および／または細胞分化に関与する遺伝子のＴＳＳにおける、ＣｐＧアイランドにおけるＤＮＡメチル化の局所的増加が含まれる。この高メチル化は、関与する遺伝子の転写能の異常な喪失に関連し得、変更された遺伝子発現の原因として点変異および欠失と少なくとも同頻度で生じる。ＤＮＡメチル化プロファイリングは、発生の間に変更されるか、または疾患、例えばがんもしくは任意のがん関連疾患により摂動を受けるゲノムの、異なる程度のメチル化（「示差的にメチル化された領域」または「ＤＭＲ」）を有する領域を検出するために使用され得る。

メチル化プロファイリングは、ゲノムの異なる領域にわたってメチル化パターンを決定することを含み得る。例えば、メチル化の程度（例えば、分子あたりのメチル化ヌクレオチドの相対的な数）およびシーケンシングに基づいて分子を分配した後、異なる画分中の分子の配列は、参照ゲノムにマッピングされ得る。これは、他の領域と比較してより高度にメチル化されたか、またはあまり高度にメチル化されていない、ゲノムの領域を示し得る。このように、ゲノム領域は、個々の分子とは対照的に、メチル化の程度が異なり得る。メチル化に加えて、他のエピジェネティック改変を同様にプロファイリングしてもよい。

試料中の核酸分子は、１つまたは複数の特徴に基づいて分画または分配され得る。試料中の核酸分子の分配は、まれなシグナルを増加させることができる。例えば、高メチル化ＤＮＡ中に存在するが、低メチル化ＤＮＡ中には存在が少ない（または存在しない）遺伝的バリエーションは、試料を高メチル化核酸分子および低メチル化核酸分子に分配することによってより容易に検出することができる。試料の複数の分画を解析することによって、単一の分子の多次元解析を実施することができ、したがって、より高い感度を達成することができる。分配は、ゲノム特徴の存在または非存在に基づいて核酸分子をサブセットまたは群に物理的に分配することを含み得る。分画は、ゲノム特徴、例えばエピジェネティック改変が存在する程度に基づいて核酸分子を画分群に物理的に分配することを含み得る。試料は、示差的遺伝子発現または疾患状態を示す特徴に基づいて、１つまたは複数の群画分に分画または分配され得る。試料は、核酸、例えば、無細胞ＤＮＡ（「ｃｆＤＮＡ」）、非ｃｆＤＮＡ、腫瘍ＤＮＡ、循環腫瘍ＤＮＡ（「ｃｔＤＮＡ」）および無細胞核酸（「ｃｆＮＡ」）の解析の間に正常状態と罹患状態との間でのシグナルにおける差異を提供する特徴またはそれらの組合せに基づいて分画され得る。

本開示は、腫瘍の存在または非存在を検出するために分配アッセイを使用してポリヌクレオチドを解析するための方法、組成物およびシステムを提供する。これらの方法は、担体核酸分子を対象から得られたポリヌクレオチド試料に添加するステップを含み得る。一部の実施形態では、担体核酸分子の使用は、メチル結合タンパク質を使用するポリヌクレオチドの分配を改善するのを助ける。メチル結合ドメインタンパク質は、非メチル化分子に対して低い親和性を有する。したがって、対象から得られたＤＮＡと共にインキュベートされると、メチル化シトシンを含まない分子が意図せずに捕捉され得る。これは、メチル化分子を非メチル化分子から効率的に分離する能力を低減させる。したがって、担体核酸分子をアッセイ中に含めることによって、担体核酸分子は、メチル結合タンパク質に結合し、ポリヌクレオチド試料由来の非メチル化分子は、メチル結合タンパク質に結合することができなくなり、こうしてメチル化分子の分配の特異性が改善される。一部の実施形態では、担体核酸分子は、次世代シーケンシングのための分子のライブラリ調製を改善する。

一部の実施形態では、担体核酸分子は、ポリヌクレオチド試料に添加され、分子のメチル化レベルに基づいて異なる分配されたセットに分配され、その後、各画分中の核酸分子がシーケンシング（単独でまたは一緒に）および解析される。一部の実施形態では、核酸の画分は、特異的標的ゲノム領域について富化される。一部の実施形態では、核酸分子の画分は、富化するステップの前および／または後に増幅される。一部の実施形態では、富化は、分配されたセットが、分子バーコードで示差的にタグ付けされ、示差的にタグ付けされた分配されたセットの混合物へと再度合わされた後に、実施され得る。これらの方法は、様々な適用、例えば、疾患の予後判定、診断において、および／またはそのモニタリングのために使用され得る。一部の実施形態では、疾患はがんである。

したがって、一態様では、本開示は、対象における腫瘍の存在または非存在を検出する方法であって、（ｉ）対象からポリヌクレオチド試料を得るステップ；（ｉｉ）担体核酸分子のセットをポリヌクレオチド試料に添加して、第１の試料を生成するステップであって、担体核酸分子のセットが、（ａ）非メチル化担体核酸分子の少なくとも１つのサブセット；および／または（ｂ）メチル化担体核酸分子の少なくとも１つのサブセットを含み、非メチル化担体核酸分子が、メチル化ヌクレオチドを含まず、メチル化担体核酸分子が、１つまたは複数のメチル化ヌクレオチドを含む、ステップ；（ｉｉｉ）第１の試料を、メチル化ポリヌクレオチドに選択的に結合する捕捉剤を使用して、少なくとも２つの分配されたセットに分配し、それにより、分配された試料を生成するステップ；（ｉｖ）分配された試料の少なくとも一部を処理して、処理された試料を生成するステップであって、この処理は、以下：（ａ）タグ付けするステップ、（ｂ）増幅するステップ、および（ｃ）目的の特異的領域についてＤＮＡ分子を富化するステップのうち少なくとも１つを含む、ステップ；（ｖ）処理された試料の少なくとも一部をシーケンシングして、シーケンシングリードのセットを生成するステップ；および（ｖｉ）シーケンシングリードのセットの少なくとも一部を解析して、腫瘍の存在または非存在を検出するステップを含む方法を提供する。

別の態様では、本開示は、対象における腫瘍の存在または非存在を検出する方法であって、（ｉ）対象からポリヌクレオチド試料を得るステップ；（ｉｉ）担体核酸分子のセットをポリヌクレオチド試料に添加して、第１の試料を生成するステップであって、担体核酸分子のセットが、（ａ）非メチル化担体核酸分子の少なくとも１つのサブセット；および／または（ｂ）メチル化担体核酸分子の少なくとも１つのサブセットを含み、担体核酸分子の少なくとも一方の末端が、ライゲーションを防止するように改変され、非メチル化担体核酸分子が、メチル化ヌクレオチドを含まず、メチル化担体核酸分子が、１つまたは複数のメチル化ヌクレオチドを含む、ステップ；（ｉｉｉ）第１の試料を、メチル化ポリヌクレオチドに選択的に結合する捕捉剤を使用して、少なくとも２つの分配されたセットに分配し、それにより、分配された試料を生成するステップ；（ｉｖ）分配された試料の少なくとも一部を処理して、処理された試料を生成するステップであって、この処理は、以下：（ａ）タグ付けするステップ、（ｂ）増幅するステップ、および（ｃ）目的の特異的領域についてＤＮＡ分子を富化するステップのうち少なくとも１つを含む、ステップ；（ｖ）処理された試料の少なくとも一部をシーケンシングして、シーケンシングリードのセットを生成するステップ；および（ｖｉ）シーケンシングリードのセットの少なくとも一部を解析して、腫瘍の存在または非存在を検出するステップを含む方法を提供する。

図１は、対象における腫瘍の存在または非存在を検出するための方法１００の例示的な実施形態を示す。１０２では、対象由来のポリヌクレオチド試料が得られる。一部の実施形態では、ポリヌクレオチド試料は、対象の組織、血液、血漿、血清、尿、唾液、糞便、脳脊髄液、頬内スワブまたは胸腔穿刺から得られる。一部の実施形態では、ポリヌクレオチド試料は、組織から得られる。一部の実施形態では、組織から得られたポリヌクレオチド試料は、酵素的手段／方法または機械的手段／方法のいずれかによって断片化される。一部の実施形態では、フラグメンターゼ（ｆｒａｇｍｅｎｔａｓｅ）酵素が、組織から得られたＤＮＡを断片化するために使用され得る。一部の実施形態では、ポリヌクレオチド試料は、血液から得られる。一部の実施形態では、血液から得られたポリヌクレオチド試料は、無細胞ＤＮＡ試料である。一部の実施形態では、ポリヌクレオチド試料は、無細胞ＤＮＡ試料である。

１０４では、担体核酸分子のセットがポリヌクレオチド試料に添加されて、第１の試料が生成される。一部の実施形態では、担体核酸分子のセットは、非メチル化担体核酸分子の少なくとも１つのサブセットおよび／またはメチル化担体核酸分子の少なくとも１つのサブセットを含み、非メチル化担体核酸分子は、メチル化ヌクレオチドを含まず、メチル化担体核酸分子は、１つまたは複数のメチル化ヌクレオチドを含む。一部の実施形態では、担体核酸分子の少なくとも一方の末端は、ライゲーションを防止するように改変される。一部の実施形態では、担体核酸分子の少なくとも一方の末端は、Ｃ３（プロピル基）スペーサーを含む。一部の実施形態では、担体核酸分子の少なくとも一方の末端は、ジデオキシヌクレオチドを含む。一部の実施形態では、担体核酸分子の少なくとも一方の末端は、ヒドロキシル基が求核試薬として作用することを阻止する任意の化学的改変を含む。一部の実施形態では、担体核酸分子の５’末端は、以下の改変：（ｉ）反転（５’－５’）－ジデオキシチミン、ジデオキシシトシン、ジデオキシグアニンまたはジデオキシアデニン；（ｉｉ）プロピル基、または（ｉｉｉ）例えば、ベンジル、エチルもしくはメチルであるがこれらに限定されない他の有機官能基のうち少なくとも１つを含む。一部の実施形態では、担体核酸分子の３’末端は、以下の改変：（ｉ）酵素的に、または合成の間に付加され得る任意のジデオキシ塩基、例えば、ジデオキシチミン、ジデオキシシトシン、ジデオキシグアニンまたはジデオキシアデニン；（ｉｉ）プロピル基、または（ｉｉｉ）例えば、ベンジル、エチルもしくはメチルであるがこれらに限定されない他の有機官能基のうち少なくとも１つを含む。

一部の実施形態では、１つまたは複数のメチル化ヌクレオチドは、以下：（ｉ）５－メチルシトシン、（ｉｉ）６－メチルアデニン、（ｉｉｉ）ヒドロキシメチルシトシン、（ｉｖ）メチルウラシル、または（ｖ）任意の他のメチル化ヌクレオチドのうち少なくとも１つである。一部の実施形態では、メチル化担体核酸分子は、１、２、３、４、５、６、７、８、９、１０、１２、１４、１５、１６、１７、１８、１９または少なくとも２０個のメチル化ヌクレオチドを有し得る。一部の実施形態では、担体核酸分子は、長さが２５ｂｐと３２５ｂｐとの間であり得る。一部の実施形態では、１つのサブセットの非メチル化担体核酸分子は、別のサブセットの非メチル化担体核酸分子と同じ配列を有し得る。一部の実施形態では、１つのサブセットのメチル化担体核酸分子は、別のサブセットのメチル化担体核酸分子と同じ配列を有し得る。一部の実施形態では、１つのサブセット中の非メチル化担体核酸分子の配列は、他のサブセット（複数可）中の非メチル化担体核酸分子の配列とは異なる。一部の実施形態では、１つのサブセット中のメチル化担体核酸分子の配列は、他のサブセット（複数可）中のメチル化担体核酸分子の配列とは異なる。

一部の実施形態では、非メチル化担体核酸分子および／またはメチル化担体核酸分子の１つまたは複数のサブセットは、ヌクレオチド配列中に１つまたは複数のＣｐＧジヌクレオチドを有し得る。一部の実施形態では、メチル化担体核酸分子中の１つまたは複数のＣｐＧジヌクレオチドは、１つまたは複数のメチル化シトシンを有し得る。

一部の実施形態では、非メチル化担体核酸分子の１つのサブセット中の１つまたは複数のＣｐＧジヌクレオチドの位置は、他のサブセット（複数可）中の１つまたは複数のＣｐＧジヌクレオチドの位置とは異なる。一部の実施形態では、非メチル化担体核酸分子の１つのサブセット中のＣｐＧジヌクレオチドの数は、他のサブセット（複数可）中のＣｐＧジヌクレオチドの数とは異なる。一部の実施形態では、非メチル化担体核酸分子の１つのサブセット中の１つまたは複数のＣｐＧジヌクレオチドに隣接するヌクレオチドの配列は、他のサブセット（複数可）中の１つまたは複数のＣｐＧジヌクレオチドに隣接するヌクレオチドの配列とは異なる。一部の実施形態では、非メチル化担体核酸分子の１つのサブセット中の非メチル化担体核酸分子の長さは、他のサブセット（複数可）中の非メチル化担体核酸分子の長さとは異なる。

一部の実施形態では、メチル化担体核酸分子の１つのサブセット中の１つまたは複数のメチル化ヌクレオチドの位置（即ち、分子の末端に対する）は、他のサブセット（複数可）中の１つまたは複数のメチル化ヌクレオチドの位置とは異なる。一部の実施形態では、メチル化担体核酸分子の１つのサブセット中のメチル化ヌクレオチドの数は、他のサブセット（複数可）中のメチル化ヌクレオチドの数とは異なる。一部の実施形態では、非メチル化担体核酸分子の１つのサブセット中の１つまたは複数のメチル化ヌクレオチドに隣接するヌクレオチドの配列は、他のサブセット（複数可）中の１つまたは複数のメチル化ヌクレオチドに隣接するヌクレオチドの配列とは異なる。一部の実施形態では、メチル化担体核酸分子の１つのサブセット中のメチル化担体核酸分子の長さは、他のサブセット（複数可）中のメチル化担体核酸分子の長さとは異なる。一部の実施形態では、担体核酸分子は、ウラシルヌクレオシドを含む。これらの実施形態では、この方法は、増幅ステップの前に、ウラシルデグリコシラーゼおよびＤＮＡグリコシラーゼ－リアーゼ（例えば、エンドヌクレアーゼＶＩＩＩ）を添加するステップをさらに含む。

一部の実施形態では、メチル化担体核酸分子の、非メチル化担体核酸分子に対する量は、約０：１、０．１：９９．９、０．５：９９．５、０．７５：９９．２５、１：９９、１：９５、１：９０、１：８０、１：７５、１：７０、１：６０、１：５０、１：４０、１：３０、１：２５、１：２０、１：１０、１：５、１：２、１：１．１５、１：１、１．１５：１、２：１、５：１、１０：１、２０：１、２５：１、３０：１、４０：１、５０：１、６０：１、７０：１、７５：１、８０：１、９０：１、９５：１、９９：１、９９．２５：０．７５、９９．５：０．５、９９．９：０．１または１：０の比である。一部の実施形態では、ポリヌクレオチド試料の、担体核酸分子のセットに対する量は、約１：０．１；１：０．２、１：０．３、１：４、１：０．５、１：６、１：７、１：８、１：０．９、１：１、１：１、１：２、１：３、１：４、１：５、１：６、１：７、１：８、１：９、１：１０の比、１：２０、１：３０、１：４０、１：５０、１：６０、１：７０、１：８０、１：９０、１：１００、１：２００、１：３００；１：４００、１：５００、１：６００、１：７００、１：８００、１：９００、１：１０００、１：５０００、１：１０，０００、１：１００，０００、１：５００，０００、１：１０^６、１：１０^７、１：１０^８または１：１０^９である。一部の実施形態では、量は、質量を単位とする。一部の実施形態では、量は、モル濃度を単位とする。一部の実施形態では、ポリヌクレオチド試料は、最大１μｇである。一部の実施形態では、ポリヌクレオチド試料は、最大２００ｎｇである。一部の実施形態では、ポリヌクレオチド試料は、最大１５０ｎｇである。一部の実施形態では、ポリヌクレオチド試料は、最大１００ｎｇである。一部の実施形態では、担体核酸分子のセットは、ポリヌクレオチド試料と担体核酸分子のセットとの総量が約１７５ｎｇ、２００ｎｇ、２２５ｎｇ、２５０ｎｇ、２７５ｎｇ、３００ｎｇ、３５０ｎｇ、４００ｎｇ、４５０ｎｇ、５００ｎｇ、６００ｎｇ、７００ｎｇ、７５０ｎｇ、８００ｎｇ、９００ｎｇ、１μｇ、１．１μｇ、１．２５μｇまたは１．５μｇになるように十分な量で添加される。

一部の実施形態では、担体核酸分子の配列は、以下：（ｉ）ウイルスゲノム由来の配列、（ｉｉ）細菌ゲノム由来の配列、（ｉｉｉ）ラムダゲノム由来の配列、または（ｉｖ）非ヒトゲノム由来の配列のうち１つから選択される。一部の実施形態では、担体核酸分子は、合成ＤＮＡである。一部の実施形態では、担体核酸分子は、ウラシルヌクレオシドを含む。一部の実施形態では、担体ＤＮＡ分子は、ＰＣＲによって生成され得る。一部の実施形態では、ＰＣＲによって生成された担体核酸分子は、担体核酸分子中の１つまたは複数のヌクレオチドにメチル基を組み込むために、メチルトランスフェラーゼによる処置によってさらに改変され得る。一部の実施形態では、担体核酸分子は、アダプターへの担体核酸分子のライゲーションを防止するように改変ヌクレオシドを組み込むために、ポリメラーゼで末端標識され得る。一部の実施形態では、担体核酸分子は、天然に存在しないヌクレオシド誘導体を含む。一部の実施形態では、担体核酸分子は、ビオチンまたはフルオロフォアで標識され得る。

１０６では、第１の試料の少なくとも一部は、メチル化ポリヌクレオチドに選択的に結合する捕捉剤を使用して、少なくとも２つの分配されたセットに分配または分画され、それにより、分配された試料を生成する。一部の実施形態では、分配は、結合剤への核酸分子の示差的結合親和性に基づく。結合剤の例には、メチル結合ドメイン（ＭＢＤ）およびメチル結合タンパク質（ＭＢＰ）が含まれるがこれらに限定されない。本明細書で企図されるＭＢＰの例には、以下が含まれるがこれらに限定されない：
（ａ）ＭｅＣＰ２は、未改変のシトシンよりも５－メチル－シトシンに優先的に結合するタンパク質である；
（ｂ）ＲＰＬ２６、ＰＲＰ８およびＤＮＡミスマッチ修復タンパク質ＭＨＳ６は、未改変のシトシンよりも５－ヒドロキシメチル－シトシンに優先的に結合する；
（ｃ）ＦＯＸＫ１、ＦＯＸＫ２、ＦＯＸＰ１、ＦＯＸＰ４およびＦＯＸＩ３は、未改変のシトシンよりも５－ホルミル－シトシンに好適に結合する（Iurlaro et al., Genome Biol. 14, R119 (2013)）；および
（ｄ）１つまたは複数のメチル化ヌクレオチド塩基に対して特異的な抗体。

一部の親和性剤および改変に関して、作用剤への結合は、核酸が改変（例えば、メチル化）を有するか否かに応じて本質的に全か無かの様式で起こり得るが、分離は程度の問題であり得る。そのような実施形態では、改変で過剰出現する核酸は、改変で過少出現する核酸より大きい程度に作用剤に結合する。あるいは、改変を有する核酸は、全か無かの様式で結合し得る。しかし、様々なレベルの改変が結合剤から逐次的に溶出され得る。

例えば、一部の実施形態では、分配は、バイナリであるか、またはメチル化の程度／レベルに基づき得る。例えばすべてのメチル化分子は、メチル結合ドメインタンパク質（例えば、ＭｅｔｈｙｌＭｉｎｅｒメチル化ＤＮＡ富化キット（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ））を使用して非メチル化分子から分配することができる。次いで、追加の分配は、メチル結合ドメインおよび結合した断片を含む溶液中の塩濃度を調節することによって、異なるレベルのメチル化を有する断片を溶出するステップを伴い得る。塩濃度が増加すると、より大きいメチル化レベルを有する分子が溶出される。

一部の実施形態では、分配は、メチル化ヌクレオチドを含む核酸分子に優先的に結合する結合剤への核酸分子の示差的結合親和性に基づいて核酸分子を分配するステップを含む。

一部の実施形態では、分配されたセットは、異なる程度の改変（改変の過剰出現または過少出現）を有する核酸の代表である。過剰出現および過少出現は、集団における分子あたりのメチル化ヌクレオチドの数の中央値と比較した、核酸が有するメチル化ヌクレオチドの数によって定義することができる。例えば、試料中の核酸分子中の５－メチルシトシンヌクレオチドの数の中央値が２である場合、２つよりも多くの５－メチルシトシン残基を含む核酸分子はこの改変では過剰出現され、１またはゼロ個の５－メチルシトシン残基を有する核酸は過少出現される。親和性分離の効果は、結合相で改変において過剰出現される核酸および非結合相（すなわち、溶液中）で改変において過少出現される核酸を分配することである。結合相における核酸は、その後の処理の前に溶出させることができる。

ＭｅｔｈｙｌＭｉｎｅｒメチル化ＤＮＡ富化キット（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ）を使用する場合、様々なレベルのメチル化を、逐次的溶出を使用して分配することができる。例えば、低メチル化画分（メチル化なし）を、核酸集団に、磁気ビーズに結合したキットからのＭＢＤを接触させることによってメチル化画分から分離することができる。ビーズを使用して、非メチル化核酸からメチル化核酸を分離する。次いで、１つまたは複数の溶出ステップを逐次的に実施して、異なるレベルのメチル化を有する核酸を溶出する。例えば、メチル化核酸の第１のセットを、約１５０ｍＭもしくは約１６０ｍＭまたはそれよりも高い塩濃度、例えば、少なくとも１５０ｍＭ、２００ｍＭ、３００ｍＭ、４００ｍＭ、５００ｍＭ、６００ｍＭ、７００ｍＭ、８００ｍＭ、９００ｍＭ、１０００ｍＭまたは２０００ｍＭで溶出することができる。そのようなメチル化核酸を溶出後、磁気分離を再度使用して、高レベルのメチル化核酸を低レベルのメチル化を有する核酸から分離する。溶出および磁気分離ステップを繰り返して、低メチル化画分（メチル化なしの代表）、中等度メチル化画分（低レベルのメチル化の代表）、および高メチル化画分（高レベルのメチル化の代表）等の様々な画分を作製することができる。

一部の方法では、親和性分離のために使用した作用剤に結合した核酸を、洗浄ステップに供する。洗浄ステップは、親和性剤に弱く結合した核酸を洗い流す。そのような核酸を、平均値または中央値に近い程度まで改変を有する核酸（すなわち、固相に結合したままである核酸と、試料に作用剤を最初に接触させた場合に固相に結合しない核酸との間の中等度）において富化することができる。親和性分離は、異なる程度の改変を有する核酸の少なくとも２つ、時に３つまたはそれよりも多くの画分をもたらす。核酸分子の分配は、分配された核酸分子のシーケンシングによってまたはデジタル液滴ＰＣＲ（ｄｄＰＣＲ）によってまたは定量的ＰＣＲ（ｑＰＣＲ）によって解析することができる。一部の実施形態では、分配するステップの前に担体核酸分子を添加する代わりに、担体核酸分子は、洗浄ステップの間（即ち、中等度の分配されたセットを収集している間）または溶出ステップの間（即ち、高度に分配されたセットを収集している間）のいずれかに添加することができる。

１０８では、分配された試料の少なくとも一部が処理されて、処理された試料が生成される。処理するステップは、タグ付けするステップ；増幅するステップおよび／または目的の特異的領域について分子を富化するステップを含む。一部の実施形態では、増幅の前に、少なくとも２つの分配されたセットの各々は、示差的にタグ付けされる。次いで、タグ付けされた分配されたセットは、増幅の前に共にプールされる。分配されたセットの示差的タグ付けは、特定の分配されたセットに属する核酸分子の追跡を助ける。タグは通常、アダプターの成分として提供される。異なる分配されたセット中の核酸分子は、１つの分配されたセットのメンバーを別の分配されたセットのメンバーから区別することができる異なるタグを受ける。同じ画分セットの核酸分子に連結されたタグは、互いに同じまたは異なり得る。しかし、互いに異なる場合、タグは、それらが結合される分子を、特定の分配されたセットのものであると同定するために、それらの配列の一部を共通して有し得る。例えば、第１の試料の分子が２つの分配されたセット－Ｐ１およびＰ２－に分配される場合、Ｐ１中の分子は、Ａ１、Ａ２、Ａ３等でタグ付けされ得、Ｐ２中の分子は、Ｂ１、Ｂ２、Ｂ３等でタグ付けされ得る。そのようなタグ付けシステムは、分配されたセットの区別および分配されたセット内の分子間の区別を可能にする。一部の実施形態では、タグ（即ち、分子バーコード）は、アダプターの一部であり、アダプターは、ユニバーサルプライマー結合部位を含む。タグを含むアダプターは、ライゲーションを介して結合される。一部の実施形態では、担体核酸分子の末端は、ライゲーションを防止するように改変される。これらの実施形態では、アダプター（これは、タグ、即ち、分子バーコードを含む）は、担体核酸分子には結合されない。したがって、担体核酸分子は、ユニバーサルプライマーを使用して増幅することができない。タグ付けの後、これらの分子は、アダプター（分子にライゲーションされている）中に存在するプライマー結合領域に結合するプライマーを使用して増幅される。この増幅では、対象から得られたポリヌクレオチドのみが増幅され、担体核酸分子は増幅されない。増幅の後、分子は、目的の特異的領域について富化される。

１１０では、処理された試料の少なくとも一部がシーケンシングされて、シーケンシングリードのセットが生成される。一部の実施形態では、少なくとも２つの分配されたセット由来の処理された試料の少なくとも一部がシーケンシングされて、シーケンシングリードのセットが生成される。得られた配列情報は、核酸分子およびポリヌクレオチドに結合されたタグ（即ち、分子バーコード）の配列を含む。ポリヌクレオチドに結合されたタグ（即ち、分子バーコード）の配列から、タグ（即ち、分子バーコード）を、ポリヌクレオチドの分配されたセットと相関させることができる。配列情報は、ポリヌクレオチド（対象から得られた）およびその対応する分配されたセットを同定するために使用される。１１２では、シーケンシングリードのセットの少なくとも一部が、腫瘍の存在または非存在を検出するために解析される。一部の実施形態では、解析ステップは、分子のメチル化状態を決定するステップを含む。例えば、目的の特異的領域は、健康な個体ではメチル化されておらず、悪性腫瘍を有する個体ではメチル化されていることが、以前に決定されている。解析ステップは、分子が目的のこれらの領域においてメチル化されているか否かを決定するステップを含む。これは、分子、および分子が分配される分配されたセット中のＣｐＧ残基の数に基づいて決定され、これは次いで、腫瘍の存在または非存在を検出するために使用される。

ＩＩ．担体核酸分子
担体核酸分子は、分配アッセイにおいてポリヌクレオチドを解析する際に使用される。一部の実施形態では、担体核酸分子の使用は、メチル結合タンパク質を使用するメチル化ポリヌクレオチドの分配の特異性の増加を助ける。メチル結合ドメインタンパク質は、非メチル化分子に対して低い親和性を有する。したがって、対象から得られたＤＮＡと共にインキュベートされると、メチル化シトシンを含まない分子が意図せずに捕捉され得る。この不完全な特異性は、メチル化分子を非メチル化分子から効率的に分離する能力を低減させる。したがって、担体核酸分子をアッセイ中に含めることによって、担体核酸分子は、メチル結合タンパク質に結合し得、ポリヌクレオチド試料由来の非メチル化分子は、メチル結合タンパク質に結合することができなくなり、こうしてメチル化分子の分配の特異性が改善される。同様に、担体核酸分子は、他のメチル化核酸特異的結合試薬、例えば、抗体、抗体誘導体分子等の分配特異性を改善するために使用され得る。一部の実施形態では、担体核酸分子は、次世代シーケンシングのための分子のライブラリ調製を改善する。

一部の実施形態では、担体核酸分子は、天然に存在する核酸配列を有し得る。一部の実施形態では、担体核酸分子は、天然に存在しない核酸配列を有し得る。一部の実施形態では、担体核酸分子は、合成オリゴヌクレオチドであり得る。一部の実施形態では、担体核酸分子は、非ヒトゲノムに対応する核酸配列を有し得る。例えば、これらの分子は、（ｉ）ラムダファージＤＮＡもしくはヒトゲノムの領域に対応する配列、（ｉｉ）ウイルスゲノムもしくは細菌ゲノムの領域に対応する配列、（ｉｉｉ）天然に存在しない配列、および／または（ｉｖ）上記のいずれかの組合せのいずれかを有し得る。一部の実施形態では、担体ＤＮＡ分子は、ＰＣＲによって生成され得る。一部の実施形態では、ＰＣＲによって生成された担体核酸分子は、担体核酸分子中の１つまたは複数のヌクレオチドにメチル基を組み込むために、メチルトランスフェラーゼによる処置によってさらに改変され得る。一部の実施形態では、担体核酸分子は、アダプターへの担体核酸分子のライゲーションを防止するように改変ヌクレオシドを組み込むために、ポリメラーゼで末端標識され得る。一部の実施形態では、担体核酸分子は、天然に存在しないヌクレオシド誘導体を含む。一部の実施形態では、担体核酸分子は、ビオチンまたはフルオロフォアで標識され得る。

別の態様では、本開示は、（ｉ）非メチル化担体核酸分子の少なくとも１つのサブセット；および／または（ｉｉ）メチル化担体核酸分子の少なくとも１つのサブセットを含む担体核酸分子のセットであって、非メチル化担体核酸分子が、メチル化ヌクレオチドを含まず、メチル化担体核酸分子が、１つまたは複数のメチル化ヌクレオチドを含む、担体核酸分子のセットを提供する。一部の実施形態では、担体核酸分子の少なくとも一方の末端は、ライゲーションを防止するように改変される。

別の態様では、本開示は、（ｉ）非メチル化担体核酸分子の少なくとも１つのサブセット；および／または（ｉｉ）メチル化担体核酸分子の少なくとも１つのサブセットを含む担体核酸分子のセットであって、非メチル化担体核酸分子の少なくとも１つのサブセットが、メチル化ヌクレオチドを含まず、メチル化担体核酸分子の少なくとも１つのサブセットが、メチル化ヌクレオチドを含み、担体核酸分子の少なくとも一方の末端が、ライゲーションを防止するように改変される、担体核酸分子のセットを提供する。

一部の実施形態では、担体核酸分子の少なくとも一方の末端は、Ｃ３（プロピル基）スペーサーを含む。一部の実施形態では、担体核酸分子の少なくとも一方の末端は、ジデオキシヌクレオチドを含む。一部の実施形態では、担体核酸分子の少なくとも一方の末端は、ヒドロキシル基が求核試薬として作用することを阻止する任意の化学的改変を含む。一部の実施形態では、担体核酸分子の５’末端は、以下の改変：（ｉ）反転（５’－５’）－ジデオキシチミン、ジデオキシシトシン、ジデオキシグアニンまたはジデオキシアデニン；（ｉｉ）プロピル基、または（ｉｉｉ）例えば、ベンジル、エチルもしくはメチルであるがこれらに限定されない他の有機官能基のうち少なくとも１つを含む。一部の実施形態では、担体核酸分子の３’末端は、以下の改変：（ｉ）酵素的に、または合成の間に付加され得る任意のジデオキシ塩基、例えば、ジデオキシチミン、ジデオキシシトシン、ジデオキシグアニンまたはジデオキシアデニン；（ｉｉ）プロピル基、または（ｉｉｉ）例えば、ベンジル、エチルもしくはメチルであるがこれらに限定されない他の有機官能基のうち少なくとも１つを含む。

一部の実施形態では、メチル化担体核酸分子の１つのサブセット中の１つまたは複数のメチル化ヌクレオチドの位置は、他のサブセット（複数可）中の１つまたは複数のメチル化ヌクレオチドの位置とは異なる。一部の実施形態では、メチル化担体核酸分子の１つのサブセット中のメチル化ヌクレオチドの数は、他のサブセット（複数可）中のメチル化ヌクレオチドの数とは異なる。一部の実施形態では、非メチル化担体核酸分子の１つのサブセット中の１つまたは複数のメチル化ヌクレオチドに隣接するヌクレオチドの配列は、他のサブセット（複数可）中の１つまたは複数のメチル化ヌクレオチドに隣接するヌクレオチドの配列とは異なる。一部の実施形態では、メチル化担体核酸分子の１つのサブセット中のメチル化担体核酸分子の長さは、他のサブセット（複数可）中のメチル化担体核酸分子の長さとは異なる。

一部の実施形態では、メチル化担体核酸分子の、非メチル化担体核酸分子に対する量は、約０：１、０．１：９９．９、０．５：９９．５、０．７５：９９．２５、１：９９、１：９５、１：９０、１：８０、１：７５、１：７０、１：６０、１：５０、１：４０、１：３０、１：２５、１：２０、１：１０、１：５、１：２、１：１．１５、１：１、１．１５：１、２：１、５：１、１０：１、２０：１、２５：１、３０：１、４０：１、５０：１、６０：１、７０：１、７５：１、８０：１、９０：１、９５：１、９９：１、９９．２５：０．７５、９９．５：０．５、９９．９：０．１または１：０の比である。一部の実施形態では、量は、質量を単位とする。一部の実施形態では、量は、モル濃度を単位とする。一部の実施形態では、担体核酸分子は、ウラシルヌクレオシドを含む。

図２は、本開示の一実施形態に従う担体核酸分子の概略図である。図２中の担体核酸分子は、二本鎖ＤＮＡ分子である。二本鎖ＤＮＡ配列中の「－－－」領域は、任意のＤＮＡ配列を示す。Ｒ_１およびＲ_３は、担体核酸分子のライゲーションを防止する、担体核酸分子の５’末端における改変を示す。Ｒ_２およびＲ_４は、担体核酸分子のライゲーションを防止する、担体核酸分子の３’末端における改変を示す。一部の実施形態では、担体核酸分子の末端は、Ｃ３（プロピル基）スペーサーを含む。一部の実施形態では、担体核酸分子の末端は、ジデオキシヌクレオチドまたは反転ジデオキシヌクレオチドを含む。一部の実施形態では、担体核酸分子の５’末端は、反転ジデオキシヌクレオチドを含む。一部の実施形態では、担体核酸分子の３’末端は、ジデオキシヌクレオチドを含む。一部の実施形態では、担体核酸分子の末端は、ヒドロキシル基が求核試薬として作用することを阻止する任意の化学的改変を含む。一部の実施形態では、担体核酸分子の５’末端は、以下の改変：（ｉ）反転（５’－５’）－ジデオキシチミン、ジデオキシシトシン、ジデオキシグアニンまたはジデオキシアデニン；（ｉｉ）プロピル基、または（ｉｉｉ）例えば、ベンジル、エチルもしくはメチルであるがこれらに限定されない他の有機官能基のうち少なくとも１つを含む。一部の実施形態では、担体核酸分子の３’末端は、以下の改変：（ｉ）酵素的に、または合成の間に付加され得る任意のジデオキシ塩基、例えば、ジデオキシチミン、ジデオキシシトシン、ジデオキシグアニンまたはジデオキシアデニン；（ｉｉ）プロピル基、または（ｉｉｉ）例えば、ベンジル、エチルもしくはメチルであるがこれらに限定されない他の有機官能基のうち少なくとも１つを含む。一部の実施形態では、担体核酸分子のＤＮＡ配列は、１つまたは複数のＣｐＧジヌクレオチドを含む。一部の実施形態では、担体核酸分子は、１つまたは複数のメチル化ヌクレオチドを含む。

図３Ａは、本開示の一実施形態に従う担体核酸分子のセットの概略図である。この実施形態では、担体核酸分子は、二本鎖ＤＮＡ分子であり、担体ＤＮＡ分子と呼ばれる。また、この実施形態では、担体ＤＮＡ分子の末端は、ライゲーションを防止するように改変される。他の実施形態では、担体ＤＮＡ分子の末端は、ライゲーションを防止するように改変される必要はない。例示を目的として、すべてのサブセットについて、単一の担体ＤＮＡ分子の一方の鎖のみが図中に示される。図３Ａでは、担体ＤＮＡ分子中の「－－－」領域は、ＣｐＧとは別の任意の他の配列を示し、Ｍは５－メチルシトシンを示し、Ｃはシトシンを示し、Ｇはグアニンを示す。この実施形態では、担体ＤＮＡ分子は、非メチル化担体ＤＮＡ分子の１つのサブセット（サブセット１）およびメチル化担体ＤＮＡ分子の１つのサブセット（サブセットＡ）を有する。この実施形態では、サブセット１およびサブセットＡの両方中の担体ＤＮＡ分子の配列は、同じである。サブセット１およびサブセットＡの担体ＤＮＡ分子は共に、３つのＣｐＧジヌクレオチドを有する。この実施形態、サブセットＡでは、３つすべてのＣｐＧジヌクレオチド中のシトシンがメチル化されている（したがって、図３Ａ中でＭＧと示される）。一部の実施形態では、担体ＤＮＡ分子は、２５ｂｐと３２５ｂｐとの間の任意の長さのものであり得る。一部の実施形態では、担体ＤＮＡ分子は、少なくとも５０ｂｐ、少なくとも６０ｂｐ、少なくとも８０ｂｐ、少なくとも１００ｂｐ、少なくとも１２０ｂｐ、少なくとも１５０ｂｐ、少なくとも２００ｂｐ、少なくとも２５０ｂｐまたは少なくとも３００ｂｐであり得る。

図３Ｂは、本開示の一実施形態に従う担体核酸分子のセットの概略図である。この実施形態では、担体核酸分子は、二本鎖ＤＮＡ分子であり、担体ＤＮＡ分子と呼ばれる。また、この実施形態では、担体ＤＮＡ分子の末端は、ライゲーションを防止するように改変される。他の実施形態では、担体ＤＮＡ分子の末端は、ライゲーションを防止するように改変される必要はない。例示を目的として、すべてのサブセットについて、単一の担体ＤＮＡ分子の一方の鎖のみが図中に示される。図３Ｂでは、担体ＤＮＡ分子中の「－－－」領域は、ＣｐＧとは別の任意の他の配列を示し、Ｍは５－メチルシトシンを示し、Ｃはシトシンを示し、Ｇはグアニンを示す。この実施形態では、担体ＤＮＡ分子は、非メチル化担体ＤＮＡ分子の２つのサブセット（サブセット１および２）およびメチル化担体ＤＮＡ分子の２つのサブセット（サブセットＡおよびＢ）を有する。この実施形態では、各サブセット（サブセット１、２、ＡおよびＢ）は、異なるヌクレオチド配列を有し、各サブセットは、異なる数のＣｐＧジヌクレオチドを有する。即ち、サブセット１は、２つのＣｐＧジヌクレオチドを有し、サブセット２は、４つのＣｐＧジヌクレオチドを有し、サブセットＡは、３つのＣｐＧジヌクレオチドを有し、サブセットＢは、５つのＣｐＧジヌクレオチドを有する。この実施形態では、メチル化担体ＤＮＡ分子中のＣｐＧジヌクレオチドのすべてのシトシンがメチル化されている（したがって、図３Ｂ中でＭＧと示される）。他の実施形態では、メチル化担体ＤＮＡ分子中のＣｐＧジヌクレオチドのすべてのシトシンがメチル化される必要はない（例えば、図４を参照されたい）。一部の実施形態では、担体ＤＮＡ分子は、２５ｂｐと３２５ｂｐとの間の任意の長さのものであり得る。一部の実施形態では、担体ＤＮＡ分子は、少なくとも５０ｂｐ、少なくとも６０ｂｐ、少なくとも８０ｂｐ、少なくとも１００ｂｐ、少なくとも１２０ｂｐ、少なくとも１５０ｂｐ、少なくとも２００ｂｐ、少なくとも２５０ｂｐまたは少なくとも３００ｂｐであり得る。

図４は、本開示の一実施形態に従う担体核酸分子のセットの概略図である。この実施形態では、担体核酸分子は、二本鎖ＤＮＡ分子であり、担体ＤＮＡ分子と呼ばれる。また、この実施形態では、担体ＤＮＡ分子の末端は、ライゲーションを防止するように改変される。他の実施形態では、担体ＤＮＡ分子の末端は、ライゲーションを防止するように改変される必要はない。この実施形態では、本明細書に記載される担体ＤＮＡ分子は、核酸分子の分配の間のＣｐＧジヌクレオチド中のメチル化シトシンのメチル化効果を考慮に入れてもよい。例示を目的として、すべてのサブセットについて、単一の担体ＤＮＡ分子の一方の鎖のみが図中に示される。図４では、担体ＤＮＡ分子中の「－－－」領域は、ＣｐＧとは別の任意の他の配列を示し、Ｍは５－メチルシトシンを示し、Ｃはシトシンを示し、Ｇはグアニンを示す。この実施形態では、担体ＤＮＡ分子は、非メチル化担体ＤＮＡ分子の１つのサブセット（サブセット１）およびメチル化担体ＤＮＡ分子の３つのサブセット（サブセットＡ、ＢおよびＣ）を有する。この実施形態では、すべてのサブセット中の担体ＤＮＡ分子の配列は、同じである。即ち、サブセット１、Ａ、ＢおよびＣは、同じヌクレオチド配列を有し、これらはすべて、４つのＣｐＧジヌクレオチドを有する。しかし、メチル化ヌクレオチド（この実施形態では、ＣｐＧジヌクレオチドのメチル化シトシン）の数は、メチル化担体ＤＮＡ分子の各サブセットにおいて異なる。この実施形態では、サブセットＡは、ＣｐＧヌクレオチド中の２つのメチル化シトシンを有し、サブセットＢは、ＣｐＧヌクレオチド中の３つのメチル化シトシンを有し、サブセットＣは、ＣｐＧヌクレオチド中の４つのメチル化シトシンを有する（図４中でＭＧと示される）。一部の実施形態では、担体ＤＮＡ分子は、２５ｂｐと３２５ｂｐとの間の任意の長さのものであり得る。一部の実施形態では、担体ＤＮＡ分子は、少なくとも５０ｂｐ、少なくとも６０ｂｐ、少なくとも８０ｂｐ、少なくとも１００ｂｐ、少なくとも１２０ｂｐ、少なくとも１５０ｂｐ、少なくとも２００ｂｐ、少なくとも２５０ｂｐまたは少なくとも３００ｂｐであり得る。

図５は、本開示の一実施形態に従う担体核酸分子のセットの概略図である。この実施形態では、担体核酸分子は、二本鎖ＤＮＡ分子であり、担体ＤＮＡ分子と呼ばれる。また、この実施形態では、担体ＤＮＡ分子の末端は、ライゲーションを防止するように改変される。他の実施形態では、担体ＤＮＡ分子の末端は、ライゲーションを防止するように改変される必要はない。この実施形態では、本明細書に記載される担体ＤＮＡ分子は、核酸分子の分配の間のＣｐＧジヌクレオチドの位置特異的効果および／またはメチル化効果を考慮に入れてもよい。例示を目的として、すべてのサブセットについて、単一の担体ＤＮＡ分子の一方の鎖のみが図中に示される。図５では、担体ＤＮＡ分子中の「－－－」領域は、ＣｐＧとは別の任意の他の配列を示し、Ｍは５－メチルシトシンを示し、Ｃはシトシンを示し、Ｇはグアニンを示す。この実施形態では、担体ＤＮＡ分子のセットは、非メチル化担体ＤＮＡ分子の２つのサブセット（サブセット１および２）およびメチル化担体ＤＮＡ分子の２つのサブセット（サブセットＡおよびＢ）を有する。この実施形態では、各サブセット中の担体ＤＮＡ分子の配列は、他のサブセットとは異なる。即ち、サブセット１、２、ＡおよびＢは、異なるヌクレオチド配列を有する。この実施形態では、すべてのサブセット中のＣｐＧジヌクレオチドの数は、同じである。即ち、すべてのサブセット（サブセット１、２、ＡおよびＢ）が、４つのＣｐＧジヌクレオチドを有する。この実施形態では、メチル化担体ＤＮＡ分子の各サブセット中のメチル化ヌクレオチド（この実施形態では、ＣｐＧジヌクレオチドのメチル化シトシン）の数は、同じであり、４つのＣｐＧジヌクレオチド中の４つすべてのシトシンがメチル化されている（図５のサブセットＡおよびＢ中でＭＧと示される）。この実施形態では、ＣｐＧジヌクレオチドの位置は、サブセット１とサブセット２との間で異なり、サブセットＡとサブセットＢとの間で異なる。しかし、サブセット１およびサブセットＡ中のＣｐＧジヌクレオチドの位置は同じであり、サブセット２およびサブセットＢ中のＣｐＧジヌクレオチドの位置は同じである。一部の実施形態では、担体ＤＮＡ分子は、２５ｂｐと３２５ｂｐとの間の任意の長さのものであり得る。一部の実施形態では、担体ＤＮＡ分子は、少なくとも５０ｂｐ、少なくとも６０ｂｐ、少なくとも８０ｂｐ、少なくとも１００ｂｐ、少なくとも１２０ｂｐ、少なくとも１５０ｂｐ、少なくとも２００ｂｐ、少なくとも２５０ｂｐまたは少なくとも３００ｂｐであり得る。

図６は、本開示の一実施形態に従う担体核酸分子のセットの概略図である。この実施形態では、担体核酸分子は、二本鎖ＤＮＡ分子であり、担体ＤＮＡ分子と呼ばれる。また、この実施形態では、担体ＤＮＡ分子の末端は、ライゲーションを防止するように改変される。他の実施形態では、担体ＤＮＡ分子の末端は、ライゲーションを防止するように改変される必要はない。この実施形態では、本明細書に記載される担体ＤＮＡ分子は、核酸分子の分配の間のＣｐＧジヌクレオチドに隣接するヌクレオチドの配列特異的効果を考慮に入れてもよい。例示を目的として、すべてのサブセットについて、単一の担体ＤＮＡ分子の一方の鎖のみが図中に示される。図６では、担体ＤＮＡ分子中の「－－－」領域は、ＣｐＧジヌクレオチドとは別の任意の他の配列を示し；Ｍは５－メチルシトシンを示し、Ｃはシトシンを示し、Ｇはグアニンを示し；Ｘ_ｎｉおよびＹ_ｎｉは、同じ長さｎｉの任意の２つの異なるヌクレオチド配列であり得、ここで、ｎｉは、ｎ１、ｎ２、ｎ３、ｎ４、ｎ５またはｎ６であり得る。即ち、例えば、Ｘ_ｎ１およびＹ_ｎ１は、長さｎ１の２つの異なるヌクレオチド配列であり、ｎ１、ｎ２、ｎ３、ｎ４、ｎ５およびｎ６は、０と３０との間の任意の整数であり得る。この実施形態では、担体ＤＮＡ分子のセットは、非メチル化担体ＤＮＡ分子の２つのサブセット（サブセット１および２）およびメチル化担体ＤＮＡ分子の２つのサブセット（サブセットＡおよびＢ）を有し、すべてのサブセット中のＣｐＧジヌクレオチドの数は、同じである。即ち、サブセット１、２、ＡおよびＢは、４つのＣｐＧジヌクレオチドを有する。しかし、ＣｐＧジヌクレオチドに隣接するヌクレオチドの配列は、非メチル化担体ＤＮＡ分子の２つのサブセット間で異なる。即ち、ＣｐＧジヌクレオチドに隣接するヌクレオチドの配列（Ｘ_ｎｉおよびＹ_ｎｉ）は、サブセット１およびサブセット２において異なる。同様に、ＣｐＧジヌクレオチドに隣接するヌクレオチドの配列は、メチル化担体ＤＮＡ分子の２つのサブセット間で異なる。即ち、ＣｐＧジヌクレオチドに隣接するヌクレオチドの配列（Ｘ_ｎｉおよびＹ_ｎｉ）は、サブセットＡおよびサブセットＢにおいて異なる。しかし、ＣｐＧジヌクレオチドに隣接するヌクレオチドの配列（Ｘ_ｎｉ）は、サブセット１およびサブセットＡにおいて同じであり、サブセット１においても同じであり、ＣｐＧジヌクレオチドに隣接するヌクレオチドの配列（Ｙ_ｎｉ）は、サブセット２およびサブセットＢにおいて同じである。一部の実施形態では、担体ＤＮＡ分子は、２５ｂｐと３２５ｂｐとの間の任意の長さのものであり得る。一部の実施形態では、担体ＤＮＡ分子は、少なくとも５０ｂｐ、少なくとも６０ｂｐ、少なくとも８０ｂｐ、少なくとも１００ｂｐ、少なくとも１２０ｂｐ、少なくとも１５０ｂｐ、少なくとも２００ｂｐ、少なくとも２５０ｂｐまたは少なくとも３００ｂｐであり得る。一部の実施形態では、ｎｉは、長さ最大５ｂｐのヌクレオチド配列であり得る。

別の態様では、本開示は、（ｉ）ｉ）非メチル化担体核酸分子の少なくとも１つのサブセット；および／または（ｉｉ）メチル化担体核酸分子の少なくとも１つのサブセットを含む担体核酸分子のセットであって、担体核酸分子の少なくとも一方の末端が、ライゲーションを防止するように改変され、非メチル化担体核酸分子が、メチル化ヌクレオチドを含まず、メチル化担体核酸分子が、１つまたは複数のメチル化ヌクレオチドを含む、担体核酸分子のセット；ならびに（ｉｉ）対象から得られたポリヌクレオチド試料を含む核酸の集団を提供する。

一部の実施形態では、担体核酸分子は、（ｉ）ウイルスゲノム、（ｉｉ）細菌ゲノム、（ｉｉｉ）ラムダファージゲノム、（ｉｖ）ヒトゲノム、（ｉｖ）任意の天然に存在する配列、（ｖ）天然に存在しない配列、（ｖｉ）非ヒトゲノムおよび／または（ｖｉｉ）上記のいずれかの組合せの領域に対応する配列のいずれかを有し得る。一部の実施形態では、担体核酸分子は、天然に存在しない配列を含み得る。一部の実施形態では、担体核酸分子は、天然に存在する配列を含み得る。一部の実施形態では、担体ＤＮＡ分子は、ＰＣＲによって生成され得る。一部の実施形態では、ＰＣＲによって生成された担体核酸分子は、担体核酸分子中の１つまたは複数のヌクレオチドにメチル基を組み込むために、メチルトランスフェラーゼによる処置によってさらに改変され得る。一部の実施形態では、担体核酸分子は、アダプターへの担体核酸分子のライゲーションを防止するように改変ヌクレオシドを組み込むために、ポリメラーゼで末端標識され得る。一部の実施形態では、担体核酸分子は、天然に存在しないヌクレオシド誘導体を含む。一部の実施形態では、担体核酸分子は、ビオチンまたはフルオロフォアで標識され得る。

一部の実施形態では、ポリヌクレオチド試料は、組織、血液、血漿、血清、尿、唾液、糞便、脳脊髄液、頬内スワブまたは胸腔穿刺から得られる。一部の実施形態では、ポリヌクレオチド試料は、組織から得られる。一部の実施形態では、組織から得られたポリヌクレオチド試料は、酵素的手段または機械的手段によって断片化される。一部の実施形態では、ポリヌクレオチド試料は、血液から得られる。一部の実施形態では、血液から得られたポリヌクレオチド試料は、無細胞ＤＮＡ試料である。一部の実施形態では、ポリヌクレオチド試料は、無細胞ＤＮＡ試料である。

一部の実施形態では、ポリヌクレオチド試料は、ＤＮＡ試料、ＲＮＡ試料、無細胞ポリヌクレオチド試料、無細胞ＤＮＡ試料または無細胞ＲＮＡ試料である。一部の実施形態では、ポリヌクレオチド試料は、無細胞ＤＮＡ試料である。

一部の実施形態では、メチル化担体核酸分子の少なくとも１つのサブセットの、非メチル化担体核酸分子の少なくとも１つのサブセットに対する量は、約０：１、０．１：９９．９、０．５：９９．５、０．７５：９９．２５、１：９９、１：９５、１：９０、１：８０、１：７５、１：７０、１：６０、１：５０、１：４０、１：３０、１：２５、１：２０、１：１０、１：５、１：２、１：１．１５、１：１、１．１５：１、２：１、５：１、１０：１、２０：１、２５：１、３０：１、４０：１、５０：１、６０：１、７０：１、７５：１、８０：１、９０：１、９５：１、９９：１、９９．２５：０．７５、９９．５：０．５、９９．９：０．１または１：０の比である。一部の実施形態では、ポリヌクレオチド試料の、担体核酸分子のセットに対する量は、約１：０．１；１：０．２、１：０．３、１：４、１：０．５、１：６、１：７、１：８、１：０．９、１：１、１：１、１：２、１：３、１：４、１：５、１：６、１：７、１：８、１：９、１：１０の比、１：２０、１：３０、１：４０、１：５０、１：６０、１：７０、１：８０、１：９０、１：１００、１：２００、１：３００；１：４００、１：５００、１：６００、１：７００、１：８００、１：９００、１：１０００、１：５０００、１：１０，０００、１：１００，０００、１：５００，０００、１：１０^６、１：１０^７、１：１０^８または１：１０^９である。一部の実施形態では、量は、質量を単位とする。一部の実施形態では、量は、モル濃度を単位とする。

一部の実施形態では、ポリヌクレオチド試料は、少なくとも１ｎｇ、少なくとも５ｎｇ、少なくとも１０ｎｇ、少なくとも１５ｎｇ、少なくとも２０ｎｇ、少なくとも３０ｎｇ、少なくとも５０ｎｇ、少なくとも７５ｎｇ、少なくとも１００ｎｇ、少なくとも１５０ｎｇ、少なくとも２００ｎｇ、少なくとも２５０ｎｇ、少なくとも３００ｎｇ、少なくとも３５０ｎｇ、少なくとも４００ｎｇ、少なくとも４５０ｎｇ、少なくとも５００ｎｇ、少なくとも７５０ｎｇまたは少なくとも１μｇである。一部の実施形態では、ポリヌクレオチド試料は、最大１μｇである。一部の実施形態では、ポリヌクレオチド試料は、最大２００ｎｇである。一部の実施形態では、ポリヌクレオチド試料は、最大１５０ｎｇである。一部の実施形態では、ポリヌクレオチド試料は、最大１００ｎｇである。一部の実施形態では、担体核酸分子のセットは、ポリヌクレオチド試料と担体核酸分子のセットとの総量が約１７５ｎｇ、２００ｎｇ、２２５ｎｇ、２５０ｎｇ、２７５ｎｇ、３００ｎｇ、３５０ｎｇ、４００ｎｇ、４５０ｎｇ、５００ｎｇ、６００ｎｇ、７００ｎｇ、７５０ｎｇ、８００ｎｇ、９００ｎｇ、１μｇ、１．１μｇ、１．２５μｇまたは１．５μｇになるように十分な量で添加される。

ＩＩＩ．本方法の一般的な特色
Ａ．試料
試料は、対象から単離した任意の生体試料であってよい。試料には、身体組織、全血、血小板、血清、血漿、糞便、赤血球、白血球（ｗｈｉｔｅｂｌｏｏｄｃｅｌｌ）または白血球（ｌｅｕｃｏｃｙｔｅ）、内皮細胞、組織生検材料（例えば、既知のまたは疑われる固形腫瘍由来の生検材料）、脳脊髄液、滑液、リンパ液、腹水、間質または細胞外の流体（例えば、細胞間隙由来の流体）、歯肉溝滲出液（gingival fluid）、歯肉溝滲出液（crevicular fluid）、骨髄、胸水、脳脊髄液、唾液、粘液、痰、精液、汗および尿が含まれ得る。試料は、体液、例えば、血液およびその分画、ならびに尿であり得る。そのような試料は、腫瘍から脱落した核酸を含み得る。核酸には、ＤＮＡおよびＲＮＡが含まれ得、二本鎖形態および一本鎖形態であり得る。試料は、もともと対象から単離した形態であってよく、あるいは細胞等の成分を除去しもしくは添加し、ある成分を別の成分に対して富化するように、またはある型の核酸を別の型の核酸に、例えば、ＲＮＡをＤＮＡにもしくは一本鎖核酸を二本鎖核酸に変換するように、さらに処理に供されたものでもよい。したがって、例えば、解析のための体液は、無細胞核酸、例えば、無細胞ＤＮＡ（ｃｆＤＮＡ）を含む血漿または血清であり得る。

一部の実施形態では、対象から採取された体液の試料体積は、シーケンシングされる領域の所望のリード深度に依存する。体積の例は、約０．４～４０ミリリットル（ｍＬ）、約５～２０ｍＬ、約１０～２０ｍＬである。例えば、体積は、約０．５ｍＬ、約１ｍＬ、約５ｍＬ、約１０ｍＬ、約２０ｍＬ、約３０ｍＬ、約４０ｍＬまたはそれよりも大きいミリリットルであり得る。試料採取された血漿の体積は、典型的には、約５ｍＬ～約２０ｍＬの間である。

試料は、様々な量の核酸を含み得る。典型的には、所与の試料中の核酸の量は、複数のゲノム等価物と同等とみなされる。例えば、ＤＮＡ約３０ナノグラム（ｎｇ）の試料は、約１０，０００（１０^４）個のハプロイドヒトゲノム等価物を含有し得、ｃｆＤＮＡの場合には約２０００億（２×１０^１１）個の個々のポリヌクレオチド分子を含有し得る。同様に、ＤＮＡ約１００ｎｇの試料は、約３０，０００個のハプロイドヒトゲノム等価物を含有し得、ｃｆＤＮＡの場合には約６０００億個の個々の分子を含有し得る。

一部の実施形態では、試料は、異なる供給源から、例えば、細胞からおよび無細胞供給源（例えば、血液試料等）からの核酸を含む。典型的には、試料は、変異を有する核酸を含む。例えば、試料は、必要に応じて、生殖細胞系列変異および／または体細胞変異を有するＤＮＡを含む。典型的には、試料は、がん関連変異（例えば、がん関連体細胞変異）を有するＤＮＡを含む。

増幅前の試料中の無細胞核酸の例示的な量は、典型的には、約１フェムトグラム（ｆｇ）～約１マイクログラム（μｇ）、例えば、約１ピコグラム（ｐｇ）～約２００ナノグラム（ｎｇ）、約１ｎｇ～約１００ｎｇ、約１０ｎｇ～約１０００ｎｇの範囲である。一部の実施形態では、試料は、最大約６００ｎｇ、最大約５００ｎｇ、最大約４００ｎｇ、最大約３００ｎｇ、最大約２００ｎｇ、最大約１００ｎｇ、最大約５０ｎｇまたは最大約２０ｎｇの無細胞核酸分子を含む。必要に応じて、この量は、少なくとも約１ｆｇ、少なくとも約１０ｆｇ、少なくとも約１００ｆｇ、少なくとも約１ｐｇ、少なくとも約１０ｐｇ、少なくとも約１００ｐｇ、少なくとも約１ｎｇ、少なくとも約１０ｎｇ、少なくとも約１００ｎｇ、少なくとも約１５０ｎｇまたは少なくとも約２００ｎｇの無細胞核酸分子である。一部の実施形態では、この量は、最大約１ｆｇ、約１０ｆｇ、約１００ｆｇ、約１ｐｇ、約１０ｐｇ、約１００ｐｇ、約１ｎｇ、約１０ｎｇ、約１００ｎｇ、約１５０ｎｇ、約２００ｎｇ、約３００ｎｇ、約４００ｎｇ、約５００ｎｇ、約６００ｎｇ、約７００ｎｇ、約８００ｎｇ、約９００ｎｇまたは約１μｇの無細胞核酸分子である。一部の実施形態では、方法は、約１ｆｇ～約２００ｎｇの間の、試料由来の無細胞核酸分子を得るステップを含む。

無細胞核酸は、典型的には、長さが約１００ヌクレオチドと長さが約５００ヌクレオチドとの間のサイズ分布を有し、長さが約１１０ヌクレオチド～長さが約２３０ヌクレオチドの分子が、試料中の分子の約９０％に相当し、最頻値は約１６８ヌクレオチドの長さであり（ヒト対象由来の試料において）、第２の小さなピークは、長さが約２４０ヌクレオチド～約４４０ヌクレオチドの間の範囲である。一部の実施形態では、無細胞核酸は、長さが約１６０ヌクレオチド～約１８０ヌクレオチド、または長さが約３２０ヌクレオチド～約３６０ヌクレオチド、または長さが約４４０ヌクレオチド～約４８０ヌクレオチドである。

一部の実施形態では、無細胞核酸は、分配するステップを経て体液から単離され、ここでは、溶液中に見出される無細胞核酸が、インタクトな細胞および体液の他の不溶性成分から分離される。一部の実施形態では、分配は、遠心分離または濾過等の手法を含む。あるいは、体液中の細胞を溶解し、無細胞および細胞の核酸を共に処理することができる。一般に、緩衝液の添加および洗浄ステップの後、例えば、無細胞核酸をアルコール等で沈殿させることができる。一部の実施形態では、夾雑物または塩を除去するためのシリカ系カラム等の追加の清浄ステップを使用する。例示的な手順の態様、例えば収量を最適化するために、例えば、非特異的バルク担体核酸を反応全体にわたって必要に応じて添加する。そのような処理の後、試料は、典型的には、二本鎖ＤＮＡ、一本鎖ＤＮＡおよび／または一本鎖ＲＮＡを含む種々の形態の核酸を含む。必要に応じて、それらをその後の処理および分析のステップに含めることができるように、一本鎖ＤＮＡおよび／または一本鎖ＲＮＡを二本鎖の形態に変換する。

Ｂ．分配およびタグ付け
一部の実施形態では、核酸分子（ポリヌクレオチドの試料由来）は、試料インデックスおよび／または分子バーコード（一般に「タグ」と呼ばれる）でタグ付けされ得る。タグは、他の方法の中でも、化学的合成、ライゲーション（例えば、平滑末端ライゲーションまたは付着末端ライゲーション）、または重複伸長ポリメラーゼ連鎖反応（ＰＣＲ）によって、アダプター中に組み込まれ得るか、またはそれ以外の方法でアダプターに結合され得る。そのようなアダプターは、標的核酸分子に最終的に結合され得る。他の実施形態では、１または複数ラウンドの増幅サイクル（例えば、ＰＣＲ増幅）が、従来の核酸増幅方法を使用して、核酸分子に試料インデックスを導入するために一般に適用される。増幅は、１つまたは複数の反応混合物（例えば、アレイ中の複数のマイクロウェル）において実施され得る。分子バーコードおよび／または試料インデックスは、同時に、または任意の逐次的順序で導入され得る。一部の実施形態では、分子バーコードおよび／または試料インデックスは、配列捕捉ステップを実施する前および／または配列捕捉ステップを実施した後に導入される。一部の実施形態では、分子バーコードのみがプローブ捕捉前に導入され、試料インデックスは、配列捕捉ステップを実施した後に導入される。一部の実施形態では、分子バーコードおよび試料インデックスが共に、プローブに基づく捕捉ステップを実施する前に導入される。一部の実施形態では、試料インデックスは、配列捕捉ステップを実施した後に導入される。一部の実施形態では、分子バーコードは、ライゲーション（例えば、平滑末端ライゲーションまたは付着末端ライゲーション）を経て、アダプターを介して試料中の核酸分子（例えば、ｃｆＤＮＡ分子）に組み込まれる。一部の実施形態では、試料インデックスは、重複伸長ポリメラーゼ連鎖反応（ＰＣＲ）を経て試料中の核酸分子（例えば、ｃｆＤＮＡ分子）に組み込まれる。典型的には、配列捕捉プロトコールは、標的化された核酸配列、例えば、ゲノム領域のコード配列に対して相補的な一本鎖核酸分子を導入することを含み、そのような領域の変異は、がん型に関連する。

一部の実施形態では、タグは、試料核酸分子の一方の末端または両方の末端に位置し得る。一部の実施形態では、タグは、既定のまたはランダムなもしくは半ランダムな配列のオリゴヌクレオチドである。一部の実施形態では、タグは、長さが約５００、２００、１００、５０、２０、１０、９、８、７、６、５、４、３、２または１ヌクレオチド未満であり得る。タグは、試料核酸にランダムにまたは非ランダムに連結され得る。

一部の実施形態では、各試料は、試料インデックスまたは試料インデックスの組合せで一意的にタグ付けされる。一部の実施形態では、試料またはサブ試料の各核酸分子は、分子バーコードまたは分子バーコードの組合せで一意的にタグ付けされる。他の実施形態では、分子バーコードが複数の分子バーコード中で互いに必ずしも一意的でない（例えば、非一意的分子バーコード）ように、複数の分子バーコードが使用され得る。これらの実施形態では、一般に、分子バーコードとそれが結合され得る配列との組合せが、個々に追跡され得る一意的配列を作製するように、分子バーコードが個々の分子に（例えば、ライゲーションによって）結合される。典型的には、内因性配列情報（例えば、試料中の元の核酸分子の配列に対応する出発（開始）および／もしくは終了（終止）ゲノム場所／位置、試料中の元の核酸分子の配列に対応する開始および終止ゲノム位置、参照配列にマッピングされる配列リードの出発（開始）および／もしくは終了（終止）ゲノム場所／位置、参照配列にマッピングされる配列リードの開始および終止ゲノム位置、一方もしくは両方の末端にある配列リードのサブ配列、配列リードの長さ、ならびに／または試料中の元の核酸分子の長さ）と組み合わせた非一意的分子バーコードの検出により、特定の分子への一意的正体の割り当てが可能になる。一部の実施形態では、出発領域は、参照配列とアラインメントするシーケンシングリードの５’末端における最初の１、最初の２、最初の５、最初の１０、最初の１５、最初の２０、最初の２５、最初の３０または少なくとも最初の３０個の塩基位置を含む。一部の実施形態では、終了領域は、参照配列とアラインメントするシーケンシングリードの３’末端における最後の１、最後の２、最後の５、最後の１０、最後の１５、最後の２０、最後の２５、最後の３０または少なくとも最後の３０個の塩基位置を含む。個々の配列リードの長さまたは塩基対の数もまた、必要に応じて、所与の分子への一意的正体の割り当てのために使用される。本明細書に記載されるように、一意的正体が割り当てられた核酸の単一ストランドからの断片によって、親ストランドおよび／または相補的ストランドからの断片のその後の同定が可能になり得る。

ある特定の実施形態では、クラスの中の分子の数ｚを一意的に同定するために使用される異なるタグの数は、２^＊ｚ、３^＊ｚ、４^＊ｚ、５^＊ｚ、６^＊ｚ、７^＊ｚ、８^＊ｚ、９^＊ｚ、１０^＊ｚ、１１^＊ｚ、１２^＊ｚ、１３^＊ｚ、１４^＊ｚ、１５^＊ｚ、１６^＊ｚ、１７^＊ｚ、１８＊ｚ、１９^＊ｚ、２０^＊ｚまたは１００^＊ｚのいずれか（例えば下限）と１００，０００＊ｚ、１０，０００^＊ｚ、１０００^＊ｚまたは１００^＊ｚのいずれか（例えば上限）との間であってよい。一部の実施形態では、分子バーコードは、試料中に識別子のセット（例えば、一意的または非一意的分子バーコードの組合せ）対分子の予想される比で、導入される。１つの例示的なフォーマットは、標的分子の両方の末端にライゲーションされる、約２～約１，０００，０００個の異なる分子バーコード配列、または約５～約１５０個の異なる分子バーコード配列、または約２０～約５０個の異なる分子バーコード配列を使用する。あるいは、約２５～約１，０００，０００個の異なる分子バーコード配列が使用され得る。例えば、２０～５０×２０～５０個の分子バーコード配列（即ち、２０～５０個の異なる分子バーコード配列のうち１つが、標的分子の各末端に結合され得る）が使用され得る。識別子のそのような数は、典型的には、同じ開始点および終止点を有する異なる分子が、異なる組合せの識別子を受ける高い確率（例えば、少なくとも９４％、９９．５％、９９．９９％または９９．９９９％）を有するために十分である。一部の実施形態では、分子の約８０％、約９０％、約９５％または約９９％は、分子バーコードの同じ組合せを有する。

一部の実施形態では、反応における一意的または非一意的分子バーコードの割り当ては、例えば、米国特許出願番号２００１００５３５１９、同２００３０１５２４９０および同２０１１０１６００７８ならびに米国特許第６，５８２，９０８号、同第７，５３７，８９８号、同第９，５９８，７３１号および同第９，９０２，９９２号に記載される方法およびシステムを使用して実施され、その各々は、その全体がこれにより参照により本明細書に組み込まれる。あるいは、一部の実施形態では、試料の異なる核酸分子は、内因性配列情報（例えば、開始および／もしくは終止位置、配列の一方もしくは両方の末端のサブ配列、ならびに／または長さ）のみを使用して同定され得る。

本明細書に記載されるある特定の実施形態では、異なる形態の核酸（例えば、試料中の高メチル化ＤＮＡおよび低メチル化ＤＮＡ）の集団は、解析、例えば、シーケンシング、またはタグ付けおよびシーケンシングの前に、物理的に分配され得る。このアプローチは、例えば、高メチル化可変エピジェネティック標的領域が腫瘍細胞に特徴的な高メチル化を示すかどうか、または低メチル化可変エピジェネティック標的領域が腫瘍細胞に特徴的な低メチル化を示すかどうかを決定するために使用され得る。加えて、不均一な核酸集団を分配することによって、例えば、集団の１つの分画（または画分）中により多く存在するまれな核酸分子を富化することによって、まれなシグナルを増加させてもよい。例えば、高メチル化ＤＮＡ中に存在するが、低メチル化ＤＮＡ中には存在が少ない（または存在しない）遺伝的バリエーションは、試料を高メチル化核酸分子および低メチル化核酸分子に分配することによって、より容易に検出することができる。試料の複数の分画を解析することによって、ゲノムの単一の遺伝子座または核酸の種の多次元解析を実施することができ、したがってより高い感度を達成することができる。

一部の例では、不均一な核酸試料は、２つまたはそれよりも多くの画分（例えば、少なくとも３、４、５、６または７つの画分）に分配される。一部の実施形態では、各画分は、示差的にタグ付けされる。即ち、各画分は、異なるセットの分子バーコードを有し得る。次いで、タグ付けされた画分は、集合的な試料調製および／またはシーケンシングのために共にプールされ得る。分配－タグ付け－プールするステップは、１回よりも多く行われ得、分配の各ラウンドは、異なる特徴に基づいて行われ（本明細書に提供される実施例）、他の画分および分配手段とは区別される示差的タグを使用してタグ付けされる。

分配のために使用され得る特徴の例には、配列長さ、メチル化レベル、ヌクレオソーム結合、配列ミスマッチ、免疫沈殿、および／またはＤＮＡに結合するタンパク質が含まれる。得られた画分は、以下の核酸形態のうち１つまたは複数を含み得る：一本鎖ＤＮＡ（ｓｓＤＮＡ）、二本鎖ＤＮＡ（ｄｓＤＮＡ）、短いＤＮＡ断片および長いＤＮＡ断片。一部の実施形態では、核酸の不均一な集団は、１つまたは複数のエピジェネティック改変を有する核酸と、１つまたは複数のエピジェネティック改変を有さない核酸とに分配される。エピジェネティック改変の例には、メチル化の存在または非存在；メチル化のレベル；メチル化の型（例えば、５－メチルシトシン対他の型のメチル化、例えば、アデニンメチル化および／またはシトシンヒドロキシメチル化）；ならびに１つまたは複数のタンパク質、例えばヒストンとの会合および会合のレベルが含まれる。あるいはまたは加えて、核酸の不均一な集団は、ヌクレオソームに関連する核酸分子と、ヌクレオソームを欠く核酸分子とに分配され得る。あるいはまたは加えて、核酸の不均一な集団は、一本鎖ＤＮＡ（ｓｓＤＮＡ）と二本鎖ＤＮＡ（ｄｓＤＮＡ）とに分配され得る。あるいはまたは加えて、核酸の不均一な集団は、核酸長さに基づいて分配してもよい（例えば、最大１６０ｂｐの分子および１６０ｂｐよりも長い長さを有する分子）。

一部の例では、各画分（異なる核酸形態を代表する）は、分子バーコードで示差的にタグ付けされ、画分は、シーケンシングの前に共にプールされる。他の例では、異なる形態は、別個にシーケンシングされる。一部の実施形態では、単一のタグが、特異的画分を標識するために使用され得る。一部の実施形態では、複数の異なるタグが、特異的画分を標識するために使用され得る。特異的画分を標識するために複数の異なるタグを使用する実施形態では、１つの画分を標識するために使用されるタグのセットは、他の画分を標識するために使用されるタグのセットから容易に区別することができる。一部の実施形態では、タグは、多機能性であり得る。即ち、タグは、分子識別子（即ち、分子バーコード）、画分識別子（即ち、画分タグ）および試料識別子（即ち、試料インデックス）として同時に作用することができる。例えば、４つのＤＮＡ試料が存在し、各ＤＮＡ試料が３つの画分に分配される場合、１２個の画分（即ち、合計して、４つのＤＮＡ試料について１２個の画分）の各々中のＤＮＡ分子を、ＤＮＡ分子に結合したタグ配列が、ＤＮＡ分子の正体、それが属する画分、およびそれが起源した試料を明らかにするように、タグの別個のセットでタグ付けすることができる。一部の実施形態では、タグは、分子バーコードとしておよび画分タグとしての両方で使用され得る。例えば、ＤＮＡ試料が３つの画分に分配される場合、各画分中のＤＮＡ分子は、ＤＮＡ分子に結合したタグ配列が、ＤＮＡ分子の正体およびそれが属する画分を明らかにするように、タグの分離されたセットでタグ付けされる。一部の実施形態では、タグは、分子バーコードとしておよび試料インデックスとしての両方で使用され得る。例えば、４つのＤＮＡ試料が存在する場合、各試料中のＤＮＡ分子は、ＤＮＡ分子に結合したタグ配列が、分子識別子としておよび試料識別子として機能するように、各試料から区別可能であり得るタグの別個のセットでタグ付けされる。

一実施形態では、画分タグ付けは、各画分中の分子を画分タグでタグ付けすることを含む。画分を再び合わせ、分子をシーケンシングした後、画分タグは供給源画分を同定する。別の実施形態では、異なる画分は、例えばバーコードの対から構成される異なるセットの分子タグでタグ付けされる。このように、各分子バーコードは、供給源画分、および画分内の分子を区別するために有用であることを示す。例えば、３５個のバーコードの第１のセットは、第１の画分中の分子をタグ付けするために使用され得、一方で、３５個のバーコードの第２のセットは、第２の画分中の分子をタグ付けするために使用され得る。

一部の実施形態では、分配および画分タグでのタグ付けの後に、分子を単一の試行でのシーケンシングのためにプールしてもよい。一部の実施形態では、試料タグを、例えば、画分タグの付加およびプールの後のステップにおいて分子に付加する。試料タグは、単一のシーケンシング試行におけるシーケンシングのために複数の試料から生成された材料をプールすることを容易にすることができる。

あるいは、一部の実施形態では、画分タグは、試料および画分と相関し得る。単純な例として、第１のタグは、第１の試料の第１の画分を示し得；第２のタグは、第１の試料の第２の画分を示し得；第３のタグは、第２の試料の第１の画分を示し得；第４のタグは、第２の試料の第２の画分を示し得る。

タグは、１つまたは複数のエピジェネティック特徴に基づいて既に分配された分子に結合してもよいが、ライブラリ中の最終のタグ付けされた分子は、もはやそのエピジェネティック特徴を保有していなくてもよい。例えば、一本鎖ＤＮＡ分子が分配およびタグ付けされ得るが、ライブラリ中の最終のタグ付けされた分子は、おそらく二本鎖である。同様に、ＤＮＡをメチル化の異なるレベルに基づく画分に供してもよいが、最終のライブラリでは、これらの分子に由来するタグ付けされた分子はおそらくメチル化されていない。したがって、ライブラリ中の分子に結合したタグは典型的には、最終的なタグ付けされた分子が由来する「親分子」の特徴を示し、必ずしもタグ付けされた分子自体の特徴ではない。

一例として、バーコード１、２、３、４等を使用して第１の画分中の分子をタグ付けおよび標識し；バーコードＡ、Ｂ、Ｃ、Ｄ等を使用して第２の画分中の分子をタグ付けおよび標識し；ならびにバーコードａ、ｂ、ｃ、ｄ等を使用して第３の画分中の分子をタグ付けおよび標識する。示差的にタグ付けされた画分を、シーケンシング前にプールすることができる。示差的にタグ付けされた画分を、別個にシーケンシングすることができ、または例えば、Ｉｌｌｕｍｉｎａシーケンサーの同じフローセルにおいて、共に同時にシーケンシングすることができる。

シーケンシング後、遺伝子バリアントを検出するためのリードの解析を、画分毎のレベルおよび全核酸集団レベルで実施することができる。タグを使用して、異なる画分からのリードを選別する。解析には、配列情報、ゲノム座標の長さ、カバレッジおよび／またはコピー数を使用して遺伝的およびエピジェネティックバリエーション（メチル化、クロマチン構造等のうち１つまたは複数）を決定するためのｉｎｓｉｌｉｃｏ解析が含まれ得る。一部の実施形態では、より高いカバレッジは、ゲノム領域におけるより高いヌクレオソーム占有率と相関し得るが、より低いカバレッジは、より低いヌクレオソーム占有率またはヌクレオソーム枯渇領域（ＮＤＲ）と相関し得る。

Ｃ．増幅
試料核酸には、アダプターが隣接してもよく、増幅すべきＤＮＡ分子に隣接するアダプターの中のプライマー結合部位に結合する核酸プライマーを使用するＰＣＲおよび他の増幅方法によって増幅することができる。一部の実施形態では、増幅法は、熱サイクリングから生じる伸長、変性およびアニーリングのサイクルを含むか、または例えば転写媒介増幅におけるように定温であってもよい。必要に応じて利用され得る増幅法の他の例には、リガーゼ連鎖反応、鎖置換増幅（ｓｔｒａｎｄｄｉｓｐｌａｃｅｍｅｎｔａｍｐｌｉｆｉｃａｔｉｏｎ）、核酸配列に基づく増幅、および配列に基づく自己持続複製が含まれる。

典型的には、増幅反応は、約１５０ヌクレオチド（ｎｔ）～約７００ｎｔ、２５０ｎｔ～約３５０ｎｔまたは約３２０ｎｔ～約５５０ｎｔのサイズ範囲の、分子バーコードおよび試料インデックスで非一意的にまたは一意的にタグ付けされた複数の核酸アンプリコンを生成する。一部の実施形態では、アンプリコンは、約１８０ｎｔのサイズを有する。一部の実施形態では、アンプリコンは、約２００ｎｔのサイズを有する。

Ｄ．富化／捕捉
一部の実施形態では、配列は、核酸をシーケンシングする前に富化される。富化は、必要に応じて、特異的標的領域について実施されるかまたは非特異的に実施される（「標的配列」）。一部の実施形態では、目的の標的化された領域は、示差的タイリング（differential tiling）および捕捉スキームを使用して、１つまたは複数のベイトセットパネルについて選択された核酸捕捉用プローブ（「ベイト」）を用いて富化／捕捉され得る。示差的タイリングおよび捕捉スキームは一般に、異なる相対濃度のベイトセットを使用して、ベイトと会合するゲノム領域にわたって示差的に（例えば、異なる「分解能」で）タイリングし、制約のセット（例えば、シーケンサー制約、例えば、シーケンシング負荷、各ベイトの有用性等）に供し、標的化された核酸を下流のシーケンシングのために所望のレベルで捕捉する。目的のこれらの標的化されたゲノム領域は、必要に応じて、核酸構築物の天然のまたは合成のヌクレオチド配列を含む。一部の実施形態では、目的の１つまたは複数の領域に対するプローブを有するビオチン標識されたビーズが、標的配列を捕捉するために使用され得、必要に応じて、その後、目的の領域について富化するためにそれらの領域を増幅するために使用され得る。

配列捕捉は、典型的には、標的核酸配列にハイブリダイズするオリゴヌクレオチドプローブの使用を含む。一部の実施形態では、プローブセット戦略は、目的の領域にわたってプローブをタイリングすることを含む。そのようなプローブは、例えば、長さが約６０～約１２０ヌクレオチドであり得る。セットは、約２×、３×、４×、５×、６×、７×、８×、９×、１０×、１５×、２０×、５０×の、または５０×よりも大きい深度（例えば、カバレッジの深度）を有し得る。配列捕捉の有効性は、一般に、プローブの配列に対して相補的な（またはほとんど相補的な）、標的分子中の配列の長さに一部依存する。

一部の実施形態では、富化されたＤＮＡ分子（または捕捉されたセット）は、配列可変標的領域セットおよびエピジェネティック標的領域セットに対応するＤＮＡを含み得る。一部の実施形態では、捕捉された配列可変標的領域ＤＮＡの量は、標的化された領域のサイズ（フットプリントサイズ）の差異について正規化した場合、捕捉されたエピジェネティック標的領域ＤＮＡの量よりも多い。一部の実施形態では、その全体がこれにより参照により本明細書に組み込まれるＰＣＴ特許出願番号ＰＣＴ／ＵＳ２０２０／０１６１２０に記載される組成物、方法およびシステム。

あるいは、配列可変標的領域セットに対応するＤＮＡおよびエピジェネティック標的領域セットに対応するＤＮＡをそれぞれ含む、第１および第２の捕捉されたセットを提供してもよい。第１および第２の捕捉されたセットを組み合わせて、組み合わせた捕捉されたセットを提供してもよい。

上記で考察された組み合わせた捕捉されたセットを含む、配列可変標的領域セットおよびエピジェネティック標的領域セットに対応するＤＮＡを含む捕捉されたセットにおいて、配列可変標的領域セットに対応するＤＮＡは、エピジェネティック標的領域セットに対応するＤＮＡよりも高い濃度で、例えば１．１～１．２倍高い濃度、１．２～１．４倍高い濃度、１．４～１．６倍高い濃度、１．６～１．８倍高い濃度、１．８～２．０倍高い濃度、２．０～２．２倍高い濃度、２．２～２．４倍高い濃度、２．４～２．６倍高い濃度、２．６～２．８倍高い濃度、２．８～３．０倍高い濃度、３．０～３．５倍高い濃度、３．５～４．０、４．０～４．５倍高い濃度、４．５～５．０倍高い濃度、５．０～５．５倍高い濃度、５．５～６．０倍高い濃度、６．０～６．５倍高い濃度、６．５～７．０倍高い、７．０～７．５倍高い濃度、７．５～８．０倍高い濃度、８．０～８．５倍高い濃度、８．５～９．０倍高い濃度、９．０～９．５倍高い濃度、９．５～１０．０倍高い濃度、１０～１１倍高い濃度、１１～１２倍高い濃度、１２～１３倍高い濃度、１３～１４倍高い濃度、１４～１５倍高い濃度、１５～１６倍高い濃度、１６～１７倍高い濃度、１７～１８倍高い濃度、１８～１９倍高い濃度、または１９～２０倍高い濃度で存在し得る。濃度の差の程度は、定義の節で考察したように、標的領域のフットプリントサイズに関する正規化を説明する。

ｉ．エピジェネティック標的領域セット
エピジェネティック標的領域セットは、新生物（例えば、腫瘍またはがん）細胞からのＤＮＡを、健康な細胞、例えば非新生物循環細胞からのＤＮＡとを区別する可能性がある１つまたは複数のタイプの標的領域を含み得る。そのような領域の例示的なタイプを、本明細書において詳細に考察する。一部の実施形態では、本開示に従う方法は、エピジェネティック標的領域セットに対応するｃｆＤＮＡ分子が、がん関連エピジェネティック改変（例えば、１つもしくは複数の高メチル化可変標的領域における高メチル化；ＣＴＣＦ結合の１つもしくは複数の摂動；および／または転写開始部位の１つもしくは複数の摂動）および／またはコピー数変動（例えば、局所的増幅）を含むかまたは示すかを決定するステップを含む。エピジェネティック標的領域セットはまた、例えば本明細書に記載される１つまたは複数の対照領域も含み得る。

一部の実施形態では、エピジェネティック標的領域セットは、少なくとも１００ｋｂ、例えば、少なくとも２００ｋｂ、少なくとも３００ｋｂ、または少なくとも４００ｋｂのフットプリントを有する。一部の実施形態では、エピジェネティック標的領域セットは、１００～１０００ｋｂ、例えば、１００～２００ｋｂ、２００～３００ｋｂ、３００～４００ｋｂ、４００～５００ｋｂ、５００～６００ｋｂ、６００～７００ｋｂ、７００～８００ｋｂ、８００～９００ｋｂ、および９００～１，０００ｋｂの範囲のフットプリントを有する。

１．高メチル化可変標的領域
一部の実施形態では、エピジェネティック標的領域セットは、１つまたは複数の高メチル化可変標的領域を含む。一般的に、高メチル化可変標的領域は、観察されたメチル化レベルの増加が、試料（例えば、ｃｆＤＮＡの試料）が新生物細胞、例えば腫瘍またはがん細胞によって産生されるＤＮＡを含有する可能性の増加を示す領域を指す。例えば、腫瘍抑制遺伝子のプロモーターの高メチル化は、繰り返し観察されている。例えば、Ｋａｎｇｅｔａｌ．，ＧｅｎｏｍｅＢｉｏｌ．１８：５３（２０１７）およびそこに引用されている参考文献を参照されたい。

結腸直腸がんにおけるメチル化可変標的領域に関する広範な考察は、Ｌａｍｅｔａｌ．，ＢｉｏｃｈｉｍＢｉｏｐｈｙｓＡｃｔａ．１８６６：１０６－２０（２０１６）に提供される。これらは、ＶＩＭ、ＳＥＰＴ９、ＩＴＧＡ４、ＯＳＭ４、ＧＡＴＡ４、およびＮＤＲＧ４を含む。結腸直腸がん（ＣＲＣ）の研究に基づく遺伝子またはその一部を含む高メチル化可変標的領域の例示的なセットを表１に提供する。これらの遺伝子の多くはおそらく、結腸直腸がん以外のがんに対しても関連を有し、例えばＴＰ５３は、極めて重要な腫瘍抑制因子として広く認識されており、この遺伝子の高メチル化に基づく不活化は、共通の腫瘍形成機構であり得る。

一部の実施形態では、高メチル化可変標的領域は、表１に記載の複数の遺伝子またはその一部、例えば、表１に記載の遺伝子またはその一部の少なくとも１０％、２０％、３０％、４０％、５０％、６０％、７０％、８０％、９０％、または１００％を含む。例えば、標的領域として含まれる各々の遺伝子座に関して、遺伝子の転写開始部位と終止コドン（代替的にスプライシングされる遺伝子に関しては最後の終止コドン）との間に結合するハイブリダイゼーション部位を有する１つまたは複数のプローブが存在し得る。一部の実施形態では、この１つまたは複数のプローブは、表１に記載の遺伝子またはその一部の上流および／または下流の３００ｂｐ以内、例えば、２００または１００ｂｐ以内に結合する。

様々なタイプの肺がんにおけるメチル化可変標的領域は、例えば、Ｏｏｋｉｅｔａｌ．，Ｃｌｉｎ．ＣａｎｃｅｒＲｅｓ．２３：７１４１－５２（２０１７）；Ｂｅｌｉｎｋｓｙ，Ａｎｎｕ．Ｒｅｖ．Ｐｈｙｓｉｏｌ．７７：４５３－７４（２０１５）；Ｈｕｌｂｅｒｔｅｔａｌ．，Ｃｌｉｎ．ＣａｎｃｅｒＲｅｓ．２３：１９９８－２００５（２０１７）；Ｓｈｉｅｔａｌ．，ＢＭＣＧｅｎｏｍｉｃｓ１８：９０１（２０１７）；Ｓｃｈｎｅｉｄｅｒｅｔａｌ．，ＢＭＣＣａｎｃｅｒ．１１：１０２（２０１１）；Ｌｉｓｓａｅｔａｌ．，ＴｒａｎｓｌＬｕｎｇＣａｎｃｅｒＲｅｓ５（５）：４９２－５０４（２０１６）；Ｓｋｖｏｒｔｓｏｖａｅｔａｌ．，Ｂｒ．Ｊ．Ｃａｎｃｅｒ．９４（１０）：１４９２－１４９５（２００６）；Ｋｉｍｅｔａｌ．，ＣａｎｃｅｒＲｅｓ．６１：３４１９－３４２４（２００１）；Ｆｕｒｏｎａｋａｅｔａｌ．，ＰａｔｈｏｌｏｇｙＩｎｔｅｒｎａｔｉｏｎａｌ５５：３０３－３０９（２００５）；Ｇｏｍｅｓｅｔａｌ．，Ｒｅｖ．Ｐｏｒｔ．Ｐｎｅｕｍｏｌ．２０：２０－３０（２０１４）；Ｋｉｍｅｔａｌ．，Ｏｎｃｏｇｅｎｅ．２０：１７６５－７０（２００１）；Ｈｏｐｋｉｎｓ－Ｄｏｎａｌｄｓｏｎｅｔａｌ．，ＣｅｌｌＤｅａｔｈＤｉｆｆｅｒ．１０：３５６－６４（２００３）；Ｋｉｋｕｃｈｉｅｔａｌ．，Ｃｌｉｎ．ＣａｎｃｅｒＲｅｓ．１１：２９５４－６１（２００５）；Ｈｅｌｌｅｒｅｔａｌ．，Ｏｎｃｏｇｅｎｅ２５：９５９－９６８（２００６）；Ｌｉｃｃｈｅｓｉｅｔａｌ．，Ｃａｒｃｉｎｏｇｅｎｅｓｉｓ．２９：８９５－９０４（２００８）；Ｇｕｏｅｔａｌ．，Ｃｌｉｎ．ＣａｎｃｅｒＲｅｓ．１０：７９１７－２４（２００４）；Ｐａｌｍｉｓａｎｏｅｔａｌ．，ＣａｎｃｅｒＲｅｓ．６３：４６２０－４６２５（２００３）；およびＴｏｙｏｏｋａｅｔａｌ．，ＣａｎｃｅｒＲｅｓ．６１：４５５６－４５６０，（２００１）において詳細に考察されている。

肺がんの研究に基づく遺伝子またはその一部を含む例示的な高メチル化可変標的領域セットを表２に提供する。これらの遺伝子の多くはおそらく、肺がん以外のがんに対しても関連を有する可能性があり、例えばＣａｓｐ８（カスパーゼ８）は、プログラム細胞死における重要な酵素であり、この遺伝子の高メチル化に基づく不活化は、肺がんに限定されない共通の腫瘍形成機構であり得る。加えて、いくつかの遺伝子が表１および表２の両方に出現し、一般性を示している。

表２において同定された標的領域に関する前述の実施形態のいずれかを、表１において同定された標的領域に関する上記の実施形態のいずれかと組み合わせてもよい。一部の実施形態では、高メチル化可変標的領域は、表１または表２に記載される複数の遺伝子またはその一部、例えば表１または表２に記載される遺伝子またはその一部の少なくとも１０％、２０％、３０％、４０％、５０％、６０％、７０％、８０％、９０％、または１００％を含む。

追加の高メチル化標的領域を、例えばがんゲノムアトラス（ＣａｎｃｅｒＧｅｎｏｍｅＡｔｌａｓ）から得てもよい。Ｋａｎｇｅｔａｌ．，ＧｅｎｏｍｅＢｉｏｌｏｇｙ１８：５３（２０１７）は、乳房、結腸、腎臓、肝臓、および肺からの高メチル化標的領域を使用してＣａｎｃｅｒＬｏｃａｔｏｒと呼ばれる確率論的方法の構築を記載している。一部の実施形態では、高メチル化標的領域は、１つまたは複数のタイプのがんに対して特異的であり得る。したがって一部の実施形態では、高メチル化標的領域は、乳がん、結腸がん、腎臓がん、肝臓がん、および肺がんのうちの１つ、２つ、３つ、４つ、または５つにおいて高メチル化を集合的に示す高メチル化標的領域の１つ、２つ、３つ、４つ、または５つのサブセットを含む。

ｉｉ．低メチル化可変標的領域
グローバルな低メチル化は、様々ながんにおいて共通して観察される現象である。例えば、Ｈｏｎｅｔａｌ．，ＧｅｎｏｍｅＲｅｓ．２２：２４６－２５８（２０１２）（乳がん）；Ｅｈｒｌｉｃｈ，Ｅｐｉｇｅｎｏｍｉｃｓ１：２３９－２５９（２００９）（結腸がん、卵巣がん、前立腺がん、白血病、肝細胞がん、および子宮頸がんにおける低メチル化に関する知見を記載する総説論文）を参照されたい。例えば、反復エレメント、例えばＬＩＮＥ１エレメント、Ａｌｕエレメント、セントロメアタンデムリピート、傍セントロメアタンデムリピート、およびサテライトＤＮＡ等の領域、ならびに通常は健康な細胞中でメチル化されている遺伝子間領域は、腫瘍細胞中ではメチル化の低減を示し得る。したがって一部の実施形態では、エピジェネティック標的領域セットは、低メチル化可変標的領域を含み、観察されたメチル化レベルの減少は、試料（例えば、ｃｆＤＮＡの試料）が、新生物細胞、例えば腫瘍細胞またはがん細胞によって産生されたＤＮＡを含有する可能性の増加を示している。

一部の実施形態では、低メチル化可変標的領域は、反復エレメントおよび／または遺伝子間領域を含む。一部の実施形態では、反復エレメントは、ＬＩＮＥ１エレメント、Ａｌｕエレメント、セントロメアタンデムリピート、傍セントロメアタンデムリピート、および／またはサテライトＤＮＡのうちの１つ、２つ、３つ、４つ、または５つを含む。

がん関連低メチル化を示す例示的な特定のゲノム領域は、例えばｈｇ１９またはｈｇ３８ヒトゲノム構築物に従って、ヒト第１染色体のヌクレオチド８４０３５６５～８９５３７０８および１５１１０４７０１～１５１１０６０３５を含む。一部の実施形態では、低メチル化可変標的領域は、重複するか、またはこれらの領域の１つもしくは両方を含む。

ｉｉｉ．ＣＴＣＦ結合領域
ＣＴＣＦは、クロマチンの組織化に寄与し、しばしばコヒーシンと共局在するＤＮＡ結合タンパク質である。ＣＴＣＦ結合部位の摂動は、多様な異なるがんにおいて報告されている。例えば、２０１５年６月８日にオンライン発行された、Ｋａｔａｉｎｅｎｅｔａｌ．，ＮａｔｕｒｅＧｅｎｅｔｉｃｓ，ｄｏｉ：１０．１０３８／ｎｇ．３３３５；Ｇｕｏｅｔａｌ．，Ｎａｔ．Ｃｏｍｍｕｎ．９：１５２０（２０１８）を参照されたい。ＣＴＣＦ結合は、シーケンシングによって、例えば断片長解析を通して検出することができる、ｃｆＤＮＡの認識可能なパターンをもたらす。例えば、シーケンシングに基づく断片長解析に関する詳細は、その各々が参照により本明細書に組み込まれる、Ｓｎｙｄｅｒｅｔａｌ．，Ｃｅｌｌ１６４：５７－６８（２０１６）；ＷＯ２０１８／００９７２３号；および米国特許出願公開第２０１７０２１１１４３Ａ１号に提供されている。

このように、ＣＴＣＦ結合の摂動は、ｃｆＤＮＡの断片化パターンの変動をもたらす。そのため、ＣＴＣＦ結合部位は、１つのタイプの断片化可変標的領域を表す。

多くの公知のＣＴＣＦ結合部位が存在する。例えば、インターネット上のｉｎｓｕｌａｔｏｒｄｂ．ｕｔｈｓｃ．ｅｄｕ／で入手可能であるＣＴＣＦＢＳＤＢ（ＣＴＣＦＢｉｎｄｉｎｇＳｉｔｅＤａｔａｂａｓｅ）；Ｃｕｄｄａｐａｈｅｔａｌ．，ＧｅｎｏｍｅＲｅｓ．１９：２４－３２（２００９）；Ｍａｒｔｉｎｅｔａｌ．，Ｎａｔ．Ｓｔｒｕｃｔ．Ｍｏｌ．Ｂｉｏｌ．１８：７０８－１４（２０１１）；Ｒｈｅｅｅｔａｌ．，Ｃｅｌｌ．１４７：１４０８－１９（２０１１）を参照されたく、それらはその各々が参照により本明細書に組み込まれる。例示的なＣＴＣＦ結合部位は、ｈｇ１９またはｈｇ３８ヒトゲノム構築物に従って、第８染色体上のヌクレオチド５６０１４９５５～５６０１６１６１および第１３染色体上のヌクレオチド９５３５９１６９～９５３６０４７３である。

したがって、一部の実施形態では、エピジェネティック標的領域セットは、ＣＴＣＦ結合領域を含む。一部の実施形態では、ＣＴＣＦ結合領域は、少なくとも１０、２０、５０、１００、２００、もしくは５００個のＣＴＣＦ結合領域、または１０～２０、２０～５０、５０～１００、１００～２００、２００～５００、もしくは５００～１０００個のＣＴＣＦ結合領域、例えば上記のまたはＣＴＣＦＢＳＤＢもしくは上記で引用したＣｕｄｄａｐａｈら、Ｍａｒｔｉｎら、もしくはＲｈｅｅらの論文の１つもしくは複数におけるＣＴＣＦ結合領域を含む。

一部の実施形態では、ＣＴＣＦ部位の少なくとも一部はメチル化されていてもメチル化されていなくてもよく、メチル化状態は、細胞ががん細胞であるか否かと相関する。一部の実施形態では、エピジェネティック標的領域セットは、ＣＴＣＦ結合部位の少なくとも１００ｂｐ、少なくとも２００ｂｐ、少なくとも３００ｂｐ、少なくとも４００ｂｐ、少なくとも５００ｂｐ、少なくとも７５０ｂｐ、少なくとも１０００ｂｐ上流および／または下流の領域を含む。

ｉｖ．転写開始部位
転写開始部位もまた、新生物細胞において摂動を示し得る。例えば、造血系列の健康な細胞における様々な転写開始部位でのヌクレオソーム組織化は、健康な個体におけるｃｆＤＮＡに実質的に寄与するが、新生物細胞におけるそれらの転写開始部位でのヌクレオソーム組織化とは異なり得る。これは、異なるｃｆＤＮＡパターンをもたらすが、これらは例えば、一般的にＳｎｙｄｅｒｅｔａｌ．，Ｃｅｌｌ１６４：５７－６８（２０１６）；ＷＯ２０１８／００９７２３号；および米国特許出願公開第２０１７０２１１１４３Ａ１号において考察されるように、シーケンシングによって検出することができる。

このように、転写開始部位の摂動もまた、ｃｆＤＮＡの断片化パターンの変動をもたらす。そのため、転写開始部位もまた、１つのタイプの断片化可変標的領域を表す。

ヒト転写開始部位は、インターネット上のｄｂｔｓｓ．ｈｇｃ．ｊｐで利用可能なＤＢＴＳＳ（ＤａｔａＢａｓｅｏｆＨｕｍａｎＴｒａｎｓｃｒｉｐｔｉｏｎＳｔａｒｔＳｉｔｅｓ）から入手可能であり、参照により本明細書に組み込まれる、Ｙａｍａｓｈｉｔａｅｔａｌ．，ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．３４（Ｄａｔａｂａｓｅｉｓｓｕｅ）：Ｄ８６－Ｄ８９（２００６）に記載されている。

したがって、一部の実施形態では、エピジェネティック標的領域セットは、転写開始部位を含む。一部の実施形態では、転写開始部位は、少なくとも１０、２０、５０、１００、２００、もしくは５００個の転写開始部位、または１０～２０、２０～５０、５０～１００、１００～２００、２００～５００、もしくは５００～１０００個の転写開始部位、例えばＤＢＴＳＳに記載される転写開始部位を含む。一部の実施形態では、転写開始部位の少なくとも一部はメチル化されていてもメチル化されていなくてもよく、メチル化状態は、細胞ががん細胞であるか否かと相関する。一部の実施形態では、エピジェネティック標的領域セットは、転写開始部位の少なくとも１００ｂｐ、少なくとも２００ｂｐ、少なくとも３００ｂｐ、少なくとも４００ｂｐ、少なくとも５００ｂｐ、少なくとも７５０ｂｐ、少なくとも１０００ｂｐ上流および／または下流の領域を含む。

ｖ．コピー数変動；局所的増幅
局所的増幅等のコピー数変動は、体細胞変異であるが、これらは、メチル化の変化等のある特定のエピジェネティック変化を検出するためのアプローチと類似の様式でリード頻度に基づきシーケンシングによって検出することができる。そのため、がんにおける局所的増幅等のコピー数変動を示し得る領域を、エピジェネティック標的領域セットに含めることができ、そうした領域は、ＡＲ、ＢＲＡＦ、ＣＣＮＤ１、ＣＣＮＤ２、ＣＣＮＥ１、ＣＤＫ４、ＣＤＫ６、ＥＧＦＲ、ＥＲＢＢ２、ＦＧＦＲ１、ＦＧＦＲ２、ＫＩＴ、ＫＲＡＳ、ＭＥＴ、ＭＹＣ、ＰＤＧＦＲＡ、ＰＩＫ３ＣＡ、およびＲＡＦ１のうちの１つまたは複数を含み得る。例えば一部の実施形態では、エピジェネティック標的領域セットは、前述の標的の少なくとも２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、または１８個を含む。

ｉｖ．メチル化対照領域
データの検証を容易にするために対照領域を含めることは有用であり得る。一部の実施形態では、エピジェネティック標的領域セットは、ＤＮＡががん細胞または正常細胞に由来するか否かにかかわらず、本質的に全ての試料においてメチル化されているまたはメチル化されていないと予想される対照領域を含む。一部の実施形態では、エピジェネティック標的領域セットは、本質的に全ての試料において低メチル化されると予想される対照低メチル化領域を含む。一部の実施形態では、エピジェネティック標的領域セットは、本質的に全ての試料において高メチル化されると予想される対照高メチル化領域を含む。

ｂ．配列可変標的領域セット
一部の実施形態では、配列可変標的領域セットは、がんにおいて体細胞変異（本明細書においてがん関連変異と呼ぶ）を受けることが公知である複数の領域を含む。したがって、方法は、配列可変標的領域セットに対応するｃｆＤＮＡ分子ががん関連変異を含むか否かを決定するステップを含み得る。

一部の実施形態では、配列可変標的領域セットは、がんを有する対象の既定の比率が、パネルにおける１つまたは複数の異なる遺伝子またはゲノム領域において遺伝子バリアントまたは腫瘍マーカーを示すように選択される複数の異なる遺伝子またはゲノム領域（「パネル」）を標的とする。パネルは、シーケンシング領域を固定数の塩基対に限定するように選択され得る。パネルは、例えば、本明細書において他所で記載されるようにプローブの親和性および／または量を調節することによって、ＤＮＡの所望の量をシーケンシングするように選択され得る。パネルはさらに、所望の配列リードの深度を達成するように選択され得る。パネルは、シーケンシングされた塩基対の量に関して所望の配列リード深度または配列リードカバレッジを達成するように選択され得る。パネルは、試料中の１つまたは複数の遺伝子バリアントの検出に関して、理論的感度、理論的特異度、および／または理論的精度を達成するように選択され得る。

領域のパネルを検出するためのプローブは、目的のゲノム領域（ホットスポット領域）ならびにヌクレオソーム認識プローブ（例えば、ＫＲＡＳコドン１２および１３）を検出するためのプローブを含み得、ヌクレオソーム結合パターンおよびＧＣ配列組成によって影響を受けるｃｆＤＮＡカバレッジおよび断片サイズ変動の解析に基づいて捕捉を最適化するように設計され得る。本明細書において使用される領域はまた、ヌクレオソーム位置およびＧＣモデルに基づいて最適化された非ホットスポット領域も含み得る。

目的のゲノム位置の一覧の例は、表３および表４に見出され得る。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表３の遺伝子の少なくとも５個、少なくとも１０個、少なくとも１５個、少なくとも２０個、少なくとも２５個、少なくとも３０個、少なくとも３５個、少なくとも４０個、少なくとも４５個、少なくとも５０個、少なくとも５５個、少なくとも６０個、少なくとも６５個、または７０個のうちの少なくとも一部を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表３のＳＮＶの少なくとも５個、少なくとも１０個、少なくとも１５個、少なくとも２０個、少なくとも２５個、少なくとも３０個、少なくとも３５個、少なくとも４０個、少なくとも４５個、少なくとも５０個、少なくとも５５個、少なくとも６０個、少なくとも６５個、または７０個を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表３の融合の少なくとも１個、少なくとも２個、少なくとも３個、少なくとも４個、少なくとも５個、または６個を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表３のインデルの少なくとも１個、少なくとも２個、または３個のうちの少なくとも一部を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表４の遺伝子の少なくとも５個、少なくとも１０個、少なくとも１５個、少なくとも２０個、少なくとも２５個、少なくとも３０個、少なくとも３５個、少なくとも４０個、少なくとも４５個、少なくとも５０個、少なくとも５５個、少なくとも６０個、少なくとも６５個、少なくとも７０個、または７３個のうちの少なくとも一部を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表４のＳＮＶの少なくとも５個、少なくとも１０個、少なくとも１５個、少なくとも２０個、少なくとも２５個、少なくとも３０個、少なくとも３５個、少なくとも４０個、少なくとも４５個、少なくとも５０個、少なくとも５５個、少なくとも６０個、少なくとも６５個、少なくとも７０個、または７３個を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表４の融合の少なくとも１個、少なくとも２個、少なくとも３個、少なくとも４個、少なくとも５個、または６個を含む。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表４のインデルの少なくとも１個、少なくとも２個、少なくとも３個、少なくとも４個、少なくとも５個、少なくとも６個、少なくとも７個、少なくとも８個、少なくとも９個、少なくとも１０個、少なくとも１１個、少なくとも１２個、少なくとも１３個、少なくとも１４個、少なくとも１５個、少なくとも１６個、少なくとも１７個、または１８個のうちの少なくとも一部を含む。目的のこれらのゲノム位置の各々は、所与のパネルに関する骨格領域またはホットスポット領域として同定され得る。目的のホットスポットゲノム位置の一覧の例は、表５に見出され得る。表５における座標は、ヒトゲノムのｈｇ１９アセンブリに基づくが、当業者は他のアセンブリにも通じており、その選択されるアセンブリにおいて示されるエクソン、イントロン、コドン等に対応する座標セットを同定することができる。一部の実施形態では、本開示の方法において使用される配列可変標的領域セットは、表５の遺伝子の少なくとも１個、少なくとも２個、少なくとも３個、少なくとも４個、少なくとも５個、少なくとも６個、少なくとも７個、少なくとも８個、少なくとも９個、少なくとも１０個、少なくとも１１個、少なくとも１２個、少なくとも１３個、少なくとも１４個、少なくとも１５個、少なくとも１６個、少なくとも１７個、少なくとも１８個、少なくとも１９個、または少なくとも２０個のうちの少なくとも一部を含む。各々のホットスポットゲノム領域を、関連する遺伝子、それが存在する染色体、遺伝子座を表すゲノムの開始位置および終止位置、遺伝子座の塩基対の長さ、遺伝子によってカバーされるエクソン、ならびに目的の所与のゲノム領域が捉えようとし得る重要な特色（例えば、変異のタイプ）を含むいくつかの特徴と共に記載する。

加えてまたはあるいは、適した標的領域セットは、文献から入手可能である。例えば、参照により本明細書に組み込まれる、Ｇａｌｅｅｔａｌ．，ＰＬｏＳＯｎｅ１３：ｅ０１９４６３０（２０１８）は、配列可変標的領域セットの一部または全てとして使用することができる３５個のがんに関係する遺伝子標的のパネルを記載している。これらの３５個の標的は、ＡＫＴ１、ＡＬＫ、ＢＲＡＦ、ＣＣＮＤ１、ＣＤＫ２Ａ、ＣＴＮＮＢ１、ＥＧＦＲ、ＥＲＢＢ２、ＥＳＲ１、ＦＧＦＲ１、ＦＧＦＲ２、ＦＧＦＲ３、ＦＯＸＬ２、ＧＡＴＡ３、ＧＮＡ１１、ＧＮＡＱ、ＧＮＡＳ、ＨＲＡＳ、ＩＤＨ１、ＩＤＨ２、ＫＩＴ、ＫＲＡＳ、ＭＥＤ１２、ＭＥＴ、ＭＹＣ、ＮＦＥ２Ｌ２、ＮＲＡＳ、ＰＤＧＦＲＡ、ＰＩＫ３ＣＡ、ＰＰＰ２Ｒ１Ａ、ＰＴＥＮ、ＲＥＴ、ＳＴＫ１１、ＴＰ５３、およびＵ２ＡＦ１である。

一部の実施形態では、配列可変標的領域セットは、少なくとも１０、２０、３０、または３５個のがんに関係する遺伝子、例えば上記のがんに関係する遺伝子からの標的領域を含む。

Ｅ．シーケンシング
必要に応じてアダプターが隣接する試料核酸は、事前の増幅を伴いまたは伴わずに、一般にシーケンシングに供される。シーケンシング法または必要に応じて利用される市販のフォーマットには、例えばＳａｎｇｅｒシーケンシング、ハイスループットシーケンシング、パイロシーケンシング、合成によるシーケンシング、単分子シーケンシング、ナノポアに基づくシーケンシング、半導体シーケンシング、ライゲーションによるシーケンシング、ハイブリダイゼーションによるシーケンシング、ＲＮＡ－Ｓｅｑ（Ｉｌｌｕｍｉｎａ）、ＤｉｇｉｔａｌＧｅｎｅＥｘｐｒｅｓｓｉｏｎ（Ｈｅｌｉｃｏｓ）、次世代シーケンシング（ＮＧＳ）、合成による単分子シーケンシング（ＳＭＳＳ）（Ｈｅｌｉｃｏｓ）、大規模並列シーケンシング、ＣｌｏｎａｌＳｉｎｇｌｅＭｏｌｅｃｕｌｅＡｒｒａｙ（Ｓｏｌｅｘａ）、ショットガンシーケンシング、ＩｏｎＴｏｒｒｅｎｔ、ＯｘｆｏｒｄＮａｎｏｐｏｒｅ、ＲｏｃｈｅＧｅｎｉａ、マキサム－ギルバートシーケンシング、プライマーウォーキング、ＰａｃＢｉｏ、ＳＯＬｉＤ、ＩｏｎＴｏｒｒｅｎｔ、またはＮａｎｏｐｏｒｅプラットフォームを使用するシーケンシングが含まれる。シーケンシング反応は種々の試料処理ユニットで実施することができ、その中には複数のレーン、複数のチャネル、複数のウェル、または実質的に同時に複数の試料のセットを処理するその他の手段が含まれ得る。試料処理ユニットには、複数の試行を同時に処理することができる複数の試料チャンバーも含まれ得る。

シーケンシング反応は、がんのまたは他の疾患のマーカーを含むことが公知の１つまたは複数の核酸断片型または領域に対して実施され得る。シーケンシング反応は、試料中に存在する任意の核酸断片に対しても実施され得る。配列反応は、ゲノムの少なくとも約５％、１０％、１５％、２０％、２５％、３０％、４０％、５０％、６０％、７０％、８０％、９０％、９５％、９９％、９９．９％または１００％に対して実施され得る。他の例では、配列反応は、ゲノムの約５％、１０％、１５％、２０％、２５％、３０％、４０％、５０％、６０％、７０％、８０％、９０％、９５％、９９％、９９．９％または１００％未満に対して実施され得る。

同時シーケンシング反応は、多重シーケンシング手法を使用して実施してよい。一部の実施形態では、無細胞ポリヌクレオチドは、少なくとも約１０００、２０００、３０００、４０００、５０００、６０００、７０００、８０００、９０００、１００００、５００００、または１００，０００回のシーケンシング反応によってシーケンシングされる。他の実施形態では、無細胞ポリヌクレオチドは、約１０００、２０００、３０００、４０００、５０００、６０００、７０００、８０００、９０００、１００００、５００００、または１００，０００回未満のシーケンシング反応によってシーケンシングされる。シーケンシング反応は、典型的には逐次的にまたは同時に実施される。その後のデータ解析は一般にシーケンシング反応の全部または一部について実施される。一部の実施形態では、データ解析は少なくとも約１０００、２０００、３０００、４０００、５０００、６０００、７０００、８０００、９０００、１００００、５００００、または１００，０００回のシーケンシング反応について実施される。他の実施形態では、データ解析は約１０００、２０００、３０００、４０００、５０００、６０００、７０００、８０００、９０００、１００００、５００００、または１００，０００回未満のシーケンシング反応について実施してよい。リード深度の例は、遺伝子座（例えば塩基の位置）あたり約１０００～約５００００リードである。

Ｆ．解析
シーケンシングは、複数のシーケンシングリードまたはリードを生成し得る。シーケンシングリードまたはリードは、長さが約１５０塩基未満または長さが約９０塩基未満のヌクレオチドデータの配列を含み得る。一部の実施形態では、リードは、長さが約８０塩基と約９０塩基との間、例えば、約８５塩基である。一部の実施形態では、本開示の方法は、例えば、長さが約５０塩基または約３０塩基未満の非常に短いリードに適用される。シーケンシングリードデータは、配列データおよびメタ情報を含み得る。配列リードデータは、例えば、ＶＣＦファイル、ＦＡＳＴＡファイルまたはＦＡＳＴＱファイルを含む任意の好適なファイルフォーマットで記憶することができる。

ＦＡＳＴＡは、配列データベースを検索するためのコンピュータプログラムを指し得、ＦＡＳＴＡという名称は標準ファイルフォーマットをも指し得る。例えば、ＦＡＳＴＡは、例えばその全体がこれにより参照により本明細書に組み込まれる、Pearson & Lipman, 1988, Improved tools for biological sequence comparison, PNAS 85:2444-2448に記載されている。ＦＡＳＴＡフォーマットにおける配列は１行の説明で始まり、複数行の配列データが続く。説明行は第１欄における「より大（＞）」符号によって配列データから区別される。「＞」符号に続く単語は配列の識別子であり、行の残りは説明である（いずれも任意）。「＞」と識別子の第１文字との間にスペースがあってはならない。テキストのすべての行は８０字より短いことが推奨されている。「＞」で始まる別の行が現れた場合には配列は終了する。これは別の配列の始まりを示す。

ＦＡＳＴＱフォーマットは、生物学的配列（通常、ヌクレオチド配列）とそれに対応する品質スコアとの両方を記憶するための、テキストに基づくフォーマットである。これはＦＡＳＴＡフォーマットに類似しているが、配列データに続く品質スコアを有する。簡略のため、配列文字と品質スコアの両方が単一のＡＳＣＩＩ文字によってコードされている。ＦＡＳＴＱフォーマットは、例えば、これにより全体が参照により本明細書に組み込まれる、Ｃｏｃｋｅｔａｌ．（“ＴｈｅＳａｎｇｅｒＦＡＳＴＱｆｉｌｅｆｏｒｍａｔｆｏｒｓｅｑｕｅｎｃｅｓｗｉｔｈｑｕａｌｉｔｙｓｃｏｒｅｓ，ａｎｄｔｈｅＳｏｌｅｘａ／ＩｌｌｕｍｉｎａＦＡＳＴＱｖａｒｉａｎｔｓ，” ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ３８（６）：１７６７－１７７１，２００９）に記載されているＩｌｌｕｍｉｎａのＧｅｎｏｍｅＡｎａｌｙｚｅｒ等のハイスループットシーケンシング装置の出力を記憶するための事実上の標準である。

ＦＡＳＴＡおよびＦＡＳＴＱのファイルについて、メタ情報は説明行を含み、配列データの行を含まない。一部の実施形態では、ＦＡＳＴＱファイルについて、メタ情報は品質スコアを含む。ＦＡＳＴＡおよびＦＡＳＴＱのファイルについて、配列データは説明行の後に始まり、典型的には必要に応じて「－」を有するＩＵＰＡＣ多義コードのあるサブセットを使用して存在する。一実施形態では、配列データは、必要に応じて任意に「－」またはＵ（例えばギャップまたはウラシルを表わす）を含むＡ、Ｔ、Ｃ、Ｇ、およびＮ文字を使用し得る。

一部の実施形態では、少なくとも１つのマスター配列リードファイルおよび出力ファイルが、（例えばＡＳＣＩＩ、ＩＳＯ／ＩＥＣ６４６、ＥＢＣＤＩＣ、ＵＴＦ－８、またはＵＴＦ－１６等のコーディングを使用して）プレインテキストファイルとして記憶される。本開示によって提供されるコンピュータシステムは、プレインテキストファイルを開くことができるテキストエディタープログラムを含み得る。テキストエディタープログラムは、コンピュータスクリーン上にテキストファイル（例えばプレインテキストファイル）の内容を提示して、（例えばモニター、キーボード、およびマウスを使用して）人がテキストを編集することを可能にすることができるコンピュータプログラムを意味し得る。テキストエディターの例には、限定なくＭｉｃｒｏｓｏｆｔＷｏｒｄ、ｅｍａｃｓ、ｐｉｃｏ、ｖｉ、ＢＢＥｄｉｔ、およびＴｅｘｔＷｒａｎｇｌｅｒが含まれる。テキストエディタープログラムは、コンピュータスクリーン上にプレインテキストファイルを表示し、メタ情報および配列リードを人が読めるフォーマットで（例えばバイナリーコードでなく、その代わりに印刷または手書きで使用されるような英数字を使用して）示すことができる。

ＦＡＳＴＡまたはＦＡＳＴＱファイルを参照して方法を論じたが、本開示の方法およびシステムは、例えばＶａｒｉａｎｔＣａｌｌＦｏｒｍａｔ（ＶＣＦ）フォーマットのファイルを含む任意の好適な配列ファイルフォーマットを圧縮するために使用し得る。典型的なＶＣＦファイルは、ヘッダーセクションとデータセクションとを含み得る。ヘッダーは、それぞれが文字「＃＃」で始まる任意の数のメタ情報行、および単一の「＃」文字で始まるＴＡＢで区切られたフィールド定義行を含む。フィールド定義行は必須の８個の欄を命名し、ボディセクションはフィールド定義行によって定義された欄を埋めるデータの行を含有する。ＶＣＦフォーマットは、例えばこれによりその全体がこれにより参照により組み込まれる、Danecek et al. ("The variant call format and VCF tools," Bioinformatics 27(15):2156-2158, 2011)に記載されている。ヘッダーセクションは圧縮されたファイルに書き込むメタ情報として処理され得、データセクションはそのそれぞれが固有のものであった場合のみにマスターファイルに記憶される行として処理され得る。

一部の実施形態は、シーケンシングリードのアセンブリを提供する。例えば、アラインメントによるアセンブリでは、シーケンシングリードは相互にアラインメントされるか、または参照配列に対してアラインメントされる。それぞれのリードを今度は参照ゲノムに対してアラインメントすることによって、リードのすべてが相互の関係において位置決めされてアセンブリが生成される。さらに、シーケンシングリードを参照配列に対してアラインメントする、またはマッピングすることは、シーケンシングリード内のバリアント配列を同定するためにも使用され得る。本明細書に記載した方法およびシステムと組み合わせてバリアント配列を同定することを使用して、疾患もしくは状態の診断もしくは予後判定をさらに助け、または処置の決定を導くことができる。

一部の実施形態では、ステップのいずれかまたはすべては自動化される。あるいは、本開示の方法は、全体としてまたは部分的に、例えばそれぞれが必要に応じてＣ＋＋等のコンパイラ型言語で書かれ、次いでコンパイルされバイナリとして配布される１つまたは複数の専用プログラムに具現化してもよい。本開示の方法は、全体としてまたは部分的に、既存の配列解析プラットフォーム内のモジュールとして、またはその内の機能を呼び出すことによって、実装してもよい。一部の実施形態では、本開示の方法は、すべてが単一の開始キュー（例えば、人の活動、別のコンピュータプログラム、または機械に起因する誘発事象の１つまたは組合せ）に応答して自動的に呼び出されるいくつかのステップを含む。したがって、本開示は、ステップのいずれかまたはステップの任意の組合せがキューに応答して自動的に起こり得る方法を提供する。「自動的に」は一般に、介在する人の入力、影響、または相互作用がないこと（例えば、元のまたはキュー以前の人の活動にのみ応答すること）を意味する。

本開示の方法は、対象の核酸試料の正確かつ感度の良い解釈を含む種々の形態の出力をも包含し得る。検索の出力はコンピュータファイルのフォーマットで提供され得る。一部の実施形態では、出力はＦＡＳＴＡファイル、ＦＡＳＴＱファイル、またはＶＣＦファイルである。出力を処理してテキストファイル、または、例えば、核酸の配列を参照ゲノムの配列にアラインメントさせた配列データを含有するＸＭＬファイルを生成させてもよい。他の実施形態では、処理によって参照ゲノムに対する対象核酸の１つまたは複数の変異を記述する座標またはストリングを含有する出力が得られる。アラインメントストリングには、ＳｉｍｐｌｅＵｎＧａｐｐｅｄＡｌｉｇｎｍｅｎｔＲｅｐｏｒｔ（ＳＵＧＡＲ）、ＶｅｒｂｏｓｅＵｓｅｆｕｌＬａｂｅｌｅｄＧａｐｐｅｄＡｌｉｇｎｍｅｎｔＲｅｐｏｒｔ（ＶＵＬＧＡＲ）、およびＣｏｍｐａｃｔＩｄｉｏｓｙｎｃｒａｔｉｃＧａｐｐｅｄＡｌｉｇｎｍｅｎｔＲｅｐｏｒｔ（ＣＩＧＡＲ）（例えばこれにより全体が参照により本明細書に組み込まれる、Ｎｉｎｇｅｔａｌ．，ＧｅｎｏｍｅＲｅｓｅａｒｃｈ１１（１０）：１７２５－９，２００１に記載されている）が含まれ得る。これらのストリングは、例えばＥｕｒｏｐｅａｎＢｉｏｉｎｆｏｒｍａｔｉｃｓＩｎｓｔｉｔｕｔｅ（Ｈｉｎｘｔｏｎ、ＵＫ）のＥｘｏｎｅｒａｔｅ配列アラインメントソフトウェアで実装され得る。

一部の実施形態では、例えばＣＩＧＡＲストリングを含む配列アラインメントマップ（ＳＡＭ）またはバイナリアラインメントマップ（ＢＡＭ）ファイル等の配列アラインメントが生成される（ＳＡＭフォーマットは、例えば、これにより全体が参照により本明細書に組み込まれる、Ｌｉｅｔａｌ．， “ＴｈｅＳｅｑｕｅｎｃｅＡｌｉｇｎｍｅｎｔ／ＭａｐｆｏｒｍａｔａｎｄＳＡＭｔｏｏｌｓ，” Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ，２５（１６）：２０７８－９，２００９に記載されている）。一部の実施形態では、ＣＩＧＡＲは１行あたり１個のギャップアラインメントを呈示しまたは含む。ＣＩＧＡＲは、ＣＩＧＡＲストリングとして報告される圧縮されたペアワイズアラインメントフォーマットである。ＣＩＧＡＲストリングは、長い（例えばゲノムの）ペアワイズアラインメントを表わすのに有用であろう。ＣＩＧＡＲストリングは、参照ゲノム配列に対するリードのアラインメントを表わすＳＡＭフォーマットで使用され得る。

ＣＩＧＡＲストリングは、確立されたモチーフに従い得る。それぞれの文字の前には事象のベースカウントを与える数字がある。使用する文字にはＭ、Ｉ、Ｄ、Ｎ、およびＳが含まれ得る（Ｍ＝マッチ、Ｉ＝挿入、Ｄ＝欠失、Ｎ＝ギャップ、Ｓ＝置換）。ＣＩＧＡＲストリングは、マッチ／ミスマッチおよび欠失（またはギャップ）の配列を定義する。例えば、ＣＩＧＡＲストリング２ＭＤ３Ｍ２Ｄ２Ｍは、アラインメントが２つのマッチ、１つの欠失（いくらかスペースを節約するため、数字１は省略する）、３つのマッチ、２つの欠失、および２つのマッチを含むことを示し得る。

一部の実施形態では、一方または両方の末端に一本鎖のオーバーハングを有する二本鎖核酸に平滑末端を酵素的に形成することによるシーケンシングのための核酸の集団が調製される。これらの実施形態では、集団は典型的にはヌクレオチド（例えばＡ、Ｃ、Ｇ、およびＴまたはＵ）の存在下に５’－３’ＤＮＡポリメラーゼ活性および３’－５’エキソヌクレアーゼ活性を有する酵素で処理される。必要に応じて使用され得る酵素またはその触媒断片の例には、Ｋｌｅｎｏｗ大断片およびＴ４ポリメラーゼが含まれる。５’オーバーハングでは、酵素は典型的には対向するストランドの上の後退した３’末端を、それが５’末端と重なって平滑末端を生成するまで伸長する。３’オーバーハングでは、酵素は一般に３’末端から対向するストランドの５’末端まで、時にはそれを越えて、消化する。この消化が対向するストランドの５’末端を越えて進めば、ギャップは５’オーバーハングに使用する同じポリメラーゼ活性を有する酵素によってフィルインされ得る。二本鎖核酸における平滑末端の形成により、例えばアダプターの結合およびその後の増幅が容易になる。

一部の実施形態では、核酸の集団はさらなる処理、例えば一本鎖核酸から二本鎖核酸への変換および／またはＲＮＡからＤＮＡ（例えば相補的ＤＮＡ、即ちｃＤＮＡ）への変換に供される。これらの形態の核酸も、必要に応じてアダプターに連結され、増幅される。

事前の増幅ありとなしで、上記の平滑末端を形成するプロセスに供する核酸、および必要に応じて試料中の他の核酸をシーケンシングして、シーケンシングされた核酸を産生することができる。シーケンシングされた核酸は、核酸の配列（例えば配列情報）、またはその配列が決定された核酸と称し得る。シーケンシングは、試料中の個々の核酸分子の増幅産物のコンセンサス配列から直接または間接的に試料中の個々の核酸分子の配列データを提供するように、実施することができる。

一部の実施形態では、平滑末端の形成の後の試料中の一本鎖オーバーハングを有する二本鎖核酸は、バーコードを含むアダプターに両末端で連結され、シーケンシングは核酸配列およびアダプターによって導入されたインラインバーコードを決定する。平滑末端ＤＮＡ分子は、必要に応じて、少なくとも部分的に二本鎖のアダプター（例えばＹ字形またはベル形のアダプター）の平滑末端にライゲーションされる。あるいは、試料核酸およびアダプターの平滑末端に相補的ヌクレオチドのテイルを付けてライゲーションを容易にする（例えば付着末端ライゲーションのため）ことができる。

核酸試料は、典型的には同じ核酸の任意の２つのコピーが両末端に連結されたアダプターからの同じアダプターバーコードの組合せを受ける確率が低くなる（例えば約１または０．１％未満）ように、十分な数のアダプターと接触させられる。このようにしてアダプターを使用することにより、参照核酸上の同じ出発点および停止点を有し、同じバーコードの組合せに連結された核酸配列のファミリーの特定が可能になる。そのようなファミリーは、増幅前の試料中の核酸の増幅産物の配列を表わし得る。ファミリーメンバーの配列をコンパイルして、平滑末端の形成およびアダプターの結合によって改変された元の試料中の核酸分子のコンセンサスヌクレオチドまたは完全なコンセンサス配列を誘導することができる。換言すれば、試料中の核酸の特定された位置を占めるヌクレオチドは、ファミリーメンバー配列における対応する位置を占めるヌクレオチドのコンセンサスであると決定することができる。ファミリーには、二本鎖核酸の一方または両方のストランドの配列が含まれ得る。ファミリーのメンバーが二本鎖核酸からの両方のストランドの配列を含むならば、配列をコンパイルしてコンセンサスヌクレオチドまたは配列を誘導する目的のために、１つのストランドの配列をその相補体に変換することができる。いくつかのファミリーは単一メンバーの配列のみを含む。この場合には、この配列は増幅前の試料中の核酸の配列とみなすことができる。あるいは、単一メンバー配列のみを有するファミリーを、その後の解析から除外してもよい。

シーケンシングされた核酸におけるヌクレオチドの変動（例えばＳＮＶまたはインデル）は、シーケンシングされた核酸を参照配列と比較することによって決定することができる。参照配列は既知の配列、例えば対象からの既知の全部または一部のゲノム配列（例えばヒト対象の全ゲノム配列）であることが多い。参照配列は、例えばｈＧ１９またはｈＧ３８であってよい。上記のように、シーケンシングされた核酸は、試料中の核酸について直接決定された配列、またはそのような核酸の増幅産物の配列のコンセンサスを表わし得る。比較は、参照配列の１つまたは複数の指定された位置で実施することができる。シーケンシングされた核酸のサブセットは、それぞれの配列が最大限にアラインメントされた場合に、参照配列の指定された位置に対応する位置を含んで特定することができる。そのようなサブセットの中で、シーケンシングされた核酸がもしあれば、指定された位置にヌクレオチドの変動を含むか、必要に応じてもしあれば、参照ヌクレオチドを含む（例えば参照配列と同じ）かを、決定することができる。ヌクレオチドバリアントを含むサブセット中のシーケンシングされた核酸の数が選択した閾値を超えれば、バリアントヌクレオチドを指定された位置においてコールすることができる。閾値は、他の可能性の中でも、ヌクレオチドバリアントを含むサブセットの中の少なくとも１、２、３、４、５、６、７、８、９、もしくは１０個等のシーケンシングされた核酸の単純な数であってもよく、またはヌクレオチドバリアントを含むサブセットの中のシーケンシングされた核酸の少なくとも０．５、１、２、３、４、５、１０、１５、もしくは２０等の比であってもよい。参照配列の中の任意の指定された目的の位置について、比較を繰り返すことができる。時には、参照配列の少なくとも約２０、１００、２００、または３００の隣接する位置、例えば約２０～５００、または約５０～３００の隣接する位置を占める指定された位置について、比較を実施してもよい。

本明細書に記載したフォーマットおよび適用を含む核酸シーケンシングに関するさらなる詳細は、例えば、そのそれぞれがこれにより全体が参照により本明細書に組み込まれる、Ｌｅｖｙｅｔａｌ．，ＡｎｎｕａｌＲｅｖｉｅｗｏｆＧｅｎｏｍｉｃｓａｎｄＨｕｍａｎＧｅｎｅｔｉｃｓ，１７：９５－１１５（２０１６）、Ｌｉｕｅｔａｌ．，Ｊ．ｏｆＢｉｏｍｅｄｉｃｉｎｅａｎｄＢｉｏｔｅｃｈｎｏｌｏｇｙ，Ｖｏｌｕｍｅ２０１２，ＡｒｔｉｃｌｅＩＤ２５１３６４：１－１１（２０１２）、Ｖｏｅｌｋｅｒｄｉｎｇｅｔａｌ．，ＣｌｉｎｉｃａｌＣｈｅｍ．，５５：６４１－６５８（２００９）、ＭａｃＬｅａｎｅｔａｌ．，ＮａｔｕｒｅＲｅｖ．Ｍｉｃｒｏｂｉｏｌ．，７：２８７－２９６（２００９）、Ａｓｔｉｅｒｅｔａｌ．，ＪＡｍＣｈｅｍＳｏｃ．，１２８（５）：１７０５－１０（２００６）、米国特許第６，２１０，８９１号、米国特許第６，２５８，５６８号、米国特許第６，８３３，２４６号、米国特許第７，１１５，４００号、米国特許第６，９６９，４８８号、米国特許第５，９１２，１４８号、米国特許第６，１３０，０７３号、米国特許第７，１６９，５６０号、米国特許第７，２８２，３３７号、米国特許第７，４８２，１２０号、米国特許第７，５０１，２４５号、米国特許第６，８１８，３９５号、米国特許第６，９１１，３４５号、米国特許第７，５０１，２４５号、米国特許第７，３２９，４９２号、米国特許第７，１７０，０５０号、米国特許第７，３０２，１４６号、米国特許第７，３１３，３０８号、および米国特許第７，４７６，５０３号にも提供されている。

ＩＶ．コンピュータシステム
本開示の方法は、コンピュータシステムを使用して、またはその助けによって、実装することができる。例えば、そのような方法は、（ｉ）担体核酸分子のセットをポリヌクレオチド試料に添加して、第１の試料を生成するステップであって、担体核酸分子のセットが、（ａ）非メチル化担体核酸分子の少なくとも１つのサブセット；および／または（ｂ）メチル化担体核酸分子の少なくとも１つのサブセットを含み、担体核酸分子の少なくとも一方の末端が、ライゲーションを防止するように改変され、非メチル化担体核酸分子が、メチル化ヌクレオチドを含まず、メチル化担体核酸分子が、１つまたは複数のメチル化ヌクレオチドを含む、ステップ；（ｉｉ）第１の試料を、メチル化ポリヌクレオチドに選択的に結合する捕捉剤を使用して、少なくとも２つの分配されたセットに分配し、それにより、分配された試料を生成するステップ；（ｉｉｉ）分配された試料の少なくとも一部を処理して、処理された試料を生成するステップであって、この処理は、以下：（ａ）タグ付けするステップ、（ｂ）増幅するステップ、および（ｃ）目的の特異的領域について分子を富化するステップのうち少なくとも１つを含む、ステップ；（ｉｖ）処理された試料の少なくとも一部をシーケンシングして、シーケンシングリードのセットを生成するステップ；および（ｖ）シーケンシングリードのセットの少なくとも一部を解析して、腫瘍の存在または非存在を検出するステップを含み得る。この実施形態では、このシステムは、担体核酸分子を添加する、分配する、タグ付けする、増幅する、富化するおよびシーケンシングするためのコンポーネントを含む。

図７は、本開示の方法を実装するようにプログラムされるか、または他の方法で構成されたコンピュータシステム７０１を示す。コンピュータシステム７０１は種々の態様の試料調製、シーケンシングおよび／または解析を制御することができる。一部の例では、コンピュータシステム７０１は、核酸のシーケンシングを含む試料調製および試料解析を実施するように構成されている。

コンピュータシステム７０１は中央処理ユニット（ＣＰＵ、本明細書では「プロセッサー」および「コンピュータプロセッサー」ともいう）７０５を含み、これは、シングルコアもしくはマルチコアのプロセッサーでよく、または並列処理のための複数のプロセッサーでもよい。コンピュータシステム７０１は、メモリーまたはメモリーロケーション７１０（例えば、ランダムアクセスメモリー、リードオンリーメモリー、フラッシュメモリー）、電子的記憶ユニット７１５（例えば、ハードディスク）、１つまたは複数の他のシステムと通信するための通信インターフェース７２０（例えば、ネットワークアダプター）、ならびに周辺デバイス７２５、例えば、キャッシュ、他のメモリー、データストレージ、および／または電子的ディスプレイアダプターも含む。メモリー７１０、記憶ユニット７１５、インターフェース７２０および周辺デバイス７２５は、マザーボード等の通信ネットワークまたはバス（実線）を通じてＣＰＵ７０５と通信する。記憶ユニット７１５は、データを記憶するためのデータ記憶ユニット（またはデータレポジトリ）であってよい。コンピュータシステム７０１は、通信インターフェース７２０の助けによってコンピュータネットワーク７３０に作動可能に連結することができる。コンピュータネットワーク７３０は、インターネット(Internet)、インターネット(internet)および／もしくはエクストラネット、またはインターネットと通信するイントラネットおよび／もしくはエクストラネットであってよい。コンピュータネットワーク７３０は、一部の場合には、遠隔通信および／またはデータネットワークである。コンピュータネットワーク７３０は、１つまたは複数のコンピュータサーバを含んでよく、これは、分散コンピューティング、例えばクラウドコンピューティングを可能にすることができる。コンピュータネットワーク７３０は、コンピュータシステム７０１の助けがある一部の場合には、ピアツーピアネットワークを実装することができ、これは、デバイスがコンピュータシステム７０１に連結されてクライアントまたはサーバとして挙動することを可能にし得る。

ＣＰＵ７０５は機械可読命令のシーケンスを実行することができ、これはプログラムまたはソフトウェアに具現化することができる。命令はメモリーロケーション、例えばメモリー７１０に記憶してよい。ＣＰＵ７０５によって実施される演算の例には、フェッチ、解読、実行、およびライトバック（ｗｒｉｔｅｂａｃｋ）が含まれ得る。

記憶ユニット７１５は、ファイル、例えばドライバー、ライブラリ、および保存されたプログラムを記憶することができる。記憶ユニット７１５は、ユーザによって生成されたプログラムおよび記録されたセッション、ならびにプログラムに関連する出力を記憶することができる。記憶ユニット７１５は、ユーザデータ、例えばユーザの選好およびユーザプログラムを記憶することができる。一部の場合におけるコンピュータシステム７０１は、コンピュータシステム７０１の外部の、例えばイントラネットまたはインターネットを通じてコンピュータシステム７０１と通信するリモートサーバ上に位置するような１つまたは複数の追加的なデータ記憶ユニットを含み得る。データは、例えば通信ネットワークまたは物理的なデータ転送を使用して（例えば、ハードドライブ、サムドライブ、またはその他のデータ記憶機構を使用して）ある場所から別の場所に転送してよい。

コンピュータシステム７０１は、ネットワーク７３０を通じて１つまたは複数のリモートコンピュータシステムと通信することができる。実施形態について、コンピュータシステム７０１は、ユーザ（例えば、オペレータ）のリモートコンピュータシステムと通信することができる。リモートコンピュータシステムの例には、パーソナルコンピュータ（例えば、携帯ＰＣ）、スレートまたはタブレットＰＣ（例えば、Ａｐｐｌｅ（登録商標）ｉＰａｄ（登録商標）、Ｓａｍｓｕｎｇ（登録商標）ＧａｌａｘｙＴａｂ）、電話、スマートフォン（例えば、Ａｐｐｌｅ（登録商標）ｉＰｈｏｎｅ（登録商標）、Ａｎｄｒｏｉｄ可能デバイス、Ｂｌａｃｋｂｅｒｒｙ（登録商標））、またはパーソナルデジタルアシスタントが含まれる。ユーザは、ネットワーク７３０を介してコンピュータシステム７０１にアクセスすることができる。

本明細書に記載した方法は、コンピュータシステム７０１の電子的記憶場所、例えば、メモリー７１０または電子的記憶ユニット７１５等に記憶された機械（例えば、コンピュータプロセッサー）実行可能なコードによって実装することができる。機械実行可能または機械可読なコードは、ソフトウェアの形態で提供され得る。使用の間、コードはプロセッサー７０５によって実行され得る。一部の場合には、コードは、記憶ユニット７１５から取り出され、プロセッサー７０５による容易なアクセスのためにメモリー７１０に記憶される。一部の状況では、電子記憶ユニット７１５を除外することができ、機械実行可能な命令がメモリー７１０に記憶される。

ある態様では、本開示は、少なくとも１つの電子プロセッサーによって実行された場合に、（ｉ）担体核酸分子のセットをポリヌクレオチド試料に添加して、第１の試料を生成するステップであって、担体核酸分子のセットが、（ａ）非メチル化担体核酸分子の少なくとも１つのサブセット；および／または（ｂ）メチル化担体核酸分子の少なくとも１つのサブセットを含み、担体核酸分子の少なくとも一方の末端が、ライゲーションを防止するように改変され、非メチル化担体核酸分子が、メチル化ヌクレオチドを含まず、メチル化担体核酸分子が、１つまたは複数のメチル化ヌクレオチドを含む、ステップ；（ｉｉ）第１の試料を、メチル化ポリヌクレオチドに選択的に結合する捕捉剤を使用して、少なくとも２つの分配されたセットに分配し、それにより、分配された試料を生成するステップ；（ｉｉｉ）分配された試料の少なくとも一部を処理して、処理された試料を生成するステップであって、この処理は、以下：（ａ）タグ付けするステップ、（ｂ）増幅するステップ、および（ｃ）目的の特異的領域について分子を富化するステップのうち少なくとも１つを含む、ステップ；（ｉｖ）処理された試料の少なくとも一部をシーケンシングして、シーケンシングリードのセットを生成するステップ；および（ｖ）シーケンシングリードのセットの少なくとも一部を解析して、腫瘍の存在または非存在を検出するステップを含む方法を実行するコンピュータ実行可能命令を含む非一過性コンピュータ可読媒体を提供する。この実施形態では、コンピュータ可読媒体は、担体核酸分子を添加する、分配する、タグ付けする、増幅する、富化するおよびシーケンシングするために要求されるコンピュータ実行可能命令を含む。

コードは、コードを実行するように適合されたプロセッサーを有する機械で使用するためにプリコンパイルされ、かつ構成され得るか、または実行時にコンパイルすることができる。コードは、プリコンパイルされたものとして、またはコンパイルしつつコードを実行することを可能にするように選択され得るプログラミング言語で記述して供給することができる。

本明細書で提供するシステムおよび方法の態様、例えばコンピュータシステム７０１は、プログラミング中に具現化し得る。本技術の種々の態様は、典型的には機械（またはプロセッサー）実行可能なコードおよび／または機械可読媒体の型に含まれまたは具現化される関連するデータの形態で「製品」または「製造物品」として考えることができる。機械実行可能なコードは、電子的記憶ユニット、例えばメモリー（例えばリードオンリーメモリー、ランダムアクセスメモリー、フラッシュメモリー）またはハードディスクに記憶することができる。「記憶」型媒体には、コンピュータの有形のメモリー、プロセッサーもしくは同様のもの、またはその関連するモジュール、例えば種々の半導体メモリー、テープドライブ、ディスクドライブおよび同様のもののいずれかまたはすべてが含まれ、これらはソフトウェアプログラミングのため、いつでも非一過性記憶を提供し得る。

ソフトウェアの全部または一部は、時にはインターネットまたは他の種々の遠隔通信ネットワークを通じて通信してよい。そのような通信は、例えば１つのコンピュータまたはプロセッサーから別のコンピュータまたはプロセッサーへ、例えばマネージメントサーバまたはホストコンピュータからアプリケーションサーバのコンピュータプラットフォームへのソフトウェアのローディングを可能にし得る。したがって、ソフトウェアエレメントを有し得る別の型の媒体には、ローカルデバイスの間で物理的インターフェースにわたって、有線および光地上通信のネットワークを通じて、種々のエアリンクを介して使用されるもののような光、電気、および電磁波が含まれる。そのような波を運搬する物理的エレメント、例えば有線または無線のリンク、光リンク、または同様のものも、ソフトウェアを有する媒体と考えてよい。本明細書で使用される場合、非一過性な有形「記憶」媒体に制限しなければ、コンピュータまたは機械「可読媒体」等の用語は、実行のための命令をプロセッサーに提供することに寄与する任意の媒体を意味する。

したがって、機械可読媒体、例えばコンピュータ実行可能なコードは、有形記憶媒体、搬送波媒体、または物理的送信媒体を含むがこれらに限定されない多くの形態をとり得る。非揮発性記憶媒体には、例えば図に示すデータベース等を実装するために使用されるような任意のコンピュータ等の記憶デバイスのいずれか等の光または磁気のディスクが含まれる。揮発性記憶媒体には、そのようなコンピュータプラットフォームの主メモリー等のダイナミックメモリーが含まれる。有形送信媒体には、共軸ケーブル、銅線および光ファイバ（コンピュータシステム中のバスを含むワイヤを含む）が含まれる。搬送波送信媒体は、電気的もしくは電磁気的な信号、またはラジオ周波数（ＲＦ）および赤外（ＩＲ）データ通信中に生成されるもののような音響もしくは光の波の形態をとり得る。したがってコンピュータ可読媒体の一般的な形態には、例えばフロッピー（登録商標）ディスク、フレキシブルディスク、ハードディスク、磁気テープ、他の任意の磁気媒体、ＣＤ－ＲＯＭ、ＤＶＤもしくはＤＶＤ－ＲＯＭ、他の任意の光学媒体、パンチカード、紙テープ、穴のパターンを有する他の任意の物理的記憶媒体、ＲＡＭ、ＲＯＭ、ＰＲＯＭおよびＥＰＲＯＭ、ＦＬＡＳＨ（登録商標）－ＥＰＲＯＭ、他の任意のメモリーチップまたはカートリッジ、搬送波輸送データもしくは命令、そのような搬送波を輸送するケーブルもしくはリンク、またはそれからコンピュータがプログラミングコードおよび／またはデータを読み取ることができる他の任意の媒体が含まれる。コンピュータ可読媒体のこれらの形態の多くは、１つまたは複数の命令の１つまたは複数のシーケンスを実行のためにプロセッサーに搬送することに関与し得る。

コンピュータシステム７０１は、例えば試料分析の１つまたは複数の結果を提供するためのユーザインターフェース（ＵＩ）を含む電子的ディスプレイを含むか、またはそれと通信し得る。ＵＩの例には、限定なくグラフィカルユーザインターフェース（ＧＵＩ）およびウェブベースユーザインターフェースが含まれる。

コンピュータシステムおよびネットワーク、データベース、ならびにコンピュータプログラム製品に関するさらなる詳細は、例えば、そのそれぞれがこれにより全体が参照により本明細書に組み込まれるＰｅｔｅｒｓｏｎ，ＣｏｍｐｕｔｅｒＮｅｔｗｏｒｋｓ：ＡＳｙｓｔｅｍｓＡｐｐｒｏａｃｈ，ＭｏｒｇａｎＫａｕｆｍａｎｎ，５ｔｈＥｄ．（２０１１）、Ｋｕｒｏｓｅ，ＣｏｍｐｕｔｅｒＮｅｔｗｏｒｋｉｎｇ：ＡＴｏｐ－ＤｏｗｎＡｐｐｒｏａｃｈ，Ｐｅａｒｓｏｎ，７^ｔｈＥｄ．（２０１６）、Ｅｌｍａｓｒｉ，ＦｕｎｄａｍｅｎｔａｌｓｏｆＤａｔａｂａｓｅＳｙｓｔｅｍｓ，ＡｄｄｉｓｏｎＷｅｓｌｅｙ，６ｔｈＥｄ．（２０１０）、Ｃｏｒｏｎｅｌ，ＤａｔａｂａｓｅＳｙｓｔｅｍｓ：Ｄｅｓｉｇｎ，Ｉｍｐｌｅｍｅｎｔａｔｉｏｎ，＆Ｍａｎａｇｅｍｅｎｔ，ＣｅｎｇａｇｅＬｅａｒｎｉｎｇ，１１^ｔｈＥｄ．（２０１４）、Ｔｕｃｋｅｒ，ＰｒｏｇｒａｍｍｉｎｇＬａｎｇｕａｇｅｓ，ＭｃＧｒａｗ－ＨｉｌｌＳｃｉｅｎｃｅ／Ｅｎｇｉｎｅｅｒｉｎｇ／Ｍａｔｈ，２ｎｄＥｄ．（２００６）、およびＲｈｏｔｏｎ，ＣｌｏｕｄＣｏｍｐｕｔｉｎｇＡｒｃｈｉｔｅｃｔｅｄ：ＳｏｌｕｔｉｏｎＤｅｓｉｇｎＨａｎｄｂｏｏｋ，ＲｅｃｕｒｓｉｖｅＰｒｅｓｓ（２０１１）にも提供されている。

Ｖ．適用
Ａ．がんおよび他の疾患
一部の実施形態では、考慮している疾患は、ある型のがんである。そのようながんの非限定的な例には、胆管がん、膀胱がん、移行細胞癌、尿路上皮癌、脳がん、神経膠腫、星状細胞腫、乳癌、化生性癌、子宮頸がん、子宮頸部扁平上皮癌、直腸がん、結腸直腸癌、結腸がん、遺伝性非ポリポーシス性結腸直腸がん、結腸直腸腺癌、消化管間質腫瘍（ＧＩＳＴ）、子宮内膜癌、子宮内膜間質肉腫、食道がん、食道扁平上皮癌、食道腺癌、眼黒色腫、ブドウ膜黒色腫、胆嚢癌、胆嚢腺癌、腎細胞癌、明細胞腎細胞癌、移行細胞癌、尿路上皮癌、ウィルムス腫瘍、白血病、急性リンパ性白血病（ＡＬＬ）、急性骨髄性白血病（ＡＭＬ）、慢性リンパ性白血病（ＣＬＬ）、慢性骨髄性白血病（ＣＭＬ）、慢性骨髄単球性白血病（ＣＭＭＬ）、肝臓がん、肝臓癌、ヘパトーマ、肝細胞癌、胆管癌、肝芽腫、肺がん、非小細胞肺がん（ＮＳＣＬＣ）、中皮腫、Ｂ細胞リンパ腫、非ホジキンリンパ腫、びまん性大細胞型Ｂ細胞リンパ腫、マントル細胞リンパ腫、Ｔ細胞リンパ腫、非ホジキンリンパ腫、前駆体Ｔリンパ芽球性リンパ腫／白血病、末梢Ｔ細胞リンパ腫、多発性骨髄腫、鼻咽頭癌（ＮＰＣ）、神経芽腫、口腔咽頭がん、口腔扁平上皮癌、骨肉腫、卵巣癌、膵がん、膵管腺癌、偽乳頭状新生物（ｐｓｅｕｄｏｐａｐｉｌｌａｒｙｎｅｏｐｌａｓｍ）、腺房細胞癌、前立腺がん、前立腺腺癌、皮膚がん、黒色腫、悪性黒色腫、皮膚黒色腫、小腸癌、胃がん、胃癌、消化管間質腫瘍（ＧＩＳＴ）、子宮がんまたは子宮肉腫が含まれる。

必要に応じて本明細書で開示した方法およびシステムを使用して評価される他の遺伝系疾患、障害、または状態の非限定的な例には、軟骨形成不全症、アルファ－１アンチトリプシン欠乏症、抗リン脂質症候群、自閉症、常染色体優性多発性嚢胞腎疾患、シャルコー・マリー・トゥース（ＣＭＴ）、ネコなき症、クローン病、嚢胞性線維症、ダーカム病、ダウン症候群、デュアンヌ症候群、デュシェンヌ筋ジストロフィー、第Ｖ因子ライデン栓友病、家族性高コレステロール血症、家族性地中海熱、脆弱性Ｘ症候群、ゴーシュ病、ヘモクロマトーシス、血友病、全前脳症、ハンチントン病、クラインフェルター症候群、マルファン症候群、筋強直性ジストロフィー、神経線維腫、ヌーナン症候群、骨形成不全症、パーキンソン病、フェニルケトン尿症、ポーランド異形、ポルフィリン症、早老症、網膜色素変性、重症複合型免疫不全（ＳＣＩＤ）、鎌状赤血球症、脊髄性筋萎縮症、テイサックス病、サラセミア、トリメチルアミン尿症、ターナー症候群、口蓋心顔面症候群、ＷＡＧＲ症候群、ウィルソン病、または同様のものが含まれる。

Ｂ．試験対象におけるがんの再発のリスクを決定する方法および／または試験対象をその後のがん処置の候補として分類する方法
一部の実施形態では、本明細書で提供する方法は、試験対象におけるがんの再発のリスクを決定する方法である。一部の実施形態では、本明細書で提供する方法は、試験対象をその後のがん処置の候補として分類する方法である。

そのような方法のいずれかは、試験対象に対する１つまたは複数の以前のがんの処置後の１つまたは複数の予め選択した時点においてがんを有すると診断された試験対象から（例えば腫瘍細胞を起源とするまたはそれに由来する）ＤＮＡを収集するステップを含み得る。対象は本明細書に記載した対象のいずれでもよい。ＤＮＡはｃｆＤＮＡであってよい。ＤＮＡは組織試料から得られる。

そのような方法のいずれかは、対象からのＤＮＡから複数の標的領域セットを捕捉するステップであって、複数の標的領域セットが配列可変標的領域セットおよびエピジェネティック標的領域セットを含み、捕捉されたＤＮＡ分子セットが産生されるステップを含み得る。捕捉するステップは、本明細書の他の箇所に記載した実施形態のいずれかに従って実施され得る。

そのような方法のいずれにおいても、以前のがん処置は手術、治療組成物の投与、および／または化学療法を含み得る。

そのような方法のいずれかは、捕捉されたＤＮＡ分子をシーケンシングするステップを含み、それにより配列情報セットが産生される。配列可変標的領域セットの捕捉されたＤＮＡ分子は、エピジェネティック標的領域セットの捕捉されたＤＮＡ分子よりも高いシーケンシング深度までシーケンシングされ得る。

そのような方法のいずれかは、配列情報セットを使用して、予め選択された時点で腫瘍細胞を起源とするまたはそれに由来するＤＮＡの存在または非存在を検出するステップを含み得る。腫瘍細胞を起源とするまたはそれに由来するＤＮＡの存在または非存在の検出は、本明細書の他の箇所に記載したそれらの実施形態のいずれかに従って実施され得る。

試験対象におけるがん再発のリスクを決定する方法は、その試験対象について腫瘍細胞を起源とするまたはそれに由来するＤＮＡの存在もしくは非存在、または量を示すがん再発スコアを決定するステップを含み得る。がん再発スコアは、がん再発状態を決定するためにさらに使用され得る。がん再発状態は、例えばがん再発スコアが既定の閾値より上である場合にがん再発のリスクがあり得る。がん再発状態は、例えばがん再発スコアが既定の閾値より上である場合にがん再発のリスクが低いまたはより低い。特定の実施形態では、既定の閾値に等しいがん再発スコアは、がん再発のリスクがある、またはがん再発の低いもしくはより低いリスクがあるがん再発状態をもたらし得る。

試験対象をその後のがん処置の候補であると分類する方法は、その試験対象のがん再発スコアを既定のがん再発閾値と比較するステップを含み、がん再発スコアががん再発閾値より上である場合、その試験対象をその後のがん処置の候補であると分類するか、またはがん再発スコアががん再発閾値より下である場合、治療の候補ではないと分類する。特定の実施形態では、がん再発閾値と等しいがん再発スコアは、その後のがん処置の候補であるか、または治療の候補でないという分類をもたらし得る。一部の実施形態では、その後のがん処置は、化学療法または治療組成物の投与を含む。

そのような方法のいずれかは、がん再発スコアに基づいて試験対象の無病生存（ＤＦＳ）期間を決定するステップを含み得、例えばＤＦＳ期間は１年、２年、３年、４年、５年、または１０年であってよい。

一部の実施形態では、配列情報セットは配列可変標的領域配列を含み、がん再発スコアを決定するステップは、配列可変標的領域配列に存在するＳＮＶ、挿入／欠失、ＣＮＶ、および／または融合の量を示す少なくとも第１のサブスコアを決定するステップを含み得る。

一部の実施形態では、１、２、３、４、または５から選択される配列可変標的領域における変異の数は、第１のサブスコアががん再発について陽性であると分類されるがん再発スコアをもたらすために十分である。一部の実施形態では、変異の数は１、２、または３から選択される。

一部の実施形態では、配列情報のセットは、エピジェネティック標的領域配列を含み、がん再発スコアを決定するステップは、エピジェネティック標的領域配列中のエピジェネティック特色における変化、例えば、高メチル化可変標的領域のメチル化および／または断片化可変標的領域の摂動を受けた断片化を示す第２のサブスコアを決定するステップを含み、「摂動を受けた」は、健康な対象からの対応する試料中に見出されるＤＮＡとは異なることを意味する。

がん再発スコアががんの再発について陽性であると分類されるいずれかの実施形態では、対象のがん再発状態はがん再発のリスクがある、および／または対象はその後のがん処置の候補として分類され得る。

一部の実施形態では、がんは本明細書の他の箇所に記載したがんの型のいずれか１つ、例えば結腸直腸がんである。

Ｃ．治療および関連する投与
ある特定の実施形態では、本明細書に開示した方法は、体細胞または生殖細胞系列の起源である核酸バリアントの状態を与えられた患者にカスタマイズされた療法を特定し投与することに関する。一部の実施形態では、本質的にいずれのがん療法（例えば手術療法、放射線療法、化学療法、および／または同様のもの）も、これらの方法の一部として含まれ得る。典型的には、カスタマイズされた療法には少なくとも１つの免疫療法（または免疫療法剤）が含まれる。免疫療法は一般に、所与のがんの型に対する免疫応答を増強する方法を意味する。ある特定の実施形態では、免疫療法は腫瘍またはがんに対するＴ細胞の応答を増強する方法を意味する。

ある特定の実施形態では、体細胞または生殖細胞系列の起源である対象からの試料の核酸バリアントの状態は、参照集団からのコンパレータの結果のデータベースと比較され、その対象のためのカスタマイズされたまたは標的化された療法が特定される。典型的には、参照集団は試験対象と同じがんまたは疾患の型を有する患者、および／または試験対象と同じ療法を受けている、または受けた患者を含む。核酸バリアントとコンパレータの結果がある特定の分類基準を満たせば（例えば実質的にまたは近似的に一致すれば）、カスタマイズされたまたは標的化された療法（１つまたは複数の療法）が特定され得る。

ある特定の実施形態では、本明細書に記載したカスタマイズされた療法は、典型的には、非経口的（例えば、静脈内または皮下）に投与される。免疫療法剤を含有する医薬組成物は、典型的には、静脈内投与される。ある特定の治療剤は、経口投与される。しかし、カスタマイズされた療法（例えば、免疫療法剤、その他）は、例えば、頬内、舌下、直腸、膣、尿道内、局所、眼内、鼻内および／または耳介内を含む当該分野で公知の任意の方法によっても投与され得、投与は、錠剤、カプセル剤、顆粒剤、水性懸濁剤、ゲル剤、スプレー剤、坐剤、軟膏剤（ｓａｌｖｅ）、軟膏剤（ｏｉｎｔｍｅｎｔ）、または同様のものを含み得る。

（実施例１：無細胞ＤＮＡ試料の分配）
培養培地中に放出されたＤＮＡを抽出することによってＧＭ１２８７８細胞系から得られた２つのＤＮＡ試料（試料１および試料２）（即ち、ＤＮＡを、細胞を遠心分離によって分離した後の培養培地の上清から抽出した）をここで解析する。この実施例では、各無細胞ＤＮＡ試料を、２つのアリコートに分割し、各アリコートは、１０ｎｇの無細胞ＤＮＡを有する。試料の一方のアリコートに、１４０ｎｇの担体ＤＮＡ分子を添加する。この実施形態では、使用する担体ＤＮＡ分子は二本鎖であり、担体ＤＮＡ分子の約５０％はメチル化されており、担体ＤＮＡ分子の５０％はメチル化されていない。メチル化担体ＤＮＡ分子および非メチル化担体ＤＮＡ分子は共に、同じ配列を有し、これらの担体ＤＮＡ分子は、３つのＣｐＧジヌクレオチドを有する。メチル化担体ＤＮＡ分子の３つのＣｐＧジヌクレオチド中のすべてのシトシンは、メチル化されている。試料の他方のアリコートには担体ＤＮＡ分子を添加しない。

試料１および試料２由来の２つのアリコート（担体ＤＮＡ分子ありおよびなし）を、メチル結合ドメイン（ＭＢＤ）緩衝液およびＭＢＤタンパク質にコンジュゲートした磁気ビーズ（ＭｅｔｈｙｌＭｉｎｅｒメチル化ＤＮＡ富化キット（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ））と合わせ、一晩インキュベートする。メチル化ＤＮＡ分子（存在する場合には、無細胞ＤＮＡ試料中および担体ＤＮＡ分子中）に、このインキュベーションの間にＭＢＤタンパク質が結合する。非メチル化ＤＮＡまたはメチル化が少ないＤＮＡは、増加する塩濃度を含有する緩衝液によってビーズから洗い流される。最後に、高い塩濃度の緩衝液を使用して、高度にメチル化されたＤＮＡをＭＢＤタンパク質から洗い流す。これらの洗浄は、メチル化が増大するＤＮＡの３つの画分（３つの分配されたセット－低、中等度および高）をもたらす。分配されたセット中に存在する分配されたＤＮＡは、無細胞ＤＮＡ試料由来のＤＮＡおよび担体ＤＮＡ分子を含む。３つの分配されたセット中の分配されたＤＮＡを、清浄し、塩除去し、ライブラリ調製の酵素的ステップのために調製物中で濃縮する。

分配されたセット中のＤＮＡを富化した後、分配されたＤＮＡの末端オーバーハングを伸長させ、アデノシン残基を断片の３’末端に付加する。各断片の５’末端をリン酸化する。これらの改変により、分配されたＤＮＡはライゲーション可能になる。ＤＮＡリガーゼおよびアダプターを添加して、各末端で、各分配されたＤＮＡ分子をアダプターとライゲーションさせる。これらのアダプターは、非一意的バーコードを含み、各分配されたセットは、他の分配されたセットにおいて使用されるアダプター中のバーコードから区別可能な非一意的バーコードを有するアダプターとライゲーションされる。ライゲーション後、３つの分配されたセットを共にプールし、ＰＣＲによって増幅する。担体ＤＮＡ分子の末端はライゲーションを防止するように改変されているので、アダプターは担体ＤＮＡ分子にライゲーションされない。したがって、これらの分子はアダプターとはライゲーションされず、アダプターはプライマー結合部位を含むので、担体ＤＮＡ分子は増幅されない。

ＰＣＲ後、増幅されたＤＮＡを再度清浄し、富化前に濃縮する。濃縮したら、増幅されたＤＮＡを、塩緩衝液、および目的の特異的領域を標的化するビオチン化ＲＮＡプローブと合わせ、この混合物を一晩インキュベートする。ビオチン化ＲＮＡプローブを、ストレプトアビジン磁気ビーズによって捕捉し、一連の塩洗浄によって溶出されなかった増幅されたＤＮＡから分離し、それによって試料を富化する。このステップでは、残った担体ＤＮＡ分子が試料中になおも存在する場合、担体ＤＮＡ分子は、プローブに結合するための配列類似性を有さず（即ち、担体ＤＮＡ分子は、この実施例では、非ヒトゲノム由来の配列を有する）また担体ＤＮＡ分子は捕捉されないので、プローブは担体ＤＮＡ分子に結合せず、こうして、担体ＤＮＡ分子がシーケンシングされないことを確実にする。

富化後、試料インデックスを、富化された分子にＰＣＲ増幅を経て組み込む。ＰＣＲ増幅後、（バッチ内の）異なる試料由来の増幅された分子を共にプールし、ＩｌｌｕｍｉｎａＮｏｖａＳｅｑシーケンサーを使用してシーケンシングする。次いで、シーケンサーによって生成された配列リードを、バイオインフォマティクスツール／アルゴリズムを使用して解析する。解析ステップは、分子のメチル化状態を決定するステップを含む。例えば、目的の特異的領域は、健康な個体ではメチル化されておらず、悪性腫瘍を有する個体ではメチル化されていることが、以前に決定されている。この実施例では、解析ステップは、分子が目的のこれらの領域においてメチル化されているか否かを決定するステップを含む。これは、分子、および分子が分配される分配されたセット中のＣｐＧ残基の数に基づいて決定され、これは次いで、腫瘍の存在または非存在を検出するために使用される。

図８Ａおよび８Ｂは、担体ＤＮＡ分子の存在下および非存在下での、試料由来の無細胞ＤＮＡ分子の分配のグラフ図を示す。ヒトゲノムでは、ある特定の領域のメチル化状態は、変動／変化しない場合が多く、常に同じままであるか、または異なる対象および／もしくは異なる型の疾患／疾患ステージと合致したままであることが見出されている。例えば、ある特定のヒトゲノム領域は、対象ががんを有するか否かにかかわらず、メチル化されているのが優勢であるか、またはメチル化されていないのが優勢であるかのいずれかであり得る。図８Ａは、高度に分配されたセット中のメチル化されていないのが優勢であることが公知のある特定のヒトゲノム領域の無細胞ＤＮＡ分子のパーセンテージを示す。図８Ａは、高度に分配されたセット中にある可能性が低い非メチル化無細胞ＤＮＡ分子が、高度に分配されたセットに分配されたことを明らかに示している。そして、試料への担体ＤＮＡ分子の添加は、高度に分配されたセットに分配されるメチル化されていない無細胞ＤＮＡ分子の量を大幅に低減させた。例えば、担体ＤＮＡ分子なしの試料１では、高度に分配されたセット中のメチル化されていないのが優勢であることが公知のある特定のヒトゲノム領域の無細胞ＤＮＡ分子のパーセンテージは０．３７％であるが（図８Ａ中の担体なしの試料１）、担体ＤＮＡ分子を添加すると、これは０．０７％まで低減された（図８Ａ中の担体ありの試料１）。試料２において同様に、高度に分配されたセット中のメチル化されていないのが優勢であることが公知のある特定のヒトゲノム領域の無細胞ＤＮＡ分子のパーセンテージ（担体ＤＮＡ分子の非存在下での）は０．４６％であるが（図８Ａ中の担体なしの試料２）、担体ＤＮＡ分子を添加すると、これは０．０６％まで低減された（図８Ａ中の担体ありの試料２）。図８Ｂは、高度に分配されたセット中のゼロ個のＣｐＧジヌクレオチドを有する無細胞ＤＮＡ分子の分配を示す。理想的には、これらの分子は、高度に分配されたセットに分配されるべきではない。図８Ｂは、試料１（図８Ｂ中の担体なしの試料１）および試料２（図８Ｂ中の担体なしの試料２）中のゼロ個のＣｐＧジヌクレオチドを有する無細胞ＤＮＡ分子の約０．１５％および０．２２％がそれぞれ、高度に分配されたセットに分配されることを明らかに示している。しかし、担体ＤＮＡ分子を添加すると、高度に分配されたセット中のゼロ個のＣｐＧジヌクレオチドを有する無細胞ＤＮＡ分子のパーセンテージは、それぞれ、試料１（図８Ｂ中の担体ありの試料１）では０．０１４％まで、試料２（図８Ｂ中の担体ありの試料２）では０．０１％まで低減された。図８は、担体ＤＮＡ分子の使用が、非メチル化ＤＮＡ分子の誤分配、アッセイノイズを低減させること、したがって、分配アッセイの分子特異性を改善することによって、分配アッセイの信頼度を増加させ、このことは、臨床性能の改善をもたらすことを明らかに示している。

本発明の好ましい実施形態を本明細書に示し、記載したが、そのような実施形態は例としてのみ提供されることは当業者には明白になる。本発明は本明細書内で提供される特定の実施例によって限定されることを意図していない。本発明は上述の明細書を参照して記載しているが、本明細書の実施形態の記述および説明は限定する意味で解釈することを意味していない。ここで多くの変形、変化、および置換が、本発明から逸脱することなく当業者には生じるであろう。さらに、本発明のすべての態様は、種々の条件および変数に依存する本明細書で説明した特定の描写、構成、または相対的な比率に限定されないことを理解されたい。本発明の実施において本明細書に記載した開示の実施形態に対して種々の代替選択肢が採用され得ることを理解されたい。したがって、本開示はいずれのそのような選択肢、改変、変形、または均等物をも包含すべきであることが意図されている。以下の特許請求の範囲が本発明の範囲を定義すること、ならびにこれらの特許請求の範囲およびその均等物の範囲内の方法および構造がそれによって包含されることが意図されている。

上記の開示は明確さおよび理解の目的のために説明および例としていくらか詳細に記載しているが、本開示を読んで、本開示の真の範囲から逸脱することなく形態および詳細において種々の変化を加えることができ、添付の特許請求の範囲内で実施できることは、当業者には明白になる。例えば、すべての方法、システム、コンピュータ可読媒体、および／または成分の特色、ステップ、エレメント、またはその他の態様を、種々の組合せで使用することができる。

本明細書で引用したすべての特許、特許出願、ウェブサイト、その他の刊行物および書類、受託番号、および同様のものは、それぞれの別個の項目が参照により組み込まれると具体的かつ別個に指示されているかのように、同程度にあらゆる目的のために全体が参照により組み込まれる。異なるバージョンの配列が異なる時の受託番号に関連している場合には、本出願の有効な出願日における受託番号に関連するバージョンが意味される。有効な出願日は、実際の出願日、または適用される場合には受託番号に言及する優先出願の提出日のいずれか早い方を意味する。同様に、異なるバージョンの刊行物、ウェブサイト、または同様のものが異なる時に公開された場合には、他に指示されなければ、本出願の有効な出願日に最も近く公開されたバージョンが意味される。

Claims

対象における腫瘍の存在または非存在を検出する方法であって、
（ｉ）前記対象からポリヌクレオチド試料を得るステップ；
（ｉｉ）担体核酸分子のセットを前記ポリヌクレオチド試料に添加して、第１の試料を生成するステップであって、前記担体核酸分子のセットが、
（ａ）非メチル化担体核酸分子の少なくとも１つのサブセット；および／または
（ｂ）メチル化担体核酸分子の少なくとも１つのサブセット
を含み、前記担体核酸分子の少なくとも一方の末端が、ライゲーションを防止するように改変され、前記非メチル化担体核酸分子が、メチル化ヌクレオチドを含まず、前記メチル化担体核酸分子が、１つまたは複数のメチル化ヌクレオチドを含む、ステップ；
（ｉｉｉ）前記第１の試料を、メチル化ポリヌクレオチドに選択的に結合する捕捉剤を使用して、少なくとも２つの分配されたセットに分配し、それにより、分配された試料を生成するステップ；
（ｉｖ）前記分配された試料の少なくとも一部を処理して、処理された試料を生成するステップであって、前記処理は、以下：（ａ）タグ付けするステップ、（ｂ）増幅するステップ、および（ｃ）目的の特異的領域について分子を富化するステップのうち少なくとも１つを含む、ステップ；
（ｖ）前記処理された試料の少なくとも一部をシーケンシングして、シーケンシングリードのセットを生成するステップ；ならびに
（ｖｉ）前記シーケンシングリードのセットの少なくとも一部を解析して、腫瘍の存在または非存在を検出するステップを含む、方法。
前記担体核酸分子の長さが２５ｂｐと３２５ｂｐとの間である、請求項１に記載の方法。
前記非メチル化担体核酸分子の少なくとも１つのサブセットの第１のサブセットおよび第２のサブセットが、同じヌクレオチド配列を含む、請求項１に記載の方法。
前記非メチル化担体核酸分子の少なくとも１つのサブセットの第１のサブセットおよび第２のサブセットが、異なるヌクレオチド配列を含む、請求項１に記載の方法。
前記非メチル化担体核酸分子の少なくとも１つのサブセットの前記第１のサブセットおよび前記第２のサブセットが、ヌクレオチド配列中に、１つまたは複数のＣｐＧジヌクレオチドを含む、請求項３または４に記載の方法。
前記非メチル化担体核酸分子の少なくとも１つのサブセットの前記第１のサブセット中の前記１つまたは複数のＣｐＧジヌクレオチドの位置が、前記第２のサブセット中の前記１つまたは複数のＣｐＧジヌクレオチドの位置とは異なる、請求項５に記載の方法。
前記非メチル化担体核酸分子の少なくとも１つのサブセットの前記第１のサブセット中の前記ＣｐＧジヌクレオチドの数が、前記第２のサブセット中のＣｐＧジヌクレオチドの数とは異なる、請求項５に記載の方法。
前記非メチル化担体核酸分子の少なくとも１つのサブセットの前記第１のサブセット中の前記１つまたは複数のＣｐＧジヌクレオチドに隣接するヌクレオチドの配列が、前記第２のサブセット中の前記１つまたは複数のＣｐＧジヌクレオチドに隣接するヌクレオチドの配列とは異なる、請求項５に記載の方法。
前記非メチル化担体核酸分子の少なくとも１つのサブセットの第１のサブセットおよび第２のサブセットが、異なる長さのものである、請求項２に記載の方法。
前記１つまたは複数のメチル化ヌクレオチドが、（ｉ）５－メチルシトシン、（ｉｉ）６－メチルアデニン、（ｉｉｉ）ヒドロキシメチルシトシン、（ｉｖ）メチルウラシル、および（ｖ）任意の他のメチル化ヌクレオチドからなる群より選択される、請求項１に記載の方法。
メチル化ヌクレオチドの数が、１、２、３、４、５、６、７、８、９、１０、１２、１４、１５、１６、１７、１８、１９または少なくとも２０である、請求項１０に記載の方法。
前記メチル化担体核酸分子の少なくとも１つのサブセットの第１のサブセットおよび第２のサブセットが、同じヌクレオチド配列を含む、請求項１０に記載の方法。
前記メチル化担体核酸分子の少なくとも１つのサブセットの第１のサブセットおよび第２のサブセットが、異なるヌクレオチド配列を含む、請求項１０に記載の方法。
前記メチル化担体核酸分子の少なくとも１つのサブセットの前記第１のサブセットおよび前記第２のサブセットが、ヌクレオチド配列中に、１つまたは複数のＣｐＧジヌクレオチドを含む、請求項１２または１３に記載の方法。
前記１つまたは複数のＣｐＧジヌクレオチドが、１つまたは複数のメチル化シトシンを含む、請求項１４に記載の方法。
前記メチル化担体核酸分子の少なくとも１つのサブセットの前記第１のサブセット中の前記１つまたは複数のメチル化ヌクレオチドの位置が、前記第２のサブセット中の前記１つまたは複数のメチル化ヌクレオチドの位置とは異なる、請求項１２または１３に記載の方法。
前記メチル化担体核酸分子の少なくとも１つのサブセットの前記第１のサブセット中の前記メチル化ヌクレオチドの数が、前記第２のサブセット中のメチル化ヌクレオチドの数とは異なる、請求項１２または１３に記載の方法。
前記メチル化担体核酸分子の少なくとも１つのサブセットの前記第１のサブセット中の前記１つまたは複数のメチル化ヌクレオチドに隣接するヌクレオチドの配列が、前記第２のサブセット中の前記１つまたは複数のメチル化ヌクレオチドに隣接するヌクレオチドの配列とは異なる、請求項１３に記載の方法。
前記メチル化担体核酸分子の少なくとも１つのサブセットの第１のサブセットおよび第２のサブセットが、異なる長さのものである、請求項１０に記載の方法。
前記メチル化担体核酸分子の少なくとも１つのサブセットの、前記非メチル化担体核酸分子の少なくとも１つのサブセットに対する量が、約０：１、０．１：９９．９、０．５：９９．５、０．７５：９９．２５、１：９９、１：９５、１：９０、１：８０、１：７５、１：７０、１：６０、１：５０、１：４０、１：３０、１：２５、１：２０、１：１０、１：５、１：２、１：１．１５、１：１、１．１５：１、２：１、５：１、１０：１、２０：１、２５：１、３０：１、４０：１、５０：１、６０：１、７０：１、７５：１、８０：１、９０：１、９５：１、９９：１、９９．２５：０．７５、９９．５：０．５、９９．９：０．１または１：０の比である、請求項１０に記載の方法。
前記ポリヌクレオチド試料の、前記担体核酸分子のセットに対する量が、約１：０．１；１：０．２、１：０．３、１：４、１：０．５、１：６、１：７、１：８、１：０．９、１：１、１：１、１：２、１：３、１：４、１：５、１：６、１：７、１：８、１：９、１：１０の比、１：２０、１：３０、１：４０、１：５０、１：６０、１：７０、１：８０、１：９０、１：１００、１：２００、１：３００；１：４００、１：５００、１：６００、１：７００、１：８００、１：９００、１：１０００、１：５０００、１：１０，０００、１：１００，０００、１：５００，０００、１：１０^６、１：１０^７、１：１０^８または１：１０^９である、請求項１に記載の方法。
前記ポリヌクレオチド試料が最大１μｇである、請求項１に記載の方法。
前記ポリヌクレオチド試料が最大２００ｎｇである、請求項１に記載の方法。
前記ポリヌクレオチド試料が最大１５０ｎｇである、請求項１に記載の方法。
前記ポリヌクレオチド試料が最大１００ｎｇである、請求項１に記載の方法。
前記担体核酸分子のセットが、前記ポリヌクレオチド試料と前記担体核酸分子のセットとの総量が約１７５ｎｇ、２００ｎｇ、２２５ｎｇ、２５０ｎｇ、２７５ｎｇ、３００ｎｇ、３５０ｎｇ、４００ｎｇ、４５０ｎｇ、５００ｎｇ、６００ｎｇ、７００ｎｇ、７５０ｎｇ、８００ｎｇ、９００ｎｇ、１μｇ、１．１μｇ、１．２５μｇまたは１．５μｇになるように十分な量で添加される、請求項２２から２５のいずれか一項に記載の方法。
前記担体核酸分子の配列が、（ｉ）ウイルスゲノム由来の配列、（ｉｉ）細菌ゲノム由来の配列、（ｉｉｉ）ラムダゲノム由来の配列、および（ｉｖ）非ヒトゲノム由来の配列からなる群より選択される、請求項１に記載の方法。
前記担体核酸分子が合成ＤＮＡである、請求項１に記載の方法。
前記担体核酸分子の前記少なくとも一方の末端が、Ｃ３（プロピル基）スペーサーを含む、請求項１に記載の方法。
前記担体核酸分子の前記少なくとも一方の末端が、ジデオキシヌクレオチドを含む、請求項１に記載の方法。
前記担体核酸分子の前記少なくとも一方の末端が、ヒドロキシル基が求核試薬として作用することを阻止する任意の化学的改変を含む、請求項１に記載の方法。
前記担体核酸分子が、ウラシルヌクレオシドを含む、請求項１に記載の方法。
前記増幅するステップの前に、ウラシルデグリコシラーゼおよびＤＮＡグリコシラーゼ－リアーゼを添加するステップをさらに含む、請求項３２に記載の方法。
前記担体核酸分子の５’末端が、以下の改変：（ｉ）反転（５’－５’）、例えば、ジデオキシチミン、ジデオキシシトシン、ジデオキシグアニンまたはジデオキシアデニン；（ｉｉ）プロピル基、または（ｉｉｉ）例えば、ベンジル、エチルもしくはメチルであるがこれらに限定されない他の有機官能基のうち少なくとも１つを含む、請求項１に記載の方法。
前記担体核酸分子の３’末端が、以下の改変：（ｉ）酵素的に、または合成の間に付加され得る任意のジデオキシ塩基、例えば、ジデオキシチミン、ジデオキシシトシン、ジデオキシグアニンまたはジデオキシアデニン；（ｉｉ）プロピル基、または（ｉｉｉ）例えば、ベンジル、エチルもしくはメチルであるがこれらに限定されない他の有機官能基のうち少なくとも１つを含む、請求項１に記載の方法。
前記ポリヌクレオチド試料が、組織、血液、血漿、血清、尿、唾液、糞便、脳脊髄液、頬内スワブまたは胸腔穿刺から得られる、請求項１に記載の方法。
前記ポリヌクレオチド試料が、組織から得られる、請求項１に記載の方法。
前記組織から得られた前記ポリヌクレオチド試料が、酵素的手段または機械的手段によって断片化される、請求項３７に記載の方法。
前記ポリヌクレオチド試料が、血液から得られる、請求項１に記載の方法。
前記血液由来の前記ポリヌクレオチド試料が、無細胞ＤＮＡ試料である、請求項３９に記載の方法。
（ｉ）非メチル化担体核酸分子の少なくとも１つのサブセット；および／または
（ｉｉ）メチル化担体核酸分子の少なくとも１つのサブセット
を含む担体核酸分子のセットであって、
前記担体核酸分子の少なくとも一方の末端が、ライゲーションを防止するように改変され、前記非メチル化担体核酸分子が、メチル化ヌクレオチドを含まず、前記メチル化担体核酸分子が、１つまたは複数のメチル化ヌクレオチドを含む、担体核酸分子のセット。
前記担体核酸分子の長さが２５ｂｐと３２５ｂｐとの間である、請求項４１に記載の担体核酸分子のセット。
前記非メチル化担体核酸分子の少なくとも１つのサブセットの第１のサブセットおよび第２のサブセットが、同じヌクレオチド配列を含む、請求項４１に記載の担体核酸分子のセット。
前記非メチル化担体核酸分子の少なくとも１つのサブセットの第１のサブセットおよび第２のサブセットが、異なるヌクレオチド配列を含む、請求項４１に記載の担体核酸分子のセット。
前記非メチル化担体核酸分子の少なくとも１つのサブセットの前記第１のサブセットおよび前記第２のサブセットが、ヌクレオチド配列中に、１つまたは複数のＣｐＧジヌクレオチドを含む、請求項４３または４４に記載の担体核酸分子のセット。
前記非メチル化担体核酸分子の少なくとも１つのサブセットの前記第１のサブセット中の前記１つまたは複数のＣｐＧジヌクレオチドの位置が、前記第２のサブセット中の前記１つまたは複数のＣｐＧジヌクレオチドの位置とは異なる、請求項４５に記載の担体核酸分子のセット。
前記非メチル化担体核酸分子の少なくとも１つのサブセットの前記第１のサブセット中の前記ＣｐＧジヌクレオチドの数が、前記第２のサブセット中のＣｐＧジヌクレオチドの数とは異なる、請求項４５に記載の担体核酸分子のセット。
前記非メチル化担体核酸分子の少なくとも１つのサブセットの前記第１のサブセット中の前記１つまたは複数のＣｐＧジヌクレオチドに隣接するヌクレオチドの配列が、前記第２のサブセット中の前記１つまたは複数のＣｐＧジヌクレオチドに隣接するヌクレオチドの配列とは異なる、請求項４５に記載の担体核酸分子のセット。
前記非メチル化担体核酸分子の少なくとも１つのサブセットの第１のサブセットおよび第２のサブセットが、異なる長さのものである、請求項４１に記載の担体核酸分子のセット。
前記１つまたは複数のメチル化ヌクレオチドが、（ｉ）５－メチルシトシン、（ｉｉ）６－メチルアデニン、（ｉｉｉ）ヒドロキシメチルシトシン、（ｉｖ）メチルウラシル、および（ｖ）任意の他のメチル化ヌクレオチドからなる群より選択される、請求項４１に記載の担体核酸分子のセット。
メチル化ヌクレオチドの数が、１、２、３、４、５、６、７、８、９、１０、１２、１４、１５、１６、１７、１８、１９または少なくとも２０である、請求項５０に記載の担体核酸分子のセット。
前記メチル化担体核酸分子の少なくとも１つのサブセットの第１のサブセットおよび第２のサブセットが、同じヌクレオチド配列を含む、請求項５０に記載の担体核酸分子のセット。
前記メチル化担体核酸分子の少なくとも１つのサブセットの第１のサブセットおよび第２のサブセットが、異なるヌクレオチド配列を含む、請求項５０に記載の担体核酸分子のセット。
前記メチル化担体核酸分子の少なくとも１つのサブセットの前記第１のサブセットおよび前記第２のサブセットが、ヌクレオチド配列中に、１つまたは複数のＣｐＧジヌクレオチドを含む、請求項５２または５３に記載の担体核酸分子のセット。
前記１つまたは複数のＣｐＧジヌクレオチドが、１つまたは複数のメチル化シトシンを含む、請求項５４に記載の担体核酸分子のセット。
前記メチル化担体核酸分子の少なくとも１つのサブセットの前記第１のサブセット中の前記１つまたは複数のメチル化ヌクレオチドの位置が、前記第２のサブセット中の前記１つまたは複数のメチル化ヌクレオチドの位置とは異なる、請求項５２または５３に記載の担体核酸分子のセット。
前記メチル化担体核酸分子の少なくとも１つのサブセットの前記第１のサブセット中の前記メチル化ヌクレオチドの数が、前記第２のサブセット中のメチル化ヌクレオチドの数とは異なる、請求項５２または５３に記載の担体核酸分子のセット。
前記メチル化担体核酸分子の少なくとも１つのサブセットの前記第１のサブセット中の前記１つまたは複数のメチル化ヌクレオチドに隣接するヌクレオチドの配列が、前記第２のサブセット中の前記１つまたは複数のメチル化ヌクレオチドに隣接するヌクレオチドの配列とは異なる、請求項５３に記載の担体核酸分子のセット。
前記メチル化担体核酸分子の少なくとも１つのサブセットの第１のサブセットおよび第２のサブセットが、異なる長さのものである、請求項５０に記載の担体核酸分子のセット。
前記メチル化担体核酸分子の少なくとも１つのサブセットの、前記非メチル化担体核酸分子の少なくとも１つのサブセットに対する量が、約０：１、０．１：９９．９、０．５：９９．５、０．７５：９９．２５、１：９９、１：９５、１：９０、１：８０、１：７５、１：７０、１：６０、１：５０、１：４０、１：３０、１：２５、１：２０、１：１０、１：５、１：２、１：１．１５、１：１、１．１５：１、２：１、５：１、１０：１、２０：１、２５：１、３０：１、４０：１、５０：１、６０：１、７０：１、７５：１、８０：１、９０：１、９５：１、９９：１、９９．２５：０．７５、９９．５：０．５、９９．９：０．１または１：０の比である、請求項５０に記載の担体核酸分子のセット。
前記担体核酸分子の配列が、（ｉ）ウイルスゲノム由来の配列、（ｉｉ）細菌ゲノム由来の配列、（ｉｉｉ）ラムダゲノム由来の配列、および（ｉｖ）非ヒトゲノム由来の配列からなる群より選択される、請求項４１に記載の担体核酸分子のセット。
前記担体核酸分子が合成ＤＮＡである、請求項４１に記載の担体核酸分子のセット。
前記担体核酸分子の前記少なくとも一方の末端が、Ｃ３（プロピル基）スペーサーを含む、請求項４１に記載の担体核酸分子のセット。
前記担体核酸分子の前記少なくとも一方の末端が、ジデオキシヌクレオチドを含む、請求項４１に記載の担体核酸分子のセット。
前記担体核酸分子の前記少なくとも一方の末端が、ヒドロキシル基が求核試薬として作用することを阻止する任意の化学的改変を含む、請求項４１に記載の担体核酸分子のセット。
前記担体核酸分子が、ウラシルヌクレオシドを含む、請求項４１に記載の担体核酸分子のセット。
増幅するステップの前に、ウラシルデグリコシラーゼおよびＤＮＡグリコシラーゼ－リアーゼを添加するステップをさらに含む、請求項６６に記載の担体核酸分子のセット。
前記担体核酸分子の５’末端が、以下の改変：（ｉ）反転（５’－５’）－ジデオキシチミン、ジデオキシシトシン、ジデオキシグアニンまたはジデオキシアデニン；（ｉｉ）プロピル基、または（ｉｉｉ）例えば、ベンジル、エチルもしくはメチルであるがこれらに限定されない他の有機官能基のうち少なくとも１つを含む、請求項４１に記載の担体核酸分子のセット。
前記担体核酸分子の３’末端が、以下の改変：（ｉ）酵素的に、または合成の間に付加され得る任意のジデオキシ塩基、例えば、ジデオキシチミン、ジデオキシシトシン、ジデオキシグアニンまたはジデオキシアデニン；（ｉｉ）プロピル基、または（ｉｉｉ）例えば、ベンジル、エチルもしくはメチルであるがこれらに限定されない他の有機官能基のうち少なくとも１つを含む、請求項４１に記載の担体核酸分子のセット。
（ｉ）
（ａ）非メチル化担体核酸分子の少なくとも１つのサブセット；および／または
（ｂ）メチル化担体核酸分子の少なくとも１つのサブセット
を含む担体核酸分子のセットであって、前記担体核酸分子のセットの少なくとも一方の末端が、ライゲーションを防止するように改変され、前記非メチル化担体核酸分子が、メチル化ヌクレオチドを含まず、前記メチル化担体核酸分子が、１つまたは複数のメチル化ヌクレオチドを含む、担体核酸分子のセット；
（ｉｉ）対象から得られたポリヌクレオチド試料
を含む、核酸の集団。
前記担体核酸分子の長さが２５ｂｐと３２５ｂｐとの間である、請求項７０に記載の核酸の集団。
前記非メチル化担体核酸分子の少なくとも１つのサブセットの第１のサブセットおよび第２のサブセットが、同じヌクレオチド配列を含む、請求項７０に記載の核酸の集団。
前記非メチル化担体核酸分子の少なくとも１つのサブセットの第１のサブセットおよび第２のサブセットが、異なるヌクレオチド配列を含む、請求項７０に記載の核酸の集団。
前記非メチル化担体核酸分子の少なくとも１つのサブセットの前記第１のサブセットおよび前記第２のサブセットが、ヌクレオチド配列中に、１つまたは複数のＣｐＧジヌクレオチドを含む、請求項７２または７３に記載の核酸の集団。
前記非メチル化担体核酸分子の少なくとも１つのサブセットの前記第１のサブセット中の前記１つまたは複数のＣｐＧジヌクレオチドの位置が、前記第２のサブセット中の前記１つまたは複数のＣｐＧジヌクレオチドの位置とは異なる、請求項７２または７３に記載の核酸の集団。
前記非メチル化担体核酸分子の少なくとも１つのサブセットの前記第１のサブセット中の前記ＣｐＧジヌクレオチドの数が、前記第２のサブセット中のＣｐＧジヌクレオチドの数とは異なる、請求項７２または７３に記載の核酸の集団。
前記非メチル化担体核酸分子の少なくとも１つのサブセットの前記第１のサブセット中の前記１つまたは複数のＣｐＧジヌクレオチドに隣接するヌクレオチドの配列が、前記第２のサブセット中の前記１つまたは複数のＣｐＧジヌクレオチドに隣接するヌクレオチドの配列とは異なる、請求項７４に記載の核酸の集団。
前記非メチル化担体核酸分子の少なくとも１つのサブセットの第１のサブセットおよび第２のサブセットが、異なる長さのものである、請求項７０に記載の核酸の集団。
前記１つまたは複数のメチル化ヌクレオチドが、（ｉ）５－メチルシトシン、（ｉｉ）６－メチルアデニン、（ｉｉｉ）ヒドロキシメチルシトシン、（ｉｖ）メチルウラシル、および（ｖ）任意の他のメチル化ヌクレオチドからなる群より選択される、請求項７０に記載の核酸の集団。
メチル化ヌクレオチドの数が、１、２、３、４、５、６、７、８、９、１０、１２、１４、１５、１６、１７、１８、１９または少なくとも２０である、請求項７９に記載の核酸の集団。
前記メチル化担体核酸分子の少なくとも１つのサブセットの第１のサブセットおよび第２のサブセットが、同じヌクレオチド配列を含む、請求項７９に記載の核酸の集団。
前記メチル化担体核酸分子の少なくとも１つのサブセットの第１のサブセットおよび第２のサブセットが、異なるヌクレオチド配列を含む、請求項７９に記載の核酸の集団。
前記メチル化担体核酸分子の少なくとも１つのサブセットの前記第１のサブセットおよび前記第２のサブセットが、ヌクレオチド配列中に、１つまたは複数のＣｐＧジヌクレオチドを含む、請求項８１または８２に記載の核酸の集団。
前記１つまたは複数のＣｐＧジヌクレオチドが、１つまたは複数のメチル化シトシンを含む、請求項８３に記載の核酸の集団。
前記メチル化担体核酸分子の少なくとも１つのサブセットの前記第１のサブセット中の前記１つまたは複数のメチル化ヌクレオチドの位置が、前記第２のサブセット中の前記１つまたは複数のメチル化ヌクレオチドの位置とは異なる、請求項８１または８２に記載の核酸の集団。
前記メチル化担体核酸分子の少なくとも１つのサブセットの前記第１のサブセット中の前記メチル化ヌクレオチドの数が、前記第２のサブセット中のメチル化ヌクレオチドの数とは異なる、請求項８１または８２に記載の核酸の集団。
前記メチル化担体核酸分子の少なくとも１つのサブセットの前記第１のサブセット中の前記１つまたは複数のメチル化ヌクレオチドに隣接するヌクレオチドの配列が、前記第２のサブセット中の前記１つまたは複数のメチル化ヌクレオチドに隣接するヌクレオチドの配列とは異なる、請求項８２に記載の核酸の集団。
前記メチル化担体核酸分子の少なくとも１つのサブセットの第１のサブセットおよび第２のサブセットが、異なる長さのものである、請求項７９に記載の核酸の集団。
前記メチル化担体核酸分子の少なくとも１つのサブセットの、前記非メチル化担体核酸分子の少なくとも１つのサブセットに対する量が、約０：１、０．１：９９．９、０．５：９９．５、０．７５：９９．２５、１：９９、１：９５、１：９０、１：８０、１：７５、１：７０、１：６０、１：５０、１：４０、１：３０、１：２５、１：２０、１：１０、１：５、１：２、１：１．１５、１：１、１．１５：１、２：１、５：１、１０：１、２０：１、２５：１、３０：１、４０：１、５０：１、６０：１、７０：１、７５：１、８０：１、９０：１、９５：１、９９：１、９９．２５：０．７５、９９．５：０．５、９９．９：０．１または１：０の比である、請求項７９に記載の核酸の集団。
前記ポリヌクレオチド試料の、前記担体核酸分子のセットに対する量が、約１：０．１；１：０．２、１：０．３、１：４、１：０．５、１：６、１：７、１：８、１：０．９、１：１、１：１、１：２、１：３、１：４、１：５、１：６、１：７、１：８、１：９、１：１０の比、１：２０、１：３０、１：４０、１：５０、１：６０、１：７０、１：８０、１：９０、１：１００、１：２００、１：３００；１：４００、１：５００、１：６００、１：７００、１：８００、１：９００、１：１０００、１：５０００、１：１０，０００、１：１００，０００、１：５００，０００、１：１０^６、１：１０^７、１：１０^８または１：１０^９である、請求項７０に記載の核酸の集団。
前記ポリヌクレオチド試料が最大１μｇである、請求項７０に記載の核酸の集団。
前記ポリヌクレオチド試料が最大２００ｎｇである、請求項７０に記載の核酸の集団。
前記ポリヌクレオチド試料が最大１５０ｎｇである、請求項７０に記載の核酸の集団。
前記ポリヌクレオチド試料が最大１００ｎｇである、請求項７０に記載の核酸の集団。
前記担体核酸分子のセットが、前記ポリヌクレオチド試料と前記担体核酸分子のセットとの総量が約１７５ｎｇ、２００ｎｇ、２２５ｎｇ、２５０ｎｇ、２７５ｎｇ、３００ｎｇ、３５０ｎｇ、４００ｎｇ、４５０ｎｇ、５００ｎｇ、６００ｎｇ、７００ｎｇ、７５０ｎｇ、８００ｎｇ、９００ｎｇ、１μｇ、１．１μｇ、１．２５μｇまたは１．５μｇになるように十分な量で添加される、請求項９１から９４のいずれか一項に記載の核酸の集団。
前記担体核酸分子の配列が、（ｉ）ウイルスゲノム由来の配列、（ｉｉ）細菌ゲノム由来の配列、（ｉｉｉ）ラムダゲノム由来の配列、および（ｉｖ）非ヒトゲノム由来の配列からなる群より選択される、請求項７０に記載の核酸の集団。
前記担体核酸分子の前記少なくとも一方の末端が、ジデオキシヌクレオチドを含む、請求項７０に記載の核酸の集団。
前記担体核酸分子の前記少なくとも一方の末端が、ヒドロキシル基が求核試薬として作用することを阻止する任意の化学的改変を含む、請求項７０に記載の核酸の集団。
前記担体核酸分子が、ウラシルヌクレオシドを含む、請求項７０に記載の核酸の集団。
増幅するステップの前に、ウラシルデグリコシラーゼおよびＤＮＡグリコシラーゼ－リアーゼを添加するステップをさらに含む、請求項９９に記載の核酸の集団。
前記担体核酸分子の５’末端が、以下の改変：（ｉ）反転（５’－５’）－ジデオキシチミン、ジデオキシシトシン、ジデオキシグアニンまたはジデオキシアデニン；（ｉｉ）プロピル基、または（ｉｉｉ）例えば、ベンジル、エチルもしくはメチルであるがこれらに限定されない他の有機官能基のうち少なくとも１つを含む、請求項７０に記載の核酸の集団。
前記担体核酸分子の３’末端が、以下の改変：（ｉ）酵素的に、または合成の間に付加され得る任意のジデオキシ塩基、例えば、ジデオキシチミン、ジデオキシシトシン、ジデオキシグアニンまたはジデオキシアデニン；（ｉｉ）プロピル基、または（ｉｉｉ）例えば、ベンジル、エチルもしくはメチルであるがこれらに限定されない他の有機官能基のうち少なくとも１つを含む、請求項７０に記載の核酸の集団。
前記ポリヌクレオチド試料が、組織、血液、血漿、血清、尿、唾液、糞便、脳脊髄液、頬内スワブまたは胸腔穿刺から得られる、請求項７０に記載の核酸の集団。
前記ポリヌクレオチド試料が、組織から得られる、請求項７０に記載の核酸の集団。
前記組織から得られた前記ポリヌクレオチド試料が、酵素的手段または機械的手段によって断片化される、請求項１０４に記載の核酸の集団。
前記ポリヌクレオチド試料が、血液から得られる、請求項７０に記載の核酸の集団。
前記血液から得られた前記ポリヌクレオチド試料が、無細胞ＤＮＡ試料である、請求項１０６に記載の核酸の集団。
前記担体核酸分子が二本鎖分子である、上記請求項のいずれか一項に記載の方法。
前記第１の試料が、変性させるステップに供されない、上記請求項のいずれか一項に記載の方法。
前記第１のサブセットおよび／または前記第２のサブセット中の前記１つまたは複数のＣｐＧヌクレオチドまたはメチル化ヌクレオチドに隣接するヌクレオチドの配列が、前記１つまたは複数のＣｐＧヌクレオチドまたはメチル化ヌクレオチドに隣接する１ヌクレオチド、２ヌクレオチド、３ヌクレオチド、４ヌクレオチドまたは５ヌクレオチドの配列であり得る、上記請求項のいずれか一項に記載の方法または担体核酸分子のセット。
前記シーケンシングするステップが、少なくとも２つの分配されたセット由来の前記処理された試料のうちの少なくとも一部をシーケンシングするステップを含む、上記請求項のいずれか一項に記載の方法。
（ｉ）
（ａ）非メチル化担体核酸分子の少なくとも１つのサブセット、および／または
（ｂ）メチル化担体核酸分子の少なくとも１つのサブセット
を含む担体核酸分子のセットであって、前記担体核酸分子のセットの少なくとも一方の末端が、ライゲーションを防止するように改変され、前記非メチル化担体核酸分子が、メチル化ヌクレオチドを含まず、前記メチル化担体核酸分子が、１つまたは複数のメチル化ヌクレオチドを含む、担体核酸分子のセット；および
（ｉｉ）メチル化ポリヌクレオチドに選択的に結合する捕捉剤
を含む、キット。