JP2022553164A

JP2022553164A - ３’オーバーハングを修復する方法

Info

Publication number: JP2022553164A
Application number: JP2022521657A
Authority: JP
Inventors: エリーンシャム，
Original assignee: ガーダントヘルス，インコーポレイテッド
Priority date: 2019-10-25
Filing date: 2020-10-23
Publication date: 2022-12-22
Also published as: EP4048812B1; EP4345171A3; WO2021081423A1; US20230212663A1; EP4048812A1; US11447819B2; ES2971348T3; EP4345171A2; US20210123097A1

Abstract

部分的に二本鎖のＤＮＡ断片を修復する方法を提供する。いくつかの実施形態では、この方法は、（ａ）前記部分的に二本鎖のＤＮＡ断片をプライマー集団の１または複数のプライマーと接触させる工程であって、ここで、前記部分的に二本鎖のＤＮＡ断片が３’オーバーハングを含み、前記プライマー集団がランダム標的ハイブリッド形成配列を含む、工程；（ｂ）ＤＮＡポリメラーゼを使用して前記ＤＮＡ断片に沿って前記プライマー集団の１または複数のプライマーを伸長させる工程であって、それにより、前記ＤＮＡ断片にアニーリングした１または複数の伸長したプライマーが産生される、工程；および（ｃ）１または複数の伸長したプライマーの３’末端を、伸長したプライマーまたは部分的に二本鎖のＤＮＡ断片の鎖の５’末端にライゲートする工程であって、それにより、修復されたＤＮＡ断片が得られる、工程を含む。

Description

関連出願の引用
本出願は、２０１９年１０月２５日出願の米国仮特許出願第６２／９２６，０９３号（その全体が全ての目的のために本明細書中で参考として援用される）に基づく優先権の利益を主張する。

配列表
本出願は、配列表を含んでおり、この配列表は、ＡＳＣＩＩ形式で電子的に提出され、その全体が本明細書中で参考として援用される。前記ＡＳＣＩＩコピーは、２０２０年１０月２１日に作成され、ファイル名は２０２０－１０－２３＿ＧＨ００５４ＷＯ＿Ｓｅｑｕｅｎｃｅ＿Ｌｉｓｔｉｎｇ＿ＳＴ２５．ｔｘｔであり、サイズは９７０バイトである。

緒言と要旨
ある特定のＤＮＡ分子型で生じるオーバーハングの修復は、配列決定および／または増幅などのさらなる分析用の分子の調製における重要な工程である。例えば、分子の３’末端付近のいくつかのヌクレオチドが一本鎖である３’オーバーハングは、剪断されたＤＮＡおよび無細胞ＤＮＡ（血液試料から得る）で生じ得る。タグ、バーコード、またはアダプターのライゲーションなどのその後の工程と適合させるために、３’オーバーハングを平滑末端または一塩基オーバーハングに変換することが望ましい場合がある。

既存のオーバーハングの修復方法は、３’オーバーハングを切除するために３’→５’エキソヌクレアーゼを使用する。ヌクレオチドが除去され、元の分子の末端の位置を決定することができないという点で、このアプローチは情報を喪失する。したがって、エキソヌクレオリシスによって３’オーバーハングを修復すると、例えば、５’末端と３’末端との間の塩基の配列ならびにヌクレオソームの位置付けに関する情報を得ることができない。したがって、改良された３’オーバーハングの修復方法が必要である。本開示は、このニーズを満たすか、他の利益を提供するか、少なくとも有用な選択肢を公的に提供することを目的とする。

したがって、以下の実施形態を提供する。実施形態１は、部分的に二本鎖のＤＮＡ断片を修復する方法であって、
（ａ）前記部分的に二本鎖のＤＮＡ断片をプライマー集団の１または複数のプライマーと接触させる工程であって、ここで、前記部分的に二本鎖のＤＮＡ断片が３’オーバーハングを含み、前記プライマー集団がランダム標的ハイブリッド形成配列を含む、工程；
（ｂ）ＤＮＡポリメラーゼを使用して前記ＤＮＡ断片に沿って前記プライマー集団の１または複数のプライマーを伸長させる工程であって、それにより、前記ＤＮＡ断片にアニーリングした１または複数の伸長したプライマーが産生される、工程；および
（ｃ）１または複数の伸長したプライマーの３’末端を、伸長したプライマーまたは部分的に二本鎖のＤＮＡ断片の鎖の５’末端にライゲートする工程であって、それにより、修復されたＤＮＡ断片が得られる、工程
を含む、方法である。

実施形態２は、先行する実施形態のいずれか１つに記載の方法であり、前記ＤＮＡポリメラーゼは３’→５’エキソヌクレアーゼ活性を欠く。

実施形態３は、先行する実施形態のいずれか１つに記載の方法であり、前記ＤＮＡポリメラーゼは５’→３’エキソヌクレアーゼ活性を欠く。

実施形態４は、先行する実施形態のいずれか１つに記載の方法であり、前記ＤＮＡポリメラーゼは鎖置換活性を欠く。

実施形態５は、先行する実施形態のいずれか１つに記載の方法であり、前記ＤＮＡポリメラーゼはクレノウ断片である。

実施形態６は、直前の実施形態に記載の方法であり、前記ＤＮＡポリメラーゼはエキソ－クレノウ断片である。

実施形態７は、先行する実施形態のいずれか１つに記載の方法であり、前記部分的に二本鎖のＤＮＡ断片は、各末端に３’オーバーハングを有する。

実施形態８は、先行する実施形態のいずれか１つに記載の方法であり、前記部分的に二本鎖のＤＮＡ断片は、３’オーバーハングおよび（ｉ）平滑末端または（ｉｉ）５’オーバーハングを有する。

実施形態９は、直前の実施形態に記載の方法であり、前記５’オーバーハングは、前記５’オーバーハングに沿って前記３’末端を伸長させることによって修復される。

実施形態１０は、先行する実施形態のいずれか１つに記載の方法であり、前記部分的に二本鎖のＤＮＡ断片は、体液試料に由来する。

実施形態１１は、直前の実施形態に記載の方法であり、前記体液は、全血、血清、血漿、または尿である。

実施形態１２は、先行する実施形態のいずれか１つに記載の方法であり、前記部分的に二本鎖のＤＮＡ断片はｃｆＤＮＡ断片である。

実施形態１３は、先行する実施形態のいずれか１つに記載の方法であり、前記部分的に二本鎖のＤＮＡ断片は哺乳動物由来である。

実施形態１４は、先行する実施形態のいずれか１つに記載の方法であり、前記部分的に二本鎖のＤＮＡ断片はヒト由来である。

実施形態１５は、先行する実施形態のいずれか１つに記載の方法であり、前記部分的に二本鎖のＤＮＡ断片は、組成物中のＤＮＡ断片集団の一部である。

実施形態１６は、直前の実施形態に記載の方法であり、前記ＤＮＡ断片集団は剪断されたＤＮＡを含む。

実施形態１７は、実施形態１５または１６に記載の方法であり、前記ＤＮＡ断片集団は、後成的に改変されたＤＮＡを含む。

実施形態１８は、実施形態１５～１７のいずれか１つに記載の方法であり、前記ＤＮＡ断片集団は、複数のゲノム遺伝子座由来の断片を含む。

実施形態１９は、実施形態１５～１８のいずれか１つに記載の方法であり、前記ＤＮＡ断片集団は富化されていない。

実施形態２０は、実施形態１５～１９のいずれか１つに記載の方法であり、前記ＤＮＡ断片集団は増幅されていない。

実施形態２１は、先行する実施形態のいずれか１つに記載の方法であり、前記ランダム標的ハイブリッド形成配列の長さは、少なくとも４、５、６、７、８、９、または１０ヌクレオチドである。

実施形態２２は、先行する実施形態のいずれか１つに記載の方法であり、前記ランダム標的ハイブリッド形成配列の長さは、約４、５、６、７、８、９、１０、１１、または１２ヌクレオチドである。

実施形態２３は、先行する実施形態のいずれか１つに記載の方法であり、前記プライマー集団のプライマーが一本鎖である。

実施形態２４は、実施形態１～２０のいずれか１つに記載の方法であり、前記プライマー集団のプライマーは３’オーバーハングを有する二本鎖であり、前記ランダム標的ハイブリッド形成配列は前記３’オーバーハング中に存在する。

実施形態２５は、実施形態１～２０のいずれか１つに記載の方法であり、前記プライマー集団のプライマーは３’オーバーハングを有するヘアピンであり、前記ランダム標的ハイブリッド形成配列は３’オーバーハング中に存在する。

実施形態２６は、実施形態２１～２２のいずれか１つに記載の方法であり、前記プライマーのヘアピンまたは二本鎖領域はアダプターを含む。

実施形態２７は、実施形態２１～２３のいずれか１つに記載の方法であり、前記プライマーのヘアピンまたは二本鎖領域はタグを含む。

実施形態２８は、実施形態２４に記載の方法であり、前記タグはバーコードを含む。

実施形態２９は、実施形態２５に記載の方法であり、前記プライマー集団は、複数の異なるバーコードを含む。

実施形態３０は、先行する実施形態のいずれか１つに記載の方法であり、少なくとも工程（ａ）～（ｃ）を単一の管内で行う。

実施形態３１は、先行する実施形態のいずれか１つに記載の方法であり、前記二本鎖ＤＮＡ断片は組成物中に存在し、少なくとも工程（ａ）～（ｃ）について、構成要素は組成物から除去されない。

実施形態３２は、先行する実施形態のいずれか１つに記載の方法であり、前記修復されたＤＮＡ断片が１つまたは２つの平滑末端を含むか、前記方法が、前記修復されたＤＮＡ断片の１つまたは２つの末端を平滑末端化する工程をさらに含む。

実施形態３３は、直前の実施形態に記載の方法であり、前記平滑末端化された核酸の３’末端にヌクレオチドを非テンプレート指向性に付加するポリメラーゼを使用して、修復されたＤＮＡ断片を末端テーリングする工程をさらに含み、必要に応じて、ＡがＧより優先され、ＧがＣまたはＴより優先されて付加される。

実施形態３４は、先行する実施形態のいずれか１つに記載の方法であり、前記修復されたＤＮＡ断片に（必要に応じて両端に）タグをライゲートする工程をさらに含み、必要に応じて、前記タグはバーコードおよび／またはアダプターを含む。

実施形態３５は、先行する実施形態のいずれか１つに記載の方法であり、前記修復されたＤＮＡ断片を精製する工程をさらに含む。

実施形態３６は、先行する実施形態のいずれか１つに記載の方法であり、工程（ｂ）および／または（ｃ）後に工程（ｂ）および／または（ｃ）で使用した１または複数の酵素を変性させる工程をさらに含む。

実施形態３７は、先行する実施形態のいずれか１つに記載の方法であり、前記修復されたＤＮＡ断片を増幅する工程をさらに含む。

実施形態３８は、直前の実施形態に記載の方法であり、前記修復されたＤＮＡ断片は１または複数のアダプター（例えば、２つのアダプター）を含み、前記修復されたＤＮＡ断片の増幅に前記１または複数のアタプターにアニーリングする１または複数の（例えば、２つの）増幅オリゴマーを使用する。

実施形態３９は、先行する実施形態のいずれか１つに記載の方法であり、前記修復されたＤＮＡ断片のうちの目的の断片を富化する工程であって、それにより富化されたＤＮＡ断片が得られる、工程をさらに含み、必要に応じて、前記富化する工程を増幅工程後に行う。

実施形態４０は、直前の実施形態に記載の方法であり、前記目的の断片は、疾患または障害に関連する様式によって変動する遺伝子座を含み、必要に応じて、前記疾患または障害は癌である。

実施形態４１は、直前の実施形態に記載の方法であり、前記変動は、一ヌクレオチド変動、コピー数変動、遺伝子融合、またはインデルのうちの１つまたは複数である。

実施形態４２は、直前の実施形態に記載の方法であり、前記目的の断片は、疾患または障害に関連する一ヌクレオチド変動；疾患または障害に関連するコピー数の変動；疾患または障害に関連する遺伝子融合；または疾患または障害に関連するインデルを示すフラグメントのうちの１つ、２つ，３つ，または４つを含み、必要に応じて、前記疾患または障害は癌である。

実施形態４３は、実施形態３６～３９のいずれか１つに記載の方法であり、前記富化されたＤＮＡ断片を増幅する工程をさらに含む。

実施形態４４は、先行する実施形態のいずれか１つに記載の方法であり、前記修復されたＤＮＡ断片を配列決定する工程をさらに含む。

実施形態４５は、直前の実施形態に記載の方法であり、前記配列決定する工程は、部分的に二本鎖のＤＮＡ断片中に３’オーバーハングを形成したヌクレオチドを配列決定する。

実施形態４６は、実施形態４１または４２に記載の方法であり、前記配列決定する工程はハイスループット配列決定である。

実施形態４７は、実施形態４４～４６のいずれか１つに記載の方法であり、複数の修復されたＤＮＡ断片が生成され、前記修復されたＤＮＡ断片の少なくとも一部がタグを含み、前記配列決定が複数の修復されたＤＮＡ断片から複数の配列リードを生成する。

実施形態４８は、実施形態４７に記載の方法であり、前記配列リードが、前記部分的に二本鎖のＤＮＡ断片中に３’オーバーハングを形成したヌクレオチドの配列およびタグの配列を含む。

本発明の各態様およびあらゆる態様のいくつかの実施形態では、本明細書中に開示のシステムおよび／または方法の結果を、報告書を作成するための材料として使用する。報告書は、紙面または電子形式であり得る。例えば、本明細書中に開示の方法またはシステムによって判定された癌の存在または非存在に関する情報を、かかる報告書に示すことができる。あるいはまたはさらに、報告書は、試料中の核酸塩基の同定に関するか、同定に由来する情報を含み得る。本明細書中に開示の方法またはシステムは、試料を提供した被験体または医療関係者などの第三者に報告書を伝える工程をさらに含み得る。

本明細書中に開示の方法の種々の工程、または本明細書中に開示のシステムによって実施される工程は、同時もしくは異なる時間に、ならびに／または同一の地理的な位置もしくは異なる地理的な位置（例えば、国）で行われ得る。本明細書中に開示の方法の種々の工程を、同一の人物または異なる人物が行うことができる。

図１は、５’オーバーハング、３’オーバーハング、および既存の末端修復方法を示す。

図２は、３’ランダム配列および５’二本鎖配列（例えば、バーコード、アダプター、またはタグを含む）を含むプライマーを部分的に二本鎖のＤＮＡ断片にアニーリングする本開示に従った３’オーバーハング修復の実施形態を示す。伸長（例えば、クレノウエキソ－を使用）およびライゲーションにより、３’オーバーハング配列が保持されている修復された分子が得られる。

図３は、ランダム配列を有するプライマーを部分的に二本鎖のＤＮＡ断片にアニーリングする本開示に従った３’オーバーハング修復の実施形態を示す。伸長（例えば、クレノウエキソ－を使用）およびライゲーションにより、３’オーバーハング配列が保持されている修復された分子が得られる。

ある特定の実施形態の詳細な説明
本明細書中で使用した節の見出しは、体系化することのみを目的とし、記載の発明の対象を制限すると解釈されないものとする。

特許出願、特許公開、およびＧｅｎｂａｎｋ受入番号を含む本明細書中の全ての引用文献は、各々の文献の全体が参考として援用されることを具体的かつ個別に示されているかのように、本明細書中で参考として援用される。

定義
別段の定義がない限り、本開示に関連して使用される科学用語および技術用語は、当業者が一般的に理解している意味を有するものとする。さらに、文脈上別段の必要性が無く、明確に示されていない限り、単数形の用語は複数形を含み、複数形の用語は単数形を含むものとする。種々の出典または文献の定義の間に任意の矛盾がある場合、本明細書中に提供した定義を優先するものとする。

本教示を詳細に記載する前に、本開示が具体的な組成物またはプロセスの工程に制限されず、そのようなものとして変動し得ると理解すべきである。本明細書中および添付の特許請求の範囲中で使用される場合、文脈上明確にそうでない旨を表さない限り、単数形「ａ」、「ａｎ」、および「ｔｈｅ」には複数形が含まれることに留意すべきである。したがって、例えば、「オリゴマー」との言及には、複数のオリゴマーなどが含まれる。本出願では、明確に述べれられていないか、当業者によって理解されない限り、「または」の使用は「および／または」を意味する。複数の従属クレームの文脈において、「または」を使用する場合、１つを超える先行する独立クレームまたは従属クレームに戻って参照することを意味する。

本開示で考察された温度、濃度、時間などの前の「約」は、わずかな逸脱が本明細書中の教示の範囲内にあることを意味すると認識されるであろう。一般に、用語「約」は、組成物の活性または安定性にいかなる有意な影響も及ぼさない組成物の構成要素の量のわずかな変動を示す。また、「ｃｏｍｐｒｉｓｅ」、「ｃｏｍｐｒｉｓｅｓ」、「ｃｏｍｐｒｉｓｉｎｇ」、「ｃｏｎｔａｉｎ」、「ｃｏｎｔａｉｎｓ」、「ｃｏｎｔａｉｎｉｎｇ」、「ｉｎｃｌｕｄｅ」、「ｉｎｃｌｕｄｅｓ」、および「ｉｎｃｌｕｄｉｎｇ」の使用は、制限を意図しない。前記一般的な説明および詳細な説明は共に例示および説明のみを目的とし、本教示を制限しないと理解すべきである。参考として援用される任意の資料が本開示に表示の内容と矛盾する限りにおいて、表示の内容を優先する。

具体的記載がない限り、種々の構成要素「を含む」と述べている本明細書中の実施形態は、列挙された構成要素「からなる」または「から本質的になる」ことも意図する；種々の構成要素「からなる」と述べている本明細書中の実施形態は、列挙された構成要素「を含む」または「から本質的になる」ことも意図する；種々の構成要素「から本質的になる」と述べている本明細書中の実施形態は、列挙した構成要素「からなる」または「を含む」ことも意図する（この互換性は、特許請求の範囲内のこれらの用語の使用には適用されない）。

被験体は、哺乳動物種（好ましくは、ヒト）または鳥類（例えば、トリ）などの動物、または他の生物（植物など）を指す。より具体的には、被験体は、脊椎動物、例えば、マウス、霊長類、サル、またはヒトなどの哺乳動物であり得る。動物には、家畜、競技用動物、および愛玩動物が含まれる。被験体は、健康な個体、疾患もしくは疾患の素因を有するか有する疑いのある個体、または治療を必要とするか、治療を必要とする疑いのある個体であり得る。

遺伝的バリアントは、被験体の核酸試料またはゲノム中の変化、バリアント、または多型を指す。かかる変化、バリアント、または多型は、参照ゲノムに対するものであり得、参照ゲノムは、被験体または他の個体の参照ゲノムでってよい。変動には、１または複数の一ヌクレオチド変動（ＳＮＶ）、挿入、欠失、反復、小さな挿入、小さな欠失、小さな反復、構造バリアントジャンクション、可変長縦列反復、および／または隣接配列が含まれ、コピー数バリアント（ＣＮＶ）、トランスバージョン、および他の再構成も遺伝的変動の形態である。変動は、塩基の変化、挿入、欠失、反復、コピー数変動、塩基転換、またはその組み合わせであり得る。

癌マーカーは、癌の存在または発症リスクに関連する遺伝的バリアントである。癌マーカーは、被験体が癌を有するか、年齢および性別が適合した同種の被験体よりも癌の発症リスクが高いことを示すことができる。癌マーカーは、癌の原因であってもなくてもよい。

核酸タグは、通常は人工的な配列で、通常はＤＮＡである短い核酸（例えば、１００、５０、または１０ヌクレオチド長未満）であり、（ｉ）異なる試料に由来するか（例えば、試料の指標を示す）、（ｉｉ）異なる型であるか、（ｉｉｉ）異なるプロセシングを受けた核酸を識別するために修復されたＤＮＡ断片を標識するために使用される。タグは、一本鎖または二本鎖であり得る。核酸タグを解読して、起源となる試料、核酸の形態またはプロセシングなどの情報を明らかにすることができる。タグを使用して異なるタグを保有する複数の核酸をプールして並行処理し、その後に核酸をタグの読み取りによって解析することができる。タグを、分子識別子またはバーコードとも呼ぶことができる。

アダプターは、修復されたＤＮＡ断片分子の末端のいずれかまたは両方に連結するための短い核酸（例えば、５００、１００、または５０ヌクレオチド長未満であり、典型的にはＤＮＡである）である。アダプターは、必ずしもそうではないが、ライゲーションのために二本鎖の形態で提供され得る。また、アダプターを、プライマー（例えば、一本鎖、ヘアピン、または二本鎖であり得る）中の５’エレメント（ランダム化した標的ハイブリッド形成配列を有するプライマー集団のメンバーなど）として提供することができる。アダプターは、両端がアダプターに隣接する修復されたＤＮＡ断片分子を増幅させるためのプライマー結合部位、および／または配列決定プライマー結合部位（次世代配列決定手技のためのプライマー結合部位が含まれる）を含むことができる。また、アダプターは、捕捉プローブ（フローセル支持体に付着したオリゴヌクレオチドなど）のための結合部位を含むことができる。また、アダプターは、本明細書中に記載のタグを含むことができる。タグがアンプリコンおよび修復されたＤＮＡ断片の配列決定リード中に含まれるように、タグはプライマーおよび配列決定プライマー部位に対して配置され得る。同一および異なるアダプターを、同一分子の各末端に連結することができる。時折、タグが異なることを除いて同一のアダプターがそれぞれの末端に連結される。アダプター型の例は、平滑末端化されてもいるか、相補ヌクレオチドを用いてテーリングされてもいる核酸（例えば、修復されたＤＮＡ断片）への連結のために、一方の末端が本明細書中に記載のように平滑末端化されているかテーリングされているＹ型アダプターである。アダプター型の別の例は、同様に分析されるべき核酸への連結のために平滑末端化またはテーリングされた末端を有するボール型アダプターである。

「部分的に二本鎖のＤＮＡ断片」は、一部が二本鎖であり、かつ一部が一本鎖である線状ＤＮＡを指す。

「３’オーバーハング」は、相補ヌクレオチドにアニーリングしない部分的に二本鎖のＤＮＡ断片の３’末端の１または複数の連続するヌクレオチドを指す。

交換可能な用語「オリゴマー」、「オリゴ」、および「オリゴヌクレオチド」は、一般に１，０００ヌクレオチド（ｎｔ）残基未満の核酸（下限約５ｎｔ残基かつ上限約５００～９００ｎｔ残基の範囲のポリマーが含まれる）を指す。いくつかの実施形態では、オリゴヌクレオチドのサイズは、下限約１２～１５ｎｔかつ上限約５０～６００ｎｔの範囲であり、他の実施形態は、下限約１５～２０ｎｔかつ上限約２２～１００ｎｔの範囲である。オリゴヌクレオチドは、天然に存在する供給源から精製され得るか、種々の周知の酵素的方法および化学的方法のうちのいずれかを使用して合成され得る。オリゴヌクレオチドという用語は、いかなる試薬に対する特定の機能も表さず；むしろ、本明細書中に記載の全てのかかる試薬を対象とするために一般的に使用される。オリゴヌクレオチドは、種々の異なる機能を果たし得る。例えば、相補鎖とハイブリッド形成することができ、かつ核酸ポリメラーゼの存在下でさらに伸長することができる場合にはプライマーとして機能し得る；標的核酸またはそのアンプリコンとハイブリッド形成することができ、かつ検出可能な部分（例えば、フルオロフォア）をさらに提供することができる場合には標的核酸を検出するように機能し得る。

「プライマー」は、ポリメラーゼによって伸長することができる３’末端を含むオリゴヌクレオチドである。

「ランダム標的ハイブリッド形成配列を含む」プライマー集団は、標的ハイブリッド形成配列が定常配列よりも変動し得る複数のプライマーである。例えば、ランダム標的ハイブリッド形成配列は、本明細書中の他所で詳細に考察するように、集団間で変動する少なくとも４つの位置を含み得る。

「ＤＮＡポリメラーゼ」は、テンプレートに相補的なプライマーの３’末端にヌクレオチドを付加することによってテンプレートにアニーリングしたプライマーを伸長することができる酵素である（当該分野で公知のように、ポリメラーゼは一般にある程度のエラーを有すると理解されている）。

「３’→５’エキソヌクレアーゼ活性」は、核酸の３’末端からヌクレオチドを除去する酵素活性を指す。

「５’→３’エキソヌクレアーゼ活性」は、核酸の５’末端からヌクレオチドを除去する酵素活性を指す。

酵素活性についての標準的なアッセイにおいて酵素活性を検出することができない場合、酵素またはポリペプチドは、酵素活性を「欠く」。例えば、エキソヌクレアーゼ活性を、場合によって３’末端または５’末端のヌクレオチドが標識された好適な核酸基質を準備し、酵素が標識を検出可能に除去するかどうかを判定することによってアッセイすることができる。「エキソ－」という表示は、本明細書中で、エキソヌクレアーゼ活性を欠くポリメラーゼを省略するために使用される。

「タグ」は、例えば、プライマーの５’エレメントの組み込みを介するか、ライゲーションを介して核酸分子に付加された任意の配列を指す。タグは、種々の機能（その後の反応においてプライマーの結合部位としての機能を果たすこと、または試料もしくは分子のプロセシングについての情報を提供するか、分子（独立しているか、分子の内因性配列との組み合わせ）およびその複製産物もしくは増幅産物を同定するバーコードもしくはインデックスとしての機能を果たすことが含まれる）を有し得る。

「無細胞ＤＮＡ」（「ｃｆＤＮＡ」）は、被験体からのＤＮＡの単離時に細胞内に含まれないＤＮＡを指す。

「精製」は、組成物の少なくとも１つの他の構成要素（例えば、プライマー、酵素、塩、およびヌクレオチドなど）からの目的の分析物（修復されたＤＮＡ分子など）の分離を指す。「精製」は、分離によって出発組成物中の他の構成要素（単数または複数）と比較して高い濃度比で目的の分析物を含む組成物が得られる任意の手技を含む。

「後成的に改変された」ＤＮＡは、ｉｎｖｉｖｏで起源となるそのヌクレオチドの１または複数の改変を含む。シトシンの５－メチル化および５－ヒドロキシメチル化は、後成的に改変されたＤＮＡの例である。

詳細な説明
１．概要
核酸試料は、しばしば、ハイスループット配列決定または次世代配列決定などの配列決定のための核酸試料を調製するためにプロセシングを必要とする一本鎖オーバーハングを有する部分的に二本鎖の核酸断片を含む。５’オーバーハングを簡潔な伸長反応（図１を参照のこと）で修復することができ、この反応は、配列情報を喪失することは無いが、従来の３’オーバーハングの修復はエキソヌクレオリシスに依存しており、断片から配列が排除される。

本発明は、例えば３’オーバーハングの全てまたは実質的部分の配列を保持することができる３’オーバーハングの改良された修復方法を提供する。いくつかの実施形態では、方法は、３’オーバーハングを含む部分的に二本鎖のＤＮＡ断片をプライマー集団の１または複数のプライマーと接触させる工程を含み、ここで、プライマー集団は、ランダム標的ハイブリッド形成配列を含む。プライマー集団の１または複数のメンバーを、部分的に二本鎖のＤＮＡ断片にアニーリングして伸長させ、それにより、ＤＮＡ断片にアニーリングした１または複数の伸長したプライマーを産生することができる。別の伸長したプライマーまたは部分的に二本鎖のＤＮＡ断片の鎖の５’末端と共にＤＮＡ断片にアニーリングした伸長したプライマーは、ライゲーションのための基質を形成することができる。次いで、ライゲーションを行って修復されたＤＮＡ断片を得る。当業者は、かかる方法の個別の操作（例えば、ＤＮＡ分子へのランダム標的ハイブリッド形成配列を有するプライマーのアニーリング、ＤＮＡの別のセグメントの５’末端へのプライマーの伸長、および前記５’末端へ伸長したプライマーのライゲーション）の各々に適切な条件に精通しているであろう。

いくつかの実施形態では、プライマーは、部分的に二本鎖のＤＮＡ断片の鎖の５’末端まで伸長され、次いで、部分的に二本鎖のＤＮＡ断片の鎖の５’末端にライゲートされる。いくつかの実施形態では、第１のプライマーは、部分的に二本鎖のＤＮＡ断片の鎖の５’末端まで伸長され；第２のプライマーは第１のプライマーの５’末端まで伸長され；次いで、第１のプライマーは部分的に二本鎖のＤＮＡ断片の鎖の５’末端にライゲートされ、第２のプライマーは第１のプライマーの５’末端にライゲートされる。

いくつかの実施形態では、本明細書中に記載の方法の少なくとも工程（ａ）～（ｃ）を単一の管内で行う。

いくつかの実施形態では、二本鎖ＤＮＡ断片は組成物中に存在し、少なくとも工程（ａ）～（ｃ）について、構成要素は組成物から除去されない。

２．部分的に二本鎖のＤＮＡ断片
いくつかの実施形態では、部分的に二本鎖のＤＮＡ断片は、各末端に３’オーバーハングを有する。いくつかの実施形態では、部分的に二本鎖のＤＮＡ断片は、３’オーバーハングおよび（ｉ）平滑末端または（ｉｉ）５’オーバーハングを有する。いくつかの実施形態では、５’オーバーハングは、前記５’オーバーハングに沿って前記３’末端を伸長させることによって修復される。

いくつかの実施形態では、部分的に二本鎖のＤＮＡ断片はｃｆＤＮＡ断片である。いくつかの実施形態では、部分的に二本鎖のＤＮＡ断片は哺乳動物由来である。いくつかの実施形態では、部分的に二本鎖のＤＮＡ断片はヒト由来である。いくつかの実施形態では、部分的に二本鎖のＤＮＡ断片は、体液試料に由来する。さらなる実施形態では、体液は、全血、血清、または血漿である。

いくつかの実施形態では、部分的に二本鎖のＤＮＡ断片は、組成物中のＤＮＡ断片集団の一部である。さらなる実施形態では、ＤＮＡ断片集団は剪断されたＤＮＡを含む。さらなる実施形態では、ＤＮＡ断片集団は、後成的に改変されたＤＮＡを含む。いくつかの実施形態では、ＤＮＡ断片集団は、複数のゲノム遺伝子座（例えば、少なくとも１０、１００、１０００、または１００００個のゲノム遺伝子座）由来の断片を含む。いくつかの実施形態では、ＤＮＡ断片集団は富化されていない。ある断片を他の断片と比較して存在量を増加させる手技（配列特異的プライマーを使用した増幅または配列特異的捕捉プローブを使用した標的の捕捉など）に集団が供されていない場合、集団は富化されていない。いくつかの実施形態では、ＤＮＡ断片集団が増幅されていないとは、前記集団がいかなる増幅手技も受けていなかったことを意味する。非増幅ＤＮＡを使用して、ＤＮＡメチル化などの後成的遺伝情報を保持することができる。

いくつかの実施形態では、部分的に二本鎖のＤＮＡ断片は、試料中に含まれるか、試料から得られる。試料は、被験体から単離された任意の生物試料であり得る。試料には、身体組織、例えば、存在が既知または疑われる固形腫瘍、全血、血小板、血清、血漿、便、赤血球、白血球細胞または白血球、内皮細胞、組織生検、脳脊髄液滑液、リンパ液、腹水、間質液または細胞外液、細胞間隙中の流動物（歯肉溝滲出液が含まれる）、骨髄、胸水、脳脊髄液、唾液、粘液、痰、精液、汗、尿が含まれ得る。試料は、好ましくは体液、特に血液およびその画分、ならびに尿である。試料は、被験体から最初に単離された形態であり得るか、構成要素（細胞など）を除去するか添加するためか、他と比較して１つの構成要素を富化するためのさらなるプロセシングに供することができている。いくつかの実施形態では、部分的に二本鎖のＤＮＡ断片は、体液試料に由来する。さらなる実施形態では、体液は、全血、血清、または血漿である。

いくつかの実施形態では、部分的に二本鎖のＤＮＡ断片は、血漿試料に由来する。血漿の体積は、配列決定される領域の所望の読み取り深度に依存し得る。例示的な体積は、０．４～４０ｍＬ、５～２０ｍＬ、１０～２０ｍＬである。例えば、体積は、０．５ｍＬ、１ｍＬ、５ｍＬ、１０ｍＬ、２０ｍＬ、３０ｍＬ、または４０ｍＬであり得る。試料採取された血漿の体積は、例えば、５～２０ｍＬであってよい。

試料は、ゲノム等価物を含む種々の量のＤＮＡを含むことができる。例えば、約３０ｎｇのＤＮＡ試料は、約１０，０００個の半数体ヒトゲノム等価物、無細胞ＤＮＡ（ｃｆＤＮＡ）の場合、約２０００億個の個別の核酸分子を含むことができる。同様に、約１００ｎｇのＤＮＡ試料は、約３０，０００個の半数体ヒトゲノム等価物、無細胞ＤＮＡ（ｃｆＤＮＡ）の場合、約６０００億個の個別の分子を含むことができる。いくつかの試料は、１～５００、２～１００、５～１５０ｎｇの無細胞ＤＮＡ（例えば、５～３０ｎｇ、または１０～１５０ｎｇの無細胞ＤＮＡ）を含む。

試料は、異なる供給源由来のＤＮＡを含むことができる。例えば、試料は、生殖系列ＤＮＡまたは体細胞ＤＮＡを含むことができる。試料は、変異を有するＤＮＡを含むことができる。例えば、試料は、生殖系列変異および／または体細胞変異を有するＤＮＡを含むことができる。また、試料は、癌関連変異（例えば、癌関連体細胞変異）を有するＤＮＡを含むことができる。

増幅前の試料中の無細胞ＤＮＡ（ｃｆＤＮＡ）量の例は、約１ｆｇ～約１ｕｇ、例えば、１ｐｇ～２００ｎｇ、１ｎｇ～１００ｎｇ、１０ｎｇ～１０００ｎｇの範囲である。例えば、量は、約６００ｎｇまで、約５００ｎｇまで、約４００ｎｇまで、約３００ｎｇまで、約２００ｎｇまで、約１００ｎｇまで、約５０ｎｇまで、または約２０ｎｇまでの無細胞核酸分子であり得る。量は、少なくとも１ｆｇ、少なくとも１０ｆｇ、少なくとも１００ｆｇ、少なくとも１ｐｇ、少なくとも１０ｐｇ、少なくとも１００ｐｇ、少なくとも１ｎｇ、少なくとも１０ｎｇ、少なくとも１００ｎｇ、少なくとも１５０ｎｇ、または少なくとも２００ｎｇの無細胞核酸分子であり得る。量は、１フェムトグラム（ｆｇ）、１０ｆｇ、１００ｆｇ、１ピコグラム（ｐｇ）、１０ｐｇ、１００ｐｇ、１ｎｇ、１０ｎｇ、１００ｎｇ、１５０ｎｇ、または２００ｎｇまでの無細胞ＤＮＡ分子であり得る。方法は、１フェムトグラム（ｆｇ）～２００ｎｇを得る工程を含むことができる。

いくつかの実施形態では、体液試料は、５～１０ｍｌの全血、血漿、または血清であり、前記試料は、約３０ｎｇのＤＮＡまたは約１０，０００個の半数体ヒトゲノム等価物を含む。

いくつかの実施形態では、部分的に二本鎖のＤＮＡ断片は、組成物中のＤＮＡ断片集団の一部である。さらなる実施形態では、ＤＮＡ断片集団は剪断されたＤＮＡを含む。いくつかの実施形態では、部分的に二本鎖のＤＮＡ断片はｃｆＤＮＡ断片である。

無細胞ＤＮＡは、細胞内に含まれないか、そうでなければ細胞に結合していないＤＮＡであり、換言すれば、インタクトな細胞の除去後に試料中に核酸が残存している。無細胞ＤＮＡは、二本鎖、一本鎖、またはそのハイブリッドであり得る。いくつかの実施形態では、ｃｆＤＮＡ断片は、二本鎖ＤＮＡ分子を含み、そのうちの少なくともいくつかは一本鎖オーバーハングを有する。無細胞ＤＮＡは、分泌または細胞死過程（例えば、細胞壊死およびアポトーシス）によって身体流動物中に放出され得る。いくつかの無細胞ＤＮＡは、癌細胞（例えば、循環腫瘍ＤＮＡ（ｃｔＤＮＡ））から身体流動物中に放出される。健康な細胞から放出されるものもある。

無細胞ＤＮＡは、１または複数の後成的改変を有することができ、例えば、無細胞核酸は、アセチル化、メチル化、ユビキチン化、ホスホリル化、ｓｕｍｏ化、リボシル化、および／またはシトルリン化され得る。いくつかの実施形態では、部分的に二本鎖のＤＮＡ断片は、組成物中のＤＮＡ断片集団の一部であり、ＤＮＡ断片集団は、後成的に改変されたＤＮＡを含む。無細胞ＤＮＡは、約１００～５００ヌクレオチド、特に１１０～約２３０ヌクレオチド（最頻値は約１６８ヌクレオチド）、および２４０～４４０ヌクレオチドの範囲の第２の小ピークのサイズ分布を有する。

無細胞ＤＮＡを、分割工程によって身体流動物から単離することができ、無細胞ＤＮＡは、溶液中に見出される場合、インタクトな細胞および身体流動物の他の不溶性の構成要素から分離される。分割には、遠心分離または濾過などの技術が含まれ得る。あるいは、身体流動物中の細胞を溶解し、無細胞核酸および細胞核酸を共にプロセシングすることができる。一般に、緩衝液の添加および洗浄工程後、核酸をアルコールで沈殿させることができる。シリカベースのカラムなどのさらなる清浄化工程を使用して、夾雑物または塩が除去され得る。非特異的なバルクキャリア核酸を、例えば、反応中に添加して、収率などの手技のある特定の態様が最適化され得る。

かかるプロセシング後、試料は、種々のＤＮＡ形態（二本鎖ＤＮＡおよび一本鎖ＤＮＡが含まれる）を含むことができる。必要に応じて、一本鎖ＤＮＡを二本鎖形態に変換することができ、従って、その後のプロセシング工程および分析工程で二本鎖ＤＮＡ形態が含まれる。

３．ＤＮＡポリメラーゼ
いくつかの実施形態では、ＤＮＡポリメラーゼは３’→５’エキソヌクレアーゼ活性を欠く。いくつかの実施形態では、ＤＮＡポリメラーゼは５’→３’エキソヌクレアーゼ活性を欠く。いくつかの実施形態では、ＤＮＡポリメラーゼは鎖置換活性を欠く。５’－３’ポリメラーゼ活性を示すことができ、かつ３’→５’エキソヌクレアーゼ活性、５’→３’エキソヌクレアーゼ活性、および鎖置換活性を欠く当該分野で公知の任意のＤＮＡポリメラーゼは、本明細書中に記載の方法の工程（ｂ）のためのＤＮＡポリメラーゼとして使用され得る。いくつかの実施形態では、ＤＮＡポリメラーゼはクレノウ断片である。いくつかの実施形態では、ＤＮＡポリメラーゼはエキソ－クレノウ断片である。

４．プライマー
いくつかの実施形態では、プライマー集団のプライマーが一本鎖である。

いくつかの実施形態では、プライマー集団のプライマーは、ヘアピン領域または二本鎖領域を含む。いくつかの実施形態では、プライマー集団のプライマーは３’オーバーハングを有する二本鎖であり、ランダム標的ハイブリッド形成配列は３’オーバーハング中に存在する。いくつかの実施形態では、プライマー集団のプライマーは３’オーバーハングを有するヘアピンであり、ランダム標的ハイブリッド形成配列は３’オーバーハング中に存在する。

いくつかの実施形態では、プライマー集団のプライマーは、アダプターを含む。いくつかの実施形態では、プライマーのヘアピン領域または二本鎖領域は、アダプターを含む。

いくつかの実施形態では、アダプターは、本明細書中に記載のタグを含まれる。いくつかの実施形態では、アダプターはタグを含む。さらなる実施形態では、タグはバーコードを含む。さらなる実施形態では、プライマー集団は、複数の異なるバーコードを含む。

同一または異なるアダプターを、修復されたＤＮＡ断片のそれぞれの末端に連結することができる。時折、タグが異なることを除いて同一のアダプターがそれぞれの末端に連結される。いくつかの実施形態では、アダプターは、Ｙ形アダプターである。いくつかの実施形態では、アダプターはベル形アダプターである。本明細書中で使用されるアダプターを、以下にさらに記載する（第６節）。

いくつかの実施形態では、ランダム標的ハイブリッド形成配列の長さは、少なくとも４、５、６、７、８、９、または１０ヌクレオチドである。いくつかの実施形態では、ランダム標的ハイブリッド形成配列の長さは、少なくとも４ヌクレオチドである。いくつかの実施形態では、ランダム標的ハイブリッド形成配列の長さは、少なくとも５ヌクレオチドである。いくつかの実施形態では、ランダム標的ハイブリッド形成配列の長さは、少なくとも６ヌクレオチドである。いくつかの実施形態では、ランダム標的ハイブリッド形成配列の長さは、少なくとも７ヌクレオチドである。いくつかの実施形態では、ランダム標的ハイブリッド形成配列の長さは、少なくとも８ヌクレオチドである。いくつかの実施形態では、ランダム標的ハイブリッド形成配列の長さは、少なくとも９ヌクレオチドである。いくつかの実施形態では、ランダム標的ハイブリッド形成配列の長さは、少なくとも１０ヌクレオチドである。

いくつかの実施形態では、ランダム標的ハイブリッド形成配列の長さは、約４、５、６、７、８、９、１０、１１、または１２ヌクレオチドである。いくつかの実施形態では、ランダム標的ハイブリッド形成配列の長さは、約４ヌクレオチドである。いくつかの実施形態では、ランダム標的ハイブリッド形成配列の長さは、約５ヌクレオチドである。いくつかの実施形態では、ランダム標的ハイブリッド形成配列の長さは、約６ヌクレオチドである。いくつかの実施形態では、ランダム標的ハイブリッド形成配列の長さは、約７ヌクレオチドである。いくつかの実施形態では、ランダム標的ハイブリッド形成配列の長さは、約８ヌクレオチドである。いくつかの実施形態では、ランダム標的ハイブリッド形成配列の長さは、約９ヌクレオチドである。いくつかの実施形態では、ランダム標的ハイブリッド形成配列の長さは、約１０ヌクレオチドである。いくつかの実施形態では、ランダム標的ハイブリッド形成配列の長さは、約１１ヌクレオチドである。いくつかの実施形態では、ランダム標的ハイブリッド形成配列の長さは、約１２ヌクレオチドである。

本明細書中に記載の任意の実施形態では、プライマー集団は、４つの異なる塩基（例えば、Ａ、Ｃ、Ｔ、およびＧ）の各々がランダム標的ハイブリッド形成配列の各々の位置に出現するメンバーを含み得る。言い換えれば、プライマー集団の異なるメンバーにおいて、４つの塩基の各々は、ランダム標的ハイブリッド形成配列の各々の位置に出現することができる。当業者は、ＵをＴの変わりに使用することができ、そして／または非改変塩基と同一の塩基対合優先度を有する改変塩基（例えば、メチル化シトシン、プソイドウリジンなど）を使用することができると認識するであろう；そのようなものとして、ＴはＵを包含し、Ａ、Ｃ、Ｔ、およびＧの各々は、非改変塩基と同一の塩基対合優先度を保持する改変形態を包含する。

いくつかの実施形態では、部分的に二本鎖のＤＮＡ断片は、各々が本明細書中に開示のように修復されている２つの３’オーバーハングを含む。

いくつかの実施形態では、部分的に二本鎖のＤＮＡ断片は、３’オーバーハングおよび５’オーバーハングを含む。５’オーバーハングは、例えば、５’オーバーハングに沿って組み込まれた３’末端を伸長することによって修復され得る。いくつかの実施形態では、この伸長は、３’オーバーハングに沿って１または複数のプライマーを伸長させる同一のポリメラーゼによって行われる。

いくつかの実施形態では、修復されたＤＮＡ断片は、１つまたは２つの平滑末端を含む。いくつかの実施形態では、本明細書中に記載のライゲーション反応後、任意の残存するオーバーハングは、例えば、好適なエキソヌクレアーゼ（例えば、３’→５’エキソヌクレアーゼ）を使用してさらに修復される。これにより、少量の配列を喪失するが、それにもかかわらず３’オーバーハングの元の部分であった配列を相当量保持し得る一方で、さらなる操作に供することができる平滑末端を有する分子を依然として提供する。

いくつかの実施形態では、修復されたＤＮＡ断片は、例えば、平滑末端化された核酸の３’末端にヌクレオチドを非テンプレート指向性に付加するポリメラーゼを使用する末端テーリングに供され、必要に応じて、ＡはＧより優先され、ＧはＣまたはＴより優先されて付加される。このポリメラーゼは、校正機能を欠き得、そして／または例えば高温で活性を保持する熱安定性であり得る。Ｔａｑ、Ｂｓｔ大断片、およびＴｔｈポリメラーゼは、かかるポリメラーゼの例である。反応混合物は典型的には前の工程由来の４つの標準的なヌクレオチド型の各々を等モル量で含むが、４つのヌクレオチド型は、均等な比率で３’末端に付加されない。むしろＡが最も高い頻度で付加され、Ｇがそれに続き、ＣおよびＴがそれに続く。

適用可能な場合、修復されたＤＮＡ断片の平滑末端化およびテーリングを、単一の管内で行うことができる。平滑末端化された核酸は、テーリング反応が起こる前に平滑末端化を行う酵素（単数または複数）から分離する必要はない。必要に応じて、全ての酵素、ヌクレオチド、および他の試薬を、平滑末端化反応が起こる前に共に供給する。共に供給するとは、平滑末端化するために試料をインキュベートする時に全てが存在するように、全てを試料中に十分に近い時間に導入することを意味する。必要に応じて、少なくとも平滑末端化および末端テーリングの両方のためのインキュベーションを完了するまで、酵素、ヌクレオチド、および他の試薬を供給した後に試料から何も除去しない。しばしば、末端テーリング反応を、平滑末端化反応よりも高い温度で行う。例えば、平滑末端化反応を、５’－３’ポリメラーゼおよび３’－５’エキソヌクレアーゼが活性であり、かつ熱安定性ポリメラーゼが不活性であるか最小の活性である周囲温度で行い、末端テーリング反応を、５’－３’ポリメラーゼおよび３’－５’エキソヌクレアーゼが不活性であり、かつ熱安定性ポリメラーゼが活性である場合の高温（６０℃超）で行うことができる。

いくつかの実施形態では、修復後および／または任意のさらなるプロセシング工程後に、酵素（単数または複数）（例えば、ポリメラーゼ、リガーゼ、および／またはエキソヌクレアーゼ）を、例えば熱変性によって変性させる。例えば、７５℃～８０℃に温度を上昇させることによって変性させることができる。

５．修復されたＤＮＡ断片のアダプターへの連結
いくつかの実施形態では、修復後、テーリングした試料分子をその後に精製するか精製せずに、テーリングした試料分子をアダプターに接触させる。例えば、修復されたＤＮＡ断片のテーリング後、テーリングした試料分子を、アダプターの一方の末端が相補的なＴおよびＣヌクレオチドでテーリングされたアダプターと接触させ得る。別の例では、平滑末端を有する修復されたＤＮＡ断片を、平滑末端を有するアダプターと接触させ得る。

アダプターを、その各鎖の個別の合成およびアニーリングによって形成することができる。したがって、さらなるＴテールおよびＣテールを、使用する場合、一方の鎖の合成における追加のヌクレオチドとして付加することができる。典型的には、ＧおよびＡでテーリングしたアダプターは、これらのアダプターがＣおよびＴでそれぞれテーリングした試料分子とアニーリングするかもしれないが、他のアダプターともアニーリングするであろうとの理由から、含まれない。３’末端に相補ヌクレオチド（すなわち、Ｔ－ＡおよびＣ－Ｇ）を保有するアダプター分子および試料分子がアニーリングし、相互に連結することができる。Ｔテーリングしたアダプターと比較したＣテーリングしたアダプターの百分率は、モル基準で約５～４０％（例えば、１０～３５％、１５～２５％、２０～３５％、２５～３５％、または約３０％）の範囲であり得る。試料分子の３’末端への単一ヌクレオチドの非テンプレート指向性の付加は完了まで進まないので、試料はいくつかのテーリングされていない平滑末端化された試料分子も含み得る。これらの分子を、１つ、好ましくは唯一の平滑末端を有するアダプターも試料に供給することによって回収することができる。平滑末端アダプターに、０．２～２０％、または０．５～１５％または１～１０％のアダプターモル比で、ＴテーリングしたアダプターおよびＣテーリングしたアダプターを供給することができる。末端平滑化したアダプターを、ＴテーリングしたアダプターおよびＣテーリングしたアダプターと同時、前、または後に提供することができる。末端平滑化したアダプターを平滑末端化した試料分子と再度ライゲートすると、両側がアダプターに隣接した試料分子が得られる。これらの分子は、試料の間にＡ－Ｔヌクレオチド対またはＣ－Ｇヌクレオチド対を欠き、アダプターは、テーリングした試料分子がテーリングしたアダプターにライゲートされた時に出現する。

これらの反応で使用されるアダプターは、好ましくは、アダプターが一方向のみで試料分子とライゲートすることができるように、ＴまたはＣで末端テーリングされた唯一の末端または唯一の平滑末端を有する。アダプターは、例えば、一方の末端がテーリングされているか平滑であり、他方の末端が２つの一本鎖を有するＹ形アダプターであり得る。例示的なＹ形アダプターは、以下の通りタグを示す（６塩基）を有する配列を有する。上のオリゴヌクレオチドは、単一塩基Ｔテールを含む。

ユニバーサルアダプター：５’ＡＡＴＧＡＴＡＣＧＧＣＧＡＣＣＡＣＣＧＡＧＡＴＣＴＡＣＡＣＴＣＴＴＴＣＣＣＴＡＣＡＣＧＡＣＧＣＴＣＴＴＣＣＧＡＴＣＴ（配列番号１）。

アダプター、インデックス１－１２：５’ ＧＡＴＣＧＧＡＡＧＡＧＣＡＣＡＣＧＴＣＴＧＡＡＣＴＣＣＡＧＴＣＡＣ（６塩基）ＡＴＣＴＣＧＴＡＴＧＣＣＧＴＣＴＴＣＴＧＣＴＴＧ（配列番号２）

Ｃテールを有する別のＹ形アダプターは、以下の配列を有する：

５’ＡＡＴＧＡＴＡＣＧＧＣＧＡＣＣＡＣＣＧＡＧＡＴＣＴＡＣＡＣＴＣＴＴＴＣＣＣＴＡＣＡＣＧＡＣＧＣＴＣＴＴＣＣＧＡＴＣＣ（配列番号３）およびアダプター、インデックス１－１２：５’ ＧＡＴＣＧＧＡＡＧＡＧＣＡＣＡＣＧＴＣＴＧＡＡＣＴＣＣＡＧＴＣＡＣ（６塩基）ＡＴＣＴＣＧＴＡＴＧＣＣＧＴＣＴＴＣＴＧＣＴＴＧ（配列番号２）

かかるオリゴヌクレオチドのカスタマイズされた組み合わせ（ＴテールおよびＣテールの両方を有するオリゴヌクレオチドが含まれる）を、本方法で使用するために合成することができる。

これらのアダプター配列の短縮バージョンは、Ｒｏｈｌａｎｄｅｔａｌ．，ＧｅｎｏｍｅＲｅｓ．２０１２Ｍａｙ；２２（５）：９３９－９４６に記載されている。

また、アダプターは、テーリングされているか平滑末端化されている唯一の末端を有するベル形であり得る。アダプターは、増幅のためのプライマー結合部位、配列決定プライマーのための結合部位、および／または同定のための核酸タグを含むことができる。同一または異なるアダプターを、単一の反応で使用することができる。

アダプターが識別タグを含み、試料中の核酸が各末端でアダプターに付着される場合、識別子の潜在的な組み合わせの数は、供給される固有のタグの数に伴って指数関数的に増加する（すなわち、ｎ^ｎ個の組み合わせ、ここで、ｎは固有の識別タグの数である）。いくつかの方法では、固有のタグの組み合わせの数は、試料中の全てまたは実質的に全て（例えば、少なくとも９０％）の異なる二本鎖ＤＮＡ分子が異なる組み合わせのタグを受け取る可能性が統計的に高くなるほどに十分である。いくつかの方法では、識別タグの固有の組み合わせの数は、試料中の固有の二本鎖ＤＮＡ分子の数より少ない（例えば、５～１０，０００の異なるタグの組み合わせ）。

上記方法を実施するのに好適な酵素を提供するキットは、ＮＥＢＮｅｘｔ（登録商標）Ｕｌｔｒａ（商標）ＩＩＤＮＡＬｉｂｒａｒｙＰｒｅｐＫｉｔｆｏｒＩｌｌｕｍｉｎａ（登録商標）である。このキットは、以下の試薬を提供する：ＮＥＢＮｅｘｔＵｌｔｒａＩＩ末端調製酵素ミックス、ＮＥＢＮｅｘｔＵｌｔｒａＩＩ末端調製反応緩衝液、ＮＥＢＮｅｘｔライゲーションエンハンサー、ＮＥＢＮｅｘｔＵｌｔｒａＩＩライゲーションマスターミックス－２０、ＮＥＢＮｅｘｔ（登録商標）ＵｌｔｒａＩＩＱ５（登録商標）マスターミックス。

記載のＴテーリングしたアダプターおよびＣテーリングしたアダプターを付着させることによってアダプター化した核酸の集団を得ることができ、この集団は複数の核酸分子を含み、核酸分子の各々は核酸断片を含み、核酸断片はその両側がバーコードを含むアダプターに隣接しており、核酸断片とアダプターとの間でＡ／ＴまたはＧ／Ｃ塩基対を形成する。複数の核酸分子は、少なくとも１０，０００、１００，０００、または１，０００，０００分子であり得る。集団中のほとんどの核酸を、異なるバーコードを有するアダプターに隣接させることができる（例えば、少なくとも９９％）。平滑末端化したアダプターも含まれる場合、集団は、核酸断片のいずれかの末端または両端にアダプターが直接連結した（すなわち、Ａ／Ｔ対またはＧ／Ｃ対を介在しない）核酸分子を含む。

６．増幅
アダプターに隣接した修復されたＤＮＡ断片を、増幅すべき核酸に隣接するアダプター中のプライマー結合部位に結合するプライマーからプライミングされるＰＣＲまたは別の増幅方法によって増幅することができる。増幅方法は、サーモサイクリングによる伸長、変性、およびアニーリングのサイクルを含むことができるか、転写媒介増幅のような等温増幅であり得る。他の増幅方法には、リガーゼ連鎖反応、鎖置換増幅、核酸配列ベースの増幅、および自律配列ベースの複製が含まれる。

いくつかの実施形態では、本明細書中に記載の方法は、工程（ａ）～（ｃ）の後に、修復されたＤＮＡ断片を増幅する工程をさらに含む。さらなる実施形態では、修復されたＤＮＡ断片は１または複数のアダプター（例えば、２つのアダプター）を含み、前記修復されたＤＮＡ断片の増幅に、前記１または複数のアタプターにアニーリングする１または複数の（例えば、２つの）増幅オリゴマーを使用する。

（本明細書中の他所で考察するように）富化工程を行う場合、増幅は、富化工程に先行し、そして／または富化工程に続き得る。いくつかの実施形態では、方法は、修復された断片を増幅する工程、富化工程を実施して付加された断片を得る、富化工程を実施する工程、および、その後に付加された修復された断片をさらに増幅する工程を含む。

７．タグ
いくつかの実施形態では、核酸分子（ポリヌクレオチド試料に由来する）は、試料インデックスおよび／または分子バーコード（一般に、「タグ」と呼ばれる）でタグ化され得る。タグは、特に、化学合成、ライゲーション（例えば、平滑末端ライゲーションまたは粘着末端ライゲーション）、またはオーバーラップ伸長ポリメラーゼ連鎖反応（ＰＣＲ）によってアダプターに組み込まれるか、そうでなければ連結され得る。かかるアダプターは、最終的に標的核酸分子に連結され得る。他の実施形態では、従来の核酸増幅方法を使用して核酸分子に試料インデックスを導入するために、１ラウンドまたはそれを超えるラウンドの増幅サイクル（例えば、ＰＣＲ増幅）を一般に適用する。増幅は、１または複数の反応混合物（例えば、アレイ中の複数のマイクロウェル）中で行われ得る。分子バーコードおよび／または試料インデックスは、同時または任意の順序で導入され得る。いくつかの実施形態では、分子バーコードおよび／または試料インデックスは、配列捕捉工程が行われる前および／または後に導入される。いくつかの実施形態では、プローブ捕捉前に分子バーコードのみが導入され、試料インデックスは、配列捕捉工程が行われた後に導入される。いくつかの実施形態では、分子バーコードおよび試料インデックスの両方は、プローブベースの捕捉工程が行われる前に導入される。いくつかの実施形態では、試料インデックスは、配列捕捉工程が行われた後に導入される。いくつかの実施形態では、分子バーコードは、ライゲーション（例えば、平滑末端ライゲーションまたは付着末端ライゲーション）によってアダプターを介して試料中の核酸分子（例えば、ｃｆＤＮＡ分子）に組み込まれる。いくつかの実施形態では、試料インデックスは、オーバーラップ伸長ポリメラーゼ連鎖反応（ＰＣＲ）によって試料中の核酸分子（例えば、ｃｆＤＮＡ分子）に組み込まれる。典型的には、配列捕捉プロトコールは、標的にされた核酸配列（例えば、ゲノム領域のコード配列）に相補的な一本鎖核酸分子の導入を含み、かかる領域の変異は、ある癌型に関連する。

いくつかの実施形態では、タグは、試料核酸分子の一方の末端または両端に位置付けられ得る。いくつかの実施形態では、タグは、予め決定された配列、ランダム配列、またはセミランダム配列のオリゴヌクレオチドである。いくつかの実施形態では、タグは、約５００、２００、１００、５０、２０、１０、９、８、７、６、５、４、３、２、または１ヌクレオチド長未満であり得る。タグは、試料核酸にランダムまたは非ランダムに連結され得る。

いくつかの実施形態では、各試料は、試料インデックスまたは試料インデックスの組み合わせを用いて固有にタグ化される。いくつかの実施形態では、試料または副試料の各核酸分子は、分子バーコードまたは分子バーコードの組み合わせを用いて固有にタグ化される。他の実施形態では、分子バーコードが複数で相互に必ずしも固有ではない（例えば、非固有分子バーコード）ような複数の分子バーコードが使用され得る。これらの実施形態では、分子バーコードは、一般に、（例えば、ライゲーションによって）個別の分子に付着され、その結果、分子バーコードとこれに付着され得る配列が組み合わせられると個別に追跡され得る固有の配列が作出される。非固有にタグ化された分子バーコードの検出を内因性配列情報（例えば、試料中の元の核酸分子の配列に対応する開始（ｓｔａｒｔ）位置および／または末端（ｓｔｏｐ）位置、一方または両方の末端の配列リードのサブシーケンス、配列リードの長さ、および／または試料中の元の核酸分子の長さ）と組み合わせると、典型的には、固有の同一性を特定の分子に割り当てることが可能である。また、個別の配列リードの長さまたは塩基対の数は、必要に応じて、所与の分子の固有の同一性を割り当てるために使用される。本明細書中に記載されるように、それにより、固有の同一性を割り当てられた核酸の一本鎖由来の断片は、親鎖由来の断片、および／または相補鎖をその後に同定することできる場合がある。

いくつかの実施形態では、分子バーコードは、試料中の分子に対する識別子セット（例えば、固有のまたは非固有の分子バーコードの組み合わせ）の期待される比で導入される。形式の１つの例は、約２から約１，０００，０００個までの異なる分子バーコード、または約５から約１５０個までの異なる分子バーコード、または約２０から約５０個までの異なる分子バーコードを使用する。あるいは、約２５から約１，０００，０００個までの異なる分子バーコードが使用され得る。分子バーコードを、標的分子の両端にライゲートすることができる。例えば、２０～５０×２０～５０個の分子バーコードを使用することができる。いくつかの実施形態では、２０～５０個の異なる分子バーコードを使用することができる。いくつかの実施形態では、５～１００個の異なる分子バーコードを使用することができ、いくつかの実施形態では、５～１５０個の分子バーコードを使用することができる。いくつかの実施形態では、５～２００個の異なる分子バーコードを使用することができる。かかる識別子のメンバーは、典型的には、同一の開始点および終結点を有する異なる分子が識別子の異なる組み合わせを受け取る確率を高くする（例えば、少なくとも９４％、９９．５％、９９．９９％、または９９．９９９％）ために十分である。いくつかの実施形態では、約８０％、約９０％、約９５％、または約９９％の分子が分子バーコードの同一の組み合わせを有する。

いくつかの実施形態では、反応中の固有のまたは非固有の分子バーコードの割り当ては、例えば、米国特許出願第２００１００５３５１９号、同第２００３０１５２４９０号、および同第２０１１０１６００７８号、ならびに米国特許第６，５８２，９０８号、同第７，５３７，８９８号、同第９，５９８，７３１号、および同第９，９０２，９９２号（その各々全体が、本明細書中で参考として援用される）に記載の方法およびシステムを使用して行われる。あるいは、いくつかの実施形態では、試料の異なる核酸分子は、内因性配列情報（例えば、開始および／または終結位置、配列の一方または両方の末端のサブシーケンス、および／または長さ）のみを使用して同定され得る。

したがって、また、本開示は、本明細書中に記載の方法によって産生された、修復およびタグ化されたＤＮＡ断片の組成物を提供する。ポリヌクレオチドは、断片化されたＤＮＡ（例えば、ｃｆＤＮＡ）を含むことができる。ゲノム内のマッピング可能な塩基の位置にマッピングされる組成物中のポリヌクレオチドセットを、非固有にタグ化することができ、すなわち、異なる識別子の数は、少なくとも少なくとも２個かつマッピング可能な塩基の位置にマッピングされるポリヌクレオチド数未満であり得る。約１０ｎｇ～約１０μｇの間（例えば、約１０ｎｇ～１μｇ、約１０ｎｇ～１００ｎｇ、約１００ｎｇ～１０μｇ、約１００ｎｇ～１μｇ、約１μｇ～１０μｇのうちのいずれか）の組成物は、２、５、１０、５０、または１００個のうちのいずれかから１００、１０００、１０，０００、または１００，０００のうちのいずれかまでの異なる識別子を保有することができる。例えば、５個と１００個との間または１００個と４０００個との間の異なる識別子を使用して、かかる組成物中のポリヌクレオチドをタグ化することができる。

異なる分子が同一の座標（この場合、同一の開始／終結位置を有する）にマッピングされ、かつ異なるタグよりもむしろ同一のタグを保有する事象は、「分子衝突」と呼ばれる。ある特定の例では、実際の分子衝突数は、上記のように計算された理論上の衝突数より大きい場合がある。これは、座標全体の分子の不均一な分布、バーコード間のライゲーション効率の相違、および他の要因と相関し得る。この場合、経験的な方法を使用して、理論上の衝突数に近づくのに必要なバーコード数を決定することができる。１つの実施形態では、配列決定された分子の長さの分布および配列の均一性に基づいて所与の半数体ゲノム等価物のバーコード衝突を減少させるために必要なバーコード数を決定する方法を本明細書中に提供する。方法は、複数の核酸分子プールを作出する工程；各プールを漸増数のバーコードでタグ化する工程；およびバーコード衝突数を理論上のレベルに減少させる最適なバーコード数（例えば、プール効率およびライゲーション効率の相違に起因する有効バーコード濃度の相違に起因し得る）を決定する工程を含む。

１つの実施形態では、ある領域にマッピングされるポリヌクレオチドを実質的に固有にタグ化するのに必要な識別子数を、経験的に決定することができる。例えば、選択した数の異なる識別子を、試料中の分子に付着させることができ、分子を前記領域にマッピングするための異なる識別子の数を計数することができる。使用される識別子数が不十分である場合、前記領域にマッピングされるいくつかのポリヌクレオチドは同一の識別子を保有するであろう。その場合、計数される識別子数は、サンプル中の元の分子の数未満であろう。新規の元の分子を示すさらなる識別子が検出されなくなるまで、異なる識別子の使用数を試料型に対して反復的に増加させることができる。例えば、第１の反復では、５個の異なる識別子が計数され得るが、これは少なくとも５個の異なる元の分子を示す。第２の反復では、より多くのバーコードを使用して、７個の異なる識別子が計数され、これは少なくとも７個の異なる元の分子を示す。第３の反復では、より多くのバーコードを使用して、１０個の異なる識別子が計数され、これは少なくとも１０個の異なる元の分子を示す。第４の反復では、より多くのバーコードを使用して、１０個の異なる識別子が再度計数される。この時点で、より多くのバーコードを付加しても、元の分子の検出数を増加しない可能性が高い。

８．富化
いくつかの実施形態では、ＤＮＡ断片を含む試料を、目的の断片について富化する。例えば、部分的に二本鎖のＤＮＡ断片の鎖の５’末端への伸長されたプライマーのライゲーション後、またはかかるライゲーションおよびアダプターの付着（ライゲーションの一部としてか、その後の工程のいずれかにおいて）に続く増幅工程後に富化が行われ得る。富化は、目的の断片の他の断片に対する相対存在量が増加する任意の手技を指し、試料中の目的の断片が優先的に保持される一方で他の断片が除去される手技が含まれる。富化は、例えば、目的の標的に特異的な標的ハイブリッド形成配列を有する捕捉プローブセットを使用した捕捉工程であり得る。目的の標的は、単一のヌクレオチドバリアント、コピー数可変領域、融合物、およびインデルのうちの１つまたは複数または全てを含むことができる。いくつかの実施形態では、単一のヌクレオチドバリアント、コピー数可変領域、融合物、およびインデルのうちの１つまたは複数または全ては、疾患または障害（例えば、本明細書中の他所で考察した任意の癌などの癌）に関連する。

上記で考察されるように、試料中の核酸を、標的配列を有する分子を次の分析のために捕捉する捕捉工程に供することができる。標的捕捉は、捕捉部分（ビオチンまたは下記の他の例など）で標識されたオリゴヌクレオチドベイトを含むベイトセットの使用を含むことができる。プローブは、遺伝子などの領域の一団にわたって探索するように選択された配列を有することができる。いくつかの実施形態では、本明細書中の他所で考察されるように、ベイトセットは、標的領域セットの捕捉収率（それぞれ配列可変標的領域セットおよび後成的標的領域セットの捕捉収率など）を上下させることができる。かかるベイトセットを、標的分子がベイトとハイブリッド形成することが可能な条件下で試料と組み合わせる。次いで、捕捉された分子を、捕捉部分を使用して単離する。例えば、ビオチン捕捉部分は、ビーズベースのストレプトアビジンである。かかる方法は、例えば、２０１７年１２月２６日発行の米国特許第９，８５０，５２３号（本明細書中で参考として援用される）にさらに記載されている。

捕捉部分には、制限されないが、ビオチン、アビジン、ストレプトアビジン、特定のヌクレオチド配列を含む核酸、抗体によって認識されるハプテン、および磁性粒子が含まれる。抽出部分は、ビオチン／ストレプトアビジンまたはハプテン／抗体などの結合対のメンバーであり得る。いくつかの実施形態では、分析物に付着された捕捉部分は、単離可能な部分（磁性粒子または遠心分離によって沈殿することができる巨大粒子など）に付着されたその結合対によって捕捉される。捕捉部分は、捕捉部分を欠く核酸からの捕捉部分を保有する核酸の親和性分離が可能な任意のタイプの分子であり得る。例示的な捕捉部分は、固相に連結されたか連結可能なストレプトアビジンへの結合によって親和性分離が可能なビオチン、または固相に連結されたか連結可能な相補的オリゴヌクレオチドへの結合によって親和性分離が可能なオリゴヌクレオチドである。
９．配列決定のための試料を調製するための例示的なワークフロー

いくつかの実施形態では、本明細書中に記載の方法は、上記実施形態のうちのいずれかに従って修復されたＤＮＡ断片を産生する工程を含み、アダプターは、ライゲーション工程またはその後の工程によって組み込まれる。アダプターは、プライマー結合部位および必要に応じてバーコードを含む。アダプターを含む修復されたＤＮＡ断片を、増幅反応に供する。本明細書中に記載のように、増幅反応後に富化工程が続き得る。富化工程後に、必要に応じてさらなる増幅工程が続き得る。いくつかの実施形態では、さらなるタグ（例えば、試料インデックス）を増幅反応またはさらなる増幅工程中に添加する。これらのワークフローは、修復された断片中にバーコードおよび試料インデックスの一方または両方を含めること、また、修復された断片を目的の断片について富化することによって、配列決定のための試料を調製することができる。
１０．配列決定

いくつかの実施形態では、本明細書中に記載の方法は、修復されたＤＮＡ断片を配列決定する工程をさらに含む。さらなる実施形態では、配列決定は、部分的に二本鎖のＤＮＡ断片中に３’オーバーハングを形成したヌクレオチドを配列決定する。

事前に増幅されているか、増幅されていないアダプターに隣接する修復されたＤＮＡ断片を、配列決定に供することができる。配列決定方法には、例えば、Ｓａｎｇｅｒ配列決定、ハイスループット配列決定、ピロシーケンシング、合成時配列決定、単一分子配列決定、ナノポア配列決定、半導体配列決定、ライゲーション時配列決定、ハイブリッド形成時配列決定、ＲＮＡ－Ｓｅｑ（Ｉｌｌｕｍｉｎａ）、デジタル遺伝子発現（Ｈｅｌｉｃｏｓ）、次世代配列決定、合成による単一分子配列決定（ＳＭＳＳ）（Ｈｅｌｉｃｏｓ）、超並列配列決定、クローン単一分子アレイ（Ｓｏｌｅｘａ）、ショットガン配列決定、ＩｏｎＴｏｒｒｅｎｔ、ＯｘｆｏｒｄＮａｎｏｐｏｒｅ、ＲｏｃｈｅＧｅｎｉａ、Ｍａｘｉｍ－Ｇｉｌｂｅｒｔ配列決定、プライマーウォーキング、ＰａｃＢｉｏ、ＳＯＬｉＤ、ＩｏｎＴｏｒｒｅｎｔ、またはＮａｎｏｐｏｒｅの各プラットフォームを使用した配列決定が含まれる。複数のレーン、複数のチャネル、複数のウェル、または複数の試料セットを実質的に同時にプロセシングする他の手段を含み得る種々の試料プロセシングユニット中で配列決定反応を行うことができる。試料プロセシングユニットは、複数のプロセシングを同時に運転することができるように複数の試料チャンバーも含むことができる。いくつかの実施形態では、複数の修復されたＤＮＡ断片が生成され、修復されたＤＮＡ断片の少なくとも一部がタグを含み、配列決定が複数の修復されたＤＮＡ断片から複数の配列リードを生成する。いくつかの実施形態では、配列リードは、部分的に二本鎖のＤＮＡ断片中に３’オーバーハングを形成したヌクレオチドの配列およびタグの配列を含む。

配列決定反応を、癌または他の疾患のマーカーを含むことが公知の１または複数の断片型に対して行うことができる。また、配列決定反応を、試料中に存在する任意の核酸断片に対して行うことができる。配列反応は、少なくとも５％、１０％、１５％、２０％、２５％、３０％、４０％、５０％、６０％、７０％、８０％、９０％、９５％、９９％、９９．９％、または１００％のゲノムの配列包括度を提供し得る。他の場合、ゲノムの配列包括度は、５％、１０％、１５％、２０％、２５％、３０％、４０％、５０％、６０％、７０％、８０％、９０％、９５％、９９％、９９．９％、または１００％未満であり得る。

同時配列決定反応は、多重配列決定を使用して行われ得る。一部の場合では、無細胞核酸は、少なくとも１０００、２０００、３０００、４０００、５０００、６０００、７０００、８０００、９０００、１００００、５００００、１００，０００の配列決定反応を用いて配列決定され得る。他の場合では、無細胞ポリヌクレオチドは、１０００、２０００、３０００、４０００、５０００、６０００、７０００、８０００、９０００、１００００、５００００、１００，０００未満の配列決定反応を用いて配列決定され得る。配列決定反応は、連続的または同時に行われ得る。その後に、配列決定反応の全部または一部に対してデータ解析が行われ得る。一部の場合では、データ解析は、少なくとも１０００、２０００、３０００、４０００、５０００、６０００、７０００、８０００、９０００、１００００、５００００、１００，０００の配列決定反応に対して行われ得る。他の場合では、データ解析は、１０００、２０００、３０００、４０００、５０００、６０００、７０００、８０００、９０００、１００００、５００００、１００，０００未満の配列決定反応に対して行われ得る。

配列決定方法は、超並列配列決定（すなわち、少なくとも１００、１０００、１０，０００、１００，０００、１００万、１０００万、１億、または１０億の核酸分子のうちのいずれかを同時に（または立て続けに）配列決定する）であり得る。
１１．解析

本発明の方法を使用して、被験体における容態（特に、癌）の存在または非存在を診断するか、容態を特徴づけるか（例えば、癌の病期分類または癌の不均一性の決定）、容態の処置に対する応答をモニタリングするか、被験体における容態の再発リスクを決定することができる。

本発明の方法を使用して、種々の癌を検出することができる。ほとんどの細胞がそうであるように、癌細胞を、代謝回転（旧細胞が死滅して新規の細胞に置換されること）の速度によって特徴づけることができる。一般に、所与の被験体中の脈管構造に接触している死細胞は、ＤＮＡまたはＤＮＡ断片を血流に放出し得る。これは、種々の病期の癌細胞にも当てはまる。また、癌細胞は、病期に応じて、コピー数変動および稀な変異などの種々の遺伝子異常を特徴とし得る。この現象は、本明細書中に記載の方法およびシステムを使用した個体における癌の存在または非存在を検出するために使用され得る。

検出され得る癌の型および数には、血液癌、脳癌、肺癌、皮膚癌、鼻の癌、咽頭癌、肝臓癌、骨の癌、リンパ腫、膵臓癌、皮膚癌、腸癌、直腸癌、甲状腺癌、膀胱癌、腎臓癌、口腔癌、胃癌、固形状態の癌、混合腫瘍、および均一腫瘍などが含まれ得る。

癌を、遺伝的変動（変異、稀な変異、インデル、コピー数変動、トランスバージョン、転座、反転、欠失、異数性、部分異数性、倍数性、染色体不安定性、染色体構造の変化、遺伝子融合、染色体融合、遺伝子短縮、遺伝子増幅、遺伝子重複、染色体損傷、ＤＮＡ損傷、核酸化学修飾の異常な変化、後成的パターンの異常な変化、感染症および癌による核酸メチル化の異常な変化が含まれる）から検出することができる。

また、遺伝子データを、特異的な癌形態の特徴づけのために使用することができる。癌は、しばしば、組成および病期分類の両方において不均一である。遺伝子プロフィールデータは、癌の特異的サブタイプの診断または処置において重要であり得る癌の特異的サブタイプの特徴づけが可能であり得る。また、この情報は、被験体または医師が特異的な癌型の予後予測に関する手がかりを得ることが可能であり、被験体または医師が診断の進行に合わせて治療の選択肢を採用することが可能である。いくつかの癌は、進行し、より侵襲性が高くなり、遺伝的に不安定になる。他の癌は、良性、非活動性、または休眠状態を維持し得る。本開示のシステムおよび方法は、疾患進行の判定において有用であり得る。

また、本解析は、特定の処置選択の有効性の判定において有用である。処置が成功すると、より多くの癌が死滅し、ＤＮＡが流出し得るので、処置をうまく選択すると、被験体の血液中のコピー数変動または稀な変異の検出量を増加させることができる。他の例では、これは起こらないかもしれない。別の例では、おそらくある特定の処置の選択肢は、経時的な癌の遺伝子プロフィールと相関し得る。この相関は、治療の選択において有用であり得る。さらに、処置後に癌の寛解が認められる場合、本発明の方法を使用して、残存疾患または疾患の再発をモニタリングすることができる。

また、本発明の方法を、癌以外の容態における遺伝的変動を検出するために使用することができる。Ｂ細胞などの免疫細胞は、ある特定の疾患の存在時にクローンが急速に増殖し得る。コピー数変動の検出を用いてクローン増殖をモニタリングすることができ、ある特定の免疫状態をモニタリングすることができる。この例では、コピー数変動の解析を経時的に行って、特定の疾患の進行状態のプロフィールを得ることができる。コピー数変動またはさらに稀な変異の検出を使用して、感染中にどのように病原体集団が変化しているのかを判定することができる。これは、ウイルスが感染中に生活環の状態を変化させ、そして／またはより毒性の高い形態に変異し得る慢性感染（ＨＩＶ／ＡＩＤＳまたは肝炎など）中で特に重要であり得る。本発明の方法を使用して、宿主の身体の拒絶活動を判定またはプロファイリングすることができ、免疫細胞が移植された組織の破壊を試みている場合に移植された組織の状態をモニタリングすることができ、拒絶の処置または予防方針を変更することもできる。

さらに、本開示の方法を使用して、被験体における異常な容態の不均一性を特徴づけることができ、前記方法は、被験体における細胞外ポリヌクレオチドの遺伝子プロフィールを作成する工程を含み、前記遺伝子プロフィールは、コピー数変動および稀な変異の解析による複数のデータを含む。癌が含まれるがこれに限定されない一部の場合では、疾患は不均一であり得る。疾患細胞は、同一でない場合がある。癌の例では、いくつかの腫瘍は、異なる型の腫瘍細胞を含むことが公知であり、いくつかの細胞は、癌の病期が異なる。他の例では、不均一性は、複数の病巣を含み得る。さらに、癌の例では、複数の腫瘍病巣が存在する場合があり、おそらく、１または複数の病巣は、原発性部位から拡大した転移の結果である。

本発明の方法を使用して、不均一性疾患における異なる細胞由来の遺伝情報が加算されたフィンガープリントまたはデータセットを作成するかプロファイリングすることができる。このデータセットは、コピー数変動および稀な変異の解析を単独または組み合わせて含み得る。

本方法を使用して、胎児起源の癌または他の疾患を診断、予後予測、モニタリング、または観察することができる。すなわち、これらの方法論は、ＤＮＡおよび他の核酸が母親の分子と同時循環し得る出産前の被験体における癌または他の疾患を診断、予後予測、モニタリング、または観察するために妊娠中の被験体で使用され得る。

別段の具体的な指示がない限り、本発明の任意の特徴、工程、要素、実施形態、または態様を、任意の他のものと組み合わせて使用することができる。本発明は、明確にする目的および理解させる目的で例証および例示としていくらか詳細に記載されてきたが、添付の特許請求の範囲の範囲内である特定の変更および改変が行われ得ることが明らかであろう。

Claims

部分的に二本鎖のＤＮＡ断片を修復する方法であって、
（ａ）前記部分的に二本鎖のＤＮＡ断片をプライマー集団の１または複数のプライマーと接触させる工程であって、ここで、前記部分的に二本鎖のＤＮＡ断片が３’オーバーハングを含み、前記プライマー集団がランダム標的ハイブリッド形成配列を含む、工程；
（ｂ）ＤＮＡポリメラーゼを使用して前記ＤＮＡ断片に沿って前記プライマー集団の１または複数のプライマーを伸長させる工程であって、それにより、前記ＤＮＡ断片にアニーリングした１または複数の伸長したプライマーが産生される、工程；および
（ｃ）１または複数の伸長したプライマーの３’末端を、伸長したプライマーまたは部分的に二本鎖のＤＮＡ断片の鎖の５’末端にライゲートする工程であって、それにより、修復されたＤＮＡ断片が得られる、工程
を含む、方法。
前記ＤＮＡポリメラーゼが３’→５’エキソヌクレアーゼ活性を欠く、先行する請求項のいずれか１項に記載の方法。
前記ＤＮＡポリメラーゼが５’→３’エキソヌクレアーゼ活性を欠く、先行する請求項のいずれか１項に記載の方法。
前記ＤＮＡポリメラーゼが鎖置換活性を欠く、先行する請求項のいずれか１項に記載の方法。
前記ＤＮＡポリメラーゼがクレノウ断片である、先行する請求項のいずれか１項に記載の方法。
前記ＤＮＡポリメラーゼがエキソ－クレノウ断片である、直前の請求項に記載の方法。
前記部分的に二本鎖のＤＮＡ断片が、各末端に３’オーバーハングを有する、先行する請求項のいずれか１項に記載の方法。
前記部分的に二本鎖のＤＮＡ断片が、３’オーバーハングおよび（ｉ）平滑末端または（ｉｉ）５’オーバーハングを有する、先行する請求項のいずれか１項に記載の方法。
前記５’オーバーハングが、前記５’オーバーハングに沿って前記３’末端を伸長させることによって修復される、直前の請求項に記載の方法。
前記部分的に二本鎖のＤＮＡ断片が、体液試料に由来する、先行する請求項のいずれか１項に記載の方法。
前記体液が、全血、血清、血漿、または尿である、直前の請求項に記載の方法。
前記部分的に二本鎖のＤＮＡ断片がｃｆＤＮＡ断片である、先行する請求項のいずれか１項に記載の方法。
前記部分的に二本鎖のＤＮＡ断片が哺乳動物由来である、先行する請求項のいずれか１項に記載の方法。
前記部分的に二本鎖のＤＮＡ断片がヒト由来である、先行する請求項のいずれか１項に記載の方法。
前記部分的に二本鎖のＤＮＡ断片が、組成物中のＤＮＡ断片集団の一部である、先行する請求項のいずれか１項に記載の方法。
前記ＤＮＡ断片集団が剪断されたＤＮＡを含む、直前の請求項に記載の方法。
前記ＤＮＡ断片集団が、後成的に改変されたＤＮＡを含む、請求項１５または１６に記載の方法。
前記ＤＮＡ断片集団が、複数のゲノム遺伝子座由来の断片を含む、請求項１５～１７のいずれか１項に記載の方法。
前記ＤＮＡ断片集団が富化されていない、請求項１５～１８のいずれか１項に記載の方法。
前記ＤＮＡ断片集団が増幅されていない、請求項１５～１９のいずれか１項に記載の方法。
前記ランダム標的ハイブリッド形成配列の長さが、少なくとも４、５、６、７、８、９、または１０ヌクレオチドである、先行する請求項のいずれか１項に記載の方法。
前記ランダム標的ハイブリッド形成配列の長さが、約４、５、６、７、８、９、１０、１１、または１２ヌクレオチドである、先行する請求項のいずれか１項に記載の方法。
前記プライマー集団のプライマーが一本鎖である、先行する請求項のいずれか１項に記載の方法。
前記プライマー集団のプライマーが３’オーバーハングを有する二本鎖であり、前記ランダム標的ハイブリッド形成配列が前記３’オーバーハング中に存在する、請求項１～２０のいずれか１項に記載の方法。
前記プライマー集団のプライマーが３’オーバーハングを有するヘアピンであり、前記ランダム標的ハイブリッド形成配列が前記３’オーバーハング中に存在する、請求項１～２０のいずれか１項に記載の方法。
前記プライマーのヘアピンまたは二本鎖領域がアダプターを含む、請求項２１～２２のいずれか１項に記載の方法。
前記プライマーのヘアピンまたは二本鎖領域がタグを含む、請求項２１～２３のいずれか１項に記載の方法。
前記タグがバーコードを含む、請求項２４に記載の方法。
前記プライマー集団が、複数の異なるバーコードを含む、請求項２５に記載の方法。
少なくとも工程（ａ）～（ｃ）を単一の管内で行う、先行する請求項のいずれか１項に記載の方法。
前記二本鎖ＤＮＡ断片が組成物中に存在し、少なくとも工程（ａ）～（ｃ）について、構成要素が組成物から除去されない、先行する請求項のいずれか１項に記載の方法。
前記修復されたＤＮＡ断片が１つまたは２つの平滑末端を含むか、前記方法が、前記修復されたＤＮＡ断片の１つまたは２つの末端を平滑末端化する工程をさらに含む、先行する請求項のいずれか１項に記載の方法。
前記平滑末端化された核酸の３’末端にヌクレオチドを非テンプレート指向性に付加するポリメラーゼを使用して、修復されたＤＮＡ断片を末端テーリングする工程をさらに含み、必要に応じて、ＡがＧより優先され、ＧがＣまたはＴより優先されて付加される、直前の請求項に記載の方法。
前記修復されたＤＮＡ断片に（必要に応じて両端に）タグをライゲートする工程をさらに含み、必要に応じて、前記タグがバーコードおよび／またはアダプターを含む、先行する請求項のいずれか１項に記載の方法。
前記修復されたＤＮＡ断片を精製する工程をさらに含む、先行する請求項のいずれか１項に記載の方法。
工程（ｂ）および／または（ｃ）後に工程（ｂ）および／または（ｃ）で使用した１または複数の酵素を変性させる工程をさらに含む、先行する請求項のいずれか１項に記載の方法。
前記修復されたＤＮＡ断片を増幅する工程をさらに含む、先行する請求項のいずれか１項に記載の方法。
前記修復されたＤＮＡ断片が１または複数のアダプター（例えば、２つのアダプター）を含み、前記修復されたＤＮＡ断片を増幅する工程に前記１または複数のアタプターにアニーリングする１または複数の（例えば、２つの）増幅オリゴマーを使用する、直前の請求項に記載の方法。
前記修復されたＤＮＡ断片を目的の断片について富化する工程であって、それにより富化されたＤＮＡ断片が得られる、工程をさらに含み、必要に応じて、前記富化する工程を増幅する工程後に行う、先行する請求項のいずれか１項に記載の方法。
前記目的の断片が、疾患または障害に関連する様式によって変動する遺伝子座を含み、必要に応じて、前記疾患または障害が癌である、直前の請求項に記載の方法。
前記変動が、一ヌクレオチド変動、コピー数変動、遺伝子融合、またはインデルのうちの１つまたは複数である、直前の請求項に記載の方法。
前記目的の断片が、疾患または障害に関連する一ヌクレオチド変動；疾患または障害に関連するコピー数の変動；疾患または障害に関連する遺伝子融合；または疾患または障害に関連するインデルを示すフラグメントのうちの１つ、２つ，３つ，または４つを含み、必要に応じて、前記疾患または障害が癌である、直前の請求項に記載の方法。
前記富化されたＤＮＡ断片を増幅する工程をさらに含む、請求項３６～３９のいずれか１項に記載の方法。
前記修復されたＤＮＡ断片を配列決定する工程をさらに含む、先行する請求項のいずれか１項に記載の方法。
前記配列決定する工程が、部分的に二本鎖のＤＮＡ断片中に３’オーバーハングを形成したヌクレオチドを配列決定する、直前の請求項に記載の方法。
前記配列決定する工程がハイスループット配列決定である、請求項４１または４２に記載の方法。
複数の修復されたＤＮＡ断片が生成され、前記修復されたＤＮＡ断片の少なくとも一部がタグを含み、前記配列決定する工程が複数の修復されたＤＮＡ断片から複数の配列リードを生成する、請求項４４～４６のいずれか１項に記載の方法。
前記配列リードが、前記部分的に二本鎖のＤＮＡ断片中に３’オーバーハングを形成したヌクレオチドの配列およびタグの配列を含む、請求項４７に記載の方法。