JP7256748B2

JP7256748B2 - エラーが訂正された核酸配列決定への適用を伴う標的化核酸配列濃縮のための方法

Info

Publication number: JP7256748B2
Application number: JP2019552077A
Authority: JP
Inventors: スコットアールケネディ; ジェシージェイソーク; マイケルヒップ; エリザベスシュミット; ローザアナリスケス; ダニエラナシュマンソン
Original assignee: ユニヴァーシティオブワシントン
Priority date: 2017-03-23
Filing date: 2018-03-23
Publication date: 2023-04-12
Anticipated expiration: 2038-03-23
Also published as: US12006532B2; ES2929281T3; JP2023093499A; EP4450643A3; IL269431B2; AU2025203238A1; ES3002386T3; US20240401108A1; AU2018240559A1; CN110520542B; EP4134444A1; US11479807B2; IL269431A; CN110520542A; IL269431B1; AU2018240559B2; EP4450643A2; EP4134444B1; WO2018175997A1; US20200131561A1

Description

関連出願の相互参照
本出願は、２０１７年３月２３日に出願された米国仮特許出願第６２／４７５，６８２号、および２０１７年１０月２３日に出願された、米国仮特許出願第６２／５７５，９５８号の優先権を主張し、それらの開示は参照によりその全ての内容が本明細書に組み込まれる。

政府の利害に関する声明
本発明は、国立衛生研究所から授与された助成金番号Ｒ０１ＣＡ１６０６７４およびＲ０１ＣＡ１８１３０８、ならびに米国陸軍研究局から授与された助成金番号Ｗ９１１ＮＦ－１５－２－０１２７の下で政府支援を受けてなされた。政府は、本発明において一定の権利を有する。

特定のタイプの遺伝子分析、例えば法医学ＤＮＡ分析へのこれまでのアプローチは、ＰＣＲ増幅産物のキャピラリー電気泳動（ＣＥ）分離（ＰＣＲ－ＣＥ）に依存して、短いタンデムリピート配列の長さの多型を識別する。このタイプの分析は、１９９１年頃に導入されて以来、非常に価値があることが証明されている。それ以来、いくつかの出版物は標準化されたプロトコールを導入し、世界中の研究室での使用を検証し、多くの異なる人種でのその使用を詳述し、ｍｉｎｉＳＴＲなどのより効率的なアプローチを導入してきた。

このアプローチは非常に成功していることが証明されているが、この技術にはその有用性を制限する多くの欠点を有している。例えば、ＳＴＲ遺伝子型決定に対する現在のアプローチでは、テンプレートＤＮＡ上のポリメラーゼの滑りによって引き起こされるＰＣＲスタッターに起因するバックグラウンドシグナルをしばしば発生させ、最終的に完了した反応で異なる長さのＰＣＲ増幅産物の混合物をもたらす。この問題は、１つを超える寄与者による試料（例えば、異なるＳＴＲ長バリアントを持つ特定の遺伝子構成を含む異なる特定の個体に由来するＤＮＡの混合物）において、スタッター対立遺伝子と本物の対立遺伝子を区別する困難さのために、特に重要である。分解されたＤＮＡ試料を分析するときに別の問題が発生する。損傷したＤＮＡは、スタッターおよびＰＣＲエラーの程度を悪化させる可能性がある。断片の長さの変動により、しばしば、より長いＰＣＲ断片が大幅に少なくなるか、または存在しなくなることさえある。結果として、分解されたＤＮＡからのキャピラリー電気泳動図プロファイルは、しばしばより低い識別力を有する。

超並列配列決定（ＭＰＳ、しばしば次世代ＤＮＡ配列決定、ＮＧＳとしても知られる）システムの導入は、法医学分析におけるいくつかの困難な問題に対処する可能性がある。例えば、これらのプラットフォームは、識別力を劇的に増大させ、民族性および身体的属性（表現型）さえも決定する可能性を提供する、核およびミトコンドリアＤＮＡ（ｍｔＤＮＡ）のＳＴＲと一塩基多型（ＳＮＰ）の同時分析を可能にするこれまでに比類のない能力を提供する。さらに、単純に分子の集合集団の平均遺伝子型を報告するＰＣＲ－ＣＥとは異なり、ＭＰＳ技術は、多くの個々のＤＮＡ分子の完全なヌクレオチド配列をデジタルで集計し、異種ＤＮＡ混合物内のマイナー対立遺伝子頻度（ＭＡＦ）を検出する独自の能力を提供する。２人以上の寄与者を含む法医学試料は、法医学で最も問題のある問題のうちの１つとして残るため、法医学の分野に対するＭＰＳの影響は非常に大きくなり得る。

ヒトゲノムの発表は、ＭＰＳプラットフォームの計り知れない力を強調した。しかしながら、ごく最近まで、短いタンデムリピート（ＳＴＲ）座位よりも読取の長さが大幅に短く、長さに基づく遺伝子型決定をコールすることができないため、これらのプラットフォームの完全な力は法医学に限定されていた。当初、ＭＰＳＲｏｃｈｅ４５４プラットフォームなどのパイロシーケンサーは、コア標準ＳＴＲ座位を配列決定するのに十分な読取の長さを持つ唯一のプラットフォームであった。しかしながら、競合する技術の読取の長さが増加しているため、法医学用途に対する有用性が発揮されている。全体として、これらの全ての研究の全般的な結果は、プラットフォームに関係なく、ＳＴＲを正常に分類できるため、損傷した法医学試料からでもＣＥ分析に匹敵する遺伝子型を生成できることである。

多くの研究は、従来のＰＣＲ－ＣＥアプローチとの一致を示しており、ＳＴＲ内ＳＮＰ（一塩基多型）の検出などの追加の利点も示しているが、現在の技術に関する多くの問題もまた強調している。例えば、ＳＴＲ遺伝子型決定に対する現在のＭＰＳアプローチは、配列決定とＰＣＲプライマーの導入に十分なＤＮＡを提供するためのマルチプレックスＰＣＲに依存している。しかしながら、マルチプレックスＰＣＲキットはＰＣＲ－ＣＥ用に設計されているため、様々なサイズの増幅産物のためのプライマーが含まれている。この変動により、小さな断片が増幅されるバイアスを有して包含が不均衡になり、対立遺伝子が脱落する可能性がある。実際、最近の研究では、特に低ＭＡＦにおいて、ＰＣＲ効率の相違が混合物成分に影響を及ぼすことが示されている。

ＰＣＲ－ＣＥと同様に、ＭＰＳはＰＣＲスタッターの発生に影響されない。ＳＴＲに関するＭＰＳ研究の大部分は、人工的なドロップイン対立遺伝子の発生を報告している。最近、体系的なＭＰＳの研究は、多くのスタッター事象が、４塩基対単位の真の対立遺伝子と異なり、最も一般的にｎ－４であるが、ｎ－８およびｎ－１２の位置もまた観察される、より短い長さの多型として現れることを報告している。スタッターのパーセントは通常、読取の約１％で発生したが、一部の座位では３％に達する可能性があり、ＭＰＳがＰＣＲ－ＣＥよりも高い割合でスタッターを示す可能性があることを示している。

ＭＰＳ用途におけるＰＣＲに基づくエラーの影響を緩和するために、プロトコール開発、化学／生化学、およびデータ処理のレベルでの様々なアプローチが開発されている。さらに、個々のＤＮＡ断片から生じるＰＣＲの複製を、固有のランダムなせん断点に基づいて、または外因性のタグ付け（すなわち、分子タグ、固有の分子識別子［ＵＭＩ］および単一分子識別子［ＳＭＩ］としても知られる分子バーコードの使用）によって、増幅前または増幅中に、解明することのできる技術は、一般的に使用されている。このアプローチは、ＤＮＡおよびＲＮＡテンプレートの計数精度を改善するために使用されている。単一の開始分子に由来する全ての増幅産物を明示的に識別することができるため、同一のタグの付いた配列決定読取の配列の変動を使用して、ＰＣＲまたは配列決定中に生じる塩基のエラーを訂正できる。例えば、Ｋｉｎｄｅ，ｅｔａｌ．（ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ１０８，９５３０－９５３５，２０１１）は、一本鎖分子バーコード付けを使用して、バーコード配列決定を共有するＰＣＲコピーをグループ化し、コンセンサスを形成することにより、配列決定のエラー率を低減するＳａｆｅＳｅｑＳを導入した。このアプローチにより、点変異の平均検出限界は０．５％になるが、そのＳＴＲ座位に対する有効性は広く評価されていない。

最近報告された別のアプローチであるＭＩＰＳＴＲは、ＳＴＲ座位に隣接する配列に特異的にアニールする単一分子の分子反転プローブ（ｓｍＭＩＰ）によるＳＴＲ座位の標的化捕捉を使用する。ｓｍＭＩＰの３’末端のポリメラーゼ伸長後、末端をライゲートし、ＰＣＲ増幅および配列決定に供する。ＳＴＲ座位の隣接領域に特異的なＭＩＰを使用すると、標的特異性が大幅に向上し、ＳＴＲ座位の遺伝子型決定の精確さが向上する。しかしながら、Ｓａｆｅ－ＳｅｑＳと同様に、一本鎖分子バーコードを組み込んでも、「ジャックポット」事象として派生コピーに持ち込まれる増幅の最初の回で生じるＰＣＲアーティファクトを完全に排除することができない。

ＳＴＲ座位、一塩基多型（ＳＮＰ）座位、および他の多くの形態の変異および遺伝的バリアントのより精確な遺伝子型決定の方法は、法医学、医学、科学産業の様々な用途において望まれている。しかしながら、課題は、最大の信頼性を備えつつ、合理的な費用によって、可能な限り多くの関連する配列決定される遺伝物質のコピーから、配列情報を最も効率的に生成する方法である。様々なコンセンサス配列決定法（分子バーコードに基づくものとそうでないものの両方）がエラー訂正に使用され、混合物中のバリアントをより適切に識別できるようになった（詳細な議論についてはＪ．Ｓａｌｋｅｔａｌ，Ｅｎｈａｎｃｉｎｇｔｈｅａｃｃｕｒａｃｙｏｆｎｅｘｔ－ｇｅｎｅｒａｔｉｏｎｓｅｑｕｅｎｃｉｎｇｆｏｒｄｅｔｅｃｔｉｎｇｒａｒｅａｎｄｓｕｂｃｌｏｎａｌｍｕｔａｔｉｏｎｓ，ＮａｔｕｒｅＲｅｖｉｅｗｓＧｅｎｅｔｉｃｓ，２０１８を参照されたい）が、性能には様々なトレードオフがある。我々は以前に、エラー訂正を目的として、二本鎖核酸分子の独立した鎖の配列決定を遺伝子型決定および比較することに依存する超高精度配列決定法であるデュプレックス配列決定について記載した。本明細書で明確に述べられる技術は、コスト効率、回収効率、およびその他の性能基準を改善する方法と、デュプレックス配列決定および関連するＭＰＳ配列決定方法の全体的なプロセス速度について説明する。

本技術は、概して、標的化核酸配列濃縮のための方法、およびエラー訂正核酸配列決定用途のためのそのような濃縮の使用に関する。いくつかの実施形態では、二本鎖核酸複合体中の一意的に標識された鎖の組み合わせを使用して、各鎖がその相補鎖に情報的に関連するが、各鎖の配列決定に続いてそれが区別されるか、またはそれに由来する増幅産物から区別されるようにして、核酸材料の非常に精確な、エラーが訂正された超並列配列決定が可能であり、この情報は、決定された配列のエラー訂正の目的で使用することができる。本技術のいくつかの態様は、標的化超高精度配列決定のための、コスト、配列決定された分子の変換、および標識分子を生成する時間効率を改善するための方法および組成物を提供する。いくつかの実施形態では、提供される方法および組成物は、非常に少量の核酸材料（例えば、犯罪現場から採取された試料または血液中に自由に浮遊する小さな臨床試料またはＤＮＡからのもの）の精確な分析を可能にする。いくつかの実施形態では、提供される方法および組成物は、１００個の細胞または分子に１個未満の頻度（例えば、１０００個の細胞または分子に１個未満、１万個の細胞または分子に１個未満、１０万個の細胞または分子に１個未満）で存在する核酸材料の試料における変異の検出を可能にする。

いくつかの実施形態では、本開示は、二本鎖核酸材料を提供するステップであって、核酸材料が、核酸材料の各々の鎖上の単一分子の識別子配列および核酸材料の各々の鎖の５’末端および３’末端のうちの少なくとも１つ上のアダプター配列を含み、第１のアダプター配列が核酸材料の第１の鎖の５’末端または３’末端のうちの１つ上に位置し、第２のアダプター配列が核酸材料の第２の鎖の反対側の末端上に位置し、第１の鎖と第２の鎖が、同一の二本鎖核酸材料を起源とする、提供するステップと、核酸材料を増幅するステップと、増幅した核酸材料を第１の試料と第２の試料とに分離するステップと、第１のアダプター配列に特異的なプライマーの使用を通じて第１の試料中の第１の鎖を増幅して第１の核酸産物をもたらすステップと、第２のアダプター配列に特異的なプライマーの使用を通じて第２の試料中の第２の鎖を増幅して第２の核酸産物をもたらすステップと、第１の核酸産物および第２核酸産物の各々を配列決定するステップと、第１の核酸産物の配列を第２の核酸産物の配列と比較するステップと、を含む方法を提供する。いくつかの実施形態では、核酸材料は、核酸材料の各々の鎖の５’末端および３’末端の各々にアダプター配列を含む。

いくつかの実施形態では、本開示は、１つ以上の二本鎖核酸分子を含む二本鎖核酸材料を提供することであって、各々の二本鎖核酸分子が、各々の鎖上の単一分子識別子配列と核酸分子の５’末端および／または３’末端のうちの少なくとも１つの上のアダプターとを含み、各々の核酸分子に対して、第１のアダプター配列が核酸分子の第１の鎖と関連し、第２のアダプター配列が核酸分子の第２の鎖と関連する、提供するステップと、核酸材料を増幅するステップと、増幅した核酸材料を第１の試料と第２の試料とに分離するステップと、第１のアダプター配列に特異的なプライマーの使用を通じて第１の試料中の第１の鎖を増幅して第１の核酸産物をもたらすステップと、第２のアダプター配列に特異的なプライマーの使用を通じて第２の試料中の第２の鎖を増幅して第２の核酸産物をもたらすステップと、第１の核酸産物および第２核酸産物の各々を配列決定するステップと、第１の核酸産物の配列を第２の核酸産物の配列と比較するステップと、を含む方法を提供する。いくつかの実施形態では、核酸材料は、核酸材料の各々の鎖の５’末端および３’末端の各々にアダプター配列を含む。

いくつかの実施形態では、本開示はまた、二本鎖核酸材料を提供するステップであって、核酸材料が、標的化エンドヌクレアーゼ（例えば、ＣＲＩＳＰＲ関連（Ｃａｓ）酵素／ガイドＲＮＡ複合体、例えば、Ｃａｓ９またはＣｐｆ１、メガヌクレアーゼ、転写活性化因子様エフェクターベースヌクレアーゼ（ＴＡＬＥＮ）、ジンクフィンガーヌクレアーゼ、アルゴノートヌクレアーゼ）による切断の結果として実質的に同様の長さ（約１～１，０００，０００塩基、約１０～１，０００塩基、または約１００～５００塩基の核酸材料の鎖をもたらすように切断されており、核酸材料が、核酸材料の各々の鎖上の単一分子の識別子配列および核酸材料の各々の鎖の５’末端および３’末端のうちの少なくとも１つ上のアダプター配列を含み、第１のアダプター配列が核酸材料の第１の鎖の５’末端または３’末端の１つ上に位置し、第２のアダプター配列が核酸材料の第２の鎖の反対側の末端上に位置し、第１の鎖と第２の鎖が、同一の二本鎖核酸材料を起源とする、提供するステップと、核酸材料を増幅するステップと、増幅した核酸材料を第１の試料と第２の試料とに分離するステップと、第１のアダプター配列に特異的なプライマーの使用を通じて第１の試料中の第１の鎖を増幅して第１の核酸産物をもたらすステップと、第２のアダプター配列に特異的なプライマーの使用を通じて第２の試料中の第２の鎖を増幅して第２の核酸産物をもたらすステップと、第１の核酸産物および第２核酸産物の各々を配列決定するステップと、第１の核酸産物の配列を第２の核酸産物の配列と比較するステップと、を含む方法を提供する。いくつかの実施形態では、核酸材料は、核酸材料の各々の鎖の５’末端および３’末端の各々にアダプター配列を含む。

いくつかの実施形態では、第１の核酸産物と第２の核酸産物の各々を配列決定することは、第１の鎖の配列読取を決定するために、第１の鎖のうちの少なくとも１つを配列決定するステップと、第２の鎖の配列読取を決定するための第２の鎖のうちの少なくとも１つを配列決定するステップと、第１の鎖の配列読取と第２の鎖の配列読取とを比較して、エラーが訂正された配列読取を生成するステップと、を含む。いくつかの実施形態では、エラーが訂正された配列読取は、第１の鎖の配列読取と第２の鎖の配列読取との間で一致するヌクレオチド塩基を含む。いくつかの実施形態では、エラーが訂正された配列読取の特定の位置で生じる変動が真のバリアントとして同定される。いくつかの実施形態では、第１の鎖の配列読取または第２の鎖の配列読取の一方のみの特定の位置で生じる変動が潜在的なアーティファクトとして同定される。

いくつかの実施形態では、エラーが訂正された配列読取が、二本鎖標的核酸分子が由来する生物または対象における、がん、がんリスク、がん変異、がんの代謝状態、ミューテーターの表現型、発がん物質への暴露、毒素暴露、慢性炎症暴露、年齢、神経変性疾患、病原体、薬剤耐性バリアント、胎児分子、法医学に関連する分子、免疫学的に関連する分子、変異したＴ細胞受容体、変異したＢ細胞受容体、変異した免疫グロブリン遺伝子座、ゲノムのカタエギス部位、ゲノムの超変異部位、低頻度バリアント、サブクローンバリアント、少数の分子集団、混入源、核酸合成エラー、酵素修飾エラー、化学修飾エラー、遺伝子編集エラー、遺伝子治療エラー、核酸情報ストレージの断片、微生物の準種、ウイルスの準種、臓器移植、臓器移植拒絶、がん再発、治療後の残存がん、前がん状態、異形成状態、マイクロキメリズム状態、幹細胞移植状態、細胞療法状態、別の分子に付着した核酸標識、またはそれらの組み合わせを同定または特性評価するために使用される。いくつかの実施形態では、エラーが訂正された配列読取が、発がん性化合物または発がん物質への曝露を同定するために使用される。いくつかの実施形態では、エラーが訂正された配列読取が、変異原性化合物または変異原性への曝露を同定するために使用される。いくつかの実施形態では、核酸材料が法医学試料に由来し、エラーが訂正された配列読取が法医学分析で使用される。

いくつかの実施形態では、単一分子識別子配列が、内因性のせん断点またはせん断点に位置的に関連する可能性のある内因性の配列を含む。いくつかの実施形態では、単一分子識別子配列が、二本鎖核酸分子を一意的に標識する、縮重もしくは半縮重バーコード配列、核酸材料の１つ以上の核酸断片末端、またはそれらの組み合わせのうちの少なくとも１つである。いくつかの実施形態では、アダプターおよび／またはアダプター配列が、少なくとも部分的に非相補的であるか、または少なくとも１つの非標準塩基を含む少なくとも１つのヌクレオチド位置を含む。いくつかの実施形態では、アダプターが、約５個以上の自己相補型ヌクレオチドによって形成される単一の「Ｕ字型」オリゴヌクレオチド配列を含む。

様々な実施形態に従って、様々な核酸材料のうちのいずれかが使用され得る。いくつかの実施形態では、核酸材料は、標準的な糖リン酸骨格内のポリヌクレオチドに対する少なくとも１つの修飾を含んでもよい。いくつかの実施形態では、核酸材料は、核酸材料のいずれかの塩基内に少なくとも１つの修飾を含んでもよい。例えば、非限定的な例として、いくつかの実施形態では、核酸材料は、二本鎖ＤＮＡ、二本鎖ＲＮＡ、ペプチド核酸（ＰＮＡ）、ロックド核酸（ＬＮＡ）のうちの少なくとも１つであるか、またはそれを含む。

いくつかの実施形態では、提供するステップは、二本鎖核酸材料を少なくとも１つの二本鎖縮重バーコード配列にライゲートして、二本鎖核酸分子バーコード複合体を形成し、二本鎖縮重バーコード配列が、各々の鎖中に単一分子識別子配列を含む。

いくつかの実施形態では、第１の試料中の核酸材料を増幅することは、第１の鎖の第１のアダプター配列に特異的なプライマーと第１の鎖の非アダプター部分に特異的な第２のプライマーとの使用を通じて第１の試料中の第１の鎖を増幅して、第１の核酸産物をもたらすことを含む。いくつかの実施形態では、第２の鎖の第２のアダプター配列に特異的なプライマーと第２の鎖の非アダプター部分に特異的な第２のプライマーとの使用を通じて第２の試料中の第２の鎖を増幅して、第２の核酸産物をもたらす。

いくつかの実施形態では、第１の試料中の核酸材料を増幅することは、第１のアダプター配列中に存在する配列に少なくとも部分的に相補的である少なくとも１つの一本鎖オリゴヌクレオチドと目的の標的配列に少なくとも部分的に相補的である少なくとも１つの一本鎖オリゴヌクレオチドとを使用して、単一分子識別子配列が少なくとも部分的に維持されるように、元の二本鎖核酸分子からの単一の核酸鎖に由来する核酸材料を増幅することを含む。

いくつかの実施形態では、第２のアダプター配列中に存在する配列に少なくとも部分的に相補的である少なくとも１つの一本鎖オリゴヌクレオチドと目的の標的配列に少なくとも部分的に相補的である少なくとも１つの一本鎖オリゴヌクレオチドとを使用して、単一分子識別子配列が少なくとも部分的に維持されるように、元の二本鎖核酸分子からの単一の核酸鎖に由来する核酸材料を増幅することを含む。

いくつかの実施形態では、核酸材料を増幅することが、第１の鎖に由来する複数の増幅産物と、第２の鎖に由来する複数の増幅産物とを生成することを含む。

いくつかの実施形態では、提供される方法は、提供するステップの前に、実質的に既知の長さの標的核酸断片が形成されるように、１つ以上の標的化エンドヌクレアーゼにより核酸材料を切断するステップと、実質的に既知の長さに基づいて、標的核酸断片を単離するステップと、をさらに含む。いくつかの実施形態では、提供される方法は、提供するステップの前に、アダプター（例えば、アダプター配列）を標的核酸（例えば、標的核酸断片）にライゲートすることをさらに含む。

いくつかの実施形態では、核酸材料は１つ以上の標的核酸断片であり得るか、またはそれを含み得る。いくつかの実施形態では、１つ以上の標的核酸断片がそれぞれ、ゲノム中の１つ以上の位置からの目的のゲノム配列を含むいくつかの実施形態では、１つ以上の標的核酸断片が、核酸材料内の実質的に既知の領域からの標的配列を含むいくつかの実施形態では、実質的に既知の長さに基づいて標的核酸断片を単離することが、ゲル電気泳動、ゲル精製、液体クロマトグラフィー、サイズ排除精製、濾過、またはＳＰＲＩビーズ精製による標的核酸断片の濃縮を含む。

様々な実施形態によれば、提供されるいくつかの方法は、核酸材料の任意の様々な最適以下の（例えば、損傷または分解）試料の配列決定に有用であり得る。例えば、いくつかの実施形態では、核酸材料の少なくとも一部が損傷している。いくつかの実施形態では、損傷が、酸化、アルキル化、脱アミノ化、メチル化、加水分解、ヒドロキシル化、ニッキング、鎖内架橋、鎖間架橋、平滑末端鎖切断、付着末端二重鎖切断、リン酸化、脱リン酸化、ＳＵＭＯ化、グリコシル化、脱グリコシル化、プトレシニル化、カルボキシル化、ハロゲン化、ホルミル化、一本鎖ギャップ、熱による損傷、乾燥による損傷、紫外線暴露による損傷、ガンマ線による損傷、Ｘ線による損傷、電離放射線による損傷、非電離放射線による損傷、重粒子線による損傷、核崩壊による損傷、ベータ線による損傷、アルファ線による損傷、中性子線による損傷、陽子線による損傷、宇宙線による損傷、高ｐＨによる損傷、低ｐＨによる損傷、反応性酸化種による損傷、フリーラジカルによる損傷、過酸化物による損傷、次亜塩素酸塩による損傷、ホルマリンまたはホルムアルデヒドなどの組織固定による損傷、反応性鉄による損傷、低イオン状態による損傷、高イオン状態による損傷、緩衝されていない状態による損傷、ヌクレアーゼによる損傷、環境暴露による損傷、火災による損傷、機械的ストレスによる損傷、酵素分解による損傷、微生物による損傷、分取機械的せん断による損傷、分取酵素による断片化による損傷、生体内で自然に生じた損傷、核酸抽出中に生じた損傷、配列決定ライブラリーの調製中に生じた損傷、ポリメラーゼによって導入された損傷、核酸の修復中に導入された損傷、核酸の末端処理中に生じた損傷、核酸ライゲーション中に生じた損傷、配列決定中に生じた損傷、ＤＮＡの機械的取り扱いにより生じた損傷、ナノポアを通過する際に生じた損傷、生物の老化の一部として生じた損傷、個体の化学物質への暴露の結果として生じた損傷、変異原性物質により生じた損傷、発がん性物質により生じた損傷、染色体異常誘発物質により生じた損傷、酸素暴露による生体内炎症損傷により生じた損傷、１つ以上の鎖切断による損傷、およびそれらの組み合わせのうちの少なくとも１つであるか、またはそれを含む。

核酸材料は、様々な供給源に由来し得ると考えられる。例えば、いくつかの実施形態では、核酸材料（例えば、１つ以上の二本鎖核酸分子を含む）は、ヒト対象、動物、植物、菌類、ウイルス、細菌、原生動物、または任意の他の生命体の試料から提供される。他の実施形態では、試料は、少なくとも部分的に人工的に合成された核酸材料を含む。いくつかの実施形態では、試料が、体組織、生検、皮膚試料、血液、血清、血漿、汗、唾液、脳脊髄液、粘液、子宮洗浄液、膣スワブ、パップスメア、鼻腔スワブ、口腔スワブ、組織擦過検体、髪の毛、指紋、尿、便、硝子体液、腹膜洗浄液、唾液、気管支洗浄液、口腔洗浄液、胸膜洗浄液、胃洗浄液、胃液、胆汁、膵管洗浄液、胆管洗浄液、総胆管洗浄液、胆嚢液、滑液、感染性創傷、非感染性創傷、考古学的な試料、法医学試料、水試料、組織試料、食品試料、バイオリアクター試料、植物試料、細菌試料、原生動物のサンプル、真菌試料、動物試料、ウイルス試料、複数の生体の試料、爪擦過検体、精液、前立腺液、膣液、膣スワブ、卵管洗浄液、無細胞核酸、細胞内の核酸、メタゲノミクス試料、移植された異物の洗浄液またはスワブ、鼻洗浄液、腸液、上皮擦過検体、上皮洗浄液、組織生検、剖検試料、剖検試料、臓器試料、人物同定試料、非ヒト同定試料、人工的に産生された核酸試料、合成遺伝子試料、バンクに寄託または保管された核酸試料、腫瘍組織、胎児試料、臓器移植試料、微生物培養試料、核ＤＮＡ試料、ミトコンドリアＤＮＡ試料、葉緑体ＤＮＡ試料、アピコプラストＤＮＡ試料、細胞小器官試料、およびそれらの任意の組み合わせであるか、またはそれを含む。いくつかの実施形態では、核酸材料は１つを超える供給源に由来する。

本明細書に記載されるとき、いくつかの実施形態では、配列決定プロセスの効率、精確さ、および／または速度を改善するために、核酸材料を処理することが有利である。いくつかの実施形態では、核酸材料は、実質的に均一な長さおよび／または実質的に既知の長さの核酸分子を含む。いくつかの実施形態では、実質的に均一な長さおよび／または実質的に既知の長さは、約１～約１，０００，０００塩基である）。例えば、いくつかの実施形態では、実質的に均一な長さおよび／または実質的に既知の長さは、少なくとも１、２、３、４、５、６、７、８、９、１０、１５、２０、２５、３０、３５、４０、５０、６０、７０、８０、９０、１００、１２０、１５０、２００、３００、４００、５００、６００、７００、８００、９００、１０００、１２００、１５００、２０００、３０００、４０００、５０００、６０００、７０００、８０００、９０００、１０，０００、１５，０００、２０，０００、３０，０００、４０，０００、または５０，０００塩基の長さであり得る。いくつかの実施形態では、実質的に均一な長さおよび／または実質的に既知の長さは、最大で６０，０００、７０，０００、８０，０００、９０，０００、１００，０００、１２０，０００、１５０，０００、２００，０００、３００，０００、４００，０００、５００，０００、６００，０００、７００，０００、８００，０００、９００，０００、または１，０００，０００塩基であり得る。具体的な非限定的な例として、いくつかの実施形態では、実質的に均一な長さおよび／または実質的に既知の長さは、約１００～約５００塩基である。いくつかの実施形態では、核酸材料は、１つ以上の標的化エンドヌクレアーゼにより、実質的に均一な長さおよび／または実質的に既知の長さの核酸分子に切断されている。いくつかの実施形態では、標的化エンドヌクレアーゼは、少なくとも１つの修飾を含む。

いくつかの実施形態では、核酸材料は、１つ以上の実質的に既知のサイズ範囲内の長さを有する核酸分子を含む。いくつかの実施形態では、核酸分子は、１～約１，０００，０００塩基、約１０～約１０，０００塩基、約１００～約１０００塩基、約１００～約６００塩基、約１００～約５００塩基、またはそれらのいくつかの組み合わせであり得る。

いくつかの実施形態では、標的化エンドヌクレアーゼは、認識部位またはその近辺でＤＮＡを切断する制限エンドヌクレアーゼ（すなわち、制限酵素）（例えば、ＥｃｏＲＩ、ＢａｍＨＩ、ＸｂａＩ、ＨｉｎｄＩＩＩ、ＡｌｕＩ、ＡｖａＩＩ、ＢｓａＪＩ、ＢｓｔＮＩ、ＤｓａＶ、Ｆｎｕ４ＨＩ、ＨａｅＩＩＩ、ＭａｅＩＩＩ、Ｎ１ａＩＶ、ＮＳｉＩ、ＭｓｐＪＩ、ＦｓｐＥＩ、ＮａｅＩ、Ｂｓｕ３６Ｉ、ＮｏｔＩ、ＨｉｎＦ１、Ｓａｕ３ＡＩ、ＰｖｕＩＩ、ＳｍａＩ、ＨｇａＩ、ＡｌｕＩ、ＥｃｏＲＶなど）のうちの１つであるかまたはそれを含む。いくつかの制限エンドヌクレアーゼの一覧は、印刷された形式とコンピューターで読取可能な形式の両方で入手可能であり、多くの商業的供給業者（例えば、ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ，Ｉｐｓｗｉｃｈ，ＭＡ）によって提供されている。本技術の様々な実施形態に従って、任意の制限エンドヌクレアーゼを使用することができることを当業者は理解するであろう。他の実施形態では、標的化エンドヌクレアーゼは、例えば、ＣＲＩＳＰＲ関連（Ｃａｓ）酵素／ガイドＲＮＡ複合体（例えば、Ｃａｓ９もしくはＣｐｆ１）またはＣａｓ９様酵素などのリボ核タンパク質複合体のうちの少なくとも１つであるか、またはそれを含む。他の実施形態では、標的化エンドヌクレアーゼは、ホーミングエンドヌクレアーゼ、ジンクフィンガーヌクレアーゼ、ＴＡＬＥＮ、および／またはメガヌクレアーゼ（例えば、ｍｅｇａＴＡＬヌクレアーゼなど）、アルゴノートヌクレアーゼ、またはそれらの組み合わせであるか、またはそれを含む。いくつかの実施形態では、標的化エンドヌクレアーゼは、Ｃａｓ９もしくはＣＰＦ１、またはそれらの誘導体を含む。いくつかの実施形態では、１つを超える標的化エンドヌクレアーゼを使用してもよい（例えば、２、３、４、５、６、７、８、９、１０、またはそれ以上）。いくつかの実施形態では、標的化エンドヌクレアーゼを使用して、核酸材料の１つを超える潜在的標的領域（例えば、２、３、４、５、６、７、８、９、１０、またはそれ以上）を切断することができる。いくつかの実施形態では、核酸材料の１つを超える標的領域が存在する場合、各々の標的領域は同一（または実質的に同一）の長さであり得る。いくつかの実施形態では、核酸材料の１つを超える標的領域が存在する場合、既知の長さの標的領域のうちの少なくとも２つは長さが異なる（例えば、１００ｂｐの長さの第１の標的領域と、１，０００ｂｐの長さの第２の標的領域）。

いくつかの実施形態では、核酸材料の試料の一部（例えば、アダプター配列）に特定の修飾がなされる。特定の例として、いくつかの実施形態では、第１の試料中の核酸材料を増幅することは、分離するステップの後、および第１の試料を増幅することの前に、核酸材料上に見られる第２のアダプター配列の一部または全てを破壊または崩壊することをさらに含む。さらなる例として、いくつかの実施形態では、第２の試料中の核酸材料を増幅することは、分離するステップの後、および第２の試料を増幅することの前に、核酸材料上に見られる第１のアダプター配列を破壊または崩壊することをさらに含む。いくつかの実施形態では、破壊または崩壊することが、酵素消化、少なくとも１つの複製阻害分子の含有、酵素的切断、一方の鎖の酵素的切断、両方の鎖の酵素的切断、切断または一方もしくは両方の鎖をもたらす酵素処理が後に続く修飾された核酸の取り込み、複製阻止ヌクレオチドの組み込み、連鎖停止剤の組み込み、光切断可能なリンカーの取り込み、ウラシルの取り込み、リボース塩基の取り込み、８－オキソ－グアニン付加物の組み込み、制限エンドヌクレアーゼの使用、リボ核タンパク質エンドヌクレアーゼ（例えば、Ｃａｓ９もしくはＣＰＦ１などのＣａｓ酵素）、または他のプログラム可能なエンドヌクレアーゼ（例えば、ホーミングエンドヌクレアーゼ、ジンクフィンガーヌクレアーゼ、ＴＡＬＥＮ、メガヌクレアーゼ（例えば、ｍｅｇａＴＡＬヌクレアーゼ）、アルゴノートヌクレアーゼなど）の使用、およびそれらの任意の組み合わせの少なくとも１つであり得るか、またはそれを含み得る。いくつかの実施形態では、プライマー部位破壊または崩壊に加えて、またはその代替として、親和性プルダウン、サイズ選択、または試料から望ましくない核酸材料を除去および／または増幅しない他の既知の技術などの方法が考えられる。

いくつかの実施形態では、少なくとも１つの増幅ステップは、少なくとも１つの非標準ヌクレオチドであるかまたはそれを含む少なくとも１つのプライマーおよび／またはアダプター配列を含む。さらなる例として、いくつかの実施形態では、少なくとも１つのアダプター配列が、少なくとも１つの非標準ヌクレオチドであるか、またはそれを含むいくつかの実施形態では、非標準ヌクレオチドは、ウラシル、メチル化ヌクレオチド、ＲＮＡヌクレオチド、リボースヌクレオチド、８－オキソ－グアニン、ビオチン化ヌクレオチド、デスチオビオチンヌクレオチド、チオール修飾ヌクレオチド、アクリダイト修飾ヌクレオチドｉｓｏ－ｄＣ、ｉｓｏｄＧ、２’－Ｏ－メチルヌクレオチド、イノシンヌクレオチドロックド核酸、ペプチド核酸、５メチルｄＣ、５－ブロモデオキシウリジン、２，６－ジアミノプリン、２－アミノプリンヌクレオチド、脱塩基ヌクレオチド、５－ニトロインドールヌクレオチド、アデニル化ヌクレオチド、アジドヌクレオチド、ジゴキシゲニンヌクレオチド、Ｉリンカー、５’ヘキシニル修飾ヌクレオチド、５－オクタジイニルｄＵ、光開裂性スペーサー、非光開裂性スペーサー、クリックケミストリー対応の修飾ヌクレオチド、蛍光色素、ビオチン、フラン、ＢｒｄＵ、フルオロ－ｄＵ、ｌｏｔｏ－ｄＵ、およびそれらの任意の組み合わせから選択される。

いくつかの実施形態によれば、提供されるプロセスの精確さ、速度、および効率のうちの１つ以上を向上するために、様々な分析ステップのいずれかを使用することができる。例えば、いくつかの実施形態では、第１の核酸産物および第２の核酸産物の各々を配列決定することは、第１の核酸産物中の複数の鎖の配列を比較して、第１の鎖のコンセンサス配列を決定することと、第２の核酸産物中の複数の鎖の配列を比較して、第２の鎖のコンセンサス配列を決定することと、を含む。いくつかの実施形態では、第１の核酸産物の配列を、第２の核酸産物の配列と比較することが、第１の鎖のコンセンサス配列と第２の鎖のコンセンサス配列を比較して、エラーが訂正されたコンセンサス配列を提供することを含む。

核酸材料を増幅するための様々な方法のいずれかが、様々な実施形態に従って使用され得ることが企図される。例えば、いくつかの実施形態では、少なくとも１つの増幅するステップは、ポリメラーゼ連鎖反応（ＰＣＲ）、ローリングサークル増幅（ＲＣＡ）、多置換増幅（ＭＤＡ）、等温増幅、エマルション内のポロニー増幅、表面、ビーズの表面またはヒドロゲル内部のブリッジ増幅、およびそれらの任意の組み合わせを含む。いくつかの実施形態では、核酸材料を増幅することが、目的のゲノム配列の領域に少なくとも部分的に相補的な一本鎖オリゴヌクレオチド、およびアダプター配列の領域に少なくとも部分的に相補的な一本鎖オリゴヌクレオチドの使用を含む。いくつかの実施形態では、核酸材料を増幅することは、第１アダプター配列および第２アダプター配列の領域に少なくとも部分的に相補的（例えば、核酸材料の各々の鎖の５’および／または３’末端のアダプター配列に少なくとも部分的に相補的）な一本鎖オリゴヌクレオチドの使用を含む。

いくつかの実施形態によって提供される一態様は、非常に少量の核酸材料からの高品質の配列決定情報を生成する能力である。いくつかの実施形態では、提供される方法および組成物は、最大で以下の量の出発核酸材料とともに使用することができる：約１ピコグラム（ｐｇ）、１０ｐｇ、１００ｐｇ、１ナノグラム（ｎｇ）、１０ｎｇ、１００ｎｇ、２００ｎｇ、３００ｎｇ、４００ｎｇ、５００ｎｇ、６００ｎｇ、７００ｎｇ、８００ｎｇ、９００ｎｇ、または１０００ｎｇ。いくつかの実施形態では、提供される方法および組成物は、最大で１分子コピーまたはゲノム相当、１０分子コピーまたはそのゲノム相当、１００分子コピーまたはそのゲノム相当、１，０００分子コピーまたはそのゲノム相当、１０，０００分子コピーまたはそのゲノム相当、１００，０００分子コピーまたはそのゲノム相当、または１，０００，０００分子コピーまたはそのゲノム相当の投入量の核酸材料とともに使用することができ、例えば、いくつかの実施形態では、最大で１，０００ｎｇの核酸材料が特定の配列決定プロセスに最初に提供される。例えば、いくつかの実施形態では、最大で１００ｎｇの核酸材料が特定の配列決定プロセスに最初に提供される。例えば、いくつかの実施形態では、最大で１０ｎｇの核酸材料が特定の配列決定プロセスに最初に提供される。例えば、いくつかの実施形態では、最大で１ｎｇの核酸材料が特定の配列決定プロセスに最初に提供される。例えば、いくつかの実施形態では、最大で１００ｐｇの核酸材料が特定の配列決定プロセスに最初に提供される。例えば、いくつかの実施形態では、最大で１ｐｇの核酸材料が特定の配列決定プロセスに最初に提供される。

本出願で使用するとき、「約」および「およそ」という用語は同等のものとして使用される。本明細書での出版物、特許、または特許出願への全ての引用は、それらの全体が参照により本明細書に組み込まれる。本出願で使用される、約／およそを有するかまたは有さない数字は、関連技術分野の当業者によって認識される通常の変動を包含することを意味する。

様々な実施形態では、目的の領域への核酸材料の濃縮を含む核酸材料の濃縮は、より速い速度で（例えば、より少ないステップで）、より少ないコストで（例えば、より少ない試薬を使用して）提供され、望ましいデータの増加をもたらす。本技術の様々な態様は、前臨床試験および臨床試験と診断との両方、ならびに他の用途において多くの用途を有する。

本技術のいくつかの実施形態の具体的な詳細は、図１Ａ～図２４を参照して以下に説明される。実施形態の多くはデュプレックス配列決定に関して本明細書に記載されているが、本明細書に記載されたものに加えてエラー訂正配列決定読取および／または他の配列決定読取を生成できる他の配列決定様式は本技術の範囲内である。さらに、本明細書に記載される核酸濃縮方法および試薬から利益を得るために、他の核酸の調査が企図される。さらに、本技術の他の実施形態は、本明細書で説明されるものとは異なる構成、構成要素、または手順を有することができる。それゆえに、当業者は、技術が追加の要素を備えた他の実施形態を有することができ、技術が図１Ａ～２４を参照して以下に示され記載される特徴のいくつかを含まずに他の実施形態を有することができることをそれに従って理解するであろう。

本開示の多くの態様は、以下の図面を参照することによってよりよく理解することができる。図面の構成要素は必ずしも縮尺通りではない。代わりに、本開示の原理を明確に示すことに重点が置かれている。

本技術のいくつかの実施形態で使用するための核酸アダプター分子、および本技術の実施形態によるアダプター分子の二本鎖核酸断片へのライゲーションから生じる二本鎖アダプター－核酸複合体を示す。本技術の実施形態による様々なデュプレックス配列決定方法のステップの概念図である。本開示の特定の態様による、次世代シーケンス（ＮＧＳ）、一本鎖タグベースのエラー訂正、および二重鎖配列決定エラー訂正の分子集団におけるバリアント対立遺伝子頻度の関数として陽性的中率をプロットしたグラフである。本開示の態様による、エラー訂正の非存在下のＣＯＤＩＳ遺伝子型と対配列決定読取の数を示す一連のグラフ（図３Ａ）、および３つの異なる座位の標準的なＤＳによる分析（図３Ｂ）を示す。本技術の一実施形態によるＳＰＬｉＴ－ＤＳ法のステップの概念図である。本技術の一実施形態による、ＳＰＬｉＴ－ＤＳ法のステップの概念図であり、二重鎖コンセンサス配列を生成するステップを示している。本技術の実施形態による様々なＳＰＬｉＴ－ＤＳ法のステップの概念図である。本技術の一実施形態によるさらなるＳＰＬｉＴ－ＤＳ法のステップの概念図である。本技術の追加の実施形態による二本鎖プライマー部位破壊スキームを組み込んだＳＰＬｉＴ－ＤＳ法のステップの概念図である。図８Ａに示され、本技術の実施形態によるＳＰＬｉＴ－ＤＳ法のステップの例の概念図である。本技術の追加の態様による、図８Ａに示される方法のステップに続くＳＰＬｉＴ－ＤＳ法のステップの実施形態の概念図である。本技術の別の実施形態による二本鎖プライマー部位破壊スキームを組み込んだＳＰＬｉＴ－ＤＳ法のステップの概念図である。本技術のさらなる態様による一本鎖プライマー部位破壊スキームを組み込んだＳＰＬｉＴ－ＤＳ法のステップの様々な実施形態の概念図である。本技術のさらに別の実施形態による、より長い核酸分子の二重鎖コンセンサス配列を生成するための複数の標的化プライマーを使用するＳＰＬｉＴ－ＤＳ法のステップの概念図である。本技術の一実施形態による、核酸インサートサイズと増幅後に得られるファミリーサイズとの関係をプロットしたグラフである。本技術の態様による、異なる核酸インサートのサイズについて生成された配列決定データを示す概略図である。本技術の一実施形態による、配列決定情報を生成するためのＣＲＩＳＰＲ／Ｃａｓ９によって特定のサイズに切断された標的化断片を生成する方法のステップを示す概略図である。本技術の一実施形態によるＣＲＩＳＰＲ－ＤＳ法のステップの概念図である。図１２Ａは、ＴＰ５３のＣＲＩＳＰＲ／Ｃａｓ９消化からの結果を示し、７つの断片は、ｇＲＮＡを使用する標的化切断により切除された全てのＴＰ５３コーディングエクソンを含む。暗い灰色は参照鎖を表し、明るい灰色は反参照鎖を表す。図１２Ｂは、０．５×ＳＰＲＩビーズを使用するサイズ選択を示し、未切断のゲノムＤＮＡはビーズに結合し、溶液中の切除された断片の回収を可能にする。図１２Ｃは、１０ｂｐのランダムな相補的ヌクレオチドおよび３’－ｄＴ突出を含む二本鎖ＤＳアダプターで断片化およびライゲートされた二本鎖ＤＮＡ分子の概略図を示す。図１２Ｄは、ＤＳによるエラー訂正の概略図を示す。同一のＤＮＡ鎖に由来する読取を比較して、一本鎖コンセンサス配列（ＳＳＣＳ）を形成する。次いで、同一の開始ＤＮＡ分子の両方の鎖を互いに比較して二本鎖コンセンサス配列（ＤＳＣＳ）を作成し、両方のＳＳＣＳ読取で見つかった変異をＤＳＣＳ読取の真の変異として計数する。本技術の特定の実施形態による、ＣＲＩＳＰＲ－ＤＳおよび標準的なＤＳの方法のステップを概略的に比較する。図１２Ｅは、ＣＲＩＳＰＲ－ＤＳおよび標準的なＤＳのライブラリー調製ステップの比較である。各ボックスは１時間を表す。図１２Ｆは、最適で一貫した長さであり、配列決定読取の完全な包含を有するＣＲＩＳＰＲ－ＤＳによる断片産物と比較して、最適長よりも短いかまたは長い（それぞれ、失われた情報または冗長な情報に対応する）、超音波処理を使用して産生された断片の概略図を示す。本技術の一実施形態によるＳＰＬｉＴ－ＤＳ手順から得られたデータを示す。図１３Ａは、配列決定前のインサート断片サイズを示す代表的なゲルである。図１３Ｂおよび１３Ｃは、ＣＯＤＩＳ遺伝子型対エラー訂正の非存在下（図１３Ｂ）およびＳＰＬｉＴ－ＤＳによる分析後（図１３Ｃ）の配列決定読取の数を示すグラフである。本技術の実施形態による、高度に損傷したＤＮＡに対する、ＣＯＤＩＳ遺伝子型対エラー訂正の非存在下（図１４Ａ）およびＳＰＬｉＴ－ＤＳによる分析後（図１４Ｂ）の配列決定読取の数を示すグラフである。本技術の実施形態による、ｃｆＤＮＡの１０ｎｇ（図１５Ａ）および２０ｎｇ（図１５Ｂ）から生成されたＫＲＡＳエクソン２のＳＰＬｉＴ－ＤＳ配列決定データを視覚的に表す。本技術の実施形態による、超音波処理およびＣＲＩＳＰＲ／Ｃａｓ９断片化によって産生される断片の長さの概略図である。、本技術の実施形態による、標準的なＤＳおよびＣＲＩＳＰＲ－ＤＳプロトコールで調製された試料の断片インサートサイズを示すヒストグラムグラフである。Ｘ軸は、最適な断片サイズ、例えば、分子バーコードとクリッピングの調整後の配列決定読取の長さに一致する断片サイズ、との差異の割合を表す。縦欄領域は、最適なサイズから１０％以内の範囲にある断片サイズの範囲を示し、最適なサイズは垂直のハッシュ線で指定される。本技術の実施形態による、ヒトＴＰ５３のコード領域の標的化された濃縮のためのＣＲＩＳＰＲ／Ｃａｓ９スキームを示す。ＴＰ５３腫瘍タンパク質；Ｈｏｍｏｓａｐｉｅｎｓ；ＮＣ＿００００１７．１１Ｃｈｒ．１７，Ｒｅｆ．ＧＲＣｈ３８．ｐ２．灰色の文字はコード領域を表し、エクソン名は、右マージンに示され、同一の断片にあるときは、一緒にボックスで囲まれる。灰色で強調表示されたテキストは、ＰＡＭ配列に二重下線を付したＣａｓ９切断部位を表す。下線を付した単一のテキストは、ビオチン化プローブを表し、プローブ名は左マージンに示されている。二重鎖コンセンサス配列読取（図１８Ｂ）を産生するインプットＤＮＡ中のゲノムのパーセンテージによって計算された回収パーセンテージを示し、および本技術の実施形態による標準的なＤＳおよびＣＲＩＳＰＲ－ＤＳを使用して処理された様々なインプット量のＤＮＡの全ての標的領域にわたる中央二重鎖コンセンサス配列深度（図１８Ｃ）を示す、オンターゲットの未処理の配列決定読取（生の読取り）のパーセント（ＴＰ５３を包含）を示す棒グラフ（図１８Ａ）である。本技術の一実施形態による、３つの異なる血液ＤＮＡ試料での２つの捕捉ステップと比較して、１つの捕捉ステップでＣＲＩＳＰＲ－ＤＳによりもたらされる標的濃縮を示す棒グラフである。、パルスフィールドゲル上のＢｌｕｅＰｉｐｐｉｎによる高分子量ＤＮＡのプレ濃縮の結果（図２０Ａ）、およびオンターゲットの未処理読取と、本技術の実施形態によるＢｌｕｅＰｉｐｐｉｎプレ濃縮の前後に配列決定された同一のＤＮＡについての二重鎖コンセンサス配列深度とのパーセンテージの比較を示す棒グラフ（図２０Ｂ）を示す。、合成二本鎖ＤＮＡ分子の概略図（図２１Ａ）およびＣＲＩＳＰＲ／Ｃａｓ９消化後の予測断片の長さのチャート（図２１Ｂ）、ならびに合成二本鎖ＤＮＡ分子のＣＲＩＳＰＲ／Ｃａｓ９消化後の実際のＤＮＡ断片の長さの得られたＴａｐｅＳｔａｔｉｏｎゲル画像（図２１Ｃ）であり、本技術の実施形態によるＣＲＩＳＰＲ／Ｃａｓ９消化を使用した成功した切断を実証する。本技術の一実施形態による、ＣＲＩＳＰＲ－ＤＳおよび標準的なＤＳプロトコールを使用したＴＰ５３の増幅後の核酸インサートサイズと得られたファミリーサイズとの関係をプロットしたグラフである。ドットは元のバーコードＤＮＡ分子を表し、ＣＲＩＳＰＲ－ＤＳでは、全てのＤＮＡ分子（明るいドット）はあらかじめ設定されたサイズを持ち、同様の数のＰＣＲコピーを生成する（いくつかの「ドット様」の明るいドットのクラスターによって示される）。標準的なＤＳ（暗いドット）では、超音波処理によりＤＮＡが様々な断片の長さに切断される（暗いドット、明るいドットよりもプロット上でより広く分布）。このプロットは、長い断片よりも短い断片の数が多いことを示している。本技術の実施形態による、ＣＲＩＳＰＲ－ＤＳおよび標準的なＤＳ法のステップから得られたＴＰ５３に関するデータを示す。図２２Ｂは、アダプターライゲーション後および配列決定前のインサート断片サイズを示す代表的なゲルである。図２２Ｃおよび２２Ｄは、配列決定の前にＣＲＩＳＰＲ－ＤＳ（図２２Ｃ）および標準的なＤＳ（図２２Ｄ）によって生成された得られた核酸ライブラリーのピークを示すエレクトロフェログラムである。図２２Ｅは、ＣＲＩＳＰＲ－ＤＳおよびＩｎｔｅｇａｔｉｖｅＧｅｎｏｍｉｃｓＶｉｅｗｅｒによる標準的なＤＳプロトコールによって生成されたＴＰ５３の二重鎖コンセンサス配列読取を示す。図２２Ｂは、ＣＲＩＳＰＲ－ＤＳ（Ａ１）および標準的なＤＳ（Ｂ１）からのラダーと試料を有するＴａｐｅＳｔａｔｉｏｎゲルを示す。バンドのサイズは、アダプターを有するＣＲＩＳＰＲ／Ｃａｓ９切断断片に対応している。図２２Ｅは、ＣＲＩＳＰＲ／Ｃａｓ９切断点に対応する明確な境界と、断片内と断片間の両方の位置にわたる深度の均一な分布を示す。標準的なＤＳは、断片のランダムなせん断およびハイブリダイゼーション捕捉、ならびに不均一な包含によって生成されたピークパターンを示す。本技術の一実施形態によるＣＲＩＳＰＲ－ＤＳデータ処理のステップの概略図である。本技術の一実施形態による、ＣＲＩＳＰＲ／Ｃａｓ９消化とそれに続くサイズ選択後の標的濃縮の度合を定量化した結果を示すチャート（図２４Ａ）およびグラフ（図２４Ｂ）である。図２４Ａは、ＤＮＡ試料およびそれぞれについて達成された濃縮を示す。図２４Ｂは、インプットＤＮＡの量と比較して「オンターゲット」にあった未処理の読取のパーセントを示す。

定義
本開示をより容易に理解するために、特定の用語を最初に以下に定義する。以下の用語およびその他の用語の追加の定義は、明細書全体に記載されている。

本出願において、文脈からそうでないことが明確でない限り、用語「ａ」は「少なくとも１つ」を意味すると理解され得る。本出願で使用するとき、「または」という用語は「および／または」を意味すると理解され得る。本出願では、「含むこと（ｃｏｍｐｒｉｓｉｎｇ）」および「含むこと（ｉｎｃｌｕｄｉｎｇ）」という用語は、それ自体で、または１つ以上の追加の構成要素またはステップとともに提示されるかどうかにかかわらず、項目化された構成要素またはステップを包含すると理解され得る。本明細書で範囲が提供されている場合、端点が含まれる。本出願で使用するとき、「含む（ｃｏｍｐｒｉｓｅ）」という用語、ならびに「含むこと（ｃｏｍｐｒｉｓｉｎｇ）」および「含む（ｃｏｍｐｒｉｓｅｓ）」などの用語の変形は、他の添加剤、構成要素、整数、またはステップを除外することを意図していない。

約：「約」という用語は、値に関して本明細書で使用するとき、文脈において、参照される値に類似する値を指す。一般に、文脈に精通している当業者は、その文脈の「約」に包含される関連する分散の程度を理解するであろう。例えば、いくつかの実施形態では、「約」という用語は、言及された値の２５％、２０％、１９％、１８％、１７％、１６％、１５％、１４％、１３％、１２％、１１％、１０％、９％、８％、７％、６％、５％、４％、３％、２％、１％、またはそれ以下内の値の範囲を包含し得る。

類似体：本明細書で使用するとき、「類似体」という用語は、１つ以上の特定の構造的特徴、要素、成分、または部分を参照物質と共有する物質を指す。通常、「類似体」は、参照物質との重要な構造的類似性、例えばコアまたはコンセンサス構造の共有を示すが、特定の個別の点で異なってもいる。いくつかの実施形態では、類似体は、例えば、参照物質の化学的操作により、参照物質から生成できる物質である。いくつかの実施形態では、類似体は、参照物質を生成するものと実質的に類似する（例えば、複数のステップを共有する）合成プロセスの実行を通じて生成できる物質である。いくつかの実施形態では、類似体は、参照物質の生成に使用されたものとは異なる合成プロセスの実行により生成されるか、または生成することができる。

生体試料：本明細書で使用するとき、「生体試料」または「試料」という用語は、通常、本明細書に記載される目的の生物学的供給源（例えば、組織または生物または細胞培養）から得られるまたはそれに由来する試料を指す。いくつかの実施形態では、目的の供給源は、動物またはヒトなどの生物を含む。他の実施形態では、目的の供給源は、細菌、ウイルス、原生動物、または真菌などの微生物を含む。さらなる実施形態では、目的の供給源は、合成組織、生物、細胞培養物、核酸、または他の物質であり得る。さらなる実施形態では、目的の供給源は植物ベースの生物であり得る。さらに別の実施形態では、試料は、例えば水試料、土壌試料、考古学的試料、または非生物源から収集された他の試料などの環境試料であってもよい。他の実施形態では、試料は多生物試料（例えば、混合生物試料）であり得る。いくつかの実施形態では、生体試料は、生体組織または生体液である。いくつかの実施形態では、生体試料は、骨髄、血液、血球、腹水、細針生検試料、細胞含有体液、浮遊核酸、喀痰、唾液、尿、脳脊髄液、腹水、胸水、糞便、リンパ液、婦人科液、皮膚スワブ、膣スワブ、パップスメア、口腔スワブ、鼻腔スワブ、管洗浄液または気管支肺胞洗浄液などの洗液または洗浄液、膣液、吸引物、擦過検体、骨髄試料、組織生検試料、胎児組織または体液、摘出試料、糞便、他の体液、分泌物、および／または排泄物、および／またはそこからの細胞などであり得るか、またはそれを含む。いくつかの実施形態では、生体試料は、個体から得られた細胞であるか、またはそれを含む。いくつかの実施形態では、得られた細胞は、試料が得られた個体の細胞であるか、またはそれを含む。特定の実施形態では、生体試料は、対象から得られた液体生検である。いくつかの実施形態では、試料は、適切な手段によって目的の供給源から直接得られた「一次試料」である。例えば、いくつかの実施形態では、一次生体試料は、生検（例えば、細針吸引または組織生検）、手術、体液の収集（例えば、血液、リンパ液、糞便）などからなる群から選択された方法によって取得される。いくつかの実施形態では、文脈から明らかなように、「試料」という用語は、一次試料を処理することによって（例えば、１つ以上の成分を除去することによって、および／または１つ以上の薬剤を添加することによって）得られる調製物を指す。例えば、半透膜を使用したフィルタリングである。そのような「処理された試料」は、例えば、試料から抽出されるか、あるいは一次試料をｍＲＮＡの増幅もしくは逆転写、特定の成分の単離および／または精製などの技術に供することにより得られた核酸またはタンパク質を含み得る。

決定する：本明細書に記載される多くの方法論には、「決定すること」のステップが含まれる。本明細書を読む当業者は、そのような「決定すること」が、例えば本明細書に明示的に言及される特定の技術を含む、当業者に利用可能な様々な技術のいずれかを利用することにより利用または達成できることを理解するであろう。いくつかの実施形態では、決定することには物理的な試料の操作が含まれる。いくつかの実施形態では、決定することには、関連する分析を実行するように適合されたコンピューターまたは他の処理ユニットの利用など、データまたは情報の検討および／または操作が含まれる。いくつかの実施形態では、決定することには、供給源からの関連情報および／または物質の受容が含まれる。いくつかの実施形態では、決定することには、試料または実体の１つ以上の特徴を比較可能な参照と比較することが含まれる。

発現：本明細書で使用するとき、核酸配列の「発現」とは、以下の事象の１つ以上を指す：（１）ＤＮＡ配列からのＲＮＡテンプレートの産生（例えば、転写による）、（２）ＲＮＡ転写産物の処理（例えば、スプライシング、編集、５’キャップ形成、および／または３’末端形成による）、（３）ＲＮＡのポリペプチドまたはタンパク質への翻訳、および／または（４）ポリペプチドまたはタンパク質の翻訳後修飾。

ｇＲＮＡ：本明細書で使用するとき、「ｇＲＮＡ」または「ガイドＲＮＡ」は、ＤＮＡまたはＲＮＡの特定の領域の切断を促進する実質的に標的特異的な配列に対する標的化エンドヌクレアーゼ（例えば、Ｃａｓ９またはＣｐｆ１などのＣａｓ酵素、または類似の特性を有する別のリボ核タンパク質など）結合に適した足場配列を含む短いＲＮＡ分子を指す。

核酸：本明細書で使用するとき、その最も広い意味で、オリゴヌクレオチド鎖に組み込まれているか、または組み込むことができる任意の化合物および／または物質を指す。いくつかの実施形態では、核酸は、ホスホジエステル結合を介してオリゴヌクレオチド鎖に組み込まれているか、または組み込むことができる化合物および／または物質である。文脈から明らかなように、いくつかの実施形態では、「核酸」とは、個々の核酸残基（例えば、ヌクレオチドおよび／またはヌクレオシド）を指し、いくつかの実施形態では、「核酸」とは、個々の核酸残基を含むオリゴヌクレオチド鎖を指す。いくつかの実施形態では、「核酸」はＲＮＡであるか、またはそれを構成し、いくつかの実施形態では、「核酸」はＤＮＡであるか、またはＤＮＡを構成する。いくつかの実施形態では、核酸は、１つ以上の天然の核酸残基であるか、それを含むか、またはそれからなる。いくつかの実施形態では、核酸は、１つ以上の核酸類似体であるか、それを含むか、またはそれからなる。いくつかの実施形態では、核酸類似体は、ホスホジエステル骨格を利用しないという点で核酸とは異なる。例えば、いくつかの実施形態では、核酸は、当該技術分野で既知であり、骨格にホスホジエステル結合の代わりにペプチド結合を有し、本技術の範囲内であると考えられる、１つ以上の「ペプチド核酸」であるか、それを含むか、またはそれからなる。代替的にまたは追加的に、いくつかの実施形態では、核酸は、ホスホジエステル結合ではなく、１つ以上のホスホロチオエートおよび／または５’－Ｎ－ホスホラミダイト結合を有する。いくつかの実施形態では、核酸は、１つ以上の天然のヌクレオシド（例えば、アデノシン、チミジン、グアノシン、シチジン、ウリジン、デオキシアデノシン、デオキシチミジン、デオキシグアノシン、およびデオキシシチジン）であるか、それを含むか、またはそれからなる。いくつかの実施形態では、核酸は、１つ以上のヌクレオシド類似体（例えば、２－アミノアデノシン、２－チオチミジン、イノシン、ピロロ－ピリミジン、３－メチルアデノシン、５－メチルシチジン、Ｃ－５プロピニル－シチジン、Ｃ－５プロピニル－ウリジン、２－アミノアデノシン、Ｃ５－ブロモウリジン、Ｃ５－フルオロウリジン、Ｃ５－ヨードウリジン、Ｃ５－プロピニル－ウリジン、Ｃ５－プロピニル－シチジン、Ｃ５－メチルシチジン、２－アミノアデノシン、７－デアザアデノシン、７－デアザグアノシン、８－オキソアデノシン、８－オキソグアノシン、０（６）－メチルグアニン、２－チオシチジン、メチル化塩基、挿入塩基、およびそれらの組み合わせ）であるか、それを含むか、またはそれからなる。いくつかの実施形態では、核酸は、天然の核酸のものと比較して、１つ以上の修飾糖（例えば、２’－フルオロリボース、リボース、２’－デオキシリボース、アラビノース、およびヘキソース）を含む。いくつかの実施形態では、核酸は、ＲＮＡやタンパク質などの機能的な遺伝子産物をコードするヌクレオチド配列を有する。いくつかの実施形態では、核酸には１つ以上のイントロンが含まれる。いくつかの実施形態では、核酸は、天然源からの分離、相補的テンプレートに基づく重合による酵素合成（インビボまたはインビトロ）、組換え細胞またはシステムでの複製、および化学合成の１つ以上によって調製される。いくつかの実施形態では、核酸は少なくとも２、３、４、５、６、７、８、９、１０、１５、２０、２５、３０、３５、４０、４５、５０、５５、６０、６５、７０、７５、８０、８５、９０、９５、１００、１１０、１２０、１３０、１４０、１５０、１６０、１７０、１８０、１９０、２００、２２５、２５０、２７５、３００、３２５、３５０、３７５、４００、４２５、４５０、４７５、５００、６００、７００、８００、９００、１０００、１５００、２０００、２５００、３０００、３５００、４０００、４５００、５０００、またはそれ以上の残基の長さである。いくつかの実施形態では、核酸は部分的または完全に一本鎖であり、いくつかの実施形態では、核酸は部分的または完全に二本鎖である。いくつかの実施形態では、核酸は、ポリペプチドをコードする、またはコードする配列の相補体である少なくとも１つの要素を含むヌクレオチド配列を有する。いくつかの実施形態では、核酸は酵素活性を有する。いくつかの実施形態では、核酸は、例えば、リボ核タンパク質複合体またはトランスファーＲＮＡにおいて機械的機能を果たす。

参照：本明細書で使用するとき、比較が実行される基準または対照を説明する。例えば、いくつかの実施形態では、薬剤、動物、個体、集団、試料、配列、または目的の値は、参照または対照の薬剤、動物、個体、集団、試料、配列、または値と比較される。いくつかの実施形態では、参照または対照は、目的の試験または決定と実質的に同時に試験および／または決定される。いくつかの実施形態では、参照または対照は、具体的な媒体で必要に応じて具体化される歴史的な参照または対照である。典型的には、当業者に理解されるように、参照または対照は、評価下のものと比較可能な条件または状況下で決定または特性評価される。当業者は、特定の可能な参照または対照への依存および／または比較を正当化するのに十分な類似性が存在するときを認識するであろう。

単一の分子識別子（ＳＭＩ）：本明細書で使用するとき、「単一の分子識別子」または「ＳＭＩ」という用語（他の名称のうちとりわけ、「タグ」、「バーコード」、「分子バーコード」、「固有の分子識別子」、または「ＵＭＩ」と呼ばれることもある）は、分子の大きな不均一な集団内の個々の分子を区別することができる任意の物質（例えば、ヌクレオチド配列、核酸分子の特徴）を指す。いくつかの実施形態では、ＳＭＩは、外因性に適用されるＳＭＩであるか、またはそれを含むことができる。いくつかの実施形態では、外因性に適用されるＳＭＩは、縮重または半縮重配列であり得るか、またはそれを含み得る。いくつかの実施形態では、実質的に縮重したＳＭＩは、ランダム固有分子識別子（Ｒ－ＵＭＩ）として知られている場合がある。いくつかの実施形態では、ＳＭＩは、既知のコードのプール内からのコード（例えば、核酸配列）を含み得る。いくつかの実施形態では、事前定義されたＳＭＩコードは、定義済み固有分子識別子（Ｄ－ＵＭＩ）として知られている。いくつかの実施形態では、ＳＭＩは内因性ＳＭＩであり得るか、または内因性ＳＭＩを含み得る。いくつかの実施形態では、内因性ＳＭＩは、標的配列の特定のせん断点に関連する情報、または標的配列を含む個々の分子の末端に関連する特徴であり得るか、またはそれを含み得る。いくつかの実施形態では、ＳＭＩは、ランダムまたはセミランダム損傷、化学修飾、酵素修飾、または核酸分子への他の修飾によって引き起こされる核酸分子の配列変化に関連し得る。いくつかの実施形態では、修飾はメチルシトシンの脱アミノ化であり得る。いくつかの実施形態では、修飾は、核酸ニックの部位を伴う場合がある。いくつかの実施形態では、ＳＭＩは外因性要素と内因性要素の両方を含む場合がある。いくつかの実施形態では、ＳＭＩは物理的に隣接するＳＭＩ要素を含み得る。いくつかの実施形態では、ＳＭＩ要素は分子内で空間的に異なっていてもよい。一部の実施形態では、ＳＭＩは非核酸であり得る。いくつかの実施形態では、ＳＭＩは、２つ以上の異なるタイプのＳＭＩ情報を含み得る。ＳＭＩの様々な実施形態は、国際特許公開第ＷＯ２０１７／１００４４１号にさらに開示されており、その全体が参照により本明細書に組み込まれる。

鎖定義要素（ＳＤＥ）：本明細書で使用するとき、「鎖定義要素」または「ＳＤＥ」という用語は、二本鎖核酸材料の特定の鎖の同定を可能にし、したがって他の／相補鎖との区別を可能にする任意の物質を指す（例えば、標的二本鎖核酸から生じる２つの一本鎖核酸のそれぞれの増幅産物を、配列決定または他の核酸調査後に互いに実質的に区別可能にする任意の物質）。いくつかの実施形態では、ＳＤＥは、アダプター配列内の実質的に非相補的な配列の１つ以上のセグメントであり得るか、またはそれを含み得る。特定の実施形態では、アダプター配列内の実質的に非相補的な配列のセグメントは、Ｙ形状または「ループ」形状を含むアダプター分子によって提供され得る。他の実施形態では、アダプター配列内の実質的に非相補的な配列のセグメントは、アダプター配列内の隣接する相補配列の中央に不対の「バブル」を形成し得る。他の実施形態では、ＳＤＥは核酸修飾を包含し得る。いくつかの実施形態では、ＳＤＥは、物理的に分離された反応コンパートメントへのペア鎖の物理的分離を含み得る。いくつかの実施形態では、ＳＤＥは化学修飾を含んでもよい。いくつかの実施形態では、ＳＤＥは修飾された核酸を含んでもよい。いくつかの実施形態では、ＳＤＥは、ランダムまたはセミランダム損傷、化学修飾、酵素修飾、または核酸分子への他の修飾によって引き起こされる核酸分子の配列変化に関連し得る。いくつかの実施形態では、修飾はメチルシトシンの脱アミノ化であり得る。いくつかの実施形態では、修飾は、核酸ニックの部位を伴う場合がある。ＳＤＥの様々な実施形態は、国際特許公開第ＷＯ２０１７／１００４４１号にさらに開示されており、その全体が参照により本明細書に組み込まれる。

対象：本明細書で使用するとき、「対象」という用語は、生物、典型的には哺乳動物（例えば、出生前のヒトの形態を含むいくつかの実施形態ではヒト）を指す。いくつかの実施形態では、対象は関連する疾患、障害または状態に苦しんでいる。いくつかの実施形態では、対象は疾患、障害、または状態に影響されやすい。いくつかの実施形態では、対象は疾患、障害、または状態の１つ以上の症状または特徴を示す。いくつかの実施形態では、対象は症状、または疾患、障害、もしくは状態の特徴を示さないいくつかの実施形態では、対象とは、疾患、障害、または状態に対する感受性またはリスクを特徴とする１つ以上の特徴を有するものである。いくつかの実施形態では、対象は患者である。いくつかの実施形態では、対象は、診断および／または治療が、施されているおよび／または施された個体である。

実質的に：本明細書で使用するとき、「実質的に」という用語は、目的の特徴または特性の全体またはほぼ全体の範囲または度合を示す定性的な状態を指す。生物学分野の当業者は、生物学的および化学的現象が、もし存在する場合、めったに完了しないこと、および／またはめったに完全に進まないこと、または絶対的な結果を達成または回避することはめったにないことを理解するであろう。したがって、本明細書では、「実質的に」という用語は、多くの生物学的および化学的現象に固有の潜在的な完全性の欠如を捉えるために使用される。
＜詳細な説明＞

デュプレックス配列決定法と関連するアダプターおよび試薬の選択された実施形態
デュプレックス配列決定（ＤＳ）は、二本鎖核酸分子からエラーが訂正されたＤＮＡ配列を生成する方法であり、元は国際特許公開第ＷＯ２０１３／１４２３８９号および米国特許第９，７５２，１８８号に記載されており、それらの両方は、それらの全体が参照により組み込まれる。図１Ａ～１Ｃに示されるように、および本技術の特定の態様では、ＤＳを使用して、個々のＤＮＡ分子の両方の鎖を独立して配列決定し、誘導体配列読取がＭＰＳ中に同一の二重鎖核酸親分子に由来するものとして認識できるが、配列決定後に識別可能な実体として互いに区別されるようにすることができる。デュプレックスコンセンサス配列（ＤＣＳ）として知られる元の二本鎖核酸分子のエラーが訂正された配列を取得する目的で、各鎖から得られた配列読取を比較する。ＤＳのプロセスにより、元の二本鎖核酸分子の一方または両方の鎖が、ＤＣＳを形成するために使用される生成された配列データ中に表されるかどうかを確認することができる。

特定の実施形態では、ＤＳを組み込む方法は、二本鎖標的核酸複合体を産生するために、第１の鎖標的核酸配列および第２の鎖標的核酸配列を含む標的二本鎖核酸分子への１つ以上の配列決定アダプターのライゲーションを含み得る（例えば、図１Ａ）。

様々な実施形態では、得られた標的核酸複合体は、外因性に適用される縮重または半縮重配列、標的二本鎖核酸分子の特定のせん断点に関連する内因性情報、またはその組み合わせを伴う可能性がある少なくとも１つのＳＭＩ配列を含むことができる。ＳＭＩは、標的核酸分子を、配列決定される集団内の複数の他の分子から実質的に区別可能にすることができる。ＳＭＩ要素の実質的に区別可能な特徴は、二本鎖核酸分子を形成する一本鎖の各々によって独立して運ぶことができ、配列決定後に、各鎖の誘導体増幅産物が同一の元の実質的に固有の二本鎖核酸分子に由来するものとして認識できる。他の実施形態では、ＳＭＩは追加の情報を含むことができ、および／または上述の刊行物に記載されているような分子識別機能が有用な他の方法で使用することができる。別の実施形態では、アダプターライゲーション後にＳＭＩ要素を組み込むことができる。いくつかの実施形態では、ＳＭＩは本質的に二本鎖である。他の実施形態では、それは本質的に一本鎖である。他の実施形態では、それは、本質的に一本鎖と二本鎖の組み合わせである。

いくつかの実施形態では、各二本鎖標的核酸配列複合体は、配列決定後に実質的に互いに区別できる標的二本鎖核酸分子を形成する２つの一本鎖核酸の増幅産物をもたらす要素（例えば、ＳＤＥ）をさらに含むことができる。一実施形態では、ＳＤＥは、配列決定アダプター内に含まれる非対称プライマー部位を含んでもよく、または他の配置では、配列の非対称性が、プライマー配列内ではないアダプター分子に導入されてもよく、増幅および配列決定後、第１の鎖標的核酸配列複合体および標的核酸配列複合体の第２の鎖のヌクレオチド配列の少なくとも一部が互いに異なるようにされていてもよい。他の実施形態では、ＳＭＩは、標準的なヌクレオチド配列Ａ、Ｔ、Ｃ、ＧまたはＵとは異なるが、２つの増幅および配列決定された分子における少なくとも１つの標準的なヌクレオチド配列の差に変換される２つの鎖間の別の生化学的非対称性を含み得る。さらに別の実施形態では、ＳＤＥは、増幅前に２本の鎖を物理的に分離する手段であり得、第１の鎖標的核酸配列および第２の鎖標的核酸配列からの誘導体増幅産物は、２つの区別を維持するために一方と他方とを実質的な物理的分離中に維持される。上述の刊行物に記載されているような第１および第２の鎖を区別することを可能にするＳＤＥ機能を提供する他のそのような配置または方法論、または記載された機能的目的に役立つ他の方法を利用し得る。

少なくとも１つのＳＭＩと少なくとも１つのＳＤＥを含む二本鎖標的核酸複合体を生成した後、またはこれらの要素の一方または両方がその後導入される場合、複合体はＰＣＲまたは任意の他のＤＮＡ増幅の生化学的方法（例えば、ローリングサークル増幅、多置換増幅、等温増幅、ブリッジ増幅、または表面結合増幅）などのＤＮＡ増幅に供し得、第１の鎖標的核酸配列の１つ以上のコピーと第２の鎖標的核酸配列の１つ以上のコピーが産生されるようにされる（例えば、図１Ｂ）。次いで、第１の鎖標的核酸分子の１つ以上の増幅コピーおよび第２の標的核酸分子の１つ以上の増幅コピーを、好ましくは「次世代」の超並列ＤＮＡ配列決定プラットフォームを使用するＤＮＡ配列決定に供し得る（例えば、図１Ｂ）。

元の二本鎖標的核酸分子に由来する第１の鎖標的核酸分子および第２の鎖標的核酸分子のいずれかから産生された配列読取は、関連する実質的に固有のＳＭＩの共有に基づいて識別され、ＳＤＥにより反対の鎖標的核酸分子と区別される。いくつかの実施形態では、ＳＭＩは、数学ベースのエラー訂正コード（例えば、ハミングコード）に基づく配列であり得、それにより、特定の増幅エラー、配列決定エラー、またはＳＭＩ合成エラーは、元のデュプレックス（例えば、二本鎖核酸分子）の相補鎖上のＳＭＩ配列の配列に関連する目的のために許容され得る。例えば、ＳＭＩが標準的なＤＮＡ塩基の完全に縮重した配列の１５塩基対を含む二本鎖外因性ＳＭＩでは、完全に縮重したＳＭＩの母集団に推定４^15 = 1,073,741,824のＳＭＩバリアントが存在する。１０，０００個のサンプリングされたＳＭＩの母集団のうち、ＳＭＩ配列内の１つのヌクレオチドのみが異なる配列データの読取から２つのＳＭＩが回収された場合、ランダムな偶然によってこの発生する確率が数学的に計算でき、おそらく、単一の塩基対の相違が前述のタイプのエラーのうちの１つを反映しているかどうかを決定でき、ＳＭＩ配列が実際には同一の元の二重鎖分子に由来するものであると判断することができる。ＳＭＩが少なくとも部分的に、外因的に適用された配列であり、配列バリアントが互いに完全に縮重せず、少なくとも部分的に既知の配列であるいくつかの実施形態では、既知の配列の識別性は、いくつかの実施形態では、前述のタイプの１つ以上のエラーが１つの既知のＳＭＩ配列の識別性を別のＳＭＩ配列のものに変換しないように設計することができ、１つのＳＭＩが別のＳＭＩのものと誤解される可能性が低減される。いくつかの実施形態では、このＳＭＩ設計戦略は、ハミングコードアプローチまたはその派生物を含む。識別されると、第１の鎖標的核酸分子から産生された１つ以上の配列読取を、第２の鎖標的核酸分子から生成された１つ以上の配列読取と比較して、エラーが訂正された標的核酸分子配列を産生する（例えば、図１Ｃ）。例えば、第１の鎖と第２の鎖の両方の標的核酸配列の塩基が一致するヌクレオチド位置は真の配列とみなされるが、２つの鎖間で一致しないヌクレオチド位置は、無視され得る技術的エラーの可能性のある部位として認識される。したがって、元の二本鎖標的核酸分子のエラーが訂正された配列を産生することができる（図１Ｃに示す）。

代替的に、いくつかの実施形態では、２つの鎖間の配列不一致の部位は、元の二本鎖標的核酸分子の生物学的に由来する不一致の潜在的な部位として認識され得る。代替的に、いくつかの実施形態では、２つの鎖間の配列不一致の部位は、元の二本鎖標的核酸分子のＤＮＡ合成に由来する不一致の潜在的な部位として認識され得る。代替的に、いくつかの実施形態では、２つの鎖間の配列不一致の部位は、損傷または修飾されたヌクレオチド塩基が一方または両方の鎖に存在し、酵素プロセス（例えば、ＤＮＡポリメラーゼ、ＤＮＡグリコシラーゼ、または別の核酸修飾酵素、または化学プロセス）によって不一致に変換された潜在的な部位として認識され得る。いくつかの実施形態では、この後者の発見は、酵素プロセスまたは化学処理の前に核酸損傷またはヌクレオチド修飾の存在を推測するために使用できる。

図２は、本開示の特定の態様による、次世代シーケンス（ＮＧＳ）、一本鎖タグベースのエラー訂正、および二重鎖配列決定エラー訂正の分子集団におけるバリアント対立遺伝子頻度の関数として理論的な陽性的中率をプロットしたグラフである。図２を参照すると、陽性的中率（例えば、陽性コールの総数で割った正解陽性コールの期待数）は、次世代配列決定（ＮＧＳ）、一本鎖タグベースのエラー訂正、および特定されたエラー率のＤＳエラー訂正の分子集団におけるバリアント対立遺伝子頻度の関数としてプロットされている。曲線の重複でわかるように、検出されたバリアントの頻度が１０につき２つ以上の場合、どのメソッドを使用してもほぼ全ての変異コールが訂正される。しかしながら、標準的なイルミナシーケンスのエラー率および一本鎖タグベースのエラー訂正は、それぞれ、１００あたり約１および１，０００あたり１のバリアント頻度で陽性的中率に重大な損失をもたらす。ＤＳによって提供される非常に低いエラー率により、１００，０００あたり１未満のバリアントを確実に識別できる（点線）。

いくつかの実施形態では、および本技術の態様によると、本明細書で論じたＤＳのステップから生成された配列読取をさらにフィルタリングして、ＤＮＡ損傷分子（例えば、保管中、輸送中、または、組織もしくは血液の抽出後、ライブラリーの調製中または調製後など）からの配列決定読取を排除することができる。例えば、ウラシルＤＮＡグリコシラーゼ（ＵＤＧ）、ホルムアミドピリミジンＤＮＡグリコシラーゼ（ＦＰＧ）、および８－オキソグアニンＤＮＡグリコシラーゼ（ＯＧＧ１）などのＤＮＡ修復酵素を、ＤＮＡ損傷（例えば、インビトロＤＮＡ損傷またはインビボ損傷）を排除または訂正するのに利用することができる。例えば、これらのＤＮＡ修復酵素は、ＤＮＡから損傷した塩基を除去するグリコリアーゼである。例えば、ＵＤＧはシトシンの脱アミノ化（シトシンの自然加水分解により起こる）から生じるウラシルを除去し、ＦＰＧは８－オキソ－グアニン（例えば、活性酸素種に起因する一般的なＤＮＡ損傷）を除去する。ＦＰＧはまた、無塩基部位に１塩基のギャップを生じさせるリアーゼ活性をも有する。そのような脱塩基部位は、一般に、例えば、ポリメラーゼがテンプレートのコピーに失敗するため、ＰＣＲによる増幅が失敗する。したがって、このようなＤＮＡ損傷修復／除去酵素を使用すると、真の変異を持たない損傷ＤＮＡを効果的に除去できるが、そうでなければ、配列決定および二重鎖配列分析後にエラーとして検出されない。まれに塩基の損傷によるエラーはしばしばＤＳによって訂正されるが、理論的には両方の鎖の同一の位置で相補的なエラーが発生する可能性があるため、エラーが増加する損傷を減らすと、アーティファクトの可能性を減らすことができる。さらに、ライブラリーの調製中に、配列決定されるＤＮＡの特定のフラグメントは、その供給源または処理ステップ（例えば、機械的なＤＮＳせん断）から一本鎖になる場合がある。これらの領域は通常、当該技術分野で既知の「末端修復」ステップ中に二本鎖ＤＮＡに変換され、ＤＮＡポリメラーゼとヌクレオシド基質がＤＮＡ試料に添加され、５’陥凹末端が延長される。コピーされるＤＮＡの一本鎖部分のＤＮＡ損傷の変異部位（すなわち、ＤＮＡ二重鎖の片端もしくは両端の１本鎖５’突出または内部の一本鎖ニックもしくはギャップ）は、一本鎖変異、合成エラー、または核酸損傷部位を二本鎖の形に変換し得るフィルイン反応中にエラーを引き起こす可能性があり、実際にはそうではないときに、元の二本鎖核酸分子に真の変異が存在する真の変異として最終的な二重鎖コンセンサス配列で誤解される可能性がある。「偽二重鎖」と呼ばれるこのシナリオは、このような損傷を破壊／修復する酵素を使用することで軽減または防止できる。他の実施形態では、この発生は、元の二重鎖分子の一本鎖部分を破壊または防止する戦略の使用（例えば、元の二本鎖核酸材料の断片化に使用される、機械的せん断またはニックやギャップを残す可能性のある特定の他の酵素ではない特定の酵素の使用）により減少または排除することができる。他の実施形態では、元の二本鎖核酸の一本鎖部分を排除するプロセスの使用（例えば、Ｓ１ヌクレアーゼまたはマングビーンヌクレアーゼなどの一本鎖特異的ヌクレアーゼ）を同様の目的に利用することができる。

さらなる実施形態では、本明細書で論じされるＤＳのステップから生成された配列決定読取をさらにフィルタリングして、偽二重鎖アーティファクトに最もなりやすい読取の末端をトリミングすることにより、偽の変異を排除できる。例えば、ＤＮＡ断片化により、二本鎖分子の末端に一本鎖部分が生成されることがある。これらの一本鎖部分は、末端修復中に（例えば、クレノウまたはＴ４ポリメラーゼによって）満たすことができる。場合によっては、ポリメラーゼはこれらの末端修復領域でコピーミスを起こし、「擬似二重鎖分子」の生成をもたらす。ライブラリー調製のこれらのアーティファクトは、配列決定されると誤って真の変異であるように見える場合がある。末端修復メカニズムの結果としてのこれらのエラーは、配列決定読取の末端をトリミングして、リスクの高い領域で発生した可能性のある任意の変異を除外することにより、配列決定後の解析から排除または削減でき、これによって偽の変異の数を低減できる。一実施形態では、配列決定読取のそのようなトリミングは自動的に達成することができる（例えば、通常のプロセスのステップ）。別の実施形態では、断片末端領域について変異頻度を評価することができ、断片末端領域で変異の閾値レベルが観察される場合、ＤＮＡ断片の二本鎖コンセンサス配列読取を生成する前に、配列決定読取のトリミングを実行することができる。

ＤＳの鎖比較技術によって提供される高度なエラー訂正は、標準的な次世代配列決定法と比較して、二本鎖核酸分子の配列決定エラーを数桁低減する。このエラーの減少により、ほぼ全てのタイプの配列の配列決定の精確さが向上するが、特にエラーを起こしやすいことが当該技術分野でよく知られている生化学的に困難な配列に特に適している。そのようなタイプの配列の１つの非限定的な例は、ホモポリマーまたは他のマイクロサテライト／短いタンデムリピートである。ＤＳエラー訂正の恩恵を受けるエラーを起こしやすいシーケンスの別の非限定的な例は、例えば、加熱、放射線、機械的ストレス、または１つ以上のヌクレオチドポリメラーゼによるコピー中にエラーを起こしやすい化学付加物を作成する様々な化学物質暴露によって損傷した分子である。さらなる実施形態では、ＤＳは、二本鎖核酸分子の集団間の少数配列バリアントの精確な検出にも使用することができる。本出願の１つの非限定的な例は、対象内の非がん性組織からの多数の非変異分子の中で、がんに由来する少数のＤＮＡ分子の検出である。ＤＳによるまれなバリアント検出の別の非限定的な用途は、異なる遺伝子型の別の個体のＤＮＡと低濃度で混合された１人の個体からのＤＮＡの法医学検出である。

ＤＳは、ミトコンドリアＤＮＡおよび核ＤＮＡの増幅と配列決定／シーケンサーとの両方に由来するアーティファクトの除去に非常に成功することが示されている。しかしながら、特定の先行研究では、体細胞の点変異と小さな（例えば５ｂｐ未満の）挿入および欠失の検出に焦点が当てられていた。法医学分析に関連するいくつかの課題（例えば、ＰＣＲスタッターの除去、低レベルのＤＮＡ、混合された試料など）に対処する際に、ＤＳは法医学界に大きな期待を抱いている。例えば、図３Ａおよび３Ｂを参照すると、ＤＳは、標準的なＭＰＳと比較したときにＰＣＲスタッターを除去する能力を実証した。この例では、１０ｎｇのＰｒｏｍｅｇａ２８００Ｍ標準参照物質ＤＮＡからの３つの代表的なＣＯＤＩＳ座位を、３００ｂｐの対末端読取を備えたＩｌｌｕｍｉｎａＭｉＳｅｑプラットフォームで従来のＭＰＳ（図３Ａ）およびＤＳ（図３Ｂ）を使用して配列決定し、データをＳＴＲａｉｔ－ＲａｚｏｒＳＴＲ対立遺伝子呼び出しツールによって視覚化した。図３Ａは、３つのＣＯＤＩＳ座位のそれぞれのＣＯＤＩＳ遺伝子型対エラー訂正の非存在下の配列決定読取の数（例えば、従来のＭＰＳ）を示す３つのグラフを示し、いくつかのスタッター事象を示す（黒い矢印）。対照的に、図３Ｂに示すように、ＤＳは同一の３つのＣＯＤＩＳ座位のスタッター事象を排除した。同様の結果は、全ての元のＣＯＤＩＳ１３座位で見られる。したがって、ＤＳ技術の様々な態様は、法医学分析に関して従来の方法論が経験する制限のいくつかを克服することができる。法医学分析の他の態様は、ＤＳの他の用途に加えて、変換効率の様々な態様、またはエラーが訂正された配列データに変換されるインプットＤＮＡのパーセンテージの改善から恩恵を受け得る。法医学分析は、とりわけ、ヒトの犯罪、自然災害、大規模な死傷者の事件、動物または他の生命界の密猟、人身売買または誤用、ヒトまたは動物の遺体の同定、暴行の同定、行方不明者の同定、性的暴行の同定、古生物学的応用、および考古学的応用に関連する用途を指し得る。

ＤＳプロセスの効率に関して、２種類の効率、変換効率とワークフロー効率についてさらに詳しく説明する。ＤＳの効率を議論する目的のために、変換効率は、少なくとも１つの二重鎖コンセンサス配列読取が産生される配列決定ライブラリー調製反応にインプットされる固有の核酸分子の割合として定義することができる。ワークフロー効率は、デュプレックス配列決定ライブラリーを産生するためにこれらのステップを実行するため、および／または目的の配列の標的化濃縮を実行するために必要な時間、相対的なステップ数、および／または試薬／物質の財務コストの相対的な非効率性に関連し得る。

場合によっては、変換効率とワークフロー効率の制限のいずれかまたは両方が、その他では非常に適している一部の用途の高精度ＤＳの有用性を制限する場合がある。例えば、変換効率が低いと、標的二本鎖核酸のコピー数が制限される状況になり、産生される配列情報が望ましい量よりも少なくなる可能性がある。この概念の非限定的な例には、循環腫瘍細胞からのＤＮＡ、腫瘍由来の無細胞ＤＮＡ、または血漿などの体液に流されて他の組織からの過剰なＤＮＡと混ざり合った出生前の乳児が含まれる。ＤＳには通常、１０万を超える非変異分子の中から１つの変異分子を分離できる精確さがあるが、例えば試料中で１０，０００分子しか利用できない場合、およびこれらを二重鎖コンセンサス配列読取に変換する理想的な１００％の効率でも、測定できる最低の変異頻度は１／（１０，０００×１００％）＝１／１０，０００となる。臨床診断として、がんまたは治療に関連する変異の低レベルのシグナルを検出するための最大感度を有することが重要である可能性があり、したがって、比較的低い変換効率はこの文脈では望ましくないだろう。同様に、法医学用途では、しばしば、試験に使用できるＤＮＡがほとんどない。犯罪現場または自然災害の現場からナノグラムまたはピコグラムの量しか回収できず、複数の個体からのＤＮＡが混在している場合、混合物中の全ての個体のＤＮＡの存在を検出できるようにするには、変換効率を最大にすることが重要である。

場合によっては、特定の核酸検査用途でワークフローの非効率性が同様に困難になる可能性がある。これの１つの非限定的な例は、臨床微生物検査である。しばしば、１つ以上の感染性生物の性質を迅速に検出することが望ましく、例えば、微生物または多微生物性の血流感染は、いくつかの生物が、その生物が持つ固有の遺伝的変異に基づいて特定の抗生剤に耐性があるが、感染性生物を培養すること、および感染性生物の抗生剤感受性を経験的に決定することにかかる時間は、治療に使用する抗生剤について治療上の決定を下す必要がある時間よりもはるかに長い。血液（または他の感染した組織または体液）からのＤＮＡのＤＮＡ配列決定は、より迅速になる可能性があり、例えば、ＤＳは他の高精度配列決定方法の中でも特に、ＤＮＡシグネチャーに基づいて、感染集団の治療上重要な少数派バリアントを非常に精確に検出できる。データ生成までのワークフローの所要時間は、治療選択肢を決定するために重要である可能性があるため（例えば、本明細書で使用される例のように）、データ出力に到達する速度を上げる用途も望ましいであろう。

本明細書でさらに開示されるのは、標的化核酸配列の濃縮のための方法および組成物、ならびにコスト、配列決定された分子の変換、および標的化された超高精度配列決定のための標識分子を生成する時間効率の改善を提供するエラーが訂正された核酸配列決定用途のためのそのような濃縮の使用である。

ＳＰＬｉＴ－ＤＳ
いくつかの実施形態では、提供された方法は、エラー訂正のための分子バーコードの使用と互換性のあるＰＣＲベースの標的化濃縮戦略を提供する。図４は、本技術の一実施形態による、配列決定のためのリンクしたテンプレートの分離ＰＣＲ（「ＳＰＬｉＴ－ＤＳ」）方法のステップを利用する配列決定濃縮戦略の概念図である。図４を参照すると、および一実施形態では、ＳＰＬｉＴ－ＤＳアプローチは、上記と同様の方法で、および標準的なＤＳライブラリー構築プロトコールに関して（例えば、図１Ｂに示されているように）、分子バーコードによって断片化二本鎖核酸材料（例えば、ＤＮＡ試料から）を標識化（例えば、タグ付け）することで始めることができる。いくつかの実施形態では、二本鎖核酸材料は断片化されている場合がある（例えば、無細胞ＤＮＡ、損傷したＤＮＡなど）が、他の実施形態では、様々なステップは、超音波処理などの機械的せん断、または本明細書でさらに説明するような他のＤＮＡ切断方法を使用した核酸材料の断片化を含むことができる。断片化された二本鎖核酸材料の標識の態様には、特定の用途で必要な場合、末端修復および３’－ｄＡ－テーリングが含まれ、その後に二本鎖核酸断片とＳＭＩを含むＤＳアダプターがライゲーションされる（図４、ステップ１）。他の実施形態では、ＳＭＩは、元の核酸分子の両方の鎖からの情報を一意的に関連付けるための内因性または外因性および内因性配列の組み合わせであり得る。アダプター分子を二本鎖核酸材料にライゲーションした後、方法は増幅（例えば、ＰＣＲ増幅、ローリングサークル増幅、多置換増幅、等温増幅、ブリッジ増幅、表面結合増幅など）を続けることができる（図４、ステップ２）。

特定の実施形態では、例えば、１つ以上のアダプター配列に特異的なプライマーを使用して、核酸材料の各鎖を増幅し、元の二本鎖核酸分子の各鎖に由来する核酸増幅産物の複数コピーをもたらすことができ、各増幅産物は、元々関連付けられていたＳＭＩを保持している（図４、ステップ２）。増幅および反応副産物を除去するための関連ステップの後、試料を２つ以上の別々の試料（必須ではないが、好ましくは実質的に均等に）に分割することができる（例えば、チューブ中に、エマルション滴中に、マイクロチャンバー中に、表面上の孤立した液滴に、または「チューブ」と総称される他の既知の容器に）（図４、ステップ３）。代替的に、増幅の増幅産物は、例えば、マイクロビーズに結合した後、マイクロビーズの集団を２つのチャンバーに分割するか、または分割した増幅産物を表面上の２つ以上の異なる物理的位置に固定するなど、溶液中に存在する必要のない方法で分割することができる。本明細書では、これらの後者の分割された集団のいずれかを機能的に同等であり、別個の「チューブ」にあるのと同様に称する。図４に示される例では、このステップにより、各チューブで見られる任意の所与の鎖／バーコード増幅産物のコピーの半分の平均が得られる。元の試料が２つを超える別々の試料に分割される他の実施形態では、そのような核酸材料の割り当てにより、増幅産物の数が比較的同等に減少する。増幅産物が分割されるランダムな性質により、この平均に関する分散が生じることに注意されたい。この分散を考慮するために、超幾何分布（つまり、置換なしでｋ個のバーコードコピーを選択する確率）をモデルとして使用して、ＳＭＩ（例えば、バーコード）の増幅産物（例えば、ＰＣＲコピー）の最小数を決定でき、これは、各チューブが両方の鎖に由来する少なくとも１つのコピーを含む可能性を最大化するために必要である。特定の理論に固執することを望まずに、ステップ２で４サイクル以上のＰＣＲサイクル（つまり、２⁴＝１６コピー／バーコード）により、各鎖に由来する各バーコードコピーが各チューブに少なくとも１回表れる確率が、９９％を超えることが想定される。いくつかの実施形態では、増幅産物を不均一に分割することが好ましい場合がある。核酸材料が２つを超えるチューブに分割される場合、追加の増幅サイクルを使用して、追加のコピーを生成し、さらなる分割に対応することができる。試料を２つのチューブに分割した後、アダプター配列に特異的なプライマーおよび目的の標的核酸領域に特異的なプライマーを使用して、マルチプレックスＰＣＲで標的核酸領域（例えば、目的の領域、座位など）を濃縮できる（図４、ステップ３）。別の実施形態では、目的の標的領域の指数関数的増幅を可能にする第２のプライマーの後続の追加の前に線形増幅ステップを追加することができる。

特定の実施形態では、マルチプレックス標的特異的ＰＣＲは、各チューブで得られるＰＣＲ産物が２本の鎖のうちの１本のみ（例えば、「トップ鎖」または「ボトム鎖」）に由来するように行われる。図４（ステップ３）に示すように、いくつかの実施形態では、これは以下のように達成される：第１のチューブ（左側に表示）に、アダプター配列（図４、ステップ３、灰色の矢印）の「読取１」（例えば、ＩｌｌｕｍｉｎａＰ５）に少なくとも部分的に相補的なプライマー、および目的の核酸領域に少なくとも部分的に相補的であり「読取２」（すなわち、ＩｌｌｕｍｉｎａＰ７、灰色のテールを持つ黒い矢印）アダプター配列を含むプライマーが、元の核酸分子の「トップ鎖」を特異的に増幅（例えば、濃縮）するのに使用される（図４、ステップ３および４）。この第１の試料では、ＳＤＥの性質（例えば、この場合、標的核酸インサートに対する固有のアダプター配列の向き）のため、「ボトム鎖」は適切に増幅しない。同様に、第２のチューブ（左側に表示）に、アダプター配列（図４、ステップ３、灰色の矢印）の「読取２」に少なくとも部分的に相補的なプライマー（例えば、ＩｌｌｕｍｉｎａＰ５）、および目的の核酸領域に少なくとも部分的に相補的であり「読取１」アダプター配列を含むプライマー（すなわち、ＩｌｌｕｍｉｎａＰ７、灰色の尾を持つ黒い矢印）が、元の核酸分子の「ボトム鎖」を特異的に増幅（例えば、濃縮）するのに使用される（図４、ステップ３および４）。この第２の試料では、「トップ鎖」が適切に増幅しない。ＰＣＲまたは他の増幅方法に続いて、「トップ鎖」の複数のコピーが第１のチューブで生成され、「ボトム鎖」の複数のコピーが第２のチューブで生成される。これらの得られた標的特異的なコピーの各々は、核酸増幅産物の各末端で利用可能な両方のアダプター配列を有するため（例えば、ＩｌｌｕｍｉｎａＰ５およびＩｌｌｕｍｉｎａＰ７アダプター配列）、これらの標的濃縮産物は標準的なＭＰＳ法を使用して配列決定できる。

図５は、図４に関して示され議論されたＳＰＬｉＴ－ＤＳ法のステップの概念図であり、本技術の実施形態によるＰＣＲ濃縮標的領域の複数のコピーを配列決定し、二重コンセンサス配列を生成するステップをさらに示す。第１のチューブからの「トップ鎖」の複数のコピーと第２のチューブからの「ボトム鎖」の複数のコピーの配列決定に続いて、シーケンスデータはＤＳと同様のアプローチで分析でき、これによって元の二本鎖標的核酸分子の「トップ」または「ボトム」の鎖に由来する同一の分子バーコードを共有する配列読取（それぞれ、第１のチューブと第２のチューブに見られる）は別々にグループ化される。いくつかの実施形態では、「トップ鎖」からのグループ化された配列読取は、トップ鎖コンセンサス配列（例えば、一本鎖コンセンサス配列（ＳＳＣＳ））を形成するために使用され、「ボトム鎖」からのグループされた配列読取は、ボトム鎖コンセンサス配列（例えば、ＳＳＣＳ）を形成するために使用される。図５を参照すると、トップとボトムのＳＳＣＳを比較して、２つの鎖間で一致するヌクレオチドを有する二重鎖コンセンサス配列（ＤＣＳ）を生成することができる（例えば、バリアントまたは変異は、療法の鎖に由来する配列決定読取に現れる場合に真とみなされる）（例えば、図１Ｃを参照されたい）。

具体的な例として、いくつかの実施形態では、本明細書で提供されるのは、二本鎖標的核酸材料を少なくとも１つのアダプター配列にライゲートしてアダプター標的核酸材料複合体を形成するステップを含む二本鎖標的核酸材料のエラーが訂正された配列読取を生成する方法であって、少なくとも１つのアダプター配列は、（ａ）二本鎖標的核酸材料の各々の分子を一意的に標識する縮重または半縮重単一分子識別子（ＳＭＩ）配列、ならびに（ｂ）アダプター－標的核酸材料複合体の第１の鎖にタグ付けする第１のヌクレオチドアダプター配列、およびアダプター－標的核酸材料複合体の第２の鎖にタグ付けする第１のヌクレオチド配列に少なくとも部分的に非相補的である第２のヌクレオチドアダプター配列を含み、アダプター－標的核酸材料服が応対の各鎖がその相補的な鎖に対して明確に同定可能なヌクレオチド配列を有するようにされる、方法である。この方法は次に、アダプター－標的核酸材料複合体の各鎖を増幅して複数の第１の鎖アダプター－標的核酸複合体増幅産物および複数の第２の鎖鎖アダプター－標的核酸複合体増幅産物を産生するステップと、アダプター－標的核酸複合体増幅産物を第１の試料と第２の試料に分離するステップと、を含み得る。この方法は、第１のヌクレオチドアダプター配列に少なくとも部分的に相補的な第１のプライマーおよび目的の標的配列に少なくとも部分的に相補的なプライマーを使用して、第１の試料中の第１の鎖を増幅して第１の核酸産物をもたらすステップと、第２のヌクレオチドアダプター配列に少なくとも部分的に相補的な第２のプライマーおよび目的の標的配列に少なくとも部分的に相補的なプライマーを使用して、第２の試料中の第２の鎖を増幅して第２の核酸産物をもたらすステップと、をさらに含み得る。この方法はまた、第１の核酸産物および第２の核酸産物のそれぞれを配列決定して複数の第１の鎖配列読取および複数の第２の鎖配列読取を産生するステップと、少なくとも１つの第１の鎖配列読取および少なくとも１つの第２の鎖配列読取の存在を確認するステップと、を含み得る。この方法は、少なくとも１つの第１の鎖配列読取を少なくとも１つの第２の鎖は利悦読取と比較することと、一致しないヌクレオチド位置を無視することによって、または代替的に、比較された第１および第２の鎖配列読取が非相補的である１つ以上のヌクレオチド位置を有する比較された第１および第２の鎖配列読取を除去することによって、二本鎖標的核酸材料のエラーが訂正された配列読取を生成するステップと、さらに含み得る。

さらなる具体的な例として、いくつかの実施形態では、本明細書で提供されるのは、試料からＤＮＡバリアントを同定する方法であって、核酸材料（例えば、二本鎖標的ＤＮＡ分子）の療法の鎖を、少なくとも１つの非対称のアダプター分子とライゲートして、二本鎖標的ＤＮＡ分子のトップ鎖と関連する第１のヌクレオチド配列および第１のヌクレオチド配列に少なくとも部分的に非相補的であり、二本鎖標的ＤＮＡ分子のボトム鎖と関連する第２のヌクレオチド配列を有するアダプター－標的核酸材料複合体を形成するステップと、アダプター－標的核酸材料の各鎖を増幅して、異なるが、なおも関連する増幅されたアダプター－標的ＤＮＡ産物のセットを生成する各鎖を得るステップと、を含む方法である。この方法はまた、アダプター－標的ＤＮＡ産物を第１の試料と第２の試料に分離するステップと、第１のヌクレオチド配列に特異的（例えば、少なくとも部分的に相補的）なプライマーおよび目的の標的配列に少なくとも部分的に相補的なプライマーを使用して第１の試料中のアダプター－標的ＤＮＡ産物のトップ鎖を増幅して、トップ鎖アダプター－標的核酸複合体増幅産物をもたらすステップと、第２のヌクレオチド配列に特異的（例えば、少なくとも部分的に相補的）な第２のプライマーおよび第２のプライマーを使用して、第２の試料中のボトム鎖を増幅して、ボトム鎖アダプター－標的核酸複合体増幅産物をもたらすステップと、を含み得る。この方法は、トップ鎖アダプター－標的核酸複合体増幅産物とボトム鎖アダプター－標的核酸複合体増幅産物の各々を配列決定するステップと、アダプター－標的ＤＮＡ複合体の各鎖からの少なくとも１つの増幅された配列読取の存在を確認するステップと、トップ鎖から得られた少なくとも１つの増幅された配列読取をボトム鎖から得られた少なくとも１つの増幅された配列読取とを比較して核酸材料（例えば、二本鎖標的ＤＮＡ分子）の両方の鎖の配列が一致しているヌクレオチド塩基のみを有する核酸材料（例えば、二本鎖標的ＤＮＡ分子）のコンセンサス配列読取を形成するステップと、をさらに含み得、コンセンサス配列読取の特定の位置に起こるバリアントが真のＤＮＡバリアントとして同定されるようにする。

いくつかの実施形態では、本明細書で提供されるのは、二本鎖核酸材料からエラー訂正二本鎖コンセンサス配列を生成する方法であって、個々の二重鎖ＤＮＡ分子をアダプター分子でタグ付けしてタグ付けされたＤＮＡ物質を形成するステップであって、各アダプター分子は、（ａ）二重鎖ＤＮＡ分子を一意的に標識する縮重または半縮重の単一分子識別子（ＳＭＩ）、および（ｂ）タグ付けされたＤＮＡ分子ごとに、タグ付けされたＤＮＡ物質内の個々のＤＮＡ分子の元のトップ鎖を元のボトム鎖と区別する第１および第２の非相補的ヌクレオチドアダプター配列を含む、ステップと、タグ付けされたＤＮＡ分子の元のトップ鎖の複製のセット、およびタグ付けされたＤＮＡ分子の元のボトム鎖の複製のセットを生成して、増幅されたＤＮＡ物質を形成するステップと、を含む方法である。この方法はまた、増幅されたＤＮＡ物質を第１の試料と第２の試料に分離するステップと、第１のヌクレオチドアダプター配列に特異的なプライマーおよび目的の標的配列に少なくとも部分的に相補的なプライマーを使用して第１の試料中の元のトップ鎖のさらなる複製を生成して第１の核酸産物をもたらすステップと、第２のヌクレオチドアダプター配列（同一または異なる）に特異的なプライマーおよび目的の標的配列に少なくとも部分的の相補的なプライマーを使用して第２の試料中の元のボトム鎖のさらなる複製を生成して第２の核酸産物をもたらすステップと、を含み得る。この方法は、元のトップ鎖のさらなる複製から第１の一本鎖コンセンサス配列（ＳＳＣＳ）を作成し、元のボトム鎖のさらなる複製から第２の一本鎖コンセンサス配列（ＳＳＣＳ）を作成するステップと、元のトップ鎖の第１のＳＳＣＳを元のボトム鎖の第２のＳＳＣＳと比較するステップと、元のトップ鎖の第１のＳＳＣＳと元のボトム鎖の第２のＳＳＣＳの両方の配列が相補的であるヌクレオチド塩基のみを有するエラーが訂正された二本鎖コンセンサス配列を生成するステップと、をさらに含み得る。

単一分子識別子配列（ＳＭＩｓ）
様々な実施形態によれば、提供される方法および組成物は、核酸材料の各鎖上に１つ以上のＳＭＩ配列を含む。ＳＭＩは、二本鎖核酸分子から生じる一本鎖の各々によって独立して運ぶことができ、配列決定後に、各鎖の誘導体増幅産物が同一の元の実質的に固有の二本鎖核酸分子に由来するものとして認識できる。いくつかの実施形態では、ＳＭＩは追加の情報を含むことができ、および／または当業者によって理解されるような分子識別機能が有用な他の方法で使用することができる。いくつかの実施形態では、ＳＭＩ要素は、核酸材料へのアダプター配列ライゲーションの前、実質的に同時に、または後に組み込むことができる。

いくつかの実施形態では、ＳＭＩ配列には少なくとも１つの縮重または半縮重核酸が含まれ得る。他の実施形態では、ＳＭＩ配列は非縮重であり得る。いくつかの実施形態では、ＳＭＩは、核酸分子のフラグメント末端に関連するかまたはそれに近い配列（例えば、ライゲートされた核酸材料のランダムまたは半ランダムにせん断された末端）であり得る。いくつかの実施形態では、外因性配列は、例えば、互いからの単一ＤＮＡ分子を区別することのできるようなＳＭＩ配列を得るために、ライゲートされた核酸材料（例えば、ＤＮＡ）のランダムまたは半ランダムにせん断された末端に対応する配列と併せて考慮され得る。いくつかの実施形態では、ＳＭＩ配列は、二本鎖核酸分子にライゲートされるアダプター配列の一部である。特定の実施形態では、ＳＭＩ配列を含むアダプター配列は二本鎖であり、二本鎖核酸分子の各鎖は、アダプター配列へのライゲーション後にＳＭＩを含む。別の実施形態では、ＳＭＩ配列は、二本鎖核酸分子へのライゲーションの前後に一本鎖であり、相補的ＳＭＩ配列は、ＤＮＡポリメラーゼで反対側の鎖を伸長することによって相補的二本鎖ＳＭＩ配列をもたらすことにより生成できる。いくつかの実施形態では、各ＳＭＩ配列には約１～約３０の核酸（例えば、１、２、３、４、５、８、１０、１２、１４、１６、１８、２０、またはそれ以上の縮重または半縮重核酸）が含まれる。

いくつかの実施形態では、ＳＭＩは、核酸材料とアダプター配列の一方または両方にライゲートできる。いくつかの実施形態では、ＳＭＩは、核酸材料のＴ突出、Ａ突出、ＣＧ突出、脱ヒドロキシル化塩基、および平滑末端のうちの少なくとも１つにライゲートできる。

いくつかの実施形態では、ＳＭＩの配列は、例えば、核酸材料（例えば、ライゲートされた核酸材料）のランダムまたは半ランダムにせん断された末端に対応する配列と合わせて考慮され（またはそれに従って設計され）得、単一の核酸分子を互いに区別できるＳＭＩ配列を得る。

いくつかの実施形態では、少なくとも１つのＳＭＩは内因性ＳＭＩであり得る（例えば、せん断点に関連するＳＭＩ、例えばせん断点自体を使用するか、またはせん断点に直接隣接した［例えば、せん断点から２、３、４、５、６、７、８、９、１０ヌクレオチド］核酸材料中のヌクレオチドの定義された数を使用する）。いくつかの実施形態では、少なくとも１つのＳＭＩは外因性ＳＭＩ（例えば、標的核酸材料に見られない配列を含むＳＭＩ）であり得る。

いくつかの実施形態では、ＳＭＩは、イメージング部分（例えば、蛍光または他の光学的に検出可能な部分）であり得るか、またはそれを含み得る。いくつかの実施形態では、そのようなＳＭＩは、増幅ステップを必要とせずに検出および／または定量化を可能にする。

一部の実施形態では、ＳＭＩ要素は、アダプター－標的核酸複合体上の異なる位置に位置する２つ以上の別個のＳＭＩ要素を含み得る。

ＳＭＩの様々な実施形態は、国際特許公開第ＷＯ２０１７／１００４４１号にさらに開示されており、その全体が参照により本明細書に組み込まれる。

鎖定義要素（ＳＤＥ）：
いくつかの実施形態では、二本鎖核酸材料の各鎖は、標的二本鎖核酸材料を形成する２つの一本鎖核酸の増幅産物を、配列決定後に互いに実質的に区別可能にする要素をさらに含み得る。いくつかの実施形態では、ＳＤＥは、配列決定アダプター内に含まれる非対称プライマー部位であり得るか、それを含み得、または他の配置では、少なくとも１つの位置がプライマー配列内ではなくアダプター配列に導入され得、第１の鎖の標的核酸配列複合体の標的核酸配列複合体の第２の鎖のヌクレオチド配列中の少なくとも１つの位置が、増幅および配列決定後に互いに異なるようにされる。他の実施形態では、ＳＤＥは、標準的なヌクレオチド配列Ａ、Ｔ、Ｃ、ＧまたはＵとは異なるが、２つの増幅および配列決定された分子における少なくとも１つの標準的なヌクレオチド配列の差に変換される２つの鎖間の別の生化学的非対称性を含み得る。さらに別の実施形態では、ＳＤＥは、増幅前に２本の鎖を物理的に分離する手段であり得るか、または含み得、第１の鎖標的核酸配列および第２の鎖標的核酸配列からの誘導体増幅産物は、２つの誘導体増幅産物間の区別を維持するために互いに実質的な物理的分離中に維持される。第１および第２の鎖を区別することを可能にするＳＤＥ機能を提供するための他のそのような配置または方法論が利用されてもよい。

いくつかの実施形態では、ＳＤＥはループ（例えば、ヘアピンループ）を形成し得る。いくつかの実施形態では、ループは少なくとも１つのエンドヌクレアーゼ認識部位を含んでもよい。いくつかの実施形態では、標的核酸複合体は、ループ内の切断事象を促進するエンドヌクレアーゼ認識部位を含み得る。いくつかの実施形態では、ループは非標準的なヌクレオチド配列を含んでもよい。いくつかの実施形態では、含まれる非標準的なヌクレオチドは、鎖切断を促進する１つ以上の酵素によって認識可能であってもよい。いくつかの実施形態では、含まれる非標準的なヌクレオチドは、ループ内の鎖切断を促進する１つ以上の化学プロセスによって標的化され得る。いくつかの実施形態では、ループは、ループ内の鎖切断を促進する１つ以上の酵素的、化学的、または物理的プロセスによって標的化され得る修飾核酸リンカーを含み得る。いくつかの実施形態では、この修飾リンカーは光切断可能なリンカーである。

他の様々な分子ツールがＳＭＩおよびＳＤＥとして機能し得る。せん断点およびＤＮＡベースのタグ以外に、ペア鎖を物理的に近接させる単一分子区画化法または他の非核酸タグ付け法は、鎖関連機能に役立ち得る。同様に、物理的に分離することができるようなアダプター鎖の非対称化学標識は、ＳＤＥの役割を果たし得る。最近説明されたＤＳの改変では、重亜硫酸塩変換を使用して、シトシンのメチル化の形での天然に存在する鎖の非対称性を、２つの鎖を区別する配列の相違に変換する。この組み込みは検出できる変異のタイプを制限するが、天然の非対称性を利用するという概念は、修飾ヌクレオチドを直接検出できる新しい配列決定の技術の文脈では注目に値する。ＳＤＥの様々な実施形態は、国際特許公開第ＷＯ２０１７／１００４４１号にさらに開示されており、その全体が参照により組み込まれる。

アダプターおよびアダプター配列
様々な配置において、ＳＭＩ（例えば、分子バーコード）、ＳＤＥ、プライマー部位、フローセル配列、および／または他の特徴を含むアダプター分子は、本明細書に開示される多くの実施形態での使用が企図される。いくつかの実施形態では、提供されるアダプターは、以下の特性の少なくとも１つを有するＰＣＲプライマーに相補的または少なくとも部分的に相補的な１つ以上の配列（例えば、プライマー部位）であり得るか、それらを含み得る：１）高い標的特異性、２）多重化できる、３）堅牢で最小限にバイアスのある増幅を示す。

いくつかの実施形態では、アダプター分子は、「Ｙ字型」、「Ｕ字型」、「ヘアピン」型であり得、バブル（例えば、非相補的である配列の一部）、またはその他の特徴を有し得る。他の実施形態では、アダプター分子は、「Ｙ」字型、「Ｕ」字型、「ヘアピン」形状、またはバブルを含むことができる。特定のアダプターは、修飾または非標準のヌクレオチド、制限部位、またはインビトロでの構造または機能の操作のための他の特徴を含み得る。アダプター分子は、末端を有する様々な核酸材料にライゲートし得る。例えば、アダプター分子は、核酸材料のＴ突出、Ａ突出、ＣＧ突出、複数ヌクレオチドの突出、脱ヒドロキシル化塩基、および平滑末端にライゲートするのに適切であり得、分子の末端は標的の５’であり、脱リン酸化されるか、そうでなければ従来のライゲーションから保護される。他の実施形態では、アダプター分子は、ライゲーション部位の５’鎖上に脱リン酸化またはそうでなければライゲーション防止修飾を含むことができる。後者の２つの実施形態では、そのような戦略は、ライブラリー断片またはアダプター分子の二量体化を防ぐのに有用であり得る。

アダプター配列は、一本鎖配列、二本鎖配列、相補配列、非相補配列、部分相補配列、非対称配列、プライマー結合配列、フローセル配列、ライゲーション配列、またはアダプター分子によって提供される他の配列を意味し得る。特定の実施形態では、アダプター配列は、オリゴヌクレオチドに対する相補体として増幅に使用される配列を意味し得る。

いくつかの実施形態では、提供される方法および組成物には、少なくとも１つのアダプター配列が含まれる（例えば、核酸材料の５’および３’の各末端に１つずつの２つのアダプター配列）。いくつかの実施形態では、提供される方法および組成物は、２つ以上（例えば、３、４、５、６、７、８、９、１０またはそれ以上）のアダプター配列を含んでもよい。いくつかの実施形態では、アダプター配列の少なくとも２つが互いに（例えば、配列ごとに）異なる。いくつかの実施形態では、各アダプター配列は他のアダプター配列とは（例えば、配列ごとに）異なる。いくつかの実施形態では、少なくとも１つのアダプター配列は、少なくとも１つの他のアダプター配列の少なくとも一部に対して少なくとも部分的に非相補的である（例えば、少なくとも１つのヌクレオチドで非相補的である）。

いくつかの実施形態では、アダプター配列は少なくとも１つの非標準ヌクレオチドを含む。いくつかの実施形態では、非標準ヌクレオチドは、脱塩基部位、ウラシル、テトラヒドロフラン、８－オキソ－７，８－ジヒドロ－２’デオキシアデノシン（８－オキソ－Ａ）、８－オキソ－７，８－ジヒドロ－２’－デオキシグアノシン（８－オキソ－Ｇ）、デオキシイノシン、５’ニトロインドール、５－ヒドロキシジエチル－２’－デオキシシチジン、イソシトシン、５’－メチルイソシトシン、またはイソグアノシン、メチル化ヌクレオチド、ＲＮＡヌクレオチド、リボースヌクレオチド、８－オキソ－グアニン、光切断可能なリンカー、ビオチン化ヌクレオチド、デスチオビオチンヌクレオチド、チオール修飾ヌクレオチド、アクリダイト修飾ヌクレオチドｉｓｏ－ｄＣ、ｉｓｏｄＧ、２’－Ｏ－メチルヌクレオチド、イノシンヌクレオチドロックド核酸、ペプチド核酸、５メチルｄＣ、５－ブロモデオキシウリジン、２，６－ジアミノプリン、２－アミノプリンヌクレオチド、脱塩基ヌクレオチド、５－ニトロインドールヌクレオチド、アデニル化ヌクレオチド、アジドヌクレオチド、ジゴキシゲニンヌクレオチド、Ｉリンカー、５’ヘキシニル修飾ヌクレオチド、５－オクタジイニルｄＵ、光開裂性スペーサー、非光開裂性スペーサー、クリックケミストリー対応の修飾ヌクレオチド、およびそれらの任意の組み合わせから選択される。

いくつかの実施形態では、アダプター配列は、磁気特性を有する部分（すなわち、磁気部分）を含む。いくつかの実施形態では、この磁気特性は常磁性である。アダプター配列が磁気部分（例えば、磁気部分を含むアダプター配列にライゲートされた核酸材料）を含むいくつかの実施形態では、磁場が適用されると、磁気部分を含むアダプター配列は、磁気部分を含まないアダプター部分（例えば、磁気部分を含まないアダプター配列にライゲートされた核酸材料）から実質的に分離される。

いくつかの実施形態では、少なくとも１つのアダプター配列がＳＭＩの５’に位置している。いくつかの実施形態では、少なくとも１つのアダプター配列がＳＭＩの３’に位置している。

いくつかの実施形態では、アダプター配列は、１つ以上のリンカードメインを介してＳＭＩおよび核酸材料のうちの少なくとも１つに連結され得る。いくつかの実施形態では、リンカードメインはヌクレオチドで構成されていてもよい。いくつかの実施形態では、リンカードメインには、（例えば、この開示のいずこかで説明されているように）少なくとも１つの修飾ヌクレオチドまたは非ヌクレオチド分子が含まれ得る。いくつかの実施形態では、リンカードメインはループであり得るか、ループを含み得る。

いくつかの実施形態では、二本鎖核酸材料の各鎖の片端または両端のアダプター配列は、ＳＤＥをもたらす１つ以上の要素をさらに含んでもよい。いくつかの実施形態では、ＳＤＥは、アダプター配列内に含まれる非対称プライマー部位であり得るか、またはそれを含み得る。

いくつかの実施形態では、アダプター配列は、少なくとも１つのＳＤＥおよび少なくとも１つのライゲーションドメイン（すなわち、少なくとも１つのリガーゼの活性に修正可能なドメイン、例えば、リガーゼの活性による核酸材料へのライゲートに適したドメイン）であり得るか、または含み得る。いくつかの実施形態では、アダプター配列は、５’～３’に向かって、プライマー結合部位、ＳＤＥ、およびライゲーションドメインであり得るか、それを含み得る。

ＤＳアダプターを合成するための様々な方法は、例えば、米国特許第９，７５２，１８８号および国際特許公開第ＷＯ２０１７／１００４４１号に以前に記載されており、これらは両方ともそれらの全体が参照により本明細書に組み込まれる。

プライマー
いくつかの実施形態では、以下の特性の少なくとも１つを有する１つ以上のＰＣＲプライマー：１）高い標的特異性、２）多重化できる、３）堅牢で最小限にバイアスのある増幅を示すが、本技術の態様による、様々な実施形態での使用に企図される。多くの先行研究および市販製品は、従来のＰＣＲ－ＣＥのこれらの基準のいくつかを満たすプライマー混合物を設計した。しかしながら、これらのプライマー混合物は、ＭＰＳでの使用に必ずしも最適ではないことに留意されたい。実際、高度に多重化されたプライマー混合物の開発は、困難で時間のかかるプロセスである。便利なことに、ＩｌｌｕｍｉｎａとＰｒｏｍｅｇａの両方が、Ｉｌｌｕｍｉｎａプラットフォーム用のマルチプレックス適合プライマー混合物を最近開発し、様々な標準および非標準のＳＴＲおよびＳＮＰ遺伝子座の堅牢かつ効率的な増幅を示している。これらのキットは、配列決定の前にＰＣＲを使用して標的領域を増幅するため、ペアエンド配列データの各読取の５’末端は、ＤＮＡの増幅に使用されるＰＣＲプライマーの５’末端に対応する。いくつかの実施形態では、提供される方法および組成物には、均一な増幅を保証するために設計されたプライマーが含まれ、これには、様々な反応濃度、融解温度、二次構造、およびプライマー内／プライマー間相互作用の最小化が必要になる場合がある。ＭＰＳ用途のための高度に多重化されたプライマー最適化のための多数の技術が説明されている。特に、これらの技術は、当該技術分野でよく説明されているように、ａｍｐｌｉｓｅｑ法としてしばしば知られている。

増幅
提供される方法および組成物は、様々な実施形態において、核酸材料（またはその一部、例えば特定の標的領域または座位）が増幅されて増幅された核酸材料（例えば、いくつかの数の増幅産物）を形成する少なくとも１つの増幅ステップを使用するか、またはその使用である。いくつかの実施形態では、提供される方法には、増幅された核酸材料を、例えば、第１および第２の試料に分離するステップが含まれる。

いくつかの実施形態では、第１の試料中の核酸材料を増幅することは、第１のアダプター配列中に存在する配列に少なくとも部分的に相補的である少なくとも１つの一本鎖オリゴヌクレオチドと目的の標的配列に少なくとも部分的に相補的である少なくとも１つの一本鎖オリゴヌクレオチドとを使用して、ＳＭＩ配列が少なくとも部分的に維持されるように、元の二本鎖核酸材料からの単一の核酸鎖に由来する核酸材料を増幅するステップを含む。

いくつかの実施形態では、第２の試料中の核酸材料を増幅することは、第２のアダプター配列中に存在する配列に少なくとも部分的に相補的である少なくとも１つの一本鎖オリゴヌクレオチドと目的の標的配列に少なくとも部分的に相補的である少なくとも１つの一本鎖オリゴヌクレオチドとを使用して、ＳＭＩ配列が少なくとも部分的に維持されるように、元の二本鎖核酸材料からの単一の核酸鎖に由来する核酸材料を増幅するステップを含む。

いくつかの実施形態では、増幅された核酸材料は、第２の増幅ステップの前に、３つ以上の試料（例えば、４、５、６、７、８、９、２０、２０、３０、４０、５０またはそれ以上の試料）に分離され得る。いくつかの実施形態では、各試料には、互いの試料で、ほぼ同一の量の増幅された核酸材料が含まれている。いくつかの実施形態では、少なくとも２つの試料には、実質的に異なる量の増幅された核酸材料が含まれている。

いくつかの実施形態では、第１の試料または第２の試料の核酸材料を増幅することには、「チューブ」（例えば、ＰＣＲチューブ）、エマルション滴、マイクロチャンバー、および上記の他の例または他の既知の容器内の試料を増幅することが含まれる。

いくつかの実施形態では、少なくとも１つの増幅ステップは、少なくとも１つの非標準ヌクレオチドであるかまたはそれを含む少なくとも１つのプライマーを含む。いくつかの実施形態では、非標準ヌクレオチドは、ウラシル、メチル化ヌクレオチド、ＲＮＡヌクレオチド、リボースヌクレオチド、８－オキソ－グアニン、ビオチン化ヌクレオチド、ロックド核酸、ペプチド核酸、高Ｔｍ核酸バリアント、対立遺伝子識別核酸バリアント、本明細書のいずこかに記載されている他のヌクレオチドまたはリンカーバリアント、およびそれらの任意の組み合わせから選択される。

用途に適した任意の増幅反応はいくつかの実施形態に適合すると考えられるが、特定の例として、いくつかの実施形態では、増幅するステップは、ポリメラーゼ連鎖反応（ＰＣＲ）、ローリングサークル増幅（ＲＣＡ）、多置換増幅（ＭＤＡ）、等温増幅、エマルション内のポロニー増幅、表面、ビーズの表面またはヒドロゲル内部のブリッジ増幅、およびそれらの任意の組み合わせであり得るか、またはそれを含み得る。

いくつかの実施形態では、核酸材料の試料の一部（例えば、アダプター配列）に特定の修飾がなされ得る。例として、いくつかの実施形態では、第１の試料中の核酸材料を増幅することは、分離するステップの後、および第１の試料を増幅することの前に、核酸材料上に見られる第２のアダプター配列の一部または全てを破壊または崩壊することをさらに含み得る。さらなる特定の例として、いくつかの実施形態では、第２の試料中の核酸材料を増幅することは、分離するステップの後、および第２の試料を増幅することの前に、核酸材料上に見られる第１のアダプター配列の少なくとも一部を破壊または崩壊することをさらに含み得る。いくつかの実施形態では、破壊または崩壊することが、酵素消化（例えば、エンドヌクレアーゼおよび／またはエクソヌクレアーゼによる）、少なくとも１つの複製阻害分子の含有、酵素的切断、一方の鎖の酵素的切断、両方の鎖の酵素的切断、切断または一方もしくは両方の鎖をもたらす酵素処理が後に続く修飾された核酸の取り込み、複製阻止ヌクレオチドの組み込み、連鎖停止剤の組み込み、光切断可能なリンカーの取り込み、ウラシルの取り込み、リボース塩基の取り込み、８－オキソ－グアニン付加物の組み込み、配列特異的制限エンドヌクレアーゼの使用、標的化エンドヌクレアーゼの使用、およびそれらの任意の組み合わせの少なくとも１つであり得るか、またはそれを含み得る。いくつかの実施形態では、プライマー部位破壊または崩壊に加えて、またはその代替として、親和性プルダウン、サイズ選択、または試料から望ましくない核酸材料を除去および／または増幅しない他の既知の技術などの方法が考えられる。

いくつかの実施形態では、少なくとも部分的な破壊の標的とする望ましくない第１の増幅産物は、２つの別個のプライマー結合部位ではなく分子の各末端に２つの類似のプライマー結合部位を最終的に含む標的化プライマーによる第２の増幅に続く第２の増幅産物をもたらす。いくつかの実施形態では、そのような構造は、ＭＰＳＤＮＡ配列の性能または効率にとって問題となり得る。

いくつかの実施形態では、核酸材料を増幅することが、目的の標的領域または標的配列（例えば、ゲノム配列、ミトコンドリア配列、プラスミド配列、合成的に産生された標的核酸など）に少なくとも部分的に相補的な一本鎖オリゴヌクレオチド、およびアダプター配列（例えば、プライマー部位）の領域に少なくとも部分的に相補的な少なくとも１つの一本鎖オリゴヌクレオチドの使用を含む。いくつかの実施形態では、核酸材料を増幅することは、核酸材料の各鎖の５’および３’末端のアダプター配列の領域に少なくとも部分的に相補的な一本鎖オリゴヌクレオチドの使用を含む。

一般に、例えばＰＣＲ増幅のような堅牢な増幅は、反応条件に大きく依存する。例えば、マルチプレックスＰＣＲは、緩衝剤組成、１価または２価のカチオン濃度、界面活性剤濃度、密集剤（すなわち、ＰＥＧ、グリセロールなど）濃度、プライマー濃度、プライマーＴｍ、プライマー設計、プライマーＧＣ含有量、プライマー修飾ヌクレオチドの特性、およびサイクル条件（すなわち、温度と伸長時間、および温度変化率）に影響されやすい。緩衝剤条件の最適化は、困難で時間のかかるプロセスであり得る。いくつかの実施形態では、増幅反応では、以前に既知の増幅プロトコールに従って、緩衝剤、プライマープール濃度、ＰＣＲ条件の少なくとも１つを使用できる。いくつかの実施形態では、新しい増幅プロトコールを作成することができ、および／または、増幅反応最適化を使用することができる。特定の例として、いくつかの実施形態では、マルチプレックス、リアルタイム、ＧＣリッチ、阻害剤耐性増幅などの様々なＰＣＲ用途のために部分的に最適化された多数の事前に調製された緩衝剤が含まれる、Ｐｒｏｍｅｇａ（登録商標）のＰＣＲ最適化キットなどのＰＣＲ最適化キットを使用できる。これらの事前に調製された緩衝剤には、種々なＭｇ²⁺およびプライマー濃度、ならびにプライマープール比を迅速に補充できる。さらに、いくつかの実施形態では、様々なサイクル条件（例えば、熱サイクル）が評価および／または使用し得る。特定の実施形態が特定の所望の用途に適切であるかどうかを評価する際に、他の態様の中でも特に、特異性、ヘテロ接合座位の対立遺伝子包含率、座位間バランス、および深度のうちの１つ以上を評価してもよい。増幅の成功の測定には、産物のＤＮＡ配列決定、ゲルまたはキャピラリー電気泳動またはＨＰＬＣまたはその他のサイズ分離法とそれに続く断片の視覚化による産物の評価、二本鎖核酸結合色素または蛍光プローブを使用した融解曲線分析、質量分析、または当該技術分野で既知の他の方法が含まれ得る。

様々な実施形態によれば、様々な要因のいずれかが特定の増幅ステップの長さ（例えば、ＰＣＲ反応のサイクル数など）に影響を与える可能性がある。例えば、いくつかの実施形態では、提供された核酸材料は、損傷しているか、さもなければ最適以下である（例えば、分解および／または混入されている）可能性がある。そのような場合、より長い増幅ステップは、所望の産物が許容可能な程度に増幅されることを確実にするために役立ち得る。いくつかの実施形態では、増幅ステップは、各開始ＤＮＡ分子から平均３～１０個の配列決定されたＰＣＲコピーを提供し得るが、他の実施形態では、トップ鎖およびボトム鎖のそれぞれの単一コピーのみが必要である。特定の理論に固執することを望まずに、ＰＣＲコピーが多すぎる、または少なすぎると、アッセイの効率が低下し、最終的に深度が低下する可能性がある。一般に、増幅（例えば、ＰＣＲ）反応で使用される核酸（例えば、ＤＮＡ）断片の数は、同一のＳＭＩ／バーコード配列を共有する読取の数を決定できる主要な調整可能な変数である。ＳＰＬｉＴ－ＤＳは追加のＰＣＲステップを使用し、いくつかのこれまでに記載された方法のようにハイブリダイゼーションベースの標的化捕捉を使用する必要がないため、従来の方法を使用して報告された二本鎖核酸のインプット量の要件は、より効率的である可能性がある現在提供されている方法に直接変換できない可能性がある。

プライマー部位破壊
図６～図９Ｂは、本技術の追加の実施形態による様々なＳＰＬｉＴ－ＤＳ方法のステップの概念図である。上述のように、および図４－６を参照して、ＳＰＬｉＴ－ＤＳに関連する方法のステップは、ＳＭＩおよび複数の試料に分離できる増幅の第１の回後の非対称プライマー部位（例えば、ＩｌｌｕｍｉｎａＰ５およびＰ７プライマーに関する、図６）を含む追加のアダプター配列でタグ付けされた第１および第２の鎖増幅産物（例えば、α、α’、β、β’、図６）を有する増幅された核酸材料をもたらす。図７は、ネステッドＰＣＲ反応が、別個の反応試料（例えば、チューブ）中の元の核酸分子のトップおよびボトム鎖の濃縮された増幅を提供できる後続のステップを示す。図７に示すように、所望の増幅産物の濃縮に加えて、いくつかの望ましくない増幅産物およびその後の配列決定読取が生成され得る。したがって、およびいくつかの実施形態では、効率が低下する場合がある（例えば、ＳＰＬｉＴ－ＤＳで使用するための所望の産物のパーセントは、ＳＰＬｉＴ－ＤＳプロトコールでは有用でない産物に比べて低い場合がある）。

本技術のさらなる態様によれば、望ましくない増幅産物の増幅および配列決定を低減および／または排除するための１つ以上の戦略を採用することにより、変換効率およびワークフロー効率の様々な態様が向上し得る。いくつかの実施形態では、プライマー部位破壊または崩壊（例えば、アダプター配列内のプライマー部位破壊）は、増幅の第１の回および増幅された核酸材料の複数の試料への分離後、特定の核酸産物を濃縮する方法として使用できる（例えば図８Ａのように）。いくつかの実施形態では、提供される方法には、二本鎖プライマー部位破壊の使用が含まれ得る。本明細書では、プライマー部位破壊のいくつかの方法が企図される。図８Ａ～８Ｄは、二本鎖プライマー部位破壊スキームを組み込んだＳＰＬｉＴ－ＤＳ法のステップの概念図である。二本鎖プライマー部位破壊は、第１の増幅ステップで使用される修飾プライマーを介した標的化鎖へのプライマー部位修飾の導入を含む、様々な手段で達成可能であり得る（例えば、図６）。いくつかの実施形態では、第１のＰＣＲのプライマーは、ウラシル、メチル化、ＲＮＡ塩基、８－オキソ－グアニンを含む修飾、または後のステップで標的化され得る他の修飾を有し得る。いくつかの実施形態では、プライマー部位破壊は、例えば、アダプター配列に存在する配列の、制限酵素または他の標的化エンドヌクレアーゼ（Ｃａｓ９、ＣＰＦ１など）による消化であり得るか、または含み得、制限部位の可能性は、目的の配列に生じる可能性が低いと判断されている。

特定の実施形態では、破壊されるべきプライマー配列に相補的なオリゴヌクレオチドを特定の試料に添加し、続いて二本鎖ＤＮＡに特異的な標的化エンドヌクレアーゼで調べることができる。別の特定の実施形態では、メチル基を有するハイブリダイズするオリゴを使用して、メチル化特異的制限エンドヌクレアーゼを相補的プライマー部位に動員することができる。図８Ａに示すように、二本鎖プライマー部位破壊（例えば、試料中の非標的鎖の両方のコピー上のプライマー部位破壊）を使用して、チューブ１中の「トップ鎖」と「ボトム鎖」の両方のコピーから「Ｐ５」プライマー配列を破壊、無効化または除去することができる。同様に、チューブ２中で、「トップ鎖」と「ボトム鎖」の両方のコピーから「Ｐ７」プライマー配列を選択的に破壊、無効化、または除去することができる。図８Ｂは、試料中のプライマー配列を選択的に破壊するための一例の概念図である。図８Ｂに示すように、第１の試料は、第１のプライマー配列（例えば、Ｉｌｌｕｍｉｎａ「Ｐ５」）に見られる部位を選択的に切断する第１の制限エンドヌクレアーゼ（例えば、ＭｓｐＪＩ）によって処理し、それにより第１の試料中の全ての核酸材料の第１のプライマー部位を破壊することができる。同様に、第２の試料は、第２のプライマー配列（例えば、Ｉｌｌｕｍｉｎａ「Ｐ７」）に見られる部位を選択的に切断する第２の制限エンドヌクレアーゼ（例えば、ＦｓｐＥＩ）によって処理し、それにより第２の試料中の全ての核酸材料の第２のプライマー部位を破壊することができる。

図８Ａおよび８Ｃを合わせて参照すると、「Ｐ７」プライマーおよび「Ｐ５」プライマー部位テールを有する標的配列プライマー（例えば、遺伝子特異的プライマー）を使用してチューブ１中の産物を選択的に増幅する（１回または複数の線形サイクルを延長する）ことによって、「Ｐ７」と「Ｐ５」プライマー部位の両方を組み込んだ「ボトム鎖」種のみが生成され（例えば、図８Ｃを参照されたい）、チューブ１中の他の核酸種は指数関数的に増幅も配列決定もできない（例えば、「Ｐ５」プライマー部位を欠く）。同様に、「Ｐ５」プライマーおよび「Ｐ７」プライマー部位テールを有する標的配列プライマー（例えば、遺伝子特異的プライマー）を使用してチューブ２中の産物を選択的に増幅する（１回または複数の線形サイクルを延長する）ことによって、「Ｐ５」と「Ｐ７」プライマー部位の両方を組み込んだ「トップ鎖」種のみが生成され（例えば、図８Ｃを参照されたい）、チューブ２中の他の核酸種は指数関数的に増幅も配列決定もできない（例えば、「Ｐ５」プライマー部位を欠く）。望ましくない線形産物は配列決定も指数関数的に増幅もしないが、それらはプライマーやｄＮＴＰを消費する可能性があり、そのような反応の効率に影響を与える可能性があることを理解されたい。

いくつかの実施形態では、プライマー部位破壊を含む方法では、１つ以上のビオチン化または他の標的化プライマーを使用することもできる。図８Ｄは、本技術の別の実施形態による二本鎖プライマー部位破壊スキームを組み込んだＳＰＬｉＴ－ＤＳ法のステップの概念図である。図８Ｄに示される実施形態では、「Ｐ５」プライマー部位テールまたは「Ｐ７」プライマー部位テールを有する標的配列プライマーがビオチン化される。図８Ｄを参照し、ビオチン化標的化プライマーによる伸長ステップに続いて、ストレプトアビジンビーズまたはヒドロゲル濃縮を使用して、２つのプライマー部位を有する産物を濃縮し、それにより１つのプライマー部位のみを有する核酸種の大部分を排除することができる。いくつかのそのような実施形態において、そのような濃縮は、ＰＣＲ効率を改善し、および／または多重化アプローチを促進し、および／またはＭＰＳＤＮＡシーケンサーでのクラスター増幅効率を改善し、および／またはＭＰＳＤＮＡシーケンサーでより有用な配列決定データを生成することが起こり得る。

ビオチン／ストレプトアビジン濃縮により捕捉された種のオフターゲット濃縮をさらに制限するために、ネステッドプライマー（例えば、「Ｐ５」または「Ｐ７」プライマーおよび反対のフローセル配列を有する内部にネステッド第２の標的化プライマー）によるさらなる増幅を使用して、オンターゲット種をさらに濃縮し、望ましくない増幅産物を減らすことができる。特定の実施形態では、例えば、目的の標的配列に特異的なプライマーを使用する選択的線形増幅は、指数関数的増幅のための対になったネステッドプライマーの添加前に、所望の種をさらに濃縮できる。

いくつかの実施形態では、一本鎖プライマー部位破壊が使用され得る。図９Ａおよび９Ｂは、本技術のさらなる態様による一本鎖プライマー部位破壊スキームを組み込んだＳＰＬｉＴ－ＤＳ法のステップの様々な実施形態の概念図である。非限定的な例として、図９Ａに示すように、ＳＰＬｉＴ－ＤＳの第１の増幅ステップ中に修飾プライマー（図示せず）を使用することにより、二本鎖分子の一方の鎖のプライマー部位を破壊することができる（例えば、図６を参照されたい）。修飾されたプライマーは、影響を受ける鎖上のプライマー部位の破壊または無効化の後に標的化することができる化学修飾（例えば、ウラシル、メチル化、ＲＮＡ塩基、８－オキソ－グアニンなど）などを含むことができる。「Ｐ７」プライマーと特別に標識（例えば、ビオチン、異なるフローセルアダプターテールなど）された標的配列プライマー（例えば、遺伝子特異的プライマー）を使用した、チューブ１中の所望の標的のその後の増幅（１回または複数の線形サイクルの延長）により、「Ｐ７」と特別な標識（例えば、ビオチン、異なるプライマー部位など）の両方を組み込んだ「ボトム鎖」種のみが生成される（例えば、図９Ａを参照されたい）が、チューブ１中の他の核酸種は指数関数的に増幅しない。次のステップでは、ストレプトアビジンビーズ濃縮（図示せず）により、または「Ｐ７」プライマーおよび異なるプライマー部位相補体を持つ修飾プライマーおよび「Ｐ５」プライマー部位を持つフローセルアダプターテールによるさらなる増幅により、望ましくない産物がさらに選択される（図９Ｂ）。「Ｐ７」および「Ｐ５」プライマーによる最終増幅反応により、チューブ１試料中で濃縮された「ボトム鎖」産物が得られる（図９Ｂ）。チューブ２の試料中の相補ステップは、「トップ鎖」産物を濃縮するために実行できる（図９Ｂ）。特定の理論に拘束されることを望まないが、二本鎖プライマー部位消化の選択肢が利用可能な場合、そのような選択肢は一本鎖消化よりも好ましい場合がある。

さらなる実施形態では、図６～図９Ｂに関して説明したスキームの１つ以上を組み合わせてもよく、または特定の効率改善を依然として達成しながら特定のステップを削除してもよい。例えば、一実施形態では、ビオチン化標的化プライマーは、伸長ステップ中に使用することができ（例えば、図６に示す方法のステップに続いて）、その後のストレプトアビジンプローブ化を使用して、目的の鎖を回収することができる。この実施形態（例えば、プライマー部位破壊を伴わない）では、同一のプライマー部位の２つ（例えば、２つの「Ｐ５」プライマー部位、２つの「Ｐ７」プライマー部位）を有する種も回収される。

捕捉された分子ごとに複数のＰＣＲ
特定の用途では、核酸切断点が標的特異的プライマーに近づくことができず、短い断片または完全に欠落した領域が生じる可能性があるため、標的化領域または配列は配列決定が困難な場合がある。例えば、循環腫瘍ＤＮＡまたは循環胎児ＤＮＡなどのランダムにせん断されたＤＮＡまたは循環無細胞ＤＮＡ（ｃｆＤＮＡ）の試料には、取得できない標的配列を有する場合がある（例えば、配列決定読取で検出／または包含されない）。いくつかの実施形態では、提供される方法は、標的配列のスタガー（ｓｔａｇｇｅｒｅｄ）部分に相補的な複数の標的プライマーの使用などにより、標的配列内の複数の領域を標的化することにより、そのような課題を克服することができる（例えば、各プライマーが標的配列の異なる領域を標的化する）。短い断片に関連する課題を回避するために、そして一実施形態では、最適な配列決定に典型的に望ましくなり得るよりも大きな断片にＤＮＡをせん断することができる。図１０は、本技術のさらに別の実施形態による、より長い核酸分子の二重鎖コンセンサス配列を生成するための複数の標的化プライマーを使用するＳＰＬｉＴ－ＤＳ法のステップの概念図である。

図１０を参照すると、提供される方法は、複数の増幅プライマー、例えば、目的の標的配列の領域（例えば、約１００ＢＰ離れている）をそれぞれ標的とする複数のプライマーの使用を含み得る。様々な実施形態によれば、そのようなアプローチは、例えば、近くのまたは隣接するプライマーが互いに相互作用するのを避けるために、単一の反応（例えば、チューブ）で、または他の実施形態では、複数の反応（例えば、チューブ）で実行され得る。いくつかの実施形態では、同一のチューブ内での複数のスタガープライマーの相互作用を防止することは、下流からプライミングするプライマーがさらに上流からプライミングするプライマーを阻止しないように、鎖置換ポリメラーゼで伸長を実行することで軽減できる。いくつかの実施形態では、伸長は、第１のプライマーでいくつかの線形サイクルで実行され、その後クリーンアップ、第２のプライマーでの別のセットの伸長などが実行される。図１０に示すように、ネステッドプライマーセットは、後で配列決定できる異なる長さの増幅産物を生成する。全ての増幅産物の読取１は同一の配列情報を生成するが、増幅産物Ａ、Ｂ、およびＣのそれぞれからのペアエンド配列読取は、読取１配列情報と合わせて、従来、ＭＰＳまたは標準的なＤＳプロトコールで可能であったものよりも長い長さの組み合わされた配列を提供するスタガー配列決定情報をもたらす。

いくつかの実施形態では、マルチプライマーデータの分析は、他のＤＳ法に対して非標準のメソッドで実施される。当業者には理解されるように、多重化された試料は同一のタグを持つ様々な長さの生成物を含むことがあるため、マルチプライマー配列読取の二重鎖アセンブリはＳＭＩタグ単独では不可能である。この課題に対処するために、いくつかの実施形態は、ＳＭＩと標的プライマー開始部位の配列（例えば、ゲノム）位置との組み合わせであるタグによる二重鎖のアセンブリを含む。いくつかの実施形態では、二重鎖アセンブリの後、一般的なＳＭＩを有し、長さが異なる二重鎖読取についてのデータを評価できる。いくつかの実施形態では、個々の二重鎖ファミリーは、集合的な「多重読取二重鎖ファミリー」にまとめることができる。いくつかのそのような実施形態は、特定の用途に有利であり、短い読取配列決定プラットフォームで標的核酸分子の有効な遺伝子型決定の長さを増加させる、より長い単一分子読取へのＤＳ標的化領域のサブアセンブリを促進し得ると考えられる。

当業者に知られているように、ＩｌｌｕｍｉｎａＮｅｘｔＳｅｑで現在取得できる最長の連続読取は約３００ＢＰであり、酵素標的化とプライマーがこの長さに実質的に近い断片を産生するように慎重に設計されている限り、中間で一致するペアエンド１５０ＢＰ読取である。したがって、本明細書に記載されるマルチプライマーアプローチを組み込んだ実施形態は、いくつかの実施形態では、より長い全分子ＤＳ配列を達成し得る。

いくつかの態様では、提供される方法は、いくつかの実施形態では、ＳＰＬｉＴ－ＤＳと組み合わせた複数の標的化プライマーが、とりわけ、（ｉ）単一の長い分子の連続配列、および必要に応じて、（ｉｉ）高い特異性および／または（ｉｉ）ＤＳの精確さを達成し得る。ここで提供される方法は、例えば、次のような用途で有用である可能性が高いと考えられる：長く、精確な連続読取が必要な用途、デノボゲノムアセンブリ、固有のマッピングが困難な反復領域（すなわち、反復配列を持つゲノムの領域）でアッセイを実行すること、特に困難であると考えられる領域の配列決定（例えば、ＨＬＡ座位、がん偽遺伝子、マイクロサテライト）、がん（例えば、薬物感作性変異、耐性変異）、ハプロタイプ分析（例えば、循環胎児ＤＮＡ（例えば、母性、父性、または胎児起源）における変異の起源の評価）などのバリアントの同時発生のアッセイ、メタゲノミクス（例えば、抗生剤耐性）、特定の酵素の制限を克服すること（例えば、Ｃａｓ９と、酵素認識部位の位置に基づいて特定の領域をどれだけ離す必要があるかの制限）、大規模な構造的再配置、および／またはインデルなど。

核酸材料を処理するためのさらなる実施形態
いくつかの実施形態では、配列決定プロセスの効率、精確さ、および／または速度を改善するために、核酸材料を処理することが有利である。本技術のさらなる態様によれば、例えば、ＤＳおよび／またはＳＰＬｉＴ－ＤＳの効率は、標的化核酸の断片化によって増強され得る。古典的に、核酸（例えば、ゲノム、ミトコンドリア、プラスミドなど）の断片化は、物理的なせん断（例えば、超音波処理）またはＤＮＡホスホジエステル結合を切断するために酵素カクテルを利用するやや非配列特異的な酵素的アプローチのいずれかによって達成される。上記のいずれかの方法の結果は、無傷の核酸材料（例えば、ゲノムＤＮＡ（ｇＤＮＡ））がランダムまたは半ランダムのサイズの核酸断片の混合物に減少された試料である。これらのアプローチは効果的であるが、可変サイズの核酸断片を生成し、増幅バイアス（例えば、短い断片は長い断片よりもＰＣＲ増幅し、ポロニー形成中にクラスターがより容易に増幅する傾向がある）および不均一な配列決定の深度をもたらし得る。例えば、図１１Ａは、核酸インサートのサイズと増幅後に生じるファミリーサイズとの関係をプロットしたグラフである。図１１Ａに示すように、より短い断片は優先的に増幅する傾向があるため、これらのより短い断片のそれぞれのより多くのコピーが生成および配列決定され、これらの領域の不均衡なレベルの配列決定の深度が提供される。さらに、より長いフラグメントでは、配列決定読取の限界間（またはペアエンド配列決定読取の末端間）のＤＮＡの一部を調査できず、ライゲート、増幅、および捕捉に成功したにもかかわらず「暗い」である（図１１Ｂ）。同様に、短い読取の場合、およびペアエンド配列決定を使用するとき、両方の読取から分子の中央で同一の配列を読み取ることで、冗長な情報が得られ、費用効率が低くなる（図１１Ｂ）。ランダムまたは半ランダムな核酸断片化は、ハイブリッド捕捉のベイト鎖と相補性または相補性が低下している可能性のある断片を生成する標的分子の予測不可能な切断点をもたらし、それにより標的捕捉効率を低下させる。ランダムまたは半ランダムな断片化はまた、目的の配列を破壊、およびまたはライブラリーの調製の他の段階で失われる非常に小さいまたは非常に大きい断片をもたらし、データの収量と効率を低下させる可能性がある。

ランダム断片化の多くの方法、特に機械的または音響的方法のもう１つの問題は、二本鎖ＤＮＡの一部が二本鎖でなくなる可能性がある二本鎖切断を超える損傷をもたらすことである。例えば、機械的せん断により、分子の端に３’または５’の突出、および分子の中央に一本鎖のニックが生じることがある。「末端修復」酵素のカクテルなどのアダプターライゲーションに適したこれらの一本鎖部分は、それをもう一度人工的に二本鎖にするために使用され、人為的エラーの原因になる可能性がある「偽二重分子」に関して上述されるものなど）。多くの実施形態では、取り扱い中に天然の二本鎖形態のままである目的の二本鎖核酸の量を最大化することが最適である。

したがって、いくつかの実施形態では、提供される方法および組成物は、標的化エンドヌクレアーゼ（例えば、リボ核タンパク質複合体（Ｃａｓ９、Ｃｐｆ１などのＣＲＩＳＰＲ関連エンドヌクレアーゼ）、ホーミングエンドヌクレアーゼ、ジンクフィンガーヌクレアーゼ、ＴＡＬＥＮ、アルゴノートヌクレアーゼ、および／またはメガヌクレアーゼ（例えば、ｍｅｇａＴＡＬヌクレアーゼなど）、またはそれらの組み合わせ）、または核酸材料を切断して配列決定のための最適な断片サイズで目的の標的配列を切り出すことができる他の技術（例えば、１つ以上の制限酵素）を利用する。いくつかの実施形態では、標的化エンドヌクレアーゼは、目的の正確な配列領域を特異的かつ選択的に切除する能力を有する。図１１Ｃは、本技術の一実施形態による、ＣＲＩＳＰＲ／Ｃａｓ９によって特定のサイズに切断され標的化断片を生成し、配列決定情報を生成するための方法のステップを示す概略図である。例えば、所与の実質的に均一なサイズの断片（図１１Ｃ）をもたらすプログラム可能なエンドヌクレアーゼ（例えば、ＣＲＩＳＰＲ関連（Ｃａｓ）酵素／ガイドＲＮＡ複合体）を使用して切断部位を事前に選択することにより、バイアス、および情報のない読取の存在を大幅に減らすことができる。さらに、切除された断片と残りの非切断ＤＮＡのサイズの相違により、サイズ選択ステップ（以下でさらに説明する）を実行して、大きなオフターゲット領域を除去し、任意のさらなる処理ステップの前に、試料を事前に濃縮することができる。末端修復ステップの必要性も同様に減少または排除される可能性があり、したがって、時間と偽二重化の課題のリスクを節約し、場合によっては、分子の末端近くのデータの計算によるトリミングの必要性を削減または排除して、効率を改善する。

制限エンドヌクレアーゼ
様々な制限エンドヌクレアーゼ（すなわち、酵素）のいずれかを使用して、実質的に均一な長さの核酸材料を提供できることが特に考えられている。一般に、制限酵素は通常、特定の細菌／他の原核生物によって産生され、ＤＮＡの特定のセグメントの特定の配列で、その近くで、またはその間を切断する。

特定の部位、または代替的に、切断のための制限部位を作成するために生成される部位で切断するように制限酵素が選択されることは、当業者には明らかであろう。いくつかの実施形態では、制限酵素は合成酵素である。いくつかの実施形態では、制限酵素は合成酵素ではない。いくつかの実施形態では、本明細書で使用される制限酵素は、酵素自体のゲノム内に１つ以上の変化を導入するように修飾されている。いくつかの実施形態では、制限酵素は、ＤＮＡの特定の部分内の定義された配列間で二本鎖切断を産生する。

いくつかの実施形態に従って任意の制限酵素（例えば、Ｉ型、ＩＩ型、ＩＩＩ型、および／またはＩＶ型）を使用してもよいが、以下は、使用できる制限酵素の非限定的な一覧を表す：ＡｌｕＩ、ＡｐｏＩ、ＡｓｐＨＩ、ＢａｍＨＩ、ＢｆａＩ、ＢｓａＩ、ＣｆｒＩ、ＤｄｅＩ、ＤｐｎＩ、ＤｒａＩ、ＥｃｏＲＩ、ＥｃｏＲＩＩ、ＥｃｏＲＶ、ＨａｅＩＩ、ＨａｅＩＩＩ、ＨｇａＩ、ＨｉｎｄＩＩ、ＨｉｎｄＩＩＩ、ＨｉｎＦＩ、ＫｐｎＩ、ＭａｍＩ、ＭｓｅＩ、ＭｓｔＩ、ＭｓｔＩＩ、ＮｃｏＩ、ＮｄｅＩ、ＮｏｔＩ、ＰａｃＩ、ＰｓｔＩ、ＰｖｕＩ、ＰｖｕＩＩ、ＲｃａＩ、ＲｓａＩ、ＳａｃＩ、ＳａｃＩＩ、ＳａｌＩ、Ｓａｕ３ＡＩ、ＳｃａＩ、ＳｍａＩ、ＳｐｅＩ、ＳｐｈＩ、ＳｔｕＩ、ＸｂａＩ、ＸｈｏＩ、ＸｈｏＩＩ、ＸｍａＩ、ＸｍａＩＩ、および任意のそれらの組み合わせ。適切な制限酵素の広範囲であるが完全に網羅されていない一覧は、公開されているカタログおよびインターネットで見つけることができる（例えば、ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ，Ｉｐｓｗｉｃｈ，ＭＡ，Ｕ．Ｓ．Ａ．で入手できる）。

標的化エンドヌクレアーゼ
標的化エンドヌクレアーゼ（例えば、Ｃａｓ９またはＣｐｆ１などのＣＲＩＳＰＲ関連リボ核タンパク質複合体、ホーミングヌクレアーゼ、ジンクフィンガーヌクレアーゼ、ＴＡＬＥＮ、ｍｅｇａＴＡＬヌクレアーゼ、アルゴノートヌクレアーゼ、および／またはその誘導体）を使用して、配列決定用途のためにそのような標的化部分を濃縮する目的で、核酸材料の標的化部分を選択的に切断および切除することができる。いくつかの実施形態では、例えば、強化された熱安定性、耐塩性、および／またはｐＨ耐性を提供するためのアミノ酸置換を有するなど、標的化エンドヌクレアーゼを修飾することができる。他の実施形態では、標的化エンドヌクレアーゼは、ビオチン化され、ストレプトアビジンと融合され、および／または他の親和性に基づいた（例えば、バイト／プレイ）技術を組み込んでもよい。特定の実施形態では、標的化エンドヌクレアーゼは、改変された認識部位特異性を有し得る（例えば、改変されたＰＡＭ部位特異性を有するＳｐＣａｓ９バリアント）。本明細書では、ＣＲＩＳＰＲベースの標的化エンドヌクレアーゼをさらに説明して、標的化エンドヌクレアーゼの使用のさらに詳細な非限定的な例を提供する。そのような標的ヌクレアーゼ周辺の命名法は流動的であることに留意されたい。本明細書の目的のために、「ＣＲＩＳＰＥＲベース」という用語を使用して、一般に、切断される核酸配列を再定義するためにその配列を修飾できる核酸配列を含むエンドヌクレアーゼを意味する。Ｃａｓ９とＣＰＦ１は現在使用されているこのような標的化エンドヌクレアーゼの例であるが、自然界の様々な場所に存在するものがさらに多くあり、このような標的化された容易に調整可能なヌクレアーゼの様々な種類が今後数年間で急速に増加すると予想される。同様に、これらの酵素の特性を強化または改変するための、これらの酵素の複数の改変バリアントが利用可能になりつつある。本明細書では、本明細書に明示的に記載されていないか、またはまだ発見されていない実質的に機能的に類似の標的化エンドヌクレアーゼの使用を明示的に企図し、記載された開示と同様の目的を達成する。

ＣＲＩＳＰＲ－ＤＳ
本技術のさらなる態様は、プログラム可能なエンドヌクレアーゼＣＲＩＳＰＲ／Ｃａｓ９を使用して目的の領域を濃縮する方法に関する。特に、ＣＲＩＳＰＲ／Ｃａｓ９（または他のプログラム可能なエンドヌクレアーゼ）を使用して、１つ以上の目的の配列領域を選択的に切除でき、切除された標的領域は１つ以上の所与の長さになるように設計されているため、ＤＳおよびＳＰＬｉＴ－ＤＳなどの配列決定用途のためのライブラリーの調製前にサイズ選択を可能にする。これらのプログラム可能なエンドヌクレアーゼは、単独で、または制限エンドヌクレアーゼなどの他の形態の標的化ヌクレアーゼと組み合わせて使用することができる。ＣＲＩＳＰＲ－ＤＳと呼ばれるこの方法は、非常に高度のオンターゲット濃縮を可能にし（後続のハイブリッド捕捉ステップの必要性を減らすことができる）、時間とコストを大幅に削減し、変換効率を高めることができる。図１２Ａ～１２Ｄは、本技術の一実施形態によるＣＲＩＳＰＲ－ＤＳ法のステップの概念図である。例えば、ＣＲＩＳＰＲ／Ｃａｓ９を使用して、標的配列内の１つ以上の特定の部位（例えば、ＰＡＭ部位）を切断できる（図１２Ａ；この例ではＴＰ５３標的領域）。図１２Ｂは、ＳＰＲＩ／Ａｍｐｕｒｅビーズおよび磁石精製を使用して切除された標的部分を単離して、所与のより短い断片を残しながら高分子量ＤＮＡを除去する１つの方法を示す。他の実施形態では、ゲル電気泳動、ゲル精製、液体クロマトグラフィー、サイズ排除精製、およびろ過精製法を含むがこれらに限定されない様々なサイズ選択方法を使用して、所与の長さの切除部分を望ましくないＤＮＡ断片および他の高分子量ゲノムＤＮＡ（該当する場合）から分離することができる。サイズ選択後、ＣＲＩＳＰＲ－ＤＳ法には、Ａテーリング（ＣＲＩＳＰＲ／Ｃａｓ９切除により平滑末端が残る）、ＤＳアダプターのライゲーション（図１２Ｃ）、二重鎖増幅（図１２Ｄ）、各鎖の配列決定および二重鎖コンセンサス配列（図１２Ｄ）の生成前の捕捉ステップおよび指標増幅（例えばＰＣＲ）を含む、ＤＳメソッドのステップ（例えば、図１２Ｅを参照されたい）と一致するステップが含まれる。図１２Ｅで明らかなワークフロー効率の改善に加えて、ＣＲＩＳＰＲ－ＤＳは高効率の増幅および配列決定ステップに最適な断片長を提供する（図１２Ｆ）。

特定の実施形態では、ＣＲＩＳＰＲ－ＤＳは、例えば、ＣＲＩＳＰＲベースのサイズ選択により最適化され得る非効率的な標的濃縮、エラーが訂正された二重鎖コンセンサス配列を生成するためのＤＳ方法論を使用して削除できる配列エラー、事前に設計されたＣＲＩＳＰＲ／Ｃａｓ９断片化によって緩和される不均一な断片サイズを含む、ＮＧＳに関連する複数の一般的な問題を解決する（表１）。

表１、ＴＰ５３のＣＲＩＳＰＲ／Ｃａｓ９消化のためのｃｒＲＮＡ配列

Target description:標的の説明、Name：名称、Sequence plus pam sige:配列＋pam部位、
Position start：開始位置、Position end:収量位置、Zhang score：Zhangスコア
upstream of exon 11:エクソン11の上流
downstream of exon 11:エクソン11の下流
upstream of exon 10:エクソン10の上流
downstream of exon 10:エクソン10の下流
upstream of exon 9-8:エクソン9-8の上流
downstream of exon 9-8:エクソン9-8の下流
downstream of exon 7:エクソン7の下流
upstream of exon 6-5:エクソン6-5の上流
downstream of exon 6-5:エクソン6-5の下流
upstream of exon 4-3:エクソン4-3の上流
downstream of exon 4-3:エクソン4-3の下流
downstream of exon2:エクソン2の下流

Ｃａｓ９ヌクレアーゼによるＤＮＡ物質のインビトロ消化では、リボ核タンパク質複合体の形成を利用し、これは、所与の部位（例えば、ＰＡＭ部位、図１１Ｃ）を認識および切断する。この複合体は、ガイドＲＮＡ（「ｇＲＮＡ」、例えばｃｒＲＮＡ＋ｔｒａｃｒＲＮＡ）とＣａｓ９で形成される。多重切断の場合、全てのｃｒＲＮＡをプールしてからｔｒａｃｒＲＮＡと複合体化することによってか、または各ｃｒＲＮＡとｔｒａｃｒＲＮＡを別々に複合体化してからプールすることによって、ｇＲＮＡを複合体化できる。いくつかの実施形態では、ｃｒＲＮＡ間の競合を排除するため、第２の選択肢が好ましい場合がある。

本明細書に記載されるように、当業者には理解されるように、ＣＲＩＳＰＲ－ＤＳは、法医学および早期がん検出用途など、試料がＤＮＡに制限される状況での変異の高感度同定のための用途を有し得る。

いくつかの実施形態では、核酸材料は、実質的に均一な長さの核酸分子を含む。いくつかの実施形態では、実質的に均一な長さは、約１～約１，０００，０００塩基である）。例えば、いくつかの実施形態では、実質的に均一な長さは、少なくとも１、２、３、４、５、６、７、８、９、１０、１５、２０、２５、３０、３５、４０、５０、６０、７０、８０、９０、１００、１２０、１５０、２００、３００、４００、５００、６００、７００、８００、９００、１０００、１２００、１５００、２０００、３０００、４０００、５０００、６０００、７０００、８０００、９０００、１０，０００、１５，０００、２０，０００、３０，０００、４０，０００、または５０，０００塩基の長さであり得る。いくつかの実施形態では、実質的に均一な長さは、最大で６０，０００、７０，０００、８０，０００、９０，０００、１００，０００、１２０，０００、１５０，０００、２００，０００、３００，０００、４００，０００、５００，０００、６００，０００、７００，０００、８００，０００、９００，０００、または１，０００，０００塩基であり得る。具体的な非限定的な例として、いくつかの実施形態では、実質的に均一な長さは、約１００～約５００塩基である。いくつかの実施形態では、本明細書に記載されているようなサイズ選択ステップは、任意の特定の増幅ステップの前に実行されてもよい。いくつかの実施形態では、本明細書に記載されているようなサイズ選択ステップは、任意の特定の増幅ステップの後に実行されてもよい。いくつかの実施形態では、本明細書に記載されているようなサイズ選択ステップの後に、消化ステップおよび／または別のサイズ選択ステップなどの追加のステップが続く場合がある。

標的化エンドヌクレアーゼの使用に加えて、実質的に均一な長さの核酸分子を達成する任意の他の用途に適した方法が使用されてもよい。非限定的な例として、そのような方法は、アガロースまたは他のゲル、アフィニティーカラム、ＨＰＬＣ、ＰＡＧＥ、ろ過、ＳＰＲＩ／Ａｍｐｕｒｅタイプのビーズ、または当業者によって認識される他の適切な方法の１つ以上の使用であり得るか、または含み得る。

いくつかの実施形態では、実質的に均一な長さ（または質量）の核酸分子を産生するように核酸材料を処理することは、試料から１つ以上の所望の標的領域（例えば、目的の標的配列）を回収するために使用できる。いくつかの実施形態では、実質的に均一な長さ（または質量）の核酸分子を生成するように核酸材料を処理することは、試料の特定の部分（例えば、望ましくない種、または同一の種の望ましくない対象からの核酸材料）を排除するために使用できる。いくつかの実施形態では、核酸材料は様々なサイズで存在し得る（例えば、実質的に均一な長さまたは質量ではない）。

いくつかの実施形態では、１つを超える標的化エンドヌクレアーゼまたは実施的に均一な長さの核酸分子をもたらすための他の方法を使用してもよい（例えば、２、３、４、５、６、７、８、９、１０、またはそれ以上）。いくつかの実施形態では、標的化ヌクレアーゼを使用して、核酸材料の１つを超える潜在的標的領域（例えば、２、３、４、５、６、７、８、９、１０、またはそれ以上）を切断することができる。いくつかの実施形態では、核酸材料の１つを超える標的領域が存在する場合、各々の標的領域は同一（または実質的に同一）の長さであり得る。いくつかの実施形態では、核酸材料の１つを超える標的領域が存在する場合、既知の長さの標的領域のうちの少なくとも２つは長さが異なる（例えば、１００ｂｐの長さの第１の標的領域と、１，０００ｂｐの長さの第２の標的領域）。

いくつかの実施形態では、複数の標的化エンドヌクレアーゼ（例えば、プログラム可能なエンドヌクレアーゼ）を組み合わせて使用して、目的の標的核酸の複数の領域を断片化してもよい。いくつかの実施形態では、１つ以上のプログラム可能な標的化エンドヌクレアーゼを他の標的化ヌクレアーゼと組み合わせて使用してもよい。いくつかの実施形態では、１つ以上の標的化エンドヌクレアーゼをランダムまたは半ランダムヌクレアーゼと組み合わせて使用してもよい。いくつかの実施形態では、１つ以上の標的化エンドヌクレアーゼを、機械的または音響的せん断など、他のランダムまたは半ランダムな核酸断片化方法と組み合わせて使用してもよい。いくつかの実施形態では、１つ以上のサイズ選択ステップを介在させて連続ステップで切断を行うことが有利な場合がある。標的化された断片化がランダムまたは半ランダム断片化と組み合わせて使用されるいくつかの実施形態では、後者のランダムまたは半ランダムな性質は、ＳＭＩの目的を果たすのに役立つ場合がある。標的化断片化がランダムまたは半ランダム断片化と組み合わせて使用されるいくつかの実施形態では、後者のランダムまたは半ランダムな性質は、長い高度の反復領域などの標的化された方法で容易に切断されない核酸の領域の配列決定を促進するのに有用であり得る。

さらなる方法
いくつかの実施形態では、提供される方法は、核酸材料を提供するステップ、所与の長さの標的領域が残りの核酸材料から分離されるように標的エンドヌクレアーゼ（例えば、リボ核タンパク質複合体）により核酸材料を切断するステップと、切断された標的領域を分析することと、を含み得る。いくつかの実施形態では、提供される方法は、少なくとも１つのＳＭＩおよび／またはアダプター配列を、所与の長さの切断された標的領域の５’または３’末端のうちの少なくとも１つにライゲートすることをさらに含み得る。いくつかの実施形態では、分析することは、定量および／または配列決定であり得るか、またはそれを含み得る。

いくつかの実施形態では、定量化は、分光光度分析、リアルタイムＰＣＲ、および／または蛍光ベースの定量化（例えば、蛍光色素タグ付けを使用すること）であり得るか、またはそれを含み得る。いくつかの実施形態では、配列決定は、サンガー配列決定、ショットガン配列決定、ブリッジＰＣＲ、ナノポア配列決定、単一分子リアルタイム配列決定、イオントレント配列決定、パイロ配列決定、デジタル配列決定（例えば、デジタルバーコードベースの配列決定）、ライゲーションによる配列決定、ポロニーベースの配列決定、電流ベースの配列決定（例えば、トンネル電流）、質量分析による配列決定、マイクロフルイディクスベースの配列決定、およびそれらの任意の組み合わせであり得るか、またはそれを含み得る。

いくつかの実施形態では、標的化エンドヌクレアーゼは、ＣＲＩＳＰＲ関連（Ｃａｓ）酵素（例えば、Ｃａｓ９もしくはＣｐｆ１）、または他のリボ核タンパク質複合体、ホーミングエンドヌクレアーゼ、ジンクフィンガーヌクレアーゼ、転写活性化因子様エフェクターヌクレアーゼ（ＴＡＬＥＮ）、アルゴノートヌクレアーゼ、および／またはｍｅｇａＴＡＬヌクレアーゼのうちの少なくとも１つであるか、それを含む。いくつかの実施形態では、１つを超える標的化エンドヌクレアーゼを使用してもよい（例えば、２、３、４、５、６、７、８、９、１０、またはそれ以上）。いくつかの実施形態では、標的化ヌクレアーゼを使用して、所与の長さの１つを超える潜在的標的領域（例えば、２、３、４、５、６、７、８、９、１０、またはそれ以上）を切断することができる。いくつかの実施形態では、所与の長さの１つを超える標的領域が存在する場合、各々の標的領域は同一（または実質的に同一）の長さであり得る。いくつかの実施形態では、所与の長さの１つを超える標的領域が存在する場合、所与の長さの標的領域のうちの少なくとも２つは長さが異なる（例えば、１００ｂｐの長さの第１の標的領域と、１，０００ｂｐの長さの第２の標的領域）。

さらなる態様
本開示の一態様によれば、いくつかの実施形態は、非常に少量の核酸材料から高品質の配列決定情報を提供する。いくつかの実施形態では、提供される方法および組成物は、最大で以下の量の出発核酸材料とともに使用することができる：約１ピコグラム（ｐｇ）、１０ｐｇ、１００ｐｇ、１ナノグラム（ｎｇ）、１０ｎｇ、１００ｎｇ、２００ｎｇ、３００ｎｇ、４００ｎｇ、５００ｎｇ、６００ｎｇ、７００ｎｇ、８００ｎｇ、９００ｎｇ、または１０００ｎｇ。いくつかの実施形態では、提供される方法および組成物は、最大で１分子コピーまたはゲノム相当、１０分子コピーまたはそのゲノム相当、１００分子コピーまたはそのゲノム相当、１，０００分子コピーまたはそのゲノム相当、１０，０００分子コピーまたはそのゲノム相当、１００，０００分子コピーまたはそのゲノム相当、または１，０００，０００分子コピーまたはそのゲノム相当の投入量の核酸材料とともに使用することができる。例えば、いくつかの実施形態では、最大で１，０００ｎｇの核酸材料が特定の配列決定プロセスに最初に提供される。例えば、いくつかの実施形態では、最大で１００ｎｇの核酸材料が特定の配列決定プロセスに最初に提供される。例えば、いくつかの実施形態では、最大で１０ｎｇの核酸材料が特定の配列決定プロセスに最初に提供される。例えば、いくつかの実施形態では、最大で１ｎｇの核酸材料が特定の配列決定プロセスに最初に提供される。例えば、いくつかの実施形態では、最大で１００ｐｇの核酸材料が特定の配列決定プロセスに最初に提供される。例えば、いくつかの実施形態では、最大で１ｐｇの核酸材料が特定の配列決定プロセスに最初に提供される。

本技術の他の態様によれば、提供されるいくつかの方法は、核酸材料の任意の様々な最適以下の（例えば、損傷または分解）試料の配列決定に有用であり得る。例えば、いくつかの実施形態では、核酸材料の少なくとも一部が損傷している。いくつかの実施形態では、損傷が、酸化、アルキル化、脱アミノ化、メチル化、加水分解、ニッキング、鎖内架橋、鎖間架橋、平滑末端鎖切断、付着末端二重鎖切断、リン酸化、脱リン酸化、ＳＵＭＯ化、グリコシル化、一本鎖ギャップ、熱による損傷、乾燥による損傷、紫外線暴露による損傷、ガンマ線による損傷、Ｘ線による損傷、電離放射線による損傷、非電離放射線による損傷、重粒子線による損傷、核崩壊による損傷、ベータ線による損傷、アルファ線による損傷、中性子線による損傷、陽子線による損傷、宇宙線による損傷、高ｐＨによる損傷、低ｐＨによる損傷、反応性酸化種による損傷、フリーラジカルによる損傷、過酸化物による損傷、次亜塩素酸塩による損傷、ホルマリンまたはホルムアルデヒドなどの組織固定による損傷、反応性鉄による損傷、低イオン状態による損傷、高イオン状態による損傷、緩衝されていない状態による損傷、ヌクレアーゼによる損傷、環境暴露による損傷、火災による損傷、機械的ストレスによる損傷、酵素分解による損傷、微生物による損傷、分取機械的せん断による損傷、分取酵素による断片化による損傷、生体内で自然に生じた損傷、核酸抽出中に生じた損傷、配列決定ライブラリーの調製中に生じた損傷、ポリメラーゼによって導入された損傷、核酸の修復中に導入された損傷、核酸の末端処理中に生じた損傷、核酸ライゲーション中に生じた損傷、配列決定中に生じた損傷、ＤＮＡの機械的取り扱いにより生じた損傷、ナノポアを通過する際に生じた損傷、生物の老化の一部として生じた損傷、個体の化学物質への暴露の結果として生じた損傷、変異原性物質により生じた損傷、発がん性物質により生じた損傷、染色体異常誘発物質により生じた損傷、酸素暴露による生体内炎症損傷により生じた損傷、１つ以上の鎖切断による損傷、およびそれらの組み合わせのうちの少なくとも１つであるか、またはそれを含む。

核酸材料
種類
様々な実施形態に従って、様々な核酸材料のうちのいずれかが使用され得る。いくつかの実施形態では、核酸材料は、標準的な糖リン酸骨格内のポリヌクレオチドに対する少なくとも１つの修飾を含んでもよい。いくつかの実施形態では、核酸材料は、核酸材料のいずれかの塩基内に少なくとも１つの修飾を含んでもよい。例えば、非限定的な例として、いくつかの実施形態では、核酸材料は、二本鎖ＤＮＡ、一本鎖ＤＮＡ、二本鎖ＲＮＡ、一本鎖ＲＮＡ、ペプチド核酸（ＰＮＡ）、ロックド核酸（ＬＮＡ）のうちの少なくとも１つであるか、またはそれを含む。

修飾
様々な実施形態によれば、核酸材料は、特定の提供される方法または組成物が使用される用途に応じて、特定のステップの前、実質的に同時、または後に１つ以上の修飾を受けてもよい。

いくつかの実施形態では、修飾は、核酸材料の少なくとも一部の修復であってもよく、またはそれを含んでもよい。核酸修復の用途に適した任意の方法は、いくつかの実施形態に適合すると考えられるが、特定の例示的な方法および組成物は、したがって、以下および実施例に記載されている。

非限定的な例として、いくつかの実施形態では、ウラシルＤＮＡグリコシラーゼ（ＵＤＧ）、ホルムアミドピリミジンＤＮＡグリコシラーゼ（ＦＰＧ）、および８－オキソグアニンＤＮＡグリコシラーゼ（ＯＧＧ１）などのＤＮＡ修復酵素を、ＤＮＡ損傷（例えば、インビトロＤＮＡ損傷）を訂正するのに利用することができる。例えば、これらのＤＮＡ修復酵素は、ＤＮＡから損傷した塩基を除去するグリコリアーゼである。例えば、ＵＤＧはシトシンの脱アミノ化（シトシンの自然加水分解により起こる）から生じるウラシルを除去し、ＦＰＧは８－オキソ－グアニン（例えば、活性酸素種に起因する多くの一般的なＤＮＡ損傷）を除去する。ＦＰＧはまた、無塩基部位に１塩基のギャップを生じさせるリアーゼ活性をも有する。そのような脱塩基部位は、例えば、ポリメラーゼがテンプレートのコピーに失敗するため、ＰＣＲによる増幅が失敗する。したがって、このようなＤＮＡ損傷修復酵素を使用すると、真の変異を持たない損傷ＤＮＡを効果的に除去できるが、そうでなければ、配列決定および二重鎖配列分析後にエラーとして検出されない。

上述のように、さらなる実施形態では、本明細書で論じされる処理するステップから生成された配列決定読取をさらにフィルタリングして、アーティファクトに最もなりやすい読取の末端をトリミングすることにより、偽の変異を排除できる。例えば、ＤＮＡ断片化により、二本鎖分子の末端に一本鎖部分が生成されることがある。これらの一本鎖部分は、末端修復中に（例えば、クレノウによって）満たすことができる。場合によっては、ポリメラーゼはこれらの末端修復領域でコピーミスを起こし、「擬似二重鎖分子」の生成をもたらす。これらのアーティファクトは、配列決定されると真の変異であるように見える場合がある。末端修復メカニズムの結果としてのこれらのエラーは、配列決定読取の末端をトリミングして、発生した可能性のある任意の変異を除外することにより、配列決定後の解析から排除でき、これによって偽の変異の数を低減できる。いくつかの実施形態では、配列決定読取のそのようなトリミングは自動的に達成することができる（例えば、通常のプロセスのステップ）。いくつかの実施形態では、断片末端領域について変異頻度を評価することができ、断片末端領域で変異の閾値レベルが観察される場合、ＤＮＡ断片の二本鎖コンセンサス配列読取を生成する前に、配列決定読取のトリミングを実行することができる。

供給源
核酸材料は、任意の様々な供給源に由来し得ると考えられる。例えば、いくつかの実施形態では、核酸材料は、少なくとも１つの対象（例えば、ヒトもしくは動物の対象）または他の生物学的供給源からの試料から提供される。いくつかの実施形態では、バンク寄託／保管された試料から核酸材料が提供される。いくつかの実施形態では、試料が、血液、血清、汗、唾液、脳脊髄液、粘液、子宮洗浄液、膣スワブ、鼻腔スワブ、口腔スワブ、組織擦過検体、髪の毛、指紋、尿、便、硝子体液、腹膜洗浄液、唾液、気管支洗浄液、口腔洗浄液、胸膜洗浄液、胃洗浄液、胃液、胆汁、膵管洗浄液、胆管洗浄液、総胆管洗浄液、胆嚢液、滑液、感染性創傷、非感染性創傷、考古学的な試料、法医学試料、水試料、組織試料、食品試料、バイオリアクター試料、植物試料、爪擦過検体、精液、前立腺液、卵管洗浄液、無細胞核酸、細胞内の核酸、メタゲノミクス試料、移植された異物の洗浄液、鼻洗浄液、腸液、上皮擦過検体、上皮洗浄液、組織生検、剖検試料、剖検試料、臓器試料、人物同定試料、人工的に産生された核酸試料、合成遺伝子試料、核酸データ貯蔵試料、腫瘍組織、およびそれらの任意の組み合わせのうちの少なくとも１つであるか、またはそれを含む。他の実施形態では、試料は、微生物、植物ベースの生物、または収集された環境試料（例えば、水、土壌、考古学など）のうちの少なくとも１つであるか、またはそれを含む。

選択された用途の例
本明細書に記載されるとき、提供される方法および組成物は、様々な目的のいずれかおよび／または様々なシナリオのいずれかで使用されてもよい。以下は、特定の説明のみを目的とした非限定的な用途および／またはシナリオの例である。

法医学
法医学ＤＮＡ分析へのこれまでのアプローチは、ＰＣＲ増幅産物のキャピラリー電気泳動分離にほとんど完全に依存して、短いタンデムリピート配列の長さの多型を識別する。このタイプの分析は、１９９１年に導入されて以来、非常に価値があることが証明されている。それ以来、いくつかの出版物は標準化されたプロトコールを導入し、世界中の研究室での使用を検証し、多くの異なる人種でのその使用を詳述し、ｍｉｎｉＳＴＲなどのより効率的なアプローチを導入してきた。

このアプローチは非常に成功していることが証明されているが、この技術にはその有用性を制限する多くの欠点を有している。例えば、ＳＴＲ遺伝子型決定に対する現在のアプローチでは、テンプレートＤＮＡ上のポリメラーゼの滑りによって引き起こされるＰＣＲスタッターに起因するバックグラウンドシグナルをしばしば発生させる。この問題は、スタッター対立遺伝子と真の対立遺伝子を区別するのが難しいため、２つ以上の寄与者による試料においてとくに重要である。分解されたＤＮＡ試料を分析するときに別の問題が発生する。断片の長さの変動により、しばしば、より長いＰＣＲ断片が大幅に少なくなるか、または存在しなくなることさえある。結果として、分解されたＤＮＡからのプロファイルは、しばしばより低い識別力を有する。

ＭＰＳシステムの導入は、法医学分析におけるいくつかの困難な問題に対処する可能性を有している。例えば、これらのプラットフォームは、識別力を劇的に増大させ、民族性および身体的属性さえも決定する可能性を提供する、核およびｍｔＤＮＡのＳＴＲとＳＮＰの同時分析を可能にする比類のない能力を提供する。さらに、単純に分子の集合集団の平均遺伝子型を報告するＰＣＲ－ＣＥとは異なり、ＭＰＳ技術は、多くの個々のＤＮＡ分子の完全なヌクレオチド配列をデジタルで集計し、異種ＤＮＡ混合物内のＭＡＦを検出する独自の能力を提供する。２人以上の寄与者を含む法医学試料は、法医学で最も問題のある問題のうちの１つとして残るため、法医学の分野に対するＭＰＳの影響は非常に大きくなり得る。

ヒトゲノムの発表は、ＭＰＳプラットフォームの計り知れない力を強調した。
しかしながら、ごく最近まで、読取の長さがＳＴＲ座位よりも大幅に短く、長さに基づく遺伝子型を判定することができないため、これらのプラットフォームの完全な力はは法医学に限定されていた。当初、Ｒｏｃｈｅ４５４プラットフォームなどのパイロシーケンサーは、コアＳＴＲ座位を配列決定するのに十分な読取長を持つ唯一のプラットフォームであった。しかしながら、競合する技術の読取の長さが増加しているため、法医学用途に対する有用性が発揮されている。多くの研究により、ＳＴＲ座位のＭＰＳ遺伝子型決定の可能性が明らかになっている。全体として、これらの全ての研究の全般的な結果は、プラットフォームに関係なく、ＳＴＲを正常に分類できるため、損傷した法医学試料からでもＣＥ分析に匹敵する遺伝子型を生成できることである。

全てのこれら研究は、従来のＰＣＲ－ＣＥアプローチとの一致を示しており、ＳＴＲ内ＳＮＰの検出などの追加の利点も示しているが、現在の技術に関する多くの問題もまた強調している。例えば、ＳＴＲ遺伝子型決定に対する現在のＭＰＳアプローチは、配列決定とＰＣＲプライマーの導入に十分なＤＮＡを提供するためのマルチプレックスＰＣＲに依存している。しかしながら、マルチプレックスＰＣＲキットはＰＣＲ－ＣＥ用に設計されているため、様々なサイズの増幅産物のためのプライマーが含まれている。この変動により、小さな断片が増幅されるバイアスを有して包含が不均衡になり、対立遺伝子が脱落する可能性がある。実際、最近の研究では、特に低ＭＡＦにおいて、ＰＣＲ効率の相違が混合物成分に影響を及ぼすことが示されている。この問題に対処するために、法医学のために特別に設計されたいくつかの配列決定キットが現在市販されており、検証研究が報告され始めている。しかしながら、多重化のレベルが高いため、増幅バイアスは依然として明らかである。

対照的に、いくつかの実施形態では、提供される方法および組成物は、上記および以下の実施例で説明されるように、低品質および／または少量の試料の高品質かつ効率的な配列決定を可能にする。したがって、いくつかの実施形態では、提供される方法および／または組成物は、異なる遺伝子型の別の個体のＤＮＡと低濃度で混合された１人の個体からのＤＮＡのまれなバリアントの検出に有用であり得る。

法医学ＤＮＡ試料には通常、非ヒトＤＮＡが含まれている。この外因性ＤＮＡの潜在的な供給源は次の通りである：ＤＮＡの供給源（例えば、唾液または口腔試料中の微生物）、試料が収集された表面環境、および実験室（例えば、試薬、作業エリアなど）からの混入。いくつかの実施形態によって提供される別の態様は、特定の提供される方法および組成物が、他の供給源（例えば、異なる種）および／または表面もしくは環境混入物質からの混入核酸材料の区別を可能にし、これらの物質（および／またはその効果）を最終分析から削除でき、配列決定結果にバイアスをもたらさない。

高度に分解されたＤＮＡでは、必要なプライマーアニーリング部位を含まないＤＮＡ断片が原因で座位特異的ＰＣＲがうまく機能せず、対立遺伝子のドロップアウトが生じる。この状況は、遺伝子型コールの一意性を制限し、特に混合試験では、一致の信頼性が保証されない。しかしながら、いくつかの実施形態では、提供される方法および組成物は、ＳＴＲマーカーに加えて、またはＳＴＲマーカーの代替として、一塩基多型（ＳＮＰ）を使用できるようにする。

実際、ヒトの遺伝的変異に関するデータは増え続けており、ＳＮＰは法医学研究にますます重要になっている。そのため、いくつかの実施形態では、提供される方法および組成物は、例えば現在利用可能な配列決定キットに基づいてマルチプレックスプライマーパネルを作成できるようにプライマー設計戦略を使用し、読取が１つ以上のＳＮＰ位置を確実にまたぐようにする。

患者の層別化
患者の層別化は、一般に１つ以上の治療に関連しない要因に基づいて患者を分割することを指し、医学界で大きな関心を集めているトピックである。この関心の多くは、特定の治療薬候補が、部分的に試験中の患者間のこれまで認識されていなかった相違に起因してＦＤＡの承認を取得できなかったという事実に起因する可能性がある。これらの相違は、１つの群の患者と１つ以上の他の群の患者で、治療薬の代謝が異なる、または副作用が生じるまたは悪化する１つ以上の遺伝的相違であり得るか、またはそれを含み得る。場合によっては、これらの相違の一部または全てが、同一の遺伝的プロファイルを示さない他の患者とは異なる治療薬への反応をもたらす、患者の１つ以上の異なる遺伝子プロファイルとして検出され得る。

したがって、いくつかの実施形態では、提供される方法および組成物は、特定の患者集団（例えば、一般的な疾患、障害または状態に苦しむ患者）のどの対象が特定の治療に応答するかを決定する際に有用であり得る。例えば、いくつかの実施形態では、提供される方法および／または組成物を使用して、特定の被験者が治療に対する応答不良に関連する遺伝子型を保有しているか否かを評価することができる。いくつかの実施形態では、提供される方法および／または組成物を使用して、特定の被験者が治療に対する陽性の応答に関連する遺伝子型を保有しているか否かを評価することができる。

治療に対する応答のモニタリング（腫瘍変異など）
ゲノム研究における次世代シーケンシング（ＮＧＳ）の出現により、前例のない詳細を備えた腫瘍の変異状況の特性評価が可能になり、診断、予後、および臨床的に処置し得る変異のカタログ化をもたらした。まとめると、これらの変異は、個別化医療によるがん転帰の改善および潜在的な早期がんの検出とスクリーニングに大きな期待を抱かせる。本開示の前に、この分野における重大な制限は、これらの変異が低頻度で存在するときにこれらの変異を検出できないことであった。臨床生検の多くはしばしば、大部分が正常細胞で構成されており、ＤＮＡ変異に基づくがん細胞の検出は、現代のＮＧＳにとっても技術的な課題である。数千の正常なゲノムの中で腫瘍の変異を同定することは、干し草の山から針を見つけることに類似しており、これまでに知られている方法を超えるレベルの配列決定の精確さを必要とする。

一般的に、この問題は液体生検の場合に悪化し、この場合、課題は腫瘍の変異を見つけるために必要な極度の感度を提供するだけでなく、これらの生検に通常存在する最小限の量のＤＮＡでそれを行うことである。「液体生検」という用語は通常、循環している腫瘍ＤＮＡ（ｃｔＤＮＡ）の存在に基づいて癌について知らせる能力のある血液を指す。ｃｔＤＮＡは、がん細胞によって血流中に放出され、がんをモニター、検出、および予測し、ならびに腫瘍の遺伝子型決定と治療法の選択を可能にする大きな期待を示している。これらの用途は、がん患者の現在の管理に革命をもたらす可能性があるが、進歩は以前に予想されていたよりも遅くなっている。大きな問題は、通常、ｃｔＤＮＡは血漿中に存在する全ての無細胞ＤＮＡ（ｃｆＤＮＡ）のごく一部を占めることである。転移性がんでは、その頻度は５％を超える可能性があるが、限局性がんでは１％～０．００１％の間である。理論的には、十分な数の分子をアッセイすることにより、あらゆるサイズのＤＮＡ亜集団を検出できるはずである。しかしながら、以前の方法の基本的な制限は、塩基が誤ってスコアリングされる頻度が高いことである。多くの場合、エラーはクラスターの生成、配列決定サイクル、低いクラスターの解像度、テンプレートの分解の際に発生する。その結果、配列決定された塩基の約０．１～１％が誤ってコールされる。さらなる問題は、ＰＣＲの際のポリメラーゼのミスや増幅バイアスから生じ得、集団のゆがみや偽変異対立遺伝子頻度（ＭＡＦ）の導入をもたらし得る。まとめると、従来のＮＧＳを含むこれまで知られている技術は、低頻度変異の検出に必要なレベルで実行することができない。

ＮＧＳの精確さを向上させるために、いくつかのアプローチが採用されている。
インビトロ修復キットを使用したＤＮＡ損傷の除去は、ＮＧＳでの誤ったバリアントコールの数を減らすことが示されている。しかしながら、全ての変異原性病変がこれらの酵素によって認識されるわけではなく、修復の忠実度も完全ではない。重要な牽引力を得た別のアプローチは、個々のＤＮＡ断片から生じるＰＣＲの重複を利用してコンセンサスを形成することである。「分子バーコード付け」と呼ばれる、ＰＣＲの前または最中に固有のランダムなせん断ポイントまたは外因性に導入されたランダムなＤＮＡ配列を共有する読取がグループ化され、最も一般的な配列が保持される。Ｋｉｎｄｅらは、一本鎖分子バーコード付けを使用して、バーコード配列決定を共有するＰＣＲコピーをグループ化し、コンセンサスを形成することにより、配列決定のエラー率を低減するＳａｆｅＳｅｑＳによってこの概念を導入した。このアプローチにより、平均検出限界は０．５％になり、転移癌におけるｃｔＤＮＡの検出に成功したが、早期癌の約４０％でのみ成功している。この検出限界は、ＭＡＦで約０．０１％の低い変異を検出できるデジタルドロップレットＰＣＲ（ｄｄＰＣＲ）で大幅に改善できる。しかしながら、変異は事前に知られている必要があり、これは複数のがんの用途を深刻に制限する。さらに、一度に試験できるのは１～４個の変異のみであり、ハイスループットスクリーニングが不可能である（表２）。
表２

本開示の前に、ｄｄＰＣＲに匹敵する感度を有するが、腫瘍変異の先験的な知識を必要としない唯一の技術はＤＳである。ＤＳは、２本鎖の分子バーコードを使用して、２本のＤＮＡ鎖が相補的な情報を含むという事実を利用することにより、分子バーコード付けの概念を拡張する。私たちは以前、このアプローチにより、ヒト核ＤＮＡの０．００５％未満の比類ない感度が得られることを実証した。

ＤＳ、ＳＰＬｉＴ－ＤＳ、およびＣＲＩＳＰＲ－ＤＳの高精度により、ＤＳ、ＳＰＬｉＴ－ＤＳ、およびＣＲＩＳＰＲ－ＤＳ、ならびにこれらの配列決定プラットフォームの変換とワークフローの効率を向上させる方法は、腫瘍学の分野で有望である。本明細書に記載されるように、提供される方法および組成物は、エラー訂正を維持しながら効率および拡張性を高めるために、ＤＳの二本鎖分子タグ付けを標的配列特異的増幅（例えばＰＣＲ）と統合するＤＳ方法論への革新的なアプローチを可能にする。

非常に精確で効率的なアッセイの必要性に加えて、臨床検査室の現実は、高速で拡張性があり、合理的に費用効果の高いアッセイも要求する。したがって、ＤＳのワークフロー効率を改善する本技術の態様による様々な実施形態（例えば、ＤＳのための濃縮戦略）が非常に望ましい。本書に記載されているように、ＤＳ用途のための特定の標的配列の増幅ベースの濃縮および消化／サイズ選択濃縮は、高い標的特異性、低ＤＮＡインプットでの性能、拡張性、および最小コスト（通常約２～３ドル／試料）を提供する。

提供される方法および組成物のいくつかの実施形態は、一般にがん研究、特にｃｔＤＮＡの分野で特に重要であり、これは、本明細書で開発された技術が、ＤＮＡインプット、調製時間、およびコストを最小限にしながら、比類ない感度でがん変異を同定する可能性があるためである。本明細書に開示される他の実施形態の中でも特に、ＳＰＬｉＴ－ＤＳおよびＣＲＩＳＰＲ－ＤＳは、改善された患者管理および早期がん検出により生存率を大幅に高めることができる臨床用途に有用であり得る。
本発明の具体的な実施態様をいくつか以下に例示する。
〔１〕１つ以上の二本鎖核酸分子を含む二本鎖核酸材料を提供することであって、各々の二本鎖核酸分子が、各々の鎖上の単一分子識別子配列と前記核酸分子の５’末端および／または３’末端のうちの少なくとも１つの上のアダプターとを含み、各々の核酸分子に対して、第１のアダプター配列が前記核酸分子の第１の鎖と関連し、第２のアダプター配列が前記核酸分子の第２の鎖と関連する、提供することと、
前記核酸材料を増幅することと、
前記増幅した核酸材料を、第１の試料と第２の試料とに分離することと、
前記第１のアダプター配列に特異的なプライマーの使用を通じて前記第１の試料中の前記第１の鎖を増幅して、第１の核酸産物をもたらすことと、
前記第２のアダプター配列に特異的なプライマーの使用を通じて前記第２の試料中の前記第２の鎖を増幅して、第２の核酸産物をもたらすことと、
前記第１の核酸産物および第２の核酸産物の各々を配列決定することと、
前記第１の核酸産物の配列と前記第２の核酸産物の配列とを比較することと、を含む、方法。
〔２〕前記核酸材料が、二本鎖ＤＮＡおよび二本鎖ＲＮＡのうちの少なくとも１つであるか、またはそれを含む、前記〔１〕に記載の方法。
〔３〕前記提供するステップが、
二本鎖核酸材料を少なくとも１つの縮重または半縮重バーコード配列にライゲートして、二本鎖核酸分子バーコード複合体を形成することを含み、前記バーコード配列が、前記単一分子識別子配列を含む、前記〔１〕または前記〔２〕に記載の方法。
〔４〕前記単一分子識別子配列が、前記二本鎖核酸分子を一意的に標識する、縮重もしくは半縮重バーコード配列、前記核酸材料の１つ以上の核酸断片末端、またはそれらの組み合わせのうちの少なくとも１つである、前記〔１〕または前記〔２〕に記載の方法。
〔５〕前記単一分子識別子配列が、内因性のせん断点または前記せん断点に位置的に関連する可能性のある内因性の配列を含む、前記〔１〕または前記〔２〕に記載の方法。
〔６〕前記核酸材料を増幅することが、前記第１の鎖に由来する複数の増幅産物と、前記第２の鎖に由来する複数の増幅産物とを生成することを含む、前記〔１〕～〔５〕のいずれか１項に記載の方法。
〔７〕前記第１の試料中の前記核酸材料を増幅することが、
前記第１のアダプター配列中に存在する配列に少なくとも部分的に相補的である少なくとも１つの一本鎖オリゴヌクレオチドと目的の標的配列に少なくとも部分的に相補的である少なくとも１つの一本鎖オリゴヌクレオチドとを使用して、前記単一分子識別子配列が少なくとも部分的に維持されるように、元の二本鎖核酸分子からの単一の核酸鎖に由来する核酸材料を増幅することを含む、前記〔１〕～〔６〕のいずれか１項に記載の方法。
〔８〕前記第２の試料中の前記核酸材料の前記増幅することが、
前記第２のアダプター配列中に存在する配列に少なくとも部分的に相補的である少なくとも１つの一本鎖オリゴヌクレオチドと目的の標的配列に少なくとも部分的に相補的である少なくとも１つの一本鎖オリゴヌクレオチドとを使用して、前記単一分子識別子配列が少なくとも部分的に維持されるように、元の二本鎖核酸分子からの単一の核酸鎖に由来する核酸材料を増幅することを含む、前記〔１〕～〔７〕のいずれか１項に記載の方法。
〔９〕前記核酸材料の少なくとも一部が損傷している、前記〔１〕～〔８〕のいずれか１項に記載の方法。
〔１０〕前記損傷が、酸化、アルキル化、脱アミノ化、メチル化、加水分解、ヒドロキシル化、ニッキング、鎖内架橋、鎖間架橋、平滑末端鎖切断、付着末端二重鎖切断、リン酸化、脱リン酸化、ＳＵＭＯ化、グリコシル化、脱グリコシル化、プトレシニル化、カルボキシル化、ハロゲン化、ホルミル化、一本鎖ギャップ、熱による損傷、乾燥による損傷、紫外線暴露による損傷、ガンマ線による損傷、Ｘ線による損傷、電離放射線による損傷、非電離放射線による損傷、重粒子線による損傷、核崩壊による損傷、ベータ線による損傷、アルファ線による損傷、中性子線による損傷、陽子線による損傷、宇宙線による損傷、高ｐＨによる損傷、低ｐＨによる損傷、反応性酸化種による損傷、フリーラジカルによる損傷、過酸化物による損傷、次亜塩素酸塩による損傷、ホルマリンまたはホルムアルデヒドなどの組織固定による損傷、反応性鉄による損傷、低イオン状態による損傷、高イオン状態による損傷、緩衝されていない状態による損傷、ヌクレアーゼによる損傷、環境暴露による損傷、火災による損傷、機械的ストレスによる損傷、酵素分解による損傷、微生物による損傷、分取機械的せん断による損傷、分取酵素による断片化による損傷、生体内で自然に生じた損傷、核酸抽出中に生じた損傷、配列決定ライブラリーの調製中に生じた損傷、ポリメラーゼによって導入された損傷、核酸の修復中に導入された損傷、核酸の末端処理中に生じた損傷、核酸ライゲーション中に生じた損傷、配列決定中に生じた損傷、ＤＮＡの機械的取り扱いにより生じた損傷、ナノポアを通過する際に生じた損傷、生物の老化の一部として生じた損傷、個体の化学物質への暴露の結果として生じた損傷、変異原性物質により生じた損傷、発がん性物質により生じた損傷、染色体異常誘発物質により生じた損傷、酸素暴露による生体内炎症損傷により生じた損傷、１つ以上の鎖切断による損傷、およびそれらの組み合わせのうちの少なくとも１つであるか、またはそれを含む、前記〔９〕に記載の方法。
〔１１〕前記核酸材料が、対象または生物を起源とする１つ以上の二本鎖核酸分子を含む試料により提供される、前記〔１〕～〔１０〕のいずれか１項に記載の方法。
〔１２〕前記試料が、体組織、生検、皮膚試料、血液、血清、血漿、汗、唾液、脳脊髄液、粘液、子宮洗浄液、膣スワブ、パップスメア、鼻腔スワブ、口腔スワブ、組織擦過検体、髪の毛、指紋、尿、便、硝子体液、腹膜洗浄液、唾液、気管支洗浄液、口腔洗浄液、胸膜洗浄液、胃洗浄液、胃液、胆汁、膵管洗浄液、胆管洗浄液、総胆管洗浄液、胆嚢液、滑液、感染性創傷、非感染性創傷、考古学的な試料、法医学試料、水試料、組織試料、食品試料、バイオリアクター試料、植物試料、細菌試料、原生動物のサンプル、真菌試料、動物試料、ウイルス試料、複数の生体の試料、爪擦過検体、精液、前立腺液、膣液、膣スワブ、卵管洗浄液、無細胞核酸、細胞内の核酸、メタゲノミクス試料、移植された異物の洗浄液またはスワブ、鼻洗浄液、腸液、上皮擦過検体、上皮洗浄液、組織生検、剖検試料、剖検試料、臓器試料、人物同定試料、非ヒト同定試料、人工的に産生された核酸試料、合成遺伝子試料、バンクに寄託または保管された試料、腫瘍組織、胎児試料、臓器移植試料、微生物培養試料、核ＤＮＡ試料、ミトコンドリアＤＮＡ試料、葉緑体ＤＮＡ試料、アピコプラストＤＮＡ試料、細胞小器官試料、およびそれらの任意の組み合わせであるか、またはそれを含む、前記〔１１〕に記載の方法。
〔１３〕前記核酸材料が、実質的に均一またはほぼ均一な長さの核酸分子を含む、前記〔１〕～〔１２〕のいずれか１項に記載の方法。
〔１４〕前記実質的に均一な長さが、約１～約１，０００，０００塩基である、前記〔１３〕に記載の方法。
〔１５〕前記核酸材料が、標的化エンドヌクレアーゼによって実質的に均一またはほぼ均一の長さの核酸分子に切断されている、前記〔１３〕または前記〔１４〕に記載の方法。
〔１６〕前記核酸材料が、１つ以上の実質的に既知のサイズ範囲内の長さを有する核酸分子を含む、前記〔１〕～〔１２〕のいずれか１項に記載の方法。
〔１７〕前記核酸分子が１～約１，０００，０００塩基、約１０～約１０，０００塩基、約１００～約１０００塩基、約１００～約６００塩基、約１００～約５００塩基、またはそれらのいくつかの組み合わせである、前記〔１６〕に記載の方法。
〔１８〕前記方法が、前記提供するステップの前に、
実質的に既知の長さの標的核酸断片が形成されるように、１つ以上の標的化エンドヌクレアーゼにより前記核酸材料を切断することと、
前記実質的に既知の長さに基づいて、前記標的核酸断片を単離することと、を含む、前記〔１〕～〔１７〕のいずれか１項に記載の方法。
〔１９〕前記１つ以上の標的化エンドヌクレアーゼが、リボ核タンパク質、Ｃａｓ酵素、Ｃａｓ９様酵素、メガヌクレアーゼ、転写活性化因子様エフェクターベースヌクレアーゼ（ＴＡＬＥＮ）、ジンクフィンガーヌクレアーゼ、アルゴノートヌクレアーゼ、またはそれらの組み合わせからなる群から選択される、前記〔１８〕に記載の方法。
〔２０〕前記１つ以上の標的化エンドヌクレアーゼが、Ｃａｓ９もしくはＣＰＦ１またはそれらの誘導体を含む、前記〔１８〕または前記〔１９〕に記載の方法。
〔２１〕前記提供するステップの前に、前記アダプターを前記標的核酸断片にライゲートすることをさらに含む、前記〔１８〕～〔２０〕のいずれか１項に記載の方法。
〔２２〕前記標的核酸断片が対象または生物を起源とする、前記〔１８〕～〔２１〕のいずれか１項に記載の方法。
〔２３〕前記標的核酸断片が少なくとも部分的に人工的に合成されている、前記〔１８〕～〔２１〕のいずれか１項に記載の方法。
〔２４〕前記核酸材料を切断することが、実質的に既知の長さの２つ以上の標的核酸断片が形成されるように、前記核酸材料を１つ以上の標的化エンドヌクレアーゼによって切断することを含む、前記〔１８〕～〔２３〕のいずれか１項に記載の方法。
〔２５〕前記標的核酸断片が、異なる実質的に既知の長さである、前記〔２４〕に記載の方法。
〔２６〕前記標的核酸断片がそれぞれ、ゲノム中の１つ以上の異なる位置からの目的のゲノム配列を含む、前記〔２４〕に記載の方法。
〔２７〕前記標的核酸断片がそれぞれ、前記核酸材料内の実質的に既知の領域からの標的配列を含む、前記〔２４〕に記載の方法。
〔２８〕前記実質的に既知の長さに基づいて前記標的核酸断片を単離することが、ゲル電気泳動、ゲル精製、液体クロマトグラフィー、サイズ排除精製、濾過、またはＳＰＲＩビーズ精製による前記標的核酸断片の濃縮を含む、前記〔１８〕～〔２７〕のいずれか１項に記載の方法。
〔２９〕少なくとも１つの増幅するステップが、少なくとも１つの非標準ヌクレオチドであるか、またはそれを含む少なくとも１つのプライマーを含む、前記〔１〕～〔２８〕のいずれか１項に記載の方法。
〔３０〕少なくとも１つのアダプター配列が、少なくとも１つの非標準ヌクレオチドであるか、またはそれを含む、前記〔１〕～〔２９〕のいずれか１項に記載の方法。
〔３１〕前記非標準ヌクレオチドが、ウラシル、メチル化ヌクレオチド、ＲＮＡヌクレオチド、リボースヌクレオチド、８－オキソ－グアニン、ビオチン化ヌクレオチド、デスチオビオチンヌクレオチド、チオール修飾ヌクレオチド、アクリダイト修飾ヌクレオチドｉｓｏ－ｄＣ、ｉｓｏｄＧ、２’－Ｏ－メチルヌクレオチド、イノシンヌクレオチドロックド核酸、ペプチド核酸、５メチルｄＣ、５－ブロモデオキシウリジン、２，６－ジアミノプリン、２－アミノプリンヌクレオチド、脱塩基ヌクレオチド、５－ニトロインドールヌクレオチド、アデニル化ヌクレオチド、アジドヌクレオチド、ジゴキシゲニンヌクレオチド、Ｉリンカー、５’ヘキシニル修飾ヌクレオチド、５－オクタジイニルｄＵ、光開裂性スペーサー、非光開裂性スペーサー、クリックケミストリー対応の修飾ヌクレオチド、蛍光色素、ビオチン、フラン、ＢｒｄＵ、フルオロ－ｄＵ、ｌｏｔｏ－ｄＵ、およびそれらの任意の組み合わせから選択される、前記〔２９〕または前記〔３０〕に記載の方法。
〔３２〕前記第１の核酸産物および第２の核酸産物の各々を配列決定することが、
前記第１の核酸産物中の複数の鎖の前記配列を比較して、第１の鎖のコンセンサス配列を決定することと、
前記第２の核酸産物中の複数の鎖の前記配列を比較して、第２の鎖のコンセンサス配列を決定することと、を含む、前記〔１〕～〔３１〕のいずれか１項に記載の方法。
〔３３〕前記第１の核酸産物の前記配列を、前記第２の核酸産物の前記配列と比較することが、前記第１の鎖のコンセンサス配列と前記第２の鎖のコンセンサス配列を比較して、エラーが訂正されたコンセンサス配列を提供することを含む、前記〔３２〕に記載の方法。
〔３４〕前記第１の核酸産物および第２の核酸産物の各々を配列決定することが、
前記第１の鎖の少なくとも１つを配列決定して、第１の鎖の配列読取を決定することと、
前記第２の鎖の少なくとも１つを配列決定して、第２の鎖の配列読取を決定することと、
前記第１の鎖の配列読取と前記第２の鎖の配列読取とを比較して、エラーが訂正された配列読取を生成することと、を含む、前記〔１〕～〔３３〕のいずれか１項に記載の方法。
〔３５〕前記エラーが訂正された配列読取が、前記第１の鎖の配列読取と前記第２の鎖の配列読取との間で一致するヌクレオチド塩基を含む、前記〔３４〕に記載の方法。
〔３６〕前記エラーが訂正された配列読取の特定の位置で生じる変動が真のバリアントとして同定される、前記〔３４〕または前記〔３５〕に記載の方法。
〔３７〕前記第１の鎖の配列読取または前記第２の鎖の配列読取の一方のみの特定の位置で生じる変動が潜在的なアーティファクトとして同定される、前記〔３４〕～〔３６〕のいずれか１項に記載の方法。
〔３８〕前記エラーが訂正された配列読取が、二本鎖標的核酸分子が由来する生物または対象における、がん、がんリスク、がん変異、がんの代謝状態、ミューテーターの表現型、発がん物質への暴露、毒素暴露、慢性炎症暴露、年齢、神経変性疾患、病原体、薬剤耐性バリアント、胎児分子、法医学に関連する分子、免疫学的に関連する分子、変異したＴ細胞受容体、変異したＢ細胞受容体、変異した免疫グロブリン遺伝子座、ゲノムのカタエギス部位、ゲノムの超変異部位、低頻度バリアント、サブクローンバリアント、少数の分子集団、混入源、核酸合成エラー、酵素修飾エラー、化学修飾エラー、遺伝子編集エラー、遺伝子治療エラー、核酸情報ストレージの断片、微生物の準種、ウイルスの準種、臓器移植、臓器移植拒絶、がん再発、治療後の残存がん、前がん状態、異形成状態、マイクロキメリズム状態、幹細胞移植状態、細胞療法状態、別の分子に付着した核酸標識、またはそれらの組み合わせを同定または特性評価するために使用される、前記〔３４〕～〔３６〕のいずれか１項に記載の方法。
〔３９〕前記エラーが訂正された配列読取が、変異原性化合物または曝露を同定するために使用される、前記〔３４〕～〔３６〕のいずれか１項に記載の方法。
〔４０〕前記エラーが訂正された配列読取が、発がん性化合物または曝露を同定するために使用される、前記〔３４〕～〔３６〕のいずれか１項に記載の方法。
〔４１〕前記核酸材料が法医学試料に由来し、前記エラーが訂正された配列読取が法医学分析で使用される、前記〔３４〕～〔３６〕のいずれか１項に記載の方法。
〔４２〕少なくとも１つの増幅するステップがポリメラーゼ連鎖反応（ＰＣＲ）を含む、前記〔１〕～〔４１〕のいずれか１項に記載の方法。
〔４３〕最大でも１０００ｎｇの核酸材料が最初に提供される、前記〔１〕～〔４２〕のいずれか１項に記載の方法。
〔４４〕最大でも１０ｎｇの核酸材料が最初に提供される、前記〔１〕～〔４３〕のいずれか１項に記載の方法。
〔４５〕前記第１の試料中の前記核酸材料を増幅することが、前記分離するステップの後、および前記第１の試料を前記増幅することの前に、前記核酸材料上に見られる第２のアダプター配列を破壊または崩壊することをさらに含む、前記〔１〕～〔４４〕のいずれか１項に記載の方法。
〔４６〕前記第２の試料中の前記核酸材料を増幅することが、前記分離するステップの後、および前記第２の試料を前記増幅することの前に、前記核酸材料上に見られる第１のアダプター配列を破壊または崩壊することをさらに含む、前記〔１〕～〔４５〕のいずれか１項に記載の方法。
〔４７〕前記破壊することが、酵素消化、少なくとも１つの複製阻害分子の含有、酵素的切断、一方の鎖の酵素的切断、両方の鎖の酵素的切断、切断または一方もしくは両方の鎖をもたらす酵素処理が後に続く修飾された核酸の取り込み、複製阻止ヌクレオチドの組み込み、連鎖停止剤の組み込み、光切断可能なリンカーの取り込み、ウラシルの取り込み、リボース塩基の取り込み、８－オキソ－グアニン付加物の組み込み、制限エンドヌクレアーゼの使用、標的化ヌクレアーゼの使用、およびそれらの任意の組み合わせの少なくとも１つを含む、前記〔４５〕または前記〔４６〕に記載の方法。
〔４８〕増幅することが、ローリングサークル増幅、多置換増幅、等温増幅、ブリッジ増幅、または表面結合増幅を含む、前記〔１〕～〔４７〕のいずれか１項に記載の方法。
〔４９〕前記核酸材料を増幅することが、目的の配列に少なくとも部分的に相補的な一本鎖オリゴヌクレオチド、および前記アダプターの領域に少なくとも部分的に相補的な一本鎖オリゴヌクレオチドの使用を含む、前記〔１〕～〔４８〕のいずれか１項に記載の方法。
〔５０〕前記核酸材料が、前記核酸材料の各々の鎖の５’末端および３’末端の各々にアダプターを含む、前記〔１〕～〔４９〕のいずれか１項に記載の方法。
〔５１〕前記核酸材料を増幅することが、前記第１のアダプター配列および前記第２のアダプター配列の領域に少なくとも部分的に相補的な一本鎖オリゴヌクレオチドの使用を含む、前記〔５０〕に記載の方法。
〔５２〕前記アダプターが、少なくとも部分的に非相補的であるか、または少なくとも１つの非標準塩基を含む少なくとも１つのヌクレオチド位置を含む、前記〔１〕～〔５１〕のいずれか１項に記載の方法。
〔５３〕前記アダプターが、約５個以上の自己相補型ヌクレオチドによって形成される単一の「Ｕ字型」オリゴヌクレオチド配列を含む、前記〔１〕～〔５２〕のいずれか１項に記載の方法。
〔５４〕二本鎖核酸材料を提供することであって、前記核酸材料が、標的化エンドヌクレアーゼによる切断の結果、約１～１，０００，０００塩基であり、前記核酸材料が、前記核酸材料の各々の鎖上の単一分子識別子配列と前記核酸材料の各々の鎖上の５’末端および３’末端のうちの少なくとも１つの上のアダプター配列とを含み、第１のアダプター配列が前記核酸材料の第１の鎖の５’末端または３’末端の１つの上に位置し、第２のアダプター配列が前記核酸材料の第２の鎖の反対の末端の上に位置し、前記第１の鎖と前記第２の鎖が、同一の二本鎖核酸分子を起源とする、提供することと、
前記核酸材料を増幅することと、
前記増幅した核酸材料を、第１の試料と第２の試料とに分離することと、
前記第１のアダプター配列に特異的なプライマーの使用を通じて前記第１の試料中の前記第１の鎖を増幅して、第１の核酸産物をもたらすことと、
前記第２のアダプター配列に特異的なプライマーの使用を通じて前記第２の試料中の前記第２の鎖を増幅して、第２の核酸産物をもたらすことと、
前記第１の核酸産物および第２の核酸産物の各々を配列決定することと、
前記第１の核酸産物の配列と前記第２の核酸産物の配列とを比較することと、を含む、方法。
〔５５〕前記核酸材料が、２つ以上の供給源に由来する核酸材料を含む、前記〔１〕～〔５４〕のいずれか１項に記載の方法。

実施例１：ＳＰＬｉＴ－ＤＳ
ＳＰＬｉＴ－ＤＳは、デュプレックス配列決定エラー訂正（図４Ａ）のための各鎖の分子バーコードの使用と互換性のあるＰＣＲベースの標的濃縮戦略である。この例示的な実施形態では、ＳＰＬｉＴ－ＤＳ分析を開始するために、１つ以上のアプローチを使用して１つ以上のＤＮＡ試料が断片化される（当技術分野で既知のこれまでに記載されたデュプレックス配列決定ライブラリー構築と同様）。断片化の後、最も一般的には末端修復と３’－ｄＡ－テーリングが行われ、続いて各ＤＮＡ断片と縮重または半縮重二本鎖バーコードを含むＴ－テール付きＤＳアダプターとライゲートされる（図４、ステップ１）。代替的に、他のタイプのライゲーション突出、平滑末端ライゲーション、または国際特許公開第ＷＯ２０１７／１００４４１号および米国特許第９，７５２，１８８号にこれまでに記載されたアダプターライゲーション化学を使用することができる。実質的に全てのデュエル適合ＤＮＡ分子は、一本鎖アダプターテールのユニバーサルプライマー結合部位に特異的なプライマーを使用してＰＣＲ増幅され、各鎖に由来するＤＮＡ断片（「バーコード断片」）の複数のバーコードコピーをもたらす（図４、ステップ２）。反応副産物を除去した後、所与の試料を２つの別々のチューブに分割する（図４、ステップ３）（すなわち、試料を半分に分割し、各チューブが試料の内容の約半分を含む）。平均して、所与のバーコード断片のコピーの半分が各チューブに移されるが、試料の分割に伴うランダム性により、所与のバーコード断片の分布に分散が生じる可能性がある。このような分散を説明するために、超幾何分布（すなわち、置換なしでｋ個のバーコードコピーを選択する確率）をモデルとして使用して、各チューブが元の二重鎖の２本（つまり両方）のＤＮＡ鎖のそれぞれに由来する少なくとも１つのバーコード断片を含むということのかなり高い確率を達成するために必要な所与のバーコードのＰＣＲコピーの最小数を決定する。超幾何モデルによると、ステップ１での４を超えるＰＣＲサイクル（すなわち、２Ｅ４＝１６コピー／バーコード）により、各バーコード断片（各鎖から）が各チューブで少なくとも１回表れることが９９％を超える確率を提供する可能性が高いと考えられる。これは、全てのシナリオで現実的ではないかもしれない均一でほぼ１００％のＰＣＲ増幅効率を前提としているが、比較的低いインプットの高品質ＤＮＡ試料（例えば、５０ｕＬのＰＣＲあたり１０ｎｇのヒトゲノムＤＮＡ）での合理的な仮定である。試料を２本のチューブに分割した後、標的座位は、アダプター配列と目的の座位に特異的なプライマーを使用したマルチプレックスＰＣＲで濃縮される（図４、ステップ４）。

マルチプレックス座位特異的ＰＣＲは、各チューブで得られるＰＣＲ産物が、所与のＤＮＡ分子試料の２本の元の鎖のうちの１本のみに由来するように行われる。これは、本明細書に記載されているように２つのチューブ（第１チューブと第２チューブ）に分割された試料を使用して、次の手順に従って実現される。第１のチューブでは、「読取１」アダプター配列（図４、ステップ３、灰色の矢印）にハイブリダイズするのに特異的なプライマー（すなわち、ＩｌｌｕｍｉｎａＰ５）、および目的の遺伝子座に特異的な、読取２アダプター配列（図４、ステップ３、灰色の尾を持つ黒い矢印）の配列でテールされるプライマー（すなわち、ＩｌｌｕｍｉｎａＰ７）を使用してＰＣＲを実行する。代替的に、このテールを短くして、完全なＰ７配列を含まないようにすることもでき、代わりに、配列決定の前に、のちのＰＣＲにおいて追加することもできる。このステップでは、各末端に１つのＰ５および１つのＰ７配列を含む増幅産物が、元の親ＤＮＡ分子の１本の鎖（すなわち、最初の試料ＤＮＡ）に由来するＤＮＡからのみ生じることが提案される。逐次的にまたは同時に、第２のチューブで同様の反応が繰り返され、第１のチューブでの試料の増幅と比較して、同一のゲノム位置の反対側の鎖に由来する増幅産物から増幅が起こる。これは、チューブ１のように反対の鎖の向きにアニールする、反対のユニバーサルプライマー配列（すなわち、Ｐ７の代わりにＰ５）と反対のユニバーサルプライマー配列へのアダプタープライマー（すなわちＰ５の代わりにＰ７）でテールされた座位特異的プライマー（すなわち、反参照対参照配列）を使用することにより達成される。データは、従来のデュプレックス配列決定分析／ライブラリー構築で使用されるものと同様のアプローチで分析され、これにより、「元の第１の鎖または元の第２の鎖」由来の特定のバーコードを共有する読取が一本鎖コンセンサス配列にグループ化される。

次いで、これらの一本鎖コンセンサス配列（「ＳＳＣＳ」）は、他の元の鎖（例えば、本明細書に記載されるような反対の鎖）について計算されたコンセンサスと比較される。ヌクレオチド位置の識別性は、同一の位置で得られた配列が二重鎖の元の鎖のそれぞれに由来する２つのＳＳＣＳに対して相補的である場合にのみ保持される。位置の識別性がＳＳＣＳで一致しない場合、これは指摘される。対になったＳＳＣＳ間で一致するヌクレオチド位置については、この位置の識別性は最終的なデュプレックスコンセンサス配列に詳述される（すなわち、ＤＣＳを形成する）（図１Ｃ）。２つのＳＳＣＳ間の配列識別性が一致しない位置については、潜在的なエラー部位としてフラグが付され、通常、この位置を不明（すなわち、「Ｎ」）としてマークすることで無視される。国際特許公開第ＷＯ２０１７／１００４４１号および米国特許第９，７５２，１８８号でこれまでに説明された代替戦略には、不一致が見つかった場合にコンセンサス読取全体を無視するか、統計的アプローチを使用して一方のバリアントと他方のバリアントに信頼性を割り当て、特定のタイプのエラーの事前の確率およびそれを構成するファミリーの数について所与のＳＳＣＳがどれだけうまく表現されているかおよびそれらがどれらけ一致するかに基づいてどちらが真のバリアントである可能性が高いかを決定する。別のアプローチは、例えば、ＩＵＰＡＣ命名法（ＧまたはＴのいずれかである位置を表す「Ｋ」など）を使用して、ヌクレオチド位置の不確実性を保持することである。コンセンサス配列データファイルに追加情報を適用して、例えば特定のタイプのシーケンサーの事前の確率または所与の配列コンテキストまたは各ペアのコンセンサスファミリーのその位置で各バリアントをサポートする読取の相対的な数、またはＳＳＣＳファミリーを含む未処理の赤の読取品質スコアなどに基づいて、別の不確かな位置に対する１つのヌクレオチドの識別性の相対尤度を反映する。

デュプレックスコンセンサスコールアプローチは、国際特許公開第ＷＯ２０１７／１００４４１号および米国特許第９，７５２，１８８号に記載されているものと実質的に類似するが、ＳＰＬｉＴ－ＤＳの場合には、分子の端の単一の分子識別子配列は、通常、個々の分子を識別するために使用され（各端に１つではなく）、元の鎖の１つのコピーに由来する配列読取は１つのチューブに見られ、相補的な元の鎖は他のチューブに見られ得る。しかしながら、必ずしもそうである必要はなく：本明細書にで記載されるように、二重鎖増幅ライブラリーのＰＣＲ反応は、２つより多いチューブ（例えば、各チューブに１つの特定のプライマーペアを持つ４つのチューブ）に分割され、分子ごとに２つのデュプレックスコンセンサス配列が作製されるように、元の分子の両端で上記のプロセスを実行できる。同様に、初期のＰＣＲ反応を複数のチューブに分割し（図１０）、デュプレックス配列決定エラー訂正および／または短い読取配列を持つ長いシーケンスのサブアセンブリに対して複数の読取を生成できる。

しばしば、各チューブの産物に異なるインデックスを付けて、マルチプレックス配列決定後にそれらを区別することに利便性がある。ただし、これは必須ではない。ＳＰＬｉＴ－ＤＳの利点の１つは、ＰＣＲを使用する標的化濃縮を実現できることであり、これにより、目的の領域を濃縮するためにハイブリッド捕捉に依存する以前のバージョンのデュプレックス配列決定または他のアプローチのワークフローが高速化される。同時に、デュプレックスアダプターとタグを使用して最大限の精確さを実現できるが、これは従来のアンプリコン配列決定では達成できない。

実施例２ＣＯＤＩＳＳＴＲ座位のためのＳＰＬｉＴ－ＤＳの開発
本実施例は、短いタンデムリピート（ＳＴＲ）などのＤＮＡの反復領域を遺伝子型決定する現在利用可能な方法が精確さと感度の改善から利益を得るという洞察に基づいている。本実施例は、「ＳＰＬｉＴ－ＤＳ」アッセイ／プロトコールを作成するために、ＤＳのための確立されたプロトコール（それ自体が「スタッター」を除去できる；図３Ｂ）を拡張および改善する。現在の例では、（１）マルチプレックスＰＣＲで使用するためのプライマーの設計とその後の選択、（２）ＤＮＡライブラリーの調製を改善する方法、（３）例えば、減少するＤＮＡ量の使用などの提供された技術の精確さ、精度、感度、特異性の評価；（４）最終的なエラーが訂正されたデータの大幅に減少したスタッターの実証を実証した。

マルチプレックスＰＣＲのためのプライマー設計と選択
ＳＰＬｉＴ－ＤＳＰＣＲプライマーは、好ましくは次の特性を持つように設計されている：１）高い標的特異性、２）多重化できる、３）堅牢で最小限にバイアスのある増幅を示す。従来のＰＣＲキャピラリー電気泳動（ＰＣＲ－ＣＥ）で使用するためのこれらの基準を満たす多くの既存のプライマー混合物が存在するが、ＭＰＳでは同一のプライマー混合物は信頼できない。この目的のために、利用可能なデータ（配列決定の前に標的座位を増幅する市販のキットを使用して取得した配列決定データからのマッピング座標（すなわち、ペアエンド配列決定データの各読取の５’端は、ＤＮＡを増幅するために使用されるＰＣＲプライマーの５’端に対応する））は、この例で使用するためのプライマーを開発するために活用された。本明細書で説明する洞察とこれまでの実施例から得られたデータは、拡張ＣＯＤＩＳコア座位（ＣＯＤＩＳ２０）に加えて、ＰｅｎｔａＤ、ＰｅｎｔａＥ、およびＳＥ３３２９（簡潔に、別途示されない限り、これはまとめて単にＣＯＤＩＳ座位と呼ばれる）の初期プライマーセットの設計を通知するために使用される。これまでに決定されたマッピング座標は、長さ、融解温度、濃度など、市販の（またはその他の）キットで使用されるプライマーに関する他の情報を提供しないため、本実施例でのプライマーの作成は、反応を多重化する前の、均一、堅牢、および特異的な増幅を達成する確率を最大にする設計に焦点を当てている。

結果は、ゲル分析などとは対照的に、直接配列決定（例えば、ＩｌｌｕｍｉｎａＭｉＳｅｑプラットフォーム）によって分析できる。最適なプライマー混合物を設計するために、各試料をいくつかの基準で評価できる。基準には以下が含まれる：１）特異性（すなわち、オンターゲット読取の数をオフターゲット読取の数で割った値）、２）ヘテロ接合座位の対立遺伝子包含率（すなわち、低深度の対立遺伝子を高深度の対立遺伝子で割ったもの；理想は１．０）、３）座位間バランス（すなわち、最低深度座位を最高深度座位で割ったもの；理想は１．０）、４）深度の変化（すなわち、各座位の平均深度を全ての座位の合計平均深度で割ったもの）。さらなる分析と開発のために、これらの基準に基づいて少なくとも１つのプライマーセットを選択できる。代替的および／または追加的に、プライマー設計は、例えば、各ＳＴＲマーカーのＰｒｉｍｅｒ３などのウェブベースのプログラムの使用を含んでもよい。

実施例３ライブラリーの調製方法の改善
ＳＰＬｉＴ－ＤＳのライブラリー調製プロトコールは、第１のＰＣＲステップが完了するまで、デュプレックス配列決定プロトコールなどの既知の標準プロトコールに従う。本実施例は、本明細書で提供されるＳＰＬｉＴ－ＤＳ技術に特有の座位特異的ＰＣＲにおいて、特に、最初のデュプレックス配列決定ＰＣＲステップ後に生じるステップを改善することにより、このプロトコールを改善および拡張する。

参照点として、反応はまず既知の緩衝液、プライマープール濃度、およびＰＣＲ条件（例えば、標準的なＤＳプロトコールのように）を使用して実行されるが、ＳＰＬｉＴ－ＤＳアプローチに適用され、最初のデュプレックス配列決定ＰＣＲが実行され、場合によっては、ハイブリッド捕捉など、他の形式の標的化濃縮が行われる。マルチプレックスＰＣＲでのこれらの条件の有効性は、ＩｌｌｕｍｉｎａＭｉＳｅｑプラットフォームで反応を直接配列決定し、特異性、ヘテロ接合座位の対立遺伝子の包含率、座位間バランス、および深度をモニターすることで決定される。このアッセイはＰＣＲの有効性を評価し（例えばエラー訂正はしない）、条件ごとに約１００，０００～５００，０００の読取が使用され、配列決定実行ごとに少なくとも５０のＰＣＲ条件の分析が可能になる。

この特定の実施例では、分析を成功させるために、各開始ＤＮＡ分子から平均３～１０個の配列決定されたＰＣＲコピー（すなわち、バーコードファミリー）を取得する必要がある。他の実施形態において、成功した分析は、特定の二重鎖分子の各々の元のＤＮＡ鎖の１つ以上のコピーを回収することとして定義され得る。追加の有用なデータがなくても、シーケンサーリソースの使用に関して、３～１０コピーを超えるとアッセイ効率が低下する可能性があると考えられる。各鎖の平均コピーが少なすぎると、定義された成功した分析の基準を満たさず、最終的には深度が減少すると考えられる。いくつかの実施形態では、各鎖の最小数の配列決定されたコピーを達成するとして成功した分析を定義することは、元の鎖あたりの最小必要コピー数が少ないデュプレックス配列決定よりも高い精確さのデュプレックス配列決定を促進すると考えられる。

ＳＰＬｉＴ－ＤＳは、他の現在利用可能な技術と比較して独自のアプローチであるため、ＤＮＡインプットの既知の条件（例えば、他のアッセイで知られている条件）に依存することはできず、したがって、第１のＰＣＲステップが必然的に後処理の深度に影響を与えるまでのインプット量の変更（例えば、低減）として、分割後に発生するＰＣＲで使用されるＤＮＡインプット量が決定される。

ＤＮＡインプット範囲が決定された後、ｑＰＣＲベースのアッセイを使用して、アダプターがライゲートされた標的ＤＮＡの絶対量を定量化する（例えば、図４のステップ３と同様）。

ＤＮＡインプットの減少に伴う精確さ、精度、感度、および特異性
一般的に使用される標準参照物質（ＳＲＭ）ＤＮＡの精確さ、精度、感度、および特異性は、本明細書に記載される改善された技術の参照点として実施される。ＳＰＬｉＴ－ＤＳは、連続希釈（例えば、約５０ｐｇから約１０ｎｇの範囲内）を使用して、インプットＤＮＡの量の減少（すなわち、感度）で実行される（例えば、アプローチの精確さと精度を評価する）。各ＤＮＡインプットに対して、少なくとも６つの異なるライブラリーが個別に調製される。配列決定およびエラー訂正（デュプレックス配列決定のＳＰＬｉＴ－ＤＳバリアント用に特別に開発および設計された社内ソフトウェアを使用）後、ＳＴＲａｉｔＲａｚｏｒを使用して以下についての精確さを評価する：（ｉ）処理されたデータの遺伝子型決定、および／または（ｉｉ）各ＣＯＤＩＳ座位で「訂正」遺伝子型を示す読取の割合を決定（すなわち、標準化された試料から既知）。精度は、以下を決定することにより評価される：（ｉ）ヘテロ接合座位の対立遺伝子包含率、（ｉｉ）座位間バランス、（ｉｉｉ）深度の変化、および／または（ｉｖ）スタッターパーセント（例えば、試料間の変化の定量化）。

混入ＤＮＡの検出
本実施例はまた、外因性ＤＮＡ（例えば、非ヒトＤＮＡで混入されたヒトの法医学的ＤＮＡ）による所与の試料の混入を検出するための現在利用可能なＤＮＡ評価方法の改善に焦点を当てている。ＳＰＬｉＴ－ＤＳ分析は、混入ＤＮＡ（マウス、イヌ、ウシ、トリ、Ｃａｎｄｉｄａａｌｂｉｃａｎｓ、Ｅｓｃｈｅｒｉｃｈｉａｃｏｌｉ、Ｓｔａｐｈｙｌｏｃｏｃｃｕｓａｕｒｅｕｓなど）の存在下でヒトＤＮＡ試料に対して行われる。分析には、１０ｎｇの混入ＤＮＡをスパイクした試料ＤＮＡが含まれ、次の比率で３回繰り返す：５０：５０、１０：１、および１００：１（混入物：試料ＤＮＡ、重量比で）、ならびに１００：０対照（すなわち、ヒトＤＮＡを含まない）０：１００（スパイクされていないヒトＤＮＡ）。正常に生成された各ライブラリーは配列決定され、参照ゲノムとヒトゲノム（ＧＲＣｈ３８）に対応する所与の混入物にマッピングされる。このマッピングを使用して、各座位で正しい（例えば、参照ゲノムと一致する）遺伝子型を示す読取のパーセンテージを決定し、対照の値と比較する。アライメントは、ＳＰＬｉＴ－ＤＳの成功をなおも許容する混入ＤＮＡの範囲に関する情報を提供する（すなわち、ＳＰＬｉＴ－ＤＳの精度や強度に悪影響を与えずに存在する可能性のある混入ＤＮＡのレベル）。

実施例４：唯一の供給源試料でのＳＰＬｉＴ－ＤＳの検証。
ＳＰＬｉＴ－ＤＳが代表的なヒト集団で実行可能な高精度遺伝子型決定法として検証されるように、ＰｅｒｓｏｎａｌＧｅｎｏｍｅＰｒｏｊｅｃｔ（ＰＧＰ）から取得した細胞から精製されたＤＮＡが使用される（例えば、表３のＰＧＰの人口統計の詳細を参照されたい）。
表３：ＰＧＰ試料の詳細

ＳＰＬｉＴ－ＤＳの能力を評価して、ＤＮＡ単一供給源試料を正しく遺伝子型決定する。
ＳＰＬｉＴ－ＤＳは、ＰＧＰの血縁関係のない個人の細胞株から精製されたＤＮＡに対して、２回ずつ実行される。約１１０人の固有の個人からのＤＮＡが試験される。ＳＰＬｉＴ－ＤＳは、前の実施例で決定された適切な量のＤＮＡを使用して実行される（すなわち、各座位の平均６０倍を超えるポストプロセッシング深度で配列決定ライブラリーを確実に（例えば、８０％を超えて）産生する最小量）。本明細書に記載されている社内ＳＰＬｉＴ－ＤＳソフトウェアを使用して配列決定を行い、エラー訂正を実行した後、ＳＴＲａｉｔＲａｚｏｒを使用して試料の遺伝子型を決定する。

ＳＰＬｉＴ－ＤＳデータの遺伝子型決定の解釈ガイドラインとして、次のように、２つの複製の修正された「コンセンサス」アプローチが使用される。

結果なし：少なくとも１つ（例えば、２つのうちの１つ）の複製が低い包含（例えば、６０倍未満）を産生するとき；

正しい遺伝子型：全て（例えば、２つのうち２つ）の複製が予想される遺伝子型を産生するとき（すなわち、所与の試料のＷＧＳデータの遺伝子型と一致する）。

未定義の遺伝子型：所与の座位で全ての複製（２つのうち２つなど）で異なる遺伝子型が取得されるとき、または１つの遺伝子型のみがＷＧＳデータと異なるとき。

誤った遺伝子型：全て（２つのうち２つ）の複製が同一の誤った遺伝子型を示すとき。

配列決定された座位のスタッター比を決定することにより、全ての試料と座位でスタッターの量を定量化する。スタッター比は、所与のスタッター対立遺伝子の読取数を実際の試料の対立遺伝子の読取数で割ることによって計算される。１つを超えるタイプのスタッター事象が観察された場合、各スタッター長の計算が行われる。この分析のバイアスを最小限にするために、スタッター率は、平均深度が６０倍以上の座位でのみ計算される（５％で発生する代替スタッター対立遺伝子を含む１以上のポストプロセッシング読取を検出する８０％の力（１－ＳａｍｐｌｅＢｉｎｏｍｉａｌ試験）。少なくともいくつかの座位で一貫した高い深度包含が得られる場合、低頻度のスタッター事象が調べられ、比率が適切に計算される（例えば、パワーを調整する）。

本実施例の分析の別の部分には、様々なパラメーターに対するＳＴＲの長さの影響が含まれ、参照の所与の座位での結果とＳＴＲの長さと比較することが含まれる（例えば、特異性、ヘテロ接合座位の対立遺伝子包含率、座位間バランス、および／または深度）。これらのパラメーターの評価により、ＳＴＲの長さに基づいた多型の解釈が改善されると考えられる（例えば、評価されるＳＰＬｉＴ－ＤＳ試料は一般的に非近交系の集団から採取され、例えば様々なＳＴＲ長の多型を持っている可能性があることを含む）。ＳＴＲの長さの効果の評価に加えて、スタッター比も決定される。最後に、各試料の識別力の計算（本明細書に記載されているガイドラインに従って正しく遺伝子型決定された座位に基づいて、例えば、米国の人口で予想される対立遺伝子頻度を使用して）が実行される。

本実施例で説明する分析の結果は、例えば様々なタイプの試料、および／またはＳＴＲの遺伝子型決定のためなどの、ＳＰＬｉＴ－ＤＳの使用範囲（および方法の任意のバイアスの程度）を決定する。

キャピラリー電気泳動およびＭＰＳアプローチによる比較および一致の研究
例えば、法医学用途の配列決定法としてのＳＰＬｉＴ－ＤＳの優位性を実証するために、現在利用可能な手法に対する一致研究が実施される。現在、法医学のＳＴＲ遺伝子型決定の「ゴールドスタンダード」はＰＣＲ－ＣＥである。本明細書に記載される実施例に従って得られたＳＰＬｉＴ－ＤＳの結果は、標準手順に従って、ＰＣＲ－ＣＥ分析および１ｎｇのインプットＤＮＡを使用して遺伝子型決定された同一のＤＮＡ試料と比較される。２つのデータセット（ＰＣＲ－ＣＥおよびＳＰＬｉＴ－ＤＳ、適切な対照／参照（例えば、ＷＧＳＰＧＰ試料データ）が伴う）によって、２つのアプローチ間の一致のレベルを決定できる。一致の研究はまた、ＣＯＤＩＳ座位を含む６３のＳＴＲおよび９５の識別性情報ＳＮＰの標的化ＰＣＲ増幅を使用する市販のキット（例えば、ＩｌｌｕｍｉｎａＦＯＲＥＮＳＥＱＤＮＡＳｉｇｎａｔｕｒｅＰｒｅｐＫｉｔ）を使用して実行される。ＰＣＲ－ＣＥとＳＰＬｉＴ－ＤＳの一致の研究で使用されたのと同一の試料が使用され、遺伝子型決定はＳＴＲａｉｔ－Ｒａｚｏｒを使用して実行される。ＰＣＲスタッターも各アプローチ（ＰＣＲ－ＣＥ、市販キット、ＳＰＬｉＴ－ＤＳ）でレビューされ、真の対立遺伝子ピークの高さが少なくとも６００ＲＦＵ（確率的しきい値）であるが１５，０００ＲＦＵを超えない場合にスタッターが計算される。ヘテロ接合対立遺伝子間の繰り返し位置でのプラスおよびマイナスのスタッターの付加的な全ての効果を排除するために、２つの繰り返し単位を離れた位置は含まれない。本明細書に記載されるように、スタッターのパーセンテージは、スタッターピークのピーク高さを真の対立遺伝子のピーク高さで割ることにより計算される。市販のキットによって分析した試料の場合、６０以上の観察された読取を持つ全ての対立遺伝子がコールされ、本明細書に記載されるようにスタッターのパーセンテージが計算される。比較は、試験された各座位のスタッターパーセントの間で実行される。プラットフォーム間のスタッターの結果は互いに直接比較できないが、データは各方法におけるスタッターの相対的な豊富さの合理的な推定を提供すると考えられる。

実施例５：損傷したＤＮＡおよびＤＮＡ混合物に対するＳＰＬｉＴ－ＤＳの検証。
高度に損傷／分解されたＤＮＡおよび混合物は、現在利用可能な遺伝子型決定技術を混乱させる。したがって、本実施例は、ＳＰＬｉＴ－ＤＳが損傷したＤＮＡおよびＤＮＡ混合物を含む試料を正しく遺伝子型決定し、現在利用可能な方法論を改善および拡張する能力を実証する。

単一の寄与者からの損傷したＤＮＡに対するＳＰＬｉＴ－ＤＳの検証
ＳＰＬｉＴ－ＤＳは、法医学的に関連する以下の３つのカテゴリーにさらされた試料ＤＮＡに対して実行される：（ｉ）化学物質への暴露、（ｉｉ）紫外線（ＵＶ）光、および（ｉｉｉ）高温（従来のＳＴＲ分析に影響を与えることが知られている／以前の研究で使用された例示的な暴露方法／条件の要約については、表４を参照されたい）。損傷したＤＮＡ試料に利用できるＳＲＭの不足により、誘発される損傷のレベルは生物学的複製間で標準化される。ＤＮＡは最初に表４に示す環境条件および時点にさらされ、所与の試料中のＤＮＡ損傷／分解の決定に使用される市販のキット（例えば、ＫＡＰＡＢｉｏｓｙｓｔｅｍｓｈｇＤＮＡＱｕａｎｔｉｆｉｃａｔｉｏｎａｎｄＱＣｑＰＣＲｋｉｔ（Ｒｏｃｈｅ／ＫＡＰＡＢｉｏｓｙｓｔｅｍｓ））を使用して評価が行われる。特定の環境条件（本明細書に記載されるアッセイで決定されるような）に対して同等のレベルの損傷（観測平均値の１標準偏差以内として定義）を示す試料のみが、本実施例の分析に使用される。

損傷／分解したＤＮＡでＳＰＬｉＴ－ＤＳを評価する実験は、表４の各カテゴリー（本明細書に記載されるようになされたそのような量の決定）で考えられる最も過酷な条件でＳＰＬｉＴ－ＤＳを使用して配列決定できるライブラリーを一貫して（＞５０％）形成するのに必要な最小インプットＤＮＡ量を使用して、Ｐｒｏｍｅｇａ２８００ＭＳＲＭＤＮＡで３回実行される。一貫性のあるライブラリーを産生しない条件は、損傷／分解したＤＮＡに対するＳＰＬｉＴ－ＤＳの感度の限界を定義するとみなされると考えられる。そのようなライブラリーはいずれも評価されない。
表４：ＤＮＡ損傷条件

試料は、ＩｌｌｕｍｉｎａＭｉＳｅｑプラットフォームで３００ｂｐペアエンド読取を使用して配列決定され、ＳＴＲａｉｔＲａｚｏｒを使用して決定されたデータ遺伝子型について、本明細書に記載されるカスタムＳＰＬｉＴ－ＤＳソフトウェアを使用して処理される。（前の実施例で説明したように）正しく遺伝子型を決定できなくなる実験条件は、損傷／分解したＤＮＡのＳＰＬｉＴ－ＤＳの精確さの限界を定義すると考えられる。計算は、特異性、ヘテロ接合座位の対立遺伝子包含率、および／または損傷／分解ＤＮＡの各座位の深度を決定するために実行され、結果は損傷のない対照と比較される。

高品質のＤＮＡでのＳＰＬｉＴ－ＤＳの相対的な性能は、損傷したＤＮＡでの性能と必ずしも直接変換可能ではないため、ＳＰＬｉＴ－ＤＳ、標準ＰＣＲ－ＣＥ、およびＭＰＳ法を使用して比較も実行される。これらの方法は、以前の実施例で遺伝子型決定した１０のＰＧＰ試料を使用して実行され、正常に遺伝子型決定したＳＰＬｉＴ－ＤＳ試料の損傷の各カテゴリーで最も困難な条件（結果により決定）に供される。試料は、以前の実施例に記載したように、適切な市販のキットを使用して、ＰＣＲ－ＣＥおよび従来のＭＰＳで遺伝子型決定する。ＳＰＬｉＴ－ＤＳのＰＣＲ－ＣＥおよびＭＰＳへの相対的な性能は、アプローチ間のスタッター、対立遺伝子ドロップアウト、対立遺伝子内バランス、および遺伝子型決定の成功率の相対的な量の決定と比較を含んで、本明細書に記載されるように決定される。ＩＳＰＬｉＴ－ＤＳは、他の方法で達成できるよりも、より小さな試料および／またはＤＮＡのより損傷した／より分解した試料を使用して、より高感度で精確な結果をもたらし得る。

混合物でのＳＰＬｉＴ－ＤＳの検証。
広範囲のＭＡＦ比の遺伝的に無関係な２人の個人からなるＤＮＡ混合物のＳＰＬｉＴ－ＤＳ分析の有効性の向上（例えば、利用可能な方法と比較したときの精確さと感度の向上）が実証される。表５の各混合物については、前の例で遺伝子型決定したＰＧＰ試料から、１０組の２人の組み合わせが選択される。本実施例で使用される特定のＰＧＰ試料は、以前の実施例または全ゲノム配列（ＰＧＰの一部として入手可能）により決定される特定の遺伝子型に依存する。可能であれば、８を超える座位で少なくとも２回の繰り返しの長さの異なる寄与者ペアが選択される。各試料から１０ｎｇを超えるＤＮＡが必要になる可能性が高いと考えられる。正確な量は、以前の実施例で決定したように、各座位でＳＰＬｉＴ－ＤＳがどれだけ効率的に機能するかによって決定される。
表５：ＤＮＡ混合物条件

ＤＮＡのインプット量は、任意のマイナーな寄与者が少なくとも１０の読取で表れるように調整される。少なくとも１０の読取がある表現は、全てのＣＯＤＩＳ座位で両方の対立遺伝子を検出する可能性が９５％を超えると考えられる。以前の実施例で示したように、１０のＭＡＦの読取を達成するために必要な特定の量は、ＳＰＬｉＴ－ＤＳの感度の限界に依存する。

複製間のばらつきを最小限にするために、ＱＵＡＮＴＩＦＩＬＥＲＤｕｏＤＮＡ定量化キット（ＴｈｅｒｍｏＦｉｓｈｅｒ）を使用して、３重のＤＮＡ定量化に基づいて混合物を構築する。本明細書に記載されるように、ＩｌｌｕｍｉｎａＭｉＳｅｑプラットフォームで試料を配列決定し、本明細書で記載されるカスタムＳＰＬｉＴ－ＤＳソフトウェアを使用してデータを処理し、ＳＴＲａｉｔＲａｚｏｒを使用して遺伝子型を決定する。これらの実験でスタッターの存在を評価することは、ＤＮＡ混合物でのＳＰＬｉＴ－ＤＳの性能の評価に役立つ。各混合試料で分析された各座位について、既知のＭＡＦのウィルソンスコア間隔（二項比例信頼区間の形式）が計算される。混合物の既知のＭＡＦと１反復長だけ異なるスタッター事象の数計数される。
スタッター読取計数がＭＡＦ対立遺伝子の１つの９５％ウィルソンスコア間隔内にある場合、座位は部分一致とみなされる。両方のＭＡＦ対立遺伝子がこの試験に失敗する場合、座位は失敗した遺伝子型コールとみなされる（ＭＡＦがスタッターと区別できない場合、ホモ接合性対立遺伝子は自動的に失敗する）。以前の実施例と同様に、ＳＰＬｉＴ－ＤＳのＰＣＲ－ＣＥおよびＭＰＳに対する比較研究、ならびにスタッター、対立遺伝子ドロップアウト、対立遺伝子内バランス、および／または遺伝子型決定の成功率の相対的な量の比較も、本明細書に記載されるように実施および評価される。次いで、２人の混合実験の結果を使用して、２人の混合分析と同じ試料選択基準と分析を使用して、３人の混合実験（例えば、表５を参照されたい）を実施する。

ＳＰＬｉＴ－ＤＳは、以前に分析された市販の法医学ＤＮＡ習熟度試験から、ワシントン州パトロール法医学研究所サービスビューローによって提供されたＤＮＡを使用して、単一供給源および２人の混合物の模擬ケースワーク試料を使用して実行される。ＳＰＬｉＴ－ＤＳを使用した遺伝子型決定は、試料のオンライン投稿コンセンサス結果と比較される。

実施例６：損傷したＤＮＡ試料でのＳＰＬｉＴ－ＤＳの向上したパフォーマンス
ホルマリン固定は、シチジン脱アミノ化、酸化的損傷、および架橋の形で極端なＤＮＡ損傷を引き起こす。現在利用可能な方法と比較してＳＰＬｉＴ－ＤＳの機能を実証するために、Ｐｒｏｍｅｇａ２８００ＭＳＲＭのＤ３Ｓ１３５８座位でホルマリン固定された核ＤＮＡを配列決定することにより、高度に損傷したＤＮＡの分析を実施した（図１３Ｂおよび１４Ａ）。図１３Ａ～１３Ｃは、本技術の一実施形態によるＳＰＬｉＴ－ＤＳ手順から得られたデータを示す。図１３Ａは、配列決定前のインサート断片サイズを示す代表的なゲルである（レーン１はラダーであり、レーン２および３は、各チューブからのＰＣＲ産物の試料である、例えば図４のステップ４を参照されたい）。図１３Ｂおよび１３Ｃは、ＣＯＤＩＳ遺伝子型対エラー訂正の非存在下（図１３Ｂ）およびＳＰＬｉＴ－ＤＳによる分析後（図１３Ｃ）の配列決定読取の数を示すグラフである。図１３Ｂは、エラー訂正の非存在下で多型が観察された試料（Ｄ３Ｓ１３５８）を示し、スタッター事象は黒い矢印で示される。図１３Ｃは、ＳＰＬｉＴ－ＤＳによる分析後、検出可能なスタッター事象を含まない試料（Ｄ３Ｓ１３５８－ＤＣＳ）を示す。図１３Ｂおよび１３Ｃのそれぞれのｘ軸は、ＣＯＤＩＳ遺伝子型を示し、ｙ軸は、読取の数を示す。

図１４Ａおよび１４Ｂは、本技術の実施形態による、高度に損傷したＤＮＡに対する、ＣＯＤＩＳ遺伝子型対エラー訂正の非存在下（図１４Ａ）およびＳＰＬｉＴ－ＤＳによる分析後（図１４Ｂ）の配列決定読取の数を示すグラフである。各パネルのｘ軸は、ＣＯＤＩＳ遺伝子型を示し、ｙ軸は、読取の数を示す。図１４Ａは、ＳＰＬｉＴ－ＤＳ（Ｄ３Ｓ１３５８）によって分析されない損傷ＤＮＡ試料を示し、スタッター事象（黒い矢印）および顕著な量の明らかな点変異（図示せず）を示している。図１４Ｂは、ＳＰＬｉＴ－ＤＳエラー訂正で分析された試料（Ｄ３Ｓ１３５８－ＤＣＳ）を示しており、検出可能なスタッター事象がないことを示す。明らかな点突然変異は全く観察されなかった。

ＳＰＬｉＴ－ＤＳの結果は、ホルマリンにさらされたＤＮＡで、標準の配列決定法を使用して存在する全てのＰＣＲおよび配列決定ベースのアーティファクトがＳＰＬｉＴ－ＤＳを使用して排除されることを示した。（図１３Ｃおよび１４Ｂ）。これらの試料では効率の低下（約３倍）があったことが注目された（例えば、図１４Ｂ対図１３Ｃを参照されたい）が、ホルマリン固定に共通の鎖間架橋の存在がこの低下に寄与している可能性がある。

実施例７：標的化ゲノム断片化
本実施例は、ゲノムＤＮＡ（ｇＤＮＡ）の配列決定の効率を改善する方法として、標的化ゲノム断片化を実証している。ＳＰＬｉＴ－ＤＳゲノムの断片化は、通常、例えば物理的せん断またはＤＮＡホスホジエステル結合の酵素消化などの方法によって達成される。そのようなアプローチは、無傷のｇＤＮＡがランダムなサイズのＤＮＡ断片の混合物に低減された試料を産生する。非常に堅牢であるが、可変サイズのＤＮＡ断片は、ＰＣＲ増幅バイアス（短いフラグメントがより多く増幅する）と不均一な配列決定の深度（図１１Ａ）、ならびにＤＮＡ断片内の目的の領域と重複しない配列決定読取を引き起こす可能性がある。したがって、本実施例ではＣＲＩＳＰＲ／Ｃａｓ９を使用してこれらの問題を克服する。切断部位は、あらかじめ決められた均一なサイズの断片を産生するように設計される。断片のより均質なセットは、標的化断片化を使用しない他の技術の効率に影響を与える可能性のあるバイアスおよび／または情報のない読取の存在を克服しない可能性が高いとみなされる。また、断片サイズの一貫性／差異のために、ｇＤＮＡから断片を分離することにより大きなオフターゲット領域の除去が可能になる可能性が高いため、標的化断片化がライブラリー調製前に所与の試料の事前濃縮を促進する可能性が高いと考えられている。

実施例８：がんの監視と診断のためのＳＰＬｉＴ－ＤＳ
血液中の循環腫瘍ＤＮＡの存在は何十年も認識されてきたが、がんバイオマーカー（例えば、疾患の存在／進行を診断および／または追跡するためのマーカー）の信頼できる開発のために超高感度の方法が必要である。ＳＰＬｉＴ－ＤＳは、様々な量の無細胞ＤＮＡを含む血液試料内の少量の循環腫瘍ＤＮＡを含む、広範な課題を克服するのに役立つ。ＳＰＬｉＴ－ＤＳはまた、特定の変異の事前知識を必要としないため、ＢＥＡＭｉｎｇ、ＳａｆｅＳｅｑＳ、ＴａｍＳｅｑ、ｄｄＰＣＲなど、当該技術分野で既知のいくつかの高感度かつ特定の方法を改善および拡張する。ＳＰＬｉＴ－ＤＳは、低いＤＮＡインプットで、特定の腫瘍変異に関する予備知識なしで、現在利用可能な最高レベルの精確さでがん関連変異を検出できるアプローチを提供する。

本実施例では、ＳＰＬｉＴ－ＤＳを使用して、循環腫瘍細胞ＤＮＡに関連する配列を評価する。既知の変異の対照試料が、がんと診断される、および／またはがんの疑いがある患者からの試料と一緒に使用および実行される。

ＳＰＬｉＴ－ＤＳおよびゲノムＤＮＡまたは無細胞ＤＮＡ
ＳＰＬｉＴ－ＤＳは、低インプットｇＤＮＡ（１０～１００ｎｇ）およびｃｆＤＮＡ（約１０ｎｇ）の精確な配列決定のためのアッセイの開発に使用される。ゲノムＤＮＡは一般に大きな断片（１Ｋｂを超える）で発生し、無細胞ＤＮＡはほとんど例外なく、約１５０ｂｐの頻度の少ない断片として発生する。

低インプット（１０～１００ｎｇ）ｇＤＮＡの根拠
本実施例は、低ＤＮＡインプットに対するＳＰＬｉＴ－ＤＳの実現可能性と多重化への適合性を実証する。がん患者の生検から組織を入手し得るが、必要な全ての試験を完了するために、このような試料の使用は控えめにすることが好ましい。したがって、ｇＤＮＡの配列決定は、低インプットの物質を必要とするＳＰＬｉＴ－ＤＳが提供するプラットフォームなどの改善されたプラットフォームから恩恵を受ける。

ＳＰＬｉＴ－ＤＳの各標的は、個別に設計および最適化される。遺伝子ＴＰ５３、ＫＲＡＳ、およびＢＲＡＦは、原理の証明として分析される。特に、各遺伝子にはがんに関連する変異が発生する既知の標的領域がある。ＴＰ５３には１０のコーディングエクソン（比較的小さいサイズ）があり、その全てがＳＰＬｉＴ－ＤＳを使用して標的化される。ＫＲＡＳは、エクソン２のコドン１２、１３、および６１に既知の変異ホットスポットを有するが、これらは全て標的化される。ＢＲＡＦには、エクソン１５で標的化されるＶ６００Ｅの変異を有する。

材料および方法
ＳＰＬｉＴ－ＤＳアッセイは、ＴＰ５３、ＫＲＡＳ、およびＢＲＡＦで既知のクローン変異を有する匿名化された腫瘍のＤＮＡ、ならびにがんのない個人の白血球ｇＤＮＡを使用して、図４および５に概説されているように、ｇＤＮＡで実行される。任意の最適化／検証ステップを実験して、効率と感度を試験するために、２つの異なる実験セットが実行される。

効率
効率は、ＤＣＳ読取に変換されるインプットＤＮＡ分子のパーセンテージとして定義される。本実施例の効率は、少なくとも３０％であるが、５０％を超えることを目標とする。１０ｎｇのインプットＤＮＡが目的の座位全体にわたって平均１０００倍のＤＣＳ深度を達成する可能性が高いと考えられる（１０ｎｇ＝約３２００ゲノム、したがって３２００×０．３効率＝約１０００ゲノムが配列決定される）。効率は、一部、マルチプレックスＰＣＲの性能に依存する。インシリコアプローチを使用して、ＰＣＲプライマーは次のように設計される：ｉ）高い標的特異性、ｉｉ）多重化する能力、ｉｉｉ）堅牢で最小バイアスの増幅を実行する能力。

ＣＲＩＳＰＲ／Ｃａｓ９システムは、特定の目的の領域を含む約５００～５５０ｂｐの断片を特異的に産生するために使用される（図１１Ｃを参照されたい）。ガイドＲＮＡとＰＣＲプライマーの設計を完了した後、コンビナトリアルアプローチを使用して以下を達成する：（ｉ）標的特異性（すなわち、標的読取のパーセンテージ、７０％を超えると許容可能）：および（ｉｉ）座位間深度バランス（すなわち、最低深度の座位を最高深度の座位で割る、０．５％を超えると許容範囲）。最適化されたガイドとプライマーのプールは、次いで、１０ｎｇおよび１００ｎｇの同一のｇＤＮＡに適用される。これらのプールは、ｇＤＮＡを含む全ての後続の実験に使用される。

感度
ＴＰ５３変異腫瘍ｇＤＮＡは、１：２、１：１０、１：１００、１：１０００、１：１０，０００の比率で、対照の非変異白血球ｇＤＮＡにスパイクされる。ＫＲＡＳおよびＢＲＡＦのそれぞれに既知のクローン変異を含む２つの追加の腫瘍ＤＮＡを使用して、合計１５の試料（３つの遺伝子ごとに５希釈）で同じ混合実験を行う。これらの１５の試料は、１０ｎｇおよび１００ｎｇのインプットＤＮＡを使用して、本明細書で記載されるようなＳＰＬｉＴ－ＤＳで処理される。「期待される」ＭＡＦと「観察される」ＭＡＦを比較する（最大ＭＡＦはＭＡＦ^max＝α ＩＮによって決定されるガイドラインを使用し、Ｎはゲノムの数であり、ａはＳＰＬｉＴ－ＤＳの効率であり、例えば、３０％の効率で、ＭＡＦ^maxが１０ｎｇのＤＮＡに対して０．１％であり、１００ｎｇのＤＮＡに対して０．０１％である）。

二項分布に基づいて、ＭＡＦ^maxに存在する所与の変異を検出する確率が６３％に達する可能性が高いと考えられる。実験には３つのスパイクされた変異があるため、統計的には少なくとも１つが０．１％と０．０１％で検出される可能性が高く、効率は３０％を超えるとこの確率が高くなる。

スパイクされた変異に加えて、正常な対照ＤＮＡは腫瘍ＤＮＡとは異なる個体からのものであるため、感度を確認するためにＳＮＰが使用される。ＳＮＰは、同一の希釈（ホモ接合ＳＮＰ）および１：４、１：２０、１：２００、１：２０００、および１：２０，０００の有効希釈（ヘテロＳＮＰ）で調べられる。

ＣＲＩＳＰＲ／Ｃａｓ９は、全てのＴＰ５３エクソンを効率的に切断し、サイズ選択による濃縮を促進し、読取使用量を最大化できた。ＣＲＩＳＰＲ／Ｃａｓ９ガイドは、ＴＰ５３エクソンを切断するように設計された（図１２Ａを参照されたい）。エクソン５～６および７（図１２Ｃおよび１２Ｄ）を増幅するための適切なＰＣＲプライマーによって、以前の実施例に記載したように、ＳＰＬｉＴ－ＤＳ（図１２Ｂおよび１２Ｃを参照されたい）を使用して１０ｎｇのｇＤＮＡを消化および処理した。ＤＮＡの両方の鎖は、高いパーセンテージのオンターゲット読取により適切に配列決定され、各分子の相補的なランダムタグと一致した後、ＤＣＳ読取が生成された（図１２Ｄ）。さらに、１０ｎｇのＤＮＡの開始量で得られた平均深度は２５％の効率に相当し（すなわち、元の３０００ゲノムから、平均で約８００倍が配列決定された）、これは、標準ＤＳの５０倍の改善、および従来の溶液ハイブリダイゼーションアプローチと比較した比類なき改善を表す。

実施例９：ｃｆＤＮＡの精確な配列決定のためのＳＰＬｉＴ－ＤＳの開発
本実施例は、以下の例示的ながん関連遺伝子の変異の検出のためのＳＰＬｉＴ－ＤＳの使用を実証する：ｃｆＤＮＡ中のＴＰ５３、ＫＲＡＳ、およびＢＲＡＦ。

材料および方法
市販の血漿（ＣｏｎｖｅｒｓａｎｔＢｉｏ）からの無細胞ＤＮＡは、ＱＩＡａｍｐＣｉｒｃｕｌａｔｉｎｇＮｕｃｌｅｉｃＡｃｉｄキットを使用して抽出される。目的の３つの遺伝子のそれぞれについて既知の変異をコードする３つの異なる合成１５０ｂｐのＤＮＡ分子が使用される。これらの各合成ＤＮＡ分子は、１：２、１：１０、１：１００、１：１０００、１：１０，０００の比率でｃｆＤＮＡにスパイクされる。ｃｆＤＮＡのＳＰＬｉＴ－ＤＳプロトコールパラメーターを最適化および検証するために、２つの異なる実験セットが実行される。

効率
ｃｆＤＮＡはすでに断片化されているため、切断（例えば、ＣＲＩＳＰＲ／Ｃａｓ９）は必要ない。したがって、ＳＰＬｉＴ－ＤＳは、ネステッドＰＣＲを追加して、以前の実施例で記載したように実行される。得られたフラグメントは、ＭｉＳｅｑｖ３で１５０サイクルで配列決定され、それぞれ約２５０万回の読取のために約１０の試料がカートリッジに多重化される。

感度
ｃｆＤＮＡのＴＰ５３、ＫＲＡＳ、およびＢＲＡＦ変異のそれぞれに対する５つの混合希釈（１：２、１：１０、１：１００、１：１０００、１：１０，０００）は、本実施例で設計され、１０ｎｇおよび１００ｎｇのＤＮＡで開始する、最適化されたプライマーを使用するＳＰＬｉＴ－ＤＳによって分析される。実験は、ＳａｆｅＳｅｑＳと並行して実行され、技術間の感度を比較する（ｃｔＤＮＡの精確な配列決定のための既知の技術はＳａｆｅＳｅｑＳであり、一本鎖訂正を使用してＮＧＳエラーを低減する）。ＳＰＬｉＴ－ＤＳは、ＭＡＦ＝０．１％および０．０１％での変異の検出に関してＳａｆｅＳｅｑＳを上回る可能性が高いと考えられる。ＳＰＬｉＴ－ＤＳは推定平均感度０．５％でスパイク変異を検出できる可能性が高いと考えられるが（表２）、Ｓａｆｅ－ＳｅｑＳはそのような低頻度ではスパイク変異を検出できない。

プライマー（ネステッドＰＣＲアプローチのための）は、ＫＲＡＳエクソン２のコドン１２および１３を増幅するように設計された。正常な血漿（ＣｏｎｖｅｒｓａｎｔＢｉｏ）から抽出された１０ｎｇと２０ｎｇのｃｆＤＮＡを並行して処理した。図１５Ａおよび１５Ｂは、本技術の一実施形態により、ネステッドＰＣＲを使用し、１０ｎｇ（図１５Ａ）および２０ｎｇ（図１５Ｂ）のｃｆＤＮＡから生成されたＫＲＡＳエクソン２のＳＰＬｉＴ－ＤＳ配列決定データを視覚的に表す。本実施例では、ＳＰＬｉＴ－ＤＳを使用して標的濃縮を行い、配列決定はは７５ｂｐのペアエンド読取でｌｌｌｕｍｉｎａＭｉＳｅｑで行った。二重鎖形成前の「Ａ」鎖と「Β」鎖の両方のＳＳＣＳ、および最終ＤＣＳ読取が示される。矢印は、２つの座位特異的ＰＣＲプライマーを示す（灰色のプライマー＝ネステッドＰＣＲプライマー）。

図１５Ａおよび１５Ｂに示すように、「サイドＡ」および「サイドＢ」はＤＮＡの２つの異なる鎖に対応し、適切に増幅され、それらの相補鎖が非常に精確なＤＣＳ読取を形成することを発見した。得られた深度は控えめであった（約５０読取）が、約１％の効率に相当し、これは標準的なＤＳの現在の効率である。したがって、ベースライン（すなわち最適化なし）で、ＳＰＬｉＴ－ＤＳは現在使用されているアプローチと同じ効率で結果を取たが、わずか１０ｎｇのインプットＤＮＡで、非常に少ない量を含んで、ｃｆＤＮＡを配列決定するために利用可能な他のアプローチよりも効率が向上していることを実証している。

実施例１０：ｃｔＤＮＡに基づく膵臓癌の検出と予後のためのＳＰＬｉＴ－ＤＳ。
本実施例は、ＳＰＬｉＴ－ＤＳを使用した膵管腺癌（ＰＤＡＣ）患者のｃｔＤＮＡの変異の検出時の改善（現在利用可能な方法と比較して）を示す。ＳＰＬｉＴ－ＤＳは、ＫＲＡＳ、ＴＰ５３、およびＢＲＡＦを含む複数の標的遺伝子におけるｄｄＰＣＲの感度を向上させる。これらのアッセイの結果は、現在のアプローチでＰＤＡＣ患者の９５％で１つの変異を検出し、ＰＤＡＣ症例の５０％を超えて２つの変異を検出する感度の向上を示す可能性が高いと考えられる。

さらに、ヒト対象の循環中のほとんどのＤＮＡ（すなわち、循環系（例えば、無細胞ＤＮＡ））は造血起源であるため、白血球ＤＮＡはｃｆＤＮＡに見られるものと比較される配列と変異となる。これらの結果は、特定のバックグラウンド変異が白血球サブクローンに由来するかどうかを、他の結果よりも高い感度と精確さで通知することが提案されている。

物質および方法
ＰＤＡＣの４０人の患者、慢性膵炎の２０人の患者、および年齢が一致した２０人の正常対照からの完全に特定されていないｃｆＤＮＡおよび一致する白血球ＤＮＡ試料が評価される。血液試料は抽出後２時間以内に処理され、２～５ｍｌの血漿と５００ｕｌのバフィーコートを含む試料が提供される。さらに、ＰＤＡＣ患者の場合、腫瘍の変異を確認するために凍結腫瘍片が利用可能になる。全てのＰＤＡＣ患者について、術前に血液が調達される。全ての患者は臨床的に追跡され、再発までの時間および死亡率を含む詳細な臨床病理情報が利用可能になる。患者の試料には、２０人の限局性がんと２０人の転移性がんが含まれる。

ｃｔＤＮＡはＱＩＡａｍｐＣｉｒｃｕｌａｔｉｎｇＮｕｃｌｅｉｃＡｃｉｄＫｉｔで抽出され、ｇＤＮＡはＱＩＡａｍｐＤＮＡＭｉｎｉキットで抽出される。１０ｎｇ以上のｃｆＤＮＡ（収集された血漿から）、１００ｎｇのｇＤＮＡ、および利用可能な全てのｃｔＤＮＡ（最大１００ｎｇ）は、ＫＲＡＳ、ＢＲＡＦ、およびＴＰ５３を対象に、本明細書に記載されるような適切なＳＰＬｉＴ－ＤＳ手順で処理される。配列決定は、ｃｔＤＮＡの場合はＩｌｌｕｍｉｎａ１５０サイクル、ｇＤＮＡの場合は６００サイクルのＭｉＳｅｑｖ３ＲｅａｇｅｎｔＫｉｔを使用して実行される。１５０サイクルキットでは１０のｃｔＤＮＡ試料が多重化され、６００サイクルキットでは１５のｇＤＮＡ試料が多重化される。実験デザインに基づいて、１０ｎｇのＤＮＡで少なくとも１，０００倍、１００ｎｇのＤＮＡで１０，０００倍もの配列決定深度で、少なくとも３０％の予想効率が得られる可能性が高いと考えられる。データは、配列決定、ＤＣＳ生成、および変異の同定後に分析される。

膵臓癌の検出
本実施例では、ＰＤＡＣ患者のｃｆＤＮＡにおけるＫＲＡＳ、ＴＰ５３、およびＢＲＡＦ変異を検出するＳＰＬｉＴ－ＤＳの感度と特異性を決定する。感度を分析するために、ｃｆＤＮＡで見つかった変異を、ＳＰＬｉＴ－ＤＳで同定された腫瘍変異（クローンおよびサブクローン）と比較する。ＳＰＬｉＴ－ＤＳの結果は、１変異のＰＤＡＣ症例のほぼ全てと２変異の症例の５０％を超えて包含するため、全ての転移症例と約８０％の限局性症例のｃｆＤＮＡで少なくとも１つの腫瘍変異を検出するる可能性が高いと考えられ、全てのＰＤＡＣに対する感度の合計が約９０％となる。

ｃｆＤＮＡで見つかった変異は、同じ患者から精製された一致した白血球で見つかった変異と比較される。ｃｆＤＮＡで見つかった変異と一致する白血球は生物学的バックグラウンドとみなされ、ｃｆＤＮＡの最終的な変異数からは無視される。共有される突然変異を差し引くと、ＰＤＡＣ、膵炎、および対照のｃｆＤＮＡ変異が比較される。生物学的バックグラウンド変異（例えば、年齢関連の変異）が試料に残っている場合でも、がんの変異は生物学的バックグラウンドの変異よりも高い頻度で発生する可能性が高いと考えられる。曲線下面積と年齢補正ＲＯＣモデルを使用して、最大の感度と特異性でがんと対照を区別するために、変異頻度の最適な閾値が決定される。

膵臓癌の予後
以前の実施例で示したように、ＳＰＬｉＴ－ＤＳの感度が向上したため、以前に利用可能なアプローチとは対照的に、ｃｔＤＮＡはほぼ（９０％）全てのＰＤＡＣ患者で検出可能である可能性が高いと考えられる。ｃｔＤＮＡの存在に対するバイナリ変数（すなわち、はい／いいえ）の代わりに、ｃｔＤＮＡＭＡＦは量的変数として分析され、ＭＡＦスコアと臨床データを比較する（例えば、ＭＡＦスコアと予後を比較する）。変異した遺伝子、コドン、および／または変異タイプが再発または死亡と相関しているかどうかも決定される。交絡因子（年齢と病期を含む）に合わせて調整された多変量ＣＯＸモデルを使用して、これらの変数とその組み合わせの能力を試験し、無病生存率と全生存率を予測する。カプラン・マイヤー曲線は、カテゴリー変数の予測値を表すために使用される。

実施例１１：転移性ＣＲＣにおける耐性変異の同定のためのＳＰＬｉＴ－ＤＳ
早期がんの検出、およびｃｔＤＮＡを使用した再発の予測
発症時の症例の約５０％を占める転移性ＣＲＣ（すなわち、ステージＩＶ）では、治療の決定を導くために腫瘍の遺伝子型決定が不可欠である：ＫＲＡＳ、ＮＲＡＳ、およびＢＲＡＦの発癌性変異は、ＣＲＣ患者の約５０％で発生し、ＥＧＦＲモノクローナル抗体セツキシマブおよびパニツムマブに対する応答の欠如を予測する。したがって、これらの遺伝子は固定と未固定の組織生検の両方で日常的に評価されるが、現在利用可能なアプローチはしばしば低品質のサブクローン解像度をもたらし、試料採取バイアスに悩まれる。その結果、サブクローン変異を有する腫瘍は見逃され、一部の患者には確実に失敗する治療法が投与される可能性がある。したがって、本実施例では、ＳＰＬｉＴ－ＤＳを使用したｃｔＤＮＡによる腫瘍遺伝子型決定により、現在利用可能な技術よりも感度が向上したアッセイが実証され、これはまた、ＥＧＦＲ遮断療法の患者の適格性を条件付けるＳＰＬｉＴ－ＤＳの既存の耐性変異の検出により、診断と治療を改善する。

ＣＲＣの存在および／または再発の検出および予測
ＳＰＬｉＴ－ＤＳは、特定の腫瘍変異に関する予備知識なしにｃｔＤＮＡの変異の検出を実証するために、５つの一般的に変異したＣＲＣ遺伝子のパネルで使用される。このアッセイの結果は、はるかに単純化された検査（例えば血液検査）を使用して将来のＣＲＣ検出を通知できる可能性が高いと考えられる。

本実施例は、再発を検出および／または予測するために使用される方法の改善も実証する。現在、十分な感度および／または特異性の欠如により利用可能な技術が制限されるか、または、十分な感度／特異性を有する技術の場合、それらは法外な費用がかかる。したがって、ｃｔＤＮＡのＳＰＬｉＴ－ＤＳ分析は、ＣＲＣの再発の改善された検出および予測を実証し、精確さの改善（例えば、例としてのＳａｆｅＳｅｑＳの１００倍を超える）、ならびに複数の遺伝子を拡大および評価する能力を提供する。

物質および方法
本実施例では、腫瘍の外科的切除を受けた３００人を超える患者からの複数の生検タイプの患者からの試料が使用される。利用可能な生体試料には、腫瘍、血漿、バフィーコートが含まれる。試料が得られた患者を縦断的に追跡し、ベースライン切除後６、１２、および２４か月で血液試料を入手できる。全ての患者について、再発を含む詳細な臨床病理情報が利用可能である。全ての試料とコード化された医療情報は完全に匿名化されている。転移性疾患の患者からの試料は、セツキシマブまたはパニツムマブに対する応答の可能性を決定するために、以前にＫＲＡＳおよびＮＲＡＳの変異について評価された。変異が見つからなかった場合、標的化療法が適用された。耐性は、イメージング研究の進行を介して記録された。

転移性がんの２０人の患者（ＩＶ期）と限局性がんの４０人の患者（Ｉ期～ＩＩＩ期）の試料を評価する。ＤＮＡは、手術前に得られた血漿（２～５ｍｌ）およびバフィーコート、ならびに凍結腫瘍試料から精製される。転移性がんを有すると分類される患者は、ＫＲＡＳおよびＮＲＡＳの変異について陰性と試験されたが、ＥＧＦＲ阻害剤療法に応答しなかった患者である。少なくとも１０人の再発患者も含まれる。ｃｔＤＮＡは、手術後６、１２、および２４か月に収集された血液で測定される。以前の実施例のように、白血球ＤＮＡ変異を使用して、ｃｆＤＮＡに存在する可能性のある潜在的な生物学的バックグラウンド変異を同定する。

さらに、ＡＰＣはＣＲＣで最も一般的な変異遺伝子であり、本実施例で使用されるＳＰＬｉＴ－ＤＳパネルには、例えば、コドン１，２８６からコドン１，５８５に及ぶ変異クラスター領域（２９９ｂｐ）など、ＡＰＣの最も一般的な変異領域が含まれ、これはＡＰＣ５２のＣＲＣ変異の約６０％を包含し、ＣＯＳＭＩＣで見つかった追加の上位ヒットは合計で約１０００ｂｐである。ＮＲＡＳコドン１２、１３、６１も含まれる。したがって、本実施例で使用されるパネルには、ＡＰＣ（約１０００ｂｐ）、ＴＰ５３（コード領域１１８２ｂｐ）、ＫＲＡＳ（コドン１２、１３、６１）、ＢＲＡＦ（Ｖ６００Ｅ）、およびＮＲＡＳ（コドン１２、１３、６１）が含まれ、合計サイズは約２７００ｂｐである。本実施例で記載されるパネルが、１つの変異と２つの変異を含むもののサブセットを含む全てのＣＲＣ試料を包含する可能性が高いと考えられる。

転移性ＣＲＣにおける耐性変異の同定
ＳＰＬｉＴ－ＤＳは、ｃｆＤＮＡのクローン腫瘍変異について、転移性ＣＲＣからの試料を評価するために使用される。全ての腫瘍はＫＲＡＳおよびＮＲＡＳの変異に対して陰性であるが、本実施例に記載されるパネルで同定された少なくとも１つのクローン変異（ＡＰＣまたはＴＰ５３中）を保有する可能性がある。ＳＰＬｉＴ－ＤＳは、ＥＧＦＲ療法に対する耐性を付与するｃｔＤＮＡの非常に低い頻度（０．１％未満）の変異の存在が検出可能かどうかを判断するためにも使用される。転移性疾患の患者からの試料は、非常に高い深度（約１０，０００倍）で正常にシーケンスされる可能性が高いと考えられる。ＳＰＬｉＴ－ＤＳ分析は、腫瘍ＤＮＡのサンガー配列決定によりＫＲＡＳおよびＮＲＡＳが陰性であるがＥＧＦＲ療法に失敗した転移性疾患患者のｃｔＤＮＡにおける低頻度ＫＲＡＳ、ＢＲＡＦおよびＮＲＡＦの変異の検出も改善する。ＳＰＬｉＴ－ＤＳを使用して同様の高深度で腫瘍ＤＮＡを配列決定し、ｃｔＤＮＡにおける一次耐性変異の有無を判定する。ｃｔＤＮＡと腫瘍内組織由来のＤＮＡの結果を比較する。

限局性ＣＲＣの検出
ＳＰＬｉＴ－ＤＳは、限局性（ステージＩ～ＩＩＩ）がんの試料で、本明細書に記載される５つのＣＲＣ遺伝子のパネルを使用してｃｔＤＮＡを同定するために使用される。腫瘍ＤＮＡもＳＰＬｉＴ－ＤＳを使用した配列になる。以前の実施例に記載したように、白血球細胞に由来する生物学的バックグラウンド変異の存在も決定される。

現在利用可能な特定の方法（例えばＣＥＡ）は、再発を検出する他の方法と比較して、推定１．５～６か月の「リードタイム」を提供するが、そのような時間が生存に影響するかどうかは明らかではない。他の技術はリードタイムを改善するかもしれないが、腫瘍の遺伝子型の先験的な知識を必要とする。したがって、ＳＰＬｉＴ－ＤＳを使用してｃｔＤＮＡを配列決定し、「リード」タイムを数か月改善する優れた能力を実証し、本明細書で記載するように、腫瘍遺伝子型の事前の知識は必要ない。本実施例では、再発を経験した限局性ＣＲＣ患者の初回手術後６、１２、および２４ヶ月でｃｔＤＮＡを検出するＳＰＬｉＴ－ＤＳの能力を実証する。腫瘍とベースラインｃｔＤＮＡが前述のパネルの遺伝子に少なくとも１つの変異（理想的には２）を保有している再発を有することに基づいて、１０人の患者が選択される。各試料（個人）について、ベースライン、６、１２、および２４か月での各変異の総ｃｔＤＮＡレベルに対して、経時的な病歴（化学療法、ＣＴスキャン、および再発の他の指標）がプロットされる。ｃｔＤＮＡおよびＣＥＡのＣＥＡレベルおよび再発までのリードタイムにおける比較も評価される。

実施例１２：ＣＲＩＳＰＲ－ＤＳ
本実施例では、非常に精確で高感度の配列決定を実行するためのＣＲＩＳＰＲ－ＤＳの作成について記載する。ＣＲＩＳＰＲベースの技術を使用して、あらかじめ決められた均一な長さで設計された標的領域を切除した（図１２Ａ）。本実施例では、使用されたＣＲＩＳＰＲ適合性ヌクレアーゼはＣａｓ９であった。このサイズコントロールを使用して、ライブラリー調製の前にサイズ選択を容易にし（図１２Ｂ）、続いてエラー除去を実行するために二本鎖バーコード付け（図１２Ｃ）を実行した（前述の、例えばＤＳ法と同様）（図１２Ｄ）。バーコード付けに続いて、単一回の捕捉が実行され（他の利用可能な方法とは対照的に）、非常に高いオンターゲット濃縮が行われ、完全な配列決定読取を包含する断片を産生することができる（図１２Ｆおよび１６Ａ）。ハイブリダイゼーション捕捉の断片化は通常、超音波処理で実行され、これは、長すぎたり、目的の領域と重複しない配列決定読取、および／または短すぎたり、相互に重複し、同一の配列を再読取する配列決定読取をしばしば生成する（図１２Ｆおよび１６Ａ）。図１６Ｂおよび１６Ｃは、本技術の実施形態による、標準的なＤＳおよびＣＲＩＳＰＲ－ＤＳプロトコールで調製された試料の断片インサートサイズを示すヒストグラムグラフである。Ｘ軸は、最適な断片サイズ、例えば、分子バーコードとクリッピングの調整後の配列決定読取の長さに一致する断片サイズ、との差異の割合を表す。縦欄領域は、最適なサイズから１０％以内の範囲にある断片サイズの範囲を示し、最適なサイズは垂直のハッシュ線で指定されます。図１６Ｂおよび１６Ｃに示すように、超音波処理により、最適な断片サイズからの逸脱量に大幅なばらつきが生じた（図１６Ｂ）が、一方で、ＣＲＩＳＰＲ／Ｃａｓ９消化により、最適な断片サイズ内に大部分の読取を有する断片が得られた（図１６Ｃ）。

本実施例は、ＣＲＩＳＰＲベースの断片化を使用することにより、例えば本実施例で使用される酵素Ｃａｓ９が平滑末端を産生するため、末端修復を必要としないということを含めて、偽変異がどのように防止されるかを示す。したがって、本明細書で提供される技術は、非効率的な標的濃縮、配列決定エラー、および不均一な断片サイズを含む、ＮＧＳの複数の一般的かつ広範にわたる問題を克服する。

ガイドＲＮＡ（ｇＲＮＡ）は、ＴＰ５３のコード領域と隣接するイントロン領域を切り出すように設計された（図１２Ａ）。断片サイズは約５００ｂｐに設定された。ｇＲＮＡは、特異性スコアと断片の長さに基づいて選択された（表１、図１７Ａ～１７Ｃ）。可変量のインプットＤＮＡ（１０～２５０ｎｇ）を含む試験試料をＣＲＩＳＰＲ／Ｃａｓ９で消化し、続いて固相可逆固定化（ＳＰＲＩ）ビーズでサイズ選択して未消化の高分子量ＤＮＡを除去し、標的化領域を含む切除断片を濃縮した（図１２Ｂ）。後続のライブラリー調製は、現在利用可能な標準プロトコールに従って行われたが、本明細書に記載するように、１回の捕捉とわずかな修正のみを使用した。ＤＮＡをＡテールにし、ＤＳアダプターとライゲートし、増幅し、ビーズ洗浄により精製し、ＴＰ５３エクソンを標的化するビオチン化１２０ｂｐのＤＮＡプローブとのハイブリダイゼーションにより捕捉した（表６）。捕捉された試料はインデックスプライマーで増幅され、ＩｌｌｕｍｉｎａＭｉＳｅｑｖ３６００サイクルキットで配列決定された。標準プロトコールと同様に分析を実施したが、アラインメントの前にコンセンサス配列の生成を含むように修正した（図２３）。
表６．ＴＰ５３ハイブリダイゼーション捕捉プローブ

Targeted exon:標的化エクソン、IDT probe name：IDTプローブ名称、IDT probe sequence：IDT プローブ配列Exon：エクソン

１回または２回のハイブリダイゼーション捕捉を伴う標準的なＤＳと１回のハイブリダイゼーション捕捉を伴うＣＲＩＳＰＲ－ＤＳとの並列比較を図１８Ａ～１８Ｃに示す。図１８Ａ～１８Ｃは、二重鎖コンセンサス配列読取（図１８Ｂ）を産生するインプットＤＮＡ中のゲノムのパーセンテージによって計算された回収パーセンテージを示し、および標準的なＤＳおよびＣＲＩＳＰＲ－ＤＳを使用して処理された様々なインプット量のＤＮＡの全ての標的領域にわたる中央二重鎖コンセンサス配列深度（図１８Ｃ）を示す、オンターゲットの未処理の配列決定読取のパーセント（ＴＰ５３を包含）を示す棒グラフ（図１８Ａ）である。図１８Ａは、２回の捕捉を伴うＳｔａｎｄａｒｄ－ＤＳと１回のキャプチャを伴うＣＲＩＳＰＲ－ＤＳとの間のオンターゲット（ＴＰ５３を包含する）の未処理の配列決定読取のパーセンテージを示す。図１８Ｂは、ＤＣＳ読取を産生したインプットＤＮＡ中のゲノムのパーセンテージによって計算された回収率を示す。図１８Ｃは、全ての標的領域にわたるＤＣＳ深度の中央値が各インプット量について計算されたことを示している。正常なヒト膀胱組織から抽出された同一のＤＮＡの３つのインプット量（２５０ｎｇ、１００ｎｇ、および２５ｎｇ）は、準プロトコール（つまり、標準的なＤＳ）およびＣＲＩＳＰＲ－ＤＳで配列決定された。１回の捕捉で、ＣＲＩＳＰＲ－ＤＳは９０％を超えるオンターゲットの未処理の読取を達成し（例えば、ＴＰ５３を包含）（以下に示す表８）、これは、標準的なＤＳ（１回の捕捉で、約５％のオンターゲットの未処理の読取を達成する（表８、下に表示）を超える大幅な改善を表す。２回目の捕捉では、ＣＲＩＳＰＲ－ＤＳの未処理の読取が最小限に増加した（図１９）。Ｓｔａｎｄａｒｄ－ＤＳは、異なるインプット全体で約１％の回収率（例えば、配列決定されたゲノムとして回収されたインプットゲノムのパーセンテージ；分数ゲノム等価回収としても知られている）を産生し、ＣＲＩＳＰＲ－ＤＳは６～１２％の範囲の回収率を産生した。ＣＲＩＳＰＲ－ＤＳの回収率は、標準的なＤＳで２５０ｎｇのＤＮＡが産生するものに匹敵するＤＣＳ深度（ＤＣＳ読取で生成される深度）を生成する２５ｎｇのＤＮＡに変換される。２つの方法を並べて比較すると、ＣＲＩＳＰＲ－ＤＳは、ＰＣＲ増幅バイアスに起因する短い断片の過剰表示が発生しない／結果に影響を与えない（すなわち、目的の領域の包含が均等である）という改善を提供できることが実証され、明確なバンド／ピークにより、配列決定前の正しいライブラリー調製の確認が提供され、標的化断片化によって作成された明確な断片は、均一な包含で所望の標的領域に完全に広がった（図２２Ｅ）。

物質および方法
試料
本実施例で分析された試料には、末梢血、癌を伴うまたは伴わない膀胱、および腹水ＤＮＡからの匿名化されたヒトゲノムＤＮＡが含まれた。患者情報は腹水試料で利用可能であり、腫瘍変異の存在を確認するために使用された。ワシントン大学婦人科腫瘍組織バンクから体液試料を入手し、ワシントン大学ヒト対象部門の治験審査委員会によって承認されたプロトコール番号２７０７７に基づくインフォームドコンセント後に検体と臨床情報を収集した。匿名化された凍結膀胱試料は、ワシントン大学泌尿生殖器がん生物標本保管所および以前に固定または凍結されていない剖検組織から入手した。ＤＮＡは以前にＱＩＡａｍｐＤＮＡＭｉｎｉキット（Ｑｉａｇｅｎ，Ｉｎｃ．，Ｖａｌｅｎｃｉａ，ＣＡ，ＵＳＡ）で抽出されており、変性したことはなかった。ＤＮＡはＱｕｂｉｔＨＳｄｓＤＮＡキット（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ）で定量化した。ＤＮＡの品質はＧｅｎｏｍｉｃＴａｐｅＳｔａｔｉｏｎ（Ａｇｉｌｅｎｔ，ＳａｎｔａＣｌａｒａ，ＣＡ）で評価され、ＤＮＡの完全性の数値（ＤＩＮ）が決定された。ＤＩＮは、１（非常に劣化）から１０（劣化なし）までのゲノムＤＮＡ品質の尺度である。末梢血ＤＮＡおよび腹水ＤＮＡのＤＩＮは７を超えていた（分解のない良質のＤＮＡを反映）。図１９は、３つの異なる血液ＤＮＡ試料での２つの捕捉ステップと比較して、１つの捕捉ステップでＣＲＩＳＰＲ－ＤＳによりもたらされる標的濃縮を示す棒グラフである。

膀胱試料は、異なるレベルのＤＮＡ分解を含むように意図的に選択された。膀胱ＤＮＡ試料Ｂ１からＢ１３は６．８から８．９のＤＩＮを持ち、ＣＲＩＳＰＲ－ＤＳによって正常に分析された（以下に示す表１０）。試料Ｂ１４およびＢ１６は、それぞれ６および４のＤＩＮを持ち、Ｂｌｕｅｐｉｐｐｉｎシステムで高分子量ＤＮＡを事前に濃縮することによってなされた改善を実証するために使用された（図２０Ａおよび２０Ｂ）。

ＣＲＩＳＰＲガイド設計
ＴＰ５３エクソンを切除するｇＲＮＡは、以下の特性を有するよう設計された：ＴＰ５３コード領域を包含する約５００ｂｐの断片を産生する能力、（２）最高のＭＩＴＷｅｂサイトスコア（「ＭＩＴスコア」；ＣＲＩＳＰＲ．ｍｉｔ．ｅｄｕ：８０７９／；表１および図１７Ａ－１７Ｃ）。エクソン７の場合、ガイドは、目的の領域内の近位のポリＡトラクト（ｔｒａｃｔ）を避けるために、より小さいサイズの断片を産生するように設計された。合計１２のｇＲＮＡが設計され、ＴＰ５３が７つの異なる断片に切り出された（図１２Ａ）。全てのｇＲＮＡの「ＭＩＴ」スコアは６０を超えていた。切断の品質は、ＩｎｔｅｇａｔｉｖｅＧｅｎｏｍｉｃｓＶｉｅｗｅｒを使用して最終ＤＣＳ読取のアライメントをレビューすることにより評価された。成功したガイドは、領域境界の鋭いエッジと適切なＤＣＳ深度を持つ典型的な包含パターンを産生した（図２２Ｅ）。ガイドが「失敗」した場合、ＤＣＳ深度の低下が観察され、予想される切断点を超える長い読取の存在が観察され、そのようなガイドは、必要に応じて再設計された。ランダムなＤＮＡ配列（表７）で挟まれた全てのｇＲＮＡ配列を含む合成ＧｅｎｅＢｌｏｃｋＤＮＡ断片（ＩＤＴ，Ｃｏｒａｌｖｉｌｌｅ，ＩＡ）を使用してガイドを評価した（図２１Ａ～２１Ｂ）。本明細書に記載されるＣＲＩＳＰＲ／Ｃａｓ９インビトロ消化プロトコールを使用して、３ｎｇのＧｅｎｅＢｌｏｃｋＤＮＡを各ｇＲＮＡで消化した。消化後、ＴａｐｅＳｔａｔｉｏｎ４２００（ＡｇｉｌｅｎｔＴｅｃｈｎｏｌｏｇｉｅｓ，ＳａｎｔａＣｌａｒａ，ＣＡ，ＵＳＡ）で反応を分析した（図２１Ｃ）。定義済みの断片の長さが存在し、適切なｇＲＮＡアセンブリとｇＲＮＡがその標的部位を切断する能力を確認した。

表７．ＧｅｎｅＢｌｏｃｋＤＮＡ断片

Geneblock fragment: 500bp with all of the gRNA target sequences:ＧｅｎｅＢｌｏｃｋ断片－全てのｇＲＮＡ標的配列を含む５００ｂｐ。
Spacer Sequences 17bp(frin ubtribu areas DS id TP53 exon 10:スペーサー配列１７ｂｐ（ＴＰ５３のエクソン１０のイントロン領域ＤＳ由来）
Beginning spacer sequence (7bp):開始スペーサー配列（７ｂｐ）：
Ending spacer sequencer (30bp):終了スペーサー配列（３０ｂｐ）

ゲノムＤＮＡのＣＲＩＳＰＲ／Ｃａｓ９インビトロ消化
ｃｒＲＮＡおよびｔｒａｃｒＲＮＡ（ＩＤＴ，Ｃｏｒａｌｖｉｌｌｅ，ＩＡ）をｇＲＮＡと複合体形成させ、３０ｎＭのｇＲＮＡを約３０ｎＭのＣａｓ９ヌクレアーゼ（ＮＥＢ，Ｉｐｓｗｉｃｈ，ＭＡ）、１×ＮＥＢＣａｓ９反応緩衝液、および２３～２７μＬの水とともに、２５℃で１０分間インキュベートした。次いで、１０～２５０ｎｇのＤＮＡを添加し、最終容量を３０μＬにした。反応物を３７℃で一晩インキュベートした後、酵素不活性化のために７０℃で１０分間熱ショックを与えた。

サイズ選択。
サイズ選択を使用して、ライブラリー調製の前にターゲット濃縮のための所定の長さの断片を選択した。ＡＭＰｕｒｅＸＰビーズ（ＢｅｃｋｍａｎＣｏｕｌｔｅｒ，Ｂｒｅａ，ＣＡ，ＵＳＡ）を使用して、オフターゲットの未消化高分子ＤＮＡを除去した。熱不活性化後、反応物を０．５倍比のビーズと組み合わせ、少し混合し、次いで、３分間インキュベートして高分子量ＤＮＡを結合させた。次いで、磁石でビーズを溶液から分離し、溶液（目的の長さのＤＮＡ断片を含む）を新しいチューブに移した。標準のＡＭＰｕｒｅ１．８倍比のビーズ精製を実行し、５０μＬのＴＥＬｏｗに溶離した。

ライブラリー調製
Ａ－テーリングおよびライゲーション
断片化したＤＮＡはＡ－テール化され、製造元のプロトコールに従ってＮＥＢＮｅｘｔＵｌｔｒａＩＩＤＮＡＬｉｂｒａｒｙＰｒｅｐＫｉｔ（ＮＥＢ，Ｉｐｓｗｉｃｈ，ＭＡ）を使用してライゲートした。ＮＥＢ末端修復およびＡテーリング（ＥＲＡＴ）反応は、２０℃で３０分間、および６５℃で３０分間インキュベートした。ＣＲＩＳＰＲ－ＤＳには末端修復は必要ない（Ｃａｓ９は平滑末端を産生する）が、有用なＡ－テーリングのためにＥＲＡＴ反応が使用された。ＮＥＢライゲーションマスターミックスと１５μＭのＤＳアダプターの２．５μｌを添加し、２０℃で１５分間インキュベートした。市販のアダプタープロトタイプ（図１２Ｃ）は、これまでの研究で使用されたアダプターとは次の相違を有して合成された：（１）１２ｂｐの代わりに、１０ｂｐのランダムな二本鎖分子タグが使用された、（２）単純な３’－ｄＴ突出による以前の３’の５ｂｐ保存配列の置換を使用して、５’－ｄＡテールＤＮＡ分子にライゲートした。ライゲーション時に、ＤＮＡを０．８倍比のＡＭＰｕｒｅビーズ精製で洗浄し、２３μＬのヌクレアーゼフリー水に溶離した。

ＰＣＲ
ＫＡＰＡＲｅａｌ－ＴｉｍｅＡｍｐｌｉｆｉｃａｔｉｏｎｋｉｔと蛍光標準（ＫＡＰＡＢｉｏｓｙｓｔｅｍｓ，ＷｏｂｕｒｎＭＡ，ＵＳＡ））を使用して、ライゲートされたＤＮＡを増幅した。ＫＡＰＡＨｉＦｉＨｏｔＳｔａｒｔリアルタイムＰＣＲマスターミックス、２３μｌの事前にライゲートおよび精製されたＤＮＡ、ならびに最終濃度２μΜのＤＳプライマーＭＷＳ１３およびＭＷＳ２０を含む５０μｌの反応液を調製した。反応は、９８℃で４５秒間変性され、９８℃で１５秒間、６５℃で３０秒間、７２℃で３０秒間を６～８サイクルで増幅され、７２℃で１分間の最終伸長が続いた。蛍光標準３（試料全体にわたる捕捉に十分な標準化された数のＤＮＡコピーを産生し、過剰増幅を防ぎ、Ｃａｓ９の切断とライゲーションの成功を示す）に達するまで試料を増幅し、通常、ＤＮＡインプットの量に応じて６～８サイクルかかる。０．８倍比のＡＭＰｕｒｅＢｅａｄ洗浄を実施して増幅断片を精製し、４０μＬのヌクレアーゼフリー水に溶離した。ＰＣＲステップの標準ＤＳと比較して、ＣＲＩＳＰＲ－ＤＳは以下を含む改善を提供する：（ｉ）同様のサイズの断片を提供する（小さな断片への増幅バイアスを低減する（図２２Ａ）、（ｉｉ）目的の領域のより均一な包含の生成（図２２Ｅ）、（ｉｉｉ）ＴａｐｅＳｔａｔｉｏｎ４２００による、ライブラリー調製（所定の断片サイズ特性を使用）が成功したことの精確な評価（ＡｇｉｌｅｎｔＴｅｃｈｎｏｌｏｇｉｅｓ，ＳａｎｔａＣｌａｒａ，ＣＡ，ＵＳＡ）。標準ＤＳでは、ＰＣＲ産物は超音波処理により幅広いサイズであり、試料間で比較するのが困難である広いスメアとして存在する（図２２Ａ）。例えば、標準的なＤＳ（試料間で比較するのが困難である結果を産生できる）などの他のアプローチとは対照的に、ＣＲＩＳＰＲ－ＤＳは、切断とライゲーションの成功を明確に示し、試料全体にわたる品質管理の比較に適した離散ピークを産生する（図２２Ｂ～Ｄ）。

捕捉と捕捉後のＰＣＲ
ＴＰ５３ｘＧｅｎＬｏｃｋｄｏｗｎＰｒｏｂｅｓ（ＩＤＴ，Ｃｏｒａｌｖｉｌｌｅ，ＩＡ）を使用して、以前の研究に従ってＴＰ５３エクソンのハイブリダイゼーション捕捉を実行したが、次のように変更した：プローブ（ＩＤＴＴＰ５３Ｌｏｃｋｄｏｗｎプローブセット由来）を選択して、ＴＰ５３コード領域全体を包含した（エクソン１およびエクソン１１の一部はコード領域ではない）（表６）。各ＣＲＩＳＰＲ／Ｃａｓ９切除断片は、最小で２つのプローブと最大で５つのプローブに包含されていた（図１７Ａ～１７Ｃ）。捕捉プローブプールを産生するために、所与の断片に対する各プローブを等モル量でプールし、７つの異なるプール（各断片に１つ）を生成した。次いで、７つの断片プールを再び等モル量で混合した（エクソン７とエクソン８～９のプールは例外で、それぞれ４０％と９０％で表れた）。これらのエクソンの捕捉プローブの減少は、エクソンの過剰表現がシーケンスで観察された場合にもたらされた。最終的な捕獲プールを０．７５ｐｍｏｌ／μｌに希釈した。ハイブリダイゼーション捕捉は、次の変更を加えた標準ＩＤＴプロトコールに従って実行された：ＤＳアダプターに特異的なブロッカーＭＷＳ６０およびＭＳＷ６１を使用した、７５μｌ（１００μｌの代わり）のＤｙｎａｂｅａｄｓＭ－２７０ストレプトアビジンビーズを使用した、捕捉後後ＰＣＲは、最終濃度０．８μＭのＭＷＳ１３およびインデックス付きプライマーＭＷＳ２１を使用して、ＫＡＰＡＨｉ－ＦｉＨｏｔＳｔａｒｔＰＣＲキット（ＫＡＰＡＢｉｏｓｙｓｔｅｍｓ，Ｗｏｂｕｒｎ，ＭＡ，ＵＳＡ）により実施した。反応は９８℃で４５秒間変性し、次いで９８℃で３０秒間、６０℃で４５秒間、７２℃で４５秒間を２０サイクルで増幅し、７２℃で６０秒間の延長が後に続いた。ＰＣＲ産物は０．８倍のＡＭＰｕｒｅビーズ洗浄で精製した。

配列決定
ＱｕｂｉｔｄｓＤＮＡＨＳＡｓｓａｙＫｉｔを使用して試料を定量化し、希釈し、配列決定のためにプールした。次いで、Ａｇｉｌｅｎｔ４２００ＴａｐｅＳｔａｔｉｏｎで試料プールを視覚化して、ライブラリーの品質を確認した。ＴａｐｅＳｔａｔｉｏｎのエレクトロフェログラムは、設計されたＣＲＩＳＰＲ／Ｃａｓ９切断断片の断片の長さに対応するシャープで明確なピークを示した（図２２Ｂ～２２Ｄ）。（このステップは、プールする前に各試料に対して個別に実行して、必要に応じて／所望なら、個々の試料の性能を検証することもできる）。最終的なプールは、ＫＡＰＡＬｉｂｒａｒｙＱｕａｎｔｉｆｉｃａｔｉｏｎｋｉｔ（ＫＡＰＡＢｉｏｓｙｓｔｅｍｓ，Ｗｏｂｕｒｎ，ＭＡ，ＵＳＡ）を使用して定量化した。ライブラリーは、製造者の取扱説明書に従って、ｖ３６００サイクルキット（Ｉｌｌｕｍｉｎａ，ＳａｎＤｉｅｇｏ，ＣＡ，ＵＳＡ）を使用して、ＭｉＳｅｑＩｌｌｕｍｉｎａプラットフォームで配列決定された。各試料には、約７～１０％のレーンが割り当てられ（約２００万回の読み取りに対応）、各配列決定の実行には、約１％のＰｈｉＸ対照ＤＮＡがスパイクされた。

データ処理
未処理のＦＡＳＴＱファイルからテキストファイルへの分析を自動化するために、カスタムバイオインフォマティクスパイプラインが作成された（図２３）。このパイプラインは、標準的なＤＳ分析に使用される方法に類似するが、次の変更が加えられている：（ｉ）ペア読取情報の保持が達成され、（ｉｉ）アラインメントの前にコンセンサス作製が実行される。ペアエンド読取はＣＲＩＳＰＲ－ＤＳデータの分析に使用されるが、断片サイズの品質管理と短い断片の存在による潜在的な技術的アーティファクトの除去をもたらすので、標準的なＤＳ分析よりも改善されている。さらに、標準的なＤＳ分析では、全ての読取が参照ゲノムにマッピングされた後にコンセンサスが作製されるが、ＣＲＩＳＰＲ－ＤＳ分析では、シーケンサーによる塩基読取のみに依存して最初のステップとしてコンセンサスが実行される。この変更により、コンセンサス作製が改善され、データ処理に必要な時間が短縮される可能性が高いと考えられる。ＣＲＩＳＰＲ－ＤＳでは、コンセンサス作製は、同一のタグに由来する全ての読取を取得し、各位置でコールされた塩基を比較し、一本鎖コンセンサス（ＳＳＣＳ）読取を産生するＵｎｉｆｉｅｄＣｏｎｓｅｎｓｕｓＭａｋｅｒ．ｐｙと呼ばれるカスタムｐｙｔｈｏｎスクリプトによって実行された。次いで、タグの各相補ペアのＳＳＣＳ読取を位置ごとに比較して、二本鎖コンセンサス（ＤＣＳ）読取を作成した（図１２Ｄ）。得られたＳＳＣＳ読取とＤＣＳ読取を含む２つのＦＡＳＴＱファイルが作製された（ＤＣＳ読取は元のＤＮＡ分子に対応するため、平均ＤＣＳ深度は配列決定されたゲノム数の推定値である）。回収率（分数ゲノム等価回収とも呼ばれる）は、平均ＤＣＳ深度（配列決定されたゲノム）をインプットゲノム数（１ｎｇのＤＮＡが約３３０の半数体ゲノムに対応）で割って計算された。ゲノム座標が上流および下流のＣＲＩＳＰＲ／Ｃａｓ９切断部位内にあり、いずれかの側に１００ｂｐのウィンドウが追加された読取の数を計数することにより、オンターゲットの未処理読取を計算した。ペアエンドのＤＣＳＦＡＳＴＱファイルは、ｂｗａ－ｍｅｍｖ．０．７．４１９をデフォルトパラメータとともに使用して、ヒト参照ゲノムｖ３８とアライメントされた。マッピングされた読取はＧＡＴＫＩｎｄｅｌ－Ｒｅａｌｉｇｎｅｒで再アライメントされ、低品質のベースはＧＡＴＫＣｌｉｐ－Ｒｅａｄｓで両端からクリップされた。３’末端から３０塩基、５’末端から７塩基の保守的なクリッピングが行われた。さらに、ＴＰ５３設計では約８０ｂｐにわたる読取ペアの重複領域は、ｆｇｂｉｏＣｌｉｐＯｖｅｒｌａｐｐｉｎｇＲｅａｄｓを使用してトリミングされた。このアルゴリズムは、ペアの読み取りの両端から一致するまでクリッピングを実行し、これにより、高いＰＨＲＥＤ品質スコアを持つ配列決定塩基の使用が最大化される。ＳＡＭｔｏｏｌｓｍｐｉｌｅｕｐを使用して、得られたファイルからパイルアップファイルが作成された。次いで、標的化ゲノム位置のためのＢＥＤファイルを含むカスタムＰｙｔｈｏｎスクリプトを使用して、パイルアップファイルをフィルタリングした。ＢＥＤファイルは、ＣＲＩＳＰＲ／Ｃａｓ９のｇＲＮＡの座標を使用して簡単に作成できる。次いで、フィルタリングされたパイルアップファイルは、「ｍｕｔｐｏｓ」と呼ばれる変異情報を含むタブ区切りテキストファイルを作成する、カスタム作製スクリプトｍｕｔ－ｐｏｓｉｔｉｏｎ．１．３３．ｐｙによって処理される。ｍｕｔｐｏｓには、ＤＣＳの深度と配列決定された各位置の変異の概要が含まれる（ＣＲＩＳＰＲ－ＤＳ分析で使用されるソフトウェアは、ハイパーテキスト転送プロトコールｓｅｃｕｒｅ：／／ｇｉｔｈｕｂ．ｃｏｍ／ｒｉｓｑｕｅｓｌａｂ／ＣＲＩＳＰＲ－ＤＳでアクセスできる）。

標準的なＤＳ
正常なヒト膀胱試料Ｂ９からの３つの量のＤＮＡ（２５ｎｇ、１００ｎｇ、および２５０ｎｇ）を１回および２回の捕捉で標準的なＤＳで配列決定し、ＣＲＩＳＰＲ－ＤＳの結果と比較した。標準的なＤＳ分析を実施したが、末端修復とライゲーションにはＫＡＰＡＨｙｐｅｒｐｒｅｐキット（ＫＡＰＡＢｉｏｓｙｓｔｅｍｓ，Ｗｏｂｕｒｎ，ＭＡ，ＵＳＡ）を使用し、ＰＣＲ増幅には、ＫＡＰＡＨｉ－ＦｉＨｏｔＳｔａｒｔＰＣＲキット（ＫＡＰＡＢｉｏｓｙｓｔｅｍｓ，Ｗｏｂｕｒｎ，ＭＡ，ＵＳＡ）を使用した。ハイブリダイゼーション捕捉は、ＴＰ５３エクソン２～１１を包含するｘＧｅｎＬｏｃｋｄｏｗｎプローブを使用して実行された（標準的なＤＳとＣＲＩＳＰＲ－ＤＳの両方で同一のプローブが使用された）。試料は、短い断片の長さに対応するために、ＨｉＳｅｑ２５００Ｉｌｌｕｍｉｎａプラットフォームの約１０％で配列決定された。

ＣＲＩＳＰＲ－ＤＳ標的濃縮
ＣＲＩＳＰＲ－ＤＳ標的濃縮を特徴評価するために、２つの別々の分析が実行された。

最初の分析には、１回対２回での捕捉の比較（および標準的なＤＳの結果との比較）が含まれていた。３つのＤＮＡ試料をＣＲＩＳＰＲ－ＤＳ用に処理し、１回のハイブリダイゼーション捕捉後に半分に分割した。元のＤＳプロトコールで必要とされたように、第１の半分にはインデックスが付けられて配列決定され、第２の半分は追加の回の捕捉の対象となった。「オンターゲット」（すなわち、ＴＰ５３エクソンを包含する）未処理の読取のパーセンテージを、１対２の捕捉で比較した。標準的なＤＳとＣＲＩＳＰＲ－ＤＳの比較の詳細を表８に示す。
表８．標準的なＤＳ対ＣＲＩＳＰＲ－ＤＳの比較

２番目の分析では、ハイブリダイゼーション捕捉を実行せずにオンターゲットの未処理の読取のパーセンテージを評価し、ＣＲＩＳＰＲ切除断片をサイズ選択することによって排他的に産生される濃縮を判定した。異なるＤＮＡ量（１０ｎｇ～２５０ｎｇ）の３つの異なる試料を、第１のＰＣＲまで（すなわち、ハイブリダイゼーション捕捉の前に）、第１の分析で記載したプロトコールで処理した。図２４Ａおよび２４Ｂは、本技術の一実施形態による、ＣＲＩＳＰＲ／Ｃａｓ９消化とそれに続くサイズ選択後の標的濃縮の度合を定量化した結果を示すチャート（図２４Ａ）およびグラフ（図２４Ｂ）である。図２４Ａは、ＤＮＡ試料およびそれぞれについて達成された濃縮を示す。図２４Ｂは、インプットＤＮＡの量と比較して「オンターゲット」にあった未処理の読取のパーセントを示す。次いで、ＰＣＲ産物にインデックスを付け、配列決定した。オンターゲットの未処理の読取のパーセンテージを計算し、濃縮倍率を推定した（標的化領域サイズ、この場合は３２８０ｂｐを考慮した）。

高分子量ＤＮＡの事前濃縮
高分子量ＤＮＡを選択すると、ＣＲＩＳＰＲ－ＤＳで分解されたＤＮＡの性能が向上する。この選択は、ＢｌｕｅＰｉｐｐｉｎシステム（ＳａｇｅＳｃｉｅｎｃｅ，Ｂｅｖｅｒｌｙ，ＭＡ）を使用して実行した。ＤＩＮが６および４の２つの膀胱ＤＮＡを、０．７５％ゲルカセットとハイパス設定を使用して実行し、８ｋｂを超える断片を取得した。サイズ選択はＴａｐｅＳｔａｔｉｏｎで確認された（図２０Ａ）。次いで、ＢｌｕｅＰｉｐｐｉｎの前に２５０ｎｇのＤＮＡとＢｌｕｅＰｉｐｐｉｎの後に２５０ｎｇのＤＮＡがＣＲＩＳＰＲ－ＤＳによって並行して処理された。オンターゲットの未処理の読取のパーセンテージと平均ＤＣＳ深度を定量化し、比較した（図２０Ｂ）。

実施例１３：卵巣癌試料でのＣＲＩＳＰＲ－ＤＳ
低頻度変異を検出するＣＲＩＳＰＲ－ＤＳの能力を検証するために、卵巣癌の女性から減量手術中に４つの腹水試料を収集し、分析した。これらの試料にＴΡ５３腫瘍変異が存在することは、標準的なＤＳによってこれまでに実証されていた。１００ｎｇのＤＮＡ（標準的なＤＳに使用されたものより３０～１００倍少ない）がＣＲＩＳＰＲ－ＤＳ分析に使用され、標準的なＤＳに匹敵するＤＣＳ深度が得られ、ＴＰ５３腫瘍変異が全ての場合で正常に同定された（表９）。回収率は６～１２％の範囲で、同一のＤＮＡによる標準的なＤＳと比較して１５倍から２００倍の増加を示した。
表９．ＴＰ５３変異を含む４つの異なる試料のＳｔａｎｄａｒｄ－ＤＳ対ＣＲＩＳＰＲ－ＤＳの比較。

実施例１４：膀胱組織試料のＣＲＩＳＰＲ－ＤＳ
本実施例では、様々な患者の膀胱組織から抽出された１３のＤＮＡ試料のセットでのＣＲＩＳＰＲ－ＤＳの使用について記載する（表１０）。各試料からの２５０ｎｇのＤＮＡをアッセイに使用し、回収率の中央値７．４％に相当する６，１４３倍の中央値のＤＣＳ深度が得られた。２つの試料（Ｂ２およびＢ４）の技術的な重複により、再現可能な性能が実証された。全ての試料のオンターゲットのＤＣＳ読取は９８％を超えていたが、オンターゲットの未処理の読取（生の読取り）のパーセンテージは４３％～９８％の範囲であった。低いターゲット濃縮は、７未満のＤＮＡＩｎｔｅｇｒｉｔｙＮｕｍｂｅｒｓ（ＤＩＮ）の試料に対応していた。

表１０．２５０ｎｇのインプットＤＮＡで処理した１３の試料のＣＲＩＳＰＲ－ＤＳ配列決定結果。

アッセイの性能に対するＤＩＮの効果を試験するために、ＣＲＩＳＰＲ／Ｃａｓ９消化の前に低分子量ＤＮＡを除去した。ＢｌｕｅＰｉｐｐｉｎシステムのパルスフィールド機能を使用して、「分解されたＤＮＡ」を持つ２つの試料（ＤＩＮ６および４）から高分子量ＤＮＡを選択した。事前濃縮により、オンターゲットの未処理の読取が２倍、ＤＣＳ深度が５倍増加した（図２０Ｂ）。単純にＣＲＩＳＰＲ／Ｃａｓ９消化とそれに続くサイズ選択によって付与される濃縮の度合を直接定量化するために、３つの試料を捕捉せずに配列決定した。１０～２５０ｎｇのＤＮＡを消化し、サイズ選択し、ライゲートし、増幅し、配列決定した。「オンターゲット」の未処理の読取のパーセンテージは、０．２％～５％の範囲で、約２，０００倍～５０，０００倍の濃縮に対応した（表１１）。特に、低ＤＮＡインプットは最高の濃縮度を示し、これはおそらく、少量で存在するときの、オフターゲットの高分子量ＤＮＡ断片の最適な除去を反映している可能性がある。
表１１．サイズ選択による標的濃縮

ＣＲＩＳＰＲ／Ｃａｓ９断片化とそれに続くサイズ選択により、効率的な標的濃縮が正常に実行され、小さな標的領域の２回目の捕捉の必要が排除された。さらに、ＰＣＲバイアスが排除され、目的の領域の均一な包含が達成され、現在利用可能な方法よりも大幅な改善を示す。

均等物と範囲
本技術の実施形態の上記の詳細な説明は、網羅的であること、または技術を上記で開示された正確な形態に限定することを意図していない。本技術の特定の実施形態および実施例は、例示の目的で上述されているが、当業者が認識するように、本技術の範囲内で様々な均等の修正が可能である。例えば、ステップは所与の順序で提示されるが、代替の実施形態では異なる順序でステップを実行できる。本明細書に記載される様々な実施形態は、さらなる実施形態を提供するために組み合わされてもよい。本明細書で引用される全ての参照文献は、その全てが本明細書に記述されるように、参照により本明細書に組み込まれる。

上記から、本技術の特定の実施形態が例示の目的で本明細書に記載されているが、本技術の実施形態の説明を不必要に曖昧にすることを避けるために、周知の構造および機能は詳細に図示または説明されていないことが理解されよう。文脈が許す場合、単数または複数の用語は、それぞれ複数または単数の用語を含んでもよい。さらに、技術の特定の実施形態に関連する利点がそれらの実施形態の文脈で説明されたが、他の実施形態もそのような利点を示す可能性があり、全ての実施形態が必ずしも本技術の範囲内にあるような利点を示す必要はない。したがって、本開示および関連技術は、本明細書に明示的に示されていないまたは説明されていない他の実施形態を包含することができる。

当業者は、日常的な実験にすぎないものを用いて、本明細書において記載される開示された技術の具体的な実施形態の多くの均等物を認識するか、またはそれを確かめることができるであろう。本技術の範囲は、上記の説明に限定されることを意図するものではなく、以下の特許請求の範囲に記述されるようなものである。

Claims

１つ以上の二本鎖DNA分子を提供することであって、前記１つ以上の各々の二本鎖DNA分子が、サンプルに由来する二本鎖DNA断片、各々の鎖上の単一分子識別子配列、および前記二本鎖DNA断片の二つの末端の少なくとも一つに位置しているアダプター分子を含み、各々の二本鎖DNA分子に対して、前記二本鎖DNA分子の第１の鎖が第１のアダプター配列を含み、前記二本鎖DNA分子の第２の鎖が前記第１のアダプターに少なくとも部分的に非相補的である第２のアダプター配列を含み、
前記１つ以上の二本鎖DNA分子を増幅して、第１鎖増幅産物と第２鎖増幅産物を含む増幅産物を生成することと、
前記増幅産物を、第１の試料と第２の試料とに分離することと、
（ａ）前記第１のアダプター配列中に存在する配列に少なくとも部分的に相補的である少なくとも１つの一本鎖オリゴヌクレオチド、および、
（ｂ）目的の標的配列に少なくとも部分的に相補的である少なくとも１つの一本鎖オリゴヌクレオチド、
の使用により
前記第１の試料中の前記第１の鎖または第1鎖増幅産物を増幅して、第１のDNA産物をもたらすことであって、前記単一分子識別子配列が少なくとも部分的に前記第１のDNA産物中に維持され、
（ａ）前記第２のアダプター配列中に存在する配列に少なくとも部分的に相補的である少なくとも１つの一本鎖オリゴヌクレオチド、および、
（ｂ）目的の標的配列に少なくとも部分的に相補的である少なくとも１つの一本鎖オリゴヌクレオチド、
の使用により、
前記第２の試料中の前記第２の鎖または第２鎖増幅産物を増幅して、第２のDNA産物をもたらすことであって、前記単一分子識別子配列が少なくとも部分的に前記第２のDNA産物中に維持され、
前記第１のDNA産物および第２のDNA産物の各々を配列決定することと、
前記第１のDNA産物の配列と前記第２のDNA産物の配列とを比較することと、を含む、方法。
提供するステップが、
１つ以上の二本鎖DNA断片の各々に少なくとも１つの縮重または半縮重バーコード配列をライゲートして、１つ以上の二本鎖DNA分子バーコード複合体を形成することを含み、前記バーコード配列が、単一分子識別子配列を含む、請求項１に記載の方法。
単一分子識別子配列が、二本鎖DNA分子を一意的に標識する、縮重もしくは半縮重バーコード配列、または、１つ以上の内因性のせん断点または前記１つ以上の内因性せん断点に位置的に関連する可能性のある内因性配列、またはそれらの組み合わせのうちの少なくとも１つを含む、請求項１または請求項２に記載の方法。
単一分子識別子配列が、内因性のせん断点または前記せん断点に位置的に関連する可能性のある内因性の配列を含む、請求項３に記載の方法。
１つ以上の二本鎖DNA分子を増幅することが、前記第１の鎖に由来する複数の増幅産物と、前記第２の鎖に由来する複数の増幅産物とを生成することを含む、請求項１～４のいずれか１項に記載の方法。
１つ以上の二本鎖DNA分子の少なくとも一つが損傷している、請求項１～５のいずれか１項に記載の方法。
損傷が、酸化、アルキル化、脱アミノ化、メチル化、加水分解、ヒドロキシル化、ニッキング、鎖内架橋、鎖間架橋、平滑末端鎖切断、付着末端二重鎖切断、リン酸化、脱リン酸化、ＳＵＭＯ化、グリコシル化、脱グリコシル化、プトレシニル化、カルボキシル化、ハロゲン化、ホルミル化、一本鎖ギャップ、熱による損傷、乾燥による損傷、紫外線暴露による損傷、ガンマ線による損傷、Ｘ線による損傷、電離放射線による損傷、非電離放射線による損傷、重粒子線による損傷、核崩壊による損傷、ベータ線による損傷、アルファ線による損傷、中性子線による損傷、陽子線による損傷、宇宙線による損傷、高ｐＨによる損傷、低ｐＨによる損傷、反応性酸化種による損傷、フリーラジカルによる損傷、過酸化物による損傷、次亜塩素酸塩による損傷、組織固定による損傷、反応性鉄による損傷、低イオン状態による損傷、高イオン状態による損傷、緩衝されていない状態による損傷、ヌクレアーゼによる損傷、環境暴露による損傷、火災による損傷、機械的ストレスによる損傷、酵素分解による損傷、微生物による損傷、分取機械的せん断による損傷、分取酵素による断片化による損傷、生体内で自然に生じた損傷、核酸抽出中に生じた損傷、配列決定ライブラリーの調製中に生じた損傷、ポリメラーゼによって導入された損傷、核酸の修復中に導入された損傷、核酸の末端処理中に生じた損傷、核酸ライゲーション中に生じた損傷、配列決定中に生じた損傷、ＤＮＡの機械的取り扱いにより生じた損傷、ナノポアを通過する際に生じた損傷、生物の老化の一部として生じた損傷、個体の化学物質への暴露の結果として生じた損傷、変異原性物質により生じた損傷、発がん性物質により生じた損傷、染色体異常誘発物質により生じた損傷、酸素暴露による生体内炎症損傷により生じた損傷、１つ以上の鎖切断による損傷、およびそれらの組み合わせのうちの少なくとも１つを含む、請求項６に記載の方法。
１つ以上の二本鎖DNA分子が各々、対象または生物を起源とする試料により提供される二本鎖DNA断片を含む、請求項１～７のいずれか１項に記載の方法。
１つ以上の二本鎖DNA分子が、それぞれ、体組織、生検、皮膚試料、血液、血清、血漿、汗、唾液、脳脊髄液、粘液、子宮洗浄液、膣スワブ、パップスメア、鼻腔スワブ、口腔スワブ、組織擦過検体、髪の毛、指紋、尿、便、硝子体液、腹膜洗浄液、唾液、気管支洗浄液、口腔洗浄液、胸膜洗浄液、胃洗浄液、胃液、胆汁、膵管洗浄液、胆管洗浄液、総胆管洗浄液、胆嚢液、滑液、感染性創傷、非感染性創傷、考古学的な試料、法医学試料、水試料、組織試料、食品試料、バイオリアクター試料、植物試料、細菌試料、原生動物のサンプル、真菌試料、動物試料、ウイルス試料、複数の生体の試料、爪擦過検体、精液、前立腺液、膣液、膣スワブ、卵管洗浄液、無細胞核酸、細胞内の核酸、メタゲノミクス試料、移植された異物の洗浄液またはスワブ、鼻洗浄液、腸液、上皮擦過検体、上皮洗浄液、組織生検、生検試料、剖検試料、臓器試料、人物同定試料、非ヒト同定試料、人工的に産生された核酸試料、合成遺伝子試料、バンクに寄託または保管された試料、腫瘍組織、胎児試料、臓器移植試料、微生物培養試料、核ＤＮＡ試料、ミトコンドリアＤＮＡ試料、葉緑体ＤＮＡ試料、アピコプラストＤＮＡ試料、細胞小器官試料、またはそれらの任意の組み合わせから得られる二本鎖DNA断片を含む、請求項１～８のいずれか１項に記載の方法。
１つ以上の二本鎖DNA分子の各々が実質的に均一またはほぼ均一な長さの二本鎖DNA断片を含む、請求項１～９のいずれか１項に記載の方法。
実質的に均一な長さが、約１００～約１０，０００塩基である、請求項１０に記載の方法。
１つ以上の二本鎖DNA分子が、それぞれ、標的化エンドヌクレアーゼによって実質的に均一またはほぼ均一の長さに切断されている二本鎖DNA断片を含む、請求項１０または請求項１１に記載の方法。
二本鎖DNA断片の長さが、１つ以上の実質的に既知のサイズ範囲内である、請求項１～９のいずれか１項に記載の方法。
１つ以上の二本鎖DNA断片の長さが、約１００～約１０００塩基、約１００～約６００塩基、約１００～約５００塩基、またはそれらのいくつかの組み合わせである、請求項１３に記載の方法。
提供するステップの前に、
実質的に既知の長さの標的二本鎖DNA断片が形成されるように、１つ以上の標的化エンドヌクレアーゼにより二本鎖DNA材料を切断することと、
前記実質的に既知の長さに基づいて、前記標的二本鎖DNA断片を単離することと、を含む、請求項１～１４のいずれか１項に記載の方法。
１つ以上の標的化エンドヌクレアーゼが、リボ核タンパク質、Ｃａｓ酵素、Ｃａｓ９様酵素、メガヌクレアーゼ、転写活性化因子様エフェクターベースヌクレアーゼ（ＴＡＬＥＮ）、ジンクフィンガーヌクレアーゼ、アルゴノートヌクレアーゼ、およびそれらの組み合わせからなる群から選択される、請求項１５に記載の方法。
１つ以上の標的化エンドヌクレアーゼが、Ｃａｓ９もしくはＣＰＦ１またはそれらの誘導体を含む、請求項１５または請求項１６に記載の方法。
提供するステップの前に、アダプターを標的二本鎖DNA断片にライゲートすることをさらに含む、請求項１５～１７のいずれか１項に記載の方法。
標的二本鎖DNA断片が対象または生物を起源とする、請求項１５～１８のいずれか１項に記載の方法。
標的二本鎖DNA断片が少なくとも部分的に人工的に合成されている、請求項１５～１８のいずれか１項に記載の方法。
二本鎖DNA材料を切断することが、実質的に既知の長さの２つ以上の標的二本鎖DNA断片が形成されるように、前記二本鎖DNA材料を１つ以上の標的化エンドヌクレアーゼによって切断することを含む、請求項１５～２０のいずれか１項に記載の方法。
標的二本鎖DNA断片が異なる実質的に既知の長さである、請求項２１に記載の方法。
標的二本鎖DNA断片がそれぞれ、ゲノム中の１つ以上の異なる位置からの目的のゲノム配列を含む、請求項２１に記載の方法。
標的二本鎖DNA断片がそれぞれ、１つ以上の二本鎖DNA分子内の実質的に既知の領域からの標的配列を含む、請求項２１に記載の方法。
実質的に既知の長さに基づいて標的二本鎖DNA断片を単離することが、ゲル電気泳動、ゲル精製、液体クロマトグラフィー、サイズ排除精製、濾過、またはＳＰＲＩビーズ精製による前記標的二本鎖DNA断片の濃縮を含む、請求項１５～２４のいずれか１項に記載の方法。
少なくとも１つの増幅するステップが、少なくとも１つの非標準ヌクレオチドであるか、またはそれを含む少なくとも１つのプライマーを含む、請求項１～２５のいずれか１項に記載の方法。
少なくとも１つのアダプター配列が、少なくとも１つの非標準ヌクレオチドであるか、またはそれを含む、請求項１～２６のいずれか１項に記載の方法。
非標準ヌクレオチドが、ウラシル、メチル化ヌクレオチド、ＲＮＡヌクレオチド、リボースヌクレオチド、８－オキソ－グアニン、ビオチン化ヌクレオチド、デスチオビオチンヌクレオチド、チオール修飾ヌクレオチド、アクリダイト修飾ヌクレオチド、ｉｓｏ－ｄＣ、ｉｓｏｄＧ、２’－Ｏ－メチルヌクレオチド、イノシンヌクレオチド、ロックド核酸、ペプチド核酸、５メチルｄＣ、５－ブロモデオキシウリジン、２，６－ジアミノプリン、２－アミノプリンヌクレオチド、脱塩基ヌクレオチド、５－ニトロインドールヌクレオチド、アデニル化ヌクレオチド、アジドヌクレオチド、ジゴキシゲニンヌクレオチド、Ｉリンカー、５’ヘキシニル修飾ヌクレオチド、５－オクタジイニルｄＵ、光開裂性スペーサー、非光開裂性スペーサー、クリックケミストリー対応の修飾ヌクレオチド、蛍光色素、ビオチン、フラン、ＢｒｄＵ、フルオロ－ｄＵ、ｌｏｔｏ－ｄＵ、およびそれらの任意の組み合わせから選択される、請求項２６または請求項２７に記載の方法。
第１のDNA産物および第２のDNA産物の各々を配列決定することが、
第１のDNA産物中の複数の鎖の前記配列を比較して、第１の鎖のコンセンサス配列を決定することと、
前記第２のDNA産物中の複数の鎖の前記配列を比較して、第２の鎖のコンセンサス配列を決定することと、を含む、請求項１～２８のいずれか１項に記載の方法。
第１のDNA産物の配列を第２のDNA産物の配列と比較することが、第１の鎖のコンセンサス配列と第２の鎖のコンセンサス配列を比較して、エラーが訂正されたコンセンサス配列を提供することを含む、請求項２９に記載の方法。
第１のDNA産物および第２のDNA産物の各々を配列決定することが、
第１のDNA産物の鎖の少なくとも１つを配列決定して、第１の鎖の配列読取を決定することと、
第２のDNA産物の鎖の少なくとも１つを配列決定して、第２の鎖の配列読取を決定することと、
前記第１の鎖の配列読取と前記第２の鎖の配列読取とを比較して、エラーが訂正された配列読取を生成することと、を含む、請求項１～３０のいずれか１項に記載の方法。
エラーが訂正された配列読取が、第１の鎖の配列読取と第２の鎖の配列読取との間で一致するヌクレオチド塩基を含む、請求項３１に記載の方法。
エラーが訂正された配列読取の特定の位置で生じる変動が真のバリアントとして同定される、請求項３１または請求項３２に記載の方法。
第１の鎖の配列読取または前記第２の鎖の配列読取の一方のみの特定の位置で生じる変動が潜在的なアーティファクトとして同定される、請求項３１～３３のいずれか１項に記載の方法。
エラーが訂正された配列読取が、変異原性化合物または曝露を同定するために使用される、請求項３１～３４のいずれか１項に記載の方法。
エラーが訂正された配列読取が、発がん性化合物または曝露を同定するために使用される、請求項３１～３４のいずれか１項に記載の方法。
１つ以上の二本鎖DNA分子の二本鎖DNA断片が法医学試料に由来し、前記エラーが訂正された配列読取が法医学分析で使用される、請求項３１～３４のいずれか１項に記載の方法。
少なくとも１つの増幅するステップがポリメラーゼ連鎖反応（ＰＣＲ）を含む、請求項１～３７のいずれか１項に記載の方法。
最大でも１０００ｎｇの二本鎖DNA断片が最初に提供される、請求項１～３８のいずれか１項に記載の方法。
最大でも１０ｎｇの二本鎖DNA断片が最初に提供される、請求項１～３９のいずれか１項に記載の方法。
第１の試料中の第1の鎖または第１鎖増幅産物を増幅することが、分離するステップの後、および前記第１の試料を増幅することの前に、前記１つ以上の二本鎖DNA分子上に見られる第２のアダプター配列を破壊または崩壊することをさらに含む、請求項１～４０のいずれか１項に記載の方法。
第２の試料中の第２の鎖または第２鎖増幅産物を増幅することが、分離するステップの後、および前記第２の試料を増幅することの前に、前記１つ以上の二本鎖DNA分子上に見られる第１のアダプター配列を破壊または崩壊することをさらに含む、請求項１～４１のいずれか１項に記載の方法。
破壊することが、酵素消化、少なくとも１つの複製阻害分子の含有、酵素的切断、一方の鎖の酵素的切断、両方の鎖の酵素的切断、一方もしくは両方の鎖の切断をもたらす酵素処理が後に続く修飾された核酸の取り込み、複製阻止ヌクレオチドの組み込み、連鎖停止剤の組み込み、光切断可能なリンカーの取り込み、ウラシルの取り込み、リボース塩基の取り込み、８－オキソ－グアニン付加物の組み込み、制限エンドヌクレアーゼの使用、標的化ヌクレアーゼの使用、およびそれらの任意の組み合わせの少なくとも１つを含む、請求項４１または請求項４２に記載の方法。
増幅することが、ローリングサークル増幅、多置換増幅、等温増幅、ブリッジ増幅、または表面結合増幅を含む、請求項１～４３のいずれか１項に記載の方法。
第1の鎖または第１鎖増幅産物を増幅すること、または、第２の鎖または第２鎖増幅産物を増幅することが、目的の配列に少なくとも部分的に相補的な一本鎖オリゴヌクレオチド、および前記アダプターの領域に少なくとも部分的に相補的な一本鎖オリゴヌクレオチドの使用を含む、請求項１～４４のいずれか１項に記載の方法。
複数の１つ以上の二本鎖DNA分子が、二本鎖DNA断片の両方の末端にアダプターを含む、請求項１～４５のいずれか１項に記載の方法。
第1の鎖または第１鎖増幅産物を増幅すること、または、第２の鎖または第２鎖増幅産物を増幅することが、第１のアダプター配列および前記第２のアダプター配列の領域に少なくとも部分的に相補的な一本鎖オリゴヌクレオチドの使用を含む、請求項４６に記載の方法。
アダプターが、少なくとも部分的に非相補的であるか、または少なくとも１つの非標準塩基を含む少なくとも１つのヌクレオチド位置を含む、請求項１～４７のいずれか１項に記載の方法。
アダプターが、約５個以上の自己相補型ヌクレオチドによって形成される単一の「Ｕ字型」オリゴヌクレオチド配列を含む、請求項１～４８のいずれか１項に記載の方法。
１つ以上の二本鎖DNA分子の二本鎖DNA断片が、２つ以上の供給源に由来する、請求項１～４９のいずれか１項に記載の方法。
エラー訂正コンセンサス配列が第１の鎖のコンセンサス配列と第２の鎖のコンセンサス配列で一致するヌクレオチド塩基を含む、請求項３０記載の方法。
エラー訂正コンセンサス配列中の特定の位置で生じる変動が真のバリアントとして同定される、請求項３０記載の方法。
第１の鎖のコンセンサス配列または第２の鎖のコンセンサス配列の一方のみの特定の位置で生じる変動が潜在的なアーティファクトとして同定される、請求項３０記載の方法。