JP6743268B2

JP6743268B2 - 合成核酸スパイクイン

Info

Publication number: JP6743268B2
Application number: JP2019500764A
Authority: JP
Inventors: クリスチャンズ，フレッド・シー; ヴィルファン，イゴール・ディー; ケルテース，マイケル; ブラウキャンプ，ティモシー・エー; ベンカタサブラーマニヤン，シヴクマール; ローゼン，マイケル; シット，レネ
Original assignee: カリウス・インコーポレイテッド
Priority date: 2016-03-25
Filing date: 2017-03-24
Publication date: 2020-08-19
Anticipated expiration: 2037-03-24
Also published as: CA3014070C; IL278000A; IL278000B; KR20200128194A; CA3185611A1; EP4198146A3; US20170275691A1; KR102175718B1; KR102326769B1; KR20180129844A; US20210324467A1; JP2022120165A; AU2017237199A1; EP4198146A2; KR102531487B1; EP3433382B1; CN116987777A; JP2019509068A; MX2018011429A; EP3433382A1

Description

本発明は合成核酸スパイクイン（ｓｐｉｋｅ−ｉｎ）に関する。

相互参照
本出願は２０１６年３月２５日付け出願の米国仮特許出願第６２／３１３，６６８号、２０１６年９月２１日付け出願の米国仮特許出願第６２／３９７，８７３号および２０１７年１月２７日付け出願の米国仮特許出願第６２／４５１，３６３号（それらの全体を参照により本明細書に組み入れることとする）の利益を主張するものである。

次世代シーケンシングは、サンプルの遺伝的内容に関する大量のデータを収集するために用いられうる。それは臨床サンプルのような複雑なサンプルにおける核酸の分析および全ゲノムの配列決定に特に有用でありうる。しかし、核酸、特に低含量の核酸または患者のサンプルにおける核酸を検出および定量するための、より効率的かつ高精度の方法が当技術分野で必要とされている。

概要
スパイクイン合成核酸を使用する、次世代シーケンシングアッセイおよび他のアッセイにおける核酸の、改良された特定または定量のための方法および組成物を、本発明において提供する。幾つかの場合には、スパイクイン合成核酸は特定の配列、長さ、ＧＣ含量、縮重度、多様性の度合および／または既知の出発濃度のような特別な特徴を有する。本発明で提供する方法は、血漿のような臨床サンプルにおける病原体核酸の検出に特に有用であるが、他のタイプの標的を検出するためにも使用されうる。

１つの態様においては、標的核酸を含む初期サンプルにおける核酸の存在量を決定するための方法を本発明で提供し、該方法は、（ａ）少なくとも１，０００個の合成核酸の出発量をサンプルに加え（添加し）、ここで、前記の少なくとも１，０００個の合成核酸のそれぞれはユニーク（ｕｎｉｑｕｅ；一意）可変領域を含み、（ｂ）該サンプルにおける標的核酸の一部および前記の少なくとも１，０００個の合成核酸の一部に関して配列決定アッセイを行い、それにより、標的および合成核酸配列リード（ｒｅａｄ；読取り）を得、ここで、該合成核酸配列リードはユニーク可変領域配列を含み、（ｃ）（ｉ）該合成核酸配列リード内の異なる可変領域配列の数を定量して、ユニーク配列決定値を得、（ｉｉ）前記の少なくとも１，０００個の合成核酸の出発量を前記のユニーク配列決定値と比較して、前記の少なくとも１，０００個の合成核酸の多様性減少を得ることにより、前記の少なくとも１，０００個の合成核酸の多様性減少を検出し、（ｄ）前記の少なくとも１，０００個の合成核酸の多様性減少を用いて、初期サンプルにおける標的核酸の存在量を計算することを含む。幾つかの場合には、比較する出発量は出発濃度である。

幾つかの実施形態においては、標的核酸は病原体核酸を含む。幾つかの場合には、標的核酸は、少なくとも５つの異なる病原体からの病原体核酸を含む。幾つかの場合には、標的核酸は、少なくとも２つの異なる病原体からの病原体核酸を含む。幾つかの場合には、標的核酸は、少なくとも１０種の異なる病原体からの病原体核酸を含む。

幾つかの場合には、前記の少なくとも１，０００個の合成核酸はＤＮＡを含む。幾つかの場合には、前記の少なくとも１，０００個の合成核酸はＲＮＡ、ｓｓＲＮＡ、ｄｓＤＮＡ、ｓｓＤＮＡまたはそれらの幾つかの組合せを含む。幾つかの場合には、前記の少なくとも１，０００個の合成核酸のそれぞれは５００塩基対またはヌクレオチド長未満である。幾つかの場合には、前記の少なくとも１，０００個の合成核酸のそれぞれは２００塩基対またはヌクレオチド長未満である。幾つかの場合には、前記の少なくとも１，０００個の合成核酸のそれぞれは１００塩基対またはヌクレオチド長未満である。幾つかの場合において、サンプルは血液、血漿、血清、脳脊髄液、滑液、気管支肺胞洗浄液、尿、便、唾液または鼻サンプルである。幾つかの場合には、サンプルはヒト対象由来である。幾つかの場合には、サンプルは、単離された核酸のサンプルである。

幾つかの場合には、該方法は更に、該サンプルから配列決定ライブラリーを製造（作製）することを含み、ここで、配列決定ライブラリーを製造する前に前記の少なくとも１，０００個の合成核酸をサンプルに加える。幾つかの場合には、前記の少なくとも１，０００個の合成核酸の多様性減少はサンプルのサンプル処理中の１以上の核酸の減少を示す。

幾つかの場合には、前記の少なくとも１，０００個の合成核酸のそれぞれは識別タグ配列を含む。幾つかの場合には、ユニーク可変領域配列の数の定量は、該タグ配列を含有する配列を検出することを含む。幾つかの場合には、第１配列リード内の少なくとも１，０００個のユニーク配列の定量は、第１配列リード内のユニーク配列のリード数（リードカウント）を決定することを含む。幾つかの場合には、少なくとも１，０００個のユニーク合成核酸は少なくとも１０^４個のユニーク合成核酸を含む。

幾つかの場合には、該方法は更に、第１の長さを有する第１の追加的合成核酸群、第２の長さを有する第２の追加的合成核酸群、および第３の長さを有する第３の追加的合成核酸群を加えることを含み、ここで、第１、第２および第３の追加的合成核酸群のそれぞれは、少なくとも３つの異なるＧＣ含量を有する合成核酸を含む。幾つかの場合には、該方法は更に、該追加的合成核酸を使用して、サンプルにおける標的核酸の絶対的存在量値を計算することを含む。幾つかの場合には、該方法は更に、該追加的合成核酸を使用して、該追加的合成核酸の長さ、ＧＣ含量または長さおよびＧＣ含量の両方に基づいてサンプルにおける標的核酸の絶対的または相対的存在量を計算することを含む。

幾つかの場合には、第１サンプル処理工程において、前記の少なくとも１，０００個の合成核酸をサンプルに加える。幾つかの場合には、該方法は更に、第２サンプル処理工程において、少なくとも１，０００個のユニーク合成核酸の追加的プールをサンプルに加えることを含み、ここで、第２サンプル処理工程は第１サンプル処理工程とは異なる。幾つかの場合には、該方法は更に、少なくとも１，０００個の合成核酸の追加的プールに関する多様性減少を計算することを含む。幾つかの場合には、該方法は更に、少なくとも１，０００個の合成核酸に関する多様性減少を少なくとも１，０００個の合成核酸の追加的プールに関する多様性減少と比較することにより、比較的高い多様性減少を示すサンプル処理工程を特定することを含む。

幾つかの場合には、少なくとも１，０００個のユニーク合成核酸の追加的プールにおけるユニーク合成核酸のそれぞれは、少なくとも１，０００個の合成核酸の追加的プールのメンバーとして該合成核酸を特定するドメインを含む。幾つかの場合には、該方法は更に、サンプル識別核酸をサンプルに加えることを含む。幾つかの場合には、前記の（ａ）は更に、非ユニーク合成核酸をサンプルに加えることを含む。

幾つかの実施形態においては、計算される存在量は相対的存在量である。幾つかの実施形態においては、計算される存在量は絶対的存在量である。

もう１つの態様においては、サンプルにおける病原体核酸の相対的存在量または初期存在量を決定する方法を本発明で提供し、該方法は、（ａ）病原体に感染している又は感染していると疑われる対象からサンプルを得、ここで、該サンプルは複数の病原体核酸を含み、（ｂ）該サンプルが既知初期存在量の合成核酸を含むように、複数の合成核酸を該サンプルに加え、ここで、（ｉ）該合成核酸は５００塩基対長未満であり、（ｉｉ）該合成核酸は、第１の長さを有する合成核酸、第２の長さを有する合成核酸、および第３の長さを有する合成核酸を含み、ここで、第１、第２および第３の長さは異なり、（ｉｉｉ）第１の長さを有する合成核酸は、少なくとも３つの異なるＧＣ含量を有する合成核酸を含み、（ｃ）前記の複数の合成核酸を含むサンプルに関して配列決定アッセイを行い、それにより、該合成核酸の最終存在量および前記の複数の病原体核酸の最終存在量を決定し、（ｄ）合成核酸の最終存在量および既知初期存在量を比較して、該合成核酸に関する回収プロファイルを得、（ｅ）該合成核酸に関する回収プロファイルを使用して、該病原体核酸を、最も近いＧＣ含量および長さを有する合成核酸と比較し、それにより、前記の複数の病原体核酸の相対的存在量または初期存在量を決定することにより、前記の複数の病原体核酸の最終存在量を正規化することを含む。

幾つかの場合には、前記の少なくとも３つの異なるＧＣ含量は、１０％〜４０％である第１のＧＣ含量、４０％〜６０％である第２のＧＣ含量、および６０％〜９０％である第３のＧＣ含量を含む。幾つかの場合には、前記の少なくとも３つの異なるＧＣ含量はそれぞれ１０％〜５０％である。幾つかの場合には、前記の少なくとも３つの異なるＧＣ含量はそれぞれ５％〜４０％である。幾つかの場合には、該合成核酸は２００塩基対またはヌクレオチド長未満である。幾つかの場合には、該合成核酸は１００塩基対またはヌクレオチド長未満である。幾つかの場合には、前記の少なくとも３つの異なるＧＣ含量は、少なくとも４つ、少なくとも５つ、少なくとも６つ、少なくとも７つ、または少なくとも８つの異なるＧＣ含量である。幾つかの場合には、該合成核酸は、少なくとも第４の長さ、少なくとも第５の長さ、少なくとも第６の長さ、少なくとも第７の長さ、少なくとも第９の長さ、少なくとも第１０の長さ、少なくとも第１２の長さ、または少なくとも１５番目の長さを有する。幾つかの実施形態においては、各長さは、少なくとも３、４、５、６、７、８、９、１０個の異なるＧＣ含量、または５０個以下の異なるＧＣ含量を有する合成核酸を含む。

幾つかの場合には、該合成核酸は二本鎖ＤＮＡを含む。幾つかの場合には、該方法は更に、該合成核酸を使用して、病原体核酸の変性をモニターすることを含む。幾つかの場合には、該方法は更に、重み係数を使用することにより、病原体核酸の相対的存在量または初期存在量を正規化することを含む。幾つかの場合には、第１合成核酸の既知濃度および第２合成核酸の既知濃度と比較して、前記の複数の合成核酸の第１合成核酸の生測定値および前記の複数の合成核酸の第２合成核酸の生測定値を分析することにより、重み付け係数を得る。

もう１つの態様においては、病原体からの核酸を検出するための方法を本発明で提供し、該方法は、（ａ）第１病原体核酸を含む第１サンプルを得、ここで、第１サンプルは、第１病原体に感染している第１対象から得られ、（ｂ）第２対象から第２サンプルを得、（ｃ）第１病原体核酸にハイブリダイズし得ない異なる合成核酸をそれぞれが含む第１サンプル識別子および第２サンプル識別子を得、第１サンプル識別子を第１サンプルに割り当て、第２サンプル識別子を第２サンプルに割り当て、（ｄ）第１サンプル識別子を第１サンプルに、そして第２サンプル識別子を第２サンプルに加え、（ｅ）第１サンプル識別子を含む第１サンプルに関して、そして第２サンプル識別子を含む第２サンプルに関して配列決定アッセイを行い、それにより、第１サンプルおよび第２サンプルに関する配列結果を得、（ｆ）第１サンプルに関する配列結果における第１サンプル識別子、第２サンプル識別子および第１病原体核酸の存在または非存在を検出し、（ｇ）該配列決定アッセイが、第１サンプルにおいて、（ｉ）第１サンプル識別子を検出し、（ｉｉ）第１病原体核酸を検出し、および（ｉｉｉ）第２サンプル識別子を検出せず、または閾値レベル未満の第２サンプル識別子を検出しない場合には、検出された第１病原体核酸が第１サンプルに元々存在すると決定することを含む。

もう１つの態様においては、核酸を検出するための方法を本発明で提供し、該方法は、（ａ）第１核酸を含む第１核酸サンプルを得、（ｂ）第１陽性対照核酸を含む第１対照核酸サンプルを得、（ｃ）第１核酸にハイブリダイズし得ない合成核酸を含む第１サンプル識別子を第１対照核酸に加え、（ｄ）第１サンプル識別子を含む第１対照核酸サンプルおよび第１核酸サンプルに関して配列決定アッセイを行い、それにより、第１および対照核酸サンプルの配列リードを得、（ｅ）第１核酸サンプルに関する配列リードを参照配列とアライメント（整列）させて、第１核酸サンプルに関する配列リードにおける第１サンプル識別子の存在または非存在を検出し、（ｆ）該配列リードのアライメントに基づいて、第１陽性対照核酸が第１核酸サンプルに存在するかどうかを決定することを含む。

幾つかの場合には、第１サンプル識別子の合成核酸は１５０塩基対またはヌクレオチド長未満である。幾つかの場合には、第１陽性対照核酸は病原体核酸である。幾つかの場合には、第１サンプル識別子は修飾核酸を含む。幾つかの場合には、第１サンプル識別子はＤＮＡを含む。幾つかの場合には、サンプルは無細胞体液を含む。幾つかの場合には、サンプルは、病原体に感染している対象からのものである。

もう１つの態様においては、サンプルにおいて試薬を検出するための方法を本発明で提供し、該方法は、（ａ）第１合成核酸を試薬に加え、ここで、第１合成核酸はユニーク配列を含み、（ｂ）第１合成核酸を含む試薬を核酸サンプルに加え、（ｃ）配列決定アッセイのための核酸サンプルを調製し、（ｄ）核酸サンプルに関して配列決定アッセイを行い、それにより、核酸サンプルに関する配列結果を得、（ｅ）核酸サンプルに関する配列結果に基づいて、該サンプルにおける第１合成核酸の存在または非存在を決定することにより、該サンプルにおいて試薬を検出することを含む。

幾つかの場合には、第１合成核酸は１５０塩基対またはヌクレオチド長未満である。幾つかの場合には、第１合成核酸を第１試薬ロットを加え、更に、第２合成核酸を第２試薬ロットに加えることを含む。幾つかの場合には、サンプルにおいて試薬を検出することは、試薬の特定のロットを検出することを含む。幾つかの場合には、該合成核酸はヌクレアーゼにより分解可能でない。幾つかの場合には、試薬は水性バッファーを含む。幾つかの場合には、試薬は抽出試薬、酵素、リガーゼ、ポリメラーゼまたはｄＮＴＰを含む。

もう１つの態様においては、配列決定ライブラリーの製造（作製）方法を本発明で提供し、該方法は、（ａ）（ｉ）標的核酸、（ｉｉ）配列決定アダプター、および（ｉｉｉ）少なくとも１つの合成核酸を含むサンプルを得、ここで、前記の少なくとも１つの合成核酸はＤＮＡを含み、核酸への連結に抵抗し、（ｂ）該配列決定アダプターが前記の少なくとも１つの合成核酸よりも優先的に標的核酸に連結するように、該サンプルに関して連結反応を行うことを含む。

もう１つの態様においては、配列決定ライブラリーの製造方法を本発明で提供し、該方法は、（ａ）標的核酸と少なくとも１つの合成核酸とを含むサンプルを得、（ｂ）前記の少なくとも１つの合成核酸を該サンプルから除去し、それにより、該標的核酸を含み前記の少なくとも１つの合成核酸を含まない配列決定サンプルを得、（ｃ）配列決定アダプターを配列決定サンプルにおける標的核酸に結合させることを含む。

もう１つの態様においては、配列決定ライブラリーの製造方法を本発明で提供し、該方法は、（ａ）標的核酸と少なくとも１つの合成核酸とを含むサンプルを得、ここで、前記の少なくとも１つの合成核酸は、（ｉ）一本鎖ＤＮＡ、（ｉｉ）該合成核酸の増幅を抑制するヌクレオチド修飾、（ｉｉｉ）固定化タグ、（ｉｖ）ＤＮＡ−ＲＮＡハイブリッド、（ｖ）標的核酸の長さより長い長さを有する核酸、または（ｖｉ）それらの任意の組合せを含み、（ｂ）配列決定反応のためのサンプルから配列決定ライブラリーを製造すること（ここで、前記の少なくとも１つの合成核酸の少なくとも一部は該配列決定反応において配列決定されない）を含む。

もう１つの態様においては、配列決定ライブラリーの製造方法を本発明で提供し、該方法は、（ａ）（ｉ）標的核酸、（ｉｉ）配列決定アダプター、および（ｉｉｉ）少なくとも１つの合成核酸を含むサンプルを得、ここで、前記の少なくとも１つの合成核酸はＤＮＡを含み、末端修復に抵抗し、（ｂ）標的核酸が前記の少なくとも１つの合成核酸よりも優先的に末端修復されるように、該サンプルに関して末端修復反応を行うことを含む。

もう１つの態様においては、配列決定ライブラリーを製造するためのキットを本発明で提供し、該キットは、（ａ）配列決定アダプター、および（ｂ）少なくとも１つの合成核酸を含み、ここで、前記の少なくとも１つの合成核酸はＤＮＡを含み、核酸に対する末端修復に抵抗する。

１つの態様においては、標的核酸を含む初期サンプルにおける核酸の絶対的または相対的存在量を決定するための方法を本発明で提供し、該方法は、（ａ）少なくとも１，０００個のユニーク合成核酸の出発量をサンプルに加え、ここで、前記の少なくとも１，０００個のユニーク合成核酸のそれぞれは、（ｉ）識別タグ、および（ｉｉ）可変領域を含み、（ｂ）該サンプルにおける標的核酸の一部および前記の少なくとも１，０００個のユニーク合成核酸の一部に関して配列決定アッセイを行い、それにより、標的および合成核酸配列リードを得、ここで、該合成核酸配列リードは識別タグ配列および可変領域配列を含み、（ｃ）（ｉ）該識別タグ配列の少なくとも一部に対応する配列リードを検出して、第１配列リードのセットを得、（ｉｉ）第１配列リード内の異なる可変領域配列の数を定量して、ユニーク配列決定値を得、（ｉｉｉ）前記の少なくとも１，０００個のユニーク合成核酸の出発量を該ユニーク配列決定値と比較して、前記の少なくとも１，０００個のユニーク合成核酸の多様性減少を得ることにより、前記の少なくとも１，０００個のユニーク合成核酸の多様性減少を検出し、（ｄ）前記の少なくとも１，０００個のユニーク合成核酸の多様性減少を用いて、初期サンプルにおける標的核酸の絶対的または相対的存在量値を計算することを含む。幾つかの場合には、比較する出発量は出発濃度である。

幾つかの場合には、標的核酸は病原体核酸を含む。幾つかの場合には、標的核酸は、少なくとも５つの異なる病原体からの病原体核酸を含む。幾つかの場合には、前記の少なくとも１，０００個のユニーク合成核酸はＤＮＡを含む。

幾つかの場合には、前記の少なくとも１，０００個のユニーク合成核酸のそれぞれは５００塩基対またはヌクレオチド長未満である。幾つかの場合には、前記の少なくとも１，０００個のユニーク合成核酸のそれぞれは２００塩基対またはヌクレオチド長未満である。幾つかの場合には、前記の少なくとも１，０００個のユニーク合成核酸のそれぞれは１００塩基対またはヌクレオチド長未満である。

幾つかの場合において、サンプルは血液、血漿、血清、脳脊髄液、滑液、気管支肺胞洗浄液、尿、便、唾液または鼻サンプルである。幾つかの場合には、サンプルは、単離された核酸のサンプルである。幾つかの場合には、サンプルはヒト対象由来である。

幾つかの場合には、該方法は更に、該サンプルから配列決定ライブラリーを製造することを含み、ここで、配列決定ライブラリーを製造する前に前記の少なくとも１，０００個のユニーク合成核酸をサンプルに加える。幾つかの場合には、前記の少なくとも１，０００個のユニーク合成核酸の多様性減少はサンプルのサンプル処理中の１以上の核酸の減少を示す。幾つかの場合には、該識別タグは共通配列を含む。幾つかの場合には、第１配列リード内の少なくとも１，０００個のユニーク配列の定量は、第１配列リード内のユニーク配列のリード数を決定することを含む。

幾つかの場合には、前記の少なくとも１，０００個のユニーク合成核酸は少なくとも１０^４個のユニーク合成核酸を含む。幾つかの場合には、前記の少なくとも１，０００個のユニーク合成核酸は少なくとも１０^５個のユニーク合成核酸を含む。幾つかの場合には、該方法は更に、少なくとも３つの異なる長さを有する追加的合成核酸を加えることを含む。

幾つかの場合には、該方法は更に、第１の長さを有する第１の追加的合成核酸群、第２の長さを有する第２の追加的合成核酸群、および第３の長さを有する第３の追加的合成核酸群を加えることを含み、ここで、第１、第２および第３の追加的合成核酸群のそれぞれは、少なくとも３つの異なるＧＣ含量を有する合成核酸を含む。幾つかの場合には、該方法は更に、該追加的合成核酸を使用して、サンプルにおける標的核酸の絶対的または相対的存在量値を計算することを含む。幾つかの場合には、該方法は更に、該追加的合成核酸を使用して、該追加的合成核酸の長さ、ＧＣ含量または長さおよびＧＣ含量の両方に基づいてサンプルにおける標的核酸の絶対的または相対的存在量を計算することを含む。

幾つかの場合には、第１サンプル処理工程において、前記の少なくとも１，０００個のユニーク合成核酸をサンプルに加える。幾つかの場合には、該方法は更に、第２サンプル処理工程において、少なくとも１，０００個のユニーク合成核酸の追加的プールをサンプルに加えることを含み、ここで、第２サンプル処理工程は第１サンプル処理工程とは異なる。幾つかの場合には、該方法は更に、少なくとも１，０００個のユニーク合成核酸の追加的プールに関する多様性減少を計算することを含む。幾つかの場合には、該方法は更に、前記の少なくとも１，０００個のユニーク合成核酸に関する多様性減少を少なくとも１，０００個のユニーク合成核酸の追加的プールに関する多様性減少と比較することにより、比較的高い多様性減少を示すサンプル処理工程を特定することを含む。

幾つかの場合には、少なくとも１，０００個のユニーク合成核酸の追加的プールにおけるユニーク合成核酸のそれぞれは、少なくとも１，０００個の合成核酸の追加的プールのメンバーとして該合成核酸を特定するドメインを含む。幾つかの場合には、該方法は更に、サンプル識別核酸をサンプルに加えることを含む。幾つかの場合には、前記の（ａ）は更に、非ユニーク合成核酸をサンプルに加えることを含む。幾つかの場合には、参照配列とアライメント（整列）させることにより、可変配列リードを検出する。幾つかの場合には、可変配列リードを互いにアライメントさせ、重複配列リードを除外することにより、異なる可変配列リードの数を定量する。

核酸のサンプルにおける病原体核酸の相対的存在量または濃度を決定する方法を本発明で提供する。幾つかの場合には、該方法は、病原体に感染している又は感染していると疑われる対象からサンプルを得（ここで、該サンプルは２以上の病原体核酸を含み、ここで、前記の２以上の病原体核酸は、異なる長さを有する第１病原体核酸および第２病原体核酸を含む）、既知濃度の２以上の合成核酸をサンプルに加え（ここで、前記の２以上の合成核酸は、第１病原体核酸の６５％〜１３５％、７５％〜１２５％、または８５％〜１１５％の長さを有する第１合成核酸、および第２病原体核酸の６５％〜１３５％、７５％〜１２５％、または８５％〜１１５％の長さを有する第２合成核酸を含み、ここで、前記の２以上の合成核酸は第１または第２病原体核酸にハイブリダイズしない）、サンプルに関して配列決定アッセイを行い、それにより、前記の２以上の合成核酸、第１病原体核酸および第２病原体核酸に関する生測定値を得、第１合成核酸の生測定値を第１合成核酸の既知濃度と比較して、第１合成核酸に関する回収プロファイルを得、第１合成核酸に関する回収プロファイルを使用して、第１病原体核酸に関する生測定値を正規化し、それにより、第１病原体核酸の相対的存在量または出発濃度を決定することを含みうる。

幾つかの場合において、第１病原体核酸および第２の病原体核酸は、同じ病原体に由来する。幾つかの場合には、第１病原体核酸および第２の病原体核酸は、異なる病原体に由来する。幾つかの場合には、本明細書に記載されている方法は更に、重み係数を使用することにより、第１病原体核酸の相対的存在量または出発濃度濃度を正規化することを含む。幾つかの場合には、第１合成核酸の既知濃度および第２合成核酸の既知濃度と比較して、前記の複数の合成核酸の第１合成核酸の生測定値および前記の複数の合成核酸の第２合成核酸の生測定値を分析することにより、重み付け係数を得る。

核酸のサンプルにおける核酸の相対的存在量または出発濃度を決定する方法を本発明で提供し、該方法は、（ａ）対象から核酸サンプルを得（ここで、該核酸サンプルは、異なる長さを有する第１核酸および第２核酸を含む）、既知濃度の２以上の合成核酸をサンプルに加え（ここで、（ｉ）前記の２以上の合成核酸は、第１核酸の６５％〜１３５％、７５％〜１２５％、または８５％〜１１５％の長さを有する第１合成核酸、および第２核酸の長さの６５％〜１３５％、７５％〜１２５％、または８５％〜１１５％の長さを有する第２合成核酸を含み、（ｉｉ）第１合成核酸は特定の長さのロード（ｌｏａｄ）ドメインと、ロードドメインの特定の長さを識別するようにコードされたユニーク配列を有する識別ドメインとを含み、（ｉｉｉ）前記の２以上の合成核酸は第１または第２核酸にハイブリダイズし得ない）、（ｂ）サンプルに関して配列決定アッセイを行い、それにより、前記の２以上の合成核酸、第１核酸および第２核酸に関する生測定値を得、（ｃ）第１合成核酸の生測定値を第１合成核酸の既知濃度と比較して、回収プロファイルを得、（ｄ）該回収プロファイルを使用して、第１核酸に関する生測定値を正規化し、それにより、第１核酸の相対的存在量または出発濃度を決定することを含む。

幾つかの場合には、第１核酸は病原体核酸である。幾つかの場合には、前記の２以上の合成核酸の既知濃度は２以上、３以上、５以上、１０以上、５０以上、１００以上、または１，０００以上の異なる濃度を含む。幾つかの場合には、前記の２以上の合成核酸の既知濃度は等モル濃度である。幾つかの場合には、前記の２以上の合成核酸はＤＮＡまたは修飾ＤＮＡを含む。幾つかの場合には、前記の２以上の合成核酸はＲＮＡまたは修飾ＲＮＡを含む。幾つかの場合には、前記の２以上の合成核酸は、２以上、３以上、５以上、８以上、１０以上、５０以上、１００以上、または１，０００以上の異なる長さの核酸を含む。幾つかの場合には、前記の２以上の合成核酸は、２以上、３以上、５以上、８以上、１０以上、５０以上、１００以上、または１，０００以上の異なる配列の核酸を含む。幾つかの場合には、前記の２以上の合成核酸は５０ヌクレオチド長以下、１００ヌクレオチド長以下、２００ヌクレオチド長以下、３００ヌクレオチド長以下、３５０ヌクレオチド長以下、４００ヌクレオチド長以下、４５０ヌクレオチド長以下、５００ヌクレオチド長以下、７５０ヌクレオチド長以下、または１，０００ヌクレオチド長以下である。幾つかの場合には、前記の２以上の合成核酸は少なくとも１０ヌクレオチド長、少なくとも２０ヌクレオチド長、または少なくとも３０ヌクレオチド長、少なくとも５０ヌクレオチド長、少なくとも１００ヌクレオチド長、または少なくとも１５０ヌクレオチド長である。幾つかの場合には、前記の２以上の合成核酸は、前記の２以上の合成核酸を合成物として特定する核酸配列を含む。幾つかの場合には、前記の２以上の合成核酸を合成物として特定する核酸配列は１０ヌクレオチド長以下、２０ヌクレオチド長以下、３０ヌクレオチド長以下、４０ヌクレオチド長以下、５０ヌクレオチド長以下、１００ヌクレオチド長以下、２００ヌクレオチド長以下、または５００ヌクレオチド長以下である。幾つかの場合には、前記の２以上の合成核酸は、該合成核酸の長さを特定する核酸配列を含む。幾つかの場合には、該合成核酸の長さを特定する核酸配列は１０ヌクレオチド長以下、２０ヌクレオチド長以下、３０ヌクレオチド長以下、４０ヌクレオチド長以下、５０ヌクレオチド長以下、１００ヌクレオチド長以下、２００ヌクレオチド長以下、または５００ヌクレオチド長以下である。

幾つかの場合において、サンプルは、血液、血漿、血清、脳脊髄液、滑液、気管支肺胞洗浄液、尿、便、唾液、鼻スワブおよびそれらの任意の組合せからなる群から選択される。幾つかの場合には、サンプルは無細胞核酸を含む。幾つかの場合には、サンプルは循環無細胞核酸を含む。幾つかの場合には、対象はヒトである。幾つかの場合には、病原体は細菌、ウイルス、真菌または寄生生物である。幾つかの場合には、対象は敗血症を有する又は有すると疑われる。幾つかの場合には、病原体は敗血症に関連している。幾つかの場合には、前記の２以上の病原体核酸は３以上、５以上、１０以上、５０以上、１００以上、１，０００以上、２，０００以上、５，０００以上、８，０００以上、１０，０００以上、１５，０００以上、または２０，０００以上の病原体核酸配列を含む。

幾つかの場合には、第１病原体核酸の相対的存在量の決定は、１以上のゲノムコピーを生成させることを含む。幾つかの場合には、１以上のゲノムコピーの生成は体積当たりのゲノムコピーとして表される。幾つかの場合には、本明細書に記載されている方法は更に、サンプルから核酸を抽出することを含む。幾つかの場合には、サンプルからの核酸の抽出は、磁気ビーズを使用して行う。幾つかの場合には、本明細書に記載されている方法は更に、低品質の配列決定リードを除去することを含む。幾つかの場合には、本明細書に記載されている方法は更に、対象の種の参照配列に対してアライメント（整列）またはマッピングされた配列決定リードを除去することを含む。幾つかの場合には、本明細書に記載されている方法は更に、１以上の異なる長さの核酸を回収する相対的効率を決定することを含む。幾つかの場合には、本明細書に記載されている方法は更に、１以上の合成核酸の測定濃度を決定することを含む。幾つかの場合には、本明細書に記載されている方法は、前記の１以上の合成核酸の測定濃度を既知濃度と比較することを含む。幾つかの場合には、本明細書に記載されている方法は更に、配列決定アッセイにおいて、１以上、２以上、３以上、５以上、１０以上、５０以上、１００以上、１，０００以上、２，０００以上、５，０００以上、８，０００以上、１０，０００以上、１５，０００以上、または２０，０００以上の病原体核酸を検出することを含む。幾つかの場合には、本明細書に記載されている方法は更に、配列決定アッセイにおいて、抗微生物、抗細菌、抗ウイルスまたは抗真菌耐性を示す１以上、２以上、３以上、５以上、１０以上、５０以上、１００以上、１，０００以上、２，０００以上、５，０００以上、８，０００以上、１０，０００以上、１５，０００以上、または２０，０００以上の病原体核酸を検出することを含む。幾つかの場合には、本明細書に記載されている方法は更に、サンプルにおける２以上、３以上、５以上、１０以上、５０以上、１００以上の病原体の同時存在を特定することを含む。

幾つかの場合には、サンプルからの核酸の抽出の前または途中に、前記の２以上の合成核酸をサンプルに加える。幾つかの場合には、サンプルからの核酸の抽出の後および核酸のライブラリー調製の前に、前記の２以上の合成核酸をサンプルに加える。幾つかの場合には、前記の２以上の合成核酸の長さは少なくとも約２０塩基対異なる。幾つかの場合には、前記の２以上の合成核酸は３以上、５以上、８以上、１０以上、２０以上または５０以上の合成核酸を含む。幾つかの場合には、前記の２以上の合成核酸は、配列番号１１１〜配列番号１１８およびそれらの任意の組合せからなる群から選択される。幾つかの場合には、前記の２以上の合成核酸は共通のフォワード配列を共有する。幾つかの場合には、前記の共通のフォワード配列は約２０塩基対長以下である。幾つかの場合には、前記の２以上の合成核酸は共通のリバース配列を共有する。幾つかの場合には、前記の共通のリバース配列は約２０塩基対長以下である。

幾つかの場合には、本明細書に記載されている方法は更に、第２合成核酸の生測定値を第２合成核酸の既知濃度と比較して、第２合成核酸に関する回収プロファイルを得、第２合成核酸に関する回収プロファイルを使用して、第２病原体核酸に関する生測定値を正規化し、それにより、第２病原体核酸の相対的存在量または出発濃度を決定することを含む。

幾つかの場合には、前記の２以上の病原体核酸は、異なる長さを有する５以上の病原体核酸を含み、前記の２以上の合成核酸は、前記の５以上の病原体核酸のそれぞれの長さの６５％〜１３５％、７５％〜１２５％、または８５％〜１１５％の長さを有する１以上の合成核酸を含み、前記の２以上の核酸は前記の５以上の病原体核酸にハイブリダイズせず、サンプルに関して配列決定アッセイを行うことにより、前記の２以上の合成核酸および前記の５以上の病原体核酸に関する生測定値を得、該生測定値の比較は、該生測定値を各合成核酸の既知濃度と比較して、各合成核酸に関する回収プロファイルを得ることを含み、および／または該回収プロファイルの使用は、各合成核酸に関する回収プロファイルを使用して、前記の５以上の病原体核酸のそれぞれの生測定値を正規化し、それにより、前記の５以上の病原体核酸のそれぞれの相対的存在量または出発濃度を決定することを含む。幾つかの場合には、前記の５以上の病原体核酸は、１０以上、５０以上、１００以上、１，０００以上、２，０００以上、５，０００以上、８，０００以上、１０，０００以上、１５，０００以上、または２０，０００以上の病原体核酸を含む。幾つかの場合には、本明細書に記載されている方法は更に、前記の２以上の合成核酸および核酸のサンプルにおける核酸を抽出または精製することを含む。幾つかの場合には、前記の２以上の合成核酸および核酸のサンプルにおける核酸の抽出または精製は、前記の２以上の合成核酸および核酸のサンプルにおける核酸の相対的濃度を変化させる。幾つかの場合には、該生測定値はリード数である。

病原体からの核酸を検出するための方法を本発明で提供し、該方法は、（ａ）第１病原体核酸を含む第１核酸サンプルを得、ここで、第１病原体に感染している又は第１病原体に感染していると疑われる第１対象から第１核酸サンプルを得、（ｂ）第２病原体核酸を含む第２核酸サンプルを得、ここで、第２病原体に感染している又は第２病原体に感染していると疑われる第２対象から第２核酸サンプルを得、（ｃ）病原体核酸にハイブリダイズし得ない異なる合成核酸をそれぞれが含む第１サンプル識別子および第２サンプル識別子を得、第１サンプル識別子を第１核酸サンプルに、そして第２サンプル識別子を第２核酸サンプルに割り当て、（ｄ）第１サンプル識別子を第１核酸サンプルに、そして第２サンプル識別子を第２核酸サンプルに加え、（ｅ）第１サンプル識別子を含む第１核酸サンプルに関して、および第２サンプル識別子を含む第２核酸サンプルに関して配列決定アッセイを行い、それにより、第１サンプルおよび第２サンプルに関する配列結果を得、（ｆ）該配列結果における第１サンプル識別子、第２サンプル識別子および病原体核酸の存在または非存在を検出し、（ｇ）該配列決定アッセイが第１サンプル識別子および標的核酸を検出するが、第２サンプル識別子を検出しない場合には、第１サンプル中に標的核酸が元々存在すると決定することを含む。

幾つかの場合には、該合成核酸は約５００塩基対長以下である。幾つかの場合には、該合成核酸は約１００塩基対長以下である。幾つかの場合には、該合成核酸は少なくとも約５０塩基対長である。幾つかの場合には、該合成核酸は少なくとも約１００塩基対長である。幾つかの場合には、該合成核酸はＤＮＡまたは修飾ＤＮＡを含む。幾つかの場合には、該合成核酸はＲＮＡまたは修飾ＲＮＡを含む。幾つかの場合には、該合成核酸は修飾核酸である。幾つかの場合には、該合成核酸は、配列番号１〜配列番号１１０およびそれらの任意の組合せからなる群から選択される配列を含む。幾つかの場合には、第１サンプルは無細胞体液を含む。

サンプルにおいて試薬を検出するための方法を本発明で提供し、該方法は、第１合成核酸を試薬に加え（ここで、第１合成核酸はユニーク配列を含む）、第１合成核酸を含む試薬を核酸サンプルに加え、配列決定アッセイのための核酸サンプルを調製し、核酸サンプルに関して配列決定アッセイを行い、それにより、核酸サンプルに関する配列結果を得、核酸サンプルに関する配列結果に基づいて、該サンプルにおける第１合成核酸の存在または非存在を決定することにより、該サンプルにおいて試薬を検出することを含む。

幾つかの場合には、工程ａにおいて第１合成核酸を試薬に加えることは、試薬の特定のロットに第１合成核酸を加えることを含む。幾つかの場合には、本明細書に記載されている方法は更に、核酸サンプルに関する配列結果に基づいて、試薬の特定のロットを検出することを含む。幾つかの場合には、第１合成核酸は病原体からの核酸にハイブリダイズしない。幾つかの場合には、本明細書に記載されている方法は更に、試薬の異なるロットに第２合成核酸を加えることを含み、ここで、第２合成核酸は、試薬の異なるロットをユニーク（一意）に特定する。幾つかの場合には、本明細書に記載されている方法は更に、核酸サンプルの配列決定アッセイからの結果に基づいて標的核酸を検出することを含む。幾つかの場合には、本明細書に記載されている方法は更に、（ｉ）標的核酸が正確に検出される場合には、将来の配列決定アッセイにおいて、試薬の特定のロットを使用し、または（ｉｉ）標的核酸が正確に検出されない場合には、将来の配列決定アッセイにおいて、試薬の特定のロットを使用することを控えることを含む。幾つかの場合には、該試薬は水溶液を含む。幾つかの場合には、該合成核酸は約５０〜約５００塩基対長である。幾つかの場合には、該合成核酸はＤＮＡまたは修飾ＤＮＡを含む。幾つかの場合には、該合成核酸はＲＮＡまたは修飾ＲＮＡを含む。幾つかの場合には、該合成核酸は、配列番号１〜配列番号１１０およびそれらの任意の組合せからなる群から選択される配列を含む。幾つかの場合には、該合成核酸はＤＮアーゼにより分解され得ない。

サンプルにおける核酸の多様性減少または存在量を決定するための方法を本発明で提供し、該方法は、標的核酸を含むサンプルに既知濃度の１，０００個のユニーク合成核酸を加え、サンプルに関して配列決定アッセイを行い、それにより、標的核酸の配列リード数、および前記の１，０００個のユニーク合成核酸の少なくとも一部の配列リード数を得、前記の１，０００個のユニーク合成核酸の少なくとも一部の配列リード数を、工程ａにおいて標的核酸を含むサンプルに加えられた１，０００個のユニーク核酸の配列とアライメント（整列）させ、アライメント配列リード数の多様性を前記の１，０００個以上のユニーク合成核酸の多様性と比較することにより、前記の１，０００個のユニーク合成核酸の多様性減少を検出し、前記の１，０００個のユニーク合成核酸の多様性減少を使用して、該サンプルにおける標的核酸における多様性減少または該標的核酸の存在量を計算することを含む。

幾つかの場合には、前記の１，０００個のユニーク合成核酸は約５００塩基対長以下または約１００塩基対長以下である。幾つかの場合には、前記の１，０００個のユニーク合成核酸を等モル濃度で加える。幾つかの場合には、前記の１，０００個のユニーク合成核酸は少なくとも約１×１０^６の多様性を有する。幾つかの場合には、前記の１，０００個のユニーク合成核酸は少なくとも約１×１０^６の多様性を有する。幾つかの場合には、前記の１，０００個のユニーク合成核酸は少なくとも約１×１０^７の多様性を有する。幾つかの場合には、前記の１，０００個のユニーク合成核酸は少なくとも約１×１０^８の多様性を有する。幾つかの場合には、前記の１，０００個のユニーク合成核酸はランダム化部分を有する。幾つかの場合には、前記の１，０００個のユニーク合成核酸はＤＮＡ、修飾ＤＮＡ、ＲＮＡまたは修飾ＲＮＡを含む。幾つかの場合には、前記の１，０００個のユニーク合成核酸は、配列番号１１９および配列番号１２０において特定されている配列を含む。幾つかの場合には、第１サンプル処理工程において、前記の１，０００個のユニーク合成核酸をサンプルに加える。幾つかの場合には、該方法は更に、第２サンプル処理工程において、１，０００個のユニーク合成核酸の追加的プールをサンプルに加えることを含み、ここで、第２サンプル処理工程は第１サンプル処理工程とは異なる。幾つかの場合には、１，０００個のユニーク合成核酸の追加的プールに関する多様性減少を計算する。幾つかの場合には、本明細書に記載されている方法は、前記の１，０００個のユニーク合成核酸に関する多様性減少を１，０００個のユニーク合成核酸の追加的プールに関する多様性減少と比較することにより、比較的高い多様性減少を示すサンプル処理工程を特定することを含む。幾つかの場合には、前記の１，０００個のユニーク合成核酸は、前記の１，０００個のユニーク合成核酸のプールのメンバーとして該合成核酸を特定するドメインを含む。幾つかの場合には、１，０００個のユニーク合成核酸の追加的プールは、１，０００個のユニーク合成核酸の追加的プールのメンバーとして該合成核酸を特定するドメインを含む。幾つかの場合には、前記の１，０００個のユニーク合成核酸を標的核酸の抽出の前にサンプルに加える。幾つかの場合には、前記の１，０００個のユニーク合成核酸を標的核酸のライブラリー調製の前にサンプルに加える。幾つかの場合には、本明細書に記載されている方法は更に、標的核酸を含むサンプルに既知濃度の５，０００個のユニーク合成核酸を加えることを含む。

更に、分子を分析するための方法および組成物を本明細書において開示する。１つの態様においては、配列決定ライブラリーの製造方法を本明細書において開示し、該方法は、ａ）（ｉ）標的核酸、（ｉｉ）配列決定アダプター、および（ｉｉｉ）少なくとも１つの合成核酸を含むサンプルを得、ここで、前記の少なくとも１つの合成核酸はＤＮＡを含み、核酸への連結に抵抗し、ｂ）該配列決定アダプターが前記の少なくとも１つの合成核酸よりも優先的に標的核酸に連結するように、該サンプルに関して連結反応を行うことを含む。

幾つかの場合には、前記の少なくとも１つの合成核酸はホスホジエステル結合を介した該核酸への連結に抵抗する。幾つかの場合には、前記の少なくとも１つの合成核酸は該配列決定アダプターへの連結に抵抗する。もう１つの態様においては、配列決定ライブラリーの製造方法を本明細書において開示し、該方法は、ａ）標的核酸と少なくとも１つの合成核酸とを含むサンプルを得、ｂ）前記の少なくとも１つの合成核酸を該サンプルから除去し、それにより、該標的核酸を含み前記の少なくとも１つの合成核酸を含まない配列決定サンプルを得、ｃ）配列決定アダプターを配列決定サンプルにおける標的核酸に結合させることを含む。幾つかの場合には、前記の少なくとも１つの合成核酸の除去はエンドヌクレアーゼ消化によっては実施されない。幾つかの場合には、サンプルから除去された前記の少なくとも１つの合成核酸は別の合成核酸に結合していない。幾つかの場合には、前記の少なくとも１つの合成核酸は末端修復に抵抗する。

もう１つの態様においては、配列決定ライブラリーの製造方法を本明細書において開示し、該方法は、ａ）標的核酸と少なくとも１つの合成核酸とを含むサンプルを得、ｂ）配列決定アダプターを該サンプルにおける標的核酸に結合させ、それにより、配列決定サンプルを得、ｃ）前記の少なくとも１つの合成核酸を、アフィニティに基づく枯渇（除去）、ＲＮＡ誘導性ＤＮアーゼ消化またはそれらの組合せにより、該配列決定サンプルから除去する（ここで、該配列決定サンプルからの前記の少なくとも１つの合成核酸の除去は、該配列決定アダプターよりも、および該配列決定アダプターの多量体よりも、前記の少なくとも１つの合成核酸を優先的に除去することを含む）ことを含む。

幾つかの場合には、該方法は更に、エンドヌクレアーゼ消化、サイズに基づく除去またはそれらの組合せにより、前記の少なくとも１つの合成核酸を除去することを含む。幾つかの場合には、該配列決定アダプターは核酸である。幾つかの場合には、前記の少なくとも１つの合成核酸の除去を、アフィニティに基づく枯渇により行い、前記の少なくとも１つの合成核酸は固定化タグを含む。幾つかの場合には、前記の少なくとも１つの合成核酸の除去をＲＮＡ誘導性ＤＮアーゼ消化により行う。幾つかの場合には、ＲＮＡ誘導性ＤＮアーゼはＣＲＩＳＰＲ関連タンパク質を含む。幾つかの場合には、前記の少なくとも１つの合成核酸の除去をエンドヌクレアーゼ消化により行う。幾つかの場合には、前記の少なくとも１つの合成核酸の除去を、サイズに基づく除去により行い、前記の少なくとも１つの合成核酸は、標的核酸の長さより長い長さを有する。幾つかの場合には、前記の少なくとも１つの合成核酸の除去をＲＮアーゼで行い、前記の少なくとも１つの合成核酸の除去はＤＮＡ−ＲＮＡハイブリッドである。幾つかの場合には、配列決定アダプターを標的核酸に結合させることは、配列決定アダプターを標的核酸に連結することを含む。幾つかの場合には、配列決定アダプターを標的核酸に結合させることは、配列決定アダプターを標的核酸に連結することを含む。

もう１つの態様においては、配列決定ライブラリーの製造方法を本明細書において開示し、該方法は、ａ）標的核酸と少なくとも１つの合成核酸とを含むサンプルを得、ここで、前記の少なくとも１つの合成核酸は、（ｉ）一本鎖ＤＮＡ、（ｉｉ）該合成核酸の増幅を抑制するヌクレオチド修飾、（ｉｉｉ）固定化タグ、（ｉｖ）ＤＮＡ−ＲＮＡハイブリッド、（ｖ）標的核酸の長さより長い長さを有する核酸、または（ｖｉ）それらの任意の組合せを含み、ｂ）配列決定反応のためのサンプルから配列決定ライブラリーを製造すること（ここで、前記の少なくとも１つの合成核酸の少なくとも一部は該配列決定反応において配列決定されない）を含む。

幾つかの場合には、前記の少なくとも１つの合成核酸は更に、エンドヌクレアーゼ認識部位を含む。幾つかの場合には、サンプルを得ることは、試験サンプルから標的核酸を抽出することを含み、更に、試験サンプルから標的核酸を抽出した後、前記の少なくとも１つの合成核酸を試験サンプルに加えることを含む。幾つかの場合には、サンプルを得ることは、試験サンプルから標的核酸を抽出することを含み、更に、試験サンプルから標的核酸を抽出する前に、前記の少なくとも１つの合成核酸を試験サンプルに加えることを含む。幾つかの場合には、前記の少なくとも１つの合成核酸が、連結反応を阻害するブロッキング基を含む場合には、該ブロッキング基は修飾ヌクレオチドを含む。幾つかの場合には、修飾ヌクレオチドは反転（ｉｎｖｅｒｔｅｄ）デオキシ−糖を含む。幾つかの場合には、反転デオキシ−塩基は３’反転デオキシ−糖を含む。幾つかの場合には、修飾ヌクレオチドは反転チミジン、反転アデノシン、反転グアノシンまたは反転シチジンを含む。幾つかの場合には、修飾ヌクレオチドは反転ジデオキシ−糖を含む。幾つかの場合には、反転ジデオキシ−糖は５’反転ジデオキシ−糖を含む。幾つかの場合には、修飾ヌクレオチドは反転ジデオキ−シチミジン、反転ジデオキシ−アデノシン、反転ジデオキシ−グアノシンまたは反転ジデオキシ−シチジンを含む。幾つかの場合には、修飾ヌクレオチドはジデオキシ−シチジンである。幾つかの場合には、前記の少なくとも１つの合成核酸は連結反応を阻害するブロッキング基を含み、ブロッキング基はスペーサーを含む。幾つかの場合には、スペーサーはＣ３スペーサーまたはスペーサー１８を含む。幾つかの場合には、前記の少なくとも１つの合成核酸は、連結反応を阻害するブロッキング基を含み、ブロッキング基はヘアピン構造を含む。幾つかの場合には、該合成核酸は、前記の少なくとも１つの合成核酸の増幅を阻害するヌクレオチド修飾を含み、該ヌクレオチド修飾は少なくとも１つの脱塩基部位を含む。幾つかの場合には、前記の少なくとも１つの脱塩基部位は少なくとも１つの内部脱塩基部位である。幾つかの場合には、該ヌクレオチド修飾は８〜１０個の脱塩基部位を含む。幾つかの場合には、前記の少なくとも１つの脱塩基部位は単一脱塩基部位である。幾つかの場合には、前記の少なくとも１つの脱塩基部位は修飾リボース上に存在する。幾つかの場合には、前記の少なくとも１つの脱塩基部位は、１’，２’−ジデオキシリボース、ロック化（ｌｏｃｋｅｄ）核酸、架橋核酸、またはねじれたインターカレーティング核酸を含む。幾つかの場合には、前記の少なくとも１つの合成核酸は固定化タグを含み、固定化タグはビオチン、ジゴキシゲニン、ポリヒスチジンまたはＮｉ−ニトリロ三酢酸を含む。幾つかの場合には、前記の少なくとも１つの合成核酸はＤＮＡを含み、内部ウラシルで標識されている。幾つかの場合には、前記の少なくとも１つの合成核酸を、ウラシル特異的切除試薬酵素を使用して、配列決定サンプルから除去する。

幾つかの場合には、試験サンプルは生物学的サンプルである。幾つかの場合には、生物学的サンプルは全血、血漿、血清または尿である。幾つかの場合には、標的核酸は無細胞核酸である。幾つかの場合には、無細胞核酸は無細胞ＤＮＡである。幾つかの場合には、無細胞核酸は病原体核酸である。幾つかの場合には、無細胞核酸は循環無細胞核酸である。幾つかの場合には、前記の少なくとも１つの合成核酸は二本鎖核酸を含む。幾つかの場合には、前記の少なくとも１つの合成核酸は一本鎖核酸を含む。幾つかの場合には、前記の少なくとも１つの合成核酸はＤＮＡ、ＲＮＡ、ＤＮＡ−ＲＮＡハイブリッドまたはそれらの任意の類似体を含む。

幾つかの場合には、該方法は更に、（ａ）サンプルから標的核酸を抽出すること、（ｂ）サンプルから標的核酸を精製すること、（ｃ）標的核酸を末端修復すること、（ｄ）標的核酸を断片化すること、（ｅ）標的核酸を増幅すること、（ｆ）配列決定アダプターを標的核酸に結合させること、および（ｇ）標的核酸を配列決定することの１以上を含む。幾つかの場合には、該方法は、配列決定アダプターを標的核酸に結合させることを含み、更に、配列決定アダプターを標的核酸に結合させる前に、配列決定サンプルをエンドヌクレアーゼで処理することを含む。幾つかの場合には、該方法は、配列決定アダプターを標的核酸に結合させることを含み、更に、配列決定アダプターを標的核酸に結合させた後、配列決定サンプルをエンドヌクレアーゼで処理することを含む。幾つかの場合には、該方法は、標的核酸を末端修復することを含み、ここで、標的核酸を末端修復する前に、前記の少なくとも１つの合成核酸をサンプルに加える。幾つかの場合には、該方法は、標的核酸を末端修復することを含み、ここで、標的核酸を末端修復した後、前記の少なくとも１つの合成核酸をサンプルに加える。幾つかの場合には、該方法は、配列決定アダプターを標的核酸に結合させることを含み、配列決定アダプターを標的核酸に結合させる前に、前記の少なくとも１つの合成核酸をサンプルに加える。幾つかの場合には、サンプルにおける前記の少なくとも１つの合成核酸の濃度とサンプルにおける標的核酸の濃度との比は１：１〜１０００：１である。

幾つかの場合には、前記の少なくとも１つの合成核酸のサイズと標的核酸のサイズとの差異は、前記の少なくとも１つの合成核酸を標的核酸からサイズに基づいて分離することを可能にする。幾つかの場合には、合成核酸は、連結反応を阻害するブロッキング基、および増幅反応を阻害するヌクレオチド修飾を含む。幾つかの場合には、連結反応を阻害するブロッキング基は３’反転デオキシ−Ｔを含み、増幅反応を阻害するヌクレオチド修飾は内部脱塩基部位を含む。幾つかの場合には、ブロッキング基は更に、５’反転ジデオキシ−Ｔを含む。幾つかの場合には、該方法は更に、サンプルをエンドヌクレアーゼＶＩＩＩと共にインキュベートすることを含む。幾つかの場合には、サンプルをエンドヌクレアーゼＶＩＩＩと共に１時間以下、インキュベートする。幾つかの場合には、該方法は、サンプルから標的核酸を抽出することを含み、標的核酸を抽出することは、前記の少なくとも１つの合成核酸を含有しないサンプルから標的核酸を抽出することと比較して高い収率を示す。幾つかの場合には、該方法は、標的核酸を末端修復することを含み、標的核酸を末端修復することは、前記の少なくとも１つの合成核酸を含有しないサンプルにおける標的核酸を末端修復することと比較して高い効率を示す。幾つかの場合には、標的核酸は、天然に存在する核酸またはそのコピーを含む。幾つかの場合には、該方法は更に、コンピュータを使用して、標的核酸の少なくとも１つの配列情報を得ることを含む。

もう１つの態様においては、配列決定ライブラリーの製造方法を本明細書において開示し、該方法は、（ａ）（ｉ）標的核酸、（ｉｉ）配列決定アダプター、および（ｉｉｉ）少なくとも１つの合成核酸（ここで、前記の少なくとも１つの合成核酸はＤＮＡを含み、末端修復に抵抗する）を含むサンプルを得、ｂ）前記の少なくとも１つの合成核酸よりも標的核酸が優先的に末端修復されるように、該サンプルに関して末端修復反応を行うことを含む。

幾つかの実施形態においては、前記方法のいずれかは、該方法の結果を患者、介護者または他の者に報告することを含みうる。

もう１つの態様においては、配列決定ライブラリーを製造するためのキットを本明細書において開示し、該キットは、ａ）配列決定アダプター、およびｂ）少なくとも１つの合成核酸（ここで、前記の少なくとも１つの合成核酸はＤＮＡを含み、核酸に対する末端修復に抵抗する）を含む。幾つかの場合には、前記の少なくとも１つの合成核酸の量と配列決定アダプターの量との比は１：１以下である。

開示されている内容の新規特徴は添付の特許請求の範囲に詳細に記載されている。本開示の内容の特徴および利点のより深い理解は、開示されている内容の原理を利用する例示的な実施形態を記載する以下の詳細な説明および後記の添付図面を参照することによりもたらされる。

文献の援用
本明細書に挙げられている全ての刊行物、特許および特許出願の全体を、各個の刊行物、特許または特許出願が参照により本明細書に組み入れられると具体的かつ個別に示されている場合と同様に、参照により本明細書に組み入れることとする。

詳細な説明
概要
本開示は、次世代シーケンシングアッセイおよび他のアッセイにおける核酸の、改良された特定または定量のための複数の方法およびアプローチを提供する。一般に、本発明で提供する方法は、特定の配列、長さ、ＧＣ含量、縮重度、多様性の度合および／または既知の出発濃度のような特別な特徴を有するスパイクイン合成核酸の使用を含む。そのようなスパイクイン合成核酸の使用は、絶対的存在量の決定、相対的存在量の決定、存在量の正規化、汎用的な定量、バイアス制御、サンプルの特定（同定）、交差汚染の検出、情報伝達効率、試薬追跡、多様性減少の正規化、絶対的または相対的な損失の決定、品質管理および多数の他の用途を可能にし、改善しうる。本発明で提供するスパイクイン合成核酸は、特別に設計された担体（ｃａｒｒｉｅｒ）核酸をも含み、該担体核酸はサンプルにおける核酸の全濃度を増加させうるが、配列決定または他のアッセイによる検出を回避する能力を有する。

好ましい実施形態においては、本開示は、スパイクイン合成核酸の種のセットを提供し、ここで、それぞれの種の長さおよび／またはＧＣ含量は、分析されるべき標的核酸のセットの、予想されるまたは観察可能な長さおよび／またはＧＣ含量に合致または近似するように設計される。例えば、スパイクイン合成核酸の長さは、そのような病原体に感染しているヒト患者から得られたサンプル（例えば、血漿）における疾患特異的または病原体特異的無細胞核酸の長さに近似可能である。他の好ましい実施形態においては、本開示は、サンプル、試薬または試薬ロットをユニークに特定するための配列を含むスパイクイン合成核酸を提供する。更に他の好ましい実施形態においては、本開示は、ユニーク配列を有する多数のスパイクイン合成核酸（例えば、１０^４、１０^５、１０^６、１０^７、１０^８、１０^９または１０^１０個のユニークスパイクイン合成核酸）を含むプールを提供し、これは、ハイスループット配列決定アッセイの経過中、特にサンプル処理工程、例えば核酸抽出および／またはライブラリー製造におけるユニークスパイクイン配列の多様性の減少を介してサンプルにおける絶対的核酸減少を追跡するために使用されうる。

絶対的核酸減少を追跡しうることは初期サンプルにおける標的核酸の絶対的存在量の決定を可能にしうる。例えば、臨床サンプルにおける病原体の絶対量は、その病原体に起因する配列決定リードの数に基づいて決定されうる。抗生物質または医薬組成物での治療の前、途中および後などに経時的に採取された臨床サンプルにおける病原体の絶対的存在量を決定することにより、医学的治療がモニターまたは調節されうる。特定の病原体が存在するかどうかを決定することに加えて、感染または疾患の度合または段階も決定されうる。

該方法は、臨床サンプル、処理サンプル（例えば、抽出核酸、抽出無細胞ＤＮＡ、抽出無細胞ＲＮＡ、血漿、血清）、未処理サンプル（例えば、全血）および任意の他のタイプのサンプル、特に核酸を含むサンプル（これらに限定されるものではない）を含む多種多様なサンプルにスパイクイン合成核酸を加えることを含みうる。幾つかの場合には、該方法は、試薬、特に、配列決定（例えば、次世代シーケンシング）によるサンプルの分析の任意の段階で使用される検査用試薬（または特定の試薬ロット）に該スパイクイン合成核酸を加えることを含みうる。好ましい実施形態においては、該方法は、既知濃度の合成核酸を試薬およびサンプル内に導入することを含みうる。該方法は、臨床サンプルにおける病原体に由来する低存在量の病原体または核酸を検出、特定、モニターまたは定量するように設計されたアッセイの精度および効率を高めるのに特に有用でありうる。該方法はまた、サンプルトラッキング（サンプル追跡）のエラーで生じる、あるいはサンプル調製、核酸精製または配列決定ライブラリー製造中の核酸配列の不均一な減少から生じる、あるいは異なる標的核酸または異なるサンプルの分析を比較する際の内部正規化標準の欠如から生じる望ましくない影響を低減しうる。

図１は、特に存在量の正規化に関する本発明で提供する方法の多くの工程の一般的概要を示す。該方法は、対象１１０（例えば、ヒト患者）からサンプルを得ることを含みうる。幾つかの特定の実施形態においては、対象は感染症を有し、または病原体に感染していると疑われる。サンプルは、図示されているとおり、血液サンプル１２０または血漿サンプル１３０、あるいは任意の他のタイプの生物学的サンプル、特に、体液、組織および／または細胞を含有する生物学的サンプル、あるいは無細胞生物学的サンプルでありうる。

サンプル１４０からの核酸（例えば、無細胞核酸）を抽出し、アッセイ、例えば配列決定アッセイ（例えば、次世代シーケンシングアッセイ）において使用することが可能である。１以上のタイプの合成核酸１５０を、該方法における１以上の工程において、例えば血液サンプル１２０、血漿サンプル１３０またはサンプル核酸１４０に加える（またはスパイクイン（添加）する）。該合成核酸は、分析すべき標的核酸のセットの長さに近似するように設計された長さ、および／または分析すべき標的核酸のセットのＧＣ含量に近似するように設計されたＧＣ含量を有しうる。一般に、該合成核酸は既知の出発濃度をも有する。ついで該合成核酸を含むサンプルを配列決定アッセイ１６０、例えば次世代シーケンシングアッセイにより分析することが可能である。幾つかの場合には、配列決定アッセイにより特定された合成核酸の量を該合成核酸の既知出発濃度と比較して、リード数を既知出発濃度と相関させる。結果として、特に、検出された標的核酸の存在量を、長さおよび／またはＧＣ含量においてそのような標的核酸１７０に最も近い合成核酸の存在量と比較することにより、サンプル核酸における標的核酸を特定または定量することが可能である。そのような方法および本発明で提供する他の方法の使用により、対象の状態を、より高い精度および確実性のレベルで特定することが可能である。幾つかの特定の実施形態においては、配列決定アッセイ（例えば、次世代シーケンシングアッセイ）はヒト患者由来の無細胞核酸（例えば、ＤＮＡ）のサンプルにおける病原体核酸を検出する。

それらの工程は任意の順序および任意の組合せで行われうる。幾つかの場合には、ある工程は行われない。幾つかの場合には、図示されている工程に新たな工程を加え、または図示されている工程の間に介在させる。

図２は典型的な感染の概要図を示す。病原体感染源は、例えば肺におけるものでありうる。病原体に由来する無細胞核酸、例えば無細胞ＤＮＡなどの無細胞核酸は血流を通って移動し、分析のために血漿サンプル中に収集されうる。ついでサンプルにおける核酸を、図１に示されているとおりに配列決定アッセイにより分析することが可能である。

図３は、本発明で提供する方法の幾つかの一般的スキームを示す。該方法は、宿主（例えば、ヒト）核酸および非宿主（例えば、病原体）核酸を含有するサンプルを得ることを含みうる。サンプルは対象、例えば患者から得られうる。幾つかの特定の実施形態においては、対象は感染症を有し、または病原体に感染していると疑われる。サンプルは血液サンプルまたは血漿サンプル、または任意の他のタイプの生物学的サンプル、特に、体液、組織および／または細胞を含有する生物学的サンプルでありうる。サンプルからの核酸（例えば、無細胞核酸）を既知量の合成核酸と一緒にすることが可能である。ついで、合成核酸を含有するサンプルを、配列決定アッセイ、例えば次世代シーケンシングアッセイにより分析することが可能である。配列決定結果を既知の宿主および非宿主参照配列に対してマッピングすることが可能である。幾つかの場合には、配列決定アッセイにより特定された合成核酸の量を該合成核酸の既知出発濃度と比較して、リード数を該既知出発濃度と相関させる。結果として、非宿主配列の相対的存在量が決定されうる。それらの工程は任意の順序および任意の組合せで行われうる。幾つかの場合には、ある工程は数回反復されうる。幾つかの場合には、ある工程は行われない。幾つかの場合には、図示されている工程に新たな工程を加え、または図示されている工程の間に介在させる。

本発明で提供する方法は、標的核酸がサンプル中に低存在量で存在する場合または複数のサンプルもしくは複数の標的核酸を比較もしくは追跡する場合には特に、次世代シーケンシングによる標的核酸の改良された特定または定量を可能にしうる。例えば、次世代シーケンシングによる臨床サンプルにおける標的病原体、腫瘍細胞または腫瘍原性マーカーの正確な検出および定量は、該サンプルが不適切に追跡される場合または標的核酸が不正確に正規化もしくは定量される場合には、損なわれ、または負の影響を受けうる。したがって、本発明で提供する方法は、サンプルトラッキングもしくは特定における又は核酸の定量もしくは配列決定データのクラウド分析におけるエラーから生じる陥穽を回避することを助けうる。

本発明で提供する方法および組成物は、出発サンプルが比較的少量の核酸を含有する場合には特に、配列決定ライブラリーの収率、品質または効率を向上させるために配列決定ライブラリーの製造中に合成核酸を加えるおよび／または除去するために使用されうる。一般に、幾つかの場合には、該合成核酸はこれらの用途において担体核酸として作用して、サンプル調製プロセス中に全核酸の濃度を上昇させうる。サンプルへの該合成核酸の添加は配列決定ライブラリーの製造（作製）の１以上の工程の収率および／または効率を増加させうる。前記の１以上の工程は核酸濃度に感受性でありうる。例えば、該工程の収率および／または効率はサンプルにおける核酸濃度に左右されうる。そのような工程は核酸抽出、精製、連結および末端修復を含みうる。幾つかの場合には、該合成核酸は該配列決定ライブラリーから除去されうる。該合成核酸は、該配列決定ライブラリーの製造における１以上の工程にそれらが関与することを妨げる或る特徴を含みうる。したがって、該合成核酸は配列決定工程において配列決定されない可能性がある。

該方法および組成物は、複数の対象からのサンプルを分析するために（例えば、サンプルにおける標的核酸から配列決定ライブラリーを製造するために）使用されうる。これらのサンプルにおける標的核酸の濃度は対象によって異なりうる。この場合のこれらのサンプルへの該合成核酸の添加はサンプル間の濃度変動を低減して、分析の精度を改善しうる。

該方法および組成物は、少なくとも１つの合成核酸を加えることにより、サンプルから配列決定ライブラリーを製造するために使用されうる。該合成核酸は、配列決定反応においてそれらが配列決定されないようにする１以上の特徴を有しうる。幾つかの場合には、該合成核酸は、配列決定ライブラリーの製造における１以上の反応、例えばアダプター連結および核酸増幅を抑制する修飾を含む。例えば、該核酸は一方または両方の末端に反転糖および／または１以上の脱塩基部位を含みうる。

幾つかの場合には、該合成核酸は配列決定前に配列決定ライブラリーから除去されうる。幾つかの場合には、該合成核酸は酵素消化により除去されうる。例えば、該合成核酸は制限酵素認識部位を含むことが可能であり、制限酵素により分解されうる。幾つかの場合には、該合成核酸は、アフィニティに基づく枯渇により除去されうる。例えば、該合成核酸は１以上の固定化タグを含むことが可能であり、アフィニティに基づく枯渇により除去されうる。ある場合においては、該合成核酸は、サイズに基づく除去により除去されうる。該合成核酸は配列決定ライブラリーにおける他の分子とは異なるサイズを有することも可能であり、その結果、該合成核酸は、サイズに基づく除去により除去されうる。幾つかの場合には、該合成核酸は本明細書における特徴および／または修飾の組合せを含むことが可能であり、その結果、それらは配列ライブラリーの製造の１以上の工程に関与せず、配列決定前に除去されうる。

サンプル
本発明で提供する方法は多種多様なサンプルの改良された分析を可能にしうる。本発明で提供する合成核酸は、そのようなサンプルを分析するために使用可能であり、それは、サンプルに、またはサンプルの加工形態、例えば臨床血漿サンプルからの抽出無細胞核酸に該合成核酸を直接加えることを含みうる。

本発明で提供する方法において分析されるサンプルは、好ましくは、任意のタイプの臨床サンプルである。幾つかの場合には、サンプルは細胞、組織または体液を含有する。好ましい実施形態においては、サンプルは液体または流体サンプルである。幾つかの場合には、サンプルは体液、例えば全血、血漿、血清、尿、便、唾液、リンパ液、髄液、滑液、気管支肺胞洗浄液、鼻腔スワブ、呼吸器分泌物、膣液、羊水、精液または月経物を含有する。幾つかの場合には、サンプルは、全体的または部分的に、細胞または組織から構成される。幾つかの場合には、細胞、細胞断片またはエキソソームは、例えば遠心分離または濾過によりサンプルから取り出される。本明細書におけるサンプルは生物学的サンプルでありうる。

サンプルは任意の濃度の核酸を含みうる。本明細書における組成物および方法は、低濃度の全核酸を含有するサンプルに有用でありうる。幾つかの場合には、サンプルは、多くとも１００ｎｇ／μＬ、５０ｎｇ／μＬ、１０ｎｇ／μＬ、５ｎｇ／μＬ、２ｎｇ／μＬ、１．５ｎｇ／μＬ、１．２ｎｇ／μＬ、１ｎｇ／μＬ、０．８ｎｇ／μＬ、０．４ｎｇ／μＬ、０．２ｎｇ／μＬ、０．１ｎｇ／μＬ、０．０５ｎｇ／μＬ、０．０１ｎｇ／μＬ、１０ｎｇ／ｍＬ、５ｎｇ／ｍＬ、２ｎｇ／ｍＬ、１ｎｇ／ｍＬ、０．８ｎｇ／ｍＬ、０．６ｎｇ／ｍＬ、０．５ｎｇ／ｍＬまたは０．１ｎｇ／ｍＬの核酸の全濃度を有する。幾つかの場合には、サンプルは、少なくとも０．１ｎｇ／ｍＬ、０．５ｎｇ／ｍＬ、０．６ｎｇ／ｍＬ、０．８ｎｇ／ｍＬ、１ｎｇ／ｍＬ、２ｎｇ／ｍＬ、５ｎｇ／ｍＬ、１０ｎｇ／ｍＬ、０．０１ｎｇ／μＬ、０．０５ｎｇ／μＬ、０．１ｎｇ／μＬ、０．２ｎｇ／μＬ、０．４ｎｇ／μＬ、０．８ｎｇ／μＬ、１ｎｇ／μＬ、１．２ｎｇ／μＬ、１．５ｎｇ／μＬ、２ｎｇ／μＬ、５ｎｇ／μＬ、１０ｎｇ／μＬ、５０ｎｇ／μＬまたは１００ｎｇ／μＬの核酸の全濃度を含む。幾つかの場合には、サンプルは約０．１ｎｇ／ｍＬ〜約１０，０００ｎｇ／ｍＬ（すなわち、約０．１ｎｇ／ｍＬ〜約１０ｎｇ／μＬ）の範囲内の核酸の全濃度を有する。

サンプルは１以上の対照を含みうる。幾つかの場合には、サンプルは１以上の陰性対照を含む。典型的な陰性対照は、汚染物質を特定するために調製されたサンプル（例えば、血漿マイナスサンプル）、健康な対象からの血漿、および低多様性サンプル（例えば、見かけ上健康な対象から採取されたサンプル）を含む。幾つかの場合には、サンプルは１以上の陽性対照を含む。典型的な陽性対照は、既知病原体からのゲノムＤＮＡを有する健常対象からのサンプル（例えば、血漿サンプル）を含む。既知病原体からのゲノムＤＮＡは完全なゲノムＤＮＡでありうる。幾つかの場合には、既知病原体からのゲノムＤＮＡは、例えば種々の平均長までせん断されうる。せん断は機械的せん断（例えば、超音波、流体力学的せん断力）、酵素的せん断（例えば、エンドヌクレアーゼ）、熱分解（例えば、高温でのインキュベーション）、化学的断片化（例えば、アルカリ溶液、二価イオン）により行われうる。

サンプルは標的核酸を含みうる。標的核酸は、サンプルにおいて分析される核酸を意味しうる。例えば、標的核酸はサンプル中に元々存在することが可能であり、例えば、天然核酸でありうる。サンプルは更に、本明細書に開示されている１以上の合成核酸を含みうる。幾つかの場合には、標的核酸は、本明細書に記載されている無細胞核酸である。例えば、標的核酸は無細胞ＤＮＡ、無細胞ＲＮＡ（例えば、無細胞ｍＲＮＡ、無細胞ｍｉＲＮＡ、無細胞ｓｉＲＮＡ）、またはそれらの任意の組合せでありうる。ある場合においては、無細胞核酸は病原体核酸、例えば、病原体からの核酸である。無細胞核酸は循環核酸、例えば、循環腫瘍ＤＮＡまたは循環胎児ＤＮＡでありうる。サンプルは、病原体、例えばウイルス、細菌、真菌および／または真核寄生生物からの核酸を含みうる。

ある場合においては、サンプルはアダプターをも含む。アダプターは、既知または未知配列を有する核酸でありうる。アダプターは核酸の３’末端、５’末端または両方の末端に結合されうる。アダプターは既知配列および／または未知配列を含みうる。アダプターは二本鎖または一本鎖でありうる。幾つかの場合には、アダプターは配列決定アダプターである。配列決定アダプターは標的核酸に結合し、標的核酸の配列決定を助けうる。例えば、配列決定アダプターは、配列決定用プライマー結合部位、ユニーク識別子配列、非ユニーク識別子配列、および固体支持体上に標的核酸を固定化するための配列の１以上を含みうる。配列決定アダプターに結合される標的核酸はシーケンサー上の固体支持体上に固定化されうる。配列決定用プライマーはアダプターにハイブリダイズし、配列決定反応において標的核酸を鋳型として使用して伸長されうる。幾つかの場合には、アダプターにおける識別子を使用して、異なる標的配列の配列リードを標識し、それにより、複数の標的核酸のハイスループット配列決定が可能となる。

「結合」なる語およびその文法的等価体は、任意の結合形態を用いて２つの分子を連結することを意味しうる。例えば、結合は、２つの分子を化学結合または他の方法により連結して新しい分子を生成させることを意味しうる。核酸にアダプターを結合させることは、アダプターと核酸との間に化学結合を形成させることを意味しうる。幾つかの場合には、結合は、例えばリガーゼを使用する連結により行われる。例えば、核酸アダプターは、リガーゼによって触媒されるホスホジエステル結合を形成させることにより、連結により標的核酸に結合されうる。

配列決定ライブラリーは、本発明で提供する方法および組成物を使用して、サンプルから製造されうる。配列決定ライブラリーは、使用される配列決定システムに適合した複数の核酸を含みうる。例えば、配列決定ライブラリーにおける核酸は、１以上のアダプターに結合した標的核酸を含みうる。配列決定ライブラリーを製造するための工程は、サンプルから標的核酸を抽出すること、標的核酸を断片化すること、標的核酸にアダプターを結合させること、標的核酸−アダプター複合体を増幅すること、および増幅された標的核酸−アダプター複合体を配列決定することの１以上を含みうる。

サンプル（特に、細胞サンプルまたは組織生検）は身体の任意の部分または領域からのものでありうる。典型的なサンプルは、例えば血液、中枢神経系、脳、脊髄、骨髄、膵臓、甲状腺、胆嚢、肝臓、心臓、脾臓、結腸、直腸、肺、呼吸器系、咽喉、鼻腔、胃、食道、耳、眼、皮膚、四肢、子宮、前立腺、生殖器または身体の任意の他の器官または領域から得られうる。

一般に、サンプルはヒト対象、特にヒト患者からのものである。しかし、サンプルはまた、任意の他のタイプの対象、例えば任意の哺乳動物、非ヒト哺乳動物、非ヒト霊長類、飼育動物（例えば、実験動物、家庭用ペットまたは家畜）または非飼育動物（例えば、野生動物）からのものでありうる。幾つかの特定の実施形態においては、対象はイヌ、ネコ、げっ歯類、マウス、ハムスター、ウシ、トリ、ニワトリ、ブタ、ウマ、ヤギ、ヒツジ、ウサギ、類人猿、サルまたはチンパンジーである。

好ましい実施形態においては、対象は、病原体に感染している、または病原体による感染のリスクを有する、または病原体感染を有すると疑われる宿主生物（例えば、ヒト）である。幾つかの場合には、対象は、特定の感染を有することが疑われ、例えば、結核を有することが疑われる。他の場合においては、対象は未知起源の感染を有することが疑われる。幾つかの場合には、宿主または対象は（例えば、１以上の微生物、病原体、細菌、ウイルス、真菌または寄生生物に）感染している。幾つかの場合には、宿主または対象は、１以上の型の癌を有すると診断されており、または１以上の型の癌を発生するリスクを有する。幾つかの場合には、宿主または対象は（例えば、１以上の微生物、病原体、細菌、ウイルス、真菌または寄生生物に）感染していない。幾つかの場合には、宿主または対象は健康である。幾つかの場合には、宿主または対象は感染に感受性である、または感染のリスクを有する。

幾つかの場合には、対象は抗微生物剤、抗細菌剤、抗ウイルス剤または抗寄生生物剤で治療されていてもよく、または治療されうる。対象は（例えば、１以上の微生物、病原体、細菌、ウイルス、真菌または寄生生物による）実際の感染を有しうる。幾つかの場合には、対象は（例えば、１以上の微生物、病原体、細菌、ウイルス、真菌または寄生生物に）感染していない。幾つかの場合には、対象は健康である。幾つかの場合には、対象は感染に感受性であり、または感染のリスクを有する（例えば、患者は免疫無防備状態である）。対象は、別の疾患または障害を有する、またはそのリスクを有しうる。例えば、対象は、疾患、例えば癌（例えば、乳癌、肺癌、膵臓癌、血液癌など）を有しうる、またはそのリスクを有しうる、またはそのような疾患を有すると疑われうる。

サンプルは核酸サンプルでありうる。幾つかの場合には、サンプルは或る量の核酸を含有する。サンプル中の核酸は二本鎖（ｄｓ）核酸、一本鎖（ｓｓ）核酸、ＤＮＡ、ＲＮＡ、ｃＤＮＡ、ｍＲＮＡ、ｃＲＮＡ、ｔＲＮＡ、リボソームＲＮＡ、ｄｓＤＮＡ、ｓｓＤＮＡ、ｍｉＲＮＡ、ｓｉＲＮＡ、循環核酸、循環無細胞核酸、循環ＤＮＡ、循環ＲＮＡ、無細胞核酸、無細胞ＤＮＡ、無細胞ＲＮＡ、循環無細胞ＤＮＡ、無細胞ｄｓＤＮＡ、無細胞ｓｓＤＮＡ、循環無細胞ＲＮＡ、ゲノムＤＮＡ、エキソソーム、無細胞病原体核酸、循環病原体核酸、ミトコンドリア核酸、非ミトコンドリア核酸、核ＤＮＡ、核ＲＮＡ、染色体ＤＮＡ、循環腫瘍ＤＮＡ、循環腫瘍ＲＮＡ、環状核酸、環状ＤＮＡ、環状ＲＮＡ、環状一本鎖ＤＮＡ、環状二本鎖ＤＮＡ、プラスミドまたはそれらの任意の組合せを含みうる。幾つかの場合には、サンプル核酸は合成核酸を含みうる。ある場合においては、合成核酸は、本明細書に開示されている任意のタイプの核酸、例えばＤＮＡ、ＲＮＡ、ＤＮＡ−ＲＮＡハイブリッドを含む。例えば、合成核酸はＤＮＡでありうる。

幾つかの場合には、サンプル中には種々のタイプの核酸が存在しうる。例えば、サンプルは無細胞ＲＮＡおよび無細胞ＤＮＡを含みうる。同様に、本発明で提供する方法は、サンプル中に存在するＲＮＡおよびＤＮＡの両方を単独でまたは組合せて分析する方法を含みうる。

本明細書中で用いる「無細胞」なる語は、体からサンプルが得られる前に体内に出現した核酸の状態を意味する。例えば、サンプルにおける循環無細胞核酸は、人体の血流中を循環する無細胞核酸に起源を有しうる。これとは対照的に、生検のような固体組織から抽出された核酸は一般に「無細胞」であるとはみなされない。

幾つかの場合には、サンプルは、無細胞核酸または細胞結合核酸を含有する処理サンプル（例えば、血清、血漿）または未処理サンプル（例えば、全血）でありうる。幾つかの場合には、サンプルは、あるタイプの核酸、例えばＤＮＡ、ＲＮＡ、無細胞ＤＮＡ、無細胞ＲＮＡ、無細胞循環ＤＮＡ、無細胞循環ＲＮＡなどに関して富化されている。幾つかの場合には、サンプルは、核酸を単離するために、またはサンプルにおける他の成分から核酸を分離するために、何らかの方法で処理されている。幾つかの場合には、サンプルは病原体特異的核酸に関して富化されている。

しばしば、サンプルは新鮮なサンプルである。幾つかの場合には、サンプルは凍結サンプルである。幾つかの場合には、サンプルは、例えばホルマリン固定パラフィン包埋組織のように、例えば化学的固定剤で固定される。

標的核酸
本発明で提供する方法は、多数の標的核酸を検出するために使用されうる。標的核酸には、全ゲノムまたは部分ゲノム、エクソーム、遺伝子座、遺伝子、エキソン、イントロン、修飾核酸（例えば、メチル化核酸）、および／またはミトコンドリア核酸が含まれるが、これらに限定されるものではない。しばしば、本発明で提供する方法は、病原体標的核酸を検出するために使用されうる。幾つかの場合には、病原体標的核酸は、対象からの核酸を含有する複雑な臨床サンプル中に存在する。病原体標的核酸は、感染症、例えばインフルエンザ、結核または任意の他の公知の感染性の疾患または障害（本明細書に更に詳細に記載されているものを含む）に関連していることが可能である。幾つかの場合には、本明細書に記載されている標的核酸は標的核酸でありうる。

幾つかの場合には、病原体標的核酸は、組織サンプル、例えば、感染部位からの組織サンプル中に存在する。他の場合においては、病原体標的核酸は感染部位から移動しており、例えば、それは、循環無細胞核酸（例えば、ＤＮＡ）を含有するサンプルから得られうる。

幾つかの場合には、標的核酸は癌組織に由来する。標的核酸は組織または腫瘍から直接得られうる。幾つかの場合には、標的癌核酸は循環無細胞核酸または循環腫瘍細胞（ＣＴＣ）から得られる。

幾つかの場合には、標的核酸は、サンプル全体の非常に小さな部分のみ、例えば、サンプルにおける全核酸の１％未満、０．５％未満、０．１％未満、０．０１％未満、０．００１％未満、０．０００１％未満、０．００００１％未満または０．００００００１％未満を構成しうる。幾つかの場合には、標的核酸はサンプルにおける全核酸の約０．００００１％〜約０．５％を構成しうる。しばしば、元のサンプルにおける全核酸は変動しうる。例えば、全無細胞核酸（例えば、ＤＮＡ、ｍＲＮＡ、ＲＮＡ）は１〜１００ｎｇ／ｍｌ（例えば、約１、５、１０、２０、３０、４０、５０、８０、１００ｎｇ／ｍｌ）の範囲でありうる。幾つかの場合には、サンプルにおける無細胞核酸の全濃度はこの範囲外である（例えば、１ｎｇ／ｍｌ未満；他の場合においては、全濃度は１００ｎｇ／ｍｌを超える）。これは、ヒトＤＮＡおよび／またはＲＮＡから主に構成される無細胞核酸（例えば、ＤＮＡ）サンプルの場合に当てはまりうる。そのようなサンプルにおいては、病原体標的核酸または癌標的核酸は、例えば化学療法を受けている対象からのサンプルに関しては、ヒト核酸または健常核酸と比較して十分には存在しないかもしれない。例えば、病原体標的核酸はサンプルにおける全核酸の０．００１％未満を構成することが可能であり、癌標的核酸はサンプルにおける全核酸の１％未満を構成することが可能である。

標的核酸の長さは様々でありうる。幾つかの場合には、標的核酸は少なくとも約２０、３０、４０、５０、６０、７０、８０、９０、１００、１１０、１２０、１３０、１４０、１５０、１６０、１７０、１８０、１９０、２００、２５０、３００、３５０、４００、４５０、５００、７５０、１０００、１５００、２０００、３０００、４０００、５０００、１００００、１５０００、２００００、２５０００または５００００ヌクレオチド（または塩基対）長でありうる。幾つかの場合には、標的核酸は多くとも約２０、３０、４０、５０、６０、７０、８０、９０、１００、１１０、１２０、１３０、１４０、１５０、１６０、１７０、１８０、１９０、２００、２５０、３００、３５０、４００、４５０、５００、７５０、１０００、１５００、２０００、３０００、４０００、５０００、１００００、１５０００、２００００、２５０００または５００００ヌクレオチド（または塩基対）長でありうる。幾つかの特定の実施形態においては、標的核酸は比較的短く、例えば、５００塩基対（またはヌクレオチド）長未満または１０００塩基対（またはヌクレオチド）長未満である。幾つかの場合には、標的核酸は比較的長く、例えば、１０００塩基対（またはヌクレオチド）長を超える、１５００塩基対（またはヌクレオチド）長を超える、２０００塩基対（またはヌクレオチド）長を超える、２５００塩基対（またはヌクレオチド）長を超える、３０００塩基対（またはヌクレオチド）長を超える、または５０００塩基対（またはヌクレオチド）長を超える。幾つかの場合には、標的核酸は約２０〜約１２０塩基対の範囲でありうる。幾つかの場合には、標的核酸は約４０〜約１００塩基対の範囲でありうる。

サンプル核酸の場合と同様に、標的核酸は、二本鎖（ｄｓ）核酸、一本鎖（ｓｓ）核酸、ＤＮＡ、ＲＮＡ、ｃＤＮＡ、ｍＲＮＡ、ｃＲＮＡ、ｔＲＮＡ、リボソームＲＮＡ、ｄｓＤＮＡ、ｓｓＤＮＡ、ｍｉＲＮＡ、ｓｉＲＮＡ、循環核酸、循環無細胞核酸、循環ＤＮＡ、循環ＲＮＡ、無細胞核酸、無細胞ＤＮＡ、無細胞ＲＮＡ、循環無細胞ＤＮＡ、無細胞ｄｓＤＮＡ、無細胞ｓｓＤＮＡ、循環無細胞ＲＮＡ、ゲノムＤＮＡ、エキソソーム、無細胞病原体核酸、循環病原体核酸、ミトコンドリア核酸、非ミトコンドリア核酸、核ＤＮＡ、核ＲＮＡ、染色体ＤＮＡ、循環腫瘍ＤＮＡ、循環腫瘍ＲＮＡ、環状核酸、環状ＤＮＡ、環状ＲＮＡ、環状一本鎖ＤＮＡ、環状二本鎖ＤＮＡ、プラスミドまたはそれらの任意の組合せを含む任意のタイプの核酸でありうる。標的核酸は、好ましくは、ウイルス、細菌、真菌、寄生生物および任意の他の微生物、特に感染性微生物（これらに限定されるものではない）を含む病原体に由来する核酸である。標的核酸は、特定の器官または組織に由来する核酸でありうる。幾つかの場合には、標的核酸は、病原体ではなく対象から直接的に誘導される。

スパイクイン（ｓｐｉｋｅ−ｉｎ）合成核酸
本開示は、特にハイスループットまたは次世代シーケンシングアッセイに関連した種々の用途で使用される単一合成核酸および合成核酸のセットを記載する。幾つかの場合には、スパイクイン合成核酸は、記載されている方法で使用される場合、例えば、それが由来する個体、分析前サンプル処理条件、核酸抽出の方法、分子生物学的手段および方法による核酸操作、核酸精製の方法、測定自体の実施、保存条件および時間経過には無関係に、サンプルにわたる核酸（例えば、疾患特異的核酸、病原体核酸）の効率的な正規化を可能にしうる。幾つかの場合には、本開示は、例えば多数のユニーク配列のような特定の特徴を有する合成核酸のプールまたはセットを提供する。合成核酸のセットは、サンプル分析の経過中に多様性減少をモニターするために使用可能であり、そして該多様性減少は、出発核酸の存在量を決定するために使用されうる。本発明で提供する合成核酸はまた、サンプルを追跡するため、サンプル間の交差汚染をモニターするため、試薬を追跡するため、試薬ロットを追跡するため、および多数の他の用途に使用されうる。しばしば、合成核酸の設計、長さ、品質、濃度、多様性レベルおよび配列は個々の用途に適合化されうる。幾つかの場合には、スパイクイン合成核酸には、本明細書に記載されている担体合成核酸（例えば、担体合成核酸）が含まれる。

本発明で提供する合成核酸の集合体（コレクション）（またはセット）は幾つかの種の合成核酸を含みうる。幾つかの場合には、該種の長さ、濃度および／または配列は同じである、または類似していることが可能である。幾つかの場合には、該種の長さ、濃度および／または配列は異なっていてもよい。

好ましい実施形態においては、合成核酸の種は長さにおいて様々である。例えば、合成核酸種の集合体は全体として、サンプルにおける或る標的核酸の長さの観察可能な範囲、またはそのような観察可能な範囲の少なくとも一部にわたりうる。例えば、該種は全体として、サンプル（特に、病原体に感染している又は感染していると疑われる対象から得られたサンプル）における疾患特異的または病原体特異的核酸の長さにわたりうる。幾つかの場合には、サンプルにおける疾患特異的または病原体特異的核酸の長さは約４０〜約１００塩基対の範囲でありうる。幾つかの場合には、該種は全体として、サンプルにおける多種多様な疾患特異的または病原体特異的核酸の長さにわたりうる。幾つかの場合には、該種は全体として、特定の病原体特異的核酸、例えば、特定の病原体ゲノム内の核酸の長さにわたりうる。幾つかの場合には、該核酸は、病原体ゲノム内の特異的核酸、例えば、病原体のビルレンス領域内の核酸、病原体の抗生物質耐性領域、あるいは他の領域または特定の核酸もしくは遺伝子でありうる。幾つかの場合には、長さまたは核酸は感染の個々のタイプ（例えば、急性、慢性、活動性または潜伏性）に特異的でありうる。他の例においては、該種は全体として、サンプル（例えば、感染対象由来のもの）における或る対象核酸および／または病原体核酸の長さにわたりうる。

集合体内の合成核酸の種の長さは特定の標的核酸の長さ（例えば、サンプルにおける病原体特異的または疾患特異的核酸の観察可能な範囲）と厳密に一致しうる。他の場合においては、合成核酸の集合体内の合成核酸の種の長さは標的核酸の長さと厳密に一致し、またはそのような長さに実質的に一致しうる。例えば、合成核酸の種の長さは標的核酸の長さの５０％〜１５０％、標的核酸の長さの５５％〜１４５％、標的核酸の長さの６０％〜１４０％、標的核酸の長さの６５％〜１３５％、標的核酸の長さの７０％〜１３０％、標的核酸の長さの７５％〜１２５％、標的核酸の長さの８０％〜１２０％、標的核酸の長さの８５％〜１１５％、標的核酸の長さの９０％〜１１０％、標的核酸の長さの９５％〜１０５％、標的核酸の長さの９６％〜１０４％、標的核酸の長さの９９％〜１０１％、または標的核酸の長さの９９．５％〜１００．５％の範囲内である。幾つかの場合には、合成核酸の種の長さは標的核酸の長さの５０％〜１５０％の範囲内でありうる。幾つかの場合には、合成核酸の種の長さは標的核酸の長さの２倍、３倍、４倍または５倍まででありうる。幾つかの場合には、合成核酸の種の長さは標的核酸の長さの１、２、３、４、５、１０、２０、３０、４０、５０、６０、７０、８０、９０、１００、１２５、１５０または２００ヌクレオチド以内でありうる。幾つかの場合には、集合体内の合成核酸の種は、最も厳密に一致した標的核酸の長さの６５％、７５％、８０％、８５％、９０％、９２％、９５％、９７％または９９％より大きい。

本明細書に開示されている合成核酸の集合体（またはプール）内のそれぞれ又はほとんどの核酸「種」は、関心のある１以上のドメインまたは領域を含みうる。幾つかの場合には、関心のあるドメインまたは領域は長さ識別子配列である。長さ識別子配列は、特定の長さを示す又は表すと予め定められたコードを含有しうる。しばしば、そのような長さ識別子は短い配列であることが可能であり、例えば、１０塩基対（ｂｐ）、９ｂｐ、８ｂｐ、７ｂｐ、６ｂｐ、５ｂｐ、４ｂｐまたは３ｂｐ；９ｂｐ未満、８ｂｐ未満、７ｂｐ未満または６ｂｐ未満；あるいは６〜１５ｂｐ、５〜１０ｂｐ、４〜８ｂｐ、または６〜９ｂｐでありうる。該種は１個、２個またはそれ以上の長さ識別子配列を含有しうる。幾つかの場合には、長さ識別子はフォワードおよび／またはリバース配列として存在する。

幾つかの場合には、合成核酸の集合体内の核酸種におけるドメインは、存在する場合の該合成核酸における長さ識別配列によりコードされる長さに一般に対応する特定の長さのロード（ｌｏａｄ）配列でありうる。スパイクイン核酸またはロードの長さは様々でありうる。幾つかの場合には、スパイクイン核酸全体は少なくとも約２０、３０、４０、５０、６０、７０、８０、９０、１００、１１０、１２０、１３０、１４０、１５０、１６０、１７０、１８０、１９０、２００、２５０、３００、３５０、４００、４５０または５００ヌクレオチド長でありうる。幾つかの場合には、スパイクイン核酸は多くとも約２０、３０、４０、５０、６０、７０、８０、９０、１００、１１０、１２０、１３０、１４０、１５０、１６０、１７０、１８０、１９０、２００、２５０、３００、３５０、４００、４５０または５００ヌクレオチド長でありうる。幾つかの場合には、スパイクイン核酸は約２０〜約２００塩基対、例えば約２０〜約１２０塩基対の範囲でありうる。幾つかの場合には、スパイクイン核酸内のロード配列ドメインの長さは少なくとも約２０、３０、４０、５０、６０、７０、８０、９０、１００、１１０、１２０、１３０、１４０、１５０、１６０、１７０、１８０、１９０、２００、２５０、３００、３５０、４００、４５０または５００ヌクレオチド長でありうる。幾つかの場合には、スパイクイン核酸内のロード配列ドメインの長さは多くとも約２０、３０、４０、５０、６０、７０、８０、９０、１００、１１０、１２０、１３０、１４０、１５０、１６０、１７０、１８０、１９０、２００、２５０、３００、３５０、４００、４５０または５００ヌクレオチド長でありうる。幾つかの場合には、スパイクイン核酸内のロード配列ドメインの長さは０〜約２００ｂｐの範囲内でありうる。

合成核酸の集合体内の核酸種におけるドメインは、該核酸が元のサンプルの一部ではなくスパイクインであることを示すユニークコードを含む合成核酸識別配列［例えば、スパーク（Ｓｐａｒｋ）識別配列、スパンク（Ｓｐａｎｋ）識別配列］でありうる。一般に、該ユニークコードは、元のサンプルに又は標的核酸のプールに存在しないコードである。該合成核酸識別配列は特定の数のｂｐ、例えば２５ｂｐ、２０ｂｐ、１９ｂｐ、１８ｂｐ、１６ｂｐ、１５ｂｐ、１２ｂｐ、１０ｂｐまたは他の長さを含みうる。該種は１個、２個またはそれ以上の合成核酸識別配列またはドメインを含有しうる。幾つかの場合には、該合成核酸識別配列はフォワードおよび／またはリバース配列として存在する。

幾つかの場合には、合成核酸の集合体内の核酸種におけるドメインは、合成核酸の全体的なプールまたは集合体に関連する「多様性コード」でありうる。多様性コードドメインは、合成核酸のプール内の多様性の量を示すユニークコードでありうる。そのような場合、該多様性プール内の各合成核酸は、該プールの多様性の度合（例えば、１０^８個のユニーク配列）を示す配列でコードされうる。幾つかの場合、例えば、２以上の多様性プールが同一サンプルに関して使用される場合には、該多様性コードは、それらの２以上のプールにおける多様性減少を特定するために使用されうる。

幾つかの場合には、合成核酸の集合体内の核酸種におけるドメインは、用途に応じて、サンプルまたは試薬の特徴の１以上に関連する特徴ドメインでありうる。例えば、該特徴ドメインは、特定の試薬、特定の試薬ロットまたは特定のサンプル（例えば、サンプル番号、患者番号、患者名、患者の年齢、患者の性別、患者の人種、サンプルが患者から得られた場所）を示すようにコードされた配列を含みうる。

関心のあるドメインまたは領域は任意の組合せおよび数で存在しうる。例えば、合成核酸は、１以上の長さ識別子配列、１以上のロード配列、１以上の合成核酸識別配列、１以上の多様性コードおよび／または１以上の特徴ドメインを任意の組合せまたは比で含みうる。例えば、幾つかの場合には、合成核酸は長さ識別子配列およびロード配列を含有する。幾つかの場合には、合成核酸は合成核酸識別子配列および特徴ドメイン配列を含む。幾つかの場合には、合成核酸は合成核酸識別子配列を含み、他の場合においては、それはそのような配列を含有しない。

幾つかの場合には、合成核酸は、重複する目的を有するドメインを含有しうる。例えば、幾つかの場合には、合成核酸は、ロード配列としても機能する１以上の長さ識別子配列を含有する。幾つかの場合には、長さ識別子配列および／またはロード配列は合成核酸識別子配列としても機能する。

合成またはスパイクイン核酸は、核酸ライブラリーに適合するように選択または設計されうる。幾つかの場合には、合成核酸またはスパイクインは、アダプター、共通配列、ランダム配列、ポリ（Ａ）尾部、平滑末端もしくは不整（ｒａｇｇｅｄ）末端またはそれらの任意の組合せを含有しうる。幾つかの場合には、合成核酸またはスパイクインは、これらの又は他の特性の１以上において、サンプルにおける核酸を模倣するように設計される。

本発明で提供する合成核酸（例えば、スパイクイン合成核酸）は任意のタイプの核酸、または核酸タイプの組合せを含有しうる。好ましい実施形態においては、合成またはスパイクイン核酸はＤＮＡである。幾つかの場合には、合成またはスパイクイン核酸は一本鎖ＤＮＡである。幾つかの場合には、合成またはスパイクイン核酸は二本鎖ＤＮＡである。幾つかの場合には、合成またはスパイクイン核酸はＲＮＡである。幾つかの場合には、合成またはスパイクイン核酸は修飾塩基または人工塩基を含有しうる。二本鎖合成またはスパイクイン核酸は平滑末端または陥凹末端を有しうる。合成またはスパイクイン核酸はリン酸化または脱リン酸化末端を有しうる。幾つかの場合には、合成核酸は二本鎖（ｄｓ）核酸、一本鎖（ｓｓ）核酸、ＤＮＡ、ＲＮＡ、ｃＤＮＡ、ｍＲＮＡ、ｃＲＮＡ、ｔＲＮＡ、リボソームＲＮＡ、ｄｓＤＮＡ、ｓｓＤＮＡ、ｓｎＲＮＡ、ゲノムＤＮＡ、オリゴヌクレオチド、二本鎖オリゴヌクレオチド、より長い合体（ａｓｓｅｍｂｌｅｄ）二本鎖ＤＮＡ（例えば、ＩｎｔｅｇｒａｔｅｄＤＮＡＴｅｃｈｎｏｌｏｇｉｅｓのｇＢｌｏｃｋｓ）、プラスミド、ＰＣＲ産物、インビトロ合成転写産物、ウイルス粒子、断片化または非断片化ゲノムＤＮＡ、環状核酸、環状ＤＮＡ、環状ＲＮＡ、環状一本鎖ＤＮＡ、環状二本鎖ＤＮＡ、プラスミドまたはそれらの任意の組合せを含有しうる。合成核酸は、しばしば、核酸塩基、例えばアデニン（Ａ）、シトシン（Ｃ）、グアニン（Ｇ）、チミン（Ｔ）および／またはウラシル（Ｕ）を含みうる。

合成核酸は任意の合成核酸または核酸類似体であることが可能であり、あるいは任意の合成核酸または核酸類似体を含みうる。合成核酸は、修飾または改変リン酸骨格、修飾ペントース糖（例えば、修飾リボースまたはデオキシリボース）、あるいは修飾または改変核酸塩基（例えば、修飾アデニン（Ａ）、シトシン（Ｃ）、グアニン（Ｇ）、チミン（Ｔ）、ウラシル（Ｕ））を含みうる。幾つかの場合には、合成核酸は１以上の修飾塩基、例えば５−メチルシトシン（ｍ５Ｃ）、シュードウリジン（Ψ）、ジヒドロウリジン（Ｄ）、イノシン（Ｉ）および／または７−メチルグアノシン（ｍ７Ｇ）を含みうる。幾つかの場合には、合成核酸はペプチド核酸（ＰＮＡ）、架橋核酸（ＢＮＡ）、類似核酸、グリセロール核酸（ＧＮＡ）、トレオース核酸（ＴＮＡ）、ロックト核酸（ＬＮＡ）、２’−Ｏ−メチル置換ＲＮＡ、モルホリノ、またはヌクレオチド側鎖を有する他の合成ポリマーを含みうる。幾つかの場合には、合成核酸はＤＮＡ、ＲＮＡ、ＰＮＡ、ＬＮＡ、ＢＮＡまたはそれらの任意の組合せを含みうる。幾つかの場合には、合成核酸は二重らせんまたは三重らせんまたは他の構造を含みうる。

合成核酸は任意のヌクレオチドの任意の組合せを含みうる。ヌクレオチドは天然物または合成物でありうる。幾つかの場合には、ヌクレオチドは酸化またはメチル化されていてもよい。ヌクレオチドには以下のものが含まれうる（それらに限定されるものではない）：アデノシン一リン酸（アデノシンモノホスファート）（ＡＭＰ）、アデノシン二リン酸（ＡＤＰ）、アデノシン三リン酸（ＡＴＰ）、グアノシン一リン酸（ＧＭＰ）、グアノシン二リン酸（ＧＤＰ）、グアノシン三リン酸（ＧＴＰ）、チミジン一リン酸（ＵＴＰ）、ウリジン二リン酸（ＵＤＰ）、ウリジン三リン酸（ＵＴＰ）、シチジン一リン酸（ＣＭＰ）、シチジン二リン酸（ＣＤＰ）、シチジン三リン酸（ＣＴＰ）、５−メチルシチジン一リン酸、５−メチルシチジン二リン酸、５−メチルシチジン三リン酸、５−ヒドロキシメチルシチジン一リン酸、５−ヒドロキシメチルシチジン二リン酸、５−ヒドロキシメチルシチジン三リン酸、環状アデノシン一リン酸（ｃＡＭＰ）、環状グアノシン一リン酸（ｃＧＭＰ）、デオキシアデノシン一リン酸（ｄＡＭＰ）、デオキシアデノシン二リン酸（ｄＡＤＰ）、デオキシアデノシン三リン酸（ｄＡＴＰ）、デオキシグアノシン一リン酸（ｄＧＭＰ）、デオキシグアノシン二リン酸（ｄＧＤＰ）、デオキシグアノシン三リン酸（ｄＧＴＰ）、デオキシチミジン一リン酸（ＤＴＭＰ）、デオキシチミジン二リン酸（ｄＴＤＰ）、デオキシチミジン三リン酸（ｄＴＴＰ）、デオキシウリジン一リン酸（ｄＵＭＰ）、デオキシウリジン二リン酸（ｄＵＤＰ）、デオキシウリジン三リン酸（ｄＵＴＰ）、デオキシシチジン一リン酸（ｄＣＭＰ）、デオキシシチジン二リン酸（ｄＣＤＰ）およびデオキシシチジン三リン酸（ｄＣＴＰ）、５−メチル−２’−デオキシシチジン一リン酸、５−メチル−２’−デオキシシチジン二リン酸、５−メチル−２’−デオキシシチジン三リン酸、５−ヒドロキシメチル−２’−デオキシシチジン一リン酸、５−ヒドロキシメチル−２’−デオキシシチジン二リン酸および５−ヒドロキシメチル−２’−デオキシシチジン三リン酸。

合成またはスパイクイン核酸は、サンプルに添加される任意の分子を意味することが可能であり、例えばカラム上で化学合成された分子には限定されない。幾つかの場合には、合成またはスパイクイン核酸は、例えばＰＣＲ増幅、インビトロ転写、または鋳型に基づく他の複製により合成されうる。幾つかの場合には、合成またはスパイクイン核酸は、せん断または断片化された核酸であり、あるいは、せん断または断片化された核酸を含む。該せん断または断片化核酸はゲノム核酸、例えばヒトまたは病原体ゲノム核酸を含みうる。幾つかの場合には、合成核酸はヒト核酸を含有しない。幾つかの場合には、合成核酸は、天然で見出されうる核酸を含有しない。幾つかの場合には、合成核酸はサンプル核酸を含有しない。

スパイクインまたは合成核酸のグアニン−シトシン含量（ＧＣ含量）は様々でありうる。幾つかの場合には、スパイクインまたは合成核酸のＧＣ含量は少なくとも約０％、５％、１０％、１５％、２０％、２５％、３０％、３５％、４０％、４５％、５０％、５５％、６０％、６５％、７０％、７５％、８０％、８５％、９０％、９５％または１００％でありうる。幾つかの場合には、ＧＣ含量は多くとも約５％、１０％、１５％、２０％、２５％、３０％、３５％、４０％、４５％、５０％、５５％、６０％、６５％、７０％、７５％、８０％、８５％、９０％、９５％または１００％でありうる。幾つかの場合には、スパイクインまたは合成核酸のＧＣ含量は約１５％〜約８５％、例えば約２０％〜約８０％の範囲内でありうる。集合体内の合成核酸の種のＧＣ含量は特定の標的核酸（例えば、サンプルにおける病原体特異的または疾患特異的核酸の観察可能な範囲）のＧＣ含量と厳密に一致しうる。他の場合においては、合成核酸の集合体内の合成核酸の種のＧＣ含量は標的核酸のＧＣ含量と厳密に一致し、またはそのようなＧＣ含量に実質的に一致しうる。例えば、合成核酸の種のＧＣ含量は標的核酸のＧＣ含量の７５％〜１２５％、標的核酸のＧＣ含量の８０〜１２０％、標的核酸のＧＣ含量の８５％〜１１５％、標的核酸のＧＣ含量の９０％〜１１０％、標的核酸のＧＣ含量の９５％〜１０５％、標的核酸のＧＣ含有量の９６％〜１０４％、標的核酸のＧＣ含量の９９％〜１０１％、または標的核酸のＧＣ含有量の９９．５％〜１００．５％の範囲内でありうる。

スパイクイン核酸は、異なる分子、例えばビーズ、発蛍光団、ポリマーに結合され、連結され、またはコンジュゲート化されうる。発蛍光団の例には、蛍光タンパク質、緑色蛍光タンパク質（ＧＦＰ）、Ａｌｅｘａ色素、フルオレセイン、赤色蛍光タンパク質（ＲＦＰ）および黄色蛍光タンパク質（ＹＦＰ）が含まれるが、これらに限定されるものではない。スパイクイン核酸はタンパク質（例えば、ヒストン、核酸結合タンパク質、ＤＮＡ結合タンパク質、ＲＮＡ結合タンパク質）に結合されうる。他の場合においては、スパイクイン核酸はタンパク質に結合されない。スパイクイン核酸は粒子で保護されうる（例えば、ビリオン内の核酸に類似）。幾つかの場合には、スパイクイン核酸は粒子内に封入され、または粒子に結合している。幾つかの場合には、粒子はタンパク質、脂質、金属、金属酸化物、プラスチック、ポリマー、生体高分子、セラミックまたは複合材料を含む。

スパイクイン核酸は、サンプルまたは宿主において潜在的に見出される配列とは異なる配列を有しうる。幾つかの場合には、スパイクイン核酸配列は天然に存在する。幾つかの場合には、スパイクイン核酸配列は天然に存在しない。幾つかの場合には、スパイクイン核酸配列は宿主に由来する。幾つかの場合には、スパイクイン核酸配列は宿主に由来しない。幾つかの場合には、スパイクインまたは合成核酸は１以上の標的核酸（例えば、病原体核酸、疾患特異的核酸）および／または１以上のサンプル核酸にハイブリダイズし得ない（または相補的でない）。

サンプルにおけるスパイクイン核酸の濃度は様々でありうる。スパイクインは、感度およびサンプル損失を決定するのに有用でありうる広範囲の濃度で添加されうる。幾つかの場合には、１０万、５０万、１００万、２００万、３００万、４００万、５００万、６００万、７００万、８００万、９００万、１０００万、２０００万、３０００万、４０００万、５０００万、６０００万、７０００万、８０００万、９０００万、１億、５億または１０億個の、各スパイクイン核酸の分子が、血漿またはサンプルの１ｍＬ当たりに添加される。幾つかの場合には、約１０００万〜約１０億個の、各スパイクイン核酸の分子が、血漿またはサンプルの１ｍＬ当たりに添加される。他の場合においては、合成核酸は、異なる濃度でサンプルにスパイクイン（添加）される。

サンプルに添加される種々のスパイクイン核酸の数は様々でありうる。複数のスパイクイン核酸がサンプルまたは試薬に添加されうる。幾つかの場合には、少なくとも約１、２、３、４、５、６、７、８、９または１０個のスパイクイン核酸がサンプルまたは試薬に添加される。幾つかの場合には、多くとも約１、２、３、４、５、６、７、８、９または１０個のスパイクイン核酸がサンプルまたは試薬に添加される。幾つかの場合には、サンプルまたは試薬に添加されるスパイクイン核酸は、同じ長さである。幾つかの場合には、サンプルまたは試薬に添加されるスパイクイン核酸は、異なる長さである。幾つかの場合には、スパイクイン核酸は、配列番号１〜１２０およびそれらの任意の組合せからなる群から選択される。

スパイクイン核酸のユニーク性（一意性）のレベルは様々でありうる。本質的に無制限の数のスパイクイン（例えば、ＩＤスパイク）が設計または使用されうる。

スパイクイン核酸が添加されるプロセスにおける工程は様々でありうる。サンプルトラッキングのためには、スパイクイン核酸の、より早期の添加がより良好であり、その後のオペレータまたはシステムエラーの可能性を減少させうる。幾つかの場合には、サンプル（例えば、血液）が最初に添加されるチューブは既にスパイクイン核酸を含有していてもよい。これらのチューブの製造は、診療所または研究検査施設におけるサンプルへのスパイクイン核酸の添加と比較して、より体系的に制御および試験されることが可能であり、それにより、サンプルの混同の可能性が低減されうる。幾つかの場合には、ＩＤスパイクが全ての外部ラベル（「ホワイトラベル」）に取って代わりうる。

幾つかの場合には、各配列リードが識別マーカーを含有するように、識別核酸マーカーがサンプルにおける各核酸断片に加えられうる。この方法は初期のものと下流のものとの交差汚染の識別を可能にするであろう。断片のタグ付けが十分に完了している場合、それは、バーコードがサンプル断片に加えられるとすぐに、サンプルの意図的な多重化をも可能にしうるであろう。タグを組み込むための方法には、トランスポゾン、末端トランスフェラーゼ、メチル化部位での切断、および脱メチル化部位での切断が含まれるが、これらに限定されるものではない。

プロセス品質管理または開発作業に関連する用途（これらに限定されるものではない）を含む他の用途の場合、スパイクイン核酸は該プロセスにおける種々の工程で添加されうる。例えば、ＲＮＡ分析の場合には、異なる濃度、長さ、配列および／またはＧＣ含量をそれぞれが有する複数のＲＮＡスパイクインがサンプル調製の開始時に添加可能であり、ＲＮＡがＤＮＡに変換された後、ＤＮＡスパイクインが添加可能である。ＤＮＡライブラリーの場合には、種々の形態のＤＮＡがライブラリー作製プロセスの種々の工程で添加されうる。例えば、末端修復工程を試験するために、非平滑末端を有する、５’−リン酸を有する又は有さない（＋／− ５’−リン酸）、および３’−アデニン伸長を有する又は有さない（＋／− ３’−アデニン伸長）ＤＮＡスパイクインが使用されうる。アダプターを末端修復断片に連結する工程を試験するために、予め適合化された又はされていない（＋／− ｐｒｅ−ａｄａｐｔｅｄ）スパイクインが使用されうる。配列決定ｑＰＣＲは個々の工程におけるサンプル損失を定量しうる。スパイクインのｑＰＣＲはまた、配列決定前の最終的なライブラリー評価のための他のライブラリー定量法と併用されうる。

「スパイクイン」、「スパイクイン合成核酸」、「スパイク」および「合成核酸」なる語は本明細書においては互換的に用いられ、異なる解釈を文脈が示す場合を除き、そのようなものとして解釈されるべきである。「ＩＤスパイク」または「トレーサー」なる語は、例えばサンプル識別トラッキング、交差汚染検出、試薬トラッキングまたは試薬ロットトラッキングに使用されうる識別スパイクを意味するものとして本明細書において一般に用いられる。「スパーク（Ｓｐａｒｋ）」なる語は、存在量の正規化、開発および／または分析の目的ならびに他の目的で使用されうる、サイズまたは長さマーカーである核酸を意味するものとして本明細書において一般に用いられる。「スパンク（Ｓｐａｎｋ）」なる語は、縮重プール、または多様な配列を有する核酸のプールを意味するものとして一般に用いられ、しばしば、多様性評価および存在量の計算のために用いられうる。

核酸の測定結果の一般的な正規化
本開示は、記載されている方法において使用される場合、サンプルにおける疾患特異的核酸、病原体特異的核酸または他の標的核酸の量の効率的かつ改善された正規化を可能にしうる合成核酸のセットを記載する。添加（ｓｐｉｋｅｄ）核酸のセットは、長さにおいて異なる核酸の幾つかの「種」を含有することが可能であり、その結果、添加核酸種の集合体は全体として、測定される病原体核酸、疾患特異的核酸または他の標的核酸の長さの観察可能な範囲にわたる。

スパイクイン合成核酸は、多種多様な方法でサンプルを正規化するために使用されうる。しばしば、正規化は、サンプルが由来する対象、分析前サンプル処理条件、核酸抽出の方法、分子生物学的手段および方法による核酸操作、核酸精製の方法、測定自体の実施、保存条件ならびに／または時間経過には無関係に、サンプル全体にわたりうる。

幾つかの好ましい実施形態では、スパイクイン核酸は、疾患特異的核酸、病原体特異的核酸または他の標的核酸を測定する全ての方法および全てのサンプルにわたって正規化しうる。幾つかの場合には、スパイクインは、サンプルにおける病原体核酸（または疾患特異的核酸または標的核酸）の、他の病原体核酸と比較した場合の相対的存在量を決定するために使用されうる。

一般に、本発明で提供する方法は、合成核酸のセットの１以上をサンプル内に添加（スパイクイン）または導入することを含む。この添加工程は、プロセスの初期、中期または終期を含む、該方法全体の任意の時点で行われうる。例えば、合成核酸は、対象からサンプルが採取された時点またはその直後、サンプルの保存の前または途中、サンプルの輸送の前、核酸抽出の前または途中、ライブラリー調製の前または途中、配列決定アッセイの直前、あるいは該方法の任意の他の工程において導入されうる。幾つかの場合には、該方法は、同じ方法により測定されうるが病原体特異的もしくは疾患特異的核酸または他のサンプル核酸から容易に識別される既知量のユニーク核酸分子を該プロセスの初期に生物学的サンプルに添加することを含みうる。幾つかの場合には、該プロセスの単一工程（例えば、サンプルを対象から採取したとき、分析を行うためにサンプルを得たとき、サンプル保存中、核酸抽出の前または途中、ライブラリー調製の前または途中、あるいは配列決定アッセイの直前）において合成核酸を生物学的サンプルに添加する。他の場合においては、同じ又は異なるスパイクイン合成核酸を該プロセスにおける異なる工程において導入する。例えば、ユニーク合成核酸を該プロセスの初期（例えば、サンプル採取時）に導入することが可能であり、異なるセットのユニーク核酸を、該プロセスの、より後の時点（例えば、抽出、精製またはライブラリー調製の前または後）で導入することが可能である。また、スパイクイン核酸の同一集合体または何らかの態様で異なる集合体を使用して、該方法の異なる工程で添加工程を繰り返すことも可能である。

一般に、既知濃度（または複数濃度）の合成核酸の種を各サンプルに添加することが可能である。多くの場合においては、合成核酸の種を各種の等モル濃度で添加する。幾つかの場合には、合成核酸種の濃度は異なる。

サンプルが処理され、最終的に測定される場合、サンプルの取り扱い、調製および測定の固有の偏りゆえに、核酸種の相対的存在量は変化しうる。測定後、添加核酸の各「種」の測定存在量を最初の添加量と比較することにより、各長さの核酸の回収効率が決定されうる。これは「長さに基づく回復プロファイル」を与えうる。

「長さに基づく回復プロファイル」を用いて、最も近い長さの添加分子に対して、または種々の長さの添加分子にフィットされた関数に対して、疾患特異的核酸の存在量（または病原体核酸もしくは他の標的核酸の存在量）を正規化することにより、疾患特異的核酸、病原体核酸または他の標的核酸の全て（または大部分または幾つか）の存在量を正規化することが可能である。このプロセスは疾患特異的核酸に適用可能であり、サンプル添加の時点の「全ての疾患特異的核酸の元の長さの分布」の推定をもたらしうる。同様に、このプロセスは他の標的核酸、例えば病原体特異的核酸にも適用可能であり、サンプル添加の時点の「全ての病原体特異的核酸の元の長さの分布」の推定をもたらしうる。「全ての標的核酸の元の長さの分布」はサンプル添加の時点の標的核酸（例えば、疾患特異的核酸、病原体特異的核酸）に関する長さの分布プロファイルを示しうる。完璧またはほぼ完璧な存在量の正規化を達成するために添加核酸が再現（ｒｅｃａｐｉｔｕｌａｔｅ）しようとするのは、この長さの分布である。

特定のサンプルにおける疾患特異的核酸、病原体核酸または他の標的核酸の相対的存在量プロファイルを厳密に再現する既知核酸の混合物をサンプルに添加することは可能でない可能性があるため（これは１つには、該サンプルが使い果たされた、または時間が相対的存在量プロファイルを変化させた可能性があるからである）、スパイクインの各「種」は「全ての疾患特異的核酸の元の長さの分布」におけるその相対的存在量に比例して加重（ｗｅｉｇｈｔ）されうる。全ての「加重係数（ｗｅｉｇｈｔｉｎｇｆａｃｔｏｒ）」の和は１．０に等しいことが可能である。

正規化は単一工程または一連の工程を含みうる。幾つかの場合には、最も近いサイズの添加核酸の存在量の生測定値を用いて、病原体特異的核酸（または病原体核酸もしくは他の標的核酸）の存在量を正規化して、「正規化疾患特異的核酸（または病原体核酸もしくは他の標的核酸）存在量」を得ることが可能である。ついで「正規化疾患特異的核酸存在量」（または病原体核酸もしくは他の標的核酸存在量）に「加重係数」を掛け算して、その長さの回収の相対的重要性に関して補正して、「加重正規化疾患特異的（または病原体特異的もしくは他の標的）核酸存在量」を得ることが可能である。この正規化方法の利点の１つは、それが、疾患特異的核酸の存在量を測定する全て（またはほとんど）の方法にわたって、方法には無関係に、標的核酸（例えば、疾患特異的核酸、病原体核酸）の存在量の同等の測定を可能にすることであろう。

標的核酸存在量または相対的存在量の測定は、検出、予測、モニターおよび診断アッセイに特に有用でありうる。そのようなアッセイは、病原体の存在を検出するために、または病態を特定するために、生物学的サンプル（例えば、血漿）における標的核酸（例えば、疾患特異的核酸）の量を測定することを含みうる。本明細書に記載されている方法は、これらの測定を、サンプル、測定時間、核酸抽出方法、核酸操作方法、核酸測定方法および／または種々のサンプル処理条件の全体にわたって同等にしうる。

添加分子の厳密な配列、「種」の厳密な数、「種」の長さの範囲、添加分子の濃度、各分子の相対量、各添加分子の実際の量、分子が添加される段階は、サンプルに基づいて最適化または調整されうる。長さはＧＣ含量、核酸構造、ＤＮＡ損傷またはＤＮＡ修飾状態で置換または分析されうる。

幾つかの場合には、本発明で提供する方法は、（幾つかの方法における幾つかの短いランダム化部分を除き）大部分が固定された配列組成をしばしば伴う、核酸の単一の長さを含む添加核酸の使用を含みうる。この方法は、疾患特異的核酸、病原体特異的核酸または他の標的核酸が添加核酸とほぼ同じ長さのものである場合に、良好に機能しうる。

単一の長さの核酸は単独で使用可能であり、あるいは該方法は、複数の長さの核酸の使用を伴う別の方法と組合されうる。例えば、サンプルが得られた際または核酸の抽出の前に、複数の長さの核酸のプールをサンプルに添加することが可能であり、単一の長さの核酸のプールを該プロセスにおける異なる時点で（例えば、核酸の抽出の後およびライブラリー調製の前に）サンプルに添加することが可能である。単一の長さおよび／または複数の長さの核酸を使用する場合、疾患特異的核酸、病原体核酸または他の標的核酸の量を、該方法の終了時の測定された添加核酸の量に対して正規化することが可能である。

多くの場合、本明細書に記載されているとおり、複数の長さを有する合成核酸の使用は、単一の長さの合成核酸の使用を含む方法より好ましいかもしれない。本発明で提供する核酸は、標的核酸が複数の長さを有する場合に特に有用である。例えば、疾患特異的（または病原体特異的）核酸は長さにおいて広範に変動しうる。したがって、疾患特異的核酸の観察可能な長さにわたるスパイクイン核酸の使用が特に役立ちうる。更に、測定された疾患特異的核酸の長さは、それが由来する個体の代謝、分析前的サンプル処理条件、核酸抽出の方法、分子生物学手段および方法による核酸操作、核酸精製の方法、測定自体の実施、保存条件および時間経過を含む多数の要因によっても劇的な影響を受けうる。これらの要因は、異なる長さの核酸に対して差動的な影響を及ぼし、したがって、単一の添加核酸は、混合した長さの核酸に関して行われるプロセスの全体的な効率を適切に反映しない可能性がある。

「体積当たりのゲノムコピー数」の計算
本発明で提供する方法および合成核酸は、次世代シーケンシングの結果からサンプルにおける微生物または病原体の体積当たりのゲノムコピー数を決定することを含む或る計算を助けるために使用されうる。一般に、体積当たりのゲノムコピー数は流体（例えば、血漿、尿、バッファーなど）１ｍｌ当たりの標的核酸（例えば、特定の病原体に由来する標的核酸）の量の絶対的尺度を示すことが可能であり、個々の病原体の存在量または相対的存在量を示すための表現としてしばしば用いられうる。病原体の存在量のリード（ｒｅａｄ；読取り）の総数および／または大きさはサンプルごとに異なりうる。感染の生物学的レベルに対応し、サンプルとサンプルとの比較に有用でありうる値を報告することが望ましいことがある。

特定の例においては、該方法は、サンプル（特に、病原体に感染している又は病原体に感染していると疑われる対象から得られたサンプル）における病原体核酸の体積当たりのゲノムコピー数を決定するために使用されうる。体積当たりのゲノムコピー数は、統計的枠組みを使用して決定または推定されうる。該統計的枠組みは、サンプルからの配列決定結果における非ヒトリード（例えば、病原体リード）の集合体（コレクション）を与える１以上のゲノムの相対的存在量を推定するために使用されうる。

本発明で提供するスパイクイン合成核酸を使用して、サンプルにおける１以上の病原体／生物の「体積当たりのゲノムコピー数」の推定値が計算されうる。一般に、種々の長さの核酸が既知濃度でサンプルに添加されうる。幾つかの場合には、配列データにおいて実際に観察されるサンプルからの情報の割合が、（例えば、観察されたリード数を、添加核酸に関連するリード数と比較することにより、または観察されたリード数を添加リード数で割り算することにより）各スパイクイン長に関して観察されうる。各長さにおける非宿主または病原体分子の元の数を逆算することも可能である（例えば、各長さにおけるスパイクインリードの数から部分的に推測される）。各病原体のゲノムの長さが知られている場合、このロード（ｌｏａｄ）は「体積当たりのゲノムコピー数」の尺度に変換されうる。

多くの場合、体積当たりのゲノムコピーを検出するための方法（および本発明で提供する他の方法）は低品質のリードの除去または隔離を含みうる。低品質のリードの除去は、本発明で提供する方法の精度および信頼性を改善しうる。幾つかの場合には、該方法は、マッピング不可能なリード、ＰＣＲデュープリケート（ｄｕｐｌｉｃａｔｅ）から得られたリード、低品質リード、アダプター二量体リード、配列決定アダプターリード、非ユニークマップ化リードおよび／または情報価値のない配列に位置するリードの（任意の組合せでの）除去または隔離を含みうる。

幾つかの場合には、配列リードは参照ゲノムに対してマッピングされ、そのような参照ゲノムにマッピングされていないリードが１以上の標的または病原体ゲノムにマッピングされる。幾つかの例においては、リードはヒト参照ゲノム（例えば、ｈｇ１９）にマッピングされ、一方、残りのリードはウイルス、細菌、真菌および他の真核生物病原体（例えば、真菌、原虫、寄生生物）のキュレート参照データベースに対してマッピングされる。

幾つかの特定の例においては、該方法は、ＤＮＡ抽出（例えば、無細胞ＤＮＡ抽出、無細胞ＲＮＡ抽出）の前またはアッセイの異なる段階（例えば、抽出後、ライブラリー調製前、配列決定前、サンプルの保存中）において、既知濃度の合成核酸（例えば、ＤＮＡ）をサンプル（例えば、血漿サンプル）に添加することを含みうる。合成核酸は陰性および／または陽性対照サンプルにも添加されうる。幾つかの場合には、対照サンプルはサンプルと並行して処理されうる。該方法は更に、サンプル（例えば、血漿サンプル、陽性対照、陰性対照）のための配列決定ライブラリーを製造することを含みうる。該ライブラリーは、当技術分野で公知の配列決定装置、特に、次世代シーケンシングの性能を有する装置において多重化され、配列決定されうる。該方法は更に、低品質のリードを破棄すること、およびヒト参照配列（例えば、ｈｇ１９）に対するアライメントによりヒトリードを除去することを含みうる。ついで、残りのリードは病原体配列のデータベースにアライメントされうる。幾つかの場合には、関心のある標的配列（例えば、病原体配列）に対応するリードはＮＧＳリードセットから定量される。この情報から、標的核酸（例えば、病原体核酸）の相対的存在量が体積当たりのゲノムコピー数として表されうる。体積当たりのゲノムコピー数は、例えば、サンプル（例えば、血漿）に添加された既知量のオリゴヌクレオチドに対して正規化された各生物（例えば、病原体）に関する存在配列の数を決定することにより決定されうる。体積当たりのゲノム数の計算は個々の病原体ゲノムの相対的長さをも考慮しうる。幾つかの場合には、体積当たりのゲノムコピー数は、各生物（例えば、病原体）に関する存在配列の数を定量し、サンプルに添加された既知量の合成核酸に対して正規化することにより決定可能であり、ここで、病原体配列の正規化は、長さにおいて病原体配列に最も近い合成核酸を考慮する。同様に、正規化は、種々の長さ（例えば、２、３、４、５、６、１０、１５、２０個またはそれ以上の異なる長さ）のスパイクイン合成核酸の集合体の使用を含むことが可能であり、ここで、病原体核酸は、スパイクインの集合体内の、長さにおいて最も近いそれぞれのスパイクイン核酸に対して正規化される。

サンプルの追跡（トラッキング）および／または分析のためのスパイクイン
分子をサンプルに添加して、ユニーク（ｕｎｉｑｕｅ；一意の、特有の）識別子およびトレーサーを得ることが可能である。これらの分子はサンプルの一部となることが可能であり、適切な測定装置により読取られうる（レーザースキャナーにより読取られるサンプルチューブの外表面上の１Ｄまたは２Ｄバーコードに類似した概念）。光学的、放射性および他のトレーサーが可能であるが、核酸サンプルの分析のためには、核酸トレーサーが最適な選択肢でありうる。なぜなら、スパイクインが何であるかが、サンプルの核酸を評価する同じプロセス（例えば、ＤＮＡまたはＲＮＡ配列決定）において示されうるからである。

外部由来の核酸には、オリゴヌクレオチド、二本鎖オリゴヌクレオチド、より長い合体（ａｓｓｅｍｂｌｅｄ）二本鎖ＤＮＡ（例えば、ＩｎｔｅｇｒａｔｅｄＤＮＡＴｅｃｈｎｏｌｏｇｉｅｓのｇＢｌｏｃｋｓ）、プラスミド、ＰＣＲ産物、インビトロ合成転写産物、ウイルス粒子、および断片化または非断片化ゲノムＤＮＡ（これらに限定されるものではない）が含まれ、それらはサンプル、例えば対象からの体液に添加されうる。スパイクインを使用する利点には、核酸配列、長さ、多様性および濃度がサンプルまたは用途に適合化されうることが含まれるが、これに限定されるものではない。

用途には以下のものが含まれるが、それらに限定されるものではない：サンプルの追跡（トラッキング）［例えば、通常のラベルバーコードに加えて、または潜在的にその代わりに、ＩＤスパイク（Ｓｐｉｋｅ）が使用されうる］、サンプル交差汚染（例えば、サンプルのいずれにおいてもＩＤスパイクが天然で見出されない場合、およびサンプルによって異なるＩＤスパイクがサンプルに添加される場合には、サンプルの混合が判定されうる）、試薬の追跡［例えば、ＩＤスパイクは試薬にも添加されうる。例えば、各試薬ロットは、それが使用される各サンプルに関して追跡可能であり、エラーのより少ない試薬追跡分子実験室情報管理システム（ＬＩＭＳ）がもたらされうる］、品質管理または開発作業［例えば、ライブラリーの複雑性（例えば、ＰＣＲデュープリケート（ｄｕｐｌｉｃａｔｅ））、サンプル損失または感度をモニターするために、異なるスパイクインがサンプル処理プロセスにおける種々の時点で添加されうる］、正規化または収率［例えば、既知入力をスパイクインの測定出力と比較することは、（例えばサンプルにおける）未知入力の、その測定出力による推測を可能にしうる。これらの測定および計算から、例えばサンプルの病原体量が判明しうる］、および核酸濃度の増加（例えば、バーコードが核酸である場合、それは、限定的である核酸濃度を有するサンプルに関して高濃度で使用可能であり、このことはサンプルの回収を改善しうる）。

幾つかの好ましい実施形態においては、スパイクインは、関心のある特定の核酸配列が、それが観察されたサンプルに由来する可能性、または観察されたサンプルにおけるその存在が、異なるサンプルからの交差汚染もしくは持ち越し汚染の結果でありうるかどうかを推定するために使用されうる。ユニークスパイクイン分子を、特定の病原体からの分子（または関心のある他の配列クラス）から合理的に予想される濃度より高い濃度で各サンプル内に導入することにより、交差汚染または持ち越し汚染によって偶然に導入されたいずれかの病原体配列（または関心のある他の配列クラス）が、該汚染または持ち越し汚染配列の起源からの、より一層多数のスパイクイン分子を伴う可能性が高い。したがって、交差汚染または持ち越し汚染スパイクイン分子数に対する病原体配列数（または他のクラスの配列）の比率を用いて、サンプル間の交差汚染または持ち越し汚染の結果でありうる任意の病原体配列を特定することが可能である。幾つかの場合には、交差汚染または持ち越し汚染スパイクイン分子の非存在、または閾値レベル未満のレベルでのその存在を利用して、サンプルが汚染されていないことを示す。

幾つかの用途には、サンプルが由来する対象の遺伝子型を、特にサンプル追跡のために使用することが可能である。幾つかの場合には、遺伝子型は分析操作中に決定可能であり、あるいはアリコートを取り出し、別個の遺伝子型決定法を行うことにより決定可能である。幾つかの場合には、サンプルの遺伝子型は既に知られている。対象のＤＮＡの配列決定出力を、独立して得られた遺伝子型と比較することが可能である。遺伝子型を使用する利点は、それが既にサンプルの一部であり、サンプルに固有のものであることである。典型的な直交性（ｏｒｔｈｏｇｏｎａｌ）遺伝子型決定法は、ショート・タンデム・リピート（ＳＴＲ）分析である。例えば、ＡＴＣＣの試験サービスを参照されたい。

幾つかの場合には、表現型の特徴がサンプルの特定を助けうる。例えば、対象の眼の色、血液型、性別、人種および他の形質が遺伝子型の手がかりをもたらしうるであろう。

ＩＤスパイク
ユニークサンプル識別子は完全にスクランブルされることが可能であり（例えば、ＤＮＡではＡ、Ｃ、ＧおよびＴのランダム化、またはＲＮＡではＡ、Ｃ、ＧおよびＵのランダム化）、あるいはそれらは共通配列の幾つかの領域を有することが可能である。例えば、各末端の共有領域は連結事象における配列の偏りを減少させうる。幾つかの場合には、共有領域は少なくとも約１、２、３、４、５、６、７、８、９、１０、１５または２０個の共通塩基対である。幾つかの場合には、共有領域は多くとも約１、２、３、４、５、６、７、８、９、１０、１５または２０個の共通塩基対である。典型的な配列は、表１を参照されたい。

ＩＤスパイクの組合せは、膨大な数のＩＤスパイクを使用しなくても多様性を増大させるために添加されうる。ＩＤスパイクはマイクロタイタープレートにおけるウェル位置に関する識別子として使用可能であり（例えば、９６ウェルプレートの場合には９６個の異なるＩＤスパイク）、別のＩＤスパイクはプレート番号に関する識別子として使用可能であり（例えば、２４個の異なるプレートの場合には２４個の異なるＩＤスパイク）、僅か９６＋２４＝１２０の配列を使用して、９６×２４＝２，３０４の組合せが得られる。サンプル当たり３個以上のＩＤスパイクの使用は、達成可能な多様性を、より一層劇的に増大させうる。

スパーク（Ｓｐａｒｋ）バイアス制御スパイクイン
複数の長さにわたる核酸配列のセット（「スパーク（Ｓｐａｒｋ）」）はサイズマーカーとして働きうる。これらの配列はサンプル核酸と共にサンプルに添加され、処理（例えば、抽出、精製、配列決定）されうる。あるプロセスは、異なる長さの核酸に差動的に影響を及ぼしうる。例えば、シリカ膜カラムを使用する核酸精製は、より長い長さの配列に対して偏向することが可能であり、または特定の長さの配列を保持するように最適化されうる。核酸配列決定は、典型的には、サンプルから核酸が抽出された後に行われるため、配列決定結果における長さの出現率または分布は元のサンプルを代表するものではない可能性がある。既知の量および長さのスパーク配列を添加することにより、種々の長さのサンプル核酸に対する処理および配列決定の効果をモニターし、定量化することが可能である。また、サンプル核酸およびスパークサイズセット（Ｓｐａｒｋｓｉｚｅｓｅｔ）核酸に関する配列決定リードの最終的な数を測定し、元のサンプルに添加された既知量のスパークサイズセット核酸に対して正規化することにより、元のサンプルにおける種々の長さのサンプル核酸の相対および／または絶対量を推定することが可能である。

幾つかの場合には、スパークサイズセットは、少なくとも約３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、２０、２５、３０、３５、４０、４５、５０、１００、２００、２５０、３００、３５０、４００、５００、６００、７００、８００、１０００個またはそれ以上の核酸を含みうる。幾つかの場合には、スパークサイズセットは、多くとも約３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、２０、２５、３０、３５、４０、４５、５０、１００または２００個の核酸を含みうる。幾つかの場合には、スパークサイズセットは約３〜約５０個の核酸、例えば約３〜約３０個の核酸を含む。幾つかの場合には、スパークサイズセットにおける核酸は、１以上の異なる特性、例えば、異なる長さ、異なるＧＣ含量および／または異なる配列を有する。

スパーク核酸は、長さ識別配列、ロード（ｌｏａｄ）配列、合成核酸識別配列（それは、この場合、スパーク識別配列であろう）および特徴ドメインを含む、本明細書に記載されている合成スパイクイン核酸の特徴のいずれかを含みうる。幾つかの場合には、スパークサイズセットにおける核酸は、固定されたフォワード配列および／または固定されたリバース配列を含有する。固定されたフォワード配列および／または固定されたリバース配列はスパークサイズセットにおける全ての核酸に共通であることが可能であり、配列をスパークとして識別しうる。幾つかの場合には、固定されたフォワード配列および／または固定されたリバース配列は、少なくとも約５、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２５、３０、３２、４０、５０、６０、７０、８０、９０または１００塩基対長である。幾つかの場合には、固定されたフォワード配列および／または固定されたリバース配列は、多くとも約５、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２５、３０、３２、４０、５０、６０、７０、８０、９０または１００塩基対長である。幾つかの場合には、固定されたフォワード配列および／または固定されたリバース配列は、約８ｂｐ〜約５０ｂｐ、例えば、約８ｂｐ〜約２０ｂｐ、または約１６ｂｐ〜約４０ｂｐの範囲内である。幾つかの場合には、スパーク識別配列はサンプルにおいて見出されず、または天然で存在しない。幾つかの場合には、固定されたフォワード配列は、固定されたリバース配列とは異なる。

幾つかの場合には、スパークサイズセットにおける核酸はユニークフォワード配列および／またはユニークリバース配列を含有する。ユニークフォワード配列および／またはユニークリバース配列は該サイズセットにおけるスパークをお互いから識別しうる。幾つかの場合には、ユニークフォワード配列および／またはユニークリバース配列は、少なくとも約０、１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２５、３０、３２、４０、５０、６０、７０、８０、９０または１００塩基対長である。幾つかの場合には、ユニークフォワード配列および／またはユニークリバース配列は、多くとも約１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２５、３０、３２、４０、５０、６０、７０、８０、９０、１００、２００、３００、３０６、４００または５００塩基対長である。幾つかの場合には、ユニークフォワード配列および／またはユニークリバース配列は約４〜約１０塩基対長の範囲内である。幾つかの場合には、スパークサイズセットにおける各核酸は、異なるユニークフォワード配列および／またはユニークリバース配列を有する。幾つかの場合には、スパークサイズセットにおける各核酸は、同じ長さを有するユニークフォワード配列および／またはユニークリバース配列を有する。幾つかの場合には、スパークサイズセットにおける各核酸は、異なる長さを有するユニークフォワード配列および／またはユニークリバース配列を有する。

幾つかの場合には、スパークサイズセットにおける核酸は充填（ｆｉｌｌｅｒ）配列を含有する。幾つかの場合には、充填配列はサイズセットにおけるスパークをお互いから識別しうる。幾つかの場合には、充填配列は、少なくとも約０、１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２５、３０、３２、４０、５０、６０、７０、８０、９０または１００塩基対長である。幾つかの場合には、充填配列は、多くとも約１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２５、３０、３２、４０、５０、６０、７０、８０、９０、１００、２００、３００、３０６、４００または５００塩基対長である。幾つかの場合には、充填配列は０〜約３５０ｂｐの範囲内である。幾つかの場合には、スパークサイズセットにおける各核酸は、異なる長さを有する充填配列を有する。幾つかの場合には、充填配列の長さは、０、８、３１、５６、８１、１０６、１３１および３０６ｂｐからなる群から選択される。

幾つかの場合には、スパークサイズセットにおける核酸は、少なくとも約１０、２０、３０、３２、４０、５０、６０、７０、８０、９０または１００塩基対長である。幾つかの場合には、スパークサイズセットにおける核酸は、多くとも約１００、２００、３００、３５０、４００、５００、６００、７００、８００、９００または１，０００塩基対長である。幾つかの場合には、スパークサイズセットにおける核酸は約２０〜約５００塩基対長の範囲内、約２０〜約４００塩基対長の範囲内、または約２０〜約２００塩基対長の範囲内である。

例えば、以下の特徴を有する８個の二重鎖ＤＮＡ配列（表２、図４における配列番号１１１〜１１８）のセットが設計されうる：３２〜３５０ｂｐサイズ範囲（例えば、それぞれ０、８、３１、５６、８１、１０６、１３１および３０６ｂｐの充填配列長を有する３２、５２、７５、１００、１２５、１５０、１７５および３５０ｂｐの断片）、固定された１６ｂｐのフォワード配列、フォワード配列とは異なる固定された１６ｂｐのリバース配列、ならびにユニーク６ｂｐフォワードおよびリバース配列。

ＧＣ含量スパイクインパネル
既知濃度でサンプルに添加され、ついで、処理後に測定された核酸（例えば、ＤＮＡ）は、収率およびプロセスに関する他の情報をもたらすことが可能であり、これらは、収率およびサンプル自体に関する追加的特性を推定するために使用されうる。例えば、あるサイズ範囲を含む核酸スパイクインセットはサンプル（例えば、血漿）に添加され、ついで抽出およびそれに続いて次世代シーケンシング（ＮＧＳ）に付されうる。各サイズスパイクの収率は、意図的なサイズ選択、温度および他の変性要因ならびにＰＣＲバイアスを含む、処理中の多数の要因に応じて変動しうる。この情報は、所望のサイズ範囲の回収を最大にすることを目的とした新規方法を開発するために、または既存プロセスをモニターする（例えば、品質管理）ために有用でありうる。

二本鎖ＤＮＡライブラリー調製物の場合、比較的低い融解温度（Ｔ_ｍ）のＤＮＡ二重鎖の変性は、Ｔ_ｍに反比例して、これらの二本鎖の収率を低下させる。与えられた条件（例えば、塩濃度、温度、ｐＨなど）において、二重鎖のＴ_ｍに影響を及ぼす寄与因子には、長さおよびＧＣ含量が含まれる。単一ＧＣ含量を有する単一種で各サイズが代表される、二重鎖のサイズ範囲は、種々の条件に対するＴ_ｍの応答に関する部分的な情報のみを提供しうる。

核酸の長さおよび／またはＧＣ含量が核酸のＴ_ｍおよび処理にどのように影響を及ぼすかに関する情報は、例えば、血中の種々の病原体からの短い無細胞断片の回収を推測するための代用物としてスパイクインを使用する場合に重要でありうる。病原体核酸はそれらのＧＣ含量において劇的に変動する可能性があり、したがって、短い断片長において非常に様々なＴ_ｍを有しうる。多数のｃｆＤＮＡ断片の短い長さ（例えば、３０、４０、５０ｂｐ）を考慮すると、それらは、例えばＮＧＳのための処理中の変性に感受性でありうる。広範なＴ_ｍ範囲にわたって回収を追跡するための、より詳細なスパイクインセットは、未知サンプルの出発量のより良好な推測を可能にしうる。

ある範囲のＴ_ｍ、ＧＣおよび／または長さにわたるスパイクイン核酸のパネルは、絶対的存在量の決定のために、および／または変性の詳細なモニターを可能にするために使用されうる。例えば、表３に示されているとおり、４つの異なる長さ（例えば、３２、４２、５２および７５ｂｐ）および各長さについて７つの異なるＧＣ含量（約２０、３０、４０、５０、６０、７０または８０％のＧＣ）を有する核酸を含む２８個の異なる核酸（例えば、二重鎖）のパネルが使用されうる。全体として、該パネルは、各サイズごとに単一のＧＣ含量を有するセットより高い細分性をもたらしうる。幾つかの場合には、合成核酸（ｄｓＤＮＡ、ｓｓＤＮＡ、ｄｓＲＮＡ、ｓｓＲＮＡ）のパネルは、少なくとも３個の異なる長さ、および各長さについて少なくとも２個の異なるＧＣ含量、少なくとも３個のＧＣ含量、少なくとも４個のＧＣ少なくとも５個のＧＣ含量、少なくとも７個のＧＣ含量または少なくとも１０個のＧＣ含量の核酸を含有しうる。幾つかの場合には、合成核酸（ｄｓＤＮＡ、ｓｓＤＮＡ、ｄｓＲＮＡ、ｓｓＲＮＡ）のパネルは、少なくとも５個の異なる長さ、および各長さについて少なくとも２個の異なるＧＣ含量、少なくとも３個のＧＣ含量、少なくとも４個のＧＣ少なくとも５個のＧＣ含量、少なくとも７個のＧＣ含量または少なくとも１０個のＧＣ含量の核酸を含有しうる。

幾つかの場合には、スパイクインパネルは、少なくとも３、５、１０、１５、２０、２５または３０個のユニーク核酸を含む。幾つかの場合には、スパイクインパネルは、多くとも１５、２０、２５、３０、３５、４０、４５、５０または１００個のユニーク核酸を含む。

種々のＧＣ含量を有するスパイクイン核酸が使用されうる。幾つかの場合には、スパイクインパネルは、約４０〜６０％のＧＣ、約４５〜６５％のＧＣ、約３０〜７０％のＧＣ、約２５〜７５％のＧＣ、または約２０〜８０％のＧＣの範囲にわたるＧＣ含有量を有する核酸を含む。幾つかの場合には、スパイクインパネルは、少なくとも２、３、４、５、６、７、８、９または１０個の異なるＧＣ含量を有する核酸を含む。幾つかの場合には、スパイクインパネルは、多くとも３、４、５、６、７、８、９、１０、１５または２０個の異なるＧＣ含量を有する核酸を含む。幾つかの場合には、スパイクインパネルは、ＧＣが少なくとも１、２、３、４、５、６、７、８、９、１０、１５または２０％異なる種々のＧＣ含有量を有する核酸を含む。ＧＣの百分率は、ＧヌクレオチドおよびＣヌクレオチドの数の和を配列内の総ヌクレオチド数で割り算することにより算出されうる。例えば、配列ＡＣＴＧの場合、ＧＣの百分率（％ＧＣ）は（１＋１）／４＝５０％ＧＣとして算出されるであろう。

種々の長さを有するスパイクイン核酸が使用されうる。幾つかの場合には、スパイクインパネルは、少なくとも３、４、５、６、７、８、９、１０または１５個の異なる長さを有する核酸を含む。幾つかの場合には、スパイクインパネルは、多くとも３、４、５、６、７、８、９、１０、１５、２０、２５、５０または１００個の異なる長さを有する核酸を含む。幾つかの場合には、スパイクインパネルは、約４０〜５０ｂｐ、約３５〜５５ｂｐ、約３０〜６０ｂｐ、約３５〜６０ｂｐ、約３５〜６５ｂｐ、約３５〜７０ｂｐ、約３５〜７５ｂｐ、約３０〜７０ｂｐ、約３０〜８０ｂｐ、約３０〜９０ｂｐ、約３０〜１００ｂｐ、約２５〜１５０ｂｐ、約２０〜３００ｂｐ、または約２０〜５００ｂｐの範囲にわたる長さを有する核酸を含む。幾つかの場合には、スパイクインパネルは、少なくとも１、２、３、４、５、６、７、８、９、１０、１５または２０ｂｐ異なる種々の長さを有する核酸を含む。幾つかの場合には、スパイクインパネルは、３２、４２、５２および７５ｂｐの長さ、または２７、３７、４７、５７、６２および６７ｂｐの長さを有する核酸を含む。

一連の値から選択された長さおよびＧＣ含量を有するスパイクイン核酸が使用されうる。例えば、合成核酸のセットは２以上の長さおよび２以上のＧＣ含量から選択されうる。表３における２８個の合成核酸のセット（配列番号１２５〜配列番号１５２）は４つの異なる長さ（例えば、３２、４２、５２および７５塩基対）および７つの異なるＧＣ含量（例えば、約２０、３０、４０、５０、６０、７０および８０％ＧＣ）から構成される。異なる長さ（例えば、２７、３７、４７、５７、６２および６７ｂｐ）および異なるＧＣ含量（例えば、約１５、２５、３５、４５、５５、６５および７５％ＧＣ）を用いて、合成核酸の類似セットが得られうる。

種々の融解温度（Ｔ_ｍ）を有するスパイクイン核酸が使用されうる。幾つかの場合には、スパイクインパネルは、約４０〜５０℃、約３５〜５５℃、約３０〜６０℃、約３５〜６０℃、約３５〜６５℃、約３５〜７０℃、約３５〜７５℃、または約３０〜７０℃の範囲にわたる融解温度（Ｔ_ｍ）を有する核酸を含む。幾つかの場合には、幾つかの場合には、スパイクインパネルは、少なくとも１、２、３、４、５、６、７、８、９、１０、１５、２０、２５または３０℃異なる種々の融解温度（Ｔ_ｍ）を有する核酸を含む。

幾つかの場合には、Ｔ_ｍは、二本鎖の長さおよびＧＣ含量に加えて、二本鎖濃度、ヌクレオチド配列の最近傍効果、高次ＤＮＡ構造、１価および／または２価カチオン濃度ならびにヌクレオチド濃度に基づいて計算されうる。幾つかの場合には、Ｔ_ｍは、与えられた条件、例えば、二本鎖ＤＮＡ特異的色素および温度の漸増および色素シグナルの検出に関して、実験的に計算されうる。

種々の配列を有するスパイクイン核酸が使用されうる。好ましくは、非天然もしくは非自然配列、またはサンプル核酸にハイブリダイズし得ない配列が使用される。幾つかの場合には、スパイクインパネルは、少なくとも３、４、５、６、７、８、９、１０または１５個の異なる配列を有する核酸を含む。幾つかの場合には、スパイクインパネルは、多くとも３、４、５、６、７、８、９、１０、１５、２０、２５、５０または１００個の異なる配列を有する核酸を含む。

種々の数のスパイクイン核酸が使用されうる。幾つかの場合には、約１、２、３、４、５、６、７、８、９、１０、１５、２０、２５、３０、４０または５０個の核酸が使用される。例えば、表３に列挙された２８個の配列のサブセット（例えば、３２／４２／５２／７５ｂｐ×２０／５０／８０％ＧＣ）が使用されうる。

ＲＮＡの用途には、ＲＮＡパネルが使用されうる。本明細書に記載されているとおり、ＲＮＡパネルは、同一分子、あるいは長さ、ＧＣ含量および／または他の特性に関して異なる多様な分子を含みうる。

８個のＤＮＡ配列のセット（それぞれ約５０％ＧＣである、表２における配列番号１１１〜１１８）は、表３に列挙された２８個のメンバーのＧＣパネルの部分的な適用範囲（カバレッジ）をもたらす。

縮重スパイクイン：スパンク（Ｓｐａｎｋ）
スパイクイン合成核酸は、核酸の縮重プール、または高い多様度を有する核酸のプールでありうる（本明細書においては「スパンク（Ｓｐａｎｋ）」と称されることもある）。一般に、スパンクは、配列決定反応につながるおよび／または配列決定反応を含むサンプル処理工程中に生じうる絶対的もしくは相対的な核酸損失または多様性減少を決定するために使用されうる。スパンク配列のユニークプールの場合、プール内の配列多様性の減少は核酸存在量の減少に直接対応するはずであり、この場合、増幅またはＰＣＲバイアスの影響を考慮する必要はない。例えば、１０^８個のユニークスパンク配列をサンプルに添加し、配列決定後に１０^４個のユニークスパンク配列しか回収されなかった場合、核酸の存在量および核酸の多様性は共に、１０^４分の１に減少したことになる。幾つかの場合には、スパンクは、重複分子の回収の度合を決定するために使用されうる。例えば、抽出およびライブラリー処理（これは種々の投入分子のＰＣＲおよび潜在的不均一増幅を含みうる）の後、個々のスパンクの配列決定およびアライメントは重複分子の回収の度合を示しうる。

ついで、決定された多様性減少を用いて、１以上のサンプル処理または配列決定工程の前に、初期サンプルにおける核酸（例えば、標的核酸）の絶対的存在量を決定することが可能である。幾つかの場合には、決定された多様性減少を用いて、初期サンプルにおける核酸の相対的存在量を決定する。図５に示されているとおり、サンプル核酸（Ｓ_１、Ｓ_２、．．．、Ｓ_ｍ）は、１以上のサンプル処理工程の前に、スパンク（Ｓｐａｎｋ）スパイクイン合成核酸（ＳＰ_１、ＳＰ_２、．．．、ＳＰ_ｎ）と一緒にされうる。例えば、約１０^８個のユニークスパンクがサンプルに添加されうる。サンプル処理（例えば、核酸抽出、精製、連結および／または末端修復）中に、サンプル核酸の一部および合成核酸の一部が失われうる。サンプル処理後、最初の１０^８個のユニーク配列のうちの約１０^６個のユニーク配列が残存しうる。ついで、これらの配列の一部、例えば１０^４個のユニーク配列が配列決定されうる。絶対的多様性減少は、最初のユニーク配列の数を配列決定または回収されたユニーク配列の数で割り算したものとして算出されうる（例えば、１０^８／１０^４＝１０^４）。同様に、回復値は、配列決定または回収されたユニーク配列の数を最初のユニーク配列の数で割り算したものとして算出されうる（例えば、１０^４／１０^８＝１０^−４）。算出された多様性減少は、初期サンプルにおける核酸の絶対的存在量を決定するために用いられうる。例えば、スパンク配列に関する及びサンプル配列に関する配列決定リード数は配列決定分析から決定可能であり、サンプルに添加されるスパンク配列の初期濃度または量は既知である。決定された多様性減少を用いて、初期サンプルにおける核酸（例えば、特定の生物、病原体、腫瘍または器官からの核酸）の初期濃度または量が決定されうる。元のサンプルにおけるサンプル核酸の絶対量は、サンプル核酸およびスパンク核酸に関する配列決定リードの最終的な数ならびに／またはスパンク核酸の最終的な多様性を測定し、元のサンプルに添加されたスパンク核酸の既知量または多様性に対して正規化することにより推定されうる。

ユニーク配列リードの数は種々の方法により決定されうる。例えば、識別タグを有する配列リードが特定（識別）されうる。ついで、識別タグを有する配列リード内のユニーク配列の数は、重複配列を重複排除（ｄｅ−ｄｕｐｌｉｃａｔｅ）（「デデュープ（ｄｅｄｕｐｅ）」）または除去することにより決定されうる。例えば、それらの配列を、可能な配列の参照データベースに対して又はお互いに対してアライメントさせて、どれが重複しているのか、およびどれがユニークである又は異なるのかを決定することが可能である。識別タグは典型的には配列間で保存されているため、各添加分子内に埋め込まれたランダム化配列領域が分析されうる。幾つかの場合には、スパンク核酸は識別タグを含まず、そのような場合には、スパンクは、例えば、既知配列を含むデータベースに対する参照またはアライメントのような他の方法により特定されうる。

スパンク配列は、相対的損失および／または絶対的損失をモニターするために使用されうる。幾つかの場合には、スパンク配列の多様性が十分に高い場合には、サンプルに添加されるスパンク配列は実質的に全て非ユニークであると仮定されうる。したがって、配列決定された重複スパンク配列が存在する場合、それはＰＣＲ増幅によるものであり、サンプルに添加された同じスパンク配列の複数コピーによるものではない可能性が高く、分析から除外されうる。また、各スパンク配列がユニークである場合、サンプルに最初に添加されたスパンク配列の総数は、サンプルに添加された核酸の濃度および体積に基づいて既知であり、配列決定後のユニークスパンク配列決定リードの総数は既知である。これらの値を一緒に使用して、多様性減少値または回収値が計算されうる。

本発明で提供する方法は、ボトルネック効果（ｐｏｐｕｌａｔｉｏｎｂｏｔｔｌｅｎｅｃｋ）または多様性の減少に関連するサンプル処理中の工程を特定する方法を含む。幾つかの場合には、ボトルネック効果が特定された場合、出発集団における最初は未知であったその他の分子に補正係数が適用されうる。例えば、投入スパンク分子は実質的に全てユニークであるが、回収されたスパンクは５０％しかユニークでない場合、これは、サンプルからのその他の分子の多様性の解釈に関する情報をもたらしうるボトルネック効果および多様性の減少を示す。

ボトルネック効果が生じる工程を特定するために、サンプル処理中の任意の工程において、スパンクの集合体（コレクション）がサンプルに添加されうる。例えば、サンプル（例えば、体液）を対象から採取した際に、スパンクの第１集合体を導入することが可能であり、採取サンプルの後続処理（例えば、残存細胞の除去、保存）の前または途中に、スパンクの第２集合体をサンプル内に導入することが可能であり、および／または、ライブラリーの製造の前に、スパンクの第３集合体を導入することが可能である。幾つかの場合には、サンプル処理中の異なる工程においてサンプルに添加されたスパンクの集合体は、同じまたは類似した組成を有する。幾つかの場合には、スパンクの別の集合体をサンプル処理中の異なる工程においてサンプルに添加する。

幾つかの場合には、スパンク核酸はそれぞれ、ユニーク配列を有するランダム化部分を含有しうる。スパンクは１以上の異なるドメインを含みうる。幾つかの場合には、スパンクは１以上のプロセスコード、１以上の多様性コード、１以上の長さ識別配列、１以上のロード（ｌｏａｄ）配列、１以上の合成核酸識別配列（またはスパンク識別配列）および／または１以上の特徴ドメインを含みうる。幾つかの場合には、スパンクは識別タグおよびユニーク核酸配列を含みうる。

スパンクの種々の集合体が使用される場合、各集合体は、特定の工程（例えば、サンプル採取、抽出、ライブラリー処理）においてサンプル内に導入されるスパンク集合体を識別するための「プロセスコード」でコードされうる。そのような場合においては、同一プロセスコードを有するスパンクは生物情報学的に分類され、多様性減少に関して分析されうる。ついで、特定の工程に関連する多様性減少の度合が決定され、ついで各サンプル処理工程にわたって比較されうる。

スパンクは、合成核酸またはスパンクの全プールまたは集合体に関連する「多様性コード」を含みうる。多様性コードドメインは、合成核酸のプール内の多様性の量を示すユニークコードでありうる。そのような場合においては、多様性プール内の各合成核酸は、プールの多様性の度合（例えば、１０^８個のユニーク配列）を示す配列でコードされうる。幾つかの場合、例えば、２以上の多様性プールが同一サンプルに関して使用される場合には、該多様性コードは、それらの２以上のプールにおける多様性減少を特定するために使用されうる。

幾つかの場合には、スパンクは、特定のスパンクプールまたは集合体のメンバーとしてスパンクを特定する１以上のコード（例えば、プロセスコード）を含みうる。幾つかの場合には、スパンクは、サンプルに最初に存在した核酸ではなくスパンクとしてスパンクを特定する１以上のスパンク識別ドメインを含みうる。本明細書に更に詳細に記載されているとおり、スパンクは特徴ドメイン、長さ識別子ドメイン（長さ識別ドメイン）およびロード（ｌｏａｄ）ドメインをも含みうる。

スパンクは、核酸の存在量を計算するため、または他の用途のために、単独で、または他の合成核酸と組合せて使用されうる。幾つかの場合には、スパンクは他の合成核酸と共に使用されうる。例えば、幾つかの場合には、スパンクのパネルおよびスパーク（Ｓｐａｒｋ）のパネルがサンプルに添加されうる。幾つかの場合には、サンプル識別核酸もサンプルに添加されうる。

スパンクプールは、好ましくは、核酸配列の多様な混合物を含む。したがって、スパンクプールは、多様性を最大にするように設計されうる。幾つかの場には、スパンクプールは、より一層大きなスパンクプールに由来する。例えば、幾つかの場合には、７５ｂｐのオリゴヌクレオチドは、２つの８ｂｐストリング（文字列）のＮ（例えば、等しい比率のＡ／Ｃ／Ｇ／Ｔ）を使用して合成されうる。スパンクは、（ｉ）１以上の識別タグと（ｉｉ）ユニーク核酸配列とを含む合成核酸でありうる。幾つかの場合には、ユニーク核酸配列は複数の縮重またはランダム位置であることが可能であり、例えば、図６に示されているとおり、１以上のヌクレオチドによって隔てられた８ｂｐストリングの縮重位置の２つのグループでありうる。２つの典型的な配列が表４に列挙されている。２つの８ｂｐストリングのＮを有するオリゴヌクレオチド設計は、４^１６＝４．３×１０^９個の異なるオリゴヌクレオチドのプールで、合計１６個のＮを含有する。例えば、このプールの１×１０^８個の分子が１ｍＬの血漿に添加され、ＩＤスパイクおよびスパークに関して前記で記載されているとおりに処理された場合には、スパンクのほぼ全てがユニークとなる。例えば、そのような場合には、スパンクの９０％超（すなわち、９０％を超える）、９５％超、９９％超がユニークでありうる。

幾つかの場合には、スパンク核酸は、少なくとも約２０、３０、４０、５０、６０、７０、７５、８０、９０、１００、１１０、１２０、１２５、１３０、１４０、１５０、１６０、１７０、１７５、１８０、１９０、２００、２５０、３００、３５０、４００、４５０、５００、６００、７００、８００、９００または１０００ヌクレオチド長でありうる。幾つかの場合には、スパンク核酸は、多くとも約２０、３０、４０、５０、６０、７０、７５、８０、９０、１００、１１０、１２０、１２５、１３０、１４０、１５０、１６０、１７０、１７５、１８０、１９０、２００、２５０、３００、３５０、４００、４５０、５００、６００、７００、８００、９００または１０００ヌクレオチド長でありうる。幾つかの場合には、スパンク核酸は約２０〜約１７５塩基対の範囲内の長さを有しうる。幾つかの場合には、スパンクセットにおける核酸は同じ長さを有する。幾つかの場合には、スパンクセットにおける核酸は２以上の異なる長さ（例えば、２、３、４、５個またはそれ以上の長さ）を有する。

幾つかの場合には、スパンク核酸は、少なくとも約５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９または３０個の縮重位置を有しうる。幾つかの場合には、スパンク核酸は、多くとも約１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９または３０個の縮重位置を有しうる。スパンク核酸は約５個〜約２５個の範囲内の数の縮重位置を有しうる。幾つかの場合には、縮重位置は連続的であり、分離しており、または２以上のグループ、例えば２、３、４または５個のグループに分割されうる。縮重位置が幾つかのグループに分割される幾つかの場合には、縮重位置はグループ間で均等に分割されることが可能であり（例えば、８ｂｐストリングの縮重位置の２つのグループで、合計１６個の縮重位置）、あるいはグループ間で不均等に分割されることが可能である（例えば、１つのグループは１０個の縮重位置で、別のグループは６個の縮重位置で、合計１６個の縮重位置）。縮重位置が幾つかのグループに分割される幾つかの場合には、それらのグループは１以上のヌクレオチドによって隔てられうる。幾つかの場合には、それらのグループは少なくとも約１、２、３、４、５、６、７、８、９、１０、１５、２０、３０、４０または５０個のヌクレオチドによって隔てられる。幾つかの場合には、それらのグループは少なくとも約１、２、３、４、５、６、７、８、９、１０、１５、２０、３０、４０または５０ヌクレオチドによって隔てられる。

幾つかの場合には、スパンク核酸は、少なくとも１×１０^３、１×１０^４、１×１０^５、１×１０^６、２×１０^６、３×１０^６、４×１０^６、５×１０^６、６×１０^６、７×１０^６、８×１０^６、９×１０^６、１×１０^７、２×１０^７、３×１０^７、４×１０^７、５×１０^７、６×１０^７、７×１０^７、８×１０^７、９×１０^７、１×１０^８、２×１０^８、３×１０^８、４×１０^８、５×１０^８、６×１０^８、７×１０^８、８×１０^８、９×１０^８、１×１０^９、２×１０^９、３×１０^９、４×１０^９、５×１０^９、６×１０^９、７×１０^９、８×１０^９、９×１０^９、１×１０^１０または１×１０^１１個のユニーク配列の多様性を有しうる。幾つかの場合には、スパンク核酸は、多くとも１×１０^６、２×１０^６、３×１０^６、４×１０^６、５×１０^６、６×１０^６、７×１０^６、８×１０^６、９×１０^６、１×１０^７、２×１０^７、３×１０^７、４×１０^７、５×１０^７、６×１０^７、７×１０^７、８×１０^７、９×１０^７、１×１０^８、２×１０^８、３×１０^８、４×１０^８、５×１０^８、６×１０^８、７×１０^８、８×１０^８、９×１０^８、１×１０^９、２×１０^９、３×１０^９、４×１０^９、５×１０^９、６×１０^９、７×１０^９、８×１０^９、９×１０^９、１×１０^１０または１×１０^１１個のユニーク配列の多様性を有しうる。幾つかの場合には、スパンク核酸は約１×１０^４〜約１×１０^１１個のユニーク配列の範囲内の多様性を有しうる。

トレーサー配列
実験室（検査室）由来の核酸（例えば、病原体ゲノムＤＮＡ）は、感染症診断試験の開発、立証、検証、アッセイ対照などのための標準として有用である。しかし、これらの同じ生物は臨床サンプル（例えば、病原体感染サンプル）中に存在しうるため、実験室由来の物質が、試験中に、臨床サンプルを交差汚染して、偽陽性判定を与える危険性があり、これは患者および医師に不正確な情報を与えうるだけでなく、ある病原体種に関しては、保健当局への法定の届出をも生じさせうるであろう。実際の参照核酸（例えば、実際の病原体ゲノムＤＮＡ、癌核酸、腫瘍核酸または他の疾患関連核酸）は陽性対照として有用であり、または更には不可欠であるが、それを取り扱う際の通常の又は更には特別な注意は、次世代シーケンシング（ＮＧＳ）のような高感度アッセイの場合には特に、交差汚染を予防するのには不十分でありうる。

天然に存在しない又はサンプル核酸にハイブリダイズし得ない合成トレーサー核酸は、陽性対照核酸と少なくとも同程度に高い有効濃度で、陽性対照核酸ストックに添加されうる。トレーサーおよび陽性対照核酸は、それらが同じ様態で処理され検出されるような形態で存在する。したがって、エンドポイント（例えば、ＮＧＳの場合のアライメントされた配列リード）はトレーサーおよび陽性対照核酸の両方に関して同じであり、トレーサーは、より高いその有効濃度ゆえに、陽性対照核酸と少なくとも同じくらい容易に検出される。幾つかの場合には、陽性対照核酸は病原体ゲノムＤＮＡである。幾つかの場合には、陽性対照核酸は発癌遺伝子のような疾患関連核酸を含む。

トレーサー配列は、例えば配列、長さ、濃度、ＧＣ含量などのような１以上の特性において変動可能である。表５に示され実施例６で使用される配列は約５０％のＧＣ含量を有するが、トレーサー配列は、それが組合される陽性対照またはゲノムの組成に合致するように変動可能であり、例えば、３０％のＧＣ含量、３５％のＧＣ含量、４０％のＧＣ含量、４５％のＧＣ含量、５０％のＧＣ含量、５５％のＧＣ含量、６０％のＧＣ含量、６５％のＧＣ含量、または７０％のＧＣ含量を有しうる。

幾つかの場合には、トレーサー配列は、例えば実施例６に記載されているとおり、断片化後の陽性対照核酸またはゲノムＤＮＡに添加されうる。幾つかの場合には、陽性対照核酸またはサンプル核酸に対して行われる完全な処理をより良好に表すために、トレーサー配列は断片化前の陽性対照核酸またはゲノムＤＮＡに添加されうる。臨床サンプル（例えば、病原体ＤＮＡ）において稀であり低濃度で見出される陽性対照核酸は、未標識核酸での交差汚染を最小にするために、可能な限り早くトレーサー配列で標識されうる。

幾つかの場合には、２以上のトレーサー配列が各陽性対照核酸に添加される。幾つかの場合には、２以上、３以上、４以上または５以上のトレーサー配列が、同じ濃度または異なる濃度で添加される。

用途によって異なる形態のトレーサー配列が使用されうる。例えば、トレーサー配列の長さは、対照配列の長さに、例えば平均または中央値の長さに一致させることが可能である。幾つかの場合には、トレーサー配列の長さは対照配列の平均または中央値の長さの５％、１０％または２０％以内でありうる。

ＲＮＡ用途にはＲＮＡトレーサー配列が使用されうる。

分子ＬＩＭＳ
実験室情報管理システム（ＬＩＭＳ）は、消耗品の消費および使用を追跡する方法であり、幾つかの場合には、与えられた実験に必要な化学物質または試薬、および与えられた実験に必要な化学物質または試薬のみがその実験に使用されたことを保証するための方法である。ＬＩＭＳは、実験の各繰り返しに使用される化学物質のロット番号を追跡するのにも役立ちうる。これらの機能（例えば、ロット番号の追跡）は全て、例えば単一の化学物質の品質が低下した場合または誤った試薬が実験で使用された場合、実験の失敗の問題解決を助けうる。

ＬＩＭＳシステムは、プロセスにおいて使用される各消耗品に関するカタログ番号およびロット番号を実験室員が入力する電子的またはウェブアプリケーションとして設計されうる。典型的には、該プロセスを促進し、その精度を高めるために、バーコードが使用される。しかし、人為的な誤りが尚も、反応の所与反復に関する不完全な記録をもたらしうる。

試薬、特に試薬、試薬ロット、アリコート、または出荷品を分子的に標識する方法を本発明で提供する。幾つかの場合には、該方法は、種々の試薬の異なる容器を分子的にバーコード化するための、スパイクイン合成核酸の使用を含む。例えば、ユニーク配列（例えば、非ヒト、非病原体）を有するスパイクイン核酸または短い核酸オリゴマー（例えば、５０〜１００ｂｐ）を各試薬、試薬ロット、試薬アリコートまたは試薬出荷品に添加することは、個々のライブラリーを製造するために使用されるために使用される試薬の在庫を追跡するのに役立ちうる。幾つかの場合には、１以上のＩＤスパイク（Ｓｐｉｋｅ）、スパーク（Ｓｐａｒｋ）またはスパンク（Ｓｐａｎｋ）配列が分子ＬＩＭＳに使用されうる。ついで、各サンプルの処理において使用されるロット番号および試薬が配列決定によって自動的に検出されることが可能であり、例えば、成功した実施において使用されたロット番号と比較すること、またはそのサンプルの処理において使用される欠如している若しくは余分な試薬を特定することにより、問題のある実施の問題解決に使用されることが可能である。

同様に、特定の試薬、試薬ロット番号、アリコートまたは出荷品に関連するスパイクイン核酸の検出は、成功する配列決定実施において使用される試薬のロット番号、アリコートまたは出荷品を特定するために用いられうる。幾つかの場合には、核酸またはスパイクインは配列決定以外の方法により検出されることが可能であり、例えば、１以上の蛍光プローブで標識された一般的なポリマーが、蛍光を用いて検出されうる。

ＤＮＡオリゴマーは多数の水溶液に有効でありうるが、ＤＮアーゼ作用を受けない核酸オリゴマー（例えば、ＲＮＡ、修飾主鎖を有するＤＮＡオリゴマー）がＤＮアーゼ含有溶液のために設計されうる。同様に、ＲＮアーゼに抵抗性の合成核酸（例えば、ＤＮＡ）が、ＲＮアーゼ含有溶液を追跡するために使用されうる。

核酸の富化およびライブラリーの製造
本発明で提供する方法においては、核酸は、当技術分野で公知の任意の手段を用いて、サンプルから単離されうる。例えば、核酸は、液体抽出（例えば、トリゾール（Ｔｒｉｚｏｌ）、ＤＮＡｚｏｌ）技術を用いて抽出されうる。核酸は、商業的に入手可能なキット［ＱＩＡａｍｐ循環核酸キット（ＣｉｒｃｕｌａｔｉｎｇＮｕｃｌｅｉｃＡｃｉｄＫｉｔ）、ＱｉａｇｅｎＤＮｅａｓｙキット、ＱＩＡａｍｐキット、ＱｉａｇｅｎＭｉｄｉキット、ＱＩＡｐｒｅｐ］を使用することによっても抽出されうる。

核酸は、単なる例示として遠心分離を含む公知方法により濃縮または沈殿されうる。核酸は、精製目的で、選択的膜（例えば、シリカ）に結合されうる。核酸は、所望の長さの断片、例えば、１０００、５００、４００、３００、２００または１００塩基対長未満の断片に関しても富化されうる。サイズに基づくそのような富化は、例えば、ＰＥＧ誘導沈殿、電気泳動ゲルまたはクロマトグラフィー材（Ｈｕｂｅｒら（１９９３）ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．２１：１０６１−６）、ゲル濾過クロマトグラフィーまたはＴＳＫゲル（Ｋａｔｏら（１９８４）Ｊ．Ｂｉｏｃｈｅｍ，９５：８３−８６）（それらの刊行物の全体をあらゆる目的で参照により本明細書に組み入れることとする）を使用して行われうる。

核酸サンプルは、標的ポリヌクレオチド、特に、炎症または感染に関連する標的核酸に関して富化されうる。幾つかの好ましい場合には、標的核酸は病原体核酸（例えば、無細胞病原体核酸）である。幾つかの好ましい場合には、標的核酸は、子宮、心臓、肺、腎臓、胎児脳、肝臓または子宮頸組織（これらに限定されるものではない）を含む特定の器官または組織に関連する無細胞ＲＮＡである。

標的富化は、当技術分野で公知の任意の手段によるものでありうる。例えば、核酸サンプルは、標的特異的プライマー（例えば、病原体核酸に特異的なプライマー）を使用して標的配列を増幅することにより富化されうる。標的増幅は、当技術分野で公知の任意の方法またはシステムを使用して、デジタルＰＣＲ形態で行われうる。核酸サンプルは、標的選択的オリゴヌクレオチドが固定化されたアレイ上に標的配列を捕捉することにより富化されうる。核酸サンプルは、溶液中に遊離した又は固体支持体上の標的選択的オリゴヌクレオチドにハイブリダイズさせることにより富化されうる。オリゴヌクレオチドは、捕捉試薬による捕捉を可能にする捕捉部分を含みうる。幾つかの実施形態においては、核酸サンプルは標的ポリヌクレオチドに関しては富化されず、例えば、全ゲノムを表す。

幾つかの場合には、標的（例えば、病原体器官）核酸は、例えばプルダウン（ｐｕｌｌ−ｄｏｗｎ）（例えば、ビオチンタグのような標識に結合した相補的オリゴヌクレオチドに標的核酸をハイブリダイズさせ、そして、例えば、固体支持体に結合したアビジンまたはストレプトアビジンを使用することにより、プルダウンアッセイにおいて標的核酸を優先的にプルダウンさせること）、標的化ＰＣＲまたは他の方法により、サンプル中のバックグラウンド（例えば、対象、健常組織）核酸に対して富化されうる。富化技術の例には、（ａ）核酸のサンプルにおける主要集団がサンプルにおける少数集団より迅速に自己ハイブリダイズする、自己ハイブリダイゼーション技術、（ｂ）遊離ＤＮＡからのヌクレオソーム関連ＤＮＡの枯渇、（ｃ）特定の長さ間隔のＤＮＡを除去および／または単離すること、（ｄ）エキソソーム枯渇または富化、ならびに（ｅ）関心領域の戦略的捕捉が含まれるが、これらに限定されるものではない。

幾つかの場合には、富化工程は、（ａ）宿主からの核酸のサンプルを準備すること（ここで、宿主からの核酸のサンプルは宿主からの一本鎖核酸のサンプルであり、宿主核酸および非宿主核酸を含む）、（ｂ）宿主からの一本鎖核酸の少なくとも一部を再生させ、それにより、サンプルにおける二本鎖核酸の集団を生成させること、および（ｃ）ヌクレアーゼを使用してサンプル内の二本鎖核酸の少なくとも一部を取り出し、それにより、宿主からの核酸のサンプルにおける非宿主配列を富化させることを含む。幾つかの場合には、富化工程は、（ａ）宿主からの核酸のサンプルを準備すること（ここで、宿主からの核酸のサンプルは、ヌクレオソームに関連する宿主核酸および非宿主核酸を含む）、および（ｂ）ヌクレオソームに関連する宿主核酸の少なくとも一部を除去し、それにより、宿主からの核酸のサンプルにおける非宿主核酸を富化することを含む。幾つかの場合には、富化工程は、（ａ）宿主からの核酸のサンプルを準備すること（ここで、宿主からの核酸のサンプルは宿主核酸および非宿主核酸を含む）、および（ｂ）１以上の長さ間隔のＤＮＡを除去または単離し、それにより、宿主からの核酸のサンプルにおける非宿主核酸を富化することを含む。幾つかの場合には、富化工程は、（ａ）宿主からの核酸のサンプルを準備すること（ここで、宿主からの核酸のサンプルは宿主核酸、非宿主核酸およびエキソソームを含む）、および（ｂ）エキソソームの少なくとも一部を除去または単離し、それにより、宿主からの核酸のサンプルにおける非宿主配列を富化することを含む。幾つかの場合には、富化工程は、約３００塩基長以上の長さを有する核酸をサンプルから優先的に除去することを含む。幾つかの場合には、富化工程は、サンプルからの非宿主核酸を優先的に増幅または捕捉することを含む。

富化工程は、約１２０、約１５０、約２００または約２５０塩基長以上の核酸をサンプルから優先的に除去することを含みうる。幾つかの場合には、富化工程は、約１０塩基〜約６０塩基長、約１０塩基〜約１２０塩基長、約１０塩基〜約１５０塩基長、約１０塩基〜約３００塩基長、約３０塩基〜約６０塩基長、約３０塩基〜約１２０塩基長、約３０塩基〜約１５０塩基長、約３０塩基〜約２００塩基長、または約３０塩基〜約３００塩基長の、サンプルからの核酸を優先的に富化することを含む。幾つかの場合には、富化工程は、宿主（例えば、対象）からの核酸を優先的に消化させることを含む。幾つかの場合には、富化工程は、非宿主核酸を優先的に複製させることを含む。

幾つかの場合には、富化工程は、宿主（例えば、対象）核酸に対する非宿主核酸の比率を、少なくとも２倍、少なくとも３倍、少なくとも４倍、少なくとも５倍、少なくとも６倍、少なくとも７倍、少なくとも８倍、少なくとも９倍、少なくとも１０倍、少なくとも１１倍、少なくとも１２倍、少なくとも１３倍、少なくとも１４倍、少なくとも１５倍、少なくとも１６倍、少なくとも１７倍、少なくとも１８倍、少なくとも１９倍、少なくとも２０倍、少なくとも３０倍、少なくとも４０倍、少なくとも５０倍、少なくとも６０倍、少なくとも７０倍、少なくとも８０倍、少なくとも９０倍、少なくとも１００倍、少なくとも１０００倍、少なくとも５０００倍または少なくとも１０，０００倍増加させる。幾つかの場合には、富化工程は、宿主（例えば、対象）核酸に対する非宿主核酸の比率を少なくとも１０倍増加させる。幾つかの場合には、富化工程は宿主（例えば、対象）核酸に対する非宿主核酸の比率を約１０倍〜約１００倍増加させる。

幾つかの場合には、核酸ライブラリーを製造する。核酸ライブラリーは一本鎖核酸ライブラリーまたは二本鎖核酸ライブラリーでありうる。幾つかの場合には、一本鎖核酸ライブラリーは一本鎖ＤＮＡライブラリー（ｓｓＤＮＡライブラリー）またはＲＮＡライブラリーでありうる。幾つかの場合には、二本鎖核酸ライブラリーは二本鎖ＤＮＡライブラリー（ｄｓＤＮＡライブラリー）である。ｓｓＤＮＡライブラリーの製造方法は、二本鎖ＤＮＡ断片をｓｓＤＮＡ断片に変性させ、プライマードッキング配列をｓｓＤＮＡ断片の一端に連結し、プライマーを該プライマードッキング配列にハイブリダイズさせることを含みうる。プライマーは、次世代シーケンシングプラットフォームと組合されるアダプター配列の少なくとも一部を含みうる。該方法は更に、ハイブリダイズしたプライマーを伸長させて二本鎖を生成させることを含むことが可能であり、ここで、該二本鎖は元のｓｓＤＮＡ断片および伸長プライマー鎖を含む。該伸長プライマー鎖は元のｓｓＤＮＡ断片から分離されうる。該伸長プライマー鎖は回収可能であり、ここで、該伸長プライマー鎖はｓｓＤＮＡライブラリーのメンバーである。ＲＮＡライブラリーの製造方法は、プライマードッキング配列をＲＮＡ断片の一端に連結し、プライマーをプライマードッキング配列にハイブリダイズさせることを含みうる。プライマーは、次世代シーケンシングプラットフォームと組合されるアダプター配列の少なくとも一部を含みうる。該方法は更に、ハイブリダイズしたプライマーを伸長させて二本鎖を生成させることを含むことが可能であり、ここで、該二本鎖は元のＲＮＡ断片および伸長プライマー鎖を含む。該伸長プライマー鎖は元のＲＮＡ断片から分離されうる。該伸長プライマー鎖は回収可能であり、ここで、該伸長プライマー鎖はＲＮＡライブラリーのメンバーである。ｄｓＤＮＡライブラリーの製造方法は、アダプター配列をｄｓＤＮＡ断片の一端または両端に連結することを含みうる。

種々の態様においては、ｄｓＤＮＡは、当技術分野で公知の又は本明細書に記載されている任意の手段により断片化されうる。幾つかの場合においては、ｄｓＤＮＡは物理的手段（例えば、機械的剪断、噴霧または超音波処理）、酵素的手段または化学的手段により断片化されうる。

幾つかの実施形態においては、ＲＮＡからｃＤＮＡを生成させる。例えば、ランダムプライム逆転写（ＲＮアーゼＨ＋）を用いて、ランダムなサイズのｃＤＮＡを得ることにより、ｃＤＮＡを生成させることが可能である。

核酸の長さは様々でありうる。核酸または核酸断片（例えば、ｄｓＤＮＡ断片、ＲＮＡ、またはランダムなサイズのｃＤＮＡ）は、１０００ｂｐ未満、８００ｂｐ未満、７００ｂｐ未満、６００ｂｐ未満、５００ｂｐ未満、４００未満ｂｐ、３００ｂｐ未満、２００ｂｐ未満または１００ｂｐ未満である。ＤＮＡ断片は約４０〜約１００ｂｐ、約５０〜約１２５ｂｐ、約１００〜約２００ｂｐ、約１５０〜約４００ｂｐ、約３００〜約５００ｂｐ、約１００〜約５００、約４００〜約７００ｂｐ、約５００〜約８００ｂｐ、約７００〜約９００ｂｐ、約８００〜約１０００ｂｐ、または約１００〜約１０００ｂｐである。幾つかの場合には、核酸または核酸断片（例えば、ｄｓＤＮＡ断片、ＲＮＡ、またはランダムなサイズのｃＤＮＡ）は約２０〜約２００ｂｐの範囲内、例えば約４０〜約１００ｂｐの範囲内でありうる。

ｄｓＤＮＡ断片の末端はポリッシュ（ｐｏｌｉｓｈ）（例えば、平滑末端化）されうる。ＤＮＡ断片の末端はポリメラーゼでの処理によりポリッシュされうる。ポリッシュは、３’オーバーハング（突出）の除去、５’オーバーハングの補充（フィルイン；ｆｉｌｌ−ｉｎ）またはそれらの組合せを含みうる。ポリメラーゼはプルーフリーディングポリメラーゼ（例えば、３’から５’へのエキソヌクレアーゼ活性を含む）でありうる。プルーフリーディングポリメラーゼは、例えば、Ｔ４ＤＮＡポリメラーゼ、Ｐｏｌ１クレノー断片またはＰｆｕポリメラーゼでありうる。ポリッシュは、当技術分野で公知の任意の手段を用いて損傷ヌクレオチド（例えば、脱塩基部位）を除去することを含みうる。

核酸断片の３’末端へのアダプターの連結は該断片の３’ＯＨ基とアダプターの５’ホスファートとの間の結合の形成を含みうる。したがって、核酸断片からの５’ホスファートの除去は２つのライブラリーメンバーの異常連結を最小限に抑えうる。したがって、幾つかの実施形態においては、５’ホスファートが核酸断片から除去される。幾つかの実施形態においては、５’ホスファートはサンプルにおける核酸断片の少なくとも５０％、５５％、６０％、６５％、７０％、７５％、８０％、８５％、９０％、９５％または９５％超から除去される。幾つかの実施形態においては、実質的に全てのホスファート基（リン酸基）が核酸断片から除去される。幾つかの実施形態においては、実質的に全てのホスファートがサンプルにおける核酸断片の少なくとも５０％、５５％、６０％、６５％、７０％、７５％、８０％、８５％、９０％、９５％または９５％超から除去される。核酸サンプルからのホスファート基の除去は、当技術分野で公知の任意の手段によるものでありうる。ホスファート基の除去は、サンプルを熱不安定性ホスファターゼで処理することを含みうる。幾つかの実施形態においては、ホスファート基は核酸サンプルから除去されない。幾つかの実施形態においては、核酸断片の５’末端へのアダプターの連結が行われる。

配列決定（シーケンシング）
本開示は核酸の分析方法を提供する。そのような分析方法は核酸の配列決定および配列決定結果の生物情報学的（バイオインフォマティクス）分析を含む。本方法により得られた核酸は、ゲノム、エピジェネティック（例えば、メチル化）およびＲＮＡ発現を含む種々のタイプの情報を得るために分析されうる。メチル化分析は、例えば、メチル化塩基の変換およびそれに続くＤＮＡ配列決定により行われうる。ＲＮＡ発現分析は、例えば、ポリヌクレオチドアレイハイブリダイゼーション、ＲＮＡ配列決定技術、またはＲＮＡから生成されたｃＤＮＡの配列決定により行われうる。

好ましい実施形態においては、配列決定は、次世代シーケンシングアッセイを用いて行われる。本明細書中で用いる「次世代」なる語は当技術分野において十分に理解されており、一般に、限定的なものではないが以下の１以上を含む任意のハイスループット配列決定アプローチを意味する：大規模並列シグネチャー配列決定、ピロシーケンス（例えば、Ｒｏｃｈｅ４５４配列決定装置を使用するもの）、イルミナ（Ｉｌｌｕｍｉｎａ）（ソレクサ（Ｓｏｌｅｘａ））配列決定、合成による配列決定（Ｉｌｌｕｍｉｎａ）、イオントレント（Ｉｏｎｔｏｒｒｅｎｔ）配列決定、連結による配列決定（例えば、ＳＯＬｉＤ配列決定）、単分子リアルタイム（ＳＭＲＴ）配列決定（例えば、ＰａｃｉｆｉｃＢｉｏｓｃｉｅｎｃｅ）、ポロニー（ｐｏｌｏｎｙ）配列決定、ＤＮＡナノボール（ｎａｎｏｂａｌｌ）配列決定、ヘリスコープ単分子（ｈｅｌｉｓｃｏｐｅｓｉｎｇｌｅｍｏｌｅｃｕｌｅ）配列決定（ＨｅｌｉｃｏｓＢｉｏｓｃｉｅｎｃｅｓ）およびナノポア（ｎａｎｏｐｏｒｅ）配列決定（例えば、ＯｘｆｏｒｄＮａｎｏｐｏｒｅ）。幾つかの場合には、配列決定アッセイはナノポア配列決定を用いる。幾つかの場合には、配列決定アッセイはサンガー配列決定の幾つかの形態を含む。幾つかの場合には、配列決定はショットガン配列決定を含み、幾つかの場合には、配列決定はブリッジ（ｂｒｉｄｇｅ）ＰＣＲを含む。幾つかの場合には、配列決定は広域スペクトルである。幾つかの場合には、配列決定は標的化される。

幾つかの場合には、配列決定アッセイはギルバートの配列決定法を含む。そのようなアプローチにおいては、核酸（例えば、ＤＮＡ）を化学修飾し、ついで特定の塩基において切断する。幾つかの場合には、配列決定アッセイはジデオキシヌクレオチド鎖終結またはサンガー配列決定を含む。

本発明で提供する方法においては、合成による配列決定アプローチが用いられうる。幾つかの場合においては、蛍光標識可逆的ターミネーターヌクレオチドを、ガラスフローセルの表面上に固定化されたクローン増幅ＤＮＡ鋳型に導入する。各配列決定サイクル中に、単一の標識デオキシヌクレオシド三リン酸（ｄＮＴＰ）が核酸鎖に付加されうる。標識ターミネーターヌクレオチドは、塩基を特定するために、添加されたらイメージングされることが可能であり、ついで酵素的に切断されて、次のヌクレオチドの取り込みを可能にしうる。全４個の可逆的ターミネーター結合ｄＮＴＰ（Ａ、Ｃ、Ｔ、Ｇ）は、一般に、単一の分離した分子として存在するため、自然競合が取り込みバイアスを最小にしうる。

幾つかの場合には、単一分子リアルタイム（ＳＭＲＴ）と称される方法を用いる。そのようなアプローチにおいては、核酸（例えば、ＤＮＡ）をゼロモード導波路（ＺＭＷ）において合成する。ＺＭＷは、ウェルの底部に位置する捕捉手段を含有する小さなウェル様容器である。未修飾ポリメラーゼ（ＺＭＷ底部に結合している）および溶液中で自由流動する蛍光標識ヌクレオチドを使用して、配列決定を行う。蛍光標識は、ＤＮＡ鎖内への取り込みに際してヌクレオチドから分離され、未修飾ＤＮＡ鎖が残る。ついで、カメラのような検出器を使用して、発光を検出することが可能である。データを生物情報学的に分析して、配列情報を得ることが可能である。

幾つかの場合においては、連結アプローチによる配列決定を用いて、サンプルにおける核酸を配列決定する。一例としては、ＳＯＬｉＤ［オリゴヌクレオチド連結および検出による配列決定（ＳｅｑｕｅｎｃｉｎｇｂｙＯｌｉｇｏｎｕｃｌｅｏｔｉｄｅＬｉｇａｔｉｏｎａｎｄＤｅｔｅｃｔｉｏｎ）］配列決定（ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓ）の次世代シーケンシング法が挙げられる。この次世代技術は数億個〜数十億個の小さな配列リード（ｒｅａｄ）を同時に生成しうる。該配列決定方法は、配列決定されるべきサンプルからＤＮＡ断片のライブラリーを製造することを含みうる。幾つかの場合には、該ライブラリーを使用して、各ビーズ（例えば、磁気ビーズ）の表面上にただ１つの種の断片が存在するクローンビーズ集団を調製する。磁気ビーズに結合した断片は、各断片の出発配列が既知かつ同一となるように結合した汎用Ｐ１アダプター配列を有しうる。幾つかの場合には、該方法は更に、ＰＣＲまたはエマルジョンＰＣＲを含みうる。例えば、エマルジョンＰＣＲは、ＰＣＲ用の試薬を含有するマイクロリアクターの使用を含みうる。ついで、ビーズに結合した得られたＰＣＲ産物をガラススライドに共有結合させることが可能である。配列決定アッセイ、例えばＳＯＬｉＤ配列決定アッセイまたは連結アッセイによる他の配列決定は、プライマーの使用を含む工程を含みうる。プライマーはＰ１アダプター配列またはライブラリー鋳型内の他の配列にハイブリダイズしうる。該方法は更に、配列決定プライマーへの連結に関して競合する４つの蛍光標識二塩基プローブを導入することを含みうる。該二塩基プローブの特異性は、各連結反応における各第１および第２塩基をイントロゲート（ｉｎｔｅｒｒｏｇａｔｅ）することにより達成されうる。連結、検出および切断の複数のサイクルが、最終的なリード長を決定するサイクル数で行われうる。幾つかの場合には、一連の連結サイクルの後、伸長産物を除去し、第２ラウンドの連結サイクルのために、ｎ−１位に相補的なプライマーを使用して、鋳型を再配置する。各配列タグのために、複数ラウンド（例えば、５ラウンド）のプライマー再配置が完了されうる。プライマー再配置プロセスを通じて、各塩基は、２つの異なるプライマーによる２つの独立した連結反応においてイントロゲートされうる。例えば、リード位置５における塩基は、連結サイクル２においてはプライマー番号２によって、そして連結サイクル１においてはプライマー番号３によってアッセイされる。

該実施形態のいずれかにおいては、オリゴヌクレオチドの検出または定量分析は配列決定により達成されうる。サブユニットまたは全合成オリゴヌクレオチドは、本明細書に記載されている配列決定方法を含む当技術分野で公知の任意の適切な方法（例えば、ＩｌｌｕｍｉｎａＨｉＳｅｑ２５００）による全オリゴヌクレオチドの完全な配列決定により検出されうる。

配列決定は、当技術分野でよく知られた古典的なサンガー配列決定法により達成されうる。配列決定は、ハイスループット系を使用することによっても達成可能であり、それらのうちの幾つかは、配列決定ヌクレオチドが、成長中の鎖内へのその取り込みの直後または該取り込みに際して検出されること（例えば、リアルタイムまたは実質的にリアルタイムでの配列の検出）を可能にする。幾つかの場合には、ハイスループット配列決定は、１時間当たり少なくとも１，０００、少なくとも５，０００、少なくとも１０，０００、少なくとも２０，０００、少なくとも３０，０００、少なくとも４０，０００、少なくとも５０，０００、少なくとも１００，０００または少なくとも５００，０００個の配列リード（ｒｅａｄ）を生成する。幾つかの場合には、各リードはリード当たり少なくとも５０、少なくとも６０、少なくとも７０、少なくとも８０、少なくとも９０、少なくとも１００、少なくとも１２０または少なくとも１５０塩基である。幾つかの場合には、各リードはリード当たり多くとも２０００、多くとも１０００、多くとも９００、多くとも８００、多くとも７００、多くとも６００、多くとも５００、多くとも４００、多くとも３００、多くとも２００または多くとも１００塩基である。長いリード配列決定は、例えば、５００塩基より長い、８００塩基より長い、１０００塩基より長い、１５００塩基より長い、２０００塩基より長い、３０００塩基より長い、または４５００より長い連続配列リードを与える配列決定を含みうる。

幾つかの場合には、ハイスループット配列決定は、ＩｌｌｕｍｉｎａのＧｅｎｏｍｅＡｎａｌｙｚｅｒＩＩＸ、ＭｉＳｅｑパーソナルシーケンサー、またはＨｉＳｅｑシステム、例えば、ＨｉＳｅｑ２５００、ＨｉＳｅｑ１５００、ＨｉＳｅｑ２０００もしくはＨｉＳｅｑ１０００を使用するものにより利用可能な技術の使用を含む。これらの装置は、合成化学による可逆的ターミネーターベース配列決定を利用する。これらの装置は８日間で２，０００億個以上のＤＮＡの読取りを行いうる。より小さいシステムは、３日、２日もしくは１日以内またはそれより短い時間内の実施のために利用されうる。短い合成サイクルは、配列決定結果を得るために要する時間を最小するために用いられうる。

幾つかの場合には、ハイスループット配列決定は、ＡＢＩＳｏｌｉｄＳｙｓｔｅｍにより利用可能な技術の使用を含む。この遺伝子解析プラットフォームは、ビーズに結合したクローン増幅ＤＮＡ断片の大規模並列配列決定を可能にしうる。該配列決定方法は色素標識オリゴヌクレオチドとの連続的連結に基づく。

次世代シーケンシングはイオン半導体配列決定（例えば、ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓ（ＩｏｎＴｏｒｒｅｎｔ）の技術を利用するもの）を含みうる。イオン半導体配列決定は、ヌクレオチドがＤＮＡ鎖内に取り込まれる際にイオンが放出されうるという事実を利用しうる。イオン半導体配列決定を行うために、微細加工ウェルの高密度アレイを形成させることが可能である。各ウェルは単一ＤＮＡ鋳型を保持しうる。ウェルの下にはイオン感受性層が存在することが可能であり、イオン感受性層の下にはイオンセンサーが存在することが可能である。ヌクレオチドがＤＮＡに加えられると、Ｈ＋が放出される可能性があり、これはｐＨの変化として測定されうる。Ｈ＋イオンは電圧に変換され、半導体センサにより記録されうる。アレイチップは１ヌクレオチドずつ連続的に水に浸されうる。スキャン、ライト、カメラは不要でありうる。幾つかの場合には、ＩＯＮＰＲＯＴＯＮ（商標）シーケンサーが、核酸を配列決定するために使用される。幾つかの場合には、ＩＯＮＰＧＭ（商標）Ｓｅｑｕｅｎｃｅｒが使用される。イオン・トレント・パーソナル・ゲノム・マシン（ＩｏｎＴｏｒｒｅｎｔＰｅｒｓｏｎａｌＧｅｎｏｍｅＭａｃｈｉｎｅ）（ＰＧＭ）は２時間で１，０００万の読取りを行いうる。

幾つかの場合には、ハイスループット配列決定は、ＨｅｌｉｃｏｓＢｉｏＳｃｉｅｎｃｅｓＣｏｒｐｏｒａｔｉｏｎ（Ｃａｍｂｒｉｄｇｅ，Ｍａｓｓａｃｈｕｓｅｔｔｓ）により利用可能な技術、例えば、合成による単一分子配列決定（ＳｉｎｇｌｅＭｏｌｅｃｕｌｅＳｅｑｕｅｎｃｉｎｇｂｙＳｙｎｔｈｅｓｉｓ）（ＳＭＳＳ）法の使用を含む。ＳＭＳＳは、ヒトゲノム全体を２４時間以内に配列決定することを可能にしうる。ＳＭＳＳは、ＭＩＰ技術と同様に、ハイブリダイゼーションの前に前増幅工程を要しないであろう。ＳＭＳＳは増幅を要しないであろう。ＳＭＳＳは、米国特許出願公開第２００６００２４７１１号、第２００６００２４６７８号、第２００６００１２７９３号、第２００６００１２７８４号および第２００５０１００９３２号に部分的に記載されている。

幾つかの場合には、ハイスループット配列決定は、４５４Ｌｉｆｅｓｃｉｅｎｃｅｓ、Ｉｎｃ．（Ｂｒａｎｆｏｒｄ，Ｃｏｎｎｅｃｔｉｃｕｔ）により利用可能な技術、例えばＰｉｃｏＴｉｔｅｒＰｌａｔｅ装置の使用を含み、該装置は、該装置内のＣＣＤカメラにより記録される、配列決定反応により生成された化学発光シグナルを伝達する光ファイバープレートを含む。光ファイバーのこの使用は４．５時間で少なくとも２，０００万塩基対の検出を可能にしうる。

ビーズ増幅およびそれに続く光ファイバー検出を使用するための方法は、Ｍａｒｇｕｉｌｅｓ，Ｍ．ら，“Ｇｅｎｏｍｅｓｅｑｕｅｎｃｉｎｇｉｎｍｉｃｒｏｆａｂｒｉｃａｔｅｄｈｉｇｈ−ｄｅｎｓｉｔｙｐｉｃｏｌｉｔｒｅｒｅａｃｔｏｒｓ”，Ｎａｔｕｒｅ，ｄｏｉ：１０．１０３８／ｎａｔｕｒｅ０３９５９、ならびに米国特許出願公開第２００２００１２９３０号、第２００３００５８６２９号、第２００３０１００１０２号、第２００３０１４８３４４号、第２００４０２４８１６１号、第２００５００７９５１０号、第２００５０１２４０２２号および第２００６００７８９０９号に記載されている。

幾つかの場合には、ハイスループット配列決定は、ＣｌｏｎａｌＳｉｎｇｌｅＭｏｌｅｃｕｌｅＡｒｒａｙ（Ｓｏｌｅｘａ，Ｉｎｃ．）を用いて、または可逆的ターミネーター化学を利用する合成による配列決定（ＳＢＳ）を用いて行われる。これらの技術は、米国特許第６，９６９，４８８号、第６，８９７，０２３号、第６，８３３，２４６号、第６，７８７，３０８号、および米国特許出願公開第２００４０１０６１１０号、第２００３００６４３９８号、第２００３００２２２０７号、およびＣｏｎｓｔａｎｓ，Ａ．，ＴｈｅＳｃｉｅｎｔｉｓｔ２００３，１７（１３）：３６に部分的に記載されている。

幾つかの場合には、次世代シーケンシングはナノポア（ｎａｎｏｐｏｒｅ）配列決定である（例えば、ＳｏｎｉＧＶおよびＭｅｌｌｅｒＡ．（２００７）ＣｌｉｎＣｈｅｍ５３：１９９６−２００１を参照されたい）。ナノポアは、例えば、直径約１ナノメートルのオーダーの小孔でありうる。導電性流体中にナノポアを浸漬し、それを越えるポテンシャルを印加すると、ナノポアを通るイオンの伝導によるわずかな電流が生じうる。流れる電流の量はナノポアのサイズに感受性でありうる。ＤＮＡ分子がナノポアを通過する際、ＤＮＡ分子上の各ヌクレオチドは種々の度合でナノポアを妨害しうる。したがって、ＤＮＡ分子がナノポアを通過する際にナノポアを通過する電流の変化はＤＮＡ配列の読取りを表しうる。ナノポア配列決定技術はＯｘｆｏｒｄＮａｎｏｐｏｒｅＴｅｃｈｎｏｌｏｇｉｅｓからのもの、例えばＧｒｉｄＩＯＮシステムでありうる。マイクロウェルの最上部を横切るポリマー膜内に単一ナノポアが挿入されうる。各マイクロウェルは個々のセンシングのための電極を有しうる。マイクロウェルは、チップ当たり１００，０００個以上（例えば、２００，０００、３００，０００、４００，０００、５００，０００、６００，０００、７００，０００、８００，０００、９００，０００または１，０００，０００個以上）のマイクロウェルを有するアレイチップへと加工されうる。チップを分析するために装置（またはノード）が使用されうる。データはリアルタイムで分析されうる。１以上の装置が同時に作動されうる。ナノポアはタンパク質ナノポア、例えば、ヘプタマータンパク質ナノポアであるタンパク質アルファ溶血素でありうる。ナノポアは固体状態（ソリッドステート）であることが可能であり、例えば、合成膜（例えば、ＳｉＮｘまたはＳｉＯ_２）中に形成されるナノメートルサイズの孔でありうる。ナノポアはハイブリッドポア（例えば、固体膜内へのタンパク質ポアの組み込み）でありうる。ナノポアは集積センサ（例えば、トンネル電極検出器、容量検出器、またはグラフェンベースナノギャップもしくはエッジ状検出器（例えば、Ｇａｒａｊら（２０１０）Ｎａｔｕｒｅｖｏｌ．６７，ｄｏｉ：１０．１０３８／ｎａｔｕｒｅ０９３７９）を参照されたい））を有するナノポアでありうる。ナノポアは、特定のタイプの分子（例えば、ＤＮＡ、ＲＮＡまたはタンパク質）を分析するために機能化されうる。ナノポア配列決定は「鎖配列決定（ストランドシーケンシング）」を含むことが可能であり、この場合、無傷ＤＮＡポリマーが、該ＤＮＡがポアへ移動するにつれて、リアルタイムで配列決定されながら、タンパク質ナノポアを通過しうる。酵素は二本鎖ＤＮＡの鎖を分離し、ナノポアを通して鎖を供給しうる。ＤＮＡは一端にヘアピンを有することが可能であり、該システムは両鎖を読取りうる。幾つかの場合には、ナノポア配列決定は「エキソヌクレアーゼ配列決定」であり、この場合、個々のヌクレオチドが加工性（プロセッシブ）エキソヌクレアーゼによりＤＮＡ鎖から切断され、ヌクレオチドがタンパク質ナノポアを通過しうる。ヌクレオチドはポア内の分子（例えば、シクロデキストラン）に一時的に結合しうる。電流の特徴的な乱れ（ｄｉｓｒｕｐｔｉｏｎ）を利用して、塩基を特定することが可能である。

ＧＥＮＩＡからのナノポア配列決定技術が利用されうる。操作されたタンパク質ポアが脂質二重層膜内に包埋されうる。効率的なナノポア−膜集合、およびチャネルを通るＤＮＡ移動の制御を可能にするために、「アクティブ制御」技術が用いられうる。幾つかの場合には、ナノポア配列決定技術はＮＡＢｓｙｓからのものである。ゲノムＤＮＡは約１００ｋｂの平均長の鎖に断片化されうる。１００ｋｂの断片は一本鎖にされることが可能であり、ついで、６マー（ｍｅｒ）プローブにハイブリダイズされうる。プローブを有するゲノム断片はナノポアを通り抜けることが可能であり、これは電流対時間トレーシングを生成しうる。該電流トレーシングは各ゲノム断片上のプローブの位置を示しうる。それらのゲノム断片を並べて、ゲノムに関するプローブ地図を作成することが可能である。該プロセスはプローブのライブラリに関して並行して行われうる。各プローブのゲノム長プローブ地図が作成されうる。エラーは、「移動ウインドウ・シーケンシング・バイ・ハイブリダイゼーション（ｍｏｖｉｎｇｗｉｎｄｏｗＳｅｑｕｅｎｃｉｎｇＢｙＨｙｂｒｉｄｉｚａｔｉｏｎ）（ｍｗＳＢＨ）」と称されるプロセスで修正されうる。幾つかの場合には、ナノポア配列決定技術はＩＢＭ／Ｒｏｃｈｅからのものである。電子ビームを用いて、マイクロチップ内にナノポアサイズの開口部を生成させることが可能である。電場を用いて、ナノポアを介してＤＮＡを引っ張り、または通すことが可能である。ナノポア内のＤＮＡトランジスタデバイスは金属および誘電体の交互のナノメートルサイズの層を含みうる。ＤＮＡ骨格内の孤立電荷はＤＮＡナノポア内の電場により捕捉されうる。ゲート電圧をオフおよびオンにすることにより、ＤＮＡ配列を読取ることが可能となりうる。

次世代シーケンシングはＤＮＡナノボール（ｎａｎｏｂａｌｌ）配列決定（例えば、ＣｏｍｐｌｅｔｅＧｅｎｏｍｉｃｓにより行われるもの；例えば、Ｄｒｍａｎａｃｅｔら（２０１０）Ｓｃｉｅｎｃｅ３２７：７８−８１を参照されたい）を含みうる。ＤＮＡを単離し、断片化し、サイズ選択することが可能である。例えば、ＤＮＡは（例えば、超音波処理により）約５００ｂｐの平均長に断片化されうる。アダプター（Ａｄｌ）が断片の末端に結合される。アダプターを使用して、配列決定反応用アンカーにハイブリダイズさせることが可能である。各末端に結合したアダプターを有するＤＮＡをＰＣＲ増幅することが可能である。アダプター配列は、相補的な一本鎖末端が互いに結合して環状ＤＮＡを形成するように修飾されうる。ＤＮＡは、後続工程で使用されるＩＩＳ型制限酵素による切断から保護するためにメチル化されうる。アダプター（例えば、右アダプター）は制限認識部位を有することが可能であり、制限認識部位は非メチル化状態のままでありうる。アダプター内の非メチル化制限認識部位は制限酵素（例えば、ＡｃｕＩ）により認識されることが可能であり、該ＤＮＡは、右アダプターの１３ｂｐ右側で、ＡｃｕＩにより切断されて、線状二本鎖ＤＮＡを形成しうる。第２ラウンドの右および左アダプター（Ａｄ２）を該線状ＤＮＡのいずれかの末端に連結することが可能であり、両方のアダプターが結合された全てのＤＮＡを（例えばＰＣＲにより）ＰＣＲ増幅することが可能である。Ａｄ２配列は、それらが互いに結合して環状ＤＮＡを形成するように修飾されうる。該ＤＮＡはメチル化されうるが、制限酵素認識部位は左Ａｄ１アダプター上で非メチル化状態のままでありうる。制限酵素（例えば、ＡｃｕＩ）が適用可能であり、該ＤＮＡはＡｄ１の１３ｂｐ左側で切断されて線状ＤＮＡ断片を形成しうる。第３ラウンドの右および左アダプター（Ａｄ３）を該線状ＤＮＡの右および左側に連結することが可能であり、得られた断片をＰＣＲ増幅することが可能である。該アダプターは、それらが互いに結合して環状ＤＮＡを形成しうるように修飾されうる。ＩＩＩ型制限酵素（例えば、ＥｃｏＰ１５）が添加されうる。ＥｃｏＰ１５はＡｄ３の２６ｂｐ左側およびＡｄ２の２６ｂｐ右側でＤＮＡを切断しうる。この切断は大きなＤＮＡセグメントを除去し、ＤＮＡを再び線状化しうる。第４ラウンドの右および左アダプター（Ａｄ４）をＤＮＡに連結し、ＤＮＡを（例えばＰＣＲにより）増幅し、修飾して、それらが互いに結合し、完全な環状ＤＮＡ鋳型を形成するようにすることが可能である。

ローリングサークル複製（例えば、Ｐｈｉ２９ＤＮＡポリメラーゼを使用するもの）を用いて、ＤＮＡの小さな断片を増幅することが可能である。４つのアダプター配列は、ハイブリダイズ可能な回文配列を含むことが可能であり、単一鎖がそれ自体に対してフォールディングして、約２００〜３００ナノメートルの平均直径を有しうるＤＮＡナノボール（ＤＮＢ（商標））を形成しうる。ＤＮＡナノボールはマイクロアレイ（配列決定フローセル）に（例えば吸着により）結合されうる。該フローセルは、二酸化ケイ素、チタンおよびヘキサメチルジシラザン（ＨＭＤＳ）でコーティングされたシリコンウェハならびにフォトレジスト材でありうる。配列決定は、蛍光プローブをＤＮＡに連結することにより、非連鎖（ｕｎｃｈａｉｎｅｄ）配列決定により行われうる。イントロゲート（ｉｎｔｅｒｒｏｇａｔｅｄ）位置の蛍光の色は高分解能カメラにより可視化されうる。アダプター配列間のヌクレオチド配列の同一性が決定されうる。

本発明で提供する方法はシステムの使用を含むことが可能であり、例えば、ＤＮＡまたはＲＮＡ配列情報を得るための核酸シーケンサー（例えば、ＤＮＡシーケンサー、ＲＮＡシーケンサー）を含むシステムの使用を含みうる。該システムは、ＤＮＡまたはＲＮＡ配列情報に関するバイオインフォマティクス（生物情報学的）分析を実行するソフトウェアを含むコンピュータを含みうる。バイオインフォマティクス分析には、限定的なものではないが、配列データの構築、サンプルにおける遺伝的変異体［生殖系列変異体および体細胞変異体（例えば、癌または前癌状態に関連する遺伝的変異、感染に関連する遺伝的変異）を含む］の検出および定量が含まれる。

配列データを使用して、遺伝子配列情報、倍数性状態、１以上の遺伝的変異体の同一性、および変異体の定量的尺度（相対的および絶対的相対尺度を含む）を決定することが可能である。

幾つかの場合には、ゲノムの配列決定は全ゲノム配列決定または部分ゲノム配列決定を含む。配列決定は不偏性（ｕｎｂｉａｓｅｄ）であることが可能であり、サンプルにおける核酸の全てまたは実質的に全て（例えば、７０％、８０％、９０％を超える）の配列決定を含みうる。ゲノムの配列決定は選択的であることが可能であり、例えば、関心のあるゲノムの部分に向けられたものでありうる。例えば、多数の遺伝子（およびこれらの遺伝子の変異形態）は種々の癌に関連していることが公知である。所望の分析のためには、選択された遺伝子または遺伝子の一部の配列決定で十分でありうる。関心のある対象である、ゲノム内の特定の遺伝子座に位置決定（マッピング）されたポリヌクレオチドは、例えば配列捕捉または部位特異的増幅により、配列決定のために単離されうる。

用途
本発明で提供する方法は種々の目的に使用可能であり、例えば、状態（例えば、感染）の診断または検出、状態の発生または再発の予測、治療のモニター、治療レジメンの選択または修飾、あるいは療法の最適化に使用されうる。このアプローチにより、治療および／または診断レジメンを、治療経過にわたる種々の時点で得られたデータに従い個別化および調整し、それにより、個別に適切なレジメンを提供することが可能である。

状態の検出／診断／予後判定
本発明で提供する方法は、患者のサンプル、例えばヒトの血液サンプルにおいて感染または疾患を検出、診断または予後判定するために使用されうる。該方法は、ヒト核酸から主に構成されるサンプルにおける希少微生物核酸断片を検出するために使用されうる。例えば、血液中の無細胞ＤＮＡ（ｃｆＤＮＡ）は、主に宿主由来のＤＮＡ断片からなるが、体内の微生物由来の少量の断片をも含有する。ｃｆＤＮＡの抽出およびそれに続く詳細な配列決定（例えば、次世代シーケンシングまたはＮＧＳ）は、宿主および非宿主ゲノムデータベースに対して位置決定（マッピング）されうる数百万個または数十億個の配列リード（ｒｅａｄ；読取り）を生成しうる。同様に、該方法は、特定の器官からの循環または無細胞ＲＮＡの希少集団を検出するためにも使用されうる。非宿主リードが全体のうちのごく少数であるサンプルの場合、本発明で提供する方法によらなければ、異なる標的核酸（例えば、異なる微生物または生物に由来するもの）と比較するための又は異なるサンプルもしくは試薬を追跡するための内部正規化標準の欠如により損なわれるアッセイの感度および特異性を、本発明で提供する方法は改善しうる。また、該方法は、標的核酸が核酸の全集団のより大きな部分を構成する場合に使用されうる。

本発明で提供する方法は、多種多様な疾患および障害を検出、モニター、診断、予後判定、治療または予防するために使用されうる。特に、該方法は、感染性疾患または障害に関連する病原体に由来する１以上の標的核酸を検出するために使用されうる。典型的な疾患および障害には、感染に関連する任意の疾患または障害、例えば、敗血症、肺炎、結核、ＨＩＶ感染、肝炎感染（例えば、ＨｅｐＡ、ＢまたはＣ）、ヒトパピローマウイルス（ＨＰＶ）感染、クラミジア感染、梅毒感染、エボラ感染、スタフィロコッカス・アウレウス（ｓｔａｐｈｙｌｏｃｏｃｃｕｓａｕｒｅｕｓ）感染またはインフルエンザが含まれる。本発明で提供する方法は、薬剤耐性微生物、例えば、多剤耐性微生物、または容易には培養されず若しくは典型的には試験されない微生物による感染を検出するのに特に有用である。本方法で検出されうる疾患および障害の幾つかの非限定的な例には以下のものが含まれる：癌、拡張型心筋症、ギラン・バレー症候群、多発性硬化症、結核、炭疽病、睡眠病、赤痢、トキソプラズマ症、白癬、カンジダ症、ヒストプラスマ症、エボラ、アシネトバクター感染、放線菌症、アフリカ睡眠病（アフリカトリパノソーマ症）、エイズ（後天性免疫不全症候群）、ＨＩＶ感染、アメーバ症、アナプラズマ症、炭疽病、アルカンバクテリウム・ヘモリティカム（Ａｒｃａｎｏｂａｃｔｅｒｉｕｍｈａｅｍｏｌｙｔｉｃｕｍ）感染、アルゼンチン出血熱、アスカリアシス、アスペルギルス症、アストロウイルス感染、バベシア症、バシルス・セレウス（Ｂａｃｉｌｌｕｓｃｅｒｅｕｓ）感染、細菌性肺炎、細菌性膣症（ＢＶ）、バクテロイデス感染、バランチジウム症、ベイリサスカリス（Ｂａｙｌｉｓａｓｃａｒｉｓ）感染、ＢＫウイルス感染、黒色砂毛、胚盤胞感染、胚盤葉感染、ボリビア出血熱、ボレリア感染、ボツリヌス中毒（および幼児ボツリヌス中毒症）、ブラジル出血熱、ブルセラ症、腺ペスト、バークホルデリア感染、ブルリ潰瘍、カリシウイルス感染（ノロウイルスおよびサポウイルス）、カンピロバクター症、カンジダ症（モニリア症；膣炎）、猫引っかき病、蜂巣炎、シャガス病（アメリカトリパノソーマ症）、軟性下疳、水痘、チクングニア熱、クラミジア、クラミドフィラ・ニューモニエ（Ｃｈｌａｍｙｄｏｐｈｉｌａｐｎｅｕｍｏｎｉａｅ）感染（台湾急性呼吸器症候群またはＴＷＡＲ）、コレラ、クロモブラストミコーシス、肝吸虫症、クロストリジウム・ディフィシレ（Ｃｌｏｓｔｒｉｄｉｕｍｄｉｆｆｉｃｉｌｅ）感染、コクシジオイデス症、コロラドダニ熱（ＣＴＦ）、感冒（急性ウイルス性鼻咽頭炎；急性コリーザ）、クロイツフェルト・ヤコブ病（ＣＪＤ）、クリミア・コンゴ出血熱（ＣＣＨＦ）、クリプトコックス症、クリプトスポリジウム症、皮膚幼虫遊走（ＣＬＭ）、シクロスポラ症、嚢虫症、サイトメガロウイルス感染、デング熱、二核アメーバ症、ジフテリア、裂頭条虫症、メジナ虫症、エボラ出血熱、エキノコックス症、エーリキア症、蟯虫症（蟯虫感染症）、腸球菌感染症、エンテロウイルス感染、流行チフス、伝染性紅斑（第五病）、突発性発疹（第六病）、肥大吸虫症、肝蛭症、フィラリア症、クロストリジウム・パーフリンジェンス（Ｃｌｏｓｔｒｉｄｉｕｍｐｅｒｆｒｉｎｇｅｎｓ）による食中毒、自由生活アメーバ感染、フゾバクテリウム感染、ガス壊疽（クロストリジウム筋壊死）、ゲオトリクム症、ゲルストマン−シュトロイスラー−シャインカー症候群（ＧＳＳ）、ジアルジア症、鼻疽、顎口虫症、淋病、鼠径肉芽腫（ドノヴァン症）、Ａ群連鎖球菌感染、Ｂ群レンサ球菌感染、ヘモフィルス・インフルエンゼ（Ｈａｅｍｏｐｈｉｌｕｓｉｎｆｌｕｅｎｚａｅ）感染、手足口病（ＨＦＭＤ）、ハンタウイルス肺症候群（ＨＰＳ）、ハートランド（Ｈｅａｒｔｌａｎｄ）ウイルス疾患、ヘリコバクター・ピロリ（Ｈｅｌｉｃｏｂａｃｔｅｒｐｙｌｏｒｉ）感染、溶血性尿毒症症候群（ＨＵＳ）、腎症候性出血熱（ＨＦＲＳ）、Ａ型肝炎、Ｂ型肝炎、Ｃ型肝炎、Ｄ型肝炎、Ｅ型肝炎、単純ヘルペス、ヒストプラスマ症、鉤虫感染、ヒトボカウイルス感染、ヒト・エウィンギイエールリキオシス（ｅｗｉｎｇｉｉｅｈｒｌｉｃｈｉｏｓｉｓ）、ヒト顆粒球アナプラズマ症（ＨＧＡ）、ヒトメタニューモウイルス感染、ヒト単球エールリヒア症、ヒトパピローマウイルス（ＨＰＶ）感染、ヒトパラインフルエンザウイルス感染、膜様条虫症、エプスタイン−バーウイルス感染性単核球症（Ｍｏｎｏ）、インフルエンザ（ｆｌｕ）、イソスポラ症、川崎病、角膜炎、キンゲラ・キンゲ（Ｋｉｎｇｅｌｌａｋｉｎｇａｅ）感染、クールー、ラッサ熱、レジオネラ症（レジオネラ病）、レジオネラ症（ポンティアック熱）、リーシュマニア症、ハンセン病、レプトスピラ症、リステリア症、ライム病（ライムボレリア症）、リンパ管フィラリア症（象皮病）、リンパ球性脈絡髄膜炎、マラリア、マールブルグ出血熱（ＭＨＦ）、麻疹、中東呼吸器症候群（ＭＥＲＳ）、類鼻疽（ホイットモア病）、髄膜炎、髄膜炎菌性疾患、横川吸虫症、微胞子虫症、伝染性軟属腫（ＭＣ）、サル痘、流行性耳下腺炎、マウスチフス（流行チフス）、マイコプラズマ肺炎、菌腫、ハエ幼虫症、新生児結膜炎（新生児眼炎）、（新）変種クロイツフェルト・ヤコブ病（ｖＣＪＤ、ｎｖＣＪＤ）、ノカルジア症、オンコセルカ症（河川盲目症）、パラコクシジオイデス（南米ブラストミセス症）、肺吸虫症、パスツレラ症、アタマジラミ寄生症（アタマジラミ）、コロモジラミ寄生症（着物虱）、ケジラミ症（恥毛シラミ、カニシラミ）、骨盤内炎症性疾患（ＰＩＤ）、百日咳（百日ぜき）、ペスト、肺炎球菌感染、ニューモシスチス肺炎（ＰＣＰ）、肺炎、ポリオ、プレボテラ感染、原発性アメーバ性髄膜脳炎（ＰＡＭ）、進行性多巣性白質脳症、オウム病、Ｑ熱、狂犬病、呼吸器合胞体ウイルス感染、リスノポリジウム症、ライノウイルス感染、リケッチア感染、リケッチア痘、リフトバレー熱（ＲＶＦ）、ロッキー山紅斑熱（ＲＭＳＦ）、ロタウイルス感染、風疹、サルモネラ症、ＳＡＲＳ（重症急性呼吸器症候群）、疥癬、住血吸虫症、敗血症、細菌性赤痢（細菌赤痢）、帯状疱疹（帯状ヘルペス）、天然痘（痘瘡）、スポロトリクス症、ブドウ球菌食中毒、ブドウ球菌感染、糞線虫症、亜急性硬化性全脳炎、梅毒、テニア症、破傷風（咬痙）、白癬性毛瘡（床屋痒み症）、頭部白癬（しらくも）、体部白癬（ぜにたむし）、股部白癬（いんきんたむし）、手白癬（手の白癬）、黒癬、足白癬（水虫）、爪白癬（爪真菌症）、澱風（なまず）、トキソカラ症（眼幼虫移行症（ＯＬＭ））、トキソカラ症（内臓幼虫移行症（ＶＬＭ））、トラコーマ、トリノククリアシス（Ｔｒｉｎｏｃｈｃｃｌｉａｓｉｓ）、旋毛虫病（Ｔｒｉｃｈｉｎｌｏｓｉｓ）、鞭虫症（鞭虫感染）、結核、野兎病、腸チフス、ウレアプラズマ・ウレアリチカム（Ｕｒｅａｐｌａｓｍａｕｒｅａｌｙｔｉｃｕｍ）感染、渓谷熱、ベネズエラウマ脳炎、ベネズエラ出血熱、ウイルス性肺炎、西ナイル熱、白色砂毛（チネア・ブランカ（Ｔｉｎｅａｂｌａｎｃａ）、エルシニア・シュードツベルクローシス（Ｙｅｒｓｉｎｉａｐｓｅｕｄｏｔｕｂｅｒｃｕｌｏｓｉｓ）感染、エルシニア症、黄熱病、ジカウイルス、および接合菌症。

幾つかの場合には、本明細書に記載されている方法は、感染が活動性であるか潜在性であるかを決定することを含む。幾つかの場合には、遺伝子発現の定量は、活動性感染を検出、予測、診断またはモニターするための方法を提供しうる。幾つかの場合には、本明細書に記載されている方法は、活動性感染を検出することを含む。幾つかの場合には、遺伝子発現は、関心のある１以上の標的核酸の検出または配列決定により定量されうる。幾つかの場合には、遺伝子発現の定量は、潜伏感染を検出、予測、診断またはモニターするための方法を提供しうる。幾つかの場合には、本明細書に記載されている方法は、潜伏感染を検出することを含む。

本発明で提供する方法は、癌を検出するために使用可能であり、特に、そのような癌を有する対象、そのような癌を有するリスクのある対象、またはそのような癌を有すると疑われる対象において、癌を検出するために使用されうる。癌の例には、限定的なものではないが、脳腫瘍、頭頸部癌、喉頭癌、口腔癌、乳癌、骨癌、血液癌、白血病、リンパ腫、肺癌、腎癌、膵臓癌、胃癌、結腸癌、直腸癌、皮膚癌、生殖路の癌、前立腺癌などが含まれる。幾つかの場合には、本発明で提供する方法は、非血液癌、例えば、実質臓器の癌（例えば、肺癌、乳癌、膵臓癌など）を検出するのに特に有用である。

該方法は、対象の任意の他のタイプの疾患または状態を検出するのにも有用でありうる。しばしば、それは、希少遺伝的変異を検出するのに有用であり、あるいは、サンプルにおける全核酸集団のうちの非常に小さな部分のみを構成する核酸配列を検出するのに有用である。

病原体または器官核酸の検出は、病原体または器官核酸の存在もしくは非存在および／または病原体もしくは器官核酸の量を決定するために、病原体または器官核酸のレベルを対照または参照値と比較することを含みうる。レベルは定性的または定量的レベルでありうる。幾つかの場合には、対照または参照値は、無細胞病原体核酸または無細胞器官由来核酸の存在または非存在を示す所定の絶対的な値である。例えば、対照値を超える無細胞病原体核酸のレベルの検出は病原体または感染の存在を示しうる。一方、対照値より低いレベルは病原体または感染の非存在を示しうる。該対照値は、感染を有さない対象の無細胞核酸レベルを分析することにより得られる値でありうる。幾つかの場合には、対照値は陽性対照値であることが可能であり、特定の感染を有する、または特定の器官の特定の感染を有する対象からの無細胞核酸を分析することにより得られうる。

幾つかの場合には、感染が存在するか否かを決定するために、そしてしばしば、正確な結果を得るために、以下の方法の１以上が適用されうる：（ｉ）ＷＯ２０１５０７００８６Ａ１の特許に記載されているとおり、配列決定により得られたリード（ｒｅａｄ）の全体はキュレート（ｃｕｒａｔｅｄ）宿主ゲノム参照データベース（これはヒト、イヌ、ネコ、霊長類由来または任意の他の宿主由来であることが可能であり、例えば、ＧｅｎＢａｎｋｈｇ１９ヒト参照配列を含む）に対してアライメントされうる；（ｉｉ）病原体関連配列を含む非宿主配列のみが更に分析されうるように、バイオインフォマティクス分析のためのデータプロセッサは宿主配列を除去または隔離しうる；（ｉｉｉ）データプロセッサは、例えばＧｅｎＢａｎｋおよびＲｅｆｓｅｑからの例示参照配列を含むキュレート微生物参照配列データベースに対して非宿主配列をアライメントさせることにより、１以上の病原体の存在を決定しうる；（ｉｖ）１以上の病原体の存在が統計的に有意であるかどうかを判定するために、統計的解析フレームワークが適用されうる；および／または（ｖ）幾つかの場合には、データプロセッサは、配列決定前に既知濃度でサンプルに添加された対照分子により得られたリードの数と比較した場合の、病原体に関して得られたリードの数に基づいて、存在する病原体の量を定量しうる。

対照値は、異なる時点、例えば、試験時点の前の時点で、対象（例えば、感染を有する対象または感染を有すると疑われる対象）から得られた無細胞病原体または器官特異的核酸のレベルでありうる。そのような場合、異なる時点でのレベルの比較は、感染の存在、特定の器官における感染の存在、感染の改善、または感染の悪化を示しうる。例えば、無細胞病原体核酸の経時的な一定量の増加は感染の存在または感染の悪化を示しうる。例えば、元の値と比較して、少なくとも５％、１０％、２０％、２５％、３０％、５０％、７５％、１００％、２００％、３００％または４００％の、病原体または器官特異的無細胞核酸の増加は、感染の存在または感染の悪化を示しうる。他の例においては、元の値と比較して、少なくとも５％、１０％、２０％、２５％、３０％、５０％、７５％、１００％、２００％、３００％または４００％の、病原体または器官特異的無細胞核酸の減少は、感染の非存在または感染の改善を示しうる。しばしば、そのような測定は、特定の期間にわたって、例えば毎日、隔日、毎週、隔週、毎月または隔月に行われうる。例えば、１週間わたる、少なくとも５０％の、病原体または器官無細胞核酸の増加は、感染の存在を示しうる。

対照または参照値は濃度として又は配列決定リードの数として測定されうる。対照または参照値は病原体依存的でありうる。例えば、大腸菌（Ｅｓｃｈｅｒｉｃｈｉａｃｏｌｉ）の対照値はマイコプラズマ・ホミニス（Ｍｙｃｏｐｌａｓｍａｈｏｍｉｎｉｓ）の対照値と異なりうる。レベルまたは対照値のデータベースは、１以上の病原体、１以上の器官および／または１以上の時点に関して、１以上の対象から得られたサンプルに基づいて作成されうる。そのようなデータベースはキュレート（ｃｕｒａｔｅｄ）物または独占物でありうる。推奨治療選択肢は種々の閾値レベルに基づきうる。例えば、低レベルは感染を示しうるが、治療は不要でない可能性があり、中等度のレベルは抗生物質治療につながる可能性があり、高レベルは即座の又は重大な介入を要しうる。

本発明で提供する方法は高効率、高精度および／または高感度での配列決定データの作成を可能にしうる。しばしば、そのような方法は、プレート培養またはポリメラーゼ連鎖反応（ＰＣＲ）のような他の方法によっては検出されず又は検出可能である病原体または感染を検出しうる。該方法は一般に、非常に高い感度、例えば、８０％、８５％、９０％、９５％、９９％または９９．５％を超える感度を有しうる。該方法は一般に、非常に低い偽陽性率、例えば、５％、４％、３％、２％、１％、０．１％、０．０５％、０．０１％未満の偽陽性率を有しうる。

本発明で提供する方法は、高い特異性、高い感度、高い陽性的中度および／または低い陰性的中度を与えうる。本発明で提供する方法は、少なくとも７０％、７５％、８０％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％またはそれ以上である特異性（または陰性一致率）および／または感度（または陽性一致率）を示しうる。幾つかの場合には、名目上の特異性は７０％以上である。名目上の陰性的中度（ＮＰＶ）は９５％以上である。幾つかの場合には、ＮＰＶは少なくとも９５％、９５．５％、９６％、９６．５％、９７％、９７．５％、９８％、９８．５％、９９％、９９．５％またはそれ以上である。

感度、陽性一致率（ＰＰＡ）または真陽性率（有病正診率）（ＴＰＲ）はＴＰ／（ＴＰ＋ＦＮ）またはＴＰ／（感染対象の総数）の式に関するものでありうる（ここで、ＴＰは真陽性の数であり、ＦＮは偽陰性の数である）。前記式の分母を計算する場合、該値は、特定の独立した感染検出方法（例えば、血液培養またはＰＣＲ）に基づく感染結果の総数を反映しうる。

特異性、陰性一致率または真陰性率（無病正診率）は、ＴＮ／（ＴＮ＋ＦＰ）またはＴＮ／（未感染対象の総数）のような式に関するものでありうる（ここで、ＴＮは真陰性であり、ＦＰは偽陽性である）。前記式の分母を計算する場合、該値は、独立した感染検出方法（例えば、血液培養またはＰＣＲ）により決定された実際の「未感染」の総数を反映しうる。

幾つかの場合には、サンプルは、７５％、８０％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％、９９．５％またはそれ以上の精度で、感染していると特定される。幾つかの場合には、サンプルは、９５％を超える感度で、感染していると特定される。幾つかの場合には、サンプルは、９５％を超える特異性で、感染していると特定される。幾つかの場合には、サンプルは、９５％を超える感度および９５％を超える特異性で、感染していると特定される。幾つかの場合には、精度は、学習したアルゴリズムを使用して計算される。本明細書中で用いる診断精度は特異性、感度、陽性的中度、陰性的中度および／または偽発見率を含む。幾つかの場合には、本明細書に記載されている方法は、７０％、７５％、８０％、８５％、８６％、８７％、８８％、８９％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％、または９９．５％を超える特異性または感度、あるいは少なくとも９５％、９５．５％、９６％、９６．５％、９７％、９７．５％、９８％、９８．５％、９９％、９９．５％またはそれ以上の陽性的中度または陰性的中度を有する。

感染の診断のためにサンプルを分類する場合、典型的には、二項分類指標からの４つの可能な結果が存在する。予測からの結果がｐであり、実際の値もｐである場合、それは真陽性（ＴＰ）と称される。しかし、実際の値がｎであれば、それは偽陽性（ＦＰ）であると称される。逆に、予測結果と実際の値の両方がｎである場合には真陰性が生じ、実際の値がｐである場合に予測結果がｎである場合には偽陰性となる。そのような感染症のような疾患または障害を検出する試験では、対象（被験体）が陽性試験結果を示すが実際には感染を有さない場合には、この場合の偽陽性が生じうる。一方、対象が実際に感染しているが、そのような感染に関する陰性試験結果を示す場合には、偽陰性が生じうる。

陽性的中度（ＰＰＶ）、または精度（ｐｒｅｃｉｓｉｏｎｒａｔｅ）、または疾患の検査後確率は、正確に診断された陽性試験結果を有する患者の割合である。それは、以下の式：ＰＰＶ＝ＴＰ／（ＴＰ＋ＦＰ）を適用することにより計算されうる。ＰＰＶは、陽性試験結果が、試験されている基礎状態（基礎疾患）を反映する確率を反映しうる。しかし、その度合は、変動しうる当該疾患の罹患率に左右されうる。陰性的中度（ＮＰＶ）は、以下の式：ＴＮ／（ＴＮ＋ＦＮ）により計算される。陰性的中度は、正確に診断された陰性試験結果を有する患者の割合でありうる。ＰＰＶおよびＮＰＶ測定値は、適切な疾患有病率推定値を用いて導出されうる。

幾つかの場合には、本明細書に記載されている方法の配列決定分析の結果は、与えられた診断が正しいという統計的信頼水準を示す。幾つかの場合には、そのような統計的信頼水準は８５％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％または９９．５％を超える。

モニターおよび治療
該方法は、経時的に対象が感染を有するかどうかをモニター（監視）することを含みうる。例えば、感染の存在または非存在を決定するために、サンプルを種々の時点で連続的に採取されうる。他の例では、該方法は、経時的に感染経過をモニターすることを含みうる。そのような場合、サンプルは感染または疾患中の種々の時点で連続的に採取可能であり、幾つかの場合には、連続的に採取されたサンプルを互いに比較して、感染が改善しているか悪化しているかを決定する。

本発明で提供する方法は、対象、例えば、感染を有する対象または感染を有すると疑われる対象の治療方法を含む。治療は対象における感染を軽減、予防または排除しうる。幾つかの場合には、治療は感染および／または炎症を軽減、予防または排除しうる。

治療は、炎症および／または感染を軽減または排除するために薬物または他の療法を投与することを含みうる。幾つかの場合には、例えば、感染または炎症の発生を予防するために、対象を薬物で予防的に治療（処置）する。

感染または炎症の症状を改善または軽減するための任意の療法（薬物を含む）を対象に投与することが可能である。典型的な薬物には、限定的なものではないが、抗生物質、抗ウイルス薬、アンピシリン、スルバクタム、ペニシリン、バンコマイシン、ゲンタマイシン、アミノグリコシド、クリンダマイシン、セファロスポリン、メトロニダゾール、チメンチン、チカルシリン、クラブラン酸、セフォキシチン、抗レトロウィルス薬（例えば、高活性抗レトロウィルス療法（ＨＡＡＲＴ）、逆転写逆転インヒビター、ヌクレオシド／ヌクレオチド逆転写酵素インヒビター（ＮＲＴＩ）、非ヌクレオシドＲＴインヒビターおよび／またはプロテアーゼインヒビター）、抗体−薬物コンジュゲート、および免疫グロブリンが含まれる。

該方法は治療レジメンを調節する方法を含みうる。例えば、対象は既知の感染を有する可能性があり、該感染を治療するための薬物が投与されている可能性がある。本発明で提供する方法は、薬物治療の有効性を追跡またはモニターするために使用されうる。幾つかの場合には、該治療レジメンは、そのようなモニターの結果に応じて調節されうる。例えば、本発明で提供する方法が、薬物治療の結果として感染が改善していないことを示している場合には、患者に投与する薬物または治療のタイプを変更すること、先行薬物の使用を中止すること、該薬物の使用を継続すること、薬物治療の用量を増加させること、あるいは新たな薬物または他の治療を対象の治療レジメンに加えることにより、治療レジメンが調節されうる。幾つかの場合には、治療レジメンは特定の処置を含みうる。同様に、該方法が、感染が改善している又は消散していることを示している場合には、調節は、薬物治療を低減または中止することを含みうる。

本明細書に記載されている方法は更に、ＲＮＡ配列決定（ＲＮＡ−Ｓｅｑ）を含むことが可能であり、またはＲＮＡ−Ｓｅｑを含む方法と組合されうる。組織損傷または感染は特定の器官または組織からの無細胞核酸の放出をもたらしうる。例えば、組織におけるアポトーシス細胞によりＲＮＡが放出されうる。無細胞ＲＮＡのＲＮＡ−Ｓｅｑは体内の種々の組織の健康または状態を示しうる。

ＲＮＡ配列決定を含む方法は、感染した特定の器官または組織の検出を可能にし、器官の健康状態を検出またはモニターするために使用されうる。ＲＮＡ−Ｓｅｑは、器官の健康を調べるために独立して使用可能であり、または本明細書に記載されている方法により検出された感染が特定の器官の感染であるという信頼性を高めうる。ＲＮＡ−Ｓｅｑ試験は、感染の検出方法と同時に、感染の検出方法の後で、または感染の検出方法の前に行われうる。

本発明が提供する病原体検出方法が体液中の無細胞ＲＮＡのＲＮＡ配列決定による感染部位の検出方法と組合されうる多数の潜在的シナリオが存在する。例えば、本発明で提供する方法は、病原体からの循環無細胞核酸を検出するために使用されうる。該方法は更に、対象血液における器官特異的無細胞ＲＮＡの増加を検出するためのＲＮＡ−Ｓｅｑ試験を行うことを含みうる。試験結果の組合せは、病原体が器官に感染していることを示すことが可能であり、更には、どの器官組織が感染しているかをも決定することが可能でありうる。

ＲＮＡ−Ｓｅｑ試験（または一連のＲＮＡ−Ｓｅｑ試験）は、時には、本明細書に記載されている方法が陽性試験結果（例えば、病原体感染の検出）を示した後に行われうる。ＲＮＡ−Ｓｅｑ試験は、感染を確認するため、または感染の位置を特定するために特に有用でありうる。例えば、該方法は、循環無細胞核酸を分析することにより、対象における病原体の存在を検出しうるが、感染部位は不明でありうる。そのような場合には、該方法は更に、（例えば、器官組織に由来する循環無細胞ＲＮＡのレベルの増加の検出により）感染が器官内に存在することを確認するために、対象からの無細胞ＲＮＡを配列決定することを含みうる。ついで、特定の器官または組織において感染が悪化または改善しているかどうか、あるいはそれが異なる器官または組織に広がっているかどうかを判定するために、ＲＮＡ配列決定試験を経時的に反復することが可能である。同様に、病原体検出アッセイを経時的に反復することが可能である。

幾つかの場合には、本明細書に記載されている病原体検出方法は、ＲＮＡ−Ｓｅｑ試験の実施の後で行われる。例えば、器官に関連する無細胞ＲＮＡの血漿レベルの上昇は器官の感染のような障害を示しうる。そのような場合、該方法は更に、器官感染に関連する循環無細胞核酸のレベルを検出することを含みうる。

本明細書に記載されている方法は、例えば、経時的に感染または治療をモニターするために反復されうる。本明細書に記載されている方法は、１、２、３、４、５、６、７、８、９または１０日ごと、１、２、３、４、５または６週ごと、あるいは１、２、３、４、５、６、７、８または９ヶ月ごとに反復されうる。

幾つかの場合には、本明細書に記載されている方法が陰性試験結果を示す（例えば、病原体が検出されない）場合、対象における病原体核酸をモニターするために、方法を経時的に連続的に反復することが可能である。また、幾つかの場合においては、陰性病原体試験結果または陰性ＲＮＡ−Ｓｅｑ結果の後、ＲＮＡ−Ｓｅｑアッセイを経時的に連続的に反復する。

幾つかの場合には、本明細書に記載されている方法が陽性試験結果（例えば、病原体の検出）を示す場合、治療レジメンを対象に投与することが可能である。治療レジメンには、薬物投与、抗生物質投与または抗ウイルス投与が含まれ得るが、これに限定されるものではない。

幾つかの場合には、本明細書に記載されている方法が陽性試験結果を示す場合、感染の経過をモニターするために、方法または試験を経時的に連続的に反復することが可能である。例えば、感染の上方または下方の経過に応じて、治療レジメンを調節することが可能である。他の場合には、最初はいずれの治療レジメンをも行わない。例えば、追加的な医学的介入を行うことなく感染が消失するかどうかを見るために、「監視的待機」または「経過観察」の方法で感染がモニターされうる。幾つかの場合には、本明細書に記載されている方法が陽性試験結果を示す場合、薬物を投与することが可能であり、該薬物がどれほど良好に作用するか、または薬物治療をいつ終了すべきかを調べるために、感染の経過をモニターすることが可能である。幾つかの場合には、必要に応じて療法が改変されうる。

コンピュータ制御システム
本開示は、本開示の方法を実施するようにプログラムされたコンピュータ制御システムを提供する。図７は、本開示の方法を実施するようにプログラムまたは他の方法で構成されたコンピュータシステム７０１を示す。

コンピュータシステム７０１は中央処理装置（ＣＰＵ；本明細書においては「プロセッサ」および「コンピュータプロセッサ」とも称される）７０５を含み、これは単一コアもしくはマルチコアプロセッサ、または並列処理のための複数のプロセッサでありうる。コンピュータシステム７０１はまた、メモリまたはメモリロケーション７１０（例えば、ランダムアクセスメモリ、読み出し専用メモリ、フラッシュメモリ）、電子記憶装置７１５（例えば、ハードディスク）、１以上の他のシステムと通信するための通信インターフェイス７２０（例えば、ネットワークアダプタ）、および周辺装置７２５、例えばキャッシュ、他のメモリ、データ記憶装置および／または電子ディスプレイアダプタを含む。メモリ７１０、記憶装置７１５、インタフェース７２０および周辺装置７２５は、マザーボードのような通信バス（実ライン）を介してＣＰＵ７０５につながっている。記憶装置７１５は、データを格納するためのデータ記憶装置（またはデータリポジトリ）でありうる。コンピュータシステム７０１は、通信インタフェース７２０を用いてコンピュータネットワーク（「ネットワーク」）７３０に機能的に接続されうる。ネットワーク７３０は、インターネット、インターネットおよび／またはエクストラネット、あるいはインターネットとつながったイントラネットおよび／またはエクストラネットでありうる。ネットワーク７３０は、幾つかの場合には、テレコミュニケーションおよび／またはデータネットワークである。ネットワーク７３０は１以上のコンピュータサーバを含み、これは分散コンピューティング、例えばクラウドコンピューティングを可能にしうる。ネットワーク７３０は、幾つかの場合には、コンピュータシステム７０１を用いて、ピアツーピアネットワークを実行することが可能であり、これは、コンピュータシステム７０１に接続した装置がクライアントまたはサーバとして動作することを可能にしうる。

ＣＰＵ７０５は、プログラムまたはソフトウェアにおいて表されうる一連の機械可読命令を実行しうる。命令はメモリ位置、例えばメモリ７１０に格納されうる。命令はＣＰＵ７０５に向けられ、これはついで、本開示の方法を実施するようにＣＰＵ７０５をプログラムまたは構成しうる。ＣＰＵ７０５によって実行される動作の例には、フェッチ、デコード、実行およびライトバックが含まれうる。

ＣＰＵ７０５は集積回路のような回路の一部でありうる。システム７０１の１以上の他の構成要素が回路に含まれうる。幾つかの場合には、回路は特定用途向け集積回路（ＡＳＩＣ）である。

記憶装置７１５は、ファイル、例えばドライバ、ライブラリおよび保存プログラムを格納しうる。記憶装置７１５は、ユーザデータ、例えば、利用者選好およびユーザプログラムを格納しうる。コンピュータシステム７０１は、幾つかの場合には、コンピュータシステム７０１の外部にある１以上の追加的データ記憶装置を含むことが可能であり、該追加的データ記憶装置は、例えば、イントラネットまたはインターネットを介してコンピュータシステム７０１につながっているリモートサーバ上に位置する。

コンピュータシステム７０１はネットワーク７３０を介して１以上のリモートコンピュータシステムと通信可能である。例えば、コンピュータシステム７０１はユーザ（例えば、医療提供者）のリモートコンピュータシステムと通信可能である。リモートコンピュータシステムの例には、パーソナルコンピュータ（例えば、ポータブルＰＣ）、スレートまたはタブレットＰＣ（例えば、Ａｐｐｌｅ（登録商標）ｉＰａｄ、Ｓａｍｓｕｎｇ（登録商標）ＧａｌａｘｙＴａｂ）、電話、スマートフォン（例えば、Ａｐｐｌｅ（登録商標）ｉＰｈｏｎｅ、Ａｎｄｒｏｉｄ対応デバイス、Ｂｌａｃｋｂｅｒｒｙ（登録商標））またはパーソナルデジタルアシスタントが含まれる。ユーザはネットワーク７３０を介してコンピュータシステム７０１にアクセス可能である。

本明細書に記載されている方法は、コンピュータシステム７０１の電子記憶場所、例えばメモリ７１０または電子記憶装置７１５上に記憶された機械（例えば、コンピュータプロセッサ）実行可能コードにより実行されうる。機械実行可能コードまたは機械可読コードはソフトウェアの形態で提供されうる。コードは、使用中に、プロセッサ７０５により実行されうる。幾つかの場合には、コードは記憶装置７１５から検索され、プロセッサ７１０によって容易にアクセスできるようにメモリ７１０に記憶されうる。幾つかの場合には、電子記憶装置７１５は除外可能であり、機械実行可能命令はメモリ７１０に格納される。

コードは、コードを実行するように適合化されたプロセッサを有する機械と共に使用されるように、プリコンパイルされ、構成されることが可能であり、または実行中にコンパイルされうる。コードは、プリコンパイルまたはコンパイル形態でコードが実行可能となるように選択されうるプログラミング言語で供給されうる。

コンピュータシステム７０１のような、本発明で提供するシステムおよび方法の態様は、プログラミングにおいて具体化されうる。該技術の種々の態様は、典型的には機械（またはプロセッサ）実行可能コードの形態および／または機械可読媒体の一種に搭載または組み込まれた関連データの形態の「製品」または「製造品」であると考えられうる。機械実行可能コードは、電子記憶装置、例えばメモリ（例えば、リードオンリメモリ、ランダムアクセスメモリ、フラッシュメモリ）またはハードディスクに格納されうる。「記憶（ストレージ）」タイプのメディアには、コンピュータ、プロセッサなどの有形メモリ、または関連モジュール、例えば種々の半導体メモリ、テープドライブ、ディスクドライブなどのありとあらゆるものが含まれることが可能であり、それらはソフトウェアプログラミングのために任意の時点で非一時的ストレージを提供しうる。ソフトウェアの全部または一部は、時には、インターネットまたは種々の他のテレコミュニケーションネットワークを介して通信されうる。そのような通信は、あるコンピュータまたはプロセッサから別のコンピュータまたはプロセッサへ、例えば、管理サーバまたはホストコンピュータからアプリケーションサーバのコンピュータプラットフォームへの、ソフトウェアのロードを可能にしうる。したがって、ソフトウェア要素を担いうる別のタイプの媒体には、有線および光陸線ネットワークならびに種々のエアリンクを介してローカルデバイス間の物理インタフェースを越えて使用されるような、光波、電波および電磁波が含まれる。そのような波を運ぶ物理的要素、例えば有線または無線リンク、光リンクなども、ソフトウェアを担持する媒体とみなされうる。本明細書中で用いる、コンピュータまたは機械「可読媒体」のような語は、非一時的な有形「記憶」媒体に限定されない限り、実行のためにプロセッサに命令を与えることに関与する任意の媒体を意味する。

したがって、機械可読媒体、例えばコンピュータ実行可能コードは、有形記憶媒体、搬送波媒体または物理的伝送媒体（これらに限定されるものではない）を含む多数の形態を取りうる。不揮発性記憶媒体には、例えば、光学または磁気ディスク、例えば、任意のコンピュータなどにおける記憶装置のいずれか、例えば、図面に示されているデータベースを実行するために使用されうるものが含まれる。揮発性記憶媒体には、動的メモリ、例えば、そのようなコンピュータプラットフォームのメインメモリが含まれる。有形伝送媒体には、同軸ケーブル、銅線および光ファイバ（コンピュータシステム内のバスを構成するワイヤを含む）が含まれる。搬送波伝送媒体は、電気または電磁信号、あるいは音響波または光波、例えば、無線周波数（ＲＦ）および赤外線（ＩＲ）データ通信中に生成されるものの形態を取りうる。したがって、コンピュータ可読媒体の一般的な形態には、例えば、フロッピーディスク、フレキシブルディスク、ハードディスク、磁気テープ、任意の他の磁気媒体、ＣＤ−ＲＯＭ、ＤＶＤまたはＤＶＤ−ＲＯＭ、任意の他の光学媒体、パンチカード紙テープ、ホールのパターンを有する任意の他の物理的記憶媒体、ＲＡＭ、ＲＯＭ、ＰＲＯＭおよびＥＰＲＯＭ、ＦＬＡＳＨ−ＥＰＲＯＭ、任意の他のメモリチップまたはカートリッジ、データまたは命令を搬送する搬送波、そのような搬送波を搬送するケーブルまたはリンク、あるいはコンピュータがプログラミングコードおよび／またはデータを読取りうる任意の他の媒体が含まれうる。コンピュータ可読媒体のこれらの形態の多くは、実行のために１以上の命令のシーケンスの１以上をプロセッサに搬送することに関与しうる。

コンピュータシステム７０１は、電子ディスプレイ７３５を含むことが可能であり、または電子ディスプレイ７３５と通信可能であり、電子ディスプレイ７３５は、対象の診断または対象に対する治療的介入を含みうる報告の出力を提供するユーザインターフェース（ＵＩ）７４０を含む。ＵＩの例には、限定的なものではないが、グラフィカルユーザインタフェース（ＧＵＩ）およびウェブベースユーザインタフェースが含まれる。分析は報告として提供されうる。報告は対象、医療従事者、研究者または他の個人に提供されうる。

本開示の方法およびシステムは１以上のアルゴリズムにより実行されうる。アルゴリズムは、中央処理ユニット７０５による実行に際してソフトウェアにより実行されうる。アルゴリズムは、例えば、病原体または他の標的核酸の富化、配列決定および／または検出を容易にしうる。

患者または対象に関する情報、例えば患者の背景、患者の病歴または医学的スキャンがコンピュータシステムに入力されうる。コンピュータシステムは、本明細書に記載されている方法からの結果を分析するため、あるいは結果を患者または医師に報告するため、あるいは治療計画を策定するために使用されうる。

試薬およびキット
本明細書に記載されている方法の１以上を行うための試薬およびそのキットも提供する。該試薬およびそのキットは多種多様でありうる。関心のある試薬には、対象から得られたサンプルにおける１以上の病原体または他の標的核酸の特定、検出および／または定量における使用のために特別に設計された試薬が含まれる。該キットは、本明細書に記載されている方法、例えばＰＣＲおよび配列決定を用いて核酸抽出および／または核酸検出を行うのに必要な試薬を含みうる。該キットは更に、データ解析用のソフトウェアパッケージを含むことが可能であり、これは、試験プロファイルとの比較のための参照プロファイルを含むことが可能であり、特に、参照データベースを含みうる。該キットは、試薬、例えばバッファーおよび水を含みうる。

そのようなキットはまた、情報、例えば科学文献リファレンス、添付文書資料、臨床試験結果および／またはこれらの概要などを含むことが可能であり、これらは、該組成物の活性および／もしくは利点を示し、もしくは確定し、および／または用量、投与、副作用、薬物相互作用、もしくは医療提供者にとって有用な他の情報を記載している。そのようなキットは、データベースにアクセスするための説明をも含みうる。そのような情報は、種々の研究の結果、例えば、インビボモデルを含む実験動物を用いる研究およびヒト臨床試験に基づく研究に基づくものでありうる。本明細書に記載されているキットは、医師、看護師、薬剤師、処方職員などを含む医療提供者に提供、販売および／または宣伝されうる。キットはまた、幾つかの実施形態においては、消費者に直接販売されうる。

本開示は、配列決定ライブラリーを製造するためのキットをも提供する。該キットは、本明細書に記載されている少なくとも１つの合成核酸、および配列決定ライブラリー反応のための試薬を含みうる。幾つかの場合には、該キットは、１以上の配列決定アダプターおよび１以上の担体（ｃａｒｒｉｅｒ）核酸を含む。該キットにおける担体核酸は、ｉ）末端修復に抵抗性である１以上の担体核酸、ｉｉ）連結に抵抗性である１以上の担体核酸、ｉｉｉ）増幅に抵抗性である１以上の担体核酸、ｉｖ）固定化タグを含む１以上の担体核酸、ｖ）サイズに基づく枯渇を可能にするサイズを有する１以上の担体核酸、および／またはｖｉ）それらの任意の組合せを含みうる。例えば、該キットは、１以上の配列決定アダプター、および末端修復に抵抗性である１以上の担体核酸を含みうる。

キットにおける配列決定ライブラリーアダプターの量および１以上の担体核酸の量は一定の比率でありうる。幾つかの場合には、配列決定ライブラリーアダプターの量と１以上の担体核酸の量との比は、１：１０、１：５、１：１、５：１、１０：１、２０：１、５０：１、１００：１、５００：１、または１０００：１以下である。例えば、配列決定ライブラリーアダプターの量と１以上の担体核酸の量との比は１：１以下でありうる。

担体核酸（ＣＮＡ）
本開示は、担体（ｃａｒｒｉｅｒ）核酸（ＣＮＡ）、特に、配列決定アッセイの工程の１以上からそれを除外するように設計された特徴を含有する密かな（ｓｕｒｒｅｐｔｉｔｉｏｕｓ）ＣＮＡを提供する。本開示はまた、配列決定アッセイの工程の１以上を回避しうるＣＮＡを使用する方法を提供する。本発明で提供するＣＮＡは密かに作用しうるが、それらは、一般に、サンプルにおける全核酸量を増加させることが可能であり、それにより、典型的な「担体」核酸として作用しうる。担体核酸は、一般に、サンプルから配列決定ライブラリーを製造する際の収率および／または効率を改善するために核酸量を増加させ、最終的に配列決定アッセイの精度および／または感度を改善しうる。本発明で提供する修飾ＣＮＡを含む担体核酸の添加は、サンプルが少量（例えば、１ｎｇ未満）の標的核酸を含有する場合に特に有用でありうる。なぜなら、核酸の量が少ないと、ライブラリー製造の１以上の工程（例えば、核酸抽出、核酸精製、核酸末端修復、アダプター連結など）または配列決定アッセイにおける後の工程（例えば、増幅）の効率および／または収率が低下しうるからである。ＤＮＡおよび／またはＲＮＡに基づく核酸は、それらの構造的形態がいずれであっても、および／または１以上の化学修飾を伴う場合も伴わない場合も、関心のある核酸サンプルにＣＮＡとして添加されうる。典型的には、ＣＮＡは、例えば阻害によっても、あるいは、配列決定スループットの過度な部分を占めることによっても、核酸配列決定を妨げない。幾つかの場合には、ＤＮＡサンプルおよび／またはＲＮＡサンプルにＤＮＡＣＮＡを添加する。幾つかの場合には、ＤＮＡサンプルおよび／またはＲＮＡサンプルにＲＮＡＣＮＡを添加する。

本発明で提供するＣＮＡは、配列決定ライブラリー製造の工程の１以上、例えば、末端修復、断片化、増幅、連結および配列決定を回避するように設計または修飾されうる。ＣＮＡは配列決定ライブラリー製造における１以上の工程に添加されうる。例えば、図８に示されているとおり、ＣＮＡは、サンプル採取８０２の途中もしくは直後、サンプル調製、例えば血漿８０３の単離の途中もしくは後、核酸単離８０４もしくは抽出８０５の前、途中もしくは後、核酸精製の前、途中もしくは後に、核酸８０６の末端修復の前、途中もしくは後、連結８０７もしくは核酸にアダプターを結合させるための他の操作の前、途中もしくは後、および／または増幅８０８の前もしくは途中に添加されうる。幾つかの場合には、ＣＮＡは、例えば、酵素消化、アフィニティに基づく枯渇および／またはサイズに基づく枯渇により、配列決定アッセイにおける工程から除去されうる。例えば、本発明で提供するＣＮＡは、それが配列決定ライブラリーに含まれないように、配列決定アッセイの工程から物理的に除去されうる。幾つかの場合には、ＣＮＡは配列決定ライブラリー自体から物理的に除去されうる。

結合に抵抗するＣＮＡ
本発明で提供するＣＮＡは、１以上の配列決定アダプターおよび／または標的核酸のような他の分子に対する結合または連結に抵抗しうる（抵抗性でありうる）。幾つかの場合には、ＣＮＡは、アダプターがＣＮＡよりも優先的に標的核酸に優先的に連結するように設計されうる。アダプターまたは標的核酸への連結または結合を回避することにより、ＣＮＡは配列決定されることも回避されうる。

幾つかの場合、特に、サンプルにおける核酸にアダプターを結合させるために連結を用いる場合には、ＣＮＡは、連結反応に加わることに抵抗するように設計されうる。一般に、連結反応は、２つの核酸をホスホジエステル結合により連結することを含む。幾つかの場合には、ＣＮＡは、連結反応に抵抗する二次構造（例えば、一本鎖構造、ヘアピン構造）を有するように設計されうる。二次構造はＲＮＡ、ＤＮＡ、ｓｓＤＮＡ、ｄｓＤＮＡ、ＤＮＡ−ＲＮＡハイブリッドおよび／または他の特徴を含みうる。幾つかの場合には、ＣＮＡは、連結を妨げるように設計されたブロッキング基または他の構造を含有しうる。

本発明で提供するＣＮＡは、結合または連結に抵抗し又はそれらを低減するように設計された一本鎖および／または二本鎖二次構造を含有しうる。ＣＮＡは１以上の一本鎖領域を含有することが可能であり、あるいは全体が一本鎖でありうる。一本鎖領域はＣＮＡの任意の位置に存在しうるが、幾つかの好ましい場合には、ＣＮＡは、その末端付近または末端の一方もしくは両方に一本鎖領域を含有する。例えば、ＣＮＡは、一方または両方の末端から５０ヌクレオチド以内に、例えば、一方または両方の末端から５０ｎｔ、４５ｎｔ、４０ｎｔ、３５ｎｔ、３０ｎｔ、２５ｎｔ、２０ｎｔ、１５ｎｔ、１０ｎｔまたは５ｎｔ以内に、一本鎖領域を含有しうる。幾つかの好ましい場合には、ＣＮＡは、その末端の一方または両方（例えば、５’末端、３’末端）に一本鎖領域を含有しうる。幾つかの場合には、ＣＮＡは全体が二本鎖であることが可能であり、あるいは、二本鎖である領域を単に含有することが可能である。二次構造（特にヘアピンループ）は、リガーゼによるＣＮＡの結合および／または認識を妨げうる。幾つかの場合には、ＣＮＡはＹ字型二本鎖核酸を含有することが可能であり、その結果、ＣＮＡのＹ字型部分は別の核酸に連結または結合できない。

本発明で提供するＣＮＡに存在しうるヘアピン構造は、一般に、ループおよびハイブリダイゼーション領域、例えばヘアピンステムを有する。例えば、ヘアピンは、二本鎖ハイブリダイゼーション領域を形成する２つの相補的領域と、それらの２つの相補的領域を連結するループとを含みうる。相補的領域は少なくとも５、１０、１５、２０、３０、４０、５０ヌクレオチドを含みうる。ループ領域は少なくとも３、４、５、１０、１５、２０、３０、４０、５０ヌクレオチドを含みうる。一般に、ヘアピン構造は、しばしば、結合を伴わない一本鎖核酸であるため、製造が比較的容易でありうる。ヘアピンはＲＮＡまたはＤＮＡを含有しうる。

本発明で提供するＣＮＡは、結合または連結に抵抗しまたはそれを低減しうる環状構造を含有しうる。環状構造は環状ＤＮＡ、環状ＲＮＡまたは環状ＤＮＡ−ＲＮＡハイブリッドでありうる。幾つかの場合には、環状構造は環状ＤＮＡである。環状構造は二本鎖または一本鎖でありうる。環状構造は、特定の長さ、例えば少なくとも５ｎｔ、１０ｎｔ、２０ｎｔ、３０ｎｔ、３２ｎｔ、４０ｎｔ、５０ｎｔ、６０ｎｔ、７０ｎｔ、８０ｎｔ、９０ｎｔ、１００ｎｔ、１２０ｎｔ、１４０ｎｔ、１６０ｎｔ、１８０ｎｔ、２００ｎｔ、２５０ｎｔ、３００ｎｔ、４００ｎｔ、５００ｎｔまたは１０００ｎｔのものでありうる。幾つかの場合には、環状構造は約３０〜約１００ヌクレオチドを含む。幾つかの場合には、環状構造は約１０ヌクレオチド〜約１０，０００ヌクレオチドの範囲内、例えば約１００ヌクレオチド〜約１，０００ヌクレオチドの範囲内のサイズを有しうる。環状構造が二本鎖である場合、環状構造は少なくとも１０ｂｐ、２０ｂｐ、３０ｂｐ、４０ｂｐ、５０ｂｐ、６０ｂｐ、７０ｂｐ、８０ｂｐ、９０ｂｐ、１００ｂｐ、２００ｂｐ、２５０ｂｐ、３００ｂｐ、４００ｂｐ、５００ｂｐまたは１０００ｂｐのサイズを有しうる。幾つかの場合にて、二本鎖環状構造は約３０ｂｐ〜１００ｂｐを含む。幾つかの場合には、二本鎖環状構造は、約１０塩基対〜約１０，０００塩基対の範囲内、例えば、約１００塩基対〜約１，０００塩基対の範囲内のサイズを有しうる。幾つかの場合には、環状構造は、ある酵素、例えばエンドヌクレアーゼからの消化に対してＣＮＡが抵抗性となることを可能にしうる。例えば、ＣＮＡは二本鎖環状構造を含有することが可能であり、エンドヌクレアーゼ、例えば、二本鎖線状ＤＮＡを消化するが二本鎖環状ＤＮＡを消化しないエンドヌクレアーゼによる消化に抵抗しうる。幾つかの場合には、ＣＮＡは、大部分または全体が環状であり、例えば、環状二本鎖ＤＮＡ、環状一本鎖ＤＮＡである。幾つかの場合には、ＣＮＡは、エンドヌクレアーゼ、例えば、ＣＮＡの二次構造に結合しないおよび／またはそれを認識しないエンドヌクレアーゼによる消化に抵抗する二次構造を含む。例えば、ＣＮＡは、一本鎖ＤＮＡを認識するが二本鎖ＤＮＡを認識しないエンドヌクレアーゼによる消化に抵抗する二本鎖ＤＮＡを含みうる。もう１つの例では、ＣＮＡは、二本鎖ＤＮＡを認識するが一本鎖ＤＮＡを認識しないエンドヌクレアーゼによる消化に抵抗する一本鎖ＤＮＡを含みうる。

幾つかの場合には、ＣＮＡは、１以上のニック（切れ目）を有する二本鎖である。ニックは二本鎖核酸分子において不連続性であることが可能であり、この場合、該鎖の１つの隣接ヌクレオチド間にホスホジエステル結合が存在しない。ニックは酵素（例えば、ニッキングエンドヌクレアーゼ）により生成されうる。幾つかの場合には、ニックは酵素（例えば、リガーゼ）により連結されうる。ある場合には、ニックはエキソヌクレアーゼ消化および／または連結から保護される。

ＣＮＡは、連結反応に抵抗する１以上の修飾（例えば、修飾ヌクレオチド）を含みうる。幾つかの場合には、修飾は、核酸にＣＮＡが連結するのを妨げるブロッキング基でありうる。例えば、ＣＮＡは３’末端、５’末端または両末端にブロッキング基を有しうる。ブロッキング基は、反転（ｉｎｖｅｒｔｅｄ）デオキシ糖を含みうる。反転デオキシ糖は反転デオキシ糖、反転ジデオキシ糖または他の反転デオキシ糖でありうる。反転デオキシ糖は３’反転デオキシ糖または５’反転ジデオキシ糖でありうる。例えば、ブロッキング基は３’反転チミジン（ｄＴ）、３’反転アデノシン（ｄＡ）、３’反転グアノシン（ｄＧ）、３’反転シチジン（ｄＣ）、３’反転デオキシウラシル（ｄＵ）、５’反転ジデオキシチミジン（ｄｄＴ）、５’反転ジデオキシアデノシン（ｄｄＡ）、５’反転ジデオキシグアノシン（ｄｄＧ）、５’反転ジデオキシシチジン（ｄｄＣ）、５’（反転）ジデオキシウラシル（ｄｄＵ）またはそれらの任意の類似体でありうる。幾つかの場合には、ＣＮＡは３’反転チミジンを含む。幾つかの場合には、ＣＮＡは５’反転ジデオキシチミジンを含む。幾つかの場合には、ＣＮＡは３’反転チミジンおよび／または５’反転ジデオキシチミジンを含む。幾つかの場合には、ブロッキング基はジデオキシシチジンを含む。幾つかの場合には、修飾はウラシル（Ｕ）塩基、２’ＯＭｅ修飾ＲＮＡ、Ｃ３−１８スペーサー（例えば、３〜１８個の連続炭素原子を有する構造）、ビオチン、ジ−デオキシヌクレオチドトリホスファート、エチレングリコール、アミンおよび／またはホスファート（リン酸）を含む。

増幅に抵抗する担体核酸
ＣＮＡは、核酸増幅を阻害することにより配列決定反応においてＣＮＡが増幅されることを妨げる１以上の核酸修飾を含みうる。幾つかの場合には、修飾は、例えば、ポリメラーゼを機能停止または阻害（例えば、機能低下）することにより、核酸ポリメラーゼの機能を妨げうる。幾つかの場合には、修飾は１以上の脱塩基（ａｂａｓｉｃ）部位を含みうる。脱塩基部位は、塩基を有さない核酸内の位置を意味しうる。例えば、核酸内の脱塩基部位は、塩基を有さない１’末端に存在しうる。脱塩基部位はアプリンもしくはアピリミジン構造、塩基類似体またはリン酸骨格類似体を有しうる。幾つかの場合には、脱塩基部位は、アミド結合により連結されたＮ−（２−アミノエチル）−グリシン、テトラヒドロフランまたは１’，２’−ジデオキシリボース（ｄＳｐａｃｅｒ）を有する。幾つかの場合には、修飾は、脱塩基部位および修飾糖残基、例えば、３個の炭素原子を含有する糖残基、例えば、部分リボース構造（例えば、３’、４’、５’末端炭素原子のみが保持されている）を含むことが可能であり、それにより、骨格（バックボーン）に沿った接続性が維持されうる。

脱塩基部位は、ＣＮＡをポリメラーゼが増幅するのを妨げうる。幾つかの場合には、ＣＮＡにおける脱塩基部位はポリメラーゼ（例えば、Ｔａｑポリメラーゼ）を脱塩基部位１個当たり１桁阻害しうる。

本発明で提供するＣＮＡは複数の脱塩基部位、例えば、複数の内部脱塩基部位および１以上の他の特徴を含みうる。ＣＮＡは、１以上のライブラリー生成反応に加わることを妨げる特徴を含みうる。例えば、ＣＮＡは１以上の内部脱塩基部位、３’反転ｄＴおよび／または５’反転ｄｄＴを任意の組合せで含みうる。

幾つかの場合には、ＣＮＡは、核酸増幅を阻害する他の修飾を含みうる。幾つかの場合には、核酸増幅を阻害する修飾には、ウラシル（Ｕ）塩基、２’ＯＭｅ修飾ＲＮＡ、Ｃ３−１８スペーサー（例えば、Ｃ３スペーサーのような３〜１８個の連続炭素原子を有する構造）、エチレングリコール多量体スペーサー（例えば、スペーサー１８（ヘキサ−エチレングリコールスペーサー）、ビオチン、ジ−デオキシヌクレオチドトリホスファート、エチレングリコール、アミンおよび／またはホスファート）が含まれる。

修飾
ＣＮＡは少なくとも１、２、３、４、５、６、７、８、９、１０個またはそれ以上の修飾（例えば、脱塩基部位）を含みうる。ＣＮＡが複数の修飾（例えば、核酸増幅を阻害する修飾）を含む場合、修飾はクラスター化されうる（例えば、修飾は互いに隣接して連続して位置する）。幾つかの場合には、１以上の修飾がＣＮＡの５’末端に存在する。幾つかの場合には、１以上の修飾がＣＮＡの３’末端に存在する。幾つかの場合には、前記の１以上の修飾はＣＮＡの３’末端および５’末端の両方に存在する。幾つかの場合には、前記の１以上の修飾はＣＮＡの内部位置に存在する。例えば、ＣＮＡは、１以上の内部ｄｓｐａｃｅｒ（ｉｄｓｐ）を含みうる。

本明細書に記載されている修飾には、２−アミノプリン、２，６−ジアミノプリン、５−ブロモｄＵ、デオキシウリジン、反転ｄＴ、反転ジデオキシ−Ｔ、ジデオキシ−Ｃ、５−メチルｄＣ、デオキシノシン、汎用塩基、例えば５−ニトロインドール、２’−Ｏ−メチルＲＮＡ塩基、イソ−ｄＣ、イソ−ｄＧ、リボヌクレオチド、モルホリノ、タンパク質ヌクレオチド類似体、糖ヌクレオチド類似体、ロックド（Ｌｏｃｋｅｄ）ヌクレオチド類似体、トレオースヌクレオチド類似体、鎖終結ヌクレオチド類似体、チオウリジン、プソイドウリジン、ジヒドロウリジン、キューオシン、ワイオシンヌクレオチド、脱塩基部位、官能基、例えばアルキン官能基、アジド官能基、例えばアジド（ＮＨＳエステル、非天然結合、例えばホスホロチオアート結合、スペーサー、例えば２’−ジデオキシリボース（ｄＳｐａｃｅｒ）、ヘキサンジオール、光切断性スペーサー、種々の数の炭素原子を有する種々の長さのスペーサー、例えばＣ３スペーサーホスホラミダイト、Ｃ９スペーサー、例えばトリエチレングリコールスペーサー、ＣＩ８（１８原子ヘキサエチレングリコールスペーサー）が含まれうる。そのようなスペーサーはＣＮＡまたはアダプターの５’末端または３’末端または内部に組み込まれうる。更に、ＣＮＡの少なくとも１つの鎖は、例えば、５’ホスファートまたは３’ホスファート（例えば、相補鎖上）のいずれかまたは両方を含むように、リン酸化により修飾されうる。

酵素認識部位
ＣＮＡは、配列決定ライブラリーからＣＮＡが除去されることを可能にする特徴を含みうる。そのような特徴は酵素認識部位を含みうる。例えば、ＣＮＡは、合成核酸が酵素により分解されうるように、１以上の酵素認識部位を含みうる。幾つかの場合には、ＣＮＡは、標的核酸およびアダプターに存在しない１以上の酵素認識部位を含みうる。したがって、担体核酸は、標的核酸またはアダプターの酵素分解をもたらすことなく、認識部位を標的とする酵素により除去されうる。

幾つかの場合には、ＣＮＡはヌクレアーゼ認識部位を含みうる。例えば、ヌクレアーゼ認識部位はエンドヌクレアーゼ認識部位でありうる。エンドヌクレアーゼはＩ型、ＩＩ型（ＩＩＳ型、ＩＩＧ型を含む）、ＩＩＩ型またはＩＶ型エンドヌクレアーゼでありうる。幾つかの場合には、エンドヌクレアーゼ認識部位は制限ヌクレアーゼ認識部位である。例えば、エンドヌクレアーゼ認識部位は、ＡａｔＩＩ、Ａｃｃ６５Ｉ、ＡｃｃＩ、ＡｃｌＩ、ＡａｔＩＩ、Ａｃｃ６５Ｉ、ＡｃｃＩ、ＡｃｌＩ、ＡｆｅＩ、ＡｆｌＩＩ、ＡｇｅＩ、ＡｐａＩ、ＡｐａＬＩ、ＡｐｏＩ、ＡｓｃＩ、ＡｓｅＩ、ＡｓｉＳＩ、ＡｖｒＩＩ、ＢａｍＨＩ、ＢｃｌＩ、ＢｇｌＩＩ、Ｂｍｅ１５８０Ｉ、ＢｍｔＩ、ＢｓａＨＩ、ＢｓｉＥＩ、ＢｓｉＷＩ、ＢｓｐＥＩ、ＢｓｐＨＩ、ＢｓｒＧＩ、ＢｓｓＨＩＩ、ＢｓｔＢＩ、ＢｓｔＺ１７Ｉ、ＢｔｇＩ、ＣｌａＩ、ＤｒａＩ、ＥａｅＩ、ＥａｇＩ、ＥｃｏＲＩ、ＥｃｏＲＶ、ＦｓｅＩ、ＦｓｐＩ、ＨａｅＩＩ、ＨｉｎｃＩＩ、ＨｉｎｄＩＩＩ、ＨｐａＩ、ＫａｓＩ、ＫｐｎＩ、ＭｆｅＩ、ＭｌｕＩ、ＭｓｃＩ、ＭｓｐＡ１Ｉ、ＭｆｅＩ、ＭｌｕＩ、ＭｓｃＩ、ＭｓｐＡ１Ｉ、ＮａｅＩ、ＮａｒＩ、ＮｃｏＩ、ＮｄｅＩ、ＮｇｏＭＩＶ、ＮｈｅＩ、ＮｏｔＩ、ＮｒｕＩ、ＮｓｉＩ、ＮｓｐＩ、ＰａｃＩ、ＰｃｉＩ、ＰｍｅＩ、ＰｍｌＩ、ＰｓｉＩ、ＰｓｐＯＭＩ、ＰｓｔＩ、ＰｖｕＩ、ＰｖｕＩＩ、ＳａｃＩ、ＳａｃＩＩ、ＳａｌＩ、ＳｂｆＩ、ＳｃａＩ、ＳｆｃＩ、ＳｆｏＩ、ＳｇｒＡＩ、ＳｍａＩ、ＳｍｌＩ、ＳｎａＢＩ、ＳｐｅＩ、ＳｐｈＩ、ＳｓｐＩ、ＳｔｕＩ、ＳｗａＩ、ＸｂａＩ、ＸｈｏＩまたはＸｍａＩの認識部位でありうる。酵素認識部位は、前記で挙げられていないＤＮアーゼ、例えばエキソデオキシリボヌクレアーゼの部位でありうる。酵素認識部位はウラシルＤＮＡグリコシラーゼ（ＵＤＧ）、ＤＮＡグリコシラーゼ−リアーゼ（エンドヌクレアーゼＶＩＩＩ）またはそれらの混合物（例えば、ウラシル特異的切断試薬（ＵＳＥＲ）酵素）の部位でありうる。例えば、ＣＮＡは１以上のウラシル（例えば、内部ウラシル）を含みうる。酵素認識部位はＲＮＡ誘導ＤＮアーゼの部位、例えばＣＲＩＳＰＲ関連タンパク質ヌクレアーゼ、例えばＣａｓ９の部位でありうる。ある場合には、ヌクレアーゼ認識部位は、ＲＮアーゼ、例えばエンドリボヌクレアーゼ、例えばＲＮアーゼＡ、ＲＮアーゼＨ、ＲＮアーゼＩＩＩ、ＲＮアーゼＬ、ＲＮアーゼＰ、ＲＮアーゼＰｈｙＭ、ＲＮアーゼＴ１、ＲＮアーゼＴ２、ＲＮアーゼＵ２、ＲＮアーゼＶ、またはエキソリボヌクレアーゼ、例えばポリヌクレオチドホスホリラーゼ、ＲＮアーゼＰＨ、ＲＮアーゼＲ、ＲＮアーゼＤ、ＲＮアーゼＴ、オリゴリボヌクレアーゼ、エキソリボヌクレアーゼＩまたはエキソリボヌクレアーゼＩＩの認識部位でありうる。幾つかの特定の例では、ＣＮＡは制限酵素認識部位を含むことが可能であり、本発明で提供する方法は、そのような部位を認識する制限酵素でＣＮＡを消化することを含みうる。幾つかの場合には、ＣＮＡは、酵素（例えば、ＣＮＡに結合しおよび／またはＣＮＡを分解する酵素）、リボザイム、アプタマーおよびＤＮＡに基づく触媒または結合ポリマーにより認識されうる二次または三次構造を含む。幾つかの場合には、ＣＮＡは、酵素により認識されうる１以上の特異的結合性核酸配列を含む。

幾つかの場合には、ＣＮＡは、ＤＮアーゼまたはＲＮアーゼにより分解されうるＤＮＡ−ＲＮＡハイブリッドを含みうる。幾つかの場合には、ＣＮＡはＤＮＡ−ＲＮＡ−ＤＮＡハイブリッドを含む。そのような分子は二本鎖でありうる。ＣＮＡの末端領域はデオキシリボヌクレオチドを含みうる。内部領域はリボヌクレオチドを含みうる。幾つかの場合には、ＤＮＡ−ＲＮＡハイブリッドは標的核酸またはアダプターに連結することが可能であり、ついでＤＮＡ−ＲＮＡハイブリッドは配列決定の前（例えば、増幅工程の前）にＲＮアーゼにより消化されうる。幾つかの特定の場合には、ＤＮＡ−ＲＮＡハイブリッドは（例えば、ＲＮアーゼにより）消化され、一方、標的核酸（例えばＤＮＡ、例えば無細胞ＤＮＡ）はＲＮアーゼによっては消化されない。

ＣＮＡのＤＮＡ部分が、増幅に抵抗するのに十分な程度に長い場合には、配列決定の前にＤＮＡ−ＲＮＡハイブリッドを除去するためのＲＮアーゼ消化工程は必要ないかもしれない。あるいは、ＤＮＡ−ＲＮＡハイブリッド分子が増幅前に酵素消化により分解される場合には、ＤＮＡ−ＲＮＡハイブリッドは、増幅に抵抗するサイズまたは長さを有する必要がないかもしれない。

サイズに基づく枯渇のためのＣＮＡ
ＣＮＡは、サイズに基づく枯渇（ｄｅｐｌｅｔｉｏｎ）により配列決定ライブラリーから分離されうるサイズを有しうる。幾つかの場合には、ＣＮＡは、標的核酸の長さよりも長い、または標的核酸の平均長よりも長い長さを有する。例えば、ＣＮＡは、標的核酸の長さ又は標的核酸の平均長より少なくとも１．５、２、３、４、５、１０、２０または５０倍長い長さを有しうる。ＣＮＡは少なくとも１５０ｂｐ、２００ｂｐ、３００ｂｐ、４００ｂｐ、５００ｂｐ、６００ｂｐ、８００ｂｐ、１ｋｂ、２ｋｂ、５ｋｂまたは１０ｋｂの長さを有しうる。例えば、ＣＮＡは少なくとも５００ｂｐの長さを有しうる。幾つかの場合には、ＣＮＡは約１５０ｂｐ〜約１０００ｂｐの範囲内のサイズを有しうる。幾つかの場合には、ＣＮＡは２ｋｂまでのサイズを有しうる。幾つかの場合には、ＣＮＡの長さは標的核酸の長さまたは標的核酸の平均長より短い。例えば、ＣＮＡは標的核酸の長さまたは標的核酸の平均長の多くとも９９％、９５％、９０％、８０％、６０％、５０％、４０％、２０％または１０％の長さを有しうる。幾つかの場合には、ＣＮＡは標的核酸のサイズまたは標的核酸の平均サイズの多くとも５０％のサイズを有しうる。ある場合には、ＣＮＡは標的核酸または標的核酸の平均長と実質的に同じ長さを有する。

サイズに基づく枯渇を可能にするサイズまたは長さを有するＣＮＡは、本開示に記載されている任意の修飾、例えば、連結、増幅、末端修復またはそれらの組合せを妨げるための修飾を含有しうる。幾つかの場合には、ＣＮＡの末端の一方または両方は該修飾の１以上を含有しうる。幾つかの場合には、修飾は内部修飾、例えば内部脱塩基部位、または末端修飾と内部修飾との組合せでありうる。

幾つかの特定の例においては、ＣＮＡは、サイズに基づく枯渇を可能にする、より長い長さ、および連結を妨げる反転塩基のような修飾（例えば、末端修飾など）を有しうる。連結を防止するまたは妨げる構造の他の組合せも可能である（例えば、ヘアピンループ、ヘアピンループと末端修飾との組合せ）。幾つかの場合には、ＣＮＡは１以上のヘアピン構造および１以上の脱塩基部位を含みうる。幾つかの特定の場合には、ＣＮＡは、５００ｂｐを超えるサイズまたは長さを有することが可能であり、３’反転ｄＴ、５’反転ｄｄＴ、Ｃ３スペーサー、またはスペーサー１８、またはヘアピン構造（一方の末端に存在する）を有しうる。幾つかの特定の場合には、ＣＮＡは、６００ｂｐを超えるサイズまたは長さを有することが可能であり、３’反転ｄＴ、５’反転ｄｄＴ（一方の末端に存在する）および１以上の内部脱塩基部位を有しうる。

固定化タグ
ＣＮＡは１以上の固定化タグを含みうる。固定化タグは、アフィニティに基づく枯渇による溶液（例えば、配列決定ライブラリーの溶液）からＣＮＡを除去するために使用されうる。例えば、固定化タグは固体支持体、例えばビーズまたはプレートに結合しうる。溶液を固体支持体に接触させた際に、ＣＮＡは溶液から除去されうる。１以上の固定化タグを含むＣＮＡは標的核酸より短いことが可能である。あるいは、ＣＮＡ分子は、例えば、配列決定反応へのＣＮＡの持ち越し（キャリーオーバー）を最小限に抑えるために、標的核酸より長いことが可能である。

固定化タグには、ビオチン、ジゴキシゲニン、Ｎｉ−ニトリロトリ酢酸、デスチオビオチン、ヒスチジン、ポリヒスチジン、ｍｙｃ、ヘマグルチニン（ＨＡ）、ＦＬＡＧ、蛍光タグ、タンデムアフィニティー精製（ＴＡＰ）タグ、グルタチオンＳトランスフェラーゼ（ＧＳＴ）、ポリヌクレオチド、アプタマー、ポリペプチド（例えば、抗原または抗体）またはそれらの誘導体が含まれうる。例えば、ＣＮＡはビオチン、例えば、内部または末端ビオチン化鎖を含みうる。幾つかの場合には、固定化タグは磁気感受性材料、例えば磁石、または磁気感受性金属を含みうる。幾つかの特定の例においては、ビオチン化ＣＮＡは、増幅工程の前に、サンプルまたは配列決定ライブラリーからの、ＣＮＡの、磁気ビーズに基づく枯渇（例えば、アビジン−磁気ビーズによるもの）を可能にしうる。幾つかの場合には、ＣＮＡは、固体支持体に結合しうる又は固定化タグに結合しうる二次または三次構造を含む。

幾つかの場合には、標的核酸および／または配列決定ライブラリー核酸は１以上の固定化タグを含む。これらの場合には、ＣＮＡは固定化タグを含まず、または標的核酸とは異なる固定化タグを含む。したがって、ＣＮＡは、異なる固定化タグを使用する、アフィニティに基づく枯渇により、標的核酸および／または配列決定ライブラリ核酸から分離されうる。例えば、標的核酸および／または配列決定ライブラリー核酸は固体支持体上に固定化されることが可能であり、一方、ＣＮＡは洗い流されうる。幾つかの場合には、ＣＮＡは直接的または間接的に固定化タグに連結される。幾つかの場合には、ＣＮＡは固定化タグから切断される。

ＣＮＡは、本明細書に開示されている特徴および構造の組合せを含みうる。幾つかの場合には、ＣＮＡは、核酸増幅を阻害する１以上の修飾と、連結反応に抵抗する１以上の修飾とを含む。例えば、ＣＮＡは１以上の脱塩基部位（例えば、内部ｄｓｐａｃｅｒ）および反転デオキシ塩基（例えば、３’反転チミジン）を含みうる。修飾を含むＣＮＡは更に、酵素認識部位および／または固定化タグを含みうる。ある場合には、ＣＮＡは、１以上の固定化タグを有するＤＮＡ−ＲＮＡハイブリッド、例えばビオチン化ＤＮＡ−ＲＮＡ−ＤＮＡハイブリッド分子を含む。ＣＮＡは、特定の酵素またはタンパク質、非アミノ酸に基づく任意の触媒またはアフィニティ単位、例えばリボザイム、ＤＮＡに基づく触媒高分子および分子刷込高分子に対して高いアフィニティを有する核酸の二次および／または三次構造をも有しうる。

サンプルにおける核酸に対する担体核酸の比
例えば、サンプルにおける核酸から配列決定ライブラリーを製造するために、核酸を含むサンプルに特定の量のＣＮＡが添加されうる。幾つかの場合には、サンプルにおける全核酸の量とサンプルに添加されるＣＮＡの量との比は少なくとも１：１００，１：５０、１：１０、１：１、１０：１、５０：１、１００：１、５００：１、１０００：１、２０００：１、または５０００：１である。幾つかの場合には、サンプルにおける標的核酸の量とサンプルに添加されるＣＮＡの量との比は少なくとも１：１００、１：５０、１：１０、１：１、１０：１、５０：１、１００：１、５００：１、１０００：１、２０００：１または５０００：１である。幾つかの場合には、サンプルにおける全核酸の量とサンプルに添加されるＣＮＡの量との比は多くとも１０：１、１：１、１：１０、１：５０、１：１００、１：５００、１：１０００、１：２０００または１：５０００である。幾つかの場合には、サンプルにおける標的核酸の量とサンプルに添加されるＣＮＡの量との比は多くとも１０：１、１：１、１：１０、１：５０、１：１００、１：５００、１：１０００、１：２０００または１：５０００である。幾つかの場合には、サンプルにおける全核酸の量とサンプルに添加されるＣＮＡの量との比は約１：１〜約１：１００の範囲内である。幾つかの場合には、サンプルにおける標的核酸の量とサンプルに添加されるＣＮＡの量との比は約１：１〜約１：１００の範囲内である。幾つかの場合には、該比はモル比である。

配列決定ライブラリーを製造する際のＣＮＡの使用方法
本明細書の開示は配列決定ライブラリーの製造方法を含む。該方法は、配列決定ライブラリーの製造の効率および／または収率を改善するために、本明細書に開示されているＣＮＡを添加することを含みうる。配列決定ライブラリーは、配列決定に付される核酸分子の集団を意味しうる。該方法は、標的核酸および／またはアダプター（例えば、配列決定アダプター）を含むサンプル、ならびに１以上のＣＮＡを得ることを含みうる。該方法は更に、配列決定ライブラリーを製造するための１以上を含みうる。該方法はまた、配列決定ライブラリーにおける１以上の核酸を配列決定することを含みうる。ＣＮＡは配列決定されないことが可能である。例えば、ＣＮＡはライブラリーから物理的に除去されることが可能であり、あるいは、配列決定ライブラリーの製造における１以上の工程にそれが関与しないように設計されることが可能である。

該方法は、標的核酸および／またはアダプターを含むサンプルにＣＮＡを添加することを含みうる。サンプルに添加されるＣＮＡの量は少なくとも０．１ｎｇ、０．５ｎｇ、１ｎｇ、５ｎｇ、１０ｎｇ、２０ｎｇ、３０ｎｇ、４０ｎｇ、５０ｎｇ、６０ｎｇ、７０ｎｇ、８０ｎｇ、９０ｎｇ、１００ｎｇ、１５０ｎｇ、２００ｎｇ、３００ｎｇ、４００ｎｇまたは５００ｎｇである。幾つかの場合には、ＣＮＡの量は０．１ｎｇ〜２００ｎｇ、１ｎｇ〜１００ｎｇ、５ｎｇ〜８０ｎｇ、１０〜６０ｎｇ、または２０ｎｇ〜５０ｎｇでありうる。サンプルにおけるＣＮＡの濃度は少なくとも０．１ｎｇ／ｍＬ、０．５ｎｇ／ｍＬ、０．６ｎｇ／ｍＬ、０．８ｎｇ／ｍＬ、１ｎｇ／ｍＬ、２ｎｇ／ｍＬ、５ｎｇ／ｍＬ、１０ｎｇ／ｍＬ、０．０１ｎｇ／μＬ、０．０５ｎｇ／μＬ、０．１ｎｇ／μＬ、０．２ｎｇ／μＬ、０．４ｎｇ／μＬ、０．８ｎｇ／μＬ、１ｎｇ／μＬ、１．２ｎｇ／μＬ、１．５ｎｇ／μＬ、２ｎｇ／μＬ、５ｎｇ／μＬまたは１０ｎｇ／μＬでありうる。幾つかの場合には、サンプルに添加されるＣＮＡの量は約１ｎｇ／１５μＬ〜約５ｎｇ／１５μＬの範囲内でありうる。幾つかの場合には、サンプルに添加されるＣＮＡの量は約０．０５ｎｇ／μＬ〜約０．５ｎｇ／μＬの範囲内でありうる。

本明細書における方法は、本開示の全体にわたって記載されている任意のタイプの合成核酸を添加することを含みうる。例えば、該方法は、以下の合成核酸、すなわち、配列決定ライブラリーの製造のための合成核酸、標的核酸の相対的存在量を正規化するための合成核酸（例えば、既知濃度の合成核酸）、および／またはサンプルにおける核酸の多様性減少を決定するための合成核酸の１以上を添加することを含みうる。

核酸抽出
該方法はサンプルから核酸（例えば、標的核酸、無細胞核酸）を抽出することを含みうる。抽出は、サンプル中に存在しうる他の細胞成分および汚染物、例えば生物学的流体または組織サンプルから核酸を分離することを含みうる。幾つかの場合には、フェノールクロロホルム抽出または有機溶媒（例えば、エタノールまたはイソプロパノール）による沈殿により抽出を行う。幾つかの場合には、核酸結合カラムを使用して抽出を行う。幾つかの場合には、商業的に入手可能なキット、例えばＱｉａｇｅｎＱｉａｍｐ循環核酸キット（ＣｉｒｃｕｌａｔｉｎｇＮｕｃｌｅｉｃＡｃｉｄＫｉｔ）ＱｉａｇｅｎＱｕｂｉｔｄｓＤＮＡＨＳアッセイキット、Ａｇｉｌｅｎｔ（商標）ＤＮＡ１０００キット、ＴｒｕＳｅｑ（商標）配列決定ライブラリー製造（ＳｅｑｕｅｎｃｉｎｇＬｉｂｒａｒｙＰｒｅｐａｒａｔｉｏｎ）、または核酸結合スピンカラム（例えば、ＱｉａｇｅｎＤＮＡミニプレップキット）を使用して抽出を行う。幾つかの場合には、無細胞核酸の抽出は濾過または限外濾過を含みうる。

ＣＮＡは抽出の前または途中にサンプルに添加されうる。例えば、担体核酸は、それが抽出試薬、例えば抽出バッファーと混合される前に、サンプルに添加されうる。あるいは、担体核酸は、抽出試薬、例えば抽出バッファーに添加され、ついでそれがサンプルと混合されうる。ある場合には、ＣＮＡはサンプルと抽出試薬、例えば抽出バッファーとの混合物にも添加されうる。これらの場合には、標的核酸およびＣＮＡは同時に抽出されうる。

サンプルへのＣＮＡの添加は核酸抽出の収率を増加させうる。標的核酸をＣＮＡと共に抽出する収率は、標的核酸をＣＮＡの非存在下で抽出する収率よりも、例えば少なくとも１０％、２０％、４０％、６０％、８０％、１００％、２倍、４倍、６倍、８倍または１０倍高くなりうる。幾つかの場合には、ＣＮＡは、核酸抽出後に標的核酸を含むサンプルに添加されうる。該抽出は少なくとも１０ｎｇ、５０ｎｇ、１００ｎｇ、２００ｎｇ、３００ｎｇ、４００ｎｇ、５００ｎｇ、６００ｎｇ、７００ｎｇ、８００ｎｇ、９００ｎｇまたは１０００ｎｇの核酸を与えうる。

核酸の精製
該方法は、標的核酸を精製することを含みうる。典型的な精製方法には、エタノール沈殿、イソプロパノール沈殿、フェノールクロロホルム精製、およびカラム精製（例えば、アフィニティに基づくカラム精製）、透析、濾過または限外濾過が含まれる。

ＣＮＡは精製の前または途中にサンプルに添加されうる。例えば、担体核酸は、それが精製試薬、例えば精製バッファーと混合される前に、サンプルに添加されうる。あるいは、担体核酸は、精製試薬、例えば精製バッファーに添加され、ついでそれがサンプルと混合されうる。ある場合には、ＣＮＡはサンプルと精製試薬、例えば精製バッファーとの混合物にも添加されうる。これらの場合には、標的核酸およびＣＮＡは同時に抽出されうる。

サンプルへのＣＮＡの添加は核酸精製の収率を増加させうる。標的核酸をＣＮＡと共に精製する収率は、標的核酸をＣＮＡの非存在下で精製する収率よりも、例えば少なくとも１０％、２０％、４０％、６０％、８０％、１００％、２倍、４倍、６倍、８倍または１０倍高くなりうる。幾つかの場合には、ＣＮＡは、核酸精製後に標的核酸を含むサンプルに添加されうる。幾つかの場合には、ＣＮＡが添加されたサンプルにおける核酸の精製はサンプルにおける全核酸の少なくとも１ｐｇ、１０ｐｇ、５０ｐｇ、１００ｐｇ、５００ｐｇ、１ｎｇ、５ｎｇ、１０ｎｇ、５０ｎｇ、１００ｎｇ、２００ｎｇ、３００ｎｇ、４００ｎｇ、５００ｎｇ、６００ｎｇ、７００ｎｇ、８００ｎｇ、９００ｎｇまたは１０００ｎｇを与える。幾つかの場合には、ＣＮＡが添加されたサンプルにおける核酸の精製はサンプルにおける標的核酸の少なくとも１ｐｇ、１０ｐｇ、５０ｐｇ、１００ｐｇ、５００ｐｇ、１ｎｇ、５ｎｇ、１０ｎｇ、５０ｎｇ、１００ｎｇ、２００ｎｇ、３００ｎｇ、４００ｎｇ、５００ｎｇ、６００ｎｇ、７００ｎｇ、８００ｎｇ、９００ｎｇまたは１０００ｎｇを与える。

断片化
該方法は、標的核酸を断片化することを含みうる。標的核酸の断片化は、例えば機械的剪断、サンプルをシリンジに通すこと、超音波処理、加熱処理またはそれらの組合せにより行われうる。幾つかの場合には、標的核酸の断片化は、ヌクレアーゼまたはトランスポザーゼを含む酵素を使用することにより行われる。断片化に使用されるヌクレアーゼは、制限エンドヌクレアーゼ、ホーミングエンドヌクレアーゼ、ニッキングエンドヌクレアーゼ、高忠実度制限酵素、または本明細書に開示されている任意の酵素を含みうる。該方法は、標的核酸を、ある長さ、例えば少なくとも５０、６０、８０、１００、１２０、１４０、１６０、１８０、２００、３００、４００、５００、１０００、２０００、４０００、６０００、８０００または１００００ｂｐの長さの断片に断片化することを含みうる。ＣＮＡは標的核酸の断片化の前にサンプルに添加されうる。ＣＮＡは標的核酸の断片化の後でサンプルに添加されうる。

Ａ−テーリング
該方法は、標的核酸に対してＡ−テーリング（ｔａｉｌｉｎｇ）を行うことを含みうる。Ａ−テーリング反応は、１以上のＡ−テーリング酵素を使用して行われうる。例えば、単一の３’アデニン残基を付加する非プルーフリーディングＤＮＡポリメラーゼおよびｄＡＴＰと共にＤＮＡをインキュベートすることにより、アデニン（Ａ）残基を付加することが可能である。Ａ−テーリングの前に、標的核酸を含むサンプルにＣＮＡを添加することが可能である。あるいは、Ａ−テーリングの後に、標的核酸を含むサンプルにＣＮＡを添加することが可能である。

末端修復
該方法は、標的核酸に対して末端修復を行うことを含みうる。例えば、標的核酸が配列決定ライブラリーの他の工程に適合しうるように、標的核酸に対して末端修復が行われうる。末端修復反応は、１以上の末端修復酵素を使用して行われうる。ＤＮＡを修復するための酵素はポリメラーゼおよびエキソヌクレアーゼを含みうる。例えば、ポリメラーゼは、５’から３’の方向に、ＤＮＡ鎖の欠失塩基を埋めることが可能である。得られる二本鎖ＤＮＡは元の最長ＤＮＡ鎖と実質的に同じ長さを有しうる。エキソヌクレアーゼは３’オーバーハングを除去しうる。得られる二本鎖ＤＮＡは元の最短ＤＮＡ鎖と実質的に同じ長さを有しうる。

ＣＮＡは、末端修復の前に、標的核酸を含むサンプルに添加されうる。幾つかの場合には、ＣＮＡの添加は末端修復反応の効率を、例えば少なくとも１０％、２０％、４０％、６０％、８０％または１００％増加させる。幾つかの場合には、ＣＮＡは、末端修復の後で、標的核酸を含むサンプルに添加されうる。幾つかの場合には、ＣＮＡの添加は、酵素、例えば末端修復酵素の活性および／または機能を維持しうる。例えば、酵素は、核酸の量が少ないサンプルにおいては、低下した活性または異常な機能を有する可能性があり、ＣＮＡの添加はサンプルにおける全核酸量を増加させることが可能であり、その結果、酵素はサンプルにおいて正常に機能することが可能である。

アダプターの結合
該方法は、１以上のアダプターを標的核酸に結合させることを含みうる。アダプターは、プライマー伸長、逆転写またはハイブリダイゼーションにより標的核酸に結合されうる。幾つかの場合には、アダプターは連結により標的核酸に結合される。例えば、アダプターは、リガーゼにより標的核酸に結合されうる。例えば、アダプターは粘着末端連結または平滑末端連結により標的核酸に結合されうる。幾つかの場合には、アダプターはトランスポザーゼにより標的核酸に結合されうる。標的核酸は３’末端、５’末端またはそれらの両方の末端においてアダプターに結合されうる。幾つかの場合には、標的核酸は、両方の末端において、同じアダプターまたは異なるアダプターに結合される。幾つかの場合には、標的核酸は、一方の末端において、１以上のアダプターに結合されうる。

ＣＮＡは結合工程の前に添加されうる。あるいは、ＣＮＡは結合工程の後で添加されうる。ＣＮＡは連結反応に抵抗しうる。例えば、ＣＮＡは、標的核酸および／またはアダプターとの連結に抵抗しうる。これらの場合、ＣＮＡが結合工程の前に添加された場合、それらは標的核酸またはアダプターのいずれにも連結せず、配列決定工程において配列決定されない。他の場合には、ＣＮＡは結合工程の前にサンプルから除去されうる。あるいは、ＣＮＡはサンプル抽出の後および結合工程の前に除去されうる。

サンプルにおける標的核酸にアダプターを結合させる前に、サンプルを酵素で処理することが可能である。例えば、サンプルをエンドヌクレアーゼで処理して、連結部位、例えば粘着末端または平滑末端を生成させることが可能である。あるいは、アダプターが標的核酸に結合した後、サンプルを酵素で処理することが可能である。

増幅
該方法は、標的核酸を増幅することを含みうる。増幅は、核酸配列のコピー数を増加させるための任意の方法を意味しうる。例えば、増幅は、例えば１以上のポリメラーゼ連鎖反応において、ポリメラーゼを使用して行われうる。増幅は、当技術分野で公知の方法を用いて行われうる。これらの方法は、しばしば、核酸またはその相補体の複数のコピーの産物触媒形成によるものである。そのような方法の１つとして、以下のものを含むポリメラーゼ連鎖反応（ＰＣＲ）が挙げられる：ＡＦＬＰ（増幅断片長多型）ＰＣＲ、対立遺伝子特異的ＰＣＲ、ＡｌｕＰＣＲ、アセンブリ、非対称ＰＣＲ、コロニーＰＣＲ、ヘリカーゼ依存性ＰＣＲ、ホットスタートＰＣＲ、インバースＰＣＲ、ｉｎｓｉｔｕ（インシトゥ）ＰＣＲ、配列間特異的ＰＣＲまたはＩＳＳＲＰＣＲ、デジタルＰＣＲ、ドロップレット（ｄｒｏｐｌｅｔ）デジタルＰＣＲ、線形後指数関数的ＰＣＲまたはレイト（Ｌａｔｅ）ＰＣＲ、ロング（ｌｏｎｇ）ＰＣＲ、ネスティッドＰＣＲ、リアルタイムＰＣＲ、二重ＰＣＲ、マルチプレックスＰＣＲ、定量的ＰＣＲまたはシングルセルＰＣＲ。リガーゼ連鎖反応（ＬＣＲ）、核酸配列ベース増幅（ＮＡＳＢＡ）、線形増幅、等温線形増幅、Ｑ−ベータ−レプリカーゼ法、３ＳＲ、転写媒介増幅（ＴＭＡ）、鎖置換（ＳｔｒａｎｄＤｉｓｐｌａｃｅｍｅｎｔ）増幅（ＳＤＡ）またはローリングサークル増幅（ＲＣＡ）を含む他の増幅方法も用いられうる。

ＣＮＡは増幅前に添加されうる。あるいは、ＣＮＡは増幅後に添加されうる。ＣＮＡは増幅されないことが可能である。例えば、ＣＮＡは、増幅を阻害する修飾を含みうる。これらの場合、ＣＮＡが増幅前に添加されると、それは増幅されない。したがって、ＣＮＡは配列決定ライブラリーに存在しない、または配列決定されないことが可能である。

ＣＮＡの除去
該方法は更に、ＣＮＡをサンプルから除去することを含むことが可能であり、これは、しばしば、ＣＮＡが配列決定されることを妨げる。幾つかの場合には、該方法は、サンプルからＣＮＡの一部または全部を除去して、配列決定サンプルを調製することを含む。得られる配列決定サンプルはＣＮＡを含有していないことが可能であり、配列決定にそのまま使用されうる。幾つかの場合には、該方法は、サンプルにおける他の核酸、例えば標的核酸、アダプターまたはアダプターの多量体よりも優先的に、少なくとも１つのＣＮＡを除去することを含む。

ＣＮＡの除去は、酵素を使用して行われうる。例えば、ＣＮＡは酵素、例えば酵素消化により分解されうる。幾つかの場合には、該方法は、ヌクレアーゼを使用してＣＮＡを除去することを含む。例えば、該方法は、エンドヌクレアーゼ、例えばＩ型、ＩＩ型（ＩＩＳ型、ＩＩＧ型を含む）、ＩＩＩ型またはＩＶ型エンドヌクレアーゼを使用して、ＣＮＡを除去することを含みうる。該方法は、制限エンドヌクレアーゼ、例えばＡａｔＩＩ、Ａｃｃ６５Ｉ、ＡｃｃＩ、ＡｃｌＩ、ＡａｔＩＩ、Ａｃｃ６５Ｉ、ＡｃｃＩ、ＡｃｌＩ、ＡｆｅＩ、ＡｆｌＩＩ、ＡｇｅＩ、ＡｐａＩ、ＡｐａＬＩ、ＡｐｏＩ、ＡｓｃＩ、ＡｓｅＩ、ＡｓｉＳＩ、ＡｖｒＩＩ、ＢａｍＨＩ、ＢｃｌＩ、ＢｇｌＩＩ、Ｂｍｅ１５８０Ｉ、ＢｍｔＩ、ＢｓａＨＩ、ＢｓｉＥＩ、ＢｓｉＷＩ、ＢｓｐＥＩ、ＢｓｐＨＩ、ＢｓｒＧＩ、ＢｓｓＨＩＩ、ＢｓｔＢＩ、ＢｓｔＺ１７Ｉ、ＢｔｇＩ、ＣｌａＩ、ＤｒａＩ、ＥａｅＩ、ＥａｇＩ、ＥｃｏＲＩ、ＥｃｏＲＶ、ＦｓｅＩ、ＦｓｐＩ、ＨａｅＩＩ、ＨｉｎｃＩＩ、ＨｉｎｄＩＩＩ、ＨｐａＩ、ＫａｓＩ、ＫｐｎＩ、ＭｆｅＩ、ＭｌｕＩ、ＭｓｃＩ、ＭｓｐＡ１Ｉ、ＭｆｅＩ、ＭｌｕＩ、ＭｓｃＩ、ＭｓｐＡ１Ｉ、ＮａｅＩ、ＮａｒＩ、ＮｃｏＩ、ＮｄｅＩ、ＮｇｏＭＩＶ、ＮｈｅＩ、ＮｏｔＩ、ＮｒｕＩ、ＮｓｉＩ、ＮｓｐＩ、ＰａｃＩ、ＰｃｉＩ、ＰｍｅＩ、ＰｍｌＩ、ＰｓｉＩ、ＰｓｐＯＭＩ、ＰｓｔＩ、ＰｖｕＩ、ＰｖｕＩＩ、ＳａｃＩ、ＳａｃＩＩ、ＳａｌＩ、ＳｂｆＩ、ＳｃａＩ、ＳｆｃＩ、ＳｆｏＩ、ＳｇｒＡＩ、ＳｍａＩ、ＳｍｌＩ、ＳｎａＢＩ、ＳｐｅＩ、ＳｐｈＩ、ＳｓｐＩ、ＳｔｕＩ、ＳｗａＩ、ＸｂａＩ、ＸｈｏＩ、ＸｍａＩまたはそれらの任意の組合せを使用して、ＣＮＡを除去することを含みうる。該方法は、前記で挙げられていないＤＮアーゼ、例えばエキソデオキシリボヌクレアーゼを使用して、ＣＮＡを除去することを含みうる。該方法は、ウラシルＤＮＡグリコシラーゼ（ＵＤＧ）、ＤＮＡグリコシラーゼ−リアーゼ（エンドヌクレアーゼＶＩＩＩ）またはそれらの混合物（例えば、ウラシル特異的切断試薬（ＵＳＥＲ）酵素）を使用して、ＣＮＡを除去することを含みうる。該方法は、ＲＮＡ誘導ＤＮアーゼの部位、例えばＣＲＩＳＰＲ関連タンパク質ヌクレアーゼ、例えばＣａｓ９、ＲＮアーゼを使用して、ＣＮＡを除去することを含みうる。該方法は、ＲＮアーゼ、例えばエンドリボヌクレアーゼ、例えばＲＮアーゼＡ、ＲＮアーゼＨ、ＲＮアーゼＩＩＩ、ＲＮアーゼＬ、ＲＮアーゼＰ、ＲＮアーゼＰｈｙＭ、ＲＮアーゼＴ１、ＲＮアーゼＴ２、ＲＮアーゼＵ２、ＲＮアーゼＶ、またはエキソリボヌクレアーゼ、例えばポリヌクレオチドホスホリラーゼ、ＲＮアーゼＰＨ、ＲＮアーゼＲ、ＲＮアーゼＤ、ＲＮアーゼＴ、オリゴリボヌクレアーゼ、エキソリボヌクレアーゼＩまたはエキソリボヌクレアーゼＩＩ、あるいはそれらの任意の組合せを使用して、担体合成核酸を除去することを含みうる。幾つかの場合には、該方法は、当技術分野で公知の任意の核酸分解試薬を使用して、ＣＮＡを除去することを含む。幾つかの場合には、該方法は、ＣＮＡを物理的処理、例えば加熱、冷却またはせん断に付すことにより、ＣＮＡを除去することを含みうる。幾つかの場合には、ＣＮＡの除去方法は、標的核酸、アダプター、または配列決定ライブラリーにおける他の任意の分子をサンプルから除去しない。幾つかの場合には、ＣＮＡの除去は酵素分解、例えばエンドヌクレアーゼ消化によっては行われない。

ＣＮＡを除去するために、該方法は、酵素が機能する温度でＣＮＡを酵素と共にインキュベートすることを含みうる。例えば、該方法は、１０℃〜８０℃、例えば２０℃〜６０℃、２０℃〜４０℃、３０℃〜４０℃、または２０℃〜２５℃の温度でＣＮＡを酵素と共にインキュベートすることを含みうる。該方法は、少なくとも１０℃、２０℃、２５℃、３０℃、３１℃、３２℃、３３℃、３４℃、３５℃、３６℃、３７℃、３８℃、３９℃、４０℃、５０℃、６０℃または７０℃の温度でＣＮＡを酵素と共にインキュベートすることを含みうる。幾つかの場合には、該方法は、約２０℃、２１℃、２２℃、２３℃、２４℃、２５℃、２６℃、２７℃、２８℃、２９℃、３０℃、３１℃、３２℃、３３℃、３４℃、３５℃、３６℃、３７℃、３８℃、３９℃、４０℃、４１℃または４２℃の温度でＣＮＡを酵素と共にインキュベートすることを含みうる。

ＣＮＡを除去するために、該方法は、酵素が機能的である時間にわたってＣＮＡを酵素と共にインキュベートすることを含みうる。幾つかの場合には、該方法は、少なくとも１分間、５分間、１０分間、１５分間、２０分間、３０分間、４０分間、５０分間、１時間、２時間、５時間、１２時間、２４時間、４８時間または７２時間、ＣＮＡを酵素と共にインキュベートすることを含みうる。

該方法は、アフィニティに基づく枯渇（ｄｅｐｌｅｔｉｏｎ）により担体合成核酸を除去することを含みうる。アフィニティに基づく枯渇は、１以上の固定化タグを含みうる担体合成核酸上で行われうる。これらの場合には、該方法は、固体支持体に固定化タグを結合させることによりＣＮＡを除去することを含みうる。そのような固体支持体は紙、ガラス（例えば、制御孔ガラス（ＣＰＧ））、プラスチック（例えば、ポリメチルアクリル酸、ポリエチレン、ポリプロピレン、ポリアクリラート、ポリメチルメタクリラート、ポリ塩化ビニル、ポリテトラフルオロエチレン、ポリスチレン、ポリカーボネートマクロポロスポリスチレン（ＭＰＰＳ）またはナイロン）、ポリアクリルアミド、酢酸セルロース、硝酸セルロース、ニトロセルロース、シリコンまたは他の金属、または光ファイバーでありうる。

アフィニティに基づく枯渇のための固体支持体は任意の形状および形態に成形されうる。幾つかの場合には、固体支持体は、ウェル、桶（トラフ）、台（ペデスタル）、疎水性もしくは親水性パッチ、ダイカット接着剤リザーバ、または流体流動に対する他の物理的障壁の形態の、分離した隔離領域を有する平面装置の形態で製造されうる。そのような固体支持体の例には、スライド、マイクロプレート、シート、フィルム、ディップスティックなどが含まれる。

他の場合には、固体支持体は、被覆カチオン性表面を含有するビーズまたはペレットの形態でありうる。ビーズは、被覆固体支持体上のプローブ密度を増加させるための手段を提供しうる。ビーズは、例えばアミノ化によりビーズをカチオン性にするのに適した種々の表面化学または官能基（例えば、アミン、カルボキシルまたはヒドロキシル）を提供しうる。適切なビーズ組成物には、例えば、プラスチック、例えば、ポリスチレン、メチルスチレン、アクリルポリマー、セラミック、ガラス、ポリマー材料、例えば、架橋デキストラン、セルロース、ナイロンおよびラテックス、常磁性材料、二酸化チタン、ラテックスが含まれる。ビーズは、任意のタイプの中実もしくは中空の球、ボール、ベアリング、シリンダーまたは他の固体形状を含みうる。ビーズは本質的に多孔質または非多孔質でありうる。多孔質ビーズの使用は、核酸検出に利用可能なビーズの表面積を増加させうる。ビーズサイズは、１００ｎｍ〜５ｍｍ、例えば０．２μｍ〜２００μｍ、または０．５μｍ〜５μｍの範囲でありうる。幾つかの場合には、固体支持体は磁性または磁気感受性でありうる。固体支持体は被覆されうる。被覆（コーティング）は固定化タグに結合しうる。例えば、固体支持体は、固定化タグの結合相手、例えば、ストレプトアビジン、抗原、抗体（例えば、抗ポリヒスチジン抗体）、グルタチオンＳトランスフェラーゼ、またはその類似体で被覆されうる。

該方法は、サイズに基づく枯渇によりＣＮＡを除去することを含みうる。例えば、サイズに基づく枯渇は、多孔性ビーズ（例えば、固相可逆的固定化（ＳｏｌｉｄＰｈａｓｅＲｅｖｅｒｓｉｂｌｅＩｍｍｏｂｉｌｉｚａｔｉｏｎ）（ＳＰＲＩ）磁気ビーズ、電気泳動ゲル精製（例えば、アガロースゲル精製）および／またはゲル濾過を用いて行われうる。幾つかの場合には、該方法は、５０ｂｐ、１００ｂｐ、２００ｂｐ、３００ｂｐ、４００ｂｐ、５００ｂｐ、６００ｂｐ、７００ｂｐ、８００ｂｐ、９００ｂｐ、１ｋｂ、２ｋｐ、５ｋｂまたは１０ｋｂの長さを有する合成核酸を除去することを含みうる。例えば、該方法は、少なくとも５００ｂｐの長さを有する合成核酸を除去することを含みうる。

配列決定
該方法は、配列決定ライブラリーにおける標的核酸および／またはアダプターを配列決定することを含みうる。配列決定は、マキサム−ギルバート（Ｍａｘａｍ−Ｇｉｌｂｅｒｔ）配列決定、鎖終結配列決定、ショットガン配列決定またはブリッジＰＣＲを含む基本的な配列決定方法により行われうる。配列決定は、大規模並列配列決定法（例えば、次世代シーケンシング）、例えば、ハイスループット配列決定、パイロシーケンシング、合成による配列決定、単一分子配列決定、ナノポア配列決定、半導体配列決定、連結による配列決定、ハイブリダイゼーションによる配列決定、ＲＮＡ−Ｓｅｑ（Ｉｌｌｕｍｉｎａ）、デジタル遺伝子発現（ＤｉｇｉｔａｌＧｅｎｅＥｘｐｒｅｓｓｉｏｎ）（Ｈｅｌｉｃｏｓ）、次世代シーケンシング、合成による単分子配列決定（ＳｉｎｇｌｅＭｏｌｅｃｕｌｅＳｅｑｕｅｎｃｉｎｇｂｙＳｙｎｔｈｅｓｉｓ）（ＳＭＳＳ）（Ｈｅｌｉｃｏｓ）、大規模並列配列決定、クローン単一分子アレイ（ＣｌｏｎａｌＳｉｎｇｌｅＭｏｌｅｃｕｌｅＡｒｒａｙ）（Ｓｏｌｅｘａ）、ショットガン配列決定、マキサム−ギルバート（Ｍａｘａｍ−Ｇｉｌｂｅｒｔ）またはサンガー（Ｓａｎｇｅｒ）配列決定、プライマーウォーキング、Ｉｌｌｕｍｉｎａ、ＰａｃＢｉｏ、ＳＯＬｉＤ、ＩｏｎＴｏｒｒｅｎｔ、４５４またはナノポアプラットフォームを使用する配列決定によっても行われうる。配列決定を次世代シーケンシング法により行う場合、ここで作製される配列決定ライブラリーは次世代シーケンシングライブラリーである。

本明細書の全体にわたって用いる、数字または数値範囲に関する「約」なる語は、言及された数字または数値範囲が実験的変動内（または統計的実験誤差内）の近似であること、あるいは数字または数値範囲が、例えば、示されている数字または数値範囲の１％〜１５％で変動しうることを意味する。例えば、「約」なる語は、示されている数または値の±１０％を意味する。

本明細書中で用いる「または」なる語は、特に示されていない限り、非排他的であり、例えば、「ＡまたはＢ」は「ＢではなくＡ」、「ＡではなくＢ」および「ＡおよびＢ」を含む。

図１は本開示の基本的方法の概要図を示す。図２は典型的な感染の概要図を示す。図３は、本発明で提供する方法の幾つかの一般的スキームを示す。図４は８つの典型的なスパーク（Ｓｐａｒｋ）サイズセットスパイクインの設計を示す。図５は、多様性減少を決定するための本発明で提供する方法の一般的スキームを示す。図６は典型的なスパンク（Ｓｐａｎｋ）スパイクインの設計を示す。図７は、本発明で提供する方法を実行するようにプログラムまたは構成されたコンピュータ制御システムを示す。図８は、担体（ｃａｒｒｉｅｒ）核酸が加えられうる配列決定ライブラリーの製造における工程を示す。図９は１１０個の典型的なＩＤスパイクに関する正規化リード数を示す。図１０は１１０個の典型的なシグナル正規化ＩＤスパイクに関する正規化リード数を示す。図１１は、病原体トレーサーを使用してシゲラ・フレックスネリ（Ｓｈｉｇｅｌｌａｆｌｅｘｎｅｒｉ）の陽性対照からの交差汚染を特定するための方法からの結果を示す。図１２は、病原体トレーサーを使用してサルモネラ・エンテリカ（Ｓａｌｍｏｎｅｌｌａｅｎｔｅｒｉｃａ）の陽性対照からの交差汚染を特定するための方法からの結果を示す。図１３は、病原体トレーサーを使用してスタフィロコッカス・アウレウス（Ｓｔａｐｈｙｌｏｃｏｃｃｕｓａｕｒｅｕｓ）の陽性対照からの交差汚染を特定するための方法からの結果を示す。図１４は、病原体トレーサーを使用してシュードモナス・エルジノーサ（Ｐｓｅｕｄｏｍｏｎａｓａｅｒｕｇｉｎｏｓａ）の陽性対照からの交差汚染を特定するための方法からの結果を示す。図１５は、病原体トレーサーを使用してクロストリジウム・スポロゲネス（Ｃｌｏｓｔｒｉｄｉｕｍｓｐｏｒｏｇｅｎｅｓ）の陽性対照からの交差汚染を特定するための方法からの結果を示す。図１６は典型的なスパーク（Ｓｐａｒｋ）サイズスパイクインの相対収率に対するサイズ選択ライブラリ処理方法の効果を示す。図１７は、種々のＧＣ含量の核酸を用いて、酵素加熱失活工程を含む配列決定ライブラリーの製造方法からの結果を示す。図１８は、種々のＧＣ含量の核酸を使用する、酵素加熱失活工程を欠く配列決定ライブラリーの製造方法からの結果を示す。図１９は、両端の連結を妨げる大きなサイズを有する担体合成核酸を使用する、配列決定ライブラリーの典型的な製造方法を示す。図２０Ａは、脱塩基部位および修飾を有する担体合成核酸を使用する、配列決定ライブラリーの典型的な製造方法を示す。図２０Ｂは、エンドヌクレアーゼＶＩＩＩ消化の非存在下で担体合成核酸を使用する配列決定ライブラリーの製造からの結果を示す。レーンＡ１：ＴａｐｅＳｔａｔｉｏｎラダー。レーンＢ１：ＣＮＡ無し、第１複製。レーンＣ１：ＣＮＡ無し、第２複製。レーンＤ１：ＣＮＡ無し、第３複製。レーンＥ１：１０ｎｇのＣＮＡ、第１複製。レーンＦ１：１０ｎｇのＣＮＡ、第２複製。レーンＧ１：１０ｎｇのＣＮＡ、第３複製。図２０Ｃは、エンドヌクレアーゼＶＩＩＩ消化の存在下で担体合成核酸を使用する配列決定ライブラリーの製造からの結果を示す。レーンＡ１：ＴａｐｅＳｔａｔｉｏｎラダー。レーンＢ１：ＣＮＡ無し、第１複製。レーンＣ１：ＣＮＡ無し、第２複製。レーンＤ１：ＣＮＡ無し、第３複製。レーンＥ１：１０ｎｇのＣＮＡ、第１複製。レーンＦ１：１０ｎｇのＣＮＡ、第２複製。レーンＧ１：１０ｎｇのＣＮＡ、第３複製。図２１Ａは、エンドヌクレアーゼＶＩＩＩ消化の非存在下で脱塩基部位を有する担体合成核酸を使用する配列決定ライブラリーの製造からの結果を示す。図２１Ｂは、エンドヌクレアーゼＶＩＩＩ消化の存在下で脱塩基部位を有する担体合成核酸を使用する配列決定ライブラリーの製造からの結果を示す。図２２は、ＤＮＡ−ＲＮＡハイブリッドを有する担体合成核酸の典型的配列を示す。「ｒＸ」なる文字（例えば、ｒＧ、ｒＣ、ｒＡ）はＲＮＡ配列を示す。図２３Ａは、ＤＮＡ−ＲＮＡハイブリッドを有する担体合成核酸を使用する、配列決定ライブラリーの典型的な製造方法を示す。図２３Ｂは、ＤＮＡ−ＲＮＡハイブリッドを有する担体合成核酸を使用する、配列決定ライブラリーの製造からの結果を示す。

実施例
実施例１：無細胞ＤＮＡ配列決定アッセイによる診断
無細胞血漿サンプルを調製する。次世代シーケンシングのためのＤＮＡライブラリーを、既に記載されているとおりに製造する（ＤｅＶｌａｍｉｎｃｋＩ，ＫｈｕｓｈＫＫ，ＳｔｒｅｈｌＣら，Ｔｅｍｐｏｒａｌｒｅｓｐｏｎｓｅｏｆｔｈｅｈｕｍａｎｖｉｒｏｍｅｔｏｉｍｍｕｎｏｓｕｐｐｒｅｓｓｉｏｎａｎｄａｎｔｉｖｉｒａｌｔｈｅｒａｐｙ．Ｃｅｌｌ２０１３；１５５（５）：１１７８−８７．；ＤｅＶｌａｍｉｎｃｋＩ，ＭａｒｔｉｎＬ，ＫｅｒｔｅｓｚＭら，Ｎｏｎｉｎｖａｓｉｖｅｍｏｎｉｔｏｒｉｎｇｏｆｉｎｆｅｃｔｉｏｎａｎｄｒｅｊｅｃｔｉｏｎａｆｔｅｒｌｕｎｇｔｒａｎｓｐｌａｎｔａｔｉｏｎ．ＰｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅＮａｔｉｏｎａｌＡｃａｄｅｍｙｏｆＳｃｉｅｎｃｅｓｏｆｔｈｅＵｎｉｔｅｄＳｔａｔｅｓｏｆＡｍｅｒｉｃａ２０１５；１１２（４３）：１３３３６−４１；それらのそれぞれの全体を参照により本明細書に組み入れることとする）。配列決定をＩｌｌｕｍｉｎａＮｅｘｔＳｅｑ装置で行い、分析する。簡潔に説明すると、低品質リードを除去した後、リードをヒト参照ゲノム（例えば、ｈｇ１９）に対してマッピングする。残りのリードをウイルス性、細菌性、真菌性および他の真核性病原体のキュレート参照データベースに対してマッピングする。個々の病原体の存在量を、血漿１ｍｌ当たりの特定の病原体由来の核酸量の絶対的尺度である、体積当たりのゲノムコピー数として表す。耐性を付与することが知られている配列を特定するために、更なる分析を行うことが可能である。

患者の血漿の直接次世代シーケンシング（ＮＧＳ）
ＤＮＡ抽出の前に既知濃度の合成ＤＮＡ分子を血漿サンプルに添加する。改変された磁気ビーズに基づく方法（ＯｍｅｇａＢｉｏｔｅｋ，Ｎｏｒｃｒｏｓｓ，ＧＡ）を用いてＤＮＡを抽出する。改変されたライブラリー調製キット（ＮｕＧＥＮ，ＳａｎＣａｒｌｏｓ，ＣＡ）を使用して、ＮＧＳライブラリーを構築する。陰性（バッファーを含有するが血漿を含有しない）および陽性（健常ドナーからの血漿および既知濃度の剪断された実験室由来の病原体ＤＮＡを含有する）対照サンプルを、サンプルと並行して処理する。７５サイクルのシングルエンド（ｓｉｎｇｌｅ−ｅｎｄ）デュアルインデックス（ｄｕａｌ−ｉｎｄｅｘ）配列決定キットを使用するＩｌｌｕｍｉｎａＮｅｘｔＳｅｑで全３個のＤＮＡライブラリータイプを多重化し、配列決定する。

バイオインフォマティクス分析
病原体リードをＮＧＳリードセットから定量する。簡潔に説明すると、低品質リードを破棄した後、ヒト参照配列（例えば、ｈｇ１９）に対してアライメントすることによりヒトリードを除去する。完全スパイクイン配列のデータベースに対するアライメントにより、合成スパイクインリードを特定する。残りのリードを、ウイルス、原核生物および真菌（真菌、原生動物および寄生生物を含む）の８０００個を超える参照配列のキュレートデータベースに対してアライメントする。ＰＣＲ重複（ｄｕｐｌｉｃａｔｅ）または配列決定装置のエラーに由来すると推定される重複リードをアライメントに基づき特定し、除去する。生物の相対的存在量を、推定される重複排除（ｄｅｄｕｐｅｄ）リード（ＥＤＲ）または百万当たりのリード（ＲＰＭ；サンプルに関する全リードに対して正規化されたもの）、またはサンプルの体積当たりのリード（ＭＰＭ；１マイクロリットル当たりの分子）として表す。ＭＰＭは、血漿１マイクロリットルにおける各生物に関して表される、核酸断片の推定数を見積もる正規化量である。この計算は、抽出の開始時に血漿に添加された既知量の合成ＤＮＡに対して正規化された各生物に関して存在する配列の数から導出される。

２つの患者サンプルの処理の説明は以下の通りである。スパンク（Ｓｐａｎｋ）−７５Ｂ（配列番号１２０）、スパーク（Ｓｐａｒｋ）−３２／５２／７５／１００／１２５／１５０／１７５／３５０（配列番号１１１〜１１８）、およびＩＤスパイク（血漿１マイクロリットル当たりの各スパイクインの３×１０^５個の分子）の混合物を血漿に添加する。各サンプルには同じスパンク／スパーク混合物を加えるが、異なるＩＤスパイクを加える。添加された血漿を１６，０００ｇで１０分間遠心分離し、無細胞血漿からなる上清を新鮮なチューブに移す。デュアルインデックスＩｌｌｕｍｉｎａアダプターを添加するための無細胞ＤＮＡ抽出およびライブラリー調製の後、サンプルをプールし、それと並行して、陰性対照サンプルおよび陽性対照サンプルを処理し、ついでＩｌｌｕｍｉｎａＮｅｘｔＳｅｑで配列決定する。典型的には、約４億個のリードがバッチ内のサンプルに分布し、任意の個々のサンプルのリード数は、サンプルが含む全ライブラリプールの割合に比例し、そしてこの割合は無細胞血漿中のＤＮＡの量に比例する。

計算分析：個々のサンプルのリードを、対応するアダプターバーコード配列に基づいて特定した（「脱多重化」）。アダプター二量体配列の除去、および品質に基づくリードのトリミングの後、ヒトゲノム、スパイクインおよび病原体ゲノム参照配列に対するアライメントにより、リード配列の推定起源を特定した。ＩＤスパイクおよびＳＰＡＮＫ（スパンク）−７５Ｂリードの数を、スパイクインアライメントを用いてカウントし、各添加分子内に埋め込まれたランダム化配列タグを使用して、スパンク（ＳＰＡＮＫ）−７５Ｂリードを重複排除（ｄｅ−ｄｕｐｌｉｃａｔｅ）（「デデュープ（ｄｅｄｕｐｅ）」）した。ゲノム位置に基づいて病原体アライメントを重複排除し、機械学習アプローチを用いて、各リードの最も可能性の高い分類学的起源を決定して、特定の病原体に起因する推定重複リードを得た。正規化病原体存在量を１マイクロリットル当たりの病原体分子（ＭＰＭ−スパンク）としての濃度で表し、以下のとおりに計算する：ＭＰＭ−スパンク＝（推定重複排除リード／スパンク−７５Ｂの数）×ｃ（ここで、ｃは、サンプルに添加されたスパンク−７５Ｂリードの濃度、すなわち、１マイクロリットル当たり３×１０^５リードである）。

ＩＤスパイクは、配列決定バッチにおける各サンプルに関してユニークであるスパイクインの一種でありうる。スパンク分子は全ライブラリーにわたって一定濃度で添加されうる。したがって、個々のライブラリーにおいて検出される重複排除スパンク分子の数は、そのライブラリーにおいて検出可能な最小濃度の代用物でありうる。より一般的には、それは、そのライブラリーが元のサンプルにおける核酸（例えば、ＤＮＡ）分子を核酸配列決定データにおけるリードに変換した効率に正比例しうる。スパンク分子の目的は、サンプルにおいて表される混合物における標的（例えば、病原体または疾患関連）分子の相対的存在量を確定するのを助けることでありうる。

実施例２：ＩＤスパイクの合成および処理
インテグレーテッドＤＮＡテクノロジーズ（ＩｎｔｅｇｒａｔｅｄＤＮＡＴｅｃｈｎｏｌｏｇｉｅｓ）により合成された相補的な１００マー（ｍｅｒ）オリゴヌクレオチドのペアをアニーリングさせることにより、１１０個の典型的なＩＤスパイク（ＩＤスパイク２８〜１３７；配列は表１に列挙されている）を構築した。ついで、これらの配列を４つのグループにサブプールし、ヒト血漿の４つのアリコートに加え、抽出し、血漿の無細胞ＤＮＡと共に配列決定ライブラリーへと処理し、ＩｌｌｕｍｉｎａＮｅｘｔＳｅｑ５００装置で配列決定した。１１０個のＩＤスパイクのそれぞれにマッピングされたリードの数を決定し、ついで１００万個の全リードごとに正規化した。１００万個の全リード当たり最小約１２，０００個および最大約８８，０００個を示すプロットを図９に示す。

ＩＤスパイクからのシグナルは調節可能である。ＩＤスパイクは、例えば、図９に示されているシグナル中央値に基づいて各ＩＤスパイクの入力量を調節することにより、シグナル正規化されうる。シグナル正規化ＩＤスパイクの再試験は、図１０に示されているとおり、より均一なリード数を与える。この場合、各ＩＤスパイクにマッピングされるリードの数は１００万個の全リード当たり１０，０００〜２５，０００の範囲内であり、ほとんどのＩＤスパイクは１００万個の全リード当たり１５，０００〜２０，０００の範囲内のリード数を有する。異なるＩＤスパイクのシグナルを等化または正規化する利点は、それが交差汚染検出の精度を向上させうることである。例えば、１つのＩＤスパイクが典型的には１００万当たり７０，０００個のリードを与え、別のＩＤスパイクが１９，０００個を与える場合、後者はより低感度の交差汚染トレーサでありうる。それらの２つのＩＤスパイク間のシグナルの正規化はより高い均一性をもたらしうる。

実施例３：ＩＤスパイクを使用するサンプルの交差汚染の測定
４つのサンプルを調製する。ＩＤスパイク１２４〜１２７をサンプル１に添加する。ＩＤスパイク１２８〜１３１をサンプル２に添加する。ＩＤスパイク１３２〜１３４をサンプル３に添加する。ＩＤスパイク１３５〜１３７をサンプル４に添加する。それらの４つのサンプルを処理し、配列決定する。表７にＩＤスパイクのサブセットに関して示されているとおり、交差汚染（例えば、ＩＤスパイクが意図的には添加されなかったサンプルにおけるＩＤスパイクに起因するリード）は１：１０，０００未満であることが示されている。

実施例４：ＩＤスパイクを使用するサンプルの交差汚染の特定
４つのサンプルを調製する。ＩＤスパイク１２４をサンプルＡに添加する。ＩＤスパイク１２３をサンプルＢに添加する。ＩＤスパイク１２２をサンプルＣに添加する。ＩＤスパイク１１９をサンプルＤに添加する。それらの４つのサンプルを処理し、配列決定する。サンプルＡおよびＢにおけるＩＤスパイク１２３およびＩＤスパイク１２４の両方からの相当数のリードは、表８に示されているとおり、それらの２つのＩＤスパイクストック間またはサンプルＡおよびＢの間の交差汚染を示している。

実施例５：ＩＤスパイクを使用する交差汚染源の特定
幾つかのサンプルにおいては、実質的にだた１つのＩＤスパイクのみが特定されるが、他のサンプルにおいては、幾つかの汚染ＩＤスパイクが有意レベルで観察される。そのような状況においては、表９に示されているとおり、汚染ＩＤスパイクが何であるかが、例えば、マイクロタイタープレートの隣接ウェルからの交差汚染源を示しうる。

実施例６：病原体ＤＮＡの陽性対照からの交差汚染を特定するためのトレーサー配列
実験室（検査室）病原体ＤＮＡサンプルは陽性対照として使用されるが、臨床サンプルを交差汚染し、偽陽性リードまたは診断をもたらすリスクを伴う。交差汚染検出を可能にするために、トレーサーを実験室病原体ＤＮＡサンプルに添加する。血液からの無細胞病原体ＤＮＡ断片のＮＧＳ検出の場合には、比較的短いトレーサーが使用されうる。なぜなら、無細胞病原体断片は比較的短く、例えば２０〜１２０ｂｐであり、しばしば、平均約７５ｂｐであるからである。ここでは、病原体対照当たり１個のユニークトレーサー配列を含有する７５ｂｐの合成ＤＮＡ二本鎖のセットをトレーサーとして使用する。実験室で得られたゲノムＤＮＡ（ＡＴＣＣまたはＮＩＳＴ）を、ＤＮａｓｅＩ（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）またはフラグメンターゼ（Ｆｒａｇｍｅｎｔａｓｅ）ヌクレアーゼ混合物（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）を使用して剪断することにより、病原体断片を得た。

表１０〜１２に列挙されている１１種の異なる病原体由来のゲノムＤＮＡを約７５ｂｐの平均断片長に個々に剪断し、精製し、定量した（Ｑｕｂｉｔ，ＴｈｅｒｍｏＦｉｓｈｅｒ）。各断片プールに、別の７５ｂｐの合成ＤＮＡ二本鎖（ＩｎｔｅｇｒａｔｅｄＤＮＡＴｅｃｈｎｏｌｏｇｉｅｓ）を約１０倍高い質量で加えて（Ｑｕｂｉｔ，ＴｈｅｒｍｏＦｉｓｈｅｒ）、各断片化病原体にユニークトレーサーを付与した。好ましくは、ゲノムＤＮＡに対して少なくとも約５倍高いシグナルが該トレーサーに関して得られる。同時感染をシミュレートするために、病原体／トレーサーペアを３つの種々の組合せで一緒に混合し（表１０〜１２に列挙されているとおり、混合物１は４つの病原体を含有し、混合物２は４つの病原体を含有し、混合物３は３つの病原体を含有していた）、ヒト血漿に加え、ヒト血漿において更に希釈して濃度系列を得、ついで無細胞ＤＮＡ抽出、ライブラリー調製およびＮＧＳに付した。データベースに対するアライメントは全サンプルにおける全１１個のトレーサーおよび全１１個の病原体の検出濃度を算出した。

表１０〜１２および図１１〜図１５に示されている結果はトレーサーと病原体との１：１のペア形成を示している。各場合において、トレーサーは病原体より高い濃度で検出され、濃度差は希釈系列にわたって一貫したままである。低レベルの交差汚染事象から予想されるような非常に低い濃度への外挿は、病原体の前にトレーサーが検出されることを強く示唆している。表１０〜１２は全てのサンプルからのデータを示し、図１１〜１５は、それぞれシゲラ・フレックスネリ（Ｓｈｉｇｅｌｌａｆｌｅｘｎｅｒｉ）、サルモネラ・エンテリカ（Ｓａｌｍｏｎｅｌｌａｅｎｔｅｒｉｃａ）、スタフィロコッカス・アウレウス（Ｓｔａｐｈｙｌｏｃｏｃｃｕｓａｕｒｅｕｓ）、シュードモナス・エルジノーサ（Ｐｓｅｕｄｏｍｏｎａｓａｅｒｕｇｉｎｏｓａ）およびクロストリジウム・スポロゲネス（Ｃｌｏｓｔｒｉｄｉｕｍｓｐｏｒｏｇｅｎｅｓ）に関する代表的なトレーサー：病原体のペアをプロットしている。トレーサーは、それが意図的に添加されたサンプルでのみ観察された。未添加サンプルにおいては、１つの病原体、すなわち、大腸菌（Ｅ．ｃｏｌｉ）のみが観察された。それらのサンプルにおいては大腸菌（Ｅ．ｃｏｌｉ）トレーサー＃１４３は観察されなかったため、大腸菌（Ｅ．ｃｏｌｉ）はヒト血漿中に低レベルで存在していたと結論づけることが可能であり、これはこの共生生物ではよくあることである。

実施例７：スパーク配列を使用する、種々の長さの核酸の相対的収量の決定
８個のスパーク（Ｓｐａｒｋ）をヒト血漿に等モル量で加え、抽出し、血漿の無細胞ＤＮＡと共に配列決定ライブラリーへと処理し、ＩｌｌｕｍｉｎａＮｅｘｔＳｅｑ５００装置で配列決定した。種々の処理方法（例えば、図１６に示されているとおり、種々のサイズ範囲を有するライブラリーのサブセットを選択するもの）が、種々のスパークの相対的収率を決定することによりモニターされうる。更に、全てのサンプルに同じ量のスパークを添加した場合、例えば８個のスパークのそれぞれの１億個の分子を血漿１ｍＬ当たりに加えた場合、与えられたスパークのリード数を用いて、サンプルにおける他の類似サイズの断片（例えば、感染因子由来の無細胞ＤＮＡ）の出発濃度を推測することが可能である。

実施例８：種々のＧＣ含量を有する合成核酸を使用する配列決定ライブラリーの製造
無細胞病原体核酸はそれらのＧＣ含量において様々であることが可能であり、短い断片長で多種多様なＴ_ｍを有しうる。無細胞病原体断片は比較的短い長さ（例えば、２０〜１２０ｂｐ、そしてしばしば平均約７５ｂｐ）を有するため、より短い断片は、例えばＮＧＳのための処理中に、より変性し易く、したがって、サンプル中に存在していたとしても配列決定も検出もされない可能性がある。低いＴ_ｍの断片（例えば、低いＧＣゲノムからの短い断片）、特に、３２〜７５ｂｐの範囲の断片の回収を追跡するための方法を用いて、より高い比率の低いＴ_ｍの断片が維持されるように、核酸処理を最適化することが可能である。

２８個の二本鎖のそれぞれを、２個のオリゴヌクレオチドをアニーリングすることによって作製した。二本鎖ＤＮＡの濃度がＱｕｂｉｔ（ＴｈｅｒｍｏＦｉｓｈｅｒ）によりを測定された。それらの２８個の等モル量を１つの混合物へと一緒にした。該混合物の８個の重複サンプルを標準的なライブラリー製造方法１（酵素加熱不活性化工程を含む）で処理し、別の８個を、改変されたライブラリー製造方法２（酵素加熱不活性化工程を欠く）で処理した。ライブラリー製造の後、それらの１６個のサンプルを１回の配列決定の実施において組合せ、各サンプルに関する２８個のスパイクのそれぞれの収率を計算し、各ライブラリーに関する１００万当たりのリード数に対して正規化した。

該正規化リード数は、標準方法１（図１７に示されている）と比較した場合の、改変法２（図１８に示されている）における低いＴ_ｍの種の回収の増加を示しており、例えば、３２ｂｐ長および２０％ＧＣ含量、３２ｂｐ長および３０％ＧＣ含量、３２ｂｐ長および４０％ＧＣ含量、４２ｂｐ長および２０％ＧＣ含量、４２ｂｐ長および３０％ＧＣ含量、または５２ｂｐ長および２０％ＧＣ含量であるスパイクインに関して、それが認められる。ＧＣパネルのこの粒度が無かったなら、そのような差は遥かに不明確であったであろう。例えば、５０％ＧＣ含量においては、試験した４つの長さのうち、３２ｂｐの長さのみが回復レベルの差を示す。

実施例９：サイズに基づく枯渇を可能にする長い長さを有する担体合成核酸を使用する配列決定ライブラリーの製造
本実施例は、サンプルにおける標的核酸より長い合成ＤＮＡ（例えば、ＰＣＲにより合成されたＤＮＡ）を使用して配列決定ライブラリーを製造するための典型的方法を示す。合成ＤＮＡは、サンプルにおける標的核酸からの、サイズに基づく分離を可能にする長さを有しうる。合成ＤＮＡの一方または両方の末端は、連結に抵抗する修飾を有しうる。該修飾は、１以上の末端における１以上の内部脱塩基部位および／または反転（ｉｎｖｅｒｔｅｄ）ヌクレオチドを含みうる。合成ＤＮＡは、配列決定ライブラリーに加えられた後、合成ＤＮＡの比較的長い長さを利用する、サイズに基づく枯渇法を用いて、任意の時点で、該ライブラリーから枯渇されうる。

無細胞ＤＮＡを含む血漿サンプルを対象から得る。合成ＤＮＡを、ライブラリー作製キットのための最小必要量のＤＮＡの濃度で、ライブラリーＤＮＡ投入溶液（例えば、無細胞ＤＮＡ抽出物）に添加する。末端修復工程の前、または末端修復工程の後かつアダプター連結工程の前に、合成ＤＮＡを血漿ＤＮＡ抽出物に添加する。

ついで、ＤＮＡ濃度感受性連結を、キット製造者の説明に従い行う。合成ＤＮＡはＰＣＲ増幅されない。むしろ、合成ＤＮＡをサイズ選択し、短い断片（例えば、１１０ｂｐ未満の断片）の富化中に配列決定ライブラリーから枯渇させる。また、合成ＤＮＡを、末端修復または連結に抵抗するように修飾した場合、またはそれが連結に抵抗するように末端修復後にそれを添加した場合には、それは両末端においてアダプターを欠き、したがって配列決定されない。

図１９は配列決定ライブラリーの製造における工程を示す。サンプル（例えば、血漿）における無細胞ＤＮＡ断片１９０１を工程１９０２において単離して、非常に低い濃度の無細胞ＤＮＡ１９０３を得ることが可能である。工程１９０４において該断片を末端修復に付すことが可能である。ついで、一方の末端において連結に抵抗する修飾を有する長い担体核酸１９１０を添加することが可能である。ついで、核酸をアダプター連結工程１９０５に付すことが可能であり、ここで、末端修復断片は、両端に連結されたアダプターを有するが、担体核酸は、一方の末端に連結されたアダプターのみを有する。増幅工程１９０６中に、連結断片は増幅されるが、担体核酸は増幅されない。ついで、サイズ選択工程１９０７を行うことが可能である。

合成ＤＮＡの一方の末端は、ライブラリー製造における反応に合成ＤＮＡが関与することを妨げる修飾または構造を含む。アダプターを合成ＤＮＡの３’末端に連結する場合、合成ＤＮＡを２つの制限酵素で二重消化して、２つの異なるオーバーハングを有する、または一方の末端にオーバーハングを有し他方の末端に平滑末端を有する５００ｂｐを超える分子を得る。次に、それぞれ相補的オーバーハングまたは平滑末端化ヘアピンを特異的に使用して、オーバーハングまたは平滑末端にヘアピンを連結する。アダプターが合成ＤＮＡの５’末端に連結することが予想される場合には、ＰＣＲプライマーのペア［そのうちの一方は不活性化５’末端（例えば、５’反転ジデオキシ−Ｔ、Ｃ３スペーサー、スペーサー１８など）を有する］を使用して、合成ＤＮＡを合成する。

実施例１０：脱塩基部位および修飾を有する担体合成核酸を使用する配列決定ライブラリーの製造
ｃｆＤＮＡ抽出工程中に担体核酸として機能し、ライブラリー製造中に最小ライブラリー投入量をもたらす担体合成核酸を設計した。担体合成核酸は中央脱塩基伸長を含有し、修飾を含む両端を有していた。担体合成核酸の配列を以下に示す（５Ｉｎｖｄｄｔは５’反転ｄｄＴを示し、３ｉｎｖｄＴは３’反転ｄＴを示し、ｉｄＳｐは内部脱塩基部位を示す）。

５’−／５ＩｎｖｄｄＴ／ＧＣＧＴＣＣＣＧＧＣＧＣＧＣＧＴＴＴＡＧＧＧＡＴＡＡＣＡ／ｉｄＳｐ／ｉｄＳｐ／ｉｄＳｐ／ｉｄＳｐ／ＧＧＧＴＡＡＴＧＧＣＧＣＡＡＧＧＧＴＧＣＴＧＧＣ／３ＩｎｖｄＴ／−３’；
３’−／３ＩｎｖｄＴ／ＣＧＣＡＧＧＧＣＣＧＣＧＣＧＣＡＡＡＴＣＣＣＴＡＴＴＧＴ／ｉｄＳｐ／ｉｄＳｐ／ｉｄＳｐ／ｉｄＳｐ／ＣＣＣＡＴＴＡＣＣＧＣＧＴＴＣＣＣＡＣＧＡＣＣＧ／５ＩｎｖｄｄＴ／−５’。

該方法の工程を図２０Ａに示す。２つの並行実験を行った。２つの実験のうちの１つでエンドヌクレアーゼＶＩＩＩ消化を行った。エンドヌクレアーゼＶＩＩＩ消化を伴わない実験においては、該方法は末端修復（工程２００１）、酢酸ナトリウムおよびエタノールでのＭａｇＢｉｎｄ精製（工程２００２）、アダプター連結（工程２００３）、アンプア（Ａｍｐｕｒｅ）精製（工程２００４）およびライブラリー増幅（工程２００５）を含む。エンドヌクレアーゼＶＩＩＩ消化を伴う実験においては、該方法は末端修復（工程２００６）、酢酸ナトリウムおよびエタノールでのＭａｇＢｉｎｄ精製（工程２００７）、アダプター連結（工程２００８）、アンプル（Ａｍｐｕｒｅ）精製（工程２００９）、エンドヌクレアーゼＶＩＩＩ消化（工程２０１０）およびライブラリー増幅（工程２０１１）を含む。

エンドヌクレアーゼＶＩＩＩ消化を３７℃で行い、１時間進行させた。アダプター連結後には担体合成核酸の枯渇は不要であった。なぜなら、脱塩基部位が鋳型の増幅を既に効率的に阻害したからである。また、該修飾はアダプター連結を妨げ、全ては、担体合成核酸が配列決定されることを妨げた。エンドヌクレアーゼＶＩＩＩはライブラリーにおけるアダプター二量体を枯渇させるために使用されうる。

図２０Ｂおよび２０Ｃは、エンドヌクレアーゼＶＩＩＩ消化を伴う又は伴わない配列決定ライブラリーの作製を示す。担体合成核酸を含有するライブラリーにおけるアダプター連結後のエンドヌクレアーゼＶＩＩＩによる消化は、担体合成核酸を含有しないライブラリーと比較して改善された再現性およびより高いスパイクインシグナルをもたらした。

実施例１１：脱塩基部位を有する合成核酸を使用する配列決定ライブラリーの製造
ｃｆＤＮＡ抽出工程中に担体核酸として機能し、ライブラリー製造中に最小ライブラリー投入量をもたらす脱無塩基含有担体合成核酸を設計した。配列決定ライブラリーの製造方法は、実施例８で用いたものと実質的に同じであった。種々のタイプの脱塩基含有担体合成核酸を設計した。担体合成核酸分子の配列を以下に示す。

連結に抵抗する修飾を含む二本鎖の一端を有する部分的に活性な脱塩基担体合成核酸（部分的ａｂ−ＣＮＡ）（連結用に二本鎖の一端を残したことは、末端修復およびアダプター連結反応に対するいずれかの濃度効果をもたらすことを助けた）（５Ｉｎｖｄｄｔは５’反転ｄｄＴを示し、３ｉｎｖｄＴは３’反転ｄＴを示し、ｉｄＳｐは内部脱塩基部位を示す）：
５’−ＧＣＧＴＣＣＣＧＧＣＧＣＧＣＧＴＴＴＡＧＧＧＡＴＡＡＣＡ／ｉｄＳｐ／ｉｄＳｐ／ｉｄＳｐ／ｉｄＳｐ／ＧＧＧＴＡＡＴＧＧＣＧＣＡＡＧＧＧＴＧＣＴＧＧＣ／３ＩｎｖｄＴ／−３’；
３’−ＣＧＣＡＧＧＧＣＣＧＣＧＣＧＣＡＡＡＴＣＣＣＴＡＴＴＧＴ／ｉｄＳｐ／ｉｄＳｐ／ｉｄＳｐ／ｉｄＳｐ／ＣＣＣＡＴＴＡＣＣＧＣＧＴＴＣＣＣＡＣＧＡＣＣＧ／５ＩｎｖｄｄＴ／−５’。

二本鎖の両端を含有する活性な脱塩基性担体合成核酸（活性ａｂ−ＣＮＡ）は連結可能であった（連結用に両端を残したことは、濃度効果の効率的低減に末端が要求される場合に担体合成核酸投入量を減少させるのに有用であった）（ｉｄＳｐは内部脱塩基部位を示す）：
５’−ＧＣＧＴＣＣＣＧＧＣＧＣＧＣＧＴＴＴＡＧＧＧＡＴＡＡＣＡ／ｉｄＳｐ／／ｉｄＳｐ／／ｉｄＳｐ／／ｉｄＳｐ／ＧＧＧＴＡＡＴＧＧＣＧＣＡＡＧＧＧＴＧＣＴＧＧＣ−３’；
３’−ＣＧＣＡＧＧＧＣＣＧＣＧＣＧＣＡＡＡＴＣＣＣＴＡＴＴＧＴ／ｉｄＳｐ／／ｉｄＳｐ／／ｉｄＳｐ／／ｉｄＳｐ／ＣＣＣＡＴＴＡＣＣＧＣＧＴＴＣＣＣＡＣＧＡＣＣＧ−５’。

鎖当たりだた１つの脱塩基部位を有する単一脱塩基担体合成核酸（単一ａｂ−ＣＮＡ）（単一脱塩基部位はエンドヌクレアーゼＶＩＩＩで、より効率的に消化された）（ｉｄＳｐは内部脱塩基部位を示す）：
５’−ＧＣＧＴＣＣＣＧＧＣＧＣＧＣＧＴＴＴＡＧＧＧＡＴＡＡＣＡＧＴ／ｉｄＳｐ／ＧＧＧＴＡＡＴＧＧＣＧＣＡＡＧＧＧＴＧＣＴＧＧＣ−３’；
３’−ＣＧＣＡＧＧＧＣＣＧＣＧＣＧＣＡＡＡＴＣＣＣＴＡＴＴＧＴＣＡＴＣＣＣＡＴＴ／ｉｄＳｐ／ＣＣＧＣＧＴＴＣＣＣＡＣＧＡＣＣＧ−５’。

全てのライブラリーを製造し、各変異を３回重複して施した。また、連結用の二本鎖末端の作製はスパイクイン分子（例えば、スパーク）のバンドを拡散させた。このことは、この実験条件下、多様性の減少が有意でありうることを示唆している。図２１Ａおよび２１Ｂは配列決定ライブラリーの製造の結果を示す。エンドヌクレアーゼＶＩＩＩ消化は該重複体の幾つかにおいてアダプター二量体バンドの消失を引き起こした。エンドヌクレアーゼＶＩＩＩ消化物を用いた場合、より多数の非アダプター二量体鋳型が増幅に利用可能となった。

実施例１２：ＤＮＡ−ＲＮＡハイブリッドを含有する合成核酸を使用する配列決定ライブラリーの製造
ｃｆＤＮＡ抽出工程中に担体核酸として機能し、ライブラリー製造中に最小ライブラリー投入量をもたらす、ＤＮＡ−ＲＮＡハイブリッドを含有する担体合成核酸（ＲｎＤ−ＣＮＡ）を設計した。図２２に示されているとおり、配列決定可能な分子の最終プールにおけるＲｎＤ−ＣＮＡ枯渇はアダプター連結後かつライブラリー増幅前のＲＮアーゼＨ消化により達成された。ＲＮアーゼＨに基づく枯渇をライブラリー増幅バッファー中、３７℃で行い、１時間進行させた。

該方法の工程を図２３Ａに示す。典型的な実験においては、該方法は末端修復（工程２３０１）、酢酸ナトリウムおよびエタノールでのＭａｇＢｉｎｄ精製（工程２３０２）、アダプター連結（工程２３０３）、アンプル（Ａｍｐｕｒｅ）精製（工程２３０４）、担体核酸枯渇（工程２３０５）およびライブラリー増幅（工程２３０６）を含む。これらの実験におけるＲｎＤ−ＣＮＡは、連結または増幅を妨げる末端を有さなかった。図２３Ｂはライブラリの製造の結果を示す。アダプター二量体バンドは、ＲｎＤ−ＣＮＡがライブラリー投入物の一部として導入された場合には消失した。

図２３Ａおよび２３ＢはＲＮアーゼＨ消化後のＲｎＤ−ＣＮＡを示す。ＲＮアーゼＨ消化により得られた断片は、両側をアダプターに連結した場合、２本のアダプターの全長が１４５ｂｐであると仮定すると、１７５ｂｐおよび１６６ｂｐの断片を与えた。この連結は、最初に増幅バッファー中でポリメラーゼにより３’陥凹末端が埋められた場合に可能であった。これは、消化後の断片が共に３’オーバーハングを含有するように、そして増幅ポリメラーゼが３’エンドヌクレアーゼ活性を示さないように、ＲｎＡ−ＣＮＡ内のリボヌクレオチドの位置を設計することにより妨げられた。

本開示内容の好ましい実施形態が本明細書に示され、記載されているが、そのような実施形態は単なる例示として記載されていることが当業者に明らかであろう。本開示内容から逸脱することなく、多数の変形、変更および置換が当業者に今や見出されるであろう。本明細書に記載されている開示内容の実施形態の種々の代替物が本開示内容の実施において使用されうると理解されるべきである。以下の特許請求の範囲は本開示内容の範囲を定め、特許請求の範囲の範囲内の方法および構造ならびにそれらの均等物はそれに包含されると意図される。

Claims

（ａ）少なくとも１，０００個のユニーク合成核酸の出発量を初期サンプルに加え、ここで、前記の少なくとも１，０００個のユニーク合成核酸のそれぞれは（i）識別タグ、および（ii）少なくとも５縮重塩基を含む可変領域を含み、
（ｂ）標的核酸の一部および前記の少なくとも１，０００個のユニーク合成
核酸の一部に関して配列決定アッセイを行い、それにより、標的および合成核酸配列リードを得、
（ｃ）前記の少なくとも１，０００個のユニーク合成核酸の部分に関する多様性減少値を計算することを含み、
ここで、初期サンプルにおける標的核酸の存在量は、前記多様性減少値を用いて決定される、標的核酸を含む初期サンプルにおける核酸の存在量を決定するための方法。
標的核酸が病原体核酸を含む、請求項１記載の方法。
標的核酸が、少なくとも５つの異なる病原体からの病原体核酸を含む、請求項２に記載の方法。
前記の少なくとも１，０００個のユニーク合成核酸がＤＮＡを含む、請求項１に記載の方法。
前記の少なくとも１，０００個のユニーク合成核酸のそれぞれが５００塩基対またはヌクレオチド長未満である、請求項１に記載の方法。
初期サンプルが血液、血漿、血清、脳脊髄液、滑液、気管支肺胞洗浄液、尿、便、唾液または鼻サンプルである、請求項１記載の方法。
初期サンプルが、単離された核酸のサンプルである、請求項１に記載の方法。
初期サンプルから配列決定ライブラリーを製造することを更に含み、ここで、配列決定ライブラリーを製造する前に前記の少なくとも１，０００個のユニーク合成核酸をサンプルに加える、請求項１に記載の方法。
前記の少なくとも１，０００個のユニーク合成核酸の部分に関する多様性減少値が初期サンプルのサンプル処理中の１以上の核酸の減少を示す、請求項１に記載の方法。
前記の少なくとも１，０００個のユニーク合成核酸のそれぞれの識別タグが、共通配列を含む、請求項１に記載の方法。
初期サンプルがヒト対象由来である、請求項１に記載の方法。
前記の少なくとも１，０００個のユニーク合成核酸が少なくとも１０^４個のユニーク合成核酸を含む、請求項１に記載の方法。
初期サンプルに追加的合成核酸を加えることを更に含み、該追加的合成核酸が少なくとも３つの異なる長さを有する、請求項１に記載の方法。
第１の長さを有する追加的合成核酸の第１群、第２の長さを有する追加的合成核酸の第２群、および第３の長さを有する追加的合成核酸の第３群を初期サンプルに加えることを更に含み、ここで、追加的合成核酸の第１群、追加的合成核酸の第２群および追加的合成核酸の第３群のそれぞれは、少なくとも３つの異なるＧＣ含量を有する合成核酸を含む、請求項１に記載の方法。
該追加的合成核酸を使用して、初期サンプルにおける標的核酸の存在量を計算することを更に含む、請求項１３記載の方法。
該追加的合成核酸を使用して、該追加的合成核酸の長さ、ＧＣ含量、または長さおよびＧＣ含量の両方に基づいて初期サンプルにおける標的核酸の存在量を計算することを更に含む、請求項１３記載の方法。
第１サンプル処理工程において、前記の少なくとも１，０００個のユニーク合成核酸を初期サンプルに加える、請求項１に記載の方法。
第２サンプル処理工程において、少なくとも１，０００個のユニーク合成核酸の追加的プールを初期サンプルに加えることを更に含み、ここで、第２サンプル処理工程は第１サンプル処理工程とは異なる、請求項１７記載の方法。
少なくとも１，０００個のユニーク合成核酸の追加的プールに関する多様性減少値を計算することを更に含む、請求項１８記載の方法。
前記の少なくとも１，０００個のユニーク合成核酸に関する多様性減少値を少なくとも１，０００個のユニーク合成核酸の追加的プールに関する多様性減少値と比較することにより、比較的高い多様性減少を示すサンプル処理工程を特定することを更に含む、請求項１８記載の方法。
少なくとも１，０００個のユニーク合成核酸の追加的プールにおけるユニーク合成核酸のそれぞれが、少なくとも１，０００個のユニーク合成核酸の追加的プールのメンバーとして該合成核酸を特定するドメインを含む、請求項１８記載の方法。
サンプル識別核酸を初期サンプルに加えることを更に含む、請求項１記載の方法。
（ａ）が更に、非ユニーク合成核酸を初期サンプルに加えることを含む、請求項１記載の方法。
方法の結果を、介護人、患者またはその他の人に報告することをさらに含む、請求項１に記載の方法。
決定される存在量が相対的存在量である、請求項１記載の方法。
決定される存在量が絶対的存在量である、請求項１記載の方法。
異なる可変領域を含む合成核酸配列リードの数を測定することを更に含む、請求項１に記載の方法。
前記の少なくとも１０００個のユニーク合成核酸の出発量を、異なる可変領域を含む合成核酸配列リードの数と比較することによって前記多様性減少値を計算する、請求項２７に記載の方法。
異なる可変領域を含む異なる合成核酸配列リードを参照配列とアライメントさせることで、該合成核酸配列リードの数を決定する、請求項２７に記載の方法。
異なる可変領域を含む異なる合成核酸配列リードを互いにアライメントさせ、重複配列リードを除外することにより、該合成核酸配列リードの数を定量する、請求項２８に記載の方法。