JP2024512463A

JP2024512463A - 増幅されたライブラリからの望ましくない断片の選択的枯渇のためのブロッキングオリゴヌクレオチド

Info

Publication number: JP2024512463A
Application number: JP2023556903A
Authority: JP
Inventors: ブラウン、コリン; シュルツァバーガー、サラ; エムグロス、スティーブン; バー、アンジェリカ; スノー、サマンサ
Original assignee: イルミナインコーポレイティッド
Priority date: 2021-03-31
Filing date: 2022-03-30
Publication date: 2024-03-19
Also published as: WO2022212589A1; AU2022252302A1; US20240191288A1; IL306060A; BR112023019999A2; CA3213037A1; KR20230163386A; CN117098855A; MX2023011523A; EP4314335A1

Abstract

本開示は、ブロッキングオリゴヌクレオチドを使用する増幅されたライブラリからの望ましくない断片の選択的枯渇のための方法、組成物、及びキットに関する。

Description

（関連出願の相互参照）
本出願は、２０２１年３月３１日に出願された米国特許仮出願第６３／１６９，１８５号に対する優先権を主張するものであり、その開示は、参照により本明細書に組み込まれる。

（発明の分野）
本開示は、ブロッキングオリゴヌクレオチドを使用する増幅されたライブラリからの望ましくない断片の選択的枯渇のための方法、組成物、及びキットに関する。

ライブラリ調製物は、次世代シーケンシング（next-generation sequencing、ＮＧＳ）のためのＤＮＡ断片のコレクションを構築することを目的とする。高品質ＤＮＡライブラリは、均一かつ一貫したゲノムカバレッジを保証し、したがって、包括的かつ信頼できる配列決定データを送達する。しかしながら、ライブラリ調製物は、ｒＲＮＡのための配列、ハウスキーピング遺伝子のための配列、ミトコンドリア配列などの、多くの望ましくない配列を含有する。したがって、ライブラリ調製物におけるこれらの望ましくない配列の排除は、より焦点が絞られた、かつデータリッチな次世代シーケンシング（ＮＧＳ）ライブラリを提供することができる。

ｒＲＮＡのハイブリダイゼーションプルダウン（例えば、ＲｉｂｏＺｅｒｏ、ＲｉｂｏＭｉｎｕｓ）又は酵素消化（例えば、ＲＮａｓｅＨ、ＣＲＩＳＰＲ）などの、豊富な配列の枯渇のための現在の方法は、高品質、高入力試料に対して良好に機能するが、多くの場合、ホルマリン固定／パラフィン包埋（formalin fixed/paraffin-embedded、ＦＦＰＥ）組織及び血漿由来循環ＲＮＡ（circulating RNA、Ｃ－ＲＮＡ）などの臨床的に関連する試料タイプにおいて遭遇する低品質、低含量の入力では不十分な性能を示す。代替的に、配列特異的濃縮アプローチ（例えば、エクソームキャプチャ）は、低入力試料に対してより良好な性能を示すが、標的のセットを予め指定する必要性によって制限される。これは、有用なバイオマーカであり得る稀な転写アイソフォーム及び非コードＲＮＡを検出するためのそれらの有用性を制限する。

本開示は、ＰＣＲにおけるポリメラーゼ伸長をブロックするために、長く、強く結合するオリゴヌクレオチドを使用する代替的な枯渇戦略である「ＰＣＲブロッキング」及び関連方法を提供する。本明細書に説明されるアプローチは、既存のアプローチに特徴的な時間のかかる非効率的なインキュベーション及び精製工程を排除し、増幅前の工程中に豊富な配列がビルトイン「キャリア」として作用することを可能にすることによって、低入力用途におけるライブラリ変換を改善することが予想される。

特定の実施形態では、本開示は、１つ以上のブロッキングオリゴヌクレオチドを使用することによって、増幅されたＤＮＡ又はｃＤＮＡライブラリから望ましくない断片を選択的に枯渇させる方法を提供し、方法は、ポリメラーゼ連鎖反応（polymerase chain reaction、ＰＣＲ）反応において、アダプタ配列を含む二本鎖鋳型配列を含む複数のライブラリ断片を増幅することであって、断片の一部分が、分析されるべきではない望ましくない断片を含む、増幅することを含み、ＰＣＲ反応が、複数の断片、ポリメラーゼ、ｄＮＴＰ、ＰＣＲプライマ、及び１つ以上のブロッキングオリゴヌクレオチドを含み、１つ以上のブロッキングオリゴヌクレオチドが、（ｉ）、及び／又は（ｉｉ）、並びに（ｉｉｉ）：（ｉ）５’末端に、ホスホロチオエート結合を含む１つ以上のヌクレオチド、及び／又は（ｉｉ）３’末端に、ホスホロチオエート結合を含む１つ以上のヌクレオチド、並びに（ｉｉｉ）ブロッキングオリゴヌクレオチドの３’末端におけるポリメラーゼ伸長を防止する３’－ブロック、を含み、１つ以上のブロッキングプライマが、所望されない断片の鋳型配列に結合し、それによって、ＰＣＲによる所望されない断片の増幅をブロックする。更なる実施形態では、ブロッキングオリゴヌクレオチドのうちの１つ以上が、１５ｎｔ～１００ｎｔの長さである。なお更なる実施形態では、ポリメラーゼが５’－３’エキソヌクレアーゼ活性を有する場合、ブロッキングオリゴヌクレオチドのうちの１つ以上が、５’末端に、ホスホロチオエート結合を含む１～５個のヌクレオチドを含む。別の実施形態では、ポリメラーゼが３’－５’プルーフリーディング活性を有する場合、ブロッキングオリゴヌクレオチドのうちの１つ以上が、３’末端に、ホスホロチオエート結合を含む１～５個のヌクレオチドを含む。なお別の実施形態では、１つ以上のブロッキングオリゴヌクレオチドが、（ｉ）、（ｉｉ）、及び（ｉｉｉ）：（ｉ）５’末端に、ホスホロチオエート結合を含む２～５個のヌクレオチド、（ｉｉ）３’末端に、ホスホロチオエート結合を含む２～５個のヌクレオチド、及び（ｉｉｉ）ブロッキングオリゴヌクレオチドの３’末端におけるポリメラーゼ伸長を防止する３’－ブロック、を含む。別の実施形態では、３’－ブロックが、Ｃ_３－スペーサ、３’反転塩基、３’リン酸化、３’ジデオキシ塩基、又は３’非相補的オーバーハング塩基から選択される。なお別の実施形態では、増幅されたライブラリが、ｃＤＮＡ由来の鋳型配列を含む。更なる実施形態では、増幅されたライブラリが、ｇＤＮＡ由来の鋳型配列を含む。特定の実施形態では、アダプタ配列が、鋳型配列の各末端にライゲーションされているＹ字アダプタに由来する。別の実施形態では、１つ以上のブロッキングオリゴヌクレオチドが、ｒＲＮＡ及び／又はグロビン由来の鋳型配列に結合する。なお別の実施形態では、１つ以上のブロッキングオリゴヌクレオチドが、１８ＳｒＲＮＡ、５．８ＳｒＲＮＡ、及び／又は２８ＳＲＮＡ由来の鋳型配列に結合するブロッキングオリゴヌクレオチドのプールを含む。更なる実施形態では、ブロッキングオリゴヌクレオチドのうちの１つ以上が、ｍｔＤＮＡ由来の鋳型配列に結合する。なお更なる実施形態では、増幅されたＤＮＡ又はｃＤＮＡライブラリは、次世代シーケンシングを使用することによって分析される。特定の実施形態では、ＰＣＲ増幅工程は、以下の工程：ＲＮＡ試料を取得する工程と、ＲＮＡを断片化する工程と、ＲＮＡ断片をｃＤＮＡに逆転写する工程と、ｃＤＮＡを平滑末端化し、平滑末端化されたｃＤＮＡの３’末端にＡヌクレオチドを付加する工程と、Ａテール付きｃＤＮＡを、３’末端に非相補的Ｔヌクレオチドを含むアダプタとライゲーションする工程と、によって先行される。更なる実施形態では、ＲＮＡ断片をｃＤＮＡに逆転写する前に、ＲＮＡ試料が、ＲＮＡ試料からｒＲＮＡ配列を枯渇させるように処理される。

特定の実施形態では、本開示は、１つ以上のブロッキングオリゴヌクレオチドを使用することによって、増幅されたＤＮＡ又はｃＤＮＡライブラリから望ましくない断片を選択的に枯渇させる方法を更に提供し、方法は、ポリメラーゼ連鎖反応（ＰＣＲ）反応において、アダプタ配列を含む二本鎖鋳型配列を含む複数のライブラリ断片を増幅することであって、断片の一部分が、分析されるべきではない鋳型配列を含有する望ましくない断片を含む、増幅することを含み、ＰＣＲ反応が、複数の断片、ポリメラーゼ、ｄＮＴＰ、ＰＣＲプライマ、及びブロッキングオリゴヌクレオチドのプールを含み、ブロッキングオリゴヌクレオチドのプールの一部分が、所望されない断片の鋳型配列の各鎖に結合し、１つ以上のブロッキングプライマが、所望されない断片の鋳型配列に結合し、それによって、ＰＣＲによる所望されない断片の増幅をブロックする。更なる実施形態では、ブロッキングオリゴヌクレオチドのプールが、１５ｎｔ～１００ｎｔの長さである。なお更なる実施形態では、ブロッキングオリゴヌクレオチドのプールが、非重複かつ隣接様式で鋳型の鎖に結合するブロッキングオリゴヌクレオチドを含む。別の実施形態では、ブロッキングオリゴヌクレオチドのプールが、他のブロッキングオリゴヌクレオチドに対して逆相補的であるブロッキングオリゴヌクレオチドを含む。なお別の実施形態では、ブロッキングオリゴヌクレオチドのプールが、（ｉ）、及び／又は（ｉｉ）、並びに（ｉｉｉ）：（ｉ）５’末端に、ホスホロチオエート結合を含む１つ以上のヌクレオチド、及び／又は（ｉｉ）３’末端に、ホスホロチオエート結合を含む１つ以上のヌクレオチド、並びに（ｉｉｉ）ブロッキングオリゴヌクレオチドの３’末端におけるポリメラーゼ伸長を防止する３’－ブロック、を含む。更なる実施形態では、ポリメラーゼが５’－３’エキソヌクレアーゼ活性を有する場合、ブロッキングオリゴヌクレオチドのうちの１つ以上が、５’末端に、ホスホロチオエート結合を含む１～５個のヌクレオチドを含む。なお更なる実施形態では、ポリメラーゼが３’－５’プルーフリーディング活性を有する場合、ブロッキングオリゴヌクレオチドのうちの１つ以上が、３’末端に、ホスホロチオエート結合を含む１～５個のヌクレオチドを含む。特定の実施形態では、１つ以上のブロッキングオリゴヌクレオチドが、（ｉ）、（ｉｉ）、及び（ｉｉｉ）：（ｉ）５’末端に、ホスホロチオエート結合を含む２～５個のヌクレオチド、（ｉｉ）３’末端に、ホスホロチオエート結合を含む２～５個のヌクレオチド、及び（ｉｉｉ）ブロッキングオリゴヌクレオチドの３’末端上のポリメラーゼ伸長を防止する３’－ブロック、を含む。更なる実施形態では、３’－ブロックが、Ｃ_３－スペーサ、３’反転塩基、３’リン酸化、３’ジデオキシ塩基、又は３’非相補的オーバーハング塩基から選択される。別の実施形態では、増幅されたライブラリが、ｃＤＮＡ由来の鋳型配列を含む。なお別の実施形態では、増幅されたライブラリが、ｇＤＮＡ由来の鋳型配列を含む。更なる実施形態では、アダプタ配列が、鋳型配列の各末端にライゲーションされているＹ字アダプタに由来する。なお更なる実施形態では、ブロッキングオリゴヌクレオチドのプールが、ｒＲＮＡ及び／又はグロビン由来の鋳型配列に結合する。別の実施形態では、ブロッキングオリゴヌクレオチドのプールが、１８ＳｒＲＮＡ、５．８ＳｒＲＮＡ、及び／又は２８ＳＲＮＡ由来の鋳型配列に結合する。更なる実施形態では、ブロッキングオリゴヌクレオチドのブロッキングのプールが、ｍｔＤＮＡ由来の鋳型配列に結合する。なお更なる実施形態では、増幅されたＤＮＡ又はｃＤＮＡライブラリは、次世代シーケンシングを使用することによって分析される。別の実施形態では、ＰＣＲ増幅工程は、以下の工程：ＲＮＡ試料を取得する工程と、ＲＮＡを断片化する工程と、ＲＮＡ断片をｃＤＮＡに逆転写する工程と、ｃＤＮＡを平滑末端化し、平滑末端化されたｃＤＮＡの３’末端にＡヌクレオチドを付加する工程と、Ａテール付きｃＤＮＡを、３’末端に非相補的Ｔヌクレオチドを含むアダプタとライゲーションする工程と、によって先行される。なお更なる実施形態では、ＲＮＡ断片をｃＤＮＡに逆転写する前に、ＲＮＡ試料が、ＲＮＡ試料からｒＲＮＡ配列を枯渇させるように処理される。

特定の実施形態では、本開示は、１つ以上のブロッキングオリゴヌクレオチドを含むＲＮＡ－Ｓｅｑベースのライブラリ調製キットを更に提供し、１つ以上のブロッキングオリゴヌクレオチドが、（ｉ）、及び／又は（ｉｉ）、並びに（ｉｉｉ）：（ｉ）５’末端に、ホスホロチオエート結合を含む１つ以上のヌクレオチド、及び／又は（ｉｉ）３’末端に、ホスホロチオエート結合を含む１つ以上のヌクレオチド、並びに（ｉｉｉ）ブロッキングオリゴヌクレオチドの３’末端におけるポリメラーゼ伸長を防止する３’－ブロック、を含み、１つ以上のブロッキングオリゴヌクレオチドが、所望されないライブラリ断片の鋳型配列に結合し、それによって、ＰＣＲによる所望されないライブラリ断片の増幅をブロックする。更なる実施形態では、ライブラリ調製キットが、Ａ－テーリングミックスと、増強されたＰＣＲミックスと、ライゲーションミックスと、再懸濁緩衝液と、停止ライゲーション緩衝液と、Ｅｌｕｔｅ，Ｐｒｉｍｅ，ＦｒａｇｍｅｎｔＨｉｇｈＣｏｎｃｅｎｔｒａｔｉｏｎＭｉｘと、ＦｉｒｓｔｓｔｒａｎｄＳｙｎｔｈｅｓｉｓＡｃｔＤＭｉｘと、逆転写酵素と、第２鎖マスタミックスと、を含む。なお更なる実施形態では、ブロッキングオリゴヌクレオチドのうちの１つ以上が、１５ｎｔ～１００ｎｔの長さである。

特定の実施形態では、本開示は、ブロッキングオリゴヌクレオチドのプールを含むＲＮＡ－Ｓｅｑベースのライブラリ調製キットを提供し、ブロッキングオリゴヌクレオチドのプールの一部分が、所望されない断片の鋳型配列の各鎖に非重複かつ隣接様式で結合し、それによって、ＰＣＲによる所望されないライブラリ断片の増幅をブロックする。更なる実施形態では、ライブラリ調製キットが、Ａ－テーリングミックスと、増強されたＰＣＲミックスと、ライゲーションミックスと、再懸濁緩衝液と、停止ライゲーション緩衝液と、Ｅｌｕｔｅ，Ｐｒｉｍｅ，ＦｒａｇｍｅｎｔＨｉｇｈＣｏｎｃｅｎｔｒａｔｉｏｎＭｉｘと、ＦｉｒｓｔｓｔｒａｎｄＳｙｎｔｈｅｓｉｓＡｃｔＤＭｉｘと、逆転写酵素と、第２鎖マスタミックスと、を含む。更なる実施形態では、ブロッキングオリゴヌクレオチドのプールが、１５ｎｔ～１００ｎｔの長さである。なお更なる実施形態では、ブロッキングオリゴヌクレオチドのプールが、（ｉ）、及び／又は（ｉｉ）、並びに（ｉｉｉ）：（ｉ）５’末端に、ホスホロチオエート結合を含む１つ以上のヌクレオチド、及び／又は（ｉｉ）３’末端に、ホスホロチオエート結合を含む１つ以上のヌクレオチド、並びに（ｉｉｉ）ブロッキングオリゴヌクレオチドの３’末端におけるポリメラーゼ伸長を防止する３’－ブロック、を含む。更なる実施形態では、３’－ブロックが、Ｃ_３－スペーサ、３’反転塩基、３’リン酸化、３’ジデオキシ塩基、又は３’非相補的オーバーハング塩基から選択される。

本開示の１つ以上の実施形態の詳細が、添付の図面及び以下の明細書に記載されている。他の特徴、目的、及び利点は、明細書及び図面、並びに特許請求の範囲から明らかになるであろう。

ｒＲＮＡ断片のＲＮＡ－Ｓｅｑライブラリを枯渇させるためのＰＣＲクランプの使用と比較した、従来の全ＲＮＡワークフローのワークフロー概要を提示する。不要な断片の配列決定ライブラリを枯渇させるためにＰＣＲクランプがどのように使用され得るかの例示を提供する。反応における重要な試薬：所望される断片及び所望されない断片から構成される配列決定ライブラリ、ＰＣＲクランプ、並びにＰＣＲ増幅プライマ。簡略化のために、２つのライブラリ断片タイプのみが示される：ＰＣＲクランプによって標的化される１つの所望されない断片（赤色）及びＰＣＲクランプによって標的化されない１つの断片。ライブラリ断片における濃い灰色の末端は、ユニバーサルアダプタ配列を表す。不要な断片の配列決定ライブラリを枯渇させるためにＰＣＲクランプがどのように使用され得るかの例示を提供する。ＰＣＲクランプ及びＰＣＲプライマのハイブリダイゼーション：ＰＣＲにおける高温による変性後、反応物が冷却されて、ＰＣＲプライマのアニーリングを可能にする。同時に、所望されないライブラリ断片は、ＰＣＲクランプとハイブリダイズすることによって除去のために標的化されるが、一方、所望されるライブラリ断片は、任意のＰＣＲクランプによって非結合のままである。重要な特徴は、ＰＣＲクランプのその標的への完全な端から端までのハイブリダイゼーションが必要とされないことである。したがって、多くの所望されないライブラリ断片は、ライブラリ内のそれらの特異的性質の演繹的知識なしで、枯渇のために標的化され得る。不要な断片の配列決定ライブラリを枯渇させるためにＰＣＲクランプがどのように使用され得るかの例示を提供する。伸長：耐熱性ポリメラーゼがＰＣＲプライマから伸長して、ライブラリ断片のコピーを生成する。所望されない断片に結合したＰＣＲクランプは、結合したＰＣＲクランプによるブロッキングに起因して、完全にコピーされることができない。所望されるライブラリ断片は、ＰＣＲクランプによって妨害されずにコピーされる。不要な断片の配列決定ライブラリを枯渇させるためにＰＣＲクランプがどのように使用され得るかの例示を提供する。最終ライブラリ：最終ライブラリは、所望されるライブラリ断片（灰色）の指数関数的増幅から生成されるが、一方、所望されないライブラリ断片（赤色）は、非効率的に増幅された。結果は、所望されないライブラリ断片が「枯渇」されるライブラリである。ｒＲＮＡ遺伝子の増幅をブロックするように設計された例示的なＰＣＲクランプの概要を提供する。Ｄｅｓｉｇｎ１は、逆平行及び隣接ＰＣＲクランプを提供する。Ｄｅｓｉｇｎ１＋２は、追加の逆相補的ＰＣＲクランプが付加されているＤｅｓｉｇｎ１の特徴を組み込む非重複ＰＣＲクランプを提供する。Ｄｅｓｉｇｎ３は、重複逆平行ＰＣＲクランプを提供する。Ｄｅｓｉｇｎ１又はＤｅｓｉｇｎ１＿２において設計されたＰＣＲクランプが、非枯渇全ＲＮＡを使用したときのｒＲＮＡ増幅転写物を有意に低減させたことを示す。ｒＲＮＡは、対照（ＰＣＲクランプなし）と比較して、ＰＣＲクランプを使用して約８５％から３０％まで減少した。Ｄｅｓｉｇｎ１又はＤｅｓｉｇｎ１＿２において設計されたＰＣＲクランプが、ＲＰＯ濃縮試料及び非枯渇全ＲＮＡ試料においてｒＲＮＡを更に低減させたことを示す。ＤｅｓｉｇｎＯｆｆＳｅｔ（Ｄｅｓｉｇｎ３）は、ＲＰＯ試料中のｒＲＮＡ濃縮に有意な影響を及ぼさなかった。Ｄｅｓｉｇｎ１又はＤｅｓｉｇｎ１＿２ＰＣＲクランプを使用することは、ｒＲＮＡ濃縮を約２０％から１％まで減少させた。Ｄｅｓｉｇｎ１又はＤｅｓｉｇｎ１＿２で設計されたＰＣＲクランプが、ｍＲＮＡ選択試料中の標的化されたｒＲＮＡを低減したことを実証する。Ｄｅｓｉｇｎ１及び２は、ｍＲＮＡ選択試料中の％ｒＲＮＡを約１．５％ｒＲＮＡから約０．２５％ｒＲＮＡまで更に低減することができた。ＰＣＲクランプとＲｉｂｏＺｅｒｏ法との間の１００万マッピングリード当たりの転写物１キロベースの断片数（Fragments Per Kilobase of transcript per Million mapped reads、ＦＰＫＭ）比較を提供する。ＰＣＲクランプを使用する試料が、異なる枯渇方法にわたってＦＰＫＭＲ^２値＞０．９５を有する高レベルの発現相関を有することを実証する。最適化なしのプローブパネルから生成されたデータのトレースを示す。プローブ設計及びワークフロー生化学を最適化することによって、追加の利益が可能であり得る。本開示のＰＣＲクランプ（ブロッキングオリゴ）の例示的な実施形態を提供する。７５℃又は８０℃の融解温度を有するように設計されたＰＣＲクランプを用いて、２８ＳｒＲＮＡ、１８ＳｒＲＮＡ、５．８５ｒＲＮＡ、Ｍｔ１２ＳｒＲＮＡ及びｍｔ１６Ｓの配列から生成され得るＰＣＲクランプの例を提供する。丸は、８０℃ＰＣＲクランプがｒＲＮＡ配列から生成されることができない配列のギャップを示す（表に示されるように）。ｒＲＮＡ含有ＲＮＡｓｅｑデータからのデータを示す。リードの大部分は、８０℃の融解温度を有するＰＣＲクランプでブロックされた。ＰＣＲクランプ研究の概要を提示する。（上パネル）４２ｋｂｐヒトリボソームＤＮＡ完全反復単位（ＧｅｎＢａｎｋＵ１３３５９．１）の概要。非常に豊富なリボソームＲＮＡ（１８Ｓ、５．８Ｓ、及び２８Ｓ）をコードする３つの遺伝子座が赤色で記されている。追加の特徴は、濃い灰色で示されている。（下パネル）１８Ｓ、５．８Ｓ、及び２８ＳｒＲＮＡをコードする遺伝子座を含有する領域の拡大図。ｒＲＮＡ遺伝子は、赤色で記されている。ＰＣＲクランプの２つの設計が示されている：端から端までタイル状に並べられた交互の８０－ｍｅｒＰＣＲクランプを有するＤｅｓｉｇｎ１。１つおきのＰＣＲクランプは、標的化されたｒＲＮＡ遺伝子に対して交互の５’→３’配向にある（薄い灰色又は濃い灰色のいずれか）。Ｄｅｓｉｇｎ２は、Ｄｅｓｉｇｎ１と同じ相対位置にＰＣＲクランプを含有するが、各クランプは、Ｄｅｓｉｇｎ１の逆相補的配列である。

本明細書に組み込まれ、かつ本明細書の一部を構成する添付図面は、本開示の１つ以上の実施形態を図解し、詳細な説明とともに、本開示の原理及び実装を説明する役割を果たす。

本明細書及び添付の特許請求の範囲で使用される場合、「ａ」、「ａｎ」、及び「ｔｈｅ」という単数形は、文脈がそうでない旨を明確に指示しない限り、複数の指示対象を含む。したがって、例えば、「オリゴヌクレオチド（oligonucleotide）」への言及は、複数のそのようなオリゴヌクレオチドを含み、「標的配列（the target sequence）」への言及は、１つ以上の標的配列への言及などを含む。

また、別途記載のない限り、「又は」の使用は「及び／又は」を意味する。同様に、「含む（comprise）」、「含む（comprises）」、「含む（comprising）」、「含む（include）」、「含む（includes）」、「含む（including）」、「有する（have）」、「有する（haves）」、「有する（having）」は、交換可能であり、限定することを意図するものではない。

様々な実施形態の説明が「含む（comprising）」という用語を使用する場合、当業者であれば、いくつかの具体的な事例において、ある実施形態が、「から本質的になる（consisting essentially of）」又は「からなる（consisting of）」という文言を使用して代替的に説明することができることを理解するであろうことを、更に理解されたい。

別途定義されない限り、本開示書で使用される全ての技術用語及び科学用語は、本開示が属する技術分野の当業者に一般的に理解されるものと同じ意味を有する。本明細書に記載されるものと同様又は同等の方法及び材料を本開示の方法及び組成物の実施に使用することができるが、例示的な方法、デバイス、及び材料が、本明細書に記載されている。

「増幅」又は「増幅する」という表現は、特定のポリヌクレオチドの余分なコピー又は複数のコピーが形成されるプロセスを指す。増幅は、ＰＣＲ、ライゲーション増幅（又はリガーゼ連鎖反応、ｌｉｇａｓｅｃｈａｉｎｒｅａｃｔｉｏｎ、ＬＣＲ）、及び増幅法などの方法を含む。これらの方法は、公知であり、当技術分野で広く実施されている。例えば、米国特許第４，６８３，１９５号及び同第４，６８３，２０２号、並びにＩｎｎｉｓｅｔａｌ．，「ＰＣＲｐｒｏｔｏｃｏｌｓ：ａｇｕｉｄｅｔｏｍｅｔｈｏｄａｎｄａｐｐｌｉｃａｔｉｏｎｓ」ＡｃａｄｅｍｉｃＰｒｅｓｓ，Ｉｎｃｏｒｐｏｒａｔｅｄ（１９９０）（ＰＣＲに関して）と、Ｗｕｅｔａｌ．（１９８９）Ｇｅｎｏｍｉｃｓ４：５６０－５６９（ＬＣＲに関して）と、を参照されたい。一般に、ＰＣＲ手順は、（ｉ）ＤＮＡ試料（又はライブラリ）内の特定の遺伝子へのプライマの配列特異的ハイブリダイゼーション、（ｉｉ）ＤＮＡポリメラーゼを使用する複数回のアニーリング、伸長、及び変性を伴うその後の増幅、並びに（ｉｉｉ）正確なサイズのバンドについてのＰＣＲ産物のスクリーニングから構成される、遺伝子増幅の方法を説明する。使用されるプライマは、重合の開始を提供するのに十分な長さ及び適切な配列のオリゴヌクレオチドであり、すなわち、各プライマは、増幅されるゲノム遺伝子座の各鎖に相補的であるように特異的に設計される。

増幅反応を実施するための試薬及びハードウェアは、市販されている。特定の遺伝子領域からの配列を増幅するために有用なプライマは、好ましくは、標的領域又はその隣接領域における配列に相補的であり、かつ特異的にハイブリダイズし、本明細書で提供されるポリヌクレオチド配列を使用して調製され得る。増幅によって生成された核酸配列は、直接配列決定され得る。

「ブロッキングオリゴヌクレオチド」は、本明細書で使用される場合、１つ以上の望ましくない核酸種のうちの少なくとも１つに特異的に結合し得る核酸分子を指し、それによって、ブロッキングオリゴヌクレオチドと１つ以上の望ましくない核酸種との間の結合は、１つ以上の望ましくない核酸腫の増幅又は伸長（例えば、逆転写）を低減又は防止し得る。例えば、ブロッキングオリゴヌクレオチドは、１つ以上の望ましくない核酸種とハイブリダイズすることができる核酸配列を含み得る。いくつかの実施形態では、複数のブロッキングオリゴヌクレオチドが提供され得る。複数のブロッキングオリゴヌクレオチドは、１つ以上の望ましくない核酸種のうちの少なくとも１つ、少なくとも２つ、少なくとも５つ、少なくとも１０個、少なくとも１００個、少なくとも１，０００個以上に特異的に結合し得る。更に、複数の異なるブロッキングオリゴヌクレオチドは、同じ望ましくない核酸種上の少なくとも１つ、少なくとも２つ、少なくとも５つ、少なくとも１０個、少なくとも２０個、少なくとも１００個の異なる部位に、望ましくない核酸種上の平行であるか、逆平行であるか、間隔を有するか、又は連続する部位で特異的に結合し得る。ブロッキングオリゴヌクレオチドが望ましくない核酸種に特異的に結合する場所は、変化し得る。例えば、ブロッキングオリゴヌクレオチドは、望ましくない核酸種の５’末端に近い配列に特異的に結合し得る。いくつかの態様では、ブロッキングオリゴヌクレオチドは、１つ以上の望ましくない核酸種のうちの少なくとも１つの５’末端の１０ｎｔ、２０ｎｔ、３０ｎｔ、４０ｎｔ、５０ｎｔ、１００ｎｔ、２００ｎｔ、３００ｎｔ、４００ｎｔ、５００ｎｔ、又は１，０００ｎｔ以内に特異的に結合し得る。いくつかの実施形態では、ブロッキングオリゴヌクレオチドは、望ましくない核酸種の３’末端に近い配列に特異的に結合し得る。例えば、ブロッキングオリゴヌクレオチドは、１つ以上の望ましくない核酸種のうちの少なくとも１つの３’末端の１０ｎｔ、２０ｎｔ、３０ｎｔ、４０ｎｔ、５０ｎｔ、１００ｎｔ、２００ｎｔ、３００ｎｔ、４００ｎｔ、５００ｎｔ、１，０００ｎｔ以内に特異的に結合し得る。別の例として、ブロッキングオリゴヌクレオチドは、望ましくない核酸種の中間部分の配列に特異的に結合し得る。いくつかの態様では、ブロッキングオリゴヌクレオチドは、１つ以上の望ましくない核酸種のうちの少なくとも１つの中間点から１０ｎｔ、２０ｎｔ、３０ｎｔ、４０ｎｔ、５０ｎｔ、１００ｎｔ、２００ｎｔ、３００ｎｔ、４００ｎｔ、５００ｎｔ、１，０００ｎｔ以内に特異的に結合し得る。いくつかの実施形態では、ブロッキングオリゴヌクレオチドは、望ましくない核酸種の５’末端と３’末端との間の複数の位置で結合し得る。

いくつかの実施態様では、ブロッキングオリゴヌクレオチドと望ましくない核酸種との間の結合は、望ましくない核酸種の増幅及び／又は伸長を少なくとも１０％、少なくとも２０％、少なくとも３０％、少なくとも４０％、少なくとも５０％、少なくとも６０％、少なくとも７０％、少なくとも８０％、少なくとも９０％、少なくとも９５％、少なくとも９８％、少なくとも９９％、又は１００％だけ低減し得る。

ブロッキングオリゴヌクレオチドは、例えば、望ましくない核酸種とのハイブリダイゼーション複合体を形成することによって、望ましくない核酸種の増幅及び／又は伸長を低減し得ることが企図され、それにより、複合体は、高い融解温度（Ｔ_ｍ）を有し、したがって、ブロッキングオリゴヌクレオチドが、逆転写酵素若しくはポリメラーゼ、又はそれらの組み合わせのためのプライマとして機能することを可能にしない。いくつかの実施形態では、ブロッキングオリゴヌクレオチドは、４８℃、４９℃、５０℃、５１℃、５２℃、５３℃、５４℃、５５℃、５６℃、５７℃、５８℃、５９℃、６０℃、６１℃、６２℃、６３℃、６４℃、６５℃、７０℃、７５℃、８０℃、又は上記の温度のうちの任意の２つを含むか若しくはその間である範囲（例えば、５０℃～６０℃）のＴ_ｍを有し得る。

ブロッキングオリゴヌクレオチドは、いくつかの実施形態では、１つ以上の非天然ヌクレオチドを含み得る。非天然ヌクレオチドは、例えば、感光性又はトリガー可能なヌクレオチドであり得る。非天然ヌクレオチドの例としては、ペプチド核酸（ｐｅｐｔｉｄｅｎｕｃｌｅｉｃａｃｉｄ、ＰＮＡ）、モルフォリノ及びロックド核酸（ｌｏｃｋｅｄｎｕｃｌｅｉｃａｃｉｄ、ＬＮＡ）、並びにグリコール核酸（ｇｌｙｃｏｌｎｕｃｌｅｉｃａｃｉｄ、ＧＮＡ）及びトレオース核酸（ｔｈｒｅｏｓｅｎｕｃｌｅｉｃａｃｉｄ、ＴＮＡ）が挙げられ得るが、これらに限定されない。いくつかの実施形態では、ブロッキングオリゴヌクレオチドは、ＬＮＡ／ＰＮＡ／ＤＮＡキメラ、ＬＮＡ／ＤＮＡキメラ、ＰＮＡ／ＤＮＡキメラ、ＧＮＡ／ＤＮＡキメラ、ＴＮＡ／ＤＮＡキメラ、又はそれらの組み合わせなどの、キメラオリゴヌクレオチドである。

ブロッキングオリゴヌクレオチドは、約１０ｎｔ、１１ｎｔ、１２ｎｔ、１３ｎｔ、１４ｎｔ、１５ｎｔ、１６ｎｔ、１７ｎｔ、１８ｎｔ、１９ｎｔ、２０ｎｔ、２１ｎｔ、２２ｎｔ、２３ｎｔ、２４ｎｔ、２５ｎｔ、２６ｎｔ、２７ｎｔ、２８ｎｔ、２９ｎｔ、３０ｎｔ、３５ｎｔ、４０ｎｔ、４５ｎｔ、５０ｎｔ、６０ｎｔ、７０ｎｔ、８０ｎｔ、９０ｎｔ、１００ｎｔ、２００ｎｔ、又は上記のヌクレオチド長のうちのいずれか２つを含むか若しくはその間である範囲（例えば、１７ｎｔ～３０ｎｔ）である長さを有し得る。

ブロッキングオリゴヌクレオチドの融解温度（Ｔ_ｍ）は、いくつかの実施形態では、ブロッキングオリゴヌクレオチドの長さを調節することによって修飾され得る。いくつかの実施形態では、ブロッキングオリゴヌクレオチドのＴ_ｍは、ＬＮＡ／ＤＮＡキメラ又はＰＮＡ／ＤＮＡキメラを含むブロッキングオリゴヌクレオチド中のＤＮＡ残基の数によって修飾される。例えば、ＬＮＡ／ＤＮＡキメラ又はＰＮＡ／ＤＮＡキメラを含むブロッキングオリゴヌクレオチドは、約１０％、１５％、２０％、２５％、３０％、３５％、４０％、４５％、５０％、６０％、７０％、８０％、９０％、９５％、９９％又は上記の値のうちの任意の２つの間の範囲であるＤＮＡ残基のパーセンテージを有し得る。

いくつかの実施形態では、ブロッキングオリゴヌクレオチドは、増幅及び／又は伸長反応のためのプライマ又はプローブとして機能することができないように設計され得る。例えば、ブロッキングオリゴヌクレオチドは、逆転写酵素又はポリメラーゼに対するプライマとして機能することができない場合がある。例えば、ＬＮＡ／ＤＮＡキメラ又はＰＮＡ／ＤＮＡキメラを含むブロッキングオリゴヌクレオチドは、特定のパーセンテージのＬＮＡ又はＰＮＡ残基を有するように、あるいはオリゴヌクレオチドの３’末端、５’末端に近いか、若しくは３’末端、５’末端、又は中間部分などの、特定の場所にＬＮＡ又はＰＮＡを有するように設計され得る。いくつかの実施形態では、ＬＮＡ／ＤＮＡキメラ又はＰＮＡ／ＤＮＡキメラを含むブロッキングオリゴヌクレオチドは、約１０％、１５％、２０％、２５％、３０％、３５％、４０％、４５％、５０％、６０％、７０％、８０％、９０％、又は上記の値のうちの任意の２つの間の範囲であるＬＮＡ又はＰＮＡ残基のパーセンテージを有し得る。

「ｃＤＮＡライブラリ」という用語は、単一細胞又は複数の単一細胞のトランスクリプトームのいくつかの部分を一緒に構成する、クローニングされた相補的ＤＮＡ（complementary DNA、ｃＤＮＡ）断片のコレクションを指す。ｃＤＮＡは、細胞に見つかる完全に転写されたｍＲＮＡから生成され、したがって、単一細胞の発現された遺伝子のみ、又は一緒にプールされたとき、複数の単一細胞由来の発現された遺伝子を含有する。

本明細書で使用される場合、「相補的」という用語は、２つのヌクレオチド間の精密な対合の能力を指し得る。例えば、核酸の所与の位置のヌクレオチドが別の核酸のヌクレオチドと水素結合することができる場合、２つの核酸は、その位置で互いに相補的であると考えられる。２つの一本鎖核酸分子間の相補性は、ヌクレオチドのうちの一部のみが結合する「部分的」であり得るか（例えば、ブロッキングオリゴと相補的標的との間に１つ以上のミスマッチが存在する）、又は一本鎖分子間に完全な相補性が存在するとき完全であり得る（例えば、ブロッキングオリゴと相補的標的との間にミスマッチがない）。第１のヌクレオチド配列は、第１のヌクレオチド配列が第２のヌクレオチド配列に相補的である場合、第２の配列の「相補体」であると言うことができる。第１のヌクレオチド配列は、第１のヌクレオチド配列が第２の配列の逆である（すなわち、ヌクレオチドの順序が逆である）配列に相補的である場合、第２の配列の「逆相補体」であると言うことができる。本明細書で使用される場合、「相補体」、「相補的」、及び「逆相補体」という用語は、交換可能に使用され得る。分子が別の分子にハイブリダイズし得る場合、それはハイブリダイズしている分子の相補体であり得ることが本開示から理解される。

「保存的アミノ酸置換」は、アミノ酸残基が類似の側鎖を有するアミノ酸残基で置換される置換である。類似の側鎖を有するアミノ酸残基のファミリーは、当技術分野において定義されている。これらのファミリーは、塩基性側鎖を有するアミノ酸（例えば、リジン、アルギニン、ヒスチジン）、酸性側鎖を有するアミノ酸（例えば、アスパラギン酸、グルタミン酸）、無電荷極性側鎖を有するアミノ酸（例えば、グリシン、アスパラギン、グルタミン、セリン、スレオニン、チロシン、システイン）、非極性側鎖を有するアミノ酸（例えば、アラニン、バリン、ロイシン、イソロイシン、プロリン、フェニルアラニン、メチオニン、トリプトファン）、β分岐側鎖を有するアミノ酸（例えば、スレオニン、バリン、イソロイシン）、及び芳香族側鎖を有するアミノ酸（例えば、チロシン、フェニルアラニン、トリプトファン、ヒスチジン）を含む。以下の６つの群は、各々、互いに保存的置換であるアミノ酸を含有する：１）セリン（Ｓ）、スレオニン（Ｔ）、２）アスパラギン酸（Ｄ）、グルタミン酸（Ｅ）、３）アスパラギン（Ｎ）、グルタミン（Ｑ）、４）アルギニン（Ｒ）、リジン（Ｋ）、５）イソロイシン（Ｉ）、ロイシン（Ｌ）、メチオニン（Ｍ）、アラニン（Ａ）、バリン（Ｖ）、及び６）フェニルアラニン（Ｆ）、チロシン（Ｙ）、トリプトファン（Ｗ）。

本明細書で使用される場合、「発現」は、ポリヌクレオチドがｍＲＮＡに転写されるプロセス、及び／又は転写されたｍＲＮＡが、続いて、ペプチド、ポリペプチド、若しくはタンパク質に翻訳されるプロセスを指す。ポリヌクレオチドがゲノムＤＮＡに由来する場合、発現は、真核細胞におけるｍＲＮＡのスプライシングを含み得る。

第１のファミリー又は種の元の酵素又は遺伝子に関して使用される「相同体」という用語は、機能的、構造的又はゲノム分析によって、第１のファミリー又は種の元の酵素又は遺伝子に対応する第２のファミリー又は種の酵素又は遺伝子であると決定される、第２のファミリー又は種の別個の酵素又は遺伝子を指す。ほとんどの場合、相同体は、機能的、構造的、又はゲノム類似性を有することになる。酵素又は遺伝子の相同体が、遺伝子プローブ及びＰＣＲを使用して容易にクローニングされ得る技術は公知である。相同体としてのクローニングされた配列の同一性は、機能アッセイを使用して、及び／又は遺伝子のゲノムマッピングによって確認され得る。

本明細書で使用される場合、２つのポリヌクレオチド、オリゴヌクレオチド、ペプチド、ポリペプチド、若しくはタンパク質（又は上記のうちのいずれかの断片）は、核酸又はアミノ酸配列が少なくとも約３０％、４０％、５０％、６０％、６５％、７０％、７５％、８０％、８５％、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、又は９９％の同一性を有するとき、実質的に相同である。２つのアミノ酸配列、又は２つの核酸配列のパーセント同一性を決定するために、配列が最適な比較目的のためにアラインメントされる（例えば、ギャップが、最適なアラインメントのために第１及び第２のアミノ酸又は核酸配列のうちの一方又は両方に導入され得、非相同配列は、比較目的のために無視され得る）。一実施形態では、比較目的のためにアラインメントされる参照配列の長さは、参照配列の長さの少なくとも３０％、典型的には少なくとも４０％、より典型的には少なくとも５０％、更により典型的には少なくとも６０％、及び更により典型的には少なくとも７０％、８０％、９０％、又は１００％である。次いで、対応するアミノ酸位置又はヌクレオチド位置におけるアミノ酸残基又はヌクレオチドが比較される。第１の配列における位置が、第２の配列における対応する位置と同じアミノ酸残基又はヌクレオチドによって占められているとき、分子は、その位置で同一である（本明細書で使用される場合、アミノ酸又は核酸「同一性」は、アミノ酸又は核酸「相同性」と等価である）。２つの配列間のパーセント同一性は、２つの配列の最適なアラインメントのために導入される必要がある、ギャップの数及び各ギャップの長さを考慮する、配列によって共有される同一の位置の数の関数である。

ハイブリダイゼーションが２つの一本鎖ポリヌクレオチド間で、逆平行構成において起こるとき、反応は、「アニーリング」と呼ばれ、これらのポリヌクレオチドは、「相補的」として説明される。二本鎖ポリヌクレオチドは、ハイブリダイゼーションが第１のポリヌクレオチドの鎖のうちの１つと第２のポリヌクレオチドとの間で起こり得る場合、別のポリヌクレオチドに対して相補的又は相同であり得る。相補性又は相同性（１つのポリヌクレオチドが別のポリヌクレオチドと相補的である度合い）は、一般的に受け入れられている塩基対合規則に従って、互いに水素結合を形成すると予想される対向鎖における塩基の割合に関して定量可能である。

「オリゴヌクレオチド」及び「ポリヌクレオチド」という用語は、交換可能に使用され、デオキシリボヌクレオチド若しくはリボヌクレオチド又はそれらの類似体のいずれかである、任意の長さのヌクレオチドのポリマー形態を指す。ポリヌクレオチドは、任意の三次元構造を有し得、既知の又は不明な任意の機能を果たし得る。以下は、ポリヌクレオチドの非限定的な例である：遺伝子又は遺伝子断片（例えば、プローブ、プライマ、ＥＳＴ又はＳＡＧＥタグ）、エクソン、イントロン、メッセンジャーＲＮＡ（messenger RNA、ｍＲＮＡ）、トランスファーＲＮＡ、リボソームＲＮＡ、リボザイム、ｃＤＮＡ、組換えポリヌクレオチド、分岐ポリヌクレオチド、プラスミド、ベクター、任意の配列の単離ＤＮＡ、任意の配列の単離ＲＮＡ、核酸プローブ及びプライマ。ポリヌクレオチド（例えば、ブロッキングオリゴヌクレオチド）は、メチル化ヌクレオチド及びヌクレオチド類似体などの修飾ヌクレオチドを含み得る。用語はまた、二本鎖分子及び一本鎖分子の両方を指す。別段の指定又は要求がない限り、ポリヌクレオチドを含む本開示の任意の実施形態は、二本鎖形態と、二本鎖形態を構成することが知られているか又は予測される２つの相補的な一本鎖形態の各々との両方を包含する。

本明細書に開示される方法及び組成物において有用な核酸は、骨格中に非天然糖部分を含有し得る。例示的な糖修飾としては、ハロゲン、アルキル、置換アルキル、－ＳＨ、－ＳＣＨ_３、－ＯＣＮ、－Ｃｌ、－Ｂｒ、－ＣＮ、－ＣＦ_３、－ＯＣＦ_３、－ＳＯ_２ＣＨ_３、－ＯＳＯ_２、－ＳＯ_３、－ＣＨ_３、－ＯＮＯ_２、－ＮＯ_２、－Ｎ_３、－ＮＨ_２、置換シリルなどの付加などの２’修飾が挙げられるが、これらに限定されない。同様の修飾は、糖上の他の位置、特に３’末端ヌクレオチド上又は２’－５’結合オリゴヌクレオチド中の糖の３’位、及び５’末端ヌクレオチドの５’位でも行われ得る。糖修飾を有する核酸、ヌクレオシド類似体、又はヌクレオチド類似体は、可逆的ブロッキング基、ペプチド結合標識、又はその両方を含むように更に修飾され得る。上記の２’修飾が存在するそれらの実施形態では、塩基は、ペプチド結合標識を有し得る。

本明細書に開示される方法及び組成物において有用な核酸はまた、ネイティブ又は非ネイティブ塩基を含み得る。この点に関して、ネイティブデオキシリボ核酸は、アデニン、チミン、シトシン、又はグアニンからなる群から選択される１つ以上の塩基を有することができ、リボ核酸は、ウラシル、アデニン、シトシン、又はグアニンからなる群から選択される１つ以上の塩基を有することができる。ネイティブ骨格又は類似体構造を有するかどうかにかかわらず、核酸に含められ得る例示的な非ネイティブ塩基としては、限定なしで、イノシン、キササニン、ヒポキササニン、イソシトシン、イソグアニン、５－メチルシトシン、５－ヒドロキシメチルシトシン、２－アミノアデニン、６－メチルアデニン、６－メチルグアニン、２－プロピルグアニン、２－プロピルアデニン、２－チオウラシル、２－チオチミン、２－チオシトシン、１５－ハロウラシル、１５－ハロシトシン、５－プロピニルウラシル、５－プロピニルシトシン、６－アゾウラシル、６－アゾシトシン、６－アゾチミン、５－ウラシル、４－チオウラシル、８－ハロアデニン又はグアニン、８－アミノアデニン又はグアニン、８－チオールアデニン又はグアニン、８－チオアルキルアデニン又はグアニン、８－ヒドロキシルアデニン又はグアニン、５－ハロ置換ウラシル又はシトシン、７－メチルグアニン、７－メチルアデニン、８－アザグアニン、８－アザアデニン、７－デアザグアニン、７－デアザアデニン。３－デアザグアニン、３－デアザアデニンなどが挙げられる。特定の実施形態は、米国特許第５，６８１，７０２号に一般的に説明されているように、非特異的ハイブリダイゼーションを低減するために、核酸中のイソシトシン及びイソグアニンを利用し得る。

本開示の核酸において使用される非ネイティブ塩基は、ユニバーサル塩基対合活性を有し得、任意の他の天然由来の塩基と塩基対合することができる。ユニバーサル塩基対合活性を有する例示的な塩基としては、３－ニトロピロール及び５－ニトロインドールが挙げられる。使用され得る他の塩基としては、シトシン、アデニン、又はウラシルと塩基対合するイノシンなどの天然由来の塩基のサブセットとの塩基対合活性を有するものが挙げられる。

ポリヌクレオチドは、４つのヌクレオチド塩基：アデニン（Ａ）、シトシン（Ｃ）、グアニン（Ｇ）、チミン（Ｔ）、及びポリヌクレオチドがＲＮＡであるとき、チミンの代わりにウラシル（Ｕ）の特定の配列から構成される。したがって、ポリヌクレオチド配列という用語は、ポリヌクレオチド分子のアルファベット表現である。このアルファベット表現は、中央処理装置を有するコンピュータ内のデータベース内に入力され、機能ゲノミクス及び相同性検索などのバイオインフォマティクス用途に使用され得る。

「ライブラリ」という用語は、５’末端及び３’末端に、典型的に、付加されたアダプタ配列を含む、鋳型分子のコレクション又は複数の鋳型分子を指す。鋳型分子のコレクション又は複数の鋳型分子を指すための「ライブラリ」という用語の使用は、ライブラリを構成する鋳型が特定の供給源に由来すること、又は「ライブラリ」が特定の組成物を有することを暗示すると解釈されるべきではない。例として、「ライブラリ」という用語の使用は、ライブラリ内の個々の鋳型が異なるヌクレオチド配列のものでなければならないこと、又は鋳型が配列及び／若しくは供給源に関して関連していることを暗示すると解釈されるべきではない。

本明細書で使用される場合、「ロックド核酸」又は「ＬＮＡ」という用語は、修飾ＲＮＡヌクレオチドを指す。ＬＮＡヌクレオチドのリボース部分は、２’酸素及び４’炭素を接続する余分な架橋で修飾される。架橋は、リボースを３’－ｅｎｄｏ（Ｎｏｒｔｈ）立体構造に「ロック」する。本開示の方法においてＬＮＡを使用する利点のうちのいくつかとしては、二本鎖の熱安定性の増加、標的特異性の増加、並びにエキソ及びエンドヌクレアーゼからの耐性が挙げられる。

様々な実施形態では、本開示は、単一のタイプの鋳型分子の複数のコピーを含み、各々が、それらの５’末端及びそれらの３’末端に付加されたアダプタ配列を有する、いわゆる「単一鋳型」ライブラリと、個々の鋳型分子の全てではないが多くが異なる標的配列（以下に定義されるような）を含み、各鋳型分子がそれらの５’末端及びそれらの３’末端にアダプタ配列を付加している、「複合」ライブラリと、の形成を包含する。そのような複合鋳型ライブラリは、ランダムゲノムＤＮＡ断片、ｃＤＮＡなど（これらに限定されない）の標的ポリヌクレオチドの複合混合物から出発して、本開示の方法を使用して調製され得る。本開示はまた、いくつかの個々の「単一鋳型」ライブラリを一緒に混合することによって形成された「複合」ライブラリに及び、「単一鋳型」ライブラリの各々は、単一のタイプの標的分子（すなわち、モノ鋳型）から出発して、本開示の方法を使用して別々に調製されている。特定の実施形態では、複合ライブラリ中の個々のポリヌクレオチド鋳型の５０％超、又は６０％超、又は７０％超、又は８０％超、又は９０％超、又は９５％超が、異なる標的配列を含み得る。

本明細書で使用される場合、「複数」とは、分子の集団を指し、分析されることが所望される任意の数の分子を含み得る。

本明細書で使用される場合、「ペプチド核酸」又は「ＰＮＡ」は、ＤＮＡ又はＲＮＡに類似する人工的に合成されたポリマーを指し、骨格は、ペプチド結合によって結合された反復Ｎ－（２－アミノエチル）－グリシン単位から構成される。ＰＮＡの骨格は、天然由来の核酸の高度に荷電されたホスホジエステル骨格とは対照的に、中性条件下で実質的に非イオン性である。これは、２つの非限定的な利点を提供する。第一に、ＰＮＡ骨格は、改善されたハイブリダイゼーション動態を呈する。第二に、ＰＮＡは、ミスマッチ塩基対完全にマッチした塩基対の融解温度（Ｔｍ）のより大きい変化を有する。ＤＮＡ及びＲＮＡは、典型的には、内部ミスマッチに対してＴｍにおける２～４℃の低下を呈する。非イオン性ＰＮＡ骨格では、低下は、７～９℃に近い。これは、より良好な配列識別を提供し得る。同様に、それらの非イオン性の性質に起因して、これらの骨格に結合した塩基のハイブリダイゼーションは、塩濃度に対して比較的非感受性である。

「プライマ」は、概して、標的とハイブリダイズし、その後、標的に相補的なポリヌクレオチドの重合を促進することによって、関心対象の試料中に潜在的に存在する標的又は鋳型に結合する遊離３’－－ＯＨ基を有する短いポリヌクレオチドである。本開示のプライマは、１７～３０ヌクレオチドの範囲のヌクレオチドから構成される。一実施形態では、プライマは、少なくとも１７ヌクレオチド、又は代替的に少なくとも１８ヌクレオチド、又は代替的に少なくとも１９ヌクレオチド、又は代替的に少なくとも２０ヌクレオチド、又は代替的に少なくとも２１ヌクレオチド、又は代替的に少なくとも２２ヌクレオチド、又は代替的に少なくとも２３ヌクレオチド、又は代替的に少なくとも２４ヌクレオチド、又は代替的に少なくとも２５ヌクレオチド、又は代替的に少なくとも２６ヌクレオチド、又は代替的に少なくとも２７ヌクレオチド、又は代替的に少なくとも２８ヌクレオチド、又は代替的に少なくとも２９ヌクレオチド、又は代替的に少なくとも３０ヌクレオチド、又は代替的に少なくとも５０ヌクレオチド、又は代替的に少なくとも７５ヌクレオチド、又は代替的に少なくとも１００ヌクレオチドである。

本明細書で使用される場合、「単一細胞」は、１つの細胞を指す。本明細書に説明される方法において有用な単一細胞は、関心対象の組織から、又は生検、血液試料、若しくは細胞培養物から取得され得る。加えて、特定の器官、組織、腫瘍、新生物などからの細胞が取得され、本明細書に説明される方法で使用され得る。更に、一般に、細菌又は酵母を含む原核生物又は真核生物の単細胞生物の集団などの任意の集団由来の細胞が、本方法において使用され得る。いくつかの実施形態では、ｃＤＮＡライブラリを調製する方法は、単一細胞を取得する工程を含み得る。単一細胞懸濁液は、例えば、トリプシン又はパパインを酵素的に使用して、組織試料中の細胞を結合すること、又は培養中の接着細胞を放出すること、又は試料中の細胞を機械的に分離することを含む、当技術分野で公知の標準的な方法を使用して取得され得る。単一細胞は、単一細胞が個々に処理され得る任意の好適な反応容器中に配置され得る。例えば、各単一細胞が単一ウェルに配置されるような９６ウェルプレートである。

単一細胞を操作するための方法は、当技術分野で公知であり、蛍光活性化細胞選別（fluorescence activated cell sorting、ＦＡＣＳ）、顕微操作、及び半自動細胞ピッカー（例えば、ＳｔｏｅｌｔｉｎｇＣｏ．製のＱｕｉｘｅｌｌ（商標）細胞転送システム）の使用を含む。個々の細胞は、例えば、場所、形態、又はレポーター遺伝子発現などの顕微鏡観察によって検出可能な特徴に基づいて個々に選択され得る。

ライブラリ中の個々のポリヌクレオチド分子を指すための「鋳型」という用語の使用は、ライブラリ中のポリヌクレオチドの一方又は両方の鎖が、ポリメラーゼによって触媒される鋳型依存性核酸重合のための鋳型として作用することができることを単に示す。この用語の使用は、本開示の範囲を、その後の酵素触媒重合反応において鋳型として実際に使用されるポリヌクレオチドのライブラリに限定するものとして解釈されるべきではない。

「マッチしていない領域」という用語は、アダプタを形成する２つのポリヌクレオチド鎖の配列が、ＰＣＲ反応のための標準的なアニーリング条件下で、２つの鎖が互いにアニーリングすることができないような非相補性の度合いを呈する、アダプタの領域を指す。マッチしていない領域における２つの鎖は、２つの鎖がアニーリング条件下で一本鎖形態に逆転するという条件で、酵素触媒ライゲーション反応のための標準的な反応条件下で、ある程度のアニーリングを呈し得る。

プールされたｃＤＮＡ試料は、本明細書中に説明される方法で、エマルジョンＰＣＲ及び単一プライマＰＣＲを含むポリメラーゼ連鎖反応（ＰＣＲ）によって増幅され得る。例えば、ｃＤＮＡ試料は、単一プライマＰＣＲによって増幅され得る。ｃＤＮＡ合成プライマは、５’増幅プライマ配列（amplification primer sequence、ＡＰＳ）を含み得、これは、その後、ｃＤＮＡの第１鎖が、５’ＡＰＳに相補的であるプライマを使用するＰＣＲによって増幅されることを可能にする。鋳型スイッチオリゴヌクレオチドはまた、５’ＡＰＳを含み得、これは、ｃＤＮＡ合成プライマ中の５’ＡＰＳと少なくとも７０％同一、少なくとも８０％同一、少なくとも９０％同一、少なくとも９５％同一、又は７０％、８０％、９０％、若しくは１００％同一であり得る。これは、プールされたｃＤＮＡ試料が、単一プライマを使用するＰＣＲによって（すなわち、単一プライマＰＣＲによって）増幅され得ることを意味し、これは、短い混入アンプリコン及びプライマ二量体の増幅を低減するためにＰＣＲ抑制効果を利用する（Ｄａｉｅｔａｌ．，ＪＢｉｏｔｅｃｈｎｏｌ１２８（３）：４３５－４３（２００７））。各アンプリコンの２つの末端が相補的であるため、短いアンプリコンは、安定なヘアピンを形成することになり、これらは、ＰＣＲには不十分な鋳型である。これは、短縮型ｃＤＮＡの量を低減し、より長いｃＤＮＡ分子の収率を改善する。５’ＡＰＳは、ｃＤＮＡライブラリの下流処理を容易にするように設計され得る。例えば、ｃＤＮＡライブラリが特定の配列決定方法、例えば、ＬｉｆｅＴｅｃｈｎｏｌｏｇｙのＳＯＬｉＤ配列決定技術、又はＩｌｌｕｍｉｎａのＧｅｎｏｍｅＡｎａｌｙｚｅｒによって分析されることになる場合、５’ＡＰＳは、これらの配列決定方法において使用されるプライマと同一であるように設計され得る。例えば、５’ＡＰＳは、ＳＯＬｉＤＰ１プライマ、及び／又はｃＤＮＡ合成プライマに挿入されたＳＯＬｉＤＰ２配列と同一であり得、その結果、ＳＯＬｉＤ配列決定に必要とされるＰ１及びＰ２配列は、増幅されたライブラリに不可欠である。

プールされたｃＤＮＡを増幅するための別の例示的な方法は、ＰＣＲを含む。ＰＣＲは、複製コピーが、上流及び下流プライマからなるプライマの対又はプライマのセットと、ＤＮＡポリメラーゼなどの重合の触媒と、典型的には、熱安定性ポリメラーゼ酵素と、を使用して、標的ポリヌクレオチドから作製される反応である。ＰＣＲの方法は、当技術分野で周知であり、例えば、ＭａｃＰｈｅｒｓｏｎｅｔａｌ．（１９９１）ＰＣＲ１：ＡＰｒａｃｔｉｃａｌＡｐｐｒｏａｃｈ（ＩＲＬＰｒｅｓｓａｔＯｘｆｏｒｄＵｎｉｖｅｒｓｉｔｙＰｒｅｓｓ）に教示されている。ＰＣＲ又は遺伝子クローニングなどのポリヌクレオチドの複製コピーを生成する全てのプロセスは、本明細書で集合的に複製と称される。プライマはまた、サザンブロット分析又はノーザンブロット分析などの、ハイブリダイゼーション反応におけるプローブとして使用され得る。

エマルジョンＰＣＲのために、エマルジョンＰＣＲ反応は、「油中水」混合物を激しく振盪又は撹拌して、数百万のミクロンサイズの水性区画を生成することによって生じる。ＤＮＡライブラリは、限界希釈で、乳化前にビーズと混合されるか、又はエマルジョン混合物中に直接混合される。区画サイズとビーズ及び標的分子の限界希釈との組み合わせが、平均してただ１つのＤＮＡ分子及びビーズを含有する区画を生成するために使用される（最適希釈では、多くの区画がいかなる標的も含まないビーズを有することになる）。増幅効率を促進するために、上流（低濃度、ビーズ上のプライマ配列にマッチする）、及び下流ＰＣＲプライマ（高濃度）の両方が、反応混合物中に含められる。乳化工程中に生成された水性区画のサイズに応じて、１μｌ当たり最大３×１０^９個の個々のＰＣＲ反応が同じチューブ内で同時に実施され得る。本質的に、エマルジョン中の各小区画は、マイクロＰＣＲ反応器を形成する。エマルジョン中の区画の平均サイズは、乳化条件に応じて、直径がサブミクロンから１００ミクロンを超える範囲である。

「同一性」、「相同性」、又は「類似性」は、交換可能に使用され、２つの核酸分子間の配列類似性を指す。同一性は、比較の目的のためにアラインメントされ得る各配列における位置を比較することによって決定され得る。比較される配列中の位置が同じ塩基又はアミノ酸によって占められているとき、分子は、その位置で相同である。配列間の同一性の度合いは、配列によって共有されるマッチング又は同一の位置の数の関数である。非関連配列又は非相同配列は、本明細書に説明される配列のうちの１つと４０％未満の同一性、又は代替的に２５％未満の同一性を共有する。

別の配列に対して特定のパーセンテージ（例えば、６０％、６５％、７０％、７５％、８０％、８５％、９０％、９５％、９８％又は９９％）の「配列同一性」を有するポリヌクレオチドは、アラインメントされたとき、そのパーセンテージの塩基が、２つの配列を比較する際に、同じであることを意味する。このアラインメント及びパーセント配列同一性又は相同性は、当技術分野で公知のソフトウェアプログラム、例えば、Ａｕｓｕｂｅｌｅｔａｌ．，ＣｕｒｒｅｎｔＰｒｏｔｏｃｏｌｓｉｎＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ，ＪｏｈｎＷｉｌｅｙ＆Ｓｏｎｓ，ＮｅｗＹｏｒｋ，Ｎ．Ｙ．，（１９９３）に説明されるものを使用して決定され得る。好ましくは、デフォルトパラメータがアラインメントに使用される。１つのアラインメントプログラムは、デフォルトパラメータを使用するＢＬＡＳＴである。特に、プログラムは、以下のデフォルトパラメータを使用するＢＬＡＳＴＮ及びＢＬＡＳＴＰである：Ｇｅｎｅｔｉｃｃｏｄｅ＝ｓｔａｎｄａｒｄ、ｆｉｌｔｅｒ＝ｎｏｎｅ、ｓｔｒａｎｄ＝ｂｏｔｈ、ｃｕｔｏｆｆ＝６０、ｅｘｐｅｃｔ＝１０、Ｍａｔｒｉｘ＝ＢＬＯＳＵＭ６２、Ｄｅｓｃｒｉｐｔｉｏｎｓ＝５０ｓｅｑｕｅｎｃｅｓ、ｓｏｒｔｂｙ＝ＨＩＧＨＳＣＯＲＥ、Ｄａｔａｂａｓｅｓ＝ｎｏｎ－ｒｅｄｕｎｄａｎｔ、ＧｅｎＢａｎｋ＋ＥＭＢＬ＋ＤＤＢＪ＋ＰＤＢ＋ＧｅｎＢａｎｋＣＤＳｔｒａｎｓｌａｔｉｏｎｓ＋ＳｗｉｓｓＰｒｏｔｅｉｎＳＰｕｐｄａｔｅ＋ＰＩＲ。これらのプログラムの詳細は、ＮａｔｉｏｎａｌＣｅｎｔｅｒｆｏｒＢｉｏｔｅｃｈｎｏｌｏｇｙＩｎｆｏｒｍａｔｉｏｎにおいて見出すことができる。

パーセント配列同一性とも称され得る、ポリペプチドに対する配列相同性は、典型的には、配列分析ソフトウェアを使用して測定される。例えば、ｔｈｅＳｅｑｕｅｎｃｅＡｎａｌｙｓｉｓＳｏｆｔｗａｒｅＰａｃｋａｇｅｏｆｔｈｅＧｅｎｅｔｉｃｓＣｏｍｐｕｔｅｒＧｒｏｕｐ（ＧＣＧ），ＵｎｉｖｅｒｓｉｔｙｏｆＷｉｓｃｏｎｓｉｎＢｉｏｔｅｃｈｎｏｌｏｇｙＣｅｎｔｅｒ，９１０ＵｎｉｖｅｒｓｉｔｙＡｖｅｎｕｅ，Ｍａｄｉｓｏｎ，Ｗｉｓ．５３７０５を参照されたい。タンパク質分析ソフトウェアは、保存的アミノ酸置換を含む様々な置換、欠失、及び他の修飾に割り当てられた相同性の測定を使用して、類似の配列をマッチングさせる。例えば、ＧＣＧは、「Ｇａｐ」及び「Ｂｅｓｔｆｉｔ」などのプログラムを含有し、これらは、デフォルトパラメータとともに使用されて、異なる種の生物由来の相同ポリペプチドなどの、密接に関連するポリペプチド間、又は野生型タンパク質とその突然変異タンパク質との間の配列相同性又は配列同一性を決定し得る。例えば、ＧＣＧバージョン６．１を参照されたい。

分子配列を、異なる生物由来の多数の配列を含有するデータベースと比較するために使用される典型的なアルゴリズムは、コンピュータプログラムＢＬＡＳＴ（Ａｌｔｓｃｈｕｌ，１９９０、Ｇｉｓｈ，１９９３、Ｍａｄｄｅｎ，１９９６、Ａｌｔｓｃｈｕｌ，１９９７、Ｚｈａｎｇ，１９９７）、特にｂｌａｓｔｐ又はｔｂｌａｓｔｎ（Ａｌｔｓｃｈｕｌ，１９９７）である。ＢＬＡＳＴｐの典型的なパラメータは以下のとおりである：Ｅｘｐｅｃｔａｔｉｏｎｖａｌｕｅ：１０（デフォルト）、Ｆｉｌｔｅｒ：ｓｅｇ（デフォルト）、Ｃｏｓｔｔｏｏｐｅｎａｇａｐ：１１（デフォルト）、Ｃｏｓｔｔｏｅｘｔｅｎｄａｇａｐ：１（デフォルト）、Ｍａｘ．ａｌｉｇｎｍｅｎｔｓ：１００（デフォルト）、Ｗｏｒｄｓｉｚｅ：１１（デフォルト）、Ｎｏ．ｏｆｄｅｓｃｒｉｐｔｉｏｎｓ：１００（デフォルト）、ＰｅｎａｌｔｙＭａｔｒｉｘ：ＢＬＯＷＳＵＭ６２。

多数の異なる生物に由来する配列を含有するデータベースを検索するとき、アミノ酸配列を比較することが典型的である。アミノ酸配列を使用するデータベース検索は、当技術分野で公知のｂｌａｓｔｐ以外のアルゴリズムによって測定され得る。例えば、ポリペプチド配列は、ＧＣＧバージョン６．１のプログラムであるＦＡＳＴＡを使用して比較され得る。ＦＡＳＴＡは、クエリー配列と検索配列との間の最良の重複の領域のアラインメント及びパーセント配列同一性を提供する（Ｐｅａｒｓｏｎ，１９９０、参照によって本明細書に組み込まれる）。例えば、アミノ酸配列間のパーセント配列同一性は、参照により本明細書に組み込まれるＧＣＧバージョン６．１で提供されるように、ＦＡＳＴＡをそのデフォルトパラメータ（２のｗｏｒｄｓｉｚｅ及びＰＡＭ２５０ｓｃｏｒｉｎｇｍａｔｒｉｘ）を用いて使用して決定され得る。

本明細書で説明されるｃＤＮＡライブラリを調製する方法は、ｃＤＮＡライブラリを処理して、配列決定に好適なライブラリを取得することを更に含み得る。本明細書で使用される場合、ライブラリは、ｃＤＮＡライブラリの複雑性、サイズ、純度などが所望されるスクリーニング方法に好適であるとき、配列決定に好適である。特に、ｃＤＮＡライブラリは、ＬｉｆｅＴｅｃｈｎｏｌｏｇｙのＳＯＬｉＤ配列決定技術、ＯｘｆｏｒｄのＮａｎｏｐｏｒｅＤＮＡ配列決定技術、又はＩｌｌｕｍｉｎａのクラスタ生成及び配列決定技術などの、任意のハイスループットスクリーニング方法に好適な試料を作製するように処理され得る。したがって、ｃＤＮＡライブラリは、短い断片の５’末端ライブラリを取得するために、ｃＤＮＡライブラリ（例えば、ＤＮａｓｅを用いて）を断片化することによって処理され得る。アダプタは、ライブラリの配列決定を容易にするために、例えば、一方又は両方の末端でｃＤＮＡに付加され得る。ｃＤＮＡライブラリは、配列決定のために十分な量のｃＤＮＡを取得するために、例えば、ＰＣＲによって更に増幅され得る。

本開示の実施形態は、本明細書に説明される方法のいずれかによって生成されたｃＤＮＡライブラリを提供する。このｃＤＮＡライブラリは、単一細胞又は複数の単一細胞における遺伝子発現の分析を提供するために配列決定され得る。

本開示の実施形態はまた、複数の単一細胞における遺伝子発現を分析するための方法を提供し、方法は、本明細書に説明される方法を使用してｃＤＮＡライブラリを調製する工程と、ｃＤＮＡライブラリを配列決定する工程と、を含む。「遺伝子」は、転写及び翻訳された後に特定のポリペプチド又はタンパク質をコードすることができる少なくとも１つのオープンリーディングフレーム（open reading frame、ＯＲＦ）を含有するポリヌクレオチドを指す。本明細書に説明されるポリヌクレオチド配列のうちのいずれかは、それらと関連付けられる遺伝子のより大きい断片又は全長コード配列を識別するために使用され得る。より大きい断片配列を単離する方法は、当業者に公知である。

ｃＤＮＡライブラリは、任意の好適なスクリーニング方法によって配列決定され得る。特に、ｃＤＮＡライブラリは、ＬｉｆｅＴｅｃｈｎｏｌｏｇｙのＳＯＬｉＤ配列決定技術、ＯｘｆｏｒｄのＮａｎｏｐｏｒｅＤＮＡ配列決定技術、又はＩｌｌｕｍｉｎａのクラスタ生成及び配列決定技術などの、任意のハイスループットスクリーニング方法を使用して配列決定され得る。一実施形態では、ｃＤＮＡライブラリは、ショットガン配列決定され得る。リードの数は、少なくとも１０，０００、少なくとも１００万、少なくとも１０００万、少なくとも１億、又は少なくとも１０億であり得る。別の実施形態では、リードの数は、１０，０００～１００，０００、又は代替的に１００，０００～１００万、又は代替的に１００万～１０００万、又は代替的に１０００万～１億、又は代替的に１億～１０億であり得る。「リード」は、配列決定反応によって取得される連続的な核酸配列の長さである。

次世代シーケンシング（ＮＧＳ）ライブラリは、多くの場合、トランスクリプトームライブラリにおけるリボソームＲＮＡ配列、マイクロバイオーム若しくはメタゲノムライブラリにおける宿主配列、又は体細胞変異体検出用途におけるマジョリティ対立遺伝子配列などの、生物学的重要性がほとんどない豊富な配列を含有する。ＲＮＡ－ｓｅｑライブラリでは、例えば、リボソームＲＮＡ（ｒＲＮＡ）配列は、全リードの９５％以上を構成し得、ほとんどの用途では、これらのリードは、情報価値がなく、二次分析中に廃棄される。これらの配列によって占められるフローセルの「不動産」は、特に、関心対象の種を十分にサンプリングするためにより大きい配列決定深度が必要とされる、カウントベースの用途又は稀な断片の検出について、配列決定のコストを有意に増加させ得る。

全ての生物において、非常に豊富なリボソームの構造成分であるリボソームＲＮＡ（ｒＲＮＡ）は、全てのＲＮＡの大部分を構成する。これらのリボソームＲＮＡのＲＮＡ試料を選択的に枯渇させずに、結果的に得られるＮＧＳライブラリは、大部分がｒＲＮＡを表す断片から構成され、これは、エンドユーザにとってほとんど役に立たないか、又は科学的関心がほとんどないものである。したがって、ｒＲＮＡは、ライブラリ構築の前に試料から枯渇されなければならない。ｒＲＮＡのハイブリダイゼーションプルダウン（例えば、ＲｉｂｏＺｅｒｏ、ＲｉｂｏＭｉｎｕｓ）又は酵素消化（例えば、ＲＮａｓｅＨ、ＣＲＩＳＰＲ）などの、豊富な配列の枯渇のための現在の方法は、高品質、高入力試料に対して良好に機能するが、多くの場合、ホルマリン固定／パラフィン包埋（ＦＦＰＥ）組織及び血漿由来循環ＲＮＡ（Ｃ－ＲＮＡ）などの臨床的に関連する試料タイプにおいて遭遇する低品質、低含量の入力では不十分な性能を示す。代替的に、配列特異的濃縮アプローチ（例えば、エクソームキャプチャ）は、低入力試料に対してより良好な性能を示すが、標的のセットを予め指定する必要性によって制限される。これは、有用なバイオマーカであり得る稀な転写アイソフォーム及び非コードＲＮＡを検出するためのそれらの有用性を制限する。加えて、ｒＲＮＡを除去するためのこれらの処理は、化学的に不安定なＲＮＡから構成される試料に直接作用し、試料損傷のリスクを導入する。更に、ｒＲＮＡを低減するためのこれらの方法は、ＲＮＡ試料自体のみに適用可能であり、一旦、試料がライブラリに変換されると、ｒＲＮＡキャプチャ又は枯渇のために同じ方法が適用可能ではない。

望ましくないライブラリ断片の存在量を低減するための１つ以上のブロッキングオリゴヌクレオチドの使用が、本明細書に説明される。本開示の方法は、エンドユーザにとって極めて容易であり、追加のライブラリ調製工程及び１つ以上のオリゴヌクレオチドの付加を必要としない。本明細書に説明される方法は、試料に直接ではなく、作製されたライブラリに作用し、元のポリヌクレオチド試料への損傷のリスクを低減する。

本明細書に提示される研究に示されるように、本開示の方法は、ＲＮＡ－Ｓｅｑ技術についてｒＲＮＡを有意に低減した。本開示の方法が、望ましくないライブラリ断片が生成される他のライブラリ調製（例えば、ｄｓＤＮＡライブラリ）に適用されるとき、同様の結果が予想されることになる。他の潜在的な使用の例としては、グロビンＲＮＡ、ミトコンドリアＤＮＡ断片、ライブラリからのハウスキーピング遺伝子断片、非宿主遺伝物質の除去、及び宿主又は他の豊富な核酸の枯渇が、より焦点が絞られたデータリッチなＮＧＳライブラリの生成に望ましい他のシナリオが挙げられるが、これらに限定されない。

したがって、本開示の方法、組成物、及びキットは、ｇＤＮＡ又は他のＤＮＡ供給源から生成されたＤＮＡライブラリとともに使用され得る。そのような場合、ライブラリ生成は、アダプタ／鋳型構築物からＤＮＡ配列決定ライブラリを作製するためのＰＣＲ増幅工程を除いて、標準的な方法論を利用することになる。特に、本開示の１つ以上のブロッキングオリゴヌクレオチドは、ＤＮＡ配列決定ライブラリを作製するためのＰＣＲ増幅工程への成分として付加されることになる。

ここで、本明細書に開示される方法の様々な非限定的な特定の実施形態が、添付の図面を参照して更に詳細に説明されることになる。１つの特定の実施形態に関して好ましいものとして説明されている特徴は、別途記載されない限り、本開示の他の特定の実施形態に必要な変更を加えて適用される。

図１は、全ＲＮＡから配列決定のための鋳型ライブラリを生成するために従来的に使用されるプロセスを例示する。全ＲＮＡからのライブラリ調製は、Ｉｌｌｕｍｉｎａ（商標）、ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓ（商標）、及びＯｘｆｏｒｄＮａｎｏｐｏｒｅ（商標）からのものを含む、全ての主要な配列決定プラットフォームに共通である。

図１に示されるように、全ＲＮＡ試料は、本明細書に説明されるもののような方法論を使用して試料から単離される。全ＲＮＡは、典型的には、ｒＲＮＡ枯渇工程を実施することによってｒＲＮＡを除去するように処理される。ｒＲＮＡの枯渇のための現在の方法としては、ｒＲＮＡのハイブリダイゼーションプルダウン（例えば、ＲｉｂｏＺｅｒｏ（商標）、ＲｉｂｏＭｉｎｕｓ（商標））、又は酵素消化（例えば、ＲＮａｓｅＨ、ＣＲＩＳＰＲ）が挙げられる。上記のｒＲＮＡ枯渇方法は、非常に長く（１．５～２時間）、複数のサブコンポーネント及び工程を伴い得る。これらの枯渇方法は、高品質、高入力試料に対して良好に機能するが、多くの場合、ホルマリン固定／パラフィン包埋（ＦＦＰＥ）組織及び血漿由来循環ＲＮＡ（Ｃ－ＲＮＡ）などの臨床的に関連する試料タイプにおいて遭遇する低品質、低含量の入力では不十分な性能を示す。代替的に、配列特異的濃縮アプローチ（例えば、エクソームキャプチャ）は、低入力試料に対してより良好な性能を示すが、標的のセットを予め指定する必要性によって制限される。これは、有用なバイオマーカであり得る稀な転写アイソフォーム及び非コードＲＮＡを検出するためのそれらの有用性を制限する。更に、ｒＲＮＡ及び他の所望されないＲＮＡを除去するための枯渇方法は、ＲＮＡ試料自体に対して実施されなければならない。ＲＮＡは、不安定な核酸であり、取り扱い、保存条件、及びＲＮａｓｅ活性に感受性である。上記の方法を使用するｒＲＮＡ及び他の所望されないＲＮＡの不完全な枯渇は、一旦、ライブラリに変換されると、その後の工程において改善されることができないことが留意されるべきである。

全く対照的に、本開示は、１つ以上のブロッキングオリゴヌクレオチド（すなわち、ＰＣＲクランプ）を使用して、所望されないヌクレオチド配列を枯渇させるための新しい革新的な方法を提供する。ブロッキングオリゴヌクレオチドを設計するための考慮事項は、本明細書に更に説明される。

図１は、ＲＮＡからの配列決定のための鋳型ライブラリを生成するために標準的に使用されるＲＮＡ－Ｓｅｑプロセスを例示する。図１は、本開示の１つ以上のブロッキングオリゴヌクレオチドを組み込むように修飾されたＲＮＡ－Ｓｅｑプロセスを更に例示する。ＲＮＡ－Ｓｅｑ（「ＲＮＡ配列決定」の略語として命名される）は、次世代シーケンシング（ＮＧＳ）を使用して、所与の瞬間における生体試料中のＲＮＡの存在及び量を明らかにし、連続的に変化する細胞トランスクリプトームを分析する配列決定技術である。

具体的には、ＲＮＡ－Ｓｅｑは、選択的遺伝子スプライシングされた転写物、転写後修飾、遺伝子融合、突然変異／ＳＮＰ、及び経時的な遺伝子発現の変化、又は異なる群若しくは処理における遺伝子発現の差異を見る能力を促進する。ｍＲＮＡ転写物に加えて、ＲＮＡ－Ｓｅｑは、全ＲＮＡ、ｍｉＲＮＡ、ｔＲＮＡなどの小ＲＮＡ、及びリボソームプロファイリングを含むように、ＲＮＡの異なる集団を見ることができる。ＲＮＡ－Ｓｅｑはまた、エクソン／イントロン境界を決定し、既に注釈付きの５’及び３’遺伝子境界を検証又は修正するために使用され得る。ＲＮＡ－Ｓｅｑにおける最近の進歩は、単一細胞配列決定及び固定組織のインサイチュ配列決定を含む。

ＲＮＡ－Ｓｅｑの前に、ハイブリダイゼーションベースのマイクロアレイを用いて遺伝子発現研究が行われた。マイクロアレイに関する問題としては、クロスハイブリダイゼーションアーチファクト、低発現遺伝子及び高発現遺伝子の不十分な定量化、並びに先験的に配列を知る必要があることが挙げられる。これらの技術的問題のため、トランスクリプトミクスは、配列決定ベースの方法に移行した。これらは、発現配列タグタグライブラリのサンガーシーケンシングから、化学的タグベースの方法（例えば、例えば、遺伝子発現の連続分析）、最終的に現在の技術であるｃＤＮＡの次世代シーケンシング（特にＲＮＡ－Ｓｅｑ）へと進歩した。次世代シーケンシング（ＮＧＳ）は、典型的には、既知のアダプタＤＮＡ配列が、配列決定される標的ヌクレオチドに付加されるライブラリ調製を必要とする。従来的に、これは、ＲＮＡがｃＤＮＡに変換され、断片化され、末端修復され、次いで、アダプタＤＮＡにライゲーションされることを必要とする（例えば、図１を参照されたい）。このライブラリ調製は、Ｉｌｌｕｍｉｎａ（商標）、ＰａｃｉｆｉｃＢｉｏｓｃｉｅｎｃｅｓ（商標）、及びＯｘｆｏｒｄＮａｎｏｐｏｒｅ（商標）からのものを含む、全ての主要な配列決定プラットフォームに共通である。

図１に示されるように、ＲＮＡは、試料から単離される。特定の実施形態では、ＲＮＡは、細胞を溶解することによって、細胞から単離され得る。溶解は、例えば、細胞を加熱することによって、若しくは界面活性剤若しくは他の化学的方法の使用によって、又はそれらの組み合わせによって、達成され得る。しかしながら、当技術分野で公知の任意の好適な溶解方法を使用することができる。核クロマチンの放出を防止し、それによって、ｃＤＮＡライブラリのゲノム汚染を回避し、ｍＲＮＡの分解を最小限に抑えるために、穏やかな溶解手順が有利に使用され得る。例えば、Ｔｗｅｅｎ－２０の存在下で、７２℃で２分間細胞を加熱することは、結果的に核クロマチンからの検出可能なゲノム汚染をもたらさずに、細胞を溶解するのに十分である。代替的に、細胞は、水中で１０分間６５℃まで（Ｅｓｕｍｉｅｔａｌ．，ＮｅｕｒｏｓｃｉＲｅｓ６０（４）：４３９－５１（２００８））、若しくは０．５％ＮＰ－４０（Ｋｕｒｉｍｏｔｏｅｔａｌ．，ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ３４（５）：ｅ４２（２００６））で懸濁されたＰＣＲバッファーＩＩ（ＬｉｆｅＴｅｃｈｎｏｌｏｇｙ）中で９０秒間７０℃まで加熱され得るか、又は溶解は、プロテイナーゼＫなどのプロテアーゼを用いて、又はグアニジンイソチオシアネートなどのカオトロピック塩の使用によって達成され得る（米国特許出願公開第２００７／０２８１３１３号）。

ＤＮａｓｅは、典型的には、ＲＮＡ試料に付加される。ＤＮａｓｅは、ゲノムＤＮＡの量を低減する。ＲＮＡ分解の量がゲル及びキャピラリー電気泳動でチェックされ、ＲＮＡ完全性番号を試料に割り当てるために使用される。このＲＮＡ品質及び出発ＲＮＡの総量は、その後のライブラリ調製中、配列決定中、及び分析工程中に考慮される。ＲＮＡは、Ｑｉａｇｅｎ若しくはＡｍｂｉｏｎからのキット、ＬｕｃｉｇｅｎＭａｓｔｅｒＰｕｒｅＫｉｔｓなどの任意の数の市販のキットを使用して、又はＴＲＩｚｏｌのような特定のＲＮＡ単離試薬を使用して、良好な収率及び高品質で単離され得る。ＲＮＡ完全性番号は、８を超えるべきである。ＲＮＡは、Ｒｉｂｏ－ｇｒｅｅｎのような、蛍光分析ベースの方法を使用して定量化され得る。

図１に示されるように、次いで、ＲＮＡは、典型的には、ポリＡ選択によって濃縮されるか、又はｒＲＮＡ試料のＲＮＡを枯渇させるように処理される。ｒＲＮＡのハイブリダイゼーションプルダウン（例えば、ＲｉｂｏＺｅｒｏ、ＲｉｂｏＭｉｎｕｓ）又は酵素消化（例えば、ＲＮａｓｅＨ、ＣＲＩＳＰＲ）などの、豊富な配列の枯渇のための現在の方法は、高品質、高入力試料に対して良好に機能するが、多くの場合、ホルマリン固定／パラフィン包埋（ＦＦＰＥ）組織及び血漿由来循環ＲＮＡ（Ｃ－ＲＮＡ）などの臨床的に関連する試料タイプにおいて遭遇する低品質、低含量の入力では不十分な性能を示す。代替的に、配列特異的濃縮アプローチ（例えば、エクソームキャプチャ）は、低入力試料に対してより良好な性能を示すが、標的のセットを予め指定する必要性によって制限される。これは、有用なバイオマーカであり得る稀な転写アイソフォーム及び非コードＲＮＡを検出するためのそれらの有用性を制限する。典型的には、ｒＲＮＡのＲＮＡ試料を枯渇させるのに１～２時間かかる。

ＲＮＡ試料を所望される鋳型で濃縮するためにＲＮＡが処理された後、ＲＮＡは、ｃＤＮＡに逆転写される。任意選択的に、ＲＮＡは、ｃＤＮＡへの変換の前に断片化及びサイズ選択され得る。断片化及びサイズ選択は、配列決定機械に適切な長さである配列を精製するために実施される。ＲＮＡ、ｃＤＮＡ、又はその両方は、酵素、超音波処理、又はネブライザーで断片化される。ＲＮＡの断片化は、ランダムにプライムされた逆転写の５’バイアス及びプライマ結合部位の影響を低減し、５’及び３’末端がｃＤＮＡにあまり効率的に変換されないという欠点を有する。断片化の後にサイズ選択が続き、小さい配列が除去されるか、又は狭い範囲の配列長が選択される。ｍｉＲＮＡのような小ＲＮＡが失われるため、これらは、独立して分析される。

図１に示されるように、処理されたＲＮＡは、ｃＤＮＡに変換される。ｃＤＮＡは、典型的には、逆転写によってｍＲＮＡから合成される。単一細胞を含む少量のｍＲＮＡからｃＤＮＡを合成するための方法は、既に説明されている（Ｋｕｒｉｍｏｔｏｅｔａｌ．，ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ３４（５）：ｅ４２（２００６）：Ｋｕｒｉｍｏｔｏｅｔａｌ．，ＮａｔＰｒｏｔｏｃ２（３）：７３９－５２（２００７）、及びＥｓｕｍｉｅｔａｌ．，ＮｅｕｒｏｓｃｉＲｅｓ６０（４）：４３９－５１（２００８））。増幅可能なｃＤＮＡを生成するために、これらの方法は、ｃＤＮＡライブラリが単一のプライマを使用して増幅され得るような方式で、各ｃＤＮＡ分子の両末端にプライマアニーリング配列を導入する。Ｋｕｒｉｍｏｔｏ法は、ポリメラーゼを使用して３’ポリＡテールをｃＤＮＡ鎖に付加し、次いで、これが、ユニバーサルオリゴ－Ｔプライマを使用して増幅され得る。対照的に、Ｅｓｕｍｉ法は、ｃＤＮＡ合成プライマの３’テールに逆相補的であるように設計されている、任意の配列をｃＤＮＡの３’末端に導入するために鋳型スイッチング法を使用する。再び、ｃＤＮＡライブラリは、単一のＰＣＲプライマによって増幅され得る。単一プライマＰＣＲは、短い混入アンプリコン及びプライマ二量体の増幅を低減するためにＰＣＲ抑制効果を利用する（Ｄａｉｅｔａｌ．，ＪＢｉｏｔｅｃｈｎｏｌ１２８（３）：４３５－４３（２００７））。各アンプリコンの２つの末端が相補的であるため、短いアンプリコンは、安定なヘアピンを形成することになり、これらは、ＰＣＲには不十分な鋳型である。これは、短縮型ｃＤＮＡの量を低減し、より長いｃＤＮＡ分子の収率を改善する。

特定の実施形態では、ｃＤＮＡの第１鎖の合成は、ＲＮＡ相補配列（ＲＣＳ）を含むｃＤＮＡ合成プライマ（ＣＤＳ）によって導かれ得る。別の実施形態では、ＲＣＳは、個々のｍＲＮＡ試料中の１つ以上のｍＲＮＡに少なくとも部分的に相補的である。これは、典型的にはオリゴヌクレオチドであるプライマが、個々のｍＲＮＡ試料中の少なくともいくつかのｍＲＮＡにハイブリダイズして、ｍＲＮＡを鋳型として使用してｃＤＮＡ合成を導くことを可能にする。ＲＣＳは、オリゴ（ｄＴ）を含むか、又は全ての若しくは大部分の関連遺伝子内に存在する核酸の配列などの遺伝子ファミリー特異的であるか、あるいはランダムヘキサマーなどのランダム配列から構成され得る。ｃＤＮＡ合成プライマがそれ自体をプライミングし、したがって、所望されない副産物を生成することを回避するために、非自己相補的準ランダム配列が使用され得る。例えば、遺伝子コードの１文字が排除され得るか、又はｃＤＮＡ合成プライマを非自己相補的であるように制約しながら、より複雑な設計が使用され得る。

ＲＣＳはまた、ｃＤＮＡの第１鎖の一部分に少なくとも部分的に相補的であり得、それにより、ｃＤＮＡの第１鎖を鋳型として使用してｃＤＮＡの第２鎖の合成を導くことができる。したがって、第１鎖合成に続いて、ＲＮａｓｅ酵素（例えば、ＲＮａｓｅＨ活性を有する酵素）が、ｃＤＮＡの第１鎖の合成後に付加されて、ＲＮＡ鎖を分解し、ｃＤＮＡ合成プライマが、第１鎖上で再びアニーリングして、ｃＤＮＡの第２鎖の合成を導くことを可能にし得る。例えば、ＲＣＳは、ランダムヘキサマー、又は非自己相補的準ランダム配列（ｃＤＮＡ合成プライマの自己アニーリングを最小化する）を含み得る。

ｃＤＮＡの第１鎖の３’末端の一部分に少なくとも部分的に相補的である部分を含む鋳型スイッチオリゴヌクレオチド（template switch oligonucleotide、ＴＳＯ）は、本明細書に説明される方法で各個々のＲＮＡ試料に付加され得る。そのような鋳型スイッチング法は、（Ｅｓｕｍｉｅｔａｌ．，ＮｅｕｒｏｓｃｉＲｅｓ６０（４）：４３９－５１（２００８））に説明され、ＲＮＡの完全な５’末端を含む完全長ｃＤＮＡが合成されることを可能にする。逆転写酵素の末端トランスフェラーゼ活性は、典型的には、ｍＲＮＡから合成されたｃＤＮＡの第１鎖の３’末端に２～５個のシトシンを組み込ませているため、ｃＤＮＡの第１鎖は、その３’末端に、グアノシンと塩基対合する複数のシトシン又はシトシン類似体を含み得る（米国特許第５，９６２，２７２号を参照されたい）。一実施形態では、ｃＤＮＡの第１鎖は、グアノシンと塩基対合する、少なくとも２つ、少なくとも３つ、少なくとも４つ、少なくとも５つ、又は２つ、３つ、４つ、若しくは５つのシトシン又はシトシン類似体を含む３’部分を含み得る。グアノシンと塩基対合するシトシン類似体の非限定的な例は、５－アミノアリル－２’－デオキシシチジンである。

一実施形態では、鋳型スイッチオリゴヌクレオチドは、シトシンと塩基対合する複数のグアノシン又はグアノシン類似体を含む３’部分を含み得る。本明細書に説明される方法で有用なグアノシン又はグアノシン類似体の非限定的な例としては、デオキシリボグアノシン、リボグアノシン、ロックド核酸－グアノシン、及びペプチド核酸－グアノシンが挙げられるが、これらに限定されない。グアノシンは、リボヌクレオシド又はロックド核酸モノマーであり得る。

特定の実施形態では、鋳型スイッチオリゴヌクレオチドは、シトシンと塩基対合する、少なくとも２つ、少なくとも３つ、少なくとも４つ、少なくとも５つ、あるいは２つ、３つ、４つ、若しくは５つ、又は２～５つのグアノシン又はグアノシン類似体を含む３’部分を含み得る。複数のグアノシン（又はシトシンと塩基対合するグアノシン類似体）の存在は、鋳型スイッチオリゴヌクレオチドが、ｃＤＮＡの第１鎖の３’末端の露出したシトシンに一過的にアニーリングすることを可能にする。これは、逆転写酵素に、鋳型をスイッチさせ、鋳型スイッチオリゴヌクレオチドに相補的な鎖を合成することを続けさせる。一実施形態では、鋳型スイッチオリゴヌクレオチドの３’末端は、例えば、３’リン酸基によってブロックされて、鋳型スイッチオリゴヌクレオチドがｃＤＮＡ合成中にプライマとして機能することを防止し得る。

別の実施形態では、ＲＮＡは、細胞溶解によって細胞から放出される。溶解が加熱によって部分的に達成される場合、ｃＤＮＡ合成プライマ及び／又は鋳型スイッチオリゴヌクレオチドは、細胞溶解中に各個々のＲＮＡ試料に付加され得、これは、オリゴヌクレオチドのハイブリダイゼーションを支援することになるためである。いくつかの実施形態では、逆転写酵素が、細胞溶解後に付加されて、酵素の変性を回避し得る。

本開示のいくつかの実施形態では、タグは、ｃＤＮＡの合成中にｃＤＮＡに組み込まれ得る。例えば、ｃＤＮＡ合成プライマ及び／又は鋳型スイッチオリゴヌクレオチドは、長さが少なくとも４、少なくとも５、少なくとも６、少なくとも７、少なくとも８、少なくとも９、少なくとも１０、少なくとも１５、又は少なくとも２０ヌクレオチドであり得る特定のヌクレオチド配列などのタグを含み得る。例えば、タグは、４～２０ヌクレオチドの長さ、例えば、４、５、６、７、８、９、１０、１５、又は２０ヌクレオチドの長さのヌクレオチド配列であり得る。タグは、ｃＤＮＡ合成プライマ及び／又は鋳型スイッチオリゴヌクレオチド中に存在するため、その合成中にｃＤＮＡに組み込まれることになり、したがって、ｃＤＮＡを識別するための「バーコード」として作用し得る。ｃＤＮＡ合成プライマ及び鋳型スイッチオリゴヌクレオチドの両方は、タグを含み得る。ｃＤＮＡ合成プライマ及び鋳型スイッチオリゴヌクレオチドは、各々、タグ付きｃＤＮＡ試料がタグの組み合わせを含むように、異なるタグを含み得る。上記の方法によって生成された各ｃＤＮＡ試料は、別個のタグ又はタグの別個の組み合わせを有し得、それにより、一旦タグ付きｃＤＮＡ試料がプールされると、タグは、どの単一細胞が各ｃＤＮＡ試料に由来するかを識別するために使用され得る。したがって、各ｃＤＮＡ試料は、タグ付きｃＤＮＡ試料が本明細書で説明される方法でプールされた後でも、単一細胞に結合され得る。

タグ付きｃＤＮＡ試料がプールされる前に、例えば、逆転写酵素を除去又は不活性化することによって、ｃＤＮＡの合成が停止され得る。これは、逆転写によるｃＤＮＡ合成がプールされた試料中で継続することを防止する。タグ付きｃＤＮＡ試料は、任意選択的に、それらがプールされる前又は後のいずれかで、増幅の前に精製され得る。

ＲＮＡがｃＤＮＡへの変換前に断片化されなかった場合、ｃＤＮＡが断片化され、サイズ選択が実施される。ｃＤＮＡは、酵素、音波処理、又はネブライザーで断片化され得る。断片化の後にサイズ選択が続き、小さい配列が除去されるか、又は狭い範囲の配列長が選択される。

ｃＤＮＡ反応後、次いで、末端修復反応が、Ｔ４ポリヌクレオチドキナーゼ、ｒＡＴＰ、及びＴ４ＤＮＡポリメラーゼ、ｄＮＴＰを用いて実施されて、平滑末端二本鎖鋳型を形成する。末端修復完了及びサイズ選択の後、Ａ－テーリング反応が、Ｋｌｅｎｏｗｅｘｏ－、ｄＮＴＰ（例えば、ｄＡＴＰ）を用いて実施されて（図１参照）、アダプタのライゲーションを容易にする。アダプタは、従来の自動化オリゴヌクレオチド合成によって調製された２つの一本鎖オリゴヌクレオチドをアニーリングすることによって形成される。オリゴヌクレオチドは、第１のオリゴヌクレオチドの３’末端が第２のオリゴヌクレオチドの５’末端に相補的であるように部分的に相補的である。第１のオリゴヌクレオチドの５’末端及び第２のオリゴヌクレオチドの３’末端は、互いに相補的ではない。２つの鎖がアニーリングされるとき、結果的に得られる構造は、一方の末端（二本鎖領域）で二本鎖であり、他方の末端（マッチしていない領域）で一本鎖であり、本明細書では「Ｙ字アダプタ」と称される。Ｙ字アダプタの二本鎖領域は、平滑末端であり得るか、又はオーバーハングを有し得る。後者の場合、オーバーハングは、３’オーバーハング又は５’オーバーハングであり得、単一のヌクレオチド又は２つ以上のヌクレオチドを含み得る。Ｙ字アダプタは、その５’末端でリン酸化され、二本鎖部分は、「Ｔ」デオキシヌクレオチドを含む単一塩基３’オーバーハングを含有する。次いで、アダプタを、Ｔ４リガーゼ、ｒＡＴＰを使用して、「Ａ」ヌクレオチドの５’側に単一塩基を含む二本鎖鋳型分子の末端にライゲーションされる。

Ｙ型アダプタは、その５’末端でリン酸化され、二重鎖の二本鎖部分は、「Ｔ」デオキシヌクレオチドを含む単一塩基３’オーバーハングを含有する（図１参照）。次いで、アダプタを、Ｔ４リガーゼ、ｒＡＴＰを使用して、「Ａ」ヌクレオチドの５’側に単一塩基を含む二本鎖鋳型分子の末端にライゲーションされる。

ライブラリは、一般に、アダプタポリヌクレオチド分子を１つ以上の標的ポリヌクレオチド二重鎖（既知の、部分的に既知の、又は不明な配列であり得る）の５’及び３’末端にライゲーションして、アダプタ－標的構築物を形成し、次いで、ＰＣＲ増幅を実行して、鋳型ポリヌクレオチドのライブラリを形成することによって形成される。次いで、鋳型ポリヌクレオチドのライブラリは、次世代シーケンシングを使用して配列決定され得る。資源を節約するために、複数のライブラリが一緒にプールされ、同じ実行で配列決定され得、これは、多重化として知られるプロセスである。アダプタライゲーション中、固有のインデックス配列、又は「バーコード」が各ライブラリに付加される。これらのバーコードは、データ分析中にライブラリを区別するために使用される。

本開示の非相同末端結合因子及び方法を使用して二本鎖鋳型上に付加されたアダプタは、典型的には、相補的配列の二本鎖領域及び配列ミスマッチの一本鎖領域を含む。特定の実施形態では、アダプタは、Ｙ字を有し、配列ミスマッチの領域がアダプタのアームを互いに分離させる。アダプタの「二本鎖領域」は、２つの部分的に相補的なポリヌクレオチド鎖のアニーリングによって形成される、典型的には５つ以上の連続する塩基対を含む短い二本鎖領域である。この用語は、単に、２つの鎖がアニーリングされている核酸の二本鎖領域を指し、いかなる特定の構造的配座も暗示しない。代替的な実施形態では、アダプタは、Ｙ字構造を有する代わりに、Ｕ字であり、それにより、一旦、非相同末端結合因子を使用してアダプタが鋳型の末端に付加されると、本開示の方法は、鋳型の５’末端及び３’末端で連続ループを形成する。したがって、結果的に得られたＤＮＡライブラリ鋳型は、ローリングサークル増幅を使用して増幅され得る。

概して、二本鎖領域は、機能を損なうことなく可能な限り短いことが有利である。この文脈における「機能」とは、二本鎖領域が、本明細書に説明される原核生物末端結合因子及び修復因子についての反応条件下で安定な二重鎖を形成し、それにより、アダプタを形成する２つの鎖は、標的分子へのアダプタのライゲーション中に部分的にアニーリングされたままであることを意味する。二本鎖領域が、ＰＣＲ反応のアニーリング工程において典型的に使用される条件下で安定であることは絶対的に必要ではない。

別の実施形態では、同一のアダプタが各鋳型分子の両端に付加され、各アダプタ－標的構築物中の標的配列は、アダプタの二本鎖領域に由来する相補的配列に隣接することになる。二本鎖領域、したがって、アダプタ－標的構築物中の二本鎖領域に由来する相補的配列が長いほど、アダプタ－標的構築物が、ＰＣＲにおいて使用されるアニーリング条件下で内部自己相補性のこれらの領域で、折り返され、それ自体と塩基対合することができる可能性が高くなる。一般的に、この効果を低減するために、二本鎖領域が２０以下、１５以下、又は１０以下の塩基対の長さであることが好ましい。二本鎖領域の安定性は増加し得、したがって、標準的なワトソン－クリック塩基対よりも強い塩基対合を示す非天然ヌクレオチドを含めることによって、潜在的にその長さが低減する。

好ましい実施形態では、アダプタの２つの鎖は、二本鎖領域で１００％相補的である。しかしながら、２つの鎖が標準的なライゲーション条件下で安定な二重鎖を形成することができることを条件に、１つ以上のヌクレオチドミスマッチが二本鎖領域内で許容され得ることが理解されるであろう。

代替的に、本開示の非相同末端結合因子及び方法を使用して二本鎖鋳型上に付加されたアダプタは、二本鎖相補的配列を含む。次いで、結果的に得られたアダプタ／鋳型分子は、ＰＣＲによって増幅されて、ＤＮＡライブラリ鋳型を形成し得る。更なる実施形態では、スプリントオリゴヌクレオチドが、ＤＮＡライブラリ鋳型の末端を結合して環を形成するために使用され得る。エキソヌクレアーゼが、全ての残存する直鎖状一本鎖及び二本鎖ＤＮＡ産物を除去するために付加される。結果物は、完成した環状ＤＮＡ鋳型である。

本明細書に開示される方法における使用のためのアダプタは、概して、アダプタの「ライゲーション可能な」末端、すなわち、リガーゼ又は非相同末端結合因子を使用して標的ポリヌクレオチドに結合される末端に隣接する二本鎖領域を含むことになる。アダプタのライゲーション可能な末端は、平滑であり得るか、又は他の実施形態では、１つ以上のヌクレオチドの短い５’又は３’オーバーハングが、ライゲーションを容易にする／促進するために存在し得る。アダプタのライゲーション可能な末端における５’末端ヌクレオチドは、標的ポリヌクレオチド上の３’ヒドロキシル基へのホスホジエステル結合を可能にするためにリン酸化されるべきである。

二本鎖領域を形成する２つの鎖の部分は、典型的には、各鎖上に少なくとも１０個、又は少なくとも１５個、又は少なくとも２０個の連続したヌクレオチドを含む。マッチしていない領域の長さの下限は、典型的には、機能、例えば、ＰＣＲ及び／又は配列決定のためのプライマの結合に好適な配列を提供する必要性によって決定されることになる。理論的には、マッチしていない領域の長さに上限はないが、例えば、１つ以上のライゲーション工程後の非結合アダプタのアダプタ－標的構築物からの分離を容易にするために、一般にアダプタの全長を最小化することが有利である場合を除く。したがって、マッチしていない領域は、各鎖上で５０未満、又は４０未満、又は３０未満、又は２５未満の連続したヌクレオチドの長さであることが好ましい。

アダプタを形成する２つの鎖の全長は、典型的には、２５～１００ヌクレオチド、より典型的には、３０～５５ヌクレオチドの範囲となる。

マッチしていない領域を形成する２つの鎖の部分は、好ましくは、同様の長さであるべきであるが、これは、各部分の長さがその所望される機能（例えば、プライマ結合）を果たすのに十分であることを条件に、絶対的に必須ではない。マッチしていない領域を形成する２つの鎖の部分は、アダプタ機能に過度に影響を与えることなく、最大２５ヌクレオチドまで異なり得ることが実験によって示されている。

特定の実施形態では、マッチしていない領域を形成する２つのポリヌクレオチド鎖の部分は、完全にミスマッチとなるか、又は１００％非相補的となる。しかしながら、いくつかの配列「マッチ」、すなわち、より低い度合いの非相補性は、実質的な程度まで機能に影響することなく、この領域において許容され得る。上述のように、配列ミスマッチ又は非相補性の程度は、マッチしていない領域内の２つの鎖が、上記で定義されたアニーリング条件下で一本鎖形態のままであるような程度である。

アダプタの正確なヌクレオチド配列は、一般に、本開示に対して重要ではなく、所望される配列要素が最終的にアダプタに由来する鋳型のライブラリの共通配列に含まれるようにユーザによって選択され、例えば、ユニバーサル伸長プライマ及び／又は配列決定プライマ（例えば、Ｐ７又はＰ５プライマ）の特定のセットの結合部位を提供し得る。追加の配列要素が、例えば、ライブラリ中の鋳型分子の配列決定において最終的に使用されることになる配列決定プライマ、又は、例えば、固体支持体上における鋳型ライブラリの増幅に由来する産物のための結合部位を提供するために含められ得る。アダプタは、「バーコード」配列を更に含み得、これは、特定の供給源に由来する鋳型分子をバーコード化するために使用され得る。

アダプタの正確なヌクレオチド配列は、一般に、本開示に対して非限定的であるが、マッチしていない領域における個々の鎖の配列は、いずれの個々の鎖も、標準的なアニーリング条件下で自己アニーリング、ヘアピン構造の形成などにつながり得るいかなる内部自己相補性も呈さないようなものであるべきである。マッチしていない領域における鎖の自己アニーリングは、この鎖への増幅プライマの特異的結合を防止又は低減し得るため、回避されるべきである。

ミスマッチアダプタは、好ましくは、ＤＮＡの２つの鎖から形成されるが、ホスホジエステル及び非ホスホジエステル骨格結合の混合物によって結合された天然及び非天然ヌクレオチド（例えば、１つ以上のリボヌクレオチド）の混合物を含み得る。以下で更に詳細に考察されるように、例えば、ビオチン部分、ブロッキング基、及び固体表面への付着のためのキャプチャ部分などの、他の非ヌクレオチド修飾が含められ得る。

アダプタがライゲーションされる１つ以上の「標的ポリヌクレオチド二重鎖」は、固相ＰＣＲによる増幅、次世代シーケンシング、サブクローニングなどを含む、追加の方法論とともに使用され得る任意のポリヌクレオチド分子であり得る。標的ポリヌクレオチド二重鎖は、二本鎖ＤＮＡ形態（例えば、ゲノムＤＮＡ断片）で生じ得るか、又はＤＮＡ若しくはＲＮＡとして一本鎖形態で生じ、ライゲーション前にｄｓＤＮＡ形態に変換されている場合がある。例として、ｍＲＮＡ分子は、当技術分野で既知の標準的な方法論を使用して本開示の方法で使用するのに好適な二本鎖ｃＤＮＡにコピーされ得る。標的分子の精密な配列は、一般に、本開示に重要ではなく、既知又は不明であり得る。修飾がアダプタへの付加、ＤＮＡ分子へのアダプタのタグ付け、及び／又はＰＣＲによるコピーを妨げないことを条件に、非天然ヌクレオチド及び／又は非天然骨格結合を含む修飾ＤＮＡ分子が、標的として役立ち得る。

本明細書で使用される場合、「タグ付け（tagmentation）」、「タグ付け（tagment）」、又は「タグ付け（tagmenting）」という用語は、核酸、例えば、ＤＮＡを、核酸が５’及び３’アダプタ分子を含むように修飾されるように、アダプタ修飾鋳型に変換することを指す。このプロセスは、トランスポゾン末端配列を含むアダプタと複合体を形成したトランスポザーゼ酵素を含むトランスポゾン複合体による核酸の修飾を伴うことが多い。タグ付けにより、核酸の断片化と、二本鎖断片の両方の鎖の５’末端へのアダプタのライゲーションを同時にもたらす。トランスポザーゼ酵素を除去するための精製工程に続いて、ＰＣＲによって適合された断片の末端に追加の配列が付加され得る。

「トランスポザーゼ（transposase）」は、トランスポゾン末端含有組成物（例えば、トランスポゾン、トランスポゾン末端、トランスポゾン末端組成物）を備えた機能複合体を形成し、例えば、インビトロ転位反応で、それがインキュベートされる二本鎖標的核酸へのトランスポゾン末端含有組成物の挿入又は転位を触媒することができる酵素を意味する。本明細書に提示されるトランスポザーゼはまた、レトロトランスポゾン及びレトロウイルスからのインテグラーゼを含み得る。トランスポザーゼ、トランスポソーム及びトランスポソーム複合体は、参照によりその内容全体が本明細書に組み込まれる米国特許出願公開第２０１０／０１２００９８号の開示によって例示されるように、当業者に一般に知られる。本明細書に記載の多くの実施形態は、Ｔｎ５トランスポザーゼ及び／又は過活性Ｔｎ５トランスポザーゼに言及するが、意図された目的で標的核酸に５’タグを付けて断片化するのに十分な効率でトランスポゾン末端を挿入し得る任意の転位システムを本発明で使用し得ることが理解される。特定の実施形態では、好ましい転位システムは、トランスポゾン末端をランダムに又はほぼランダムな方法で挿入し、標的核酸に５’タグを付けて断片化することができる。

本明細書で使用される場合、「転位反応（transposition reaction）」という用語は、１つ以上のトランスポゾンが、例えば、ランダム部位又はほぼランダム部位で標的核酸に挿入される反応を指す。転位反応の必須成分は、転送したトランスポゾン配列及びその相補体（転送されないトランスポゾン末端配列）、並びに官能的転位又はトランスポゾン複合体を形成するために必要な他の成分を含む、トランスポゾンのヌクレオチド配列を示すトランスポザーゼ及びＤＮＡオリゴヌクレオチドである。ＤＮＡオリゴヌクレオチドは、必要とされる際、又は所望される際、追加の配列（例えば、アダプタ又はプライマ配列）を更に含み得る。いくつかの実施形態では、本明細書で提供される方法は、過活性Ｔｎ５トランスポザーゼ及びＴｎ５型トランスポゾン末端（ＧｏｒｙｓｈｉｎａｎｄＲｅｚｎｉｋｏｆｆ，１９９８，Ｊ．Ｂｉｏｌ．Ｃｈｅｍ．，２７３：７３６７）により、又はＲ１及びＲ２末端配列を含むＭｕＡトランスポザーゼ及びＭｕトランスポゾン末端（Ｍｉｚｕｕｃｈｉ，１９８３，Ｃｅｌｌ，３５：７８５；Ｓａｖｉｌａｈｔｉｅｔａｌ．，１９９５，ＥＭＢＯＪ．，１４：４８９３）によって形成される転位複合体を使用することによって例示される。しかし、意図された目的で標的ＤＮＡに５’－タグを付け及び断片化するのに十分な効率でランダム又はほぼランダムな方法でトランスポゾン末端を挿入し得る任意の転位システムを本発明で使用し得る。本発明の方法に使用することができ得る当技術分野で知られる転位システムの例としては、黄色ブドウ球菌Ｔｎ５５２（（Ｃｏｌｅｇｉｏｅｔａｌ．，２００１，ＪＢａｃｔｅｒｉｄ．，１８３：２３８４－８、Ｋｉｒｂｙｅｔａｌ．，２００２，ＭｏＩＭｉｃｒｏｂｉｏｌ，４３：１７３－８６）、ＴｙＩ（ＤｅｖｉｎｅａｎｄＢｏｅｋｅ，１９９４，ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．，２２：３７６５－７２及び国際特許出願第９５／２３８７５号）、トランスポゾンＴｎ７（Ｃｒａｉｇ，１９９６，Ｓｃｉｅｎｃｅ．２７１：１５１２、Ｃｒａｉｇ，１９９６，Ｒｅｖｉｅｗｉｎ：ＣｕｒｒＴｏｐＭｉｃｒｏｂｉｏｌＩｍｍｕｎｏｌ，２０４：２７－４８）、ＴｎＩＯ及びＩＳｌＯ（Ｋｌｅｃｋｎｅｒｅｔａｌ．，１９９６，ＣｕｒｒＴｏｐＭｉｃｒｏｂｉｏｌＩｍｍｕｎｏｌ，２０４：４９－８２）、マリナートランスポザーゼ（Ｌａｍｐｅｅｔａｌ．，１９９６，ＥＭＢＯＪ．，１５：５４７０－９）、Ｔｃｉ（Ｐｌａｓｔｅｒｋ，１９９６，ＣｕｒｒＴｏｐＭｉｃｒｏｂｉｏｌＩｍｍｕｎｏｌ，２０４：１２５－４３）、Ｐ要素（Ｇｌｏｏｒ，２００４，ＭｅｔｈｏｄｓＭｏＩＢｉｏｌ，２６０：９７－１１４）、ＴｎＪ（ＩｃｈｉｋａｗａａｎｄＯｈｔｓｕｂｏ，１９９０，ＪＢｉｏｌＣｈｅｍ．２６５：１８８２９－３２）、細菌の挿入配列（ＯｈｔｓｕｂｏａｎｄＳｅｋｉｎｅ，１９９６，Ｃｕｒｒ．Ｔｏｐ．Ｍｉｃｒｏｂｉｏｌ．Ｉｍｍｕｎｏｌ．２０４：１－２６）、レトロウイルス（Ｂｒｏｗｎｅｔａｌ．，１９８９，ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ，８６：２５２５－９）、及び酵母のレトロトランスポゾン（ＢｏｅｋｅａｎｄＣｏｒｃｅｓ，１９８９，ＡｎｎｕＲｅｖＭｉｃｒｏｂｉｏｌ．４３：４０３－３４）が挙げられるが、これらに限定されない。トランスポゾン末端を標的配列に挿入するための方法は、好適なインビトロ転位システムが利用可能であるか、又は当技術分野の知識に基づいて開発し得る任意の好適なトランスポゾンシステムを使用してインビトロで実施することができる。一般に、本明細書で提供される方法で使用するための好適なインビトロ転位システムは、少なくとも、十分な純度、十分な濃度、及び十分なインビトロ転位活性のトランスポザーゼ酵素、並びにトランスポザーゼが、転位反応を触媒し得るそれぞれのトランスポザーゼと機能複合体を形成するトランスポザーゼ末端を必要とする。本発明で使用され得る好適なトランスポザーゼトランスポゾン末端配列は、トランスポザーゼの野生型、誘導体又は突然変異体から選択されるトランスポザーゼと複合体を形成する野生型、誘導体又は突然変異体型トランスポゾン末端配列を含むが、それらに限定されない。

本明細書で使用される場合、「トランスポソーム複合体（transposome complex）」という用語は、二本鎖核酸に非共有結合するトランスポザーゼ酵素を指す。例えば、複合体は、非共有結合複合体形成をサポートする条件下で二本鎖トランスポゾンＤＮＡとプレインキュベートされたトランスポザーゼ酵素であり得る。二本鎖トランスポゾンＤＮＡは、Ｔｎ５ＤＮＡ、Ｔｎ５ＤＮＡの一部、トランスポゾン末端組成物、トランスポゾン末端組成物の混合物、又は過活性Ｔｎ５トランスポザーゼなどのトランスポザーゼと相互作用することができる他の二本鎖ＤＮＡを含み得るが、それらに限定されない。

「トランスポゾン末端（transposon end）」（ＴＥ）という用語は、二本鎖核酸、例えば、インビトロ転位反応で機能するトランスポザーゼ又はインテグラーゼ酵素との複合体を形成するために必要なヌクレオチド配列（「トランスポゾン末端配列」）のみを示す二本鎖ＤＮＡを指す。いくつかの実施形態では、トランスポゾン末端は、転位反応においてトランスポザーゼと機能複合体を形成することができる。非限定的な例として、参照によりその全体が本明細書に組み込まれる米国特許出願公開第２０１０／０１２００９８号の開示に記載されるように、トランスポゾン末端は、１９－ｂｐの外側末端（outer end、「ＯＥ」）トランスポゾン末端、内末端（inner end、「ＩＥ」）トランスポゾン末端、又は野生型若しくは突然変異体型Ｔｎ５トランスポザーゼによって認識される「モザイク末端」（mosaic end、「ＭＥ」）トランスポゾン末端、又はＲ１及びＲ２トランスポゾン末端を含み得る。トランスポゾン末端は、インビトロ転位反応においてトランスポザーゼ又はインテグラーゼ酵素と機能複合体を形成するために好適な任意の核酸又は核酸類似体を含み得る。例えば、トランスポゾン末端は、ＤＮＡ、ＲＮＡ、修飾された塩基、非天然の塩基、修飾された骨格を含み得、一本鎖又は二本鎖にニックを含み得る。「ＤＮＡ」という用語は、トランスポゾン末端組成物に関連して本開示では時々使用されるが、任意の好適な核酸又は核酸類似体がトランスポゾン末端において利用され得ることが理解されるべきである。

各標的ポリヌクレオチドの５’及び３’末端へのアダプタの「ライゲーション」は、共有結合が２つの二本鎖分子の両方の鎖の間に形成されるように、アダプタの２つのポリヌクレオチド鎖を二本鎖標的ポリヌクレオチドに結合することを伴う。この文脈では、「結合」は、以前に共有結合していない２つのポリヌクレオチド鎖の共有結合を意味する。好ましくは、そのような「結合」は、２つのポリヌクレオチド鎖間のホスホジエステル連結の形成によって起こることになるが、他の共有結合手段（例えば、非ホスホジエステル骨格結合）が使用され得る。しかしながら、ライゲーション反応で形成される共有結合は、ポリメラーゼのリードスルーを可能にするはずであり、それにより、結果物である構築物は、アダプタ分子に由来するアダプタ－標的構築物の領域中の配列に結合するプライマを使用して、ＰＣＲ反応でコピーされ得る。

ライゲーション反応は、典型的には、酵素触媒されることになる。特定の実施形態では、ライゲーション反応は、リガーゼ又は非相同末端結合因子によって触媒されることになる。非酵素的ライゲーション技術（例えば、化学的ライゲーション）もまた、非酵素的ライゲーションが、ポリメラーゼのリードスルーを可能にする共有結合の形成につながることを条件に、結果物である構築物がＰＣＲによってコピーされ得るように、使用され得る。

ライゲーション反応の所望される産物は、アダプタ－標的構築物であり、アダプタは、各標的ポリヌクレオチドの両末端でライゲーションされ、アダプタ－標的－アダプタという構造が与えられる。したがって、ライゲーション反応の条件は、一方の末端のみにアダプタを有する標的に優先して、この産物の形成を最大化するように最適化されるべきである。

アダプタ－標的構築物が更に処理される前に、非結合アダプタ分子を除去するために、タグ付け反応又はライゲーション反応の産物が精製工程に供され得る。過剰な非結合アダプタを除去するために、任意の好適な技術が使用され得、その好ましい例が、以下に更に詳細に説明される。

次いで、アダプタ－標的構築物は、以下に更に詳細に説明されるように、ＰＣＲによって増幅される。そのような更なるＰＣＲ増幅の産物は、鋳型のライブラリを形成するために収集され得る。特定の実施形態では、ＰＣＲ増幅のために使用されるプライマは、アダプタのマッチしていない領域における反対の鎖上の異なるプライマ結合配列にアニーリングすることになる。しかしながら、他の実施形態は、アダプタの二本鎖領域中のプライマ結合配列にアニーリングする単の一タイプの増幅プライマの使用に基づき得る。

図１に示されるように、鋳型ライブラリを形成するために所望されない配列を枯渇させるための新規かつ改善された方法は、アダプタ構築物ＰＣＲ増幅反応における１つ以上のブロッキングオリゴヌクレオチドの包含を提供する。したがって、標準的なＲＮＡ－Ｓｅｑプロトコルとは異なり、ｃＤＮＡへの変換の前に、ＲＮＡ試料を処理して、ｒＲＮＡ転写物のＲＮＡ試料を枯渇させる必要も、ｍＲＮＡのためのＲＮＡ試料を濃縮する必要もない。望ましくない断片を低減するために本開示の１つ以上のブロッキングオリゴヌクレオチドを使用することの単純さは、試薬及び工程の数を低減させることが単純かつ堅牢なワークフローにとって最重要である自動化ライブラリ調製システムにおいて有利である。本開示の１つ以上のブロッキングオリゴヌクレオチドの使用は、ライブラリ構築後の望ましくない断片の枯渇を促進し、不安定なＲＮＡを用いたハンズオン時間の低減を可能にする。加えて、ＰＣＲクランプの使用は、生物学的に多量のｒＲＮＡ、グロビン転写物、又は他の所望されない転写物を有することが知られている、より困難な試料に対する従来のｒＲＮＡ枯渇アプローチと組み合わされ得る。

溶液中又は固体支持体上でＰＣＲによって増幅されるアダプタ－標的構築物は、特に増幅産物が最終的に配列決定されることになる場合、ライブラリ内の全ての鋳型分子に共通であるにもかかわらず、それらの５’及び３’末端に「異なる」配列の領域を含むことが一般的に有利である。例えば、ライブラリ中の各鋳型の一方の末端のみの共通の固有の配列の存在は、配列決定プライマの結合部位を提供し得、ライブラリの増幅形態における各鋳型の一方の鎖が、単一のタイプの配列決定プライマを使用して単一の配列決定反応で配列決定されることを可能にする。

ＰＣＲ反応のアニーリング工程中に遭遇する条件は、一般的に当業者に既知であるが、精密なアニーリング条件は、反応ごとに変化することになる（Ｓａｍｂｒｏｏｋｅｔａｌ．，２００１，ＭｏｌｅｃｕｌａｒＣｌｏｎｉｎｇ，ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ，３ｒｄＥｄ，ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＬａｂｏｒａｔｏｒｙＰｒｅｓｓ，ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＬａｂｏｒａｔｏｒｙＰｒｅｓｓ，ＮＹ；ＣｕｒｒｅｎｔＰｒｏｔｏｃｏｌｓ，ｅｄｓＡｕｓｕｂｅｌｅｔａｌ．）。典型的には、そのような条件は、標準的なＰＣＲ反応緩衝液中で約１分間、約４０℃～７２℃（好ましくは５０～６８℃）の範囲の温度への曝露（約１分間の約９４℃の温度における変性工程の後）を含み得るが、これらに限定されない。

アダプタ－標的構築物の相補的コピーを形成するためのＰＣＲ増幅の包含は、いくつかの理由で有利である。第一に、プライマ伸長工程、及びその後のＰＣＲ増幅の包含は、特に本開示の方法の場合、所望されない転写物がＰＣＲ反応で増幅されないため、両末端にライゲーションされたアダプタを有するアダプタ－標的構築物を選択するための濃縮工程として作用する。両方の末端でライゲーションされたアダプタを有する標的構築物のみが、アダプタ中のプライマ結合配列に特異的な共通又はユニバーサルプライマを使用するＰＣＲのための有効な鋳型を提供し、したがって、ＰＣＲ増幅の前に二重ライゲーション標的のみを含む鋳型ライブラリを生成することが有利である。

第二に、ＰＣＲ増幅の包含は、配列決定の前に、標的の５’及び３’末端における共通配列の長さが増加することを可能にする。上記で概説されたように、ライゲーション及びその後の非結合アダプタの除去の効率を最大化するために、アダプタ分子の長さを可能な限り短く保つことが一般に有利である。しかしながら、配列決定の目的のために、増幅されるべき鋳型の５’及び３’末端に、より長い配列共通又は「ユニバーサル」配列を有することが有利であり得る。ＰＣＲ増幅の包含は、鋳型ライブラリ内のポリヌクレオチドの一方（又は両方）の末端における共通配列の長さが、ＰＣＲ増幅のために使用されるプライマの５’末端における追加の配列の包含によってライゲーション後に増加され得ることを意味する。

本明細書に開示される方法に従って調製された鋳型ライブラリは、核酸分析の任意の方法、例えば、鋳型又はその増幅産物の配列決定において使用され得る。鋳型ライブラリの例示的な使用としては、全ゲノム増幅、配列決定、サブクローニング、及びＰＣＲ増幅のための鋳型（単一鋳型又は複合鋳型ライブラリのいずれかの）を提供することが挙げられるが、これらに限定されない。

全ゲノム又は実質的に全ゲノムを表すゲノムＤＮＡ断片の複合混合物から本開示の方法に従って調製された鋳型ライブラリは、いわゆる「全ゲノム」増幅のための好適な鋳型を提供する。「全ゲノム増幅」という用語は、増幅される鋳型が、全体（又は実質的に全ゲノム）を代表する核酸断片の複合混合物を含む、核酸増幅反応（例えば、ＰＣＲ）を指す。

本明細書に説明される方法に従って調製された鋳型のライブラリは、固相核酸増幅のために使用され得る。本明細書で使用される「固相増幅」という用語は、形成時に増幅産物の全て又は一部分が固体支持体上に固定化されるように、固体支持体上又は固体支持体と会合して実施される任意の核酸増幅反応を指す。具体的には、この用語は、順方向及び逆方向増幅プライマの一方又は両方が固体支持体上に固定化されていることを除いて、標準的な溶液相ＰＣＲに類似した反応である固相ポリメラーゼ連鎖反応（固相ＰＣＲ）を包含する。

「固相」増幅法では、一方の増幅プライマが固定化され得る（他方のプライマは、通常、遊離溶液中に存在する）。代替的に、順方向及び逆方向プライマの両方が固定化され得る。実際には、ＰＣＲプロセスは増幅を維持するために過剰なプライマを必要とするため、「複数」の同一の順方向プライマ及び／又は固体支持体上に固定化された「複数」の同一の逆方向プライマが存在するであろう。本明細書における順方向及び逆方向プライマへの言及は、文脈上別段の指示がある場合を除き、「複数の」かかるプライマを包含するものとして解釈されるべきである。

１つのタイプのプライマのみを用いて固相増幅を行うことができ、そのような単一プライマ法は、本開示の範囲内に包含される。他の実施形態は、同一の鋳型特異的配列を含有するが、いくつかの他の構造的特徴において異なる順方向及び逆方向プライマを使用し得る。例えば、一方のタイプのプライマは、他方には存在しない非ヌクレオチド修飾を含み得る。他の実施形態では、順方向プライマ及び逆方向プライマは、異なる配列の鋳型特異的部分を含有し得る。

固相ＰＣＲ用の増幅プライマは、好ましくは、プライマの５’末端又はその付近で固体支持体への共有結合によって固定され、プライマの鋳型特異的部分をその同族鋳型へのアニーリングのために自由にし、３’ヒドロキシル基をプライマ伸長のために自由にする。当技術分野において既知の任意の好適な共有付着手段が、この目的のために使用され得る。選択された結合化学は、固体支持体の性質、及びそれに適用される任意の誘導体化又は官能化に依存する。プライマ自体は、付着を促進するために非ヌクレオチド化学修飾であり得る部分を含み得る。

固相ＰＣＲ増幅によって核酸コロニーのクラスタ化アレイを調製するために、本明細書中に開示される方法に従って調製された鋳型のライブラリを使用することが好ましい。「クラスタ」及び「コロニー」という用語は、本明細書において交換可能に使用され、複数の同一の固定化された核酸鎖及び複数の同一の固定化された相補的核酸鎖から構成される、固体支持体上の別個の部位を指す。「クラスタ化アレイ」という用語は、そのようなクラスタ又はコロニーから形成されるアレイを指す。この文脈では、「アレイ」という用語は、クラスタの順序付けられた配置を必要とするものとして理解されるべきではない。

特定の実施形態では、本開示は、ＰＣＲ増幅によって生成された増幅核酸を配列決定する方法を更に提供する。したがって、本開示は、上記のようなＰＣＲを使用して核酸鋳型のライブラリを増幅することと、核酸配列決定反応を実行して、ＰＣＲによって生成された少なくとも１つの増幅核酸鎖の全体又は一部の配列を決定することと、を含む、核酸配列決定の方法を提供する。

配列決定は、任意の好適な「合成による配列決定」技術を使用して実行することができ、ヌクレオチドは、遊離３’ヒドロキシル基に連続的に添加され、５’から３’方向でのポリヌクレオチド鎖の合成をもたらす。付加されたヌクレオチドの性質は、好ましくは、各ヌクレオチド付加後に決定される。

配列決定反応の開始点は、全ゲノムの産物への配列決定プライマのアニーリング又は固相増幅反応によって提供され得る。これに関連して、鋳型ライブラリの形成中に付加されるアダプタのうちの一方又は両方は、全ゲノム又は鋳型ライブラリの固相増幅によって誘導される増幅産物への配列決定プライマのアニーリングを可能にするヌクレオチド配列を含み得る。

順方向及び逆方向増幅プライマの両方が固体表面上に共有結合で固定化される固相増幅反応の産物は、固定化されたポリヌクレオチド鎖及び固定化された相補的鎖の対のアニーリングによって形成されたいわゆる「架橋」構造であり、両方の鎖は、５’末端で固体支持体（例えば、フローセル）に付着している。固定化鎖のうちの１つへの従来の配列決定プライマのハイブリダイゼーションは、ハイブリダイゼーションのための標準的な条件下におけるその固定化された相補的鎖へのこの鎖のアニーリングと比較して好ましくないため、そのような架橋構造から構成されるアレイは、核酸配列決定のための非効率的な鋳型を提供する。

核酸配列決定により好適な鋳型を提供するために、「架橋」構造の固定化鎖の１つの実質的に全部又は少なくとも一部を除去して、少なくとも部分的に一本鎖である鋳型を生成することが好ましい。したがって、一本鎖である鋳型の部分は、配列決定プライマへのハイブリダイゼーションに利用可能である。「架橋」二本鎖核酸構造中の１つの固定化鎖の全部又は一部を除去するプロセスは、本明細書では「線形化」と称され得る。

架橋鋳型構造は、制限エンドヌクレアーゼによる一方若しくは両方の鎖の切断によって、又はニッキングエンドヌクレアーゼによる一方の鎖の切断によって線形化され得る。開裂の他の方法は、制限酵素又はニッキング酵素に対する代替として使用され得、とりわけ、化学的開裂（例えば、過ヨウ素酸を用いたジオール結合の開裂）、エンドヌクレアーゼを用いた開裂による、又は熱若しくはアルカリに曝露することによる、脱塩基部位の開裂、別様に、デオキシリボヌクレオチド、光化学的開裂、又はペプチドリンカーの開裂で構成された増幅産物に組み込まれるリボヌクレオチドの開裂を含む。

固相増幅反応が共有結合で固定化された一方のプライマ及び遊離溶液中の他方のみを用いて実施される場合、線形化工程は、必須でない場合があることが理解されるであろう。

配列決定に好適な線形化された鋳型を生成するために、完全に又は部分的に一本鎖である、配列決定のための線形化された鋳型を残すために、増幅によって形成された架橋構造中の相補的鎖の「等しくない」量を除去することが必要である。最も好ましくは、架橋構造の一方の鎖が実質的に又は完全に除去される。

切断工程に続いて、切断のために使用される方法にかかわらず、切断反応の産物は、固体支持体に付着していない切断された鎖の部分を除去するために、変性条件に供され得る。好適な変性条件は、標準的な分子生物学プロトコル（Ｓａｍｂｒｏｏｋｅｔａｌ．，２００１，ＭｏｌｅｃｕｌａｒＣｌｏｎｉｎｇ，ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ，３ｒｄＥｄ，ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＬａｂｏｒａｔｏｒｙＰｒｅｓｓ，ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＬａｂｏｒａｔｏｒｙＰｒｅｓｓ，ＮＹ；ＣｕｒｒｅｎｔＰｒｏｔｏｃｏｌｓ，ｅｄｓＡｕｓｕｂｅｌｅｔａｌ．）を参照すると、熟練した読者には明らかであろう。

変性（及びその後の切断された鎖の再アニーリング）は、部分的又は実質的に一本鎖である配列決定鋳型の生成をもたらす。次に、配列決定反応は、鋳型の一本鎖部分への配列決定プライマのハイブリダイゼーションによって開始され得る。

したがって、核酸配列決定反応は、線形化された増幅産物の一本鎖領域に配列決定プライマをハイブリダイズし、１つ以上のヌクレオチドを、配列決定される増幅された鋳型鎖の領域に相補的なポリヌクレオチド鎖に連続的に組み込み、組み込まれたヌクレオチドのうちの１つ以上に存在する塩基を識別し、それによって鋳型鎖の領域の配列を決定することを含み得る。

本開示によって使用され得る１つの好ましい配列決定法は、連鎖停止剤として作用し得る修飾されたヌクレオチドの使用に依存する。修飾されたヌクレオチドが、配列決定されている鋳型の領域に相補的な成長ポリヌクレオチド鎖に組み込まれると、更なる配列伸長を誘導するために利用可能な遊離３’－ＯＨ基が存在せず、したがって、ポリメラーゼは、更なるヌクレオチドを付加することができない。成長鎖に組み込まれた塩基の性質が決定されると、３’ブロックを除去して、次の連続したヌクレオチドの添加を可能にし得る。これらの修飾ヌクレオチドを使用して誘導される生成物を配列させることにより、ＤＮＡ鋳型のＤＮＡ配列を推定することが可能である。修飾ヌクレオチドの各々が、各組み込み工程で添加された塩基間の識別を容易にするために、特定の塩基に対応することが知られている異なる標識を結合している場合、そのような反応は、単一の実験で行うことができる。代替的に、別個の反応が実行され得、修飾されたヌクレオチドの各々を別々に含有する。

修飾されたヌクレオチドは、それらの検出を容易にするために標識を担持し得る。好ましくは、これは、蛍光標識である。各ヌクレオチドのタイプは、異なる蛍光標識を担持し得る。しかしながら、検出可能な標識は、蛍光標識である必要はない。組み込まれたヌクレオチドの検出を可能にする任意の標識を使用することができる。

蛍光標識されたヌクレオチドを検出するための１つの方法は、標識されたヌクレオチドに特異的な波長のレーザー光を使用すること、又は他の好適な照明源の使用を含む。ヌクレオチド上の標識からの蛍光は、ＣＣＤカメラ又は他の好適な検出手段によって検出され得る。

本開示は、ポリヌクレオチド鎖へのヌクレオチドの連続的な組み込みに依存する本質的に任意の配列決定方法論が使用され得るため、上記で概説された配列決定法の使用に限定されない。好適な代替的な技術としては、例えば、Ｐｙｒｏｓｅｑｕｅｎｃｉｎｇ（商標）、ＦＩＳＳＥＱ（fluorescent in situ sequencing、蛍光インサイチュ配列決定）、ＭＰＳＳ（massively parallel signature sequencing、大規模並行署名配列決定）、及びライゲーションベースの方法による配列決定が挙げられる。

本開示の方法を使用して配列決定される標的ポリヌクレオチドは、配列決定することが所望される任意のポリヌクレオチドであり得る。本明細書で詳細に説明される鋳型ライブラリ調製方法を使用することは、既知、未知、又は部分的に既知の配列の本質的に任意の二本鎖又は一本鎖標的ポリヌクレオチドから始まる鋳型ライブラリを調製することが可能である。固相増幅によって調製されたクラスタ化されたアレイの使用により、同じ又は異なる配列の複数の標的を並行して配列決定することが可能である。

ここで、本開示の方法の様々な非限定的な特定の実施形態が、添付の図面を参照して更に詳細に説明されることになる。本開示の１つの特定の実施形態に関して好ましいものとして説明されている特徴は、別途記載されない限り、本開示の他の特定の実施形態に必要な変更を加えて適用される。

図１は、上記に詳細に説明されるように、ＲＮＡ試料からの配列決定ライブラリの生成のためのＲＮＡ－Ｓｅｑ技術を提供する。従来のＲＮＡワークフローとは異なり、望ましくないｒＲＮＡ断片に特異的な１つ以上のブロッキングオリゴヌクレオチドの付加によって可能にされるワークフローは、オンマーケット技術の場合のように、ｃＤＮＡへのＲＮＡの変換前にｒＲＮＡの長い１～２時間の枯渇を必要としない。これは、より速いワークフロー時間を可能にし、いくつかの実装では、様々な試薬の低減された必要性に起因して、より容易な自動化を可能にする。

図２は、本開示の例示的な方法の例示及び概要を提供する。示されるように、ＰＣＲクランプは、標的化された所望されないライブラリ断片の増幅を選択的にブロックする（図２Ａ参照）。ＰＣＲの初期熱変性工程におけるライブラリの変性に続いて、増幅プライマがライブラリ断片の末端に結合する。望ましくない断片に相補的であるように設計されたＰＣＲクランプはまた、選択ライブラリ断片にハイブリダイズする（図２Ｂ参照）。熱安定性ポリメラーゼは、プライマを伸長させ、所望されるライブラリ断片をコピーし得る。しかしながら、ＰＣＲにおいて使用される典型的な熱安定性ポリメラーゼは、５’－３’エキソヌクレアーゼ及び鎖置換活性を欠くため、ＰＣＲクランプは、所望されない断片のコピーを効果的にブロックする（図２Ｃ参照）。数サイクルのＰＣＲの後、所望されるライブラリ断片は、指数関数的に増幅されているが、所望されない断片の増幅は、抑制されている。結果は、所望されないライブラリ断片の低減された提示を有する最終的に増幅されたライブラリである（図２Ｄ参照）。本開示の方法は、ＫａｐａＨｉＦｉポリメラーゼの５’→３’エキソヌクレアーゼ活性及び鎖置換の欠失に起因して、ＫａｐａＨｉＦｉポリメラーゼを用いて良好に機能することが見出された。

図３は、鋳型ライブラリから所望されない転写物を枯渇させるためのブロッキングオリゴヌクレオチドのプールの様々な設計（すなわち、ＰＣＲクランプ）を提供する。Ｄｅｓｉｇｎ１は、逆平行及び隣接ＰＣＲクランプのプールを提供する。Ｄｅｓｉｇｎ１＋２は、Ｄｅｓｉｇｎ１のＰＣＲクランプの同じプールを提供するが、逆相補的ＰＣＲクランプがプールに付加されている。Ｄｅｓｉｇｎ３は、逆平行重複ＰＣＲクランプを提供する。

図４は、Ｄｅｓｉｇｎ１のＰＣＲクランプのプール及びＤｅｓｉｇｎ１＿２のＰＣＲクランプのプールが、非枯渇ＲＮＡを使用するＲＮＡ－ｓｅｑプロトコルにおいて、ｒＲＮＡ転写物のパーセンテージを８０％から３０％に低減したことを示す。追加のワークアップ工程は、必要なかった。

図５は、Ｄｅｓｉｇｎ１のＰＣＲクランプのプール及びＤｅｓｉｇｎ１＿２のＰＣＲクランプのプールが、ＲＰＯ枯渇ＲＮＡ試料を使用したＲＮＡ－ｓｅｑプロトコルにおいて、ｒＲＮＡ転写物のパーセンテージを２０％から１％に更に低減したことを示す（左パネル）。ＲＰＯ枯渇ＲＮＡ試料は、関心対象のライブラリ断片で濃縮されるが、いくらかの望ましくないリボソームｒＲＮＡが依然として観察される（２０％）。（ＲＰＯ＝ＲＮＡＰａｎ－ＣａｎｃｅｒＯｌｉｇｏｓ（すなわち、Ｉｌｌｕｍｉｎａ（商標）ＴｒｕＳｉｇｈｔＲＮＡＰａｎ－Ｃａｎｃｅｒ製品からのオリゴ）。更に、Ｄｅｓｉｇｎ１のＰＣＲクランプのプール及びＤｅｓｉｇｎ１＿２のＰＣＲクランプのプールは、非枯渇ＲＮＡ試料中のｒＲＮＡ転写物を、ＲＰＯ枯渇ＲＮＡ試料と同等のレベルまで枯渇させることができた（右パネル）。Ｄｅｓｉｇｎ３（ＤｅｓｉｇｎＯｆｆＳｅｔ）は、ｒＲＮＡ転写物の試料を枯渇させることができなかった。ＰＣＲクランプは、ｒＲＮＡアーチファクトの二次構造を形成するために互いにプライミングオフしていたと仮定される。

図６は、Ｄｅｓｉｇｎ１のＰＣＲクランプのプール及びＤｅｓｉｇｎ１＿２のＰＣＲクランプのプールが、ｍＲＮＡ選択試料を使用するＲＮＡ－ｓｅｑプロトコルにおいて、ｒＲＮＡ転写物のパーセンテージを１．５％から０．２５％に更に低減したことを示す。

図８は、Ｄｅｓｉｇｎ１のＰＣＲクランプ又はＤｅｓｉｇｎ１＿２のＰＣＲクランプによって枯渇された試料が、他の枯渇方法と同等であった＞０．９５の値を呈する１００万マッピングリード当たりの転写物１キロベースの断片数（ＦＰＫＭ）によるように、高レベルの遺伝子発現を呈したことを示す。

図９は、ブロッキングオリゴヌクレオチドを使用してｒＲＮＡの枯渇された試料対非枯渇試料において、ｒＲＮＡ転写物が大幅に低減されたことを示すトレースを提供する。

図１０は、本開示の例示的なブロッキングオリゴヌクレオチドを提示する。ブロッキングオリゴヌクレオチドは、標的断片の内部（すなわち、重複しないプライマ結合部位）領域とハイブリダイズするように設計される。ＰＣＲで使用されるほとんどのＤＮＡポリメラーゼが有意な鎖置換活性を欠くため、十分に強く結合したブロッキングオリゴヌクレオチドの存在は、ポリメラーゼの進行を物理的に妨げ、かつ全長アンプリコンの合成を防止するはずである。ブロッキングヌクレオチドについての考慮事項としては、以下が挙げられるが、これらに限定されない。
（１）ＰＣＲ反応における伸長工程の温度よりも高い融解温度（Ｔｍ）を有すること。これは、ブロッキングオリゴヌクレオチドがＰＣＲ伸長工程を通して結合したままであることを確保する。
（２）ブロッキングオリゴヌクレオチドは、ポリメラーゼ伸長を防止するために、その３’末端に３’－ブロックを含み得る。この３’－ブロックは、ブロッキングオリゴヌクレオチドがプライマとして作用し、望ましくないＰＣＲ副産物を生成することを防止する。これを達成するために、３’スペーサ修飾（例えば、Ｃ３）、３’反転塩基、３’リン酸化、３’ジデオキシ塩基、又は３’非相補的オーバーハング塩基を含む、いくつかの方法が使用され得る。
（３）プルーフリーディングＤＮＡポリメラーゼ（すなわち、強力な３’－＞５’エキソヌクレアーゼ活性を有するポリメラーゼ）がＰＣＲ反応に使用される場合、ブロッキングオリゴが、分解を防止するために３’末端でエキソヌクレアーゼ活性に対して耐性であるべきである。これは、ブロッキングオリゴヌクレオチドの３’末端に１つ以上のホスホロチオエート結合を含むブロッキングオリゴヌクレオチドによって達成され得る。
（４）強力な５’－＞３’エキソヌクレアーゼ活性を有するポリメラーゼ（例えば、ＴａｑＤＮＡポリメラーゼ）が使用される場合、ブロッキングオリゴは、その５’末端におけるエキソヌクレアーゼ分解に耐性であるべきである。これは、ブロッキングオリゴヌクレオチドの５’末端に１つ以上のホスホロチオエート結合を含むブロッキングオリゴヌクレオチドによって達成され得る。

Ｔｍについての配列依存性に起因して、考慮事項（１）を達成するために必要とされるオリゴの長さは、特にＡＴリッチ配列について、非常に長くなり得る。ロックド核酸（ＬＮＡ）塩基又はペプチド核酸（ＰＮＡ）結合などの、追加のオリゴ修飾が、この状況において、ブロッキングオリゴヌクレオチドの長さ又は配列を変化させることなくブロッキングオリゴヌクレオチドのＴｍを上昇させるために使用され得る。

図１１～図１２は、ＲＮＡ－ｓｅｑライブラリからリボソーム配列を枯渇させるためのブロッキングオリゴヌクレオチドの使用を実証する。ブロッキングオリゴのプールは、５つの主要なｒＲＮＡ配列（１８Ｓ、２８Ｓ、５Ｓ、ミトコンドリア１２Ｓ、及びミトコンドリア１６Ｓ）の各々からの潜在的なライブラリ断片の大部分が、１つ以上のブロッキングオリゴヌクレオチドによって標的化されるように設計され得る。次いで、ブロッキングオリゴのプールは、ライブラリ調製のＰＣＲ増幅工程中に試料に付加され得、結果として、最終ライブラリ中のｒＲＮＡアンプリコンの特異的枯渇を生じる。

上記で概説された一般的なブロッキングオリゴヌクレオチドの考慮事項に加えて、ｒＲＮＡブロッキングオリゴヌクレオチドプール設計のために、いくつかの追加のパラメータが考慮される必要がある。
（１）ブロッキングオリゴヌクレオチドの長さは、標的Ｔｍを維持しながら可能な限り最小化されるべきである。これは、最大数の可能なｒＲＮＡライブラリ断片が、ブロッキングオリゴとの端から端までのマッチによってカバーされることを可能にする。
（２）ブロッキングオリゴヌクレオチド間隔は、標的ライブラリの挿入サイズよりも大きいギャップの数を最小化するように選択されるべきである。
（３）ブロッキングオリゴヌクレオチドは、標的化されたｒＲＮＡ断片のセンス鎖及びアンチセンス鎖の両方を標的化するように設計される必要があり得る。

ヒトＲＮＡ－ｓｅｑライブラリとともに使用するためのｒＲＮＡブロッキングオリゴのプールを設計するために、以下の工程を含む計算戦略が実装された。
（１）各ｒＲＮＡ配列の５’末端から出発して、９０ｂｐのウィンドウ（ＲＮＡライブラリの平均挿入サイズの約０．５倍）が指定され、８０℃を上回るＴｍを有するオリゴについてスキャンされた。オリゴの長さは、最初に１５ｂｐに設定され、（ａ）所望されるＴｍを有するオリゴが見出されるか、又は（ｂ）オリゴの長さが９０ｂｐを超えるまで、反復して増加させた。
（２）一旦オリゴがウィンドウ内で識別されると、新しい９０ｂｐウィンドウがオリゴの３’末端から開始して設定され、工程（１）からの検索手順が繰り返される。所与のウィンドウ内にオリゴが見出されない場合、前のウィンドウの３’末端から開始する新しいウィンドウが設定される。
（３）シーケンスの最後に達するまで、工程（１）及び（２）が繰り返される。

このアプローチを使用して、全ての配列にわたって９０ｂｐよりも長い、１１個のギャップのみを有する５つのヒトｒＲＮＡのほぼ全長をカバーしたブロッキングオリゴのセットが設計された（図１１及び図１２参照）。非枯渇ＲＮＡｓｅｑライブラリ（すなわち、大部分がｒＲＮＡからなる）を使用するシミュレーションは、ｒＲＮＡライブラリ断片のほぼ９０％が、設計されたプールからのブロッキングオリゴヌクレオチドのうちの１つ以上による枯渇のために標的化されることになることを示した。これは、本明細書に説明されるブロッキングオリゴヌクレオチドアプローチが、市販のｒＲＮＡ枯渇キットに匹敵する枯渇効率（例えば、ＲｉｂｏＭｉｎｕｓについて約９５％の枯渇）を、非常に簡略化されたワークフロー及び低入力ＲＮＡ試料に対するより良好な性能を伴って、与え得ることを示唆する。プール設計に対するこのアプローチは、希少な体細胞突然変異の検出、ＮＩＰＴ、メタゲノミクス、又は病原体検出などの、豊富な配列による汚染が問題となる他のＮＧＳ法にも適用され得る。

したがって、本明細書に提示される研究では、ブロッキングオリゴヌクレオチドのプール（すなわち、ＰＣＲクランプ）が、所望されないライブラリ断片のＰＣＲ増幅を選択的に防止したことが示された。ライブラリからの所望されない転写物の枯渇は、ユーザによる余分なワークアップ工程を必要とせず、１つ以上のブロッキングポリヌクレオチドのみがＰＣＲ増幅反応に付加される必要がある。研究は、１つの使用が、本開示の１つ以上のブロッキングオリゴヌクレオチド（すなわち、ＰＣＲクランプ）を使用することによって、増幅されたＲＮＡ－Ｓｅｑライブラリ内のｒＲＮＡ含量を選択的に低減させ得ることを明確に実証する。更に、ｒＲＮＡ枯渇剤で処理された試料（ＲＰＯ処理）及びｍＲＮＡ選択試料において、１つ以上のブロッキングオリゴヌクレオチドの使用は、これらの試料中のｒＲＮＡ含量を有意に更に低減させた。例えば、ＲＰＯ処理試料において、本開示の１つ以上のブロッキングオリゴヌクレオチド（すなわち、ＰＣＲクランプ）の使用は、ｒＲＮＡ含量を約１０～１５％から＜１％ｒＲＮＡまで低減させた。

他のｒＲＮＡ枯渇技術と比較して、本開示の組成物、方法、及びキットは、ＲＮＡ－Ｓｅｑワークフローを使用した枯渇ＲＮＡライブラリのより迅速な調製を提供する。更に、本開示の組成物、方法、及びキットは、ｒＲＮＡ含量を８０％から３０％に枯渇させ、これは、既存のｒＲＮＡ枯渇技術に匹敵した。本開示の組成物、方法、及びキットは、既存のｒＲＮＡ枯渇技術と完全に適合し、ｒＲＮＡ含量をかろうじて検出可能なレベルまで更に低減させるためにその技術とともに使用され得る。観察されたオフターゲット効果はほとんどなく、本開示の組成物、方法、及びキットは、Ｒｉｂｏｚｅｒｏ及びＲＮａｓｅＨ枯渇法に匹敵した遺伝子レベル発現の高い相関を維持した。ＰＣＲ反応におけるサイクル数は、結果的に得られたライブラリにおける望ましくない転写物の低減のレベルに相関する。言い換えると、ＰＣＲサイクル数が多いほど、結果的に得られるライブラリ内の望ましくない転写物の低減が大きくなる。

３’－ブロックが利用されなかったブロッキングオリゴヌクレオチド（すなわち、ＰＣＲクランプ）を用いて研究が実施されたことに留意されるべきである。ブロッキングオリゴヌクレオチドは、所望されない転写物の試料を枯渇させることにおいて、更なる改善を提供し、重複ブロッキングヌクレオチド（Ｄｅｓｉｇｎ３）におけるコンカテマーの形成を大きく低減する可能性が高いことが予想される。ブロッキングオリゴヌクレオチドの長さを増加させることなくブロッキングヌクレオチドのＴｍを増加させる必要がある場合、ＬＮＡ又はＰＮＡなどの修飾塩基が使用され得る。

研究は、全ＲＮＡ試料からｒＲＮＡ転写物を枯渇させることを対象としたが、本開示の方法、組成物、及びキットは、ライブラリ調製物中の望ましくない転写物を低減するために一般的に適用可能であることが予想される。例えば、１つ以上のブロッキングオリゴヌクレオチドが、ＡＴＡＣ－Ｓｅｑ調製物中の望ましくないｍｔＤＮＡを低減するために、又は疫学試料のための宿主転写物を低減するために、使用することができる。

本開示は、本明細書に開示される１つ以上のブロッキングオリゴヌクレオチドを含むキットを更に提供する。キットは、特定の用途における使用のために調整され得る。例えば、キットは、本開示の方法を使用して鋳型ポリヌクレオチドのライブラリを調製する際の１つ以上のブロッキングオリゴヌクレオチドの使用を対象とし得る。そのようなキットは、少なくとも、本明細書で定義されるアダプタの供給物と、アダプタにアニーリングして伸長産物の合成を開始することができる少なくとも１つの増幅プライマの供給物と、を含み得、伸長産物は、アダプタが使用されているときにアダプタにライゲーションされた任意の標的配列を含むことになる。増幅プライマの構造及び特性は、当業者に周知であろう。キットに含められるアダプタとともに使用するための適切なヌクレオチド配列の好適なプライマは、当技術分野で通例的に使用される標準的な自動核酸合成設備及び試薬を使用して容易に調製され得る。キットは、１つの単一のタイプのプライマの供給物として、又は２つの異なるプライマの別個の供給物として（又は混合物でも）、例えば、溶液相中及び／又は好適な固体支持体上でミスマッチアダプタを用いて修飾された鋳型のＰＣＲ増幅（すなわち、固相ＰＣＲ）に好適なＰＣＲプライマの対を含み得る。

アダプタ、ＰＣＲプライマ、及び１つ以上のブロッキングオリゴヌクレオチドは、即座に使用できるキットで、又はより好ましくは、使用前に希釈を必要とする濃縮物として、又は使用前に再構成を必要とする凍結乾燥若しくは乾燥形態で供給され得る。必要に応じて、キットは、プライマの希釈又は再構成のための好適な希釈剤の供給を更に含み得る。任意選択的に、キットは、ＰＣＲ増幅を実施する際に使用するための試薬、緩衝液、酵素、ｄＮＴＰなどの供給物を更に含み得る。任意選択的にキット中に供給され得る更なる成分としては、アダプタ及びプライマを使用して調製される鋳型を配列決定するために好適な「ユニバーサル」配列決定プライマが挙げられる。

本開示は、本明細書に説明される方法及び組成物が、以下の態様（態様１～４３）によって更に定義され得ることを更に提供する。
態様１．１つ以上のブロッキングオリゴヌクレオチドを使用することによって、増幅されたＤＮＡ又はｃＤＮＡライブラリから望ましくない断片を選択的に枯渇させる方法であって、
ポリメラーゼ連鎖反応（ＰＣＲ）反応において、アダプタ配列を含む二本鎖鋳型配列を含む複数のライブラリ断片を増幅することであって、断片の一部分が、分析されるべきではない望ましくない断片を含む、増幅することを含み、
ＰＣＲ反応が、複数の断片、ポリメラーゼ、ｄＮＴＰ、ＰＣＲプライマ、及び１つ以上のブロッキングオリゴヌクレオチドを含み、１つ以上のブロッキングオリゴヌクレオチドが、（ｉ）、及び／又は（ｉｉ）、並びに（ｉｉｉ）：
（ｉ）５’末端に、ホスホロチオエート結合を含む１つ以上のヌクレオチド、及び／又は
（ｉｉ）３’末端に、ホスホロチオエート結合を含む１つ以上のヌクレオチド、並びに
（ｉｉｉ）ブロッキングオリゴヌクレオチドの３’末端におけるポリメラーゼ伸長を防止する３’－ブロック、を含み、
１つ以上のブロッキングプライマが、所望されない断片の鋳型配列に結合し、それによって、ＰＣＲによる所望されない断片の増幅をブロックする、方法。
態様２．ブロッキングオリゴヌクレオチドのうちの１つ以上が、１５ｎｔ～１００ｎｔの長さであり、好ましくは、ブロッキングヌクレオチドが、１５ｎｔ～８０ｎｔ、１５ｎｔ～７０ｎｔ、１５ｎｔ～６０ｎｔ、１５ｎｔ～５０ｎｔ、１５ｎｔ～４０ｎｔ、１５ｎｔ～３０ｎｔ、１７ｎｔ～３０ｎｔ、又は２０ｎｔ～３０ｎｔの長さである、態様１の方法。
態様３．ポリメラーゼが５’－３’エキソヌクレアーゼ活性を有する場合、ブロッキングオリゴヌクレオチドのうちの１つ以上が、５’末端に、ホスホロチオエート結合を含む１～５個のヌクレオチドを含み、好ましくは、５’末端が、ホスホロチオエート結合を含む２～５、３～５、４～５、２～４、又は２～３個のヌクレオチドを含む、態様１又は態様２の方法。
態様４．ポリメラーゼが３’－５’エキソヌクレアーゼ活性を有する場合、ブロッキングオリゴヌクレオチドのうちの１つ以上が、３’末端に、ホスホロチオエート結合を含む１～５個のヌクレオチドを含み、好ましくは、３’末端が、ホスホロチオエート結合を含む２～５、３～５、４～５、２～４、又は２～３個のヌクレオチドを含む、態様１～３のいずれか１つの方法。

態様５．１つ以上のブロッキングオリゴヌクレオチドが、（ｉ）、（ｉｉ）、及び（ｉｉｉ）：
（ｉ）５’末端に、ホスホロチオエート結合を含む２～５個のヌクレオチドを含み、好ましくは、５’末端が、ホスホロチオエート結合を含む２～５、３～５、４～５、２～４、又は２～３個のヌクレオチド。
及び／又は
（ｉｉ）３’末端に、ホスホロチオエート結合を含む２～５個のヌクレオチドを含み、好ましくは、３’末端が、ホスホロチオエート結合を含む２～５、３～５、４～５、２～４、又は２～３個のヌクレオチド。
並びに
（ｉｉｉ）ブロッキングオリゴヌクレオチドの３’末端上のポリメラーゼ伸長を防止する３’－ブロック、を含む、態様１～４のいずれか１つの方法。
態様６．３’－ブロックが、Ｃ_３－スペーサ、３’反転塩基、３’リン酸化、３’ジデオキシ塩基、又は３’非相補的オーバーハング塩基から選択され、好ましくは、３’－ブロックが、Ｃ_３－スペーサである、態様１～５のいずれか１つの方法。
態様７．増幅されたライブラリが、ｃＤＮＡ由来の鋳型配列を含む、態様１～６のいずれか１つの方法。
態様８．増幅されたライブラリが、ｇＤＮＡ由来の鋳型配列を含む、態様１～７のいずれか１つの方法。
態様９．アダプタ配列が、鋳型配列の各末端にライゲーションされているＹ字アダプタに由来する、態様１～８のいずれか１つの方法。
態様１０．１つ以上のブロッキングオリゴヌクレオチドが、ｒＲＮＡ及び／又はグロビン由来の鋳型配列に結合する、態様１～９のいずれか１つの方法。
態様１１．１つ以上のブロッキングオリゴヌクレオチドが、１８ＳｒＲＮＡ、５．８ＳｒＲＮＡ、及び／又は２８ＳＲＮＡ由来の鋳型配列に結合するブロッキングオリゴヌクレオチドのプールを含む、態様１～１０のいずれか１つの方法。
態様１２．ブロッキングオリゴヌクレオチドのうちの１つ以上が、ｍｔＤＮＡ由来の鋳型配列に結合する、態様１～１１のいずれか１つの方法。
態様１３．増幅されたＤＮＡ又はｃＤＮＡライブラリが、次世代シーケンシングを使用することによって分析される、態様１～１２のいずれか１つの方法。
態様１４．ＰＣＲ増幅工程が、以下の工程：
ＲＮＡ試料を取得する工程と、
好ましくは、超音波処理、酵素の使用、熱単独、又は高温における二価カチオンへの曝露によって、ＲＮＡを断片化する工程と、
ＲＮＡ断片をｃＤＮＡに逆転写する工程と、
ｃＤＮＡを平滑末端化し、平滑末端化されたｃＤＮＡの３’末端にＡヌクレオチドを付加する工程と、
Ａテール付きｃＤＮＡを、３’末端に非相補的Ｔヌクレオチドを含むアダプタとライゲーションする工程と、によって先行される、態様１～１３のいずれか１つの方法。
態様１５．ＲＮＡ断片をｃＤＮＡに逆転写する前に、ＲＮＡ試料が、ＲＮＡ試料からｒＲＮＡ配列を枯渇させるように処理される、態様１４の方法。
態様１６．ＰＣＲ増幅工程が、アダプタ配列を含む二本鎖鋳型配列を含む複数のライブラリ断片を生成するためのタグ付け反応工程によって先行される、態様１～１３のいずれか１つの方法。
態様１７．１つ以上のブロッキングオリゴヌクレオチドを使用することによって、増幅されたＤＮＡ又はｃＤＮＡライブラリから望ましくない断片を選択的に枯渇させる方法であって、
ポリメラーゼ連鎖反応（ＰＣＲ）反応において、アダプタ配列にライゲーションされた二本鎖鋳型配列を含む複数のライブラリ断片を増幅することであって、断片の一部分が、分析されるべきではない鋳型配列を含有する望ましくない断片を含む、増幅することを含み、
ＰＣＲ反応が、複数の断片、ポリメラーゼ、ｄＮＴＰ、ＰＣＲプライマ、及びブロッキングオリゴヌクレオチドのプールを含み、ブロッキングオリゴヌクレオチドのプールの一部分が、所望されない断片の鋳型配列の各鎖に結合し、
１つ以上のブロッキングプライマが、所望されない断片の鋳型配列に結合し、それによって、ＰＣＲによる所望されない断片の増幅をブロックする、方法。
態様１８．ブロッキングオリゴヌクレオチドのプールが、１５ｎｔ～１００ｎｔの長さであり、好ましくは、ブロッキングヌクレオチドが、１５ｎｔ～８０ｎｔ、１５ｎｔ～７０ｎｔ、１５ｎｔ～６０ｎｔ、１５ｎｔ～５０ｎｔ、１５ｎｔ～４０ｎｔ、１５ｎｔ～３０ｎｔ、１７ｎｔ～３０ｎｔ、又は２０ｎｔ～３０ｎｔの長さである、態様１７の方法。
態様１９．ブロッキングオリゴヌクレオチドのプールが、非重複かつ隣接様式で、好ましくは、図３のＤｅｓｉｇｎ１の様式で、鋳型の鎖に結合するブロッキングオリゴヌクレオチドを含む、態様１７の方法。
態様２０．ブロッキングオリゴヌクレオチドのプールが、好ましくは、図３のＤｅｓｉｇｎ１＋２の様式で、他のブロッキングオリゴヌクレオチドに対して逆相補的であるブロッキングオリゴヌクレオチドを含む、態様１９の方法。
態様２１．ブロッキングオリゴヌクレオチドのプールが、（ｉ）、及び／又は（ｉｉ）、並びに（ｉｉｉ）：
（ｉ）５’末端に、ホスホロチオエート結合を含む１つ以上のヌクレオチド、及び／又は
（ｉｉ）３’末端に、ホスホロチオエート結合を含む１つ以上のヌクレオチド、並びに
（ｉｉｉ）ブロッキングオリゴヌクレオチドの３’末端上のポリメラーゼ伸長を防止する３’－ブロック、を含む、態様１７～２０のいずれか１つの方法。
態様２２．ポリメラーゼが５’－３’エキソヌクレアーゼ活性を有する場合、ブロッキングオリゴヌクレオチドのうちの１つ以上が、５’末端に、ホスホロチオエート結合を含む１～５個のヌクレオチドを含む、態様２１の方法。
態様２３．ポリメラーゼが３’－５’プルーフリーディング活性を有する場合、ブロッキングオリゴヌクレオチドのうちの１つ以上が、３’末端に、ホスホロチオエート結合を含む１～５個のヌクレオチドを含む、態様２１の方法。
態様２４．１つ以上のブロッキングオリゴヌクレオチドが、（ｉ）、（ｉｉ）、及び（ｉｉｉ）：
（ｉ）５’末端に、ホスホロチオエート結合を含む２～５個のヌクレオチド、
（ｉｉ）３’末端に、ホスホロチオエート結合を含む２～５個のヌクレオチド、及び
（ｉｉｉ）ブロッキングオリゴヌクレオチドの３’末端上のポリメラーゼ伸長を防止する３’－ブロック、を含む、態様２１の方法。
態様２５．３’－ブロックが、Ｃ_３－スペーサ、３’反転塩基、３’リン酸化、３’ジデオキシ塩基、又は３’非相補的オーバーハング塩基から選択される、態様２１～２４のいずれか１つの方法。
態様２６．増幅されたライブラリが、ｃＤＮＡ由来の鋳型配列を含む、態様１７～２５のいずれか１つの方法。
態様２７．増幅されたライブラリが、ｇＤＮＡ由来の鋳型配列を含む、態様１７～２５のいずれか１つの方法。
態様２８．アダプタ配列が、鋳型配列の各末端にライゲーションされているＹ字アダプタに由来する、態様１７～２７のいずれか１つの方法。
態様２９．ブロッキングオリゴヌクレオチドのプールが、ｒＲＮＡ及び／又はグロビン由来の鋳型配列に結合する、態様１７～２８のいずれか１つの方法。
態様３０．ブロッキングオリゴヌクレオチドのプールが、１８ＳｒＲＮＡ、５．８ＳｒＲＮＡ、及び／又は２８ＳＲＮＡ由来の鋳型配列に結合する、態様１７～２９のいずれか１つの方法。
態様３１．ブロッキングオリゴヌクレオチドのブロッキングのプールが、ｍｔＤＮＡ由来の鋳型配列に結合する、態様１７～３０のいずれか１つの方法。
態様３２．増幅されたＤＮＡ又はｃＤＮＡライブラリが、次世代シーケンシングを使用することによって分析される、態様１７～３１のいずれか１つの方法。
態様３３．ＰＣＲ増幅工程が、以下の工程：
ＲＮＡ試料を取得する工程と、
好ましくは、超音波処理、酵素の使用、熱単独、又は高温における二価カチオンへの曝露によって、ＲＮＡを断片化する工程と、
ＲＮＡ断片をｃＤＮＡに逆転写する工程と、
ｃＤＮＡを平滑末端化し、平滑末端化されたｃＤＮＡの３’末端にＡヌクレオチドを付加する工程と、
Ａテール付きｃＤＮＡを、３’末端に非相補的Ｔヌクレオチドを含むアダプタとライゲーションする工程と、によって先行される、態様１７～３２のいずれか１つの方法。
態様３４．ＲＮＡ断片をｃＤＮＡに逆転写する前に、ＲＮＡ試料が、ＲＮＡ試料からｒＲＮＡ配列を枯渇させるように処理される、態様３３の方法。
態様３５．ＰＣＲ増幅工程が、アダプタ配列を含む二本鎖鋳型配列を含む複数のライブラリ断片を生成するためのタグ付け反応工程によって先行される、態様１７～３４のいずれか１つの方法。
態様３６．１つ以上のブロッキングオリゴヌクレオチドを含むＲＮＡ－Ｓｅｑベースのライブラリ調製キットであって、１つ以上のブロッキングオリゴヌクレオチドが、（ｉ）、及び／又は（ｉｉ）、並びに（ｉｉｉ）：
（ｉ）５’末端に、ホスホロチオエート結合を含む１つ以上のヌクレオチド、及び／又は
（ｉｉ）３’末端に、ホスホロチオエート結合を含む１つ以上のヌクレオチド、並びに
（ｉｉｉ）ブロッキングオリゴヌクレオチドの３’末端におけるポリメラーゼ伸長を防止する３’－ブロック、を含み、
１つ以上のブロッキングオリゴヌクレオチドが、所望されないライブラリ断片の鋳型配列に結合し、それによって、ＰＣＲによる所望されないライブラリ断片の増幅をブロックする、ＲＮＡ－Ｓｅｑベースのライブラリ調製キット。
態様３７．ライブラリ調製キットが、
Ａ－テーリングミックスと、
増強されたＰＣＲミックスと、
ライゲーションミックスと、
再懸濁緩衝液と、
停止ライゲーション緩衝液と、
Ｅｌｕｔｅ，Ｐｒｉｍｅ，ＦｒａｇｍｅｎｔＨｉｇｈＣｏｎｃｅｎｔｒａｔｉｏｎＭｉｘと、
ＦｉｒｓｔｓｔｒａｎｄＳｙｎｔｈｅｓｉｓＡｃｔＤＭｉｘと、
逆転写酵素と、
第２鎖マスタミックスと、を更に含む、態様３６のＲＮＡ－Ｓｅｑベースのライブラリ調製キット。
態様３８．ブロッキングオリゴヌクレオチドのうちの１つ以上が、１５ｎｔ～１００ｎｔの長さであり、好ましくは、ブロッキングヌクレオチドが、１５ｎｔ～８０ｎｔ、１５ｎｔ～７０ｎｔ、１５ｎｔ～６０ｎｔ、１５ｎｔ～５０ｎｔ、１５ｎｔ～４０ｎｔ、１５ｎｔ～３０ｎｔ、１７ｎｔ～３０ｎｔ、又は２０ｎｔ～３０ｎｔの長さである、態様３７のＲＮＡ－Ｓｅｑベースのライブラリ調製キット。
態様３９．ブロッキングオリゴヌクレオチドのプールを含むＲＮＡ－Ｓｅｑベースのライブラリ調製キットであって、ブロッキングオリゴヌクレオチドのプールの一部分が、所望されない断片の鋳型配列の各鎖に非重複かつ隣接様式で結合し、それによって、ＰＣＲによる所望されないライブラリ断片の増幅をブロックする、ＲＮＡ－Ｓｅｑベースのライブラリ調製キット。
態様４０．ライブラリ調製キットが、
Ａ－テーリングミックスと、
増強されたＰＣＲミックスと、
ライゲーションミックスと、
再懸濁緩衝液と、
停止ライゲーション緩衝液と、
Ｅｌｕｔｅ，Ｐｒｉｍｅ，ＦｒａｇｍｅｎｔＨｉｇｈＣｏｎｃｅｎｔｒａｔｉｏｎＭｉｘと、
ＦｉｒｓｔｓｔｒａｎｄＳｙｎｔｈｅｓｉｓＡｃｔＤＭｉｘと、
逆転写酵素と、
第２鎖マスタミックスと、を更に含む、態様３９のＲＮＡ－Ｓｅｑベースのライブラリ調製キット。
態様４１．ブロッキングオリゴヌクレオチドのプールが、１５ｎｔ～１００ｎｔの長さであり、好ましくは、ブロッキングヌクレオチドが、１５ｎｔ～８０ｎｔ、１５ｎｔ～７０ｎｔ、１５ｎｔ～６０ｎｔ、１５ｎｔ～５０ｎｔ、１５ｎｔ～４０ｎｔ、１５ｎｔ～３０ｎｔ、１７ｎｔ～３０ｎｔ、又は２０ｎｔ～３０ｎｔの長さである、態様３９又は態様４０のＲＮＡ－Ｓｅｑベースのライブラリ調製キット。
態様４２．ブロッキングオリゴヌクレオチドのプールが、（ｉ）、及び／又は（ｉｉ）、並びに（ｉｉｉ）：
（ｉ）５’末端に、ホスホロチオエート結合を含む１つ以上のヌクレオチド、及び／又は
（ｉｉ）３’末端に、ホスホロチオエート結合を含む１つ以上のヌクレオチド、並びに
（ｉｉｉ）ブロッキングオリゴヌクレオチドの３’末端上のポリメラーゼ伸長を防止する３’－ブロック、を含む、態様３９～４１のいずれか１つのＲＮＡ－Ｓｅｑベースのライブラリ調製キット。
態様４３．３’－ブロックが、Ｃ_３－スペーサ、３’反転塩基、３’リン酸化、３’ジデオキシ塩基、又は３’非相補的オーバーハング塩基から選択される、態様４２のＲＮＡ－Ｓｅｑベースのライブラリ調製キット。

本開示の多くの実施形態を説明してきた。しかしながら、本開示の趣旨及び範囲を逸脱することなく、様々な修正が行われ得ることを理解されたい。したがって、他の実施形態は、以下の特許請求の範囲の範囲内にある。

Claims

１つ以上のブロッキングオリゴヌクレオチドを使用することによって、増幅されたＤＮＡ又はｃＤＮＡライブラリから望ましくない断片を選択的に枯渇させる方法であって、
ポリメラーゼ連鎖反応（ＰＣＲ）反応において、アダプタ配列を含む二本鎖鋳型配列を含む複数のライブラリ断片を増幅することであって、前記断片の一部分が、分析されるべきではない望ましくない断片を含む、増幅することを含み、
前記ＰＣＲ反応が、複数の断片、ポリメラーゼ、ｄＮＴＰ、ＰＣＲプライマ、及び１つ以上のブロッキングオリゴヌクレオチドを含み、前記１つ以上のブロッキングオリゴヌクレオチドが、（ｉ）、及び／又は（ｉｉ）、並びに（ｉｉｉ）：
（ｉ）５’末端に、ホスホロチオエート結合を含む１つ以上のヌクレオチド、及び／又は
（ｉｉ）３’末端に、ホスホロチオエート結合を含む１つ以上のヌクレオチド、並びに
（ｉｉｉ）前記ブロッキングオリゴヌクレオチドの前記３’末端におけるポリメラーゼ伸長を防止する３’－ブロック、を含み、
前記１つ以上のブロッキングプライマが、所望されない断片の前記鋳型配列に結合し、それによって、ＰＣＲによる前記所望されない断片の増幅をブロックする、方法。
前記ブロッキングオリゴヌクレオチドのうちの１つ以上が、１５ｎｔ～１００ｎｔの長さである、請求項１に記載の方法。
前記ポリメラーゼが５’－３’エキソヌクレアーゼ活性を有する場合、前記ブロッキングオリゴヌクレオチドのうちの１つ以上が、５’末端に、ホスホロチオエート結合を含む１～５個のヌクレオチドを含む、請求項１に記載の方法。
前記ポリメラーゼが３’－５’プルーフリーディング活性を有する場合、前記ブロッキングオリゴヌクレオチドのうちの１つ以上が、３’末端に、ホスホロチオエート結合を含む１～５個のヌクレオチドを含む、請求項１に記載の方法。
前記１つ以上のブロッキングオリゴヌクレオチドが、（ｉ）、（ｉｉ）、及び（ｉｉｉ）：
（ｉ）前記５’末端に、ホスホロチオエート結合を含む２～５個のヌクレオチド、
（ｉｉ）前記３’末端に、ホスホロチオエート結合を含む２～５個のヌクレオチド、及び
（ｉｉｉ）前記ブロッキングオリゴヌクレオチドの前記３’末端上のポリメラーゼ伸長を防止する３’－ブロック、を含む、請求項１に記載の方法。
前記３’－ブロックが、Ｃ_３－スペーサ、３’反転塩基、３’リン酸化、３’ジデオキシ塩基、又は３’非相補的オーバーハング塩基から選択される、請求項１に記載の方法。
前記増幅されたライブラリが、ｃＤＮＡ由来の鋳型配列を含む、請求項１に記載の方法。
前記増幅されたライブラリが、ｇＤＮＡ由来の鋳型配列を含む、請求項１に記載の方法。
前記アダプタ配列が、鋳型配列の各末端にライゲーションされているＹ字アダプタに由来する、請求項１に記載の方法。
前記１つ以上のブロッキングオリゴヌクレオチドが、ｒＲＮＡ及び／又はグロビン由来の鋳型配列に結合する、請求項１に記載の方法。
前記１つ以上のブロッキングオリゴヌクレオチドが、１８ＳｒＲＮＡ、５．８ＳｒＲＮＡ、及び／又は２８ＳＲＮＡ由来の鋳型配列に結合するブロッキングオリゴヌクレオチドのプールを含む、請求項１０に記載の方法。
前記ブロッキングオリゴヌクレオチドのうちの１つ以上が、ｍｔＤＮＡ由来の鋳型配列に結合する、請求項１に記載の方法。
前記増幅されたＤＮＡ又はｃＤＮＡライブラリが、次世代シーケンシングを使用することによって分析される、請求項１に記載の方法。
前記ＰＣＲ増幅工程が、以下の工程：
ＲＮＡ試料を取得する工程と、
前記ＲＮＡを断片化する工程と、
前記ＲＮＡ断片をｃＤＮＡに逆転写する工程と、
前記ｃＤＮＡを平滑末端化し、前記平滑末端化されたｃＤＮＡの３’末端にＡヌクレオチドを付加する工程と、
前記Ａテール付きｃＤＮＡを、前記３’末端に非相補的Ｔヌクレオチドを含むアダプタとライゲーションする工程と、によって先行される、請求項１に記載の方法。
前記ＲＮＡ断片をｃＤＮＡに逆転写する前に、前記ＲＮＡ試料が、前記ＲＮＡ試料からｒＲＮＡ配列を枯渇させるように処理される、請求項１４に記載の方法。
１つ以上のブロッキングオリゴヌクレオチドを使用することによって、増幅されたＤＮＡ又はｃＤＮＡライブラリから望ましくない断片を選択的に枯渇させる方法であって、
ポリメラーゼ連鎖反応（ＰＣＲ）反応において、アダプタ配列を含む二本鎖鋳型配列を含む複数のライブラリ断片を増幅することであって、前記断片の一部分が、分析されるべきではない鋳型配列を含有する望ましくない断片を含む、増幅することを含み、
前記ＰＣＲ反応が、複数の断片、ポリメラーゼ、ｄＮＴＰ、ＰＣＲプライマ、及びブロッキングオリゴヌクレオチドのプールを含み、前記ブロッキングオリゴヌクレオチドの前記プールの一部分が、所望されない断片の鋳型配列の各鎖に結合し、
前記１つ以上のブロッキングプライマが、所望されない断片の前記鋳型配列に結合し、それによって、ＰＣＲによる前記所望されない断片の増幅をブロックする、方法。
ブロッキングオリゴヌクレオチドの前記プールが、１５ｎｔ～１００ｎｔの長さである、請求項１６に記載の方法。
ブロッキングオリゴヌクレオチドの前記プールが、非重複かつ隣接様式で前記鋳型の前記鎖に結合するブロッキングオリゴヌクレオチドを含む、請求項１６に記載の方法。
ブロッキングオリゴヌクレオチドの前記プールが、他のブロッキングオリゴヌクレオチドに対して逆相補的であるブロッキングオリゴヌクレオチドを含む、請求項１８に記載の方法。
ブロッキングオリゴヌクレオチドの前記プールが、（ｉ）、及び／又は（ｉｉ）、並びに（ｉｉｉ）：
（ｉ）５’末端に、ホスホロチオエート結合を含む１つ以上のヌクレオチド、及び／又は
（ｉｉ）３’末端に、ホスホロチオエート結合を含む１つ以上のヌクレオチド、並びに
（ｉｉｉ）前記ブロッキングオリゴヌクレオチドの前記３’末端上のポリメラーゼ伸長を防止する３’－ブロック、を含む、請求項１６に記載の方法。
前記ポリメラーゼが５’－３’エキソヌクレアーゼ活性を有する場合、前記ブロッキングオリゴヌクレオチドのうちの１つ以上が、前記５’末端に、ホスホロチオエート結合を含む１～５個のヌクレオチドを含む、請求項２０に記載の方法。
前記ポリメラーゼが３’－５’プルーフリーディング活性を有する場合、前記ブロッキングオリゴヌクレオチドのうちの１つ以上が、３’末端に、ホスホロチオエート結合を含む１～５個のヌクレオチドを含む、請求項２０に記載の方法。
前記１つ以上のブロッキングオリゴヌクレオチドが、（ｉ）、（ｉｉ）、及び（ｉｉｉ）：
（ｉ）前記５’末端に、ホスホロチオエート結合を含む２～５個のヌクレオチド、
（ｉｉ）前記３’末端に、ホスホロチオエート結合を含む２～５個のヌクレオチド、及び
（ｉｉｉ）前記ブロッキングオリゴヌクレオチドの前記３’末端上のポリメラーゼ伸長を防止する３’－ブロック、を含む、請求項２０に記載の方法。
前記３’－ブロックが、Ｃ_３－スペーサ、３’反転塩基、３’リン酸化、３’ジデオキシ塩基、又は３’非相補的オーバーハング塩基から選択される、請求項２０に記載の方法。
前記増幅されたライブラリが、ｃＤＮＡ由来の鋳型配列を含む、請求項１６に記載の方法。
前記増幅されたライブラリが、ｇＤＮＡ由来の鋳型配列を含む、請求項１６に記載の方法。
前記アダプタ配列が、鋳型配列の各末端にライゲーションされているＹ字アダプタに由来する、請求項１６に記載の方法。
ブロッキングオリゴヌクレオチドの前記プールが、ｒＲＮＡ及び／又はグロビン由来の鋳型配列に結合する、請求項１６に記載の方法。
ブロッキングオリゴヌクレオチドの前記プールが、１８ＳｒＲＮＡ、５．８ＳｒＲＮＡ、及び／又は２８ＳＲＮＡ由来の鋳型配列に結合する、請求項１６に記載の方法。
ブロッキングオリゴヌクレオチドのブロッキングの前記プールが、ｍｔＤＮＡ由来の鋳型配列に結合する、請求項１６に記載の方法。
前記増幅されたＤＮＡ又はｃＤＮＡライブラリが、次世代シーケンシングを使用することによって分析される、請求項１６に記載の方法。
前記ＰＣＲ増幅工程が、以下の工程：
ＲＮＡ試料を取得する工程と、
前記ＲＮＡを断片化する工程と、
前記ＲＮＡ断片をｃＤＮＡに逆転写する工程と、
前記ｃＤＮＡを平滑末端化し、前記平滑末端化されたｃＤＮＡの３’末端にＡヌクレオチドを付加する工程と、
前記Ａテール付きｃＤＮＡを、前記３’末端に非相補的Ｔヌクレオチドを含むアダプタとライゲーションする工程と、によって先行される、請求項１６に記載の方法。
前記ＲＮＡ断片をｃＤＮＡに逆転写する前に、前記ＲＮＡ試料が、前記ＲＮＡ試料からｒＲＮＡ配列を枯渇させるように処理される、請求項３２に記載の方法。
１つ以上のブロッキングオリゴヌクレオチドを含むＲＮＡ－Ｓｅｑベースのライブラリ調製キットであって、前記１つ以上のブロッキングオリゴヌクレオチドが、（ｉ）、及び／又は（ｉｉ）、並びに（ｉｉｉ）：
（ｉ）５’末端に、ホスホロチオエート結合を含む１つ以上のヌクレオチド、及び／又は
（ｉｉ）３’末端に、ホスホロチオエート結合を含む１つ以上のヌクレオチド、並びに
（ｉｉｉ）前記ブロッキングオリゴヌクレオチドの前記３’末端におけるポリメラーゼ伸長を防止する３’－ブロック、を含み、
前記１つ以上のブロッキングオリゴヌクレオチドが、所望されないライブラリ断片の鋳型配列に結合し、それによって、ＰＣＲによる前記所望されないライブラリ断片の増幅をブロックする、ＲＮＡ－Ｓｅｑベースのライブラリ調製キット。
前記ライブラリ調製キットが、
Ａ－テーリングミックスと、
増強されたＰＣＲミックスと、
ライゲーションミックスと、
再懸濁緩衝液と、
停止ライゲーション緩衝液と、
Ｅｌｕｔｅ，Ｐｒｉｍｅ，ＦｒａｇｍｅｎｔＨｉｇｈＣｏｎｃｅｎｔｒａｔｉｏｎＭｉｘと、
ＦｉｒｓｔｓｔｒａｎｄＳｙｎｔｈｅｓｉｓＡｃｔＤＭｉｘと、
逆転写酵素と、
第２鎖マスタミックスと、を更に含む、請求項３４に記載のＲＮＡ－Ｓｅｑベースのライブラリ調製キット。
前記ブロッキングオリゴヌクレオチドのうちの１つ以上が、１５ｎｔ～１００ｎｔの長さである、請求項３４に記載のＲＮＡ－Ｓｅｑベースのライブラリ調製キット。
ブロッキングオリゴヌクレオチドのプールを含むＲＮＡ－Ｓｅｑベースのライブラリ調製キットであって、ブロッキングオリゴヌクレオチドの前記プールの一部分が、所望されない断片の鋳型配列の各鎖に非重複かつ隣接様式で結合し、それによって、ＰＣＲによる所望されないライブラリ断片の増幅をブロックする、ＲＮＡ－Ｓｅｑベースのライブラリ調製キット。
前記ライブラリ調製キットが、
Ａ－テーリングミックスと、
増強されたＰＣＲミックスと、
ライゲーションミックスと、
再懸濁緩衝液と、
停止ライゲーション緩衝液と、
Ｅｌｕｔｅ，Ｐｒｉｍｅ，ＦｒａｇｍｅｎｔＨｉｇｈＣｏｎｃｅｎｔｒａｔｉｏｎＭｉｘと、
ＦｉｒｓｔｓｔｒａｎｄＳｙｎｔｈｅｓｉｓＡｃｔＤＭｉｘと、
逆転写酵素と、
第２鎖マスタミックスと、を更に含む、請求項３７に記載のＲＮＡ－Ｓｅｑベースのライブラリ調製キット。
前記ブロッキングオリゴヌクレオチドの前記プールが、１５ｎｔ～１００ｎｔの長さである、請求項３７に記載のＲＮＡ－Ｓｅｑベースのライブラリ調製キット。
ブロッキングオリゴヌクレオチドの前記プールが、（ｉ）、及び／又は（ｉｉ）、並びに（ｉｉｉ）：
（ｉ）５’末端に、ホスホロチオエート結合を含む１つ以上のヌクレオチド、及び／又は
（ｉｉ）３’末端に、ホスホロチオエート結合を含む１つ以上のヌクレオチド、並びに
（ｉｉｉ）前記ブロッキングオリゴヌクレオチドの前記３’末端上のポリメラーゼ伸長を防止する３’－ブロック、を含む、請求項３７に記載のＲＮＡ－Ｓｅｑベースのライブラリ調製キット。
前記３’－ブロックが、Ｃ_３－スペーサ、３’反転塩基、３’リン酸化、３’ジデオキシ塩基、又は３’非相補的オーバーハング塩基から選択される、請求項４０に記載のＲＮＡ－Ｓｅｑベースのライブラリ調製キット。