I.概要
本開示は、サンプル構成成分のサブセットへの試薬の制御された送達と、それに続く、部分的に送達された試薬を使用するサンプル構成成分の分析を介したサンプル材料の処理において有用な方法、システム及び組成物を提供する。多くの場合、サンプル処理のために、特に、全般的に、核酸分析適用、特には、核酸配列決定適用のために、方法及び組成物が使用される。バーコード配列を含有する多数のオリゴヌクレオチドに付着しているビーズの多様なライブラリーなどの試薬の多様なセットを含むビーズ組成物及びそれを作製し、使用する方法が本開示内に含まれる。
ビーズを作製する方法は、一般に、例えば、水溶液中でビーズ前駆体(モノマー又はポリマーなど)、プライマー及び架橋剤を組み合わせること、時には、マイクロ流体デバイス又は液滴発生装置を使用して、前記水溶液を油相と組み合わせること及び油中水液滴を形成させることを含み得る。一部の場合には、促進剤及び/又は開始剤などの触媒を、液滴形成の前又は後に添加してもよい。一部の場合には、開始は、例えば、熱又は光(例えば、UV光)の付加などによる、エネルギーの付加によって達成され得る。液滴における重合反応は、一部の場合には、オリゴヌクレオチド(例えば、プライマー)の1種以上のコピーと共有結合で連結しているビーズを生成するよう起こり得る。さらなる配列を、種々の方法を使用して官能化されたビーズに付着せることができる。一部の場合には、官能化されたビーズを、鋳型オリゴヌクレオチド(例えば、バーコードを含有する)と組み合わせ、平均して、1個又は2、3個の鋳型オリゴヌクレオチドが、官能化されたビーズと同一の区画を占めるよう区画化する。区画は、種々の異なる種類の区画のいずれか、例えば、ウェル、マイクロウェル、チューブ、バイアル、マイクロカプセルなどであり得るが、好ましい態様では、区画は、エマルジョン内の液滴(例えば、水性液滴)であり得る。オリゴヌクレオチド(例えば、バーコード)配列を、プライマー伸長反応、ライゲーション反応又はその他の方法などの反応によって区画内のビーズに付着させることができる。例えば、一部の場合には、プライマーを用いて官能化されたビーズを、プライマーの結合部位を含む鋳型バーコードオリゴヌクレオチと組み合わせ、プライマーがビーズ上で伸長されるのを可能にする。複数の増幅のラウンド後、単一バーコード配列のコピーを、ビーズに付着している複数のプライマーに付着させる。ビーズへのバーコード配列の付着後、エマルジョンを破壊することができ、バーコードが付いたビーズ(又は別の種類の増幅産物と連結しているビーズ)を、増幅されたバーコードを伴わないビーズから分離することができる。次いで、ランダム配列(例えば、ランダムN mer)又は標的化配列などのさらなる配列を、例えば、プライマー伸長法又はその他の増幅反応を使用して、ビーズが結合しているバーコード配列に付加することができる。このプロセスによって、バーコードが付いたビーズの大きな多様なライブラリーを作製することができる。
図1Aは、バーコードが付いたビーズを作製するための例示的方法を示す。第1に、水溶液中で、ゲル前駆体(例えば、直鎖状ポリマー及び/又はモノマー)、架橋剤及びプライマーを組み合わせればよい、101。次に、マイクロ流体デバイスにおいて、水溶液を油相と組み合わせることができる、102。油相及び水溶液を組み合わせることで、油中水液滴を形成させることができる、103。油中水液滴内で、ゲル前駆体の重合が起こり、プライマーの複数のコピーを含むビーズを形成する、104。プライマーを含有するビーズの作製後に、エマルジョンを破壊し、105、ビーズを回収すればよい。例えば、洗浄によって、回収したビーズを未反応の構成成分から分離し、任意の適した溶媒(例えば、水性溶媒、非水性溶媒)中に導入すればよい。一部の場合には、次いで、プライマー含有ビーズを、各液滴が、平均して少なくとも1個のビーズ及び平均して1個以下の分子の鋳型バーコード配列を含むよう、別のエマルジョンの液滴中で鋳型バーコード配列と組み合わせればよい(例えば、限界希釈法によって)。鋳型バーコード配列を、ビーズに付着しているプライマーを使用してクローン増幅すればよく、その結果、鋳型と相補的であるバーコード配列の複数のコピーがビーズへ付着される、106。次いで、バーコードが付いたビーズを、バーコードを含有するか、バーコードを含有しないいずれかのビーズの集団にプールすればよい、107。次いで、例えば、濃縮工程によって、バーコードが付いたビーズを単離すればよい。また、その後の処理において利用するために、さらなる機能的配列構成成分を有するバーコード分子を提供してもよい。例えば、プライマー配列を、バーコード配列セグメントを含む同一オリゴヌクレオチド中に組み込み、バーコードを含有するオリゴヌクレオチドの、サンプル核酸の複製のための伸長プライマーとして、又はその後の配列決定若しくは増幅反応の誘導部位として機能するための使用を可能にしてもよい。一例では、次いで、プライマー伸長又はその他の増幅反応によって、バーコードが付いたビーズにランダムN mer配列を付加してもよく、108、それによって、バーコードが付いたビーズの多様なライブラリー、110を得てもよく、このようなランダムN mer配列は、ユニバーサルプライマー配列を提供し得る。同様に、機能的配列は、例えば、配列決定適用のために、バーコード含有配列を表面上に固定化するための固定化配列を含んでもよい。議論の容易さのために、P5、P7、R1、R2などのいくつかの特定の機能的配列、サンプル指数、ランダムN merなど及びこれらの部分的配列並びに前記のいずれかの相補体を以下に記載する。しかし、これらの記載は、議論の目的のためであって、バーコード含有オリゴヌクレオチド内に含まれる種々の機能的配列のいずれも、制限するものではないが、種々の付着配列、種々の配列決定プライマー領域、種々のn mer領域(標的化及びランダム)並びに種々の機能、例えば、ヘアピン又はその他の構造を形成する、例えば、二次構造を有する配列、例えば、オリゴヌクレオチドの有無の照合を可能にするか、又は得られたアンプリコンのプルダウンを可能にするプローブ配列又は種々のその他の機能的配列のいずれかを含めたこれらの特定の配列と置換されてもよいということが理解される。
核酸解析のための、特に、配列決定適用のためのサンプル調製の方法も本開示内に含まれる。サンプル調製は、一般に、例えば、供給源からサンプル核酸を含むサンプルを得る工程、任意選択で、サンプルを更に処理する工程、サンプル核酸をバーコードが付いたビーズと組み合わせる工程並びにサンプル核酸及びバーコードが付いたビーズを含む流体液滴を含有するエマルジョンを形成する工程を含み得る。液滴は、例えば、マイクロ流体デバイスの補助を得て、及び/又は任意の適した乳化方法によって作製してもよい。流体液滴はまた、バーコードが付いたビーズを溶解、分解若しくはそうでなければ破壊可能な、及び/又は付着している配列との連結を破壊し、それによって、ビーズから付着しているバーコード配列を放出可能な薬剤を含み得る。バーコード配列は、ビーズを分解する工程、切断反応などによってオリゴヌクレオチドをビーズから脱離させる工程のいずれか、又は両方の組合せによって放出され得る。流体液滴中のサンプル核酸を増幅する工程によって(例えば、本明細書に記載される増幅方法によって)、例えば、遊離バーコード配列をサンプル核酸に付着させることができる。次いで、流体液滴を含むエマルジョンを破壊することができ、必要に応じて、次いで、さらなる配列(例えば、特定の配列決定法において補助する配列、さらなるバーコード配列など)を、例えば、さらなる増幅法を使用してバーコードが付いたサンプル核酸に付加できる。次いで、バーコードが付いた、増幅されたサンプル核酸で配列決定を実施し、1種以上の配列決定アルゴリズムを適用して、配列決定データを解釈できる。本明細書において、サンプル核酸は、例えば、DNA及びRNAを含めた、具体的には、例えば、ゲノムDNA、cDNA、mRNA全RNA及びmRNAから作製されたcDNA又は全RNA転写物を含めたさまざまな核酸のいずれかを含み得る。
図1Bは、サンプル核酸にバーコードを付け、その後、配列決定するための例示的方法を示す。第1に、供給源から核酸を含むサンプルを得ればよく、111、例えば、本明細書に記載されるようにバーコードが付いたビーズのセットを得ればよい、112。ビーズを、好ましくは、1種以上のバーコード配列及びランダムN mer又はその他のプライマーなどのプライマーを含有するオリゴヌクレオチドに連結する。好ましくは、バーコード配列は、例えば、バーコードとビーズの間の連結の切断によって、又はバーコードを放出するための根底にあるビーズの分解によって、又は2つの組合せによってバーコードが付いたビーズから放出可能である。例えば、ある特定の好ましい態様では、バーコードが付いたビーズを、還元剤などの薬剤によって分解又は溶解して、バーコード配列を放出できる。この例では、核酸を含むサンプル、113、バーコードが付いたビーズ、114及び例えば、還元剤、116を組み合わせ、区画化に付す。例によって、このような区画化は、マイクロ流体デバイス、115などの液滴生成システムに構成成分を導入する工程を含んでもよい。マイクロ流体デバイス115の補助を得て、サンプル核酸、還元剤及びバーコードが付いたビーズを含有する水性液滴、117を含有する油中水型エマルジョン117を形成してもよい。還元剤は、バーコードが付いたビーズを溶解又は分解し得、それによって、バーコード及びランダムN merを有するオリゴヌクレオチドが液滴内のビーズから放出される、118。次いで、ランダムN merは、サンプル核酸の種々の領域をプライミングし得、その結果、増幅後にサンプルの増幅されたコピーが得られ、各コピーにバーコード配列を用いてタグが付けられる、119。好ましくは、各液滴は、同一バーコード配列及び異なるランダムN mer配列を含有するオリゴヌクレオチドのセットを含有する。続いて、エマルジョンを破壊し、120、さらなる配列(例えば、特定の配列決定法において補助する配列、さらなるバーコード配列など)を、例えば、増幅法(例えば、PCR)によって付加してもよい。次いで、配列決定を実施し、123、アルゴリズムを適用して、配列決定データを解釈してもよい、124。配列決定アルゴリズムは、一般に、例えば、バーコードの分析を実施して、配列決定リードをアラインし、及び/
又は特定の配列リードが属するサンプルを同定することが可能である。
本開示の方法及び組成物は、任意の適したデジタルプロセッサとともに使用してもよい。デジタルプロセッサは、例えば、デバイスの任意の成分を操作し、及び/又は本明細書に記載された方法を実行するようプログラムしてもよい。一部の実施形態では、ビーズ形成は、液滴発生装置と連絡しているデジタルプロセッサの補助を得て実行してもよい。デジタルプロセッサは、液滴が形成される速度を制御し得るか、又は生成する液滴の総数を制御し得る。一部の実施形態では、サンプル核酸にバーコード配列を付着させる工程は、マイクロ流体デバイス及びマイクロ流体デバイスと連絡しているデジタルプロセッサの補助を得て完了してもよい。一部の場合には、デジタルプロセッサは、マイクロ流体デバイスのチャネルに提供されるサンプル及び/又はビーズの量、チャネル内の材料の流速並びにバーコード配列及びサンプル核酸を含む液滴が生成される速度を制御してもよい。
本開示の方法及び組成物は、それだけには限らないが、核酸配列決定、タンパク質配列決定、核酸定量化、配列決定最適化、遺伝子発現の検出、遺伝子発現の定量化、エピジェネティック適用及びゲノム又は発現されたマーカーの単一細胞解析を含めた種々の異なる分子生物学適用にとって有用であり得る。更に、本開示の方法及び組成物は、種々の遺伝病及び非遺伝病及び癌を含めた障害の同定、検出、診断、治療、ステージ分類又はリスク予測を含めた多数の医学適用を有する。
II.ビーズ又は粒子
本開示の方法、組成物、デバイス及びキットは、ゲルビーズ及びその他の種類のビーズを含めた、任意の適したビーズ又は粒子とともに使用してもよい。ビーズは、本明細書に記載される方法に従って送達されるべき試薬の担体として役立ち得る。特に、これらのビーズは、試薬が放出可能に付着している表面又は試薬が取り込まれるか、そうでなければ、放出可能に区画化される容量を提供し得る。次いで、これらの試薬は、所望の方法に従って、例えば、個別の区画への試薬の制御された送達で送達され得る。さまざまな異なる試薬又は試薬の種類をビーズと会合することができ、このような試薬を区画に送達しようと望むことができる。このような試薬の限定されない例として、例えば、酵素、ポリペプチド、抗体又は抗体断片、標識試薬、例えば、色素、フルオロフォア、クロモフォアなど、核酸、ポリヌクレオチド、オリゴヌクレオチド及び前記のうち2種以上の任意の組合せが挙げられる。一部の場合には、ビーズは、オリゴヌクレオチド配列を合成又は付着させる表面を提供し得る。オリゴヌクレオチド、バーコード配列、プライマー、架橋剤などを含めた種々の実体を、ビーズの外表面と会合させてもよい。多孔性ビーズの場合には、実体をビーズの外表面及び内表面の両方と会合させてもよい。実体は、ビーズの表面に直接付着させてもよく(例えば、共有結合、イオン結合、ファンデルワールス相互作用などによって)、ビーズの表面に付着しているその他のオリゴヌクレオチド配列(例えば、アダプター又はプライマー)に付着させてもよく、ビーズの内部中に拡散させてもよく、及び/又は区画(例えば、流体液滴)中のビーズと組み合わせてもよい。好ましい実施形態では、オリゴヌクレオチドは、ビーズのポリマーマトリックス内の部位と共有結合によって付着しており、したがって、ビーズの内部内及び外部に存在する。一部の場合には、細胞又は核酸などの実体は、ビーズ内に封入される。増幅試薬(例えば、PCR試薬、プライマー)を含めたその他の実体をビーズ中に拡散させてもよく、又はビーズの内部内に化学的に連結させてもよい(例えば、孔、ポリマーマトリックスへの共有結合による付着によって)。
ビーズは、実体又はサンプルを局在化させるよう働き得る。一部の実施形態では、実体(例えば、オリゴヌクレオチド、バーコード配列、プライマー、架橋剤、アダプターなど)をビーズの外表面及び/又は内表面と会合させてもよい。一部の場合には、実体は、ビーズ中のいたるところにあり得る。一部の場合には、実体を、ビーズの全表面と、又はビーズの表面の少なくとも半分と会合させてもよい。
ビーズは、オリゴヌクレオチド配列を合成するための支持体として働き得る。一部の実施形態では、オリゴヌクレオチドの合成は、ライゲーション工程を含み得る。一部の場合には、オリゴヌクレオチドの合成は、2つの小さいオリゴヌクレオチドを一緒にライゲーションする工程を含み得る。一部の場合には、プライマー伸長又はその他の増幅反応を使用し、ビーズに付着しているプライマーによってビーズ上にオリゴヌクレオチドを合成してもよい。このような場合には、ビーズに付着しているプライマーは、鋳型ヌクレオチド配列も含有するオリゴヌクレオチドのプライマー結合部位とハイブリダイズし得る。次いで、プライマー伸長反応又はその他の増幅反応によってプライマーを伸長させることができ、それによって、鋳型オリゴヌクレオチドと相補的であるオリゴヌクレオチドを、ビーズに付着させることができる。一部の場合には、ビーズと会合している同一オリゴヌクレオチドのセットを、同一オリゴヌクレオチドが各々、オリゴヌクレオチドの多様なセットの異なるメンバーに付着されるよう、多様なオリゴヌクレオチドのセットにライゲーションしてもよい。他の場合には、ビーズと会合している多様なオリゴヌクレオチドのセットを、同一オリゴヌクレオチドのセットにライゲーションしてもよい。
ビーズの特徴
本開示の方法、組成物、デバイス及びキットは、任意の適したビーズとともに使用してもよい。一部の実施形態では、ビーズは、多孔性であっても、非多孔性であっても、固体、半固体、半流体又は流体であってもよい。一部の実施形態では、ビーズは、溶解可能、破壊可能又は分解可能であり得る。一部の場合には、ビーズは、分解可能でない場合もある。一部の実施形態では、ビーズは、ゲルビーズであり得る。ゲルビーズは、ヒドロゲルビーズであり得る。ゲルビーズは、ポリマー又はモノマー種などの分子前駆体から形成され得る。半固体ビーズは、リポソームビーズであり得る。固体ビーズは、酸化鉄、金及び銀を含めた金属を含み得る。一部の場合には、ビーズは、シリカビーズである。一部の場合には、ビーズは、強固である。一部の場合には、ビーズは、柔軟性であり得る。
一部の実施形態では、ビーズは、分子前駆体(例えば、モノマー又はポリマー)を含有し得、これが、前駆体の重合によってポリマーネットワークを形成し得る。一部の場合には、前駆体は、例えば、化学的架橋結合によってさらなる重合を受けることが可能であるすでに重合された種であり得る。一部の場合には、前駆体は、1種以上のアクリルアミド又はメタクリルアミドモノマー、オリゴマー又はポリマーを含む。一部の場合には、ビーズは、プレポリマーを含み得、これは、さらなる重合が可能なオリゴマーである。例えば、ポリウレタンビーズは、プレポリマーを使用して調製され得る。一部の場合には、ビーズは、更に一緒に重合され得る個々のポリマーを含有し得る。一部の場合には、ビーズは、異なる前駆体の重合によって作製され得、その結果、それらは、混合ポリマー、コポリマー及び/又はブロックコポリマーを含む。
ビーズは、天然及び合成ポリマーを含めた天然及び/又は合成材料を含み得る。天然ポリマーの例として、タンパク質及び糖類、例えば、デオキシリボ核酸、ゴム、セルロース、デンプン(例えば、アミロース、アミロペクチン)、タンパク質、酵素、多糖、絹、ポリヒドロキシアルカノエート、キトサン、デキストラン、コラーゲン、カラギーナン、イスパキュラ、アラビアガム、寒天、ゼラチン、セラック、ステルキュリアガム、キサンタンガム、コーンシュガーガム、グアーガム、カラヤガム、アガロース、アルギン酸、アルギネート又はそれらの天然ポリマーが挙げられる。合成ポリマーの例として、アクリル樹脂、ナイロン、シリコン、スパンデックス、ビスコースレーヨン、ポリカルボン酸、ポリビニルアセテート、ポリアクリルアミド、ポリアクリレート、ポリエチレングリコール、ポリウレタン、ポリ乳酸、シリカ、ポリスチレン、ポリアクリロニトリル、ポリブタジエン、ポリカーボネート、ポリエチレン、ポリエチレンテレフタレート、ポリ(クロロトリフルオロエチレン)、ポリ(エチレンオキシド)、ポリ(エチレンテレフタレート)、ポリエチレン、ポリイソブチレン、ポリ(メチルメタクリレート)、ポリ(オキシメチレン)、ポリホルムアルデヒド、ポリプロピレン、ポリスチレン、ポリ(テトラフルオロエチレン)、ポリ(ビニルアセテート)、ポリ(ビニルアルコール)、ポリ(ビニルクロリド)、ポリ(ビニリデンジクロリド)、ポリ(ビニリデンジフルオリド)、ポリ(ビニルフルオリド)及びそれらの組合せ(例えば、コポリマー)が挙げられる。ビーズはまた、脂質、ミセル、セラミック、ガラス-セラミック、複合材料、金属、その他の無機材料などを含めた、ポリマー以外の材料から形成されてもよい。
一部の場合には、化学架橋剤は、モノマーの重合の際にモノマーを架橋するために使用される前駆体であり得、及び/又はビーズを種を用いて官能化するために使用され得る。一部の場合には、さらなる重合されたネットワークを生成するために、ポリマーを架橋剤種又はその他の種類のモノマーを用いて更に重合してもよい。化学的架橋剤(本明細書において「架橋剤(crosslinker)」又は「架橋作用物質(crosslinker agent)」とも呼ばれる)の限定されない例として、シスタミン、グルテルアルデヒド、ジメチルスベリミデート、N-ヒドロキシスクシンイミド架橋剤BS3、ホルムアルデヒド、カルボジイミド(EDC)、SMCC、スルホ-SMCC、ビニルシラン(vinylsilance)、N,N'ジアリル酒石酸ジアミド(DATD)、N,N'-ビス(アクリロイル)シスタミン(BAC)又はそれらの相同体が挙げられる。一部の場合には、本開示において使用される架橋剤は、シスタミンを含有する。
架橋結合は、使用される特定の架橋剤に応じて永久的なものである場合も、可逆性である場合もある。可逆性架橋結合は、ポリマーが、適当な条件下で直鎖状化又は解離することを可能にし得る。一部の場合には、可逆性架橋結合は、ビーズの表面と結合している材料の可逆的付着を可能にし得る。一部の場合には、架橋剤は、ジスルフィド結合を形成し得る。一部の場合には、ジスルフィド結合を形成する化学的架橋剤は、シスタミン又は修飾シスタミンであり得る。一部の実施形態では、ジスルフィド結合は、分子前駆体単位(例えば、モノマー、オリゴマー又は直鎖状ポリマー)間に形成され得る。一部の実施形態では、ジスルフィド結合は、分子前駆体単位(例えば、モノマー、オリゴマー又は直鎖状ポリマー)又はビーズ中に組み込まれた前駆体とオリゴヌクレオチドの間に形成され得る。
シスタミン(修飾シスタミンを含む)は、例えば、ビーズの個々のモノマー又はポリマー前駆体間の架橋作用物質として使用され得る、ジスルフィド結合を含む有機物質である。ポリアクリルアミドは、シスタミン又はシスタミンを含む種(例えば、修飾シスタミン)の存在下で重合されて、ジスルフィド結合を含むポリアクリルアミドゲルビーズ(例えば、化学的に還元可能な架橋剤を含む化学的に分解可能なビーズ)を生成し得る。ジスルフィド結合は、ビーズを還元剤に曝露した際に、ビーズが分解(又は溶解)されることを可能にし得る。
少なくとも1つの代替例では、キトサン、直鎖状多糖ポリマーは、グルタルアルデヒドを用い、親水性鎖によって架橋されて、ビーズを形成し得る。キトサンポリマーの架橋結合は、熱、圧力、pHの変化及び/又は放射線照射によって開始される化学反応によって達成され得る。
一部の実施形態では、ビーズは、ポリマー前駆体(例えば、モノマー、オリゴマー、直鎖状ポリマー)、オリゴヌクレオチド、プライマー及びその他の実体間に共有結合又はイオン結合を含み得る。一部の場合には、共有結合は、炭素-炭素結合又はチオエーテル結合を含む。
一部の場合には、ビーズは、アクリダイト部分を含んでもよく、これは、ある特定の態様では、ビーズに、1種以上の種(例えば、バーコード配列、プライマー、その他のオリゴヌクレオチド)を付着させるために使用され得る。一部の場合には、アクリダイト部分は、アクリダイトの1種以上の種との反応、例えば、重合反応の際のアクリダイトのその他のモノマー及び架橋剤との反応などから生じたアクリダイト類似体を指す場合もある。アクリダイト部分は、付着されるべき種、例えば、オリゴヌクレオチド(例えば、バーコード配列、プライマー、その他のオリゴヌクレオチド)と化学結合を形成するよう修飾されていてもよい。例えば、アクリダイト部分は、ジスルフィド結合を形成可能なチオール基を用いて修飾されてもよく、又はジスルフィド結合をすでに含む基を用いて修飾されてもよい。チオール又はジスルフィド(ジスルフィド交換による)が、付着されるべき種の固定点として使用されてもよく、又はアクリダイト部分の別の部分が付着のために使用されてもよい。一部の場合には、付着は、可逆性であり、その結果、ジスルフィド結合が破壊されると(例えば、還元剤の存在下で)、その物質は、ビーズから放出される。他の場合には、アクリダイト部分は、付着のために使用され得る反応性ヒドロキシル基を含む。
その他の種、例えば、核酸の付着のためのビーズの官能化は、ポリマー内の化学基の活性化、ポリマー構造中への活性な又は活性化可能な官能基の組込み又はビーズ製造のプレポリマー又はモノマー段階での付着を含めた、さまざまな異なるアプローチによって達成してよい。
例えば、一部の例では、重合されてビーズを形成する前駆体(例えば、モノマー、架橋剤)は、アクリダイト部分を含んでもよく、その結果、ビーズが生成すると、ビーズはまた、アクリダイト部分も含む。アクリダイト部分は、ビーズ中に組み込まれるよう望まれるプライマー(例えば、標的核酸を増幅すること及び/又は標的核酸バーコード配列を配列決定すること、配列を結合することなどのうち1つ以上に対するプライマー))などのオリゴヌクレオチド配列と付着していることが多い。一部の場合には、プライマーは、P5配列を含む。例えば、アクリルアミド前駆体(例えば、架橋剤、モノマー)は、アクリダイト部分を含んでもよく、その結果、それらがビーズを形成するよう重合されると、ビーズはまた、アクリダイト部分も含む。
一部の場合には、モノマー及び架橋剤などの前駆体は、例えば、単一オリゴヌクレオチド(例えば、プライマー又はその他の配列など)又はその他の種を含んでもよい。図29Aは、アクリダイト部分及びジスルフィド結合によってアクリダイト部分と連結している単一のP5配列を含む例示的モノマーを表す。一部の場合には、モノマー及び架橋剤などの前駆体は、複数のオリゴヌクレオチド、その他の配列又はその他の種を含んでもよい。図29Bは、各々、ジスルフィド結合によってP5プライマーと連結している複数のアクリダイト部分を含む例示的モノマーを表す。更に、図29Cは、各々、ジスルフィド結合によってP5種と連結している複数のアクリダイト部分を含む例示的架橋剤を表す。各前駆体中に複数のアクリダイト部分又はその他のリンカー種を含むことは、各前駆体が、ロードされる種の複数のコピーを含み得るので、連結している種(例えば、オリゴヌクレオチド)の、前駆体から作製されたビーズへのローディングを改善し得る。
一部の場合には、反応性であるか、又は反応性になるよう活性化することが可能である官能基を含む前駆体を、その他の前駆体を用いて重合して、活性化された、又は活性化可能な官能基を含むゲルビーズを作製できる。次いで、官能基を使用して、ゲルビーズにさらなる種(例えば、ジスルフィドリンカー、プライマー、その他のオリゴヌクレオチドなど)を付着させてもよい。例えば、図31に示されるように、カルボン酸(COOH)基を含む一部の前駆体を、その他の前駆体とともに同時に重合して、COOH官能基も含むゲルビーズを形成することができる。一部の場合には、アクリル酸(遊離COOH基を含む種)、アクリルアミド及びビス(アクリロイル)シスタミンを一緒に同時に重合して、遊離COOH基を含むゲルビーズを作製することができる。ゲルビーズのCOOH基は、反応性である(例えば、EDC/NHS又はDMTMMが活性化のために使用される場合にアミン官能基に対して反応性である)よう、活性化され得る(例えば、図31に示されるように、1-エチル-3-(3-ジメチルアミノプロピル)カルボジイミド(EDC)及びN-ヒドロキシスクシンイミド(NHS)又は4-(4,6-ジメトキシ-1,3,5-トリアジン-2-イル)-4-メチルモルホリニウムクロリド(DMTMM)によって)。次いで、活性化されたCOOH基を、ビーズと連結される部分を含む適当な種(例えば、カルボン酸基が、アミン官能基と反応性であるよう活性化される、アミン官能基を含む種)と反応させてもよい。
ジスルフィド結合によってP5プライマーと連結しているアミン基を含む例示的種(例えば、H2N-C6-S-S-C6-P5)を図31に示す。ゲルビーズのCOOH官能基を、EDC/NHS又はDMTMMを用いて活性化して、1つ以上のCOOH部位でアミン反応性の種を生成することができる。図31に示すように、種H2N-C6-S-S-C6-P5部分のアミン基を、活性化されたカルボン酸と反応させることができ、その結果、部分及び付着しているP5オリゴヌクレオチドは、ビーズに共有結合で連結しているようになる。未反応COOH種を、ブロックされるようにその他の種に変換してもよい。
ポリマーネットワーク中にジスルフィド結合を含むビーズを、さらなる種を用い、ジスルフィド結合の一部の遊離チオールへの還元によって官能化してもよい。ジスルフィド結合は、例えば、還元剤(例えば、DTT、TCEPなど)の、ビーズの溶解を伴わずに遊離チオール基を生成する作用によって還元され得る。次いで、ビーズの遊離チオールを、別のジスルフィド結合を含む種と反応させることができ(例えば、チオール-ジスルフィド交換によって))、その結果、種はビーズに連結され得る(例えば、生じたジスルフィド結合によって)。しかし、一部の場合には、ビーズの遊離チオールは、任意のその他の適した基と反応し得る。例えば、ビーズの遊離チオールは、アクリダイト部分を含む種と反応し得る。ビーズの遊離チオール基は、マイケル付加化学によってアクリダイトと反応でき、その結果、アクリダイトを含む種がビーズに連結される。一部の場合には、例えば、N-エチルマレイミド(N-ethylmalieamide)又はヨードアセテートなどのチオールキャッピング剤を含めることによって、未制御の反応を防ぐことができる。
ビーズ内のジスルフィド結合の活性化は、少数のジスルフィド結合のみが活性化されるように制御することができる。制御は、例えば、遊離チオール基を生成するために使用される還元剤の濃度及び/又はビーズ重合においてジスルフィド結合を形成するために使用される試薬の濃度を制御することによって行えばよい。一部の場合には、還元のために、低濃度(例えば、約10000、100000、1000000、10000000、100000000、1000000000、10000000000又は100000000000未満の還元剤の分子:ゲルビーズ比)の還元剤を使用してもよい。遊離チオールに還元されるジスルフィド結合の数を制御することは、官能化の際にビーズ構造完全性を確実にすることにおいて有用であり得る。一部の場合には、蛍光色素などの光学活性な薬剤を、ビーズの遊離チオール基を介してビーズに結合し、ビーズ中に存在する遊離チオールの数を定量化する、及び/又はビーズを追跡するために使用してもよい。
ジスルフィド結合を含むゲルビーズを官能化するための例示的スキームを、図35Aに示す。示されるように、例えば、本明細書に記載される方法のいずれかを使用して、ジスルフィド結合を含むビーズ3501(例えば、ゲルビーズ)を作製することができる。ビーズ分解に適していない濃度の還元剤3502(例えば、DTT、TCEP又は本明細書に記載される任意のその他の還元剤)の作用の際に、ゲルビーズ3501ジスルフィド結合の一部が、遊離チオールに還元されて、遊離チオール基を含むビーズ3503が生成し得る。還元剤を除去すると(例えば、洗浄によって)3504、ビーズ3503を、ジスルフィド結合によってアクリダイトと連結している、ロードされる種(例えば、示されるP5オリゴヌクレオチド、但し、種は別の種類のポリヌクレオチド、例えば、P5、バーコード配列、R1及びランダムN merを含むオリゴヌクレオチドなどであってもよい)を含むアクリダイト-S-S-種部分3505と反応させることができる。部分3505は、マイケル付加化学によってゲルビーズ3503と結合し、部分3505を含むビーズ3506を作製できる。次いで、不要の(例えば、付着していない)種を除去することによって、作製されたビーズ3506を精製できる(例えば、洗浄によって)。
ジスルフィド結合を含むゲルビーズを官能化するための別の例示的スキームを図35Bに示す。示されるように、例えば、本明細書に記載される方法のいずれかを使用して、ジスルフィド結合を含むビーズ3501(例えば、ゲルビーズ)を、作製することができる。ビーズ分解に適していない濃度の還元剤3502(例えば、DTT、TCEP又は本明細書に記載される任意のその他の還元剤)の作用の際に、ゲルビーズ3501ジスルフィド結合の一部が、遊離チオールに還元されて、遊離チオール基を含むビーズ3503を作製し得る。還元剤を除去すると(例えば、洗浄によって)3504、ビーズ3503を、2,2'-ジチオピリジン3507と反応させて、ジスルフィド結合によってピリジン部分と連結している、ゲルビーズ3509を作製できる。2,2'-ジチオピリジンの代替物として、4,4'-ジチオピリジン又は5,5'-ジチオビス-(2-ニトロ安息香酸)(例えば、DTNB又はエルマン試薬)などのその他の同様の種を使用してもよい。2,2'-ジチオピリジン3507を、ジスルフィド交換によってゲルビーズ3503と結合して、ジスルフィド結合によってビーズ3509と連結しているピリジン部分を含むビーズ3509を作製できる。次いで、ゲルビーズ3509を未反応種から分離することができる(例えば、洗浄によって)。
次いで、精製されたゲルビーズ3509を、ゲルビーズに結合される目的の種(例えば、示されるようなP5オリゴヌクレオチド)及び遊離チオール基を含む部分3508と反応させることができる。一部の場合には、部分3508を、ジスルフィド結合を含む別の種から作製してもよく、その結果、ジスルフィド結合が還元されると(例えば、DTT、TCEPなどといった還元剤の作用によって)、遊離チオール基を有する部分3508が得られる。部分3508は、ビーズ3509のピリジン基とのチオール-ジスルフィド交換に参加して、部分3508を含むゲルビーズ3510を作製できる。ピリジン基は、一般に、良好な脱離基であり、これは、部分3508の遊離チオールとの有効なチオール-ジスルフィド交換を可能にすることができる。次いで、不要な種を除去することによって、生じたビーズ3510を精製することができる(例えば、洗浄によって)。
一部の場合には、ゲルビーズ形成後のゲルビーズへの部分の付加が、有利であり得る。例えば、ゲルビーズ形成後の種の付加は、重合の際に起こり得る鎖転移終結の際の種の喪失を避け得る。更に、重合に、より小さい前駆体(例えば、側鎖基及び連結している部分を含まないモノマー又は架橋剤)を使用してもよく、粘性効果によって鎖末端が増殖することが最小にしか妨げられない可能性がある。一部の場合には、ゲルビーズ合成後の官能化は、ロードされるべき種(例えば、オリゴヌクレオチド)の、損傷を与える可能性がある物質(例えば、フリーラジカル)及び/又は化学環境との曝露を最小にすることができる。一部の場合には、生じたゲルは、温度によって駆動されるビーズの膨張及び崩壊を可能にできる上部臨界溶液温度(UCST)を有し得る。このような官能性は、種を用いるビーズのその後の官能化の間に、種(例えば、プライマー、P5プライマー)がビーズ中に浸潤するのに役立ちうる。ビーズにおける種のローティング割合の制御において製造後官能化も有用であり得、その結果、例えば、ローディング割合のばらつきが最小化される。また、単一バッチ中の種を用いて、複数のビーズを官能化することができるよう、種のローディングをバッチプロセスで実施してもよい。
一部の場合には、前駆体と連結しているアクリダイト部分、前駆体と連結している別の種又は前駆体自体は、例えば、化学的、熱的又は光感受性結合、例えば、ジスルフィド結合、UV感受性結合などといった不安定な結合を含む。アクリダイト部分又は不安定な結合を含むその他の部分がビーズ中に組み込まれると、ビーズもまた、不安定な結合を含み得る。不安定な結合は、例えば、種(例えば、バーコード、プライマーなど)をビーズに可逆的に連結すること(例えば、共有結合で連結すること)においては有用であり得る。一部の場合には、熱的に不安定な結合は、例えば、オリゴヌクレオチドが、ビーズに付着している相補配列とハイブリダイズされる場合には、核酸ハイブリダイゼーションをベースとする付着を含み得、その結果、ハイブリッドの熱融解によって、ビーズ又はマイクロカプセルからオリゴヌクレオチド、例えば、バーコード含有配列が放出される。更に、ゲルビーズへの複数の種類の不安定な結合の付加の結果、多様な刺激に応答可能なビーズが作製される。各種の不安定な結合は、関連刺激(例えば、化学的刺激、光、温度など)に対して感受性であり得、その結果、適当な刺激の適用によって各不安定な結合によるビーズに付着している種の放出を制御することができる。このような官能性は、ゲルビーズからの種の制御された放出において有用であり得る。一部の場合には、例えば、上記されたようなゲルビーズの活性化された官能基によってゲルビーズ形成後に不安定な結合を含む別の種をゲルビーズに連結してもよい。理解されるように、本明細書に記載されたビーズと放出可能に、切断可能に、又は可逆的に付着しているバーコードとして、バーコード分子とビーズの間の連結の切断によって放出されるか、若しくは放出可能な、又は根底にあるビーズ自体の分解によって放出され、バーコードがその他の試薬によって接近されるか、接近可能であることが可能となる、又はその両方であるバーコードが挙げられる。一般に、本明細書において記載されるように放出可能であるバーコードは、一般に、ひとたび放出されると反応のために利用可能であるという点で活性化可能であると呼ばれ得る。したがって、例えば、活性化可能なバーコードは、バーコードをビーズ(又は本明細書に記載されるその他の適した種類の区画)から放出することによって活性化され得る。理解されるであろうが、その他の活性化可能な立体配置も、記載される方法及びシステムとの関連で想定される。特に、ビーズと放出可能に付着している、そうでなければ、会合している活性化可能な基とともに区画中に配置され、その結果、活性化可能な基が、例えば、同時区画化によって所望の試薬のセットに送達されると、所望の試薬と反応され得る試薬が提供され得る。このような活性化可能な基として、ケージング基、除去可能遮断基又は保護基、例えば、光不安定基、熱不安定基又は化学的に除去可能な基が挙げられる。
熱的に切断可能な結合に加えて、ジスルフィド結合及びUV感受性結合、前駆体又はビーズに結合され得る不安定な結合のその他の限定されない例として、エステル結合(例えば、酸、塩基又はヒドロキシルアミンで切断可能)、隣接しているジオール連結(例えば、過ヨウ素酸ナトリウムによって切断可能)、ディールス・アルダー連結(例えば、熱によって切断可能)、スルホン結合(例えば、塩基によって切断可能)、シリルエーテル結合(例えば、酸によって切断可能)、グリコシド結合(例えば、アミラーゼによって切断可能)、ペプチド結合(例えば、プロテアーゼによって切断可能)又はホスホジエステル結合(例えば、ヌクレアーゼ(例えば、DNAase(DNA分解酵素))によって切断可能)が挙げられる。
ビーズは、多様な数のアクリダイト部分と連結され得る。例えば、ビーズは、ビーズと連結している約1、10、100、1000、10000、100000、1000000、10000000、100000000、1000000000又は10000000000個のアクリダイト部分を含み得る。他の例では、ビーズは、ビーズと連結している少なくとも1、10、100、1000、10000、100000、1000000、10000000、100000000、1000000000又は10000000000個のアクリダイト部分を含み得る。例えば、ビーズは、アクリダイト部分などを介してビーズと共有結合で連結している約1、10、100、1000、10000、100000、1000000、10000000、100000000、1000000000又は10000000000個のオリゴヌクレオチドを含み得る。他の例では、ビーズは、アクリダイト部分などを介してビーズと共有結合で連結している少なくとも1、10、100、1000、10000、100000、1000000、10000000、100000000、1000000000又は10000000000個のオリゴヌクレオチドを含み得る。
重合に関与しない種もビーズ作製の際(例えば、前駆体の重合の際)にビーズ中に封入され得る。このような種が、重合反応混合物中に入ることがあり、その結果、作製されたビーズは、ビーズ形成の際に種を含む。一部の場合には、このような種を、形成後にゲルビーズに添加してもよい。このような種として、例えば、オリゴヌクレオチド、本明細書に記載されたものを含めた核酸増幅反応に必要な種(例えば、プライマー、ポリメラーゼ、dNTP、補助因子(例えば、イオン性補助因子))、酵素反応に必要な種(例えば、酵素、補助因子、基質)又は重合、ライゲーション又は消化などの核酸修飾反応に必要な種を挙げることができる。このような種の捕獲は、前駆体の重合の際に生じたポリマーネットワーク密度、ゲルビーズ内のイオン電荷の制御(例えば、重合種と連結しているイオン性種による)によって、又はその他の種の放出によって制御され得る。封入された種は、ビーズ分解の際に、及び/又はビーズから種を放出可能な刺激の適用によってビーズから放出され得る。
ビーズは、均一な大きさ又は不均一な大きさのものであり得る。一部の場合には、ビーズの直径は、約1μm、5μm、10μm、20μm、30μm、40μm、45μm、50μm、60μm、65μm、70μm、75μm、80μm、90μm、100μm、250μm、500μm又は1mmであり得る。一部の場合には、ビーズは、少なくとも約1μm、5μm、10μm、20μm、30μm、40μm、45μm、50μm、60μm、65μm、70μm、75μm、80μm、90μm、100μm、250μm、500μm、1mm又はそれ以上の直径を有し得る。一部の場合には、ビーズは、約1μm、5μm、10μm、20μm、30μm、40μm、45μm、50μm、60μm、65μm、70μm、75μm、80μm、90μm、100μm、250μm、500μm又は1mm未満の直径を有し得る。一部の場合には、ビーズは、約40〜75μm、30〜75μm、20〜75μm、40〜85μm、40〜95μm、20〜100μm、10〜100μm、1〜100μm、20〜250μm又は20〜500μmの範囲の直径を有し得る。
特定の好ましい態様では、ビーズは、比較的単分散の大きさ分布を有するビーズの集団として提供される。理解されるように、区画内に比較的一貫した量の試薬を提供することが望ましい一部の適用では、大きさなどの比較的一貫したビーズの特徴を維持することが、その全体的な一貫性に貢献する。特に、本明細書に記載されるビーズは、50%未満、40%未満、30%未満、20%未満、一部の場合には、15%未満、10%未満又は更には5%未満の断面の直径における変動の係数を有する大きさ分布を有し得る。
ビーズは、規則的な形状又は不規則的な形状のものであり得る。ビーズの形状の例として、球状、非球状、楕円形、長円形、無定形、環状、円筒形及びそれらの相同体が挙げられる。
分解可能なビーズ
ビーズと、会合している分子、例えば、上記のバーコード含有オリゴヌクレオチドとの間の切断可能な結合に加えて、又はその代替として、ビーズは、自発的に、又は1種以上の刺激(例えば、温度変化、pH変化、特定の化学種又は相に対する曝露、光、還元剤に対する曝露など)に曝露されると、分解可能、破壊可能又は溶解可能であり得る。一部の場合には、ビーズは、溶解可能であり得、その結果、特定の化学種又は例えば、温度若しくはpHなどの環境変化に曝露されると、ビーズの材料構成成分が可溶化される。例えば、ゲルビーズは、高温下で、及び/又は塩基性条件において分解又は溶解され得る。一部の場合には、ビーズは、ビーズが、温度(例えば、熱)の適当な変化に曝露されると、ビーズが分解するよう熱的に分解可能であり得る。種(例えば、核酸種)と結合しているビーズの分解又は溶解は、ビーズからの種の放出をもたらし得る。
分解可能なビーズは、不安定な結合を有する1種以上の種を含み得、その結果、ビーズ/種が適当な刺激に曝露されると、結合が破壊され、ビーズが分解する。不安定な結合は、化学結合(例えば、共有結合、イオン結合)である場合も、別の種類の物理的相互作用(例えば、ファンデルワールス相互作用、双極子間相互作用など)である場合もある。一部の場合には、ビーズを作製するために使用される架橋剤は、不安定な結合を含み得る。適当な条件に曝露すると、不安定な結合は、破壊され、ビーズは、分解される。例えば、ポリアクリルアミドゲルビーズは、シスタミン架橋剤を含み得る。ビーズを還元剤に曝露すると、シスタミンのジスルフィド結合が破壊され、ビーズは分解される。
分解可能なビーズは、適当な刺激が、ビーズに加えられる場合に、付着している種(例えば、オリゴヌクレオチド、バーコード配列)を、ビーズからより迅速に放出することにおいて有用であり得る。例えば、多孔性ビーズの内表面と結合している種について、又は封入された種の場合には、種は、ビーズの分解の際に、溶液中で大きな移動性及びその他の種との接触性を有し得る。一部の場合には、種はまた、分解可能なリンカー(例えば、ジスルフィドリンカー)を介して分解可能なビーズに付着させることができる。分解可能なリンカーは、分解可能なビーズと同一の刺激に対して反応する場合も、2種の分解可能な種が、異なる刺激に対して反応する場合もある。例えば、バーコード配列は、ジスルフィド結合を介して、シスタミンを含むポリアクリルアミドビーズと付着させることができる。バーコードが付いたビーズを還元剤に曝露すると、ビーズは分解し、バーコード配列とビーズの間のジスルフィド結合及びビーズ中のシスタミンのジスルフィド結合の両方の分解の際にバーコード配列が放出される。
分解可能なビーズを、エマルジョンの液滴又はウェルなどの区画中に導入することができ、その結果、適当な刺激が加えられると、ビーズが区画内で分解し、任意の会合している種が液滴内に放出される。遊離種は、その他の種と相互作用し得る。例えば、シスタミンを含み、バーコード配列とジスルフィド結合を介して連結しているポリアクリルアミドビーズを、油中水型エマルジョンの液滴内で還元剤と組み合わせることができる。液滴内で、還元剤は、種々のジスルフィド結合を破壊し、ビーズの分解をもたらし、液滴の水性内環境中にバーコード配列を放出する。別の例では、塩基性溶液中のビーズが結合しているバーコード配列を含む液滴の加熱もまた、ビーズ分解及び付着しているバーコード配列の、液滴の水性内環境への放出をもたらし得る。
上記の開示から理解されるように、上記のように、多くの場合には、ビーズの分解と呼ばれながら、分解は、物理的ビーズ自体を構造的に分解することを伴う及び伴わない、ビーズからの結合された又は同伴された種の解離を指し得る。例えば、同伴された種は、例えば、化学環境を変更することによる浸透圧差によってビーズから放出され得る。例として、浸透圧差によるビーズ孔径の変更は、一般に、ビーズ自体の構造的分解を伴わずに起こり得る。一部の場合には、ビーズの浸透圧的膨張による孔径の増大は、ビーズ内の同伴された種の放出を可能にし得る。他の場合には、ビーズの浸透圧的萎縮は、孔径収縮によってビーズが同伴された種を良好に保持するようにし得る。
理解されるように、分解可能なビーズが提供される場合には、未熟なビーズの分解及び例えば、不十分な流れの特徴、クランピング及び凝集を含めた、このような分解から起こる事柄を避けるために、所望の時間の前に、このような分解を引き起こす1つ以上の刺激にこのようなビーズを曝露することを避けることが望ましい場合がある。例として、ビーズがジスルフィド基などの還元可能な架橋結合基を含む場合には、このようなビーズを還元剤、例えば、DTT又はその他のジスルフィド切断試薬と接触させることを避けることが望ましい場合がある。このような場合には、DTTなどの還元剤を含まないよう、本明細書に記載されるビーズへの処理が、一部の場合には提供される。還元剤は、市販の酵素調製物中に提供されることが多いので、本明細書に記載されるビーズの処理では、還元剤不含(又はDTT不含)酵素調製物を提供することが望ましいことが多い。このような酵素の例として、例えば、ポリメラーゼ酵素調製物、リガーゼ酵素調製物並びに本明細書に記載されるビーズを処理するために使用され得る多数のその他の酵素調製物が挙げられる。「還元剤不含」又は「DTT不含」調製物とは、調製物が、ビーズの分解において使用されるこのような材料の下方範囲の1/10未満、1/50未満更には1/100未満を有することを意味する。例えば、DTTについて、還元剤不含調製物は、通常、0.01mM、0.005mM、0.001mM DTT、0.0005mM DTT未満又は更には0.0001mM未満のDTT又はそれ以下を有する。多くの場合には、DTTの量は、検出不能となる。
ビーズを分解する方法
一部の場合には、刺激が、ビーズの分解を引き起こすために使用され得、これが、ビーズからの内容物の放出をもたらし得る。一般に刺激は、共有結合又はその他の種類の物理的相互作用の分解などのビーズ構造の分解を引き起こし得る。これらの刺激は、ビーズが分解し、及び/又は内容物を放出することを誘導することにおいて有用であり得る。使用され得る刺激の例として、以下により十分に記載されるような、化学的刺激、熱的刺激、光刺激及びそれらの任意の組合せが挙げられる。
多数の化学トリガーが、ビーズの分解を引き起こすために使用され得る。これらの化学変化の例として、それだけには限らないが、ビーズ内の成分の完全性のpH媒介性変化、架橋結合の切断によるビーズの成分の分解及びビーズの成分の脱重合を挙げることができる。
一部の実施形態では、ビーズは、BAC又はシスタミンなどの分解可能な化学的架橋剤を含む材料から形成され得る。このような分解可能な架橋剤の分解は、いくつかの機序によって達成され得る。一部の例では、ビーズを、酸化、還元又はその他の化学変化を誘導し得る化学的分解剤と接触させることができる。例えば、化学的分解剤は、ジチオトレイトール(DTT)などの還元剤であり得る。還元剤のさらなる例として、β-メルカプトエタノール、(2S)-2-アミノ-1,4-ジメルカプトブタン(ジチオブチルアミン又はDTBA)、トリス(2-カルボキシエチル)ホスフィン(TCEP)又はそれらの組合せを挙げることができる。還元剤は、ビーズを形成するゲル前駆体間に形成されるジスルフィド結合を分解し、ひいては、ビーズを分解し得る。他の場合には、pHの増大などの溶液のpHの変化が、ビーズの分解を引き起こし得る。他の場合には、水などの水溶液に対する曝露が、加水分解性分解、ひいてはビーズの分解を引き起こし得る。
ビーズはまた、熱的刺激を加える際にその内容物を放出するよう誘導され得る。温度の変化は、ビーズの種々の変化を引き起こし得る。例えば、熱は、固体ビーズを液化させ得る。熱の変化は、ビーズの融解を引き起こし得、その結果、ビーズの一部が分解する。他の場合には、熱は、ビーズ構成成分の内部圧力を増大し得、その結果、ビーズが破裂又は爆発する。熱はまた、ビーズを構築するための材料として使用される熱感受性ポリマーに作用し得る。
本開示の方法、組成物、デバイス及びキットは、ビーズを分解するための任意の適した薬剤とともに使用され得る。一部の実施形態では、ビーズ内の熱感受性又はpH感受性結合を分解するために、温度又はpHの変化が使用され得る。一部の実施形態では、化学的分解剤は、酸化、還元又はその他の化学変化によってビーズ内の化学結合を分解するために使用され得る。例えば、化学的分解剤は、DTTなどの還元剤であり得、DTTは、架橋剤とゲル前駆体の間に形成されるジスルフィド結合を分解し、ひいては、ビーズを分解し得る。一部の実施形態では、ビーズを分解するために還元剤が添加され得、これは、ビーズにその内容物を放出させる場合も放出させない場合もある。還元剤の例として、ジチオトレイトール(DTT)、β-メルカプトエタノール、(2S)-2-アミノ-1,4-ジメルカプトブタン(ジチオブチルアミン又はDTBA)、トリス(2-カルボキシエチル)ホスフィン(TCEP)又はそれらの組合せを挙げることができる。還元剤は、0.1mM、0.5mM、1mM、5mM又は10mMで存在し得る。還元剤は、0.1mM、0.5mM、1mM、5mM、10mMを超えて又はそれ以上で存在し得る。還元剤は、0.1mM、0.5mM、1mM、5mM又は10mM未満で存在し得る。
分解工程のタイミング
ビーズは分解されて、ビーズ内に付着しており、含有されている内容物を放出し得る。この分解工程は、サンプルがビーズと組み合わされるのと同時に起こり得る。この分解工程は、サンプルが、マイクロ流体デバイスにおいて形成され得る流体液滴内のビーズと組み合わされるのと同時に起こり得る。この分解工程は、サンプルが、マイクロ流体デバイスにおいて形成され得る流体液滴内のビーズと組み合わされた後に起こり得る。理解されるように、多くの適用では、分解工程は起こらない場合もある。
還元剤は、サンプルと、次いで、ビーズと組み合わされ得る。一部の場合には、還元剤は、サンプルと同時にマイクロ流体デバイスに導入され得る。一部の場合には、還元剤は、サンプルが導入された後にマイクロ流体デバイスに導入され得る。一部の場合には、サンプルは、マイクロ流体デバイス中で還元剤と混合され、次いで、マイクロ流体デバイス中でゲルビーズと接触され得る。一部の実施形態では、サンプルは、還元剤と予め混合され、次いで、デバイスに添加され、ゲルビーズと接触されてもよい。
分解可能なビーズは、適当な刺激の適用の際、即時に分解し得る。他の場合には、ビーズの分解は、経時的に起こり得る。例えば、ビーズは、適当な刺激を加える際、即時に又は約0、0.01、0.1、0.5、1、1.5、2.0、2.5、3.0、3.5、4.0、4.5、5.0、5.5、6.0、6.5、7.0、7.5、8.0、8.5、9.0、9.5、10.0、11、12、13、14、15若しくは20分内に分解し得る。他の例では、ビーズは、適切な刺激を加える際、即時に又は最大約0、0.01、0.1、0.5、1、1.5、2.0、2.5、3.0、3.5、4.0、4.5、5.0、5.5、6.0、6.5、7.0、7.5、8.0、8.5、9.0、9.5、10.0、11、12、13、14、15若しくは20分内に分解し得る。
ビーズはまた、サンプルとの組合せに対して種々の時間で分解され得る。例えば、ビーズは、サンプルと組み合わされ、続いて、後のある時点で分解され得る。サンプルのビーズとの組合せとその後のビーズの分解の間の時間は、約0.0001、0.001、0.01、1、10、30、60、300、600、1800、3600、18000、36000、86400、172800、432000又は864000秒であり得る。サンプルのビーズとの組合せとその後のビーズの分解の間の時間は、約0.0001、0.001、0.01、1、10、30、60、300、600、1800、3600、18000、36000、86400、172800、432000、864000秒を超える又はそれ以上であり得る。サンプルのビーズとの組合せとその後のビーズの分解の間の時間は、約0.0001、0.001、0.01、1、10、30、60、300、600、1800、3600、18000、36000、86400、172800、432000又は864000秒未満であり得る。
オリゴヌクレオチドを用いて事前に官能化されたビーズを調製する
本明細書に記載されるビーズは、種々の方法を使用して製造され得る。一部の場合には、ビーズは、分子前駆体(例えば、直鎖状ポリマー、モノマー、架橋剤)を含有する液体から形成され得る。次いで、液体は、重合反応に付され、それによって、ビーズ(又はゲルビーズ)に硬化又はゲル化する。液体はまた、重合の際にビーズ中に組み込まれるようになるオリゴヌクレオチドなどの実体も含有し得る。この組込みは、ビーズとの共有結合による会合であっても非共有結合による会合であってもよい。例えば、一部の場合には、オリゴヌクレオチドは、形成の際にビーズ内に同伴され得る。或いは、それらは、形成の際又は形成後に、ビーズ又はビーズフレームワークに結合されてもよい。オリゴヌクレオチドは、重合プロセスの際にビーズと架橋されるようになるアクリダイト部分に接続されることが多い。一部の場合には、オリゴヌクレオチドは、ジスルフィド結合によってアクリダイト部分に付着される。結果として、ビーズ-アクリダイト-S-S-オリゴヌクレオチド連結を含む組成物が形成される。図4Aは、アクリダイトが連結されたプライマーで官能化されたビーズの例示的図である。
1つの例示的プロセスでは、官能化されたビーズは、複数のポリマー及び/又はモノマーを1種以上のオリゴヌクレオチド、例えば、プライマー(例えば、ユニバーサルプライマー、配列決定プライマー)を含む1種以上のオリゴヌクレオチドなどと混合することによって作製され得る。ポリマー及び/又はモノマーは、アクリルアミドを含み得、ポリマー及び/又はモノマー間にジスルフィド結合が形成し、その結果、硬化したビーズが形成されるように架橋され得る。オリゴヌクレオチドは、硬化したビーズの形成の際に(例えば、同時に)複数のポリマー及び/又はモノマーに共有結合で連結され得るか、又は硬化したビーズの形成後に(例えば、逐次)複数のポリマー及び/又はモノマーに共有結合で連結され得る。一部の場合には、オリゴヌクレオチドは、アクリダイト部分を介してビーズに連結され得る。
ほとんどの場合、ビーズの集団は、ユニバーサルプライマー又はプライマー結合部位などの同一オリゴヌクレオチドを用いて予め官能化される。一部の場合には、ビーズの集団中のビーズは、複数の異なるオリゴヌクレオチドを用いて予め官能化される。これらのオリゴヌクレオチドは、ビーズのその後の処理又は適用において使用するために、種々の異なる機能的配列のいずれかを任意選択で含み得る。機能的配列として、例えば、標的化プライマー配列、ユニバーサルプライマー配列、例えば、サンプル核酸上の多数の種々の位置とハイブリダイズし、そこからの伸長をプライミングできるよう十分に短いプライマー配列若しくはランダムプライマー配列などのプライマー配列、付着若しくは固定化配列、連結配列、ヘアピン配列、タグ付け配列、例えば、バーコード又はサンプルインデックス配列又は種々のその他のヌクレオチド配列のいずれかを挙げることができる。
例として、一部の場合には、ユニバーサルプライマー(例えば、P5又はその他の適したプライマー)は、さらなる内容物(例えば、バーコード、ランダムN mer、その他の機能的配列)をビーズに付着するための各ビーズ上のプライマーとして使用され得る。一部の場合には、ユニバーサルプライマー(例えば、P5)はまた、配列決定デバイスと適合し得、配列決定デバイス内のフローセルへの所望の鎖の付着を後に可能にし得る。例えば、このような付着又は固定化配列は、配列決定デバイス中のフローセルの表面に繋ぎ止められたオリゴヌクレオチドの相補配列を提供し、配列決定のためにその表面への配列の固定化を可能にし得る。或いは、このような付着配列は、ビーズと付着しているオリゴヌクレオチド配列内に更に提供されてもよく、それに付加されてもよい。一部の場合には、ビーズ及びその付着された種は、配列決定デバイス又はシステムなどのその後の分析プロセスと適合するよう提供され得る。一部の場合には、2つ以上のプライマーをビーズに付着させることができ、2つ以上のプライマーは、例えば、異なる逐次若しくは並行処理工程において、オリゴヌクレオチドの異なる処理を可能にするためのユニバーサル配列並びにその配列に結合された任意のさらなる配列、例えば、標的配列の増幅のための第1のプライマー及び増幅産物を配列決定するための第2のプライマーを含有し得る。例えば、一部の場合には、ビーズに付着しているオリゴヌクレオチドは、増幅されたバーコードが付いた標的配列を作製するための、第1の増幅又は複製プロセス、例えば、標的核酸配列に沿ってプライマーを伸長する工程を実施するための第1のプライマー配列を含む。オリゴヌクレオチド内に配列決定プライマーも含むことによって、得られた増幅された標的配列は、このようなプライマーを含み、配列決定システムに容易に移される。例えば、一部の場合には、例えば、Illumina配列決定システムを使用して、例えば、増幅された標的を配列決定しようとする場合には、R1プライマー又はプライマー結合部位もビーズに付着させてもよい。
ビーズ中に組み込まれた実体は、上記のような種々の機能的配列のいずれかを有するオリゴヌクレオチドを含み得る。例えば、これらのオリゴヌクレオチドは、P5、R1及びR2配列、非切断可能な5'アクリダイト-P5、切断可能な5'アクリダイト-SS-P5、R1c、配列決定プライマー、リードプライマー、ユニバーサルプライマー、P5_U、ユニバーサルリードプライマー及び/又はこれらのプライマーのいずれかの結合部位のうちいずれか1種以上を含み得る。一部の場合には、プライマーは、1種以上の修飾されたヌクレオチドヌクレオチド類似体又はヌクレオチド模倣体を含有し得る。例えば、一部の場合には、オリゴヌクレオチドは、ペプチド核酸(PNA)、ロックド(locked)核酸(LNA)ヌクレオチドなどを含み得る。一部の場合には、これらのオリゴヌクレオチドは、更に、又は或いは、その適用の異なる工程での異なる処理を可能にするよう、異なって処理され得るヌクレオチド又は類似体を含み得る。例えば、一部の場合には、1種以上の機能的配列は、特定のポリメラーゼ酵素によって処理されず、したがって、その酵素を利用するプロセス工程においてコピーされないヌクレオチド又は類似体を含み得る。例えば、例えば、一部の場合には、オリゴヌクレオチドの1種以上の機能的配列構成成分は、例えば、ウラシル含有ヌクレオチド、非天然塩基を含有するヌクレオチド、ブロッカーオリゴヌクレオチド、ブロックされた3'末端、3'ddCTPを含む。図19は、さらなる例を提供する。理解されるように、これらの実体のいずれかの配列は、特定の適用に応じてプライマー又はプライマー結合部位として機能し得る。
重合は、自発的に起こり得る。一部の場合には、重合は、開始剤及び/又は促進剤によって、電磁放射によって、温度変化(例えば、熱の付加又は除去)によって、pH変化によって、その他の方法及びそれらの組合せによって開始され得る。開始剤とは、重合反応において使用される1種以上の前駆体を活性化することによって(例えば、フリーラジカルの生成を介して)重合反応を開始可能な種を指し得る。促進剤は、重合反応が起こる速度を加速可能な種を指し得る。一部の場合には、促進剤は、使用される開始剤の活性化を加速し(例えば、フリーラジカルの生成を介して)、次いで、モノマーを活性化し(例えば、フリーラジカルの生成を介して)、ひいては、重合反応を開始し得る。一部の場合には、開始剤のより迅速な活性化は、より速い重合速度をもたらし得る。しかし、一部の場合には、促進はまた、非化学的手段、例えば、熱的(例えば、熱の付加及び除去)手段、種々の種類の放射手段(例えば、可視光、UV光など)又は任意のその他の適した手段によっても達成され得る。次いで、重合して硬化ビーズを形成し得る分子前駆体を含有する液滴を作製するために、エマルジョン技術を使用してもよい。例えば、分子前駆体を水溶液に添加してもよい。次いで、水溶液をオイルを用いて乳化してもよい(例えば、撹拌、マイクロ流体液滴発生装置又はその他の方法によって)。分子前駆体は、次いで、乳化された液滴中で重合化されて、ビーズを形成し得る。
エマルジョンは、例えば、バルク振盪、バルク撹拌、フローフォーカシング及びマイクロシーブなどの当技術分野で公知の方法を含めた任意の適した方法によって調製され得る(例えば、Weizmannら、Nature Methods、2006、3(7):545〜550; Weitzら米国特許出願公開第2012/0211084号を参照のこと)。一部の場合には、エマルジョンは、マイクロ流体デバイスを使用して調製され得る。一部の場合には、油中水型エマルジョンが使用され得る。これらのエマルジョンは、bis krytox peg (BKP)などのPEG含有化合物を含むKrytox FSHなどのフッ素系化界面活性剤を組み込み得る。一部の場合には、水中油型エマルジョンが使用され得る。一部の場合には、多分散エマルジョンが形成され得る。一部の場合には、単分散エマルジョンが形成され得る。一部の場合には、マイクロ流体フローフォーカシングデバイスにおいて単分散エマルジョンが形成され得る。(Garteckiら、Applied Physics Letters、2004、85(13):2649〜2651)。
少なくとも1つの例では、ビーズを作製するためのマイクロ流体デバイスは、分子前駆体を含有する水溶液とオイルなどの非混和性流体の2種以上の流れを組み合わせる単一交差点で交差するチャネルセグメントを含有し得る。2種の非単一の交差点で非混和性流体を組み合わせることが、流体液滴を形成させ得る。形成される流体液滴の大きさは、流体クロスに入る流体の流れの流速、2種の流体の特性及びマイクロ流体チャネルの大きさに応じて変わり得る。流体クロスを出て流体液滴を形成した後の重合の開始が、流体液滴から硬化ビーズを形成させ得る。ビーズ形成のため及び本明細書において別の場所に論じられるようなビーズの別個の液滴への区画化両方のために、液滴を生成するためのマイクロ流体デバイス、チャネルネットワーク及びシステムの例は、例えば、2014年4月4日に出願され、全ての目的のためにその全体が参照により本明細書に組み込まれる米国特許仮出願第61/977,804号に記載されている。
個々の分子前駆体、オリゴマー又はポリマーが重合し始めて、硬化ビーズを形成する時間を操作するために、開始剤及び/又は促進剤を、ビーズ形成プロセス中の種々の時点で添加することができる。促進剤は、重合プロセスを開始し得(例えば、一部の場合には、重合開始剤の活性化によって)、したがって、ビーズが硬化する時間を減少し得る薬剤であり得る。一部の場合には、重合に単一の促進剤を使用してもよく、複数の促進剤を使用してもよい。加速を注意深く調整することは、適した重合反応を達成することにおいて重要であり得る。例えば、加速が速すぎる場合には、重量及び過剰な鎖移動事象が、不十分なゲル構造及び任意の所望の種の低いローディングを引き起こし得る。加速が遅すぎる場合には、高分子量ポリマーは、ポリマー絡み合い及び高粘度によって捕獲された活性化部位(例えば、フリーラジカル)を生成し得る。高粘度は、ビーズローディングのために意図される種の拡散を妨害し、その結果、種のローディングが低く又は全くなくなる。促進剤作用の調整は、例えば、適当な促進剤、促進剤の適当な組合せを選択することによって、又は適当な促進剤及び促進剤の作用を調節可能な任意の刺激(例えば、熱、電磁放射(例えば、光、UV光)、別の化学種など)を選択することによって達成され得る。開始剤の作用の調整はまた、類似の様式で達成され得る。
促進剤は、水溶性、油溶性であり得、又は水溶性及び油溶性の両方であり得る。例えば、促進剤は、テトラメチルエチレンジアミン(TMEDA又はTEMED)、ジメチルエチレンジアミン、N,N、N,'N'-テトラメチルメタンジアミン、N,N'-ジモルホリノメタン又はN,N,N',N'-テトラキス(2-ヒドロキシプロピル)エチレンジアミンであり得る。例えば、開始剤は、過硫酸アンモニウム(APS)、カルシウムイオン又は図32に示される化合物(I〜IX)のいずれかであり得る。図32に示される化合物(I〜IX)は、水溶性アゾ系開始剤として機能し得る。アゾ系開始剤は、TEMED及びAPSの非存在下で使用されてもよく、熱系開始剤として機能し得る。熱系開始剤は、種を熱によって活性化でき(例えば、フリーラジカルの生成によって)、したがって、開始剤の作用速度は、温度及び/又は開始剤の濃度によって調整され得る。重合促進剤又は開始剤として、ホスホネート、スルホネート、カルボキシレート、ヒドロキシル、アルブミン結合部分、N-ビニル基及びリン脂質を含めた官能基を挙げることができる。重合促進剤又は開始剤は、低分子量モノマー化合物であり得る。促進剤又は開始剤は、a)液滴生成に先立ってオイルに添加され得る、b)液滴生成後にラインに添加され得る、c)液滴生成後に出口リザーバーに添加され得る、又はd)それらの組合せであり得る。
重合はまた、電磁放射によって開始され得る。ある特定の種類のモノマー、オリゴマー又はポリマーは、光感受性特性を含有し得る。したがって、重合は、このようなモノマー、オリゴマー又はポリマーをUV光、可視光、増感剤と組み合わされたUV光、増感剤と組み合わされた可視光又はそれらの組合せに対して曝露することによって開始され得る。増感剤の一例は、リボフラビンであり得る。
ビーズが完全に重合する、又は硬化するための時間は、ビーズの大きさ、促進剤が添加され得るかどうか、促進剤が添加され得る時間、開始剤の種類、電磁放射が適用され得る時間、溶液の温度、ポリマー組成物、ポリマー濃度及びその他の関連パラメータに応じて変わり得る。例えば、重合は、約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19又は20分後に完了され得る。重合は、約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20分を超えて又はそれ以上後に完了され得る。重合は、約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19又は20分未満で完了され得る。
ビーズは、連続相交換によってエマルジョン(例えば、ゲル-水-オイル)から回収することができる。過剰の水性流体をエマルジョン(例えば、ゲル-水-オイル)に添加してもよく、硬化したビーズを沈降に付してもよく、ビーズを凝集させることができ、過剰のオイルを含有する上清を除去することができる。過剰の水性流体を添加し、続いて、沈降させ、過剰のオイルを除去するこのプロセスを、ビーズが、連続相オイルに対して所与の純度の水性バッファー中に懸濁されるまで反復することができる。水性バッファーの純度は、約80%、90%、95%、96%、97%、98%又は99%(v/v)であり得る。水性バッファーの純度は、約80%、90%、95%、96%、97%、98%、99%(v/v)を超えて又はそれ以上であり得る。水性バッファーの純度は、約80%、90%、95%、96%、97%、98%又は99%(v/v)未満であり得る。沈降工程を、約2、3、4又は5回反復してもよい。沈降工程を、約2、3、4、5回を超えて又はそれ以上反復してもよい。沈降工程は、約2、3、4又は5回未満反復してもよい。一部の場合には、沈降及び上清の除去はまた、未反応の出発材料も除去し得る。
液滴発生装置の例として、Nanomi B.V.及びその他のものによって使用されるものなどの単一フローフォーカサー、並行フローフォーカサー及びマイクロシーブメンブレンを含み得る。好ましくは、液滴を生成するためにマイクロ流体デバイスが使用されることが好ましい。
ジスルフィド結合によってP5プライマーと連結しているアクリダイト部分で予め官能化されたゲルビーズを作製するための1つの例示的エマルジョンベースのスキームが、図30に表わされている。図30Aに示されるように、アクリルアミド、ビス(アクリロイル)シスタミン、アクリダイト-S-S-P5部分及び過硫酸アンモニウムを、エマルジョンの液滴中に組み合わせる。TEMEDをエマルジョン油相に添加することができ、液滴中に拡散させて、重合反応を開始させることができる。図30Aに示されるように、過硫酸アンモニウムに対するTEMED作用は、SO4 -フリーラジカルの生成をもたらし、次いで、炭素-炭素二重結合の炭素の一方でのフリーラジカルの生成によってアクリルアミドの炭素-炭素二重結合を活性化し得る。
図30Bに示されるように、活性化されたアクリルアミドは、非活性化アクリルアミドと反応し得(再度、その炭素-炭素二重結合で)、重合を開始し得る。生じた各生成物は、再度、フリーラジカルの形成によって活性化され得、ポリマー成長をもたらす。更に、ビス(アクリロイル)シスタミン架橋剤及びアクリダイト-S-S-P5部分の両方が、活性化された種と反応し得る炭素-炭素二重結合を含み、次いで、生成物自体が、活性化されたようになり得る。図30Cに示されるように、重合反応にビス(アクリロイル)シスタミン架橋剤を含むことは、精製されるポリマー鎖の架橋結合をもたらす。したがって、図30Cに表わされるように、ポリマー主鎖と連結しているアクリダイト-S-S-P5部分を含むヒドロゲルポリマーネットワークが生じ得る。重合反応は、終結するまで継続し得る。反応終結時に、連続相交換又はその他の適した方法を使用して、エマルジョンを破壊し、アクリダイト-S-S-P5部分に結合された架橋されたヒドロゲルを含むゲルビーズ(図30Aに模式的に示される)を得ることができる。
バーコード及びランダムN mer(導入)
ある特定の適用、例えば、ポリヌクレオチド配列決定は、配列を同定するのに、例えば、配列決定された断片から大きな配列をアセンブルするのに、固有の識別子(「バーコード」)に頼る場合がある。したがって、配列決定に先立ってポリヌクレオチド断片にバーコードを付加することが望ましいものであり得る。核酸適用の場合には、このようなバーコードは、通常、サンプル配列に付着しているヌクレオチドの比較的短い配列を含んでなり、バーコード配列は、公知であるか、又はその位置若しくは配列要素によって同定可能である。一部の場合には、固有の識別子は、サンプルインデックス化にとって有用であり得る。しかし、一部の場合には、バーコードもまた、その他の関連において有用であり得る。例えば、バーコードは、処理を通じてサンプルを追跡するために役立ち(例えば、実験室におけるサンプルの位置、複数の反応容器中のサンプルの位置など)、製造情報を提供し、バーコードの性能を経時的に(例えば、使用するためのバーコード製造から)、現場で追跡し、バーコードロット性能を経時的に現場で追跡し、配列決定の間の生成物情報を提供し、恐らくは、生成物と会合しているバーコードが、配列決定の際に読み取られると、自動プロトコール(例えば、コンピュータの補助を得て、自動プロトコールが開始され、実行される)を始動させ、問題のあるバーコード配列又は生成物ロットの問題を追跡して解決し、バーコード及びその組み合わせが絡む反応において分子トリガーとして役立ち得る。特に好ましい態様では、上記で示唆したように、本明細書に記載されるようなバーコード配列セグメントは、2種の別個の決定された核酸配列間のような連鎖情報を提供するために使用され得る。この連鎖情報は、例えば、共通のサンプル、共通の反応容器、例えば、ウェル若しくは区画又は更に共通の出発核酸分子との連鎖を含み得る。特に、所与の反応容量内の特定のサンプル成分又はサンプル構成成分のサブセットに、共通のバーコードを付着させることによって、そのバーコードを有する得られた配列がその反応用量に起因すると考えることができる。順に、サンプルが、その起源のサンプル、その後に曝される処理工程に基づいて、又は個々の分子に基づいてその反応容量に割り当てられる場合には、得られた配列を、その反応容量から生じたとより良好に同定することができる。
バーコードは、バルク合成されたポリヌクレオチドバーコード、無作為に合成されたバーコード配列、マイクロアレイベースのバーコード合成、天然ヌクレオチド、N merを有する部分的相補体、ランダムN mer、偽ランダムN mer又はそれらの組合せを含めた種々の形式から作製することができる。バーコードの合成は本明細書に、及び、例えば、その全開示内容が、全ての目的のためにその全体で参照により本明細書において組み込まれる2014年2月7日に出願された米国特許出願第14/175,973号に記載されている。
上記のように、固有の識別子として機能するバーコード配列セグメントを組み込んでいるオリゴヌクレオチドはまた、さらなる配列セグメントを含み得る。このようなさらなる配列セグメントとして、プライマー配列、プライマーアニーリング部位配列、固定化配列又はその後の処理にとって有用なその他の認識若しくは結合配列、例えば、バーコードを含有するオリゴヌクレオチドが付着されるサンプルの配列決定において使用するための配列決定プライマー又はプライマー結合部位など機能的配列を挙げることができる。更に、本明細書において、特定の機能的配列が、バーコードを含有する配列内に含まれるとの言及は、相補的複製の際に、特定の記載された配列が生じるような任意のこのような配列に対する相補体を含むことも想定した。
一部の例では、バーコード又は部分バーコードを、マイクロアレイ又はビーズアレイなどのオリゴヌクレオチドアレイから得られた、又はそれにおいて使用するのに適したオリゴヌクレオチドから作製することができる。このような場合には、マイクロアレイのオリゴヌクレオチドを切断してもよく(例えば、オリゴヌクレオチドをアレイに固定する切断可能な結合又は部分(光切断可能な、化学的に切断可能な、又はそうでなければ切断可能な結合などの)を使用して)、その結果、遊離オリゴヌクレオチドがバーコード又は部分バーコードとして役立ち得る。一部の場合には、バーコード又は部分バーコードは、アレイから得られ、既知配列のものである。アレイから得られたものを含めた既知配列の使用は、例えば、未知配列のバーコードと関連している配列決定エラーを避けることにおいて有益であり得る。マイクロアレイは、バーコード又は部分バーコードとして使用され得る、少なくとも約10,000,000、少なくとも約1,000,000、少なくとも約900,000、少なくとも約800,000、少なくとも約700,000、少なくとも約600,000、少なくとも約500,000、少なくとも約400,000、少なくとも約300,000、少なくとも約200,000、少なくとも約100,000、少なくとも約50,000、少なくとも約10,000、少なくとも約1,000、少なくとも約100又は少なくとも約10個の異なる配列を提供し得る。
本明細書に提供されるビーズは、固有の識別子(例えば、バーコード)として挙動し得るオリゴヌクレオチド配列に付着させることができる。本明細書において提供されるビーズの集団は、バーコードの多様なライブラリーを含有することが多く、各ビーズは、単一のバーコード配列の複数のコピーと付着している。一部の場合には、バーコード配列は、既知配列を用いて事前に合成され及び/又は設計される。一部の場合には、ライブラリー内の各ビーズは、固有のバーコード配列と付着している。一部の場合には、複数のビーズは、それらを付着している同一のバーコード配列を有する。例えば、一部の場合には、ライブラリー中のビーズの約1%、2%、3%、4%、5%、10%、20%、25%、30%、50%、75%、80%、90%、95%又は100%が、ライブラリー中の異なるビーズと付着しているバーコード配列と同一であるバーコード配列と付着している。ビーズの約1%、2%、3%、4%、5%、10%、20%、25%又は30%が、同一のバーコード配列と付着していることもある。
バーコード配列の長さは、適用に応じて、任意の適した長さであり得る。一部の場合には、バーコード配列は、約2〜約500ヌクレオチドの長さ、約2〜約100ヌクレオチドの長さ、約2〜約50ヌクレオチドの長さ、約2〜約20ヌクレオチドの長さ、約6〜約20ヌクレオチドの長さ又は約4〜16ヌクレオチドの長さであり得る。一部の場合には、バーコード配列は、約2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、85、90、95、100、150、200、250、300、400又は500ヌクレオチドの長さである。一部の場合には、バーコード配列は、約2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、85、90、95、100、150、200、250、300、400、500、750、1000、5000又は10000ヌクレオチドを超える長さである。一部の場合には、バーコード配列は、約2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、85、90、95、100、150、200、250、300、400、500、750又は1000ヌクレオチド未満の長さである。
バーコードは、1個以上のバーコードが、特定のビーズ中に導入されるようにビーズ中にロードされ得る。一部の場合には、各ビーズは、同一セットのバーコードを含有し得る。他の場合には、各ビーズは、異なるセットのバーコードを含有し得る。他の場合には、各ビーズは、同一バーコードのセットを含み得る。他の場合には、各ビーズは、異なるバーコードのセットを含み得る。
本明細書において提供されるビーズは、下流プロセスにおいて、ランダム、偽ランダム又はサンプル(例えば、ゲノムサンプル)を誘導可能な標的化N merであるオリゴヌクレオチド配列に付着させることができる。一部の場合には、単一ビーズ又はビーズ集団に付着しているオリゴヌクレオチド上に同一のn mer配列が存在する。これは、例えば、プライマーが、大きな標的配列内のある特定の配列セグメントを標的とするよう選択される、標的化されたプライミング方法のための場合であり得る。他の場合には、本明細書におけるビーズの集団内の各ビーズは、中でも、鋳型分子に対するこれらのプライマーのサンプリングを多様化するために、大きな、多様な数のN mer配列に付着されるが、これは、このようなランダムN mer配列が、サンプル核酸の種々の部分に対して無作為にプライミングするからである。
N merの長さは変わり得る。一部の場合には、N mer(例えば、ランダムN mer、偽ランダムN mer又は標的化N mer)は、約2から約100ヌクレオチドの間の長さ、約2から約50ヌクレオチドの間の長さ、約2から約20ヌクレオチドの間の長さ、約5から約25ヌクレオチドの間の長さ又は約5から約15ヌクレオチドの間の長さであり得る。一部の場合には、N mer(例えば、ランダムN mer、偽-ランダムN mer又は標的化N mer)は、約2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、85、90、95、100、150、200、250、300、400又は500ヌクレオチドの長さであり得る。一部の場合には、N mer(例えば、ランダムN mer、偽ランダムN mer又は標的化N mer)は、約2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、85、90、95、100、150、200、250、300、400、500、750、1000、5000又は10000ヌクレオチドを超える長さであり得る。一部の場合には、N mer(例えば、ランダムN mer、偽ランダムN mer又は標的化N mer)は、約2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、85、90、95、100、150、200、250、300、400、500、750又は1000ヌクレオチド未満の長さであり得る。
N mer(ランダムN merを含む)を、特定のサンプルの種類をプライミングするために工学的に作製してもよい。例えば、サンプル核酸の種々の種類又はサンプル核酸の種々の領域のために、各N merの長さが、サンプル核酸の種々の種類各々又はサンプル核酸の種々の領域各々に対応するように、種々の長さのN merを作製することができる。例えば、ある種のゲノム(例えば、例えば、ヒトゲノム)を起源とするサンプル核酸のためにある長さのN merを作製することができ、別の種を起源とするサンプル核酸(例えば、例えば、酵母ゲノム)のために別の長さのN merを作製することができる。別の例では、ゲノムの特定の配列領域を含むサンプル核酸のためにある長さのN merを作製することができ、ゲノムの別の配列領域を含むサンプル核酸のために別の長さのN merを作製することができる。更に、N merの長さに加えて又はその代替として、N merの塩基組成物(例えば、N merのGC含量)も、サンプル核酸の特定の種類又は領域に対応するよう工学的に作製することができる。塩基含量は、サンプル核酸の特定の種類において、又はサンプル核酸の特定の領域において変わり得、したがって、例えば、異なる塩基含量のN merが、核酸の異なるサンプルの種類又はサンプル核酸の異なる領域をプライミングするのに有用であり得る。
特定のサンプル種又は特定のサンプル配列領域のために工学的に作製されたN merを有する、本明細書において別の場所に記載されるビーズの集団を作製してもよい。一部の場合には、N merの長さ及び含量に対して、ビーズの混合集団(例えば、あるサンプル種類又は配列領域のために工学的に作製されたN merを含むビーズ及び別のサンプル種類又は配列領域のために工学的に作製された別のN merを含むビーズの混合物)を作製してもよい。一部の場合には、1種以上のビーズが、複数のサンプル種類又は配列領域のための工学的に作製されたN merの混合集団を含み得るビーズの集団を作製してもよい。
先に記載したように、一部の場合には、N merは、ランダムであろうが標的化されたものであろうが、その後の処理工程において改善された性能を有するプライマーを提供するためにヌクレオチド類似体、模倣体又は非天然ヌクレオチドを含み得る。例えば、一部の場合には、n mer配列の相対プライミング効率を増強するために、例えば、増幅の間に熱サイクリングに付された場合に異なる融解/アニーリングプロファイルを有するN merプライマーを提供することが望ましいことであり得る。一部の場合には、天然ヌクレオチドを含む対応するプライマーと比較して、プライマー配列の融解温度プロファイルを変更するために、ヌクレオチド類似体又は非天然ヌクレオチドをN merプライマー配列中に組み込んでもよい。ある特定の場合には、鋳型配列とハイブリダイズされた場合にプライマーに高温安定性を提供する、及び、全般的に増強された二本鎖安定性を提供するために、本明細書に記載されるN mer配列などのプライマー配列は、配列内の1つ以上の位置に修飾されたヌクレオチド又はヌクレオチド類似体、例えば、LNA塩基を含み得る。一部の場合には、プライマー合成においてA又はT塩基の代わりにLNAヌクレオチドが、それらのより弱く結合する塩基を、より堅く結合するLNA類似体を置き換えるために使用される。増強されたハイブリダイズするプライマー配列を提供することによって、このようなプライマーを使用するより高効率の増幅プロセスを作製することができ、種々の温度状況内で作動できる。
上記のオリゴヌクレオチドにその他の修飾を提供してもよい。例えば、一部の場合には、例えば、任意の本エキソヌクレアーゼ活性によるオリゴヌクレオチドの任意の分解を防ぐ又は低減するために、保護された末端又は他の領域を有するオリゴヌクレオチドを提供してもよい。一例では、例えば、3'及び/又は5'末端位置に隣接するか、又は近位にあるオリゴヌクレオチド配列内の1種以上の位置に、1個以上のホスホロチオエートヌクレオチド類似体を有するオリゴヌクレオチドを提供してもよい。オリゴヌクレオチドに対する、例えば、3'-5'及び/又は5'-3'エキソヌクレアーゼを含めたヌクレアーゼ活性を低減又は排除するために、これらのホスホロチオエートヌクレオチドは、通常、オリゴヌクレオチド内のヌクレオチド間連結中の非連結酸素の代わりに硫黄基を提供する。一般に、ホスホロチオエート類似体は、例えば、オリゴヌクレオチドの3'-5'及び/又は5'-3'エキソヌクレアーゼ消化に対する保護を提供することを含めた、それらを含むオリゴヌクレオチドにエキソ及び/又はエンドヌクレアーゼ耐性を付与することにおいて有用である。したがって、一部の態様では、これらの1つ以上のホスホロチオエート結合は、オリゴヌクレオチドの3'又は5'末端いずれかの最後の5〜10個のヌクレオチド間連結のうち1つ以上中にあり、好ましくは、3'-5'又は5'-3'エキソヌクレアーゼ活性に対する保護を提供するためには、最後の3'又は5'末端ヌクレオチド間連結のうち1つ以上及び最後から2番目の5'末端ヌクレオチド間連結を含む。オリゴヌクレオチド内の他の位置に、ホスホロチオエート(phosphorothiate)結合が同様に提供されてもよい。バーコード配列(及び任意の会合している機能的配列)を含むオリゴヌクレオチドにこのような保護を提供することに加え、上記の修飾、例えば、ブロッカー配列内に、例えば、3'及び/又は5'末端位置に隣接して若しくは近位に、並びにおそらくはオリゴヌクレオチド内の他の位置にホスホロチオエート類似体を組み込むことはまた、本明細書に記載されるブロッカー配列の関連で有用である。
予め官能化されたビーズに内容物を付着させる
種々の内容物を、オリゴヌクレオチドを用いて官能化されたビーズを含めた、本明細書に記載されるビーズに付着させることができる。オリゴヌクレオチド、特に、所望の配列(例えば、バーコード、ランダムN mer)を有するオリゴヌクレオチドが付着されることが多い。本明細書において提供される方法の多くでは、オリゴヌクレオチドは、プライマー伸長反応を介してビーズに付着される。プライマーを用いて予め官能化されたビーズを、オリゴヌクレオチド鋳型と接触させることができる。次いで、プライマーが伸長され、その結果、オリゴヌクレオチド鋳型の相補体のコピーが、プライマーに付着されるように増幅反応を実施してもよい。ライゲーション反応などのその他の付着方法も可能である。
一部の場合には、異なる配列(又は同一の配列)を有するオリゴヌクレオチドは、別個の工程でビーズに付着される。例えば、一部の場合には、各ビーズがその上に第1のバーコード配列の複数のコピーを有するように、固有の配列を有するバーコードがビーズに付着される。第2の工程では、ビーズは、第2の配列を用いて更に官能化され得る。第1及び第2の配列の組合せは、ビーズに付着している固有のバーコード又は固有の識別子として役立ち得る。プロセスを、バーコード配列として挙動するさらなる配列(一部の場合には、1、2、3、4、5、6、7、8、9又は10個を超えるバーコード配列が、各ビーズに逐次付加される)を付加するよう継続してもよい。ビーズをまた、例えば、下流の全ゲノム増幅反応のためのランダムプライマーとして作用し得るランダムN merで更に官能化してもよい。
一部の場合には、ある特定のオリゴヌクレオチド配列(例えば、バーコード配列)を用いる官能化後に、ビーズをプールし、次いで、その後ビーズに付着されるランダムN merの大きな集団と接触させてもよい。一部の場合には、特に、ビーズが、ランダムN merの付着に先立ってプールされる場合には、各ビーズは、付着している1個のバーコード配列(多くは、複数のコピーとして)を有するが、付着している多数の異なるランダムN mer配列を有する。図4は、バーコード及びN merなどのオリゴヌクレオチドをビーズに付着させるための1つの例示的方法、例示的限界希釈法の段階的な描写を提供する。
オリゴヌクレオチドをビーズに付着させるために、ビーズが、平均して、1つ以下の、バーコードなどの固有のオリゴヌクレオチド配列に付着されるように限界希釈が使用され得る。このプロセスでは、ビーズは、プライマーなどのある特定のオリゴヌクレオチドを用いてすでに官能化されていることが多い。例えば、プライマー(例えば、ユニバーサルプライマーなど)を用いて官能化されたビーズ及び複数の鋳型オリゴヌクレオチドを、多くは、ビーズ:鋳型オリゴヌクレオチドの高い割合で組み合わせて、ビーズ及び鋳型オリゴヌクレオチドの混合物を生成してもよい。次いで、バルク乳化プロセス、プレート内エマルジョンによって、又は例えば、マイクロ流体液滴発生装置などのマイクロ流体デバイスによって、混合物を複数の区画(例えば、油中水型エマルジョン内の水性液滴)中に区画化してもよい。一部の場合には、平均して、各区画が1つ以下の鋳型オリゴヌクレオチドを含むように混合物を複数の区画中に区画化することができる。
更に、ビーズと付着しているプライマーによって区画内で鋳型オリゴヌクレオチドを増幅させることができる(例えば、プライマー伸長反応によって)。増幅は、増幅された鋳型オリゴヌクレオチドを含むビーズの作製をもたらし得る。増幅後、区画の内容物を共通の容器(例えば、チューブ、ウェルなど)中にプールしてもよい。次いで、増幅された鋳型オリゴヌクレオチドを含むビーズを、例えば、本明細書において別の場所に記載されるような捕捉部分を用いて、又は用いずに、遠心分離及び磁性分離を含めた任意の適した方法によって、区画の他の内容物(増幅された鋳型オリゴヌクレオチドを含まないビーズを含む)から分離してもよい。
増幅された鋳型オリゴヌクレオチドを含むビーズを、さらなる鋳型オリゴヌクレオチドと組み合わせて、ビーズとさらなる鋳型オリゴヌクレオチドとを含むバルク混合物を作製してもよい。さらなる鋳型オリゴヌクレオチドは、ビーズ上の増幅された鋳型オリゴヌクレオチドと少なくとも部分的に相補的である配列を含み得、その結果、さらなる鋳型オリゴヌクレオチドは、増幅された鋳型オリゴヌクレオチドとハイブリダイズする。次いで、増幅された鋳型オリゴヌクレオチドは、増幅反応においてハイブリダイズされるさらなる鋳型オリゴヌクレオチドによって伸長され得、その結果、さらなる鋳型オリゴヌクレオチドの相補体が、増幅された鋳型オリゴヌクレオチドに付着される。さらなる鋳型オリゴヌクレオチドを増幅されたオリゴヌクレオチドと結合し、続いて、増幅反応において増幅されたオリゴヌクレオチドを伸長する周期は、ビーズに付加されるべき任意の所望の数のさらなるオリゴヌクレオチドについて反復することができる。
増幅された鋳型オリゴヌクレオチドと付着しているオリゴヌクレオチドは、例えば、1種以上のランダムN mer配列、偽ランダムN mer配列又はプライマー結合部位(例えば、配列決定デバイスと適合しているユニバーサル配列部分などのユニバーサル配列部分)を含み得る。ビーズと付着しているこれらの配列のいずれか又は任意のその他の配列は、本明細書において別の場所に記載されるようなウラシル含有ヌクレオチドの少なくともサブセクションを含み得る。
バーコード配列及びランダムN merをビーズに付着させるための限界希釈方法の一例が図4に示されている。図4Aに示されるように、ビーズ401(例えば、ジスルフィド架橋ポリアクリルアミドゲルビーズ)は、第1のプライマー403を用いて予め官能化される。第1のプライマー403は、例えば、ビーズ401の表面と結合しているアクリダイト部分を有するジスルフィド結合402によってビーズに結合され得る。しかし、一部の場合には、第1のプライマー403は、ジスルフィド結合402を伴わずにアクリダイト部分を介してビーズに結合され得る。第1のプライマー403は、ビーズに付着されるべきオリゴヌクレオチドの鋳型配列をプライミングするためのユニバーサルプライマーであり得、及び/又は第1のプライマー403を含むオリゴヌクレオチドの配列決定において使用するためのプライマー結合部位(例えば、P5)であり得る。
図4Bに示されるように、第1のプライマー403によって官能化されたビーズ401を、次いで、水溶液中で鋳型オリゴヌクレオチド(例えば、第1のプライマー結合部位404(例えば、P5c)を含むオリゴヌクレオチド、鋳型バーコード配列405及び鋳型プライマー結合部位407(例えば、R1c))及び核酸増幅に必要な試薬(例えば、dNTP、ポリメラーゼ、補助因子など)と混合することができる。水性混合物はまた、鋳型オリゴヌクレオチドの鋳型プライマー結合部位407と配列において同一である、捕捉部分(例えば、ビオチン)に連結された捕捉プライマー406(例えば、リードプライマーと呼ばれることもある)を含み得る。
次いで、水性混合物を水/油エマルジョン中で乳化し、連続油相中に水性液滴(例えば、1種以上のビーズ401、鋳型オリゴヌクレオチド、核酸増幅に必要な試薬及び必要に応じて、任意の捕捉プライマー406を含む液滴)を生成する。一般に、液滴は、液滴あたり、平均して、最大で1つの鋳型オリゴヌクレオチドを含む。図4B及び4Cに示されるように、液滴の第1ラウンドの熱サイクリングは、第1のプライマー403によるプライマー結合部位404での鋳型オリゴヌクレオチドのプライミング及び第1のプライマー403の伸長をもたらし、その結果、鋳型オリゴヌクレオチド配列と相補的であるオリゴヌクレオチドが、第1のプライマー403でゲルビーズに付着される。相補的オリゴヌクレオチドは、第1のプライマー403、バーコード配列408(例えば、鋳型バーコード配列405と相補的である)並びに鋳型プライマー結合部位407及び捕捉プライマー406の両方と相補的である捕捉プライマー結合部位415を含む。捕捉プライマー結合部位415もまた、相補的オリゴヌクレオチドの配列決定の間にリードプライマー結合部位(例えば、R1)として使用され得る。
図4Dに示されるように、捕捉プライマー406は、熱サイクリングの次のラウンドの間に捕捉プライマー結合部位415と結合できる。次いで、図4Eに示されるように、その5'末端に捕捉部分(例えば、ビオチン)を含む捕捉プライマー406を伸長して、さらなる鋳型オリゴヌクレオチド(例えば、配列404、405及び406を含む)を生成することができる。ビーズ401の全ての第1のプライマー403部位が、バーコード配列408及び捕捉プライマー結合部位415に連結されるまで、所望のサイクル数の間(例えば、少なくとも約1、5、10、15、20、25、30、35、40、45、50又はそれ以上のサイクル)熱サイクリングを継続してもよい。各液滴は、一般に、1つ又は0の出発する鋳型オリゴヌクレオチドを含むので、各液滴は、一般に、鋳型オリゴヌクレオチドと相補的である配列の複数のコピーと付着しているビーズを含むか、又は鋳型オリゴヌクレオチドと相補的である配列のコピーを含まない。図4Eに示されるように、熱サイクリングの終わりに、ビーズと付着しているオリゴヌクレオチド生成物は、捕捉部分(例えば、ビオチン)も含む鋳型オリゴヌクレオチドとハイブリダイズされる。
次いで、任意の適した手段によってエマルジョンを破壊してもよく、放出されたビーズを共通の容器中にプールすることができる。図4F及び図4Gに示されるように、捕捉プライマー406の捕捉部分と結合可能な部分(例えば、ストレプトアビジン)と連結している捕捉ビーズ(又は本明細書に記載された捕捉デバイスを含む他のデバイス)409を使用して、捕捉ビーズの捕捉部分との相互作用によって、陽性ビーズ(例えば、配列403、408及び415を含むビーズ)を、陰性ビーズ(例えば、配列403、408及び415を含まないビーズ)から濃縮してもよい。捕捉ビーズが使用される場合には、ビーズは磁性であってもよく、その結果、濃縮に磁石を使用してもよい。代替法として、濃縮に遠心分離を使用してもよい。図4Hに示されるように、陽性ビーズの濃縮の際、捕捉部分を含み、捕捉ビーズに連結されたハイブリダイズされた鋳型オリゴヌクレオチドは、熱的又は本明細書に記載された化学的手段を含めた化学的手段によって、ビーズが結合しているオリゴヌクレオチドから変性され得る。次いで、変性されたオリゴヌクレオチド(例えば、配列404、405及び406を含むオリゴヌクレオチド)は、変性されたオリゴヌクレオチドと付着している捕捉ビーズによって陽性ビーズから分離され得る。図4Hに示されるように、配列403、408及び415を含むビーズが得られる。捕捉ビーズの代替法として、例えば、ビーズ又はビーズと結合している種と結合可能な区画中に光学活性色素を含めることによって、フローサイトメトリーによって、陽性ビーズを、陽性ビーズから選別してもよい。
図4Iに示されるように、バルク水性流体中で、配列403、408及び415を含むビーズを、捕捉プライマー結合部位415と相補的である配列412と各々連結された鋳型ランダム配列(例えば、ランダムN mer)413と組み合わせることができる。図4Jに示されるように、捕捉プライマー結合部位415は、加熱時に、配列412に鋳型ランダム配列413を含むオリゴヌクレオチドをプライミングすることができる。プライミング後、捕捉プライマー結合部位415を伸長して(例えば、ポリメラーゼによって)、捕捉プライマー結合部位415を、鋳型ランダム配列413と相補的であるランダム配列414と連結することができる。熱的又は本明細書に記載された化学的手段を含めた化学的手段を使用して、鋳型ランダム配列413及び配列412を含むオリゴヌクレオチドを、ビーズから変性することができる。例えば、ビーズの遠心分離及び洗浄を使用して、ビーズを変性されたオリゴヌクレオチドから分離してもよい。図4K、4L及び4Mに示されるように、変性されたオリゴヌクレオチドを除去した後、バーコード配列408及びランダム配列414を含むビーズが得られる。ランダム配列414の付着はバルクで行われるので、固有のバーコード配列408の複数のコピーを含む各ビーズはまた、種々のランダム配列414も含む。
ビーズからビーズが結合しているオリゴヌクレオチドを放出するために、例えば、還元剤などの本明細書において別の場所に記載される刺激を使用してもよい。図4Nに示されるように、ジスルフィド結合及びジスルフィド結合を介したオリゴヌクレオチドとの結合を含むビーズの、還元剤との接触は、ビーズ及びジスルフィド結合両方を分解し、オリゴヌクレオチドをビーズから遊離させる。還元剤との接触は、例えば、別の区画(例えば、別のエマルジョンの液滴)において完了され得、その結果、ビーズからのオリゴヌクレオチド放出の際に、各液滴は、全般的に、全て同一のバーコード配列408を含むが、種々のランダム配列414を含む遊離オリゴヌクレオチドを含む。ランダムプライマーとして作用するランダム配列414によって、遊離オリゴヌクレオチドは、区画中のサンプル核酸の種々の領域にバーコードを付けるために使用され得る。本明細書に記載されたものを含めた増幅又はライゲーションスキームは、サンプル核酸へのバーコードの付着を完了するために使用され得る。
限界希釈を用いて、区画(例えば、液滴)は、区画あたり平均して最大で1つのオリゴヌクレオチド配列を含有し得る。所与の配列-ビーズ希釈でのこの分布の頻度は、ポワソン分布をたどる。したがって、一部の場合には、液滴又は区画の約6%、10%、18%、20%、30%、36%、40%又は50%は、1つ又は2、3のオリゴヌクレオチド配列を含み得る。一部の場合には、液滴の約6%、10%、18%、20%、30%、36%、40%、50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%を超えるもの、又はそれ以上は、1つ又は2、3のオリゴヌクレオチド配列を含み得る。他の場合には、液滴の約6%、10%、18%、20%、30%、36%、40%又は50%未満は、1つ又は2、3のオリゴヌクレオチド配列を含み得る。
一部の場合には、バーコードのコピーを有する陽性ビーズの数を増大するために、ランダムN mer配列の付加に先立って限界希釈工程を反復してもよい。例えば、限界希釈は、エマルジョン液滴の所望の割合(例えば、1/10〜1/3)が、増幅のための鋳型を含むように調製することができる。陽性ビーズは、鋳型の増幅によって作製することができ(図4に表されるように)、その結果、陽性は、一般に、増幅のためのプライマーをもはや含まない(例えば、全てのP5プライマー部位は伸長されている)。次いで、エマルジョン液滴を破壊し、その後、第2ラウンドの増幅のために限界希釈で新鮮な鋳型を用いて再乳化することができる。第1ラウンドの増幅で作製した陽性ビーズは、そのプライミング部位はすでに占有されているので、一般に、さらなる増幅に関与しない。所望の陽性ビーズの画分が得られるまで、増幅とそれに続く再乳化のプロセスを適した工程数の間反復することができる。
一部の場合には、限界希釈官能化後の選別の際に得られた陰性ビーズを回収し、更に処理して、さらなる陽性ビーズを作製してもよい。例えば、陰性ビーズを、各ウェルが一般に1つのビーズを含むよう、回収後にプレートのウェル(例えば、384ウェルプレート)に分配してもよい。一部の場合には、分配は、フローサイトメトリー(例えば、フローサイトメーターは、選別の間に各陰性ビーズをウェルに向ける-例示的フローサイトメーターは、BD FACS Jazzである)を用いて、又は例えば、ロボット分配デバイスなどの分配デバイスによって達成され得る。各ウェルはまた、鋳型バーコード配列も含み得、プロセスは、各ウェルが、流体液滴ではなく各ビーズを区画化する点を除いて反復される図4に表されている。各ウェルは、鋳型及びビーズを含むので、各ウェルは陽性ビーズを生成し得る。次いで、各ウェルからビーズをプールすることができ、さらなる配列(例えば、ランダムN mer配列)を、本明細書において別の場所に記載されるようなバルクに付加することができる。
バーコードが付けられるべきビーズあたりのバーコードの予想又は予測される割合で、バーコードをビーズ中にロードすることができる。一部の場合には、バーコードは、ビーズあたり約0.0001、0.001、0.1、1、2、3、4、5、6、7、8、9、10、20、50、100、500、1000、5000、10000、20000、50000、100000、500000、1000000、5000000、10000000、50000000、100000000、500000000、1000000000、5000000000、10000000000、50000000000又は100000000000個のバーコードの割合がロードされるようにロードされる。一部の場合には、バーコードは、ビーズあたり0.0001、0.001、0.1、1、2、3、4、5、6、7、8、9、10、20、50、100、500、1000、5000、10000、20000、50000、100000、200000、300000、400000、500000、600000、700000、800000、900000、1000000、2000000、3000000、4000000、5000000、6000000、7000000、8000000、9000000、10000000、20000000、30000000、40000000、50000000、60000000、70000000、80000000、90000000、100000000、200000000、300000000、400000000、500000000、600000000、700000000、800000000、900000000、1000000000、2000000000、3000000000、4000000000、5000000000、6000000000、7000000000、8000000000、9000000000、10000000000、20000000000、30000000000、40000000000、50000000000、60000000000、70000000000、80000000000、90000000000、100000000000個を超えるもの又はそれ以上のバーコードがロードされるようにロードされる。一部の場合には、バーコードは、ビーズあ
たり約0.0001、0.0002、0.0003、0.0004、0.0005、0.0006、0.0007、0.0008、0.0009、0.001、0.002、0.003、0.004、0.005、0.006、0.007、0.008、0.009、0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1、2、3、4、5、6、7、8、9、10、20、50、100、500、1000、5000、10000、20000、50000、100000、500000、1000000、5000000、10000000、50000000、100000000、500000000、1000000000、5000000000、10000000000、50000000000又は100000000000個未満のバーコードの割合がロードされるようにロードされる。
本明細書に記載されたもの(例えば、実質的に溶解可能なビーズ、一部の場合には、還元剤によって実質的に溶解可能な)を含めたビーズは、複数のオリゴヌクレオチドに共有結合で又は非共有結合で連結され得、オリゴヌクレオチドの少なくともサブセットは、定常領域又はドメイン(例えば、バーコード配列、バーコードドメイン、共通のバーコードドメイン又はサブセットのオリゴヌクレオチド間で一定である他の配列)及び可変領域又はドメイン(例えば、ランダム配列、ランダムN mer又はサブセットのオリゴヌクレオチド間で可変である他の配列)を含む。一部の場合には、オリゴヌクレオチドは、本明細書において別の場所に記載されるようなビーズに放出可能に結合され得る。オリゴヌクレオチドは、本明細書において別の場所で記載される共有結合又は非共有結合による結合の種類を含めた適した結合を介してビーズと共有結合で又は非共有結合で連結され得る。一部の場合には、オリゴヌクレオチドは、例えば、化学的に切断可能な結合(例えば、ジスルフィド結合)、光切断可能な結合又は熱的に切断可能な結合などの切断可能な結合を介して、ビーズと共有結合で連結され得る。ビーズは、約1、10、50、100、500、1000、5000、10000、50000、100000、500000、1000000、5000000、10000000、50000000、100000000、500000000、1000000000、5000000000、10000000000、50000000000、100000000000、500000000000若しくは1000000000000個を超える、又は少なくとも約1、10、50、100、500、1000、5000、10000、50000、100000、500000、1000000、5000000、10000000、50000000、100000000、500000000、1000000000、5000000000、10000000000、50000000000、100000000000、500000000000若しくは1000000000000個の、定常領域又はドメイン及び可変領域又はドメインを含むオリゴヌクレオチドを含み得る。
一部の場合には、オリゴヌクレオチドは各々、同一の定常領域又はドメイン(例えば、同一のバーコード配列、同一のバーコードドメイン、共通のドメインなど)を含み得る。一部の場合には、オリゴヌクレオチドは各々、異なる配列を有する可変ドメインを含み得る。一部の場合には、同一の定常領域(又は共通のドメイン)を含むオリゴヌクレオチドのパーセンテージは、少なくとも約0.01%、0.1%、1%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%又は100%であり得る。一部の場合には、異なる配列を有する可変領域を含むオリゴヌクレオチドのパーセンテージは、少なくとも約0.01%、0.1%、1%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%又は100%であり得る。一部の場合には、異なるヌクレオチド配列を有するオリゴヌクレオチド(可変及び定常領域又はドメインを含むものを含む)を含む複数のビーズ中のビーズのパーセンテージは、少なくとも約0.01%、0.1%、1%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%又は100%である。一部の場合には、オリゴヌクレオチドはまた、例えば、プライマー結合部位(例えば、配列決定プライマー結合部位)、ユニバーサルプライマー配列(例えば、特定の長さの任意の核酸断片上の1種以上の遺伝子座とハイブリダイズし、プライミングすると、このような遺伝子座がこのような長さの配列内に存在する可能性に基づいて予測されるプライマー配列)又は本明細書において別の場所に記載されるさらなる配列の種類を含めた任意の他の所望の配列などの1種以上のさらなる配列を含み得る。
本明細書において別の場所に記載されるように、複数のビーズを作製して、例えば、ビーズライブラリー(例えば、バーコードが付いたビーズライブラリー)を形成してもよい。一部の場合には、共通のドメイン(例えば、共通のバーコードドメイン)又は領域の配列は、少なくとも、複数のものの個々のビーズのサブセットの間で変わり得る。例えば、複数のビーズの個々のビーズ間の共通のドメイン又は領域の配列は、複数のもののうち2以上、10以上、50以上、100以上、500以上、1000以上、5000以上、10000以上、50000以上、100000以上、500000以上、1000000以上、5000000以上、10000000以上、50000000以上、100000000以上、500000000以上、1000000000以上、5000000000以上、10000000000以上、50000000000以上又は100000000000以上のビーズ間で異なり得る。一部の場合には、複数のビーズの各ビーズは、異なる共通のドメイン又は領域を含み得る。一部の場合には、異なる共通のドメイン又は領域を含む複数のビーズの個々のビーズのパーセンテージは、少なくとも約0.01%、0.1%、1%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%又は100%であり得る。一部の場合には、複数のビーズは、複数のもののうち異なるビーズに結合された、少なくとも約2、10、50、100、500、1000、5000、10000、50000、100000、500000、1000000、5000000、10000000、50000000、100000000、500000000個又はそれ以上の異なる共通のドメインを含み得る。
限界希釈(例えば、エマルジョンの液滴による)の代替法として、他の区画化法を使用して、オリゴヌクレオチドをビーズに付着させてもよい。図13Aに示されるように、プレートのウェルを使用してもよい。プレートのウェル中で、プライマーを含むビーズ(例えば、P5、アクリダイト及び任意選択で、ジスルフィド結合を介してビーズと連結しているプライマー)を、鋳型オリゴヌクレオチド(例えば、バーコード配列を含む鋳型オリゴヌクレオチド)及び増幅試薬と組み合わせてもよい。各ウェルは、固有の鋳型バーコード配列の1つ以上のコピー及び1つ以上のビーズを含み得る。プレートの熱サイクリングは、鋳型オリゴヌクレオチドのプライマーとのハイブリダイゼーションによってプライマーを伸長し、その結果、ビーズは、オリゴヌクレオチド鋳型と相補的である配列を有するオリゴヌクレオチドを含む。熱サイクリングは、全てのプライマーが伸長されるまで、所望の数のサイクル(例えば、少なくとも約1、2、5、10、15、20、25、30、35、40、45、50又はそれ以上のサイクル)を継続してもよい。
熱サイクリングが完了すると、ビーズを共通の容器中にプールし、洗浄し(例えば、遠心分離、磁性分離などによって)、相補鎖を変性させ、再度洗浄し、次いで、必要に応じてバルク処理のさらなるラウンドに付してもよい。例えば、限界希釈について上記で記載され、図13B及び図4I〜Mで示されるように、プライマー伸長法を使用して、ランダムN mer配列を、ビーズが結合しているオリゴヌクレオチドに付加してもよい。
図13Cに示されるように、限界希釈の別の代替アプローチとして、マルチウェルプレートにおいて区画化することを含むコンビナトリアルプロセスを使用して、オリゴヌクレオチド配列を有するビーズを作製することができる。このような方法では、ウェルは、オリゴヌクレオチド鋳型などの事前に合成されたオリゴヌクレオチドを含有し得る。ビーズ(例えば、プライマーなどの予め組み込まれたオリゴヌクレオチドを有するビーズ)は、マルチウェルプレートの個々のウェル中に分けられ得る。例えば、P5オリゴヌクレオチドを含有するビーズの混合物が、マルチウェルプレートの個々のウェル(例えば、384ウェル)中に分けられ得、各ウェルは、固有のオリゴヌクレオチド鋳型(例えば、第1の部分バーコード鋳型又はバーコード鋳型を含むオリゴヌクレオチド)を含有する。プライマー伸長反応は、例えば、鋳型としてオリゴヌクレオチド鋳型及びプライマーとしてビーズと付着しているプライマーを使用して個々のウェル内で実施され得る。その後、全てのウェルが一緒にプールされ、未反応の生成物が除去され得る。
増幅産物に付着しているビーズの混合物は、第2のマルチウェルプレート(例えば、384ウェルプレート)のウェル中に再度分けられ得、第2のマルチウェルプレートの各ウェルは、別のオリゴヌクレオチド配列(例えば、第2の部分バーコード配列及び/又はランダムN merを含む)を含有する。一部の場合には、オリゴヌクレオチド配列は、ブロッカーオリゴヌクレオチドに付着され得る(例えば、ハイブリダイゼーションによって)。各ビーズにさらなる配列を付加するために、第2のマルチウェルプレートのウェル内に、一本鎖ライゲーション反応などの反応が実施され得る(例えば、第2の工程のウェルにおいてオリゴヌクレオチドを用いて第1の工程におけるように、ビーズと付着しているプライマー伸長産物のライゲーションによって)。一部の場合には、第1の工程におけるビーズと連結している部分バーコード配列が、第2の工程における第2の部分バーコード配列とライゲートされ、全バーコード配列を含むビーズを作製する。一部の場合には、全バーコード配列を含むビーズはまた、ランダム配列(例えば、ランダムN mer)及び/又はブロッキングオリゴヌクレオチドも含む。一部の場合には、さらなる配列をビーズに付着するためにPCR反応又はプライマー伸長反応が実施される。ウェルからビーズが一緒にプールされ得、未反応の生成物が除去され得る。一部の場合には、プロセスはさらなるマルチウェルプレートを用いて反復される。プロセスは、1、2、3、4、5、6、7、8、9、10、15、20、50、100、500、1000、5000又は10000回を超えて反復され得る。
一部のコンビナトリアルアプローチでは、ライゲーション方法を使用して、ビーズ(例えば、本明細書において別の場所に記載されるような分解可能なビーズ)上にバーコード配列を含むオリゴヌクレオチド配列をアセンブルしてもよい。例えば、バーコードを含有するオリゴヌクレオチドが付着されるべきビーズの別個の集団が提供され得る。これらの集団は、ヌクレオチドを付着するための固定構成成分(又は結合)、例えば、活性化可能な化学基(ホスホラミダイト、アクリダイト部分又は他の熱的に、光学的に若しくは化学的に活性化可能な基)、切断可能な結合、バーコードを含有するオリゴヌクレオチドがライゲーション、ハイブリダイズ又はそうでなければ付着され得る先に付着されたオリゴヌクレオチド分子、DNA結合タンパク質、静電気的付着のための帯電した基又は種々の他の付着機序のいずれかを含み得る。
第1のオリゴヌクレオチド又は第1のバーコード配列セグメントを含むオリゴヌクレオチドセグメントは別個の集団に付着され、異なる集団は、付着している異なるバーコード配列セグメントを含む。別個の集団の各々中の各ビーズは、少なくとも2、10、50、100、500、1000、5000、10000、50000、100000、500000、1000000、5000000、10000000、50000000、100000000、500000000、1000000000個又はそれ以上の第1のオリゴヌクレオチド分子又はオリゴヌクレオチドセグメント分子に付着され得る。第1のオリゴヌクレオチド又はオリゴヌクレオチドセグメントは、別個の集団に放出可能に付着され得る。一部の場合には、第1のオリゴヌクレオチド又はオリゴヌクレオチドセグメントは、別個の集団中のそれぞれのビーズに直接付着され得るか、又は別個の集団中のそれぞれのビーズに間接的に付着され得る(例えば、上記のようにビーズと結合された固定成分によって)。
一部の場合には、第1のオリゴヌクレオチドは、スプリントの補助を得て別個の集団に付着され得る(スプリントの一例は、図23Aにおいて2306として示されている)。スプリントとは、本明細書において、一般に、二本鎖核酸を指し、核酸の一方の鎖は、1個以上のレシービングオリゴヌクレオチドと付着されるべきオリゴヌクレオチドを含み、核酸のもう一方の鎖は、付着されるべきオリゴヌクレオチドの少なくとも一部と部分的に相補的であり、1個以上のレシービングオリゴヌクレオチドの少なくとも一部と部分的に相補的である配列を有するオリゴヌクレオチドを含む。一部の場合には、オリゴヌクレオチドは、図23Aに示されるように、オーバーハング配列を介してレシービングオリゴヌクレオチドの少なくとも一部と部分的に相補的であり得る。オーバーハング配列は、本明細書において別の場所に記載されるように任意の適した長さのものであり得る。
例えば、スプリントは、第1のオリゴヌクレオチド又はオリゴヌクレオチドセグメントの少なくとも一部と部分的に相補的である配列及び別個の集団と付着しているオリゴヌクレオチドの少なくとも一部と部分的に相補的である配列(例えば、オーバーハング配列)を含むオリゴヌクレオチドとハイブリダイズされる第1のオリゴヌクレオチド又はオリゴヌクレオチドセグメントを含むよう、構成され得る。スプリントは、その相補配列を介して別個の集団と付着しているオリゴヌクレオチドとハイブリダイズし得る。スプリントの第1のオリゴヌクレオチド又はオリゴヌクレオチドセグメントは、ハイブリダイズされると、次いで、例えば、ライゲーション反応などの任意の適した付着機序によって、別個の集団と付着しているオリゴヌクレオチドに付着され得る。
第1のオリゴヌクレオチド又はオリゴヌクレオチドセグメントの別個の集団との付着後、次いで、別個の集団がプールされて、混合されたプールされた集団が生じ、次いで、これが、混合されたプールされた集団の複数の別個の集団中に分離される。次いで、第2のオリゴヌクレオチド又は第2のバーコード配列セグメントを含むセグメントが、別個の混合されたプールされた集団中のビーズ上の第1のオリゴヌクレオチドに付着され、その結果、異なる混合されたプールされたビーズ集団は、それと付着している異なる第2のバーコード配列セグメントを有する。混合されたプールされた集団の別個の集団中の各ビーズは、少なくとも2、10、50、100、500、1000、5000、10000、50000、100000、500000、1000000、5000000、10000000、50000000、100000000、500000000、1000000000個又はそれ以上の第2のオリゴヌクレオチド分子又はオリゴヌクレオチドセグメント分子に付着され得る。
一部の場合には、第2のオリゴヌクレオチドは、スプリントの補助を得て第1のオリゴヌクレオチドに付着され得る。例えば、混合されたプールされた集団を生成する前に、第1のオリゴヌクレオチド又はオリゴヌクレオチドセグメントを別個の集団に付着するために使用されるスプリントはまた、第2のオリゴヌクレオチドの少なくとも一部と部分的に相補的である配列(例えば、オーバーハング配列)も含み得る。スプリントは、相補配列を介して第2のオリゴヌクレオチドとハイブリダイズし得る。第2のオリゴヌクレオチドは、ハイブリダイズされると、次いで、例えば、ライゲーション反応などの任意の適した付着機序によって第1のオリゴヌクレオチドに付着され得る。次いで、第1及び第2のオリゴヌクレオチドの両方と相補的であるスプリント鎖は、さらなる処理を用いて変性(又は除去)され得る。或いは、スプリントの補助を得て、第1のオリゴヌクレオチドを、別個の集団と付着しているオリゴヌクレオチドに付着させるために上記で記載されたような類似の様式で、第2のオリゴヌクレオチドを第1のオリゴヌクレオチドに付着させるために、第2のオリゴヌクレオチドを含む別個のスプリントが提供されてもよい。また、一部の場合には、第1のオリゴヌクレオチドの第1のバーコードセグメント及び第2のオリゴヌクレオチドの第2のバーコードセグメントは、本明細書において別の場所に記載されるような連結配列を介してつなげられ得る。
次いで、混合されたプールされた集団の別個の集団がプールされ得、次いで、得られたプールされたビーズ集団は、異なる第1のバーコード配列の数及び異なる第2のバーコード配列の数の積によって表される、バーコード配列又はバーコードライブラリーの多様な集団を含む。例えば、第1及び第2のオリゴヌクレオチドが、例えば、全て256種の4 merのバーコード配列セグメントを含む場合には、全長バーコードライブラリーは、65,536種の多様な8塩基バーコード配列を含み得る。
バーコード配列セグメントは、バーコード配列セグメントのセットから独立に選択されてもよく、又は第1及び第2のバーコード配列セグメントは各々、バーコード配列セグメントの別個のセットから選択されてもよい。更に、バーコード配列セグメントは個々に及び独立に2〜20ヌクレオチドの長さ、好ましくは、約4〜約20ヌクレオチドの長さ、より好ましくは、約4〜約16ヌクレオチドの長さ又は約4〜約10ヌクレオチドの長さを含み得る。一部の場合には、バーコード配列セグメントは、個々に及び独立に、少なくとも2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20又はそれ以上のヌクレオチドの長さを含み得る。特に、バーコード配列セグメントは、2 mer、3 mer、4 mer、5 mer、6 mer、7 mer、8 mer、9 mer、10 mer、11 mer、12 mer、13 mer、14 mer、15 mer、16 mer、17 mer、18 mer、19 mer、20 mer又はそれより長い配列セグメントを含み得る。
更に、第1及び第2のオリゴヌクレオチド配列又は配列セグメント内に含まれるバーコード配列セグメントは、通常、少なくとも10個の異なるバーコード配列セグメント、少なくとも50個の異なるバーコード配列セグメント、少なくとも100個の異なるバーコード配列セグメント、少なくとも500個の異なるバーコード配列セグメント、少なくとも1,000個の異なるバーコード配列セグメント、少なくとも約2,000個の異なるバーコード配列セグメント、少なくとも約4,000個の異なるバーコード配列セグメント、少なくとも約5,000個の異なるバーコード配列セグメント、少なくとも約10,000個の異なるバーコード配列セグメント、少なくとも50,000個の異なるバーコード配列セグメント、少なくとも100,000個のバーコード配列セグメント、少なくとも500,000個のバーコード配列セグメント、少なくとも1,000,000個のバーコード配列セグメント又はそれ以上を表す。上記のプロセスに一致して、これらの異なるオリゴヌクレオチドは、第1又は第2のオリゴヌクレオチド付加工程のいずれかにおいて、同様又は同一数の別個のビーズ集団の間に配分され得、例えば、少なくとも10、100、500、1000、2000、4000、5000、10000、50000、100000、500000、1000000個などの異なるバーコード配列セグメントは、少なくとも10、100、500、1000、2000、4000、5000、10000、50000、100000、500000、1000000個などの別個のビーズ集団に別個に付加される。
結果として、得られたバーコードライブラリーは、本明細書において別の場所に記載されるように、多様性が少なくとも約100種の異なるバーコード配列セグメントから少なくとも約1,000,000、2,000,000、5,000,000、10,000,000 100,000,000種又はそれ以上の異なるバーコード配列セグメントまでさまざまであり得、ライブラリー内に表わされる。
先に記載されたように、第1及び第2のオリゴヌクレオチド配列又は配列セグメントのいずれか若しくは両方又はその後に付加されるオリゴヌクレオチド(例えば、第3のオリゴヌクレオチドの第2のオリゴヌクレオチドへの付加、第4のオリゴヌクレオチドの付加された第3のオリゴヌクレオチドへの付加など)は、その後の処理において使用するための、さらなる配列、例えば、完全又は部分機能的配列(例えば、プライマー配列(例えば、ユニバーサルプライマー配列、標的化プライマー配列、ランダムプライマー配列)、プライマーアニーリング配列、付着配列、配列決定プライマー配列、ランダムN merなど)を含み得る。これらの配列は、多くの場合、別個の集団、集団のサブセット中のビーズの中で共通となる、及び/又は集団全体中の全てのビーズの中で共通となる。一部の場合には、機能的配列は、異なるビーズ亜集団、異なるビーズ又は更には単一ビーズと付着している異なる分子間のように可変であり得る。更に、第1及び第2のオリゴヌクレオチド配列又は配列セグメントのいずれか又は両方は、本明細書において別の場所に記載されるように、1種以上のウラシル含有ヌクレオチド及び非天然ヌクレオチドを含む配列セグメントを含み得る。更に、バーコード配列を含むオリゴヌクレオチドとして記載されるが、このような言及は、オリゴヌクレオチド内で1個以上の塩基によって分離されている2、3又はそれ以上の個別のバーコード配列セグメント、例えば、含有されるオリゴヌクレオチド中で1、2、3、4、5、6又は10個又はそれ以上の塩基によって第2のバーコードセグメントから分離されている第1のバーコードセグメントを含んでなるオリゴヌクレオチドを含むということが理解される。好ましくは、バーコード配列セグメントは、含有されるオリゴヌクレオチド配列中で、互いに隣接して、又は互いに6塩基、4塩基、3塩基若しくは2塩基内に配置される。オリゴヌクレオチド配列内で連続していようと、1個以上の塩基によって分離されてようと、総称して、所与のオリゴヌクレオチド内のこのような総体のバーコード配列セグメントは、本明細書においてバーコード配列、バーコード配列セグメント又はバーコードドメインと呼ばれる。
バーコード配列及び特定の種類の機能的配列を含む配列を用いてビーズを作製するための例示的コンビナトリアル方法が、図23に示されている。例示目的で、ある特定の配列セグメントの点で記載されているが、種々の異なる機能的配列の種類、プライマーの種類、例えば、異なる配列決定システムに特異的なものなどを含め、種々の異なる立体配置が、本明細書に記載されるビーズと付着しているバーコードを含有するオリゴヌクレオチド中に組み込まれ得るということが理解される。図23Aに示されるように、ビーズ2301は、作製され、固定化成分及び/又は機能的配列又は部分機能的配列、例えば、部分的P5配列2302として使用されるべき第1のオリゴヌクレオチド成分と共有結合で連結され得る(例えば、アクリダイト部分又は他の種を介して)。プレート(例えば、384ウェルプレート)の各ウェルでは、残りのP5配列及び固有の第1の部分バーコード配列(オリゴヌクレオチド2303中で塩基「DDDDDD」によって示される)を含むオリゴヌクレオチド2303を、オリゴヌクレオチド2303の相補体及びオリゴヌクレオチド2303の各末端をオーバーハングするさらなる塩基を含むオリゴヌクレオチド2304とハイブリダイズさせることができる。ハイブリダイズされた生成物「スプリント」2306がこのように生成され得る。スプリントの各オーバーハングは、副生成物形成を防ぐためにブロッキング部分を用いてブロックされ得る(図23Aでは「X」で示される)。ブロッキング部分の限定されない例として、3'Inverted dT、ジデオキシシチジン(ddC)及び3'C3スペーサーが挙げられる。したがって、記載される例では、記載されるように各々固有の第1の部分バーコード配列又はその相補体を用いて、種々のスプリント、例えば、384種の異なるスプリントが生成され得る。
図23Bで示されるように、ビーズ2301は、プレートの各ウェルに付加され得、各ウェル中のスプリント2306は、オリゴヌクレオチド2304のオーバーハングの一方を介してビーズ2301の対応するアンカー配列、例えば、部分的P5配列2302とハイブリダイズし得る。部分的P5配列2302のハイブリダイズにおけるオリゴヌクレオチド2304のオーバーハングの制限された安定性は、スプリント2306の動的サンプリングを可能にすることができ、これは、オリゴヌクレオチド2303の部分的P5配列2302とのその後のライゲーションが効率的であることを確実にすることを補助し得る。ライゲーション酵素(例えば、リガーゼ)は、部分的P5配列2302をオリゴヌクレオチド2303とライゲーションし得る。リガーゼの一例は、T4 DNAリガーゼとなる。ライゲーション後、生成物をプールし、ビーズを洗浄してライゲーションしていないオリゴヌクレオチドを除去することができる。
図23Cに示されるように、次いで、洗浄された生成物を、別のプレート(例えば、384ウェルプレート)のウェルに再分配することができ、プレートの各ウェルは、固有の第2の部分バーコード配列(オリゴヌクレオチド2305において「DDDDDD」によって示される)及びオリゴヌクレオチド2304の残りのオーバーハングと相補的である隣接する短い配列(例えば、第2の部分バーコード配列に隣接し、オリゴヌクレオチド2305の末端の「CC」)を有するオリゴヌクレオチド2305を含む。オリゴヌクレオチド2305はまた、R1配列及びランダムN mer(オリゴヌクレオチド2305において「NNNNNNNNNN」によって示される)などのさらなる配列を含み得る。一部の場合には、オリゴヌクレオチド2305は、ウラシル含有ヌクレオチドを含み得る。一部の場合には、オリゴヌクレオチド2305のチミン含有ヌクレオチドのいずれかが、ウラシル含有ヌクレオチドで置換されてもよい。一部の場合には、第2の部分バーコード配列を含むオリゴヌクレオチド、例えば、配列2305の、第1の部分バーコード配列、例えば、配列2303とのライゲーションの効率を改善するために、例えば、オリゴヌクレオチド2305の全て又は一部と相補的である二本鎖が提供され、スプリント2304とのハイブリダイゼーションに利用可能なオーバーハング塩基を残しながら、オリゴヌクレオチド2305の一部又は全てとハイブリダイズされ得る。先に記載されたように、スプリント2304及び/又は二本鎖が提供され、スプリント及び二本鎖の一方又は両方から又はその間の副生成物の形成を防ぐために、その3'及び5'末端の一方又は両方でブロックされ得る。好ましい態様では、二本鎖は、オリゴヌクレオチド2305の全て又は一部と相補的であり得る。例えば、オリゴヌクレオチド2305がランダムn merを含む場合には、オリゴヌクレオチドのその部分とハイブリダイズしない二本鎖が提供され得る。
図23Cに示されるように、隣接する短い配列を介して、オリゴヌクレオチド2305は、オリゴヌクレオチド2304とハイブリダイズされ得る。再度、オリゴヌクレオチド2305の短い相補配列のハイブリダイズにおけるオーバーハングの制限された安定性は、オリゴヌクレオチド2305の動的サンプリングを可能にすることができ、これは、オリゴヌクレオチド2305のオリゴヌクレオチド2303とのその後のライゲーションが効率的であることを確実にすることを補助し得る。次いで、ライゲーション酵素(例えば、リガーゼ)は、オリゴヌクレオチド2305をオリゴヌクレオチド2303とライゲーションし得る。オリゴヌクレオチド2305のオリゴヌクレオチド2303とのライゲーションは、オリゴヌクレオチド2305の第1の部分バーコード配列とオリゴヌクレオチド2303の第2の部分バーコード配列を接合することによって全バーコード配列の生成をもたらし得る。図23Dに示されるように、次いで、生成物をプールすることができ、オリゴヌクレオチド2304を生成物から変性することができ、次いで、結合していないオリゴヌクレオチドを洗浄除去することができる。洗浄後、例えば、P5配列を含むオリゴヌクレオチド、全バーコード配列及びR1配列及びランダムN merと結合している各ビーズを用いて、バーコードが付いたビーズの多様なライブラリーを得ることができる。この例では、147,456種の固有のバーコード配列を得ることができる(例えば、384種の固有な第1の部分バーコード配列×384種の固有な第2の部分バーコード配列)。
一部の場合には、上記のようにオリゴヌクレオチドのライゲーションを補助するオーバーハング塩基を含むことは、全て、図24Aに示されるようなバーコード配列の部分の間を含め所与の位置に同一塩基を有する生成物をもたらし得る。配列決定リード中で、所与の配列位置で塩基の多様性が制限される又はないことは、利用される特定の配列決定方法に応じて配列決定実施の失敗をもたらし得る。したがって、いくつかの態様では、オリゴヌクレオチドの配列決定された部分全体内の塩基の同一性又は位置のいずれかの点で、異なるスプリント間のように幾分かのばらつきを有するオーバーハング塩基を提供してもよい。例えば、第1の例では、ビーズ上で大きなオリゴヌクレオチドを合成するために使用される一部のオリゴヌクレオチドに、1個以上のスペーサー塩基2401 (例えば、2401での図24B中の「1」「2」)を付加でき、その結果、オリゴヌクレオチド生成物の長さが、互いにわずかに異なり、したがって、オーバーハング塩基を異なる配列中の異なる位置に位置付ける。相補的スペーサー塩基はまた、配列成分ライゲーションのために必要なスプリントに付加してもよい。図24Bに示されるように、生成物間でのオリゴヌクレオチドの長さのわずかな相違は、所与のリード位置での塩基の多様性をもたらし得る。
図25に示される別の例では、ランダム塩基オーバーハングを含むスプリントを使用して、スプリントオーバーハングに対して相補的であるリード位置に塩基多様性を導入してもよい。例えば、二本鎖スプリント2501は、一方の鎖にランダム塩基(例えば、図25Aにおける「NN」)オーバーハング2503及び決定された塩基(例えば、図25Aにおける「CTCT」)オーバーハング2506を、もう一方の鎖に第1の部分バーコード配列(例えば、図25Aにおける「DDDDDD」)を含み得る。図23において表された実施例について上記で記載されたような類似のライゲーションスキームを使用し、決定されたオーバーハング2506を使用して、スプリント2501の上部の鎖(図25Aに示されるような)とのその後のライゲーションのためのハイブリダイゼーションによって、配列2502(図23に示されるようにビーズに付着され得る)を捕捉してもよい。オーバーハング2506は、4塩基の決定された配列オーバーハングとして例示されているが、この配列は、ハイブリダイゼーション及び第1のライゲーション工程におけるライゲーションの効率を改善するためにより長くてもよいということが理解される。そのようなものとして、決定された塩基オーバーハング2506は、部分的P5配列2502と相補的である4、6、8、10個又はそれ以上の塩基の長さを含み得る。更に、最終的な所望の配列の残りの成分(例えば、配列2504)を捕捉するためにランダム塩基オーバーハング2503を使用してもよい。配列2504は、第2の部分バーコード配列(図25Cの配列2504中の「DDDDDD」)、一方の末端にランダム塩基オーバーハング2503の相補体2505(例えば、図25Cにおいて2505での「NN」)及びもう一方の末端にランダムN mer2507(例えば、図25Cの配列2504中の「NNNNNNNNNN」)を含み得る。
ランダム塩基オーバーハング2503中の塩基のランダム性のために、相補体2505でライゲーション生成物中に組み込まれる塩基は変わり得、その結果、生成物は、相補体2505のリード位置で種々の塩基を含む。理解されるように、好ましい態様では、第1の部分バーコード配列とライゲートされるべき第2の部分バーコード配列部分は、通常、ランダムオーバーハング配列に対する相補体の全てを含むこのような第2の部分バーコード配列の集団を含み、例えば、同一の第2の部分バーコード配列を、複数のオーバーハング配列が表される所与のウェル中の各ビーズに付加するために、所与の部分バーコード配列は、16種の異なるオーバーハング部分を有して存在する。図25においてランダムオーバーハング2503及び相補体2505について2個の塩基のみが示されているが、例は制限することを意味しない。オーバーハングにおいて任意の適した数のランダム塩基を使用してよい。更に、ランダムオーバーハング配列として記載されているが、一部の場合には、これらのオーバーハング配列は、オーバーハング配列のサブセットから選択してもよい。例えば、一部の場合には、オーバーハングは、2個以上のオーバーハング配列、一部の場合には、3個以上、5個以上、11個以上、21個以上、51個以上又は更に多くのオーバーハング配列であり得る、オーバーハングの長さの全ての可能性あるオーバーハング配列よりも少なく含むオーバーハング配列のサブセットから選択される。
別の例では、各々、所与の長さのオーバーハング配列のセット、例えば、少なくとも2、4、10、20個又はそれ以上のオーバーハング配列のセットから選択された既定のオーバーハングを有するスプリントのセットを使用して、スプリントオーバーハングと相補的であるリード位置に塩基多様性を導入してもよい。再度、これらのオーバーハングは、第2の部分バーコード配列を第1のバーコード配列とライゲーションするために使用されるので、第2の部分バーコード配列の集団において表される全ての可能性あるオーバーハング相補体を有することが望ましい。そのようなものとして、多くの場合には、異なるオーバーハング配列の数をより少なく維持すること、例えば、50個未満、20個未満又は一部の場合には、10個未満又は5個未満の異なるオーバーハング配列が好ましい。多くの場合には、バーコードライブラリー中の異なる連結配列の数は、2から4096の間の異なる連結配列となり、好ましいライブラリーは、約2から約50の間の異なる連結配列を有する。同様に、通常、最終配列リードに非関連塩基を導入することを避けるために、比較的短い長さのこれらのオーバーハング配列を維持することが望ましい。そのようなものとして、これらのオーバーハング配列は、通常、オリゴヌクレオチド構築物全体に10個以下、9個以下、8個以下、7個以下、6個以下、5個以下、4個以下及び一部の場合には、3個又はそれより少ないヌクレオチドを導入するよう設計される。一部の場合には、オーバーハング配列の長さは、約1から約10ヌクレオチドの長さ、約2から約8ヌクレオチドの長さ、約2から約6ヌクレオチドの長さ又は約2から約4ヌクレオチドの長さであり得る。一般に、セット中の各スプリントは、セット中の他のスプリントに由来する異なる配列を有するオーバーハングを含み得、その結果、オーバーハングの各位置での塩基は、セット中の他のスプリント中の同一塩基位置の塩基とは異なる。スプリントの例示的セットは図26に表されている。セットは、スプリント2601(「AC」2602のオーバーハングを含む)、スプリント2603(「CT」2604のオーバーハングを含む)、スプリント2605(「GA」2606のオーバーハングを含む)及びスプリント2607(「TG」2608のオーバーハングを含む)を含む。各スプリントはまた、オ
ーバーハング2609(例えば、各スプリント中の「CTCT」)及び第1の部分バーコード配列(「DDDDDD」)も含み得る。図26に示されるように、各スプリントは、固有のオーバーハング(例えば、スプリント2601中のオーバーハング2602、スプリント2603中のオーバーハング2604、スプリント2605中のオーバーハング2606及びスプリント2607中のオーバーハング2608)の各位置に異なる塩基を含み得、その結果、同一塩基位置に同一塩基を含むスプリントオーバーハングはない。各スプリントが、固有のオーバーハングの各位置に異なる塩基を含むので、各スプリントから生じた生成物もまた、他のスプリントのうち1種から生じた生成物と比較すると各相補位置に異なる塩基を有し得る。したがって、これらの位置での塩基多様性が達成され得る。
このような生成物は、所望の配列の第1の成分(例えば、第1の部分バーコード配列を含む、図25における配列2502;第1の成分はまたビーズに付着され得る)を、各スプリントに共通のオーバーハング(例えば、図26中のオーバーハング2609)とハイブリダイズする工程;配列の第1の成分をスプリントとライゲーションする工程;所望の配列の第2の部分(例えば、配列がランダム塩基の代わりに位置2505の固有のオーバーハング配列と相補的である塩基を含む点を除いて、第2の部分バーコード配列を含む図25中の配列2504と同様の配列)を、スプリントの固有のオーバーハングとハイブリダイズする工程;及び所望の配列の第2の成分をスプリントとライゲーションする工程によって生成できる。次いで、スプリントのライゲーションされてない部分(例えば、図26に示されるようなオーバーハングを含む下側の配列)を変性させ、生成物を、先に記載されるように洗浄などをして、最終生成物を得ることができる。理解されるように、先に記載されるように、これらのオーバーハング配列は、異なる部分バーコード配列(又はバーコード配列セグメント)間に1、2、3、4、5又は6個又はそれ以上の塩基を提供し得、その結果、それらは、バーコード配列セグメントの間の連結配列に上記の特徴を提供する。このような連結配列は、例えば、約2〜約10ヌクレオチドの長さ、約2〜約8ヌクレオチドの長さ、約2〜約6ヌクレオチドの長さ、約2〜約5ヌクレオチドの長さ又は約2〜約4ヌクレオチドの長さなどの多様な長さであり得る。
図26に表わされるスプリントのセットを使用する例示的ワークフローが、図27に示されている。セット中の各スプリントに、1つ以上のプレートの各ウェル中に固有のオーバーハング配列を含むスプリント鎖(例えば、図26に示されるスプリントの下側の鎖)を提供できる。図27では、固有のオーバーハング配列を含むスプリント鎖の2つの96ウェルプレートが、4種のスプリント種の各々に、合計8種のプレートに提供される。8種のプレートのうち、2種のプレート(2601a、2601b)は、図26における固有のオーバーハング配列(「AC」)を含むスプリント2601の下側の鎖に対応し、2種のプレート(2603a、2603b)は、固有のオーバーハング配列(「CT」)を含む図26におけるスプリント2603の下側の鎖に対応し、2種のプレート(2605a、2605b)は、固有のオーバーハング配列(「GA」)を含む図26におけるスプリント2605の下側の鎖に対応し、2種のプレート(2607a、2607b)は、固有のオーバーハング配列(「TG」)を含む図26におけるスプリント2607の下側の鎖に対応する。各96ウェルプレート中のオリゴヌクレオチド(2601a、2601b、2603a、2603b、2605a、2605b、2607a及び2607b)を、96ウェルプレートの別のセット2702に移すことができ、各プレートは、自身の別個のプレートに移され(再度、合計8種のプレートについて)、各プレートの各ウェルは、次のプレート中の対応するウェルに移される。
1つ以上のプレート中に、固有の第1の部分バーコード配列(例えば、図26に示されるスプリントの上側の鎖)及び第1の部分的P5配列を含むスプリント鎖を提供できる。図27では、このようなスプリント鎖は、2つの96ウェルプレート2708a及び2708b中に提供され、2つのプレート中で合計192個の固有の第1の部分バーコード配列について、2つのプレートの各ウェルは、固有の第1の部分バーコード配列を有するオリゴヌクレオチドを含む。プレート2708aの各ウェルを、プレート2702のうち4種中の対応するウェルに付加でき、プレート2708bの各ウェルを、プレート2702のうち他の4種中の対応するウェルに付加できる。したがって、各ウェル中の2種スプリント鎖は、ハイブリダイズして、完全なスプリントを生成し得る。スプリント生成後、図27における2つの96ウェルプレート2702の各ウェルは、図26においてスプリント2601、スプリント2603、スプリント2605又はスプリント2607として構成されるスプリント及び合計192個の固有の第1の部分バーコード配列について固有の第1の部分バーコード配列を含む。
次いで、プレート2702のウェルの各々に、第2の部分的P5配列を含むビーズ2709(例えば、図25において配列2502と同様又は同等の)を付加できる。各ウェル中のスプリントは、各スプリントの共通のオーバーハング配列2609を介して第2の部分的P5配列とハイブリダイズできる。次いで、ライゲーション酵素(例えば、リガーゼ)は、第2の部分的P5配列を残りの第1の部分的P5配列及び第1の部分バーコード配列を含むスプリント鎖とライゲーションできる。このようにして、P5配列及び第1の部分バーコード配列を含み、依然としてオーバーハング配列を含むスプリント鎖とハイブリダイズされる配列と連結しているビーズを含む第1の生成物が生成する。ライゲーション後、各プレートのウェルから得られた第1の生成物を別個にプールして、プレートプール2703を生成できる。各2つのプレートセット(例えば、特定のスプリント立体配置に対応する各セット)に対応するプレートプール2703も、別個にプールして、第1の生成物プール2704を生成でき、その結果、各第1の生成物プール2704は、唯一の固有のオーバーハング配列を含むスプリントから生成された生成物を含む。図27では、例において使用された4種のスプリント種のうち1種に各々対応する、4種の第1の生成物プール2704が生成される。各プレートプール2703中の生成物を洗浄して、結合していないオリゴヌクレオチドを除去してもよく、各第1の生成物プール2704中の生成物を洗浄して、結合していないオリゴヌクレオチドを除去してもよく、又は洗浄を両プール工程で行ってもよい。一部の場合には、第1の生成物プール2704中に直接入れられた各2つのプレートセットの内容物を用いてプレートプール2703を迂回してもよい。
次いで、図27に表わされるように、合計8つのプレートについて(例えば、生成物プール2704あたり2つのプレート)、各第1の生成物プール2704を、2つの96ウェルプレート2705の各ウェルに分注できる。別個に、固有の第2の部分バーコード配列を含むオリゴヌクレオチド、4種の固有のオーバーハング配列のうち1種と相補的である末端配列及び付加されるべき任意の他の配列(例えば、さらなる配列決定プライマー部位、ランダムN merなど)を、96ウェルプレート2706中に提供できる。このようなオリゴヌクレオチドは、例えば、配列が、ランダム塩基の代わりに位置2505の固有のオーバーハング配列と相補的である塩基を含む点を除いて、図25における配列2504と同様の配列を含み得る。例えば、図26に示されるスプリント2601について、位置2505の塩基は、スプリント2601の固有のオーバーハング2602(「AC」)と相補的である「TG」となる。図27に示されるように、合計8つのプレート及び4つのプレートセットについて、プレート2706のうち、2つのプレートのセットは、4種の固有なオーバーハング配列のうち1種と相補的である配列を含むオリゴヌクレオチドを各々含み得る。プレート2706は、8つのプレート中で合計768個の固有の第2の部分バーコード配列について、各ウェルが、固有の第2の部分バーコード配列を含むように構成され得る。
図27に示されるように、プレート2706の各プレートは、プレート2705のプレート中に入れられた第1の生成物の適当な固有のオーバーハング配列に基づいてプレート2705の対応するプレートと対にできる。プレート2706から得られるプレートの各ウェル中のオリゴヌクレオチドを、プレート2705から得られる対応するプレート中の対応するウェルに付加でき、その結果、各ウェルは、適当な第1の生成物プール2704から得られる第1の生成物のアリコートと、固有の第2のバーコード配列を含むオリゴヌクレオチドと、プレート2706から得られる任意の他の配列(例えば、ランダムN mer)を含む。プレート2705の各ウェルでは、第1の生成物各々の固有のオーバーハング配列は、固有のオーバーハング配列と相補的であるオリゴヌクレオチドの塩基によって、第2の部分バーコード配列を含むオリゴヌクレオチドとハイブリダイズし得る。次いで、ライゲーション酵素(例えば、リガーゼ)は、オリゴヌクレオチドを第1の生成物とライゲーションし得る。ライゲーションの際、第1の生成物の第1の部分バーコード配列を、第2の生成物の第2の部分バーコード配列と接合することによって、完全なバーコード配列を含む第2の生成物が生じる。プレート2705から得られた第2の生成物を除去し、共通の第2の生成物プール2707中に沈着させることができる。次いで、生成物プール2707において、オーバーハングを含むスプリント鎖(図26に示されるように)を変性させ、生成物を洗浄して、最終生成物を得ることができる。ライゲーションの際に使用される固有のオーバーハング配列と相補的である塩基位置に塩基多様性を有する、合計147,456種の固有のバーコード配列を得ることができる(例えば、192種の第1の部分バーコード配列×768種の第2の部分バーコード配列)。
スプリントセットに関する上記の例は、コンビナトリアル合成に使用されるプレートの数及び種類を制限するものではない。スプリントのセットは、任意の適した数のスプリントを含み得る。更に、例えば、望まれる固有のバーコード配列の数、バーコード配列を作製するために使用される塩基の数などに応じて適当な第1の部分バーコード配列多様性を用いてスプリントの各セットを設計してもよい。
コンビナトリアルプレート法を使用して、高多様性を有するバーコードが付いたビーズのライブラリーを作製できる。例えば、2つの384ウェルプレートを使用し、各々が、各ウェル中に予め沈着させた部分バーコード配列を含むオリゴヌクレオチドを有する場合には、384×384すなわち、147,456種の固有のバーコード配列が作製され得ることが可能である。本明細書に示されるコンビナトリアル例は、プレートの任意の適した組合せを使用してもよいので、制限であるよう意味するものではない。例えば、一部の場合には、各コンビナトリアル工程において付加されるバーコード配列セグメントを、バーコード配列セグメントの同一セットから選択してもよい。しかし、多くの場合には、各コンビナトリアル工程において付加されるバーコード配列セグメントを、オリゴヌクレオチド配列の部分的又は完全に異なるセットから選択してもよい。例えば、一部の場合には、第1のオリゴヌクレオチドセグメントは、バーコード配列の第1のセットから得られたバーコード配列、例えば、4 merの配列を含み得、一方で、第2のオリゴヌクレオチド配列は、バーコード配列セグメントの部分的又は完全に異なるセットから得られたバーコード配列、例えば、4 merの配列、6 merの配列、8 merの配列など、又は、例えば、作製されるバーコード、例えば、配列及び長さにおいてマルチパラメータのばらつきを生じさせるために、第2のオリゴヌクレオチドセグメントが、多様な長さ及び配列を有するバーコード配列を有するオリゴヌクレオチドのセットから選択される場合には、混合された長さのさらなる配列を含み得る。
上記の例に関して、例えば、コンビナトリアル法において各工程のために使用されるプレート(及びバーコード)の数及び種類は、同一でなくてもよい。例えば、生じた合計36,864種の固有のバーコード配列について、第1の工程のために384ウェルプレートを使用してもよく、第2の工程のために96ウェルプレートを使用してもよい。更に、各コンビナトリアル工程において付加される全バーコード配列の塩基の数は、同一である必要はない。例えば、第1のコンビナトリアル工程では、12塩基のバーコード配列のうち4塩基を付加してもよく、第2のコンビナトリアル工程において残りの8塩基を付加してもよい。更に、全バーコード配列を作製するために使用されるコンビナトリアル工程の数もまた変わり得る。一部の場合には、約2、3、4、5、6、7、8、9又は10のコンビナトリアル工程が使用される。
プライマー伸長反応及びライゲーション反応は、マルチウェルプレートにおいて標準技術及び試薬を用いて実施できる。例えば、ポリマー、ポリエチレン グリコール(PEG)は、約15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%又は75%の濃度で一本鎖ライゲーション反応の際に存在し得る。一部の場合には、PEGは、約6%、10%、18%、20%、30%、36%、40%、50%を超える又はそれ以上の濃度で、ライゲーション反応の際に存在し得る。一部の場合には、PEGは、約6%、10%、18%、20%、30%、36%、40%又は50%未満の濃度で、第2のプレートにおけるライゲーション反応の際に存在し得る。
本明細書に提供される方法は、ライゲーション反応におけるヌクレオチドの偏りを低減し得る。第1のウェルプレートにおける第1の伸長が完了まで実施され得る場合に、良好な結果が生じ得る。第2のウェルプレートにおける一本鎖ライゲーション工程について、唯一の種類のオリゴヌクレオチド配列が使用される場合には、競合は存在しない可能性がある。内容物をビーズに付着させるためのウェル方法における区画化は、特に、第1のウェルプレートにおける第1の伸長が完了まで実施される場合には、8N末端を有する誤って形成されたアダプターを避け得る。
ウェルプロセスにおける区画化への可能性ある修飾として、縮重塩基を有する第2のオリゴヌクレオチド配列を提供することによって一本鎖ライゲーション工程をPCRと置き換えること、第1のオリゴヌクレオチド配列を第2のオリゴヌクレオチド配列よりも長いよう修飾すること及び/又は合成費用を削減し得、N mer配列の偏りを低減し得るので、一本鎖ライゲーション工程後に別個のバルク反応物中のランダムN mer配列を付加することを挙げることができる。
一部の場合には、以下の一連のプロセスを使用して、バーコード配列をビーズに付着させてもよい。水性流体中で、バーコード配列を適したPCR試薬及び複数のビーズと混合してもよい。水性流体を、オイルなどの非混和性流体内で乳化して、エマルジョンを形成してもよい。エマルジョンは、バーコード配列、ビーズ及びPCR試薬を含有する個々の流体液滴を生成し得る。個々の流体液滴を熱サイクリング条件に曝露してもよく、ここで、複数ラウンドの温度サイクリングが、バーコード配列のプライミング及び伸長を可能にする。流体液滴を含有するエマルジョンを、本開示において別の場所に記載される連続相交換によって破壊してもよい。水溶液に懸濁された得られたバーコードが付いたビーズは、磁性分離又は水性流体中の精製されたバーコードが付いたビーズの収集物を得るための他の選別方法によって選別してもよい。
一部の場合には、以下の一連のプロセスを使用して、N mer配列をビーズに付着させてもよい。水性流体中で、N mer配列を適したPCR試薬及び複数のプールされたバーコードが付いたビーズと混合してもよい。水性流体を加熱して、N mer配列のハイブリダイゼーション及び伸長を可能にしてもよい。さらなる加熱は、相補鎖の除去を可能にし得る。
PCR試薬は、任意の適したPCR試薬を含み得る。一部の場合には、dUTPは、プライマー伸長又は他の増幅反応の際にdTTPと置換され得、その結果、オリゴヌクレオチド生成物は、チミン含有ヌクレオチドではなくウラシル含有ヌクレオチドを含む。望ましくない増幅産物を軽減するために、ユニバーサル配列のこのウラシル含有部分を、後に、ウラシル含有鋳型を受容又は処理しないポリメラーゼと一緒に使用してもよい。
増幅試薬は、ユニバーサルプライマー、ユニバーサルプライマー結合部位、配列決定プライマー、配列決定プライマー結合部位、ユニバーサルリードプライマー、ユニバーサルリード結合部位又は配列決定デバイス、例えば、Illuminaシークエンサー、Ion Torrentシークエンサーなどと適合する他のプライマーを含み得る。増幅試薬は、P5、非切断可能5'アクリダイト-P5、切断可能な5'アクリダイト-SS-P5、R1c、ビオチンR1c、配列決定プライマー、リードプライマー、P5_ユニバーサル、P5_U、52-BioR1-rc、ランダムN mer配列、ユニバーサルリードプライマーなどを含み得る。一部の場合には、プライマーは、修飾されたヌクレオチド、ロックド核酸(LNA)、LNAヌクレオチド、ウラシル含有ヌクレオチド、非天然塩基を含有するヌクレオチド、ブロッカーオリゴヌクレオチド、ブロックされた3'末端、3'ddCTPを含有し得る。図19は、さらなる実施例を提供する。
本明細書に記載されるように、一部の場合には、バーコードを含むオリゴヌクレオチドは、各ビーズが平均して、1個未満の固有のオリゴヌクレオチド配列、2個未満の固有のオリゴヌクレオチド配列、3個未満の固有のオリゴヌクレオチド配列、4個未満の固有のオリゴヌクレオチド配列、5個未満の固有のオリゴヌクレオチド配列又は10個未満の固有のオリゴヌクレオチド配列とともに区画化されるように区画化される。したがって、一部の場合には、ビーズの画分はオリゴヌクレオチド鋳型を含有せず、したがって、増幅されたオリゴヌクレオチドを含有できない。したがって、オリゴヌクレオチドを含むビーズを、オリゴヌクレオチドを含まないビーズから分離することが望ましいことであり得る。一部の場合には、これを、捕捉部分を使用して行ってもよい。
一部の実施形態では、磁性分離などの単離方法とともに捕捉部分を使用して、バーコードを含むビーズを、バーコードを含有しない可能性があるビーズから分離してもよい。そのようなものとして、一部の場合には、増幅試薬は、プライマー又はプローブと付着している捕捉部分を含み得る。捕捉部分は、標識されたビーズを、非標識ビーズから選別して、プライマー及び下流の増幅産物のビーズとの付着を確認することを可能にし得る。例示的捕捉部分として、ビオチン、ストレプトアビジン、グルタチオン-S-トランスフェラーゼ(GST)、cMyc、HAなどが挙げられる。捕捉部分は、蛍光標識又は磁性標識であり得るか、又はそれを含み得る。捕捉部分は、捕捉部分の複数の分子、例えば、ビオチン、ストレプトアビジンなどの複数の分子を含み得る。一部の場合には、増幅反応は、捕捉部分と付着している捕捉プライマーを使用し得(本明細書において別の場所に記載されるように)、その結果、プライマーは、増幅産物とハイブリダイズし、捕捉部分は、増幅反応のさらなるサイクルの際にさらなる増幅されたオリゴヌクレオチド中に組み込まれる。他の場合には、捕捉部分が増幅されたオリゴヌクレオチドと会合されるよう、増幅反応の完了後に、捕捉部分を含むプローブを、増幅されたオリゴヌクレオチドとハイブリダイズさせてもよい。
捕捉部分は、結合対のメンバーであり得、その結果、捕捉部分は、分離の際にその結合対と結合され得る。例えば、結合対のメンバー(例えば、ビオチン)である捕捉部分を含むオリゴヌクレオチドを含むビーズを作製してもよい。ビーズを、結合対の他のメンバー(例えば、ストレプトアビジン)を含む捕捉ビーズと混合してもよく、その結果、2種の結合対メンバーは、得られた混合物中で結合する。次いで、例えば、遠心分離及び磁性分離(例えば、捕捉ビーズが磁性ビーズである場合を含む)を含めた任意の適した手段を使用して、ビーズ-捕捉ビーズ複合体を、混合物の他の構成成分から分離してもよい。
記載されるような多くの場合には、個々のビーズは、全般的に、共通の全バーコード配列セグメントを有する、付着しているオリゴヌクレオチドを有する。本明細書に記載されるように、ビーズが共通のバーコード配列を有するオリゴヌクレオチドを含む場合には、所与のビーズと結合しているオリゴヌクレオチドのうち、相当なパーセンテージ、例えば、予想される全長又は最終オリゴヌクレオチドの長さを含み、未反応のアンカー配列又は部分バーコード配列を含まない所与の長さの、又はそれを超える、オリゴヌクレオチドの、例えば、70%を超える、80%を超える、90%を超える、95%を超える又は更に99%を超えるものが、同一(same)又は同一の(identical)バーコード配列セグメントを含むことを全般的に意味する。このバーコード配列セグメント又はドメイン(再度、1個以上の塩基によって分離されている2個以上の配列セグメントからなる場合もある)は、単一ビーズ内の他の共通又は可変配列又はドメイン間に含まれ得る。また、記載されるように、ビーズの集団全体は、多数の異なるバーコード配列セグメントを有するビーズを含む。しかし、多くの場合、所与のビーズ集団内のいくつかの別個のビーズは、同一のバーコード配列セグメントを含み得る。特に、1000、10,000、1,000,000、10,000,000種又はそれ以上の異なる配列を有するバーコード配列ライブラリーは、100,000、1,000,000、10,000,000、100,000,000、10億、100億、1000億個を超える又はそれ以上の個別のビーズのビーズ集団で表され得、その結果、同一のバーコード配列は、所与のビーズ集団又は亜集団内で複数回表される。例えば、同一のバーコード配列は、所与の分析内の2個以上のビーズ、10個以上のビーズ、100個以上のビーズなどに存在し得る。
ストレプトアビジンなどの対応する結合を有する磁性ビーズなどの捕捉デバイスを付加して、捕捉部分、例えば、ビオチンと結合させてもよい。次いで、付着された磁性ビーズによって、例えば、磁性選別によってバーコードが付いたビーズの単離が可能となり得る。磁性ビーズをまた、ストレプトアビジンの他、Hisタグの付いた融合タンパク質の分離を可能にするニッケル-IMACを含めた他の連結実体を用いてコーティングしてもよく、リン酸化ペプチドの分離を可能にする二酸化チタンでコーティングしてもよく、又は分離のためにタンパク質又は他のリガンドを固定化するためのアミン反応性NHS-エステル基でコーティングしてもよい。
一部の実施形態では、捕捉部分をプライマーに、内部配列に、増幅産物内の特定の配列に、バーコード配列に、ユニバーサル配列に、又は相補配列に付着させてもよい。捕捉部分をPCR増幅又はライゲーションによって付着させてもよい。捕捉部分は、プライマーなどの特異的標的に付着しているビオチンなどのユニバーサルタグを含み、その後、ビーズ集団に付加してもよい。他の場合には、捕捉部分は、特異的配列又はタンパク質又はビーズ集団に独立に付加され得る抗体を認識する特異的タグを含み得る。一部の実施形態では、捕捉部分を磁性ビーズなどの選別ビーズに予め連結してもよい。一部の場合には、捕捉部分は、蛍光活性化細胞選別(FACS)による選別を可能にし得る蛍光標識であり得る。
一部の場合には、オリゴヌクレオチドを含有する流体液滴、エマルジョン又はビーズを同定するために核酸標識(例えば、蛍光標識)を使用してもよい。次いで、増幅されたオリゴヌクレオチドと付着しているビーズを単離するために、標識された液滴又はビーズの選別(例えば、フローサイトメトリーによる)を実施してもよい。例示的染料として、挿入色素、副溝結合剤、主溝結合剤、外部結合剤及びビス挿入剤が挙げられる。このような色素の具体的な例として、SYBRグリーン、SYBRブルー、DAPI、ヨウ化プロピジウム、SYBRゴールド、臭化エチジウム、ヨウ化プロピジウム、イミダゾール(例えば、Hoechst 33258、Hoechst 33342、Hoechst 34580及びDAPI)、7-AAD、SYTOXブルー、SYTOXグリーン、SYTOXオレンジ、POPO-1、POPO-3、YOYO-1、YOYO-3、TOTO-1、TOTO-3、JOJO-1、LOLO-1、BOBO-1、BOBO-3、PO-PRO-1、PO-PRO-3、BO-PRO-1、BO-PRO-3、TO-PRO-1、TO-PRO-3、TO-PRO-5、JO-PRO-1、LO-PRO-1、YO-PRO-1、YO-PRO-3、ピコグリーン、オリグリーン、リボグリーン、エバグリーン、SYBRグリーン、SYBRグリーンII、SYBR DX、SYTO-40、-41、-42、-43、-44、-45(ブルー)、SYTO-13、-16、-24、-21、-23、-12、-11、-20、-22、-15、-14、-25(グリーン)、SYTO-81、-80、-82、-83、-84、-85(オレンジ)、SYTO-64、-17、-59、-61、-62、-60及び-63(レッド)が挙げられる。
多機能ビーズ
ビーズを、それらが多機能性であるよう種々の種(非核酸種を含む)と連結してもよい。例えば、ビーズを、バーコード配列及びN mer(例えば、以下に記載される、ランダムN mer又は標的化N mer)を含む複数の種類のオリゴヌクレオチドと連結してもよい。各種のオリゴヌクレオチドは、オリゴヌクレオチドのそのバーコード配列、そのN mer又はその任意の他の配列が異なり得る。更に、各ビーズを、バーコード配列及びN merを含むオリゴヌクレオチドと連結してもよく、バーコード配列及びN merを含むオリゴヌクレオチドをブロック可能なブロッカーオリゴヌクレオチドと連結してもよい。オリゴヌクレオチドブロッカー並びにバーコード配列及びN merを含むオリゴヌクレオチドのローディングを、オリゴヌクレオチドブロッカー対バーコード配列及びN merを含むオリゴヌクレオチドの所望の化学量論比を得るために、個別の割合で完了してもよい。一般に、ビーズでの種の所望の化学量論比を得るために、個別の割合でビーズに複数の種をロードしてもよい。
更に、ビーズをまた、1種以上の異なる種類の多機能オリゴヌクレオチドと連結してもよい。例えば、多機能オリゴヌクレオチドは、以下のうち2種以上として機能し得る:プライマー、ライゲーションのためのツール、オリゴヌクレオチドブロッカー、ハイブリダイゼーション検出可能なオリゴヌクレオチド、リポーターオリゴヌクレオチド、オリゴヌクレオチドプローブ、機能的オリゴヌクレオチド、濃縮プライマー、標的化プライマー、非特異的プライマー及び蛍光プローブ。蛍光プローブとして機能するオリゴヌクレオチドを、例えば、ビーズ検出又はキャラクタライズ(例えば、ビーズの数の定量化、ビーズと付着している種(例えば、プライマー、リンカーなど)の定量化、ビーズの大きさ/トポロジーの決定、ビーズ多孔度の決定など)のために使用してもよい。
同様にビーズに付着又は結合され得る種の他の限定されない例として、全細胞、染色体、ポリヌクレオチド、有機分子、タンパク質、ポリペプチド、炭水化物、サッカライド、糖類、脂質、酵素、制限酵素、リガーゼ、ポリメラーゼ、バーコード、アダプター、小分子、抗体、抗体断片、フルオロフォア、デオキシヌクレオチド三リン酸(dNTP)、ジデオキシヌクレオチド三リン酸(ddNTP)、バッファー、酸性溶液、塩基性溶液、温度感受性酵素、pH感受性酵素、光感受性酵素、金属、金属イオン、塩化マグネシウム、塩化ナトリウム、マンガン、水性バッファー、弱バッファー、イオン性バッファー、阻害剤、サッカライド、オイル、塩、イオン、洗浄剤、イオン性洗浄剤、非イオン性洗浄剤、オリゴヌクレオチド、ヌクレオチド、DNA、RNA、ペプチドポリヌクレオチド、相補的DNA(cDNA)、二本鎖DNA(dsDNA)、一本鎖DNA(ssDNA)、プラスミドDNA、コスミドDNA、染色体DNA、ゲノムDNA、ウイルスDNA、細菌DNA、mtDNA(ミトコンドリアDNA)、mRNA、rRNA、tRNA、nRNA、siRNA、snRNA、snoRNA、scaRNA、マイクロRNA、dsRNA、リボザイム、リボスイッチ及びウイルスRNA、全体又は部分でのロックド核酸(LNA)、ロックド核酸ヌクレオチド、任意の他の種類の核酸類似体、プロテアーゼ、ヌクレアーゼ、プロテアーゼ阻害剤、ヌクレアーゼ阻害剤、キレート化剤、還元剤、酸化剤、プローブ、クロモフォア、色素、有機物、乳化剤、界面活性剤、安定剤、ポリマー、水、小分子、医薬品、放射活性分子、保存料、抗生物質、アプタマー及びそれらの組合せが挙げられる。さらなるオリゴヌクレオチド種及び他の種類の種の両方を、共有結合及び非共有結合手段(例えば、イオン性結合、ファンデルワールス相互作用、疎水性相互作用、被包、種のビーズへの拡散など)を含めた任意の適した方法によってビーズに結合してもよい。一部の場合には、さらなる種は、ビーズ上の別の種類の種を含む反応に使用される反応物であり得る。例えば、ビーズと結合しているさらなる種は、同様にビーズと付着しているオリゴヌクレオチド種を含む増幅反応において使用するのに適した反応物であり得る。
一部の場合には、ビーズは、核酸を含み得る構成成分を含む、特定の種類のサンプル成分を各々捕捉可能な、1種以上の捕捉リガンドを含み得る。例えば、ビーズは、サンプルから細胞を捕捉可能な捕捉リガンドを含み得る。捕捉リガンドは、例えば、抗体、抗体断片、受容体、タンパク質、ペプチド、小分子又は特定の細胞の表面に固有の、及び/若しくはそこで過剰発現される種に向けて標的化される任意の他の種であり得る。細胞標的との相互作用によって、特定の細胞種類をサンプルから捕捉でき、その結果、ビーズと結合しているままとなる。細胞と結合しているビーズを、本明細書において別の場所に記載されるような区画に入れ、細胞から得られた核酸にバーコードを付けることができる。一部の場合には、サンプルからの細胞の捕捉は、区画において起こり得る。例えば、細胞から核酸を放出するためにそのような区画中に溶解剤を含めてもよい。本明細書に記載された方法のいずれかを使用して、放出された核酸にバーコードを付け、処理できる。
III.バーコードライブラリー
ビーズは、1個以上の付着されたバーコード配列を含有し得る。単一ビーズと付着しているバーコード配列は、同一であっても異なっていてもよい。一部の場合には、各ビーズを、約1、5、10、50、100、500、1000、5000、10000、20000、50000、100000、500000、1000000、5000000、10000000、50000000、100000000、500000000、1000000000、5000000000、10000000000、50000000000又は100000000000個の同一のバーコード配列に付着させてもよい。一部の場合には、各ビーズを、約1、5、10、50、100、500、1000、5000、10000、20000、50000、100000、500000、1000000、5000000、10000000、50000000、100000000、500000000、1000000000、5000000000、10000000000、50000000000又は100000000000個の異なるバーコード配列に付着させてもよい。一部の場合には、各ビーズを、少なくとも約1、5、10、50、100、500、1000、5000、10000、20000、50000、100000、200000、300000、400000、500000、600000、700000、800000、900000、1000000、2000000、3000000、4000000、5000000、6000000、7000000、8000000、9000000、10000000、20000000、30000000、40000000、50000000、60000000、70000000、80000000、90000000、100000000、200000000、300000000、400000000、500000000、600000000、700000000、800000000、900000000、1000000000、2000000000、3000000000、4000000000、5000000000、6000000000、7000000000、8000000000、9000000000、10000000000、20000000000、30000000000、40000
000000、50000000000、60000000000、70000000000、80000000000、90000000000、100000000000個又はそれ以上の同一のバーコード配列に付着させてもよい。一部の場合には、各ビーズを、少なくとも約1、5、10、50、100、500、1000、5000、10000、20000、50000、100000、200000、300000、400000、500000、600000、700000、800000、900000、1000000、2000000、3000000、4000000、5000000、6000000、7000000、8000000、9000000、10000000、20000000、30000000、40000000、50000000、60000000、70000000、80000000、90000000、100000000、200000000、300000000、400000000、500000000、600000000、700000000、800000000、900000000、1000000000、2000000000、3000000000、4000000000、5000000000、6000000000、7000000000、8000000000、9000000000、10000000000、20000000000、30000000000、40000000000、50000000000、60000000000、70000000000、80000000000、90000000000、100000000000個又はそれ以上の異なるバーコード配列に付着させてもよい。一部の場合には、各ビーズを、約1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000、60000、70000、80000、90000、100000、500000、1000000、5000000、10000000、50000000、1000000000、5000000000、10000000000、50000000000又は100000000000個未満の同一のバーコード配列に付着させてもよい。一部の場合には、各ビーズを、約1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000、60000、70000、80000、90000、100000、500000、1000000、5000000、10000000、50000000、1000000000、5000000000、10000000000、50000000000又は100000000000個未満の異なるバーコード配列に付着させてもよい。
個々のバーコードライブラリーは、1個以上のバーコードが付いたビーズを含み得る。一部の場合には、個々のバーコードライブラリーは、約1、5、10、50、100、500、1000、5000、10000、20000、50000、100000、500000、1000000、5000000、10000000、50000000、100000000、500000000、1000000000、5000000000、10000000000、50000000000又は100000000000個の同一のバーコードが付いたビーズを含み得る。一部の場合には、各ライブラリーは、少なくとも約1、5、10、50、100、500、1000、5000、10000、20000、50000、100000、200000、300000、400000、500000、600000、700000、800000、900000、1000000、2000000、3000000、4000000、5000000、6000000、7000000、8000000、9000000、10000000、20000000、30000000、40000000、50000000、60000000、70000000、80000000、90000000、100000000、200000000、300000000、400000000、500000000、600000000、700000000、800000000、900000000、1000000000、2000000000、3000000000、4000000000、5000000000、6000000000、7000000000、8000000000、9000000000、10000000000、20000000000、30000000000、40000000000、50000000000、60000000000、70000000000、80000000000、90000000000、100000000000個又はそれ以上の個々のバーコードが付いたビーズを含み得る。一部の場合には、各ライブラリーは、約1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、40
00、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000、60000、70000、80000、90000、100000、500000、1000000、5000000、10000000、50000000、1000000000、5000000000、10000000000、50000000000又は100000000000個未満の個々のバーコードが付いたビーズを含み得る。ライブラリー内のバーコードが付いたビーズは、同一配列を有することも、異なる配列を有することもある。
一部の実施形態では、各ビーズは、固有のバーコード配列を有し得る。しかし、バーコードライブラリー内の固有のバーコード配列を有するビーズの数は、コンビナトリアル制限によって制限され得る。例えば、4種の異なるヌクレオチドを使用して、バーコードが、12ヌクレオチドの長さである場合には、固有の構築物の数は、412=16777216の固有の構築物に制限され得る。バーコードライブラリーが、多数の、1677216より多くのビーズを含み得るので、同一バーコードの複数のコピーを有する一部のライブラリーがあり得る。一部の実施形態では、所与のライブラリー内の同一バーコードの複数のコピーのパーセンテージは、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、40%又は50%であり得る。一部の場合には、所与のライブラリー内の同一バーコードの複数のコピーのパーセンテージは、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、40%、50%を超えるもの又はそれ以上であり得る。一部の場合には、所与のライブラリー内の同一バーコードの複数のコピーのパーセンテージは、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、25%、30%、40%又は50%未満であり得る。
一部の実施形態では、各ビーズは、1個の固有のバーコード配列を含み得るが、複数の異なるランダムN merを含み得る。一部の場合には、各ビーズは、1個以上の異なるランダムN merを有し得る。再度、バーコードライブラリー内の異なるランダムN merを有するビーズの数は、コンビナトリアル制限によって制限され得る。例えば、4種の異なるヌクレオチドを使用して、N mer配列が12ヌクレオチドの長さである場合には、異なる構築物の数は、412=16777216の異なる構築物に制限され得る。バーコードライブラリーが、多数の、1677216より多くのビーズを含み得るので、同一N mer配列の複数のコピーを有する一部のライブラリーがあり得る。一部の実施形態では、所与のライブラリー内の同一N mer配列の複数のコピーのパーセンテージは、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、40%又は50%であり得る。一部の場合には、所与のライブラリー内の同一N mer配列の複数のコピーのパーセンテージは、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、40%、50%を超えるもの又はそれ以上であり得る。一部の場合には、所与のライブラリー内の同一N mer配列の複数のコピーのパーセンテージは、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、25%、30%、40%又は50%未満であり得る。
一部の実施形態では、バーコード内の固有の識別子配列は、各ビーズ内の各プライマーについて異なっている場合もある。一部の場合には、バーコード配列内の固有の識別子配列は、各ビーズ内の各プライマーについて同一である場合もある。
IV.バーコードが付いたビーズをサンプルと組み合わせる
サンプルの型
この開示の方法、組成物、デバイス、及びキットは、任意の適切なサンプル又は種と共に用いられてもよい。サンプル(例えば、サンプル材料、サンプル材料の構成成分、サンプル材料の断片など)又は種は、例えば、試薬又は分析物などのサンプル処理に用いられる任意の物質であり得る。例示的なサンプルは、細胞全体、染色体、ポリヌクレオチド、有機分子、タンパク質、核酸、ポリペプチド、炭水化物、糖類、糖質、脂質、酵素、制限酵素、リガーゼ、ポリメラーゼ、バーコード(例えば、バーコード配列、核酸バーコード配列、バーコード分子を含む)、アダプター、小分子、抗体、フルオロフォア、デオキシヌクレオチド三リン酸(dNTP)、ジデオキシヌクレオチド三リン酸(ddNTP)、バッファー、酸性溶液、塩基性溶液、温度感受性酵素、pH感受性酵素、光感受性酵素、金属、金属イオン、塩化マグネシウム、塩化ナトリウム、マンガン、水性バッファー、穏やかなバッファー、イオン性バッファー、インヒビター、油、塩、イオン、界面活性剤(detergent)、イオン性界面活性剤、非イオン性界面活性剤、オリゴヌクレオチド、鋳型核酸分子(例えば、鋳型オリゴヌクレオチド、鋳型核酸配列)、核酸断片、鋳型核酸断片(例えば、断片化中に鋳型核酸を断片化することから生じた鋳型核酸の断片、核酸増幅反応から生じた鋳型核酸の断片)、ヌクレオチド、DNA、RNA、ペプチドポリヌクレオチド、相補DNA(cDNA)、二本鎖DNA(dsDNA)、一本鎖DNA(ssDNA)、プラスミドDNA、コスミドDNA、染色体DNA、ゲノムDNA(gDNA)、ウイルスDNA、細菌DNA、mtDNA(ミトコンドリアDNA)、mRNA、rRNA、tRNA、nRNA、siRNA、snRNA、snoRNA、scaRNA、microRNA、dsRNA、リボザイム、リボスイッチ及びウイルスRNA、プロテアーゼ、全部又は一部においてロックド核酸、ロックド核酸ヌクレオチド、ヌクレアーゼ、プロテアーゼインヒビター、ヌクレアーゼインヒビター、キレート剤、還元剤、酸化剤、プローブ、発色団、色素、有機物、乳化剤、界面活性剤(surfactant)、安定剤、ポリマー、水、医薬品、放射性分子、保存剤、抗体、アプタマーなどの1つ以上を含み得る。要するに、用いられるサンプルは、特定の処理ニーズに依存して変わる。
サンプルは、ヒト及び非ヒトの供給源に由来してもよい。一部の場合においては、サンプルは、哺乳類、非ヒト哺乳類、齧歯類、両生類、爬虫類、イヌ、ネコ、ウシ、ウマ、ヤギ、ヒツジ、メンドリ、トリ、マウス、ウサギ、昆虫、ナメクジ、微生物、細菌、寄生生物、又は魚類に由来する。サンプルは、様々な細胞に由来してもよく、その細胞には、真核細胞、原核細胞、真菌細胞、心臓細胞、肺細胞、腎臓細胞、肝臓細胞、膵臓細胞、生殖細胞、幹細胞、誘導多能性幹細胞、胃腸管細胞、血液細胞、癌細胞、細菌細胞、ヒトの微生物叢サンプルから単離された細菌細胞などが挙げられるが、それらに限定されない。一部の場合においては、サンプルは、単細胞の内容物又は多細胞の内容物などの細胞の内容物を含み得る。本明細書に記載された方法および系の単細胞適用の例は、本明細書と同じ日付で出願された、米国仮特許出願第_____号(代理人整理番号43487-728.101)に示されている。サンプルはまた、循環核酸(例えば、DNA、RNA)など、無細胞でもよい。
サンプルは、天然でも、合成でもよい。サンプルは、任意の適切な場所から得られてもよく、その場所には、生物体、任意の生物体由来の細胞全体、任意の生物体由来の細胞調製物及び無細胞組成物、組織、細胞、又は環境が挙げられる。サンプルは、環境生検、吸引液、ホルマリン固定化包埋組織、大気、農産物サンプル、土壌サンプル、石油サンプル、水サンプル、又は粉塵サンプルから得られてもよい。場合によっては、サンプルは、体液から得られてもよく、その体液には、血液、尿、糞便、血清、リンパ液、唾液、粘膜分泌物、汗、中枢神経系液、腟液、又は精液が挙げられ得る。サンプルはまた、化粧品、食品、パーソナルケア製品などの工業製品から得られてもよい。サンプルは、組換えクローニング、ポリヌクレオチド増幅、ポリメラーゼ連鎖反応(PCR)増幅、精製方法(ゲノムDNA又はRNAの精製など)、及び合成反応を含む、実験的操作の産物であってもよい。
バーコードをサンプルへ付着させる方法
バーコード(又は他のオリゴヌクレオチド、例えば、ランダムN mer)を、酵素の作用を通して2つの核酸セグメントを連結させることにより、サンプルに付着させてもよい。これは、プライマー伸長、ポリメラーゼ連鎖反応(PCR)、ポリメラーゼを用いる別の型の反応により、又はリガーゼを用いるライゲーションにより、達成され得る。サンプルをバーコードに付着させるためにライゲーション方法が用いられる場合、サンプルは、ライゲーション工程の前に断片化されてもよいし、されなくてもよい。一部の場合には、オリゴヌクレオチド(例えば、バーコード、ランダムN mer)は、オリゴヌクレオチドがビーズに付着したままで、サンプルに付着する。一部の場合には、オリゴヌクレオチド(例えば、バーコード、ランダムN mer)は、オリゴヌクレオチドがビーズから、例えば、バーコードを含むオリゴヌクレオチドのビーズからの切断により、及び/又はビーズの分解を通して、放出された後に、サンプルに付着する。
オリゴヌクレオチドには、1種以上のランダムN mer配列が挙げられ得る。一群の固有のランダムN mer配列は、DNAセグメントのランダム部分をプライミングし、それにより、サンプル(例えば、全ゲノム)を増幅し得る。生じた産物は、サンプル全体(例えば、ゲノム)を代表する一群のバーコードが付いた断片であり得る。
サンプルは、バーコードが付いたビーズへのライゲーション前に、断片化されてもよいし、されなくてもよい。DNA断片化は、DNA鎖を小さな小片又はセグメントへ分離又は分断させることを含み得る。様々な方法がDNAを断片化するために用いられてもよく、その方法には、制限消化、又はずり応力を発生させる様々な方法が挙げられる。制限消化は、制限酵素を利用して、両方の鎖への平滑切断により、又は付着末端を生じる不均等切断により、DNA配列に意図的な切れ目を入れ得る。ずり応力媒介性DNA鎖分断の例には、超音波処理、音響的剪断、針による剪断、ピペッティング、又は噴霧が挙げられ得る。超音波処理は、一種の流体力学的剪断であり、DNA配列を短時間のずり応力に曝すことであり、その結果として、約700bp断片サイズを生じ得る。音響的剪断は、ボウル形のトランスデューサ内でDNAサンプルに高周波の音響エネルギーを与える。針による剪断は、DNAを小径針に通過させることにより、ずり応力を発生させて、DNAをより小さいセグメントへ物理的に裂く。噴霧力は、DNAをエアロゾルユニットの小さい穴へ送ることにより発生し得、その結果生じたDNA断片が、そのユニットから出た霧状ミストから収集される。
一部の場合には、ライゲーション反応を用いて、オリゴヌクレオチドをサンプルにライゲーションする。ライゲーションは、バーコード配列とサンプルなどの2つの核酸セグメントを、ホスホジエステル結合の形成を触媒することにより、連結することを含み得る。ライゲーション反応は、大腸菌(E.coli)DNAリガーゼ、T4 DNAリガーゼ、DNAリガーゼI、DNAリガーゼIII、DNAリガーゼIVなどの哺乳類リガーゼ、耐熱性リガーゼなどを含み得る。T4 DNAリガーゼは、DNA、オリゴヌクレオチド、RNA、及びRNA-DNAハイブリッドを含有するセグメントをライゲーションし得る。ライゲーション反応は、DNAリガーゼを含まない場合があり、トポイソメラーゼなどの代替物を利用する。サンプルをバーコード配列にライゲーションするために、高いDNAリガーゼ濃度を利用し、かつPEGを含めることが、迅速なライゲーションを達成し得る。DNAリガーゼについての最適な温度(37℃の可能性がある)、及びライゲーションされるDNAの融解温度(様々であり得る)は、ライゲーション反応にとって都合良い温度として選択すると考えられ得る。サンプル及びバーコードが付いたビーズを、ライゲーションに影響する可能性があるイオンの効果を最小にするバッファー中に懸濁させてもよい。
バーコード配列のサンプル核酸構成成分へのライゲーション又は直接的付着に関して上で記載されているが、本明細書で用いられる場合、バーコードのサンプル核酸への付着はまた、例えば、本明細書中の他の所でより詳細に記載されているように、バーコードが、サンプル核酸を複製するために用いられるプライマー配列と会合している場合、バーコード配列の、サンプルの相補体、又はその相補体のコピー若しくは相補体への付着も包含する。特に、プライマー配列を含有するバーコードが、鋳型としてサンプル核酸(又はサンプル核酸の複製物)を用いるプライマー伸長反応に用いられる場合、その結果生じた伸長産物は、サンプル核酸の相補体であろうが、サンプル核酸の複写物であろうが、バーコード配列がそれに付着しているとみなされる。
一部の場合には、例えばマイクロ流体デバイスにおいて、サンプルは、バーコードが付いたビーズと(手作業で、又はマイクロ流体デバイスを活用してかのいずれかで)組み合わされ、組み合わされたサンプルとビーズは、区画化される。区画は、油中水型エマルジョン内の水性液滴であってもよい。サンプルがバーコードが付いたビーズと組み合わされている場合、平均して2個未満の標的分析物が、各流体液滴中に存在し得る。一部の実施形態では、流体液滴あたり平均して3個未満の標的分析物が出現し得る。一部の場合には、流体液滴あたり平均して2個より多くの標的分析物が出現し得る。他の場合には、流体液滴あたり平均して3個より多くの標的分析物が出現し得る。一部の場合には、同じ流体液滴中に、同じ標的分析物の1個以上の鎖が出現し得る。一部の場合には、流体液滴内に、1個未満、2個未満、3個未満、4個未満、5個未満、6個未満、7個未満、8個未満、9個未満、10個未満、50個未満、100個未満、1000個未満、5000個未満、10000個未満、又は100000個未満の標的分析物が存在する。一部の場合には、流体液滴内に、1個より多く、2個より多く、3個より多く、4個より多く、5個より多く、6個より多く、7個より多く、8個より多く、9個より多く、10個より多く、50個より多く、100個より多く、1000個より多く、5000個より多く、10000個より多く、又は100000個より多くの標的分析物が存在する。本明細書に記載された区画は、極めて小さい体積を有することを特徴とする場合が多い。例えば、液滴に基づいた区画の場合、液滴は、1000pL未満、900pL未満、800pL未満、700pL未満、600pL未満、500pL未満、400pL未満、300pL未満、200pL未満、100pL未満、50pL未満、20pL未満、10pL未満、又はさらに1pL未満である全体積を有し得る。ビーズと共区画化される場合、区画内のサンプル流体体積が上記の体積の90%未満、上記の体積の80%未満、70%未満、60%未満、50%未満、40%未満、30%未満、20%未満、又はさらに10%未満であり得ることは認識されるだろう。
サンプルがバーコードが付いたビーズと組み合わされている場合、平均して1個未満のビーズが各流体液滴中に存在し得る。一部の実施形態では、平均して2個未満のビーズが各流体液滴中に存在し得る。一部の実施形態では、流体液滴あたり平均して3個未満のビーズが存在し得る。一部の場合には、平均して1個より多いビーズが各流体液滴中に存在し得る。他の場合には、流体液滴あたり平均して3個より多いビーズが存在し得る。一部の実施形態では、流体液滴あたり平均して1未満のバーコードが付いたビーズの比率が、限界希釈技術を用いて達成され得る。この場合、バーコードが付いたビーズは、サンプルと混合する前に希釈されてもよいし、サンプルと混合中に希釈されてもよいし、又はサンプルと混合した後に希釈されてもよい。
区画化される異なるバーコード又は異なるバーコードセット(例えば、各々の異なるセットが異なるビーズに結合している、異なるバーコードセット)の数は、例えば、区画化される特定のバーコード及び/又は適用に依存して変わり得る。異なるバーコードセットは、例えば、同一のバーコードのセットであってもよく、その同一のバーコードが各セット間で異なる。又は、異なるバーコードセットは、例えば、異なるバーコードのセットであってもよく、各セットがそれの含まれるバーコードの点で異なる。一部の場合には、異なるバーコードは、異なるバーコードを異なるビーズ(例えば、ゲルビーズ)に付着させることにより区画化される。一部の場合には、異なるバーコードセットは、各々の異なるセットを異なる区画に配置することにより区画化される。しかし、一部の場合には、1つの区画が、1つ以上の異なるバーコードセットを含んでもよい。例えば、各々の異なるバーコードセットは、異なるビーズ(例えば、ゲルビーズ)に結合され得る。各々の異なるビーズは、各々の異なるバーコードセットが異なる流体液滴へ区画化されるように、流体液滴に区画化され得る。例えば、約1個、5個、10個、50個、100個、1000個、10000個、20,000個、30,000個、40,000個、50,000個、60,000個、70,000個、80,000個、90,000個、100000個、200,000個、300,000個、400,000個、500,000個、600,000個、700,000個、800,000個、900,000個、1000000個、2000000個、3000000個、4000000個、5000000個、6000000個、7000000個、8000000個、9000000個、10000000個、20000000個、50000000個、100000000個、又はそれ以上の異なるバーコード又は異なるバーコードセットが区画化され得る。一部の例では、少なくとも約1個、5個、10個、50個、100個、1000個、10000個、20000個、30000個、40000個、50000個、60000個、70000個、80000個、90000個、100000個、200,000個、300,000個、400,000個、500,000個、600,000個、700,000個、800,000個、900,000個、1000000個、2000000個、3000000個、4000000個、5000000個、6000000個、7000000個、8000000個、9000000個、10000000個、20000000個、50000000個、100000000個、又はそれ以上の異なるバーコード又はバーコードセットが区画化され得る。一部の例では、約1個未満、5個未満、10個未満、50個未満、100個未満、1000個未満、10000個未満、20000個未満、30000個未満、40000個未満、50000個未満、60000個未満、70000個未満、80000個未満、90000個未満、100000個未満、200,000個未満、300,000個未満、400,000個未満、500,000個未満、600,000個未満、700,000個未満、800,000個未満、900,000個未満、1000000個未満、2000000個未満、3000000個未満、4000000個未満、5000000個未満、6000000個未満、7000000個未満、8000000個未満、9000000個未満、10000000個未満、20000000個未満、50000000個未満、又は100000000個未満の異なるバーコード又はバーコードセットが区画化され得る。一部の例では、約1〜5個、5〜10個、10〜50個、50〜100個、100〜1000個、1000〜10000個、10000〜100000個、100000〜1000000個、10000〜1000000個、10000〜10000000個、又は10000〜100000000個の異なるバーコード又はバーコードセットが区画化され得る。
バーコードは、特定の密度で区画化され得る。例えば、バーコードは、各区画が区画あたり約1個、5個、10個、50個、100個、1000個、10000個、20,000個、30,000個、40,000個、50,000個、60,000個、70,000個、80,000個、90,000個、100000個、200,000個、300,000個、400,000個、500,000個、600,000個、700,000個、800,000個、900,000個、1000000個、2000000個、3000000個、4000000個、5000000個、6000000個、7000000個、8000000個、9000000個、10000000個、20000000個、50000000個、又は100000000個のバーコードを含有するように区画化され得る。バーコードは、各区画が区画あたり少なくとも約1個、5個、10個、50個、100個、1000個、10000個、20000個、30000個、40000個、50000個、60000個、70000個、80000個、90000個、100000個、200,000個、300,000個、400,000個、500,000個、600,000個、700,000個、800,000個、900,000個、1000000個、2000000個、3000000個、4000000個、5000000個、6000000個、7000000個、8000000個、9000000個、10000000個、20000000個、50000000個、100000000個、又はそれ以上のバーコードを含有するように分解され得る。バーコードは、各区画が区画あたり約1個未満、5個未満、10個未満、50個未満、100個未満、1000個未満、10000個未満、20000個未満、30000個未満、40000個未満、50000個未満、60000個未満、70000個未満、80000個未満、90000個未満、100000個未満、200,000個未満、300,000個未満、400,000個未満、500,000個未満、600,000個未満、700,000個未満、800,000個未満、900,000個未満、1000000個未満、2000000個未満、3000000個未満、4000000個未満、5000000個未満、6000000個未満、7000000個未満、8000000個未満、9000000個未満、10000000個未満、20000000個未満、50000000個未満、又は100000000個未満のバーコードを含有するように区画化され得る。バーコードは、各区画が区画あたり約1〜5個、5〜10個、10〜50個、50〜100個、100〜1000個、1000〜10000個、10000〜100000個、100000〜1000000個、10000〜1000000個、10000〜10000000個、又は10000〜100000000個のバーコードを含有するように区画化され得る。一部の場合には、区画化されたバーコードは、例えば、ゲルビーズなどの1個以上のビーズに結合され得る。一部の場合には、区画は、流体液滴である。
バーコードは、同一のバーコードが特定の密度で区画化されるように区画化されてもよい。例えば、同一のバーコードは、各区画が、区画あたり約1個、5個、10個、50個、100個、1000個、10000個、20,000個、30,000個、40,000個、50,000個、60,000個、70,000個、80,000個、90,000個、100000個、200,000個、300,000個、400,000個、500,000個、600,000個、700,000個、800,000個、900,000個、1000000個、2000000個、3000000個、4000000個、5000000個、6000000個、7000000個、8000000個、9000000個、10000000個、20000000個、50000000個、又は100000000個の同一のバーコードを含有するように区画化され得る。バーコードは、各区画が区画あたり少なくとも約1個、5個、10個、50個、100個、1000個、10000個、20000個、30000個、40000個、50000個、60000個、70000個、80000個、90000個、100000個、200,000個、300,000個、400,000個、500,000個、600,000個、700,000個、800,000個、900,000個、1000000個、2000000個、3000000個、4000000個、5000000個、6000000個、7000000個、8000000個、9000000個、10000000個、20000000個、50000000個、100000000個、又はそれ以上の同一のバーコードを含有するように分解され得る。バーコードは、各区画が区画あたり約1個未満、5個未満、10個未満、50個未満、100個未満、1000個未満、10000個未満、20000個未満、30000個未満、40000個未満、50000個未満、60000個未満、70000個未満、80000個未満、90000個未満、100000個未満、200,000個未満、300,000個未満、400,000個未満、500,000個未満、600,000個未満、700,000個未満、800,000個未満、900,000個未満、1000000個未満、2000000個未満、3000000個未満、4000000個未満、5000000個未満、6000000個未満、7000000個未満、8000000個未満、9000000個未満、10000000個未満、20000000個未満、50000000個未満、又は100000000個未満の同一のバーコードを含有するように区画化され得る。バーコードは、各区画が区画あたり約1〜5個、5〜10個、10〜50個、50〜100個、100〜1000個、1000〜10000個、10000〜100000個、100000〜1000000個、10000〜1000000個、10000〜10000000個、又は10000〜100000000個の同一のバーコードを含有するように区画化され得る。一部の場合には、区画化された同一のバーコードは、例えば、ゲルビーズなどのビーズに結合され得る。一部の場合には、区画は、流体液滴である。
バーコードは、異なるバーコードが特定の密度で区画化されるように区画化されてもよい。例えば、異なるバーコードは、各区画が、区画あたり約1個、5個、10個、50個、100個、1000個、10000個、20,000個、30,000個、40,000個、50,000個、60,000個、70,000個、80,000個、90,000個、100000個、200,000個、300,000個、400,000個、500,000個、600,000個、700,000個、800,000個、900,000個、1000000個、2000000個、3000000個、4000000個、5000000個、6000000個、7000000個、8000000個、9000000個、10000000個、20000000個、50000000個、又は100000000個の異なるバーコードを含有するように区画化され得る。バーコードは、各区画が区画あたり少なくとも約1個、5個、10個、50個、100個、1000個、10000個、20000個、30000個、40000個、50000個、60000個、70000個、80000個、90000個、100000個、200,000個、300,000個、400,000個、500,000個、600,000個、700,000個、800,000個、900,000個、1000000個、2000000個、3000000個、4000000個、5000000個、6000000個、7000000個、8000000個、9000000個、10000000個、20000000個、50000000個、100000000個、又はそれ以上の異なるバーコードを含有するように区画化され得る。バーコードは、各区画が区画あたり約1個未満、5個未満、10個未満、50個未満、100個未満、1000個未満、10000個未満、20000個未満、30000個未満、40000個未満、50000個未満、60000個未満、70000個未満、80000個未満、90000個未満、100000個未満、200,000個未満、300,000個未満、400,000個未満、500,000個未満、600,000個未満、700,000個未満、800,000個未満、900,000個未満、1000000個未満、2000000個未満、3000000個未満、4000000個未満、5000000個未満、6000000個未満、7000000個未満、8000000個未満、9000000個未満、10000000個未満、20000000個未満、50000000個未満、又は100000000個未満の異なるバーコードを含有するように区画化され得る。バーコードは、各区画が区画あたり約1〜5個、5〜10個、10〜50個、50〜100個、100〜1000個、1000〜10000個、10000〜100000個、100000〜1000000個、10000〜1000000個、10000〜10000000個、又は10000〜100000000個の異なるバーコードを含有するように区画化され得る。一部の場合には、区画化された異なるバーコードは、例えば、ゲルビーズなどのビーズに結合され得る。一部の場合には、区画は、流体液滴である。
バーコード又は異なるバーコードセットを区画化するのに用いられる区画の数は、例えば、区画化される異なるバーコード又は異なるバーコードセットの適用及び/又は数に依存して変わり得る。例えば、バーコード又は異なるバーコードセットを区画化するのに用いられる区画の数は、約5個、10個、50個、100個、250個、500個、750個、1000個、1500個、2000個、2500個、5000個、7500個、又は10,000個、20000個、30000個、40000個、50000個、60000個、70000個、80000個、90000個、100,000個、200000個、300000個、400000個、500000個、600000個、700000個、800000個、900000個、1,000,000個、2000000個、3000000個、4000000個、5000000個、10000000個、20000000個又はそれ以上であり得る。バーコード又は異なるバーコードセットを区画化するのに用いられる区画の数は、少なくとも約5個、10個、50個、100個、250個、500個、750個、1000個、1500個、2000個、2500個、5000個、7500個、10,000個、20000個、30000個、40000個、50000個、60000個、70000個、80000個、90000個、100,000個、200000個、300000個、400000個、500000個、600000個、700000個、800000個、900000個、1,000,000個、2000000個、3000000個、4000000個、5000000個、10000000個、20000000個又はそれ以上であり得る。バーコード又は異なるバーコードセットを区画化するのに用いられる区画の数は、約5個未満、10個未満、50個未満、100個未満、250個未満、500個未満、750個未満、1000個未満、1500個未満、2000個未満、2500個未満、5000個未満、7500個未満、10,000個未満、20000個未満、30000個未満、40000個未満、50000個未満、60000個未満、70000個未満、80000個未満、90000個未満、100,000個未満、200000個未満、300000個未満、400000個未満、500000個未満、600000個未満、700000個未満、800000個未満、900000個未満、1,000,000個未満、2000000個未満、3000000個未満、4000000個未満、5000000個未満、10000000個未満、20000000個未満であり得る。バーコードを区画化するのに用いられる区画の数は、約5〜10000000個、5〜5000000個、5〜1,000,000個、10〜10,000個、10〜5,000個、10〜1,000個、1,000〜6,000個、1,000〜5,000個、1,000〜4,000個、1,000〜3,000個、又は1,000〜2,000個であり得る。一部の場合には、区画は、流体液滴であり得る。
上記のように、異なるバーコード又は異なるバーコードセット(例えば、各セットが、同一のバーコード又は異なるバーコードの複数を含む)は、各区画が、一般的に、異なるバーコード又は異なるバーコードセットを含むように区画化され得る。一部の場合には、各区画は、ビーズ(例えば、ゲルビーズ)に結合した同一のバーコードセットなど、同一バーコードの異なるセットを含み得る。同一バーコードの異なるセットが区画化される場合、区画あたりの同一バーコードの数は変わり得る。例えば、同一バーコードの約100,000個又はそれ以上の異なるセット(例えば、ビーズに付着した同一バーコードのセット)は、各区画が同一バーコードの異なるセットを含む(例えば、各区画が同一バーコードの1つの異なるセットに結合したビーズを含む)ように約100,000個又はそれ以上の異なる区画へ区画化され得る。各区画において、バーコードセットあたりの同一バーコードの数は、約1,000,000個又はそれ以上の同一バーコードであり得る(例えば、各区画が、1個以上のビーズに結合した1,000,000個又はそれ以上の同一バーコードを含む)。一部の場合には、異なるバーコードセットの数は、区画の数と等しく、若しくは実質的に等しくあり得、又は区画の数より少なくあり得る。異なるバーコード若しくは異なるバーコードセットの任意の適切な数、又は区画あたりのバーコードの任意の適切な数、及び区画の任意の適切な数が組み合わされ得る。したがって、認識されているように、上記の異なる数のいずれかのバーコードが、上記の区画あたりのバーコード密度のいずれかで、かつ上記の数のいずれかの区画において、提供され得る。
マイクロ流体デバイス及び液滴
一部の場合には、この開示は、ビーズを作製するためのデバイス、及び、例えば、サンプル構成成分とビーズを共区画化するために、ビーズ(又は他の型の区画)をサンプルと組み合わせるためのデバイスを提供する。そのようなデバイスは、マイクロ流体デバイス(例えば、液滴発生装置)であり得る。デバイスは、任意の適切な材料から形成されてもよい。一部の例では、デバイスは、溶融石英、ソーダ石灰ガラス、ホウケイ酸ガラス、ポリ(メチルメタクリレート)PMMA、PDMS、サファイア、シリコン、ゲルマニウム、環状オレフィンコポリマー、ポリエチレン、ポリプロピレン、ポリアクリレート、ポリカルボネート、プラスチック、熱硬化性樹脂、ヒドロゲル、熱可塑性プラスチック、紙、エラストマー、及びそれらの組み合わせからなる群から選択される材料から形成され得る。
デバイスは、それが流体の流れのためのチャネルを含む様式で、形成され得る。任意の適切なチャネルが用いられ得る。一部の場合には、デバイスは、1つ以上の流体入力チャネル(例えば、入口チャネル)及び1つ以上の流体出口チャネルを含む。一部の実施形態では、流体チャネルの内径は、約10μm、20μm、30μm、40μm、50μm、60μm、65μm、70μm、75μm、80μm、85μm、90μm、100μm、125μm、又は150μmであり得る。一部の場合には、流体チャネルの内径は、10μmより大きく、20μmより大きく、30μmより大きく、40μmより大きく、50μmより大きく、60μmより大きく、65μmより大きく、70μmより大きく、75μmより大きく、80μmより大きく、85μmより大きく、90μmより大きく、100μmより大きく、125μmより大きく、150μmより大きく、又はそれ以上であり得る。一部の実施形態では、流体チャネルの内径は、約10μm未満、20μm未満、30μm未満、40μm未満、50μm未満、60μm未満、65μm未満、70μm未満、75μm未満、80μm未満、85μm未満、90μm未満、100μm未満、125μm未満、又は150μm未満であり得る。流体チャネル内の体積流量は、当技術分野において知られた任意の流量であってよい。
本明細書中の他の所で記載されているように、マイクロ流体デバイスは、1つ以上のゲル前駆体、1つ以上の架橋剤、任意選択で開始剤、及び任意選択で水性界面活性剤を含む流体液滴を形成することによりビーズを形成するために利用され得る。流体液滴は、油などの非混和性連続流体により囲まれていてもよく、その非混和性連続流体はさらに、界面活性剤及び/又は促進剤を含んでもよい。
一部の実施形態では、マイクロ流体デバイスは、ビーズ(例えば、本明細書に記載された任意の適切な型の区画を含む、バーコードが付いたビーズ又は他の型の第1の区画)とサンプルの両方を含む流体液滴(又は本明細書に記載された任意の適切な型の区画を含む他の型の第2の区画)を形成することにより、ビーズをサンプル(例えば、核酸のサンプル)と組み合わせるために用いられ得る。流体液滴は、例えば、油中水型エマルジョン内の水性液滴など、油相により囲まれた水性コアを有し得る。流体液滴は、1つ以上のバーコードが付いたビーズ、サンプル、増幅試薬、及び還元剤を含有してもよい。一部の場合には、流体液滴は、水、ヌクレアーゼを含まない水、アセトニトリル、ビーズ、ゲルビーズ、ポリマー前駆体、ポリマー単量体、ポリアクリルアミド単量体、アクリルアミド単量体、分解可能架橋剤、非分解可能架橋剤、ジスルフィド結合、アクリダイト部分、PCR試薬、プライマー、ポリメラーゼ、バーコード、ポリヌクレオチド、オリゴヌクレオチド、ヌクレオチド、DNA、RNA、ペプチドポリヌクレオチド、相補DNA(cDNA)、二本鎖DNA(dsDNA)、一本鎖DNA(ssDNA)、プラスミドDNA、コスミドDNA、染色体DNA、ゲノムDNA、ウイルスDNA、細菌DNA、mtDNA(ミトコンドリアDNA)、mRNA、rRNA、tRNA、nRNA、siRNA、snRNA、snoRNA、scaRNA、ミクロRNA、dsRNA、プローブ、色素、有機物、乳化剤、界面活性剤、安定剤、ポリマー、アプタマー、還元剤、開始剤、ビオチン標識、フルオロフォア、バッファー、酸性溶液、塩基性溶液、光感受性酵素、pH感受性酵素、水性バッファー、油、塩、界面活性剤、イオン性界面活性剤、非イオン性界面活性剤などのうちの1つ以上を含んでもよい。要するに、流体液滴の組成は、特定の処理ニーズに依存して変わる。
流体液滴は、均一なサイズでも不均一なサイズでもよい。一部の場合には、流体液滴の直径は、約1μm、5μm、10μm、20μm、30μm、40μm、45μm、50μm、60μm、65μm、70μm、75μm、80μm、90μm、100μm、250μm、500μm、又は1mmであり得る。一部の場合には、流体液滴は、少なくとも約1μm、5μm、10μm、20μm、30μm、40μm、45μm、50μm、60μm、65μm、70μm、75μm、80μm、90μm、100μm、250μm、500μm、1mm、又はそれ以上であり得る。一部の場合には、流体液滴は、約1μm未満、5μm未満、10μm未満、20μm未満、30μm未満、40μm未満、45μm未満、50μm未満、60μm未満、65μm未満、70μm未満、75μm未満、80μm未満、90μm未満、100μm未満、250μm未満、500μm未満、又は1mm未満の直径を有し得る。一部の場合には、流体液滴は、約40〜75μm、30〜75μm、20〜75μm、40〜85μm、40〜95μm、20〜100μm、10〜100μm、1〜100μm、20〜250μm、又は20〜500μmの範囲での直径を有し得る。
一部の実施形態では、デバイスは、2つ以上の流体入力チャネルの1つ以上の交差点を含み得る。例えば、交差点は、流体交差であり得る。流体交差は、2つ以上の流体入力チャネル及び1つ以上の流体出口チャネルを含み得る。一部の場合には、流体交差は、2つの流体入力チャネル及び2つの流体出口チャネルを含み得る。他の場合には、流体交差は、3つの流体入力チャネル及び1つの流体出口チャネルを含み得る。一部の場合には、流体交差は、交差を形成する流体チャネルのうちの2つ又はそれ以上の間で実質的に直角の角度を形成し得る。
一部の場合には、マイクロ流体デバイスは、出力チャネルへ流体接続される接合部で集まる第1及び第2の入力チャネルを含み得る。一部の場合には、出力チャネルは、例えば、接合部で第3の入力チャネルに流体接続され得る。一部の場合には、第4の入力チャネルが含まれ得、接合部で第3の入力チャネルと出口チャネルと交差し得る。一部の場合には、マイクロ流体デバイスは、第1、第2、及び第3の入力チャネルを含み得、第3入力チャネルが、第1の入力チャネル、第2の入力チャネル、又は第1の入力チャネルと第2の入力チャネルの接合部と交差する。
本明細書中の他の所で記載されているように、マイクロ流体デバイスは、液体からゲルビーズを作製するために用いられ得る。例えば、一部の実施形態では、流体入力チャネル内に1つ以上のゲル前駆体、1つ以上の架橋剤、並びに任意選択で開始剤、任意選択で水性界面活性剤、及び任意選択でアルコールを含む水性流体は、流体交差に入り得る。第2の流体入力チャネル内において、任意選択で界面活性剤及び促進剤を含む油が、同じ流体交差に入り得る。水性構成成分と油構成成分の両方が、流体交差で混合され、水性流体液滴を連続油相内に形成させ得る。流体交差から出る流体液滴内のゲル前駆体は、重合して、ビーズを形成し得る。
本明細書中の他の所で記載されているように、マイクロ流体デバイス(例えば、液滴発生装置)は、サンプルを、ビーズ(例えば、バーコードが付いたビーズのライブラリー)、加えて、望ましい場合には、ビーズを分解する能力がある作用物質(例えば、ビーズがジスルフィド結合で連結されている場合には、還元剤)と組み合わせるために用いられ得る。一部の実施形態では、サンプル(例えば、核酸のサンプル)は、第1の流体交差(例えば、第1の流体接合部)に流体接続している第1の流体入力チャネルに供給され得る。あらかじめ形成されたビーズ(例えば、バーコードが付いたビーズ、バーコードが付いた分解可能なビーズ)が、同様に第1の流体交差に流体接続している第2の流体入力チャネルに供給され得、第1の流体交差で第1の流体入力チャネルと第2の流体入力チャネルが出会う。サンプルとビーズは、第1の流体交差で混合されて、混合物(例えば、水性混合物)を形成し得る。一部の場合には、第1の流体交差に流体接続しており、かつ第1の流体交差で第1及び第2の流体入力チャネルと出会う第3の流体入力チャネルに、還元剤が供給され得る。その後、還元剤は、第1の流体交差でビーズ及びサンプルと混合され得る。他の場合には、還元剤は、マイクロ流体デバイスに入る前に、サンプル及び/又はビーズと前もって混合されてもよく、その結果、それは、サンプルと共にマイクロ流体デバイスへ第1の流体入力チャネルを通して、及び/又はビーズと共に第2の流体入力チャネルを通して、供給される。他の場合には、還元剤は加えられなくてもよい。
一部の実施形態では、サンプルとビーズの混合物は、第1の流体交差に流体接続している第1の出口チャネル(及び、したがって、第1の流体交差を形成する任意の流体チャネル)を通って第1の流体交差から出ることができる。混合物は、第1の出口チャネルに流体接続している第2の流体交差(例えば、第2の流体接合部)に供給されてもよい。一部の場合には、油(又は他の適切な非混和性流体)が、第2の流体交差(及び、したがって、その交差を形成する任意の流体チャネル)に流体接続しており、かつ第2の流体交差で第1の出口チャネルと出会う1つ以上の別個の流体入力チャネルから第2の流体交差に入り得る。一部の場合には、油(又は他の適切な非混和性流体)が、第2の流体交差で第1の出口チャネル及びお互いに出会う第2の流体交差(及び、したがって、第1の出口チャネル)に流体接続した1つ又は2つの別個の流体入力チャネル中に供給され得る。油、及びサンプルとビーズの混合物である、両方の構成成分は、第2の流体交差で混合され得る。この混合工程は、サンプルとビーズの混合物を複数の流体液滴(例えば、油中水型エマルジョン内の水性液滴)へ区画化し、その流体液滴中には、形成する液滴の少なくともサブセットがバーコードが付いたビーズ(例えば、ゲルビーズ)を封入する。形成する流体液滴は、第2の流体交差から出る第2の流体出口チャネルを通って油内で運ばれ得る。一部の場合には、第2の流体交差から第2の出口チャネルを出る流体液滴は、さらなる処理(例えば、熱サイクリング)のためにウェルへ区画化されてもよい。
多くの場合、ビーズ(又は第1の区画)に対する生じた液滴(又は第2の区画)の占有率を制御することが望ましい。そのような制御は、例えば、2014年4月4日に出願された米国仮特許出願第61/977,804号に記載されており、その仮特許出願の完全な開示は、全ての目的のためにその全体が参照により本明細書に組み込まれている。一般的に、液滴(又は第2の区画)は、少なくとも50%、60%、70%、80%、90%、又はそれ以上の液滴(又は第2の区画)が、1個以下のビーズ(又は第1の区画)を含有するように形成される。追加として、又は代替として、液滴(又は第2の区画)は、少なくとも50%、60%、70%、80%、90%、又はそれ以上の液滴(又は第2の区画)が、正確に1個のビーズ(又は第1の区画)を含むように形成される。一部の場合には、生じた液滴(又は第2の区画)は、それぞれ、平均して、多くても約1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個、13個、14個、15個、16個、17個、18個、19個、又は20個のビーズ(又は第1の区画)を含み得る。一部の場合には、生じた液滴(又は第2の区画)は、それぞれ、平均して、少なくとも約1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個、13個、14個、15個、16個、17個、18個、19個、20個、又はそれ以上のビーズ(又は第1の区画)を含み得る。
一部の実施形態では、サンプルは、混合物のマイクロ流体デバイスへの流入の前に、バーコードを含むビーズ(例えば、分解可能なビーズ)及び任意の他の試薬(例えば、サンプル増幅に必要な試薬、還元剤など)と前もって混合されて、水性反応混合物を生じ得る。水性混合物の流体デバイスへの流入により、混合物は、第1の流体入力チャネルから流体交差へ流れ得る。一部の場合には、油相が、同様に流体交差に流体接続した第2の流体入力チャネル(例えば、第1の流体入力チャネルと直角を成し、又は実質的に直角を成す流体チャネル)から流体交差に入り得る。水性混合物及び油は、流体交差で混合され得、その結果、エマルジョン(例えば、ゲル-水-油のエマルジョン)が形成する。エマルジョンは、連続油相中に複数の流体液滴(例えば、水性反応混合物を含む液滴)を含むことができる。一部の場合には、各流体液滴は、単一のビーズ(例えば、1セットの同一バーコードに付着したゲルビーズ)、サンプルのアリコート、及び任意の他の試薬(例えば、還元剤、サンプルの増幅に必要な試薬など)のアリコートを含み得る。しかし、一部の場合には、流体液滴は、複数のビーズを含んでもよい。液滴が形成されると、液滴は、油連続相を介して、流体交差から出る流体出口チャネルへ運ばれ得る。出口チャネルを出た流体液滴は、さらなる処理(例えば、熱サイクリング)のためにウェルへ区画化されてもよい。
還元剤がマイクロ流体デバイスに入る前にサンプルに加えられ得、又は第1の流体交差で加えられ得る場合、第2の流体交差で形成された流体液滴は、還元剤を含有し得る。この場合、液滴が、第2の流体交差を出る出口チャネルを通って移動している時、還元剤は、流体液滴内に含有されるビーズを分解又は溶解させ得る。
一部の実施形態では、マイクロ流体デバイスは、3つの別々の流体交差を並列して含有してもよい。流体液滴は、3つの流体交差の任意の1つで形成され得る。サンプル及びビーズは、3つの流体交差の任意の1つの内で組み合わされ得る。還元剤は、3つの流体交差の任意の1つで加えられ得る。油は、3つの流体交差の任意の1つで加えられ得る。
この開示の方法、組成物、デバイス、及びキットは、任意の適切な油と共に用いられ得る。一部の実施形態では、油は、エマルジョンを生成するために用いられ得る。油は、フッ素化油、シリコンオイル、ミネラルオイル、植物油、及びそれらの組み合わせを含み得る。
一部の実施形態では、マイクロ流体デバイス内の水性流体はまた、アルコールを含有してもよい。例えば、アルコールは、グリセロール、エタノール、メタノール、イソプロピルアルコール、ペンタノール、エタン、プロパン、ブタン、ペンタン、ヘキサン、及びそれらの組み合わせであり得る。アルコールは、水性流体内に、約5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、又は20%(v/v)で存在し得る。一部の場合には、アルコールは、水性流体内に、少なくとも約5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、又はそれ以上(v/v)で存在し得る。一部の場合には、アルコールは、水性流体内に、約5%未満、6%未満、7%未満、8%未満、9%未満、10%未満、11%未満、12%未満、13%未満、14%未満、15%未満、16%未満、17%未満、18%未満、19%未満、又は20%未満(v/v)で存在し得る。
一部の実施形態では、油は、エマルジョンを安定化するために界面活性剤を含有してもよい。例えば、界面活性剤は、フッ素系化界面活性剤、Krytox潤滑剤、Krytox FSH、工学的に作製された流体、HFE-7500、bis krytox peg (BKP)などのPEGを含有するシリコン化合物であり得る。界面活性剤は、約0.1%、0.5%、1%、1.1%、1.2%、1.3%、1.4%、1.5%、1.6%、1.7%、1.8%、1.9%、2%、5%、又は10% (w/w)で存在し得る。一部の場合には、界面活性剤は、少なくとも約0.1%、0.5%、1%、1.1%、1.2%、1.3%、1.4%、1.5%、1.6%、1.7%、1.8%、1.9%、2%、5%、10%(w/w)、又はそれ以上で存在し得る。一部の場合には、界面活性剤は、約0.1%未満、0.5%未満、1%未満、1.1%未満、1.2%未満、1.3%未満、1.4%未満、1.5%未満、1.6%未満、1.7%未満、1.8%未満、1.9%未満、2%未満、5%未満、又は10%未満(w/w)で存在し得る。
一部の実施形態では、促進剤及び/又は開始剤が、油に加えられてもよい。例えば、促進剤は、テトラメチルエチレンジアミン(TMEDA又はTEMED)であり得る。一部の場合には、開始剤は、過硫酸アンモニウム又はカルシウムイオンであり得る。促進剤は、約0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1%、1.1%、1.2%、1.3%、1.4%、1.5%、1.6%、1.7%、1.8%、1.9%、又は2%(v/v)で存在し得る。一部の場合には、促進剤は、少なくとも約0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1%、1.1%、1.2%、1.3%、1.4%、1.5%、1.6%、1.7%、1.8%、1.9%、又は2%(v/v)、又はそれ以上で存在し得る。一部の場合には、促進剤は、約0.1%未満、0.2%未満、0.3%未満、0.4%未満、0.5%未満、0.6%未満、0.7%未満、0.8%未満、0.9%未満、1%未満、1.1%未満、1.2%未満、1.3%未満、1.4%未満、1.5%未満、1.6%未満、1.7%未満、1.8%未満、1.9%未満、又は2%未満(v/v)で存在し得る。
V.増幅
DNA増幅は、DNAの小さい、又は長いセグメントの多数のコピーを作製するための方法である。この開示の方法、組成物、デバイス、及びキットは、バーコード配列又はランダムN mer配列などの、1個以上の望まれるオリゴヌクレオチド配列を個々のビーズに付着させるためにDNA増幅を用い得る。DNA増幅はまた、ランダムN mer配列を利用して、サンプル配列の断片を産生し、プライマーと会合したバーコードをその断片へ結合させるために、ゲノムDNAなどの目的のサンプルに沿ってプライミングし、かつ伸長するために用いられ得る。
例えば、核酸配列は、鋳型核酸配列、及び複数の付着したオリゴヌクレオチド(例えば、放出可能に付着したオリゴヌクレオチド)を含むビーズを区画(例えば、本明細書中の他の所で記載された適切な型の区画を含む、エマルジョンの液滴、マイクロカプセル、又は任意の他の適切な型の区画)へ共区画化することにより増幅され得る。付着したオリゴヌクレオチドは、鋳型核酸配列の1つ以上の領域に相補的であるプライマー配列(例えば、例としてランダムN merなどの可変プライマー配列、又は例として標的化N merなどの標的化プライマー配列)を含むことができ、加えて、共通配列(例えば、バーコード配列など)を含んでもよい。プライマー配列は、(例えば、プライマー伸長反応又は任意の他の適切な核酸増幅反応において)鋳型核酸配列にアニーリングされ、伸長されて、鋳型核酸の少なくとも一部の1つ以上の第1のコピーを産生することができ、その結果、その1つ以上の第1のコピーは、プライマー配列及び共通配列を含む。プライマー配列を含むオリゴヌクレオチドが、ビーズに放出可能に付着している場合、そのオリゴヌクレオチドは、プライマー配列を鋳型核酸配列にアニーリングする前にビーズから放出されてもよい。さらに、一般的に、プライマー配列は、同様に区画において供給されるポリメラーゼ酵素(例えば、本明細書中の他の所で記載されているような鎖置換ポリメラーゼ酵素、本明細書中の他の所で記載されているようなエキソヌクレアーゼ欠損ポリメラーゼ酵素、又は本明細書中の他の所で記載されたある種のポリメラーゼを含む、任意の他の型の適切なポリメラーゼ)によって伸長され得る。なおさらに、ビーズに放出可能に付着したオリゴヌクレオチドは、エキソヌクレアーゼ抵抗性であってもよく、したがって、本明細書中の他の所で記載されているように、1つ以上のホスホロチオエート結合を含み得る。一部の場合には、1つ以上のホスホロチオエート結合は、オリゴヌクレオチドにおいて末端ヌクレオチド間結合でのホスホロチオエート結合を含み得る。
一部の場合には、1つ以上の第1のコピーの生成後、プライマー配列は、第1のコピーのうちの1つ以上にアニーリングされ、プライマー配列が再び、伸長されて、1つ以上の第2のコピーを産生することができる。1つ以上の第2のコピーは、プライマー配列、共通配列を含むことができ、1つ以上の第1のコピーの個々のコピーの少なくとも一部分に相補的な配列、及び/又は可変プライマー配列に相補的な配列も含み得る。前述の工程は、望ましい数のサイクル、繰り返されて、増幅された核酸を産生し得る。
上記のオリゴヌクレオチドは、伸長反応(上記の1つ以上の第1又は第2のコピーを産生する伸長反応など)中にコピーされない配列セグメントを含んでもよい。本明細書中の他の所で記載されているように、そのような配列セグメントは、1つ以上のウラシル含有ヌクレオチドを含む場合があり、また、アニーリング条件下でヘアピン(又は部分的ヘアピン)分子を形成するアンプリコンの生成を生じる場合もある。
別の例において、複数の異なる核酸が、それぞれ第2の区画(例えば、本明細書中の他の所で記載されたある種のビーズを含むビーズ)を含む別個の第1の区画(例えば、エマルジョン中の液滴)へ異なる核酸を区画化することにより増幅することができる。第2の区画は、複数のオリゴヌクレオチドと放出可能に会合してもよい。第2の区画は、任意の適切な数のオリゴヌクレオチド(例えば、本明細書中に記載された区画あたり1,000個より多いオリゴヌクレオチド、10,000個より多いオリゴヌクレオチド、100,000個より多いオリゴヌクレオチド、1,000,000個より多いオリゴヌクレオチド、10,000,000個より多いオリゴヌクレオチド、又は任意の他の数のオリゴヌクレオチド)を含んでもよい。さらに、第2の区画は、任意の適切な数の異なるバーコード配列 (例えば、少なくとも1,000種の異なるバーコード配列、少なくとも10,000種の異なるバーコード配列、少なくとも100,000種の異なるバーコード配列、少なくとも1,000,000種の異なるバーコード配列、少なくとも10,000,000種の異なるバーコード配列、又は本明細書中の他の所に記載された任意の他の数の異なるバーコード配列)を含んでもよい。
なおさらに、所与の第2の区画と会合した複数のオリゴヌクレオチドは、プライマー配列(例えば、可変プライマー配列、標的化プライマー配列)及び共通配列(例えば、バーコード配列)を含んでもよい。さらに、異なる第2の区画と会合した複数のオリゴヌクレオチドは、異なるバーコード配列を含んでもよい。複数の第2の区画と会合したオリゴヌクレオチドは、第1の区画へ放出され得る。放出後、第1の区画内のプライマー配列は、第1の区画内の核酸へアニーリングすることができ、その後、プライマー配列は、伸長されて、第1の区画内の核酸の少なくとも一部分の1つ以上のコピーを産生することができる。一般的に、1つ以上のコピーは、第1の区画へ放出されたバーコード配列を含み得る。
液滴内の増幅及びサンプルインデックス化
核酸(例えば、DNA)増幅は、流体液滴内の内容物に実施され得る。本明細書に記載されているように、流体液滴は、ビーズに付着したオリゴヌクレオチドを含有し得る。流体液滴はさらに、サンプルを含み得る。流体液滴はまた、増幅反応に適した試薬を含み得、その試薬には、Kapa HiFi Uracil Plus、修飾ヌクレオチド、天然ヌクレオチド、ウラシル含有ヌクレオチド、dTTP、dUTP、dCTP、dGTP、dATP、DNAポリメラーゼ、Taqポリメラーゼ、変異型プルーフリーディングポリメラーゼ、9 degrees North, modified (NEB)、exo(-)、exo(-) Pfu、Deep Vent exo(-)、Vent exo(-)、及びアシクロヌクレオチド(acyNTP)が挙げられ得る。
流体液滴内のビーズに付着したオリゴヌクレオチドは、オリゴヌクレオチドがサンプル核酸に付着することになるように、サンプル核酸を増幅するために用いられ得る。サンプル核酸は、事実上、分析されることが求められるいずれの核酸も含んでもよく、それには、例えば、全ゲノム、エキソーム、アンプリコン、標的ゲノムセグメント、例えば、遺伝子又は遺伝子ファミリー、細胞核酸、循環核酸などが挙げられ、及び、上で述べられているように、DNA(gDNA、cDNA、mtDNAなど)、RNA(例えば、mRNA、rRNA、全RNAなど)が挙げられ得る。バーコード付与のためのそのような核酸の調製は、一般的に、容易に利用できる方法、例えば、濃縮又はプルダウン方法、単離方法、増幅方法により達成され得る。gDNAなどの所望のサンプルを増幅するために、流体液滴内のオリゴヌクレオチドのランダムN mer配列が、用いられて、所望の標的配列をプライミングし、標的配列の相補体として伸長され得る。一部の場合には、オリゴヌクレオチドは、プライミングする前に、本明細書中の他の所で記載されているように、液滴においてビーズから放出されてもよい。これらのプライミング及び伸長工程について、DNA増幅の任意の適切な方法が利用されてもよく、それには、ポリメラーゼ連鎖反応(PCR)、デジタルPCR、逆転写PCR、多重PCR、ネステッドPCR、重複伸長PCR、定量的PCR、多置換増幅(MDA)、又はリガーゼ連鎖反応(LCR)が挙げられる。一部の場合には、流体液滴内の増幅は、バーコードを含むサンプル核酸のある特定の量が産生されるまで実施され得る。一部の場合には、増幅は、約1サイクル、2サイクル、3サイクル、4サイクル、5サイクル、6サイクル、7サイクル、8サイクル、9サイクル、10サイクル、11サイクル、12サイクル、13サイクル、14サイクル、15サイクル、16サイクル、17サイクル、18サイクル、19サイクル、又は20サイクル、実施され得る。一部の場合には、増幅は、約1サイクルより多く、2サイクルより多く、3サイクルより多く、4サイクルより多く、5サイクルより多く、6サイクルより多く、7サイクルより多く、8サイクルより多く、9サイクルより多く、10サイクルより多く、11サイクルより多く、12サイクルより多く、13サイクルより多く、14サイクルより多く、15サイクルより多く、16サイクルより多く、17サイクルより多く、18サイクルより多く、19サイクルより多く、20サイクル、又はそれ以上、実施され得る。一部の場合には、増幅は、約2サイクル未満、3サイクル未満、4サイクル未満、5サイクル未満、6サイクル未満、7サイクル未満、8サイクル未満、9サイクル未満、10サイクル未満、11サイクル未満、12サイクル未満、13サイクル未満、14サイクル未満、15サイクル未満、16サイクル未満、17サイクル未満、18サイクル未満、19サイクル未満、又は20サイクル未満、実施され得る。
本明細書に記載されているような例示的な増幅及びバーコード付与工程は、図38に概略的に示されている。示されているように、バーコード配列を含むオリゴヌクレオチドは、例えば、エマルジョン中の液滴3802において、サンプル核酸3804と共に共区画化される。本明細書中の他の所で述べられているように、オリゴヌクレオチド3808は、サンプル核酸3804と共区画化されるビーズ3806上に供給されてもよく、そのオリゴヌクレオチドは、パネルAに示されているように、好ましくは、ビーズ3806から放出可能である。オリゴヌクレオチド3808は、1つ以上の機能性配列、例えば、配列3810、3814、及び3816に加えて、バーコード配列3812を含む。例えば、オリゴヌクレオチド3808は、バーコード配列3812、加えて配列3810(所与の配列決定システムのための付着又は固定化配列として機能し得る、例えば、Illumina Hiseq又はMiseqシステムのフローセルにおける付着に用いられるP5配列)を含むとして示されている。示されているように、オリゴヌクレオチドはまた、プライマー配列3816を含み、そのプライマー配列は、サンプル核酸3804の部分の複製をプライミングするためのランダムな、又は標的化N merを含み得る。オリゴヌクレオチド3808内に含まれるのはまた、配列3814であり、それは、配列決定システムにおいて合成反応によるポリメラーゼ媒介性鋳型指向性配列決定をプライミングするために用いられる「read1」又はR1プライミング領域などの配列決定プライミング領域を提供し得る。多くの場合、バーコード配列3812、固定化配列3810、及びR1配列3814は、所与のビーズに付着したオリゴヌクレオチドの全部に共通している。プライマー配列3816は、ランダムN merプライマーとして変わり得、又はある特定の標的とされる適用のために所与のビーズ上のオリゴヌクレオチドに共通してもよい。
プライマー配列3816の存在に基づいて、オリゴヌクレオチドは、パネルBに示されているように、サンプル核酸をプライミングすることができ、そのことは、ビーズ3806及びサンプル核酸3804と共区画化されたポリメラーゼ酵素及び他の伸長試薬を用いるオリゴヌクレオチド3808及び3808aの伸長を可能にする。本明細書中の他の所で記載されているように、これらのポリメラーゼ酵素には、例えば、区画内の二本鎖サンプル核酸の最初の変性が望まれる場合、耐熱性ポリメラーゼが挙げられ得る。あるいは、サンプル核酸の変性が区画化に先行してもよく、その結果、一本鎖標的核酸が区画へ置かれ、望ましい場合には、非耐熱性ポリメラーゼ酵素、例えば、Klenow、phi29、Pol 1などの使用を可能にする。パネルCに示されているように、ランダムN merプライマーについて、サンプル核酸3804の複数の異なる領域にアニーリングするオリゴヌクレオチドの伸長後、その核酸の複数の重複相補体又は断片、例えば、断片3818及び3820が生成される。試料核酸の部分に相補的である配列部分、例えば、配列3822及び3824を含むが、これらの構築物は、一般的に、本明細書において、サンプル核酸3804の断片を含み、付着したバーコード配列を有すると言われる。一部の場合には、最初の増幅工程から管理しやすい断片サイズを維持するために、産生される複製断片のサイズを人工的に限定することが望ましくあり得る。一部の場合には、これは、上記のように、機械的手段によって、例えば、Covarisシステムのような断片化システムを用いて、達成され得、又は過剰に長い断片の形成を防ぐために、ランダムな伸長ターミネーターを、例えば低濃度で、取り込むことにより達成され得る。
その後、これらの断片を、配列分析に供してもよいし、又はそれらを、パネルDに示されているように、そのプロセスにおいてさらに増幅してもよい。例えば、ビーズ3806から放出された追加のオリゴヌクレオチド、例えば、オリゴヌクレオチド3808bもまた、断片3818及び3820をプライミングし得る。これは、断片3818について示されている。特に、この場合もやはり、オリゴヌクレオチド3808bにおけるランダムN merプライマー3816b(多くの場合、所与の区画における他のランダムN mer、例えばプライマー配列3816とは異なる)の存在に基づいて、そのオリゴヌクレオチドは、断片3818とアニーリングし、伸長されて、サンプル核酸配列の一部分の複写物を含む、断片3818の少なくとも一部分に相補的な3826(それには、配列3828を含む)を生成する。オリゴヌクレオチド3808bの伸長は、それが断片3818のオリゴヌクレオチド部分3808に至って複製されるまで続く。本明細書中の他の所で述べられ、かつパネルDに図示されているように、そのオリゴヌクレオチドは、ポリメラーゼによる複製において所望の点で、例えば、断片3818内に含まれるオリゴヌクレオチド3808の配列3816及び3814まで複製された後、停止を促すように形成され得る。本明細書に記載されているように、これは、異なる方法によって達成されてもよく、その方法には、例えば、用いられたポリメラーゼ酵素により処理され得ない異なるヌクレオチド及び/又はヌクレオチド類似体の取り込みが挙げられる。例えば、これには、配列領域3812内にウラシル含有ヌクレオチドの包含が挙げられ、それは、非ウラシル耐性ポリメラーゼにその領域の複製を停止させる。結果として、バーコード配列3812、付着配列3810、R1プライマー領域3814、及びランダムN mer配列3816bを含む完全長3808bを一方の端に含む断片3826が生成される。その配列の他方の端に、最初のオリゴヌクレオチド3808のランダムN merに相補的な3816'、加えて、配列3814'として示された、R1配列の全部又は一部分の相補体が含まれる。その後、R1配列3814及びそれの相補体3814'は、互いにハイブリダイズして、部分的ヘアピン構造3828を形成することができる。認識されているように、ランダムN merは異なるオリゴヌクレオチドの間で異なるため、これらの配列及びそれらの相補体は、ヘアピン形成に関与するとは予想されず、例えば、ランダムN mer3816の相補体である配列3816'は、ランダムN mer配列3816bに相補的であるとは予想されない。これは、他の適用、例えば、標的化プライマーについてはそうではなく、その場合、N merは、所与の区画内のオリゴヌクレオチド間で共通であり得る。
これらの部分的ヘアピン構造を形成することにより、サンプル配列の最初のレベルの複写物のさらなる複製からの除去を可能にし、例えば、コピーの反復コピーを防ぐ。部分的ヘアピン構造はまた、生成された断片、例えば、断片3826のその後の処理にとって有用な構造を提供する。
バーコードのサンプルへの付着後、追加の増幅工程(例えば、PCR)は、配列決定前にバーコードが付いた断片を増幅するように、加えて、任意選択で、追加の機能性配列、例えば、配列決定デバイス(例えば、Illumina MiSeq)と適合する追加のプライマー結合部位(例えば、Read2配列プライマー、インデックスプライマー)、及び任意選択で、1つ以上の追加のバーコード配列(例えば、図14C参照)、及び他の機能性配列、例えば、追加の固定化配列又はそれらの相補体、例えば、P7配列をそれらのバーコードが付いた断片に付加するように、実施されてもよい。一部の場合には、追加のバーコード配列は、サンプルインデックスとしての役割を果たし得、最初のバーコード及びサンプルインデックスは、多重化配列決定(例えば、同時の分子タギング及びサンプル同定)を可能にする。最初のバーコードは、バーコードと会合した核酸分子に対応する(例えば、バーコードを介して同定される)配列リードを整列させるために配列決定中、用いることができる。異なるサンプルインデックスは、各々の異なるサンプルから生じた、シークエンサーレディ(sequencer-ready)産物に含まれ得る。したがって、サンプルインデックスは、特定の配列リードが属するサンプルを同定するために配列決定中、用いることができ、多重化を達成することができる。
一部の場合には、サンプルインデックスは、区画の使用又は追加の区画の発生の有無に関わらず、最初のバーコードのサンプル核酸への付加後、サンプルインデックスをサンプル核酸に付加することができる。一部の場合には、サンプルインデックスは一括で付加される。一部の場合には、サンプルインデックスのサンプル核酸への付加は、バーコードのサンプル核酸への付加の前に起こり得る。一部の場合には、サンプルインデックスのサンプル核酸への付加は、サンプルインデックスのサンプル核酸への付加と同時に、又は並行して起こり得る。
一部の場合には、サンプルインデックスは、バーコード配列のサンプル核酸の付加後、サンプル核酸に付加され得る。例えば、本明細書中の他の所で記載されているように、バーコード配列及び他の配列(例えば、P5、R1など)をサンプル核酸へ付着させるために増幅方法が用いられ得る。一部の場合には、例えば、配列決定のための部分的ヘアピン増幅(PHASE(Partial Hairpin Amplification for Sequencing) - 本明細書中の他の所で記載されている)などのランダムな増幅スキームが、バーコード配列及び他の配列をサンプル核酸へ付着させるのに助けとなる。一例において、それぞれが異なるランダムN mer、シークエンサー付着又は固定化部位(例えば、P5)、バーコード配列(例えば、同一のバーコード配列)、及び配列決定プライマー結合部位(例えば、R1)を含む、複数のプライマーが、サンプル核酸をランダムにプライミングして、増幅するために用いられる。シークエンサープライマー結合部位、バーコード配列、及び/又は配列決定プライマー結合部位のいずれかが、ウラシル含有ヌクレオチドを含み得る。プライマーはまた、サンプル核酸のプライミングがランダムN merを介してのみ起こることを確実にするためにプライマーの1つ以上の配列にプライマーにハイブリダイズしたオリゴヌクレオチドブロッカーを含んでもよい。例のプライマーの概略表示は以下の通りである(オリゴヌクレオチドブロッカーは示されていない):
P5-バーコード-R1-ランダムN mer
サンプル核酸のランダムなプライミング及び複数ラウンドの増幅は、シークエンサー付着又は固定化部位(例えば、P5)、バーコード、配列決定プライマー結合部位(例えば、R1)、及びランダムN merの一方の端に連結されたサンプル核酸の一部分を含むアンプリコンを生じることができる。それの他方の端において、サンプル核酸の部分は、配列決定プライマー結合部位に相補的、又は部分的に相補的である領域(例えば、R1c又はR1c部分)に連結することができる。(直線的配置における)例の配列の概略表示は以下の通りである:
P5-バーコード-R1-ランダムN mer-挿入断片-R1c,部分
但し、「挿入断片」は、増幅中コピーされたサンプル核酸の部分に対応する。コピーされたサンプル核酸の部分(挿入断片)の反対側の端における配列決定プライマー結合部位(例えば、R1)とそれの部分的相補体(例えば、R1c,部分)は、本明細書中の他の所で記載されているように、分子内でハイブリダイズして、部分的ヘアピン構造を形成することができる。
サンプル核酸のバーコードが付いた断片の生成後、上記で述べられているように、それらの断片をさらに増幅し、加えて、増幅されたバーコードが付いた断片に追加の機能性配列を付着させることが望ましい場合がある。この増幅は、例えば、PCR、LCR、線形増幅などを含む任意の適切な増幅プロセスを用いて行われ得る。典型的には、この増幅は、生成された断片における既知の末端配列に対してプライミングする、例えば、図38における付着配列3810と配列3814'の一方又は両方に対してプライミングする、標的化プライマーを用いて惹起され得る。さらに、これらのプライマー内に追加の機能性配列、例えば、P7などの追加の付着配列、追加の配列決定プライマー、例えば、read 2又はR2プライミング配列、加えて、任意のサンプルインデックス化配列を組み込むことにより、増幅されたバーコードが付いた断片をさらに形成することができる。
例として、部分的ヘアピンアンプリコンの発生後、ヘアピンを破壊し、ヘアピン構造に沿っての伸長をプライミングするために、部分的ヘアピンアンプリコンをヘアピンの二重鎖部分、例えば、配列3814'に相補的であるプライマーと接触させることにより、部分的ヘアピンアンプリコンの分子内ハイブリダイゼーションを破壊することができる。多くの場合、そのヘアピンを優先的に破壊するために、ヘアピン構造より強いハイブリダイゼーション親和性をもつこれらのプライマーを供給することが望ましい。それとして、少なくとも1つの例において、プライマーは、ロックド核酸(LNA)又はロックド核酸ヌクレオチドを含む。LNAには、リボ核酸塩基が、ヌクレオチドのリボース部分の2'-酸素と4'-炭素を接続する分子架橋を含むヌクレオチドが挙げられる。LNAは、一般的に、より高い融解温度及びより低いハイブリダイゼーションエネルギーを有する。したがって、LNAは、部分的ヘアピンアンプリコンのハイブリダイズした配列のいずれかに結合することにより、部分的ヘアピンアンプリコンの分子内ハイブリダイゼーションと有利に競合することができる。LNAを含むプライマー及び他のプライマーを介して破壊されたアンプリコンのその後の増幅は、その配列に付加される任意の追加の配列(サンプルインデックスを含む)を含む直鎖状産物を発生させることができる。
上記の例の部分的ヘアピン、P5-バーコード-R1-ランダムN mer-挿入断片-R1c,部分の配置について、部分的ヘアピンを、LNA及びR1c,部分に相補的な配列を含むプライマーと接触させることができる(例えば、図14C参照)。プライマーはまた、その構築物に付加される任意の追加の配列の相補体を含んでもよい。例えば、追加の配列(例えば、R2部分)は、R1c,部分に結合した時、追加の配列決定プライマー結合部位(例えば、R2)を発生する配列であり得る。プライマーの部分的ヘアピンとのハイブリダイゼーションは、部分的ヘアピンの分子内ハイブリダイゼーションを破壊し、その構築物を直線化することができる。ハイブリダイゼーションは、例えば、プライマーが、それの相補配列を介してR1c,部分とハイブリダイズするように起こり得る(例えば、図14C参照)。プライマーの伸長は、直線化された部分的ヘアピンアンプリコンに相補的な配列に連結されたプライマーを含む構築物を生じることができる。例の構築物の概略は以下の通りである:
P5c-バーコード,c-R1c-ランダムN mer,c-挿入断片,c-R1,部分-R2部分,c
但し、P5cはP5の相補体に対応し、バーコード,cはバーコードの相補体に対応し、ランダムN mer,cはランダムN merの相補体に対応し、挿入断片,cは挿入断片の部分の相補体に対応し、R1,部分-R2部分,cは、R2の相補体に対応する。
第2のプライマー(例えば、P5cでハイブリダイズするP5)でのさらなるラウンドの増幅を行うことにより、部分的ヘアピンアンプリコンの配列及びプライマーに相補的な配列を含む直鎖状構築物が発生し得る。例の配置の概略表示は以下の通りである:
P5-バーコード-R1-ランダムN mer-挿入断片-R1c,部分-R2部分、又は
P5-バーコード-R1-ランダムN mer-挿入断片-R2
但し、R1c,部分とR2部分の組み合わされた配列が、追加の配列決定プライマー結合部位(例えば、R2)に対応することができる。
追加のラウンドのそのような増幅を用いて、追加の配列を構築物に付加することができるが、多くの追加の配列/ラウンドの増幅が望まれる。上記の例のP5-バーコード-R1-ランダムN mer-挿入断片-R2構築物について、R2に相補的な配列 (例えば、R2c)、サンプルインデックス配列の相補体(例えば、SIc、SampleBarcode)、及び追加のシークエンサープライマー結合部位配列の相補体(例えば、P7c) を含むプライマーは、そのプライマーのR2cを介してR2で構築物にハイブリダイズすることができる(例えば、図14C参照)。プライマーの伸長は、構築物に相補的な配列に連結されたプライマーを含む構築物を生じることができる。例の配置の概略表示は以下の通りである:
P5c-バーコード,c-R1c-ランダムN mer,c-挿入断片,c-R2,c- Sic-P7c
第2のプライマー(例えば、P5cでハイブリダイズするP5)でさらなるラウンドの増幅を行うことにより、構築物配列、及びプライマーに相補的な配列を含むシークエンサーレディ構築物が発生し得る。そのようなシークエンサーレディ構築物の例の配置の概略表示は以下の通りである:
P5-バーコード-R1-ランダムN mer-挿入断片-R2-サンプルインデックス -P7
代替物として、開始プライマーは、バーコード配列、(P5及びR1の代わりに)P7及びR2を含んでもよい。例のプライマーの概略表示は以下の通りである:
P7-バーコード-R2-ランダムN mer
上記のような類似の増幅スキーム(例えば、LNAを含むプライマーでの増幅、追加のラウンドの増幅など)を用いて、配列決定されるサンプル核酸の一部分を含む挿入断片、P5、R1、及びサンプルインデックスは、シークエンサーレディ産物を生じるように、プライマーに付加することができる。例の産物の概略表示は以下の通りである:
P7-バーコード-R2-ランダムN mer-挿入断片-R1-サンプルインデックス-P5
他の場合には、サンプルインデックスは、バーコード配列のサンプル核酸への付加と同時にサンプル核酸に付加されてもよい。例えば、バーコードがサンプル核酸に結合する時、サンプルインデックスが同時に結合するように、バーコードが付いたサンプル核酸を作製するために用いられるプライマーは、バーコード配列とサンプルインデックスの両方を含み得る。サンプルインデックスは、プライマー配列内のどこに位置してもよい。一部の場合には、プライマーは、PHASE増幅などのランダムな増幅を介してバーコードが付いたサンプル核酸を発生させる能力があるプライマーであり得る。そのようなプライマーの例の概略表示には以下が挙げられる:
P5-バーコード-R1-サンプルインデックス-ランダムN mer
P5-バーコード-サンプルインデックス- R1-ランダムN mer
P5-サンプルインデックス-バーコード- R1-ランダムN mer
区画における代表的なプライマーでのサンプル核酸のランダムなプライミング及びサンプル核酸の増幅により、バーコード配列及びサンプルインデックス配列を含む部分的ヘアピンアンプリコンが生じ得る。上記プライマーから生じたそのような部分的ヘアピンアンプリコンの例の概略表示(直鎖状型で示されている)には、それぞれ以下が挙げられる:
P5-バーコード-R1-サンプルインデックス-ランダムN mer-挿入断片-R1c,部分
P5-バーコード-サンプルインデックス- R1-ランダムN mer-挿入断片-R1c,部分
P5-サンプルインデックス-バーコード- R1-ランダムN mer-挿入断片-R1c,部分
R1c,部分は、R1内のそれの相補配列と分子内でハイブリダイズして、部分的ヘアピンアンプリコンを形成することができる。
例として、一部の場合には、部分的ヘアピンアンプリコンの発生後、追加の配列(例えば、R2及びP7配列のような機能性配列)が、部分的ヘアピンアンプリコンに、例えば一括で、付加することができる。本明細書中の他の所で記載された増幅方法に類似した様式において、これらの機能性配列を含むプライマーが、例えば、上記の部分的ヘアピンの5'末端、例えば、R1c配列に対してプライミングすることにより、部分的ヘアピン分子の複製をプライミングするために用いられ得る。多くの場合、より強いプライミング及び複製を提供するために、例えば、ヘアピン構造の再ハイブリダイゼーションを打ち負かすように、より高い親和性プライマー配列を供給することが望ましい。そのような場合、例えば、LNAなどのような1つ以上のより高い親和性ヌクレオチド類似体をそれらの配列内に含む、より密接に結合するプライマー配列が、部分的ヘアピンアンプリコンを破壊して、追加の配列をアンプリコンに付加するために用いられ得る。例えば、上記の例に関して、プライマーは、LNA、R1c,部分に相補的な配列、及びR2部分の相補体を含む配列を含み得、その結果、プライマーが伸長されて、生じた産物が、P5プライマーを介してさらに増幅され、R1c,部分及びR2部分が連結されて、R2を生じる。上記プライマーから生じたそのような構築物の例の概略表示にはそれぞれ、以下が挙げられる:
P5-バーコード-R1-サンプルインデックス-ランダムN mer-挿入断片-R2
P5-バーコード-サンプルインデックス- R1-ランダムN mer-挿入断片-R2
P5-サンプルインデックス-バーコード- R1-ランダムN mer-挿入断片-R2
上記で述べられているように、追加のラウンドの増幅サイクルは、構築物に追加の配列を付加するために用いられ得る。例えば、プライマーは、R2に相補的な配列、及びP7の相補体を含む配列を含み得、その結果、プライマーが伸長され、生じた産物がP5プライマーを介してさらに増幅された時、P7がR2に連結され、シークエンサーレディ構築物が生じる。上記プライマーから生じたそのようなシークエンサーレディ構築物の例の概略表示にはそれぞれ、以下が挙げられる:
P5-バーコード-R1-サンプルインデックス-ランダムN mer-挿入断片-R2-P7
P5-バーコード-サンプルインデックス- R1-ランダムN mer-挿入断片-R2-P7
P5-サンプルインデックス-バーコード- R1-ランダムN mer-挿入断片-R2-P7
サンプル核酸の領域を増幅する能力があるプライマーへバーコード及びサンプルインデックスを(例えば、PHASE増幅を介して)組み合わせることは、サンプルインデックス化の並行化を可能にし得る。異なるサンプル由来の核酸をインデックス化するためにプライマーセットが用いられ得る。各プライマーセットは、特定のサンプルから得られた核酸分子と会合し得、多様なバーコード配列及び共通のサンプルインデックス配列を含むプライマーを含む。
一部の場合には、上記のようにサンプル核酸の増幅された断片に追加の機能性を与えるためだけでなく、それらの分子のより効率的なその後の処理、例えば、増幅及び/又は配列決定を保証するために、本明細書に記載された部分的ヘアピン分子の5'末端に追加の配列セグメントを付着させることが望ましくあり得る。例えば、部分的ヘアピン分子が伸長反応条件に供される場合、5'末端における伸長を通してそれ自体の「充填(filling in)」反応をプライミングすることにより、部分的ヘアピン構造が充填されやすくあり得る。結果として、それの二重鎖部分のより大きい安定性のおかげで、増幅するのがより困難である、完全なヘアピン構造が生成され得る。そのような場合、完全なヘアピン構造の形成を防ぐために、反対の末端配列に相補的ではない追加の配列セグメントを優先的に付着させることが望ましくあり得る。1つの例示的なプロセスにおいて、部分的ヘアピン構造の増幅のための上記のLNAプライマーが、追加のオーバーハング配列を有するように供給され得、そのオーバーハング配列には、例えば、上記のR2相補的配列、加えて、他の機能性配列構成成分に相補的である可能性がある配列、例えば、P7のような付着配列、サンプルインデックス配列などが挙げられる。その部分的ヘアピンの増幅のために部分的ヘアピン及びプライマーを上記の伸長反応に供することはまた、LNAプライマー上のオーバーハング配列に沿っての部分的ヘアピンの伸長を生じるだろう。伸長した配列は、単に非相補配列だけを含む場合もあるし、又はそれは、上記で述べられているように、追加の機能性配列若しくはそれらの相補体を含む場合もあり、その結果、伸長反応は、部分的ヘアピン構造の5'末端へのそれらの機能性配列の付着を生じる。
代替の態様において、追加の配列セグメントは、そのような配列セグメントがヘアピン構造の非重複部分に相補的ではない場合、部分的ヘアピン構造の5'末端にライゲーションされ得る。前述のことは、図40に概略的に示されている。パスAに示されているように、プライマー伸長条件に曝される場合の部分的ヘアピン構造は、それ自体のプライマーとして働き、それが、例えばほとんど、又は全くオーバーハング配列を有さずに、完全な、又はほぼ完全なヘアピン構造を形成するまで、それの5'配列を、破線矢印によって示されているように伸長され得る。この完全なヘアピン構造は、はるかに大きい二重鎖安定性を有し、それにより、より高い親和性プライマー、例えば、LNA含有プライマー/プローブを用いた場合でさえも、ヘアピン構造を破壊して、それの複製をプライミングする能力にマイナスの影響を与える可能性が高い。
この可能性を最小にするために、パスBとCの両方に示されているように、完全な、又はほぼ完全なヘアピン構造の発生を防ぐために、別個の配列セグメント4006がヘアピン構造の5'末端に付加されて、非相補的尾部配列を有する部分的ヘアピン4008を提供する。示されているように、これは、いくつかの異なる方法で達成され得る。例えば、パスBに示された第1のプロセスにおいて、侵入プローブ4010が用いられて、部分的ヘアピン構造を破壊し、配列セグメント4012にハイブリダイズし得る。そのような侵入プローブは、例えば、LNAなどのより高い親和性ヌクレオチド類似体の使用により、本来の部分的ヘアピン構造より高い親和性結合をもって提供され得る。特に、配列セグメント4012にハイブリダイズする侵入体配列4010のその部分は、その後の増幅に用いられるLNAプライマー配列に関して用いられる本明細書に記載された同じ様式で、それの配列内にLNAを含み得る。
パスBにおいて破線矢印によって示されているような部分的ヘアピン(及び配列セグメント4012)の5'部分の伸長は、その後、配列4006を部分的ヘアピン構造の5'末端に付け加えて、構造4008を与える。あるいは、配列4006は、部分的ヘアピン構造4002(又は配列セグメント4012)の5'末端にライゲーションされ得る。パスCに示されているように、これは、ライゲーションのために配列セグメント4012に隣接して配列4006を保持するために、配列4006に部分的に相補的であり、かつ配列4012に部分的に相補的であるスプリント(splint)配列4014の使用を通して達成される。認識されているように、スプリント配列4014は、再び、プローブ4010のようなより高い親和性侵入プローブを利用して、ヘアピン構造を破壊して、配列セグメント4012にハイブリダイズし得る。特に、この場合もやはり、配列セグメント4012にハイブリダイズすることを目的とするスプリント配列4014のその部分は、優先的に部分的ヘアピン構造4002を破壊し、配列4006のそれの5'末端へのライゲーションを可能にするために、それの配列内に1個以上のLNAヌクレオチド類似体を有するように、供給され得る。
一部の場合には、マイクロ流体デバイス(例えば、マイクロ流体チップ)は、サンプルインデックス化を並行化するのに有用であり得る。そのようなデバイスは、それぞれが、バーコード配列とサンプルインデックスの両方を含むプライマーを介して、バーコード配列及びサンプルインデックスをサンプルの核酸分子に付加する能力がある並行モジュールを含み得る。各並行モジュールは、各モジュールにおいて処理されるサンプルが異なるサンプルインデックス及びバーコードセットと会合するように、異なるサンプルインデックスを含むプライマーセットを含み得る。例えば、8つのモジュールを有するマイクロ流体デバイスは、8つの異なるサンプルをサンプルインデックス化する能力があり得る。その配列のサンプル核酸への付着を介してのバーコード付与及びサンプルインデックス化後、例えば、連続増幅を介しての追加の配列(例えば、R2、P7、他のバーコード配列)の一括付加を用いて、本明細書中の他の所で記載されているように、シークエンサーレディ産物を生じさせることができる。
一部の場合には、サンプルインデックス化は、バーコードをサンプル核酸に付着させるために用いられるプライマーにおいて、別個のサンプルインデックス配列を含めることなく、バーコード付与中に達成され得る。そのような場合、例えば、バーコード配列は、サンプルインデックスとしての役割も果たし得る。バーコード配列とサンプルインデックスの両方として機能する配列を有するシークエンサーレディ構築物の例の配置は以下の通りである:
P5-BSI-R1-ランダムN mer-挿入断片-R2-P7
但し、「BSI」は、バーコード配列とサンプルインデックスの両方として機能する配列である。
シークエンサーレディ産物は、配列リードを整列させ、サンプル核酸についての配列を提供するために用いることができるバーコード配列を含み得る。シークエンサーレディ産物は、例えば、本明細書中の他の所に記載されているようなPHASE増幅及びその後の一括増幅を用いて作製され得る。さらに、バーコード配列は、既知のバーコード配列の特定のセットに属してもよい。特定の配列決定リードが生じるサンプルの同定がリードバーコード配列を介して達成することができるように、バーコード配列セットが、特定のサンプルと会合され得る。各サンプルは、既知のバーコード配列セットと会合することができ、各バーコード配列セットが、他のサンプルと会合した他のバーコードセットにおけるバーコード配列と重複しないバーコード配列を含む。したがって、バーコード配列の固有性及びバーコード配列の異なるセット間でのそれの固有性が多重化のために用いられ得る。
例えば、配列決定リードは、バーコード配列「GAGCCG」を含み得る。バーコード配列「GAGCCG」は、サンプルAと会合した既知のバーコード配列のセットにおけるバーコード配列であり得る。その配列は、別のサンプルと会合した既知のバーコード配列のセットにおいては見出されない。配列「GAGCCG」を読み取った場合、その配列リードがサンプルAに関連付けられると決定することができ、配列「GAGCCG」が、サンプルAと会合したバーコード配列のセットに固有だからである。さらに、別の配列決定リードは、バーコード配列「AGCAGA」を含み得る。バーコード配列「AGCAGA」は、サンプルBと会合した既知のバーコード配列のセットにおけるバーコード配列であり得る。その配列は、別のサンプルと会合した既知のバーコード配列のセットにおいては見出されない。配列「AGCAGA」を読み取った場合、その配列リードがサンプルBに関連付けられると決定することができ、配列「AGCAGA」が、サンプルBと会合したバーコード配列のセットに固有だからである。
別の例において、サンプルインデックス配列は、バーコードをサンプル核酸に付着させるための1つ以上の増幅反応に用いられるプライマーのランダム配列に埋め込まれ得る。例えば、プライマーは、バーコード配列と、サンプル核酸をランダムにプライミングし、バーコード配列をサンプル核酸に付着させるために用いることができるランダム配列とを含み得る。一部の場合には、ランダム配列は、ランダム配列の特定の塩基が全プライマー間で保存されているように、偽ランダム配列であり得る。特定のサンプルから得られた全ての、シークエンサーレディ産物は全て、ランダム配列領域において保存された塩基のパターンを含むので、保存された塩基のパターンは、サンプルインデックスとして用いられ得る。各サンプルは、保存された塩基の異なるパターンと関連付けることができ、したがって、多重化を達成することができる。一部の場合には、パターンは、偽ランダム配列の連続した配列領域(例えば、「NNNATACNNN」)であり、他の場合には、パターンは、偽ランダム配列の非連続の配列領域(例えば、「NCNGNNAANN」)であり、但し、「N」はランダムな塩基に対応する。さらに、偽ランダム配列において任意のパターンで、任意の適切な数の塩基が保存されてもよく、本明細書に記載された例は、限定することを意図するものではない。バーコード配列とサンプルインデックスの両方として機能する配列を有するシークエンサーレディ構築物の例の配置は、以下の通りである:
P5-バーコード-R1- NQNQNNQQNN-挿入断片-R2-P7
但し、「Q」はランダム領域において保存された塩基である。
例えば、シークエンサーレディ産物は、10 merの偽ランダム配列「NCNGNNAANN」を含み得、但し、偽ランダム配列の2番目の塩基(「C」)、4番目の塩基(「G」)、7番目の塩基(「A」)、及び8番目の塩基(「A」)が、サンプルAから生じた、シークエンサーレディ全ての産物について保存されている。配列決定リードは、ランダム配列領域において保存された塩基のそのようなパターンを含み得る。その保存された塩基パターンを読み取った場合、その配列リードは、サンプルAに関連付けられると決定することができ、「NCNGNNAANN」という塩基の保存されたパターンはサンプルAに関連付けられているからである。さらに、シークエンサーレディ産物は、10 merの偽ランダム配列「NNGCNGNGNN」を含み得、但し、偽ランダム配列の3番目の塩基(「G」)、4番目の塩基(「C」)、6番目の塩基(「G」)、及び8番目の塩基(「G」)が、サンプルBから生じた、シークエンサーレディ全ての産物について保存されている。配列決定リードは、ランダム配列領域において保存された塩基のそのようなパターンを含み得る。その保存された塩基パターンを読み取った場合、その配列リードは、サンプルBに関連付けられると決定することができ、「NNGCNGNGNN」という塩基の保存されたパターンはサンプルBに関連付けられているからである。
他の場合には、バーコード配列のサンプル核酸への付加の前に、サンプルインデックスが、サンプル核酸に付加され得る。例えば、生じたアンプリコンがバーコード付与の前にサンプルインデックス配列に付着しているように、サンプル核酸が一括で事前増幅され得る。例えば、サンプルインデックス配列がサンプル核酸に付着できるように、サンプルが、サンプルインデックス配列を含むプライマーで増幅され得る。一部の場合には、プライマーは、(例えば、ランダムN merを含む)ランダムプライマーであり得、増幅はランダムであり得る。サンプルインデックスを含む産生されたアンプリコンは、その後、本明細書に記載されたバーコード付与方法を含む任意の適切な方法を用いてバーコードを付けることができる。
サンプル核酸分子は、上記のプライマーと共に、区画(例えば、エマルジョンの液滴)へと統合することができる。一部の場合には、各区画は、複数のサンプル核酸分子(例えば、より大きい核酸のより小さい小片)を含むことができる。一部の場合には、固有のサンプル核酸分子の1個以下のコピーが区画あたりに存在する。一部の場合には、各区画は、一般的に、同一のバーコード配列及びサンプルプライミング配列(例えば、可変ランダムN mer、標的化N mer)を含むプライマーを含むことができ、バーコード配列は一般的に、区画間で異なる。そのような場合、各区画(及び、したがって、区画内のサンプル核酸)は、固有のバーコード配列と会合することができ、固有のバーコード配列は、その区画において生じたバーコードが付いたサンプル核酸についての配列を決定するために用いることができる。
一部の場合には、バーコードが付いたサンプル核酸の発生により、バーコードが付いたサンプル核酸を、それらの個々の区画から放出し、プールし、一括増幅スキームに供して、全ての下流の、シークエンサーレディ産物に共通の追加の配列(例えば、追加の配列決定プライマー結合部位、追加のシークエンサープライマー結合部位、追加のバーコード配列、サンプルインデックス配列)を付加することができる。区画がエマルジョンの液滴で一部の場合、エマルジョンは、破壊され、バーコードが付いたサンプル核酸がプールされ得る。サンプルインデックスを、放出されたバーコードが付いたサンプル核酸に、例えば、本明細書に記載された連続増幅方法を用いて、一括で付加することができる。サンプルインデックスが一括で付加される場合、同じサンプルから生じた、シークエンサーレディ各産物は、シークエンサーレディ産物についてのリードが発生したサンプルを同定するために用いることができる同一のサンプルインデックスを含む。サンプルインデックスがバーコード付与中に付加される場合、バーコード付与のために用いられる各プライマーは、同一のサンプルインデックス配列を含み得、その結果、同じサンプルから生じた、シークエンサーレディ各産物は、同一のサンプルインデックス配列を含むだろう。
バーコード付与(又はバーコード付与かつサンプルインデックス化)サンプル核酸を作製するためのサンプル核酸の区画化、及びその後の、バーコードが付いたサンプル核酸への追加の配列(例えば、サンプルインデックスを含む)の付加は、サンプルごとに異なるサンプルインデックスを用いて、サンプルごとに繰り返すことができる。一部の場合には、マイクロ流体液滴発生装置が、サンプル核酸を区画化するために用いられ得る。一部の場合には、異なるサンプルが各液滴発生装置において処理され、並行したサンプルインデックス化を可能にすることができるように、マイクロ流体チップが複数の液滴発生装置を含み得る。各々の異なるサンプルインデックスを介して、配列決定中の多重化を達成することができる。
シークエンサーレディオリゴヌクレオチドの発生により、シークエンサーレディオリゴヌクレオチドは、その後、配列決定のために配列決定デバイスへ供給することができる。したがって、例えば、配列決定デバイスに供給される全配列は、配列決定デバイスと適合性のある1つ以上のアダプター(例えば、P5、P7)、1つ以上のバーコード配列、1つ以上のプライマー結合部位(例えば、Read1(R1)、配列プライマー、Read2(R2)配列決定プライマー、インデックスプライマー)、N mer配列、ユニバーサル配列、目的の配列、及びそれらの組み合わせを含み得る。バーコード配列は、配列のいずれかの端に位置し得る。一部の場合には、バーコード配列は、P5とRead1配列プライマー結合部位との間に位置し得る。他の場合には、バーコード配列は、P7とRead2配列プライマー結合部位との間に位置し得る。一部の場合には、第2のバーコード配列が、P7とRead2配列プライマー結合部位との間に位置し得る。インデックス配列プライマー結合部位は、バーコード配列を決定するための配列決定デバイスにおいて利用され得る。
シークエンサーデバイスに供給される配列の様々な構成成分(例えば、アダプター、バーコード配列、サンプルインデックス配列、サンプル配列、プライマー結合部位など)の配置は、例えば、望まれる特定の配置、及び/又は配列の様々な構成成分が付加される順序によって異なり得る。配列決定のための任意の適切な配置が用いられてもよく、任意の配列が、任意の適切な順序でオリゴヌクレオチドに付加され得る。追加の配列は、サンプル核酸のバーコード付与の前、付与中、及び付与後、サンプル核酸に付加されてもよい。例えば、P5配列は、サンプル核酸にバーコード付与中に付加することができ、P7は、サンプル核酸のバーコード付与後に一括増幅で付加することができる。あるいは、P7配列は、サンプル核酸にバーコード付与中に付加することができ、P5配列は、サンプル核酸のバーコード付与後に一括増幅で付加することができる。本明細書中に例として示された例の配置は、限定することを意図するものではない。さらに、配列構成成分のオリゴヌクレオチドへの増幅による付加もまた、限定することを意図するものではない。例えば、ライゲーションなどの他の方法もまた、用いられ得る。なおさらに、本明細書に記載された、アダプター、バーコード配列、サンプルインデックス配列、プライマー結合部位、シークエンサーレディ産物などは、限定することを意図するものではない。シークエンサーレディ産物を含む、本明細書に記載された任意の型のオリゴヌクレオチドが、本明細書に記載された方法を用いて、任意の適切な型の配列決定プラットフォーム(例えば、Illumina配列決定、Life Technologies Ion Torrent、Pacific Biosciences SMRT、Roche 454配列決定、Life Technologies SOLiD配列決定)について作製され得る。
シークエンサーレディオリゴヌクレオチドは、本明細書に記載された方法を用いて特定の配列決定プラットフォームに適した任意のアダプター配列で作製することができる。例えば、1つ以上のバーコード配列及びP1、並びにLife Technologies Ion Torrent配列決定において有用なAアダプター配列を含む、シークエンサーレディオリゴヌクレオチドが、本明細書に記載された方法を用いて作製され得る。一例において、ジスルフィド結合を介してP1配列に連結されたアクリダイト部分を含むビーズ(例えば、ゲルビーズ)が作製され得る。P1配列、バーコード配列、及びランダムN mer配列を含むバーコード構築物が作製され得る。バーコード構築物は、(例えば、流体液滴などの区画において)増幅反応に入って、サンプル核酸にバーコードを付け得る。その後、バーコードが付いたアンプリコンが、一括でさらなる増幅に供されて、A配列、及びサンプルインデックスなどの望まれる任意の他の配列を付加され得る。あるいは、Aがサンプルバーコード付与中に付加され、P1が一括で付加されるように、P1と A配列を交換することができる。その後、その完全な配列を、Ion Torrentシークエンサーへ入れることができる。他の配列決定プラットフォームについての他のアダプター配列(例えば、Life Technologies SOLiD配列決定についてのP1アダプター配列、Roche 454についてのA及びBアダプター配列など)を、類似した様式で付加することができる。
部分的ヘアピン分子を作製すること、及び、一部の場合には、完全なヘアピンの形成を防ぐことについて本明細書に記載されているが、一部の場合には、本明細書に記載されたバーコード配列を含む完全なヘアピン断片を提供することが望ましくあり得る。特に、そのような完全なヘアピン分子は、通常の配列決定ワークフローにおける二本鎖の二重鎖分子の1つの末端として単一のヘアピン分子の3'及び5'の端を扱うことにより、通常のサンプル調製工程にさらに供され得る。特に、通常のライゲーション工程を用いて、適切なアダプター配列を、それらが二重鎖分子の3'及び5'末端に付着されるのと同じ様式でヘアピン分子の3'と5'の両方の端に容易に付着させることができる。例えば、Illuminaに基づいた配列決定プロセスの場合、P5及びP7アダプターを含む標準Yアダプター、並びにR1及びR2プライマー配列を、標準Illuminaプロトコールを用いて、ヘアピンの1つの端に、あたかもそれが二重鎖分子の1つの端であるかのように、付着させることができる。
不要な増幅産物を低減する方法{配列決定のための部分的ヘアピン増幅(PHASE)}
ランダムN mer配列を使用して、ゲノムDNA(gNDA)等のサンプルをランダムにプライミングすることができる。一部の実施形態では、ランダムN merはプライマーを含むことができる。一部の場合には、ランダムN merはサンプルをプライミングすることができる。一部の場合には、ランダムN merはゲノムDNAをプライミングすることができる。一部の場合には、ランダムN merはDNA断片をプライミングすることができる。
加えて、ランダムN mer配列を別のオリゴヌクレオチドに付着させることもできる。このオリゴヌクレオチドはユニバーサル配列であり得る、並びに/又は配列決定デバイスに適合可能であり得る1種以上のプライマーリード配列(例えば、リード1プライマー部位、リード2プライマー部位、インデックスプライマー部位)、1種以上のバーコード配列、及び配列決定デバイスに適合可能であり得る1種以上のアダプター断片(例えば、P5、P7)を含有することができる。或いは、オリゴヌクレオチドはこれらのいずれも含まずに別の配列を含むことができる。
その後の増幅法により、ランダムN merによるサンプル核酸のプライミングを使用して、ランダムN merに結合しているオリゴヌクレオチド配列(例えば、バーコード配列を含むオリゴヌクレオチド配列)を、配列決定するサンプル核酸等のサンプル核酸に結合させることができる。サンプルをプライミングするためにランダムプライマーを利用することにより、例えば不要な増幅産物の生成に起因して顕著な配列リードエラーが導入される可能性がある。
不要な増幅産物を軽減するために、オリゴヌクレオチド配列の少なくとも一部分を、dTTP又はチミン含有ヌクレオチドの代わりとしてdUTP又はウラシル含有ヌクレオチドでそれぞれ置換することができる。一部の場合には、置換は完全であり得る(例えば、全てのチミン含有ヌクレオチドがウラシル含有ヌクレオチドに置換されている)、又はオリゴヌクレオチドのチミン含有ヌクレオチドの一部がウラシル含有ヌクレオチドで置換されているように部分的であり得る。一部の場合には、ランダムN mer配列に隣接するヌクレオチド配列の最大で約10個から約20個、最大で約10個から約30個、最大で約10個から40個又は最大で約5個から40個のヌクレオチドを除く全てのチミン含有ヌクレオチドを、dUTP又はウラシル含有ヌクレオチドで置換する。加えて、サンプル核酸の増幅に、ウラシル含有鋳型を受容しない又は処理しないポリメラーゼを使用することができる。この場合には、約10個から約20個のヌクレオチドである非ウラシル含有部分を増幅させることができ、dUTP又はウラシル含有ヌクレオチドを含む残余の部分は増幅され得ない。一部の場合には、dUTP又はウラシル含有ヌクレオチドを含むオリゴヌクレオチド配列の部分をN mer配列に隣接させることができる。一部の場合には、dUTP又はウラシル含有ヌクレオチドを含むオリゴヌクレオチド配列の部分をバーコード配列に隣接させることができる。アダプター断片、バーコード又はリードプライマー配列等のオリゴヌクレオチド配列のあらゆる部分は、オリゴヌクレオチド配列の立体配置に応じて、(例えばチミン含有ヌクレオチドの代わりに)dUTP又はウラシル含有ヌクレオチドを含むことができる。
更に、オリゴヌクレオチドにおけるチミン含有ヌクレオチド置換用のウラシル含有ヌクレオチドの数及び位置を使用して、例えば、下記に記載する増幅法により得られる部分的ヘアピン産物のサイズを調整することができる、及び/又はポリメラーゼ酵素とウラシル含有プライマー配列との結合を調整することができる。加えて、遊離ウラシル含有ヌクレオチド、例えばUTP又はこの類似体を所望の濃度で反応混合物内に、例えば区画内に供給して、ポリメラーゼ/ウラシルプライマー結合動態を媒介することもできる。一部の場合には、部分的ヘアピン産物がより小さくなることにより、配列決定結果をより正確にすることができる。従って、オリゴヌクレオチドは、例えばオリゴヌクレオチドから生成される部分的ヘアピン産物の所望の長さに応じて、少なくとも1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個、13個、14個、15個、16個、17個、18個、19個、20個、21個、22個、23個、24個、25個、26個、27個、28個、29個、30個又はそれ以上の、チミン含有ヌクレオチド置換用のウラシル含有ヌクレオチドを含むことができる。
オリゴヌクレオチド配列(例えば、上記に記載したウラシル含有ヌクレオチドを含むオリゴヌクレオチド配列)に結合したランダムN merによるサンプル核酸のランダムプライミング時に(図15A)、(例えば、鋳型としてウラシル含有ヌクレオチドを受容しない又は処理しないポリメラーゼを使用する)増幅の第1のラウンドにより、オリゴヌクレオチド配列をサンプル核酸の相補体に付着させることができる(図15B及び図15C)。(ランダムN merによる)プライミング時に、及びランダムN merを含むオリゴヌクレオチド配列の別のコピーによる増幅産物の更なる増幅時に(図15D)、オリゴヌクレオチド配列の反対側での増幅産物の末端において、オリゴヌクレオチド配列、サンプル核酸配列の一部及び部分的相補オリゴヌクレオチド配列(例えば、オリゴヌクレオチド配列のウラシル含有ヌクレオチドを含まない部分に対して相補的である)を含む増幅産物を生成することができる。部分的相補オリゴヌクレオチド配列及びオリゴヌクレオチド配列をハイブリダイズさせて、いくつかの場合にはもはや核酸増幅に関与し得ない部分的ヘアピンを形成することができる。部分的ヘアピンを生成することができ、なぜならば、元々のオリゴヌクレオチド配列のウラシル含有ヌクレオチドを含む部分がコピーされなかったからである。ランダムN merを含む全てのオリゴヌクレオチド配列が使い尽くされるまで、所望の数のサイクル(例えば、5サイクル、10サイクル、15サイクル、20サイクル、25サイクル、30サイクル、35サイクル、40サイクル、45サイクル又は50サイクル)にわたり増幅は連続することができる(図15E〜図15G)。
一部の実施形態では、付着したオリゴヌクレオチド配列の部分ではなくランダムN merのみによるサンプル核酸{例えばゲノムDNA(gDNA)}のプライミングを確かなものとするために、ブロッカーオリゴヌクレオチド(例えば図15における黒色のダンベル)のハイブリダイゼーションによりオリゴヌクレオチド配列をブロックすることができる。ブロッカーオリゴヌクレオチド(本明細書の別の箇所においてオリゴヌクレオチドブロッカーとも称される)を、バーコード配列、リードプライマー部位配列、オリゴヌクレオチドのウラシル含有部分の全て若しくは一部、又はオリゴヌクレオチドの全ての若しくは任意の他の部分、又はオリゴヌクレオチドにおけるその他の配列等のオリゴヌクレオチド配列の任意の部分にハイブリダイズさせることができる。ブロッカーオリゴヌクレオチドはDNA又はRNAであり得る。一部の場合には、ブロッカーオリゴヌクレオチドは、チミン含有ヌクレオチド置換用のウラシル含有ヌクレオチドを含むことができる。一部の場合には、ブロッカーオリゴヌクレオチドのチミン含有ヌクレオチドの全てをウラシル含有ヌクレオチドで置換することができる。一部の場合には、ブロッカーオリゴヌクレオチドのチミン含有ヌクレオチドの一部をウラシル含有ヌクレオチドで置換することができる。一部の場合には、ブロッカーオリゴヌクレオチドは、ロックド核酸(LNA)、LNAヌクレオチド、架橋核酸(BNA)及び/又はBNAヌクレオチドを含むことができる。更に、ブロッカーオリゴヌクレオチドは、ブロッカー機能に必要な任意の適した長さであり得る。ブロッカーオリゴヌクレオチドは、オリゴヌクレオチドの一部をブロックするのに適した長さであり得る、又はブロックするように設計されているオリゴヌクレオチドと同じ長さ若しくは実質的に同じ長さであり得る。ブロッカーオリゴヌクレオチドは、オリゴヌクレオチド配列のその他の部分ではなくランダムN merのみのサンプル核酸(例えばゲノムDNA)への結合を確かなものとすることができる。
オリゴヌクレオチドに対するブロッカーオリゴヌクレオチドの化学量論比(例えばブロッカーオリゴヌクレオチド:オリゴヌクレオチド)は変動することができる。例えば、ブロッカーオリゴヌクレオチド:オリゴヌクレオチドの化学量論比は、約0.01、約0.05、約0.10、約0.15、約0.20、約0.25、約0.30、約0.35、約0.40、約0.45、約0.50、約0.55、約0.60、約0.65、約0.70、約0.75、約0.80、約0.85、約0.90、約0.95、約1.00、約1.05、約1.10、約1.15、約1.20、約1.25、約1.30、約1.35、約1.40、約1.45、約1.50、約1.55、約1.60、約1.65、約1.70、約1.75、約1.80、約1.85、約1.90、約1.95、約2.00、約2.10、約2.20、約2.30、約2.40、約2.50、約2.60、約2.70、約2.80、約2.90、約3.00、約3.50、約4.00、約4.50、約5.0、約5.5、約6.0、約6.5、約7.0、約7.5、約8.0、約8.5、約9.0、約10.0、約20、約30、約40、約50、約100又はそれ以上であり得る。一部の場合には、ブロッカーオリゴヌクレオチド:オリゴヌクレオチドの化学量論比は、少なくとも約0.01、約0.05、約0.10、約0.15、約0.20、約0.25、約0.30、約0.35、約0.40、約0.45、約0.50、約0.55、約0.60、約0.65、約0.70、約0.75、約0.80、約0.85、約0.90、約0.95、約1.00、約1.05、約1.10、約1.15、約1.20、約1.25、約1.30、約1.35、約1.40、約1.45、約1.50、約1.55、約1.60、約1.65、約1.70、約1.75、約1.80、約1.85、約1.90、約1.95、約2.00、約2.10、約2.20、約2.30、約2.40、約2.50、約2.60、約2.70、約2.80、約2.90、約3.00、約3.50、約4.00、約4.50、約5.0、約5.5、約6.0、約6.5、約7.0、約7.5、約8.0、約8.5、約9.0、約10.0、約20、約30、約40、約50、約100又はそれ以上であり得る。一部の場合には、ブロッカーオリゴヌクレオチド:オリゴヌクレオチドの化学量論比は、最大で約0.01、約0.05、約0.10、約0.15、約0.20、約0.25、約0.30、約0.35、約0.40、約0.45、約0.50、約0.55、約0.60、約0.65、約0.70、約0.75、約0.80、約0.85、約0.90、約0.95、約1.00、約1.05、約1.10、約1.15、約1.20、約1.25、約1.30、約1.35、約1.40、約1.45、約1.50、約1.55、約1.60、約1.65、約1.70、約1.75、約1.80、約1.85、約1.90、約1.95、約2.00、約2.10、約2.20、約2.30、約2.40、約2.50、約2.60、約2.70、約2.80、約2.90、約3.00、約3.50、約4.00、約4.50、約5.0、約5.5、約6.0、約6.5、約7.0、約7.5、約8.0、約8.5、約9.0、約10.0、約20、約30、約40、約50又は約100であり得る。
更に、{例えば、ブロッカーオリゴヌクレオチドの3'末端で若しくは5'末端でジデオキシヌクレオチド(ddNTP)、ddCTP、ddATP、ddGTP、ddTTP等を介する}ブロッカー部分のブロッカーオリゴヌクレオチドへの組み込み及び/又はブロッカーオリゴヌクレオチド中でのウラシル含有ヌクレオチド(例えば、チミン含有ヌクレオチドの全て又は一部が置換される)の包含により、ブロックされたオリゴヌクレオチド配列のブロックされた部分のサンプル核酸への優先的な結合を防ぐことができる。ブロッカー部分の追加の例として、3'ホスフェート、ブロックされた3'末端、3'ddCTP、C3スペーサー(/3SpC3/)、ジデオキシ-C(/3ddc/)が挙げられる。RNエース、RNエースH、アンチセンスDNAオリゴヌクレオチド及び/又はアルカリホスファターゼにより、ブロッカーオリゴヌクレオチドをオリゴヌクレオチド配列から切断することができる。
一部の場合には、ブロッカーオリゴヌクレオチドによりオリゴヌクレオチド配列をブロックすることができ、その結果、オリゴヌクレオチド配列は、ブロックされた5'末端を含む、ブロックされた3'末端を含む、完全にブロックされ得る(例えば、そのランダムN mer配列を除いて完全にブロックされ得る)、又は別の位置(例えば、オリゴヌクレオチド配列のランダムN merとは異なるオリゴヌクレオチドの部分配列)でブロックされ得る。一部の場合には、オリゴヌクレオチド配列は複数のブロッカーを含むことができ、その結果、オリゴヌクレオチドの複数の部位がブロックされる。一部の場合には、オリゴヌクレオチド配列は、ブロックされた3'末端とウラシル含有ヌクレオチドとの両方を含むことができる。一部の場合には、ウラシル含有ヌクレオチドとブロックされた3'末端とを含むオリゴヌクレオチド配列はN mer配列に隣接することができる。一部の場合には、オリゴヌクレオチド配列は、ブロックされた3'末端を含むことができる。一部の場合には、オリゴヌクレオチド配列はウラシル含有ヌクレオチドを含むことができる。一部の場合には、オリゴヌクレオチド配列は、ブロックされた5'末端とウラシル含有ヌクレオチドとの両方を含むことができる。
一部の場合には、ウラシル含有ヌクレオチドとブロックされた3'とを含むオリゴヌクレオチド配列はN mer配列に隣接することができる。一部の場合には、ウラシル含有ヌクレオチドとブロックされた3'とを含むオリゴヌクレオチド配列はバーコード配列に隣接することができる。一部の場合には、オリゴヌクレオチドは、ブロックされた3'末端を含むことができる。一部の場合には、オリゴヌクレオチド配列はウラシル含有ヌクレオチドを含むことができる。一部の場合には、オリゴヌクレオチド配列は、ブロックされた3'末端とウラシル含有ヌクレオチドとの両方を含むことができる。ブロッカーオリゴヌクレオチドの付加により、ユニバーサル配列の部分への優先的な結合を防ぐことができ、このユニバーサル配列が増幅されることが望ましくない場合がある。
一部の場合には、そのランダムN merによりサンプル核酸をプライミングするのに適したオリゴヌクレオチドは、ブロッカーオリゴヌクレオチドと同じ役割で機能することができるブロッキング配列も含むことができる。例えば、ブロッカーオリゴヌクレオチドと同じ役割で機能することができるブロッキング配列により、オリゴヌクレオチドをヘアピン構造中に配置することができる。ランダムN mer、R1c配列、P5配列、バーコード配列及びR1配列を含む例示的オリゴヌクレオチドを下記のように構成することができる:
5'-ランダムN mer-R1c-P5-バーコード-R1-3'
オリゴヌクレオチドのR1配列及びR1c配列をハイブリダイズさせて、P5配列及びバーコード配列を含むヘアピンループを有するヘアピンを生成することができる。R1c配列はブロッカーオリゴヌクレオチドと同じ役割で機能することができ、その結果、オリゴヌクレオチドのランダムN merのみにより、オリゴヌクレオチドによるサンプル核酸のプライミングが生じる。一部の場合には、1つ以上の切断部位(例えば、制限部位、切断部位、脱塩基部位等)を、オリゴヌクレオチドのヘアピンループ等のブロッキング配列を有するヘアピンとして配置されたオリゴヌクレオチドに含めて、必要に応じてオリゴヌクレオチドの下流の配列構成成分を分離することができる。例えば、酵素反応、酸化-還元、放射線(例えばUV光)、熱の付加又はその他の適切な手段により、分離が生じることができる。
ランダムN merに結合した例示的ウラシル含有ヌクレオチド置換オリゴヌクレオチド配列を図14Bに示す。具体的には、約8N〜12Nの長さのランダムプライマー(例えばランダムN mer)1404をオリゴヌクレオチド配列と結合させることができる。ランダムN merを使用してゲノムDNA(gDNA)等のサンプル核酸をランダムにプライミングし、該サンプル核酸から伸長することができる。オリゴヌクレオチド配列は下記を含む:(1)フローセル等の配列決定デバイスとの適合性のための配列(例えば、Illumina社のP5 1401及びリード1プライマー部位1402)、並びに(2)バーコード(BC)1403(例えば6〜12塩基の配列)。更に、オリゴヌクレオチド配列のリード1プライマー部位1402を、ウラシル含有ヌクレオチドとその3'末端でのブロッカー部位(例えば、3'ddCTP、「X」で示す)とを含むブロッキングオリゴヌクレオチドとハイブリダイズさせることができる。ブロッキングオリゴヌクレオチドを使用して、ランダムN mer配列のみによるサンプル核酸のプライミングを促進させることができる、及びサンプル核酸のリード1プライマー部位1402に対して相補的である部分へのオリゴヌクレオチド配列の優先的な結合を防ぐことができる。任意選択で、産物の長さを更に制限するために、わずかな割合の終結ヌクレオチド{例えば、0.1〜2%のアシクロヌクレオチド(acyNTP)}(図16B)をオリゴヌクレオチド配列に含ませて、不要な増幅産物を低減することができる。
ランダムN merを含むウラシル含有ヌクレオチド置換オリゴヌクレオチド配列をサンプル核酸{例えばゲノムDNA(gDNA)}に付着させるための部分的ヘアピン増幅の一例を図15に示す。まず、サンプル核酸の最初の変性を変性温度(例えば2分にわたる98℃)で達成させ、続いてプライミング温度(例えば4℃で30秒)でランダムN mer配列によりサンプル核酸のランダムな部分をプライミングする(図15A)。オリゴヌクレオチド配列をブロッキングオリゴヌクレオチド(図15中の黒色のダンベル)とハイブリダイズさせ、ランダムN merのみがサンプル核酸をプライミングし、オリゴヌクレオチド核酸の別の部分はプライミングしないことを確かなものとする。その後、より高い温度までの温度傾斜{例えば、45℃まで0.1℃/秒(1秒にわたり保持)}として、(例えば、鋳型としてウラシル含有ヌクレオチドを受容しない又は処理しないポリメラーゼによる)配列伸長が続くことができる(図15A)。次いで、高温で伸長が続くことができ(例えば70℃で20秒)、上流鎖を置換し続ける及び重複の第1の段階を作り続ける(図15B)。次いで、変性温度(例えば30秒にわたり98℃)で増幅産物の変性を生じさせ、更なるプライミングのためにサンプル核酸及び増幅産物を放出させることができる。
最初のサイクル後、増幅産物は、オリゴヌクレオチド配列を含む単一の5'タグ(図15C)を有する。これら上述した工程を繰り返し、オリゴヌクレオチド配列のランダムN merにより、このオリゴヌクレオチド配列を有する増幅産物及びサンプル核酸をプライミングする。黒色の配列は、ウラシル含有ヌクレオチドを含む、付加された5'タグ(サイクル1で付加される)の部分を示し、そのため、増幅産物のプライミング及び増幅時にコピーされ得ない(図15D)。増幅の第2のラウンドの後、5'のタグが付された産物と3'及び5'のタグが付された産物との両方を生成することができる(図15E)。3'及び5'のタグが付された産物は、一方の末端で完全オリゴヌクレオチド配列を含み、オリゴヌクレオチドの他方の末端で、サンプル核酸配列と、オリゴヌクレオチド配列に対して部分的に相補的な配列(例えば、ウラシル含有ヌクレオチドを含まないオリゴヌクレオチド配列の領域に対して相補的である)とを含む。オリゴヌクレオチド配列をその部分的に相補的な配列とハイブリダイズさせて、部分的ヘアピン構造を生成することができる(図15F)。全てのオリゴヌクレオチド配列が使い尽くされるまで、所望の数のサイクル(例えば最高で20回)にわたり増幅は何度も連続することができる(図15G)。
部分的ヘアピンの形成により、コピーのコピーを生成することを防ぐことができ、代わりに、生成すべき元々の鋳型のコピーのみを促進することができ、そのため、潜在的な増幅の偏り及びその他の人為的結果が低減される。部分的ヘアピンの形成により、所望の産物の分離を促進することができる、及びコピーの生成を低減することができる。
部分的ヘアピンを形成するためにウラシル非リーディングポリメラーゼに望ましい特性として、エキソヌクレアーゼ欠乏性ポリメラーゼ(例えば、低エキソヌクレアーゼ活性を有する、エキソヌクレアーゼ活性を実質的に有しない、エキソヌクレアーゼ活性を有しない)、鎖置換能力(例えば、熱安定性の鎖置換ポリメラーゼ酵素)、<50℃の温度での残留活性、及びチミン含有ヌクレオチドに対するウラシル含有ヌクレオチドの識別を挙げることができる。そのようなポリメラーゼの例として、9度North(9 degrees North)、改変型(NFB)、エクソマイナスPfu(exo minus Pfu)、Deep Ventエクソマイナス(Deep Vent exo minus)、Ventエクソマイナス(Vent exo minus)及びこれらの相同体を挙げることができる。更に、低エキソヌクレアーゼ活性を有するポリメラーゼは、正常なエキソヌクレアーゼ活性を有する熱的に安定なポリメラーゼ(例えばTaqポリメラーゼ)の90%未満、80%未満、70%未満、60%未満、50%未満、40%未満、30%未満、20%未満、10%未満、5%未満又は0%のエキソヌクレアーゼ活性を有するポリメラーゼであり得る。一部の場合には、部分的ヘアピン増幅に使用するポリメラーゼは鎖を置換することができる。一部の場合には、増幅配列の長さを制限することにより、より長い産物がバーコード配列等の不要な上流部分を含む可能性がある不要な増幅産物を低減することができる。停止ヌクレオチドの包含により、増幅産物の長さを制限することができる。停止ヌクレオチドの例として、アシクロヌクレオチド(acyNTP)を挙げることができる。停止ヌクレオチドは、増幅産物の長さの約0%、約0.1%、約0.2%、約0.3%、約0.4%、約0.5%、約0.6%、約0.7%、約0.8%、約0.9%、約1%、約1.1%、約1.2%、約1.3%、約1.4%、約1.5%、約1.6%、約1.7%、約1.8%、約1.9%、約2%、約2.1%、約2.2%、約2.3%、約2.4%又は約2.5%で存在することができる。一部の場合には、停止ヌクレオチドは、増幅産物の長さの約0%超、約0.1%超、約0.2%超、約0.3%超、約0.4%超、約0.5%超、約0.6%超、約0.7%超、約0.8%超、約0.9%超、約1%超、約1.1%超、約1.2%超、約1.3%超、約1.4%超、約1.5%超、約1.6%超、約1.7%超、約1.8%超、約1.9%超、約2%超、約2.1%超、約2.2%超、約2.3%超、約2.4%超、約2.5%又はそれ以上で存在することができる。一部の場合には、停止ヌクレオチドは、増幅産物の長さの約0%未満、約0.1%未満、約0.2%未満、約0.3%未満、約0.4%未満、約0.5%未満、約0.6%未満、約0.7%未満、約0.8%未満、約0.9%未満、約1%未満、約1.1%未満、約1.2%未満、約1.3%未満、約1.4%未満、約1.5%未満、約1.6%未満、約1.7%未満、約1.8%未満、約1.9%未満、約2%未満、約2.1%未満、約2.2%未満、約2.3%未満、約2.4%未満又は約2.5%未満で存在することができる。
PHASE増幅の開始の前のサンプル核酸の事前増幅により、増幅産物の長さを制御することもできる。例えば、サンプル核酸の事前増幅のためにランダムN merを使用することができる。ランダムN merを使用してサンプル核酸をプライミングし、続いて適切なサーマルサイクル条件を使用してプライマーを伸長させることができる。サンプル核酸のランダムプライミングに加えて、サーマルサイクル条件(例えば、サーマルサイクルの数、用いる温度、サイクル時間、全実行時間等)により産物の長さを制御することができる。一部の場合には、元々のサンプル核酸に比べて小さい事前増幅産物を得ることができる。次いで、事前増幅中に生成される増幅産物をPHASE増幅に入れて上記に記載したようにバーコードを付けることができる。
図17に示すように、ブロッキングオリゴヌクレオチドの追加により、開始部位の偏りを50%低減することができる。チミン含有ヌクレオチドの代わりにウラシル含有ヌクレオチドをユニバーサル配列に組み込むことにより、及びウラシル含有鋳型を受容しない又は処理しないポリメラーゼを使用することにより、図21及び図22で報告するように、配列決定エラーを著しく低減することができる。例えば、Q40エラーを約0.002から約0.001に低減することができ、マッピングされない割合の限度を約0.996から約0.03に低減することができ、中央値挿入サイズを約399から約310に低減することができ、IQR挿入サイズを約413から約209に低減することができ、ゼロ被覆度の割合を約0.9242から約0.0093に低減することができる。
ウラシル含有ヌクレオチドによるチミン含有ヌクレオチドの置換に関与しない増幅スキームを部分的ヘアピン種の生成のために予想することもできる。一部の場合には、ポリメラーゼにより認識され得ない又はコピーされ得ないその他の種(例えば、メチル化塩基、脱塩基部位、嵩高い側基に結合した塩基等)をウラシル含有ヌクレオチドの代わりに使用して、部分的ヘアピンアンプリコンを生成することができる。一部の場合には、完全ヘアピンアンプリコンを生成することができ、合成後に処理して部分的ヘアピン種を生成することができる。一部の場合には、完全ヘアピンアンプリコンを生成し、その後に一部を除去して部分的ヘアピン種を生成することができる。例えば、図34Aに示すように、ランダムN merを含むオリゴヌクレオチドプライマーがウラシル含有ヌクレオチドを含まない及び/又はウラシル含有鋳型を受容することができる若しくは処理することができるポリメラーゼを増幅に使用する場合に、図15に示す増幅スキームにより完全ヘアピンアンプリコン3401を生成することができる。完全ヘアピンアンプリコン3401の生成時に、1つ以上の適切な部位で完全ヘアピンアンプリコンに(例えば、制限酵素若しくはニッカーゼ等のその他の部位特異的酵素により)酵素的に又は化学的に切れ目を入れて(3403)、部分的ヘアピン種3402を生成することができる。
一部の場合には、完全ヘアピンアンプリコンを生成し、完全ヘアピンアンプリコンに部分追加して部分的ヘアピン種を生成することができる。例えば、図15に示す増幅スキームにより、ランダムN merに結合している配列決定プライマー結合部位(例えばR1)を含む及びウラシル含有ヌクレオチドを含まないプライマーを使用して、サンプル核酸を増幅させることができる、及び完全ヘアピンアンプリコン{例えば、配列決定プライマー結合部位(例えばR1)、コピーされたサンプル核酸及び配列決定プライマー結合部位(例えばR1c)とハイブリダイズした配列決定プライマー結合部位に対する相補体3404を含む完全ヘアピン、図34B}を生成することができる。完全ヘアピンアンプリコン3404の生成時に、完全ヘアピンアンプリコンは、例えばライゲーション3406により追加の配列(例えば、P5配列及びバーコード配列を含む配列)3405を有することができる。
一部の場合には、完全ヘアピン増幅の生成に使用することができるプライマー(例えばランダムN merを含むオリゴヌクレオチド)を、例えばリンカー(例えば、核酸を含まないリンカー又は増幅に関与しない核酸を含むリンカー)により、追加の配列を含むように共有結合で修飾することができる。一部の場合には、リンカーは、ポリエチレングリコール又は炭素ベースのリンカーであり得る。そのため、(例えば、図15に示す増幅スキームにより)プライマーから生成された完全ヘアピンアンプリコンを、リンカーにより追加の配列に共有結合させることもできる。次いで、付着した配列を完全ヘアピンアンプリコンにライゲーションさせて部分的ヘアピン種を生成することができる。リンカー3407により追加の配列3408を含む完全ヘアピンアンプリコン3409の例を図34Cに示す。完全ヘアピンの生成後に、追加の配列3408を完全ヘアピンアンプリコン3409にライゲーションさせ、その結果、追加の配列3408を含む部分的ヘアピン種(3410)を生成することができる。
標的化N mer及び標的増幅
ランダム増幅スキームに加えて、標的プライミング配列(例えば標的化N mer)を含むバーコード構築物(例えば、サンプル核酸をプライミングするためにバーコード配列及びN merを含むオリゴヌクレオチド)並びに標的増幅スキームも予想される。標的増幅スキームは、例えば、配列決定法による目的の特定の遺伝子又は配列の検出で有用であり得る、特定の種類の核酸の検出で有用であり得る、ある配列を含む核酸の特定の鎖の検出で有用であり得る、及びこれらの組み合わせであり得る。一般に、標的増幅スキームは、特定の核酸配列の増幅の完了を標的化プライマーに依存する。一部の例では、目的の特定の遺伝子配列又は目的の特定の遺伝子配列の特定の配列上流を標的とするプライマーの使用により、PCR法を標的増幅に使用することができ、その結果、目的の特定の遺伝子配列がPCR中に増幅される。
上記に記載したPHASE増幅反応を、サンプル核酸の標的増幅が達成されるように改変することもできる。上記に記載したように、ランダム配列(例えばランダムN mer)ではなく標的プライミング配列(例えば標的化N mer)を含むバーコード構築物を使用して、PHASE増幅中に特定の配列をプライミングすることができる。具体的な配列は、例えば、アンプリコンの生成が配列の存在を示すような目的の特定の遺伝子配列であり得る。或いは、具体的な配列は、目的の特定の遺伝子配列から上流であることが既知である配列であり得る。そのような構築物を生成することができ、必要に応じて、本明細書に記載する方法のいずれかを使用してビーズに結合させることができ、この方法として、図4に示した限界希釈スキーム及び本明細書の別の箇所に記載した組み合わせプレートスキームが挙げられる。
例えば、図4を参照して既に説明したように、プライマー403(例えばP5)、バーコード配列408及びリードプライマー結合部位(例えばR1)415を含む構築物を生成することができる(図4A〜図4Hを参照されたい)。図4Iに示すように、リードプライマー結合部位415に相補的な配列412を含むプライマーにより、追加の配列413を(任意選択で大量に)構築物に追加することができる。配列413は標的化配列(例えば標的化N mer)として作用することができ、その結果、標的化配列は目的の特定の標的配列に対応する。構築物は、標的化核酸のみがサンプル核酸をプライミングし、構築物のその他の配列部分はサンプル核酸をプライミングしないことを確かなものとするために、本明細書の別の箇所に記載したようにオリゴヌクレオチドブロッカーを含むこともできる。完成した構築物のサンプル核酸とのPHASE反応への参加時に、例えば、標的構築物はサンプル核酸を(例えば所望の配列部位で)プライミングすることができ、増幅反応は、上記に記載したようにサンプル核酸から部分的ヘアピンの生成し始めることができる。一部の場合には、標的化N merプライマーとランダムN merプライマーとの組み合わせを使用して、部分的ヘアピンアンプリコンを生成する。一部の場合には、標的増幅は、特定の標的のための増幅中に生成される部分的ヘアピンアンプリコンのサイズ(例えば配列長)の制御に有用であり得る。
一部の場合には、バーコード配列及び標的化N merを含む複数の構築物をビーズ(例えばゲルビーズ)に結合させることができる。一部の場合には、複数の構築物は、同一のバーコード配列及び/又は同一の標的化N mer配列を含むことができる。一部の場合には、標的化N mer配列は複数の個々の構築物の間で異なることができ、その結果、サンプル核酸上の複数の標的配列を様々な標的化N merによりプライミングすることができる。上記に記載したように、(例えば流体液滴中において)ビーズをサンプル核酸とともに区画することができ、各区画中のビーズが分解されて、結合した構築物が区画中に放出され、サンプル核酸が構築物の標的化N merにより増幅される。生成されたアンプリコンの後処理{例えば、追加の配列(例えば、P7、R2)の追加、サンプルインデックスの追加等}を、多量増幅法(例えば大量PCR (bulk PCR))及び大量ライゲーション等の本明細書に記載した任意の方法により達成することができる。
区画中では、バーコード配列及び標的化N merを含む構築物は、ビーズに結合され得る、溶液中で遊離している(例えば、流体液滴の水性内部中に遊離している)ことができる、又はこれらの両方であり得る。更に、区画は、標的構築物(例えば標的化N mer配列を含む構築物)と非標的構築物(例えばランダムN mer配列を含む構築物)との両方を含むことができる。標的構築物及び非標的構築物の各々をビーズに結合させることができ、これら2種の内の一方をビーズに結合させることができ、どちらかの構築物が区画内の溶液中であることもできる。
各種の構築物が区画中に存在する場合には、サンプル核酸の標的化増幅及び非標的化増幅の両方が起こる場合がある。例えば、PHASE増幅反応に関しては、標的化バーコード構築物を使用して、サンプル核酸を最初にプライミングして該サンプル核酸から伸長することができる。一般に、これらの工程は、図15A〜図15Cに関して上記に記載したPHASE増幅の最初のサイクルに対応しているが、但し、最初のプライミングに標的構築物を使用する。次いで、伸長産物を、ランダムN merを含むバーコード構築物でプライミングすることができ、その結果、部分的ヘアピンが生成され、この工程は、図15D〜図15Fに関して上記に記載したPHASEの2番目のサイクルに対応する。所望の数のラウンドが完了するまで、更なるラウンド(例えば図15G)にわたり増幅は連続することができる。生成された部分的ヘアピンアンプリコンの後処理{例えば、追加の配列(例えば、P7、R2)の追加、サンプルインデックスの追加等)を、大量増幅法(例えば大量PCR)及び大量ライゲーション等の本明細書に記載した任意の方法により達成することができる。
更に、構築物の標的化N merがDNA以外の核酸種、例えばRNA種を対象とするような標的化バーコード構築物を生成することができる。一部の場合には、標的化バーコード構築物の標的化N merを、特定のRNA配列、例えば転写遺伝子に対応する配列又はメッセンジャーRNA(mRNA)転写物上のその他の配列等を対象とすることができる。一部の場合には、RNA(例えばmRNA)から生成された、バーコードが付いた産物の配列決定は、RNAにより転写された遺伝子の発現レベルの測定に役立つことができる。一部の場合には、標的化N merは、例えばmRNA転写産物の3'末端で見出され得るポリアデニン(ポリ-A配列)とハイブリダイズすることができるポリチミン(例えばポリ-T配列)配列であり得る。バーコード構築物のポリ-T配列とmRNAのポリ-A配列とのハイブリダイゼーションによる、ポリ-T配列を含む標的化バーコード構築物によるmRNAのプライミング時に、バーコード構築物を含む相補的DNA(cDNA)産物を生成するために、逆転写反応により標的化バーコード構築物を伸長させることができる。一部の場合には、ポリ-T標的化N merを含む標的化バーコード構築物は、本明細書の別の箇所に記載したオリゴヌクレオチドブロッカーも含むことができ、その結果、ポリ-T配列のみがRNAとハイブリダイズする。
RNA種に対する標的化バーコード構築物は、例えばPHASE増幅反応による部分的ヘアピンアンプリコンの生成に有用であることもできる。例えば、ポリT配列を含む標的化バーコード構築物は、mRNAのポリA配列により、このmRNAとハイブリダイズすることができる。(例えば逆転写酵素の作用による)逆転写反応により標的化バーコード構築物を伸長させることができ、その結果、バーコード構築物を含むcDNAが生成される。これらの工程は、図15A〜図15Cに関して上記に記載したPHASE増幅の最初のサイクルに対応することができるが、但し、逆転写が伸長産物の生成に使用される。逆転写(例えば最初のPHASEサイクル)に続いて、ランダムN merを含むバーコード構築物は伸長産物をプライミングすることができ、その結果、図15D〜図15Fに関して上記に記載したように部分的ヘアピンが生成される。所望の数のラウンドが完了するまで、更なるラウンドにわたり増幅は連続することができる(例えば図15G)。
一部の場合には、バーコード配列とポリT配列を含む標的化N merとを含む複数の標的構築物をビーズ(例えばゲルビーズ)に結合させることができる。一部の場合には、複数の構築物は同一のバーコード配列を含むことができる。ビーズを、RNAを含むサンプル核酸とともに(例えば流体液滴中において)区画することができ、各区画中のビーズが分解されて、結合した構築物が区画中に放出され、構築物の標的化N merによりサンプルRNAが捕捉される。区画は、ランダムN merを含むバーコード構築物(例えば標的構築物と同一のバーコード配列を有する)も含むことができる。最初の増幅サイクルでは、各区画内での逆転写により標的構築物の伸長が生じ、標的構築物を含む伸長産物を生成することができる。次いで、各区画における伸長産物に、ランダムN merを含むバーコード構築物をプライミングさせて、図15A〜図15Gに関して上記に記載したように部分的ヘアピンアンプリコンを生成することができる。生成されたアンプリコンの後処理{例えば、追加の配列(例えば、P7、R2)の追加、サンプルインデックスの追加等}を、大量増幅法(例えば大量PCR)及び大量ライゲーション等の本明細書に記載した任意の方法により達成することができる。
一部の場合には、標的化バーコード構築物を使用することなく、サンプルにおけるRNAの逆転写を使用することもできる。例えば、RNAを含むサンプル核酸に、RNAからcDNAが生成されるようなその他の種類の逆転写プライマーによる逆転写反応を最初に施すことができる。次いで、生成されるcDNAは、本明細書に記載したように標的の又は非標的の増幅を受ける。例えば、RNAを含むサンプル核酸に、RNAからcDNAが生成されるような逆転写反応を施すことができる。次いで、図15A〜図15Gに関して上記に記載したようにランダムN merを有するバーコード構築物を使用して、cDNAがPHASE増幅反応に加わり、構築物のバーコード配列を含む部分的ヘアピンアンプリコンを生成することができる。生成された部分的ヘアピンアンプリコンの後処理{例えば、追加の配列(例えば、P7、R2)の追加、サンプルインデックスの追加等}を、大量増幅法(例えば大量PCR)及び大量ライゲーション等の本明細書に記載した任意の方法により達成することができる。
核酸の特定の鎖上の特定の配列(例えば遺伝子配列)に対して標的化バーコード構築物を生成することもでき、その結果、鎖性情報(strandedness information)が、各鎖に関して生成されたシークエンサーレディ産物として保持される。例えば、核酸の各鎖が1つ以上の異なる標的遺伝子配列を含むように、サンプル核酸は二本鎖核酸(例えば二本鎖DNA)を含むことができる。相補的DNA鎖は、各鎖の逆の5'から3'への方向性及び/又は塩基組成に起因して異なる遺伝子配列を含むことができる。標的化N mer及びバーコード構築物の配置に基づいて、(鎖の5'から3'への方向性に基づいて)各鎖に関して標的化バーコード構築物を生成することができる。二本鎖サンプル核酸のフォワード鎖及びリバース鎖を対象とする標的化バーコード構築物の例示的セットを図28Aに示す。
二本鎖サンプル核酸のフォワード(2801)鎖及びリバース(2802)鎖のどちらかをそれぞれ標的とする標的化バーコード構築物の例示的セット2801及び2802を図28Aに示す。セット2801は、P5配列と、バーコード配列と、第1の標的配列(2803)又は第2の標的配列(2804)のどちらかに対する標的化N merとを含む標的化バーコード構築物2803及び2804を含む。セット2802は、P5配列と、バーコード配列と、第1の標的配列(2805)及び第2の標的配列(2806)のどちらかに対する標的化N merトとを含む標的化バーコード構築物2805及び2806を含む。各構築物は、バーコードと標的化N mer(図28Aに示す各構築物において矢印で示す)との間に任意の追加の配列を含むこともできる。
セット2801におけるバーコード構築物は、二本鎖サンプル核酸のフォワード鎖上の各標的配列をプライミングするように構成されている。セット2802におけるバーコード構築物は、二本鎖サンプル核酸のリバース鎖上の各標的配列をプライミングするように構成されている。示すように、各セットにおける標的化バーコード構築物は、二本鎖サンプル核酸のフォワード鎖及びリバース鎖の反対の方向性に対応する反対の方向性で構成されている。各バーコード構築物は、サンプル核酸の各鎖上の各標的配列をプライミングして、本明細書に記載した任意の増幅反応等の増幅反応によりバーコードアンプリコンを生成することができる。
大量増幅、大量ライゲーション又はこれらの組み合わせ等の本明細書に記載した増幅方法を使用して、バーコードが付いたアンプリコンに追加の配列を追加することができる。図28Aにおける標的化バーコード構築物から生成されるアンプリコンにサンプルインデックス及びP7配列を追加するために使用することができるプライマーの例示的セットを図28Bに示す。プライマーセット2808は標的化バーコード構築物セット2801に対応し(例えば、標的化バーコード構築物2803はプライマー2811に対応し、標的化バーコード構築物2804はプライマー2812に対応する)、プライマーセット2808は標的化バーコード構築物セット2801に対応する(例えば、標的化バーコード構築物2505はプライマー2809に対応し、標的化バーコード構築物2806はプライマー2810に対応する)。各プライマーは各鎖上の各標的配列をプライミングすることができ、大量増幅(例えば大量PCR)が開始されて、本明細書の別の箇所に記載した大量増幅方法に類似する様式でP7及びサンプルインデックス配列を含むシークエンサーレディ構築物が生成される。各シークエンサーレディ構築物の様々な構成成分(例えば、P5、バーコード、標的化N mer、サンプルインサート等)の配置及び方向性に基づいて、シークエンサーレディ構築物が生成される鎖を決定することができる/保持することができる。
二本鎖核酸のフォワード鎖及びリバース鎖の両方に関して、バーコード構築物(例えば標的化バーコード構築物)のライブラリーを生成することができる。例えば、本明細書に記載した方法を使用して、一方のライブラリーがサンプル核酸のフォワード鎖に関する標的化バーコード構築物を含み、他方のライブラリーがサンプル核酸のリバース鎖に関する標的化バーコード構築物を含むように標的化バーコード構築物を含むビーズ(例えばゲルビーズ)の2種類のライブラリーを生成することができる。一部の場合には、各ライブラリーは、同一の標的化N merをそれぞれ含むビーズを含むことができる。一部の場合には、各ライブラリーはビーズの二種以上のセットを含むことができ、あるセットにおける各ビーズは同一の標的化N mer(例えば特定の遺伝子を標的とする標的化N mer)を含み、異なるセットは異なる標的化N merを含む。一部の場合には、2種類のライブラリーを組み合わせることができ、その結果、フォワード鎖のビーズ及びリバース鎖のビーズのライブラリーが生成される。
例えば、ライブラリーは、合計で4種類のビーズの場合には2種類のフォワード鎖のビーズと2種類のリバース鎖のビーズとを含むことができる。ライブラリーにおける各ビーズは固有のバーコード配列を含むことができる。フォワード鎖のビーズの内の一方の種類及びリバース鎖のビーズの内の一方の種類は、標的配列(例えば標的遺伝子配列)に対応する標的化N merを含むことができる。例えば、図28Aにおいて2803に示すように、フォワード鎖のビーズの内の一方の種類は標的化バーコード構築物を含むことができ、図28Aにおいて2805に示すように、リバース鎖のビーズの内の一方の種類は標的化バーコード構築物を含むことができる。同様に、図28Aにおいて2804に示すように、フォワード鎖のビーズの内の別の種類は標的化バーコード構築物を含むことができ、図28Aにおいて2806に示すように、リバース鎖のビーズの内の別の種類は標的化バーコード構築物を含むことができる。
各ビーズが固有のバーコード配列を含む、フォワード鎖及びリバース鎖のビーズ(例えばゲルビーズ)を含むバーコードライブラリーを区画化し、本明細書の別の箇所に記載したようにサンプル核酸にバーコードを付けることができる。例えば、上記に記載した2種類のフォワード鎖のビーズ及び2種類のリバース鎖のビーズの混合ライブラリーをサンプル核酸(例えばゲノムDNA)及び任意のその他の所望の試薬(例えば、サンプル核酸の増幅に必要な試薬、還元剤)とともに区画化することができる。区画は、例えばエマルジョンの液滴等の流体液滴であり得る。一般に、各区画は、固有のバーコード配列及び標的化N merを含む標的化バーコード構築物に結合したビーズ(例えばフォワード鎖のビーズ又はリバース鎖のビーズ)を含むことができる。それにもかかわらず、一部の場合には、1つ以上の区画は、同じ種類の又は異なる種類の複数のビーズを含むことができる。標的化バーコード構築物は、(例えばビーズの分解により、例えば、ビーズが、ジスルフィド結合を含むゲルビーズである場合には還元剤により)区画中のビーズから放出され得、サンプル核酸の各鎖(例えばフォワード鎖又はリバース鎖)上の標的配列にプライミングすることができる。
例えばサンプル核酸の線形増幅による、ハイブリダイズした標的化バーコード構築物の伸長により、第1の産物鎖の合成が各区画中で起こることができる。例えば、標的化バーコード構築物によるサンプル核酸の線形増幅の更なるラウンドを使用して、第1の産物鎖の更なるコピーを生成することができる。次いで、第1の産物鎖を区画から取り出して(例えば、区画がエマルジョンの液滴である場合には、エマルジョンを破壊して第1の産物を放出させることができる)、プールすることができる。第1の産物を洗浄して標的化バーコード構築物及び任意のその他の排出物を除去することができる。一部の場合には、任意選択的な二本鎖消化を完了させ、サンプル核酸を消化してサンプル核酸を第1の産物鎖から除去することができる。
次に、第1の産物鎖を大量増幅にかけて、追加の配列(例えば、P7、サンプルインデックス等)を第1の産物鎖に追加することができ、その結果、第2の産物鎖が生成される。大量増幅反応混合物は複数のプライマーを含むことができ、この複数における各プライマーは、第1の産物鎖を生成するために使用するビーズの種類の内の1つ(そのため、標的化バーコード構築物の種類)に対応する。上記に記載した2種類のフォワード鎖のビーズ及び2種類のリバース鎖のビーズを含む例示的ライブラリーの場合、図28Bにおいて2809、2810、2811及び2812として示すプライマーを使用して、追加のサンプルインデックス及びP7配列を、大量増幅により標的化バーコード構築物2803、2804、2805及び2806それぞれから生成された第1の産物鎖に追加することができる。次いで、第2の産物鎖を洗浄して反応混合物からプライマーを除去することができる。次いで、新たなプライマー(例えば上記に記載した例の場合にはP5及びP7を含むプライマー)を(例えばPCRによる)増幅の1つ以上の更なるラウンドに加えて、最終のシークエンサーレディ産物を生成することができる。そのため、最終産物は、元々の標的化バーコード構築物と、増幅されたサンプル核酸の鎖と、第1の産物鎖に追加された追加の配列(例えば、P7、サンプルインデックス)とを含むことができる。
本明細書に記載した方法は全ゲノム増幅に有用であり得る。全ゲノム増幅の一部の実施形態では、ランダムプライマー(例えばランダムN mer配列)をゲノム核酸にハイブリダイズさせることができる。ランダムプライマーは、ユニバーサル核酸配列(本明細書に記載したあらゆる種類のユニバーサル核酸配列等)と核酸バーコード配列とを含むこともできる、より大きなオリゴヌクレオチドの構成成分であり得る。一部の場合には、ユニバーサル核酸配列は1つ以上のウラシル含有ヌクレオチドを含むことができる。更に、一部の場合には、ユニバーサル核酸配列は、ウラシルを含まない少なくとも1個の、2個の、3個の、4個の、5個の、6個の、7個の、8個の、9個の、10個の、11個の、12個の、13個の、14個の、15個の、16個の、17個の、18個の、19個の、20個の又はそれ以上のヌクレオチドの断片を含むことができる。(例えば、プライマー伸長反応又は任意のその他の適切な種類の核酸増幅反応において)ランダムプライマーを伸長させて、増幅産物を形成することができる。
本明細書の別の箇所に記載したように、増幅産物を分子内ハイブリダイゼーション反応にかけて例えば部分的ヘアピン分子等のヘアピン分子を形成することができる。一部の場合には、全ゲノム増幅は、ブロッカー部分{例えば、C3スペーサー(/3SpC3/)、ジデオキシ-C(/3ddC/)、3'リン酸塩又は本明細書の別の箇所に記載したあらゆるその他の種類のブロッカー部分}を含んでもよいし含まなくてもよいオリゴヌクレオチドブロッカー(本明細書の別の箇所ではブロッカーオリゴヌクレオチドとも称される)の存在下で起こることができる。更に、オリゴヌクレオチドブロッカーは、ユニバーサル核酸配列の少なくとも一部又はランダムプライマーを含むオリゴヌクレオチドの任意のその他の部分にハイブリダイズすることができる、
全ゲノム増幅の一部の実施形態では、ゲノム構成成分(例えば、染色体、ゲノムDNA等のゲノム核酸、生物の全ゲノム又は本明細書に記載したあらゆるその他の種類のゲノム構成成分)を複数の第1の断片に断片化することができる。第1の断片を、複数のオリゴヌクレオチドとともに複数の区画に共区画化することができる。各々の区画におけるオリゴヌクレオチドは、プライマー配列(本明細書の別の箇所に記載した、プライマー配列の種類等)と共通配列(例えばバーコード配列)とを含むことができる。次いで、各区画におけるプライマー配列を、各区画内の第1の断片の複数の異なる領域にアニールさせることができる。次いで、プライマー配列を第1の断片に沿って伸長させて、複数の区画の各区画内で、増幅された第1の断片を生じさせることができる。区画内の増幅された第1の断片は、ゲノム構成成分の(本明細書の別の箇所に記載した)任意の適切な被覆度を含むことができる。一部の場合には、区画内の増幅された第1の断片は、ゲノム構成成分の少なくとも1倍の被覆度、少なくとも2倍の被覆度、少なくとも5倍の被覆度、少なくとも10倍の被覆度、少なくとも20倍の被覆度、少なくとも40倍の被覆度又はより多い被覆度を含むことができる。
VII.デジタルプロセッサ
本開示の方法、組成物、デバイス及びキットを、任意の適切なプロセッサ、デジタルプロセッサ又はコンピュータとともに使用することができる。例えばデバイスの任意の構成要素を操作するように及び/又は本明細書に記載した方法を実行するように、デジタルプロセッサをプログラムすることができる。デジタルプロセッサは、例えばインターネット等のコンピュータネットワークを介して及び/又は遠隔コンピュータとの通信により電子信号を送信する又は受信することができる。1種以上の周辺デバイス、例えばスクリーンディスプレイ、プリンタ、メモリ、データストレージ及び/又は電子ディスプレイアダプタをデジタルプロセッサと通信させることができる。1種以上の入力デバイス、例えばキーボード、マウス又はジョイスティックをデジタルプロセッサと通信させることができる。デジタルプロセッサを検出器と通信させることもでき、その結果、検出器は、所望の若しくは予め決定した時点で又は前処理ユニット若しくはその他のデバイスから受信したフィードバックから決定した時点で測定を実施する。
例示的制御アセンブリの概念図を図18に示す。コンピュータは制御アセンブリの中心ハブとして機能する。このコンピュータは、ディスプレイと、1つ以上の入力デバイス(例えば、マウス、キーボード、カメラ等)と、任意選択でプリンタと通信している。制御アセンブリは、このコンピュータを介して下記の1つ以上のデバイスと通信している:任意選択でサンプル前処理ユニット、1つ以上のサンプル処理ユニット(例えば、配列決定デバイス、サーマルサイクラ―デバイス又はマイクロ流体デバイス)及び任意選択で検出器。制御アセンブリを例えばイーサネット接続によりネットワーク化することができる。ユーザーは、入力デバイスを使用してコンピュータに(例えば所望のセットの核酸増幅反応に必要なパラメータ又はマイクロ流体デバイスへの流量を)入力することができる。この入力がコンピュータにより解釈されて指示が生成される。コンピュータは、実行させるために、そのような指示を任意選択のサンプル前処理ユニット、1つ以上のサンプル処理ユニット及び/又は任意選択の検出器に伝達する。
更に、任意選択のサンプル前処理ユニット、1つ以上のサンプル処理ユニット及び/又は任意選択の検出器の稼働中に、各デバイスはコンピュータに信号を戻すことができる。そのような信号をコンピュータにより解釈して及び使用して、どのデバイスが更なる指示を必要とするかを決定することができる。コンピュータはサンプル前処理ユニットを調節することもでき、その結果、サンプルの構成成分が適切に混合され、所望の又は予め決定した割合でサンプル処理ユニット(例えばマイクロ流体デバイス)に供給される。
コンピュータは検出器と通信することもでき、その結果、検出器は、所望の若しくは予め決定した時点で又は前処理ユニット若しくはサンプル処理ユニットから受信したフィードバックから決定した時点で測定を実施する。検出器は、更なる分析及び解釈のために、測定中に得られる生データをコンピュータに戻すこともできる。
分析を、ディスプレイによるエンドユーザーに有用なフォーマット及び/又はプリンタにより生成される印刷物にまとめることができる。サンプル前処理ユニット、サンプル処理ユニット及び/若しくは検出器を制御するために使用する指示又はプログラム;本明細書に記載した方法のいずれかを実行することにより得られるデータ;又は分析された及び/若しくは解釈されたデータを、例えばインターネットである可能性があるネットワークにより、1つ以上の遠隔コンピュータに送信することができる、又は該遠隔コンピュータから受信することができる。
一部の実施形態では、液滴生成器と通信しているデジタルプロセッサの補助を得てビーズ形成方法を実行することができる。デジタルプロセッサは、液滴が形成される速度を制御することができる、又は生成される液滴の総数を制御することができる。一部の実施形態では、マイクロ流体デバイスと通信しているデジタルプロセッサの補助を得て、バーコードが付いたビーズにサンプルを付着させる方法を実行することができる。具体的には、デジタルプロセッサは、入力チャネルに注入されたサンプル及び/又はビーズの容積測定量を制御することができ、チャネル内の流量を制御することもできる。一部の実施形態では、サーマルサイクラ―又はその他のプログラム可能な発熱体と通信しているデジタルプロセッサの補助を得て、オリゴヌクレオチド、プライマー等を付着させる方法を実行することができる。具体的には、デジタルプロセッサは、ライゲーション又は増幅中のサイクルの時間及び温度を制御することができる。一部の実施形態では、配列決定デバイスと通信しているデジタルプロセッサの補助を得て、サンプルを配列決定する方法を実行することができる。
VIII.キット
一部の場合には、本開示は、マイクロ流体デバイスと、バーコードが付いた複数のビーズと、マイクロ流体デバイスを利用するための及びバーコードが付いたビーズを顧客のサンプルと組み合わせて両方を含有する流体液滴を生成するための説明書とを含むキットを提供する。本開示全体にわたって明示しているように、任意の適切なサンプルを流体液滴に組み込むことができる。本開示全体にわたって説明しているように、分解可能であるように又は分解不能であるようにビーズを設計することができる。この場合には、キットはビーズ分解用の還元剤を含んでもよいし含まなくてもよい。
一部の場合には、本開示は、バーコードが付いた複数のビーズと、適切な増幅試薬、例えばポリメラーゼ酵素、ヌクレオシド三リン酸又はこの類似体、プライマー配列、バッファー等の内の1種以上を任意選択で含む増幅用試薬と、バーコードが付いたビーズと顧客のサンプルとを組み合わせるための説明書とを含むキットを提供する。本開示全体にわたって明示しているように、任意の適切なサンプルを使用することができる。本開示全体にわたって明示しているように、増幅用試薬は、ウラシル含有鋳型を受容しない又は処理しないであろうポリメラーゼを含むことができる。本開示のキットは、オイル及び界面活性剤等の、エマルジョンを形成するための試薬を提供することもできる。
IX.適用
サンプル材料へのバーコードの付与
本明細書に記載した方法、組成物及びシステムは、バーコードの、特にバーコード核酸配列のサンプル材料及びこのサンプル材料の構成成分への付与に特に有用である。一般に、この付与は、サンプル材料構成成分を、複数のバーコードが共区画化され、次いで同じ区画内のサンプル構成成分に付与される別個の区画中に又は反応体積中に区画化することにより達成される。
例示的なプロセスでは、それぞれが共通の核酸バーコード配列を含む複数のオリゴヌクレオチド(例えば核酸バーコード分子)を含む第1の区画が提供される。第1の区画は、オリゴヌクレオチドが放出可能に付着している、放出可能に結合している又は放出可能に会合している、様々なポータブル区画、例えばビーズ(例えば分解可能なビーズ、ゲルビーズ)、液滴(例えばエマルジョン中の水性液滴)、マイクロカプセル等の内のいずれかを含むことができる。更に、本明細書の別の箇所に記載した区画当たりのオリゴヌクレオチドの数等の、あらゆる適切な数のオリゴヌクレオチドを第1の区画に含めることができる。例えば、切断可能な結合、例えば化学的に切断可能な結合(例えば、ジスルフィド結合若しくは本明細書に記載したあらゆるその他の種類の化学的に切断可能な結合)、光切断可能な結合及び/又は熱的に切断可能な結合により、オリゴヌクレオチドを第1の区画に放出可能に付着させることができる、放出可能に結合させることができる、又は放出可能に会合させることができる。一部の場合には、第1の区画はビーズであり得、ビーズは分解可能なビーズ(例えば、光分解可能なビーズ、化学的に分解可能なビーズ、熱的に分解可能なビーズ又は本明細書の別の箇所に記載したあらゆるその他の種類の分解可能なビーズ)であり得る。更に、ビーズは、本明細書の別の箇所に記載したように、化学的に切断可能な架橋結合(例えばジスルフィド架橋結合)を含むことができる。
次いで、第1の区画を、サンプル材料、サンプル材料構成成分、サンプル材料の断片又はサンプル材料構成成分の断片とともに第2の区画に共区画化する。サンプル材料(又はこの構成成分若しくは断片)は、本明細書の別の箇所に記載した例示的サンプルタイプ等の任意の適切なサンプルタイプであり得る。サンプル材料又はサンプル材料の構成成分が1種以上の核酸断片を含む場合では、1種以上の核酸断片は、例えば本明細書の別の箇所に記載した核酸断片長さ等の任意の適切な長さであり得る。第2の区画は、例えばウェル、マイクロウェル、ナノウェル、チューブ若しくは容器等の様々な区画の内のいずれかを含むことができる、又は好ましい場合には液滴(例えばエマルジョン中の水性液滴)若しくは第1の区画が共区画化され得るマイクロカプセルを含むことができる。一部の場合には、第1の区画を第1の水性流体及びサンプル材料で提供することができ、サンプル材料構成成分又はサンプル材料構成成分の断片を第2の水性流体で提供することができる。同時の区画化中に、第1の水性流体及び第2の水性流体を非混和性流体内の液滴内で組み合わせることができる。一部の場合には、第2の区画は1つ以下の第1の区画を含むことができる。その他の場合では、第2の区画は最大で1個の、2個の、3個の、4個の、5個の、6個の、7個の、8個の、9個の又は10個の第1の区画を含むことができる。その他の場合では、第2の区画は、少なくとも1個の、2個の、3個の、4個の、5個の、6個の、7個の、8個の、9個の、10個の又はそれ以上の第1の区画を含むことができる。
共区画化すると、バーコード配列を含むオリゴヌクレオチドを(例えば、第1の区画の分解により、オリゴヌクレオチドと第1の区画との間の化学的な結合を切断することにより、又は本明細書の別の箇所に記載した放出の種類等のあらゆるその他の適切な種類の放出により)第1の区画から第2の区画に放出させ、共区画化したサンプル構成成分に付着させることができる。一部の場合には、第1の区画はビーズを含むことができ、ビーズの架橋結合はジスルフィド結合を含むことができる。加えて又は代わりに、ジスルフィド結合によりオリゴヌクレオチドをビーズに結合させることができる。いずれの場合でも、第1の区画を還元剤(例えば、DTT、TCEP又は本明細書の別の箇所に記載したあらゆるその他の例示的な還元剤)に曝露することにより、オリゴヌクレオチドを第1の区画から放出させることができる。
本明細書の別の箇所で述べたように、バーコードのサンプル構成成分への付着は、例えばライゲーション、ハイブリダイゼーション又はその他の会合によるバーコードオリゴヌクレオチドのサンプル材料への直接付着を含む。加えて、多くの場合では、例えば、核酸サンプル材料(例えば、鋳型核酸配列、鋳型核酸分子)、該核酸サンプル材料の構成成分又は断片のバーコードの付与において、そのような付着は、プライミング配列も含むバーコード含有オリゴヌクレオチドの使用を更に含むことができる。プライミング配列は核酸サンプル材料の少なくとも一部に対して相補的であり得、該プライミング配列を核酸サンプル材料に沿って伸長させてそのようなサンプル材料に対する相補体を生成することができ、この配列又はこの配列の相補体の少なくとも部分的な増幅産物を更に生成することもできる。
別の例示的なプロセスでは、複数の異なる核酸バーコード配列を含む複数の第1の区画を提供することができる。各々の第1の区画は、同じ核酸バーコード配列が会合している複数の核酸バーコード分子を含むことができる。本明細書の別の箇所に記載した区画当たりの核酸バーコード分子の数等の任意の適切な数の核酸バーコード分子を各々の第1の区画と会合させることができる。第1の区画は、例えば少なくとも約2個の、約10個の、約100個の、約500個の、約1000個の、約5000個の、約10000個の、約50000個の、約100000個の、約500000個の、約1000000個の、約5000000個の、約10000000個の、約50000000個の若しくは約1000000000個の又はそれ以上の異なる核酸バーコード配列等の任意の適切な数の異なる核酸バーコード配列を含むことができる。
一部の場合には、複数の第1の区画は複数の異なる第1の区画を含むことができ、各々の異なる第1の区画は、複数の放出可能に付着している、放出可能に結合している又は放出可能に会合しているオリゴヌクレオチドを含み、該オリゴヌクレオチドは共通のバーコード配列を含み、オリゴヌクレオチドは、異なるバーコード配列を含む異なる第1の区画それぞれと会合している。異なる第1の区画の数は、例えば少なくとも約2個の、約10個の、約100個の、約500個の、約1000個の、約5000個の、約10000個の、約50000個の、約100000個の、約500000個の、約1000000個の、約5000000個の、約10000000個の、約50000000個の若しくは約1000000000個の又はそれ以上の異なる第1の区画であり得る。
第1の区画を、サンプル材料、サンプル材料の断片、サンプル材料の構成成分又はサンプル材料の構成成分の断片とともに複数の第2の区画に共区画化することができる。一部の場合には、第2の区画のサブセットは同じ核酸バーコード配列を含むことができる。例えば、第2の区画の少なくとも約1%、約2%、約3%、約4%、約5%、約6%、約7%、約8%、約9%、約10%、約15%、約20%、約25%、約30%、約35%、約40%、約45%、約50%、約55%、約60%、約65%、約70%、約75%、約80%、約85%、約90%、約95%又はそれ以上が同じ核酸バーコード配列を含むことができる。更に、第2の区画当たりの第1の区画の分配は、例えば本明細書の別の場所に記載した占有率に従って異なることもできる。複数の第1の区画が複数の異なる第1の区画を含む場合、異なる第1の区画それぞれを別個の第2の区画内に配置することができる。
同時の区画化に続いて、第1の区画と会合している核酸バーコード分子を複数の第2の区画中に放出させることができる。次いで、放出された核酸バーコード分子を、第2の区画内のサンプル材料、サンプル材料構成成分、サンプル材料の断片又はサンプル材料構成成分の断片に付着させることができる。バーコードが付いた核酸種(例えば、バーコードが付いたサンプル核酸、バーコードが付いた鋳型核酸、1種以上の鋳型核酸配列のバーコードが付いた断片等)の場合には、バーコードが付いた核酸種を、本明細書の別の箇所に記載したように配列決定することができる。
別の例示的なプロセスでは、活性化可能な核酸バーコード配列を生成することができ、1種以上のサンプル材料、サンプル材料の構成成分、サンプル材料の断片又はサンプル材料の構成成分の断片とともに第1の区画に区画化することができる。第1の区画により、活性化可能な核酸バーコード配列を活性化させて活性核酸バーコード配列を生成することができる。次いで、活性核酸バーコード配列を、1種以上のサンプル材料、サンプル材料の構成成分、サンプル材料の断片又はサンプル材料の構成成分の断片に付着させることができる。
一部の場合には、活性可能な核酸バーコード配列を、活性可能な核酸バーコード配列とともに第1の区画にも区画されている第2の区画に結合させることができる。本明細書の別の箇所に記載したように、会合している区画(例えばビーズ)から活性化可能な核酸バーコード配列を放出させることにより、活性化可能な核酸バーコード配列を活性化させることができる。そのため、活性化可能な核酸バーコード配列が、第1の区画(例えば流体液滴)に区画化されている第2の区画(例えばビーズ)と会合している場合には、活性化可能な核酸バーコード配列をその会合している第2の区画から放出させることにより、活性化可能な核酸バーコード配列を活性化させることができる。加えて又は代わりに、除去可能なブロッキング基又は保護基を活性化可能な核酸バーコード配列から除去することにより、活性化可能なバーコードを活性化させることもできる。
別の例示的なプロセスでは、核酸のサンプルと、バーコードが付いたビーズ(本明細書の別の箇所に記載したビーズの種類等)のライブラリーとを組み合わせて、混合物を形成することができる。一部の場合には、ビーズのバーコードはそれぞれ、バーコード配列に加えて、1種以上の追加の配列、例えばユニバーサル配列及び/又は機能性配列(例えば、本明細書の別の箇所に記載したランダムN mer又は標的化N mer)を含むことができる。混合物を複数の区画に区画化することができ、区画の少なくともサブセットは最大で1つのバーコードが付いたビーズを含む。区画内で、本明細書に記載した放出の種類等の任意の適切な経路を使用して、バーコードをビーズから放出させることができる。本明細書の別の箇所に記載した方法及び組成物の使用等の任意の適切な経路により、バーコードが付いたビーズのライブラリーを生成することができる。一部の場合には、本明細書の別の箇所に記載したように、核酸のサンプルを、バーコードが付いたビーズのライブラリー、及び/又はマイクロ流体デバイスを用いて区画された、結果として生じる混合物と組み合わせることができる。放出されたバーコードがプライマー配列(例えば、本明細書の別の箇所に記載した標的化N mer又はランダムN mer等)も含む場合には、バーコードのプライマー配列をサンプル核酸とハイブリダイズさせることができ、必要に応じて、増幅反応を区画中で完了させることができる。
ポリヌクレオチドの配列決定
一般に、本明細書に記載した方法及び組成物は、配列決定等の下流の適用のためのオリゴヌクレオチド断片の調製に有用である。特に、これらの方法、組成物及びシステムは、配列決定ライブラリーの調製で有用である。あらゆる入手可能な技法により、配列決定を実施することができる。例えば、古典的なSanger配列決定法により配列決定を実施することができる。配列決定法として下記を挙げることもできる:高スループット配列決定、パイロ配列決定、ライゲーションによる配列決定、合成による配列決定、ハイブリダイゼーションによる配列決定、RNA-Seq(Illumina社)、Digital Gene Expression(Helicos社)、次世代配列決定、合成による単分子配列決定(SMSS)(Helicos社)、大規模平行配列決定、クローナル単分子アレイ(Solexa)、ショットガン配列決定、Maxim-Gilbert配列決定、プライマーウォーキング及当分野で既知のあらゆるその他の配列決定法。
例えば、複数の標的核酸配列を提供し、標的核酸配列を複数の別個の区画に分離することにより、複数の標的核酸配列を配列決定することができる。別個の区画の各々は、1つ以上の標的核酸配列及び複数のオリゴヌクレオチドを含むことができる。別個の区画は、任意の適切な数の異なるバーコード配列(例えば、少なくとも1,000個の異なるバーコード配列、少なくとも10,000個の異なるバーコード配列、少なくとも100,000個の異なるバーコード配列、少なくとも1,000,000個の異なるバーコード配列、少なくとも10,000,000個の異なるバーコード配列又は本明細書の別の箇所に記載したあらゆるその他の数の異なるバーコード配列)を含むことができる。更に、所与の区画中のオリゴヌクレオチドは共通のバーコード配列を含むことができる。所与の区画中のオリゴヌクレオチド及び会合した共通のバーコード配列を、所与の区画内の1種以上の標的核酸配列の断片又は標的核酸配列の一部のコピーに付着させることができる。付着後に、別個の区画をプールすることができる。次いで、標的核酸の断片又は標的核酸の一部のコピー及び付着したバーコード配列を配列決定することができる。
別の例では、標的核酸配列を提供し、この標的核酸配列を複数の別個の区画に分離することにより、複数の標的核酸配列を配列決定することができる。複数の別個の区画の各区画は、1種以上の標的核酸配列と、複数の付着したオリゴヌクレオチド有するビーズとを含むことができる。所与のビーズに付着しているオリゴヌクレオチドは共通のバーコード配列を含むことができる。ビーズに会合しているオリゴヌクレオチドを所与の区画内の標的核酸配列の断片又は標的核酸配列の一部のコピーに付着させることができ、その結果、この所与の区画の断片又はコピーは、ビーズと会合している共通のバーコード配列にも付着している。オリゴヌクレオチドの標的核酸配列の断片又は標的核酸配列の一部のコピーへの付着後に、別個の区画をプールすることができる。次いで、(例えば、本明細書の別の箇所に記載したもの等の任意の適切な配列決定法を使用して)標的核酸配列の断片又は標的核酸配列の一部のコピー及び任意の付着したバーコード配列を配列決定して、バーコードが付いた断片配列又はバーコードが付いたコピー配列を生成することができる。バーコードが付いた断片配列又はバーコードが付いたコピー配列を、部分的にはバーコードが付いた断片配列又はバーコードが付いたコピー配列のバーコード部分に基づいて、1つ以上の連続した核酸配列にアセンブルすることができる。
一部の場合には、様々な数の、バーコードが付いたオリゴヌクレオチドを配列決定する。例えば、一部の場合には、バーコードが追加オリゴヌクレオチドの約30%〜90%を配列決定する。一部の場合には、バーコードが付いたオリゴヌクレオチドの約35%〜85%、約40%〜80%、約45%〜75%、約55%〜65%又は約50%〜60%を配列決定する。一部の場合には、バーコードが付いたオリゴヌクレオチドの少なくとも約30%、約40%、約50%、約60%、約70%、約80%又は約90%を配列決定する。一部の場合には、バーコードが付いたオリゴヌクレオチドの約30%未満、約40%未満、約50%未満、約60%未満、約70%未満、約80%未満又は約90%未満を配列決定する。
一部の場合には、断片からの配列をアセンブルさせて、個々の配列リードよりも長い場合がある元々の標的ポリヌクレオチドの連続した領域に関する配列情報を提供する。個々の配列リードは、約10〜50、約50〜100、約100〜200、約200〜300、約300〜400又はそれ以上のヌクレオチドの長さであり得る。配列アセンブリ方法の例として、本出願と同日付けで出願された米国仮特許出願第_____号(代理人整理番号第43487-729.101号)に記載されているものが挙げられる。
バーコードの同一性は、個々の断片からの配列リードを指示するのに役立つことができ、更にハプロタイプ間を区別することもできる。例えば、流体液滴内で個々のサンプル断片とバーコードが付いたビーズとを組み合わせる際に、親ポリヌクレオチド断片を異なる液滴に分離することができる。液滴内の流体液滴及びビーズの数の増加により、同じビーズと会合している同じ流体液滴内に含有される材料及び親ハプロタイプの両方からの断片の可能性は無視できるほど小さくなることができる。そのため、同じ流体液滴中の及び同じビーズと会合している断片からの配列リードをアセンブルすることができる、及び指示することができる。
少なくとも一実施形態では、本開示は、配列アセンブリ及びリード長の等価物の両方において無数の利点を提供するのに有用であるが、非常に高いスループット並びにサンプル調製の時間及びコストの低減で行うことができる、核酸を配列決定する方法、システム、組成物及びこれらの組み合わせを提供する。
一般に、本明細書に記載した配列決定法は、遺伝子配列の断片に局所性のタグを付けること又はバーコードを付けることを提供する。より大きい遺伝子配列内の同じ位置に由来する断片にタグを付けることにより、タグ又はバーコードの存在を利用して上記で示唆したようにアセンブリプロセスを伝えることができる。加えて、本明細書に記載した方法を使用して、単一の長い核酸分子から、より短い断片を生成することができる、及び該断片にバーコードを付けることができる。このより短い断片の配列決定及びアセンブリは、長いリードの等価の配列を提供するが、低スループットのより長いリード長の配列決定技法を必要としない。
図39には、例示的配列決定方法の略図が記載されている。示すように、例えば染色体又はその他の大きな核酸分子を含むことができる第1の遺伝子構成成分3902は、例えば断片3904及び3906等の大きな第1の核酸断片のセットに断片化されている。大きな遺伝子構成成分の断片は重複し得ず又は重複し得、一部の場合には、より大きい構成成分の配列の高信頼のアセンブリを提供するために多重な重複断片を含むことができる。一部の場合には、より大きな遺伝子構成成分の断片は、より大きな構成成分の1倍の、2倍の、5倍の、10倍の、20倍の、40倍の又はより大きな被覆度を提供する。
次いで、1種以上の第1の断片3904を処理して、第1の断片の第2の断片の重複セット、例えば第2の断片セット3908及び3910を別個に生成する。この処理により、特定の第1の断片に由来する第2の断片の各々に関して同じであるバーコード配列を有する第2の断片も提供される。示すように、第2の断片セット3908のバーコード配列を「1」で示し、断片セット3910のバーコード配列を「2」で示す。バーコードの様々なライブラリーを使用して、多数の異なる断片セットに別個にバーコードを付けることができる。しかしながら、異なる第1の断片からの全ての第2の断片セットに、異なるバーコード配列によりバーコードを付ける必要はない。実際に、多くの場合では、同じバーコード配列を含むように、複数の異なる第1の断片を同時に処理することができる。多様なバーコードライブラリーが本明細書の別の箇所に詳細に記載されている。
次いで、例えば断片セット3908及び3910からのバーコードが付いた断片を配列決定用にプールすることができる。配列決定すると、配列リード3912を、例えば凝集リード3914及び3916に示すように、バーコードに少なくとも部分的に基づいて、並びに任意選択で及び好ましくは断片自体の配列に部分的に基づいて、該配列リード3912の各断片セットに起因すると考えることができる。次いで、各断片セットの起因する配列リードをアセンブルして、第1の断片に関してアセンブルされた配列、例えば断片配列3918及び3920を生成し、次に、該アセンブルされた配列をより大きな遺伝子構成成分の配列3922にアセンブルすることができる。
上述に従って、大きな遺伝子構成成分、例えば長い核酸断片、例えば1、10、20、40、50、75、100、1000若しくはそれ以上のkbの長さ、染色体断片若しくは全染色体又はゲノムの一部若しくは全ゲノム(例えばゲノムDNA)を、より小さな第1の断片に断片化する。典型的には、この断片は、約1000から約100000塩基の長さの範囲であり得る。ある好ましい態様では、断片は、約1kbから約100kbの間又は約5kbから約50kbの間又は約10kbから約30kbであり得、一部の場合には、約15kbから約25kbの間であり得る。このより大きな遺伝子構成成分の断片化を、市販の剪断ベースの断片化システム、例えばCovaris断片化システム、サイズ標的断片化システム、例えばBlue Pippin(Sage Sciences社)、酵素的断片化プロセス、例えば制限エンドヌクレアーゼを使用する酵素的断片化プロセス等の様々な便利で入手可能なプロセスのいずれかにより実行することができる。上述したように、より大きな遺伝子構成成分の第1の断片は、重複の又は非重複の第1の断片を含むことができる。区画前に断片化されると本明細書には記載されているが、プロセスの後半で、例えば1つ以上の増幅工程の後に、断片化を任意選択で及び/又は追加で実施して、配列決定適用のために所望のサイズの断片を得ることができることが認識され得る。
好ましい態様では、重複する第1の断片が作製されるように、より大きな遺伝子構成成分又はこの一部の複数のコピーから第1の断片を生成する。好ましい態様では、重複する断片は、元となる大きな遺伝子構成成分又はこの一部の1倍超の被覆度、2倍超の被覆度、5倍超の被覆度、10倍超の被覆度、20倍超の被覆度、40倍超の被覆度又は更により大きな被覆度を構成することができる。次いで、第1の断片を別々の反応体積に分離する。一部の場合には、反応体積が1つ以下の第1の断片を含有するように第1の断片を分離することができる。このことは典型的には、溶液中での限界希釈で断片を生成することにより達成され、その結果、溶液の別々の反応体積への分配により、複数の断片が所与の反応体積に入れられる確率が非常に低くなる。しかしながら、ほとんどの場合では、所与の反応体積は複数の異なる第1の断片を含むことができ、所与の反応体積中に2個の、5個の、10個の、100個の、1000個の若しくは最大で10,000個又はそれ以上の異なる第1の断片を有することさえもできる。この場合も、個々の反応体積内で所望の範囲の断片の数を達成することは、出発材料という点での核酸の濃度の理解に基づく、第1の断片の起源である溶液の適切な希釈により典型的には達成される。
反応体積は、様々な異なる種類の容器又は区画のいずれかを含むことができる。例えば、反応体積は、従来の反応容器、例えば試験管、反応ウェル、マイクロウェル、ナノウェルを含むことができる、又は反応体積は、より少ない従来の反応体積、例えば安定化エマルジョン内の液滴、例えば油中水エマルジョン系中の水を含むことができる。好ましい態様では、例えば単一の容器内で数十万の、数百万の、数千万の又は更にそれ以上の別々の液滴/反応体積の使用を可能とする非常に高い多様な能力のために、反応体積として液滴が好ましい。各反応体積内において、次いで、反応体積に含有されている断片を処理して、第1の断片の各々を重複する第2の断片のセットに誘導するだけでなく、付着したバーコード配列を含む第2の断片も生成する。認識され得るように、好ましい態様では、第1の断片を、第2の断片を生成してバーコードを付けるのに使用するバーコードライブラリーのメンバーを含む1つ以上のマイクロカプセル又はビーズも含有する液滴中に区画化する。
好ましい態様では、この第2の断片の生成を、バーコード配列を含み、第1の断片の一部にハイブリダイズし、第1の断片に沿って伸長させてバーコード配列を含む第2の断片を生成することができるプライマー配列の導入により実行する。このプライマーは標的化プライマー配列、例えば第1の断片の特定の部分を重複する断片を誘導するための標的化プライマー配列を含むことができる、又は、このプライマーは、第1の断片の複数の異なる領域をプライミングして第1の断片に及ぶ第2の断片の大きくて多様なセットを生成し、多種多様な重複被覆度を提供することができるユニバーサルプライミング配列、例えばランダムプライマーを含むことができる。この伸長されたプライマー配列を第2の断片として使用することができる、又はこの伸長されたプライマー配列を更に複製する若しくは増幅させることができる。例えば、例えばバーコードが付いたオリゴヌクレオチドを含有する同じプライマーを使用する、伸長された配列に対する反復プライミング。ある好ましい態様では、断片の第2のセットの生成により、それぞれが例えば本明細書に記載したPHASE増幅用のバーコード配列を含む、本明細書の別の箇所に記載した第1の断片の一部である部分的ヘアピン複製物が生成される。本明細書の別の箇所で述べたように、複製鎖の再プライミング、例えばコピーのコピーを作ることを防止するために、部分的ヘアピンの形成が概して望ましい。従って、例えばヘアピンがプライマー産物対よりも高いTmを有することができる、増幅産物へのプライマーアニーリングと比較して、アニーリング中に増幅産物から部分的ヘアピンが典型的には優先的に形成される。
第2の断片は、その後の配列決定に適している長さであるように概して選択される。短リード配列決定技法の場合、そのような断片は典型的には、バーコート配列セグメント及び配列決定プロセスにかけられる機能性配列等の、約50塩基から約1000塩基の配列決定可能な長さ、約50塩基から約900塩基の配列決定可能な長さ、約50塩基から約800塩基の配列決定可能な長さ、約50塩基から約700塩基の配列決定可能な長さ、約50塩基から約600塩基の配列決定可能な長さ、約50塩基から約500塩基の配列決定可能な長さ、約50塩基から約400塩基の配列決定可能な長さ、約50塩基から約300塩基の配列決定可能な長さ、約50塩基から約250塩基の配列決定可能な長さ、約50塩基から約200塩基の配列決定可能な長さ又は約50塩基から約100塩基の配列決定可能な長さであり得る。
重複する、バーコードが付いた第2の断片セットが生成すると、該第2の断片セットを、その後の処理及び最終的には配列決定のためにプールすることができる。例えば、一部の場合には、本明細書の別の箇所に記載したように、続いてバーコードが付いた断片を追加の増幅、例えばPCR増幅にかけることができる。同様に、バーコードが付いた断片の回収が由来し、更に配列決定プロセスで使用するための追加の機能性配列も供給するサンプルを同定するために、この断片を、サンプルインデックス配列とともに追加的に又は同時に供給することができる。
加えて、クリーンアップ工程を任意選択で実行し、例えば配列決定等のために断片セットをサイズ選択すべく核酸構成成分をその他の不純物から精製することもできる。そのようなクリーンアップ工程は、SPRIビーズ{例えばBeckman Coulter, Inc.社から入手可能なAmpure(登録商標)ビーズ}での精製及び/又はサイズ選択を含むことができる。一部の場合には、例えば、全ての目的のためにその全体が参照により本明細書に組み込まれている、Fisher他, Genome Biol. 2011:12(1):R1 (E-pub Jan 4, 2011)に記載されているように断片がSPRIビーズと会合している統合されたプロセスで多重処理工程を実行することができる。
既に述べたように、多くの場合では、短リード配列決定技法を使用して第2の断片セットに関する配列情報を提供する。従って、好ましい態様では、第2の断片セットは、バーコード配列を含む場合に、使用する配列決定システムのリード長内であり得る断片を概して含むことができる。例えば、Illumina HiSeq(登録商標)配列決定の場合、そのような断片は、対末端配列決定を実行する場合に約100塩基から約200塩基の長さの一般的な範囲の間であり得る。一部の場合には、配列決定プロセスにより断片の末端部のみを利用する場合に、より長い第2の配列を配列決定することができる。
図39を参照して上述したように、次いで、様々な第2の断片の配列リードはその各開始核酸セグメントに起因しており、該開始核酸セグメントは、特定のバーコード配列の存在に部分的に基づき、一部の場合には断片の実際の配列、即ち断片配列の非バーコード部分に部分的に基づく。認識され得るように、短配列データに基づいているにもかかわらず、例えば共通のバーコードを保持するその他の重複配列を使用して、おそらく同じより長い第1の断片配列に由来する同じバーコードを共有する2つの配列(特に、そのような配列は、近接する配列セグメントに別の方法でアセンブル可能である)を推測することができる。第1の断片をアセンブルすると、該第1の断片を、より長い配列セグメント、例えば完全長の遺伝子構成成分にアセンブルさせることができる。
一例示的プロセスでは、本明細書に記載した方法を使用して、1つ以上の鋳型核酸配列の1つ以上の断片にバーコードを付けることができる。付着した核酸バーコード配列に少なくとも部分的に基づいて、1つ以上の断片の断片をキャラクタライズすることができる。断片のキャラクタライゼーションは、断片を各鋳型核酸配列又は鋳型核酸配列が由来するゲノムへの位置付けを含むこともできる。更に、キャラクタライゼーションは、個々の核酸バーコード配列及び付着した鋳型核酸配列の断片の配列を同定することを含むこともできる。
一部の場合には、本明細書に記載した配列決定法は、核酸セグメント又は標的核酸のキャラクタライゼーションで有用であり得る。いくつかの例示的方法では、核酸セグメントと、共通の核酸バーコード配列を含む複数のオリゴヌクレオチドを含むビーズ(例えば、本明細書に記載したビーズの任意の適切な種類等)とを区画(例えば液滴等の本明細書に記載した任意の適切な種類の区画等)に共区画化することにより、核酸セグメントをキャラクタライズすることができる。オリゴヌクレオチドを、本明細書の別の箇所に記載したようにビーズに放出可能に付着させることができる(例えば、例えば熱刺激、光刺激及び化学的刺激等の刺激のビーズへの適用時にビーズから放出可能である)、並びに/又は1つ以上の機能性配列(例えば、プライマー配列、プライマーアニーリング配列、固定化配列、本明細書の別の箇所に記載したあらゆるその他の適切な機能性配列等)及び/又は本明細書の別の箇所に記載した1つ以上の配列決定用プライマー配列を含むことができる。更に、本明細書の別の箇所に記載したビーズに付着しているオリゴヌクレオチドの数等の任意の適切な数のオリゴヌクレオチドをビーズに付着させることができる。
区画内において、オリゴヌクレオチドを核酸セグメントの断片又は核酸セグメントの一部のコピーに付着させることができ、その結果、断片又はコピーも共通の核酸バーコード配列に付着する。断片は、核酸セグメントの断片と重複することができ、例えば、核酸セグメントの2倍超の被覆度、5倍超の被覆度、10倍超の被覆度、20倍超の被覆度、40倍超の被覆度又は更に高い被覆度を提供することができる。一部の場合には、オリゴヌクレオチドは、核酸セグメントの一部又はその相補体とアニールすることができるプライマー配列を含むことができる。一部の場合には、オリゴヌクレオチドを含み、そのため共通の核酸バーコード配列を含む核酸セグメントの少なくとも一部のコピーを生成するために、オリゴヌクレオチドのプライマー配列を伸長させることによりオリゴヌクレオチドを付着させて、核酸セグメント又はその相補体の少なくとも一部を複製することができる。
核酸セグメントの断片又は核酸セグメントの一部のコピーへのオリゴヌクレオチドの付着後に、本明細書に記載した配列決定法のあらゆる種類等の任意の適切な配列決定法により、核酸セグメントの断片又は核酸セグメントの一部のコピー及び付着したオリゴヌクレオチド(オリゴヌクレオチドのバーコード配列を含む)を配列決定し、バーコードが付いた複数の断片配列又はバーコードが付いた複数のコピー配列を生成することができる。配列決定後に、共通の核酸バーコード配列への付着時に、核酸セグメントの断片又は核酸セグメントの一部のコピーを、少なとも部分的に核酸セグメント内で連結されているとキャラクタライズすることができる。認識され得るように、そのようなキャラクタライゼーションは、連結されて連続しているとキャラクタライズされる配列を含むことができ、同じ断片内で連結され得るが連続配列ではない配列も含むことができる。更に、配列決定中に生成された、バーコードが付いた断片配列又はバーコードが付いたコピー配列を、共通の核酸バーコード配列及び/又はバーコードが付いた断片配列若しくはバーコードが付いたコピー配列の非バーコード部分に少なくとも部分的に基づいて、1つ以上の連続核酸配列にアセンブルすることができる。
一部の場合には、複数の核酸セグメント(例えば、本明細書の別の箇所に記載したゲノムの少なくとも一部の断片)を複数の別個の区画中において複数の異なるビーズとともに共区画化することができ、その結果、別個の区画の複数の異なる区画の各区画は単一のビーズを含有する。複数の異なるビーズは、複数の異なるバーコード配列(例えば、少なくとも1,000個の異なるバーコード配列、少なくとも10,000個の異なるバーコード配列、少なくとも100,000個の異なるバーコード配列、少なくとも1,000,000個の異なるバーコード配列又は本明細書の別の場所に記載したあらゆるその他の数の異なるバーコード配列)を含むことができる。一部の場合には、複数の別個の区画の2個以上の、3個以上の、4個以上の、5個以上の、6個以上の、7個以上が、同じバーコード配列を含むビーズを含むことができる。一部の場合には、別個の区画の少なくとも0.01%、0.1%、1%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%又は99%が、同じバーコード配列を有するビーズを含むことができる。更に、各ビーズは、共通の核酸バーコード配列を含む、複数の付着したオリゴヌクレオチドを含むことができる。
同時の区画化後に、各区画において、バーコード配列を核酸セグメントの断片又は核酸セグメントの一部のコピーに付着させることができる。次いで、核酸セグメントの断片又は核酸セグメントの一部のコピーを別個の区画からプールすることができる。プール後、(例えば、本明細書に記載したもの等の任意の適切な配列決定法を使用して)核酸セグメントの断片又は核酸セグメントの一部のコピー及び任意の会合しているバーコード配列を配列決定し、配列決定された断片又は配列決定されたコピーを生成することができる。配列決定された断片又は配列決定されたコピーを、共通のバーコード配列を含む、配列決定された断片又は配列決定されたコピーに少なくとも部分的に基づいて、共通の核酸セグメントに由来するとキャラクタライズすることができる。更に、配列決定された断片又は配列決定されたコピーから得た配列をアセンブルして、配列決定された断片又は配列決定されたコピーが由来する配列の連続配列(例えばゲノムの少なくとも一部)を生成することができる。配列決定された断片又は配列決定されたコピーからの配列アセンブリを、配列断片のヌクレオチド配列及び配列決定された断片の共通のバーコード配列の各々に少なくとも部分的に基づいて完了させることができる。
別の例示的方法では、標的核酸の断片を複数の液滴に区画化することにより、標的核酸をキャラクタライズすることができる。各液滴は、共通のバーコード配列を含む複数のオリゴヌクレオチドに付着したビーズを含むことができる。共通のバーコード配列を、液滴中において標的核酸の断片の断片に付着させることができる。次いで、液滴をプールすることができ、本明細書に記載した配列決定法等の任意の適切な配列決定法を使用して、プールした液滴の断片及び会合したバーコード配列を配列決定する。配列決定後に、共通のバーコード配列を含む標的核酸の断片の断片に少なくとも部分的に基づいて、標的核酸の断片の断片を標的核酸の断片に位置付けることができる。
配列決定における本明細書に記載した方法、組成物及びシステムの適用は概して、NGS配列決定技法、例えば、Illumina MiSeq、HiSeq and X10配列決定システム、及びLife Technologies, Inc.社から入手可能な配列決定システム、例えばIon Torrentラインの配列決定システム等の様々な異なる配列決定技法のいずれかに適用可能であり得る。バーコード配列に関して論じたが、配列決定されたバーコード配列は、例えば配列決定エラーの主な原因である全体バーコード配列を含み得ないことが認識され得る。従って、2つのバーコード配列が同じバーコード配列であるとのキャラクタライゼーションに言及する場合、このことは、例えば5未満の、4未満の、3未満の、2未満又は更に単一の塩基により変動するバーコード配列の実質的な部分の認識に基づくことができることが認識され得る。
少数の細胞からの配列決定
本明細書に記載した方法を、細胞特有の情報を得ることができるようにするやり方で、細胞内に含有されるポリヌクレオチドを調製するのに使用することもできる。この方法は、非常に少ないサンプルからの、例えば約10〜100個の細胞を含むサンプルからの遺伝子多様性の検出を可能にする。一部の場合には、約1個の、約5個の、約10個の、約20個の、約30個の、約40個の、約50個の、約60個の、約70個の、約80個の、約90個の又は約100個の細胞を、本明細書に記載した方法で使用することができる。一部の場合には、少なくとも約1個の、約5個の、約10個の、約20個の、約30個の、約40個の、約50個の、約60個の、約70個の、約80個の、約90個の又は約100個の細胞を、本明細書に記載した方法で使用することができる。その他の場合では、最大で約5個の、約10個の、約20個の、約30個の、約40個の、約50個の、約60個の、約70個の、約80個の、約90個の又は約100個の細胞を、本明細書に記載した方法で使用することができる。
ある例では、方法は、最大で1つの細胞(又は1つの細胞の抽出物)が区画内に、例えば流体液滴内に存在し、バーコードオリゴヌクレオチド、例えば上記に記載したバーコードオリゴヌクレオチドとともに共区画化されるように細胞サンプル(又は粗細胞抽出物)を区画化することを含む。次いで、処理は、細胞を溶解させること、細胞内に含有されるポリヌクレオチドを断片化すること、断片化したポリヌクレオチドを、バーコードが付いたビーズに付着させること、バーコードが付いたビーズをプールすること、及び結果として生じる、バーコードが付いた核酸断片を配列決定することを含む。
本明細書の別の箇所に記載したように、バーコード及びその他の試薬を、ビーズ(例えばゲルビーズ)内に封入することができる、ビーズ(例えばゲルビーズ)上に被覆することができる、ビーズ(例えばゲルビーズ)と会合させることができる、又はビーズ(例えばゲルビーズ)内に分散させることができる。ビーズを、サンプル(例えば細胞)の充填と同時に流体液滴中に充填することができ、その結果、各細胞は異なるビーズと接触する。この技法を使用して、各細胞から得たオリゴヌクレオチドに固有のバーコードを付着させることができる。次いで、結果として生じる、タグが付いたオリゴヌクレオチドをプールして配列決定することができ、バーコードを使用してオリゴヌクレオチドの起源を追跡することができる。例えば、同一のバーコードを有するオリゴヌクレオチドを同じ細胞に由来すると決定することができ、異なるバーコードを有するオリゴヌクレオチドを異なる細胞に由来すると決定することができる。
本明細書に記載した方法を使用して、がん等の疾患の存在を示すことができる特定の遺伝子変異を検出することができる。例えば、結腸組織サンプルのBRAF遺伝子でのV600変異の存在の検出は、結腸がんの存在を示すことができる。その他の場合では、予後適用として、特定疾患の発症に関する増加したリスクファクターとして機能することができる特定遺伝子での変異の検出を挙げることができる。例えば、乳房組織サンプルにおけるBRCA1変異の存在の検出は、この変異を有しない人よりも高いレベルの乳がんの発症リスクを示すことができる。一部の例では、本開示は、2つの異なる発がん遺伝子(例えばKRAS及びEGRF)での変異を同定する方法を提供する。同じ細胞が、両方の変異を有する遺伝子を含む場合、このことは、より攻撃的な形態のがんを示すことができる。対照的に、変異が2つの異なる細胞に位置する場合、このことは、がんはより良性である可能性がある又はあまり進行していない可能性があることを示すことができる。
遺伝子発現の分析
本開示の方法を、遺伝子発現の変化の検出ためのサンプルの処理に適用することができる。サンプルは、細胞、mRNA又はmRNAから逆転写されたcDNAを含むことができる。サンプルは、プールされたサンプルであり得る、いくつかの異なる細胞若しくは組織からの抽出物を含むことができる、又は単一の細胞若しくは組織からの抽出物を含むサンプルであり得る。
細胞を流体液滴中に直接置いて溶解させることができる。溶解後、本開示の方法を使用して、配列決定用の細胞のオリゴヌクレオチドを断片化することができる、及び該オリゴヌクレオチドにバーコードを付けることができる。本開示の方法で使用して流体液滴中にオリゴヌクレオチドを導入する前に、該オリゴヌクレオチドを細胞から抽出することもできる。本明細書に記載した流体液滴中で又はそのような流体液滴の外で、mRNAの逆転写を実施することができる。cDNAの配列決定は、特定の細胞における経時的な又は特定の条件への暴露後の特定の転写産物の存在量を示すことができる。
細胞又はタンパク質からのポリヌクレオチドの区画化
一例では、本開示で提供された組成物、方法、デバイス及びキットを使用して、流体液滴内に細胞又はタンパク質を封入することができる。一例では、単一の細胞以上の細胞(例えば、2個、10個、50個、100個、1000個、10000個、25000個、50000個、100000個、500000個、1000000個又はそれ以上の細胞)を、流体液滴内の溶解バッファーとともにビーズ上に、ビーズ中に又はビーズ内に充填し、特定の期間にわたりインキュベートすることができる。流体液滴内の1つ以上の細胞のポリヌクレオチド(例えば染色体)を維持しつつビーズの内容物の洗浄及び試薬のビーズ中への導入を可能とするために、ビーズは多孔質であり得る。次いで、本開示で提供された方法のいずれかに従って又は当分野で既知の方法に従って、1つ以上の細胞の封入されたポリヌクレオチド(例えば染色体)を処理することができる。この方法を、タンパク質等のあらゆるその他の細胞構成成分に適用することもできる。
エピジェネティック適用
本開示の組成物、方法、デバイス及びキットはエピジェネティック適用に有用であり得る。例えば、DNAメチル化はエピジェネティック遺伝の指標であり得、単一ヌクレオチド多型(SNP)を含む。従って、核酸を含むサンプルを処理して、配列決定中に、メチル化されている塩基を決定することができる。一部の場合には、バーコードを付ける核酸を含むサンプルを2つのアリコートに分けることができる。サンプルの1つのアリコートを二亜硫酸塩で処理して、非メチル化シトシン含有ヌクレオチドをウラシル含有ヌクレオチドに変換することができる。一部の場合には、二亜硫酸塩処理をサンプル区画化前に行うことができる、又はサンプル区画化後に行ってもよい。次いで、各アリコートを区画化し(まだ区画化されていない場合)、この区画中において各アリコートにバーコードを付け、本明細書に記載したように一括して追加の配列を追加して、シークエンサーレディ産物を生成することができる。各アリコートに関して得た配列決定データの比較(例えば二亜硫酸塩処理サンプル対未処理サンプル)を使用して、サンプル核酸中においてメチル化されている塩基を決定することができる。
一部の場合には、分けたサンプルの1つのアリコートをメチル化感受性制限酵素(MSRE)で処理することができる。メチル化特異的酵素はサンプル核酸を加工することができ、その結果、サンプル核酸がメチル化部位で切断される。サンプルアリコートの処理をサンプルの区画化前に行うことができ、又はサンプルの区画化後に行ってもよく、各アリコートを区画化して、バーコードが付いたシークエンサーレディ産物を生成することができる。各アリコートに関して得た配列決定データの比較(例えばMSRE処理サンプル対未処理サンプル)を使用して、サンプル核酸中においてメチル化されている塩基を決定することができる。
低インプットDNA適用
本明細書に記載した組成物及び方法は、低ポリヌクレオチドインプット適用の分析及び配列決定に有用であり得る。本明細書に記載した方法、例えばPHASEは、低ポリヌクレオチドインプット適用での優れたデータ品質を得る補助となり得る、及び/又は増幅エラーを除去する補助となり得る。この低インプットDNA適用として、異なる核酸の凝集として存在する複数の異なる核酸を個々に配列決定し得る及び同定し得るための、更にインプットDNAの総量が極端に低い分析を行い得るための、目的の配列がごく一部の構成成分である無関係な又は関係性が低い核酸の混合物中において目的の特定の核酸配列を配列決定するための及び同定するためのサンプルの分析が挙げられる。具体例として、サンプルの大部分が正常な健康細胞により提供され得るが、ごく少数は腫瘍又はその他のがん細胞に由来し得る組織サンプル又は循環細胞からの体細胞変異の配列決定及び同定が挙げられる。その他の例として、個々の個体群メンバーの寄与が微生物要素の大きくて多様な個体群の中では他の方法では容易に同定され得ない複数の個々の個体群構成成分のキャラクタライゼーション、例えば微生物叢分析適用における複数の個々の個体群構成成分のキャラクタライゼーションが挙げられる。更なる例では、異なる染色体、例えば母系染色体及び父系染色体からの同じ領域の異なる鎖を個々に配列決定し得る及び同定し得ることにより、各染色体上の固有のバリアントの同定が可能になる。本明細書に記載した組成物、方法及びシステムの低ポリヌクレオチドインプット適用の更なる例は、本出願と同日付けで出願された米国仮特許出願第_____号(代理人整理番号第43487-727.101号)に記載されている。
本明細書に記載した方法及びシステムの利点は、現状の技術で直面する問題についての議論でより明確になる。サンプル材料、例えば細胞サンプル又は組織サンプルの遺伝子構造の分析において、ほとんどの配列決定技法は、配列決定プロセスに十分な材料を作るために、サンプル中における標的核酸の幅広い増幅に依存している。残念なことに、この増幅プロセス中に、存在が多い材料が、低濃度で存在するサンプルの一部を優先的に圧倒するだろう。例えば、サンプルからの遺伝子材料が95%の正常な組織DNAと5%の腫瘍細胞からのDNAとから構成される場合、典型的な増幅プロセス、例えばPCRに基づく増幅は、存在が少ない材料を除いて、存在が多い材料を速やかに増幅させるだろう。更に、この増幅反応は典型的にはプールされた状況で実行されることから、特定の染色体、ポリヌクレオチド又は生物の観点から、増幅される配列の起源は典型的には、プロセス中に保持されないだろう。
対照的に、本明細書に記載した方法及びシステムは、個々の又は少数の核酸を例えば液滴において別個の反応体積中に区画し、この反応体積中では、核酸構成成分を最初に増幅させることができる。この最初の増幅中に、別個の反応体積中に存在する構成成分に固有の識別子を結合させることができる。異なる構成成分の別個の区画化された増幅及び固有の識別子、例えばバーコード配列の適用により、各サンプル構成成分の寄与の保持が可能となり、更に、その後の増幅プロセス、例えばPCR増幅等の配列決定プロセスによる各サンプル構成成分の起源の帰属も可能になる。
用語「約」は本明細書内で及び本開示全体を通して使用する場合、具体的な使用量と関連して述べた数値の15%超又は15%未満であり得る範囲を概して意味する。例えば、「約10」は8.5から11.5の範囲を含むであろう。
認識され得るように、本開示は、本明細書に記載した様々な適用、使用及び目的等の特定の使用又は目的のための、本明細書に記載した組成物、ライブラリー、方法、デバイス及びキットのいずれかの使用を提供する。例えば、本開示は、種の区画化における、オリゴヌクレオチドの区画化における、区画からの種の刺激選択的放出における、区画中における反応(例えばライゲーション反応及び増幅反応)の実施における、核酸合成反応の実施における、核酸のバーコード付けにおける、配列決定のためのポリヌクレオチドの調製における、ポリヌクレオチドの配列決定における、ポリヌクレオチドの段階的実行における{例えば、本出願と同日付けで出願された米国仮特許出願第_____号(代理人整理番号第43487-726.101号)を参照されたい}、少数の細胞からのポリヌクレオチドの配列決定における、遺伝子発現の解析における、細胞からのポリヌクレオチドの区画化における、変異の検出における、神経障害の診断における、糖尿病の診断における、胎児異数性の診断における、がんの変異検出及び法医学における、疾患の検出における、医療診断における、低インプット核酸適用、例えば循環腫瘍細胞(CTC)の配列決定における、これらの組み合わせにおける、並びに本明細書に記載したあらゆるその他の適用、方法、プロセス又は使用における、本明細書に記載した組成物、方法、ライブラリー、デバイス及びキットの使用を提供する。
本明細書に記載したあらゆる濃度値は、あらゆるin situでの変換、修飾、反応、隔離等を問わず、混合濃度値として記載されている。更に、必要に応じて、本明細書に記載した方法(例えば、配列決定方法、バーコードを付ける方法、増幅方法、標的増幅方法、バーコードが付いたサンプルを分析する方法等)の感度及び/又は特異性は変動することができる。例えば、本明細書に記載した方法は、50%超の、70%超の、75%超の、80%超の、85%超の、86%超の、87%超の、88%超の、89%超の、90%超の、91%超の、92%超の、93%超の、94%超の、95%超の、96%超の、97%超の、98%超の、99%超の若しくは99.5%超の特異性、及び/又は50%超の、70%超の、75%超の、80%超の、85%超の、86%超の、87%超の、88%超の、89%超の、90%超の、91%超の、92%超の、93%超の、94%超の、95%超の、96%超の、97%超の、98%超の、99%超の若しくは99.5%.超の感度を有することができる。
X.実施例
(実施例1)アクリダイトプライマーで官能化されたゲルビーズの生成
図2に示す方法に従ってゲルビーズを作製する。ヌクレアーゼフリーの水中において、下記の濃度で1mLのストック溶液を調製する:アクリルアミド前駆体(化合物A)=40%(v/v)ストック溶液、架橋剤(ビス-アクリロイルシスタミン-化合物B)=アセトニトリル:水の50:50ミックス中に3.19mg/mL、開始剤(化合物C)=20mg/mL及びジスルフィドアクリダイトプライマー (化合物D)=1mM。このストック溶液から、下記の体積を混合することにより1mLの水性ゲルビーズ(GB)ワーキング溶液を調製する:ヌクレアーゼフリーの水=648μL、化合物A=150μL、化合物B=100μL、化合物C=100μL及び化合物D=2μL。化合物A及び化合物Bのストック溶液並びにGBワーキング溶液を毎日調製する。
ゲルビーズ(GB)ワーキング溶液201は、架橋剤と、BACと、約0.1〜約100μmの間の濃度でジスルフィド修飾アクリダイトオリゴヌクレオチドを含むポリマー前駆体溶液とを含有する水性流体である。第2の流体202は、界面活性剤であるKrytox FSH 1.8w/w% HFE 7500を含有するフッ素化油である。促進剤であるテトラメチルエチレンジアミン(TEMED)をa)液滴生成前の油に添加して(203)、b)液滴生成後のラインで添加して(205)、及び/又はc)液滴生成後の出口リザーバーに添加して(206)、最終濃度を1%(v/v)にする。TEMEDを毎日新しく作る。水相及び油相の流体を液滴生成器204に送ることにより、ゲルビーズを生成する。液滴生成直後に重合を開始させ、該重合は出口ウェルまで連続する。15〜20分後にゲル化は完了すると考えられる。ゲル化後、HFE 7500で洗浄することにより、生成したゲルビーズを連続相交換にかけて(207)、過剰な油を除去し、ビーズを水溶液中に再懸濁させる。一部の場合には、得られるビーズは凝集して存在する場合がある。ゲルビーズの凝集を、ボルテックスすることにより個々のゲルビーズに分離する。ゲルビーズは顕微鏡下で可視化される。
(実施例2)限界希釈による、バーコードが付いたゲルビーズの生成
図3A及び図4に示す方法に従った限界希釈により、官能化ゲルビーズを作製する。アクリダイトオリゴヌクレオチド(ジスルフィド修飾されているか又はされていない)を有するゲルビーズ301、401を、限界希釈でバーコード含有鋳型配列302と混合する。ビオチン標識リードプライマー406を含むPCR試薬303を、ゲルビーズ及び鋳型配列と混合する(304)。好ましくは最高で1つのバーコード鋳型がエマルジョン内の区画(例えば液滴)中に存在するように、振盪/撹拌、フローフォーカシング又はマイクロシーブにより、ビーズ、バーコード鋳型及びPCR試薬をゲル-水-油エマルジョンに乳化させる(305)。エマルジョンを1つ以上のサーマルサイクルに曝露する(306)。最初のサーマルサイクルで相補的バーコード配列408が組み込まれ、ゲルビーズ上に固定化される。
連続したサーマルサイクルを実施して、ゲルビーズ全体でバーコードをクローン的に増幅させ、及びバーコード配列を含有しないビーズからバーコード配列を含有するビーズを下流で選別するために5'ビオチン標識プライマーを相補鎖に組み込む。ペルフルオロデカノールを添加し、油を除去し、HFE-7500で洗浄し、水性バッファーを添加し、遠心分離し、上清を除去し、不要な生成物{例えば、プライマー二量体、出発材料、デオキシヌクレオチドトリホスフェート(dNTP)、酵素等}を除去し、分解可能なゲルビーズを水性懸濁液中に回収することにより、エマルジョンを破壊する(307)。官能化ゲルビーズを、高塩バッファー中に再懸濁させる(308)。この再懸濁液にストレプトアビジン標識磁性ビーズを添加し、次いで再懸濁液をインキュベートして、ビオチン化バーコードに付着したゲルビーズに結合させる(308、410)。次いで、磁性デバイスを使用して、陽性のバーコードが付いたゲルビーズをバーコードに付着していないビーズから分離する(308)。変性条件309(例えば、熱又は化学変性剤)をゲルビーズに適用し、ビオチン化された相補鎖をバーコードが付いたビーズから分離する。その後、磁性ビーズを溶液から除去し、結果として生じる部分的に官能化されたバーコードが付いたビーズの溶液を更なる処理のためにプールする。
(実施例3)バーコードが付いたビーズの更なる官能化
図3Bに示すように、実施例2からのバーコードが付いたゲルビーズ311を下記のように更に官能化する。ビーズを追加の鋳型オリゴヌクレオチド310(例えば、図4に示すように、ランダムN mer配列413を含有するオリゴヌクレオチド)及びPCR試薬312と組み合わせ(313)、鋳型ヌクレオチドとゲルビーズに付着したリードプライ-マーとのハイブリダイゼーションを可能にする条件に晒す。バーコード鎖が伸長するように伸長反応を実施し(314)、これにより鋳型オリゴヌクレオチドの相補配列が組み込まれる。結果として生じる官能化ゲルビーズを水性バッファー中に再懸濁させ(315)、加熱条件に曝露して相補鎖を除去し(316)、水性貯蔵バッファー中に置く(317)。
(実施例4)ビーズ官能化の段階的記述
図4には、バーコード及びランダムN merによるゲルビーズの官能化の例示的プロセスの段階的記述が示されている。図4Aに示すように、このプロセスは、P5プライマー等のユニバーサルプライマー(又はこの相補体)403に付着しているゲルビーズ401とともに始まる。ジスルフィド結合402により、ビーズがプライマーに結合されていてもよい。ゲルビーズは水溶液(g/w)中に提供されている。限界希釈及び区画化を使用して、固有のバーコード配列鋳型405とビーズとを組み合わせ、その結果、最大で1つの固有のバーコード配列がゲルビーズと同じ区画を占める。一般に、区画は、ゲル/水/油(g/w/o)エマルジョン内の水性液滴である。図4Bに示すように、バーコード配列鋳型405は、ユニバーサルプライマー403に相補的である配列404と、ビオチン標識リードプライマー406と同一の配列である配列407とを含有するより大きなヌクレオチド鎖内に含有されている。
図4Cに示すように、次いで増幅反応を行い、バーコード鋳型405の相補体408を、ビーズに付着した鎖上に組み込む。増幅反応により、配列407に相補的である配列415も組み込まれる。更なる増幅サイクルにより、ビオチン標識リードプライマー406の配列415へのハイブリダイゼーションが生じ(図4D)、次いで、ビオチン標識リードプライマーが伸長される(図4E)。次いで、エマルジョンを破壊し、次いでゲルビーズをゲル/水共通溶液中にプールすることができる。
ゲル/水溶液中において、次いで、磁性捕捉ビーズ409を使用してゲルビーズに付着したビオチン化核酸を捕捉し、次いで、元々のプライマーのみを含有するビーズから単離する(図4F及び図4G)。次いで、ビオチン化鎖を、ゲルビーズに付着した鎖から除去する(図4H)。次いで、ゲルビーズに付着した鎖にランダムN mer配列414を付着させることができる。各ゲルビーズに関して、ゲルビーズ全体にわたり同一のバーコード配列408を各プライマーに付着させ、次いで、各バーコード配列をランダムN mer配列414で官能化させ、その結果、複数の異なるランダムN mer配列が各ビーズに付着する。このプロセスの場合、配列415に相補的な配列412に結合しているランダムN mer鋳型配列413が、プールされたビーズを含有する溶液に導入される(図4I)。この溶液を、ビーズに付着した鎖への鋳型のハイブリダイゼーションを可能にする条件に晒し、ランダムN mer 414を含むように配列415を伸長させる(図4J)。次いで、完全に官能化されたビーズ(図4K)をサンプル核酸及び還元剤{例えば、1mMの濃度のジチオスレイトール(DTT)}と組み合わせ、ゲル/水/油エマルジョンの液滴内で区画化する(図4L)。この組み合わせ工程を、マイクロ流体デバイスにより行うことができる(図5A)。次いで、例えば還元剤の作用により各区画(例えば液滴)内でゲルビーズを分解させ、バーコードが付いた配列を液滴から放出させる(図4M及び図4N)。バーコードが付いた配列内のランダムN merは、サンプル核酸の増幅用のプライマーとして機能することができる。
(実施例5)エマルジョン中のゲルビーズ(GEM)とサンプルとを組み合わせるためのマイクロ流体チップの使用
図5に示す二重交差マイクロ流体デバイスを使用して、官能化ゲルビーズをサンプルと組み合わせることができる。分解可能なゲルビーズを流体の流れで流体入り口501に導入し、該流体の流れは約7%のグリセロールを含有する。目的の実験サンプルを流体の流れで流体入り口502に導入し、該流体の流れは水相である。還元剤である約1mMの濃度のジチオスレイトール(DTT)を流体の流れで流体入り口503に導入し、該流体の流れは約7%のグリセロールを含有する。流体入り口501、502及び503はマイクロ流体交差接合部504で混ざり、第2のマイクロ流体交差接合部506に入る。第2のマイクロ流体交差接合部を使用して、ゲルビーズを含有する乳化(w/o)液滴を作製することができる。流体入り口505を使用して、2%(w/w) bis krytox peg (BKP)を含む油を導入する。第2のマイクロ流体交差接合部507から出る個々の液滴を、更なる下流での利用のためにマイクロプレートウェル中に添加する(図5C)。図5Dは、DTTの非存在下で生成された(従ってゲルビーズを含有する)液滴の画像である。図5Eは、DTTの存在下で生成された液滴の画像であり、DTTにより内部のゲルビーズが分解された。
(実施例6)陽性ゲルビーズの蛍光同定
図6は、蛍光標識で標識されている増幅核酸を含有するゲルビーズの画像を示す。ゲルビーズの一部のみがバーコードで官能化されるように、限界希釈を使用してゲルビーズの官能化を最初に実施する。PCRサーマルサイクル後かつ洗浄前に、bis krytox peg (BKP)エマルジョン中に懸濁させたゲルビーズを4倍の倍率で撮像する。明視野画像(図6A)は全てのエマルジョン生成液滴を示し、蛍光画像(図6B)は陽性の官能化ゲルビーズのみを示す。空の液滴を示す多くの非蛍光液滴が生成されており、該非蛍光液滴はゲルビーズ及び/又はオリゴヌクレオチドを含有しない。複数回の再懸濁及びHFE-7500での洗浄により、空の液滴を洗い流す。図6C及び図6Dは、エマルジョンの破壊及び更なる洗浄工程後に陽性ゲルビーズが濃縮されたことを示す。明視野画像(4倍、図6C及び10倍、図6E)は全てのゲルビーズを示す。蛍光画像(4倍、図6D及び10倍、図6F)は、SYBR染色による30%の陽性ビーズを示す。30%の陽性ビーズという結果は、gDNAインプットからの予測値と一致する。
図7は、単鎖(ss)DNA、二本鎖(ds)DNA及び変性ssDNAを含有するゲルビーズの画像を示す。下記の工程で得た蛍光画像から明らかであるように、1X EvaGreenで染色したゲルビーズはdsDNAの存在下でより明るい。工程1:製作(ssDNA)、図7A、工程2:伸長(dsDNA)、図7B及び工程3:変性(ssDNA)、図7C。蛍光画像は、ビーズが伸長後により明るくなり、変性後により薄暗くなることを示す。
(実施例7)ストレプトアビジン被覆磁性ビーズを使用する陽性ゲルビーズの濃縮
ストレプトアビジン被覆磁性ビーズを使用する陽性ゲルビーズの濃縮を図8に示す。図8A(明視野)及び図8B(蛍光)は、磁性ビーズの添加から24時間後のSYBR染色ゲルビーズの画像を提供する。磁性被覆陽性ゲルビーズは、SYBR染色に起因してより明るい。40mg/mLの磁性ビーズ濃度での選別前(図8C)の及び選別後(図8D)の明視野画像は、被覆ビーズが光学的により明るい陽性ゲルビーズが濃縮されたことを示す。60mg/mLの磁性ビーズ濃度での選別前(図8E)の及び選別後(図8F)の明視野画像は、被覆ビーズが光学的により明るい陽性ゲルビーズが濃縮されたことを示す。各磁性ビーズのワーキング濃度にて、単一のゲルビーズは約100〜1000個の磁性ビーズで被覆される。
(実施例8)ゲルビーズの溶解
図9で明らかなように、塩基性溶液中でのゲルビーズの加熱によりゲルビーズが分解する。95℃にて塩基性溶液中においてゲルビーズを加熱し、5分の加熱間隔でモニタリングする:t=0分、図9A、t=5分、図9B、t=10分、図9C、t=15分、図9D。15分後にゲルビーズは完全に分解される。ゲルビーズが分解している間、ゲルビーズのサイズは2倍超になる。図10は、トリス(2-カルボキシエチル)ホスフィン(TCEP)を使用するゲルビーズの溶解を示しており、該トリス(2-カルボキシエチル)ホスフィン(TCEP)は、効果的で不可逆的なジスルフィド結合還元剤である。官能化ゲルビーズ(図10A)を、1mMのTCEPを含む塩基性溶液pH=8中に置き、2分の間隔でモニタリングする:t=0分、図10B、t=2分、図10C、t=4分、図10D、t=6分、図10E、t=8分、図10F、t=10分、図10G。約6分から約10分の間に、官能化ゲルビーズは完全に分解される。
(実施例9)ゲルビーズ(GB)の溶解後の内容物の分析
ゲルビーズに付着している内容物の分析を図11及び図12に示す。ゲルビーズを、バーコード又はバーコード相補配列(N12C)と8ヌクレオチドの長さであるランダムN mer(8 mer)1102とにより官能化する(1101)。R1C及びランダムN merを含有する鋳型構築物1102を使用するプライマー伸長反応を実施することにより、ランダムN merを付加する。オリゴヌクレオチド鎖全体(バーコード及びランダムN merを含む)の長さは82bpである(1101)。ランダムN mer及びR1Cの鎖長は42塩基対(bp)である(1102)。1時間にわたる65℃での高プライマー濃度(10μm)下でKAPA HIFI RM Master Mixを使用して伸長反応を実施する。ゲルビーズの分解工程前の洗浄工程の数の増加により、結果としてサンプル内でのプライマー二量体の量が低減される。洗浄を実施しない場合(1103)、42bpの生成物1106及び80bpの生成物1107の両方を観測することができる。3回の洗浄後、プライマー二量体のレベル1104は、非洗浄実験と比べて低減されている。6回の洗浄後(1105)、80bpの生成物1107は観測されるがプライマー二量体は観測されない。
伸長工程に関して、6つの異なる温度(65℃、67℃、69℃、71℃、73℃、75℃、図11C)を使用して6つの洗浄実験を行うこともできる。この特定の実施例では、高プライマー濃度(10μm)を使用し、伸長工程は1時間持続する。80bpの生成物の量の最適化及び42bpの生成物1109の数の最小化の両方にとって67℃が至適温度であると思われる。
その後の変性試験のために温度67℃を選択する。サンプルを95℃に6回加熱し洗浄して相補鎖を除去する相補鎖の熱変性により、結果として変性前に84bpのピーク1202が生じ、変性後にピーク1201の低減を示す。工程1から測定した対照値を1203で示す。
(実施例10)ウェル中での区画化による、バーコードが付いたゲルビーズの生成
図13A及び図13Bに示す方法に従ってウェル中で区画化することにより官能化ビーズを作製する。最初の官能化工程を図13Aで概説し、2番目の官能化工程を図13Bで概説する。例示的多重アダプター生成スキームを図13Cで概説し、実施例11で説明する。図13Aに示すように、官能化ビーズ1301{例えば、アクリダイトオリゴ(acrydite oligo)及びプライマー(例えば5'-AAUGAUACGGCGACCACCGAGA-3')を有するビーズ}、バーコード配列を有する鋳型1302(例えば5'-XXXXXXTCTCGGTGGTCGCCGTATCATT-3')、並びに適切なPCR試薬1303を一緒に混合し(1304/1305)、マルチウェルプレートの384ウェルに分ける。各ウェルは、固有のバーコード配列の多重コピー及び複数のビーズを含む。個々のウェルにおいて伸長反応を伴うサーマルサイクル1306を実施し、バーコードに付着したビーズを形成する。全てのウェルを一緒にプールし、まとめてクリーンアップする(1307/1308)。
ランダムN merを追加するために、部分的に官能化されたビーズ1310、鋳型ランダムN merオリゴヌクレオチド1309及び適切なPCR試薬1311を一緒に混合し(1312)、官能化ビーズ1310を伸長反応1313にかけて、ランダムN mer鋳型に相補的なランダムN mer配列をビーズに追加する。サーマルサイクル後、ビーズをまとめてクリーンアップする(1314〜1316)。
(実施例11)組み合わせプレート技法
図13Cに示すように、プライマー(例えばP5オリゴマー、5'-AAUGAUACGGCGACCACCGAGA-3')1318に付着したビーズ1317を、固有の鋳型部分バーコード配列(例えば5'-XXXXXXTCTCGGTGGTCGCCGTATCATT-3')を含む鋳型1321の多重コピーを含むマルチウェルプレート(例えば5X-1 384ウェルプレート1319)のウェルに区画化する。伸長反応(例えば鋳型1321を介したプライマー1318の伸長)を実施して、各ウェルにおいて、伸長産物(例えば、プライマー1318と鋳型部分バーコード配列に相補的な部分バーコード配列とを含むオリゴヌクレオチド)を含むビーズ-P5-[5X-1] 1320を生成する。ウェルから取り出したビーズを一緒にプールし、まとめてクリーンアップ工程を実施する。
次いで、プールした混合物を、第2のマルチウェルプレート、例えば5X-2を有する384ウェルプレート1322のウェルに再び分け、また各ウェルは別の固有の部分バーコード配列及びランダムN merを含むオリゴヌクレオチド(例えば5'P-YYYYYYCGCACACUCUUUCCCUACACGACGCUCUUCCGAUCUNNNNNNNN-BLOCK)も含む。オリゴヌクレオチドには、(例えばハイブリダイゼーションにより)ブロッカーオリゴヌクレオチド(例えば「BLOCK」)が付着され得る。ビーズに結合している伸長産物と第2の部分バーコード配列及びランダムN merを含むオリゴヌクレオチドとの間で単鎖ライゲーション反応1324を実施する。ライゲーション反応後、全長バーコード配列(例えばXXXXXXYYYYYY)及びランダムN merを含むビーズ(例えばビーズ-P5-[5X-1][5X-2]R1[8N-ブロッカー])が生成される(1323)。また、ビーズはブロッカーオリゴヌクレオチドも含む。次いで、全てのウェルを一緒にプールし、ブロック基を切断し、ビーズ生成物を一括してクリーンアップする。非常に多様なバーコード配列を含むビーズが得られる。
(実施例12)配列決定のための部分的ヘアピン増幅(PHASE)反応
配列決定のための部分的ヘアピン増幅(PHASE)反応は、図14及び図15で概説する方法に従って、部分的ヘアピン構造を形成することにより、望ましくない増幅産物を軽減するために使用され得る技法である。具体的には、ユニバーサル配列部分1401/1402/1403でタグ付けされている約8N〜12Nの長さのランダムプライマー1404を使用して、ゲノムDNA(gDNA)等の核酸からランダムにプライミングして伸長することができる。ユニバーサル配列は下記を含む:(1)フローセル等の配列決定デバイスとの適合性のための配列(例えば、Illumina社のP5 1401及びリード1プライマー部位1402)並びに(2)バーコード(BC)1403(例えば6塩基配列)。そのような長いユニバーサル配列部分の望ましくない結果を低減するために、ユニバーサル配列部分の最後の10〜20個のヌクレオチドを除く全てに関してチミン含有ヌクレオチドがウラシル含有ヌクレオチドに置換されており、ウラシル含有鋳型を受容し得ない又は処理し得ないポリメラーゼを核酸の増幅に使用し、結果として主要な配列決定基準が著しく改善される(図16A、図21及び図22)。更に、ウラシル含有ヌクレオチド及びブロックされた3'末端(例えば3'ddCTP)を含むブロッキングオリゴヌクレオチドを使用して、ランダムN mer配列による核酸のプライミングを促進し、及び核酸のリード1プライマー部位1402に相補的である部分への優先的な結合を防ぐ。加えて、生成物の長さは、望ましくない増幅産物を低減するためのごくわずかな末端化ヌクレオチド{例えば0.1〜2%のアシクロヌクレオチド(acyNTP)}の包含(図16B)により更に制限される。
望ましくない生成物の増幅を防ぐための部分的ヘアピン形成の一例をここに示す。まず、最初の変性を2分間98℃で実行し、続いて4℃で30秒間、プライマーとして機能するランダムN mer配列によりゲノムDNA配列のランダムな部分をプライミングする(図15A)。その後、0.1℃/秒の温度勾配を伴って45℃まで配列伸長が続く(1秒間保持する)(図15A)。伸長は高温(70℃で20秒)で続き、上流鎖を置換し続け、重複の第1段階が生じる(図15B)。30秒間98℃で変性が起き、更なるプライミングのためのゲノムDNAが放出される。最初のサイクル後、増幅産物は単一の5'タグを有する(図15C)。例えばサイクル2を4℃で開始し、ランダムN mer配列を使用してゲノムDNAを再びプライミングすることにより、これらの上述した工程を最大20回繰り返し、黒色の配列は、コピーされ得ない追加の5'タグ(サイクル1で追加される)の部分を示す(図15D)。98℃で変性が起き、更なるプライミングのためにゲノムDNA及び最初のサイクルからの増幅産物が再び放出される。サーマルサイクルの第2のラウンドの後、5'のタグが付いた産物と3'及び5'のタグが付いた産物との両方が存在する(図15E)。3'及び5'のタグがついた産物からの部分的ヘアピン構造は、望ましくない産物の増幅を防ぐ(図15F)。ゲノムDNA配列の新たなランダムプライミングが4℃で再び始まる(図15G)。
(実施例13)増幅による追加の配列の追加
シークエンサーレディライブラリーの完成のために、更なる増幅{例えばポリメラーゼ連鎖反応(PCR)工程}を完了させて追加の配列を追加する(図14C)。ヘアピン形成を破るために、ロックド核酸(LNA)又はロックド核酸ヌクレオチドを含有するプライマーを使用する。更に、ウラシル含有ヌクレオチドの包含が以前の工程で使用されている場合、この工程では、鋳型ウラシル含有ヌクレオチドを識別しないポリメラーゼを使用する。図17に示す結果から、Illumina MiSeqシークエンサーでの配列決定により測定したように、オリゴヌクレオチドをブロッキングすることにより開始部位の偏りが低減されることが分かる。この場合における核酸鋳型は酵母gDNAである。
(実施例14)デジタルプロセッサ
例示的制御アセンブリ1801の概念図を図18に示す。コンピュータ1802は、制御アセンブリ1801の中心ハブとして機能する。コンピュータ1802は、ディスプレイ1803と、1つ以上の入力デバイス(例えば、マウス、キーボード、カメラ等)1804と、任意選択でプリンタ1805と通信している。制御アセンブリ1801は、このコンピュータ1802を介して下記の1つ以上のデバイスと通信している:任意選択でサンプル前処理ユニット1806、1つ以上のサンプル処理ユニット(配列決定デバイス、サーマルサイクラ―デバイス又はマイクロ流体デバイス)1807及び任意選択で検出器1808。制御アセンブリを例えばイーサネット(登録商標)接続によりネットワーク化することができる。ユーザーは、入力デバイス1804を使用してコンピュータ1802に(例えば所望のセットの核酸増幅反応に必要なパラメータ又はマイクロ流体デバイスへの流量を)入力することができる。この入力がコンピュータ1802により解釈されて指示が生成される。コンピュータ1802は、実行させるために、そのような指示を任意選択のサンプル前処理ユニット1806、1つ以上のサンプル処理ユニット1807及び/又は任意選択の検出器1808に伝達する。更に、任意選択のサンプル前処理ユニット1806、1つ以上のサンプル処理ユニット1807及び/又は任意選択の検出器1808の稼働中に、各デバイスはコンピュータ1802に信号を戻すことができる。そのような信号をコンピュータ1802により解釈して及び使用して、いずれかのデバイスが更なる指示を必要とするかを決定することができる。コンピュータ1802はサンプル前処理ユニット1806を調節することもでき、その結果、サンプルの構成成分が適切に混合され、所望の又は予め決定した割合でサンプル処理ユニット(例えばマイクロ流体デバイス)1807に送られる。コンピュータ1802は検出器1808と通信することもでき、その結果、検出器は、所望の若しくは予め決定した時点で又は前処理ユニット1806若しくはサンプル処理ユニット1807から受信したフィードバックから決定した時点で測定を実施する。検出器1808は、更なる分析及び解釈のために、測定中に得られる生データをコンピュータ1802に戻すこともできる。分析を、ディスプレイ1803及び/又はプリンタ1805により生成される印刷物を介した、エンドユーザーに有用なフォーマットにまとめることができる。サンプル前処理ユニット1806、サンプル処理ユニット1807及び/若しくは検出器1808を制御するために使用する指示又はプログラム;本明細書に記載した方法のいずれかを実行することにより得られるデータ;又は分析された及び/若しくは解釈されたデータを、例えばインターネットである可能性があるネットワーク1810により、1つ以上の遠隔コンピュータ1809に送信することができる、又は該遠隔コンピュータから受信することができる。
(実施例15)ライゲーションによる組み合わせ技法
図23Aに示すように、ビーズ2301が生成され、(例えばアクリダイト部分を介して)部分P5配列2302に共有結合している。独立して、4つの96ウェルプレートの50μlの各ウェルにおいて、残りのP5配列及び固有の部分バーコード配列(オリゴヌクレオチド2303において塩基「DDDDDD」で示す)を含むオリゴヌクレオチド2303を、オリゴヌクレオチド2303に対する逆相補体及びオリゴヌクレオチド2303の各末端からオーバーハングする追加の塩基を含むオリゴヌクレオチド2304にハイブリダイズさせる。スプリント2306が生成される。各オーバーハングは3'C3スペーサー、3'逆位dT又はジデオキシ-C(ddC)によりブロックされており(図23において「X」で示す)、副生成物の形成が防止されている。
図23Bに示すように、スプリント2306をそれぞれ4つの96ディープウェルプレートに添加し、各ウェルは2mLのビーズ2301を含み、スプリントは固有の部分バーコード配列を含む。各ウェルにおいて、スプリント2306は、オリゴヌクレオチド2304の対応するオーバーハングを介してビーズ2301の部分P5配列2302とハイブリダイズする。ハイブリダイゼーション後、1時間の16℃でのリガーゼ、例えばT4リガーゼの作用により、部分P5配列2302をオリゴヌクレオチド2303(典型的には5'リン酸化されている)にライゲーションさせる。ライゲーション後、生成物をプールし、ビーズを洗浄して、ライゲーションされていないオリゴヌクレオチドを除去する。
図23Cに示すように、次いで、洗浄した生成物を4つの新たな96ウェルプレートのウェルに再び分け、プレートの各ウェルは、2mLのビーズ2301と、固有の部分バーコード配列(オリゴヌクレオチド2305において「DDDDDD」で示す)並びにオリゴヌクレオチド2304の残余のオーバーハングに相補的な、隣接する短配列(例えば、部分バーコード配列に隣接しオリゴヌクレオチド2305の末端にある「CC」)を有するオリゴヌクレオチド2305とを含む。オリゴヌクレオチド2305はランダムN mer(オリゴヌクレオチド2305において「NNNNNNNNNN」で示す)も含む。隣接する短配列を介して、オリゴヌクレオチド2304の残余のオーバーハングを介してオリゴヌクレオチド2305をオリゴヌクレオチド2304とハイブリダイズさせる。次いで、1時間の16℃でのリガーゼの作用により、オリゴヌクレオチド2305をオリゴヌクレオチド2303にライゲーションさせる。オリゴヌクレオチド2305のオリゴヌクレオチド2303へのライゲーションにより、結果として全長バーコード配列が生成される。図23Dに示すように、次いで生成物をプールし、オリゴヌクレオチド2304を生成物から変性させ、次いで非結合オリゴヌクレオチドを洗い流す。洗浄後、バーコードが付いたビーズの多様なライブラリーが得られ、オリゴヌクレオチドに結合した各ビーズは、P5配列、全長バーコード配列及びランダムN merを含む。生成されたライブラリーは、約147,000種の異なるバーコード配列を含む。
(実施例16)バーコードプライマーにおけるチミン含有ヌクレオチドのウラシル含有ヌクレオチドへの置換
図33Aに示すように、PHASE増幅に適した2つのバーコードプライマー3301及び3302を使用して、酵母ゲノムから得たサンプル核酸を増幅させた。PHASE増幅後、(例えば大量PCRにより)追加の配列を追加してシークエンサーレディ産物を生成した。バーコードプライマー3301(図33AにおいてU.2としても示す)が位置3306でチミン含有ヌクレオチド置換用の更なるウラシル含有ヌクレオチドを含む点を除いて、バーコードプライマー3301及び3302(図33AにおいてU.1とも示す)は同一の配列を含んだ。特定のブロッカーオリゴヌクレオチドに対応する各セットを様々な化学量論比で各バーコードプライマーと混合する、各バーコードプライマーに関する増幅実験のセットを実行した。バーコードプライマー3302の場合、標準的なブロッカーオリゴヌクレオチド3303、架橋核酸(BNA)を含む全長ブロッカーオリゴヌクレオチド3304(図33AにおいてBNAブロッカーとも示す)又は全長ブロッカーオリゴヌクレオチド3305に対応する増幅実験のセットを行った。ブロッカーオリゴヌクレオチド3303及び3305は、全てのチミン含有ヌクレオチド位置及びddCブロック末端で、チミン含有ヌクレオチド置換用のウラシル含有ヌクレオチドを含んだ。各セットにおいて、ブロッカーオリゴヌクレオチド:バーコードプライマーの化学量論比は、0、0.4、0.8又は1.2のいずれかであった。バーコードプライマー3301の場合、各種のブロッカーオリゴヌクレオチド3303、3304及び3305を0.8のブロッカーオリゴヌクレオチド:バーコードプライマーの化学量論比で試験した。
PHASE増幅産物のサイズ結果を図33Bに示す。示すように、ブロッカーオリゴヌクレオチド3303に結合しているバーコードプライマー3302(例えば、チミン含有ヌクレオチド置換用の余分なウラシル含有ヌクレオチドを含む)は概して、試験した化学量論比全てにわたり最小の増幅産物を生成した。ブロッカーオリゴヌクレオチド3304及び3305に対するバーコードプライマー3302に関する結果は様々であり、サイズはブロッカーオリゴヌクレオチド3303に関する結果よりも概して大きかった。バーコードプライマー3301の場合、増幅産物のサイズは、試験したブロッカーオリゴヌクレオチド全てにわたって、ブロッカーオリゴヌクレオチド3303に結合したバーコードプライマー3301の場合に得られた増幅産物のサイズよりも概して大きかった。シークエンサーレディ産物のサイズ結果を図33Cに示す。
増幅産物から得られる主要な配列決定基準を図33Dに示す。示すように、マッピングされないリードの割合(図33DにおけるパネルI)は、バーコードプライマー3302から生成された増幅産物に関する配列決定のランの場合に概してより低かった。例えば、0.8のブロッカーオリゴヌクレオチド:バーコードプライマーの化学量論比でバーコードプライマー3302及びブロッカーオリゴヌクレオチド3303から生成された増幅産物の場合のマッピングされないリードの割合は約7〜8%であったが、同じ条件でバーコードプライマー3301を使用して得た結果は約17〜18%であった。更に、Q40エラーの割合(図33DにおけるパネルII)もバーコードプライマー3302の場合により低かった。例えば、0.8のブロッカーオリゴヌクレオチド:バーコードプライマーの化学量論比でバーコードプライマー3302及びブロッカーオリゴヌクレオチド3303から生成された増幅産物の場合のQ40エラーの割合は約0.105%であったが、同じ条件でバーコードプライマー3301を使用して得た結果は約0.142%であった。配列決定中に測定したリード1開始部位相対エントロピー(パネルIII)及びリード2開始部位相対エントロピー(パネルIV)を図33Eに示す。
(実施例17)ジスルフィド交換によるゲルビーズの合成後官能化
ジスルフィド結合を含むゲルビーズを、本明細書に記載した1つ以上の方法に従って生成した。次いで、ゲルビーズを、ゲルビーズに対するTCEPの分子の比率(TCEP:GB)でTCEPと反応させた。試験した比率は0、25億及び100億であった。TCEPは還元剤として機能し、ゲルビーズ内に遊離チオールが生成される。還元後、ゲルビーズを1回洗浄してTCEPを除去した。次に、ゲルビーズの生成された遊離チオールをアクリダイト-S-S-P5種(例えば図35Aにおける3505)と反応させ、図35Aに示すようにMichael付加化学反応によりアクリダイト-S-S-P5をゲルビーズに結合させた。各種の活性化ゲルビーズに対して異なる比率(例えば、ゲルビーズ上に遊離チオールを生成するために使用したTCEP:GBの比率)のアクリダイト-S-S-P5を試験した。活性化ゲルビーズに対するアクリダイト-S-S-P5種の試験した比率(P5:GB)は、5千万、5億及び50億であった。
合成後、各反応由来のゲルビーズを洗浄し、反応混合物中においてDTTで処理してゲルビーズを分解し、あらゆる結合アクリダイト-S-S-P5種を放出させた。図36(例えば図36におけるレーン3〜11)に示すように、一定分量の各反応混合物をゲルのレーンに入れ、遊離オリゴヌクレオチドをゲル電気泳動にかけた。50ピコモルのアクリダイト-S-S-P5スタンダード(例えば図36におけるレーン1)、及び25塩基対ラダー(例えば図36におけるレーン2)も泳動した。ロードしたアクリダイト-S-S-P5に相当するバンドがレーン5及びレーン8で生じた(図36において矢印で示す)。レーン5は、25億のTCEB:GB比で処理したゲルビーズ及び50億のP5:GB比でアクリダイト-S-S-P5と反応させたTCEP処理ゲルビーズに相当する。レーン8は、100億のTCEP:GB比で処理したゲルビーズ及び50億のP5:GB比でアクリダイト-S-S-P5と反応させたTECP処理ゲルビーズに相当する。
(実施例18)ジスルフィド交換によるゲルビーズの合成後官能化
ジスルフィド結合を含むゲルビーズを、本明細書に記載した1つ以上の方法に従って生成した。次いで、4μgのTCEP/100,000個のゲルビーズの濃度で、0.1Mのリン酸塩バッファー中においてゲルビーズをTCEPと反応させた。TCEPは還元剤として機能し、遊離チオール基を有するゲルビーズを生成することができる。還元後、ゲルビーズを1回洗浄してゲルビーズをTCEPから分離した。次に、図35Bに示すように、ゲルビーズの遊離チオールを2,2'-ジチオピリジンの飽和溶液(〜0.2mM)中の2,2'-ジチオピリジン(例えば図35Bにおける3507)と反応させ、ジスルフィド交換化学反応によりピリジン基をゲルビーズに結合させた。合成後、ゲルビーズを3回洗浄して過剰な2,2'-ジチオピリジンを除去した。
次いで、洗浄したゲルビーズを、一方の末端で全長コンストラクトバーコード(FCBC-例えば、P5、バーコード配列、R1及びランダムN merを含むオリゴヌクレオチド)配列を含み、他方の末端で遊離チオール基を含むオリゴヌクレオチド3702と反応させた。ゲルビーズに対するFCBCの分子の2つの異なる比率(例えばFCBC:GB)で2種の反応を完成させ、反応を一晩進行させた。試験したFCBC:GBの比率は4億及び16億であった。図37A中の3701として示すように、オリゴヌクレオチド3702は、最初はオリゴヌクレオチド3702の遊離チオール基がジスルフィド結合中に保護されている状態で供給された。オリゴヌクレオチド3702中にあるような遊離チオールを生成するために、オリゴヌクレオチド3701を30分間1X Tris-EDTA(TE)バッファー中において0.1MのDTTで処理した。Sephadex(NAP-5)カラム上での塩交換を使用し、還元後にDTTを除去してオリゴヌクレオチド3702を精製した。各反応に関して、次いで、チオール-ジスルフィド交換(例えば図35Bを参照されたい)により、精製したオリゴヌクレオチド3702をゲルビーズのジチオ-ピリジン種と反応させ、オリゴヌクレオチド3702を含むゲルビーズを生成した。反応後、ゲルビーズを3回洗浄することによりゲルビーズを精製した。
比較目的のために、本明細書の別の箇所に記載したモノマーの重合により、ジスルフィド結合及びFCBC配列を含むゲルビーズも生成した。FCBCを、アクリルアミド及びビス(アクリロイル)シスタミンとの重合に関与してゲルビーズを生成することができるアクリダイト種を含むモノマーに結合させた。アクリダイト部分を介してFCBC配列をゲルビーズに結合させた。
合成後、各反応からのゲルビーズを洗浄し、反応混合物中においてDTTで処理してゲルビーズを分解し、あらゆる結合オリゴヌクレオチド3702を放出させた。重合により合成したFCBC配列を含むゲルビーズも反応混合物中においてDTTで処理した。図37Bに示すように、一定分量の各反応混合物をゲルのレーンに入れ、遊離オリゴヌクレオチドをゲル電気泳動にかけた。図37Bに示すゲル写真に示すように、レーン1は50塩基対ラダーに相当し、レーン2は、4億のFCBC:GB比でのジスルフィド交換化学反応により官能化したゲルビーズに相当し、レーン3は、16億のFCBC:GB比でのジスルフィド交換化学反応により官能化したゲルビーズに相当し、レーン4は、アクリダイト種の重合により生成した官能化ゲルビーズに相当する。ローディングされたオリゴヌクレオチドに相当するバンドは、両方のFCBC:GB比で生成された官能化ゲルビーズに関して生じており、アクリダイト種の重合により生成された官能化ゲルビーズに関して生じたバンドと同様の位置であった。
合成後、各反応からのゲルビーズも洗浄し、SYBR Gold蛍光染色で染色した。重合により合成したFCBC配列を含むゲルビーズもSYBR Goldで染色した。SYBR Goldは、あらゆる結合オリゴヌクレオチドをインターカレートすることにより、官能化ビーズを染色することができる。染色後、ビーズをプールし、図37Cに示す顕微鏡写真で示すように、蛍光顕微鏡を使用して撮像した。図37Cにおけるより明るいビーズ(3704)は、ビーズの重合中に官能化されたビーズに相当し、薄暗いビーズ(それでもSYBR goldシグナルを示す)(3705)は、ゲルビーズ生成後のジスルフィド交換化学反応により官能化されたビーズに相当する。ジスルフィド交換によるオリゴヌクレオチドのローディングは、ゲルビーズ重合中におけるビーズの官能化により達成されたローディングの約30%であった。
上述から、特定の実施が図示されている及び説明されているが、様々な改変をこの特定の実施に行うことができ、本明細書において考慮されることを理解しなければならない。また、本発明が本明細書内に記載した具体例により限定されることも意図されていない。本発明が上述した明細書を参照して説明されているが、本明細書における好ましい実施形態の説明及び図示が限定的な意味で解釈されることは意図されていない。更に、本発明の全ての態様は、様々な条件及び変数に依存する、本明細書に記載した具体的な描写、構成又は相対的な割合に限定されないことを理解しなければならない。本発明の実施形態の形態及び詳細における様々な改変は当業者に明らかであるだろう。従って、本発明は任意のそのような改変、変更及び等価も包含するものとすると考慮される。下記の特許請求の範囲は本発明の範囲を定義し、これにより、この特許請求の範囲内の方法及び構造並びにこれらの等価物が包含されることが意図される。