詳細な説明
定義
請求項及び明細書で使用される用語は、特に明記しない限り、以下に記載するように定義する。
用語「対象」または「患者」は、同じ意味で用いられ、生体、ヒトまたは非ヒト、哺乳類または非哺乳類、雄または雌を包含する。
用語「試料」または「試験試料」は、静脈穿刺、排泄、射精、マッサージ、生検、針穿刺吸引、洗浄試料、擦過、外科的切開、または、当該技術分野において公知の他の介入もしくは他の手段を含む手段により対象から採取された、シングルセルもしくは複数細胞、または細胞の断片、または、血液試料などの体液のアリコートを含むことができる。
用語「検体」とは、細胞の構成成分を指す。細胞検体は、細胞の状態、挙動、または軌道を理解するのに有益である。したがって、本明細書に記載するシステム及び方法を用いて、細胞の1つ以上の検体のシングルセル分析を行うことは、細胞の状態または挙動を測定するのに有益である。検体の例としては、核酸(例えばRNA、DNA、cDNA)、タンパク質、ペプチド、抗体、抗体断片、多糖類、糖、脂質、小分子、またはこれらの組み合わせが挙げられる。特定の実施形態では、シングルセル分析は、RNA及びDNAなどの、2つの異なる検体を分析することを伴う。特定の実施形態では、シングルセル分析は、RNA、DNA、及びタンパク質などの、細胞の3つ以上の異なる検体を分析することを伴う。
いくつかの実施形態では、本明細書に記載する個別の要素はドロップレットである。用語「エマルション」、「滴」、「ドロップレット」、及び「マイクロドロップレット」は、本明細書では同じ意味で用いられ、第1の流体相と不混和性である第2の流体相(例えば、油)により結合した、少なくとも第1の流体相、例えば水相(例えば水)を含有する、小型で、一般的には球状の構造体を意味する。いくつかの実施形態では、本開示に従ったドロップレットは、例えば、第2の不混和性流体相、例えば水相流体(例えば水)により結合した、第1の流体相、例えば油を含有することができる。いくつかの実施形態では、第2の流体相は、不混和性相キャリア流体である。故に、本開示に従ったドロップレットは、油中水型エマルション、または水中油型エマルションとして提供されてよい。ドロップレットは、個別の要素に対して、本明細書に記載するようにサイジングされる、及び/または形状化されることができる。例えば、本開示に従ったドロップレットは一般に、直径が1μm~1000μm(両端を含む)の範囲である。本開示に従ったドロップレットを使用して、細胞、核酸(例えばDNA)、酵素、試薬、反応混合物、及び様々な他の構成成分を封入することができる。用語「エマルション」は、マイクロ流体デバイス内で、またはこれにより作製され、かつ/または、マイクロ流体デバイスにより流されるか、もしくはアプライされるエマルションを指すために使用することができる。
用語「細胞軌道」、または「細胞の軌道」とは、細胞が、第1の状態から第2の状態に変化することを意味する。「細胞軌道」は、RNA-seqとDNA-seqを組み合わせたシングルセル分析(例えば、クロマチンがアクセス可能なDNAの配列決定)により測定される。RNA-seqにより入手した配列決定リードは、細胞の過去の状態の速写を提供する一方で、DNA-seqにより入手した配列決定リードは、細胞の将来の状態の速写を提供する。細胞軌道の例としては、細胞系統、細胞運命、細胞の将来の状態における細胞機能、不健康な細胞の将来の状態、外部刺激(例えば治療)に対する将来の細胞応答のいずれかが挙げられる。
「相補性」とは、核酸が、従来のワトソン・クリック形式または従来型とは異なる他の形式のいずれかによって、別の核酸配列と水素結合(複数可)を形成する能力、すなわち、別の核酸配列とハイブリダイズする能力を指す。本明細書で使用する場合、「ハイブリダイゼーション」とは、分子が、特定のヌクレオチド配列のみと、低ストリンジェント、中ストリンジェントまたは高ストリンジェントな条件で結合、二本鎖形成またはハイブリダイズすることを指す(その配列が、複合混合物(例えば全細胞)のDNAまたはRNAに存在する場合を含む)。例えば、Ausubel,et al.,Current Protocols In Molecular Biology,John Wiley & Sons,New York,N.Y.,1993を参照されたい。ポリヌクレオチドのある特定の位置におけるヌクレオチドが、アンチパラレルなDNA鎖またはRNA鎖の同じ位置におけるヌクレオチドとワトソン・クリック対を形成できる場合には、そのポリヌクレオチドと、そのDNA分子またはRNA分子は、その位置において、互いに相補的である。そのポリヌクレオチドと、そのDNA分子またはRNA分子は、所望のプロセスに影響が及ぶように、各分子における対応する位置が十分な数、互いにハイブリダイズまたはアニールすることができるヌクレオチドで占められている場合には、互いに「実質的に相補的」である。相補的な配列は、ストリンジェントな条件下でアニールして、相補鎖合成起点として機能する3’末端をもたらすことのできる配列である。
「同一性」とは、当該技術分野において知られているように、2つ以上のポリペプチド配列または2つ以上のポリヌクレオチド配列間の関係であって、それらの配列を比較することによって求めたものである。当該技術分野においては、「同一性」とは、ポリペプチド配列またはポリヌクレオチド配列間の関連度であって、それらの配列からなる鎖間の一致率を求めたものも意味する。「同一性」及び「類似性」は、既知の方法によって容易に算出でき、その方法としては、Computational Molecular Biology,Lesk,A.M.,ed.,Oxford University Press,New York,1988、Biocomputing:Informatics and Genome Projects,Smith,D.W.,ed.,Academic Press,New York,1993、Computer Analysis of Sequence Data,Part I,Griffin,A.M.,and Griffin,H.G.,eds.,Humana Press,New Jersey,1994、Sequence Analysis in Molecular Biology,von Heinje,G.,Academic Press,1987、Sequence Analysis Primer,Gribskov,M.and Devereux,J.,eds.,M Stockton Press,New York,1991及びCarillo,H.,and Lipman,D.,Siam J.Applied Math.,48:1073(1988)に記載されているものが挙げられるが、これらに限らない。加えて、同一性パーセントの値は、Vector NTI Suite 8.0(Informax、Frederick,Md.)のAlignXというコンポーネントのデフォルト設定を用いて生成したアミノ酸配列アラインメント及びヌクレオチド配列アラインメントから得ることができる。同一性を求める好ましい方法は、試験する配列間の一致率が最も大きくなるように設計する。同一性及び類似性を求める方法は、公的に入手可能なコンピュータプログラムに体系化されている。2つの配列間の同一性及び類似性を求めるための好ましいコンピュータプログラムの方法としては、GCGプログラムパッケージ(Devereux,J.,et al.,Nucleic Acids Research 12(1):387(1984))、BLASTP、BLASTN及びFASTA(Atschul,S.F.et al.,J.Molec.Biol.215:403-410(1990))が挙げられるが、これらに限らない。BLAST Xというプログラムは、NCBI及びその他の供給源から公的に入手可能である(BLAST Manual,Altschul,S.,et al.,NCBINLM NIH Bethesda,Md.20894、Altschul,S.,et al.,J.Mol.Biol.215:403-410(1990))。周知であるSmith Watermanアルゴリズムを用いて、同一性を求めてもよい。
「増幅する」、「増幅すること」、「増幅反応」という用語、及びそれらの類似表現は概して、核酸分子の少なくとも一部(鋳型核酸分子という)を複製またはコピーして、追加の核酸分子を少なくとも1つもたらすいずれかの作用またはプロセスを指す。その追加の核酸分子は任意に、その鋳型核酸分子の少なくとも相当な部分と実質的に同一であるかまたは実質的に相補的である配列を含む。その鋳型核酸分子は、一本鎖であることも、二本鎖であることもでき、その追加の核酸分子は独立して、一本鎖であることも、二本鎖であることもできる。いくつかの実施形態では、増幅には、核酸分子の少なくとも相当な部分を少なくとも1コピー作製するか、または核酸分子の少なくとも相当な部分と相補的である核酸配列を少なくとも1コピー作製するための、酵素を触媒とする鋳型依存性のin vitro反応が含まれる。増幅には任意に、核酸分子の線形的または指数関数的な複製が含まれる。いくつかの実施形態では、このような増幅は、等温条件を用いて行い、別の実施形態では、このような増幅には、熱サイクリングを含めることができる。いくつかの実施形態では、増幅は、1回の増幅反応で複数の標的配列を同時に増幅することを含むマルチプレックス増幅である。その標的配列の少なくともいくつかは、1回の増幅反応に含まれる同じ核酸分子または異なる標的核酸分子に位置することができる。いくつかの実施形態では、「増幅」には、DNAベース及びRNAベースの核酸の少なくとも相当部分を単独で、または組み合わせて増幅することが含まれる。その増幅反応は、一本鎖または二本鎖の核酸基質を含むことができ、さらに、当業者に知られている増幅プロセスのいずれかを含むことができる。いくつかの実施形態では、その増幅反応は、ポリメラーゼ連鎖反応(PCR)を含むことができる。いくつかの実施形態では、増幅反応としては、LAMPなどの等温増幅反応が挙げられる。本発明では、核酸の「合成」及び「増幅」という用語を使用する。本発明では、核酸の合成とは、合成起点として機能するオリゴヌクレオチドから、核酸を延長または伸長させることを意味する。この合成のみならず、他の核酸の形成と、この形成された核酸の延長反応または伸長反応も連続的に行う場合、これらの一連の反応は、包括して増幅という。採用した増幅技術によって作製されたポリ核酸は一般に、「アンプリコン」または「増幅産物」という。
PCRベースのアッセイ、例えば定量PCR(qPCR)、または等温増幅のようないずれかの核酸増幅法を用いて、別個の物体、またはその構成成分の1つ以上、例えば、その物体に封入された細胞に存在するある特定の核酸、例えば、対象とする遺伝子の存在を検出してよい。このようなアッセイは、マイクロフルイディクスデバイスもしくはその一部、またはいずれかの他の好適な位置にある別個の物体に適用できる。このような増幅またはPCRベースのアッセイの条件は、経時的に核酸の増幅を検出することを含んでよく、1つ以上の方法が異なっていてよい。
本明細書に示されているある特定の実施形態で用いられる増幅反応では、多くの核酸ポリメラーゼを使用することができ、そのポリメラーゼには、ヌクレオチド(そのアナログを含む)が重合して核酸鎖となるのを触媒できるいずれの酵素も含まれる。ヌクレオチドのこのような重合は、鋳型依存的に行うことができる。このようなポリメラーゼとしては、天然のポリメラーゼ、そのサブユニット及びトランケート体のいずれか、変異ポリメラーゼ、バリアントポリメラーゼ、組み換えポリメラーゼ、融合ポリメラーゼ、または別段に操作したポリメラーゼ、化学的に改変したポリメラーゼ、合成の分子またはアセンブリ、ならびに上記のような重合を触媒する能力を保持するこれらのアナログ、誘導体または断片のいずれかを挙げることができるが、これらに限らない。任意に、そのポリメラーゼは、1つ以上のアミノ酸が他のアミノ酸に置換されているか、そのポリメラーゼから1つ以上のアミノ酸が挿入もしくは欠失されているか、または2つ以上のポリメラーゼの一部分が連結されていることを伴う変異を1つ以上含む変異ポリメラーゼであることができる。典型的には、そのポリメラーゼは、ヌクレオチドの結合及び/またはヌクレオチドの重合の触媒を行うことができる活性部位を1つ以上含む。いくつかの例示的なポリメラーゼとしては、DNAポリメラーゼ及びRNAポリメラーゼが挙げられるが、これらに限らない。本明細書で使用する場合、「ポリメラーゼ」という用語及びその類似表現には、連結し合った少なくとも2つの部分を含む融合タンパク質も含まれ、その第1の部分は、ヌクレオチドが重合して核酸鎖となるのを触媒できるペプチドを含むとともに、第2のポリペプチドを含む第2の部分に連結されている。いくつかの実施形態では、その第2のポリペプチドは、レポーター酵素またはプロセッシビティ向上ドメインを含むことができる。任意に、そのポリメラーゼは、5’エキソヌクレアーゼ活性またはターミナルトランスフェラーゼ活性を有することができる。いくつかの実施形態では、そのポリメラーゼは任意に、例えば、熱を利用するか、化学物質によるか、または新たな量のポリメラーゼを反応混合物に再度加えることによって再活性化させることができる。いくつかの実施形態では、そのポリメラーゼとしては、任意に再活性化させることができるホットスタートポリメラーゼまたはアプタマーベースのポリメラーゼを挙げることができる。
「標的プライマー」または「標的特異的プライマー」という用語、及びそれらの類似表現は、結合部位の配列と相補的であるプライマーを指す。標的プライマーは概して、標的核酸配列と少なくとも部分的に相補的である配列を少なくとも1つ含む一本鎖または二本鎖のポリヌクレオチド、典型的にはオリゴヌクレオチドである。
「フォワードプライマー結合部位」及び「リバースプライマー結合部位」とは、鋳型DNA及び/またはアンプリコンの領域のうち、フォワードプライマー及びリバースプライマーが結合する領域を指す。これらのプライマーは、元の鋳型ポリヌクレオチドの領域のうち、増幅の際に指数関数的に増幅される領域を定める働きをする。いくつかの実施形態では、追加のプライマーが、フォワードプライマー及び/またはリバースプライマーの5’側の領域に結合してよい。このような追加のプライマーを用いる場合、フォワードプライマー結合部位及び/またはリバースプライマー結合部位は、これらの追加のプライマーの結合領域と、そのプライマー自体の結合領域を含んでよい。例えば、いくつかの実施形態では、本発明の方法では、フォワードプライマー結合領域及び/またはリバースプライマー結合領域の5’側に位置する領域に結合する追加のプライマーを1つ以上使用してよい。このような方法は例えば、「置換プライマー」または「アウタープライマー」の使用について開示しているWO0028082に開示されている。
「バーコード」核酸識別配列は、核酸に組み込むか、またはプライマーに連結して、独立したシーケンシング及び識別が、同一の試料に存在する分子に由来する情報及び識別に関係するバーコードを介して互いに関連することを可能にすることができる。個別の構成要素の中で核酸にバーコードを取り付けるために使用可能な、多数の技術が存在する。例えば、標的核酸をまず増幅して、より短い片に断片化してもよいし、しなくてもよい。分子を個別の構成要素、例えば、バーコードを含有するドロップレットと組み合わせることができる。バーコードを次に、例えば、オーバーラップ伸長によるスプライシングを使用して、分子に取り付けることができる。本アプローチにおいて、最初の標的分子は「アダプター」配列が追加されていることができ、これは、プライマーが合成可能な既知の配列の分子である。バーコードと組み合わせたときに、アダプター配列及びバーコード配列に相補的なプライマーを使用することができ、標的核酸とバーコードの両方の生成物であるアンプリコンが互いにアニールし、かつ、DNA重合などの伸長反応により、互いに伸長することができ、バーコード配列に取り付けられた標的核酸を含む二本鎖生成物を生成する。あるいは、当該標的を増幅するプライマーは、それ自身がバーコード化されることができるため、標的へのアニーリング及び伸長の際に、生成されたアンプリコンは、アンプリコンに組み込まれたバーコード配列を有する。これは、PCRによる特異的増幅、または、例えばMDAによる非特異的増幅を含む多数の増幅法により応用することができる。バーコードを核酸に取り付けるために使用可能な代替の酵素反応、平滑末端または付着末端ライゲーションを含むライゲーションである。本アプローチにおいて、DNAバーコードは、核酸標的及びリガーゼ酵素でインキュベートされ、バーコードの、標的へのライゲーションがもたらされる。核酸の末端は、分子末端に取り付けられるバーコードの数よりも大きな制御が可能なリガーゼまたは断片と共に導入されるアダプターを使用することを含む多数の技術により、必要に応じてライゲーションのために修飾することができる。
本明細書で使用する場合、「同一性」及び「同一な」という用語、ならびにそれらの類似表現は、2つ以上の配列に関して使用する時には、その2つ以上の配列(例えば、ヌクレオチド配列またはポリペプチド配列)が同じである程度を指す。2つ以上の配列に関しては、配列またはその部分配列の同一性パーセントまたは相同性パーセントは、配列の所与の一または領域において同じであるすべてのモノマー単位(例えば、ヌクレオチドまたはアミノ酸)のパーセンテージを示す(すなわち、約70%の同一性、好ましくは、75%、80%、85%、90%、95%、97%、98%または99%の同一性)。その同一性パーセントは、BLASTまたはBLAST2.0という配列比較アルゴリズムを下記のデフォルトパラメーターで用いるか、またはマニュアルアラインメント及び目視確認によって測定した場合において、比較ウィンドウまたは指定領域にわたって最大限一致するように比較及びアラインメントを行った時の所定の領域に対するものであることができる。配列は、アミノ酸レベルまたはヌクレオチドレベルの同一性が少なくとも85%である時に、「実質的に同一」であるとする。好ましくは、その同一性は、少なくとも約25残基長、約50残基長もしくは約100残基長である領域、または少なくとも1つの比較配列の全長に対して存在する。配列同一性パーセント及び配列類似性パーセントを求めるための典型的なアルゴリズムは、BLAST及びBLAST2.0のアルゴリズムであり、これらは、Altschul et al,Nuc.Acids Res.25:3389-3402(1977)に記載されている。他の方法としては、Smith & Waterman,Adv.Appl.Math.2:482(1981)及びNeedleman & Wunsch,J.Mol.Biol.48:443(1970)などのアルゴリズムが挙げられる。2つの核酸配列が実質的に同一であることの別の指標は、その2つの分子またはそれらの相補体が、ストリンジェントなハイブリダイゼーション条件下で、互いにハイブリダイズすることである。
「核酸」、「ポリヌクレオチド」及び「オリゴヌクレオチド」という用語は、ヌクレオチドのバイオポリマーを指し、文脈上別段に示されている場合を除き、改変ヌクレオチド及び非改変ヌクレオチド、DNA及びRNAの両方、ならびに改変核酸主鎖を含む。例えば、ある特定の実施形態では、その核酸は、ペプチド核酸(PNA)またはロックト核酸(LNA)である。典型的には、本明細書に記載されているような方法は、DNAを増幅用の核酸鋳型として用いて行う。しかしながら、ヌクレオチドが、天然のDNAまたはRNAに由来する人工の誘導体または改変核酸に置き換えられている核酸も、相補鎖合成用の鋳型として機能する限りは、本発明の核酸に含めてよい。本発明の核酸は概して、生体試料に含まれている。その生体試料には、動物、植物または微生物の組織、細胞、培養液、及び排泄物または抽出物が含まれる。ある特定の態様では、その生体試料には、ウイルスまたはマイコプラズマのような細胞内寄生体のゲノムDNAまたはRNAが含まれる。本発明の核酸は、上記生体試料に含まれる核酸に由来してよい。例えば、好ましくは、記載されている方法では、ゲノムDNA、mRNAから合成したcDNA、または生体試料に由来する核酸に基づいて増幅した核酸を使用する。別段に示されていない限り、オリゴヌクレオチド配列が示されている場合、そのヌクレオチドは、左から右に向かって、5’から3’の順であり、「A」はデオキシアデノシンを示し、「C」はデオキシシチジンを示し、「G」はデオキシグアノシンを示し、「T」はデオキシチミジンを示し、「U」はウリジンを示すと理解されたい。オリゴヌクレオチドは、「5’末端」及び「3’末端」を有するという。典型的には、モノヌクレオチドが反応して、ある1つのヌクレオチドの5’リン酸基または同等の基が、任意にホスホジエステル結合またはその他の好適な結合を介して、その隣接ヌクレオチドの3’ヒドロキシル基または同等の基に結合することによって、オリゴヌクレオチドを形成するからである。
鋳型核酸は、核酸増幅法において相補鎖を合成する際の鋳型として機能する核酸である。その鋳型と相補的なヌクレオチド配列を有する相補鎖は、その鋳型に対応する鎖としての意味を持つが、これらの2つの関係は、相対的なものに過ぎない。すなわち、本明細書に記載されている方法によれば、相補鎖として合成された鎖は、再び鋳型として機能できる。換言すると、相補鎖は、鋳型となることができる。ある特定の実施形態では、鋳型は、生体試料、例えば、植物、動物、ウイルス、微生物、細菌、真菌などに由来する。ある特定の実施形態では、その動物は、哺乳動物、例えばヒト患者である。鋳型核酸は典型的には、標的核酸を1つ以上含む。例示的な実施形態における標的核酸は、試料中に存在する疑いがあるか、または試料中に存在すると予測されるいずれの核酸配列も含め、本開示に従って増幅または合成できる一本鎖または二本鎖のいずれの核酸配列も含んでよい。
本発明における実施形態で用いるプライマー及びオリゴヌクレオチドは、ヌクレオチドを含む。ヌクレオチドは、ポリメラーゼに選択的に結合できるか、またはポリメラーゼによって重合化できるいずれの化合物も含み、いずれの天然ヌクレオチドまたはそのアナログも含まれるが、これらに限らない。必然ではないが、典型的には、ヌクレオチドがポリメラーゼに選択的に結合した後には、そのヌクレオチドは、ポリメラーゼによって重合化して核酸鎖となるが、時折、ヌクレオチドが、核酸鎖に組み込まれずに、ポリメラーゼから解離することがあり、この事象は、本明細書では、「非生成」事象という。このようなヌクレオチドには、その構造にかかわらず、ポリメラーゼに選択的に結合できるか、またはポリメラーゼによって重合化できる天然のヌクレオチドのみならず、いずれのアナログも含まれる。天然のヌクレオチドは典型的には、塩基部分、糖部分及びリン酸部分を含むが、本開示のヌクレオチドは、このような部分のいずれか1つ、一部またはすべてが欠損している化合物を含むことができる。例えば、そのヌクレオチドは任意に、リン原子を3個、4個、5個、6個、7個、8個、9個、10個またはそれを上回る数含むリン原子鎖を含むことができる。いくつかの実施形態では、そのリン鎖は、糖環のいずれかの炭素(5’炭素など)に結合できる。そのリン鎖は、介在するOまたはSとともに、糖に連結できる。一実施形態では、その鎖のリン原子の1つ以上は、P及びOを有するリン酸基の一部であることができる。別の実施形態では、その鎖のリン原子は、介在するO、NH、S、メチレン、置換メチレン、エチレン、置換エチレン、CNH2、C(O)、C(CH2)、CH2CH2またはC(OH)CH2R(式中、Rは、4-ピリジンまたは1-イミダゾールであることができる)とともに連結できる。一実施形態では、その鎖のリン原子は、O、BH3またはSを有する側鎖基を有することができる。そのリン鎖では、O以外の側鎖基を持つリン原子は、置換リン酸基であることができる。そのリン鎖では、O以外の介在する原子を持つリン原子は、置換リン酸基であることができる。ヌクレオチドアナログの例のいくつかは、Xuによる米国特許第7,405,281号に記載されている。
いくつかの実施形態では、ヌクレオチドは標識を含み、そのヌクレオチドは、本明細書では、「標識ヌクレオチド」といい、標識ヌクレオチドの標識は、本明細書では、「ヌクレオチド標識」という。いくつかの実施形態では、その標識は、末端リン酸基、すなわち、糖から最も遠いリン酸基に結合した蛍光部分(例えば色素)、発光部分などの形態であることができる。本開示の方法及び組成物で使用できるヌクレオチドの例のいくつかとしては、リボヌクレオチド、デオキシリボヌクレオチド、改変リボヌクレオチド、改変デオキシリボヌクレオチド、リボヌクレオチドポリホスフェート、デオキシリボヌクレオチドポリホスフェート、改変リボヌクレオチドポリホスフェート、改変デオキシリボヌクレオチドポリホスフェート、ペプチドヌクレオチド、改変ペプチドヌクレオチド、メタロヌクレオシド、ホスホネートヌクレオシド、及び改変リン酸-糖という主鎖のヌクレオチド、上記化合物のアナログ、誘導体またはバリアントなどが挙げられるが、これらに限らない。いくつかの実施形態では、そのヌクレオチドは、そのヌクレオチドのαリン酸と糖、そのヌクレオチドのαリン酸とβリン酸、そのヌクレオチドのβリン酸とγリン酸、そのヌクレオチドのいずれかの他の2つのリン酸、またはこれらをいずれかに組み合わせたものを架橋する酸素部分の代わりに、例えばチオ部分またはボラノ部分のような非酸素部分を含むことができる。「ヌクレオチド5’-三リン酸」とは、5’位に三リン酸エステル基を有するヌクレオチドを指し、「NTP」、または特にリボース糖の構造的特徴を示す目的で、「dNTP」及び「ddNTP」と称する場合がある。三リン酸エステル基は、様々な酸素に対する硫黄置換基を含むことができる(例えばα-チオ-ヌクレオチド5’-三リン酸)。核酸化学の論評については、Shabarova,Z.and Bogdanov,A.Advanced Organic Chemistry of Nucleic Acids,VCH,New York,1994を参照されたい。
概要
RNA-seq及びDNA-seq(例えば、クロマチンがアクセス可能なDNAのDNA-seq)の組み合わせを使用してシングルセル分析を行い、シングルセルの軌道を予測する実施形態を、本明細書で記載する。細胞軌道の例としては、細胞系統、細胞運命、細胞の将来の状態における細胞機能、不健康な細胞の将来の状態、外部刺激(例えば治療)に対する将来の細胞応答のいずれかが挙げられる。一般に、シングルセル分析は、シングルセルを処理し、配列決定(例えばRNA-seq、DNA-seq、または、RNA-seq及びDNA-seqの両方)を行って、シングルセルの検体の配列決定リードを入手するためのワークフローを伴う。シングルセル分析は、配列決定リードを分析し、シングルセルの軌道を測定するコンピュータ工程をさらに含む。
様々な実施形態では、シングルセルを処理するワークフローにより、シングルセル内のRNA転写産物に由来する核酸の配列決定、加えて、ヌクレオソーム及びクロマチン(例えば、クロマチンがアクセス可能なDNA)と共にパッケージ化された場合においてもアクセス可能なDNAに由来する、核酸の配列決定が可能となる。様々な実施形態では、細胞を、(RNA転写産物上で逆転写を行うための)逆転写酵素を含むが、プロテアーゼまたはトランスポザーゼの使用を最小限に抑えるか、または避ける試薬に曝露する。したがって、パッケージ化DNAはインタクトなままである。RNA-seqを行って、RNA転写産物に由来する核酸分子の配列決定リードを入手することができ、DNA-seqを行って、クロマチンがアクセス可能なDNAに由来する核酸分子の配列決定リードを入手することができる。RNA-seq及びDNA-seqから入手した配列決定リードを分析し、個々の細胞の軌道を測定する。
ここで、配列決定のために単一細胞を処理し、増幅した核酸分子を生成する実施形態を示す、図1を参照する。具体的には、図1は、標的核酸分子の細胞封入160、検体放出165、細胞バーコード化、及び標的増幅175の工程を含むワークフロープロセスを示す。
一般に、細胞封入工程160は、シングルセル110を試薬120と共に、エマルションに封入することを伴う。様々な実施形態では、エマルションは、細胞110及び試薬120を含有する水性流体を、キャリア流体(例えば、油115)に分画することにより、油中水性流体型エマルションを得ることにより形成される。エマルションは、封入細胞125、及び試薬120を含む。封入細胞は、工程165において、検体放出を受ける。一般に、試薬は細胞の溶解を引き起こすことにより、エマルション内で細胞溶解物130を生成する。特定の実施形態では、試薬120は、少なくとも逆転写酵素を含む。様々な実施形態において、試薬120は、減少した量のプロテアーゼまたはトランスポザーゼを含むか、またはプロテアーゼまたはトランスポザーゼを含まない。例えば、試薬120は少量のプロテイナーゼKを含むか、または、プロテイナーゼK(もしくはその変異バリアント)を含まず、少量のトランスポザーゼTn5をさらに含むか、または、トランスポザーゼTn5(もしくはその変異バリアント)を含まない。細胞溶解物130は、1つ以上の異なる種類の検体(例えば、RNA転写産物、DNA、タンパク質、脂質、または炭化水素)を含むことができる、細胞の内容物を含む。様々な実施形態では、細胞溶解物130の異なる検体は、エマルション内で試薬120と相互作用することができる。例えば、試薬120中の逆転写酵素は、cDNA分子を、細胞溶解物130中に存在するRNA転写産物から逆転写することができる。
細胞バーコード化工程170は、細胞溶解物130を第2のエマルションに、バーコード145及び/または反応混合物140と共に封入することを伴う。様々な実施形態では、第2のエマルションは、細胞溶解物130を含有する水性流体を、不混和性油135に分画することにより形成される。図1に示すように、反応混合物140及びバーコード145を、水性流体の個別の流れを通して導入することにより、反応混合物140及びバーコードを、細胞溶解物130と共に、第2のエマルションに分画することができる。
一般に、バーコード145は、分析される標的核酸(例えば、細胞溶解物の検体)を標識することが可能であり、これにより、標的核酸に由来するシーケンスリードの起源の、その後の同定が可能となる。様々な実施形態では、複数のバーコード145は、細胞溶解物の複数の標的核酸を標識することにより、大量のシーケンスリードの起源の、その後の同定を可能にすることができる。一般に、反応混合物140は、核酸増幅反応などの反応の実施を可能にする。
標的増幅工程175は、標的核酸を増幅することを伴う。例えば、細胞溶解物の標的核酸は、第2のエマルション中で反応混合物140を用いる増幅を受けることにより、標的核酸に由来するアンプリコンを生成する。図1Bは、細胞バーコード化170、及び標的増幅175を2つの個別の工程で示すものの、様々な実施形態では、標的核酸は、核酸増幅工程を通して、バーコード145で標識される。
本明細書で参照するように、図1に示すワークフロープロセスは、細胞からの検体放出165が、細胞バーコード化170及び標的増幅175の工程とは別に生じる、2段階ワークフロープロセスである。例えば、細胞からの検体放出165は、第1のエマルション内で生じ、続いて、細胞バーコード化170及び標的増幅175が第2のエマルション内で生じる。様々な実施形態では、代替のワークフロープロセス(例えば、図1に示す2段階ワークフロープロセス以外のワークフロープロセス)を用いることができる。例えば、細胞110、試薬120、反応混合物140、及びバーコード145を、エマルションに封入することができる。したがって、検体放出165はエマルション内で生じることができ、続いて、細胞バーコード化170及び標的増幅175が同じエマルションで生じることができる。
図2は、シングルセルの検体に由来する配列決定リードを用いてシングルセルの細胞軌道を測定するためのフロープロセスである。具体的には、図2は、工程205において、増幅核酸をプールする工程、工程210において、増幅核酸を配列決定する工程、工程215においてアラインメントを読み取る工程、及び、アラインしたシーケンスリードを用いて、細胞に関する細胞軌道を測定する工程と、を示す。一般に、図2に示す流れ作業は、図1に示すワークフロープロセスの続きである。
例えば、図1の工程175における標的増幅の後で、増幅核酸250A、250B、及び250Cを、図2に示す工程205でプールする。例えば、増幅核酸のエマルションをプールして収集し、エマルションの不混和性油を取り除く。したがって、複数の細胞由来の増幅核酸は、合わせてプールすることができる。図2は、3つの増幅核酸250A、250B、及び250Cを示すが、様々な実施形態では、プールした核酸は、複数の細胞の検体に由来する、数百、数千、または数百万個の核酸を含むことができる。
様々な実施形態では、各増幅核酸250は、少なくとも、標的核酸240及びバーコード230の配列を含む。様々な実施形態では、増幅核酸250は、ユニバーサルプライマー配列(例えば、オリゴ-dT配列)、ランダムプライマー配列、遺伝子特異的プライマーフォワード配列、遺伝子特異的プライマーリバース配列、または定常領域のいずれかなどの、さらなる配列を含むことができる。
様々な実施形態では、増幅核酸250A、250B、及び250Cは、同一のシングルセルに由来し、故に、バーコード230A、230B、及び230Cは同一である。したがって、バーコード230を配列決定することにより、増幅核酸250が同一の細胞に由来するという測定が可能となる。様々な実施形態では、増幅核酸250A、250B、及び250Cはプールされ、異なる細胞に由来する。したがって、バーコード230A、230B、及び230Cは互いに異なり、バーコード230を配列決定することにより、増幅核酸250が異なる細胞に由来するという測定が可能となる。
工程210において、プールした増幅核酸250は配列決定を受け、シーケンスリードを生成する。各増幅核酸に関して、シーケンスリードは、バーコード及び標的核酸の配列を含む。増幅核酸に含まれるバーコード配列に従い、個別の細胞に由来するシーケンスリードをクラスター化する。工程215において、各シングルセルに対するシーケンスリードを(例えば、参照ゲノムに対して)アラインする。シーケンスリードを参照ゲノムに対してアラインすることにより、ゲノム内のどこで、シーケンスリードが由来するかを測定することができる。例えば、RNA転写産物から生成される複数のシーケンスリードは、ゲノム位置にアラインされた場合に、ゲノムの位置において、遺伝子が転写されたことを明らかにすることができる。別の例として、クロマチンがアクセス可能なDNAから生成した複数のシーケンスリードは、ゲノムの位置にアラインされた場合に、ゲノムの位置において遺伝子がアクセス可能であり、転写可能であることを明らかにすることができる。
工程200において、シングルセルに対してアラインしたシーケンスリードを分析して、シングルセルの軌道を測定する。例えば、RNA転写産物から生成したシーケンスリードにより、細胞の初期状態における遺伝子発現の速写がもたらされる。加えて、クロマチンがアクセス可能なDNAから生成したシーケンスリードにより、細胞の将来の状態における遺伝子発現の速写がもたらされる。まとめると、細胞の初期状態、及び細胞の将来の状態は、細胞系統、細胞運命、細胞の将来の状態における細胞機能、不健康な細胞の将来の状態、外部刺激(例えば治療)に対する将来の細胞応答のいずれかなどの細胞軌道を測定するのに有用であることができる。
シングルセル分析を行うための方法
封入、検体放出、バーコード化、及び増幅
本明細書に記載する実施形態は、(例えば、図1の工程160において)1つ以上の細胞を封入し、1つ以上の細胞にてシングルセル分析を行うことを伴う。様々な実施形態では、1つ以上の細胞は、対象または患者から入手した試験試料から単離することができる。様々な実施形態では、1つ以上の細胞は、健常な対象から採取した健常な細胞である。様々な実施形態では、1つ以上の細胞は、以前にがんと診断された対象から採取したがん細胞を含む。例えば、このようながん細胞は、がんと診断された対象の血流にて入手可能な腫瘍細胞であることができる。したがって、腫瘍細胞のシングルセルを分析することにより、対象のがんの細胞予測及び細胞下予測が可能となる。様々な実施形態では、試験試料は、対象の処置の後に(例えば、がん治療などの治療の跡に)、対象から入手される。したがって、細胞のシングルセルを分析することにより、治療に対する対象の応答の細胞予測及び細胞下予測が可能となる。様々な実施形態では、1つ以上の細胞は前駆細胞である。したがって、前駆細胞のシングルセルを分析することにより、前駆細胞の、可能性のある細胞系統の予測が可能となる。
様々な実施形態では、細胞を試薬と共に封入することは、細胞及び試薬を含む水相を、不混和性油と組み合わせることにより達成される。一実施形態では、細胞及び試薬を含む水相は、流れている不混和性油と共に流れて油中水型エマルションが形成され、ここで、少なくとも1つのエマルションは、シングルセル及び試薬を含む。様々な実施形態では、不混和性油相は、フルオラス油、フルオラス非イオン性界面活性剤、またはその両方を含む。様々な実施形態では、エマルションは、約0.001~1000ピコメートルまたはそれ以上の内部体積を有することができ、直径は0.1~1000μmの範囲であることができる。
様々な実施形態では、細胞及び試薬を含む水相は必ずしも、不混和性油相と同時に流れる必要はない。例えば、水相は流れて、不混和性油相の静止リザーバと接触することができ、これにより、静止した油リザーバ内で、油中水型エマルションの発生が可能となる。
様々な実施形態では、水相と不混和性油相とを組み合わせることは、マイクロフルイディクスデバイス内で行うことができる。例えば、水相は、マイクロ流体デバイスのマイクロチャネルを通って流れ、不混和性油相と接触することができ、これは同時に、個別のマイクロチャネルを通って流れているか、または、マイクロフルイディクスデバイスの静止リザーバ内で保持される。エマルションに封入された細胞及び試薬は次に、マイクロフルイディクスデバイスを通って流れ、細胞溶解を受けることができる。
試薬及び細胞をエマルションに添加する、さらなる例示的実施形態は、細胞及び試薬を個別に含有するエマルションを合わせること、または、試薬をエマルション内にピコインジェクションすることを含むことができる。例示的実施形態のさらなる説明は、米国出願第14/420,646号に記載されており、その全体が参照により本明細書に組み込まれている。
エマルションに封入された細胞を溶解し、細胞溶解物を生成する。様々な実施形態では、試薬中に存在する剤を溶解させることにより、細胞を溶解する。例えば、試薬は、細胞膜を溶解させる、NP40など(例えば、Tergitol型NP-40、またはノニルフェノキシポリエトキシエタノール)の洗剤を含むことができる。いくつかの実施形態では、細胞溶解はまた、または代わりに、試薬中で剤を溶解させることを伴わない技術に依存する。例えば、溶解は、様々なゲノム的特徴を用いて、細胞の穿孔、剪断、擦過などを達成し得る機械的技術により実現することができる。音響技術などの他の種類の機械的破壊もまた、使用することができる。さらに、熱エネルギーもまた使用して、細胞を溶解することができる。細胞溶解を達成する任意の便利な手段を、本明細書に記載の方法において用いることができる。
ここで、第1の実施形態に従った、検体の処理及び放出、ならびにその後の、エマルション内でのシングルセルの検体の処理を示す、図3A~3Cを参照する。具体的には、図3A~3Cに示す実施形態では、エマルション300A内で、細胞と共に封入した試薬は、プロテアーゼ(例えば、プロテイナーゼK)とトランスポザーゼ(例えば、トランスポザーゼTn5)のいずれをも含まない。図3Aにおいて、細胞膜の点線により示されるように、細胞は溶解される。一実施形態では、試薬は、細胞の溶解を引き起こす、NP40(例えば、0.01%または1.0%のNP40)を含むことができる。溶解した細胞は、細胞の細胞質内に、RNA転写産物などの検体、加えてパッケージ化DNAを含み、パッケージ化DNAとは、ヒストンによるDNAの組織化により、クロマチンとしてパッケージされたヌクレオソームを形成することを意味する。図3Aに示すように、エマルション300Aは、逆転写酵素(「RT」と略す)をさらに含む。
図3Bは、逆転写酵素としてのエマルション300Bが、RNA転写産物の逆転写を行うことを示す。図3Cは、合成したcDNA鎖を示す。このようなcDNA鎖は、リバースプライマーなどの試薬に含まれるプライマーを用いてプライミングすることができる。図3Cはまた、パッケージ化DNAをさらに詳述して示す。例えば、パッケージ化DNAは、クロマチンがアクセス可能なDNA330とも本明細書では呼ばれる、DNAのオープンセグメントを含む。クロマチンがアクセス可能なDNA330が、細胞転写機構(例えば、転写因子、ポリメラーゼなど)によりアクセスされる際に、遺伝子発現が生じることを考慮すると、クロマチンがアクセス可能なDNA330は、細胞の状態を反映し得る。パッケージ化DNAは、転写のために結合され、アクセス不可能な、アクセス不可能なDNA320を含むヌクレオソーム310をさらに含む。様々な実施形態では、パッケージ化DNA302に加えて、エマルション300Cは、クロマチンがアクセス可能なDNA330から生成した伸長生成物340もまた含む。例えば、クロマチンがアクセス可能なDNA330のセグメントをプライミングすることができ、相補性DNA鎖(例えば、伸長生成物340)を生成することができる。しかし、他の実施形態では、エマルション300Cは、cDNA306及びパッケージ化DNA302を含むが、伸長生成物340を含まない。
図1における細胞バーコード化170の工程は、細胞溶解物130を、反応混合物140及びバーコード145と共に封入することを含む。様々な実施形態では、反応混合物140は、標的核酸(例えば、cDNAまたはクロマチンがアクセス可能なDNA)上で核酸反応を行うための、プライマーなどの構成要素を含む。
様々な実施形態では、細胞溶解物は、反応混合物及びバーコードを含む水相を、細胞溶解物及び不混和性油相と組み合わせることにより、反応混合物及びバーコードと共に封入される。一実施形態では、反応混合物及びバーコードを含む水相は、流れている細胞溶解物及び流れている不混和性油相と共に流れ、これにより油中水型エマルションが形成され、ここで、少なくとも1つのエマルションは、細胞溶解物、反応混合物、及びバーコードを含む。様々な実施形態では、不混和性油相は、フルオラス油、フルオラス非イオン性界面活性剤、またはその両方を含む。様々な実施形態では、エマルションは、約0.001~1000ピコメートルまたはそれ以上の内部体積を有することができ、直径は0.1~1000μmの範囲であることができる。
様々な実施形態では、水相と不混和性油相とを組み合わせることは、マイクロフルイディクスデバイス内で行うことができる。例えば、水相は、マイクロ流体デバイスのマイクロチャネルを通って流れ、不混和性油相と接触することができ、これは同時に、個別のマイクロチャネルを通って流れているか、または、マイクロフルイディクスデバイスの静止リザーバ内で保持される。エマルションに封入された細胞溶解物、反応混合物、及びバーコードを次に、マイクロフルイディクスデバイスを通して流し、標的核酸の増幅を行うことができる。
反応混合物及びバーコードをエマルションに添加する、さらなる例示的実施形態は、細胞溶解物及び反応混合物及びバーコードを個別に含むエマルションを合わせること、または、反応混合物及び/もしくはバーコードをエマルションにピコインジェクションすることを含むことができる。エマルションを合わせる、または、物質をエマルションにピコインジェクションする例示的実施形態のさらなる説明は、米国出願第14/420,646号に見出され、その全体が参照により本明細書に組み込まれている。
反応混合物及びバーコードがエマルションに添加されると、エマルションは、核酸増幅反応を促進する条件下でインキュベートすることができる。様々な実施形態では、エマルションは、反応混合物及び/もしくはバーコードを添加するのに使用したのと同じマイクロフルイディクスデバイスでインキュベートすることができるか、または、別個の装置でインキュベートすることができる。特定の実施形態では、核酸増幅を促進する条件下でエマルションをインキュベートすることは、細胞を封入し、細胞を溶解するのに使用したのと同じマイクロフルイディクスデバイスで行う。エマルションをインキュベートすることは、様々な形態をとることができる。特定の態様では、反応混合物、バーコード、及び細胞溶解物を含有するエマルションは、核酸増幅に効果的な条件下でエマルションをインキュベートするチャネルを流れることができる。マイクロドロップレットがチャネルを流れることは、PCRに効果的な温度で維持される、様々な温度域にわたって蛇行するチャネルを伴う場合がある。このようなチャネルは例えば、2つ以上の温度域にわたってサイクルことができ、少なくとも1つの域は約65℃にて維持され、少なくとも1つの域は約95℃で維持される。滴がこのような域にまたがり移動するため、温度は、核酸増幅の必要に応じてサイクルする。域の数、及び、各域の対応する温度は、当業者により速やかに決定し、所望の核酸増幅を実現することができる。
様々な実施形態では、核酸増幅の後で、増幅核酸を含有するエマルションを収集する。様々な実施形態では、エマルションは、マイクロフルイディクスデバイスのウェルなどのウェルにて収集される。様々な実施形態では、エマルションは、リザーバ、または、エッペンドルフチューブなどのチューブで収集される。収集されると、異なるエマルションにまたがる増幅核酸がプールされる。一実施形態では、エマルションは、外部刺激により破壊され、増幅核酸をプールする。一実施形態では、エマルションは、水相と不混和性油相との密度差を考慮すると、時間の経過とともに自然に凝集する。したがって、増幅核酸は水相にプールされる。
プールした後、増幅核酸は、配列決定のためにさらなる調製を受けることができる。例えば、シーケンシングアダプターを、プールした核酸に添加することができる。例示的なシーケンシングアダプターは、P5及びP7シーケンシングアダプターである。シーケンシングアダプターにより、核酸のその後の配列決定が可能となる。
RNA及びクロマチンがアクセス可能なDNAの例示的な処理
図4Aは、第1の実施形態に従い、RNA及びパッケージ化DNAを第1のエマルション中で処理することを示す。具体的には、図4Aは、図1、及び図3A~3Cに示す検体放出165のプロセスをさらに詳細に示す。単一のRNA分子、及び単一の二本鎖パッケージ化DNAのみを示すものの、シングルセルは、2つ以上のRNA分子、及び2つ以上のパッケージ化DNAを有意に含有することができ、故に、後続の説明は、さらなるRNA分子及びさらなるパッケージ化DNAにまたがり適用されることを、当業者は認識するであろう。
前述したように、細胞を溶解することで、細胞溶解物を試薬に曝露する。ここで、図4Aの上の図に示すように、細胞溶解物は、RNA304と、ヌクレオソーム310及びクロマチンがアクセス可能なDNA330を含むパッケージ化DNA302と、を含む。試薬は、RNA304のセグメントとハイブリダイズする、リバースプライマー(点線で示す)などのプライマーを含む。様々な実施形態では、このようなリバースプライマーは、メッセンジャーRNAのポリAテールとハイブリダイズする、オリゴdT配列である。さらに、リバースプライマーはPCRハンドルを含む。リバースプライマーは、RNA304分子をプライミングする。したがって、図4の下の図に示すように、RNA304に対して相補的なcDNA306が生成される。本実施形態では、パッケージ化DNA302はプライミングされず、故に、変化しないままである。
図4Bは、図4Aに示す第1の実施形態に従った、RNA及びクロマチンがアクセス可能なDNAに由来する核酸の増幅及びバーコード化を示す。ここで、図4Bは、図1に示す細胞バーコード化170及び標的増幅の工程をさらに詳述する。図4Bの上の図は、図4Aの下の図に示したような、生成したcDNA306及びパッケージ化DNA302を示す。図4Bの中央の図は、cDNA306及びクロマチンがアクセス可能なDNA330の、増幅及びバーコード化プロセスを示す。cDNA306をまず参照すると、反応混合物からもたらされるフォワードプライマーとリバースプライマーの対(点線で示すフォワード及びリバースプライマー)は、cDNAをプライミングすることができる。フォワードプライマー及びリバースプライマーは、PCRハンドルなどの定常領域に結合することができる。フォワードプライマーのPCRハンドルは、バーコード配列に結合したPCRハンドルに対して相補的である(図4Bでは、「細胞BC」と注記する)。したがって、フォワード及びリバース合成は、中央の図に示す水平矢印により示される、フォワード及びリバースプライマーにより生じることができる。
クロマチンがアクセス可能なDNA330を参照すると、クロマチンがアクセス可能なDNA330のセグメントは、反応混合物からもたらされるリバースプライマー及びフォワードプライマー(点線で示すフォワード及びリバースプライマー)によりアクセス可能である。様々な実施形態では、クロマチンがアクセス可能なDNA330は、制御性複合体により、DNAアクセス性に関して役割を果たすDNAの呼吸性変動により、アクセス可能である。DNAの呼吸性変動についてのさらなる説明は、“von Hippel PH,Johnson NP,Marcus AH.Fifty years of DNA ”breathing”: Reflections on old and new approaches.Biopolymers.2013;99(12):923-954”に見出され、その全体が参照により本明細書に援用されている。フォワードプライマーは、バーコード配列に結合したPCRハンドルに対してさらに相補的な、PCRハンドルなどの定常領域に結合する。したがって、フォワード及びリバース合成は、中央の図に示す水平矢印により示される、フォワード及びリバースプライマーにより生じることができる。
具体的には、フォワード及びリバースプライマーが異なるエクソンを標的にするため、クロマチンがアクセス可能なDNA由来の合成アンプリコンは、(RNAアンプリコンと比較して)長い。したがって、DNAアンプリコンは、実施例1で後述するような、クロマチンがアクセス可能なDNAのプライミングが生じることを確認可能なイントロン配列を含有する。
図4Bの下の図は、(cDNA306からの、及びクロマチンがアクセス可能なDNA330からの)増幅核酸の調製を示す。ここで、cDNA由来の増幅核酸は、P5配列アダプター、リード1、バーコード(「細胞BC」)、第1のPCRハンドル、フォワードプライマー(点線で示す)、cDNA、リバースプライマー(点線で示す)、第2のPCRハンドル、及び、P7配列アダプターの配列を含む。クロマチンがアクセス可能なDNA330由来の増幅核酸は、P5配列アダプター、リード1、バーコード(「細胞BC」)、第1のPCRハンドル、フォワードプライマー、伸長生成物340(アクセス可能なDNA330に由来)、リバースプライマー、第2のPCRハンドル、及び、P7配列アダプターの配列を含む。様々な実施形態では、リード2配列は、各増幅核酸に含まれることができる。あるシナリオでは、リード2配列は、リバースプライマーに結合した第2のPCRハンドルに含まれることができる。別のシナリオでは、リード2配列は、P7配列アダプターに含まれることができる。
ここで、第2の実施形態に従った、RNA及びパッケージ化DNAの第1のエマルション中での処理を示す、図4Cを参照する。再び、図4Cは、図1、及び図3A~3Cに示す検体放出165のプロセスをさらに詳細に示す。図4Cの上の図に示すように、細胞溶解物は、RNA304と、ヌクレオソーム310及びクロマチンがアクセス可能なDNA330を含むパッケージ化DNA302と、を含む。エマルションは、40℃~60℃の温度といった、(例えば、生理学的温度と比較して増加した)増加した温度範囲に曝露することができる。様々な実施形態では、エマルションは、40℃、41℃、42℃、43℃、44℃、45℃、46℃、47℃、48℃、49℃、50℃、51℃、52℃、53℃、54℃、55℃、56℃、57℃、58℃、59℃、または60℃の増加した温度に曝露することができる。
増加した温度への曝露により、パッケージ化DNA302の構造を変えることができる。例えば、図4Cの中央の図に示すように、パッケージ化DNA302のクロマチンがアクセス可能なDNA330のセグメントをほどくことができる。様々な実施形態では、増加した温度においてパッケージ化DNA302がほどかれることは、制御性複合体による、DNAアクセス性に関して役割を果たすDNAの呼吸性変動を模倣する。DNAの呼吸性変動についてのさらなる説明は、“von Hippel PH,Johnson NP,Marcus AH.Fifty years of DNA ”breathing”: Reflections on old and new approaches.Biopolymers.2013;99(12):923-954”に見出され、その全体が参照により本明細書に援用されている。全てを合わせると、中央の図は、制御エレメントによりアクセス可能であり転写に利用可能な、クロマチンがアクセス可能なDNAのセグメントの速写である、細胞内でのパッケージ化DNAの状態を示す。図4Cの中央のパネルは、エマルション内での、添加された試薬のリバースプライマー(点線として示す)が、RNA304分子の相補配列とハイブリダイズ可能であることをさらに示す。様々な実施形態では、このようなリバースプライマーは、メッセンジャーRNAのポリAテールとハイブリダイズする、オリゴdT配列である。加えて、リバースプライマーは、少なくとも部分的に、増加した温度の観点において、構造的にほどかれた、クロマチンがアクセス可能なDNA330の相補配列とハイブリダイズすることができる。
図4Cの下の図を参照すると、相補性cDNA306分子は、RNA304分子から合成される。加えて、伸長生成物340は、プライミング領域にて開始するクロマチンがアクセス可能なDNA330から合成される。したがって、cDNA306及び伸長生成物340を、本明細書に記載する後の行程(例えば、細胞バーコード化及び標的増幅)で、さらに処理することができる。
図4Dは、図4Cに示す第2の実施形態に従った、RNA及びクロマチンがアクセス可能なDNAに由来する核酸の増幅及びバーコード化を示す。ここで、図4Cは、図1に示す細胞バーコード化170及び標的増幅の工程をさらに詳述する。図4Dの上の図は、図4Cの下の図に示したような、生成したcDNA306、及びパッケージ化DNA302の伸長生成物340を示す。図4Dの中央の図は、cDNA306及び伸長生成物340の増幅及びバーコード化プロセスを示す。一般に、cDNA306及び伸長生成物340は、共にDNA配列であることを考慮すると、同じ方法で処理される。cDNA306をまず参照すると、反応混合物からもたらされるフォワードプライマーとリバースプライマーの対(点線で示すフォワード及びリバースプライマー)は、cDNAをプライミングすることができる。フォワードプライマー及びリバースプライマーは、PCRハンドルなどの定常領域に結合することができる。フォワードプライマーのPCRハンドルは、バーコード配列に結合したPCRハンドルに対して相補的である(図4Dでは、「細胞BC」と注記する)。したがって、フォワード及びリバース合成は、中央の図に示す水平矢印により示される、フォワード及びリバースプライマーにより生じることができる。伸長生成物340を参照すると、反応混合物からもたらされるフォワードプライマー及びリバースプライマーは、cDNAをプライミングすることができる。フォワードプライマー及びリバースプライマーは、PCRハンドルなどの定常領域に結合することができる。フォワードプライマーのPCRハンドルは、バーコード配列に結合したPCRハンドルに対して相補的である(図4Dでは、「細胞BC」と注記する)。したがって、フォワード及びリバース合成は、中央の図に示す水平矢印により示される、フォワード及びリバースプライマーにより生じることができる。
図4Dの下の図は、(cDNA306からの、及びクロマチンがアクセス可能なDNA330からの)増幅核酸の調製を示す。ここで、cDNA由来の増幅核酸は、P5配列アダプター、リード1、バーコード(「細胞BC」)、第1のPCRハンドル、フォワードプライマー(点線で示す)、cDNA、リバースプライマー(点線で示す)、第2のPCRハンドル、及び、P7配列アダプターの配列を含む。(クロマチンがアクセス可能なDNA330に由来する)伸長生成物340を含む増幅核酸は、P5配列アダプター、リード1、バーコード(「細胞BC」)、第1のPCRハンドル、フォワードプライマー(点線で示す)、伸長生成物340、リバースプライマー(点線で示す)、第2のPCRハンドル、及び、P7配列アダプターの配列を含むことができる。様々な実施形態では、リード2配列は、各増幅核酸に含まれることができる。あるシナリオでは、リード2配列は、リバースプライマーに結合した第2のPCRハンドルに含まれることができる。別のシナリオでは、リード2配列は、P7配列アダプターに含まれることができる。
配列決定、及びリードアラインメント
増幅核酸を配列決定し、配列決定ライブラリーを生成するためのシーケンスリードを入手する。シーケンスリードは、合成による配列決定、ライゲーションによる配列決定、パイロシーケンス法、可逆的ターミネーターの化学作用を用いること、ホスホ結合蛍光ヌクレオチドを用いること、またはリアルタイム配列決定、のいずれかを行うプラットホームを含む、市販されている次世代配列決定(NGS)プラットホームを用いて実現することができる。一例として、増幅核酸は、Illumina MiSeqプラットホームで配列決定することができる。
パイロシーケンス法の場合、アダプターに対して相補的なオリゴヌクレオチドでコーティングした顆粒を用いて、1つのマトリックス分子を捕捉することにより、NGS断片のライブラリーをクローンin-situ増幅する。同じ種類のマトリックスを含有する各顆粒を、「油中水」型のマイクロバブルに配置し、エマルションPCRと呼ばれる方法を用いて、マトリックスをクローン増幅する。増幅後、エマルションは破壊され、顆粒は、配列決定反応の間にフローセルとして作用する滴定ピコプレートの、別個のウェルにスタックされる。4つのdNTP試薬のそれぞれをフローセルに、順序立てて複数回投与することは、配列決定酵素、及び、ルシフェラーゼなどの発光レポーターの存在下で生じる。好適なdNTPが配列決定プライマーの3’末端に添加される場合において、得られるATPは、ウェル内でのルミネセンスの発光を生み出し、これはCCDカメラを用いて記録される。400塩基以上の長さを達成することが可能であり、配列の106の読取り値を得ることが可能であり、結果として、最大5億個の塩基対(メガバイト)の配列が得られる。パイロシーケンス法のさらなる詳細は、Voelkerding et al.,Clinical Chem.,55: 641-658,2009;MacLean et al.,Nature Rev.Microbiol.,7: 287-296;米国特許第6,210,891号、;同第6,258,568号に記載され、これらそれぞれの全体が参照により本明細書に援用されている。
Solexa/Illuminaプラットホームでは、配列決定データは短い読取り値の形態で作成される。本方法では、NGS断片のライブラリーの断片が、オリゴヌクレオチドアンカー分子でコーティングされたフローセルの表面で捕捉される。アンカー分子はPCRプライマーとして使用されるが、マトリックスの長さ、及び、他の付近のアンカーオリゴヌクレオチドへの近接性が原因で、PCRにより伸長により、隣接するアンカーオリゴヌクレオチドとのハイブリダイゼーション、及び、フローセル表面での架橋構造の形成を伴う、分子の「ヴォールト」の形成がもたらされる。これらのDNAループは変性され、切断される。次いで、直鎖が、可逆的に染色されたターミネーターを用いて配列決定される。配列に含まれるヌクレオチドは、包含後に蛍光を検出することにより測定され、各蛍光剤、及びブロック剤は、次のdNTP添加サイクルの前に取り除かれる。Illuminaプラットホームを用いる配列決定のさらなる詳細は、Voelkerding et al.,Clinical Chem.,55: 641-658,2009;MacLean et al.,Nature Rev.Microbiol.,7: 287-296;米国特許第6,833,246号;同第7,115,400号;同第6,969,488号に見出され、これらそれぞれの全体が参照により本明細書に援用されている。
固体技術を用いる核酸分子の配列決定としては、エマルションPCRを用いる、NGS断片のライブラリーのクローン増幅が挙げられる。その後、マトリックスを含有する顆粒を、ガラスフローセルの誘導体化された表面で固定し、アダプターオリゴヌクレオチドに対して相補的なプライマーでアニールする。しかし、3’伸長のために示したプライマーを用いる代わりに、当該相補的なプライマーを使用して、2つのプローブ特異的塩基、続いて6個の縮退塩基、及び4個の蛍光標識のうちの1つを含有する、試験プローブ用のライゲーションのための5’リン酸基を入手する。固体システムにおいて、試験プローブは、各プローブの3’末端における2つの塩基と、5’末端における4つの蛍光染料のうちの1つとの、16個の可能性のある組み合わせを有する。蛍光染料の色、及び故に、各プローブの同一性は、特定の色空間コードスキームに対応する。プローブのアラインメントの多くのサイクルの後で、プローブのライゲーション、及び蛍光シグナルの検出、変性、続いて、元のプライマーと比較して1塩基移動したプライマーを用いる第2の配列決定サイクル。このようにして、マトリックスの配列を計算により再構築することが可能であり、マトリックス塩基を2回確認することで、正確性の増加に繋がる。固体技術を用いる配列決定のさらなる詳細は、Voelkerding et al.,Clinical Chem.,55: 641-658,2009;MacLean et al.,Nature Rev.Microbiol.,7: 287-296;米国特許第5,912,148号、;同第6,130,073号に見出され、これらそれぞれは、その全体が参照により組み込まれる。
特定の実施形態では、Helicos BioSciences製のHeliScopeを使用する。配列決定は、ポリメラーゼの添加、及び、蛍光標識したdNTP試薬の連続添加により達成される。切り替えにより、dNTPに対応する蛍光シグナルの概観がもたらされ、特定のシグナルが、各dNTP添加サイクルの前に、CCDカメラにより捕捉される。配列の読取り値の長さは、25~50ヌクレオチドで変化し、分析作業サイクル1回当たりで、全収率が10億個のヌクレオチド対を超える。HeliScopeを用いる配列決定を行うためのさらなる詳細は、Voelkerding et al.,Clinical Chem.,55: 641-658,2009;MacLean et al.,Nature Rev.Microbiol.,7: 287-296;米国特許第7,169,560号;同第7,282,337号;同第7,482,120号;同第7,501,245号;同第6,818,395号;同第6,911,345号;同第7,501,245号に見出され、これらそれぞれは、その全体が参照により組み込まれる。
いくつかの実施形態では、Rocheの配列決定システム454を使用する。配列決定454は、2つの工程を伴う。第1の工程では、DNAは約300~800個の塩基対の断片に切断され、これらの断片は平滑末端を有する。オリゴヌクレオチドアダプターは次に、断片の末端にライゲーションされる。アダプターは、断片の増幅及び配列決定のためのプライマーとして機能する。断片は、例えば、5’-ビオチンタグを含有するアダプターを用いて、DNA捕捉ビーズ、例えばストレプトアビジンでコーティングされたビーズに取り付けることができる。顆粒に取り付けられた断片は、油-水エマルションのドロップレット内で、PCRにより増幅される。結果は、各ビーズにおける、クローン増幅したDNA断片の複数のコピーである。第2の段階において、顆粒はウェルで捕捉される(体積は数ピコリットル)。パイロシーケンス法を、各DNA断片で並行して行う。1つ以上のヌクレオチドを添加することにより、光シグナルの生成がもたらされ、これは、配列決定機器のCCDカメラに記録される。シグナル強度は、含まれるヌクレオチドの数に比例する。パイロシーケンス法はピロホスフェート(PPi)を用い、これはヌクレオチドの添加の際に放出される。PPiは、アデノシン5’ホスホ硫酸の存在下で、ATPスルフリラーゼを使用してATPに転換される。ルシフェラーゼはATPを使用して、ルシフェリンをオキシルシフェリンに転換し、この反応の結果、光が生成され、これが検出及び分析される。配列決定454を行うためのさらなる詳細はMargulies et al.(2005) Nature 437: 376-380に見出され、その全体が参照により本明細書に組み込まれている。
Ion Torrent技術は、DNA重合の間に放出される水素イオンの検出に基づく、DNA配列決定法である。マイクロウェルは、配列決定されるNGS断片のライブラリーの断片を含有する。マイクロウェル層の下には、超感度イオンセンサISFETがある。全ての層が、エレクトロニクス産業で使用されるチップ同様に、半導体CMOSチップの中に含まれる。dNTPが生長する相補鎖に組み込まれるとき、水素イオンが放出され、超感度イオンセンサを励起する。ホモポリマーが鋳型の配列に存在する場合、複数のdNTP分子が1サイクルに含められる。これにより、相当量の、放出される水素原子、及び、それに比例した、より大きな電気シグナルがもたらされる。この技術は、修飾ヌクレオチドまたは光学装置を用いない他の配列決定技術とは異なる。Ion Torrent技術についてのさらなる詳細は、Science 327(5970):1190(2010);米国特許出願公開第20090026082号、同第20090127589号、同第20100301398号、同第20100197507号、同第20100188073号、及び同第20100137143号に見出され、これらそれぞれは、その全体が参照により組み込まれる。
様々な実施形態では、NGS法から得られる配列決定リードは、質により分類し、当該技術分野において公知の任意のアルゴリズム、例えばPython script barcodeCleanup.pyを使用するバーコード配列によりグルーピングすることができる。いくつかの実施形態では、その塩基の約20%超が、約99%のベースコールの正確性を示す、Q20の品質スコア(Q-スコア)を有する場合、所与の配列決定リードを廃棄してよい。いくつかの実施形態では、約5%超、約10%、約15%、約20%、約25%、約30%が、それぞれ、約90%、約99%、約99.9%、約99.99%、約99.999%、約99.9999%のベースコールの正確性を示す、Q10未満、Q20、Q30、Q40、Q50、Q60、またはそれ以上のQ-スコアを有する場合、所与の配列決定リードを廃棄してよい。
いくつかの実施形態では、50個未満のリードを含有するバーコードと関連する全ての配列決定リードを破棄して、シングルセルを表す全てのバーコード基が、十分な数の高品質のリードを確実に含有することができる。いくつかの実施形態では、30未満、40未満、50未満、60未満、70未満、80未満、90未満、100未満、またはそれ以上を含有するバーコードと関連する全ての配列決定リードを廃棄して、シングルセルを表すバーコード基の質を確保することができる。
共通のバーコード配列を有するシーケンスリード(例えば、同じ細胞に由来するシーケンスリードを意味する)を、当該技術分野において既知の方法を使用して参照ゲノムとアラインし、アラインメント位置情報を測定することができる。アラインメント位置情報は、所与のシーケンスリードの開始ヌクレオチド塩基及び末端ヌクレオチド塩基に対応する、参照ゲノム内の領域の開始位置及び終了位置を示し得る。参照ゲノム内の領域は、標的遺伝子、または遺伝子のセグメントと関連する場合がある。例示的なアライナーアルゴリズムとしては、BWA、Bowtie、参照に対するスプライス転写物アラインメント(STAR)、Tophat、またはHISAT2が挙げられる。シーケンスリードを参照配列にアラインするためのさらなる詳細は、米国出願第16/279,315号に記載されており、その全体が参照により本明細書に組み込まれている。様々な実施形態では、SAM(配列アラインメントマップ)フォーマット、またはBAM(2元アラインメントマップ)フォーマットを有する出力ファイルを、例えば、細胞軌道を測定するための後の分析のために生成し、出力することができる。
細胞軌道の測定
シングルセルのRNA転写産物及びクロマチンがアクセス可能なDNAに由来する核酸の配列決定リードを分析し、シングルセルの細胞軌道を測定する。一般に、細胞軌道とは、細胞のクロマチン構造により示される、細胞の、第1の状態から第2の状態への変化を意味する。したがって、細胞軌道は、細胞のクロマチン組織化プロファイルを反映したものである。RNA-seqにより入手した配列決定リードは、細胞の過去の状態の速写を提供する。例えば、RNA転写産物の存在により、過去のクロマチンの組織化の詳細を明らかにすることができる(例えば、RNA転写産物に対応する特定の遺伝子が発現することで、クロマチン内でアクセス可能となる)。DNA-seqにより入手した配列決定リードは、細胞の将来の状態の速写を提供する。例えば、DNA-seqの結果は、現在のクロマチンの組織化の詳細を明らかにする(例えば、クロマチンがアクセス可能な領域に対応する特定の遺伝子を、転写及び発現のために入手可能である)。全てを合わせると、RNA-seq及びDNA-seqのシーケンスリードは、クロマチン構造プロファイルを明らかにする。
細胞軌道を測定するために、RNA転写産物に由来する、アラインされたシーケンスリードを、クロマチンがアクセス可能なDNAに由来する、アラインされたシーケンスリードと比較する。より具体的には、RNA転写産物に由来するシーケンスリードのリード計数を、クロマチンがアクセス可能なDNAに由来する、アラインされたシーケンスリードのリード計数と比較する。様々な実施形態では、個別の遺伝子ベースで比較を行う。
例えば、参照ゲノム内で、既知の範囲の位置を有する遺伝子に関しては、RNA-seqにより入手した「X」シーケンスリードが存在し得、DNA-seqにより入手した「Y」シーケンスリードが存在し得る。一実施形態では、RNA-seqにより入手した「X」シーケンスリードは、遺伝子の発現を示し、DNA-seqにより入手した「Y」シーケンスリードは、遺伝子が、DNAのクロマチンがアクセス可能な領域に対応することを示す。これにより、細胞が、以前の状態と将来の状態との両方において、パッケージ化DNA内でアクセス可能であるということを考慮すると、細胞の以前の状態(RNA-seqにより明らかとなる)と、細胞の将来の状態(DNA-seqにより明らかとなる)の、共通性が明らかとなる。
第1の実施形態に従い、細胞軌道を測定するために単一細胞RNA-seq及びDNA-seqにより入手した、配列決定リードを示す、図5Aを参照する。図5Aは、参照ゲノムの4つのウィンドウを示す。各ウィンドウは、ゲノムに沿って一定範囲の位置を含む。様々な実施形態では、各ウィンドウは、既知の遺伝子の位置範囲を参照することができる。第2及び第3のグラフは、4つのウィンドウのそれぞれにおけるゲノム位置にそれぞれまたがる、RNA-seq520及びDNA-seq530のリードの量を示す。ここで、RNA-seq及びDNA-seqの両方が、ウィンドウ1、3、及び4におけるシーケンスリードをもたらし、ウィンドウ2にシーケンスリードは存在しない。例えば、4つのウィンドウのそれぞれが遺伝子の位置を参照する場合、RNA-seq520とDNA-seq530のリードは、4つの遺伝子の以前の状態と将来の状態における共通性を示す。すなわち、4つの遺伝子のクロマチン構造プロファイルは変化しない。これは、4つの遺伝子に対するクロマチン構造プロファイルが変化しないままである細胞軌道を同定するのに有益である。
別の実施形態では、RNA-seqにより入手した「X」シーケンスリード、及び、「Y」シーケンスリードにより、細胞の以前の状態と細胞の将来の状態とにおける変化が明らかになる。一例として、RNA-seqにより入手した「X」シーケンスリードは、遺伝子が発現しなかったことを示す。このようなシナリオでは、X=0のシーケンスリードとなるか、またはほぼ0のシーケンスリードとなる。しかし、DNA-seqにより入手した「Y」シーケンスリードは、遺伝子が、パッケージ化DNA内でアクセス可能であり、転写のために利用可能であることを示す。これは、細胞が、遺伝子の非発現の以前の状態から、遺伝子が発現し得る将来の状態に変化していることを示し得る。別の例として、RNA-seqにより入手した「X」シーケンスリードは、遺伝子が発現したことを示す。しかし、DNA-seqにより入手した「Y」シーケンスリードは、遺伝子が、パッケージ化DNA内でアクセス不可能であり、転写のために利用不可能であることを示す。このようなシナリオでは、Y=0のシーケンスリードとなるか、またはほぼ0のシーケンスリードとなる。これは、細胞が、遺伝子の発現の以前の状態から、遺伝子が発現しない将来の状態に変化していることを示し得る。
図5Bは、第2の実施形態に従い、細胞軌道を測定するためにシングルセルRNA-seq及びDNA-seqにより入手した、配列決定リードを示す。再び、図5Bは、参照ゲノムの4つのウィンドウを示す。各ウィンドウは、ゲノムに沿って一定範囲の位置を含む。様々な実施形態では、各ウィンドウは、既知の遺伝子の位置範囲を参照することができる。第2及び第3のグラフは、4つのウィンドウのそれぞれにおけるゲノム位置にそれぞれまたがる、RNA-seq520及びDNA-seq530のリードの量を示す。
ここで、RNA-seq及びDNA-seqは、ウィンドウ1、2、及び3において、異なるリードの量をもたらす一方で、ウィンドウ4におけるリードの量は一般に一致する。ここでもまた、4つのウィンドウのそれぞれが遺伝子の位置を参照する場合、RNA-seq520及びDNA-seq530のリードは、遺伝子のうち3つ(例えば、ウィンドウ1、2、及び3)のクロマチンプロファイルにおける変化を示す一方で、4番目の遺伝子(例えばウィンドウ4)のクロマチンプロファイルは変化しない。具体的には、ウィンドウ1及び3は、対応する遺伝子が、アクセス可能な状態からアクセス不可能な状態に変化し得ることを示す。対応する遺伝子が、アクセス不可能な状態からアクセス可能な状態に変化し得ることを、ウィンドウ2は示す。これは、クロマチン構造プロファイルが、遺伝子のうち3つに対して変化を受け(例えば、アクセス可能からアクセス不可能、または、アクセス不可能からアクセス可能)、4番目の遺伝子に関しては変化しない、細胞軌道を同定するのに有益である。
前述の例示的な説明では、単独の遺伝子、または限定数の遺伝子(例えば、図5A及び5Bで示すように、4つの遺伝子)を参照するが、RNA-seq及びDNA-seqにより入手したシーケンスリードの分析は、ゲノムにまたがる、数十、数百、数千、または数万個の遺伝子に適用することができる。そのため、各細胞に関しては、細胞のゲノムにまたがって、変化していない、または変化したクロマチン構造プロファイルを測定することができる。変化していない、または変化したクロマチン構造プロファイルは、細胞系統、細胞運命、細胞の将来の状態における細胞機能、不健康な細胞の将来の状態、外部刺激(例えば治療)に対する将来の細胞応答のいずれかなどの細胞軌道を測定するのに有益である。クロマチンプロファイルを使用して細胞系統を予測するさらなる説明は、Ma et al.,Chromatin potential identified by shared single cell profiling of RNA and chromatin,bioRxiv,June 18,2020,doi: https://doi.org/10.1101/2020.06.17.156943に見出され、その全体が参照により本明細書に組み込まれている。
バーコード及びバーコード化ビーズ
本発明の実施形態は、図1に示す工程170の間に、シングルセルの検体を標識するために、1つ以上のバーコード配列を提供すること伴う。1つ以上のバーコード配列は、エマルションに、シングルセルに由来する細胞溶解物と共に封入される。そのため、1つ以上のバーコードは細胞の検体を標識することにより、シーケンスリードが、細胞起源の検体に由来することをその後判定することを可能にする。
様々な実施形態では、複数のバーコードをエマルションに、細胞溶解物と共に添加する。様々な実施形態では、エマルションに添加される複数のバーコードは、少なくとも102、少なくとも103、少なくとも104、少なくとも105、少なくとも105、少なくとも106、少なくとも107、または少なくとも108個のバーコードを含む。様々な実施形態では、エマルションに添加される複数のバーコードは、同一のバーコード配列を有する。様々な実施形態では、エマルションに添加される複数のバーコードは、「固有の識別配列」(UMI)を含む。UMIは、そのUMIがコンジュゲートされている1つ以上の第1の分子を、1つ以上の第2の分子から識別及び/または区別するのに利用できる配列を有する核酸である。UMIは典型的には、長さが短く、例えば、約5~20塩基長であり、対象とする1つ以上の標的分子またはその増幅産物にコンジュゲートしてよい。UMIは、一本鎖であっても、二本鎖であってもよい。いくつかの実施形態では、バーコード配列及びUMIの両方が、バーコードに組み込まれる。概して、UMIは、1つの集団または群における似た種類の分子を区別する目的で用いるのに対して、バーコード配列は、異なる細胞に由来する複数の分子集団または分子群を区別するのに用いる。いくつかの実施形態では、UMI及びバーコード配列の両方を使用する場合、そのUMIは、そのバーコード配列よりも配列の長さが短い。バーコードの使用は、米国特許出願第15/940,850号にさらに記載されており、その全体が参照により本明細書に組み込まれている。
いくつかの実施形態では、バーコードは一本鎖バーコードである。一本鎖バーコードは、多数の技術を使用して生成することができる。例えば、一本鎖バーコードは、異なる分子の配列が少なくとも部分的に異なっている、複数のDNAバーコードを入手することにより生成することができる。これらの分子を次に増幅し、例えば、非対称PCRを使用して、一本鎖のコピーを作製することができる。あるいは、バーコード分子を環状にした後で、ローリングサークル増幅に供することができる。これにより、バーコード化した元のDNAが、単一の長い分子として何回も濃縮される、生成物である分子が得られる。
いくつかの実施形態では、任意数の定常配列が隣接するバーコード配列を含有する、環状バーコードDNAは、線状DNAを環状にすることで入手することができる。任意の定常配列をアニールするプライマーは、鎖置換ポリメラーゼ(Phi29ポリメラーゼなど)を使用することにより、ローリングサークル増幅を開始することができ、バーコードDNAの長い直鎖コンカテマーを生成する。
様々な実施形態では、バーコードは、当該バーコードが標的核酸を標識可能にするプライマー配列に結合することができる。一実施形態では、バーコードはフォワードプライマー配列に結合する。様々な実施形態では、フォワードプライマー配列は、核酸のフォワード標的とハイブリダイズする遺伝子特異的プライマーである。様々な実施形態では、フォワードプライマー配列は、遺伝子特異的プライマーに付着した相補配列とハイブリダイズする、PCRハンドルなどの定常領域である。遺伝子特異的プライマーに付着した相補配列を、反応混合物(例えば、図1の反応混合物140)中に提供することができる。バーコードが同一のフォワードプライマーを有することができ、遺伝子特異的フォワードプライマーに結合するように個別に設計される必要がないため、定常フォワードプライマー配列をバーコードに含めることが、好ましい場合がある。
様々な実施形態では、バーコードは、ビーズなどの支持構造体に解放可能に付着することができる。したがって、バーコードの複数のコピーを含む単一のビーズを、細胞溶解物を含むエマルションに分画することができ、これにより、細胞溶解物の検体を、ビーズのバーコードで標識することが可能となる。例示的なビーズとしては、固体ビーズ(例えば、シリカビーズ)、高分子ビーズ、またはハイドロゲルビーズ(例えば、ポリアクリルアミド、アガロース、もしくはアルギン酸ビーズ)が挙げられる。ビーズは、様々な技術を用いて合成することができる。例えば、混合分離技術を使用すると、同一な無作為のバーコード配列の多くのコピーを伴うビーズを合成することができる。これは例えば、DNAを合成可能な部位を含む複数のビーズを作製することにより達成することができる。ビーズは4つの集まりに分けることができ、それぞれに、A、T、G、またはCなどの塩基をビーズに添加する、緩衝液と混合することができる。母集団を4つの亜集団に分けることで、各亜集団は、その表面に添加された塩基のうちの1つを有することができる。本反応は、単一の塩基のみが添加され、更なる塩基が添加されない方法で達成することができる。4つの亜集団全てに由来するビーズを合わせて互いに混合し、2回目の4つの集団への分割を行うことができる。この分割工程において、以前の4つの集団に由来するビーズを、無作為に一緒に混合することができる。これらを次に、4つの異なる溶液に添加し、各ビーズの表面上の、別の無作為な塩基を添加することができる。本プロセスを繰り返し、ビーズ表面に、母集団が分離及び混合される時間数におよそ等しい長さの配列を生成することができる。これを10回行ったら、例えば、結果は、各ビーズが、その表面に同一の無作為の10個の塩基配列が合成された多数のコピーを有する、ビーズの母集団となろう。各ビーズ上の配列は、各分離混合サイクルを通して終了した、反応器の特定の配列により測定される。例示的なビーズ及びその合成についてのさらなる詳細は、国際出願第PCT/US2016/016444号に記載されており、その全体が参照により本明細書に組み込まれている。
試薬
本明細書に記載する実施形態は、細胞を試薬と共に、エマルションに封入することを含む。一般に、試薬は、細胞が溶解する条件下で封入細胞と相互作用し、これにより、細胞の標的検体を放出する。試薬をさらに、標的検体と相互作用して、後続のバーコード化及び/または増幅のために調製することができる。様々な実施形態では、試薬としては、ddNTP、リボヌクレアーゼ阻害剤などの阻害剤、プライマー(例えば、オリゴdTまたは遺伝子特異的リバースプライマーなどのリバースプライマー)、及び、ジチオトレイトール(DTT)などの安定化剤が挙げられる。
様々な実施形態では、試薬は、細胞を溶解させる1つ以上の溶解剤を含む。溶解剤の例としては、Triton X-100、NP-40、加えて細胞毒素などの洗剤が挙げられる。NP-40の例としては、Thermo Scientific NP-40 Surfact-Amps洗剤溶液、及びSigma Aldrich NP-40(TERGITOL型NP-40)が挙げられる。いくつかの実施形態では、試薬としては、細胞膜を破壊し、細胞溶解を引き起こすのに十分ではあるが、クロマチンパッケージ化DNAを破壊しないNP40洗剤が挙げられる。様々な実施形態では、試薬は、0.01%、0.05%、0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1.0%、1.1%、1.2%、1.3%、1.4%、1.5%、1.6%、1.7%、1.8%、1.9%、2.0%、3.0%、3.1%、3.2%、3.3%、3.4%、3.5%、3.6%、3.7%、3.8%、3.9%、4.0%、4.1%、4.2%、4.3%、4.4%、4.5%、4.6%、4.7%、4.8%、4.9%、または5.0%のNP40(v/v)を含む。様々な実施形態では、試薬は、少なくとも0.01%、少なくとも0.05%、少なくとも0.1%、少なくとも0.5%、少なくとも1%、少なくとも2%、少なくとも3%、少なくとも4%、または少なくとも5%のNP40(v/v)を含む。
様々な実施形態では、試薬は、細胞の溶解、及び/またはゲノムDNAのアクセスを補助するプロテアーゼをさらに含む。様々な実施形態では、試薬中のプロテアーゼとしては、プロテイナーゼK、ペプシン、プロテアーゼ-サブチリシンCarlsberg、プロテアーゼ型X-bacillus thermoproteolyticus、または、プロテアーゼ型XIII-aspergillus Saitoiを挙げることができる。様々な実施形態では、試薬中のプロテアーゼの量は、シングルセルワークフロー手順で用いるプロテアーゼの量を下回る。様々な実施形態では、試薬中のプロテアーゼの量は、従来のシングルセルワークフロー手順で存在する量の0.01%未満、0.05%未満、0.1%未満、0.2%未満、0.3%未満、0.4%未満、0.5%未満、0.6%未満、0.7%未満、0.8%未満、0.9%未満、1%未満、2%未満、3%未満、4%未満、5%未満、10%未満、15%未満、20%未満、25%未満、30%未満、40%未満、または50%未満である。例えば、シングルセルワークフロー手順では、1mg/mLのプロテイナーゼKを使用している(その全体が参照により本明細書に組み込まれている、Pellegrino,Maurizio et al.“High-throughput single-cell DNA sequencing of acute myeloid leukemia tumors with droplet microfluidics.” Genome research vol.28,9(2018): 1345-1352を参照されたい)。したがって、様々な実施形態では、試薬は、0.0001mg/mL未満、0.0005mg/mL未満、0.0010mg/mL未満、0.0020mg/mL未満、0.0030mg/mL未満、0.0040mg/mL未満、0.0050mg/mL未満、0.0060mg/mL未満、0.0070mg/mL未満、0.0080mg/mL未満、0.0090mg/mL未満、0.01mg/mL未満、0.02mg/mL未満、0.03mg/mL未満、0.04mg/mL未満、0.05mg/mL未満、0.10mg/mL未満、0.15mg/mL未満、0.20mg/mL未満、0.30mg/mL未満、0.40mg/mL未満、または0.50mg/mL未満を含む。
様々な実施形態では、試薬は、シングルセルから放出された標的検体と相互作用する剤をさらに含む。このような剤の一例としては、細胞から放出されるメッセンジャーRNAを逆転写し、対応するcDNAを生成する、逆転写酵素が挙げられる。
いくつかの実施形態では、剤は、パッケージ化DNAと相互作用して、クロマチン及び/またはヌクレオソームにより結合されない、クロマチンがアクセス可能なDNAのセグメントを生成するトランスポザーゼTn5(または、変異したトランスポザーゼTn5)を含む。様々な実施形態では、試薬中でのトランスポザーゼTn5の量は、従来のATAC-seq手順で使用されるトランスポザーゼTn5の量を下回る。従来のATAC-seq手順で使用するトランスポザーゼTn5の例としては、Illumina Tagment DNA酵素(Illuminaカタログ番号20034197または20034198)、及び、Nextera Tn5トランスポザーゼ,Illuminaカタログ番号FC-121-1030)が挙げられる。様々な実施形態では、試薬中のトランスポザーゼTn5の量は、従来のATAC-seq手順で存在する量の0.01%未満、0.05%未満、0.1%未満、0.2%未満、0.3%未満、0.4%未満、0.5%未満、0.6%未満、0.7%未満、0.8%未満、0.9%未満、1%未満、2%未満、3%未満、4%未満、5%未満、10%未満、15%未満、20%未満、25%未満、30%未満、40%未満、または50%未満である。例えば、従来のATAC-seq手順では、5%のトランスポザーゼTn5(v/v)を用いる(それぞれが、その全体が参照により組み込まれている、Buenrostro,J.et al.,“Single-cell chromatin accessibility reveals principles of regulatory variation.” Nature,523(7561):486-490.July 23,2015、Buenrostro,J.et al.“ATAC-seq:A Method for Assaying Chromatin Accessibility Genome-Wide.” Current protocols in molecular biology vol.109 21.29.1-21.29.9.5 Jan.2015、及びShashikant,Tanvi,and Charles A Ettensohn.“Genome-wide analysis of chromatin accessibility using ATAC-seq.” Methods in cell biology vol.151(2019): 219-235を参照されたい)。したがって、様々な実施形態では、試薬は、0.0005%未満、0.0025%未満、0.005%未満、0.01%未満、0.015%未満、0.02%未満、0.025%未満、0.030%未満、0.035%未満、0.040%未満、0.045%未満、0.050%未満、0.1%未満、0.15%未満、0.2%未満、0.25%未満、0.5%未満、0.75%未満、1.0%未満、1.25%未満、1.5%未満、1.75%未満、2.0%未満、または2.5%未満のトランスポザーゼTn5(v/v)を含む。
本明細書の実施形態は、シングルセル由来のDNAでDNA-配列決定を行うことについて記載する。好ましい実施形態では、DNA-配列決定は、クロマチンがアクセス可能なDNA(例えば、クロマチンでパッケージ化されたときにアクセス可能なDNA)で行われる。クロマチンがアクセス可能なDNAでDNA-配列決定を行うことと一致する特定の実施形態では、細胞と同時に封入される試薬は、プロテアーゼを含まず、より具体的には、プロテイナーゼK(または、変異したプロテイナーゼK)を含まない。さらに、試薬は、トランスポザーゼTn5などのトランスポザーゼ、または、変異したトランスポザーゼTn5などの、変異したトランスポザーゼを含まない。
特定の実施形態では、試薬はNP40を含み、プロテイナーゼKまたはトランスポザーゼを含まない。NP40は、パッケージ化DNAを破壊することなく細胞を溶解するには十分であり、その後、パッケージ化DNA内での、クロマチンがアクセス可能なDNAのプライミングを行うことができ、これにより、クロマチンがアクセス可能なDNAを調査するDNA-配列決定が可能となる。プロテイナーゼK及びトランスポザーゼを欠いていることで、シングルセルワークフロープロセスが簡素化されるため、NP40を含み、プロテイナーゼKまたはトランスポザーゼを含まない試薬を用いることが好ましい。加えて、プロテイナーゼK及びトランスポザーゼを欠いていることにより、ワークフロープロセスで用いられる消耗品の数が少なくなり、これにより、大量の細胞のシングルセル分析を行うときに、より低コストがもたらされる。
反応混合物
本明細書に記載されるように、反応混合物を、細胞溶解物と共にエマルションに供給する(例えば、図1の細胞バーコード化工程170を参照されたい)。一般に、反応混合物は、細胞溶解物の検体にて、核酸増幅などの反応を行うのに十分な反応物質を含む。
様々な実施形態では、反応混合物は、核酸鎖に対して相補的なプライマー伸長生成物の合成が触媒される条件下に配置されるときに、相補鎖に沿って、合成の開始点として機能することができるプライマーを含む。様々な実施形態では、反応混合物は、4つの異なるデオキシリボヌクレオシド三リン酸(アデノシン、グアニン、シトシン、及びチミン)を含む。様々な実施形態では、反応混合物は、核酸増幅のための酵素を含む。核酸増幅のための酵素の例としては、DNAポリメラーゼ、熱サイクル増幅用の熱安定ポリメラーゼ、または、等温増幅のための複数置換増幅用ポリメラーゼが挙げられる。DNA依存性RNAポリメラーゼを用いる増幅などの、さほど一般的でない他の増幅形態もまた適用し、それ自身がDNAに逆転換し、本質的に、標的の増幅をもたらすことができる、元のDNA標的に由来するRNAの複数のコピーを作製することができる。生体もまた使用して、例えば、標的を生体に変換することにより、標的を増幅することができ、これにより次いで、生体の複製を伴い、または伴わずに、標的をコピーすることが可能となるか、またはコピーを誘発することができる。
様々な実施形態では、反応混合物の内容物は、好適な緩衝液中に存在し(「緩衝液」は、補助因子であるか、または、pH、イオン強度などに影響を及ぼす置換基を含む)、好適な温度にある。
核増幅の程度を、反応混合物中で反応物質の濃度を制御することにより制御することができる。場合によっては、これは、増幅産物が用いられる反応の微細なチューニングに有用である。
プライマー
本明細書に記載する本発明の実施形態は、プライマーを使用して、シングルセル分析を実施する。例えば、プライマーは、図1に示すワークフロープロセスの間に用意される。プライマーを使用して、対象となる核酸がバーコード化、及び/または増幅可能となるように、対象となる核酸の特定の配列とプライミング(例えばハイブリダイズ)することができる。加えて、プライマーにより、配列決定後の標的領域の同定が可能となる。後で説明するように、プライマーは、図1に示すワークフロープロセスにおいて、様々な工程で提供することができる。図1を再度参照すると、様々な実施形態では、プライマーを、細胞110と共に封入される試薬120に含めることができる。試薬120中のこのようなプライマーとしては、プライミングRNA用のRNAプライマー、及び/または、パッケージ化DNA内でクロマチンがアクセス可能なDNAをプライミングするためのDNAプライマーを含むことができる。様々な実施形態では、プライマーを、細胞溶解物130と共に封入される反応混合物140に含めることができる。反応混合物140中のこのようなプライマーとしては、RNAから逆転写されているcDNAをプライミングするためのcDNAプライマー、ならびに/または、パッケージ化DNA中のクロマチンがアクセス可能なDNA、及び/もしくは、クロマチンがアクセス可能なDNAから生成されている生成物をプライミングするためのDNAプライマーを挙げることができる。様々な実施形態では、プライマーを、細胞溶解物130と共に封入されるバーコード145に含めることができるか、または、これと結合させることができる。シングルセル分析ワークフロープロセスで使用されるプライマーのさらなる説明及び例は、米国出願第16/749,731号に記載されており、その全体が参照により本明細書に組み込まれている。
様々な実施形態では、試薬、反応混合物、またはバーコードのいずれかの中でのプライマーの数は、約1~約500個以上の範囲、例えば、約2~100個のプライマー、約2~10個のプライマー、約10~20個のプライマー、約20~30個のプライマー、約30~40個のプライマー、約40~50個のプライマー、約50~60個のプライマー、約60~70個のプライマー、約70~80個のプライマー、約80~90個のプライマー、約90~100個のプライマー、約100~150個のプライマー、約150~200個のプライマー、約200~250個のプライマー、約250~300個のプライマー、約300~350個のプライマー、約350~400個のプライマー、約400~450個のプライマー、約450~500個のプライマーまたは約500個以上のプライマーであってよい。
標的化DNA配列決定、及び標的化RNA配列決定に関して、試薬(例えば、図1における試薬120)中のプライマーとしては、対象となる核酸(例えば、DNAまたはRNA)において、逆標的に対して相補的なリバースプライマーを挙げることができる。様々な実施形態では、試薬中のプライマーは、対象となる遺伝子の逆標的を標的にする遺伝子特異的プライマーであってよい。様々な実施形態では、反応混合物(例えば、図1の反応混合物140)中のプライマーとしては、対象となる核酸(例えばDNA)のフォワード標的に対して相補的なフォワードプライマーであってよい。様々な実施形態では、反応混合物中のプライマーは、対象となる遺伝子のフォワード標的を標的にする遺伝子特異的プライマーであってよい。様々な実施形態では、試薬のプライマー、及び反応混合物のプライマーは、核酸上で、対象となる領域に対するプライマーセット(例えば、フォワードプライマー及びリバースプライマー)を形成する。
対象とする遺伝子用フォワードまたはリバースプライマーの添加数は、約1~500個の範囲、例えば、約1~10個のプライマー、約10~20個のプライマー、約20~30個のプライマー、約30~40個のプライマー、約40~50個のプライマー、約50~60個のプライマー、約60~70個のプライマー、約70~80個のプライマー、約80~90個のプライマー、約90~100個のプライマー、約100~150個のプライマー、約150~200個のプライマー、約200~250個のプライマー、約250~300個のプライマー、約300~350個のプライマー、約350~400個のプライマー、約400~450個のプライマー、約450~500個のプライマーまたは約500個以上のプライマーであってよい。様々な実施形態では、DNA-配列決定またはRNA-配列決定のいずれかに対する、対象となる遺伝子としては、CCND3、CD44、CCND1、CD33、CDK6、CDK4、CDKN1B、CREB3L4、CDKN1A、CREBBP、CREB3L1、CREB5、CREB1、ELK1、FOS、FHL1、FASLG、GNG12、GSK3B、BAD、FOXO4、FOXO1、HIF1A、HSPB1、IKBKG、IRF9、BCL2、BCL2L11、MAP2K1 MAPK1、BCL2L1、MYB、NF1、NFKB1、MYC、PIK3CB、PIM1、PIAS1、PRKCB、PTEN、HSPA1A、HSPA2、IL2RB、IL2RA、SIRT1、NCL、RHOA、MCM4、NASP、SOS1、TCL1B、SOCS3、SOCS2、STAT4、STAT6、SRF、TP53、CASP9、CASP3、CASP8、UBB、MPRL16、MRPL21、FAM32A、ABCB7、PCBP1、EPS15、NRAS、RPS27A、AFF3、PAX3、CMTM6、RHOA、PIK3CA、MAP3K13、NSD1、PTPRK、CARD11、EGFR、EZH2、WRN、JAK2、GATA3、DKK1、POLA2、CCND1、ATM、ARHGEF12、KRAS、COL2A1、KMT2D、CLIP1、FLT3、BRCA2、BUB1B、PALB2、FANCA、NCOR1、ERBB2、KAT2A、RAB5C、METTL23、SRSF2、MFSD11、DNM2、CIC、BCR、MYH9、EP300、及びSSX1が挙げられるが、これらに限定されない。
全トランスクリプトームRNA配列決定のために、様々な実施形態では、試薬(例えば、図1の試薬120)のプライマーは、定常リバースプライマー及びランダムフォワードプライマーを含むことができる。定常リバースプライマーとしては、ユニバーサルプライマー領域、及び、PCRハンドルなどの逆定常領域を挙げることができる。例えば、ユニバーサルプライマー領域は、メッセンジャーRNA転写物のポリAテールとハイブリダイズする、オリゴdT配列であることができる。このプライミングにより、mRNA転写物を逆転写することが可能となる。ランダムフォワードプライマーは、逆転写cDNAの配列とハイブリダイズするランダムプライマー配列を有することができ、これにより、cDNAをプライミングすることが可能となる。様々な実施形態では、反応混合物(例えば、図1の反応混合物140)のプライマーは、定常フォワードプライマー及び定常リバースプライマーであることができる。定常フォワードプライマーは、cDNAのプライミングを可能にするランダムフォワードプライマーとハイブリダイズすることができる。定常リバースプライマーは、以前にmRNA転写物の逆転写を可能にした、PCRハンドルなどの逆定常領域の配列とハイブリダイズすることが可能である。
様々な実施形態では、反応混合物(例えば、図1の反応混合物140)に含まれるプライマーの代わりに、このようなプライマーは、バーコード(例えば、図1のバーコード145)の含まれることができるか、またはこれに結合することができる。特定の実施形態では、プライマーは、バーコードの末端に結合し、それ故、細胞溶解物中で、核酸の標的配列とハイブリダイズするのに利用可能である。
様々な実施形態では、反応混合物のプライマー、試薬のプライマー、またはバーコードのプライマーはエマルションに、1工程で、または2つ以上の工程で添加することができる。例えば、プライマーは、2工程以上、3工程以上、4工程以上または5工程以上で加えてよい。プライマーを1工程で加えるか、2工程以上で加えるかにかかわらず、プライマーは、溶解剤を加えた後、溶解剤を加える前、または溶解剤を加えるのと同時に加えてよい。溶解剤を加える前または加えた後にPCRプライマーを加える場合、反応混合物のプライマーは、(例えば、図1に示す2段階ワークフロープロセスで例示されるように)溶解剤の添加とは別個の工程で添加することができる。
標的核酸を増幅するためのプライマーセットは典型的には、標的核酸またはその相補体と相補的であるフォワードプライマー及びリバースプライマーを含む。いくつかの実施形態では、増幅は、1回の増幅反応において、複数の標的特異的プライマー対を用いて行うことができ、この場合、各プライマー対は、標的特異的なフォワードプライマー及び標的特異的なリバースプライマーを含み、それぞれ、試料中の対応する標的配列と実質的に相補的であるかまたは実質的に同一である配列を少なくとも1つ含み、各プライマー対は、対応する標的配列が異なる。したがって、本発明におけるある特定の方法を用いて、シングルセルの試料に由来する複数の標的配列を検出または識別する。
例示的なシステム及び/またはコンピュータの実施形態
図6は、図1~5に記載する実施形態に従い、細胞(複数可)でシングルセル分析を行い、予測された細胞軌道640を生成するための、シングルセルワークフロー装置620及び演算装置630を含む全体のシステム環境を示す。様々な実施形態では、シングルセルワークフロー装置620は、細胞封入160、検体放出165、細胞バーコード化170、標的増幅175、核酸プール205、及び配列決定210の工程を行うように構成される。様々な実施形態では、演算装置630は、リードアラインメント215及び細胞軌道測定220のコンピュータによる工程を行うように構成される。
様々な実施形態では、シングルセルワークフロー装置620は、少なくとも、細胞を試薬と共に封入し、細胞溶解物を反応混合物と封入し、核酸増幅反応を行うように構成される、マイクロフルイディクスデバイスを含む。例えば、マイクロフルイディクスデバイスは、流体連通している1つ以上の流体チャネルを含むことができる。したがって、第1のチャネルを通る水性流体と、第2のチャネルを通るキャリア流体とを組み合わせることにより、エマルションドロップレットの生成がもたらされる。様々な実施形態では、マイクロフルイディクスデバイスの流体チャネルは、ミリメートル以下のオーダー(例えば、約1ミリメートル以下)の、少なくとも1つの断面寸法を有することができる。マイクロチャネルのデザイン及び寸法についてのさらなる詳細は、これらそれぞれの全体が参照により本明細書に組み込まれている、国際特許出願第PCT/US2016/016444号、及び、米国特許第14/420,646号に記載されている。マイクロフルイディクスデバイスの一例は、Tapestri(商標)Platformである。
様々な実施形態では、シングルセルワークフロー装置620はまた、(a)対象装置及び/またはその中のドロップレットの、1つ以上の部分の温度を制御し、マイクロフルイディクスデバイス(複数可)に動作可能に接続されている、温度調節モジュール、(b)マイクロフルイディクスデバイス(複数可)に動作可能に接続されている、検出手段、即ち検出器、例えば光学撮像器、(c)マイクロフルイディクスデバイス(複数可)に動作可能に接続されている、インキュベーター、例えば細胞インキュベーター、ならびに、(d)マイクロフルイディクスデバイス(複数可)に動作可能に接続したシーケンサーのうちの1つ以上を含むことができる。1つ以上の温度及び/または圧力制御モジュールは、装置の1つ以上の流路内での、キャリア流体の温度及び/または圧力の制御をもたらす。一例として、温度調節モジュールは、核酸増幅を行うために温度を制御する、1つ以上の熱サイクラーであってよい。1つ以上の検出手段、即ち検出器、例えば光学撮像器は、1つ以上のドロップレットの存在、または、その特徴(その組成を含む)を検出するように構成される。いくつかの実施形態では、検出手段は、1つ以上の流路内で、1つ以上のドロップレットの1つ以上の構成成分を認識するように構成される。シーケンサーは、次世代配列決定などの配列決定を行うように構成された、ハードウェア装置である。シーケンサーの例としては、Illuminaのシーケンサー(例えば、MiniSeq(商標)、MiSeq(商標)、NextSeq(商標)550 Series、またはNextSeq(商標)2000)、Rocheの配列決定システム454、及び、Thermo Fisher Scientificのシーケンサー(例えば、Ion GeneStudio S5システム、Ion Torrent Genexusシステム)が挙げられる。
図7は、図1~6を参照して記載するシステム及び方法を実装するための、例示的な演算装置を示す。例えば、例示的な演算装置630は、リードアラインメント215及び細胞軌道測定220のコンピュータによる工程を行うように構成される。演算装置の例としては、パーソナルコンピュータ、デスクトップコンピュータ、ラップトップ、サーバーコンピュータ、クラスター内の演算ノード、メッセージプロセッサ、ハンドヘルドデバイス、マルチプロセッサシステム、マイクロプロセッサベースまたはプログラミング可能な消費者エレクトロニクス、ネットワークPC、ミニコンピュータ、メインフレームコンピュータ、携帯電話、PDA、タブレット、ポケベル、ルーター、スイッチなどを挙げることができる。
図7は、図1~5に示すシステム及び方法を実装するための、例示的な演算装置630を示す。いくつかの実施形態では、演算装置630は、チップセット704に結合した少なくとも1つのプロセッサ702を含む。チップセット704は、メモリコントローラハブ720、及び入力/出力(I/O)コントローラハブ722を含む。メモリ706およびグラフィックスアダプター712は、メモリコントローラハブ720に連結され、ディスプレイ718は、グラフィックスアダプター712に連結される。記憶装置708、入力インタフェース714、及びネットワークアダプター716が、I/Oコントローラハブ722に連結される。演算装置630の他の実施形態は、異なる構造を有する。
記憶装置708は、ハードドライブ、コンパクトディスクリードオンリーメモリ(CD-ROM)、DVD、またはソリッドステートメモリデバイス等の、非一時的コンピュータ可読記憶媒体である。メモリ706は、プロセッサ702によって使用される命令およびデータを保持する。入力インタフェース714は、タッチスクリーンインタフェース、マウス、トラックボール、または他の種類の入力インタフェース、キーボード、またはいくつかのこれらの組み合わせであり、データを演算装置630に入力するために使用する。いくつかの実施形態では、演算装置630は、入力インタフェース714から、ユーザのジェスチャを介して、入力(例えばコマンド)を受けるように構成されることができる。グラフィックスアダプター712は、ディスプレイ718に、イメージ及び他の情報を表示する。例えば、ディスプレイ718は、予測した細胞軌道の指標を示すことができる。ネットワークアダプター716は、演算装置630を1つ以上のコンピュータネットワークに結合する。
演算装置630は、本明細書に記載される機能性を提供するためのコンピュータプログラムモジュールを実行するように適合される。本明細書で使用される「モジュール」という用語は、指定された機能性を提供するために使用されるコンピュータプログラム論理を指す。したがって、モジュールは、ハードウェア、ファームウェア、及び/またはソフトウェアに実装することができる。一実施形態において、プログラムモジュールは、記憶装置708に記憶され、メモリ706にロードされ、プロセッサ702によって実行される。
演算装置630の種類は、本明細書に記載する実施形態毎で変化し得る。例えば、演算装置630は、グラフィックスアダプター712、入力インタフェース714、及びディスプレイ718などの、上述した構成要素のいくつかを欠く場合がある。いくつかの実施形態では、演算装置630は、メモリ706に格納された命令を実行するためのプロセッサ702を含むことができる。
シーケンスリードをアラインし、細胞軌道を測定する方法は、ハードウェアもしくはソフトウェア、またはこれらの組み合わせの中で実装することができる。一実施形態では、上述したものなどの、非一時的コンピュータ可読記憶媒体が提供され、当該媒体は、上記データを用いるための指示でプログラミングされた機械を用いる際に、本発明の細胞軌道のデータセット及び実行及び結果のいずれかを表示可能な、機械で読取り可能なデータでコードされた、データ格納マテリアルを含む。このようなデータは、患者の監視、処置の考慮などの、様々な目的のために使用することができる。上述した方法の実施形態を、プロセッサ、データ格納システム(揮発性及び不揮発性メモリ、ならびに/または格納要素を含む)、グラフィックスアダプター、入力インタフェース、ネットワークアダプター、少なくとも1つの入力装置、ならびに少なくとも1つの出力装置を含む、プログラミング可能なコンピュータ上で実行するコンピュータプログラムに実装することができる。ディスプレイを、グラフィックスアダプターに結合する。プログラムコードを入力データに適用し、上述した機能を実施し、出力情報を生成する。出力情報を、既知の様式で1つ以上の出力装置に適用する。コンピュータは例えば、従来のデザインのパーソナルコンピュータ、マイクロコンピュータ、または、ワークステーションであることができる。
各プログラムは、ハイレベルの手順またはオブジェクト指向プログラミング言語で実装して、コンピュータシステムと通信することができる。しかし、プログラムは、所望する場合、アセンブリまたは機械言語で実装することができる。いずれの場合も、言語はコンパイラ言語またはインタプリタ言語であることができる。このような各コンピュータプログラムは、ストレージ媒体または装置がコンピュータにより読み取られ、本明細書に記載する手順を実行するときに、コンピュータを構成して操作するために、汎用または特殊目的のプログラミング可能なコンピュータにより読み取り可能な、ストレージ媒体または装置(例えば、ROMまたは磁気ディスク)に格納されるのが好ましい。システムは、構成されたストレージ媒体が、コンピュータを特定かつ所定の様式で操作させ、本明細書に記載する機能を実施する場合に、コンピュータプログラムと共に構成される、コンピュータ読み取り可能なストレージ媒体として実装されるとみなされることもまた、可能である。
署名パターン及びそのデータベースを、様々な媒体で提供して、その使用を容易にすることができる。「媒体」とは、本発明の署名パターン情報を含有するマニュファクチャを意味する。本発明のデータベースは、コンピュータが読み取り可能な媒体、例えば、コンピュータにより読み取られ、直接アクセス可能な任意の媒体に記録することができる。このような媒体としては、フロッピーディスク、ハードディスクストレージ媒体、及び磁気テープなどの磁気記憶媒体;CD-ROMなどの光学記憶媒体;RAM及びROMなどの電気記憶媒体;ならびに、磁気/光学記憶媒体などの、これらのカテゴリーのハイブリッドが挙げられるが、これらに限定されない。当業者は、現在知られているコンピュータで読み取り可能な媒体のいずれかを使用して、本データベース情報を記録することを含むマニュファクチャを作製する方法を速やかに理解することができる。「記録された」とは、当技術分野において既知の任意のこのような方法を使用して、コンピュータで読み取り可能な媒体に情報を格納するプロセスを意味する。格納した情報にアクセスするために使用する手段に基づき、任意の従来のデータ格納構造体を選択することができる。様々なデータプロセッサプログラム及びフォーマット、例えば、ワープロテキストファイル、データベースフォーマットなどを、格納のために使用することができる。
例示的なキットの実施形態
個々の細胞、または細胞の集団の、RNA転写産物及びDNA(例えば、クロマチンがアクセス可能なDNA)を分析するためのキットもまた、本明細書で提供する。キットは、以下のうちの1つ以上を含むことができる:エマルションを形成するための流体(例えば、キャリア相、水相)、バーコード化ビーズ、シングルセルを処理するためのマイクロフルイディクスデバイス、細胞を溶解し、細胞検体を放出するための試薬、核酸増幅反応を行うための反応混合物、及び、本明細書に記載の方法に対応するキット成分のうちのいずれかを使用するための取扱説明書。
実施例1:イントロン領域のDNAアンプリコン-オリゴdTプライミング
Tapestri(商標)を用いる、図1に示すワークフロープロセスを使用して、K-562細胞を処理した。具体的には、シングルセルを、試薬と共に、エマルションに分画した。試薬は、プロテアーゼ(例えば、プロテイナーゼK)も、トランスポザーゼ(例えば、トランスポザーゼTn5)も含まない。試薬は、SSIV RT、5X SSIV緩衝液、10mMのdNTP、100mMのDTT、リボヌクレアーゼ阻害剤、50uMのオリゴdT、NP-40、及びdH2Oを含んだ。試薬中の0.1%のNP40が、シングルセルの、エマルションへの溶解を引き起こす。封入ドロップレットを含有するチューブを55℃で10分間、次いで80℃で10分間インキュベートした。シシングルセルのRNA及びパッケージ化DNAを、図4A及び4Bに記載するプロセスに従い処理した。具体的には、第1のエマルション内で、シングルセル由来のRNA転写産物を、オリゴdTプライマーを使用してプライミングし、逆転写酵素を使用して生成した。
cDNA及びパッケージ化DNAを含む細胞溶解物を次に、反応混合物及びバーコード化ビーズと共に(ビーズに解放可能に結合した、100万個にわたるバーコードと共に)、第2のエマルションに封入した。反応混合物は、対象となる遺伝子を標的にする、(PCRハンドルが付いた)フォワード及びリバースプライマーを含む。フォワードプライマーを表1に示す。リバースプライマーを表2に示す。
パッケージ化DNA及びcDNA内のクロマチンがアクセス可能なDNAをプライミングする。核酸増幅を行い、RNA転写産物及びクロマチンがアクセス可能なDNAに由来する増幅核酸を生成した。
増幅核酸をチューブ(例えば、PCRチューブまたはエッペンドルフチューブ)にプールし、エマルションを破壊した。増幅核酸は、P5及びP7配列アダプターを添加することにより、ライブラリー調製を受けた。核酸を配列決定し、シーケンスリードを得た。一般的なバーコードに従ってシーケンスリードをクラスター化し、参照ゲノムにアラインした。
クロマチンがアクセス可能なDNAがプライミングされ増幅したことを確認するために、参照ゲノムで既知の、DNAのイントロン領域を分析し、イントロン領域に対応するシーケンスリードが増幅され配列決定されたか否かを分析した。
図8Aは、K-562細胞のオリゴdTプライミングにより入手したイントロン領域において、リードにより観察されたDNAアンプリコンのサイズを示し、プロテイナーゼK及びトランスポザーゼ(Tn5)は封入の間に使用しなかった。特に、イントロンリードは、100~500塩基対、500~100塩基対、1000~1500塩基対、及びさらに、1500塩基対を超える長さを含む、様々な長さにて存在した。このことは、これらのイントロンリードが存在する、対応する遺伝子が、転写のためにアクセス可能であり利用可能である可能性が高いことを示している。逆に、いくつかのイントロンリードは観察されなかった。このことは、これらのイントロンリードが存在しない、対応する遺伝子が、転写のためにアクセス不可能で利用不可能であることを示している。
図8B及び図8Cは、参照ゲノムに対してアラインされた(それぞれ、CCL2遺伝子及びHLA-C遺伝子に対してアラインされた)シーケンスリードの、一体化されたゲノムビューワー(IGV)スクリーンショットを示す。図8B及び図8Cにおいて、多数の対形成したリード(例えば、フォワード及びリバースリード)が、CCL2及びHLA-Cのイントロン領域とアラインされる。したがって、CCL2及びHLA-Cのイントロン領域中にこれらのシーケンスリードが存在することは、CCL2及びHLA-Cの遺伝子が、転写のためにアクセス可能であり利用可能であることを示している。
全てを合わせると、図8A~8Cの結果は、シングルセル分析プロセスにより入手したシーケンスリードが、イントロン領域とアラインされることを示す。このことは、クロマチンがアクセス可能なDNAは、パッケージ化状態にあるときに、上手くアクセスされ、プライミングされ、増幅され、配列決定されたことを示している。
実施例2:イントロン領域のDNAアンプリコン-遺伝子の特異的プライミング
Tapestri(商標)を用いる、図1に示すワークフロープロセスを使用して、MC7細胞を処理した。具体的には、シングルセルを、試薬と共に、エマルションに分画した。試薬は、プロテアーゼ(例えば、プロテイナーゼK)も、トランスポザーゼ(例えば、トランスポザーゼTn5)も含まない。試薬は、SSIV RT、5X SSIV緩衝液、10mMのdNTP、100mMのDTT、リボヌクレアーゼ阻害剤、リバースプライマー(34重)、NP-40、及びdH2Oを含んだ。試薬中の0.1%のNP40が、シングルセルの、エマルションへの溶解を引き起こす。封入ドロップレットを含有するチューブを50℃で10分間、次いで80℃で10分間インキュベートした。シングルセルのRNA及びパッケージ化DNAを、図4A及び4Bに記載するプロセスに従い処理した。具体的には、第1のエマルション内で、シングルセル由来のRNA転写産物を、リバースプライマーを使用してプライミングし、逆転写酵素を使用して生成した。リバースプライマーを表3に示す。
cDNA及びパッケージ化DNAを含む細胞溶解物を次に、反応混合物及びバーコード化ビーズと共に(ビーズに解放可能に結合した、100万個にわたるバーコードと共に)、第2のエマルションに封入した。反応混合物は、対象となる遺伝子を標的とするフォワードプライマーを含む。フォワードプライマーを下表4に示す。
パッケージ化DNA及びcDNA内のクロマチンがアクセス可能なDNAをプライミングする。核酸増幅を行い、RNA転写産物及びクロマチンがアクセス可能なDNAに由来する増幅核酸を生成した。
増幅核酸をエッペンドルフチューブにプールし、エマルションを破壊した。増幅核酸は、P5及びP7配列アダプターを添加することにより、ライブラリー調製を受けた。核酸を配列決定し、シーケンスリードを得た。一般的なバーコードに従ってシーケンスリードをクラスター化し、参照ゲノムにアラインした。
クロマチンがアクセス可能なDNAがプライミングされ増幅したことを確認するために、参照ゲノムで既知の、DNAのイントロン領域を分析し、イントロン領域に対応するシーケンスリードが増幅され配列決定されたか否かを分析した。
図9Aは、MCF7細胞の遺伝子特異的プライミングにより入手したイントロン領域において、リードにより観察されたDNAアンプリコンのサイズを示し、プロテイナーゼK及びトランスポザーゼ(Tn5)は封入の間に使用しなかった。特に、イントロンリードは、100~500塩基対、及び500~100塩基対を含む、様々な長さにて存在した。このことは、これらのイントロンリードが存在する、対応する遺伝子が、転写のためにアクセス可能であり入手可能である可能性が高いことを示している。逆に、いくつかのイントロンリードは観察されなかった。このことは、これらのイントロンリードが存在しない、対応する遺伝子が、転写のためにアクセス不可能で利用不可能であることを示している。
図9B及び9Cは、参照ゲノムに対してアラインされた(それぞれ、VIM遺伝子及びMKI67遺伝子に対してアラインされた)シーケンスリードの、一体化されたゲノムビューワー(IGV)スクリーンショットを示す。図9B及び9Cに示すように、リードは、VIM遺伝子及びMK167遺伝子のイントロン領域で観察され、このことは、遺伝子が、転写のためにアクセス可能であり利用可能であることを示している。
様々な実施形態では、複数の核酸は、イントロンDNA領域に対応するパッケージ化DNA内に、クロマチンがアクセス可能なDNAの他のセグメントに由来する核酸をさらに含む。様々な実施形態では、イントロンDNA領域に対応するパッケージ化DNAの、他のクロマチンがアクセス可能なDNAに由来する核酸の少なくとも50%は、長さが100~500塩基対である。
[本発明1001]
細胞の細胞軌道を予測するための方法であって、
試薬を含むエマルションに細胞を封入することであって、前記細胞が、少なくとも1つのRNA分子と、クロマチンがアクセス可能なDNAのセグメントを含むパッケージ化DNAとを含む、前記封入することと、
前記細胞を前記エマルション内に溶解することであって、それにより前記RNA及び前記パッケージ化DNAを前記試薬に曝露し、前記試薬が、0.50mg/mL未満のプロテアーゼ、及び2.5%(v/v)未満のトランスポザーゼを含む、前記溶解することと、
少なくとも1つのcDNA分子を、前記少なくとも1つのRNAを使用して生成することと、
前記少なくとも1つのcDNA分子、前記パッケージ化DNA、及び反応混合物を、第2のエマルションに封入することと、
複数の核酸を生成するために、核酸増幅反応を、前記反応混合物を使用して前記第2のエマルション内で行うことであって、前記複数の核酸が、
前記少なくとも1つのcDNA分子のうちの1つに由来する第1の核酸、及び
前記パッケージ化DNAの前記クロマチンがアクセス可能なDNAのセグメントに由来する第2の核酸
を含む、前記行うことと、
前記第1の核酸及び前記第2の核酸を配列決定することと
を含む、前記方法。
[本発明1002]
前記試薬が、0.10mg/mL未満のプロテアーゼを含む、本発明1001の方法。
[本発明1003]
前記試薬が、0.01mg/mL未満のプロテアーゼを含む、本発明1001の方法。
[本発明1004]
前記試薬がプロテアーゼを含まない、本発明1001の方法。
[本発明1005]
前記試薬が、0.1%(v/v)未満のトランスポザーゼを含む、本発明1001~1004のいずれかの方法。
[本発明1006]
前記試薬が、0.01%(v/v)未満のトランスポザーゼを含む、本発明1001~1004のいずれかの方法。
[本発明1007]
前記試薬がトランスポザーゼを含まない、本発明1001~1004のいずれかの方法。
[本発明1008]
前記複数の核酸を生成するために、前記核酸増幅反応を、前記反応混合物を使用して前記第2のエマルション内で行うことが、
前記クロマチンがアクセス可能なDNAの前記セグメントを前記パッケージ化DNA内でプライミングすることと、
前記クロマチンがアクセス可能なDNAの前記プライミングしたセグメントから、伸長生成物を生成することと
を含む、本発明1001~1007のいずれかの方法。
[本発明1009]
前記エマルション内で、前記パッケージ化DNA内の前記クロマチンがアクセス可能なDNAのセグメントから伸長生成物を生成することをさらに含み、
前記少なくとも1つのcDNA分子、前記パッケージ化DNA、及び反応混合物を、前記第2のエマルションに封入することが、前記伸長生成物を前記第2のエマルションに封入することをさらに含む、
本発明1001~1008のいずれかの方法。
[本発明1010]
前記パッケージ化DNA内の前記クロマチンがアクセス可能なDNAのセグメントから前記伸長生成物を生成することが、
第1のエマルションを40℃~60℃の温度に曝露することにより、前記クロマチンがアクセス可能なDNAの前記セグメントを脱安定化させること
を含む、本発明1009の方法。
[本発明1011]
前記試薬が逆転写酵素を含む、本発明1001~1010のいずれかの方法。
[本発明1012]
前記試薬がNP-40を含む、本発明1001~1011のいずれかの方法。
[本発明1013]
前記配列決定した第1の核酸及び前記配列決定した第2の核酸を使用して、前記細胞軌道を予測することをさらに含む、本発明1001~1012のいずれかの方法。
[本発明1014]
前記細胞軌道を予測することが、少なくとも、前記配列決定した第1の核酸及び前記配列決定した第2の核酸を使用して、前記細胞の2つの異なる状態を測定することを含む、本発明1013の方法。
[本発明1015]
前記配列決定した第1の核酸を使用して、前記細胞の以前の状態を測定し、前記配列決定した第2の核酸を使用して、前記細胞の将来の状態を測定する、本発明1014の方法。
[本発明1016]
前記少なくとも1つのRNAが、1つのクロマチンがアクセス可能なDNAを含むDNA領域から以前に転写され、それにより、前記細胞の前記以前の状態と前記将来の状態との間での共通性が示される、本発明1015の方法。
[本発明1017]
前記少なくとも1つのRNAが、クロマチンがアクセス不可能なDNAに対応するDNA領域から転写され、それにより、前記細胞の前記以前の状態から、前記細胞の前記将来の状態への変化が示される、本発明1015の方法。
[本発明1018]
前記細胞軌道が、細胞系統、細胞運命、前記細胞の将来の状態における細胞機能、不健康な前記細胞の将来の状態、または外部刺激に対する将来の細胞応答のうちのいずれか1つである、本発明1001~1017のいずれかの方法。
[本発明1019]
前記第2のエマルションに、第1のバーコード及び第2のバーコードを、前記少なくとも1つのcDNA、少なくとも1つのクロマチンがアクセス可能なDNA、及び前記反応混合物と共に封入すること
をさらに含む、本発明1001~1018のいずれかの方法。
[本発明1020]
前記第1の核酸が前記第1のバーコードを含む、本発明1019の方法。
[本発明1021]
前記第2の核酸が前記第2のバーコードを含む、本発明1019または1020の方法。
[本発明1022]
前記第1のバーコード及び前記第2のバーコードが同じバーコード配列を共有する、本発明1019~1021のいずれかの方法。
[本発明1023]
前記第1のバーコード及び前記第2のバーコードが異なるバーコード配列を共有する、本発明1019~1021のいずれかの方法。
[本発明1024]
前記第1のバーコード及び前記第2のバーコードが、前記第2のエマルション内でビーズに解放可能に付着している、本発明1019~1023のいずれかの方法。
[本発明1025]
前記少なくとも1つのRNAを逆転写することが、前記第1のエマルション内で生じる、本発明1001~1024のいずれかの方法。
[本発明1026]
前記核酸増幅反応がポリメラーゼ連鎖反応である、本発明1001~1025のいずれかの方法。
[本発明1027]
前記複数の核酸が、イントロンDNA領域に対応する前記パッケージ化DNA内に、クロマチンがアクセス可能なDNAの他のセグメントに由来する核酸をさらに含む、本発明1001~1026のいずれかの方法。
[本発明1028]
前記イントロンDNA領域に対応する前記パッケージ化DNAの、他のクロマチンがアクセス可能なDNAに由来する前記核酸の少なくとも50%が、長さが100~500塩基対である、本発明1027の方法。
[本発明1029]
試薬を含むエマルションに細胞を封入することであって、前記細胞が、少なくとも1つのRNA分子と、クロマチンがアクセス可能なDNAのセグメントを含むパッケージ化DNAとを含む、前記封入することと、
前記細胞を前記エマルションに溶解することであって、それにより前記RNA及び前記パッケージ化DNAを前記試薬に曝露し、前記試薬が、0.50mg/mL未満のプロテアーゼ、及び2.5%(v/v)未満のトランスポザーゼを含む、前記溶解することと、
前記少なくとも1つのRNAを逆転写することにより、少なくとも1つのcDNA分子を生成することと、
前記少なくとも1つのcDNA分子、前記パッケージ化DNA、及び試薬を、第2のエマルション内に封入することと、
複数の核酸を生成するために、前記第2のエマルション内でPCR反応を行うことであって、前記複数の核酸が、
前記少なくとも1つのcDNA分子のうちの1つに由来する第1の核酸、及び
前記パッケージ化DNAの前記クロマチンがアクセス可能なDNAのセグメントに由来する第2の核酸
を含む、前記行うことと、
前記第1の核酸及び前記第2の核酸を配列決定することと
を行うように構成された装置
を含む、システム。
[本発明1030]
前記装置と通信可能に連結した演算装置であって、前記配列決定した第1の核酸及び前記配列決定した第2の核酸を使用することにより、細胞軌道を予測するように構成されている、前記演算装置
をさらに含む、本発明1029のシステム。
[本発明1031]
前記試薬が、0.10mg/mL未満のプロテアーゼを含む、本発明1029または1030のシステム。
[本発明1032]
前記試薬が、0.01mg/mL未満のプロテアーゼを含む、本発明1029または1030のシステム。
[本発明1033]
前記試薬がプロテアーゼを含まない、本発明1029または1030のシステム。
[本発明1034]
前記試薬が、0.1%(v/v)未満のトランスポザーゼを含む、本発明1029~1033のいずれかのシステム。
[本発明1035]
前記試薬が、0.01%(v/v)未満のトランスポザーゼを含む、本発明1029~1033のいずれかのシステム。
[本発明1036]
前記試薬がトランスポザーゼを含まない、本発明1029~1033のいずれかのシステム。
[本発明1037]
前記複数の核酸を生成するために、前記核酸増幅反応を、前記反応混合物を使用して前記第2のエマルション内で行うことが、
前記クロマチンがアクセス可能なDNAの前記セグメントを前記パッケージ化DNA内でプライミングすることと、
前記クロマチンがアクセス可能なDNAの前記プライミングしたセグメントから、伸長生成物を生成することと
を含む、本発明1029~1036のいずれかのシステム。
[本発明1038]
前記エマルション内で、前記パッケージ化DNA内の前記クロマチンがアクセス可能なDNAのセグメントから伸長生成物を生成することをさらに含み、
前記少なくとも1つのcDNA分子、前記パッケージ化DNA、及び反応混合物を、前記第2のエマルションに封入することが、前記伸長生成物を前記第2のエマルションに封入することをさらに含む、
本発明1029~1037のいずれかのシステム。
[本発明1039]
前記パッケージ化DNA内の前記クロマチンがアクセス可能なDNAのセグメントから前記伸長生成物を生成することが、
第1のエマルションを40℃~60℃の温度に曝露することにより、前記クロマチンがアクセス可能なDNAの前記セグメントを脱安定化させること
を含む、本発明1038のシステム。
[本発明1040]
前記試薬が逆転写酵素を含む、本発明1029~1039のいずれかのシステム。
[本発明1041]
前記試薬がNP-40を含む、本発明1029~1040のいずれかのシステム。
[本発明1042]
前記細胞軌道を予測することが、少なくとも、前記配列決定した第1の核酸及び前記配列決定した第2の核酸を使用して、前記細胞の2つの異なる状態を測定することを含む、本発明1030~1041のいずれかのシステム。
[本発明1043]
前記配列決定した第1の核酸を使用して、前記細胞の以前の状態を測定し、前記配列決定した第2の核酸を使用して、前記細胞の将来の状態を測定する、本発明1042のシステム。
[本発明1044]
前記少なくとも1つのRNAが、1つのクロマチンがアクセス可能なDNAを含むDNA領域から以前に転写され、それにより、前記細胞の前記以前の状態と前記将来の状態との間での共通性が示される、本発明1042または1043のシステム。
[本発明1045]
前記少なくとも1つのRNAが、クロマチンがアクセス不可能なDNAに対応するDNA領域から転写され、それにより、前記細胞の前記以前の状態から、前記細胞の前記将来の状態への変化が示される、本発明1042または1043のシステム。
[本発明1046]
前記細胞軌道が、細胞系統、細胞運命、前記細胞の将来の状態における細胞機能、不健康な前記細胞の将来の状態、または外部刺激に対する将来の細胞応答のうちのいずれか1つである、本発明1030~1045のいずれかのシステム。
[本発明1047]
前記第2のエマルションに、第1のバーコード及び第2のバーコードを、前記少なくとも1つのcDNA、少なくとも1つのクロマチンがアクセス可能なDNA、及び前記反応混合物と共に封入するように、前記装置がさらに構成される、本発明1029~1046のいずれかのシステム。
[本発明1048]
前記第1の核酸が前記第1のバーコードを含む、本発明1047のシステム。
[本発明1049]
前記第2の核酸が前記第2のバーコードを含む、本発明1047または1048のシステム。
[本発明1050]
前記第1のバーコード及び前記第2のバーコードが同じバーコード配列を共有する、本発明1047~1049のいずれかのシステム。
[本発明1051]
前記第1のバーコード及び前記第2のバーコードが異なるバーコード配列を共有する、本発明1047~1049のいずれかのシステム。
[本発明1052]
前記第1のバーコード及び前記第2のバーコードが、前記第2のエマルション内でビーズに解放可能に付着している、本発明1047~1051のいずれかのシステム。
[本発明1053]
前記少なくとも1つのRNAを逆転写することが、前記第1のエマルション内で生じる、本発明1029~1052のいずれかのシステム。
[本発明1054]
前記核酸増幅反応がポリメラーゼ連鎖反応である、本発明1029~1053のいずれかのシステム。
[本発明1055]
前記複数の核酸が、イントロンDNA領域に対応する前記パッケージ化DNA内に、クロマチンがアクセス可能なDNAの他のセグメントに由来する核酸をさらに含む、本発明1029~1054のいずれかのシステム。
[本発明1056]
前記イントロンDNA領域に対応する前記パッケージ化DNAの、他のクロマチンがアクセス可能なDNAに由来する前記核酸の少なくとも50%が、長さが100~500塩基対である、本発明1055のシステム。