1.概観
本明細書で記載される発明は、ncRNAが核空間における後成的制御の役割を有するならば、それはクロマチン状態および標的遺伝子活性の調節に関する機能が発揮される染色体中の特定の位置においてクロマチンと直接または間接的にのどちらかで相互作用しなければならないであろうという認識に部分的に基づいている。従って、本明細書で記載される発明は、ncRNA−クロマチン相互作用を、RNA−DNAライゲーション、続いてペアエンドタグ配列決定(RICh−PET)により全体的にマッピングするための新規のアプローチを提供する。
簡潔には、本明細書で記載される組成物は、3つの主な部分を含む方法で用いられることができる:1)生きた細胞(例えばインビトロで培養された細胞、または組織試料から得られた一次細胞)におけるRNA、DNAおよびタンパク質間の(好ましくは全ての)分子相互作用事象を捕捉するためのクロマチン架橋;2)係留された相互作用しているRNAおよびクロマチンDNA断片の(例えば特異的に設計されたリンカー、例えばRNAリンカーおよびDNAリンカー対による、またはRNAの3’末端の5’アデニル化されたssDNAもしくは5’アデニル化されたオーバーハングへのライゲーションによる)ライゲーション;ならびに、3)ゲノム中のncRNAの転写部位およびそれらのクロマチン標的部位の位置を決定するための、RNA−DNAライゲーション産物またはそれに由来するタグ配列(例えばPETポリヌクレオチド)の配列決定およびマッピング分析。
従って、本発明の一側面は、ゲノムの非コードRNA(ncRNA)に関するゲノム内の機能的相互作用座位を同定する方法を提供し、その方法は、以下の工程を含む:(1)架橋されたゲノムDNA断片および架橋されたncRNA(またはその断片)を含むクロマチン断片を提供し;(2)架橋されたゲノムDNA断片の末端を、架橋されたncRNAの末端に、近接ライゲーションに関する条件下でライゲーションし;(3)ペアエンドタグ(PET)ポリヌクレオチドを配列決定分析のために単離し、ここでそのPETポリヌクレオチドは、非コードRNA(ncRNA)の配列タグおよびゲノムDNAの配列タグを含み;そして(4)ゲノムDNAの配列タグおよびncRNAの配列タグを、参照ゲノムに対してマッピングし、それにより参照ゲノムの非コードRNA(ncRNA)に関する参照ゲノム内の機能的相互作用座位を同定する。
このRNA−DNAライゲーションアプローチは、全てのncRNA−クロマチン相互作用の全体的な研究に適用されるだけでなく、特定のクロマチン位置におけるRNA−タンパク質相互作用の研究にも適用されることができる。従って、染色体免疫沈降(ChIP)に基づくRICh−PET法は、RNA−タンパク質−クロマチン相互作用情報の追加の特異性を提供することができるであろう。
本発明の試薬および方法は、研究、開発、薬物標的同定、薬物スクリーニング、診断、処置/有効性モニタリング、予後推定等における広い範囲の使用の可能性を有する。例えば、本発明の試薬および方法は、多数の確立された細胞株、幹細胞、iPS細胞、および一次組織からの細胞、例えば癌および健康な組織対照由来の細胞に関するncRNA−クロマチン相互作用を包括的に特性付けるために;そしてゲノムの出力の制御におけるRNA機能の限りなく複雑な世界を調べる我々の能力を著しく増大させるために用いられることができる。RNA−クロマチンインタラクトームの特性付けの完了の成功は、ncRNA種の(全てではないにしても)ほとんどに関する包括的なクロマチンアドレス帳を提供すると考えられ、それは、どのようにゲノムが健康な状態および疾患状態において機能しているかを理解するのを助けるためのゲノム情報の別の次元を加えるであろう。
本発明のいくつかの特定の態様が、下記でより詳細に記載される。
a)RNAリンカーおよびDNAリンカーの対
第1の特定の態様において、本発明の方法は、同じクロマチン断片中の架橋されたRNAおよび染色体DNAをライゲーションするために、RNAリンカーおよびDNAリンカーの対を用いて実施されることができる。
従って、本発明の一側面は、以下のものを含むキットを提供する:(1)(i)第1ポリヌクレオチドおよび(ii)第2ポリヌクレオチドを含むRNAリンカー、ここで、第1および第2ポリヌクレオチドは、第1ライゲーション適合末端および第1ポリヌクレオチドの3’末端の3’オーバーハングにより隣接される第1二本鎖領域を形成しており、ここで、3’オーバーハングは、ランダム配列プライマーを含む;ならびに(2)(iii)第3ポリヌクレオチドおよび(iv)第4ポリヌクレオチドを含むDNAリンカー、ここで第3および第4ポリヌクレオチドは、平滑末端および第2ライゲーション適合末端により隣接される第2二本鎖領域を形成し、ここで、第1および第2ライゲーション適合末端は、互いにライゲーションし、または互いにライゲーションするように適合可能である。
特定の態様において、第1ライゲーション適合末端は、第2ポリヌクレオチドの3’末端における3’オーバーハングであり、第2ライゲーション適合末端は、第3ポリヌクレオチドの3’末端における3’オーバーハングであり、ここで両方の3’オーバーハングは、ライゲーションのために互いにアニーリングする。
特定の態様において、第1ライゲーション適合末端は、第1ポリヌクレオチドの5’末端における5’オーバーハングであり、第2ライゲーション適合末端は、第4ポリヌクレオチドの5’末端における5’オーバーハングであり、ここで両方の5’オーバーハングは、ライゲーションのために互いにアニーリングする。
特定の態様において、第1および/または第2ライゲーション適合末端は、ライゲーションに適合可能である。例えば、ライゲーションのための必須の3’または5’オーバーハングを有する代わりに、第1および/または第2ライゲーション適合末端は、制限酵素(RE)部位を含むことができ、それは、REにより切断されてライゲーションに必要な必須の3’または5’オーバーハングを生成することができる。しかし、制限酵素による切断の前に、ライゲーション適合末端は、平滑末端化されることができ(例えば自己ライゲーションを防ぐための脱リン酸化された平滑末端)、または自己ライゲーションもしくは他のライゲーション適合末端とのライゲーションを防ぐ非適合性オーバーハングを有することもできる。
特定の態様において、適合性ライゲーション末端における2個の5’または3’オーバーハングは、自己アニーリングせず、かつ互いとアニーリングしない。これは、例えば、そのオーバーハングの配列を、そのオーバーハングの配列が、少なくともリンカーが用いられるべき条件下の場合に自己アニーリングも互いとのアニーリングもしないように設計することにより成し遂げられ得る。
この設計は、例えば下流の工程がPCR増幅を含む特定の態様において有利であり得る。ある頻繁に観察されるタイプの非特異的増幅産物は、“プライマーダイマー”と呼ばれる増幅反応の鋳型非依存性の人為産物であり、それは二本鎖断片であり、その長さは典型的には2つのプライマーの長さの和に近く、1つのプライマーが他方のプライマーの上で伸長された際に生じる。結果として生じる伸長産物は、その短い長さのために効率的に増幅される望ましくない鋳型を形成する。
第1、第2、第3、および第4ポリヌクレオチドのそれぞれは、別々の容器中で、例えば合成されたポリヌクレオチドとして提供されることができ、それは凍結乾燥された(freeze dried,lyophilized)形態または水もしくは適切な緩衝溶液中のどちらでもよい。あるいは、第1および第2ポリヌクレオチドは、同じ容器中(凍結乾燥状態または溶液中)で、例えば1:1のモル比で、それらが予めアニーリングされたRNAリンカーとして用いられることができるように、組み合わせられることができる。同様に、第3および第4ポリヌクレオチドは、同じ容器中(凍結乾燥状態または溶液中)で、例えば1:1のモル比で、それらが予めアニーリングされたDNAリンカーとして用いられることができるように、組み合わせられることができる。
第2、第3、および第4ポリヌクレオチドは、実質的に均質または純粋であり(例えば、同じ容器内の個々のポリヌクレオチド分子は、同じである)、一方で、3’オーバーハング領域中の第1ポリヌクレオチドの3’末端は、ランダム配列プライマーを含む(例えば、同じ容器内の個々の第1ポリヌクレオチド分子は、それぞれが3’オーバーハング領域内で異なるランダム配列プライマーを有し得ることを除いて、同じである)。従って、第1ポリヌクレオチドは、それが実際には個々のポリヌクレオチドのランダム配列プライマー領域においてのみ異なるポリヌクレオチドの混合物である点で独特であり得る。
しかし、関連する態様において、定められた3’末端配列を有する特定のncRNAが対象となる場合、本発明の第1ポリヌクレオチドは、その定められた3’末端配列を有する特定のncRNAから特異的に第1鎖cDNA合成を開始するために、ランダム配列プライマー領域において同じマッチする配列を均質に含有していることができる。
ランダム配列プライマーは、一般に、非コードRNAの3’末端から第1鎖cDNA合成を方向付けることができるように、十分な長さ(例えばヘキサマー)を有する。ヘキサマーのランダム配列が用いられることができるが、他の長さ、例えば4、5、7、8、9、10、11、12のランダム配列のプライマーが用いられることもできる。
特定の態様において、ランダム配列プライマーのほとんどの3’末端は、デオキシチミジン(T)もしくはウリジン(U)、またはmRNAのポリA尾部中のアデニン(A)と塩基対合することができる他のヌクレオチド類似体ではない。そのような設計は、mRNAのポリA尾部からの逆転写を避けるのをさらに助けることができる。
第2および第3ポリヌクレオチドの3’末端の5’または3’オーバーハング(第1および第2ライゲーション適合末端)は、それらが互いにアニーリングするように相補的であるように設計されている。第2および第3ポリヌクレオチド中のオーバーハング領域の長さは、同じであることができるが、同じである必要はない。特定の態様において、両方のポリヌクレオチドのオーバーハング領域中の約2、3、4、5、6、7、8個、またはより多くのヌクレオチドは、相補的であり、塩基対(ワトソン−クリックまたはゆらぎ塩基対)を形成することができる。
特定の態様において、RNAリンカー上の第1二本鎖領域の長さは、約6、7、8、9、10、15、20、25、30、35、40、50、60塩基対、またはより多くの塩基対である。
特定の態様において、DNAリンカー上の第2二本鎖領域の長さは、約6、7、8、9、10、15、20、25、30、35、40、50、60塩基対、またはより多くの塩基対である。
特定の態様において、ライゲーションされたRNA−DNAリンカー中の第1および第2二本鎖領域の合計の長さは、約10、15、20、25、30、35、40、45、50、55、60、65、70、75、80塩基対、またはより多くの塩基対である。
特定の態様において、第1二本鎖領域は、第1制限酵素、例えばII型制限酵素(RE)に関する第1認識部位を含むことができる。RE認識部位は、REが切断する際に、それがRE部位の外側、ランダム配列プライマーに対して3’側を切断するように、戦略的に配置されることができる。これは、RNAリンカーに連結されたRNAタグの生成を可能にする。例えば、MmeI認識部位は、第1二本鎖領域の末端に、第1二本鎖領域の他方の末端(そこでRNAリンカーおよびDNAリンカーが、それらのそれぞれの3’オーバーハング領域を介して連結されている)に対して遠位に配置されることができる。MmeI部位は、MmeIが切断する際に、2bpのオーバーハングを有する18bpの断片を含むRNAタグが、連結されたncRNA由来のcDNAにおいて生成されるような方向性であるように設計される。しかし、RE部位の配置は、第1二本鎖領域の末端である必要はない。より内側の配置は、対応してより短いRNAタグ配列を生成する。
特定の態様において、(第1(II型)制限酵素に関する)第1認識部位の最後のヌクレオチドは、ランダム配列プライマーに対して5’側の最後の塩基対合したヌクレオチドである。
同様に、特定の態様において、第2二本鎖領域は、第2制限酵素、例えばII型制限酵素(RE)に関する第2認識部位を含むことができ、それは、第2RE認識部位に対して3’側であり第3ポリヌクレオチドに対して5’側を切断することができる。RE認識部位の方向性は、それが連結されたゲノムDNAの末端配列に基づくDNAタグを生成するような様式で配置される。特定の態様において、RE部位の配置は、第2二本鎖領域の末端である必要はない。より内部の配置は、対応してより短いDNAタグ配列を生成する。
特定の態様において、(第2(II型)制限酵素に関する)第2認識部位の最後のヌクレオチドは、平滑末端における塩基対合したヌクレオチドである。
特定の態様において、第1および第2(II型)制限酵素は同じである。他の態様において、第1および第2(II型)制限酵素は異なる。
比較的長いタグ配列を生成するRE、例えばI型またはIII型REに関して、第1および第2RE認識配列の方向性は、RNAリンカー中のRE部位がDNAタグの生成を方向付け、一方でDNAリンカー中のRE部位がRNAタグの生成を方向付けるように、逆転することができる。
2つの認識部位を認識するRE(例えばIIB型RE)に関して、RNAおよびDNAリンカーが設計されたように正しくライゲーションされて完全なRE認識部位を再構成した場合にのみREが切断するように、RE部位の一方がRNAリンカー中にあることができ、他方がDNAリンカー中にあることができる。
本発明に従って用いられることができる適切な制限酵素は、下記でより詳細に記載される。特定の態様において、第1または第2制限酵素に関する切断部位は、認識部位の最後のヌクレオチドに対して少なくとも約10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30ヌクレオチドまたはより多くのヌクレオチド3’側である。
特定の態様において、RNAリンカー、DNAリンカー、または両方は、RNAタグまたはDNAタグを生成するための制限酵素認識部位を有しない。
特定の態様において、第1、第2、第3、および第4ポリヌクレオチドの1つ以上は、DNAであり(例えば全てがDNAであり)、またはDNAおよびRNAヌクレオチドの両方を含む。他の態様において、それらの全てがRNAであることができる。
特定の態様において、第1、第2、第3、および第4ポリヌクレオチドの1つ以上は、修飾ヌクレオチドを含むことができる。修飾ヌクレオチドは、5’末端、3’末端に、および/または内部の位置にあることができる。
特定の態様において、修飾ヌクレオチドは、ビオチン化されたヌクレオチド、例えばビオチン化されたdT(デオキシチミジン)である。ビオチン化されたヌクレオチドの存在は、そのようなビオチン化されたヌクレオチドの1個以上を含むポリヌクレオチドの、例えばビオチン結合パートナー、例えばアビジンまたはストレプトアビジンにコンジュゲートした樹脂、アガロース、ナノ粒子、金属または磁性ビーズを用いることによる親和性精製を可能にする。次いで、そのようなビーズは、磁石により分離されることができる。ビオチン化されたヌクレオチドは、RNAリンカー、DNAリンカー、または両方の中に存在することができる。この技法は、高スループット次世代配列決定、例えば単分子リアルタイム配列決定(Pacific Bio);イオン半導体(Ion Torrent配列決定);パイロ配列決定(pyrosequencing)(454);合成による配列決定(Illumina);ライゲーションによる配列決定(SOLiD配列決定);ポロニー配列決定(polony sequencing);大規模並行署名配列決定(massively parallel signature sequencing)(MPSS);DNAナノボール配列決定;Heliscope単分子配列決定と組み合わせられることもでき、またはカラービーズもしくはレーザーもしくはFACSベースの選別のための他の抗体を用いるLuminex型システムと共に用いられることもできる。
特定の態様において、修飾ヌクレオチドは、第1鎖cDNAを逆転写により合成するランダムプライマーの能力を、例えばランダムプライマーとncRNAの3’末端の間のハイブリダイゼーションの安定性および/または特異性を高めることにより高める。
特定の態様において、ランダムプライミング配列は、天然に存在するDNAおよびRNA中にある一般的に用いられる2’−デオキシ−D−リボースまたはD−リボース以外の糖を含有する少なくとも1個のヌクレオチド、例えば糖が側鎖基の付加または置換により修飾されているヌクレオチド、または糖が天然に存在するDNAおよびRNA中にある一般的に用いられる2’−デオキシ−D−リボースもしくはD−リボースの立体異性体であるヌクレオチド、または両方を含むことができる。米国特許第6,794,142号(本明細書に参照により援用される)を参照。そのような修飾ヌクレオチドは、ランダムプライミング配列の3’末端に、またはその付近にあることができる。一態様において、修飾ランダムプライマー配列は、本質的に、3個の3’末端ヌクレオチドの少なくとも1個が2’−O−メチル−ヌクレオチド、2’−アミノ−ヌクレオチド、および2’−フルオロ−ヌクレオチドからなる群から選択される修飾ヌクレオチドであるオリゴヌクレオチドからなる。一態様において、修飾プライマー配列は、本質的に、3個の3’末端ヌクレオチドの少なくとも1個が2’−O−メチル−リボヌクレオチド、2’−デオキシ−2’−アミノ−ヌクレオチド、および2’−デオキシ−2’−フルオロ−ヌクレオチドからなる群から選択される修飾ヌクレオチドであるオリゴヌクレオチドからなる。これらの修飾は、部分の2’OHへの付加、または代替部分による2’−OHの置換を表す。
特定の態様において、ランダムプライミング配列は、1個以上のLNAまたはPNAを含む。RNA中の異常に熱力学的に安定な構造断片、例えばヘアピンの存在は、プライマー伸長を実施するのをほぼ不可能にし得る。DNAプライマーのLNA修飾プライマーによる置き換えは、この限界を克服することができる(Fratczak et al., Biochemistry, 48(3):514-6, 2009; Uppuladinne et al., Biomol. Struct. Dyn., 31(6):539-60, 2013を参照)。
他の修飾ヌクレオチド、例えばヌクレオチド間結合をヌクレアーゼ分解に耐性にするチオホスフェート(またはホスホロチオエート、PS4−xOx 3−(x=0、1、2、または3)の一般化学式を有する化合物および陰イオンのファミリー)修飾、モルホリノオリゴヌクレオチド、2’F−ANA、2’−O−アルキル等も、リンカーの安定性およびヌクレアーゼ耐性能力を高めるためにリンカーに組み込まれることができる。Verma & Eckstein, “Modified oligonucleotides: synthesis and strategy for users,” Annu. Rev. Biochem., 67:99-134, 1998(本明細書に参照により援用される)を参照。
特定の態様において、RNAリンカーおよび/またはDNAリンカーは、RNAリンカーをDNAリンカーから、またはRNA/DNAリンカーを他のRNA/DNAリンカーから(例えば、2セット以上のRNAリンカーが一緒に用いられる場合に)区別する独特の配列(例えば“バーコード”)を含むことができる。例えば、第1および/または第2二本鎖領域(単数または複数)は、RNAリンカーをDNAリンカーから区別する独特の配列を含むことができる。そのようなバーコードは、単純に独特の配列の短い一続き、例えば2、3、4、5、6、7、8、9、10ヌクレオチド配列(またはより多く)であることができる。特定の態様において、RNAリンカーおよびDNAリンカーの配列における違いは、RNAリンカーをDNAリンカーから区別するために十分であることができる。特定の態様において、RNAリンカーのみまたはDNAリンカーのみが、独特の配列/バーコードを有する。特定の態様において、RNAリンカーおよびDNAリンカーの両方が、それらのそれぞれの独特の配列/バーコードを有する。
特定の態様において、第1ポリヌクレオチドは、脱リン酸化されている。特定の態様において、第2ポリヌクレオチドは、脱リン酸化されている。特定の態様において、第3ポリヌクレオチドは、脱リン酸化されている。特定の態様において、第4ポリヌクレオチドは、脱リン酸化されている。脱リン酸化は、ポリヌクレオチドまたはDNA/RNAリンカーの自己ライゲーション、例えばそれぞれが同じクロマチン断片中の染色体DNA断片にライゲーションしている可能性がある2個のDNAリンカーの平滑末端による自己ライゲーションを避けるのを助けることができる。加えて、リンカーまたはリンカーのライゲーション可能な末端が脱リン酸化されている場合、リンカーはライゲーションしてダイマーまたはリンカーのコンカテマーを形成しそうにないと予想される。さらに、DNAリンカーは、染色体DNA分子のリン酸化された末端にライゲーションすることができるが、染色体DNA分子の末端を、それらがリン酸化されるまで、ライゲーションして繋ぎ合わせることができないと予想される。
代替の態様において、第1および第2ポリヌクレオチドは、ハイブリダイズしてRNAリンカーを形成することができ、それは、一方の末端において、第1ヌクレオチドのランダムプライミング配列を含む3’オーバーハングを有し、他方の末端において、制限酵素に関する認識部位を含む第1ライゲーション適合部位を有する。同様に、第3および第4ポリヌクレオチドは、ハイブリダイズしてDNAリンカーを形成することができ、それは、一方の末端において、染色体断片の遊離末端にライゲーションするための平滑末端を有し、他方の末端において、同じ制限酵素に関する認識部位または適合するライゲーション可能な末端を生成する適合する制限酵素に関する認識部位を含む第2ライゲーション適合末端を有する。従って、制限酵素および/またはその適合するREによる消化は、DNAおよびRNAリンカーをライゲーションするために用いられることができるオーバーハング(3’または5’オーバーハングであることができるであろう)を生成する。
この態様において、制限酵素消化の前に、DNAおよびRNAリンカーの末端は、ライゲーション可能であってはならず(例えば、RNAリンカーは、5’オーバーハングを有することができ、DNAリンカーは、3’オーバーハングの平滑末端を有することができ、または逆もまた同様である)、そのような末端は、さらに脱リン酸化されていてよい。RE消化後、DNAおよびRNAリンカーの末端においてライゲーション可能な末端が、適切なリン酸化を伴って生成される。次いで、DNAおよびRNAリンカー(単数または複数)のライゲーション可能な末端は、ライゲーションされることができる。制限後のライゲーション可能な末端は、平滑末端であることができ、または5’もしくは3’オーバーハングを有する付着末端を有することもできる。特に、稀にしか切断しない制限酵素が、核酸物質を意図されない位置で切断する可能性を低減するために、および/または非常に短い断片を生成するために、用いられることができる。
対象ポリヌクレオチドは、以下のような方法による直接化学合成を含むあらゆる適切な方法により調製されることができる:Narang et al., 1979, Meth. Enzymol., 68:90-99のホスホトリエステル法;Brown et al., 1979, Meth. Enzymol., 68:109-151のホスホジエステル法;Beaucage et al., 1981, Tetrahedron Lett., 22:1859-1862のジエチルホスホルアミダイト法;および米国特許第4,458,066号の固体支持体法、それぞれ参照により本明細書に援用される。オリゴヌクレオチドおよび修飾ヌクレオチドのコンジュゲートの合成法の総説が、本明細書に参照により援用されるGoodchild, 1990, Bioconjugate Chemistry, 1(3):165-187において提供されている。
本発明の方法を実施するための1種類以上の追加の試薬も、本発明のキットに含まれていることができる。
特定の態様において、キットは、さらにタンパク質およびポリヌクレオチドを架橋する試薬、例えばホルムアルデヒド(例えば1%ホルムアルデヒド)を含む。
特定の態様において、キットは、さらにクロマチンの構成要素(例えばヒストンまたは対象の特定のncRNA)に特異的にまたは選択的に結合する親和性試薬を含む。例えば、親和性試薬は、抗体(例えばモノクローナル抗体)、または機能性抗原結合断片もしくはその誘導体のいずれかであることができる。親和性試薬は、クロマチンのポリヌクレオチド構成要素にハイブリダイズする/結合することができるポリヌクレオチド(例えばアンチセンスポリヌクレオチド)であることもできる。アンチセンスポリヌクレオチドは、その後のアンチセンスポリヌクレオチドおよびその相補的標的配列の間で形成されるハイブリダイゼーション複合体の捕捉を促進するために標識されることができる。例えば、標識は、アビジンまたはストレプトアビジンでコートされたビーズにより捕捉されることができるビオチン標識(例えばビオチン化されたUまたはT)であることができる。アンチセンスポリヌクレオチドは、固体支持体上で、例えばマイクロビーズまたはナノ粒子の表面上で固定されることもでき、それは、相補的標的配列の親和性捕捉のために、カラム中に充填されることができ、またはバッチ混合物中で用いられることもできる。
特定の態様において、キットは、さらに、損傷した、または不適合な5’および/または3’突出末端を含有するDNAをリン酸化された平滑末端DNAに変換する末端修復混合物を含む。そのような試薬は、容易に商業的に入手可能であり、例えばEpicentreからのEnd−It(商標)DNA末端修復キットである。
特定の態様において、キットは、さらにDNAリガーゼ(例えば、様々な商業的な源、例えばNew England Biolabs(NEB)からのT4 DNAリガーゼ)を含む。
特定の態様において、キットは、さらに、タンパク質およびポリヌクレオチドの架橋を逆行させる試薬(例えば、様々な商業的な源、例えばNew England Biolabs(NEB)からのプロテイナーゼK)を含む。
特定の態様において、キットは、さらに、第1および/または第2制限酵素(単数または複数)、ならびに場合によりRE消化に必要なあらゆる適切な緩衝剤または補助因子を含む。
特定の態様において、キットは、さらに、平滑末端二本鎖DNAのPCR増幅のためのコンカテマー化アダプターの対を含む。アダプターは、コンカテマー化に有用な制限酵素部位を含むことができ、PCR増幅に適したPCRプライマー配列を含むことができる。
特定の態様において、キットは、さらに、PCR増幅のためのTaq DNAポリメラーゼ、または他の増幅の形態(例えばローリングサークル増幅)に必要な他のDNAポリメラーゼを含む。
特定の態様において、キットは、さらに、第1鎖cDNA合成のための逆転写酵素を含む。
本発明の別の側面は、第1および第2ライゲーション適合末端により連結された第1および第2二本鎖領域を含む中央領域を含むペアエンドタグ(PET)ポリヌクレオチドを提供し、前記の中央領域は、(1)第1二本鎖領域に近位の部位において、非コードRNA(ncRNA)の配列タグ;および(2)第2二本鎖領域に近位の部位において、ゲノムDNAの配列タグにより隣接されている。
そのようなPETポリヌクレオチドは、RNAタグおよびDNAタグの両方を含み、それぞれが、それぞれのncRNAおよびゲノムDNAの末端配列に由来する(ペアエンドタグ)。合わせて、ペアエンドタグは、ncRNAおよびゲノムDNA断片が染色体断片中で互いに近接している観察された事象または出来事を表す。
特定の態様において、非コードRNA(ncRNA)の配列タグは、第1制限酵素による消化の結果もたらされる遊離末端を有する。
制限酵素は、上記の制限酵素、例えばII型RE(IIS型、IIB型、IIG型等)、I型RE、またはIII型REのいずれであることもでき、それはそれらの認識部位の外側を消化することができる。あるいは、遊離末端は、ncRNAに対応するcDNA上に天然に存在するRE部位により生成されることもできる。好ましくは、REは、中央領域の配列に基づいて、REが中央領域の内部を切断して連結されたDNAリンカーおよびRNAリンカーの構造を壊さないように選択される。
特定の態様において、ncRNAのRNA配列タグまたはゲノムDNAのDNA配列タグは、物理的剪断、例えば超音波処理、水力剪断、皮下注射針を通す吸い込みの繰り返し等による剪断の結果として生じる遊離末端を有する。
特定の態様において、ncRNAのRNA配列タグまたはゲノムDNAのDNA配列タグは、架橋されたゲノムDNAまたはncRNAのcDNAの平均長を低減するための非特異的エンドヌクレアーゼ、例えばミクロコッカスヌクレアーゼ(NEBカタログ番号M0247S)、DNase I(NEBカタログ番号M0303S)、または二本鎖DNAの一方の末端から進行的に消化するエキソヌクレアーゼ、またはエンドおよびエキソヌクレアーゼの組み合わせ(例えばエキソヌクレアーゼIIIおよびマングビーンヌクレアーゼ)の限定的な消化の結果生じる遊離末端を有する。消化の程度(extend)は、酵素もしくは基質濃度、消化の温度および/またはpH、補助因子の利用可能性、またはそれらの組み合わせを制限することにより制御され得る。適切な消化条件は、定められた長さの標準基質を用いて、そして消化の前および後に消化産物を(CE(キャピラリー電気泳動)等の電気泳動により)調べて、予め試験されることができる。
RNAまたはDNA配列タグの長さは、ncRNAが転写される、またはゲノムDNAが位置するゲノム領域を独特に同定するために十分であるべきである。例えば、非コードRNA(ncRNA)のRNA配列タグおよび/またはDNA配列タグは、高等真核生物の比較的複雑なゲノムに関して約10〜100塩基対の長さ(または15〜50bp、20〜40bp、20〜30bp、20〜25bp)であることができるが、細菌または低級真核生物の比較的単純なゲノムに関してはより短くてよい(例えば6〜10bp、8〜10bp、8〜12bp)。
関連する側面において、本発明は、対象のPETポリヌクレオチドの2つ以上のメンバーを含むペアエンドタグ(PET)ポリヌクレオチドライブラリーを提供し、ここで、PETライブラリーのそれぞれのメンバーは、同じ中央領域、および非コードRNA(ncRNA)の異なるRNA配列タグ、ゲノムDNAの異なるDNA配列タグ、または両方を含む。
さらに別の関連する側面において、本発明は、対象のPETポリヌクレオチドを含むベクターまたは組み換えベクターを提供する。
特定の態様において、ベクターは、複数のコンカテマー化された対象PETポリヌクレオチドを含む。
本発明の別の側面は、ゲノムの非コードRNA(ncRNA)に関するゲノム内の機能的相互作用座位を同定する方法を提供し、その方法は、以下の工程を含む:(1)架橋されたゲノムDNA断片および架橋されたncRNAを含むクロマチン断片を提供し;(2)本発明のRNAリンカーおよびDNAリンカーを用いて、架橋されたゲノムDNA断片の末端を架橋されたncRNAのcDNAの末端に近接ライゲーションに関する条件下でライゲーションし、ここで架橋されたゲノムDNA断片の末端はDNAリンカーにライゲーションされ、架橋されたncRNAのcDNAの末端はRNAリンカーを含み;(3)本発明のPETポリヌクレオチドを配列決定分析のために単離し;そして、(4)それぞれのPETポリヌクレオチド内のゲノムDNAの配列タグおよびncRNAの配列タグを、参照ゲノムに対してマッピングし、それにより参照ゲノムの非コードRNA(ncRNA)に関する参照ゲノム内の機能的相互作用座位を同定する。
特定の態様において、本発明の方法は、生きた細胞、例えば組織培養細胞または新しく解剖された組織から単離された細胞を用いて実施される。特定の態様において、生きた細胞中のncRNAおよびゲノムDNAは、ホルムアルデヒドおよび/またはEGS(エチレングリコールビス[スクシンイミジルスクシネート])に媒介される架橋により架橋される。タンパク質−DNA、タンパク質−RNAおよび/またはタンパク質−タンパク質を架橋するのに適した他の類似の二官能性架橋試薬(例えば、アミドおよび/またはチオール基と反応するのに適した2以上の反応性化学基を有する二官能性架橋試薬)が用いられることもできる。EGSが用いられる場合、2つのNHS−エステル間のスペーサー領域は、12原子のスペーサーであることができるが、より長い、またはより短いスペーサー(例えば、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20原子のスペーサー)が用いられることもできる。
ホルムアルデヒドまたはEGS(典型的には約1〜2mM、または1.5mM)が用いられる場合、EGSがまず添加され、続いて(約1%)ホルムアルデヒドが添加されることができる。反応は、グリシンにより停止されることができる。あるいは、約1%ホルムアルデヒドまたは約1%グルタルアルデヒドが用いられることができる。
他の態様において、核酸は、紫外線架橋によりクロマチンに架橋される。例えば、組織培養細胞は、約150mJ/cm2において、254nmにおいて(例えば、紫外線架橋装置、例えばSTRATALINKER(登録商標)紫外線架橋装置を用いることにより)紫外線架橋されることができる。
例えば、約1〜2×108個の生きた組織培養細胞または単離された細胞は、まず収集され、室温において振盪しながら40分間EGSで架橋され、次いで10分間ホルムアルデヒド(約1%の終濃度;Sigma)で架橋されることができる。
プロテイナーゼ阻害剤および/またはRNase阻害剤が、非特異的プロテイナーゼまたはRNase消化を防ぐために添加されることができる。
次いで、細胞が適切な溶解緩衝液(例えば、50mM HEPES、1mM EDTA、0.15M NaCl、1% SDS、1% Triton X−100、0.1%デオキシコール酸ナトリウム、全てAmbionからのもの)中で溶解される。
一度架橋工程が完了したら、様々な方法が、架橋されたゲノムDNAおよびncRNAを含むクロマチン断片を生成するために用いられることができる。
例えば、特定の態様において、クロマチン断片は、物理的剪断、例えば超音波処理、水力剪断、または皮下注射針を通す吸い込みの繰り返しにより生成される。超音波処理は、クロマチン線維を破壊してRNA、DNAおよびタンパク質構成要素を含む係留複合体にする一方で、偽の、ランダムな、または弱いncRNA−クロマチン−DNA相互作用を“振るい落とす”ために有利であり得る。
あるいは、特定の態様において、クロマチン断片は、適切な長さのRNAおよびDNAタグを生成するために、制御された条件下での制限酵素消化、または部分的もしくは限定的エンドおよび/またはエキソヌクレアーゼ消化により生成されることができる。
架橋されたゲノムDNA断片および架橋されたncRNAを含むクロマチン断片を生成するため、クロマチンは、超音波処理(例えば、Branson450超音波細胞破砕装置を使用、20%機関効率電力出力(duty power output)、30秒、5〜8回で操作;またはプローブ超音波処理器を使用、35%出力で20秒オン/30秒オフのサイクルで1.5分間操作)により可溶化されることができる。
他の商業的に入手可能な機器が、超音波処理のために用いられることができる。例えば、Covaris,Inc.からのS220 Focused−超音波処理器は、Adaptive Focused Acoustics(商標)(AFA)技術をDNA、RNA、およびクロマチンの剪断のために利用する。製造業者によれば、そのソフトウェアは、標準的な方法、例えばDNAの特定の断片長への剪断のための様々な予め設定されたプロトコルを組み込んでいる。あるいは、ベンチトップ超音波処理装置であるBIORUPTOR(登録商標)UCD−200(Life Technologies Corp.)も、超音波処理剪断のために用いられることができる。その装置は、水槽の下に配置された高出力超音波生成素子からなり、(プローブ超音波処理器と類似した)20kHzの周波数で作動して、ChIP、MeDIP等のような標準化されたプロトコルに適した自動化された超音波処理工程を提供する。
一度剪断されたら、クロマチンは、SDS濃度を(例えば約0.1〜0.5%まで)下げるために(例えば10倍)希釈される。次いで、抽出物は、(例えば4℃で14,000rpmにおいて10分間の)遠心分離により澄んだ状態になる。この抽出物は、使用まで−80℃で保管されることができる。
免疫沈降が所望される場合、約2μgの(クロマチン構成要素に特異的な)モノクローナル抗体が、プロテインGセファロース(Pharmacia)に結合することができる。次いで、抗体でコートされたビーズは、クロマチン抽出物と共に4℃で16時間インキュベートされる。次いで、ビーズは洗浄される(例えばSigma Chemical Companyからの以下の試薬による:洗浄緩衝液1(50mM HEPES、1mM EDTA、0.15M NaCl、0.1% SDS、1% Triton X−100、0.1%デオキシコール酸ナトリウム);洗浄緩衝液2(50mM HEPES、1mM EDTA、0.5M NaCl、0.1% SDS、1% Triton X−100、0.1%デオキシコール酸ナトリウム)で2回;洗浄緩衝液3(20mM トリス.HCl pH8.0、1mM EDTA、0.25M LiCl、0.5% NP40、0.5%デオキシコール酸ナトリウム)で1回;洗浄緩衝液4(20mM トリス.HCl pH8.0、1mM EDTA)で1回)。次いで、タンパク質−DNA複合体が、ビーズから溶離緩衝液(例えば、50mM トリス.HCl pH8.0、1mM EDTA、1% SDS)により65℃で20分間溶離される。次いで、溶離液は、SDSを除去するために、PBS(Ambion)中で(例えば4℃で3時間)透析される。
場合により、クロマチン断片は、(例えばEZlinkヨードアセチル−PEG2−ビオチン(IPB)(Thermo Scientific、カタログ番号21334)を用いることにより)ビオチン化され、ストレプトアビジンビーズに結合したクロマチン断片として単離されることもできる。例えば、ストレプトアビジンを有するDYNABEADS(登録商標)(DYNABEADS(登録商標)MyOne(商標)ストレプトアビジンC1/T1)が、ビオチン化されたクロマチン断片を富化するために用いられることができる。
加えて、シリカ様コーティングを有するビーズが、クロマチン断片上の架橋された核酸を富化するために用いられることができる。
クロマチン断片は、剪断またはRE消化後、損傷した末端または他の点でDNAリンカーとのライゲーションに適していない末端を有し得る。従って、末端修復が、例えばEpicentreからのEnd−ItキットまたはT4ポリメラーゼ(Promega,R0191)を用いて、製造業者の提案に従って実施されることができる。
第1鎖cDNA合成は、逆転写酵素およびRNAリンカー(または下記の第2の特定の態様における修飾RNAリンカー)、例えばSuperscript III第1鎖合成システム(Life Technologies,カタログ番号18080051)を用いて実施されることができる。
次いで、その平滑末端において5’リン酸化を有する修復されたクロマチンDNAは、DNAリンカーとのライゲーションにおいて用いられることができる。これは、DNAライゲーションに関する適切な緩衝液および他の反応条件が提供される限り、RNAリンカーを用いる逆転写のための容器と同じ容器中で実施されることができる。DNAリガーゼ、例えばT4 DNAリガーゼが、この反応のために用いられることができる。必要であれば、次いで、脱リン酸化されたDNAリンカーは、(例えばT4ポリヌクレオチドキナーゼにより)リン酸化されることができる。
特定の態様において、第1鎖cDNA合成は、RNAリンカーを用いて実施される(DNAリンカーライゲーションの前もしくは後またはそれと同時のいずれでもよい)。
特定の態様において、架橋されたncRNAのcDNAは、RNAリンカーのランダム配列プライマーおよびncRNA鋳型から逆転写された第1鎖cDNAを含む。RNAリンカーの存在により、この第1鎖cDNAおよびncRNA鋳型のハイブリッド分子は、既に染色体DNA断片の遊離末端にライゲーションされたDNAリンカーにライゲーションされることができる。
一度RNAリンカーおよびDNAリンカーが標的核酸のそれらのそれぞれの末端に適切にライゲーションされたら、同じクロマチン断片上のDNAリンカーおよびRNAリンカーを連結するために近接ライゲーションが実施されることができる。近接ライゲーションは、通常は、同じクロマチン断片上のRNAおよびDNAリンカーがライゲーションされる可能性が、それらの互いに対する近接のために、異なるクロマチン断片上のRNAおよびDNAリンカーと比較して遥かに高いように、希釈された環境において実施される。
特定の態様において、近接ライゲーションは、リンカーライゲーション工程に関して約2、3、4、5、6、7、8、9、10、12、13、14、15、16、70、18、19、20倍の希釈度またはより高い希釈度で実施される。
特定の態様において、近接ライゲーションは、約1×108個のヒト細胞に由来する捕捉されたクロマチン断片のそれぞれの相当量に関して、約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20mLまたはより多くの総ライゲーション体積で実施される。ライゲーション体積は、細胞のタイプ(例えば、由来の種またはゲノムサイズ)に基づいて適宜調節されることができる。
近接ライゲーション条件は、必要に応じて、DNAおよびRNAリンカーのライゲーションを最大化するように修正または調節されることができる。あらゆるライゲーション条件は、修正または調節されることができ、それはライゲーション反応に関する時間および/または試薬の濃度の増大または減少を含むが、それらに限定されない。換言すると、ライゲーション反応は、同じクロマチン断片に架橋された別々の核酸分子の分子間ライゲーションを最大化するように調節または修正される。特に、ライゲーションは、異なる核酸分子の末端のライゲーションを最大化し、かつ環状マルチマーの形成を低減するために、核酸分子の非常に希薄な条件下で実施されることができる。
特定の態様において、その方法は、異なるクロマチン断片に架橋されたゲノムDNAおよびncRNAの間の望まれない、または偽陽性のライゲーション事象の程度または頻度を評価することを含む。理想的な近接ライゲーション条件下では、同じクロマチン断片に架橋されたゲノムDNAおよびncRNAのみがライゲーションされるはずである。
例えば、DNAおよびRNAリンカーのあるセット(例えばリンカーセットA)が、1つの反応容器中で、ゲノムDNAおよびRNA末端にそれぞれライゲーションするために用いられることができる。一方で、DNAおよびRNAリンカーの第2のセット(例えばリンカーセットB)が、第2の反応容器中で、ゲノムDNAおよびRNA末端にそれぞれライゲーションするために用いられることができる。次いで、2個の反応容器の内容物が、近接ライゲーションのためにプールされる。リンカーセットA中のRNAリンカーが、両方のリンカーセットのDNAリンカーにライゲーションされ得る(そしてリンカーセットA中のDNAリンカーは両方のリンカーセットのRNAリンカーにライゲーションされ得る)場合、近接ライゲーション条件は、セットAおよびBのリンカー間のライゲーション(例えば、セットA中のRNAリンカーがセットB中のDNAリンカーにライゲーションする)が存在しないか非常に稀にしか存在しない場合に最適である。逆に、近接ライゲーション条件は、セットAおよびBのリンカー間で著しいライゲーションが存在する場合、最適未満である。
特定の態様において、リンカーセットAおよびB中のRNAおよびDNAリンカーの比率は、さらに調節される(例えば、必ずしも1:1ではない)ことができる。例えば、リンカーセットA中のRNAおよびDNAリンカーの、リンカーセットB中のRNAおよびDNAリンカーと比較したモル比は、2:1、3:1、4:1、5:1、6:1、7:1、8:1、9:1、10:1であることができ、逆もまた同様である。
特定の態様において、本発明の第1、第2、第3、および/または第4ポリヌクレオチドは、脱リン酸化されており、DNAリンカーまたはRNAリンカーは、自己ライゲーションしない。
第2鎖cDNA合成は、RNAリンカー−DNAリンカーライゲーションの前または後のどちらでも、例えばSuperscript二本鎖cDNA合成キット(Life Technologies,カタログ番号1197−020)を用いて完了されることができる。特定の態様において、第2鎖cDNA合成は、近接ライゲーションの後であるが工程(3)の前に実施される。
特定の態様において、DNAポリメラーゼ、例えばT4 DNAポリメラーゼが、第2鎖cDNA合成の後に添加されることができる。
次に、クロマチン断片の架橋された核酸およびタンパク質構成要素は、プロテイナーゼKにより架橋を逆行する(reverse cross−linked)ことができる。典型的な反応条件では、例えば、試料は、20μLの分割量(aliquots)として、15μlの20mg/mlプロテイナーゼK(Ambion)および場合により0.3% SDS(Ambion)の存在下での65℃における一晩インキュベーションにより、架橋を逆行することができる。次の日に、約1μLの10mg/ml RNase A(Qiagen)が、RNAを分解するために(例えば37℃で45分間)添加されることができ、続いてフェノール抽出およびDNAのエタノール沈殿が行われる。
場合により、少なくとも1つの連結されて架橋を逆行した核酸分子の精製または富化が、少なくとも2つの構成要素を含む結合系を用いて実施されることができ、ここで、少なくとも1つの第1構成要素がリンカーに結合しており(例えば、例えばRNAまたはDNAリンカー中に組み込まれたビオチン化されたヌクレオチド)、少なくとも1つの第2構成要素が第1構成要素に結合する。構成要素は、ストレプトアビジン−ビオチン、アビジン−ビオチン、タンパク質−抗体および/または磁石/磁性物質を含むが、それらに限定されない。
特に、ビオチン化されたリンカーにライゲーションした核酸物質は、ストレプトアビジンビーズ、例えばストレプトアビジンコンジュゲート磁性DYNABEADS(商標)(Life Technologies,カタログ番号11206D−10ML)を用いて精製されることができる。ビオチン化されたリンカーを含有する核酸物質のみが、ストレプトアビジンビーズ上に固定されるであろう。別の構成要素が用いられるリンカーに結合している場合、その構成要素に適した核酸分子を精製する他のシステムが用いられることができる。
あるいは、ストレプトアビジンカラムが、ビオチン化されたビーズを捕捉するために代わりに用いられることができる。さらに別の代替案において、ビーズは、それらがFACS等により流れに基づく検出機器(例えばLUMINEX(登録商標)100(商標)、LUMINEX(登録商標)200(商標)またはBIO−RAD(登録商標)BIO−PLEX(登録商標)型分析装置)上で選別または収集されることができるように、色で、または蛍光的にコートされていることができる。
結果として生じた遊離したDNAは、例えばRE酵素消化により対になったDNAおよびRNAタグを有するPETポリヌクレオチドを生成するために用いられることができる。場合により、遊離したPETポリヌクレオチドは、配列決定分析の前にさらにPCRにより増幅されることができる。PCRアダプターが、PCR増幅を実施する前に、PETポリヌクレオチドの両方の末端に(例えばT4 DNAリガーゼにより)ライゲーションされることができる。平滑末端の環状化されていない核酸のみが、アダプターにライゲーションされることができる。自己ライゲーションした核酸分子および環状マルチマーは、アダプターにライゲーションされることができない。
PCRアダプターは、PCR産物の精製のための修飾ヌクレオチドも含むことができる。同様に、ストレプトアビジン−ビオチン、アビジン−ビオチン、タンパク質−抗体および/または磁石/磁性物質がこの目的のために用いられることができる。
PETポリヌクレオチド(増幅を伴う、または伴わない)は、例えば様々な次世代配列決定、例えば454多重配列決定機(454 life sciences)を用いる454配列決定に関するプロトコルに従って、直接配列決定されることができる。その技法は、Margulies et al (2005)および米国出願第20030068629号(両方とも参照により本明細書に援用される)において教示されている。あらゆる他の高スループットまたは次世代配列決定(NGS)法が、PETポリヌクレオチドの配列を決定するために用いられることができる。
得られたRNA/DNAタグ配列のそれらのそれぞれのゲノム位置へのマッピングは、多くの商業的に利用可能なツール、ソフトウェア、またはサービスのいずれかを用いて実施されることができる。
一度PETポリヌクレオチドのRNAおよびDNAタグが配列決定され、参照ゲノムにマッピングされたら、それぞれの連結されたRNAタグおよびDNAタグは、推定上のncRNA−クロマチン相互作用を表す。全てのそのような観察された相互作用の集合は、参照ゲノムの非コードRNA(ncRNA)に関する参照ゲノム内の機能的相互作用座位を構成する。
特定の態様において、その方法はさらに、ゲノムDNAの重複する配列タグおよびncRNAの重複する配列タグを有する2以上のPETポリヌクレオチドのクラスターを同定することを含む。
PETクラスターは、ncRNA−クロマチン相互作用のより信頼できる事象の繰り返される検出を反映する高い信頼度のデータであると考えられる。対照的に、RNAタグおよびDNAタグの両方において他のPET配列と重複しない単集合PETは、弱いつながりのシグナルを表す可能性があり、ランダムなバックグラウンドノイズと区別できない可能性がある。
特定の態様において、その方法はさらに、rRNAの配列タグを含むPETポリヌクレオチドを除外することを含む。一部のrRNA−クロマチン−gDNA(ゲノムDNA)相互作用は、真に生物学的に重要であり得るが、大量(一部のデータセット中の約1/4)のrRNA−クロマチン−DNA相互作用の存在は、その他のより豊富でない相互作用を見えづらくする可能性がある。従って、さらなるデータ分析の前のそのようなデジタル減算は、より頻度の低いncRNA−クロマチン相互作用を分析するために望ましい可能性がある。
特定の態様において、その方法はさらに、近接ライゲーション工程の前にクロマチン断片の部分集合を分離または富化することを含む。例えば、クロマチン断片の部分集合は、クロマチン断片のその部分集合のタンパク質構成要素に特異的な抗体を用いる免疫沈降により、またはクロマチン断片のその部分集合の核酸構成要素に特異的な(標識された)ポリヌクレオチドを用いるハイブリダイゼーションにより、単離または富化されることができる。これは、既知のクロマチン構成要素およびncRNAの間の特異的な相互作用を同定するために有用である可能性がある。
特定の態様において、タンパク質構成要素は、ヒストン、転写因子(例えば一般的な転写因子RNAPII、RNAPI、RNAPIII)、クロマチンを再構築するポリコーム群(PcG)ファミリータンパク質(例えばEZH2、ならびに昆虫、哺乳類、および植物からの他のもの);組み換えに関わる因子(例えばPRDM9);クロマチンインスレーターもしくはクロマチンウェーバー(例えばCTCF);メチルCpG結合タンパク質(例えばMeCP2);またはRNA結合タンパク質である。
方法のあるバリエーションにおいて、特定の標識されたncRNA(例えばビオチン化)が、架橋前に細胞に添加されることができる。そのような標識されたncRNAは、アビジンまたはストレプトアビジンでコートされた磁性ビーズを用いることにより単離または富化されることができる。
方法のさらに別のバリエーションにおいて、対象の1以上の特定のncRNAに対する相補配列が、クロマチン断片に架橋されたそのような特異的なncRNAを(アレイまたはカラムを用いて)単離または富化するために用いられることができる。一度単離または富化されたら、そのようなクロマチン断片は、その特定のncRNAと相互作用するゲノムDNAの領域を同定するために、その方法の残りの工程を受けることができる。
特定の態様において、その方法はさらに、1以上の観察されたncRNA−クロマチン相互作用を、例えばDNA/RNA FISHおよび免疫沈降アッセイにより検証することを含む。例えば、特定のncRNAが特定のゲノム座位に連結された場合、その観察を確証するために、DNA/RNA FISHおよび免疫沈降アッセイがそのncRNAを用いて実施されることができる(例えば、図4Bを参照)。
b)修飾RNAリンカー
別の/第2の特定の態様において、本発明の方法は、同じクロマチン断片中の架橋されたRNAおよび染色体DNAをライゲーションするために、1つの修飾されたRNAリンカーを用いて(かつDNAリンカーを用いずに)実施されることができる。
従って、本発明の別の側面は、以下のものを含む修飾RNAリンカーを提供する:(i)第1ポリヌクレオチド、および(ii)第2ポリヌクレオチド、ここで、第1および第2ポリヌクレオチドは、ゲノムDNAライゲーション適合末端および第1ポリヌクレオチドの3’末端における3’オーバーハングにより隣接される二本鎖領域を形成し、ここで、3’オーバーハングはランダムプライマー配列を含む。
本発明のこの側面によれば、第1ポリヌクレオチドの3’末端における3’オーバーハングは、小節a)(RNAおよびDNAリンカー対)において記載された特定の態様におけるRNAリンカーの機能と類似した機能を有し、一方でゲノムDNAライゲーション適合末端は、同じクロマチン断片に架橋された平滑末端ゲノムDNAをライゲーションするために用いられることができる。
特定の態様において、ライゲーション適合末端は、架橋されたゲノムDNA断片の平滑末端に対する直接のライゲーションのために平滑末端化されることができる。
別の態様において、ライゲーション適合末端は、制限酵素部位を含むことができ、それは、REにより切断されて、架橋されたゲノムDNA断片の平滑末端へのライゲーションに必要な必須の平滑末端を生成することができる。しかし、制限酵素による切断の前に、ライゲーション適合末端は、平滑末端化されることができ(例えば、自己リン酸化を防ぐための脱リン酸化された平滑末端)、または自己ライゲーションを防ぐ非適合性オーバーハングを有することもできる。
特定の態様において、修飾RNAリンカーは、その3’オーバーハングまたはそのライゲーション適合末端のどちらによっても自己ライゲーションしない。
第1および第2ポリヌクレオチドは、別々の容器中で、例えば合成されたポリヌクレオチドとして提供されることができ、それは凍結乾燥された(freeze dried,lyophilized)形態または水もしくは適切な緩衝溶液中のどちらでもよい。あるいは、第1および第2ポリヌクレオチドは、同じ容器中(凍結乾燥状態または溶液中)で、例えば1:1のモル比で、それらが予めアニーリングされた修飾RNAリンカーとして用いられることができるように、組み合わせられることができる。
第2ポリヌクレオチドは、実質的に均質または純粋であり(例えば、同じ容器内の個々のポリヌクレオチド分子は、同じである)、一方で、3’オーバーハング領域中の第1ポリヌクレオチドの3’末端は、ランダム配列プライマーを含む。
関連する態様において、第1ポリヌクレオチドは、その定められた3’末端配列を有する特定のncRNAから特異的に第1鎖cDNA合成を開始するために、ランダム配列プライマー領域において同じマッチする配列を均質に含有していることができる。
特定の態様において、二本鎖領域は、第1制限酵素、例えばII型制限酵素(RE)に関する第1制限部位を含むことができる。RE認識部位は、REが切断する際に、それがRE部位の外側、ランダム配列プライマーに対して3’側を切断するように、戦略的に配置されることができる。これは、RNAリンカーに連結されたRNAタグの生成を可能にする。例えば、MmeI認識部位は、二本鎖領域の末端に、ランダム配列プライマーを含む3’オーバーハングに対して近位に配置されることができる。MmeI部位は、MmeIが切断する際に、2bpのオーバーハングを有する18bpの断片を含むRNAタグが、連結されたncRNA由来のcDNAにおいて生成されるような方向性であるように設計される。しかし、RE部位の配置は、第1二本鎖領域の末端である必要はない。より内側の配置は、対応してより短いRNAタグ配列を生成する。
特定の態様において、(第1(II型)制限酵素に関する)第1認識部位の最後のヌクレオチドは、ランダム配列プライマーに対して5’側の最後の塩基対合したヌクレオチドである。
特定の態様において、二本鎖領域は、ライゲーション適合末端において、またはその付近に、第2制限酵素、例えばII型制限酵素(RE)に関する第2制限部位を含むことができる。REは、第2RE認識部位に対して3’側であり第1ポリヌクレオチドに対して5’側(例えば、ライゲーションされたゲノムDNA中)を切断することができる。RE認識部位の方向性は、それが、連結されたゲノムDNAの末端配列に基づいてDNAタグを生成するような方式で配置される。特定の態様において、RE部位の配置は、二本鎖領域の末端である必要はない。より内部の配置は、対応してより短いDNAタグ配列を生成する。
特定の態様において、(第2(II型)制限酵素に関する)第2認識部位の最後のヌクレオチドは、ライゲーション適合性/平滑末端における塩基対合したヌクレオチドである。
特定の態様において、修飾RNAリンカーは、RNAタグまたはDNAタグを生成するための制限酵素認識部位を有しない。
特定の態様において、修飾RNAリンカーは、その修飾RNAリンカーを他の修飾RNAリンカー(単数または複数)から区別する独特の配列(例えば“バーコード”)を含むことができる。
特定の態様において、第1および/または第2ポリヌクレオチドは、脱リン酸化されている。
本発明の別の側面は、以下:(1)ランダム配列プライマーに対して近位の部位において非コードRNA(ncRNA)の配列タグ;および(2)ライゲーション適合末端に対して近位の部位においてゲノムDNAの配列タグにより隣接されている(修飾RNAリンカーの)二本鎖領域を含む中央領域を含むペアエンドタグ(PET)ポリヌクレオチドを提供する。
関連する側面において、本発明は、対象のPETポリヌクレオチドの2以上のメンバーを含むペアエンドタグ(PET)ポリヌクレオチドライブラリーを提供し、ここで、PETライブラリーのそれぞれのメンバーは、同じ中央領域、および非コードRNA(ncRNA)の異なるRNA配列タグ、ゲノムDNAの異なるDNA配列タグ、または両方を含む。
さらに別の関連する側面において、本発明は、対象のPETポリヌクレオチドを含むベクターまたは組み換えベクターを提供する。
本発明の別の側面は、ゲノムの非コードRNA(ncRNA)に関するゲノム内の機能的相互作用座位を同定する方法を提供し、その方法は、以下の工程を含む:(1)架橋されたゲノムDNA断片および架橋されたncRNAを含むクロマチン断片を提供し;(2)本発明の修飾RNAリンカーを用いて、架橋されたゲノムDNA断片の末端を架橋されたncRNAのcDNAの末端に近接ライゲーションに関する条件下でライゲーションし、ここで架橋されたゲノムDNA断片の末端は修飾RNAリンカーのライゲーション適合末端にライゲーションされ、架橋されたncRNAのcDNAの末端は修飾RNAリンカーを含み;(3)本発明のPETポリヌクレオチドを配列決定分析のために単離し;そして、(4)それぞれのPETポリヌクレオチド内のゲノムDNAの配列タグおよびncRNAの配列タグを、参照ゲノムに対してマッピングし、それにより参照ゲノムの非コードRNA(ncRNA)に関する参照ゲノム内の機能的相互作用座位を同定する。
特定の態様において、架橋されたncRNAのcDNAは、修飾RNAリンカーのランダム配列プライマーおよびncRNA鋳型から逆転写された第1鎖cDNAを含む。修飾RNAリンカーの存在のため、この第1鎖cDNAおよびncRNA鋳型のハイブリッド分子は、染色体DNA断片の遊離末端にライゲーションされることができる。
特定の態様において、修飾RNAリンカー上の二本鎖領域の長さは、約6、7、8、9、10、15、20、25、30、35、40、50、60塩基対またはより多くの塩基対である。
小節a)(RNAおよびDNAリンカー対)において記載された第1の特定の態様において記載されたような他の態様は、一般的に適用可能であり、ここでも組み込まれる(が繰り返して述べない)。
c)直接的RNA−DNAライゲーション
別の/第3の特定の態様において、本発明の方法は、ncRNAの3’−OH基を、5’アデニル化された一本鎖DNA(5’App−ssDNA)、例えば後で相補的ポリヌクレオチドにハイブリダイズされるssDNAリンカー、またはncRNAの3’−OH基への直接的なライゲーションのための酵素の基質の役目を果たすことができる5’アデニル化されたオーバーハングを有するdsDNAに直接ライゲーションする特定の酵素(例えば切り詰められたRNAリガーゼ2またはRNL2)を用いて実施されることができる。
従って、本発明は、同じクロマチン断片中の架橋されたncRNAの3’末端および架橋されたゲノムDNA断片の遊離末端をライゲーションするための代替の方法も提供する。本発明のこの側面によれば、一本鎖DNAオリゴヌクレオチドが、その5’が予めアデニル化された状態で提供される(5’App ssDNA)。次いで、RNA−DNAリガーゼ(例えば熱安定性5’AppDNA/RNAリガーゼ、NEBカタログ番号M0319SまたはM0319L)が、ncRNAの3’−OHを5’App ssDNAに直接連結するために用いられることができる。
製造によれば、その熱安定性5’AppDNA/RNAリガーゼは、メタノバクテリウム・サーモオートトロフィカス(Methanobacterium thermoautotrophicum)からのRNAリガーゼの触媒的リジンの点変異体である(Zhelkovsky and McReynolds, BMC Mol. Biol., 13:24, 2012)。この酵素は、ATP非依存性であるが、RNAまたは一本鎖DNA(ssDNA)のどちらの3’−OH末端へのライゲーションに関しても、5’が予めアデニル化されたリンカーを必要とする。その酵素は、2’−O−メチル化された3’末端を有するRNAの5’アデニル化されたリンカーへのライゲーションにおいても活性である。(Zhelkovsky and McReynolds、上記)。その変異体リガーゼは、RNAまたはssDNAの5’ホスフェートをアデニル化することができず、それは、望まれないライゲーション産物(コンカテマーおよび環)の形成を低減する。65℃で機能するリガーゼの能力は、RNAライゲーション反応におけるRNAの二次構造の制約をさらに低減し得る。
本発明のこの態様に関する別の適切なリガーゼは、RNAリガーゼ2、例えばBioo Scientific(テキサス州オースティン)からのAIRTM RNAリガーゼ2(RNL2)であり、それは、アダプターのアデニル化された5’末端をRNAの3’末端に特異的にライゲーションする。同様に、その酵素は、ライゲーションに関してATPを必要としないが、アデニル化された基質を必要とし、それは、ランダムRNA分子間のライゲーションの量を劇的に低減する。そのリガーゼは、T4 RNAリガーゼ2の切り詰められたバージョンである。完全長のRNAリガーゼ2とは異なり、AIR(商標)リガーゼは、アデニル化された基質を有しないRNAまたはDNAのリン酸化された5’末端をライゲーションしない。
あるいは、T4 RNAリガーゼ1(NEBカタログ番号M0204SまたはM0204L)が、ncRNAの3’−OHを5’ホスホリル末端を有するssDNAにライゲーションするために用いられ得る。
一度ncRNAの3’末端がssDNAにライゲーションされたら、相補的ssDNAが、ライゲーションされたssDNAにアニーリングして第2鎖cDNA合成を開始することができ、および/または同じクロマチン断片中の架橋されたゲノムDNA断片の遊離末端とのライゲーションに適した平滑末端を形成することができる。
代替の態様において、平滑末端(またはライゲーション適合末端)を一方の末端に、(上記の様々なRNAリガーゼに関する一本鎖基質の役目を果たすことができる)5’アデニル化されたオーバーハングを他方の末端に有するdsDNAリンカーが、突出しているアデニル化された5’末端がncRNAの3’−OHに直接ライゲーションされる前に、架橋されたゲノムDNA断片の遊離末端にまずライゲーションされることができる。
同様に、上記でライゲーションされたRNAリンカー−DNAリンカーまたは修飾RNAリンカーに関して記載された全ての態様またはバリエーションは、5’App ssDNAおよびその相補配列の間で形成された二本鎖領域に一般的に適用可能である。
例えば、特定の態様において、5’App ssDNAおよびその相補配列の間で形成された二本鎖領域は、RNAおよびDNAタグ配列の生成を容易にするための1個以上のRE認識部位を含むことができる。2個のMmeI部位が、二本鎖領域の両方の末端に位置し、二本鎖領域の外側の切断を方向付けて、二本鎖領域に隣接する18〜20bpのRNAおよびDNAタグを生成することができる。あるいは、1個のRE部位が、RNAタグ(またはDNAタグ)を生成するために用いられることができ、DNAタグ(またはRNAタグ)は、物理的剪断または限定的な非特異的酵素消化(上記参照)により生成されることができる。
従って、本発明の別の側面は、以下:(i)第1ポリヌクレオチドおよび(ii)第2ポリヌクレオチドを含む直接的なRNAリンカーを提供し、ここで、第1および第2ポリヌクレオチドは、ゲノムDNAライゲーション適合末端、および第1ポリヌクレオチドの5’末端における5’オーバーハングにより隣接される二本鎖領域を形成する。
5’オーバーハングは、場合により5’アデニル化されており、または適切な酵素、例えば5’DNAアデニル化キット(カタログ番号E2610SまたはE2610L)中のMth RNAリガーゼによりアデニル化されることができる。RNAライゲーションが5’オーバーハングを用いて実施される予定である場合、(その第2ポリヌクレオチドとのアニーリングの前の)ssDNAとしての第1ポリヌクレオチドとは対照的に、5’オーバーハングは、直接的なRNAライゲーションのための酵素に関する基質として用いられるために十分な長さ(例えば、4、5、6、7、8、9、10、11、12、13、14、15塩基またはより多くの塩基)のものである。
特定の態様において、ライゲーション適合末端は、架橋されたゲノムDNA断片の平滑末端への直接的なライゲーションのために平滑末端化されることができる。
別の態様において、ライゲーション適合末端は、制限酵素部位を含むことができ、それはREにより切断されて、架橋されたゲノムDNA断片の平滑末端へのライゲーションに必要な必須の平滑末端を生成することができる。しかし、制限酵素による切断の前に、ライゲーション適合末端は、平滑末端化されることができ(例えば自己ライゲーションを防ぐための脱リン酸化された平滑末端)、または自己ライゲーションを防ぐ非適合性オーバーハングを有することができる。
特定の態様において、直接的なRNAリンカーは、自己ライゲーションしない。例えば、第1ポリヌクレオチドの3’末端は、第1ポリヌクレオチドの自己ライゲーション(自己環状化)を防ぐために、ジデオキシヌクレオチドまたは他の修飾ヌクレオチドによりブロックされることができる。RNA−DNAライゲーションが完了したら、第1ポリヌクレオチドのブロックされた3’末端は、ライゲーション適合末端の一部になり、RE消化により切断されてゲノムDNAライゲーションのための平滑末端を作り出すことができる。
特定の態様において、二本鎖領域は、第1制限酵素、例えばII型制限酵素(RE)に関する第1制限部位を含むことができる。RE認識部位は、REが切断する際に、それがRE部位の外側、第1ポリヌクレオチドの5’アデニル化された末端に対して5’側を切断するように、戦略的に配置されることができる。これは、直接的なRNAリンカーに連結されたRNAタグの生成を可能にする。例えば、MmeI認識部位は、二本鎖領域の末端に、第1ポリヌクレオチドの5’オーバーハングの5’末端に対して近位に配置されることができる。MmeI部位は、MmeIが切断する際に、2bpのオーバーハングを有する18bpの断片を含むRNAタグが、連結されたncRNA由来のcDNAにおいて生成されるような方向性であるように設計される。しかし、RE部位の配置は、第1ポリヌクレオチドの末端である必要はない。より内側の配置は、対応してより短いRNAタグ配列を生成する。第1ポリヌクレオチドがssDNA基質として用いられる場合(その5’オーバーハングが基質として用いられる場合とは対照的に)、RE部位は第1ポリヌクレオチドの5’末端に配置されることができるため、より長いRNAタグ配列が生成されることができる。
従って、特定の態様において、(第1(II型)制限酵素に関する)第1認識部位の最後のヌクレオチドは、第1ポリヌクレオチドの5’末端である。
特定の態様において、二本鎖領域は、ライゲーション適合末端において、またはその付近に、第2制限酵素、例えばII型制限酵素(RE)に関する第2制限部位を含むことができる。REは、第2RE認識部位に対して3’側であり第1ポリヌクレオチドに対して3’側(例えば、ライゲーションされたゲノムDNA中)を切断することができる。RE認識部位の方向性は、それが、連結されたゲノムDNAの末端配列に基づいてDNAタグを生成するような方式で配置される。特定の態様において、RE部位の配置は、二本鎖領域の末端である必要はない。より内部の配置は、対応してより短いDNAタグ配列を生成する。
特定の態様において、(第2(II型)制限酵素に関する)第2認識部位の最後のヌクレオチドは、ライゲーション適合性/平滑末端における塩基対合したヌクレオチドである。
特定の態様において、直接的なRNAリンカーは、RNAタグまたはDNAタグを生成するための制限酵素認識部位を有しない。
特定の態様において、直接的なRNAリンカーは、直接的なRNAリンカーを他の直接的なRNAリンカー(単数または複数)から区別する独特の配列(例えば“バーコード”)を含むことができる。
特定の態様において、第2ポリヌクレオチドは、脱リン酸化されている。
本発明のこの側面に従って生成されたPETポリヌクレオチドは、5’App ssDNAおよびその相補配列(すなわち第2ポリヌクレオチド)の間で形成された二本鎖領域に対応する中央領域を含む。この領域に関する特定の配列の要求は存在せず、その領域の長さは柔軟性がある(例えば数bpほどの短いもの、RNA−DNAリガーゼの基質の要求、そして逆転写酵素に関する基質の要求を支持するために十分に長いもの)が、より長い配列が、あらゆる所望されるRE認識部位、バーコード配列、または修飾ヌクレオチド(例えば親和性精製のためのビオチン化ヌクレオチド)を組み込むために用いられることができる。
従って、本発明の別の側面は、以下:(1)第1ポリヌクレオチド(5’アデニル化されていても、5’アデニル化されるのに適していてもどちらでもよい)の5’末端に対して近位の部位において非コードRNA(ncRNA)の配列タグ;および(2)ライゲーション適合末端に対して近位の部位においてゲノムDNAの配列タグにより隣接されている(直接的なRNAリンカーの)二本鎖領域を含む中央領域を含むペアエンドタグ(PET)ポリヌクレオチドを提供する。
関連する側面において、本発明は、対象のPETポリヌクレオチドの2以上のメンバーを含むペアエンドタグ(PET)ライブラリーを提供し、ここで、PETライブラリーのそれぞれのメンバーは、同じ前記の中央領域、および非コードRNA(ncRNA)の異なるRNA配列タグ、ゲノムDNAの異なるDNA配列タグ、または両方を含む。
さらに別の関連する側面において、本発明は、対象のPETポリヌクレオチドを含むベクターまたは組み換えベクターを提供する。
本発明のさらに別の側面は、ゲノムの非コードRNA(ncRNA)に関するゲノム内の機能的相互作用座位を同定する方法を提供し、その方法は、以下の工程を含む:(1)架橋されたゲノムDNA断片および架橋されたncRNAを含むクロマチン断片を提供し;(2)ncRNAの3’−OHを、5’を予めアデニル化されたssDNAにライゲーションし;(3)ssDNAの相補物を提供してssDNAおよび相補物の間で二本鎖領域を形成し、(4)必要であれば、二本鎖領域の末端において平滑末端を生成し;(5)その平滑末端を、架橋されたゲノムDNA断片の末端に、近接ライゲーションに関する条件下でライゲーションし;(6)PETポリヌクレオチドを配列決定分析のために単離し、ここで、そのPETポリヌクレオチドは、架橋されたゲノムDNA断片のDNAタグおよびncRNAのRNAタグにより隣接された二本鎖領域を含み;そして、(7)そのDNAタグおよびRNAタグを参照ゲノムに対してマッピングし、それにより参照ゲノムの非コードRNA(ncRNA)に関する参照ゲノム内の機能的相互作用座位を同定する。
本発明の代替の側面は、ゲノムの非コードRNA(ncRNA)に関するゲノム内の機能的相互作用座位を同定する方法を提供し、その方法は、以下の工程を含む:(1)架橋されたゲノムDNA断片および架橋されたncRNAを含むクロマチン断片を提供し;(2)ncRNAの3’−OHを、二本鎖領域を有するdsDNAの5’を予めアデニル化されたオーバーハングにライゲーションし、(4)必要であれば、二本鎖領域の末端において、5’を予めアデニル化されたオーバーハングに対して遠位に平滑末端を生成し;(5)その平滑末端を、架橋されたゲノムDNA断片の末端に、近接ライゲーションに関する条件下でライゲーションし;(6)PETポリヌクレオチドを配列決定分析のために単離し、ここで、そのPETポリヌクレオチドは、架橋されたゲノムDNA断片のDNAタグおよびncRNAのRNAタグにより隣接された二本鎖領域を含み;そして、(7)そのDNAタグおよびRNAタグを参照ゲノムに対してマッピングし、それにより参照ゲノムの非コードRNA(ncRNA)に関する参照ゲノム内の機能的相互作用座位を同定する。
特定の態様において、ssDNAの相補物(すなわち、第2ポリヌクレオチド)は、ssDNAと同じ長さを有する。特定の態様において、その相補物は、ssDNAより長いか、またはssDNAより短く、突出している3’または5’末端を有する二本鎖領域を形成する。後者の場合、そのオーバーハングは、酵素により埋められて、または平滑末端を生成する制限酵素により末端から切り離されることにより、ライゲーションに適した平滑末端を生成することができる。RE部位は、ssDNAの配列中に入るように設計されることができる。
特定の態様において、直接的なRNAリンカーの第1ポリヌクレオチドの長さは、約6、7、8、9、10、15、20、25、30、35、40、50、60塩基またはより多くの塩基である。
小節a)(RNAおよびDNAリンカー対)および小節b)(修飾RNAリンカー)において記載された第1および第2の特定の態様において記載されたような他の態様は、それぞれ一般的に適用可能であり、ここでも組み込まれる(が繰り返して述べない)。
そのように記載された本発明の一般的な側面により、以下の節は、本発明の特定の態様に関する追加の詳細ならびに特定の量およびパラメーターを提供する。本発明は、本発明の一般的な範囲から逸脱することなく、そのような詳細を用いずに、またはわずかな修正を加えて実施されることができることは、当業者には明らかであるものとする。
2.定義
“非コードRNA(ncRNA)”は、タンパク質に翻訳されないRNA分子を含む。頻度はより低いが、それは、非タンパク質コードRNA(npcRNA)、非メッセンジャーRNA(nmRNA)および機能性RNA(fRNA)と呼ばれる可能性もある。それは、通常は、タンパク質をコードする以外の機能を有する機能性RNAであるが、一部は非機能性である、または既知の機能を有しない可能性がある。時々、小さいRNA(sRNA)という用語が、しばしば短い細菌性ncRNAに関して用いられる。非コードRNAが転写されるDNA配列は、しばしばRNA遺伝子と呼ばれる。
非コードRNA遺伝子は、高度に豊富であり機能的に重要なRNA、例えば転移RNA(tRNA)およびリボソームRNA(rRNA)、ならびにsnoRNA(scRNAを含む;RNAのヌクレオチド修飾に関する)、snRNA(スプライシングおよび他の機能に関する)、gRNA(ガイドRNA;mRNAのヌクレオチド修飾に関する)、RNase P(tRNAの成熟に関する)RNase MRP(rRNAの成熟および/またはDNA複製に関する)、Y RNA(RNAプロセシングおよび/またはDNA複製に関する)、テロメラーゼRNA(テロメア合成に関する)スプライシングされたリーダーRNA、SmY RNA(mRNAのトランススプライシングに関する)、アンチセンスRNA、シス−天然アンチセンス転写産物、マイクロRNA(遺伝子制御に関する)siRNA(トランス作用性siRNAを含む;遺伝子制御に関する)、exRNA、およびpiRNA(リピート関連siRNAを含む;トランスポゾン防御に関し、他の機能である可能性もある)のようなRNA、7SK RNA(CDK9/サイクリンT複合体の負の制御に関する)、ならびにXistおよびHOTAIRのような例を含む長いncRNAを含む。ヒトゲノム内にコードされているncRNAの数は未知であるが、最近のトランスクリプトームおよび生物情報学の研究は、数千のncRNAの存在を示唆している。新規に同定されたncRNAの多くは、それらの機能に関して検証されていないため、多くが非機能性である可能性がある。
特定の態様において、本発明のncRNAは、上記で参照された種の1以上を一切含まない。例えば、特定の態様において、本発明のncRNAは、rRNAを含まない。特定の態様において、本発明のncRNAは、tRNAを含まない。特定の態様において、本発明のncRNAは、tRNAを含まない。
“制限酵素(RE)”および“制限エンドヌクレアーゼ”は、本明細書において、二本鎖DNAを切断する酵素を含むように互換的に用いられている。その酵素は、典型的には、“制限部位”または“RE認識部位”として知られる特定の認識ヌクレオチド配列において、その内部に、またはその付近(例えば、約数塩基〜約数キロ塩基)に2つの切り込みを作り、切り込みは塩基を損傷することなく二重らせんのホスフェート主鎖のそれぞれを通る。
制限酵素は、一般に3つのタイプに分類され、それは、それらの構造およびそれらがそれらのDNA基質をそれらの認識部位において切断するかどうか、またはその認識および切断部位が互いから離れているかどうかにおいて異なる。3000種類を越える制限酵素が、今までに詳細に研究されており、これらの600種類より多くが、商業的に入手可能であり、その多くが、分子生物学においてDNA修飾および操作のためにルーチン的に用いられている。
I型制限酵素は、それらの認識部位と異なり、それからランダムな距離(少なくとも1000bp)離れた部位を切断する。I型制限酵素の認識部位は非対称であり、約6〜8ヌクレオチドの非特異的スペーサーにより隔てられた2つの特異的な部分(1つは3〜4ヌクレオチドを含有し、別の部分は4〜5ヌクレオチドを含有する)からなる。これらの酵素は、多機能であり、標的DNAのメチル化状態に依存して、制限および修飾活性の両方が可能である。補助因子S−アデノシルメチオニン(AdoMet)、加水分解されたアデノシン3リン酸(ATP)およびマグネシウム(Mg2+)イオンが、それらの完全な活性のために必要とされる。
典型的なII型制限酵素は、ホモダイマーであり、通常は分割されておらず回文構造であり長さ4〜8ヌクレオチドである認識部位を有する。それらは、同じ部位においてDNAを認識および切断し、それらは、それらの活性のためにATPもAdoMetも用いず−それらは通常はMg2+のみを補助因子として必要とする。最近、新規のサブファミリーの命名法(1文字接尾辞を用いて定義される)が、この大きいファミリーをII型酵素の典型的な特徴からの逸脱に基づいてサブカテゴリーに分けるために開発された。例えば、IIB型制限酵素(例えば、BcgIおよびBplI)は、AdoMetおよびMg2+補助因子の両方を必要とする多量体であり、それらは、DNAをそれらの認識の両側で切断して、認識部位を切り抜く。IIE型制限エンドヌクレアーゼ(例えばNaeI)は、2コピーのそれらの認識配列との相互作用後にDNAを切断する。1つの認識部位は、切断のための標的として作用し、一方で他方の認識部位は、酵素切断の速度を上げるかまたは効率を向上させるアロステリック作用因子として作用する。IIE型酵素と類似して、IIF型制限エンドヌクレアーゼ(例えばNgoMIV)は、2コピーのそれらの認識配列と相互作用するが、両方の配列を同時に切断する。IIG型制限エンドヌクレアーゼ(Eco57I)は、古典的なII型制限酵素のように単一のサブユニットを有するが、活性であるために補助因子AdoMetを必要とする。IIM型制限エンドヌクレアーゼ、例えばDpnIは、メチル化されたDNAを認識して切断することができる。IIS型制限エンドヌクレアーゼ(例えばFokI)は、それらの非回文構造非対称認識部位から定められた距離においてDNAを切断する。すなわち、IIS型酵素は、それらの認識配列の外側(片側)で切断する。MmeIならびにIIS型制限酵素のほとんどは、変動する末端の長さをもたらす。Dunnら(2002)は、MmeIは18/20または19/21塩基離れた位置をおおよそ1:1の割合で切断し得ることを示した。従って、18/20がMmeI制限切断部位を記載するために用いられる場合、19/21も意図されている。IIT型制限酵素(例えばBpu10IおよびBslI)は、2個の異なるサブユニットからなる。一部は回文構造の配列を認識し、一方で他のものは非対称な認識部位を有する。
III型制限酵素(例えばEcoP15)は、逆を向いた2つの分離した非回文構造配列を認識する。それらは、認識部位の約20〜30塩基対後でDNAを切断する。これらの酵素は、1個より多くのサブユニットを含有し、DNAのメチル化および制限におけるそれらの役割のためにAdoMetおよびATP補助因子をそれぞれ必要とする。III型酵素は、短い5〜6bpの長さの非対称なDNA配列を認識し、25〜27bp下流を切断して短い一本鎖の5’突出を残す。それらは、2つの逆を向いたメチル化されていない認識部位の存在を、制限が起こるために必要とする。
制限酵素切断産物は、平滑末端であることができ、または5’もしくは3’オーバーハングを伴う粘着末端を有することもでき、その粘着末端断片は、それが元々切断された断片に対してだけでなく、適合する付着または粘着末端を有するあらゆる他の断片にもライゲーションされることができる。
“ヌクレオチド”は、本明細書で用いられる際、ヌクレオシドのリン酸エステル−核酸(DNAまたはRNA)の基本構造単位を含む。2個以上のヌクレオチド(例えば、2〜30、5〜25、10〜15ヌクレオチド)の短い鎖は、時々“オリゴヌクレオチド”と呼ばれ、一方でより長い鎖は、ポリヌクレオチドと呼ばれるが、その2つの用語の間に決定的な長さの限定は存在しない。ヌクレオチドという用語は、用語“核酸”と互換的に用いられることができる。ポリヌクレオチドは、一本鎖であることもそれぞれの鎖が5’末端および3’末端を有する二本鎖であることもできる。一続きの核酸の末端領域は、それぞれ5’末端および3’末端と呼ばれることができる。ポリヌクレオチド中のヌクレオチドは、天然ヌクレオチド(DNAに関してデオキシリボヌクレオチドA、T、C、またはG、およびRNAに関してリボヌクレオチドA、U、C、G)であることができ、または修飾ヌクレオチドを含むこともでき、それは、例えば化学合成によりポリヌクレオチド中に組み込まれることができる。そのような修飾ヌクレオチドは、天然ヌクレオチドに存在しない、または欠けている追加の望ましい特性を与えることができ、修飾ヌクレオチドを含むポリヌクレオチドは、本発明の組成物および方法において用いられることができる。
用語“プライマー”または“プライミング配列”は、核酸鎖に相補的なプライマー伸長産物の合成が誘導される条件下で、すなわち4種類の異なるヌクレオシド三リン酸および伸長のための因子(例えばDNAポリメラーゼまたは逆転写酵素)の存在下で、適切な緩衝液中で、かつ適切な温度において、DNA合成の開始の点として作用することができるオリゴヌクレオチドを指す。プライマーは、一本鎖DNAであることができる。プライマーの適切な長さは、プライマーの意図される用途に依存するが、典型的には10〜50ヌクレオチド、例えば15〜35ヌクレオチドの範囲である。短いプライマー分子は、一般に鋳型との十分に安定なハイブリッド複合体を形成するためにより低い温度を必要とする。プライマーは、鋳型核酸の正確な配列を反映する必要はないが、鋳型とハイブリダイズするために十分に相補的でなければならない。所与の標的配列の増幅のための適切なプライマーの設計は、当該技術で周知であり、例えば本明細書で引用される文献において記載されている。
“プローブ”は、一般に、標的配列のcDNAまたはmRNA、例えばCCAT1 ncRNA配列またはそのcDNAの少なくとも一部の存在を検出するために用いられる、核酸分子またはそれと相補的な配列を指す。検出は、プローブおよびアッセイされる標的配列の間のハイブリダイゼーション複合体の同定により実施されることができる。プローブは、固体支持体に、または検出可能な標識に結合していることができる。プローブは、一般に一本鎖であろう。プローブ(単数または複数)は、典型的には10〜200ヌクレオチドを含む。プローブの個々の特性は、個々の用途に依存すると考えられ、当業者の決定する能力の範囲内である。一般に、プローブは、高ストリンジェンシーハイブリダイゼーションの条件下で、標的cDNAまたはRNAの少なくとも一部にハイブリダイズするであろう。
“アダプター”は、ライゲーションされる予定のオリゴヌクレオチド分子を指し、または核酸分子の末端にライゲーションされている。アダプターは、増幅(PCRプライマー配列を有するPCRアダプター)、配列決定(配列決定プライマー配列を有する)、および/または核酸断片のベクター中への挿入(適切なクローニング配列、例えばRE認識部位を有する)のために用いられることができる。
“コンカテマー”は、通常は、末端同士が連結され、場合によりリンカーまたはスペーサーにより隔てられた、少なくとも2個のヌクレオチドモノマー配列からなる。モノマーは、配列が同じである可能性も同じでない可能性もあるが、類似の構造要素(例えば本発明のRNAおよびDNAリンカー)を有し得る。モノマーは、同じ向きである可能性も異なる向きである可能性もある(例えば、コンカテマー内のモノマーは、互いにヘッドトゥーヘッド、ヘッドトゥーテール、または両方の混合で連結されている可能性がある)。本発明のコンカテマーは、本発明の方法に従って調製された少なくとも2つのオリゴヌクレオチド(例えばPETポリヌクレオチド)を含む。
“ライブラリー”は、同様の核酸配列、オリゴヌクレオチド、またはポリヌクレオチドの集合を含み、ライブラリーのそれぞれのメンバーは、1以上の定義する(defining)特徴を共有している。例えば、本発明のPETポリヌクレオチドのライブラリーは、2以上(例えば、数万、数十万、数百万、数千万等)の本発明のPETポリヌクレオチドを含み、それぞれのPETポリヌクレオチドは、類似または同一の構造を共有しているが、異なるDNAおよび/またはRNAタグ配列を有する。
“ベクター”または“組み換えベクター”は、内部に含有される遺伝物質(例えば、クローニングされた遺伝情報またはクローニングされたDNA)をある細胞から別の細胞に移動させる、または増幅することができるバクテリオファージ、プラスミド、または他の媒介物を指す、当該技術で認められている用語である。そのようなベクターは、特定の性質および特徴に応じて、異なる宿主細胞中に、トランスフェクションおよび/または形質転換、例えばリポフェクション、リン酸カルシウム沈殿、レトロウイルス送達、電気穿孔法、および微粒子銃形質転換、ならびに当該技術で利用可能なあらゆる他の分子生物学の技法により導入されることができる。
適切なベクターは、異種遺伝子配列の挿入または組み込みにより操作されているプラスミド、ウイルスベクターまたは当該技術で既知の他の媒介物を含み得る。そのようなベクターは、適切な宿主増幅のための複製起点、クローニングされた配列の効率的な転写を促進することができるプロモーター配列、クローニングされた配列の直接的な増幅のための隣接しているPCRプライマーを含有し得る。ベクターは、形質転換された細胞の表現型選択を可能にする特定の遺伝子も含み得る。本発明における使用に適したベクターは、例えば、pBlueScript(Stratagene,カリフォルニア州ラホヤ);pBC、pZErO−1(Invitrogen,カリフォルニア州カールスバッド)およびpGEM3z(Promega,ウィスコンシン州マディソン)またはそれらの改変ベクターならびに当業者に既知の他の類似のベクターを含む。例えば、本明細書に参照により援用される米国特許第4,766,072号において開示されているpGEMベクターを参照。
“クロマチン”は、細胞核中の核酸およびタンパク質、主にヒストンの複合体を記載するために用いられ、それは塩基性色素により容易に染色され、細胞分裂の間に凝集して染色体を形成する。クロマチンは、核酸−タンパク質複合体の一例である。
“タグ”は、本明細書で用いられる際、参照ゲノム内の配列の由来を独特に同定することができる同定可能な一続きの核酸の配列を含む。タグは、そのタグを参照ゲノム中の1つまたはいくつかの位置(例えばある遺伝子または高い配列の同一性を有する関連遺伝子の二重コピー)に独特にまたは明確にマッピングする十分な長さ(通常は18〜20bpであるが、配列の組成ならびに参照ゲノムの大きさおよび複雑さ等に応じてより短いこともできる)であることができる。本発明のDNAタグは、ゲノムDNA配列に由来する。それは、ncRNA、またはncRNAのcDNAに、例えば本発明のDNAリンカーおよびRNAリンカー(または本発明の修飾RNAリンカー、または本発明の直接的なRNAリンカー)を通して連結されることができる。本発明のRNAタグは、ncRNA、またはncRNAから逆転写されたcDNAに由来する。RNAタグは、ゲノムDNAに、例えば本発明のDNAリンカーおよびRNAリンカー(または本発明の修飾RNAリンカー、または本発明の直接的なRNAリンカー)を通して連結されることができる。
本発明のRNAまたはDNAタグは、あらゆる大きさであることができるが、それが由来する親配列の大きさよりも意味があり、有利である必要がある。特定の態様において、DNAまたはRNAタグの大きさは、ゲノムの複雑さにより決定される。細菌ゲノムに関して、約8bp〜約16bpのタグで十分である可能性があり、一方でヒトゲノムのような複雑なゲノムに関しては、16〜20bpのタグが考慮され得る。
“リンカー”は、通常は特定の目的、例えば2個のポリヌクレオチドを一緒に連結するために設計された核酸の人工配列である。本発明の“RNAリンカー”は、本発明のDNAリンカーに、そしてRNA、例えば架橋された非コードRNAの遊離3’末端から合成されたcDNAに連結されるように設計されている。本発明の“DNAリンカー”は、本発明のRNAリンカーに、そしてDNA、例えばクロマチン断片に架橋された染色体DNAの遊離末端に連結されるように設計されている。本発明の“修飾RNAリンカー”は、一方の末端(例えば平滑末端または平滑末端を生成することができるライゲーション適合末端)においてゲノムDNA断片に、そして他方の末端においてRNA、例えば架橋された非コードRNAの遊離3’末端から合成されたcDNAに連結されるように設計されている。本発明の“直接的なRNAリンカー”は、ncRNAの3’−OHに予めアデニル化された5’末端を通して直接連結されるように、そして他方の末端(例えば平滑末端または平滑末端を生成することができるライゲーション適合末端)においてゲノムDNA断片に連結されるように設計されている。
“配列決定”は、生体ポリマー、この場合は核酸中の構成要素の順序を決定するために用いられる様々な方法をさす。本発明と共に用いられることができる適切な配列決定技法は、伝統的な鎖終結サンガー法、ならびに多くの商業的な源から利用可能ないわゆる次世代(高スループット)配列決定、例えば大規模並行署名配列決定(またはMPSS、Lynx Therapeutics/Solexa/Illuminaによる)、ポロニー配列決定(Life Technologies)、パイロ配列決定または“454配列決定”(454 Life Sciences/Roche Diagnostics)、ライゲーションによる配列決定(SOLiD配列決定、Applied Biosystems/Life Technologiesによる)、合成による配列決定(Solexa/Illumina)、DNAナノボール配列決定、heliscope配列決定(Helicos Biosciences)、ion半導体またはIon Torrent配列決定(Ion Torrent Systems Inc./Life Technologies)、および単分子リアルタイム(SMRT)配列決定(Pacific Bio)等を含む。数多くの他の高スループット配列決定法が、まだ開発されており、または完成しており、それらも本発明のPETポリヌクレオチドを配列決定するために用いられることができ、それはナノポアDNA配列決定、ハイブリダイゼーションによる配列決定、質量分析による配列決定、微小流体サンガー配列決定、透過型電子顕微鏡DNA配列決定、PNAP配列決定、およびインビトロウイルス高スループット配列決定等を含む。
特定の態様において、配列決定法は、対象のPETポリヌクレオチドの両側からタグを配列決定することができ、従ってペアエンドタグの情報を提供することができる。特定の態様において、配列決定法は、変動可能な長さの長いDNA断片、例えば対象PETポリヌクレオチドのコンカテマーにおいて読みを実施することができる。
“参照ゲノム”は、対象の生物のゲノム、またはncRNAおよびゲノムDNAが由来するゲノムを指す。本発明の方法および組成物は、数多くの古細菌または真正細菌、原生生物、真菌(例えば出芽酵母(S.cerevisae)または分裂酵母)、植物、動物ゲノムを含む、完全または実質的に完全な配列が入手可能であるあらゆる参照ゲノムに適用される。例えば、ヒト、マウスおよび数多くの他の哺乳類および非哺乳類種のゲノム配列は、現在パブリックドメインにおいて容易に入手可能である。例えば、Venter et al., “The Sequence of the Human Genome,” Science, 291(5507):1304-1351, 2001を参照。他の非限定的な参照ゲノムは、数多くの非ヒト霊長類、哺乳類、げっ歯類(ラット、マウス、ハムスター、ウサギ等)、家畜動物(ウシ、ブタ、ウマ、ヒツジ、ヤギ)、鳥類(ニワトリ)、爬虫類、両生類(アフリカツメガエル)、魚類(ゼブラフィッシュ(ダニオ・レリオ(Danio rerio))、フグ)、昆虫(ショウジョウバエ(Drosophila)、蚊)、線虫、寄生生物、真菌(例えば酵母、例えば出芽酵母(S.cerevisae)または分裂酵母)、様々な植物、ウイルス(例えば宿主ゲノム中に組み込まれたウイルス)等を含む。
ロックド(Locked)核酸(LNA)は、LNAヌクレオチドのリボース部分が2’酸素および4’炭素を連結する余分な架橋で修飾されている修飾RNAヌクレオチドである。その架橋は、リボースを3’−エンド立体配座で“ロック”する。LNAヌクレオチドは、所望される場合はいつでもオリゴヌクレオチド中でDNAまたはRNA残基と混合されることができる。そのようなオリゴマーは、化学的に合成され、商業的に入手可能である。ロックされたリボースの立体配座は、塩基のスタッキングおよび主鎖の前組織化(pre−organization)を増進する。これは、オリゴヌクレオチドのハイブリダイゼーション特性(融解温度)著しく高める。
ペプチド核酸(PNA)は、DNAまたはRNAに類似の人工的に合成されたポリマーである。PNAオリゴマーは、相補的DNAへの結合においてより大きな特異性を示し、PNA/DNAの塩基のミスマッチは、DNA/DNA二本鎖における類似のミスマッチよりも大きく不安定化する。この結合強度および特異性は、PNA/RNA二本鎖にも当てはまる。
本発明の“ペアエンドタグ(PET)ポリヌクレオチドは、一方の末端において、またはその付近に、ncRNA由来のRNAタグがあり、そして他方の末端において、またはその付近に、ゲノムDNA由来のDNAタグがあるポリヌクレオチドであり、ここで、ncRNAおよびゲノムDNAは、好ましくは同じクロマチン断片に架橋されている。その意味で、PETポリヌクレオチドの2つの末端のRNAおよびDNAタグは対になっており、架橋の時点におけるncRNAおよびゲノムDNAの間の物理的近接の事象を反映している。
“近接ライゲーション条件”は、近接しているライゲーション可能なポリヌクレオチド末端、例えば同じクロマチン断片に架橋されているゲノムDNAおよびncRNAが優先的にライゲーションされる、ポリヌクレオチドライゲーション反応に関する条件を指す。一方で、近接していないライゲーション可能なポリヌクレオチド末端、例えば異なるクロマチン断片に架橋されたゲノムDNAおよびncRNAは、ライゲーションされないか、または実質的にライゲーションされない。そのようなライゲーション条件は、同じクロマチン断片上のライゲーション可能な末端が、それらの互いに対する物理的近接のために、異なるクロマチン断片上のライゲーション可能な末端の間のライゲーションよりもライゲーションされる可能性が遥かに高いような、大体積ライゲーション(large volume ligation)を含む。
“(配列タグのゲノムへの)マッピング”は、ゲノム中の配列タグのゲノム位置の同定を含む。
“二官能性架橋剤/試薬”または“架橋剤/試薬”は、2個以上の反応基を有し、それぞれが1つの部分(例えばDNA、RNA、またはタンパク質)と反応することができ、そうして2つの部分が別々の分子である場合にその2つの部分を架橋して一緒にする修飾剤を含む。そのような二官能性クロスリンカーは、当該技術で周知である(例えば、Isalm and Dent in Bioconjugation, Chapter 5, pp. 218-363, Groves Dictionaries Inc., ニューヨーク, 1999を参照)。例えば、ホルムアルデヒド、グルタルアルデヒド、またはアルデヒド反応基を有する他の類似の試薬は、タンパク質中の第一級アミノ基を、タンパク質またはDNA中の他の近くの窒素原子と、メチレン(−CH2−)連結により架橋することができる。チオエーテル結合を介した連結を可能にする他の二官能性架橋剤は、マレイミド基を導入するためのN−スクシンイミジル−4−(N−マレイミドメチル)−シクロヘキサン−1−カルボキシレート(SMCC)、またはヨードアセチル基を導入するためのN−スクシンイミジル−4−(ヨードアセチル)−アミノベンゾエート(SIAB)を含む。マレイミド基またはハロアセチル基をポリペプチド上に導入する他の二官能性架橋剤は、当該技術で周知であり(例えば、米国特許出願第2008/0050310号、第2005/0169933号を参照、Pierce Biotechnology Inc. P.O. Box 117,Rockland,IL 61105,米国から入手可能)、以下のものを含むが、それらに限定されない:ビス-マレイミドポリエチレングリコール(BMPEO)、BM(PEO)2、BM(PEO)3、N−(β−マレイミドプロピルオキシ)スクシンイミドエステル(BMPS)、γ−マレイミド酪酸 N−スクシンイミジルエステル(GMBS)、ε−マレイミドカプロン酸 N−ヒドロキシスクシンイミドエステル(EMCS)、5−マレイミド吉草酸 NHS、HBVS、SMCCの“長鎖”類似体(LC−SMCC)であるN−スクシンイミジル−4−(N−マレイミドメチル)−シクロヘキサン−1−カルボキシ−(6−アミドカプロエート)、m−マレイミドベンゾイル−N−ヒドロキシスクシンイミドエステル(MBS)、4−(4−N−マレイミドフェニル)−酪酸ヒドラジドまたはHCl塩(MPBH)、N−スクシンイミジル 3−(ブロモアセトアミド)プロピオネート(SBAP)、N−スクシンイミジル ヨードアセテート(SIA)、κ−マレイミドウンデカン酸 N−スクシンイミジルエステル(KMUA)、N−スクシンイミジル 4−(p−マレイミドフェニル)−ブチレート(SMPB)、スクシンイミジル−6−(β−マレイミドプロピオンアミド)ヘキサノエート(SMPH)、スクシンイミジル−(4−ビニルスルホニル)ベンゾエート(SVSB)、ジチオビス−マレイミドエタン(DTME)、1,4−ビス−マレイミドブタン(BMB)、1,4−ビスマレイミジル−2,3−ジヒドロキシブタン(BMDB)、ビス−マレイミドヘキサン(BMH)、ビス−マレイミドエタン(BMOE)、スルホスクシンイミジル 4−(N−マレイミド−メチル)シクロヘキサン−1−カルボキシレート(スルホ−SMCC)、スルホスクシンイミジル(4−ヨード−アセチル)アミノベンゾエート(スルホ−SIAB)、m−マレイミドベンゾイル−N−ヒドロキシスルホスクシンイミドエステル(スルホ−MBS)、N−(γ−マレイミドブチリルオキシ)スルホスクシンイミドエステル(N−(γ−maleimidobutryloxy)sulfosuccinimde ester)(スルホ−GMBS)、N−(ε−マレイミドカプロイルオキシ)スルホスクシンイミドエステル(N−(ε−maleimidocaproyloxy)sulfosuccimido ester)(スルホ−EMCS)、N−(κ−マレイミドウンデカノイルオキシ)スルホスクシンイミドエステル(スルホ−KMUS)、およびスルホスクシンイミジル 4−(p−マレイミドフェニル)ブチレート(スルホ−SMPB)。
架橋のために用いられることができるヘテロ二官能性架橋剤は、アミン反応性N−ヒドロキシスクシンイミド基(NHS基)、および/またはカルボニル反応性ヒドラジン基を含有し得る。そのような商業的に入手可能なヘテロ二官能性架橋剤の例は、スクシンイミジル 6−ヒドラジノニコチンアミド アセトン ヒドラゾン(SANH)、スクシンイミジル 4−ヒドラジドテレフタレート塩酸塩(SHTH)およびスクシンイミジル ヒドラジニウム ニコチネート塩酸塩(SHNH)を含む。酸不安定性結合を有するコンジュゲートも、本発明のヒドラジンを有するベンゾジアゼピン誘導体を用いて調製されることができる。用いられることができる二官能性架橋剤の例は、スクシンイミジル−p−ホルミル ベンゾエート(SFB)およびスクシンイミジル−p−ホルミルフェノキシアセテート(SFPA)を含む。
ジスルフィド結合を介する架橋を可能にする他の二官能性架橋剤が、当該技術で既知であり、ジチオピリジル基を導入するためのN−スクシンイミジル−3−(2−ピリジルジチオ)プロピオネート(SPDP)、N−スクシンイミジル−4−(2−ピリジルジチオ)ペンタノエート(SPP)、N−スクシンイミジル−4−(2−ピリジルジチオ)ブタノエート(SPDB)、N−スクシンイミジル−4−(2−ピリジルジチオ)2−スルホ ブタノエート(スルホ−SPDB)を含む。ジスルフィド基を導入するために用いられることができる他の二官能性架橋剤が、当該技術で既知であり、米国特許第6,913,748号、第6,716,821号ならびに米国特許公開第2009/0274713号および第2010/0129314号において開示されており、その全部が参照により本明細書に援用される。あるいは、チオール基を導入する架橋剤、例えば2−イミノチオラン、ホモシステインチオラクトンまたはS−アセチルコハク酸無水物が用いられることもできる。
上記の二官能性架橋試薬の2種類以上が、クロマチン断片中のDNA、RNA、およびタンパク質を架橋するために一緒に用いられることができる。
3.制限酵素
本発明のDNAおよび/またはRNAリンカーが制限酵素認識部位を含むことは、必要とされない。実際、特定の態様において、本発明のDNAおよび/またはRNAリンカーは、制限酵素認識部位を含まないことが望ましい可能性さえある。しかし、特定の態様において、本発明のDNAおよび/またはRNAリンカーは、少なくとも1個のRE認識部位、例えばII型RE認識部位(例えばIIS型RE部位)を含むことができる。
一般に、RE切断の結果が、所望の長さ、例えば10〜20bpのDNAまたはRNAタグを生成するならば、当該技術で既知のあらゆるREおよびそれらの認識部位が用いられることができる。核酸分子内の少なくとも1個の認識部位を認識し、本発明と共に用いられることができるような制限酵素は、特に本明細書および説明的な実施例において提供される手引きを考慮すれば、当業者には明らかであろう。例えば、Current Protocols in Molecular Biology, 第2巻, 1995, 編者Ausubel, et al., Greene Publish. Assoc. & Wiley Interscience, Unit 3.1.15;および最新のNew England Biolabsのカタログまたはウェブサイトの情報(2005年およびそれ以降)を参照。
可能な制限酵素認識部位および同じ物を認識する対応する制限酵素の非排他的なリストが、下記で報告されている。
一例として、IIS型RE、例えばMmeIは、ライゲーションされたRNA−DNAリンカーに隣接する一定の長さのDNAまたはRNAタグを生成するために用いられることができる。特に、MmeI認識部位は、RNAまたはDNAリンカーの二本鎖領域の末端に、MmeI切断の際にそのRNAまたはDNA配列に由来する17〜21bpのタグ配列が今ライゲーションされたRNAリンカーおよびDNAリンカーに連結されているように、配置されることができる。1つのMmeI部位がRNAおよびDNAリンカーのそれぞれの中に現れる場合、2つの生成されたタグ(1つはDNAタグ、別のタグはRNAタグ)が、今ライゲーションされたRNAリンカーおよびDNAリンカーに隣接する。その2つのタグは、さらなる下流の操作、例えばPCR増幅、コンカテマー化、または配列決定が実施されることができるように、平滑末端化により追加で処理されることができる。
本発明と共に用いられることができる一部の網羅的ではないII型制限酵素の例は、以下の制限酵素を含む:AarI、AceIII、AloI、BaeI、Bbr7I、BbvI、BbvII、BccI、Bce83I、BceAI、BcefI、BcgI、BciVI、BfiI、BinI、BplI、BsaXI、BscAI、BseMII、BseRI、BsgI、BsmI、BsmAI、BsmFI、Bsp24I、BspCNI、BspMI、BsrI、BsrDI、BstF5I、BtgZI、BtsI、CjeI、CjePI、EciI、Eco31I、Eco57I、Eco57MI、Esp3I、FalI、FauI、FokI、GsuI、HaeIV、HgaI、Hin4I、HphI、HpyAV、Ksp632I、MboII、MlyI、MmeI、MnlI、PleI、PpiI、PsrI、RleAI、SapI、SfaNI、SspD5I、Sth132I、StsI、TaqII、TspDTI、TspGWI、TspRIおよびTth111II(Rebase Enzymesのウェブサイトにおけるリストを参照:rebase.neb.com/cgi-bin/outsidelist;Szybalski, W., 1985, Gene, 40:169も参照)。所望の長さ(例えば10〜25bp〜数百bp)のタグ配列を生成することができる類似の特性を有する、当該技術で既知の他の適切なRE酵素または後に発見される適切なRE酵素も、本発明を実施するために用いられることができる。
特定の態様において、制限酵素は、IIS型酵素である。特定の態様において、REは、約10〜25bpまたは15〜20bpのDNAまたはRNAタグ配列を生成する。特定の態様において、REは、MmeIまたはGsuIである。
いくつかのクラスII制限酵素の認識部位および切断部位の他の例は、以下のものを含む(カッコ中にあるのは認識部位および切断部位である):BbvI(GCAGC 8/12)、HgaI(GACGC 5/10)、BsmFI(GGGAC 10/14)、SfaNI(GCATC 5/9)、およびBspI(ACCTGC 4/8)。
人工制限エンドヌクレアーゼも、用いられることができる。これらのエンドヌクレアーゼは、タンパク質工学より調製されることができる。例えば、エンドヌクレアーゼFokIは、それがDNA基質の両方の鎖上のその認識部位からさらに離れた1個のヌクレオチドを切断するように、挿入により操作されている。Li and Chandrasegaran, Proc. Nat. Acad. Sciences USA, 90:2764-8, 1993を参照。そのような技法は、望ましい認識配列および望ましい認識部位から切断部位までの距離を有する制限エンドヌクレアーゼを調製するように適用されることができる。
従って、特定の態様において、本発明の組成物および方法に有用であり得るRE酵素は、人工制限エンドヌクレアーゼ、例えば認識部位の外側でIIS型のタイプの切断断片を生成することができる人工制限エンドヌクレアーゼを含む。しかし、特定の他の態様において、本発明の組成物および方法に有用であり得るRE酵素は、人工制限エンドヌクレアーゼを除外する。
特定の態様において、IIB型制限酵素認識部位は、デザイン(design)DNAおよび/またはRNAリンカー中に組み込まれることができる。IIB型制限酵素(例えばBcgIおよびBplI)は、AdoMetおよびMg2+補助因子の両方を必要とする多量体であり、それらは、それらの認識の両側でDNAを切断して認識部位を切り抜く。従って、IIB型RE部位は、連結されたRNAおよびDNAリンカーにかかる(span)、もしくはまたがる(straddle)(例えば、ライゲーションされたDNAおよびRNAリンカーが完全なIIB型RE部位を再構成するように、RE部位の一部がRNAリンカー上にあり、RE部位の残りの部分がDNAリンカー上にある)、または完全にRNAリンカーもしくはDNAリンカーの内部にあるように操作されることができる。IIB型REによる消化の際に、RNAおよびDNAタグの両方が生成されることができる。
特定の態様において、IIG型RE(例えばAcuI)認識部位は、IIS型RE部位の代わりに用いられることができる。そのようなIIG型REは、連続する配列を認識し、片側においてのみ切断する(AcuI)。
全ての適切なII型RE、例えばその認識配列の外側を片側または両側で切断するII型REの認識部位のリストは、様々な源から得られることができる。例えば、本明細書に参照により援用される、A. Pingoudにより編集されたRestriction Endonucleases (Nucleic Acids and Molecular Biology), Springer;2004年版(2004年12月1日)を参照。また、New England Biolabsの2010年のカタログおよびその後の更新(参照により本明細書に援用される)も参照。
特定の態様において、I型制限酵素も、RNAまたはDNAタグ、特にDNAタグを生成するために用いられることができる。例えば、I型RE認識部位は、DNAリンカー中に、REが連結された染色体DNAにおいてランダムな距離で切断するように含まれることができる。
特定の態様において、III型RE認識部位(例えば、EcoP15I部位)が、RNAおよび/またはDNAリンカー中で用いられることができる。III型RE酵素は、それらの認識配列の外側で切断し、同じDNA分子内の2個の逆向きのそのような配列を切断を成し遂げるために必要とする。それぞれの切断のための2個の必要とされる認識部位は、DNAリンカー内に完全に含有されていることができ、またはRNAリンカー内に完全に含有されていることもでき、または両方のリンカー中に(正しく連結されたRNA−DNAリンカーのみがRE認識部位を再生させるように)含有されていることもできる。
III型制限部位(単数または複数)およびIII型酵素(単数または複数)の例が、例えばMatsumura et al., SuperSAGE, Proc. Natl. Acad. Sci., USA 100(26):15718-23 (Dec. 2003); Moencke-Buchner et al., J. Biotechnol., 114: 99-106, 2004; Mucke et al., J. Mol. Biol,. 312: 687-698, 2001; Rao et al., J. Mol. Biol., 209: 599-606, 1989; Hadi et al., J. Mol. Biol,. 134: 655-666, 1979において記載されており、全て参照により本明細書に援用される。III型制限酵素は、New England Biolabs(NEB)から購入されることもできる。特に、本発明の態様を実施するための典型的なIII型REは、III型酵素EcoP15Iである。EcoP15Iの認識部位(単数または複数)は、CAGCAG(25/27)である。
上記の制限部位の全てが、DNAまたはRNAリンカーにおいて一緒に用いられることができる。例えば、RNAリンカーは、IIS型RE部位を含むことができ、対応するDNAリンカーは、RE部位を有しない、IIG型部位を有する、またはIII型RE部位を有することができる、等。
4.コンカテマーおよびライブラリー
特定の態様において、本発明の単離されたPETポリヌクレオチドは、他の単離されたPETポリヌクレオチドと繋がれて、またはコンカテマー化されて、PETポリヌクレオチドのコンカテマーを形成することができる。あらゆる数のPETポリヌクレオチドが、配列決定の目的のために、または適切なプラスミドもしくはベクター中へのクローニングのために、一緒に繋げられることができる。
従って、別の側面において、本発明は、少なくとも2個のPETポリヌクレオチドを含むPETポリヌクレオチドのコンカテマーを提供し、それぞれが、少なくとも1個のDNAタグおよび少なくとも1個のRNAタグを含み、ここで、DNAタグは染色体またはゲノムDNAから得られ、RNAタグはncRNAのcDNAから得られ、ここで、DNAおよびncRNAのcDNAは、架橋された核酸−タンパク質複合体から、本発明のRNA/DNAリンカーおよび方法を用いて得られる。
従って、PETポリヌクレオチドのコンカテマーのそれぞれのPETポリヌクレオチドは、RNAタグ−RNAリンカー−DNAリンカー−DNAタグ(または逆の方向性)の一般構造を有することができる。
コンカテマーは、多くの当該技術で認められている方法のいずれかにより形成されることができる。特に、長さが制御されるコンカテマー化の方法(Ruan et al.、米国特許出願公開第2008/0124707 A1号、参照により本明細書に援用される)が用いられることができる。別の例において、単離されたPETポリヌクレオチドは、必要であれば、両方の末端において、その末端が(II型)制限酵素により消化されることができる1個以上のアダプターオリゴヌクレオチド(単数または複数)に連結される前に、仕上げされる(polished)ことができる。消化産物は、個々のPETポリヌクレオチドのコンカテマー化を促進することができる適合性粘着末端を有することができる。RE部位が、PETポリヌクレオチドの末端に連結された全部のアダプターに関して同じである場合、全部の粘着末端が、ライゲーションおよびコンカテマー化に適合性であり、個々のPETポリヌクレオチドは、ヘッドトゥーテール様式またはヘッドトゥーヘッド様式のどちらでも、独立して一緒に連結されることができる。アダプターが異なる場合、例えば、第1RE部位を有する第1アダプターがRNAタグに連結されることができ、一方で第2(異なる)RE部位を有する第2アダプターがDNAタグに連結されることができる。コンカテマー化の際は、全部のPETポリヌクレオチドが、ヘッドトゥーヘッド様式で連結されるであろう。
従って、PETポリヌクレオチドのコンカテマーのそれぞれのPETポリヌクレオチドは、独立して(末端のPETポリヌクレオチドに関して)1個または(内部のポリヌクレオチドに関して)2個の別のPETポリヌクレオチドに、ヘッドトゥーテールまたはヘッドトゥーヘッド様式で連結されていることができる。特定の態様において、コンカテマー内の全部のPETポリヌクレオチドは、ヘッドトゥーヘッド様式で連結されている。
PETポリヌクレオチドのDNAおよび/またはRNAリンカーは、少なくとも1個の制限酵素認識部位、例えばIIS型制限酵素(例えばMmeIまたはGsuI)に関するRE認識部位を含むことができる。
PETポリヌクレオチドのコンカテマーは、ベクターもしくは細胞中に挿入される、またはベクターもしくは細胞においてクローニングされることができ;その細胞は、細菌細胞であることができる。PETポリヌクレオチドのクローニングされたコンカテマーは、所望であればREにより消化され、個々に単離されることができる。
コンカテマー化され得る本発明のPETポリヌクレオチドの数はPETポリヌクレオチドの長さに依存することは、明らかであると考えられ、それは、当業者により過度の実験操作なしに容易に決定されることができる。コンカテマーの形成後、多重タグは、配列分析のためにベクター中にクローニングされることができ、またはそのコンカテマーは、当業者に既知の方法により、例えば本明細書で記載される、もしくは当該技術で既知の、単分子配列決定法を含むいわゆる次世代高スループット配列決定法のいずれかにより、クローニングを用いずに直接配列決定されることもできる。従って、PETポリヌクレオチドのコンカテマー化は、多数のPETポリヌクレオチドを単一のベクターまたはクローン内で配列決定することによる連続的な様式での核酸分子の効率的な分析を可能にする。
関連する側面において、本発明は、少なくとも2個のPETポリヌクレオチドを含むPETポリヌクレオチドのライブラリーを提供し、それぞれが少なくとも1個のDNAタグおよび少なくとも1個のRNAタグを含み、ここで、DNAタグは、染色体またはゲノムDNAから得られ、RNAタグは、ncRNAのcDNAから得られ、ここで、DNAおよびncRNAのcDNAは、架橋された核酸−タンパク質複合体から、RNA/DNAリンカーおよび本発明の方法を用いて得られる。
特定の態様において、ライブラリーは、1000万までのPETポリヌクレオチド、または100万、10万、1万、1000、100、もしくは10までのPETポリヌクレオチドを含むことができる。
特定の態様において、ライブラリーは、あらゆる増幅、例えばPCR増幅を経ていない。
特定の態様において、ライブラリーは、ライブラリー内の少なくとも2つのメンバーが、増幅、例えばPCR増幅、ローリングサークル増幅、クローニングされた遺伝物質の生物学的増幅、またはあらゆる他の既知の増幅法に由来するように、増幅されている。PCRプライマーおよびプローブの配列は、PETポリヌクレオチドの末端に連結されたPCRアダプターの情報に基づいて、またはクローニングされたPETポリヌクレオチドもしくはそのコンカテマーに隣接するクローニングベクター上のプライマー配列に基づいて調製されることができる。
次いで、PETポリヌクレオチドを含有するPCRまたは他の増幅産物は、(アダプター内の)隣接するRE制限部位を認識する酵素を用いて単離されて増幅されたライブラリーを生成することができ、それは、多くの下流の分析の全てのために用いられることができる。
特定の態様において、増幅の前または後のPETポリヌクレオチドコンカテマーは、適切な大きさに関して、ゲル電気泳動およびゲルの切り出しを含むあらゆる標準的な方法により選択されることができる。適切な大きさに関する選択における主な考慮事項は、その大きさが、プライマーダイマーおよびアニーリングしなかったアダプターの大きさより上であり、特定の長い線状多量体の大きさより下であるべきであることである。特に、おおよそ100〜1000bp、または200〜500bpの大きさを有するコンカテマーが、選択されることができる。従って、大きさの選択により、利点は、長い線状多量体が、それらの大きさがその大きさの範囲より上であろうために排除され得ることである。同様に、短すぎる断片、アニーリングしなかったアダプターおよびプライマーダイマーも、排除されることができる。
5.クロマチン免疫沈降(ChIP)
特定の態様において、本発明の方法は、特定のncRNA−クロマチン/タンパク質−DNA相互作用を同定するために用いられることができる。例えば、特定の態様において、特定のクロマチン構成要素またはタンパク質と関係するあらゆるncRNA−DNA−クロマチン相互作用を決定することは、興味深い可能性がある。本発明の方法は、さらに、対象のタンパク質を免疫沈降するためにChIPを用いることを含む。
ChIPは、特定のタンパク質、例えばヒストンおよび核酸に核酸−タンパク質複合体で結合する他のタンパク質と会合するゲノム領域を富化し、それによりその同定を可能にするために用いられてきた(Taverner et al., Genome Biol., 2004, 5(3):210において総説されている)。その目的は、タンパク質をDNAと、それらの相互作用の部位において架橋することである。
これは、適切な固定剤、例えばホルムアルデヒド、パラホルムアルデヒド、グルタルアルデヒド、アセトン、メタノール、または他の二官能性架橋試薬(またはその混合物)を、培養状態の生きた細胞に直接添加することにより、迅速かつ効率的に成し遂げられることができる。次いで、これらの固定された細胞の粗製の抽出物が調製され、本発明の方法に従ってクロマチンが断片化される。例えば、断片化は、所望の平均の大きさ(例えば通常は約1kb)が達成されるような物理的剪断(例えば超音波処理、水力剪断、皮下注射針を通す吸い込みの繰り返しによる剪断)によって達成されることも、または酵素消化(例えば制限酵素消化、または制御されたタイミング、酵素濃度、温度、pH等でのエンドヌクレアーゼによる消化)によって達成されることもできる。次いで、架橋および剪断されたクロマチン断片は、対象の特定のタンパク質(例えば転写因子またはヒストン)に対して産生された抗体を用いた免疫沈降反応において用いられる。それぞれの免疫沈降で富化された架橋されたncRNAおよびDNA断片は、続いて本発明のDNAおよびRNAリンカーを用いて近接ライゲーションにより連結され、次いで(例えば熱および/またはプロテイナーゼK消化により)タンパク質構成要素から脱連結され、または架橋を逆行し、本発明の方法によるそれらの同定を可能にするために精製される。
ChIPを用いる利点は、このアプローチが、ncRNAまたは遺伝子制御ネットワークを、そのような相互作用がクロマチンおよび他の非ヒストンタンパク質の急速な架橋によりそれらの天然の状態で存在するため、生きた細胞中で“凍結する”ことができ、それによりそれは、理論上、例えば異種性発現により強いられる可能性のある人為産物を含まない、特定のncRNAまたは遺伝子制御ネットワークのあらゆる時点における“真の”写真に相当することである。
6.適用
本発明の方法および組成物は、ncRNAおよびゲノム座位の間の相互作用を、偏りのない全体的なレベルまたは対象の特定のncRNAもしくは特定のクロマチン構成要素のレベルのどちらにおいても同定することを可能にする。本方法を用いて得られる情報は、多種多様な研究および開発設定において用いられることができる。
例えば、本発明は、以前には未知の、または不完全に理解された機能を有し得る特定のncRNAのクロマチン標的を同定するための方法を提供し、その方法は、特定のncRNAおよびそのゲノム標的配列の間の相互作用を、本発明の方法および組成物を用いて決定することを含む。同定されたゲノム標的配列は、ncRNAがその生物学的機能を発揮する候補標的に相当する。
関連する側面において、本発明は、特定の遺伝子またはゲノム領域、例えば腫瘍抑制因子遺伝子または癌遺伝子を有する遺伝子またはゲノム領域と相互作用するncRNAを同定するための方法を提供し、その方法は、ゲノムの特定の遺伝子またはゲノム領域およびncRNAの間の相互作用を、本発明の方法および組成物を用いて決定することを含む。同定されたncRNAは、遺伝子機能の候補調節因子(例えば、サプレッサー、エンハンサーまたは補助活性化因子)に相当する。
特定の態様において、その方法は、さらに、2以上の試料の間でncRNAおよび遺伝子/ゲノム領域の間の相互作用の存在/非存在または程度を比較することを含む。そのような比較は、その相互作用の生物学的重要性および試料間のあらゆる観察された違いをさらに解読するのを助けることができる。
例えば、試料の1つは、健康な対照試料であることができ、その他の試料は、疾患試料、例えば動物モデル(例えばマウスまたはラットモデル)からの疾患試料;特定の処置の前および後の疾患試料;処置の異なる段階にわたる疾患試料;特定の処置に応答した患者、または処置に抵抗性である患者、または処置後に再発した患者からの疾患試料であることができる。
特定の態様において、試料の1つは、患者由来の幹細胞または誘導多能性幹(iPS)細胞であり、場合により、その他の試料は、そのような幹細胞またはiPS細胞から分化した細胞株であることができる。ここで、特定のncRNA−クロマチン相互作用は、発生または分化プログラムの開始と関係している可能性がある。
特定の態様において、試料(単数または複数)は、ヒト、非ヒト霊長類/哺乳類、家畜動物(ウシ、ウマ、ブタ、ヒツジ、ヤギ、ニワトリ、ラクダ、ロバ、ネコ、およびイヌ)、哺乳類モデル動物(マウス、ラット、ハムスター、モルモット、ウサギまたは他のげっ歯類)、両生類(例えばアフリカツメガエル)、魚類(例えばゼブラフィッシュ)、昆虫(ショウジョウバエ)、線虫(例えばC.エレガンス(C.elegans))、植物、藻類、真菌(酵母、例えば出芽酵母(S.cerevisae)または分裂酵母)からのものであることができる。試料(単数または複数)は、確立された細胞株の組織培養物、培養された一次細胞、(新しく解剖された、または凍結された)組織生検等であることができる。
実施例9において示されるように、本発明の方法は、ncRNA−CCAT1(結腸癌関連転写産物1)を、この座位における非常に複雑な転写産物イソ型構造を有するものとして同定した。RICh−PETデータは、CCAT1の可能性のある機能および基礎をなす機序の重要な洞察を提供する。具体的には、CCAT1座位自体が重要なエンハンサーの特徴を有すること、CCAT1座位は子宮頸癌細胞株であるHeLa細胞において高度に転写されていることが分かり、RICh−PETデータは、この座位からの転写産物は他のエンハンサーおよびプロモーター領域を標的とすることを示している。例えば、CCAT1 ncRNA転写産物により標的とされる122の座位(それぞれ3以上のRNAタグによる)に関して、88の座位は、RNAPII相互作用を有する6のエンハンサー座位を含むエンハンサー領域である。別の34の座位は、プロモーター領域内である。これは、CCAT1標的遺伝子は平均してランダムに選択された遺伝子の群よりも高度に発現されているという観察と一致する。従って、lncRNA CCAT1は、癌遺伝子c−mycを含む遺伝子のネットワークを活性化するための転写補助因子として作用している可能性がある。
従って、本発明の別の側面は、CCAT1を発現している癌を処置するための方法を提供し、その方法は、CCAT1にコードされるlncRNAの拮抗薬を投与することを含む。
関連する側面において、本発明は、CCAT1の遺伝子産物(例えば転写されたlncRNA)により媒介される転写活性化または同時活性化を崩壊させるための方法であって、遺伝子産物をCCAT1にコードされるlncRNAの拮抗薬と接触させることを含む方法を提供する。特定の態様において、転写活性化または同時活性化は、癌細胞において起こる。特定の態様において、転写活性化または同時活性化は、c−myc、FAN84B、および/またはSNX14に関する。特定の態様において、転写活性化または同時活性化は、CCAT1ゲノム座位を標的遺伝子座位に物理的に近接させることにより達成される。
特定の態様において、癌は、結腸癌(例えば結腸の腺癌)、直腸癌、子宮頚癌、肺癌、胃癌、肝臓癌、およびそれらの転移である。特定の態様において、癌は、CCAT1転写産物を、マッチする、または対照試料と比較して2倍、3、5、10、15、20、30、40、50、60、70、80、90、100、120、150、175、200、250、300、500、1000倍高いレベルで発現している。
特定の態様において、拮抗薬は、場合により例えば血清安定性、薬理学的特性または薬物動態特性等を向上させるために修飾ヌクレオチドを含み得るアンチセンスポリヌクレオチドである。修飾ヌクレオチドは、PNA、LNA、2’−O−アルキルもしくは他の2’修飾、および/または糖−ホスフェート主鎖における修飾を含み得る。
特定の態様において、拮抗薬は、コードされるCCAT1 lncRNAを標的とするsiRNAまたはmiRNAコンストラクトである。
本発明は、CCAT1 lncRNAの拮抗薬(アンチセンス、siRNA、miRNA、または同じ物をコードする/発現するベクターも提供する。
別の側面において、本発明は、薬物スクリーニングのための方法を提供し、その方法は、薬物の有効性および本発明の方法により同定された特定の観察されたncRNA−クロマチン相互作用(例えば、応答性の患者では同定されるが抵抗性の患者では同定されない相互作用)の間の統計的に有意な関連または相関を確立し、複数の候補薬物のその統計的に有意な関連または相関への作用を決定し、そしてその統計的に有意な関連または相関を促進する候補薬物を同定することを含む。
特定の態様において、候補薬物の作用は、抵抗性の患者からの試料を用いて試験される。これは、抵抗性の患者においてその統計的に有意な関連を修復する候補薬物の同定を可能にすることができる。
別の側面において、本発明は、疾患を処置するための標的遺伝子を同定するための方法を提供し、その方法は、以下の工程を含む:(1)本発明の方法を用いて、(観察されたncRNA−ゲノムDNA相互作用の中から)薬物の有効性および特定のncRNA−ゲノムDNA(遺伝子)相互作用の間の統計的に有意な関連(例えば、処置に応答性の患者において有効性が観察される場合はいつでも、特定のncRNA−ゲノムDNA(遺伝子)の相互作用(単数または複数)が観察される;処置に応答性ではない患者において有効性が観察されない場合はいつでも、その特定のncRNA−ゲノムDNA(遺伝子)の相互作用(単数または複数)が観察されない)を同定し、(2)関与するncRNAおよび/またはDNA(遺伝子)の発現レベルを決定し;ここで、そのDNA(遺伝子)は、薬物の有効性が増大したncRNA発現およびDNA(遺伝子)発現の阻害と関係している場合、その疾患を処置するための可能性のある標的遺伝子として同定される。
本発明の組成物および方法は、特定のゲノム中のまだ未知のncRNAを同定するために、本発明の方法はそのようなncRNAを同定するための偏りのないアプローチであるため、用いられることもできる。PETポリヌクレオチドのクラスターが、タンパク質を一切コードしていないゲノムのある領域におけるRNAタグのクラスターを一貫して同定し、これらのRNAタグを対応するDNAタグにより表される(離れた、例えば染色体間)座位に一貫して連結する場合、そのRNAタグはncRNAを明らかにしている可能性が高い。
本発明のスクリーニング法により同定されたあらゆる候補療法試薬または標的遺伝子は、インビトロおよび/またはインビボで、疾患または病気と相関する周知の実験モデルを用いて検証されることができる。例えば、特定のncRNAが癌遺伝子の発現を促進するものとして(または腫瘍抑制因子遺伝子の発現を阻害するものとして)同定され、従って候補薬物標的になった場合、ncRNAの拮抗薬、例えばsiRNA、miRNA、アンチセンス等を用いる可能性のある療法が、インビトロおよび/またはインビボでさらに検証されることができ、後者は、確立された癌モデルにおいて、例えばモデル動物、例えば処置されるべき癌のマウスモデルにおいて実施されることができる。
マウスは、薬物の発見および開発のための十分に確立されたモデルであり、多くの異なる系統が入手可能である。例えば、癌を研究するための多数の有用なモデルが、発達したいくつかのデータベース、例えばEmice(emice.nci.nih.gov)、癌モデルデータベース(cancermodels.nci.nih.gov)および癌イメージデータベース(cancerimages.nci.nih.gov)を有するヒト癌のマウスモデル・コンソーシアム、または他の源、例えばジャクソン研究所(jaxmice.jax.org/list/rax3.htmlを参照)により配布される癌研究モデルにおいて見つけられることができる。一次癌生検または細胞株のどちらかを用いるさらなる異種移植モデルが、癌を研究するために有用である。
例えば、候補ncRNAに対する可能性のある拮抗薬の有効性が検証され得る肺癌モデルを開発するために、6〜8匹の8週齢のメスの免疫不全マウス、例えばCB17−SCIDベージュマウス(Taconic,カタログ番号CBSCBG)またはNOD/SCID(ジャクソン研究所カタログ番号001303)またはNSGとしても知られているNOD SCIDガンママウス(ジャクソン研究所カタログ番号5557)に、ヒト肺癌A549細胞(ATCC(登録商標)CCL−185)を皮下または左肺経由のどちらかで経胸(同所性(orthotopic);104/sup 細胞/25μL)注射する。腫瘍を有するマウスに、中和抗CXCL12もしくは免疫前血清を腹腔内注射し、または処置を与えない。あるいは、腫瘍を有するマウスを、Platinol(シスプラチン)もしくはAbitrexate(メトトレキサート)もしくはパクリタキセル、または他の化合物で処置することができる。腫瘍を、処置済みおよび未処置の様々な時点で分離する。非コードRNAを、前に記載された方法に従って同定する。
7.CCAT1転写産物、拮抗薬、およびその使用
別の側面において、本発明は、本発明の方法により同定された様々なCCAT1転写産物、それらのcDNA配列(両方の鎖)、拮抗薬(例えば、これらのCCAT1 ncRNA転写産物の機能に拮抗するアンチセンス配列、siRNAまたはmiRNAコンストラクト)を提供する。
CCAT1 ncRNAの異なるイソ型に相当する8個の同定されたcDNA配列が、下記でSEQ ID NO:1〜8において提供されている。
>CCAT1_JAX_1転写産物配列;ゲノム位置:8番染色体:128128655〜128241571 鎖:−
>CCAT1_JAX_2転写産物配列;ゲノム位置:8番染色体:128128655〜128232653 鎖:−
>CCAT1_JAX_3転写産物配列;ゲノム位置:8番染色体:128152989〜128231094 鎖:−
>CCAT1_JAX_4転写産物配列;ゲノム位置:8番染色体:128160497〜128232653 鎖:−
>CCAT1_JAX_5転写産物配列;ゲノム位置:8番染色体:128172634〜128231094 鎖:−
>_CCAT1_JAX_6転写産物配列;ゲノム位置:8番染色体:128197810〜128240377 鎖:−
>CCAT1_JAX_7転写産物配列;ゲノム位置:8番染色体:128186443〜128240377 鎖:−
>CCAT1_JAX_8転写産物配列;ゲノム位置:8番染色体:128218833〜128240377 鎖=−
SEQ ID NO:1〜8のそれぞれに関して、それぞれのCCAT1 ncRNA転写産物イソ型と同じ配列(RNAにおけるUがcDNAにおいてTで置き換わっていることを除く)を有するcDNA配列の“−”鎖が、3’末端から5’末端へと示されている。加えて、それぞれのcDNAの“−”鎖の最初および最後のヌクレオチドも、それらはゲノム配列上の対応するヌクレオチドにマッピングされているため、示されている(例えば、SEQ ID NO:1において、5’末端における最初のcDNAヌクレオチドCは、ヒトゲノムの8番染色体上のヌクレオチド128128655に対応し、5’末端における最後のcDNAヌクレオチドTは、ヒトゲノムの8番染色体上のヌクレオチド128241571に対応する)。
さらに、以下の表は、ヒト8番染色体上のヌクレオチド位置により表されたそれぞれのCCAT1転写産物のそれぞれのエキソンに関する開始および終結ヌクレオチド位置、それぞれのエキソンの長さ、および対応するゲノム配列範囲を含む、8種類の転写産物CCAT1_JAX_1〜CCAT1_JAX_8(それぞれSEQ ID NO:1〜8)に関する追加の情報を列挙している。
これらのCCAT1転写産物は、下記でNCBI参照配列:XR_133500.3において記載されるCCAT1転写産物とは異なる:
従って、一側面において、本発明は、CCAT1 ncRNA転写産物のcDNA配列を提供し、ここで、そのcDNA配列は、SEQ ID NO:1〜8からなる群から選択される配列により表される。
関連する側面において、本発明は、CCAT1 ncRNAの拮抗薬配列を提供し、ここで、その拮抗薬配列は、CCAT1 ncRNAの機能に拮抗する。
特定の態様において、その拮抗配列は、SEQ ID NO:9に対応するCCAT1 ncRNAの機能に拮抗しない。
特定の態様において、その拮抗薬配列は、SEQ ID NO:1〜8において示されている“−”鎖cDNA配列のいずれか1つに対するアンチセンス配列である。
特定の態様において、そのアンチセンス配列は、SEQ ID NO:1〜8において示されている“−”鎖cDNA配列のいずれか1つに、生理的条件下(例えば細胞の核中)で、または高ストリンジェンシーハイブリダイゼーション条件、例えばCold Spring Harbor Laboratory Pressにより出版された、SambrookおよびRussellによるMolecular Cloning:A Laboratory Manual、第3版、2001(本明細書に参照により援用される)において記載されている条件下でハイブリダイズする(がSEQ ID NO:9において示されている“−”鎖cDNA配列にはハイブリダイズしない)。1つのそのような高ストリンジェンシーハイブリダイゼーション条件は、おおよそ45℃における6×塩化ナトリウム/クエン酸ナトリウム(SSC)、続いて50℃における、55℃における、または約60℃における、または約65℃以上における0.2×SSCおよび0.1% SDS中での1回以上の洗浄を含み得る。
特定の態様において、そのアンチセンス配列は、SEQ ID NO:1〜8において示されている“−”鎖cDNA配列のいずれか1つと、少なくともそのアンチセンス配列がcDNA配列とハイブリダイズする領域において、少なくとも約40%、50%、60%、70%、80%、85%、90%、95%、97%、99%またはより大きい割合で同一である。特定の態様において、そのアンチセンス配列は、SEQ ID NO:9に約50%、40%、30%、20%より大きくない割合で同一である。
特定の態様において、アンチセンス配列は、約10、12、14、16、20、22、24、26、28、30ヌクレオチド長またはより大きいヌクレオチド長である。
特定の態様において、拮抗薬配列は、SEQ ID NO:1〜8において示されている“−”鎖cDNA配列により表されるCCAT1 ncRNAイソ型のいずれか1つ以上の破壊を標的とする(が、SEQ ID NO:9において示されている“−”鎖cDNA配列により表されるCCAT1 ncRNAイソ型の破壊は標的としない)siRNAまたはmiRNA配列である。
特定の態様において、拮抗薬配列は、そのsiRNA/miRNAをコードしているベクター、またはプロセシングされてそのsiRNAもしくはmiRNAになることができるRNase III(例えばDicer)に関するdsRNA基質である。
特定の態様において、そのsiRNAまたはmiRNAは、CCAT1 ncRNAイソ型の破壊を標的とする約20〜25ヌクレオチドのガイド配列を含む。
関連する側面において、本発明は、癌または前癌病変を診断する方法であって、生物学的試料中のSEQ ID NO:1〜8のいずれか1つまたはその断片の発現のレベルを測定することを含む方法を提供し、ここで、生物学的試料中のSEQ ID NO:1〜8のいずれか1つまたはその断片の発現は、癌または前癌病変を示している。特定の態様において、その断片は、SEQ ID NO:9の断片ではない。
特定の態様において、その方法はさらに、生物学的試料中で測定された発現レベルを標準と比較することを含み、ここで、その生物学的試料中のSEQ ID NO:1〜8のいずれか1つまたはその断片の発現のより高いレベルは、癌または前癌病変を示している。特定の態様において、その断片は、SEQ ID NO:9の断片ではない。
特定の態様において、その方法は、以下の工程を含む:(a)核酸を対象から得られた生物学的試料から単離し;(b)SEQ ID NO:1〜8のいずれか1つを認識することができるプローブを、その核酸と、ハイブリダイゼーション複合体の形成を可能にする条件下でハイブリダイズさせ;そして(c)ハイブリダイゼーション複合体の形成を標準と比較する;ここで、その生物学的試料中のハイブリダイゼーション複合体のより高いレベルは、癌または前癌病変を示している。特定の態様において、そのプローブは、SEQ ID NO:9にはハイブリダイズしない。
特定の態様において、その方法は、以下の工程を含む:(a)核酸を対象から得られた生物学的試料から単離し;(b)単離された核酸中のSEQ ID NO:1〜8のいずれか1つまたはそのいずれかの断片を増幅し;(c)増幅されたCCAT1産物を可視化し;そして(d)CCAT1増幅産物の量を標準と比較する;ここで、より高いレベルのCCAT−1増幅産物の存在は、癌または前癌病変を示している。特定の態様において、その断片は、SEQ ID NO:9の断片ではない。
特定の態様において、その増幅は、SEQ ID NO:1〜8の1つ以上に特異的なプローブを用いるPCR(例えばリアルタイム定量PCR)により実施される。
特定の態様において、その標準は、癌で苦しんでいない対象におけるCCAT−1の発現のレベルを測定することにより決定される。関連する態様において、その標準は、同じ対象の癌ではない組織におけるCCAT−1の発現のレベルを測定することにより決定される。
特定の態様において、癌は、結腸癌(例えば結腸の腺癌)、直腸癌、子宮頚癌、肺癌、胃癌、肝臓癌、およびそれらの転移からなる群から選択される。
特定の態様において、前癌病変は、腺腫性ポリープである。
特定の態様において、生物学的試料は、組織、血液、唾液、尿、便、および骨髄試料からなる群から選択される。
本発明の関連する側面は、プローブまたはプライマーとして有用な、SEQ ID NO:1〜8のいずれか1つまたはその相補物の少なくとも8個の連続するヌクレオチドを含むオリゴヌクレオチドを提供する。特定の態様において、そのオリゴヌクレオチドは、SEQ ID NO:9にはハイブリダイズしない。
本発明の関連する側面は、生物学的試料中のCCAT−1の発現を検出するための方法を提供し、その方法は、以下の工程を含む:(a)核酸を生物学的試料から単離し;(b)本発明のCCAT1オリゴヌクレオチドプローブを、その核酸に対して、ハイブリダイゼーション複合体の形成を可能にする条件下でハイブリダイズさせ;そして(c)ハイブリダイゼーション複合体の形成を標準と比較し、ここで、その生物学的試料中のハイブリダイゼーション複合体のより高いレベルは、その試料におけるCCAT−1の発現を示している。
本発明の別の関連する側面は、cDNAまたはその断片を含むベクターを提供し、ここで、そのcDNAは、SEQ ID NO:1〜8からなる群から選択される。特定の態様において、そのcDNA断片は、SEQ ID NO:9にはハイブリダイズしない。
本発明の別の関連する側面は、対象のベクターを含む宿主細胞を提供する。
本発明の別の関連する側面は、以下の工程を含む、癌または前癌病変を画像化する方法を提供する:(a)対象に本発明のCCAT1プローブを投与し;ここで、そのプローブは指示物質分子にコンジュゲートしており;そして(b)そのプローブにコンジュゲートした指示物質分子(例えば、放射性同位体、蛍光色素、可視色素またはナノ粒子)を、画像化装置により検出する。
本発明のさらなる関連する側面は、SEQ ID NO:1〜8のいずれか1つ以上により表されるCCAT1 ncRNA転写産物の機能に拮抗するための方法であって、CCAT1 ncRNAを対象のCCAT1の拮抗薬配列(例えばアンチセンス、miRNAまたはsiRNA)と接触させることを含む方法を提供する。
特定の態様において、その方法は、インビトロで実施され、そのCCAT1 ncRNA転写産物は、組織培養試料からの細胞中に存在する。
特定の態様において、その方法は、インビボで実施され、それを必要とする対象に、対象のCCAT1の拮抗薬配列(例えばアンチセンス、miRNAまたはsiRNA)を投与することを含む。
本発明のさらに別の関連する側面は、対象のCCAT1の拮抗薬配列(例えばアンチセンス、miRNAまたはsiRNA)ならびに医薬的に許容できる賦形剤および/またはキャリヤーを含む医薬組成物を提供する。
本出願において記載されているあらゆる態様は、本発明の一側面の下でのみ記載された態様を含め、本発明の他の側面の他の態様と組み合わせられることができることは、理解されるべきである。
当業者は、本明細書で具体的に教示されていない技法は、以下のような標準的な分子生物学の参考書において見付けられることができることを、理解しているであろう:Cold Spring Harbor Laboratory Pressにより出版された、SambrookおよびRussellによるMolecular Cloning:A Laboratory Manual、第3版、2001;Oligonucleotide Synthesis (M. J. Gait, 編者, 1984);Nucleic Acid Hybridization (B. D. HamesおよびS. J. Higgins. 編者, 1984);PCR Technology - principles and applications for DNA amplification, 1989, (編者 H. A. Erlich) Stockton Press, ニューヨーク;PCR Protocols: A Guide to Methods and Applications, 1990, (編者 M. A. Innis et al.) Academic Press, サンディエゴ;ならびにPCR Strategies, 1995, (編者 M. A. Innis et al.) Academic Press, サンディエゴ;その全部が参照により本明細書に援用される。
上記で一般的に記載された本発明は、以下の説明的な実施例への参照により、より容易に理解されると考えられ、それは説明のためだけのものであり、何らかの点において限定することは一切意図されていない。
実施例1 一般的なRICh−PET方法論
RNA−DNAライゲーション、続いてペアエンドタグ配列決定(RICH−PET)を用いて、出願人らは、ncRNA(非コードRNA)およびクロマチンの相互作用を偏りのない全ゲノム方式で研究するための、下記で記載される典型的な方法を開発してきた。
その方法の裏にある原理的な概念は、ncRNAの制御機能、特に長いncRNA(lncRNA)により採用された制御機能のほとんどは、おそらく特定のクロマチン座位におけるRNA−タンパク質、RNA−DNA、および/またはRNA−RNA相互作用のいずれかの組み合わせによる直接または間接的接触を有するという認識に基づいている。従って、ゲノム全体におけるクロマチン位置のncRNA接触アドレスの包括的収集は、個々のおよび/または集合的なncRNAにより媒介される全体的な影響ならびに特異的な機能を理解するためのゲノム要素の大きな構造的枠組みおよび詳細な内容を提供するであろう。
架橋により、RNA−クロマチン相互作用が捕捉されることができる。クロマチン線維の超音波処理による断片化の後、それぞれのクロマチン複合体中でタンパク質結合により一緒に係留されたncRNAおよびDNA断片は、次いで、特異性を有する高スループット分析のためにRNA分子およびDNA断片の人工的な連結関係を確立するために、対象のRNAおよびDNAリンカーを用いたRNA−DNAライゲーションを受ける(subjective)。
本発明のRNAリンカーは、あらゆる係留されたRNA分子の3’末端へのアニーリングのために、そしてRNA鋳型を第1鎖cDNA分子に変換するための逆転写のためのプライマーとして、ランダムオリゴヌクレオチド配列、例えばランダムヘキサヌクレオチド(hexonucleotides)を含むことができる。一方で、本発明のDNAリンカーは、平滑末端クロマチンDNA断片にライゲーションされる。RNAリンカーおよびDNAリンカーは、それぞれ互いに相補的であるがそれ自体には相補的ではない粘着末端を有する。従って、一度そのリンカーが相応にそれらの意図される標的に付着したら、そのRNAおよびDNA断片は、ライゲーションにより共有結合的に連結されることができる。次いで、そのハイブリッドライゲーション産物は、ペアエンドタグ(PET)ライブラリー構築およびその後の高スループット配列決定分析を受ける(subjective)。この方法に関する概略図が、図1Aにおいて示されている。
あるいは、修飾RNAリンカーは、RNA−DNAライゲーション工程を実施するために用いられることができる。この方法に関する概略図が、図1Bにおいて示されている。
加えて、直接的なRNAリンカーが、RNAの3’末端を5’をアデニル化されたssDNAまたは5’をアデニル化されたオーバーハングに直接連結することができる特定の酵素(例えば切り詰められたRNL2)を利用することにより、RNA−DNAライゲーション工程を実施するために用いられることができ、後者の方法に関する概略図が、図1Cにおいて示されている。
タグ配列をそれらのRNAまたはDNAとしての本来の性質からさらに識別するため、特異的なヌクレオチドバーコードが、RNAおよび/またはDNAリンカー配列設計中に組み込まれることができ、次いでそれは、RICh−PETライブラリーデータセット中の対になったRNAタグおよびDNAタグの正確な呼び出しを可能にする。次いで、処理されたRNAタグおよびDNAタグ配列は、ncRNAおよびそれらのクロマチン標的座位を同定するために、参照ゲノム(例えばヒト由来の配列に関して参照ヒトゲノム)にマッピングされる(データは示されていない)。
特定の実験の詳細が、下記で説明目的のために提供されている。
I.細胞培養および架橋
HeLa S3細胞を、5%ウシ胎児血清(FBS)(Life Technologies,カタログ番号10082147)を補ったハムF−12栄養素混合物(Life Technologies,カタログ番号11765−054)中で増殖させた。架橋された細胞のそれぞれのバッチに関して、EGS(スペーサーアーム:16.1A;Thermo Scientific,カタログ番号21565)およびホルムアルデヒド(スペーサーアーム:2.0A;Merck−Calbiochem,カタログ番号344198−250ML)を用いて、細胞をタンパク質−DNA、タンパク質−RNAおよびタンパク質−タンパク質の二重架橋のために処理し、それはホルムアルデヒドのみを用いるよりも良好な連結性を提供することができた。
245mmスクエアプレート(Corning,カタログ番号431110)中の約1×108個の細胞を、45mlの予め温めたDPBS(Life Technologies,カタログ番号14190250)中1.5mM EGSを用いて架橋し、まず75rpmで40分間振盪し、次いで1%ホルムアルデヒド(Merck−Calbiochem,カタログ番号344198−250ML)を添加し、20分間振盪を保ち、続いて0.125Mグリシン(Promega,カタログ番号H5071)で10分間停止し、次いで氷冷DPBSで2回洗浄した。次いで、プロテイナーゼ阻害剤(Roche,カタログ番号11873580001)およびRNase阻害剤(例えばSUPERase・In(商標)RNase阻害剤、Life Technologies,カタログ番号 AM2696)を含有する3〜5mlの氷冷DPBSを添加し、次いで細胞を剥がし、15ml−Falconチューブ(Life Technologies,カタログ番号AM1250)に移した。このプロセスを、全ての細胞が収集されることを確実にするために必要に応じて繰り返した。細胞を2000rpmにおいて4℃で5分間遠心沈殿させ、次いで細胞のペレットを使用まで−80℃で保管した。
II.細胞溶解およびクロマチンのビオチン化
細胞溶解を、以前に記載されたように実施した(Goh et al., J. Vis. Exp., (62), e3770, doi:10.3791/3770, 2012; Fullwood et al., Nature, 462:58-64, 2009, 両方とも参照により本明細書に援用される)。簡潔には、核のペレットを、氷冷洗浄緩衝液(50mMトリス−HCl pH=8.0、150mM NaCl、1mM EDTA、1% TritonX−100、0.1% SDS)で2回洗浄し、1mLの同じ緩衝液中で懸濁した。クロマチンを、例えば超音波処理により剪断し、約500bpの平均サイズを有する断片にした。次いで、以前に記載されたように(Kalhor et al., Nat. Biotechnol., 30:90-98, 2012, 参照により本明細書に援用される)、SDSを剪断されたクロマチンに約0.5%の終濃度になるように添加し、次いでその混合物を37℃で15分間インキュベートした後、EZlinkヨードアセチル−PEG2−ビオチン(IPB)(Thermo Scientific,カタログ番号21334)と混合し、室温で60分間回転させた。次いで、ストレプトアビジンビーズに結合したクロマチンに対してRICh−PETライブラリー構築を行った。
III.RICh−PETライブラリー構築
ストレプトアビジンビーズに結合したクロマチン中に存在するDNA断片を、T4ポリメラーゼ(Promega,R0191)を用いて末端修復した後、Superscript III第1鎖合成システム(Life Technologies,カタログ番号18080051)を用いて第1鎖合成を行った。
簡潔には、1μgの隣接するMmeI部位(IDT)を含有するビオチン化RNAリンカーa(チューブ1)およびRNAリンカーb(チューブ2)を、アニーリング混合物(5μl 10mM dNTP、40μl DEPC処理水)を含有する2個のチューブにそれぞれ添加し、65℃で5分間インキュベートし、次いで氷上に少なくとも約1分間置き、次いでcDNA合成混合物(10μl 10×RT(逆転写)緩衝液、20μl 25mM MgCl2、10μl 0.1M DTT、5μl RNaseOUT、5μl SuperScript III RT)と、25℃で10分間、続いて50℃で30分間のインキュベーションのために混合した。
一晩ライゲーションを、1μgのDNAリンカーA(チューブ1)およびDNAリンカーB(チューブ2)をそれぞれ用いて、ライゲーション混合物(140μl 5×T4DNAリガーゼ緩衝液(PEGを含む)、3.5μl RNase阻害剤、546.5μlヌクレアーゼ無含有水)中で、5μlのT4 DNAリガーゼを用いて、16℃において実施した。次いで、リンカーを付加されたDNA断片を、14μlのT4ポリヌクレオチドキナーゼ(NEB)で、PNKマスターミックス緩衝液(70μl 10×T4 DNAリガーゼ緩衝液、3.5μl RNase阻害剤、612.5μlヌクレアーゼ無含有水)中でリン酸化し、続いて2つのチューブの近接ライゲーションを、34μlのT4 DNAリガーゼにより、反応緩衝液(1000μl 10×T4 DNAリガーゼ緩衝液、50μl RNase、8916μlヌクレアーゼ無含有水)中で、16℃において一晩行った。
リンカーを有するクロマチンDNA断片に対して、Superscript二本鎖cDNA合成キット(Life Technologies,カタログ番号1197−020)を用いた第2鎖cDNA合成を行った。具体的には、クロマチン断片を第2鎖cDNA混合物(111μl DEPC処理水、30μl 5×第2鎖反応緩衝液、3μl 10mM dNTP混合物、1μl大腸菌DNAリガーゼ、4μl大腸菌DNAポリメラーゼI、1μl大腸菌RNase H)と混合し、16℃で2時間インキュベートした。その反応後、16℃で5分間の継続されるインキュベーションのために2μlのT4 DNAポリメラーゼを添加した。
次いで、DNA/RNA/タンパク質複合体における架橋を、0.3% SDS(Ambion)およびプロテイナーゼK(Ambion)による65℃で一晩のインキュベーションにより逆行させた。cDNA−DNA断片を、フェノール/クロロホルム イソプロパノール沈殿により精製した。次いで、精製されたcDNA−DNAを、1μlのMmeI(NEB)により、適切な緩衝液(5μl 10×NEBuffer4、5μlの過剰なMmeIを停止させるためのビオチン化されていない半分のリンカー(Half linker)、5μl 10×SAM)中で、37℃において少なくとも2時間消化し、cDNAタグ−RNAリンカー−DNAリンカー−DNAタグ構造(ペアエンドタグ、PET)を解除した。
次いで、ビオチン化されたPETを、ストレプトアビジンコンジュゲート磁性Dynabeads(Life Technologies,カタログ番号11206D−10ML)上で、50μlの2×B&W緩衝液(10mMトリス−HCl pH7.5、1mM EDTA、1M NaCl)中で固定し、室温で45分間揺り動かした。次いで、それぞれのPET構造の末端を、アダプターに、1μlのT4 DNAリガーゼ(Thermo Scientific,カタログ番号EL0013)により、アダプターライゲーション緩衝液(4μlアダプターA、4μlアダプターB、5μl 10×T4 DNAリガーゼ緩衝液、36μlヌクレアーゼ無含有水)中で、16℃で混合しながら一晩ライゲーションした。次いで、ビーズを1×B&W緩衝液(5mMトリス−HCl pH7.5、0.5mM EDTA、1M NaCl)で3回洗浄した。
ニック翻訳を、4μlの大腸菌DNAポリメラーゼIを用いて、反応混合物(38.5μlヌクレアーゼ無含有水、10×NEBuffer2、2.5μl 10mM dNTP)中で実施し、それをIntelli−ミキサー上で回転させながら(F8、30rpm、U=50、u=60;ELMI Ltd.、ラトビア、リガ)室温で2時間インキュベートした。この後、16ラウンドのPCRを行い、PETを増幅した。RICh−PETライブラリーを、Illumina HiSeq2000上で配列決定した(2×36bpの読み)。
タンパク質およびRNAの分解を防ぐ、または最小限にするため、全ての工程は、プロテアーゼ阻害剤およびRNase阻害剤を含む緩衝液中で実施された。
本明細書で用いられる様々なポリヌクレオチドまたはプライマーが、下記で列挙されている:
実施例2 RICh−PETライブラリーの統計学
3つのRICh−PETライブラリーデータセットを、HeLa S3細胞からの技術的および生物学的複製を用いて生成した。
RICh−PETデータを、単集合PET(すなわち、RNAタグおよびDNAタグの両方において他のPET配列と重複しない)としてまたは2以上のPET配列を有するPETクラスター(すなわち、対になったRNAタグおよびDNAタグ配列の両方が他のPETと重複している)としてのどちらかで分類した。PETクラスターは、より信頼できると、またはncRNA−クロマチン相互作用のより信頼できる事象の繰り返しの検出を反映する高信頼度データであると考えられ、一方で、単集合PETは、弱い連結シグナルを表し得るが、ランダムなバックグラウンドノイズと識別できない。クラスター化基準を用いて、約5000のクロマチン座位に結び付けられたおおよそ700の推定上のRNA座位が同定された(図2A)。
迅速な検証として、これらのRNAおよびDNA座位に関するRNA−seqシグナルがチェックされ、RNA座位が実際にDNA座位よりも有意に高いRNA計数を有することが分かり、これは、RICh−PETデータが予想された通りであることを示唆している(図2B)。
得られたRNA−DNA連結性データの約5分の1(約22%)は、天然においてシス作用性(すなわち、RNAのマッピング部位からDNAのマッピング部位まで100kb未満)であると考えられることができ、一方でRNA−DNA連結性データの大部分は、トランス作用性である(図2C)。
1つの懸念は、クロマチンRNA−DNAライゲーションアプローチは、転写がまだ進行中である場合に大部分が発生中のmRNAを捕捉する可能性があることであった。驚くべきことに、データは、ほとんどの発生中のmRNA転写産物は、ncRNA分子のおそらく遊離の3’末端を用いることに部分的に基づいている本発明の方法が発生中のmRNAからの干渉を概ね回避するように、それらの3’末端をRNAポリメラーゼ複合体の中心部内に隠しているようであることを示している。
具体的には、対になったRICh−PETデータのマッピングは、対になったRNAおよびDNAタグの間の距離を明らかにし、従って可能性のある相互作用の方式(シスまたはトランス)を示唆する。マッピングの結果は、データの小さなセットのみがシス作用性であり、大部分はトランス作用性および染色体間であることを示し、これは、RICh−PETプロトコルにおいて発生中の転写産物を捕捉する可能性が低いことを示している。
RNAタグクラスターのさらなるアノテーション分析(下記参照)は、RNAタグの3%のみがmRNAエキソンにマッピングされ、一方で大多数がncRNAにマッピングされることを示した。
別の懸念は、細胞中にrRNAが豊富にあることであり、一部の細胞ではrRNAは総RNAの80%もの多さであり得るため、それはRNA関連分析に関する一般的な問題である。
rRNAに対処するための1つの戦略は、特定の分析の開始前に用いられる回避アプローチ、例えばmRNAに関するポリA+選択アプローチおよびrRNAの減算枯渇(subtractive depletion)を含む。我々は、RICh−PETライブラリーの1つにおいてrRNA配列の存在度レベルを評価し、rRNA配列は総RNAタグの約26%を構成していることを見出した。対照的に、rRNA配列に対応するDNAタグはほとんど無かった(0.23%)。従って、デジタル枯渇アプローチを用いてあらゆるさらなる分析の前に全てのrRNA配列を除去し、rRNAによるデータのノイズを低減することができる。
実施例3 RICh−PET法の再現性および感度
RICh−PETデータの再現性を評価するため、2つの技術的複製(並行ライブラリー構築および配列決定分析のために2つの分割量(aliquots)に分けられた同じ細胞調製物)および2つの生物学的複製(わずかな修正を加えたほぼ同一の手順を用いてライブラリー構築における使用のために異なる時点で収集された異なる細胞調製物)を実施した。結果として得られた複製の結果は、真の再現性を示した(図3)。例えば、癌に関わっていることが知られている2つの十分に研究されたlncRNAであるNEAT1およびMALAT1は、3つのライブラリー全部において再現性よく検出された(データは示されていない)。
その2つのlncRNA遺伝子は、RNAポリメラーゼII(RNAPIIまたはRNA Pol2)により媒介される広範囲にわたるクロマチン相互作用ループ構造において空間的に組織化されていることが分かり、これは、それらの発現が共通の転写複合体機構の下で同時制御されている可能性が最も高いことを示している。
本明細書で得られたRICh−PETデータにおいて、MALAT1およびNEAT1は両方ともHeLa S3細胞において高度に発現されており、3つのRICh−PETデータセット全部において豊富に検出された。具体的には、NEAT1はその細胞においてMALAT1と比較して比較的少なく発現されており、従って、NEAT1に対するRICH−PETデータ計数は、MALAT1に対するRICH−PETデータ計数よりも少なかった(データは示されていない)。対照として、HOTAIRは、HeLa S3細胞において低レベルで発現されている別の既知のlncRNAであり、それは得られたRICh−PETデータでは検出されなかった(データは示されていない)。
従って、RICh−PETデータにおけるncRNAの検出は、ncRNA発現レベルと十分に相関しているようであった。
実施例4 RICh−PETデータの検証
得られたRICh−PETマッピングデータに基づいて、たとえこれらの2つのncRNAが同じ転写工場中で同時転写されているとしても、それらの相互作用特性は非常に異なることは、興味深い。具体的には、NEAT1のRNAは限定的にシス性であり、それが転写された場所にのみ結合している;一方で、MALAT1は大部分がトランス性で外向きであり、ゲノム中の多くの座位と相互作用している(図4A)。
この観察を検証するため、NEAT1およびMALAT1のRNAを蛍光プローブとして用いてHeLaの核を調べるRNA−FISH実験が実施された(図4B)。予想されたように、NEAT1プローブは、核あたり1または2個のスポットしかもたらさず、一方でMALAT1プローブは、核空間全体にわたってスポットをもたらし、これはRICh−PETデータにおいて観察されたことと一致している。A549細胞におけるNEAT1およびMALAT1に関する類似のRNA−FISHの結果も得られた。この検証は、RICh−PETデータが、真正のシスおよびトランス相互作用の検出および識別において定性的かつ正確であることを示唆している。
実施例5 RICh−PETデータの特性付け
RNAおよびDNAタグクラスターを、ヒトゲノムの遺伝子コードV14アノテーションに基づいて特性付けた。RNAタグクラスターの3%のみが、タンパク質をコードするエキソンと重複しており、RNAタグクラスターの大多数は、非コード領域にマッピングされ、その多くは以前に知られているncRNAである(172、24%)。残りは、タンパク質をコードするイントロン領域、アンチセンス、および遺伝子間領域に位置する新規のncRNAである可能性がある(図5A)。
RICh−PETデータにおいて同定された全ての推定上のncRNAは、RNA−Seqデータの支持を有し、これは、それらがHeLa細胞において活発に転写されていることを示している。逆に、RICh−PETデータのDNAタグクラスターは、大部分がタンパク質をコードする遺伝子にマッピングされ、かなりの部分が遺伝子のプロモーターにマッピングされた(図5B)。
RNAおよびDNAタグクラスターの周囲のクロマチン活性マークのセットに対して、さらなる分析を行った。RNAタグクラスターの中央は、PNA Pol2のシグナルおよび開放クロマチン状態に関するDHSにより定められる転写活性のピークを外れており、そのような“中央を外れる”特性は鎖特異的であることを特筆することは興味深い(データは示されていない)。この鎖特異的な“中央を外れる”特性は、RICh−PET方法論と合致しており、これはそれがRNAの3’末端を捕捉するように設計されているためである。従って、RNAタグクラスターは、転写開始部位の下流であることが予想される。対照的に、クロマチン活性シグナルは、DNAタグクラスターの中央の周囲に対称的にピークがあり(データは示されていない)、これは、超音波処理によるクロマチン線維のランダムな剪断を反映している。
実施例6 MALAT1は、多くのゲノム特徴と相互作用し、遺伝子活性化および遺伝子抑制の両方に関して機能している可能性がある
(単集合PETを含む)MALAT1に結び付けられた全てのRICh−PETデータを用いて、出願人らは、全染色体および全ゲノムのMALAT1相互作用プロフィールを生成し、それは、MALAT1がゲノム中の大きな領域と相互作用している可能性を有することを示している(データは示されていない)。50より多い高信頼度相互作用(タグ計数が2以上のPETクラスター)の内で、約半分は既知の遺伝子のプロモーター中に位置しており、4分の1はイントロン領域中に位置している(図6A)。同じ細胞からのRNA−SeqおよびRNA Pol2 ChIP−seqデータは、それらのプロモーター中にMALAT1が存在する遺伝子は、それらのイントロン領域においてMALAT1と相互作用する遺伝子よりも有意に高い転写活性を有することを示した(図6B;データは示されていない)。MALAT1は、SRSF2を含むいくつかのスプライシング因子と相互作用することによりスプライシング機能の調節に関わっていることが報告されていた(Tripathi et al., 2011)。
出願人らは、MALAT1のRNAはSRSF2の発現の調節にそのプロモーターと相互作用することにより直接関わっている可能性があることも見出した(データは示されていない)。これらの観察は、MALAT1は遺伝子の活性化および抑制の制御において多数の機能的役割を有し得ることを示唆している。
実施例7 X染色体を越えるXISTの機能
最も十分に特性付けられているlncRNAは、XISTであり、それはX染色体の1コピーから転写され、X染色体のその他のコピー中の同じ部位に結合し(シス作用性)、さらに拡張して染色体全体を不活性化のために覆う(示されていない)。RICh−PETマッピングデータは、実際、XISTのRNAタグと対になったDNAタグがX染色体において非常に富んでおり、一方でバックグラウンドノイズはゲノム全体にわたって点在しており、これは、XISTが予想されたようにX染色体に特異的に結合していることを示している。
興味深いことに、1つの非X染色体においていくらかのレベルのXIST結合の富化が存在し、どういうわけか別の非X染色体には枯渇しているようでもあった。より多くのデータおよびさらなる分析が、この観察をさらに検証するために得られている。
実施例8 ncRNAによる複雑な相互作用ネットワーク
本明細書で示されたRICh−PETデータは、ncRNA相互作用ネットワークの複雑なシステムへの最初の一瞥(glimpse)を提供してきた。1つのncRNAがゲノムにおいて多数の標的を有し得るという古典的な見解(MALAT1)に加えて、ある座位がncRNAにより相互作用されることが分かり、そしてそこから相互作用するncRNAが別の座位とも相互作用することが検出された点で、多くの推定上のncRNA座位は“内および外”のRICh−PETデータを有することが分かっていた。
多くの意味で、このncRNA相互作用ネットワークは、転写因子(TF)結合ネットワークに類似しており、そこでは多くのTFが互いの遺伝子に転写調節のために結合する。より多くのデータは、どのようにncRNAが機能するか、そしてどのようにncRNA相互作用ネットワークがゲノムシステムに影響を及ぼすかをさらに説明するのを助けるであろう。
実施例9 CCAT1によりコードされるlncRNAは、転写補助活性化因子である
RICh−PET法を用いて、全体的なncRNA−ゲノムDNA相互作用を同定した。同定された相互作用の中で、1つのncRNA−結腸癌関連転写産物1−が特に興味深かった。
結腸癌関連転写産物1(CCAT1)は、最近代表差分析(Representational Difference Analysis)(RDA)、cDNAクローニング、およびcDNA末端の急速増幅(RACE)を用いて発見された、2628ヌクレオチド長の非コードRNAである(Nissan et al., “Colon cancer associated transcript-1: A novel RNA expressed in malignant and pre-malignant human tissues,” Int. J. Cancer, 13:1598-1606, 2012)。それは、結腸癌(CC)において過剰発現されているが正常な組織では過剰発現されておらず、それによりそれを可能性のある疾患特異的バイオマーカーにすることが最近発見された(Nissan et al., Int. J. Cancer, 130(7):1598-606, 2012; Alaiyan et al., BMC Cancer, 13:196, 2013)。
RICh−PETデータに基づく注意深い分析は、この座位におけるイソ型転写産物の新規の複雑なモデルを明らかにした(データは示されていない)。加えて、CCAT1は、子宮頚癌細胞株HeLa細胞において高度に転写されている。
RICh−PETデータは、CCAT1 lncRNA転写産物が、15番、16番、20番、XおよびY染色体を除く全てのヒト染色体を含め、ゲノム中の多くの他の座位を標的としていることも明らかにした(データは示されていない)。
少なくとも2つのCCAT1タグを有するCCAT1クロマチン標的の中で、多くが、エンハンサーまたはプロモーターにおいて最も強いlncRNA−ゲノムDNA関係を示している(データは示されていない)。例えば、少なくとも3つのCCAT RNAタグと関係している122のCCAT1ゲノム標的座位に関して、88の標的座位は、RNAPII相互作用を有するエンハンサー座位の6つを含め、エンハンサー領域中である。別の34のCCAT1のゲノム標的座位は、プロモーター中である。
これらのCCAT1標的遺伝子は、ランダムに選択された対照遺伝子の集合よりも数倍高い平均発現レベルを有し、これは、CCAT1 lncRNAが標的遺伝子発現を促進することを示唆している。
これらのCCAT1標的遺伝子の1つは、乳癌の約80%、結腸癌の約70%、婦人科系癌の約90%、肝細胞癌の約50%、および異常なmyc発現を有する様々な血液学的腫瘍(例えばバーキットリンパ腫)を含む多種多様なヒトの癌において過剰発現されている癌遺伝子であるc−mycである。追加のデータは、CCAT1 lncRNAが、CCAT1座位自体ならびにmyc座位に結合し、そうしてCCAT1およびmyc座位を物理的に近接させ、CCAT1座位中のエンハンサーにmycの転写を刺激させることにより機能していることを示唆している。加えて、CCAT1の転写されたlncRNAは、タンパク質因子に結合して転写補助活性化因子の役目を果たし、そうしてmycならびに他のCCAT1標的遺伝子、例えばFAM84BおよびSNX14の転写を直接増進している可能性がある。
実施例10 ヒトBリンパ芽球様細胞GM12878およびショウジョウバエS2細胞における追加の適用
上記のRICh−PET法と実質的に同じRICh−PET法を用いて、出願人らは、RICh−PET法の一般的な適用可能性をさらに支持するため、ヒトBリンパ芽球様細胞GM12878およびショウジョウバエS2細胞から追加のデータを得た。
具体的には、ヒトGM12878細胞がRICh−PET分析のために用いられ、これは、ncRNA遺伝子XISTがこの細胞株において高度に発現されており、一方でRICh−PET分析のために用いられた前のHeLa細胞は低レベルのXIST発現を有し、そしてHCT116は男性由来であり、従ってXIST発現を有しないためであった。従って、GM12878は、XISTをRICh−PET分析のncRNAのクロマチンとの相互作用を検出する性能を評価するためのモデルとして用いる場合、RICh−PET分析のための遥かに優れた細胞型である。
以前に記載されたように、XISTは、X染色体に特異的または優先的に結合する。図9Aを参照、それは、100万の読みあたりのkbあたりの読み(RPKM)でのRNA−Seqデータにより測定されたXISTの計数を示している;そして図9Bを参照、それは、XIST結合により覆われるそれぞれの染色体の割合を示している。GM12878細胞において、染色体のほとんどは、総染色体空間の10〜20%においてのみXISTに覆われており、一方でX染色体は、XISTにより90%近く覆われている。このカバー率は、XISTの他の非特異的染色体と比べたその標的とする染色体に対するほぼ6倍(5.9倍)の特異性を表している。対照的に、HeLa細胞では、カバー率は、XISTの他の非特異的染色体と比べたその標的とする染色体に対する約3.4倍の特異性を表しており、HCT116細胞では、予想されたように、X染色体の富化は観察されなかった。
同様に、ショウジョウバエS2細胞では、ncRNA遺伝子rox2−ヒトのXISTに相当するもの−は、X染色体に対するrox2結合の類似の富化を示した:他の染色体と比べて5倍(データは示されていない)。具体的には、全ショウジョウバエゲノムにおけるrox2結合データが得られた。rox2に連結されたDNAタグの80%より多くが、X染色体に結合し、これはX染色体に対する5倍の富化を表している。CHART−seqによる、およびRICh−PET法によるX染色体上のrox2のマッピングの間で合理的に強い相関値(0.6)が観察され、これはRICh−PET法の適切性を示している。
RICh−PETデータのRNAタグの大部分は非コード領域にマッピングされ、一方で約26%のみがコード領域にあり、これは、その方法がncRNAに関する富化を有することを示している(データは示されていない)。RICh−PETデータのRNAタグの、ショウジョウバエS2細胞からのRNA−seqデータとの比較は、既知のncRNAに関する著しい富化を示した(データは示されていない)。
要約すると、上記の実施例において示されたデータは、本発明の方法(例えばRICh−PET法)が設計されたように作動することを実証している。RICh−PETデータにおけるRNAタグの大多数は、非コード領域にマッピングされ、それらの一部は、既知のlncRNA、例えばMALAT1およびNEAT1にマッピングされた。これは、この方法が期待された通りに機能したことを強く示すものである。より重要なことだが、RNA−DNA連結性マッピングデータにより、出願人らは、可能性のあるncRNA−クロマチン相互作用座位を全ゲノムで同定することができる。今までに行われた予備的な検証のいくつかのラインは、RICh−PETが同定したncRNA相互作用は本物であることを示唆してきた。