ここで、本発明の実施態様が示される添付の図面および実施例を参照して、以下に本発明を説明する。当該説明は、本発明が実施され得る全ての異なる方法または本発明に加えられ得る全ての特徴の、詳細一覧であることを目的としない。例えば、一実施態様に関して説明される特徴を他の実施態様に援用し得て、特定の実施態様に関して説明される特徴をその実施態様から消去し得る。したがって、本発明は、本発明の一部の実施態様において、本明細書に示される任意の特徴または特徴の組み合わせは、除外または省略することができることを期待する。加えて、本明細書に示唆される様々な実施態様に対する非常に多くの変更および追加は、本開示に照らして当業者に明らかであり、本発明から逸脱しない。それ故に、以下の説明は、本発明の一部の特定の実施態様を説明することを目的とし、その全ての並べ替え、組み合わせおよび変更を徹底的に特定することは目的としない。
別段の定義がない限り、本明細書で用いられる全ての技術的および科学的用語は、本発明が属する分野における通常の知識を有する者により一般に理解されるのと同一の意味を有する。本明細書において本発明の説明で用いられる専門用語は、特定の実施態様を説明する目的のみであり、本発明の限定を意図しない。
本明細書中の刊行物、特許出願、特許文献および他の引用文献は全て、引用文献が示されている文および/または段落と関連のある教示に関して、それらの全体で参照により援用される。
文脈が別段の提示をしない限り、本明細書に記載の本発明の様々な特徴は任意の組み合わせで用いることができることが、明確に意図される。さらに、本発明は、本発明の一部の実施態様において、本明細書に示される任意の特徴または特徴の組み合わせを除外または省略することができることも期待する。説明するために、明細書が、組成物は構成要素A、BおよびCを含むと記述する場合、A、BまたはCのいずれか、またはそれらの組み合わせは、単独または任意の組み合わせで省略および放棄することができることが、明確に意図される。
本発明の説明および添付の請求項で用いられる単数形「a」、「an」および「the」は、文脈が明確に別段の提示をしない限り、複数形も同様に含むことを意図する。
また、本明細書において用いられる「および/または」は、1つまたは複数の関連する挙げられた事項の任意および全てのあり得る組み合わせ、および、選択的(「または」)に解釈する場合は、組み合わせの欠如を言及および包含する。
本明細書において用いられる用語「約」は、用量または期間などの測定可能な値を言及する場合、規定量の±20%、±10%、±5%、±1%、±0.5%、または実に±0.1%の変動を言及する。
本明細書において用いられる「XおよびYの間(between X and Y)」および「約XおよびYの間(between about X and Y)」などの語句は、XおよびYを含むと解釈すべきである。本明細書において用いられる「約XおよびYの間(between about X and Y)」などの語句は「約Xおよび約Yの間(between about X and about Y)」を意味し、「約XからYまで(from about X to Y)」などの語句は「約Xから約Yまで(from about X to about Y)」を意味する。
本明細書において用いられる「バルジ配列」は、合成tracr核酸構築物および合成CRISPR核酸構築物/CRISPR核酸アレイに含まれる、非相補(非ハイブリダイズ)ヌクレオチド配列を指す。合成tracr核酸構築物において、バルジ配列は、抗−ジッパーおよび抗−ステッチ配列の間に位置し、合成CRISPR核酸構築物/CRISPR核酸アレイ内の対応するバルジ配列と非相補(100%非同一性)である、約3個のヌクレオチド〜約6個のヌクレオチド(例えば、約3、4、5、6個のヌクレオチド;例えば、約3〜約6個のヌクレオチド、約3〜約5個のヌクレオチド、約3〜約4個のヌクレオチドなど)からなる。合成CRISPR核酸構築物/CRISPR核酸アレイのバルジ配列は、ジッパーとステッチ配列との間およびジッパーとステッチ配列との間に位置し、少なくとも2個のヌクレオチド(例えば、(−NN−)のヌクレオチド配列)(例えば、約2、3、4、5、6個のヌクレオチド;例えば、約2〜約6個のヌクレオチド、約2〜約5個のヌクレオチド、約2〜約4個のヌクレオチド;約3〜約6個のヌクレオチド、約3〜約5個のヌクレオチドなど)を含み、から本質的になり、またはからなる。バルジ配列のヌクレオチド組成物は、それらが相補でなく(例えば、100%非同一性)、それにより互いにハイブリダイズしない限り、任意の一連の少なくとも2個(合成CRISPR核酸構築物/CRISPR核酸アレイ)または3個以上(合成tracr核酸構築物)のヌクレオチドであってよい。合成tracr核酸構築物および合成CRISPR核酸構築物/CRISPR核酸アレイ上のバルジ配列の非相補性の結果として、抗−ジッパーとジッパー配列および抗−ステッチとステッチ配列が並び、ハイブリダイズする場合(キメラ核酸構築物でのように)、突出またはバルジが、キメラ核酸構築物の合成tracr核酸構築物側に形成される(例えば、図12〜図16を参照)。いかなる特定の理論にも拘束されることを望まないが、バルジ構造は、CRISPR−Casシステムの機能に関与し得ると考えられる。
本明細書において用いられる用語「含む(comprise)」、「含む(comprises)」および「含む(comprising)」は、記述された特徴、整数、ステップ、操作、因子、および/または構成要素の存在を特定するが、1つまたは複数の他の特徴、整数、ステップ、操作、因子、構成要素、および/またはそれらの群の存在または追加を妨げない。
本明細書において用いられる暫定の語句「から本質的になる」は、請求項の範囲が、請求項に挙げられた特定の物質またはステップおよび特許請求の範囲に記載された発明の基本的かつ新規の特徴(単数または複数)を実質的に影響しないものを包含すると解釈されることを意味する。したがって、用語「〜から本質的になる」は、本発明の請求項において用いられる場合、「含む(comprising)」と同等であると解釈されることを意図しない。
「Cas9ヌクレアーゼ」は、CRISPR Casシステムにおいて二本鎖DNA切断を触媒するエンドヌクレアーゼの大きなグループを指す。これらのポリペプチドは、当技術分野でよく知られていて、それらの構造(配列)の多くが特徴付けられている(例えば、WO2013/176772;WO/2013/188638を参照)。dsDNAの切断を触媒するためのドメインは、RuvCドメインおよびHNHドメインである。RuvCドメインは(−)鎖にニックを入れる役割があり、HNHドメインは(+)鎖にニックを入れる役割がある(例えば、Gasiunasetal.PNAS 109(36):E2579−E2586(September 4,2012)を参照)。
本明細書において用いられる「キメラ」は、少なくとも2つの構成要素が異なる起源(例えば、異なる生物、異なるコード領域)から得られた核酸分子またはポリペプチドを指す。
本明細書において用いられる「相補」は、コンパレーターヌクレオチド配列と100%の相補性または同一性を意味することができ、または、100%未満の相補性(例えば、約70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%などの相補性)を意味することができる。
本明細書において用いられる用語「相補」または「相補性」は、塩基対合による、許容される塩および温度条件下でのポリヌクレオチドの自然な結合を指す。例えば、配列「A−G−T」は、相補配列「T−C−A」に結合する。2つの一本鎖分子間の相補性は、ヌクレオチドの一部のみが結合する「部分的」であり得て、または、一本鎖分子間に全体的相補性が存在する場合は完全であり得る。核酸鎖間の相補性の度合いは、核酸鎖間のハイブリダイゼーションの効率および強度に重大な効果を有する。
本明細書において用いられる「接触させる(contact)」、「接触させる(contacting)」、「接触した(contacted)」およびそれらの文法的変更は、所望の反応(例えば、目的ポリペプチドの部位特異的ターゲッティング、組込み、形質転換、部位特異的切断(ニック、開裂)、増幅など)を行なうのに適切な条件下で、所望の反応の構成要素を一緒に配置することを指す。そのような反応を行なうための方法および条件は、当技術分野でよく知られている(例えば、 Gasiunas et al.(2012)Proc.Natl.Acad.Sci.109:E2579−E2586;M.R.Green and J.Sambrook(2012)Molecular Cloning:A Laboratory Manual.4th Ed.,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NYを参照)。
本発明のヌクレオチド配列の「フラグメント」または「一部」は、参照核酸またはヌクレオチド配列に対して、長さが短くなった(例えば、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20またはそれより多くのヌクレオチド短くなった)ヌクレオチド配列を意味すると理解され、および、参照核酸またはヌクレオチド配列と同一のまたはほぼ同一の(例えば、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一の)連続したヌクレオチドのヌクレオチド配列を含み、から本質的になり、および/または、からなる。本発明に係るそのような核酸フラグメントまたは一部は、適切な場合は、それが構成要素となる、より大きなポリヌクレオチドに含まれ得る。したがって、例えば、標的DNAの少なくとも一部にハイブリダイズすること(hybridizing to)(またはハイブリダイズする(hybridize to)、およびそれらの他の文法的変更)は、標的DNAの連続したヌクレオチドの長さと同一または実質的に同一のヌクレオチド配列に対するハイブリダイゼーションを指す。
本明細書において用いられる「GR1」は、合成CRISPER核酸構築物またはcrRNAのリピート部分に含まれる、単一ヌクレオチド(G)または短い3個のヌクレオチド配列(GTT)である。GR1は、本開示の合成tracr核酸構築物またはtracrRNAの抗−リピートとハイブリダイズしない。しかしながら、非標準的なワトソンクリック塩基対合スキームでは、GR1は、tracrRNAの抗−CRISPRリピート部分の末端でUと揺らぎ塩基対を形成し得る。
本明細書において用いられる用語「遺伝子」は、mRNA、アンチセンスRNA、miRNA、抗−ミクロRNAアンチセンスオリゴデオキシリボヌクレオチド(AMO)などを生産するのに用いることが可能な核酸分子を指す。遺伝子は、機能性タンパク質または遺伝子産物を生産するのに用いることが可能であってよく、または不可能であってよい。遺伝子は、コード領域および非コード領域(例えば、イントロン、制御因子、プロモーター、エンハンサー、終止配列および/または5’および3’非翻訳領域)の両方を含んでよい。遺伝子は、「分離」され得て、それにより、その天然の状態では核酸と結合して通常は見られる構成要素から、実質的にまたは本質的にフリーである核酸が意味される。そのような構成要素は、他の細胞物質、組み換え生産による培養培地、および/または核酸の化学合成で用いられる様々な化学物質を含む。
本明細書において用いられる「ヘアピン配列」は、ヘアピンを含むヌクレオチド配列である。ヘアピン(例えば、ステム−ループ、フィード−バック)は、いずれか側に一本鎖領域がさらに隣接する二本鎖を形成するヌクレオチドの領域を含む二次構造を有する核酸分子を指す。そのような構造は当技術分野でよく知られている。当技術分野で知られているように、二本鎖領域は、塩基対合内にいくつかのミスマッチを含んでよく、または完全に相補であってよい。本開示の一部の実施態様では、核酸構築物のヘアピン配列は、合成tracr核酸構築物の3’末端で「ネクサス配列」のすぐ下流に位置する。いかなる特定の理論にも拘束されずに、ヘアピンは、crRNA−tracrRNA複合体へのCas9結合に関与し得ると考えられる(例えば、合成CRISPR核酸構築物−合成
「異種」または「組み換え」ヌクレオチド配列は、それが導入される宿主細胞と天然には関係しないヌクレオチド配列であり、天然起源ヌクレオチド配列の非天然起源多重コピーを含む。
相同性を有する異なる核酸またはタンパク質は、本明細書において「ホモログ」と呼ぶ。ホモログという用語は、同一および他の種由来の相同配列および同一および他の種由来のオルソロガス配列を含む。「相同性」は、位置同一性(すなわち配列類似性または同一性)のパーセントの観点からの、2以上の核酸および/またはアミノ酸配列の間の類似性のレベルを指す。また、相同性は、異なる核酸またはタンパク質間の類似の機能特性の概念を指す。したがって、本発明の組成物および方法は、本発明のヌクレオチド配列およびポリペプチド配列に対するホモログをさらに含む。本明細書において用いられる「オルソロガス」は、種分化の間に共通の祖先遺伝子から生じる異なる種における相同ヌクレオチド配列および/またはアミノ酸配列を指す。本発明のヌクレオチド配列のホモログは、本発明の前記ヌクレオチド配列と実質的な配列同一性(例えば、少なくとも約70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、および/または100%)を有する。したがって、例えば、本発明で有用なCas9ポリペプチドのホモログは、本明細書に提供されるCas9配列のいずれか1つと約70%相同またはそれより高くてよい。
本明細書において用いられる、ハイブリダイゼーション(hybridization)、ハイブリダイズする(hybridize)、ハイブリダイズする(hybridizing)、およびそれらの文法的変更は、2つの完全に相補のヌクレオチド配列またはいくつかのミスマッチの塩基対が存在し得る実質的に相補の配列の結合を指す。ハイブリダイゼーションの条件は当技術分野でよく知られていて、ヌクレオチド配列の長さおよびヌクレオチド配列間の相補性の度合いに基づき変化する。一部の実施態様では、ハイブリダイゼーションの条件は、高ストリンジェンシーであってよく、または、それらは、ハイブリダイズされる配列の長さおよび相補性の量に応じて、中ストリンジェンシーまたは低ストリンジェンシーであってよい。ヌクレオチド配列間のハイブリダイゼーションの目的に関して低、中および高ストリンジェンシーを構成する条件は、当技術分野でよく知られている(例えば、Gasiunas et al.(2012)Proc.Natl.Acad.Sci.109:E2579−E2586;M.R.Green and J.Sambrook(2012)Molecular Cloning:A Laboratory Manual.4th Ed.,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NYを参照)。
本明細書において用いられる用語「増大する(increase)」、「増大する(increasing)」、「増大した(increased)」「増強する(enhance)」「増強した(enhanced)」「増強する(enhancing)」および「増強(enhancement)」(およびそれらの文法的変更)は、コントロールと比べて、少なくとも約25%、50%、75%、100%、150%、200%、300%、400%、500%またはそれよりも多い上昇を表す。
用語「侵襲性外因性遺伝因子」、「侵襲性外因性核酸」または「侵襲性外因性DNA」は、細菌にとって外因性であるDNA(例えば、制限されないが、ウイルス、バクテリオファージ、および/またはプラスミドを含む病原体由来の遺伝因子)を意味する。
「天然」または「野生型」の核酸、ヌクレオチド配列、ポリペプチドまたはアミノ酸配列は、天然起源または内因性の核酸、ヌクレオチド配列、ポリペプチドまたはアミノ酸配列を指す。したがって、例えば、「野生型mRNA」は、生物において天然起源または内因性であるmRNAである。「相同」核酸配列は、それが導入される宿主細胞と天然に関連するヌクレオチド配列である。
本明細書において用いられる「ネクサス配列」は、合成tracr核酸構築物内の「抗−ステッチ配列」のすぐ下流に位置するヌクレオチド配列を指す。ネクサスは、長さが約6〜10個のヌクレオチドであり、高保存配列:TNANNCを含む。一部の実施態様では、ネクサスは、T(A/C)A(A/G)(G/A)C(またはU(A/C)A(A/G)(G/A)C))、GATAAGGCTT(またはGAUAAGGCUU)、TCAAGCAA(またはUCAAGCAA)、またはT(C/A)AA(A/C)(C/A)(A/G)(A/T)(またはU(C/A)AA(A/C)(C/A)(A/G)(A/U))のヌクレオチド配列であってよい。いかなる特定の理論にも拘束されずに、配列保存に基づき、ネクサスは、Cas9直交性および認識において重要であり得ると考えられる。
また、本明細書において用いられる用語「核酸」、「核酸分子」、「核酸構築物」、「ヌクレオチド配列」および「ポリヌクレオチド」は、直鎖または分岐の一本鎖または二本鎖であるRNAまたはDNA、またはそれらのハイブリッドを指す。また、用語は、RNA/DNAハイブリッドも包含する。dsRNAが合成的に生産される場合は、一般的でない塩基、例えば、イノシン、5−メチルシトシン、6−メチルアデニン、ヒポキサンチンおよびその他もまた、アンチセンス、dsRNA、およびリボザイム対合に用いることができる。例えば、シチジンおよびウリジンのC−5プロピンアナログを含むポリヌクレオチドは、高アフィニティでRNAと結合し、遺伝子発現の強力なアンチセンス阻害剤となることが示されている。他の修飾、例えば、ホスホジエステル主鎖、またはRNAのリボース糖基内の2’−ヒドロキシに対する修飾もすることができる。本開示の核酸構築物は、DNAまたはRNAであってよいが、好ましくはDNAである。したがって、本発明の核酸構築物は、DNAの形態で記載され用いられ得るが、使用目的に応じて、RNAの形態で記載され用いられてもよい。
本明細書において用いられる「合成」核酸またはヌクレオチド配列は、天然に見いだされないが人の手により構築される(結果として天然の産物でない)核酸またはヌクレオチド配列を指す。
本明細書において用いられる用語「ヌクレオチド配列」は、ヌクレオチドのヘテロポリマーまたは核酸分子の5’から3’末端のこれらのヌクレオチドの配列を指し、DNAまたはRNA分子を含み、cDNA、DNAフラグメントまたは部分、ゲノムDNA、合成(例えば化学合成)DNA、プラスミドDNA、mRNA、およびアンチセンスRNAを含み、そのいずれかは一本鎖または二本鎖であってよい。用語「ヌクレオチド配列」「核酸」、「核酸分子」、「オリゴヌクレオチド」および「ポリヌクレオチド」は、本明細書において交換可能に用いられて、ヌクレオチドのヘテロポリマーも指す。別段の指示がされる場合を除き、本明細書において提供される核酸分子および/またはヌクレオチド配列は、本明細書において、5’から3’の方向で左から右に示され、米国の配列規則(連邦規則法典第37巻セクション1.821〜1.825)および世界知的所有権機関(WIPO)標準ST.25に示されるヌクレオチドの特徴を表すための標準的なコードを用いて表される。本明細書において用いられる「5’領域」は、5’末端に最も近いポリヌクレオチドの領域を意味し得る。したがって、例えば、ポリヌクレオチドの5’領域内の因子は、ポリヌクレオチドの5’末端に位置する最初のヌクレオチドから、ポリヌクレオチドの半ばに位置するヌクレオチドまでのどこかに位置し得る。本明細書において用いられる「3’領域」は、3’末端に最も近いポリヌクレオチドの領域を意味し得る。したがって、例えば、ポリヌクレオチドの3’領域内の因子は、ポリヌクレオチドの3’末端に位置する最初のヌクレオチドから、ポリヌクレオチドの半ばに位置するヌクレオチドまでのどこかに位置し得る。
本明細書において用いられる用語「パーセント配列同一性」または「パーセント同一性」は、2つの配列が最適に並べられた場合の、試験(「対象」)ポリヌクレオチド分子(またはその相補鎖)と比較した、参照(「クエリー」)ポリヌクレオチド分子(またはその相補鎖)の直鎖ポリヌクレオチド配列内の同一のヌクレオチドのパーセンテージを指す。一部の実施態様では、「パーセント同一性」は、アミノ酸配列内の同一のアミノ酸のパーセンテージを指し得る。
「プロトスペーサー配列」は、標的二本鎖DNAを指し、具体的には、合成CRISPR核酸構築物のスペーサー配列と完全または実質的に相補である(およびハイブリダイズする)標的DNAの一部を指す。
本明細書において用いられる用語「低減させる(reduce)」「低減した(reduced)」「低減する(reducing)」「低減(reduction)」「縮小する(diminish)」「抑制する(suppress)」および「減少する(decrease)」(およびそれらの文法的変更)は、例えば、コントロールと比較して、少なくとも約5%、10%、15%、20%、25%、35%、50%、75%、80%、85%、90%、95%、97%、98%、99%、または100%の減少を示す。特定の実施態様では、低減は検出可能な活性または量を生じ得ず、または本質的に生じ得ない(すなわち、些細な量、例えば、約10%未満または実に5%未満)。したがって、一部の実施態様では、Cas9ヌクレアーゼの変異は、Cas9のヌクレアーゼ活性を、コントロール(例えば野生型Cas9)と比較して、少なくとも約5%、10%、15%、20%、25%、35%、50%、75%、80%、85%、90%、95%、97%、98%、99%、または100%低減させ得る。
本明細書において用いられる「リピート配列」は、例えば、「スペーサー配列」により隔てられた野生型CRISPR座または合成CRISPR核酸構築物のリピート配列を指す。リピート配列は、対応する抗−リピート配列に対して、相補(例えば、100%塩基対マッチ)、または、実質的に相補、例えば、少なくとも70%相補(例えば、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、またはそれよりも高い)であり得る。
本開示の合成CRISPR核酸構築物の「リピート配列」は、随意的な「ジッパー配列」、「バルジ配列」、「ステッチ配列」、および「スペーサー配列」を含む。一部の実施態様では、合成CRISPR核酸構築物は、GR1(他の実施態様ではステッチ配列に含まれる)を含み得る。
本明細書において用いられる「ジッパー配列」は、合成CRISPR核酸構築物内のバルジ配列の3’または(3’から5’の方向に)すぐ上流に位置するリピート配列の随意的な部分を指し、少なくとも約3個のヌクレオチド(例えば、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30個またはそれよりも多くのヌクレオチド、またはそれらの中の任意の範囲または値)を含み、からなり、または、から本質的になる。一部の実施態様では、ジッパー配列は、「上側ステム(upper stem)」と呼ばれ得る。「ジッパー配列」は、合成tracr核酸構築物上に位置する対応し随意的でもある「抗−ジッパー配列」と、十分な相補性を共有し、したがって、存在する場合は、ジッパー配列と抗−ジッパー配列が接触する際に互いにハイブリダイズすることができ、それにより、2つの核酸構築物を一緒に結合させる。一部の実施態様では、ジッパー/抗−ジッパー配列は、「上側ステム」と呼ぶことができる。ジッパー配列は、対応する抗−ジッパー配列と、完全に相補(例えば100%塩基対マッチ)または実質的に相補、例えば、少なくとも70%相補(例えば、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、またはそれよりも高い)であり得る。したがって、本発明の合成tracr核酸構築物の抗−ジッパー配列は、合成CRISPR核酸構築物または合成CRISPR核酸アレイ内の対応するジッパー配列と完全に相補または実質的に相補である、少なくとも約3個のヌクレオチド(例えば、約3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30個またはそれよりも多いヌクレオチド、またはその中の任意の範囲または値)を含む、からなる、または本質的にからなる。抗−ジッパー配列はRNaseIII結合部位であり、したがって、RNaseIII結合に関与することが当技術分野でよく知られているヌクレオチド配列を含む(例えば、Pertzev and Nicholson,Nucleic Acids Res.34(13):3708−3721(2006)を参照)。
本明細書において用いられる「配列同一性」は、2つの最適に並べられたポリヌクレオチドまたはペプチド配列が、構成要素(例えば、ヌクレオチドまたはアミノ酸)のアライメントのウインドウ全体で不変である程度を指す。「同一性」は、制限されないが:Computational Molecular Biology(Lesk, A.M.,ed.)Oxford University Press,New York(1988);Biocomputing:Informatics and Genome Projects(Smith,D.W.,ed.)Academic Press,New York(1993);Computer Analysis of Sequence Data,Part I(Griffin,A.M.,and Griffin,H.G.,eds.)Humana Press,New Jersey(1994);Sequence Analysis in Molecular Biology(von Heinje,G.,ed.)Academic Press(1987);and Sequence Analysis Primer (Gribskov,M.and Devereux,J.,eds.)Stockton Press,New York(1991)に記載のものを含む公知の方法により、容易に計算することができる。
本明細書において用いられる「スペーサー配列」は、標的DNA(例えば「プロトスペーサー配列」)に相補のヌクレオチド配列である。スペーサー配列は、標的DNAと、完全に相補または実質的に相補(例えば、少なくとも70%相補(例えば、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、またはそれよりも高い))であり得る。代表的な実施態様では、スペーサー配列は、標的DNAと100%の相補性を有する。さらなる実施態様では、標的DNAに対するスペーサー配列の3’領域の相補性は100%であるが、スペーサーの5’領域では100%よりも低く、したがって、標的DNAに対するスペーサー配列の全体的な相補性は100%未満である。したがって、例えば、20個のヌクレオチドスペーサー配列の3’領域における、最初の7、8、9、10、11、12、13、14、15、16個などのヌクレオチド(シード配列)は、標的DNAと100%相補であり得て、一方で、スペーサー配列の5’領域における残りのヌクレオチドは、標的DNAと実質的に相補(例えば、少なくとも約70%相補)である。一部の実施態様では、スペーサー配列の最初の7〜12個のヌクレオチドは、標的DNAと100%相補であり得て、一方で、スペーサー配列の5’領域における残りのヌクレオチドは、標的DNAと実質的に相補(例えば、少なくとも約70%相補)である。他の実施態様では、スペーサー配列の最初の7〜10個のヌクレオチドは標的DNAと100%相補であり得て、一方で、スペーサー配列の5’領域における残りのヌクレオチドは標的DNAと実質的に相補(例えば、少なくとも約70%相補)である。代表的な実施態様では、スペーサー配列の最初の7個のヌクレオチドは標的DNAと100%相補であり得て、一方で、スペーサー配列の5’領域における残りのヌクレオチドは標的DNAと実質的に相補(例えば、少なくとも約70%相補)である。
本明細書において用いられる「ステッチ配列」は、約5個の長さのヌクレオチドを含み、から本質的になり、またはからなり、NNTNNのコンセンサスヌクレオチド配列を有する、ヌクレオチド配列を指す。「ステッチ配列」は、合成CRISPR核酸構築物上で、(5’から3’の方向に)「バルジ配列」のすぐ上流および「GR1」の下流に位置する。「ステッチ配列」は高AT含有量を有する傾向があり、合成tracr核酸構築物内に位置する「抗−ステッチ配列」にハイブリダイズする。一部の特定の実施態様では、ステッチ配列は、(5’から3’の方向に)NNTNN、TTTGT、TTTTA、(T/C)(T/C)T(T/C)(T/G)、TTTTA、TTTCAのヌクレオチド配列を含む、から本質的になる、またはからなる。
本明細書において用いられる「抗−ステッチ配列」は、ステッチ配列と完全に相補でハイブリダイズするヌクレオチド配列(例えば、NNANN、ACAAA、TAAAA、(T/C)(A/G)T(A/G)(A/G)、TAAAA、TGAAA)を指す。抗−ステッチ配列は、合成tracr核酸構築物上で、(5’から3’の方向に)バルジ配列のすぐ下流および「ネクサス配列」のすぐ上流に位置する。いかなる特定の理論にも拘束されることを望まずに、合成tracrRNA構築物の抗−ステッチ配列との、合成crRNA構築物のステッチ配列のハイブリダイゼーションは、「バルジ配列」の後の再建塩基対合に関与すると考えられる。一部の実施態様では、ステッチ/抗−ステッチは、「下側ステム(lower stem)」と呼ぶことができる。
本明細書において用いられる、2つの核酸分子、ヌクレオチド配列またはタンパク質配列の関連における語句「実質的に同一」または「実質的な同一性」は、最大一致に関して比較およびアライメントした場合、以下の配列比較アルゴリズムの1つを用いた測定または目視検査により、少なくとも約70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、および/または100%のヌクレオチドまたはアミノ酸残基同一性を有する2以上の配列またはサブシーケンスを指す。本発明の一部の実施態様では、実質的な同一性は、少なくとも約50残基〜約150残基の長さである配列の領域にわたって存在する。したがって、本発明の一部の実施態様では、実質的な同一性は、少なくとも約3〜約15(例えば、3、4、5、6、7、8、9、10、11、12、13、14、15残基の長さなど、またはその中の任意の値または任意の範囲)、少なくとも約5〜約30、少なくとも約10〜約30、少なくとも約16〜約30、少なくとも約18〜少なくとも約25、少なくとも約18、少なくとも約22、少なくとも約25、少なくとも約30、少なくとも約40、少なくとも約50、約60、約70、約80、約90、約100、約110、約120、約130、約140、約150、またはそれよりも多くの残基の長さ、およびその中の任意の範囲である配列の領域にわたって存在する。代表的な実施態様では、配列は、少なくとも約22個のヌクレオチドにわたって実質的に同一であり得る。一部の特定の実施態様では、配列は、少なくとも約150残基にわたって実質的に同一である。一部の実施態様では、本発明の配列は、少なくとも約16個のヌクレオチド〜約25個のヌクレオチドにわたって、約70%〜約100%同一であり得る。一部の実施態様では、本発明の配列は、少なくとも約16個のヌクレオチド〜約25個のヌクレオチドにわたって、約75%〜約100%同一であり得る。さらなる実施態様では、本発明の配列は、少なくとも約16個のヌクレオチド〜約25個のヌクレオチドにわたって、約80%〜約100%同一であり得る。さらなる実施態様では、本発明の配列は、少なくとも約7個のヌクレオチド〜約25個のヌクレオチドにわたって、約80%〜約100%同一であり得る。一部の実施態様では、本発明の配列は、少なくとも約18個のヌクレオチドにわたって、約70%同一であり得る。他の実施態様では、配列は、約22ヌクレオチドにわたって、約85%同一であり得る。さらに他の実施態様では、配列は、約16個のヌクレオチドにわたって、100%相同であり得る。さらなる実施態様では、配列は、コード領域の長さ全体にわたって実質的に同一である。さらに、代表的な実施態様では、実質的に同一のヌクレオチドまたはタンパク質配列は、実質的に同一の機能(例えば、Cas9 HNHおよび/またはRuvCニッカーゼ活性)を発揮する。
配列比較のために、典型的に、1つの配列は、試験配列が比較される参照配列としての役割がある。配列比較アルゴリズムを用いる場合、試験および比較配列がコンピューターに入力され、必要な場合はサブシーケンス座標が指定されて、配列アルゴリズムプログラムパラメーターが指定される。それから、配列比較アルゴリズムは、指定されたプログラムパラメーターに基づき、参照配列に対する試験配列(単数または複数)のパーセント配列同一性を計算する。
比較ウインドウを並べるための最適な配列アライメントは当業者に広く知られ、Smith and Watermanのローカル相同性アルゴリズム、Needleman and Wunschの相同性アライメントアルゴリズム、Pearson and Lipmanの類似性検索方法などのツールにより、および場合により、GCG(登録商標)Wisconsin Package(登録商標)(Accelrys Inc.,San Diego,CA)の一部として利用可能なGAP、BESTFIT、FASTA、および、TFASTAなどのアルゴリズムのコンピューター実施により、行ない得る。試験配列および参照配列のアライメントされた区分の「同一性分数」は、2つの並べられた配列が共有する同一の構成要素の数を、参照配列セグメント(すなわち、参照配列全体または参照配列のより小さな規定部分)内の構成要素の全数で割った数である。パーセント配列同一性は、同一性分数に100をかけて表される。1つまたは複数のポリヌクレオチド配列の比較は、全長ポリヌクレオチド配列またはその一部に対して、または、より長いポリヌクレオチド配列に対して、され得る。本発明の目的に関し、「パーセント同一性」は、翻訳ヌクレオチド配列のためのBLASTX version 2.0およびポリヌクレオチド配列のためのBLASTN version 2.0を用いて決定されてもよい。
BLAST解析を行なうためのソフトウェアは、国立生物工学情報センターを通じて一般に利用可能である。このアルゴリズムは、データベース配列内の同じ長さのワードと並べた場合に、一部の正の値の閾値スコアTと一致する、または満たす、クエリー配列内の長さWのショートワードを特定することにより、高スコア配列ペア(HSP)を最初に特定するステップを含む。Tは、隣接ワードスコア閾値と呼ばれる(Altschul et al.,1990)。これらの最初の隣接ワードヒットは、それらを含むより長いHSPを見つけるためのサーチを始める種として作用する。それから、ワードヒットは、累積アライメントスコアが増加し得る限り、各配列に沿って両方向に伸びる。累積スコアは、ヌクレオチド配列について、パラメーターM(一致する残基のペアに関する恩恵スコア;常に>0)およびN(ミスマッチ残基に関するペナルティスコア;常に<0)を用いて計算される。アミノ酸配列については、スコアマトリックスを用いて累積スコアを計算する。各方向でのワードヒットの伸長は、累積アライメントスコアがその最大達成値から量X低下した場合は停止し、1つまたは複数の負のスコアの残基アライメントの蓄積、またはいずれかの配列が終わりに到達したことに起因して、累積スコアは0以下になる。BLASTアルゴリズムパラメーターW、T、およびXは、アライメントの感度および速度を決定する。BLASTNプログラム(ヌクレオチド配列)は、デフォルトとして、ワード長(W)11、期待値(E)10、カットオフ100、M=5、N=−4、および両方の鎖の比較を使用する。アミノ酸配列に関しては、BLASTPプログラムは、デフォルトとして、ワード長(W)3、期待値(E)10、およびBLOSUM62スコアマトリックスを使用する(Henikoff&Henikoff,Proc.Natl.Acad.Sci.USA89:10915(1989)を参照)。
パーセント配列同一性の計算に加え、BLASTアルゴリズムは、2つの配列間の類似性の統計分析も行う(例えば、Karlin&Altschul,Proc.Nat’l.Acad.Sci.USA90:5873 5787 (1993)を参照)。BLASTアルゴリズムにより提供される類似性の1つの評価基準は最小和確率(P(N))であり、2つのヌクレオチドまたはアミノ酸配列の間で一致が偶然に生じる確率の示度を提供する。例えば、参照ヌクレオチド配列に対する試験ヌクレオチド配列の比較における最小和確率が約0.1未満〜約0.001未満である場合に、試験核酸配列は参照配列と類似すると考えられる。したがって、本発明の一部の実施態様では、参照ヌクレオチド配列に対する試験ヌクレオチド配列の比較における最小和確率は、約0.001未満である。
また、2つのヌクレオチド配列は、2つの配列がストリンジェントな条件下で互いにハイブリダイズする場合に、実質的に相補であると考えることができる。一部の代表的な実施態様では、実質的に相補であると考えられる2つのヌクレオチド配列は、高ストリンジェントな条件下で、互いにハイブリダイズする。
サザンおよびノーザンハイブリダイゼーションなどの核酸ハイブリダイゼーション実験の関連における、「ストリンジェントなハイブリダイゼーション条件」および「ストリンジェントなハイブリダイゼーション洗浄条件」は配列依存性であり、異なる環境パラメーターの下で異なる。核酸のハイブリダイゼーションに対する広範なガイドは、Tijssen Laboratory Techniques in Biochemistry and Molecular Biology−Hybridization with Nucleic Acid Probes part I chapter 2“Overview of principles of hybridization and the strategy of nucleic acid probe assays”Elsevier,New York(1993)に見られる。一般に、高ストリンジェントなハイブリダイゼーションおよび洗浄条件は、規定のイオン強度およびpHでの特異的配列に関する融点(Tm)よりも約5℃低くなるように選択される。
Tmは、標的配列の50%が完全に一致するプローブにハイブリダイズする、(規定のイオン強度およびpHでの)温度である。非常にストリンジェントな条件は、特異的なプローブに関するTmと等しくなるように選択される。サザンまたはノーザンブロットでのフィルターにおける、100よりも多い相補残基を有する相補ヌクレオチド配列のハイブリダイゼーションに関するストリンジェントなハイブリダイゼーション条件の例は、1mgのヘパリンを含む50%ホルムアミド(42℃)であり、ハイブリダイゼーションは一晩行われる。高ストリンジェントな洗浄条件の例は、0.1 5M NaCl、72℃、約15分である。ストリンジェントな洗浄条件の例は、0.2×SSC洗浄、65℃、15分である(SSCバッファーの説明については、Sambrook(以下)を参照)。バックグラウンドのプローブシグナルを除去するために、高ストリンジェンシーな洗浄の前に低ストリンジェンシーな洗浄を行うことが多い。例えば、100個を超えるヌクレオチドのデュプレックスに関する、中ストリンジェンシーな洗浄の例は、1×SSC、45℃、15分である。例えば、100個を超えるヌクレオチドのデュプレックスに関する、低ストリンジェンシーな洗浄の例は、4〜6×SSC、40℃、15分である。短いプローブ(例えば、約10〜50個のヌクレオチド)に関しては、ストリンジェントな条件は典型的に、約1.0M未満のNaイオンの塩濃度、典型的に、約0.01〜1.0MのNaイオン濃度(または他の塩)(pH7.0〜8.3)を含み、温度は典型的に、少なくとも約30℃である。また、ストリンジェントな条件は、ホルムアミドなどの不安定化剤の添加によっても達成することができる。一般に、特定のハイブリダイゼーションアッセイにおいて、関係のないプローブについて見られるものより2倍の(またはそれより高い)シグナル・ノイズ比は、特異的なハイブリダイゼーションの検出を示す。ストリンジェントな条件下で互いにハイブリダイズしないヌクレオチド配列は、それらがコードするタンパク質が実質的に同一であるならば、依然として実質的に同一である。これは、例えば、遺伝子コードにより許容される最大コドン縮退を用いてヌクレオチド配列のコピーが作られる場合に生じ得る。
以下は、本発明の参照ヌクレオチド配列と実質的に同一である相同ヌクレオチド配列をクローニングするために用いられ得る、ハイブリダイゼーション/洗浄条件のセットの例である。一実施態様では、参照ヌクレオチド配列は、7%ドデシル硫酸ナトリウム(SDS)、0.5M NaPO4、1mM EDTA(50℃)中、2×SSC、0.1%SDSの洗浄(50℃)で、「試験」ヌクレオチド配列とハイブリダイズする。別の実施態様では、参照ヌクレオチド配列は、7%ドデシル硫酸ナトリウム(SDS)、0.5M NaPO4、1mM EDTA(50℃)中、1×SSC、0.1%SDSの洗浄(50℃)で、または、7%ドデシル硫酸ナトリウム(SDS)、0.5M NaPO4、1mM EDTA(50℃)中、0.5×SSC、0.1%SDSの洗浄(50℃)で、「試験」ヌクレオチド配列とハイブリダイズする。また、さらなる実施態様では、参照ヌクレオチド配列は、7%ドデシル硫酸ナトリウム(SDS)、0.5M NaPO4、1mM EDTA(50℃)中、0.1×SSC、0.1%SDSの洗浄(50℃)で、または7%ドデシル硫酸ナトリウム(SDS)、0.5M NaPO4、1mM EDTA(50℃)中、0.1×SSC、0.1%SDSの洗浄(65℃)で、「試験」ヌクレオチド配列とハイブリダイズする。
本発明の任意のヌクレオチド配列および/または組み換え核酸分子は、任意の目的の種での発現のためにコドン最適化され得る。コドン最適化は当技術分野で広く知られていて、種特異的なコドン使用頻度を用いたコドン使用バイアスに関するヌクレオチド配列の改変を含む。コドン使用頻度は、目的の種に関して最も高く発現される遺伝子の配列解析に基づいて作られる。ヌクレオチド配列が核内で発現される場合、コドン使用頻度は、目的の種に関して高発現の核遺伝子の配列解析に基づいて作られる。ヌクレオチド配列の改変は、種特有のコドン使用頻度を、天然のポリヌクレオチド配列に存在するコドンと比較することにより決定される。当分野において理解されるように、ヌクレオチド配列のコドン最適化は、天然のヌクレオチド配列と100%未満の同一性(例えば、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%など)を有するが、依然としてオリジナルの天然のヌクレオチド配列によりコードされるものと同一の機能を有するポリペプチドをコードする、ヌクレオチド配列を生じさせる。したがって、本発明の代表的な実施態様では、本発明のヌクレオチド配列および/または組み換え核酸分子は、特定の目的の種での発現のためにコドン最適化され得る。
一部の実施態様では、本発明の組み換え核酸分子、ヌクレオチド配列およびポリペプチドは、「分離される」。「分離された」核酸分子、「分離された」ヌクレオチド配列または「分離された」ポリペプチドは、人の手によりその天然環境から離れて存在し、したがって天然の産物ではない、核酸分子、ヌクレオチド配列またはポリペプチドである。分離された核酸分子、ヌクレオチド配列またはポリペプチドは、天然起源の生物またはウイルスの他の構成要素の少なくとも一部、例えば、細胞またはウイルスの構造上の構成要素または他のポリペプチドまたはポリヌクレオチドと関連して一般に見いだされる核酸から、少なくとも部分的に切り離された、精製された形態で存在し得る。代表的な実施態様では、分離された核酸分子、分離されたヌクレオチド配列および/または分離されたポリペプチドは、少なくとも約1%、5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、またはそれよりも高い純度である。
他の実施態様では、分離された核酸分子、ヌクレオチド配列またはポリペプチドは、非天然の環境(例えば組み換え宿主細胞)内に存在し得る。したがって、例えばヌクレオチド配列に関しては、用語「分離された」は、それが天然に生じる染色体および/または細胞から切り離されることを意味する。また、ポリヌクレオチドは、それが天然に生じる染色体および/または細胞から切り離され、それから、それが天然に生じない遺伝的状況、染色体および/または細胞(例えば、異なる宿主細胞、異なる制御配列、および/または天然に見られるのと異なるゲノム内の位置)に挿入される場合もまた、分離される。したがって、組み換え核酸分子、ヌクレオチド配列およびそれらのコードされるポリペプチドは、人の手により、それらの天然環境から離れて存在し、したがって、天然の産物ではない点で「分離される」が、一部の実施態様では、組み換え宿主細胞内に導入され存在することができる。
本明細書に記載の任意の実施態様では、本発明のヌクレオチド配列および/または組み換え核酸分子は、様々な生物細胞での発現のための様々なプロモーターおよび他の制御因子と動作可能に関連することができる。したがって、代表的な実施態様では、本発明の組み換え核酸は、1つまたは複数のヌクレオチド配列に作動可能に連結された、1つまたは複数のプロモーターをさらに含むことができる。
本明細書において用いられる「作動可能に連結」または「動作可能に関連」により、示された因子が互いに機能的に関連し、また一般に、物理的にも関連することを意味する。したがって、本明細書において用いられる用語「作動可能に連結」または「動作可能に関連」は、機能的に関係がある単一核酸分子上のヌクレオチド配列を指す。したがって、第二のヌクレオチド配列に作動可能に連結された第一のヌクレオチド配列は、第一のヌクレオチド配列が、第二のヌクレオチド配列と機能的関係で配置される状況を意味する。例えば、プロモーターがヌクレオチド配列の転写または発現を果たす場合に、プロモーターは前記ヌクレオチド配列と動作可能に関連する。当業者は、コントロール配列がその発現を方向付けるように機能する限り、コントロール配列(例えばプロモーター)は、それが動作可能に関連するヌクレオチド配列と隣接している必要はないことを理解するだろう。したがって、例えば、介在する非翻訳でなお転写される配列が、プロモーターとヌクレオチド配列との間に存在してよく、プロモーターは依然としてヌクレオチド配列に「作動可能に連結」していると考えることができる。
「プロモーター」は、プロモーターと動作可能に関連するヌクレオチド配列の転写をコントロールまたは制御するヌクレオチド配列(すなわち、コード配列)である。コード配列は、ポリペプチドおよび/または機能性RNAをコードし得る。典型的に、「プロモーター」は、RNAポリメラーゼIIに関する結合部位を含むヌクレオチド配列を指し、転写の開始を管理する。一般に、プロモーターは、5’または対応するコード配列のコード領域のスタートに対して上流に見られる。プロモーター領域は、遺伝子発現のレギュレーターとして作用する他の因子を含んでよい。これらはTATAボックスコンセンサス配列を含み、そして、CAATボックスコンセンサス配列を含むことが多い(Breathnach and Chambon,(1981) Annu.Rev.Biochem.50:349)。植物では、CAATボックスはAGGAボックスで置き換えられ得る(Messing et al.,(1983)in Genetic Engineering of Plants,T.Kosuge,C.Meredith and A.Hollaender(eds.),Plenum Press,pp.211−227)。
プロモーターは、組み換え核酸分子(すなわち、「キメラ遺伝子」または「キメラポリヌクレオチド」)の調製で用いるための、例えば、構成的、誘導性、時間的に制御された、発生学的に制御された、化学的に制御された、組織−好適および/または組織−特異的なプロモーターを含んでよい。これらの様々なタイプのプロモーターは、当技術分野で知られている。
プロモーターの選択は、発現のための時間的および空間的要求に応じて変化し、および、形質転換される宿主細胞にも応じて変化する。多くの異なる生物のためのプロモーターは、当技術分野でよく知られている。当分野に存在する広範囲の知識に基づき、適切なプロモーターを、特定の目的宿主生物のために選択することができる。したがって、例えば、モデル生物において、高度に構成的に発現された遺伝子の上流のプロモーターについて多くが知られ、そのような知識は、必要に応じて、他のシステムで容易に利用および実施することができる。
一部の実施態様では、本発明の核酸構築物は、「発現カセット」であってよく、または発現カセット内に含まれてよい。本明細書において用いられる「発現カセット」は、目的のヌクレオチド配列(例えば本発明の核酸構築物(例えば、合成tracr核酸構築物、合成CRISPR核酸構築物、合成CRISPRアレイ、キメラ核酸構築物;目的ポリペプチドをコードするヌクレオチド配列、cas9ヌクレアーゼをコードするヌクレオチド配列))を含む組み換え核酸分子を意味し、ここで、前記ヌクレオチド配列は、少なくともコントロール配列(例えばプロモーター)と動作可能に関連する。したがって、本発明の一部の態様は、本発明のヌクレオチド配列を発現するように設計された発現カセットを提供する。
目的のヌクレオチド配列を含む発現カセットは、キメラであってよく、それの構成要素の少なくとも1つが、それの他の構成要素の少なくとも1つに対して異種であることを意味する。また、発現カセットは、天然起源であるが異種発現に有用である組み換え型で得られたものであってもよい。
また、発現カセットは、場合により、選択された宿主細胞内で機能性の転写および/または翻訳終結領域(すなわち終結領域)を含んでもよい。様々な転写終結因子が発現カセットでの使用に利用可能であり、目的の異種ヌクレオチド配列を超えて転写の終結に関与し、mRNAのポリアデニル化を修正する。終結領域は、転写開始領域に対して天然であり得て、作動可能に連結された目的のヌクレオチド配列に対して天然であり得て、宿主細胞に対して天然であり得て、または、別の起源(すなわち、プロモーターに対して、目的のヌクレオチド配列に対して、宿主に対して外因または異種、またはそれらの任意の組み合わせ)に由来し得る。
また、発現カセットは、形質転換された宿主細胞を選択するために用いることのできる選択可能なマーカーに関するヌクレオチド配列を含むこともできる。本明細書において用いられる「選択可能なマーカー」は、発現した場合に、マーカーを発現している宿主細胞に、区別できる表現型を与え、したがって、そのマーカーを有さないものからそのような形質転換された細胞が区別されるのを可能にする、ヌクレオチド配列を意味する。そのようなヌクレオチド配列は、マーカーが、化学的手段により、例えば選択剤(例えば抗生物質など)を用いることにより、選択することのできる形質を与えるかどうか、または、マーカーが単に、例えばスクリーニング(例えば蛍光)による、観察または試験を介して同定され得る形質であるかどうかに応じて、選択可能なマーカーまたはスクリーニング可能なマーカーのいずれかをコードし得る。もちろん、適切な選択可能なマーカーの多くの例が当技術分野で知られていて、本明細書に記載の発現カセットにおいて用いることができる。
発現カセットに加えて、本明細書に記載の核酸分子およびヌクレオチド配列は、ベクターとの関連で用いることができる。用語「ベクター」は、核酸(単数)(または核酸(複数))を細胞に移行、送達または導入するための組成物を指す。ベクターは、移行、送達または導入されるヌクレオチド配列(単数または複数)を含む核酸分子を含む。宿主生物の形質転換での使用のためのベクターは、当技術分野でよく知られている。ベクターの全般的なクラスの非限定的な例は、限定されないが、二本鎖または一本鎖の直鎖または環状型の、ウイルスベクター、プラスミドベクター、ファージベクター、ファージミドベクター、コスミドベクター、フォスミドベクター、バクテリオファージ、人工染色体、またはアグロバクテリウムバイナリーベクターを含み、自己で伝染または動員が可能であってよく、または不可能であってよい。本明細書に定義されるベクターは、細胞ゲノムへの組込みにより原核生物または真核生物宿主を形質転換することができ、または、染色体外に存在することができる(例えば複製起点を有する自己複製プラスミド)。天然にまたは設計により、放線菌および関連種、細菌および真核生物(例えば、より高度の植物、哺乳類、酵母または真菌細胞)から選択され得る2つの異なる宿主生物での複製が可能であるDNAビヒクルを意味する、シャトルベクターがさらに含まれる。一部の代表的な実施態様では、ベクター内の核酸は、宿主細胞での転写のための適切なプロモーターまたは他の制御因子の制御下であり、作動可能に連結されている。ベクターは、複数の宿主内で機能する二機能性発現ベクターであり得る。ゲノムDNAの場合は、これは、それ自身のプロモーターまたは他の制御因子を含み得て、cDNAの場合は、これは、宿主細胞での発現のための適切なプロモーターまたは他の制御因子の制御下であり得る。したがって、本発明の核酸分子および/または発現カセットは、本明細書に記載され、当技術分野で知られているように、ベクター内に含まれ得る。
目的のポリヌクレオチドの関連における「導入する(introducing)」、「導入する(introduce)」、「導入された(introduce)」(およびそれらの文法的変更)は、目的のヌクレオチド配列を、宿主生物または前記生物の細胞(例えば、宿主細胞)に、ヌクレオチド配列が細胞の内部に接近するような方法で提示することを意味する。1個よりも多いヌクレオチド配列が導入される場合は、これらのヌクレオチド配列は、単一のポリヌクレオチドまたは核酸構築物の一部として、または別個のポリヌクレオチドまたは核酸構築物として、集まることができ、同一または異なる発現構築物または形質転換ベクター上に位置することができる。したがって、これらのポリヌクレオチドは、細胞単一の形質転換イベントで、別個の形質転換/トランスフェクションイベントで、細胞に導入され得て、または、例えば、それらは従来の繁殖プロトコルにより生物に取り込まれ得る。したがって、本発明の一部の態様では、本発明の1つまたは複数の核酸構築物(例えば、合成tracr核酸構築物、合成CRISPR核酸構築物、合成CRISPRアレイ、キメラ核酸構築物;目的ポリペプチドをコードするヌクレオチド配列、cas9ヌクレアーゼをコードするヌクレオチド配列など)を、宿主生物または前記宿主生物の細胞に導入することができる。
本明細書において用いられる用語「形質転換」または「トランスフェクション」は、細胞への異種核酸の導入を指す。細胞の形質転換は、安定または一過的であり得る。したがって、一部の実施態様では、宿主細胞または宿主生物は、本発明の核酸分子により安定的に形質転換される。他の実施態様では、宿主細胞または宿主生物は、本発明の組み換え核酸分子により一過的に形質転換される。
ポリヌクレオチドの関連における「一過的に形質転換される」は、ポリヌクレオチドが細胞に導入されて、細胞のゲノム内に組込まれないことを意味する。
細胞内に導入されたポリヌクレオチドの関連における「安定に導入される(stably introducing)」または「安定に導入された(stably introduced)」は、導入されたポリヌクレオチドが細胞のゲノム内に安定的に取り込まれ、したがって細胞がポリヌクレオチドで安定的に形質転換されることを意図する。
本明細書において用いられる「安定した形質転換」または「安定的に形質転換された」は、核酸分子が細胞内に導入されて、細胞のゲノム内に組込むことを意味する。したがって、組み込まれた核酸分子は、その子孫により、より具体的には、複数の後に続く世代の子孫により、受け継がれることが可能である。また、本明細書において用いられる「ゲノム」は、核およびプラスチドゲノムも含み、したがって、例えば葉緑体またはミトコンドリアゲノムへの核酸の組込みを含む。また、本明細書において用いられる安定した形質転換は、染色体外に例えばミニ染色体またはプラスミドとして維持される導入遺伝子も指し得る。
一過的な形質転換は、生物内に導入された1つまたは複数の導入遺伝子によりコードされるペプチドまたはポリペプチドの存在を検出することのできる、酵素結合免疫吸着測定法(ELISA)またはウエスタンブロットなどにより、検出され得る。細胞の安定した形質転換は、生物(例えば、植物、哺乳類、昆虫、古細菌、細菌など)に導入された導入遺伝子のヌクレオチド配列と特異的にハイブリダイズする核酸配列を用いた、細胞のゲノムDNAのサザンブロットハイブリダイゼーションアッセイなどにより、検出することができる。細胞の安定した形質転換は、植物または他の生物に導入された導入遺伝子のヌクレオチド配列と特異的にハイブリダイズする核酸配列を用いた、細胞のRNAのノーザンブロットハイブリダイゼーションアッセイなどにより、検出することができる。また、細胞の安定した形質転換は、例えば、導入遺伝子の標的配列(単数または複数)とハイブリダイズする特異的なプライマー配列を用いて、ポリメラーゼ連鎖反応(PCR)または当技術分野でよく知られている他の増幅反応により検出することもでき、導入遺伝子配列の増幅をもたらし、標準的な方法に従って検出することができる。また、形質転換は、当技術分野でよく知られているダイレクトシーケンスおよび/またはハイブリダイゼーションのプロトコルにより検出することもできる。
したがって、一部の実施態様では、ヌクレオチド配列、構築物、発現カセットは、一過的に発現することができ、および/または、それらは宿主生物のゲノム内に安定的に取り込まれ得る。
本発明の組み換え核酸分子/ポリヌクレオチドは、当業者に公知の任意の方法により、細胞内に導入することができる。本発明の一部の実施態様では、細胞の形質転換は、核形質転換を含む。他の実施態様では、細胞の形質転換は、プラスチド形質転換(例えば、葉緑体形質転換)を含む。またさらなる実施態様では、本発明の組み換え核酸分子/ポリヌクレオチドは、従来の繁殖技術を介して細胞に導入することができる。
真核生物および原核生物は両方とも、形質転換の手順は広く知られていて当分野においてルーチンであり、文献全体を通して記載される(例えば、Jiang et al.2013.Nat.Biotechnol.31:233−239;Ranetal.Nature Protocols 8:2281−2308(2013)を参照)。
したがって、ヌクレオチド配列は、当技術分野でよく知られている任意の数の方法で、宿主生物またはその細胞に導入することができる。本発明の方法は、1つまたは複数のヌクレオチド配列が生物内に導入されるためには、それらが生物の少なくとも1つの細胞の内部に接近しさえすれば、特定の方法に依存しない。1個よりも多いヌクレオチド配列が導入される場合は、それらは、単一の核酸構築物の一部として、または別個の核酸構築物として、集まることができ、同一または異なる核酸構築物上に位置することができる。したがって、ヌクレオチド配列は、単一の形質転換イベントで、または別個の形質転換イベントで、目的の細胞内に導入することができ、あるいは、関連する場合は、ヌクレオチド配列は、繁殖プロトコルの一部として植物内に取り込むことができる。
本発明は、標的DNAの部位特異的ニック、切断および/または改変のための、および、標的DNAに対する目的ポリペプチドの部位特異的ターゲッティングのための、増大した効率および増大した特異性を有する組成物および方法に関する。
本発明の核酸構築物およびヌクレオチド配列は、構築物または配列の全体的な構造または機能に影響を与えない代替の方法で表すことができる。したがって、例えば、ある場合には、合成CRISPR核酸(crRNA)は、揺らぎ塩基GR1配列(G/U)およびステッチ配列を含むことができ、あるいは、crRNAは、(G/U)揺らぎ塩基を含むステッチ配列を含むことができ、したがって、GR1配列をさらに表さない。ある場合には、GR1は対合しない(すなわちG/AはLjeとミスマッチである、図20)。さらなる等価性は、以下に提供される等価表(表1)に示されるものを含む(図22も参照)。
したがって、本発明の一態様では、合成トランスコード化CRISPR(tracr)核酸(例えば、tracrRNA、tracrDNA)構築物が提供され、前記構築物は、5’から3’の方向に、少なくとも約3個のヌクレオチドを含む、から本質的になる、またはからなる抗−ジッパー配列;少なくとも約3個のヌクレオチドを含むバルジ配列;NNANNのヌクレオチド配列を含む抗−ステッチ配列;TNANNC、T(A/C)A(A/G)(G/A)C(またはU(A/C)A(A/G)(G/A)C))、TCAAAC、(またはUCAAAC)、TAAGGC(またはUAAGGC)、GATAAGG(またはGAUAAGG)、GATAAGGCTT(またはGAUAAGGCUU)、TCAAG(またはUCAAG)、TCAAGCAA(またはUCAAGCAA)、T(C/A)AA(A/C)(C/A)(A/G)(A/T)(またはU(C/A)AA(A/C)(C/A)(A/G)(A/U))、GATAAGGCCATGCC、TAAGGCTAGTCC、TCAAGCAAAGC、またはTCAAACAAAGCTTCAGCのヌクレオチド配列を含むネクサス配列;および、少なくとも1つのヘアピンを有するヌクレオチド配列を含むヘアピン配列を、含み、から本質的になり、またはからなり、前記ヘアピンは、少なくとも3個の一致する塩基対を含み、ここで、抗−ジッパー配列は、バルジ配列のすぐ上流に位置し、バルジ配列は、抗−ステッチ配列のすぐ上流に位置し、抗−ステッチ配列は、ネクサス配列のすぐ上流に位置し、および、ネクサス配列は、ヘアピン配列のすぐ上流に位置する。一部の実施態様では、抗−ステッチ配列は、NNANN、ACAAA、TAAAA、(T/C)(A/G)T(A/G)(A/G)、TAAAA、TGAAAのヌクレオチド配列を、含む、から本質的になる、またはからなる。
さらなる実施態様では、5’から3’の方向に、少なくとも約3個のヌクレオチドを含む随意的な抗−ジッパー配列;少なくとも約3個のヌクレオチドを含むバルジ配列;NNANNのヌクレオチド配列を含む抗−ステッチ配列;TNANNC、T(A/C)A(A/G)(G/A)C(またはU(A/C)A(A/G)(G/A)C))、TCAAAC、(またはUCAAAC)、TAAGGC(またはUAAGGC)、GATAAGG(またはGAUAAGG)、GATAAGGCTT(またはGAUAAGGCUU)、TCAAG(またはUCAAG)、TCAAGCAA(またはUCAAGCAA)、T(C/A)AA(A/C)(C/A)(A/G)(A/T)(またはU(C/A)AA(A/C)(C/A)(A/G)(A/U))、GATAAGGCCATGCC、TAAGGCTAGTCC、TCAAGCAAAGC、またはTCAAACAAAGCTTCAGCのヌクレオチド配列を含む、から本質的になる、またはからなる、ネクサス配列、および、少なくとも1つのヘアピンを有するヌクレオチド配列を含むヘアピン配列を、含む、から本質的になる、またはからなる、合成トランスコード化CRISPR(tracr)核酸構築物が提供され、前記ヘアピンは、少なくとも3個の一致する塩基対を含み、ここで、抗−ジッパー配列は、存在する場合は、バルジ配列のすぐ上流に位置し、バルジ配列は、抗−ステッチ配列のすぐ上流に位置し、抗−ステッチ配列は、ネクサス配列のすぐ上流に位置し、および、ネクサス配列は、ヘアピン配列のすぐ上流に位置する。
一部の実施態様では、合成tracr核酸構築物のバルジ配列は、少なくとも約3個のヌクレオチドを含む、から本質的になる、またはからなる。一部の実施態様では、合成tracr核酸構築物のバルジ配列は、少なくとも約4個のヌクレオチドを含む、から本質的になる、またはからなる。他の実施態様では、合成tracr核酸構築物のバルジ配列は、5個のヌクレオチドを含む、から本質的になる、またはからなる。他の実施態様では、合成tracr核酸構築物のヘアピン配列は、少なくとも2個のヘアピンを含み、から本質的になり、またはからなり、各ヘアピンは、少なくとも3個の一致する塩基対を含む。
さらなる態様では、本発明は、3’から5’の方向に、少なくとも約3個のヌクレオチドを含む、から本質的になる、またはからなる随意的なジッパー配列、少なくとも2個のヌクレオチドを有するヌクレオチド配列(例えば、(−NN−)のヌクレオチド配列)を含む、から本質的になる、またはからなるバルジ配列、NNTNN(またはNNUNN)のヌクレオチド配列を含む、から本質的になる、またはからなるステッチ配列、ヌクレオチドGまたはGTTを含む、から本質的になる、またはからなるGR1、および、5’末端および3’末端を有するスペーサー配列であって、その3’末端に標的DNAと100%の同一性を有する少なくとも7個のヌクレオチドを含む、から本質的になる、またはからなるスペーサー配列を、含む、から本質的になる、またはからなる合成CRISPR核酸(例えば、crRNA、crDNA)構築物を提供し、ジッパー配列は、存在する場合は、バルジ配列のすぐ上流に位置し、バルジ配列は、ステッチ配列のすぐ上流に位置し、ステッチ配列は、GR1のすぐ上流に位置し、および、GR1は、スペーサー配列のすぐ上流に位置する。
さらなる実施態様では、3’から5’の方向に、抗−ジッパーにハイブリダイズする少なくとも3個のヌクレオチドを有するヌクレオチド配列を含む随意的なジッパー配列、少なくとも約2個のヌクレオチドのヌクレオチド配列を含むバルジ配列、NNUNNのヌクレオチド配列を含むステッチ配列(、および5’末端および3’末端を有するスペーサー配列であって、その3’末端に標的DNAと100%の同一性を有する少なくとも7個のヌクレオチドを含むスペーサー配列を、含む、から本質的になる、またはからなる合成CRISPR核酸(例えば、crRNA、crDNA)構築物が提供され、ジッパー配列は、存在する場合は、バルジ配列のすぐ上流に位置し、バルジ配列は、ステッチ配列のすぐ上流に位置し、ステッチ配列は、スペーサー配列のすぐ上流に位置する。
一部の実施態様では、合成CRISPR核酸アレイが提供され、前記合成CRISPR核酸アレイは、本発明の2以上のCRISPR核酸構築物をコードするヌクレオチド配列を含み、ここで、2以上のCRISPR核酸構築物は、前記ヌクレオチド配列上で互いにすぐ隣に位置し、前記2以上のCRISPR核酸構築物のステッチ配列は同一であり、前記2以上のCRISPR核酸構築物のスペーサー配列は同一または非同一であり、および、存在する場合は、前記2以上のCRISPR核酸構築物のジッパー配列は同一である。
他の態様では、本発明の合成tracr核酸構築物および合成CRISPR核酸構築物を含むキメラ核酸構築物(またはガイド核酸構築物)が提供され、ここで、合成CRISPR核酸構築物のジッパー配列は、前記合成tracr核酸構築物の抗−ジッパー配列と少なくとも約70%(例えば、約70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%など)相補でありハイブリダイズし、合成CRISPR核酸構築物のステッチ配列は、前記合成tracr核酸構築物の抗−ステッチ配列と100%同一でありハイブリダイズし、合成CRISPR核酸構築物のバルジ配列および合成CRISPR核酸構築物のバルジ配列は、非相補である。
他の実施態様では、本発明の合成tracr核酸構築物および合成CRISPR核酸構築物を含む、から本質的になる、またはからなるキメラ核酸構築物が提供され、ここで、合成CRISPR核酸構築物のステッチ配列のNNUNNは、前記合成tracr核酸構築物の抗−ステッチ配列のNNANNと100%相補でありハイブリダイズし、前記ステッチ配列の(G)は、前記抗−ステッチ配列のUと揺らぎ塩基対合を形成し、合成CRISPR核酸構築物のバルジ配列および合成CRISPR核酸構築物のバルジ配列は、非相補であり、ジッパー配列および抗−ジッパー配列が存在する場合は、合成CRISPR核酸構築物のジッパー配列は、前記合成tracr核酸構築物の抗−ジッパー配列にハイブリダイズする。
一部の実施態様では、キメラ核酸構築物は、場合により、ハイブリダイズしたジッパーおよび抗−ジッパー配列を連結するヌクレオチドを、ハイブリダイズした配列の末端(バルジ配列に対して遠位)にさらに含むことができる。さらなる実施態様では、ジッパーおよび抗−ジッパーが存在しない場合、キメラ核酸構築物は、場合により、合成trac核酸配列のバルジ配列を合成CRISPR核酸のバルジ配列に連結するヌクレオチドをさらに含むことができる。連結するヌクレオチドは、任意のヌクレオチド(例えば、T、A、G、C)であってよく、ジッパー配列および抗−ジッパー配列またはバルジ配列を連結するヌクレオチドの数は、約3個〜約7個であり得る。
さらなる態様では、本発明の合成tracr核酸構築物、合成CRISPR核酸構築物、CRISPR核酸アレイ、またはキメラ核酸構築物は、Cas9ヌクレアーゼ、Cas9ヌクレアーゼをコードするアミノ酸配列と少なくとも70%の同一性(例えば、約70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%など)を有するアミノ酸配列をコードするヌクレオチド配列、または、Cas9ヌクレアーゼをコードするアミノ酸配列と少なくとも70%の同一性を有するアミノ酸配列を、さらに含むことができる。本発明で有用なCas9ヌクレアーゼは、CRISPR−CasシステムにおいてDNA切断を触媒することが知られる任意のCas9ヌクレアーゼであってよい。当技術分野で知られているように、そのようなCas9ヌクレアーゼは、HNHモチーフおよびRuvCモチーフ(例えば、WO2013/176772;WO/2013/188638を参照)を含む。一部の実施態様では、HNHモチーフまたはRuvCモチーフは、野生型Cas9ヌクレアーゼと比較してそれらの活性を低下または消去する変異を含み得る。一部の実施態様では、片方のモチーフのみ(例えば、HNHモチーフまたはRuvCモチーフのいずれか)が突然変異される。他の実施態様では、両方の活性が低下または消去されるように両方のモチーフが突然変異される。ミスセンス変異、ナンセンス変異、フレームシフト変異などを含む任意のタイプの変異を用いて、Cas9ヌクレアーゼでのHNHモチーフおよび/またはRuvCモチーフの活性を低下または消去することができる。
本開示は、様々なCRISPR−CasシステムおよびCas9ヌクレアーゼのグループ化を特定する。これらのグループ化は、Cas9ヌクレアーゼのStreptococcus thermophilus CRISPR 1(Sth CR1)グループ、Cas9ヌクレアーゼのStreptococcus thermophilus CRISPR 3(Sth CR3)グループ、Cas9ヌクレアーゼのLactobacillus buchneri CD034(Lb)グループ、およびCas9ヌクレアーゼのLactobacillus rhamnosus GG(Lrh)グループを含む。Sth CR1グループCas9ヌクレアーゼの非限定的な例は、配列番号1〜9および51のポリペプチド配列によりコードされるCas9ヌクレアーゼを含む。Sth CR3グループCas9ヌクレアーゼの非限定的な例は、配列番号10〜23のポリペプチド配列によりコードされるCas9ヌクレアーゼを含む。LbグループCas9ヌクレアーゼの非限定的な例は、配列番号28、30〜33、35、43、44、47、50および52のポリペプチド配列によりコードされるCas9ヌクレアーゼを含む。LrhグループCas9ヌクレアーゼの非限定的な例は、配列番号24〜27、29、34、36〜42、45および53のポリペプチド配列によりコードされるCas9ヌクレアーゼを含む。さらなるCas9ヌクレアーゼは、限定されないが、Lactobacillus curvatus CRL 705のものを含む。本発明で有用なさらなるCas9ヌクレアーゼは、限定されないが、Lactobacillus animalis KCTC 3501、およびLactobacillus farciminis WP 010018949.1由来の、Cas9を含む。
したがって、一部の実施態様では、Cas9ヌクレアーゼは、Cas9ヌクレアーゼのStreptococcus thermophilus CRISPR 1(Sth CR1)グループ由来のCas9、Cas9ヌクレアーゼのStreptococcus thermophilus CRISPR 3(Sth CR3)グループ由来のCas9、Cas9ヌクレアーゼのLactobacillus buchneri CD034(Lb)グループ由来のCas9ヌクレアーゼ、および/または、Cas9ヌクレアーゼのLactobacillus rhamnosus GG(Lrh)グループ由来のCas9ヌクレアーゼを含み得る、から本質的になり得る、またはからなり得る。さらなる実施態様では、Cas9ヌクレアーゼをコードするアミノ酸配列は、配列番号1〜配列番号53のいずれか1つのアミノ酸配列であってよい。また、さらなる実施態様では、本開示の合成tracr核酸構築物、合成CRISPR核酸構築物、合成CRISPR核酸アレイ、および/またはキメラ核酸構築物で有用なCas9ヌクレアーゼは、配列番号1〜配列番号53のいずれか1つのアミノ酸配列と少なくとも70%の同一性を有するアミノ酸配列をコードするヌクレオチド配列を含む、から本質的になる、またはからなる。
さらに、特定の実施態様では、Cas9ヌクレアーゼは、標的DNAを含む生物のためにコドン最適化されたヌクレオチド配列によりコードされ得る。さらに他の実施態様では、Cas9ヌクレアーゼは、少なくとも1つの核局在化配列を含み得る。
本発明者は、驚くべきことに、特定のグループのCas9ヌクレアーゼと合成tracr核酸構築物(tracrRNA、tracrDNA)のネクサス配列間の機能的対合を発見した。したがって、一部の実施態様では、ネクサス配列がGATAAGGCまたはGATAAGGCCATGCCである場合、Cas9ヌクレアーゼは、Cas9ヌクレアーゼのStreptococcus thermophilus CRISPR 1(STh CR1)グループ由来であり;ネクサス配列がTAAGGCまたはTAAGGCTAGTCCである場合は、Cas9ヌクレアーゼは、Cas9ヌクレアーゼのStreptococcus thermophilus CRISPR 3(Sth CR3)グループ由来であり;ネクサス配列がTCAAGCまたはTCAAGCAAAGCである場合は、Cas9ヌクレアーゼは、Cas9ヌクレアーゼのLactobacillus buchneri CD034(Lb)グループ由来であり;または、前記ネクサス配列がTCAAACまたはTCAAACAAAGCTTCAGCである場合は、Cas9ヌクレアーゼは、Cas9ヌクレアーゼのLactobacillus rhamnosus GG(Lrh)グループ由来である。
本明細書に記載のように、本発明で有用なCas9ヌクレアーゼは、HNHモチーフおよび/またはRuvCモチーフに変異を含んでよく、それにより、それぞれのモチーフの活性が低下または消去される。当技術分野で知られているように、HNHモチーフ内の変異は、二本鎖標的DNAの(+)鎖の部位特異的ニックを減少/消去し、RucV活性部位の変異は、二本鎖標的DNAの(−)鎖の部位特異的ニックを低下/消去する。両方の活性部位の変異は、DNAの切断を低下/消去する(すなわち、標的DNAの部位特異的切断を低下/消去する)。したがって、一部の実施態様では、本開示の合成tracr核酸構築物、合成CRISPR核酸構築物、CRISPR核酸アレイ、および/またはキメラ核酸構築物は、RuvC活性部位モチーフ内に変異を有するCas9ヌクレアーゼを含む。他の実施態様では、本開示の合成tracr核酸構築物、合成CRISPR核酸構築物、CRISPR核酸アレイ、および/またはキメラ核酸構築物は、HNH活性部位モチーフ内に変異を有するCas9ヌクレアーゼを含む。またさらなる実施態様では、本開示の合成tracr核酸構築物、合成CRISPR核酸構築物、CRISPR核酸アレイ、および/またはキメラ核酸構築物は、HNH活性部位モチーフ内およびRuvCモチーフ内に変異を有するCas9ヌクレアーゼを含む。
またさらなる実施態様では、HNHおよびRuvCモチーフ内に変異を有し、それによりヌクレアーゼ活性が低下または消去されたCas9ヌクレアーゼは、Cas9ヌクレアーゼに融合された目的ポリペプチドをさらに含む。そのようなCas9−目的ポリペプチド融合タンパク質を用いて、目的ポリペプチドを特定の標的DNAへ向かわせる、または標的化することができる。
本開示の合成tracr核酸構築物、合成CRISPR核酸構築物、CRISPR核酸アレイ、および/またはキメラ核酸構築物を用いるための方法が、本明細書においてさらに提供される。したがって、一部の実施態様では、本開示のキメラ核酸構築物または本開示のキメラ核酸構築物を含む発現カセットを、Cas9ヌクレアーゼ(例えば、配列番号1〜53)の存在下で標的DNAと接触させ、それにより、標的DNAに対するスペーサー配列の相補ハイブリダイゼーションにより規定される領域内で標的DNAの部位特異的切断を生じさせるステップを含む、二本鎖標的DNAの部位特異的切断のための方法が提供される。一部の実施態様では、部位特異的切断は、二本鎖標的DNAの(+)鎖の部位特異的ニックであってよく、前記Cas9ヌクレアーゼは、RuvC活性部位モチーフ内の変異を含み、それにより、二本鎖標的の(+)鎖を切断して、部位−特異的なニックを二本鎖標的DNAの前記(+)鎖に生じさせる。他の実施態様では、部位特異的切断は、二本鎖標的DNAの(−)鎖の部位特異的ニックであり、前記Cas9ヌクレアーゼは、HNH活性部位モチーフ内に点変異を含み、それにより、二本鎖標的DNAの(−)鎖を切断し、二本鎖標的DNAの前記(−)鎖に部位−特異的なニックを生じさせる。
さらなる実施態様では、二本鎖標的DNAの部位特異的切断のための方法が提供され、以下を含む:トランスコード化CRISPR(tracr)核酸分子およびCRISPR核酸分子を、Cas9ヌクレアーゼ(例えば、配列番号1〜53)の存在下で標的DNAと接触させるステップ、ここで、(a)tracr核酸分子は、5’から3’の方向に、少なくとも約3個のヌクレオチドを含む抗−ジッパー配列;少なくとも約3個のヌクレオチドを含むバルジ配列;NNANNのヌクレオチド配列を含む抗−ステッチ配列;TNANNC、T(A/C)A(A/G)(G/A)C、TCAAAC、TAAGGC、GATAAGG、GATAAGGCTT、TCAAG、TCAAGCAA、T(C/A)AA(A/C)(C/A)(A/G)(A/T)、GATAAGGCCATGCC、TAAGGCTAGTCC、TCAAGCAAAGC、またはTCAAACAAAGCTTCAGCのヌクレオチド配列を含むネクサス配列;および、少なくとも1つのヘアピンを含む、から本質的になる、またはからなる、ヌクレオチド配列を含むヘアピン配列を含む、ヌクレオチド配列によりコードされ、前記ヘアピンは少なくとも3個の一致する塩基対を含み、抗−ジッパー配列は、バルジ配列のすぐ上流に位置し、バルジ配列は、抗−ステッチ配列のすぐ上流に位置し、抗−ステッチ配列は、ネクサス配列のすぐ上流に位置し、および、ネクサス配列は、ヘアピン配列のすぐ上流に位置する;および、(b)CRISPR核酸分子は、3’から5’の方向に、少なくとも約3個のヌクレオチドを含むジッパー配列、少なくとも2個のヌクレオチドを有するヌクレオチド配列を含むバルジ配列、NNTNN(またはNNUNN)のヌクレオチド配列を含むステッチ配列、ヌクレオチドGまたはGTTを含むGR1、および5’末端および3’末端を有するスペーサー配列であって、その3’末端に標的DNAと100%の同一性を有する少なくとも7個のヌクレオチドを含むスペーサー配列を含む、ヌクレオチド配列によりコードされ、ジッパー配列は、バルジ配列のすぐ上流に位置し、バルジ配列は、ステッチ配列のすぐ上流に位置し、ステッチ配列は、GR1のすぐ上流に位置し、および、GR1は、スペーサー配列のすぐ上流に位置する、およびさらにここで、tracr核酸分子の抗−ジッパー配列および抗−ステッチ配列は、それぞれ、CRISPR核酸分子のジッパー配列およびステッチ配列と、少なくとも約70%相補でありハイブリダイズし、CRISPR核酸分子のスペーサー配列は、標的DNAの一部(標的DNA上のプロトスペーサー隣接モチーフ(PAM)に隣接する)と少なくとも約80%相補でありハイブリダイズし、それにより、標的DNAに対するCRISPR核酸分子のスペーサー配列の相補結合により規定される領域内で、標的DNAの部位特異的切断をもたらす。
他の実施態様では、二本鎖標的DNAを、以下を含むキメラ核酸と接触させるステップ含む、二本鎖標的DNAの部位特異的切断のための方法が提供される。(a)5’から3’の方向に、少なくとも約9個のヌクレオチドを含む抗−ジッパー配列;少なくとも約4個のヌクレオチドを含むバルジ配列;NNANNのヌクレオチド配列を含む抗−ステッチ配列;TNANNC、T(A/C)A(A/G)(G/A)C、TCAAAC、TAAGGC、GATAAGG、GATAAGGCTT、TCAAG、TCAAGCAA、T(C/A)AA(A/C)(C/A)(A/G)(A/T)、GATAAGGCCATGCC、TAAGGCTAGTCC、TCAAGCAAAGC、またはTCAAACAAAGCTTCAGCのヌクレオチド配列を含むネクサス配列;および、少なくとも1つのヘアピンを有するヌクレオチド配列を含むヘアピン配列を含む、第一のヌクレオチド配列(前記ヘアピンは、少なくとも3個の一致する塩基対を含み、抗−ジッパー配列は、バルジ配列のすぐ上流に位置し、バルジ配列は、抗−ステッチ配列のすぐ上流に位置し、抗−ステッチ配列は、ネクサス配列のすぐ上流に位置し、ネクサス配列は、ヘアピン配列のすぐ上流に位置する);(b)3’から5’の方向に、少なくとも約3個のヌクレオチドを含むジッパー配列、少なくとも2個のヌクレオチドを有するヌクレオチド配列を含むバルジ配列、NNTNN(またはNNUNN)のヌクレオチド配列を含むステッチ配列、ヌクレオチドGまたはGTTを含むGR1、および、5’末端および3’末端を有するスペーサー配列であって、その3’末端に標的DNAと100%の同一性を有する少なくとも7個のヌクレオチドを含むスペーサー配列を含む、第二のヌクレオチド配列(ジッパー配列は、バルジ配列のすぐ上流に位置し、バルジ配列は、ステッチ配列のすぐ上流に位置し、ステッチ配列は、GR1のすぐ上流に位置し、および、GR1は、スペーサー配列のすぐ上流に位置する);および、(c)Cas9ヌクレアーゼ(例えば、配列番号1〜53)をコードするアミノ酸配列と少なくとも80%の同一性を有するアミノ酸配列をコードする、第三のヌクレオチド配列(ここで、第一のヌクレオチド配列の抗−ジッパー配列および抗−ステッチ配列は、第二のヌクレオチド配列のジッパー配列およびステッチ配列にハイブリダイズし、第二のヌクレオチド配列のスペーサー配列は、標的DNAの一部(標的DNA上のプロトスペーサー隣接モチーフ(PAM)に隣接する)にハイブリダイズし、それにより、標的DNAに対する第二のヌクレオチド配列のスペーサー配列の相補結合により規定される領域内で、標的DNAの部位特異的切断をもたらす)。
さらなる実施態様では、二本鎖(ds)標的DNAに対する、目的ポリペプチドの部位特異的ターゲッティングの方法が提供され、トランスコード化CRISPR(tracr)核酸分子およびCRISPR核酸分子を、Cas9ヌクレアーゼ(例えば、配列番号1〜53)の存在下で標的DNAと接触させるステップを含み、ここで(a)tracr核酸分子は、5’から3’の方向に、少なくとも約3個のヌクレオチドを含む抗−ジッパー配列;少なくとも約3個のヌクレオチドを含むバルジ配列;NNANNのヌクレオチド配列を含む抗−ステッチ配列;TNANNC、T(A/C)A(A/G)(G/A)C、TCAAAC、TAAGGC、GATAAGG、GATAAGGCTT、TCAAG、TCAAGCAA、T(C/A)AA(A/C)(C/A)(A/G)(A/T)、GATAAGGCCATGCC、TAAGGCTAGTCC、TCAAGCAAAGC、またはTCAAACAAAGCTTCAGCのヌクレオチド配列を含むネクサス配列;および、少なくとも1つのヘアピンを有するヌクレオチド配列を含むヘアピン配列を含む、ヌクレオチド配列によりコードされ、前記ヘアピンは、少なくとも3個の一致する塩基対を含み、抗−ジッパー配列は、バルジ配列のすぐ上流に位置し、バルジ配列は、抗−ステッチ配列のすぐ上流に位置し、抗−ステッチ配列は、ネクサス配列のすぐ上流に位置し、および、ネクサス配列は、ヘアピン配列のすぐ上流に位置する;および、(b)CRISPR核酸分子は、3’から5’の方向に、少なくとも約3個のヌクレオチドを含むジッパー配列、少なくとも2個のヌクレオチド(例えば(−NN−)のヌクレオチド配列)を含むバルジ配列、NNTNNのヌクレオチド配列を含むステッチ配列、ヌクレオチドGまたはGTTを含むGR1、および5’末端および3’末端を有するスペーサー配列であって、その3’末端に標的DNAと100%の同一性を有する少なくとも7個のヌクレオチドを含むスペーサー配列を含む、ヌクレオチド配列によりコードされ、ジッパー配列は、バルジ配列のすぐ上流に位置し、バルジ配列は、ステッチ配列のすぐ上流に位置し、ステッチ配列は、GR1のすぐ上流に位置し、および、GR1は、スペーサー配列のすぐ上流に位置する、およびさらにここで、Cas9ヌクレアーゼは、HNH活性部位モチーフ内の変異、RuvC活性部位モチーフ内の変異を含み、および、目的ポリペプチドに融合され、抗−ジッパー配列は、ジッパー配列と約70%相補でありハイブリダイズし、ステッチ配列は、ステッチ配列と100%相補でありハイブリダイズし、スペーサー配列は、標的DNA上のプロトスペーサー隣接モチーフ(PAM)に隣接する標的DNAと約80%相補でありハイブリダイズし、それにより、標的DNAに対するCRISPR核酸分子のスペーサー配列の相補結合により規定される領域で、標的DNAに対する目的ポリペプチドの部位特異的ターゲッティングをもたらす。
代表的な実施態様では、本明細書に記載のように、合成tracr核酸構築物に関して、合成tracr核酸分子のバルジ配列または第一のヌクレオチド配列は、約3個、4個または5個のヌクレオチドを含み得て、から本質的になり得て、またはからなり得る。他の実施態様では、バルジ配列は、5個のヌクレオチドを含み得て、から本質的になり得て、またはからなり得て、および、ヘアピン配列は、少なくとも2個のヘアピンを含み得て、から本質的になり得て、またはからなり得て、ここで、各ヘアピンは少なくとも3個の一致する塩基対を含む。
さらなる実施態様では、本発明は、トランスコード化CRISPR(tracr)核酸分子およびCRISPR核酸分子を、Cas9ヌクレアーゼの存在下で標的DNAと接触させるステップを含む二本鎖標的DNAの部位特異的切断のための方法を提供し、ここで、
(a)tracr核酸分子は、5’から3’の方向に、少なくとも約3個のヌクレオチドを含む随意的な抗−ジッパー配列;少なくとも約3個のヌクレオチドを含むバルジ配列;NNANNのヌクレオチド配列を含む抗−ステッチ配列、TNANNC、T(A/C)A(A/G)(G/A)C、TCAAAC、TAAGGC、GATAAGG、GATAAGGCTT、TCAAG、TCAAGCAA、T(C/A)AA(A/C)(C/A)(A/G)(A/T)、GATAAGGCCATGCC、TAAGGCTAGTCC、TCAAGCAAAGC、またはTCAAACAAAGCTTCAGCのヌクレオチド配列を含むネクサス配列、少なくとも1つのヘアピンを有するヌクレオチド配列を含むヘアピン配列を含むヌクレオチド配列によりコードされ、前記ヘアピンは、少なくとも3個の一致する塩基対を含む、および
抗−ジッパー配列は、存在する場合は、バルジ配列のすぐ上流に位置し、バルジ配列は、抗−ステッチ配列のすぐ上流に位置し、抗−ステッチ配列は、ネクサス配列のすぐ上流に位置し、および、ネクサス配列は、ヘアピン配列のすぐ上流に位置する;および
(b)CRISPR核酸分子は、3’から5’の方向に、抗−ジッパーにハイブリダイズする少なくとも3個のヌクレオチドを有するヌクレオチド配列を含む随意的なジッパー配列、(−NN−)のヌクレオチド配列を含むバルジ配列、NNUNNのヌクレオチド配列を含むステッチ配列、および5’末端および3’末端を有するスペーサー配列であって、その3’末端に標的DNAと100%の同一性を有する少なくとも7個のヌクレオチドを含むスペーサー配列を含むヌクレオチド配列によりコードされ、および
ジッパー配列は、存在する場合は、バルジ配列のすぐ上流に位置し、バルジ配列は、ステッチ配列のすぐ上流に位置し、ステッチ配列は、スペーサー配列のすぐ上流に位置し、および、
さらにここで、抗−ジッパーおよびジッパー配列が存在する場合は、抗−ジッパー配列はジッパー配列にハイブリダイズし、抗−ステッチ配列のNNANNは、ステッチ配列のNNUNNに相補でありハイブリダイズし、CRISPR核酸分子のスペーサー配列は標的DNAの一部(標的DNA上のプロトスペーサー隣接モチーフ(PAM)に隣接する)にハイブリダイズし、それにより、標的DNAに対するCRISPR核酸分子のスペーサー配列のハイブリダイゼーションにより規定される領域内で、標的DNAの部位特異的切断をもたらす。
またさらなる実施態様では、二本鎖標的DNAの部位特異的切断のための方法が提供され、その方法は、二本鎖標的DNAを、以下を含むキメラ核酸と接触させるステップを含む:
(a)5’から3’の方向に、少なくとも約3個のヌクレオチドを含む随意的な抗−ジッパー配列;少なくとも約3個のヌクレオチドを含むバルジ配列;NNANNのヌクレオチド配列を含む抗−ステッチ配列、TNANNC、T(A/C)A(A/G)(G/A)C、TCAAAC、TAAGGC、GATAAGG、GATAAGGCTT、TCAAG、TCAAGCAA、T(C/A)AA(A/C)(C/A)(A/G)(A/T)、GATAAGGCCATGCC、TAAGGCTAGTCC、TCAAGCAAAGC、またはTCAAACAAAGCTTCAGCのヌクレオチド配列を含むネクサス配列、少なくとも1つのヘアピンを有するヌクレオチド配列を含むヘアピン配列を含む、第一のヌクレオチド配列(前記ヘアピンは、少なくとも3個の一致する塩基対を含む)、
ここで、抗−ジッパー配列は、存在する場合は、バルジ配列のすぐ上流に位置し、バルジ配列は、抗−ステッチ配列のすぐ上流に位置し、抗−ステッチ配列は、ネクサス配列のすぐ上流に位置し、および、ネクサス配列は、ヘアピン配列のすぐ上流に位置する;
(b)3’から5’の方向に、抗−ジッパーにハイブリダイズする少なくとも3個のヌクレオチドを有するヌクレオチド配列を含む随意的なジッパー配列、少なくとも2個のヌクレオチドを有するヌクレオチド配列(例えば、(−NN−)のヌクレオチド配列)を含むバルジ配列、NNUNNのヌクレオチド配列を含むステッチ配列、および5’末端および3’末端を有するスペーサー配列であって、その3’末端に標的DNAと100%の同一性を有する少なくとも7個のヌクレオチドを含むスペーサー配列を含む、第二のヌクレオチド配列、および
ジッパー配列は、存在する場合は、バルジ配列のすぐ上流に位置し、バルジ配列は、ステッチ配列のすぐ上流に位置し、ステッチ配列は、スペーサー配列のすぐ上流に位置する;および
(c)Cas9ヌクレアーゼ(例えば、配列番号1〜53)をコードするアミノ酸配列と少なくとも80%の同一性を有するアミノ酸配列をコードする、第三のヌクレオチド配列、
ここで、ジッパー配列および抗−ジッパー配列が存在する場合は、ジッパー配列は、抗−ジッパー配列にハイブリダイズし、抗−ステッチ配列のNNANNは、ステッチ配列のNNUNNと相補でありハイブリダイズし、第二のヌクレオチド配列のスペーサー配列は、標的DNAの一部(標的DNA上のプロトスペーサー隣接モチーフ(PAM)に隣接する)にハイブリダイズし、それにより、標的DNAに対する第二のヌクレオチド配列のスペーサー配列のハイブリダイゼーションにより規定される領域内で、標的DNAの部位特異的切断をもたらす。
さらなる実施態様では、二本鎖(ds)標的DNAに対する、目的ポリペプチドの部位特異的ターゲッティングの方法が提供され、トランスコード化CRISPR(tracr)核酸分子およびCRISPR核酸分子を、Cas9ヌクレアーゼ(例えば、配列番号1〜53)の存在下で標的DNAと接触させるステップを含み、
ここで、(a)tracr核酸分子は、5’から3’の方向に、少なくとも約3個のヌクレオチドを含む随意的な抗−ジッパー配列;少なくとも約3個のヌクレオチドを含むバルジ配列;NNANNのヌクレオチド配列を含む抗−ステッチ配列、TNANNC、T(A/C)A(A/G)(G/A)C、TCAAAC、TAAGGC、GATAAGG、GATAAGGCTT、TCAAG、TCAAGCAA、T(C/A)AA(A/C)(C/A)(A/G)(A/T)、GATAAGGCCATGCC、TAAGGCTAGTCC、TCAAGCAAAGC、またはTCAAACAAAGCTTCAGCのヌクレオチド配列を含むネクサス配列、少なくとも1つのヘアピンを有するヌクレオチド配列を含むヘアピン配列を含む、ヌクレオチド配列によりコードされ、前記ヘアピンは、少なくとも3個の一致する塩基対を含み、および
抗−ジッパー配列は、存在する場合は、バルジ配列のすぐ上流に位置し、バルジ配列は、抗−ステッチ配列のすぐ上流に位置し、抗−ステッチ配列は、ネクサス配列のすぐ上流に位置し、および、ネクサス配列は、ヘアピン配列のすぐ上流に位置する;および
(b)CRISPR核酸分子は、3’から5’の方向に、抗−ジッパーにハイブリダイズする少なくとも3個のヌクレオチドを有するヌクレオチド配列を含む随意的なジッパー配列、少なくとも2個のヌクレオチドを有するヌクレオチド配列(例えば、(−NN−)のヌクレオチド配列)を含むバルジ配列、NNUNNのヌクレオチド配列を含むステッチ配列、および5’末端および3’末端を有するスペーサー配列であって、その3’末端に標的DNAと100%の同一性を有する少なくとも7個のヌクレオチドを含むスペーサー配列を含む、ヌクレオチド配列によりコードされ、および
ジッパー配列は、存在する場合は、バルジ配列のすぐ上流に位置し、バルジ配列は、ステッチ配列のすぐ上流に位置し、ステッチ配列は、スペーサー配列のすぐ上流に位置し、および
さらにここで、Cas9ヌクレアーゼは、HNH活性部位モチーフ内の変異、RuvC活性部位モチーフ内の変異を含み、目的ポリペプチドに融合され、ジッパー配列および抗−ジッパー配列が存在する場合は、ジッパー配列は抗−ジッパー配列にハイブリダイズし、抗−ステッチ配列のNNANNは、ステッチ配列のNNUNNと相補でありハイブリダイズし、スペーサー配列は、標的DNA上のプロトスペーサー隣接モチーフ(PAM)に隣接する標的DNAにハイブリダイズし、それにより、標的DNAに対するCRISPR核酸分子のスペーサー配列のハイブリダイゼーションにより規定される領域内で、標的DNAに対する目的ポリペプチドの部位特異的ターゲッティングをもたらす。
一部の実施態様では、tracr核酸分子およびaCRISPR核酸分子の抗−ジッパーおよびジッパー配列または第一のヌクレオチド配列および第二のヌクレオチド配列がハイブリダイズする場合、ハイブリダイズした配列は、場合により、バルジ配列に対して遠位であるハイブリダイズした配列の末端にさらなるヌクレオチドをさらに含むことができ、それにより、ハイブリダイズしたジッパーおよび抗−ジッパー配列を連結する。さらなる実施態様では、ジッパーおよび抗−ジッパーが存在しない場合、キメラ核酸構築物は、場合により、合成trac核酸配列のバルジ配列を合成CRISPR核酸のバルジ配列に連結するヌクレオチドをさらに含むことができる。連結ヌクレオチドは、任意のヌクレオチド(例えば、T、A、G、C)であり得て、ジッパーおよび抗−ジッパー配列またはバルジ配列を連結するヌクレオチドの数は、約3〜約7個であり得る。
制限されないが配列番号1〜53を含む、任意の野生型、突然変異型、コドン最適化Cas9ヌクレアーゼ、または、本明細書に記載の少なくとも1つの核局在化配列を含むものは、本発明の方法で用いることができる。
本明細書においてさらに提供されるのは、本発明の核酸構築物、核酸アレイ、核酸分子および/またはヌクレオチド配列を含む、発現カセットおよびベクターであり、本開示の方法で用いることができる。
さらなる態様では、本発明の核酸構築物、核酸アレイ、核酸分子、および/またはヌクレオチド配列は、宿主生物の細胞に導入することができる。本発明が有用である任意の細胞/宿主生物を用いることができる。例示的な宿主生物は、限定されないが、植物、細菌、古細菌、菌類、動物、哺乳類、昆虫、鳥類、魚類、両生類、刺胞動物、ヒト、または非ヒト霊長類を含む。特定の実施態様では、宿主生物は、制限されないが、Homo sapiens、Drosophila melanogaster、Mus musculus、Rattus norvegicus、Caenorhabditis elegans、Saccharomyces pombe、Saccharomyces cerevisiae、Glycine max、Zeae maydis、Gossypium hirsutum、または、Arabidopsis thalianaであってよい。さらなる実施態様では、本発明で有用な細胞は、制限されないが、幹細胞、体細胞、生殖細胞、植物細胞、動物細胞、細菌性細胞、古細菌細胞、真菌細胞、哺乳類細胞、昆虫細胞、鳥類細胞、魚類細胞、両生類細胞、刺胞動物細胞、ヒト細胞、または非ヒト霊長類細胞であってよい。他の実施態様では、本発明で有用な細胞は、制限されないが、Homo sapiens、Drosophila melanogaster、Mus musculus、Rattus norvegicus、Caenorhabditis elegans、Saccharomyces pombe、Saccharomyces cerevisiae、Glycine max、Zeae maydis、Gossypium hirsutum、または、Arabidopsis thaliana由来の細胞を含む。
本発明のさらなる態様では、目的ポリペプチドは、制限されないが、ヘリカーゼ、ヌクレアーゼ、メチルトランスフェラーゼ、ジャイレース、デメチラーゼ、キナーゼ、ジスムターゼ、インテグラーゼ、トランスポゼース、テロメラーゼ、リコンビナーゼ、アセチルトランスフェラーゼ、デアセチラーゼ、ポリメラーゼ、ホスファターゼ、リガーゼ、ユビキシンリガーゼ、ホトリアーゼまたはグリコシラーゼを含んでよい。本発明の他の態様では、目的ポリペプチドは、脱プリン活性、酸化活性、ピリミジンダイマー形成活性、アルキル化活性、DNA修復活性、DNA損傷活性、脱ユビキチン化活性、アデニル化活性、脱アデニル化活性 SUMO化活性、脱SUMO化活性、リボシル化活性、脱リボシル化活性、ミリストイル化活性、脱ミリストイル化活性またはテロメア修復活性、または脱アミノ化活性を有する。代表的な実施態様では、目的ポリペプチドは、キナーゼ活性、ヌクレアーゼ活性、メチルトランスフェラーゼ活性、デメチラーゼ活性、アセチルトランスフェラーゼ活性、デアセチラーゼ活性、ホスファターゼ活性、ユビキシンリガーゼ活性、脱ユビキチン化活性、またはテロメア修復活性を有するポリペプチドであってよい。
本発明の核酸構築物、核酸分子、および/またはヌクレオチド配列を含むキットが、本明細書においてさらに提供される。
したがって、一態様では、二本鎖DNAの部位特異的切断のためのキットが提供され、そのキットは、本発明の合成tracr核酸構築物、合成CRISPR核酸構築物、CRISPR核酸アレイまたはキメラ核酸構築物を含む。別の態様では、二本鎖(ds)標的DNAに対する目的ポリペプチドの部位特異的ターゲッティングのためのキットが提供され、そのキットは、本発明の合成tracr核酸構築物、合成CRISPR核酸構築物、CRISPR核酸アレイまたはキメラ核酸構築物を含む。一部の態様では、キットは、1つまたは複数の発現カセットに包含された、本発明の合成tracr核酸構築物、合成CRISPR核酸構築物、CRISPR核酸アレイおよび/またはキメラ核酸構築物を含んでよい。またさらなる態様では、キットは、本明細書に記載の本発明の核酸構築物、核酸アレイ、核酸分子、および/またはヌクレオチド配列で用いるためのCas9ヌクレアーゼ(例えば、配列番号1〜53)をさらに含んでよい。
さらなる態様では、キットはプライマーを含んでよく、前記プライマーは、両方向にCRISPRリピート配列の一部を含む。他の実施態様では、キットは、CRISPRアレイの境界(すなわち一方のリーダーエンドともう片方のトレーラーエンド)を含んで両方向にCRISPRリピート配列を通って伸長するように設計された、プライマーを含んでよい。
さらなる実施態様では、キットは、使用のための説明書をさらに含んでよい。
ここで本発明は、以下の実施例を参照して説明される。これらの実施例は本発明に対する請求項の範囲を限定することを意図しないが、特定の実施態様の例示であることが意図されることが、理解されるべきである。当業者が想到する例示された方法における任意の変更は、本発明の範囲内であることが意図される。
実施例1.ガイド配列内に同定されたモジュールの機能的役割の評価
Clustered regularly interspaced short palindromic repeat(CRISPR)および関連するCasタンパク質は、細菌および古細菌において侵襲性遺伝因子に対する適応免疫を与える1。II型CRISPR−Casシステムでは、シグネチャRNAにガイドされるエンドヌクレアーゼCas9は、CRISPRスペーサーに相補な配列を特異的に標的化し、2つのニッカーゼドメインを用いた二本鎖DNA切断(DSB)を生じさせる(Makarova,K.S.et al.Nat Rev Microbiol 9,467−477(2011);Garneau,J.E.et al.Nature 468,67−71(2010);Sapranauskas,R.et al.Nucleic Acids Res 39,9275−9282(2011);Gasiunas,G.et al.Proc Natl Acad Sci US A 109,E2579−E2586(2012);Jinek,M.et al.,Science 337,816−821(2012))。Cas9−特異的プロトスペーサー−隣接モチーフ(PAM)が隣接している限り、任意のDNA配列が標的とされ得る。Garneau,J.E.et al.Nature 468,67−71(2010);Sapranauskas,R.et al.Nucleic Acids Res 39,9275−9282(2011);Gasiunas,G.et al.Proc Natl Acad Sci US A 109,E2579−E2586(2012);Jinek,M.et al.,Science 337,816−821(2012);Sternberg,S.H.et al.Nature 507,62(2014))。Cas9システムによるターゲッティングおよび切断は、CRISPR RNA(crRNA)およびトランス活性化crRNA(tracrRNA)からなるRNAデュプレックスに依拠する8。この天然の複合体は、crRNA:tracrRNAデュプレックスをミミックする合成のシングルガイドRNA(sgRNA)キメラにより置き換えることができる(Jinek,M.et al.,Science 337,816−821(2012))。Cas9と組み合わせたsgRNAは、エンジニアリングおよび工業上および翻訳上興味深い様々なモデルシステムへの異種移行に適した、便利で、コンパクトで、そしてポータブルな、配列−特異的なターゲッティングシステムを作る。
したがって、二本鎖切断(DSB)を生じさせるためのコンパクトで実践的な手段を提供するCas9:sgRNA技術は、革命的なゲノム編成を有し(Mali,P.et al.,Science 339,823−826(2013);Cong,L.et al.Science 339,819−823(2013);Jiang,W.et al.Nat.Biotechnol.31,233−239(2013);Sander,J.D.&Joung,J.K.Nature Biotechnol.32,347−355.(2014))、ハイスループットのゲノム全域にわたる遺伝子スクリーニングに新しい道を切り開き13,14、転写調節のツールボックスを拡張した(Qi,L.S.et al.Cell 152,1173−1183(2013);Gilbert,L.A.et al.Cell 154,442−451(2013))。さらに、進化的に離れたCas9:sgRNAの間の相互作用の不存在は(Chylinski,K.et al.RNA biology 10,726−737(2013);Fonfara,I.et al.Nucleic Acids Res(2013);Esvelt,K.M.et al.Nature Methods(2013))、共存する機能性II型CRISPR−Casシステムが同時に機能する場合、多重の非依存性ターゲッティングが細胞内で達成されるのを可能にした(Barrangou,R.et al.Science 315,1709−1712(2007);Horvath,P.et al.J Bacteriol.190,1401−1412(2008))。これらの分子機構の広範な使用にかかわらず、sgRNAガイドの重大な特性、および、機能的にオルソロガスなCas9エンドヌクレアーゼの定義におけるそれらの関与は、特徴付けが未だされていない。実際に、Cas9ターゲッティングおよび切断の初期の注目は、スペーサー:標的相補性およびPAM配列感度に焦点が当てられ、一方で、Cas9:sgRNA相互作用を駆動する因子およびII型CRISPR−Casシステム間の直交性を指示する因子を定義する情報は不足したままである。したがって、我々は、CRISPR技術に関する新しいエンジニアリングの道を切り開くために、Cas9ターゲッティングおよび切断特異性を与えるsgRNA内の特性を同定および特徴付けに着手した。
したがって、本明細書に記載のガイド配列内に同定された様々なモジュール(例えば、合成tracr核酸構築物、合成CRISPR核酸構築物、キメラ核酸構築物(tracr核酸−合成CRISPR核酸構築物)の機能的役割および意味合い(implication)を評価するために、我々は、前述の機能性モジュールのそれぞれの改変または欠失を含む、ガイドの突然変異の変異体を設計した。我々は、代表的な機能性モデルとしてSthCRISPR3システムを選択し、天然のガイド配列を用いてポジティブの機能性コントロール(野生型、WT)を最初に確立した。それから我々は、ステッチが欠失した「ステッチ」変異体を試験し、機能の損失を観察した。それから、バルジが欠失した「バルジ」変異体を試験し、機能の損失を観察した。それから我々は、ネクサスが欠失した「ネクサス」変異体を試験し、機能の損失を観察した。それから我々は、第一のヘアピンが欠失した「ヘアピン」変異体を試験し、機能の損失を観察した。続いて我々は、配列特異性および可変性感受性を試験し、突然変異の構築物において、ネクサスの配列は特異的であり、一方で他の機能性モジュール、とりわけジッパー、バルジ、ヘアピンおよびステッチに関しては可変性許容性があることを確立した。これらの実験の結果を図1〜21に示す。
したがって、図1は、ネクサスモジュールに関する多重配列アライメントを示し、図2は、本研究を通して開発されたネクサスモジュールに関する最大尤度ツリーを提供する。図3A〜図3Dは、Sth Cr1グループ(図3A)、Sth Cr3グループ(図3B)、Lrhグループ(図3C)およびLbuグループ(図3D)のネクサスモジュールに関するコンセンサス配列を示す。
図5は、抗−ステッチモジュールに関する多重配列アライメントを示し、一方で、図6A〜図6Dは、Sth Cr1グループ(図6A)、Sth Cr3グループ(図6B)、Lrhグループ(図6C)およびLbuグループ(図6D)の抗−ステッチモジュールに関するコンセンサス配列を示す。
同様に、バルジモジュールに関する多重配列アライメントが図7に提供され、Sth Cr1グループのバルジモジュールに関するコンセンサス配列が図8Aに示される。図8Bは、Sth Cr3グループのバルジモジュールに関するコンセンサス配列を示す。図8Cは、Lrhグループのコンセンサス配列を示し、図8Dは、Lbuグループのバルジモジュールに関するコンセンサス配列を示す。
ジッパーモジュールに関する多重配列アライメントが図9に示され、図10は、ジッパーモジュールに関する最大尤度ツリーを示す。
図11は、バルジ、抗−ステッチおよびネクサスモジュールに関する多重配列アライメントを示す。図4は、Cas9ヌクレアーゼに関する最大尤度ツリーを示す。
図12〜図21は、様々なcRNA:tracRNA構築物に関するガイド配列およびターゲッティングを示し、Sth CR1グループを表すStreptococcus thermophilus CR3(図12);Lbuグループを表すLactobacillus buchneri(図13);Sth CR1グループを表すStreptococcus thermophilus CR1(図14);Sth CR3グループを表すStreptococcus pyrogenes M1 GAS(図15);Lrhグループを表すLactobacillus rhamnosus(図16);Lanグループを表すLactobacillus animalis(図17);Lcaグループを表すLactobacillus casei(図18);Lgaグループを表すLactobacillus gasseri(図19);Ljeグループを表すLactobacillus jensenii(図20);および、Lpeグループを表すLactobacillus pentosusを含む(図21)。図12〜図21のそれぞれの下側は、標的配列(オープン構造)および隣接する(3’)PAMを含む、標的dsDNAを表す。各図の上側は、標的配列に相補の5’部分、およびCRISPRリピートに由来する3’部分からなる、CRISPR RNA(crRNA)を表し;そしてまた、抗−CRISPRリピート部分からなるtracrRNA、および、ネクサスおよび3’ヘアピンも示す。図12〜図21のそれぞれに示されるように、crRNA:tracrRNAデュプレックスの相補部分は、下側ステム(下の相補部分)、バルジ(ヘルニアミスマッチ(herniated mismatch))および上側ステム(上の相補部分)からなる。
実施例2.様々なさらなるII型システムにおける、ガイドRNA配列の特性の決定
実施例1で説明した知見は、Streptococcus pyrogenes Cas9(SpyCas9)活性をサポートするために必要なsgRNAでの重要なモジュールを確立する。しかしながら、ゲノム編成に幅広く用いられるが、SpyCas9は、天然に見いだされた多くのCas9オルソロガス(orthologs)の単なる1つにすぎない(Chylinski,K.et al.RNA biology 10,726−737(2013);Fonfara,I.et al.Nucleic Acids Res(2013))。したがって、我々は次に、同じsgRNA配列の特性が、他のII型CRISPR−Casシステムでも生じるかどうかを研究した。我々は、StreptococcusおよびLactobacillusゲノム(II型システムが優先的に生じる2)から41個のCas9配列をサンプリングし、それらの対応するCRISPRリピートを同定し、tracrRNA配列を予測した。Cas9タンパク質配列は、3つの主な配列グループにクラスタリングされた(図23)。期待したとおり、似たグループ化が、CRISPR−リピートまたは予測tracrRNA配列のいずれかを用いてクラスタリングを行なった場合に見られ(図24A、図23、図25、図26)、tracrRNA内の抗−CRISPRリピートの存在、およびCas9およびcrRNA:tracrRNAのペアの間の関係深い分子関係を与えた(Makarova,K.S.et al.Nat Rev Microbiol 9,467−477(2011);Deltcheva,E.et al.Nature 471,602−607(2011);Fonfara,I.et al.Nucleic Acids Res(2013))。tracrRNA配列内に、我々は一貫して、SpyCas9に関して同定された機能性モジュールを観察し(図24B)、ファミリー間の全体的なsgRNA/crRNA:tracrRNA構造は保存されていて、クラスター内で高レベルに配列が保存されていた。
下側ステム(すなわちステッチ/抗−ステッチ)と上側ステム(すなわちジッパー/抗−ジッパー)との間に方向のねじれを有するバルジの存在が、システムの多様性にわたって一貫して見られた。下側ステムの長さは、ファミリー内で高度に保存され、および、ファミリー間で可変であった。興味深いことに、最も高いレベルの保存はネクサス配列に関して見られた(図24B、図27)。GC−リッチのステムおよびオフセットのウラシルを有する、全般的なネクサスの形状は、2つのStreptococcusファミリー間で共有されていた。対照的に、独特な二重ステムのネクサス(図24A〜B)は、Lactobacillusシステムに特有で遍在した。意外なことに、ネクサス内のいくつかの塩基は、A52およびC55を含む異なるファミリー間でさえ厳密に保存されていて(図24A〜B)、このモジュールの重大な役割をさらに強調した。実際に、A52は、SpyCas9の結晶構造において、標的鎖の5’末端付近の残基1103−1107の主鎖と相互作用し、タンパク質主鎖とネクサスの相互作用がPAM結合に必要であり得ることを示唆する。
Cas9タンパク質の直交性に対する、ガイドRNAの構造の関係の決定。本明細書に記載の知見は、sgRNAの配列と構造の間の潜在的関係およびCas9タンパク質の多様性を示唆する。この観察は、Cas9オルソロガスのグループを定義するsgRNAモジュールを決定することを我々に駆り立てた。したがって、我々は、2つの天然に共存するオルソロガスのS.thermophilus II型システム、すなわちSth1 Cas9およびSth3 Cas9由来のエンドヌクレアーゼを選択し(Horvath,P.et al.J Bacteriol.190,1401−1412(2008))、sgRNA組成物とCas9直交性との間の関連を調べた。一連の実験は、Escherichia coliでの自己ターゲッティング活性に基づいて設計され(図28A〜B)、sgRNA内の特異的な変異が、オルソロガスであった(previously orthologous)Cas9での切断活性を促進することができるかどうか試験した。我々は、Sth1Cas9およびSth3Cas9システムに関してオーバーラップするCas9標的部位を含むE.coliゲノム内の領域を同定し、切断が1ヌクレオチドにおいて生じること(図29B)、および、PAM配列が好適にオーバーラップすることを確認した。我々は、2つのsgRNA主鎖のキメラバージョンを製造し、スペーサー、下側ステム(すなわちステッチ/抗ステッチ)−バルジ−上側ステム(すなわちジッパー/抗−ジッパー)、ネクサスおよびヘアピンを交換し(図29C)、および、Sth1Cas9またはSth3Cas9のいずれかにより、自己ターゲッティングを駆動する(Gomaa,A.A.et al.MBio.5,e00928−13(2014))、それらの能力を試験した。初めに我々は、これらの2つのシステムが、このアッセイシステムにおいて実際に直交性であること、および、各ガイドは単独でその同起源Cas9でのターゲッティングを駆動すること(図29C)を確認した。次に我々は、スペーサー配列の交換は、Sth1Cas9切断活性をサポートすることが可能な、CRISPR3スペーサーおよびCRISPR1主鎖を有するsgRNAをもたらすことを示した。しかしながら、Sth3Cas9活性について逆は成り立たない。CRISPR1スペーサーおよびCRISPR3主鎖を含むsgRNAは、Sth3Cas9活性をサポートしない(図29C)。我々は、この一方向性の相互機能性は、SthCRISPR1システムにおけるプロトスペーサーとPAMとの間の空間に関する要件の柔軟性に起因すると仮定する(Chen et al.J.Biol.Chem.doi:10.1074/jbc.M113.539726.(2014))(図29C、上パネル)。それから我々は、sgRNAとCas9との間の機能性は、2つの直交性システム間でネクサス−ヘアピンの組み合わせを交換するだけで変更することができることを示した。sgRNAの再プログラミングの主な結果は、オリジナルのCas9をガイドする能力がそのプロセスで失われることである(図29C、下パネル)。これは、CRISPRリピート配列がオルソロガスのCRISPR−Casシステムの定義において重要な役割を果たすという標準的な考えと対照的である。しかしながら、これらの結果は、変更されたネクサス配列を有するキメラsgRNAが、予測可能および一方向性の方法で直交性を再プログラムすることができることを示し、異なるPAMと関連する直交性Cas9タンパク質をさらに利用するために重大である(Esvelt,K.M.et al.Nature Methods(2013)))。
最近の構造的および生化学的データは、Cas9によるDNA認識および切断のメカニズムに光を放ち始めている(Jinek,M.et al.,Science 337,816−821(2012);Jinek,M.et al.,Science 343,6176(2014);Nishimasu,H.et al.Cell 156,935(2014))。apo−、RNA−結合およびタンパク質/RNA/DNA複合体の電子顕微鏡写真は、ガイドRNAと結合する際に、Cas9は、劇的な立体構造変化を受けて、標的DNA結合および切断の構造を促進することを示した(Jinek,M.et al.,Science 343,6176(2014)。結晶構造は、電子顕微鏡による画像と矛盾せずに、SpyCas9:sgRNA:DNA:複合体およびapo−SpyCas9は、RNA−およびDNA−結合ドメインの実質的な再編成が2つの構造間で行なわれて、著しく異なる構造を占めることを示す(Jinek,M.et al.,Science 343,6176(2014);Nishimasu,H.et al.Cell 156,935(2014))。ネクサスは、SpyCas9−sgRNA:DNA複合体において重大な位置を占め、タンパク質およびsgRNAの多くの重要な構成要素を整合し、タンパク質およびRNAの両方を適切に配置して、切断のための標的DNAデュプレックスを受け取る。sgRNA:DNAと結合する際に、アルギニン−リッチのブリッジヘリックスが、ネクサスの塩基および下側ステムに結合する。加えて、ネクサスは、SpyCas9の2つのローブ(lobe)由来の2つの小さな領域(我々は、Nexus Interacting Region 1(NIR1)446−497、および、Nexus Interacting Region 2(NIR2)1105−1138として確立することを提案する)と相互作用する。これらの領域の両方ともapoSpyCas9構造内で無秩序であり、とりわけ、PAM認識21において重要であるとして特定される2つのトリプトファン残基を含む。また、NIR2は、下側ステムとも直接相互作用し、ネクサス−結合部位と反対の面は、標的鎖の3’末端にごく接近して存在し、ネクサスとの相互作用が、PAM認識部位を整えるために必要であり得ることを示唆する。とりわけ、Actinomyces naeslundii Cas9(AnaCas9)apo−構造(Jinek,M.et al.,Science 343,6176(2014))では、NIR2が整えられ、約50個のアミノ酸の挿入を含む。AnaCas9が、より大きいネクサス(および場合によりPAM配列を伴う)を認識し得ると考える動機がある。
しかしながら、これらの結果は、ガイドRNA内に6個の異なる特徴があることを明らかにし、バルジおよびネクサスを、Cas9ターゲッティングおよび切断をガイドする、構造−および配列−特異的な特性として確立する。これは、sgRNA組成物の最適化のための基礎、および、先天性の免疫応答を潜在的に引き起こす二本鎖RNAのより小さな領域を含みアデノ−関連のウイルスなどへのパッケージングにより適している短い最小のガイドRNAを設計するチャンスのあるデザインを提供する。II型CRISPR−Casシステムに関するこの理解は、Briner et al.(Mol.Cell 56:333−339(2014))およびNishimasu et al.(Cell 156:935−949(2014)により裏付けられ、配列の改変は、改変された配列がCas9をガイドする能力に影響することが示されている。注目すべきことに、これらの研究は、ガイド内のネクサス配列が、相補DNAへ向かってCas9をガイドすること、およびその後の切断に、重大であることを確認する。
改変ネクサス配列を有するキメラsgRNAを用いてCas9直交性を再プログラムする能力は、天然のCas9オルソロガス(orthologs)の多様性を利用する潜在力を有する新規のCas9タンパク質の開発のための新しい道を切り開き、便利なパッケージングおよび送達のための短いCas9変異体を含む。加えて、キメラmgRNAを用いてCas9を再プログラムする能力は、標的頻度(target frequency)の柔軟な管理(短いPAMが頻発する)およびオフターゲットの切断の減少による特異性(より長いPAMが稀に発生する)のための、様々なPAMの増大した用途を可能にするであろう。またこれは、様々なキメラガイドとともに単一のCas9を使用することにより、または、スタンダードまたはキメラsgRNAの異なる組み合わせとともに直交性システムを同時に使用することにより、多重の機会を広げる。まとめると、我々の知見は、Cas9−依存性DNAターゲッティングのための新しい道を切り開き、および、次世代のCRISPRに基づく技術の開発のためのステージをセットする。
実施例3。
CRISPR1座およびCRISPR3座由来のcas9遺伝子を、S.thermophilus LMD−9由来のゲノムDNAからPCR増幅し、pwtCas9−細菌にクローニングした(Addgene #44250))(Qi,L.S. et al.Cell 152,1173−1183(2013))。sgRNA−発現プラスミドを構築するために、pdCas9−細菌プラスミド(Addgene #44249)(Id.)内のSpeI制限部位を除去し、CRISPR1またはCRISPR3座に基づくzraP−ターゲッティングsgRNAをコードするgBlock(IDT)を、pgRNA−細菌プラスミド(Addgene#44251)(Id.)のPCR−増幅された主鎖と組み合わせた。形質転換分析のためにE.coli K−12を用いて、形質転換効率は、以前に説明されるとおりに(Gomaa,A.A.et al.MBio.5,e00928−13(2014))、試験されたsgRNAプラスミドに関する形質転換体の数を、psgRNA−C1−T4コントロールプラスミドに関する形質転換体の数で割ることにより計算した。
プラスミド構築。Cas9−発現プラスミドを構築するために、CRISPR1座(Sth1−Cas9)およびCRISPR3座(Sth3−Cas9)由来のCas9遺伝子を、S.thermophilus LMD−9から抽出されたゲノムDNAからPCR増幅した。各PCR産物を、ギブソンアセンブリーによって、pwtCas9−細菌(Addgene #44250)(Qi,L.S.et al.Cell 152,1173−1183(2013))のPCR−増幅された主鎖と組み合わせた。sgRNA−発現プラスミドを構築するために、プラスミドをSpeIで消化することによりpdCas9−細菌プラスミド(Addgene#44249)(Id.)内のSpeI制限部位を除去し、平滑末端化し、再ライゲーションしてpdCas9ΔSpeIプラスミドを生産した。別個に、S.thermophilus LMD−9内のCRISPR1(C1)座またはCRISPR3(C3)座に基づくzraP−ターゲッティングsgRNAをコードするgBlock(IDT)を、ギブソンアセンブリーによって、pgRNA−細菌プラスミド(Addgene #44251)(Id.)のPCR−増幅された主鎖と組み合わせ、それにより、オリジナルのS.pyogenes sgRNA配列を、設計したsgRNA配列で置き換えた。それから、生じたsgRNAプラスミドおよびpdCas9ΔSpeI主鎖をAatIIおよびXhoIで消化し、各sgRNAプラスミドおよびpdCas9ΔSpeIプラスミドのゲル−抽出フラグメントを一緒にライゲーションして、psgRNA−SthC1およびpsgRNA−SthC3を形成した。sgRNA配列を改変するために、5’リン酸化オリゴヌクレオチドを、psgRNA−C1プラスミドまたはpsgRNA−C3プラスミドのSpeI/KpnIまたはKpnI/HindIII部位にアニールさせてライゲーションした。全てのプラスミド改変をシーケンシングにより確認した。
株および増殖条件。E.coli K−12 subst.MG1655(遺伝子型:E.coli K−12 F λ− ilvG− rfb−5C rph−1)を、全ての形質転換分析に用いた。株は、別段の指示がない限り、LB培地(10g/Lトリプトン、5g/L酵母抽出物、10g/L塩化ナトリウム)中、37℃および250RPMで好気的に増殖させた。培地は、必要に応じて抗生物質(34μg/mlのクロラムフェニコール、50μg/mlアンピシリン)で補充した。
形質転換アッセイ。示された(indicated)Cas9−発現プラスミドを保有する細胞の冷凍ストックを、単離のためにストリークして、個々のコロニーを3mlのLB培地に植菌して一晩培養した。生じた培養物を45mlのLB培地に逆希釈し(back−dilute)、Nanodrop 2000c分光光度計(Thermo Scientific)で測定してABS600が0.6〜0.8になるまで増殖させた。それから、培養物をピペッティングして、200〜400μlの10%グリセロールに再懸濁する前に、氷冷10%グリセロールで2回洗浄した。懸濁された細胞(50μl)を、MicroPulser Electroporator(BioRad)を用いて、25ngの示されたsgRNA−発現プラスミドで形質転換し、300μlのSOC培地(Quality Biological)中で、1時間回復させた。回復後、異なる量のLB培地を含む200μlの培養物を、100ng/mlのアンヒドロテトラサイクリンを含むLB寒天上にプレーティングした。形質転換効率は、以前に説明されるように(Gomaa,A.A.et al.MBio. 5,e00928−13(2014))、試験されたDgRNAプラスミドに関する形質転換体の数をpsgRNA−C1−T4コントロールプラスミドに関する形質転換体の数で割ることにより計算した。形質転換効率の実験間のばらつきを減らすために、試験されたsgRNAプラスミドおよびコントロールプラスミドを、同一バッチのエレクトロコンピテント細胞に形質転換した。同様に、図30〜図32に関して、形質転換分析を用いて、活性のCRISPR−Casシステムを保有するLactobacillus株にプラスミドがエレクトロポレーションされる能力を試験した(Lbu−Lactobacillus buchneri、図30;Lrh−Lactobacillus rhamnosus、図32;Lca−Lactobacillus casei、図31。プラスミドは、宿主のCRISPR座内の最初のスペーサー配列と同一のプロトスペーサー配列を含むように設計した。完全なPAMでプロトスペーサーと隣接するように、様々なプラスミドを設計した(Lgaに関してNTAAC;Lcaに関してNNGAA;Lrhに関してNGAAA;PAM領域は、図30〜図32で下線がされたヌクレオチド、およびそれらの突然変異した変異体(効率が試験されたヌクレオチドはイタリック体である)。また、実験は、コントロールの非−ターゲッティング配列(図30〜図32に示す各実験に関して最後から2番目のエントリー(entry)、および、標的配列がないコントロールプラスミド(図30〜図32に示す各実験に関して最後のエントリーも含んだ。天然のCRISPR−CasシステムがDNAターゲッティングによるプラスミド取り込みを妨げる能力は、試験配列および2つの前述のコントロールの間の形質転換効率の違いとして測定される。
ここで、本発明の実施態様が示される添付の図面および実施例を参照して、以下に本発明を説明する。当該説明は、本発明が実施され得る全ての異なる方法または本発明に加えられ得る全ての特徴の、詳細一覧であることを目的としない。例えば、一実施態様に関して説明される特徴を他の実施態様に援用し得て、特定の実施態様に関して説明される特徴をその実施態様から消去し得る。したがって、本発明は、本発明の一部の実施態様において、本明細書に示される任意の特徴または特徴の組み合わせは、除外または省略することができることを期待する。加えて、本明細書に示唆される様々な実施態様に対する非常に多くの変更および追加は、本開示に照らして当業者に明らかであり、本発明から逸脱しない。それ故に、以下の説明は、本発明の一部の特定の実施態様を説明することを目的とし、その全ての並べ替え、組み合わせおよび変更を徹底的に特定することは目的としない。
別段の定義がない限り、本明細書で用いられる全ての技術的および科学的用語は、本発明が属する分野における通常の知識を有する者により一般に理解されるのと同一の意味を有する。本明細書において本発明の説明で用いられる専門用語は、特定の実施態様を説明する目的のみであり、本発明の限定を意図しない。
本明細書中の刊行物、特許出願、特許文献および他の引用文献は全て、引用文献が示されている文および/または段落と関連のある教示に関して、それらの全体で参照により援用される。
文脈が別段の提示をしない限り、本明細書に記載の本発明の様々な特徴は任意の組み合わせで用いることができることが、明確に意図される。さらに、本発明は、本発明の一部の実施態様において、本明細書に示される任意の特徴または特徴の組み合わせを除外または省略することができることも期待する。説明するために、明細書が、組成物は構成要素A、BおよびCを含むと記述する場合、A、BまたはCのいずれか、またはそれらの組み合わせは、単独または任意の組み合わせで省略および放棄することができることが、明確に意図される。
本発明の説明および添付の請求項で用いられる単数形「a」、「an」および「the」は、文脈が明確に別段の提示をしない限り、複数形も同様に含むことを意図する。
また、本明細書において用いられる「および/または」は、1つまたは複数の関連する挙げられた事項の任意および全てのあり得る組み合わせ、および、選択的(「または」)に解釈する場合は、組み合わせの欠如を言及および包含する。
本明細書において用いられる用語「約」は、用量または期間などの測定可能な値を言及する場合、規定量の±20%、±10%、±5%、±1%、±0.5%、または実に±0.1%の変動を言及する。
本明細書において用いられる「XおよびYの間(between X and Y)」および「約XおよびYの間(between about X and Y)」などの語句は、XおよびYを含むと解釈すべきである。本明細書において用いられる「約XおよびYの間(between about X and Y)」などの語句は「約Xおよび約Yの間(between about X and about Y)」を意味し、「約XからYまで(from about X to Y)」などの語句は「約Xから約Yまで(from about X to about Y)」を意味する。
本明細書において用いられる「バルジ配列」は、合成tracr核酸構築物および合成CRISPR核酸構築物/CRISPR核酸アレイに含まれる、非相補(非ハイブリダイズ)ヌクレオチド配列を指す。合成tracr核酸構築物において、バルジ配列は、抗−ジッパーおよび抗−ステッチ配列の間に位置し、合成CRISPR核酸構築物/CRISPR核酸アレイ内の対応するバルジ配列と非相補(100%非同一性)である、約3個のヌクレオチド〜約6個のヌクレオチド(例えば、約3、4、5、6個のヌクレオチド;例えば、約3〜約6個のヌクレオチド、約3〜約5個のヌクレオチド、約3〜約4個のヌクレオチドなど)からなる。合成CRISPR核酸構築物/CRISPR核酸アレイのバルジ配列は、ジッパーとステッチ配列との間およびジッパーとステッチ配列との間に位置し、少なくとも2個のヌクレオチド(例えば、(−NN−)のヌクレオチド配列)(例えば、約2、3、4、5、6個のヌクレオチド;例えば、約2〜約6個のヌクレオチド、約2〜約5個のヌクレオチド、約2〜約4個のヌクレオチド;約3〜約6個のヌクレオチド、約3〜約5個のヌクレオチドなど)を含み、から本質的になり、またはからなる。バルジ配列のヌクレオチド組成物は、それらが相補でなく(例えば、100%非同一性)、それにより互いにハイブリダイズしない限り、任意の一連の少なくとも2個(合成CRISPR核酸構築物/CRISPR核酸アレイ)または3個以上(合成tracr核酸構築物)のヌクレオチドであってよい。合成tracr核酸構築物および合成CRISPR核酸構築物/CRISPR核酸アレイ上のバルジ配列の非相補性の結果として、抗−ジッパーとジッパー配列および抗−ステッチとステッチ配列が並び、ハイブリダイズする場合(キメラ核酸構築物でのように)、突出またはバルジが、キメラ核酸構築物の合成tracr核酸構築物側に形成される(例えば、図12〜図16を参照)。いかなる特定の理論にも拘束されることを望まないが、バルジ構造は、CRISPR−Casシステムの機能に関与し得ると考えられる。
本明細書において用いられる用語「含む(comprise)」、「含む(comprises)」および「含む(comprising)」は、記述された特徴、整数、ステップ、操作、因子、および/または構成要素の存在を特定するが、1つまたは複数の他の特徴、整数、ステップ、操作、因子、構成要素、および/またはそれらの群の存在または追加を妨げない。
本明細書において用いられる暫定の語句「から本質的になる」は、請求項の範囲が、請求項に挙げられた特定の物質またはステップおよび特許請求の範囲に記載された発明の基本的かつ新規の特徴(単数または複数)を実質的に影響しないものを包含すると解釈されることを意味する。したがって、用語「〜から本質的になる」は、本発明の請求項において用いられる場合、「含む(comprising)」と同等であると解釈されることを意図しない。
「Cas9ヌクレアーゼ」は、CRISPR Casシステムにおいて二本鎖DNA切断を触媒するエンドヌクレアーゼの大きなグループを指す。これらのポリペプチドは、当技術分野でよく知られていて、それらの構造(配列)の多くが特徴付けられている(例えば、WO2013/176772;WO/2013/188638を参照)。dsDNAの切断を触媒するためのドメインは、RuvCドメインおよびHNHドメインである。RuvCドメインは(−)鎖にニックを入れる役割があり、HNHドメインは(+)鎖にニックを入れる役割がある(例えば、Gasiunasetal.PNAS 109(36):E2579−E2586(September 4,2012)を参照)。
本明細書において用いられる「キメラ」は、少なくとも2つの構成要素が異なる起源(例えば、異なる生物、異なるコード領域)から得られた核酸分子またはポリペプチドを指す。
本明細書において用いられる「相補」は、コンパレーターヌクレオチド配列と100%の相補性または同一性を意味することができ、または、100%未満の相補性(例えば、約70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%などの相補性)を意味することができる。
本明細書において用いられる用語「相補」または「相補性」は、塩基対合による、許容される塩および温度条件下でのポリヌクレオチドの自然な結合を指す。例えば、配列「A−G−T」は、相補配列「T−C−A」に結合する。2つの一本鎖分子間の相補性は、ヌクレオチドの一部のみが結合する「部分的」であり得て、または、一本鎖分子間に全体的相補性が存在する場合は完全であり得る。核酸鎖間の相補性の度合いは、核酸鎖間のハイブリダイゼーションの効率および強度に重大な効果を有する。
本明細書において用いられる「接触させる(contact)」、「接触させる(contacting)」、「接触した(contacted)」およびそれらの文法的変更は、所望の反応(例えば、目的ポリペプチドの部位特異的ターゲッティング、組込み、形質転換、部位特異的切断(ニック、開裂)、増幅など)を行なうのに適切な条件下で、所望の反応の構成要素を一緒に配置することを指す。そのような反応を行なうための方法および条件は、当技術分野でよく知られている(例えば、 Gasiunas et al.(2012)Proc.Natl.Acad.Sci.109:E2579−E2586;M.R.Green and J.Sambrook(2012)Molecular Cloning:A Laboratory Manual.4th Ed.,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NYを参照)。
本発明のヌクレオチド配列の「フラグメント」または「一部」は、参照核酸またはヌクレオチド配列に対して、長さが短くなった(例えば、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20またはそれより多くのヌクレオチド短くなった)ヌクレオチド配列を意味すると理解され、および、参照核酸またはヌクレオチド配列と同一のまたはほぼ同一の(例えば、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%同一の)連続したヌクレオチドのヌクレオチド配列を含み、から本質的になり、および/または、からなる。本発明に係るそのような核酸フラグメントまたは一部は、適切な場合は、それが構成要素となる、より大きなポリヌクレオチドに含まれ得る。したがって、例えば、標的DNAの少なくとも一部にハイブリダイズすること(hybridizing to)(またはハイブリダイズする(hybridize to)、およびそれらの他の文法的変更)は、標的DNAの連続したヌクレオチドの長さと同一または実質的に同一のヌクレオチド配列に対するハイブリダイゼーションを指す。
本明細書において用いられる「GR1」は、合成CRISPER核酸構築物またはcrRNAのリピート部分に含まれる、単一ヌクレオチド(G)または短い3個のヌクレオチド配列(GTT)である。GR1は、本開示の合成tracr核酸構築物またはtracrRNAの抗−リピートとハイブリダイズしない。しかしながら、非標準的なワトソンクリック塩基対合スキームでは、GR1は、tracrRNAの抗−CRISPRリピート部分の末端でUと揺らぎ塩基対を形成し得る。
本明細書において用いられる用語「遺伝子」は、mRNA、アンチセンスRNA、miRNA、抗−ミクロRNAアンチセンスオリゴデオキシリボヌクレオチド(AMO)などを生産するのに用いることが可能な核酸分子を指す。遺伝子は、機能性タンパク質または遺伝子産物を生産するのに用いることが可能であってよく、または不可能であってよい。遺伝子は、コード領域および非コード領域(例えば、イントロン、制御因子、プロモーター、エンハンサー、終止配列および/または5’および3’非翻訳領域)の両方を含んでよい。遺伝子は、「分離」され得て、それにより、その天然の状態では核酸と結合して通常は見られる構成要素から、実質的にまたは本質的にフリーである核酸が意味される。そのような構成要素は、他の細胞物質、組み換え生産による培養培地、および/または核酸の化学合成で用いられる様々な化学物質を含む。
本明細書において用いられる「ヘアピン配列」は、ヘアピンを含むヌクレオチド配列である。ヘアピン(例えば、ステム−ループ、フィード−バック)は、いずれか側に一本鎖領域がさらに隣接する二本鎖を形成するヌクレオチドの領域を含む二次構造を有する核酸分子を指す。そのような構造は当技術分野でよく知られている。当技術分野で知られているように、二本鎖領域は、塩基対合内にいくつかのミスマッチを含んでよく、または完全に相補であってよい。本開示の一部の実施態様では、核酸構築物のヘアピン配列は、合成tracr核酸構築物の3’末端で「ネクサス配列」のすぐ下流に位置する。いかなる特定の理論にも拘束されずに、ヘアピンは、crRNA−tracrRNA複合体へのCas9結合に関与し得ると考えられる(例えば、合成CRISPR核酸構築物−合成
「異種」または「組み換え」ヌクレオチド配列は、それが導入される宿主細胞と天然には関係しないヌクレオチド配列であり、天然起源ヌクレオチド配列の非天然起源多重コピーを含む。
相同性を有する異なる核酸またはタンパク質は、本明細書において「ホモログ」と呼ぶ。ホモログという用語は、同一および他の種由来の相同配列および同一および他の種由来のオルソロガス配列を含む。「相同性」は、位置同一性(すなわち配列類似性または同一性)のパーセントの観点からの、2以上の核酸および/またはアミノ酸配列の間の類似性のレベルを指す。また、相同性は、異なる核酸またはタンパク質間の類似の機能特性の概念を指す。したがって、本発明の組成物および方法は、本発明のヌクレオチド配列およびポリペプチド配列に対するホモログをさらに含む。本明細書において用いられる「オルソロガス」は、種分化の間に共通の祖先遺伝子から生じる異なる種における相同ヌクレオチド配列および/またはアミノ酸配列を指す。本発明のヌクレオチド配列のホモログは、本発明の前記ヌクレオチド配列と実質的な配列同一性(例えば、少なくとも約70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、および/または100%)を有する。したがって、例えば、本発明で有用なCas9ポリペプチドのホモログは、本明細書に提供されるCas9配列のいずれか1つと約70%相同またはそれより高くてよい。
本明細書において用いられる、ハイブリダイゼーション(hybridization)、ハイブリダイズする(hybridize)、ハイブリダイズする(hybridizing)、およびそれらの文法的変更は、2つの完全に相補のヌクレオチド配列またはいくつかのミスマッチの塩基対が存在し得る実質的に相補の配列の結合を指す。ハイブリダイゼーションの条件は当技術分野でよく知られていて、ヌクレオチド配列の長さおよびヌクレオチド配列間の相補性の度合いに基づき変化する。一部の実施態様では、ハイブリダイゼーションの条件は、高ストリンジェンシーであってよく、または、それらは、ハイブリダイズされる配列の長さおよび相補性の量に応じて、中ストリンジェンシーまたは低ストリンジェンシーであってよい。ヌクレオチド配列間のハイブリダイゼーションの目的に関して低、中および高ストリンジェンシーを構成する条件は、当技術分野でよく知られている(例えば、Gasiunas et al.(2012)Proc.Natl.Acad.Sci.109:E2579−E2586;M.R.Green and J.Sambrook(2012)Molecular Cloning:A Laboratory Manual.4th Ed.,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NYを参照)。
本明細書において用いられる用語「増大する(increase)」、「増大する(increasing)」、「増大した(increased)」「増強する(enhance)」「増強した(enhanced)」「増強する(enhancing)」および「増強(enhancement)」(およびそれらの文法的変更)は、コントロールと比べて、少なくとも約25%、50%、75%、100%、150%、200%、300%、400%、500%またはそれよりも多い上昇を表す。
用語「侵襲性外因性遺伝因子」、「侵襲性外因性核酸」または「侵襲性外因性DNA」は、細菌にとって外因性であるDNA(例えば、制限されないが、ウイルス、バクテリオファージ、および/またはプラスミドを含む病原体由来の遺伝因子)を意味する。
「天然」または「野生型」の核酸、ヌクレオチド配列、ポリペプチドまたはアミノ酸配列は、天然起源または内因性の核酸、ヌクレオチド配列、ポリペプチドまたはアミノ酸配列を指す。したがって、例えば、「野生型mRNA」は、生物において天然起源または内因性であるmRNAである。「相同」核酸配列は、それが導入される宿主細胞と天然に関連するヌクレオチド配列である。
本明細書において用いられる「ネクサス配列」は、合成tracr核酸構築物内の「抗−ステッチ配列」のすぐ下流に位置するヌクレオチド配列を指す。ネクサスは、長さが約6〜10個のヌクレオチドであり、高保存配列:TNANNCを含む。一部の実施態様では、ネクサスは、T(A/C)A(A/G)(G/A)C(またはU(A/C)A(A/G)(G/A)C))、GATAAGGCTT(またはGAUAAGGCUU)、TCAAGCAA(またはUCAAGCAA)、またはT(C/A)AA(A/C)(C/A)(A/G)(A/T)(またはU(C/A)AA(A/C)(C/A)(A/G)(A/U))のヌクレオチド配列であってよい。いかなる特定の理論にも拘束されずに、配列保存に基づき、ネクサスは、Cas9直交性および認識において重要であり得ると考えられる。
また、本明細書において用いられる用語「核酸」、「核酸分子」、「核酸構築物」、「ヌクレオチド配列」および「ポリヌクレオチド」は、直鎖または分岐の一本鎖または二本鎖であるRNAまたはDNA、またはそれらのハイブリッドを指す。また、用語は、RNA/DNAハイブリッドも包含する。dsRNAが合成的に生産される場合は、一般的でない塩基、例えば、イノシン、5−メチルシトシン、6−メチルアデニン、ヒポキサンチンおよびその他もまた、アンチセンス、dsRNA、およびリボザイム対合に用いることができる。例えば、シチジンおよびウリジンのC−5プロピンアナログを含むポリヌクレオチドは、高アフィニティでRNAと結合し、遺伝子発現の強力なアンチセンス阻害剤となることが示されている。他の修飾、例えば、ホスホジエステル主鎖、またはRNAのリボース糖基内の2’−ヒドロキシに対する修飾もすることができる。本開示の核酸構築物は、DNAまたはRNAであってよいが、好ましくはDNAである。したがって、本発明の核酸構築物は、DNAの形態で記載され用いられ得るが、使用目的に応じて、RNAの形態で記載され用いられてもよい。
本明細書において用いられる「合成」核酸またはヌクレオチド配列は、天然に見いだされないが人の手により構築される(結果として天然の産物でない)核酸またはヌクレオチド配列を指す。
本明細書において用いられる用語「ヌクレオチド配列」は、ヌクレオチドのヘテロポリマーまたは核酸分子の5’から3’末端のこれらのヌクレオチドの配列を指し、DNAまたはRNA分子を含み、cDNA、DNAフラグメントまたは部分、ゲノムDNA、合成(例えば化学合成)DNA、プラスミドDNA、mRNA、およびアンチセンスRNAを含み、そのいずれかは一本鎖または二本鎖であってよい。用語「ヌクレオチド配列」「核酸」、「核酸分子」、「オリゴヌクレオチド」および「ポリヌクレオチド」は、本明細書において交換可能に用いられて、ヌクレオチドのヘテロポリマーも指す。別段の指示がされる場合を除き、本明細書において提供される核酸分子および/またはヌクレオチド配列は、本明細書において、5’から3’の方向で左から右に示され、米国の配列規則(連邦規則法典第37巻セクション1.821〜1.825)および世界知的所有権機関(WIPO)標準ST.25に示されるヌクレオチドの特徴を表すための標準的なコードを用いて表される。本明細書において用いられる「5’領域」は、5’末端に最も近いポリヌクレオチドの領域を意味し得る。したがって、例えば、ポリヌクレオチドの5’領域内の因子は、ポリヌクレオチドの5’末端に位置する最初のヌクレオチドから、ポリヌクレオチドの半ばに位置するヌクレオチドまでのどこかに位置し得る。本明細書において用いられる「3’領域」は、3’末端に最も近いポリヌクレオチドの領域を意味し得る。したがって、例えば、ポリヌクレオチドの3’領域内の因子は、ポリヌクレオチドの3’末端に位置する最初のヌクレオチドから、ポリヌクレオチドの半ばに位置するヌクレオチドまでのどこかに位置し得る。
本明細書において用いられる用語「パーセント配列同一性」または「パーセント同一性」は、2つの配列が最適に並べられた場合の、試験(「対象」)ポリヌクレオチド分子(またはその相補鎖)と比較した、参照(「クエリー」)ポリヌクレオチド分子(またはその相補鎖)の直鎖ポリヌクレオチド配列内の同一のヌクレオチドのパーセンテージを指す。一部の実施態様では、「パーセント同一性」は、アミノ酸配列内の同一のアミノ酸のパーセンテージを指し得る。
「プロトスペーサー配列」は、標的二本鎖DNAを指し、具体的には、合成CRISPR核酸構築物のスペーサー配列と完全または実質的に相補である(およびハイブリダイズする)標的DNAの一部を指す。
本明細書において用いられる用語「低減させる(reduce)」「低減した(reduced)」「低減する(reducing)」「低減(reduction)」「縮小する(diminish)」「抑制する(suppress)」および「減少する(decrease)」(およびそれらの文法的変更)は、例えば、コントロールと比較して、少なくとも約5%、10%、15%、20%、25%、35%、50%、75%、80%、85%、90%、95%、97%、98%、99%、または100%の減少を示す。特定の実施態様では、低減は検出可能な活性または量を生じ得ず、または本質的に生じ得ない(すなわち、些細な量、例えば、約10%未満または実に5%未満)。したがって、一部の実施態様では、Cas9ヌクレアーゼの変異は、Cas9のヌクレアーゼ活性を、コントロール(例えば野生型Cas9)と比較して、少なくとも約5%、10%、15%、20%、25%、35%、50%、75%、80%、85%、90%、95%、97%、98%、99%、または100%低減させ得る。
本明細書において用いられる「リピート配列」は、例えば、「スペーサー配列」により隔てられた野生型CRISPR座または合成CRISPR核酸構築物のリピート配列を指す。リピート配列は、対応する抗−リピート配列に対して、相補(例えば、100%塩基対マッチ)、または、実質的に相補、例えば、少なくとも70%相補(例えば、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、またはそれよりも高い)であり得る。
本開示の合成CRISPR核酸構築物の「リピート配列」は、「ジッパー配列」、「バルジ配列」、「ステッチ配列」、および「スペーサー配列」を含む。一部の実施態様では、合成CRISPR核酸構築物は、GR1(他の実施態様ではステッチ配列に含まれる)を含み得る。
本明細書において用いられる「ジッパー配列」は、合成CRISPR核酸構築物内のバルジ配列の3’または(3’から5’の方向に)すぐ上流に位置するリピート配列の部分を指し、少なくとも約3個のヌクレオチド(例えば、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30個またはそれよりも多くのヌクレオチド、またはそれらの中の任意の範囲または値)を含み、からなり、または、から本質的になる。一部の実施態様では、ジッパー配列は、「上側ステム(upper stem)」と呼ばれ得る。「ジッパー配列」は、合成tracr核酸構築物上に位置する対応する「抗−ジッパー配列」と、十分な相補性を共有し、したがって、ジッパー配列と抗−ジッパー配列が接触する際に互いにハイブリダイズすることができ、それにより、2つの核酸構築物を一緒に結合させる。一部の実施態様では、ジッパー/抗−ジッパー配列は、「上側ステム」と呼ぶことができる。ジッパー配列は、対応する抗−ジッパー配列と、完全に相補(例えば100%塩基対マッチ)または実質的に相補、例えば、少なくとも70%相補(例えば、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、またはそれよりも高い)であり得る。したがって、本発明の合成tracr核酸構築物の抗−ジッパー配列は、合成CRISPR核酸構築物または合成CRISPR核酸アレイ内の対応するジッパー配列と完全に相補または実質的に相補である、少なくとも約3個のヌクレオチド(例えば、約3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30個またはそれよりも多いヌクレオチド、またはその中の任意の範囲または値)を含む、からなる、または本質的にからなる。抗−ジッパー配列はRNaseIII結合部位であり、したがって、RNaseIII結合に関与することが当技術分野でよく知られているヌクレオチド配列を含む(例えば、Pertzev and Nicholson,Nucleic Acids Res.34(13):3708−3721(2006)を参照)。
本明細書において用いられる「配列同一性」は、2つの最適に並べられたポリヌクレオチドまたはペプチド配列が、構成要素(例えば、ヌクレオチドまたはアミノ酸)のアライメントのウインドウ全体で不変である程度を指す。「同一性」は、制限されないが:Computational Molecular Biology(Lesk, A.M.,ed.)Oxford University Press,New York(1988);Biocomputing:Informatics and Genome Projects(Smith,D.W.,ed.)Academic Press,New York(1993);Computer Analysis of Sequence Data,Part I(Griffin,A.M.,and Griffin,H.G.,eds.)Humana Press,New Jersey(1994);Sequence Analysis in Molecular Biology(von Heinje,G.,ed.)Academic Press(1987);and Sequence Analysis Primer (Gribskov,M.and Devereux,J.,eds.)Stockton Press,New York(1991)に記載のものを含む公知の方法により、容易に計算することができる。
本明細書において用いられる「スペーサー配列」は、標的DNA(例えば「プロトスペーサー配列」)に相補のヌクレオチド配列である。スペーサー配列は、標的DNAと、完全に相補または実質的に相補(例えば、少なくとも70%相補(例えば、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、またはそれよりも高い))であり得る。代表的な実施態様では、スペーサー配列は、標的DNAと100%の相補性を有する。さらなる実施態様では、標的DNAに対するスペーサー配列の3’領域の相補性は100%であるが、スペーサーの5’領域では100%よりも低く、したがって、標的DNAに対するスペーサー配列の全体的な相補性は100%未満である。したがって、例えば、20個のヌクレオチドスペーサー配列の3’領域における、最初の7、8、9、10、11、12、13、14、15、16個などのヌクレオチド(シード配列)は、標的DNAと100%相補であり得て、一方で、スペーサー配列の5’領域における残りのヌクレオチドは、標的DNAと実質的に相補(例えば、少なくとも約70%相補)である。一部の実施態様では、スペーサー配列の最初の7〜12個のヌクレオチドは、標的DNAと100%相補であり得て、一方で、スペーサー配列の5’領域における残りのヌクレオチドは、標的DNAと実質的に相補(例えば、少なくとも約70%相補)である。他の実施態様では、スペーサー配列の最初の7〜10個のヌクレオチドは標的DNAと100%相補であり得て、一方で、スペーサー配列の5’領域における残りのヌクレオチドは標的DNAと実質的に相補(例えば、少なくとも約70%相補)である。代表的な実施態様では、スペーサー配列の最初の7個のヌクレオチドは標的DNAと100%相補であり得て、一方で、スペーサー配列の5’領域における残りのヌクレオチドは標的DNAと実質的に相補(例えば、少なくとも約70%相補)である。
本明細書において用いられる「ステッチ配列」は、約5個の長さのヌクレオチドを含み、から本質的になり、またはからなり、NNTNNのコンセンサスヌクレオチド配列を有する、ヌクレオチド配列を指す。「ステッチ配列」は、合成CRISPR核酸構築物上で、(5’から3’の方向に)「バルジ配列」のすぐ上流および「GR1」の下流に位置する。「ステッチ配列」は高AT含有量を有する傾向があり、合成tracr核酸構築物内に位置する「抗−ステッチ配列」にハイブリダイズする。一部の特定の実施態様では、ステッチ配列は、(5’から3’の方向に)NNTNN、TTTGT、TTTTA、(T/C)(T/C)T(T/C)(T/G)、TTTTA、TTTCAのヌクレオチド配列を含む、から本質的になる、またはからなる。
本明細書において用いられる「抗−ステッチ配列」は、ステッチ配列と完全に相補でハイブリダイズするヌクレオチド配列(例えば、NNANN、ACAAA、TAAAA、(T/C)(A/G)T(A/G)(A/G)、TAAAA、TGAAA)を指す。抗−ステッチ配列は、合成tracr核酸構築物上で、(5’から3’の方向に)バルジ配列のすぐ下流および「ネクサス配列」のすぐ上流に位置する。いかなる特定の理論にも拘束されることを望まずに、合成tracrRNA構築物の抗−ステッチ配列との、合成crRNA構築物のステッチ配列のハイブリダイゼーションは、「バルジ配列」の後の再建塩基対合に関与すると考えられる。一部の実施態様では、ステッチ/抗−ステッチは、「下側ステム(lower stem)」と呼ぶことができる。
本明細書において用いられる、2つの核酸分子、ヌクレオチド配列またはタンパク質配列の関連における語句「実質的に同一」または「実質的な同一性」は、最大一致に関して比較およびアライメントした場合、以下の配列比較アルゴリズムの1つを用いた測定または目視検査により、少なくとも約70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、および/または100%のヌクレオチドまたはアミノ酸残基同一性を有する2以上の配列またはサブシーケンスを指す。本発明の一部の実施態様では、実質的な同一性は、少なくとも約50残基〜約150残基の長さである配列の領域にわたって存在する。したがって、本発明の一部の実施態様では、実質的な同一性は、少なくとも約3〜約15(例えば、3、4、5、6、7、8、9、10、11、12、13、14、15残基の長さなど、またはその中の任意の値または任意の範囲)、少なくとも約5〜約30、少なくとも約10〜約30、少なくとも約16〜約30、少なくとも約18〜少なくとも約25、少なくとも約18、少なくとも約22、少なくとも約25、少なくとも約30、少なくとも約40、少なくとも約50、約60、約70、約80、約90、約100、約110、約120、約130、約140、約150、またはそれよりも多くの残基の長さ、およびその中の任意の範囲である配列の領域にわたって存在する。代表的な実施態様では、配列は、少なくとも約22個のヌクレオチドにわたって実質的に同一であり得る。一部の特定の実施態様では、配列は、少なくとも約150残基にわたって実質的に同一である。一部の実施態様では、本発明の配列は、少なくとも約16個のヌクレオチド〜約25個のヌクレオチドにわたって、約70%〜約100%同一であり得る。一部の実施態様では、本発明の配列は、少なくとも約16個のヌクレオチド〜約25個のヌクレオチドにわたって、約75%〜約100%同一であり得る。さらなる実施態様では、本発明の配列は、少なくとも約16個のヌクレオチド〜約25個のヌクレオチドにわたって、約80%〜約100%同一であり得る。さらなる実施態様では、本発明の配列は、少なくとも約7個のヌクレオチド〜約25個のヌクレオチドにわたって、約80%〜約100%同一であり得る。一部の実施態様では、本発明の配列は、少なくとも約18個のヌクレオチドにわたって、約70%同一であり得る。他の実施態様では、配列は、約22ヌクレオチドにわたって、約85%同一であり得る。さらに他の実施態様では、配列は、約16個のヌクレオチドにわたって、100%相同であり得る。さらなる実施態様では、配列は、コード領域の長さ全体にわたって実質的に同一である。さらに、代表的な実施態様では、実質的に同一のヌクレオチドまたはタンパク質配列は、実質的に同一の機能(例えば、Cas9 HNHおよび/またはRuvCニッカーゼ活性)を発揮する。
配列比較のために、典型的に、1つの配列は、試験配列が比較される参照配列としての役割がある。配列比較アルゴリズムを用いる場合、試験および比較配列がコンピューターに入力され、必要な場合はサブシーケンス座標が指定されて、配列アルゴリズムプログラムパラメーターが指定される。それから、配列比較アルゴリズムは、指定されたプログラムパラメーターに基づき、参照配列に対する試験配列(単数または複数)のパーセント配列同一性を計算する。
比較ウインドウを並べるための最適な配列アライメントは当業者に広く知られ、Smith and Watermanのローカル相同性アルゴリズム、Needleman and Wunschの相同性アライメントアルゴリズム、Pearson and Lipmanの類似性検索方法などのツールにより、および場合により、GCG(登録商標)Wisconsin Package(登録商標)(Accelrys Inc.,San Diego,CA)の一部として利用可能なGAP、BESTFIT、FASTA、および、TFASTAなどのアルゴリズムのコンピューター実施により、行ない得る。試験配列および参照配列のアライメントされた区分の「同一性分数」は、2つの並べられた配列が共有する同一の構成要素の数を、参照配列セグメント(すなわち、参照配列全体または参照配列のより小さな規定部分)内の構成要素の全数で割った数である。パーセント配列同一性は、同一性分数に100をかけて表される。1つまたは複数のポリヌクレオチド配列の比較は、全長ポリヌクレオチド配列またはその一部に対して、または、より長いポリヌクレオチド配列に対して、され得る。本発明の目的に関し、「パーセント同一性」は、翻訳ヌクレオチド配列のためのBLASTX version 2.0およびポリヌクレオチド配列のためのBLASTN version 2.0を用いて決定されてもよい。
BLAST解析を行なうためのソフトウェアは、国立生物工学情報センターを通じて一般に利用可能である。このアルゴリズムは、データベース配列内の同じ長さのワードと並べた場合に、一部の正の値の閾値スコアTと一致する、または満たす、クエリー配列内の長さWのショートワードを特定することにより、高スコア配列ペア(HSP)を最初に特定するステップを含む。Tは、隣接ワードスコア閾値と呼ばれる(Altschul et al.,1990)。これらの最初の隣接ワードヒットは、それらを含むより長いHSPを見つけるためのサーチを始める種として作用する。それから、ワードヒットは、累積アライメントスコアが増加し得る限り、各配列に沿って両方向に伸びる。累積スコアは、ヌクレオチド配列について、パラメーターM(一致する残基のペアに関する恩恵スコア;常に>0)およびN(ミスマッチ残基に関するペナルティスコア;常に<0)を用いて計算される。アミノ酸配列については、スコアマトリックスを用いて累積スコアを計算する。各方向でのワードヒットの伸長は、累積アライメントスコアがその最大達成値から量X低下した場合は停止し、1つまたは複数の負のスコアの残基アライメントの蓄積、またはいずれかの配列が終わりに到達したことに起因して、累積スコアは0以下になる。BLASTアルゴリズムパラメーターW、T、およびXは、アライメントの感度および速度を決定する。BLASTNプログラム(ヌクレオチド配列)は、デフォルトとして、ワード長(W)11、期待値(E)10、カットオフ100、M=5、N=−4、および両方の鎖の比較を使用する。アミノ酸配列に関しては、BLASTPプログラムは、デフォルトとして、ワード長(W)3、期待値(E)10、およびBLOSUM62スコアマトリックスを使用する(Henikoff&Henikoff,Proc.Natl.Acad.Sci.USA89:10915(1989)を参照)。
パーセント配列同一性の計算に加え、BLASTアルゴリズムは、2つの配列間の類似性の統計分析も行う(例えば、Karlin&Altschul,Proc.Nat’l.Acad.Sci.USA90:5873 5787 (1993)を参照)。BLASTアルゴリズムにより提供される類似性の1つの評価基準は最小和確率(P(N))であり、2つのヌクレオチドまたはアミノ酸配列の間で一致が偶然に生じる確率の示度を提供する。例えば、参照ヌクレオチド配列に対する試験ヌクレオチド配列の比較における最小和確率が約0.1未満〜約0.001未満である場合に、試験核酸配列は参照配列と類似すると考えられる。したがって、本発明の一部の実施態様では、参照ヌクレオチド配列に対する試験ヌクレオチド配列の比較における最小和確率は、約0.001未満である。
また、2つのヌクレオチド配列は、2つの配列がストリンジェントな条件下で互いにハイブリダイズする場合に、実質的に相補であると考えることができる。一部の代表的な実施態様では、実質的に相補であると考えられる2つのヌクレオチド配列は、高ストリンジェントな条件下で、互いにハイブリダイズする。
サザンおよびノーザンハイブリダイゼーションなどの核酸ハイブリダイゼーション実験の関連における、「ストリンジェントなハイブリダイゼーション条件」および「ストリンジェントなハイブリダイゼーション洗浄条件」は配列依存性であり、異なる環境パラメーターの下で異なる。核酸のハイブリダイゼーションに対する広範なガイドは、Tijssen Laboratory Techniques in Biochemistry and Molecular Biology−Hybridization with Nucleic Acid Probes part I chapter 2“Overview of principles of hybridization and the strategy of nucleic acid probe assays”Elsevier,New York(1993)に見られる。一般に、高ストリンジェントなハイブリダイゼーションおよび洗浄条件は、規定のイオン強度およびpHでの特異的配列に関する融点(Tm)よりも約5℃低くなるように選択される。
Tmは、標的配列の50%が完全に一致するプローブにハイブリダイズする、(規定のイオン強度およびpHでの)温度である。非常にストリンジェントな条件は、特異的なプローブに関するTmと等しくなるように選択される。サザンまたはノーザンブロットでのフィルターにおける、100よりも多い相補残基を有する相補ヌクレオチド配列のハイブリダイゼーションに関するストリンジェントなハイブリダイゼーション条件の例は、1mgのヘパリンを含む50%ホルムアミド(42℃)であり、ハイブリダイゼーションは一晩行われる。高ストリンジェントな洗浄条件の例は、0.1 5M NaCl、72℃、約15分である。ストリンジェントな洗浄条件の例は、0.2×SSC洗浄、65℃、15分である(SSCバッファーの説明については、Sambrook(以下)を参照)。バックグラウンドのプローブシグナルを除去するために、高ストリンジェンシーな洗浄の前に低ストリンジェンシーな洗浄を行うことが多い。例えば、100個を超えるヌクレオチドのデュプレックスに関する、中ストリンジェンシーな洗浄の例は、1×SSC、45℃、15分である。例えば、100個を超えるヌクレオチドのデュプレックスに関する、低ストリンジェンシーな洗浄の例は、4〜6×SSC、40℃、15分である。短いプローブ(例えば、約10〜50個のヌクレオチド)に関しては、ストリンジェントな条件は典型的に、約1.0M未満のNaイオンの塩濃度、典型的に、約0.01〜1.0MのNaイオン濃度(または他の塩)(pH7.0〜8.3)を含み、温度は典型的に、少なくとも約30℃である。また、ストリンジェントな条件は、ホルムアミドなどの不安定化剤の添加によっても達成することができる。一般に、特定のハイブリダイゼーションアッセイにおいて、関係のないプローブについて見られるものより2倍の(またはそれより高い)シグナル・ノイズ比は、特異的なハイブリダイゼーションの検出を示す。ストリンジェントな条件下で互いにハイブリダイズしないヌクレオチド配列は、それらがコードするタンパク質が実質的に同一であるならば、依然として実質的に同一である。これは、例えば、遺伝子コードにより許容される最大コドン縮退を用いてヌクレオチド配列のコピーが作られる場合に生じ得る。
以下は、本発明の参照ヌクレオチド配列と実質的に同一である相同ヌクレオチド配列をクローニングするために用いられ得る、ハイブリダイゼーション/洗浄条件のセットの例である。一実施態様では、参照ヌクレオチド配列は、7%ドデシル硫酸ナトリウム(SDS)、0.5M NaPO4、1mM EDTA(50℃)中、2×SSC、0.1%SDSの洗浄(50℃)で、「試験」ヌクレオチド配列とハイブリダイズする。別の実施態様では、参照ヌクレオチド配列は、7%ドデシル硫酸ナトリウム(SDS)、0.5M NaPO4、1mM EDTA(50℃)中、1×SSC、0.1%SDSの洗浄(50℃)で、または、7%ドデシル硫酸ナトリウム(SDS)、0.5M NaPO4、1mM EDTA(50℃)中、0.5×SSC、0.1%SDSの洗浄(50℃)で、「試験」ヌクレオチド配列とハイブリダイズする。また、さらなる実施態様では、参照ヌクレオチド配列は、7%ドデシル硫酸ナトリウム(SDS)、0.5M NaPO4、1mM EDTA(50℃)中、0.1×SSC、0.1%SDSの洗浄(50℃)で、または7%ドデシル硫酸ナトリウム(SDS)、0.5M NaPO4、1mM EDTA(50℃)中、0.1×SSC、0.1%SDSの洗浄(65℃)で、「試験」ヌクレオチド配列とハイブリダイズする。
本発明の任意のヌクレオチド配列および/または組み換え核酸分子は、任意の目的の種での発現のためにコドン最適化され得る。コドン最適化は当技術分野で広く知られていて、種特異的なコドン使用頻度を用いたコドン使用バイアスに関するヌクレオチド配列の改変を含む。コドン使用頻度は、目的の種に関して最も高く発現される遺伝子の配列解析に基づいて作られる。ヌクレオチド配列が核内で発現される場合、コドン使用頻度は、目的の種に関して高発現の核遺伝子の配列解析に基づいて作られる。ヌクレオチド配列の改変は、種特有のコドン使用頻度を、天然のポリヌクレオチド配列に存在するコドンと比較することにより決定される。当分野において理解されるように、ヌクレオチド配列のコドン最適化は、天然のヌクレオチド配列と100%未満の同一性(例えば、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%など)を有するが、依然としてオリジナルの天然のヌクレオチド配列によりコードされるものと同一の機能を有するポリペプチドをコードする、ヌクレオチド配列を生じさせる。したがって、本発明の代表的な実施態様では、本発明のヌクレオチド配列および/または組み換え核酸分子は、特定の目的の種での発現のためにコドン最適化され得る。
一部の実施態様では、本発明の組み換え核酸分子、ヌクレオチド配列およびポリペプチドは、「分離される」。「分離された」核酸分子、「分離された」ヌクレオチド配列または「分離された」ポリペプチドは、人の手によりその天然環境から離れて存在し、したがって天然の産物ではない、核酸分子、ヌクレオチド配列またはポリペプチドである。分離された核酸分子、ヌクレオチド配列またはポリペプチドは、天然起源の生物またはウイルスの他の構成要素の少なくとも一部、例えば、細胞またはウイルスの構造上の構成要素または他のポリペプチドまたはポリヌクレオチドと関連して一般に見いだされる核酸から、少なくとも部分的に切り離された、精製された形態で存在し得る。代表的な実施態様では、分離された核酸分子、分離されたヌクレオチド配列および/または分離されたポリペプチドは、少なくとも約1%、5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、またはそれよりも高い純度である。
他の実施態様では、分離された核酸分子、ヌクレオチド配列またはポリペプチドは、非天然の環境(例えば組み換え宿主細胞)内に存在し得る。したがって、例えばヌクレオチド配列に関しては、用語「分離された」は、それが天然に生じる染色体および/または細胞から切り離されることを意味する。また、ポリヌクレオチドは、それが天然に生じる染色体および/または細胞から切り離され、それから、それが天然に生じない遺伝的状況、染色体および/または細胞(例えば、異なる宿主細胞、異なる制御配列、および/または天然に見られるのと異なるゲノム内の位置)に挿入される場合もまた、分離される。したがって、組み換え核酸分子、ヌクレオチド配列およびそれらのコードされるポリペプチドは、人の手により、それらの天然環境から離れて存在し、したがって、天然の産物ではない点で「分離される」が、一部の実施態様では、組み換え宿主細胞内に導入され存在することができる。
本明細書に記載の任意の実施態様では、本発明のヌクレオチド配列および/または組み換え核酸分子は、様々な生物細胞での発現のための様々なプロモーターおよび他の制御因子と動作可能に関連することができる。したがって、代表的な実施態様では、本発明の組み換え核酸は、1つまたは複数のヌクレオチド配列に作動可能に連結された、1つまたは複数のプロモーターをさらに含むことができる。
本明細書において用いられる「作動可能に連結」または「動作可能に関連」により、示された因子が互いに機能的に関連し、また一般に、物理的にも関連することを意味する。したがって、本明細書において用いられる用語「作動可能に連結」または「動作可能に関連」は、機能的に関係がある単一核酸分子上のヌクレオチド配列を指す。したがって、第二のヌクレオチド配列に作動可能に連結された第一のヌクレオチド配列は、第一のヌクレオチド配列が、第二のヌクレオチド配列と機能的関係で配置される状況を意味する。例えば、プロモーターがヌクレオチド配列の転写または発現を果たす場合に、プロモーターは前記ヌクレオチド配列と動作可能に関連する。当業者は、コントロール配列がその発現を方向付けるように機能する限り、コントロール配列(例えばプロモーター)は、それが動作可能に関連するヌクレオチド配列と隣接している必要はないことを理解するだろう。したがって、例えば、介在する非翻訳でなお転写される配列が、プロモーターとヌクレオチド配列との間に存在してよく、プロモーターは依然としてヌクレオチド配列に「作動可能に連結」していると考えることができる。
「プロモーター」は、プロモーターと動作可能に関連するヌクレオチド配列の転写をコントロールまたは制御するヌクレオチド配列(すなわち、コード配列)である。コード配列は、ポリペプチドおよび/または機能性RNAをコードし得る。典型的に、「プロモーター」は、RNAポリメラーゼIIに関する結合部位を含むヌクレオチド配列を指し、転写の開始を管理する。一般に、プロモーターは、5’または対応するコード配列のコード領域のスタートに対して上流に見られる。プロモーター領域は、遺伝子発現のレギュレーターとして作用する他の因子を含んでよい。これらはTATAボックスコンセンサス配列を含み、そして、CAATボックスコンセンサス配列を含むことが多い(Breathnach and Chambon,(1981) Annu.Rev.Biochem.50:349)。植物では、CAATボックスはAGGAボックスで置き換えられ得る(Messing et al.,(1983)in Genetic Engineering of Plants,T.Kosuge,C.Meredith and A.Hollaender(eds.),Plenum Press,pp.211−227)。
プロモーターは、組み換え核酸分子(すなわち、「キメラ遺伝子」または「キメラポリヌクレオチド」)の調製で用いるための、例えば、構成的、誘導性、時間的に制御された、発生学的に制御された、化学的に制御された、組織−好適および/または組織−特異的なプロモーターを含んでよい。これらの様々なタイプのプロモーターは、当技術分野で知られている。
プロモーターの選択は、発現のための時間的および空間的要求に応じて変化し、および、形質転換される宿主細胞にも応じて変化する。多くの異なる生物のためのプロモーターは、当技術分野でよく知られている。当分野に存在する広範囲の知識に基づき、適切なプロモーターを、特定の目的宿主生物のために選択することができる。したがって、例えば、モデル生物において、高度に構成的に発現された遺伝子の上流のプロモーターについて多くが知られ、そのような知識は、必要に応じて、他のシステムで容易に利用および実施することができる。
一部の実施態様では、本発明の核酸構築物は、「発現カセット」であってよく、または発現カセット内に含まれてよい。本明細書において用いられる「発現カセット」は、目的のヌクレオチド配列(例えば本発明の核酸構築物(例えば、合成tracr核酸構築物、合成CRISPR核酸構築物、合成CRISPRアレイ、キメラ核酸構築物;目的ポリペプチドをコードするヌクレオチド配列、cas9ヌクレアーゼをコードするヌクレオチド配列))を含む組み換え核酸分子を意味し、ここで、前記ヌクレオチド配列は、少なくともコントロール配列(例えばプロモーター)と動作可能に関連する。したがって、本発明の一部の態様は、本発明のヌクレオチド配列を発現するように設計された発現カセットを提供する。
目的のヌクレオチド配列を含む発現カセットは、キメラであってよく、それの構成要素の少なくとも1つが、それの他の構成要素の少なくとも1つに対して異種であることを意味する。また、発現カセットは、天然起源であるが異種発現に有用である組み換え型で得られたものであってもよい。
また、発現カセットは、場合により、選択された宿主細胞内で機能性の転写および/または翻訳終結領域(すなわち終結領域)を含んでもよい。様々な転写終結因子が発現カセットでの使用に利用可能であり、目的の異種ヌクレオチド配列を超えて転写の終結に関与し、mRNAのポリアデニル化を修正する。終結領域は、転写開始領域に対して天然であり得て、作動可能に連結された目的のヌクレオチド配列に対して天然であり得て、宿主細胞に対して天然であり得て、または、別の起源(すなわち、プロモーターに対して、目的のヌクレオチド配列に対して、宿主に対して外因または異種、またはそれらの任意の組み合わせ)に由来し得る。
また、発現カセットは、形質転換された宿主細胞を選択するために用いることのできる選択可能なマーカーに関するヌクレオチド配列を含むこともできる。本明細書において用いられる「選択可能なマーカー」は、発現した場合に、マーカーを発現している宿主細胞に、区別できる表現型を与え、したがって、そのマーカーを有さないものからそのような形質転換された細胞が区別されるのを可能にする、ヌクレオチド配列を意味する。そのようなヌクレオチド配列は、マーカーが、化学的手段により、例えば選択剤(例えば抗生物質など)を用いることにより、選択することのできる形質を与えるかどうか、または、マーカーが単に、例えばスクリーニング(例えば蛍光)による、観察または試験を介して同定され得る形質であるかどうかに応じて、選択可能なマーカーまたはスクリーニング可能なマーカーのいずれかをコードし得る。もちろん、適切な選択可能なマーカーの多くの例が当技術分野で知られていて、本明細書に記載の発現カセットにおいて用いることができる。
発現カセットに加えて、本明細書に記載の核酸分子およびヌクレオチド配列は、ベクターとの関連で用いることができる。用語「ベクター」は、核酸(単数)(または核酸(複数))を細胞に移行、送達または導入するための組成物を指す。ベクターは、移行、送達または導入されるヌクレオチド配列(単数または複数)を含む核酸分子を含む。宿主生物の形質転換での使用のためのベクターは、当技術分野でよく知られている。ベクターの全般的なクラスの非限定的な例は、限定されないが、二本鎖または一本鎖の直鎖または環状型の、ウイルスベクター、プラスミドベクター、ファージベクター、ファージミドベクター、コスミドベクター、フォスミドベクター、バクテリオファージ、人工染色体、またはアグロバクテリウムバイナリーベクターを含み、自己で伝染または動員が可能であってよく、または不可能であってよい。本明細書に定義されるベクターは、細胞ゲノムへの組込みにより原核生物または真核生物宿主を形質転換することができ、または、染色体外に存在することができる(例えば複製起点を有する自己複製プラスミド)。天然にまたは設計により、放線菌および関連種、細菌および真核生物(例えば、より高度の植物、哺乳類、酵母または真菌細胞)から選択され得る2つの異なる宿主生物での複製が可能であるDNAビヒクルを意味する、シャトルベクターがさらに含まれる。一部の代表的な実施態様では、ベクター内の核酸は、宿主細胞での転写のための適切なプロモーターまたは他の制御因子の制御下であり、作動可能に連結されている。ベクターは、複数の宿主内で機能する二機能性発現ベクターであり得る。ゲノムDNAの場合は、これは、それ自身のプロモーターまたは他の制御因子を含み得て、cDNAの場合は、これは、宿主細胞での発現のための適切なプロモーターまたは他の制御因子の制御下であり得る。したがって、本発明の核酸分子および/または発現カセットは、本明細書に記載され、当技術分野で知られているように、ベクター内に含まれ得る。
目的のポリヌクレオチドの関連における「導入する(introducing)」、「導入する(introduce)」、「導入された(introduce)」(およびそれらの文法的変更)は、目的のヌクレオチド配列を、宿主生物または前記生物の細胞(例えば、宿主細胞)に、ヌクレオチド配列が細胞の内部に接近するような方法で提示することを意味する。1個よりも多いヌクレオチド配列が導入される場合は、これらのヌクレオチド配列は、単一のポリヌクレオチドまたは核酸構築物の一部として、または別個のポリヌクレオチドまたは核酸構築物として、集まることができ、同一または異なる発現構築物または形質転換ベクター上に位置することができる。したがって、これらのポリヌクレオチドは、細胞単一の形質転換イベントで、別個の形質転換/トランスフェクションイベントで、細胞に導入され得て、または、例えば、それらは従来の繁殖プロトコルにより生物に取り込まれ得る。したがって、本発明の一部の態様では、本発明の1つまたは複数の核酸構築物(例えば、合成tracr核酸構築物、合成CRISPR核酸構築物、合成CRISPRアレイ、キメラ核酸構築物;目的ポリペプチドをコードするヌクレオチド配列、cas9ヌクレアーゼをコードするヌクレオチド配列など)を、宿主生物または前記宿主生物の細胞に導入することができる。
本明細書において用いられる用語「形質転換」または「トランスフェクション」は、細胞への異種核酸の導入を指す。細胞の形質転換は、安定または一過的であり得る。したがって、一部の実施態様では、宿主細胞または宿主生物は、本発明の核酸分子により安定的に形質転換される。他の実施態様では、宿主細胞または宿主生物は、本発明の組み換え核酸分子により一過的に形質転換される。
ポリヌクレオチドの関連における「一過的に形質転換される」は、ポリヌクレオチドが細胞に導入されて、細胞のゲノム内に組込まれないことを意味する。
細胞内に導入されたポリヌクレオチドの関連における「安定に導入される(stably introducing)」または「安定に導入された(stably introduced)」は、導入されたポリヌクレオチドが細胞のゲノム内に安定的に取り込まれ、したがって細胞がポリヌクレオチドで安定的に形質転換されることを意図する。
本明細書において用いられる「安定した形質転換」または「安定的に形質転換された」は、核酸分子が細胞内に導入されて、細胞のゲノム内に組込むことを意味する。したがって、組み込まれた核酸分子は、その子孫により、より具体的には、複数の後に続く世代の子孫により、受け継がれることが可能である。また、本明細書において用いられる「ゲノム」は、核およびプラスチドゲノムも含み、したがって、例えば葉緑体またはミトコンドリアゲノムへの核酸の組込みを含む。また、本明細書において用いられる安定した形質転換は、染色体外に例えばミニ染色体またはプラスミドとして維持される導入遺伝子も指し得る。
一過的な形質転換は、生物内に導入された1つまたは複数の導入遺伝子によりコードされるペプチドまたはポリペプチドの存在を検出することのできる、酵素結合免疫吸着測定法(ELISA)またはウエスタンブロットなどにより、検出され得る。細胞の安定した形質転換は、生物(例えば、植物、哺乳類、昆虫、古細菌、細菌など)に導入された導入遺伝子のヌクレオチド配列と特異的にハイブリダイズする核酸配列を用いた、細胞のゲノムDNAのサザンブロットハイブリダイゼーションアッセイなどにより、検出することができる。細胞の安定した形質転換は、植物または他の生物に導入された導入遺伝子のヌクレオチド配列と特異的にハイブリダイズする核酸配列を用いた、細胞のRNAのノーザンブロットハイブリダイゼーションアッセイなどにより、検出することができる。また、細胞の安定した形質転換は、例えば、導入遺伝子の標的配列(単数または複数)とハイブリダイズする特異的なプライマー配列を用いて、ポリメラーゼ連鎖反応(PCR)または当技術分野でよく知られている他の増幅反応により検出することもでき、導入遺伝子配列の増幅をもたらし、標準的な方法に従って検出することができる。また、形質転換は、当技術分野でよく知られているダイレクトシーケンスおよび/またはハイブリダイゼーションのプロトコルにより検出することもできる。
したがって、一部の実施態様では、ヌクレオチド配列、構築物、発現カセットは、一過的に発現することができ、および/または、それらは宿主生物のゲノム内に安定的に取り込まれ得る。
本発明の組み換え核酸分子/ポリヌクレオチドは、当業者に公知の任意の方法により、細胞内に導入することができる。本発明の一部の実施態様では、細胞の形質転換は、核形質転換を含む。他の実施態様では、細胞の形質転換は、プラスチド形質転換(例えば、葉緑体形質転換)を含む。またさらなる実施態様では、本発明の組み換え核酸分子/ポリヌクレオチドは、従来の繁殖技術を介して細胞に導入することができる。
真核生物および原核生物は両方とも、形質転換の手順は広く知られていて当分野においてルーチンであり、文献全体を通して記載される(例えば、Jiang et al.2013.Nat.Biotechnol.31:233−239;Ranetal.Nature Protocols 8:2281−2308(2013)を参照)。
したがって、ヌクレオチド配列は、当技術分野でよく知られている任意の数の方法で、宿主生物またはその細胞に導入することができる。本発明の方法は、1つまたは複数のヌクレオチド配列が生物内に導入されるためには、それらが生物の少なくとも1つの細胞の内部に接近しさえすれば、特定の方法に依存しない。1個よりも多いヌクレオチド配列が導入される場合は、それらは、単一の核酸構築物の一部として、または別個の核酸構築物として、集まることができ、同一または異なる核酸構築物上に位置することができる。したがって、ヌクレオチド配列は、単一の形質転換イベントで、または別個の形質転換イベントで、目的の細胞内に導入することができ、あるいは、関連する場合は、ヌクレオチド配列は、繁殖プロトコルの一部として植物内に取り込むことができる。
本発明は、標的DNAの部位特異的ニック、切断および/または改変のための、および、標的DNAに対する目的ポリペプチドの部位特異的ターゲッティングのための、増大した効率および増大した特異性を有する組成物および方法に関する。
本発明の核酸構築物およびヌクレオチド配列は、構築物または配列の全体的な構造または機能に影響を与えない代替の方法で表すことができる。したがって、例えば、ある場合には、合成CRISPR核酸(crRNA)は、揺らぎ塩基GR1配列(G/U)およびステッチ配列を含むことができ、あるいは、crRNAは、(G/U)揺らぎ塩基を含むステッチ配列を含むことができ、したがって、GR1配列をさらに表さない。ある場合には、GR1は対合しない(すなわちG/AはLjeとミスマッチである、図20)。さらなる等価性は、以下に提供される等価表(表1)に示されるものを含む(図22も参照)。
したがって、本発明の一態様では、合成トランスコード化CRISPR(tracr)核酸(例えば、tracrRNA、tracrDNA)構築物が提供され、前記構築物は、5’から3’の方向に、少なくとも約3個のヌクレオチドを含む、から本質的になる、またはからなる抗−ジッパー配列;少なくとも約3個のヌクレオチドを含むバルジ配列;NNANNのヌクレオチド配列を含む抗−ステッチ配列;TNANNC、T(A/C)A(A/G)(G/A)C(またはU(A/C)A(A/G)(G/A)C))、TCAAAC、(またはUCAAAC)、TAAGGC(またはUAAGGC)、GATAAGG(またはGAUAAGG)、GATAAGGCTT(またはGAUAAGGCUU)、TCAAG(またはUCAAG)、TCAAGCAA(またはUCAAGCAA)、T(C/A)AA(A/C)(C/A)(A/G)(A/T)(またはU(C/A)AA(A/C)(C/A)(A/G)(A/U))、GATAAGGCCATGCC、TAAGGCTAGTCC、TCAAGCAAAGC、またはTCAAACAAAGCTTCAGCのヌクレオチド配列を含むネクサス配列;および、少なくとも1つのヘアピンを有するヌクレオチド配列を含むヘアピン配列を、含み、から本質的になり、またはからなり、前記ヘアピンは、少なくとも3個の一致する塩基対を含み、ここで、抗−ジッパー配列は、バルジ配列のすぐ上流に位置し、バルジ配列は、抗−ステッチ配列のすぐ上流に位置し、抗−ステッチ配列は、ネクサス配列のすぐ上流に位置し、および、ネクサス配列は、ヘアピン配列のすぐ上流に位置する。一部の実施態様では、抗−ステッチ配列は、NNANN、ACAAA、TAAAA、(T/C)(A/G)T(A/G)(A/G)、TAAAA、TGAAAのヌクレオチド配列を、含む、から本質的になる、またはからなる。
さらなる実施態様では、5’から3’の方向に、少なくとも約3個のヌクレオチドを含む抗−ジッパー配列;少なくとも約3個のヌクレオチドを含むバルジ配列;NNANNのヌクレオチド配列を含む抗−ステッチ配列;TNANNC、T(A/C)A(A/G)(G/A)C(またはU(A/C)A(A/G)(G/A)C))、TCAAAC、(またはUCAAAC)、TAAGGC(またはUAAGGC)、GATAAGG(またはGAUAAGG)、GATAAGGCTT(またはGAUAAGGCUU)、TCAAG(またはUCAAG)、TCAAGCAA(またはUCAAGCAA)、T(C/A)AA(A/C)(C/A)(A/G)(A/T)(またはU(C/A)AA(A/C)(C/A)(A/G)(A/U))、GATAAGGCCATGCC、TAAGGCTAGTCC、TCAAGCAAAGC、またはTCAAACAAAGCTTCAGCのヌクレオチド配列を含む、から本質的になる、またはからなる、ネクサス配列、および、少なくとも1つのヘアピンを有するヌクレオチド配列を含むヘアピン配列を、含む、から本質的になる、またはからなる、合成トランスコード化CRISPR(tracr)核酸構築物が提供され、前記ヘアピンは、少なくとも3個の一致する塩基対を含み、ここで、抗−ジッパー配列は、バルジ配列のすぐ上流に位置し、バルジ配列は、抗−ステッチ配列のすぐ上流に位置し、抗−ステッチ配列は、ネクサス配列のすぐ上流に位置し、および、ネクサス配列は、ヘアピン配列のすぐ上流に位置する。
一部の実施態様では、合成tracr核酸構築物のバルジ配列は、少なくとも約3個のヌクレオチドを含む、から本質的になる、またはからなる。一部の実施態様では、合成tracr核酸構築物のバルジ配列は、少なくとも約4個のヌクレオチドを含む、から本質的になる、またはからなる。他の実施態様では、合成tracr核酸構築物のバルジ配列は、5個のヌクレオチドを含む、から本質的になる、またはからなる。他の実施態様では、合成tracr核酸構築物のヘアピン配列は、少なくとも2個のヘアピンを含み、から本質的になり、またはからなり、各ヘアピンは、少なくとも3個の一致する塩基対を含む。
さらなる態様では、本発明は、3’から5’の方向に、少なくとも約3個のヌクレオチドを含む、から本質的になる、またはからなるジッパー配列、少なくとも2個のヌクレオチドを有するヌクレオチド配列(例えば、(−NN−)のヌクレオチド配列)を含む、から本質的になる、またはからなるバルジ配列、NNTNN(またはNNUNN)のヌクレオチド配列を含む、から本質的になる、またはからなるステッチ配列、ヌクレオチドGまたはGTTを含む、から本質的になる、またはからなるGR1、および、5’末端および3’末端を有するスペーサー配列であって、その3’末端に標的DNAと100%の同一性を有する少なくとも7個のヌクレオチドを含む、から本質的になる、またはからなるスペーサー配列を、含む、から本質的になる、またはからなる合成CRISPR核酸(例えば、crRNA、crDNA)構築物を提供し、ジッパー配列は、バルジ配列のすぐ上流に位置し、バルジ配列は、ステッチ配列のすぐ上流に位置し、ステッチ配列は、GR1のすぐ上流に位置し、および、GR1は、スペーサー配列のすぐ上流に位置する。
さらなる実施態様では、3’から5’の方向に、抗−ジッパーにハイブリダイズする少なくとも3個のヌクレオチドを有するヌクレオチド配列を含むジッパー配列、少なくとも約2個のヌクレオチドのヌクレオチド配列を含むバルジ配列、NNUNNのヌクレオチド配列を含むステッチ配列(、および5’末端および3’末端を有するスペーサー配列であって、その3’末端に標的DNAと100%の同一性を有する少なくとも7個のヌクレオチドを含むスペーサー配列を、含む、から本質的になる、またはからなる合成CRISPR核酸(例えば、crRNA、crDNA)構築物が提供され、ジッパー配列は、バルジ配列のすぐ上流に位置し、バルジ配列は、ステッチ配列のすぐ上流に位置し、ステッチ配列は、スペーサー配列のすぐ上流に位置する。
一部の実施態様では、合成CRISPR核酸アレイが提供され、前記合成CRISPR核酸アレイは、本発明の2以上のCRISPR核酸構築物をコードするヌクレオチド配列を含み、ここで、2以上のCRISPR核酸構築物は、前記ヌクレオチド配列上で互いにすぐ隣に位置し、前記2以上のCRISPR核酸構築物のステッチ配列は同一であり、前記2以上のCRISPR核酸構築物のスペーサー配列は同一または非同一であり、および、前記2以上のCRISPR核酸構築物のジッパー配列は同一である。
他の態様では、本発明の合成tracr核酸構築物および合成CRISPR核酸構築物を含むキメラ核酸構築物(またはガイド核酸構築物)が提供され、ここで、合成CRISPR核酸構築物のジッパー配列は、前記合成tracr核酸構築物の抗−ジッパー配列と少なくとも約70%(例えば、約70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%など)相補でありハイブリダイズし、合成CRISPR核酸構築物のステッチ配列は、前記合成tracr核酸構築物の抗−ステッチ配列と100%同一でありハイブリダイズし、合成CRISPR核酸構築物のバルジ配列および合成CRISPR核酸構築物のバルジ配列は、非相補である。
他の実施態様では、本発明の合成tracr核酸構築物および合成CRISPR核酸構築物を含む、から本質的になる、またはからなるキメラ核酸構築物が提供され、ここで、合成CRISPR核酸構築物のステッチ配列のNNUNNは、前記合成tracr核酸構築物の抗−ステッチ配列のNNANNと100%相補でありハイブリダイズし、前記ステッチ配列の(G)は、前記抗−ステッチ配列のUと揺らぎ塩基対合を形成し、合成CRISPR核酸構築物のバルジ配列および合成CRISPR核酸構築物のバルジ配列は、非相補であり、ジッパー配列および抗−ジッパー配列が存在する場合は、合成CRISPR核酸構築物のジッパー配列は、前記合成tracr核酸構築物の抗−ジッパー配列にハイブリダイズする。
一部の実施態様では、キメラ核酸構築物は、場合により、ハイブリダイズしたジッパーおよび抗−ジッパー配列を連結するヌクレオチドを、ハイブリダイズした配列の末端(バルジ配列に対して遠位)にさらに含むことができる。連結するヌクレオチドは、任意のヌクレオチド(例えば、T、A、G、C)であってよく、ジッパー配列および抗−ジッパー配列またはバルジ配列を連結するヌクレオチドの数は、約3個〜約7個であり得る。
さらなる態様では、本発明の合成tracr核酸構築物、合成CRISPR核酸構築物、CRISPR核酸アレイ、またはキメラ核酸構築物は、Cas9ヌクレアーゼ、Cas9ヌクレアーゼをコードするアミノ酸配列と少なくとも70%の同一性(例えば、約70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%など)を有するアミノ酸配列をコードするヌクレオチド配列、または、Cas9ヌクレアーゼをコードするアミノ酸配列と少なくとも70%の同一性を有するアミノ酸配列を、さらに含むことができる。本発明で有用なCas9ヌクレアーゼは、CRISPR−CasシステムにおいてDNA切断を触媒することが知られる任意のCas9ヌクレアーゼであってよい。当技術分野で知られているように、そのようなCas9ヌクレアーゼは、HNHモチーフおよびRuvCモチーフ(例えば、WO2013/176772;WO/2013/188638を参照)を含む。一部の実施態様では、HNHモチーフまたはRuvCモチーフは、野生型Cas9ヌクレアーゼと比較してそれらの活性を低下または消去する変異を含み得る。一部の実施態様では、片方のモチーフのみ(例えば、HNHモチーフまたはRuvCモチーフのいずれか)が突然変異される。他の実施態様では、両方の活性が低下または消去されるように両方のモチーフが突然変異される。ミスセンス変異、ナンセンス変異、フレームシフト変異などを含む任意のタイプの変異を用いて、Cas9ヌクレアーゼでのHNHモチーフおよび/またはRuvCモチーフの活性を低下または消去することができる。
本開示は、様々なCRISPR−CasシステムおよびCas9ヌクレアーゼのグループ化を特定する。これらのグループ化は、Cas9ヌクレアーゼのStreptococcus thermophilus CRISPR 1(Sth CR1)グループ、Cas9ヌクレアーゼのStreptococcus thermophilus CRISPR 3(Sth CR3)グループ、Cas9ヌクレアーゼのLactobacillus buchneri CD034(Lb)グループ、およびCas9ヌクレアーゼのLactobacillus rhamnosus GG(Lrh)グループを含む。Sth CR1グループCas9ヌクレアーゼの非限定的な例は、配列番号1〜9および51のポリペプチド配列によりコードされるCas9ヌクレアーゼを含む。Sth CR3グループCas9ヌクレアーゼの非限定的な例は、配列番号10〜23のポリペプチド配列によりコードされるCas9ヌクレアーゼを含む。LbグループCas9ヌクレアーゼの非限定的な例は、配列番号28、30〜33、35、43、44、47、50および52のポリペプチド配列によりコードされるCas9ヌクレアーゼを含む。LrhグループCas9ヌクレアーゼの非限定的な例は、配列番号24〜27、29、34、36〜42、45および53のポリペプチド配列によりコードされるCas9ヌクレアーゼを含む。さらなるCas9ヌクレアーゼは、限定されないが、Lactobacillus curvatus CRL 705のものを含む。本発明で有用なさらなるCas9ヌクレアーゼは、限定されないが、Lactobacillus animalis KCTC 3501、およびLactobacillus farciminis WP 010018949.1由来の、Cas9を含む。
したがって、一部の実施態様では、Cas9ヌクレアーゼは、Cas9ヌクレアーゼのStreptococcus thermophilus CRISPR 1(Sth CR1)グループ由来のCas9、Cas9ヌクレアーゼのStreptococcus thermophilus CRISPR 3(Sth CR3)グループ由来のCas9、Cas9ヌクレアーゼのLactobacillus buchneri CD034(Lb)グループ由来のCas9ヌクレアーゼ、および/または、Cas9ヌクレアーゼのLactobacillus rhamnosus GG(Lrh)グループ由来のCas9ヌクレアーゼを含み得る、から本質的になり得る、またはからなり得る。さらなる実施態様では、Cas9ヌクレアーゼをコードするアミノ酸配列は、配列番号1〜配列番号53のいずれか1つのアミノ酸配列であってよい。また、さらなる実施態様では、本開示の合成tracr核酸構築物、合成CRISPR核酸構築物、合成CRISPR核酸アレイ、および/またはキメラ核酸構築物で有用なCas9ヌクレアーゼは、配列番号1〜配列番号53のいずれか1つのアミノ酸配列と少なくとも70%の同一性を有するアミノ酸配列をコードするヌクレオチド配列を含む、から本質的になる、またはからなる。
さらに、特定の実施態様では、Cas9ヌクレアーゼは、標的DNAを含む生物のためにコドン最適化されたヌクレオチド配列によりコードされ得る。さらに他の実施態様では、Cas9ヌクレアーゼは、少なくとも1つの核局在化配列を含み得る。
本発明者は、驚くべきことに、特定のグループのCas9ヌクレアーゼと合成tracr核酸構築物(tracrRNA、tracrDNA)のネクサス配列間の機能的対合を発見した。したがって、一部の実施態様では、ネクサス配列がGATAAGGCまたはGATAAGGCCATGCCである場合、Cas9ヌクレアーゼは、Cas9ヌクレアーゼのStreptococcus thermophilus CRISPR 1(STh CR1)グループ由来であり;ネクサス配列がTAAGGCまたはTAAGGCTAGTCCである場合は、Cas9ヌクレアーゼは、Cas9ヌクレアーゼのStreptococcus thermophilus CRISPR 3(Sth CR3)グループ由来であり;ネクサス配列がTCAAGCまたはTCAAGCAAAGCである場合は、Cas9ヌクレアーゼは、Cas9ヌクレアーゼのLactobacillus buchneri CD034(Lb)グループ由来であり;または、前記ネクサス配列がTCAAACまたはTCAAACAAAGCTTCAGCである場合は、Cas9ヌクレアーゼは、Cas9ヌクレアーゼのLactobacillus rhamnosus GG(Lrh)グループ由来である。
本明細書に記載のように、本発明で有用なCas9ヌクレアーゼは、HNHモチーフおよび/またはRuvCモチーフに変異を含んでよく、それにより、それぞれのモチーフの活性が低下または消去される。当技術分野で知られているように、HNHモチーフ内の変異は、二本鎖標的DNAの(+)鎖の部位特異的ニックを減少/消去し、RucV活性部位の変異は、二本鎖標的DNAの(−)鎖の部位特異的ニックを低下/消去する。両方の活性部位の変異は、DNAの切断を低下/消去する(すなわち、標的DNAの部位特異的切断を低下/消去する)。したがって、一部の実施態様では、本開示の合成tracr核酸構築物、合成CRISPR核酸構築物、CRISPR核酸アレイ、および/またはキメラ核酸構築物は、RuvC活性部位モチーフ内に変異を有するCas9ヌクレアーゼを含む。他の実施態様では、本開示の合成tracr核酸構築物、合成CRISPR核酸構築物、CRISPR核酸アレイ、および/またはキメラ核酸構築物は、HNH活性部位モチーフ内に変異を有するCas9ヌクレアーゼを含む。またさらなる実施態様では、本開示の合成tracr核酸構築物、合成CRISPR核酸構築物、CRISPR核酸アレイ、および/またはキメラ核酸構築物は、HNH活性部位モチーフ内およびRuvCモチーフ内に変異を有するCas9ヌクレアーゼを含む。
またさらなる実施態様では、HNHおよびRuvCモチーフ内に変異を有し、それによりヌクレアーゼ活性が低下または消去されたCas9ヌクレアーゼは、Cas9ヌクレアーゼに融合された目的ポリペプチドをさらに含む。そのようなCas9−目的ポリペプチド融合タンパク質を用いて、目的ポリペプチドを特定の標的DNAへ向かわせる、または標的化することができる。
本開示の合成tracr核酸構築物、合成CRISPR核酸構築物、CRISPR核酸アレイ、および/またはキメラ核酸構築物を用いるための方法が、本明細書においてさらに提供される。したがって、一部の実施態様では、本開示のキメラ核酸構築物または本開示のキメラ核酸構築物を含む発現カセットを、Cas9ヌクレアーゼ(例えば、配列番号1〜53)の存在下で標的DNAと接触させ、それにより、標的DNAに対するスペーサー配列の相補ハイブリダイゼーションにより規定される領域内で標的DNAの部位特異的切断を生じさせるステップを含む、二本鎖標的DNAの部位特異的切断のための方法が提供される。一部の実施態様では、部位特異的切断は、二本鎖標的DNAの(+)鎖の部位特異的ニックであってよく、前記Cas9ヌクレアーゼは、RuvC活性部位モチーフ内の変異を含み、それにより、二本鎖標的の(+)鎖を切断して、部位−特異的なニックを二本鎖標的DNAの前記(+)鎖に生じさせる。他の実施態様では、部位特異的切断は、二本鎖標的DNAの(−)鎖の部位特異的ニックであり、前記Cas9ヌクレアーゼは、HNH活性部位モチーフ内に点変異を含み、それにより、二本鎖標的DNAの(−)鎖を切断し、二本鎖標的DNAの前記(−)鎖に部位−特異的なニックを生じさせる。
さらなる実施態様では、二本鎖標的DNAの部位特異的切断のための方法が提供され、以下を含む:トランスコード化CRISPR(tracr)核酸分子およびCRISPR核酸分子を、Cas9ヌクレアーゼ(例えば、配列番号1〜53)の存在下で標的DNAと接触させるステップ、ここで、(a)tracr核酸分子は、5’から3’の方向に、少なくとも約3個のヌクレオチドを含む抗−ジッパー配列;少なくとも約3個のヌクレオチドを含むバルジ配列;NNANNのヌクレオチド配列を含む抗−ステッチ配列;TNANNC、T(A/C)A(A/G)(G/A)C、TCAAAC、TAAGGC、GATAAGG、GATAAGGCTT、TCAAG、TCAAGCAA、T(C/A)AA(A/C)(C/A)(A/G)(A/T)、GATAAGGCCATGCC、TAAGGCTAGTCC、TCAAGCAAAGC、またはTCAAACAAAGCTTCAGCのヌクレオチド配列を含むネクサス配列;および、少なくとも1つのヘアピンを含む、から本質的になる、またはからなる、ヌクレオチド配列を含むヘアピン配列を含む、ヌクレオチド配列によりコードされ、前記ヘアピンは少なくとも3個の一致する塩基対を含み、抗−ジッパー配列は、バルジ配列のすぐ上流に位置し、バルジ配列は、抗−ステッチ配列のすぐ上流に位置し、抗−ステッチ配列は、ネクサス配列のすぐ上流に位置し、および、ネクサス配列は、ヘアピン配列のすぐ上流に位置する;および、(b)CRISPR核酸分子は、3’から5’の方向に、少なくとも約3個のヌクレオチドを含むジッパー配列、少なくとも2個のヌクレオチドを有するヌクレオチド配列を含むバルジ配列、NNTNN(またはNNUNN)のヌクレオチド配列を含むステッチ配列、ヌクレオチドGまたはGTTを含むGR1、および5’末端および3’末端を有するスペーサー配列であって、その3’末端に標的DNAと100%の同一性を有する少なくとも7個のヌクレオチドを含むスペーサー配列を含む、ヌクレオチド配列によりコードされ、ジッパー配列は、バルジ配列のすぐ上流に位置し、バルジ配列は、ステッチ配列のすぐ上流に位置し、ステッチ配列は、GR1のすぐ上流に位置し、および、GR1は、スペーサー配列のすぐ上流に位置する、およびさらにここで、tracr核酸分子の抗−ジッパー配列および抗−ステッチ配列は、それぞれ、CRISPR核酸分子のジッパー配列およびステッチ配列と、少なくとも約70%相補でありハイブリダイズし、CRISPR核酸分子のスペーサー配列は、標的DNAの一部(標的DNA上のプロトスペーサー隣接モチーフ(PAM)に隣接する)と少なくとも約80%相補でありハイブリダイズし、それにより、標的DNAに対するCRISPR核酸分子のスペーサー配列の相補結合により規定される領域内で、標的DNAの部位特異的切断をもたらす。
他の実施態様では、二本鎖標的DNAを、以下を含むキメラ核酸と接触させるステップ含む、二本鎖標的DNAの部位特異的切断のための方法が提供される。(a)5’から3’の方向に、少なくとも約9個のヌクレオチドを含む抗−ジッパー配列;少なくとも約4個のヌクレオチドを含むバルジ配列;NNANNのヌクレオチド配列を含む抗−ステッチ配列;TNANNC、T(A/C)A(A/G)(G/A)C、TCAAAC、TAAGGC、GATAAGG、GATAAGGCTT、TCAAG、TCAAGCAA、T(C/A)AA(A/C)(C/A)(A/G)(A/T)、GATAAGGCCATGCC、TAAGGCTAGTCC、TCAAGCAAAGC、またはTCAAACAAAGCTTCAGCのヌクレオチド配列を含むネクサス配列;および、少なくとも1つのヘアピンを有するヌクレオチド配列を含むヘアピン配列を含む、第一のヌクレオチド配列(前記ヘアピンは、少なくとも3個の一致する塩基対を含み、抗−ジッパー配列は、バルジ配列のすぐ上流に位置し、バルジ配列は、抗−ステッチ配列のすぐ上流に位置し、抗−ステッチ配列は、ネクサス配列のすぐ上流に位置し、ネクサス配列は、ヘアピン配列のすぐ上流に位置する);(b)3’から5’の方向に、少なくとも約3個のヌクレオチドを含むジッパー配列、少なくとも2個のヌクレオチドを有するヌクレオチド配列を含むバルジ配列、NNTNN(またはNNUNN)のヌクレオチド配列を含むステッチ配列、ヌクレオチドGまたはGTTを含むGR1、および、5’末端および3’末端を有するスペーサー配列であって、その3’末端に標的DNAと100%の同一性を有する少なくとも7個のヌクレオチドを含むスペーサー配列を含む、第二のヌクレオチド配列(ジッパー配列は、バルジ配列のすぐ上流に位置し、バルジ配列は、ステッチ配列のすぐ上流に位置し、ステッチ配列は、GR1のすぐ上流に位置し、および、GR1は、スペーサー配列のすぐ上流に位置する);および、(c)Cas9ヌクレアーゼ(例えば、配列番号1〜53)をコードするアミノ酸配列と少なくとも80%の同一性を有するアミノ酸配列をコードする、第三のヌクレオチド配列(ここで、第一のヌクレオチド配列の抗−ジッパー配列および抗−ステッチ配列は、第二のヌクレオチド配列のジッパー配列およびステッチ配列にハイブリダイズし、第二のヌクレオチド配列のスペーサー配列は、標的DNAの一部(標的DNA上のプロトスペーサー隣接モチーフ(PAM)に隣接する)にハイブリダイズし、それにより、標的DNAに対する第二のヌクレオチド配列のスペーサー配列の相補結合により規定される領域内で、標的DNAの部位特異的切断をもたらす)。
さらなる実施態様では、二本鎖(ds)標的DNAに対する、目的ポリペプチドの部位特異的ターゲッティングの方法が提供され、トランスコード化CRISPR(tracr)核酸分子およびCRISPR核酸分子を、Cas9ヌクレアーゼ(例えば、配列番号1〜53)の存在下で標的DNAと接触させるステップを含み、ここで(a)tracr核酸分子は、5’から3’の方向に、少なくとも約3個のヌクレオチドを含む抗−ジッパー配列;少なくとも約3個のヌクレオチドを含むバルジ配列;NNANNのヌクレオチド配列を含む抗−ステッチ配列;TNANNC、T(A/C)A(A/G)(G/A)C、TCAAAC、TAAGGC、GATAAGG、GATAAGGCTT、TCAAG、TCAAGCAA、T(C/A)AA(A/C)(C/A)(A/G)(A/T)、GATAAGGCCATGCC、TAAGGCTAGTCC、TCAAGCAAAGC、またはTCAAACAAAGCTTCAGCのヌクレオチド配列を含むネクサス配列;および、少なくとも1つのヘアピンを有するヌクレオチド配列を含むヘアピン配列を含む、ヌクレオチド配列によりコードされ、前記ヘアピンは、少なくとも3個の一致する塩基対を含み、抗−ジッパー配列は、バルジ配列のすぐ上流に位置し、バルジ配列は、抗−ステッチ配列のすぐ上流に位置し、抗−ステッチ配列は、ネクサス配列のすぐ上流に位置し、および、ネクサス配列は、ヘアピン配列のすぐ上流に位置する;および、(b)CRISPR核酸分子は、3’から5’の方向に、少なくとも約3個のヌクレオチドを含むジッパー配列、少なくとも2個のヌクレオチド(例えば(−NN−)のヌクレオチド配列)を含むバルジ配列、NNTNNのヌクレオチド配列を含むステッチ配列、ヌクレオチドGまたはGTTを含むGR1、および5’末端および3’末端を有するスペーサー配列であって、その3’末端に標的DNAと100%の同一性を有する少なくとも7個のヌクレオチドを含むスペーサー配列を含む、ヌクレオチド配列によりコードされ、ジッパー配列は、バルジ配列のすぐ上流に位置し、バルジ配列は、ステッチ配列のすぐ上流に位置し、ステッチ配列は、GR1のすぐ上流に位置し、および、GR1は、スペーサー配列のすぐ上流に位置する、およびさらにここで、Cas9ヌクレアーゼは、HNH活性部位モチーフ内の変異、RuvC活性部位モチーフ内の変異を含み、および、目的ポリペプチドに融合され、抗−ジッパー配列は、ジッパー配列と約70%相補でありハイブリダイズし、ステッチ配列は、ステッチ配列と100%相補でありハイブリダイズし、スペーサー配列は、標的DNA上のプロトスペーサー隣接モチーフ(PAM)に隣接する標的DNAと約80%相補でありハイブリダイズし、それにより、標的DNAに対するCRISPR核酸分子のスペーサー配列の相補結合により規定される領域で、標的DNAに対する目的ポリペプチドの部位特異的ターゲッティングをもたらす。
代表的な実施態様では、本明細書に記載のように、合成tracr核酸構築物に関して、合成tracr核酸分子のバルジ配列または第一のヌクレオチド配列は、約3個、4個または5個のヌクレオチドを含み得て、から本質的になり得て、またはからなり得る。他の実施態様では、バルジ配列は、5個のヌクレオチドを含み得て、から本質的になり得て、またはからなり得て、および、ヘアピン配列は、少なくとも2個のヘアピンを含み得て、から本質的になり得て、またはからなり得て、ここで、各ヘアピンは少なくとも3個の一致する塩基対を含む。
さらなる実施態様では、本発明は、トランスコード化CRISPR(tracr)核酸分子およびCRISPR核酸分子を、Cas9ヌクレアーゼの存在下で標的DNAと接触させるステップを含む二本鎖標的DNAの部位特異的切断のための方法を提供し、ここで、
(a)tracr核酸分子は、5’から3’の方向に、少なくとも約3個のヌクレオチドを含む抗−ジッパー配列;少なくとも約3個のヌクレオチドを含むバルジ配列;NNANNのヌクレオチド配列を含む抗−ステッチ配列、TNANNC、T(A/C)A(A/G)(G/A)C、TCAAAC、TAAGGC、GATAAGG、GATAAGGCTT、TCAAG、TCAAGCAA、T(C/A)AA(A/C)(C/A)(A/G)(A/T)、GATAAGGCCATGCC、TAAGGCTAGTCC、TCAAGCAAAGC、またはTCAAACAAAGCTTCAGCのヌクレオチド配列を含むネクサス配列、少なくとも1つのヘアピンを有するヌクレオチド配列を含むヘアピン配列を含むヌクレオチド配列によりコードされ、前記ヘアピンは、少なくとも3個の一致する塩基対を含む、および
抗−ジッパー配列は、バルジ配列のすぐ上流に位置し、バルジ配列は、抗−ステッチ配列のすぐ上流に位置し、抗−ステッチ配列は、ネクサス配列のすぐ上流に位置し、および、ネクサス配列は、ヘアピン配列のすぐ上流に位置する;および
(b)CRISPR核酸分子は、3’から5’の方向に、抗−ジッパーにハイブリダイズする少なくとも3個のヌクレオチドを有するヌクレオチド配列を含むジッパー配列、(−NN−)のヌクレオチド配列を含むバルジ配列、NNUNNのヌクレオチド配列を含むステッチ配列、および5’末端および3’末端を有するスペーサー配列であって、その3’末端に標的DNAと100%の同一性を有する少なくとも7個のヌクレオチドを含むスペーサー配列を含むヌクレオチド配列によりコードされ、および
ジッパー配列は、バルジ配列のすぐ上流に位置し、バルジ配列は、ステッチ配列のすぐ上流に位置し、ステッチ配列は、スペーサー配列のすぐ上流に位置し、および、
さらにここで、抗−ジッパーおよびジッパー配列が存在する場合は、抗−ジッパー配列はジッパー配列にハイブリダイズし、抗−ステッチ配列のNNANNは、ステッチ配列のNNUNNに相補でありハイブリダイズし、CRISPR核酸分子のスペーサー配列は標的DNAの一部(標的DNA上のプロトスペーサー隣接モチーフ(PAM)に隣接する)にハイブリダイズし、それにより、標的DNAに対するCRISPR核酸分子のスペーサー配列のハイブリダイゼーションにより規定される領域内で、標的DNAの部位特異的切断をもたらす。
またさらなる実施態様では、二本鎖標的DNAの部位特異的切断のための方法が提供され、その方法は、二本鎖標的DNAを、以下を含むキメラ核酸と接触させるステップを含む:
(a)5’から3’の方向に、少なくとも約3個のヌクレオチドを含む抗−ジッパー配列;少なくとも約3個のヌクレオチドを含むバルジ配列;NNANNのヌクレオチド配列を含む抗−ステッチ配列、TNANNC、T(A/C)A(A/G)(G/A)C、TCAAAC、TAAGGC、GATAAGG、GATAAGGCTT、TCAAG、TCAAGCAA、T(C/A)AA(A/C)(C/A)(A/G)(A/T)、GATAAGGCCATGCC、TAAGGCTAGTCC、TCAAGCAAAGC、またはTCAAACAAAGCTTCAGCのヌクレオチド配列を含むネクサス配列、少なくとも1つのヘアピンを有するヌクレオチド配列を含むヘアピン配列を含む、第一のヌクレオチド配列(前記ヘアピンは、少なくとも3個の一致する塩基対を含む)、
ここで、抗−ジッパー配列は、バルジ配列のすぐ上流に位置し、バルジ配列は、抗−ステッチ配列のすぐ上流に位置し、抗−ステッチ配列は、ネクサス配列のすぐ上流に位置し、および、ネクサス配列は、ヘアピン配列のすぐ上流に位置する;
(b)3’から5’の方向に、抗−ジッパーにハイブリダイズする少なくとも3個のヌクレオチドを有するヌクレオチド配列を含むジッパー配列、少なくとも2個のヌクレオチドを有するヌクレオチド配列(例えば、(−NN−)のヌクレオチド配列)を含むバルジ配列、NNUNNのヌクレオチド配列を含むステッチ配列、および5’末端および3’末端を有するスペーサー配列であって、その3’末端に標的DNAと100%の同一性を有する少なくとも7個のヌクレオチドを含むスペーサー配列を含む、第二のヌクレオチド配列、および
ジッパー配列は、バルジ配列のすぐ上流に位置し、バルジ配列は、ステッチ配列のすぐ上流に位置し、ステッチ配列は、スペーサー配列のすぐ上流に位置する;および
(c)Cas9ヌクレアーゼ(例えば、配列番号1〜53)をコードするアミノ酸配列と少なくとも80%の同一性を有するアミノ酸配列をコードする、第三のヌクレオチド配列、
ここで、ジッパー配列および抗−ジッパー配列が存在する場合は、ジッパー配列は、抗−ジッパー配列にハイブリダイズし、抗−ステッチ配列のNNANNは、ステッチ配列のNNUNNと相補でありハイブリダイズし、第二のヌクレオチド配列のスペーサー配列は、標的DNAの一部(標的DNA上のプロトスペーサー隣接モチーフ(PAM)に隣接する)にハイブリダイズし、それにより、標的DNAに対する第二のヌクレオチド配列のスペーサー配列のハイブリダイゼーションにより規定される領域内で、標的DNAの部位特異的切断をもたらす。
さらなる実施態様では、二本鎖(ds)標的DNAに対する、目的ポリペプチドの部位特異的ターゲッティングの方法が提供され、トランスコード化CRISPR(tracr)核酸分子およびCRISPR核酸分子を、Cas9ヌクレアーゼ(例えば、配列番号1〜53)の存在下で標的DNAと接触させるステップを含み、
ここで、(a)tracr核酸分子は、5’から3’の方向に、少なくとも約3個のヌクレオチドを含む抗−ジッパー配列;少なくとも約3個のヌクレオチドを含むバルジ配列;NNANNのヌクレオチド配列を含む抗−ステッチ配列、TNANNC、T(A/C)A(A/G)(G/A)C、TCAAAC、TAAGGC、GATAAGG、GATAAGGCTT、TCAAG、TCAAGCAA、T(C/A)AA(A/C)(C/A)(A/G)(A/T)、GATAAGGCCATGCC、TAAGGCTAGTCC、TCAAGCAAAGC、またはTCAAACAAAGCTTCAGCのヌクレオチド配列を含むネクサス配列、少なくとも1つのヘアピンを有するヌクレオチド配列を含むヘアピン配列を含む、ヌクレオチド配列によりコードされ、前記ヘアピンは、少なくとも3個の一致する塩基対を含み、および
抗−ジッパー配列は、バルジ配列のすぐ上流に位置し、バルジ配列は、抗−ステッチ配列のすぐ上流に位置し、抗−ステッチ配列は、ネクサス配列のすぐ上流に位置し、および、ネクサス配列は、ヘアピン配列のすぐ上流に位置する;および
(b)CRISPR核酸分子は、3’から5’の方向に、抗−ジッパーにハイブリダイズする少なくとも3個のヌクレオチドを有するヌクレオチド配列を含むジッパー配列、少なくとも2個のヌクレオチドを有するヌクレオチド配列(例えば、(−NN−)のヌクレオチド配列)を含むバルジ配列、NNUNNのヌクレオチド配列を含むステッチ配列、および5’末端および3’末端を有するスペーサー配列であって、その3’末端に標的DNAと100%の同一性を有する少なくとも7個のヌクレオチドを含むスペーサー配列を含む、ヌクレオチド配列によりコードされ、および
ジッパー配列は、バルジ配列のすぐ上流に位置し、バルジ配列は、ステッチ配列のすぐ上流に位置し、ステッチ配列は、スペーサー配列のすぐ上流に位置し、および
さらにここで、Cas9ヌクレアーゼは、HNH活性部位モチーフ内の変異、RuvC活性部位モチーフ内の変異を含み、目的ポリペプチドに融合され、ジッパー配列および抗−ジッパー配列が存在する場合は、ジッパー配列は抗−ジッパー配列にハイブリダイズし、抗−ステッチ配列のNNANNは、ステッチ配列のNNUNNと相補でありハイブリダイズし、スペーサー配列は、標的DNA上のプロトスペーサー隣接モチーフ(PAM)に隣接する標的DNAにハイブリダイズし、それにより、標的DNAに対するCRISPR核酸分子のスペーサー配列のハイブリダイゼーションにより規定される領域内で、標的DNAに対する目的ポリペプチドの部位特異的ターゲッティングをもたらす。
一部の実施態様では、tracr核酸分子およびaCRISPR核酸分子の抗−ジッパーおよびジッパー配列または第一のヌクレオチド配列および第二のヌクレオチド配列がハイブリダイズする場合、ハイブリダイズした配列は、場合により、バルジ配列に対して遠位であるハイブリダイズした配列の末端にさらなるヌクレオチドをさらに含むことができ、それにより、ハイブリダイズしたジッパーおよび抗−ジッパー配列を連結する。連結ヌクレオチドは、任意のヌクレオチド(例えば、T、A、G、C)であり得て、ジッパーおよび抗−ジッパー配列またはバルジ配列を連結するヌクレオチドの数は、約3〜約7個であり得る。
制限されないが配列番号1〜53を含む、任意の野生型、突然変異型、コドン最適化Cas9ヌクレアーゼ、または、本明細書に記載の少なくとも1つの核局在化配列を含むものは、本発明の方法で用いることができる。
本明細書においてさらに提供されるのは、本発明の核酸構築物、核酸アレイ、核酸分子および/またはヌクレオチド配列を含む、発現カセットおよびベクターであり、本開示の方法で用いることができる。
さらなる態様では、本発明の核酸構築物、核酸アレイ、核酸分子、および/またはヌクレオチド配列は、宿主生物の細胞に導入することができる。本発明が有用である任意の細胞/宿主生物を用いることができる。例示的な宿主生物は、限定されないが、植物、細菌、古細菌、菌類、動物、哺乳類、昆虫、鳥類、魚類、両生類、刺胞動物、ヒト、または非ヒト霊長類を含む。特定の実施態様では、宿主生物は、制限されないが、Homo sapiens、Drosophila melanogaster、Mus musculus、Rattus norvegicus、Caenorhabditis elegans、Saccharomyces pombe、Saccharomyces cerevisiae、Glycine max、Zeae maydis、Gossypium hirsutum、または、Arabidopsis thalianaであってよい。さらなる実施態様では、本発明で有用な細胞は、制限されないが、幹細胞、体細胞、生殖細胞、植物細胞、動物細胞、細菌性細胞、古細菌細胞、真菌細胞、哺乳類細胞、昆虫細胞、鳥類細胞、魚類細胞、両生類細胞、刺胞動物細胞、ヒト細胞、または非ヒト霊長類細胞であってよい。他の実施態様では、本発明で有用な細胞は、制限されないが、Homo sapiens、Drosophila melanogaster、Mus musculus、Rattus norvegicus、Caenorhabditis elegans、Saccharomyces pombe、Saccharomyces cerevisiae、Glycine max、Zeae maydis、Gossypium hirsutum、または、Arabidopsis thaliana由来の細胞を含む。
本発明のさらなる態様では、目的ポリペプチドは、制限されないが、ヘリカーゼ、ヌクレアーゼ、メチルトランスフェラーゼ、ジャイレース、デメチラーゼ、キナーゼ、ジスムターゼ、インテグラーゼ、トランスポゼース、テロメラーゼ、リコンビナーゼ、アセチルトランスフェラーゼ、デアセチラーゼ、ポリメラーゼ、ホスファターゼ、リガーゼ、ユビキシンリガーゼ、ホトリアーゼまたはグリコシラーゼを含んでよい。本発明の他の態様では、目的ポリペプチドは、脱プリン活性、酸化活性、ピリミジンダイマー形成活性、アルキル化活性、DNA修復活性、DNA損傷活性、脱ユビキチン化活性、アデニル化活性、脱アデニル化活性 SUMO化活性、脱SUMO化活性、リボシル化活性、脱リボシル化活性、ミリストイル化活性、脱ミリストイル化活性またはテロメア修復活性、または脱アミノ化活性を有する。代表的な実施態様では、目的ポリペプチドは、キナーゼ活性、ヌクレアーゼ活性、メチルトランスフェラーゼ活性、デメチラーゼ活性、アセチルトランスフェラーゼ活性、デアセチラーゼ活性、ホスファターゼ活性、ユビキシンリガーゼ活性、脱ユビキチン化活性、またはテロメア修復活性を有するポリペプチドであってよい。
本発明の核酸構築物、核酸分子、および/またはヌクレオチド配列を含むキットが、本明細書においてさらに提供される。
したがって、一態様では、二本鎖DNAの部位特異的切断のためのキットが提供され、そのキットは、本発明の合成tracr核酸構築物、合成CRISPR核酸構築物、CRISPR核酸アレイまたはキメラ核酸構築物を含む。別の態様では、二本鎖(ds)標的DNAに対する目的ポリペプチドの部位特異的ターゲッティングのためのキットが提供され、そのキットは、本発明の合成tracr核酸構築物、合成CRISPR核酸構築物、CRISPR核酸アレイまたはキメラ核酸構築物を含む。一部の態様では、キットは、1つまたは複数の発現カセットに包含された、本発明の合成tracr核酸構築物、合成CRISPR核酸構築物、CRISPR核酸アレイおよび/またはキメラ核酸構築物を含んでよい。またさらなる態様では、キットは、本明細書に記載の本発明の核酸構築物、核酸アレイ、核酸分子、および/またはヌクレオチド配列で用いるためのCas9ヌクレアーゼ(例えば、配列番号1〜53)をさらに含んでよい。
さらなる態様では、キットはプライマーを含んでよく、前記プライマーは、両方向にCRISPRリピート配列の一部を含む。他の実施態様では、キットは、CRISPRアレイの境界(すなわち一方のリーダーエンドともう片方のトレーラーエンド)を含んで両方向にCRISPRリピート配列を通って伸長するように設計された、プライマーを含んでよい。
さらなる実施態様では、キットは、使用のための説明書をさらに含んでよい。
ここで本発明は、以下の実施例を参照して説明される。これらの実施例は本発明に対する請求項の範囲を限定することを意図しないが、特定の実施態様の例示であることが意図されることが、理解されるべきである。当業者が想到する例示された方法における任意の変更は、本発明の範囲内であることが意図される。
実施例1.ガイド配列内に同定されたモジュールの機能的役割の評価
Clustered regularly interspaced short palindromic repeat(CRISPR)および関連するCasタンパク質は、細菌および古細菌において侵襲性遺伝因子に対する適応免疫を与える1。II型CRISPR−Casシステムでは、シグネチャRNAにガイドされるエンドヌクレアーゼCas9は、CRISPRスペーサーに相補な配列を特異的に標的化し、2つのニッカーゼドメインを用いた二本鎖DNA切断(DSB)を生じさせる(Makarova,K.S.et al.Nat Rev Microbiol 9,467−477(2011);Garneau,J.E.et al.Nature 468,67−71(2010);Sapranauskas,R.et al.Nucleic Acids Res 39,9275−9282(2011);Gasiunas,G.et al.Proc Natl Acad Sci US A 109,E2579−E2586(2012);Jinek,M.et al.,Science 337,816−821(2012))。Cas9−特異的プロトスペーサー−隣接モチーフ(PAM)が隣接している限り、任意のDNA配列が標的とされ得る。Garneau,J.E.et al.Nature 468,67−71(2010);Sapranauskas,R.et al.Nucleic Acids Res 39,9275−9282(2011);Gasiunas,G.et al.Proc Natl Acad Sci US A 109,E2579−E2586(2012);Jinek,M.et al.,Science 337,816−821(2012);Sternberg,S.H.et al.Nature 507,62(2014))。Cas9システムによるターゲッティングおよび切断は、CRISPR RNA(crRNA)およびトランス活性化crRNA(tracrRNA)からなるRNAデュプレックスに依拠する8。この天然の複合体は、crRNA:tracrRNAデュプレックスをミミックする合成のシングルガイドRNA(sgRNA)キメラにより置き換えることができる(Jinek,M.et al.,Science 337,816−821(2012))。Cas9と組み合わせたsgRNAは、エンジニアリングおよび工業上および翻訳上興味深い様々なモデルシステムへの異種移行に適した、便利で、コンパクトで、そしてポータブルな、配列−特異的なターゲッティングシステムを作る。
したがって、二本鎖切断(DSB)を生じさせるためのコンパクトで実践的な手段を提供するCas9:sgRNA技術は、革命的なゲノム編成を有し(Mali,P.et al.,Science 339,823−826(2013);Cong,L.et al.Science 339,819−823(2013);Jiang,W.et al.Nat.Biotechnol.31,233−239(2013);Sander,J.D.&Joung,J.K.Nature Biotechnol.32,347−355.(2014))、ハイスループットのゲノム全域にわたる遺伝子スクリーニングに新しい道を切り開き13,14、転写調節のツールボックスを拡張した(Qi,L.S.et al.Cell 152,1173−1183(2013);Gilbert,L.A.et al.Cell 154,442−451(2013))。さらに、進化的に離れたCas9:sgRNAの間の相互作用の不存在は(Chylinski,K.et al.RNA biology 10,726−737(2013);Fonfara,I.et al.Nucleic Acids Res(2013);Esvelt,K.M.et al.Nature Methods(2013))、共存する機能性II型CRISPR−Casシステムが同時に機能する場合、多重の非依存性ターゲッティングが細胞内で達成されるのを可能にした(Barrangou,R.et al.Science 315,1709−1712(2007);Horvath,P.et al.J Bacteriol.190,1401−1412(2008))。これらの分子機構の広範な使用にかかわらず、sgRNAガイドの重大な特性、および、機能的にオルソロガスなCas9エンドヌクレアーゼの定義におけるそれらの関与は、特徴付けが未だされていない。実際に、Cas9ターゲッティングおよび切断の初期の注目は、スペーサー:標的相補性およびPAM配列感度に焦点が当てられ、一方で、Cas9:sgRNA相互作用を駆動する因子およびII型CRISPR−Casシステム間の直交性を指示する因子を定義する情報は不足したままである。したがって、我々は、CRISPR技術に関する新しいエンジニアリングの道を切り開くために、Cas9ターゲッティングおよび切断特異性を与えるsgRNA内の特性を同定および特徴付けに着手した。
したがって、本明細書に記載のガイド配列内に同定された様々なモジュール(例えば、合成tracr核酸構築物、合成CRISPR核酸構築物、キメラ核酸構築物(tracr核酸−合成CRISPR核酸構築物)の機能的役割および意味合い(implication)を評価するために、我々は、前述の機能性モジュールのそれぞれの改変または欠失を含む、ガイドの突然変異の変異体を設計した。我々は、代表的な機能性モデルとしてSthCRISPR3システムを選択し、天然のガイド配列を用いてポジティブの機能性コントロール(野生型、WT)を最初に確立した。それから我々は、ステッチが欠失した「ステッチ」変異体を試験し、機能の損失を観察した。それから、バルジが欠失した「バルジ」変異体を試験し、機能の損失を観察した。それから我々は、ネクサスが欠失した「ネクサス」変異体を試験し、機能の損失を観察した。それから我々は、第一のヘアピンが欠失した「ヘアピン」変異体を試験し、機能の損失を観察した。続いて我々は、配列特異性および可変性感受性を試験し、突然変異の構築物において、ネクサスの配列は特異的であり、一方で他の機能性モジュール、とりわけジッパー、バルジ、ヘアピンおよびステッチに関しては可変性許容性があることを確立した。これらの実験の結果を図1〜21に示す。
したがって、図1は、ネクサスモジュールに関する多重配列アライメントを示し、図2は、本研究を通して開発されたネクサスモジュールに関する最大尤度ツリーを提供する。図3A〜図3Dは、Sth Cr1グループ(図3A)、Sth Cr3グループ(図3B)、Lrhグループ(図3C)およびLbuグループ(図3D)のネクサスモジュールに関するコンセンサス配列を示す。
図5は、抗−ステッチモジュールに関する多重配列アライメントを示し、一方で、図6A〜図6Dは、Sth Cr1グループ(図6A)、Sth Cr3グループ(図6B)、Lrhグループ(図6C)およびLbuグループ(図6D)の抗−ステッチモジュールに関するコンセンサス配列を示す。
同様に、バルジモジュールに関する多重配列アライメントが図7に提供され、Sth Cr1グループのバルジモジュールに関するコンセンサス配列が図8Aに示される。図8Bは、Sth Cr3グループのバルジモジュールに関するコンセンサス配列を示す。図8Cは、Lrhグループのコンセンサス配列を示し、図8Dは、Lbuグループのバルジモジュールに関するコンセンサス配列を示す。
ジッパーモジュールに関する多重配列アライメントが図9に示され、図10は、ジッパーモジュールに関する最大尤度ツリーを示す。
図11は、バルジ、抗−ステッチおよびネクサスモジュールに関する多重配列アライメントを示す。図4は、Cas9ヌクレアーゼに関する最大尤度ツリーを示す。
図12〜図21は、様々なcRNA:tracRNA構築物に関するガイド配列およびターゲッティングを示し、Sth CR1グループを表すStreptococcus thermophilus CR3(図12);Lbuグループを表すLactobacillus buchneri(図13);Sth CR1グループを表すStreptococcus thermophilus CR1(図14);Sth CR3グループを表すStreptococcus pyrogenes M1 GAS(図15);Lrhグループを表すLactobacillus rhamnosus(図16);Lanグループを表すLactobacillus animalis(図17);Lcaグループを表すLactobacillus casei(図18);Lgaグループを表すLactobacillus gasseri(図19);Ljeグループを表すLactobacillus jensenii(図20);および、Lpeグループを表すLactobacillus pentosusを含む(図21)。図12〜図21のそれぞれの下側は、標的配列(オープン構造)および隣接する(3’)PAMを含む、標的dsDNAを表す。各図の上側は、標的配列に相補の5’部分、およびCRISPRリピートに由来する3’部分からなる、CRISPR RNA(crRNA)を表し;そしてまた、抗−CRISPRリピート部分からなるtracrRNA、および、ネクサスおよび3’ヘアピンも示す。図12〜図21のそれぞれに示されるように、crRNA:tracrRNAデュプレックスの相補部分は、下側ステム(下の相補部分)、バルジ(ヘルニアミスマッチ(herniated mismatch))および上側ステム(上の相補部分)からなる。
実施例2.様々なさらなるII型システムにおける、ガイドRNA配列の特性の決定
実施例1で説明した知見は、Streptococcus pyrogenes Cas9(SpyCas9)活性をサポートするために必要なsgRNAでの重要なモジュールを確立する。しかしながら、ゲノム編成に幅広く用いられるが、SpyCas9は、天然に見いだされた多くのCas9オルソロガス(orthologs)の単なる1つにすぎない(Chylinski,K.et al.RNA biology 10,726−737(2013);Fonfara,I.et al.Nucleic Acids Res(2013))。したがって、我々は次に、同じsgRNA配列の特性が、他のII型CRISPR−Casシステムでも生じるかどうかを研究した。我々は、StreptococcusおよびLactobacillusゲノム(II型システムが優先的に生じる2)から41個のCas9配列をサンプリングし、それらの対応するCRISPRリピートを同定し、tracrRNA配列を予測した。Cas9タンパク質配列は、3つの主な配列グループにクラスタリングされた(図23)。期待したとおり、似たグループ化が、CRISPR−リピートまたは予測tracrRNA配列のいずれかを用いてクラスタリングを行なった場合に見られ(図24A、図23、図25、図26)、tracrRNA内の抗−CRISPRリピートの存在、およびCas9およびcrRNA:tracrRNAのペアの間の関係深い分子関係を与えた(Makarova,K.S.et al.Nat Rev Microbiol 9,467−477(2011);Deltcheva,E.et al.Nature 471,602−607(2011);Fonfara,I.et al.Nucleic Acids Res(2013))。tracrRNA配列内に、我々は一貫して、SpyCas9に関して同定された機能性モジュールを観察し(図24B)、ファミリー間の全体的なsgRNA/crRNA:tracrRNA構造は保存されていて、クラスター内で高レベルに配列が保存されていた。
下側ステム(すなわちステッチ/抗−ステッチ)と上側ステム(すなわちジッパー/抗−ジッパー)との間に方向のねじれを有するバルジの存在が、システムの多様性にわたって一貫して見られた。下側ステムの長さは、ファミリー内で高度に保存され、および、ファミリー間で可変であった。興味深いことに、最も高いレベルの保存はネクサス配列に関して見られた(図24B、図27)。GC−リッチのステムおよびオフセットのウラシルを有する、全般的なネクサスの形状は、2つのStreptococcusファミリー間で共有されていた。対照的に、独特な二重ステムのネクサス(図24A〜B)は、Lactobacillusシステムに特有で遍在した。意外なことに、ネクサス内のいくつかの塩基は、A52およびC55を含む異なるファミリー間でさえ厳密に保存されていて(図24A〜B)、このモジュールの重大な役割をさらに強調した。実際に、A52は、SpyCas9の結晶構造において、標的鎖の5’末端付近の残基1103−1107の主鎖と相互作用し、タンパク質主鎖とネクサスの相互作用がPAM結合に必要であり得ることを示唆する。
Cas9タンパク質の直交性に対する、ガイドRNAの構造の関係の決定。本明細書に記載の知見は、sgRNAの配列と構造の間の潜在的関係およびCas9タンパク質の多様性を示唆する。この観察は、Cas9オルソロガスのグループを定義するsgRNAモジュールを決定することを我々に駆り立てた。したがって、我々は、2つの天然に共存するオルソロガスのS.thermophilus II型システム、すなわちSth1 Cas9およびSth3 Cas9由来のエンドヌクレアーゼを選択し(Horvath,P.et al.J Bacteriol.190,1401−1412(2008))、sgRNA組成物とCas9直交性との間の関連を調べた。一連の実験は、Escherichia coliでの自己ターゲッティング活性に基づいて設計され(図28A〜B)、sgRNA内の特異的な変異が、オルソロガスであった(previously orthologous)Cas9での切断活性を促進することができるかどうか試験した。我々は、Sth1Cas9およびSth3Cas9システムに関してオーバーラップするCas9標的部位を含むE.coliゲノム内の領域を同定し、切断が1ヌクレオチドにおいて生じること(図29B)、および、PAM配列が好適にオーバーラップすることを確認した。我々は、2つのsgRNA主鎖のキメラバージョンを製造し、スペーサー、下側ステム(すなわちステッチ/抗ステッチ)−バルジ−上側ステム(すなわちジッパー/抗−ジッパー)、ネクサスおよびヘアピンを交換し(図29C)、および、Sth1Cas9またはSth3Cas9のいずれかにより、自己ターゲッティングを駆動する(Gomaa,A.A.et al.MBio.5,e00928−13(2014))、それらの能力を試験した。初めに我々は、これらの2つのシステムが、このアッセイシステムにおいて実際に直交性であること、および、各ガイドは単独でその同起源Cas9でのターゲッティングを駆動すること(図29C)を確認した。次に我々は、スペーサー配列の交換は、Sth1Cas9切断活性をサポートすることが可能な、CRISPR3スペーサーおよびCRISPR1主鎖を有するsgRNAをもたらすことを示した。しかしながら、Sth3Cas9活性について逆は成り立たない。CRISPR1スペーサーおよびCRISPR3主鎖を含むsgRNAは、Sth3Cas9活性をサポートしない(図29C)。我々は、この一方向性の相互機能性は、SthCRISPR1システムにおけるプロトスペーサーとPAMとの間の空間に関する要件の柔軟性に起因すると仮定する(Chen et al.J.Biol.Chem.doi:10.1074/jbc.M113.539726.(2014))(図29C、上パネル)。それから我々は、sgRNAとCas9との間の機能性は、2つの直交性システム間でネクサス−ヘアピンの組み合わせを交換するだけで変更することができることを示した。sgRNAの再プログラミングの主な結果は、オリジナルのCas9をガイドする能力がそのプロセスで失われることである(図29C、下パネル)。これは、CRISPRリピート配列がオルソロガスのCRISPR−Casシステムの定義において重要な役割を果たすという標準的な考えと対照的である。しかしながら、これらの結果は、変更されたネクサス配列を有するキメラsgRNAが、予測可能および一方向性の方法で直交性を再プログラムすることができることを示し、異なるPAMと関連する直交性Cas9タンパク質をさらに利用するために重大である(Esvelt,K.M.et al.Nature Methods(2013)))。
最近の構造的および生化学的データは、Cas9によるDNA認識および切断のメカニズムに光を放ち始めている(Jinek,M.et al.,Science 337,816−821(2012);Jinek,M.et al.,Science 343,6176(2014);Nishimasu,H.et al.Cell 156,935(2014))。apo−、RNA−結合およびタンパク質/RNA/DNA複合体の電子顕微鏡写真は、ガイドRNAと結合する際に、Cas9は、劇的な立体構造変化を受けて、標的DNA結合および切断の構造を促進することを示した(Jinek,M.et al.,Science 343,6176(2014)。結晶構造は、電子顕微鏡による画像と矛盾せずに、SpyCas9:sgRNA:DNA:複合体およびapo−SpyCas9は、RNA−およびDNA−結合ドメインの実質的な再編成が2つの構造間で行なわれて、著しく異なる構造を占めることを示す(Jinek,M.et al.,Science 343,6176(2014);Nishimasu,H.et al.Cell 156,935(2014))。ネクサスは、SpyCas9−sgRNA:DNA複合体において重大な位置を占め、タンパク質およびsgRNAの多くの重要な構成要素を整合し、タンパク質およびRNAの両方を適切に配置して、切断のための標的DNAデュプレックスを受け取る。sgRNA:DNAと結合する際に、アルギニン−リッチのブリッジヘリックスが、ネクサスの塩基および下側ステムに結合する。加えて、ネクサスは、SpyCas9の2つのローブ(lobe)由来の2つの小さな領域(我々は、Nexus Interacting Region 1(NIR1)446−497、および、Nexus Interacting Region 2(NIR2)1105−1138として確立することを提案する)と相互作用する。これらの領域の両方ともapoSpyCas9構造内で無秩序であり、とりわけ、PAM認識21において重要であるとして特定される2つのトリプトファン残基を含む。また、NIR2は、下側ステムとも直接相互作用し、ネクサス−結合部位と反対の面は、標的鎖の3’末端にごく接近して存在し、ネクサスとの相互作用が、PAM認識部位を整えるために必要であり得ることを示唆する。とりわけ、Actinomyces naeslundii Cas9(AnaCas9)apo−構造(Jinek,M.et al.,Science 343,6176(2014))では、NIR2が整えられ、約50個のアミノ酸の挿入を含む。AnaCas9が、より大きいネクサス(および場合によりPAM配列を伴う)を認識し得ると考える動機がある。
しかしながら、これらの結果は、ガイドRNA内に6個の異なる特徴があることを明らかにし、バルジおよびネクサスを、Cas9ターゲッティングおよび切断をガイドする、構造−および配列−特異的な特性として確立する。これは、sgRNA組成物の最適化のための基礎、および、先天性の免疫応答を潜在的に引き起こす二本鎖RNAのより小さな領域を含みアデノ−関連のウイルスなどへのパッケージングにより適している短い最小のガイドRNAを設計するチャンスのあるデザインを提供する。II型CRISPR−Casシステムに関するこの理解は、Briner et al.(Mol.Cell 56:333−339(2014))およびNishimasu et al.(Cell 156:935−949(2014)により裏付けられ、配列の改変は、改変された配列がCas9をガイドする能力に影響することが示されている。注目すべきことに、これらの研究は、ガイド内のネクサス配列が、相補DNAへ向かってCas9をガイドすること、およびその後の切断に、重大であることを確認する。
改変ネクサス配列を有するキメラsgRNAを用いてCas9直交性を再プログラムする能力は、天然のCas9オルソロガス(orthologs)の多様性を利用する潜在力を有する新規のCas9タンパク質の開発のための新しい道を切り開き、便利なパッケージングおよび送達のための短いCas9変異体を含む。加えて、キメラmgRNAを用いてCas9を再プログラムする能力は、標的頻度(target frequency)の柔軟な管理(短いPAMが頻発する)およびオフターゲットの切断の減少による特異性(より長いPAMが稀に発生する)のための、様々なPAMの増大した用途を可能にするであろう。またこれは、様々なキメラガイドとともに単一のCas9を使用することにより、または、スタンダードまたはキメラsgRNAの異なる組み合わせとともに直交性システムを同時に使用することにより、多重の機会を広げる。まとめると、我々の知見は、Cas9−依存性DNAターゲッティングのための新しい道を切り開き、および、次世代のCRISPRに基づく技術の開発のためのステージをセットする。
実施例3。
CRISPR1座およびCRISPR3座由来のcas9遺伝子を、S.thermophilus LMD−9由来のゲノムDNAからPCR増幅し、pwtCas9−細菌にクローニングした(Addgene #44250))(Qi,L.S. et al.Cell 152,1173−1183(2013))。sgRNA−発現プラスミドを構築するために、pdCas9−細菌プラスミド(Addgene #44249)(Id.)内のSpeI制限部位を除去し、CRISPR1またはCRISPR3座に基づくzraP−ターゲッティングsgRNAをコードするgBlock(IDT)を、pgRNA−細菌プラスミド(Addgene#44251)(Id.)のPCR−増幅された主鎖と組み合わせた。形質転換分析のためにE.coli K−12を用いて、形質転換効率は、以前に説明されるとおりに(Gomaa,A.A.et al.MBio.5,e00928−13(2014))、試験されたsgRNAプラスミドに関する形質転換体の数を、psgRNA−C1−T4コントロールプラスミドに関する形質転換体の数で割ることにより計算した。
プラスミド構築。Cas9−発現プラスミドを構築するために、CRISPR1座(Sth1−Cas9)およびCRISPR3座(Sth3−Cas9)由来のCas9遺伝子を、S.thermophilus LMD−9から抽出されたゲノムDNAからPCR増幅した。各PCR産物を、ギブソンアセンブリーによって、pwtCas9−細菌(Addgene #44250)(Qi,L.S.et al.Cell 152,1173−1183(2013))のPCR−増幅された主鎖と組み合わせた。sgRNA−発現プラスミドを構築するために、プラスミドをSpeIで消化することによりpdCas9−細菌プラスミド(Addgene#44249)(Id.)内のSpeI制限部位を除去し、平滑末端化し、再ライゲーションしてpdCas9ΔSpeIプラスミドを生産した。別個に、S.thermophilus LMD−9内のCRISPR1(C1)座またはCRISPR3(C3)座に基づくzraP−ターゲッティングsgRNAをコードするgBlock(IDT)を、ギブソンアセンブリーによって、pgRNA−細菌プラスミド(Addgene #44251)(Id.)のPCR−増幅された主鎖と組み合わせ、それにより、オリジナルのS.pyogenes sgRNA配列を、設計したsgRNA配列で置き換えた。それから、生じたsgRNAプラスミドおよびpdCas9ΔSpeI主鎖をAatIIおよびXhoIで消化し、各sgRNAプラスミドおよびpdCas9ΔSpeIプラスミドのゲル−抽出フラグメントを一緒にライゲーションして、psgRNA−SthC1およびpsgRNA−SthC3を形成した。sgRNA配列を改変するために、5’リン酸化オリゴヌクレオチドを、psgRNA−C1プラスミドまたはpsgRNA−C3プラスミドのSpeI/KpnIまたはKpnI/HindIII部位にアニールさせてライゲーションした。全てのプラスミド改変をシーケンシングにより確認した。
株および増殖条件。E.coli K−12 subst.MG1655(遺伝子型:E.coli K−12 F λ− ilvG− rfb−5C rph−1)を、全ての形質転換分析に用いた。株は、別段の指示がない限り、LB培地(10g/Lトリプトン、5g/L酵母抽出物、10g/L塩化ナトリウム)中、37℃および250RPMで好気的に増殖させた。培地は、必要に応じて抗生物質(34μg/mlのクロラムフェニコール、50μg/mlアンピシリン)で補充した。
形質転換アッセイ。示された(indicated)Cas9−発現プラスミドを保有する細胞の冷凍ストックを、単離のためにストリークして、個々のコロニーを3mlのLB培地に植菌して一晩培養した。生じた培養物を45mlのLB培地に逆希釈し(back−dilute)、Nanodrop 2000c分光光度計(Thermo Scientific)で測定してABS600が0.6〜0.8になるまで増殖させた。それから、培養物をピペッティングして、200〜400μlの10%グリセロールに再懸濁する前に、氷冷10%グリセロールで2回洗浄した。懸濁された細胞(50μl)を、MicroPulser Electroporator(BioRad)を用いて、25ngの示されたsgRNA−発現プラスミドで形質転換し、300μlのSOC培地(Quality Biological)中で、1時間回復させた。回復後、異なる量のLB培地を含む200μlの培養物を、100ng/mlのアンヒドロテトラサイクリンを含むLB寒天上にプレーティングした。形質転換効率は、以前に説明されるように(Gomaa,A.A.et al.MBio. 5,e00928−13(2014))、試験されたDgRNAプラスミドに関する形質転換体の数をpsgRNA−C1−T4コントロールプラスミドに関する形質転換体の数で割ることにより計算した。形質転換効率の実験間のばらつきを減らすために、試験されたsgRNAプラスミドおよびコントロールプラスミドを、同一バッチのエレクトロコンピテント細胞に形質転換した。同様に、図30〜図32に関して、形質転換分析を用いて、活性のCRISPR−Casシステムを保有するLactobacillus株にプラスミドがエレクトロポレーションされる能力を試験した(Lbu−Lactobacillus buchneri、図30;Lrh−Lactobacillus rhamnosus、図32;Lca−Lactobacillus casei、図31。プラスミドは、宿主のCRISPR座内の最初のスペーサー配列と同一のプロトスペーサー配列を含むように設計した。完全なPAMでプロトスペーサーと隣接するように、様々なプラスミドを設計した(Lgaに関してNTAAC;Lcaに関してNNGAA;Lrhに関してNGAAA;PAM領域は、図30〜図32で下線がされたヌクレオチド、およびそれらの突然変異した変異体(効率が試験されたヌクレオチドはイタリック体である)。また、実験は、コントロールの非−ターゲッティング配列(図30〜図32に示す各実験に関して最後から2番目のエントリー(entry)、および、標的配列がないコントロールプラスミド(図30〜図32に示す各実験に関して最後のエントリーも含んだ。天然のCRISPR−CasシステムがDNAターゲッティングによるプラスミド取り込みを妨げる能力は、試験配列および2つの前述のコントロールの間の形質転換効率の違いとして測定される。