引用される全ての特許文献および非特許文献の開示は、参照によってその全体が本明細書に組み込まれる。
本明細書中で用いられる用語「本発明」または「開示される本発明」は、限定することが意味されるのではなく、全般的に、特許請求の範囲において定義される、または本明細書中に記載されるあらゆる発明に当てはまる。これらの用語は、本明細書中で互換的に用いられる。
本明細書中の用語「非従来型酵母」は、サッカロミセス(Saccharomyces)属酵母種(例えば出芽酵母(S.cerevisiae))でもシゾサッカロミセス(Schizosaccharomyces)属酵母種でもないあらゆる酵母を指す。非従来型酵母は、Non−Conventional Yeasts in Genetics,Biochemistry and Biotechnology:Practical Protocols(K.Wolf,K.D.Breunig,G.Barth,Eds.,Springer−Verlag,Berlin,Germany,2003)に記載されており、この文献は参照によって本明細書に組み込まれる。ある実施形態における非従来型酵母は追加的に(または代わりに)、相同組換え(HR)によって媒介される修復プロセスに対して、非相同末端結合(NHEJ)DNA修復プロセスを優先する酵母であってよい。当該ライン(HRに勝るNHEJの優先度)に沿う非従来型酵母の定義が、Chen et al.(PLoS ONE 8:e57952)によってさらに開示されており、この文献は参照によって本明細書に組み込まれる。本明細書中で好ましい非従来型酵母が、ヤロウイア(Yarrowia)属のもの(例えば酵母(Yarrowia lipolytica))である。本明細書中の用語「酵母」は、主に単細胞の形態で存在する菌類の種を指す。酵母は代わりに、本明細書中で「酵母細胞」と呼ぶことができる。
本明細書中の用語「RNA誘導型エンドヌクレアーゼ」(RGEN)は、少なくとも1つのCRISPR(クラスター化された、等間隔にスペーサが入った、短い回文リピート)結合(Cas)タンパク質および少なくとも1つのRNA構成要素を含む複合体を指す。簡潔に、RGENのRNA構成要素は、標的部位配列においてDNA配列と相補的である配列を含有する。この相補性に基づいて、RGENは、特定のDNA標的部位配列を特異的に認識し、かつ切断することができる。本明細書中でRGENは、4つの既知のCRISPR系(Horvath and Barrangou,Science 327:167−170)、例えばI型、II型、またはIII型CRISPR系のいずれかのCasタンパク質および適切なRNA構成要素を含んでよい。好ましい実施形態におけるRGENは、Cas9エンドヌクレアーゼ(CRISPR II系)および少なくとも1つのRNA構成要素(例えば、crRNAおよびtracrRNA、またはgRNA)を含む。
用語「CRISPR」(クラスター化された、等間隔にスペーサが入った、短い回文リピート)は、例えば、外来DNAを破壊するために細菌細胞および古細菌細胞によって用いられる、クラスI、IIまたはIII DNA切断系の因子をコードする特定の遺伝子座を指す(Horvath and Barrangou,Science 327:167−170)。CRISPR系の構成要素は、本明細書中で、非従来型酵母細胞におけるDNAターゲティングに利用される。
用語「II型CRISPR系」および「II型CRISPR−Cas系」は、本明細書中で互換的に用いられ、Cas9エンドヌクレアーゼを、少なくとも1つのRNA構成要素と複合させて利用するDNA切断系を指す。例えば、Cas9は、CRISPR RNA(crRNA)およびトランス活性化CRISPR RNA(tracrRNA)と複合させることができる。別の例において、Cas9は、ガイドRNAと複合させることができる。ゆえに、crRNA、tracrRNA、およびガイドRNAは、本明細書中で、RNA構成要素の非限定的な例である。
用語CRISPR関連(「Cas」)エンドヌクレアーゼは、本明細書中で、Cas遺伝子によってコードされるCasタンパク質を指す。Casエンドヌクレアーゼは、適切なRNA構成要素と複合すると、ある実施形態において、特定のDNA標的配列の全て、または一部を切断することができる。例えば、特定のDNA標的配列中に一本鎖切断または二本鎖切断を導入することができる;これ以外にも、特定のDNA標的配列の一方の鎖または双方の鎖を切断することができると特徴付けられ得る。Casエンドヌクレアーゼは、Casと複合したcrRNAまたはガイドRNAによる標的配列の認識によって媒介されて、標的配列にてDNA二重鎖を解いて、少なくとも一本のDNA鎖を切断する。Casエンドヌクレアーゼによる標的配列のそのような認識およびカットは典型的には、正確なプロトスペーサ隣接モチーフ(PAM)が、DNA標的配列の3’末端に位置決めされれば、またはDNA標的配列の3’末端に隣接すれば、生じる。これ以外にも、Casタンパク質は、本明細書中で、適切なRNA構成要素と複合化する場合、DNA切断活性またはニッキング活性を欠くかもしれないが、DNA標的配列に依然として特異的に結合することができる。好ましいCasタンパク質は、本明細書において、Cas9である。
「Cas9」(以前はCas5、Csn1、またはCsx12と呼ばれた)は、本明細書中で、crRNAおよびtracrRNAとの、またはガイドRNAとの複合体を形成して、DNA標的配列の全てまたは一部を特異的に認識して切断する、II型CRISPR系のCasエンドヌクレアーゼを指す。Cas9タンパク質は、RuvCヌクレアーゼドメイン、およびHNH(H−N−H)ヌクレアーゼドメインを含み、これらはそれぞれ、標的配列にて一本鎖DNAを切断する(双方のドメインが協調して作用すると、DNA二本鎖が切断されるが、一方のドメインの活性ではニックに至る)。一般に、RuvCドメインは、サブドメインI、II、およびIIIを含み、ドメインIは、Cas9のN末端近くに位置決めされ、そしてサブドメインIIおよびIIIは、タンパク質の中央に位置決めされて、HNHドメインにフランキングする(Hsu et al,Cell 157:1262−1278)。「Apo−Cas9」は、RNA構成要素と複合化しないCas9を指す。Apo−Cas9は、DNAに結合することができるが、非特異的であり、そしてDNAを切断することができない(Sternberg et al.,Nature 507:62−67)。
一部の実施形態において、Casエンドヌクレアーゼは、Cas9ポリペプチドの修飾型を含んでよい。Cas9ポリペプチドの修飾型は、Cas9タンパク質の自然に生じるヌクレアーゼ活性を引き下げるアミノ酸変化(例えば、欠失、挿入、または置換)を含んでよい。例えば、一部の例において、Cas9タンパク質の修飾型は、対応する野生型のCas9ポリペプチドのヌクレアーゼ活性が、50%未満、40%未満、30%未満、20%未満、10%未満、5%未満、または1%未満である(米国特許出願公開第20140068797 A1号明細書、2014年3月6日公開)。場合によっては、Cas9ポリペプチドの修飾型は、実質的なヌクレアーゼ活性を有しておらず、触媒的に「不活化されたCas9」または、「非活性化されたcas9(dCas9)」と呼ばれる。触媒的に不活化されたCas9変異体として、HNHヌクレアーゼドメインおよびRuvCヌクレアーゼドメイン中に突然変異を含有するCas9変異体が挙げられる。これらの触媒的に不活化されたCas9変異体は、インビボで、sgRNAと相互作用して標的部位に結合することができるが、標的DNAのいずれの鎖も切断することができない。DNAに結合するが切断しないこの作用様式は、永続的な遺伝的変異を生じさせることなく、染色体中の特定の遺伝子座の発現を一時的に減少させるのに用いられ得る。
触媒的に不活性のCas9は、非相同配列に融合し得る(米特許出願公開第20140068797A1号明細書、2014年3月6日公開)。適切な融合パートナーとして、標的DNA、または標的DNAと関連するポリペプチド(例えば、ヒストンまたは他のDNA結合タンパク質)に直接作用することによって、転写を間接的に増進する活性を提供するポリペプチドが挙げられるが、これに限定されない。付加的な適切な融合パートナーとして、メチルトランスフェラーゼ活性、デメチラーゼ活性、アセチルトランスフェラーゼ活性、デアセチラーゼ活性、キナーゼ活性、ホスファターゼ活性、ユビキチンリガーゼ活性、脱ユビキチン化活性、アデニル化活性、脱アデニル化活性、SUMO化活性、脱SUMO化活性、リボシル化活性、脱リボシル化活性、ミリストイル化活性、または脱ミリストイル化活性を付与するポリペプチドが挙げられるが、これに限定されない。さらに適切な融合パートナーとして、標的核酸の転写の増進を直接実現するポリペプチド(例えば、転写活性化因子またはそのフラグメント、転写活性化因子、小分子/薬物反応性転写レギュレータその他を動員するタンパク質またはそのフラグメント)が挙げられるが、これに限定されない。触媒的に不活性のCas9はまた、FokIヌクレアーゼに融合して、二本鎖切断を生じさせることもできる(Guilinger et al.Nature biotechnology,volume 32,number 6,June 2014)。
本明細書中で用語「RNA構成要素」は、DNA標的配列の鎖と相補的なリボ核酸配列を含有するRGENのRNA構成要素を指す。この相補的な配列は、本明細書中で「ガイド配列」または「可変ターゲティングドメイン」配列と呼ぶ。本明細書中の適切なRNA構成要素の例として、crRNAおよびガイドRNAが挙げられる。また、本明細書中でRNA構成要素は、5’キャップを有していない。
用語「CRISPR RNA」(crRNA)は、本明細書中で、1つまたは複数のCasタンパク質(例えばCas9)との複合体を形成することができるRNA配列を指し、複合体にDNA結合特異性を付与する。crRNAは、DNA標的配列の鎖と相補的である「ガイド配列」(「可変ターゲティングドメイン」[VT])を含有するので、DNA結合特異性を付与する。crRNAはさらに、crRNAが由来するCRISPR遺伝子座のリピート領域によってコードされる「リピート配列」(「tracrRNAメイト配列」)を含む。crRNAのリピート配列は、tracrRNAの5’末端の配列にアニールすることができる。本来のCRISPR系におけるcrRNAは、CRISPR遺伝子座から転写される「プレcrRNA」に由来する。プレcrRNAは、スペーサ領域およびリピート領域を含む;スペーサ領域は、DNA標的部位配列と相補的なユニーク配列を含有する。本来の系におけるプレcrRNAは、複数の異なるcrRNAにプロセシングされ、それぞれがガイド配列、およびリピート配列の一部を有する。CRISPR系は、例えば、DNAターゲティング特異性のために、crRNAを利用する。
本明細書中で用語「トランス活性化CRISPR RNA(tracrRNA)」は、II型CRISPR系に用いられる非コードRNAを指し、5’から3’の方向に、(i)CRISPR II型crRNAのリピート領域とアニールする配列、および(ii)ステムループ含有部分を含有する(Deltcheva et al.,Nature 471:602−607)。
用語「ガイドRNA」(gRNA)および「単一ガイドRNA」(sgRNA)は、本明細書中で互換的に用いられる。gRNAは、本明細書中で、tracrRNAに機能可能なように結合するcrRNAを含有するキメラ配列を指し得る。これ以外にも、gRNAは、例えば、crRNAおよびtracrRNAの合成融合体を指し得る。Jinek et al.(Science 337:816−821)は、いくつかのgRNAの特徴を開示している。gRNAはまた、ガイド配列(可変ターゲティングドメイン)に続いてCasエンドヌクレアーゼ認識(CER)ドメインを有する観点からも特徴付けられ得る[国際公開第2015026883号パンフレット、2015年2月26日公開、米国特許出願公開第2015−0082478A1号明細書、2015年3月19日公開、および米国特許出願公開第2015−0059010A1号明細書、2015年2月26日公開。全てが参照によってその全体が本明細書に組み込まれる]。CERドメインは、tracrRNAメイト配列に続いてtracrRNA配列を含む。
用語「標的部位配列」、「標的部位」、「標的配列」、「標的DNA」、「DNA標的配列」、「標的遺伝子座」、「ゲノム標的部位」、「ゲノム標的配列」、「ゲノム標的遺伝子座」、および「プロトスペーサ」は、本明細書中で互換的に用いられる。標的部位配列は、本明細書中のRGENが認識し、結合し、場合によってはニックを入れ、または切断することができる、非従来酵母の染色体、エピソーム、またはゲノム中の他のあらゆるDNA分子上のポリヌクレオチド配列を指す。標的部位は、(i)酵母中の内在部位/在来部位であってもよいし、(ii)ゲノム中に自然に生じ得ない、酵母とは異種起源であってもよいし、(iii)本来生じる場所に対して非相同ゲノム位置に見出されてもよい。
本明細書中で標的部位配列は、長さが少なくとも13ヌクレオチドであり、そして、(ある実施形態において、適切なPAMが、標的配列に隣接するならば)(crRNAまたはgRNAの)ガイド配列とハイブリダイズすることができ、かつ標的配列にCasタンパク質またはCasタンパク質複合体を配列特異的に直接結合することができるほど十分な、ガイド配列との相補性がある鎖を有する。切断/ニック部位(エンドヌクレオチド結合分解性CasまたはニッキングCasが該当する)は、標的配列内であってもよいし(例えば、Cas9が用いられる)、切断/ニック部位は、標的配列外であってもよい(例えば、非相同エンドヌクレアーゼドメイン、例えばFokI酵素に由来するものに融合するCas9が用いられる)。
本明細書中で「人工標的部位」または「人工標的配列」は、非従来型酵母のゲノム中に導入された標的配列を指す。一部の実施形態における人工標的配列は、酵母のゲノム中の本来の標的配列と配列が同じでありながら、ゲノム中の異なる位置(非相同位置)に位置決めされてもよいし、酵母のゲノム中の同じ位置に位置決めされるならば本来の標的配列と異なってもよい。
本明細書中で「エピソーム」は、酵母細胞の染色体は別として、酵母細胞中に自律的に存在することができる(複製して娘細胞に進むことができる)DNA分子を指す。エピソームDNAは、在来であってもよいし、酵母細胞とは異種起源であってもよい。明細書中の在来エピソームの例として、ミトコンドリアDNA(mtDNA)が挙げられる。本明細書中の異種起源エピソームの例として、プラスミドおよび酵母人工染色体(YAC)が挙げられる。
本明細書中で「プロトスペーサ隣接モチーフ」(PAM)は、本明細書中のRGENによって認識される短い配列を指す。本明細書中でPAMの配列および長さは、用いられるCasタンパク質またはCasタンパク質複合体に応じて異なってよいが、典型的には、例えば、2、3、4、5、6、7、または8ヌクレオチド長である。
用語「5’キャップ」および「7−メチルグアニル酸(m7G)キャップ」は、本明細書中で互換的に用いられる。7−メチルグアニル酸残基は、真核生物においてメッセンジャRNA(mRNA)の5’末端上に位置決めされる。RNAポリメラーゼII(Pol II)は、真核生物においてmRNAを転写する。メッセンジャRNAキャッピングは一般に、以下のように起こる:mRNA転写産物の最も末端の5’リン酸基が、RNA末端ホスファターゼによって除去されて、2つの末端リン酸が残る。グアニリルトランスフェラーゼによって、グアノシン一リン酸(GMP)が転写産物の末端のリン酸に加えられて、転写産物末端に5’−5’三リン酸結合グアニンが残る。最後に、この末端グアニンの7−窒素が、メチルトランスフェラーゼによってメチル化される。
本明細書中で専門用語「5’キャップを有していない」は、例えば、5’キャップの代わりに5’−水酸基を有するRNAを指すのに用いられる。そのようなRNAは、例えば、「キャップ離脱RNA」と呼ぶことができる。キャップ離脱RNAは、転写後、核内により十分に蓄積することができる。というのも、5’キャッピングされたRNAは、核外搬出に曝されるからである。本明細書中で、1つまたは複数のRNA構成要素が、キャップ離脱している。
用語「リボザイム」および「リボ核酸酵素」は、本明細書中で互換的に用いられる。リボザイムは、特定の部位にてRNAを切断することができる、二次、三次、および/または四次構造を形成する1つまたは複数のRNA配列を指す。リボザイムとして、リボザイム配列に対してシス部位にてRNAを切断することができる(すなわち、自己触媒的である、または自己切断する)「自己切断リボザイム」が挙げられる。リボザイム核酸分解活性の一般的な性質が解説されてきた(例えば、Lilley,Biochem.Soc.Trans.39:641−646)。「ハンマーヘッドリボザイム」(HHR)は、本明細書中で、触媒反応に関与する3つの塩基対形成されたステム、および高度に保存された、非相補的ヌクレオチドのコアで構成される小さな触媒的RNAモチーフを含んでよい。Pley et al.(Nature 372:68−74)、そしてHammann et al.(RNA 18:871−885)(これらの文献は参照によって本明細書に組み込まれる)が、ハンマーヘッドリボザイムの構造および活性を開示している。本明細書中でハンマーヘッドリボザイムは、例えば、Scott et al.(Cell 81:991−1002(参照によって本明細書に組み込まれる))によって開示される「最小のハンマーヘッド」配列を含んでよい。
本開示の一実施形態において、方法は、非従来型酵母中の染色体またはエピソーム上の標的部位配列に、RNA誘導型エンドヌクレアーゼ(RGEN)を標的として向ける方法を含み、前記方法は、前記酵母に、CasエンドヌクレアーゼをコードするDNA配列を含む第1の組換えDNA構築体、およびRNA構成要素の上流にリボザイムをコードするDNA配列を含む少なくとも第2の組換えDNA構築体を提供する工程を含み、第2の組換えDNA構築体から転写されるRNAは、自己触媒的にリボザイムを除去して前記RNA構成要素が生成し、RNA構成要素およびCas9エンドヌクレアーゼは、標的部位配列の全てまたは一部に結合することができるRGENを形成することができる。
本開示の一実施形態において、非従来型酵母は、少なくとも1つのヌクレオチド配列に機能可能なように結合するプロモータを含むポリヌクレオチド配列を含み、前記ヌクレオチド配列は、RNA構成要素をコードするDNA配列の上流にリボザイムをコードするDNA配列を含み、前記RNA構成要素は、酵母中の染色体またはエピソーム上の標的部位配列と相補的な可変ターゲティングドメインを含み、RNA構成要素は、RNA誘導型エンドヌクレアーゼ(RGEN)を形成することができ、前記RGENは、標的部位配列の全てまたは一部に結合することができ、ヌクレオチド配列から転写されるRNAは自己触媒的にリボザイムを除去して前記RNA構成要素が生成し、前記RNA構成要素は5’キャップを有していない。
リボザイムはまた、自己の配列の5’を切断して、先行するあらゆる転写産物を除去するが、リボザイム配列を無傷のままにするリボザイムを含む。
本開示の一実施形態において、非従来型酵母は、少なくとも1つのヌクレオチド配列に機能可能なように結合するプロモータを含むポリヌクレオチド配列を含み、前記ヌクレオチド配列は、RNA構成要素をコードするDNA配列の上流にリボザイムをコードするDNA配列を含み、前記RNA構成要素は、酵母中の染色体またはエピソーム上の標的部位配列と相補的な可変ターゲティングドメインを含み、RNA構成要素は、RNA誘導型エンドヌクレアーゼ(RGEN)を形成することができ、前記RGENは、標的部位配列の全てまたは一部に結合することができ、ヌクレオチド配列から転写されるRNAは自己触媒的にリボザイムを除去して前記RNA構成要素が生成し、ヌクレオチド配列から転写されるRNAは自己触媒的にリボザイムを除去しないで、5’キャップなしのリボザイム−RNA構成要素融合分子を生成する。
用語「ターゲティング」、「遺伝子ターゲティング」、「DNAターゲティング」、「編集」、「遺伝子編集」、および「DNA編集」は、本明細書中で互換的に用いられる。本明細書中でDNAターゲティングは、例えば非従来型酵母の染色体またはエピソーム中の、特定のDNA配列でのindel、ノックアウト、またはノックインの特異的な導入であってよい。一般に、DNAターゲティングは、本明細書中で、Casタンパク質が適切なRNA構成要素と関連して、非従来型酵母中の特定のDNA配列にて一方の鎖または双方の鎖を切断することによって、実行され得る。そのようなDNA切断は、二本鎖切断(DSB)の場合、標的部位にてindelを形成することができるNHEJプロセスを促進することができる。また、切断が一本鎖切断(SSB)であるかDSBであるかを問わず、適切なドナーDNAポリヌクレオチドがDNAニック部位またはDNA切断部位に提供される場合、HRプロセスが促進され得る。そのようなHRプロセスは、ドナーDNAポリヌクレオチドの配列に応じて、標的部位にてノックアウトまたはノックインを導入するのに用いられ得る。
これ以外にも、本明細書中でDNAターゲティングは、標的DNA配列に対する本明細書中のCas/RNA構成要素複合体の特異的な関連を指し得、Casタンパク質は、(Casタンパク質のエンドヌクレオチド結合分解性ドメインの状態に応じて)DNA鎖をカットしたりカットしなかったりする。
本明細書中で用語「indel」は、染色体またはエピソーム中の標的DNA配列中のヌクレオチド塩基の挿入または欠失を指す。そのような挿入または欠失は、例えば、1、2、3、4、5、6、7、8、9、10、またはそれ以上の塩基のものであってよい。ある実施形態におけるindelは、さらにより大きくてよく、少なくとも約20、30、40、50、60、70p、80、90、または100塩基である。indelが遺伝子のオープンリーディングフレーム(ORF)内に導入されれば、indelは多くの場合、フレームシフト突然変異を生じさせることによって、ORFによってコードされるタンパク質の野生型発現を分裂させる。
用語「ノックアウト」、「遺伝子ノックアウト」および「遺伝的ノックアウト」は、本明細書中で互換的に用いられる。ノックアウトは、本明細書中で、Casタンパク質によるターゲティングによって部分的に、または完全に無効とされた、非従来型酵母のDNA配列を表す;ノックアウト前のそのようなDNA配列は、アミノ酸配列をコードしていてもよいし、例えば調節機能(例えばプロモータ)を有していてもよい。ノックアウトは、ターゲティング部位の配列、もしくはその近くの配列の機能を弱める、もしくは完全に破壊する、(NHEJによる)indelによって、または配列の特異的な除去によってもたらされ得る。ノックアウトされたDNAポリヌクレオチド配列は、本明細書中で代わりに、例えば、部分的に、または全体として分裂する、または下方制御されると特徴付けられ得る。
一実施形態において、本開示は、Cas9エンドヌクレアーゼ、および少なくとも1つのヌクレオチド配列に機能可能なように結合するプロモータを含むポリヌクレオチド配列を含む非従来型酵母に関し、前記ヌクレオチド配列は、RNA構成要素をコードするDNA配列の上流にリボザイムをコードするDNA配列を含み、前記RNA構成要素は、酵母中の染色体またはエピソーム上の標的部位配列と相補的な可変ターゲティングドメインを含み、RNA構成要素は、CasエンドヌクレアーゼによるRNA誘導型エンドヌクレアーゼ(RGEN)を形成することができ、前記RGENは、標的部位配列に結合することができる。Cas9エンドヌクレアーゼは、酵母中にタンパク質として導入されてもよいし、組換えDNA構築体を介して導入されてもよい。Cas9エンドヌクレアーゼは、当該技術分野において知られているあらゆる方法によって安定的に、または一時的に発現され得る。
用語「ノックイン」、「遺伝子ノックイン」および「遺伝的ノックイン」は、本明細書中で互換的に用いられる。ノックインは、Casタンパク質によるターゲティングによる、非従来型酵母中の特定のDNA配列でのDNA配列の置換または挿入を表す。ノックインの例として、遺伝子のコード領域中の異種起源アミノ酸コード配列の特異的な挿入、または遺伝子座中への転写調節要素の特異的な挿入がある。
用語「ドナーポリヌクレオチド」、「ドナーDNA」、「ターゲティングポリヌクレオチド」、および「ターゲティングDNA」は、本明細書中で互換的に用いられる。ドナーポリヌクレオチドは、DNA標的部位(例えば、本明細書中で、Casタンパク質によって特異的に標的とされる配列)の配列、またはその近くの配列に相同である少なくとも1つの配列を含むDNA配列を指す。少なくとも1つのヌクレオチド修飾を含むポリヌクレオチドを含むドナーDNAポリヌクレオチドは、編集されることとなるヌクレオチド配列と比較した場合、「ポリヌクレオチド修飾鋳型」、「ポリヌクレオチド修飾鋳型DNA」、または「鋳型DNA」とも呼ばれる。ヌクレオチド修飾は、少なくとも1つのヌクレオチドの置換、付加、または欠失であり得る。場合によっては、ポリヌクレオチド修飾鋳型は、少なくとも1つのヌクレオチド修飾にフランキングする相同ヌクレオチド配列をさらに含んでよく、フランキング相同ヌクレオチド配列は、編集されることが所望されるヌクレオチド配列との十分な相同性を提供する。
本明細書中でドナーポリヌクレオチド内の「相同配列」は、標的部位の配列、もしくはその近くの配列との同一性が100%、または標的部位の配列、もしくはその近くの配列との同一性が少なくとも約95%、96%、97%、98%、もしくは99%である少なくとも約25ヌクレオチドの配列を含んでもよいし、この配列からなってもよい。
ある実施形態において、ドナーDNAポリヌクレオチドは、標的部位の配列と非相同である配列によって分離される2つの相同配列を有してよい。そのようなドナーポリヌクレオチドのこれら2つの相同配列は、「相同アーム」と呼ぶことができ、これらは非相同配列にフランキングする。標的部位と、2本の相同アームを有するドナーポリヌクレオチドとのHRは典型的に、標的部位の配列の、ドナーポリヌクレオチドの非相同配列との置換を生じさせる(ドナーポリヌクレオチドの相同アームに相同なDNA配列間に位置決めされる標的部位配列は、ドナーポリヌクレオチドの非相同配列によって置換される)。2本の相同アームを有するドナーポリヌクレオチドにおいて、アームは1つまたは複数のヌクレオチドによって分離されてよい(すなわち、ドナーポリヌクレオチド中の非相同配列は、少なくとも1ヌクレオチド長であってよい)。本明細書中で非従来型酵母において実行され得る種々のHR手順が、例えば、DNA Recombination:Methods and Protocols:1st Edition(H.Tsubouchi,Ed.,Springer−Verlag,New York,2011)に開示されており、この文献は参照によって本明細書に組み込まれる。
一実施形態において、ドナーDNA構築体は、Casエンドヌクレアーゼの標的部位中に挿入されることになる、対象のポリヌクレオチドを含み、ドナーDNA構築体はさらに、対象のポリヌクレオチドにフランキングする第1および第2の相同領域を含む。ドナーDNAの第1および第2の相同領域は、植物ゲノムの標的部位中に存在する、またはこれにフランキングするそれぞれ第1および第2のゲノム領域との相同性を共有する。
用語「容量パーセント(percent by volume)」、「容量パーセント(volume percent)」、「vol%」、および「v/v%」は、本明細書中で互換的に用いられる。溶液中の溶質の容量パーセントは、式:[(溶質の容量)/(溶液の容量)]×100%を用いて確定され得る。
用語「重量パーセント」、「重量パーセンテージ(wt%)」、および「重量−重量パーセンテージ(%w/w)」は、本明細書中で互換的に用いられる。重量パーセントは、組成物、混合物、または溶液中に含まれるままの、質量ベースでの材料のパーセンテージを指す。
用語「ポリヌクレオチド」、「ポリヌクレオチド配列」、および「核酸配列」は、本明細書中で互換的に用いられる。これらの用語は、ヌクレオチド配列等を包含する。ポリヌクレオチドは、場合によっては合成の、非天然の、または変更されたヌクレオチド塩基を含有する、一本鎖または二本鎖のDNAまたはRNAのポリマーであってよい。ポリヌクレオチドは、cDNA、ゲノムDNA、合成DNA、またはそれらの混合物の1つまたは複数のセグメントで構成されてよい。ヌクレオチド(リボヌクレオチドまたはデオキシリボヌクレオチド)は、以下の一文字呼称によって呼ぶことができる:アデニル酸またはデオキシアデニル酸(それぞれRNAまたはDNAに関する)について「A」、シチジル酸またはデオキシチジル酸(それぞれRNAまたはDNAに関する)について「C」、グアニル酸またはデオキグアニル酸(それぞれRNAまたはDNAに関する)について「G」、ウリジル酸(RNAに関する)について「U」、デオキシチミジル酸(DNAに関する)について「T」、プリン(AまたはG)について「R」、ピリミジン(CまたはT)について「Y」、GまたはTについて「K」、A、C、またはTについて「H」、イノシンについて「I」、AまたはTについて「W」、そしてあらゆるヌクレオチドについて「N」(例えば、DNA配列に言及するならば、Nは、A、C、T、またはGであり得;RNA配列に言及するならば、Nは、A、C、U、またはGであり得る)。本明細書中に開示されるあらゆるRNA配列(例えば、crRNA、tracrRNA、gRNA)は、適切なDNA配列によってコードされ得る。
本明細書中で用いられる用語「単離された」は、その本来の源から完全に、または部分的に精製されたポリヌクレオチドまたはポリペプチド分子を指す。場合によっては、単離されたポリヌクレオチドまたはポリペプチド分子は、より大きな組成物、バッファ系、または試薬混合物の一部である。例えば、単離されたポリヌクレオチドまたはポリペプチド分子は、細胞内または生物内に異種起源のものとして含まれてよい。
本明細書中で用いられる用語「遺伝子」は、コード領域からRNAを発現するDNAポリヌクレオチド配列を指し(RNAは、DNAポリヌクレオチド配列から転写される)、当該RNAは、メッセンジャRNA(タンパク質をコードする)またはタンパク質非コードRNA(例えば、本明細書中でcrRNA、tracrRNA、またはgRNA)であってよい。遺伝子は、コード領域のみを指してもよいし、コード領域の上流かつ/または下流に調節配列(例えば、プロモータ、5’非翻訳領域、3’転写ターミネータ領域)を含んでもよい。タンパク質をコードするコード領域は代わりに、本明細書中で「オープンリーディングフレーム」[ORF]と呼ぶことができる。「在来の」または「内在性の」遺伝子は、自然界で見出されるような、自己調節配列を有する遺伝子を指す;そのような遺伝子は、宿主細胞のゲノム中の、その本来の位置に位置決めされている。「キメラ」遺伝子は、在来遺伝子でなく、自然界では一緒に見出されない調節配列およびコード配列を含む(すなわち、調節領域およびコード領域が互いに異種起源である)あらゆる遺伝子を指す。したがって、キメラ遺伝子は、様々な源に由来する調節配列およびコード配列を含んでもよいし、同じ源に由来するが、自然界で見出されるものとは異なるようにして配置される調節配列およびコード配列を含んでもよい。「外来の」または「異種起源」遺伝子は、遺伝子導入によって宿主生物中に導入される遺伝子を指す。外来遺伝子は、非在来生物中に挿入される在来遺伝子、在来宿主内の新しい位置に導入される在来遺伝子、またはキメラ遺伝子を含んでよい。本明細書中に開示されるある実施形態におけるポリヌクレオチド配列は、異種起源である。「トランスジーン」は、形質転換手順によってゲノム中に導入された遺伝子である。「コドン最適化」オープンリーディングフレームは、そのコドン使用頻度が、宿主細胞の好ましいコドン使用頻度を模倣するように設計されている。
在来アミノ酸配列またはポリヌクレオチド配列は、自然界に存在するものであるが、非在来アミノ酸配列またはポリヌクレオチド配列は、自然界に存在するものでない。
本明細書中で用いられる「調節配列」は、遺伝子の転写開始部位(例えばプロモータ)、5’非翻訳領域、および3’非コード領域の上流に位置決めされるヌクレオチド配列を指し、転写、プロセシングもしくは安定性、または遺伝子から転写されるRNAの翻訳に影響し得る。本明細書中の調節配列として、プロモータ、エンハンサ、サイレンサ、5’非翻訳リーダー配列、イントロン、ポリアデニル化認識配列、RNAプロセシング部位、エフェクタ結合部位、ステム−ループ構造、および遺伝子発現の調節に関与する他の要素が挙げられ得る。本明細書中で1つまたは複数の調節要素は、本明細書中のコード領域とは異種起源であってよい。
本明細書中で用いられる「プロモータ」は、遺伝子からのRNAの転写を制御することができるDNA配列を指す。一般に、プロモータ配列は、遺伝子の転写開始部位の上流にある。プロモータは、その全体が在来遺伝子に由来してもよいし、自然界に見出される様々なプロモータに由来する様々な要素から構成されてもよいし、合成DNAセグメントを含んでもよい。遺伝子を殆どの細胞型において殆どの時点で発現させるプロモータは一般に、「構成プロモータ」と呼ばれる。本明細書中で1つまたは複数のプロモータは、本明細書中のコード領域とは異種起源であってよい。
本明細書中で用いられる「強プロモータ」は、単位時間あたりに比較的多数の生産開始を導くことができるプロモータを指し得、かつ/または、酵母における遺伝子の平均転写レベルよりも高い遺伝子転写レベルを駆動するプロモータである。
本明細書中で用いられる用語「3’非コード配列」、「転写ターミネータ」、および「ターミネータ」は、コード配列の下流に位置決めされるDNA配列を指す。これには、ポリアデニル化認識配列、および、mRNAプロセシングまたは遺伝子発現に影響を及ぼすことができる調節シグナルをコードする他の配列が挙げられる。
本明細書中で用いられる用語「カセット」は、タンパク質コードRNAまたはタンパク質非コードRNAをコードする配列に機能可能なように結合したプロモータを指す。カセットは場合によっては、3’非コード配列に機能可能なように結合してよい。
ポリヌクレオチドに関して本明細書中で用いられる用語「上流」および「下流」はそれぞれ、「5’」および「3’」を指す。
本明細書中で用いられる用語「発現」は、(i)コード領域からのRNA(例えば、mRNAまたはタンパク質非コードRNA、例えばcrRNA、tracrRNA、またはgRNA)の転写、または(ii)mRNAからのポリペプチドの翻訳を指す。
遺伝子またはポリヌクレオチド配列の発現を記載するのに用いられる場合、用語「下方制御」、「分裂」、「阻害」、「不活化」、および「サイレンシング」は、ポリヌクレオチド配列の転写が引き下げられる、または除外される例に言及するために、本明細書中で互換的に用いられる。これにより、ポリヌクレオチド配列からのRNA転写産物の引下げまたは除外がもたらされ、結果として(遺伝子がORFを含むならば)ポリヌクレオチド配列に由来するタンパク質発現の引下げまたは除外がもたらされる。これ以外にも、下方制御は、ポリヌクレオチド配列によって生じる転写産物からのタンパク質の翻訳が引き下げられる、または除外される例に言及し得る。さらにこれ以外にも、下方制御は、ポリヌクレオチド配列によって発現されるタンパク質の活性が低下する例に言及し得る。細胞における上記プロセス(転写、翻訳、タンパク質活性)のいずれかの引下げは、適切なコントロール細胞の転写、翻訳、またはタンパク質活性に対して約40%、50%、60%、70%、80%、90%、95%、または100%であり得る。下方制御は、例えば、本明細書中に開示されるターゲティング事象(例えば、indel、ノックアウト)の結果であり得る。
用語「コントロール細胞」および「適切なコントロール細胞」は、本明細書中で互換的に用いられ、特定の修飾(例えば、ポリヌクレオチドの過剰発現、ポリヌクレオチドの下方制御)がなされた細胞(すなわち、「実験細胞」)に対して参照され得る。コントロール細胞は、実験細胞の特定の修飾を有しもしなければ、これを発現もしないあらゆる細胞であり得る。ゆえに、コントロール細胞は、非形質転換野生型細胞であってもよいし、遺伝的に形質転換されているが、遺伝的形質転換を発現しないものであってもよい。例えば、コントロール細胞は、実験細胞の直接の親であってよく、この直接の親細胞は、実験細胞中に存在する特定の修飾を有していない。これ以外にも、コントロール細胞は、一世代または複数世代によって除かれる、実験細胞の親であってよい。さらにこれ以外にも、コントロール細胞は、実験細胞のきょうだいであってよく、このきょうだいは、実験細胞中に存在する特定の修飾を含まない。
本明細書中で用いられる用語「増大」は、量または活性の増大が比較されることになる量または活性を、少なくとも1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、または20%超える量または活性に言及し得る。用語「増大」、「超」、および「向上」は、本明細書中で互換的に用いられる。用語「増大」は、例えば、タンパク質をコードするポリヌクレオチドの発現を特徴付けるために用いられ得、「発現の増大」は、「過剰発現」を意味することもある。
本明細書中で用いられる用語「機能可能なように結合」は、2つ以上の核酸配列について、一方の機能が他方によって影響されるような関連を指す。例えば、プロモータが、コード配列の発現に影響を及ぼすことができる場合、そのコード配列と機能可能なように結合している。すなわち、コード配列は、プロモータの転写制御下にある。コード配列は、例えば、調節配列に機能可能なように結合し得る。また、例えば、crRNAは、本明細書中で、crRNAのtracrRNAメイト配列が、tracrRNAの5’配列とアニールするように、tracrRNAに機能可能なように結合(融合)し得る。そのような機能可能な結合は、適切なループ形成配列、例えばGAAA(配列番号43)、CAAA(配列番号44)、またはAAAG(配列番号45)を含んでよい。
本明細書中で用いられる用語「組換え」は、例えば化学合成による、または、遺伝子工学技術による核酸の単離セグメントの操作による、配列の2つの、通常であれば分離しているセグメントの人工的な組合せを指す。用語「組換え」、「トランスジェニック」、「形質転換」、「操作」、または「外来遺伝子発現のために修飾」は、本明細書中で互換的に用いられる。
本明細書中の組換え構築体/ベクター(例えば、本明細書中のリボザイム−RNA構成要素カセットをコードするDNAポリヌクレオチド、または本明細書中のCasタンパク質をコードするDNAポリヌクレオチド)を調製する方法は、J.Sambrook and D.Russell(Molecular Cloning:A Laboratory Manual,3rd Edition,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY,2001);T.J.Silhavy et al.(Experiments with Gene Fusions,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY,1984);およびF.M.Ausubel et al.(Short Protocols in Molecular Biology,5th Ed.Current Protocols,John Wiley and Sons,Inc.,NY,2002)によって記載されるような標準的な組換えDNA技術および分子クローニング技術に従ってよい。
本明細書中で用いられる用語「形質転換」は、宿主生物中または宿主細胞中への核酸分子の運搬を指す。例えば、核酸分子は、細胞中で自律的に複製し、宿主生物/細胞のゲノム中に組み込まれ、または複製することも組み込まれることもなく細胞中に一時的に存在する。形質転換に適した核酸分子の非限定的な例、例えばプラスミドおよび線状DNA分子が、本明細書中に開示される。形質転換された核酸フラグメントを含有する宿主生物/細胞(例えば、本明細書中の非従来型酵母)は、「トランスジェニック」、「組換え体」、「形質転換された」、または「形質転換体」と呼ぶことができる。
ポリヌクレオチドまたはポリペプチド配列に関して本明細書中で用いられる用語「配列同一性」または「同一性」は、指定された比較ウィンドウ上で最大に一致するようにアラインされた場合に、2つの配列中の同じである核酸残基またはアミノ酸残基を指す。ゆえに、「配列同一性のパーセンテージ」または「パーセント同一性」は、比較ウィンドウ上の2つの最適にアラインされた配列を比較することによって確定される値を指し、比較ウィンドウ中のポリヌクレオチド配列またはポリペプチド配列の一部は、基準配列(付加または欠失を含まない)と比較して、2つの配列の最適アラインメントについて、付加または欠失(すなわちギャップ)を含んでよい。パーセンテージは、双方の配列において、同一の核酸塩基またはアミノ酸残基が起こる位置の数を判定して、マッチする位置の数を得て、マッチする位置の数を、比較ウィンドウ中の位置の総数によって除して、結果に100を乗じることで配列同一性のパーセンテージを得ることによって、算出される。DNA配列とRNA配列との間で配列同一性を算出する場合、DNA配列のT残基が、RNA配列のU残基とアラインすると「同一である」と考えられ得ることが理解されるであろう。第1のポリヌクレオチドと第2のポリヌクレオチドとのパーセント相補性を確定する目的で、例えば、(i)第1のポリヌクレオチドと第2のポリヌクレオチドの相補体配列(またはその反対)との間のパーセント同一性、および/または(ii)規範的なワトソンおよびクリックの塩基対を生じさせることになる第1のポリヌクレオチドと第2のポリヌクレオチドとの間の塩基のパーセンテージを確定することによって、当該パーセント相補性を得ることができる。
National Center for Biotechnology Information(NCBI)のウェブサイトにてオンラインで利用可能なBasic Local Alignment Search Tool(BLAST)アルゴリズムが、例えば、本明細書中に開示される2つ以上のポリヌクレオチド配列間の(BLASTNアルゴリズム)、またはポリペプチド配列間の(BLASTPアルゴリズム)パーセント同一性を測定するのに用いられてよい。これ以外にも、配列間のパーセント同一性は、Clustalアルゴリズム(例えば、ClustalWまたはClustalV)を用いて実行されてもよい。アラインメントのClustal法を用いるマルチプルアラインメントについて、デフォルト値は、GAP PENALTY=10、そしてGAP LENGTH PENALTY=10に対応してよい。Clustal法を用いた、ペアワイズアラインメント、およびタンパク質配列のパーセント同一性の計算についてのデフォルトパラメータは、KTUPLE=1、GAP PENALTY=3、WINDOW=5、そしてDIAGONALS SAVED=5であってよい。核酸について、これらのパラメータは、KTUPLE=2、GAP PENALTY=5、WINDOW=4、そしてDIAGONALS SAVED=4であってよい。さらにこれ以外にも、配列間のパーセント同一性は、EMBOSSアルゴリズム(例えばneedle)を用いて実行されてよく、パラメータは例えば、BLOSUM matrix(例えばBLOSUM62)を用いて、GAP OPEN=10、GAP EXTEND=0.5、END GAP PENALTY=false、END GAP OPEN=10、END GAP EXTEND=0.5である。
本明細書中で、第2の配列と「相補的な」第1の配列を、代わりに、第2の配列と「アンチセンス」の向きにあると呼ぶことができる。
種々のポリペプチドアミノ酸配列およびポリヌクレオチド配列が、開示される本発明のある実施形態の特徴として、本明細書中に開示される。本明細書中に開示される配列と少なくとも約70〜85%、85〜90%、または90%〜95%同一である配列の変異体が用いられてよい。これ以外にも、種々のアミノ酸配列またはポリヌクレオチド配列は、本明細書中に開示される配列と、少なくとも70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の同一性を有し得る。種々のアミノ酸配列またはポリヌクレオチド配列は、開示される配列と同じ機能/活性、または開示される配列の、少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、もしくは99%の機能/活性を有する。
本明細書中のCas9タンパク質の各アミノ酸位置の、本明細書中に開示される全てのアミノ酸残基は、例である。あるアミノ酸が互いに類似した構造的特徴および/または電荷の特徴を共有する(すなわち、保存されている)ならば、Cas9中の各位置のアミノ酸は、開示される配列に与えられるそのものであってもよいし、以下のように、保存アミノ酸残基で置換されてもよい(「保存的アミノ酸置換」):
1.以下の小さな、無極性の、または僅かに極性のある脂肪族残基は、互いに置換し得る:Ala(A)、Ser(S)、Thr(T)、Pro(P)、Gly(G);
2.以下の極性のある、負に帯電する残基、およびそれらのアミドは、互いに置換し得る:Asp(D)、Asn(N)、Glu(E)、Gln(Q);
3.以下の極性のある、正に帯電する残基は、互いに置換し得る:His(H)、Arg(R)、Lys(K);
4.以下の無極性の脂肪族残基は、互いに置換し得る:Ala(A)、Leu(L)、Ile(I)、Val(V)、Cys(C)、Met(M);そして
5.以下の大きな芳香族残基は、互いに置換し得る:Phe(F)、Tyr(Y)、Trp(W)。
以下で実施例1において示されるように、非従来型酵母、例えば酵母(Yarrowia lipolytica)において、Pol IIIプロモータで転写されるgRNAを用いて、Cas9媒介DNAターゲティングを実行するのは、困難であることが証明された。したがって、Cas9用の、RNA構成要素を生じさせる他の手段が、非従来型酵母におけるCas9媒介DNAターゲティングの実現のために注目されている。
開示される本発明の実施形態は、5’キャップを有していない少なくとも1つのRNA構成要素を含む少なくとも1つのRNA誘導型エンドヌクレアーゼ(RGEN)を含む非従来型酵母に関する。このキャップ離脱RNA構成要素は、酵母中の染色体またはエピソームにおける標的部位配列と相補的な配列を含む。RGENは、標的部位配列の全てまたは一部に結合することができ、そして場合によってはこれを切断することができる。
重要なことに、RGEN媒介DNAターゲティングは、indel形成、またはRGEN標的部位配列と、外因的に供給されるドナーDNA配列との相同組換え(HR)のレベルの増大によって明らかにされるように、非従来型酵母中で起こる。本開示に先立って、非従来型酵母は概して、HRによる遺伝子ターゲティングに抵抗性であり、典型的には、標的部位でのランダムな、稀なDNA切断をあてにして、ドナーDNAとのHRを促進していた。これは、非従来型酵母が、低いHR活性を有し、代わりとして非相同末端結合(NHEJ)活性を優先するためである。ゆえに、非従来型酵母中のHRによる遺伝的ターゲティングは今回、NHEJプロセスよりもHRを優先する従来の酵母、例えば出芽酵母(S.cerevisiae)におけるのとほぼ同じくらい実行可能であり得る。いかなる理論にも拘束されることを望むものではないが、5’キャップのない少なくとも1つのRNA構成要素を非従来型酵母細胞中に提供することで、RNA構成要素が核中でより十分に蓄積して、RGEN媒介DNAターゲティングに関与することができると考えられる。
RNAプロセシングツール、例えばCsy4(Cas6)ベースのRNAプロセシングツールが記載されている(Nissim et al.2014.Molecular Cell 54:698−710)。Csy4は、プレcrRNAステム−ループリピートに結合し、かつその同起源の担体を特異的に切断して、リピートのフラグメントがフランキングするスペーサ配列を含有する成熟crRNAを生じさせる(Sternberg et al.2012.RNA,18(4):661−72)。本明細書(実施例12)中に開示されるのは、ガイドRNAをプロセシングするためのCsy4の使用であり、これは、5’キャップを有していないRNA構成要素(ガイドRNA)をもたらし、RNA構成要素は、非従来型酵母のゲノム中の標的部位に結合してこれを切断することができるRGENを形成することができる。
本明細書中で非従来型酵母は、「従来型」(「モデル」)酵母、例えばサッカロミセス(Saccharomyces)属(例えば、出芽酵母、パン酵母、および/または醸造酵母としても知られる出芽酵母(S.cerevisiae))でも、シゾサッカロミセス(Schizosaccharomyces)属(例えば、分裂酵母としても知られるシゾサッカロミセス・ポンベ(S.pombe))種でもない。ある実施形態における従来型酵母は、NHEJによって媒介される修復プロセスよりもHR DNA修復プロセスを優先する酵母である。
ある実施形態における非従来型酵母は、HRによって媒介される修復プロセスよりもNHEJ DNA修復プロセスを優先する酵母であってよい。従来の酵母、例えば出芽酵母(Saccharomyces cerevisiae)およびシゾサッカロミセス・ポンベ(Schizosaccharomyces pombe)は典型的に、短フランキング相同アーム(30〜50bp)を有するドナーDNAの特異的な組込みを示し、効率はルーチン的に70%を超える一方、非従来型酵母、例えばピキア酵母(Pichia pastoris)、ハンゼヌラ・ポリモルファ(Hansenula polymorpha)、酵母(Yarrowia lipolytica)、ピキア・スティピティス(Pichia stipitis)、およびクルイベロミセス・ラクティス(Kluyveromyces lactis)は通常、類似した構造のドナーDNAによる特異的組込みを示すが、効率は1%未満である(Chen et al.,PLoS ONE 8:e57952)。ゆえに、HRプロセスの優先度は、例えば、酵母を適切なドナーDNAで形質転換して、ドナーDNAによって標的とされると予測されるゲノム部位と特異的に組み換えられる程度を判定することによって、測定され得る。例えば、そのようなアッセイにより、酵母ゲノムにおけるドナーDNAのランダムな組込みの高い程度が得られるならば、NHEJの優先度(すなわちHRの低い優先度)が顕在化するであろう。酵母におけるDNAの特異的な(HR媒介)、かつ/またはランダムな(NHEJ媒介)組込み率を判定するためのアッセイが、当該技術分野において知られている(例えば、Ferreira and Cooper,Genes Dev.18:2249−2254;Corrigan et al.,PLoS ONE 8:e69628;Weaver et al.,Proc.Natl.Acad.Sci.U.S.A.78:6354−6358;Keeney and Boeke,Genetics 136:849−856)。
低いレベルのHR活性を考えると、本明細書中の非従来型酵母は、(i)30〜50bpのフランキング相同アームを有する適切なドナーDNAによる、例えば約1%、2%、3%、4%、5%、6%、7%、もしくは8%未満の特異的なターゲティング率を示し得、かつ/または(ii)前述のドナーDNAの、例えば約65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、もしくは75%超のランダムな組込み率を示し得る。適切なドナーDNAのこれらの(i)特異的なターゲティング率、および/または(ii)ランダムな組込み率は、本明細書中に開示されるRGENが提供されるよりも前から存在するため、非従来型酵母を特徴付けることができる。ある実施形態においてRGENを非従来型酵母に提供する目的は、酵母を特定の部位でのHRに偏らせるための部位特異的DNA一本鎖切断(SSB)または二本鎖切断(DSB)を生じさせることである。ゆえに、本明細書中で適切なRGENを含む非従来型酵母は典型的に、特定のドナーDNAとのHR率の増大を示すはずである。そのような率の増大は、適切なコントロール(例えば、適切なRGENを欠く以外は同じドナーDNAで形質転換した同じ非従来型酵母)のHR率よりも少なくとも約2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、または10倍高くなり得る。
本明細書中のある態様における非従来型酵母は、無性生殖で繁殖する(アナモルフィック)ものであっても、有性生殖で繁殖する(テレオモルフィック)ものであってもよい。本明細書中の非従来型酵母は典型的に、単細胞の形態で存在する一方、当該酵母のある型は場合によっては、偽菌糸(出芽細胞が連結したストリング)を形成することができてもよい。更なる態様において、非従来型酵母は、半数体であっても二倍体であってもよいし、かつ/またはこれらの倍数性のどちらの形態でも存在する能力を有してもよい。
本明細書中で非従来型酵母は、例えばNon−Conventional Yeasts in Genetics,Biochemistry and Biotechnology:Practical Protocols(K.Wolf,K.D.Breunig,G.Barth,Eds.,Springer−Verlag,Berlin,Germany,2003)、Yeasts in Natural and Artificial Habitats(J.F.T.Spencer,D.M.Spencer,Eds.,Springer−Verlag,Berlin,Germany,1997)、および/またはYeast Biotechnology:Diversity and Applications(T.Satyanarayana,G.Kunze,Eds.,Springer,2009)(これらの文献は全て、参照によって本明細書に組み込まれる)に記載される、当該技術分野において知られているあらゆる手段に従って培養され得る。
本明細書中の非従来型酵母の非限定的な例として、以下の属の酵母が挙げられる:ヤロウイア(Yarrowia)属、ピキア(Pichia)属、シュワニオミセス(Schwanniomyces)属、クルイベロミセス(Kluyveromyces)属、アルクスラ(Arxula)属、トリコスポロン(Trichosporon)属、カンディダ(Candida)属、ウスティラゴ(Ustilago)属、トルロプシス(Torulopsis)属、チゴサッカロミセス(Zygosaccharomyces)属、トリゴノプシス(Trigonopsis)属、クリプトコッカス(Cryptococcus)属、ロドトルラ(Rhodotorula)属、ファフィア(Phaffia)属、スポロボロミセス(Sporobolomyces)属、およびパキソレン(Pachysolen)属。ヤロウイア(Yarrowia)属種の適切な例は、酵母(Y.lipolytica)である。ピキア(Pichia)属種の適切な例として、ピキア酵母(P.pastoris)、メチロトローフ酵母(P.methanolica)、ピキア・スティピティス(P.stipitis)、ピキア・アノマーラ(P.anomala)、およびピキア・アングスタ(P.angusta)が挙げられる。シュワニオミセス(Schwanniomyces)属種の適切な例として、シュワニオミセス・カステリィ(S.castellii)、シュワニオミセス・アルビウス(S.alluvius)、シュワニオミセス・ホミニス(S.hominis)、シュワニオミセス・オキシデンタリス(S.occidentalis)、シュワニオミセス・カプリオッティ(S.capriottii)、シュワニオミセス・エチェルシィ(S.etchellsii)、シュワニオミセス・ポリモルファス(S.polymorphus)、シュワニオミセス・シュードポリモルファス(S.pseudopolymorphus)、シュワニオミセス・バンリジエ(S.vanrijiae)、およびシュワニオミセス・ヤマダエ(S.yamadae)が挙げられる。クルイベロミセス(Kluyveromyces)属種の適切な例として、クルイベロミセス・ラクティス(K.lactis)、クルイベロミセス・マルキシアヌス(K.marxianus)、クルイベロミセス・フラギリス(K.fragilis)、クルイベロミセス・ドロソフィラルム(K.drosophilarum)、クルイベロミセス・サーモトレランス(K.thermotolerans)、クルイベロミセス・ファゼオロスポラス(K.phaseolosporus)、クルイベロミセス・バヌデニィ(K.vanudenii)、クルイベロミセス・ワルティ(K.waltii)、クルイベロミセス・アフリカヌス(K.africanus)、およびクルイベロミセス・ポリスポラス(K.polysporus)が挙げられる。アルクスラ(Arxula)属種の適切な例として、アルクスラ・アデニニボランス(A.adeninivorans)およびアルクスラ・テレストレ(A.terrestre)が挙げられる。トリコスポロン(Trichosporon)属種の適切な例として、トリコスポロン・クタネウム(T.cutaneum)、トリコスポロン・キャピタトゥム(T.capitatum)、トリコスポロン・インキン(T.inkin)、およびトリコスポロン・ビーメリ(T.beemeri)が挙げられる。カンディダ(Candida)属種の適切な例として、カンディダ・アルビカンス(C.albicans)、カンディダ・アスカラフィダルム(C.ascalaphidarum)、カンディダ・アムフィキシエ(C.amphixiae)、カンディダ・アンタークティカ(C.antarctica)、カンディダ・アルゲンティア(C.argentea)、カンディダ・アトランティカ(C.atlantica)、カンディダ・アトモスファェリカ(C.atmosphaerica)、カンディダ・ブラッテ(C.blattae)、カンディダ・ブロメリアセアルム(C.bromeliacearum)、カンディダ・カルポフィラ(C.carpophila)、カンディダ・カルバジャリス(C.carvajalis)、カンディダ・セラムビシダルム(C.cerambycidarum)、カンディダ・チャウリオデス(C.chauliodes)、カンディダ・コリダリ(C.corydali)、カンディダ・ドッセイ(C.dosseyi)、カンディダ・デュブリニエンシス(C.dubliniensis)、カンディダ・エルガテンシス(C.ergatensis)、カンディダ・フルクトゥス(C.fructus)、カンディダ・グラブラタ(C.glabrata)、カンディダ・フェルメンタティ(C.fermentati)、カンディダ・ギリエルモンディ(C.guilliermondii)、カンディダ・ハエムロニィ(C.haemulonii)、カンディダ・インセクタメンス(C.insectamens)、カンディダ・インセクトルム(C.insectorum)、カンディダ・インテルメディア(C.intermedia)、カンディダ・イェフレシィ(C.jeffresii)、カンディダ・ケフィア(C.kefyr)、カンディダ・ケロセニエ(C.keroseneae)、カンディダ・クルセイ(C.krusei)、カンディダ・ルシタニエ(C.lusitaniae)、カンディダ・リキソソフィラ(C.lyxosophila)、カンディダ・マルトーサ(C.maltosa)、カンディダ・マリーナ(C.marina)、カンディダ・メンブラニファシエンス(C.membranifaciens)、カンディダ・ミレリ(C.milleri)、カンディダ・モギィ(C.mogii)、カンディダ・オレオフィラ(C.oleophila)、カンディダ・オレゴネンシス(C.oregonensis)、カンディダ・パラシローシス(C.parapsilosis)、カンディダ・クエルシトルーサ(C.quercitrusa)、カンディダ・ルゴサ(C.rugosa)、カンディダ・サケ(C.sake)、カンディダ・シャハテア(C.shehatea)、カンディダ・テムノキラエ(C.temnochilae)、カンディダ・テヌイス(C.tenuis)、カンディダ・テアエ(C.theae)、カンディダ・トレランス(C.tolerans)、カンディダ・トロピカリス(C.tropicalis)、カンディダ・ツチヤエ(C.tsuchiyae)、カンディダ・シノラボランティウム(C.sinolaborantium)、カンディダ・ソーヤ(C.sojae)、カンディダ・サブハシィ(C.subhashii)、カンディダ・ビスワナシィ(C.viswanathii)、カンディダ・ユティリス(C.utilis)、カンディダ・ウバトゥベンシス(C.ubatubensis)、およびカンディダ・ゼプリニナ(C.zemplinina)が挙げられる。ウスティラゴ(Ustilago)属種の適切な例として、エンバク裸黒穂病菌(U.avenae)、黒穂病菌(U.esculenta)、堅黒穂病菌(U.hordei)、トウモロコシ黒穂病菌(U.maydis)、オオムギ裸黒穂病菌(U.nuda)、および裸黒穂病菌(U.tritic)が挙げられる。トルロプシス(Torulopsis)属種の適切な例として、トルロプシス・ゲオチャレス(T.geochares)、トルロプシス・アジマ(T.azyma)、トルロプシス・グラブラータ(T.glabrata)、およびトルロプシス・カンディダ(T.candida)が挙げられる。チゴサッカロミセス(Zygosaccharomyces)属種の適切な例として、チゴサッカロミセス・バイリィ(Z.bailii)、チゴサッカロミセス・ビスポラス(Z.bisporus)、チゴサッカロミセス・シドリ(Z.cidri)、チゴサッカロミセス・フェルメンタティ(Z.fermentati)、チゴサッカロミセス・フロレンティヌス(Z.florentinus)、チゴサッカロミセス・コンブチャエンシス(Z.kombuchaensis)、チゴサッカロミセス・レントゥス(Z.lentus)、チゴサッカロミセス・メリス(Z.mellis)、チゴサッカロミセス・ミクロエリプソイデス(Z.microellipsoides)、チゴサッカロミセス・ムラキィ(Z.mrakii)、チゴサッカロミセス・シュードルーキシィ(Z.pseudorouxii)、およびチゴサッカロミセス・ルーキシィ(Z.rouxii)が挙げられる。トリゴノプシス(Trigonopsis)属種の適切な例として、トリゴノプシス・バリアビリス(T.variabilis)が挙げられる。クリプトコッカス(Cryptococcus)属種の適切な例として、クリプトコッカス・ローレンティ(C.laurentii)、クリプトコッカス・アルビダス(C.albidus)、クリプトコッカス・ネオフォルマンス(C.neoformans)、クリプトコッカス・ガッティ(C.gattii)、クリプトコッカス・ユニグトゥラトゥス(C.uniguttulatus)、クリプトコッカス・アデリエンシス(C.adeliensis)、クリプトコッカス・エリウス(C.aerius)、クリプトコッカス・アルビドシミリス(C.albidosimilis)、クリプトコッカス・アンタルクティカス(C.antarcticus)、クリプトコッカス・アクアティカス(C.aquaticus)、クリプトコッカス・アーテル(C.ater)、クリプトコッカス・ブータネンシス(C.bhutanensis)、クリプトコッカス・コンソルティオニス(C.consortionis)、クリプトコッカス・カルバトゥス(C.curvatus)、クリプトコッカス・フェノリカス(C.phenolicus)、クリプトコッカス・スキンネリ(C.skinneri)、クリプトコッカス・テレウス(C.terreus)、およびクリプトコッカス・ビシュニアッシ(C.vishniacci)が挙げられる。ロドトルラ(Rhodotorula)属種の適切な例として、ロドトルラ・アケニオルム(R.acheniorum)、ロドトルラ・トゥラ(R.tula)、ロドトルラ・アクタ(R.acuta)、ロドトルラ・アメリカーナ(R.americana)、ロドトルラ・アラウカリエ(R.araucariae)、ロドトルラ・アークティカ(R.arctica)、ロドトルラ・アルメニアカ(R.armeniaca)、ロドトルラ・アウランティアカ(R.aurantiaca)、ロドトルラ・アウリクラリエ(R.auriculariae)、ロドトルラ・バカルム(R.bacarum)、ロドトルラ・ベンチカ(R.benthica)、ロドトルラ・ビオウルゲイ(R.biourgei)、ロドトルラ・ボゴリエンシス(R.bogoriensis)、ロドトルラ・ブロンキアリス(R.bronchialis)、ロドトルラ・ブフォニィ(R.buffonii)、ロドトルラ・カリプトゲナエ(R.calyptogenae)、ロドトルラ・チュングナメンシス(R.chungnamensis)、ロドトルラ・クラディエンシス(R.cladiensis)、ロドトルラ・コラリナ(R.corallina)、ロドトルラ・クレゾリカ(R.cresolica)、ロドトルラ・クロセア(R.crocea)、ロドトルラ・シクロクラスティカ(R.cycloclastica)、ロドトルラ・ダイレネンシス(R.dairenensis)、ロドトルラ・ディフルエンス(R.diffluens)、ロドトルラ・エベルグラディエンシス(R.evergladiensis)、ロドトルラ・フェルリカ(R.ferulica)、ロドトルラ・フォリオルム(R.foliorum)、ロドトルラ・フラガリア(R.fragaria)、ロドトルラ・フジサネンシス(R.fujisanensis)、
ロドトルラ・フトロネンシス(R.futronensis)、ロドトルラ・ゲラティノーサ(R.gelatinosa)、ロドトルラ・グラシアリス(R.glacialis)、ロドトルラ・グルティニス(R.glutinis)、ロドトルラ・グラシリス(R.gracilis)、ロドトルラ・グラミニス(R.graminis)、ロドトルラ・グリンベルグシィ(R.grinbergsii)、ロドトルラ・ヒマライエンシス(R.himalayensis)、ロドトルラ・ヒヌレア(R.hinnulea)、ロドトルラ・ヒストリティカ(R.histolytica)、ロドトルラ・ヒロフィラ(R.hylophila)、ロドトルラ・インカルナタ(R.incarnata)、ロドトルラ・インゲニオサ(R.ingeniosa)、ロドトルラ・ジャバニカ(R.javanica)、ロドトルラ・コイシカウェンシス(R.koishikawensis)、ロドトルラ・ラクトーサ(R.lactosa)、ロドトルラ・ラメリブラキエ(R.lamellibrachiae)、ロドトルラ・ラリンギス(R.laryngis)、ロドトルラ・リグノフィラ(R.lignophila)、ロドトルラ・リニ(R.lini)、ロドトルラ・ロンギッシマ(R.longissima)、ロドトルラ・ルドウィギィ(R.ludwigii)、ロドトルラ・リシノフィラ(R.lysinophila)、ロドトルラ・マリーナ(R.marina)、ロドトルラ・マルチニエ−フラガンティス(R.martyniae−fragantis)、ロドトルラ・マトリテンシス(R.matritensis)、ロドトルラ・メリ(R.meli)、ロドトルラ・ミヌタ(R.minuta)、ロドトルラ・ムシラギノーサ(R.mucilaginosa)、ロドトルラ・ニテンス(R.nitens)、ロドトルラ・ノトファギ(R.nothofagi)、ロドトルラ・オリゼ(R.oryzae)、ロドトルラ・パシフィカ(R.pacifica)、ロドトルラ・パリダ(R.pallida)、ロドトルラ・ペネウス(R.peneaus)、ロドトルラ・フィリラ(R.philyla)、ロドトルラ・フィロプラナ(R.phylloplana)、ロドトルラ・ピラティ(R.pilatii)、ロドトルラ・ピリマネ(R.pilimanae)、ロドトルラ・ピニコラ(R.pinicola)、ロドトルラ・ピリカタ(R.plicata、)、ロドトルラ・ポリモルファ(R.polymorpha)、ロドトルラ・サイクロフェノリカ(R.psychrophenolica)、ロドトルラ・サイクロフィラ(R.psychrophila)、ロドトルラ・パストゥラ(R.pustula)、ロドトルラ・レティノフィラ(R.retinophila)、ロドトルラ・ロザケア(R.rosacea)、ロドトルラ・ロスラータ(R.rosulata)、ロドトルラ・ルベファシエンス(R.rubefaciens)、ロドトルラ・ルベラ(R.rubella)、ロドトルラ・ルベスセンス(R.rubescens)、ロドトルラ・ルブラ(R.rubra)、ロドトルラ・ルブロルゴサ(R.rubrorugosa)、ロドトルラ・ルフラ(R.rufula)、ロドトルラ・ルティラ(R.rutila)、ロドトルラ・サングイネア(R.sanguinea)、ロドトルラ・サニエイ(R.sanniei)、ロドトルラ・サルトリィ(R.sartoryi)、ロドトルラ・シルベストリス(R.silvestris)、ロドトルラ・シンプレックス(R.simplex)、ロドトルラ・シネンシス(R.sinensis)、ロドトルラ・スルーフィエ(R.slooffiae)、ロドトルラ・ソンクキィ(R.sonckii)、ロドトルラ・ストラミネア(R.straminea)、ロドトルラ・スベリコラ(R.subericola)、ロドトルラ・スガニィ(R.suganii)、ロドトルラ・タイワネンシス(R.taiwanensis)、ロドトルラ・タイワニアナ(R.taiwaniana)、ロドトルラ・テルペノイダリス(R.terpenoidalis)、ロドトルラ・テッレア(R.terrea)、ロドトルラ・テキセンシス(R.texensis)、ロドトルラ・トキョエンシス(R.tokyoensis)、ロドトルラ・ウルザメ(R.ulzamae)、ロドトルラ・バニリカ(R.vanillica)、ロドトルラ・ブイレミニィ(R.vuilleminii)、ロドトルラ・ヤロウィ(R.yarrowii)、ロドトルラ・ユナネンシス(R.yunnanensis)、およびロドトルラ・ゾルティ(R.zsoltii)が挙げられる。ファフィア(Phaffia)属種の適切な例として、赤色酵母(P.rhodozyma)が挙げられる。スポロボロミセス(Sporobolomyces)属種の適切な例として、スポロボロミセス・アルボルベスセンス(S.alborubescens)、スポロボロミセス・バナエンシス(S.bannaensis)、スポロボロミセス・ベイジンゲンシス(S.beijingensis)、スポロボロミセス・ビスフォフィエ(S.bischofiae)、スポロボロミセス・クラバトゥス(S.clavatus)、スポロボロミセス・コプロスメ(S.coprosmae)、スポロボロミセス・コプロスミコーラ(S.coprosmicola)、スポロボロミセス・コラリヌス(S.corallinus)、スポロボロミセス・ディメネ(S.dimmenae)、スポロボロミセス・ドラコフィリィ(S.dracophylli)、スポロボロミセス・エロンガトゥス(S.elongatus)、スポロボロミセス・グラシリス(S.gracilis)、スポロボロミセス・イノシトフィルス(S.inositophilus)、スポロボロミセス・ジョンソニィ(S.johnsonii)、スポロボロミセス・コアラエ(S.koalae)、スポロボロミセス・マグニスポラス(S.magnisporus)、スポロボロミセス・ノボゼアランディカス(S.novozealandicus)、スポロボロミセス・オドラス(S.odorus)、スポロボロミセス・パタゴニカス(S.patagonicus)、スポロボロミセス・プロダクトゥス(S.productus)、スポロボロミセス・ロセウス(S.roseus)、スポロボロミセス・サシコーラ(S.sasicola)、スポロボロミセス・シバタヌス(S.shibatanus)、スポロボロミセス・シンギュラリス(S.singularis)、スポロボロミセス・スブルンネウス(S.subbrunneus)、スポロボロミセス・シンメトリカス(S.symmetricus)、スポロボロミセス・シジギィ(S.syzygii)、スポロボロミセス・タウポエンシス(S.taupoensis)、スポロボロミセス・ツガエ(S.tsugae)、スポロボロミセス・ザンザス(S.xanthus)、およびスポロボロミセス・ユナネンシス(S.yunnanensis)が挙げられる。パキソレン(Pachysolen)属種の適切な例として、パキソレン・タノフィルス(P.tannophilus)が挙げられる。
酵母(Yarrowia lipolytica)は、本明細書中に開示されるある実施形態において、好ましい。適切な酵母(Y.lipolytica)の例として、米国菌培養収集所(American Type Culture Collection:ATCC,Manassas,VA)から入手可能な、以下の単離物が挙げられる:株名称ATCC#20362、#8862、#8661、#8662、#9773、#15586、#16617、#16618、#18942、#18943、#18944、#18945、#20114、#20177、#20182、#20225、#20226、#20228、#20327、#20255、#20287、#20297、#20315、#20320、#20324、#20336、#20341、#20346、#20348、#20363、#20364、#20372、#20373、#20383、#20390、#20400、#20460、#20461、#20462、#20496、#20510、#20628、#20688、#20774、#20775、#20776、#20777、#20778、#20779、#20780、#20781、#20794、#20795、#20875、#20241、#20422、#20423、#32338、#32339、#32340、#32341、#34342、#32343、#32935、#34017、#34018、#34088、#34922、#34922、#38295、#42281、#44601、#46025、#46026、#46027、#46028、#46067、#46068、#46069、#46070、#46330、#46482、#46483、#46484、#46436、#60594、#62385、#64042、#74234、#76598、#76861、#76862、#76982、#90716、#90811、#90812、#90813、#90814、#90903、#90904、#90905、#96028、#201241、#201242、#201243、#201244、#201245、#201246、#201247、#201249、および/または#201847。
本明細書中で酵母(Y.lipolytica)および他のあらゆる非従来型酵母は、油産生性であってよく(例えば、その乾燥細胞重の少なくとも25%を油として産生する)、かつ/または1種もしくは複数種の多価不飽和脂肪酸(例えば、オメガ6またはオメガ3)を産生してよい。そのような油産生性は、酵母が、その野生型の形態と比較して、脂質を大量に産生するように遺伝子操作された結果であってよい。油産生性酵母(Y.lipolytica)株の例が、米国特許出願公開第2009/0093543号明細書、米国特許出願公開第2010/0317072号明細書、米国特許出願公開第2012/0052537号明細書、および米国特許出願公開第2014/0186906号明細書に開示されており、これらの文献は参照によって本明細書に組み込まれる。
非従来型酵母について本明細書中に開示される実施形態はまた、他の微生物、例えば菌類に応用され得る。ある実施形態における菌類は、HRによって媒介される修復プロセスよりもNHEJ DNA修復プロセスを優先する菌類であってよい。本明細書中で菌は、担子菌類、接合菌類、ツボカビ類、または子嚢菌類の菌であってよい。本明細書中の糸状菌類の例として、トリコデルマ(Trichoderma)属、クリソスポリウム(Chrysosporium)属、チエラビア(Thielavia)属、ニューロスポラ(Neurospora)属(例えば、アカパンカビ(N.crassa)、ニューロスポラ・ストフィラ(N.sitophila))、クリフォネクトリア(Cryphonectria)属(例えばクリフォネクトリア・パラシティカ(C.parasitica))、オーレオバシディウム(Aureobasidium)(例えばオーレオバシディウム・プルランス(A.pullulans))、フィロバシディウム(Filibasidium)属、ピロミセス(Piromyces)属、クリプトコッカス(Cryplococcus)属、アクレモニウム(Acremonium)属、トリポクラディウム(Tolypocladium)属、スキタリディウム(Scytalidium)属、シゾフィルム(Schizophyllum)属、スポロトリクム(Sporotrichum)属、ペニシリウム(Penicillium)属(例えば、ペニシリウム・ビライエ(P.bilaiae)、ペニシリウム・カメンベルティ(P.camemberti)、ペニシリウム・カンディドゥム(P.candidum)、ペニシリウム・クリソゲヌム(P.chrysogenum)、ペニシリウム・エキスパンスム(P.expansum)、ペニシリウム・フニクロスム(P.funiculosum)、ペニシリウム・グラウクム(P.glaucum)、ペニシリウム・マルネッフェイ(P.marneffei)、ペニシリウム・ロックフォルティ(P.roqueforti)、ペニシリウム・ベルコースム(P.verrucosum)、ペニシリウム・ビリディカトゥム(P.viridicatum))、ジベレラ(Gibberella)属(例えば、ジベレラ・アクミナタ(G.acuminata)、リンゴ水腐病菌(G.avenacea)、ジベレラ・バッカタ(G.baccata)、ジベレラ・シルシナタ(G.circinata)、ジベレラ・シアノゲナ(G.cyanogena)、イネ馬鹿苗病菌(G.fujikuroi)、ジベレラ・イントリカンス(G.intricans)、ジベレラ・プリカリス(G.pulicaris)、ジベレラ・スティルボイデス(G.stilboides)、ジベレラ・トリシンクタ(G.tricincta)、ジベレラ・ゼアエ(G.zeae))、マイセリオフトーラ(Myceliophthora)属、ケカビ(Mucor)属(例えば、ムコール・ルーキシィ(M.rouxii)、ムコール・シルシネロイデス(M.circinelloides))、アスペルギラス(Aspergillus)属(例えば、クロコウジカビ(A.niger)、ニホンコウジカビ(A.oryzae)、アスペルギラス・ニデュランス(A.nidulans)、アスペルギラス・フラブス(A.flavus)、アスペルギラス・レントゥルス(A.lentulus)、アスペルギラス・テレウス(A.terreus)、アスペルギラス・クラバトゥス(A.clavatus)、アスペルギラス・フミガトゥス(A.fumigatus))、フザリウム(Fusarium)属(例えば、ムギ類赤カビ病菌(F.graminearum)、フザリウム・オキシスポルム(F.oxysporum)、フザリウム・ヌビゲヌム(F.bubigenum)、フサリウム・ソラニ(F.solani)、フザリウム・オキシスポルム(F.oxysporum)、フザリウム・バーティシリオイデス(F.verticillioides)、フザリウム・プロリフェラトゥム(F.proliferatum)、フザリウム・ベネナトゥム(F.venenatum))、およびフミコーラ(Humicola)属、ならびにそれらのアナモルフおよびテレオモルフの糸状菌類が挙げられる。本明細書中で菌類の属および種は、Barnett and Hunter(Illustrated Genera of Imperfect Fungi,3rd Edition,Burgess Publishing Company,1972)に開示されるように、必要に応じて、形態によって定義され得る。菌は場合によっては、ペスト/病原体、例えば動物(例えばヒト)のペスト/病原体として特徴付けられ得る。
本明細書中のある態様におけるトリコデルマ(Trichoderma)属種として、トリコデルマ・アグレッシバム(T.aggressivum)、トリコデルマ・アマゾニクム(T.amazonicum)、トリコデルマ・アスペレルム(T.asperellum)、トリコデルマ・アトロビリデ(T.atroviride)、トリコデルマ・アウレオビリデ(T.aureoviride)、トリコデルマ・アウストロコニンギィ(T.austrokoningii)、トリコデルマ・ブレビコンパクトゥム(T.brevicompactum)、トリコデルマ・カンディドゥム(T.candidum)、トリコデルマ・カリッベウム(T.caribbaeum)、トリコデルマ・カトプトロン(T.catoptron)、トリコデルマ・クレメウム(T.cremeum)、トリコデルマ・セラミクム(T.ceramicum)、トリコデルマ・セリヌム(T.cerinum)、トリコデルマ・クロロスポルム(T.chlorosporum)、トリコデルマ・クロロスペルマム(T.chromospermum)、トリコデルマ・シナモメウム(T.cinnamomeum)、トリコデルマ・シトリノビリデ(T.citrinoviride)、トリコデルマ・クラッスム(T.crassum)、トリコデルマ・クレメウム(T.cremeum)、トリコデルマ・ジングレエアエ(T.dingleyeae)、トリコデルマ・ドロテアエ(T.dorotheae)、トリコデルマ・エフスム(T.effusum)、トリコデルマ・エリナセウム(T.erinaceum)、トリコデルマ・エストニクム(T.estonicum)、トリコデルマ・フェルティル(T.fertile)、トリコデルマ・ゲラティノサス(T.gelatinosus)、トリコデルマ・グハネンセ(T.ghanense)、トリコデルマ・ハマトゥム(T.hamatum)、トリコデルマ・ハルジアヌム(T.harzianum)、トリコデルマ・ヘリクム(T.helicum)、トリコデルマ・イントリカトゥム(T.intricatum)、トリコデルマ・コニラングブラ(T.konilangbra)、トリコデルマ・コニンギィ(T.koningii)、トリコデルマ・コニンギオプシス(T.koningiopsis)、トリコデルマ・ロンギブラチアトゥム(T.longibrachiatum)、トリコデルマ・ロンギピレ(T.longipile)、トリコデルマ・ミヌティスポルム(T.minutisporum)、トリコデルマ・オブロギスポルム(T.oblongisporum)、トリコデルマ・オバリスポルム(T.ovalisporum)、トリコデルマ・ペテルセニィ(T.petersenii)、トリコデルマ・フィロスタヒディス(T.phyllostahydis)、トリコデルマ・ピルリフェルム(T.piluliferum)、トリコデルマ・プレウロティコラ(T.pleuroticola)、トリコデルマ・プレウロトゥム(T.pleurotum)、トリコデルマ・ポリスポルム(T.polysporum)、トリコデルマ・シュードコニンギィ(T.pseudokoningii)、トリコデルマ・プベスセンス(T.pubescens)、トリコデルマ・リーゼイ(T.reesei)、トリコデルマ・ロゲルソニィ(T.rogersonii)、トリコデルマ・ロシクム(T.rossicum)、トリコデルマ・サトゥルニスポルム(T.saturnisporum)、トリコデルマ・シネンシス(T.sinensis)、トリコデルマ・シヌオスム(T.sinuosum)、トリコデルマ・スピラレ(T.spirale)、トリコデルマ・ストラミネウム(T.stramineum)、トリコデルマ・ストリゴスム(T.strigosum)、トリコデルマ・ストロマティクム(T.stromaticum)、トリコデルマ・スロトゥンドゥム(T.surrotundum)、トリコデルマ・タイワネンセ(T.taiwanense)、トリコデルマ・タイランディクム(T.thailandicum)、トリコデルマ・テレフォリコルム(T.thelephoricolum)、トリコデルマ・セオブロミコラ(T.theobromicola)、トリコデルマ・トメントスム(T.tomentosum)、トリコデルマ・ベルティヌム(T.velutinum)、トリコデルマ・ビレンス(T.virens)、トリコデルマ・ビリデ(T.viride)、およびトリコデルマ・ビリデスセンス(T.viridescens)が挙げられる。本明細書中でトリコデルマ(Trichoderma)属種は、例えば、Trichoderma:Biology and Applications(P.K.Mukherjee et al.,Eds.,CABI,Oxfordshire,UK,2013)(この文献は参照によって本明細書に組み込まれる)に記載されるように培養され、かつ/または操作され得る。
ある実施形態における微生物細胞は、藻類細胞である。例えば、藻類細胞は、以下のいずれに由来してもよい:緑藻植物(Chlorophyta)門(緑藻類)、紅藻植物(Rhodophyta)門(紅藻類)、褐藻植物(Phaeophyceae)綱(褐藻類)、珪藻植物(Bacillariophycaeae)綱(珪藻類)、および渦鞭毛虫(Dinoflagellata)門(渦鞭毛虫類)。藻類細胞は、他の態様において、微細藻類(例えば、植物プランクトン、微細植物、またはプランクトン藻類)の細胞であっても大型藻類(ケルプ、海草)の細胞であってもよい。更なる例として、本明細書中で藻類細胞は、アマノリ(Porphyra)属(アサクサノリ)、ダルス(Palmaria)属種、例えばダルス(P.palmata)、アルトロスピラ(Arthrospira)属種、例えばスピルリナ(A.platensis)、クロレラ(Chlorella)属(例えばクロレラ(C.protothecoides))、ツノマタ(Chondrus)属種、例えばトチャカ(C.crispus)、アファニゾメノン(Aphanizomenon)属、ホンダワラ(Sargassum)属、コチャユヨ(Cochayuyo)属、ボツリオコッカス(Botryococcus)属(例えばボツリオコッカス・ブラウニィ(B.braunii))、ドナリエラ(Dunaliella)属(例えばドナリエラ・テルティオレクタ(D.tertiolecta))、グラシラリア(Gracilaria)属、プレウロクリシス(Pleurochrysis)属(例えばプレウロクリシス・カルテレ(P.carterae))、アンキストロデスムス(Ankistrodesmus)属、キクロテラ(Cyclotella)属、ハンチア(Hantzschia)属、ナンノクロリス(Nannochloris)属、ナンノクロロプシス(Nannochloropsis)属、ニッチア(Nitzschia)属、フェオダクチルム(Phaeodactylum)属(例えばフェオダクチルム・トリコルヌトゥム(P.tricornutum))、セネデスムス(Scenedesmus)属、スティココッカス(Stichococcus)属、テトラセルミス(Tetraselmis)属(例えばテトラセルミス・スエシカ(T.suecica))、タラシオシラ(Thalassiosira)属(例えばタラシオシラ・シュードナナ(T.pseudonana))、クリプテコディニウム(Crypthecodinium)属(例えばクリプテコディニウム・コーニィ(C.cohnii))、ネオクロリス(Neochloris)属(例えばネオクロリス・オレオアブンダンス(N.oleoabundans))、またはシゾキトリウム(Schiochytrium)属のものであってよい。本明細書中で藻類種は、例えば、Thompson(Algal Cell Culture.Encyclopedia of Life Support System(EOLSS),Biotechnology Vol 1、eolss.net/sample−chaptersインターネットサイトにて入手可能)(この文献は参照によって本明細書に組み込まれる)に記載されるように培養され、かつ/または操作され得る。
本明細書中の、5’キャップを有していない少なくとも1つのRNA構成要素を含む少なくとも1つのRGENを含む非従来型酵母は、自然界に存在しない。いかなる特定の理論にも拘束されることを望むものではないが、そのような酵母は本来、存在しないと考えられる。というのも、本明細書中のRGENは、例えば、原核生物中に存在することしか見出されなかったためである。また、酵母のある実施形態は、gRNAを含むRNA構成要素を有するRGENを含む(これは、crRNAの、tracrRNAとの異種結合を表す)ことによって、本来存在しないと考えられる。
本明細書中でRGENは、少なくとも1つのCasタンパク質および少なくとも1つのRNA構成要素を含む複合体を指す。適切なCasタンパク質の例として、I型、II型、またはIII型CRISPR系の1つまたは複数のCasエンドヌクレアーゼが挙げられる(Bhaya et al.,Annu.Rev.Genet.45:273−297(参照によって本明細書に組み込まれる))。I型CRISPR Casタンパク質は、例えば、Cas3タンパク質またはCas4タンパク質であってよい。II型CRISPR Casタンパク質は、例えば、Cas9タンパク質であってよい。III型CRISPR Casタンパク質は、例えば、Cas10タンパク質であってよい。好ましい実施形態において、Cas9タンパク質が用いられる。ある実施形態におけるCasタンパク質は、細菌タンパク質または古細菌タンパク質であってよい。本明細書中でI〜III型CRISPR Casタンパク質は典型的に、起源が原核生物である;例えば、I型およびIII型Casタンパク質は、細菌種または古細菌種に由来し得るが、II型Casタンパク質(すなわちCas9)は、細菌種に由来し得る。他の実施形態において、適切なCasタンパク質として、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9、Cas10、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4、それらの相同体、またはそれらの修飾型の1つまたは複数が挙げられる。
開示される本発明の他の態様において、本明細書中でCasタンパク質は、以下の属のいずれに由来してもよい:アエロピルム(Aeropyrum)属、ピロバキュラム(Pyrobaculum)属、スルフォロブス(Sulfolobus)属、アルカエオグロブス(Archaeoglobus)属、ハロアーキュラ(Haloarcula)属、メタノバクテリウム(Methanobacteriumn)属、メタノコッカス(Methanococcus)属、メタノサルシーナ(Methanosarcina)属、メタノピラス(Methanopyrus)属、ピロコッカス(Pyrococcus)属、ピクロフィルス(Picrophilus)属、サーモプラズマ(Thernioplasnia)属、コリネバクテリウム(Corynebacterium)属、マイコバクテリウム(Mycobacterium)属、ストレプトミセス(Streptomyces)属、アクウィフェクス(Aquifrx)属、ポルフィロモナス(Porphvromonas)属、クロロビウム(Chlorobium)属、サームス(Thermus)属、バシラス(Bacillus)属、リステリア(Listeria)属、ブドウ球菌(Staphylococcus)属、クロストリディウム(Clostridium)属、サーモアナエロバクター(Thermoanaerobacter)属、マイコプラズマ(Mycoplasma)属、フゾバクテリウム(Fusobacterium)属、アザーカス(Azarcus)属、クロモバクテリウム(Chromobacterium)属、ナイセリア(Neisseria)属、ニトロソモナス(Nitrosomonas)属、デサルフォビブリオ(Desulfovibrio)属、ジオバクター(Geobacter)属、マイクロコッカス(Myrococcus)属、カンピロバクター(Campylobacter)属、ウォリネラ(Wolinella)属、アシネトバクター(Acinetobacter)属、エルウィニア(Erwinia)属、エシェリキア(Escherichia)属、レジオネラ(Legionella)属、メチロコッカス(Methylococcus)属、パスツレラ(Pasteurella)属、フォトバクテリウム(Photobacterium)属、サルモネラ(Salmonella)属、キサントモナス(Xanthomonas)属、エルシニア(Yersinia)属、連鎖球菌(Streptococcus)属、トレポネーマ(Treponema)属、フランシセラ(Francisella)属、またはテルモトガ(Thermotoga)属。これ以外にも、本明細書中のCasタンパク質は、例えば、米国特許出願公開第2010/0093617号明細書(この文献は参照によって本明細書に組み込まれる)に開示される配列番号462〜465、467〜472、474〜477、479〜487、489〜492、494〜497、499〜503、505〜508、510〜516、または517〜521のいずれによってコードされてもよい。
ある実施形態におけるRGENは、Cas9アミノ酸配列を含む。本明細書中でCas9タンパク質、および本明細書中で他のCasタンパク質のアミノ酸配列は、例えば、連鎖球菌(Streptococcus)属種(例えば、化膿連鎖球菌(S.pyogenes)、肺炎球菌(S.pneumoniae)、サーモフィルス菌(S.thermophilus)、ストレプトコッカス・アガラクティエ(S.agalactiae)、ストレプトコッカス・パラサングイニス(S.parasanguinis)、ストレプトコッカス・オラリス(S.oralis)、ストレプトコッカス・サリバリウス(S.salivarius)、ストレプトコッカス・マカカエ(S.macacae)、ストレプトコッカス・ディスガラクティエ(S.dysgalactiae)、ストレプトコッカス・アンギノサス(S.anginosus)、ストレプトコッカス・コンステラトゥス(S.constellatus)、ストレプトコッカス・シュードポルシヌス(S.pseudoporcinus)、ストレプトコッカス・ミュータンス(S.mutans))、リステリア(Listeria)属種(例えばリステリア・イノキュア(L.innocua))、スピロプラズマ(Spiroplasma)属種(例えばスピロプラズマ・アピス(S.apis)、スピロプラズマ・シルフィディコーラ(S.syrphidicola))、ペプトストレプトコッカス(Peptostreptococcaceae)科種、アトポビウム(Atopobium)属種、ポルフィロモナス(Porphyromonas)属種(例えばポルフィロモナス・カトニアエ(P.catoniae))、プレボテーラ(Prevotella)属種(例えばプレボテラ・インテルメディア(P.intermedia)、ベイロネラ(Veillonella)属種、トレポネーマ(Treponema)属種(例えば、トレポネーマ・ソクランスキィ(T.socranskii)、トレポネーマ・デンティコラ(T.denticola))、カプノシトファガ(Capnocytophaga)属種、フィネゴルディア(Finegoldia)属種(例えばフィネゴルディア・マグナ(F.magna))、コリオバクテリア(Coriobacteriaceae)科種(例えばC.バクテリウム(C.bacterium))、オルセネラ(Olsenella)属種(例えばオルセネラ・プロフューザ(O.profusa))、ヘモフィルス(Haemophilus)属種(例えば、ヘモフィルス・スプトルム(H.sputorum)、ヘモフィルス・ピットマニエ(H.pittmaniae))、パスツレラ(Pasteurella)属種(例えばパスツレラ・ベッティアエ(P.bettyae))、オリビバクター(Olivibacter)属種(例えばオリビバクター・シティエンシス(O.sitiensis))、エピリソニモナス(Epilithonimonas)属種(例えばエピリソニモナス・テナックス(E.tenax))、メソニア(Mesonia)属種(例えばメソニア・モビリス(M.mobilis))、ラクトバシラス(Lactobacillus)属種(例えば乳酸菌(L.plantarum))、バシラス(Bacillus)属種(例えばセレウス菌(B.cereus))、アクイマリーナ(Aquimarina)属種(例えばアクイマリーナ・ムエレリ(A.muelleri))、クリセオバクテリウム(Chryseobacterium)属種(例えばクリセオバクテリウム・パルストレ(C.palustre))、バクテロイデス(Bacteroides)属種(例えばバクテロイデス・グラミニソルベンス(B.graminisolvens))、ナイセリア(Neisseria)属種(例えば髄膜炎菌(N.meningitidis))、フランシセラ(Francisella)属種(例えばフランシセラ・ノビシダ(F.novicida))、またはフラボバクテリウム(Flavobacterium)属種(例えば、フラボバクテリウム・フリギダリウム(F.frigidarium)、フラボバクテリウム・ソリ(F.soli))に由来してよい。本明細書中のある態様において、化膿連鎖球菌(S.pyogenes)Cas9が好ましい。別の例として、Cas9タンパク質は、Chylinski et al.(RNA Biology 10:726−737)(この文献は参照によって本明細書に組み込まれる)に開示されるCas9タンパク質のいずれであってもよい。
したがって、本明細書中でCas9タンパク質の配列は、例えば、GenBank登録番号G3ECR1(サーモフィルス菌(S.thermophilus))、WP_026709422、WP_027202655、WP_027318179、WP_027347504、WP_027376815、WP_027414302、WP_027821588、WP_027886314、WP_027963583、WP_028123848、WP_028298935、Q03JI6(サーモフィルス菌(S.thermophilus))、EGP66723、EGS38969、EGV05092、EHI65578(ストレプトコッカス・シュードポルシヌス(S.pseudoporcinus))、EIC75614(ストレプトコッカス・オラリス(S.oralis))、EID22027(ストレプトコッカス・コンステラトゥス(S.constellatus))、EIJ69711、EJP22331(ストレプトコッカス・オラリス(S.oralis))、EJP26004(ストレプトコッカス・アンギノサス(S.anginosus))、EJP30321、EPZ44001(化膿連鎖球菌(S.pyogenes))、EPZ46028(化膿連鎖球菌(S.pyogenes))、EQL78043(化膿連鎖球菌(S.pyogenes))、EQL78548(化膿連鎖球菌(S.pyogenes))、ERL10511、ERL12345、ERL19088(化膿連鎖球菌(S.pyogenes))、ESA57807(化膿連鎖球菌(S.pyogenes))、ESA59254(化膿連鎖球菌(S.pyogenes))、ESU85303(化膿連鎖球菌(S.pyogenes))、ETS96804、UC75522、EGR87316(ストレプトコッカス・ディスガラクティエ(S.dysgalactiae))、EGS33732、EGV01468(ストレプトコッカス・オラリス(S.oralis))、EHJ52063(ストレプトコッカス・マカカエ(S.macacae))、EID26207(ストレプトコッカス・オラリス(S.oralis))、EID33364、EIG27013(ストレプトコッカス・パラサングイニス(S.parasanguinis))、EJF37476、EJO19166(連鎖球菌(Streptococcus)属種BS35b)、EJU16049、EJU32481、YP_006298249、ERF61304、ERK04546、ETJ95568(ストレプトコッカス・アガラクティエ(S.agalactiae))、TS89875、ETS90967(連鎖球菌(Streptococcus)属種SR4)、ETS92439、EUB27844(連鎖球菌(Streptococcus)属種BS21)、AFJ08616、EUC82735(連鎖球菌(Streptococcus)属種CM6)、EWC92088、EWC94390、EJP25691、YP_008027038、YP_008868573、AGM26527、AHK22391、AHB36273、Q927P4、G3ECR1、またはQ99ZW2(化膿連鎖球菌(S.pyogenes))(これらは参照によって組み込まれる)に開示されるCas9アミノ酸配列のいずれを含んでもよい。これらのCas9タンパク質配列のいずれの変異体が用いられてもよいが、本明細書中のRNA構成要素と関連する場合に、DNAに向けた、特異的な結合活性を、そして場合によってはエンドヌクレオチド結合分解活性を有するべきである。そのような変異体は、基準Cas9のアミノ酸配列と少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%同一であるアミノ酸配列を含んでよい。
これ以外にも、本明細書中のCas9タンパク質は、例えば、米国特許出願公開第2010/0093617号明細書(参照によって本明細書に組み込まれる)に開示される、配列番号462(サーモフィルス菌(S.thermophilus))、474(サーモフィルス菌(S.thermophilus))、489(ストレプトコッカス・アガラクティエ(S.agalactiae))、494(ストレプトコッカス・アガラクティエ(S.agalactiae))、499(ストレプトコッカス・ミュータンス(S.mutans))、505(化膿連鎖球菌(S.pyogenes))、または518(化膿連鎖球菌(S.pyogenes))のいずれによってコードされてもよい。さらにこれ以外にも、本明細書中のCas9タンパク質は、例えば、配列番号11のアミノ酸配列、または配列番号11の残基1〜1368を含んでよい。さらにこれ以外にも、Cas9タンパク質は、例えば、前述のアミノ酸配列のいずれかと少なくとも約80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%同一であるアミノ酸配列を含んでよい。そのような変異体Cas9タンパク質は、本明細書中のRNA構成要素と関連する場合に、DNAに向けた特異的な結合活性を、そして場合によっては、切断またはニッキング活性を有するべきである。
本明細書中で用いられるCasタンパク質(例えばCas9)の起源は、RNA構成要素が由来する同じ種であってもよいし、異なる種であってもよい。例えば、連鎖球菌(Streptococcus)属種(例えば、化膿連鎖球菌(S.pyogenes)またはサーモフィルス菌(S.thermophilus))に由来するCas9タンパク質を含むRGENは、同じ連鎖球菌(Streptococcus)属種に由来する配列(例えば、crRNA反復配列、tracrRNA配列)を有する少なくとも1つのRNA構成要素と複合化されてよい。これ以外にも、本明細書中で用いられるCasタンパク質(例えばCas9)の起源は、RNA構成要素が由来するのとは異なる種であってよい(Casタンパク質およびRNA構成要素は、互いに異種起源であってよい);そのような異種起源のCas/RNA構成要素RGENは、DNAターゲティング活性を有するはずである。
特定の標的DNA配列に向けた、本明細書中のCasタンパク質の結合活性および/またはエンドヌクレオチド結合分解活性の判定は、例えば米国特許第8697359号明細書(この文献は参照によって本明細書に開示される)に開示されるような、当該技術分野において知られているあらゆる適切なアッセイによって評価されてよい。判定は、例えば、非従来型酵母中でCasタンパク質および適切なRNA構成要素を発現させてから、indelの存在が予測されるDNA標的部位を調査することによってなされてよい(Casタンパク質は、この特定のアッセイにおいて、完全なエンドヌクレオチド結合分解活性[二本鎖切断活性]を有することになる)。予測される標的部位でのindelの存在についての調査は、例えば、DNA配列決定法を介して、または標的配列の機能の欠如についてアッセイすることによりindel形成を推測することによって、なされ得る。別の例において、Casタンパク質活性は、標的部位中の配列、またはその近くの配列に相同である配列を含むドナーDNAが提供された非従来型酵母において、Casタンパク質および適切なRNA構成要素を発現させることによって判定され得る。標的部位でのドナーDNA配列の存在(例えば、ドナーと標的配列との首尾良いHRによって予測されるであろう)により、ターゲティングが起こったことが示されることになる。
本明細書中のCasタンパク質、例えばCas9は、典型的にはさらに、異種起源の核局在化配列(NLS)を含む。本明細書中で異種起源のNLSアミノ酸配列は、例えば、本明細書中の酵母細胞の核内でのCasタンパク質の蓄積を検出可能な量で駆動するのに十分な強度のものであり得る。NLSは、塩基性の、正に帯電する残基(例えば、リジンおよび/またはアルギニン)の1つ(一分節)または複数(例えば、二分節)の短い配列(例えば、2〜20残基)を含んでよく、そして、タンパク質表面上に曝されるのであれば、Casアミノ酸配列中のどこに位置決めされてもよい。NLSは、例えば、本明細書中のCasタンパク質のN末端またはC末端に機能可能なように結合してよい。例えば、2つ以上のNLS配列が、Casタンパク質に、例えばCasタンパク質のN末端およびC末端に結合してよい。本明細書中の適切なNLS配列の非限定的な例として、米国特許第6660830号明細書および米国特許第7309576号明細書(例えば、その中でも表1)に開示されるものが挙げられる(これらの文献は双方とも参照によって本明細書に組み込まれる)。本明細書中の有用なNLSの別の例として、配列番号11のアミノ酸残基1373〜1379が挙げられる。
ある実施形態において、Casタンパク質、およびその、Casタンパク質によるDNA特異的ターゲティングを導く各RNA構成要素(例えばcrRNA)は、開示される非従来型酵母と異種起源である。当該RGEN構成要素の異種起源の本質は、Casタンパク質およびその各RNA構成要素が、原核生物(細菌および古細菌)中に存在することしか知られていないという事実によるものである。
本明細書中のCasタンパク質は、場合によっては、酵母細胞での発現のためにコドン最適化されたオープンリーディングフレーム(ORF)を用いて、非従来酵母細胞中で発現されてよい。「コドン最適化された」配列は、本明細書中で、宿主細胞の好ましいコドン使用頻度を模倣するように設計されたコドン使用頻度を有するORFである。酵母(Y.lipolytica)が非従来型酵母細胞である態様において、ORFのコドン最適化は、米国特許第7125672号明細書(この文献は参照によって本明細書に組み込まれる)に提供されるような酵母(Y.lipolytica)コドン使用頻度プロフィールに従って実行されてよい。
一部の実施形態において、Casタンパク質は、1つまたは複数の異種起源のタンパク質ドメイン(例えば、Casタンパク質に加えて1つ、2つ、3つ、またはそれ以上のドメイン)を含む融合タンパク質の一部である。そのような融合タンパク質は、あらゆる付加的なタンパク質配列を、そして場合によっては任意の2つのドメイン間に、例えばCasと第1の異種起源のドメインとの間にリンカー配列を含んでよい。本明細書中でCasタンパク質に融合し得るタンパク質ドメインの例として、限定されないが、エピトープタグ(例えば、ヒスチジン[His]、V5、FLAG、インフルエンザヘマグルチニン[HA]、myc、VSV−G、チオレドキシン[Trx])、リポータ(例えば、グルタチオン−5−トランスフェラーゼ[GST]、ホースラディッシュペルオキシダーゼ[HRP]、クロラムフェニコールアセチルトランスフェラーゼ[CAT]、ベータ−ガラクトシダーゼ、ベータ−グルクロニダーゼ[GUS]、ルシフェラーゼ、緑色蛍光タンパク質[GFP]、HcRed、DsRed、シアン色蛍光タンパク質[CFP]、黄色蛍光タンパク質[YFP]、青色蛍光タンパク質[BFP])、および以下の活性の1つまたは複数を有するドメインが挙げられる:メチラーゼ活性、デメチラーゼ活性、転写活性化活性(例えば、VP16またはVP64)、転写抑制活性、転写終止因子活性、ヒストン修飾活性、RNA切断活性、および核酸結合活性。他の実施形態におけるCasタンパク質は、DNA分子または他の分子、例えばマルトース結合タンパク質(MBP)、S−タグ、Lex A DNA結合ドメイン(DBD)、GAL4A DNA結合ドメイン、および単純ヘルペスウィルス(HSV)VP16と結合するタンパク質と融合し得る。本明細書中でCasタンパク質を含む融合タンパク質の一部であってよい付加的なドメインが、米国特許出願公開第2011/0059502号明細書に開示されており、この文献は参照によって本明細書に組み込まれる。Casタンパク質が異種起源のタンパク質(例えば転写因子)に融合する実施形態において、Casタンパク質は、(本明細書中の適切なRNA構成要素と複合した場合に)DNA認識および結合活性を有するが、DNAニッキング活性も切断活性も有していない。
本明細書中のRGENは、DNA標的配列のDNA鎖に結合することができ、そして場合によってはこれを切断することができる。ある実施形態において、RGENは、DNA標的配列の一方の鎖または双方の鎖を切断することができる。RGENは、例えば、DNA標的配列の双方の鎖を切断することができる。
DNA標的配列の双方の鎖を切断することができる本明細書中のRGENは典型的に、エンドヌクレアーゼドメインの全てを機能的な状態で有するCasタンパク質(例えば、各エンドヌクレアーゼドメインの一部または全ての活性を保持する野生型エンドヌクレアーゼドメインまたはその変異体)を含む。ゆえに、Casタンパク質の各エンドヌクレアーゼドメインの一部または全ての活性を保持する野生型Casタンパク質(例えば、本明細書中に開示されるCas9タンパク質)またはその変異体が、DNA標的配列の双方の鎖を切断することができるRGENの適切な例である。機能的なRuvCおよびHNHヌクレアーゼドメインを含むCas9タンパク質は、DNA標的配列の双方の鎖を切断することができるCasタンパク質の例である。本明細書中でDNA標的配列の双方の鎖を切断することができるRGENは典型的に、カット部位にて平滑末端(すなわち、ヌクレオチド突出部がない)が形成されるように、双方の鎖を同じ位置にてカットする。
DNA標的配列の一本鎖を切断することができる本明細書中のRGENは、本明細書中で、ニッカーゼ活性(例えば、部分的切断能力)を有すると特徴付けられ得る。本明細書中でCasニッカーゼ(例えばCas9ニッカーゼ)は典型的に、CasがDNA標的配列の一本鎖のみを切断する(すなわち、ニックを入れる)ことを可能にする一機能的エンドヌクレアーゼドメインを含む。例えば、Cas9ニッカーゼは、(i)突然変異した、機能不全RuvCドメイン、および(ii)機能的HNHドメイン(例えば野生型HNHドメイン)を含んでよい。別の例として、Cas9ニッカーゼは、(i)機能的RuvCドメイン(例えば野生型RuvCドメイン)、および(ii)突然変異した、機能不全HNHドメインを含んでよい。
本明細書中での使用に適したCas9ニッカーゼの非限定的な例が、Gasiunas et al.(Proc.Natl.Acad.Sci.U.S.A.109:E2579−E2586)、Jinek et al.(Science 337:816−821),Sapranauskas et al.(Nucleic Acids Res.39:9275−9282)、および米国特許出願公開第2014/0189896号明細書に開示されており、これらの文献は参照によって本明細書に組み込まれる。例えば、本明細書中のCas9ニッカーゼは、Asp−31置換(例えば、Asp−31−Ala)(突然変異したRuvCドメインの例)、またはHis−865置換(例えばHis−865−Ala)、Asn−882置換(例えばAsn−882−Ala)、もしくはAsn−891置換(例えばAsn−891−Ala)(突然変異したHNHドメインの例)を有するサーモフィルス菌(S.thermophilus)Cas9を含んでよい。また例えば、本明細書中のCas9ニッカーゼは、Asp−10置換(例えばAsp−10−Ala)、Glu−762置換(例えばGlu−762−Ala)、もしくはAsp−986置換(例えばAsp−986−Ala)(突然変異したRuvCドメインの例)、またはHis−840置換(例えばHis−840−Ala)、Asn−854置換(例えば、Asn−854−Ala)、もしくはAsn−863置換(例えばAsn−863−Ala)(突然変異したHNHドメインの例)を有する化膿連鎖球菌(S.pyogenes)Cas9を含んでよい。化膿連鎖球菌(S.pyogenes)Cas9に関して、3つのRuvCサブドメインは概して、アミノ酸残基1〜59、718〜769、および909〜1098にそれぞれ位置決めされ、HNHドメインは、アミノ酸残基775〜908に位置決めされる(Nishimasu et al.,Cell 156:935−949)。
本明細書中のCas9ニッカーゼは、開示される本発明の非従来型酵母において、種々の目的で用いられ得る。例えば、Cas9ニッカーゼは、適切なドナーポリヌクレオチドとの、DNA標的部位配列での、またはその近くでのHRを誘発するのに用いられてよい。ニックが入ったDNAは、NHEJプロセス用の担体ではなく、HRプロセスによって認識されるので、特定の標的部位のニッキングDNAにより、部位は、適切なドナーポリヌクレオチドとのHRをより受け入れ易くなるはずである。
別の例として、一対のCas9ニッカーゼが、DNAターゲティングの特異度を高めるのに用いられてよい。一般にこれは、2つのCas9ニッカーゼを与えることによってなされ得、これらが、ガイド配列が様々なRNA構成要素との関連により、所望のターゲティング領域における反対側の鎖のDNA配列近くを標的とし、かつそこにニックを入れる。各DNA鎖のそのような近くでの切断により、DSB(すなわち、一本鎖突出部を有するDSB)が生じ、これはその後、NHEJ(indel形成の原因となる)またはHR(提供されるならば、適切なドナーポリヌクレオチドとの組換えの原因となる)用の担体として認識される。これらの実施形態における各ニックは、例えば、互いと少なくとも約5、10、15、20、30、40、50、60、70、80、90、または100(または5から100までのあらゆる整数)塩基離れてよい。先に記載されるように、本明細書中で1つまたは2つのCas9ニッカーゼタンパク質が、Cas9ニッカーゼ対に用いられてよい。例えば、突然変異したRuvCドメインを有するが、機能するHNHドメインのないCas9ニッカーゼ(すなわち、Cas9 HNH+/RuvC−)が用いられてよい(例えば、化膿連鎖球菌(S.pyogenes)Cas9 HNH+/RuvC−)。各Cas9ニッカーゼ(例えば、Cas9 HNH+/RuvC−)は、各ニッカーゼをそれぞれの特定のDNA部位に標的として向けるガイドRNA配列を有する本明細書中の適切なRNA構成要素を用いることによって、互いに近い(最大で100塩基対離れている)特定のDNA部位に導かれることになる。
ある実施形態におけるRGENは、DNA標的部位配列に結合することができるが、標的部位配列にていかなる鎖も切断しない。そのようなRGENは、全ヌクレアーゼドメインが、突然変異した、機能不全であるCasタンパク質を含んでよい。例えば、DNA標的部位配列に結合することができるが、標的部位配列にていかなる鎖も切断しない本明細書中のCas9タンパク質は、突然変異した、機能不全RuvCドメイン、および突然変異した、機能不全HNHドメインの双方を含んでよい。そのようなCas9タンパク質の非限定的な例は、先に開示されるRuvCヌクレアーゼドメイン突然変異およびHNHヌクレアーゼドメイン突然変異(例えば、Asp−10置換、例えばAsp−10−Ala、およびHis−840置換、例えばHis−840−Alaを有する化膿連鎖球菌(S.pyogenes)Cas9)のいずれかを含む。標的DNA配列に結合するがこれを切断しない本明細書中のCasタンパク質は、遺伝子発現を調整するために用いられてよく、例えば、その場合には、Casタンパク質は、転写因子(またはその一部)(例えば、リプレッサまたは活性化因子、例えば本明細書中で開示されるもののいずれか)と融合し得る。例えば、Asp−10置換(例えばAsp−10−Ala)およびHis−840置換(例えばHis−840−Ala)を有する化膿連鎖球菌(S.pyogenes)Cas9を含むCas9は、VP16転写活性化因子ドメインまたはVP64転写活性化因子ドメインに融合し得る。そのようなRGENのRNA構成要素に用いられるガイド配列は、例えば、遺伝子プロモータまたは他の調節要素(例えばイントロン)中のDNA配列と相補的であることになる。
ある態様における酵母は、(i)DNA標的配列の一方のDNA鎖または双方のDNA鎖を切断することができるRGEN、および(ii)DNA標的部位配列(本明細書中のCasタンパク質によって特異的に標的とされる配列)の配列、またはその近くの配列に相同である少なくとも1つの配列を含むドナーポリヌクレオチドを含んでよい。適切なドナーポリヌクレオチドは、標的部位がSSBまたはDSBを含有するならば(例えば、本明細書中のCasタンパク質を用いて導入され得る)、DNA標的部位の配列、またはその近くの配列とのHRに曝され得る。本明細書中のドナーポリヌクレオチド内の「相同配列」は、例えば、標的部位配列の配列、もしくはその近くの配列と100%の同一性を、または標的部位配列の配列、もしくはその近くの配列と少なくとも約95%、96%、97%、98%、もしくは99%の同一性を有する、少なくとも約25、50、75、100、150、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、もしくは10000ヌクレオチド、または約50〜500、50〜550、50〜600、50〜650、もしくは50〜700ヌクレオチドの配列を含んでよく、またはこれからなってよい。
本明細書中のドナーポリヌクレオチドは、例えば、標的部位配列の配列、またはその近くの配列に非相同である配列によって分離される、2つの相同配列(相同アーム)を有してよい。そのようなドナーポリヌクレオチドと標的部位配列とのHRにより、典型的には、ドナーポリヌクレオチドの非相同配列との、標的部位の配列の置換が生じる(ドナーポリヌクレオチドの相同アームに相同である標的部位配列間に位置決めされる標的部位配列は、ドナーポリヌクレオチドの非相同配列によって置換される)。2本の相同アームを有するドナーポリヌクレオチドにおいて、アームは、例えば、少なくとも約1、2、3、4、5、10、20、30、40、50、75、100、250、500、1000、2500、5000、10000、15000、20000、25000、または30000ヌクレオチドによって分離されてよい(すなわち、ドナーポリヌクレオチド中の非相同配列は、少なくとも約1、2、3、4、5、10、20、30、40、50、75、100、250、500、1000、2500、5000、10000、15000、20000、25000、または30000ヌクレオチド長である)。各相同アームの長さ(例えば、相同配列について先に開示される長さのいずれか)は、同じであっても異なってもよい。標的部位の各相同配列、またはその近くの各相同配列との各アームのパーセント同一性(例えば、相同配列について先に開示される%同一性のいずれか)は、同じであっても異なってもよい。
ドナーポリヌクレオチド中の対応する相同配列に相同である標的部位配列のDNA配列、またはその近くの(代わりに、その場所にある、またはそれに近接する)DNA配列は、例えば、標的配列中の予測されるCasタンパク質カット部位(DSBまたはニック)から、約1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90、100、150、200、250、300、450、500、750、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000、または60000(または1から60000までのあらゆる整数)ヌクレオチド(例えば、約1〜1000、100〜1000、500〜1000、1〜500、または100〜500ヌクレオチド)以内にあってよい。これらのヌクレオチド距離は、カット部位から上流方向に、または下流方向に進む、カット部位から相同配列の第1のヌクレオチドまでで評価されてよい。例えば、ドナーポリヌクレオチド中の対応する配列に相同である標的配列近くの配列は、標的配列中の予測されるCasタンパク質カット部位の下流500ヌクレオチド塩基対から開始してよい。本明細書中で2本の相同アーム(例えば、非相同配列によって分離される第1および第2の相同アーム)を有するドナーポリヌクレオチドを利用する実施形態において、相同配列(相同性においてドナーの第1の相同アームと対応する)は、例えば、予測されるCasカット部位の上流にあってよく、相同配列(相同性においてドナーの第2の相同アームと対応する)は、予測されるCasカット部位の下流にあってよい。これらの上流の相同配列および下流の相同配列のそれぞれの、予測されるカット部位からのヌクレオチド距離は、同じであっても異なってもよく、例えば、先に開示されるヌクレオチド距離のいずれであってもよい。例えば、相同配列(相同性においてドナーの第1の相同アームと対応する)の3’末端は、予測されるCasカット部位の上流600ヌクレオチド塩基対に位置決めされてよく、相同配列(相同性においてドナーの第2の相同アームと対応する)の5’末端は、予測されるCasカット部位の下流400ヌクレオチド塩基対に位置決めされてよい。
本明細書中のRGENは、非従来型酵母の染色体、エピソーム、またはゲノム中の他のあらゆるDNA分子における標的部位配列のDNA鎖に結合することができ、そして場合によってはこれを切断することができる。標的配列のこの認識および結合は、RGENのRNA構成要素が、標的配列の鎖と相補的である配列(ガイド配列)を含むならば、特異的である。ある実施形態における標的部位は、固有であってよい(すなわち、対象ゲノム中に標的部位配列が1つ存在する)。
本明細書中で標的配列の長さは、例えば、少なくとも13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、もしくは30ヌクレオチド;13から30ヌクレオチド;17から25ヌクレオチド;または17から20ヌクレオチドであってよい。この長さは、PAM配列を含んでも除いてもよい。また、本明細書中で標的配列の鎖は、ガイド配列とハイブリダイズし、かつCasタンパク質またはCasタンパク質複合体の、標的配列への配列特異的結合を導くのに十分な、(crRNAまたはgRNAの)ガイド配列との相補性を有する(適切なPAMが標的配列に隣接する場合、以下参照)。ガイド配列と、その対応するDNA標的配列の鎖との相補性の程度は、例えば、少なくとも約90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%である。本明細書中で標的部位は、例えば、遺伝子産物(例えば、タンパク質またはRNA)をコードする配列中に位置決めされてもよいし、非コード配列(例えば、調節配列または「ジャンク」配列)中に位置決めされてもよい。
PAM(プロトスペーサ隣接モチーフ)配列が、標的部位配列に隣接してよい。PAM配列は、本明細書中のRGENによって認識される短いDNA配列である。関連するPAM、およびDNA標的配列の最初の11のヌクレオチドは、Cas9/gRNAターゲティングおよび切断にとっておそらく重要である(Jiang et al.,Nat.Biotech.31:233−239)。本明細書中でPAM配列の長さは、用いられるCasタンパク質またはCasタンパク質複合体に応じて変動し得るが、典型的には、例えば、2、3、4、5、6、7、または8ヌクレオチド長である。PAM配列は、例えば、標的部位中で、RNA構成要素のガイド配列と相補的である鎖と相補的である標的部位配列から直ぐ下流にあり、またはその下流2または3ヌクレオチド以内にある。RGENが、RNA構成要素と複合化した、エンドヌクレオチド結合分解活性のあるCas9タンパク質である本明細書中の実施形態において、Cas9は、RNA構成要素によって導かれて標的配列に結合し、PAM配列の上流にある第3のヌクレオチド位置の直ぐ5’側の双方の鎖を切断する。標的部位の以下の例を考える:PAM配列:
Nは、A、C、T、またはGであってよく、Xは、この例の配列において、A、C、T、またはGであってよい(Xは、NPAMと呼ぶこともできる)。PAM配列は、この例において、XGGである(下線が引かれている)。適切なCas9/RNA構成要素複合体は、この標的を、二重下線が引かれたNの直ぐ5’側で切断することになる。配列番号46におけるNのストリングは、例えば、本明細書中のRNA構成要素中のガイド配列と少なくとも約90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%同一の標的配列を表す(DNA標的配列のどのTも、RNAガイド配列の全てのUとアラインすることになる)。Cas9複合体のRNA構成要素のガイド配列は、この標的配列(本明細書中の標的部位を代表する)での認識および結合の際に、Nのストリングの相補体配列とアニールすることになる;ガイド配列と標的部位相補体とのパーセント相補性は、例えば、少なくとも約90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%である。Cas9ニッカーゼがゲノム中の配列番号46を標的とするのに用いられる場合、ニッカーゼは、ニッカーゼ中のどのエンドヌクレアーゼドメインが機能不全であるかに応じて、相補鎖の、二重下線が引かれたNの直ぐ5’側、または同じ位置にニックを入れることになる。核酸分解活性を有していないCas9(RuvCドメインおよびHNHドメインの双方が機能不全)がゲノム中の配列番号46を標的とするのに用いられる場合、標的配列を認識してこれに結合することになるが、配列にいかなるカットも入れることはない。
本明細書中でPAMは典型的に、利用されることになるRGENのタイプを考慮して選択される。本明細書中でPAM配列は、Cas、例えば、Casが由来し得る、本明細書中に開示されるあらゆる種に由来する、例えばCas9を含むRGENによって認識されるものであってよい。ある実施形態において、PAM配列は、化膿連鎖球菌(S.pyogenes)、サーモフィルス菌(S.thermophilus)、ストレプトコッカス・アガラクティエ(S.agalactiae)、髄膜炎菌(N.meningitidis)、トレポネーマ・デンティコラ(T.denticola)、またはフランシセラ・ノビシダ(F.novicida)に由来するCas9を含むRGENによって認識されるものであってよい。例えば、化膿連鎖球菌(S.pyogenes)に由来する適切なCas9は、NGGのPAM配列(配列番号47;Nは、A、C、T、またはGであってよい)を有するゲノム配列を標的とするのに用いられ得る。他の例として、以下のPAM配列を有するDNA配列を標的とする場合、適切なCas9が、以下の種のいずれかに由来してよい:サーモフィルス菌(S.thermophilus)(NNAGAA[配列番号48])、ストレプトコッカス・アガラクティエ(S.agalactiae)(NGG[配列番号47])、NNAGAAW[配列番号49、Wは、AまたはTである]、NGGNG[配列番号50])、髄膜炎菌(N.meningitidis)(NNNNGATT[配列番号51])、トレポネーマ・デンティコラ(T.denticola)(NAAAAC[配列番号52])、またはフランシセラ・ノビシダ(F.novicida)(NG[配列番号53])(これらの特定の全PAM配列中のNは、A、C、T、またはGである)。本明細書中の有用なCas9/PAMの他の例として、Shah et al.(RNA Biology 10:891−899)およびEsvelt et al.(Nature Methods 10:1116−1121)に開示されるものが挙げられ、これらの文献は参照によって本明細書に組み込まれる。本明細書中の標的配列の例は、配列番号46に従うが、「XGG」PAMは、前述のPAMのいずれか1つによって置換されている。
5’キャップを有していない少なくとも1つのRNA構成要素が、本明細書中の実施形態におけるRGENに含まれる。このキャップ離脱RNA構成要素は、非従来型酵母中の染色体またはエピソームにおける標的部位配列と相補的な配列を含む。RGENは特異的に、この配列相補体に基づいて標的部位のDNA鎖に結合し、そして場合によってはこれを切断する。ゆえに、開示される本発明の実施形態におけるRNA構成要素の相補配列はまた、ガイド配列または可変ターゲティングドメインと呼ぶこともできる。
本明細書中のRNA構成要素のガイド配列(例えば、crRNAまたはgRNA)は、例えば、少なくとも13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、もしくは30リボヌクレオチド長;13〜30リボヌクレオチド長;17〜25リボヌクレオチド長;または17〜20リボヌクレオチド長であってよい。一般に、本明細書中のガイド配列は、標的配列とハイブリダイズし、かつCasタンパク質またはCasタンパク質複合体の、標的配列への配列特異的結合を導くのに十分な、標的DNA配列の鎖との相補性を有する(適切なPAMが標的配列に隣接する場合)。例えば、ガイド配列と、その対応するDNA標的配列との相補性の程度は、少なくとも約90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%である。ガイド配列は、酵母細胞中のDNA標的配列にRGENを標的として向けるように、然るべく操作されてよい。
本明細書中のRNA構成要素は、例えば、ガイド配列およびリピート(tracrRNAメイト)配列を含むcrRNAを含んでよい。ガイド配列は典型的に、crRNAの5’末端に、またはその近く(1、2、3、4、5、6、7、8、9、10、またはそれ以上の塩基以内)に位置決めされる。crRNAのガイド配列の下流には、tracrRNAの5’末端の配列と相補的であり、かつこれとハイブリダイズすることができる「リピート」配列または「tracrRNAメイト」配列がある。ガイド配列およびtracrRNAメイト配列は、直接隣接してもよいし、例えば、1、2、3、4、またはそれ以上の塩基によって分離されてもよい。tracrRNAメイト配列は、例えば、tracrRNAの5’末端に対する配列相補性が、少なくとも50%、60%、70%、80%、90%、95%、96%、97%、98%、または99%である。一般に、相補性の程度は、2つの配列のうちのより短い方の全長に沿う、tracrRNAメイト配列およびtracrRNA配列の最適アラインメントに関するものであってよい。本明細書中のtracrRNAメイト配列の長さは、例えば、少なくとも8、9、10、11、12、13、14、15、16、17、または18リボヌクレオチド長であってよく、そしてtracrRNAの5’末端の同じ、または類似した長さ(例えば、プラスマイナス1、2、3、4、または5塩基)の配列とハイブリダイズする。本明細書中のtracrRNAメイト配列の適切な例が、配列番号54(guuuuuguacucucaagauuua)、配列番号55(guuuuuguacucuca)、配列番号56(guuuuagagcua、実施例参照)、もしくは配列番号57(guuuuagagcuag)、またはその変異体を含み、これらは、(i)少なくとも約90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%の配列同一性を有し、かつ(ii)tracrRNAの5’末端配列とアニールすることができる。本明細書中のcrRNAの長さは、例えば、少なくとも約18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、もしくは48リボヌクレオチド;約18〜48リボヌクレオチド;または約25〜50リボヌクレオチドであってよい。
tracrRNAは、II型CRISPR系のCas9タンパク質がRGEN中に含まれる実施形態において、crRNAと共に含まれるべきである。本明細書中のtracrRNAは、5’から3’の方向に、(i)crRNAのリピート領域(tracrRNAメイト配列)とアニールする配列、および(ii)ステムループ含有部分を含む。(i)の配列の長さは、例えば、先に開示されるtracrRNAメイト配列長のいずれかと同じであってもよいし、類似(例えば、プラスマイナス1、2、3、4、または5塩基)であってもよい。本明細書中のtracrRNA(すなわち、配列構成要素[i]および[ii])の全長は、例えば、少なくとも約30、35、40、45、50、55、60、65、70、75、80、85、または90(または30から90までのあらゆる整数)リボヌクレオチドであってよい。tracrRNAはさらに、3’末端に1、2、3、4、5、またはそれ以上のウラシル残基を含んでよく、これは、転写ターミネータ配列によるtracrRNAの発現によって存在し得る。
本明細書中のtracrRNAは、例えば、Cas9配列が由来してよい、先に記載されるいずれの細菌種に由来してもよい。適切なtracrRNA配列の例として、米国特許第8697359号明細書、およびChylinski et al.(RNA Biology 10:726−737)に開示されるものが挙げられ、これらの文献は参照によって本明細書に組み込まれる。本明細書中の好ましいtracrRNAは、連鎖球菌(Streptococcus)属種のtracrRNA(例えば、化膿連鎖球菌(S.pyogenes)、サーモフィルス菌(S.thermophilus))に由来してよい。本明細書中のtracrRNAの他の適切な例は、以下を含んでよく:
配列番号58:
uagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaaguggcaccgagucggugc(実施例参照)、
配列番号59:
uagcaaguuaaaauaaggcuaguccguuaucaacuugaaaaagug、または
配列番号60:
uagcaaguuaaaauaaggcuaguccguuauca、
これらは化膿連鎖球菌(S.pyogenes)のtracrRNAに由来する。本明細書中のtracrRNAの他の適切な例は、以下:
配列番号61:
uaaaucuugcagaagcuacaaagauaaggcuucaugccgaaaucaacacccugucauuuuauggcaggguguuuucguuauuuaa、
配列番号62:
ugcagaagcuacaaagauaaggcuucaugccgaaaucaacacccugucauuuuauggcaggguguuuucguuauuua、または
配列番号63:
ugcagaagcuacaaagauaaggcuucaugccgaaaucaacacccugucauuuuauggcagggugu、
を含んでよく、これらは、サーモフィルス菌(S.thermophilus)のtracrRNAに由来する。
本明細書中のtracrRNAのさらに他の例は、これらのtracrRNA配列番号の変異体であって、(i)tracrRNA配列番号と少なくとも約80%、85%、90、91、92、93、94、95、96、97、98、または99%の配列同一性を有し、かつ(ii)tracrRNAとして機能することができる変異体である(例えば、5’末端配列は、crRNAのtracrRNAメイト配列にアニールすることができ、5’末端配列から下流の配列は、1つまたは複数のヘアピンを形成することができ、変異体tracrRNAは、Cas9タンパク質と複合体を形成することができる)。
本明細書中に開示されるRGENのRNA構成要素は、例えば、tracrRNAに機能可能なように結合する、またはこれに融合するcrRNAを含むガイドRNA(gRNA)を含んでよい。ある好ましい実施形態におけるgRNAのcrRNA構成要素は、tracrRNA構成要素の上流にある(すなわち、例えばgRNAは、5’から3’の方向に、tracrRNAに機能可能なように結合するcrRNAを含む)。本明細書(例えば、先の実施形態)中に開示されるあらゆるcrRNAおよび/またはtracrRNA(および/またはその一部、例えば、crRNAリピート配列、tracrRNAメイト配列、またはtracrRNAの5’末端配列)は、例えば、gRNA中に含まれてよい。
本明細書中のgRNAのcrRNA構成要素のtracrRNAメイト配列は、tracrRNA構成要素の5’末端とアニールすることによって、ヘアピン構造を形成することができるべきである。(crRNA構成要素の)tracrRNAメイト配列と、(tracrRNA構成要素の)5’末端配列との長さ、およびパーセント相補性に関する先の開示はいずれも、例えば、gRNAのcrRNA構成要素およびtracrRNA構成要素を特徴付けることができる。このアニーリングを促進するために、crRNA構成要素およびtracrRNA構成要素の機能可能な結合または融合は好ましくは、適切なループ形成リボヌクレオチド配列を含む(すなわち、ループ形成配列が、crRNA構成要素およびtracrRNA構成要素をまとめて結合して、gRNAを形成し得る)。RNAループ形成配列の適切な例として、GAAA(配列番号43、実施例参照)、CAAA(配列番号44)、およびAAAG(配列番号45)が挙げられる。しかしながら、代わりのループ配列として、より長い、またはより短いループ配列が用いられてもよい。ループ配列は好ましくは、リボヌクレオチドトリプレット(例えば、AAA)を、そしてトリプレットのどちらかの末端に付加的なリボヌクレオチド(例えば、CまたはG)を含む。
本明細書中のgRNAは、その(crRNA構成要素の)tracrRNAメイト配列部分およびtracrRNAの5’末端配列部分のアニーリングにより、ヘアピン(「第1のヘアピン」)を形成する。1つまたは複数(例えば、1、2、3、または4つ)の付加的なヘアピン構造が、gRNAのtracrRNA構成要素の配列に応じて、この第1のヘアピンから下流に形成されてよい。したがって、gRNAは、例えば、最大5つのヘアピン構造を有し得る。gRNAはさらに、例えば、gRNA配列の末端に続く、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、またはそれ以上の残基を含んでよく、これは、転写ターミネータ配列によるgRNAの発現によって存在し得る。これらの付加的な残基は、例えば、ターミネータ配列の選択に応じて、全てがU残基であってもよいし、少なくとも90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%がU残基であってもよい。
開示される本発明に有用な、適切なgRNAの非限定的な例は、以下を含んでよい:
配列番号64〜70のそれぞれにおいて、一重下線が引かれた配列は、gRNAのcrRNA部分を表す。各「N」は、適切なガイド配列のリボヌクレオチド塩基(A、U、G、またはC)を表す。小文字の第1のブロックは、tracrRNAメイト配列を表す。小文字の第2のブロックは、gRNAのtracrRNA部分を表す。二重下線が引かれた配列は、tracrRNAメイト配列とアニールして、第1のヘアピンを形成するtracrRNA配列の部分に接近する。ループ配列(GAAA、配列番号43)は大文字で示され、これは、各gRNAのcrRNA部分およびtracrRNA部分と機能可能なように結合する。本明細書中のgRNAの他の例として、前述のgRNAの変異体であって、(i)前述のgRNAの配列と少なくとも約80%、85%、90、91、92、93、94、95、96、97、98、または99%の配列同一性を有し(この計算において、ガイド配列は除外する)、かつ(ii)Cas9タンパク質を特異的に標的として、標的DNA配列と結合し、場合によってはこれにニックを入れ、またはこれを切断するgRNAとして機能し得る変異体が挙げられる。
本明細書中のgRNAはまた、ガイド配列(VTドメイン)に続いてCasエンドヌクレアーゼ認識(CER)ドメインを有する観点から特徴付けられ得る。CERドメインは、tracrRNAメイト配列に続いてtracrRNA配列を含む。本明細書中の有用なCERドメインの例として、先の配列番号64〜70に含まれるものが挙げられる(それぞれにおけるCERドメインは、VTドメインのNに続く配列である)。CERドメインの別の適切な例が、配列番号1であり(実施例参照)、これは、5’から3’の方向に、配列番号56のtracrRNAメイト配列、配列番号43のループ形成配列(GAAA)、および配列番号58のtracrRNA配列を含む。
開示される本発明のRGENのRNA構成要素は、5’キャップ(7−メチルグアニル酸[m7G]キャップ)を有していない。ゆえに、本明細書中のRNA構成要素は、その5’末端に7メチルグアニル酸(m7G)キャップを有していない。本明細書中のRNA構成要素の、5’キャップの代わりに、例えば、5’水酸基を有してよい。これ以外にも、本明細書中のRNA構成要素は、例えば、5’キャップの代わりに、5’リン酸を有してよい。RNA構成要素は、転写後、核中により十分に蓄積し得ると考えられる。というのも、5’キャッピングされたRNA(すなわち、5’m7Gキャップを有するRNA)は、核搬出を受けるからである。本明細書中のキャップ離脱RNA構成要素の好ましい例として、適切なgRNA、crRNA、および/またはtracrRNAが挙げられる。ある実施形態において、本明細書中のRNA構成要素は、RNA構成要素の前駆体の5’末端でのリボザイム配列によるRNA自動プロセシングによって、5’キャップを欠き、場合によっては、その代わりとして5’水酸基を有する(すなわち、gRNA等のRNA構成要素の上流にリボザイム配列を含む前駆体RNAは、リボザイム配列を除去するリボザイム媒介自動プロセシングを受けることによって、RNA構成要素の下流は、5’キャップを欠いたままとなる)。ある他の実施形態において、本明細書中のRNA構成要素は、RNAポリメラーゼIII(Pol III)プロモータからの転写によって生じない。
ある実施形態における酵母はさらに、(i)プロモータ、そして(ii)これが機能可能なように結合する、RNA構成要素をコードするヌクレオチド配列を含むDNAポリヌクレオチド配列を含む。このポリヌクレオチド配列は、酵母によって、Casタンパク質と複合化してRGENを形成するRNA構成要素を発現するために用いられる。そのようなポリヌクレオチド配列は、例えば、プラスミド、酵母人工染色体(YAC)、コスミド、ファージミド、細菌人工染色体(BAC)、ウィルス、または線状DNA(例えば、線状PCR産物)の形態であってもよいし、非従来型酵母細胞中にポリヌクレオチド配列を移すのに有用な他のタイプのあらゆるベクターまたは構築体であってもよい。本明細書中でこのポリヌクレオチド配列は、一時的に存在してもよいし(すなわち、ゲノム中に組み込まれない)、酵母細胞内に安定して存在してもよい(すなわち、ゲノム中に組み込まれる)。また、このポリヌクレオチド配列は、1つまたは複数の適切なマーカー配列(例えば、選択マーカーまたは表現型マーカー)を含んでもよいし、欠いていてもよい。
RNA構成要素発現用のポリヌクレオチド配列に含まれる適切なプロモータは、本明細書中で、非従来型酵母細胞において機能可能であり、そして例えば、構成的であっても誘導可能であってもよい。ある態様におけるプロモータは、強プロモータを含んでよく、これは、単位時間あたり比較的多数の生産開始を導くことができるプロモータであり、かつ/または、酵母を含む酵母における遺伝子の平均転写レベルよりも高い転写レベルを駆動するプロモータである。
本明細書中で有用な強プロモータの例として、米国特許出願公開第2012/0252079号明細書(DGAT2)、米国特許出願公開第2012/0252093号明細書(EL1)、米国特許出願公開第2013/0089910号明細書(ALK2)、米国特許出願公開第2013/0089911号明細書(SPS19)、米国特許出願公開第2006/0019297号明細書(GPDおよびGPM)、米国特許出願公開第2011/0059496号明細書(GPDおよびGPM)、米国特許出願公開第2005/0130280号明細書(FBA、FBAIN、FBAINm)、米国特許出願公開第2006/0057690号明細書(GPAT)、および米国特許出願公開第2010/0068789号明細書(YAT1)に開示されるものが挙げられ、これらの文献は参照によって本明細書に組み込まれる。適切な強プロモータの他の例として、表2に記載されるものが挙げられる。
上に列挙される強プロモータは、酵母(Yarrowia lipolytica)由来であるが、本明細書中に開示されるあらゆる非従来型酵母に由来する、その対応するプロモータ(例えば、相同体)は、例えば、強プロモータとして機能し得ると考えられる。ゆえに、強プロモータは、例えば、XPR2、TEF、GPD、GPM、GPDIN、FBA、FBAIN、FBAINm、GPAT、YAT1、EXP1、DGAT2、EL1、ALK2、またはSPS19プロモータを含んでよい。これ以外にも、前述のいずれかに対応するような強プロモータが、他のタイプの酵母(例えば、出芽酵母(S.cerevisiae)、シゾサッカロミセス・ポンベ(S.pombe))に由来し得る(例えば、米国特許出願公開第2010/0150871号明細書(この文献は参照によって本明細書に組み込まれる)に開示されるあらゆる強プロモータ)。本明細書中で有用な強プロモータの他の例として、PGK1、ADH1、TDH3、TEF1、PHO5、LEU2、およびGAL1プロモータ、ならびにVelculescu et al.(Cell 88:243−251)に開示される強酵母プロモータが挙げられ、この文献は参照によって本明細書に組み込まれる。本明細書中で有用な強プロモータのさらに別の例は、配列番号12(ヤロウイア(Yarrowia)属FBA1プロモータ配列)を含んでよい。
本明細書中でプロモータは、ある実施形態において、RNAポリメラーゼII(Pol II)プロモータを含んでよい。先に列挙した全ての強プロモータは、適切なPol IIプロモータの例であると考えられる。Pol IIプロモータからの転写は、例えば、少なくとも約12のタンパク質(例えば、RPB1−RPN12タンパク質)のRNAポリメラーゼII複合体の形成を含んでよい。本明細書中でPol IIプロモータから転写されるRNAは典型的に、5’キャッピングされる(例えば、5’末端にm7G基を含有する)。本明細書中のRNA構成要素は5’キャップを有していないので、本明細書中でPol IIプロモータから発現される場合、RNA構成要素から5’キャップを除去する手段が利用されるべきである。本明細書中でPol II転写RNA構成要素から5’キャップを効果的に除去する適切な手段として、例えば、1つまたは複数のリボザイム(下記参照)、グループ1自己スプライシングイントロン、およびグループ2自己スプライシングイントロンの適切な使用が挙げられる。
本明細書中の、RNA構成要素をコードするヌクレオチド配列はさらに、例えば、リボザイムをコードしてよく、これは、RNA構成要素をコードする配列の上流にある。ゆえに、ある実施形態における酵母はさらに、(i)プロモータ、そして(ii)これが機能可能なように結合する、5’から3’の方向にリボザイムおよびRNA構成要素をコードするヌクレオチド配列を含むDNAポリヌクレオチド配列を含む。そのようなポリヌクレオチド配列から発現される転写産物は自己触媒的に、リボザイム配列を除去して、5’キャップを有していないがRNA構成要素配列を含むRNAを生成する。この「自動プロセシングされた」RNAは、例えば、crRNAまたはgRNAを含んでよく、そしてCasタンパク質、例えばCas9と複合化することよって、RGENを形成することができる。
本明細書中のリボザイムは、例えば、ハンマーヘッド(HH)リボザイム、デルタ型肝炎ウィルス(HDV)リボザイム、グループIイントロンリボザイム、RnasePリボザイム、またはヘアピンリボザイムであってよい。本明細書中のリボザイムの他の非限定的な例として、Varkudサテライト(VS)リボザイム、グルコサミン−6−リン酸活性化リボザイム(glmS)、およびCPEB3リボザイムが挙げられる。Lilley(Biochem.Soc.Trans.39:641−646)は、リボザイムの構造および活性に関する情報を開示している。本明細書中で用いるのに適しているはずであるリボザイムの例として、EP0707638号明細書、ならびに米国特許第6063566号明細書、米国特許第5580967号明細書、米国特許第5616459号明細書および米国特許第5688670号明細書に開示されるリボザイムが挙げられ、これらの文献は参照によって本明細書に組み込まれる。
ハンマーヘッドリボザイムは、ある好ましい実施形態において用いられる。このタイプのリボザイムは、例えば、Hammann et al.(RNA 18:871−885)(この文献は、参照によって本明細書に組み込まれる)に開示されるように、I型、II型、またはIII型ハンマーヘッドリボザイムであってよい。ハンマーヘッドリボザイムをコードするDNAを同定する複数の手段が、Hammann et al.に開示されており、これらが本明細書中で然るべく利用され得る。本明細書中のハンマーヘッドリボザイムは、例えば、ウィルス、ウィロイド、植物ウィルスサテライトRNA、原核生物(例えば、古細菌、シアノバクテリア、アシドバクテリア)、または真核生物、例えば植物(例えば、シロイヌナズナ(Arabidopsis thaliana)、カーネーション)、原生生物(例えば、アメーバ、ユーグレナ)、菌類(例えば、アスペルギルス(Aspergillus)属、酵母(Y.lipolytica))、両生類(例えば、イモリ、カエル)、住血吸虫、昆虫(例えばコオロギ)、軟体動物、哺乳類(例えば、マウス、ヒト)、もしくは線虫に由来してよい。
本明細書中のハンマーヘッドリボザイムは典型的に、3つの塩基対形成ヘリックスを含み、それぞれ、ヘリックスI、II、およびIIIと呼ばれ、保存配列の短リンカーによって分離されている。ハンマーヘッドリボザイムの3つの型(I〜III)は一般に、リボザイムの5’末端および3’末端がどのヘリックスに含まれるかに基づく。例えば、ハンマーヘッドリボザイム配列の5’末端および3’末端がステムIに寄与するならば、I型ハンマーヘッドリボザイムと呼ぶことができる。3つの起こり得る位相型のうち、I型は、原核生物、真核生物、およびRNA植物病原体のゲノム中に見出され得るが、II型ハンマーヘッドリボザイムは、原核生物において記載されたのみであり、III型ハンマーヘッドリボザイムは殆どの場合、植物、植物病原体、および原核生物中に見出される。ある実施形態におけるハンマーヘッドリボザイムは、I型ハンマーヘッドリボザイムである。
ある実施形態において、ハンマーヘッドリボザイムをコードする配列は、少なくとも約40、50、60、70、80、90、100、110、120、130、140、もしくは150(または、40から150までのあらゆる整数)ヌクレオチド、40〜100ヌクレオチド、または40〜60ヌクレオチドを含んでよい。
ハンマーヘッドリボザイムをコードする配列は、RNA構成要素をコードする配列の上流にある。本明細書中のハンマーヘッドリボザイムをコードする配列は、例えば、RNA構成要素のガイド配列(例えば、ガイド配列は、crRNAのものであってもgRNAのものであってもよい)をコードする配列の直ぐ5’側であってもよいし、5’側の少なくとも2、3、4、5、6、7、8、9、または10ヌクレオチドにあってもよい。ハンマーヘッドリボザイムの最初の5、6、7、8、9、10、11、12、13、14、または15リボヌクレオチドは典型的に、ハンマーヘッドリボザイム配列の直ぐ下流の配列の最初の同数のリボヌクレオチドにそれぞれ相補的であるべきである。例えば、本明細書中のポリヌクレオチド配列が、RNA構成要素のガイド配列の直ぐ上流にハンマーヘッドリボザイムを含むRNAをコードするならば、リボザイムの最初の6リボヌクレオチドは、例えば、ガイド配列の最初の6リボヌクレオチドと相補的であってよい。この例では、ハンマーヘッドリボザイムは、ガイド配列の第1の位置の直ぐ上流にあるRNA転写産物を切断することになる(または、別の言い方をすれば、ハンマーヘッドリボザイムは、リボザイム配列の直ぐ下流にあるRNA転写産物を切断することになる)。この論理は、他の前述の例となる実施形態に同様に当てはまる。例えば、本明細書中のポリヌクレオチド配列が、RNA構成要素のガイド配列の8残基上流に(例えば、8残基スペーサ配列がある)ハンマーヘッドリボザイム配列を含むRNAをコードするならば、リボザイムの最初の6リボヌクレオチドは、例えば、リボザイム配列の直ぐ3’側の6リボヌクレオチドと相補的であってよい。この例において、ハンマーヘッドリボザイムは、リボザイム配列の直ぐ下流にあるRNA転写産物を切断することになる。さらに別の例として、本明細書中のポリヌクレオチド配列が、RNA構成要素のガイド配列の直ぐ上流にハンマーヘッドリボザイム配列を含むRNAをコードするならば、リボザイムの最初の10リボヌクレオチドは、例えば、ガイド配列の最初の10リボヌクレオチドと相補的であってよい。この例において、ハンマーヘッドリボザイムは、ガイド配列の最初の位置の直ぐ上流にあるRNA転写産物を切断することになる(または、別の言い方をすれば、ハンマーヘッドリボザイムは、リボザイム配列の直ぐ下流にあるRNA転写産物を切断することになる)。
ハンマーヘッドリボザイム配列の例が、以下のように示され得る:
配列番号15の最初の6残基は、本明細書中のDNAポリヌクレオチドから発現されるRNA転写産物中の配列番号15の直ぐ後ろに、(例えば、本明細書中に開示されるcrRNAまたはgRNAのガイド配列の)最初の6残基と相補的である(とアニールする)ように設計されてよい。リボザイムは、配列番号15の直ぐ後ろにある転写産物を切断することになる。配列番号15は、配列番号15の直ぐ後ろの配列残基とアニールする6残基(「N」)と共に示されているが、この目的のために、このリボザイムの始まりに5〜15「N」残基が存在してよい。なお、配列番号15を含むRNA転写産物により、(i)ハンマーヘッドリボザイムのヘリックスIが、転写産物におけるN残基の、配列番号15の直ぐ後ろの最初の6残基とのアニーリングによって形成されることになり、(ii)ヘリックスIIが、一重下線により示される相補配列のアニーリングによって形成されることになり、そして(iii)ヘリックスIIIが、二重下線により示される相補配列のアニーリングによって形成されることになる。ゆえに、ある実施形態におけるハンマーヘッドリボザイムは、(i)配列番号15と少なくとも約80%、85%、90、91、92、93、94、95、96、97、98、または99%の配列同一性を有し(この計算において、「N」配列は除外する)、かつ(ii)互いにアニールしてヘリックスIIおよびヘリックスIIIを形成する(ヘリックスIは、「N」残基の適切な選択によって形成される)、配列番号15の一重下線領域および二重下線領域とアラインする領域を有する、配列番号15の変異体であってよい。
配列番号15、およびその(上記の)種々の実施形態に結合し得る配列の例として、配列番号64〜70の1つを含むgRNAが挙げられる。
本明細書中の、RNA構成要素に結合する5’ハンマーヘッドリボザイムを含むRNA配列(本明細書の「リボザイム−RNA構成要素カセット」)をコードするDNAポリヌクレオチドは、ハンマーヘッドリボザイム配列の5’末端の直ぐから始まる転写産物の転写を駆動するように設計されてよい(すなわち、リボザイム配列は、転写開始点から始まる)。これ以外にも、DNAポリヌクレオチドは、リボザイム−RNA構成要素カセットから上流に非リボザイム配列を有する転写産物の転写を駆動するように設計されてもよい。そのような5’非リボザイム転写産物の配列は、例えば、数ヌクレオチド(1〜10)長しかなくてもよいし、最大5000〜20000ヌクレオチド長もあってもよい(リボザイムのこの5’側配列は、リボザイムがそれ自体をRNA構成要素から切断するときに、RNA構成要素から除去される)。
ある実施形態において、リボザイム−RNA構成要素カセットを含むDNAポリヌクレオチドは、RNA構成要素配列の下流に、適切な転写終止配列を含んでよい。本明細書中で有用な転写終止配列の例が、米国特許出願公開第2014/0186906号明細書に開示されており、この文献は参照によって本明細書に組み込まれる。例えば、出芽酵母(S.cerevisiae)Sup4遺伝子転写ターミネータ配列(例えば、配列番号8)が用いられてよい。そのような実施形態は典型的に、リボザイム−RNA構成要素カセットから下流に位置決めされるリボザイム配列を含まない。また、そのような実施形態は典型的に、ターミネータ配列の選択に応じて、RNA構成要素配列の末端の後ろに、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、またはそれ以上の残基を含む。これらの付加的な残基は、例えば、ターミネータ配列の選択に応じて、全てU残基であってもよいし、少なくとも90%、91%、92%、93%、94%、95%、96%、97%、98%、または99%がU残基であってもよい。これ以外にも、リボザイム配列(例えば、ハンマーヘッドまたはHDVリボザイム)は、RNA構成要素配列の(例えば、1、2、3、4、5、6、7、8、9、10、またはそれ以上のヌクレオチド)3’側にあってよい;そのような実施形態におけるRNA構成要素配列は、上流リボザイムおよび下流リボザイムがフランキングする。3’リボザイム配列は、それ自体をRNA構成要素配列から切断するように然るべく位置が定められ得る;そのような切断により、転写産物は、例えば、RNA構成要素配列の末端にて正確に終止し、または、RNA構成要素配列の末端の後ろに、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、もしくはそれ以上の残基が続くことになる。
ある実施形態において、DNAポリヌクレオチドは、(i)プロモータ、そして(ii)これが機能可能なように結合する、複数のリボザイム−RNA構成要素カセット(すなわち、タンデム型カセット)を含む配列を含んでよい。そのようなDNAポリヌクレオチドから発現される転写産物は、例えば、2、3、4、5、6、7、8、9、10、またはそれ以上のリボザイム−RNA構成要素カセットを有してよい。3’リボザイム配列は、場合によっては、各RNA構成要素配列の後ろに(例えば、上記のように)含まれて、下流転写産物配列からのRNA構成要素の切断および分離が可能となる。そのような実施形態における各RNA構成要素は典型的に、固有のDNA標的部位に本明細書中のRGENを誘導するように設計される。ゆえに、そのようなDNAポリヌクレオチドは、例えば、複数の異なる標的部位を同時に標的とするように、非従来型酵母において然るべく用いられ得る;そのような使用は場合によっては、多重法と特徴付けられ得る。3’リボザイムに結合するRNA構成要素に結合する5’ハンマーヘッドリボザイムは、本明細書中で「リボザイム−RNA構成要素−リボザイムカセット」と呼ぶことができる。タンデム型リボザイム−RNA構成要素−リボザイムカセットを含む転写産物を発現するための本明細書中のDNAポリヌクレオチドは、各カセット間に約10、20、30、40、50、60、70、80、90、100、またはそれ以上のヌクレオチド(例えば、非コードスペーサ配列)が存在するように設計されてよい。各カセットの間の距離は、同じであっても異なってもよい。
たとえ上記の一部の実施形態が、ハンマーヘッドリボザイム配列に関して記載されなかったとしても、そのような実施形態はまた、本明細書中で、ハンマーヘッドリボザイム配列の代わりに、他のあらゆるリボザイム配列(例えば、HDVリボザイム)に関して、然るべく特徴付けられ得る。当業者であれば、特定の部位にて切断するように、そのような他のリボザイム配列を配置する方法を理解するであろう。
ある実施形態における酵母はさらに、(i)プロモータ、そして(ii)これが機能可能なように結合する、Casタンパク質(例えば、Cas9)をコードするヌクレオチド配列を含むDNAポリヌクレオチド配列を含む。このポリヌクレオチド配列は、酵母によって用いられて、RGENを形成するようにRNA構成要素と複合化するCasタンパク質を発現する。そのようなポリヌクレオチド配列は、例えば、プラスミド、YAC、コスミド、ファージミド、BAC、ウィルス、または線状DNA(例えば、線状PCR産物)の形態であってもよいし、ポリヌクレオチド配列を非従来型酵母細胞中に移すのに有用な他のあらゆるタイプのベクターまたは構築体であってもよい。例えば、本明細書中に開示されるあらゆるPol IIプロモータが用いられてよい。RNA構成要素を発現するDNAポリヌクレオチド配列に関して先に開示されるいずれの特徴も、Casタンパク質を発現するDNAポリヌクレオチド配列に然るべく当てはまり得る。このポリヌクレオチド配列は、本明細書中で、酵母細胞中に一時的に存在してもよいし(すなわち、ゲノム中に組み込まれない)、安定して存在してもよい(すなわち、ゲノム中に組み込まれる)。他の態様における酵母は、Casタンパク質を発現するDNAポリヌクレオチドに加えて、RNA構成要素(例えば、先に記載される)を発現するDNAポリヌクレオチドを有してよい。これらのDNAポリヌクレオチドは双方とも、酵母に対して安定していてもよいし、一時的であってもよい;これ以外にも、Casタンパク質を発現するDNAポリヌクレオチドは安定してよく、かつRNA構成要素を発現するDNAポリヌクレオチドは一時的であってよい(またはその反対)。
DNAポリヌクレオチド配列は代わりに、酵母細胞中にRGENを提供するためにCasタンパク質および適切なRNA構成要素の双方を発現させるものであってよい。そのようなDNAポリヌクレオチドは、例えば、(i)(RGENの)RNA構成要素(RNA構成要素カセット)をコードするヌクレオチド配列に機能可能なように結合するプロモータ、および(ii)Casタンパク質(例えば、Cas9)(Casカセット)をコードするヌクレオチド配列に機能可能なように結合するプロモータを含んでよい。Casタンパク質またはRNA構成要素を発現するDNAポリヌクレオチドに関する、先に記載されるあらゆる特徴は、例えば、非従来型酵母細胞においてCasタンパク質および適切なRNA構成要素の双方を発現するDNAポリヌクレオチド配列に当てはまり得る。また、本明細書中に開示されるCasタンパク質およびRNA構成要素(例えば、crRNAまたはgRNA)はいずれも、このDNAポリヌクレオチド配列から発現され得る。1つまたは複数のRNA構成要素および/またはCasカセットは、ある実施形態において、DNAポリヌクレオチド配列内に含まれてよい。他の態様において、1つまたは複数のRNA構成要素は、先に記載されるように、タンデムに発現されてよい。CasカセットおよびRNAカセットに用いられるプロモータは、同じであっても異なってもよい。そのようなDNAポリヌクレオチド配列は、非従来型酵母および従来型酵母の双方においてRGENを発現するのに有用であろうと考えられる。
開示される本発明はまた、非従来型酵母中の染色体またはエピソーム中の標的部位配列にRNA誘導型エンドヌクレアーゼ(RGEN)を標的として向ける方法に関する。この方法は、酵母の核に、5’キャップを有していない少なくとも1つのRNA構成要素を含むRGENを提供する工程を含み、RNA構成要素は、標的部位配列と相補的な配列を含み、RGENは、標的部位配列の全てまたは一部に結合し、そして場合によってはこれを切断する。
このターゲティング法は、例えば、方法の各特徴(例えば、酵母型、RGEN、RNA構成要素、その他)に関する、先に開示される実施形態または以下の実施例のいずれかを用いて実行され得る。ゆえに、先に、または実施例に開示される特徴のいずれか、または当該特徴のあらゆる組合せが、本明細書中のターゲティング法の実施形態を特徴付けるために適切に用いられてよい。以下のターゲティング法の特徴は、例である。
本明細書中のターゲティング法のある実施形態における非従来型酵母は、以下の属のいずれのメンバーであってもよい:ヤロウイア(Yarrowia)属、ピキア(Pichia)属、シュワニオミセス(Schwanniomyces)属、クルイベロミセス(Kluyveromyces)属、アルクスラ(Arxula)属、トリコスポロン(Trichosporon)属、カンディダ(Candida)属、ウスティラゴ(Ustilago)属、トルロプシス(Torulopsis)属、チゴサッカロミセス(Zygosaccharomyces)属、トリゴノプシス(Trigonopsis)属、クリプトコッカス(Cryptococcus)属、ロドトルラ(Rhodotorula)属、ファフィア(Phaffia)属、スポロボロミセス(Sporobolomyces)属、およびパキソレン(Pachysolen)属。酵母(Y.lipolytica)が、本明細書において適したヤロウイア(Yarrowia)属酵母である。ターゲティング法に有用な非従来型酵母の他の非限定的な例が、本明細書中に開示される。
本明細書中のターゲティング法に用いるのに適したRGENは、I型、II型、またはIII型CRISPR系のCasタンパク質を含んでよい。Cas9タンパク質、例えば連鎖球菌(Streptococcus)属Cas9が、ある実施形態において用いられ得る。ターゲティング法に用いるのに適した連鎖球菌(Streptococcus)属Cas9タンパク質の例として、化膿連鎖球菌(S.pyogenes)、サーモフィルス菌(S.thermophilus)、肺炎球菌(S.pneumoniae)、ストレプトコッカス・アガラクティエ(S.agalactiae)、ストレプトコッカス・パラサングイニス(S.parasanguinis)、ストレプトコッカス・オラリス(S.oralis)、ストレプトコッカス・サリバリウス(S.salivarius)、ストレプトコッカス・マカカエ(S.macacae)、ストレプトコッカス・ディスガラクティエ(S.dysgalactiae)、ストレプトコッカス・アンギノサス(S.anginosus)、ストレプトコッカス・コンステラトゥス(S.constellatus)、ストレプトコッカス・シュードポルシヌス(S.pseudoporcinus)、またはストレプトコッカス・ミュータンス(S.mutans)のCas9タンパク質に由来するアミノ酸配列を含むCas9タンパク質が挙げられる。本明細書中のターゲティング法に有用なRGENおよびCas9タンパク質の他の非限定的な例が、本明細書中に開示されている。例えば、DNA標的配列の一方の鎖または双方の鎖を切断することができるRGENが用いられてよい。
本明細書中のターゲティング法に用いられるRGENのRNA構成要素は、例えば、tracrRNAに機能可能なように結合し、または融合するcrRNAを含むgRNAを含んでよい。本明細書中に開示されるあらゆるcrRNAおよび/またはtracrRNA(および/またはその部分、例えばtracrRNAメイト配列またはtracrRNAの5’末端配列)は、例えば、gRNAに含まれてよい。また、本明細書中に開示されるあらゆるgRNAは、例えば、ターゲティング法に用いられ得る。
PAM(プロトスペーサ隣接モチーフ)配列は、例えば、標的部位配列に隣接してよい。本明細書中のターゲティング法のある実施形態において、PAM配列は、標的部位中で、RNA構成要素のガイド配列と相補的である鎖と相補的である標的部位配列から直ぐ下流にあり、またはその下流2または3ヌクレオチド以内にある。RGENが、RNA構成要素と複合化した、エンドヌクレオチド結合分解活性のあるCas9タンパク質である本明細書中の実施形態において、Cas9は、RNA構成要素によって導かれて標的配列に結合し、PAM配列の上流にある第3のヌクレオチド位置の直ぐ5’側の双方の鎖を切断する。適切なPAM配列の例として、化膿連鎖球菌(S.pyogenes)(NGG[配列番号47])およびサーモフィルス菌(S.thermophilus)(NNAGAA[配列番号48])PAM配列が挙げられ、これらはそれぞれ、各種由来のCas9タンパク質によるターゲティングに用いられ得る。また、本明細書中に開示されるあらゆるPAM配列が、例えば、ターゲティング法に用いられ得る。
本明細書中のターゲティング法のある実施形態における酵母はさらに、(i)プロモータ、そして(ii)これが機能可能なように結合する、RNA構成要素をコードするヌクレオチド配列を含むDNAポリヌクレオチド配列を含む。そのようなDNAポリヌクレオチドにより、RGENのRNA構成要素が酵母の核に提供され得る。というのも、RNA構成要素は、DNAポリヌクレオチドから転写されるからである。酵母核において(RGENの)RNA構成要素を発現するのに適したDNAポリヌクレオチド配列の例が、本明細書中に開示されている。本明細書中に開示される、例えば、強プロモータおよび/またはPol IIプロモータ配列を含むプロモータ等のあらゆるプロモータが、DNAポリヌクレオチド配列に用いられ得る。ある実施形態において、RNA構成要素をコードするDNAポリヌクレオチドは、Casタンパク質を発現(例えば、Casを安定して発現)するように既に操作された酵母中にRNA構成要素を提供するのに用いられ得る。
本明細書中の、RNA構成要素をコードするヌクレオチド配列はさらに、例えば、リボザイムをコードしてよく、これは、RNA構成要素をコードする配列の上流にある。ゆえに、本明細書中のターゲティング法のある実施形態における酵母は、(i)プロモータ、そして(ii)これが機能可能なように結合する、5’から3’の方向にリボザイムおよびRNA構成要素をコードするヌクレオチド配列を含むDNAポリヌクレオチド配列を含んでよい。そのようなDNAポリヌクレオチドにより、RGENのRNA構成要素が酵母の核に提供され得る。というのも、RNA構成要素は、DNAポリヌクレオチドから転写されるからである。本明細書中のリボザイムは、例えば、ハンマーヘッドリボザイム、デルタ型肝炎ウィルス(HDV)リボザイム、グループIイントロンリボザイム、RnasePリボザイム、またはヘアピンリボザイムであってよい。本明細書中に開示されるあらゆるリボザイム、および本明細書中に開示される、RNA構成要素に結合するリボザイムをコードするあらゆるポリヌクレオチド配列は、例えば、ターゲティング法に用いられ得る。
本明細書中のターゲティング法のある実施形態における酵母はさらに、(i)プロモータ、そして(ii)これが機能可能なように結合する、Casタンパク質(例えば、Cas9)をコードするヌクレオチド配列を含むDNAポリヌクレオチド配列を含んでよい。そのようなDNAポリヌクレオチドにより、RGENのCasタンパク質構成要素が酵母中に提供され得る。酵母中で(RGENの)Casタンパク質構成要素を発現するのに適したDNAポリヌクレオチド配列の例が、本明細書中に開示されている。例えば、強プロモータ等の、本明細書中に開示されるあらゆるプロモータが、そのようなDNAポリヌクレオチド配列に用いられ得る。
DNA標的部位配列の配列、またはその近くの配列に相同である少なくとも1つの配列を含むドナーポリヌクレオチドもまた、ターゲティング法のある実施形態において、酵母に提供され得る(標的部位配列にてニックを入れ、またはカットするRGENを提供することを伴う)。適切な例として、相同アームを有するドナーポリヌクレオチドが挙げられる。本明細書中に開示されるあらゆるドナーポリヌクレオチドは、例えば、ターゲティング法に用いられ得る。当該方法のそのような実施形態は典型的に、(標的配列のRGEN媒介ニッキングまたは切断の後に)ドナーポリヌクレオチドと標的配列とのHRを伴う;ゆえに、当該方法は、場合によっては、非従来型酵母においてHRを実行する方法と呼ぶこともできる。当該方法によって実行され得るHR戦略の例が、本明細書中に開示されている。酵母細胞におけるターゲティングのためのドナーDNAポリヌクレオチドの適切な量は、酵母細胞あたり、少なくとも約300、400、500、600、700、または800分子のドナーDNAであってよい。
RGEN構成要素を発現するのに本明細書中に記載されるDNAポリヌクレオチドを含むあらゆる構築体またはベクターは、あらゆる標準的な技術によって非従来型酵母細胞中に導入されてよい。これらの技術として、例えば、形質転換(例えば、酢酸リチウム形質転換(Methods in Enzymology,194:186−187)、バイオリスティックインパクト、エレクトロポーレーション、およびマイクロインジェクションが挙げられる。例として、米国特許第4880741号明細書および米国特許第5071764号明細書、ならびにChen et al.(Appl.Microbiol.Biotechnol.48:232−235)(これらの文献は参照によって本明細書に組み込まれる)が、酵母(Y.lipolytica)用のDNA運搬技術を記載している。
本明細書中のターゲティング法は、非従来型酵母においてindelを生じさせる目的で実行され得る。そのような方法は、先に開示されるように、標的DNA部位にて、またはその近くでHRを受け得るドナーDNAポリヌクレオチドをさらに提供することなく実行され得る(すなわち、NHEJが当該方法において誘導される)。生じ得るindelの例が、本明細書中に開示されている。indelのサイズは、例えば、1、2、3、4、5、6、7、8、9、10、またはそれ以上の塩基であってよい。ある実施形態におけるindelは、さらに大きくてよく、例えば少なくとも約20、30、40、50、60、70、80、90、100、110、120、130、140、または150塩基であってよい。さらに他の実施形態において、挿入または欠失は、少なくとも約500、750、1000、または1500塩基であってよい。ある実施形態においてindelを生じさせようとする場合、その代わりとして単一の塩基置換が、標的部位配列中に形成されてよい。ゆえに、本明細書中のターゲティング法は、例えば、単一の塩基置換を生じさせる目的で実行されてよい。
indel形成を意図する本明細書中のターゲティング法のある実施形態において、非従来型酵母(例えば、酵母(Y.lipolytica))におけるindel形成の頻度は、従来型酵母、例えば出芽酵母(S.cerevisiae)において同じ、または類似のターゲティング戦略を用いて観察されるであろう頻度よりも、有意に高い。例えば、従来型酵母におけるindel形成の頻度は、約0.0001から0.001であり得(DiCarlo et al.,Nucleic Acids Res.41:4336−4343)、非従来型酵母における頻度は本明細書中で、少なくとも約0.05、0.10、0.15、0.20、0.25、0.30、0.35、0.40、0.45、0.50、0.55、0.60、0.65、0.70、0.75、または0.80であり得る。ゆえに、非従来型酵母のindel形成の頻度は本明細書中で、例えば、従来型酵母において同じ、または類似のCas媒介ターゲティング戦略を用いて観察されるであろう頻度よりも、少なくとも約50、100、250、500、750、1000、2000、4000、または8000倍高くなり得る。これらの実施形態のある態様は、ドナーDNAを含まない、かつ/またはRGEN構成要素(Cas、および適切なRNA構成要素)が同じベクター/構築体から発現されるターゲティング法に関してよい。
本明細書中のターゲティング法は、例えば、当該方法において2つ以上のDNA標的部位が標的とされるように実行されてよい。そのような方法は、酵母に、本明細書中に開示されるタンデム型リボザイム−RNA構成要素カセット(例えば、タンデム型リボザイム−RNA構成要素−リボザイムカセット)を含む転写産物を発現するDNAポリヌクレオチドを提供する工程を含んでよい。当該方法は、同じ配列(例えば、プロモータ、またはオープンリーディングフレーム)に非常に近いDNA部位を、かつ/または互いに離れている部位(例えば、異なる遺伝子および/または染色体にある)を標的とすることができる。そのような方法は、ターゲティングの所望される結果に応じて、適切なドナーDNAポリヌクレオチドがあっても(HRについて)、なくても(indelおよび/または塩基置換の原因となるNHEJについて)実行され得る。
ある実施形態におけるターゲティング法は、タンパク質または非コードRNAをコードする1つまたは複数のDNAポリヌクレオチド配列を分裂させるために実行されてよい。分裂のために標的とされてよいそのような配列の例が、マーカーをコードする配列(すなわち、マーカー遺伝子)である。本明細書中のマーカーの非限定的な例として、スクリーニング可能なマーカーおよび選択可能なマーカーが挙げられる。本明細書中のスクリーニング可能なマーカーとして、適切な条件下で酵母を視覚的に異ならせるものであってよい。スクリーニング可能なマーカーの例として、ベータ−グルクロニダーゼ(GUS)、ベータ−ガラクトシダーゼ(lacZ)、および蛍光タンパク質(例えば、GFP、RFP、YFP、BFP)をコードするポリヌクレオチドが挙げられる。本明細書中の選択可能なマーカーは、酵母を、選択剤または選択環境に対して耐性にするものであってよい。選択可能なマーカーの例として、栄養要求性マーカー、例えばHIS3、LEU2、TRP1、MET15、またはURA3があり、これらにより酵母は、外因的に提供されるヒスチジン、ロイシン、トリプトファン、メチオニン、またはウラシルの不在下でそれぞれ生存することができる。選択可能なマーカーの他の例として、抗生物質(抗真菌)耐性マーカー、例えば、酵母を、ハイグロマイシンB、ノウルセオスリシン、フレオマイシン、ピューロマイシン、またはネオマイシン(例えばG418)に対して耐性にするものがある。
ある実施形態においてマーカーを分裂させる少なくとも1つの目的は、マーカーリサイクルのためであってよい。マーカーリサイクルは、例えば、(i)酵母をマーカーおよび非相同DNA配列で形質転換する工程と、(ii)マーカーおよび非相同DNA配列を含む形質転換された酵母を選択する工程(マーカー選択可能な酵母は典型的に、非相同DNA配列を含有する見込みがより高い)と、(iii)マーカーを分裂させる工程と、その後、酵母を、複数の非相同DNA配列で形質転換するために、工程(i)〜(iii)を必要なだけ繰り返す(同じマーカーを用いるが、各サイクルで、異なる非相同DNA配列を用いる)工程を含むプロセスである。当該プロセスの1つまたは複数の非相同配列は、ドナーポリヌクレオチドの形態のマーカーそれ自体(例えば、特定の遺伝子座を標的とする相同アームがフランキングするマーカー)を含んでよい。本明細書中のマーカーリサイクルプロセスの例として、URA3を、非従来型酵母(例えば酵母(Y.lipolytica))においてマーカーとして用いるものが挙げられる。
本明細書中に開示される組成物および方法の非限定的な例は、以下の通りである:
1.5’キャップを有していない少なくとも1つのRNA構成要素を含む少なくとも1つのRNA誘導型エンドヌクレアーゼ(RGEN)を含む非従来型酵母であって、RNA構成要素は、酵母中の染色体またはエピソーム上の標的部位配列と相補的な配列を含み、RGENは、標的部位配列の全てまたは一部に結合することができる、非従来型酵母。
2.RGENは、標的部位配列の全てまたは一部に結合することができ、かつこれを切断することができる、実施形態1の非従来型酵母。
3.前記酵母は、ヤロウイア(Yarrowia)属、ピキア(Pichia)属、シュワニオミセス(Schwanniomyces)属、クルイベロミセス(Kluyveromyces)属、アルクスラ(Arxula)属、トリコスポロン(Trichosporon)属、カンディダ(Candida)属、ウスティラゴ(Ustilago)属、トルロプシス(Torulopsis)属、チゴサッカロミセス(Zygosaccharomyces)属、トリゴノプシス(Trigonopsis)属、クリプトコッカス(Cryptococcus)属、ロドトルラ(Rhodotorula)属、ファフィア(Phaffia)属、スポロボロミセス(Sporobolomyces)属、およびパキソレン(Pachysolen)属からなる群から選択される属のメンバーである、実施形態1の酵母。
4.RGENは、CRISPR(クラスター化された、等間隔にスペーサが入った、短い回文リピート)結合(Cas)タンパク質9(Cas9)アミノ酸配列を含む、実施形態1の酵母。
5.Cas9タンパク質は、連鎖球菌(Streptococcus)属Cas9タンパク質である、実施形態4の酵母。
6.RNA構成要素は、トランス活性化CRISPR RNA(tracrRNA)に機能可能なように結合するCRISPR RNA(crRNA)を含むガイドRNA(gRNA)を含む、実施形態4の酵母。
7.PAM(プロトスペーサ隣接モチーフ)配列が、標的部位配列に隣接する、実施形態4の酵母。
8.少なくとも1つのヌクレオチド配列に機能可能なように結合するプロモータを含むポリヌクレオチド配列を含む非従来型酵母であって、前記ヌクレオチド配列は、RNA構成要素をコードするDNA配列の上流にリボザイムをコードするDNA配列を含み、前記RNA構成要素は、酵母中の染色体またはエピソーム上の標的部位配列と相補的な可変ターゲティングドメインを含み、RNA構成要素は、RNA誘導型エンドヌクレアーゼ(RGEN)を形成することができ、前記RGENは、標的部位配列の全てまたは一部に結合することができる、非従来型酵母。
9.RGENは、標的部位配列の全てまたは一部に結合することができ、かつこれを切断することができる、実施形態8の非従来型酵母。
10.ヌクレオチド配列から転写されるRNAは、自己触媒的にリボザイムを除去して前記RNA構成要素が生じ、前記RNA構成要素は、5’キャップを有していない、実施形態8の非従来型酵母。
11.リボザイムは、ハンマーヘッドリボザイム、デルタ型肝炎ウィルスリボザイム、グループIイントロンリボザイム、RnasePリボザイム、またはヘアピンリボザイムである、実施形態10の非従来型酵母。
12.ヌクレオチド配列から転写されるRNAは、自己触媒的にリボザイムを除去しないで、5’キャップなしのリボザイム−RNA構成要素融合分子を生成する、実施形態8の非従来型酵母。
13.リボザイムはHDVリボザイムである、実施形態12の非従来型酵母。
14.プロモータは強プロモータである、実施形態8の非従来型酵母。
15.プロモータはPol IIプロモータ配列を含む、実施形態8の非従来型酵母。
16.非従来型酵母中の染色体またはエピソーム上の標的部位配列にRNA誘導型エンドヌクレアーゼ(RGEN)を標的として向ける方法であって、前記方法は、前記酵母に、5’キャップを有していない少なくとも1つのRNA構成要素を含むRGENを提供する工程を含み、RNA構成要素は、標的部位配列と相補的な配列を含み、RGENは、標的部位配列の全てまたは一部に結合する、方法。
17.RGENは、標的部位配列の全てまたは一部に結合することができ、かつこれを切断することができる、実施形態16の方法。
18.非従来型酵母中の染色体またはエピソーム上の標的部位配列にRNA誘導型エンドヌクレアーゼ(RGEN)を標的として向ける方法であって、前記方法は、前記酵母に、少なくとも1つのリボザイム−RNA構成要素融合分子を含むRGENを提供する工程を含み、RNA構成要素は、標的部位配列と相補的な配列を含み、RGENは、標的部位配列の全てまたは一部に結合する、方法。
19.RGENは、標的部位配列の全てまたは一部に結合することができ、かつこれを切断することができる、実施形態18の方法。
20.非従来型酵母中の染色体またはエピソーム上の標的部位配列にRNA誘導型エンドヌクレアーゼ(RGEN)を標的として向ける方法あって、前記方法は、前記酵母に、CasエンドヌクレアーゼをコードするDNA配列を含む第1の組換えDNA構築体、およびRNA構成要素の上流にリボザイムをコードするDNA配列を含む少なくとも第2の組換えDNA構築体を提供する工程を含み、第2の組換えDNA構築体から転写されるRNAは、自己触媒的にリボザイムを除去して、前記RNA構成要素が生じ、RNA構成要素およびCas9エンドヌクレアーゼは、標的部位配列の全てまたは一部に結合することができるRGENを形成することができる、方法。
21.RGENは、標的部位配列の全てまたは一部に結合することができ、かつこれを切断することができる、実施形態20の方法。
22.非従来型酵母中の染色体またはエピソーム上の標的部位配列にRNA誘導型エンドヌクレアーゼ(RGEN)を標的として向ける方法であって、前記方法は、前記酵母に、CasエンドヌクレアーゼをコードするDNA配列を含む第1の組換えDNA構築体、およびリボザイム−RNA構成要素融合分子をコードするDNA配列を含む少なくとも第2の組換えDNA構築体を提供する工程を含み、前記リボザイム−RNA構成要素融合分子およびCas9エンドヌクレアーゼは、標的部位配列の全てまたは一部に結合することができ、そして場合によってはこれを切断することができるRGENを形成することができる、方法。
23.RGENは、標的部位配列の全てまたは一部に結合することができ、かつこれを切断することができる、実施形態22の方法。
24.非従来型酵母中の染色体またはエピソーム上の標的部位を修飾する方法であって、当該方法は、非従来型酵母に、CasエンドヌクレアーゼをコードするDNA配列を含む第1の組換えDNA構築体、およびRNA構成要素の上流にリボザイムをコードするDNA配列を含む第2の組換えDNA構築体を提供する工程を含み、第2の組換えDNA構築体から転写されるRNAは、自己触媒的にリボザイムを除去して、5’キャップを有していない前記RNA構成要素が生じ、Cas9エンドヌクレアーゼは、前記標的部位に一本鎖切断または二本鎖切断を導入する、方法。
25.非従来型酵母中の染色体またはエピソーム上の標的部位を修飾する方法であって、当該方法は、非従来型酵母に、CasエンドヌクレアーゼをコードするDNA配列を含む第1の組換えDNA構築体、および5’キャップを有していないリボザイム−RNA構成要素融合分子をコードするDNA配列を含む第2の組換えDNA構築体を提供する工程を含み、前記リボザイム−RNA構成要素融合分子およびCas9エンドヌクレアーゼは、前記標的部位に一本鎖切断または二本鎖切断を導入するRGENを形成することができる、方法。
26.非従来型酵母中の染色体またはエピソーム上の複数の標的部位を修飾する方法であって、当該方法は、非従来型酵母に、CasエンドヌクレアーゼをコードするDNA配列を含む少なくとも第1の組換えDNA構築体、および少なくとも1つのポリヌクレオチドに機能可能なように結合するプロモータを含む少なくとも第2の組換えDNA構築体を提供する工程を含み、前記少なくとも1つのポリヌクレオチドは、RNA構成要素の上流にリボザイムを含むRNA分子をコードし、前記RNA分子は、自己触媒的にリボザイムを除去して、前記RNA構成要素が生じ、Cas9エンドヌクレアーゼは、前記標的部位に一本鎖切断または二本鎖切断を導入する、方法。
27.非従来型酵母中の染色体またはエピソーム上の複数の標的部位を修飾する方法であって、当該方法は、非従来型酵母に、CasエンドヌクレアーゼをコードするDNA配列を含む少なくとも第1の組換えDNA構築体、および少なくとも1つのポリヌクレオチドに機能可能なように結合するプロモータを含む少なくとも第2の組換えDNA構築体を提供する工程を含み、前記少なくとも1つのポリヌクレオチドは、リボザイム−RNA構成要素融合分子をコードし、前記リボザイム−RNA構成要素融合分子およびCas9エンドヌクレアーゼは、前記標的部位に一本鎖切断または二本鎖切断を導入するRGENを形成することができる、方法。
28.前記標的に修飾を有する少なくとも1つの非従来型酵母細胞を同定する工程をさらに含み、修飾は、前記標的部位中の1つまたは複数のヌクレオチドの少なくとも1つの欠失、付加、または置換を含む、実施形態22〜25のいずれかの方法。
29.ドナーDNAを前記酵母に提供する工程をさらに含み、前記ドナーDNAは、対象のポリヌクレオチドを含む、実施形態24〜28のいずれかの方法。
30.前記標的部位に組み込まれた対象のポリヌクレオチドを染色体またはエピソーム中に含む少なくとも1つの酵母細胞を同定する工程をさらに含む、実施形態29の方法。
31.非従来型酵母中の染色体またはエピソーム上のヌクレオチド配列を編集する方法であって、当該方法は、非従来型酵母に、ポリヌクレオチド修飾鋳型DNA、CasエンドヌクレアーゼをコードするDNA配列を含む第1の組換えDNA構築体、およびRNA構成要素の上流にリボザイムをコードするDNA配列を含む第2の組換えDNA構築体を提供する工程を含み、第2の組換えDNA構築体から転写されるRNAは、自己触媒的にリボザイムを除去して、5’キャップを有していない前記RNA構成要素が生じ、Cas9エンドヌクレアーゼは、前記酵母の染色体またはエピソーム中の標的部位に一本鎖切断または二本鎖切断を導入し、前記ポリヌクレオチド修飾鋳型DNAは、前記ヌクレオチド配列の少なくとも1つのヌクレオチド修飾を含む、方法。
32.非従来型酵母中の染色体またはエピソーム上のヌクレオチド配列を編集する方法であって、当該方法は、非従来型酵母に、ポリヌクレオチド修飾鋳型DNA、CasエンドヌクレアーゼをコードするDNA配列を含む第1の組換えDNA構築体、および5’キャップを有していないリボザイム−RNA構成要素融合分子をコードするDNA配列を含む第2の組換えDNA構築体を提供する工程を含み、前記リボザイム−RNA構成要素融合分子およびCas9エンドヌクレアーゼは、前記酵母の染色体またはエピソーム中の標的部位に一本鎖切断または二本鎖切断を導入するRGENを形成することができ、前記ポリヌクレオチド修飾鋳型DNAは、前記ヌクレオチド配列の少なくとも1つのヌクレオチド修飾を含む、方法。
33.非従来型酵母中の染色体またはエピソーム上のヌクレオチド配列を編集する方法であって、当該方法は、非従来型酵母に、少なくとも1つのポリヌクレオチド修飾鋳型DNA、CasエンドヌクレアーゼをコードするDNA配列を含む少なくとも第1の組換えDNA構築体、および少なくとも1つのポリヌクレオチドに機能可能なように結合するプロモータを含む少なくとも第2の組換えDNA構築体を提供する工程を含み、前記少なくとも1つのポリヌクレオチドは、RNA構成要素の上流にリボザイムを含むRNA分子をコードし、前記RNA分子は、自己触媒的にリボザイムを除去して、5’キャップを有していない前記RNA構成要素が生じ、Cas9エンドヌクレアーゼは、前記酵母の染色体またはエピソーム中の標的部位に一本鎖切断または二本鎖切断を導入し、前記ポリヌクレオチド修飾鋳型DNAは、前記ヌクレオチド配列の少なくとも1つのヌクレオチド修飾を含む、方法。
34.非従来型酵母中の染色体またはエピソーム上のヌクレオチド配列を編集する方法であって、当該方法は、非従来型酵母に、少なくとも1つのポリヌクレオチド修飾鋳型DNA、CasエンドヌクレアーゼをコードするDNA配列を含む少なくとも第1の組換えDNA構築体、および少なくとも1つのポリヌクレオチドに機能可能なように結合するプロモータを含む少なくとも第2の組換えDNA構築体を提供する工程を含み、前記少なくとも1つのポリヌクレオチドは、5’キャップを有していないリボザイム−RNA構成要素融合分子をコードし、前記リボザイム−RNA構成要素融合分子およびCas9エンドヌクレアーゼは、前記酵母の染色体またはエピソーム中の標的部位に一本鎖切断または二本鎖切断を導入するRGENを形成することができ、前記ポリヌクレオチド修飾鋳型DNAは、前記ヌクレオチド配列の少なくとも1つのヌクレオチド修飾を含む、方法。
35.第1の組換えDNAおよび第2の組換えDNAは、同じプラスミド上に位置決めされる、実施形態24〜34のいずれかの方法。
36.第1の組換えDNAおよび第2の組換えDNAは、別個のプラスミド上に位置決めされる、実施形態24〜34のいずれかの方法。
37.非従来型酵母中の染色体またはエピソーム上のヌクレオチド配列をサイレンシングする方法であって、当該方法は、非従来型酵母に、不活化Cas9エンドヌクレアーゼをコードするDNA配列を含む少なくとも第1の組換えDNA構築体、および少なくとも1つのポリヌクレオチドに機能可能なように結合するプロモータを含む少なくとも第2の組換えDNA構築体を提供する工程を含み、前記少なくとも1つポリヌクレオチドは、5’キャップを有していないリボザイム−RNA構成要素融合分子をコードし、前記リボザイム−RNA構成要素融合分子および不活化Cas9エンドヌクレアーゼは、前記酵母の染色体またはエピソーム中の前記ヌクレオチド配列に結合するRGENを形成することによって、前記ヌクレオチド配列の転写を阻止することができる、方法。
38.非従来型酵母における遺伝子修飾のための複数のガイドRNAの生産のための高スループット法であって、当該方法は:
a)5’から3’の順に、リボザイムをコードする第1のDNA配列、カウンターセレクション剤をコードする第2のDNA配列、ガイドRNAのCERドメインをコードする第3のDNA配列、およびターミネータ配列に機能可能なように結合するプロモータを含む組換えDNA構築体を提供する工程と;
b)少なくとも1つのオリゴヌクレオチド二重鎖を、(a)の組換えDNA構築体に提供する工程であって、前記オリゴヌクレオチド二重鎖は、ガイドRNA標的配列の可変ターゲティングドメイン(VT)をコードすることができるDNA配列を含む第1の単鎖オリゴヌクレオチドの、可変ターゲティングドメインをコードするDNA配列と相補的な配列を含む第2の単鎖オリゴヌクレオチドとの組合せに由来する、工程と;
c)(a)のカウンターセレクション剤を、(b)の少なくとも1つのオリゴ二重鎖と交換することによって、ガイドRNAの可変ターゲティングドメインをコードすることができるDNA配列をそれぞれが含む組換えDNA構築体のライブラリを作製する工程と;
d)(c)の組換えDNA構築体のライブラリを転写することによって、リボザイム−ガイドRNA分子のライブラリを作製する工程と
を含む方法。
39.前記分子が、リボザイムの上流でリボザイムおよびあらゆるRNA配列を自己触媒的に除去して、5’キャップを含有しないガイドRNA分子のライブラリを作製するように、リボザイム−ガイドRNA分子のライブラリを誘導する工程をさらに含む、実施形態38の方法。
40.前記分子が、リボザイムの上流で、あらゆるRNA配列を切断して、5’キャップを含有しないリボザイム−gRNA融合分子が生じるように、リボザイム−ガイドRNA分子のライブラリを誘導する工程をさらに含む、実施形態38の方法。
41.(i)ポリメラーゼIIプロモータ、そして(ii)これが機能可能なように結合する、リボザイムおよびガイドRNAをコードするヌクレオチド配列を含む組換えDNA配列であって、前記リボザイムは、前記ガイドRNAの上流にあり、(ii)のヌクレオチド配列から転写されるRNAは、自己触媒的にリボザイムを除去して、前記ガイドRNAが生じ、前記ガイドRNAは、非従来型酵母のゲノム中の標的部位を認識することができ、これに結合することができ、そして場合によってはこれを切断することができるRGENを形成することができる、組換えDNA配列。
42.リボザイムおよびガイドRNAを含む組換えRNA配列であって、前記リボザイムは、前記ガイドRNAの上流にあり、前記リボザイムは、自己触媒的に除去されて、前記ガイドRNAが生じ得、前記ガイドRNAは、非従来型酵母のゲノム中の標的部位を認識することができ、これに結合することができ、そして場合によってはこれを切断することができるRGENを形成することができる、組換えRNA配列。
43.(i)ポリメラーゼIIプロモータ、そして(ii)これが機能可能なように結合する、リボザイムおよびガイドRNAをコードするヌクレオチド配列を含む組換えDNA配列であって、前記リボザイムは、前記ガイドRNAの上流にあり、(ii)のヌクレオチド配列から転写されるRNAは、リボザイム−ガイドRNA融合分子を生成し、前記リボザイム−ガイド融合分子は、非従来型酵母のゲノム中の標的部位を認識することができ、これに結合することができ、そして場合によってはこれを切断することができるRGENを形成することができる、組換えDNA配列。
44.リボザイム−ガイドRNA融合分子を含む組換えRNA配列であって、前記リボザイム−ガイドRNA融合分子は、非従来型酵母のゲノム中の標的部位を認識することができ、これに結合することができ、そして場合によってはこれを切断することができるRGENを形成することができる、組換えRNA配列。
開示される本発明は、以下の実施例においてさらに明らかにされる。これらの実施例は、本発明のある好ましい態様を示す一方で、実例としてのみ与えられることが理解されるべきである。上記の考察およびこれらの実施例から、当業者であれば、本発明の必須の特徴を確認することができ、そして、その精神および範囲を逸脱しない範囲で、本発明の種々の変更および改変を行なって、種々の用途および条件に適応させることができる。
実施例1:ヤロウイア(Yarrowia)属においてPol IIIプロモータから発現されるsgRNAは、Cas9を標的部位に導かず、DNA切断を媒介しない
この実施例は、Leu2遺伝子座を標的とする、酵母(Yarrowia lipolytica)においてsgRNAおよびCas9タンパク質を発現するように設計されたベクターおよびカセットを開示する。この酵母において産生されるsgRNAおよびCas9が相互作用して、標的部位を見付けて切断することができるならば、標的部位にて、エラープロン非相同末端結合(NHEJ)を介して突然変異が生じるはずである。
図1は、sgRNA分子を示し、これは、2つの領域、可変ターゲティングドメイン(VT)(ガイド配列)およびCasエンドヌクレアーゼ認識ドメイン(CER)を含有する単一RNA分子である。VT領域は、標的とされる核酸分子と同一である20マーのRNAポリヌクレオチドであり得る。VTドメインは、PAMモチーフ(例えば、NGG、配列番号47)の5’側に存在する標的部位中の切断標的部位を特定する。CERドメインは、Cas9タンパク質と相互作用して、VTドメインを相互作用させて、Cas9タンパク質切断を導くことができる(Jinek et al.,Science 337:816−821)。VTおよびCERドメインは双方とも、sgRNAの機能に必要とされる。
ヤロウイア(Yarrowia)属のLEU2遺伝子座のコード領域中の3つの個々の標的部位(Leu2−1、Leu2−2、Leu2−3)にCas9を標的として向けるVTドメインをコードするDNA配列を、表3に記載する。表3はまた、ヤロウイア(Yarrowia)属CAN1遺伝子座のコード領域を標的とするVTドメインをコードするDNA配列を記載する。
表3における各LEU2ターゲティングDNA配列を、化膿連鎖球菌(Streptococcus pyogenes)Cas9タンパク質と相互作用するCERドメイン(配列番号1)をコードするDNA配列に個々に融合することによって、CERドメインおよびVTドメインの双方を有する完全sgRNAをコードするDNA配列が生じる(配列番号1は、5’から3’の方向に、配列番号56のtracrRNAメイト配列、配列番号43のループ形成配列(GAAA)、および配列番号58のtracrRNA配列を含む点に注目されたい)。細胞の核内でこれらのsgRNAを発現し、かつ核外搬出系および5’修飾系を逃れるために、sgRNAをコードするDNA配列を、出芽酵母(Saccharomyces cerevisiae)由来のRNA Pol IIIプロモータ(Snr52[配列番号5]またはRpr1[配列番号6])または酵母(Yarrowia lipolytica)由来のRNA Pol IIIプロモータ(Snr52[配列番号7])の制御下に置いた。具体的には、Sc Snr52をLeu2−1に融合し、Sc Rpr1をLeu2−2に融合し、そしてYl Snr52をLeu2−3に融合した。各sgRNAをコードするDNA配列の3’末端を、出芽酵母(Saccharomyces cerevisiae)のSup4遺伝子由来の強ターミネータ(配列番号8)に融合した。かくして、3つの異なるPol III駆動sgRNAカセットを調製した。
化膿連鎖球菌(Streptococcus pyogenes)M1 GAS(SF370)由来のCas9遺伝子のオープンリーディングフレームを、標準的な技術によって、ヤロウイア(Yarrowia)属における発現用にコドン最適化して、配列番号9を生成した。シミアンウィルス40(SV40)一分節核局在化シグナル(NLS)プラス短リンカー(4アミノ酸)をコードするDNA配列を、配列番号9の最後のセンスコドンの後ろに組み込んで、配列番号10とした。配列番号10は、配列番号11に示すアミノ酸配列をコードする。配列番号11の最後の7つのアミノ酸は、加えたNLSをコードする一方、配列番号11の位置1369〜1372の残基は、加えたリンカーをコードする。ヤロウイア(Yarrowia)属コドン最適化Cas9−NLS配列(配列番号10)を、標準的な分子生物学技術によって、ヤロウイア(Yarrowia)属構成プロモータ、FBA1(配列番号12)に融合した。ヤロウイア(Yarrowia)属コドン最適化Cas9発現カセット(配列番号13)の例を図2Aに示す。FBA1構成プロモータ、ヤロウイア(Yarrowia)属コドン最適化Cas9、およびSV40 NLSが含有される。このCas9発現カセット(配列番号13)を、プラスミドpZUF中にクローニングして、構築体pZUFCas9とした(図3A、配列番号14)。
各sgRNA発現カセット(前述)を、pZUFCas9(配列番号14)のPacI/ClaI部位中に個々にクローニングして、pZUFCas9/sgRNA構築体とした。これを用いて、ヤロウイア(Yarrowia)属コドン最適化Cas9発現カセットおよびPol III駆動sgRNA発現カセットで酵母細胞を共形質転換することができた。そのような構築体の例が、pZUFCas9/Pol III−sgRNA(図3B)であり、これは、ヤロウイア(Yarrowia)属においてLeu2−3を標的とするためのYl Snr52−sgRNA発現カセットを含有する。
ウラシル栄養要求性酵母(Y.lipolytica)細胞を、200ngのプラスミドpZUFCas9(配列番号14)または特定のpZUFCas9/sgRNA(例えば、pZUFCas9/Pol III−sgRNA、図3B)で形質転換して、ウラシルを欠く完全最小プレート(CM−ura)上で、ウラシル原栄養性について選択した。CM−uraプレート上に生じたコロニーを、ロイシンを欠く完全最小プレート(CM−leu)上で、ロイシン栄養要求性についてスクリーニングした。いずれのウラシル原栄養性形質転換体も、ロイシン栄養要求性を示さなかった。これらの結果から、ヤロウイア(Yarrowia)属コドン最適化Cas9およびPol IIIプロモータ駆動sgRNAは、発現されず、生じず、相互作用せず、DNAを標的とせず、かつ/またはDNAを切断しなかったことが示唆される。仮にこの実験がロイシン栄養要求体を生じたならば、そのような結果は、おそらく、Cas9/sgRNA複合体が、Leu2コード領域を標的として切断して、エラープロンNHEJおよびそれに伴うindel形成に至って、フレームシフト突然変異が生じたことを示したであろう。
ゆえに、sgRNAのPol III駆動発現は、ヤロウイア(Yarrowia)属において機能的Cas9−sgRNA複合体を提供するのに有用でないように思われる。
実施例2:DNAポリメラーゼIIプロモータによって駆動される5’リボザイムおよび3’リボザイムを含むヤロウイア(Yarrowia)属最適化sgRNA発現カセット この実施例は、ヤロウイア(Yarrowia)属における発現およびCas9媒介ターゲティングについて最適化したsgRNAを開示する。そのような発現に用いた各カセットは、5’リボザイムおよび3’リボザイムに融合したsgRNA(リボザイム−sgRNA−リボザイム、またはRGR)の転写を駆動するPol IIプロモータを含んだ。5’リボザイムおよび3’リボザイムを与えて、sgRNAから、Pol IIプロモータ関連転写産物の修飾、例えば5’キャップ構造を除去して、まさしくsgRNA配列だけにした。これらの発現カセットは、sgRNA発現について、より広いプロモータ選択を可能にする。また、これらのカセットから転写されるsgRNAは、5’キャップ構造を欠くので、核外搬出を受けない。これらの特徴により、ヤロウイア(Yarrowia)属細胞におけるsgRNAのロバストな発現が可能となるので、Cas9エンドヌクレアーゼが、標的とされたゲノム領域にインビボで導かれ得る。
sgRNA配列への5’ハンマーヘッド(HH)リボザイムおよび3’デルタ型肝炎ウィルス(HDV)リボザイムの追加により、一部のRNAポリメラーゼ(例えばPol II)によって転写されるプロモータで起こる転写後修飾について考慮せずとも、あらゆるプロモータからのsgRNAの発現が可能となり、sgRNA発現について限られている現在のプロモータ選択が回避される。そのようなsgRNAが発現される場合、プレsgRNA転写産物中に存在するリボザイムをオートクレーブ処理することによって、転写産物から分離して、未修飾sgRNAにする。
試験した各sgRNAについて、sgRNAをコードするDNA配列を、(i)その5’末端にて、5’HHリボザイムをコードする配列(配列番号15)に、そして(ii)その3末端にて、3’HDVリボザイム(配列番号16)をコードする配列に融合した。HHリボザイムの5’結合は、HHリボザイムの最初の6ヌクレオチドが、sgRNAのVT領域(ガイド配列)の最初の6ヌクレオチドの逆相補体であるようにした。各リボザイムがフランキングするプレsgRNA(RGR)を、標準的な分子生物学技術を用いて、FBA1プロモータ(配列番号12)に融合して、ヤロウイア(Yarrowia)属最適化sgRNA発現カセット(図2Bに表される最終カセット)を得た。そのようなカセットの例となる配列を、配列番号18に示す。これは、sgRNAが、配列番号17(Can1−1)によってコードされるVTドメイン、およびCERドメインとしての配列番号1を含むRGR(HH−sgRNA−HDV)をコードする配列に機能可能なように結合するFBA1プロモータ(配列番号12)を含む(配列番号18、pRF38(配列番号19)、およびpRF84(配列番号41)の各CERドメインコード領域に、「TGG」が加えられている点に注目されたい。そのような「TGG」は、配列番号1(CERドメイン)の位置73〜74に対応する残基位置間にある)。このVTドメインは、ヤロウイア(Yarrowia)属CAN1遺伝子のオープンリーディングフレーム(GenBank登録番号NC_006068、染色体BのYALI0B19338g、2557513〜2559231bp)のコード領域中の部位を標的とする。コードされたHHリボザイムの最初の6残基は、sgRNAの最初の6残基(すなわち、VTドメインの最初の6残基)と相補的である。配列番号18中の配列番号12(FBA1プロモータ)の直ぐ後ろに3つの残基(ATG)があり、これらは、プレsgRNAの発現およびリボザイム媒介自触媒作用に影響を及ぼすと考えられていない点に注目されたい。配列番号18を、pRF38と呼ばれる構築体中にクローニングした(図3C、配列番号19)。
かくして、5’および3’Pol IIプロモータ関連転写産物の変更なくsgRNAを発現するDNAカセットを調製した。カセットのこれらの型を、実施例3において、ヤロウイア(Yarrowia)属におけるCas9遺伝子ターゲティングに用いた。
実施例3:ヤロウイア(Yarrowia)属最適化sgRNAを、sgRNA/Cas9エンドヌクレアーゼ系に用いて、染色体DNAを切断することができる
この実施例は、実施例2に記載したヤロウイア(Yarrowia)属最適化sgRNA発現カセットを用いて、Cas9と機能することができるsgRNAを発現して、ヤロウイア(Yarrowia)属中の染色体DNAを認識して切断することを開示する。そのような切断は、予測されるDNA切断部位の領域における、切断部位でのエラープロンNHEJ DNA修復による突然変異の出現によって明らかにされた。
酵母(Y.lipolytica)のCAN1遺伝子を、切断の標的とした。ヤロウイア(Yarrowia)属形質転換体におけるCAN1のターゲティングの成否を、突然変異頻度および突然変異スペクトルについて、それぞれ表現型(カナバニン耐性)および配列決定によって調査した。
Ura−酵母(Y.lipolytica)細胞(株ATCC 20362に直接由来するウラシル栄養要求体、株Y2224が、米国特許出願公開第2010/0062502号明細書に開示されている(この文献は参照によって本明細書に組み込まれる))を、pZUFCas9(図3A、配列番号14)および線状PCR産物(CAN1遺伝子座を標的とするためのヤロウイア(Yarrowia)属最適化RGRプレsgRNAカセット(配列番号18に含まれる)を含有するpRF38(図3C、配列番号19)から増幅した)で、リチウムイオン媒介形質転換(Ito et al.,J.Bacteriology 153:163−168)によって、共形質転換した。このPCR増幅に用いたプライマーは、配列番号20(フォワード)および配列番号21(リバース)であった。pZUFCas9(配列番号14)のみで形質転換したUra−酵母(Y.lipolytica)細胞(Y2224)を、ネガティブコントロールとして供した。pZUFCas9(配列番号14)およびRGRプレsgRNA発現カセットで形質転換した細胞を、CM−ura培地上でウラシル原栄養体として選択した。ウラシルを欠き、アルギニンを欠き、そして60μg/mlの毒性のアルギニン類似体、カナバニン(CM+can)を補った完全最少培地上にCM−uraプレートをレプリカプレーティングすることによって、CAN1遺伝子中に機能欠失突然変異を含有する細胞をスクリーニングした。機能的CAN1遺伝子を有する細胞は、カナバニンを細胞中に輸送して、細胞死を引き起こし得る。CAN1遺伝子中に機能欠失対立遺伝子を有する細胞は、カナバニンを輸送せず、CM+canプレート上で増殖することができる。
カナバニン耐性の表現型スクリーニングによって回収した機能欠失突然変異体の頻度は、Cas9のみで形質転換した細胞について、ゼロであった(図4)。しかしながら、Cas9を、RGRプレsgRNA発現カセットで共形質転換すると、カナバニン耐性形質転換体の頻度は、10パーセントに増大した(図4)。
カナバニン耐性コロニーのCAN1遺伝子座を、フォワード(配列番号22)およびリバース(配列番号23)PCRプライマーを用いて増幅した。Zymoclean(商標)および濃縮カラム(Zymo Research,Irvine,CA)を用いて、PCR産物を精製した。配列決定プライマー配列番号24を用いて、PCR産物を配列決定した(サンガー法)。配列を、標的部位を含有する野生型(WT)ヤロウイア(Yarrowia)属CAN1コード配列とアラインした(図5)。Cas9およびsgRNAの双方を発現する細胞中のCAN1遺伝子座にある機能欠失一次突然変異(配列決定した単離体の73%)は、Cas9切断部位での−1フレームシフト突然変異であった(図5)。他の少数の欠失および挿入が、CAN1遺伝子座にある残りの突然変異を構成した。全部で、突然変異の90%は、小さな欠失または挿入であった(図5)。稀ではあるが、別の染色体からの少量の配列の挿入(4%)、切断部位での、ヤロウイア(Yarrowia)属最適化sgRNA発現カセットの挿入(1.5%)、またはより大きな欠失(1%)等の他の事象が生じた。スクリーニングしたカナバニン耐性コロニーの3.5%は、CAN1遺伝子座での再配列が複雑であり、配列決定によって確定できなかった。全体として、CAN1標的部位にて観察した突然変異から、Cas9/sgRNA複合体によって生じた切断を修復するために、エラープロンNHEJが細胞中で用いられたことが示される。
(i)CAN1特異的Cas9エンドヌクレアーゼを発現するように形質転換した細胞における、カナバニン耐性コロニーの頻度増大、および(ii)カナバニン耐性突然変異が、予測されるCas9切断部位でのエラープロンNHEJ事象によることを示した配列決定データの双方から、実施例2に記載するヤロウイア(Yarrowia)属最適化Cas9およびRGRプレsgRNA発現カセットが、ヤロウイア(Yarrowia)属染色体DNAを切断して、突然変異を発生させたことが確認される。
かくして、RNA構成要素の5’キャップがリボザイムによって自己触媒的に除去される場合、5’キャップを有していないRGEN(例えばCas9)のRNA構成要素(例えばsgRNA)の発現により、非従来型酵母におけるDNA配列のRGEN媒介ターゲティングが可能となる。
実施例4:5’リボザイムと共に(3’リボザイムなし)発現したヤロウイア(Yarrowia)属最適化sgRNAは、染色体DNAを切断するsgRNA/Cas9エンドヌクレアーゼ系において有用である
この実施例において、5’HHリボザイムのみを含有し、3’リボザイムを含有しないヤロウイア(Yarrowia)属最適化カセットから生じたsgRNAの機能性を評価して、sgRNAがCas9と相互作用し、DNA標的配列を認識し、Cas9によるDNA切断を誘導し、かつエラープロンNHEJによる突然変異をもたらすことができるかを判定した。
Pol IIプロモータから転写されたRNAを、5’末端および3’末端の双方にて重度にプロセシングして修飾することで、Pol IIプロモータから機能的sgRNAを生じさせるには、5’末端および3’末端が切断されなければならないことが示唆される。フランキング領域と共にインビトロで生じたsgRNAは、(i)5’フランキング領域が存在するならば、機能せず、(ii)3’フランキング領域が存在するならば、有意に機能的に損なわれることが以前に示されていた(Gao et al.,J.Integr.Plant Biol.56:343−349)。5’リボザイム、そしてまた3’フランキング領域を含有するプレsgRNAが、出芽酵母(Sacchromyces cerevisiae)において、Cas9を伴って発現されれば、sgRNAは、Cas9を標的部位に導いて切断するように機能しなかった(Gao et al.、同書)。
5’リボザイムがフランキングするsgRNA(3’に位置決めされるリボザイムを欠く)が非従来型酵母において機能することができるかを試験するために、5’から3’の方向に、FBA1プロモータ(配列番号12)、これに融合したHHリボザイム(配列番号15)、これに融合した、Can1−1標的部位(配列番号17)を標的とするsgRNAをコードする配列(配列番号70の例)、これに融合した、出芽酵母(S.cerevisiae)Sup4遺伝子由来の強転写ターミネータ(配列番号8)を含有するヤロウイア(Yarrowia)属最適化sgRNA発現カセット(配列番号25)を構築した(このカセットは、RG[リボザイム−sgRNA]RNAを発現するとして特徴付けることができる)。RG発現カセットにおいてコードされるsgRNAは、配列番号17に対応するVTドメインを含み、CERドメイン(配列番号1)が結合する。コードされるHHリボザイムの最初の6残基は、sgRNAの最初の6残基(すなわち、VTドメインの最初の6残基)と相補的である。配列番号25中の配列番号12(FBA1プロモータ)の直ぐ後ろに3つの残基(ATG)があり、これらは、プレsgRNAの発現およびリボザイム媒介自触媒作用に影響を及ぼすと考えられていない点に注目されたい。このヤロウイア(Yarrowia)属最適化RG発現カセット(配列番号25)を、図2Cに示す。
Cas9と相互作用して、Cas9をDNA標的配列に導いて、Cas9により切断することができるsgRNAを発現するヤロウイア(Yarrowia)属最適化RGカセットの能力を試験するために、RG構築体(配列番号25)またはRGR構築体(配列番号18、実施例2)のいずれかを含有するPCR産物を、リチウムイオン媒介形質転換(Ito et al.、同書)によって、pZUFCas9(配列番号14)でUra−酵母(Y.lipolytica)細胞(Y2224)中に共形質転換した。Ura+形質転換体を、CM+canプレート上にレプリカプレーティングして、(実施例3のように)カナバニン耐性細胞についてスクリーニングした。この細胞中で、RGまたはRGRプレsgRNAから生じたsgRNAは、Cas9を導いてCAN1標的配列を切断するように機能して、NHEJを介したエラープロン修復をもたらす。ヤロウイア(Yarrowia)属最適化RGまたはRGRカセットが、Cas9媒介切断を標的部位に導く頻度は同じであった(図6)ことから、出芽酵母(S.cerevisiae)を用いたGao et al.(J.Integr.Plant Biol.56:343−349)の結果に反して、3’リボザイムは、ヤロウイア(Yarrowia)属における効率的なCas9/sgRNA標的切断および突然変異に必須でなかったことが示される。
この実施例から、非従来型酵母、例えばヤロウイア(Yarrowia)属において、リボザイム戦略を用いた場合に、5’フランキングリボザイムのみが、Pol IIプロモータから機能的sgRNAを生じさせるのに必須であると思われることが実証される。この結果は、従来の酵母である出芽酵母(S.cerevisiae)において観察されたものと対照的であり、そこでは、5’リボザイムおよび3’リボザイムの双方が、Cas9による標的配列の効率的な切断および突然変異に必要とされた(Gao et al.、同書)。
かくして、この実施例からさらに、RNA構成要素の5’キャップがリボザイムによって自己触媒的に除去される場合、5’キャップを有していないRGEN(例えばCas9)のRNA構成要素(例えばsgRNA)の発現により、非従来型酵母におけるDNA配列のRGEN媒介ターゲティングが可能となることが実証される。
実施例5:Cas9/sgRNA誘導DNA二本鎖切断の相同組換え(HR)修復を促進するための、線状ポリヌクレオチド修飾鋳型の使用
この実施例は、ヤロウイア(Yarrowia)属最適化Cas9およびプレsgRNA発現カセットを発現することによって生じる二本鎖切断(DSB)を、線状ポリヌクレオチド修飾鋳型DNA配列を用いて修復する、ヤロウイア(Yarrowia)属におけるHR機構の能力についての試験を開示する。3つの異なる線状鋳型配列を生成した。これらはそれぞれ、染色体DNA中のCas9/sgRNAターゲティング部位の外側の領域に相同である5’アーム配列および3’アーム配列を有した。
ポリヌクレオチド修飾鋳型配列の最初の2つの型は、相補的である合成オリゴヌクレオチドから生じた。相補的なオリゴヌクレオチドをアニールしてから、エタノール沈殿によって精製した。
相補的オリゴヌクレオチド(配列番号28および29)を用いて、第1のポリヌクレオチド修飾鋳型を生成し、20ヌクレオチドのCan1−1標的部位(配列番号17)、3ヌクレオチドのPAMドメイン、およびCan1−1標的部位の直ぐ上流の2つのヌクレオチドを欠失させることによって、CAN1遺伝子において8つのコドンおよび1つの塩基対を欠失させて、−1bpフレームシフトが生じるように設計した。第1のポリヌクレオチド修飾鋳型は、配列番号28およびその逆相補体、配列番号29をアニールすることによってアセンブルした。第1のドナーDNAの相同アーム(それぞれ約50bp)は、互いに直接隣り合っている;間に異種起源配列はない。
相補的オリゴヌクレオチド(配列番号30および31)を用いて、第2のポリヌクレオチド修飾鋳型を生成し、CAN1オープンリーディングフレームにおいて2つのインフレーム翻訳終止コドン(すなわち、ナンセンス突然変異)を生じさせるように設計した。また、Can1−1標的部位の下流でPAM配列を分裂させ(CGGをATGで置換する)、そしてシード配列の第1のヌクレオチド(すなわち、配列番号17のCan1−1標的配列の最後の残基)を分裂させる(CをGで置換する)ように設計した。このポリヌクレオチド修飾鋳型は、配列番号30およびその逆相補体、配列番号31をアニールすることによって生成した。上記から読み取ることができるように、第2のドナーDNAの相同アーム(それぞれ約50bp)を、数塩基対の異種起源配列によって分離する。
2つのPCR産物を生じさせることによって、第3のポリヌクレオチド修飾鋳型を部分的に生じさせた。PCR産物(配列番号32。プライマー配列番号33[フォワード]および配列番号34[リバース]を用いて酵母(Y.lipolytica)ATCC 20362ゲノムDNAから増幅した)の1つにおいて、配列番号32の位置638は、CAN1オープンリーディングフレーム開始コドンの上流側ヌクレオチド3bpに対応する。リバースプライマー(配列番号34)は、CAN1オープンリーディングフレームの下流側37bpに存在する配列と相補的な17ヌクレオチドを加えている。第2のPCR産物(配列番号35。プライマー配列番号36[フォワード]および配列番号37[リバース]を用いて酵母(Y.lipolytica)ATCC 20362ゲノムDNAから増幅した)は、CAN1オープンリーディングフレームの終止コドンの下流側14塩基対から始まる637塩基対を含む。フォワードプライマー(配列番号36)は、CAN1オープンリーディングフレームの上流側2塩基対で終える領域と相補的な20ヌクレオチドを加えている。上流のPCR産物(配列番号32)および下流のPCR産物(配列番号35)の双方を、Zymoclean(商標)および濃縮カラムを用いて精製した。これらのPCR産物(各10ng)を、新しいPCR反応液中に混合した。上流産物の3’側の殆どの37ヌクレオチドは、下流産物の5’側の殆どの37ヌクレオチドと同じである。上流フラグメントおよび下流フラグメントを用いて互いをプライムさせて、上流配列および下流配列の双方を含有する、オーバーラップしている末端からの合成によって、単一の産物(配列番号38)を生じさせた(Horton et al.,Biotechniques 54:129−133によって記載される技術)。配列番号38のドナーDNAの相同アーム(それぞれ600bpを超える)は、互いに直接隣り合っている;間に異種起源配列はない。このポリヌクレオチド修飾鋳型は、Can1−1標的部位中のCas9/sgRNA媒介二本鎖切断の領域中のCAN1オープンリーディングフレーム全体を包含する大きな欠失を可能にする。
先のリチウムイオン形質転換法を用いて、(i)pZUFCas9(配列番号14)、(ii)1μgのヤロウイア(Yarrowia)属最適化RGRプレsgRNA発現カセット(配列番号18)、および(iii)1nmolの「フレームシフト鋳型」DNA(配列番号28)、1nmolの「点突然変異鋳型」DNA(配列番号30)、または1μgの「大欠失鋳型」DNA(配列番号38)で、Ura−酵母(Y.lipolytica)細胞(Y2224)を形質転換した。形質転換細胞を、CM−uraプレート上で、ウラシルの原栄養体として回収した。CAN1突然変異を有するカナバニン耐性細胞を同定するために、CM+canへのレプリカプレーティングによって、原栄養性コロニーをスクリーニングした。フォワードプライマー(配列番号22)およびリバースプライマー(配列番号23)を用いるPCR増幅を介して、各形質転換由来のCanRコロニーのCAN1遺伝子座をスクリーニングした。ExoSAP−IT(登録商標)(Affymetrix,Santa Clara,CA)を用いて各PCR産物を精製し、配列決定プライマー配列番号24を用いて配列決定した(サンガー法)。CanRコロニーの総数から予測される相同組み換え事象を示すコロニーの頻度(これを考慮して、特定の鋳型DNAを形質転換に用いた)は、約15%であった(図7)。
3つの異なるポリヌクレオチド修飾鋳型DNA配列は、HR修復の効率性が僅かに異なった(図8)。具体的には、各鋳型によるHR頻度は、おおよそ11%(大欠失およびフレームシフトドナー)から22%(点突然変異鋳型)であった(図8)ことから、ポリヌクレオチド修飾鋳型DNAが提供された場合に、Can1−1標的部位での、Cas9/sgRNAで生じた切断事象の一部が、HR経路を用いて高い忠実度で修復されたことが示される。
DNA修復の2つの主な経路、NHEJまたはHRを用いて、ヤロウイア(Yarrowia)属においてNHEJについて明らかな偏りが実証され(図7)、これは、従来型酵母におけるCas9/sgRNA媒介切断事象時の修復の研究において観察されたものと異なる。例えば、DiCarlo et al.(Nucleic Acids Res.41:4336−4343)は、Cas9/sgRNA媒介DNA切断の修復にドナーDNAが提供された場合に得られた殆ど全ての出芽酵母(S.cerevisiae)突然変異体が、HRを介して生じた一方で、ドナーDNAが提供されなかった場合、頻度が4から5の規模で下がることから、HRへの明らかな偏りが示されることを示した。対照的に、Cas9/sgRNA(RGRカセットから発現されるsgRNA)切断部位のヤロウイア(Yarrowia)属における総突然変異頻度は、ポリヌクレオチド修飾鋳型DNAを受け取った、または受け取らなかった形質転換体の間で変化せず(図9。双方の形質転換体型について、約15%の突然変異率を示す)、HRは、ドナーDNAが提供される場合に生じた突然変異形質転換体の約15パーセントしか占めない(図7)。かくして、先に観察されるように、ヤロウイア(Yarrowia)属におけるポリヌクレオチド修飾鋳型DNA配列によるHRの頻度は、僅か約2.25%であった。これは、従来型酵母においてドナーDNAで観察されたほぼ100%のHR媒介突然変異率とは全く対照的である(DiCarlo et al.、同書)。
かくして、この実施例からさらに、RNA構成要素の5’キャップがリボザイムによって自己触媒的に除去される場合、5’キャップを有していないRGEN(例えばCas9)のRNA構成要素(例えばsgRNA)の発現により、非従来型酵母におけるDNA配列のRGEN媒介ターゲティングが可能となることが実証される。この実施例からまた、適切なドナーDNA(ポリヌクレオチド修飾鋳型)が提供されるならば、非従来型酵母におけるRGEN媒介切断が、HRによってある率で修復され得ることが実証される。
実施例6:Cas9およびヤロウイア(Yarrowia)属最適化RGRまたはRGプレsgRNAの、単一の安定ベクターからの発現は、Cas9/sgRNA媒介標的DNA切断を実現する
この実施例において、ヤロウイア(Yarrowia)属最適化RGRまたはRGプレsgRNA発現カセットをそれぞれ個々に、ヤロウイア(Yarrowia)属最適化Cas9発現カセットと同じ安定発現プラスミド中に移した。具体的には、配列番号18(RGR発現用)または配列番号25(RG発現用)をそれぞれ個々に、pZUFCas9(図3A、配列番号14)中にクローニングした。これにより、単一構成要素形質転換によって、Cas9エンドヌクレアーゼおよびRGまたはRGRプレsgRNAを細胞中で発現させることによって、Cas9/sgRNA媒介標的部位切断に続いてエラープロンNHEJ修復を実現することができる。
ヤロウイア(Yarrowia)属最適化RGR(配列番号18)またはRG(配列番号25)sgRNA発現カセットを、フォワード(配列番号39)プライマーおよびリバース(配列番号40)プライマーを用いたPCRによって増幅した。各産物を、プラスミドpZUFCas9(配列番号14)中に、PacI/ClaI制限部位にて個々にクローニングして、2つの新しいプラスミドを生成した。これらはそれぞれ、Cas9発現、および最適化RGRプレsgRNA(pRF84、配列番号41、図10A)または最適化RGプレsgRNA(pRF85、配列番号42、図10B)のいずれかの発現用の各カセットを有する。
Cas9およびsgRNAを効果的に発現して、Cas9/sgRNA媒介標的部位(Can1−1)切断を実現する、pRF84(配列番号41)プラスミド構築体およびpRF85(配列番号42)プラスミド構築体の能力を試験するために、先のリチウムイオン形質転換法を用いて、Ura−酵母(Y.lipolytica)細胞(Y2224)を、200ngのpRF84(配列番号41)、pRF85(配列番号42)、またはpZUFCas9(配列番号14)で形質転換した。各プラスミドで形質転換した細胞を、CM−ura培地上でウラシル原栄養体として選択した。各形質転換由来のウラシル原栄養体を、CM+can上へのレプリカプレーティングによって、CAN1突然変異体についてスクリーニングした。CM+canプレート上で増殖したコロニーの数を利用して、pZUFCas9(Cas9のみを発現)、pRF84(Cas9およびRGRプレsgRNAを発現)、またはpRF85(Cas9およびRGプレsgRNAを発現)で形質転換した細胞について、CAN1突然変異頻度(図11)を作成した。pZUFCas9(配列番号14)で形質転換したヤロウイア(Yarrowia)属細胞は、CAN1遺伝子座でのCas9/sgRNA媒介突然変異の頻度が0であった一方で、(i)Cas9および(ii)RGRプレsgRNA(pRF84)またはRG sgRNA(pRF85)を発現する細胞は、カナバニン耐性によって示されるように、類似したCAN1突然変異頻度を有した(約69%)(図11)。
これらの結果から、同じベクターからCas9およびプレsgRNAを発現することで、予測される切断部位での有意に高いCas9/sgRNA媒介切断率、そして結果的にNHEJ媒介突然変異に至ることが示される。Cas9およびプレsgRNA(RGRまたはRGプレsgRNA)をコードする別々の配列で形質転換したヤロウイア(Yarrowia)属細胞は、約5%の標的突然変異頻度を示した(実施例4、図6)一方、Cas9およびsgRNAコード配列の双方を、形質転換に用いる同じベクター上に配置すると、約69%の標的突然変異頻度がもたらされた(図11)。
かくして、非従来型酵母を形質転換するのに用いた同じ構築体からCasタンパク質およびその対応するRNA構成要素を発現させると、RGENタンパク質およびRNA構成要素を発現する別々の構築体を用いた場合と比較して、酵母においてより高いCas媒介DNAターゲティング率がもたらされた。
実施例7:酵母(Yarrowia lipolytica)においてHDVリボザイム−sgRNA融合体を用いた高効率の遺伝子ターゲティング
この実施例は、単一ガイドRNA(5’末端上にHDVリボザイムがフランキングするsgRNA(リボザイム単一ガイドRNA融合))の使用について考察する。発現される場合、HDVリボザイムは、自己の配列の5’を切断して、先行するあらゆる転写産物を除去するが、HDV配列をsgRNAの5’末端に融合したままにする。
Agilent QuickChangeおよび以下のプライマー、AarI−removal−1(AGAAGTATCCTACCATCTACcatctccGAAAGAAACTCGTCGATTCC、配列番号90)およびAarI−removal−2(GGAATCGACGAGTTTCTTTCggagatgGTAGATGGTAGGATACTTCT、配列番号91)を用いて、プラスミドpZuf−Cas9(配列番号14)に突然変異を起こして、pZuf−Cas9(配列番号14)上のCas9遺伝子(配列番号10)中に存在する内在性AarI部位を除去して、pRF109(配列番号92)を生成した。修飾Aar1−Cas9遺伝子(配列番号93)を、NcoI/NotIフラグメントとして、pRF109から、pZufCas9のNcoI/NotI部位中にクローニングして、既存のCas9遺伝子(配列番号10)をAar1−Cas9遺伝子で置換して、pRF141(配列番号94)を生成した。
高スループットクローニングカセット(図12A、配列番号95)を、yl52プロモータ(配列番号96)、HDVリボザイム(配列番号16)、大腸菌(Escherichia coli)カウンターセレクションカセットrpsL(配列番号97)、ガイドRNA CERドメインをコードするDNA(配列番号1)、および出芽酵母(S.cerevisiae)Sup4ターミネータ(配列番号8)で構成する。高スループットクローニングカセット(配列番号95)の末端にフランキングするのは、PacIおよびClaI制限酵素認識部位である。高スループットクローニングカセットを、pRF141(配列番号94)のPacI/ClaI部位中にクローニングして、pRF291(配列番号98)を生成した。rpsLカウンターセレクションカセット(配列番号97)は、S12リボソームタンパク質サブユニットをコードする大腸菌(E.coli)遺伝子rpsLのWTコピーを含有する(Escherichia coli and Salmonella typhimurium:Cellular and Molecular Biology,1987,First ed.American Society of Microbiology,Washington,DC)。S12サブユニットにおける一部の突然変異は、抗生物質ストレプトマイシンに対する耐性(Ozaki M,Mizushima S,Nomura M.1969.Identification and functional characterization of the protein controlled by the streptomycin−resistant locus in E.coli.Nature 222:333−339)を劣性様式で(Lederberg J.1951.Streptomycin resistance;a genetically recessive mutation.Journal of bacteriology 61:549−550)もたらす(rpsL遺伝子の野生型コピーが存在するならば、株はストレプトマイシンに対して表現型的に感受性である)。Top10(Life technologies)等の一般的なクローニング株は、その染色体上に、細胞がストレプトマイシンに対して耐性を示すようなrpsLの突然変異コピーを有する。
ガイドRNAの可変ターゲティングドメインをコードするDNAフラグメントをプラスミド(例えばpRF291)中にクローニングするには、アニールされると、可変ターゲティングドメインをコードするDNAフラグメント、および高スループットクローニングカセット中に存在する2つのAarI部位中にクローニングするための正確な突出部を含有する、2つの部分的に相補的なオリゴヌクレオチドが必要とされる。2つのオリゴヌクレオチド、Can1−1F(AATGGGACtcaaacgattacccaccctcGTTT、配列番号99)およびCan1−1R(TCTAAAACgagggtgggtaatcgtttgaGTCC、配列番号100)を、デュプレックスバッファ(30mM HEPES pH7.5、100mM酢酸ナトリウム)中に100μMで再懸濁した。Can1−1F(配列番号99)およびCan1−1R(配列番号100)を、単一チューブ中にそれぞれ50μMの最終濃度で混合し、95℃に5分間加熱し、そして0.1℃/分にて25℃に冷却して、2つのオリゴヌクレオチドをアニールして、Can1−1標的部位(PAM配列CGGを含む配列番号101として示す)を標的とすることができるガイドRNAの可変ターゲティングドメインをコードするDNAフラグメントを含有する小さな二重鎖DNA分子(図12B)を形成した。50ngのpRF291、Can1−1Fで構成される2.5μMの小さな二重鎖DNA、およびCan1−1R 1×T4リガーゼバッファ(50mMトリス−HCl、10mM MgCl2、1mM ATP、10mM DTT pH7.5)、0.5μM AarIオリゴヌクレオチド、2ユニットAarI、40ユニットT4DNAリガーゼを含有する単一チューブの消化/ライゲーション反応液を、20μlの最終容量で生じさせた。二重化したCan1−1FおよびCan1−1R二重鎖を欠く第2のコントロール反応液もアセンブルした。反応液を37℃で30分間インキュベートした。各反応液の10μlを、以前に記載されるように(Green MR,Sambrook J.2012.Molecular Cloning:A Laboratory Manual,Fourth Edition ed.Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY)、Top10大腸菌(E.coli)細胞中に形質転換した。AarI制限部位がフランキングするrpsLカウンターセレクションマーカーを、Can1−1FおよびCan1−1Rの二重鎖が置換した(図12A)pRF291の存在について選択するために、細胞を、100μg/mlアンピシリンおよび50μg/mlストレプトマイシンを含有する1.5%(w/v)Bactoアガーで固めた溶原Broth上にプレーティングした。高スループットクローニングカセットを含有するpRF291の存在により、プラスミド上のカウンターセレクションカセットの存在のために、抗生物質アンピシリンに対して表現型的に耐性を示すが、抗生物質ストレプトマイシンに対して感受性であるコロニーが生じた。しかしながら、カウンターセレクションカセットがAarI酵素を介して除去され、かつCan1−1二重鎖DNAが部位中にライゲートされた(AarIの認識配列が除去された)場合、プラスミドで形質転換した細胞は、アンピシリン耐性、ストレプトマイシン耐性表現型を有した(図12A)。Can1−1可変ターゲティングドメインをコードする(カウンターセレクションカセットを置換した)DNAフラグメントを含有するpRF291は、組換えHDV−sgRNA発現カセット(配列番号102)を生成した。これは、yl52プロモータ、これに融合した、HDVリボザイム(配列番号16)をコードするDNA、これに融合した、Can1−1可変ターゲティングドメイン(配列番号17)をコードするDNA、これに融合した、ガイドCERドメイン(配列番号1)をコードするDNA、これに融合したsup4ターミネータ(配列番号8)を含有した。この構築体を含有するプラスミド、pRF303(配列番号103)を用いて、(Cas9エンドヌクレアーゼと複合させた場合に)酵母(Yarrowia lipolytica)のCan1遺伝子(配列番号21)を標的として突然変異を誘発することができるHDVリボザイム−ガイドRNA(配列番号104)をコードさせた。
酵母(Yarrowia lipolytica)を、(Richard M,Quijano RR,Bezzate S,Bordon−Pallier F,Gaillardin C.2001.Journal of bacteriology 183:3098−3107に記載されるように)プラスミドと形質転換せず、または100ngの、sgRNA発現カセットを有していないプラスミド(pRF291、配列番号98)、RGR発現カセットを有するpRF84プラスミド(配列番号41)、5’リボザイムがそれ自体をsgRNAから除去するRGカセットを有するpRF85プラスミド(配列番号42)、もしくはヤロウイア(Yarrowia)属においてCan1−1標的部位を標的とするHDV−sgRNA融合発現カセット(配列番号102)を有するpRF303(配列番号103)で形質転換した。形質転換体を、ウラシル原栄養性について選択し、アルギニン類似体カナバニンに対する表現型耐性によって、Can1遺伝子中の突然変異について記録した。HDV−sgRNA融合体を発現するプラスミドは、Can1遺伝子における機能欠失突然変異を、リボザイムから遊離するsgRNAを発現するプラスミドと同じ頻度で生じさせ、Can1−1を標的とするsgRNAへのHDVリボザイムの5’融合が、sgRNA機能に影響を及ぼさなかったことが示唆される(表4)。
いくつかの付加的な標的部位を標的とする可変ターゲティングドメインをコードするいくつかの付加的なDNAフラグメント(表5)を、先に記載したのと同じ戦略を用いて、図12Aに示すpRF291(配列番号98)プラスミド中にクローニングした。挙げられるのは、Can1遺伝子(配列番号105)内の、can1−2標的部位(配列番号106)、ならびに他の標的部位、例えばsou2−1(配列番号107)、Sou2−2(配列番号108)、Tgl1−1(配列番号112)、Acos10−1(配列番号113)、Fat1−1(配列番号114)、およびUra3−1(配列番号116)を標的とする第2の標的部位を標的とする可変ターゲティングドメインをコードするDNAフラグメントである。
標的部位の突然変異頻度は、全てのHDV−sgRNA融合体が、Cas9エンドヌクレアーゼとの複合体を形成することができることを示し、この複合体は次に、各標的部位にて切断を生じさせて、NHEJを介して突然変異をもたらした(表6)。
実施例8:不活化Cas9およびHDV−sgRNA融合体を用いた遺伝子サイレンシング。
HNHヌクレアーゼドメインおよびRuvCヌクレアーゼドメイン中に突然変異を含有する、触媒不活化Cas9変異体(配列番号117)は、sgRNAと相互作用して、標的部位にインビボで結合することはできるが、標的DNA鎖を切断することはできない。この作用様式(DNAに結合するが壊さない)を用いて、永続的な遺伝的変異を生じさせることなく、染色体中の特定の遺伝子座の発現を一時的に減少させることができる。
酵母(Yarrowia lipolytica)用の触媒不活化Cas9発現カセットを生成するために、quickchange site−directed mutagenesis(Stratagene)を、記載されるように、プライマーD10AF(GAAATACTCCATCGGCCTGGCCATTGGAACCAACTCTGTCG、配列番号118)およびD10AR(CGACAGAGTTGGTTCCAATGGCCAGGCCGATGGAGTATTTC、配列番号119)と共に用いて、D10A突然変異をプラスミドpZufCas9(配列番号14)に導入した。これにより、RuvCヌクレアーゼを不活化するD10A突然変異を有するヤロウイア(Yarrowia)属コドン最適化Cas9遺伝子(配列番号120)、および対応する、構築体を含有するプラスミド、pRF111(配列番号121)が生成された。第2のヌクレアーゼドメイン(HNH)を不活化するために、プライマーH840A1(TCAGCGACTACGATGTGGACGCCATTGTCCCTCAATCCTTTCT、配列番号122)およびH840A2(AGAAAGGATTGAGGGACAATGGCGTCCACATCGTAGTCGCTGA、配列番号123)を用いて、quickchange mutagenesis(Stratagene)の追加のラウンドを実行して、H840A突然変異をヤロウイア(Yarrowia)属コドン最適化D10A遺伝子中に導入し、ヤロウイア(Yarrowia)属コドン最適化Cas9不活化遺伝子(配列番号124)、およびヤロウイア(Yarrowia)属における発現用の遺伝子を有するプラスミド、pRF143(配列番号125)が生成された。
酵母(Yarrowia lipolytica)における遺伝子サイレンシングを評価するために、ヤロウイア(Yarrowia)属コドン最適化dsREDexpressオープンリーディングフレーム(配列番号126)を、5’NcoI制限部位および3’NotI制限部位(配列番号127)を有するクローニングフラグメントとして生成した。クローニングフラグメント(配列番号127)を、pZufCas9のNcoI/NotI部位中にクローニングして、ヤロウイア(Yarrowia)属最適化dsREDexpressクローニングフラグメント(配列番号127)に融合したFBA1プロモータ(配列番号12)を生じさせて、プラスミドpRF165(配列番号129)上に含有されるFAB1−dsRED融合カセット(配列番号128)を生成した。染色体中にFBA1−dsREDexpressカセット(配列番号128)を組み込むために、カセットを含有するPmeI−NotIフラグメント(配列番号130)を、組込み型プラスミドp2P069(配列番号131)のPmeI/NotI部位中にライゲートして、FBA1−dsREDexpress発現カセット、pRF201(配列番号132)を有する組込み型ベクターを生成した。FBA1−dsREDexpress融合体およびLeu2遺伝子(配列番号133)のコピーを有するpRF201のSphI/AscIフラグメントを、標準的な技術(Richard M,Quijano RR,Bezzate S,Bordon−Pallier F,Gaillardin C.2001.Tagging morphogenetic genes by insertional mutagenesis in the yeast Yarrowia lipolytica.Journal of bacteriology 183:3098−3107)を用いて、ロイシン原栄養性について選択することによって、ヤロウイア(Yarrowia)属の染色体中に組み込んだ。ヤロウイア(Yarrowia)属ゲノムにおけるFBA1−dsREDexpress発現カセットの存在を、標準的なPCR技術、ならびにプライマーHY026(GCGCGTTTAAACCATCATCTAAGGGCCTCAAAACTACC、配列番号134)およびHY027(GAGAGCGGCCGCTTAAAGAAACAGATGGTGTCTTCCCT、配列番号135)を用いて確かめた。FBA1−dsREDexpressカセット(配列番号128)を含有する2つの独立した株、YRF41およびYRF42を、更なる使用のために選択した。
ヤロウイア(Yarrowia)属最適化dsREDexpress発現カセット(配列番号128)を標的とするsgRNAを生成するために、実施例12に類似する戦略を用いた。プラスミド構築体、pRF169(配列番号136)は、図13Aに示すように、ヤロウイア(Yarrowia)属カウンターセレクション可能なマーカー由来のGPDプロモータ(配列番号137)、ガイドRNA CERドメインをコードするDNA(配列番号1)、およびSup4ターミネータ(配列番号8)カセット(配列番号138)を含有した。ヤロウイア(Yarrowia)属において標的部位を標的とする、HHリボザイムをコードするDNAフラグメントに結合する、sgRNAの可変ターゲティングドメインをコードするDNAを、実施例12に示すように、pRF169(配列番号136)中にクローニングした。但し、図13Bに示すように、HHリボザイムをコードするDNAフラグメントは、ハンマーヘッドリボザイムの最初の6ヌクレオチドが、可変ターゲティングドメインの最初の6ヌクレオチドの逆相補体であるようにしたことを除く。正確な突出部を有する二重オリゴヌクレオチドが、AarI部位間のカウンターセレクションカセットを置換すると、リボザイム−ガイドRNA(RG)発現カセットが生じた(図13A)。転写されると、HHリボザイムは、リボザイム−ガイドRNA分子から5’転写産物およびHHリボザイムそれ自体を除去して、細胞中でsgRNAを無傷のままにする。dsREDexpressオープンリーディングフレーム(配列番号126)を標的とする3つのガイドRNAを生成した;鋳型鎖を標的とする2つ、ds−temp−1(配列番号139)、ds−temp−2(配列番号140)、そして非鋳型鎖を標的とする1つ、ds−nontemp−1(配列番号141)。
各標的部位について、標的特異的ハンマーヘッドリボザイム、可変ターゲティングドメイン(VTD)、およびpRF169のAarI部位中へのクローニング用の正確なオーバーラップ末端をコードするDNA配列を含有する2つのオリゴヌクレオチドを設計した。各部位用のオリゴヌクレオチド;ds−temp−1F(配列番号144)、ds−temp−1R(配列番号145)、ds−temp−2F(配列番号146)、ds−temp−2R(配列番号147)、ds−nontemp−1F(配列番号148)、およびds−nontemp−1R(配列番号149)を、AarI突出部中へのクローニング用の正確な突出部が、pRF169の高スループットカセット中に残るように二重化して、二本鎖DNA分子を形成し(図13Aおよび図13B)、実施例12に記載するように、pRF291中へのクローニングを実行した。sgRNAの可変ターゲティングドメインをコードするDNAフラグメントの挿入は、カウンターセレクションカセットを置換して、各標的部位用に新しいプラスミドを生じさせた。これは、GPDプロモータを有し、これにハンマーヘッドリボザイム−標的部位二重鎖DNAが融合し、これに、ガイドRNA CERドメインをコードするDNAが融合し、これにSup4ターミネータが融合する(図13A)。これらの二重鎖を含有するプラスミドは、pRF296(ds−temp−1、配列番号150)、pRF298(ds−temp−2、配列番号151)、pRF300(ds−nontemp−1、配列番号152)である。
遺伝子サイレンシング用の構築体を生成するために、pRF143(配列番号125)由来の不活化Cas9を、NcoI/NotIフラグメントとして、標準的な技術を用いて、pRF296、pRF298、およびpRF300中にクローニングすると、これらのプラスミドのNcoI/NotI部位中に存在する機能的Cas9(配列番号93)が置換されて、プラスミドpRF339(配列番号153)、pRF341(配列番号154)、およびpRF342(配列番号155)がそれぞれ生じた。
株YRF41およびYRF42を、標準的な技術を用いて、pRF339、pRF341およびpRF343でウラシル原栄養体に形質転換した(Richard M,Quijano RR,Bezzate S,Bordon−Pallier F,Gaillardin C.2001.Tagging morphogenetic genes by insertional mutagenesis in the yeast Yarrowia lipolytica.Journal of bacteriology 183:3098−3107)。各形質転換について、12の形質転換体を、ウラシルを欠くプレート上にストリークして精製して、プラスミドを維持した。各単離物を用いて、2mlのCM−uraブロス(Teknova)に植菌して、30℃、250RPMにて一晩増殖させた。一晩経ったそれぞれ2〜5μlを、200μlのddH2O中に希釈し、AccuriフローサイトメータのdsREDexpressチャンネル内で分析し、各細胞内のdsREDexpressタンパク質の量を評価した。各培養由来の7,151〜10,000個の細胞を分析した。dsREDexpress発現カセットのないヤロウイア(Yarrowia)属細胞の平均蛍光を、分析した各培養体の平均蛍光から差し引いて、各株/プラスミド組合せ内の補正平均蛍光を得、これらを平均して標準偏差を求めた(表7)。発現ベクターを介して発現された、リボザイム−sgRBA(RG)と組み合わせた不活化Cas9は、対象の遺伝子を標的として、遺伝子の発現を2〜10倍サイレンシングした。サイレンシングの倍数は、標的部位の位置および鎖の数(strandedness)、ならびに/またはヤロウイア(Yarrowia)属細胞において機能的な形態でDNAポリメラーゼプロモータから発現される、リボザイムがフランキングするsgRNAの能力に応じて変化した(表7)。
実施例9:単一プラスミドから発現されるCas9およびHDVリボザイム−sgRNA融合(RG)を用いた正確な遺伝子編集。
この実施例において、発明者らは、同じ安定ベクターから発現されるCas9およびHDV−sgRNA融合体の安定した発現が、ヤロウイア(Yarrowia)属の標的部位においてDNA二本鎖切断を生じさせることができ、相同組換えを介した正確な遺伝子編集のための担体となり得ることを実証する。
実施例4に記載するCan1欠失ポリヌクレオチド修飾鋳型DNA(配列番号38)を、標準的な技術を用いて、HinDIIIで消化して、pUC18のHinDIII部位中にクローニングして、pRF80(配列番号156)を生成した。より短いCan1欠失編集鋳型(配列番号157)を、標準的なPCR技術、ならびにプライマー80F(AGCTTGCTACGTTAGGAGAA、配列番号158)および80R(TATGAGCTTATCCTGTATCG、配列番号159)を用いて、pRF80から増幅して、大量の編集鋳型を生成した。
Ura栄養要求性ヤロウイア(Yarrowia)属細胞を、標準的な技術(Richard M,Quijano RR,Bezzate S,Bordon−Pallier F,Gaillardin C.2001.Tagging morphogenetic genes by insertional mutagenesis in the yeast Yarrowia lipolytica.Journal of bacteriology 183:3098−3107)を用いて、100ngの、Cas9遺伝子のコピーを有するがsgRNAを有していないプラスミドpRF291、ならびにCas9遺伝子のコピーおよびCan1−1標的部位HDV−sgRNA発現カセットを有するpRF303(編集鋳型DNAも1000ngの短Can1欠失編集鋳型(配列番号157)も伴わない)で形質転換した。形質転換体を、CM−ura培地(Teknova)上で選択した。各形質転換について、20のコロニーをそれぞれ、CM−ura培地(Teknova)上にストリークして精製した。ストリーク精製した各コロニーから、それぞれ4つのコロニー(形質転換あたり合計80)を、60μg/mlのL−カナバニンを含有するCM−argプレート上にパッチして、Can1遺伝子中の機能対立遺伝子の欠失を含有するコロニーについてスクリーニングした。カナバニンに対する耐性を実証したパッチを記録し、そして遺伝子不活化の頻度を記録した(表8)。どのコロニーが、相同組換えのためにCan1機能を欠失したか、そしてどのコロニーが、NHEJのためにCan1機能を欠失したかを判定するために、Can1遺伝子座(配列番号160)を、Can1−PCRF(GGAAGGCACATATGGCAAGG、配列番号22)およびCan1−PCRR(GTAAGAGTGGTTTGCTCCAGG、配列番号23)を用いて増幅した。先の実施例において記載する小さなindelを有する細胞において、PCR産物は、Can1欠失編集鋳型との相同組換えによる欠失を含有する株中のWT Can1遺伝子座(配列番号160)とサイズが非常に類似するはずである(2125bp)。Can1−PCRF(配列番号22)およびCan1−PCRR(配列番号23)によるPCRフラグメント(配列番号161)は、より小さいであろう(392bp)。PCR産物の2μlを、標準的な技術を用いて、電気泳動を介して分離して、画像化した(図14)。編集鋳型(配列番号161)による組換えに対応する短いバンドを有する、ストリーク精製直後に1つまたは複数のコロニーを産出した当初の20のストリークしたコロニーのパーセンテージを用いて、HRの頻度を判定した(表8)。pRF303(配列番号103)を受け取った細胞において、カナバニン耐性コロニーの頻度は、細胞が編集鋳型を受け取ったかどうかに拘らず、類似した(表8)。形質転換細胞の総集団中のpRF303(配列番号103)およびCan1短編集鋳型(配列番号157)の双方を受け取った細胞において、約10分の1は、編集鋳型(配列番号157)由来のCan1遺伝子座の正確な編集(表8)を含有した。
実施例10:ヤロウイア(Yarrowia)属におけるURA3遺伝子不活化
本実施例は、ヤロウイア(Yarrowia)属におけるURA3遺伝子不活化用の単一ガイドRNA(sgRNA)およびCas9エンドヌクレアーゼを別々に、または一緒に発現するプラスミドの構築および使用を記載する。pYRH235およびpYRH236はそれぞれ、URA3.1標的配列(5’−ctgttcagagacagtttcct−3;配列番号165)を標的とする、リボザイムがフランキングするプレsgRNA(RGR−URA3.1;配列番号164)、およびURA3.2標的配列(5’−taacatccagagaagcacac−3’;配列番号167)を標的とする、リボザイムがフランキングするプレsgRNA(RGR−URA3.2;配列番号166)を発現した。RGR−URA3.1をコードするDNAフラグメントのNcoI−NotI制限消化フラグメント、およびRGR−URA3.2をコードするBspHI−NotI制限消化フラグメントを、FBA1Lプロモータ(配列番号168)に融合して、pYRH235およびpYRH236をそれぞれ生成した。pYRH235およびpYRH236プラスミドは、スルホニルウレア耐性を付与する単一アミノ酸変化(W497L)を有する、在来のアセトヒドロキシ酸シンターゼ(AHASまたはアセト乳酸シンターゼ;E.C.4.1.3.18;配列番号169)のマーカー遺伝子を含有した。
ヤロウイア(Yarrowia)属株ATCC20362のUra−マイナス誘導体(Y2224)を最初に、SphI−BsiWI制限消化によって、線状化したpZufCas9(配列番号14)で形質転換し、形質転換体を、ウラシルを欠く完全最小(CM)プレート上で選択した。線状化Cas9発現カセットを、ヤロウイア(Yarrowia)属ゲノム中にランダムに組み込んだので、形質転換体は少なくとも2コピーのURA3遺伝子を含有した。続いて、sgRNAを発現するpYRH235またはpYRH236を、Cas9発現ヤロウイア(Yarrowia)属株中に形質転換して、形質転換体を、600mg/Lスルホニルウレアを含有するCMプレート上で選択した。50の形質転換体を、CM−uraプレートおよび5−FOAを有するSCプレート上にパッチして、URA3について、Cas9およびsgRNAによるURA3遺伝子不活化の頻度を見出した。pYRH235およびpYRH236形質転換体のそれぞれ94%および100%が、ウラシル栄養要求体になった。
標的部位URA3.1またはURA3.2での突然変異の、配列決定による確認を実行した。pZufCas9およびpYRH235の20の形質転換体を、配列決定分析のためにランダムに選択して、各コロニーを、プラスミドpZufCas9のURA3遺伝子の突然変異について、在来ゲノムURA3から分析した。プラスミドpZufCas9由来のURA3遺伝子を配列決定するために、URA3用のプライマーRHO705(配列番号170)およびFBA1プロモータ配列用のRHO719(配列番号171)を、当該領域のPCR増幅に用い、プライマーRHO733(配列番号172)またはRHO734(配列番号173)を、PCR増幅産物を鋳型とした配列決定に用いた。在来ゲノム起源のURA3遺伝子を配列決定するために、プライマーRHO705(配列番号170)およびRHO707(配列番号174)をPCR増幅に用い、プライマーRHO733(配列番号172)およびRHO734(配列番号173)を、PCR増幅産物を鋳型とした配列決定に用いた。20コロニーは全て、プラスミド起源のURA3遺伝子およびゲノム起源のURA3遺伝子の双方で突然変異を含有した(図15)。5つの代表的なコロニーのプラスミド起源のURA3遺伝子およびゲノム起源のURA3遺伝子の双方(コロニー1、2、3、5、および6;それぞれ配列番号176、177、178、179、および180、ならびに配列番号181、182、183、184、および185)、および野生型URA3.1(配列番号175)の配列決定結果のフラグメントアラインメントを、図15に示す。これらの結果は、ヤロウイア(Yarrowia)属において、同じ細胞中の遺伝子の多重コピーが、sgRNA/Cas9エンドヌクレアーゼ系によって標的とされ、かつ突然変異したことを示す。
実施例11:ヤロウイア(Yarrowia)属におけるURA3遺伝子の突然変異または欠失。
本実施例は、マーカーリサイクルに用いる、ヤロウイア(Yarrowia)属におけるURA3遺伝子の突然変異または欠失について、同じベクター系上で2つのsgRNAおよびCas9エンドヌクレアーゼを発現するプラスミドの構築および使用を記載する。
pYRH222は、FBA1プロモータ(配列番号12)下のCas9エンドヌクレアーゼ(配列番号10)、および、URA3.2標的配列(配列番号167)を標的とする、リボザイムがフランキングするプレsgRNA(RGR−URA3.2;配列番号166)をコードするFBA1Lプロモータ駆動DNAフラグメントを発現する(図16Aに示す)。pYRH222ベクターは、ハイグロマイシン抗生物質耐性選択マーカー(配列番号186)を含有し、これは、TDH1(GPDとも呼ぶ)プロモータ(配列番号187)、および自己複製配列(ARS18;配列番号208)(プラスミドの染色体外の複製を調整する(PNAS,Fournier,P.et al.,1993,90:4912−4916))の下で発現した。ARS18が存在すると、選択圧がない場合に、細胞はプラスミドを失った。
pYRH282は、pYRH222に由来した。pYRH235由来のRGR−URA3.1(配列番号164)をコードするDNAフラグメントに融合したFBA1Lプロモータ(配列番号168)を、プライマーRHO804(配列番号188)およびRHO805(配列番号189)を用いてPCR増幅した。その後、PCR産物を、BsiWIで消化して、pYRH222中にクローニングした。クローニングした遺伝子の向きおよび配列同一性を、配列決定によって確かめ、構築体をpYRH282と名付けた。
pYRH283は、pYRH222に由来した。RGR−URA3.3(配列番号191)をコードするDNAに融合したTDH1プロモータ(配列番号187)で構成されるBsiWI部位(配列番号190)がフランキングする合成DNAフラグメントを、IDT(Coralville,Iowa)によって合成して、pYRH222中にBsiWI部位にてクローニングした。クローニングした遺伝子の向きおよび配列同一性を、配列決定によって確かめ、構築体をpYRH283と名付けた。
ヤロウイア(Yarrowia)属株ATCC20362の後代を、pYRH222、pYRH282、およびpYRH283で形質転換して、形質転換体を、300mg/Lハイグロマイシンを含有するYPDプレート上で選択した。バックグラウンドの比較的高い増殖は、DNAなしコントロールのプレート上で観察されなかった(表9)。各構築体の30の形質転換体をランダムに選択して、5−FOAを有するSCプレート上にストリークして、ウラシル栄養要求体についてカウンターセレクトした。DNAなしコントロールプレート由来のコロニーで、増殖は観察されなかった。4〜11のパッチが、pYRH222、pYRH282、およびpYRH283形質転換体で増殖を示した。コロニーPCRを、プライマーRHO610(配列番号192)およびRHO611(配列番号193)で実行して、sgRNAターゲティング部位を含有するDNA領域を増幅し、PCR増幅された産物は、アガロースゲル上で異なる移動を示した(図17)。配列決定を、鋳型としてのPCR産物および配列決定プライマーRHO704(配列番号194)で実行した。
pYRH222形質転換体の場合において、11のうち6体を首尾よく配列決定でき、それらの全てが、URA3.2標的部位にて突然変異していた(図16B;配列番号195〜201)。pYRH282の場合において、首尾よく配列決定できたものは全て、標的部位にて突然変異を示し、それらのうち2つは、2つの標的部位間で欠失を示した(図16C;配列番号202〜204)。pYRH283について、首尾よく配列決定できた8つのうち7つは、標的部位にて突然変異を示し、それらのうち2つは、2つの標的部位間で欠失を示し(図16D;配列番号205〜207)、URA3遺伝子のほぼ完全な欠失が生じた。
この実施例は、2つのガイドRNAが、同じプラスミド上で発現して、ヤロウイア(Yarrowia)属におけるsgRNA/Cas9エンドヌクレアーゼ系を用いて、2つの標的部位間で標的欠失をもたらした。同定を、ゲル上でのランによって、または配列決定によって実行した。これらのプラスミド上にARS18(配列番号208)が存在すると、選択圧がない場合に、細胞はプラスミドを失うので、プラスミドは、URA3マーカーリサイクルに繰り返し用いることができた。
実施例12:遺伝子不活化のための、ヤロウイア(Yarrowia)属におけるCsy4(Cas6)の使用
本実施例は、非従来型酵母におけるDNA配列(例えば、限定されないが、CAN1)を標的とすることができるRGEN複合体を形成することができる、5’キャップのないガイドRNAを生じさせるための、Csy4(Cas6とも呼ばれる)の使用を記載する。
ヤロウイア(Yarrowia)属におけるCAN1遺伝子不活化のために、Csy4(Cas6としても知られている)をコードする遺伝子を、Cas9発現プラスミド上に、28bp Csy4認識部位がフランキングするCAN1ターゲティングsgRNAをコードするDNAと一緒に導入した。
pYRH290は、FBA1プロモータ(配列番号12)下のCas9エンドヌクレアーゼ(配列番号10)を、そしてFBA1プロモータ(配列番号210)下の、Csy4発現(配列番号209)用酵母(Yarrowia lipolytica)コドン最適化遺伝子を発現した。pYRH290もまた、CAN1標的配列(配列番号214)を標的とする、28bp Csy4エンドヌクレアーゼ認識配列(配列番号212)がフランキングするプレsgRNA(配列番号213)をコードするDNAフラグメント(TDH1:28bp−gCAN1−28bp;配列番号211)を含有した。Csy4によるプロセシングの後、生じたsgRNA(配列番号222)は、8ヌクレオチド5’フランキング配列(配列番号223)および20ヌクレオチド3’フランキング配列(配列番号224)を含有した。
ヤロウイア(Yarrowia)属株ATCC20362のUra−マイナス誘導体(Y2224)を、pYRH290で形質転換して、形質転換体を、ウラシルを欠くCMプレート上で選択した。86の形質転換体を、カナバニンを含有するCMプレートにレプリカプレーティングして、can1突然変異体について選択した。86の形質転換体のうち40は、カナバニンを含有するCMプレート上で増殖がもたらされた。CAN1標的部位(配列番号214)での突然変異を確かめるために、40のカナバニン耐性コロニーのうち16を配列決定し、14のコロニーはCAN1標的部位に突然変異を有することが確かめられた。図18は、CAN1標的部位(配列番号215)、ならびに、コロニー14、16、18、19、24、および25におけるCAN1標的配列での突然変異(それぞれ配列番号216〜221)を含む野生型CAN1遺伝子のフラグメントのアラインメントを示す。