文献の援用
本明細書中で引用される全ての特許、刊行物、および特許出願は、個々の特許、刊行物、または特許出願が、全ての目的について、その全体が参照によって組み入れることが具体的に、かつ個々に示されているが如く、参照によって本明細書に組み入れる。
発明の詳細な説明
本明細書中で用いられる専門用語は、特定の実施形態のみを説明することを目的としており、限定となることは意図されていないと理解されるべきである。本明細書および特許請求の範囲において用いられている単数形「a」、「an」、および「the」は、文脈上明らかにそうでない場合を除き、複数の指示対象を含む。ゆえに、例えば、「ポリヌクレオチド」への言及は、1つまたはそれ以上のポリヌクレオチドを含み、そして「ベクター」への言及は、1つまたはそれ以上のベクターを含む。
他に定義しない限り、本明細書中で用いられる全ての技術用語および科学用語は、本発明が係わる当業者によって一般的に理解されるのと同じ意味を有する。好ましい材料および方法が本明細書中に記載されているが、本明細書中で記載されるものと類似の、または等価な他の方法および材料も本発明に有用であり得る。
本明細書および実施例の教示を鑑みて、当業者であれば、例えば以下の標準テキストによって教示されるような、免疫学、生化学、化学、分子生物学、微生物学、細胞生物学、ゲノム解析学、および組換えポリヌクレオチドの従来の技術を応用することができる:Cellular and Molecular Immunology、第9版、A.K.Abbas.ら、Elsevier(2017年)、ISBN 978−0323479783;Cancer Immunotherapy Principles and Practice、第1版、L.H.Butterfieldら、Demos Medical(2017年)、ISBN 978−1620700976;Janeway’s Immunobiology、第9版、Kenneth Murphy、Garland Science(2016年)、ISBN 978−0815345053;Clinical Immunology and Serology:A Laboratory Perspective、第4版、C.Dorresteyn Stevensら、F.A.Davis Company(2016年)、ISBN 978−0803644663;Antibodies:A Laboratory Manual、第2版、E.A.Greenfield、Cold Spring Harbor Laboratory Press(2014年)、ISBN 978−1−936113−81−1;Culture of Animal Cells:A Manual of Basic Technique and Specialized Applications、第7版、R.I.Freshney、Wiley−Blackwell(2016年)、ISBN 978−1118873656;Transgenic Animal Technology、第3版:A Laboratory Handbook、C.A.Pinkert、Elsevier(2014年)、ISBN 978−0124104907;The Laboratory Mouse、第2版、H.Hedrich、Academic Press(2012年)、ISBN 978−0123820082;Manipulating the Mouse Embryo:A Laboratory Manual、第4版、R.Behringerら、Cold Spring Harbor Laboratory Press(2013年)、ISBN 978−1936113019;PCR 2:A Practical Approach、M.J.McPhersonら、IRL Press(1995年)、ISBN 978−0199634248;Methods in Molecular Biology(シリーズ)、J.M.Walker、ISSN 1064−3745、Humana Press;RNA:A Laboratory Manual、D.C.Rioら、Cold Spring Harbor Laboratory Press(2010年)、ISBN 978−0879698911;Methods in Enzymology(シリーズ)、Academic Press;Molecular Cloning:A Laboratory Manual(第4版)、M.R.Greenら、Cold Spring Harbor Laboratory Press(2012年)、ISBN 978−1605500560;Bioconjugate Techniques、第3版、G.T.Hermanson、Academic Press(2013年)、ISBN 978−0123822390;Methods in Plant Biochemistry and Molecular Biology、W.V.Dashek、CRC Press(1997年)、ISBN 978−0849394805;Plant Cell Culture Protocols(Methods in Molecular Biology)、V.M.Loyola−Vargasら、Humana Press(2012年)、ISBN 978−1617798177;Plant Transformation Technologies、C.N.Stewartら、Wiley−Blackwell(2011年)、ISBN 978−0813821955;Recombinant Proteins from Plants(Methods in Biotechnology)、C.Cunninghamら、Humana Press(2010年)、ISBN 978−1617370212;Plant Genomics:Methods and Protocols(Methods in Molecular Biology)、W.Busch、Humana Press(2017年)、ISBN 978−1493970018;Plant Biotechnology:Methods in Tissue Culture and Gene Transfer、R.Keshavachandranら、Orient Blackswan(2008年)、ISBN 978−8173716164。
Clustered regularly interspaced short palindromic repeat(CRISPR)および関連するCRISPR関連タンパク質(Casタンパク質)が、CRISPR−Cas系を構成する(例えば、非特許文献1参照)。
本明細書中で用いられる「Casタンパク質」、「CRISPR−Casタンパク質」、「CRISPR−Casサブユニットタンパク質」、および「Casサブユニットタンパク質」は全て、同定されている場合を除き、クラス1 I型CRISPR−Casタンパク質を指す。典型的には、本発明の態様での使用について、Casサブユニットタンパク質は、1つまたはそれ以上のコグネイトポリヌクレオチド(最も典型的にはcrRNA)と相互作用して、I型エフェクター複合体(最も典型的にはRNP複合体)を形成することができる。
I−E型 CRISPR−Cas系においてカスケードをコードする遺伝子は、長い期間をかけて種々の取決めにより命名されてきた。これが、最近の文献とより古い文献とを比較するときに、混乱点となる場合がある。典型的には、本明細書は、Koonin,E.ら(非特許文献5)に示される命名法を用いている。この中で、基準大腸菌(E.coli)K12オペロンの遺伝子順序は:cas3、cas8、cas11、cas7、cas5、cas6、cas1、およびcas2である。分かり易くする目的で、cas8eの修飾詞「e」は、時折、I型系内の異なるサブタイプ間でcas8遺伝子を識別するのに用いられる。野生型大腸菌(E.coli)I−E型CRISPR−Casの化学量論は、Cas51−Cas61−Cas76−Cas81−Cas112−gRNA1である。
しかしながら、相互参照する目的で:cas8は、以前にcse1およびcasAと呼ばれ、そして「大サブユニット」としても知られ;cas11は、以前にcse2およびcasBと呼ばれ、そして「小サブユニット」としても知られ;cas7は、以前にcse4およびcasCと呼ばれ;cas5は、以前にcasDと呼ばれ、時折修飾詞が与えられてcas5eとなり;そしてcas6は、以前にcse3およびcasEと呼ばれ、多くの場合修飾詞が与えられてcas6eとなった。Casサブユニットタンパク質をコードする遺伝子を、表1に一覧にしている。
PAM配列は、典型的に、Cas1サブユニットタンパク質/Cas2サブユニットタンパク質複合体によって認識され、活性PAMセンシング部位が、Cas1サブユニットタンパク質に付随する(例えば、非特許文献18参照)。Cas1タンパク質およびCas2タンパク質は、大多数の知られているCRISPR−Cas系において存在しており、CRISPRカセット中へのスペーサーの挿入に十分である(例えば、Yosef,Iら、Nucleic Acids Res.40巻:5569〜5576頁(2012年)参照)。これらの2つのタンパク質は、適合プロセス用の複合体を形成する。Cas1タンパク質のエンドヌクレアーゼ活性は、スペーサー統合に必要とされるが、Cas2タンパク質は、非酵素的機能を実行するようである(例えば、Nunez,J.ら、Nat Struct Mol Biol.21巻:528〜534頁(2014年);Richter,C.ら、PLoS One.2012年;7巻:e49549頁参照)。Cas1−Cas2タンパク質複合体は、他の系から準自律的であると思われるCRISPR−Cas系の高度に保存された情報処理モジュールを表す(例えば、Makarova,K.ら、Methods Mol.Biol.1311巻:47〜75頁(2015年)参照)。エンドヌクレアーゼCas1タンパク質は、感染性病原体との以前の遭遇の記憶を維持するCRISPR系のユニークな能力を確実にする必須のCasタンパク質である。
用語「I型CRISPR−Casエフェクター複合体」、「I型CRISPR−Cas核タンパク質(NP)複合体」、「カスケード核タンパク質(NP)複合体」、および「I型核タンパク質(NP)複合体」は、本明細書中で互換的に用いられており、典型的に、ガイドポリヌクレオチドと共に複合体を形成するカスケードタンパク質を指す。「カスケード複合体」および「I型複合体」は、典型的に、カスケードNP複合体のタンパク質構成要素を指す場合に用いられる。用語「カスケードRNP複合体」、「I型CRISPR−Cas RNP複合体」、および「I型RNP複合体」は、より包括的なガイドポリヌクレオチド(すなわち、カスケードNP複合体中の)との対比で、crRNAを含むカスケード複合体を指す。野生型I型CRISPR−Casエフェクター複合体の例を、図1Aに示す。図1Aは、Makarova,K.S.ら(非特許文献19;非特許文献6)を変更して作成している。図1Aは、カスケード複合体として会合した6つのCas7タンパク質、Cas5タンパク質、Cas8タンパク質、2つのCse2タンパク質、Cas6タンパク質、およびcrRNAを示す(図1A:Cas7、Cas5、Cas8、Cse2、およびCas6;Cas6周りの破線のボックスは、crRNAヘアピンとの相互作用を示す;cRNAは、黒色の線で示し、ヘアピンを含む)。複合体は、核酸標的配列に結合することができる。wtCas3タンパク質(図1A、破線のボックスによって囲まれているCas3)の、複合体との会合の後、カスケード複合体は、核酸標的配列を切断することができる。表1で注目されるように、一部のCasサブユニットタンパク質の総数は、カスケード複合体で変動し得る。
「Cas3」および「Cas3タンパク質」は、本明細書中で、I型CRISPR−Cas3タンパク質、その改変型、およびそのバリアントを指すのに互換的に用いられる。I型CRISPR−Casエフェクター複合体は、crRNAガイドと相補的な外来DNAに結合して、Cas3(標的分解に必要とされるトランス作用ヌクレアーゼ−ヘリカーゼ)を動員する。Cas3タンパク質は、スーパーファミリー2由来のヘリカーゼに特徴的なモチーフを有しており、そしてDEAD/DEAHボックス領域および保存されたC末端ドメインを含有する。Cas3タンパク質およびそのバリアントが、当該技術において知られている(例えば、非特許文献13;非特許文献12;Beloglazova,N.ら、EMBO J.30巻:4616〜4627頁(2011年);Mulepati,S.ら、J.Biol.Chem.286巻:31896〜31903頁(2011年)参照)。本明細書中で用いられる用語「mCas3タンパク質」は、その対応するwtCas3タンパク質に対して1つまたはそれ以上の突然変異を含むCas3タンパク質を指す。mCas3タンパク質として、以下に限定されないが、mCas3タンパク質(例えば、実施例23A、実施例23B、および実施例23C)、dblmCas3タンパク質(例えば、実施例26A、実施例26B、および実施例26C)、およびdCas3*(いかなるヌクレアーゼ活性および/またはヘリカーゼ活性も有していない突然変異Cas3タンパク質)が挙げられる。
本明細書中で用いられる用語「ヌクレアーゼ」は、ホスホジエステル結合(二本鎖(ds)核酸(例えば、dsDNA、ゲノムDNA(gDNA)、dsRNA)において見出される2つのヌクレオチド、一本鎖(ss)核酸(例えば、ssDNA、RNA)、またはハイブリッドdsRNA/DNAを連結するもの等)を切断することができる酵素を指す。「エンドヌクレアーゼ」は、典型的に、その標的分子内のss−(ニック)またはds−切断に影響を与えることができる。DNAエンドヌクレアーゼの一例として、FokI酵素がある。「FokIエンドヌクレアーゼ」および「FokI」は、本明細書中で互換的に用いられており、FokI酵素、FokI相同体、FokI酵素の酵素活性ドメイン、およびFokI酵素のバリアントを指す。FokI二量体化が、典型的に、DNA切断に必要とされる。FokIのダイマーは、ホモダイマーを形成するように会合する2つのモノマーサブユニット、またはヘテロダイマーを形成するように会合する2つの互いに異なるモノマーサブユニットを含み得る(例えば、Bitinaite,J.ら、Proc.Natl.Acad.Sci.USA 95巻:10570〜10575頁(1998年);Ramalingam,S.ら、J.Mol.Biol.405巻:630〜641頁(2011年)参照)。FokIバリアントの一例として、Guoら(Guo,J.ら、J.Mol.Biol.400巻:96〜107頁(2010年))によって記載されるSharkeyバリアントがある。更なるDNAおよびRNAヌクレアーゼが、当該技術において知られている。
本明細書中で用いられる「CRISPR RNA」、「crRNA」、および「ガイドRNA」は、1つまたはそれ以上のRNAを指し、これとCasサブユニットタンパク質が相互作用して、I型エフェクター複合体を形成することができ、これは、(核酸標的配列を含まないポリヌクレオチドに対して)ポリヌクレオチド内の核酸標的配列に選択的に結合するように複合体をガイドする。本明細書中で用いられる「ガイド」および「ガイドポリヌクレオチド」は、リボヌクレオチド塩基(例えば、RNA)およびリボース糖を含むI型エフェクター複合体のポリヌクレオチド構成要素、ならびに異種の構成要素、ならびにそれらの組合せ(以下に限定されないが、デオキシリボヌクレオチド塩基、ヌクレオチド類似体、修飾ヌクレオチド、様々な窒素塩基、基本的に相異するヌクレオチド塩基、化学的に異種の分子、塩基(例えば、RNA塩基、DNA塩基、および/または修飾塩基)の混合物等、ならびにそれらの組合せ、加えて、合成骨格、天然に存在する骨格、天然に存在しない骨格、基本的に相異する骨格残基、化学的に異種の残基または結合、修飾骨格、混合物(例えば、骨格のリボースおよびデオキシリボース構成要素)等、ならびにそれらの組合せが挙げられる)を指す。ガイドポリヌクレオチドの一部の例を、本明細書中に記載する。crRNAスペーサーを介して核酸標的配列と会合するI型CRISPR−Cas crRNAの例を、図1Bに示す。図1Bは、Hochstrasser,M.L.ら、Mol.Cell 63巻:840〜851頁(2016年)を変更して作成している。図1Bにおいて、PAM(図1B、104)は、核酸標的配列に付随し、二本鎖核酸の5’および3’鎖が示されている(図1B、垂直な線は、水素結合を表す)。ガイドポリヌクレオチド(図1B、106)は、典型的に、5’ハンドル領域(図1B、101)、シード領域を含むスペーサー領域(図1B、103)、および2つの水素結合リピート領域を含む3’ヘアピン(図1B、102)を含む;水平の線は、水素結合を表す。いくつかのI型カスケード相同体と関連するPAM配列を、本明細書中で考察する。PAM配列は、プロトスペーサー配列(図1B、105)に隣接する。図1Bは、核酸標的配列に結合したカスケード複合体スペーサーを示す(図1B、垂直な線は、水素結合を表す)。また、図1Bは、プロトスペーサー領域(図1B、プロトスペーサー)を示す。スペーサーは、約6〜約56ヌクレオチドのcrRNAの領域を含むことができ、スペーサーは、ポリヌクレオチド内の核酸標的配列と相補的である。スペーサー長は、I−E型CRISPR−Cas系において、カスケード活性を微調整するように変えることができる。カスケード複合体には、crRNAスペーサーに全6ヌクレオチドが加わったエクストラCas7サブユニット、およびスペーサーに全12ヌクレオチドが加わったエクストラCse2サブユニットが組み込まれることがある(例えば、Luo,M.L.ら、Nucleic Acids Res.44巻(15号):7385〜7394頁(2016年)参照)。スペーサーは、典型的に、約32〜約36ヌクレオチドの領域を含む。
用語「スペーサー」、「スペーサー配列」、および「核酸標的結合配列」は、本明細書中で互換的に用いられる。
「標的」、「標的配列」、「核酸標的配列」、および「オンターゲット配列」は、本明細書中で、カスケード核タンパク質複合体(例えば、カスケードRNP複合体)のガイドの核酸標的結合配列(例えば、crRNAのスペーサー)と完全に、または部分的に相補的である核酸配列を指すのに互換的に用いられる。典型的には、核酸標的結合配列は、カスケード核タンパク質複合体の結合が導かれることとなる核酸標的配列と100%相補的となるように選択される;しかしながら、核酸標的配列への結合を減弱させるために、より低いパーセント相補性を用いることができる。標的結合配列が標的配列と100%相補的である場合、「オフターゲット」配列結合は、核酸標的結合配列(スペーサー)との相補性が100%未満である核酸配列へのカスケード核タンパク質複合体の結合を指す。二本鎖DNA配列は、典型的に、1本の鎖上に核酸標的配列を含む(図1B、ガイドRNAに結合した水素部分(section hydrogen))。「標的領域」は、核酸標的配列を含む。
本明細書中で用いられる「ステム要素」または「ステム構造」は、二本鎖領域を形成することが知られている、または予測される核酸の2本の鎖(「ステム要素」)を指す。「ステム−ループ要素」または「ステム−ループ構造」は、1本の鎖の3’末端配列が、典型的に一本鎖のヌクレオチドのヌクレオチド配列(「ステム−ループ要素ヌクレオチド配列」)によって、第2の鎖の5’末端配列に共有結合されているステム構造を指す。一部の実施形態において、ループ要素は、約3〜約20ヌクレオチド長、好ましくは約4〜約10ヌクレオチド長のループ要素ヌクレオチド配列を含む。好ましい実施形態において、ループ要素ヌクレオチド配列は、ループ要素ヌクレオチド配列内にステム要素を生じさせるように、水素結合形成を介して相互作用しない、不対核酸塩基の一本鎖ヌクレオチド配列である。また、用語「ヘアピン要素」は、本明細書中で、ステム−ループ構造を指すのに用いられる。そのような構造は、当該技術において周知である。塩基対形成は、正確であり得る;しかしながら、当該技術において知られているように、ステム要素は、正確な塩基対形成を必要としない。ゆえに、ステム要素は、1つまたはそれ以上の塩基ミスマッチまたは非対形成塩基を含んでもよい。ガイドポリヌクレオチド内のステム−ループ構造の例を、図1Bに示す。
「リンカー要素ヌクレオチド配列」、「リンカーヌクレオチド配列」、および「リンカーポリヌクレオチド」は、本明細書中で互換的に用いられており、第1の核酸配列に共有結合された1つまたはそれ以上のヌクレオチドの一本鎖核酸配列または二本鎖核酸配列(例えば、5’−リンカーヌクレオチド配列−第1の核酸配列−3’)のいずれかを指す。一部の実施形態において、リンカーヌクレオチド配列が、2つの別個の核酸配列を連結して、単一のポリヌクレオチドを形成する(例えば、5’−第1の核酸配列−リンカーヌクレオチド配列−第2の核酸配列−3’)。リンカーヌクレオチド配列の他の例として、以下に限定されないが、5’−第1の核酸配列−リンカーヌクレオチド配列−3’および5’−リンカーヌクレオチド配列−第1の核酸配列−リンカーヌクレオチド配列−3’が挙げられる。一部の実施形態において、リンカー要素ヌクレオチド配列は、リンカー要素ヌクレオチド配列内の二次構造(例えば、ステム−ループ構造)を生じさせるように、水素結合形成を介して互いに相互作用しない、不対核酸塩基の一本鎖ヌクレオチド配列であってよい。一部の実施形態において、2つのリンカー要素ヌクレオチド配列は、2つのリンカー要素ヌクレオチド配列間の水素結合を介して互いに相互作用することができる。一部の実施形態において、リンカーポリヌクレオチドが、「リンカーポリペプチド」をコードする。そのようなリンカーポリヌクレオチドは、典型的に、第1のポリペプチドをコードする第1のポリヌクレオチドの3’末端を、第2のポリペプチドをコードする第2のポリヌクレオチドの5’末端に連結して、N−第1のポリペプチド−リンカーポリペプチド−第2のポリペプチド−Cを含む融合タンパク質をコードする単一のポリヌクレオチドを形成する。本発明の一部の実施形態において、2つを超えるポリペプチド配列を、リンカーポリペプチドによってタンデムに連結することができる(例えば、N−第1のポリペプチド−第1のリンカーポリペプチド−第2のポリペプチド−第2のリンカーポリペプチド−第3のポリペプチド−C)。また、「リンカーポリペプチド」、「リンカーポリペプチド配列」、「アミノ酸リンカー配列」、および「リンカー配列」は、本明細書中で互換的に用いられる。
本明細書中で用いられる「ヌクレオチド配列を連結する」は、第1の核酸配列および第2の核酸配列を共有結合的に連結する一本鎖核酸配列リンカー配列を指す。
本明細書中で用いられる用語「スペーサー間」、「スペーサー間領域」、および「スペーサー間距離」は、互換可能であり、典型的にはPAM−inの配置にある、第1の核酸標的配列(例えば、第1のDNA標的配列)のPAMと、第2の核酸標的配列(例えば、第2のDNA標的配列)のPAMとの間の距離を指し、第1のI型CRISPR−Casエフェクター複合体が、第1の核酸標的配列に結合することができる第1のスペーサーを含み、第2のI型CRISPR−Casエフェクター複合体が、第2の核酸標的配列に結合することができる第2のスペーサーを含む。図2A、図2B、および図2Cは、リンカーポリヌクレオチド(図2A、「リンカー1」および「リンカー2」)を介して各カスケード複合体と連結される融合タンパク質(図2A、扇形として表す「FP1」および「FP2」;例えば、FP1およびFPは、FokIであってよい)を含む2つのI型CRISPR−Casエフェクター複合体(図2A:「カスケード1」、実線の輪郭のボックス、「crRNA1」を含む;および「カスケード2」、破線のボックス、「crRNA2」を含む)の実例を示しており、CRISPR−Casエフェクター複合体は、二本鎖DNA(図2A、「dsDNA」)、対形成された、水平の破線として表す)上の隣接する核酸標的配列に結合される。各核酸標的配列に付随するPAM配列を示す(図2A、「PAM1」、空白のボックス、および「PAM2」、空白のボックス))。図2Aは、PAM−in(PAM−in/PAM−in)配置の、2つの標的部位間のインタースペーサーを示す(図2Aの最上位の水平の双方向矢印線として示す)。図2Bは、PAM−in/PAM−out配置の、2つの標的部位間のインタースペーサーを示す(図2Bの最上位の水平の双方向矢印線として示す)。図2Cは、PAM−out(PAM−out/PAM−out)配置の、2つの標的部位間のインタースペーサーを示す(図2Cの最上位の水平の双方向矢印線として示す)。また、図2A、図2B、および図2Cは、dsDNAの2本の鎖の分離を示す。カスケード複合体は、PAMに隣接するdsDNA標的配列を認識する。PAM配列は、Cse1によって認識される。crRNAと、相補的標的DNA鎖間の塩基対形成は、非相補的標的DNA鎖の位置がずれたR−ループをもたらす(例えば、Beloglazova,N.ら、Nucleic Acids Res.43巻:530〜543頁(2015年)参照)。
本明細書中で用いられる用語「コグネイト」は、相互作用する生体分子、例えば細胞表面受容体(例えば、ケモカイン受容体)、およびそのリガンド(例えば、腫瘍細胞上で、または腫瘍微環境内で発現されるケモカイン);部位特異的ポリペプチドおよびそのガイド;ガイド結合配列と相補的な核酸標的配列に部位特異的に結合することができる部位特異的ポリペプチド/ガイド複合体(すなわち、核タンパク質複合体);等を指す。また、用語「コグネイト」は、1つまたはそれ以上のガイドポリヌクレオチドの1つに存在するスペーサーと相補的な核酸標的配列に部位特異的に結合することができる核タンパク質複合体を形成することができる一群のCasサブユニットタンパク質(例えば、Cse2、Cas5、Cas6、Cas7、およびCas8)および1つまたはそれ以上のガイドポリヌクレオチド(例えば、I型CRISPR−Cas RNA)を指す。
用語「野生型」、「天然に存在する」、および「無改変」は、本明細書中で、自然界に存在する典型的な(または最も一般的な)形態、外観、表現型、または系統を意味するのに用いられる;例えば、細胞、生物、ポリヌクレオチド、タンパク質、高分子複合体、遺伝子、RNA、DNA、またはゲノムの典型的な形態(これらは、天然の源に存在し、かつ天然の源から単離することができる)。野生型の形態、外観、表現型、または系統は、意図的な改変、変化、突然変異、および/または著しく異なる構造的変化の前の、元の親として機能する。ゆえに、突然変異形態、バリアント形態、操作された形態、組換え形態、および改変形態は、野生型形態ではない。
用語「操作された」、「遺伝子操作された」、「遺伝的に改変された」、「組換え型の」、「改変された」、「天然に存在しない」、および「非天然の」は、生物または細胞のゲノムの意図的なヒト操作または機械操作を示す。当該用語は、本明細書中で定義されるゲノム編集を含むゲノム改変の方法、遺伝子の発現または不活化を変更する技術、酵素工学、指向性進化、知識ベースの設計、ランダム突然変異誘発法、遺伝子シャッフリング、およびコドン最適化等を包含する。遺伝子工学法は、当該技術において知られている。
「共有結合」、「共有結合的に取り付けられた」、「共有結合した」、「共有結合的に連結された」、「共有結合的に連結した」、および「分子結合」は、本明細書中で互換的に用いられており、電子対を原子間で共有することを伴う化学結合を指す。共有結合の例として、以下に限定されないが、ホスホジエステル結合、ホスホロチオアート結合、ジスルフィド結合、およびペプチド結合(−CO−NH−)が挙げられる。
「非共有結合」、「非共有結合的に取り付けられた」、「非共有結合した」、「非共有結合的に連結された」、「非共有結合的相互作用」、および「非共有結合的に連結した」は、本明細書中で互換的に用いられており、一対の電子を共有することを伴わない、比較的弱いあらゆる化学結合を指す。複数の非共有結合は、多くの場合、巨大分子の高次構造を安定化させて、分子間の特異的相互作用を媒介する。非共有結合の例として、以下に限定されないが、水素結合、イオン相互作用(例えば、Na+Cl-)、ファンデルワールス相互作用、および疎水結合が挙げられる。
本明細書中で用いられる「水素結合」、「水素−塩基対形成」、および「水素結合した」は、互換可能であり、以下に限定されないが;「ワトソン−クリック水素結合塩基対」(W−C水素結合塩基対またはW−C水素結合);「フーグスティーン水素結合塩基対」(フーグスティーン水素結合);および「ウォブル水素結合塩基対」(ウォブル水素結合)が挙げられる規範的な水素結合および非規範的な水素結合を指す。W−C水素結合(逆W−C水素結合を含む)は、プリン−ピリミジン塩基対形成、例えば、アデニン:チミン、グアニン:シトシン、およびウラシル:アデニンを指す。フーグスティーン水素結合(逆フーグスティーン水素結合を含む)は、核酸における塩基対形成の変形を指し、2つの核酸塩基(各鎖上に1つ)が、主溝内で水素結合によって一緒に保持される。この非W−C水素結合により、第3の鎖が二重鎖に巻きついて、三本鎖螺旋を形成することができる。ウォブル水素結合(逆ウォブル水素結合を含む)は、RNA分子における2つのヌクレオチド間の対形成を指し、ワトソン−クリック塩基対規則に従わない。4つの主要なウォブル塩基対がある:グアニン:ウラシル、イノシン(ヒポキサンチン):ウラシル、イノシン−アデニン、およびイノシン−シトシン。規範的な水素結合および非規範的な水素結合の規則が、当業者に知られている(例えば、The RNA World、第三版(Cold Spring Harbor Monograph Series)、R.F.Gesteland、Cold Spring Harbor Laboratory Press(2005年)、ISBN 978−0879697396;The RNA World、第二版(Cold Spring Harbor Monograph Series)、R.F.Gestelandら、Cold Spring Harbor Laboratory Press(1999年)、ISBN 978−0879695613;The RNA World(Cold Spring Harbor Monograph Series)、R.F.Gestelandら、Cold Spring Harbor Laboratory Press(1993年)、ISBN 978−0879694562(例えば、付表1:Structures of Base Pairs Involving at Least Two Hydrogen Bonds、I.Tinoco参照);Principles of Nucleic Acid Structure、W.Saenger、Springer International Publishing AG(1988年)、ISBN 978−0−387−90761−1;Principles of Nucleic Acid Structure、第一版、S.Neidle、Academic Press(2007年)、ISBN 978−01236950791参照)。
「連結する」、「連結された」、および「連結」は、本明細書中で互換的に用いられており、2つの巨大分子(例えば、ポリヌクレオチド、タンパク質等)間の共有結合または非共有結合を指す。
本明細書中で用いられる用語「核酸配列」、「ヌクレオチド配列」、および「オリゴヌクレオチド」は、互換可能であり、ヌクレオチドのポリマー形態を指す。本明細書中で用いられる用語「ポリヌクレオチド」は、1つの5’末端および1つの3’末端を有し、かつ1つまたはそれ以上の核酸配列を含み得るヌクレオチドのポリマー形態を指す。「環状ポリヌクレオチド」は、その5’末端とその3’末端との間に共有結合を有することで、環状のポリヌクレオチドを形成するポリヌクレオチドを指す。ヌクレオチドは、デオキシリボヌクレオチド(DNA)、リボヌクレオチド(RNA)、それらの類似体、またはそれらの組合せであってもよく(例えば、ガイドポリヌクレオチドの文脈において先で述べた通りである)、そしてあらゆる長さであってもよい。ポリヌクレオチドは、あらゆる機能を実行してもよく、そして種々の二次構造および三次構造を有してもよい。当該用語は、天然のヌクレオチドの知られている類似体、ならびに塩基、糖、および/またはリン酸部分において修飾されているヌクレオチドを包含する。特定のヌクレオチドの類似体は、塩基対形成特異性が同じである(例えば、TとのAの塩基対の類似性)。ポリヌクレオチドは、1つの修飾ヌクレオチドまたは複数の修飾ヌクレオチドを含んでもよい。修飾ヌクレオチドの例として、以下に限定されないが、フッ化ヌクレオチド、メチル化ヌクレオチド、およびヌクレオチド類似体が挙げられる。ヌクレオチド構造を、ポリマーがアセンブルされる前に、またはその後に、修飾してもよい。重合後、ポリヌクレオチドを追加的に、例えば、標識構成要素または標的結合構成要素とのコンジュゲーションを介して、修飾してもよい。ヌクレオチド配列には、非ヌクレオチド構成要素を組み込んでもよい。また、包含されるのは、合成の、天然に存在する、かつ/または天然に存在しない修飾骨格残基または結合を含む核酸であり、基準ポリヌクレオチド(例えば、DNAまたはRNA)と同程度の結合特性を有する。そのような類似体の例として、以下に限定されないが、ホスホロチオアート、ホスホロアミダート、メチルホスホナート、キラル−メチルホスホナート、2−O−メチルリボヌクレオチド、ペプチド−核酸(PNA)、Locked Nucleic Acid(LNA(商標))(Exiqon,Inc.、Woburn、MA)ヌクレオシド、グリコール核酸、架橋核酸、およびモルフォリノ構造が挙げられる。
ペプチド−核酸(PNA)は、ポリヌクレオチドリン酸−糖骨格が、フレキシブルな偽ペプチドポリマーによって置換され、かつ核酸塩基がポリマーに連結されている、核酸の合成相同体である。PNAは、RNAおよびDNAの相補的な配列に対して高い親和性および特異性でハイブリダイズする能力を有する。
ホスホロチオアート核酸において、ホスホロチオアート(PS)結合は、ポリヌクレオチドリン酸骨格において、硫黄原子を非架橋酸素で置換している。この修飾により、ヌクレオチド間結合は、ヌクレアーゼ分解に対して耐性を示すようになる。一部の実施形態において、ホスホロチオアート結合が、ポリヌクレオチド配列の5’末端または3’末端の最後の3〜5ヌクレオチド間に導入されて、エキソヌクレアーゼ分解を阻害している。オリゴヌクレオチドの全体を通してのホスホロチオアート結合の配置は、同様に、エンドヌクレアーゼによる分解を低減する一助となる。
トレオース核酸(TNA)は、人工的な遺伝的ポリマーである。TNAの骨格構造は、ホスホジエステル結合によって連結される繰返しトレオース糖を含む。TNAポリマーは、ヌクレアーゼ分解に対して耐性を示す。TNAは、塩基対水素結合によって二重鎖構造に自己アセンブルすることができる。
「リバースホスホラミダイト」を用いることによって、連鎖反転(linkage inversion)をポリヌクレオチド中に導入することができる(例えば、www.ucalgary.ca/dnalab/synthesis/−modifications/linkages参照)。2つの5’−OH末端を有するが、3’−OH末端を欠くオリゴヌクレオチドを生じさせることによって、ポリヌクレオチドの末端での3’−3’結合が、エキソヌクレアーゼ分解に対してポリヌクレオチドを安定化させる。典型的には、そのようなポリヌクレオチドは、5’−OH位置上にホスホラミダイト基を、そして3’−OH位置上にジメトキシトリチル(DMT)保護基を有する。通常、DMT保護基は5’−OH上にあり、そしてホスホラミダイトは3’−OH上にある。
ポリヌクレオチド配列は、特に明記しない限り、本明細書中で、従来の5’から3’の向きに示される。
本明細書中で用いられる「配列同一性」は、通常、種々の重み付けパラメータを有するアルゴリズムを用いて、第1のポリヌクレオチドまたはポリペプチドを第2のポリヌクレオチドまたはポリペプチドと比較した、ヌクレオチド塩基またはアミノ酸の同一性パーセントを指す。2つのポリヌクレオチドまたは2つのポリペプチド間の配列同一性は、ワールドワイドウェブを介して、以下に限定されないが、GENBANK(www.ncbi.nlm.nih.gov/genbank/)およびEMBL−EBI(www.ebi.ac.uk)が挙げられるサイトにて利用可能な種々の方法およびコンピュータプログラム(例えば、BLAST、CS−BLAST、PSI−BLAST、FASTA、HMMER、L−ALIGN等)による配列アラインメントを用いて求めることができる。2つのポリヌクレオチドまたは2つのポリペプチド配列間の配列同一性が、通常、種々の方法またはコンピュータプログラムの標準的なデフォルトパラメータを用いて算出される。2つのポリヌクレオチドまたは2つのポリペプチド間の、本明細書中で用いられる高い程度の配列同一性は、典型的には約90%の同一性〜100%の同一性、例えば、約90%またはそれ以上の同一性、好ましくは約95%またはそれ以上の同一性、より好ましくは約98%またはそれ以上の同一性である。2つのポリヌクレオチドまたは2つのポリペプチド間の、本明細書中で用いられる中程度の配列同一性は、典型的には約80%の同一性〜約85%の同一性、例えば、約80%またはそれ以上の同一性、好ましくは約85%の同一性である。2つのポリヌクレオチドまたは2つのポリペプチド間の、本明細書中で用いられる低い程度の配列同一性は、典型的には、約50%の同一性〜75%の同一性、例えば、約50%の同一性、好ましくは約60%の同一性、より好ましくは約75%の同一性である。例えば、アミノ酸置換を含むCasタンパク質(例えば、I−E型Cse2、Cas5、Cas6、Cas7、および/またはCas8)は、基準Casタンパク質(例えば、それぞれ野生型I−E型Cse2、Cas5、Cas6、Cas7、および/またはCas8)に対して、その長さにわたって、低い程度の配列同一性、中程度の配列同一性、または高い程度の配列同一性を有してよい。別の例として、ガイドポリヌクレオチドは、基準Casタンパク質と複合体形成する基準野生型ガイドポリヌクレオチド(例えば、I−E型Cse2、Cas5、Cas6、Cas7、および/またはCas8と複合体を形成するガイドポリヌクレオチド)と比較して、その長さにわたって、低い程度の配列同一性、中程度の配列同一性、または高い程度の配列同一性を有してよい。
本明細書中で用いられる「ハイブリダイゼーション」、「ハイブリダイズする」、または「ハイブリダイジング」は、2つの相補的な一本鎖DNAまたはRNA分子を組み合わせて、水素塩基対形成を介して単一の二本鎖分子(DNA/DNA、DNA/RNA、RNA/RNA)を形成するプロセスである。ハイブリダイゼーションストリンジェンシは、典型的に、ハイブリダイゼーション温度、およびハイブリダイゼーションバッファの塩濃度によって決定される;例えば、高温および低塩は、高いストリンジェンシハイブリダイゼーション条件を実現する。様々なハイブリダイゼーション条件についての塩濃度範囲および温度範囲の例は、以下の通りである:高ストリンジェンシは、おおよそ0.01M〜おおよそ0.05Mの塩、ハイブリダイゼーション温度はTmよりも5℃〜10℃低い;中程度のストリンジェンシは、おおよそ0.16M〜おおよそ0.33Mの塩、ハイブリダイゼーション温度はTmよりも20℃〜29℃低い;そして低ストリンジェンシは、おおよそ0.33M〜おおよそ0.82Mの塩、ハイブリダイゼーション温度はTmよりも40℃〜48℃低い。二重鎖核酸配列のTmは、当該技術において周知の標準的な方法によって算出される(例えば、Maniatis,T.ら、Molecular Cloning:A Laboratory Manual、Cold Spring Harbor Laboratory Press:New York(1982年);Casey,J.ら、Nucleic Acids Res.4巻:1539〜1552頁(1977年);Bodkin,D.K.ら、J.Virological Methods 10巻:45〜52頁(1985年);Wallace,R.B.ら、Nucleic Acids Res.9巻:879〜894頁(1981年)参照)。Tmを推定するアルゴリズム予測ツールもまた広く利用可能である。ハイブリダイゼーションについての高ストリンジェンシ条件は、典型的に、標的配列と相補的なポリヌクレオチドが、標的配列と主にハイブリダイズして、非対象配列に実質的にハイブリダイズしない条件を指す。典型的には、ハイブリダイゼーション条件は、中程度のストリンジェンシ、好ましくは高ストリンジェンシの条件である。
本明細書中で用いられる「相補性」は、別の核酸配列と(例えば、規範的なワトソン−クリック塩基対形成を介して)水素結合を形成する核酸配列の能力を指す。相補性パーセントは、第2の核酸配列と水素結合を形成することができる核酸配列内の残基のパーセンテージを示す。2つの核酸配列が100%の相補性を有するならば、2つの配列は完全に相補的である、すなわち、第1のポリヌクレオチドの全ての連続残基が、第2のポリヌクレオチド内の同じ数の連続残基と水素結合する。
本明細書中で用いられる「結合」は、巨大分子間(例えば、タンパク質とポリヌクレオチドとの間、ポリヌクレオチドとポリヌクレオチドとの間、タンパク質とタンパク質との間等)での非共有結合性の相互作用を指す。また、そのような非共有結合性の相互作用は、「会合」または「相互作用」(例えば、第1の巨大分子が第2の巨大分子と相互作用するならば、第1の巨大分子は第2の巨大分子と非共有結合的に結合する)と呼ぶ。結合相互作用のいくつかの部分は、配列特異的であってもよい(用語「配列特異的結合」、「配列特異的に結合する」、「部位特異的結合」、および「部位特異的に結合する」は、本明細書中で互換的に用いられる)。本明細書中で用いられる配列特異的結合は、典型的に、I型CRISPR−Casサブユニットタンパク質(例えば、Cse2、Cas5、Cas6、Cas7、およびCas8)と複合体を形成して、タンパク質を、核酸標的結合配列(例えば、DNA標的結合配列)なしで、第2の核酸配列(例えば、第2のDNA配列)と比較して、核酸標的配列(例えば、DNA標的配列)を含む核酸配列(例えば、DNA配列)に選択的に結合させることができる1つまたはそれ以上のガイドポリヌクレオチドを指す。結合相互作用の全ての構成要素が配列特異的であることを必要とするわけではない(例えば、タンパク質の、DNA骨格内のリン酸残基との接触)。結合相互作用は、解離定数(Kd)によって特徴付けることができる。「結合親和性」は、結合相互作用の強度を指す。結合親和性が高いほど、低いKdと相関する。
本明細書中で用いられるエフェクター複合体は、そのような複合体がポリヌクレオチド内の核酸標的配列中のポリヌクレオチドに結合し、またはこれを切断するならば、ポリヌクレオチドを「標的化」したと言われる。
本明細書中で用いられる「二本鎖切断」(DSB)は、DNAの二本鎖セグメントの双方の鎖が分離されることを指す。ある例として、そのような切断が起これば、一方の鎖が「粘着末端」を有すると言うことができ、そこでは、ヌクレオチドが曝されて、他方の鎖上のヌクレオチドに水素結合されていない。他の例では、「平滑末端」が生じ得、そこでは、双方の鎖が、互いに完全に塩基対形成されたままである。
「ドナーポリヌクレオチド」、「ドナーオリゴヌクレオチド」、および「ドナー鋳型」は、本明細書中で互換的に用いられており、二本鎖ポリヌクレオチド(例えば、DNA)、一本鎖ポリヌクレオチド(例えば、DNAまたはRNA)、またはそれらの組合せであり得る。ドナーポリヌクレオチドは、挿入配列(例えば、DNA内のDSB)に隣接する相同アームを含んでもよい。各側部上の相同アームは、長さが変動してもよい(例えば、1〜50塩基、50〜100塩基、100〜200塩基、200〜300塩基、300〜500塩基、500〜1000塩基)。相同アームは、長さが対称性であっても非対称性であってもよい。ドナーポリヌクレオチドの設計および構築のためのパラメータが、当該技術において周知である(例えば、Ran,F.ら、Nature Protocols 8巻:2281〜2308頁(2013年);Smithies,O.ら、Nature 317巻:230〜234頁(1985年);Thomas,K.ら、Cell 44巻:419〜428頁(1986年);Wu,S.ら、Nature Protocols 3巻:1056〜1076頁(2008年);Singer,B.ら、Cell 31巻:25〜33頁(1982年);Shen,P.ら、Genetics 112巻:441〜457頁(1986年);Watt,V.ら、Proc.Natl.Acad.Sci.USA 82巻:4768〜4772頁(1985年);Sugawara,N.ら、J.Mol.Bio.12巻:563〜575頁(1992年);Rubnitz,J.ら、J.Mol.Bio.4巻:2253〜2258頁(1984年);Ayares,D.ら、Proc.Natl.Acad.Sci.USA 83巻:5199〜5203頁(1986年);Liskay,R.ら、Genetics 115巻:161〜167頁(1987年)参照)。一部の実施形態において、ドナーポリヌクレオチドは、キメラ抗原受容体(例えば、CAR)を含む。
用語「キメラ抗原受容体」および「CAR」は、本明細書中で互換的に用いられており、典型的に、少なくとも2つの構成要素:細胞外抗原認識ドメイン(標的結合ドメインまたは細胞外リガンド結合ドメインとも呼ばれる)および細胞内活性化ドメイン(例えば、1つまたはそれ以上の細胞内シグナリングドメイン、および典型的に1つまたはそれ以上の共刺激シグナリングドメインを含む)を含む、ラボで作出されるポリペプチド分子を指す。CARはさらに、ヒンジドメインおよび膜貫通ドメインを含んでもよい。典型的なCARポリペプチドの構造は、以下の通りである:N末端−細胞外−[抗原認識ドメイン−ヒンジドメイン]−膜貫通−[膜貫通ドメイン]−細胞内−[細胞内活性化ドメイン]−C末端;またはN末端−細胞内−[細胞内活性化ドメイン]−膜貫通−[膜貫通ドメイン]−細胞外−[抗原認識ドメイン−ヒンジドメイン]−C末端。
細胞外抗原認識ドメインの例が、抗原に結合するのに用いられる部分を含み、以下に限定されないが、一本鎖免疫グロブリン可変フラグメント(scFv)、抗原結合フラグメント(Fab;典型的には、抗原に結合し、かつ重鎖および軽鎖の各々の1つの定常ドメインおよび1つの可変ドメインで構成される、抗体の領域)、ナノボディ、ラクダ科もしくはサメ由来の一本鎖抗体、操作されたタンパク質結合足場(例えば、DARPinsおよびCentyrins)、またはそれらのコグネイト受容体に結合する天然のリガンドが挙げられる。
ヒンジドメインの例として、以下に限定されないが、可変長(例えば、1つまたはそれ以上のアミノ酸)のポリペプチドヒンジ、CD8アルファのヒンジ領域、CD28のヒンジ領域、IgG4のヒンジ領域、およびそれらの組合せが挙げられる。
膜貫通ドメインの例として、以下に限定されないが、膜貫通タンパク質に由来する膜貫通領域、例えば、CD8アルファ、CD28、DAP10、DAP12、NKG2D、およびそれらの組合せが挙げられる。
細胞内活性化ドメインの例として、以下に限定されないが、CD28、4−1BB、CD3ゼータ、OX40、2B4、DAP10、DAP12の細胞内シグナリングドメイン、切頂および突然変異シグナリングドメイン(例えば、CD3ゼータの3つのITAMドメイン内の突然変異および切頂)、または他の細胞内シグナリングドメイン、およびそれらの組合せが挙げられる。
細胞外リガンド結合ドメインがコグネイトリガンドに結合する場合、CARの細胞内シグナリングドメインは、リンパ球を活性化する(CAR−T細胞の説明について、例えば、Brudno,J.ら、Nature Rev.Clin.Oncol.15巻:31〜46頁(2018年);Maude,S.ら、N.Engl.J.Med.371巻:1507〜1517頁(2014年);Sadelain,M.ら、Cancer Disc.3巻:388〜398頁(2013年);米国特許第7,446,190号明細書;米国特許第8,399,645号明細書)参照)(CAR−NK細胞の説明について、例えば、Rezvani,K.ら、Mol.Ther.、25巻:1769〜1781頁(2017年);Siegler,E.ら、Cell Stem Cell.23巻:160〜161頁(2018年);Li,Y.ら、Cell Stem Cell.23巻:181〜192頁(2018年);Lin,C.ら、Biochim.Biophys.Acta.Rev.Cancer.1869巻:200〜215頁(2018年);Hu,Y.ら、Acta.Pharmacol.Sin.39巻:167〜176頁(2018年);Fang,F.ら、Semin.Immunol.31巻:37〜54頁(2017年);Glienke,W.ら、Front Pharmacol.6巻:21頁(2015年)参照)。
表2は、例示的な細胞標的、および細胞標的に結合するscFv/結合タンパク質を示す。そのようなscFv/結合タンパク質またはその部分は、CAR構築体中に組み込むことができる。
本明細書中で用いられる「相同組換え修復」(HDR)は、細胞内で起こるDNA修復、例えばgDNA内のDSBの修復を指す。HDRは、ヌクレオチド配列相同性を必要としており、ドナーまたは鋳型ポリヌクレオチドを用いて、(例えば、DNA標的配列内に)DSBが存在した配列を修復する。ドナーポリヌクレオチドは、通常、ドナーポリヌクレオチドが修復に適した鋳型として機能することができるような、DSBに隣接する配列との配列相同性を必要とする。HDRは、例えば、ドナーポリヌクレオチドからDNA標的配列への遺伝情報の移行をもたらす。HDRは、ドナーポリヌクレオチド配列がDNA標的配列と異なるならば、そしてドナーポリヌクレオチドの一部または全てを、DNA標的配列中に組み込むならば、DNA標的配列の改変(例えば、挿入、欠失、または突然変異)をもたらし得る。一部の実施形態において、ドナーポリヌクレオチド全体、一部のドナーポリヌクレオチド、またはドナーポリヌクレオチドのコピーを、DNA標的配列の部位に組み込む。例えば、ドナーポリヌクレオチドを、DNA標的配列内の切断の修復に用いることができ、修復は、DNA内の切断部位での、または当該切断の近くでの、ドナーポリヌクレオチドからの遺伝情報の移行をもたらす。したがって、新しい遺伝情報を、DNA標的配列にて挿入またはコピーすることができる。
「ゲノム領域」は、核酸標的配列部位のいずれかの側部に存在する、または代わりに、一部の核酸標的配列部位も含む、宿主細胞のゲノム内の染色体のセグメントである。ドナーポリヌクレオチドの相同アームは、対応するゲノム領域との相同組換えを経験するのに十分な相同性を有する。一部の実施形態において、ドナーポリヌクレオチドの相同アームは、核酸標的配列部位に直ぐ隣接するゲノム領域に対して著しい配列相同性を共有する;相同アームを、核酸標的配列部位からより遠くのゲノム領域に対して十分な相同性を有するように設計することができることが認識されている。
本明細書中で用いられる「非相同末端結合」(NHEJ)は、ドナーポリヌクレオチドの必要条件なしでの、切断の一方の末端の、切断の他方の末端への直接のライゲーションによる、DNA内のDSBの修復を指す。NHEJは、修復鋳型を用いずにDNAを修復するための、細胞に利用可能なDNA修復経路である。NHEJは、ドナーポリヌクレオチドの非存在下で、多くの場合、DSBの部位にてランダムに挿入または欠失されることとなるヌクレオチドをもたらす。
「ミクロ相同媒介末端結合」(MMEJ)は、gDNA内のDSBを修復する経路である。MMEJは、DSBに隣接する欠失、および結合前の切断部位に対して内部でのミクロ相同配列のアラインメントを包含する。MMEJは、遺伝的に定義され、かつ、例えば、CtIP、ポリ(ADPリボース)ポリメラーゼ1(PARP1)、DNAポリメラーゼシータ(Polθ)、DNAリガーゼ1(Lig 1)、またはDNAリガーゼ3(Lig 3)の活性を必要とする。更なる遺伝的構成要素が、当該技術において知られている(例えば、Sfeir,A.ら、Trends in Biochemical Sciences 40巻:701〜714頁(2015年)参照)。
本明細書中で用いられる「DNA修復」は、細胞の機構が、細胞内に含有されるDNA分子への損傷を修復するあらゆるプロセスを包含する。修復される損傷は、一本鎖切断またはDSBを含み得る。DSBを修復する少なくとも3つの機構:HDR、NHEJ、およびMMEJが存在する。また、「DNA修復」は、本明細書中で、標的遺伝子座が、例えば、ヌクレオチドを挿入し、欠失させ、または置換する(全て、ゲノム編集の形態を表す)ことによって改変される、ヒトまたは機械操作に由来するDNA修復を指すのに用いられる。
本明細書中で用いられる「組換え」は、2つのポリヌクレオチド間での遺伝情報の交換プロセスを指す。
本明細書中で用いられる用語「調節配列」、「調節要素」、および「制御要素」は、互換可能であり、発現されることとなるポリヌクレオチド標的の上流(5’非コード配列)、内部、または下流(3’非翻訳配列)にあるポリヌクレオチド配列を指す。調節配列は、例えば、転写のタイミング;転写の量もしくはレベル;RNAプロセシングもしくは安定性;および/または関連する構造ヌクレオチド配列の翻訳に影響する。調節配列として、アクチベーター結合配列、エンハンサー、イントロン、ポリアデニル化認識配列、プロモーター、転写開始部位、リプレッサー結合配列、ステム−ループ構造、翻訳開始配列、内部リボソーム侵入部位(IRES)、翻訳リーダー配列、転写終結配列(例えば、ポリアデニル化シグナルおよびポリU配列)、翻訳終結配列、およびプライマー結合部位等を挙げることができる。
調節要素として、多くの宿主細胞型において、ヌクレオチド配列の構成的な、誘導性の、かつ抑制可能な発現を導くもの、および特定の宿主細胞のみにおいてヌクレオチド配列の発現を導くもの(例えば、組織特異的調節配列)が挙げられる。一部の実施形態において、ベクターは、1つもしくはそれ以上のpol IIIプロモーター、1つもしくはそれ以上のpol IIプロモーター、1つもしくはそれ以上のpol Iプロモーター、またはそれらの組合せを含む。pol IIIプロモーターの例として、以下に限定されないが、U6およびH1プロモーターが挙げられる。pol IIプロモーターの例として、以下に限定されないが、レトロウイルスのラウス肉腫ウイルス(RSV)LTRプロモーター(場合により、RSVエンハンサーを有する)、サイトメガロウイルス(CMV)プロモーター(場合により、CMVエンハンサーを有する;例えば、Boshart,M.ら、Cell 41巻:521〜530頁(1985年)参照)、SV40プロモーター、ジヒドロ葉酸レダクターゼプロモーター、β−アクチンプロモーター、ホスホグリセロールキナーゼ(PGK)プロモーター、およびEF1αプロモーター、ならびに操作された人工プロモーター(例えば、MNDプロモーターおよびCAGプロモーター)が挙げられる。発現ベクターの設計は、形質転換されることとなる宿主細胞の選択、所望される発現レベル等の要因によって決まり得ることが、当業者によって理解されるであろう。ベクターが、宿主細胞中に導入されることによって、本明細書中に記載されるような、核酸配列によってコードされる融合タンパク質またはペプチドが挙げられる、RNA転写産物、タンパク質、またはペプチドを生成することができる。
本明細書中で用いられる「遺伝子」は、エクソンおよび関連する調節配列を含むポリヌクレオチド配列を指す。遺伝子はさらに、イントロンおよび/または非翻訳領域(UTR)を含んでもよい。
本明細書中で用いられる用語「作動可能に連結された」は、互いと機能的に関係するように配置されたポリヌクレオチド配列またはアミノ酸配列を指す。例えば、調節配列(例えば、プロモーターまたはエンハンサー)が、ポリヌクレオチドの転写を調節する、または当該転写の調節に寄与するならば、調節配列は、遺伝子産物をコードするポリヌクレオチドに「作動可能に連結され」ている。作動可能に連結された調節要素は、典型的に、コード配列と連続している。しかしながら、最大数キロベースまたはそれ以上プロモーターから離れていても、エンハンサーは機能することができる。加えて、マルチシストロン性構築体は、2A自己切断ペプチド、IRES要素等を含むことによって、1つのプロモーターのみを用いるマルチコード配列を含むことができる。したがって、一部の調節要素は、ポリヌクレオチド配列に作動可能に連結されているが、ポリヌクレオチド配列と連続していなくてもよい。同様に、翻訳調節要素が、ポリヌクレオチドからのタンパク質発現の調節に寄与する。
本明細書中で用いられる「発現」は、例えば、メッセンジャーRNA(mRNA)または他のRNA転写産物(例えば、非コード、例えば、構造または足場RNA)をもたらす、DNA鋳型からのポリヌクレオチドの転写を指す。当該用語はさらに、転写されたmRNAが、ペプチド、ポリペプチド、またはタンパク質に翻訳されるプロセスを指す。転写産物およびコードされたポリペプチドは、まとめて「遺伝子産物」と呼ぶことができる。ポリヌクレオチドがgDNAに由来するならば、発現は、真核細胞において、mRNAをスプライシングすることを含み得る。
「コード配列」、または選択されたポリペプチドを「コードする」配列は、適切な調節配列の制御下に配置された場合、インビトロまたはインビボで転写され(DNAの場合)、かつポリペプチドに翻訳される(mRNAの場合)核酸分子である。コード配列の境界は、5’末端の開始コドン、および3’末端の翻訳終止コドンによって決定される。
本明細書中で用いられる「人工転写アクチベーター(ATA)」または「人工転写因子(ATF)」が意味するのは、それが会合した遺伝子にRNAポリメラーゼIIホロ酵素を動員し、それによって注目する遺伝子の異所性発現を引き起こすことができる複合体である。そのようなアクチベーターは、少なくとも2つの構成要素を含む:(1)コグネイトヌクレオチド配列を直接認識して、当該配列に結合することができる、触媒的に不活性なポリヌクレオチド結合ドメイン、または結合のためのそのような配列にガイドされるポリヌクレオチド結合ドメイン(例えば、核酸結合ドメイン、および本明細書中に記載されるガイドを含む核タンパク質複合体);ならびに(2)転写機構を構成する種々のタンパク質と相互作用して転写を上方制御する活性化ドメイン(「エフェクタードメイン」とも呼ばれる)。
「触媒的に不活性なポリヌクレオチド結合ドメイン」が意味するのは、結合ドメインによって結合される核酸標的部位に結合するがこれを切断しない分子である。そのようなドメインの代表的な例が、本明細書中で詳述される。
本明細書中で用いられる用語「調節する」は、機能の数、程度、または量の変化を指す。例えば、本明細書中で開示されるI型CRISPR核タンパク質複合体は、プロモーターまたは転写開始部位もしくはレギュレータ部位にて、またはそれらの近くで、核酸標的配列に結合することによって、プロモーター配列の活性を調節し得る。結合後に起こる作用に応じて、I型CRISPR核タンパク質複合体は、プロモーター配列に作動可能に連結された遺伝子の転写を誘導、増強、抑制、または阻害することができる。ゆえに、遺伝子発現の「調節」は、遺伝子活性化および遺伝子抑制の双方を含む。
調節は、標的遺伝子の発現によって直接的または間接的に影響されるあらゆる特徴を判定することによってアッセイすることができる。そのような特徴の例として、RNAもしくはタンパク質レベル、タンパク質活性、生成物レベル、遺伝子の発現、またはリポータ遺伝子の活性レベルの変化が挙げられる。したがって、用語、遺伝子の「発現の調節」、「発現の阻害」、および「発現の活性化」は、遺伝子の転写を変化させ、活性化させ、または阻害する、I型CRISPR核タンパク質複合体の能力を指し得る。
機能(例えば、酵素機能)を、上方調節する(例えば、機能を増大させる、強化する、増幅させる、または増強する)、または下方調節する(例えば、機能を低下させる、弱める、減弱させる、または小さくする)ことができる。一実施形態において、mCas3タンパク質の、一本鎖DNA(ssDNA)への結合、またはmCas3タンパク質によるATP結合/加水分解は、対応するwtCas3タンパク質と比較して、上方調節することも下方調節することもできる。
本明細書中で用いられる「ベクター」および「プラスミド」は、遺伝的材料を細胞中に導入するためのポリヌクレオチドビヒクルを指す。ベクターは、直鎖状であっても環状であってもよい。ベクターは、適切な宿主細胞内でベクターの複製をもたらすことができる複製配列(例えば、複製起点)を含有し得る。適切な宿主の形質転換の直ぐ後に、ベクターは複製して、宿主ゲノムから独立して機能し、または宿主ゲノム中に統合することができる。ベクター設計は、とりわけ、意図される使用、およびベクター用の宿主細胞によって決まり、そして特定の使用のための本発明のベクターの設計、および宿主細胞は、当該技術のレベルの範囲内である。ベクターの4つの主要なタイプは、プラスミド、ウイルスベクター、コスミド、および人工染色体である。典型的には、ベクターは、複製起点、マルチクローニング部位、および/または選択マーカーを含む。発現ベクターは、典型的に、発現カセットを含む。「組換えウイルス」が意味するのは、例えば、異種核酸構築体の、ウイルスゲノムまたはその部分中への追加または挿入によって、遺伝的に改変されたウイルスである。
本明細書中で用いられる「発現カセット」は、組換え方法を用いて、または合成手段によって生成され、そして選択されたポリヌクレオチドに作動可能に連結されて、選択されたポリヌクレオチドの発現を宿主細胞内で促進する調節配列を含むポリヌクレオチド構築体を指す。例えば、調節配列は、選択されたポリヌクレオチドの転写を宿主細胞内で、または選択されたポリヌクレオチドの転写および翻訳を宿主細胞内で促進することができる。発現カセットは、例えば、宿主細胞のゲノム内に統合することもできるし、ベクター内に存在して発現ベクターを形成することもできる。
本明細書中で用いられる「標的化ベクター」は、gDNAに相同である、調整されたDNAアーム(標的遺伝子または核酸標的配列の要素(例えば、DSB)に隣接する)を典型的に含む組換えDNA構築体である。標的化ベクターは、ドナーポリヌクレオチドを含む。標的遺伝子の要素を、欠失および/または挿入が挙げられるいくつかの方法で改変することができる。欠陥のある標的遺伝子を、機能的標的遺伝子によって置換することができ、または択一的に、機能遺伝子をノックアウトすることができる。場合により、標的化ベクターのドナーポリヌクレオチドは、標的遺伝子中に導入される選択マーカーを含む選択カセットを含む。標的遺伝子に隣接する、または標的遺伝子内の領域(核酸標的配列を含む)の標的化を用いて、遺伝子発現の調節に影響を与えることができる。
本明細書中で用いられる用語「〜」は、所定の範囲において末端の値を含める(例えば、1〜50ヌクレオチド長は、1ヌクレオチドおよび50ヌクレオチドを含む;5アミノ酸〜50アミノ酸長は、5アミノ酸および50アミノ酸を含む)。
本明細書中で用いられる用語「アミノ酸」(aa)は、アミノ酸類似体、修飾アミノ酸、ペプチド模倣体、グリシン、およびDまたはL光学異性体が挙げられる、天然の、そして合成の(非天然の)アミノ酸を指す。
本明細書中で用いられる用語「ペプチド」、「ポリペプチド」、「タンパク質」、および「サブユニットタンパク質」は、互換可能であり、アミノ酸のポリマーを指す。ポリペプチドは、あらゆる長さのものであってよい。ポリペプチドは、分枝状であっても直鎖状であってもよく、非アミノ酸によって中断されていてもよく、そして修飾アミノ酸を含んでもよい。また、当該用語は、例えば、アセチル化、ジスルフィド結合形成、グリコシル化、脂質化、リン酸化、ペグ化、ビオチン化、架橋結合、および/または(例えば、標識構成要素またはリガンドとの)コンジュゲーションを介して修飾されたアミノ酸ポリマーを指す。ポリペプチド配列は、特に明記しない限り、本明細書中で、従来のN末端からC末端の向きに示される。
ポリペプチドおよびポリヌクレオチドは、分子生物学の分野においてルーチンの技術を用いて製造することができる(例えば、先で一覧にした標準テキスト参照)。さらに、本質的にあらゆるポリペプチドまたはポリヌクレオチドが、市販の源から入手可能である。
本明細書中で用いられる用語「融合タンパク質」および「キメラタンパク質」は、天然では単一のタンパク質内に一緒に存在しない2つまたはそれ以上のタンパク質、タンパク質ドメイン、タンパク質フラグメント、または環状配置ポリペプチドを結合することによって作出された単一のタンパク質を指す。一部の実施形態において、リンカーポリヌクレオチドは、第1のタンパク質、タンパク質ドメイン、タンパク質フラグメント、または環状配置ポリペプチドを、第2のタンパク質、タンパク質ドメイン、タンパク質フラグメント、または環状配置ポリペプチドに連結するのに用いることができる。例えば、融合タンパク質は、I型CRISPR−Casタンパク質(例えば、Cas8、Cas3)、および別のタンパク質由来の機能ドメイン(例えば、FokI;例えば、米国特許第9,885,026号明細書参照)を含んでもよい。そのようなドメインを融合タンパク質内に含むような改変は、操作されたI型CRISPR−Casタンパク質に、付加的な活性を付与することができる。そのような活性として、ヌクレアーゼ活性、メチルトランスフェラーゼ活性、デメチラーゼ活性、DNA修復活性、DNA損傷活性、脱アミノ活性、ジスムターゼ活性、アルキル化活性、脱プリン化活性、酸化活性、ピリミジンダイマー形成活性、インテグラーゼ活性、トランスポザーゼ活性、リコンビナーゼ活性、ポリメラーゼ活性、リガーゼ活性、ヘリカーゼ活性、フォトリアーゼ活性、グリコシラーゼ活性、アセチルトランスフェラーゼ活性、デアセチラーゼ活性、キナーゼ活性、ホスファターゼ活性、ユビキチンリガーゼ活性、脱ユビキチン化活性、アデニル化活性、脱アデニル化活性、SUMO化活性、脱SUMO化活性、リボシル化活性、脱リボース化活性、および/またはミリストイル化活性もしくは脱ミリストイル化活性(核酸標的配列と会合したポリペプチド(例えば、ヒストン)を修飾する)を挙げることができる。
一部の実施形態において、融合タンパク質は、エピトープタグ(例えば、ヒスチジンタグ、HAタグ、FLAG(登録商標)(Sigma Aldrich、St.Louis、MO)タグ、Mycタグ、核局在化シグナル(NLS)タグ、SunTag)、リポータタンパク質配列(例えば、グルタチオン−S−トランスフェラーゼ、ベータ−ガラクトシダーゼ、ルシフェラーゼ、緑色蛍光タンパク質、シアン蛍光タンパク質、黄色蛍光タンパク質)、および/または核酸配列結合ドメイン(例えば、DNA結合ドメインまたはRNA結合ドメイン)を含んでもよい。
また、融合タンパク質は、アクチベータードメイン(例えば、ヒートショック転写因子、NFKBアクチベーター)またはリプレッサードメイン(例えば、KRABドメイン)を含んでもよい。Lupo,A.ら、Current Genomics 14巻:268〜278頁(2013年)によって記載されるように、KRABドメインは、強力な転写抑制モジュールであり、ほとんどのC2H2ジンクフィンガータンパク質のアミノ末端配列内に位置する(例えば、Margolin,J.ら、Proc.Natl.Acad.Sci.USA 91巻:4509〜4513頁(1994年);Witzgall,R.ら、Proc.Natl.Acad.Sci.USA 91巻:4514〜4518頁(1994年)参照)。KRABドメインは、典型的に、タンパク質−タンパク質相互作用を介して、コリプレッサータンパク質および/または転写因子に結合して、KRABジンクフィンガータンパク質(KRAB−ZFP)が結合する遺伝子の転写抑制を引き起こす(例えば、Friedman,J.R.ら、Genes & Development 10巻:2067〜2678頁(1996年)参照)。一部の実施形態において、リンカー核酸配列は、2つまたはそれ以上のタンパク質、タンパク質ドメイン、またはタンパク質フラグメントを結合するのに用いられる。
本明細書中で用いられる「CASCADEa」(カスケード活性化)は、CRISPR方法または系であり、当該方法または系は、カスケードRNP複合体の標的核酸配列の遺伝子座に付随する遺伝子の発現を活性化する。一部の実施形態において、カスケード複合体の1つまたはそれ以上のタンパク質が、エフェクタードメイン(例えば、VP16またはVP64)に融合され、そして融合体およびガイドポリヌクレオチドを含むカスケードRNP複合体が、内因性転写因子の動員に用いられる。一部の実施形態において、ガイドポリヌクレオチドは、5’または3’が、転写因子を動員もするMS2結合RNA等のヌクレオチドエフェクタードメインに融合し得る。
本明細書中で用いられる「CASCADEi」(カスケード阻害)は、CRISPR方法または系であり、当該CRISPR方法または系は、カスケードRNP複合体の標的核酸配列の遺伝子座に付随する遺伝子の発現を下方制御する(すなわち、カスケードRNP複合体は、遺伝子の発現を下方制御するのに用いられる)。内因性抑制因子の動員について、カスケード複合体内の1つまたはそれ以上のタンパク質が、典型的に、エフェクタードメイン(例えば、KRAB)に融合される。一部の実施形態において、ガイドポリヌクレオチドは、5’または3’が、内因性転写抑制エフェクタータンパク質を動員もするヌクレオチドエフェクタードメインに融合し得る。
本明細書中で用いられる「部分」は、一部の分子を指す。部分は、官能基であり得、または複数の官能基を有する一部の分子(例えば、共通の構造的態様を共有する)を説明し得る。用語「部分」および「官能基」は、典型的に、本明細書中で互換的に用いられる;しかしながら、「官能基」は、より詳細には、いくつかの共通の化学的挙動を含む一部の分子を指し得る。「部分」は、多くの場合、構造の説明として用いられる。一部の実施形態において、5’末端、3’末端、または5’末端および3’末端(例えば、第1のステム要素内の非天然の5’末端および/または非天然の3’末端)が、1つまたはそれ以上の部分を含み得る。
本明細書中で用いられる「養子細胞」は、細胞療法処置に使用するために、例えば、癌を処置し、かつ/または移植片対宿主病(GvHD)および細胞療法の他の不所望の副作用(例えば、以下に限定されないが、サイトカインストーム、投与された遺伝的に改変された材料の発癌性形質転換、神経学的障害等)を予防するために遺伝的に改変することができる細胞を指す。養子細胞として、以下に限定されないが、幹細胞、人工多能性幹細胞(iPSC)、臍帯血幹細胞、リンパ球、マクロファージ、赤血球、線維芽細胞、内皮細胞、上皮細胞、および膵臓前駆体細胞が挙げられる。
本明細書中で用いられる「細胞療法」は、遺伝的に改変された細胞を利用する、疾患または障害の処置を指す。遺伝的改変は、本明細書中に記載される方法、例えば、ウイルスベクター、ヌクレオフェクション、遺伝子ガン送達、ソノポレーション、細胞スクイージング、リポフェクション、または他の化学物質、細胞透過ペプチド等の使用を含む方法を用いて導入することができる。
本明細書中で用いられる「養子細胞療法(ACT)」は、特定の患者に戻される、当該患者由来の(自己由来細胞療法)、または当該患者を処置するための、第三者のドナー由来の(同種細胞療法)、遺伝的に改変された養子細胞を用いる療法を指す。ACTとして、以下に限定されないが、骨髄移植、幹細胞移植、T細胞療法、CAR−T細胞療法、およびナチュラルキラー(NK)細胞療法が挙げられる。
本明細書中で用いられる「リンパ球」は、脊椎動物の免疫系の一部である白血球を指す。また、用語「リンパ球」によって包含されるのは、リンパ系細胞を生じさせる造血幹細胞または人工多能性幹細胞(iPSC)である。リンパ球として、細胞媒介性の、細胞障害性適応免疫用のT細胞、例えばCD4+および/またはCD8+細胞障害性T細胞;アルファ/ベータT細胞およびガンマ/デルタT細胞;制御性T細胞、例えばTreg細胞;細胞媒介性の、細胞障害性先天性免疫において機能するNK細胞;体液の、抗体駆動適応免疫用のB細胞;NK/T細胞;サイトカイン誘導キラー細胞(CIK細胞);ならびに抗原提示細胞(APC)、例えば樹状細胞が挙げられる。リンパ球は、哺乳動物の細胞、例えばヒト(Homo sapiens)細胞であってもよい。また、用語「リンパ球」は、TまたはNK細胞表面上にキメラ抗原受容体(CAR)を生成するように改変された、遺伝的に改変されたT細胞およびNK細胞(CAR−T細胞およびCAR−NK細胞)を包含する。当該CAR−T細胞は、特定の可溶性の抗原を、または標的細胞表面、例えば腫瘍細胞表面上の、もしくは腫瘍微環境内の細胞上の抗原を認識する。
また、本明細書中で用いられる用語「リンパ球」によって包含されるのは、主要組織適合性複合体(MHC)によって提示される標的細胞のタンパク質または(糖)脂質抗原を認識することができる、1つまたはそれ以上の特定の、天然に存在する、または操作されたT細胞受容体を発現するように遺伝子操作された、T細胞受容体操作T細胞(TCR)である。これらの抗原の小さなピース、例えばペプチドまたは脂肪酸が、標的細胞表面に移されて、MHCの一部として、T細胞受容体に提示される。抗原がロードされたMHCに結合したT細胞受容体が、リンパ球を活性化する。
リンパ球が、その細胞表面上の抗原特異的受容体を介してトリガされると、リンパ球の活性化が起こる。これにより、細胞は増殖して、特殊なエフェクターリンパ球に分化する。そのような「活性化された」リンパ球は、典型的に、リンパ球の表面上の一セットの受容体によって特徴付けられる。活性化されたT細胞についての表面マーカーとして、CD3、CD4、CD8、PD1、およびIL2R等が挙げられる。活性化された細胞障害性リンパ球は、標的細胞の表面上のコグネイト受容体に結合した後に、標的細胞を死滅させることができる。
また、腫瘍浸潤リンパ球(TIL)も、本明細書中で用いられる用語「リンパ球」によって包含される。TILは、腫瘍内外の環境(「腫瘍微環境」)に侵入した免疫細胞である。TILは、典型的に、腫瘍細胞および腫瘍微環境から単離されて、腫瘍抗原に対する高い反応性について、インビトロで選択される。TILは、インビボで存在する寛容化の影響を克服する条件下でインビトロで増殖されてから、処置のために対象中に導入される。
T細胞は、典型的に、いくつかのサブタイプ、例えば「未感作T細胞」(Tn)、「幹細胞記憶T細胞」(Tscm)、「セントラルメモリT細胞」(Tcm)、「エフェクターメモリT細胞」(Tem)、「エフェクターT細胞」(Teff)、および「制御性T細胞」(Treg)が存在する。各々のT細胞サブセットが、一セットの細胞表面マーカーによって特徴付けられる。
本明細書中で用いられる用語「親和性タグ」は、典型的に、ある巨大分子の、別の巨大分子に対する結合親和性を増大させて、例えば、操作されたI型CRISPR−Cas核タンパク質複合体の形成を促進する1つまたはそれ以上の部分を指す。一部の実施形態において、親和性タグを用いて、あるCasサブユニットタンパク質の、別のCasサブユニットタンパク質に対する(例えば、第1のCas7タンパク質の、第2のCas7タンパク質に対する)結合親和性を増大させることができる。一部の実施形態において、親和性タグを用いて、1つまたはそれ以上のCasサブユニットタンパク質の、コグネイトガイドポリヌクレオチドに対する結合親和性を増大させることができる。本発明の一部の実施形態は、1つまたはそれ以上の親和性タグを、Casサブユニットタンパク質配列のN末端に、Casサブユニットタンパク質配列のC末端に、Casサブユニットタンパク質配列のN末端とC末端との間に位置決めされた位置に、またはそれらの組合せに、導入する。本発明の一部の実施形態において、1つまたはそれ以上のガイドポリヌクレオチドが、1つまたはそれ以上のCasサブユニットタンパク質とのガイドポリヌクレオチドの結合親和性を増大させる親和性タグを含む。多種多様な親和性タグが、2014年10月23日公開の米国特許出願公開第2014−0315985号明細書に開示されている。リガンドおよびリガンド結合部分が、対形成された親和性タグである。
本明細書中で用いられる「架橋結合」は、あるポリマー鎖(例えば、ポリヌクレオチドまたはポリペプチド)を別のポリマー鎖に連結する結合である。そのような結合は、共有結合であってもイオン結合であってもよい。一部の実施形態において、ポリヌクレオチドを架橋結合することによって、あるポリヌクレオチドを別のポリヌクレオチドに結合してもよい。他の実施形態において、ポリヌクレオチドをポリペプチドに架橋結合してもよい。更なる実施形態において、ポリペプチドをポリペプチドに架橋結合してもよい。
本明細書中で用いられる用語「架橋結合部分」は、典型的に、2つの巨大分子間の架橋結合を実現するのに適した部分を指す。架橋結合部分は、親和性タグの別の例である。
本明細書中で用いられる「宿主細胞」は、通常、生体細胞を指す。細胞は、生物の基本的、構造的、機能的、かつ/または生物学的単位である。細胞は、1つまたはそれ以上の細胞を有するあらゆる生物に由来してよい。宿主細胞の例として、以下に限定されないが、原核細胞、真核細胞、細菌細胞、古細菌細胞、単細胞真核生物の細胞、真核生物の細胞、原生動物細胞、植物由来細胞、藻類細胞(例えば、ボツリオコッカス・ブラウニ(Botryococcus braunii)、コナミドリムシ(Chlamydomonas reinhardtii)、ナンノクロロプシス・ガディタナ(Nannochloropsis gaditana)、クロレラ(Chlorella pyrenoidosa)、ヤツマタモク(Sargassum patens C.agardh)等)、海草(例えば、ケルプ)、真菌細胞(例えば、酵母細胞またはキノコ由来細胞)、動物細胞、無脊椎動物(例えば、ミバエ、刺胞動物、棘皮動物、線虫等)由来細胞、哺乳動物(例えば、ブタ、乳牛、ヤギ、ヒツジ、齧歯類、ラット、マウス、非ヒト霊長類、ヒト等)が挙げられる脊椎動物由来細胞が挙げられる。さらに、宿主細胞は、幹細胞または前駆体細胞、および免疫細胞、例えば本明細書中に記載されるあらゆる免疫細胞であってよい。宿主細胞は、ヒト細胞であってよい。一部の実施形態において、ヒト細胞は、ヒトの体外にある。一部の実施形態において、生存生物の体(例えば、ヒトの体)の細胞が、エクスビボ(すなわち、生体の外側で)操作される。イクスビボは、多くの場合、臓器、細胞、または組織が、処置または手順用に生体(例えば、ヒトの体)から採られてから生体に戻される医療手順を指す。
本明細書中で用いられる「幹細胞」は、自己再生能力、すなわち、多数の細胞分裂サイクルを経験する一方、未分化状態を維持する能力を有する細胞を指す。幹細胞は、全能性、多能性、複能性、少能性、または単能性であり得る。幹細胞は、胚、胎児、羊膜、成人、または人工多能性幹細胞であり得る。
本明細書中で用いられる「人工多能性幹細胞」は、非多能性細胞、典型的には体細胞に人工的に由来する一種の多能性幹細胞を指す。一部の実施形態において、体細胞は、ヒト体細胞である。体細胞の例として、以下に限定されないが、真皮線維芽細胞、骨髄由来間葉細胞、心筋細胞、ケラチン生成細胞、肝細胞、胃細胞、神経幹細胞、肺細胞、腎細胞、脾細胞、および膵細胞が挙げられる。体細胞の更なる例として、免疫系の細胞が挙げられ、以下に限定されないが、B細胞、樹状細胞、顆粒球、先天性リンパ系細胞、巨核球、単球/マクロファージ、骨髄由来サプレッサ細胞、ナチュラルキラー(NK)細胞、T細胞、胸腺細胞、および造血幹細胞が挙げられる。
本明細書中で用いられる「造血幹細胞」は、造血細胞、例えばリンパ球に分化する能力を有する未分化細胞を指す。
本明細書中で用いられる「植物」は、植物全体、植物器官、植物組織、胚原質、種子、植物細胞、およびそれらの後代を指す。植物細胞として、以下に限定されないが、種子、懸濁培養体、胚、分裂組織領域、カルス組織、葉、根、シュート、配偶体、胞子体、花粉、および小胞子由来の細胞が挙げられる。植物部分として、分化または未分化組織が挙げられ、以下に限定されないが、根、幹、シュート、葉、花粉、種子、腫瘍組織、ならびに細胞および培養体(例えば、単細胞、プロトプラスト、胚、およびカルス組織)の種々の形態が挙げられる。植物組織は、植物体内にあっても、植物の器官、組織、または細胞培養体内にあってもよい。「植物器官」は、植物の形態学的かつ機能的に互いに異なる部分を構成する植物組織または一群の組織を指す。
用語「対象」、「個体」、または「患者」は、本明細書中で互換的に用いられており、脊索動物門のあらゆるメンバーを指し、以下に限定されないが、ヒトおよび他の霊長類が挙げられ、非ヒト霊長類、例えば、アカゲザル、チンパンジー、および他のサル、ならびに類人猿の種;農園動物、例えば、ウシ、ヒツジ、ブタ、ヤギ、およびウマ;家畜哺乳動物、例えば、イヌおよびネコ;ウサギ、マウス、ラット、およびモルモットが挙げられるラボ動物;家畜、野生、および狩猟鳥類、例えば、ニワトリ、シチメンチョウ、ならびに他の家禽鳥類、カモ、およびガチョウが挙げられる鳥類等が挙げられる。当該用語は、特定の年齢または性別を意味しない。ゆえに、当該用語は、成人、若者、および生まれたての個体、ならびに男性および女性を含む。一部の実施形態において、宿主細胞は、対象(例えば、リンパ球、幹細胞、前駆体細胞、または組織特異的細胞)に由来する。一部の実施形態において、対象は非ヒト対象である。一部の実施形態において、対象はヒト(H.sapiens)対象である。
用語「有効な量」または「治療的に有効な量」の組成物または剤、例えば本明細書中で定められる遺伝子操作された養子細胞は、所望される応答をもたらすのに、例えば、同種養子細胞療法と関連する1つまたはそれ以上の有害な副作用を予防または除外するのに十分な量の組成物または剤を指す。そのような応答は、問題となっている特定の疾患によって決まることとなる。例えば、養子細胞療法を用いて癌が処置されることとなる患者において、所望される応答として、以下に限定されないが、GvHD、宿主対移植片拒絶、サイトカイン放出症候群(CRS)、サイトカインストームの影響の処置または予防、および投与された遺伝的改変細胞の発癌性形質転換の低減が挙げられる。必要とされる正確な量は、対象の種、年齢、および全身状態、処置されることとなる症状の重症度、ならびに用いられる特定の改変リンパ球、投与モード等に応じて、対象毎に変動することとなる。個々のあらゆる症例において適した「有効な」量は、ルーチンの実験を用いて、当業者によって決定することができる。
特定の疾患、例えば癌の症状またはGvHDの「処置」、またはこれらを「処置する」は:(1)疾患を予防する、例えば、疾患の体質であり得るが、疾患の病徴をまだ経験も提示もしていない対象において、疾患の進行を予防し、もしくは疾患をより小さな強度で起こさせること;(2)疾患を阻害する、例えば、進行の速度を低減し、進行を抑制し、もしくは疾患の状態を取り消すこと;かつ/または(3)疾患の病徴を和らげる、例えば、対象によって経験される病徴の数を少なくすることを含む。
本明細書中で用いられる「遺伝子編集」または「ゲノム編集」が意味するのは、遺伝的改変、例えば、細胞ゲノム内の特定の部位でのヌクレオチド配列の、またはさらに単一の塩基の挿入、欠失、または置換をもたらす一種の遺伝子工学である。当該用語は、以下に限定されないが、本明細書中で定義される異種遺伝子発現、遺伝子またはプロモーターの挿入または欠失、核酸突然変異、および破壊的遺伝的改変を含む。
「エピトープ」が意味するのは、特定のB細胞およびT細胞が応答する分子上の部位である。エピトープは、エピトープにユニークな空間的高次構造内に3つまたはそれ以上のアミノ酸を含み得る。通常、エピトープは、少なくとも5個のそのようなアミノ酸からなり、より一般的には少なくとも8〜10個のそのようなアミノ酸からなる。アミノ酸の空間的高次構造を判定する方法が、当該技術において知られており、例えば、X線結晶解析、電子顕微鏡検査、および二次元核磁気共鳴が挙げられる。さらに、所定のタンパク質内のエピトープの同定は、当該技術において周知の技術を用いて、例えば疎水性研究および部位特異的血清学を用いて、容易に達成される。
「ミモトープ」は、エピトープの構造を模倣する巨大分子、例えばペプチドである。この特性のため、ミモトープは、エピトープによって誘発されるものと類似の抗体応答を引き起こす。所定のエピトープ抗原に対する抗体が、そのエピトープを模倣するミモトープを認識することとなる。ミモトープは一般的に、バイオパニングを介したファージディスプレイライブラリから得られる。
「抗体」は、ポリペプチド内に存在する注目するエピトープを「認識する」、すなわち、これに特異的に結合する分子、例えばリガンド結合ドメインを意図する。「特異的に結合する」が意味するのは、抗体がエピトープと「ロックアンドキー」型の相互作用で相互作用して、抗原と抗体との間で複合体を形成することである。本明細書中で用いられる用語「抗体」は、モノクローナル調製品、および以下から得られる抗体を含む:ハイブリッド(キメラ)抗体分子;F(ab’)2およびF(ab)フラグメント;Fv分子(非共有結合性のヘテロダイマー;一本鎖Fv分子(scFv);二量体および三量体抗体フラグメント構築体;ミニボディ;ヒト化抗体分子;一本鎖抗体;Nanobody(登録商標)(Ablynx N.V.、Zwijnaarde、Belgium)抗体;ならびにそのような分子から得られるあらゆる機能フラグメント(そのようなフラグメントは、親抗体分子の免疫学的結合特性を保持する)。当該抗体は、様々な種、例えば、ヒト、マウス、ラット、ウサギ、ラクダ、ニワトリ等から供給することができる。次に、さらに、抗体および抗体部分を、インビトロ技術、例えばファージディスプレイおよび酵母ディスプレイによって得ることができる。完全ヒト化抗体を、操作されたヒト化B細胞レパートリを有するヒト血漿、ヒトB細胞クローニング、マウス、ラット、ウサギ、ニワトリ等から得ることができる。次に、抗体をさらに、親和性成熟および他の方法、例えば非フコシル化またはIgG Fc操作によって修飾することができる。
本明細書中で用いられる用語「モノクローナル抗体」は、均一な抗体集団を有する抗体組成物を指す。当該用語は、抗体の種に関しても源に関しても制限されないし、製造される様式によって制限されることが意図されることもない。当該用語は、親モノクローナル抗体分子の免疫学的結合特性を示す、免疫グロブリン全体、ならびにフラグメント、例えばFab、F(ab’)2、Fv、および他のフラグメント、ならびにキメラおよびヒト化均一抗体集団を包含する。
「抗体依存性細胞媒介性細胞障害(ADCC)」は、「抗体依存性細胞性細胞障害」とも呼ばれ、膜−表面リガンド結合ドメインが特異的抗体によって結合された場合に、免疫系のエフェクター細胞が、標的細胞、例えば養子細胞を能動的に溶解させる機構を指す。エフェクター細胞は、典型的に、ナチュラルキラー(NK)細胞である。しかしながら、マクロファージ、好中球、および好酸球が、ADCCを媒介することもできる。ADCCは、抗体、または免疫系の細胞の関与なしに膜に損傷を与えることによって標的を溶解もさせる相補体依存性細胞障害(CDC)から独立している。
本明細書中で用いられる「形質転換」は、宿主細胞中への外因性ポリヌクレオチドの挿入を指し、挿入に用いられる方法に拘わらない。例えば、形質転換は、直接的吸収、形質移入、感染等によるものであってよい。外因性ポリヌクレオチドは、非統合ベクター、例えばエピソームとして維持してもよいし、代わりに宿主ゲノム中に組み込んでもよい。本明細書中で用いられる「トランスジェニック生物」は、無関係な生物由来のDNAが人工的に導入された遺伝的材料を含有する生物を指す。当該用語は、トランスジェニック生物の後代(あらゆる世代)を含むが、後代が遺伝的改変を有する場合に限る。一部の実施形態において、トランスジェニック生物は、非ヒトトランスジェニック生物である。
本明細書中で用いられる「単離された」は、ヒトの介入によって、その天然の環境から離れて存在するため、自然の産物でない分子(例えば、ポリヌクレオチドまたはポリペプチド)を指し得る。ポリペプチドを指す場合、「単離された」は、示された分子が、生物全体から独立かつ分離しており、これにより分子が、同じ型の他の生体高分子の実質的非存在下で、自然界に見出され、または存在することを意味する。ポリヌクレオチドに関する用語「単離された」は、核酸分子であって、通常は自然界でこれに付随している配列の全てもしくは一部が全くない核酸分子;または自然界に存在する配列であるが、異種配列が付随している配列;または染色体に付随していない分子である。
本明細書中で用いられる用語「精製された」は、好ましくは、同じ分子の少なくとも75重量%、より好ましくは少なくとも85重量%、さらにより好ましくは少なくとも95重量%、最も好ましくは少なくとも98重量%が存在することを意味する。
本明細書中で用いられる「基質チャネル」は、最初にバルク環境中に拡散することのない、ある酵素反応から別の酵素反応への反応体の直接的移行を指す(例えば、Wheeldon,I.ら、Nat.Chem.8巻:299〜309頁(2016年)参照)。この酵素工程の中間生成物は、バルク溶液と平衡になく、これにより効率および収率は、酵素プロセスにおいて増大可能となる。天然に存在する代謝プロセス内の酵素は頻繁に、共局在化、および制御された凝集体へのアセンブリーの手段を進化させてきた。
本明細書中で用いられる「基質チャネル要素」は、代謝経路の構成要素を指す。一部の実施形態において、基質チャネル要素は、化学反応を触媒する酵素である。
本明細書中で用いられる「基質チャネル複合体」は、いくつかの手段を介して一緒に共局在化される複数の基質チャネル要素を指す。
本明細書中で用いられる「RNA足場」は、ペプチドが結合用の基質として用いることができるRNA分子を指す。
本明細書中で示されるデータは、カスケード構成要素とヌクレアーゼドメイン(例えば、二量体化−依存性の、非特異的なFokIヌクレアーゼドメイン;例えば、Urnov,F.D.ら、Nature Reviews Genetics 11巻:636〜646頁(2010年);Joung,J.K.ら、Nat.Rev.Mol.Cell Biol.14巻:49〜55頁(2013年);Guilinger,J.P.ら、Nat.Biotechnol.32巻:577〜582頁(2014年);Tsai,S.Q.ら、Nat.Biotechnol.32巻:569〜576頁(2014年)参照)との間の融合が、ヒト細胞内でI型系による効率的なプログラマブルRNAガイド遺伝子編集を媒介することを実証する。データは、操作されたI型CRISPR−Cas系(例えば、FokI−カスケード構成要素融合体を含む)を、無傷のリボ核タンパク(RNP)複合体として直接形質移入することができる、または個々のプラスミドコード構成要素の送達を介して細胞内でアセンブルすることができることを実証している。本明細書中で示される全てのCRISPR関連(Cas)遺伝子は、単一のポリシストロン性ベクター上にアセンブルされて、単純化された2構成要素のCasタンパク質−ガイドRNA発現系を生じた。また、ヌクレアーゼ(例えば、FokI)/カスケード構成要素リンカー配列の長さ/組成設計、および適切なDNAジオメトリの製剤形態、ならびに選択的カスケード相同体選択は、編集効率が最大約50%である操作されたI型CRISPR−Cas複合体を提供する。PAM必要条件、およびDNA標的化中のミスマッチ感度に関係する、操作されたI型CRISPR−Cas系(例えば、FokI−カスケード構成要素融合タンパク質を含む)の重要な特徴を判定した。
第1の態様において、本発明は、以下に限定されないが、カスケードサブユニットタンパク質およびカスケードガイドポリヌクレオチドが挙げられるカスケード構成要素をコードする操作されたポリヌクレオチドに関する。
一実施形態において、本発明は、カスケードI−E型系に由来するカスケード構成要素をコードする操作されたポリヌクレオチドに関する。カスケードタンパク質およびカスケードcrRNAを含む例示的なポリヌクレオチド構築体が、実施例1に示される。実施例1、表15、および配列番号1〜配列番号20は、特に大腸菌(E.coli)株K−12 MG1655由来の、I−E型カスケードの5つのサブユニットタンパク質をコードする遺伝子のポリヌクレオチドDNA配列、および結果として生じるタンパク質構成要素のアミノ酸配列を示す。ポリヌクレオチド配列は、大腸菌(E.coli)gDNAに由来し、そして大腸菌(E.coli)内での特異的発現用にコドン最適化し、かつ/または真核細胞(例えば、ヒト細胞)内での特異的発現用にコドン最適化した。このポリヌクレオチドが前駆体crRNAに転写されて、カスケードRNAエンドヌクレアーゼによってプロセシングされた場合、ゲノム内の相補的DNA配列を標的化するようなガイドRNAとして機能する成熟crRNAが生成される。最小CRISPRアレイは、crRNAのガイド部分を示す例示的なスペーサー配列に隣接する2つのリピート配列(実施例1において示されるCRISPRアレイ配列内で下線が施されている)を含む。カスケードエンドヌクレアーゼによるRNAプロセシングが、5’および3’末端の双方に、ガイド配列に隣接するリピート配列を有するcrRNAを生成する。当業者であれば、本明細書および実施例の教示を鑑みて、(例えば、gDNA内の)選択された標的配列へのカスケード複合体の結合を標的化するのに適したスペーサー配列を選択することができる。
本明細書のガイダンスに従って、そして一例として、大腸菌(E.coli)株K−12 MG1655由来のカスケードサブユニット遺伝子の相同体の位置を決定するためにBLASTおよびPSI−BLAST等のバイオインフォマティクスツールを用いてから、カスケード遺伝子のフランキングゲノムの近傍を調査して、残留するカスケードサブユニットタンパク質の遺伝子の位置を決定し、かつ同定することで、更なる細菌または古細菌種由来のカスケード構成要素をコードするポリヌクレオチド配列を同定かつ設計することができる(例えば、実施例14A、実施例14B、実施例15A、および実施例15B参照)。カスケード遺伝子は、保存されたオペロンとして共起するので、典型的に、同じI型サブタイプ内に一貫した順序で配置されて、追跡調査の分析および実験用の同定および選択を促進する。一例として、Cas8相同体の位置を決定して、相同カスケード試験用に見込みがある細菌種を同定してから、Cas8、および相同CRISPR−Cas系由来のカスケードの他のタンパク質構成要素をコードするポリヌクレオチド配列を得、または設計することによって、更なるI−E型系を同定することができる。
いくつかの種由来のカスケードのサブユニットタンパク質をコードする遺伝子のポリヌクレオチドDNA配列(表3および表4で一覧にされる)(一部は、大腸菌(E.coli)株K−12 MG1655に由来するものと相同なカスケード複合体を有する)、および結果として生じるタンパク質構成要素のアミノ酸配列、ならびに例示的な最小CRISPRアレイが、配列番号22〜配列番号213として表される(表3)。
タンパク質についてのポリヌクレオチド配列は、宿主細菌のgDNAに由来し、そして大腸菌(E.coli)内での特異的発現用にコドン最適化し、かつ/または真核細胞(例えば、ヒト細胞)内での特異的発現用にコドン最適化した。対応する最小CRISPRアレイをコードするポリヌクレオチドDNA配列は、12の種に由来するリピート配列に基づいており、そしてガイドRNAとして機能する成熟crRNAを生成するのに用いることができる。表4において、最小CRISPRアレイは、crRNAのガイド部分を示す例示的な「スペーサー」配列に隣接する2つのリピート配列(小文字、下線が施されている)を含む。エンドヌクレアーゼカスケードサブユニットによるRNAプロセシングが、5’および3’末端の双方に、ガイド配列に隣接するリピート配列を有するcrRNAを生成する。
別の実施形態において、本発明は、他のI型サブタイプ(以下に限定されないが、I−B型、I−C型、I−F型、およびI−F型のバリアントが挙げられ、これらは、本明細書のガイダンスに従って、そしてBLASTおよびPSI−BLAST等のバイオインフォマティクスツールを用いて、各サブタイプの特色となるホールマークシステムからカスケード遺伝子の相同体の位置を決定することによって、同定かつ設計することができる(例えば、非特許文献5;非特許文献6参照))内の、更なる細菌または古細菌種由来のカスケード構成要素をコードする操作されたポリヌクレオチド配列に関する。所望の相同体を同定した後に、カスケード遺伝子のフランキングゲノムの近傍を調査して、本明細書中で開示される、残留するカスケードサブユニットタンパク質の遺伝子の位置を決定しかつ同定することができる。一例として、Cas8相同体の位置を決定すること、そして相同カスケード試験用に見込みがある細菌種を同定してから、Cas8、Cas5、および相同CRISPR−Cas系由来のカスケードの他のタンパク質構成要素をコードするポリヌクレオチド配列を得、または設計することによって、更なるI−F型系を同定することができる(そしてCas5相同体の位置を決定することによって、更なるI−F型バリアント2系を同定することができる)。
12の更なる相同カスケード複合体由来のI−B型、I−C型、I−F型、およびI−F型バリアント2由来のカスケードの3つ、4つ、または5つのサブユニットタンパク質をコードする遺伝子のポリヌクレオチドDNA配列、および結果として生じるタンパク質構成要素のアミノ酸配列、ならびに例示的な最小CRISPRアレイが、配列番号214〜配列番号351として表される(表3)。サブユニットタンパク質についてのポリヌクレオチド配列は、宿主細菌のgDNAに由来し、そして大腸菌(E.coli)内での特異的発現用にコドン最適化し、かつ/または真核細胞(例えば、ヒト細胞)内での特異的発現用にコドン最適化した。対応する最小CRISPRアレイをコードするポリヌクレオチドDNA配列は、12の種から由来するリピート配列に基づいており、そしてガイドRNAとして機能する成熟crRNAを生成するために用いることができる。表5において、最小CRISPRアレイは、crRNAのガイド部分を示す例示的な「スペーサー」配列に隣接する2つのリピート配列(小文字、下線が施されている)を含む。エンドヌクレアーゼカスケードサブユニットによるRNAプロセシングが、5’および3’末端の双方に、ガイド配列に隣接するリピート配列を有するcrRNAを生成する。
実施例19A〜実施例19Iおよび実施例22A〜実施例22Cは、複数のカスケード複合体相同体の設計および試験を記載しており、これらは各々、各カスケード複合体についてのゲノム編集の効率を評価するために、Casサブユニットタンパク質−FokI融合タンパク質を含む。最も高い編集を、シュードモナス(Pseudomonas)属種S−6−2由来のバリアントで観察した一方、他の相同体(すなわち、サルモネラ・エンテリカ(Salmonella enterica)、ゲオサーモバクター(Geothermobacter)属種EPR−M、メタノケッラ・アルボリザエ(Methanocella arvoryzae)MRE50、およびS.サーモフィルス(S.thermophilus)(株ND07))が、大腸菌(E.coli)とおおよそ等しい編集を示した。また、編集を、操作されたコレラ菌(Vibrio cholerae)株L15(I−F型)FokI−カスケード複合体およびコレラ菌(Vibrio cholerae)株HE48(I−Fv2型)FokI−カスケード複合体で観察した。一実施形態において、これらの異なる相同体の異なるPAM必要条件は、標的ポリヌクレオチド(例えば、細胞内のgDNA)内の標的密度を増大させ得る。したがって、カスケード複合体相同体のこのコレクションは、標的ポリヌクレオチド(例えば、細胞内のgDNA)内の核酸標的配列の選択におけるより大きなフレキシビリティを提供する。
第2の態様において、本発明は、改変カスケードサブユニットタンパク質に関する。改変に適したカスケードサブユニットタンパク質として、以下に限定されないが、本明細書中に記載される種のカスケードサブユニットタンパク質が挙げられる。
一実施形態において、本発明は、カスケードサブユニットタンパク質の操作された円順列置換(circular permutation)に関する。カスケードサブユニットタンパク質のそのような円順列置換は、カスケードサブユニットタンパク質のアミノ酸の元の直鎖状配列の連結性が異なるが、三次元の形状が全体的に類似するタンパク質構造をもたらす(例えば、Bliven,S.ら、PLoS Comput.Biol.8巻:e1002445頁(2012年)参照)。カスケードサブユニットタンパク質の円順列置換は、いくつかの利点を有し得る。例えば、Cas7サブユニットタンパク質の円順列置換は、Cas7タンパク質の折畳みもカスケード複合体のアセンブリーも乱すことなく、更なるポリペプチド配列との連結について、融合タンパク質またはリンカー領域を形成するように位置を定められるように設計された新しいN末端および新しいC末端を作出することができる。Cas7の円順列置換(円順列置換されたCas7、cpCas7)の3つの例が、図3Aおよび図3Bにおいて示されている。図3Aおよび図3Bにおいて、タンパク質の3つの部分が示されている:天然のタンパク質のN末端部分(図3A、垂直なストライプ、例えば、Cas7タンパク質)、天然のタンパク質の中心部(図3A、灰色の陰影が付いている)、および天然のタンパク質のC末端部分(図3A、陰影が付いていない)。図3Aは、円順列置換されたタンパク質(図3A、cpCas7)を生成するための、天然のタンパク質のC末端位置への、天然のタンパク質のN末端部分の再配置を示しており、ここで天然のタンパク質のN末端部分は、cpCas7のN末端にあり、リンカーポリペプチド(図3A、リンカー)によって天然のタンパク質の中心部分に連結されている。図3Bは、天然のタンパク質(図3B、cpCas7)のN末端位置への、天然のタンパク質(図3B、Cas7)のC末端部分の再配置を示しており、ここで天然のタンパク質のC末端部分は、cpCas7のN末端にあり、リンカーポリペプチド(図3B、リンカー)によって天然のタンパク質の中心部分に連結されている。
実施例10A、実施例10B、および実施例10に示されるデータは、円順列置換されたCas7サブユニットタンパク質バリアントを含むカスケード複合体の精製により、円順列置換されたI−E型CRISPR−Casサブユニットタンパク質を、野生型タンパク質を含むカスケード複合体と(分子量に基づいて)本質的に同じ組成物を有するカスケード複合体を形成するのに首尾よく用いることができることが実証されることを示している。
別の実施形態において、本発明は、更なるポリペプチド配列に融合されて融合タンパク質を作製するカスケードサブユニットタンパク質、およびそのような融合タンパク質をコードするポリヌクレオチドに関する。更なるポリペプチド配列として、以下に限定されないが、タンパク質、タンパク質ドメイン、タンパク質フラグメント、および機能ドメインを挙げることができる。そのような更なるポリペプチド配列の例として、以下に限定されないが、転写アクチベーターまたはリプレッサードメイン、およびヌクレオチドデアミナーゼ(例えば、シチジンデアミナーゼまたはアデニンデアミナーゼ(例えば、Komorら、Nature 553巻:420〜424頁(2016年);Koblanら、Nat.Biotechnol.doi:10.1038/nbt.4172(2018年5月29日)に記載されている))に由来する配列が挙げられる。融合タンパク質についての更なる機能ドメインが、本明細書中で示されている。
更なるポリペプチド配列を、カスケードサブユニットタンパク質のいずれかに融合させてもよく、更なるポリペプチド配列は、カスケードサブユニットタンパク質のコード配列を含むポリヌクレオチドの5’または3’末端に典型的に添えられている更なるポリヌクレオチド配列によってコードされる。一部の実施形態において、アミノ酸リンカーをコードする更なるポリヌクレオチド配列が、カスケードサブユニットタンパク質を、注目する更なるポリペプチド配列に連結している。一部の実施形態において、融合タンパク質パートナについてのポリヌクレオチド配列、およびリンカー配列は、天然に存在するgDNA配列に由来してもよいし、大腸菌(E.coli)内での細菌発現または哺乳動物細胞(例えば、ヒト細胞)内での真核生物発現用にコドン最適化してもよい。親和性タグ(例えば、His6、Strep−tag(登録商標)II(IBA GMBH LLC、Gottingen、Germany))、核局在化シグナルまたは配列(NLS)、マルトース結合タンパク質、およびFokIを含む融合タンパク質の例が、実施例1に示されている。また、例示的なアミノ酸リンカー配列が、実施例1に開示されている。
実施例11Aは、カスケードサブユニットタンパク質−FokI融合体、およびシチジンデアミナーゼ、エンドヌクレアーゼ、制限酵素、ヌクレアーゼ/ヘリカーゼ、またはそれらのドメインへのカスケードサブユニットタンパク質融合体を記載している。実施例11Bは、他のカスケードサブユニットタンパク質とのカスケードサブユニットタンパク質融合体、ならびに他のカスケードサブユニット融合タンパク質および酵素タンパク質ドメインとのカスケードサブユニットタンパク質融合体(実施例11D)を記載している。一部の実施形態において、I型CRISPRサブユニットタンパク質は、N末端、C末端、またはN末端とC末端との間の位置でのタンパク質融合を生成するのに用いることができる能力について、インシリコで評価することができる。一部の実施形態において、I型CRISPRサブユニットタンパク質が、1つまたはそれ以上のポリペプチドリンカーを用いて、N末端、C末端、またはN末端とC末端との間の位置の1つまたはそれ以上の融合ドメインに連結していてもよい。一部の実施形態において、カスケードサブユニットタンパク質が、一本鎖FokIに融合していてもよい(例えば、EcoCascade RNP複合体への一本鎖FokI融合体;ヌクレオチド配列、配列番号1926;タンパク質配列、配列番号1927)。例示的なポリペプチドリンカーが、実施例1、11、18、および19に示されている。
図4Aおよび図4Bは、更なるタンパク質配列(例えば、FokI)に融合された、Cas8サブユニットタンパク質を含むカスケード複合体を示す(図4A、図4B、Cas7、Cas5、Cas8、Cse2、Cas6、Cas6周りの破線のボックスは、crRNAヘアピンとの相互作用を示す;cRNAは、黒色の線として示されており、ヘアピンを含む;そして、Cas8、「C」C末端、「N」N末端が示される)。図4Aは、リンカーポリペプチド(図4A、黒色の曲線)を用いてCas8サブユニットタンパク質のC末端と連結された更なるタンパク質配列(図4A、FP)の例を示す。図4Bは、リンカーポリペプチド(図4B、黒色の曲線)を用いてCas8サブユニットタンパク質のN末端と連結された更なるタンパク質配列(図4B、FP)の例を示す。実施例11Aは、FokIヌクレアーゼドメインとN末端にて融合するI−E型Cas8のインシリコ設計、クローニング、発現、および精製を記載している。
図5Aおよび図5Bは、更なるタンパク質配列に融合したカスケードサブユニットタンパク質を含むカスケード複合体の更なる例を示す。図5Aおよび図5Bにおいて、cRNAは、黒色の線として示されており、ヘアピンを含み、そしてカスケード複合体のCasタンパク質の相対位置が示されている(図5A、図5B:Cas7、Cas5、Cas8、Cse2、Cas6;Cas6周りの破線のボックスは、crRNAヘアピンとの相互作用を示す)。図5Aは、各々リンカーポリペプチド(図5A、黒色の曲線)を介して6つのCas7サブユニットタンパク質に各々融合した検出可能部分(例えば、緑色蛍光タンパク質;図5A、GFP)の例を示す。そのようなカスケード複合体は、カスケード複合体と会合した複数の検出可能部分の存在の結果としての著しいシグナル増幅を提供することによる、核酸標的配列への複合体の結合の検出に有用であり得る。図5Bは、リンカーポリペプチド(図5B、黒色の曲線)を用いてCas6サブユニットタンパク質と連結された更なるタンパク質配列(図5B、FP)の例を示す。
大腸菌(E.coli)I−E型カスケードサブユニットタンパク質を含有する融合タンパク質の例として、以下が挙げられるが、これらに限定されない:同じサブユニット(例えば、Cse2_リンカー_Cse2)、円順列置換されたサブユニット(例えば、cpCas7_リンカー_cpCas7_リンカー_cpCas7_リンカー_cpCas7_リンカー_cpCas7_リンカー_cpCas7)、ヌクレアーゼに融合したI−E型カスケードタンパク質(例えば、FokI_リンカー_Cas8、Cas3_リンカー_Cas8、Cas6_リンカー_FokI、S1ヌクレアーゼ_リンカー_Cse2_リンカー_Cse2)、シチジンデアミナーゼに融合したI−E型カスケードタンパク質(例えば、Cas8_リンカー_AID、Cse2_リンカー_Cse2_リンカー_APOBEC3G)、および1つまたはそれ以上の他のI−E型カスケードタンパク質に融合したI−E型カスケードタンパク質(例えば、Cas6_リンカー_cpCas7_リンカー_cpCas7_リンカー_cpCas7_リンカー_cpCas7_リンカー_cpCas7_リンカー_cpCas7、cpCas7_リンカー_cpCas7_リンカー_cpCas7_リンカー_cpCas7_リンカー_cpCas7_リンカー_cpCas7_リンカー_Cas5、Cas6_リンカー_cpCas7_リンカー_cpCas7_リンカー_cpCas7_リンカー_cpCas7_リンカー_cpCas7_リンカー_cpCas7_リンカー_Cas5)。
図6A、図6B、および図6Cは、cpCas7を含有する操作されたI型CRISPR−Casエフェクター複合体のイラストを示す。図6A、図6B、および図6Cにおいて、「cpCas7」は、円順列置換されたCas7タンパク質であり(図6A、図6B、図6C:cpCas7、Cas5、Cas8、Cse2、およびCas6;Cas6周りの破線のボックスは、crRNAヘアピンとの相互作用を示す;cRNAは、黒色の線として示されており、ヘアピンを含む;cpCas7について、陰影は、図3Aにおいて示される円順列置換されたタンパク質に相当する)、そしてカスケード複合体のCasタンパク質の相対位置が示されている。図6Aは、6つの個々のcpCas7サブユニットタンパク質を含むカスケード複合体を示す(図6A、cpCas7)。図6Bは、6つの融合cpCas7サブユニットタンパク質を含むカスケード複合体を示しており、cpCas7サブユニットタンパク質(図6B、cpCas7)のC末端は、リンカーポリペプチド(図6B、リンカーポリペプチドは、cpCas7サブユニットタンパク質を連結する暗黒色の線として示されている)を用いて、隣接するcpCas7サブユニットタンパク質のN末端と連結されている。図6Cは、カスケード複合体が6つの融合cpCas7サブユニットタンパク質(「骨格」)を含む実施形態を示しており、第1のcpCas7サブユニットタンパク質のC末端は、リンカーポリペプチド(図6C、リンカーポリペプチドは、cpCas7サブユニットタンパク質を連結する暗黒色の線として示されている)を用いて、第2のcpCas7サブユニットタンパク質のN末端と連結されており、第2のcpCas7サブユニットタンパク質のC末端は、リンカーポリペプチド(図6C、cpCas7とFPとを連結している黒色の直線)を用いて、異なるタンパク質配列(図6C、FP)(例えば、シチジンデアミナーゼ)のN末端と連結されており、そしてこのタンパク質コード配列のC末端は、リンカーポリペプチドを用いて、第3のcpCas7のN末端と連結されている。cpCas7サブユニットタンパク質のそのような融合骨格の一利点は、更なるタンパク質配列が、骨格に沿う特定の位置にて導入されて、ガイドがカスケード複合体の結合を導く核酸標的配列の長さに沿う様々な位置への更なるタンパク質配列のアクセスをもたらすことができることである。
図7Aおよび図7Bは、融合タンパク質を含む操作されたI型CRISPR−Casエフェクター複合体の更なる実施形態を示す。図7Aおよび図7Bにおいて、カスケード複合体のCasタンパク質の相対位置が示されている(図7A、図7B:Cas7、Cas5、Cas8、Cse2、およびCas6;Cas6周りの破線のボックスは、crRNAヘアピンとの相互作用を示す;cRNAは、黒色の線として示されており、ヘアピンを含む)。図7Aは、Cse2−Cse2融合タンパク質(図7A、黒色の曲線によって連結されている2つのCse2タンパク質)を含むカスケード複合体を示す。インシリコ設計、クローニング、発現、精製、および電気泳動運動能シフトアッセイが、実施例11Bおよび実施例11Cの、Cse2−Cse2融合タンパク質を含むカスケード複合体に記載されている。図7Bは、更なるタンパク質配列(図7B、FP)とリンカーポリペプチド(図7B、Cse2タンパク質をFPに連結している黒色の曲線)を介して連結されているCse2−Cse2融合タンパク質を含むカスケード複合体を示す。実施例11Dは、シチジンデアミナーゼに融合したCse2−Cse2タンパク質のインシリコ設計、クローニング、発現、および精製を記載している。
一部の実施形態において、1つまたはそれ以上の核局在化シグナルを、カスケードタンパク質サブユニット(例えば、Cas8−FokI融合タンパク質、cpCas7タンパク質、またはCse2−Cse2融合タンパク質)の操作されたN末端またはC末端に加えることができる。
融合ポリペプチドの一部の実施形態において、リンカーポリペプチドは、2つまたはそれ以上のタンパク質コード配列を連結する。例示的なリンカーポリペプチドの長さが、実施例において記載されている。典型的には、リンカー長として、以下に限定されないが、約10アミノ酸〜約40アミノ酸、約15アミノ酸〜約30アミノ酸、約17アミノ酸〜約20アミノ酸が挙げられる。リンカーポリペプチドのアミノ酸組成は、典型的に、極性のある、小さな、かつ/または帯電しているアミノ酸(例えば、Gly、Ala、Leu、Val、Gln、Ser、Thr、Pro、Glu、Asp、Lys、Arg、His、Asn、Cys、Tyr)を含む。更なる実施形態において、リンカーポリペプチドは、メチオニンを含有しないように設計され、そして融合体は、クリプティック翻訳開始部位を回避するように設計されている。本明細書のガイダンスに従って、リンカーポリペプチドは、融合タンパク質内での機能ドメインおよびカスケードタンパク質の適切な間隔保持および位置決めを実現するように設計されている(例えば、Chichili,Cら、Protein Science 22巻:153〜167頁(2013年);Chen,X.ら、65巻:1357〜1369頁(2013年);George,R.ら、Protein Engineering,Design and Selection 15巻:871〜879頁(2002年)参照)。本発明の実行に有用なリンカーポリペプチドの更なる例として、カスケード系を含む生物においてカスケードタンパク質のコード配列を互いに連結することが同定されているリンカーポリペプチド(例えば、非特許文献13によって記載されるような、ストレプトミセス・グリセウス(Streptomyces griseus)においてCas8をCas3に連結するリンカーポリペプチド)がある。
融合タンパク質コードDNA配列を、選択された生物、例えば、細菌、古細菌、植物、菌類、または哺乳動物の細胞内での発現用にコドン最適化してよい。コドン最適化プログラムが、例えばIntegrated DNA Technologiesウェブサイト(www.idtdna.com/CodonOpt)上で、またはGenscript(登録商標)(Genscript、Piscataway、NJ)サービスを介して、広く利用可能である。レシピエント発現ベクター中へのクローニングを促進するために、SLICクローニング(例えば、Li,M.ら、Methods Mol.Biol.852巻:51〜59頁(2012年)参照)に適合するベクターと重複する更なる配列を、DNA配列の5’および3’末端に添えてよい。
他の実施形態において、カスケードサブユニットタンパク質を、転写活性化および/または抑制ドメインに融合させてもよい。一部の実施形態において、融合タンパク質は、アクチベータードメイン(例えば、ヒートショック転写因子、NFKBアクチベーター、VP16、およびVP64(例えば、Eguchi,A.ら、Proc.Natl.Acad.Sci.USA 113巻:E8257〜E8266頁(2016年);Perez−Pinera,P.ら、Nature Methods 10巻:973〜6頁(2013年);Gilbert,L.A.ら、Cell 159巻:647〜61頁(2014年)参照)またはリプレッサードメイン(例えば、KRABドメイン)を含んでもよい。一部の実施形態において、リンカー核酸配列は、タンパク質、タンパク質ドメイン、またはタンパク質フラグメントの2つまたはそれ以上のコード配列を結合させるのに用いられる。
転写アクチベーターに融合されたI型CRISPR−Casサブユニットタンパク質を含むカスケード複合体を用いて、遺伝子の発現を活性化させることができる。標的遺伝子座は、細胞の転写活性化機構(因子)についての1つまたはそれ以上の結合部位を典型的に保有する転写開始部位(TSS)を含有してもよい。図8は、転写アクチベーターVP64にリンカーポリペプチド(図8、cpCas7をVP64に連結している黒色の曲線)を介して連結されたcpCas7(図3Aと比較)を含む6つの融合タンパク質を含むカスケード複合体を示す。図8において、crRNAは、ヘアピンを含む暗黒色の線として示されており、そしてカスケード複合体のCasタンパク質の相対位置が示されている(図8:cpCas7、Cas5、Cas8、Cse2、およびCas6;Cas6周りの破線のボックスは、crRNAヘアピンとの相互作用を示す)。カスケード複合体のそのような操作は、複合体を、遺伝子の転写活性化用のフレキシブルなツール(CASCADEa)に変換し、そこでは、選択された遺伝子の標的化が、カスケード複合体の結合を、選択された遺伝子の1つまたはそれ以上の調節要素(例えば、TSS)に向けるガイド配列の選択によって達成される。実施例12は、転写活性化活性をカスケード複合体に付与するための、VP64活性化ドメインに融合する大腸菌(E.coli)I−E型cp−Cas7タンパク質の設計を記載している。転写アクチベーターとして、以下に限定されないが、ホメオドメインタンパク質、ジンクフィンガータンパク質、ウイングドへリックス(フォークヘッド)タンパク質、ロイシン−ジッパータンパク質、ヘリックス−ループ−ヘリックスタンパク質、ヘテロ二量体転写因子、活性化ドメイン、およびエンハンサーに結合する転写因子が挙げられる(例えば、Molecular Cell Biology,Harvey Lodishら、W H Freeman & Co;(2002年)ISBN 978−0849394805参照)。
また、転写リプレッサーに融合するI型CRISPR−Casサブユニットタンパク質を含むカスケード複合体を用いて、遺伝子の発現を抑制することができる。標的遺伝子座は、転写調節要素を含んでもよい。一実施形態において、カスケードサブユニットタンパク質を、リンカーポリペプチドを介してKRABドメインに連結させてもよい。カスケードサブユニットタンパク質/KRABドメイン融合体を含むカスケード複合体は、当該複合体を、遺伝子の転写抑制用のフレキシブルなツール(CASCADEi)に変換することができ、そこでは、選択された遺伝子の標的化が、カスケード複合体の結合を、選択された遺伝子の1つまたはそれ以上の調節要素に向けるガイド配列の選択によって達成される。転写リプレッサーとして、以下に限定されないが、受動転写リプレッサー、bzip転写因子ファミリー、sp1様転写リプレッサー、活性転写リプレッサー(例えば、ヒストンデアセチラーゼの動員を介した転写抑制、ヒストン脱アセチル化、および二重特異性リプレッサーが挙げられる(例えば、Thiel,G.ら、Eur.J.Biochem.271巻:2855〜2862頁(2004年);Nicola Reynolds,N.ら、Development 140巻:505〜512頁(2013年);Gaston,K.ら、Cell Mol.Life Sci.,60巻:721〜741頁(2003年)参照)。
更なる実施形態において、カスケードサブユニットタンパク質を、親和性タグに融合させてもよい。
本発明の他の実施形態において、I型CRISPR−Casガイドポリヌクレオチドを、ガイドポリヌクレオチド内の選択された位置での、選択されたポリヌクレオチド要素の挿入、またはヌクレオチドの変更(例えば、RNA部分の代わりにDNA部分を用いる基本的に異なる変更、およびガイドポリヌクレオチドについて先で記載された他の変更)によって修飾することができる。そのような実施形態として、以下に限定されないが、1つまたはそれ以上のヌクレオチドエフェクタードメイン(例えば、転写因子を動員するMS2もしくはMS2−P65−HSF1結合RNAまたはアプタマー)を5’、3’、または内部に融合させたI型CRISPR−Casガイドポリヌクレオチドが挙げられる。図9は、I型CRISPRガイドポリヌクレオチドを示しており、そしてカスケード複合体のCasタンパク質の相対位置が示されている(図9:Cas7、Cas5、Cas8、Cse2、およびCas6;Cas6周りの破線のボックスは、crRNAヘアピンとの相互作用を示す;cRNAは、破線のボックス内で黒色の線として示されており、ヘアピンを含む)。図9において、crRNAはさらに、ガイドポリヌクレオチドの3’ヘアピン中に導入されたRNAアプタマーヘアピン(図9、矢印によって示される位置)を含む。
また、I型CRISPR−Casガイドの長さは、典型的にはCas7サブユニットタンパク質およびCse2サブユニットタンパク質結合領域を長くする、または短くすることによって、変更することができる。図10Aは、3つのCas7サブユニット、1つのCse2サブユニット、および短くされたcrRNAを有するカスケード複合体を示す(図10A:Cas7、Cas5、Cas8、Cse2、およびCas6;Cas6周りの破線のボックスは、crRNAヘアピンとの相互作用を示す;cRNAは、黒色の線として示されており、ヘアピンを含む)。図10Bは、9つのCas7サブユニット、3つのCse2サブユニット、および長くされたcrRNAを有するカスケード複合体を示す(図10B:Cas7、Cas5、Cas8、Cse2、およびCas6;Cas6周りの破線のボックスは、crRNAヘアピンとの相互作用を示す;cRNAは、黒色の線として示されており、ヘアピンを含む)。
実施例16は、I型CRISPR−CasガイドcrRNAの修飾の生成および試験、ならびに操作されたI型CRISPR−Casエフェクター複合体を構築するのに用いられる修飾ガイドの適合性を記載している。
第3の態様において、本発明は、1つまたはそれ以上の操作されたカスケード構成要素をコードする核酸配列、ならびに1つまたはそれ以上の操作されたカスケード構成要素をコードする核酸配列を含む発現カセット、ベクター、および組換え細胞に関する。本発明の第3の態様の一部の実施形態として、選択されたカスケード系の全ての構成要素(例えば、Cse2、Cas5、Cas6、Cas7、およびCas8タンパク質、ならびに1つまたはそれ以上のコグネイトガイド)をコードする1つまたはそれ以上のポリペプチドが挙げられ、当該構成要素は、エフェクター複合体を形成することができる。典型的には、1つを超えるコグネイトガイドが発現される場合、ガイドは、様々な核酸標的配列に結合を向けるための様々なスペーサー配列を有する。そのような実施形態として、以下に限定されないが、発現カセット、ベクター、および組換え細胞が挙げられる。
一実施形態において、本発明は、1つまたはそれ以上の操作されたカスケード構成要素をコードする1つまたはそれ以上の核酸配列を含む1つまたはそれ以上の発現カセットに関する。発現カセットは、典型的に:転写の調節、転写後の調節、または翻訳の調節の1つまたはそれ以上に関与する調節配列を含む。発現カセットは、以下に限定されないが、細菌細胞、酵母細胞、植物細胞、および哺乳動物細胞(ヒト細胞を含む)が挙げられる多種多様な生物中に導入することができる。発現カセットは、典型的に、導入されることとなる生物に対応する機能的調節配列を含む。
本発明の更なる実施形態は、ベクターに関し、1つまたはそれ以上の操作されたカスケード構成要素をコードする1つまたはそれ以上の核酸配列を含む発現ベクターが挙げられる。また、ベクターは、選択マーカーまたはスクリーニングできるマーカーをコードする配列を含んでもよい。さらに、核標的化配列を、例えば、カスケードサブユニットタンパク質に加えてもよい。また、ベクターは、タンパク質タグ(例えば、ポリ−Hisタグ、ヘマグルチニンタグ、蛍光タンパク質タグ、および生物発光タグ)をコードするポリヌクレオチドを含んでもよい。そのようなタンパク質タグのコード配列を、例えば、カスケードサブユニットタンパク質をコードする1つまたはそれ以上の核酸配列に融合させることができる。
発現ベクターの構築のための一般的な方法が、当該技術において知られている。宿主細胞用の発現ベクターが市販されている。適切なベクターの選択およびその構築を促進するように設計された、いくつかの市販のソフト製品があり、例えば、昆虫細胞形質転換および昆虫細胞内での遺伝子発現用の昆虫細胞ベクター、細菌形質転換および細菌細胞内での遺伝子発現用の細菌プラスミド、細胞形質転換ならびに酵母および他の菌類内での遺伝子発現用の酵母プラスミド、哺乳動物細胞形質転換および哺乳動物細胞または哺乳動物内での遺伝子発現用の哺乳動物ベクター、ならびに細胞形質転換および遺伝子発現用のウイルスベクター(以下に限定されないが、レンチウイルス、レトロウイルス、アデノウイルス、単純ヘルペスウイルスIまたはII、パルボウイルス、細網内皮症ウイルス、およびアデノ随伴ウイルス(AAV)ベクターが挙げられる)、ならびにそのようなポリヌクレオチドのクローニングを容易にする方法がある。
AAVベースのベクター(rAAV)が、本発明の方法の実行に有用なウイルスベクターの一例である。AAVは、パルボウイルス科の一本鎖DNAメンバーであり、元来複製が欠損したウイルスである。AAVベクターは、遺伝子治療に最も頻繁に用いられているウイルスベクターの1つである。AAV(AAV血清型1[AAV−1]〜AAV−12)の12のヒト血清型、および非ヒト由来の100を超える血清型が知られている。一実施形態において、AAV−6がベクターとして用いられる。
レンチウイルスベクターが、本発明の方法の実行に有用なウイルスベクターの別の例である。レンチウイルスは、レトロウイルス科のメンバーであり、一本鎖RNAウイルスである。これは、分裂細胞および非分裂細胞の双方に感染することができ、かつゲノム中への統合により安定した発現をもたらすことができる。レンチウイルスベクターの安全性を増大させるために、ウイルスベクターを生成するのに必須の構成要素が、複数のプラスミドにわたって分けられている。運搬ベクターは、典型的に、複製不能であり、そして加えて、3’LTR内に欠失を含有し得、これによりウイルスは統合後に自己不活化する。パッケージングおよびエンベローププラスミドが、典型的に、運搬ベクターと組み合わせて用いられる。例えば、パッケージングプラスミドが、Gag、Pol、Rev、およびTat遺伝子の組合せをコードし得る。運搬プラスミドが、ウイルスLTRおよびpsiパッケージングシグナルを含み得る。エンベローププラスミドは、通常、エンベロープタンパク質(通常、その広い感染範囲のため、水胞性口内炎ウイルス糖タンパク質、VSV−GP)を含む。
実例となる植物形質転換ベクターとして、アグロバクテリウム・ツメファシエンス(Agrobacterium tumefaciens)のTiプラスミドに由来するものが挙げられる(例えば、Lee,L.Y.ら、Plant Physiology 146巻:325〜332頁(2008年)参照)。また、当該技術において有用であり、かつ知られているのは、アグロバクテリウム・リゾゲネス(Agrobacterium rhizogenes)プラスミドである。例えば、SNAPGENE(商標)(GSL Biotech LLC、Chicago、IL;snapgene.com/resources/plasmid_files/your_time_is_valuable/)は、ベクター、個々のベクター配列、およびベクターマップ、ならびに多くのベクターの商業的供給源の広範なリストを提供している。
細菌発現系において組換えカスケードを発現させて精製するために、カスケードサブユニットタンパク質、および注目するガイド配列を含む最小CRISPRアレイをコードするベクターを設計してよい。したがって、本発明の一態様として、そのような発現系が挙げられる。一実施形態において、カスケード複合体は、3つの互いに異なるプラスミドベクターから発現され、これらはまとめて以下の構成要素:Cas8タンパク質;Cse2、Cas7、Cas5、およびCas6タンパク質;ならびにCRISPR RNAをコードする。一部の実施形態において、Cas8をコードする発現プラスミドは、天然のgDNA遺伝子配列を含み、そして他の実施形態において、発現プラスミドは、選択された細胞型内での発現用にコドン最適化したCas8をコードしてよい。同様に、Cse2、Cas7、Cas5、およびCas6をコードする発現プラスミドは、天然のgDNA遺伝子配列を含有してもよいし、選択された細胞型内での発現用にコドン最適化した遺伝子配列を含有してもよい。一部の実施形態において、様々なタンパク質が全て、単一のポリシストロン性転写産物から翻訳されるように、オペロンをコードするカスケードサブユニットタンパク質の全体を、単一の転写プロモーターの下流に配置してもよい。更なる実施形態において、カスケードサブユニットタンパク質をコードする遺伝子を互いに分けて、転写ターミネーターおよびプロモーターを介在させてもよい。
crRNAをコードする発現プラスミドは、適切な転写プロモーターの下流に、単一のスペーサー配列に隣接するわずか2つのリピートを含有してもよいし、複数のスペーサー配列(同じ正確なガイド配列、または複数の互いに異なるガイド配列のいずれか)に隣接する多くのリピートを含有してもよい。CRISPRの調整された発現、およびカスケードサブユニット、特にCas6サブユニットは、長い前駆体crRNAの、成熟した長さのcrRNAへのプロセシングをもたらし、これらはそれぞれ、crRNAの5’および3’末端上に単一のリピートのフラグメントを、そして中央に単一のスペーサー配列を含む。
大腸菌(E.coli)内で完全なカスケード複合体を発現するための代替戦略として、2つのプラスミドを用いるものがある:一プラスミドが、単一の発現プラスミド上にCas8−Cse2−Cas7−Cas5−Cas6オペロン全体をコードし、そして一プラスミドが、CRISPR RNAをコードしている。この場合、通常はCas8遺伝子の3’末端と重複するCse2遺伝子の5’末端が、Cas8遺伝子の3’末端から空間的に分離されて、親和性タグおよび/またはプロテアーゼ認識配列をコードするポリヌクレオチド配列が添えられる。
実施例2は、カスケードタンパク質用の2つのタイプの細菌発現プラスミド系を記載している:第1のタイプは、2つのプラスミドを含み、第1のプラスミドが、Cas8タンパク質をコードし、そして第2のプラスミドが、CasBCDE複合体の4つのサブユニットタンパク質(cse2−cas7−cas5−cas6オペロン)をコードしている;そして、第2のタイプは、カスケード複合体の5つのサブユニットタンパク質(cas8−cse2−cas7−cas5−cas6オペロン)を全てコードする発現プラスミドを含む。また、コグネイトCRISPRアレイが記載されている。
カスケード複合体の精製を促進するために、Cse2サブユニット上に親和性タグ、例えばN末端Strep−IIタグまたはヘキサヒスチジン(His6)タグを添えてもよい。さらに、最初の精製後のプロテアーゼによる配列の生化学的切断が、親和性タグを最終の組換えカスケード複合体から遊離させるように、プロテアーゼ、例えばTEVプロテアーゼまたはHRV3Cプロテアーゼによって認識されるアミノ酸配列を、親和性タグとCse2サブユニットの天然のN末端との間に挿入してもよい。また、親和性タグを、他のサブユニット上に配置してもよいし、Cse2サブユニット上に残してもよく、そして他のサブユニット上の更なる親和性タグと組み合わせてもよい。親和性タグを含む例示的なカスケードサブユニットタンパク質が、実施例1、実施例2、実施例3A、実施例3B、および実施例3Cに示されている。
I−E型カスケード系について、大腸菌(E.coli)の株を、CRISPR RNAおよびcse2−cas7−cas5−cas6遺伝子をコードするプラスミドで形質転換して、タンパク質発現を誘導することができ、Cas8サブユニットを欠いているカスケード複合体を生成することができる。このカスケード複合体は、典型的に、Cas8−マイナスカスケード複合体と呼ばれ、または代わりに、CasBCDE複合体と呼ばれる(例えば、Jore,M.ら、Nat.Struct.Mol.Biol.18巻:529〜536頁(2011年)参照)。この精製された複合体を、別に精製されたCas8と生化学的に組み合わせて、完全カスケードを再構成することができる(例えば、Sashital,D.G.ら、Mol.Cell 46巻:606〜615頁(2012年)参照)。
表6は、最小CRISPRアレイ、cas8、cse2−cas7−cas5−cas6構築体およびcas8−cse2−cas7−cas5−cas6構築体をコードし、異なるタグおよび設計を含有する細菌発現プラスミドの例示的な配列を示す。カスケード複合体をコードするプラスミド、および相同I型系由来のカスケード複合体を、同様に、本明細書のガイダンスに従って、大腸菌(E.coli)K−12 MG1655において見出されるI−E型についての例示的な発現プラスミド配列として設計することができる。表6は加えて、遺伝子編集実験用のヌクレアーゼ−カスケード融合体の生成のための、Cas8−Cse2−Cas7−Cas5−Cas6タンパク質を発現する発現プラスミドの配列、およびcas8遺伝子またはcas6遺伝子のいずれかへのFokI融合を含有する。
表7は、5つ全てのサブユニットタンパク質を、単一の細菌発現プラスミド由来のcrRNAと一緒にコードする単一のポリプロモーター細菌発現プラスミドの配列を含有する。この設計において、各遺伝子は、転写プロモーターおよびターミネーターを有する上流および下流に隣接する他の遺伝子から分離されている。親和性タグおよび/またはプロテアーゼ認識タグ、ならびにヌクレアーゼタンパク質への融合をコードする更なる配列を導入して、遺伝子編集用のカスケード−ヌクレアーゼ融合体を生成することができる。
本明細書中の設計基準に基づいて他のI型サブタイプおよび他の細菌または古細菌生物由来の相同カスケード複合体をコードする更なる細菌発現プラスミドを設計することができる。そのような発現プラスミドは、カスケード遺伝子用のgDNA配列で設計することもできるし、大腸菌(E.coli)または他の細菌の株内での発現用にコドン最適化した遺伝子配列で設計することもできる。
哺乳動物細胞、例えばヒト細胞内でカスケードまたはカスケードへのエフェクター融合体を発現させるために、真核生物発現プラスミドベクターを、関連するタンパク質およびRNA構成要素の発現を真核生物の転写および翻訳機構によって可能にするように設計した。一実施形態において、カスケードは、真核生物プロモーター(例えば、サイトメガロウイルス(CMV)プロモーター)によって駆動される別個の発現ベクター上に各タンパク質構成要素をコードし、そしてRNAポリメラーゼIIIプロモーター(例えば、ヒトU6プロモーター)によって駆動される別個の発現ベクター上にcrRNAをコードすることによって、哺乳動物細胞内で生成することができる。CRISPR RNAは、成熟crRNAのガイド部分として機能する1つまたはそれ以上のスペーサー配列に隣接する少なくとも2つのリピートを含有する最小CRISPRアレイと共にコードすることができる。CRISPR RNAを生成する構築体は、最小アレイ内の最も外側のリピートに隣接する更なる配列で設計することができる。前駆体CRISPR RNAのプロセシングが、別個のプラスミドから発現させることができる、カスケード複合体(Cas6サブユニットタンパク質)のRNAプロセシングサブユニットによって可能となる。
表8は、大腸菌(E.coli)I−E型カスケード複合体の各タンパク質用の個々の真核生物発現プラスミドの配列を含有する。Cas8サブユニットは、更なるエフェクターヌクレアーゼドメイン、例えばFokIヌクレアーゼに融合させることができる(実施例1、実施例3A、実施例3B、および実施例3C)。また、表8は、2つの別個のcrRNAをコードすることによって、3つのリピート配列が2つのスペーサーに隣接する、カスケードのcrRNA構成要素用の発現プラスミドの配列を含有する。核局在化シグナル(NLS)、親和性タグ、および当該タグを連結するリンカー配列を添えるポリヌクレオチド配列に、各タンパク質コード遺伝子を添えてもよい。いずれかのカスケードサブユニットタンパク質への他の融合を、典型的に、カスケードサブユニットタンパク質を注目する更なるポリペプチド配列に連結するアミノ酸リンカーをコードする更なるポリヌクレオチド配列が挙げられる、5’または3’コード配列に添えられている更なるポリヌクレオチド配列によって、コードすることができる。候補融合タンパク質の例が、本明細書中に記載されている。
より少ない発現ベクター上でカスケード複合体の構成要素を発現させるために、ポリシストロン性発現ベクターを構築することによって、単一のプロモーター(例えば、CMVプロモーター)が、トセア・アシグナ(Thosea asigna)ウイルス2A配列によって分離される複数のコード配列の発現を同時に駆動することができる。2Aウイルスペプチド配列は、リボソームスキップを誘導して、複数のタンパク質コード遺伝子を、真核細胞内での発現用の単一のポリシストロン性構築体内に連結することを可能にする。ゆえに、単一のプロモーターによって駆動される単一の転写産物上にカスケード複合体の4つまたは5つのタンパク質サブユニットをコードするポリシストロン性ベクターを設計することができる。表9は、CRISPR RNA発現プラスミドと組み合わされて、哺乳動物細胞内で機能的カスケードを生成することができる真核生物ポリシストロン性発現プラスミドの配列を含有する。
一部の実施形態において、CRISPR RNAは、タンパク質コード遺伝子の3’非翻訳領域(UTR)内にコードされており、その発現は、RNAポリメラーゼIIプロモーター(例えば、CMVプロモーター)によって駆動されて、転写産物を生成する。そのような実施形態において、最小CRISPRアレイは、タンパク質コード遺伝子、例えばCas6、Cas7、またはリポータ遺伝子(例えば、増強緑色蛍光タンパク質、eGFP)の下流に存在するように設計されており、そして上流の転写産物に安定性を付与することが以前に示されたMALAT1三重鎖配列によって、タンパク質コード配列から分離されている。最小CRISPRアレイは、(典型的に、異なるプラスミドを用いて発現される)カスケードのRNAプロセシングサブユニット(最小CRISPRアレイを切断するエンドヌクレアーゼ)によってプロセシングされ、切断が、転写産物中に導入され、そして三重鎖配列は、上流のタンパク質コード遺伝子の3’末端を、早期のエキソヌクレアーゼによる分解から保護する。表10は、3つのポリヌクレオチド配列を含有し、それにより、CRISPRアレイは、Cas6、Cas7、またはeGFPの下流でクローニングされ、そして融合配列全体の発現は、CMVプロモーターによって駆動される。
一部の実施形態において、CRISPR RNAアレイは、five5カスケードサブユニットタンパク質の発現を駆動するポリシストロン性構築体と同じベクター上にコードされる;これらの2つの要素の組合せは、カスケード複合体の機能的サブユニットの全て(タンパク質およびRNAの双方)を、カスケードサブユニットの1つに融合したあらゆるヌクレアーゼまたはエフェクタードメインと一緒に生成するオールインワンベクターを生成する。表11は、哺乳動物細胞内で機能的FokI−カスケードRNPを生成するための、それぞれの構成要素を全てコードする当該オールインワンポリヌクレオチド配列の2つの代表的な配列を含有する。
実施例3A、実施例3B、および実施例3Cは、各カスケードサブユニットタンパク質および最小CRISPRアレイを発現する別個のプラスミドを用いる発現系、複数のカスケードサブユニットタンパク質コード配列が、単一のプロモーターから発現される発現系、および単一のプラスミドカスケード発現系が、哺乳動物細胞に用いられるcas8−cse2−cas7−cas5−cas6オペロンおよび最小CRISPRアレイの全体を発現するように構築された発現系を記載している。
当業者であれば、本明細書のガイダンスに従って、大腸菌(E.coli)I−E型カスケード複合体が提供される例と同様に、他のカスケード複合体をコードする更なる哺乳動物発現ベクターを設計することができる。
第4の態様において、本発明は、宿主細胞中への操作されたI型CRISPR−Casエフェクター複合体の1つまたはそれ以上の構成要素をコードするプラスミドの導入による、操作されたI型CRISPR−Casエフェクター複合体の生成に関する。形質転換された宿主細胞(または組換え細胞)、または組換えDNA技術を用いて形質転換もしくは形質移入された細胞の後代は、操作されたI型CRISPR−Casエフェクター複合体の1つまたはそれ以上の構成要素をコードする1つまたはそれ以上の核酸配列を含み得る。宿主細胞中にポリヌクレオチドを導入する方法(例えば、発現ベクター)が、当該技術において知られており、典型的に、宿主細胞の種類に基づいて選択される。そのような方法として、例えば、ウイルスまたはバクテリオファージ感染、形質移入、コンジュゲーション、エレクトロポレーション、リン酸カルシウム沈殿、ポリエチレンイミン媒介形質移入、DEAEデキストラン媒介形質移入、プロトプラスト融合、リポフェクション、リポソーム媒介形質移入、パーティクルガン技術、マイクロプロジェクタイル砲撃、直接的マイクロインジェクション、およびナノ粒子媒介送達が挙げられる。本発明の一実施形態において、操作されたI型CRISPR−Casエフェクター複合体の構成要素をコードするポリヌクレオチドが、細菌細胞(例えば、大腸菌(E.coli))中に導入される。
実施例4Aおよび実施例4Bは、Cas8タンパク質コード配列、および操作されたI型CRISPR−Casエフェクター複合体の、大腸菌(E.coli)発現系を用いた細菌生産のための、そのような複合体の構成要素についてのコード配列の導入および発現の方法を記載している。
本明細書中で開示される種々の例示的な宿主細胞は、操作されたカスケードエフェクター複合体を用いて組換え細胞を生産するのに用いることができる。そのような宿主細胞として、以下に限定されないが、植物細胞、酵母細胞、細菌細胞、昆虫細胞、藻類細胞、および哺乳動物細胞が挙げられる。
考察を容易にするために、「形質移入」は、以下で、宿主細胞中にポリヌクレオチドを導入するあらゆる方法に言及するのに用いられる。
一部の実施形態において、宿主細胞が、I型CRISPR−Casエフェクター複合体の1つまたはそれ以上の構成要素をコードする核酸配列で一過的に、または非一過的に形質移入される。一部の実施形態において、細胞が、対象において本来存在するかの如く、形質移入される。一部の実施形態において、形質移入される細胞、例えば一次細胞または前駆体細胞が、最初に、対象から取り出される。一部の実施形態において、一次細胞または前駆体細胞は、培養され、かつ/またはイクスビボ形質移入の後に、同じ対象または異なる対象に戻される。
操作されたI型CRISPR−Casエフェクター複合体の発現および精製は、大きな労働力を要するので、多数のガイドポリヌクレオチドまたはエフェクター複合体バリアントにわたるスクリーニングを促進するために、より高いスループットのプラスミドベースの送達系を設計した。5つのCas遺伝子の各々を、ヒトコドン最適化して、N末端NLS融合体としてCMV駆動発現プラスミドにクローニングし、そしてT細胞受容体アルファ遺伝子座(UCSCゲノムブラウザ、hg38)のTRAJ27エクソンを標的化する対形成されたgRNAを含有する最小CRISPRアレイを、ヒトU6プロモーターの下流にある、第6のプラスミドにクローニングした(実施例3A;図35)。図35において、構成要素の順序は、左から右に、以下の通りである:hu6プロモーター、末端が菱形の灰色の矩形;リピート1、空白の(白色の)菱形;スペーサー1、灰色のワッフル様矩形;リピート2、灰色の菱形;スペーサー2、灰色の点画矩形;およびリピート3、黒色の菱形。図35において、ブラケットは、2つのgRNAをコードする領域を示す。一部の実施形態において、2つのガイドRNAは、同じであってよく(例えば、同じ核酸標的配列を標的化する)、そして他の実施形態において、2つのガイドRNAは、相異してもよい(例えば、2つの異なる核酸標的配列を標的化する)。
ほとんどのI型系におけるgRNAプロセシングが、カスケード内に存在するCas6リボヌクレアーゼによって自然に触媒されて(例えば、Brouns,S.J.ら、Science 321巻:960〜964頁(2008年);Hochstrasser,M.ら、Trends Biochem.Sci.40巻:58〜66頁(2015年)参照)、本明細書中で示される対形成gRNAアプローチにより、複数のプロモーターが不要となる。したがって、本発明の一実施形態は、対形成されたガイドポリヌクレオチドを含むベクターを含み、当該ガイドポリヌクレオチドが、調節要素に作動可能に連結されて、ガイドポリヌクレオチド(例えば、gRNA)の発現を実現する。6−プラスミドの共形質移入が、TRAJ27遺伝子座での最大約3%の編集をもたらし、そしていずれか1つの構成要素の除去が、ゲノム編集を排除した(唯一の例外がCas11)。大腸菌(E.coli)カスケードエフェクター複合体は、DNA結合を絶対に必要とするわけでない(例えば、Westra,E.ら、RNA Biol.9巻:1134〜1138頁(2012年)参照)。
本発明の別の実施形態において、2つのガイド配列を典型的に含む最小CRISPRアレイが、細胞または生化学反応中にDNA鋳型として導入される。DNA鋳型は、PCR増幅によって生成される(例えば、図42A;実施例20A)。そのような最小CRISPRアレイは、カスケード複合体タンパク質構成要素をコードする1つまたはそれ以上のプラスミドにより、細胞中に導入することができる。一部の実施形態において、対形成されたガイドポリヌクレオチドを含む最小CRISPRアレイおよびベクターは双方とも、細胞または生化学反応中に導入することができる。2つのカスケードRNP複合体を用いる方法(例えば、核酸標的配列に結合する方法、または核酸標的配列を切断する方法;例えば、図15A、図15B、図15C参照)において、最小CRISPRアレイは、2つの異なるガイドをコードしてよい。したがって、一部の実施形態において、2つのガイドRNAは、異なってよい(例えば、2つの異なる核酸標的配列を標的化する)。単一のカスケードRNP複合体を用いる方法(例えば、mCas3タンパク質と会合したI型CRISPR−Casエフェクター複合体、またはCas3融合タンパク質が複合体と会合しているI型CRISPR−Casエフェクター複合体を用いる場合;例えば、図16A、図17B、図17C、図21A、図21B、図21C、図21D参照)において、最小CRISPRアレイが、2コピーの同じガイド配列をコードしてよい。したがって、一部の実施形態において、2つのガイドRNAは、同じであってよい(例えば、同じ核酸標的配列を標的化する)。
さらに別の実施形態において、crRNA前駆体の、成熟ガイドRNAへのヌクレオチド鎖切断的プロセシングのための、Cas6タンパク質によって認識される配列および構造をさらに含むガイド配列をコードするポリヌクレオチドを、細胞または生化学反応中に導入してよい。他の実施形態において、プロセシングを必要としない成熟ガイドポリヌクレオチドを、カスケード複合体のアセンブリーに用いてもよい。そのような成熟ガイドは、配列修飾(例えば、例えばRNaseによる、ヌクレアーゼ消化からガイドを保護する一助となるような、5’および/または3’末端でのホスホロチオエート結合)を含んでもよい。更なるガイド修飾として、ヌクレオチド配列(例えば、ヌクレオチド類似体等)について本明細書中に記載されるものが挙げられる。
実施例9A、実施例9B、実施例9C、および実施例9Dは、ヒト細胞内でゲノム編集を促進するような、FokI融合タンパク質を含む大腸菌(E.coli)I−E型カスケード複合体の設計および送達を示す。実施例9Bは、カスケード複合体構成要素を発現するプラスミドベクターの、真核細胞中への送達を記載している。第5の態様において、本発明は、細胞からの、操作されたI型CRISPR−Casエフェクター複合体の精製、およびそのような複合体の使用に関する。操作されたI型CRISPR−Casエフェクター複合体が、宿主細胞内で生成される。操作されたI型CRISPR−Casエフェクター複合体(この場合、カスケードRNP複合体)は、細胞溶解液から精製される。
実施例5Aおよび実施例5Bは、実施例4Bに記載されるように、細菌内での過剰発現によって生成される大腸菌(E.coli)I−E型カスケードRNP複合体の精製を記載している。当該方法は、固定化金属親和性クロマトグラフィーに続いてサイズ排除クロマトグラフィー(SEC)を用いる。実施例5Aおよび実施例5Bは、精製されたカスケードRNP生成物の品質を評価するのに用いることができる方法を記載している。Cas8、Cas7、Cas6、Cas5、およびCse2カスケードRNP複合体、Cas7、Cas6、Cas5、およびCse2タンパク質、ならびにFokI−Cas8融合タンパク質を含むカスケード複合体の精製を示す実施例が示される。
また、精製された、操作されたI型CRISPR−Casエフェクター複合体は、生化学アッセイ(例えば、結合および/または切断アッセイ)に直接用いることができる。実施例6A、実施例6B、および実施例6Cは、インビトロDNA結合または切断アッセイに用いられるdsDNA標的配列の生成を記載している。実施例6は、合成ssDNAオリゴヌクレオチドのアニーリング、gDNAから選択された核酸標的配列のPCR増幅、および核酸標的配列の、細菌プラスミド中へのクローニングを含む、標的配列を生成する3つの方法を記載している。dsDNA標的配列を、カスケード結合または切断アッセイに用いた。
1つまたはそれ以上の操作されたI型CRISPR−Casエフェクター複合体の部位特異的結合および/または当該複合体による切断は、必要ならば、電気泳動運動能シフトアッセイ(例えば、Garner,M.ら、Nucleic Acids Res.9巻:3047〜3060頁(1981年);Fried,M.ら、Nucleic Acids Res.9巻:6505〜6525頁(1981年);Fried,M.,Electrophoresis 10巻:366〜376頁(1989年);Fillebeen,C.ら、J.Vis.Exp.(94),e52230,doi:10.3791/52230(2014年)参照)、または実施例7に記載される生化学切断アッセイを用いて確認することができる。
実施例7において示されるデータは、操作されたI型CRISPR−Casエフェクター複合体が、超コイル化された、環状プラスミド基質の、切断された、直鎖状形態への変換によって明示されるように、ほぼ定量的なDNA切断を示すことができることを実証している。操作されたI型CRISPR−Casエフェクター複合体(例えば、FokI−カスケード構成要素融合タンパク質を含む)によるロバストな生化学活性を実証した後に、細胞内でのゲノム編集を実行した。
実施例8A、実施例8B、実施例8C、および実施例8Dは、Casサブユニットタンパク質−FokI融合タンパク質を含む大腸菌(E.coli)I−E型カスケード複合体の設計、およびヒト細胞への送達を示す。実施例8Dにおけるデータは、予めアセンブルされたカスケードRNPの、標的細胞中への送達、およびヒト細胞内での有効なゲノム編集を実証している。
精製された、操作されたI型CRISPR−Casエフェクター複合体は、細胞中に直接導入することができる。細胞中に構成要素を導入する方法として、エレクトロポレーション、リポフェクション、パーティクルガン技術、およびマイクロプロジェクタイル砲撃が挙げられる。
図36A、図36B、図36C、および図36Dは、操作されたカスケード−RNP複合体、および操作されたI型CRISPR−Cas複合体のプラスミドベースの送達を用いて、ヒト細胞内でのゲノム編集についての比較データを示す。図36A〜図36D、図36Aにおいて、HEK293細胞を、精製されたRNPで形質移入してから、編集された部位を次世代シーケンシング(NGS)で分析した。図36A(RNP形質移入)に示されるように、2つの隣接した遺伝子座を標的化するFokI−カスケードRNP複合体(図36A、図の左側、直線よりも上に示す)を、HEK293細胞(図36A、灰色の星型、図の左側)中にヌクレオフェクト(nucleofect)して、DNA切断およびゲノム編集を誘導した。16個のユニークなゲノム標的部位(実施例6C、表31、Human Dual Hsa1−16参照)での編集効率を算出した(n=1)。TRACは、T細胞受容体の定常領域である。T細胞受容体は、生成される場合、スプライス接合部(すなわち、「可変」領域および「結合」領域)を含む。本明細書中に記載されるTRACガイドのいくつかは、結合領域(例えば、TRAJ27)を標的化する。各標的についてのスペーサー間距離が、グラフの下方に示されている(図36A、左から右に、25、30、35、40、45塩基対(bp))。図36Aにおいて、垂直軸は、編集効率パーセント(図36A、編集効率(%))であり、水平軸は、標的1〜16を表し、そして水平軸の下方には、スペーサー間長を塩基対(bp)で示すブラケットがある。
図36Bは、図36A内の標的7についての代表的なDNA修復結果を示す。図36Bにおいて、対形成されたgRNAによって標的化される半部位の相対位置が、それらの関連PAM部位と共に、図の最上位に示されている。スペーサー間距離が、頂部の線によって示されている。グラフにおいて、予想される切断部位(図36B、垂直な黒色の中央線として示される位置「0」)およびbp距離(−50〜50)が、最上部にて示される。灰色の各水平線が、標的遺伝子座にて観察された、配列決定されたリードの異なるクラスを表す。これらの線についてのインジケータは、以下の通りである:灰色の領域=配列マッチ;黒色の水平線=欠失;そして空白のボックス=挿入。円が、各線によってグラフの右側に位置決めされている:黒色の円は、野生型リードである;そして空白の白色の円は、突然変異リードである。予想される野生型リードが、第1の灰色のバー(「Ref」;すなわち、基準配列)で示されている。野生型リードが、第2の灰色のバー(第2の灰色のバー;図36B、黒色の円)で示されている。次の11本の線が、突然変異リード(図36B、空白の円)を示す。挿入長(塩基対の数で与えられる)が、円の右側のカラムに示されている。リードの合計パーセントが、右側の次のカラムに示されており、そして総リードが、右側の最後のカラムに示されている。
図36C(6−プラスミド形質移入系)に示されるように、HEK293細胞(図36C、灰色の星型、図の左側)を、6つのプラスミドで形質移入した。5つのプラスミドが、Casタンパク質(図36C、FokI−Cas8、Cas11、Cas7、Cas5、およびCas6として示されるプラスミド)をコードしており、そして1つのプラスミドが、対形成されたgRNAをコードしており、これらは、CMVおよびヒトU6(hU6)プロモーターの制御下にあった(図36C、gRNA)。その後、編集された部位を、NGSで分析した。FokI−カスケードRNP複合体の実例が、破線の下方にある。図36Aから標的7での編集効率を算出し(n=2)(図36A、グラフ内の黒色のバー)、そして単一の構成要素を欠くプラスミド混合物(図36C、水平軸の下方、−/+を含有する灰色のボックス)を、対照として含めた(図36C、グラフ内の空白のバー)。
図36D(2−プラスミド形質移入系)に示されるように、HEK293細胞(図36D、灰色の星型、図の左側)を、対形成されたgRNA発現プラスミド(図36D、gRNAプラスミド)、およびT2A「リボソームスキップ」配列ペプチド(図36D、CMV−Cas7−2A−Cas11−2A−Cas5−2A−Cas6−2A−FokI−Cas8)によって分離されている5つのタンパク質を全てコードするポリシストロン性発現プラスミドで形質移入した。その後、編集された部位を、NGSで分析した。FokI−カスケードRNP複合体の実例が、破線の下方にある。図36Aに示される16の標的での編集効率を、2−プラスミド系形質移入(図36D、空白のバー)、および図37C(n=3)由来の6−プラスミド系形質移入(図36D、黒色のバー)の双方について、算出した。図36Dにおいて、垂直軸は、編集効率パーセント(「編集効率(%))であり、水平軸は、標的1〜16を表し、そして水平軸の下方には、スペーサー間長を塩基対(bp)で示すブラケットがある(図36D、左から右に、25、30、35、40、45bp)。
FokIおよびCas6上に核局在化シグナル配列を含有する精製されたカスケード−RNPでHEK293細胞をヌクレオフェクトすることによって、実験を実行した。gDNAから得たPCRアンプリコンの次世代シーケンシングによって明示されるように、最大約4%の編集効率が観察された。試験した16の標的部位の間で、編集は、典型的に、30bpのスペーサー間長を含有する部位にあった(図36A)。修復結果のスペクトルをより綿密に調べると、インデルが、インタースペーサーの中央に密集し(図36B)、I型CRISPR−Cas複合体の設計と一致することが明らかとなった。したがって、本発明の一実施形態において、操作されたI型CRISPR−Cas複合体は、細胞中に直接導入される。6−プラスミド送達実験(図36C)について、1つを除いて、420ngの各プラスミドを含有するプラスミド混合物をアセンブルしてから、陰性対照としての水または700ngの欠失プラスミドのいずれかを、ヌクレオフェクション以降に再添加した。最初のFokI−EcoCascadeポリシストロン性2−プラスミド送達実験(図36D)について、細胞を、500ngの各プラスミドまたは500ngの対形成されたgRNA発現プラスミド、および2.5μgのポリシストロン性プラスミド(各条件について、合計3μg)でエレクトロポレーションした。一実施形態において、5つのcas遺伝子を全て、T2A「リボソームスキップ」配列によって連続的に連結された単一のポリシストロン性発現ベクター(図36D)に構築した(例えば、Kim,J.ら、PLoS ONE 6,e18556(2011年);Liu,Z.ら、Sci.Rep.7巻:2193頁(2017年)参照)。驚くべきことに、ポリシストロン性プラスミドおよび対形成されたgRNA発現プラスミドによる共形質移入は、6−プラスミド法(実施例9A)および直接的RNP送達法(実施例8A、実施例8B、実施例8C、実施例8D)の双方で観察されたものと類似の編集効率およびDNA修復結果をもたらし、生化学的に活性な操作されたI型CRISPR−Casエフェクター複合体をアセンブルして、ヒト細胞内の核に送られているという結論を支持した。まとめて、これらの実験は、広く用いられているCas9およびsgRNAプラスミドと大きさが類似するたった2つの分子構成要素による、真核細胞における、複雑な、11−サブユニットRNAガイドヌクレアーゼを再構成する、大いに単純化された発現系を証明した。
操作されたI型CRISPR−Cas複合体(大腸菌(E.coli)(EcoCascade、シュードモナス(Pseudomonas)属種S−6−2(PseCascade)、およびストレプトコッカス・サーモフィルス(Streptococcus thermophilus)(SthCascade))についてのデータは、双方の半部位、要求されるスペーサー間距離、および許容PAMを含むに違いないことから、ほとんどの標的部位がユニークなであろうということを示唆した。EcoCascade、PseCascade、およびSthCascade由来の操作されたカスケード相同体を、より詳細な特性評価のために選択した。
図37A、図37B、図37C、および図37Dは、FokIリンカー、スペーサー間長、およびカスケード相同体に関する編集効率を示す。図37AのFokI−EcoCascade編集効率を、FokI−Cas8リンカー長(図37A、空白の円、低い線、10aa;空白の円の上方のグラフ線、20aa;黒色の円、17aa;および灰色の円、30aaのリンカー長)およびスペーサー間距離の関数として示す。図37Aにおいて、垂直軸は、編集効率(%)であり、水平軸は、bpのスペーサー間距離である。各データポイントは、3〜4個のユニークな標的部位の平均を表す。
図37Bは、30aaリンカーを有するFokI−カスケードヌクレアーゼを示す。FokI−Cas8リンカーを、12個のI−E型カスケードバリアントについて生成し、そして4〜7個の標的部位でのゲノム編集について試験した。各データポイントは、単一のゲノム部位を表し、そしてバーは、部位間の平均および標準偏差(s.d.)を示す。標的は、AAG(図37B、灰色のバー)またはGAA(図37B、白色のバー)PAM配列のいずれか、および30bpのスペーサー間距離を含有し、種は、以下のように、水平軸上にある:Eco、大腸菌(E.coli);Pse、シュードモナス(Pseudomonas)属種S−6−2;Sen、サルモネラ・エンテリカ(Salmonella enterica);Geo、ゲオサーモバクター(Geothermobacter)属種EPR−M;Mar、メタノケッラ・アルボリザエ(Methanocella arvoryzae);Ahe、アトランティバクター・ヘルマンニ(Atlantibacter hermannii);Oce、オセアニコラ(Oceanicola)属種HL−35;Pae、緑膿菌(Pseudomonas aeruginosa);Sth、ストレプトコッカス・サーモフィルス(Streptococcus thermophilus);Str、ストレプトミセス(Streptomyces)属種S4;Kpn、クレブシエラ・ニューモニエ(Klebsiella pneumoniae);Lba、ラクノスピラ菌(Lachnospiraceae bacterium)。
図37Cにおいて、FokI−PseCascadeデータが示されており、垂直軸は、編集効率パーセント(図37C、編集効率(%))であり、水平軸は、塩基対(bp)のスペーサー間長を示す。FokI−Cas8リンカー長は、17アミノ酸であった。各データポイントは、単一のゲノム部位を表し、そしてバーは、7〜8個の部位間の平均およびs.d.を示す。
図37Dは、PAM配列の関数としてのFokI−PseCascade編集効率についてのデータを示しており、垂直軸は、編集効率パーセント(図37D、編集効率(%))であり、水平軸は、PAM配列に相当する(図37D、左から右に、CCG、CGC、AAG、AAA、ATG、AAC、AGG、ATA、GAG、およびAAT)。ゲノム部位は、水平軸上に示すように、第2の半部位にて1つのAAG PAMおよび可変PAMを含有した。各データポイントは、単一のゲノム部位を表し、そしてバーは、6〜15個の部位間の平均およびs.d.を示す。
図37Eは、PAM配列の関数としてのFokI−EcoCascade編集効率(図37E、垂直軸、編集効率(%))についてのデータを示している。標的部位は、水平軸(図37E、左から右に、CCG、CGC、AAG、AGG、ATG、GAG、AAA、AAC、ATA、およびAAT)上で示されるように、第2の半部位にて固定AAG PAMおよび可変PAMを含有した。各ドットは、HEK293細胞内の単一の標的部位を表し、そしてPAMあたり6〜15個の部位(部位あたりn=1)を試験した。棒グラフは、平均およびs.d.を表す。
図37Fは、PAM配列の関数としてのFokI−SthCascade効率(図37F、垂直軸、編集効率(%))についてのデータを示している。標的部位は、水平軸(図37F、左から右に、CC、AA、GA、TA、およびCA)上で示されるように、第2の半部位にて固定GAA PAMおよび可変PAMを含有した。各ドットは、HEK293細胞内の単一の標的部位を表し、そしてPAMあたり18〜33個の部位(部位あたりn=1)を試験した。棒グラフは、平均およびs.d.を表す。
図37Gは、図37Cおよび図37D由来の高い編集効率(10〜53%)を示す40個のゲノム部位についてのインデルクラス頻度を表すヒートマップを示す。0〜60の編集効率パーセントが、最上部パネルにおいて棒グラフで示されている。1〜8bpの挿入長が、中央のパネルに示されるヒートマップで示されており、そして1〜50bpの欠失長が、下部パネルにおいてヒートマップで示されている。40個のゲノム標的部位(図37G、標的)が、水平軸上に示されている(1〜40)。単一のbp挿入が、ヌクレオチド同一性によって分けられており、そして図の底部のグレイスケール強度スケールが、挿入頻度パーセンテージ(図37G、Ins Freq(%)、スケールは0〜20以上である)、および欠失頻度パーセンテージ(図37G、Del Freq(%)、スケールは0〜20以上である)に相当する。右の棒グラフは、各インデルクラスの平均頻度(図37G、スケールは0〜20である)を表す。右の円グラフは、切断部位に隣接する配列の重複を含有するものとしてここで定義される、推定の鋳型修復(図37G、円グラフの黒色の領域)に由来する2〜4bpの挿入のフラクションを示す。「他」は、円グラフの灰色の領域内に表されている。
5つの最も高度に編集されたFokI−PseCascade標的部位(約20〜48%の編集)についてのヒトゲノム内の最も密接に関連した部位を調査した(30〜33bpのスペーサー間必要条件によってのみ拘束される)。5つ全ての標的にわたって、双方の半部位間でミスマッチが<22個の部位は、同定されなかった。FokI−EcoCascade FokI−Cas8リンカー型およびスペーサー間距離実験(図37A)について、細胞を、2.4μgのFokI−EcoCascadeポリシストロン性プラスミドおよび約0.5〜3.5μgの対形成されたgRNA発現プラスミドでヌクレオフェクトした。
FokI−カスケード相同体スクリーン(図37B)について、細胞を、1.5μgのFokI−カスケードポリシストロン性プラスミドおよび約0.4〜2.2μgの対形成されたgRNA発現プラスミドでヌクレオフェクトした。相同体間で、4〜7個の部位が標的化され、そしてFokI−EcoCascadeによる高い編集効率を示した部位を選択した。相同体バリアントFokI−Cas8リンカー型およびスペーサー間距離編集実験(図37Cおよび図41A〜図41C)について、細胞を、5μgのポリシストロン性プラスミドおよび約100〜400ngの対形成されたオリゴ鋳型gRNA発現アンプリコンでヌクレオフェクトした。この実験について、gRNA濃度は、ウェルまたは相同体バリアント間で標準化しなかった。加えて、図41A〜図41Cについて、細胞を、FokI−EcoCascadeまたはFokI−SthCascade gRNAよりも平均して約1.5×多いFokI−PseCascade gRNAでヌクレオフェクトした。
オリゴ鋳型PCR増幅が、本明細書中で記載されている(例えば、実施例20A)。哺乳動物細胞内でのヒトU6(hU6)プロモーター(図42A、420)由来の対形成されたgRNA発現用のアンプリコンを生成するためのオリゴ鋳型PCR戦略が、図42Aおよび図42B内に示されている。手短に言うと、内側リバースオリゴヌクレオチド(図42A、424)は、双方のgRNA配列をコードし、そして新しい標的部位について改変されている(「リピート−スペーサー−リピート−スペーサー−リピート」配列をコードするユニークなプライマーとも呼ばれる(図42A、421:リピート、空白の矩形;スペーサー1、灰色の矩形;リピート、空白の矩形;スペーサー2、灰色の矩形;リピート、空白の矩形))が、残りのプライマーは不変である(図42A:外側のフォワードプライマー、422;内側のフォワードプライマー、423;外側のリバースプライマー、425)。FokI EcoCascade RNP複合体および対形成されたgRNA発現プラスミドまたは対形成されたgRNA発現アンプリコンのいずれかをコードするポリシストロン性プラスミドでHEK293細胞を共形質移入した後の標的7での編集効率(図36B参照)が、図42Bに示されている。図42Bにおいて、垂直軸は、編集効率(%)であり、そして水平軸は、対形成されたgRNAカセット(ng)である。データポイントは、以下の通りである:FokI−EcoCascade RNP複合体(ng)、対形成されたgRNAプラスミド、対形成されたgRNAアンプリコン;それぞれ375、空白の三角形、空白の円;750、黒色の三角形、黒色の円;1,500、灰色の三角形、灰色の円;3,000、白色の線入りの黒色の三角形、白色の線入りの黒色の円。図42B内のデータは、対形成されたgRNA発現プラスミドに対して、対形成されたgRNA発現アンプリコンについて、編集効率が高くなければ、匹敵することを実証している。
PAMスクリーン(図37D、図37E、図37F、図39A〜図39D、図40C、および図40F)のために、典型的に、細胞を、3μgのFokI−カスケードポリシストロン性プラスミド、および(特に明記しない限り)150ng(FokI−PseCascadeおよびFokI−EcoCascade)または約80〜120ng(FokI−SthCascade)のいずれかの対形成されたオリゴ鋳型gRNA発現アンプリコンでヌクレオフェクトした。
特異性分析(図38A〜図38C)のために、細胞を、3μgのポリシストロン性カスケードおよび150ngの対形成されたオリゴ鋳型gRNA発現アンプリコンでヌクレオフェクトして、ヌクレオフェクションの5日後に収穫した。図38Aの最上位にて、水平の線は、スペーサー間距離を示し、鋏は、予想される切断部位を示し、そして対応するPAM領域(図38A、末端をコントラストで引き立たせている矩形のボックス)を有するゲノム標的の半部位が示されている。示される半部位の、標的との関係が、破線によって示されている。各標的について、32の塩基対が示されており、そしてPAM領域が、シード配列に隣接して示されている。図38Aは、グリッド内の塗り潰されたボックス(PAM部位を除外する)によって表されるように、ゲノム標的内で1つまたは双方の半部位へのミスマッチを含有するように設計された、対形成されたgRNAを示す。なお、双方の半部位は、分かり易くするために、方向性を同じにして表している。図38Bは、完全にマッチするgRNAについての編集効率のパーセンテージとしてプロットされた、ミスマッチ対形成gRNAの各組合せについてのゲノム標的70での相対編集効率を示す。図38Bにおいて、頂部の線は、標的(図38B、標的70)を示し、次の行はガイド(図38B、gRNA1およびgRNA2)を表し、次の行はミスマッチのセット(図38B、mmセット1およびmmセット2)を特定しており、次の行はFokI−カスケードRNP複合体を示している。左側の列は、相対編集ガイド1−mmセット1/ガイド2−mmセット2についての、右側の列は、ガイド1−mmセット2/ガイド2−mmセット1についてのデータを示し、双方のデータの列は、相対編集効率パーセント(図38B、相対編集eff(%);スケール0〜100)を示し、すなわち、左側の列は、ミスマッチ(mm)セット1および2を有するgRNA1およびgRNA2についてのデータを示し、そして右側の列は、同じであるが、gRNA1とgRNA2との間でミスマッチ(mm)セットが交換された標的についてのデータを示す(n=1)。図38Cは、標的73での編集効率を示しており(n=1)、図38B内のように表されている。
対形成されたgRNA発現カセットをオリゴ鋳型PCR増幅によって生成するスケーラブルな方法(本明細書中で記載される)(労働力を要するクローニング工程の必要を除外した)を開発した後に、FokIリンカーおよびDNAスペーサー間長を、各相同体バリアントについて、96個のゲノム標的部位のパネルにわたって再スクリーニングした。17−aaリンカーにより、FokI−PseCascadeは、おおよそ30〜33bpのスペーサー間ウィンドウ内で平均約15〜25%の編集効率を一貫してもたらし、そして一部の標的は、最大約40〜50%のインデルを示した(図37C)。類似の傾向が、他の相同体で観察された。PAM必要条件を、1つのコグネイトPAMおよび第2の突然変異PAMを保有するゲノム部位を標的化することによって調査した。PAM認識は、インビトロで、厳格な5’−GG−3’化膿連鎖球菌(S.pyogenes)PAM必要条件よりもはるかにプロミスキャスであることが示されてきた(例えば、Szczelkun,M.ら、Proc.Natl.Acad.Sci.USA 111巻:9798〜9803頁(2014年);Hayes,R.ら、Nature 530巻:499〜503頁(2016年);非特許文献13;Fineran,P.ら、Proc.Natl.Acad.Sci.USA 111巻:E1629〜E1638頁(2014年);Leenay,R.ら、Mol.Cell.62巻:137〜147頁(2016年)参照)。驚くべきことに、インビトロデータは、多数のPAMが活性について実際に寛容であることを実証し、明確な順位選好性が出現した(図37D;図39A〜図39D)。これに対して、突然変異PAMがCRISPRアレイ由来の「自己」標的を示した場合、編集を完全に無効にした。
図39A〜図39Dの各々において、垂直軸は、編集効率(編集効率(%))に相当し、そして水平軸は、標的に付随するPAM配列に相当する。図39Aは、PAM配列の関数として、FokI−PseCascade編集効率を示す。ゲノム部位は、水平軸上に示すように、第2の半部位にて1つの固定ATG PAMおよび可変PAMを含有した。バーは、平均およびs.d.を示す(可変PAMあたり6〜14個の部位、標的部位あたりn=1)。なお、図37Dは、FokI−PseCascadeについてのデータを記載しており、一方のPAMがAAGにて固定されており、そして他方のPAMが、ATGを含む一セットのPAMにわたって可変的である。ゆえに、当該PAMのサブセットは、AAG−ATGである。図39Aは、FokI−PseCascadeについてのデータを記載しており、一方のPAMがATGにて固定されており、そして他方のPAMが、AAGを含む当該セットのPAMにわたって可変的である(図39A、水平軸、左から右に、AAG、AAC、AAA、ATG、GAG、ATA、AAT、およびAGG)。ゆえに、当該PAMのサブセットもまた、AAG−ATGであり、そして図37Dにおいて同じAAG−ATG部位である。
図39Bは、PAM配列の関数として、FokI−EcoCascade編集を示す(図39B、水平軸、左から右に、CCG、CGC、AAG、AGG、ATG、GAG、AAA、AAC、ATA、およびAAT)。固定PAMはAAGであった。バーは、平均およびs.d.を示す(可変PAMあたり6〜15個の部位、標的部位あたりn=1)。図39C(図39C、水平軸、左から右に、AAG、ATG、AAC、AAA、AGG、GAG、AAT、およびATA)は、図39Bに示されるものと類似の分析を示すが、第1のPAMを、ATGに固定した(可変PAMあたり6〜14個の部位、標的部位あたりn=1)。AAG−ATG対に相当する図39B内のATGカラム(平均約3)は、AAG−ATG対に相当する図39C内のAAGカラム(平均約3)と同一である。なお、垂直軸は、異なるスケールのものである。図39Dは、PAM配列の関数として、FokI−SthCascade編集を示す(図39D、水平軸、左から右に、CC、AA、GA、TA、およびCA)。固定されたPAMは、GAAであった。バーは、平均およびs.d.を示す(可変PAMあたり18〜33個の部位;標的部位あたりn=1)。
図40A、図40B、図40C、図40D、図40E、および図40Fは、操作されたI型CRISPR−Cas複合体の編集効率の例示的な変化に関連するデータを示す。bpのスペーサー間距離(水平軸)に対する編集効率パーセンテージ(垂直軸)について図40A(FokI−PseCascade)および図40D(FokI−SthCascade)に示されるデータを、図41Aおよび図41Cに示されるデータについて実施例20Cに本質的に記載されるようにして得た。図40Aおよび図40Dにおいて、水平軸は、23〜34bpのスペーサー間距離を示し、そしてグラフのバーは、左から右に、17aa(薄い灰色のバー)、20アミノ酸(濃い灰色のバー)、および30aa(白色のバー)のFokI−Cas8ポリペプチドリンカー長である。図40Cおよび図40Fに示されるデータは、図39Bについて本質的に記載されるようにして得た。図40Cおよび図40Fは、PAM配列の関数として、FokI−PseCascadeおよびFokI−SthCascade編集(図40C、図40F、垂直軸、編集効率(%))を示す(図40C、左から右に、CCG、CGC、AAG、AAA、ATG、AAC、AGG、ATA、GAG、およびAAT;図40F、左から右に、CC、AA、GA、TA、およびCA)。図40Bは、FokI−PseCascade RNP複合体を示す。FokI−PseCascadeについての固定PAMは、AAGであり(図40B、AAG PAM)、そして他のPAMは、一セットのPAM間で可変的である(図40B、可変PAM)。図40Eは、FokI−SthCascade RNP複合体を示す。FokI−SthCascadeについての固定PAMは、GAAであり(図40B、GAA PAM)、そして他のPAMは、一セットのPAM間で可変的である(図40E、可変PAM)。FokI−PseCascadeを、リンカーおよびインタースペーサーの選好性について再スクリーニングした。データは、ほぼ50%の編集を実証した。また、PAM選好性を調査した。このデータから、PAMのインビトロ順位選好性を判定した。本質的に同じ分析を、ストレプトコッカス・サーモフィルス(Streptococcus thermophilus)由来のバリアントについて実行した。編集は、S.サーモフィルス(S.thermophilus)系において、より低かった。しかしながら、本明細書中で示されるデータは、インビボで、ヒト細胞において、S.サーモフィルス(S.thermophilus)系についてのPAM選好性が非常にプロミスキャスであることを実証している。プロトスペーサー(すなわち、標的配列)の上流の単一のAが、編集について寛容であったという事実は、通常、(例えば、同じ遺伝子内の潜在的クラス2 II型CRISPR−Cas9 PAMが付随する標的部位の数と比較して)遺伝子内の潜在的標的配列の数の増大をもたらす。さらに、本明細書中で示されるインビボデータは、非特許文献15によって実証されるインビトロPAM選好性と相関する。
何百もの編集されたゲノム部位にわたるNGSデータの蓄積は、FokI−PseCascadeによって導入されたDSBのDNA修復結果を特徴付ける能力を示した。インデル頻度が>10%である40個のユニークな部位に焦点を合わせて、欠失および挿入の頻度を、予測された切断部位を包囲する50bpのウィンドウ内での総突然変異リードの関数として分析した。2〜4bpの挿入が、高度に増量されて、調査した部位の大多数に存在した(図37E)。詳細に調べると、これらの挿入の約90%が、切断部位に隣接する配列の完全な重複を含有することが示された。特定のいかなる理論にも拘束されることを望むものではないが、そのような重複は、二量体FokIによって導入されたスタガー切断の鋳型修復の結果であるかもしれない。
FokI−PseCascadeの特異性は、2つの高効率標的部位を、対形成されたミスマッチgRNAの広範囲にわたるパネルで編集することによって、評価した(図38A)。カスケードの以前の研究は、約8ntのPAM近位シード配列、および32ntのガイドgRNA内の6位毎のミスマッチプロミスキュアティを強調してきた。これは、これらの塩基が、標的結合して直ぐに形成されたRNA−DNAヘテロ二重鎖構造からはじかれた(flipped out of)ことに起因する(例えば、Jung,C.ら、Cell 170巻:35〜47頁(2017年);Mulepati,S.ら、Science 345巻:1479〜1484頁(2014年);Fineran,P.ら、Proc.Natl.Acad.Sci.USA 111巻:E1629〜E1638頁(2014年);Semenova,E.ら、Proc.Natl.Acad.Sci.USA 108巻:10098〜10103頁(2011年)参照)。PAM近位シード領域内のミスマッチは、ゲノム編集にとって高度に有害であったが、PAMから遠位のミスマッチは、十分に許容されて、ほぼ野生型の編集効率に至った(図38B;図38C)。しかしながら、ミスマッチのブロックが双方の半部位内に存在した場合、編集は、試験した対形成されたgRNAのパネル全体にわたって劇的に減少した(図38B、図38C)。PAMに関するデータおよびFokI−PseCascade媒介ゲノム編集のスペーサー間データ(図38C;図37D)に基づいて、本発明の操作されたI型CRISPR−Cas複合体の一利点は、標的化可能な部位が、ヒトゲノム内で、約20〜約30bp毎に存在し得るが、潜在的オフターゲット部位での編集がありそうもないことである。
したがって、本発明の一実施形態において、所定の操作されたFokI−カスケード系の、潜在的な標的化可能な部位、または「標的密度」は、その効率的なスペーサー間距離およびPAM選好性の関数であり、そして相同体にわたっていくつかの変異性を有することとなる。一部の実施形態において、以下の基準を用いて、FokI−PseCascade、FokI−EcoCascade、およびFokI−SthCascadeについて、ヒトゲノム内の標的密度を算出することができる(データを、予測される標的密度を算出するのに推定した)。
FokI−PseCascade、標的密度を、以下のモチーフを用いて算出することができる:
5’−[半部位1−PAM1]−[スペーサー間]−[PAM2−半部位2]−3’。
ここで、[半部位1−PAM1]は、半部位1gRNA1標的−鎖標的配列およびPAMのリバース相補体を表し、そして[半部位2−PAM2]は、半部位2gRNA2非標的鎖PAMおよび標的−配列を表す。FokI−PseCascadeによる編集を支持したスペーサー間長の分布に基づいて(例えば、図37D参照)、有効なスペーサー間長は、約30〜33bpである。PAMは、最も高い編集を与えるセット1(AAG、AAA、ATG、AAC)、または活性を示す、試験したPAMのいずれかを含有するならば、セット2(AAG、AGG、ATG、GAG、AAA、AAC、AAT、ATA)のいずれかに属すると定義した(例えば、図39A;図40B参照)。このことから、2つのPAMがセット1またはセット2のいずれかに属する好ましいスペーサー間長基準を満たす潜在的な標的部位が、平均してそれぞれ33.4bpまたは9.2bp毎に生じることとなる。
FokI−EcoCascadeの標的密度を、スペーサー間長を31〜33と定義し、かつPAMを、最も高い編集を与えるセット1(AAG、AGG、ATG、GAG、AAA)、または活性を示す、試験したPAMのいずれかを含有するならば、セット2(AAG、AGG、ATG、GAG、AAA、AAC、AAT、ATA)のいずれかに属すると定義したこと以外、同様に判定した(例えば、図39C;図39D参照)。このことから、潜在的な標的部位を、セット1 PAMまたはセット2 PAMで算出し、平均してそれぞれ30.4bpまたは12.2bp毎に生じた。
FokI−SthCascadeのヒトゲノム標的密度を、スペーサー間長を29〜31bpと定義し、かつPAMをNNAと定義したこと以外、同様に判定した(例えば、図39D参照)。このことから、潜在的な標的部位は、平均して4bp毎に生じると算出された。
したがって、本明細書中に記載される操作されたI型CRISPR−Cas複合体は、ゲノム編集に利用可能ないくつかのPAM隣接標的配列を用意することによって、種々の潜在的な標的部位を用意する方法を提供する。ゆえに、本発明の一実施形態は、操作されたI型CRISPR−Cas複合体と関連するPAM配列を用いて、(例えば、クラス2 CRISPR−Cas II型またはV型系のPAM配列が付随する利用可能な標的配列の数と比較して)遺伝子内の利用可能な標的配列の数の増大をもたらす方法に関する。この方法の用途は、以下に限定されないが、標的配列への結合および/または切断、標的配列の突然変異、標的配列またはその調節要素に関連した転写調節、ならびに本明細書中に記載される操作されたI型CRISPR−Cas複合体の使用によって媒介される(例えば、遺伝子の生成物内の)意図的な改変、変更、および/または著しく異なる構造的変更を含み得る操作されたI型CRISPR−Cas複合体の使用に関する。
一部の実施形態において、本明細書中に記載される操作されたI型CRISPR−Casエフェクター複合体を用いて、ゲノム内のDNA標的遺伝子座にて、選択されたポリヌクレオチド配列(例えば、ドナーポリヌクレオチドの一部)を部位特異的に導入して、gDNAの改変、変更、および/または突然変異を生成することによって、非ヒトトランスジェニック生物を生成することができる。トランスジェニック生物は、動物であっても植物であってもよい。
トランスジェニック動物は、典型的に、操作されたI型CRISPR−Casエフェクター複合体を接合子細胞中に導入することによって生成される。トランスジェニックマウスの製造に関して記載される基本的な技術(例えば、Cho,A.ら、「Generation of Transgenic Mice」、Current Protocols in Cell Biology、CHAPTER.Unit−19.11(2009年)参照)は、5つの基本的工程を伴う:第1に、本明細書中に記載される、適切なドナーポリヌクレオチドを含む系の調製工程;第2に、ドナー接合子の収穫工程;第3に、マウス接合子中への系のマイクロインジェクション工程;第4に、偽妊娠レシピエントマウス中への、微量注入した接合子の移植工程;そして第5に、創始者マウスにおいて確立されたgDNAの改変のジェノタイピングおよび分析を実行する工程。創始者マウスは、あらゆる後代に遺伝的改変を伝えることとなる。創始者マウスは、典型的に、導入遺伝子についてヘテロ接合性である。これらのマウス間の交配は、導入遺伝子について25%の確率でホモ接合性であるマウスを生成することとなる。
トランスジェニック植物を生成する方法もまた周知であり、操作された1つのI型CRISPR−Casエフェクター複合体を用いて適用することができる。(例えばアグロバクテリウム(Agrobacterium)属媒介形質転換を用いて)生成されたトランスジェニック植物は、典型的に、一染色体中に挿入された一導入遺伝子を含有する。単一の導入遺伝子を含有する独立した分離トランスジェニック植物をそれ自体と有性生殖で交配させる(すなわち、自殖させる)ことによって、導入遺伝子に関してホモ接合性であるトランスジェニック植物を生成することが可能である。典型的な接合性アッセイとして、以下に限定されないが、ホモ接合体とヘテロ接合体とを識別する単一のヌクレオチド多型アッセイおよび熱増幅アッセイが挙げられる。
第6の態様において、本発明は、基質チャネルを作出するための、操作されたI型CRISPR−Casエフェクター複合体の使用に関する。一部の実施形態において、基質チャネル要素およびCas7サブユニットタンパク質を含む融合タンパク質が構築される。次に、当該Cas7融合タンパク質は、操作されたI型CRISPR−Casエフェクター複合体(例えば、Cse2、Cas5、Cas6、Cas7−基質チャネル要素融合体、およびCas8を含む)にアセンブルされる。一部の実施形態において、操作されたI型CRISPR−Casエフェクター複合体のcrRNAを伸ばして、更なるCas7サブユニットに対応することができる(例えば、Luo,M.ら、Nucleic Acids Res.44巻:7385〜7394頁(2016年)参照)。様々な基質要素をCas7に融合させてから、所望される化学量論で混合することができる。これらの種々のCas7サブユニットが、完全なI型CRISPR−Casエフェクター複合体にアセンブルすると、基質要素の共局在化が、基質チャネリングの効力を増強させ得る。
一部の実施形態において、複数のCas7−基質チャネル要素融合体が、他のI型CRISPR−Casエフェクター複合体構成要素の非存在下で結合することができるようなRNA足場が構築される。
基質チャネル要素を、Cas7のN末端および/またはCas7のC末端に融合させることができる。また、Cas7の円順列置換を、基質チャネル要素に融合させることができる。
図11Aおよび図11Bは、経路において3つの連続した酵素からなる基質チャネルのイラストを示す。基質チャネルは、代謝経路鎖内での連続した酵素の活性部位への直接的な中間代謝生成物の通過を、別のチャネル空間中に放出させることなく促進する。図11Aは、操作された基質チャネルの典型的な配置を示す。酵素E1、E2、およびE3は、足場タンパク質(S1、S2、S3)マトリックスに共有結合的に、または非共有結合的に相互作用する。両矢印は、酵素と足場タンパク質との間の相互作用(例えば、親和性相互作用)を表す。基質(X)は次に、別のチャネル空間に放出されることなくプロセシングされて、生成物(Y)になる。図11Bは、Cas7サブユニットタンパク質への融合(すなわち、共有結合相互作用)タンパク質として酵素E1、E2、およびE3を有することで基質チャネルを作出する、操作されたI型CRISPR−Casエフェクター複合体を含む本発明の一実施形態を示す。cpCas7タンパク質、およびcpCas7タンパク質で形成された骨格もまた、本発明のこの態様の実行に有用であり得る。
他の実施形態において、基質チャネル要素を、Cas6に融合させることができる。カスケード複合体のCas6サブユニットは、特定のRNAヘアピン構造を認識する。互いに連結される複数のCas6 RNAヘアピン構造で構成されるRNA足場を構築することができる。異なるカスケード複合体由来のCas6ペプチドは、異なる認識配列を有する。したがって、RNA足場を、複数の直交Cas6 RNAヘアピンから構築することができる。直交Cas6ペプチドに異なる基質チャネル要素を融合させることによって、基質チャネル複合体を、特定の化学量論にてアセンブルすることができる。
基質チャネル要素を、Cas6のN末端および/またはCas6のC末端に融合させることができる。また、Cas6の円順列置換を、基質チャネル要素に融合させることができる。
一部の実施形態において、注目する異種代謝経路を、モデル生物、例えば大腸菌(E.coli)内で発現させることができる。遺伝子が異種発現される場合、より効率的に遺伝子を発現させるように遺伝子をコドン最適化することができる。
一実施形態において、注目する代謝経路は、出芽酵母(Saccharomyces cerevisiae)由来のメバロン酸経路である。この経路の基質チャネル要素として、以下に限定されないが、アセトアセチル−CoA−チオラーゼ(AtoB)、ヒドロキシ−メチルグルタリル−CoAシンターゼ(HMGS)、およびヒドロキシ−メチルグルタリル−CoAリダクターゼ(HMGR)が挙げられる。
別の実施形態において、注目する代謝経路は、出芽酵母(S.cerevisiae)由来のグリセロール合成経路である。この経路の基質チャネル要素として、以下に限定されないが、グリセロール−3−リン酸デヒドロゲナーゼ(GPD1)およびグリセロール−3−リン酸ホスファターゼ(GPP2)が挙げられる。
さらに別の実施形態において、注目する代謝経路は、クロストリジウム・ステルコラリウム(Clostridium stercorarium)由来のデンプン加水分解経路である。この経路の基質チャネル要素として、以下に限定されないが、CelYおよびCelZが挙げられる。
更なる実施形態において、注目する代謝経路は、大腸菌(E.coli)由来のグルコースホスホトランスフェラーゼ経路である。この経路の基質チャネル要素として、以下に限定されないが、トレハロース−6−リン酸シンセターゼ(TPS)およびトレハロース−6−リン酸ホスファターゼ(TPP)が挙げられる。
第7の態様において、本発明は、クラス2 II型Cas9タンパク質および核酸−標的化核酸(NATNA)を含む複合体による、カスケードサブユニットタンパク質に融合した機能ドメインの部位特異的動員に関する。機能ドメインが本明細書中で開示されており、そして、以下に限定されないが、転写活性化できる、または転写抑制できる、酵素機能を有するタンパク質ドメインが挙げられる。実施例13Aおよび実施例13Bは、クラス2 II型CRISPR sgRNA、crRNA、tracrRNA、またはcrRNAおよびtracrRNA配列を、クラス1 I型CRISPRリピートステム配列で操作して、II型CRISPR Casタンパク質/ガイドRNA複合体結合部位への1つまたはそれ以上のカスケードサブユニットタンパク質の動員を可能にする方法を記載する。
図12A、図12B、および図12Cは、dCas9:NATNA複合体による、カスケードサブユニットタンパク質に融合した機能タンパク質ドメインの、標的部位への部位特異的動員の一般化したイラストを示す。スペーサー配列(図12A、101)を含むクラス2 II型CRISPR NATNA(図12A、102)が、クラス1 I型CRISPRリピートステム配列(図12A、104)に、リンカー核酸配列(図12A、103)を介して共有結合されている。I型CRISPRリピートステム配列に共有結合されたII型CRISRP NATNA(図12A、105)は、II型dCas9(図12A、106)およびI型カスケードサブユニットタンパク質(例えば、Cas6;図12A、107)に結合することができ、これは、RNP複合体を形成するように、リンカー配列(図12A、108)を介して機能タンパク質ドメイン(例えば、酵素ドメイン、転写活性化または抑制ドメイン;図12A、109)に融合されている。このRNP複合体(図12B、110)は、II型CRISPR NATNAスペーサー配列(図12A、101)と相補的な標的配列(図12B、112)を含む二本鎖DNA(図12B、111)を標的化することができる。RNP複合体による標的認識により、スペーサー配列(図12A、101)と標的配列(図12B、112)との間のハイブリダイゼーション(図12B、113)が生じる。DNAへのカスケードサブユニット−機能ドメイン融合タンパク質の局在化により、隣接する遺伝子(図12C、114)の機能タンパク質ドメインまたは転写調節によるDNAの改変が可能となる。
第8の態様において、本発明は、操作されたI型CRISPR−Casエフェクター複合体、操作されたガイドポリヌクレオチド、およびそれらの組合せを含む組成物に関する。一部の実施形態において、操作されたI型CRISPR−Casエフェクター複合体は、会合したCas3融合タンパク質を含む。野生型I型CRISPR−Cas系は、DNA標的化用のカスケードエフェクター複合体およびプロセッシブ(processive)DNA分解用のCas3ヘリカーゼ−ヌクレアーゼの作用の調整を必要とする。本発明の一実施形態において、I型CRISPR−Casエフェクター複合体を操作して、ヌクレアーゼドメイン(例えば、非特異的FokIエンドヌクレアーゼドメイン)に複合体を融合させることによって、正確なDSBを製造した。このアプローチは、介在配列(すなわち、スペーサー間)によって分けられた2つの半部位DNA配列を標的化する対形成されたガイドポリヌクレオチドを用いる。
本発明のこの態様の実施形態は、それぞれがスペーサー、ならびにCasサブユニットおよびエンドヌクレアーゼを含む融合タンパク質を含む2つの操作されたI型CRISPR−Casエフェクター複合体(例えば、FokI;例えば、図2A、図2B、および図2Cのカスケード複合体参照)を含む組成物であって、少なくとも2つのパラメータが、ゲノム編集効率を調節するように変えられている組成物に関する。そのようなパラメータとして、以下が挙げられる:
Casサブユニットタンパク質およびエンドヌクレアーゼ(例えば、FokI)を含む融合タンパク質を生成するのに用いられるリンカーポリペプチドの長さ;ならびに
スペーサーが結合でできる核酸標的配列間のスペーサー間距離の長さ。
アミノ酸組成物および配列リンカーポリペプチドに関するガイダンスが、本明細書中で提供される。
本発明のこの態様の一実施形態は、組成物であって:
第1のCse2サブユニットタンパク質、第1のCas5サブユニットタンパク質、第1のCas6サブユニットタンパク質、および第1のCas7サブユニットタンパク質と、
第1のCas8サブユニットタンパク質および第1のFokIを含む第1の融合タンパク質であって、第1のCas8サブユニットタンパク質のN末端または第1のCas8サブユニットタンパク質のC末端は、第1のリンカーポリペプチドによって、第1のFokIのC末端またはN末端にそれぞれ共有結合されており、第1のリンカーポリペプチドは、長さが約10アミノ酸〜約40アミノ酸である、第1の融合タンパク質と、
第1の核酸標的配列に結合することができる第1のスペーサーを含む第1のガイドポリヌクレオチドと
を含む第1の操作されたI型CRISPR−Casエフェクター複合体と;
第2のCse2サブユニットタンパク質、第2のCas5サブユニットタンパク質、第2のCas6サブユニットタンパク質、および第2のCas7サブユニットタンパク質と、
第2のCas8サブユニットタンパク質および第2のFokIを含む第2の融合タンパク質であって、第2のCas8サブユニットタンパク質のN末端または第2のCas8タンパク質のC末端は、第2のリンカーポリペプチドによって、第2のFokIのC末端またはN末端にそれぞれ共有結合されており、第2のリンカーポリペプチドは、長さが約10アミノ酸〜約40アミノ酸である、第2の融合タンパク質と、
第2の核酸標的配列に結合することができる第2のスペーサーを含む第2のガイドポリヌクレオチドと
を含む第2の操作されたI型CRISPR−Casエフェクター複合体と
を含み、
第2の核酸標的配列のプロトスペーサー隣接モチーフ(PAM)および第1の核酸標的配列のPAMは、スペーサー間距離が約20塩基対〜約42塩基対である、組成物である。
そのような第1の核酸標的配列に結合された第1の操作されたI型CRISPR−Casエフェクター複合体および第2の核酸標的配列に結合された第2の操作されたI型CRISPR−Casエフェクター複合体の例が、図2A、図2B、および図2Cに示されている。
一部の実施形態において、第1のリンカーポリペプチドおよび/または第2のリンカーポリペプチドの長さは、約15アミノ酸〜約30アミノ酸、または約17のアミノ酸〜約20アミノ酸の長さである。一実施形態において、第1のリンカーポリペプチドと第2のリンカーポリペプチドの長さは、同じである。
第1のCas8サブユニットタンパク質および第2のCas8サブユニットタンパク質はそれぞれ、Cas8サブユニットタンパク質の同一のアミノ酸配列を含んでよい。
同様に、第1のCse2サブユニットタンパク質および第2のCse2サブユニットタンパク質は、それぞれCse2サブユニットタンパク質の同一のアミノ酸配列を含んでよく、第1のCas5サブユニットタンパク質および第2のCas5サブユニットタンパク質は、それぞれCas5サブユニットタンパク質の同一のアミノ酸配列を含んでよく、第1のCas6サブユニットタンパク質および第2のCas6サブユニットタンパク質は、それぞれCas6サブユニットタンパク質の同一のアミノ酸配列を含んでよく、第1のCas7サブユニットタンパク質および第2のCas7サブユニットタンパク質は、それぞれCas7サブユニットタンパク質の同一のアミノ酸配列を含んでよく、そしてこれらは組み合わされる。
典型的には、第1のCas8サブユニットタンパク質のN末端は、第1のリンカーポリペプチドによって、第1のFokIのC末端に共有結合されており、第1のCas8サブユニットタンパク質のC末端は、第1のリンカーポリペプチドによって、第1のFokIのN末端に共有結合されており、第2のCas8サブユニットタンパク質のN末端は、第2のリンカーポリペプチドによって、第2のFokIのC末端に共有結合されており、第2のCas8サブユニットタンパク質のC末端は、第2のリンカーポリペプチドによって、第2のFokIのN末端に共有結合されており、そしてこれらは組み合わされる。
本発明のこの態様の実施形態は、第2の核酸標的配列と第1の核酸標的配列との間の長さが、約22塩基対〜約40塩基対、約26塩基対〜約36塩基対、約29塩基対〜約35塩基対、または約30塩基対〜約34塩基対のスペーサー間距離である実施形態を含む。
第1のFokIおよび第2のFokIは、会合してホモダイマーを形成することができるモノマーサブユニットであってもよいし、会合してヘテロダイマーを形成することができる互いに異なるサブユニットであってもよい。
好ましい実施形態において、ガイドポリヌクレオチドは、RNAを含む。
一部の実施形態において、gDNAは、第2の核酸標的配列のPAMおよび第1の核酸標的配列のPAMを含む。
一部の実施形態において、操作されたI型CRISPR−Casエフェクター複合体は、サルモネラ・エンテリカ(Salmonella enterica)、ゲオサーモバクター(Geothermobacter)属種(EPR−M株)、メタノケッラ・アルボリザエ(Methanocella arvoryzae)MRE50、ストレプトコッカス・サーモフィルス(Streptococcus thermophilus)、(例えば、ストレプトコッカス・サーモフィルス(Streptococcus thermophilus)(ND07株))、シュードモナス(Pseudomonas)属種S−6−2、および大腸菌(E.coli)からなる群から選択される1つまたはそれ以上の生物のI型CRISPR−Casエフェクター複合体に基づく。好ましい実施形態において、操作されたI型CRISPR−Casエフェクター複合体は、ストレプトコッカス・サーモフィルス(Streptococcus thermophilus)、(例えば、ストレプトコッカス・サーモフィルス(Streptococcus thermophilus)(ND07株))、シュードモナス(Pseudomonas)属種S−6−2、および/または大腸菌(E.coli)のI型CRISPR−Casエフェクター複合体に基づく。シュードモナス(Pseudomonas)属種S−6−2は、大腸菌(E.coli)相同体よりも約10倍高い編集効率を誘導し、そして試験した他の相同体のおおよそ半分が、大腸菌(E.coli)と同等の活性を示した。このことは、多様なI型系由来の操作されたI型CRISPR−Casエフェクター複合体を、ヒト細胞内でのゲノム編集に機能的に用いることができることを実証している。
実施例18A、実施例18B、実施例18C、実施例18D、実施例20A、実施例20B、および実施例20Cに示されるデータは、Casサブユニットタンパク質およびFokIを含む融合タンパク質を生成するのに用いられるリンカーポリペプチドの長さを変えること、かつ/またはスペーサーが結合できる核酸標的配列間のスペーサー間距離の長さを変えることで、細胞内でのゲノム編集効率の調節が促進されることを実証している。
さらに別の実施形態において、本発明は、カスケードサブユニットタンパク質(例えば、Cas8サブユニットタンパク質)および第1の機能ドメイン(例えば、FokI)を含む第1の融合タンパク質、ならびにdCas3*タンパク質および第2の機能ドメイン(例えば、FokI)を含む第2の融合タンパク質を含む操作されたI型CRISPR−Casエフェクター複合体に関する(図13A:Cas7、Cas5、Cas8、Cse2、およびCas6、Cas6周りの破線のボックスは、crRNAヘアピンとの相互作用を示す;cRNAは、黒色の線として示されており、ヘアピンを含む)。第1の機能ドメイン(例えば、FokI)を含む操作されたI型CRISPR−Casエフェクター複合体(図13A、Cas8−リンカー1−FP1融合体)は、DNAに結合することができ、次いで、dCas3*−第2の機能ドメイン(例えば、FokI)融合タンパク質(図13A、dCas3*−リンカー2−FP2)を動員することができる。第1の機能ドメイン(図13A、Cas8−リンカー1−FP1融合体)および第2の機能ドメイン(図13A、dCas3*−リンカー2−FP2)が二量体タンパク質のサブユニットを含む場合には、dCas3*第2の機能ドメイン(例えば、FokI)融合タンパク質は、第1の機能ドメイン(例えば、FokI)を含む操作されたI型CRISPR−Casエフェクター複合体に結合して、第1の機能ドメインおよび第2の機能ドメインの二量体化を促進する(図13A)。図14Aは、リンカーポリペプチド(図14A、リンカー1)を介してCasサブユニットタンパク質(図14A、ストライプのボックス)に連結された第1の機能ドメイン(図14A、FD1)、およびカスケード複合体と会合したリンカーポリペプチド(図14A、リンカー2)を介して第2の機能ドメイン(図14A、FD2)に連結されたdCas3*を含む(然るに、FD1およびFD2を近接させて、FD1およびFD2の相互作用を促進する)操作されたI型CRISPR−Casエフェクター複合体(図14A、カスケード)の、dsDNAへの結合を示す。カスケード複合体の結合は、単一のPAM配列(図14A、PAM、空白のボックス)を伴う。図14Aにおいて、dsDNAは、対形成された、水平の破線として示されている。二量体エンドヌクレアーゼである機能ドメイン(例えば、FokI)の場合、FD1およびFD2の付近は、機能ダイマーの形成を促進する。
本発明のこの実施形態の一利点は、単一のカスケード複合体(単一のPAM配列を認識する)を、2つのFokI−カスケード複合体を用いることに対して(図14Aを、図2A、図2B、および図2Cと比較して)、二本鎖核酸標的配列を切断するのに用いることができることである。2つのFokI−カスケード複合体を用いるには、適切な向きの2つのPAM配列(図2A、図2B、および図2C)を必要とし、これらは近位の核酸標的配列の選択を制限し得る。
Casサブユニットタンパク質およびエンドヌクレアーゼ(例えば、FokI)を含む融合タンパク質を生成するのに用いたリンカーポリペプチドの長さおよび/または組成、ならびにdCas3*タンパク質およびエンドヌクレアーゼを含む融合タンパク質を生成するのに用いたリンカーポリペプチドの長さおよび/または組成を変動させて、ゲノム編集効率を調節することができる。実施例21A、実施例21B、実施例21C、および実施例21Dは、ゲノム編集効率の調節のための、複数のCas3−FokIリンカーの組成および長さ、ならびにFokI−Cas8リンカーの組成および長さの設計および試験を記載している。
本発明のこの態様の別の実施形態は、操作されたI型CRISPR−Casエフェクター複合体(図13B:Cas7、Cas5、Cas8、Cse2、およびCas6;Cas6周りの破線のボックスは、crRNAヘアピンとの相互作用を示す;cRNAは、黒色の線として示されており、ヘアピンを含む)、ならびにリンカーポリペプチド(図13B、リンカー)によって連結されたdCas3*タンパク質(図13B、dCas3*)および機能ドメイン(図13B、FP)(例えば、シチジンデアミナーゼ)を含む融合タンパク質を含む。操作されたI型CRISPR−Casエフェクター複合体は、DNAに結合して、dCas3*−機能ドメイン(例えば、シチジンデアミナーゼ)融合タンパク質を動員することができる。この実施形態は、機能ドメインによって、またはこれと相互作用して、改変のための核酸標的配列の部位特異的標的化を促進することができる。シチジンデアミナーゼの場合、操作されたI型CRISPR−Casエフェクター複合体、ならびにdCas3*タンパク質およびシチジンデアミナーゼを含む融合タンパク質は、核酸標的配列内での部位特異的塩基編集に用いることができる。図14Bは、リンカーポリペプチド(図14B、リンカー)を介して機能ドメイン(図14B、FD)と連結されたdCas3*タンパク質(図14B、dCas3*)を含む融合タンパク質を含む操作されたI型CRISPR−Casエフェクター複合体(図14B、カスケード)の例を示しており、複合体は、dsDNA(図14B、対形成された、水平の破線)に結合されている。図14Bにおいて、dsDNAとの機能ドメインの接触が促進される。カスケード複合体の結合は、単一のPAM配列(図14B、PAM、空白のボックス)を伴う。図14Cは、リンカーポリペプチド(図14C、リンカー)を介して機能ドメイン(図14C、FD)と連結されたdCas3*タンパク質(図14C、dCas3*)を含む融合タンパク質を含む操作されたI型CRISPR−Casエフェクター複合体(図14C、カスケード)の別の例を示しており、複合体は、dsDNA(図14C、対形成された、水平の破線)に結合されている。カスケード複合体の結合は、単一のPAM配列(図14C、PAM、空白のボックス)を伴う。図14Cにおいて、ssDNAとの機能ドメインの接触が促進される。
I型CRISPR−Casサブユニットタンパク質との融合タンパク質を構築するのに用いることができる更なる機能ドメインおよびタンパク質が、本明細書および実施例に記載されている。Cas3−リンカーポリペプチド機能ドメイン融合タンパク質についてのリンカーポリペプチドの組成および長さは、機能ドメインの性能に及ぼす作用を評価するための実施例21A〜実施例21Dおよび本明細書のガイダンスに従って評価することができる。
本発明の一部の実施形態は、操作されたI型CRISPR−Casエフェクター複合体およびmCas3タンパク質を用いてよく、mCas3タンパク質は、下方調節されたヘリカーゼ活性(例えば、Cas3プロセッシビティ突然変異タンパク質であるmCas3タンパク質は、野生型I型CRISPR Cas3タンパク質と比較して、DNAに沿う移動が低減している)を含み、またはmCas3タンパク質は、ヘリカーゼ活性が欠如している(例えば、mCas3タンパク質は、もはやプロセッシブヌクレアーゼ様wtCas3タンパク質でないが、mCas3タンパク質は、ニッキング活性を保持している)。操作されたI型CRISPR−Casエフェクター複合体は、DNAに結合することができ、次いで、mCas3タンパク質を動員することができる。この実施形態は、ゲノムDNAの部位特異的切断を促進することができる。
表48は、いくつかのmCas3タンパク質を記載しており、Cas3タンパク質になされた突然変異は、ヘリカーゼドメインのATP結合/加水分解領域またはヘリカーゼドメインのssDNA経路保存領域に影響を与えた。図44は、EcoCas3タンパク質の機能ドメイン、およびCas3コード配列内になされた突然変異の相対位置の線形の表示を示している。図44において、HDヌクレアーゼドメイン(アミノ酸1〜272)、ヘリカーゼドメイン、(RecA1領域、アミノ酸273〜521;RecA2領域、アミノ酸522〜737)、リンカー(アミノ酸738〜794)、およびC末端ドメイン(CTD、アミノ酸795〜888)が示されている。Huo,Y.ら、Nat.Struct.Mol.Biol.9巻:771〜777頁(2014年)は、サーモビフィダ・フスカ(Thermobifida fusca)(受託コード:Q47PJ0;配列番号1869)、サッカロモノスポラ・ビリディス(Saccharomonospora viridis)(C7MTA6;配列番号1870)、サーモモノスポラ・クルバータ(Thermomonospora curvata)(D1A6Q2;配列番号1922)、ストレプトマイセス・アベルミティリス(Streptomyces avermitilis)(Q825B5;配列番号1925)、ストレプトマイセス・ボトロペンシス(Streptomyces bottropensis)(M3DI13;配列番号1923)、サーマス・サーモフィルス(Thermus thermophilus)株HD8(Q53VY2;配列番号1924)、および大腸菌(E.coli)(P38036;配列番号1844)由来のタンパク質のCas3ファミリーの配列アラインメントによる配列保存分析を記載している。ヘリカーゼドメインまたはssDNAループ結合ドメインのATP結合部分内に突然変異を有する24の異なるEcoCas3タンパク質バリアントをスクリーニングした(実施例23A〜実施例23C)。いくつかの突然変異体が、アンプリコンウィンドウ内に有意に多い、かつ/または位置がシフトした欠失クラスを示した;mCas3タンパク質は、wtCas3と比較して、プロセッシビティが低減したことを支持することが見出された。
実施例23A〜実施例23Cは、そのようなmCas3タンパク質を記載しており、平均のmCas3タンパク質誘導欠失は、対応するwtCas3タンパク質で生じた平均の欠失と比較して、より短い。そのようなmCas3タンパク質は、(例えば、ヒト細胞内での)ゲノム編集に有用である。図45A、図45B、図45C、および図45Dは、mCas3タンパク質が、カスケードRNP複合体と会合すると、ヒト細胞中に導入されて、その中で発現された場合に、カスケードRNP複合体と会合したwtCas3タンパク質と比較して、より短い平均欠失長を生じることを示すデータを示す。本明細書の教示を鑑みて、当業者であれば、大腸菌(E.coli)の他に細菌の他の種から得られるCas3タンパク質の対応する領域内で、類似の突然変異を形成することができる。
実施例26A〜実施例26Cが、ゲノム欠失を生成するのに有用なmCas3タンパク質の更なる例を記載しており、平均のmCas3タンパク質誘導欠失は、対応するwtCas3タンパク質で生じた平均の欠失と比較して、より短い。実施例において示されるデータは、シュードモナス(Pseudomonas)属種S−6−2(mPseCas3タンパク質)由来のCas3のATPアーゼ/ヘリカーゼ欠損バリアントを、PseCascade RNP複合体に用いて、予想される切断部位での欠失(すなわち、切断部位局在化欠失)を生成することができることを支持している。
wtPseCas3タンパク質/PseCascade活性を、さらに特徴付けた。更なる実験を、標的−富化プローブを用いて実行した。これにより、大きなゲノム欠失の検出が可能となる。具体的には、HEK293細胞を、実施例26A〜実施例26Cに本質的に記載されるように、PseCascade RNP複合体、wtPseCas3タンパク質、およびTRAC遺伝子座に向けられる最小CRISPRアレイをコードするDNA鋳型で形質移入した。標的−富化プローブを用いて、ゲノムフラグメントを単離かつ配列決定した;一方で、実施例26Cにおいて、アンプリコンウィンドウを用いて、欠失の存在を同定した。標的−富化/配列決定方法は、アンプリコンウィンドウを用いて欠失を同定することによって提供されない、より大きな欠失の先入観のないビューを提供した。全体として、標的−富化、およびゲノムフラグメントの配列決定を用いて評価した欠失が、wtPseCas3タンパク質開始部位の上流で始まって、大部分は一方向性であることが見出された。欠失は、1bp〜ほぼ250kbに及んだ。ゲノムDNAを切断する方法を提供し、かつ所定の長さの欠失を提供することに加えて、当該方法は、定義された位置にて大きな、ランダムなサブセットの欠失を生成して、遺伝子の調節/プロモーター領域を探査するのに有用であり得る。
mCas3タンパク質は、1つまたはそれ以上の突然変異(例えば、表48に記載される突然変異の組合せ)を含んでもよい。
欠失長の制御を、いくつかのmCas3タンパク質について実証した。一部の実施形態において、ガイドポリヌクレオチドを含むカスケード複合体と会合した本発明のmCas3タンパク質は、約1〜約600塩基対、約1〜約500塩基対、約1〜約400塩基対、約1〜約300塩基対、好ましくは約1〜約250塩基対、約1〜約200塩基対、または約1〜約100塩基対の平均欠失長をもたらし得る。
一部の実施形態において、wtCas3タンパク質またはmCas3タンパク質は、カスケード複合体の種々のサブユニットに融合して、Cas3平均欠失長をさらに制御することができる。カスケード複合体へのテザリングが、Cas3タンパク質またはmCas3タンパク質の、DNAに沿う移動を制限または防止し得る。なぜなら、カスケード複合体が結合している遺伝子座に固定されることとなるからである。wtCas3タンパク質またはmCas3タンパク質を、典型的にはリンカーポリペプチドにより、カスケード複合体のタンパク質構成要素のNまたはC末端ドメインのいずれかに融合させることができる(例えば、EcoCascade複合体について、融合は、EcoCas8、EcoCas6、またはEcoCas5によることがある)。また、NLS配列を、融合タンパク質のN末端に添えてもよい。大腸菌(E.coli)カスケードタンパク質構成要素についてのそのような構築体の例が、表12に示されている。また、これらのEcoCas3融合タンパク質は、それらのN末端にNLS配列が添えられている。
本発明の実施形態は、野生型I型CRISPR Cas3タンパク質(wtCas3タンパク質)と比較して、DNAに沿う移動を低減できる操作されたI型CRISPR mCas3タンパク質を含む。一部の実施形態において、mCas3タンパク質は、対応するwtCas3タンパク質との配列同一性が、約90%またはそれ以上、好ましくは約95%またはそれ以上、より好ましくは約98%またはそれ以上である。mCas3タンパク質についてのコード配列は、アミノ末端、カルボキシ末端、またはアミノおよびカルボキシ末端の双方にて共有結合された核局在化シグナルを含んでもよい。mCas3タンパク質は、ヘリカーゼ活性を下方調節する1つまたはそれ以上の突然変異を含んでよく、操作されたmCas3タンパク質は、対応するwtCas3タンパク質と比較して、ヌクレアーゼ活性(または少なくともその一部)を保持する。典型的には、DNAは、核酸標的配列を含む標的領域を含むdsDNAである。wtCas3タンパク質が、対応するカスケード核タンパク質複合体と会合し(「カスケードNP複合体/wtCas3タンパク質」;例えば、カスケードRNP複合体)、そしてカスケードNP複合体が、核酸標的配列と相補的なスペーサーを含むガイドを含む場合、カスケードNP複合体/wtCas3タンパク質の、核酸標的配列への結合が、DNAの標的領域内の切断を促進して、典型的には標的領域内の欠失をもたらし;そしてmCas3タンパク質は、カスケードNP複合体と会合し(「カスケードNP複合体/mCas3タンパク質」;例えば、カスケードRNP複合体/mCas3タンパク質)、かつ核酸標的配列に結合した場合、DNAの標的領域内の切断を促進して、wtCas3平均欠失長と比較してより短い平均欠失長をもたらす。
一部の実施形態において、mCas3タンパク質内の1つまたはそれ以上の突然変異は、wtCas3タンパク質と比較したアミノ酸の置換である。他の実施形態において、1つまたはそれ以上の欠失は、wtCas3タンパク質と比較した、mCas3タンパク質コード配列におけるアミノ酸の欠失または挿入を含む。1つまたはそれ以上の突然変異は、ヘリカーゼドメインのRecA1領域内にあってもRecA2領域内にあってもよい。一実施形態において、1つまたはそれ以上の突然変異は、wtCas3タンパク質と比較して、ssDNAへのmCas3タンパク質の結合を下方調節する(例えば、ssDNAループ結合に影響を与える突然変異および/またはヘリカーゼドメインのssDNA経路保存領域内の突然変異)。更なる実施形態において、1つまたはそれ以上の突然変異は、wtCas3タンパク質と比較して、mCas3タンパク質によるATPの加水分解を下方調節し、またはwtCas3タンパク質と比較して、mCas3タンパク質へのATPの結合を下方調節する。更なる実施形態において、mCas3タンパク質は、wtCas3タンパク質と比較して、ssDNAへのmCas3タンパク質の結合を下方調節し、mCas3タンパク質によるATPの加水分解を下方調節し、またはwtCas3タンパク質と比較して、mCas3タンパク質へのATPの結合を下方調節する1つまたはそれ以上の突然変異の組合せを含む。
更なる実施形態は、カスケード核タンパク質複合体(例えば、カスケードRNP複合体)のCasタンパク質のコード配列のアミノ末端またはカルボキシ末端に共有結合されたmCas3タンパク質についてのコード配列を含む。そのようなCasタンパク質は、Cse2、Cas8タンパク質、Cas7タンパク質、Cas6、およびCas5タンパク質からなる群から選択することができる。
一部の実施形態において、wtCas3タンパク質は、大腸菌(E.coli)I型CRISPR Cas3タンパク質である。他の実施形態において、wtCas3タンパク質は、シュードモナス(Pseudomonas)属種S−6−2、サーモビフィダ・フスカ(Thermobifida fusca)、サッカロモノスポラ・ビリディス(Saccharomonospora viridis)、サーモモノスポラ・クルバータ(Thermomonospora curvata)、ストレプトマイセス・アベルミティリス(Streptomyces avermitilis)、ストレプトマイセス・ボトロペンシス(Streptomyces bottropensis)、サーマス・サーモフィルス(Thermus thermophilus)、コレラ菌(Vibrio cholera)、サルモネラ・エンテリカ(Salmonella enterica)、ゲオサーモバクター(Geothermobacter)属種EPR−M、メタノケッラ・アルボリザエ(Methanocella arvoryzae)MRE50、およびストレプトコッカス・サーモフィルス(Streptococcus thermophilus)(ND07株)からなる群から選択されるwtCas3タンパク質である。
大腸菌(E.coli)I型CRISPR wtCas3タンパク質について、1つまたはそれ以上の突然変異として、以下に限定されないが、D452H、A602V、またはD452HおよびA602Vを挙げることができる。
更なる実施形態において、細胞は、DNAを含み、当該細胞は、真核細胞(例えば、ヒト細胞)であってもよい。
更なる実施形態において、本発明は、mCas3タンパク質についてのコード配列を含むポリヌクレオチド、mCas3タンパク質コード配列を含む発現カセット、mCas3タンパク質コード配列を含むプラスミド、およびmCas3タンパク質を含むカスケード核タンパク質複合体を含む。
第9の態様において、本発明は、操作されたI型CRISPR−Casエフェクター複合体を用いる方法に関する。
一部の実施形態において、本発明は、ポリヌクレオチド(例えば、dsDNA)内の核酸標的配列に結合する方法であって、細胞または生化学反応中への導入のための、1つまたはそれ以上の操作されたI型CRISPR−Casエフェクター複合体を用意して、操作されたI型CRISPR−Casエフェクター複合体を細胞または生化学反応中に導入することによって、操作されたI型CRISPR−Casエフェクター複合体の、ポリヌクレオチドとの接触を促進することを含む方法を含む。複合体の、ポリヌクレオチドとの接触により、操作されたI型CRISPR−Casエフェクター複合体の、ポリヌクレオチド内の核酸標的配列への結合が生じる。
一実施形態において、操作されたI型CRISPR−Casエフェクター複合体は、ポリヌクレオチド内の核酸標的配列と相補的なガイドを含む。操作されたI型CRISPR−Casエフェクター複合体は、ポリヌクレオチド内の核酸標的配列に結合する。
更なる実施形態において、第1の操作されたI型CRISPR−Casエフェクター複合体が、ポリヌクレオチド内の第1の核酸標的配列と相補的なガイドを含み、そして第2の操作されたI型CRISPR−Casエフェクター複合体が、ポリヌクレオチド内の第2の核酸標的配列と相補的なガイドを含む。第1の操作された1つのI型CRISPR−Casエフェクター複合体は、第1の核酸標的配列に結合し、そして第2の操作されたI型CRISPR−Casエフェクター複合体は、ポリヌクレオチド内の第2の核酸標的配列に結合する。
さらに別の実施形態において、操作されたI型CRISPR−Casエフェクター複合体が、ポリヌクレオチド内の核酸標的配列と相補的なガイドを含み、そしてさらに、複合体と会合することができるdCas3*融合タンパク質を含む。操作されたI型CRISPR−Casエフェクター複合体は、ポリヌクレオチド内の核酸標的配列に結合し、そしてエフェクター複合体は、複合体と会合したdCas3*融合タンパク質を含む。
核酸標的配列に結合するそのような方法は、インビトロで(例えば、生化学反応内で、または培養細胞内で;一部の実施形態において、培養細胞は、培養中の、ヒトに導入されていないヒト培養細胞である);インビボで(例えば、生存生物(但し、一部の実施形態において、生物は非ヒト生物であることを条件とする)の細胞内で);またはエクスビボで(例えば、対象から取り出された細胞(但し、一部の実施形態において、対象は、ヒト対象を含み、そして他の実施形態において、対象は、非ヒト対象であることを条件とする))実行することができる。
核酸配列とポリペプチドとの間の相互作用を評価かつ/または定量化する種々の方法が、当該技術において知られており、以下に限定されないが:免疫沈降(ChIP)アッセイ、DNA電気泳動運動能シフトアッセイ(EMSA)、DNAプルダウンアッセイ、ならびにマイクロプレートキャプチャおよび検出アッセイが挙げられる。これらの方法の多くを実行するための市販のキット、材料、および試薬が利用可能であり、例えば、以下の供給者から得ることができる:Thermo Scientific(Wilmington、DE)、Signosis(Santa Clara、CA)、Bio−Rad(Hercules、CA)、およびPromega(Madison、WI)。ポリペプチドと核酸配列との間の相互作用を検出するための一般的なアプローチとして、EMSAがある(例えば、Hellman L.M.ら、Nature Protocols 2巻:1849〜1861頁(2007年)参照)。
別の実施形態において、本発明は、ポリヌクレオチド内の核酸標的配列を切断する方法であって(例えば、dsDNA内の一本鎖切断またはdsDNA内の二本鎖切断)、細胞または生化学反応中への導入のための、1つまたはそれ以上の操作されたI型CRISPR−Casエフェクター複合体を用意して、操作されたI型CRISPR−Casエフェクター複合体を、細胞または生化学反応中に導入することによって、操作されたI型CRISPR−Casエフェクター複合体の、ポリヌクレオチドとの接触を促進することを含む方法を含む。
一実施形態において、ポリヌクレオチド内の第1の核酸標的配列と相補的なガイド、および第1のヌクレアーゼドメイン(例えば、FokI)を含む第1の操作されたI型CRISPR−Casエフェクター複合体(図15A、カスケード1、実線の輪郭のボックス、リンカーポリペプチド(黒色の曲線)を介して、第1のヌクレアーゼドメイン(扇形として表される)に連結されている)、ならびにポリヌクレオチド内の第2の核酸標的配列と相補的なガイド、および第2のヌクレアーゼドメイン(例えば、FokI)を含む第2の操作されたI型CRISPR−Casエフェクター複合体(図15A、カスケード2、破線の輪郭のボックス、リンカーポリペプチド(黒色の曲線)を介して、第2のヌクレアーゼドメイン(扇形として表される)に連結されている)が、細胞または生化学反応中に導入される。第1の操作されたI型CRISPR−Casエフェクター複合体(図15B、カスケード1)は、dsDNA(図15B、dsDNA、対形成された、黒色の水平の線によって表される)内の第1の核酸標的配列に結合し、そして第1のヌクレアーゼドメインは、dsDNAの第1の鎖を切断し(図15C、カスケード1)、そして第2の操作されたI型CRISPR−Casエフェクター複合体(図15B、カスケード2)は、dsDNA内の第2の核酸標的配列に結合し、そして第2のヌクレアーゼドメインは、dsDNAの第2の鎖を切断する。操作されたI型CRISPR−Casエフェクター複合体の結合は、操作されたI型CRISPR−Casエフェクター複合体によって、ポリヌクレオチド(例えば、dsDNA)内の核酸標的配列の切断をもたらす。
更なる実施形態において、ポリヌクレオチド内の第1の核酸標的配列と相補的なガイドを含む第1の操作されたI型CRISPR−Casエフェクター複合体、ポリヌクレオチド内の第2の核酸標的配列と相補的なガイドを含む第2の操作されたI型CRISPR−Casエフェクター複合体、およびCas3ニッカーゼ(例えば、ニッカーゼ活性のみを有するATPアーゼ欠損Cas3バリアント)が、細胞または生化学反応中に導入される。第1の操作されたI型CRISPR−Casエフェクター複合体は、dsDNA内の第1の核酸標的配列に結合し、Cas3ニッカーゼタンパク質は、第1の複合体と会合して、dsDNAの第1の鎖を切断し、そして第2の操作されたI型CRISPR−Casエフェクター複合体は、dsDNA内の第2の核酸標的配列に結合し、Cas3ニッカーゼタンパク質は、第2の複合体と会合して、dsDNAの第2の鎖を切断する。Cas3ニッカーゼタンパク質が会合した、操作されたI型CRISPR−Casエフェクター複合体の結合は、操作されたI型CRISPR−Casエフェクター複合体によって、ポリヌクレオチド(例えば、dsDNA)内の核酸標的配列の切断をもたらす。実施例25A、実施例25B、および実施例25Cは、Cas3 ATPアーゼ欠損突然変異タンパク質を含むカスケードRNP複合体が、対形成されたニッキングによる標的化されたゲノム欠失を誘導することができることを実証するデータを示す。この対形成されたニッキングは、宿主細胞(例えば、ヒト細胞)のゲノム内で、標的化された欠失を促進することができる。
別の実施形態において、ポリヌクレオチド内の核酸標的配列と相補的なガイド、および第1のヌクレアーゼドメイン(例えば、FokI)を含む操作されたI型CRISPR−Casエフェクター複合体(図16A、カスケード;破線の輪郭のボックス、リンカーポリペプチド(黒色の曲線)を介して、第1のヌクレアーゼドメイン(扇形として表される)に連結されている)、ならびに複合体と会合することができるdCas3*−第2のヌクレアーゼドメイン(例えば、FokI)融合タンパク質(図16A、dCas3;実線の輪郭のボックス、リンカーポリペプチド(黒色の曲線)を介して、第2のヌクレアーゼドメイン(扇形として表される)に連結されている)が、細胞または生化学反応中に導入される。操作されたI型CRISPR−Casエフェクター複合体(図16B、カスケード)は、dsDNA(図16B、対形成された、黒色の水平の線)内の核酸標的配列に結合して、dsDNAの第1の鎖を切断し(図16C、カスケード)、そしてdCas3*融合タンパク質は、カスケードRNP複合体と会合して(図16B、dCas3*)、dsDNAの第2の鎖を切断する(図16C、dCas3*)。
更なる実施形態において、ポリヌクレオチド内に核酸標的配列を含む標的領域と相補的なガイドを含む操作されたI型CRISPR−Casエフェクター複合体、および当該複合体と会合することができるCas3タンパク質(例えば、Cas3タンパク質またはmCas3タンパク質)が、細胞または生化学反応中に導入される。操作されたI型CRISPR−Casエフェクター複合体は、dsDNA内の核酸標的配列に結合し、Cas3タンパク質(例えば、Cas3タンパク質またはmCas3タンパク質)は、複合体と会合して、標的領域内のdsDNAの少なくとも1本の鎖を切断する。一部の実施形態において、mCas3タンパク質によるdsDNAの切断は、dsDNAの標的領域内の欠失をもたらす。この方法は、特定の長さの広範囲の欠失を形成するのに用いることができ、そして遺伝子ノックアウトまたはノックインの作出に有用であり得る。一部の実施形態において、Cas3タンパク質(例えば、Cas3タンパク質またはmCas3タンパク質)を、カスケード複合体サブユニットタンパク質(例えば、Cas7タンパク質、Cas8タンパク質、Cas5タンパク質、Cse2タンパク質)に融合させることができる。実施例23A〜実施例23Cは、mCas3タンパク質の実施形態を記載している。
別の実施形態において、本発明は、I型CRISPR−Casエフェクター複合体を用いることに関し、核酸標的配列を欠失させるために、ヌクレアーゼドメインが、カスケード複合体タンパク質(例えば、実施例11A、表38参照)に、またはdCas3*タンパク質(例えば、DNaseに融合したdCas3*タンパク質)に融合されている。この方法は、dsDNAの標的領域内の切断および欠失を形成するのに用いることができ、そして遺伝子ノックアウトの作出に有用であり得る。一部の実施形態において、ヌクレアーゼドメインを、カスケード複合体サブユニットタンパク質、例えば、Cas7タンパク質、Cas8タンパク質、Cas5タンパク質、Cse2タンパク質に融合させることができる。
ポリヌクレオチド内の核酸標的配列を切断する方法がさらに、細胞のgDNA中へのドナーポリヌクレオチドの少なくとも一部の組込みを促進するための、細胞中へのドナーポリヌクレオチドの導入を含んでもよい。
図17Aは、ポリヌクレオチド内の第1の核酸標的配列と相補的なガイドおよび第1のヌクレアーゼドメイン(例えば、FokI)(図17A、カスケード1に連結している曲線として示されているリンカーポリペプチド、および灰色の扇形)を含む第1の操作されたI型CRISPR−Casエフェクター複合体(図17A、カスケード1)、ならびにポリヌクレオチド内の第2の核酸標的配列と相補的なガイドおよび第2のヌクレアーゼドメイン(例えば、FokI)(図17A、カスケード2に連結している曲線として示されるリンカーポリペプチド、および灰色の扇形)を含む第2の操作されたI型CRISPR−Casエフェクター複合体(図17A、カスケード2)によって切断されているdsDNAの双方の鎖(図17A、対形成された、暗い水平の線)の例を示している。図17Bは、二本鎖切断された部位に隣接するDNA配列(図18B、ドナー、破線)と相補的な相同アームを含むドナーポリヌクレオチド(図17B、カスケード2の上方に示される対形成された破線)を示している。図17Cは、二本鎖切断された部位の領域内での、ドナーポリヌクレオチドの一部(図17C、dsDNAを表す対形成された、暗い水平の線を連結する対形成された破線)の組込みを示す。ドナーポリヌクレオチドの組込みは、細胞DNA修復機構(例えば、HDR)によって媒介される(図17B〜図17C、下向きに指している垂直な矢印は、細胞DNA修復機構を表す)。
他の実施形態において、ポリヌクレオチド内の第1の核酸標的配列と相補的なガイド、および第1のヌクレアーゼドメインを含む操作されたI型CRISPR−Casエフェクター複合体は、第2のヌクレアーゼドメインを含む第2の構成要素と対形成することができ、第2の構成要素は、ポリヌクレオチド内の第2の核酸標的配列に結合することができる。そのような第2の構成要素の例として、第2のヌクレアーゼドメインを含む転写アクチベーター様エフェクターヌクレアーゼ(TALEN)、第2のヌクレアーゼドメインを含むジンクフィンガーヌクレアーゼ(ZFN)、または第2のヌクレアーゼドメインを含むdCas9/NATNA複合体が挙げられる。
一実施形態において、標的ポリヌクレオチド(例えば、gDNA)の領域を、標的ポリヌクレオチド内の第1の核酸標的配列と相補的なガイドを含むカスケード複合体と、dCas9/NATNA複合体との組合せを用いて欠失させることができ、NATNAは、標的ポリヌクレオチド内の第2の核酸標的配列と相補的なスペーサー配列を含む。第1および第2の核酸標的配列は、欠失のために標的化された核酸標的配列に隣接するように選択される。活性エンドヌクレアーゼ活性を含むCas3タンパク質が、カスケード複合体と会合してから、欠失のために標的化された核酸標的配列を含むdsDNAの一本鎖を、次第に欠失させる。Cas3タンパク質がdCas9/NATNA複合体(すなわち、「ロードブロック」)と衝突すると、Cas3ヌクレアーゼ活性は、dCas9/NATNA複合体によって第2の核酸標的配列にて停止し得る。図21A〜図21Dは、核酸標的配列のCas3欠失の例を示す。図21Aは、欠失のために標的化された核酸標的配列に隣接する核酸標的配列1(図21A、NATS1)および核酸標的配列2(図21A、NATS2)を含むdsDNA(図21A、対形成された、黒色の水平の線)を示す。図21Aは、NATS1と相補的なガイドを含むカスケード複合体(図21A、カスケード;黒色の線のフレームの矩形)、Cas3タンパク質(図21A、Cas3;灰色の扇形)、およびNATS2と相補的なスペーサーを含むdCas9/NATNA複合体(図21A、dCas9;破線のフレームの矩形)を示している。図21Bは、NATS1へのカスケード複合体の結合、カスケード複合体とのCas3タンパク質の会合、およびNATS2へのdCas9/NATNA複合体の結合を示す。図21Cは、欠失のために標的化された核酸標的配列の一本鎖の、Cas3による漸進的欠失を示す。図21Dは、NATS2に結合したdCas9/NATNA複合体の位置での、dsDNAからのCas3タンパク質の解離を示す。実施例24A〜実施例24Dは、カスケード核タンパク質複合体と会合したCas3タンパク質によって媒介される欠失の長さを制御するためのタンパク質ロードブロックの使用を支持するデータを示している;このように、カスケード核タンパク質複合体と会合したCas3タンパク質を用いて、細胞(例えば、ヒト細胞)のgDNA内で、長さが定義された欠失の形成を促進する方法が提供される。
別の実施形態において、標的ポリヌクレオチド(例えば、gDNA)の領域を、標的ポリヌクレオチド内の第1の核酸標的配列と相補的なガイドを含む第1のカスケード複合体と、標的ポリヌクレオチド内の第2の核酸標的配列と相補的なガイドを含む第2のカスケード複合体との組合せを用いて欠失させることができる。第1および第2の核酸標的配列は、欠失のために標的化された核酸標的配列に隣接するように選択される。活性エンドヌクレアーゼ活性を含むCas3タンパク質が、各カスケード複合体と会合してから、欠失のために標的化された核酸標的配列の双方の鎖を、次第に欠失させる。各Cas3タンパク質がカスケード複合体の1つと衝突すると、Cas3ヌクレアーゼ活性は、カスケード複合体によって第1および第2の核酸標的配列にて停止し得る。図22A〜図22Dは、核酸標的配列の双方の鎖のCas3欠失の例を示す。図22Aは、欠失のために標的化された核酸標的配列に隣接する核酸標的配列1(図22A、NATS1)および核酸標的配列2(図22A、NATS2)を含むdsDNA(図22A;対形成された、黒色の水平の線)を示す。図22Aは、NATS1と相補的なガイドを含む第1のカスケード複合体(図22A、カスケード1;黒色の線のフレームの矩形)、Cas3タンパク質(図22A、Cas3;灰色の扇形)、およびNATS2と相補的なガイドを含む第2のカスケード複合体(図22A、カスケード2;破線のフレームの矩形)を示す。図22Bは、NATS1およびNATS2へのカスケード複合体の結合、ならびにカスケード複合体とのCas3タンパク質の会合を示す。図22Cは、欠失のために標的化された核酸標的配列の双方の鎖の、Cas3によるDNAおよびヌクレアーゼ分解に沿う移動に由来する漸進的欠失を示す。図22Dは、NATS1およびNATS2に結合したカスケード複合体の位置での、dsDNAからのCas3タンパク質の解離を示す。
更なる実施形態において、カスケード複合体を、Cas3タンパク質に結合することができないように改変することができ、そしてそのような改変カスケード複合体は、図21A〜図21Dにおいて示されるのと本質的に同じようにして、カスケードRNP複合体と会合した、触媒活性のあるCas3によるDNAの漸進的分解を停止するロードブロックとして作用することができる。更なる部位特異的結合タンパク質(例えば、転写アクチベーター様エフェクター(TAL)またはジンクフィンガー(ZnF)DNA結合タンパク質)を、同様にロードブロックとして用いることができる。
一部の実施形態において、核酸標的配列は、dsDNA(例えば、ゲノム)DNAである。一部の実施形態において、核酸標的配列は、二本鎖であり、そして鎖の一方または双方が切断される。核酸標的配列を切断するそのような方法を、インビトロで、インビボで、またはエクスビボで実行することができる。
先で述べたように、一部の実施形態において、本発明は、ドナーポリヌクレオチドの存在下で、dsDNA内の核酸標的配列の切断を促進するための、宿主細胞中への1つまたはそれ以上の操作されたI型CRISPR−Casエフェクター複合体の導入に関し、1つまたはそれ以上の操作されたI型CRISPR−Casエフェクター複合体は、宿主細胞DNAの核酸標的配列を含む標的領域内に切断部位(または切断部位および関連する欠失)を生成することによって、標的領域中へのドナーポリヌクレオチドの少なくとも一部の挿入を促進する。一部の実施形態において、切断部位は、標的領域内の二本鎖切断である(例えば、スペーサー、ならびにCasタンパク質およびエンドヌクレアーゼ(例えば、FokI)を含む融合タンパク質を各々含む2つの操作されたI型CRISPR−Casエフェクター複合体、またはCas3タンパク質もしくはmCas3タンパク質と会合するスペーサーを各々含む2つの操作されたI型CRISPR−Casエフェクター複合体を用いる場合)。一部の実施形態において、切断部位は、標的領域内の一本鎖切断である(例えば、mCas3タンパク質と会合したI型CRISPR−Casエフェクター複合体を用いる場合)。他の実施形態において、切断部位は、標的領域内の欠失である(例えば、Cas3またはmCas3タンパク質と会合したI型CRISPR−Casエフェクター複合体を用いる場合)。
相同組換え修復(HDR)を実証するために、ヒトゲノム内の4つの遺伝子座(WDR92、B2M、CCR5、およびTRAC)に対してFokI−PseCascade RNP複合体を標的化するように、最小CRISPRアレイを設計した。最小CRISPRアレイを、3つのオリゴヌクレオチド(配列番号1513〜配列番号1515;実施例20A)、および「リピート−スペーサー−リピート−スペーサー−リピート」配列をコードするユニークなプライマーを用いたPCRベースのアセンブリーで生成し、第1および第2のスペーサーは、FokI−PseCascade RNP複合体を、隣接する核酸標的配列に向けて、FokI二量体化およびゲノム切断(すなわち、切断部位の生成)を可能にした。
切断部位を含む標的領域内の各HDR挿入部位(この場合、切断部位と重複する)について、細胞を以下で形質移入した:NLSがFokIのN末端に連結されたCas8のN末端に融合したFokIを含むFokI−PseCascade複合体タンパク質構成要素をコードする3μgのベクター、150ngの最小CRISPRアレイ、およびHDRのための0〜60pmolの一本鎖オリゴデオキシヌクレオチド(ssODN)鋳型ドナーポリヌクレオチド。ssODNは、相同アームを含み、各相同アームは、75ヌクレオチドであり、そして2本のアームを、切断部位の周りに対称的に位置決めした。ドナーポリヌクレオチドはさらに、ドナーポリヌクレオチドの細胞分解を低減させ、または妨げるために、相同アームの3’末端のヌクレオチドにホスホロチオアート結合を含んだ。ホスホロチオエート結合の5’に、ドナーポリヌクレオチドはさらに、2つの終止コドンを挿入するための、そして修復される染色体内のスペーサー間距離を増大させることで、FokI−PseCascade RNP複合体の再切断を妨げるための「TAATAAT」の挿入配列を含んだ。
形質移入を、HDRを可能にするために混合物内にssODNを含めたこと以外は、実施例20Bに本質的に記載されるようにHEK293細胞内で実行した。形質移入の数日後に、gDNAを細胞から精製して、エキソヌクレアーゼで処理して、以降のPCRに混入する虞があるいかなる残留ssODNも除去してから、ドナー挿入を測定するための増幅用の鋳型として用いた。ディープシーケンシング分析を、実施例20Cに本質的に記載されるように実行した。この実験由来の総リード中の突然変異リードのパーセンテージを、表13に示す(第1列は、ssODNのpmolである):
突然変異リードのパーセンテージは、非相同末端結合に由来するインデル、および「TAATAAT」HDR配列の挿入を含有する突然変異リードを示す。
「TAATAAT」挿入配列のみを含有する、この実験由来の総突然変異リード中のHDRリードのパーセンテージを、表14に示す(第1の列は、ssODNのpmolである):
データから分かるように、カスケードRNP複合体によるdsDNAの切断は、ヒトゲノムの全体にわたる複数の遺伝子座にて、ドナーポリヌクレオチドのHDRおよび組込みを可能にする。
さらに別の実施形態において、本発明は、細胞または生化学反応内のポリヌクレオチド(例えば、DNA)内の1つまたはそれ以上の核酸標的配列を改変する方法であって、細胞または生化学反応中への導入用の1つまたはそれ以上の操作されたI型CRISPR−Casエフェクター複合体(例えば、Casサブユニットタンパク質−シチジンデアミナーゼ融合タンパク質を含む)を用意することと、操作されたI型CRISPR−Casエフェクター複合体を、細胞または生化学反応中に導入することによって、操作されたI型CRISPR−Casエフェクター複合体の、ポリヌクレオチドとの接触を促進して、ポリヌクレオチド内の核酸標的配列への操作されたI型CRISPR−Casエフェクター複合体の結合をもたらして、核酸標的配列の突然変異(例えば、CからT、GからA、AからG、そしてTからC)を促進することとを含む方法を含む。図18A〜図18Dは、Casサブユニットタンパク質−リンカーポリペプチド−シチジンデアミナーゼ融合タンパク質(カスケード/CD複合体)を含むカスケード複合体を用いて、細胞のgDNA内の標的ヌクレオチドを突然変異させる例を示している(図18A、対形成された暗い水平の線、シトシンについて「C」、グアニンについて「G」)。カスケード/CD複合体(図18A;「カスケード」は、カスケード、および灰色の扇形として表されるシチジンデアミナーゼ「CD」を連結する曲線として示されるリンカーポリペプチドを有する)が、細胞中に導入される。カスケード/CD複合体は、標的シトシン(図18B、「C」)に隣接するDNA標的配列と相補的なガイドを含む。図18Bにおいて、カスケード/CD複合体は、DNA標的配列に結合し、そしてシチジンデアミナーゼは、シトシン(図18B、「C」)をウラシル(図18C、「U」)に変換する。次に、細胞の修復機構は、ウラシルをチミジンに修復し、そしてミスマッチしたグアニジンをアデニンに変えることができる(図18C〜図18D、下向きに指している垂直な矢印は、細胞DNA修復機構を表す)。
さらに別の実施形態において、本発明は、インビトロまたはインビボの転写、例えば、調節要素配列を含む遺伝子の転写を調節する方法を含む。そのような方法は、細胞または生化学反応中への導入のための、1つまたはそれ以上の操作されたI型CRISPR−Casエフェクター複合体(例えば、Casサブユニットタンパク質−転写因子融合タンパク質を含む)を用意することと、操作されたI型CRISPR−Casエフェクター複合体を、細胞または生化学反応中に導入することによって、操作されたI型CRISPR−Casエフェクター複合体の、調節要素配列との接触を促進して、操作されたI型CRISPR−Casエフェクター複合体の、調節要素配列への結合をもたらすことによって、調節要素配列を含む遺伝子のインビトロ、またはインビボでの転写の調節を促進することとを含む。
図19Aおよび図19Bは、包括的な遺伝子(「遺伝子1」)の転写活性化についての、例となる一般的なイラストを示す。図19Aは、真核細胞内の内因性遺伝子の転写調節の概要を示す。図19Aにおいて、2本の暗い平行線は、二本鎖DNAを表し、遺伝子1(図19A、遺伝子1)の位置、および遺伝子1と関連する転写開始部位(図19A、TSS)が示されている。図19Aの第1のパネルにおいて、遺伝子1の転写活性化に必要とされる転写因子(図19A、TF)、およびポリメラーゼII(図19A、Pol II)が、遺伝子1−TSSとまだ会合していない状態で示されている。第2のパネルは、TFの、そのコグネイトTSSとの会合を示す。次に、TFは、転写活性化タンパク質(図19A、TP)を動員し、これはその後、RNAポリメラーゼII(図19A、Pol II)を動員する。典型的に、真核生物において、TF因子およびTPは、複数のタンパク質、およびおそらく他の分子を含む複合体を形成する。第3のパネルは、Pol IIによる、遺伝子1の結果として生じる転写を示す(図19A、遺伝子1の終端の曲がった矢印は、転写の方向を示す)。このタイプの転写活性化は、典型的に、遺伝子の発現に特異的であるTFに依存する。図19Bは、本発明の一実施形態のイラストを示しており、カスケード複合体が、転写活性化を担う細胞内の1つまたはそれ以上の構成要素(転写活性化因子;図19B、TA)を誘引するタンパク質または因子(図19B、CASCADEa)を含むように操作されている。そのようなタンパク質または因子の例として、タンパク質VP64がある。CASCADEaは、TSS(図19B、TSS)に、またはその近くに結合することができるガイドを含む。図19Bにおいて、2本の暗い平行線は、二本鎖DNAを表し、遺伝子1(図19B、遺伝子1)の位置、および遺伝子1と関連する転写開始部位(TSS)が示されている。図19Bの第1のパネルにおいて、CASCADEaおよびポリメラーゼII(図19B、Pol II)が、遺伝子1−TSSとまだ会合していない状態で示されている。第2のパネルは、CASCADEaの、その標的、TSSとの会合を示す。次に、CASCADEaは、転写活性化タンパク質(図19B、TA)を動員し、これはその後、RNAポリメラーゼII(図19B、Pol II)を動員する。第3のパネルは、Pol IIによる、遺伝子1の結果として生じる転写を示す(図19B、遺伝子1の終端の曲がった矢印は、転写の方向を示す)。本発明のこの実施形態の一利点は、遺伝子の転写活性化が、遺伝子のTSSに結合する内因性転写因子に依存するのではなく、遺伝子のTSSを、適切なカスケードガイドの選択によって標的化することができることである。
図20Aおよび図20Bは、Casサブユニットタンパク質−KRABドメイン融合体、および遺伝子1と関連する調節配列(図20A、プロモーター)と相補的なガイドを含むカスケード複合体(図20A、曲線として示されるリンカーポリペプチドが、カスケード、およびKRABドメインを表す環状要素を連結しているCASCADEi)を用いた、包括的遺伝子(図20A、遺伝子1)の転写抑制についての、例となる一般的なイラストを示す。CASCADEiの、調節配列への結合(図20B)が、遺伝子1の転写抑制をもたらす(図20B、Xで終わる暗い線は、転写抑制を示す)。
本明細書中に記載される、操作されたI型CRISPR−Casエフェクター複合体を、キット中に組み込むことができる。一部の実施形態において、キットは、1つまたはそれ以上のコンテナがキット要素を、1つもしくはそれ以上の別個の組成物として、または場合により、構成要素の適合性が許すならば、混合物として保持する、パッケージを含む。一部の実施形態において、キットはまた、以下の賦形剤の1つまたはそれ以上を含む:バッファ、緩衝剤、塩、滅菌水溶液、保存剤、およびそれらの組合せ。実例となるキットは、1つもしくはそれ以上の操作されたI型CRISPR−Casエフェクター複合体、および1つもしくはそれ以上の賦形剤、または操作されたI型CRISPR−Casエフェクター複合体の1つもしくはそれ以上の構成要素をコードする1つもしくはそれ以上の核酸配列を含んでもよい。
さらに、キットは、操作されたI型CRISPR−Casエフェクター複合体組成物を用いるための説明書をさらに含んでもよい。
本発明の別の態様は、1つまたはそれ以上の操作されたI型CRISPR−Casエフェクター複合体、またはその構成要素を作製または製造する方法に関する。一実施形態において、作製または製造する方法は、細胞内での操作されたI型CRISPR−Casエフェクター複合体の生成、および細胞溶解液からの操作されたI型CRISPR−Casエフェクター複合体の精製を含む。
操作されたI型CRISPR−Casエフェクター複合体組成物はさらに、検出可能な標識、例えば、検出可能なシグナルを提供することができる部分を含んでもよい。検出可能な標識の例として、以下に限定されないが、酵素、放射性同位体、特異的結合対のメンバー、フルオロフォア(FAM)、蛍光タンパク質(緑色蛍光タンパク質(GFP)、赤色蛍光タンパク質、mCherry、tdTomato)、適切なフルオロフォアと一緒のDNAまたはRNAアプタマー(増強GFP(eGFP)、「Spinach」)、量子ドット、および抗体等が挙げられる。多数の、そして種々の適切な検出可能な標識が、当業者に周知である。
一部の実施形態において、操作されたI型CRISPR−Casエフェクター複合体(すなわち、核タンパク質粒子)は、以下に限定されないが、ヌクレオフェクション、遺伝子ガン送達、ソノポレーション、細胞スクイージング、リポフェクション、または他の化学物質、細胞透過ペプチド等の使用を含む方法によって細胞中に導入することができる。他の実施形態において、操作されたI型CRISPR−Casエフェクター複合体および関連タンパク質の1つまたはそれ以上の構成要素についてのコード配列を、ベクター系、構成要素の1つまたはそれ以上をコードするDNA配列を含む発現カセット、および構成要素の1つまたはそれ以上をコードするRNA配列を含む発現カセットを含む1つまたはそれ以上のRNA分子(例えば、mRNA)を用いて、細胞中に導入することができる。
本発明の一実施形態は、組換え細胞(例えば、改変リンパ球)を生成するための、操作されたI型CRISPR−Casエフェクター複合体の使用に関する。当該方法は、典型的に、宿主細胞での、核酸標的配列を含む標的領域を含むdsDNAの、本発明の1つまたはそれ以上の操作されたクラス1 I型CRISPR−Casエフェクター複合体との接触を促進することを含む。操作されたクラス1 I型CRISPR−Casエフェクター複合体の、核酸標的配列との接触により、操作されたクラス1 I型CRISPR−Casエフェクター複合体の、核酸標的配列を含む標的領域との結合、核酸標的配列を含む標的領域の切断、および標的領域内のdsDNAの改変が生じるので、組換え細胞を生成する。一部の実施形態において、dsDNAは、1つを超える核酸標的配列を含み、そして各核酸標的配列と相補的なスペーサー配列を含む操作されたクラス1 I型CRISPR−Casエフェクター複合体は、各核酸標的配列に結合して、これを切断し、かつ改変するのに用いられる。一部の実施形態において、標的領域の改変は、挿入、欠失、または挿入および欠失である。細胞中への導入のための、1つまたはそれ以上の操作されたI型CRISPR−Casエフェクター複合体を用意することを含む、ポリヌクレオチド内の核酸標的配列を切断する方法(例えば、dsDNA内の一本鎖切断またはdsDNA内の二本鎖切断)が、先に記載されている。
本発明の実施形態は、1つまたはそれ以上の操作されたクラス1 I型CRISPR−Casエフェクター複合体を用いて組換え細胞を生成することを含み、組換え細胞のgDNAは、(例えば、B2M遺伝子および/またはPDCD1遺伝子の)ノックアウト突然変異、ノックイン(例えば、TRAC遺伝子座での編集、およびドナーポリヌクレオチド由来のCARの統合)、またはそれらの組合せを含む。一部の実施形態において、gDNAのTRAC遺伝子内の核酸標的配列での切断の後に、核酸標的配列でのドナーポリヌクレオチドの少なくとも一部の組込みが続く。ドナーポリヌクレオチドは、CAR構築体を含んでよく、CARは、核酸標的配列内に挿入される。
本発明の方法によって製造される組換え細胞を、養子細胞移入(ACT)に用いることができる。ACTは、移植免疫細胞を用いて癌を処置する、急速に台頭した免疫治療アプローチである。ACTは、患者中への細胞の移入である。最も一般的に、免疫細胞は、免疫機能を向上させることを目的として、免疫系に由来する。自己由来癌免疫治療において、免疫細胞または幹細胞は、患者から収穫されて、エクスビボ培養によって大量に増殖されてから、患者に戻される。免疫細胞または幹細胞を、培養における種々の方法(例えば、T細胞のゲノム中にCARを組み込むための、ゲノム編集の使用)で改変することができる。一部の実施形態において、改変のためのリンパ球が、対象から単離されて、改変されてから、同じ対象中に再導入される。この技術は、自己由来リンパ球治療として知られている。同種異系癌免疫治療において、単一のドナーに由来する、培養増殖された免疫細胞または幹細胞が、多数の患者への処置を実現する。また、そのような免疫細胞または幹細胞を、培養における種々の方法で改変することができる。一部の実施形態において、リンパ球を単離して、改変して、異なる対象中に導入してよい。この技術は、同種異系リンパ球治療として知られている。
特定の実施形態において、そのような免疫治療法は、以下に限定されないが、T細胞、ナチュラルキラー細胞(NK細胞)、B細胞、腫瘍浸潤リンパ球(TIL)、キメラ抗原受容体T細胞(CAR−T細胞)、T細胞受容体操作T細胞(TCR)、TCR CAR−T細胞、CAR TIL細胞、CAR−NK細胞、操作されたNK細胞、またはリンパ球を生じさせる造血幹細胞が挙げられるリンパ球を利用してよい。他の実施形態において、細胞は、幹細胞、樹状細胞等である。そのような細胞のゲノムは、本発明の1つまたはそれ以上の操作されたクラス1 I型カスケードエフェクター複合体の使用によって改変することができる(例えば、リンパ球ゲノムにおける挿入および/または欠失の生成)。
改変のためのリンパ球を、対象、例えばヒト対象から、例えば、例えばTILの場合、血液から、もしくは固体腫瘍から、またはリンパ器官、例えば、胸腺、骨髄、リンパ節、および粘膜関連リンパ組織から単離することができる。リンパ球を単離する技術は、当該技術において周知である。例えば、リンパ球は、末梢血単核細胞(PBMC)から単離することができ、これは、例えば、ficoll、血液の層を分離する親水性の多糖、および密度勾配遠心分離を用いて、全血から分離される。通常、抗凝固剤または脱線維血標本が、ficoll溶液の最上部で層にされて、遠心分離されて、細胞の異なる層が形成される。最下層は、赤血球を含み、これが、ficoll培地によって収集または凝集されて、通過して、下部に完全に沈む。次の層は、顆粒球を主に含有し、これもまた、ficoll−paque溶液を通過して下方に移動する。次の層は、リンパ球を含み、これは典型的に、単球および血小板と共に、血漿とficoll溶液間の界面にある。リンパ球を単離するために、この層を回収して、塩溶液で洗浄して、血小板、ficoll、および血漿を除去してから、再度遠心分離する。これ以外にも、細胞を、遠心分離技術(例えば、CellSaver(登録商標)(Haemonetrics、Braintree、MA)機械またはLovo Automated Cell Processing System(Fresenius Kabi USA、LLC、Lake Zurich、ILを用いて)により、ドナー血液から単離することができる。
リンパ球を単離するための他の技術は、バイオパニングを含み、これは、抗体コーティングしたプラスチック表面に、注目する細胞を結合させることによって、細胞集団を溶液から単離する。次に、不所望の細胞を、特異的抗体および補体による処理によって除去する。加えて、蛍光活性化セルソーティング(FACS)分析を用いて、リンパ球を検出かつカウントすることができる。FACS分析は、光散乱および蛍光の差異に基づいて、標識された細胞を分離するフローサイトメーターを用いる。
TILについて、リンパ球を腫瘍から単離して、例えば高用量IL−2内で増殖させて、自己由来腫瘍またはHLA一致腫瘍細胞株のいずれかに対するサイトカイン放出共培養アッセイを用いて選択する。同種異系非MHC一致対照と比較して特異的反応性が増大した証拠がある培養体を選択して、急速に増殖させてから、対象中に導入して、癌を処置する(例えば、Rosenberg、S.ら、Clin.Cancer Res.17巻:4550〜4557頁(2011年);Dudly、M.ら、Science 298巻:850〜854頁(2002年);Dudly、M.ら、J.Clin.Oncol.26巻:5233〜5239頁(2008年);Dudley、M.ら、J.Immnother.26巻:332〜342頁(2003年)参照)。
単離して直ぐに、リンパ球を、特異性、頻度、および機能に関して特徴付けることができる。頻繁に使用されるアッセイとして、ELISPOTアッセイが挙げられ、これは、T細胞応答の頻度を測定する。
一部の実施形態において、CD4+およびCD8+T細胞は、ドナー末梢血単核細胞(PBMC)から単離される。当業者であれば、先に述べたような種々の方法によって、T細胞または他のリンパ系細胞を単離することができる。また、そのような細胞は、iPSC細胞からの分化によって単離することができる。
単離の後、リンパ球を、当該技術において知られている技術を用いて活性化して、増殖、および特殊なエフェクターリンパ球への分化を促進することができる。活性化されたT細胞用の表面マーカーとして、例えば、CD3、CD4、CD8、PD1、およびIL2R等が挙げられる。活性化された細胞障害性リンパ球は、標的細胞の表面上のコグネイト受容体に結合した後に、標的細胞を死滅させることができる。NK細胞用の表面マーカーとして、例えば、CD16およびCD56等が挙げられる。
単離、および場合により活性化の後に、リンパ球を、所望の特徴をもたらすように改変することができる。本発明の1つまたはそれ以上の操作されたI型カスケードエフェクター複合体を用いて、以下に限定されないが、発現されることとなるコード配列の導入、および/または内因性遺伝子発現の不活化が挙げられるゲノム改変を導入することができる。一部の実施形態において、本発明の1つまたはそれ以上の操作されたI型カスケードエフェクター複合体を用いて、TRAC遺伝子(T細胞受容体α定常部をコードする)、B2M遺伝子(β2ミクログロブリンをコードする)、および/またはPDCD1遺伝子(プログラム細胞死タンパク質1(PD−1としても知られている)をコードする)を編集することができる。
T細胞およびNK細胞が、本発明の方法によって改変することができるリンパ球の例である。一部の実施形態において、本発明の1つまたはそれ以上の操作されたI型カスケードエフェクター複合体を用いて、CARを含むドナーポリヌクレオチドの存在下で遺伝子の標的領域内に切断部位を導入することができ、CARは、リンパ球のゲノムの標的領域中に組み込まれる。更なる実施形態において、本発明の1つまたはそれ以上の操作されたI型カスケードエフェクター複合体を用いて、遺伝子の標的領域内に切断部位を導入して、遺伝子の発現を防止するためのノックアウト突然変異の生成を促進することができる。
別の実施形態において、本発明の操作されたI型カスケードエフェクター複合体を用いて、ヒトiPSC中にゲノム改変を導入することができる。一部の実施形態において、本発明の1つまたはそれ以上の操作されたI型カスケードエフェクター複合体を用いて、TRAC遺伝子、B2M遺伝子、および/またはPDCD1遺伝子を編集することができる。更なる実施形態において、操作されたI型カスケードエフェクター複合体をドナーポリヌクレオチドと一緒に用いて、ゲノム改変、およびコード配列、例えばCARまたはサイトカイン(例えばIL2およびIL15等)を導入することができる。次に、改変iPSC細胞を、T細胞およびNK細胞または樹状細胞を含む成熟細胞型にさらに分化させることができる。一部の実施形態において、改変iPSCを、CAR−T細胞およびCAR−NK細胞に分化させることができる。
本発明の方法の一部の実施形態において、ドナーポリヌクレオチドは、CARをコードするポリヌクレオチドを含む。CARを、相同組換え(「ノックイン」)を介して、切断部位を含む遺伝子(例えば、TRAC遺伝子)の標的領域中への挿入のために標的化することができる。このアプローチの利点は、標的化されたTRAC遺伝子のノックアウトを実現する;すなわち、TRAC遺伝子を無効にすることもできることである。CAR構築体中に組み込むことができる細胞外抗原認識ドメインの例が、先に記載されている(表2参照)。一実施形態において、細胞外抗原認識ドメインは、CD19結合部分(例えば、抗CD19 scFv)を含む。別の実施形態において、細胞外抗原認識ドメインは、B細胞成熟抗原(BCMA)結合部分(例えば、抗BCMA scFv)を含む。
DNAの標的領域内に切断部位を生成することを含む本発明の方法の実施形態において、当該方法はさらに、ドナーポリヌクレオチドを改変細胞中に導入することによって、改変細胞の、切断部位を含む標的領域中へのドナーポリヌクレオチドの少なくとも一部の挿入を促進することを含んでよい。ドナーポリヌクレオチドは、改変細胞中に直接導入することができる。一部の実施形態において、ドナーポリヌクレオチドは、ベクターを用いて導入される。ベクターの構築のための一般的な方法が、当該技術において知られている。ウイルスベクターの例として、以下に限定されないが、レンチウイルス、レトロウイルス、アデノウイルス、単純ヘルペスウイルスIまたはII、パルボウイルス、細網内皮症ウイルス、およびAAVベクターが挙げられる。
本発明の方法の更なる実施形態は、B2M遺伝子内への突然変異の導入を含む。好ましい実施形態において、突然変異は、B2M遺伝子内のノックアウト突然変異である。
本発明の方法の更なる実施形態は、PDCD1遺伝子内への突然変異の導入を含む。好ましい実施形態において、突然変異は、PDCD1遺伝子内のノックアウト突然変異である。
本発明の1つまたはそれ以上の操作されたI型カスケードエフェクター複合体によって促進されるゲノム改変は、操作されたカスケード複合体、ポリヌクレオチド(例えば、プラスミドまたは発現カセット)、またはそれらの混合物のいずれかを宿主細胞(例えば、リンパ球)中に同時に、または連続的に導入することによって実行することができる。
改変リンパ球を生成した後に、リンパ球を、以下に限定されないが、FACS、マイクロフルイディクスベースのスクリーニングプラットフォーム等が挙げられる高スループットスクリーニング技術等の方法を用いて、細胞が発現する(例えば、所望の細胞表面受容体を発現する)か発現しない(例えば、1つまたはそれ以上の操作されたI型カスケードエフェクター複合体を用いたゲノム編集により発現が不活化された細胞表面タンパク質)かについて選択するためにスクリーニングすることができる。これらの技術は、当該技術において知られている(例えば、Wojcik,M.ら、Int.J.Mol.Sci.16巻:24918〜24945頁(2015年)参照)。
一旦生成されると、改変リンパ球は、処置されることとなる対象への送達用の医薬組成物に製剤化することができる。本発明の組成物は、改変リンパ球および1つまたはそれ以上の薬学的に許容される賦形剤を含む。例示的な賦形剤として、限定されないが、炭水化物、無機塩、抗菌剤、抗酸化剤、界面活性剤、バッファ、酸、塩基、およびそれらの組合せが挙げられる。注射可能な組成物に適した賦形剤として、水、アルコール、ポリオール、グリセリン、植物油、リン脂質、および界面活性剤が挙げられる。炭水化物、例えば糖、誘導体化された糖、例えばアルジトール、アルドン酸、エステル化された糖、および/または糖ポリマーが、賦形剤として存在してもよい。具体的な炭水化物賦形剤として、例えば:単糖、例えば、フルクトース、マルトース、ガラクトース、グルコース、D−マンノース、ソルボース等;二糖、例えば、ラクトース、スクロース、トレハロース、セロビオース等;多糖、例えば、ラフィノース、メレジトース、マルトデキストリン、デキストラン、デンプン等;およびアルジトール、例えば、マンニトール、キシリトール、マルチトール、ラクチトール、キシリトール、ソルビトール(グルシトール)、ピラノシルソルビトール、ミオイノシトール等が挙げられる。また、賦形剤として、無機塩またはバッファ、例えば、クエン酸、塩化ナトリウム、塩化カリウム、硫酸ナトリウム、硝酸カリウム、一塩基性リン酸ナトリウム、二塩基性リン酸ナトリウム、およびそれらの組合せを挙げることができる。凍結剤(例えば、CryoStor(登録商標)(BioLife Solutions Inc、Bothell、WA)CS2、CS5、またはCS10凍結培地)を用いて、貯蔵および輸送用に細胞を凍結することができる。
また、本発明の医薬組成物は、微生物の増殖を防止または阻止するための抗菌剤を含んでもよい。本発明に適した抗菌剤の非限定的な例として、塩化ベンザルコニウム、塩化ベンゼトニウム、ベンジルアルコール、塩化セチルピリジニウム、クロロブタノール、フェノール、フェニルエチルアルコール、硝酸フェニル水銀、チメロサール、およびそれらの組合せが挙げられる。
また、抗酸化剤が、医薬組成物中に存在してもよい。抗酸化剤は、酸化を防止することによって、リンパ球または調製物の他の構成要素の劣化を防止するのに用いられる。本発明に用いるのに適した抗酸化剤として、例えば、パルミチン酸アスコルビル、ブチル化ヒドロキシアニソール、ブチル化ヒドロキシトルエン、次亜リン酸、モノチオグリセロール、没食子酸プロピル、重亜硫酸ナトリウム、ホルムアルデヒドスルホキシル酸ナトリウム、メタ重亜硫酸ナトリウム、およびそれらの組合せが挙げられる。
界面活性剤が、賦形剤として存在してもよい。例示的な界面活性剤として:ポリソルベート、例えばTWEEN 20およびTWEEN 80、ならびにプルロニック、例えばF68およびF88(BASF、Mount Olive、New Jersey);ソルビタンエステル;脂質、例えばリン脂質、例えばレシチンおよび他のホスファチジルコリン、ホスファチジルエタノールアミン(しかしリポソーム形態でないことが好ましい)、脂肪酸、および脂肪エステル;ステロイド、例えばコレステロール;キレート化剤、例えばEDTA;ならびに亜鉛および他のそのような適切なカチオンが挙げられる。
酸または塩基が、医薬組成物内に賦形剤として存在してもよい。用いることができる酸の非限定的な例として、塩酸、酢酸、リン酸、クエン酸、リンゴ酸、乳酸、ギ酸、トリクロロ酢酸、硝酸、過塩素酸、リン酸、硫酸、フマル酸、およびそれらの組合せからなる群から選択される酸が挙げられる。適切な塩基の例として、限定されないが、水酸化ナトリウム、酢酸ナトリウム、水酸化アンモニウム、水酸化カリウム、酢酸アンモニウム、酢酸カリウム、リン酸ナトリウム、リン酸カリウム、クエン酸ナトリウム、ギ酸ナトリウム、硫酸ナトリウム、硫酸カリウム、フマル酸カリウム、およびそれらの組合せからなる群から選択される塩基が挙げられる。
組成物中のリンパ球(または他の組換え細胞)の量は、いくつかの要因に応じて変動することとなるが、組成物が単位剤型またはコンテナ(例えば、バッグ)内にある場合、最適には治療的に有効な用量となろう。治療的に有効な用量は、組成物の量を増大させて、どの量が臨床的に所望されるエンドポイントをもたらすかを判定する繰返し投与によって、実験的に決定することができる。
組成物中の個々のあらゆる賦形剤の量は、賦形剤の性質および機能、ならびに組成物の特定のニーズに応じて変動することとなる。典型的には、個々のあらゆる賦形剤の最適な量が、ルーチンの実験を通して、すなわち、様々な量の賦形剤(低〜高に及ぶ)を含有する組成物を調製して、安定性および他のパラメータを調査してから、最適な性能が、重大な副作用なく達成される範囲を判定することによって、決定される。しかしながら、賦形剤は通常、組成物中に、約1重量%〜約99重量%、好ましくは約5重量%から約98重量%、より好ましくは約15重量%から約95重量%の賦形剤の量で存在することとなり、最も好ましくは30重量%未満の濃度である。これらの前述の医薬賦形剤は、他の賦形剤と一緒に、「Remington:The Science & Practice of Pharmacy」、現行版、Williams & Williams;「Physician’s Desk Reference」、現行版、Medical Economics、Montvale,NJ;およびKibbe,A.H.、Handbook of Pharmaceutical Excipients、現行版、American Pharmaceutical Association、Washington、D.C.に記載されている。
医薬組成物は、送達および使用の意図されるモードに応じて、シリンジ、移植デバイス内等に収容することができる。好ましくは、存在する組成物の量は、予め測定された、または予め包装された形態の単回用量に適している。
本明細書中の医薬組成物は、場合により、1つまたはそれ以上の更なる剤、例えば、問題となっている癌について対象を処置するのに、または処置由来の知られている副作用を処置するのに用いられる他の薬物を含んでもよい。例えば、T細胞は、血流中にサイトカインを放出し、これが危険なほど高い発熱および血圧の急な降下をもたらす虞がある。この症状は、サイトカイン放出症候群(CRS)として知られている。多くの患者において、CRSは、ステロイドおよび免疫治療、例えばIL−6活性をブロックするトシリズマブ(Actemra(商標)、Genentech、South San Francisco、CA)が挙げられる標準的な支持療法で管理することができる。
改変リンパ球組成物による処置の治療的に有効な少なくとも1サイクルが、対象に施されることとなる。「処置の治療的に有効なサイクル」によって意図されるのは、施された場合に、問題となっている疾患についての個体の処置に対してポジティブな治療応答を導く処置のサイクルである。「ポジティブな治療応答」によって意図されるのは、個々に受ける本発明に従う処置が、腫瘍の縮小および/またはリンパ球療法の必要の低減等の改善が挙げられる、疾患の1つまたはそれ以上の病徴の改善を示すことである。
特定の実施形態において、リンパ球または他の薬物を含む組成物の複数回の治療的に有効な用量が投与されることとなる。本発明の組成物は、典型的に、必ずしも必要ではないが、注射を介して、例えば、皮下に、皮内に、静脈内に、動脈内に、筋肉内に、腹膜内に、脊髄内に、腫瘍内に、結節内に、点滴によって、または局所に、投与される。医薬の調製は、投与の直前に、溶液の形態であっても懸濁液の形態であってもよい。前述のものは、更なる投与モードも意図されるので、例示的であることを意味する。医薬組成物は、当該技術において知られている医学的に許容可能なあらゆる方法に従って、同じ投与経路を用いて投与しても、異なる投与経路を用いて投与してもよい。
投与されることとなる実際の用量は、対象の年齢、体重、および全身状態、ならびに処置されることとなる症状の重症度、医療専門家の判断、および投与されることとなる特定のリンパ球に応じて変動することとなる。治療的に有効な量は、当業者によって決定することができ、そして特定の各症例の特定の必要条件に合うように調整されることとなる。
通常、リンパ球の治療的に有効な量は、患者あたり合計約1×105〜約1×1010個以上、例えば1×106〜約1×1010個、例えば、1×107〜1×109個、例えば5×107〜5×108個に及ぶ、またはこれらの範囲内のあらゆる量のリンパ球となることとなる。他の投薬量範囲は、kg/体重あたり1×104〜1×1010個の細胞となり得る。リンパ球の総数を、単回のボーラス用量で投与してもよいし、2回またはそれ以上の用量で、例えば1日またはそれ以上の間隔をおいて投与してもよい。投与される化合物の量は、特定のリンパ球組成物の効力、処置されることとなる疾患、および投与経路によって決まることとなる。
加えて、用量は、リンパ球の混合物、例えばCD8+およびCD4+細胞の混合を含んでよい。CD8+およびCD4+細胞の混合が提供されるならば、CD8+細胞の、CD4+細胞に対する比率は、例えば、1:1、1:2または2:1、1:3または3:1、1:4または4:1、1:5または5:1等であり得る。
改変リンパ球を、他の剤の前に、他の剤と同時に、または他の剤の後に投与することができる。他の剤と同時に提供されるならば、改変リンパ球は、同じ組成物中で、または異なる組成物中で提供することができる。ゆえに、リンパ球および他の剤を、同時療法によって個体に提示することができる。「同時療法」によって意図されるのは、物質の組合せの治療効果が、治療を受けた対象において引き起こされるような、対象への投与である。例えば、同時療法は、改変リンパ球を含む医薬組成物の用量、および少なくとも1つの他の剤、例えば別の化学療法剤を含む医薬組成物の用量を投与することによって達成することができ、組合せにおいては、特定の投薬レジメンに従って、治療的に有効な用量を含む。同様に、改変リンパ球および治療剤は、少なくとも1回の治療用量で投与することができる。別個の医薬組成物の投与を、同時に、または異なる時点で(例えば、同じ日に、または異なる日に、いずれかの順序で、順次)実行することができるが、これらの物質の組合せの治療効果が、療法を受けている対象において引き起こされる限りにおいてである。
本明細書中に記載される、本発明の操作されたI型カスケードエフェクター複合体は、ゲノム編集ツールを提供する。ゲノム編集用の哺乳動物細胞内でクラス1 CRISPR−Cas系の機能的再構成を実証する実験は、そのような簡素化されたプラスミド設計が、より少ないタンパク質構成要素およびユニークなPAM必要条件を示すもの、ならびに潜在的にはIII型CRISPR−Cas系由来のRNA−およびDNA−標的化エフェクター複合体すら挙げられる、他のクラス1 CRISPR−Cas系の使用を可能にすることを示す(例えば、Hille,F.ら、Cell 172巻:1239〜1259頁(2018年);Tamulaitis,G.ら、Trends Microbiol.25巻:49〜61頁(2017年)参照)。カスケード複合体のマルチサブユニットの性質は、合成転写因子、エピゲノムモディファイア、および塩基エディタ等のエフェクター融合体の多価かつ/または立体配置的に正確な動員についての潜在能力を提供する。また、I型系からの完全なDNA干渉経路の異種発現、すなわち、ゲノム標的部位へのCas3ヘリカーゼ−ヌクレアーゼのカスケード媒介動員を利用して、大きなDNA欠失を生成して、相同組換え修復用の長いssDNA束を曝露することができ、かつ/または定義されたゲノム遺伝子座にてタンパク質−DNAロードブロックを機械的に崩壊させることができる。したがって、本発明の一実施形態において、操作されたクラス1 CRISPR−Cas系を用いて、大きな欠失領域を生成することができ、そしてドナーポリヌクレオチド(例えば、適切な相同アームを含む)を細胞中に導入することで、領域中へのドナーポリヌクレオチドの少なくとも一部の挿入を促進することができる。
本発明の実施形態として、以下が挙げられるが、これらに限定されない。
実施形態1.組成物であって:
第1のCse2サブユニットタンパク質、第1のCas5サブユニットタンパク質、第1のCas6サブユニットタンパク質、および第1のCas7サブユニットタンパク質と、
第1のCas8サブユニットタンパク質および第1のFokIを含む第1の融合タンパク質であって、第1のCas8サブユニットタンパク質のN末端または第1のCas8サブユニットタンパク質のC末端は、第1のリンカーポリペプチドによって、第1のFokIのC末端またはN末端にそれぞれ共有結合されており、第1のリンカーポリペプチドは、長さが約10アミノ酸〜約40アミノ酸である、第1の融合タンパク質と、
第1の核酸標的配列に結合することができる第1のスペーサーを含む第1のガイドポリヌクレオチドと
を含む第1の操作されたクラス1 I型CRISPR−Casエフェクター複合体と;
第2のCse2サブユニットタンパク質、第2のCas5サブユニットタンパク質、第2のCas6サブユニットタンパク質、および第2のCas7サブユニットタンパク質と、
第2のCas8サブユニットタンパク質および第2のFokIを含む第2の融合タンパク質であって、第2のCas8サブユニットタンパク質のN末端または第2のCas8サブユニットタンパク質のC末端は、第2のリンカーポリペプチドによって、第2のFokIのC末端またはN末端にそれぞれ共有結合されており、第2のリンカーポリペプチドは、長さが約10アミノ酸〜約40アミノ酸である、第2の融合タンパク質と、
第2の核酸標的配列に結合することができる第2のスペーサーを含む第2のガイドポリヌクレオチドと
を含む第2の操作されたクラス1 I型CRISPR−Casエフェクター複合体と
を含み、第2の核酸標的配列のプロトスペーサー隣接モチーフ(PAM)および第1の核酸標的配列のPAMは、スペーサー間距離が約20bp〜約42bpである、組成物。
実施形態2.第1のリンカーポリペプチドは、長さが約15アミノ酸〜約30アミノ酸である、実施形態1の組成物。
実施形態3.第1のリンカーポリペプチドは、長さが約17アミノ酸〜約20アミノ酸である、実施形態2の組成物。
実施形態4.第2のリンカーポリペプチドは、長さが約15アミノ酸〜約30アミノ酸である、実施形態1〜3のいずれか1つの組成物。
実施形態5.第2のリンカーポリペプチドは、長さが約17アミノ酸〜約20アミノ酸である、実施形態4の組成物。
実施形態6.第1のリンカーポリペプチドと第2のリンカーポリペプチドの長さは、同じである、先の実施形態のいずれかの組成物。
実施形態7.第2の核酸標的配列および第1の核酸標的配列は、それぞれスペーサー間距離が約22bp〜約40bpである、先の実施形態のいずれかの組成物。
実施形態8.第2の核酸標的配列および第1の核酸標的配列は、それぞれスペーサー間距離が約26bp〜約36bpである、実施形態7の組成物。
実施形態9.第2の核酸標的配列および第1の核酸標的配列は、それぞれスペーサー間距離が約29bp〜約35bpである、実施形態8の組成物。
実施形態10.第2の核酸標的配列および第1の核酸標的配列は、それぞれスペーサー間距離が約30bp〜約34bpである、実施形態9の組成物。
実施形態11.第1のFokIおよび第2のFokIは、ホモダイマーを形成するように会合することができるモノマーサブユニットである、先の実施形態のいずれかの組成物。
実施形態12.第1のFokIおよび第2のFokIは、ヘテロダイマーを形成するように会合することができる、互いに異なるモノマーサブユニットである、実施形態1〜10のいずれか1つの組成物。
実施形態13.第1のCas8サブユニットタンパク質のN末端は、第1のリンカーポリペプチドによって、第1のFokIのC末端に共有結合されている、先の実施形態のいずれかの組成物。
実施形態14.第1のCas8サブユニットタンパク質のC末端は、第1のリンカーポリペプチドによって、第1のFokIのN末端に共有結合されている、実施形態1〜12のいずれか1つの組成物。
実施形態15.第2のCas8サブユニットタンパク質のN末端は、第2のリンカーポリペプチドによって、第2のFokIのC末端に共有結合されている、先の実施形態のいずれかの組成物。
実施形態16.第2のCas8サブユニットタンパク質のC末端は、第2のリンカーポリペプチドによって、第2のFokIのN末端に共有結合されている、実施形態1〜14のいずれか1つの組成物。
実施形態17.第1のCas8サブユニットタンパク質および第2のCas8サブユニットタンパク質は、それぞれ同一のアミノ酸配列を含む、先の実施形態のいずれかの組成物。
実施形態18.第1のCse2サブユニットタンパク質および第2のCse2サブユニットタンパク質は、それぞれ同一のアミノ酸配列を含み、第1のCas5サブユニットタンパク質および第2のCas5サブユニットタンパク質は、それぞれ同一のアミノ酸配列を含み、第1のCas6サブユニットタンパク質および第2のCas6サブユニットタンパク質は、それぞれ同一のアミノ酸配列を含み、そして第1のCas7サブユニットタンパク質および第2のCas7サブユニットタンパク質は、それぞれ同一のアミノ酸配列を含む、先の実施形態のいずれかの組成物。
実施形態19.第1のガイドポリヌクレオチドはRNAを含む、先の実施形態のいずれかの組成物。
実施形態20.第2のガイドポリヌクレオチドはRNAを含む、先の実施形態のいずれかの組成物。
実施形態21.ゲノムDNAは、第2の核酸標的配列のPAMおよび第1の核酸標的配列のPAMを含む、先の実施形態のいずれかの組成物。
実施形態22.細胞であって:先の実施形態のいずれかの組成物を含む細胞。
実施形態23.細胞のゲノムDNAは、第2の核酸標的配列のPAMおよび第1の核酸標的配列のPAMを含む、実施形態22の細胞。
実施形態24.原核細胞である、実施形態22または23の細胞。
実施形態25.真核細胞である、実施形態22または23の細胞。
実施形態26.実施形態1〜21のいずれか1つの第1のCse2サブユニットタンパク質、第1のCas5サブユニットタンパク質、第1のCas6サブユニットタンパク質、第1のCas7サブユニットタンパク質、第1の融合タンパク質、および第1のガイドポリヌクレオチドをコードする、1つまたはそれ以上の核酸配列。
実施形態27.実施形態1〜21のいずれか1つの第2のCse2サブユニットタンパク質、第2のCas5サブユニットタンパク質、第2のCas6サブユニットタンパク質、第2のCas7サブユニットタンパク質、第2の融合タンパク質、および第2のガイドポリヌクレオチドをコードする、1つまたはそれ以上の核酸配列。
実施形態28.実施形態26、実施形態27、または実施形態26および実施形態27の1つまたはそれ以上の核酸配列を含む1つまたはそれ以上の発現カセット。
実施形態29.実施形態28の1つまたはそれ以上の発現カセットを含む1つまたはそれ以上のベクター。
実施形態30.第1の核酸標的配列および第2の核酸標的配列を含むポリヌクレオチドに結合する方法であって、当該方法は:
細胞または生化学反応中への導入のための、実施形態1〜21のいずれか1つの組成物を用意することと;
細胞または生化学反応中に組成物を導入することによって、第1の操作されたクラス1 I型CRISPR−Casエフェクター複合体の、第1の核酸標的配列との接触、および第2の操作されたクラス1 I型CRISPR−Casエフェクター複合体の、第2の核酸標的配列との接触を促進して、ポリヌクレオチド内での、第1の操作されたクラス1 I型CRISPR−Casエフェクター複合体の、第1の核酸標的配列との結合、および第2の操作されたクラス1 I型CRISPR−Casエフェクター複合体の、第2の核酸標的配列の結合を生じさせることと
を含む方法。
実施形態31.ゲノムDNAはポリヌクレオチドを含む、実施形態30の方法。
実施形態32.第1の核酸標的配列および第2の核酸標的配列を含むポリヌクレオチドを切断する方法であって、当該方法は:
細胞または生化学反応中への導入のための、実施形態1〜21のいずれか1つの組成物を用意することと、
細胞または生化学反応中に組成物を導入することによって、第1の核酸標的配列との第1の操作されたクラス1 I型CRISPR−Casエフェクター複合体の接触、および第2の核酸標的配列との操作された第2のクラス1 I型CRISPR−Casエフェクター複合体の接触を促進して、第1の操作されたクラス1 I型CRISPR−Casエフェクター複合体による第1の核酸標的配列の切断、および第2の操作されたクラス1 I型CRISPR−Casエフェクター複合体による第2の核酸標的配列の切断をもたらすことと
を含む方法。
実施形態33.ゲノムDNAはポリヌクレオチドを含む、実施形態32の方法。
実施形態34.実施形態1〜21のいずれか1つの組成物と;バッファとを含むキット。
実施形態35.実施形態26、実施形態27、または実施形態26および実施形態27の1つまたはそれ以上の核酸配列と;バッファとを含むキット。
実施形態36.組成物であって:
Cse2サブユニットタンパク質、Cas5サブユニットタンパク質、Cas6サブユニットタンパク質、およびCas7サブユニットタンパク質と、
Cas8サブユニットタンパク質および第1のFokIを含む第1の融合タンパク質であって、第1のCas8サブユニットタンパク質のN末端または第1のCas8サブユニットタンパク質のC末端は、第1のリンカーポリペプチドによって、第1のFokIのC末端またはN末端にそれぞれ共有結合されている、第1の融合タンパク質と、
核酸標的配列に結合することができるスペーサーを含むガイドポリヌクレオチドと
を含む操作されたクラス1 I型CRISPR−Casエフェクター複合体と;
dCas3*タンパク質および第2のFokIを含む操作されたクラス1 I型CRISPR−Cas3融合タンパク質を含む第2の融合タンパク質であって、dCas3*タンパク質のN末端またはdCas3*タンパク質のC末端は、第2のリンカーポリペプチドによって、第2のFokIのC末端またはN末端にそれぞれ共有結合的に連結されている、第2の融合タンパク質と、を含み、第1のリンカーポリペプチドは、長さが約10アミノ酸〜約40アミノ酸である、組成物。
実施形態37.第1のリンカーポリペプチドは、長さが約5アミノ酸〜約40アミノ酸である、実施形態36の組成物。
実施形態38.第2のリンカーポリペプチドは、長さが約5アミノ酸〜約40アミノ酸である、実施形態36の組成物。
実施形態39.細胞であって:実施形態36〜38のいずれか1つの組成物を含む細胞。
実施形態40.原核細胞である、実施形態39の細胞。
実施形態41.真核細胞である、実施形態39の細胞。
実施形態42.実施形態36〜38のいずれか1つのCse2サブユニットタンパク質、Cas5サブユニットタンパク質、Cas6サブユニットタンパク質、Cas7サブユニットタンパク質、第1の融合タンパク質、およびガイドポリヌクレオチドをコードする、1つまたはそれ以上の核酸配列。
実施形態43.実施形態36〜38のいずれか1つの第2の融合タンパク質をコードする1つまたはそれ以上の核酸配列。
実施形態44.実施形態42、実施形態43、または実施形態42および実施形態43の1つまたはそれ以上の核酸配列を含む1つまたはそれ以上の発現カセット。
実施形態45.実施形態44の1つまたはそれ以上の発現カセットを含む1つまたはそれ以上のベクター。
実施形態46.核酸標的配列を含むポリヌクレオチドに結合する方法であって、当該方法は:
細胞または生化学反応中への導入のための、実施形態36〜38のいずれか1つの組成物を用意することと;
細胞または生化学反応中に組成物を導入することによって、操作されたクラス1 I型CRISPR−Casエフェクター複合体の、核酸標的配列との接触、および第2の融合タンパク質の、操作されたクラス1 I型CRISPR−Casエフェクター複合体との接触を促進して、ポリヌクレオチド内での、操作されたクラス1 I型CRISPR−Casエフェクター複合体および第2の融合タンパク質の、核酸標的配列への結合を生じさせることと
を含む方法。
実施形態47.ゲノムDNAはポリヌクレオチドを含む、実施形態46の方法。
実施形態48.核酸標的配列を含むポリヌクレオチドを切断する方法であって、当該方法は:
細胞または生化学反応中への導入のための、実施形態36〜38のいずれか1つの組成物を用意することと;
細胞または生化学反応中に組成物を導入することによって、第1の核酸標的配列との第1の操作されたクラス1 I型CRISPR−Casエフェクター複合体の接触、および第2の核酸標的配列との操作された第2のクラス1 I型CRISPR−Casエフェクター複合体の接触を促進することと、
細胞または生化学反応中に組成物を導入することによって、核酸標的配列との操作されたクラス1 I型CRISPR−Casエフェクター複合体の接触、および操作されたクラス1 I型CRISPR−Casエフェクター複合体との第2の融合タンパク質の接触を促進して、操作されたクラス1 I型CRISPR−Casエフェクター複合体および第2の融合タンパク質による核酸標的配列の切断をもたらすことと
を含む方法。
実施形態49.ゲノムDNAはポリヌクレオチドを含む、実施形態48の方法。
実施形態50.実施形態36〜38のいずれか1つの組成物と;バッファとを含むキット。
実施形態51.実施形態42、実施形態43、または実施形態42および実施形態43の1つまたはそれ以上の核酸配列と;バッファとを含むキット。
実施形態52.野生型I型CRISPR Cas3タンパク質(「wtCas3タンパク質」)よりも低減された、DNAに沿った移動が可能な操作されたI型CRISPR Cas3突然変異タンパク質(「mCas3タンパク質」)であって、mCas3タンパク質は:
対応するwtCas3タンパク質と約95%以上の配列同一性と、
アミノ末端、カルボキシ末端、またはアミノ末端およびカルボキシ末端の双方にて共有結合する核局在化シグナルと、
ヘリカーゼ活性を下方調節する1つまたはそれ以上の突然変異と
を含み、操作されたI型CRISPR Cas3突然変異タンパク質は、ヌクレアーゼ活性を保持しており;
DNAは、核酸標的配列を含む標的領域を含む二本鎖DNA(dsDNA)であり;
wtCas3タンパク質が、対応するカスケード核タンパク質複合体と会合し(「カスケードNP複合体/wtCas3タンパク質」)、かつカスケードNP複合体が、核酸標的配列と相補的なスペーサーを含むガイドを含む場合、カスケードNP複合体/wtCas3タンパク質の、核酸標的配列への結合が、DNAの標的領域内の切断を促進することによって、欠失(「wtCas3−欠失」)をもたらし;
mCas3タンパク質は、カスケードNP複合体と会合し(「カスケードNP複合体/mCas3タンパク質」)、核酸標的配列に結合する場合、DNAの標的領域内の切断を促進することによって、wtCas3−欠失よりも短い欠失をもたらす、mCas3タンパク質。
実施形態53.1つまたはそれ以上の突然変異は、アミノ酸の置換である、実施形態53のmCas3タンパク質。
実施形態54.1つまたはそれ以上の突然変異は、ヘリカーゼドメインのRecA1領域またはRecA2領域内のいずれかにある、先の実施形態のいずれかのmCas3タンパク質。
実施形態55.1つまたはそれ以上の突然変異は、wtCas3タンパク質よりも、一本鎖DNA(ssDNA)へのmCas3タンパク質の結合を下方調節する、先の実施形態のいずれかのmCas3タンパク質。
実施形態56.1つまたはそれ以上の突然変異は、wtCas3タンパク質よりも、mCas3タンパク質によるアデノシン三リン酸(ATP)の加水分解を下方調節し、またはmCas3タンパク質へのATPの結合を下方調節する、先の実施形態のいずれかのmCas3タンパク質。
実施形態57.mCas3タンパク質のコーディング配列は、カスケードNP複合体のCasタンパク質のコーディング配列のアミノ末端またはカルボキシ末端に共有結合されている、先の実施形態のいずれかのmCas3タンパク質。
実施形態58.1つまたはそれ以上の突然変異は、wtCas3タンパク質よりも、一本鎖DNA(ssDNA)へのmCas3タンパク質の結合を下方調節する、先の実施形態のいずれかのmCas3タンパク質。
実施形態59.mCas3タンパク質のコーディング配列は、カスケードRNP複合体のCasタンパク質のコーディング配列のアミノ末端またはカルボキシ末端に共有結合されている、先の実施形態のいずれかのmCas3タンパク質。
実施形態60.Casタンパク質は、Cse2、Cas8タンパク質、Cas7タンパク質、Cas6タンパク質、およびCas5タンパク質からなる群から選択される、先の実施形態のいずれかのmCas3タンパク質。
実施形態61.wtCas3タンパク質は、大腸菌(E.coli)I型CRISPR Cas3タンパク質である、先の実施形態のいずれかのmCas3タンパク質。
実施形態62.1つまたはそれ以上の突然変異は、D452H、A602V、ならびにD452HおよびA602Vからなる群から選択される、実施形態61のmCas3タンパク質。
実施形態63.DNAは細胞内にある、先の実施形態のいずれかのmCas3タンパク質。
実施形態64.細胞は真核細胞である、実施形態63のmCas3タンパク質。
実施形態65.真核細胞は、哺乳動物細胞(例えば、ヒト細胞)である、実施形態64のmCas3タンパク質。
実施形態66.実施形態52〜65のいずれか1つのmCas3タンパク質をコードする1つまたはそれ以上のポリヌクレオチド。
実施形態67.哺乳動物細胞内での発現のための調節配列に作動可能に連結された、実施形態52〜65のいずれか1つのmCas3タンパク質をコードするポリヌクレオチド配列を含むプラスミド。
実施形態68.実施形態52〜65のいずれか1つのmCas3タンパク質をコードするポリヌクレオチド配列を含む1つまたはそれ以上のプラスミド、および哺乳動物細胞内での発現のための調節配列に作動可能に連結された、対応するI型CRISPRカスケードのタンパク質構成要素をコードする1つまたはそれ以上のポリヌクレオチド。
実施形態69.哺乳動物細胞内での発現のための調節配列に作動可能に連結された1つまたはそれ以上のガイドポリヌクレオチドをコードするプラスミドをさらに含む、実施形態68の1つまたはそれ以上のプラスミド。
実施形態70.実施形態52〜65のいずれか1つのmCas3タンパク質を含むI型CRISPRカスケード核タンパク質複合体。
実施形態71.核タンパク質複合体はRNPである、実施形態70のI型CRISPRカスケード核タンパク質複合体。
本発明の好ましい実施形態が本明細書中で示され、かつ説明されてきたが、そのような実施形態は、一例としてのみ記載されていることは、当業者にとって明らかであろう。本明細書および実施例から、当業者であれば、本発明の必須の特徴を確認することができ、そしてその精神および範囲から逸脱しない範囲で、種々の使用および条件に適合させるために、本発明を変更、置換、変形、かつ修飾することができる。また、そのような変化、置換、変形、および修飾は、本開示の範囲内に含まれることが意図される。
実験の部
本発明の態様を以下の実施例に説明する。使用する数(例えば、量、濃度、変化パーセントなど)に関する正確度を保証するために努力がなされたが、いくつかの実験誤差および偏差が説明されるべきである。特に示さないかぎり、温度は摂氏温度であり、圧力は大気圧またはその近くである。これらの実施例は、単に例証として与えられるものであり、本発明の範囲を限定することを意図するものではないことが理解されるべきである。
カスケード構成要素をコードするポリヌクレオチドのin silico設計
本実施例は、I−E型CRISPR−Cas系に由来する遺伝子配列、タンパク質配列、およびCRISPR配列を用いる、カスケードをコードするポリヌクレオチド構成要素の設計の説明を提供するものである。
表15は、I−E型からの、具体的には大腸菌(E.coli)K−12 MG1655株からのカスケードの5つのタンパク質をコードする遺伝子のポリヌクレオチドDNA配列、および結果としてもたらされるタンパク質構成要素のアミノ酸配列を示す。NCBI参照配列NZ_CP014225.1からゲノム配列を得た。表15において、大腸菌における発現およびまたヒト細胞における発現について特異的にコドン最適化されたカスケードタンパク質構成要素をコードする、大腸菌gDNAまたは製造業者によって産生されたポリヌクレオチドのいずれかからポリヌクレオチド配列を増幅させた。
加えて、カスケードタンパク質を含むいくつかの融合タンパク質を設計した。表16は、カスケードタンパク質融合タンパク質をコードする遺伝子のポリヌクレオチドDNA配列、および結果としてもたらされるタンパク質構成要素のアミノ酸配列を示す。ほとんどの場合、表16に記載される融合タンパク質は、融合構築物内の2つのポリペプチド配列を結びつける短いトリアミノ酸リンカーを含み;このリンカーは、典型的にはグリシン−グリシン−セリン(GGS)またはグリシン−セリン−グリシン(GSG)を含む。それぞれの特定の融合タンパク質に使用される正確なトリアミノ酸リンカー配列は、表16中の全長アミノ酸配列に見出すことができる。
他のカスケードタンパク質と同時発現した場合のCse2タンパク質上のHis6(ヘキサヒスチジン;配列番号418)ペプチドタグおよびStrep−tag(商標)II(GE Healthcare Bio−Sciences、Pittsburgh、PA)(配列番号419)ペプチドタグは、それぞれニッケル−ニトリロ酢酸(Ni−NTA)樹脂またはStrep−Tactin(商標)(IBA GMBH LLC、Goettingen、Germany)樹脂のいずれかにより複合体を精製できるようにする。HRV3C(ヒトライノウイルス3C)プロテアーゼによってHRV3Cプロテアーゼ認識配列(配列番号420)を切断し、これを使用して目的のタンパク質からN末端融合物を除去することができる。NLS(核局在化シグナル;Cas6、Cas7、および/またはCas8タンパク質上の配列番号421のペプチドタグは、真核細胞系における核輸送を可能にする。Cas6またはCas7タンパク質上のHA(ヘマグルチニン;配列番号422)ペプチドタグは、抗HA抗体を用いたウエスタンブロット法による異種タンパク質発現の検出を可能にする。MBP(マルトース結合タンパク質;配列番号423)ペプチド融合は、Cas8タンパク質の精製を促進する可溶化タグである。TEV(タバコエッチ病ウイルス)プロテアーゼによってTEVプロテアーゼ認識配列(配列番号424)を切断し、これを使用して、目的のタンパク質からN末端融合物を除去することができる。FokIヌクレアーゼドメインは、Guoらによって記載されるシャーキーバリアントを含み(Guo、J.ら、J.Mol.Biol.400:96〜107(2010年))、2つのモノマーFokIサブユニットは会合してホモダイマーを形成し、ホモダイマー化すると二本鎖DNAの切断を触媒する。リンカー配列(配列番号425)を使用して、FokIヌクレアーゼドメインをCas8タンパク質と融合させる。
FokIヌクレアーゼドメインをCas8タンパク質に結びつける様々な長さおよびアミノ酸組成の追加的なリンカー配列が設計されている。これらのアミノ酸配列は、表17に見出すことができる。
表18は、前駆体crRNAに転写され、カスケードのRNAエンドヌクレアーゼタンパク質によってプロセシングされた場合に、生化学アッセイおよび細胞培養遺伝子編集実験において相補的DNA配列を標的化するためのガイドRNAとして機能する成熟crRNAを生成する、4つの最小CRISPRアレイのポリヌクレオチドDNA配列を含む。
最小CRISPRアレイは、crRNAのガイド部分に相当するスペーサー配列に隣接する2つのリピート配列(下線部、小文字)を含む。カスケードエンドヌクレアーゼタンパク質によるRNAのプロセシングは、ガイド配列に隣接するリピート配列を5’末端および3’末端の両方に有するcrRNAを生成する。CRISPRアレイはまた、2つのスペーサー配列に隣接する3つのリピート配列(下線部)を含むように拡張される場合があり、これらのスペーサー配列は、エンドヌクレアーゼカスケードタンパク質によるRNAプロセシングによる2つの互いに異なるcrRNAのガイド部分に相当する。アレイは、所望により追加的なスペーサー配列を含むようにさらに拡張することができる。
カスケードエフェクター複合体の産生のための細菌発現ベクターの設計
本実施例は、カスケード関連タンパク質をコードする細菌発現ベクターの設計のみならず、実施例1に記載されるガイド配列を含む最小CRISPRアレイについて記載する。最小CRISPRアレイをコードするプラスミドでの使用のためのカスケードサブユニットタンパク質発現系の構築について記載する。
単一プラスミドカスケードタンパク質発現系を構築して、CasBCDE複合体(Cse2、Cas7、Cas5、およびCas6タンパク質を含むが、Cas8タンパク質を含まない)として知られる、大腸菌におけるカスケード複合体、または大腸菌における機能的カスケード複合体全体のいずれかのタンパク質を発現させた。単一プラスミド系は、単一の発現プラスミド上にcse2−cas7−cas5−cas6オペロン、またはcas8−cse2−cas7−cas5−cas6オペロン全体のいずれかを含む。Cas8タンパク質は、CasBCDE複合体と一緒に混合してカスケードを再構成する生化学実験に使用するために、それ自体の発現プラスミドから発現させることができる。
発現ベクターの構築のために出発プラスミドを使用した(Brouns、S.ら、Science 321:960〜964(2008年)参照)。Casオペロンを含む単一プラスミドカスケードタンパク質発現系を以下のように組み立てた。cas遺伝子についてのコーディング配列をcse2−cas7−cas5−cas6(CasBCDE複合体)またはcas8−cse2−cas7−cas5−cas6(全カスケード複合体)の順序で配置し、野生型細菌遺伝子の配置に対応する配列で分離した(NCBI参照配列NZ_CP014225.1参照)。
アフィニティータグ(His6またはStrep−tag(登録商標)II、IBA GMBH LLC、Goettingen、Germany)をコードするポリヌクレオチド配列を付加するために、対応するコーディング配列をcas8遺伝子の3’末端とcse2遺伝子の5’末端との接合部に挿入した;これらの2つのオープンリーディングフレームは、野生型gDNA配列において重複している。
N末端NLSタグおよび/またはNLS−HAタグをコードするポリヌクレオチド配列をcas6遺伝子の5’末端に付加するために、cas6遺伝子と上流のcas5遺伝子との間に追加的なスペーシングを導入した。それは、これらのオープンリーディングフレームが野生型gDNA配列において重複する結果、cas6遺伝子についてのシャイン・ダルガノ配列がcas5遺伝子の3’部分内にあるからである。新しいシャイン・ダルガノ配列を新しいNLS−Cas6またはNLS−HA−Cas6のオープンリーディングフレームの上流に挿入して、翻訳効率を改善した。
C末端NLSタグおよび/またはHA−NLSタグをコードするポリヌクレオチド配列をcas7遺伝子の3’末端に付加するために、cas7遺伝子と下流のcas5遺伝子との間に追加的なスペーシングを導入した。それは、これらのオープンリーディングフレームが野生型gDNA配列において近接する結果、cas5遺伝子についてのシャイン・ダルガノ配列がcas7遺伝子の3’部分内にあるからである。新しいシャイン・ダルガノ配列を新しいCas7−NLSまたはCas7−HA−NLSのオープンリーディングフレームの上流に挿入して、cas5遺伝子についての翻訳効率を改善した。
N末端NLS−FokI−リンカー融合物をコードするポリヌクレオチド配列をCas8タンパク質に付加するために、対応するコーディング配列をcas8遺伝子の5’末端に挿入した。
aadA遺伝子の存在によりスペクチノマイシン耐性を付与するpCDF(MilliporeSigma、Hayward、CA)ベクター骨格内にcse2−cas7−cas5−cas6オペロンおよびcas8−cse2−cas7−cas5−cas6オペロンをクローニングした。オペロンの転写は、T7プロモーターによって駆動され、Lacオペレーターの制御下にあり;このベクターは、LacIリプレッサーもまたコードする。T7ターミネーターをcse2−cas7−cas5−cas6またはcas8−cse2−cas7−cas5−cas6オペロンの下流にクローニングした。このベクターは、CDF複製起点を含む。
Cas8またはFokI−Cas8融合タンパク質の発現のために、kanR遺伝子の存在によりカナマイシン耐性を付与するpET(MilliporeSigma、Hayward、CA)ファミリーベクター骨格内にcas8遺伝子をクローニングした。オペロンの転写は、T7プロモーター(PT7)によって駆動され、Lacオペレーター(lacO)の制御下にあり;このベクターは、LacIリプレッサー(lacI遺伝子)もまたコードする。T7ターミネーターをcas8遺伝子の下流にクローニングした。このベクターは、ColE1複製起点を含む。
図23A、図23B、図23C、図23D、および図23Eは、cas8、fokI−cas8、cse2−cas7−cas5−cas6オペロン、cas8−cse2−cas7−cas5−cas6オペロン、およびfokI−cas8−cse2−cas7−cas5−cas6オペロンについての過剰発現ベクターの模式図を示す。図23A、図23B、図23C、図23D、および図23Eにおける呼称は、本実施例(および実施例1)に説明され、次の通りである:PT7(T7プロモーター)、lacO(Lacオペレーター)、His6(ヘキサヒスチジン)、MBP(マルトース結合タンパク質)、Strep−tag(登録商標)II(IBA GMBH LLC、Goettingen、Germany)HRV3C(ヒトライノウイルス3C)プロテアーゼ認識配列、TEV(タバコエッチ病ウイルス)プロテアーゼ認識配列、NLS(核局在化シグナル)、kanR(カナマイシン耐性遺伝子)、lacI(LacIリプレッサー遺伝子)、colE1 ori(複製起点)、CDF ori(CloDF13複製起点)、FokIヌクレアーゼドメイン(Sharkeyバリアント)、およびaadA(アミノグリコシド耐性タンパク質をコードする遺伝子)。
表19は、Cas8タンパク質、CasBCDE複合体(cse2−cas7−cas5−cas6オペロン)の4つのタンパク質、およびカスケード複合体(cas8−cse2−cas7−cas5−cas6オペロン)の全部で5つのタンパク質をコードする細菌発現プラスミドの配列を提供する。Cas8タンパク質のN末端にFokIが融合したポリヌクレオチド配列および融合していないポリヌクレオチド配列を提供する。
crRNAを含むCasBCDE複合体およびカスケード複合体を精製するために、cse2−cas7−cas5−cas6オペロンまたはcas8−cse2−cas7−cas5−cas6オペロンをコードするタンパク質発現ベクターを、最小CRISPRアレイを含むベクターと組み合わせる。
camR遺伝子によりクロラムフェニコール耐性を付与するpACYC−Duet1ベクター骨格内にCRISPRアレイをクローニングした。アレイの転写はT7プロモーターによって駆動され、Lacオペレーター(lacO)の制御下であり;このベクターは、LacIリプレッサーもまたコードする。T7ターミネーターをCRISPRアレイの下流にクローニングした。このベクターは、p15A複製起点を含む。
図24は、2つのリピート(図24、「リピート」)および1つのスペーサー(図24、「スペーサー」)を有するCRISPRアレイを含む発現ベクターの模式図を含む。アレイは、本明細書に記載されるように拡張することができる。図24における呼称は、本実施例(および実施例1)に説明され、次の通りである:PT7(T7プロモーター)、lacO(Lacオペレーター)、lacI(LacIリプレッサー遺伝子)、p15A ori(複製起点)、およびcamR(クロラムフェニコール耐性遺伝子)。
表20は、最小CRISPRアレイの例をコードする細菌発現プラスミドの配列を提供するものである。
哺乳動物細胞におけるカスケードエフェクター複合体の産生のための真核生物発現ベクターの設計
本実施例は、カスケード関連タンパク質をコードする真核生物発現プラスミドベクターの設計のみならず、実施例1に記載される構成要素の配列を含む最小CRISPRアレイを記載する。
A. 各カスケードタンパク質を発現している別々のプラスミドおよび最小CRISPRアレイ
ヒトサイトメガロウイルス(CMV)前初期プロモーター/エンハンサーによって駆動される別々の発現ベクター上にタンパク質構成要素のそれぞれをコードさせ、ヒトU6プロモーターによって駆動される別々の発現ベクター上にcrRNAをコードさせることによって、カスケードタンパク質を哺乳動物細胞において発現させることができる。
各発現プラスミドについての出発プラスミドは、pcDNA3.1(Thermo Scientific、Wilmington、DE)の派生物であった。ヒト細胞における発現のためにコドン最適化されたカスケードタンパク質についてのコーディング配列(実施例1参照)を、ベクター内のCMVプロモーターの下流でウシ成長ホルモン(bGH)ポリアデニル化シグナルの上流に挿入した。N末端NLSおよび3×FLAGエピトープタグをコードするポリヌクレオチド配列の5’末端にcse2遺伝子を融合させた。N末端NLSをコードするポリヌクレオチド配列の5’末端にcas5遺伝子を融合させた。N末端NLSおよびHAエピトープタグをコードするポリヌクレオチド配列の5’末端にcas6遺伝子を融合させた。N末端NLSおよびMycエピトープタグをコードするポリヌクレオチド配列の5’末端にcas7遺伝子を融合させた。N末端NLSをコードするポリヌクレオチド配列の5’末端にcas8遺伝子を融合させ;別の実施形態では、N末端NLS、HAエピトープタグ、およびFokIヌクレアーゼドメインをコードするポリヌクレオチド配列の5’末端にcas8遺伝子を融合させた。
ampR遺伝子の存在によりアンピシリン耐性を付与するpcDNA3.1派生物ベクター骨格内に各遺伝子または遺伝子融合物をクローニングした。このベクターは、SV40初期プロモーター(PSV40)および起点(SV40 ori)の下流で、SV40初期ポリアデニル化シグナル(SV40 pA)の上流にあるneoR遺伝子の存在によりネオマイシン耐性もまたコードする。ヒトCMV前初期プロモーター/エンハンサー(PCMV)およびbGH(ウシ成長ホルモン)ポリアデニル化シグナルに加えて、このベクターは、目的の遺伝子の上流にT7プロモーターを含み、mRNAのin vitro転写を可能にする。このベクターは、f1複製起点のみならず、ColE1複製起点を含む。
図25は、FokI−Cas8融合タンパク質をコードする哺乳動物発現ベクターの模式図を含む。図25における呼称は、本実施例(および実施例1)に説明され、次の通りである:ヒトCMV前初期プロモーター/エンハンサー(PCMV)、NLS(核局在化シグナル)、FokI(FokIヌクレアーゼドメイン(Sharkeyバリアント))、Cas8タンパク質コーディング配列、bGH pA(ウシ成長ホルモンポリアデニル化シグナル)、f1 ori(f1ファージ複製起点)、PSV40(SV40初期プロモーター)、SV40 ori(SV40起点)、neoR(ネオマイシン耐性遺伝子)、SV40 pA(SV40初期ポリアデニル化シグナル)、colE1 ori(複製起点)、およびampR(アンピシリン耐性遺伝子)。他のカスケードタンパク質をコードするベクターを同様に設計した。
表21は、Cse2、Cas5、Cas6、Cas7、Cas8、およびFokI−Cas8のそれぞれをコードする個別の哺乳動物発現ベクターの配列を提供するものである。
2つのスペーサー配列に隣接する3つのリピートを含む最小CRISPRアレイをCRISPR RNAにコードさせた。CRISPR RNAを生成する構築物は、追加的な配列が最小アレイ中の最外側リピートに隣接するように設計することができる。前駆体CRISPR RNAのプロセシングは、カスケード複合体のRNAプロセシングタンパク質(Cas6タンパク質)によって可能にされ、それを別々のプラスミド上に発現させることができる。
ヒトCMVプロモーターをヒトU6プロモーター(PU6)で置換し、bGHポリアデニル化シグナルをポリ−T終結シグナルで置換したことを除き、上記と同じpcDNA3.1派生物ベクター骨格内にCRISPRアレイをクローニングした。そのようなCRISPRアレイの例を図35に図示する。この図中、hU6プロモーター(図35、ドット模様の領域として示す)は第1のリピート配列(白の菱形)に隣接し、第1のリピート配列は第1のスペーサー配列(図35、スペーサー1、斜線)に隣接し、第1のスペーサー配列は第2のリピート配列(図35、灰色の菱形)に隣接し、第2のリピート配列は第2のスペーサー配列(図35、スペーサー2)に隣接し、第2のスペーサー配列は第3のリピート配列(図35、黒の菱形)に隣接する。図35において、対形成gRNAガイドを含む領域を示す(図35、対形成gRNA)。
図26は、TRAC遺伝子を標的化する代表的なCRISPRアレイをコードする真核生物発現ベクターの模式図を含む。図26における呼称が、本実施例(および実施例1)に説明され、次の通りである:PU6(ヒトU6プロモーター)、リピート(CRISPR RNAリピート)、TRACスペーサー−1(TRAC遺伝子を標的化する第1のスペーサー)、TRACスペーサー−2(TRAC遺伝子を標的化する第2のスペーサー)、ポリT(ポリT終結シグナル)、f1 ori(f1ファージ複製起点)、PSV40(SV40初期プロモーター)、SV40 ori(SV40起点)、neoR(ネオマイシン耐性遺伝子)、SV40 pA(SV40初期ポリアデニル化シグナル)、colE1 ori(複製起点)、およびampR(アンピシリン耐性遺伝子)。
表22は、TRAC遺伝子を標的化するCRISPRアレイをコードする代表的な哺乳動物発現ベクターの配列を提供し;TRAC遺伝子中のマッチするDNA配列を標的化するスペーサー配列を表18に見出すことができる。
B. 複数のカスケードタンパク質コーディング配列が単一のプロモーターから発現されるカスケードタンパク質発現系
より少ない発現ベクターからカスケード複合体の構成要素を発現させるために、多シストロン性発現ベクターを構築した。それぞれで、単一のCMVプロモーターが、2Aウイルスペプチド配列により分離された複数のコーディング配列の発現を同時に駆動する。ゾセア・アシグナ(Thosea asigna)ウイルス2Aペプチド配列はリボソームスキップを誘導することで(例えば、Liu、Z.ら、Sci.Rep.7:2193(2017年)参照)、複数のタンパク質コーディング遺伝子を単一の多シストロン性構築物内で連結することを可能にする。
多シストロン性発現プラスミドのための出発プラスミドは、CMVプロモーターおよびbGHポリアデニル化シグナルを含む、上記と同じpcDNA3.1派生物であった。ヒト細胞における発現のためにコドン最適化されたカスケードタンパク質についてのコーディング配列(実施例1参照)をcas7−cse2−cas5−cas6−cas8の順に繋ぎ、各遺伝子対の間にゾセア・アシグナウイルス2A(T2A)ペプチドをコードするポリヌクレオチド配列が挿入させた。加えて、NLSタグをコードするポリヌクレオチド配列を各カスケードタンパク質遺伝子の5’末端に付加し、FokIヌクレアーゼドメインをコードするポリヌクレオチド配列を30アミノ酸のリンカー配列によって繋いてcas8遺伝子の5’末端に付加した。最終構築物は、次の順序のエレメントを有する:NLS−cas7−T2A−NLS−cse2−T2A−NLS−cas5−T2A−NLS−cas6−T2A−NLS−fokI−リンカー−cas8。
図27は、すべてのカスケードタンパク質をコードする例示的な多シストロン性哺乳動物発現ベクターの模式図を含む。図27における呼称は、本実施例(および実施例1)に説明され、次の通りである:ヒトCMV前初期プロモーター/エンハンサー(PCMV)、NLS(核局在化シグナル)、T2A(ゾセア・アシグナウイルス2Aペプチドをコードするポリヌクレオチド配列)、Cas7、Cse2、Cas5、およびCas6タンパク質についてのコーディング配列、fokI(FokIヌクレアーゼドメイン(Sharkeyバリアント)リンカー配列、Cas8タンパク質についてのコーディング配列、bGH pA(ウシ成長ホルモンポリアデニル化シグナル)、f1 ori(f1ファージ複製起点)、PSV40(SV40初期プロモーター)、SV40 ori(SV40起点)、neoR(ネオマイシン耐性遺伝子)、SV40 pA(SV40初期ポリアデニル化シグナル)、colE1 ori(複製起点)、ampR(アンピシリン耐性遺伝子)、およびMluI制限部位。
表23は、すべてのカスケードタンパク質をコードする例示的な多シストロン性哺乳動物発現ベクターの配列を提供するものである。このベクターを、上記のCRISPR RNAをコードする哺乳動物発現ベクターと組み合わせて、哺乳動物細胞における機能的カスケード複合体を産生することができる。
C. 単一プラスミド発現系
単一プラスミドカスケード発現系を構築して、ヒト細胞に完全カスケード複合体を発現させた。このプラスミドは、単一プラスミド上にcas8−cse2−cas7−cas5−cas6オペロン全体および最小CRISPRアレイをコードする。最小CRISPRアレイを上流のヒトU6プロモーターおよび下流のポリ−T終結シグナルと一緒にMluI制限部位内に挿入することによって、多シストロン性タンパク質発現ベクターからこのプラスミドを構築した(表23および図27に記載)。
表24は、ヒト細胞におけるカスケード複合体の形成を促進するためのcrRNAと一緒の全部で5つのカスケードタンパク質の発現のための単一プラスミドの配列を提供するものである。
大腸菌および哺乳動物細胞におけるCas3タンパク質(配列番号21;モノマーCas3ヌクレアーゼ/ヘリカーゼ 大腸菌K−12亜株MG1655)の発現のためのプラスミドも設計した。表25は、これらのプラスミドの構築物および配列を提供するものである。
カスケード構成要素をコードするポリヌクレオチドの細菌生産株への導入
本実施例は、大腸菌発現系を用いた細菌細胞におけるCas8サブユニットタンパク質コーディング配列のみならず操作されたI型CRISPR−Casエフェクター複合体の構成要素についてのコーディング配列の導入および発現について記載する。
A. Cas8タンパク質の発現
T7プロモーターからのHis6−MBP−TEV−Cas8のIPTG誘導発現のためのオペロンを含むプラスミド(実施例2、配列番号438、表19、図23A)から大腸菌I−E型Cas8タンパク質を発現させた。本発現プラスミドはカナマイシンに対する耐性を付与した。
Cas8タンパク質を発現させるために、発現プラスミドで大腸菌細胞を形質転換した。簡潔には、微量遠心チューブ中のケミカルコンピテント大腸菌細胞(大腸菌BL21 Star(商標)(Thermo Fisher Scientific、Waltham、MA)細胞)のアリコート100μLを氷上で10分間解凍した。解凍した細胞にプラスミドDNA 35ngを添加し、細胞をDNAと共に氷上で8分間インキュベートした。微量遠心チューブを42℃の水浴中に30秒間入れ、次いで直ちにチューブを氷中に2分間入れることによって熱ショックを行った。2×YT培地900μLを微量遠心チューブに加え、この微量遠心チューブをチューブローテーターに37℃で1時間置いた。最終的に、回収した細胞100μLを、LB固形カナマイシン(50μg/mL)上に蒔き、37℃で一晩インキュベートした。
抗生物質選択プレート上に生育したコロニーから単一のコロニーを釣り上げ、カナマイシン(50μg/mL)を補充した2×YT培地10mL中にこれを播種した。培養物を200RPMのオービタルシェーカーで振盪しながら37℃で一晩生育させた。カナマイシン(50μg/mL)を補充した2×YT培地1Lを有する2Lバッフル付きフラスコに一晩培養物6mLを移した。600nmの吸光度が0.56になるまで培養物1Lを200RPMのオービタルシェーカーで振盪しながら37℃で生育させた。
次いで、IPTGを終濃度1mMまで添加することによって発現を誘導した。誘導された培養物を200RPMのオービタルシェーカーで振盪しながら16℃で一晩生育させた。4,000RCF、4℃で15分間の遠心分離によって細胞を回収した。溶解緩衝液50mLあたりComplete(商標)(Roche、Basel、Switzerland)プロテアーゼ阻害剤錠1つを補充した、50mMトリスpH7.5、100mM NaCl、5%グリセリン、および1mM TCEPから構成される溶解緩衝液15mL中に細胞ペレットを再懸濁した。すぐ下流のプロセシングのために、再懸濁した細胞を50mLコニカルチューブに移した。Cas8タンパク質を精製し、精製タンパク質を本質的にFokI−Cas8融合タンパク質について下(実施例5C)に記載されるように特徴づけた。
B. カスケードRNP複合体の構成要素の発現
カスケードRNP複合体を産生するために2プラスミド系を使用して大腸菌細胞中に5つの大腸菌カスケードタンパク質およびRNAガイドの一式を共発現させた。1つのプラスミド(実施例2、配列番号441、表19、図23D)は、T7プロモーターからのCse2、Cas5、Cas6、Cas7、およびCas8タンパク質のIPTG誘導発現のためのオペロンを含んでいた。Cse2のN末端との翻訳融合体としてHis6アフィニティータグを含めた(実施例1、配列番号392、表16)。第2のプラスミドは、J3ガイドのIPTG誘導発現をコードしていた(実施例2、配列番号444、表20、図24)。カスケードタンパク質発現プラスミドはスペクチノマイシン耐性を付与し、カスケードRNAガイド発現プラスミドはクロラムフェニコール耐性を付与した。
同じ細胞においてカスケードタンパク質およびRNA構成要素を共発現させるために、2つのプラスミドで大腸菌細胞を同時形質転換した。マイクロ遠心チューブ中のケミカルコンピテント大腸菌細胞(大腸菌、BL21 Star(商標)(DE3)(Thermo Fisher Scientific、Waltham、MA))のアリコート100μLを氷上で10分間解凍した。解凍した細胞に各プラスミド35ngを添加し、これらの細胞をDNAと共に氷上で8分間インキュベートした。マイクロ遠心チューブを42℃の水浴中に30秒間入れ、次いで直ちにマイクロ遠心チューブを氷中に2分間入れることによって熱ショックを行った。2×YT培地900μLをマイクロ遠心チューブに加え、このマイクロ遠心チューブをチューブローテーターに37℃で1時間置いた。最終的に、回収した細胞100μLを、クロラムフェニコール(34μg/mL)およびスペクチノマイシン(50μg/mL)を有するLB固形培地上に蒔き、37℃で一晩インキュベートした。
抗生物質選択プレート上に生育したコロニーから単一のコロニーを釣り上げ、クロラムフェニコール(34μg/mL)およびスペクチノマイシン(100μg/mL)を補充した2×YT培地10mL中にこれを播種した。培養物を200RPMのオービタルシェーカーで振盪しながら37℃で一晩生育させた。クロラムフェニコール(34μg/mL)およびスペクチノマイシン(100μg/mL)を補充した2×YT培地1Lを有する2Lバッフル付きフラスコに一晩培養物6mLを移した。600nmの吸光度が0.56になるまで培養物1Lを200RPMのオービタルシェーカーで振盪しながら37℃で生育させた。
IPTGを終濃度1mMまで添加することによって両方のプラスミドからの発現を誘導した。誘導された培養物を200RPMのオービタルシェーカーで振盪しながら16℃で一晩生育させた。4,000RCF、4℃で15分間の遠心分離によって細胞を回収した。溶解緩衝液50mLあたりComplete(商標)(Roche、Basel、Switzerland)プロテアーゼ阻害剤錠1つを補充した、50mMトリスpH7.5、100mM NaCl、5%グリセリン、および1mM TCEPから構成される溶解緩衝液15mL中に細胞ペレットを再懸濁した。すぐ下流のプロセシングのために、再懸濁した細胞を50mLコニカルチューブに移した。カスケードRNP複合体を精製し、下記のように特徴づけた。
カスケード構成要素およびカスケードRNP複合体の精製
本実施例は、実施例4Bに記載される細菌における過剰発現によって産生された大腸菌I−E型カスケードRNP複合体を精製するための方法を記載するものである。この方法は、固定化金属アフィニティークロマトグラフィーに続いてサイズ排除クロマトグラフィー(SEC)を使用する。本実施例はまた、精製カスケードRNP産物の品質を評価するために使用される方法を記載する。加えて、本実施例は、カスケード構成要素の精製および特徴付けを記載する。
A. Cas8、Cas7、Cas6、Cas5、およびCse2カスケードRNP複合体の精製
大腸菌I−E型カスケードRNP複合体を実施例4Bに記載されるように産生した。固定化金属アフィニティークロマトグラフィーを用いてカスケード複合体を捕捉した。簡潔には、実施例4Bに記載のように産生した再懸濁後の細胞ペレットを氷上で解凍し、溶解緩衝液50mLあたりComplete(商標)(Roche、Basel、Switzerland)プロテアーゼ阻害剤錠1つを補充した、50mMトリスpH7.5、100mM NaCl、5%グリセリン、および1mM TCEPから構成される溶解緩衝液の追加的な15mLによって体積を35mLにした。
50mLコニカルチューブを氷浴中に入れ、1/2インチのチップを備えるQ500超音波処理器(Qsonica、Newtown、CT)を使用する2ラウンドの超音波処理によって細胞を溶解させた。各ラウンドの超音波処理は、50%振幅で10秒の超音波処理に続く20秒の休止という繰り返しサイクルを伴う2.5分の処理サイクルからなった。超音波処理のラウンドの間、チューブを氷浴中で1分間放冷した。48,384RCF、4℃で30分間の遠心分離によって溶解物を清澄化した。次いで、50mMトリスpH7.5、100mM NaCl、10mMイミダゾール、5%グリセリン、および1mM TCEPから構成されるNi洗浄緩衝液で予備平衡化しておいたHispur(商標)Ni−NTA(Thermo Fisher Scientific、Waltham、MA)樹脂に、清澄な上清を添加した。大腸菌発現培養物1L毎に1.5mLベッド体積のニッケルアフィニティー樹脂を使用した。優しく混合しながら4℃で1時間インキュベーション後、500RCF、4℃で2分間の遠心分離によって樹脂をペレットにした。上清を吸引し、樹脂を5ベッド体積のNi洗浄緩衝液で5回洗浄した。各洗浄の後に、樹脂を500RCF、4℃で2分間ペレットにし、吸引によって上清を除去した。最終的に、50mMトリスpH7.5、100mM NaCl、300mMイミダゾール、5%グリセリン、および1mMトリス(2−カルボキシエチル)ホスフィン(TCEP)から構成される5ベッド体積のNi溶出緩衝液の添加によって、結合したタンパク質(カスケードRNP複合体を含む)を溶出させた。500RCF、4℃で2分間遠心分離後、ニッケルアフィニティー溶出液を清潔な50mLコニカルチューブ中に吸引した。
ニッケルアフィニティーの溶出液をサイズ排除クロマトグラフィー(SEC)によってさらに精製した。Ultracel(登録商標)−50(MilliporeSigma、Hayward、CA)メンブランを備えるAmicon(登録商標)(MilliporeSigma、Billerica、MA)限外濾過スピン濃縮器を使用する12℃での限外濾過によってニッケルアフィニティーの溶出液を終体積0.5mLに濃縮した。濃縮したサンプルを、50mMトリスpH7.5、500mM NaCl、5%グリセリン、0.1mM EDTA、および1mM TCEPから構成されるSEC緩衝液で平衡化したHiPrep(商標)16/60 Sephacryl(登録商標)S−300(GE Healthcare、Uppsala、Sweden)カラムを用いて4℃で流速0.5mL/分の分離によってさらに精製する前に、0.22μM Ultrafree−MC GV(MilliporeSigma、Hayward、CA)遠心フィルターを使用して濾過した。SEC緩衝液でタンパク質を溶出させ、1ml画分を収集した。UV280による判定で最も早く溶出したピークを高分子量凝集物質と仮定し、対応する画分を捨てた。その後の溶出画分をクマシー染色SDS−PAGEによって分析した。適切に形成された各複合体は、Cas8を1分子、Cas7を6分子、Cas6およびCas5をそれぞれ1分子、ならびにCse2を2分子含んでいた。SDS−PAGEゲル上に視覚化した場合に、予想される化学量論比のカスケードタンパク質をおおよそで有した溶出画分をプールした。プールした画分を分光測定により分析して、280nmの吸光度よりも大きい260nmの吸光度によって実証されるように、これらの画分がかなりの核酸構成要素を含有していたことを確認した。
Ultracel(登録商標)−50(MilliporeSigma、Hayward、CA)メンブランを備えるAmicon(登録商標)(MilliporeSigma、Hayward、CA)スピン濃縮器でプールされたサンプルを100μLに濃縮し、次いで貯蔵緩衝液で50倍希釈することによって、プールされたサンプルを50mMトリスpH7.5、100mM NaCl、5%グリセリン、0.1mM EDTA、および1mM TCEPから構成される貯蔵緩衝液中になるように交換した。最後に、同じ限外濾過装置を使用してサンプルを10mg/mLに濃縮し、−80℃で保存した。
最終精製産物を分光光度分析して、カスケードRNP複合体の柊濃度を決定し、280nmの吸光度よりも大きい260nmの吸光度によって実証されるような核酸構成要素の存在を確認した。280nmの吸光度を、インタクトな複合体の0.1%溶液の経路長1cmの計算吸光度で割ることによってカスケードRNP複合体の濃度を決定した。精製複合体の0.1%溶液の予測される吸光度は2.03cm-1であるが、これは、複合体中の各分子についての280nmの計算吸光係数の合計(916940M-1cm-1)を複合体中の各分子の分子量の合計(450832g/モル)で割ることによって計算した。
追加的に、クマシーブルー染色を行うSDS−PAGEによって最終産物を分析して、各タンパク質構成要素がほぼ正しい化学量論比で存在したことを確認し、混入タンパク質の存在を評価した。SDS−PAGEゲルをクマシーInstantBlue(商標)(Expedeon、San Diego、CA)染色により染色した。Gel doc(商標)EZ(Bio−Rad、Hercules、CA)イメージャーを使用してゲルをイメージングし、ImageLab(Bio−Rad、Hercules、CA)ソフトウェアを使用してアノテーションした。
B. Cas7、Cas6、Cas5、およびCse2タンパク質を含むカスケード複合体の精製
タンパク質構成要素Cas7、Cas6、Cas5、およびCse2から構成されるカスケード複合体を精製した。本質的に実施例4Bに記載されるように第1のプラスミド(実施例2、図24)からL3ガイドRNA(実施例2、配列番号445、表20)を発現させた。本質的に実施例4Bに記載されるように第2のプラスミド(実施例2、配列番号440、表19、図23C)からカスケードタンパク質を発現させた。
アフィニティークロマトグラフィーを使用して複合体を捕捉した。再懸濁した細胞ペレットを氷上で解凍した。50mLコニカルチューブ中で、溶解緩衝液50mLあたりComplete(商標)(Roche、Basel、Switzerland)プロテアーゼ阻害剤錠1つを補充した、50mMトリスpH7.5、100mM NaCl、5%グリセリン、および1mM TCEPから構成される溶解緩衝液の追加的な15mLで体積を35mLにした。50mLコニカルチューブを氷浴中に入れ、1/2インチのチップを備えるQ500超音波処理器(Qsonica、Newtown、CT)を使用する6ラウンドの超音波処理によって細胞を溶解させた。各ラウンドの超音波処理は、90%振幅で3秒の超音波処理に続く9秒の休止という繰り返しサイクルを伴う1分の処理サイクルからなった。超音波処理のラウンドの間、チューブを氷水浴中で1分間放冷した。48,384RCF、4℃で30分間の遠心分離によって溶解物を清澄化した。50mMトリスpH7.5、100mM NaCl、1mM EDTA、5%グリセリン、および1mM TCEPから構成されるStrep−洗浄緩衝液で予備平衡化しておいたStrep−Tactin(登録商標)Sepharose(登録商標)(IBA GMBH LLC、Goettingen、Germany)樹脂の添加によって清澄な上清をアフィニティー精製した。大腸菌発現培養物1Lに対して0.55mLのベッド体積のアフィニティー樹脂を使用した。優しく混合しながら4℃で1時間インキュベートした後、30mL使い捨て自然流下カラム(Bio−Rad、Hercules、CA)にサンプルを注ぎ、未結合の物質がカラムを通過して流れるようにした。5ベッド体積のStrep−洗浄緩衝液で樹脂を5回洗浄した。最後に、50mMトリスpH7.5、100mM NaCl、2.5mMデスチオビオチン、5%グリセリン、1mM EDTA、および1mM TCEPから構成される5ベッド体積のStrep溶出緩衝液の2回の逐次添加によって、結合したタンパク質を溶出させた。
SECによってアフィニティー溶出液をさらに精製した。Ultracel(登録商標)−50(MilliporeSigma、Hayward、CA)メンブランを備えるAmicon(登録商標)(MilliporeSigma、Hayward、CA)スピン濃縮器を使用する12℃での限外濾過によってアフィニティー溶出液を最終体積550μLに濃縮した。50mMトリスpH7.5、500mM NaCl、5%グリセリン、0.1mM EDTA、および1mM TCEPから構成されるSEC緩衝液で平衡化したHiPrep(商標)16/60 Sephacryl(登録商標)S−300(GE Healthcare、Uppsala、Sweden)カラムを用いて4℃、流速0.4mL/分で分離することによってさらに精製する前に、0.22μm 13mm UltraCruz(登録商標)(Santa Cruz Biotechnology、Dallas、TX)PVDFシリンジフィルターを使用して、濃縮したサンプルを濾過した。SEC緩衝液でタンパク質を溶出させ、0.75mlの画分を収集した。UV280による判定で最も早く溶出したピークを高分子量凝集物質と仮定し、対応する画分を捨てた。第2のピーク(第1のUV280のピーク後方のショルダー)に対応する画分をプールした。
Ultracel(登録商標)−50(MilliporeSigma、Hayward、CA)メンブランを備えるAmicon(登録商標)(MilliporeSigma、Hayward、CA)スピン濃縮器で200μLに濃縮し、次いで50mMトリスpH7.5、100mM NaCl、5%グリセリン、0.1mM EDTA、および1mM TCEPから構成される貯蔵緩衝液で75倍希釈することによって、プールされたサンプルを保存用緩衝液中になるように交換した。2回目にサンプルを700μLに濃縮し、再び保存用緩衝液で20倍希釈した。最後に、同じ限外濾過装置でサンプルを4.7mg/mLに濃縮し、−80℃で保存した。
最終精製産物を分光光度分析して、カスケードRNP複合体の終濃度を決定し、280nmの吸光度よりも大きい260nmの吸光度によって実証されるような核酸構成要素の存在を確認した。280nmの吸光度を、インタクトな複合体の0.1%溶液の経路長1cmの計算吸光度で割ることによってカスケードRNP複合体の濃度を決定した。精製複合体の0.1%溶液の予測される吸光度は2.18cm-1であるが、これは、複合体中の各分子についての280nmの計算吸光係数の合計(762240M-1cm-1)を複合体中の各分子の分子量の合計(348952.07g/モル)で割ることによって計算した。
追加的に、クマシーブルー染色を行うSDS−PAGEによって最終産物を分析して、各カスケードタンパク質がほぼ正しい化学量論比で存在したことを確認し、混入タンパク質の存在を評価した。SDS−PAGEゲルをクマシーInstantBlue(商標)(Expedeon、San Diego、CA)染色により染色した。Gel doc(商標)EZ(Bio−Rad、Hercules、CA)イメージャーを使用してゲルをイメージングし、ImageLab(Bio−Rad、Hercules、CA)ソフトウェアを使用してアノテーションした。適切に形成された各複合体は、Cas7を6分子、Cas6およびCas5をそれぞれ1分子、ならびにCse2を2分子含んでいた。
C. FokI−Cas8融合タンパク質の精製
固定化金属アフィニティークロマトグラフィー、陽イオン交換クロマトグラフィー(CIEX)、および最終的にサイズ排除クロマトグラフィー(SEC)を使用して、細菌過剰発現ペレットから大腸菌I−E型Cas8タンパク質とのFokIヌクレアーゼ融合物を含む融合タンパク質を精製するために使用される方法を本明細書において記載する。
リンカー配列を含む大腸菌I−E型FokI−Cas8融合タンパク質は、実施例1(配列番号413、表16)に記載されている。発現プラスミドは、実施例2(配列番号439、表19、図23B)に記載されている。本質的に実施例4Aに記載されるように、融合タンパク質を含む細胞を産生した。Cas8融合タンパク質は、N末端His6タグ、マルトース結合タンパク質ドメイン、TEV切断部位、FokIヌクレアーゼドメイン、およびアミノ酸30個のリンカーを含んでいた。固定化金属アフィニティークロマトグラフィーを使用してタンパク質を捕捉した。再懸濁した細胞ペレットを含む50mLコニカルチューブを氷上で解凍した。次いで、チューブを氷浴中に入れ、40%振幅で10秒の超音波処理に続く20秒の休止という繰り返しサイクルを伴う3分の処理サイクルのための1/4インチのチップを備えるQ500超音波処理器(Qsonica、Newtown、CT)を使用する超音波処理によって細胞を溶解した。30,970RCF、4℃で30分間の遠心分離によって溶解物を清澄化した。次いで、50mMトリスpH7.5、100mM NaCl、10mMイミダゾール、5%グリセリン、および1mM TCEPから構成されるNi洗浄緩衝液で予備平衡化しておいたHispur(商標)Ni−NTA(Thermo Fisher Scientific、Waltham、MA)樹脂に、清澄な上清を添加した。大腸菌発現培養物1Lに対して2mLのベッド体積のニッケルアフィニティー樹脂を使用した。優しく混合しながら4℃で1時間インキュベートした後、30mL使い捨て自然流下カラム(Bio−Rad、Hercules、CA)にサンプルを注ぎ、未結合の物質がカラムを通して流れるようにした。5ベッド体積のNi−洗浄緩衝液で樹脂を5回洗浄した。最後に、50mMトリスpH7.5、100mM NaCl、300mMイミダゾール、5%グリセリン、および1mM TCEPから構成される5ベッド体積のNi溶出緩衝液を用いて、結合したタンパク質を溶出させた。
ニッケルアフィニティー溶出液をTEVプロテアーゼで処理して、アフィニティータグを除去した。TEVプロテアーゼを溶出液に1:25(w/w)の比で添加した。12mL Slid−A−Lyzer(商標)、10K MWCO(Thermo Fisher Scientific、Waltham、MA)透析カセットを使用して、TEVを含むサンプルをNi−洗浄緩衝液に対して一晩透析した。
Niアフィニティークロマトグラフィーにより透析サンプルからTEVプロテアーゼおよび切断されたHis6−MBP断片を除去した。Ni−洗浄緩衝液で平衡化された清潔なHispur(商標)Ni−NTA(Thermo Fisher Scientific、Waltham、MA)樹脂カラムに透析されたサンプルを注いだ。次いで、樹脂を1カラム体積のNi−NTA洗浄緩衝液で洗浄した。流出液および洗浄液を合わせ、濃縮し、Ultracel(登録商標)−10(MilliporeSigma、Hayward、CA)メンブランを備えるAmicon(登録商標)(MilliporeSigma、Hayward、CA)スピン濃縮器を使用して、保存用緩衝液(50mMトリスpH7.5、500mM NaCl、5%グリセリン、および1mM TCEP)中になるように交換した。次いで、このサンプルを保存用に−80℃で凍結させた。
サンプルを解凍し、陽イオン交換クロマトグラフィー(CIEX)によってさらに精製した。サンプルを氷上で解凍し、50mMトリスpH7.5、5%グリセリン、および1mM TCEPから構成される冷CIEX_A緩衝液で0.475mLから4.75mLに10倍希釈し、結果として50mM NaClの終濃度をもたらした。10mLキャピラリーループを使用して、CIEX_A緩衝液および5%CIEX_B緩衝液(50mMトリスpH7.5、1M NaCl、5%グリセリン、および1mM TCEP)を含む緩衝液で平衡化した1mL Hitrap(商標)SP HP(GE Healthcare、Uppsala、Sweden)カラムにサンプルを負荷した。分離を通して流速は0.75mL/minであった。5%CIEX_B緩衝液15mLでループの中身をカラム上に出した。5%CIEX_B緩衝液の追加的な2mLで未結合のサンプルを洗浄した。結合したタンパク質として集めた500μLの画分を、5%から65%のCIEX_B緩衝液の8mLの直接勾配をかけて溶出した。2つの大きなUV280溶出ピークがあった。これら2つのピークのうちの2番目に対応する4つの画分をプールした。プールされた体積の合計は2mLであった。
プールされたCIEX画分をSECによってさらに精製した。Ultracel(登録商標)−10(MilliporeSigma、Hayward、CA)メンブランを備えるAmicon(登録商標)(MilliporeSigma、Hayward、CA)スピン濃縮器を使用する12℃での限外濾過によって、プールされたCIEX画分を0.3mLの終体積に濃縮した。0.22μm Ultrafree−MC GV遠心分離(MilliporeSigma、Hayward、CA)スピンフィルターを使用して、濃縮したサンプルを濾過し、Cas8 SEC緩衝液(50mMトリスpH7.5、200mM NaCl、5%グリセリン、および1mM TCEP)で平衡化した10/300 Superdex(商標)200 GL Increase(GE Healthcare、Uppsala、Sweden)カラムを用い、4℃で流速0.6mL/分の分離によってそれをさらに精製した。Cas8 SEC緩衝液でタンパク質を溶出させ、0.5ml画分を収集した。UV280による判定で最も早く溶出したピークを高分子量凝集物質と仮定し、対応する画分を捨てた。約14mL後にUV280の第2の主ピークが溶出した。この第2のピークに対応する画分をプールした。Ultracel(登録商標)−3(MilliporeSigma、Hayward、CA)メンブランを備えるAmicon(登録商標)(MilliporeSigma、Hayward、CA)スピン濃縮器を用いて、プールしたサンプルを40μLに濃縮した。濃縮したサンプルを−80℃で保存した。
最終精製産物を分光光度分析して、融合タンパク質の最終濃度を決定し、260nmの吸光度よりも大きい280nmの吸光度によって実証されるような有意な核酸構成要素が存在しないことを確認した。280nm吸光度を、インタクトな複合体の0.1%溶液の計算吸光度で割ることによってFokI−Cas8融合物の濃度を決定した。精製複合体の0.1%溶液の予測される吸光度は1.05cm-1であるが、これは、FokI−Cas8融合物についての280nmの吸光係数((86290M-1cm-1)をその分子量(82171.32g/モル)で割ることによって計算した。追加的に、InstantBlue(商標)(Expedeon、San Diego、CA)染色により染色したSDS−PAGEゲルによって最終産物を分析した。Gel doc(商標)EZ(Bio−Rad、Hercules、CA)イメージャーを使用してゲルをイメージングし、ImageLab(Bio−Rad、Hercules、CA)ソフトウェアを使用してアノテーションした。この分析は、精製融合タンパク質が予想されたサイズであったこと、および低レベルの混入タンパク質だけが存在したことを実証している。
生化学切断アッセイに使用するためのdsDNA標的配列の産生
カスケード複合体またはカスケード−融合エフェクター複合体を用いたin vitro DNA結合または切断アッセイに使用するためのdsDNA標的配列は、いくつかの異なる方法を用いて産生することができる。本実施例は、合成ssDNAオリゴヌクレオチドのアニーリング、gDNAから選択された核酸標的配列のPCR増幅、および/または核酸標的配列の細菌プラスミドへのクローニングを含む、標的配列を産生するための3つの方法を記載するものである。dsDNA標的配列をカスケード結合または切断アッセイに使用した。
A. 合成ssDNAオリゴヌクレオチドをアニーリングすることによるdsDNA標的配列の産生
CRISPR RNAのガイド部分によって認識される標的配列、近隣プロトスペーサー隣接モチーフ(PAM)、ならびに追加的な5’および3’隣接配列を含む、目的の標的領域をコードするDNAオリゴヌクレオチドを商業的製造業者(Integrated DNA Technologies、Coralville、IA)から購入した。構築物1つあたり、センス鎖を含む1つおよび非センス鎖を含む1つという2つのオリゴヌクレオチドを注文した。表26は、バクテリオファージラムダgDNAに由来するJ3と表示される標的配列を含むように注文されたオリゴヌクレオチド配列を挙げる。標的配列およびPAM配列は、5’末端および3’末端の両方への20bpの追加的な配列に隣接する。
1×アニーリング緩衝液(6mM HEPES、pH7.0、および60mM KCl)中で等モル濃度(10μM)の両方のオリゴヌクレオチドを混合し、95℃で2分間加熱し、次いでゆっくりと冷却することによってオリゴヌクレオチドをアニーリングした。次いで、カスケードRNPおよび/またはカスケード−エフェクタードメイン融合RNPを用いて、アニーリングしたオリゴヌクレオチドをDNA結合および/またはDNA切断アッセイに直接使用した。
CRISPR RNAのガイド部分によって認識される標的配列と隣接近隣プロトスペーサー隣接モチーフ(PAM)との両方、ならびに追加的な5’および3’隣接配列を含む目的の標的領域をコードする5’Cy5蛍光標識DNAオリゴヌクレオチドを商業的製造業者(Integrated DNA Technologies、Coralville、IA)から購入した。1つが5’蛍光標識センス鎖を含み、1つが5’非標識センス鎖を含み、1つが5’蛍光標識非センス鎖を含み、1つが5’非標識非センス鎖を含む、4つのオリゴヌクレオチドを構築物1つあたりに注文した。標的配列およびPAM配列は、5’末端および3’末端の両方の20bpの追加的な配列に隣接する。
表27は、バクテリオファージラムダgDNAに由来したJ3と表示される標的配列およびヒトCCR5座位に由来したCCR5と表示される対照標的配列を含むように注文されたオリゴヌクレオチド配列を挙げる。
1×アニーリング緩衝液(6mM HEPES、pH7.0、60mM KCl)中で等モル濃度(1μM)の1つの標識オリゴヌクレオチドと1つの非標識オリゴヌクレオチドまたは2つの標識オリゴヌクレオチドまたは2つの非標識オリゴヌクレオチドとを混合し、95℃で2分間加熱し、次いでゆっくりと冷却することによって、オリゴヌクレオチドをアニーリングした。次いでアニーリングしたオリゴヌクレオチドを、カスケードRNPおよび/またはカスケード−エフェクタードメイン融合RNPを用いたDNA結合アッセイに直接使用した。AZURE c600(Azure BioSystems、Dublin、CA)バイオイメージャーを用いてCy5蛍光標識DNAオリゴヌクレオチドをイメージングした。
この方法は、追加的な標識または非標識の標的配列または二重標的配列を産生するために適用することができ、その際、二重標的は、スペーサー間配列によって分離された、個別のカスケード分子によって標的化される2つのプロトスペーサー配列を含む標的として定義される。
B. gDNAからのPCR増幅によるdsDNA標的配列の産生
gDNA鋳型物質からPCR増幅を直接用いて、ヒトgDNA由来の二重標的のためのdsDNA標的配列を産生させた。具体的には、PCR反応物は、K562細胞から精製されたヒトgDNAおよびQ5 Hot Start High−Fidelity 2X Master Mix(New England Biolabs、Ipswich、MA)のみならず、表28に挙げられるプライマーを含有した。表中、下線部分は、gDNA内のプライマー結合部位に対応する。
製造業者の説明書(New England Biolabs、Ipswich、MA)に従ってPCRを行い、Nucleospin GelおよびPCR Cleanupキット(Macherey−Nagel、Bethlehem、PA)を使用して長さ288bpの所望の産物DNAを精製した。次いで、カスケードRNPおよび/またはカスケード−エフェクタードメイン融合RNPを用いたDNA結合および/またはDNA切断アッセイにこのdsDNAを直接使用した。
C. 細菌プラスミドへの標的配列のクローニングによるdsDNA標的配列の産生
CRISPR RNAのガイド部分によって認識されるプロトスペーサーとしても知られる標的配列、近隣プロトスペーサー隣接モチーフ(PAM)、ならびに追加的な5’および3’隣接配列を含む、目的の標的領域をコードするDNAオリゴヌクレオチドを商業製造業者(Integrated DNA Technologies、Coralville、IA)から購入した。アニーリングした場合に、制限酵素EcoRIおよびBlpI、またはBamHIおよびEcoRIによるそれらのそれぞれの認識部位の切断時に末端が付着末端を再生するようにオリゴヌクレオチドを設計した。バクテリオファージラムダゲノムに由来するJ3と表示される単一の標的配列を含むようにオリゴヌクレオチドを設計した。加えて、バクテリオファージラムダゲノムに由来するJ3およびL3と表示される2つのタンデム型標的配列が15bpのスペーサー間配列によって互いから分離されたものを含むようにオリゴヌクレオチドを設計した。これらのオリゴヌクレオチドの配列を表29に挙げる。
オリゴヌクレオチドは、商業製造業者によって導入された、またはT4ポリヌクレオチドキナーゼ(New England Biolabs、Ipswich、MA)を使用して社内でリン酸化された、5’−リン酸化末端を含む。次いで、オリゴヌクレオチドをアニーリング緩衝液(6mM HEPES、pH7.0、60mM KCl)中で等モル量で一緒に混合し、95℃で2分間加熱し、次いで作業台上でゆっくりと冷却することによって終濃度1μMでアニーリングさせた。
別に、pACYC−Duet1(MilliporeSigma、Hayward、CA)プラスミドをBamHIおよびEcoRI、またはEcoRIおよびBlpIのいずれかの対応する制限酵素対で二重消化したが、その付着末端は、ハイブリダイゼーションしたオリゴヌクレオチドの末端によって形成される付着末端とマッチする。アガロースゲル電気泳動を用いて、取り除いた挿入部から、二重消化されたベクターを分離した。
ハイブリダイズしたオリゴヌクレオチドを二重消化されたベクターにクローニングするために、ハイブリダイズしたオリゴヌクレオチドを50nM原液濃度に希釈し、次いでハイブリダイズしたオリゴヌクレオチド、二重消化されたベクター、およびQuick Ligase(New England Biolabs、Ipswich、MA)を使用してライゲーション反応物10μLを形成させた。次いで、ライゲーション反応を用いてケミカルコンピテント大腸菌株を形質転換し、アガロースプレート上で一晩生育させた後、個別のクローンを単離し、液体培養で生育させて、十分な細菌培養物を生成し、その培養物からプラスミドを単離した。次いで、サンガーシークエンシングを用いて所望のプラスミド配列を検証した。表30は、J3標的配列(配列番号481)を含むプラスミドならびに15bpのスペーサー間配列(配列番号482)によって分離されているJ3およびL3標的配列を含むプラスミドについての完全ベクター配列を提供するものである。
さらなるクローニング操作を用いて、追加的な二重標的プラスミド構築物を生成した。配列番号482の15bpのスペーサー間配列は、ユニークなAvrIIおよびXhoI制限部位を含む。したがって、これらの制限部位へのハイブリダイズしたさらなるオリゴヌクレオチドの導入は、精製されたカスケードRNPおよびカスケード−ヌクレアーゼ融合RNPを用いた生化学検査のためにインタースペーサーをより長い長さに伸長する。crRNAによってガイドされるFokI−カスケード融合複合体が2つの隣接DNA部位を標的化するので、隣接DNA結合複合体由来のFokIドメインのダイマー化は、2つの標的部位を分離しているインタースペーサー内にDNA切断をもたらす。様々なスペーサー間長を設計し、試験して、FokIヌクレアーゼドメインとそれが融合したカスケードサブユニットタンパク質との間で所定の係留形状を有する所定のスペーサー間長を評価した。30bpの拡張されたスペーサー間配列を含む標的DNA基質についての完全ベクター配列を配列番号483として表30に示す。
加えて、以下のクローニング戦略は、1つの大きな挿入部に沿って連続的に結びついたいくつかの標的配列を含むプラスミド基質を提供した。17個の連続する二重標的を含んだ遺伝子ブロックを商業製造業者(Integrated DNA Technologies、Coralville、IA)に注文した。遺伝子ブロックは、各二重標的を近隣二重標的から分離している4bpを含み、ヒトgDNAに由来する16個の二重標的のみならず、バクテリオファージラムダゲノムに由来するJ3/L3標的を含む1つの対照二重標的も含んでいた。16個の連続するヒト二重標的のゲノム座標を表31に示す。末端に隣接SacIおよびSbfI制限部位を有する遺伝子ブロックを注文し、その結果、それをpACYC−Duet1ベクター中のSacIおよびSbfI部位にクローニングすることができた。pACYC−Duet1内に遺伝子ブロックをクローニングすることによって生成される多重標的プラスミド基質の全ベクター配列を表30の配列番号484に示す。この多重標的配列プラスミドは、プラスミド内の連続的に結びついた標的部位のうちの1つを標的化するcrRNAを内部に有する複数の異なるFokI−カスケード調製物の生化学試験を可能にする。
生化学的切断アッセイにおける精製カスケード複合体の使用
本実施例は、生化学dsDNA切断アッセイにおけるFokI−カスケード融合タンパク質複合体の使用を例証するものである。タンパク質試薬を、dsDNA切断におけるそれらの活性に関して比較した。
実施例1、2、および5に概略を述べるように、大腸菌I−E型カスケード系に由来するFokI−カスケードRNPを設計し、大腸菌において組み換え発現させ、使用のために精製した。バクテリオファージラムダgDNAに由来するJ3およびL3標的配列を標的化するCRISPR RNA、またはヒトgDNA内のTRAC遺伝子におけるイントロンを標的化するCRISPR RNAのいずれかを含むようにこれらのRNPを設計した。各RNP調製物は、crRNAのガイド部分以外は同一である2つのFokI−カスケード複合体を含む不均一混合物である。
Cas8を有さないカスケード複合体と別々にFokI−Cas8を精製し、J3およびL3ラムダ標的配列に標的化されたガイドポリヌクレオチドを有するようにプログラムし、PAM−イン立体配置で標的部位を内部に有するJ3/L3プラスミド基質を用いる生化学切断アッセイに使用した。
(実施例2に記載されるように配列番号440および配列番号446を使用して産生された)CasBCDE複合体を、16−aaリンカー(実施例2、表19における配列番号439に記載される一般FokI−Cas8発現ベクター配列;特定の16−aaリンカーは、実施例1、表17における配列番号431である)を含む精製FokI−Cas8と一緒に混合することによってFokI−カスケード複合体を再構成した。1×カスケード切断緩衝液(20mMトリス−Cl、pH7.5、200mM NaCl、5mM MgCl2、1mM TCEP、5%グリセリン)中で、どちらも1μM終濃度のCasBCDEおよびFokI−Cas8を用いて再構成を行った。
DNA切断アッセイを行うための反応混合物は次の通りである。J3/L3二重標的配列を30bpインタースペーサー(表30の配列番号483)と共に含むプラスミド基質を、終濃度13.3ng/μLのプラスミドDNAを有する1×カスケード切断緩衝液中の反応物15μL中に様々な濃度のFokI−カスケード複合体(3〜100nM)と共にインキュベートした。反応物を37℃で30分間インキュベートし、その後、6×SDS負荷色素3μLを添加した。負荷色素を添加して、結合したFokI−カスケード複合体を変性させた。反応混合物の構成要素を0.8%アガロースゲル電気泳動によって分離した。電気泳動後にSYBR(商標)Safe DNA Gel Stain(Thermo Scientific、Wilmington、DE)でゲルを染色した。
陽性対照として、化膿性連鎖球菌(S.pyogenes)Cas9タンパク質に、カスケードJ3標的配列の20bp部分を標的化する単鎖ガイドRNA(sgRNA)(sgRNA−J3;スペーサー配列を配列番号501として示す)をプログラミングした。1×CCE緩衝液(20mM HEPES pH7.4、10mM MgCl2、150mM KCl、5%グリセリン)中で2倍モル過剰のsgRNAと一緒にCas9を混合することによってCas9/sgRNA−J3複合体を再構成した。反応物を37℃で30分間インキュベートすることによって、このCas9/sgRNA−J3複合体による切断を同じ濃度範囲(3〜100nM)にわたり評価した。未切断のプラスミドDNAのみならず、NheI制限酵素(New England Biolabs、Ipswich、MA)で直鎖化されたプラスミドDNAを含む対照レーンも実験に含めた。未切断のプラスミドDNAは高次コイルを形成しており、切断された直鎖化プラスミドDNAよりも移動度が大きいので、標的DNAの切断は、プラスミドにおける移動度シフトによって証明される。ニックが入った開環状プラスミドDNAは、高次コイル形成プラスミドDNAおよび直鎖化プラスミドDNAの両方よりも移動度が小さい。
これらの実験から得られたデータは、濃度範囲にわたり、FokI−カスケード複合体がCas9−sgRNAと類似の標的DNA切断活性を示したことを実証している。試験した最高濃度(100nM)で、プラスミド標的は、FokI−カスケード複合体およびCas9−sgRNAによって定量的に直鎖化された。
FokI−カスケード複合体試薬を、それらの標的DNA切断の動態についても試験した。30bpインタースペーサー(配列番号483)を有するJ3/L3二重標的配列を含むプラスミド基質を、反応物15μL中の200nM FokI−カスケード複合体または200nM Cas9−sgRNAと共に終濃度13.3ng/μLのプラスミドDNAでインキュベートした。0、7、10、15、20、25、または30分のいずれかで反応をクエンチし、上記のようにアガロースゲル電気泳動によって反応構成要素を分離した。FokI−カスケード複合体は、Cas9/sgRNA−J3複合体と類似しているがわずかに遅い速度の標的DNA切断活性を示し、標的プラスミドは、FokI−カスケード複合体について25分の時点まで、およびCas9/sgRNA−J3複合体について20分の時点までに定量的に直鎖化された。
J3/L3二重標的プラスミド基質の特異的DNA切断と比べたpACYC−Duet1非標的プラスミド基質に対するそれらの非特異的DNA切断および/またはニッキング活性についてもFokI−カスケード複合体試薬を試験した。表32は、この対照のために使用したpACYC−Duet1非標的プラスミド基質の配列(配列番号502)を含む。具体的には、反応緩衝液中の一価塩濃度に対する非特異的および特異的DNA標的切断の依存性を検討した。NaCl濃度を200mMから150mM、100mMまたは50mMのいずれかに低下させた、1×カスケード切断緩衝液(20mMトリス−Cl、pH7.5、200mM NaCl、5mM MgCl2、1mM TCEP、および5%グリセリン)のバリアントを製造し、200nM FokI−カスケード複合体を13.3ng/μLのJ3/L3標的プラスミドまたは13.3ng/μLのpACYC−Duet1非標的プラスミドのいずれかと共にインキュベートすることによって、上記と同じ切断反応を行った。NaCl濃度を100mMに維持したが、5mM MgCl2を10mM EDTAに置換した追加的な対照反応を行ったが、FokIがDNA切断のために二価金属イオンを必要とするので、これは切断を妨げると予想された。したがって、非標的プラスミドおよびJ3/L3標的プラスミドを次の反応条件に供した:−FokI−カスケード複合体;+FokI−カスケード複合体、100mM NaCl緩衝液+10mM EDTA;+FokI−カスケード複合体、50mM NaCl緩衝液;+FokI−カスケード複合体、100mM NaCl緩衝液;+FokI−カスケード複合体、150mM NaCl緩衝液;+FokI−カスケード複合体、200mM NaCl緩衝液。データは、FokI−カスケード複合体が<200mM NaClの低い塩濃度で非標的プラスミドおよびJ3/L3標的プラスミドの両方の非特異的ニッキングを示し、ところが200mM NaClの一価塩濃度で、非標的プラスミドが無傷のままであったが、J3/L3標的プラスミドが定量的に直鎖化されたことを実証している。さらに、EDTAを含有する緩衝液は、予想通り標的切断の完全な抑止をもたらした。
FokI−カスケード複合体が予想される位置で、すなわちJ3標的とL3標的とを分離しているスペーサー間配列の中央で標的プラスミドを切断することを確認するために、標的プラスミドを最初にFokI−カスケード複合体と共にインキュベートし、続いてプラスミド基質の他のどこかを切断するAfeI制限酵素(New England Biolabs、Ipswich、MA)と共にインキュベートする実験を行った。したがって、FokI−カスケード1複合体およびAfeIの両方による切断は、高次コイル形成環状プラスミドを2つの直鎖状断片に変換し、それらの断片はアガロースゲル上で互いに異なる種として泳動する。具体的には、切断は、長さが2427bpおよび1357bpの断片を生成すると予想された。
13.3ng/μL J3/L3標的プラスミドを200nM FokI−カスケード1複合体と共に30分間インキュベートし、その後AfeI 1μL(10ユニット/μL;New England Biolabs、Ipswich、MA)を反応物に添加し、続いて追加的に37℃で30分間インキュベートした。反応産物を上記のようにアガロースゲル電気泳動によって分離した。追加的に、対照実験のために標的プラスミドをFokI−カスケード1複合体のみまたはAfeIのみと共にインキュベートし、(プラスミドがJ3/L3二重標的を欠如することから)FokI−カスケード1複合体ではなくAfeIによって切断することができる非標的プラスミドを用いて同じ反応を行った。表32は、この対照のために使用したpACYC−Duet1非標的プラスミド基質の配列(配列番号502)を含む。したがって、非標的プラスミドおよびJ3/L3標的プラスミドを次の反応条件に供した:−AfeI/−FokI−カスケード複合体;−AfeI/+FokI−カスケード複合体;+AfeI/+FokI−カスケード複合体;および+AfeI/−FokI−カスケード複合体。データは、FokI−カスケード複合体が予想される位置で標的プラスミドを切断したことを実証している。それは、FokI−カスケード1複合体およびAfeIとの同時インキュベーションが、予想される長さの2つの直鎖状産物をもたらしたからである。
FokI−カスケード複合体によるDNA切断の配列特異性をさらに確認するために、次のものを含む追加的な対照プラスミド基質を生成した:J3標的に隣接するPAMへの突然変異、L3標的に隣接するPAMへの突然変異、J3/L3標的に隣接する両方のPAMへの突然変異;J3標的内のスペーサー配列への突然変異、L3標的内のスペーサー配列への突然変異、J3/L3標的内の両方のスペーサー配列への突然変異;ならびにJ3標的はあるがL3標的なし、L3標的はあるがJ3標的なし、およびJ3標的もL3標的もなし。したがって、プラスミド基質は次の通りであった:J3 PAM突然変異体、L3 PAM突然変異体、J3/L3 PAM突然変異体、J3スペーサー突然変異体、L3スペーサー突然変異体、J3/L3スペーサー突然変異体、非標的プラスミド、J3のみの標的、L3のみの標的、およびJ3/L3標的プラスミド。各標的を次の反応条件に供した:−NdeI/−FokI−カスケード複合体;+NdeI/−FokI−カスケード複合体;および−NdeI/+FokI−カスケード1複合体。表32は、上記の突然変異型プラスミド基質のすべての配列を含む(配列番号502〜配列番号510)。
200nM FokI−カスケード複合体および13.3ng/μLプラスミド基質を使用して上記のようにDNA切断反応を行った;NdeI(New England Biolabs、Ipswich、MA)を用いて各プラスミド基質を直鎖化するための対照反応を行った。上記のようにアガロースゲル電気泳動を行った。データは、効率的な二本鎖切断の導入および標的プラスミドの直鎖化が、PAM突然変異もしくはシード突然変異を内部に含む対照プラスミドではなくJ3/L3標的プラスミドについてのみ、または2つの標的部位のうちの1つだけに観察されることを実証している。
様々なFokI−カスケード複合体についての構成要素をクローニングし、過剰発現させた。異なるFokI−カスケード複合体についての活性を比較するために、これらの構成要素によって産生されたRNPを精製し、生化学的DNA切断について試験した。具体的には、次のものを含む再構成されたFokI−カスケード複合体についてDNA切断活性を比較した:別々に精製されたCasBCDE複合体(配列番号440および配列番号446を使用して産生)およびFokI−Cas8(配列番号439を使用して産生);J3/L3ガイドcrRNAを内部に含むFokI−カスケード(配列番号442および配列番号446を使用して産生);Cas7サブユニット(配列番号443および配列番号446を使用して産生)またはCas6サブユニット上のいずれかに追加的な核局在化シグナルを内部に含むFokI−カスケード;Cas7サブユニットまたはCas6サブユニット上のいずれかに追加的な核局在化シグナルおよびHAタグを内部に含むFokI−カスケード;サイズ排除クロマトグラフィー(SEC)およびイオン交換クロマトグラフィー(IEX)の両方を伴う、よりストリンジェントな精製を受けたFokI−カスケード;ならびにさらなるクリーンアップを行わずに固定化金属アフィニティークロマトグラフィー(IMAC)によってのみ精製されたFokI−カスケード。
したがって、非標的プラスミドおよびJ3/L3標的プラスミドを次の反応条件に供した:陰性対照;AfeI;CasBCDE+FokI−Cas8複合体;FokI−カスケード複合体;FokI−カスケード(NLS−Cas6)複合体;FokI−カスケード(Cas7−NLS)複合体;FokI−カスケード(NLS−HA−Cas6)複合体;FokI−カスケード(Cas7−HA−NLS)複合体;FokI−カスケード複合体(IEX、SECクリーンアップ);およびFokI−カスケード複合体(クリーンアップなし)。非標的プラスミドまたはコンセンサスJ3/L3標的プラスミドのいずれかを使用して上記のようにこれらのRNP試薬を用いたDNA切断反応を行い、アガロースゲル電気泳動によって反応産物を分離した。データは、1つの例外を除きすべてのRNP試薬がほぼ同一で定量的なプラスミドDNAの切断を示し、非標的プラスミドのバックグラウンド切断がないことを実証している。唯一の例外は、さらなるクリーンアップなしに精製されたFokI−カスケードであったが、FokI−カスケードが非標的プラスミドと共にインキュベートされたレーンに見られるように、これはより非特異的なニッキング活性を示した。
最後に、出発点としてFokI−カスケード複合体のNLSタグ付きCas7バリアントを使用して、1つの大きな挿入部(配列番号484)に沿って連続的に結びついたヒトゲノム部位Hsa01〜Hsa16についてのプラスミド基質の生化学的DNA切断について16個の異なる対形成ガイドcrRNAを試験した。crRNAのそれぞれの対は、ヒトgDNAにおける2つの隣接標的部位に対応する2つのユニークなスペーサー配列がインタースペーサーによって分離されたものを含み;標的配列は、配列番号485〜配列番号500に記載されている。表33は、Hsa01〜Hsa16 gDNA配列を標的化する対毎に両方のcrRNAの配列を含み;crRNAのスペーサーに下線を付け、小文字で示し、ガイド領域の5’および3’の配列は、CRISPRアレイからのリピート配列に対応する。
16個のFokI−カスケード複合体を精製した後、上記のように切断反応を行った。この反応では、FokI−カスケード複合体を、ヒトゲノム部位Hsa01〜Hsa16を含むプラスミド基質と共にインキュベートし、アガロースゲル電気泳動によって反応産物を分離した。データは、16個のRNP試薬のうち、16個中14個(Hsa03〜Hsa16)が高次コイル環状プラスミド基質の切断型直鎖状形態への変換によって証明されるような定量的に近いDNA切断を示したことを実証している。構築物Hsa01およびHsa02だけが部分ニッキング活性を示した。さらにデータは、設計された16個の対形成gRNAを使用してFokI−カスケード複合体が効果的にプログラムされて、治療的に関連するヒト遺伝子が標的化されたことを実証した。
FokI−カスケードRNP複合体の標的細胞への導入
本実施例は、ヒト細胞におけるゲノム編集を促進するためのFokI融合タンパク質を含む大腸菌I−E型カスケード複合体の設計および送達を例証し、それらを予め組み立てられたカスケードRNP複合体として標的細胞内に送達することを記載するものである。
A. 細胞内への形質導入のためのFokIを含むカスケードRNP複合体の産生
最小CRISPRアレイを設計して、ヒトゲノムにおける8つの互いに異なる座位を標的化した。各最小CRISPRアレイは、両方ともCRISPRリピート配列に隣接した2つのスペーサー配列を含んでいた。2つのスペーサー配列は、互いに30bp離れたゲノム中の座位(すなわち、30bpのスペーサー間領域)を標的化しており、各スペーサーは、標的細胞ゲノム中のAAGまたはATGプロトスペーサー隣接モチーフ(PAM)配列に隣接する標的配列と結合するように設計した。アニーリングされたオリゴヌクレオチド(Integrated DNA Technologies、Coralville、IA)を細菌発現のためにpACYC−Duet1(MilliporeSigma、Hayward、CA)ベクター骨格中にライゲーションすることによって各最小CRISPRアレイを含むプラスミドベクターを産生した。
最小CRISPRアレイにおいて選択されたスペーサーを産生するための重複プライマーを表34に示し、プライマーの配列を表35に記載する。
カスケードRNP複合体の産生のための細菌発現ベクターの設計を実施例2に詳細に説明する。簡潔には、各cas遺伝子を単一のオペロンから発現させ、cas遺伝子についてのコーディング配列をcas8−cas2−cas7−cas5−cas6の順序で配置した。30−aaリンカーによってFokI部分をCas8に結びつけ、核局在化シグナル(NLS)をFokI−Cas8(FokI−カスケード複合体)のN末端およびCas6のN末端に結びつけた(以後、FokI−カスケード−NLS−Cas6複合体と呼ぶ、配列番号577)。
本質的に実施例5Aに記載されるようにFokI−カスケード−NLS−Cas6複合体を大腸菌から組み立てられた複合体として精製した。
B. FokIを含むカスケードRNP複合体の真核細胞へのトランスフェクション
HEK293細胞(ATCC、Manassas、VA)を、10%FBSおよび1×抗生物質−抗真菌薬溶液(Mediatech、Inc.、Manassas、VA)を補充したDMEM培地中、37℃、5%CO2および湿度100%で懸濁培養した。Nucleofector(登録商標)96-well Shuttleシステム(Lonza、Allendale、NJ)を使用してHEK293細胞をトランスフェクトした。ヌクレオフェクションの前に、FokI−カスケードRNP 5μlを96ウェルプレートの個別のウェルに移した。各ウェルは、RNPに応じて約225〜500pmolのFokI−カスケード−NLS−Cas6複合体を含んでいた。HEK293細胞を50mlコニカル遠心チューブに移し、200×Gで3分間遠心分離した。培地を吸引し、カルシウムおよびマグネシウムを含まないPBS中で細胞ペレットを洗浄した。細胞をもう一度遠心分離し、Nucleofector SF(Lonza、Allendale、NJ)緩衝液中に1×107個/mlの濃度で再懸濁した。この細胞懸濁液20μlを96ウェルプレート中のFokI−カスケード−NLS−Cas6複合体に添加し、混合し、次いで全体積を96ウェルNucleocuvette(商標)(Lonza、Allendale、NJ)プレートに移した。次いでプレートをNucleofector(商標)96−well Shuttle(商標)システム(Lonza、Allendale、NJ)中に負荷し、96−CM−130 Nucleofector(商標)プログラム(Lonza、Allendale、NJ)を使用して細胞にヌクレオフェクションした。ヌクレオフェクションの直後、完全DMEM培地80μlを96ウェルNucleocuvette(商標)(Lonza、Allendale、NJ)プレートの各ウェルに添加した。次いで、ウェルの全内容物を、完全DMEM培地100μlを含む96ウェル組織培養プレートに移した。細胞を37℃、5%CO2および100%湿度で約72時間培養した。
約72時間後に、HEK293細胞を500×Gで5分間遠心分離し、培地を除去した。カルシウムおよびマグネシウムを含まないPBS中で細胞を洗浄した。次いで細胞ペレットをQuickExtract DNA Extraction solution(Epicentre、Madison、WI)50μl中に再懸濁した。次いで得られたgDNAサンプルを37℃で10分間、65℃で6分間、および95℃で3分間インキュベートして、反応を止めた。次いでgDNAサンプルを水50μlで希釈し、その後のディープシークエンシング解析のために−20℃で保存した。
C. トランスフェクトされた細胞からのgDNAのディープシークエンシング
単離されたgDNAを使用して、終体積10μL中に1×濃度のQ5 Hot Start High−Fidelity 2X Master Mix(New England Biolabs、Ipswich、MA)、各0.5μMのプライマー、gDNA 3.75μLを使用して第1のPCRを行い、98℃で1分間と、98℃10秒、60℃20秒、72℃30秒の35サイクルと、72℃で2分間の最終伸長とで増幅した。PCR反応物を水で1:100希釈した。標的特異的プライマーを表36に示す。標的特異的プライマーは、Illuminaコンパチブル配列を含み、その結果、MiSeqシークエンサー(Illumina、San Diego、CA)を使用して増幅産物を分析することができた。
それぞれがユニークな8bpのインデックス(プライマー配列中に「NNNNNNNN」で示す)(配列番号575および配列番号576参照)を含むことで、配列解析の間に各アンプリコンのデマルチプレクシングを可能にするプライマー(表35におけるG2およびH2)を用いて、各標的が増幅されるように第2の「バーコーディング」PCRを設定した。
終体積10μL中に1×濃度のQ5 Hot Start High−Fidelity 2X Master Mix(New England Biolabs、Ipswich、MA)、それぞれ0.5μMのプライマー、1:100希釈された第1のPCR物質1μLを使用して第2のPCRを行い、98℃で1分と、98℃10秒、60℃20秒、72℃30秒の12サイクルと、72℃で2分間の最終伸長とで増幅した。シークエンシングのためにアンプリコンのSPRIselectビーズ(Beckman Coulter、Pasadena、CA)ベースの浄化を行うためにPCR反応物を単一の微量遠心チューブ内にプールした。
プールしたアンプリコンに、0.9×体積のSPRIselectビーズを添加し、混合し、室温で10分間インキュベートした。溶液が透明になるまでマイクロチューブを磁気チューブスタンド(Beckman Coulter、Pasadena、CA)に立てた。上清を除去し、捨て、残ったビーズを1体積の85%エタノールで洗浄し、室温(RT)で30秒間インキュベートした。インキュベーションの後に、エタノールを吸引し、ビーズを室温で10分間風乾した。次いでマイクロチューブを磁気スタンドから外し、0.25×体積の水をビーズに添加し、強く混合し、RTで2分間インキュベートした。微量遠心分離機でマイクロチューブを回転させて、チューブの内容物を収集し、次いで磁石に戻し、溶液が透明になるまでインキュベートし、精製アンプリコンを含有する上清を清潔なマイクロチューブに分注した。Nanodrop(商標)2000(Thermo Scientific、Wilmington、DE)システムを使用して精製アンプリコンのライブラリーを定量した。
アンプリコンライブラリーを260nmの吸光度(Nanodrop(商標)2000(Thermo Scientific、Wilmington、DE)システム)およびアンプリコンのサイズから計算した4nM濃度に規準化した。MiSeqシークエンサー(Illumina、San Diego、CA)によりMiSeq試薬キットv2、300サイクル(Illumina、San Diego、CA)を用いて2つの151サイクルのペアエンドラン+2つの8サイクルのインデックスリードでライブラリーを解析した。
D. ディープシークエンシングデータの解析
第2のラウンドのPCRにおけるアンプリコンに適応したインデックスバーコーディング配列に基づきシークエンシングデータにおける産物の同一性を解析した。以下のタスクを実行する計算スクリプトを使用してMiSeq(Illumina、San Diego、CA)データを処理した:
Bowtie(bowtie−bio.sourceforge.net/index.shtml)ソフトウェアを使用してリードをヒトゲノム(build GRCh38/38)と整列させた。
整列されたリードを野生型座位と比較した;座位のどの部分とも整列しなかったリードを捨てた。
野生型配列とマッチするリードを集計した。インデルを有するリード(FokI−カスケードRNPの予想される切断部位から前後10bp)をインデルの種類によって分類し、集計した。
総インデルリードを野生型リードとインデルリードとの合計で割り、突然変異型リードのパーセントを与えた。
図28は、ゲノム編集(図28、縦軸、「編集%」)をFokI−カスケード−NLS−Cas6複合体ヌクレオフェクション(n=1)に対して示す(図28、横軸、Hsa3、Hsa4、Hsa5、Hsa6、Hsa7、Hsa8、Hsa9、およびHsa10)。図28では、白い棒線は陰性対照であり、黒い棒線はFokI−カスケード−NLS−Cas6複合体の添加である)。FokI−カスケード−NLS−Cas6複合体は全部で8つの座位に編集を誘導した。編集は、約0.2〜5%のインデルの範囲であり、インデルは、スペーサー間領域中央の予測される切断部位周辺に中心を置いた。
FokI−カスケードRNP複合体の構成要素をコードするプラスミドの標的細胞への導入
本実施例は、ヒト細胞におけるゲノム編集を促進するための、FokI融合タンパク質を含む大腸菌I−E型カスケード複合体の設計および送達を例証する。本実施例はまた、真核細胞へのカスケード複合体構成要素を発現しているプラスミドベクターの送達を記載する。
A. 標的細胞にトランスフェクトすべきFokI−カスケードRNP構成要素をコードするベクターの産生
最小CRISPRアレイを設計して、ヒトゲノムにおけるTRAC座位を標的化した。最小CRISPRアレイは、実施例1および3に記載されるようにその両方がCRISPRリピート配列に隣接した2つのスペーサー配列を含んでいた。2つのスペーサー配列は、互いに30bp離れたゲノム中の座位を標的化しており、各スペーサーは、AAG PAM配列に隣接するゲノム配列と相補的であった。2つのスペーサー配列に隣接するCRISPRリピートをコードする、アニーリングされたオリゴヌクレオチド(Integrated DNA Technologies、Coralville、IA)を、2つのCRISPRリピート配列と共に哺乳動物発現ベクター中にライゲートすることによって、最小CRISPRアレイを含むプラスミドベクターを産生した。結果としてもたらされたプラスミドは、ヒトU6(hU6)プロモーターから2つのガイドを発現した「リピート−スペーサー−リピート−スペーサー−リピート」を含んでいた(配列番号454)。
FokI−カスケードRNPタンパク質構成要素をコードする遺伝子を、CMVプロモーターを含むプラスミドベクター中にクローニングして、哺乳動物細胞における送達および発現を可能にした。Cas遺伝子を別々のプラスミド(配列番号448〜配列番号451および配列番号453)中に、または各遺伝子が2Aウイルスペプチド「リボソームスキップ」配列(配列番号455中)を介して連結した多シストロン性構築物として単一のプラスミド中にクローニングした。2つの異なる方法を介してFokI−カスケードRNP複合体を真核細胞中に送達した:cas遺伝子および最小CRISPRアレイを、別々のプラスミド(6プラスミド送達系、配列番号448〜配列番号451、配列番号453および配列番号454)上に、またはすべてのcas遺伝子を多シストロン性構築物としてコードする1つのプラスミドおよび最小CRISPRアレイをコードする第2のプラスミド(2プラスミド送達系、配列番号454および配列番号455)上に供給した。
B. FokI−カスケードRNP複合体をコードするプラスミドのトランスフェクション
6プラスミド送達系および2プラスミド送達系についてのトランスフェクション条件を、実施例8Bに詳述されるものに以下の変更を加えて行った。ヌクレオフェクションの前に、プラスミドベクター溶液5μlを96ウェルプレートの個別のウェルに移した。ゲノム編集のために各構成要素の必要性を調べることによって6プラスミド送達系を最初に試験した。より具体的には、プラスミドの「カクテル」を各ウェルに添加することにより、一定量(420ng)の5つのプラスミドおよび可変量の第6のプラスミド(0ng、70ng、700ng、または1,400ngのいずれか)があるようにした。次に、一定量(3.5μg)の合計プラスミドDNAで、casコードプラスミドに対する最小CRISPRアレイプラスミドの比を変動させてヌクレオフェクションすることによって、6プラスミド送達系および2プラスミド送達系を比較した。最後に、その後のディープシークエンシング解析のためにヌクレオフェクションの約72時間後に溶解物を回収した。
C. トランスフェクトされた細胞からのgDNAのディープシークエンシングおよびデータ解析
実施例8Cに詳述するようにディープシークエンシングを行ったが、表36からの標的特異的プライマーYおよびZだけを使用した。
D. ディープシークエンシングデータの解析
実施例8Dに詳述するようにディープシークエンシングデータの解析を行った。図29は、TRAC座位でのゲノム編集(図29、縦軸、「編集%」)を6プラスミド送達戦略における各FokI−カスケード構成要素(n=1)に対して示す(図29、横軸、ガイド、FokI−Cas8、Cse2、Cas7、Cas5、Cas6、および参照サンプル)。図29では、白い棒線はFokI−カスケード構成要素0ngを表し、ドットの棒線はFokI−カスケード構成要素70ngを表し、格子の棒線はFokI−カスケード構成要素700ngを表し、縞の棒線はFokI−カスケード構成要素1,400ngを表す(各FokI−カスケード構成要素について横軸の棒線のそれぞれ左から右への順序を示す)。示すように、所与の構成要素が欠如した場合、編集が打ち消された、または劇的に減少した(Cse2の場合)。これは、各カスケード構成要素がプラスミド送達を介した編集に必要であることを確認するものである。
図30は、6プラスミド送達系または2プラスミド送達系を用いたゲノム編集を比較するデータを示す。図30は、標的座位でのゲノム編集(図30、縦軸、「編集%」)を様々な濃度の6プラスミド系(図30、白い棒線)および2プラスミド系(図30、黒い棒線)の各構成要素に対して示す(図30、横軸の棒線の順序は、左から右にそれぞれ6プラスミド系および2プラスミド系である)。横軸に沿った数値グループは構成要素の量を指す:一番上の行=ng単位の合計プラスミド、第2の行=ng単位の最小CRISPRアレイプラスミド、および第3の行=ng単位のCasコードプラスミド(例えば、第1の数値グループ:一番上の行=合計プラスミド、3500ng;第2の行=最小CRISPRアレイプラスミド、0ng;および第3の行=Casコードプラスミド、3500ng)。
両方の方法にわたり、cas:最小CRISPRアレイプラスミドの最高の比で最高レベルの編集が達成された。追加的に、多シストロン性プラスミドは、可能性としてプラスミド1μgあたりの転写の増加により、より高い編集レベルを可能にした。
カスケードサブユニットタンパク質の円順列置換
本実施例は、構造ガイドモデル化アプローチを使用する円順列置換(cp)大腸菌I−E型Cas7タンパク質のin silico設計、クローニング、発現、および精製を例証するものである。
A. in silico設計
大腸菌カスケード結晶構造5H9E.pdbに基づく構造ガイドアプローチを用いて大腸菌I−E型Cas7タンパク質(配列番号18)を円順列置換した(www.rcsb.org/pdb/;Hayes、R.Pら、Nature 530(7591):499〜503(2016年))。ナイーブなCas7 N末端とC末端とを、配列グリシン−セリン(G−S)を有する2アミノ酸ペプチドリンカーで結びつけた。この環状Cas7のポリペプチド配列を、野生型Cas7ポリペプチド配列における残基301と残基302との間のペプチド結合に対応する位置で開いて、新しいN末端(残基302)および新しいC末端(残基301)を形成させ、結果としてCas7タンパク質の円順列置換バージョン(cp−Cas7 V1タンパク質)をもたらした。Cas7タンパク質の折り畳みまたはカスケード複合体の組み立てを妨害せずに融合タンパク質またはリンカー領域との結びつきのための位置になるように新しいN末端および新しいC末端を設計した。cp−Cas7 V1タンパク質(配列番号578)の新しいN末端(すなわち、野生型Cas7タンパク質の残基302に対応するアミノ酸残基)にメチオニン残基を付加した。
G−Sリンカーを使用して第2のcp−Cas7タンパク質、cp−Cas7 V2タンパク質を同様に操作した。cp−Cas7 V2タンパク質のN末端およびC末端は、野生型Cas7配列における残基338および339にそれぞれ対応する。Cas7タンパク質の折り畳みまたはカスケード複合体の組み立てを妨害せずに融合タンパク質またはリンカー領域との結びつきのための位置になるように新しいN末端および新しいC末端を設計した。cp−Cas7 V2タンパク質(配列番号579)のN末端(すなわち、野生型Cas7タンパク質の残基339に対応するアミノ酸残基)にメチオニン残基を付加した。
B. cp−Cas7を含むカスケード複合体のクローニング、発現、および精製
cp−Cas7 V1タンパク質およびcp−Cas7 V2タンパク質のin silico設計ポリペプチド配列のDNAコーディング配列を大腸菌における発現のためにコドン最適化した。
これらのDNAコーディング配列を合成のために商業製造業者(GenScript、Piscataway、NJ)に提供した。DNA配列をカスケード−オペロン発現ベクター(表19;配列番号441)に個別に導入して、実施例2に記載される発現ベクター中の野生型Cas7タンパク質を置換した。
各発現ベクターを大腸菌BL21Star(商標)(Thermo Fisher Scientific、Waltham、MA)細胞中にトランスフェクトしたが、第2のベクターは、実施例2に記載されるように表20に示されるJ3標的についてのガイドRNA(配列番号444)をコードしていた。実施例4Bに記載されるように細胞を培養した。Cas5、Cas6、cp−Cas7 V1、Cse2、およびCas8タンパク質のみならず、ガイドRNA/標的J3;ならびにCas5、Cas6、cp−Cas7 V2、Cse2、およびCas8タンパク質のみならずガイドRNA/標的J3を含む大腸菌I−E型カスケード複合体を実施例5Aに記載されるように精製した。
cp−Cas7バリアントを含むカスケード複合体の精製は、円順列置換I−E型CRISPR−Casサブユニットタンパク質をうまく使用して、野生型タンパク質を含むカスケード複合体と本質的に同じ組成(分子量ベース)を有するカスケード複合体を形成させることができることを実証している。
C. カスケード/cp−Cas7およびJ3標的のEMSA(電気泳動移動度シフトアッセイ)
精製カスケード/cp−Cas7複合体を本実施例に記載されるように精製し、EMSAに供して、それらのそれぞれの標的配列への特異的結合を実証した。簡潔には、カスケード/cp−Cas7およびカスケード/wt−Cas7を精製し、10mg/mLに濃縮した。本質的に実施例6Aに記載されるようにCy5二本鎖標的DNAを産生し、TE緩衝液中に1μMに希釈した(J3標的は配列番号469および配列番号472であり、CCR5標的は配列番号474および配列番号470である)。異なるタンパク質/標的比のカスケード複合体および標識二本鎖標的DNAを37℃で30分間インキュベートした。インキュベーションの直後、50%グリセリン2μlをサンプルに添加し、それらを5%ネイティブPAAゲルに負荷した。ゲルを0.5×TBE緩衝液中で4℃、70Vで90分間泳動し、AZURE c600 Bioimager(Azure BioSystems、Dublin、CA)でイメージングし、バンドを定量した。データを表37に示す。
カスケードサブユニット融合タンパク質
A. FokIとのカスケードサブユニットの融合
本実施例は、カスケード複合体にヌクレアーゼ活性を付与するためにFokIヌクレアーゼドメインに融合された大腸菌I−E型Cas8タンパク質のin silico設計、クローニング、発現、および精製を例証するものである。
大腸菌I−E型Cas8のN末端にフラボバクテリウム・オケアノコイテス(Flavobacterium okeanokoites)FokIヌクレアーゼドメイン(GenBank番号AAA24927.1)を融合させた。FokIヌクレアーゼドメインは、Guoら(Guo、J.ら、J.Mol.Biol.400:96〜107(2010年))によって記載されるSharkeyバリアントに含まれる残基を含み、ホモダイマー化されると二本鎖DNA切断を触媒する。FokIヌクレアーゼについてのアミノ酸配列(配列番号580)は、残基Q384〜F579(GenBank番号AAA24927.1)を含み、以下の点突然変異を有した:E486Q、L499I、およびD469N。簡潔には、FokIのSharkeyヌクレアーゼドメイン(配列番号581)のN末端を、リンカー配列(配列番号582)を用いてCas8に融合させた。精製目的で、ヘキサヒスチジンタグ(His6、配列番号583)に続くMBPタグ(配列番号584)に続くTEVプロテアーゼ切断配列(配列番号585)、核局在化シグナル(NLS、配列番号586)、およびGGSリンカーをN末端でFokIの残基384に付加した。最終構築物は、タンパク質配列中にNH3−His6−MBP−TEV−NLS−GGS−FokISharkey−30aa−リンカー−Cas8−COOH(配列番号413)を含んでいた。
in silico設計されたDNA配列を合成のために商業製造業者(GenScript、Piscataway、NJ)に提供した。実施例2に記載されるkanR遺伝子の存在によりカナマイシン耐性を付与するpET発現(MilliporeSigma、Hayward、CA)ファミリーベクター骨格にDNA配列をクローニングし、結果としてNH3−His6−MBP−TEV−NLS−GGS−FokISharkey−30aa−リンカー−Cas8−COOH(配列番号439)を有するベクターをもたらした。
実施例4Bおよび実施例5Cに記載されるように大腸菌I−E型カスケードH3−His6−MBP−TEV−NLS−GGS−FokISharkey−30aa−リンカー−Cas8−COOH(配列番号439)を発現させ、精製した。TEV切断後のタンパク質配列は、NH3−NLS−GGS−FokISharkey−30aa−リンカー−Cas8−COOH(配列番号587)を含む。
同様に、実施例1および2に記載されるNLS−FokI−リンカー−Cas8_His6−HRV3C−Cse2_Cas7_Cas5_Cas6(配列番号442)を有するベクター中にFok1−Cas8融合タンパク質を構築した。実施例2に記載されるようにJ3標的についてのガイドRNA(配列番号444)をコードする第2のベクターを用いて各発現ベクターを大腸菌BL21 Star(商標)(Thermo Fisher Scientific、Waltham、MA)細胞にトランスフェクトした。実施例4Bおよび実施例5Aに記載されるようにこの構築物を発現させ、精製した。融合FokI−Cas8バリアントを含むカスケード複合体の精製は、ヌクレアーゼと融合したI−E型CRISPR−Casサブユニットタンパク質を使用して、野生型タンパク質を含むカスケード複合体と本質的に同じ組成(分子量ベースで)を有するカスケード複合体をうまく形成することができることを実証している。標的核酸の生化学的切断(実施例7)および真核細胞におけるゲノム配列の細胞内切断のためにFokI−Cas8融合物がうまく使用された(実施例8Dおよび実施例9D)。
表38は、Casサブユニットタンパク質−酵素融合物のさらなる例を挙げるものである。表38では、APOBECは、シチジンデアミナーゼ経路のメンバーである遺伝子に対応し(ヒトAPOBEC I Genbank番号AB009426、ヒトAPOBEC 3F Genbank番号CH471095、ヒトAPOBEC 3G Genbank番号CR456472、ラットAPOBEC UCSCゲノムブラウザーID RGD:2133rat);AIDは、活性化誘導シチジンデアミナーゼに対応し(Genbank番号AY536516);PmCDA1はAIDオーソログであり(例えば、Nishidaら、Science 16:353(2016年);Iwamatsuら、J.Biochem.110:151〜158(1991年)参照);PvuIIHIFIT46GはPvuII高忠実度バリアントT46Gであり(例えば、Fonfaraら、Nucleic Acids Res.40:847〜860(2012年)参照);PvuII単鎖T46GはpdbID 3KSKに記載されている);I−TevIは、バクテリオファージT4からの部位特異的配列寛容性ホーミングエンドヌクレアーゼであり、N末端触媒ドメインおよびC末端DNA結合ドメインを含み(これらのドメインは長い可動性リンカーにより結びつけいている)(例えば、Van Roeyら、EMBO J.20:3631〜3637(2001年)参照);BcnI(例えば、Sokolowskaら、J.Mol.Biol.369:722〜734(2007年)参照);およびMvaI(例えば、Kaus−Drobekら、Nucleic Acids Res.35:2035〜2046(2007年))は制限酵素である。
B. 別のカスケードサブユニットタンパク質とのカスケードサブユニットタンパク質の融合物
大腸菌カスケード結晶構造5H9E.pdbに基づく構造ガイドアプローチを用いてカスケード複合体の2つのCse2タンパク質を一緒に融合させた(www.rcsb.org/pdb/;例えば、Hayes、R.Pら、Nature 530(7591):499〜503(2016年)参照)。簡潔には、10−aa可動性リンカー(配列番号589)を使用して、1つのCse2のC末端および第2のCse2のN末端を一緒に融合させた。Cse2−Cse2(CasB_CasB)融合タンパク質の全配列を配列番号588に示す。
in silico設計されたDNA配列を合成のために商業製造業者(GenScript、Piscataway、NJ)に提供した。DNA配列を実施例2で設計された発現ベクターにクローニングした(配列番号441)。Cse2配列を配列番号588と交換した。
各発現ベクターを、実施例2に記載されるようにJ3標的についてのガイドRNA(配列番号444)をコードする第2のベクターと共に大腸菌BL21 Star(商標)(Thermo Fisher Scientific、Waltham、MA)にトランスフェクトした。実施例4Bおよび5Bに記載されるようにCas5、Cas6、Cas7、Cse2−Cse2、およびCas8を含む大腸菌I−E型カスケード複合体を発現させ、精製した。融合したCse2−Cse2バリアントを含むカスケード複合体の精製は、融合したI−E型CRISPR−Casサブユニットタンパク質が、野生型タンパク質を含むカスケード複合体と本質的に同じ組成(分子量ベースで)を有するカスケード複合体をうまく形成したことを実証している。
C. カスケード/Cse2−Cse2およびJ3標的の電気泳動移動度シフトアッセイ(EMSA)
精製カスケード/Cse2−Cse2複合体を本実施例に記載されるように精製し、EMSAに供して、それらのそれぞれの標的配列への特異的結合を実証した。簡潔には、カスケード/Cse2−Cse2およびカスケード/WT−Cse2を精製し、10mg/mLに濃縮した。実施例6Aに記載されるようにCy5二本鎖標的DNAを産生し、TE緩衝液中に1Mになるよう希釈した(J3標的は配列番号469および配列番号472であり、CCR5標的は配列番号474および配列番号470である)。カスケード複合体および標識二本鎖標的DNAを種々のタンパク質/標的比にて37℃で30分間インキュベートした。インキュベーションの直後、50%グリセリン2μlをサンプルに添加し、それらを5%ネイティブPAAゲルに負荷した。0.5×TBE緩衝液中のゲルを4℃、70Vで90分間泳動させ、AZURE c600 Bioimager(Azure BioSystems、Dublin、CA)でイメージングし、バンドを定量した。データを表39に示す。
D. 別のカスケードサブユニットタンパク質および酵素タンパク質ドメインとのカスケードサブユニットタンパク質の融合
シチジンデアミナーゼrAPOBEC1(アポリポタンパク質B mRNA編集酵素触媒サブユニット1、ドブネズミ(Rattus norvegicus);NCBI遺伝子ID:25383、uEnsembl:ENSRNOG00000015411)を融合のために選択した。大腸菌カスケード結晶構造5H9E.pdbに基づく構造ガイドアプローチを使用してCse2−Cse2タンパク質をrAPOBEC1と融合させた(www.rcsb.org/pdb/;例えば、Hayes、R.Pら、Nature 530(7591):499〜503(2016年)参照)。簡潔には、9−aa可動性リンカー(配列番号591)を使用して、rAPOBEC1(配列番号590)のC末端をCse2−Cse2ダイマー(上記)のN末端と融合させた。rAPOBECI_Cse2−Cse2融合タンパク質の全配列を配列番号592に示す。
in silico設計されたDNA配列を合成のために商業製造業者(GenScript、Piscataway、NJ)に提供した。DNA配列を発現ベクター(配列番号441)にクローニングし、Cse2配列を置換した。実施例2に記載されるように、各発現ベクターを、J3標的についてのガイドRNAをコードする第2のベクター(配列番号444)と共に大腸菌BL21 Star(商標)(Thermo Fisher Scientific、Waltham、MA)細胞にトランスフェクトした。実施例4Bおよび5Bに記載されるようにCas5、Cas6、Cas7、rAPOBEC1_Cse2−Cse2、およびCas8を含む大腸菌I−E型カスケード複合体を発現させ、精製した。融合rAPOBEC1_Cse2−Cse2バリアントを含むカスケード複合体の精製は、野生型タンパク質を含むカスケード複合体と本質的に同じ組成(分子量ベースで)を有するカスケード複合体を形成するために、I−E型CRISPR−Casサブユニットタンパク質とのシチジンデアミナーゼ融合物がうまく使用されたことを実証している。表40は、Cse2−Cse2との酵素融合物の例を示す。
転写活性化/抑制ドメインとのカスケードサブユニットタンパク質の融合物
本実施例は、VP64活性化ドメインと融合した大腸菌I−E型cp−Cas7タンパク質の設計がカスケード複合体に転写活性化活性を付与することを例証する。
VP64は、VP16(単純ヘルペスウイルスタンパク質16、DALDDFDLDML(配列番号614);アミノ酸437〜447、UNIPROT:UL48)の4つのタンデム型コピーがグリシン−セリン(GS)リンカーに結びついたものを含む転写活性化因子である。遺伝子のプロモーター近くに結合することができるタンパク質ドメインと融合した場合、VP64(配列番号615)は強い転写活性化因子として作用する。大腸菌I−E型cp−Cas7 V2(配列番号616)を操作のために選択することができる。
活性化ドメインVP64を、cpCas7 V2のN末端に融合させることができる(実施例10Aに記載)。リンカー(例えば、5〜50アミノ酸長)を選択して、cpCas7 V2およびVP64ドメインを作動可能に連結することができる。
in silico設計されたDNA配列を合成のために商業製造業者に提供することができる。VP64−cpCas7 V2融合タンパク質をコードするDNA配列を発現ベクターにクローニングすることができる(例えば、VP64−cpCas7 V2を使用してCas7を置換することができる配列番号455)。実施例2に記載されるようにJ3標的についてのガイドRNA(配列番号444)をコードする第2のベクターと共に、各発現ベクターを大腸菌BL21 Star(商標)(Thermo Fisher Scientific、Waltham、MA)細胞にトランスフェクトすることができる。実施例4および5に記載されるようにCas5、Cas6、VP64_cpCas7 V2、Cse2、およびCas8を含む大腸菌I−E型カスケード複合体を発現させ、精製することができる。野生型タンパク質を含むカスケード複合体と本質的に同じ組成(分子量ベースで)を有するカスケード複合体を形成させるために融合VP64_cpCas7 V2バリアントを含むカスケード複合体の精製を用いることができる。
特定の遺伝子のプロモーター領域に標的化されたガイドの選択を用いて、融合VP64_cpCas7 V2を含むカスケード複合体が遺伝子の転写活性化を促進する能力を検証することができる。
dCas9/ガイド複合体によるカスケードサブユニットに融合した機能的ドメインの部位特異的動員
本実施例は、機能的ドメインと融合した1つまたはそれ以上のカスケードサブユニットタンパク質(すなわち、Cas6、Cas5など)のII型CRISPR Casタンパク質/ガイドRNA複合体結合部位への動員のためのクラス1 I型CRISPRリピートステム配列(例えば、I−F型CRISPRリピートステム配列)を有するクラス2 II型CRISPR sgRNA、crRNA、tracrRNA、またはcrRNAおよびtracrRNA配列を操作する方法を記載する。本明細書におけるこの方法は、Gilbert、L.ら、Cell 154(2):442〜451(2013年)およびFerry、Qら、Nature Communication 8:14633 doi:10.1038/ncomms14633(2017年)を変更したものである。
A. II型ガイドRNAの操作
II型CRISPR sgRNA、crRNA、tracrRNA、またはcrRNAおよびtracrRNA(まとめて「II型ガイドRNA」と称される)を操作のために選択することができる。
II型ガイドRNA配列をI型CRISPRリピートステム配列の組み入れ領域についてin silicoで評価することができる。I型CRISPRリピートステム配列をII型ガイドRNAの5’もしくは3’末端、またはII型ガイドRNAの内部に結合させることができる、またはII型ガイドRNAの二次構造(例えば、3’ヘアピンエレメント)を置換することができる。I型CRISPRリピートステム配列の組み入れは、リンカーエレメントのヌクレオチド配列を伴うことができる。I型CRISPRリピートステム配列を含むように3’操作されたII型tracrRNAの例を表41に示す。
C−X−Cケモカイン受容体4型(CXCR4)などの哺乳動物遺伝子を標的化のために選択することができる。II型CRISPR Casタンパク質PAM配列(例えば、5’−NGG)に隣接して存在するII型CRISPR Casタンパク質標的配列について5’UTRとエクソン1との間の接合部を、in silicoでスキャンすることができる。5’方向の上流に存在する20ヌクレオチドの標的配列をII型crRNA中に組み入れることができる。CXCR4を標的化するII型crRNAの一例を表42に示す。
あるいは、CXCR4標的化スペーサー(RNA)(配列番号619)の3’末端を、3’I型CRISPRリピートステム配列(RNA)を有するII型tracrRNA(配列番号617)の5’末端とリンカーで共有結合的に連結することができる。適切なリンカーエレメントは5’−GAAA−3’である。
組み入れられたI型CRISPRリピートステム配列を有するin silico設計されたII型ガイドRNAを、合成のために商業製造業者に提供することができる。
I型カスケードサブユニットタンパク質(例えば、Cas6)を転写活性化または抑制ドメイン(例えば、KRAB)に作動可能に連結し、実施例12に記載されるように核局在化シグナル(NLS)をC末端にタグ付けすることができる。
II型Casタンパク質(例えば、Cas9)が触媒的に不活性(例えばdCas9)であり、NLS配列によりタグ付けされるように、II型Casタンパク質を突然変異誘発することができる。
Cas6−KRAB−NLSタンパク質およびdCas9−NLSタンパク質を組み換え発現させ、大腸菌から精製することができる。
RNP複合体は、60pmolのdCas9タンパク質:60pmolのCas6−KRAB−NLS:120pmolのCXCR4標的化crRNA:I型CRISPRリピートステム配列を含むように3’操作された120pmolのtracrRNAの濃度で形成することができる。dCas9およびCas6−KRAB−NLSとの組み立ての前に、120pmolのCXCR4標的化crRNAおよびI型CRISPRリピートステム配列を含むように3’操作された120pmolのtracrRNA(本明細書において「操作されたII型ガイドRNA」と称される)のそれぞれを、終体積2μL中に所望の合計濃度(120pmol)に希釈し、95℃で2分間インキュベートし、サーモサイクラーから取り出し、平衡化して室温にすることができる。dCas9およびCas6−KRAB−NLSタンパク質を結合緩衝液(20mM HEPES、100mM KCl、5mM MgCl2、および5%グリセリン、pH7.4)中に適切な濃度に希釈して終体積3μLにし、II型ガイドRNA2μLと混合し、続いて37℃で30分間インキュベートすることができる。トランスフェクトされていない対照(例えば、緩衝液のみ)、操作されていないII型ガイドRNA、または抑制ドメインと連結していないCas6を使用して、陰性対照RNPを組み立てることができる。
B. dCas9:Cas6−KRAB−NLS:操作されたII型ガイドRNAを使用する細胞トランスフェクション
Nucleofector(登録商標)96−well Shuttleシステム(Lonza、Allendale、NJ)および以下のプロトコールを使用して、dCas9:Cas6−KRAB−NLS:操作されたII型ガイドRNA核タンパク質複合体をHEK293細胞(ATCC、Manassas VA)にトランスフェクトすることができる:複合体を96ウェルプレートの個別のウェルに終体積5μLで分注することができる。細胞培養培地をHEK293細胞培養プレートから取り出し、細胞をTrypLE(商標)(Thermo Scientific、Wilmington、DE)で剥離することができる。200×gで3分間遠心分離することによって懸濁HEK293細胞をペレットにし、TrypLE試薬を吸引し、細胞をカルシウムおよびマグネシウムを含まないリン酸緩衝食塩水(PBS)で洗浄することができる。200×gで3分間遠心分離することによって細胞をペレットにし、PBSを吸引し、カルシウムおよびマグネシウムを含まないPBS 10mL中に細胞ペレットを再懸濁することができる。
Countess(登録商標)II自動細胞計数機(Life Technologies; Grand Island、NY)を使用して細胞を計数することができる。2.2×107個の細胞を1.5mlマイクロチューブに移し、ペレットにすることができる。PBSを吸引し、細胞をNucleofector(商標)SF(Lonza、Allendale、NJ)溶液中に密度1×107個/mLに再懸濁することができる。次いで、細胞懸濁液20μLを、RNP複合体5μLを含む各個別のウェルに添加することができ、各ウェルからの全体積を96ウェルNucleocuvette(商標)(Lonza、Allendale、NJ)プレートのウェルに移すことができる。プレートをNucleofector(商標) 96−well Shuttle(商標)(Lonza、Allendale、NJ)に負荷することができ、96−CM−130 Nucleofector(商標)(Lonza、Allendale、NJ)プログラムを使用して細胞をヌクレオフェクションすることができる。ヌクレオフェクション後、10%ウシ胎仔血清(FBS;Thermo Scientific、Wilmington、DE)、ペニシリンおよびストレプトマイシン(Life Technologies、Grand Island、NY)を補充したダルベッコ変法イーグル培地(DMEM;Thermo Scientific、Wilmington、DE)70μLを各ウェルに添加することができ、細胞懸濁液50μLを、予温したDMEM完全培養培地150μLを含む96ウェル細胞培養プレートに移すことができる。プレートを組織培養インキュベーターに移し、5%CO2中、37℃で48時間維持することができる。
dCas9:Cas6−KRAB−NLS:操作されたII型ガイドRNA核タンパク質複合体のヌクレオフェクションの72時間後、CXCR4発現の抑制について細胞を評価することができる。培養培地をHEK293から吸引することができ、カルシウムおよびマグネシウムを含まないPBSで細胞を1回洗浄することができ、次いでTrypLE(Life Technologies、Grand Island、NY)の添加によりトリプシン処理し、続いて37℃で3〜5分間インキュベートする。トリプシン処理された細胞を優しくピペッティングして、単一細胞懸濁液を形成することができ、次いで200×gで3分間遠心分離することによって細胞をペレットにすることができる。遠心分離後、培養培地を吸引することができ、細胞を10mM EDTA/PBS緩衝液中に再懸濁し、単一細胞懸濁液中に優しく混合する。10%FBSを含有するPBS中に0.05%の抗ヒトCXCR4抗体コンジュゲートFITC(Medical & Biological Laboratories Co.、Nagoya、Japan)を使用して、単一細胞懸濁液を室温で1時間染色することができる。アイソタイプ対照およびネイティブなRNP対照を参照のために同様に染色することができる。次いで染色された細胞をLSR IIフローサイトメーター(BD laboratories、San Jose、CA)で選別し、FITC陽性蛍光細胞の集団を集計することができる。
CXCR4発現における低減を、トランスフェクトされていない対照の測定蛍光と比べたdCas9:Cas6−KRAB−NLS:操作されたII型ガイドRNAをヌクレオフェクションされたサンプルの検出蛍光における減少により測定する。I型CRISPRリピートステム配列を有する操作されたII型ガイドRNAをヌクレアーゼ欠損II型Cas9タンパク質と組み合わせて使用して、抑制ドメインと融合したI型CRISPRカスケードサブユニットタンパク質を遺伝子標的に動員および局在化させ、前記遺伝子標的の転写を抑制することができることを実証するために、フローサイトメーターからの蛍光の減少を使用することができる。
I型cas遺伝子の同定およびスクリーニング
本実施例は、異なる種からのI型cas遺伝子を同定およびスクリーニングするための方法を記載する。本明細書に示す方法は、Shmakov、S.ら、Mol.Cell 60:385〜397(2015年)を変更したものである。
A. I型CRISPR−Cas遺伝子の同定
Basic Local Alignment Search Tool(BLAST、blast.ncbi.nlm.nih.gov/Blast.cgi)を使用して、様々な種のゲノムの検索を実行し、I型CRISPR−Cas複合体の様々な遺伝子構成要素をコードする1つまたはそれ以上の遺伝子を同定することができる。cas1インテグラーゼ遺伝子は、クラス1およびクラス2 CRISPR−Casファミリーの両方の構成要素であり、cas1遺伝子を含む種を同定した場合、これらのゲノムにおける部分配列サーチャーを実行して、I型特異的遺伝子を含むゲノムを単離することができる。ゲノム検索は、CRISPR−Casインテグラーゼ遺伝子cas1上にアンカーすることができ、使用することができる大腸菌K−12 MG1655由来のI−E型系からの例示的なcas1配列は配列番号621である。特定の遺伝子(例えば、cas7およびcas5)がI型系の干渉複合体の中核構成要素であり、それらを使用して、I型系を含む種をさらに識別することができる。使用することができる大腸菌K−12 MG1655 cas7およびcas5遺伝子の例示的な配列は、それぞれ配列番号622および配列番号623である。I型特異的ヌクレアーゼ−ヘリカーゼcas3遺伝子またはその相同体の同定により、cas7およびcas5遺伝子を有する同定されたゲノムをさらにパースすることができる。使用することができる大腸菌K−12 MG1655 cas3配列の例示的な配列は、配列番号624である。
CRISPR−Casインテグラーゼ遺伝子cas1、I型干渉複合体遺伝子cas7およびcas5、ならびにヌクレアーゼ−ヘリカーゼcas3遺伝子、またはそれらの何かの組み合せを含むゲノムは、I型CRISPR−Cas系の候補の可能性がある。I型CRISPR−Cas遺伝子は、一般的に、典型的には20キロ塩基(kb)内の単一ゲノム座位における1つの近位に見出される。I型干渉複合体を構成する残りのcas遺伝子の他のオープンリーディングフレーム(ORF)についてcas1、cas7、cas5、またはcas3遺伝子周辺の区域を検索することができる。推定されるORFのアミノ酸配列を公知のI型遺伝子と相同性について比較することができ、またはI型タンパク質構成要素の特徴的なタンパク質ドメインの存在を、Max Planck Institute Bioinformatics Toolkit(www.toolkit.tuebingen.mpg.de/#/)から入手可能な相同性検出および構造予測検索ツール、もしくは同等物を使用して分析することができる。
B. 同定されたI型構成要素のスクリーニング
I型構成要素(例えば、cas遺伝子および対応するcrRNA)の推定上のコレクションを同定した後、I型構成要素がプログラム可能なDNA標的化を実行する能力についてそれらの構成要素を試験することができる。
実施例1、2、および3のガイダンスに従って推定上のcas遺伝子およびcrRNAを発現ベクター中にコードさせることができる。様々なcas遺伝子およびcrRNAをコードするベクターを細菌株に導入し、実施例4および5に記載されるようにI型干渉複合体を発現および精製することができる。サイズ排除クロマトグラフィー(SEC)カラムからの溶出画分をSDS−PAGEゲルにより分析して、完全なI型干渉複合体を構成するタンパク質構成要素の同一性を重量ベースで決定することができる。臭化エチジウムゲルも泳動して、干渉複合体の部分としてのcrRNAの存在を検出することができる。
精製されたカスケード複合体が実施例6および7に記載されるようなDNA標的のin vitro生化学切断を支援する能力についてそれらの複合体を試験することができる。
単一の推定上のcas遺伝子が発現されない対照発現および精製サンプルを使用して、プログラム可能なDNA標的ができる完全なI型干渉複合体を構成する必要なcas遺伝子を決定することができる。
ある特定の適用のために、ゲノム配列からの個別のcas遺伝子相同体(例えば、cas7)の同定で十分であり、追加的なcas遺伝子を同定する必要も、スクリーニングする必要もない。
I型crRNAの同定
本実施例は、種々の種におけるI型crRNAを同定する方法を記載する。本明細書に示される方法は、Chylinski、K.ら、RNA Biology 10:726〜737(2013年)を変更したものである。
様々な種のゲノムの検索を実行して、実施例17Aに記載されるI型CRISPR−Cas遺伝子を同定することができる。1つまたはそれ以上のI型特異的cas遺伝子を含むゲノムは、CRISPRリピート−スペーサーアレイ内にコードされるCRISPR RNA(crRNA)を含む可能性がある候補ゲノムである。同定されたI型cas遺伝子(例えば、cas7、cas5、またはcas3遺伝子)に隣接する配列を、関連するCRISPRリピート−スペーサーアレイについて探索することができる。in silico予測スクリーニングのための方法を使用して、Grissa、I.V.ら、Nucleic Acids Res.35(Webサーバー発行):W52〜W57(2007年)に従ってリピートアレイからcrRNA配列を抽出することができる。crRNA配列は、CRISPRリピートアレイ内に含まれ、外来スペーサー配列によって間があいたその特徴的なリピート配列によって同定することができる。
A. RNA−seqライブラリーの製造
RNAシークエンシング(RNA−seq)を用いて、in silicoで同定された個別のcrRNAを含む推定上のCRISPRアレイをさらに検証することができる。
推定上のI型cas遺伝子およびcrRNA構成要素を含むと同定された種からの細胞を商業的リポジトリ(例えば、ATCC、Manassas、VA;German Collection of Microorganisms and Cell Cultures GmbH(DSMZ)、Braunschweig、Germany)から入手することができる。
細胞を対数増殖中期に生育させ、Trizol試薬(SigmaAldrich、St. Louis、MO)を使用して総RNAを製造し、それをDNアーゼI(Fermentas、Vilnius、Lithuania)で処理することができる。
総RNA 10μgをRibo−Zero rRNA Removal Kit(Illumina、San Diego、CA)で処理することができ、残りのRNAは、RNA Clean and Concentrators(Zymo Research、Irvine、CA)を使用して精製することができる。
TRUSEQ(商標)Small RNA Library Preparation Kit(Illumina、San Diego、CA)を製造業者の説明書に従って使用して、ライブラリーを製造することができる。これにより、アダプター配列を有するcDNAがもたらされるであろう。
結果としてもたらされたcDNAライブラリーを、MiSeqシークエンサー(Illumina、San Diego、CA)を使用してシークエンシングすることができる。
B. シークエンシングデータの処理
cDNAライブラリーのシークエンシングリードは、例えば以下の方法を用いて処理することができる。
アダプター配列は、cutadapt 1.1(pypi.python.org/ pypi/cutadapt/1.1)を用いて除去することができ、リードの3’末端から約15ヌクレオチドをトリミングしてリードの質を改善することができる。
Bowtie 2(www.bowtie−bio.sourceforge.net/bowtie2/index.shtml)を使用して、リードをそれぞれの種(すなわち、同定すべき推定上のcrRNAが由来する種)のゲノムと整列させることができる。その後のシークエンシング解析ステップのために、Bowtie 2によって生成されるSequence Alignment/Map(SAM)ファイルを、SAMTools(www.samtools.sourceforge.net/)を使用してBinary Alignment/Map(BAM)ファイルに変換することができる。
1つまたはそれ以上のCRISPR座位にマップするリード被覆率は、BAMファイルからBedTools(bedtools.readthedocs.org/ en/latest/)を使用して計算することができる。
以前のステップで生成されるBEDファイルをIntegrative Genomics Viewer(IGV;www.broadinstitute.org/igv/)にロードして、シークエンシングリードのパイルアップを可視化することができる。リードパイルを使用して、転写された推定上のcrRNA配列の5’末端および3’末端を同定することができる。RNA−seqデータを使用して、推定上のcrRNAエレメントがin vivoで活発に転写されることを検証することができる。
実施例17Aのガイダンスに従って、コグネイトI型cas遺伝子を用いて、プログラム可能なDNA標的化を実行する能力について推定上のcrRNAを試験することができる。
カスケードガイドRNA骨格における変化に対して寛容な部位についての探索
本実施例は、I型ガイドcrRNAへの様々な変化の生成および試験ならびにカスケードポリヌクレオチド複合体の構築に使用するためのそれらの適合性を記載する。下記の方法は、Briner、A.ら、Mol.Cell 56:333〜339(2014年)を変更したものである。
crRNA骨格に変化を導入し、結果としてもたらされた操作されたcrRNAを、コグネイトカスケード複合体を用いて試験して、I型ガイドcrRNA骨格における操作に適した領域または位置の同定を容易にすることができる。
I型CRISPR系(例えば、大腸菌カスケード)からのcrRNAを操作のために選択することができる。crRNA配列をin silicoで操作して、以下の領域の1つまたはそれ以上から選択される領域中の核酸配列に1つまたはそれ以上の塩基変化(例えば、置換、変化、突然変異、欠失、および/または挿入)を導入することができる:スペーサーの5’(5’ハンドル)、スペーサーエレメント、I型CRISPRリピートステム配列、またはI型CRISPRリピートステム配列の3’(3’ハンドル)の核酸配列。
また、塩基変化を使用して、crRNA領域のいずれかの水素塩基対相互作用にミスマッチを導入するか、または2つの塩基の置換により代替的な水素塩基対相互作用を導入する塩基対突然変異を導入することができ、その際、代替的な水素塩基対相互作用は、本来の水素塩基対相互作用と異なる(例えば、本来の水素塩基対相互作用はワトソン−クリック塩基対形成であり、2つの塩基の置換は逆フーグスティーン塩基対を形成する)。また、塩基の置換を用いて、crRNA骨格内に水素塩基対相互作用を導入することができる。
crRNAの領域を独立して操作して、crRNA骨格内に二次構造エレメントを導入することができる。そのような二次構造エレメントには、以下が含まれるが、それに限定されるわけではない:ステム−ループエレメント、ステムエレメント、シュードノット、およびリボザイム。さらに、crRNA骨格を操作して、5’末端、3’末端、またはcrRNA内部のいずれかでの欠失により、crRNA骨格の部分を欠失させることができる。代替的な骨格構造もまた導入することができる。
in silico設計されたcrRNA配列を合成のために商業製造業者に提供することができる。
操作されたcrRNAが個別のカスケードサブユニットタンパク質(すなわち、Cas6、Cas5など)による結合を支援する、またはカスケードタンパク質複合体の完全形成を支援する、またはヌクレアーゼ(例えば、Cas3)の動員によりカスケード複合体の形成および二本鎖DNA標的配列の改変を支援する能力について、それらの操作されたcrRNAを評価することができる。個別のカスケードサブユニットタンパク質へのcrRNAの結合およびカスケードタンパク質複合体の組み立ては、Jore、M.ら、Nature Structural & Molecular Biology 18:529〜536(2011年)に類似の方法でナノ−ESI質量分析により評価することができる。ヌクレアーゼの動員による二本鎖DNA標的配列のcrRNAおよびカスケードタンパク質複合体による改変の生化学的特徴づけを、実施例6および7に記載される方法と類似の方法で実行することができる。ヌクレアーゼの動員によりカスケード複合体の形成および二本鎖DNA標的配列の改変を支援することができる操作されたcrRNAを、実施例8A、実施例8B、実施例8C、および実施例8Dに記載される方法を用いて細胞における活性について検証することができる。
DNA標的結合配列を含むカスケード複合体ガイドのスクリーニング
本実施例は、ヒトgDNA(gDNA)に存在するDNA標的配列を改変するため、およびそれらの部位での切断活性のレベルを測定するための本発明のI型CRISPRタンパク質およびI型ガイドcrRNAの使用を例証するものである。
標的部位(DNA標的配列)を、最初にgDNAから選択することができる。I型ガイドcrRNAを設計して、選択された配列を標的化することができる。アッセイ(例えば、実施例7に記載)を行って、DNA標的配列の切断レベルを決定することができる。
A. gDNAからのDNA標的配列の選択
カスケードタンパク質複合体(例えば、大腸菌I−E型カスケード)についてのPAM配列(例えば、ATG)を、選択されたゲノム領域内に同定することができる。
3’がATG PAM配列に隣接する1つまたはそれ以上のカスケードDNA標的配列(例えば、32ヌクレオチド長)を同定することができる。
核酸標的配列の選択基準は、以下を含むことができるが、それに限定されるわけではない:ゲノム中の他の領域との相同性;G−C含量のパーセント;融解温度;スペーサー内のホモポリマーの存在;2つの配列の間の距離;および当業者に公知の他の基準。
カスケードDNA標的配列とハイブリダイズするDNA標的結合配列をガイドcrRNA中に組み入れることができる。ガイドcrRNA構築物の核酸配列が、典型的には商業製造業者に提供され、商業製造業者によって合成される。
本明細書に記載されるガイドcrRNAをコグネイトI型カスケードタンパク質複合体と共に使用して、crRNA/カスケードタンパク質複合体を形成させることができる。
B. 切断パーセンテージおよび特異性の決定
ガイドcrRNAと関係するin vitro切断パーセンテージおよび特異性(すなわち、オフターゲット結合の量)は、例えば、実施例7に記載される切断アッセイを用いて決定し、以下のように比較することができる:
(1)単一のDNA標的配列だけが同定される、またはガイドcrRNAのために選択される場合、DNA標的配列のそれぞれについて切断パーセンテージおよび特異性を決定することができる。そう望む場合、ガイドcrRNAを操作すること、またはエフェクタータンパク質/エフェクタータンパク質結合配列を導入してガイドcrRNAもしくはカスケードサブユニットタンパク質を操作すること、またはリガンド/リガンド結合部分を導入してガイドcrRNAもしくはカスケードサブユニットタンパク質を操作することを含むが、それに限定されるわけではない方法を用いるさらなる実験で切断パーセンテージおよび/または特異性を変更することができる。
(2)複数のDNA標的配列が同定される、またはガイドcrRNAのために選択される場合、切断アッセイから得られる切断パーセンテージのデータおよび部位特異性のデータを、標的結合配列を含む異なるDNAの間で比較して、所望の切断パーセンテージおよび特異性を有するDNA標的配列を同定することができる。切断パーセンテージのデータおよび特異性のデータは、多様な適用のための選択の基になる判定基準を提供する。例えば、いくつかの状況では、ガイドcrRNAの活性が、最も重要な要因の場合がある。他の状況では、切断部位の特異性が、切断パーセンテージよりも比較的重要な場合がある。そう望む場合、ガイドcrRNAを操作すること、エフェクタータンパク質/エフェクタータンパク質結合配列を導入してガイドcrRNAもしくはカスケードサブユニットタンパク質を操作すること、またはリガンド/リガンド結合部分を導入してガイドcrRNAもしくはカスケードサブユニットタンパク質を操作することを含むが、それに限定されるわけではない方法を用いるさらなる実験で切断パーセンテージおよび/または特異性を変更することができる。
in vitro分析に代替的にまたは追加的に、ガイドcrRNAの細胞内切断パーセンテージおよび特異性を、例えば実施例8Cおよび実施例8Dに記載される方法を用いて得て、以下のように比較することができる:
(1)単一のDNA標的配列だけが同定される、またはガイドcrRNAのために選択される場合、DNA標的配列のそれぞれについての切断パーセンテージおよび特異性を決定することができる。そう望む場合、ガイドcrRNAを操作すること、またはエフェクタータンパク質/エフェクタータンパク質結合配列を導入してガイドcrRNAもしくはカスケードサブユニットタンパク質を操作すること、またはリガンド/リガンド結合部分を導入してガイドcrRNAもしくはカスケードサブユニットタンパク質を操作することを含むが、それに限定されるわけではない方法を用いるさらなる実験で切断パーセンテージおよび/または特異性を変更することができる。
(2)複数のDNA標的配列が同定される、またはガイドcrRNAのために選択される場合、切断アッセイから得られる切断パーセンテージのデータおよび部位特異性のデータを、標的結合配列を含む異なるDNAの間で比較して、所望の切断パーセンテージおよび特異性を有するDNA標的配列を同定することができる。切断パーセンテージのデータおよび特異性のデータは、多様な適用のための選択の基になる判断基準を提供する。例えば、いくつかの状況では、ガイドcrRNAの活性が、最も重要な要因の場合がある。他の状況では、切断部位の特異性が、切断パーセンテージよりも比較的重要な場合がある。そう望む場合、ガイドcrRNAを操作すること、エフェクタータンパク質/エフェクタータンパク質結合配列を導入してガイドcrRNAもしくはカスケードサブユニットタンパク質を操作すること、またはリガンド/リガンド結合部分を導入してガイドcrRNAもしくはカスケードサブユニットタンパク質を操作することを含むが、それに限定されるわけではない方法を用いるさらなる実験で切断パーセンテージおよび/または特異性を変更することができる。
効率的なFokI−カスケード複合体のゲノム編集のためにFokI−Cas8リンカーの組成およびスペーサー間距離を変動させること
本実施例は、FokI−Cas8および様々な長さのリンカーポリペプチドを含む複数の融合タンパク質の設計および試験のみならず、効率的なゲノム編集のためにスペーサー間距離を変動させる効果を例証する。
A. 標的細胞内にトランスフェクトすべきFokI融合タンパク質を含む大腸菌I−E型カスケード複合体構成要素をコードするベクターの産生
2つの異なる遺伝子:ADAMTSL1およびPCSK9またはその近くでヒトゲノム中の座位のセットを標的化するために最小CRISPRアレイを設計した。スペーサー間距離は、2bp刻みで14〜60bpの範囲であった。各スペーサー間距離について4つの標的を設計した。標的は、AAGまたはATGのいずれかのPAM配列に隣接していた。実施例9Aに記載されるように配列番号454を用いて「リピート−スペーサー−リピート−スペーサー−リピート」配列を含むガイドのためのコーディング配列をクローニングした。配列番号625〜配列番号816は、最小CRISPRアレイを生成するために使用されるオリゴヌクレオチド配列の全セットについての配列を提供するものである。
FokI−カスケードRNPサブユニットタンパク質構成要素をコードする遺伝子を、哺乳動物細胞における送達および発現を可能にするためのCMVプロモーター;2Aウイルスペプチド「リボソームスキップ」配列を介して連結したcas遺伝子;30−aaリンカー(配列番号455)により結びついたFokIおよびCas8を含む融合タンパク質を含むベクターにクローニングした。様々な長さおよびアミノ酸組成の追加的なリンカーポリペプチド配列を設計し、これらを使用してこれらのベクター中のCas8タンパク質にFokIを結びつけた。追加的なリンカーポリペプチド配列を表43に挙げる。
B. FokI−カスケードRNP複合体構成要素をコードするベクターのトランスフェクション
トランスフェクション条件は、本質的に実施例8Bに記載されるものに以下の改変を加えたものであった。ヌクレオフェクションの前に、プラスミドベクター溶液5μlを96ウェルプレートの個別のウェルに移した。各ウェルは、FokI−カスケードRNP複合体サブユニットタンパク質構成要素をコードするプラスミド2.4μgおよび最小CRISPRアレイをコードするプラスミド約1〜2μgを含んでいた。
C. トランスフェクトされた細胞からのgDNAのディープシークエンシング
本質的に実施例8Cに記載されるものに以下の改変を加えてディープシークエンシングを行った。実施例8Cの表36からのプライマーYおよびZの代わりに、標的特異的プライマーは配列番号825〜配列番号1016であった。
D. ディープシークエンシングデータの解析
本質的に実施例8Dに記載されるようにディープシークエンシングデータの解析を行った。図31Aおよび図31Bは、データ解析の結果を示す。図31Aおよび図31Bにおいて、ゲノム編集パーセントをFokI−Cas8リンカーの種類(図31A、図31B、縦軸14〜60AA)およびスペーサー間距離(n=1)に対して示す(図31A、図31B、横軸、スペーサー間距離5〜50bp)。図31Aにおいて、右側の灰色目盛の縦棒は、インデルのパーセンテージである。図31Bにおいて、セル内の値は、インデルのパーセントである。データの初期解析により、17および20アミノ酸のFokI−Cas8リンカー(それぞれ配列番号821および配列番号822)ならびに約26bpおよび約30〜32bpのスペーサー間距離でゲノム編集が最高であったことが示された。データを再処理し、1000未満の配列リードを有するサンプルは、低い被覆率が原因で誇張された編集値を含むおそれがあるので除去した(関連するサンプルのすべてが>1000のリードを含んだ部位だけを保持した)。図31Aおよび図31Bに示されるこのデータにより、17および20アミノ酸のFokI−Cas8リンカー(それぞれ配列番号821および配列番号822)ならびに約30〜32bpのスペーサー間距離でゲノム編集が最高であったことが示された。したがって、FokI−Cas8融合タンパク質のスペーサー間距離およびリンカーポリペプチド長を変動させることにより、Fok1−Cas8融合タンパク質を含むI型CRISPR−Cas複合体を使用する効率的なゲノム編集が達成された。リンカーポリペプチドのアミノ酸組成を本明細書に述べる。
ゲノム編集のためのカスケード相同体の同定
本実施例は、ゲノム編集の効率を評価するための複数の相同カスケード複合体の設計および試験を例証する。
A. 相同カスケード複合体を用いた試験のための部位の同定
追加的な相同カスケード複合体を試験するための部位のパネルを同定した。具体的には、最小CRISPRアレイを設計して、30bpのスペーサー間距離を有し、AAGまたはATGのいずれかのPAM配列が隣接したヒトゲノム中の座位のセットを標的化した。実施例9Aに記載される方法に従って配列番号454を用いて「リピート−スペーサー−リピート−スペーサー−リピート」配列を含むガイドポリヌクレオチドをクローニングした。最小CRISPRアレイを生成するために使用されるオリゴヌクレオチド配列の全セットを配列番号1017〜配列番号1130(Hsa33F、配列番号1017、およびHsa33R、配列番号1074は、1つの対を例示する)として示す。TRAC座位を標的化するガイドを含む陽性対照を含めた(配列番号454)。
哺乳動物細胞における送達および発現を可能にするためのCMVプロモーター;2Aウイルスペプチド「リボソームスキップ」配列を介して連結したcas遺伝子;30−aaリンカー(配列番号455)により結びついたFokIおよびCas8を含む融合タンパク質を含むFokI−カスケードRNPサブユニットタンパク質構成要素をコードする遺伝子をベクター中にクローニングした。
B. FokI−カスケードRNP複合体構成要素をコードするベクターのトランスフェクション
トランスフェクション条件は、本質的に実施例8Bに記載されるものに以下の改変を加えて行った。ヌクレオフェクションの前に、プラスミドベクター溶液5μlを96ウェルプレートの個別のウェルに移した。各ウェルは、FokI−カスケードRNPサブユニットタンパク質構成要素をコードするプラスミド3μgおよび最小CRISPRアレイをコードするプラスミド0.3μgを含んでいた。
C. トランスフェクトされた細胞からのgDNAのディープシークエンシング
本質的に実施例8Cに記載されるものに以下の改変を加えてディープシークエンシングを行った。実施例8Cの表36からのプライマーYおよびZの代わりに、本実施例に使用される標的特異的プライマーは、配列番号1131〜配列番号1244であった。
D. ディープシークエンシングデータの解析
ディープシークエンシングデータの解析を本質的に実施例8Dに記載されるように行った。図32は、データ解析の結果を示す。図32において、ゲノム編集パーセント(図32、縦軸、編集%)を実施例8Aからの標的Hsa07(n=3)に加えて58個の試験部位に対してプロットする(図32、横軸、「標的」;これらの最小CRISPRアレイを生成するために使用されるオリゴヌクレオチド配列を上述する)。図32に示すように、編集は、約6%〜検出限界未満の範囲であった。これらのデータから、ゲノム編集のための相同カスケード複合体を試験するためにAAG PAMを有する8つの部位のパネル(Hsa07ならびに以下の標的Hsa37、Hsa43、Hsa46、Hsa60、Hsa77、Hsa88、およびHsa126に対応する標的1、3〜5、10、13、および16)を選択した。
E. ゲノム編集のためにFokIヌクレアーゼを用いて試験するための相同カスケード複合体の同定
異なるI型系からのCas8タンパク質配列を、psi−BLASTpのためのクエリとして使用して、相同体選択のための系統樹を生成した。具体的には、フソバクテリウム・ヌクレアタム(Fusobacterium nucleatum)(WP_008798978.1)からのCas8をI−B型のために使用し、バチルス・ハロデュランス(Bacillus halodurans)(WP_010896519.1)からのCas8をI−C型のために使用し、大腸菌(WP_001050401.1)からのCas8をI−E型のために使用し、緑膿菌(Pseudomonas aeruginosa)(WP_003139224.1)からのCas8をI−F型のために使用し、シェワネラ・プトレファシエンス(Shewanella putrefaciens)(WP_011919226.1)からのCas5をI−Fv2型のために使用した。
次に、各I型系について数千個の相同体が同定されるまでpsi−BLASTpを複数回繰り返した。この情報から、interactive Tree of Lifeオンラインソフトウェア(iTOL、itol.embl.de/login.cgiからアクセス可能)を使用して系統樹を築いた。様々な枝の長さを用いてクレードを自動的に崩壊させた後に系統樹を目視検査した。
次いで、主要クレードの範囲に入る生物のリストを出力し、選択のために手作業で検査した。このステップでは、I−E型内の12個の相同体と、I−B、I−C、I−F、およびI−Fv2型について2〜3つの代表的な相同体との両方に対して系統樹の異なる領域からサンプリングされた相同体を選択することに重きを置いた。上記の系統発生解析に基づきcas8およびcas5候補をNCBIに入力し、内因性宿主細菌内のゲノム状況を、NCBIのゲノムグラフィックブラウザー内で目視検査した。(1)37℃で生育する生物中に見出された;(2)それらのcas遺伝子オペロンが無傷であり、予想されるカスケードサブユニットタンパク質をコードする遺伝子、cas3遺伝子、および無傷の獲得遺伝子(すなわち、cas1およびcas2)のすべてを有した;(3)それらのcas遺伝子オペロンが1つまたはそれ以上のCRISPRアレイに隣接した;ならびに(4)それらのCRISPRアレイが>10個のスペーサーを含んでいた場合にかぎり、カスケード相同体を選択した。いくつかの相同体について、CRISPRfinderプログラム(crispr.i2bc.paris−saclay.fr/Server/)を使用して推定上のPAM配列を同定した。上記基準に基づき、表44に示される22個の相同カスケード複合体を選択した。
F. 標的細胞へのトランスフェクションのための22個の互いに異なる種からのFokI−カスケードRNP構成要素をコードするベクターの産生
各相同体からの各cas遺伝子についての配列を、FokIヌクレアーゼおよびCas8を含む融合タンパク質を含んでいた多シストロン性構築物の部分として合成した。各I−E型カスケード複合体相同体について、適切なPAM配列を有する座位を標的化する約7〜8つのガイドのセットを生成した。I−B、I−C、I−F、およびI−Fv2型カスケード相同体毎に、適切なPAM配列を有する座位を標的化する約2〜7つのガイドのセットを生成した。各カスケード複合体相同体系は、それらのコグネイトガイド(配列番号1267〜配列番号1288)を処理するためにユニークなリピート配列を必要とした。「リピート−スペーサー−リピート−スペーサー−リピート」配列を含むガイドについてのコーディング配列を、配列番号454について実施例9Aに記載される方法を使用してクローニングした。5’末端でオリゴヌクレオチドをリン酸化し、オーバーハング配列を付加して、適切なリピート配列を有するプラスミドベクターへのクローニングを可能にした。22個のカスケード複合体相同体のための最小CRISPRアレイを生成するために使用したオリゴヌクレオチド配列の全セットを(配列番号1289〜配列番号1400)として示す。
以下を含む、FokI−カスケードRNPサブユニットタンパク質構成要素をコードする遺伝子をベクターにクローニングした:哺乳動物細胞における送達および発現を可能にするためのCMVプロモーター;2Aウイルスペプチド「リボソームスキップ」配列を介して連結したcas遺伝子;30−aaリンカーにより結びついたFokIおよびCas8を含む融合タンパク質。
G. FokI−カスケードRNP複合体をコードするプラスミドのトランスフェクション
トランスフェクション条件は、本質的に実施例8Bに記載されるものに以下の改変を加えたものであった。ヌクレオフェクションの前に、プラスミドベクター溶液5μlを96ウェルプレートの個別のウェルに移した。各ウェルは、FokI−カスケードRNPサブユニットタンパク質構成要素をコードするプラスミド1.5μgおよび最小CRISPRアレイをコードするプラスミド約0.5〜1.5μgを含んでいた。実験を三つ組で行い、実験は、陽性対照として8つの部位(実施例8AからのHsa07ならびに実施例19Fおよび実施例19GからのHsa37、Hsa43、Hsa46、Hsa60、Hsa77、Hsa88、Hsa126)に標的化される大腸菌からのFokI−カスケードRNP複合体(配列番号455)を含んでいた。前述のように、以下のオリゴヌクレオチドを使用して、大腸菌陽性対照で使用される最小CRISPRアレイを生成した:Hsa37(配列番号1019;配列番号1076)、Hsa43(配列番号1024;配列番号1081)、Hsa46(配列番号1027;配列番号1084)、Hsa60(配列番号1037;配列番号1094)、Hsa77(配列番号1045;配列番号1102)、Hsa88(配列番号1050;配列番号1107)、Hsa126(配列番号1072;配列番号1129)。
H. トランスフェクトされた細胞からのgDNAのディープシークエンシング
ディープシークエンシングは、本質的に実施例8Cに記載されるものに以下の改変を加えて行った。実施例8Cの表36からのプライマーYおよびZの代わりに、本実施例に使用される標的特異的プライマーは、配列番号1401〜配列番号1512であった。I−E型RNP複合体と、I−B、I−C、I−F、およびI−Fv2型RNP複合体とのどちらにも大腸菌I−E型カスケードを含む対照サンプルを比較のために含め、実施例8AからのHsa07および本実施例からのHsa37、Hsa43、Hsa46、Hsa60、Hsa77、Hsa88、Hsa126に対応する標的特異的プライマーを用いてシークエンシングした。より具体的には、これらの標的のために以下の標的特異的増幅プライマーを使用した:Hsa37(配列番号1133;配列番号1190)、Hsa43(配列番号1138;配列番号1195)、Hsa46(配列番号1141;配列番号1198)、Hsa60(配列番号1151;配列番号1208)、Hsa77(配列番号1159;配列番号1216)、Hsa88(配列番号1164;配列番号1221)、Hsa126(配列番号1186;配列番号1243)。
I. ディープシークエンシングデータの解析
本質的に実施例8Dに記載されるようにディープシークエンシングデータの解析を行った。図33Aおよび図33Bは、これらの実験からの結果を示す。図33Aにおいて、縦軸は、編集パーセント(図33A、編集%)であり、横軸の数字はI−E型相同体系に対応する配列番号である。I−E型FokI−カスケード相同体の多くで編集が観察された(図33A)。シュードモナス属種S−6−2からのバリアントで最高の編集が観察され、一方、他の相同体(すなわち、サルモネラ・エンテリカ、ゲオテルモバクター属種EPR−M、メタノセラ・アルボリザエMRE50、およびS.サーモフィルス(ND07株))は、大腸菌とほぼ等価の編集を示した。図33Bでは、縦軸は編集パーセント(図33B、編集%)であり、横軸の数字は、I−B、I−C、I−F、およびI−Fv2型相同体系に対応する配列番号である。I−B、I−C、I−F、およびI−Fv2型に由来するFokI−カスケードRNPを用いた編集は、検出限界未満であった(図33B)。
本実施例は、I型相同体をスクリーニングして、ゲノム編集能を提供するI型系を同定するための方法を提供するものである。追加的なI型相同体スクリーニングを実施例22に記載する。
効率的なゲノム編集のためのシュードモナス属種S−6−2におけるFokI−Cas8リンカー長およびスペーサー間距離の変動
本実施例は、FokI−Cas8および様々な長さのリンカーポリペプチドを含む複数の融合タンパク質の設計および試験、ならびにシュードモナス属種S−6−2のI−E型CRISPR−Cas系を用いた効率的なゲノム編集のためのスペーサー間距離を変動させる効果を例証する。
A. 標的細胞にトランスフェクトすべきFokI−カスケードRNP構成要素をコードするベクターの産生
最小CRISPRアレイを設計して、ヒトゲノムにおける座位のセットを標的化した。スペーサー間距離は、1bp刻みの23〜34bpの範囲であった。各スペーサー間距離について8つの標的を設計し、標的はAAG PAM配列に隣接した。3つのオリゴヌクレオチド(配列番号1513〜配列番号1515)および「リピート−スペーサー−リピート−スペーサー−リピート」配列をコードするユニークなプライマーを使用してPCRベースの組み立て(オリゴ鋳型PCR増幅)を有する最小CRISPRアレイを生成して、FokI−カスケードの標的化を可能にした。最小CRISPRアレイを生成するためのユニークなオリゴヌクレオチド配列の全セットは配列番号1516〜配列番号1704であった。SPRIselect(登録商標(Beckman Coulter、Pasadena、CA)ビーズを本質的に製造業者の説明書に従って使用して、PCRで組み立てたガイドを精製し、濃縮した。
FokI−カスケードRNPサブユニットタンパク質構成要素をコードする遺伝子を、以下を含むベクターにクローニングした:哺乳動物細胞における送達および発現を可能にするためのCMVプロモーター、2A「リボソームスキップ」配列を介して連結したcas遺伝子、および30−aaリンカー(配列番号1748)でCas8に結合したFokI。様々な長さの追加的なリンカーのポリペプチド配列を設計し、FokIをCas8タンパク質に結びつけて融合タンパク質を形成させるために使用した。リンカーポリペプチド配列を表45に挙げる。
B. FokI−カスケードRNP複合体構成要素をコードするベクターのトランスフェクション
トランスフェクション条件は、以下の改変を加える以外、本質的に実施例8Bに記載されるように行った。ヌクレオフェクションの前に、プラスミドベクター溶液5μlを96ウェルプレートの個別のウェルに移した。各ウェルは、FokI−カスケードRNPタンパク質構成要素をコードするプラスミド5μgおよび最小CRISPRアレイをコードする直鎖状PCR産物約0.1〜0.5μgを含んでいた。
C. トランスフェクトされた細胞からのgDNAのディープシークエンシング
ディープシークエンシングを、本質的に実施例8Cに記載されるように行った。実施例8Cの表36からのプライマーYおよびZの代わりに、標的特異的プライマーは配列番号1705〜配列番号1803であった。
ディープシークエンシングデータの解析を、本質的に実施例8Dに記載されるように行った。図34は、95個の部位でのゲノム編集(図34、縦軸「編集%」)を示す(n=1)。図34において、横軸は塩基対単位のスペーサー間長に対応する(図34、スペーサー間長(bp))。リンカー長を左から右に17AA(図34、白い棒線)、20AA(図34、斜め格子の棒線)、および30AA(図34、縞模様の棒線)の3つの棒グラフによって表した。編集は、約50%(図34、エラーバーは平均±1s.d.を示す)から検出限界未満の範囲であり、スペーサー間距離およびリンカーポリペプチド長と関係した。リンカーポリペプチドのアミノ酸組成を本明細書において述べる。約30〜33bpのスペーサー間距離ならびに17および20アミノ酸のリンカーポリペプチド長は非常に効率的な編集を提供した。
本質的に本実施例に示されるものと同じプロトコールに従って、本発明を裏づけるものとして行われた追加的な実験からのデータを図41A、図41B、および図41Cに示す。これらの図において、縦軸は編集効率(%)であり、横軸はbp単位のスペーサー間距離(23〜34bp)である。データは、3つのカスケード相同体バリアント、FokI−Pseカスケード(図41A)、FokI−Ecoカスケード(図41B)、およびFokI−Sthカスケード(図41C)についてのFokI−Cas8リンカー長およびスペーサー間距離のスクリーニングを拡張したものである。編集効率パーセントを、17aa、20aa、および30aa(図41A、図41B、および図41C:左から右に、17aa、20aa、および30aa)のFokI−Cas8リンカー長およびスペーサー間距離に対して表す。各点は、単一のゲノム部位を表し、スペーサー間距離1つあたり7〜8つの部位を試験した。平均を棒グラフに示す。これらのデータから分かるように、約30〜33bpのスペーサー間距離ならびに17、20、および30アミノ酸のリンカーポリペプチド長は、FokI−Pseカスケードのための効率的な編集を提供し、約31〜33bpのスペーサー間距離ならびに17、20、および30アミノ酸のリンカーポリペプチド長はFokI−Ecoカスケードのための効率的な編集を提供し、約29〜31bpのスペーサー間距離ならびに17、20、および30アミノ酸のリンカーポリペプチド長はFokI−Sthカスケードのための効率的な編集を提供した。
FokI−カスケードゲノム編集を可能にするためのCas3−FokIおよびFokI−Cas8の利用
本実施例は、FokIのダイマー化を誘導して、ヒトゲノムにおける座位での二本鎖切断を生成するためのCas3−FokIおよびFokI−カスケードの使用を例証する(例えば、図16A、図16B、および図16C参照)。より具体的には、本実施例は、ゲノム編集効率に影響するための複数のCas3−FokIリンカーの組成および長さならびにFokI−Cas8リンカーの組成および長さの設計ならびに試験を詳述する。
A. 標的細胞にトランスフェクトすべきFokI−Cas3およびFokI−カスケードRNP構成要素をコードするベクターの産生
ヒトゲノムにおいてAAG PAMに隣接する3つの互いに異なる部位を標的化するために最小CRISPRアレイを設計する。ガイドによって方向付けされる大腸菌FokI−カスケードダイマーを用いたスペーサー間編集を支援することが以前に示されたことから、FokI−カスケード結合に許容性であることが公知である部位(例えば、Hsa37、Hsa43、およびHsa46)を選択する。
上記の実施例に記載されるFokI−カスケード系は、2つのFokIカスケード複合体を使用したものであるので(例えば、図15A、図15B、および図15C参照);第1の核酸標的部位を特定している第1のガイド配列および第2の核酸標的部位を特定している第2のガイド配列を使用することができる。Cas3−FokI−FokI−カスケード系はPAMを1つだけ必要とするので、核酸標的部位への機能的カスケード複合体の結合を促進するために「リピート−スペーサー−リピート」を含むガイドで十分なはずである。「リピート−スペーサー−リピート−スペーサー−リピート」を含むポリヌクレオチドもまた使用することができるが、典型的には本実施形態において、2つのスペーサー配列は同じ核酸標的配列へのカスケード複合体の結合を方向付ける;言い換えれば、2つのスペーサーは同じ配列を有することができる。ガイドを、配列番号454を用いて実施例9Aに本質的に記載されるようにクローニングする。最小CRISPRアレイの生成のために以下のアニーリングされたオリゴヌクレオチドを使用する:Hsa37(配列番号1019;配列番号1076)、Hsa43(配列番号1024;配列番号1081)、およびHsa46(配列番号1027;配列番号1084)。
実施例9Aに記載されるように、FokI−カスケードRNPタンパク質構成要素をコードする遺伝子を、CMVプロモーターを含むプラスミドベクターにクローニングして、哺乳動物細胞における送達および発現を可能にする。2A「リボソームスキップ」配列を介してcas遺伝子を連結する。さらに、30−aaリンカー(配列番号455)でFokIをCas8に融合する。様々な長さおよび組成の追加的なリンカー配列を設計し、FokIをCas8タンパク質に結びつけるために使用する。そのような配列の例を表46に挙げる。
大腸菌からのCas3タンパク質を、30−aaリンカーを使用してFokIにC末端で融合する。この融合物をN末端のNLS配列(配列番号1806)によりさらに操作する。様々な長さおよび組成の追加的なリンカー配列を設計し、FokIをCas3タンパク質に結びつけるために使用する(表46および配列番号1804〜配列番号1807)。
Cas3タンパク質のヘリカーゼまたはヌクレアーゼ活性が不活性された追加的なCas3−FokI融合構築物を生成する(配列番号1808〜配列番号1815)。Cas3タンパク質のD452AおよびD75A突然変異を作製することによって、それぞれヘリカーゼおよびヌクレアーゼ活性を障害する(例えば、Mulepati、S.ら、J.Biol.Chem.288:22184〜22192(2013年)参照)。
B. FokI−カスケードRNP複合体をコードするプラスミドのトランスフェクション
トランスフェクション条件は、実施例8Bに記載されるものに以下の改変を加えて行う。ヌクレオフェクションの前に、プラスミドベクター溶液5μlを96ウェルプレートの個別のウェルに移す。各ウェルは、以下の3つの構成要素を含む:FokI−カスケードRNPタンパク質構成要素のセットをコードするプラスミド3μg、Cas3−FokIをコードするプラスミド3μg、および最小CRISPRアレイをコードするプラスミド0.5μg。96ウェルプレートをマトリックスとして設定して、3つの構成要素のすべての組み合わせを提供する。
C. トランスフェクトされた細胞からのgDNAのディープシークエンシング
ディープシークエンシングは、以下の改変を加えて実施例8Cに記載されるように行う。実施例8Cの表36からのプライマーYおよびZの代わりに本実施例に使用される標的特異的プライマーは、以下の通りである:配列番号1133および配列番号1190(Hsa37標的部位)、配列番号1138および配列番号1195(Hsa43標的部位)、ならびに配列番号1141および配列番号1198(Hsa46標的部位)。
D. ディープシークエンシングデータの解析
FokI−カスケード結合部位のPAM配列の約1bp〜約25bp上流のインデルを集計することを除き、ディープシークエンシングデータの解析を実施例8Dに記載されるように行う。このようにして、もっとも効率的な編集を支援するFokI−Cas8リンカー配列、Cas3−FokIリンカー配列、およびCas3バリアントの組み合わせを決定することができる。
操作された相同体FokI−カスケード複合体のスクリーニング
本実施例は、ゲノム編集の効率を評価するための異なる数のサブユニットを有する複数の相同カスケード複合体の設計および試験を例証する。本実施例は、実施例19に記載される解析を拡張したものである。
A. FokI−カスケードRNP複合体について標的細胞にトランスフェクトすべきDNA鋳型構成要素の産生
最小CRISPRアレイを設計して、ヒトゲノム中のgDNAの反対鎖上の隣接座位に2つのFokI−カスケードRNP複合体を標的化した。FokI−カスケード構築物は、3つまたは4つのいずれかの遺伝子を含む11個の相同種のそれぞれに由来した:F.ヌクレアツム(F.nucleatum)(Fnu、I−B型)、C.フェータス(C.fetus)(Cfe、I−B型)、O.スプラキニカス(O.splanchnicus)(Osp、I−B型)、B.ハロデュランス(B.halodurans)(Bhe、I−C型)、D.ブルガリス(Dvu、I−C型)、コレラ菌(V.cholera)L15株(Vch、I−F型)、K.オキシトカ(K.oxytoca)(Koh、I−F型)、緑膿菌(Pae、I−F型)、S.プトレファシエンス(Spu、I−Fv2)、アシネトバクター(Aci、I−Fv2型)、コレラ菌HE48株(Vch_v2、I−Fv2型)。
第1および第2の操作されたクラス1 I型CRISPR−Casエフェクター複合体を設計し、その際、第1のガイドポリヌクレオチドは、第1の核酸標的配列と結合することが可能な第1のスペーサーを含み、第2のガイドポリヌクレオチドは第2の核酸標的配列と結合することが可能な第2のスペーサーを含み、第1の核酸標的配列のPAMおよび第2の核酸標的配列のPAMは14塩基対と60塩基対との間のスペーサー間距離を有した。PAMがガイドRNA標的配列に対して内側を向く(すなわち、PAM−イン配向)ように2つの操作されたクラス1 I型CRISPR−Casエフェクター複合体を配向させた。PAM配列はI−B型についてTCA、I−C型についてTTC、I−F、I−Fv2型についてCCであった(I−F型およびI−Fv2型はCRISPRアレイにおいて異なるリピート配列を有する;表47および表44参照)。
FokI−カスケードRNP複合体の標的化を可能にするための3つのオリゴヌクレオチドおよび「リピート−スペーサー−リピート−スペーサー−リピート」配列をコードするユニークなプライマーを使用して、本質的に本明細書(例えば、実施例20A;ならびにまた図42Aおよび図42B)に記載されるように、PCRベースのオリゴ鋳型アセンブリーを用いて最小CRISPRアレイを生成した。I−B型および1−C型のために非ユニバーサルリバースオリゴヌクレオチドプライマーを使用した。本質的に実施例20Aに記載されるようにSPRIselect(登録商標)ビーズ(Beckman Coulter、Pasadena、CA)を使用して、PCRで組み立てた最小CRISPRアレイを精製し、濃縮した。
操作されたクラス1 I型CRISPR−Casエフェクター複合体において、FokIコーディング配列をI−B、I−C、I−F型複合体についてCas8のN末端に、およびI−Fv2型複合体についてCas5のN末端に融合させた。FokI−カスケードRNPタンパク質構成要素をコードする遺伝子を、以下を含むベクターにクローニングした(表44および表47参照):哺乳動物細胞における送達および発現を可能にするためのCMVプロモーター、2A「リボソームスキップ」配列を介して連結したcas遺伝子、および30−aaリンカーでCas8(またはI−Fv2型相同体の場合は30−aaリンカーでCas5)に結合したFokIモノマー。
B. 操作されたFokI−カスケードRNP複合体構成要素をコードするベクターのトランスフェクション
トランスフェクション条件は、本質的に実施例8Bに記載されるものに以下の改変を加えて行った。ヌクレオフェクションの前に、DNA鋳型を含有する溶液5μLを96ウェルプレートの個別のウェルに移し、その際ウェルは、相同FokI−カスケード複合体の構成要素をコードする各プラスミド約1.5μgおよび最小CRISPRアレイをコードする直鎖状PCR産物0.4μgを含んでいた。
C. トランスフェクトされた細胞からのgDNAのディープシークエンシング
ディープシークエンシングを、本質的に実施例8Cに記載されるように行った。しかし、実施例8Cの表36からのプライマーYおよびZの代わりに、異なる標的特異的プライマーを使用した。図43は、データ解析の結果を示す。図43において、ゲノム編集パーセントは、FokI−カスケード相同体バリアント(図43、横軸、11個の相同体バリアントは上記の略語によって特定され、横軸に同じ順序で出現する)およびスペーサー間距離(図43、縦軸、14〜60bp)に対して示し;右側の灰色の目盛の縦棒はインデルのパーセンテージである。所与のスペーサー間距離での各測定値は、4つの標的部位(標的部位1つあたりn=1)にわたる平均編集を表す。操作されたFokI−カスケードオーソログ複合体の大部分での編集は、試験された標的部位にわたり検出限界未満であり、一方、操作されたコレラ菌L15株(I−F型)FokI−カスケード複合体を用いた編集は、検出限界未満から最大で約2%のインデルの範囲であり、26bpと28bpとの間のスペーサー間距離で最高の編集が観察された。操作されたコレラ菌HE48株(I−Fv2型)FokI−カスケード複合体で、42bpと46bpとの間のスペーサー間距離でもまた、検出限界未満〜約1.5%の範囲の編集が観察された。
本実施例のデータは、ゲノム編集に効果的な相同カスケード複合体を同定するために本明細書に記載される方法を有効に適用できることを例証している。
細胞における欠失長を制限するためのmCas3タンパク質の使用
本実施例は、結果としてもたらされたCas3誘導欠失が、ゲノム編集(例えば、ヒト細胞における)に使用するためにwtCas3タンパク質を用いて生成される欠失よりも短いようにCas3タンパク質を突然変異させる方法を例証する。
A. カスケードおよびCas3 DNA鋳型構成要素の産生
ヒトゲノム中のchr2(HZGJ遺伝子)上にAAG PAMを有するゲノム座位に大腸菌カスケード(Ecoカスケード)RNP複合体を標的化するために最小CRISPRアレイを設計した。次に、3つのオリゴヌクレオチド(配列番号1513〜配列番号1515;実施例20A)および「リピート−スペーサー−リピート−スペーサー−リピート」配列をコードするユニークなプライマーを使用するPCRベースのアセンブリーにより最小CRISPRアレイを生成して、EcoカスケードRNP標的化を可能にした(配列番号1818)。結果としてもたらされたアンプリコンは、最小CRISPRアレイの発現を推進するhu6プロモーターを含有する。この最小CRISPRアレイのために、両方のスペーサー配列について同一の配列を使用した。PCRで組み立てられた最小CRIPSRアレイを、SPRIselect(登録商標)ビーズ(Beckman Coulter、Pasadena、CA)を使用して精製し、濃縮した。
DNAヌクレアーゼ活性を維持しながらDNAに対する突然変異タンパク質のDNAトランスロケーションプロセッシビティ(すなわち、DNAの長さに沿った移動)を減少させるために、大腸菌Cas3(EcoCas3)突然変異バリアントのパネルを設計した。
一本鎖DNA基質に結合したサーモビフィダ・フスカ(Thermobifida fusca)Cas3の結晶構造(Huo、Y.ら、Nat.Struct.Mol.Biol.(9):771〜777(2014年))、機能的タンパク質ドメインの位置、および他のCas3オーソログとの相同性を参照し、EcoCas3(大腸菌(P38036)Cas3アミノ酸配列:UniProtKB − P38036(CAS3_ECOLI))における24個の互いに異なる突然変異のセットを作製して、ヘリカーゼドメインにおけるATP結合/加水分解領域(すなわち、G317A、S318A、G319A、K320N、T321N、Q297E、D452E、E453N、R662A、R665Q)またはssDNAループ結合/ヘリカーゼドメインのssDNA経路保存領域(すなわち、T346A、Q347N、G375A、K412G、T423A、D425H、Q426T、H601A、A602V、R603Q、R609S、T635A、Q636A、Q640H)のいずれかを調節した。表48は、EcoCas3野生型タンパク質および突然変異型タンパク質、配列(ヌクレオチド配列)をコードするプラスミド、ならびに対応するアミノ酸配列を挙げるものである。
EcoカスケードRNPタンパク質構成要素をコードする遺伝子ならびに野生型(wt)および突然変異型EcoCas3遺伝子を、CMVプロモーターを含むベクターにクローニングして、哺乳動物細胞における送達および発現を可能にした。EcoカスケードRNP cas遺伝子を、2A「リボソームスキップ」配列を介して連結し、コードされるタンパク質を核に方向づけるためにすべての遺伝子はN末端NLS配列を含んでいた(Ecoカスケード多シストロン性プラスミド、ヌクレオチド配列の配列番号1871、多シストロン性アミノ酸配列1872)。
B. 操作されたEcoカスケードRNP、野生型EcoCas3タンパク質、および突然変異型EcoCas3タンパク質をコードするベクターのトランスフェクション
トランスフェクション条件を、本質的に実施例8Bに記載されるものに以下の改変を加えて行った。ヌクレオフェクションの前に、DNA鋳型を含有する溶液6μLを96ウェルプレートの個別のウェルに移し−ウェルは、Ecoカスケード複合体タンパク質をコードするプラスミド3μg、野生型または突然変異型EcoCas3タンパク質をコードするプラスミド1μg、および最小CRISPRアレイをコードする直鎖状PCR産物0.2μgを含んだ。トランスフェクションの約4日後にgDNAを回収した。
C. トランスフェクトされた細胞からのgDNAのディープシークエンシング
ディープシークエンシングを、本質的に実施例8Cに記載されるように行った。しかし、実施例8Cの表36からのプライマーYおよびZの代わりに、標的特異的プライマーは配列番号1873〜配列番号1874であり;また、MiSeq試薬キットv3、600サイクル(Illumina、San Diego、CA)を使用した。ディープシークエンシングデータの解析を、本質的に実施例8Dに記載されるものに以下の改変を加えて行った:(1)少なくとも1つのリードを有し、アンプリコン(アンプリコン位置:chr2:68156987〜68157510;長さ=524ヌクレオチド)ウィンドウ内のいずれかの位置に3つよりも多いヌクレオチド欠失を有するユニークなリードクラスを集計した(本明細書において「ユニークな欠失クラス」と称する;長い欠失を有する産物について増幅バイアスがリードカウントに影響する場合があるので、クラスにリードカウントによる重み付けをしなかった)、(2)挿入または複数の欠失を有するリードクラスを捨て、かつ(3)サンプル間で比較して欠失開始部位および終止部位をマッピングした。
図45A、図45B、図45C、および図45Dは、野生型EcoCas3タンパク質(n=21)、欠損EcoCas3タンパク質(n=3)、または突然変異型EcoCas3タンパク質(n=3)のいずれかを含むEcoカスケードRNP複合体を用いたHZGJ座位でのゲノム編集を示す。図45Aは、縦軸にユニークな欠失クラスの数(図45A、0〜600)および横軸にEcoCas3タンパク質バリアント(図45A、左から右、野生型対照(WT)、Cas3なしのタンパク質対照、および表48に示される順序のm1Cas3タンパク質〜m24Cas3タンパク質)を示す。ここで、524bpのアンプリコンウィンドウ内のユニークな欠失クラスの数に増加をもたらしたCas3突然変異型バリアントは、トランスロケーションプロセッシビティ(すなわち、DNAの長さに沿った移動)低減の候補であった。図45Bは、縦軸に塩基対単位の平均欠失長を、横軸にEcoCas3タンパク質バリアントを示す(図45Aと同じ順序)。ユニークな欠失クラスの測定と同様に、524bpのアンプリコンウィンドウ内により短い欠失長を生じたCas3突然変異型バリアントは、トランスロケーションプロセッシビティ低減の候補であった。図45Cは、縦軸にEcoカスケードPAMの6bp上流の部位(すなわち、Cas3ニッキング部位の近く)と比べた平均欠失開始位置(bp)および横軸にEcoCas3タンパク質バリアント(図45Aと同じ順序)を示す。図45Dは、縦軸にEcoカスケードPAMの6bp上流の部位(すなわち、予想されるCas3ニッキング部位近く)と比べた平均欠失終止位置(bp)、および横軸にEcoCas3タンパク質バリアントを示す(図45Aと同じ順序)。ここで、EcoCas3の予測されるニッキング部位のより近くに欠失の開始および終止位置を示したCas3突然変異体は、トランスロケーションプロセッシビティ(すなわち、DNAの長さに沿った移動)低減の強力な候補と見なされた。まとめると、アンプリコンウィンドウ内のユニークな欠失のクラスの増加と、アンプリコンウィンドウ内の短縮化された欠失のクラスと、アンプリコンウィンドウ内の位置がシフトした欠失クラスとのある組み合わせを示したCas3突然変異体は、トランスロケーションプロセッシビティ低減の強力な候補であった。
いくつかの突然変異体が、低減した欠失長を指し示す修復パターンの変化を与えた。野生型EcoCas3タンパク質と比べて、突然変異型EcoCas3タンパク質D452HおよびA602Vは、両方とも、(1)欠失の短縮化を指し示す可能性があるアンプリコンウィンドウ内のユニークな欠失クラスの数における大きな増加、および(2)これも欠失の短縮化を指し示す可能性がある、アンプリコンウィンドウ内の野生型EcoCas3タンパク質と比べて欠失のEcoCas3開始部位近くへのシフトを示した。突然変異型EcoCas3タンパク質A602Vはまた、野生型EcoCas3タンパク質と比べてアンプリコンウィンドウ内の欠失の縮小を示した。突然変異D452HおよびA602Vの両方は、ssDNAループの結合に影響することが予測されている。本実施例におけるデータは、ヒト細胞に導入および発現される場合、カスケードRNP複合体と会合したCas3タンパク質に突然変異を導入して、wtCas3タンパク質と比べて欠失長を低減し、細胞中のgDNAにおける欠失長を調節するための突然変異を含むCas3タンパク質を作製および使用する方法に関するガイダンスを提供できることを実証している。
Cas3誘導欠失長を限定するためのロードブロックの使用
Cas3タンパク質と会合したカスケードRNP複合体によって促進される欠失長を限定および/または定義するためのいくつかの方法が、本出願に記載される。本実施例は、Cas3の欠失を限定するためにどのようにタンパク質ロードブロックを使用できるかを例証するものである。
A. Cas3タンパク質およびEcoカスケードRNP DNA鋳型構成要素の産生
ヒトゲノムにおけるchr2(HZGJ遺伝子)上のAAG PAMを有するゲノム座位に大腸菌カスケード(Ecoカスケード)RNPを標的化するために最小CRISPRアレイを設計した。次に、本質的に実施例20Aに記載されるように3つのオリゴヌクレオチド(配列番号1513〜配列番号1515)および「リピート−スペーサー−リピート−スペーサー−リピート」配列をコードするプライマーを使用してEcoカスケードRNP標的化を可能にするPCRベースのアセンブリーにより最小CRISPRアレイを生成した。この最小CRISPRアレイについて、両方のスペーサー配列は同一であった。PCRで組み立てられたガイドを、主として製造業者の説明書に従ってSPRIselect(登録商標)(Beckman Coulter、Pasadena、CA)ビーズを使用して精製し、濃縮した。操作されたEcoカスケードタンパク質構成要素をコードする遺伝子のみならず大腸菌Cas3(EcoCas3)遺伝子を、CMVプロモーターを含むベクターにクローニングして哺乳動物細胞における送達および発現を可能にした。EcoカスケードRNP cas遺伝子を、2A「リボソームスキップ」配列(プラスミドヌクレオチド配列、配列番号1871;多シストロン性タンパク質配列、配列番号1872)を介して連結し、すべての遺伝子は、コードされるタンパク質を核に方向づけるためにN末端NLS配列を含んでいた。
B. dCas9−VP64/sgRNA RNP複合体の産生
カスケードRNP複合体と会合したCas3タンパク質のトランスロケーションプロセッシビティ(すなわち、DNAに沿った移動)を止めるためのロードブロックとして使用すべきdCas9−VP64/sgRNA RNP複合体のsgRNA構成要素をin vitro転写(T7 Quick High Yield RNA Synthesis Kit、New England Biolabs、Ipswich、MA)によって産生した。5’重複プライマーを使用するPCRを用いて、sgRNA構成要素の転写のためのdsDNA鋳型をアセンブルした。dsDNA鋳型は、DNA配列の5’末端にT7プロモーターを組み入れていた。sgRNA鋳型を産生するために使用される構成要素、鋳型、およびプライマーを表49に示す。
sgRNA DNA鋳型をアセンブルするためのPCR反応を、以下を含む反応混合物を用いて以下のように実行した:濃度40nMの1つの「内部」DNAプライマー(配列番号1889〜配列番号1899)、濃度500nMの2つの「外部」DNAプライマー(配列番号1887および配列番号1888;T7プロモーターおよびRNA配列の3’末端を含む)。本質的に製造業者の説明書に従ってQ5 Hot Start High−Fidelity 2X Master Mix(New England Biolabs、Ipswich、MA)を使用してPCR反応を行った。以下のサーマルサイクリング条件を用いてPCRアセンブリー反応を実行した:98℃2分間と、98℃で10秒、58℃で20秒、72℃で20秒の11サイクルと、72℃で1分間の最終伸長と。
T7 High Yield RNA Synthesis Kit(New England Biolabs、Ipswich、MA)を使用して約0.25〜0.5μgの間の各sgRNAのDNA鋳型を37℃で約16時間転写した。転写反応物をDNアーゼI(New England Biolabs、Ipswich、MA)で処理した。VP64エフェクタードメインがC末端に融合したdCas9タンパク質(D10AおよびH840A;例えば、Sander、J.D.ら、Nat.Biotechnol.32:347〜355(2014年)参照)、およびNLSタグをVP64のC末端に付加し(N−NLS−VP64コーディング配列−dCas9コーディング配列−C)、大腸菌における細菌発現ベクター(BL21(DE3))から発現させ、本質的にJinek、M.ら、Science 337:816〜821(2012年)によって記載されるようにアフィニティークロマトグラフィー、イオン交換クロマトグラフィー(IEC)、およびサイズ排除クロマトグラフィー(SEC)を用いて精製した。
C. EcoCas3およびEcoカスケードRNP複合体構成要素の構成要素のみならず、dCas9−VP64/sgRNA RNP複合体をコードするベクターのトランスフェクション
HEK293細胞のトランスフェクションを、本質的に実施例8Bに記載されるものに以下の改変を加えて行った:
Cas3/EcoカスケードRNP複合体の形成のために、EcoCas3タンパク質およびEcoカスケードタンパク質をコードするDNA鋳型を含有する溶液4μLを96ウェルプレートの個別のウェルに移し、その際、前記ウェルは、Ecoカスケードタンパク質をコードするプラスミド3μg、最小CRISPRアレイをコードする直鎖状PCR産物0.2μg、およびEcoCas3をコードするプラスミド0、1、または3μgを含み;
Cas3−EcoカスケードRNP複合体の形成のために、Cas3−Ecoカスケードタンパク質構成要素をコードするプラスミドであって、Cas3が17−aaリンカーでCas8タンパク質に連結したプラスミド3μg、および最小CRISPRアレイをコードする直鎖状PCR産物0.2μgを含んでいた。
次に、dCas9−VP64/sgRNA RNP複合体をアセンブルした。具体的には、sgRNAを95℃で2分間インキュベートし、次いで室温に約5分間平衡化させた。dCas9−VP64タンパク質を反応緩衝液(20mM HEPES、pH7.5、100mM KCL、5mM MgCl2、5%グリセリン)中で1:3の比のsgRNAと37℃で10分間混合した。アセンブルしたdCas9−VP64/sgRNA RNP複合体を細胞内へのトランスフェクションのために様々な用量で96ウェルプレートのウェルに移し、マトリックスを確立し、その際、各Cas3/EcoカスケードまたはCas3−Ecoカスケード混合物には0、5、20、または50pmolのいずれかのdCas9−VP64ロードブロックを加えた。ヌクレオフェクションの4日後に細胞からgDNAを回収した。
D. トランスフェクトされた細胞からのgDNAのディープシークエンシング
ディープシークエンシングおよびデータ解析を本質的に実施例23Cに記載されるように行った。図46A、図46B、および図46Cは、Cas3/Ecoカスケード(それぞれ図46Aおよび図46BでCas3発現プラスミド1μgまたは3μgを用いる)またはCas3−Ecoカスケード(図46C)のいずれかについてdCas9−VP64/sgRNA RNP複合体ロードブロックの非存在下または存在下で、表示されるdCas9−VP64/sgRNA RNP複合体が結合するために標的化された位置(すなわち、ロードブロックの位置、図46A、図46B、図46C、黒い矢印)に関してHZGJ座位での欠失開始部位の頻度を実証する一連のヒートマップを示す(図46A、図46B、および図46C、白い矢印は予想されるCas3ニッキング部位を示す)。全体として、11個のロードブロック(F1〜F6およびR1〜R5)をHZGJ座位で評価した。図46A、図46B、および図46Cにおいて、「F」は、dCas9−VP64/sgRNA RNP複合体のフォワード方向を指し、その際、フォワード方向は、EcoカスケードRNP複合体の核酸標的結合部位のPAMに向いたdCas9−VP64/sgRNA RNP複合体の核酸標的結合部位に付随するPAMを意味し;「R」は、dCas9−VP64/sgRNA RNP複合体の逆方向を指し、その際、逆方向は、dCas9−VP64/sgRNA RNP複合体の核酸標的結合部位に付随するPAMがEcoカスケードRNP複合体の核酸標的結合部位のPAMに向いていなかったことを意味する。標的部位指標(F1〜F6およびR1〜R5)の右の数字1、2、3、および4は、それぞれ0、5、20、または50pmolのdCas9−VP64/sgRNA RNP複合体に対応する。各ヒートマップの上の数字(−440〜+100)はアンプリコンウィンドウ内のbpに対応し、その際、0部位はEcoカスケードRNP PAMの6bp上流を表す。各ヒートマップの左の灰色のスケールバーは、突然変異型クラスの割合を表す(0.0〜0.5)。欠失開始部位は、ロードブロックF4、F5、およびF6についてのdCas9−VP64/sgRNA RNP複合体ロードブロックの配置部位近くに高度に濃縮されているように見えた。
図47Aおよび図47Bは、Cas3−Ecoカスケード3μgおよびdCas9−VP64/sgRNA RNP複合体ロードブロック0pmol(図47A)または50pmol(図47B)のいずれかをヌクレオフェクションされたサンプルについてアンプリコンウィンドウ内の欠失のすべてについてのデータを示す。図47Aおよび図47Bにおいて、白い矢印は、EcoCas3タンパク質ニック部位の相対位置を示す。図47Bにおいて、黒い矢印はロードブロックの配置を示す(すなわち、dCas9−VP64/sgRNA RNP複合体についての標的結合部位)。図47Aおよび図47Bにおいて、縦軸は、欠失の3’末端を表し、単位はアンプリコンウィンドウ内のbpであり、「0」部位は、EcoカスケードRNP PAMの6bp上流を表す部位であり;横軸は、欠失の5’末端を表し、単位はアンプリコンウィンドウ内のbpであり、「0」部位はEcoカスケードRNP PAMの6bp上流を表した。図47Aおよび図47Bにおいて、横の破線は、欠失の3’末端の平均位置を表し、縦の破線は欠失の5’末端の平均位置を表す。図47Aおよび47Bのそれぞれの上部の棒グラフは、欠失の5’末端の分布に対応し、曲線は、欠失の5’末端のカーネル密度推定値を表す。同様に、図47Aおよび47Bのそれぞれの右の棒グラフは欠失の3’末端の分布に対応し、曲線は欠失の3’末端のカーネル密度の推定値を表す。欠失開始部位は図47Bにおける黒の矢印近くに高度に濃縮されており、これは、Cas3がロードブロック上流のgDNAを欠失するのをロードブロックが阻止したことを強く示唆している。
本実施例におけるデータは、カスケードRNP複合体と会合したCas3タンパク質によって媒介される欠失の長さを制御するためのタンパク質ロードブロックの使用を支持するものであり;したがって、カスケードRNP複合体と会合したCas3タンパク質を使用して、細胞のgDNAに所定の長さを有する欠失が形成することを促進するための方法を提供する。
対形成したニッキングによる標的化ゲノム欠失を誘導するためのカスケード複合体に連結したATPアーゼ欠失突然変異体の使用
本実施例は、どのようにCas3 ATPアーゼ欠失突然変異型タンパク質(mCas3タンパク質)を使用してゲノムDNAの反対鎖への対形成ニッキングを促進して、標的化欠失を誘導するかを例証するものである。
A. mCas3タンパク質/EcoカスケードおよびmCas3タンパク質−EcoカスケードRNP複合体DNA鋳型構成要素の産生
2つの大腸菌カスケード(Ecoカスケード)(配列番号1871)RNP複合体を、ヒトゲノムにおけるgDNAの反対鎖上の隣接座位に標的化するために最小CRISPRアレイを作製した。大腸菌D452A mCas3タンパク質(mCas3[D452A])、ヘリカーゼ活性を有さず、したがってニッキング活性のみを有するATPアーゼ欠損バリアント(例えば、Mulepati、S.ら、J.Biol.Chem.288:22184〜22192(2013年)参照)を設計して、EcoカスケードRNP複合体の動員後の対形成ニッキングを介して標的化欠失を誘導した。mCas3[D452A]タンパク質を、Ecoカスケードと離れた単一の構成要素(配列番号1900)、または17アミノ酸ポリペプチドリンカーによりEcoカスケードRNP複合体内のCas8タンパク質に連結した融合タンパク質(配列番号1901)のいずれかとして発現させた。mCas3[D452A]タンパク質が単一の構成要素として発現された場合、コーディング配列は発現ベクター上に存在し、その際、その発現はCMVプロモーターの制御下であった。Cas3[D452A]タンパク質/Ecoカスケードは、Ecoカスケードから別の構成要素として発現されるmCas3[D452A]タンパク質を指す。mCas3[D452A]タンパク質−カスケードRNPは、EcoカスケードRNP複合体内のCas8タンパク質に連結した融合タンパク質としてのmCas3[D452A]を指す。mCas3[D452A]タンパク質−カスケードRNPタンパク質構成要素をコードする遺伝子を、以下を含むベクター中にクローニングして、mCas3[D452A]−Cas8融合タンパク質を作製した:哺乳動物細胞における送達および発現を可能にするためのCMVプロモーター、2A「リボソームスキップ」配列を介して連結したcas遺伝子、および17−aaリンカーでCas8に結合したCas3のATPアーゼ欠失突然変異体バリアント(D452A)(配列番号1901)。mCas3[D452A]タンパク質がCas8タンパク質との融合タンパク質として発現された場合、融合タンパク質はEcoカスケードRNP複合体(mCas3[D452A]タンパク質−EcoカスケードRNP複合体)の部分としてアセンブルした。
2つのガイド標的配列の間の距離(ガイドオフセット)は、1bpと120bpとの間であった。PAMがガイドRNA標的配列に対して内向き(PAM−イン)または外向き(PAM−アウト)のいずれかであるようにEcoカスケードRNP複合体を配向させた。核酸標的配列に付随するPAM配列を以下から選択した:AAT、ATA、AAC、AAA、GAG、ATG、AGG、またはAAG。
3つのオリゴヌクレオチド(配列番号1513〜配列番号1515)および「リピート−スペーサー−リピート−スペーサー−リピート」配列をコードするユニークなプライマーを使用して隣接座位へのカスケードRNPの標的化を可能にするPCRベースのアセンブリーを用いて最小CRISPRアレイを生成した。結果としてもたらされたアンプリコンは、ガイドについてのコーディング配列を含む最小CRISPRアレイの発現を推進するhu6プロモーターを含むであろう(例えば、実施例20A;図42A参照)。本質的に製造業者の説明書に従ってSPRIselect(登録商標)(Beckman Coulter、Pasadena、CA)ビーズを使用して、PCRでアセンブルされた最小CRISPRアレイを精製し、濃縮した。
B. FokI−カスケードRNP複合体構成要素をコードするベクターのトランスフェクション
トランスフェクション条件は、本質的に実施例8Bに記載されるものに以下の改変を加えて行った。ヌクレオフェクションの前に、DNA鋳型を含有する溶液5μLを96ウェルプレートの個別のウェルに移した。mCas3[D452A]タンパク質/EcoカスケードRNP複合体の発現のために、ウェルは、mCas3[D452A]タンパク質をコードするプラスミド1.5μgおよびEcoカスケードをコードするプラスミド1.5μgのみならず、最小CRISPRアレイをコードする直鎖状PCR産物0.3μgを含んでいた。mCas3[D452A]タンパク質−EcoカスケードRNP複合体の発現について、ウェルは、mCas3[D452A]−Ecoカスケードタンパク質(mCas3[D452A]−Cas8融合タンパク質を含む)をコードするプラスミド3μgのみならず、最小CRISPRアレイをコードする直鎖状PCR産物0.3μgを含んでいた。
C. トランスフェクトされた細胞からのgDNAのディープシークエンシング
多数の標的部位を含む6つの座位をgDNAの反対鎖上の対形成ニッキングについて試験した(HZGJ座位、30標的部位;NPHP3−ACAD11座位、60標的部位;JAK1座位1、49標的部位;JAK1座位2、33標的部位;NMNAT2座位、38標的部位;およびERBB2座位、26標的部位)。gDNAの反対鎖上の対形成ニッキングを、標的部位へのカスケード複合体の結合を方向づけたガイドを含むmCas3[D452A]タンパク質/EcoカスケードRNP複合体およびmCas3[D452A]タンパク質−EcoカスケードRNP複合体の両方について試験した。
本質的に実施例8Cに記載されるようにディープシークエンシングを行い、上記標的に対応して異なる標的特異的プライマーを使用したことを除き、実施例8Dに記載されるように解析を行った。
表50は、表示の標的部位に標的化されるmCas3[D452A]タンパク質−EcoカスケードRNP複合体についての30個のHZGJ標的部位にわたる例示的な編集データを示す。図48は、mCas3[D452A]/EcoカスケードまたはmCas3[D452A]−Ecoカスケードのいずれかを用いる30個のHZGJ標的部位での例示的なゲノム編集データを示す。図48において、縦軸はインデルの%であり、横軸はbp単位のスペーサー間距離である。ここで、カスケード複合体の対毎に、1つのRNPを特定の標的部位に固定し、第2のRNPを異なる標的部位から上流または下流の距離範囲に方向付けた。図48において、黒丸およびそれらを結びつける黒線は、mCas3−Ecoカスケードを用いた編集に対応し、灰色の丸およびそれらを接続する灰色の線は、mCas3/Ecoカスケードを用いた編集に対応する。mCas3/Ecoカスケードを用いた編集は、大多数の部位について検出限界未満であり、一方でmCas3−Ecoカスケードを用いた編集は、検出限界未満から最大で約4%までのインデルの範囲であった。mCas3−Ecoカスケードは、ガイドRNAオフセットの範囲にわたる標的化欠失を可能にしたが、PAM−アウト立体配置の場合に最高であった。
本実施例に示されるものと本質的に同じプロトコールに従う追加的な座位からのデータは、mCas3[D452A]−EcoカスケードサンプルでカスケードRNP複合体がPAM−アウト立体配置で配向している場合に最良のゲノム編集が達成されたことを示した。検出限界を超える編集がmCas3[D452A]/Ecoカスケードを用いて238個中26個の標的部位で見られ、0.1%を超える編集が238個中1つの標的部位で見られた(すなわち、大部分の部位で検出限界未満)が、一方で、mCas3[D452A]−Ecoカスケードを用いて検出限界を超える編集が、242個中128個の標的部位で見られ、0.1%を超える編集が238個中1つの標的部位で見られた。mCas3[D452A]−Ecoカスケードは、ガイドオフセットの範囲にわたる標的化欠失を可能にし、最高は、カスケードRNP複合体がPAM−アウト立体配置の場合であった。
本実施例におけるデータは、mCas3タンパク質を含むカスケードRNP複合体を使用して、gDNAの反対鎖上に対形成ニッキングを提供することができ、したがって宿主細胞(例えば、ヒト細胞)のゲノムにおける標的化欠失を促進することを示す。
ゲノム欠失の生成のためのCas3 ATPアーゼ欠失突然変異体
Cas3タンパク質に結合するカスケードRNP複合体によって促進される欠失長を限定および/または規定するためのいくつかの方法を本出願に記載する。本実施例は、対形成していないATPアーゼ欠失突然変異型Cas3タンパク質を使用して標的化ゲノム欠失をどのように生成し;したがって、単一のカスケードRNP複合体を使用して単一部位にニッキングを提供するかを例証する。
A. 標的細胞へのトランスフェクションのためのシュードモナス属種S−6−2 Cas3バリアントおよびPseカスケードRNP複合体構成要素の産生
ヒトゲノムのTRAC座位における8つの標的(配列番号1902〜配列番号1909)にシュードモナス属種S−6−2カスケード(Pseカスケード)RNP複合体を標的化するために最小CRISPRアレイを設計した。これらの配列を表51に示す。
3つのオリゴヌクレオチド(配列番号1513〜配列番号1515)および「リピート−スペーサー−リピート−スペーサー−リピート」配列をコードするユニークなプライマーを使用して本質的に実施例25Aに記載されるようにPseカスケードRNP複合体の標的化を可能にするために、PCRベースのアセンブリーを用いて最小CRISPRアレイを生成した。この最小CRISPRアレイについて、両方のスペーサー配列は同一であった。最小CRISPRアレイを生成するためのオリゴヌクレオチド配列の全セットを表52に示す。
PCRで組み立てたガイドを、主として製造業者の説明書に従ってSPRIselect(登録商標)(Beckman Coulter、Pasadena、CA)ビーズを使用して精製し、濃縮した。
ATPアーゼ/ヘリカーゼ活性を有さず、したがってニッキング活性だけを有する、シュードモナス属種S−6−2 Cas3(PseCas3;配列番号1918)のD448A ATPアーゼ突然変異型バリアント(mPseCas3と名づける;配列番号1919)を設計して、標的化欠失を誘導した。基準点として、PseCas3のD75Aヌクレアーゼデッドバリアント(配列番号1920)(dPseCas3*と名づける)のみならず、PseCas3のATPアーゼ−ヌクレアーゼ二重突然変異型バリアント(配列番号1921)(dblmPseCas3と名づける)も生成した。各標的についてのPAM配列はAAGであった。
PseカスケードRNP複合体タンパク質構成要素をコードする遺伝子のみならず、突然変異型Psecas3遺伝子を、CMVプロモーターを含むベクターにクローニングして、哺乳動物細胞における送達および発現を可能にした。PseカスケードRNP複合体cas遺伝子を、2A「リボソームスキップ」配列を介して連結し、すべての遺伝子は、コードされるタンパク質を核に方向づけるためのN末端NLS配列を含んでいた。配列を表53に示す。
B. FokI−カスケードRNP複合体構成要素をコードするベクターのトランスフェクション
トランスフェクション条件は、本質的に実施例8Bに記載されるものに以下の改変を加えて行った。ヌクレオフェクションの前に、DNA鋳型を含有する溶液6μLを96ウェルプレートの個別のウェルに移した。その際、ウェルは、Pseカスケードタンパク質構成要素をコードするプラスミド3μg、最小CRISPRアレイをコードする直鎖状PCR産物0.2μg、およびmPseCas3、dPseCas3*、またはdblmCas3のいずれかをコードするプラスミド1μgを含んでいた。
C. トランスフェクトされた細胞からのgDNAのディープシークエンシング
ディープシークエンシングは、本質的に実施例8Cに記載されるように行った。しかし、実施例8Cの表36からのプライマーYおよびZの代わりに、TRAC1〜TRAC8標的部位のそれぞれについてフォワードおよびリバース標的特異的プライマーのみならず、MiSeq試薬キットv3、600サイクル(Illumina、San Diego、CA)を使用した。
図49は、mPseCas3、dPseCas3*、またはdblmCas3(n=2)のそれぞれに結合するPseカスケードRNP複合体を用いた8つのTRAC標的部位でのゲノム編集を示す。図49では、縦軸は編集%であり、横軸はTRAC座位における標的部位を示す。横軸に沿った棒線の順序は、mPseCas3(黒棒線)、dPseCas3*(灰色棒線)、およびdblmCas3(縞棒線)である。標的部位での編集は、dPseCas3*またはdblmPseCas3 PseカスケードRNP複合体でまれに観察されたが、mPseCas3 PseカスケードRNP複合体を用いて標的部位での欠失によって検出する場合、最大で約7%のゲノム編集に達した。これらのデータは、ATPアーゼ/ヘリカーゼ活性を有さず、したがってニッキング活性だけを有するmPseCas3タンパク質を単一の標的でのPseカスケードRNP複合体に使用して(すなわち、対形成ニッキング立体配置ではない)、予想される切断部位に欠失を生成することができることを示している。
当業者に明らかなように、本発明の精神および範囲から逸脱せずに上記実施形態の様々な改変および変形を行うことができる。そのような改変および変形は、本発明の範囲内である。