CN111801417A - 新的rna-可编程的内切核酸酶系统及其在基因组编辑和其他应用中的用途 - Google Patents

新的rna-可编程的内切核酸酶系统及其在基因组编辑和其他应用中的用途 Download PDF

Info

Publication number
CN111801417A
CN111801417A CN201880089098.9A CN201880089098A CN111801417A CN 111801417 A CN111801417 A CN 111801417A CN 201880089098 A CN201880089098 A CN 201880089098A CN 111801417 A CN111801417 A CN 111801417A
Authority
CN
China
Prior art keywords
sequence
slucas9
polypeptide
rna
dna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201880089098.9A
Other languages
English (en)
Inventor
A·科宁
M·施米德特
W·科科
A·古普塔
J·特贝
C·舒伦伯格
C·皮茨勒
M·B·贾马林达
S·贾赫
F·里希特
A·阿鲁穆罕
C·萨尔维希特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CRISPR Therapeutics AG
Casebia Therapeutics LLP
Bayer Healthcare LLC
Original Assignee
CRISPR Therapeutics AG
Bayer Healthcare LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CRISPR Therapeutics AG, Bayer Healthcare LLC filed Critical CRISPR Therapeutics AG
Publication of CN111801417A publication Critical patent/CN111801417A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Medicinal Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本发明的各方面除了别的以外涉及用于靶向、编辑或操纵细胞中DNA的新的系统,其包含一种或多种编码来自路邓葡萄球菌的SluCas9核酸酶或其变体和一种或多种指导RNAs(gRNAs)或SluCas9核酸酶或其变体和一种或多种gRNAs的异源载体。

Description

新的RNA-可编程的内切核酸酶系统及其在基因组编辑和其他 应用中的用途
与相关申请的相互参照
本申请要求于2017年12月14日提交的欧洲专利申请No.17207294.4的优先权,其内容整体引入本文作为参考,包括任何附图。
领域
本公开内容总的来说涉及分子生物学领域,包括组合物和方法,其涉及包括RNA-可编程的内切核酸酶、相关的指导RNAs和/或靶序列的新的系统,以及在各种应用中生产和使用其的方法,包括调节转录的方法,以及在细胞中靶向、编辑和/或操纵DNA的方法。
背景
内切核酸酶如锌指内切核酸酶(ZFNs)、转录激活因子样效应物核酸酶(TALENs)和核糖核酸酶已被作为位点特异性核酸酶用于基因组靶向、基因组编辑、基因沉默、转录调节、促进重组和其他分子生物学技术。CRISPR-Cas系统提供了新的核酸酶和内切核酸酶的来源,包括CRISPR-Cas9。
已在过去几年中广泛利用使用CRISPR(成簇的规律间隔的短回文重复序列(Clustered Regularly lnterspaced Short Palindromic Repeats))-Cas((CRISPR相关蛋白)的RNA-指导的DNA靶向原理编辑基因组,如WO2013/176722中所述的。以前已经描述了三种类型的CRISPR-Cas系统(类型I、类型II和IIb以及类型III),且最近鉴定了第四种(类型V)。CRISPR-Cas用于基因组编辑的大多数用途以前借助类型II系统。由细菌类型IICRISPR-Cas系统提供的主要优点在于对可编程的DNA干扰的最小限度的要求:内切核酸酶,Cas9,由可定制的双重RNA(dual-RNA)结构指导的。如最初在原始的酿脓链球菌(Streptococcus pyogenes)的类型II系统中所证明的,反式激活CRISPR RNA(tracrRNA)与前体CRISPR RNA(前crRNA(pre-crRNA))的不变重复序列结合,从而形成在有Cas9的情况下RNA酶III对RNA的共成熟和通过Cas9的侵入DNA切割两者都必不可少的双重RNA。如在酿脓链球菌中所证明的,由成熟的激活tracr RNA和靶向crRNA之间形成的双链体指导的Cas9在侵入关联DNA中引入位点特异性双链DNA(dsDNA)断裂。Cas9是多结构域酶,其使用HNH核酸酶结构域切割靶链(定义为与crRNA的间隔区序列互补),并使用RuvC-样结构域切割非靶链,从而使得能够通过选择性基序失活将dsDNA切割性Cas9转化成切口酶。DNA切割特异性由两个参数决定:靶向原间隔区(protospacer)序列的crRNA的可变的、间隔区衍生的序列(原间隔区定义为不与crRNA的间隔区互补的DNA靶上的序列)和紧接在非靶DNA链上原间隔区的3'(下游)定位的短序列,原间隔区相邻基序(Protospacer Adjacent Motif)(PAM)。
研究已证明,RNA-指导的Cas9可用作人细胞、小鼠、斑马鱼、果蝇、蠕虫、植物、酵母和细菌以及各种其他物种中的基因组编辑工具。所述系统是通用的,从而使得能够通过对Cas9进行编程以使用多种指导RNAs同时编辑基因组中的几个位点来进行多重基因组人工改造。将Cas9转化为切口酶被证明促进在诱变活性降低的情况下在哺乳动物基因组中的同源性指导的修复。此外,例如,已经利用Cas9催化失活突变体的DNA结合活性来人工改造RNA-可编程的转录沉默和激活设备或外遗传修饰因子(epigenetic modifiers)。
本发明提供了来自路邓葡萄球菌(Staphylococcus lugdunensis)的CRISPR-Cas9家族的新的CRISPR-Cas内切核酸酶(SluCas9)及其变体,其具有与已知的CRISPR-Cas内切核酸酶不同和有利的特征和功能性,并因而提供了以前不存在的用于基因组编辑的进一步的机会。本发明进一步提供了供原核、真核和体外环境之用的合适的PAM序列和合适的指导RNAs(gRNAs),例如单一指导-RNAs(sgRNAs)。
现有的CRISPR-Cas 9系统具有一个或多个以下缺点:
a)它们的大小太大,以致于无法携带到确立的治疗上合适的病毒转染系统(如腺伴随病毒(AAVs))的基因组内。
b)它们在非宿主环境中的活性通常对于在这些环境中使用来说太低了,例如对于在真核生物且特别在哺乳动物环境中有效使用来说太低了。
c)它们的核酸酶作用缺乏保真度,从而导致不想要的脱靶(off target)效应,这将例如使它们不适合于基因治疗用途或需要高精度的其他应用。
d)它们可能触发免疫应答,这可限制其在哺乳动物体内应用的用途。
e)它们要求复杂和/或长的PAMs,这限制了对于DNA靶向区段的靶选择。
本文提供的新的SluCas9 CRISPR-Cas系统表现出比起现有的CRISPR-Cas系统来有利的特征。在一些实施方案中,SluCas9 CRISPR-Cas系统在原核、真核和/或体外环境中表现出更高的活性,和/或Cas内切核酸酶在真核环境(如例如,人宿主细胞)中自核酸的更高表达。
概述
这个部分提供了本公开内容的总的概述,而不包含其全部范围或所有其特征。
在一些实施方案中,本文提供了组合物和方法,其涉及包括RNA-可编程的内切核酸酶、相关的指导RNAs和/或靶序列的新的系统,以及在各种应用中生产和使用其的方法,包括调节转录的方法,以及使用这种核酸和/或多肽靶向、编辑和/或操纵DNA的方法。本公开内容的一些实施方案还涉及包含本文公开的一种或多种系统元件的重组细胞和试剂盒。
在一方面,本文提供了一种组合物,其包含(a)根据SEQ ID NO:2的SluCas9多肽或其以下变体:(I)在其全长或从SEQ ID NO:2的位置789到位置1053上与根据SEQ ID NO:2的序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少99%或100%氨基酸同一性的变体;(II)根据(I)的变体,其含有额外的组分,如例如,核定位信号,以获取包含SluCas9多肽的SluCas9 CRISPR系统在无细胞反应或在原核细胞中以及在真核细胞环境中(例如,在活的植物或动物中)的活性,例如根据SEQ ID NO:3的多核苷酸序列;(III)编码SluCas9以及根据(I)和(II)的变体的相应多核苷酸序列的密码子优化的变体,例如SEQ IDNO:3从位置61至位置3225的多核苷酸序列和根据SEQ ID NO:44和45的多核苷酸序列;或(IV)根据(I)至(III)中任一项的变体,其进一步包含i.导致具有与不具有一种或多种修饰或突变的相应SluCas9(例如,包含SEQ ID NO:2的氨基酸序列的SluCas9)相比显著降低的核酸酶活性或不可检测的核酸酶活性的SluCas9的一种或多种修饰或突变,例如一种或多种氨基酸取代(例如,丙氨酸取代),其中相对于SEQ ID NO:2,取代是在位置10 (例如,D10A)、位置559(例如,H559A)和/或位置582(例如N582A);和/或ii.具有核碱基(nucleobase)编辑活性或脱氨酶活性的C-或N-末端附着的多肽,例如,经由接头肽序列附着的;和(b)一种或多种单一异源指导RNA(sgRNA)或编码所述一种或多种sgRNA的核酸(例如,DNA),每种sgRNA包含:(I)包含RNA并且能够与多核苷酸基因座中的靶序列杂交的DNA-靶向区段,(II)包含RNA的tracr配对物序列,和(III)包含RNA的tracr RNA序列,其中所述tracr配对物序列能够与所述tracr序列杂交,且其中(I)、(II)和(III)以5'至3'的取向排列。
在一些实施方案中,(a)的SluCas9多肽包含与SEQ ID NO:2的从位置789到位置1053(连端点在内)的氨基酸序列具有至少75%氨基酸同一性的氨基酸的邻接序列(例如,265个氨基酸的邻接序列)。
在一些实施方案中,(a)的SluCas9多肽包含与SEQ ID NO:2的从位置789到位置1053(连端点在内)的氨基酸序列具有至少90%氨基酸同一性的氨基酸的邻接序列(例如,265个氨基酸的邻接序列)。
在一些实施方案中,DNA-靶向区段的长度为18个核苷酸至22个核苷酸,并且与靶序列互补的多核苷酸基因座中的原间隔区序列在其3'末端正好与对于(a)的SluCas9多肽合适的PAM序列相邻,或这种PAM序列是DNA-靶向区段的3'部分的一部分。
在一些实施方案中,与靶序列互补的多核苷酸基因座中的原间隔区序列在其3'末端正好与PAM序列“NNGG”相邻,或这种PAM序列是DNA-靶向区段的3'部分的一部分。
在另一方面,本文提供了在细胞(例如,体外或体内)或无细胞系统中一个或多个位置处靶向、编辑、修饰或操纵靶DNA的方法,包括:(a)向所述细胞或无细胞系统中引入异源SluCas9多肽或显示与SEQ ID NO:2至少75%的同一性的多肽或编码其的核酸;和(b)引入一种或多种单一异源指导RNA(sgRNA)或编码所述一种或多种sgRNA的核酸(例如,DNA),每种sgRNA包含:(I)包含RNA并且能够与多核苷酸基因座中的靶序列杂交的DNA-靶向区段,(II)包含RNA的tracr配对物序列,和(III)包含RNA的tracr RNA序列,其中所述tracr配对物序列能够与所述tracr序列杂交,且其中(I)、(II)和(III)以5'至3'的取向排列;和(c)在靶DNA中产生一个或多个切口或切割或碱基编辑,其中所述SluCas9多肽通过其加工的或未加工的形式的sgRNA被指导至所述靶DNA。
在另一方面,本文提供了包含下述的组合物用于在细胞(例如,体外或体内)或无细胞系统中一个或多个位置处靶向、编辑、修饰或操纵靶DNA的用途:(a)SluCas9多肽或显示与SEQ ID NO:2至少75%的同一性的多肽,或编码其的核酸;和/或(b)一种或多种单一异源指导RNA(sgRNA)或编码所述一种或多种sgRNA的核酸(例如,DNA),每种sgRNA包含:(I)包含RNA并且能够与多核苷酸基因座中的靶序列杂交的DNA-靶向区段,(II)包含RNA的tracr配对物序列,和(III)包含RNA的tracr RNA序列,其中所述tracr配对物序列能够与所述tracr序列杂交,且其中(I)、(II)和(III)以5'至3'的取向排列。
在另一方面,本文提供了一种细胞,其包含(a)SluCas9多肽或显示与SEQ ID NO:2至少75%的同一性的多肽,或编码其的核酸;和(b)一种或多种单一异源指导RNA(sgRNA)或编码所述一种或多种sgRNA的核酸(例如,DNA),每种sgRNA包含:(I)包含RNA并且能够与多核苷酸基因座中的靶序列杂交的DNA-靶向区段,(II)包含RNA的tracr配对物序列,和(III)包含RNA的tracr RNA序列,其中所述tracr配对物序列能够与所述tracr序列杂交,且其中(I)、(II)和(III)以5'至3'的取向排列。
在另一方面,本文提供了一种试剂盒,其包括(a)编码SluCas9或显示与SEQ IDNO:2至少75%的同一性的多肽的核酸序列,其中所述编码这种SluCas9的核酸序列可操作地连接至启动子;(b)一种或多种单一异源指导RNA(sgRNA)或编码所述一种或多种sgRNA的核酸(例如,DNA),每种sgRNA包含:(I)包含RNA并且能够与多核苷酸基因座中的靶序列杂交的DNA-靶向区段,(II)包含RNA的tracr配对物序列,和(III)包含RNA的tracr RNA序列,其中所述tracr配对物序列能够与所述tracr序列杂交,且其中(I)、(II)和(III)以5'至3'的取向排列。
前述概述仅是举例说明性的,而不是用来以任何方式进行限制的。除了本文描述的举例说明性实施方案和特征之外,本公开内容的进一步的方面、实施方案、目的和特征根据附图和详述和权利要求将变得完全显而易见。
附图简述
图1A显示了N7-PAM文库的示意图。
图1B显示了通过SluCas9切割N7-PAM文库的结果,如通过用N7-PAM文库(pML2070)转化的BL21DE3细胞或对照BL21DE3细胞的缺失(depletion)测定所评估的。特定碱基的字符大小指的是这种位置的活性。
图1C显示了通过SluCas9体外切割N7-PAM文库的结果,如通过切割的片段的下一代测序(next generation sequencing)所评估的。特定碱基的字符大小指的是这种位置的活性。
图2A显示了通过SluCas9切割包含SluCas9 PAM的荧光标记的寡核苷酸(ODNs)的示意图(上图),以及如通过切割测定所鉴定的包含SluCas9 PAM的ODN以及包含具有在位置1用C取代A的SluCas9 PAM的ODN的切割动力学的结果(下图)。
图2B显示了通过SluCas9体外切割带有不同PAM基序的长度约1000 bp的PCR产物的结果。显示了存在RNP溶液(“+”)或不存在RNP溶液(“-”)的情况下的不同PAM序列。显示琼脂糖凝胶分离的图片右侧的箭标指示通过相应反应获得的产物。
图3A-3C显示通过细胞存活“活-死”测定对SluCas9的NNGG PAM基序的证实。图3A显示了平板形式的“活-死”测定的示意图。图3B显示了液体培养物形式的“活-死”测定的示意图。图3C显示了以液体培养物形式进行的“活-死”测定的结果。
图4A-4C显示了如通过BFP破坏所评估的在哺乳动物细胞中的SluCas9活性。图4A显示了HEK293T细胞中BFP的正向链序列。以浅灰色描绘了2种不同BFP指导的PAM区域。图4B显示了靶向BFP的2种不同指导的序列(各20nt)和第二指导的更长形式,后面是对于这些的7个核苷酸长的PAM序列。图4C显示了FACS分析的定量,其显示了依赖于指导的BFP信号的丧失。不靶向BFP的指导(靶向HBB基因,序列在下文)用于阴性对照。
图5A-5C显示通过ddPCR和T7E1测定检测哺乳动物细胞中的SluCas9活性。图5A显示了在HEK细胞中靶向HBB基因的DNA-靶向区段。图5B显示了HBB基因座的ddPCR分析的定量,所述HBB基因座显示了依赖于指导的编辑。图5C显示了使用T7E1内切核酸酶进行的插入/缺失依赖性DNA切割的琼脂糖凝胶分析。切割的产物由右侧的箭标指示。
图6显示了确定用于在哺乳动物细胞中编辑的最佳SluCas9指导RNA长度的结果。左图:BFP反向链序列的一部分和各种在HEK细胞中靶向BFP基因的DNA-靶向区段(13-25个核苷酸)。右图:FACS分析的定量,显示了依赖于指导的BFP信号丧失。将不靶向BFP的指导(靶向HBB基因,GG + 18nt,BFP20nt_1,SEQ ID NO:15)用作阴性对照。
图7A-7C显示了在BFP破坏测定中SluCas9密码子优化的表征。将BFP报道细胞系用(1)携带由CBh启动子驱动的a)来自SEQ ID NO:3的SluCas9-编码多核苷酸序列(原始Slu)、b)SEQ ID NO:44的多核苷酸序列(ATUM)或c)SEQ ID NO:45的多核苷酸序列(GeneArt)并编码靶向BFP的T2或T3 gRNA的质粒,和(2)编码DsRed2的质粒共转染。SluCas9-编码序列通过编码自切割肽T2A的序列与GFP-编码序列连接,从而允许SluCas9和GFP从单个mRNA进行翻译。DsRed2表达充当转染标记。图7A显示了共转染后2天表达GFP和RFP的细胞的百分比。图7B显示了共转染后2天的SluCas9表达。使用β-肌动蛋白表达作为内部对照,并显示了每种条件的SluCas9信号与β-肌动蛋白信号之比(Cas9/β-肌动蛋白)。图7C显示了共转染后5天BFP-细胞的百分比。
发明详述
大多数现有的类型II CRISPR Cas系统都基于来自酿脓链球菌的酶,其具有对于包装入病毒载体如AAV来说太大的特殊缺点(1638个氨基酸)。存在备择的基于来自金黄色葡萄球菌(Staphylococcus aureus)的核酸酶的类型II CRISPR Cas系统(EP 2 898 075),其大小显著较小。然而,这种核酸酶需要相当复杂的PAM,这极大地限制了其用于基因编辑应用的可用性。
提供了一种用于靶向、编辑或操纵细胞中DNA的新的系统,其包含一种或多种异源载体,所述一种或多种异源载体编码来自路邓葡萄球菌的类型II CRISPR-Cas核酸酶(SluCas9),这种核酸酶的变体,以及一种或多种指导RNAs(gRNAs),例如一种或多种单一指导RNAs(sgRNAs),或SluCas9核酸酶和一种或多种gRNAs。
在下面的详述中,参考构成其一部分的附图。在附图中,除非上下文另外指出,否则相似的符号一般标识相似的组分。在详述、附图和权利要求中描述的举例说明性备择方案不是用来进行限制的。在不背离此处呈现的主题的精神或范围的情况下,可以使用其他备择方案,并且可以进行其他改变。将容易理解的是,可以以各式各样的不同配置来布置、取代、组合和设计如本文一般地描述的以及在附图中举例说明的各方面,所有这些都被明确地预期并且构成本申请的一部分。
除非另有定义,否则本文中使用的所有技术术语、符号和其他科学术语或专门名词意图具有本申请所属领域的技术人员通常理解的含义。在一些情况下,为了清楚和/或易于参考,在本文定义了具有通常理解的含义的术语,并且在本文中包括这种定义不一定应该被解释为表示比起本领域所通常理解的来的相当大区别。本领域技术人员使用常规方法很好地理解并通常采用本文描述或参考的许多技术和程序。
本文公开的SluCas9基因编辑系统包括仅需要“简单” PAM序列的小的(例如,1053个氨基酸)高活性核酸酶。
根据路邓葡萄球菌的全基因组测序,存在关于可读框的注释,所述可读框可能编码CRISPR Cas核酸酶:gi|488391463|ref|WP_002460848.1|假设蛋白[路邓葡萄球菌];A0A133QCR3; A0A133QCR3_STALU(SEQ ID NO:1,编码SEQ ID NO:35的氨基酸序列)。
然而,不存在关于这个可读框是否被表达,或者如果被表达的话,编码的蛋白是否可能是功能性核酸酶的证据。进一步地,申请人不知道关于将其转化为功能性CRISPR-Cas基因编辑工具所必需的额外的(和必不可少的)组分(例如,PAM和gRNA)的任何教导。
除了根据SEQ ID NO:2的SluCas9酶的新变体(与在SEQ ID NO:35中该位置的丝氨酸相比,在位置737具有苏氨酸)之外,本文特别公开了包含编码SluCas9(SEQ ID NO:2)的密码子优化的多核苷酸序列的核酸。
提供了SluCas9多肽的多核苷酸(SEQ ID NO:1)和氨基酸序列(SEQ ID NO:2或35)及其以下变体:
(I)在其全长或从SEQ ID NO:2的位置789到位置1053上与根据SEQ ID NO:2的序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少99%或100%氨基酸同一性的变体;
(II)根据(I)的变体,其含有额外的组分,如例如,核定位信号,以获取包含SluCas9多肽的SluCas9 CRISPR系统在无细胞反应或在原核细胞中以及在真核细胞环境中(例如,在活的植物或动物中)的活性,例如根据SEQ ID NO:3的多核苷酸序列;
(III)编码SluCas9以及根据(I)和(II)的变体的相应多核苷酸序列的密码子优化的变体,例如SEQ ID NO:3从位置61至位置3225的多核苷酸序列和根据SEQ ID NO:44和45的多核苷酸序列;和
(IV)根据(I)至(III)中任一项的变体,其进一步包含
(a)导致具有与不具有一种或多种修饰或突变的相应SluCas9(例如,包含SEQ ID NO:2的氨基酸序列的SluCas9)相比显著降低的核酸酶活性或不可检测的核酸酶活性的SluCas9的一种或多种修饰或突变,例如一种或多种氨基酸取代(例如,丙氨酸取代),其中相对于SEQ ID NO:2,取代是在位置10 (例如,D10A)、位置559(例如,H559A)和/或位置582(例如N582A);和/或
(b)具有核碱基编辑活性或脱氨酶活性的C-或N-末端附着的多肽,例如,经由接头肽序列附着的。
在(IV)(a)项下的合适多肽及其与在(I)、(II)、(III)项下的SluCas9的C-末端结构域的附着描述于例如WO2017/070632,Gaudelli等人, Nature 551(2017年11月23日),464-471;Komor等人, Sci. Adv. 2017; 3eaao4774;Kim等人, Nature Biotechnol. 2017年4月; 35(4) 371-376;Komor等人, Nature 533(7603); 420-424。
在(IV)项下的SluCas9变体可以允许任何碱基对转化为任何可能的其他碱基对,而不是在靶DNA序列中引入双链断裂。非限制性实例包括脱氨酶活性,其可以作用于胞嘧啶、鸟嘌呤或腺嘌呤碱基,以及它们后来在细胞内的修复,以分别产生鸟嘌呤、胸腺嘧啶和鸟嘌呤。
如果没有另外说明,那么术语SluCas9包含根据SEQ ID NO:2、4或35的蛋白质序列,以及在(I)、(II)、(III)和(IV)项下指定的所有变体。
例如在酶促活性的上下文中使用的“显著降低”是指这种酶促活性低于参考蛋白(例如, SEQ ID NO:2)的活性的10%,例如低于这种参考酶促活性的5%、低于2%、低于1%或低于0.1%。
提供了显示与SEQ ID NO:2的至少75%氨基酸同一性、至少80%氨基酸同一性、至少85%氨基酸同一性、至少90%氨基酸同一性、至少95%氨基酸同一性、至少99%氨基酸同一性或100%氨基酸同一性的SluCas9多肽。
还提供了SluCas9多肽,其包含与SEQ ID NO:2的从位置789到位置1053(连端点在内)的氨基酸序列具有至少75%氨基酸同一性、至少80%氨基酸同一性、至少85%氨基酸同一性、至少90%氨基酸同一性、至少95%氨基酸同一性、至少99%氨基酸同一性或100%氨基酸同一性的氨基酸的邻接序列(例如,265个氨基酸的邻接序列)。
进一步地,提供了SluCas9多肽,其显示与SEQ ID NO:2或在核酸水平上与编码其的核酸序列的至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或99.9%的序列同一性。
此外,进一步提供了SluCas9多肽,其包含与SEQ ID NO:2的从位置789到位置1053(连端点在内)的氨基酸序列或在核酸水平上与编码其的核酸序列具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或99.9%的序列同一性的氨基酸的邻接序列(例如,265个氨基酸的邻接序列)。
提供了SluCas9多肽,其包含根据SEQ ID NOs:2、4和35中任一项的氨基酸序列,以及编码其的任何DNA序列。
还提供了SluCas9多肽,其包含根据SEQ ID NO:2的氨基酸序列,以及相应的DNA序列,包括从SEQ ID NO:3的位置61至3225的多核苷酸序列和根据SEQ ID NO:44和45的多核苷酸序列。
基于SluCas9的CRISPR-Cas系统
根据本发明的一个实施方案是包含下述的组合物:
(a)SluCas9多肽或编码这种SluCas9的多核苷酸;
(b)单一异源指导RNA(sgRNA)或允许原位产生这种sgRNA的核酸(例如,DNA)(例如,编码所述sgRNA的核酸),其中所述sgRNA包含:
i. 包含RNA并且能够与多核苷酸基因座中的靶序列杂交的DNA-靶向区段,
ii. 包含RNA的tracr配对物序列,和
iii. 包含RNA的tracr RNA序列,
其中所述tracr配对物序列能够与所述tracr序列杂交,且其中(i)、(ii)和(iii)以5'至3'的取向排列。
在sgRNA内,tracr配对物序列和tracr序列通常通过合适的环序列连接并形成茎-环结构。
进一步地,在一些实施方案中,编码SluCas9的多核苷酸和sgRNAs含有用于在细胞或体外环境中表达的合适的启动子和/或合适的核定位信号。
根据本发明的另一个实施方案是在细胞中或体外的一个或多个位置处靶向、编辑、修饰或操纵靶DNA的方法,包括:
(a)将异源SluCas9多肽或编码相同蛋白的核酸引入细胞或体外环境中;和
(b)引入单一异源指导RNA(sgRNA)或适合于原位产生这种sgRNA的核酸(例如,DNA)(例如,编码所述sgRNA的核酸),其中所述sgRNA包含:
i. 包含RNA并且能够与多核苷酸基因座中的靶序列杂交的DNA-靶向区段,
ii. 包含RNA的tracr配对物序列,和
iii. 包含RNA的tracr RNA序列,
其中所述tracr配对物序列能够与所述tracr序列杂交,且其中(i)、(ii)和(iii)以5'至3'的取向排列;
(c)在所述靶DNA中产生一个或多个切割、切口或编辑,其中所述SluCas9多肽通过其加工的或未加工的形式的gRNA被指导至所述靶DNA。
根据本发明的另一个实施方案是包含下述的组合物用于在细胞(例如,体外或体内)或无细胞系统中一个或多个位置处靶向、编辑、修饰或操纵靶DNA的用途:
(a)SluCas9多肽或编码这种SluCas9的多核苷酸;
(b)单一异源指导RNA(sgRNA)或适合于原位产生这种sgRNA的核酸(例如,DNA)(例如,编码所述sgRNA的核酸),其中所述sgRNA包含:
i. 包含RNA并且能够与多核苷酸基因座中的这种靶序列杂交的DNA-靶向区段,
ii. 包含RNA的tracr配对物序列,和
iii. 包含RNA的tracr RNA序列,
其中所述tracr配对物序列能够与所述tracr序列杂交,且其中(i)、(ii)和(iii)以5'至3'的取向排列。
根据本发明的另一个实施方案是先体外后体内或体外细胞,其包含:
(a)异源SluCas9多肽或编码其的核酸;
(b)单一异源指导RNA(sgRNA)或适合于原位产生这种sgRNA的核酸(例如,DNA)(例如,编码所述sgRNA的核酸),其中所述sgRNA包含:
i. 包含RNA并且能够与多核苷酸基因座中的这种靶序列杂交的DNA-靶向区段,
ii. 包含RNA的tracr配对物序列,和
iii. 包含RNA的tracr RNA序列,
其中所述tracr配对物序列能够与所述tracr序列杂交,且其中(i)、(ii)和(iii)以5'至3'的取向排列;
或已使用上述(a)和(b)对其基因组进行靶向、编辑、修饰或操纵的这种细胞。
根据本发明的额外的实施方案是试剂盒,其包括:
(a)编码SluCas9的核酸序列,其中所述编码SluCas9的核酸序列可操作地连接至启动子或核糖体结合位点;
(b)单一异源指导RNA(sgRNA)或适合于原位产生这种sgRNA的核酸(例如,DNA)(例如,编码所述sgRNA的核酸),其中所述sgRNA包含:
i. 包含RNA并且能够与多核苷酸基因座中的这种靶序列杂交的DNA-靶向区段,
ii. 包含RNA的tracr配对物序列,和
iii. 包含RNA的tracr RNA序列,
其中所述tracr配对物序列能够与所述tracr序列杂交,且其中(i)、(ii)和(iii)以5'至3'的取向排列。
(a)SluCas9蛋白;
(b)一种或多种单一异源指导RNAs(sgRNAs),其每一种都包含:
iv. 包含RNA并且能够与多核苷酸基因座中的这种靶序列杂交的DNA-靶向区段,
v. 包含RNA的tracr配对物序列,和
vi. 包含RNA的tracr RNA序列,
其中所述tracr配对物序列能够与所述tracr序列杂交,且其中(iv)、(v)和(vi)以5'至3'的取向排列。
根据本发明的再另一个实施方案包含用于在细胞(例如,体外或体内)或无细胞系统中一个或多个位置处靶向、编辑、修饰或操纵一种或多种靶DNA的组合物和方法,其包含:
(a)SluCas9
(b)指导RNA(gRNA)或适合于原位产生这种gRNA的核酸(例如,DNA)(例如,编码所述gRNA的核酸),其中所述gRNA包含:
i. 包含RNA并且能够与多核苷酸基因座中的这种靶序列杂交的DNA-靶向区段,
ii. 包含RNA的tracr RNA序列;
其中(i)和(ii)在单个RNA分子上,且(iii)在单独的RNA分子上。
突变体
在一些实施方案中,SluCas9多肽是具有改变的SluCas9内切核糖核酸酶活性或前crRNA、中间crRNA或成熟crRNA的相关半衰期的突变多肽。在一些实施方案中,SluCas9多肽是在没有相当大地减少或增强的内切核糖核酸酶活性或对DNA的结合亲和力的情况下的具有改变的或取消的DNA内切核酸酶活性的突变多肽。这种修饰可便于为了转录调节、激活或阻抑起见的SluCas9的序列特异性DNA靶向;通过甲基化作用、脱甲基作用、乙酰化作用或脱乙酰作用的外遗传修饰或染色质修饰,或本领域已知的DNA结合和/或DNA修饰蛋白的任何其他修饰。
在一些实施方案中,SluCas9多肽是不具有DNA内切核酸酶活性的突变多肽。
在一些实施方案中,细胞是细菌细胞、真菌细胞、古细菌细胞、原生生物、植物细胞或动物细胞。
在一些实施方案中,通过编码多肽和核酸的相同或不同重组载体将SluCas9多肽和一种或多种指导RNAs(gRNAs)如单一异源指导RNA(s)(sgRNA(s))引入细胞中。
在一些实施方案中,编码多肽、核酸或多肽和核酸两者的核酸被修饰。
在一些实施方案中,方法或系统进一步包括添加供体DNA序列,并且其中靶DNA序列通过同源性指导的修复进行编辑。在一些实施方案中,多核苷酸供体模板与crRNA或指导RNA物理连接。
在另一方面,本文提供了用于在不具有对单链RNA(ssRNA)、双链RNA(dsRNA)或RNA和DNA的异源双链体的活性的情况下修饰或编辑双链DNA或单链靶DNA的方法。
多重化
在另一方面,本文提供了一种用于在细胞中多个位置处编辑或修饰DNA的方法,其基本上由下述组成:i)将SluCas9多肽或编码SluCas9多肽的核酸引入细胞;和ii)将包含两种或更多种作为RNA或编码为DNA并在一个启动子控制下的前CRISPR RNAs(前crRNAs)的单一异源核酸引入细胞,每种前crRNA包含重复序列间隔区阵列或重复序列间隔区,其中所述间隔区包含与DNA中靶序列互补的核酸序列,且所述重复序列包含茎-环结构,其中所述SluCas9多肽在茎-环结构上游切割所述两种或更多种前crRNAs,以产生两种或更多种中间crRNAs,其中所述两种或更多种中间crRNAs被加工为两种或更多种成熟crRNAs,并且其中两种或更多种成熟crRNAs的每一种指导所述SluCas9多肽使得向DNA中产生两个或更多个双链断裂(DSBs)。例如,SluCas9的一个优点是可能仅引入一种包含几种重复序列间隔区单位的前crRNA,其在引入时,由SluCas9加工成靶向DNA上几种不同序列的活性重复序列间隔区单位。
在一些实施方案中,单一异源核酸中的前crRNA序列在特定的位置、取向、顺序或以特定的化学键连接在一起,以在由不同的crRNA序列所指定的每个位点指导或有差异地调节SluCas9的内切核酸酶活性。
在另一方面,本文提供了用于在细胞中多个位置处编辑或修饰DNA的结构或功能的总的方法的实例,其基本上由下述组成:i)将RNA-指导的内切核酸酶如SluCas9作为多肽或编码所述RNA-指导的内切核酸酶的核酸引入细胞;和ii)引入包含或编码两种或更多种作为RNA或编码为DNA并在一个或多个启动子控制下的指导RNAs的单一异源核酸,其中所述RNA-指导的内切核酸酶的活性或功能由所述单一异源核酸中的指导RNA序列指导。
SluCas9的密码子优化的DNA序列
在方法的一些实施方案中,编码SluCas9多肽的核酸序列是修饰的核酸,例如密码子优化的。在方法的一些实施方案中,单一异源核酸是修饰的核酸。在方法的一些实施方案中,方法进一步包括将多核苷酸供体模板引入细胞中。在一些实施方案中,多核苷酸供体模板与crRNA或指导RNA物理连接。在方法的一些实施方案中,通过同源性指导的修复、非同源末端连接或微同源性介导的末端连接(microhomology-mediated end joining)在DSBs处修复DNA。
在方法的一些实施方案中,SluCas9多肽更容易与局部环境中的成熟crRNA复合,且因此由于crRNA被相同SluCas9多肽自局部环境中的前crRNA加工,所以更易于用于指导DNA内切核酸酶活性。
在方法的一些实施方案中,SluCas9多肽用于从修饰的前crRNA寡核苷酸序列中切割、分离或纯化一种或多种成熟crRNA序列,在所述修饰的前crRNA寡核苷酸序列中,异源序列以5'或3'并入RNA寡核苷酸或DNA表达构建体中的一种或多种crRNA序列。可并入异源序列以修饰稳定性、半衰期、表达水平或时间控制、与SluCas9多肽或靶DNA序列的相互作用或本领域已知的任何其他物理或生化特征。
在方法的一些实施方案中,对前crRNA序列进行修饰以提供对前crRNA序列内两种或更多种成熟crRNA序列的有差异的调节,以有差异地修饰稳定性、半衰期、表达水平或时间控制、与SluCas9多肽或靶DNA序列的相互作用或本领域已知的任何其他物理或生化特征。
在一些实施方案中,对SluCas9多肽(或其核酸编码的变体)进行修饰以改善所期望的特征,例如功能、活性、动力学、半衰期等。这种修饰的一个这种非限制性实例是用来自不同核酸酶的同源或异源切割结构域(例如来自类型II CRISPR-相关核酸酶Cas9的RuvC或HNH结构域)置换SluCas9的‘切割结构域’。
在一方面,本文提供了用于靶向、编辑或操纵细胞中DNA的方法,包括将完整或部分或完全缺陷的SluCas9多肽或前crRNA或crRNA部分连接至二聚体FOK1核酸酶,以在通过一种或多种crRNA分子指导到一个或多个特定DNA靶位点时指导内切核酸酶切割。在另一个实施方案中,FOK1核酸酶系统是切口酶或温度敏感突变体或本领域已知的任何其他变体。
在一些实施方案中,将与二聚体FOK1核酸酶连接的SluCas9多肽与进入细胞的包含两种或更多种作为RNA或编码为DNA并在一个启动子控制下的前CRISPR RNAs(前crRNAs)的单一异源核酸一起引入细胞,每种前crRNA包含重复序列间隔区阵列,其中所述间隔区包含与DNA中靶序列互补的核酸序列,且所述重复序列包含茎-环结构,其中所述SluCas9多肽在茎-环结构上游切割所述两种或更多种前crRNAs,以产生两种或更多种中间crRNAs。
在一方面,本文提供了用于靶向、编辑或操纵细胞中DNA的方法,包括将完整或部分或完全缺陷的SluCas9多肽或前crRNA、中间crRNA、成熟crRNA部分或gRNA(统称为crRNA)与供体单链或双链DNA供体模板连接,以在通过一种或多种指导RNA或crRNA分子指导到一个或多个特定DNA靶位点时促进外源DNA序列的同源重组。
在再另一方面,本文提供了用于将DNA模板为了进行同源重组或同源性指导的修复指导至基因编辑的特定位点的方法。在这方面,单链或双链DNA模板用化学方法或通过本领域已知的其他方式连接至crRNA或指导RNA。在一些实施方案中,DNA模板保持与crRNA或指导RNA连接;在再其他实例中,SluCas9切割crRNA或指导RNA,从而释放DNA模板以使得能够或促进同源重组。
在再另一方面,本文提供了用于靶向、编辑或操纵细胞中DNA的方法,包括将完整或部分或完全缺陷的SluCas9多肽或前crRNA或crRNA部分连接至转录激活因子或阻遏蛋白,或外遗传修饰因子,例如甲基化酶、脱甲基酶、乙酰基转移酶或脱乙酰酶,或信号传导或检测,在通过一种或多种crRNA分子指导到一个或多个特定DNA靶位点时,其所有方面以前已关于Cas9系统进行了描述。
在另一方面,本文提供了组合物,其包含连接至crRNA或指导RNA的多核苷酸供体模板。一种靶向、编辑或操纵细胞中DNA的方法,包括将前crRNA或crRNA或指导RNA连接至供体单链或双链多核苷酸供体模板,以使供体模板通过SluCas9多肽从前crRNA或crRNA或指导RNA上切割下来,从而在通过一种或多种指导RNA或crRNA分子指导到一个或多个特定DNA靶位点时促进通过供体模板的同源性指导的修复。
SluCas9也可用于形成嵌合结合蛋白,其中引入了其他结构域和活性。作为举例说明,Fokl结构域可以与SluCas9蛋白融合,其可以含有催化活性的内切核酸酶结构域,或者Fokl结构域可以与SluCas9蛋白融合,其已经被修饰以使SluCas9内切核酸酶结构域无活性。可以与SluCas9融合以制备嵌合蛋白的其他结构域包括转录调节剂、外遗传修饰因子、标签和其他标记或成像剂、组蛋白和/或调节或修饰基因序列的结构或活性的本领域中已知的其他形态。
基于序列,并参考SluCas9与crRNA形式的发夹结构结合的结构特异性,可以基于与本系统的序列相似性来鉴定和表征SluCas9直向同源物,如已经例如用类型II系统描述的那样。例如,SluCas9的直向同源物[猪葡萄球菌(Staphylococcus hyicus)、Staphylococcus microti、巴氏葡萄球菌(Staphylococcus pasteuri)]。
核酸和/或氨基酸修饰
在一些实施方案中,引入细胞的多核苷酸包含一种或多种修饰,其可用于例如增强活性、稳定性或特异性,改变递送,减少宿主细胞中的先天免疫应答,进一步减小蛋白大小或用于其他增强,如本文进一步描述和本领域已知。在一些实施方案中,这种修饰将结果产生SluCas9多肽,其包含与SEQ ID NO:2的序列或SEQ ID NO:4的氨基酸序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少99%或100%的氨基酸序列同一性的氨基酸序列。
在某些实施方案中,在CRISPR-Cas系统中使用修饰的多核苷酸,在这种情况下,可以修饰引入细胞中的指导RNAs和/或编码Cas内切核酸酶的DNA或RNA,如下文所述和所举例说明的。这种修饰的多核苷酸可用于CRISPR-Cas系统中以编辑任何一个或多个基因组基因座。
CRISPR-Cas系统的组分
A. 指导RNAs/sgRNAs
在本发明的方面,术语“嵌合RNA”、“嵌合指导RNA”、“指导RNA”、“单一指导RNA”和“合成指导RNA”可互换使用,并且是指包含DNA-靶向区段、tracr序列和tracr配对物序列的多核苷酸序列。术语“指导序列”或“DNA-靶向序列”是指指定靶位点的指导RNA内约20bp的序列,并且可以与术语“指导”或“间隔区”互换使用。术语“tracr配对物序列”也可以与术语“一种或多种同向重复序列”互换使用。
在一些方面,根据本发明的单一指导RNA(sgRNA)包含:
i. 包含RNA并且能够与多核苷酸基因座中的靶序列杂交的DNA-靶向区段或DNA-靶向序列,
ii. 包含RNA的tracr配对物序列,和
iii. 包含RNA的tracr RNA序列,
其中所述tracr配对物序列能够与所述tracr序列杂交,且其中(i)、(ii)和(iii)以5'至3'的取向排列。在一些实施方案中,组分(i)、(ii)和(iii)在单个嵌合RNA上。
在sgRNA内,tracr配对物序列和tracr序列可以通过合适的环序列连接并形成茎-环结构。
通常,tracr配对物序列包括与tracr序列具有足够互补性的任何序列以促进下述一种或多种:(1)在含有相应tracr序列的细胞中侧接tracr配对物序列的DNA-靶向区段的切除;和(2)在靶序列处CRISPR复合体的形成,其中所述CRISPR复合体包含与tracr序列杂交的tracr配对物序列。通常,互补性程度是以沿着两个序列中较短者的长度,tracr配对物序列和tracr序列的最佳比对为基准的。最佳比对可以通过任何合适的比对算法来确定,并且可以进一步计及二级结构,例如tracr序列或tracr配对物序列内的自身互补性。在一些实施方案中,当最佳比对时,沿着两者中较短者的30个核苷酸长度,tracr序列和tracr配对物序列之间的互补性程度为约或不止25%、30%、40%、50%、60%、70%、80%、90%、95%、97.5%、99%或更高。在一些实施方案中,tracr序列长度为约或不止5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、40、50个或更多个核苷酸。在一些实施方案中,tracr序列和tracr配对物序列包含在单个转录物中,以使两者之间的杂交产生具有二级结构的转录物,例如发夹。在本发明的实施方案中,转录物或转录的多核苷酸序列具有至少两个或更多个发夹。
在一些实施方案中,转录物具有两个、三个、四个或五个发夹。在本发明的进一步的实施方案中,转录物具有至多五个发夹。在发夹结构中,最后“N”的5'和环的上游的序列部分对应于tracr配对物序列,而环的3'的序列部分对应于tracr序列。包含DNA-靶向区段、tracr配对物序列和tracr序列的单一多核苷酸的进一步的非限制性实例如下(5'至3'地列举),其中“N”代表DNA-靶向区段的碱基,第一组小写字体字母代表tracr配对物序列,且第二组小写字体字母代表tracr序列,且最后的聚胸苷酸(poly-T)序列代表转录终止子:
指导RNA的DNA-靶向区段包含与靶DNA中的序列互补的核苷酸序列。换句话说,指导RNA的DNA-靶向区段通过杂交(即,碱基配对)以序列特异性方式与靶DNA相互作用。因此,DNA-靶向区段的核苷酸序列可以变化并确定指导RNA和靶DNA将相互作用的靶DNA内的位置。可以修饰(例如通过遗传工程)指导RNA的DNA-靶向区段,以与靶DNA内的任何所期望的序列杂交。
DNA-靶向区段可以具有10个核苷酸至30个核苷酸的长度。
在一些实施方案中,DNA-靶向区段具有13个核苷酸至25个核苷酸的长度。
在一些实施方案中,DNA-靶向区段具有15个核苷酸至23个核苷酸的长度。
在一些实施方案中,DNA-靶向区段具有18个核苷酸至22个核苷酸,例如20至22个核苷酸的长度。
DNA-靶向区段的DNA-靶向序列与靶DNA的靶序列之间的百分比互补性在20-22个核苷酸范围内可以为至少60%(例如,至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少98%、至少99%或100%)。
与靶DNA中的靶序列互补的原间隔区序列可以在其3'端与对于SluCas9的合适的PAM序列相邻,或者这种PAM序列可以是DNA-靶向区段的3'部分的一部分。
为了非限制性地举例说明这种用途起见使用CRISPR-Cas系统,可以使用指导RNAs的修饰来增强CRISPR-Cas基因组编辑复合体的形成或稳定性,所述复合体包含指导RNAs和Cas内切核酸酶,例如SluCas9。指导RNAs的修饰可以也或替换地用于增强基因组编辑复合体与基因组中靶序列之间相互作用的起始、稳定性或动力学,这可以例如用于增强中靶(on-target)活性。指导RNAs的修饰可以也或替换地用于增强特异性,例如,与在其他(脱靶(off-target))位点的作用相比,在中靶位点的基因组编辑的相对比率。
修饰可以也或替换地用于增加指导RNA的稳定性,例如,通过增加其对细胞中存在的核糖核酸酶(RNA酶)降解的抗性,从而导致其在细胞中的半衰期增加。增强指导RNA半衰期的修饰在其中经由需要翻译以产生SluCas9内切核酸酶的RNA将Cas内切核酸酶例如SluCas9引入到待编辑的细胞中的实施方案中是特别有用的,这是因为增加在与编码内切核酸酶的RNA同时引入的指导RNAs的半衰期可用于增加指导RNAs和编码的Cas内切核酸酶在细胞中共存的时间。
B. 原间隔区相邻基序(PAM或PAM序列)
对于SluCas9的合适的PAM序列包括“ANGG”和“NNGG”。
如实施例1、2和3中所举例说明的,用于根据本发明的SluCas9系统的合适的原间隔区相邻基序(PAM)是“NNGG”。
切割位点通常存在于PAM序列上游的一到三个碱基对内,例如PAM序列上游的一或三个碱基对内、PAM序列的三个碱基对内或PAM序列“NNGG”上游的三个碱基对内。
C. 在真核细胞中的用途
在根据本发明的一个实施方案中,本文所述的SluCas9系统可以用于真核细胞,例如哺乳动物细胞中。这种活性在实施例4和图4A-4C和5A-5C中例示。
本发明的其他特征
修饰可以也或替换地用于降低引入细胞中的RNAs引出先天免疫应答的可能或程度。如下文和本领域中所述的,在RNA干扰(RNAi)包括小干扰RNAs(siRNAs)的背景中已被充分表征的这种应答倾向于与RNA的降低的半衰期和/或细胞因子或其他与免疫应答有关的因子的引出有关。
还可以对引入细胞中的编码内切核酸酶(例如SluCas9)的RNAs进行一种或多种类型的修饰,包括但不限于增强RNA稳定性的修饰(例如通过减少其被细胞中存在的RNA酶的降解)、增强所得产物(即,内切核酸酶)翻译的修饰和/或降低引入细胞中的RNAs引出先天免疫应答的可能或程度的修饰。同样可以使用修饰的组合,例如前述和其他的。例如,在CRISPR-Cas的情况下,可以对指导RNAs进行一种或多种类型的修饰(包括以上例示的那些),和/或可以对编码CAS内切核酸酶的RNAs进行一种或多种类型的修饰(包括以上例示的那些)。
作为举例说明,可以通过化学方法容易地合成在CRISPR-Cas系统中使用的指导RNAs或其他较小的RNAs,从而使得能够容易地并入许多修饰,如下文所举例说明和本领域中所述的。尽管化学合成程序不断地发展,但随着多核苷酸长度显著增加超过一百个左右核苷酸,通过诸如高效液相层析(HPLC,其避免使用凝胶如PAGE)的程序纯化这种RNAs倾向于变得更具挑战性。用于产生更大长度的化学修饰的RNAs的一种方法是产生两个或多个连接在一起的分子。更长的RNAs(例如编码SluCas9内切核酸酶的那些)更容易酶促产生。尽管通常可用于供酶促产生的RNAs之用的修饰类型较少,但仍存在可用于例如增强稳定性、降低先天免疫应答的可能或程度和/或增强其他属性的修饰,如下文和本领域中进一步描述的;并且正经常开发新的修饰类型。作为各种类型的修饰的举例说明,尤其是常常与较小的化学合成的RNAs一起使用的那些,修饰可以包含在糖的2'位置修饰的一种或多种核苷酸,在一些实施方案中为2'-0-烷基、2'-0-烷基-0-烷基或2'-氟修饰的核苷酸。在一些实施方案中,RNA修饰包括在嘧啶的核糖、碱基残基(basic residues)或RNA的3'端的反向碱基上的2'-氟、2'-氨基和2' 0-甲基修饰。这种修饰常规地并入寡核苷酸中,并且已显示这些寡核苷酸具有比2'-脱氧寡核苷酸对给定靶的更高的Tm(即,更高的靶结合亲和力)。
已经显示许多核苷酸和核苷修饰使它们所并入的寡核苷酸比天然寡核苷酸对核酸酶消化更具有抗性;这些修饰的寡核苷酸比未修饰的寡核苷酸完整地存活更长的时间。修饰的寡核苷酸的具体实例包括包含修饰的主链的那些,例如,硫代磷酸酯、磷酸三酯、甲基膦酸酯、短链烷基或环烷基糖间键或短链杂原子或杂环糖间键。一些寡核苷酸是具有硫代磷酸酯主链的寡核苷酸,以及具有杂原子主链的那些,特别地是CH2 -NH-O-CH2、CH,-N(CH3)-0-CH2(称为亚甲基(甲基亚氨基)或MMI主链)、CH2-0-N (CH3)-CH2、CH2 -N (CH3)-N(CH3)-CH2和0-N (CH3)- CH2 -CH2主链;酰胺主链[参见De Mesmaeker等人, Ace. Chem.Res., 28:366-374 (1995)];吗啉代主链结构(参见Summerton和Weller,美国专利No. 5,034,506);肽核酸(PNA)主链(其中寡核苷酸的磷酸二酯主链被聚酰胺主链置换,核苷酸直接或间接与聚酰胺主链的氮杂氮原子结合,参见Nielsen等人, Science 1991, 254,1497)。含磷的键包括,但不限于,硫代磷酸酯,手性硫代磷酸酯,二硫代磷酸酯,磷酸三酯,氨烷基磷酸三酯,甲基和其他烷基膦酸酯包括3'亚烷基膦酸酯和手性膦酸酯,次膦酸酯,氨基磷酸酯包括3'-氨基氨基磷酸酯和氨烷基氨基磷酸酯,硫羰氨基磷酸酯,硫羰烷基膦酸酯,硫羰烷基磷酸三酯,和具有正常3'-5'键的硼烷磷酸酯(boranophosphates),这些的2'-5'连接的类似物,以及具有反向极性的那些,其中相邻的核苷单位对3'-5'至5'-3'或2'-5'至5'-2'连接;参见美国专利Nos. 3,687,808;4,469,863;4,476,301;5,023,243;5,177,196;5,188,897;5,264,423;5,276,019;5,278,302;5,286,717;5,321,131;5,399,676;5,405,939;5,453,496;5,455, 233;5,466,677;5,476,925;5,519,126;5,536,821;5,541,306;5,550,111;5,563, 253;5,571,799;5,587,361;和5,625,050。
基于吗啉代的寡聚化合物描述于Braasch和David Corey, Biochemistry, 41(14): 4503-4510 (2002);Genesis, 第30卷, 第3期, (2001);Heasman, Dev. Bioi.,243:209-214 (2002);Nasevicius等人, Nat. Genet., 26:216-220 (2000);Lacenra等人, Proc. Nat/. Acad. Sci., 97: 9591-9596 (2000);和1991年7月23日授权的美国专利No. 5,034,506。环己烯基核酸寡核苷酸模拟物描述于Wang等人, J. Am. Chern. Soc.,122: 8595-8602 (2000)。
其中不包含磷原子的修饰的寡核苷酸主链具有由短链烷基或环烷基核苷间键、混合的杂原子和烷基或环烷基核苷间键或一种或多种短链杂原子或杂环核苷间键形成的主链。这些包括具有吗啉代键(部分由核苷的糖部分形成)的那些;硅氧烷主链;硫化物、亚砜和砜主链;甲乙酰基(formacetyl)和硫代甲乙酰基(thioformacetyl)主链;亚甲基甲乙酰基和硫代甲乙酰基主链;含烯的主链;氨基磺酸酯主链;亚甲基亚氨基和亚甲基肼基主链;磺酸酯和氨磺酰主链;酰胺主链;和其他具有混合的N、O、S和CH2组分部分的;参见美国专利Nos.5,034,506;5,166,315;5,185,444;5,214,134;5,216,141;5,235,033;5,264, 562;5,264,564;5,405,938;5,434,257;5,466,677;5,470,967;5,489,677;5,541,307;5,561,225;5,596, 086;5,602,240;5,610,289;5,602,240;5,608,046;5,610,289;5,618,704;5,623, 070;5,663,312;5,633,360;5,677,437;和5,677,439,其各自引入本文作为参考。
也可以包括一种或多种取代的糖部分,例如,在2'位置的下述之一:OH、SH、SCH3、F、OCN、OCH3、OCH3 O(CH2)n CH3、O(CH2)n NH2或O(CH2)n CH3,其中n为1至10;C1至C10低级烷基,烷氧基烷氧基,取代的低级烷基、烷芳基或芳烷基;Cl;Br;CN;CF3;OCF3;O-、S-或N-烷基;O-、S-或N-链烯基: SOCH3;SO2 CH3;ONO2;NO2;N3;NH2;杂环烷基;杂环烷芳基;氨烷基氨基;聚烷基氨基;取代的甲硅烷基;RNA切割基团;报道基团;嵌入剂;用于改善寡核苷酸的药物代谢动力学性质的基团;或用于改善寡核苷酸的药物动力学性质的基团和具有类似性质的其他取代基。在一些实施方案中,修饰包括2'-甲氧基乙氧基(2'-O-CH2CH2OCH3,也称为2'-O-(2-甲氧基乙基))(Martinet a/, Helv. Chim. Acta, 1995, 78, 486)。其他修饰包括2'-甲氧基(2'-O-CH3)、2'-丙氧基(2'-OCH2 CH2CH3)和2'-氟(2'-F)。还可以在寡核苷酸的其他位置进行类似的修饰,特别是3'末端核苷酸上糖的3'位置和5'末端核苷酸的5'位置。寡核苷酸也可以具有糖模拟物,例如环丁基代替呋喃戊糖基。在一些实施方案中,核苷酸单位的糖和核苷间键即主链两者都被新的基团置换。维持碱基单位用于与适当的核酸靶化合物杂交。一种这种寡聚化合物,已经显示出具有优良的杂交性质的寡核苷酸模拟物,被称为肽核酸(PNA)。在PNA化合物中,寡核苷酸的糖-主链被含有酰胺的主链例如氨乙基甘氨酸主链置换。核碱基被保留并直接或间接结合到主链的酰胺部分的氮杂氮原子上。教导PNA化合物的制备的代表性美国专利包括,但不限于,美国专利Nos. 5,539,082;5,714,331;和5,719,262。PNA化合物的进一步教导可以在 Nielsen等人, Science, 254: 1497-1500(1991)中找到。
指导RNAs还可以额外地或替换地包括核碱基(在本领域中经常简称为“碱基”)修饰或取代。如本文所用的,“未修饰的”或“天然的”核碱基包括腺嘌呤(A)、鸟嘌呤(G)、胸腺嘧啶(T)、胞嘧啶(C)和尿嘧啶(U)。修饰的核碱基包括仅在天然核酸中偶尔或瞬时地发现的核碱基,例如次黄嘌呤,6-甲基腺嘌呤,5-Me嘧啶,特别是5-甲基胞嘧啶(也称为5 -甲基-2'脱氧胞嘧啶,并且在本领域中经常被称为5-Me-C),5-羟甲基胞嘧啶(HMC),糖基HMC和龙胆二糖基(gentobiosyl)HMC,以及合成的核碱基,例如2-氨基腺嘌呤,2-(甲氨基)腺嘌呤,2-(咪唑基烷基)腺嘌呤,2-(氨烷基氨基)腺嘌呤或其他杂取代的烷基腺嘌呤,2-硫尿嘧啶,2-硫胸腺嘧啶,5-溴尿嘧啶,5-羟甲基尿嘧啶,8-氮鸟嘌呤,7-脱氮鸟嘌呤,N6 (6-氨基己基)腺嘌呤和2.6-二氨基嘌呤。Kornberg, A, DNA Replication, W. H. Freeman & Co., SanFrancisco, 第75-77页 (1980);Gebeyehu等人, Nuc/. Acids Res. 15:4513 (1997)。也可以包括本领域已知的“通用”碱基,例如,肌苷。5-Me-C取代已显示将核酸双链体稳定性提高0.6-1.2摄氏度(Sanghvi, Y. S., 在Crooke, S. T.和Lebleu, B., 编, AntisenseResearch and Applications, CRC Press, Boca Raton, 1993, 第276-278页中)且是碱基取代的实施方案。
修饰的核碱基包括其他合成的和天然的核碱基,例如5-甲基胞嘧啶(5-me-C),5-羟甲基胞嘧啶,黄嘌呤,次黄嘌呤,2-氨基腺嘌呤,腺嘌呤和鸟嘌呤的6-甲基和其他烷基衍生物,腺嘌呤和鸟嘌呤的2-丙基和其他烷基衍生物,2-硫尿嘧啶,2-硫胸腺嘧啶和2-硫胞嘧啶,5-卤尿嘧啶和胞嘧啶,5-丙炔基尿嘧啶和胞嘧啶,6-偶氮尿嘧啶、胞嘧啶和胸腺嘧啶,5-尿嘧啶(假尿嘧啶),4-硫尿嘧啶,8-卤、8-氨基、8-硫羟、8-硫代烷基、8-羟基和其他a-取代的腺嘌呤和鸟嘌呤,5-卤特别是5-溴、5-三氟甲基和其他5-取代的尿嘧啶和胞嘧啶,7-甲基鸟嘌呤和7-甲基腺嘌呤,8-氮鸟嘌呤和8-氮腺嘌呤,7-脱氮鸟嘌呤和7-脱氮腺嘌呤和3-脱氮鸟嘌呤和3-脱氮腺嘌呤。
进一步地,核碱基包括在美国专利No. 3,687,808中公开的那些,在'The ConciseEncyclopedia of Polymer Science And Engineering', 第858-859页, Kroschwitz,J.l., 编 John Wiley & Sons, 1990中公开的那些,由Englisch等人, AngewandteChemie, International Edition', 1991, 30, 第613页公开的那些,以及由Sanghvi, Y.S., 第15章, Antisense Research and Applications', 第289- 302页, Crooke, S.T.和Lebleu, B. ea., CRC Press, 1993公开的那些。这些核碱基中的某些对于增加本发明的寡聚化合物的结合亲和力特别有用。这些包括5-取代的嘧啶,6-氮嘧啶和N-2、N-6和-O-6取代的嘌呤,包括2-氨丙基腺嘌呤,5-丙炔基尿嘧啶和5-丙炔基胞嘧啶。5-甲基胞嘧啶取代已显示将核酸双链体稳定性提高0.6-1.2 oc(Sanghvi, Y.S., Crooke, S.T.和Lebleu,B., 编, 'Antisense Research and Applications', CRC Press, Boca Raton, 1993,第276-278页)且是碱基取代的实施方案,甚至更特别是当与2'-O-甲氧基乙基糖修饰组合时。修饰的核碱基描述于美国专利nos. 3,687,808, 以及4,845,205;5,130,302;5,134,066;5,175, 273;5, 367,066;5,432,272;5,457,187;5,459,255;5,484,908;5,502,177;5,525,711;5,552,540;5,587,469;5,596,091;5,614,617;5,681,941;5,750,692;5,763,588;5,830,653;6,005,096;和美国专利申请公开20030158403中。
给定寡核苷酸中的所有位置被均匀地修饰不是必需的,并且实际上可以将不止一种上述修饰并入单个寡核苷酸中,或甚至在寡核苷酸内的单个核苷中。
在一些实施方案中,将指导RNAs和/或编码内切核酸酶如SluCas9的mRNA(或DNA)化学连接至增强所述寡核苷酸的活性、细胞分布或细胞摄取的一种或多种部分或缀合物。这种部分包括但不限于,脂质部分,例如胆固醇部分[Letsinger等人, Proc. Nat/. Acad.Sci. USA, 86: 6553-6556 (1989)];胆酸[Manoharan等人, Bioorg. Med. Chern. Let.,4: 1053-1060 (1994)];硫醚,例如己基-S-三苯甲基硫醇[Manoharan eta/, Ann. N. YAcad. Sci., 660: 306-309 (1992)和Manoharan等人, Bioorg. Med. Chern. Let.,3.· 2765-2770 (1993)];硫胆固醇(thiocholesterol)[Oberhauser等人,Nucl. AcidsRes., 20: 533-538 (1992)];脂族链,例如十二烷二醇或十一烷基残基[Kabanov等人,FEBS Lett., 259: 327-330 (1990)和Svinarchuk等人, Biochimie, 75: 49- 54(1993)];磷脂,例如二-十六烷基-外消旋-甘油或1,2-二-O-十六烷基-外消旋-甘油-3-H-膦酸三乙铵[Manoharan等人, Tetrahedron Lett., 36:3651-3654 (1995)和Shea等人,Nuc/. Acids Res., 18: 3777-3783 (1990)];多胺或聚乙二醇链[Mancharan等人,Nucfeosides & Nuc/eotides, 14: 969-973 (1995)];金刚烷乙酸[Manoharan等人,Tetrahedron Lett., 36: 3651-3654 (1995)];棕榈基部分[(Mishra等人, Biochim.Biophys. Acta, 1264: 229-237 (1995)];或十八胺或己基氨基-羰基-t羟胆固醇部分[Crooke等人, J. Pharmacal. Exp. Ther., 277: 923-937 (1996)]。也参见美国专利Nos. 4,828,979;4,948,882;5,218,105;5,525,465;5,541,313;5,545,730;5,552, 538;5,578,717, 5,580,731;5,580,731;5,591,584;5,109,124;5,118,802;5,138,045;5,414,077;5,486, 603;5,512,439;5,578,718;5,608,046;4,587,044;4,605,735;4,667,025;4,762, 779;4,789,737;4,824,941;4,835,263;4,876,335;4,904,582;4,958,013;5,082,830;5,112,963;5,214,136;5,082,830;5,112,963;5,214,136;5,245,022;5,254,469;5,258,506;5,262,536;5,272,250;5,292,873;5,317,098;5,371,241, 5,391, 723;5,416,203, 5,451,463;5,510,475;5,512,667;5,514,785;5,565,552;5,567,810;5,574,142;5,585,481;5,587,371;5,595,726;5,597,696;5,599,923;5,599, 928和5,688,941。
糖和其他部分可用于将包含核苷酸的蛋白质和复合体(例如阳离子多核糖体和脂质体)靶向特定位点。例如,肝细胞定向转移可以通过脱唾液酸糖蛋白受体(ASGPRs)介导;参见,例如Hu等人, Protein Pept Lett. 21(1 0):1025-30 (2014)。可以使用本领域已知的和经常开发的其他系统将本情况中使用的生物分子和/或其复合体靶向特定的感兴趣的靶细胞。
这些靶向部分或缀合物可包括与官能团例如伯或仲羟基共价结合的缀合物基团。本发明的缀合物基团包括嵌入剂、报道分子、多胺、聚酰胺、聚乙二醇、聚醚、增强寡聚体的药物动力学性质的基团和增强寡聚体的药物代谢动力学性质的基团。典型的缀合物基团包括胆固醇、脂质、磷脂、生物素、吩嗪、叶酸、菲啶、蒽醌、吖啶、荧光素、罗丹明、香豆素和染料。在本发明的上下文中,增强药物动力学性质的基团包括改善摄取、增强对降解的抗性和/或增强与靶核酸的序列特异性杂交的基团。在本发明的上下文中,增强药物代谢动力学性质的基团包括改善本发明化合物的摄取、分布、代谢或排泄的基团。在1992年10月23日提交的国际专利申请No. PCT/US92/09196和美国专利No. 6,287,860中公开了代表性的缀合物基团,其引入本文作为参考。缀合物部分包括,但不限于,脂质部分,例如胆固醇部分,胆酸,硫醚,例如己基-5-三苯甲基硫醇,硫胆固醇,脂族链,例如十二烷二醇或十一烷基残基,磷脂,例如二-十六烷基-外消旋-甘油或1,2-二-O-十六烷基-外消旋-甘油-3-H-膦酸三乙铵,多胺或聚乙二醇链,或金刚烷乙酸,棕榈基部分,或十八胺或己基氨基-羰基-羟胆固醇部分。参见,例如,美国专利Nos. 4,828,979;4,948,882;5,218,105;5,525,465;5,541,313;5,545,730;5,552,538;5,578,717, 5,580,731;5,580,731;5,591,584;5,109,124;5,118,802;5,138,045;5,414,077;5,486,603;5,512,439;5,578,718;5,608,046;4,587,044;4,605,735;4,667,025;4,762,779;4,789,737;4,824,941;4,835,263;4,876,335;4,904,582;4,958,013;5,082,830;5,112,963;5,214,136;5,082,830;5,112,963;5,214,136;5,245,022;5,254,469;5,258,506;5,262,536;5,272,250;5,292,873;5,317,098;5,371,241, 5,391,723;5,416,203, 5,451,463;5,510,475;5,512,667;5,514,785;5,565,552;5,567,810;5,574,142;5,585,481;5,587,371;5,595,726;5,597,696;5,599,923;5,599,928和5,688,941。
不太适合化学合成并且通常通过酶促合成生产的较长的多核苷酸也可以通过各种方式修饰。这种修饰可以包括,例如,某些核苷酸类似物的引入,在分子的5'或3'端并入特定序列或其他部分,以及其他修饰。作为举例说明,编码SluCas9的mRNA的长度约为4kb,并且可以通过体外转录合成。对mRNA的修饰可以应用于例如增加其翻译或稳定性(例如通过增加其对细胞降解的抗性),或降低RNA引出先天免疫应答的倾向,这种倾向经常在引入外源RNAs(特别是较长的RNAs如编码SluCas9的那种)后的细胞中观察到。
本领域中已经描述了许多这种修饰,例如聚腺苷酸尾,5'帽类似物(例如抗反向帽类似物(Anti Reverse Cap Analog)(ARCA)或m7G(5')ppp(5')G (mCAP)),修饰的5'或3'非翻译区(UTRs),修饰的碱基的使用(例如假-UTP、2-硫-UTP、5-甲基胞苷-5'-三磷酸(5-甲基-CTP)或N6-甲基-ATP),或用磷酸酶处理以去除5'末端磷酸。这些和其他修饰是本领域已知的,并且正经常开发RNAs的新修饰。
有许多修饰的RNAs的商业供应商,包括例如Trilink Biotech、Axolabs、Bio-Synthesis Inc.、Dharmacon和许多其他的。如Trilink所述的,例如,5-甲基-CTP可用于赋予所期望的特征,例如增加的核酸酶稳定性,增加的翻译或降低的先天免疫受体与体外转录的RNA的相互作用。5'-甲基胞苷-5'-三磷酸(5-甲基-CTP)、N6-甲基-ATP以及假-UTP和2-硫-UTP也已显示在增强翻译的同时减少培养中和体内的先天免疫刺激,如下文参考的Konmann等人和Warren等人的出版物所举例说明的。
已经显示体内递送的化学修饰的mRNA可以用于实现改善的治疗效果;参见,例如,Kormann等人, Nature Biotechnology 29, 154-157 (2011)。这种修饰可用于例如增加RNA分子的稳定性和/或降低其免疫原性。使用化学修饰,例如假-U、N6-甲基-A、2-硫-U和5-甲基-C,发现分别用2-硫-U和5-甲基-C仅取代四分之一的尿苷和胞苷残基就导致小鼠中mRNA的toll-样受体(TLR)介导的识别显著降低。通过减少先天免疫系统的激活,这些修饰可因此用于有效地提高体内mRNA的稳定性和寿命;参见,例如 Konmann等人,上文。
还已显示重复施用并入了设计用于绕过先天抗病毒反应的修饰的合成信使RNAs可以将分化的人细胞重编程序为多潜能性。参见,例如Warren等人, Cell Stem Cell, 7(5):618-30 (2010)。充当初级重编程序蛋白的这种修饰的mRNAs可以是对多种人细胞类型进行重编程序的有效手段。这种细胞称为诱导的多潜能性干细胞(iPSCs),且发现并入了5-甲基-CTP、假-UTP和抗反向帽类似物(ARCA)的酶促合成的RNA可用于有效逃避细胞的抗病毒反应;参见,例如 Warren等人,上文。本领域中描述的多核苷酸的其他修饰包括,例如,聚腺苷酸尾的使用,5'帽类似物(例如m7G(5')ppp(5')G (mCAP))的添加,5'或3'非翻译区(UTRs)的修饰或用磷酸酶处理以去除5'末端磷酸-且正经常开发新方法。
已经连同RNA干扰(RNAi)的修饰,包括小干扰RNAs(siRNAs),开发了适用于产生供本文之用的修饰的RNAs的许多组合物和技术。siRNAs在体内引起特殊的挑战,这是因为它们通过mRNA干扰对基因沉默的作用通常是瞬时的,其可能需要重复施用。此外,siRNAs是双链RNAs(dsRNAs),且哺乳动物细胞具有已进行进化以检测和中和dsRNA的免疫应答,所述dsRNA经常是病毒感染的副产物。因此,存在哺乳动物酶如PKR(dsRNA-应答激酶),和可能的视黄酸诱导型基因I(RIG-I),其可以介导对dsRNA的细胞应答,以及Toll-样受体(例如TLR3、TLR7和TLR8),其可以响应于这种分子而触发细胞因子的诱导;参见,例如Angart等人, Pharmaceuticals (Basel) 6(4): 440-468 (2013);Kanasty等人, MolecularTherapy 20(3): 513-524 (2012);Burnett等人, Biotechnol J. 6(9):1130-46 (2011);Judge和Maclachlan, Hum Gene Ther 19(2):111-24 (2008)的综述;以及其中引用的参考文献。
各种各样的修饰已经开发并将应用于增强RNA稳定性、减少先天免疫应答和/或获得其他可以在如本文所述的将多核苷酸引入人细胞中的方面有用的益处;参见,例如Whitehead KA等人, Annual Review of Chemical and Biomolecular Engineering, 2:77-96 (2011);Gaglione和Messere, Mini Rev Med Chern, 10(7):578-95 (2010);Chernolovskaya等人, Curr Opin Mol Ther., 12(2):158-67 (2010);Deleavey等人,Curr Protoc Nucleic Acid Chern 第16章:Unit 16.3 (2009);Behlke,Oligonucleotides 18(4):305-19 (2008): Fucini等人, Nucleic Acid Ther 22(3):205-210 (2012);Bremsen等人, Front Genet 3:154 (2012)的综述。
如上文所指出的,有许多修饰的RNAs的商业供应商,其中许多专门做设计用于提高siRNAs的有效性的修饰。基于文献中报道的各种发现,提供了多种方法。例如,Dharmacon指出,用硫置换非桥联氧(硫代磷酸酯,PS)已被广泛用于改善siRNAs的核酸酶抗性,如Kale, Nature Reviews Drug Discovery 11:125-140 (2012)所报道的。已经报道核糖2'-位置的修饰在增加双链体稳定性(Tm)的同时改善核苷酸间磷酸键的核酸酶抗性,其也已显示提供保护免于免疫激活。中等PS主链修饰与小的、良好耐受的2'-取代(2'-O-甲基、2'-氟、2'-氢(Hydro))的组合已与用于体内应用的高度稳定的siRNAs有关联,如Soutschek等人 Nature 432:173-178 (2004)所报道的;且已报道2'-O-甲基修饰在改善稳定性中有效,如Volkov, Oligonucleotides 19:191-202 (2009)所报道的。关于减少先天免疫应答的诱导,已经报道用2'-O-甲基、2'-氟、2'-氢修饰具体序列在通常保持沉默活性的同时减少TLR7/TLR8相互作用;参见,例如Judge等人, Mol. Ther. 13:494-505 (2006);和Cekaite等人, J. Mol. Bioi. 365:90-108 (2007)。还已显示额外的修饰,例如2-硫尿嘧啶、假尿嘧啶、5-甲基胞嘧啶、5-甲基尿嘧啶和N6-甲基腺苷,使由TLR3、TLR7和TLR8介导的免疫作用减至最小;参见,例如 Kariko, K.等人, Immunity 23:165-175 (2005)。
如本领域中也已知的并且可商购获得的,许多缀合物可以应用于多核苷酸,例如供本文之用的RNAs,其可以增强它们的递送和/或被细胞摄取,包括例如胆固醇、生育酚和叶酸、脂质、肽、聚合物接头和适配体;参见,例如由Winkler, Ther. De/iv. 4:791-809(2013)的综述,以及其中引用的参考文献。
模拟物
核酸可以是核酸模拟物。当应用于多核苷酸时术语“模拟物”意图包括其中仅呋喃糖环或呋喃糖环和核苷酸间键两者均被非呋喃糖基团置换的多核苷酸,仅呋喃糖环的置换在本领域中也称为糖替代。维持杂环碱基部分或修饰的杂环碱基部分用于与适当的靶核酸杂交。一种这种核酸,已显示具有优良的杂交性质的多核苷酸模拟物,被称为肽核酸(PNA)。在PNA中,多核苷酸的糖-主链被含酰胺的主链特别是氨乙基甘氨酸主链置换。核苷酸被保留并直接或间接结合到主链的酰胺部分的氮杂氮原子上。
已报道具有优良杂交性质的一种多核苷酸模拟物是肽核酸(PNA)。PNA化合物中的主链是两个或更多个连接的氨乙基甘氨酸单位,其给予PNA含酰胺的主链。杂环碱基部分直接或间接结合到主链的酰胺部分的氮杂氮原子上。描述PNA化合物的制备的代表性美国专利包括,但不限于:美国专利Nos. 5,539,082;5,714,331;和5,719,262。
已研究的另一类多核苷酸模拟物基于具有附着到吗啉代环的杂环碱基的连接的吗啉代单位(吗啉代核酸)。已经报道了连接吗啉代核酸中的吗啉代单体单位的许多连接基团。已选择了一类连接基团以产生非离子型寡聚化合物。非离子型基于吗啉代的寡聚化合物不太可能与细胞蛋白具有不期望的相互作用。基于吗啉代的多核苷酸是寡核苷酸的非离子型模拟物,其不太可能与细胞蛋白质形成不期望的相互作用(Dwaine A. Braasch和David R. Corey, Biochemistry, 2002, 41(14), 45034510)。基于吗啉代的多核苷酸在美国专利No. 5,034,506中公开。已经制备了多核苷酸的吗啉代类内的多种化合物,其具有连接单体亚单位的多种不同的连接基团。
进一步的多核苷酸模拟物种类称为环己烯基核酸(GeNA)。通常存在于DNA/RNA分子中的呋喃糖环被环己烯基环置换。已经按照经典的亚磷酰胺化学原理制备了GeNA DMT保护的亚磷酰胺单体,并将其用于寡聚化合物的合成。已经制备并研究了完全修饰的GeNA寡聚化合物和使具体位置被GeNA修饰的寡核苷酸(参见Wang等人, J. Am. Chern. Soc.,2000, 122, 85958602)。通常,将GeNA单体并入DNA链增加了DNA/RNA杂交体的其稳定性。GeNA寡腺苷酸与RNA和DNA互补体(complements)形成具有与天然复合体相似稳定性的复合体。NMR和圆二色性表明,将GeNA结构并入天然核酸结构中的研究从容易的构象适应开始。
进一步的修饰包括锁定核酸(LNAs),其中2'-羟基与糖环的4'碳原子连接,从而形成2'-C,4'-C-氧亚甲基键,从而形成双环糖部分。键可以是亚甲基(-CHz-),桥连2'氧原子和4'碳原子的基团,其中n为1或2(Singh等人, Chern. Commun., 1998, 4, 455-456)。LNA和LNA类似物显示与互补的DNA和RNA非常高的双链体热稳定性(Tm = +3至+10℃)、对3'-核酸外切降解的稳定性和良好的溶解度性质。已经描述了含有LNAs的有效且无毒性的反义寡核苷酸(Wahlestedt等人, Proc. Natl. Acad. Sci. U.S.A, 2000, 97, 5633-5638)。
已描述了LNA单体腺嘌呤、胞嘧啶、鸟嘌呤、5-甲基胞嘧啶、胸腺嘧啶和尿嘧啶的合成和制备,以及它们的寡聚化和核酸识别性质(Koshkin等人, Tetrahedron, 1998, 54,3607-3630)。LNAs及其制备也在WO 98/39352和WO 99/14226中描述。
修饰的糖部分
核酸还可包含一种或多种取代的糖部分。合适的多核苷酸包含选自下述的糖取代基基团:OH;F;O-、S-或N-烷基;O-、S-或N-链烯基;O-、S-或N-炔基;或O-烷基-O-烷基,其中烷基、链烯基和炔基可以是取代或未取代的C1 -C10烷基或C2 -C10链烯基和炔基。特别合适的是O((CH2)nO)mCH3、O(CHz)nOCH3、O(CHz)nNH2、O(CH2)CH3, O(CH2)nONH2和O(CH2)nON((CH2)nCH3)2,其中n和m为1至约10。其他合适的多核苷酸包含选自下述的糖取代基:C1至C10低级烷基、取代的低级烷基、链烯基、炔基、烷芳基、芳烷基、O-烷芳基或O-芳烷基、SH、SCH3、OCN、Cl、Br、CN、CF3、OCF3、SOCH3、SO2CH3、ONOz、NO2、N3、NH2、杂环烷基、杂环烷芳基、氨烷基氨基、聚烷基氨基、取代的甲硅烷基、RNA切割基团、报道基团、嵌入剂、用于改善寡核苷酸的药物代谢动力学性质的基团、或用于改善寡核苷酸的药物动力学性质的基团和具有类似性质的其他取代基。合适的修饰包括2'-甲氧基乙氧基2'-O-CH2 CHzOCH3,也称为-2'-O-(2-甲氧基乙基)或2'-MOE)(Martin等人, Hely. Chim. Acta, 1995, 78, 486-504),即,烷氧基烷氧基基团。进一步的合适的修饰包括2'-二甲氨基氧乙氧基,即,O(CHz)zON(CH3)z基团,也称为2'-DMAOE,如在下文实施例中所述的,和2'-二甲氨基乙氧基乙氧基(本领域中也称为2'-O-二甲基-氨基-乙氧基-乙基或2'- DMAEOE),即,2'-O-CHz-O-CHz-N(CH3)z。
其他合适的糖取代基基团包括甲氧基(-O-CH3)、氨基丙氧基(-O- CHzCHzCHzNHz)、烯丙基(-CHz-CH=CHz)、-O-烯丙基(-O-CHz-CH=CHz)和氟(F)。2'-糖取代基基团可以在阿拉伯糖(上)位置或核糖(下)位置。合适的2'-阿拉伯糖修饰是2'-F。还可以在寡聚化合物上的其他位置进行类似的修饰,特别是3'末端核苷上或2'-5'链接的寡核苷酸中糖的3'位置和5'末端核苷酸的5'位置。寡聚化合物也可以具有糖模拟物,例如环丁基部分代替呋喃戊糖基糖。
碱基修饰和取代
核酸还可以包括核碱基(在本领域中经常简称为“碱基”)修饰或取代。如本文所用的,“未修饰的”或“天然的”核碱基包括嘌呤碱基腺嘌呤(A)和鸟嘌呤(G)以及嘧啶碱基胸腺嘧啶(T)、胞嘧啶(C)和尿嘧啶(U)。修饰的核碱基包括其他合成的和天然的核碱基,例如5-甲基胞嘧啶(5-me-C),5-羟甲基胞嘧啶,黄嘌呤,次黄嘌呤,2-氨基腺嘌呤,腺嘌呤和鸟嘌呤的6-甲基和其他烷基衍生物,腺嘌呤和鸟嘌呤的2-丙基和其他烷基衍生物,2-硫尿嘧啶,2-硫胸腺嘧啶和2-硫胞嘧啶,5-卤尿嘧啶和胞嘧啶,5-丙炔基(-C=C-CH3)尿嘧啶和胞嘧啶和嘧啶碱基的其他炔基衍生物,6-偶氮尿嘧啶、胞嘧啶和胸腺嘧啶,5-尿嘧啶(假尿嘧啶),4-硫尿嘧啶,8-卤、8-氨基、8-硫羟、8-硫代烷基、8-羟基和其他8-取代的腺嘌呤和鸟嘌呤,5-卤特别是5-溴、5-三氟甲基和其他5-取代的尿嘧啶和胞嘧啶,7-甲基鸟嘌呤和7-甲基腺嘌呤,2-F-腺嘌呤,2-氨基-腺嘌呤,8-氮鸟嘌呤和8-氮腺嘌呤,7-脱氮鸟嘌呤和7-脱氮腺嘌呤和3-脱氮鸟嘌呤和3-脱氮腺嘌呤。进一步的修饰的核碱基包括三环嘧啶,例如吩
Figure 869198DEST_PATH_IMAGE001
嗪胞苷(1H-嘧啶并(5,4-b)(1,4)苯并
Figure 114235DEST_PATH_IMAGE001
嗪-2(3H)-酮),吩噻嗪胞苷(1H-嘧啶并(5,4-b)(1,4)苯并噻嗪-2(3H)-酮),G-封条如取代的吩
Figure 362813DEST_PATH_IMAGE001
嗪胞苷(例如9-(2-氨基乙氧基)-H-嘧啶并(5,4-(b)(1,4)苯并
Figure 367810DEST_PATH_IMAGE001
嗪-2(3H)-酮),咔唑胞苷(2H-嘧啶并(4,5-b)吲哚-2-酮),吡啶并吲哚胞苷(H-吡啶并(3',2':4,5)吡咯并(2,3-d)嘧啶-2-酮)。
杂环碱基部分还可以包括其中嘌呤或嘧啶碱基被其他杂环置换的那些,例如7-脱氮-腺嘌呤、7-脱氮鸟苷、2-氨基吡啶和2-吡啶酮。进一步地,核碱基包括在美国专利No. 3,687,808中公开的那些,在The Concise Encyclopedia Of Polymer Science AndEngineering, 第858-859页, Kroschwitz, J. 1., 编 John Wiley & Sons, 1990中公开的那些,由Englisch等人, Angewandte Chemie, International Edition, 1991, 30,613公开的那些,以及由Sanghvi, Y. S., 第15章, Antisense Research andApplications, 第289- 302页, Crooke, S.T.和Lebleu, B. 编, CRC Press, 1993公开的那些。这些核碱基中的某些对于增加寡聚化合物的结合亲和力有用。这些包括5-取代的嘧啶,6-氮嘧啶和N-2、N-6和-O-6取代的嘌呤,包括2-氨丙基腺嘌呤,5-丙炔基尿嘧啶和5-丙炔基胞嘧啶。5-甲基胞嘧啶取代已显示将核酸双链体稳定性提高0.6-1.2 oc(Sanghvi等人, 编, Antisense Research and Applications, CRC Press, Boca Raton, 1993, 第276-278页)且是合适的碱基取代,例如,当与2'-O-甲氧基乙基糖修饰组合时。
“互补的”是指通过碱基堆积和特异性氢键合在包含天然或非天然存在的(例如如上文所述的修饰的)碱基(核苷)或其类似物的两个序列之间配对的能力。例如,如果核酸的一个位置处的碱基能够与靶的相应位置处的碱基氢键合,则认为所述碱基在那个位置处彼此互补。核酸可包含通用碱基,或惰性无碱基间隔区,其对氢键合不提供正或负贡献。碱基配对可能包括典型的沃森-克里克碱基配对和非沃森-克里克碱基配对(例如摆动碱基配对和Hoogsteen碱基配对)。
要理解的是,对于互补碱基配对,腺苷型碱基(A)与胸苷型碱基(T)或尿嘧啶型碱基(U)互补,胞嘧啶型碱基(C)与鸟苷型碱基(G)互补,并且诸如诸如3-硝基吡咯或5-硝基吲哚的通用碱基可以与任何A、C、U或T杂交并被认为与其互补。Nichols等人, Nature, 1994;369:492-493和Loakes等人, Nucleic Acids Res., 1994;22:4039-4043。肌苷(I)在本领域中也已被认为是通用碱基,并且被认为与任何A、C、U或T互补。参见Watkins和Santalucia, Nucl. Acids Research, 2005;33 (19): 6258-6267。
缀合物
核酸的另一种可能的修饰包括将一种或多种增强寡核苷酸的活性、细胞分布或细胞摄取的部分或缀合物化学连接至多核苷酸。这些部分或缀合物可包括与官能团例如伯或仲羟基共价结合的缀合物基团。缀合物基团包括,但不限于,嵌入剂、报道分子、多胺、聚酰胺、聚乙二醇、聚醚、增强寡聚体的药物动力学性质的基团和增强寡聚体的药物代谢动力学性质的基团。合适的缀合物基团包括,但不限于,胆固醇、脂质、磷脂、生物素、吩嗪、叶酸、菲啶、蒽醌、吖啶、荧光素、罗丹明、香豆素和染料。增强药物动力学性质的基团包括改善摄取、增强对降解的抗性和/或增强与靶核酸的序列特异性杂交的基团。增强药物代谢动力学性质的基团包括改善核酸的摄取、分布、代谢或排泄的基团。
缀合物部分包括但不限于脂质部分,例如胆固醇部分(Letsinger等人., Proc.Natl. Acad. Sci. USA, 1989, 86, 6553-6556),胆酸(Manoharan等人, Bioorg. Med.Chern. Let., 1994,4, 1053-1060),硫醚,例如己基-S-三苯甲基硫醇(Manoharan等人,Ann. N.Y. Acad. Sci., 1992, 660, 306-309;Manoharan等人, Bioorg. Med. Chern.Let., 1993, 3, 2765-2770),硫胆固醇(Oberhauser等人, Nucl. Acids Res., 1992,20, 533-538),脂族链,例如十二烷二醇或十一烷基残基(Saison-Behmoaras等人, EMBOJ., 1991, 10, 1111-1118;Kabanov等人, FEBS Lett., 1990, 259, 327-330;Svinarchuk等人, Biochimie, 1993, 75, 49-54),磷脂,例如二-十六烷基-外消旋-甘油或1,2-二-O-十六烷基-外消旋-甘油-3-H-膦酸三乙铵(Manoharan等人, TetrahedronLett., 1995, 36, 3651-3654;Shea等人, Nucl. Acids Res., 1990, 18, 3777-3783),多胺或聚乙二醇链(Manoharan等人, Nucleosides & Nucleotides, 1995, 14, 969-97),或金刚烷乙酸(Manoharan等人, Tetrahedron Lett., 1995, 36, 36513654),棕榈基部分(Mishra等人, Biochim. Biophys. Acta, 1995, 1264, 229-237),或十八胺或己基氨基-羰基-羟胆固醇部分(Crooke等人, J. Pharmacal. Exp. Ther., 1996,277, 923-937)。
缀合物可以包括“蛋白转导结构域”或PTD(也称为CPP-细胞穿透肽),其可以指促进通过脂双层、微团、细胞膜、细胞器膜或小泡膜的多肽、多核苷酸、碳水化合物或有机或无机化合物。与从小的极性分子一直到大的大分子和/或纳米颗粒的另一种分子附着的PTD促进分子通过膜,例如从细胞外空间到细胞内空间,或从细胞溶胶到细胞器内。在一些实施方案中,PTD共价连接至外源多肽(例如SluCas9多肽)的氨基末端。在一些实施方案中,PTD共价连接至外源多肽(例如SluCas9多肽)的C-末端或N-末端。在一些实施方案中,PTD共价连接至核酸(例如,指导RNA、编码指导RNA的多核苷酸、编码SluCas9多肽的多核苷酸等)。示例性的PTDs包括但不限于最小的十一肽蛋白转导结构域(例如,对应于包含YGRKKRRQRRR基序的HIV-1 TAT的残基47-57(用于鉴定但不是为了在本申请中公开起见);包含足以指导进入细胞的许多精氨酸的聚精氨酸序列(例如3、4、5、6、7、8、9、10或10-50个精氨酸);VP22结构域(Zender等人 (2002) Cancer Gene Ther. 9(6):489-96);果蝇触角足蛋白转导结构域(Noguchi等人 (2003) Diabetes 52(7):1732-1737);截短的人降钙素肽(Trehin等人(2004) Pharm. Research 21:1248-1256);聚赖氨酸(Wender等人 (2000) Proc. Natl.Acad. Sci. USA97:13003-13008);在一些实施方案中,PTD是能被活化的CPP(ACPP)(Aguilera等人 (2009) lntegr Bioi (Camb) June;1(5-6): 371-381)。ACPPs包含通过可切割的接头连接至匹配的聚阴离子(例如Glu9或“E9”)的聚阳离子CPP(例如 Arg9或“R9”),其将净电荷降低至几乎为零,且从而抑制黏附和摄取到细胞中。在切割接头后,聚阴离子被释放,从而局部地暴露了聚精氨酸及其固有的黏着性,从而“活化” ACPP通过膜。在一些实施方案中,对PTD进行化学修饰以增加PTD的生物利用率。示例性修饰公开于Expert OpinDrug Deliv. 2009年11月;6(11):1195-205。
编码指导RNA和/或SluCas9多肽的核酸
本公开内容提供了包含编码指导RNA和/或SluCas9多肽的核苷酸序列的核酸。在一些实施方案中,编码指导RNA的核酸是表达载体,例如重组表达载体。
在一些实施方案中,方法包括接触靶DNA或将一种或多种包含编码指导RNA和/或SluCas9多肽的核苷酸序列的核酸引入细胞(或细胞群体)。在一些实施方案中,包含靶DNA的细胞是体外的。在一些实施方案中,包含靶DNA的细胞是体内的。包含编码指导RNA和/或SluCas9多肽的核苷酸序列的合适核酸包括表达载体,其中包含编码指导RNA和/或SluCas9多肽的核苷酸序列的表达载体是“重组表达载体”。
在一些实施方案中,重组表达载体是病毒构建体,例如重组腺伴随病毒构建体(参见,例如美国专利No. 7,078,387)、重组腺病毒构建体、重组慢病毒构建体、重组反转录病毒构建体等。[00248]合适的表达载体包括,但不限于,病毒载体(例如基于痘苗病毒的病毒载体;脊髓灰质炎病毒;腺病毒(参见,例如Li等人, Invest Opthalmol Vis Sci 35:25432549, 1994;Borras等人, Gene Ther 6:515 524, 1999;Li和Davidson, PNAS 92:77007704, 1995;Sakamoto等人, H Gene Ther 5:1088 1097, 1999;WO 94/12649、WO 93/03769;WO 93/19191;WO 94/28938;WO 95/11984和WO 95/00655);腺伴随病毒(参见,例如Ali等人, Hum Gene Ther 9:81 86, 1998, Flannery等人, PNAS 94:6916 6921, 1997;Bennett等人, Invest Opthalmol Vis Sci 38:2857 2863, 1997;Jomary等人, GeneTher4:683 690, 1997, Rolling等人, Hum Gene Ther 10:641 648, 1999;Ali等人, HumMol Genet 5:591 594, 1996;Srivastava在WO 93/09239中,Samulski等人, J. Vir.(1989) 63:3822-3828;Mendelson等人, Viral. (1988) 166:154-165;和Flotte等人,PNAS (1993) 90:10613-10617);SV40;单纯疱疹病毒;人免疫缺陷病毒(参见,例如Miyoshi等人, PNAS 94:10319 23, 1997;Takahashi等人, J Viral 73:7812 7816,1999);反转录病毒载体(例如鼠白血病病毒,脾脏坏死病毒,以及衍生自反转录病毒的载体,例如劳斯肉瘤病毒,Harvey肉瘤病毒,禽类白血病病毒,慢病毒,人免疫缺陷病毒,骨髓增生肉瘤病毒和乳癌病毒);等等。
许多合适的表达载体是本领域技术人员已知的,并且许多是可商购获得的。作为实例提供下述载体;对于真核宿主细胞:pXT1、pSGS(Stratagene)、pSVK3、pBPV、pMSG和pSVLSV40(Phanmacia)。然而,可以使用任何其他载体,只要它与宿主细胞相容即可。取决于所使用的宿主/载体系统,可以在表达载体中使用许多合适的转录和翻译控制元件中的任何一种,包括组成型和诱导型启动子、转录增强子元件、转录终止子等(参见,例如Bitter等人 (1987) Methods in Enzymology, 153:516-544)。
在一些实施方案中,编码指导RNA和/或SluCas9多肽的核苷酸序列可操作地连接至控制元件,例如转录控制元件,例如启动子。转录控制元件可以在真核细胞,例如哺乳动物细胞;或原核细胞(例如细菌或古细菌细胞)中起作用。在一些实施方案中,编码指导RNA和/或SluCas9多肽的核苷酸序列可操作地连接至多个控制元件,其允许在原核和真核细胞两者中表达编码指导RNA和/或SluCas9多肽的核苷酸序列。
合适的真核启动子(在真核细胞中起作用的启动子)的非限制性例子包括来自巨细胞病毒(CMV)立即早期、单纯疱疹病毒(HSV)胸苷激酶、早期和晚期SV40、来自反转录病毒的长末端重复序列(LTRs)和小鼠金属硫蛋白-1的那些。合适的载体和启动子的选择完全在本领域普通技术水平内。表达载体还可含有用于翻译起始的核糖体结合位点和转录终止子。表达载体还可以包括用于扩增表达的合适序列。表达载体还可以包括编码与SluCas9多肽融合的蛋白标签(例如6xHis标签、血凝素标签、绿色荧光蛋白等)的核苷酸序列,从而结果产生嵌合多肽。
在一些实施方案中,编码指导RNA和/或SluCas9多肽的核苷酸序列可操作地连接至诱导型启动子。在一些实施方案中,编码指导RNA和/或SluCas9多肽的核苷酸序列可操作地连接至组成型启动子。
将核酸引入宿主细胞的方法是本领域已知的,并且可以使用任何已知方法将核酸(例如表达构建体)引入细胞。合适的方法包括,例如病毒或噬菌体感染、转染、接合、原生质体融合、脂质转染法、电穿孔、磷酸钙沉淀、聚乙烯亚胺(PEI)介导的转染、DEAE-葡聚糖介导的转染、脂质体介导的转染、基因枪技术、磷酸钙沉淀、直接显微注射、纳米颗粒介导的核酸递送(参见,例如 Panyam等人, Adv Drug Deliv Rev. 2012年9月13日. pii: S0169-409X(12)00283-9.doi: 10.1016/j.addr.2012.09.023)等。
嵌合多肽
本公开内容提供了嵌合位点定向修饰多肽,其包含衍生自SluCas9多肽的序列。嵌合位点定向修饰多肽与指导RNA(上文所述的)相互作用(例如结合)。指导RNA将嵌合位点定向修饰多肽指导至靶DNA内的靶序列(例如染色体序列或染色体外序列,例如附加型序列、小环序列、线粒体序列、叶绿体序列、无细胞多核苷酸等)。嵌合位点定向修饰多肽修饰靶DNA(例如靶DNA的切割或甲基化作用)和/或与靶DNA有关的多肽(例如组蛋白尾的甲基化作用或乙酰化作用)。嵌合位点定向修饰多肽在本文中也称为“嵌合位点定向多肽”或“嵌合RNA结合位点定向修饰多肽”。
嵌合位点定向修饰多肽包含两个部分,RNA-结合部分和活性部分。嵌合位点定向修饰多肽包含衍生自至少两种不同多肽的氨基酸序列。嵌合位点定向修饰多肽可以包含修饰的和/或天然存在的多肽序列(例如,来自修饰或未修饰的SluCas9蛋白的第一氨基酸序列;和除SluCas9蛋白之外的第二氨基酸序列)。
RNA-结合部分
在一些情况中,嵌合位点定向修饰多肽的RNA-结合部分是天然存在的多肽。在其他情况中,嵌合位点定向修饰多肽的RNA-结合部分不是天然存在的分子(修饰的,例如突变、缺失、插入)。感兴趣的天然存在的RNA-结合部分衍生自本领域已知的位点定向修饰多肽。例如,SEQ ID NO:2是天然存在的SluCas9内切核酸酶,其可用作位点定向修饰多肽。在一些情况中,嵌合位点定向修饰多肽的RNA-结合部分包含与SEQ ID NO:2所示的多肽的RNA-结合部分具有至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%的氨基酸序列同一性的氨基酸序列。
活性部分
除RNA-结合部分外,嵌合位点定向修饰多肽包含“活性部分”。在一些实施方案中,嵌合位点定向修饰多肽的活性部分包含位点定向修饰多肽(例如SluCas9内切核酸酶)的天然存在的活性部分。在其他实施方案中,主题嵌合位点定向修饰多肽的活性部分包含位点定向修饰多肽的天然存在的活性部分的修饰的氨基酸序列(例如,取代、缺失、插入)。感兴趣的天然存在的活性部分衍生自本领域已知的位点定向修饰多肽。例如,SEQ ID NO:2中公开的序列是天然存在的SluCas9内切核酸酶,其可用作位点定向修饰多肽。嵌合位点定向修饰多肽的活性部分是可变的,并且可以包含可用于本文公开的方法的任何异源多肽序列。在一些实施方案中,位点定向修饰多肽的活性部分包含与SEQ ID NO:2的活性部分氨基酸至少90%相同的SluCas9直向同源物的一部分。在一些实施方案中,嵌合位点定向修饰多肽包含:(i)与指导RNA相互作用的RNA-结合部分,其中所述指导RNA包含与靶DNA中的序列互补的核苷酸序列;(ii)表现出位点定向酶促活性(例如,RNA切割活性)的活性部分,其中酶促活性的位点由前crRNA的重复序列形成的回文发夹结构确定并在发夹的上游4 nt切割前crRNA,从而产生由重复序列间隔区(5'-3')组成的crRNAs的中间形式;和(iii)表现出位点定向酶促活性(例如,DNA切割活性)的活性部分,其中酶促活性的位点由指导RNA确定。
示例性的嵌合位点定向修饰多肽
在一些实施方案中,嵌合位点定向修饰多肽的活性部分包含SluCas9蛋白的修饰的形式,包括任何SluCas9直向同源物的修饰的形式。在一些情况中,SluCas9蛋白的修饰的形式包含减少或增加SluCas9蛋白的天然存在的核酸酶活性的氨基酸变化(例如,缺失、插入或取代)。例如,在一些情况中,SluCas9蛋白的修饰的形式具有小于50%、小于40%、小于30%、小于20%、小于10%、小于5%或小于1%的相应野生型SluCas9多肽的核酸酶活性。在一些情况中,SluCas9多肽的修饰的形式没有显著的核酸酶活性。在其他情况中,它可能具有50%、2-倍、4-倍或最多到10-倍以上的核酸酶活性。
在一些情况中,嵌合位点定向修饰多肽包含与SEQ ID NO:2具有至少75%、至少80%、至少85%、至少90%、至少95%、至少99%或100%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,位点定向修饰多肽的活性部分包含具有DNA-修饰活性和/或转录因子活性和/或DNA-相关多肽修饰活性的异源多肽。在一些情况中,异源多肽置换提供核酸酶活性的SluCas9多肽的部分。在其他实施方案中,位点定向修饰多肽既包含正常提供核酸酶活性的SluCas9多肽的部分(且所述部分可以是完全活性的,或者可以代之以被修饰为具有小于100%的相应野生型活性),又包含异源多肽。换句话说,在一些情况中,嵌合位点定向修饰多肽是既包含正常提供核酸酶活性的SluCas9多肽部分又包含异源多肽的融合多肽。在其他情况中,嵌合位点定向修饰多肽是包含SluCas9多肽的活性部分的修饰的变体(例如氨基酸改变、缺失、插入)和异源多肽的融合多肽。在再其他情况中,嵌合位点定向修饰多肽是融合多肽,其包含异源多肽和天然存在的或修饰的位点定向修饰多肽的RNA-结合部分。
例如,在嵌合的SluCas9蛋白中,可以将天然存在的(或修饰的,例如突变、缺失、插入)SluCas9多肽融合至异源多肽序列(即,来自除SluCas9之外的蛋白的多肽序列或来自另一种生物的多肽序列)。异源多肽序列可以表现出也将由嵌合SluCas9蛋白表现出的活性(例如,酶促活性)(例如,甲基转移酶活性、乙酰转移酶活性、激酶活性、泛素化活性等)。异源核酸序列可以与另一核酸序列连接(例如通过遗传工程)以产生编码嵌合多肽的嵌合核苷酸序列。在一些实施方案中,通过将SluCas9多肽(例如野生型SluCas9或SluCas9变体,例如具有降低或失活的核酸酶活性的SluCas9)与提供亚细胞定位的异源序列(例如用于靶向细胞核的核定位信号(NLS);用于靶向线粒体的线粒体定位信号;用于靶向叶绿体的叶绿体定位信号:ER保留信号;等)融合来产生嵌合SluCas9多肽。在一些实施方案中,异源序列可以提供用于易于追踪或纯化的标签(例如荧光蛋白,例如绿色荧光蛋白(GFP)、YFP、RFP、CFP、mCherry、tdTomato等;HIS标签,例如6XHis标签;血凝素(HA)标签;FLAG标签;Myc标签;等)。在一些实施方案中,异源序列可提供增加或降低的稳定性。在一些实施方案中,异源序列可提供结合结构域(例如,以提供嵌合的SluCas9多肽结合另一种感兴趣的蛋白的能力,例如DNA或组蛋白修饰蛋白、转录因子或转录阻遏蛋白、募集蛋白等)或感兴趣的核苷酸(例如,适配体或核苷酸结合蛋白的靶位点)。
编码嵌合位点定向修饰多肽的核酸
本公开内容提供了包含编码嵌合位点定向修饰多肽的核苷酸序列的核酸。在一些实施方案中,包含编码嵌合位点定向修饰多肽的核苷酸序列的核酸是表达载体,例如重组表达载体。
在一些实施方案中,方法包括接触靶DNA或将一种或多种包含嵌合位点定向修饰多肽的核酸引入细胞(或细胞群体)。包含编码嵌合位点定向修饰多肽的核苷酸序列的合适核酸包括表达载体,其中包含编码嵌合位点定向修饰多肽的核苷酸序列的表达载体是“重组表达载体”。
在一些实施方案中,重组表达载体是病毒构建体,例如重组腺伴随病毒构建体(参见,例如美国专利No. 7,078,387)、重组腺病毒构建体、重组慢病毒构建体等。合适的表达载体包括,但不限于,病毒载体(例如基于痘苗病毒的病毒载体;脊髓灰质炎病毒;腺病毒(参见,例如Li等人, Invest Opthalmol Vis Sci 35:2543 2549, 1994;Borras等人,Gene Ther 6:515 524, 1999;Li和Davidson, PNAS 92:7700 7704, 1995;Sakamoto等人,H Gene Ther 5:1088 1097, 1999;WO 94/12649、WO 93/03769:WO 93/19191;WO 94/28938;WO 95/11984和WO 95/00655);腺伴随病毒(参见,例如 Ali等人, Hum Gene Ther9:81 86, 1998, Flannery等人, PNAS 94:6916 6921, 1997;Bennett等人, InvestOpthalmol Vis Sci 38:2857 2863, 1997;Jomary等人, Gene Ther 4:683 690, 1997,Rolling等人, Hum Gene Ther 10:641 648, 1999;Ali等人, Hum Mol Genet 5:591 594,1996;Srivastava在WO 93/09239中,Samulski等人, J. Vir. (1989) 63:3822-3828;Mendelson等人, Viral. (1988) 166:154-165;和Flotte等人, PNAS (1993) 90:10613-10617);SV40;单纯疱疹病毒;人免疫缺陷病毒(参见,例如 Miyoshi等人, PNAS 94:1031923, 1997;Takahashi等人, J Viral73:7812 7816, 1999);反转录病毒载体(例如鼠白血病病毒,脾脏坏死病毒,以及衍生自反转录病毒的载体,例如劳斯肉瘤病毒,Harvey肉瘤病毒,禽类白血病病毒,慢病毒,人免疫缺陷病毒,骨髓增生肉瘤病毒和乳癌病毒);等等。
许多合适的表达载体是本领域技术人员已知的,并且许多是可商购获得的。作为实例提供下述载体;对于真核宿主细胞:pXT1、pSGS(Stratagene)、pSVK3、pBPV、pMSG和pSVLSV40(Pharmacia)。然而,可以使用任何其他载体,只要它与宿主细胞相容即可。
取决于所使用的宿主/载体系统,可以在表达载体中使用许多合适的转录和翻译控制元件中的任何一种,包括组成型和诱导型启动子、转录增强子元件、转录终止子等(参见,例如Bitter等人 (1987) Methods in Enzymology, 153:516-544)。
在一些实施方案中,编码嵌合位点定向修饰多肽的核苷酸序列可操作地连接至控制元件,例如转录控制元件,例如启动子。转录控制元件可以在真核细胞,例如哺乳动物细胞;或原核细胞(例如细菌或古细菌细胞)中起作用。在一些实施方案中,编码嵌合位点定向修饰多肽的核苷酸序列可操作地连接至多个控制元件,其允许在原核和真核细胞两者中表达编码嵌合位点定向修饰多肽的核苷酸序列。
合适的真核启动子(在真核细胞中起作用的启动子)的非限制性例子包括来自巨细胞病毒(CMV)立即早期、单纯疱疹病毒(HSV)胸苷激酶、早期和晚期SV40、来自反转录病毒的长末端重复序列(LTRs)和小鼠金属硫蛋白-1的那些。合适的载体和启动子的选择完全在本领域普通技术水平内。表达载体还可含有用于翻译起始的核糖体结合位点和转录终止子。表达载体还可以包括用于扩增表达的合适序列。表达载体还可以包括编码与嵌合位点定向修饰多肽融合的蛋白标签(例如6xHis标签、血凝素(HA)标签、荧光蛋白(例如绿色荧光蛋白;黄色荧光蛋白等)等)的核苷酸序列。
在一些实施方案中,编码嵌合位点定向修饰多肽的核苷酸序列可操作地连接至诱导型启动子(例如热激启动子、四环素调节的启动子、类固醇调节的启动子、金属调节的启动子、雌激素受体调节的启动子等)。在一些实施方案中,编码嵌合位点定向修饰多肽的核苷酸序列可操作地连接至空间限制和/或时间限制的启动子(例如组织特异性启动子、细胞类型特异性启动子等)。在一些实施方案中,编码嵌合位点定向修饰多肽的核苷酸序列可操作地连接至组成型启动子。
将核酸引入宿主细胞的方法是本领域已知的,并且可以使用任何已知方法将核酸(例如表达构建体)引入干细胞或祖先细胞。合适的方法包括例如病毒或噬菌体感染、转染、接合、原生质体融合、脂质转染法、电穿孔、磷酸钙沉淀、聚乙烯亚胺(PEI)介导的转染、DEAE-葡聚糖介导的转染、脂质体介导的转染、基因枪技术、磷酸钙沉淀、直接显微注射、纳米颗粒介导的核酸递送(参见,例如 Panyam等人 Adv Drug Deliv Rev. 2012年9月13日.pp: 50169-409X(12)00283-9. doi: 10.1016/j.addr.2012.09.023)等。
方法
本公开内容提供了用于修饰靶DNA和/或靶DNA-相关多肽的方法。通常,方法包括使靶DNA与复合体(“靶向复合体”)接触,所述复合体包含指导RNA和SluCas9多肽。
如上文所讨论的,gRNA或sgRNA和SluCas9多肽形成复合体。指导RNA通过包含与靶DNA的序列互补的核苷酸序列,为复合体提供靶特异性。复合体的SluCas9多肽提供位点特异性活性。在一些实施方案中,复合体修饰靶DNA,从而导致例如DNA切割、DNA甲基化作用、DNA损伤、DNA修复等。在其他实施方案中,复合体修饰与靶DNA相关的靶多肽(例如,组蛋白、DNA-结合蛋白等),从而导致例如组蛋白甲基化作用、组蛋白乙酰化作用、组蛋白泛素化等。靶DNA可以是例如体外裸(即未由DNA相关的蛋白结合)DNA、体外细胞中的染色体DNA、体内细胞中的染色体DNA等。
来自各种物种的SluCas9蛋白可能在靶DNA中需要不同的PAM序列。因此,对于选择的特定SluCas9蛋白,PAM序列要求可能与上述PAM序列不同。
提供利用SluCas9直向同源物的特征的示例性方法包括下述。
核酸酶活性切割靶DNA以产生双链断裂。这些断裂然后由细胞以两种方式之一修复:非同源末端连接和同源性指导的修复。在非同源末端连接(NHEJ)中,通过将断裂末端直接相互连接来修复双链断裂。在所述过程中,可以在切割位点插入或缺失少数碱基对。在同源性指导的修复中,与切割的靶DNA序列具有同源性的供体多核苷酸被用作用于修复切割的靶DNA序列的模板,从而导致遗传信息从供体多核苷酸转移至靶DNA。因此,可以将新核酸材料插入/复制到位点中。在一些情况中,靶DNA与供体多核苷酸接触。在一些情况中,将供体多核苷酸引入细胞中。由于NHEJ和/或同源性指导的修复对靶DNA的修饰导致例如基因矫正、基因置换、基因标记(gene tagging)、转基因插入、核苷酸缺失、核苷酸插入、基因破坏、基因突变、序列置换等。因此,SluCas9多肽对DNA的切割可用于通过切割靶DNA序列并允许细胞在没有外源提供的供体多核苷酸的情况下修复所述序列来从靶DNA序列删除核酸材料(例如以破坏使细胞对感染易感的基因(例如CCRS或CXCR4基因,其使T细胞对HIV感染易感,以去除神经元中引起疾病的三核苷酸重复序列,以产生作为研究中的疾病模型的基因敲除和突变等)。因此,所述方法可用于敲除基因(从而导致完全缺乏转录或改变的转录)或将遗传物质敲入靶DNA中选择的基因座。
另一方面,如果将指导RNA和SluCas9多肽共施用至具有至少包括与靶DNA序列具有同源性的区段的供体多核苷酸序列的细胞,则可以使用主题方法添加,即插入或置换,核酸材料至靶DNA序列(例如以“敲入”编码蛋白、siRNA、miRNA等的核酸),添加标签(例如6xHis,荧光蛋白(例如绿色荧光蛋白;黄色荧光蛋白等),血凝素(HA),FLAG等),向基因添加调节序列(例如启动子、聚腺苷酸化信号、内部核糖体进入序列(IRES)、2A肽、起始密码子、终止密码子、剪接信号、定位信号等),修饰核酸序列(例如,引入突变)等。因此,包含指导RNA和SluCas9多肽的复合体可用于其中期望以位点特异性(即,“靶向的”)方式修饰DNA的任何体外或体内应用,例如基因敲除、基因敲入、基因编辑、基因标记、序列置换等,如在例如下述中使用的,基因治疗,例如以治疗疾病或作为抗病毒、抗病原物质或抗癌治疗,农业中基因修饰生物的生产,用于治疗、诊断或研究目的的由细胞大规模生产蛋白,诱导iPS细胞,生物学研究,用于缺失或置换的病原体基因的靶向等。
在一些实施方案中,SluCas9多肽包含SluCas9蛋白的修饰的形式。在一些情况中,SluCas9蛋白的修饰的形式包含降低SluCas9蛋白的天然存在的核酸酶活性的氨基酸变化(例如,缺失、插入或取代)。例如,在一些情况中,SluCas9蛋白的修饰的形式具有小于50%、小于40%、小于30%、小于20%、小于10%、小于5%或小于1%的相应野生型SluCas9多肽的核酸酶活性。在一些情况中,SluCas9多肽的修饰的形式没有显著的核酸酶活性。当SluCas9多肽是没有显著的核酸酶活性的SluCas9蛋白的修饰的形式时,它可以被称为“dSluCas9”。
在一些实施方案中,SluCas9多肽包含异源序列(例如融合体)。在一些实施方案中,异源序列可以提供SluCas9多肽的亚细胞定位(例如,用于靶向细胞核的核定位信号(NLS);用于靶向线粒体的线粒体定位信号;用于靶向叶绿体的叶绿体定位信号;ER保留信号;等)。在一些实施方案中,异源序列可以提供用于易于追踪或纯化的标签(例如荧光蛋白,例如绿色荧光蛋白(GFP)、YFP、RFP、CFP、mCherry、tdTomato等;His标签,例如6XHis标签;血凝素(HA)标签;FLAG标签;Myc标签;等)。在一些实施方案中,异源序列可提供增加或降低的稳定性。
在一些实施方案中,可以对SluCas9多肽进行密码子优化。这种类型的优化在本领域中是已知的,并且需要外源DNA的突变以在编码相同蛋白的同时模拟预期宿主生物或细胞的密码子偏好。因此,密码子被改变,但是编码的蛋白保持不变。例如,如果预期的靶细胞是人细胞,则人密码子优化的SluCas9(或变体,例如酶促无活性的变体)将是合适的。可以对任何合适的SluCas9多肽(例如,任何SluCas9,例如SEQ ID NO:2所示的序列)进行密码子优化。作为另一个非限制性实例,如果预期的宿主细胞是小鼠细胞,则小鼠密码子优化的SluCas9(或变体,例如酶促无活性的变体)将是合适的。尽管不需要密码子优化,但它是可以接受的,且在某些情况中可能是优选的。
在一方面,本文提供了核酸,其包含编码SluCas9多肽(例如,包含SEQ ID NO:2的氨基酸序列的多肽)或其与SEQ ID NO:2具有至少约90%(例如至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的任一种)的序列同一性的变体的密码子优化的多核苷酸序列。这种编码SluCas9或其变体的密码子优化的多核苷酸在本文中也称为“密码子优化的SluCas9多核苷酸”或“密码子优化的SluCas9”。在一些实施方案中,密码子优化的SluCas9编码SEQ ID NO:2或35的SluCas9多肽。在一些实施方案中,密码子优化的SluCas9被密码子优化以在原核细胞如细菌细胞中表达。在一些实施方案中,密码子优化的SluCas9被密码子优化以在真核细胞如昆虫或哺乳动物细胞中表达。在一些实施方案中,密码子优化的SluCas9被密码子优化以在人细胞中表达。在一些实施方案中,密码子优化根据GeneGPS®优化(ATUM)进行。在一些实施方案中,密码子优化根据GeneOptimizer方法(ThermoFisher Scientific)进行。在一些实施方案中,密码子优化的SluCas9与SEQ IDNO:44或45具有至少约90%(例如至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的任一种)的序列同一性。在一些实施方案中,密码子优化的SluCas9包含SEQID NO:44或45的序列(或由其组成)。
在根据本文所述的包含编码SluCas9多肽或其变体的密码子优化的多核苷酸序列的任何核酸的一些实施方案中,所述核酸进一步包括编码gRNA的核苷酸序列。在一些实施方案中,核酸是表达载体,例如重组表达载体。在一些实施方案中,编码SluCas9多肽或其变体的核苷酸序列包含SEQ ID NO:44或45的密码子优化的多核苷酸序列或其与SEQ ID NO:44或45的密码子优化的多核苷酸序列具有至少90%的序列同一性的变体。
在一些实施方案中,本文提供了包含与SEQ ID NO:44或45具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性的多核苷酸序列的核酸,其中所述多核苷酸序列编码如本文所述的SluCas9多肽或其变体。在一些实施方案中,多核苷酸序列包含SEQ ID NO:44或45的密码子优化的多核苷酸序列(或由其组成)。
在一些实施方案中,本文提供了包含与SEQ ID NO:44或45的亚序列具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性的多核苷酸序列的核酸,其中所述多核苷酸序列编码一种或多种SluCas9结构域。在一些实施方案中,多核苷酸序列包含SEQ ID NO:44或45的亚序列(或由其组成)。在一些实施方案中,一种或多种SluCas9结构域包括核酸酶结构域(例如,HNH或RuvC结构域)。在一些实施方案中,一种或多种SluCas9结构域包括RNA-结合结构域(例如,Rec I结构域)。在一些实施方案中,一种或多种SluCas9结构域包括PAM-相互作用结构域。
在根据本文描述的包含密码子优化的多核苷酸序列的任何核酸的一些实施方案中,与在宿主细胞中SluCas9多肽或其变体从包含参考多核苷酸序列的相应核酸的表达相比,在宿主细胞中SluCas9多肽或其变体从所述核酸的的表达增加,密码子优化的多核苷酸序列从所述参考多核苷酸序列得到。在一些实施方案中,密码子优化的多核苷酸序列包含SEQ ID NO:44或45的密码子优化的多核苷酸序列,或其与SEQ ID NO:44或45的密码子优化的多核苷酸序列具有至少90%的序列同一性的变体。在一些实施方案中,参考多核苷酸序列包含来自SEQ ID NO:3的编码SluCas9的多核苷酸序列,或其与来自SEQ ID NO:3的编码SluCas9的多核苷酸序列具有至少90%的序列同一性的变体。在一些实施方案中,与在宿主细胞中SluCas9多肽或其变体从参考多核苷酸序列的表达相比,在宿主细胞中SluCas9多肽或其变体从密码子优化的多核苷酸序列的的表达增加至少约10%(例如至少约15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、100%或更多的任一种)。
在一些实施方案中,指导RNA和SluCas9多肽用作用于关闭细菌细胞中基因表达的诱导系统。在一些情况中,将编码合适的指导RNA和/或合适的SluCas9多肽的核酸并入靶细胞的染色体中,并在诱导型启动子的控制下。当指导RNA和/或SluCas9多肽被诱导时,当存在指导RNA和SluCas9多肽两者并形成复合体时,靶DNA在感兴趣的位置(例如,在独立的质粒上的靶基因)被切割(或以其他方式被修饰)。因此,在一些情况中,细菌表达菌株被人工改造以包含细菌基因组中编码适当SluCas9多肽的核酸序列和/或质粒上适当的指导RNA(例如在诱导型启动子的控制下),从而允许其中通过诱导指导RNA和SluCas9多肽的表达可以控制任何靶向的基因(由引入菌株中的独立质粒表达)的表达的实验。在一些情况中,SluCas9多肽具有酶促活性,其以除引入双链断裂外的方式修饰靶DNA。可用于修饰靶DNA的感兴趣的酶促活性(例如,通过将具有酶促活性的异源多肽融合到SluCas9多肽,从而产生嵌合SluCas9多肽)包括,但不限于甲基转移酶活性、脱甲基酶活性、DNA修复活性、DNA损伤活性、脱氨作用活性、歧化酶活性、烷基化活性、脱嘌呤活性、氧化活性、嘧啶二聚体形成活性、整合酶活性、转座酶活性、重组酶活性、聚合酶活性、连接酶活性、解旋酶活性、光解酶活性或糖基化酶活性)。甲基化作用和脱甲基作用在本领域中被认为是外遗传基因调节的重要模式,而DNA损伤和修复活性对于细胞存活和对于响应环境应激的正确基因组维持是必不可少的。因此,本文中的方法应用于靶DNA的外遗传修饰中,并可通过将所期望的互补核酸序列基因工程改造到指导RNA的DNA-靶向区段中而用于控制在靶DNA中任何位置处的靶DNA的外遗传修饰。本文的方法还应用于在靶DNA内任何所需位置处的DNA的有意和受控的损伤中。本文的方法还应用于在靶DNA内任何所需位置处的DNA的序列特异性和受控修复。将DNA-修饰酶促活性靶向靶DNA中特定位置的方法应用于研究和临床应用两者中。
在一些情况中,SluCas9多肽具有调节靶DNA的转录的活性(例如,在嵌合SluCas9多肽的情况中,等等)。在一些情况中,包含表现出增加或减少转录的能力的异源多肽(例如转录激活因子或转录阻遏蛋白多肽)的嵌合SluCas9多肽用于增加或减少靶DNA中特定位置处的靶DNA转录,其由指导RNA的DNA-靶向区段指导。用于提供具有转录调节活性的嵌合SluCas9多肽的来源多肽的例子包括,但不限于光诱导的转录调节物、小分子/药物应答转录调节物、转录因子、转录阻遏蛋白等。在一些情况中,所述方法用于控制靶向的编码-RNA(蛋白编码基因)和/或靶向的非编码RNA(例如tRNA、rRNA、snoRNA、siRNA、miRNA、长ncRNA等)的表达。在一些情况中,SluCas9多肽具有修饰与DNA相关的多肽(例如组蛋白)的酶促活性。在一些实施方案中,酶促活性是甲基转移酶活性、脱甲基酶活性、乙酰转移酶活性、脱乙酰酶活性、激酶活性、磷酸酶活性、泛素连接酶活性(即,泛素化活性)、脱泛素活性、腺苷化(adenylation)活性、脱腺苷化活性、苏素化(SUMOylating)活性、脱苏素化(deSUMOylating)活性、核糖基化活性、脱核糖基化(deribosylation)活性、豆蔻酰化活性、脱豆蔻酰化(demyristoylation)活性糖基化活性(例如来自GlcNAc转移酶)或去糖基化活性。本文列举的酶促活性催化对蛋白的共价修饰。这种修饰在本领域中已知改变靶蛋白的稳定性或活性(例如,由于激酶活性的磷酸化可以取决于靶蛋白刺激或沉默蛋白活性)。作为蛋白靶特别令人感兴趣的是组蛋白。组蛋白在本领域中已知结合DNA并形成称为核小体的复合体。可以修饰组蛋白(例如通过甲基化作用、乙酰化作用、泛素化、磷酸化)以引出周围DNA的结构变化,从而控制DNA的潜在大部分对相互作用因子如转录因子、聚合酶等的可接近性。单个组蛋白可以许多不同方式和以许多不同组合进行修饰(例如,组蛋白3的赖氨酸27,H3K27的三甲基化与受阻遏的转录的DNA区域相关,而组蛋白3的赖氨酸4,H3K4的三甲基化与活跃转录的DNA区域相关)。因此,具有组蛋白修饰活性的位点定向修饰多肽应用于DNA结构的位点特异性控制,并可用于改变靶DNA的选定区域中的组蛋白修饰模式。这种方法应用于研究和临床应用两者中。
在一些实施方案中,同时使用多种指导RNAs以同时修饰相同靶DNA或不同靶DNAs上的不同位置。在一些实施方案中,两种或更多种指导RNAs靶向相同的基因或转录物或基因座。在一些实施方案中,两种或更多种指导RNAs靶向不同的不相关基因座。在一些实施方案中,两种或更多种指导RNA靶向不同但相关的基因座。
在一些情况中,SluCas9多肽直接作为蛋白提供。作为一个非限制性实例,可以使用原生质球转化用外源蛋白和/或核酸转化真菌(例如酵母)(参见Kawai等人, BioengBugs. 2010年11月-12月;1(6):395-403 :“Transformation of Saccharomycescerevisiae and other fungi: methods and possible underlying mechanism”;和Tanka等人, Nature. 2004 Mar 18;428(6980):323-8:“Conformational variations inan infectious protein determine prion strain differences”;两者均整体引入本文作为参考)。因此,可以将SluCas9多肽并入原生质球(具有或不具有编码指导RNA的核酸以及具有或不具有供体多核苷酸),并且所述原生质球可用于将内容物引入酵母细胞。可以通过任何方便的方法将SluCas9多肽引入细胞(提供给细胞);这种方法是本领域普通技术人员已知的。作为另一个非限制性实例,可以将SluCas9多肽直接注射入细胞(例如,具有或不具有编码指导RNA的核酸以及具有或不具有供体多核苷酸),例如斑马鱼胚胎的细胞、受精的小鼠卵母细胞的前核等。
感兴趣的靶细胞
在一些上述应用中,所述方法可用于在体内和/或先体外后体内和/或体外在有丝分裂或有丝分裂后细胞中诱导DNA切割、DNA修饰和/或转录调节(例如以产生可以再引入个体的基因修饰细胞)。因为指导RNA通过与靶DNA杂交提供特异性,所以在公开的方法中,感兴趣的有丝分裂和/或有丝分裂后细胞可能包括来自任何生物的细胞(例如细菌细胞,古细菌细胞,单细胞真核生物的细胞,植物细胞,藻类细胞,例如丛粒藻(Botryococcus braunii)、雷氏衣藻(Chlamydomonas reinhardtii)、微拟球藻(Nannochloropsis gaditana)、蛋白核小球藻(Chlorella pyrenoidosa)、展枝马尾藻(Sargassum patens C. Agardh)等,真菌细胞(例如酵母细胞),动物细胞,来自无脊椎动物(例如果蝇、刺胞动物、棘皮动物、线虫等)的细胞,来自脊椎动物(例如鱼、两栖动物、爬行动物、鸟、哺乳动物)的细胞,来自哺乳动物的细胞,来自啮齿类动物的细胞,来自灵长类动物的细胞,来自人的细胞,等)。
任何类型的细胞都可能是有意义的(例如干细胞,例如胚胎干(ES)细胞、诱导的多潜能干(iPS)细胞、生殖细胞;体细胞,例如成纤维细胞、造血细胞、神经元、肌细胞、骨细胞、肝细胞、胰细胞;处于任何阶段的胚胎的体外或体内胚胎细胞,例如1-细胞、2-细胞、4-细胞、8-细胞等阶段斑马鱼胚胎;等)。细胞可以来自确立的细胞系,或者它们可以是原代细胞,其中“原代细胞”、“原代细胞系”和“原代培养物”在本文中可互换使用,以指已经衍生自生物并被允许在体外生长有限数目的培养物传代即分裂的细胞和细胞培养物。例如,原代培养物是可能已经传代0次、1次、2次、4次、5次、10次或15次但未传代通过转捩阶段的足够次数的培养物。通常,本发明的原代细胞系在体外维持少于10次传代。靶细胞在许多实施方案中是单细胞生物,或在培养物中生长。
如果细胞是原代细胞,则可以通过任何方便的方法从个体中收获它们。例如,白细胞可通过单采血液成分术、白细胞除去法(leukocytapheresis)、密度梯度分离等方便地收获,而来自诸如皮肤、肌肉、骨髓、脾、肝、胰、肺、肠、胃等的组织的细胞最方便通过活组织检查收获。可以使用适当的溶液分散或悬浮收获的细胞。这种溶液通常将是平衡盐溶液,例如生理盐水、磷酸缓冲盐水(PBS)、Hank氏平衡盐溶液等,方便地补加了胎牛血清或其他天然存在的因子,连带着可接受的低浓度缓冲液,通常为5-25 mM。方便的缓冲液包括HEPES、磷酸盐缓冲液、乳酸盐缓冲液等。细胞可以立即使用,或者它们可以冷冻贮藏长的时间段,被解冻并能够再使用。在这种情况中,通常将细胞在10%DMSO,50%血清,40%缓冲的培养基或如本领域中所通常使用的一些其他这种溶液中冷冻,以在这种冷冻温度保存细胞,并以如本领域中所通常已知的方式解冻,以用于解冻冷冻的培养的细胞。
编码指导RNA和/或SluCas9多肽的核酸
在一些实施方案中,方法包括接触靶DNA或将一种或多种包含编码指导RNA和/或SluCas9多肽的核苷酸序列的核酸和/或供体多核苷酸引入细胞(或细胞群体)。包含编码指导RNA和/或SluCas9多肽的核苷酸序列的合适核酸包括表达载体,其中包含编码指导RNA和/或SluCas9多肽的核苷酸序列的表达载体是“重组表达载体”。
在一些实施方案中,重组表达载体是病毒构建体,例如重组腺伴随病毒构建体(参见,例如美国专利No. 7,078,387)、重组腺病毒构建体、重组慢病毒构建体等。
合适的表达载体包括,但不限于,病毒载体(例如基于痘苗病毒的病毒载体;脊髓灰质炎病毒;腺病毒(参见,例如Li等人, Invest Opthalmol Vis Sci 35:2543 2549,1994;Borras等人, Gene Ther 6:515 524, 1999;Li和Davidson, PNAS 92:7700 7704,1995;Sakamoto等人, H Gene Ther 5:1088 1097, 1999;WO 94112649、WO 93/03769;WO93/19191;WO 94/28938;WO 95/11984和WO 95/00655);腺伴随病毒(参见,例如 Ali等人,Hum Gene Ther 9:81 86, 1998, Flannery等人, PNAS 94:6916 6921, 1997;Bennett等人, Invest Opthalmol Vis Sci 38:2857 2863, 1997;Jomary等人, Gene Ther 4:683690, 1997, Rolling等人, Hum Gene Ther 10:641 648, 1999;Ali等人, Hum Mol Genet5:591 594, 1996;Srivastava在WO 93/09239中,Samulski等人, J. Vir. (1989) 63:3822-3828;Mendelson等人, Viral. (1988) 166:154-165;和Flotte等人, PNAS (1993)90:10613-10617);SV40;单纯疱疹病毒;人免疫缺陷病毒(参见,例如 Miyoshi等人, PNAS94:10319 23, 1997;Takahashi等人, J Viral73:7812 7816, 1999);反转录病毒载体(例如鼠白血病病毒,脾脏坏死病毒,以及衍生自反转录病毒的载体,例如劳斯肉瘤病毒,Harvey肉瘤病毒,禽类白血病病毒,慢病毒,人免疫缺陷病毒,骨髓增生肉瘤病毒和乳癌病毒);等等。
许多合适的表达载体是本领域技术人员已知的,并且许多是可商购获得的。作为实例提供下述载体;对于真核宿主细胞:pXT1、pSG5(Stratagene)、pSVK3、pBPV、pMSG和pSVLSV40(Pharmacia)。然而,可以使用任何其他载体,只要它与宿主细胞相容即可。
在一些实施方案中,编码指导RNA和/或SluCas9多肽的核苷酸序列可操作地连接至控制元件,例如转录控制元件,例如启动子。转录控制元件可以在真核细胞,例如哺乳动物细胞,或原核细胞(例如细菌或古细菌细胞)中起作用。在一些实施方案中,编码指导RNA和/或SluCas9多肽的核苷酸序列可操作地连接至多个控制元件,其允许在原核和真核细胞两者中表达编码指导RNA和/或SluCas9多肽的核苷酸序列。
取决于所使用的宿主/载体系统,可以在表达载体中使用许多合适的转录和翻译控制元件中的任何一种,包括组成型和诱导型启动子、转录增强子元件、转录终止子等(例如U6启动子、H1启动子等;参见上文)(参见,例如Bitter等人 (1987) Methods inEnzymology, 153:516-544)。
在一些实施方案中,指导RNA和/或SluCas9多肽可以作为RNA提供。在这种情况中,指导RNA和/或编码SluCas9多肽的RNA可以通过直接化学合成产生,或者可以从编码指导RNA的DNA体外转录。从DNA模板合成RNA的方法是本领域众所周知的。在一些情况中,指导RNA和/或编码SluCas9多肽的RNA将使用RNA聚合酶(例如 T7聚合酶、T3聚合酶、SP6聚合酶等)体外合成。一旦合成,RNA就可以直接接触靶DNA,或者可以通过用于将核酸引入细胞的任何众所周知的技术(例如显微注射、电穿孔、转染等)引入细胞。
可以使用十分发达的转染技术将编码指导RNA(作为DNA或RNA引入)和/或SluCas9多肽(作为DNA或RNA引入)的核苷酸和/或供体多核苷酸提供给细胞;参见,例如 Angel和Yanik (2010) PLoS ONE 5(7): e 11756,和来自Qiagen的可商购获得的TransMessenger®试剂,来自Stemgent的Stemfect™ RNA转染试剂盒,和来自Mims Bio的TransiT®-mRNA转染试剂盒。也参见Beumer等人 (2008) Efficient gene targeting in Drosophila bydirect embryo injection with zinc-finger nucleases. PNAS 105(50):19821-19826。另一方面,可以在DNA载体上提供编码指导RNA和/或SluCas9多肽和/或嵌合SluCas9多肽的核酸和/或供体多核苷酸。用于将核酸转移到靶细胞中的许多载体是可获得的,例如质粒、黏粒、小环、噬菌体、病毒等。包含一种或多种核酸的载体可以附加型地维持,例如作为质粒,小环DNAs,病毒,例如巨细胞病毒,腺病毒等,或者它们可以通过同源重组或随机整合整合到靶细胞基因组中,例如反转录病毒衍生的载体,例如MMLV、HIV-1、ALV等。
载体可以直接提供给细胞。换句话说,使细胞与包含编码指导RNA和/或SluCas9多肽和/或嵌合SluCas9多肽的核酸和/或供体多核苷酸的载体接触,以使载体被细胞摄取。使细胞与作为质粒的核酸载体接触的方法,包括电穿孔、氯化钙转染、显微注射和脂质转染法是本领域众所周知的。对于病毒载体递送,使细胞与包含编码指导RNA和/或SluCas9多肽和/或嵌合SluCas9多肽的核酸和/或供体多核苷酸的病毒颗粒接触。反转录病毒,例如慢病毒,特别适合于本发明的方法。通常使用的反转录病毒载体是“缺陷的”,即,不能产生生产性感染所需的病毒蛋白。相反,载体的复制需要在包装细胞系中生长。为了产生包含感兴趣的核酸的病毒颗粒,通过包装细胞系将包含所述核酸的反转录病毒核酸包装到病毒壳体中。不同的包装细胞系提供了不同的要并入壳体中的包膜蛋白(亲嗜性、双嗜性或异嗜性),这种包膜蛋白决定了病毒颗粒对细胞的特异性(对于鼠和大鼠是亲嗜性的;对于大多数哺乳动物细胞类型包括人、狗和小鼠是双嗜性的;且对于除鼠细胞外的大多数哺乳动物细胞类型是异嗜性的)。适当的包装细胞系可用于确保细胞被包装的病毒颗粒靶向。将包含编码重编程序因子的核酸的反转录病毒载体引入包装细胞系并收集由包装系产生的病毒颗粒的方法是本领域众所周知的。核酸也可以通过直接显微注射引入(例如将RNA注射到斑马鱼胚胎中)。
用于向细胞提供编码指导RNA和/或SluCas9多肽和/或嵌合SluCas9多肽的核酸和/或供体多核苷酸的载体通常将包含合适的启动子,以用于驱动感兴趣的核酸的表达,即,转录激活。换句话说,感兴趣的核酸将可操作地连接至启动子。这可以包括遍在起作用的启动子,例如,CMV-13-肌动蛋白启动子,或诱导型启动子,例如在特定细胞群体中有活性或对诸如四环素的药物的存在起反应的启动子。通过转录激活,意图是转录将在靶细胞中增加至基础水平的至少10倍、至少100倍、更通常至少1000倍。此外,用于向细胞提供指导RNA和/或SluCas9多肽和/或嵌合SluCas9多肽和/或供体多核苷酸的载体可以包括编码靶细胞中选择标记的核酸序列,以便鉴定已摄取指导RNA和/或SluCas9多肽和/或嵌合SluCas9多肽和/或供体多核苷酸的细胞。
指导RNA和/或SluCas9多肽和/或嵌合SluCas9多肽可代之以用于接触DNA或作为RNA引入细胞中。将RNA引入细胞的方法是本领域已知的,并且可以包括,例如,直接注射、转染或用于引入DNA的任何其他方法。SluCas9多肽可以代之以作为多肽提供给细胞。这种多肽可以任选地与增加产物溶解度的多肽结构域融合。所述结构域可以通过确定的蛋白酶切割位点连接至多肽,例如TEV序列,其可被TEV蛋白酶切割。接头还可以包括一种或多种柔性序列,例如,1至10个甘氨酸残基。在一些实施方案中,融合蛋白的切割在维持产物的溶解度的缓冲液中进行,例如在有0.5至2 M尿素的情况下、在有增加溶解度的多肽和/或多核苷酸的情况下等。感兴趣的结构域包括内体裂解(endosomolytic)结构域,例如,流感HA域;和其他帮助生产的多肽,例如 IF2结构域、GST结构域、GRPE结构域等。可以配制多肽用于提高的稳定性。例如,肽可以被聚乙二醇化(PEGylated),其中聚氧乙烯(polyethyleneoxy)基团提供了血流中增加的生存期。
额外地或另一方面,SluCas9多肽可以与多肽透膜体(permeant)结构域融合以促进由细胞摄取。许多透膜体结构域是本领域已知的,并且可以用于本发明的非整合多肽,包括肽、肽模拟物(peptidomimetics)和非肽载体。例如,透膜体肽可以衍生自黑尾果蝇(Drosophila melanogaster)转录因子触角足的第三α螺旋,称为penetratin,其包含也在J. Biol. Chem., 271 (1996), 第18188-18193页中公开的氨基酸序列RQIKIWFQNRRMKWKK基序(用于鉴定但不是为了在本申请中公开起见)。作为另一个实例,透膜体肽包含HIV-1tat碱性区氨基酸序列,其可以包括例如天然存在的tat蛋白的氨基酸49-57。
其他透膜体结构域包括聚精氨酸基序,例如HIV-1 rev蛋白的氨基酸34-56的区域、九精氨酸、acta-精氨酸等。(参见,例如 Futaki等人 (2003) Curr Protein Pept Sci.2003年4月;4(2): 87-9和446;和Wender等人 (2000) Proc. Natl. Acad. Sci. U.S.A.2000年11月21日;97(24):13003-8;公开的美国专利申请公开Nos. 20030220334;20030083256;20030032593;和20030022831,关于易位肽和拟肽的教导在本文特别引入作为参考。九精氨酸(R9)序列是已被表征的更有效的PTDs之一(Wender等人,2000;Uemura等人,2002)。可以选择进行融合的位点,以最优化多肽的生物学活性、分泌或结合特征。最佳位点将通过常规实验确定。在一些实施方案中,多肽透膜体结构域被化学修饰以增加PTD的生物利用率。示例性修饰公开于Expert Opin Drug Deliv. 2009年11月;6(11):1195-205。
SluCas9多肽可以在体外或通过真核细胞、通过原核细胞或通过体外转录和翻译(IVTT)来产生,并且其可以通过解折叠例如热变性、OTT还原等进一步加工,并且可以使用本领域已知的方法进一步重折叠。
不改变一级序列的感兴趣的修饰包括多肽的化学衍生,例如酰化作用、乙酰化作用、羧化作用、酰胺化等。还包括糖基化的修饰,例如,通过在多肽的合成和加工过程中或在进一步的加工步骤中修饰多肽的糖基化模式而产生的那些;例如通过使多肽暴露于影响糖基化的酶,例如哺乳动物的糖基化或去糖基化酶。还包括具有磷酸化的氨基酸残基的序列,例如,磷酸酪氨酸,磷酸丝氨酸或磷酸苏氨酸。
本发明还包括已使用普通分子生物学技术和合成化学修饰的指导RNAs和SluCas9多肽,以便提高其对蛋白水解降解的抗性、改变靶序列特异性、最优化溶解度性质、改变蛋白活性(例如转录调节活性、酶促活性等)或使其更适合作为治疗剂。这种多肽的类似物包括含有除天然存在的L-氨基酸以外的残基的那些,例如0-氨基酸或非天然存在的合成氨基酸。D-氨基酸可以取代一些或所有氨基酸残基。SluCas9多肽可以使用本领域已知的常规方法通过体外合成来制备。各种商业合成装置是可获得的,例如,Applied Biosystems,Inc.、Beckman等的自动合成仪。通过使用合成仪,天然存在的氨基酸可以被非天然氨基酸取代。特定的序列和制备方式将由便利、经济、所需的纯度等确定。
如果期望,可以在合成过程中或表达过程中将各种基团引入肽中,其允许与其他分子或表面连接。因此,半胱氨酸可用于制备硫醚,组氨酸用于连接至金属离子络合物,羧基用于形成酰胺或酯,氨基用于形成酰胺等。
SluCas9多肽也可以根据重组合成的常规方法分离和纯化。可以制备表达宿主的裂解物,并使用HPLC、排阻层析、凝胶电泳、亲和层析或其他纯化技术纯化裂解物。相对于与产物的制备及其纯化方法相关的污染物,所使用的组合物多半将包含至少20重量%的所期望的产物,例如至少约75重量%或至少约95重量%,并且对于治疗目的,至少99.5重量%。通常,百分比将基于总蛋白。为了诱导DNA切割和重组,或对靶DNA的任何期望的修饰,或对与靶DNA相关的多肽的任何期望的修饰,指导RNA和/或SluCas9多肽和/或供体多核苷酸,不管它们作为核酸还是作为多肽引入,被提供给细胞达约30分钟至约24小时,例如1小时、1.5小时、2小时、2.5小时、3小时、3.5小时、4小时、5小时、6小时、7小时、8小时、12小时、16小时、18小时,20小时或从约30分钟到约24小时的任何其他时间段,其可以以约每天至约每4天的频率重复,例如每1.5天、每2天、每3天或从约每天至约每四天的任何其他频率。可将一种或多种试剂一次或多次地提供给细胞,例如一次、两次、三次或不止三次,并且在每次接触事件之后,允许细胞与一种或多种试剂温育一些量的时间,如16-24小时,所述时间之后将培养基置换为新鲜培养基,并进一步培养细胞。在向细胞提供两种或更多种不同的靶向复合体(例如,与相同或不同靶DNA内的不同序列互补的两种不同的指导RNAs)的情况中,复合体可以同时提供(例如,作为两种多肽和/或核酸),或同时递送。另一方面,它们可以被连续地提供,例如首先提供靶向复合体,后面是第二靶向复合体等,或反之亦然。
通常,将有效量的指导RNA和/或SluCas9多肽和/或供体多核苷酸提供给靶DNA或细胞以诱导靶修饰。指导RNA和/或SluCas9多肽和/或供体多核苷酸的有效量是相对于阴性对照(例如与空载体或不相干多肽接触的细胞),诱导在两个同源序列之间观察到的靶修饰量的2-倍增加或更多的量。也就是说,有效量或剂量的指导RNA和/或SluCas9多肽和/或供体多核苷酸将诱导在靶DNA区域观察到的靶修饰量的2-倍增加、3-倍增加、4-倍增加或更多,在一些情况下观察到的重组量的5-倍增加、6-倍增加或更多,有时7-倍或8-倍增加或更多,例如观察到的重组量的10-倍、50-倍或100-倍增加或更多,在一些情况下200-倍、500-倍、700-倍或1000-倍增加或更多,例如5000-倍或10,000-倍增加。靶修饰的量可以通过任何方便的方法来测量。例如,可以将沉默报道基因构建体共转染到细胞中,所述沉默报道基因构建体包含与侧接重复序列的指导RNA的靶向区段(靶向序列)互补的序列,其在重组时将重建编码活性报告基因的核酸,且在与指导RNA和/或SluCas9多肽和/或供体多核苷酸接触后评估报道蛋白的量,例如与指导RNA和/或SluCas9多肽和/或供体多核苷酸接触后2小时、4小时、8小时、12小时、24小时、36小时、48小时、72小时或更多。作为另一种更灵敏性的测定,例如,在与指导RNA和/或SluCas9多肽和/或供体多核苷酸接触后,可通过所述区域的PCR或DNA杂交来评估在包含靶DNA序列的感兴趣的基因组DNA区域的重组程度,例如与指导RNA和/或SluCas9多肽和/或供体多核苷酸接触后2小时、4小时、8小时、12小时、24小时、36小时、48小时、72小时或更多。
使细胞与指导RNA和/或SluCas9多肽和/或供体多核苷酸接触可以在任何培养基中和在任何促进细胞存活的培养条件下发生。例如,可以将细胞悬浮在任何合适的方便的营养培养基中,例如lscove氏改良DMEM或RPMI1640,补加了胎牛血清或热灭活的山羊血清(约5-10%),L-谷氨酰胺,硫醇,特别是2-巯基乙醇,和抗生素,例如青霉素和链霉素。培养物可以含有细胞对其响应性的生长因子。如本文所定义的,生长因子是能够通过对跨膜受体的特异性作用而在培养物中或在完整组织中促进细胞存活、生长和/或分化的分子。生长因子包括多肽和非多肽因子。促进细胞存活的条件通常容许非同源末端连接和同源性指导的修复。在期望将多核苷酸序列插入靶DNA序列的应用中,还向细胞提供了包含要插入的供体序列的多核苷酸。所谓“供体序列”或“供体多核苷酸”指的是在由SluCas9多肽诱导的切割位点处插入的核酸序列。供体多核苷酸将含有与切割位点处的基因组序列足够的同源性,例如与侧接切割位点的核苷酸序列70%、80%、85%、90%、95%或100%的同源性,例如在切割位点约50个碱基或更少之内,例如在约30个碱基之内、在约15个碱基之内、在约10个碱基之内、在约5个碱基之内或紧接地侧接切割位点,以支持其与与其具有同源性的基因组序列之间的同源性指导的修复。供体和基因组序列之间具有序列同源性的约25、50、100或200个核苷酸或不止200个核苷酸(或10至200个核苷酸之间的任何整数值,或更多)将支持同源性指导的修复。供体序列可以具有任何长度,例如10个核苷酸或更多、50个核苷酸或更多、100个核苷酸或更多、250个核苷酸或更多、500个核苷酸或更多、1000个核苷酸或更多、5000个核苷酸或更多等。
供体序列通常与其置换的基因组序列不同。相反,供体序列可以含有相对于基因组序列的至少一个或多个单碱基改变、插入、缺失、倒位或重排,只要存在足够的同源性以支持同源性指导的修复即可。在一些实施方案中,供体序列包含侧接两个同源性区域的非同源序列,从而使得靶DNA区域和两个侧翼序列之间的同源性指导的修复导致非同源序列插入靶区域。供体序列也可以包含载体主链,该载体主链含有与感兴趣的DNA区域不同源并且不打算插入感兴趣的DNA区域的序列。通常,供体序列的一个或多个同源区域将与期望与其进行重组的基因组序列具有至少50%的序列同一性。在某些实施方案中,存在60%、70%、80%、90%、95%、98%、99%或99.9%的序列同一性。取决于供体多核苷酸的长度,可以存在1%至100%序列同一性之间的任何值。与基因组序列相比,供体序列可包含某些序列差异,例如限制位点、核苷酸多态性、选择标记(例如抗药性基因、荧光蛋白、酶等)等,其可用于评估供体序列在切割位点的成功插入,或在一些情况中可用于其他目的(例如,表示在靶向的基因组基因座的表达)。在一些情况中,如果位于编码区中,则这种核苷酸序列差异将不改变氨基酸序列,或将产生沉默氨基酸改变(即,不影响蛋白结构或功能的改变)。另一方面,这些序列差异可以包括侧翼重组序列,例如FLPs、loxP序列等,其可以在较后的时间激活以去除标记序列。
供体序列可以作为单链DNA、单链RNA、双链DNA或双链RNA提供给细胞。可以将其以线性或环状形式引入细胞中。如果以线性形式引入,则可以通过本领域技术人员已知的方法保护供体序列的末端(例如,免于核酸外切降解)。例如,将一个或多个双脱氧核苷酸残基添加至线性分子的3'末端和/或将自互补寡核苷酸连接至一个或两个末端。参见,例如,Chang等人 (1987) Proc. Natl. Acad. Sci. USA 84:4959-4963;Nehls等人 (1996)Science 272:886-889。保护外源多核苷酸免于降解的额外方法包括,但不限于,添加一个或多个末端氨基和使用修饰的核苷酸间键,如例如硫代磷酸酯,氨基磷酸酯和0-甲基核糖或脱氧核糖残基。作为保护线性供体序列末端的备择方案,可以在具有同源性的区域之外包括可以在不影响重组的情况下降解的额外长度的序列。可以将供体序列作为载体分子的部分引入细胞中,所述载体分子具有额外的序列,如例如复制起点、启动子和编码抗生素抗性的基因。此外,供体序列可以作为裸(即未修饰的)核酸,作为与诸如脂质体或泊洛沙姆的试剂复合的核酸引入,或者可以通过病毒(例如腺病毒、AAV)递送,如上文对于编码指导RNA和/或SluCas9多肽的核酸和/或供体多核苷酸所述的。
按照上述方法,感兴趣的DNA区域可以先体外后体内切割和修饰,即,“基因修饰”。在一些实施方案中,当已将选择标记物插入感兴趣的DNA区域中时,可通过将基因修饰细胞与剩余群体分开来对于包含遗传修饰的那些富集细胞群体。在富集之前,“基因修饰”细胞可能仅占细胞群体的约1%或更多(例如2%或更多、3%或更多、4%或更多、5%或更多、6%或更多、7%或更多、8%或更多、9%或更多、10%或更多、15%或更多或20%或更多)。可以通过适合于所用的选择标记的任何方便的分离技术来实现“基因修饰”细胞的分离。例如,如果已经插入了荧光标记,则可以通过荧光激活的细胞分选术来分离细胞,而如果已经插入了细胞表面标记,则可以通过亲和分离技术将细胞与异质群体分离,例如,磁性分离、亲和层析、用附着于固体基质的亲和试剂“淘选”或其他方便的技术。提供精确分离的技术包括荧光激活细胞分选仪,其可以具有不同程度的复杂化。例如多颜色通道、低角度和钝角光散射检测通道、阻抗通道等。通过使用与死细胞相关的染料(例如碘化丙锭),可以相对于死细胞选择细胞。可以采用对基因修饰细胞的生存力不过度有害的任何技术。以这种方式获得了对于包含修饰的DNA的细胞高度富集的细胞组合物。所谓“高度富集的”指的是基因修饰细胞将为细胞组合物的70%或更多、75%或更多、80%或更多、85%或更多、90%或更多,例如,细胞组合物的约95%或更多或98%或更多。换句话说,所述组合物可以是基因修饰细胞的基本上纯的组合物。
通过本文描述的方法产生的基因修饰细胞可以立即使用。另一方面,可将细胞于液氮温度冷冻并贮藏长的时间段,被解冻并能够再使用。在这种情况中,通常将细胞在10%二甲基亚砜(DMSO),50%血清,40%缓冲的培养基或如本领域中所通常使用的一些其他这种溶液中冷冻,以在这种冷冻温度保存细胞,并以如本领域中所通常已知的方式解冻,以用于解冻冷冻的培养的细胞。
可以在各种培养条件下体外培养基因修饰细胞。可以在培养中扩充细胞,即,在促进其增殖的条件下生长。培养基可以是液体或半固体,例如含有琼脂、甲基纤维素等。可以将细胞群体悬浮在合适的营养培养基中,例如lscove氏改良DMEM或RPMI 1640,正常补加了胎牛血清(约5-10%),L-谷氨酰胺,硫醇,特别是2-巯基乙醇,和抗生素,例如青霉素和链霉素。培养物可以含有各种细胞对其响应性的生长因子。如本文所定义的,生长因子是能够通过对跨膜受体的特异性作用而在培养物中或在完整组织中促进细胞存活、生长和/或分化的分子。生长因子包括多肽和非多肽因子。可以将已经以这种方式基因修饰的细胞移植到主体中,以用于诸如基因治疗的目的,例如以治疗疾病或作为抗病毒、抗病原物质或抗癌治疗,用于农业中基因修饰生物的生产,或用于生物学研究。主体可以是新生儿、幼年或成体。特别感兴趣的是哺乳动物主体。可以用本方法治疗的哺乳动物物种包括犬科动物和猫科动物;马科动物;牛科动物;羊;等和灵长类动物,特别是人。动物模型,特别是小哺乳动物(例如小鼠、大鼠、豚鼠、仓鼠、兔形目(lagomorpha)(例如兔)等)可用于实验研究。
可以将细胞单独地或与合适的基底或基质一起提供给主体,例如以支持它们在它们要移植到的组织中的生长和/或组织。通常,将施用至少1x10^3的细胞,例如5x103的细胞、1x104的细胞、5x104的细胞、1x105的细胞、1 x 106的细胞或更多。可以通过下述途径的任一种将细胞引入主体:肠胃外、皮下、静脉内、颅内、脊柱内、眼内或脊髓液中。可以通过注射、导管等引入细胞。用于局部递送(即,递送至损伤部位)的方法的实例包括,例如通过Ommaya贮液囊,例如用于鞘内递送(参见例如美国专利Nos. 5,222,982和5,385,582,引入本文作为参考);通过快速浓注,例如通过注射器,例如进入关节中;通过持续输注,例如通过套管插入术,例如具有对流(参见例如,美国申请No. 20070254842,引入本文作为参考);或通过植入在其上已可逆附着细胞的设备(参见例如美国申请Nos. 20080081064和20090196903,引入本文作为参考)。为了产生转基因动物(例如转基因小鼠)起见,也可以将细胞引入胚胎(例如胚泡)中。
SluCas9系统的递送
指导RNA多核苷酸(RNA或DNA)和/或SluCas9多核苷酸(RNA或DNA)可以通过本领域已知的病毒或非病毒递送运载体来递送。
多核苷酸可以通过非病毒递送运载体递送,包括,但不限于,纳米颗粒、脂质体、核糖核蛋白、带阳电荷的肽、小分子RNA-缀合物、适配体-RNA嵌合体和RNA-融合蛋白复合体。Peer和Lieberman, Gene Therapy, 18: 1127-1133 (2011)中描述了一些示例性非病毒递送运载体(其集中于用于siRNA的非病毒递送运载体,其也可用于递送其他多核苷酸)。
重组腺伴随病毒(AAV)载体可用于递送。产生rAAV颗粒的技术在本领域中是标准的,其中将包括待递送的多核苷酸的待包装的AAV基因组,rep和cap基因以及辅助病毒功能提供给细胞。生产rAAV需要在单个细胞(在本文中表示为包装细胞)内存在下述组分:rAAV基因组,与rAAV基因组分开(即不在rAAV基因组中)的AAV rep和cap基因,以及辅助病毒功能。AAV rep和cap基因可能来自可衍生重组病毒的任何AAV血清型,并且可能来自与rAAV基因组ITRs不同的AAV血清型,包括,但不限于,AAV血清型AAV-1、AAV-2、AAV-3、AAV-4、AAV-5、AAV-6、AAV-7、AAV-8、AAV-9、AAV-10、AAV-11、AAV-12、AAV-13和AAV rh.74。假型rAAV的产生公开于例如WO 01/83692。AAV血清型
Genbank检索号
Figure 916603DEST_PATH_IMAGE002
产生包装细胞的方法是产生稳定表达用于AAV颗粒生产的所有必需组分的细胞系。例如,将包含缺乏AAV rep和cap基因的rAAV基因组,与rAAV基因组分开的AAV rep和cap基因以及选择标记(例如新霉素抗性基因)的质粒(或多个质粒)整合到细胞的基因组中。已通过诸如GC加尾(Samulski等人, 1982, Proc. Natl. Acad. S6. USA, 79:2077-2081)、添加含有限制性内切核酸酶切割位点的合成接头(Laughlin等人, 1983, Gene, 23:65-73)或通过直接平端连接(Senapathy & Carter, 1984, J. Bioi. Chern., 259:4661-4666)的程序将AAV基因组引入细菌质粒中。然后用辅助病毒如腺病毒感染包装细胞系。这个方法的优点是细胞是可选择的并且适合于大规模生产rAAV。合适方法的其他例子采用腺病毒或杆状病毒而不是质粒,以将rAAV基因组和/或rep和cap基因引入包装细胞。
rAAV生产的一般原理在例如Carter, 1992, Current Opinions inBiotechnology, 1533-539;和Muzyczka, 1992, Curr. Topics in Microbial. andlmmunol., 158:97-129中综述。各种方法描述于Ratschin等人, Mol. Cell. Bioi. 4:2072 (1984);Hermonat等人, Proc. Natl. Acad. Sci. USA, 81:6466 (1984);Tratschin等人, Mo1. Cell. Bioi. 5:3251 (1985);Mclaughlin等人, J. Virol., 62:1963 (1988);和Lebkowski等人, 1988 Mol. Cell. Bioi., 7:349 (1988). Samulski等人(1989, J. Virol., 63:3822-3828);美国专利No. 5,173,414;WO 95/13365和相应的美国专利No. 5,658.776;WO 95/13392;WO 96/17947;PCT/US98/18600;WO 97/09441 (PCT/US96/14423);WO 97/08298 (PCT/US96/13872);WO 97/21825 (PCT/US96/20777);WO 97/06243 (PCT/FR96/01064);WO 99/11764;Perrin等人 (1995) Vaccine 13:1244-1250;Paul等人 (1993) Human Gene Therapy 4:609-615;Clark等人 (1996) Gene Therapy 3:1124-1132;美国专利No. 5,786,211;美国专利No. 5,871,982;和美国专利No. 6,258,595。
AAV载体血清型可以与靶细胞类型匹配。例如,由除了别的以外的指示的AAV血清型转导的下述示例性细胞类型。
组织/细胞类型 血清型
AAV8, AAV9
骨骼肌 AAV1, AAV7, AAV6, AAV8, AAV9
中枢神经系统 AAV5, AAV1, AAV4
RPE AAV5, AAV4
感光细胞 AAV5
AAV9
心脏 AAV8
AAV8
AAV2
对主体施用治疗的数目可能有变化。将基因修饰细胞引入主体可能是一次事件;但在某些情况中,这种治疗可能引出改善达有限的时间段,并且需要正在进行的一系列的重复治疗。在其他情况中,在观察到效果之前,可能需要多次施用基因修饰细胞。确切的规程取决于疾病或状况、疾病的病期以及正被治疗的个别主体的参数。
在本公开内容的其他方面,采用指导RNA和/或SluCas9多肽和/或供体多核苷酸体内修饰细胞DNA,再一次用于诸如基因治疗的目的,例如以治疗疾病或作为抗病毒、抗病原物质或抗癌治疗,用于农业中基因修饰生物的生产,或用于生物学研究。在这些体内实施方案中,将指导RNA和/或SluCas9多肽和/或供体多核苷酸直接施用于个体。指导RNA和/或SluCas9多肽和/或供体多核苷酸可以通过本领域中用于向主体施用肽、小分子和核酸的许多众所周知的方法中的任一种来施用。可以将指导RNA和/或SluCas9多肽和/或供体多核苷酸并入多种制剂中。更特别地,本发明的指导RNA和/或SluCas9多肽和/或供体多核苷酸可以通过与合适的药学上可接受的载体或稀释剂组合而配制成药物组合物。
药物制剂是包含存在于药学上可接受的运载体中的一种或多种指导RNA和/或SluCas9多肽和/或供体多核苷酸的组合物。“药学上可接受的运载体”可以是由联邦或州政府的管理机构批准或在美国药典(US Pharmacopeia)或其他公认的供哺乳动物例如人之用的药典中列举的运载体。术语“运载体”是指稀释剂、佐剂、赋形剂或载体,本发明的化合物与其一起配制用于向哺乳动物施用。这种药物运载体可以是脂质,例如脂质体,例如脂质体树状聚体;液体,例如水和油,包括石油、动物、植物或合成起源的那些,例如花生油、大豆油、矿物油、芝麻油等,盐水;阿拉伯树胶,明胶,淀粉糊,滑石,角蛋白,胶态二氧化硅,尿素等。此外,可以使用辅助剂、稳定剂、增稠剂、润滑剂和着色剂。可以将药物组合物配制成固体、半固体、液体或气体形式的制剂,例如片剂、胶囊、粉末、颗粒、软膏、溶液、栓剂、注射液、吸入剂、凝胶、小球体和气溶胶。因此,可以以多种方式实现指导RNA和/或SluCas9多肽和/或供体多核苷酸的施用,包括口服、口腔含化(buccal)、直肠、肠胃外、腹膜内、皮内、经皮、气管内、眼内等施用。活性剂在施用后可以是全身性的,或者可以通过使用区域施用、壁内施用或使用其作用以将活性剂量保持在植入部位的植入物来局部化。可以将活性剂进行配制用于立即活性,或者可以将其进行配制用于持续释放。
对于一些状况,特别是中枢神经系统状况,可能必须配制试剂以穿越血脑屏障(888)。用于通过888进行药物递送的一种策略需要通过渗透手段(例如甘露糖醇或白三烯)或通过使用血管活性物质例如缓激肽生化地破坏888。使用888开孔(opening)以将特定试剂靶向脑肿瘤的潜力也是一种选择。当通过血管内注射施用组合物时,可以将888破坏剂与本发明的治疗用组合物共施用。通过888的其他策略可能需要使用内源性转运系统,包括窖蛋白(Caveolin)-1介导的胞转,载体介导的转运蛋白(例如葡萄糖和氨基酸载体),用于胰岛素或运铁蛋白的受体介导的胞转以及主动流出转运蛋白(例如p-糖蛋白)。主动转运部分也可以与供本发明之用的治疗用化合物缀合,以促进穿过血管内皮壁的转运。另一方面,在888后面的治疗剂的药物递送可以为通过局部递送,例如通过鞘内递送,例如通过Ommaya贮液囊(参见例如美国专利Nos. 5,222,982和5385582,引入本文作为参考);通过快速浓注,例如通过注射器,例如玻璃体内或颅内地;通过持续输注,例如通过套管插入术,例如具有对流(参见例如,美国申请No. 20070254842,在此引入作为参考);或通过植入在其上已可逆附着试剂的设备(参见例如美国申请Nos. 20080081064和20090196903,引入本文作为参考)。
通常,提供有效量的指导RNA和/或SluCas9多肽和/或供体多核苷酸。如上文关于先体外后体内方法所讨论的,在体内的指导RNA和/或SluCas9多肽和/或供体多核苷酸的有效量或有效剂量是相对于阴性对照(例如与空载体或不相干多肽接触的细胞),诱导在两个同源序列之间观察到的重组量的2倍增加或更多的量。重组的量可以通过任何方便的方法来测量,例如如上文所述和本领域已知的。指导RNA和/或SluCas9多肽和/或供体多核苷酸的有效量或有效剂量的计算在本领域普通技术人员的技术内,并且对于本领域技术人员而言将是常规的。要施用的最终量将取决于施用途径以及要治疗的病症或状况的特性。
给予特定患者的有效量将取决于多种因素,其中的几种将从一个患者到另一个患者不同。胜任的临床医生将能够确定治疗剂的有效量,以向患者施用以停止或逆转疾病状况的进展,正如所需要的。利用LD50动物数据以及对于所述试剂可获得的其他信息,临床医生可以取决于施用途径确定对于个体的最大安全剂量。例如,考虑到正向其中施用治疗用组合物的更大的流体实体,静脉内施用的剂量可以大于鞘内施用的剂量。类似地,可以以较高剂量或以重复剂量施用从身体快速清除的组合物,以维持治疗浓度。利用普通技术,胜任的临床医生将能够在常规临床试验过程中最优化特定治疗剂的剂量。
对于在药物中的包含,可以从合适的商业来源获得指导RNA和/或SluCas9多肽和/或供体多核苷酸。作为一般建议,每剂肠胃外施用的指导RNA和/或SluCas9多肽和/或供体多核苷酸的总药学有效量将在可以通过剂量反应曲线测量的范围内。
基于指导RNA和/或SluCas9多肽和/或供体多核苷酸的疗法,即,要用于治疗性施用的指导RNA和/或SluCas9多肽和/或供体多核苷酸的制剂必须是无菌的。无菌可由通过无菌滤过膜(例如 0.2 1-1m膜)过滤达到。通常将治疗用组合物放置入具有无菌通道口的容器中,例如,具有可通过皮下注射针刺穿的塞子的静脉内溶液袋或小瓶。基于指导RNA和/或SluCas9多肽和/或供体多核苷酸的疗法可以作为水溶液或作为用于重构的冻干制剂贮藏在单位或多剂容器中,例如,密封的安瓿或小瓶。作为冻干制剂的例子,将10- ml小瓶装填5ml无菌过滤的1%(w/v)化合物水溶液,并将所得混合物冻干。通过使用制菌注射用水(Water-for-Injection)重构冻干的化合物来制备输注溶液。
取决于所期望的制剂,药物组合物可以包括稀释剂的药学上可接受的无毒性载体,其被定义为通常用于配制用于动物或人施用的药物组合物的运载体。选择稀释剂以便不影响组合的生物活性。这种稀释剂的例子是蒸馏水、缓冲的水、生理盐水、PBS、林格液、葡萄糖溶液和Hank氏溶液(Hank's solution)。此外,药物组合物或制剂可包含其他载体,佐剂或无毒性、非治疗性、非免疫原性的稳定剂,赋形剂等。组合物还可包含额外的物质以近似生理条件,例如pH调节和缓冲剂、毒性调节剂、湿润剂和去污剂。
组合物还可以包含多种稳定剂中的任何一种,如例如抗氧化剂。当药物组合物包含多肽时,可以将多肽与各种众所周知的化合物复合,所述化合物增强多肽的体内稳定性,或者以其他方式增强其药理性质(例如,增加多肽的半衰期、降低其毒性、提高溶解度或摄取)。这种修饰或复合剂的实例包括硫酸盐、葡糖酸盐、柠檬酸盐和磷酸盐。组合物的核酸或多肽也可以与增强其体内属性的分子复合。这种分子包括,例如,碳水化合物、多胺、氨基酸、其他肽、离子(例如钠、钾、钙、镁、锰)和脂质。
关于适合于各种类型施用的制剂的进一步指导可以在Remington'sPharmaceutical Sciences, Mace Publishing Company, Philadelphia, Pa., 第17版(1985)中找到。对于药物递送方法的简要综述,参见Langer, Science 249:1527-1533(1990)。
可以施用药物组合物用于预防性和/或治疗性治疗。可以根据细胞培养和/或实验动物中的标准药学程序确定活性成分的毒性和治疗功效,包括,例如,确定LD50(对群体的50%致死的剂量)和ED50(在群体的50%治疗有效的剂量)。毒性和治疗效果之间的剂量比是治疗指数,且其可以表示为比率LD50/ED50。表现出大的治疗指数的治疗可能是优选的。
从细胞培养和/或动物研究获得的数据可用于配制用于人的剂量范围。活性成分的剂量通常在包括具有低毒性的ED50的循环浓度范围内。取决于所采用的剂量形式和所使用的施用途径,剂量可以在这个范围内变化。用于配制药物组合物的组分在一些实施方案中具有高纯度并且基本上不含潜在有害的污染物(例如,至少国家食品(National Food)(NF)级,通常至少分析级,包括至少药物级)。此外,计划用于体内使用的组合物通常是无菌的。就必须在使用前合成给定化合物来说,所得产物通常基本上不含任何潜在的毒性剂,特别是任何内毒素,其在合成或纯化过程中可能存在。用于肠胃外(parental)施用的组合物也是无菌的、基本上是等渗的并在GMP条件下制备。
要给予特定患者的治疗用组合物的有效量将取决于多种因素,其中的几种将从一个患者到另一个患者不同。胜任的临床医生将能够确定治疗剂的有效量,以向患者施用以停止或逆转疾病状况的进展,正如所需要的。利用LD50动物数据以及对于所述试剂可获得的其他信息,临床医生可以取决于施用途径确定对于个体的最大安全剂量。例如,考虑到正向其中施用治疗用组合物的更大的流体实体,静脉内施用的剂量可以大于鞘内施用的剂量。类似地,可以以较高剂量或以重复剂量施用从身体快速清除的组合物,以维持治疗浓度。利用普通技术,胜任的临床医生将能够在常规临床试验过程中最优化特定治疗剂的剂量。
基因修饰宿主细胞
本公开内容提供了基因修饰宿主细胞,包括分离的基因修饰宿主细胞,其中基因修饰宿主细胞包含(已经用下述基因修饰:
1) 外源指导RNA;2)外源核酸,其包含编码指导RNA的核苷酸序列;3)外源SluCas9多肽(例如天然存在的SluCas9;修饰的,即,突变的或变体,SluCas9;嵌合的SluCas9;等);4)外源核酸,其包含编码SluCas9多肽的核苷酸序列;或5)以上的任何组合。基因修饰细胞是通过用例如下述基因修饰宿主细胞而产生的:1) 外源指导RNA;2)外源核酸,其包含编码指导RNA的核苷酸序列;3)外源SluCas9多肽;4)外源核酸,其包含编码SluCas9多肽的核苷酸序列;或5)以上的任何组合)。
适合作为靶细胞的所有细胞也适合作为基因修饰宿主细胞。例如,感兴趣的基因修饰宿主细胞可以是来自任何生物的细胞(例如细菌细胞,古细菌细胞,单细胞真核生物的细胞,植物细胞,藻类细胞,例如丛粒藻(Botryococcus braunii)、雷氏衣藻(Chlamydomonas reinhardtii)、微拟球藻(Nannochloropsis gaditana)、蛋白核小球藻(Chlorel/a pyrenoidosa)、展枝马尾藻(Sargassum patens C. Agardh)等,真菌细胞(例如酵母细胞),动物细胞,来自无脊椎动物(例如果蝇、刺胞动物、棘皮动物、线虫等)的细胞,来自脊椎动物(例如鱼、两栖动物、爬行动物、鸟、哺乳动物)的细胞,来自哺乳动物(例如猪、牛、山羊、绵羊、啮齿类动物、大鼠、小鼠、非人灵长类动物、人等)的细胞,等。
在一些实施方案中,已用包含编码SluCas9多肽(例如天然存在的SluCas9;修饰的,即,突变的或变体,SluCas9;嵌合的SluCas9;等)的核苷酸序列的外源核酸对基因修饰宿主细胞进行了基因修饰。通过将指导RNA(或编码指导RNA的DNA,其确定待修饰的基因组位置/序列)和任选地共同核酸引入细胞中,可以靶向基因修饰宿主细胞的DNA用于修饰。在一些实施方案中,编码SluCas9多肽的核苷酸序列可操作地连接至诱导型启动子(例如热激启动子、四环素调节的启动子、类固醇调节的启动子、金属调节的启动子、雌激素受体调节的启动子等)。在一些实施方案中,编码SluCas9多肽的核苷酸序列可操作地连接至空间限制和/或时间限制的启动子(例如组织特异性启动子、细胞类型特异性启动子、细胞周期特异性启动子)。在一些实施方案中,编码SluCas9多肽的核苷酸序列可操作地连接至组成型启动子。
在一些实施方案中,基因修饰宿主细胞是体外的。在一些实施方案中,基因修饰宿主细胞是体内的。在一些实施方案中,基因修饰宿主细胞是原核细胞或衍生自原核细胞。在一些实施方案中,基因修饰宿主细胞是细菌细胞或衍生自细菌细胞。在一些实施方案中,基因修饰宿主细胞是古细菌细胞或衍生自古细菌细胞。在一些实施方案中,基因修饰宿主细胞是真核细胞或衍生自真核细胞。在一些实施方案中,基因修饰宿主细胞是植物细胞或衍生自植物细胞。在一些实施方案中,基因修饰宿主细胞是动物细胞或衍生自动物细胞。在一些实施方案中,基因修饰宿主细胞是无脊椎动物细胞或衍生自无脊椎动物细胞。在一些实施方案中,基因修饰宿主细胞是脊椎动物细胞或衍生自脊椎动物细胞。在一些实施方案中,基因修饰宿主细胞是哺乳动物细胞或衍生自哺乳动物细胞。在一些实施方案中,基因修饰宿主细胞是啮齿类动物细胞或衍生自啮齿类动物细胞。在一些实施方案中,基因修饰宿主细胞是人细胞或衍生自人细胞。
本公开内容进一步提供了基因修饰细胞的后代,其中所述后代可以包含与衍生其的基因修饰细胞相同的外源核酸或多肽。本公开内容进一步提供了包含基因修饰宿主细胞的组合物。
基因修饰干细胞和基因修饰祖先细胞
在一些实施方案中,基因修饰宿主细胞是基因修饰干细胞或祖先细胞。合适的宿主细胞包括,例如干细胞(成体干细胞、胚胎干细胞、iPS细胞等)和祖先细胞(例如心脏祖先细胞、神经祖先细胞等)。合适的宿主细胞包括哺乳动物干细胞和祖先细胞,包括,例如啮齿类动物干细胞、啮齿类动物祖先细胞、人干细胞、人祖先细胞等。合适的宿主细胞包括体外宿主细胞,例如分离的宿主细胞。
在一些实施方案中,基因修饰宿主细胞包含外源指导RNA核酸。在一些实施方案中,基因修饰宿主细胞包含外源核酸,其包含编码指导RNA的核苷酸序列。在一些实施方案中,基因修饰宿主细胞包含外源SluCas9多肽(例如天然存在的SluCas9;修饰的,即,突变的或变体,SluCas9;嵌合的SluCas9;等)。在一些实施方案中,基因修饰宿主细胞包含外源核酸,其包含编码SluCas9多肽的核苷酸序列。在一些实施方案中,基因修饰宿主细胞包含外源核酸,其包含编码1)指导RNA和2)SluCas9多肽的核苷酸序列。
在一些情况中,SluCas9多肽包含与SEQ ID NO:2或其长度至少为100、150、200、300、350、400或500个氨基酸的活性部分中的序列的任一种具有至少75%、至少80%、至少85%、至少90%、至少95%、至少99%或100%氨基酸序列同一性的氨基酸序列。在一些实施方案中,活性部分是RNA酶结构域。在其他实施方案中,活性部分是DNA酶结构域。
组合物
本公开内容提供了包含指导RNA和/或位点定向修饰多肽的组合物。在一些情况中,SluCas9多肽是嵌合多肽。组合物可用于执行本公开内容的方法,例如用于靶DNA的位点特异性修饰的方法;用于与靶DNA相关的多肽的位点特异性修饰的方法;等等。
包含指导RNA的组合物
本公开内容提供了包含指导RNA的组合物。除指导RNA外,组合物可包含下述的一种或多种:盐,例如NaCI、MgCb、KCI、MgS04等;缓冲剂,例如Tris缓冲液、N-(2-羟乙基)哌嗪-N'-(2-乙磺酸)(HEPES)、2-(N-吗啉代)乙磺酸(MES)、MES钠盐、3-(N-吗啉代)丙磺酸(MOPS)、N-三[羟甲基]甲基-3-氨基丙磺酸(TAPS)等;加溶剂;去污剂,例如非离子型去污剂,例如吐温-20等;核酸酶抑制剂;等等。例如,在一些情况中,组合物包含指导RNA和用于稳定核酸的缓冲液。
在一些实施方案中,存在于组合物中的指导RNA是纯的,例如,至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或不止99%纯的,其中“%纯度”是指指导RNA为不含在指导RNA生产过程中可能存在的其他大分子或污染物的所述百分比。
包含嵌合多肽的组合物
本公开内容提供了嵌合多肽的组合物。除指导RNA外,组合物可包含下述的一种或多种:盐,例如NaCI、MgCiz、KCI、MgS04等;缓冲剂,例如Tris缓冲液、HEPES、MES、MES钠盐、MOPS、TAPS等;加溶剂;去污剂,例如非离子型去污剂,例如吐温-20等;蛋白酶抑制剂;还原剂(例如二硫苏糖醇);等等。
在一些实施方案中,存在于组合物中的嵌合多肽是纯的,例如,至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或不止99%纯的,其中“%纯度”是指位点定向修饰多肽为不含在嵌合多肽生产过程中可能存在的其他蛋白、其他大分子或污染物的所述百分比。
包含指导RNA和SluCas9多肽的组合物
本公开内容提供了组合物,其包含:(i)指导RNA或编码其的DNA多核苷酸;和ii)SluCas9多肽或编码其的多核苷酸。在一些情况中,SluCas9多肽是嵌合的SluCas9多肽。在其他情况中,SluCas9多肽是天然存在的SluCas9多肽。在一些情况中,SluCas9多肽表现出修饰靶DNA的酶促活性。在其他情况中,SluCas9多肽表现出修饰与靶DNA相关的多肽的酶促活性。在再其他情况中,SluCas9多肽调节靶DNA的转录。
本公开内容提供了组合物,其包含:(i)如上所述的指导RNA,或编码其的DNA多核苷酸,所述指导RNA包含:(a)包含与靶DNA中的序列互补的核苷酸序列的第一区段;和(b)与SluCas9多肽相互作用的第二区段;和(ii)SluCas9多肽,或编码其的多核苷酸,所述SluCas9多肽包含:(a)与所述指导RNA相互作用的RNA-结合部分;和(b)表现出位点定向酶促活性的活性部分,其中酶促活性的位点由所述指导RNA确定。
在一些情况中,组合物包含:(i)指导RNA,所述指导RNA包含:(a)包含与靶DNA中的序列互补的核苷酸序列的第一区段;和(b)与SluCas9多肽相互作用的第二区段;和(ii)SluCas9多肽,所述SluCas9多肽包含:(a)与所述指导RNA相互作用的RNA-结合部分;和(b)表现出位点定向酶促活性的活性部分,其中酶促活性的位点由所述指导RNA确定。
在其他实施方案中,组合物包含:(i)编码指导RNA的多核苷酸,所述指导RNA包含:(a)包含与靶DNA中的序列互补的核苷酸序列的第一区段;和(b)与位点定向修饰多肽相互作用的第二区段;和(ii)编码SluCas9多肽的多核苷酸,所述SluCas9多肽包含:(a)与所述指导RNA相互作用的RNA-结合部分;和(b)表现出位点定向酶促活性的活性部分,其中酶促活性的位点由所述指导RNA确定。
本公开内容提供了组合物,其包含:(i)指导RNA,或编码其的DNA多核苷酸,所述指导RNA包含:(a)包含与靶DNA中的序列互补的核苷酸序列的第一区段;和(b)与SluCas9多肽相互作用的第二区段;和(ii)SluCas9多肽,或编码其的多核苷酸,所述SluCas9多肽包含:(a)与所述指导RNA相互作用的RNA-结合部分;和(b)调节靶DNA内转录的活性部分,其中靶DNA内调节的转录的位点由所述指导RNA确定。
例如,在一些情况中,组合物包含:(i)指导RNA,所述指导RNA包含:(a)包含与靶DNA中的序列互补的核苷酸序列的第一区段;和(b)与SluCas9多肽相互作用的第二区段;和(ii)SluCas9多肽,所述SluCas9多肽包含:(a)与所述指导RNA相互作用的RNA-结合部分;和(b)调节靶DNA内转录的活性部分,其中靶DNA内调节的转录的位点由所述指导RNA确定。
作为另一个实例,在一些情况中,组合物包含:(i)编码指导RNA的DNA多核苷酸,所述指导RNA包含:(a)包含与靶DNA中的序列互补的核苷酸序列的第一区段;和(b)与SluCas9多肽相互作用的第二区段;和(ii)编码位点定向修饰多肽的多核苷酸,所述SluCas9多肽包含:(a)与所述指导RNA相互作用的RNA-结合部分;和(b)调节靶DNA内转录的活性部分,其中靶DNA内调节的转录的位点由所述指导RNA确定。除i)指导RNA,或编码其的DNA多核苷酸;和ii)SluCas9多肽,或编码其的多核苷酸外,组合物可以包含下述的一种或多种:盐,例如NaCI、MgCiz、KCI、MgS04等;缓冲剂,例如Tris缓冲液、HEPES、MES、MES钠盐、MOPS、TAPS等;加溶剂;去污剂,例如非离子型去污剂,例如吐温-20等;蛋白酶抑制剂;还原剂(例如二硫苏糖醇);等等。
在一些情况中,组合物的组分各自是纯的,例如每种组分为至少75%、至少80%、至少90%、至少95%、至少98%、至少99%或至少99%纯的。在一些情况中,组合物的各种组分在加入到组合物中之前是纯的。
例如,在一些实施方案中,存在于组合物中的SluCas9多肽是纯的,例如,至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或不止99%纯的,其中“%纯度”是指SluCas9多肽为不含在SluCas9多肽生产过程中可能存在的其他蛋白(例如,除SluCas9多肽以外的蛋白)、其他大分子或污染物的所述百分比。
试剂盒
本公开内容提供了用于执行方法的试剂盒。试剂盒可包括下述的一种或多种:SluCas9多肽;包含编码位点定向修饰多肽的核苷酸的核酸;指导RNA;包含编码指导RNA的核苷酸序列的核酸。试剂盒可包括复合体,所述复合体包含下述的两种或更多种:SluCas9多肽;包含编码SluCas9多肽的核苷酸的核酸;指导RNA;包含编码指导RNA的核苷酸序列的核酸。在一些实施方案中,试剂盒包括SluCas9多肽,或编码其的多核苷酸。在一些实施方案中,SluCas9多肽包含:(a)与指导RNA相互作用的RNA-结合部分;和(b)调节靶DNA内转录的活性部分,其中所述指导RNA确定靶DNA内调节的转录的位点。在一些情况中,SluCas9多肽的活性部分表现出降低或失活的核酸酶活性。在一些情况中,SluCas9多肽是嵌合的SluCas9多肽。
在一些实施方案中,试剂盒包括:SluCas9多肽,或编码其的多核苷酸,以及用于重构和/或稀释SluCas9多肽的试剂。在其他实施方案中,试剂盒包括核酸(例如 DNA、RNA),其包含编码SluCas9多肽的核苷酸。在一些实施方案中,试剂盒包括:核酸(例如 DNA、RNA),其包含编码SluCas9多肽的核苷酸;以及用于重构和/或稀释SluCas9多肽的试剂。
包含SluCas9多肽或编码其的多核苷酸的试剂盒可以进一步包括一种或多种额外的试剂,其中这种额外的试剂可以选自:用于将SluCas9多肽引入细胞的缓冲液;洗涤缓冲液;对照试剂;对照表达载体或RNA多核苷酸;用于从DNA体外生产SluCas9多肽的试剂等。在一些情况中,试剂盒中包括的位点定向修饰多肽是如上所述的嵌合SluCas9多肽。
在一些实施方案中,试剂盒包括指导RNA,或编码其的DNA多核苷酸,所述指导RNA包含:(a)包含与靶DNA中的序列互补的核苷酸序列的第一区段;和(b)与位点定向修饰多肽相互作用的第二区段。在一些实施方案中,试剂盒包括:(i)指导RNA,或编码其的DNA多核苷酸,所述指导RNA包含:(a)包含与靶DNA中的序列互补的核苷酸序列的第一区段;和(b)与SluCas9多肽相互作用的第二区段;和(ii)SluCas9多肽,或编码其的多核苷酸,所述SluCas9多肽包含:(a)与所述指导RNA相互作用的RNA-结合部分;和(b)表现出位点定向酶促活性的活性部分,其中酶促活性的位点由所述指导RNA确定。在一些实施方案中,SluCas9多肽的活性部分不表现出酶促活性(包括失活的核酸酶,例如通过突变)。在一些情况中,试剂盒包括指导RNA和SluCas9多肽。在其他情况中,试剂盒包括:(i)包含编码指导RNA的核苷酸序列的核酸;和(ii)包含编码SluCas9多肽的核苷酸序列的核酸。作为另一个例子,试剂盒可以包括:(i)指导RNA,或编码其的DNA多核苷酸,包含:
(a)包含与靶DNA中的序列互补的核苷酸序列的第一区段;和(b)与SluCas9多肽相互作用的第二区段;和(ii)SluCas9多肽,或编码其的多核苷酸,包含:(a)与所述指导RNA相互作用的RNA-结合部分;和(b)调节靶DNA内转录的活性部分,其中靶DNA内调节的转录的位点由所述指导RNA确定。在一些情况中,试剂盒包括:(i)指导RNA;和SluCas9多肽。在其他情况中,试剂盒包括:(i)包含编码指导RNA的核苷酸序列的核酸;和(ii)包含编码SluCas9多肽的核苷酸序列的核酸。本公开内容提供了试剂盒,其包括:(1)重组表达载体,其包含(i)编码指导RNA的核苷酸序列,其中所述指导RNA包含:(a)包含与靶DNA中的序列互补的核苷酸序列的第一区段;和(b)与SluCas9多肽相互作用的第二区段;和(ii)编码SluCas9多肽的核苷酸序列,其中所述SluCas9多肽包含:(a)与所述指导RNA相互作用的RNA-结合部分;和(b)表现出位点定向酶促活性的活性部分,其中酶促活性的位点由所述指导RNA确定;和(2)用于重构和/或稀释所述表达载体的试剂。
本公开内容提供了试剂盒,其包括:(1)重组表达载体,其包含(i)编码指导RNA的核苷酸序列,其中所述指导RNA包含:(a)包含与靶DNA中的序列互补的核苷酸序列的第一区段;和(b)与SluCas9多肽相互作用的第二区段;和(ii)编码SluCas9多肽的核苷酸序列,其中所述SluCas9多肽包含:(a)与所述指导RNA相互作用的RNA-结合部分;和(b)调节靶DNA内转录的活性部分,其中靶DNA内调节的转录的位点由所述指导RNA确定;和(2)用于重构和/或稀释所述重组表达载体的试剂。
本公开内容提供了试剂盒,其包括:(1)包含核酸的重组表达载体,所述核酸包含编码DNA靶向RNA的核苷酸序列,所述DNA靶向RNA包含:(i)包含与靶DNA中的序列互补的核苷酸序列的第一区段;和(ii)与SluCas9多肽相互作用的第二区段;和(2)用于重构和/或稀释所述重组表达载体的试剂。在这个试剂盒的一些实施方案中,试剂盒包括:重组表达载体,其包含编码SluCas9多肽的核苷酸序列,其中所述SluCas9多肽包含:(a)与指导RNA相互作用的RNA-结合部分;和(b)表现出位点定向酶促活性的活性部分,其中酶促活性的位点由所述指导RNA确定。在这个试剂盒的其他实施方案中,试剂盒包括:重组表达载体,其包含编码SluCas9多肽的核苷酸序列,其中所述SluCas9多肽包含:(a)与指导RNA相互作用的RNA-结合部分;和(b)调节靶DNA内转录的活性部分,其中靶DNA内调节的转录的位点由所述指导RNA确定。
在任何上述试剂盒的一些实施方案中,试剂盒包括单分子指导RNA。在任何上述试剂盒的一些实施方案中,试剂盒包括两种或更多种单分子指导RNAs。在任何上述试剂盒的一些实施方案中,可以作为阵列(例如,RNA分子的阵列,编码一种或多种指导RNA的DNA分子的阵列等)提供指导RNA(例如,包括两种或更多种指导RNAs)。这种试剂盒可用于例如与包含SluCas9多肽的上述基因修饰宿主细胞一起使用。在任何上述试剂盒的一些实施方案中,试剂盒进一步包括供体多核苷酸以实现所期望的遗传修饰。试剂盒的组分可以在单独的容器中;或可以组合在单个容器中。
在一些情况中,试剂盒进一步包括一种或多种相对于野生型SluCas9表现出降低的内切脱氧核糖核酸酶(endodeoxyribonuclease)活性的变体SluCas9位点定向多肽。
在一些情况中,试剂盒进一步包括一种或多种包含编码变体SluCas9位点定向多肽的核苷酸序列的核酸,所述变体SluCas9位点定向多肽相对于野生型SluCas9表现出降低的内切脱氧核糖核酸酶活性。
任何上述试剂盒都可进一步包括一种或多种额外的试剂,其中这种额外的试剂可选自:稀释缓冲液;重构溶液;洗涤缓冲液;对照试剂;对照表达载体或RNA多核苷酸;用于从DNA体外生产SluCas9多肽的试剂,等。
除上述组分外,试剂盒可进一步包括使用试剂盒的组分以实施方法的说明书。通常将用于实施方法的说明书记录在合适的记录介质上。例如,说明书可以印刷在诸如纸或塑料等的基底上。因此,说明书可以作为包装插页存在于试剂盒中,存在于试剂盒或其组分的容器标签中(即,与包装或分包装(subpackaging)相关的)等。在其他实施方案中,说明书作为存在于适当的计算机可读存储介质(例如CD-ROM、软磁盘、闪存驱动器(flash drive)等)上的电子存储数据文件呈现。在再其他的实施方案中,试剂盒中不存在实际的说明书,但是提供了用于从远程来源(例如,经由因特网)获得说明书的手段。这个实施方案的示例是包括网址的试剂盒,在所述网址可以查看说明书和/或可以从其下载说明书。如同说明书一样,用于获得说明书的这种手段被记录在合适的基底上。
非人基因修饰生物
在一些实施方案中,已用包含编码SluCas9多肽(例如天然存在的SluCas9;修饰的,即,突变的或变体,SluCas9;嵌合的SluCas9;等)的核苷酸序列的外源核酸对基因修饰宿主细胞进行了基因修饰。如果这种细胞是真核单细胞生物,那么修饰的细胞可以被认为是基因修饰生物。在一些实施方案中,非人基因修饰生物是SluCas9转基因多细胞生物。
在一些实施方案中,基因修饰非人宿主细胞(例如已用包含编码位点定向修饰多肽(例如天然存在的SluCas9;修饰的,即,突变的或变体,SluCas9;嵌合的SluCas9;等)的核苷酸序列的外源核酸基因修饰的细胞)可以产生基因修饰非人生物(例如,小鼠、鱼、蛙、蝇、蠕虫等)。例如,如果基因修饰宿主细胞是多潜能干细胞(即,PSC)或生殖细胞(例如,精子、卵母细胞等),则整个基因修饰生物都可以衍生自基因修饰宿主细胞。在一些实施方案中,基因修饰宿主细胞是可产生基因修饰生物的体内或体外的多潜能干细胞(例如ESC、iPSC、多潜能植物干细胞等)或生殖细胞(例如精子细胞、卵母细胞等)。在一些实施方案中,基因修饰宿主细胞是脊椎动物PSC(例如ESC、iPSC等),并用于产生基因修饰生物(例如,通过将PSC注射入胚泡中以产生嵌合/镶嵌型动物,其然后可以交配以产生非嵌合/非镶嵌型基因修饰生物;在植物的情况下嫁接;等)。用于产生基因修饰生物的任何方便的方法/规程,包括本文所述的方法,都适合于产生包含外源核酸的基因修饰宿主细胞,所述外源核酸包含编码SluCas9多肽(例如天然存在的SluCas9;修饰的,即,突变的或变体,SluCas9;嵌合的SluCas9;等)的核苷酸序列。产生基因修饰生物的方法是本领域已知的。例如,参见Cho等人, Curr Protoc Cell Bioi. 2009年3月;第19章:Unit 19.11: Generation oftransgenic mice;Gama等人, Brain Struct Funct. 2010年3月;214(2-3):91-109. Epub2009年11月25日: Animal transgenesis: an overview;Husaini等人, GM Crops. 2011年6月-12月;2(3):150-62. Epub 2011年6月1日: Approaches for gene targeting andtargeted gene expression in plants。
在一些实施方案中,基因修饰生物包含用于本发明方法的靶细胞,且因此可以被认为是靶细胞的来源。例如,如果包含外源核酸的基因修饰细胞被用于产生基因修饰生物,所述外源核酸包含编码位点定向修饰多肽(例如天然存在的SluCas9;修饰的,即,突变的或变体,SluCas9;嵌合的SluCas9;等)的核苷酸序列,那么基因修饰生物的细胞包含所述外源核酸,其包含编码SluCas9多肽(例如天然存在的SluCas9;修饰的,即,突变的或变体,SluCas9;嵌合的SluCas9;等)的核苷酸序列。在一些这种实施方案中,可以通过将指导RNA(或编码指导RNA的DNA)和任选地供体核酸引入一个或多个细胞来靶向基因修饰生物的一个或多个细胞的DNA用于修饰。例如,将指导RNA(或编码指导RNA的DNA)引入基因修饰生物的细胞亚群(例如脑细胞、肠细胞、肾细胞、肺细胞、血细胞等)可以靶向这种细胞的DNA用于修饰,其基因组位置将取决于引入的指导RNA的DNA-靶向序列。
在一些实施方案中,基因修饰生物是用于本发明方法的靶细胞的来源。例如,包含用外源核酸基因修饰的细胞的基因修饰生物可以提供基因修饰细胞的来源,例如PSCs(例如 ESCs、iPSCs、精子、卵母细胞等)、神经元、祖先细胞、心肌细胞等,所述外源核酸包含编码SluCas9多肽(例如天然存在的SluCas9;修饰的,即,突变的或变体,SluCas9;嵌合的SluCas9;等)的核苷酸序列。
在一些实施方案中,基因修饰细胞是包含外源核酸的PSC,所述外源核酸包含编码SluCas9多肽(例如天然存在的SluCas9;修饰的,即,突变的或变体,SluCas9;嵌合的SluCas9;等)的核苷酸序列。因此,PSC可以是靶细胞,从而使得可以通过向PSC中引入指导RNA(或编码指导RNA的DNA)和任选地供体核酸来靶向PSC的DNA用于修饰,且修饰的基因组位置将取决于引入的指导RNA的DNA-靶向序列。因此,在一些实施方案中,本文描述的方法可用于修饰衍生自基因修饰生物的PSCs的DNA(例如,删除和/或置换任何期望的基因组位置)。然后可以将这种修饰的PSCs用于产生具有下述两者的生物:(i)包含编码SluCas9多肽(例如天然存在的SluCas9;修饰的,即,突变的或变体,SluCas9;嵌合的SluCas9;等)的核苷酸序列的外源核酸和(ii)引入PSC中的DNA修饰。
包含编码SluCas9多肽(例如天然存在的SluCas9;修饰的,即,突变的或变体,SluCas9;嵌合的SluCas9;等)的核苷酸序列的外源核酸可以在未知启动子的控制下(即,与其可操作地连接)(例如,当核酸随机整合到宿主细胞基因组中时),或可以在已知启动子的控制下(即,与其可操作地连接)。合适的已知启动子可以是任何已知的启动子,且包括组成型活性启动子(例如 CMV启动子)、诱导型启动子(例如热激启动子、四环素调节的启动子、类固醇调节的启动子、金属调节的启动子、雌激素受体调节的启动子等)、空间限制和/或时间限制的启动子(例如组织特异性启动子、细胞类型特异性启动子等)等。
基因修饰生物(例如,其细胞包含编码SluCas9多肽(例如天然存在的SluCas9;修饰的,即,突变的或变体,SluCas9;嵌合的SluCas9;等)的核苷酸序列的生物)可以是任何生物,包括例如,植物;藻类;无脊椎动物(例如刺胞动物、棘皮动物、蠕虫、蝇等);脊椎动物(例如鱼(例如斑马鱼、河豚、金鱼等)、两栖动物(例如蝾螈、蛙等)、爬行动物、鸟、哺乳动物等);有蹄类动物(ungulate)(例如山羊、猪、绵羊、牛等);啮齿类动物(例如小鼠、大鼠、仓鼠、豚鼠);兔形目(例如兔);等。
在一些情况中,SluCas9多肽包含与SEQ ID NO:2具有至少75%、至少80%、至少85%、至少90%、至少95%、至少99%或100%氨基酸序列同一性的氨基酸序列。
转基因非人动物
如上所述,在一些实施方案中,核酸(例如编码SluCas9多肽(例如天然存在的SluCas9;修饰的,即,突变的或变体,SluCas9;嵌合的SluCas9;等)的核苷酸序列)或重组表达载体被用作转基因以产生生产SluCas9多肽的转基因动物。因此,本公开内容进一步提供了转基因非人动物,所述动物包含转基因,所述转基因包含核酸,所述核酸包含编码位点定向修饰多肽(例如天然存在的SluCas9;修饰的,即,突变的或变体,SluCas9;嵌合的SluCas9;等)的核苷酸序列,如上所述。在一些实施方案中,转基因非人动物的基因组包含编码SluCas9多肽的核苷酸序列。在一些实施方案中,转基因非人动物对于遗传修饰是纯合的。在一些实施方案中,转基因非人动物对于遗传修饰是杂合的。在一些实施方案中,转基因非人动物是脊椎动物,例如,鱼(例如斑马鱼、金鱼、河豚、洞穴鱼(cave fish)等)、两栖动物(蛙、蝾螈等)、鸟(例如鸡、火鸡等)、爬行动物(例如蛇、蜥蜴等)、哺乳动物(例如有蹄类动物,例如猪、牛、山羊、绵羊等;兔形目(例如兔);啮齿类动物(例如大鼠、小鼠);非人灵长类动物;等)等。
包含编码SluCas9多肽(例如天然存在的SluCas9;修饰的,即,突变的或变体,SluCas9;嵌合的SluCas9;等)的核苷酸序列的外源核酸可以在未知启动子的控制下(即,与其可操作地连接)(例如,当核酸随机整合到宿主细胞基因组中时),或可以在已知启动子的控制下(即,与其可操作地连接)。合适的已知启动子可以是任何已知的启动子,且包括组成型活性启动子(例如 CMV启动子)、诱导型启动子(例如热激启动子、四环素调节的启动子、类固醇调节的启动子、金属调节的启动子、雌激素受体调节的启动子等)、空间限制和/或时间限制的启动子(例如组织特异性启动子、细胞类型特异性启动子等)等。
转基因植物
如上所述,在一些实施方案中,核酸(例如编码SluCas9多肽(例如天然存在的SluCas9;修饰的,即,突变的或变体,SluCas9;嵌合的SluCas9;等)的核苷酸序列)或重组表达载体被用作转基因以产生生产SluCas9多肽的转基因植物。因此,本公开内容进一步提供了转基因植物,所述植物包含转基因,所述转基因包含核酸,所述核酸包含编码SluCas9多肽(例如天然存在的SluCas9;修饰的,即,突变的或变体,SluCas9;嵌合的SluCas9;等)的核苷酸序列,如上所述。在一些实施方案中,转基因植物的基因组包含核酸。在一些实施方案中,转基因植物对于遗传修饰是纯合的。在一些实施方案中,转基因植物对于遗传修饰是杂合的。
将外源核酸引入植物细胞的方法是本领域众所周知的。如上文所定义,这种植物细胞被认为是“转化的”。合适的方法包括病毒感染(例如双链DNA病毒)、转染、接合、原生质体融合、电穿孔、基因枪技术、磷酸钙沉淀、直接显微注射、碳化硅须晶(silicon carbidewhiskers)技术、土壤杆菌属(Agrobacterium)介导的转化等。方法的选择通常取决于正被转化的细胞的类型和发生转化的环境(即,体外、先体外后体内或体内)。基于土壤细菌根癌土壤杆菌(Agrobacterium tumefaciens)的转化方法对于将外源核酸分子引入维管植物中特别有用。土壤杆菌属的野生型形式含有Ti(根瘤诱导)质粒,其指导在宿主植物上产生根瘤的根癌生长的产生。Ti质粒的根瘤诱导T-DNA区域转移到植物基因组需要Ti质粒编码的毒力基因以及T-DNA边界,其是一组画出要转移的区域的轮廓的同向DNA重复序列。基于土壤杆菌属的载体是Ti质粒的修饰形式,其中根瘤诱导功能被引入植物宿主的感兴趣的核酸序列置换。
土壤杆菌属介导的转化通常使用共整合载体或双元载体(binary vector)系统,其中Ti质粒的组分被分配给永久存在于土壤杆菌属宿主中并携带毒力基因的辅助载体和含有以T-DNA序列为界的感兴趣的基因的穿梭载体。多种双元载体在本领域中是众所周知的,并且可以例如从Clontech (Palo Alto, Calif.)商购获得。例如,将土壤杆菌属与培养的植物细胞或受伤的组织如叶组织、根外植体、下胚轴(hypocotyledons)、茎断片或块茎共培养的方法也是本领域众所周知的。参见,例如 Glick和Thompson, (编), Methods inPlant Molecular Biology and Biotechnology, Boca Raton, Fla.: CRC Press(1993)。
微粒介导的转化也可以用于产生转基因植物。首先由Klein等人(Nature 327:70-73 (1987))描述的这种方法依赖于通过用氯化钙、亚精胺或聚乙二醇沉淀而用所期望的核酸分子包被的微粒,例如金或钨。使用诸如BIOLISTIC PD-1000 (Biorad;HerculesCalif.)的设备将微粒颗粒高速地加速到被子植物组织中。
可以以使得核酸能够进入一种或多种植物细胞的方式将核酸引入到植物中,例如通过体内或先体外后体内规程。所谓“体内”指的是将核酸施用于活的植物体,例如渗入。所谓“先体外后体内”指的是在植物外部修饰细胞或外植体,并然后将这种细胞或器官再生为植物。已经描述了许多适合于植物细胞稳定转化或适合于确立转基因植物的载体,包括在Weissbach和Weissbach, (1989) Methods for Plant Molecular Biology AcademicPress和Gelvin等人, (1990) Plant Molecular Biology Manual, Kluwer AcademicPublishers中描述的那些。具体的实例包括衍生自根癌土壤杆菌的Ti质粒的那些,以及由Herrera-Estrella等人 (1983) Nature 303: 209、Bevan (1984) Nucl Acid Res. 12:8711-8721、Klee (1985) Bio/Technolo 3: 637-642公开的那些。另一方面,非Ti载体可以用于通过使用游离DNA递送技术将DNA转移到植物和细胞中。通过使用这些方法,可以产生转基因植物,例如小麦、稻(Christou (1991) Bio/Technology 9:957-9和4462)和玉米(Gordon-Kamm (1990) Plant Cell 2: 603-618)。未成熟胚胎也可以是用于通过使用基因枪进行直接DNA递送技术(Weeks等人 (1993) Plant Physiol 102: 1077-1084;Vasil(1993) Bio/Technolo 10: 667-674;Wan和Lemeaux (1994) Plant Physiol104: 37-48和用于土壤杆菌属介导的DNA转移(Ishida等人 (1996) Nature Biotech 14: 745-750)的单子叶植物的良好靶组织。将DNA引入叶绿体的示例性方法是生物射弹轰击、原生质体的聚乙二醇转化和显微注射(Daniell等人 Nat. Biotechnol 16:345-348, 1998;Staub等人Nat. Biotechnol 18: 333-338, 2000;O'Neill等人 Plant J. 3:729-738, 1993;Knoblauch等人 Nat. Biotechnol17: 906-909;美国专利Nos. 5,451,513、5,545,817、5,545,818和5,576,198;国际申请No. WO 95/16783;和Boynton等人, Methods inEnzymology 217: 510-536 (1993)、Svab等人, Proc. Natl. Acad. Sci. USA 90: 913-917 (1993)和McBride等人, Proc. Nati. Acad. Sci. USA 91: 7301-7305 (1994))。任何适合于生物射弹轰击、原生质体的聚乙二醇转化和显微注射的方法的载体都将适合作为用于叶绿体转化的靶向载体。任何双链DNA载体都可以用作转化载体,尤其是当引入方法不利用土壤杆菌属时。
可以进行基因修饰的植物包括谷物、饲料作物、水果、蔬菜、油料种子作物、棕榈、森林和藤本植物。可以被修饰的植物的具体实例如下:玉米、香蕉、花生、紫花豌豆、向日葵、番茄、油菜、烟草、小麦、大麦、燕麦、马铃薯、大豆、棉花、康乃馨、高粱、羽扇豆和稻。
本公开内容还提供了转化的植物细胞,含有转化的植物细胞的组织、植物和产物。转化的细胞以及包含其的组织和产物的特征是整合到基因组中的核酸的存在,以及由植物细胞产生SluCas9多肽,例如天然存在的SluCas9;修饰的,即,突变的或变体,SluCas9;嵌合的SluCas9;等。本发明的重组植物细胞作为重组细胞群体,或作为组织、种子、完整植物、茎、果实、叶、根、花、茎、块茎、谷粒、动物饲料、植物田(a field of plants)等是有用的。
包含编码SluCas9多肽(例如天然存在的SluCas9;修饰的,即,突变的或变体,SluCas9;嵌合的SluCas9;等)的核苷酸序列的核酸可以在未知启动子的控制下(即,与其可操作地连接)(例如,当核酸随机整合到宿主细胞基因组中时),或可以在已知启动子的控制下(即,与其可操作地连接)。合适的已知启动子可以是任何已知的启动子,且包括组成型活性启动子、诱导型启动子、空间限制和/或时间限制的启动子等。
本公开内容提供了调节宿主细胞中靶核酸的转录的方法。所述方法通常包括使靶核酸与酶促无活性的SluCas9多肽和指导RNA接触。所述方法在也被提供的多种应用中有用。
本公开内容的转录调节方法克服了涉及RNAi的方法的一些缺点。本公开内容的转录调节方法应用于多种应用中,包括研究应用、药物发现(例如高通量筛选)、靶标确认、工业应用(例如作物工程;微生物工程等)、诊断应用、治疗应用和成像技术。
调节转录的方法
本公开内容提供了选择性调节宿主细胞中靶DNA的转录的方法。所述方法通常包括:a)向宿主细胞引入:i)指导RNA,或包含编码所述指导RNA的核苷酸序列的核酸;和ii)变体SluCas9位点定向多肽(“变体SluCas9多肽”),或包含编码所述变体SluCas9多肽的核苷酸序列的核酸,其中所述变体SluCas9多肽表现出降低的内切脱氧核糖核酸酶活性。
指导RNA(本文也称为“指导RNA”;或“gRNA”)包含:i)包含与靶DNA中的靶序列互补的核苷酸序列的第一区段;ii)与SluCas9多肽相互作用的第二区段;和iii)转录终止子。包含与靶DNA中的靶序列互补的核苷酸序列的第一区段在本文中被称为“靶向区段”。与SluCas9多肽相互作用的第二区段在本文中也称为“蛋白结合序列”或“dSluCas9-结合发夹”或“dSluCas9柄(handle)”。所谓“区段”指的是分子的区段/部分/区域,例如RNA中核苷酸的邻接序列段。除非在特定上下文中另外明确定义,否则“区段”的定义不限于特定数目的总碱基对,并且可以包括任何总长度的RNA分子区域,并且可以包括或可以不包括与其他分子具有互补性的区域。变体SluCas9位点定向多肽包含:i)与指导RNA相互作用的RNA-结合部分;以及表现出降低的内切脱氧核糖核酸酶活性的活性部分。
指导RNA和变体SluCas9多肽在宿主细胞中形成复合体;所述复合体选择性地调节宿主细胞中靶DNA的转录。
在一些情况中,本公开内容的转录调节方法提供宿主细胞中靶核酸的选择性调节(例如减少或增加)。例如,与在没有指导RNA/变体SluCas9多肽复合体的情况下靶核酸的转录水平相比,靶核酸的转录的“选择性”减少使靶核酸的转录减少至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或大于90%。靶核酸的转录的选择性减少减少了靶核酸的转录,但不显著地减少非靶核酸的转录,例如,与在没有指导RNA/变体SluCas9多肽复合体的情况下的非靶核酸的转录水平相比,非靶核酸的转录减少(即使有的话)小于10%。
增加的转录
与在没有指导RNA/变体SluCas9多肽复合体的情况下靶DNA的转录水平相比,靶DNA的“选择性”增加的转录可以使靶DNA的转录增加到至少1.1倍(例如至少1.2倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2倍、至少2.5倍、至少3倍、至少3.5倍、至少4倍、至少4.5倍、至少5倍、至少6倍、至少7倍、至少8倍、至少9倍、至少10倍、至少12倍、至少15倍或至少20倍)。靶DNA的转录的选择性增加增加了靶DNA的转录,但是不显著地增加非靶DNA的转录,例如,与在没有指导RNA/变体SluCas9多肽复合体的情况下的非靶向的DNA的转录水平相比,非靶DNA的转录增加到(即使有的话)小于约5-倍(例如,小于约4-倍、小于约3-倍、小于约2-倍、小于约1.8-倍、小于约1.6-倍、小于约1.4-倍、小于约1.2-倍或小于约1.1-倍)。
作为非限制性实例,可以通过将dSluCas9融合至异源序列来实现增加的转录。合适的融合配偶体包括,但不限于,提供通过直接作用于靶DNA或作用于与靶DNA相关的多肽(例如组蛋白或其他DNA-结合蛋白)而间接增加转录的活性的多肽。合适的融合配偶体包括但不限于提供甲基转移酶活性、脱甲基酶活性、乙酰转移酶活性、脱乙酰酶活性、激酶活性、磷酸酶活性、泛素连接酶活性、脱泛素活性、腺苷化活性、脱腺苷化活性、苏素化活性、脱苏素化活性、核糖基化活性、脱核糖基化活性、巴豆酰化(crotonylation)、脱巴豆酰化(decrotonylation)、丙酰化(propionylation)、脱丙酰化(depropionylation)、豆蔻酰化活性或脱豆蔻酰化活性的多肽。
额外的合适的融合配偶体包括,但不限于,直接提供靶核酸增加的转录的多肽(例如转录激活因子或其片段、募集转录激活因子的蛋白或其片段、小分子/药物应答转录调节物等)。
使用dSluCas9融合蛋白以增加原核生物中转录的方法的非限制性实例包括细菌单杂交(B1H)或双杂交(B2H)系统的修饰。在B1H系统中,将DNA结合结构域(BD)与细菌转录激活结构域(AD,例如,大肠杆菌(Escherichia coli)RNA聚合酶的α亚基(RNAPa))融合。因此,可以将dSluCas9与包含AD的异源序列融合。当dSluCas9融合蛋白到达启动子的上游区域(被指导RNA靶向到那里)时,dSluCas9融合蛋白的AD(例如RNAPa)募集RNAP全酶,从而导致转录激活。在B2H系统中,BD不直接与AD融合;而是它们的相互作用由蛋白-蛋白相互作用(例如 GAL11P-GAL4相互作用)介导。为了修饰供所述方法之用的这种系统,可以将dSluCas9与提供蛋白-蛋白相互作用的第一蛋白序列融合(例如酵母GAL11P和/或GAL4蛋白质),并将RNAa与完成蛋白-蛋白相互作用的第二蛋白序列融合(例如如果GAL11P与dSluCas9融合,则为GAL4,如果GAL4与dSluCas9融合,则为GAL11P,等等)。GAL11P和GAL4之间的结合亲和力提高了结合效率和转录启动速率(firing rate)。
使用dSluCas9融合蛋白以增加真核生物中转录的方法的非限制性实例包括dSluCas9与激活结构域(AD)的融合(例如 GAL4、疱疹病毒激活蛋白VP16或VP64、人核因子NF-KB p65亚基等)。为了使系统可诱导,dSluCas9融合蛋白的表达可以通过诱导型启动子控制(例如 Tet-ON、Tet-OFF等)。指导RNA可以被进行设计以靶向已知的转录应答元件(例如启动子、增强子等)、已知的上游激活序列(UAS)、被怀疑能够控制靶DNA的表达的功能未知或已知的序列等。
额外的融合配偶体
用于达到增加或减少的转录的融合配偶体的非限制性实例包括,但不限于,转录激活因子和转录阻遏蛋白结构域(例如Krüppel相关框(KRAB或SKD);Mad mSIN3相互作用结构域(SID);ERF阻遏蛋白结构域(ERD)等)。在一些这种情况中,dSluCas9融合蛋白被指导RNA靶向靶DNA中的特定位置(即序列),并发挥基因座特异性调节,例如阻断RNA聚合酶与启动子结合(其选择性地抑制转录激活因子功能)和/或修饰局部染色质状态(例如,当使用修饰靶DNA或修饰与靶DNA相关的多肽的融合序列时)。在一些情况中,所述变化是瞬时的(例如转录阻遏或激活)。在一些情况中,所述变化是可遗传的(例如,当对靶DNA或与靶DNA相关的蛋白如核小体组蛋白进行外遗传修饰时)。在一些实施方案中,异源序列可以与dSluCas9多肽的C-末端融合。在一些实施方案中,异源序列可以与dSluCas9多肽的N-末端融合。在一些实施方案中,异源序列可以与dSluCas9多肽的内部部分(即,除了N-或C-末端以外的部分)融合。使用dSluCas9融合蛋白的方法的生物学作用可以通过任何方便的方法进行检测(例如基因表达测定;基于染色质的测定,例如染色质免疫沉淀(ChIP)、染色质体内测定(CiA)等)。
在一些情况中,方法包括使用两种或更多种不同的指导RNAs。例如,可以在单个宿主细胞中使用两种不同的指导RNAs,其中所述两种不同的指导RNAs靶向相同靶核酸中的两种不同的靶序列。因此,例如,转录调节方法可以进一步包括将第二指导RNA或包含编码所述第二指导RNA的核苷酸序列的核酸引入宿主细胞,其中所述第二指导RNA包含:i)包含与靶DNA中第二靶序列互补的核苷酸序列的第一区段;ii)与位点定向多肽相互作用的第二区段;和iii)转录终止子。在一些情况中,使用靶向相同靶核酸中的两种不同靶向序列的两种不同的指导RNAs提供了靶核酸转录的增加的调节(例如减少或增加)。
作为另一个例子,可以在单个宿主细胞中使用两种不同的指导RNAs,其中所述两种不同的指导RNAs靶向两种不同的靶核酸。因此,例如,转录调节方法可以进一步包括将第二指导RNA或包含编码所述第二指导RNA的核苷酸序列的核酸引入宿主细胞,其中所述第二指导RNA包含:i)包含与至少第二靶DNA中的靶序列互补的核苷酸序列的第一区段;ii)与位点定向多肽相互作用的第二区段;和iii)转录终止子。
在一些实施方案中,核酸(例如,指导RNA,例如单分子指导RNA;供体多核苷酸;编码SluCas9多肽的核酸;等等)包含提供额外的所期望的特征(例如,修饰或调节的稳定性;亚细胞靶向;追踪,例如荧光标记;蛋白或蛋白复合体的结合位点;等)的修饰或序列。非限制性实例包括:5'帽(例如7-甲基鸟苷酸帽(m 7G));3'聚腺苷酸化尾(即,3'聚腺苷酸尾);核糖开关(riboswitch)序列或适配体序列(例如以允许蛋白和/或蛋白复合体调节的稳定性和/或调节的可接近性);终止子序列;形成dsRNA双链体(即发夹)的序列);将RNA靶向亚细胞位置(例如细胞核、线粒体、叶绿体等)的修饰或序列;提供追踪的修饰或序列(例如直接缀合至荧光分子,缀合至促进荧光检测的部分,允许荧光检测的序列等);提供蛋白的结合位点的修饰或序列(例如作用于DNA的蛋白,包括转录激活因子、转录阻遏蛋白、DNA甲基转移酶、DNA脱甲基酶、组蛋白乙酰转移酶、组蛋白脱乙酰酶等);RNA的修饰,其改变了这种RNA的结构,从而改变了SluCas9核糖核蛋白;及其组合。
DNA-靶向区段
指导RNA的DNA-靶向区段(或“DNA-靶向序列”)包含与靶DNA内的特定序列互补的核苷酸序列(靶DNA的互补链)。
换句话说,指导RNA的DNA-靶向区段通过杂交(即,碱基配对)以序列特异性方式与靶DNA相互作用。因此,DNA-靶向区段的核苷酸序列可以变化并确定指导RNA和靶DNA将相互作用的靶DNA内的位置。可以修饰(例如通过遗传工程)指导RNA的DNA-靶向区段以与靶DNA内的任何所期望的序列杂交。
稳定性控制序列(例如转录终止子区段)
稳定性控制序列影响RNA(例如指导RNA)的稳定性。合适的稳定性控制序列的一个例子是转录终止子区段(即,转录终止序列)。指导RNA的转录终止子区段可具有约10个核苷酸至约100个核苷酸的总长度,例如约10个核苷酸(nt)至约20 nt、约20 nt至约30 nt、约30 nt至约40 nt、约40 nt至约50 nt、约50 nt至约60 nt、约60 nt至约70 nt、约70 nt至约80nt、约80 nt至约90 nt或约90 nt至约100 nt。例如,转录终止子区段可以具有约15个核苷酸(nt)至约80 nt、约15 nt至约50 nt、约15 nt至约40 nt、约15 nt至约30 nt或约15 nt至约25 nt的长度。
在一些情况中,转录终止序列是在真核细胞中起作用的序列。在一些情况中,转录终止序列是在原核细胞中起作用的序列。
可以包括在稳定性控制序列(例如转录终止区段,或在指导RNA的任何区段中以提供增加的稳定性)中的核苷酸序列包括,例如,不依赖ρ因子的trp终止位点。
额外的序列
在一些实施方案中,指导RNA在5'或3'端包含至少一个额外的区段。例如,合适的额外的区段可包括5'帽(例如7-甲基鸟苷酸帽(m7G));3'聚腺苷酸化尾(即,3'聚腺苷酸尾);核糖开关序列(例如以允许蛋白和蛋白复合体调节的稳定性和/或调节的可接近性);形成dsRNA双链体(即发夹)的序列);将RNA靶向亚细胞位置(例如细胞核、线粒体、叶绿体等)的序列;提供追踪的修饰或序列(例如直接缀合至荧光分子,缀合至促进荧光检测的部分,允许荧光检测的序列等);提供蛋白的结合位点的修饰或序列(例如作用于DNA的蛋白,包括转录激活因子、转录阻遏蛋白、DNA甲基转移酶、DNA脱甲基酶、组蛋白乙酰转移酶、组蛋白脱乙酰酶等)提供增加的、降低的和/或可控制的稳定性的修饰或序列;及其组合。
多种同时的指导RNAs
在一些实施方案中,在相同细胞中同时使用多种指导RNAs以同时调节相同靶DNA或不同靶DNAs上的不同位置的转录。在一些实施方案中,两种或更多种指导RNAs靶向相同的基因或转录物或基因座。在一些实施方案中,两种或更多种指导RNAs靶向不同的不相关基因座。在一些实施方案中,两种或更多种指导RNA靶向不同但相关的基因座。
因为指导RNAs小且坚固,所以它们可以同时存在于相同的表达载体上,且甚至可以在相同的转录控制之下,如果期望这样的话。在一些实施方案中,两种或更多种(例如3种或更多种、4种或更多种、5种或更多种、10种或更多种、15种或更多种、20种或更多种、25种或更多种、30种或更多种、35种或更多种、40种或更多种、45种或更多种或50种或更多种)指导RNAs在靶细胞中同时表达(从相同或不同的载体/从相同或不同的启动子)。在一些情况中,可以在模拟靶向子(targeter)RNAs的天然存在的CRISPR阵列的阵列中编码多种指导RNAs。靶向区段作为约30个核苷酸长的序列编码(可以为约16到约100 nt),并被CRISPR重复序列隔开。可以通过编码RNAs的DNAs或作为RNAs将阵列引入细胞。
为了表达多种指导RNAs,可以使用由Csy4内切核糖核酸酶介导的人工RNA加工系统。例如,多种指导RNAs可以在前体转录物(例如,从U6启动子表达)上连接起来成为串联阵列,并被Csy4-特异性RNA序列隔开。共表达的Csy4蛋白将前体转录物切割成多种指导RNAs。使用RNA加工系统的优点包括:首先,无需使用多种启动子;其次,因为所有的指导RNAs都是从前体转录物中加工的,所以它们的浓度针对相似的dSluCas9-结合进行了归一化。
Csy4是衍生自细菌铜绿假单胞菌(Pseudomonas aeruginosa)的小内切核糖核酸酶(RNA酶)蛋白。Csy4特异性识别最小的17-bp RNA发夹,并显示快速(<1分钟)和高效(>99.9%)的RNA切割。与大多数RNA酶不同,切割的RNA片段保持稳定并具有功能活性。基于Csy4的RNA切割可重新应用于人工RNA加工系统。在这个系统中,将17-bp RNA发夹插入作为前体转录物从单个启动子转录的多个RNA片段之间。Csy4的共表达在产生个别RNA片段中有效。
变体SluCas9位点定向多肽
如上所述,指导RNA和变体SluCas9位点定向多肽形成复合体。指导RNA通过包含与靶DNA的序列互补的核苷酸序列,为复合体提供靶特异性。变体SluCas9位点定向多肽具有降低的内切脱氧核糖核酸酶活性。例如,适合于供本公开内容的转录调节方法之用的变体SluCas9位点定向多肽表现出小于约20%、小于约15%、小于约10%、小于约5%、小于约1%或小于约0.1%的野生型SluCas9多肽如包含SEQ ID NO:2所示的氨基酸序列的野生型SluCas9多肽的内切脱氧核糖核酸酶活性。在一些实施方案中,变体SluCas9位点定向多肽基本上没有可检测的内切脱氧核糖核酸酶活性(dSluCas9)。在一些实施方案中,当变体SluCas9位点定向多肽具有降低的催化活性时,所述多肽仍可以以位点特异性方式结合靶DNA(因为它仍被指导RNA指导至靶DNA序列),只要它保留与指导RNA相互作用的能力。在一些情况中,合适的变体SluCas9位点定向多肽包含与SEQ ID NO:2具有至少75%、至少80%、至少85%、至少90%、至少95%、至少99%或100%的氨基酸序列同一性的氨基酸序列。
在一些情况中,变体SluCas9位点定向多肽是切口酶,其可以切割靶DNA的互补链,但具有降低的切割靶DNA的非互补链的能力。
在一些情况中,在切口酶中的变体SluCas9位点定向多肽可以切割靶DNA的非互补链,但具有降低的切割靶DNA的互补链的能力。
在一些情况中,变体SluCas9位点定向多肽具有降低的切割靶DNA的互补链和非互补链两者的能力。例如,预期了丙氨酸取代。
在一些情况中,变体SluCas9位点定向多肽是融合多肽(“变体SluCas9融合多肽”),即,融合多肽,其包含:i)变体SluCas9位点定向多肽;和ii)共价连接的异源多肽(也称为“融合配偶体”)。
异源多肽可以表现出也将由变体SluCas9融合多肽表现出的活性(例如,酶促活性)(例如,甲基转移酶活性、乙酰转移酶活性、激酶活性、泛素化活性等)。异源核酸序列可以与另一核酸序列连接(例如通过遗传工程)以产生编码嵌合多肽的嵌合核苷酸序列。在一些实施方案中,通过将变体SluCas9多肽与提供亚细胞定位的异源序列融合来产生变体SluCas9融合多肽(即,异源序列是亚细胞定位序列,例如用于靶向细胞核的核定位信号(NLS);用于靶向线粒体的线粒体定位信号;用于靶向叶绿体的叶绿体定位信号;ER保留信号;等)。在一些实施方案中,异源序列可以提供用于易于追踪和/或纯化的标签(即,异源序列是可检测的标记)(例如荧光蛋白,例如绿色荧光蛋白(GFP)、YFP、RFP、CFP、mCherry、tdTomato等;组氨酸标签,例如6XHis标签;血凝素(HA)标签;FLAG标签;Myc标签;等)。在一些实施方案中,异源序列可提供增加或降低的稳定性(即,异源序列是稳定性控制肽,例如降解决定子,其在一些情况中是可控制的(例如温度敏感或药物可控制的降解决定子序列,参见下文)。在一些实施方案中,异源序列可以提供从靶DNA的增加或减少的转录(即,异源序列是转录调节序列,例如转录因子/激活因子或其片段、募集转录因子/激活因子的蛋白或其片段、转录阻遏蛋白或其片段、募集转录阻遏蛋白的蛋白或其片段、小分子/药物应答转录调节物等)。在一些实施方案中,异源序列可以提供结合结构域(即,异源序列是蛋白结合序列,例如以提供嵌合的dSluCas9多肽结合另一种感兴趣的蛋白的能力,例如DNA或组蛋白修饰蛋白、转录因子或转录阻遏蛋白、募集蛋白等)。
提供增加或降低的稳定性的合适融合配偶体包括,但不限于降解决定子序列。本领域普通技术人员容易理解降解决定子为控制它们是其一部分的蛋白的稳定性的氨基酸序列。例如,包含降解决定子序列的蛋白的稳定性至少部分地由降解决定子序列控制。在一些情况中,合适的降解决定子是组成型的,以使降解决定子可以不依赖于实验控制而对蛋白稳定性发挥其影响(即,降解决定子不是药物可诱导的、温度可诱导的等)。在一些情况中,降解决定子为变体SluCas9多肽提供了可控制的稳定性,从而使得变体SluCas9多肽可以依赖于所期望的条件“打开”(即,稳定的)或“关闭”(即,不稳定的,降解的)。例如,如果降解决定子是温度敏感的降解决定子,则变体SluCas9多肽可以在低于阈值温度(例如42℃、41℃、40℃、39℃、38℃、37℃、36℃、35℃、34℃、33℃、32℃、31℃、30℃等)时有功能(即,“打开”,稳定的),但在高于阈值温度时无功能(即,“关闭”,降解的)。作为另一个例子,如果降解决定子是药物可诱导的降解决定子,则药物的存在或不存在可将蛋白从“关闭”(即,不稳定的)状态切换到“打开”(即,稳定的)状态,或反之亦然。示例性的药物可诱导的降解决定子衍生自FKBP12蛋白。降解决定子的稳定性由与降解决定子结合的小分子的存在或不存在来控制。
合适的降解决定子的例子包括,但不限于由Shield-1、DFHR、生长素和/或温度控制的那些降解决定子。合适的降解决定子的非限制性实例是本领域已知的(例如 Dohmen等人, Science, 1994. 263(5151): 第1273-1276页: Heat-inducible degron: a methodfor constructing temperature-sensitive mutants;Schoeber等人, Am J PhysiolRenal Physiol. 2009年1月;296(1):F204-11 :Conditional fast expression andfunction of multimeric TRPV5 channels using Shield-1;Chu等人, Bioorg MedChern Lett. 2008年11月15日;18(22):5941-4: Recent progress with FKBP-deriveddestabilizing domains ;Kanemaki, Pflugers Arch. 2012年12月28日: Frontiers ofprotein expression control with conditional degrons;Yang等人, Mol Cell. 2012年11月30日;48(4):487-8: Titivated for destruction: the methyl degron;Barbour等人, Biosci Rep. 2013年1月18日;33(1).: Characterization of the bipartitedegron that regulates ubiquitin-independent degradation ofthymidylatesynthase;和Greussing等人, J Vis Exp. 2012年11月10日;(69): Monitoring ofubiquitin-proteasome activity in living cells using a Degron (dgn)-destabilized green fluorescent protein (GFP)-based reporter protein;其全部特此整体引入作为参考)。
示例性的降解决定子序列已经在细胞和动物两者中得到充分表征和测试。因此,将SluCas9融合至降解决定子序列产生“可调的”和“可诱导的” SluCas9多肽。本文所述的任何融合配偶体都可以以任何期望的组合使用。作为举例说明这一点的一个非限制性实例,SluCas9融合蛋白可包含用于检测的YFP序列、用于稳定性的降解决定子序列和增加靶DNA转录的转录激活因子序列。此外,可以在SluCas9融合蛋白中使用的融合配偶体的数目是没有限制的。在一些情况中,SluCas9融合蛋白包含一个或多个(例如两个或更多个、三个或更多个、四个或更多个或五个或更多个)异源序列。
合适的融合配偶体包括,但不限于,提供甲基转移酶活性、脱甲基酶活性、乙酰转移酶活性、脱乙酰酶活性、激酶活性、磷酸酶活性、泛素连接酶活性、脱泛素活性、腺苷化活性、脱腺苷化活性、苏素化活性、脱苏素化活性、核糖基化活性、脱核糖基化活性、巴豆酰化活性、脱巴豆酰化活性、丙酰化活性、脱丙酰化活性、豆蔻酰化活性或脱豆蔻酰化活性的多肽,它们中的任何一种都可以旨在直接修饰DNA(例如DNA的甲基化作用)或修饰DNA-相关多肽(例如组蛋白或DNA结合蛋白)。进一步合适的融合配偶体包括,但不限于边界元件(例如CTCF)、提供外周募集的蛋白及其片段(例如核纤层蛋白A、核纤层蛋白B等)和蛋白质停靠元件(例如FKBP/FRB、Pil 1/Aby 1等)。
在一些实施方案中,可以对SluCas9多肽进行密码子优化。这种类型的优化在本领域中是已知的,并且需要外源DNA的突变以在编码相同蛋白的同时模拟预期宿主生物或细胞的密码子偏好。因此,密码子被改变,但是编码的蛋白保持不变。例如,如果预期的靶细胞是人细胞,则人密码子优化的dSluCas9(或dSluCas9变体)将是合适的位点定向修饰多肽。作为另一个非限制性实例,如果预期的宿主细胞是小鼠细胞,则小鼠密码子优化的SluCas9(或变体,例如酶促无活性的变体)将是合适的SluCas9位点定向多肽。尽管不需要密码子优化,但它是可以接受的,且在某些情况中可能是优选的。
还可以选择聚腺苷酸化信号以最优化在预期宿主中的表达。
宿主细胞
本公开内容的调节转录的方法可以用于在体内和/或先体外后体内和/或体外在有丝分裂或有丝分裂后细胞中诱导转录调节。因为指导RNA通过与靶DNA杂交提供特异性,所以有丝分裂和/或有丝分裂后细胞可以是多种宿主细胞中的任何一种,其中合适的宿主细胞包括,但不限于,细菌细胞;古细菌细胞;单细胞真核生物;植物细胞;藻类细胞,例如丛粒藻(Botryococcus braunii)、雷氏衣藻(Chlamydomonas reinhardtii)、微拟球藻(Nannochloropsis gaditana)、蛋白核小球藻(Chlorella pyrenoidosa)、展枝马尾藻(Sargassum patens C. Agardh)等;真菌细胞;动物细胞;来自无脊椎动物(例如昆虫、刺胞动物、棘皮动物、线虫等)的细胞;真核寄生物(例如疟原虫,例如恶性疟虫(Plasmodiumfakiparum);蠕虫等);来自脊椎动物(例如鱼、两栖动物、爬行动物、鸟、哺乳动物)的细胞;哺乳动物细胞,例如啮齿类动物细胞,人细胞,非人灵长类动物细胞等。合适的宿主细胞包括天然存在的细胞;基因修饰细胞(例如在实验室中例如通过“人的手”进行基因修饰的细胞);以及以任何方式在体外操作的细胞。在一些情况中,宿主细胞是分离的。
任何类型的细胞都可能是有意义的(例如干细胞,例如胚胎干(ES)细胞、诱导的多潜能干(iPS)细胞、生殖细胞;体细胞,例如成纤维细胞、造血细胞、神经元、肌细胞、骨细胞、肝细胞、胰细胞;处于任何阶段的胚胎的体外或体内胚胎细胞,例如1-细胞、2-细胞、4-细胞、8-细胞等阶段斑马鱼胚胎;等)。细胞可以来自确立的细胞系,或者它们可以是原代细胞,其中“原代细胞”、“原代细胞系”和“原代培养物”在本文中可互换使用,以指已经衍生自主体并被允许在体外生长有限数目的培养物传代即分裂的细胞和细胞培养物。例如,原代培养物包括可能已经传代0次、1次、2次、4次、5次、10次或15次但未传代通过转捩阶段的足够次数的培养物。原代细胞系可在体外维持少于10次传代。靶细胞在许多实施方案中是单细胞生物,或在培养物中生长。
如果细胞是原代细胞,则可以通过任何方便的方法从个体中收获这种细胞。例如,白细胞可通过单采血液成分术、白细胞除去法、密度梯度分离等方便地收获,而来自诸如皮肤、肌肉、骨髓、脾、肝、胰、肺、肠、胃等的组织的细胞最方便通过活组织检查收获。可以使用适当的溶液分散或悬浮收获的细胞。这种溶液通常将是平衡盐溶液,例如生理盐水、磷酸缓冲盐水(PBS)、Hank氏平衡盐溶液等,方便地补加了胎牛血清或其他天然存在的因子,连带着可接受的低浓度缓冲液,例如5-25 mM。方便的缓冲液包括HEPES、磷酸盐缓冲液、乳酸盐缓冲液等。细胞可以立即使用,或者它们可以冷冻贮藏长的时间段,被解冻并能够再使用。在这种情况中,通常将细胞在10%二甲基亚砜(DMSO),50%血清,40%缓冲的培养基或如本领域中所通常使用的一些其他这种溶液中冷冻,以在这种冷冻温度保存细胞,并以如本领域中所通常已知的方式解冻,以用于解冻冷冻的培养的细胞。
将核酸引入宿主细胞
可以通过多种众所周知的方法中的任一种将指导RNA或包含编码其的核苷酸序列的核酸引入宿主细胞。类似地,在方法包括将包含编码变体SluCas9位点定向多肽的核苷酸序列的核酸引入宿主细胞的场合,可以通过多种众所周知的方法中的任一种将这种核酸引入宿主细胞。
将核酸引入宿主细胞的方法是本领域已知的,并且可以使用任何已知方法将核酸(例如表达构建体)引入干细胞或祖先细胞。合适的方法包括,例如病毒或噬菌体感染、转染、接合、原生质体融合、脂质转染法、电穿孔、磷酸钙沉淀、聚乙烯亚胺(PEI)介导的转染、DEAE-葡聚糖介导的转染、脂质体介导的转染、基因枪技术、磷酸钙沉淀、直接显微注射、纳米颗粒介导的核酸递送(参见,例如 Panyam等人, Adv Drug Deliv Rev. 2012年9月13日.pii: 50169-409X(12)00283-9.doi: 10.1016/j.addr.2012.09.023)等,包括但不限于外来体递送。
核酸
本公开内容提供了分离的核酸,其包含编码指导RNA的核苷酸序列。在一些情况中,核酸还包含编码变体SluCas9位点定向多肽的核苷酸序列。
在一些实施方案中,方法包括将一种或多种包含编码指导RNA和/或变体SluCas9位点定向多肽的核苷酸序列的核酸引入宿主细胞(或宿主细胞群体)。在一些实施方案中,包含靶DNA的细胞是体外的。在一些实施方案中,包含靶DNA的细胞是体内的。包含编码指导RNA和/或变体SluCas9位点定向多肽的核苷酸序列的合适核酸包括表达载体,其中表达载体包含编码指导的核苷酸序列。
表达载体
在一些实施方案中,重组表达载体是病毒构建体,例如重组腺伴随病毒构建体(参见,例如美国专利No. 7,078,387)、重组腺病毒构建体、重组慢病毒构建体、重组反转录病毒构建体等。合适的表达载体包括,但不限于,病毒载体(例如基于痘苗病毒的病毒载体;脊髓灰质炎病毒;腺病毒(参见,例如Li等人, Invest Opthalmol Vis Sci 35:2543 2549, 1994;Borras等人, Gene Ther 6:515 524, 1999;Li和Davidson, PNAS 92:7700 7704, 1995;Sakamoto等人, H Gene Ther 5:10881097, 1999;WO 94/12649、WO 93/03769;WO 93/19191;WO 94/28938;WO 95/11984和WO 95/00655);腺伴随病毒(参见,例如 Ali等人, HumGene Ther 9:81 86, 1998, Flannery等人, PNAS 94:6916 6921, 1997;Bennett等人,Invest Opthalmol Vis Sci 38:2857 2863, 1997;Jomary等人, Gene Ther 4:683-690,1997, Rolling等人, Hum Gene Ther 10:641 648, 1999;Ali等人, Hum Mol Genet 5:591 594, 1996;Srivastava在WO 93/09239中,Samulski等人, J. Vir. (1989) 63:3822-3828;Mendelson等人, Viral. (1988) 166:154-165;和Flotte等人, PNAS (1993) 90:10613-10617);SV40;单纯疱疹病毒;人免疫缺陷病毒(参见,例如 Miyoshi等人, PNAS 94:10319 23, 1997;Takahashi等人, J Virol 73:7812 7816, 1999);反转录病毒载体(例如鼠白血病病毒,脾脏坏死病毒,以及衍生自反转录病毒的载体,例如劳斯肉瘤病毒,Harvey肉瘤病毒,禽类白血病病毒,慢病毒,人免疫缺陷病毒,骨髓增生肉瘤病毒和乳癌病毒);等等。
许多合适的表达载体是本领域技术人员已知的,并且许多是可商购获得的。作为实例提供下述载体;对于真核宿主细胞:pXT1、pSG5(Stratagene)、pSVK3、pBPV、pMSG和pSVLSV40(Pharmacia)。然而,可以使用任何其他载体,只要它与宿主细胞相容即可。
取决于所使用的宿主/载体系统,可以在表达载体中使用许多合适的转录和翻译控制元件中的任何一种,包括组成型和诱导型启动子、转录增强子元件、转录终止子等(参见,例如Bitter等人 (1987) Methods in Enzymology, 153:516-544)。
在一些实施方案中,编码指导RNA和/或变体SluCas9位点定向多肽的核苷酸序列可操作地连接至控制元件,例如转录控制元件,例如启动子。转录控制元件可以在真核细胞,例如哺乳动物细胞;或原核细胞(例如细菌或古细菌细胞)中起作用。在一些实施方案中,编码指导RNA和/或变体SluCas9位点定向多肽的核苷酸序列可操作地连接至多个控制元件,其允许在原核和真核细胞两者中表达编码指导RNA和/或变体SluCas9位点定向多肽的核苷酸序列。
启动子可以是组成型活性启动子(即,组成型地处于活性“打开”状态的启动子),其也可以是诱导型启动子(即,其状态活性/“打开”或无活性/“关闭”由外界刺激例如特定温度、化合物或蛋白的存在控制的启动子),其可以是空间限制的启动子(即,转录控制元件、增强子等)(例如组织特异性启动子、细胞类型特异性启动子等),并且其可以是时间限制的启动子(即,在胚胎发育的特定阶段过程中或生物过程的特定阶段(例如小鼠中的毛囊循环)过程中处于“打开”状态或“关闭”状态的启动子)。
合适的启动子可以衍生自病毒,且因此可以被称为病毒启动子,或者它们可以衍生自任何生物,包括原核或真核生物。合适的启动子可用于通过任何RNA聚合酶(例如polI、pol II、pol III)驱动表达。示例性启动子包括,但不限于SV40早期启动子,小鼠乳癌病毒长末端重复序列(LTR)启动子;腺病毒主要晚期启动子(Ad MLP);单纯疱疹病毒(HSV)启动子,巨细胞病毒(CMV)启动子例如CMV立即早期启动子区域(CMVIE),劳斯肉瘤病毒(RSV)启动子,人U6小核启动子(U6)(Miyagishi等人, Nature Biotechnology 20, 497- 500(2002)),增强的U6启动子(例如,Xia等人, Nucleic Acids Res. 2003 Sep 1;31(17)),人H1启动子(H1)等。
诱导型启动子的实例包括,但不限于T7 RNA聚合酶启动子、T3 RNA聚合酶启动子、异丙基-β-D-硫代吡喃半乳糖苷(IPTG)调节的启动子、乳糖诱导的启动子、热激启动子、四环素调节的启动子(例如Tet-ON、Tet-OFF等)、类固醇调节的启动子、金属调节的启动子、雌激素受体调节的启动子等。因此,诱导型启动子可以被包括但不限于下述的分子调节:多西环素;RNA聚合酶,例如 T7 RNA聚合酶;雌激素受体;雌激素受体融合体;等。
在一些实施方案中,启动子是空间限制的启动子(即,细胞类型特异性启动子、组织特异性启动子等),从而使得在多细胞生物中,所述启动子在特定细胞亚群中是有活性的(即,“打开”)。空间限制的启动子也可以称为增强子、转录控制元件、控制序列等。可以使用任何方便的空间限制的启动子,且合适的启动子(例如脑特异性启动子、驱动神经元亚群中表达的启动子、驱动种系中表达的启动子、驱动肺中表达的启动子、驱动肌肉中表达的启动子、驱动胰的胰岛细胞中表达的启动子等)的选择将取决于生物。例如,已知对于植物、蝇、蠕虫、哺乳动物、小鼠等的各种空间限制的启动子。因此,取决于生物,空间限制的启动子可用于调节在各种各样的不同组织和细胞类型中编码变体SluCas9位点定向多肽的核酸的表达。一些空间限制的启动子也是时间限制的,从而使得所述启动子在胚胎发育的特定阶段过程中或生物过程的特定阶段(例如小鼠中的毛囊循环)过程中处于“打开”状态或“关闭”状态。
为了举例说明起见,空间限制的启动子的实例包括,但不限于,神经元特异性启动子、脂肪细胞特异性启动子、心肌细胞特异性启动子、平滑肌特异性启动子、光受体特异性启动子等。神经元特异性的空间限制的启动子包括,但不限于,神经元特异性烯醇化酶(NSE)启动子(参见,例如 EMBL HSENO2,X51956);芳族氨基酸脱羧酶(AADC)启动子;神经丝启动子(参见,例如 GenBank HUMNFL,L04147);突触蛋白启动子(参见,例如GenBankHUMSYNIB,M55301);thy-1启动子(参见,例如 Chen等人 (1987) Ce/151 :7-19;和Llewellyn等人 (2010) Nat. Med. 16(10):1161-1166);5-羟色胺受体启动子(参见,例如GenBank S62283);酪氨酸羟化酶启动子(TH)(参见,例如Oh等人 (2009) Gene Ther 16:437;Sasaoka等人 (1992) Mol. Brain Res. 16:274;Boundy等人 (1998) J. Neurosci.18:9989;和Kaneda等人 (1991) Neuron 6:583-594);GnRH启动子(参见,例如Radovick等人 (1991) Proc. Nat!. Acad. Sci. USA 88:3402-3406);L7启动子(参见,例如Oberdick等人 (1990) Science 248:223-226);DNMT启动子(参见,例如Bartge等人 (1988) Proc.Nat/. Acad. Sci. USA 85:3648- 3652);脑啡肽启动子(参见,例如Comb等人 (1988)EMBO J. 17:3793-3805);髓鞘碱性蛋白(MBP)启动子;Ca2+-钙调蛋白依赖性蛋白激酶11-α(CamKIIa)启动子(参见,例如Mayford等人 (1996) Proc. Nat/. Acad. Sci. USA 93:13250;和Casanova等人 (2001) Genesis 31:37);CMV增强子/血小板衍生生长因子-0启动子(参见,例如Liu等人 (2004) Gene Therapy 11:52-60);等等。
脂肪细胞特异性的空间限制的启动子包括,但不限于aP2基因启动子/增强子,例如人aP2基因从-5.4 kb到+21 bp的区域(参见,例如Tozzo等人 (1997) Endocrinol. 138:1604;Ross等人 (1990) Proc. Nat!. Acad. Sci. USA 87:9590;和Pavjani等人 (2005)Nat. Med. 11:797);葡萄糖转运蛋白-4(GLUT4)启动子(参见,例如Knight等人 (2003)Proc. Nat/. Acad. Sci. USA 100:14725);脂肪酸移位酶(FAT/CD36)启动子(参见,例如Kuriki等人 (2002) Bioi. Pharm. Bull. 25:1476;和Sato等人 (2002) J. Bioi.Chern. 277:15703);硬脂酰辅酶A去饱和酶-1(SCD1)启动子(Tabor等人 (1999) J. Bioi.Chern. 274:20603);瘦蛋白启动子(参见,例如Mason等人 (1998) Endocrinol. 139:1013;和Chen等人 (1999) Biochem. Biophys. Res. Comm. 262:187);脂连蛋白启动子(参见,例如Kita等人 (2005) Biochem. Biophys. Res. Comm. 331:484;和Chakrabarti(2010) Endocrinol. 151:2408);降脂蛋白启动子(参见,例如Platt等人 (1989) Proc.Nat/. Acad. Sci. USA 86:7490);抵抗素启动子(参见,例如Seo等人 (2003) Malec.Endocrinol. 17:1522);等等。
心肌细胞特异性的空间限制的启动子包括,但不限于衍生自下述基因的控制序列:肌球蛋白轻链-2、a-肌球蛋白重链、AE3、心肌钙蛋白C、心肌动蛋白等。Franz等人(1997) Cardiovasc. Res. 35:560-566;Robbins等人 (1995) Ann. N.Y. Acad. Sci.752:492-505;Linn等人 (1995) Circ. Res. 76:584591;Parmacek等人 (1994) Mol.Cell. Bioi. 14:1870-1885;Hunter等人 (1993) Hypertension 22:608-617;和Sartorelli等人 (1992) Proc. Natl. Acad. Sci. USA 89:4047-4051。
平滑肌特异性的空间限制的启动子包括,但不限于SM22a启动子(参见,例如Akyilrek等人 (2000) Mol. Med. 6:983;和美国专利No. 7,169,874);平滑肌蛋白启动子(参见,例如WO 2001/018048);a-平滑肌肌动蛋白启动子;等等。例如,已经显示两个CArG元件位于其中的SM22a启动子的0.4 kb区域介导血管平滑肌细胞特异性表达(参见,例如Kim等人 (1997) Mol. Cell. Bioi. 17, 2266-2278;Li等人, (1996) J. Cell Bioi. 132,849-859;和Moessler等人 (1996) Development 122, 2415-2425)。
光受体特异性的空间限制的启动子包括,但不限于,视紫红质启动子;视紫红质激酶启动子(Young等人 (2003) Ophthalmol. Vis. Sci. 44:4076);β磷酸二酯酶基因启动子(Nicoud等人 (2007) J. Gene Med. 9:1015);色素性视网膜炎基因启动子(Nicoud等人(2007)上文);光受体间类视黄醇结合蛋白(IRBP)基因增强子(Nicoud等人 (2007)上文);IRBP基因启动子(Yokoyama等人 (1992) Exp Eye Res. 55:225);等等。
用途
根据本公开内容的用于调节转录的方法应用于也被提供的多种应用中。应用包括研究应用;诊断应用;工业应用;和治疗应用。
研究应用包括,例如确定减少或增加靶核酸的转录对例如发育、代谢、下游基因的表达等的作用。可以使用转录调节方法进行高通量的基因组分析,其中仅指导RNA的DNA-靶向区段需要改变,而蛋白结合区段和转录终止区段可以(在一些情况中)保持不变。包含在基因组分析中使用的许多核酸的文库(例如文库)将包括:与编码指导RNA的核苷酸序列可操作地连接的启动子,其中每种核酸将包括共同的蛋白结合区段,不同的DNA-靶向区段和共同的转录终止区段。芯片可含有超过5 x 104个独特的指导RNAs。应用将包括大规模的表型分析、基因到功能作图以及宏基因组分析(meta-genomic analysis)。
本文公开的方法应用于代谢工程领域。如本文所公开的,因为可以通过设计合适的指导RNA来有效地和可预测地控制转录水平,所以可以通过控制感兴趣的代谢途径中特定酶的水平(例如通过增加或减少的转录)来精确地控制和调节代谢途径(例如生物合成途径)的活性。感兴趣的代谢途径包括用于化学(精细化学品、燃料、抗生素、毒素、激动剂、拮抗剂等)和/或药物生产的那些。
感兴趣的生物合成途径包括但不限于(1)甲羟戊酸途径(例如β-羟基-β-甲基戊二酸单酰辅酶A还原酶途径)(将乙酰辅酶A转化为二甲基烯丙基焦磷酸(DMAPP)和异戊烯焦磷酸(IPP),它们用于包括类萜/类异戊二烯在内的各种各样生物分子的生物合成),(2)非甲羟戊酸途径(即,“2-C-甲基-D-赤藓糖醇4-磷酸/1-脱氧-D-木酮糖5-磷酸途径”或“MEP/DOXP途径”或“DXP途径”)(也产生DMAPP和IPP,而通过经由甲羟戊酸途径的替换途径将丙酮酸和甘油醛3-磷酸转化为DMAPP和IPP),(3)聚酮化合物合成途径(通过多种聚酮化合物合酶生产多种聚酮化合物。聚酮化合物包括用于化学疗法的天然存在的小分子(例如四环素和大环内酯),且工业上重要的聚酮化合物包括雷帕霉素(免疫抑制剂)、红霉素(抗生素)、抑甲羟酶素(抗胆固醇药)和埃博霉素B(抗癌药)),(4)脂肪酸合成途径,(5)DAHP(3-脱氧-D-阿拉伯庚酮糖酸
Figure 473486DEST_PATH_IMAGE003
-磷酸)合成途径,(6)产生潜在生物燃料(例如短链醇和链烷,脂肪酸甲酯和脂肪醇,类异戊二烯等)的途径,等。
网络和级联
本文公开的方法可以用于设计控制的综合网络(即,一种或多种级联)。例如,指导RNAI变体SluCas9位点定向多肽可用于控制(即,调节,例如增加、减少)另一种DNA-靶向RNA或另一种变体SluCas9位点定向多肽的表达。例如,第一指导RNA可以被进行设计以靶向具有与第一变体SluCas9位点定向多肽不同的功能(例如甲基转移酶活性、脱甲基酶活性、乙酰转移酶活性、脱乙酰酶活性等)的第二嵌合dSluCas9多肽的转录的调节。此外,因为不同的dSluCas9蛋白(例如衍生自不同物种)可能需要不同的SluCas9柄(即,蛋白结合区段),所以第二嵌合dSluCas9多肽可以衍生自与上述第一dSluCas9多肽不同的物种。因此,在一些情况中,可以选择第二嵌合dSluCas9多肽,从而使得其可以不与第一指导RNA相互作用。在其他情况中,可以选择第二嵌合dSluCas9多肽,从而使得其与第一指导RNA相互作用。在一些这种情况中,两种(或更多种)dSluCas9蛋白的活性可以竞争(例如,如果多肽具有相反的活性)或可以协同(例如,如果多肽具有相似或协同的活性)。同样,如上文所指出的,可以对网络中的任何复合体(即,指导RNA I dSluCas9多肽)进行设计以控制其他指导RNAs或dSluCas9多肽。因为指导RNA和变体SluCas9位点定向多肽可以靶向任何所期望的DNA序列,所以本文所述的方法可以用于控制和调节任何所期望的靶的表达。可以进行设计的综合网络(即,相互作用的级联)从非常简单的一直到非常复杂的,并且没有限制。
在其中两种或更多种组分(例如指导RNA或dSluCas9多肽)各自处于另一指导RNA/dSluCas9多肽复合体的调节控制下的网络中,网络的一种组分的表达水平可能影响网络的另一种组分的表达水平(例如可能增加或减少表达)。通过这种机制,一种组分的表达可能影响相同网络中不同组分的表达,并且所述网络可能包括增加其他组分表达的组分以及减少其他组分表达的组分的混合物。如本领域的技术人员将容易理解的,上述一种组分的表达水平可能影响一种或多种不同组分的表达水平的实例是为了举例说明起见的,而不是限制性的。当将一种或多种组分进行修饰(如上所述)以使其可操作时(即,在实验控制下,例如温度控制;药物控制,即,药物可诱导的控制;光控制;等等),可以将额外层次的复杂性引入网络。
作为一个非限制性实例,第一指导RNA可以结合第二指导RNA的启动子,其控制靶治疗/代谢基因的表达。在这种情况中,第一指导RNA的条件性表达间接激活治疗/代谢基因。这种类型的RNA级联可用于例如容易地将阻遏蛋白转化为激活物,并可用于控制靶基因表达的逻辑或动力学。
转录调节方法也可用于药物发现和靶标确认。
本发明的各个方面利用下述材料和方法,并通过下述非限制性实施例进行举例说明。
术语
除非本文不同地定义了技术或科学术语,否则本文所使用的所有技术和科学术语均具有与本发明所属领域的普通技术人员通常理解的相同的含义。
本文可互换使用的术语“多核苷酸”和“核酸”是指任何长度的核苷酸的聚合形式,不是核糖核苷酸就是脱氧核糖核苷酸。因此,这个术语包括,但不限于,单链、双链或多链DNA或RNA,基因组DNA,cDNA,DNA-RNA杂交体/三股螺旋,或包含嘌呤和嘧啶碱基或其他天然的、化学或生物化学修饰的、非天然的或衍生的核苷酸碱基的聚合物。
“寡核苷酸”通常是指单链或双链DNA的约5至约100个核苷酸的多核苷酸。然而,对本公开内容来说,寡核苷酸的长度没有上限。寡核苷酸也被称为“寡聚体”或“寡核苷酸(oligos)”,并且可以从基因中分离,或通过本领域已知的方法化学合成。在适用于所描述的实施方案的情况下,应当将术语“多核苷酸”和“核酸”理解为包括单链(例如有义或反义)和双链多核苷酸。
“基因组DNA”是指生物的基因组的DNA,包括,但不限于,细菌、真菌、古细菌、原生生物、病毒、植物或动物的基因组的DNA。
“操纵” DNA包括结合、在一条链产生切口或切割(即切断)DNA的两条链,或包括修饰或编辑DNA或与DNA相关的多肽。操纵DNA可以沉默、激活或调节(增加或减少)由DNA编码的RNA或多肽的表达,或防止或增强多肽与DNA的结合。
“茎-环结构”是指具有二级结构的核酸,所述二级结构包括已知或预测形成双链的核苷酸区域(茎部分),其在一侧通过主要为单链的核苷酸区域(环部分)连接。术语“发夹”和“折回”结构在本文中也用于指茎-环结构。这种结构在本领域中是众所周知的,并且这些术语与其在本领域中的已知含义一致地使用。如本领域中已知的,茎-环结构不需要精确的碱基配对。因此,茎可以包括一个或多个碱基错配。另一方面,碱基配对可以是精确的,即,不包括任何错配。
“可杂交的”或“互补的”或“基本上互补的”是指包含核苷酸序列的核酸(例如RNA),所述核苷酸序列使得其能够在适当的体外和/或体内温度和溶液离子强度条件下以序列特异性的、反平行的方式(即,核酸特异性结合互补核酸)与另一核酸非共价结合,即,形成沃森-克里克碱基对和/或G/U碱基对、“退火”或“杂交”。如本领域已知的,标准的沃森-克里克碱基配对包括:腺嘌呤(A)与胸苷(T)配对、腺嘌呤(A)与尿嘧啶(U)配对和鸟嘌呤(G)与胞嘧啶(C)配对[DNA,RNA]。此外,在本领域中还已知对于两个RNA分子(例如dsRNA)之间的杂交,鸟嘌呤(G)与尿嘧啶(U)碱基配对。例如,在与mRNA中的密码子进行碱基配对的tRNA反密码子的情况下,G/U碱基配对部分地负责遗传密码的简并性(即,冗余)。在本公开内容的上下文中,指导RNA分子的蛋白结合区段(dsRNA双链体)的鸟嘌呤(G)被认为与尿嘧啶(U)互补,且反之亦然。因此,当可以在指导RNA分子的蛋白结合区段(dsRNA双链体)的给定的核苷酸位置产生G/U碱基对时,所述位置不被认为是非互补的,而是被认为是互补的。
杂交和洗涤条件是众所周知的,并在Sambrook, J., Fritsch, E. F.和Maniatis, T. Molecular Cloning: A Laboratory Manual, 第二版, Cold SpringHarbor Laboratory Press, Cold Spring Harbor (1989),特别是其中的第11章和表11.1;和Sambrook, J.和Russell, W., Molecular Cloning: A Laboratory Manual, 第三版, Cold Spring Harbor Laboratory Press, Cold Spring Harbor (2001)中例示。温度和离子强度的条件决定了杂交的“严格性”。
杂交需要两个核酸包含互补序列,尽管碱基之间的错配是可能的。适合于两个核酸之间杂交的条件取决于核酸的长度和互补程度,本领域众所周知的变量。两个核苷酸序列之间的互补程度越大,具有那些序列的核酸的杂交体的解链温度(Tm)的值越大。对于具有短互补序列段(例如在35个或更少、30个或更少、25个或更少、22个或更少、20个或更少或18个或更少的核苷酸范围内的互补性)的核酸之间的杂交,错配的位置变得重要(参见Sambrook等人,上文,11.7-11.8)。通常,可杂交的核酸的长度为至少10个核苷酸。可杂交的核酸的举例说明性最小长度为:至少15个核苷酸;至少20个核苷酸;至少22个核苷酸;至少25个核苷酸;和至少30个核苷酸)。此外,本领域技术人员将认识到,可以根据诸如互补区域的长度和互补程度的因素,在必要时调节温度和洗涤溶液盐浓度。
在本领域中理解,多核苷酸的序列不需要与其可特异性杂交的靶核酸的序列100%互补。此外,多核苷酸可在一个或多个区段上杂交,从而使得在杂交事件中不涉及间插或相邻区段(例如,环结构或发夹结构)。多核苷酸可包含与其所靶向的靶核酸序列内的靶区域的至少70%、至少80%、至少90%、至少95%、至少99%或100%的序列互补性。例如,其中反义化合物的20个核苷酸中的18个与靶区域互补并且因此将特异性杂交的反义核酸将代表90%的互补性。在这个实例中,剩余的非互补核苷酸可以与互补核苷酸成簇或散布,并且不需要彼此或与互补核苷酸邻接。可以使用本领域已知的BLAST程序(基本局部比对搜索工具(basic local alignment search tools))和PowerBLAST程序(Altschul等人, J.Mol. Biol. 1990,215, 403-410;Zhang和Madden, Genome Res., 1997,7, 649-656)或通过使用Gap程序(Wisconsin Sequence Analysis Package, Version 8 for Unix,Genetics Computer Group, University Research Park, Madison Wis.),使用默认设置,其使用Smith和Waterman(Adv. Appl. Math. 1981(2) 482-489)的算法,常规地确定核酸内特定核酸序列段之间的百分比互补性。
术语“肽”、“多肽”和“蛋白质”在本文中可互换使用,且是指任何长度的氨基酸的聚合形式,其可以包括编码和非编码的氨基酸,化学或生物化学修饰或衍生的氨基酸,和具有修饰的肽主链的多肽。
如本文所用的“结合”(例如,关于多肽的RNA-结合结构域)是指大分子之间(例如,蛋白与核酸之间)的非共价相互作用。当处于非共价相互作用状态时,大分子被认为是“缔合的”或“相互作用”或“结合”(例如,当分子X被认为与分子Y相互作用时,其指的是分子X以非共价方式结合分子Y)。并非结合相互作用的所有组分都需要是序列特异性的(例如与DNA主链中的磷酸残基接触),但是结合相互作用的一些部分可能是序列特异性的。结合相互作用的特征通常在于小于10-6 M、小于10-7 M、小于10-8 M、小于10-9 M、小于10-10 M、小于10-11 M、小于10-12 M、小于10-13 M、小于10-14 M或小于10-15M的解离常数(Kd)。“亲和力”是指结合强度,增加的结合亲和力与较低的Kd有关。
所谓“结合结构域”指的是能够非共价结合另一分子的蛋白结构域。结合结构域可以结合至例如DNA分子(DNA-结合蛋白)、RNA分子(RNA-结合蛋白)和/或蛋白分子(蛋白结合蛋白)。在蛋白结构域结合蛋白的情况中,它可以结合它本身(以形成同二聚体、同三聚体等)和/或它可以结合一种或多种不同蛋白质的一个或多个分子。
术语“保守氨基酸取代”是指蛋白中具有相似侧链的氨基酸残基的可互换性。例如,具有脂族侧链的一组氨基酸由甘氨酸、丙氨酸、缬氨酸、亮氨酸和异亮氨酸组成;具有脂族-羟基侧链的一组氨基酸由丝氨酸和苏氨酸组成;具有含酰胺的侧链的一组氨基酸由天冬酰胺和谷氨酰胺组成;具有芳族侧链的一组氨基酸由苯丙氨酸、酪氨酸和色氨酸组成;具有碱性侧链的一组氨基酸由赖氨酸、精氨酸和组氨酸组成;具有酸性侧链的一组氨基酸由谷氨酸和天冬氨酸组成;且具有含硫侧链的一组氨基酸由半胱氨酸和甲硫氨酸组成。示例性的保守氨基酸取代组是:缬氨酸-亮氨酸-异亮氨酸、苯丙氨酸-酪氨酸、赖氨酸-精氨酸、丙氨酸-缬氨酸和天冬酰胺-谷氨酰胺。
多核苷酸或多肽与另一多核苷酸或多肽具有一定百分比的“序列同一性”,从而意味着当比较两个序列时,比对时所述百分比的碱基或氨基酸相同且在相同的相对位置。序列同一性可以以多种不同方式确定。为了确定序列同一性,可以使用在包括ncbi.nlm.nili.gov/BLAST、ebi.ac.uk/Tools/msa/tcoffee、ebi.Ac.Uk!Tools/msa/muscle、mafft.cbrc/alignment/software的网站在万维网上可获得的各种方法和计算机程序(例如BLAST、T-COFFEE、MUSCLE、MAFFT等)对序列进行比对。参见,例如Altschul等人(1990), J. Mol. Bioi. 215:403-10。根据本发明,使用本领域中标准的序列比对来确定SluCas9直向同源物中“对应于”另一SluCas9直向同源物中的氨基酸残基的氨基酸残基。与其他SluCas9直向同源物的氨基酸残基相对应的SluCas9直向同源物的氨基酸残基出现在序列比对中的相同位置。
“编码”特定RNA的DNA序列是转录为RNA的DNA核酸序列。DNA多核苷酸可以编码被翻译成蛋白的RNA(mRNA),或者DNA多核苷酸可以编码不被翻译成蛋白质的RNA(例如tRNA、rRNA或指导RNA;也称为“非编码”RNA或“ncRNA”)。“蛋白编码序列”或编码特定蛋白或多肽的序列是当置于适当的调节序列的控制下时在体外或体外转录成mRNA(在DNA的情况下)并翻译(在mRNA的情况下)成多肽的核酸序列。编码序列的边界由5'末端(N-末端)的起始密码子和3'末端(C-末端)的翻译终止无义密码子确定。编码序列可以包括,但不限于,来自原核或真核mRNA的cDNA、来自原核或真核DNA的基因组DNA序列以及合成核酸。转录终止序列通常将位于编码序列的3'。
如本文所用的,“启动子序列”或“启动子”是能够结合RNA聚合酶并起始下游(3'方向)编码或非编码序列的转录的DNA调节区。为了定义本发明起见,启动子序列在其3'末端以转录起始位点为界,并向上游(5'方向)延伸,以包括在高于背景的可检测水平起始转录所必需的最小数目的碱基或元件。在启动子序列内将发现转录起始位点,以及负责RNA聚合酶结合的蛋白结合结构域。真核启动子将经常但不总是含有“TATA”框和“CAAT”框。各种启动子,包括诱导型启动子,可用于驱动本发明的各种载体。启动子可以是组成型活性启动子(即,组成型地处于活性“打开”状态的启动子),其可以是诱导型启动子(即,其状态活性/“打开”或无活性/“关闭”由外界刺激例如特定温度、化合物或蛋白的存在控制的启动子),其可以是空间限制的启动子(即,转录控制元件、增强子等)(例如组织特异性启动子、细胞类型特异性启动子等),并且其可以是时间限制的启动子(即,在胚胎发育的特定阶段过程中或生物过程的特定阶段(例如小鼠中的毛囊循环)过程中处于“打开”状态或“关闭”状态的启动子)。合适的启动子可以衍生自病毒,且因此可以被称为病毒启动子,或者它们可以衍生自任何生物,包括原核或真核生物。合适的启动子可用于通过任何RNA聚合酶(例如polI、pol II、pol III)驱动表达。示例性启动子包括,但不限于SV40早期启动子,小鼠乳癌病毒长末端重复序列(LTR)启动子;腺病毒主要晚期启动子(Ad MLP);单纯疱疹病毒(HSV)启动子,巨细胞病毒(CMV)启动子例如CMV立即早期启动子区域(CMVIE),劳斯肉瘤病毒(RSV)启动子,人U6小核启动子(U6)(Miyagishi等人, Nature Biotechnology 20, 497- 500(2002)),增强的U6启动子(例如Xia等人, Nucleic Acids Res. 2003 Sep 1;31(17)),人H1启动子(H1)等。诱导型启动子的实例包括,但不限于T7 RNA聚合酶启动子、T3 RNA聚合酶启动子、异丙基-β-D-硫代吡喃半乳糖苷(IPTG)调节的启动子、乳糖诱导的启动子、热激启动子、四环素调节的启动子、类固醇调节的启动子、金属调节的启动子、雌激素受体调节的启动子等。因此,诱导型启动子可以被包括但不限于下述的分子调节:多西环素;RNA聚合酶,例如 T7 RNA聚合酶;雌激素受体;雌激素受体融合体;等。
在一些实施方案中,启动子是空间限制的启动子(即,细胞类型特异性启动子、组织特异性启动子等),从而使得在多细胞生物中,所述启动子在特定细胞亚群中是有活性的(即,“打开”)。空间限制的启动子也可以称为增强子、转录控制元件、控制序列等。可以使用任何方便的空间限制的启动子,且合适的启动子(例如脑特异性启动子、驱动神经元亚群中表达的启动子、驱动种系中表达的启动子、驱动肺中表达的启动子、驱动肌肉中表达的启动子、驱动胰的胰岛细胞中表达的启动子等)的选择将取决于生物。例如,已知对于植物、蝇、蠕虫、哺乳动物、小鼠等的各种空间限制的启动子。因此,取决于生物,空间限制的启动子可用于调节在各种各样的不同组织和细胞类型中编码SluCas9多肽的核酸的表达。一些空间限制的启动子也是时间限制的,从而使得所述启动子在胚胎发育的特定阶段过程中或生物过程的特定阶段(例如小鼠中的毛囊循环)过程中处于“打开”状态或“关闭”状态。为了举例说明起见,空间限制的启动子的实例包括,但不限于,神经元特异性启动子、脂肪细胞特异性启动子、心肌细胞特异性启动子、平滑肌特异性启动子、光受体特异性启动子等。神经元特异性的空间限制的启动子包括,但不限于,神经元特异性烯醇化酶(NSE)启动子(参见,例如 EMBL HSENO2,X51956);芳族氨基酸脱羧酶(AADC)启动子;神经丝启动子(参见,例如GenBank HUMNFL,L04147);突触蛋白启动子(参见,例如GenBank HUMSYNIB,M55301);thy-1启动子(参见,例如 Chen等人 (1987) Cell 51 :7-19;和Llewellyn等人 (2010) Nat.Med. 16(10):1161-1166);5-羟色胺受体启动子(参见,例如GenBank S62283);酪氨酸羟化酶启动子(TH)(参见,例如Oh等人 (2009) Gene Ther. 16:437;Sasaoka等人 (1992) Mol.Brain Res. 16:274;Boundy等人 (1998) J. Neurosci. 18:9989;和Kaneda等人 (1991)Neuron 6:583-594);GnRH启动子(参见,例如Radovick等人 (1991) Proc. Natl. Acad.Sci. USA 88:3402-3406);L7启动子(参见,例如Oberdick等人 (1990) Science 248:223-226);DNMT启动子(参见,例如Bartge等人 (1988) Proc. Natl. Acad. Sci. USA 85:3648-3652);脑啡肽启动子(参见,例如Comb等人 (1988) EMBO J. 17:3793-3805);髓鞘碱性蛋白(MBP)启动子;Ca2+-钙调蛋白依赖性蛋白激酶11-α(CamKIM)启动子(参见,例如Mayford等人 (1996) Proc. Natl. Acad. Sci. USA 93:13250;和Casanova等人 (2001)Genesis 31:37);CMV增强子/血小板衍生生长因子-p启动子(参见,例如Liu等人 (2004)Gene Therapy 11:52-60);等等。
脂肪细胞特异性的空间限制的启动子包括,但不限于aP2基因启动子/增强子,例如人aP2基因从-5.4 kb到+21 bp的区域(参见,例如Tozzo等人 (1997) Endocrinol. 138:1604;Ross等人 (1990) Proc. Natl. Acad. Sci. USA 87:9590;和Pavjani等人 (2005)Nat. Med. 11:797);葡萄糖转运蛋白-4(GLUT4)启动子(参见,例如Knight等人 (2003)Proc. Natl. Acad. Sci. USA 100:14725);脂肪酸移位酶(FAT/CD36)启动子(参见,例如Kuriki等人 (2002) Bioi. Pharm. Bull. 25:1476;和Sato等人 (2002) J. Bioi.Chern. 277:15703);硬脂酰辅酶A去饱和酶-1(SCD1)启动子(Tabor等人 (1999) J. Bioi.Chern. 274:20603);瘦蛋白启动子(参见,例如Mason等人 (1998) Endocrinol. 139:1013;和Chen等人 (1999) Biochem. Biophys. Res. Comm. 262:187);脂连蛋白启动子(参见,例如Kita等人 (2005) Biochem. Biophys. Res. Comm. 331:484;和Chakrabarti(2010) Endocrinol. 151:2408);降脂蛋白启动子(参见,例如Platt等人 (1989) Proc.Natl. Acad. Sci. USA 86:7490);抵抗素启动子(参见,例如Seo等人 (2003) Molec.Endocrinol. 17:1522);等等。
心肌细胞特异性的空间限制的启动子包括,但不限于衍生自下述基因的控制序列:肌球蛋白轻链-2、a-肌球蛋白重链、AE3、心肌钙蛋白C、心肌动蛋白等。Franz等人(1997) Cardiovasc. Res. 35:560-566;Robbins等人 (1995) Ann. N.Y. Acad. Sci.752:492-505;Linn等人 (1995) Circ. Res. 76:584591;Parmacek等人 (1994) Mol.Cell. Bioi. 14:1870-1885;Hunter等人 (1993) Hypertension 22:608-617;和Sartorelli等人 (1992) Proc. Natl. Acad. Sci. USA 89:4047-4051。
平滑肌特异性的空间限制的启动子包括,但不限于SM22a启动子(参见,例如Akyiirek等人 (2000) Mol. Med. 6:983;和美国专利No. 7,169,874);平滑肌蛋白启动子(参见,例如WO 2001/018048);a-平滑肌肌动蛋白启动子;等等。例如,已经显示两个CArG元件位于其中的SM22a启动子的0.4 kb区域介导血管平滑肌细胞特异性表达(参见,例如Kim等人 (1997) Mol. Cell. Bioi. 17, 2266-2278;Li等人, (1996) J. Cell Bioi. 132,849-859;和Moessler等人 (1996) Development 122, 2415-2425)。
光受体特异性的空间限制的启动子包括,但不限于,视紫红质启动子;视紫红质激酶启动子(Young等人 (2003) Ophthalmol. Vis. Sci. 44:4076);β磷酸二酯酶基因启动子(Nicoud等人 (2007) J. Gene Med. 9:1015);色素性视网膜炎基因启动子(Nicoud等人(2007)上文);光受体间类视黄醇结合蛋白(IRBP)基因增强子(Nicoud等人 (2007)上文);IRBP基因启动子(Yokoyama等人 (1992) Exp Eye Res. 55:225);等等。
本文可互换地使用的术语“DNA调节序列”、“控制元件”和“调节元件”是指转录和翻译控制序列,例如启动子、增强子、聚腺苷酸化信号、终止子、蛋白降解信号等,其提供和/或调节非编码序列(例如,指导RNA)或编码序列(例如,SluCas9多肽)的转录和/或调节编码的多肽的翻译。
如本文所用的术语“天然存在的”或“未修饰的”当应用于核酸、多肽、细胞或生物时,是指自自然界中发现的核酸、多肽、细胞或生物。例如,可从自然界中的来源分离且尚未在实验室中由人有意修饰的生物(包括病毒)中存在的多肽或多核苷酸序列是天然存在的。
如本文所用的术语“嵌合”当应用于核酸或多肽时是指由衍生自不同来源的结构组成的一个实体。例如,在嵌合多肽(例如嵌合SluCas9蛋白)的上下文中使用“嵌合”的场合,所述嵌合多肽包含衍生自不同多肽的氨基酸序列。嵌合多肽可以包含修饰的或天然存在的多肽序列(例如,来自修饰的或未修饰的SluCas9蛋白的第一氨基酸序列;和除SluCas9蛋白之外的第二氨基酸序列)。类似地,在编码嵌合多肽的多核苷酸的上下文中的“嵌合”包括衍生自不同编码区的核苷酸序列(例如,编码修饰的或未修饰的SluCas9蛋白的第一核苷酸序列;以及编码除SluCas9蛋白以外的多肽的第二核苷酸序列)。
术语“嵌合多肽”是指非天然存在的多肽,例如由通过人干预将两个或更多个在其他情况下分开的氨基序列区段人工组合(即“融合”)制备。包含嵌合氨基酸序列的多肽是嵌合多肽。一些嵌合多肽可以被称为“融合变体”。
如本文所用的,“异源的”是指分别在天然核酸或蛋白中未发现的核苷酸或肽。例如,在嵌合的SluCas9蛋白中,天然存在的细菌SluCas9多肽(或其变体)的RNA-结合结构域可以与异源多肽序列(即,来自除SluCas9以外的蛋白的多肽序列或来自另一生物的多肽序列)融合。异源多肽可以表现出也将由嵌合SluCas9蛋白表现出的活性(例如,酶促活性)(例如,甲基转移酶活性、乙酰转移酶活性、激酶活性、泛素化活性等)。异源核酸可以与天然存在的核酸(或其变体)连接(例如通过遗传工程)以产生编码嵌合多肽的嵌合多核苷酸。作为另一个例子,在融合变体SluCas9位点定向多肽中,可以将变体SluCas9位点定向多肽与异源多肽(即,除SluCas9以外的多肽)融合,所述异源多肽表现出也将由融合变体SluCas9位点定向多肽表现出的活性。异源核酸可以与变体SluCas9位点定向多肽连接(例如通过遗传工程)以产生编码融合变体SluCas9位点定向多肽的多核苷酸。如本文所用的,“异源的”另外是指处于不是其天然细胞的细胞中的核苷酸或多肽。
术语“关联”是指通常在自然界中相互作用或共存的两个生物分子。
如本文所用的,“重组”意指特定的核酸(DNA或RNA)或载体是克隆、限制、聚合酶链反应(PCR)和/或连接步骤的各种组合的产物,从而导致具有与天然系统中发现的内源核酸不同的结构编码或非编码序列的构建体。可以从cDNA片段或从一系列合成的寡核苷酸装配编码多肽的DNA序列,以提供能够从细胞或无细胞转录和翻译系统中含有的重组转录单位表达的合成核酸。包含相关序列的基因组DNA也可以用于重组基因或转录单位的形成。非翻译DNA的序列可以存在于可读框的5'或3',在那里这种序列不与编码区的操作或表达相干扰,并且确实可以起作用以通过各种机制来调节所期望的产物的产生(参见下面的“DNA调节序列”)。另一方面,未被翻译的编码RNA(例如,指导RNA)的DNA序列也可以被认为是重组的。因此,例如术语“重组”核酸是指非天然存在的核酸,例如通过人干预将两个在其他情况下分开的序列区段人工组合制备。经常通过化学合成手段或通过人工操作分离的核酸区段,例如通过遗传工程技术,来达到这种人工结合。通常这样做以用编码相同氨基酸、保守氨基酸或非保守氨基酸的密码子置换密码子。另一方面,执行其以将具有所期望的功能的核酸区段连接在一起以产生所期望的功能的组合。经常通过化学合成手段或通过人工操作分离的核酸区段,例如通过遗传工程技术,来达到这种人工结合。当重组多核苷酸编码多肽时,编码的多肽的序列可以是天然存在的(“野生型”)或可以是天然存在的序列的变体(例如突变体)。因此,术语“重组”多肽不必定是指其序列不天然存在的多肽。相反,“重组”多肽由重组DNA序列编码,但是所述多肽的序列可以是天然存在的(“野生型”)或非天然存在的(例如变体、突变体等)。因此,“重组”多肽是人干预的结果,但可以是天然存在的氨基酸序列。术语“非天然存在的”包括与它们天然存在的对应物明显不同的分子,包括化学修饰的或突变的分子。
“载体”或“表达载体”是复制子,例如质粒、噬菌体、病毒或黏粒,可以在其上附着另一种DNA区段,即,“插入片段”,以便引起附着的区段在细胞中的复制。
“表达盒”包含可操作地连接至启动子的DNA编码序列。“可操作地连接的”是指并列,其中如此描述的组分处于允许它们以其预期方式起作用的关系中。例如,如果启动子影响编码序列的转录或表达,则所述启动子可操作地连接至所述编码序列。术语“重组表达载体”或“DNA构建体”在本文可互换使用,以指包含载体和至少一个插入片段的DNA分子。重组表达载体通常是为了表达和/或繁殖一种或多种插入片段起见或为了构建其他重组核苷酸序列而产生的。一种或多种核酸可以或可以不与启动子序列可操作地连接,并且可以或可以不与DNA调节序列可操作地连接。
当外源DNA例如重组表达载体已经被引入细胞内时,细胞已被这种DNA“基因修饰”或“转化”或“转染”。外源DNA的存在导致永久或瞬时的遗传改变。转化DNA可以或可以不整合(共价连接)到细胞基因组中。
例如,在原核生物、酵母和哺乳动物细胞中,转化DNA可以保持在附加型元件如质粒上。关于真核细胞,稳定转化的细胞是这样一种细胞,其中转化DNA已经变得整合到染色体中,从而使得它被子细胞通过染色体复制遗传。通过真核细胞确立包含含有转化DNA的子细胞群体的细胞系或克隆的能力证明了这种稳定性。“克隆”是通过有丝分裂从单个细胞或共同祖先衍生的细胞群体。“细胞系”是能够在体外稳定生长许多世代的原代细胞的克隆。
合适的遗传修饰方法(也称为“转化”)包括但不限于,例如病毒或噬菌体感染、转染、接合、原生质体融合、脂质转染法、电穿孔、磷酸钙沉淀、聚乙烯亚胺(PEI)介导的转染、DEAE-葡聚糖介导的转染、脂质体介导的转染、基因枪技术、磷酸钙沉淀、直接显微注射、纳米颗粒介导的核酸递送(参见,例如 Panyam等人, Adv Drug Deliv Rev. 2012年9月13日.pp: S0169-409X(12)00283-9.doi: 10.1016/j.addr.2012.09.023)等。
遗传修饰方法的选择通常取决于被转化的细胞的类型和发生转化的环境(例如,体外、先体外后体内或体内)。这些方法的一般讨论可以在Ausubel等人, Short Protocolsin Molecular Biology, 第三版, Wiley & Sons, 1995中找到。
如本文所用的,“宿主细胞”表示体内或体外的真核细胞、原核细胞(例如细菌或古细菌细胞)或来自作为单细胞实体培养的多细胞生物的细胞(例如细胞系),所述真核或原核细胞可以或已经被用作核酸的受体,并包括已经被核酸转化的原始细胞的后代。要理解的是,由于自然、偶然或故意的突变,单个细胞的后代在形态学或基因组或总DNA互补体中不必定与原始亲本完全相同。“重组宿主细胞”(也称为“基因修饰宿主细胞”)是已在其中引入了异源核酸例如表达载体的宿主细胞。例如,细菌宿主细胞是借助于外源核酸(例如质粒或重组表达载体)引入合适的细菌宿主细胞中的基因修饰细菌宿主细胞,而真核宿主细胞是借助于外源核酸引入合适的真核宿主细胞中的基因修饰真核宿主细胞(例如哺乳动物生殖细胞)。
如本文所用的“靶DNA”是包含“靶位点”或“靶序列”的DNA多核苷酸。术语“靶位点”、“靶序列”、“靶原间隔区DNA”或“原间隔区样序列”在本文可互换使用,以指存在于靶DNA中的核酸序列,如果存在足够的用于结合的条件,则指导RNA的DNA-靶向区段将与其结合。例如,靶DNA内的靶位点(或靶序列)5'-GAGCATATC-3'被RNA序列5'-GAUAUGCUC-3'靶向(或由其结合,或与其杂交,或与其互补)。合适的DNA/RNA结合条件包括细胞中通常存在的生理条件。其他合适的DNA/RNA结合条件(例如,无细胞系统中的条件)在本领域中是已知的;参见,例如Sambrook,上文。与指导RNA互补并与其杂交的靶DNA的链被称为“互补链”,并且与“互补链”互补的靶DNA的链(且因此与指导RNA不互补)被称为“非互补链”或“非互补链”。所谓“位点定向修饰多肽”或“RNA-结合位点定向多肽”或“RNA-结合位点定向修饰多肽”或“位点定向多肽”指的是结合RNA并靶向于特定的DNA序列的多肽。如本文所述的位点定向修饰多肽被与其结合的RNA分子靶向特定的DNA序列。RNA分子包含与靶DNA内的靶序列结合、杂交或互补的序列,从而将结合的多肽靶向靶DNA内的特定位置(靶序列)。所谓“切割”指的是DNA分子的共价主链的断裂。切割可通过多种方法起始,包括但不限于磷酸二酯键的酶促或化学水解。单链切割和双链切割两者都是可能的,并且作为两个不同的单链切割事件的结果可发生双链切割。DNA切割可导致产生平端或交错末端。在某些实施方案中,将包含指导RNA和位点定向修饰多肽的复合体用于靶向的双链DNA切割。
“核酸酶”和“内切核酸酶”在本文中可互换使用,以指具有用于多核苷酸切割的内切核酸降解(endonucleolytic)催化活性的酶。
所谓核酸酶的“切割结构域”或“活性结构域”或“核酸酶结构域”指的是核酸酶内具有用于DNA切割的催化活性的多肽序列或结构域。切割结构域可以包含在单个多肽链中,或者切割活性可以由两个(或更多个)多肽的缔合产生。单个核酸酶结构域可以由给定多肽内的不止一个分离的氨基酸序列段组成。
所谓“位点定向多肽”或“RNA-结合位点定向多肽”或“RNA结合位点定向多肽”指的是结合RNA并靶向于特定的DNA序列的多肽。如本文所述的位点定向多肽被与其结合的RNA分子靶向特定的DNA序列。RNA分子包含与靶DNA内的靶序列互补的序列,从而将结合的多肽靶向靶DNA内的特定位置(靶序列)。
“指导序列”或DNA-靶向区段(或“DNA-靶向序列”)包含与在本文中称为“原间隔区样”序列的靶DNA内的特定序列(靶DNA的互补链)互补的核苷酸序列。蛋白结合区段(或“蛋白结合序列”)与位点定向修饰多肽相互作用。当位点定向修饰多肽是SluCas9或SluCas9相关多肽(在下文中有更详细的描述)时,靶DNA的位点特异性切割在由(i)指导RNA和靶DNA之间的碱基配对互补性;和(ii)靶DNA中的短基序(称为原间隔区相邻基序(PAM))两者确定的位置发生。
指导RNA的蛋白结合区段部分地包含两个互补的核苷酸序列段,其彼此杂交以形成双链RNA双链体(dsRNA双链体)。
在一些实施方案中,核酸(例如,指导RNA,包含编码指导RNA的核苷酸序列的核酸;编码位点定向多肽的核酸;等等)包含提供额外的所期望的特征(例如,修饰或调节的稳定性;亚细胞靶向;追踪,例如荧光标记;蛋白或蛋白复合体的结合位点;等)的修饰或序列。非限制性实例包括:5'帽(例如7-甲基鸟苷酸帽(m7G));3'聚腺苷酸化尾(即,3'聚腺苷酸尾);核糖开关序列(例如以允许蛋白和/或蛋白复合体调节的稳定性和/或调节的可接近性);稳定性控制序列;形成dsRNA双链体(即发夹)的序列);将RNA靶向亚细胞位置(例如细胞核、线粒体、叶绿体等)的修饰或序列;提供追踪的修饰或序列(例如直接缀合至荧光分子,缀合至促进荧光检测的部分,允许荧光检测的序列等);提供蛋白的结合位点的修饰或序列(例如作用于DNA的蛋白,包括转录激活因子、转录阻遏蛋白、DNA甲基转移酶、DNA脱甲基酶、组蛋白乙酰转移酶、组蛋白脱乙酰酶等);及其组合。
在一些实施方案中,指导RNA在5'或3'端包含额外的区段,其提供上述特征的任一种。例如,合适的第三区段可包括5'帽(例如7-甲基鸟苷酸帽(m7G));3'聚腺苷酸化尾(即,3'聚腺苷酸尾);核糖开关序列(例如以允许蛋白和蛋白复合体调节的稳定性和/或调节的可接近性);稳定性控制序列;形成dsRNA双链体(即发夹)的序列);将RNA靶向亚细胞位置(例如细胞核、线粒体、叶绿体等)的序列;提供追踪的修饰或序列(例如直接缀合至荧光分子,缀合至促进荧光检测的部分,允许荧光检测的序列等);提供蛋白的结合位点的修饰或序列(例如作用于DNA的蛋白,包括转录激活因子、转录阻遏蛋白、DNA甲基转移酶、DNA脱甲基酶、组蛋白乙酰转移酶、组蛋白脱乙酰酶等);及其组合。
指导RNA和SluCas9多肽形成复合体(即,通过非共价相互作用结合)。指导RNA通过包含与靶DNA的序列互补的核苷酸序列,为复合体提供靶特异性。所述复合体的SluCas9多肽提供位点特异性活性。换句话说,SluCas9多肽借助于其与指导RNA的蛋白结合区段的缔合被指导至靶DNA序列(例如,染色体核酸中的靶序列;染色体外核酸中的靶序列,例如附加型核酸、小环等;线粒体核酸中的靶序列;叶绿体核酸中的靶序列;质粒中的靶序列;等等)。RNA适配体是本领域已知的,并且通常是核糖开关的合成形式。术语“RNA适配体”和“核糖开关”在本文中可互换使用,以包括合成和天然核酸序列两者,其提供它们是其一部分的RNA分子的结构的可诱导的调节(以及因此特定序列的可用性)。RNA适配体通常包含折叠成特定结构(例如发夹)的序列,其特异性结合特定药物(例如小分子)。药物的结合导致RNA折叠中的结构变化,这改变了适配体是其一部分的核酸的特征。作为非限制性实例:(i)具有适配体的激活子(activator)-RNA可能不能与关联靶向子-RNA结合,除非适配体被适当的药物结合;(ii)具有适配体的靶向子-RNA可能不能与关联激活子-RNA结合,除非适配体被适当的药物结合;和(iii)各自包含结合不同药物的不同适配体的靶向子-RNA和激活子-RNA可能不能彼此结合,除非同时存在两种药物。如这些实例所举例说明的,可以对两分子指导RNA进行设计以为可诱导的。
适配体和核糖开关的实例可在例如:Nakamura等人, Genes Cells. 2012年5月;17(5):344-64;Vavalle等人, Future Cardiol. 2012年5月;8(3):371-82;Citartan等人,Biosens Bioelectron. 2012年4月15日;34(1):1-11;和Liberman等人, Wileylnterdiscip Rev RNA. 2012年5月-6月;3(3):369-84中找到;所有这些都整体引入本文作为参考。
本文使用术语“干细胞”以指既具有自我更新能力又具有产生分化的细胞类型的能力的细胞(例如植物干细胞、脊椎动物干细胞)(参见Morrison等人 (1997) Cell 88:287-298)。在细胞个体发育的情况下,形容词“分化的”或“分化”是相对术语。“分化的细胞”是比与其进行比较的细胞已进一步向发育途径下游发展的细胞。因此,多潜能干细胞(如下所述)可以分化为谱系限制的祖先细胞(例如中胚层干细胞),其本身又可以分化为进一步限制的细胞(例如神经元祖先细胞),所述细胞可以分化为终末阶段细胞(即,终末分化的细胞,例如神经元、心肌细胞等),它们在某种组织类型中起特有的作用,并且可能或可能不保留进一步增殖的能力。干细胞可以通过存在特定标记(例如蛋白、RNAs等)和不存在特定标记两者来表征。干细胞还可以通过体外和体内两者的功能测定来鉴定,特别是与干细胞产生多种分化的后代的能力有关的测定。
感兴趣的干细胞包括多潜能干细胞(PSCs)。本文使用术语“多潜能干细胞”或“PSC”以指能够产生生物的所有细胞类型的干细胞。因此,PSC可以产生生物所有胚层的细胞(例如脊椎动物的内胚层、中胚层和外胚层)。多潜能细胞能够形成畸胎瘤并能够影响活生物中的外胚层、中胚层或内胚层组织。植物的多潜能干细胞能够产生植物的所有细胞类型(例如根、茎、叶等的细胞)。
动物的PSCs可以以多种不同方式获得。例如,胚胎干细胞(ESCs)衍生自胚胎的内细胞团(Thomson等人, Science. 1998年11月6日;282(5391):1145-7),而诱导的多潜能干细胞(iPSCs)衍生自体细胞(Takahashi等人, Cell. 2007年11月30日;131(5):861-72;Takahashi等人, Nat Protoc. 2007;2(12):3081-9;Yu等人, Science. 2007年12月21日;318(5858):1917-20. Epub 2007年11月20日)。
因为术语PSC是指多潜能干细胞,而不管它们的起源,所以术语PSC包括术语ESC和iPSC,以及术语胚胎生殖干细胞(EGSC),其是PSC的另一个实例。PSCs可以是确立的细胞系的形式,它们可以直接从原代胚胎组织获得,或它们可以从体细胞获得。PSCs可以是本文所述方法的靶细胞。
所谓“胚胎干细胞”(ESC)指的是从胚胎分离的PSC,通常从胚泡的内细胞团分离。ESC在NIH Human Embryonic Stem Cell Registry中列举,例如hESBGN-01、hESBGN-02、hESBGN-03、hESBGN-04(BresaGen, Inc.);HES-1、HES-2、HES-3、HES-4、HES-5、HES-6(ESCell International);Miz-hES1(MizMedi Hospital-Seoul National University);HSF-1、HSF-6(University of California at San Francisco);和H1、H7、H9、H13、H14(Wisconsin Alumni Research Foundation(WiCell Research Institute))。感兴趣的干细胞还包括来自其他灵长类动物的胚胎干细胞,例如猕猴干细胞和绒猴干细胞。干细胞可获得自任何哺乳动物物种,例如人,马科动物,牛科动物,猪,犬科动物,猫科动物,啮齿类动物,例如小鼠,大鼠,鼠,灵长类动物等(Thomson等人 (1998) Science 282:1145;Thomson等人 (1995) Proc. Natl. Acad. Sci. USA 92:7844;Thomson等人 (1996) Bioi.Reprod. 55:254;Shamblott等人, Proc. Natl. Acad. Sci. USA 95:13726, 1998)。在培养中,ESCs通常作为具有大的核质比例、明确的边缘和突出的核仁的扁平集落生长。此外,ESCs表达SSEA-3、SSEA-4、TRA-1-60、TRA-1-81和碱性磷酸酶,但不表达SSEA-1。产生和表征ESCs的方法的例子可以在例如美国专利No. 7,029,913、美国专利No. 5,843,780和美国专利No. 6,200,806中找到,其公开内容引入本文作为参考。在WO 99/20741、WO 01/51616和WO 03/020920中描述了用于以未分化的形式增殖hESCs的方法。所谓“胚胎生殖干细胞”(EGSC)或“胚胎生殖干细胞”或“EG细胞”指的是PSC,其衍生自生殖细胞和/或生殖细胞祖先,例如原始生殖细胞,即,将变为精子和卵的那些。胚胎生殖干细胞(EG细胞)被认为具有与如上所述的胚胎干细胞相似的性质。产生和表征EG细胞的方法的例子可以在,例如,美国专利No. 7,153,684;Matsui, Y.等人, (1992) Cell 70:841;Shamblott, M.等人 (2001)Proc. Natl. Acad. Sci. USA 98: 113;Shamblott, M.等人 (1998) Proc. Natl. Acad.Sci. USA, 95:13726;和Koshimizu, U.等人 (1996) Development, 122:1235中找到,其公开内容引入本文作为参考。
所谓“诱导的多潜能干细胞”或“iPSC”指的是从非PSC的细胞(即,从相对于PSC分化的细胞)衍生的PSC。iPSCs可以衍生自多种不同的细胞类型,包括终末分化的细胞。iPSCs具有ES细胞样形态学,作为具有大的核质比例、明确的边缘和突出的核仁的扁平集落生长。此外,iPSCs表达一种或多种本领域普通技术人员已知的关键多潜能性标记,包括但不限于碱性磷酸酶、SSEA3、SSEA4、Sox2、Oct3/4、Nanog、TRA160、TRA181、TDGF 1、Dnmt3b、Fox03、GDF3、Cyp26al、TERT和zfp42。
产生和表征iPSCs的方法的例子可以在,例如,美国专利公开Nos.US20090047263、US20090068742、US20090191159、US20090227032、US20090246875和S20090304646中找到,其公开内容引入本文作为参考。通常,为了产生iPSCs,向体细胞提供本领域已知的重编程序因子(例如Oct4、SOX2、KLF4、MYC、Nanog、Lin28等)以将体细胞重编程序以变为多潜能干细胞。
所谓“体细胞”指的是生物中在没有实验操作的情况下通常不在生物中产生所有类型的细胞的任何细胞。换句话说,体细胞是已经充分分化的细胞,它们将不自然地产生身体所有三个胚层(即,外胚层、中胚层和内胚层)的细胞。例如,体细胞将包括神经元和神经祖先,后者可能能够自然产生中枢神经系统的所有或一些细胞类型,但不能产生中胚层或内胚层谱系的细胞。
所谓“有丝分裂细胞”指的是经历有丝分裂的细胞。有丝分裂是真核细胞将其细胞核中的染色体分裂成两个独立的细胞核中的两个相同组的过程。其后面通常紧接着胞质分裂,其将细胞核、细胞质、细胞器和细胞膜分裂为两个含有大致相等份额的这些细胞组分的细胞。
所谓“有丝分裂后细胞”指的是已经从有丝分裂中退出的细胞,即,它是“休眠的”,即它不再经历分裂。这个休眠状态可以是暂时的,即,可逆的,或其可以是永久的。
所谓“减数分裂细胞”指的是经历减数分裂的细胞。减数分裂是细胞为了产生配子或孢子起见分裂其核物质的过程。与有丝分裂不同,在减数分裂中,染色体经历重组步骤,其使染色体之间的遗传物质改组。此外,与从有丝分裂产生的两个(遗传上相同的)二倍体细胞相比,减数分裂的结果是四个(遗传上独特的)单倍体细胞。
所谓“重组”指的是在两个多核苷酸之间交换遗传信息的过程。如本文所用的,“同源性指导的修复(HDR)”是指例如在细胞中双链断裂修复期间发生的特殊化形式的DNA修复。这个过程需要核苷酸序列同源性,使用“供体”分子为“靶”分子(即,经历双链断裂的分子)的修复提供模板,并导致遗传信息从供体转移至靶。如果供体多核苷酸不同于靶分子,并且供体多核苷酸的部分或全部序列被并入到靶DNA中,则同源性指导的修复可能导致靶分子序列的改变(例如插入、缺失、突变)。在一些实施方案中,供体多核苷酸、供体多核苷酸的一部分、供体多核苷酸的拷贝或供体多核苷酸的拷贝的一部分整合到靶DNA中。
所谓“非同源末端连接(NHEJ)”指的是在不需要同源模板的情况下通过将断裂末端彼此直接连接来修复DNA中的双链断裂(与需要同源序列以指导修复的同源性指导的修复形成对照)。NHEJ经常导致双链断裂位点附近的核苷酸序列丧失(缺失)。
本文使用术语“治疗(treatment)”、“治疗(treating)”等以通常指获得所期望的药理和/或生理效果。所述效果就完全或部分预防疾病或其症状而论,可以是预防性的,和/或就对于疾病和/或可归因于所述疾病的副作用的部分或完全治愈而论,可以是治疗性的。如本文所用的,“治疗”包括哺乳动物中疾病或症状的任何治疗,并且包括:(a)防止所述疾病或症状在可能倾向于获得所述疾病或症状但尚未被诊断为具有所述疾病或症状的主体中发生;(b)抑制疾病或症状,即,阻止其发展;或(c)减轻疾病,即,导致疾病消退。可以在疾病或损伤发作之前、期间或之后施用治疗剂。特别重要的事是正在进行的疾病的治疗,其中所述治疗稳定或减轻了患者的不期望的临床症状。期望在受影响的组织中完全丧失功能之前进行这种治疗。将期望在疾病的有症状阶段期间以及在一些情况中在疾病的有症状阶段之后施用治疗。
术语“个体”、“主体”、“宿主”和“患者”在本文可互换使用,并且是指期望对其的诊断、治疗或疗法的任何哺乳动物主体,特别是人。
分子和细胞生物化学中的一般方法可以在像下述那样的这种标准教科书中找到:Molecular Cloning: A Laboratory Manual, 第三版 (Sambrook等人, HarboorLaboratory Press 2001);Short Protocols in Molecular Biology, 第四版 (Ausubel等人编., John Wiley & Sons 1999);Protein Methods (Bollag等人, John Wiley &Sons 1996);Nonviral Vectors for Gene Therapy (Wagner等人编, Academic Press1999);Viral Vectors (Kaplift & Loewy编, Academic Press 1995);ImmunologyMethods Manual (1. Lefkovits编, Academic Press 1997);和Cell and TissueCulture: Laboratory Procedures in Biotechnology (Doyle & Griffiths, JohnWiley & Sons 1998),其公开内容引入本文作为参考。
在提供数值范围的场合,要理解的是,在所述范围的上限和下限之间除非上下文另有明确规定否则以下限单位的十分之一为间隔的(to the tenth of the unit of thelower limit)每个中间值和所述范围中的任何其他所述或中间值都包括在本发明内。这些较小范围的上限和下限可以独立地包括在较小范围中,并且也包括在本发明内,可在所述范围内有任何明确排除的界限。在所述范围包括一个或两个界限的场合,排除那些所包括的界限中的任一个或两个的范围也包括在本发明中。
短语“基本上由……组成”在本文中是指排除不是系统的一种或多种指定的活性组分或不是分子的一种或多种指定的活性部分的一切。
本文以之前带有术语“约”的数值提供了某些范围。术语“约”在本文中用于为放在其之后的精确数字以及与放在所述术语之后的数字接近或近似的数字提供字面上的支持。在确定数字是否接近或近似于具体列举的数字时,接近或近似的未列举的数字可以是这样的数字,在给出所述数字的上下文中,所述数字提供了具体列举的数字的基本等值物。
要理解的是,为清楚而在单独的实施方案的上下文中描述的本发明的某些特征也可以在单个实施方案中组合提供。相反,为简洁而在单个实施方案的上下文中描述的本发明的各种特征也可以单独地或以任何合适的子组合(sub-combination)来提供。与本发明有关系的实施方案的所有组合都被本发明特别地包括,并且在本文中公开,正如每一个组合都被个别地并且明确地公开一样。此外,各种实施方案及其要素的所有子组合也都被本发明特别地包括,并且在本文中公开,正如每一个这种子组合都被在本文个别地并且明确地公开一样。
基因组编辑
基因组编辑通常是指修饰基因组的核苷酸序列的过程,例如以精确或预定的方式。本文描述的基因组编辑方法的实例包括使用位点定向核酸酶以在基因组中精确的靶位置切割DNA,从而在基因组内特定位置产生双链或单链DNA断裂的方法。这种断裂可以并经常通过自然的、内源性细胞过程例如同源性指导的修复(HDR)和非同源末端连接(NHEJ)进行修复,如最近在Cox等人, Nature Medicine 21(2), 121-31 (2015)中所综述的。NHEJ有时在丧失或添加核苷酸序列的情况下直接连接由双链断裂产生的DNA末端,这可能破坏或增强基因表达。HDR利用同源序列或供体序列作为模板,用于在断裂点处插入确定的DNA序列。同源序列可以在内源基因组中,例如姐妹染色单体。另一方面,供体可以是外源核酸,例如质粒、单链寡核苷酸、双链体寡核苷酸或病毒,其具有与核酸酶切割的基因座具有高同源性的区域,但其也可以含有额外的序列或序列变化,包括可以并入切割的靶基因座的缺失。第三种修复机制是微同源性介导的末端连接(MMEJ),也称为“备择NHEJ,其中遗传结果与NHEJ相似,这是因为在切割位点可发生小的缺失和插入。MMEJ利用侧接DNA断裂位点的几个碱基对的同源序列来驱动更有利的DNA末端连接修复结果,且最近的报道进一步阐明了这个过程的分子机制;参见,例如Cho和Greenberg, Nature 518, 174-76 (2015);Kent等人,Nature Structural and Molecular Biology, Adv. Online doi:10.1038/nsmb.2961(2015);Mateos-Gomez等人, Nature 518,254-57 (2015);Ceccaldi等人, Nature 528,258-62 (2015)。在一些情况中,有可能基于对在DNA断裂位点的潜在的微同源性的分析来预测可能的修复结果。
这些基因组编辑机制的每一种均可用于产生所期望的基因组改变。基因组编辑过程的第一步是通常在尽可能接近预期突变位点的靶基因座中产生一个或两个DNA断裂。如本文所述和所举例说明的,这可以通过使用位点定向多肽来实现。
位点定向多肽可以在核酸(例如基因组DNA)中引入双链断裂或单链断裂。双链断裂可刺激细胞的内源性DNA-修复途径(例如同源性依赖性修复(HDR)和非同源末端连接(NHEJ)或备择的非同源末端连接(A-NHEJ)或微同源性介导的末端连接(MMEJ))。NHEJ可在不需要同源模板的情况下修复切割的靶核酸。这有时可导致靶核酸在切割位点的小缺失或插入(插入/缺失),并可导致基因表达的破坏或改变。当同源修复模板或供体可获得时,可发生HDR。同源供体模板包含与侧接靶核酸切割位点的序列同源的序列。姐妹染色单体通常被细胞用作修复模板。然而,为了基因组编辑起见,修复模板经常作为外源核酸提供,例如质粒、双链体寡核苷酸、单链寡核苷酸或病毒核酸。在外源供体模板的情况下,通常在同源性的侧翼区之间引入额外的核酸序列(例如转基因)或修饰(例如单碱基改变或缺失),从而额外的或改变的核酸序列也变得并入靶基因座中。MMEJ导致与NHEJ相似的遗传结果,这是因为在切割位点可发生小的缺失和插入。MMEJ利用侧接切割位点的几个碱基对的同源序列来驱动有利的末端连接DNA修复结果。在一些情况中,有可能基于对核酸酶靶区域中潜在的微同源性的分析来预测可能的修复结果。因此,在一些情况中,同源重组用于将外源多核苷酸序列插入靶核酸切割位点。外源多核苷酸序列在本文中称为供体多核苷酸。在一些实施方案中,将供体多核苷酸、供体多核苷酸的一部分、供体多核苷酸的拷贝或供体多核苷酸的拷贝的一部分插入靶核酸切割位点。在一些实施方案中,供体多核苷酸是外源多核苷酸序列,即,在靶核酸切割位点不天然存在的序列。
归因于NHEJ和/或HDR的靶DNA的修饰可导致,例如,突变、缺失、改变、整合、基因矫正、基因置换、基因标记、转基因插入、核苷酸缺失、基因破坏、易位和/或基因突变。删除基因组DNA和将非天然核酸整合到基因组DNA中的方法是基因组编辑的例子。
实施例
实施例1:PAM鉴定
缺失测定:为了确定SluCas9的PAM序列,进行了缺失实验。制备了感受态细胞(带有pMC7125(SEQ ID NO:19)/pMC7204(SEQ ID NO:20)的BL21DE3 Star。作为对照,使用感受态细胞(带有pMC7125(SEQ ID NO:19)的BL21DE3 Star。将pML2070(N7-PAM文库,根据SEQ IDNO:34,参见图1A)转化到pMC7125/pMC7204(SEQ ID NO:20)或pMC7125感受态细胞中(每50µl细胞等分部分100 ng pML2070;使用3等分部分),并将细胞重悬浮于SOC(每次转化1ml)中,并在Eppendorf Thermomixer中于37℃以1000 rpm摇动1小时。将细胞悬浮液平板接种在LB-琼脂上(Cm/Kan/Amp/0.2 mM IPTG或无卡那霉素用于对照反应)。每个样品使用总共5x平板,以确保文库的16384 cfu复杂度的多重覆盖度(multiple coverage)(每个平板平板接种250 µl拯救的SOC。将平板于37℃温育过夜。收获细胞并提取质粒。通过PCR扩增包括VEGFA-靶序列和PAM基序的271 bp片段,并按照制造商的规程(Illumina Miseq V2)将其用于NGS衔接子连接。在Illumina Miseq序列分析仪上分析了NGS文库,并比较了缺失的和非缺失的对照的序列,以评估成功切割的序列。另一方面,通过在体外切割N7-PAM文库(pML2070)并通过NGS分析切割的片段来评估PAM基序。结果显示在图1B中,其中特定碱基的字符大小指的是这种位置的活性。
实施例2:PAM表征
为了充分表征PAM基序并评估单核苷酸取代的影响(尤其是位置N1的A,如来自体外切割实验的PAM基序所提示的),由SluCas9切割了荧光标记的寡核苷酸(ODNs)(图2A,上图)并测定了切割动力学(图2A,下图)。除此以外,体外切割了带有不同PAM基序的大约1000 bpPCR产物。规程荧光偏振测定:
在10 mM Tris(pH = 7.8)50 mM NaCL中作为10 µM溶液(来自100 µM原液)制备寡核苷酸双链体,并在循环变温器中于95℃退火5分钟,且然后缓慢冷却(每分钟6℃)。接着将原液在10 mM Tris(pH = 7.8)50 mM NaCL +0.05%普朗尼克(pluronic)中稀释。将20 nM寡核苷酸(20 µL)固定在链霉抗生物素蛋白包被的平板上,在5分钟后洗涤两次,且然后与20 µL样品一起温育60分钟的动力学(激发波长:635 nm;发射波长:670 nm)。在切割之前,形成反应RNP。向817.6 µl的1xPBS MgCl2中,添加4.68 µl SluCas9(71 µM)和7.69 µl sgRNAVEGFA(64.8 µM),并于37℃温育10分钟。向每个孔中添加20 µl RNP,并于37℃测量偏振达60分钟。
使用的sgRNAVEGFA序列(SEQ ID NO:8):
Figure 474940DEST_PATH_IMAGE004
寡核苷酸底物:
1) 在CGGGCGC-PAM的情况下
Figure 532895DEST_PATH_IMAGE005
2) 在AGGGCGC-PAM的情况下
Figure 670615DEST_PATH_IMAGE006
参考文献:Methods Enzymol. 2014;546:1-20。
规程体外PCR切割测定:
使用引物(fwd:tctgatttataatgtgaaaattcgcggtgtgaact,SEQ ID NO:26;rev:agcgccacgcttcccgaagggagaaaggcggacagg,SEQ.SEQ ID NO:27)从基于pCas595(或PAM变体)的质粒扩增用于体外切割的PCR产物(VEGFA-PAM变体)。使用Qiagen PCR纯化试剂盒™纯化PCR产物(按照制造商的规程)。在切割反应之前,通过添加SluCas9(10 µM终浓度),sgRNA(15 µM终浓度,1.3 µl 10x PBS + 5 mM MgCl2和6.39 µl水(13 µl终体积)形成RNPs,并于37℃温育10分钟。接着,于37℃,用10 µl反应体积中的1x PBS 5 mM MgCl2中的2 µl RNP溶液消化400 ng PCR产物30分钟(后面是由95℃热灭活15分钟)。切割反应在琼脂糖凝胶上进行分析,并在紫外线工作台(UV-table)下通过溴化乙锭显示。
使用的sgRNAVEGFA序列(SEQ ID NO:8):
Figure 398399DEST_PATH_IMAGE007
结果在图2B底部图片中显示。其中,显示了存在RNP溶液(“+”)或不存在RNP溶液(“-”)的情况下的不同PAM序列。显示琼脂糖凝胶分离的图片右侧的箭标指示通过相应反应获得的产物。结果提示“NNGG”的PAM序列。
实施例3:通过活-死测定证实NNGG PAM基序
规程活/死测定:
液体培养物(图3B):带有毒性报道质粒(pCas634,SEQ ID NO:25,具有带有VEGFA靶位点和NNGG PAM的阿拉伯糖诱导型ccdB基因)和带有靶向VEGFA的sgRNA的转录单位的质粒(pCas606,SEQ ID NO:21)的BL21DE3 origami细胞用编码在IPTG-诱导型Trc启动子下的SluCas9的质粒(pCas81,SEQ ID NO:24)转化。转化后,将细胞悬浮液用1 ml SOC拯救,并于37℃在1000 rpm摇动的情况下温育(Eppendorf Thermomix)。将200 µl用于接种LB培养基(补加了卡那霉素、氯霉素和氨苄青霉素),并将液体培养物在190 rpm摇动的情况下于37℃温育过夜。将200 µl这种过夜培养物用于接种5 ml补加了卡那霉素和氨苄青霉素且具有/不具有0.5%L-阿拉伯糖,具有/不具有0.05 mM IPTG的LB培养基。在190 rpm摇动的情况于37℃温育过夜(18小时)后,测定OD600(图3B)。
在平板上(图3A):带有毒性报道质粒(pCas634,SEQ ID NO:25,带有VEGFA靶位点和“NNGG” PAM的阿拉伯糖诱导型ccdB基因)和带有靶向VEGFA的sgRNA的转录单位的质粒(pCas606,SEQ ID NO:21)的BL21DE3 origami细胞用编码在IPTG-诱导型Trc启动子下的SluCas9的质粒(pCas81,SEQ ID NO:24)转化。转化后,将细胞悬浮液用1 ml SOC培养基拯救,并于37℃在1000 rpm摇动的情况下温育(Eppendorf Thermomix)。将200 µl平板接种在补加了卡那霉素、氨苄青霉素、0.05 mM IPTG和0.5%L-阿拉伯糖的LB-琼脂平板中。于37℃温育18小时后,对集落进行计数。
参考文献:Benjamin L. Oakes, Dana C. Nadler, David F. Savage, ProteinEngineering of Cas9 for Enhanced Function, Methods in Enzymology, 第546卷,2014, 第491-511页, ISSN 0076-6879。
实施例4:哺乳动物细胞中的活性
为了测定哺乳动物细胞中SluCas9的活性,使用下述测定。
用核糖核蛋白复合体(RNP)处理表达BFP的HEK293T细胞,所述核糖核蛋白复合体用靶向如所述的BFP基因组序列反向链的1 µg Slu Cas9蛋白和1 µg单一指导RNA(sgRNA)装配(蛋白:指导摩尔比为1:2至1:3)。使用了两种不同的BFP DNA-靶向区段(每种20个核苷酸),BFP20nt_1(SEQ ID NO:15),BFP20nt_2(SEQ ID NO:16)。参见图4B。还使用了第二指导的延长的22nt形式,BFP22nt_2(SEQ ID NO:17)。如所述的进行转染,并如之前所述(Glaser等人,2016),在转染后7天对于BFP破坏的丧失通过FACS对细胞进行分析。
结果在图4C中显示。
实施例5:使用对于HBB基因的指导的ddPCR和T7E1测定
如下所述,用RNPs处理HEK293细胞。使用了靶向人基因HBB(ENSENBL基因id:ENSG00000244734)的指导RNA(HBB指导20nt_1序列:ggtgaacgtggatgaagttg(SEQ ID NO:18),参见图5A)。进行了对于不同Cas9蛋白量的滴定,从而将蛋白与指导的摩尔比保持在1:2至1:3之间。转染2天后收获细胞,收集gDNA,并通过ddPCR(液滴数字PCR(droplet digitalPCR))检测编辑。结果显示在图5B中。由仅在有插入/缺失的情况下才切割DNA的T7E1内切核酸酶测定也证实了DNA /分子水平的编辑。结果显示在图5C中。
使用以下引物、探针和循环变温器分布,根据制造商的说明书(Bio-Rad)进行液滴数字PCR。
组分 VEGFA HBB (R01) 1X最终 20X 测定 (25 ul)
F引物 (100 uM)
Figure 494007DEST_PATH_IMAGE008
SPRJ1688 SPRJ1720 900 nM 4.5
R引物 (100 uM)
Figure 965440DEST_PATH_IMAGE008
SPRJ1689 SPRJ1721 900 nM 4.5
NIP_FAM探针 (100 uM)
Figure 82300DEST_PATH_IMAGE008
SPRJ1695 SPRJ1725 250 nM 1.25
NSP_HEX探针 (100 uM)
Figure 246565DEST_PATH_IMAGE008
SPRJ1699 SPRJ1728 250 nM 1.25
HPLC水 13.5
NHEJ反应配置
组分 1孔 25X
探针的ddPCR Supermix (无dUTP) 10 ul 250 ul
20X测定配方 1 ul 25 ul
样品DNA (50 ng) 1 ul ----
HPLC水 8 ul 200 ul
循环变温器分布
Figure 957032DEST_PATH_IMAGE009
PCR中使用的寡核苷酸引物:
Figure 841943DEST_PATH_IMAGE010
实施例6:确定用于最高编辑的最佳Slu sgRNA长度
通过体外转录(IVT)产生了一系列长度从13-25nt变化的不同的指导。参见图6A(左图)。所述指导含有用于最佳IVT的如T7聚合酶所需的在5'端的GG。如前所述进行BFP破坏。结果在图6中显示。
实施例7:使用质粒在哺乳动物细胞中的活性
a)BFP破坏:
用靶向如所述的BFP基因组序列的反向链的包含SluCas9(SEQ ID NO:3)、sgRNA BFP-靶向指导RNA(SEQ ID NO:15)和SluCas9 tracr RNA(SEQ ID NO:5)的质粒转染带有在AAVS1基因座中的编码BFP的基因的HEK293T细胞。使用Lipofectamine 3000(ThermoFischer Scientific, Cat no. L3000015),如供应商所述,进行质粒的转染。转染后7天进行BFP信号破坏的流式细胞术分析。通过用1X PBS洗涤、胰蛋白酶消化并重悬浮于200 µlFACS缓冲液(补加了2%FCS的1X PBS)中来制备细胞。使用BD FACS Canto II中的V450滤波器组测定了来自10,000个细胞的BFP信号。与Cas9蛋白质的功能一致,这可能的原因是Cas9-辅助的DNA切割继之以在BFP可读框(ORF)处的插入/缺失以及由此产生的BFP ORF的破坏。
结果显示在下表中:
BFP破坏的百分比 标准差
阴性对照 4.9 0.5
SluCas9质粒 44.7 2.2
b. ddPCR:
用靶向如所述的VEGFA基因组序列的反向链的表达SluCas9(SEQ ID NO:3)和sgRNA(VEGFA靶向指导RNA(SEQ ID NO:8)和SluCas9 tracr RNA(SEQ ID NO:15)的质粒转染HEK293T细胞。使用Lipofectamine 3000(Thermo Fischer Scientific, Cat no.L3000015),如供应商所述,进行质粒的转染。使用上述引物、探针和循环变温器分布,根据制造商的说明书进行液滴数字PCR。
结果显示在下表中:
通过ddPCR的百分比编辑 标准差
阴性对照 0 0
Slu Cas9质粒 66.5 0.8
实施例8:SluCas9密码子优化的表征
使用BFP破坏测定,将来自SEQ ID NO:3的编码SluCas9的多核苷酸序列与这个序列的两个进一步密码子优化的变体(SEQ ID NOs:44和45)进行比较。报道细胞系组成型地表达符合读框地插入β-微管蛋白基因中的BFP,并在BFP-编码序列的上游具有SluCas9的靶位点。在SluCas9切割位点产生的双链断裂可导致插入/缺失介导的移码,从而使BFP表达失活。
将报道细胞系用(1)携带由CBh启动子驱动的SluCas9-编码多核苷酸序列之一并编码两种不同的BFP-靶向gRNAs之一(T2或T3)的质粒,和(2)编码DsRed2的质粒共转染。SluCas9-编码序列通过编码自切割肽T2A的序列与GFP-编码序列连接,从而允许SluCas9和GFP从单个mRNA进行翻译。DsRed2表达充当转染标记。
转染后两天,通过流式细胞术分析了GFP和RFP(DsRed2)表达(图7A),且通过Wes™(ProteinSimple)分析了SluCas9表达(图7B),而β-肌动蛋白表达作为内部对照。转染后5天,通过流式细胞术测量BFP-细胞(归因于移码突变)(图7C)。
以上实施例中使用的进一步的规程:
RNP装配规程
纯化后,将Cas9蛋白贮藏于-80C。IVT(体外转录)指导贮藏于-80C。一旦解冻(在冰上),IVt指导就贮藏于-20C。将Cas9蛋白(用于以24孔平板形式转染)与内部IVT转录的指导以蛋白:指导的1:2-1:3摩尔比进行温育。将Cas9和指导与来自NEB(10X)的1X Cas9反应缓冲液于5-10 µl的终体积(具有无核酸酶的水)温育。于室温(RT)进行温育达10-15分钟。
使用CRISPR MAX试剂对RNPs进行脂质转染
(Thermo Scientific, Cat no. CMAX00015)(在24孔平板中)
将80K-120K HEK293或HEK293T细胞提前一天平板接种,以在转染当天达到约70%的汇合,或进行反向转染(reverse transfected)。在预先平板接种(pre-plating)的情况下,在转染当天更换培养基,且每孔添加450 µl新鲜HEK培养基。
管1:将25 µl Opti-MEM-I试剂(Thermo Scientific, cat no. 31985070)与1 µl的PLUS试剂混合,并于室温温育直到准备好RNPs为止。装配的RNPs +管1(具有PLUS试剂)于室温(RT)温育5分钟。
管2:将25 µl Opti-MEM-I试剂与1.5 µl的Lipofectamine CRISPR-MAX试剂混合,并于室温温育,直到准备好RNPs为止。
将管1和2混合并于室温温育15分钟。将约50 µl的总混合物慢慢地加入细胞中。转染后一天,更换每个孔的培养基和1ml新鲜的HEK293培养基。
ddPCR测定规程:
转染后2-4天收获细胞,并用GenElute™哺乳动物基因组DNA小量制备试剂盒规程(Sigma, Cat no. G1N350)提取gDNA。使用引物(fwd:catggtgcatctgactcctg(SEQ ID NO:28),rev;ggtagaccaccagcagccta(SEQ ID NO:29)和荧光标记的探针(NHEJ不敏感探针(Insensitive Probe),FAM标记的aggagaagtctgccgttactgccct(SEQ ID NO:30),NHEJ敏感探针,HEK标记的探针tgaagttggtggtgaggccct(SEQ ID NO:31),如下所述进行ddPCR。如以前所述进行定量(Mock等人,2016)。
ddPCR循环变温器分布:
Figure 219835DEST_PATH_IMAGE011
T7内切核酸酶测定:
对于使用T7E测定检测Slu Cas9基因组编辑活性,转染后2-4天收获细胞,并用GenElute™哺乳动物基因组DNA小量制备试剂盒规程(Sigma, Cat no. G1N350提取gDNA,用引物(fwd:gagacgcaggaagagatcca,SEQ ID NO:32;rev;ttagggttgcccataacagc,SEQ IDNO:33)在HBB基因座上进行PCR,从而产生778bps的产物。在补加了NEB缓冲液2的9 µl反应中,使用以下程序,用400ng PCR产物进行异源双链体形成,95C达5-10分钟,95C-> 85C斜降(Ramp down)1C/秒,85C-> 25C斜降0.1C /秒,冷却至4C-保持。双链体形成后,每个反应添加1 µl的NEB T7E1核酸酶(NEB, cat no. M0302S)至10 µl的终体积,并于37C温育30分钟,加样到2%琼脂糖凝胶上并成像。切割的产物为539和238bps。
BFP破坏的FACS分析:
1. 转染后7天,将细胞用1X PBS洗涤,胰蛋白酶消化并重悬浮于200 µL PBS +(2%FCS)中。使用FITC和V450滤波器使用BD FACS Conto(每孔10,000个事件)分析细胞,同时仅对单体(singlets)进行门控。
参考文献:
2. Glaser, A., McColl, B., 和Vadolas, J. (2016). GFP to BFP Conversion: AVersatile Assay for the Quantification of CRISPR/Cas9-mediated GenomeEditing. Molecular Therapy Nucleic Acids 5, e334。
3. Mock, U., Hauber, I., 和Fehse, B. (2016). Digital PCR to assessgene-editing frequencies (GEF-dPCR) mediated by designer nucleases. NatProtocols 11, 598-615。
序列表
Figure 289422DEST_PATH_IMAGE012
Figure 752764DEST_PATH_IMAGE013
Figure 425054DEST_PATH_IMAGE014
Figure 657452DEST_PATH_IMAGE015
Figure 242148DEST_PATH_IMAGE016
Figure 927208DEST_PATH_IMAGE017
Figure 668767DEST_PATH_IMAGE018
Figure 755672DEST_PATH_IMAGE019
Figure 432641DEST_PATH_IMAGE020
Figure 604997DEST_PATH_IMAGE021
Figure 369821DEST_PATH_IMAGE022
Figure 576812DEST_PATH_IMAGE023
Figure 283737DEST_PATH_IMAGE024
Figure 943388DEST_PATH_IMAGE025
Figure 902117DEST_PATH_IMAGE026
Figure 698034DEST_PATH_IMAGE027
Figure 317804DEST_PATH_IMAGE028
Figure 464752DEST_PATH_IMAGE029
序列表
<110> CASEBIA THERAPEUTICS LIMITED LIABILITY PARTNERSHIP
<120> 新的RNA-可编程的内切核酸酶系统及其在基因组编辑和其他应用中的用途
<130> 052984-518001WO
<150> EP17207294.4
<151> 2017-12-14
<160> 45
<170> BiSSAP 1.3.6
<210> 1
<211> 3165
<212> DNA
<213> 路邓葡萄球菌(Staphylococcus lugdunensis)
<400> 1
atgaatcaaa aatttatttt aggtttagat attggtatta catctgttgg atatggtctc 60
atagattatg aaactaaaaa tattatagac gcaggtgtac gtttgtttcc tgaggctaat 120
gtagaaaata acgagggccg tcgaagtaaa agaggttctc gaagacttaa gagaagaagg 180
atacatagat tagaaagagt gaaaaaatta ttagaagact ataatttatt agatcaatca 240
caaattcctc agtctactaa tccttatgca attcgagtta aggggttaag tgaagcttta 300
agtaaagatg aattagtaat tgctttgctc catatagcta aaagaagagg tattcataaa 360
attgatgtga ttgattcaaa tgatgatgtt ggtaatgagc tatcgactaa agagcagctg 420
aataaaaata gtaaattgtt aaaagataag tttgtctgtc aaatacagct agaaagaatg 480
aatgaaggtc aagttagagg agaaaaaaat agatttaaaa ctgcagacat tataaaagaa 540
attattcagc tattgaatgt tcaaaaaaac tttcatcaat tagatgaaaa tttcataaat 600
aaatatatag aattagttga gatgcgtaga gagtattttg agggtcctgg taaagggagt 660
ccatatggat gggaaggaga ccctaaggca tggtatgaaa ccttgatggg acattgtact 720
tattttccag atgaattaag aagcgttaaa tatgcttatt ctgcggattt atttaatgca 780
ttaaatgatt taaataattt agtaattcaa agagatggat tatcaaaatt agaatatcat 840
gaaaagtatc acattattga aaatgtattt aaacagaaaa agaaaccgac tttgaaacaa 900
attgcaaatg aaatcaatgt aaatccagaa gacattaaag gatatagaat cactaaaagt 960
ggtaaaccac aatttactga gtttaaactt tatcatgatt taaaaagtgt attatttgat 1020
caaagcattc tagaaaatga agatgtatta gaccaaattg cagaaatttt aactatatat 1080
caagataaag atagtattaa aagtaaacta acagaattag atattttatt gaatgaagaa 1140
gacaaggaaa atattgctca acttactggt tatacaggta cacatagact ttctttaaaa 1200
tgtattcgtc ttgtactgga agagcaatgg tattcttcta gaaatcaaat ggaaatattt 1260
actcatttaa atatcaaacc aaagaaaatt aatttaacag cagccaataa aatacctaaa 1320
gctatgattg acgaatttat attatcccca gtagtgaaaa gaacctttgg acaggcaatt 1380
aatcttataa ataagattat tgaaaaatac ggcgttccag aagatataat tatcgaatta 1440
gcacgagaaa ataatagtaa agataaacaa aaatttatta atgaaatgca aaagaaaaat 1500
gaaaatacac gtaaacggat taatgaaata atagggaagt atggaaatca aaatgctaaa 1560
agattagttg aaaaaattag attacatgat gaacaagaag gtaaatgttt atactcatta 1620
gaatcaatac cacttgagga cttattaaat aatccgaatc attatgaagt agaccatatt 1680
ataccaagat ctgtttcatt tgataattca tatcataaca aagtattagt aaaacaaagt 1740
gaaaatagta aaaaaagcaa tctaacgcct tatcaatatt ttaactctgg aaaatcaaaa 1800
ctttcctata atcaatttaa acaacatatt cttaatttaa gtaaatcaca agatagaatt 1860
tcaaagaaaa agaaagaata cttattagaa gaacgagata ttaataagtt tgaagtacaa 1920
aaagaattta ttaatcgtaa cttggtagat actagatatg ctacaagaga gttaacaaac 1980
tatttaaaag cctactttag tgctaataac atgaatgtaa aagttaaaac aattaatgga 2040
agctttactg actatttaag aaaagtttgg aaatttaaaa aagagcgtaa tcatggatat 2100
aaacatcatg ctgaagatgc tctaataatt gctaacgctg attttctgtt taaagaaaac 2160
aaaaagctaa aagctgttaa tagtgtatta gaaaaaccag aaattgaaag taaacaatta 2220
gatatacaag ttgatagtga agataattat agtgaaatgt ttatcattcc taaacaagtt 2280
caggatatta aagactttag aaacttcaag tactcacata gagtagataa aaaaccgaat 2340
aggcaactaa tcaatgacac actttactcg actcgtaaaa aagataacag cacatatatt 2400
gttcaaacta taaaggatat atatgcaaaa gataatacga cgttaaagaa acaatttgat 2460
aaaagtccag aaaagttttt aatgtatcaa catgatcctc gtacatttga aaagttagaa 2520
gttattatga agcaatacgc taatgaaaaa aatcctttgg ctaaatatca tgaagaaaca 2580
ggagaatatt taactaaata tagtaaaaaa aataatgggc ctatcgtaaa aagcttaaaa 2640
tatattggca ataaattggg aagtcattta gatgtgacac atcaatttaa aagttcaact 2700
aaaaaattag taaaattatc aattaaacct tatcgctttg atgtgtattt aacagataaa 2760
ggatataaat ttattaccat ttcatattta gatgtactta aaaaagataa ttattattat 2820
atcccagaac aaaaatatga caagttaaaa ctaggaaaag cgattgataa aaatgctaaa 2880
tttattgcta gtttctataa aaatgatttg ataaaacttg atggagagat atataaaatt 2940
attggagtaa atagtgatac tagaaatatg attgaattag atttacctga tattagatat 3000
aaagaatact gtgagttgaa caatattaaa ggagaacctc gtattaaaaa aactataggt 3060
aagaaagtaa attctataga aaaattaact acggatgtat taggaaatgt ctttactaat 3120
actcaatata caaaaccaca actgttattt aagcgaggca attag 3165
<210> 2
<211> 1056
<212> PRT
<213> 路邓葡萄球菌(Staphylococcus lugdunensis)
<220>
<223> 如用作所述专利申请实施例1-6中的SluCas9的路邓葡萄球菌CRISPR Cas9蛋白。所述蛋白在位置737具有苏氨酸而不是丝氨酸(如SEQ ID NO: 35)。
<400> 2
Met Asn Gln Lys Phe Ile Leu Gly Leu Asp Ile Gly Ile Thr Ser Val
1 5 10 15
Gly Tyr Gly Leu Ile Asp Tyr Glu Thr Lys Asn Ile Ile Asp Ala Gly
20 25 30
Val Arg Leu Phe Pro Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg
35 40 45
Ser Lys Arg Gly Ser Arg Arg Leu Lys Arg Arg Arg Ile His Arg Leu
50 55 60
Glu Arg Val Lys Lys Leu Leu Glu Asp Tyr Asn Leu Leu Asp Gln Ser
65 70 75 80
Gln Ile Pro Gln Ser Thr Asn Pro Tyr Ala Ile Arg Val Lys Gly Leu
85 90 95
Ser Glu Ala Leu Ser Lys Asp Glu Leu Val Ile Ala Leu Leu His Ile
100 105 110
Ala Lys Arg Arg Gly Ile His Lys Ile Asp Val Ile Asp Ser Asn Asp
115 120 125
Asp Val Gly Asn Glu Leu Ser Thr Lys Glu Gln Leu Asn Lys Asn Ser
130 135 140
Lys Leu Leu Lys Asp Lys Phe Val Cys Gln Ile Gln Leu Glu Arg Met
145 150 155 160
Asn Glu Gly Gln Val Arg Gly Glu Lys Asn Arg Phe Lys Thr Ala Asp
165 170 175
Ile Ile Lys Glu Ile Ile Gln Leu Leu Asn Val Gln Lys Asn Phe His
180 185 190
Gln Leu Asp Glu Asn Phe Ile Asn Lys Tyr Ile Glu Leu Val Glu Met
195 200 205
Arg Arg Glu Tyr Phe Glu Gly Pro Gly Lys Gly Ser Pro Tyr Gly Trp
210 215 220
Glu Gly Asp Pro Lys Ala Trp Tyr Glu Thr Leu Met Gly His Cys Thr
225 230 235 240
Tyr Phe Pro Asp Glu Leu Arg Ser Val Lys Tyr Ala Tyr Ser Ala Asp
245 250 255
Leu Phe Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Gln Arg Asp
260 265 270
Gly Leu Ser Lys Leu Glu Tyr His Glu Lys Tyr His Ile Ile Glu Asn
275 280 285
Val Phe Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Asn Glu
290 295 300
Ile Asn Val Asn Pro Glu Asp Ile Lys Gly Tyr Arg Ile Thr Lys Ser
305 310 315 320
Gly Lys Pro Gln Phe Thr Glu Phe Lys Leu Tyr His Asp Leu Lys Ser
325 330 335
Val Leu Phe Asp Gln Ser Ile Leu Glu Asn Glu Asp Val Leu Asp Gln
340 345 350
Ile Ala Glu Ile Leu Thr Ile Tyr Gln Asp Lys Asp Ser Ile Lys Ser
355 360 365
Lys Leu Thr Glu Leu Asp Ile Leu Leu Asn Glu Glu Asp Lys Glu Asn
370 375 380
Ile Ala Gln Leu Thr Gly Tyr Thr Gly Thr His Arg Leu Ser Leu Lys
385 390 395 400
Cys Ile Arg Leu Val Leu Glu Glu Gln Trp Tyr Ser Ser Arg Asn Gln
405 410 415
Met Glu Ile Phe Thr His Leu Asn Ile Lys Pro Lys Lys Ile Asn Leu
420 425 430
Thr Ala Ala Asn Lys Ile Pro Lys Ala Met Ile Asp Glu Phe Ile Leu
435 440 445
Ser Pro Val Val Lys Arg Thr Phe Gly Gln Ala Ile Asn Leu Ile Asn
450 455 460
Lys Ile Ile Glu Lys Tyr Gly Val Pro Glu Asp Ile Ile Ile Glu Leu
465 470 475 480
Ala Arg Glu Asn Asn Ser Lys Asp Lys Gln Lys Phe Ile Asn Glu Met
485 490 495
Gln Lys Lys Asn Glu Asn Thr Arg Lys Arg Ile Asn Glu Ile Ile Gly
500 505 510
Lys Tyr Gly Asn Gln Asn Ala Lys Arg Leu Val Glu Lys Ile Arg Leu
515 520 525
His Asp Glu Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ser Ile Pro
530 535 540
Leu Glu Asp Leu Leu Asn Asn Pro Asn His Tyr Glu Val Asp His Ile
545 550 555 560
Ile Pro Arg Ser Val Ser Phe Asp Asn Ser Tyr His Asn Lys Val Leu
565 570 575
Val Lys Gln Ser Glu Asn Ser Lys Lys Ser Asn Leu Thr Pro Tyr Gln
580 585 590
Tyr Phe Asn Ser Gly Lys Ser Lys Leu Ser Tyr Asn Gln Phe Lys Gln
595 600 605
His Ile Leu Asn Leu Ser Lys Ser Gln Asp Arg Ile Ser Lys Lys Lys
610 615 620
Lys Glu Tyr Leu Leu Glu Glu Arg Asp Ile Asn Lys Phe Glu Val Gln
625 630 635 640
Lys Glu Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg
645 650 655
Glu Leu Thr Asn Tyr Leu Lys Ala Tyr Phe Ser Ala Asn Asn Met Asn
660 665 670
Val Lys Val Lys Thr Ile Asn Gly Ser Phe Thr Asp Tyr Leu Arg Lys
675 680 685
Val Trp Lys Phe Lys Lys Glu Arg Asn His Gly Tyr Lys His His Ala
690 695 700
Glu Asp Ala Leu Ile Ile Ala Asn Ala Asp Phe Leu Phe Lys Glu Asn
705 710 715 720
Lys Lys Leu Lys Ala Val Asn Ser Val Leu Glu Lys Pro Glu Ile Glu
725 730 735
Thr Lys Gln Leu Asp Ile Gln Val Asp Ser Glu Asp Asn Tyr Ser Glu
740 745 750
Met Phe Ile Ile Pro Lys Gln Val Gln Asp Ile Lys Asp Phe Arg Asn
755 760 765
Phe Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Gln Leu Ile
770 775 780
Asn Asp Thr Leu Tyr Ser Thr Arg Lys Lys Asp Asn Ser Thr Tyr Ile
785 790 795 800
Val Gln Thr Ile Lys Asp Ile Tyr Ala Lys Asp Asn Thr Thr Leu Lys
805 810 815
Lys Gln Phe Asp Lys Ser Pro Glu Lys Phe Leu Met Tyr Gln His Asp
820 825 830
Pro Arg Thr Phe Glu Lys Leu Glu Val Ile Met Lys Gln Tyr Ala Asn
835 840 845
Glu Lys Asn Pro Leu Ala Lys Tyr His Glu Glu Thr Gly Glu Tyr Leu
850 855 860
Thr Lys Tyr Ser Lys Lys Asn Asn Gly Pro Ile Val Lys Ser Leu Lys
865 870 875 880
Tyr Ile Gly Asn Lys Leu Gly Ser His Leu Asp Val Thr His Gln Phe
885 890 895
Lys Ser Ser Thr Lys Lys Leu Val Lys Leu Ser Ile Lys Pro Tyr Arg
900 905 910
Phe Asp Val Tyr Leu Thr Asp Lys Gly Tyr Lys Phe Ile Thr Ile Ser
915 920 925
Tyr Leu Asp Val Leu Lys Lys Asp Asn Tyr Tyr Tyr Ile Pro Glu Gln
930 935 940
Lys Tyr Asp Lys Leu Lys Leu Gly Lys Ala Ile Asp Lys Asn Ala Lys
945 950 955 960
Phe Ile Ala Ser Phe Tyr Lys Asn Asp Leu Ile Lys Leu Asp Gly Glu
965 970 975
Ile Tyr Lys Ile Ile Gly Val Asn Ser Asp Thr Arg Asn Met Ile Glu
980 985 990
Leu Asp Leu Pro Asp Ile Arg Tyr Lys Glu Tyr Cys Glu Leu Asn Asn
995 1000 1005
Ile Lys Gly Glu Pro Arg Ile Lys Lys Thr Ile Gly Lys Lys Val Asn
1010 1015 1020
Ser Ile Glu Lys Leu Thr Thr Asp Val Leu Gly Asn Val Phe Thr Asn
1025 1030 1035 1040
Thr Gln Tyr Thr Lys Pro Gln Leu Leu Phe Lys Arg Gly Asn Gly Gly
1045 1050 1055
<210> 3
<211> 3315
<212> DNA
<213> 路邓葡萄球菌(Staphylococcus lugdun)
<220>
<221> CDS
<222> 1..3315
<223> /transl_table=11
<220>
<221> sig_peptide
<222> 4..51
<223> /功能="核定位信号"
<220>
<221> misc_feature
<222> 52..60
<223> /功能="柔性接头"
<220>
<221> misc_feature
<222> 3226..3240
<223> /功能="接头"
<220>
<221> sig_peptide
<222> 3241..3264
<223> /功能="SV40-核定位信号"
<220>
<221> misc_feature
<222> 3265..3294
<223> /功能="接头"
<220>
<221> misc_binding
<222> 3295..3312
<223> /功能="6xHis标签"
<400> 3
atg aaa cgt ccg gca gca acc aaa aaa gca ggt cag gcc aag aaa aaa 48
Met Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys
1 5 10 15
aaa ggt ggt ggt tca ggt aac cag aaa ttt atc ctg ggt ctg gat att 96
Lys Gly Gly Gly Ser Gly Asn Gln Lys Phe Ile Leu Gly Leu Asp Ile
20 25 30
ggt att acc agc gtt ggt tat ggc ctg att gat tac gaa acc aaa aac 144
Gly Ile Thr Ser Val Gly Tyr Gly Leu Ile Asp Tyr Glu Thr Lys Asn
35 40 45
att att gat gcc ggt gtt cgt ctg ttt ccg gaa gca aat gtt gaa aat 192
Ile Ile Asp Ala Gly Val Arg Leu Phe Pro Glu Ala Asn Val Glu Asn
50 55 60
aat gaa ggt cgt cgt agc aaa cgt ggt agc cgt cgt ctg aaa cgt cgt 240
Asn Glu Gly Arg Arg Ser Lys Arg Gly Ser Arg Arg Leu Lys Arg Arg
65 70 75 80
cgt att cat cgt ctg gaa cgt gtt aaa aaa ctg ctg gaa gat tat aac 288
Arg Ile His Arg Leu Glu Arg Val Lys Lys Leu Leu Glu Asp Tyr Asn
85 90 95
ctg ctg gat cag agc cag att ccg cag agc acc aat ccg tat gca att 336
Leu Leu Asp Gln Ser Gln Ile Pro Gln Ser Thr Asn Pro Tyr Ala Ile
100 105 110
cgt gtt aaa ggt ctg agc gaa gca ctg agc aaa gat gaa ctg gtt att 384
Arg Val Lys Gly Leu Ser Glu Ala Leu Ser Lys Asp Glu Leu Val Ile
115 120 125
gca ctg ctg cat att gca aaa cgc cgt ggc att cat aaa atc gat gtg 432
Ala Leu Leu His Ile Ala Lys Arg Arg Gly Ile His Lys Ile Asp Val
130 135 140
att gat agc aat gac gat gtg ggt aat gaa ctg agc acc aaa gaa cag 480
Ile Asp Ser Asn Asp Asp Val Gly Asn Glu Leu Ser Thr Lys Glu Gln
145 150 155 160
ctg aac aaa aat agc aaa ctg ctg aaa gac aaa ttc gtg tgt cag att 528
Leu Asn Lys Asn Ser Lys Leu Leu Lys Asp Lys Phe Val Cys Gln Ile
165 170 175
cag ctg gaa cgt atg aat gaa ggc cag gtt cgt ggt gaa aag aat cgc 576
Gln Leu Glu Arg Met Asn Glu Gly Gln Val Arg Gly Glu Lys Asn Arg
180 185 190
ttt aaa acc gca gac atc atc aaa gaa att atc cag ctg ctg aac gtg 624
Phe Lys Thr Ala Asp Ile Ile Lys Glu Ile Ile Gln Leu Leu Asn Val
195 200 205
cag aaa aac ttc cat cag ctg gat gaa aac ttc atc aac aaa tac atc 672
Gln Lys Asn Phe His Gln Leu Asp Glu Asn Phe Ile Asn Lys Tyr Ile
210 215 220
gag ctg gtt gaa atg cgt cgc gaa tat ttt gaa ggt ccg ggt aaa ggt 720
Glu Leu Val Glu Met Arg Arg Glu Tyr Phe Glu Gly Pro Gly Lys Gly
225 230 235 240
agc ccg tat ggt tgg gaa ggt gat ccg aaa gca tgg tat gaa acc ctg 768
Ser Pro Tyr Gly Trp Glu Gly Asp Pro Lys Ala Trp Tyr Glu Thr Leu
245 250 255
atg ggt cat tgt acc tat ttt ccg gat gaa ctg cgt agc gtt aaa tat 816
Met Gly His Cys Thr Tyr Phe Pro Asp Glu Leu Arg Ser Val Lys Tyr
260 265 270
gcc tat agc gca gac ctg ttt aat gca ctg aat gat ctg aat aac ctg 864
Ala Tyr Ser Ala Asp Leu Phe Asn Ala Leu Asn Asp Leu Asn Asn Leu
275 280 285
gtg att cag cgt gat ggt ctg agc aaa ctg gaa tat cat gag aaa tat 912
Val Ile Gln Arg Asp Gly Leu Ser Lys Leu Glu Tyr His Glu Lys Tyr
290 295 300
cac atc atc gaa aac gtg ttc aaa cag aag aag aaa ccg acc ctg aaa 960
His Ile Ile Glu Asn Val Phe Lys Gln Lys Lys Lys Pro Thr Leu Lys
305 310 315 320
caa atc gcc aac gaa att aat gtg aac ccg gaa gat att aaa ggc tac 1008
Gln Ile Ala Asn Glu Ile Asn Val Asn Pro Glu Asp Ile Lys Gly Tyr
325 330 335
cgt att acc aaa agc ggt aaa ccg cag ttc acc gaa ttt aaa ctg tat 1056
Arg Ile Thr Lys Ser Gly Lys Pro Gln Phe Thr Glu Phe Lys Leu Tyr
340 345 350
cac gat ctg aaa agc gtg ctg ttt gat cag agc att ctg gaa aat gaa 1104
His Asp Leu Lys Ser Val Leu Phe Asp Gln Ser Ile Leu Glu Asn Glu
355 360 365
gat gtg ctg gac cag att gca gaa att ctg acc att tat cag gac aaa 1152
Asp Val Leu Asp Gln Ile Ala Glu Ile Leu Thr Ile Tyr Gln Asp Lys
370 375 380
gac agc atc aaa agc aaa ctg acc gaa ctg gat att ctg ctg aat gaa 1200
Asp Ser Ile Lys Ser Lys Leu Thr Glu Leu Asp Ile Leu Leu Asn Glu
385 390 395 400
gaa gat aaa gag aac att gca cag ctg acc ggt tat acc ggc acc cat 1248
Glu Asp Lys Glu Asn Ile Ala Gln Leu Thr Gly Tyr Thr Gly Thr His
405 410 415
cgt ctg agc ctg aaa tgt att cgt ctg gta ctg gaa gaa cag tgg tat 1296
Arg Leu Ser Leu Lys Cys Ile Arg Leu Val Leu Glu Glu Gln Trp Tyr
420 425 430
agc agc cgt aat cag atg gaa atc ttt acc cat ctg aac att aaa ccg 1344
Ser Ser Arg Asn Gln Met Glu Ile Phe Thr His Leu Asn Ile Lys Pro
435 440 445
aag aaa atc aat ctg acc gca gcc aac aaa att ccg aaa gcc atg att 1392
Lys Lys Ile Asn Leu Thr Ala Ala Asn Lys Ile Pro Lys Ala Met Ile
450 455 460
gat gag ttt att ctg agt ccg gtt gtg aaa cgt acc ttt ggt cag gca 1440
Asp Glu Phe Ile Leu Ser Pro Val Val Lys Arg Thr Phe Gly Gln Ala
465 470 475 480
att aac ctg atc aac aaa atc att gaa aaa tat ggc gtg cct gag gat 1488
Ile Asn Leu Ile Asn Lys Ile Ile Glu Lys Tyr Gly Val Pro Glu Asp
485 490 495
atc att att gaa ctg gca cgt gaa aac aac agc aaa gat aaa cag aaa 1536
Ile Ile Ile Glu Leu Ala Arg Glu Asn Asn Ser Lys Asp Lys Gln Lys
500 505 510
ttc atc aac gag atg cag aag aag aac gaa aat acc cgc aaa cgg att 1584
Phe Ile Asn Glu Met Gln Lys Lys Asn Glu Asn Thr Arg Lys Arg Ile
515 520 525
aac gag atc att ggc aaa tat ggt aat cag aat gcc aaa cgc ctg gtg 1632
Asn Glu Ile Ile Gly Lys Tyr Gly Asn Gln Asn Ala Lys Arg Leu Val
530 535 540
gaa aaa att cgt ctg cat gat gaa caa gag ggc aaa tgt ctg tat agc 1680
Glu Lys Ile Arg Leu His Asp Glu Gln Glu Gly Lys Cys Leu Tyr Ser
545 550 555 560
ctg gaa agc att cct ctg gaa gat ctg ctg aac aat ccg aat cat tat 1728
Leu Glu Ser Ile Pro Leu Glu Asp Leu Leu Asn Asn Pro Asn His Tyr
565 570 575
gaa gtg gat cac att att ccg cgt agc gtg agc ttt gat aat tcc tat 1776
Glu Val Asp His Ile Ile Pro Arg Ser Val Ser Phe Asp Asn Ser Tyr
580 585 590
cat aat aaa gtg ctg gtg aaa cag agc gaa aac tcc aaa aaa tcc aac 1824
His Asn Lys Val Leu Val Lys Gln Ser Glu Asn Ser Lys Lys Ser Asn
595 600 605
ctg aca ccg tat cag tat ttc aat agc ggc aaa tcc aaa ctg agc tac 1872
Leu Thr Pro Tyr Gln Tyr Phe Asn Ser Gly Lys Ser Lys Leu Ser Tyr
610 615 620
aac cag ttt aaa cag cat att ctg aac ctg agc aaa agc cag gat cgc 1920
Asn Gln Phe Lys Gln His Ile Leu Asn Leu Ser Lys Ser Gln Asp Arg
625 630 635 640
atc agc aag aag aag aag gag tac ctg ctg gaa gaa cgc gac atc aac 1968
Ile Ser Lys Lys Lys Lys Glu Tyr Leu Leu Glu Glu Arg Asp Ile Asn
645 650 655
aaa ttt gaa gtg cag aaa gaa ttt atc aac cgc aac ctg gtt gat acc 2016
Lys Phe Glu Val Gln Lys Glu Phe Ile Asn Arg Asn Leu Val Asp Thr
660 665 670
cgt tat gca acc cgt gaa ctg acc aat tat ctg aaa gca tat ttc agc 2064
Arg Tyr Ala Thr Arg Glu Leu Thr Asn Tyr Leu Lys Ala Tyr Phe Ser
675 680 685
gcc aac aac atg aac gtg aaa gtg aaa acg att aac ggc agc ttt acc 2112
Ala Asn Asn Met Asn Val Lys Val Lys Thr Ile Asn Gly Ser Phe Thr
690 695 700
gat tat ctg cgt aaa gtg tgg aaa ttc aaa aaa gaa cgc aac cac ggc 2160
Asp Tyr Leu Arg Lys Val Trp Lys Phe Lys Lys Glu Arg Asn His Gly
705 710 715 720
tat aaa cat cat gcc gaa gat gcc ctg att att gca aat gca gat ttc 2208
Tyr Lys His His Ala Glu Asp Ala Leu Ile Ile Ala Asn Ala Asp Phe
725 730 735
ctg ttt aaa gaa aac aaa aaa ctg aaa gcc gtc aac agc gtg ctg gaa 2256
Leu Phe Lys Glu Asn Lys Lys Leu Lys Ala Val Asn Ser Val Leu Glu
740 745 750
aaa ccg gaa att gag aca aaa cag ctg gac att cag gtt gat agc gaa 2304
Lys Pro Glu Ile Glu Thr Lys Gln Leu Asp Ile Gln Val Asp Ser Glu
755 760 765
gat aat tac agc gaa atg ttt atc atc ccg aaa cag gtg cag gat atc 2352
Asp Asn Tyr Ser Glu Met Phe Ile Ile Pro Lys Gln Val Gln Asp Ile
770 775 780
aaa gat ttt cgc aac ttc aaa tat agc cac cgc gtt gac aaa aaa cct 2400
Lys Asp Phe Arg Asn Phe Lys Tyr Ser His Arg Val Asp Lys Lys Pro
785 790 795 800
aat cgt cag ctg att aac gat acc ctg tat agc acc cgc aaa aaa gat 2448
Asn Arg Gln Leu Ile Asn Asp Thr Leu Tyr Ser Thr Arg Lys Lys Asp
805 810 815
aac agc acc tat att gtg cag acc att aaa gac atc tac gcc aaa gat 2496
Asn Ser Thr Tyr Ile Val Gln Thr Ile Lys Asp Ile Tyr Ala Lys Asp
820 825 830
aat acc acc ctg aaa aaa cag ttc gac aaa agc cca gaa aaa ttt ctg 2544
Asn Thr Thr Leu Lys Lys Gln Phe Asp Lys Ser Pro Glu Lys Phe Leu
835 840 845
atg tat cag cat gat ccg cgt acc ttc gaa aaa ctg gaa gtt att atg 2592
Met Tyr Gln His Asp Pro Arg Thr Phe Glu Lys Leu Glu Val Ile Met
850 855 860
aaa cag tat gcc aac gag aaa aat ccg ctg gcc aaa tat cac gaa gaa 2640
Lys Gln Tyr Ala Asn Glu Lys Asn Pro Leu Ala Lys Tyr His Glu Glu
865 870 875 880
acc ggt gaa tat ctg acc aaa tat tcc aag aag aac aac ggt ccg atc 2688
Thr Gly Glu Tyr Leu Thr Lys Tyr Ser Lys Lys Asn Asn Gly Pro Ile
885 890 895
gtt aaa tcc ctg aaa tat atc ggt aat aaa ctg ggc agc cat ctg gat 2736
Val Lys Ser Leu Lys Tyr Ile Gly Asn Lys Leu Gly Ser His Leu Asp
900 905 910
gtt acc cat cag ttt aaa agc tcc aca aag aag ctg gtt aaa ctg tcc 2784
Val Thr His Gln Phe Lys Ser Ser Thr Lys Lys Leu Val Lys Leu Ser
915 920 925
atc aaa ccg tat cgc ttt gat gtg tat ctg acc gac aaa ggc tat aaa 2832
Ile Lys Pro Tyr Arg Phe Asp Val Tyr Leu Thr Asp Lys Gly Tyr Lys
930 935 940
ttc att acc atc agc tat ctg gac gtg ctg aaa aaa gac aac tat tat 2880
Phe Ile Thr Ile Ser Tyr Leu Asp Val Leu Lys Lys Asp Asn Tyr Tyr
945 950 955 960
tat atc ccg gaa cag aaa tat gat aaa ctg aaa ctg ggt aaa gcc atc 2928
Tyr Ile Pro Glu Gln Lys Tyr Asp Lys Leu Lys Leu Gly Lys Ala Ile
965 970 975
gat aaa aac gcc aaa ttt atc gcc agc ttc tac aaa aac gac ctg att 2976
Asp Lys Asn Ala Lys Phe Ile Ala Ser Phe Tyr Lys Asn Asp Leu Ile
980 985 990
aaa ctg gat ggc gag atc tat aaa atc atc ggt gtt aat agc gac acc 3024
Lys Leu Asp Gly Glu Ile Tyr Lys Ile Ile Gly Val Asn Ser Asp Thr
995 1000 1005
cgc aat atg att gag ctg gat ctg ccg gat att cgc tat aaa gaa tat 3072
Arg Asn Met Ile Glu Leu Asp Leu Pro Asp Ile Arg Tyr Lys Glu Tyr
1010 1015 1020
tgc gaa ctg aac aac att aaa ggc gaa ccg cgt atc aaa aag acc atc 3120
Cys Glu Leu Asn Asn Ile Lys Gly Glu Pro Arg Ile Lys Lys Thr Ile
1025 1030 1035 1040
ggc aaa aaa gtg aat agc atc gag aaa ctg acc acc gat gtt ctg ggt 3168
Gly Lys Lys Val Asn Ser Ile Glu Lys Leu Thr Thr Asp Val Leu Gly
1045 1050 1055
aat gtg ttt acc aat acc cag tat acc aaa cct cag ctg ctg ttc aaa 3216
Asn Val Phe Thr Asn Thr Gln Tyr Thr Lys Pro Gln Leu Leu Phe Lys
1060 1065 1070
cgc ggt aat ggc gga gga tct ggc ccc cct aag aaa aag cgg aag gtg 3264
Arg Gly Asn Gly Gly Gly Ser Gly Pro Pro Lys Lys Lys Arg Lys Val
1075 1080 1085
ggt gga agc gga ggc agc ggg gga tca ggc cat cat cat cac cat cat 3312
Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly His His His His His His
1090 1095 1100
taa 3315
<210> 4
<211> 1104
<212> PRT
<213> 路邓葡萄球菌(Staphylococcus lugdun)
<220>
<221> SIGNAL
<222> 1..16
<220>
<223> [CDS]:来自SEQ ID NO 3的1..3315
<400> 4
Met Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys
1 5 10 15
Lys Gly Gly Gly Ser Gly Asn Gln Lys Phe Ile Leu Gly Leu Asp Ile
20 25 30
Gly Ile Thr Ser Val Gly Tyr Gly Leu Ile Asp Tyr Glu Thr Lys Asn
35 40 45
Ile Ile Asp Ala Gly Val Arg Leu Phe Pro Glu Ala Asn Val Glu Asn
50 55 60
Asn Glu Gly Arg Arg Ser Lys Arg Gly Ser Arg Arg Leu Lys Arg Arg
65 70 75 80
Arg Ile His Arg Leu Glu Arg Val Lys Lys Leu Leu Glu Asp Tyr Asn
85 90 95
Leu Leu Asp Gln Ser Gln Ile Pro Gln Ser Thr Asn Pro Tyr Ala Ile
100 105 110
Arg Val Lys Gly Leu Ser Glu Ala Leu Ser Lys Asp Glu Leu Val Ile
115 120 125
Ala Leu Leu His Ile Ala Lys Arg Arg Gly Ile His Lys Ile Asp Val
130 135 140
Ile Asp Ser Asn Asp Asp Val Gly Asn Glu Leu Ser Thr Lys Glu Gln
145 150 155 160
Leu Asn Lys Asn Ser Lys Leu Leu Lys Asp Lys Phe Val Cys Gln Ile
165 170 175
Gln Leu Glu Arg Met Asn Glu Gly Gln Val Arg Gly Glu Lys Asn Arg
180 185 190
Phe Lys Thr Ala Asp Ile Ile Lys Glu Ile Ile Gln Leu Leu Asn Val
195 200 205
Gln Lys Asn Phe His Gln Leu Asp Glu Asn Phe Ile Asn Lys Tyr Ile
210 215 220
Glu Leu Val Glu Met Arg Arg Glu Tyr Phe Glu Gly Pro Gly Lys Gly
225 230 235 240
Ser Pro Tyr Gly Trp Glu Gly Asp Pro Lys Ala Trp Tyr Glu Thr Leu
245 250 255
Met Gly His Cys Thr Tyr Phe Pro Asp Glu Leu Arg Ser Val Lys Tyr
260 265 270
Ala Tyr Ser Ala Asp Leu Phe Asn Ala Leu Asn Asp Leu Asn Asn Leu
275 280 285
Val Ile Gln Arg Asp Gly Leu Ser Lys Leu Glu Tyr His Glu Lys Tyr
290 295 300
His Ile Ile Glu Asn Val Phe Lys Gln Lys Lys Lys Pro Thr Leu Lys
305 310 315 320
Gln Ile Ala Asn Glu Ile Asn Val Asn Pro Glu Asp Ile Lys Gly Tyr
325 330 335
Arg Ile Thr Lys Ser Gly Lys Pro Gln Phe Thr Glu Phe Lys Leu Tyr
340 345 350
His Asp Leu Lys Ser Val Leu Phe Asp Gln Ser Ile Leu Glu Asn Glu
355 360 365
Asp Val Leu Asp Gln Ile Ala Glu Ile Leu Thr Ile Tyr Gln Asp Lys
370 375 380
Asp Ser Ile Lys Ser Lys Leu Thr Glu Leu Asp Ile Leu Leu Asn Glu
385 390 395 400
Glu Asp Lys Glu Asn Ile Ala Gln Leu Thr Gly Tyr Thr Gly Thr His
405 410 415
Arg Leu Ser Leu Lys Cys Ile Arg Leu Val Leu Glu Glu Gln Trp Tyr
420 425 430
Ser Ser Arg Asn Gln Met Glu Ile Phe Thr His Leu Asn Ile Lys Pro
435 440 445
Lys Lys Ile Asn Leu Thr Ala Ala Asn Lys Ile Pro Lys Ala Met Ile
450 455 460
Asp Glu Phe Ile Leu Ser Pro Val Val Lys Arg Thr Phe Gly Gln Ala
465 470 475 480
Ile Asn Leu Ile Asn Lys Ile Ile Glu Lys Tyr Gly Val Pro Glu Asp
485 490 495
Ile Ile Ile Glu Leu Ala Arg Glu Asn Asn Ser Lys Asp Lys Gln Lys
500 505 510
Phe Ile Asn Glu Met Gln Lys Lys Asn Glu Asn Thr Arg Lys Arg Ile
515 520 525
Asn Glu Ile Ile Gly Lys Tyr Gly Asn Gln Asn Ala Lys Arg Leu Val
530 535 540
Glu Lys Ile Arg Leu His Asp Glu Gln Glu Gly Lys Cys Leu Tyr Ser
545 550 555 560
Leu Glu Ser Ile Pro Leu Glu Asp Leu Leu Asn Asn Pro Asn His Tyr
565 570 575
Glu Val Asp His Ile Ile Pro Arg Ser Val Ser Phe Asp Asn Ser Tyr
580 585 590
His Asn Lys Val Leu Val Lys Gln Ser Glu Asn Ser Lys Lys Ser Asn
595 600 605
Leu Thr Pro Tyr Gln Tyr Phe Asn Ser Gly Lys Ser Lys Leu Ser Tyr
610 615 620
Asn Gln Phe Lys Gln His Ile Leu Asn Leu Ser Lys Ser Gln Asp Arg
625 630 635 640
Ile Ser Lys Lys Lys Lys Glu Tyr Leu Leu Glu Glu Arg Asp Ile Asn
645 650 655
Lys Phe Glu Val Gln Lys Glu Phe Ile Asn Arg Asn Leu Val Asp Thr
660 665 670
Arg Tyr Ala Thr Arg Glu Leu Thr Asn Tyr Leu Lys Ala Tyr Phe Ser
675 680 685
Ala Asn Asn Met Asn Val Lys Val Lys Thr Ile Asn Gly Ser Phe Thr
690 695 700
Asp Tyr Leu Arg Lys Val Trp Lys Phe Lys Lys Glu Arg Asn His Gly
705 710 715 720
Tyr Lys His His Ala Glu Asp Ala Leu Ile Ile Ala Asn Ala Asp Phe
725 730 735
Leu Phe Lys Glu Asn Lys Lys Leu Lys Ala Val Asn Ser Val Leu Glu
740 745 750
Lys Pro Glu Ile Glu Thr Lys Gln Leu Asp Ile Gln Val Asp Ser Glu
755 760 765
Asp Asn Tyr Ser Glu Met Phe Ile Ile Pro Lys Gln Val Gln Asp Ile
770 775 780
Lys Asp Phe Arg Asn Phe Lys Tyr Ser His Arg Val Asp Lys Lys Pro
785 790 795 800
Asn Arg Gln Leu Ile Asn Asp Thr Leu Tyr Ser Thr Arg Lys Lys Asp
805 810 815
Asn Ser Thr Tyr Ile Val Gln Thr Ile Lys Asp Ile Tyr Ala Lys Asp
820 825 830
Asn Thr Thr Leu Lys Lys Gln Phe Asp Lys Ser Pro Glu Lys Phe Leu
835 840 845
Met Tyr Gln His Asp Pro Arg Thr Phe Glu Lys Leu Glu Val Ile Met
850 855 860
Lys Gln Tyr Ala Asn Glu Lys Asn Pro Leu Ala Lys Tyr His Glu Glu
865 870 875 880
Thr Gly Glu Tyr Leu Thr Lys Tyr Ser Lys Lys Asn Asn Gly Pro Ile
885 890 895
Val Lys Ser Leu Lys Tyr Ile Gly Asn Lys Leu Gly Ser His Leu Asp
900 905 910
Val Thr His Gln Phe Lys Ser Ser Thr Lys Lys Leu Val Lys Leu Ser
915 920 925
Ile Lys Pro Tyr Arg Phe Asp Val Tyr Leu Thr Asp Lys Gly Tyr Lys
930 935 940
Phe Ile Thr Ile Ser Tyr Leu Asp Val Leu Lys Lys Asp Asn Tyr Tyr
945 950 955 960
Tyr Ile Pro Glu Gln Lys Tyr Asp Lys Leu Lys Leu Gly Lys Ala Ile
965 970 975
Asp Lys Asn Ala Lys Phe Ile Ala Ser Phe Tyr Lys Asn Asp Leu Ile
980 985 990
Lys Leu Asp Gly Glu Ile Tyr Lys Ile Ile Gly Val Asn Ser Asp Thr
995 1000 1005
Arg Asn Met Ile Glu Leu Asp Leu Pro Asp Ile Arg Tyr Lys Glu Tyr
1010 1015 1020
Cys Glu Leu Asn Asn Ile Lys Gly Glu Pro Arg Ile Lys Lys Thr Ile
1025 1030 1035 1040
Gly Lys Lys Val Asn Ser Ile Glu Lys Leu Thr Thr Asp Val Leu Gly
1045 1050 1055
Asn Val Phe Thr Asn Thr Gln Tyr Thr Lys Pro Gln Leu Leu Phe Lys
1060 1065 1070
Arg Gly Asn Gly Gly Gly Ser Gly Pro Pro Lys Lys Lys Arg Lys Val
1075 1080 1085
Gly Gly Ser Gly Gly Ser Gly Gly Ser Gly His His His His His His
1090 1095 1100
<210> 5
<211> 156
<212> DNA
<213> 路邓葡萄球菌(Staphylococcus lugdunensis)
<220>
<223> 展示为DNA序列
<400> 5
cttgtactta tacctaaaat tacagaatct actgaaacaa gacaatatgt cgtgtttatc 60
ccatcaattt attggtggga tttttttatg tttttagcaa aaagtaatac catactttat 120
atttttaaat tataataaag atataaataa aggtgg 156
<210> 6
<211> 103
<212> DNA
<213> 路邓葡萄球菌(Staphylococcus lugdunensis)
<220>
<223> nnnnnnnnnn nnnnnnnnnn对应于位置1-20中的具体靶序列
<220>
<221> variation
<222> 1..20
<223> /置换="nnnnnnnnnn nnnnnnnnnn对应于位置1-20中的具体靶序列"
<400> 6
nnnnnnnnnn nnnnnnnnnn gttttagtac tctggaaaca gaatctactg aaacaagaca 60
atatgtcgtg tttatcccat caatttattg gtgggatttt ttt 103
<210> 7
<211> 101
<212> DNA
<213> 人工序列
<220>
<223> nnnnnnnnnn nnnnnnnnnn对应于位置1-20中的具体靶序列
<220>
<221> variation
<222> 1..20
<223> /置换="nnnnnnnnnn nnnnnnnnnn对应于位置1-20中的具体靶序列"
<400> 7
nnnnnnnnnn nnnnnnnnnn gttttagtac tctggaaaca gaatctacta aaacaagact 60
atatgtcgtg tttatcccac taatttatta gtgggaattt t 101
<210> 8
<211> 104
<212> RNA
<213> 人工序列
<220>
<223> 荧光偏振测定
<400> 8
ggacccccuc caccccgccu cguuuuagua cucuggaaac agaaucuacu gaaacaagac 60
aauaugucgu guuuauccca ucaauuuauu ggugggauuu uuuu 104
<210> 9
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> ATTO647N
<400> 9
gaccccctcc accccgcctc cgggcgcg 28
<210> 10
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 反义,具有3' –生物素
<400> 10
gcgcgcgccc ggaggcgggg tggagggggt cgg 33
<210> 11
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 5' ATTO647N
<400> 11
gaccccctcc accccgcctc agggcgcg 28
<210> 12
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 3'-生物素
<400> 12
gcgcgcgccc tgaggcgggg tggagggggt cgg 33
<210> 13
<211> 104
<212> RNA
<213> 人工序列
<220>
<223> 规程体外PCR切割测定
<400> 13
ggacccccuc caccccgccu cguuuuagua cucuggaaac agaaucuacu gaaacaagac 60
aauaugucgu guuuauccca ucaauuuauu ggugggauuu uuuu 104
<210> 14
<211> 720
<212> DNA
<213> 人工序列
<220>
<223> PAM位于反向链位置173..179和324..330
<400> 14
atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60
ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120
ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180
ctcgtgacca ccctgaccca tggcgtgcag tgcttcagcc gctaccccga ccacatgaag 240
cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 300
ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360
gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420
aagctggagt acaactacaa cagccacaac gtctatatca tggccgacaa gcagaagaac 480
ggcatcaagg tgaacttcaa gatccgccac aacatcgagg acggcagcgt gcagctcgcc 540
gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600
tacctgagca cccagtccaa gctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660
ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagtaa 720
<210> 15
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 实施例4
<400> 15
gggtcagggt ggtcacgagg 20
<210> 16
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 实施例4
<400> 16
ccctcgaact tcacctcggc 20
<210> 17
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 实施例4
<400> 17
cgccctcgaa cttcacctcg gc 22
<210> 18
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 实施例4 HBB
<400> 18
ggtgaacgtg gatgaagttg 20
<210> 19
<211> 6772
<212> DNA
<213> 人工序列
<220>
<223> SluCas9的表达载体(具有2个连续6His-标签和Amp-抗性的Trc-启动的SluCas9表达,pUC-起源)
<400> 19
ggtggaagcg gaggcagcgg gggatcaggc catcatcatc accatcatta atgaacgggt 60
cttgaggggt tttttggact tttgcgtatt gggcgctctt ccgcttcctc gctcactgac 120
tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa ggcggtaata 180
cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa 240
aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct ccgcccccct 300
gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac aggactataa 360
agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg 420
cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc tcatagctca 480
cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa 540
ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga gtccaacccg 600
gtaagacacg acttatcgcc actggcagca gccactggta acaggattag cagagcgagg 660
tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta cactagaagg 720
acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag agttggtagc 780
tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg caagcagcag 840
attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac ggggtctgac 900
gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc aaaaaggatc 960
ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag tatatatgag 1020
taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc agcgatctgt 1080
ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac gatacgggag 1140
ggcttaccat ctggccccag tgctgcaatg ataccgcgag atccacgctc accggctcca 1200
gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg tcctgcaact 1260
ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag tagttcgcca 1320
gttaatagtt tgcgcaacgt tgttgccatt gctgcaggca tcgtggtgtc acgctcgtcg 1380
tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac atgatccccc 1440
atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag aagtaagttg 1500
gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac tgtcatgcca 1560
tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg agaatagtgt 1620
atgcggcgac cgagttgctc ttgcccggcg tcaatacggg ataataccgc gccacatagc 1680
agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc 1740
ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg atcttcagca 1800
tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa 1860
aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt tcaatattat 1920
tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg tatttagaaa 1980
aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccactcct cttgctgtga 2040
ccgtctccgg gagctgcatg tgtcagaggt tttcaccgtc atcaccgaaa cgcgcgaggc 2100
agcagatcaa ttcgcgcgcg aaggcgaagc ggcatgcatt tacgttgaca ccatcgaatg 2160
gtgcaaaacc tttcgcggta tggcatgata gcgcccggaa gagagtcaat tcagggtggt 2220
gaatgtgaaa ccagtaacgt tatacgatgt cgcagagtat gccggtgtct cttatcagac 2280
cgtttcccgc gtggtgaacc aggccagcca cgtttctgcg aaaacgcggg aaaaagtgga 2340
agcggcgatg gcggagctga attacattcc caaccgcgtg gcacaacaac tggcgggcaa 2400
acagtcgttg ctgattgcgt tgccacctcc agtctggccc tgcacgcgcc gtcgcaaatt 2460
gtcgcggcga ttaaatctcg cgccgatcaa ctgggtgcca gcgtggtggt gtcgatggta 2520
gaacgaagcg gcgtcgaagc ctgtaaagcg gcggtgcaca atcttctcgc gcaacgcgtc 2580
agtgggctga tcattaacta tccgctggat gaccaggatg ccattgctgt ggaagctgcc 2640
tgcactaatg ttccggcgtt atttcttgat gtctctgacc agacacccat caacagtatt 2700
attttctccc atgaagatgg tacgcgactg ggcgtggagc atctggtcgc attgggtcac 2760
cagcaaatcg cgctgttagc gggcccatta agttctgtct cggcgcgtct gcgtctggct 2820
ggctggcata aatatctcac tcgcaatcaa attcagccga tagcggaacg ggaaggcgac 2880
tggagtgcca tgtccggttt tcaacaaacc atgcaaatgc tgaatgaggg catcgttccc 2940
actgcgatgc tggttgccaa cgatcagatg gcgctgggcg caatgcgcgc cattaccgag 3000
tccgggctgc gcgttggtgc ggatatctcg gtagtgggat acgacgatac cgaagatagc 3060
tcatgttata tcccgccgtt aaccaccatc aaacaggatt ttcgcctgct ggggcaaacc 3120
agcgtggacc gcttgctgca actctctcag ggccaggcgg tgaagggcaa tcagctgttg 3180
cccgtctcac tggtgaaaag aaaaaccacc ctggcgccca atacgcaaac cgcctctccc 3240
cgcgcgttgg ccgattcatt aatgcagctg gcacgacagg tttcccgact ggaaagcggg 3300
cagtgagcgc aatattctga aatgagctgt tgacaattaa tcatccggct cgtataatgt 3360
gtggaattgt gagcggataa caattttcac acaggaaaca gaattctagc attgtgagcg 3420
gataacaatt cccctctaga aataattttg tttaacttta agaaggagat ataccatgca 3480
tcatcatcac catcatggtg gtggtagcgg taaacgtccg gcagcaacca aaaaagcagg 3540
tcaggccaag aaaaaaaaag gtggtggttc aggtaaccag aaatttatcc tgggtctgga 3600
tattggtatt accagcgttg gttatggcct gattgattac gaaaccaaaa acattattga 3660
tgccggtgtt cgtctgtttc cggaagcaaa tgttgaaaat aatgaaggtc gtcgtagcaa 3720
acgtggtagc cgtcgtctga aacgtcgtcg tattcatcgt ctggaacgtg ttaaaaaact 3780
gctggaagat tataacctgc tggatcagag ccagattccg cagagcacca atccgtatgc 3840
aattcgtgtt aaaggtctga gcgaagcact gagcaaagat gaactggtta ttgcactgct 3900
gcatattgca aaacgccgtg gcattcataa aatcgatgtg attgatagca atgacgatgt 3960
gggtaatgaa ctgagcacca aagaacagct gaacaaaaat agcaaactgc tgaaagacaa 4020
attcgtgtgt cagattcagc tggaacgtat gaatgaaggc caggttcgtg gtgaaaagaa 4080
tcgctttaaa accgcagaca tcatcaaaga aattatccag ctgctgaacg tgcagaaaaa 4140
cttccatcag ctggatgaaa acttcatcaa caaatacatc gagctggttg aaatgcgtcg 4200
cgaatatttt gaaggtccgg gtaaaggtag cccgtatggt tgggaaggtg atccgaaagc 4260
atggtatgaa accctgatgg gtcattgtac ctattttccg gatgaactgc gtagcgttaa 4320
atatgcctat agcgcagacc tgtttaatgc actgaatgat ctgaataacc tggtgattca 4380
gcgtgatggt ctgagcaaac tggaatatca tgagaaatat cacatcatcg aaaacgtgtt 4440
caaacagaag aagaaaccga ccctgaaaca aatcgccaac gaaattaatg tgaacccgga 4500
agatattaaa ggctaccgta ttaccaaaag cggtaaaccg cagttcaccg aatttaaact 4560
gtatcacgat ctgaaaagcg tgctgtttga tcagagcatt ctggaaaatg aagatgtgct 4620
ggaccagatt gcagaaattc tgaccattta tcaggacaaa gacagcatca aaagcaaact 4680
gaccgaactg gatattctgc tgaatgaaga agataaagag aacattgcac agctgaccgg 4740
ttataccggc acccatcgtc tgagcctgaa atgtattcgt ctggtactgg aagaacagtg 4800
gtatagcagc cgtaatcaga tggaaatctt tacccatctg aacattaaac cgaagaaaat 4860
caatctgacc gcagccaaca aaattccgaa agccatgatt gatgagttta ttctgagtcc 4920
ggttgtgaaa cgtacctttg gtcaggcaat taacctgatc aacaaaatca ttgaaaaata 4980
tggcgtgcct gaggatatca ttattgaact ggcacgtgaa aacaacagca aagataaaca 5040
gaaattcatc aacgagatgc agaagaagaa cgaaaatacc cgcaaacgga ttaacgagat 5100
cattggcaaa tatggtaatc agaatgccaa acgcctggtg gaaaaaattc gtctgcatga 5160
tgaacaagag ggcaaatgtc tgtatagcct ggaaagcatt cctctggaag atctgctgaa 5220
caatccgaat cattatgaag tggatcacat tattccgcgt agcgtgagct ttgataattc 5280
ctatcataat aaagtgctgg tgaaacagag cgaaaactcc aaaaaatcca acctgacacc 5340
gtatcagtat ttcaatagcg gcaaatccaa actgagctac aaccagttta aacagcatat 5400
tctgaacctg agcaaaagcc aggatcgcat cagcaagaag aagaaggagt acctgctgga 5460
agaacgcgac atcaacaaat ttgaagtgca gaaagaattt atcaaccgca acctggttga 5520
tacccgttat gcaacccgtg aactgaccaa ttatctgaaa gcatatttca gcgccaacaa 5580
catgaacgtg aaagtgaaaa cgattaacgg cagctttacc gattatctgc gtaaagtgtg 5640
gaaattcaaa aaagaacgca accacggcta taaacatcat gccgaagatg ccctgattat 5700
tgcaaatgca gatttcctgt ttaaagaaaa caaaaaactg aaagccgtca acagcgtgct 5760
ggaaaaaccg gaaattgaga caaaacagct ggacattcag gttgatagcg aagataatta 5820
cagcgaaatg tttatcatcc cgaaacaggt gcaggatatc aaagattttc gcaacttcaa 5880
atatagccac cgcgttgaca aaaaacctaa tcgtcagctg attaacgata ccctgtatag 5940
cacccgcaaa aaagataaca gcacctatat tgtgcagacc attaaagaca tctacgccaa 6000
agataatacc accctgaaaa aacagttcga caaaagccca gaaaaatttc tgatgtatca 6060
gcatgatccg cgtaccttcg aaaaactgga agttattatg aaacagtatg ccaacgagaa 6120
aaatccgctg gccaaatatc acgaagaaac cggtgaatat ctgaccaaat attccaagaa 6180
gaacaacggt ccgatcgtta aatccctgaa atatatcggt aataaactgg gcagccatct 6240
ggatgttacc catcagttta aaagctccac aaagaagctg gttaaactgt ccatcaaacc 6300
gtatcgcttt gatgtgtatc tgaccgacaa aggctataaa ttcattacca tcagctatct 6360
ggacgtgctg aaaaaagaca actattatta tatcccggaa cagaaatatg ataaactgaa 6420
actgggtaaa gccatcgata aaaacgccaa atttatcgcc agcttctaca aaaacgacct 6480
gattaaactg gatggcgaga tctataaaat catcggtgtt aatagcgaca cccgcaatat 6540
gattgagctg gatctgccgg atattcgcta taaagaatat tgcgaactga acaacattaa 6600
aggcgaaccg cgtatcaaaa agaccatcgg caaaaaagtg aatagcatcg agaaactgac 6660
caccgatgtt ctgggtaatg tgtttaccaa tacccagtat accaaacctc agctgctgtt 6720
caaacgcggt aatggcggag gatctggccc ccctaagaaa aagcggaagg tg 6772
<210> 20
<211> 2192
<212> DNA
<213> 人工序列
<220>
<223> 如在原始PAM鉴定测定中使用的用于Shy-VEGFA sgRNA构建体的细菌sgRNA转录载体(T7-启动的VEGFA sgRNA转录和卡那霉素抗性)
<400> 20
ccactgtaga agagcaaatg ccacctgacg tctaagaaat tcgcgttaaa tttttgttaa 60
atcagctcat tttttaacca ataggccgaa atcggcaaaa tcccttataa atcaaaagaa 120
tagaccgaga tagggttgag tggccgctac actagggcgc gtctaatacg actcactata 180
ggaccccctc caccccgcct cgttttagta ctctggaaac agaatctact aaaacaagac 240
tatatgtcgt gtttatccca ctaatttatt agtgggaatt tttttgtttt agcataaccc 300
cttggggcct ctaaacgggt cttgaggggt tttttgtcac tgcccgcttt ccagtcggga 360
aacctgtcgt gccagctgca ttaatgaatc gttcgtcaga actgcttacg cggtttgtca 420
ctcggtcgct acgctccggg cgtgagactg cggcgggcgc tgcggacaca tacaaagtta 480
cccacagatt ccgtggataa gcaggggact aacatgtgag gcaaaacagc agggccgcgc 540
cggtggcgtt tttccatagg ctccgccctc ctgccagagt tcacataaac agacgctttt 600
ccggtgcatc tgtgggagcc gtgaggctca accatgaatc tgacagtacg ggcgaaaccc 660
gacaggactt aaagatcccc accgtttccg gcgggtcgct ccctcttgcg ctctcctgtt 720
ccgaccctgc cgtttaccgg atacctgttc cgcctttctc ccttacggga agtgtggcgc 780
tttctcatag ctcacacact ggtatctcgg ctcggtgtag gtcgttcgct ccaagctggg 840
ctgtaagcaa gaactccccg ttcagcccga ctgctgcgcc ttatccggta actgttcact 900
tgagtccaac ccggaaaagc acggtaaaac gccactggca gcagccattg gtaactggga 960
gttcgcagag gatttgttta gctaaacacg cggttgctct tgaagtgtgc gccaaagtcc 1020
ggctacactg gaaggacaga tttggttgct gtgctctgcg aaagccagtt accacggtta 1080
agcagttccc caactgactt aaccttcgat caaaccacct ccccaggtgg ttttttcgtt 1140
tacagggcaa aagattacgc gcagaaaaaa aggatctcaa gaagatcctt tgatcttttc 1200
tactgaaccg ctcaatctaa agtatatatg agtaaacttg gtctgacagt tattagaaaa 1260
actcatcgag catcaaatga aactgcaatt tattcatatc aggattatca ataccatatt 1320
tttgaaaaag ccgtttctgt aatgaaggag aaaactcacc gaggcagttc cataggatgg 1380
caagatcctg gtatcggtct gcgattccga ctcgtccaac atcaatacaa cctattaatt 1440
tcccctcgtc aaaaataagg ttatcaagtg agaaatcacc atgagtgacg actgaatccg 1500
gtgagaatgg caaaagttta tgcatttctt tccagacttg ttcaacaggc cagccattac 1560
gctcgtcatc aaaatcactc gcatcaacca aaccgttatt cattcgtgat tgcgcctgag 1620
cgagacgaaa tacgcgatcg ctgttaaaag gacaattaca aacaggaatc gaatgcaacc 1680
ggcgcaggaa cactgccagc gcatcaacaa tattttcacc tgaatcagga tattcttcta 1740
atacctggaa tgctgttttc ccggggatcg cagtggtgag taaccatgca tcatcaggag 1800
tacggataaa atgcttgatg gtcggaagag gcataaattc cgtcagccag tttagtctga 1860
ccatctcatc tgtaacatca ttggcaacgc tacctttgcc atgtttcaga aacaactctg 1920
gcgcatcggg cttcccatac aatcgataga ttgtcgcacc tgattgcccg acattatcgc 1980
gagcccattt atacccatat aaatcagcat ccatgttgga atttaatcgc ggcctagagc 2040
aagacgtttc ccgttgaata tggctcatac tcttcctttt tcaatattat tgaagcattt 2100
atcagggtta ttgtctcatg agcggataca tatttgaatg tatttagaaa aataaacaaa 2160
taggggttcc gcgcacattt ccccgaaaag tg 2192
<210> 21
<211> 2188
<212> DNA
<213> 人工序列
<220>
<223> 如在PAM、体外切割、ODN切割和RNP转染实验中使用的用于Slu-VEGFA sgRNA构建体的细菌sgRNA转录载体(T7-启动的VEGFA sgRNA转录和卡那霉素抗性)
<400> 21
ccactgtaga agagcaaatg ccacctgacg tctaagaaat tcgcgttaaa tttttgttaa 60
atcagctcat tttttaacca ataggccgaa atcggcaaaa tcccttataa atcaaaagaa 120
tagaccgaga tagggttgag tggccgctac actagggcgc gtctaatacg actcactata 180
ggaccccctc caccccgcct cgttttagta ctctggaaac agaatctact gaaacaagac 240
aatatgtcgt gtttatccca tcaatttatt ggtgggattt ttttctagca taaccccttg 300
gggcctctaa acgggtcttg aggggttttt tgtcactgcc cgctttccag tcgggaaacc 360
tgtcgtgcca gctgcattaa tgaatcgttc gtcagaactg cttacgcggt ttgtcactcg 420
gtcgctacgc tccgggcgtg agactgcggc gggcgctgcg gacacataca aagttaccca 480
cagattccgt ggataagcag gggactaaca tgtgaggcaa aacagcaggg ccgcgccggt 540
ggcgtttttc cataggctcc gccctcctgc cagagttcac ataaacagac gcttttccgg 600
tgcatctgtg ggagccgtga ggctcaacca tgaatctgac agtacgggcg aaacccgaca 660
ggacttaaag atccccaccg tttccggcgg gtcgctccct cttgcgctct cctgttccga 720
ccctgccgtt taccggatac ctgttccgcc tttctccctt acgggaagtg tggcgctttc 780
tcatagctca cacactggta tctcggctcg gtgtaggtcg ttcgctccaa gctgggctgt 840
aagcaagaac tccccgttca gcccgactgc tgcgccttat ccggtaactg ttcacttgag 900
tccaacccgg aaaagcacgg taaaacgcca ctggcagcag ccattggtaa ctgggagttc 960
gcagaggatt tgtttagcta aacacgcggt tgctcttgaa gtgtgcgcca aagtccggct 1020
acactggaag gacagatttg gttgctgtgc tctgcgaaag ccagttacca cggttaagca 1080
gttccccaac tgacttaacc ttcgatcaaa ccacctcccc aggtggtttt ttcgtttaca 1140
gggcaaaaga ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctact 1200
gaaccgctca atctaaagta tatatgagta aacttggtct gacagttatt agaaaaactc 1260
atcgagcatc aaatgaaact gcaatttatt catatcagga ttatcaatac catatttttg 1320
aaaaagccgt ttctgtaatg aaggagaaaa ctcaccgagg cagttccata ggatggcaag 1380
atcctggtat cggtctgcga ttccgactcg tccaacatca atacaaccta ttaatttccc 1440
ctcgtcaaaa ataaggttat caagtgagaa atcaccatga gtgacgactg aatccggtga 1500
gaatggcaaa agtttatgca tttctttcca gacttgttca acaggccagc cattacgctc 1560
gtcatcaaaa tcactcgcat caaccaaacc gttattcatt cgtgattgcg cctgagcgag 1620
acgaaatacg cgatcgctgt taaaaggaca attacaaaca ggaatcgaat gcaaccggcg 1680
caggaacact gccagcgcat caacaatatt ttcacctgaa tcaggatatt cttctaatac 1740
ctggaatgct gttttcccgg ggatcgcagt ggtgagtaac catgcatcat caggagtacg 1800
gataaaatgc ttgatggtcg gaagaggcat aaattccgtc agccagttta gtctgaccat 1860
ctcatctgta acatcattgg caacgctacc tttgccatgt ttcagaaaca actctggcgc 1920
atcgggcttc ccatacaatc gatagattgt cgcacctgat tgcccgacat tatcgcgagc 1980
ccatttatac ccatataaat cagcatccat gttggaattt aatcgcggcc tagagcaaga 2040
cgtttcccgt tgaatatggc tcatactctt cctttttcaa tattattgaa gcatttatca 2100
gggttattgt ctcatgagcg gatacatatt tgaatgtatt tagaaaaata aacaaatagg 2160
ggttccgcgc acatttcccc gaaaagtg 2188
<210> 22
<211> 3922
<212> DNA
<213> 人工序列
<220>
<223> PAM文库质粒。具有7个随机化核苷酸的VEGFA-靶序列。氯霉素抗性和阿拉伯糖诱导型RFP表达盒。用于PAM缺失实验。
<220>
<221> variation
<222> 3076..3082
<223> /注释=位置3076..3082中的"n"代表序列中鉴定合适的PAM序列的可变(随机化)区域"
<400> 22
tcaatctaaa gtatatatga gtaaacttgg tctgacagtt attacgcccc gccctgccac 60
tcatcgcagt actgttgtaa ttcattaagc attctgccga catggaagcc atcacaaacg 120
gcatgatgaa cctgaatcgc cagcggcatc agcaccttgt cgccttgcgt ataatatttg 180
cccaaggtga aaacgggggc gaagaagttg tccatattgg ccacgtttaa atcaaaactg 240
gtgaaactca cccagggatt ggctgagacg aaaaacatat tctcaataaa ccctttaggg 300
aaataggcca ggttttcacc gtaacacgcc acatcttgcg aatatatgtg tagaaactgc 360
cggaaatcgt cgtggtattc actccagagc gatgaaaacg tttcagtttg ctcatggaaa 420
acggtgtaac aagggtgaac actatcccat atcaccagct caccgtcttt cattgccata 480
cgtaattccg gatgagcatt catcaggcgg gcaagaatgt gaataaaggc cggataaaac 540
ttgtgcttat ttttctttac ggtctttaaa aaggccgtaa tatccagctg aacggtctgg 600
ttataggtac attgagcaac tgactgaaat gcctcaaaat gttctttacg atgccattgg 660
gatatatcaa cggtggtata tccagtgatt tttttctcca tactcttcct ttttcaatat 720
tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga atgtatttag 780
aaaaataaac aaataggggt tccgcgcaca tttccccgaa aagtgccact tatgacaact 840
tgacggctac atcattcact ttttcttcac aaccggcacg gaactcgctc gggctggccc 900
cggtgcattt tttaaatacc cgcgagaaat agagttgatc gtcaaaacca acattgcgac 960
cgacggtggc gataggcatc cgggtggtgc tcaaaagcag cttcgcctgg ctgatacgtt 1020
ggtcctcgcg ccagcttaag acgctaatcc ctaactgctg gcggaaaaga tgtgacagac 1080
gcgacggcga caagcaaaca tgctgtgcga cgctggcgat atcaaaattg ctgtctgcca 1140
ggtgatcgct gatgtactga caagcctcgc gtacccgatt atccatcggt ggatggagcg 1200
actcgttaat cgcttccatg cgccgcagta acaattgctc aagcagattt atcgccagca 1260
gctccgaata gcgcccttcc ccttgcccgg cgttaatgat ttgcccaaac aggtcgctga 1320
aatgcggctg gtgcgcttca tccgggcgaa agaaccccgt attggcaaat attgacggcc 1380
agttaagcca ttcatgccag taggcgcgcg gacgaaagta aacccactgg tgataccatt 1440
cgcgagcctc cggatgacga ccgtagtgat gaatctctcc tggcgggaac agcaaaatat 1500
cacccggtcg gcaaacaaat tctcgtccct gatttttcac caccccctga ccgcgaatgg 1560
tgagattgag aatataacct ttcattccca gcggtcggtc gataaaaaaa tcgagataac 1620
cgttggcctc aatcggcgtt aaacccgcca ccagatgggc attaaacgag tatcccggca 1680
gcaggggatc attttgcgct tcagccatac ttttcatact cccgccattc agagaagaaa 1740
ccaattgtcc atattgcatc agacattgcc gtcactgcgt cttttactgg ctcttctcgc 1800
taaccaaacc ggtaaccccg cttattaaaa gcattctgta acaaagcggg accaaagcca 1860
tgacaaaaac gcgtaacaaa agtgtctata atcacggcag aaaagtccac attgattatt 1920
tgcacggcgt cacactttgc tatgccatag catttttatc cataagatta gcggatccta 1980
cctgacgctt tttatcgcaa ctctctactg tttctccata cccgtttttt gggctaacag 2040
gaggaattaa atggtgagca aaggtgagga actgatcaaa gaaaacatgc atatgaaact 2100
gtacatggaa ggcaccgtga ataaccatca ctttaaatgt accagcgaag gtgaaggtaa 2160
accgtatgaa ggcacccaga ccatgcgtat taaagttgtt gaaggtggtc cgctgccgtt 2220
tgcatttgat attctggcaa ccagctttat gtatggtagc cgtaccttta ttaaccatac 2280
ccagggtatt ccggatttct ttaaacagag ctttccggaa ggttttacct gggaacgtgt 2340
taccacctat gaagatggtg gtgttctgac cgcaacccag gataccagtc tgcaggatgg 2400
ttgtctgatt tataatgtga aaattcgcgg tgtgaacttt ccgagcaatg gtccggttat 2460
gcagaaaaaa accctgggtt gggaagcaaa taccgaaatg ctgtatccgg cagatggtgg 2520
cctggaaggt cgtagcgata tggcactgaa actggttggt ggtggtcatc tgatttgtaa 2580
ctttaaaacc acctatcgca gcaaaaaacc tgccaaaaat ctgaaaatgc ctggcgtgta 2640
ttatgtggat catcgtctgg aacgcattaa agaagcagat aaagaaacct atgtggaaca 2700
gcatgaagtt gcagttgcac gttattgtga tctgccgagc aaactgggtc ataaactgaa 2760
tagcggtctg cgtagccgtg cacaggcaag caatagcgca gttgatggca ccgcaggtcc 2820
gggtagcacc ggtagtcgcg gtggtggtag cggtgcagca aatgatgaaa attatgcact 2880
ggcagcctga taatgcctgg cggcagtagc gcggtggtcc cacctgaccc catgccgaac 2940
tcagaagtga aacgccgtag cgccgatggt agtgtgggct ctccccatgc gagagtaggg 3000
aactgccagg catcaaataa aacgaaaggc tcagtcgaaa gactgggcct tataggaccc 3060
cctccacccc gcctcnnnnn nncaacgatc gtttaatttg tttttgtcac tcggtcgcta 3120
cgctccgggc gtgagactgc ggcgggctct tccgcttcct cgctcactga ctcgctacgc 3180
tcggtcgttc gactgcggcg agcggtgtca gctcactcaa aagcggtaat acggttatcc 3240
acagaatcag gggataaagc cggaaagaac atgtgagcaa aaagcaaagc accggaagaa 3300
gccaacgccg caggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg 3360
acgctcaagc cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc 3420
tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc 3480
ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgttggt atctcagttc 3540
ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg 3600
ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc 3660
actggcagca gccattggta actgatttag aggactttgt cttgaagtta tgcacctgtt 3720
aaggctaaac tgaaagaaca gattttggtg agtgcggtcc tccaacccac ttaccttggt 3780
tcaaagagtt ggtagctcag cgaaccttga gaaaaccacc gttggtagcg gtggtttttc 3840
tttatttatg agatgatgaa tcaatcggtc tatcaagtca acgaacagct attccgttac 3900
tctagatttt ctactgaacc gc 3922
<210> 23
<211> 3914
<212> DNA
<213> 人工序列
<220>
<223> 用于产生在体外PCR切割测定中切割的个别PAM序列的VEGFA靶序列。氯霉素抗性和阿拉伯糖诱导型RFP表达盒。
<400> 23
tcaatctaaa gtatatatga gtaaacttgg tctgacagtt attacgcccc gccctgccac 60
tcatcgcagt actgttgtaa ttcattaagc attctgccga catggaagcc atcacaaacg 120
gcatgatgaa cctgaatcgc cagcggcatc agcaccttgt cgccttgcgt ataatatttg 180
cccaaggtga aaacgggggc gaagaagttg tccatattgg ccacgtttaa atcaaaactg 240
gtgaaactca cccagggatt ggctgagacg aaaaacatat tctcaataaa ccctttaggg 300
aaataggcca ggttttcacc gtaacacgcc acatcttgcg aatatatgtg tagaaactgc 360
cggaaatcgt cgtggtattc actccagagc gatgaaaacg tttcagtttg ctcatggaaa 420
acggtgtaac aagggtgaac actatcccat atcaccagct caccgtcttt cattgccata 480
cgtaattccg gatgagcatt catcaggcgg gcaagaatgt gaataaaggc cggataaaac 540
ttgtgcttat ttttctttac ggtctttaaa aaggccgtaa tatccagctg aacggtctgg 600
ttataggtac attgagcaac tgactgaaat gcctcaaaat gttctttacg atgccattgg 660
gatatatcaa cggtggtata tccagtgatt tttttctcca tactcttcct ttttcaatat 720
tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga atgtatttag 780
aaaaataaac aaataggggt tccgcgcaca tttccccgaa aagtgccact tatgacaact 840
tgacggctac atcattcact ttttcttcac aaccggcacg gaactcgctc gggctggccc 900
cggtgcattt tttaaatacc cgcgagaaat agagttgatc gtcaaaacca acattgcgac 960
cgacggtggc gataggcatc cgggtggtgc tcaaaagcag cttcgcctgg ctgatacgtt 1020
ggtcctcgcg ccagcttaag acgctaatcc ctaactgctg gcggaaaaga tgtgacagac 1080
gcgacggcga caagcaaaca tgctgtgcga cgctggcgat atcaaaattg ctgtctgcca 1140
ggtgatcgct gatgtactga caagcctcgc gtacccgatt atccatcggt ggatggagcg 1200
actcgttaat cgcttccatg cgccgcagta acaattgctc aagcagattt atcgccagca 1260
gctccgaata gcgcccttcc ccttgcccgg cgttaatgat ttgcccaaac aggtcgctga 1320
aatgcggctg gtgcgcttca tccgggcgaa agaaccccgt attggcaaat attgacggcc 1380
agttaagcca ttcatgccag taggcgcgcg gacgaaagta aacccactgg tgataccatt 1440
cgcgagcctc cggatgacga ccgtagtgat gaatctctcc tggcgggaac agcaaaatat 1500
cacccggtcg gcaaacaaat tctcgtccct gatttttcac caccccctga ccgcgaatgg 1560
tgagattgag aatataacct ttcattccca gcggtcggtc gataaaaaaa tcgagataac 1620
cgttggcctc aatcggcgtt aaacccgcca ccagatgggc attaaacgag tatcccggca 1680
gcaggggatc attttgcgct tcagccatac ttttcatact cccgccattc agagaagaaa 1740
ccaattgtcc atattgcatc agacattgcc gtcactgcgt cttttactgg ctcttctcgc 1800
taaccaaacc ggtaaccccg cttattaaaa gcattctgta acaaagcggg accaaagcca 1860
tgacaaaaac gcgtaacaaa agtgtctata atcacggcag aaaagtccac attgattatt 1920
tgcacggcgt cacactttgc tatgccatag catttttatc cataagatta gcggatccta 1980
cctgacgctt tttatcgcaa ctctctactg tttctccata cccgtttttt gggctaacag 2040
gaggaattaa atggtgagca aaggtgagga actgatcaaa gaaaacatgc atatgaaact 2100
gtacatggaa ggcaccgtga ataaccatca ctttaaatgt accagcgaag gtgaaggtaa 2160
accgtatgaa ggcacccaga ccatgcgtat taaagttgtt gaaggtggtc cgctgccgtt 2220
tgcatttgat attctggcaa ccagctttat gtatggtagc cgtaccttta ttaaccatac 2280
ccagggtatt ccggatttct ttaaacagag ctttccggaa ggttttacct gggaacgtgt 2340
taccacctat gaagatggtg gtgttctgac cgcaacccag gataccagtc tgcaggatgg 2400
ttgtctgatt tataatgtga aaattcgcgg tgtgaacttt ccgagcaatg gtccggttat 2460
gcagaaaaaa accctgggtt gggaagcaaa taccgaaatg ctgtatccgg cagatggtgg 2520
cctggaaggt cgtagcgata tggcactgaa actggttggt ggtggtcatc tgatttgtaa 2580
ctttaaaacc acctatcgca gcaaaaaacc tgccaaaaat ctgaaaatgc ctggcgtgta 2640
ttatgtggat catcgtctgg aacgcattaa agaagcagat aaagaaacct atgtggaaca 2700
gcatgaagtt gcagttgcac gttattgtga tctgccgagc aaactgggtc ataaactgaa 2760
tagcggtctg cgtagccgtg cacaggcaag caatagcgca gttgatggca ccgcaggtcc 2820
gggtagcacc ggtagtcgcg gtggtggtag cggtgcagca aatgatgaaa attatgcact 2880
ggcagcctga taatgcctgg cggcagtagc gcggtggtcc cacctgaccc catgccgaac 2940
tcagaagtga aacgccgtag cgccgatggt agtgtgggct ctccccatgc gagagtaggg 3000
aactgccagg catcaaataa aacgaaaggc tcagtcgaaa gactgggcct tataggaccc 3060
cctccacccc gcctcccggc ccgtttaatt tgtttttgtc actcggtcgc tacgctccgg 3120
gcgtgagact gcggcgggct cttccgcttc ctcgctcact gactcgctac gctcggtcgt 3180
tcgactgcgg cgagcggtgt cagctcactc aaaagcggta atacggttat ccacagaatc 3240
aggggataaa gccggaaaga acatgtgagc aaaaagcaaa gcaccggaag aagccaacgc 3300
cgcaggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat cgacgctcaa 3360
gccagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc cctggaagct 3420
ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc gcctttctcc 3480
cttcgggaag cgtggcgctt tctcatagct cacgctgttg gtatctcagt tcggtgtagg 3540
tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac cgctgcgcct 3600
tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg ccactggcag 3660
cagccattgg taactgattt agaggacttt gtcttgaagt tatgcacctg ttaaggctaa 3720
actgaaagaa cagattttgg tgagtgcggt cctccaaccc acttaccttg gttcaaagag 3780
ttggtagctc agcgaacctt gagaaaacca ccgttggtag cggtggtttt tctttattta 3840
tgagatgatg aatcaatcgg tctatcaagt caacgaacag ctattccgtt actctagatt 3900
ttctactgaa ccgc 3914
<210> 24
<211> 6740
<212> DNA
<213> 人工序列
<220>
<223> SluCas9的表达载体(具有C-末端6xHis-标签、N-末端和C-末端位置中20个氨基酸的核定位肽和AMP-抗性的Trc-启动的SluCas9表达,pUC-起源)用于表达和纯化
<400> 24
ggtggaagcg gaggcagcgg gggatcaggc catcatcatc accatcatta atgaacgggt 60
cttgaggggt tttttggact tttgcgtatt gggcgctctt ccgcttcctc gctcactgac 120
tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa ggcggtaata 180
cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa 240
aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct ccgcccccct 300
gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac aggactataa 360
agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg 420
cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc tcatagctca 480
cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa 540
ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga gtccaacccg 600
gtaagacacg acttatcgcc actggcagca gccactggta acaggattag cagagcgagg 660
tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta cactagaagg 720
acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag agttggtagc 780
tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg caagcagcag 840
attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac ggggtctgac 900
gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc aaaaaggatc 960
ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag tatatatgag 1020
taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc agcgatctgt 1080
ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac gatacgggag 1140
ggcttaccat ctggccccag tgctgcaatg ataccgcgag atccacgctc accggctcca 1200
gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg tcctgcaact 1260
ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag tagttcgcca 1320
gttaatagtt tgcgcaacgt tgttgccatt gctgcaggca tcgtggtgtc acgctcgtcg 1380
tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac atgatccccc 1440
atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag aagtaagttg 1500
gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac tgtcatgcca 1560
tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg agaatagtgt 1620
atgcggcgac cgagttgctc ttgcccggcg tcaatacggg ataataccgc gccacatagc 1680
agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc 1740
ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg atcttcagca 1800
tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa 1860
aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt tcaatattat 1920
tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg tatttagaaa 1980
aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccactcct cttgctgtga 2040
ccgtctccgg gagctgcatg tgtcagaggt tttcaccgtc atcaccgaaa cgcgcgaggc 2100
agcagatcaa ttcgcgcgcg aaggcgaagc ggcatgcatt tacgttgaca ccatcgaatg 2160
gtgcaaaacc tttcgcggta tggcatgata gcgcccggaa gagagtcaat tcagggtggt 2220
gaatgtgaaa ccagtaacgt tatacgatgt cgcagagtat gccggtgtct cttatcagac 2280
cgtttcccgc gtggtgaacc aggccagcca cgtttctgcg aaaacgcggg aaaaagtgga 2340
agcggcgatg gcggagctga attacattcc caaccgcgtg gcacaacaac tggcgggcaa 2400
acagtcgttg ctgattggcg ttgccacctc cagtctggcc ctgcacgcgc cgtcgcaaat 2460
tgtcgcggcg attaaatctc gcgccgatca actgggtgcc agcgtggtgg tgtcgatggt 2520
agaacgaagc ggcgtcgaag cctgtaaagc ggcggtgcac aatcttctcg cgcaacgcgt 2580
cagtgggctg atcattaact atccgctgga tgaccaggat gccattgctg tggaagctgc 2640
ctgcactaat gttccggcgt tatttcttga tgtctctgac cagacaccca tcaacagtat 2700
tattttctcc catgaagatg gtacgcgact gggcgtggag catctggtcg cattgggtca 2760
ccagcaaatc gcgctgttag cgggcccatt aagttctgtc tcggcgcgtc tgcgtctggc 2820
tggctggcat aaatatctca ctcgcaatca aattcagccg atagcggaac gggaaggcga 2880
ctggagtgcc atgtccggtt ttcaacaaac catgcaaatg ctgaatgagg gcatcgttcc 2940
cactgcgatg ctggttgcca acgatcagat ggcgctgggc gcaatgcgcg ccattaccga 3000
gtccgggctg cgcgttggtg cggatatctc ggtagtggga tacgacgata ccgaagatag 3060
ctcatgttat atcccgccgt taaccaccat caaacaggat tttcgcctgc tggggcaaac 3120
cagcgtggac cgcttgctgc aactctctca gggccaggcg gtgaagggca atcagctgtt 3180
gcccgtctca ctggtgaaaa gaaaaaccac cctggcgccc aatacgcaaa ccgcctctcc 3240
ccgcgcgttg gccgattcat taatgcagct ggcacgacag gtttcccgac tggaaagcgg 3300
gcagtgagcg caatattctg aaatgagctg ttgacaatta atcatccggc tcgtataatg 3360
tgtggaattg tgagcggata acaattttca cacaggaaac agaattctag cattgtgagc 3420
ggataacaat tcccctctag aaataatttt gtttaacttt aagaaggaga tataccatga 3480
aacgtccggc agcaaccaaa aaagcaggtc aggccaagaa aaaaaaaggt ggtggttcag 3540
gtaaccagaa atttatcctg ggtctggata ttggtattac cagcgttggt tatggcctga 3600
ttgattacga aaccaaaaac attattgatg ccggtgttcg tctgtttccg gaagcaaatg 3660
ttgaaaataa tgaaggtcgt cgtagcaaac gtggtagccg tcgtctgaaa cgtcgtcgta 3720
ttcatcgtct ggaacgtgtt aaaaaactgc tggaagatta taacctgctg gatcagagcc 3780
agattccgca gagcaccaat ccgtatgcaa ttcgtgttaa aggtctgagc gaagcactga 3840
gcaaagatga actggttatt gcactgctgc atattgcaaa acgccgtggc attcataaaa 3900
tcgatgtgat tgatagcaat gacgatgtgg gtaatgaact gagcaccaaa gaacagctga 3960
acaaaaatag caaactgctg aaagacaaat tcgtgtgtca gattcagctg gaacgtatga 4020
atgaaggcca ggttcgtggt gaaaagaatc gctttaaaac cgcagacatc atcaaagaaa 4080
ttatccagct gctgaacgtg cagaaaaact tccatcagct ggatgaaaac ttcatcaaca 4140
aatacatcga gctggttgaa atgcgtcgcg aatattttga aggtccgggt aaaggtagcc 4200
cgtatggttg ggaaggtgat ccgaaagcat ggtatgaaac cctgatgggt cattgtacct 4260
attttccgga tgaactgcgt agcgttaaat atgcctatag cgcagacctg tttaatgcac 4320
tgaatgatct gaataacctg gtgattcagc gtgatggtct gagcaaactg gaatatcatg 4380
agaaatatca catcatcgaa aacgtgttca aacagaagaa gaaaccgacc ctgaaacaaa 4440
tcgccaacga aattaatgtg aacccggaag atattaaagg ctaccgtatt accaaaagcg 4500
gtaaaccgca gttcaccgaa tttaaactgt atcacgatct gaaaagcgtg ctgtttgatc 4560
agagcattct ggaaaatgaa gatgtgctgg accagattgc agaaattctg accatttatc 4620
aggacaaaga cagcatcaaa agcaaactga ccgaactgga tattctgctg aatgaagaag 4680
ataaagagaa cattgcacag ctgaccggtt ataccggcac ccatcgtctg agcctgaaat 4740
gtattcgtct ggtactggaa gaacagtggt atagcagccg taatcagatg gaaatcttta 4800
cccatctgaa cattaaaccg aagaaaatca atctgaccgc agccaacaaa attccgaaag 4860
ccatgattga tgagtttatt ctgagtccgg ttgtgaaacg tacctttggt caggcaatta 4920
acctgatcaa caaaatcatt gaaaaatatg gcgtgcctga ggatatcatt attgaactgg 4980
cacgtgaaaa caacagcaaa gataaacaga aattcatcaa cgagatgcag aagaagaacg 5040
aaaatacccg caaacggatt aacgagatca ttggcaaata tggtaatcag aatgccaaac 5100
gcctggtgga aaaaattcgt ctgcatgatg aacaagaggg caaatgtctg tatagcctgg 5160
aaagcattcc tctggaagat ctgctgaaca atccgaatca ttatgaagtg gatcacatta 5220
ttccgcgtag cgtgagcttt gataattcct atcataataa agtgctggtg aaacagagcg 5280
aaaactccaa aaaatccaac ctgacaccgt atcagtattt caatagcggc aaatccaaac 5340
tgagctacaa ccagtttaaa cagcatattc tgaacctgag caaaagccag gatcgcatca 5400
gcaagaagaa gaaggagtac ctgctggaag aacgcgacat caacaaattt gaagtgcaga 5460
aagaatttat caaccgcaac ctggttgata cccgttatgc aacccgtgaa ctgaccaatt 5520
atctgaaagc atatttcagc gccaacaaca tgaacgtgaa agtgaaaacg attaacggca 5580
gctttaccga ttatctgcgt aaagtgtgga aattcaaaaa agaacgcaac cacggctata 5640
aacatcatgc cgaagatgcc ctgattattg caaatgcaga tttcctgttt aaagaaaaca 5700
aaaaactgaa agccgtcaac agcgtgctgg aaaaaccgga aattgagaca aaacagctgg 5760
acattcaggt tgatagcgaa gataattaca gcgaaatgtt tatcatcccg aaacaggtgc 5820
aggatatcaa agattttcgc aacttcaaat atagccaccg cgttgacaaa aaacctaatc 5880
gtcagctgat taacgatacc ctgtatagca cccgcaaaaa agataacagc acctatattg 5940
tgcagaccat taaagacatc tacgccaaag ataataccac cctgaaaaaa cagttcgaca 6000
aaagcccaga aaaatttctg atgtatcagc atgatccgcg taccttcgaa aaactggaag 6060
ttattatgaa acagtatgcc aacgagaaaa atccgctggc caaatatcac gaagaaaccg 6120
gtgaatatct gaccaaatat tccaagaaga acaacggtcc gatcgttaaa tccctgaaat 6180
atatcggtaa taaactgggc agccatctgg atgttaccca tcagtttaaa agctccacaa 6240
agaagctggt taaactgtcc atcaaaccgt atcgctttga tgtgtatctg accgacaaag 6300
gctataaatt cattaccatc agctatctgg acgtgctgaa aaaagacaac tattattata 6360
tcccggaaca gaaatatgat aaactgaaac tgggtaaagc catcgataaa aacgccaaat 6420
ttatcgccag cttctacaaa aacgacctga ttaaactgga tggcgagatc tataaaatca 6480
tcggtgttaa tagcgacacc cgcaatatga ttgagctgga tctgccggat attcgctata 6540
aagaatattg cgaactgaac aacattaaag gcgaaccgcg tatcaaaaag accatcggca 6600
aaaaagtgaa tagcatcgag aaactgacca ccgatgttct gggtaatgtg tttaccaata 6660
cccagtatac caaacctcag ctgctgttca aacgcggtaa tggcggagga tctggccccc 6720
ctaagaaaaa gcggaaggtg 6740
<210> 25
<211> 9489
<212> DNA
<213> 人工序列
<220>
<223> 阿拉伯糖诱导型ccdb基因表达,氯霉素抗性和具有NNGG PAM的VEGFA靶位点.
<400> 25
ccggtgatac cacgatacta tgactgagag tcaacgccat gagcggcctc atttcttatt 60
ctgagttaca acagtccgca ccgctgccgg tagctattga ctatccggct gcactagccc 120
tgcgtcagat ggctctgatc caaggcaaac tgccaaaata tctgctggca ccggaagtca 180
gcgccctgca ccattatgtt ccggatctgc atcgcaggat gctgctggct accctgtgga 240
acacctacat ctgtattaac gaagcgctgg cattgaccct gagtgatttt tctctggtgc 300
cgccctatcc ctttgtgcag cttgccacgc tcaaaggggt ttgaggtcca accgtacgaa 360
aacgtacggt aagaggaaaa ttatcgtctg aaaaatcgat tagtagacaa gaaagtccgt 420
taagtgccaa ttttcgatta aaaagacacc gttttgatgg cgttttccaa tgtacattat 480
gtttcgatat atcagacagt tacttcacta acgtacgttt tcgttctatt ggccttcaga 540
ccccatatcc ttaatgtcct ttatttgctg gggttatcag atccccccga cacgtttaat 600
taatgctttc tccgccggag atcgacgcac agcgttctgt gctctatgat gttatttctt 660
aataatcatc caggtattct ctttatcacc atacgtagtg cgagtgtcca ccttaacgca 720
gggctttccg tcacagcgcg atatgtcagc cagcggggct ttcttttgcc agaccgcttc 780
catcctctgc atttcagcaa tctggctata cccgtcattc ataaaccacg taaatgccgt 840
cacgcaggaa gccaggacga agaatatcgt cagtacaaga taaatcgcgg atttccacgt 900
atagcgtgac atctcacgac gcatttcatg gatcatcgct ttcgccgtat cggcagcctg 960
attcagcgct tctgtcgccg gtttctgctg tgctaatccg gcttgtttca gttctttctc 1020
aacctgagtg agcgcggaac tcaccgattt cctgacggtg tcagtcatat taccggacgc 1080
gctgtccagc tcacgaatga ccctgctcag cgtttcactt tgctgctgta attgtgatga 1140
ggcggcctga aactgttctg tcagagaagt aacacgcttt tccagcgcct gatgatgccc 1200
gataagggcg gcaatttgtt taatttcgtc gctcatacaa aatcctgcct atcgtgagaa 1260
tgaccagcct ttatccggct tctgtcgtat ctgttcggcg agtcgctgtc gttctttctc 1320
ctgctgacgc tgtttttccg ccagacgttc gcgctctctc tgcctttcca tctcctgatg 1380
tatcccctgg aactccgcca tcgcatcgtt aacaagggac tgaagatcga tttcttcctg 1440
tatatccttc atggcatcac tgaccagtgc gttcagcttg tcaggctctt tttcaaaatc 1500
aaacgttctg ccggaatggg attcctgctc aggctctgac ttcagctcct gttttagcgt 1560
cagagtatcc ctctcgctga gggcttcccg taacgaggta gtcacgtcaa ttacgctgtc 1620
acgttcatca cgggactgct gcacctgcct ttcagcctcc ctgcgctcaa gaatggcctg 1680
tagctgctca gtatcgaatc gctgaacctg acccgcgccc agatgccgct caggctcacg 1740
gtcaatgccc tgcgccttca gggaacggga atcaacccgg tcagcgtgct gataccgttc 1800
aaggtgctta ttctggaggt cagcccagcg ttccctctgg gcaacaaggt attctttgcg 1860
ttcggtcggt gtttccccga aacgtgcctt ttttgcgcca ccgcgctccg gctctttggt 1920
gttagcccgt ttaaaatact gctcagggtc acggtgaata ccgtcattaa tgcgttcaga 1980
gaacatgata tgggcgtggg gctgctcgcc accggctatc gctgctttcg gattatggat 2040
agcgaactga taggcatggc ggtcgccaat ttcctgttgg acaaaatcgc ggacaagctc 2100
aagacgttgt tcgggtttta actcacgcgg cagggcaatc tcgatttcac ggtaggtaca 2160
gccgttggca cgttcagacg tgtcagcggc tttccagaac tcggacggtt tatgcgctgc 2220
ccacgccggc atattgccgg actccttgtg ctcaaggtcg gagtcttttt cacgggcata 2280
ctttccctca cgcgcaatat aatcggcatg aggagaggca ctgccttttc cgccggtttt 2340
tacgctgaga tgataggatg ccatcgtgtt ttatcccgct gaaggcgcgc accgtttctg 2400
aacgaagtga agaaacgtct aagtgcgccc tgataaataa aagagttatc agggattgta 2460
gtgggatttg acctcctctg ccatcactga gcataatcat tccgttagca ttcaggaggt 2520
aaacagcatg aataaaagcg aaaaacagga acaatgggca gcagaaagag tgcagtatat 2580
tcgcggctta aagtcgccga atgagcaaca gaaacttatg ctgatactga cggataaagc 2640
agataaaaca gcacaggata tcaaaacgct gtccctgctg atgaaggctg aacaggcagc 2700
agagaaagcg caggaagcca gagcgaaagt catgaacctg atacaggcag aaaagcgagc 2760
cgaagccaga gccgcccgta aagcccgtga ccatgctctg taccagtctg ccggattgct 2820
tatcctggcg ggtctggttg acagtaagac gggtaagcct gttgatgata ccgctgcctt 2880
actgggtgca ttagccagtc tgaatgacct gtcacgggat aatccgaagt ggtcagactg 2940
gaaaatcaga gggcaggaac tgctgaacag caaaaagtca gatagcacca catagcagac 3000
ccgccataaa acgccctgag aagcccgtga cgggcttttc ttgtattatg ggtagtttcc 3060
ttgcatgaat ccataaaagg cgcctgtagt gccatttacc cccattcact gccagagccg 3120
tgagcgcagc gaactgaatg tcacgaaaaa gacagcgact caggtgcctg atggtcggag 3180
acaaaaggaa tattcagcga tttgcccgag cttgcgaggg tgctacttaa gcctttaggg 3240
ttttaaggtc tgttttgtag aggagcaaac agcgtttgcg acatcctttt gtaatactgc 3300
ggaactgact aaagtagtga gttatacaca gggctgggat ctattctttt tatctttttt 3360
tattctttct ttattctata aattataacc acttgaatat aaacaaaaaa aacacacaaa 3420
ggtctagcgg aatttacaga gggtctagca gaatttacaa gttttccagc aaaggtctag 3480
cagaatttac agatacccac aactcaaagg aaaaggacta gtaattatca ttgactagcc 3540
catctcaatt ggtatagtga ttaaaatcac ctagaccaat tgagatgtat gtctgaatta 3600
gttgttttca aagcaaatga actagcgatt agtcgctatg acttaacgga gcatgaaacc 3660
aagctaattt tatgctgtgt ggcactactc aaccccacga ttgaaaaccc tacaaggaaa 3720
gaacggacgg tatcgttcac ttataaccaa tacgctcaga tgatgaacat cagtagggaa 3780
aatgcttatg gtgtattagc taaagcaacc agagagctga tgacgagaac tgtggaaatc 3840
aggaatcctt tggttaaagg ctttgagatt ttccagtgga caaactatgc caagttctca 3900
agcgaaaaat tagaattagt ttttagtgaa gagatattgc cttatctttt ccagttaaaa 3960
aaattcataa aatataatct ggaacatgtt aagtcttttg aaaacaaata ctctatgagg 4020
atttatgagt ggttattaaa agaactaaca caaaagaaaa ctcacaaggc aaatatagag 4080
attagccttg atgaatttaa gttcatgtta atgcttgaaa ataactacca tgagtttaaa 4140
aggcttaacc aatgggtttt gaaaccaata agtaaagatt taaacactta cagcaatatg 4200
aaattggtgg ttgataagcg aggccgcccg actgatacgt tgattttcca agttgaacta 4260
gatagacaaa tggatctcgt aaccgaactt gagaacaacc agataaaaat gaatggtgac 4320
aaaataccaa caaccattac atcagattcc tacctacata acggactaag aaaaacacta 4380
cacgatgctt taactgcaaa aattcagctc accagttttg aggcaaaatt tttgagtgac 4440
atgcaaagta agtatgatct caatggttcg ttctcatggc tcacgcaaaa acaacgaacc 4500
acactagaga acatactggc taaatacgga aggatctgag gttcttatgg ctcttgtatc 4560
tatcagtgaa gcatcaagac taacaaacaa aagtagaaca actgttcacc gttacatatc 4620
aaagggaaaa ctgtccatat gcacagatga aaacggtgta aaaaagatag atacatcaga 4680
gcttttacga gtttttggtg cattcaaagc tgttcaccat gaacagatcg acaatgtaac 4740
agatgaacag catgtaacac ctaatagaac aggtgaaacc agtaaaacaa agcaactaga 4800
acatgaaatt gaacacctga gacaacttgt tacagctcaa cagtcacaca tagacagcct 4860
gaaacaggcg atgctgctta tcgaatcaaa gctgccgaca acacgggagc cagtgacgcc 4920
tcccgtgggg aaaaaatcat ggcaattctg gaagaaatag cgctttcagc cggcaaaccg 4980
gctgaagccg gatctgcgat tctgataaca aactagcaac accagaacag cccgtttgcg 5040
ggcagcaaaa cccgtacttt tggacgttcc ggcggttttt tgtggcgagt ggtgttcggg 5100
cggtgcgcgc aagatccatt atgttaaacg ggcgagttta catctcaaaa ccgcccgctt 5160
aacaccatca gaaatcctca gcgcgatttt aagcaccaac ccccccccgt aacacccaaa 5220
tccatactga aagtggcttt gttgaataaa tcgaactttt gctgagttga aggatcagat 5280
cacgcatcct cccgacaaca cagaccattc cgtggcaaag caaaagttca gaatcaccaa 5340
ctggtccacc tacaacaaag ctctcatcaa ccgtggctcc ctcactttct ggctggatga 5400
tgaggcgatt caggcctggt atgagtcggc aacaccttca tcacgaggaa ggccccagcg 5460
ctattctgat ctcgccatca ccaccgttct ggtgattaaa cgcgtattcc ggctgaccct 5520
gcgggctgcg cagggtttta ttgattccat ttttgccctg atgaacgttc cgttgcgctg 5580
cccggattac accagtgtca gtaagcgggc aaagtcggtt aatgtcagtt tcaaaacgtc 5640
cacccggggt gaaatcgcac acctggtgat tgattccacc gggctgaagg tctttggtga 5700
aggcgaatgg aaagtcagaa agcacggcaa agagcgccgt cgtatctggc gaaagttgca 5760
tcttgctgtt gacagcaaca cacatgaagt tgtctgtgca gacctgtcgc tgaataacgt 5820
cacggactca gaagccttcc cgggccttat ccggcagact cacagaaaaa tcagggcagc 5880
cgcggcagac ggggcttacg atacccggct ctgtcacgat gaactgcgcc gcaaaaaaat 5940
cagcgcgctt attcctcccc gaaaaggtgc gggttactgg cccggtgaat atgcagaccg 6000
taaccgtgca gtggctaatc agcgaatgac cgggagtaat gcgcggtgga aatggacaac 6060
agattacaac cgtcgctcga tagcggaaac ggcgatgtac cgggtaaaac agctgttcgg 6120
gggttcactg acgctgcgtg actacgatgg tcaggttgcg gaggctatgg ccctggtacg 6180
agcgctgaac aaaatgacga aagcaggtat gcctgaaagc gtgcgtattg cctgaaaaca 6240
caacccgcta cgggggagac ttacccgaaa tctgatttat tcaacaaagc cgggtgtggt 6300
gaactacaaa gcagacccgt tgaggttatc agttcgatgc acaatcagca gcgcataaaa 6360
tatgcacaag aacaggagca cccttcgcat taagctgtgg tggtaacaag tagtgccggg 6420
ctaccatcag cgagcatgat gcgctcccac agcattcgcc ttggcagtat ggaagttcct 6480
cgctccagtt cgggccggta tccacctcga gctttctacg gggtctgacg ctcagtggaa 6540
cgaaaactca cgttaaggga ttttggtcat gagattatca aaaaggatct tcacctagat 6600
ccttttcgac cgaataaata cctgtgacgg aagatcactt cgcagaataa ataaatcctg 6660
gtgtccctgt tgataccggg aagccctggg ccaacttttg gcgaaaatga gacgttgatc 6720
ggcacgtaag aggttccaac tttcaccata atgaaataag atcactaccg ggcgtatttt 6780
ttgagttgtc gagattttca ggagctaagg aagctaaaat ggagaaaaaa atcactggat 6840
ataccaccgt tgatatatcc caatggcatc gtaaagaaca ttttgaggca tttcagtcag 6900
ttgctcaatg tacctataac cagaccgttc agctggatat tacggccttt ttaaagaccg 6960
taaagaaaaa taagcacaag ttttatccgg cctttattca cattcttgcc cgcctgatga 7020
atgctcatcc ggaattacgt atggcaatga aagacggtga gctggtgata tgggatagtg 7080
ttcacccttg ttacaccgtt ttccatgagc aaactgaaac gttttcatcg ctctggagtg 7140
aataccacga cgatttccgg cagtttctac acatatattc gcaagatgtg gcgtgttacg 7200
gtgaaaacct ggcctatttc cctaaagggt ttattgagaa tatgtttttc gtctcagcca 7260
atccctgggt gagtttcacc agttttgatt taaacgtggc caatatggac aacttcttcg 7320
cccccgtttt caccttgggc aaatattata cgcaaggcga caaggtgctg atgccgctgg 7380
cgattcaggt tcatcatgcc gtttgtgatg gcttccatgt cggcagaatg cttaatgaat 7440
tacaacagta ctgcgatgag tggcagggcg gggcgtaatt tttttaaggc agttattggt 7500
gcccttaaac gcctggttgc tacgcctgaa taagtgataa taagcggatg aatggcagaa 7560
attcgaaagc aaattcgacc cggtcgtcgg ttcagggcag ggtcgttaaa tagccgctta 7620
tgtctattgc tggtttaccg gattattgac taccggaagc agtgtgaccg tgtgcttctc 7680
aaatgcctga ggccagtttg ctcaggctct ccccgtggag gtaataattg acgatatgat 7740
cctttttttc tgatcaaaag tgctccatgg aattatgaca acttgacggc tacatcattc 7800
actttttctt cacaaccggc acggaactcg ctcgggctgg ccccggtgca ttttttaaat 7860
acccgcgaga aatagagttg atcgtcaaaa ccaacattgc gaccgacggt ggcgataggc 7920
atccgggtgg tgctcaaaag cagcttcgcc tggctgatac gttggtcctc gcgccagctt 7980
aagacgctaa tccctaactg ctggcggaaa agatgtgaca gacgcgacgg cgacaagcaa 8040
acatgctgtg cgacgctggc gatatcaaaa ttgctgtctg ccaggtgatc gctgatgtac 8100
tgacaagcct cgcgtacccg attatccatc ggtggatgga gcgactcgtt aatcgcttcc 8160
atgcgccgca gtaacaattg ctcaagcaga tttatcgcca gcagctccga atagcgccct 8220
tccccttgcc cggcgttaat gatttgccca aacaggtcgc tgaaatgcgg ctggtgcgct 8280
tcatccgggc gaaagaaccc cgtattggca aatattgacg gccagttaag ccattcatgc 8340
cagtaggcgc gcggacgaaa gtaaacccac tggtgatacc attcgcgagc ctccggatga 8400
cgaccgtagt gatgaatctc tcctggcggg aacagcaaaa tatcacccgg tcggcaaaca 8460
aattctcgtc cctgattttt caccaccccc tgaccgcgaa tggtgagatt gagaatataa 8520
cctttcattc ccagcggtcg gtcgataaaa aaatcgagat aaccgttggc ctcaatcggc 8580
gttaaacccg ccaccagatg ggcattaaac gagtatcccg gcagcagggg atcattttgc 8640
gcttcagcca tacttttcat actcccgcca ttcagagaag aaaccaattg tccatattgc 8700
atcagacatt gccgtcactg cgtcttttac tggctcttct cgctaaccaa accggaaacc 8760
ccgcttatta aaagcattct gtaacaaagc gggaccaaag ccatgacaaa aacgcgtaac 8820
aaaagtgtct ataatcacgg cagaaaagtc cacattgatt atttgcacgg cgtcacactt 8880
tgctatgcca tagcattttt atccataaga ttagcggatc ctacctgacg ctttttatcg 8940
caactctcta ctgtcgtgcg caacgcgtga catcgactag gaggcctttc tatgcagttc 9000
aaagtgtata cctataaacg cgaaagccgt tatcgtctgt ttgttgatgt tcagagcgat 9060
attattgata caccgggtcg tcgtatggtt attccgctgg caagcgcacg tctgctgagc 9120
gataaagtta gccgtgaact gtatccggtt gttcatattg gtgatgaaag ctggcgtatg 9180
atgaccaccg atatggcaag cgttccggtt agcgttattg gtgaagaagt tgcagatctg 9240
agccatcgtg aaaacgatat caaaaatgcc atcaacctga tgttttgggg catcttatag 9300
gaccccctcc accccgcctc gcgggcagtt tgcctggcgg cagtagcgcg gtggtcccac 9360
ctgaccccat gccgaactca gaagtgaaac gccgtagcgc cgatggtagt gtgggctctc 9420
cccatgcgag agtagggaac tgccaggcat caaataaaac gaaaggctca gtcgaaagac 9480
tgggcctta 9489
<210> 26
<211> 35
<212> DNA
<213> 智人(Homo sapiens)
<400> 26
tctgatttat aatgtgaaaa ttcgcggtgt gaact 35
<210> 27
<211> 36
<212> DNA
<213> 智人(Homo sapiens)
<400> 27
agcgccacgc ttcccgaagg gagaaaggcg gacagg 36
<210> 28
<211> 20
<212> DNA
<213> 路邓葡萄球菌(Staphylococcus lugdunensis)
<400> 28
catggtgcat ctgactcctg 20
<210> 29
<211> 20
<212> DNA
<213> 路邓葡萄球菌(Staphylococcus lugdunensis)
<400> 29
ggtagaccac cagcagccta 20
<210> 30
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> ddPCR NHEJ不敏感探针FAM标记的
<400> 30
aggagaagtc tgccgttact gccct 25
<210> 31
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> ddPCR NHEJ敏感探针HEX标记的
<400> 31
tgaagttggt ggtgaggccc t 21
<210> 32
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于T7E1测定的HBB PCR正向引物
<400> 32
gagacgcagg aagagatcca 20
<210> 33
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 用于T7E1测定的HBB PCR反向引物
<400> 33
ttagggttgc ccataacagc 20
<210> 34
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 具有VEGFA靶序列3'的7个可变碱基对的用于PAM鉴定的PAM-文库可变元件
<220>
<221> variation
<222> 21..27
<223> /注释="用于PAM鉴定序列的PAM-文库可变元件,位置21..27中的“n”代表序列中的可变(随机化)区域"
<400> 34
gaccccctcc accccgcctc nnnnnnn 27
<210> 35
<211> 1056
<212> PRT
<213> 路邓葡萄球菌(Staphylococcus lugdunensis)
<220>
Figure 265377DEST_PATH_IMAGE002
<400> 35
Met Asn Gln Lys Phe Ile Leu Gly Leu Asp Ile Gly Ile Thr Ser Val
1 5 10 15
Gly Tyr Gly Leu Ile Asp Tyr Glu Thr Lys Asn Ile Ile Asp Ala Gly
20 25 30
Val Arg Leu Phe Pro Glu Ala Asn Val Glu Asn Asn Glu Gly Arg Arg
35 40 45
Ser Lys Arg Gly Ser Arg Arg Leu Lys Arg Arg Arg Ile His Arg Leu
50 55 60
Glu Arg Val Lys Lys Leu Leu Glu Asp Tyr Asn Leu Leu Asp Gln Ser
65 70 75 80
Gln Ile Pro Gln Ser Thr Asn Pro Tyr Ala Ile Arg Val Lys Gly Leu
85 90 95
Ser Glu Ala Leu Ser Lys Asp Glu Leu Val Ile Ala Leu Leu His Ile
100 105 110
Ala Lys Arg Arg Gly Ile His Lys Ile Asp Val Ile Asp Ser Asn Asp
115 120 125
Asp Val Gly Asn Glu Leu Ser Thr Lys Glu Gln Leu Asn Lys Asn Ser
130 135 140
Lys Leu Leu Lys Asp Lys Phe Val Cys Gln Ile Gln Leu Glu Arg Met
145 150 155 160
Asn Glu Gly Gln Val Arg Gly Glu Lys Asn Arg Phe Lys Thr Ala Asp
165 170 175
Ile Ile Lys Glu Ile Ile Gln Leu Leu Asn Val Gln Lys Asn Phe His
180 185 190
Gln Leu Asp Glu Asn Phe Ile Asn Lys Tyr Ile Glu Leu Val Glu Met
195 200 205
Arg Arg Glu Tyr Phe Glu Gly Pro Gly Lys Gly Ser Pro Tyr Gly Trp
210 215 220
Glu Gly Asp Pro Lys Ala Trp Tyr Glu Thr Leu Met Gly His Cys Thr
225 230 235 240
Tyr Phe Pro Asp Glu Leu Arg Ser Val Lys Tyr Ala Tyr Ser Ala Asp
245 250 255
Leu Phe Asn Ala Leu Asn Asp Leu Asn Asn Leu Val Ile Gln Arg Asp
260 265 270
Gly Leu Ser Lys Leu Glu Tyr His Glu Lys Tyr His Ile Ile Glu Asn
275 280 285
Val Phe Lys Gln Lys Lys Lys Pro Thr Leu Lys Gln Ile Ala Asn Glu
290 295 300
Ile Asn Val Asn Pro Glu Asp Ile Lys Gly Tyr Arg Ile Thr Lys Ser
305 310 315 320
Gly Lys Pro Gln Phe Thr Glu Phe Lys Leu Tyr His Asp Leu Lys Ser
325 330 335
Val Leu Phe Asp Gln Ser Ile Leu Glu Asn Glu Asp Val Leu Asp Gln
340 345 350
Ile Ala Glu Ile Leu Thr Ile Tyr Gln Asp Lys Asp Ser Ile Lys Ser
355 360 365
Lys Leu Thr Glu Leu Asp Ile Leu Leu Asn Glu Glu Asp Lys Glu Asn
370 375 380
Ile Ala Gln Leu Thr Gly Tyr Thr Gly Thr His Arg Leu Ser Leu Lys
385 390 395 400
Cys Ile Arg Leu Val Leu Glu Glu Gln Trp Tyr Ser Ser Arg Asn Gln
405 410 415
Met Glu Ile Phe Thr His Leu Asn Ile Lys Pro Lys Lys Ile Asn Leu
420 425 430
Thr Ala Ala Asn Lys Ile Pro Lys Ala Met Ile Asp Glu Phe Ile Leu
435 440 445
Ser Pro Val Val Lys Arg Thr Phe Gly Gln Ala Ile Asn Leu Ile Asn
450 455 460
Lys Ile Ile Glu Lys Tyr Gly Val Pro Glu Asp Ile Ile Ile Glu Leu
465 470 475 480
Ala Arg Glu Asn Asn Ser Lys Asp Lys Gln Lys Phe Ile Asn Glu Met
485 490 495
Gln Lys Lys Asn Glu Asn Thr Arg Lys Arg Ile Asn Glu Ile Ile Gly
500 505 510
Lys Tyr Gly Asn Gln Asn Ala Lys Arg Leu Val Glu Lys Ile Arg Leu
515 520 525
His Asp Glu Gln Glu Gly Lys Cys Leu Tyr Ser Leu Glu Ser Ile Pro
530 535 540
Leu Glu Asp Leu Leu Asn Asn Pro Asn His Tyr Glu Val Asp His Ile
545 550 555 560
Ile Pro Arg Ser Val Ser Phe Asp Asn Ser Tyr His Asn Lys Val Leu
565 570 575
Val Lys Gln Ser Glu Asn Ser Lys Lys Ser Asn Leu Thr Pro Tyr Gln
580 585 590
Tyr Phe Asn Ser Gly Lys Ser Lys Leu Ser Tyr Asn Gln Phe Lys Gln
595 600 605
His Ile Leu Asn Leu Ser Lys Ser Gln Asp Arg Ile Ser Lys Lys Lys
610 615 620
Lys Glu Tyr Leu Leu Glu Glu Arg Asp Ile Asn Lys Phe Glu Val Gln
625 630 635 640
Lys Glu Phe Ile Asn Arg Asn Leu Val Asp Thr Arg Tyr Ala Thr Arg
645 650 655
Glu Leu Thr Asn Tyr Leu Lys Ala Tyr Phe Ser Ala Asn Asn Met Asn
660 665 670
Val Lys Val Lys Thr Ile Asn Gly Ser Phe Thr Asp Tyr Leu Arg Lys
675 680 685
Val Trp Lys Phe Lys Lys Glu Arg Asn His Gly Tyr Lys His His Ala
690 695 700
Glu Asp Ala Leu Ile Ile Ala Asn Ala Asp Phe Leu Phe Lys Glu Asn
705 710 715 720
Lys Lys Leu Lys Ala Val Asn Ser Val Leu Glu Lys Pro Glu Ile Glu
725 730 735
Ser Lys Gln Leu Asp Ile Gln Val Asp Ser Glu Asp Asn Tyr Ser Glu
740 745 750
Met Phe Ile Ile Pro Lys Gln Val Gln Asp Ile Lys Asp Phe Arg Asn
755 760 765
Phe Lys Tyr Ser His Arg Val Asp Lys Lys Pro Asn Arg Gln Leu Ile
770 775 780
Asn Asp Thr Leu Tyr Ser Thr Arg Lys Lys Asp Asn Ser Thr Tyr Ile
785 790 795 800
Val Gln Thr Ile Lys Asp Ile Tyr Ala Lys Asp Asn Thr Thr Leu Lys
805 810 815
Lys Gln Phe Asp Lys Ser Pro Glu Lys Phe Leu Met Tyr Gln His Asp
820 825 830
Pro Arg Thr Phe Glu Lys Leu Glu Val Ile Met Lys Gln Tyr Ala Asn
835 840 845
Glu Lys Asn Pro Leu Ala Lys Tyr His Glu Glu Thr Gly Glu Tyr Leu
850 855 860
Thr Lys Tyr Ser Lys Lys Asn Asn Gly Pro Ile Val Lys Ser Leu Lys
865 870 875 880
Tyr Ile Gly Asn Lys Leu Gly Ser His Leu Asp Val Thr His Gln Phe
885 890 895
Lys Ser Ser Thr Lys Lys Leu Val Lys Leu Ser Ile Lys Pro Tyr Arg
900 905 910
Phe Asp Val Tyr Leu Thr Asp Lys Gly Tyr Lys Phe Ile Thr Ile Ser
915 920 925
Tyr Leu Asp Val Leu Lys Lys Asp Asn Tyr Tyr Tyr Ile Pro Glu Gln
930 935 940
Lys Tyr Asp Lys Leu Lys Leu Gly Lys Ala Ile Asp Lys Asn Ala Lys
945 950 955 960
Phe Ile Ala Ser Phe Tyr Lys Asn Asp Leu Ile Lys Leu Asp Gly Glu
965 970 975
Ile Tyr Lys Ile Ile Gly Val Asn Ser Asp Thr Arg Asn Met Ile Glu
980 985 990
Leu Asp Leu Pro Asp Ile Arg Tyr Lys Glu Tyr Cys Glu Leu Asn Asn
995 1000 1005
Ile Lys Gly Glu Pro Arg Ile Lys Lys Thr Ile Gly Lys Lys Val Asn
1010 1015 1020
Ser Ile Glu Lys Leu Thr Thr Asp Val Leu Gly Asn Val Phe Thr Asn
1025 1030 1035 1040
Thr Gln Tyr Thr Lys Pro Gln Leu Leu Phe Lys Arg Gly Asn Gly Gly
1045 1050 1055
<210> 36
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> SPRJ1688寡核苷酸引物,实施例5
<400> 36
acggacagac agacagacac c 21
<210> 37
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> SPRJ1689寡核苷酸引物,实施例5
<400> 37
agaacagccc agaagttgga c 21
<210> 38
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> SPRJ1695寡核苷酸引物,实施例5
<400> 38
agccccagct accacctcct cc 22
<210> 39
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> SPRJ1699寡核苷酸引物,实施例5
<400> 39
tccaccccgc ctccgggcgc 20
<210> 40
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> SPRJ1720寡核苷酸引物,实施例5
<400> 40
catggtgcat ctgactcctg 20
<210> 41
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> SPRJ1721寡核苷酸引物,实施例5
<400> 41
ggtagaccac cagcagccta 20
<210> 42
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> SPRJ1725寡核苷酸引物,实施例5
<400> 42
aggagaagtc tgccgttact gccct 25
<210> 43
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> SPRJ1728寡核苷酸引物,实施例5
<400> 43
tgaagttggt ggtgaggccc t 21
<210> 44
<211> 3162
<212> DNA
<213> 人工序列
<220>
<223> 密码子优化的SluCas9多核苷酸1
<400> 44
atgaaccaaa agttcattct ggggctcgat atcggcatca cctccgtggg atatggtctg 60
atcgactacg agactaagaa catcatcgac gctggagtgc gactgttccc ggaagcgaac 120
gtggagaaca acgaaggccg cagatccaag cgcgggtcca gaaggctcaa gaggcggagg 180
atccatagac tcgaaagagt gaagaagctc cttgaagatt acaatctgtt ggaccagagc 240
cagattcccc aaagcaccaa cccgtacgcc atcagagtga agggcctgtc cgaagccctg 300
tcgaaagatg aactggtcat tgccctgctg catattgcca aacggcgcgg aatccataag 360
atcgacgtga tagactccaa cgatgacgtg ggcaacgaac tgtcaaccaa ggagcagctg 420
aacaagaact cgaaactgct gaaggacaag ttcgtctgcc aaattcaact ggaacggatg 480
aacgagggac aagtcagggg agagaaaaac cggttcaaga ccgcggacat catcaaggag 540
atcatccaac tcctgaatgt gcagaagaac tttcaccagc tggatgaaaa cttcattaac 600
aagtacattg aactggtgga aatgcggagg gagtacttcg agggacctgg aaagggatcc 660
ccttacggct gggaagggga ccccaaggct tggtacgaaa cgctcatggg ccattgcact 720
tactttccgg acgaactccg gtccgtgaag tacgcatact ctgccgatct gttcaatgca 780
ctcaacgacc ttaacaactt ggtgatccag cgcgatggcc tgtccaagtt ggaataccac 840
gaaaagtatc acatcatcga gaacgtgttc aagcagaaaa agaagccaac tctgaagcag 900
attgccaacg aaattaacgt gaaccccgag gatatcaagg gataccggat cactaagtcc 960
ggcaaaccac agttcaccga gttcaagctg taccacgatc tgaagtcggt gctctttgac 1020
cagtccatcc tggaaaacga agatgtgctg gaccagattg ctgagatcct gaccatctac 1080
caggacaagg actcgattaa gagcaagctc acggagctgg acattctgct gaacgaagag 1140
gataaggaga acatcgcgca gctcactggt tacaccggta cccaccgctt gtcccttaag 1200
tgcatccggc tggtcctcga ggaacaatgg tactccagcc ggaaccagat ggagatcttc 1260
acgcacttga acatcaagcc gaagaagatt aacctgaccg ctgcgaacaa gatacccaag 1320
gccatgatcg acgagtttat cctctcaccg gtggtcaagc gcaccttcgg acaagccatc 1380
aacctcatca acaagattat cgagaagtac ggcgtgcctg aggatatcat catcgagctg 1440
gctcgggaga acaactcaaa ggataagcag aagttcatta acgagatgca gaaaaagaac 1500
gagaacactc gcaagcggat taatgagatc atcggtaaat acgggaacca gaacgccaag 1560
cggcttgtgg aaaagattcg gctccacgac gagcaggagg gaaagtgtct gtactcgctg 1620
gagagcattc ccctggagga cctcctgaac aacccaaacc actacgaagt ggatcacata 1680
atcccccgca gcgtgtcatt cgacaattcc taccataaca aggtcctcgt gaagcagtcc 1740
gagaatagca agaagtccaa cctgactccg taccagtact tcaactccgg caaatccaag 1800
ctgtcctaca accagttcaa acagcacatc ctcaacctgt caaagagcca ggacaggatc 1860
tcgaagaaga agaaggaata ccttctcgag gaacgggata tcaataagtt cgaggtgcag 1920
aaggagttta tcaatagaaa cctggtggac actcgctatg ccacccgcga actgaccaac 1980
tacctgaagg cgtacttctc cgccaacaac atgaacgtga aggtcaaaac tattaacggc 2040
agcttcaccg actatctgcg caaggtctgg aagttcaaga aggaacgcaa ccacggttac 2100
aagcaccacg cggaagatgc gctgattatc gccaacgctg acttcctgtt caaggaaaac 2160
aagaagctca aggccgtgaa ctcagtgctc gagaagcctg aaatcgagac taagcagctg 2220
gacatccagg tcgattcgga agataactac tccgaaatgt tcatcatccc taagcaagtg 2280
caggacatca aggacttcag gaatttcaag tacagccatc gcgtggacaa gaagccaaac 2340
agacagctga tcaacgatac actgtattcc acccggaaga aggacaactc cacctacatc 2400
gtccaaacca ttaaggacat ctacgcaaag gacaacacca cgcttaagaa gcagttcgac 2460
aagagccccg aaaagttcct catgtaccag cacgacccca gaaccttcga gaagcttgaa 2520
gtgatcatga agcagtacgc caacgaaaag aacccactgg ctaagtacca cgaggaaacc 2580
ggcgaatacc tgaccaagta ctccaaaaag aacaacggac cgatcgtcaa gtccctgaag 2640
tacattggga acaagctcgg ctcgcacctc gatgtgaccc accagttcaa gtcctcgacc 2700
aaaaagctcg tgaagctgtc catcaagccg taccggttcg acgtgtacct gactgacaag 2760
ggatataagt tcatcaccat ttcctacctc gacgtgttga agaaggataa ctactactac 2820
attccggaac agaagtacga caagctcaag ctcggaaagg ccatcgacaa aaatgcgaag 2880
ttcatcgcga gcttctacaa gaatgacttg atcaagctgg atggcgaaat ctacaagatc 2940
atcggggtca actccgatac ccgcaacatg attgagctgg atctgcccga cattcggtac 3000
aaggaatact gcgagctgaa caacatcaag ggagaaccgc ggatcaagaa aaccatcgga 3060
aagaaagtga acagcatcga gaaactgact actgacgtcc tgggaaacgt gttcaccaac 3120
acacaataca ccaaacccca gctgctgttt aagcgcggga ac 3162
<210> 45
<211> 3162
<212> DNA
<213> 人工序列
<220>
<223> 密码子优化的SluCas9多核苷酸2
<400> 45
atgaaccaga agttcatcct gggcctcgac atcggcatca cctctgttgg ctacggcctg 60
atcgactacg agacaaagaa catcatcgat gccggcgtgc ggctgttccc tgaggccaac 120
gtggaaaaca acgagggccg cagaagcaag agaggcagca gaaggctgaa gcggcggaga 180
atccaccggc tggaaagagt gaagaagctg ctcgaggact acaacctgct ggaccagtct 240
cagatccctc agagcacaaa cccctacgcc atcagagtga agggcctgtc tgaggccctg 300
agcaaggacg agctggttat cgccctgctg cacattgcca agcggagagg catccacaag 360
atcgacgtga tcgacagcaa cgacgacgtg ggcaatgagc tgagcaccaa agagcagctg 420
aacaagaaca gcaagctgct gaaggacaag ttcgtgtgcc agattcagct ggaacggatg 480
aatgagggcc aagtgcgggg cgagaagaac agattcaaga ccgccgacat catcaaagag 540
atcatccagc tgctcaacgt gcagaagaac ttccaccagc tggacgagaa cttcatcaac 600
aagtacatcg agctggtcga gatgcggcgc gagtactttg aaggccctgg aaagggcagc 660
ccttatggct gggaaggcga tcccaaggct tggtacgaga cactgatggg ccactgcacc 720
tactttcccg acgagctgag aagcgtgaag tacgcctaca gcgccgacct gttcaacgcc 780
ctgaacgacc tgaacaacct cgtgatccag agagatggcc tgtccaagct ggaataccac 840
gagaagtacc acatcattga gaacgtgttc aagcagaaga agaagcccac actgaagcag 900
atcgccaacg agatcaacgt gaaccccgag gacatcaagg gctacagaat caccaagagc 960
ggcaagcccc agttcaccga gttcaagctg taccacgatc tgaagtccgt gctgttcgac 1020
cagagcatcc tggaaaacga ggacgtgctg gatcagatcg ccgagatcct gaccatctac 1080
caggacaagg acagcatcaa gagcaagctg accgagctgg acatcctgct gaacgaagag 1140
gacaaagaga atatcgccca gctgaccggc tacaccggca cacatagact gagcctgaag 1200
tgcatccggc tggtgctgga agaacagtgg tactccagcc ggaaccagat ggaaatcttc 1260
acccacctga acatcaagcc caagaagatc aacctgaccg ccgccaacaa gatccccaag 1320
gccatgatcg acgagttcat tctgagcccc gtggtcaaga gaaccttcgg ccaggccatc 1380
aatctgatca acaagattat cgagaagtat ggcgtgcccg aggatatcat catcgaactg 1440
gccagagaga acaacagcaa ggacaagcaa aagttcatca acgagatgca gaaaaagaac 1500
gagaacaccc ggaagcggat caacgaaatc atcgggaagt acggcaacca gaacgccaag 1560
agactggtgg aaaagatccg gctgcacgac gagcaagagg gcaagtgtct gtacagcctg 1620
gaatctatcc ctctcgagga tctgctgaac aatcccaacc actacgaggt ggaccacatt 1680
atccccagaa gcgtgtcctt cgacaacagc taccacaaca aggtgctggt caagcagagc 1740
gagaactcca agaagtccaa tctgacccct taccagtact tcaacagcgg caagtctaag 1800
ctgagctaca accagtttaa gcagcacatc ctgaacctca gcaagagcca ggaccggatc 1860
agcaagaaga agaaagagta cctgctcgaa gagagggaca ttaacaagtt cgaggtgcag 1920
aaagagttta tcaaccggaa cctggtggac accagatacg ccaccagaga gctgaccaac 1980
tacctgaagg cctacttcag cgccaacaac atgaacgtga aagtcaagac catcaacggc 2040
agcttcaccg actacctgcg gaaagtgtgg aagtttaaga aagagcggaa ccacggctac 2100
aagcaccacg ccgaagatgc cctgattatc gccaatgccg acttcctgtt caaagagaac 2160
aagaaactga aggccgtgaa cagcgtgctg gaaaagcccg agatcgagac aaaacagctc 2220
gacatccagg tggacagcga ggacaactac agcgagatgt tcatcatccc caaacaggtg 2280
caggatatca aggacttccg gaacttcaag tacagccacc gcgtggacaa gaagcctaac 2340
cggcagctga tcaatgacac cctgtacagc acccgcaaga aggacaacag cacctacatc 2400
gtgcagacga tcaaggacat ctacgccaag gacaatacga ccctgaagaa gcagttcgac 2460
aagagccccg agaagttcct gatgtaccag cacgacccca ggaccttcga gaagctggaa 2520
gtgatcatga agcagtacgc taatgagaag aacccgctgg ccaagtacca cgaggaaacc 2580
ggcgagtacc tgaccaagta ctctaagaag aacaacggcc ccatcgtgaa gtccctgaag 2640
tatatcggca acaagctggg cagccacctg gacgtgacac accagttcaa gagcagcacc 2700
aagaagctgg tcaaactgtc catcaagcca taccgcttcg acgtgtacct gacagacaag 2760
gggtacaagt ttatcaccat cagctacctc gacgtgctga agaaggataa ctactactac 2820
atccccgagc agaagtacga caagctgaag ctgggaaaag ccatcgacaa gaatgccaag 2880
ttcattgcca gcttctacaa gaacgacctc atcaagctgg acggcgagat ctacaagatc 2940
atcggcgtga actccgacac acggaacatg attgagctgg acctgcctga catccggtac 3000
aaagagtact gcgaactgaa caatatcaag ggcgagcccc ggatcaaaaa gacgatcggc 3060
aagaaagtga acagcattga gaagctgacc accgatgtgc tgggcaatgt gttcaccaac 3120
acacagtaca ccaagcctca gctgctgttc aagcggggca at 3162

Claims (9)

1.组合物,其包含
(a)根据SEQ ID NO:2的SluCas9多肽或其以下变体:
(I)在其全长或从SEQ ID NO:2的位置789到位置1053上与根据SEQ ID NO:2的序列具有至少75%、至少80%、至少85%、至少90%、至少95%、至少99%或100%氨基酸同一性的变体;
(II)根据(I)的变体,其含有额外的组分,如例如,核定位信号,以获取包含SluCas9多肽的SluCas9 CRISPR系统在无细胞反应或在原核细胞中以及在真核细胞环境中例如在活的植物或动物中的活性,例如根据SEQ ID NO:3的多核苷酸序列;
(III)编码SluCas9以及根据(I)和(II)的变体的相应多核苷酸序列的密码子优化的变体,例如SEQ ID NO:3从位置61至位置3225的多核苷酸序列和根据SEQ ID NO:44和45的多核苷酸序列;或
(IV)根据(I)至(III)中任一项的变体,其进一步包含
i.导致具有与不具有一种或多种修饰或突变的相应SluCas9(例如,包含SEQ ID NO:2的氨基酸序列的SluCas9)相比显著降低的核酸酶活性或不可检测的核酸酶活性的SluCas9的一种或多种修饰或突变,例如一种或多种氨基酸取代(例如,丙氨酸取代),其中相对于SEQ ID NO:2,取代是在位置10 (例如,D10A)、位置559(例如,H559A)和/或位置582(例如N582A);和/或
ii.具有核碱基编辑活性或脱氨酶活性的C-或N-末端附着的多肽,例如,经由接头肽序列附着的;和
(b)一种或多种单一异源指导RNA(sgRNA)或编码所述一种或多种sgRNA的核酸(例如,DNA),每种sgRNA包含:
(I)包含RNA并且能够与多核苷酸基因座中的靶序列杂交的DNA-靶向区段,
(II)包含RNA的tracr配对物序列,和
(III)包含RNA的tracr RNA序列,其中所述tracr配对物序列能够与所述tracr序列杂交,且其中(I)、(II)和(III)以5'至3'的取向排列。
2.权利要求1的组合物,其中(a)的SluCas9多肽包含与SEQ ID NO:2的从位置789到位置1053连端点在内的氨基酸序列具有至少75%氨基酸同一性的氨基酸的邻接序列(例如,265个氨基酸的邻接序列)。
3.权利要求1的组合物,其中(a)的SluCas9多肽包含与SEQ ID NO:2的从位置789到位置1053连端点在内的氨基酸序列具有至少90%氨基酸同一性的氨基酸的邻接序列(例如,265个氨基酸的邻接序列)。
4.权利要求1-3任一项的组合物,其中所述DNA-靶向区段的长度为18个核苷酸至22个核苷酸,并且其中在多核苷酸基因座中且与靶序列互补的原间隔区序列在其3'末端正好与对于(a)的SluCas9多肽合适的PAM序列相邻,或这种PAM序列是DNA-靶向区段的3'部分的一部分。
5.权利要求1-4任一项的组合物,其中在多核苷酸基因座中且与靶序列互补的原间隔区序列在其3'末端正好与PAM序列“NNGG”相邻,或这种PAM序列是DNA-靶向区段的3'部分的一部分。
6.在细胞(例如,体外或体内)或无细胞系统中一个或多个位置处靶向、编辑、修饰或操纵靶DNA的方法,包括:
(a)向所述细胞或无细胞系统中引入异源SluCas9多肽或显示与SEQ ID NO:2至少75%的同一性的多肽或编码其的核酸;和
(b)引入一种或多种单一异源指导RNA(sgRNA)或编码所述一种或多种sgRNA的核酸(例如,DNA),每种sgRNA包含:
(I)包含RNA并且能够与多核苷酸基因座中的靶序列杂交的DNA-靶向区段,
(II)包含RNA的tracr配对物序列,和
(III)包含RNA的tracr RNA序列,其中所述tracr配对物序列能够与所述tracr序列杂交,且其中(I)、(II)和(III)以5'至3'的取向排列;
(c)在靶DNA中产生一个或多个切口或切割或碱基编辑,其中所述SluCas9多肽通过其加工的或未加工的形式的sgRNA被指导至所述靶DNA。
7.包含下述的组合物用于在细胞(例如,体外或体内)或无细胞系统中一个或多个位置处靶向、编辑、修饰或操纵靶DNA的用途:
(a)SluCas9多肽或显示与SEQ ID NO:2至少75%的同一性的多肽,或编码其的核酸;和/或
(b)一种或多种单一异源指导RNA(sgRNA)或编码所述一种或多种sgRNA的核酸(例如,DNA),每种sgRNA包含:
(I)包含RNA并且能够与多核苷酸基因座中的靶序列杂交的DNA-靶向区段,
(II)包含RNA的tracr配对物序列,和
(III)包含RNA的tracr RNA序列,其中所述tracr配对物序列能够与所述tracr序列杂交,且其中(I)、(II)和(III)以5'至3'的取向排列。
8.细胞,其包含
(a)SluCas9多肽或显示与SEQ ID NO:2至少75%的同一性的多肽,或编码其的核酸;和
(b)一种或多种单一异源指导RNA(sgRNA)或编码所述一种或多种sgRNA的核酸(例如,DNA),每种sgRNA包含:
(I)包含RNA并且能够与多核苷酸基因座中的靶序列杂交的DNA-靶向区段,
(II)包含RNA的tracr配对物序列,和
(III)包含RNA的tracr RNA序列,其中所述tracr配对物序列能够与所述tracr序列杂交,且其中(I)、(II)和(III)以5'至3'的取向排列。
9.试剂盒,其包括
(a)编码SluCas9或显示与SEQ ID NO:2至少75%的同一性的多肽的核酸序列,其中所述编码这种SluCas9的核酸序列可操作地连接至启动子;
(b)一种或多种单一异源指导RNA(sgRNA)或编码所述一种或多种sgRNA的核酸(例如,DNA),每种sgRNA包含:
(I)包含RNA并且能够与多核苷酸基因座中的靶序列杂交的DNA-靶向区段,
(II)包含RNA的tracr配对物序列,和
(III)包含RNA的tracr RNA序列,其中所述tracr配对物序列能够与所述tracr序列杂交,且其中(I)、(II)和(III)以5'至3'的取向排列。
CN201880089098.9A 2017-12-14 2018-12-14 新的rna-可编程的内切核酸酶系统及其在基因组编辑和其他应用中的用途 Pending CN111801417A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP17207294.4 2017-12-14
EP17207294 2017-12-14
PCT/US2018/065863 WO2019118935A1 (en) 2017-12-14 2018-12-14 Novel rna-programmable endonuclease systems and their use in genome editing and other applications

Publications (1)

Publication Number Publication Date
CN111801417A true CN111801417A (zh) 2020-10-20

Family

ID=60813596

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880089098.9A Pending CN111801417A (zh) 2017-12-14 2018-12-14 新的rna-可编程的内切核酸酶系统及其在基因组编辑和其他应用中的用途

Country Status (8)

Country Link
US (1) US11578323B2 (zh)
EP (1) EP3724332A1 (zh)
JP (1) JP2021506251A (zh)
CN (1) CN111801417A (zh)
AU (1) AU2018386301A1 (zh)
CA (1) CA3084825A1 (zh)
MA (1) MA51138A (zh)
WO (1) WO2019118935A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023098485A1 (zh) * 2021-11-30 2023-06-08 上海科技大学 一种基于c2c9核酸酶的新型基因组编辑系统及其应用
CN117511912A (zh) * 2023-12-22 2024-02-06 辉大(上海)生物科技有限公司 IscB多肽、包含其的系统及其用途

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL264565B1 (en) 2016-08-03 2024-03-01 Harvard College Adenosine nuclear base editors and their uses
EP3497214B1 (en) 2016-08-09 2023-06-28 President and Fellows of Harvard College Programmable cas9-recombinase fusion proteins and uses thereof
US10745677B2 (en) 2016-12-23 2020-08-18 President And Fellows Of Harvard College Editing of CCR5 receptor gene to protect against HIV infection
WO2018165504A1 (en) 2017-03-09 2018-09-13 President And Fellows Of Harvard College Suppression of pain by gene editing
EP3658573A1 (en) 2017-07-28 2020-06-03 President and Fellows of Harvard College Methods and compositions for evolving base editors using phage-assisted continuous evolution (pace)
WO2019139645A2 (en) 2017-08-30 2019-07-18 President And Fellows Of Harvard College High efficiency base editors comprising gam
MA51138A (fr) 2017-12-14 2020-10-21 Bayer Healthcare Llc Nouveaux systèmes d'endonucléases arn-programmables et leurs utilisations dans l'édition de génome et d'autres applications
WO2020191246A1 (en) 2019-03-19 2020-09-24 The Broad Institute, Inc. Methods and compositions for editing nucleotide sequences
US20200407729A1 (en) * 2019-06-28 2020-12-31 Crispr Therapeutics Ag Materials and methods for controlling gene editing
CN110499334A (zh) * 2019-08-08 2019-11-26 复旦大学 CRISPR/SlugCas9基因编辑系统及其应用
TW202208626A (zh) * 2020-04-24 2022-03-01 美商生命編輯公司 Rna引導核酸酶及其活性片段與變體,以及使用方法
GB2614813A (en) 2020-05-08 2023-07-19 Harvard College Methods and compositions for simultaneous editing of both strands of a target double-stranded nucleotide sequence
WO2022018638A1 (en) 2020-07-21 2022-01-27 Crispr Therapeutics Ag Genome-editing compositions and methods to modulate faah for treatment of neurological disorders
US10894812B1 (en) 2020-09-30 2021-01-19 Alpine Roads, Inc. Recombinant milk proteins
WO2022070107A1 (en) 2020-09-30 2022-04-07 Crispr Therapeutics Ag Materials and methods for treatment of amyotrophic lateral sclerosis
US10947552B1 (en) 2020-09-30 2021-03-16 Alpine Roads, Inc. Recombinant fusion proteins for producing milk proteins in plants
EP4222167A1 (en) 2020-09-30 2023-08-09 Nobell Foods, Inc. Recombinant milk proteins and food compositions comprising the same
MX2023004383A (es) 2020-10-21 2023-05-04 Massachusetts Inst Technology Sistemas, metodos y composiciones para la ingenieria genetica especifica del sitio usando la adicion programable a traves de elementos objetivo especificos del sitio (paste).
EP4240854A1 (en) 2020-11-06 2023-09-13 Vertex Pharmaceuticals Incorporated Compositions and methods for treatment of dm1 with slucas9 and sacas9
CA3205138A1 (en) 2020-12-17 2022-06-23 Vertex Pharmaceuticals Incorporated Compositions and methods for editing beta-globin for treatment of hemaglobinopathies
WO2022182959A1 (en) * 2021-02-26 2022-09-01 Vertex Pharmaceuticals Incorporated Compositions and methods for treatment of myotonic dystrophy type 1 with crispr/slucas9
WO2022212926A1 (en) * 2021-04-01 2022-10-06 Prime Medicine, Inc. Methods and compositions for editing nucleotide sequences
WO2022229851A1 (en) * 2021-04-26 2022-11-03 Crispr Therapeutics Ag Compositions and methods for using slucas9 scaffold sequences
WO2022238958A1 (en) 2021-05-12 2022-11-17 Crispr Therapeutics Ag Multiplex gene editing
WO2023168235A2 (en) * 2022-03-01 2023-09-07 Crisp-Hr Therapeutics, Inc. Systems and methods of gene editing
WO2024020352A1 (en) * 2022-07-18 2024-01-25 Vertex Pharmaceuticals Incorporated Tandem guide rnas (tg-rnas) and their use in genome editing

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104854241A (zh) * 2012-05-25 2015-08-19 埃玛纽埃尔·沙尔庞捷 用于rna定向的靶dna修饰和用于rna定向的转录调节的方法和组合物
CN106687594A (zh) * 2014-07-11 2017-05-17 纳幕尔杜邦公司 用于产生对草甘膦除草剂具有抗性的植物的组合物和方法
WO2017083852A1 (en) * 2015-11-13 2017-05-18 MOORE, Tara Methods for the treatment of corneal dystrophies

Family Cites Families (171)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3687808A (en) 1969-08-14 1972-08-29 Univ Leland Stanford Junior Synthetic polynucleotides
US4469863A (en) 1980-11-12 1984-09-04 Ts O Paul O P Nonionic nucleic acid alkyl and aryl phosphonates and processes for manufacture and use thereof
US5023243A (en) 1981-10-23 1991-06-11 Molecular Biosystems, Inc. Oligonucleotide therapeutic agent and method of making same
US4476301A (en) 1982-04-29 1984-10-09 Centre National De La Recherche Scientifique Oligonucleotides, a process for preparing the same and their application as mediators of the action of interferon
JPS5927900A (ja) 1982-08-09 1984-02-14 Wakunaga Seiyaku Kk 固定化オリゴヌクレオチド
FR2540122B1 (fr) 1983-01-27 1985-11-29 Centre Nat Rech Scient Nouveaux composes comportant une sequence d'oligonucleotide liee a un agent d'intercalation, leur procede de synthese et leur application
US4605735A (en) 1983-02-14 1986-08-12 Wakunaga Seiyaku Kabushiki Kaisha Oligonucleotide derivatives
US4948882A (en) 1983-02-22 1990-08-14 Syngene, Inc. Single-stranded labelled oligonucleotides, reactive monomers and methods of synthesis
US4824941A (en) 1983-03-10 1989-04-25 Julian Gordon Specific antibody to the native form of 2'5'-oligonucleotides, the method of preparation and the use as reagents in immunoassays or for binding 2'5'-oligonucleotides in biological systems
US4587044A (en) 1983-09-01 1986-05-06 The Johns Hopkins University Linkage of proteins to nucleic acids
US5118802A (en) 1983-12-20 1992-06-02 California Institute Of Technology DNA-reporter conjugates linked via the 2' or 5'-primary amino group of the 5'-terminal nucleoside
US5550111A (en) 1984-07-11 1996-08-27 Temple University-Of The Commonwealth System Of Higher Education Dual action 2',5'-oligoadenylate antiviral derivatives and uses thereof
US5430136A (en) 1984-10-16 1995-07-04 Chiron Corporation Oligonucleotides having selectably cleavable and/or abasic sites
US5367066A (en) 1984-10-16 1994-11-22 Chiron Corporation Oligonucleotides with selectably cleavable and/or abasic sites
US5258506A (en) 1984-10-16 1993-11-02 Chiron Corporation Photolabile reagents for incorporation into oligonucleotide chains
US4828979A (en) 1984-11-08 1989-05-09 Life Technologies, Inc. Nucleotide analogs for nucleic acid labeling and detection
FR2575751B1 (fr) 1985-01-08 1987-04-03 Pasteur Institut Nouveaux nucleosides de derives de l'adenosine, leur preparation et leurs applications biologiques
US5185444A (en) 1985-03-15 1993-02-09 Anti-Gene Deveopment Group Uncharged morpolino-based polymers having phosphorous containing chiral intersubunit linkages
US5166315A (en) 1989-12-20 1992-11-24 Anti-Gene Development Group Sequence-specific binding polymers for duplex nucleic acids
US5235033A (en) 1985-03-15 1993-08-10 Anti-Gene Development Group Alpha-morpholino ribonucleoside derivatives and polymers thereof
US5034506A (en) 1985-03-15 1991-07-23 Anti-Gene Development Group Uncharged morpholino-based polymers having achiral intersubunit linkages
US5405938A (en) 1989-12-20 1995-04-11 Anti-Gene Development Group Sequence-specific binding polymers for duplex nucleic acids
US4762779A (en) 1985-06-13 1988-08-09 Amgen Inc. Compositions and methods for functionalizing nucleic acids
US5317098A (en) 1986-03-17 1994-05-31 Hiroaki Shizuya Non-radioisotope tagging of fragments
JPS638396A (ja) 1986-06-30 1988-01-14 Wakunaga Pharmaceut Co Ltd ポリ標識化オリゴヌクレオチド誘導体
US5276019A (en) 1987-03-25 1994-01-04 The United States Of America As Represented By The Department Of Health And Human Services Inhibitors for replication of retroviruses and for the expression of oncogene products
US5264423A (en) 1987-03-25 1993-11-23 The United States Of America As Represented By The Department Of Health And Human Services Inhibitors for replication of retroviruses and for the expression of oncogene products
US4904582A (en) 1987-06-11 1990-02-27 Synthetic Genetics Novel amphiphilic nucleic acid conjugates
AU598946B2 (en) 1987-06-24 1990-07-05 Howard Florey Institute Of Experimental Physiology And Medicine Nucleoside derivatives
US5585481A (en) 1987-09-21 1996-12-17 Gen-Probe Incorporated Linking reagents for nucleotide probes
US4924624A (en) 1987-10-22 1990-05-15 Temple University-Of The Commonwealth System Of Higher Education 2,',5'-phosphorothioate oligoadenylates and plant antiviral uses thereof
US5188897A (en) 1987-10-22 1993-02-23 Temple University Of The Commonwealth System Of Higher Education Encapsulated 2',5'-phosphorothioate oligoadenylates
US5525465A (en) 1987-10-28 1996-06-11 Howard Florey Institute Of Experimental Physiology And Medicine Oligonucleotide-polyamide conjugates and methods of production and applications of the same
DE3738460A1 (de) 1987-11-12 1989-05-24 Max Planck Gesellschaft Modifizierte oligonukleotide
US5082830A (en) 1988-02-26 1992-01-21 Enzo Biochem, Inc. End labeled nucleotide probe
WO1989009221A1 (en) 1988-03-25 1989-10-05 University Of Virginia Alumni Patents Foundation Oligonucleotide n-alkylphosphoramidates
US5278302A (en) 1988-05-26 1994-01-11 University Patents, Inc. Polynucleotide phosphorodithioates
US5109124A (en) 1988-06-01 1992-04-28 Biogen, Inc. Nucleic acid probe linked to a label having a terminal cysteine
US5216141A (en) 1988-06-06 1993-06-01 Benner Steven A Oligonucleotide analogs containing sulfur linkages
US5175273A (en) 1988-07-01 1992-12-29 Genentech, Inc. Nucleic acid intercalating agents
US5262536A (en) 1988-09-15 1993-11-16 E. I. Du Pont De Nemours And Company Reagents for the preparation of 5'-tagged oligonucleotides
US5512439A (en) 1988-11-21 1996-04-30 Dynal As Oligonucleotide-linked magnetic particles and uses thereof
US5599923A (en) 1989-03-06 1997-02-04 Board Of Regents, University Of Tx Texaphyrin metal complexes having improved functionalization
US5457183A (en) 1989-03-06 1995-10-10 Board Of Regents, The University Of Texas System Hydroxylated texaphyrins
US5391723A (en) 1989-05-31 1995-02-21 Neorx Corporation Oligonucleotide conjugates
US4958013A (en) 1989-06-06 1990-09-18 Northwestern University Cholesteryl modified oligonucleotides
US5585362A (en) 1989-08-22 1996-12-17 The Regents Of The University Of Michigan Adenovirus vectors for gene therapy
US5451463A (en) 1989-08-28 1995-09-19 Clontech Laboratories, Inc. Non-nucleoside 1,3-diol reagents for labeling synthetic oligonucleotides
US5134066A (en) 1989-08-29 1992-07-28 Monsanto Company Improved probes using nucleosides containing 3-dezauracil analogs
US5254469A (en) 1989-09-12 1993-10-19 Eastman Kodak Company Oligonucleotide-enzyme conjugate that can be used as a probe in hybridization assays and polymerase chain reaction procedures
US5399676A (en) 1989-10-23 1995-03-21 Gilead Sciences Oligonucleotides with inverted polarity
US5264564A (en) 1989-10-24 1993-11-23 Gilead Sciences Oligonucleotide analogs with novel linkages
US5264562A (en) 1989-10-24 1993-11-23 Gilead Sciences, Inc. Oligonucleotide analogs with novel linkages
US5292873A (en) 1989-11-29 1994-03-08 The Research Foundation Of State University Of New York Nucleic acids labeled with naphthoquinone probe
US5177198A (en) 1989-11-30 1993-01-05 University Of N.C. At Chapel Hill Process for preparing oligoribonucleoside and oligodeoxyribonucleoside boranophosphates
US5130302A (en) 1989-12-20 1992-07-14 Boron Bilogicals, Inc. Boronated nucleoside, nucleotide and oligonucleotide compounds, compositions and methods for using same
US5486603A (en) 1990-01-08 1996-01-23 Gilead Sciences, Inc. Oligonucleotide having enhanced binding affinity
US5578718A (en) 1990-01-11 1996-11-26 Isis Pharmaceuticals, Inc. Thiol-derivatized nucleosides
US5681941A (en) 1990-01-11 1997-10-28 Isis Pharmaceuticals, Inc. Substituted purines and oligonucleotide cross-linking
US5459255A (en) 1990-01-11 1995-10-17 Isis Pharmaceuticals, Inc. N-2 substituted purines
US5587470A (en) 1990-01-11 1996-12-24 Isis Pharmaceuticals, Inc. 3-deazapurines
US5587361A (en) 1991-10-15 1996-12-24 Isis Pharmaceuticals, Inc. Oligonucleotides having phosphorothioate linkages of high chiral purity
WO1991013080A1 (en) 1990-02-20 1991-09-05 Gilead Sciences, Inc. Pseudonucleosides and pseudonucleotides and their polymers
US5214136A (en) 1990-02-20 1993-05-25 Gilead Sciences, Inc. Anthraquinone-derivatives oligonucleotides
US5321131A (en) 1990-03-08 1994-06-14 Hybridon, Inc. Site-specific functionalization of oligodeoxynucleotides for non-radioactive labelling
US5470967A (en) 1990-04-10 1995-11-28 The Dupont Merck Pharmaceutical Company Oligonucleotide analogs with sulfamate linkages
US5451513A (en) 1990-05-01 1995-09-19 The State University of New Jersey Rutgers Method for stably transforming plastids of multicellular plants
ES2116977T3 (es) 1990-05-11 1998-08-01 Microprobe Corp Soportes solidos para ensayos de hibridacion de acidos nucleicos y metodos para inmovilizar oligonucleotidos de modo covalente.
US5677437A (en) 1990-07-27 1997-10-14 Isis Pharmaceuticals, Inc. Heteroatomic oligonucleoside linkages
US5602240A (en) 1990-07-27 1997-02-11 Ciba Geigy Ag. Backbone modified oligonucleotide analogs
US5489677A (en) 1990-07-27 1996-02-06 Isis Pharmaceuticals, Inc. Oligonucleoside linkages containing adjacent oxygen and nitrogen atoms
US5623070A (en) 1990-07-27 1997-04-22 Isis Pharmaceuticals, Inc. Heteroatomic oligonucleoside linkages
US5218105A (en) 1990-07-27 1993-06-08 Isis Pharmaceuticals Polyamine conjugated oligonucleotides
US5688941A (en) 1990-07-27 1997-11-18 Isis Pharmaceuticals, Inc. Methods of making conjugated 4' desmethyl nucleoside analog compounds
WO1992002258A1 (en) 1990-07-27 1992-02-20 Isis Pharmaceuticals, Inc. Nuclease resistant, pyrimidine modified oligonucleotides that detect and modulate gene expression
US5610289A (en) 1990-07-27 1997-03-11 Isis Pharmaceuticals, Inc. Backbone modified oligonucleotide analogues
US5541307A (en) 1990-07-27 1996-07-30 Isis Pharmaceuticals, Inc. Backbone modified oligonucleotide analogs and solid phase synthesis thereof
US5608046A (en) 1990-07-27 1997-03-04 Isis Pharmaceuticals, Inc. Conjugated 4'-desmethyl nucleoside analog compounds
US5138045A (en) 1990-07-27 1992-08-11 Isis Pharmaceuticals Polyamine conjugated oligonucleotides
US5618704A (en) 1990-07-27 1997-04-08 Isis Pharmacueticals, Inc. Backbone-modified oligonucleotide analogs and preparation thereof through radical coupling
US5245022A (en) 1990-08-03 1993-09-14 Sterling Drug, Inc. Exonuclease resistant terminally substituted oligonucleotides
HU217036B (hu) 1990-08-03 1999-11-29 Sanofi Eljárás génexpresszió gátlására alkalmas vegyületek előállítására
US5177196A (en) 1990-08-16 1993-01-05 Microprobe Corporation Oligo (α-arabinofuranosyl nucleotides) and α-arabinofuranosyl precursors thereof
US5512667A (en) 1990-08-28 1996-04-30 Reed; Michael W. Trifunctional intermediates for preparing 3'-tailed oligonucleotides
US5214134A (en) 1990-09-12 1993-05-25 Sterling Winthrop Inc. Process of linking nucleosides with a siloxane bridge
US5561225A (en) 1990-09-19 1996-10-01 Southern Research Institute Polynucleotide analogs containing sulfonate and sulfonamide internucleoside linkages
US5596086A (en) 1990-09-20 1997-01-21 Gilead Sciences, Inc. Modified internucleoside linkages having one nitrogen and two carbon atoms
US5432272A (en) 1990-10-09 1995-07-11 Benner; Steven A. Method for incorporating into a DNA or RNA oligonucleotide using nucleotides bearing heterocyclic bases
US5173414A (en) 1990-10-30 1992-12-22 Applied Immune Sciences, Inc. Production of recombinant adeno-associated virus vectors
KR930702373A (ko) 1990-11-08 1993-09-08 안토니 제이. 페이네 합성 올리고누클레오티드에 대한 다중 리포터(Reporter)그룹의 첨합
CA2103705C (en) 1991-02-11 1996-01-30 Ayub K. Ommaya Spinal fluid driven artificial organ
US5222982A (en) 1991-02-11 1993-06-29 Ommaya Ayub K Spinal fluid driven artificial organ
US5719262A (en) 1993-11-22 1998-02-17 Buchardt, Deceased; Ole Peptide nucleic acids having amino acid side chains
US5539082A (en) 1993-04-26 1996-07-23 Nielsen; Peter E. Peptide nucleic acids
US5714331A (en) 1991-05-24 1998-02-03 Buchardt, Deceased; Ole Peptide nucleic acids having enhanced binding affinity, sequence specificity and solubility
US5371241A (en) 1991-07-19 1994-12-06 Pharmacia P-L Biochemicals Inc. Fluorescein labelled phosphoramidites
US5571799A (en) 1991-08-12 1996-11-05 Basco, Ltd. (2'-5') oligoadenylate analogues useful as inhibitors of host-v5.-graft response
DK0648271T3 (da) 1991-08-20 2003-07-21 Us Gov Health & Human Serv Adenovirusmedieret overførsel af gener til mave-/tarmkanal
US5252479A (en) 1991-11-08 1993-10-12 Research Corporation Technologies, Inc. Safe vector for gene therapy
US5484908A (en) 1991-11-26 1996-01-16 Gilead Sciences, Inc. Oligonucleotides containing 5-propynyl pyrimidines
TW393513B (en) 1991-11-26 2000-06-11 Isis Pharmaceuticals Inc Enhanced triple-helix and double-helix formation with oligomers containing modified pyrimidines
US5565552A (en) 1992-01-21 1996-10-15 Pharmacyclics, Inc. Method of expanded porphyrin-oligonucleotide conjugate synthesis
US5595726A (en) 1992-01-21 1997-01-21 Pharmacyclics, Inc. Chromophore probe for detection of nucleic acid
FR2688514A1 (fr) 1992-03-16 1993-09-17 Centre Nat Rech Scient Adenovirus recombinants defectifs exprimant des cytokines et medicaments antitumoraux les contenant.
US5633360A (en) 1992-04-14 1997-05-27 Gilead Sciences, Inc. Oligonucleotide analogs capable of passive cell membrane permeation
US5434257A (en) 1992-06-01 1995-07-18 Gilead Sciences, Inc. Binding compentent oligomers containing unsaturated 3',5' and 2',5' linkages
US5272250A (en) 1992-07-10 1993-12-21 Spielvogel Bernard F Boronated phosphoramidate compounds
US7153684B1 (en) 1992-10-08 2006-12-26 Vanderbilt University Pluripotential embryonic stem cells and methods of making same
CA2145641C (en) 1992-12-03 2008-05-27 Richard J. Gregory Pseudo-adenovirus vectors
US5574142A (en) 1992-12-15 1996-11-12 Microprobe Corporation Peptide linkers for improved oligonucleotide delivery
US5476925A (en) 1993-02-01 1995-12-19 Northwestern University Oligodeoxyribonucleotides including 3'-aminonucleoside-phosphoramidate linkages and terminal 3'-amino groups
GB9304618D0 (en) 1993-03-06 1993-04-21 Ciba Geigy Ag Chemical compounds
WO1994022891A1 (en) 1993-03-31 1994-10-13 Sterling Winthrop Inc. Oligonucleotides with amide linkages replacing phosphodiester linkages
DE69434486T2 (de) 1993-06-24 2006-07-06 Advec Inc. Adenovirus vektoren für gentherapie
US5502177A (en) 1993-09-17 1996-03-26 Gilead Sciences, Inc. Pyrimidine derivatives for labeled binding partners
ATE437232T1 (de) 1993-10-25 2009-08-15 Canji Inc Rekombinanter adenoviren-vektor und verfahren zur verwendung
AU678867B2 (en) 1993-11-09 1997-06-12 Medical College Of Ohio, The Stable cell lines capable of expressing the adeno-associated virus replication gene
EP0733103B1 (en) 1993-11-09 2004-03-03 Targeted Genetics Corporation Generation of high titers of recombinant aav vectors
US5457187A (en) 1993-12-08 1995-10-10 Board Of Regents University Of Nebraska Oligonucleotides containing 5-fluorouracil
US5576198A (en) 1993-12-14 1996-11-19 Calgene, Inc. Controlled expression of transgenic constructs in plant plastids
US5545817A (en) 1994-03-11 1996-08-13 Calgene, Inc. Enhanced expression in a plant plastid
US5545818A (en) 1994-03-11 1996-08-13 Calgene Inc. Expression of Bacillus thuringiensis cry proteins in plant plastids
US5596091A (en) 1994-03-18 1997-01-21 The Regents Of The University Of California Antisense oligonucleotides comprising 5-aminoalkyl pyrimidine nucleotides
US5625050A (en) 1994-03-31 1997-04-29 Amgen Inc. Modified oligonucleotides and intermediates useful in nucleic acid therapeutics
US5525711A (en) 1994-05-18 1996-06-11 The United States Of America As Represented By The Secretary Of The Department Of Health And Human Services Pteridine nucleotide analogs as fluorescent DNA probes
US5658785A (en) 1994-06-06 1997-08-19 Children's Hospital, Inc. Adeno-associated virus materials and methods
US5597696A (en) 1994-07-18 1997-01-28 Becton Dickinson And Company Covalent cyanine dye oligonucleotide conjugates
US5580731A (en) 1994-08-25 1996-12-03 Chiron Corporation N-4 modified pyrimidine deoxynucleotides and oligonucleotide probes synthesized therewith
US5856152A (en) 1994-10-28 1999-01-05 The Trustees Of The University Of Pennsylvania Hybrid adenovirus-AAV vector and methods of use therefor
AU707866B2 (en) 1994-12-06 1999-07-22 Targeted Genetics Corporation Packaging cell lines for generation of high titers of recombinant AAV vectors
US5843780A (en) 1995-01-20 1998-12-01 Wisconsin Alumni Research Foundation Primate embryonic stem cells
FR2737730B1 (fr) 1995-08-10 1997-09-05 Pasteur Merieux Serums Vacc Procede de purification de virus par chromatographie
JPH11511326A (ja) 1995-08-30 1999-10-05 ジエンザイム コーポレイション アデノウィルスおよびaavの精製
US6632670B1 (en) 1995-09-08 2003-10-14 Genzyme Corporation AAV vectors for gene therapy
US5910434A (en) 1995-12-15 1999-06-08 Systemix, Inc. Method for obtaining retroviral packaging cell lines producing high transducing efficiency retroviral supernatant
JP3756313B2 (ja) 1997-03-07 2006-03-15 武 今西 新規ビシクロヌクレオシド及びオリゴヌクレオチド類縁体
ES2557997T3 (es) 1997-09-05 2016-02-01 Genzyme Corporation Métodos para generar preparados de vectores AAV de título elevado sin virus auxiliar
CA2303299C (en) 1997-09-12 2016-02-23 Exiqon A/S Oligonucleotide analogues
WO1999020741A1 (en) 1997-10-23 1999-04-29 Geron Corporation Methods and materials for the growth of primate-derived primordial stem cells
US7410798B2 (en) 2001-01-10 2008-08-12 Geron Corporation Culture system for rapid expansion of human embryonic stem cells
US6667176B1 (en) 2000-01-11 2003-12-23 Geron Corporation cDNA libraries reflecting gene expression during growth and differentiation of human pluripotent stem cells
US7078387B1 (en) 1998-12-28 2006-07-18 Arch Development Corp. Efficient and stable in vivo gene transfer to cardiomyocytes using recombinant adeno-associated virus vectors
US6258595B1 (en) 1999-03-18 2001-07-10 The Trustees Of The University Of Pennsylvania Compositions and methods for helper-free production of recombinant adeno-associated viruses
JP2003507438A (ja) 1999-08-24 2003-02-25 セルゲイト, インコーポレイテッド オリゴアルギニン部分を使用する上皮組織を横切るおよび上皮組織内への薬物送達の増強
US7229961B2 (en) 1999-08-24 2007-06-12 Cellgate, Inc. Compositions and methods for enhancing drug delivery across and into ocular tissues
EP1083231A1 (en) 1999-09-09 2001-03-14 Introgene B.V. Smooth muscle cell promoter and uses thereof
US7256286B2 (en) 1999-11-30 2007-08-14 The Board Of Trustees Of The Leland Stanford Junior University Bryostatin analogues, synthetic methods and uses
US6287860B1 (en) 2000-01-20 2001-09-11 Isis Pharmaceuticals, Inc. Antisense inhibition of MEKK2 expression
AU5557501A (en) 2000-04-28 2001-11-12 Univ Pennsylvania Recombinant aav vectors with aav5 capsids and aav5 vectors pseudotyped in heterologous capsids
MXPA03007358A (es) 2001-02-16 2004-12-13 Cellgate Inc Transportadores que contienen porciones de arginina separadas.
US20030158403A1 (en) 2001-07-03 2003-08-21 Isis Pharmaceuticals, Inc. Nuclease resistant chimeric oligonucleotides
US7169874B2 (en) 2001-11-02 2007-01-30 Bausch & Lomb Incorporated High refractive index polymeric siloxysilane compositions
US8278104B2 (en) 2005-12-13 2012-10-02 Kyoto University Induced pluripotent stem cells produced with Oct3/4, Klf4 and Sox2
US20090227032A1 (en) 2005-12-13 2009-09-10 Kyoto University Nuclear reprogramming factor and induced pluripotent stem cells
PT1970446E (pt) 2005-12-13 2011-09-01 Univ Kyoto Factor de reprogramação nuclear
PL2019683T5 (pl) 2006-04-25 2022-12-05 The Regents Of The University Of California Podawanie czynników wzrostu do leczenia zaburzeń OUN
US20080081064A1 (en) 2006-09-28 2008-04-03 Surmodics, Inc. Implantable Medical Device with Apertures for Delivery of Bioactive Agents
JP2008307007A (ja) 2007-06-15 2008-12-25 Bayer Schering Pharma Ag 出生後のヒト組織由来未分化幹細胞から誘導したヒト多能性幹細胞
US9683232B2 (en) 2007-12-10 2017-06-20 Kyoto University Efficient method for nuclear reprogramming
JP2011510750A (ja) 2008-01-29 2011-04-07 クライマン、ギルバート・エイチ 薬物送達デバイス、キット及びそれらの方法
US9209196B2 (en) 2011-11-30 2015-12-08 Sharp Kabushiki Kaisha Memory circuit, method of driving the same, nonvolatile storage device using the same, and liquid crystal display device
US9802715B2 (en) 2012-03-29 2017-10-31 The Boeing Company Fastener systems that provide EME protection
DE102012007232B4 (de) 2012-04-07 2014-03-13 Susanne Weller Verfahren zur Herstellung von rotierenden elektrischen Maschinen
DK2898075T3 (en) 2012-12-12 2016-06-27 Broad Inst Inc CONSTRUCTION AND OPTIMIZATION OF IMPROVED SYSTEMS, PROCEDURES AND ENZYME COMPOSITIONS FOR SEQUENCE MANIPULATION
JP2015092462A (ja) 2013-09-30 2015-05-14 Tdk株式会社 正極及びそれを用いたリチウムイオン二次電池
EP3760719A1 (en) * 2013-11-18 2021-01-06 CRISPR Therapeutics AG Crispr-cas system materials and methods
JP6202701B2 (ja) 2014-03-21 2017-09-27 株式会社日立国際電気 基板処理装置、半導体装置の製造方法及びプログラム
JP6197169B2 (ja) 2014-09-29 2017-09-20 東芝メモリ株式会社 半導体装置の製造方法
EP4269577A3 (en) 2015-10-23 2024-01-17 President and Fellows of Harvard College Nucleobase editors and uses thereof
EP3383409A4 (en) * 2015-12-02 2019-10-02 The Regents of The University of California COMPOSITIONS AND METHODS FOR MODIFYING TARGET NUCLEIC ACID
MA51138A (fr) 2017-12-14 2020-10-21 Bayer Healthcare Llc Nouveaux systèmes d'endonucléases arn-programmables et leurs utilisations dans l'édition de génome et d'autres applications

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104854241A (zh) * 2012-05-25 2015-08-19 埃玛纽埃尔·沙尔庞捷 用于rna定向的靶dna修饰和用于rna定向的转录调节的方法和组合物
US20160130608A1 (en) * 2012-05-25 2016-05-12 The Regents Of The University Of California Methods and compositions for rna-directed target dna modification and for rna-directed modulation of transcription
CN106687594A (zh) * 2014-07-11 2017-05-17 纳幕尔杜邦公司 用于产生对草甘膦除草剂具有抗性的植物的组合物和方法
WO2017083852A1 (en) * 2015-11-13 2017-05-18 MOORE, Tara Methods for the treatment of corneal dystrophies

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023098485A1 (zh) * 2021-11-30 2023-06-08 上海科技大学 一种基于c2c9核酸酶的新型基因组编辑系统及其应用
CN117511912A (zh) * 2023-12-22 2024-02-06 辉大(上海)生物科技有限公司 IscB多肽、包含其的系统及其用途
CN117511912B (zh) * 2023-12-22 2024-03-29 辉大(上海)生物科技有限公司 IscB多肽、包含其的系统及其用途

Also Published As

Publication number Publication date
US11578323B2 (en) 2023-02-14
EP3724332A1 (en) 2020-10-21
JP2021506251A (ja) 2021-02-22
AU2018386301A1 (en) 2020-06-18
MA51138A (fr) 2020-10-21
US20200385720A1 (en) 2020-12-10
CA3084825A1 (en) 2019-06-20
WO2019118935A1 (en) 2019-06-20

Similar Documents

Publication Publication Date Title
CN111801417A (zh) 新的rna-可编程的内切核酸酶系统及其在基因组编辑和其他应用中的用途
JP7306696B2 (ja) Rna誘導型核酸修飾酵素及びその使用方法
AU2023204605B2 (en) Compositions and methods for treating hemoglominopathies
JP2023027277A (ja) Rna誘導型核酸修飾酵素及びその使用方法
KR20210139265A (ko) 표적 서열에서 핵염기를 변형하기 위한 아데노신 데아미나제 염기 편집기 및 이의 사용 방법
KR20210023833A (ko) 프로그래밍가능한 염기 편집기 시스템을 이용하여 단일염기다형성을 편집하는 방법
KR20220076467A (ko) 신규 핵염기 편집기 및 이의 사용 방법
JP2018532402A (ja) Rnaプログラム可能エンドヌクレアーゼの新規のファミリーならびにゲノム編集および他の適用におけるそれらの使用
CN112424348A (zh) 新颖的rna-可编程的内切核酸酶系统及其用途
KR20210127206A (ko) 유전성 질환의 치료를 위한 것을 포함하는, 아데노신 데아미나제 염기 편집기를 사용하여 질환-관련 유전자를 편집하는 방법
KR20220010540A (ko) 프로그래밍가능한 염기 편집기 시스템을 이용하여 단일염기다형성을 편집하는 방법
KR20210126680A (ko) 알파-1 항트립신 결핍증을 치료하기 위한 조성물 및 방법
CN114040971A (zh) CRISPR-Cas效应子多肽及其使用方法
JP2023508362A (ja) Crispr-casエフェクターポリペプチド及びその使用方法
AU2020239225A1 (en) Novel high fidelity RNA-programmable endonuclease systems and uses thereof
KR20210129108A (ko) 글리코겐 저장 질환 1a형을 치료하기 위한 조성물 및 방법
AU2022290382A9 (en) Type v rna programmable endonuclease systems
EP4101928A1 (en) Type v rna programmable endonuclease systems
WO2023118068A1 (en) Novel small type v rna programmable endonuclease systems
CN117940560A (zh) 具有改进的pam特异性的新型小rna可编程核酸内切酶系统及其用途
CN118103502A (zh) V型rna可编程核酸内切酶系统
KR20230124553A (ko) 글리코겐축적병 1a형을 치료하기 위한 조성물 및 방법
WO2023237587A1 (en) Novel small type v rna programmable endonuclease systems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination