CN109312316B - 修饰基因组的组合物和方法 - Google Patents

修饰基因组的组合物和方法 Download PDF

Info

Publication number
CN109312316B
CN109312316B CN201780014661.1A CN201780014661A CN109312316B CN 109312316 B CN109312316 B CN 109312316B CN 201780014661 A CN201780014661 A CN 201780014661A CN 109312316 B CN109312316 B CN 109312316B
Authority
CN
China
Prior art keywords
dna
sequence
csm1
cpf
polypeptide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201780014661.1A
Other languages
English (en)
Other versions
CN109312316A (zh
Inventor
M·贝其曼
B·N·格雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Benson Hill SA
Original Assignee
Benson Hill SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Benson Hill SA filed Critical Benson Hill SA
Priority to CN202211143483.1A priority Critical patent/CN115927440A/zh
Publication of CN109312316A publication Critical patent/CN109312316A/zh
Application granted granted Critical
Publication of CN109312316B publication Critical patent/CN109312316B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8274Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for herbicide resistance
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/102Mutagenizing nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8202Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation by biological means, e.g. cell mediated or natural vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8213Targeted insertion of genes into the plant genome by homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/22Vectors comprising a coding region that has been codon optimised for expression in a respective host

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Chemical & Material Sciences (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Cell Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Peptides Or Proteins (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Compositions Of Macromolecular Compounds (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Saccharide Compounds (AREA)

Abstract

提供了用于修饰基因组DNA序列的组合物和方法。该方法在基因组DNA序列中的预定靶位点生成双链断裂(DSB),在基因组中的靶位点导致DNA序列的突变、插入和/或缺失。组合物包括DNA构建体,其包括编码Cpf1或Csm1蛋白的核苷酸酸序列,其操作性连接至在感兴趣细胞中操作性的启动子。DNA构建体可以用于指导在预定基因组基因座处的基因组DNA修饰。本文描述了使用这些DNA构建体来修饰基因组DNA序列的方法。此外,提供了用于调节基因表达的组合物和方法。组合物包括DNA构建体,其包括在感兴趣细胞中操作性的启动子,其操作性地连接至编码消除了生成DSB能力的突变型Cpf1或Csm1蛋白的核苷酸序列,任选地连接至调节转录活性的结构域。该方法可以用于上调或下调预定基因组基因座处的基因表达。

Description

修饰基因组的组合物和方法
发明领域
本发明涉及用于在预选定的位置编辑基因组序列以及用于调节基因表达的组合物和方法。
关于通过EFS-WEB以文本文件形式提交的序列表
序列表的正式文本通过EFS-Web以按照美国信息交换用标准码(ASCII)文本文件与说明书同时提交,文件名为B88552_1060WO_0057_1_Seq_List.txt,创建日期为2017年2月14日,大小为1.62MB。通过EFS-Web提交的该序列表是本说明书的一部分且通过引用全文纳入本文。
背景技术
基因组DNA的修饰对于基础和应用研究是极其重要的。基因组修饰有可能说明并且在一些情况中治疗疾病的起因,以及在包括这样修饰的个体和/或细胞中提供所需特性。基因组修饰可以包括例如植物、动物、真菌的修饰,和/或原核基因组修饰。实施基因组修饰的一个领域是植物基因组DNA的修饰。
植物基因组DNA的修饰对于基础和应用植物学研究是极其重要的。具有稳定修饰的基因组DNA的转基因植物可以具有新的性状,如除草剂耐受,抗虫性,和/或积累有价值蛋白质,包括赋予它们的药用蛋白和工业酶。原生植物基因的表达可能会被上调或下调或以其他方式改变(例如,通过改变表达原生植物基因的组织),它们的表达可能会完全消除,DNA序列可能会被改变(例如,通过点突变、插入或缺失),或新的非原生基因可能会插入植物基因组,从而将新的性状赋予植物。
修饰植物基因组DNA最常规的方法倾向于在基因组内随机位点修饰DNA。这样的方法包括例如农杆菌介导的植物转化和生物弹射转化,也称之为颗粒轰击。然而,在许多情况中,所希望的是能够在感兴趣的植物基因组中的预定靶位点修饰基因组DNA,例如,以避免破坏原生植物基因或者将转基因盒插入已知将提供稳健基因表达的基因组基因座。直至近日才有用于靶向修饰植物基因组DNA的技术。这样的技术依赖于在所需位点产生双链断裂(DSB)。该DSB导致植物的原生DNA-修复机制被募集至DSB。可以控制DNA-修复机制以在预定位点插入异源性DNA,以使原生植物基因组DNA缺失,或以在所需位置生成点突变、插入或缺失。
发明内容
提供了用于修饰基因组DNA序列的组合物和方法。本文所用基因组DNA表示线性和/或染色体DNA和/或感兴趣的一种或多种细胞中存在的质粒或其它染色体外DNA序列。该方法在基因组DNA序列中的预定靶位点生成双链断裂(DSB),在基因组中的靶位点导致DNA序列的突变、插入和/或缺失。组合物包括DNA构建体,其包括编码Cpf1或Csm1蛋白的核苷酸序列,其操作性连接至在感兴趣细胞中可操作的启动子。DNA构建体可以用于指导在预定基因组基因座的基因组DNA修饰。本文描述了使用这些DNA构建体来修饰基因组DNA序列的方法。修饰的植物、植物细胞、植物部分和种子也包括在内。还提供了用于调节基因表达的组合物和方法。该方法靶向蛋白质至基因组中预定位点以实现上调或下调一种或多种基因,其表达由基因组中靶向的位点调节。组合物包括含有核苷酸序列的DNA构建体,所述核苷酸序列编码具有减弱或消失的核酸酶活性的修饰的Cpf1或Csm1蛋白,任选地融合转录活性或抑制结构域。本文描述了使用这些DNA构建体来修饰基因表达的方法。
附图说明
图1示出显示潮霉素抗性基因盒插入水稻CAO1基因组基因座的示意图。星号表示野生型DNA中目标Cpf1介导的双链断裂的位点。虚线表示修复供体盒与野生型DNA之间的同源性。小箭头表示用于验证目标基因组基因座处插入的PCR反应的引物结合位点。35STerm.,CaMV 35S终止子;hph,潮霉素抗性基因;ZmUbi,玉米泛素启动子。
图2示出由实验1中生成的水稻愈伤组织获得的序列数据。图2A示出hph盒插入CAO1基因座的结果。PAM序列用方框表示,而引导RNA靶向的序列用下划线表示。省略号表示存在一个大插入,但是完整的序列数据未在此处示出。图2B、2C和2D示出由水稻愈伤组织获得的数据,其中FnCpf1介导的缺失事件在实验01中出现(表7)。在图2B和2C中,泳道从左至右表示愈伤组织块#1-16,之后是分子量梯标泳道。图2B示出FnCpf1基因盒的PCR扩增,表明在愈伤组织块1、2、4、6、7和15中该基因盒插入水稻基因组。图2C示出对提取自这些相同愈伤组织块DNA的T7EI试验的结果,愈伤组织#15的双条带模式表明可能的插入或缺失。在实验01的重复中其它愈伤组织获得类似的T7EI试验结果,这导致生成愈伤组织块01-20、01-21、01-30和01-31。图2D示出获自愈伤组织#15(01-15)的序列数据以及来自愈伤组织01-20、01-21、01-30和01-31的序列数据的比对。PAM序列用方框表示,而引导RNA靶向的序列用下划线表示。
图3示出来自实验31、46、80、81、91和93的序列数据,验证水稻CAO1基因组基因座中Cpf1介导的和Csm1介导的插入缺失。图3A显示了野生型水稻CAO1基因座与来自下述的序列数据的比对:实验31的愈伤组织块#21(31-21),实验80的愈伤组织块#33(80-33),实验81的愈伤组织块9、30和46(分别为81-09、81-30和81-46),实验93的愈伤组织块#47(93-47),实验91的愈伤组织块#4(91-04),实验97的愈伤组织块#112和141(97-112和97-141)以及实验119的愈伤组织块#4和11(119-04和119-11)。图3B示出来自实验46的愈伤组织块46-38、46-77、46-86、46-88和46-90的序列数据。在4A和4B中,PAM位点用方框表示,而引导RNA靶向的区域用下划线表示。
图4示出恢复自实验70和75的意料之外的重组事件的概况。图4A示出一部分131633质粒的示意图,其包括35S终止子的同源区域以及导致重组事件从实验70恢复的下游臂。将似乎介导了意料之外的HDR事件的同源性区域用下划线表示。图4B示出愈伤组织块70-15的测序数据。WT,野生型序列;GE70,愈伤组织块70-15序列;131633_上游,来自质粒131633的上游臂和35S Term序列;131633_下游,来自质粒131633的下游臂序列。图4C示出一部分131633质粒的示意图,其包括35S终止子的同源区域以及导致重组事件从实验75恢复的下游臂。将似乎介导了意料之外的HDR事件的同源性区域用下划线表示。图4D示出愈伤组织块75-46的测序数据。WT,野生型序列;GE75,愈伤组织块75-46序列;131633_上游,来自质粒131633的上游臂和35S Term序列;131633_下游,来自质粒131633的下游臂序列。35STerm.,CaMV 35S终止子;hph,潮霉素磷酸转移酶编码区域;pZmUbi:玉米泛素启动子。在图4B和4D中,PAM位点用方框表示。
图5示出实验46的愈伤组织块#46-161上游区域的序列(表7)。PAM位点用方框表示,其显示转化的水稻愈伤组织中该位点意料之中的突变,并且该序列数据表明载体131633成功插入水稻CAO1基因组基因座。
发明详述
本文提供了这样的方法和组合物,其用于控制涉及序列靶向(如基因组干扰或基因编辑)的基因表达,所述序列靶向与CRISPR-Cpf或CRISPR-Csm系统和其组件有关。在某些实施方式中,CRISPR酶是Cpf酶,例如,Cpf1直向同源物。在某些实施方式中,CRISPR酶是Csm酶,例如,Csm1直向同源物。该方法和组合物包括核酸结合靶DNA序列。这是有利的,因为核酸的生产相比例如肽容易得多且较为便宜,并且特异性根据同源性寻求延伸的长度可以不同。例如,并不需要复杂的多指3-D定位。
同样提供的是编码Cpf1和Csm1多肽的核酸,以及使用Cpf1和Csm1多肽来修饰包括植物细胞在内的宿主细胞染色体(即,基因组)或细胞群DNA序列的方法。Cpf1多肽与特定的引导RNA(gRNA)相互作用,其将Cpf1或Csm1内切核酸酶导向特定的靶位点,Cpf1或Csm1内切核酸酶在该位点引入可以通过DNA修复过程修复的双链断裂,从而修饰DNA序列。因为特异性是通过引导RNA所提供,Cpf1或Csm1多肽是通用的,并且可以与不同的引导RNA用于靶向不同的基因组序列。相比CRISPR阵列常规使用的Cas核酸酶(例如,Cas9),Cpf1和Csm1内切核酸酶具有某些优势。例如,Cpf1相关CRISPR阵列被加工成成熟的crRNA,不需要额外的反式活化crRNA(tracrRNA)。此外,Cpf1-crRNA复合物可以切割这样的靶DNA,所述靶DNA前有通常富T的短原型间隔子(protospacer)-邻近基序(PAM),这与许多Cas9系统靶DNA后富G的PAM形成对比。此外,Cpf1可以引入具有4或5个核苷酸(nt)的5'突出端的交错双链断裂。并不受限于理论,Csm1蛋白有可能同样地将其CRISPR阵列加工成成熟的crRNA,不需要额外的反式活化crRNA(tracrRNA),并且生成交错切口,而非钝性切口。本文所公开的方法可以用于靶向和修饰特定染色体序列和/或将外源性序列引入植入细胞或植物胚胎基因组中靶向的位置。该方法还可以用于引入序列或修饰细胞器(例如,叶绿体和/或线粒体)内区域。此外,靶向是特异性的,并且具有有限的脱靶作用。
I.Cpf1和Csm1内切核酸酶
本文提供了用于修饰基因组包括植物基因组的Cpf1和Csm1内切核酸酶及其片段和变体。本文所用术语Cpf1内切核酸酶或Cpf1多肽表示Zetsche等(2015)Cell 163:759-771中公开的Cpf1多肽以及美国专利申请号2016/0208243中公开的Cpf1多肽的同源物和直向同源物及其片段和变体。Cpf1多肽的示例示于SEQ ID NO:3、6、9、12、15、18、20、23、106-133、135-146、148-158、161-173和231-236。本文所用术语Csm1内切核酸酶或Csm1多肽表示SEQ ID NO:134、147、159、160和230的同源物和直向同源物。通常,Cpf1和Csm1内切核酸酶可以在不使用tracrRNA的情况下作用,并且引入交错的DNA双链断裂。通常,Cpf1和Csm1多肽包括至少一个RNA识别和/或RNA结合结构域。RNA识别和/或RNA结合结构域与引导RNA相互作用。Cpf1和Csm1多肽可以还包括核酸酶结构域(即,DNA酶或RNA酶结构域),DNA结合结构域,解旋酶结构域,RNA酶结构域,蛋白-蛋白相互作用结构域,二聚化结构域以及其它结构域。在具体实施方式中,Cpf1或Csm1多肽,或编码Cpf1或Csm1多肽的多核苷酸,包括:与DNA-靶向RNA相互作用的RNA-结合部分,以及显示定点酶促活性的活性部分,如RuvC内切核酸酶结构域。
Cpf1或Csm1多肽可以是野生型Cpf1或Csm1多肽,修饰型Cpf1或Csm1多肽,或野生型或修饰型Cpf1或Csm1多肽的片段。Cpf1或Csm1多肽可以经修饰以增强核酸结合亲和力和/或特异性,改变酶促活性,和/或改变蛋白质的其它性质。例如,Cpf1或Csm1多肽的核酸酶(即,DNA酶、RNA酶)结构域可以经修饰、缺失或灭活。或者,Cpf1或Csm1多肽可以经截短以去除对于蛋白质功能非必须的结构域。在具体实施方式中,Cpf1或Csm1多肽形成同二聚体或异二聚体。
在一些实施方式中,Cpf1或Csm1多肽可以源自野生型Cpf1或Csm1多肽或其片段。在其它实施方式中,Cpf1或Csm1多肽可以源自修饰型Cpf1或Csm1多肽。例如,Cpf1或Csm1多肽的氨基酸序列可以经修饰以改变蛋白质的一种或多种性质(例如,核酸酶活性、亲和力、稳定性等)。或者,可以将不涉及RNA引导的切割的Cpf1或Csm1多肽的结构域从蛋白质中去除,从而使得修饰型Cpf1或Csm1多肽小于野生型Cpf1或Csm1多肽。
通常,Cpf1或Csm1多肽包括至少一个核酸酶(即,DNA酶)结构域,但是不需要含有诸如Cas9蛋白中存在的HNH结构域。例如,Cpf1或Csm1多肽可以包括RuvC样核酸酶结构域。在一些实施方式中,Cpf1或Csm1多肽可以经修饰以使核酸酶结构域失活,从而使其不在具有功能性。在一些实施方式中,其中一个核酸酶结构域被灭活,Cpf1或Csm1多肽不切割双链DNA。在具体实施方式中,当进行降低或消除核酸酶活性的最大同一性比对时,突变的Cpf1或Csm1多肽在对应FnCpf1(SEQ ID NO:3)位置917或1006或者SmCsm1(SEQ ID NO:160)位置701或922的位置中包括突变。例如,RuvC样结构域中天冬氨酸向丙氨酸(D917A)的转化以及谷氨酸向丙氨酸(E1006A)完全灭活FnCpf1(SEQ ID NO:3)的DNA切割活性,而天冬氨酸向丙氨酸(D1255A)显著地降低切割活性(Zetsche等(2015)Cell 163:759-771)。核酸酶结构域可以使用已知的方法修饰,如定点诱变,PCR介导的诱变,和全基因合成,以及本领域已知的任何其它方法。具有灭活的核酸酶结构域的Cpf1或Csm1蛋白(dCpf1或dCsm1蛋白)可以用于在不修饰DNA序列的情况下调节基因表达。在某些实施方式中,dCpf1或dCsm1蛋白可以通过使用适当的gRNA靶向基因组的特定区域,如感兴趣的一种或多种基因的启动子。dCpf1或dCsm1蛋白质可以与DNA的所需区域结合并且可以干扰RNA聚合酶与该DNA区域的结合和/或转录因子与该DNA区域的结合。该技术可以用于上调或下调感兴趣的一种或多种基因的表达。在某些其它实施方式中,dCpf1或dCsm1蛋白可以与阻抑物结构域融合以进一步下调这样一种或多种基因的表达,所述一种或多种基因的表达被RNA聚合酶、转录因子或其它转录调节物与gRNA靶向的染色体DNA区域间的相互作用所调节。在某些其它实施方式中,dCpf1或dCsm1蛋白可以与激活结构域融合以上调这样一种或多种基因的表达,所述一种或多种基因的表达被RNA聚合酶、转录因子或其它转录调节物与gRNA靶向的染色体DNA区域间的相互作用所调节。
本文所公开的Cpf1和Csm1多肽可以还包括至少一个核定位信号(NLS)。通常,NLS包括碱性氨基酸的拉伸。本领域已知核定位信号(参见,例如,Lange等,J.Biol.Chem.(2007)282:5101-5105)。NLS可以定位于N末端,C末端,或Cpf1或Csm1多肽的内部位置。在一些实施方式中,Cpf1或Csm1多肽可以还包括至少一个细胞穿透结构域。细胞穿透结构域可以定位于N末端,C末端,或蛋白质的内部位置。
本文所公开的Cpf1或Csm1多肽可以还包括至少一种质体靶向信号肽,至少一种线粒体靶向信号肽,或使Cpf1或Csm1多肽靶向质体和线粒体的信号肽。本领域已知质体、线粒体和双靶向信号肽定位信号(参见,例如,Nassoury和Morse(2005)Biochim Biophys Acta1743:5-19;Kunze和Berger(2015)Front Physiol dx.doi.org/10.3389/fphys.2015.00259;Herrmann和Neupert(2003)IUBMB Life 55:219-225;Soll(2002)CurrOpin Plant Biol 5:529-535;Carrie和Small(2013)Biochim Biophys Acta 1833:253-259;Carrie等(2009)FEBS J276:1187-1195;Silva-Filho(2003)Curr Opin Plant Biol6:589-595;Peeters和Small(2001)Biochim Biophys Acta 1541:54-63;Murcha等(2014)JExp Bot65:6301-6335;Mackenzie(2005)Trends Cell Biol 15:548-554;Glaser等(1998)Plant Mol Biol 38:311-338)。质体、线粒体或双靶向信号肽可以定位于N末端,C末端,或Cpf1或Csm1多肽的内部位置。
在其他实施方式中,Cpf1或Csm1多肽还可以还包括至少一个标志物结构域。标志物结构域的非限制实例包括荧光蛋白、纯化标签和表位标签。在某些实施方式中,标志物结构域可以是荧光蛋白。合适的荧光蛋白的非限制性实例包括:绿色荧光蛋白(例如,GFP、GFP-2、tagGFP、turboGFP、EGFP、Emerald、Azami Green、Azami Green单体、CopGFP、AceGFP、ZsGreen1),黄色荧光蛋白(例如,YFP、EYFP、Citrine、Venus、YPet、PhiYFP、ZsYellow1),蓝色荧光蛋白(例如,EBFP、EBFP2、Azurite、mKalama1、GFPuv、Sapphire、T-sapphire),青色荧光蛋白(例如,ECFP、Cerulean、CyPet、AmCyan1、Midoriishi-Cyan),红色荧光蛋白(mKate、mKate2、mPlum、DsRed单体、mCherry、mRFP1、DsRed-Express、DsRed2、DsRed单体、HcRed-Tandem、HcRed1、AsRed2、eqFP611、mRasberry、mStrawberry、Jred)以及橙色荧光蛋白(mOrange、mKO、Kusabira-Orange、Monomeric Kusabira-Orange、mTangerine、tdTomato)或任何其它合适的荧光蛋白。在其他实施方式中,标志物结构域可以是纯化标签和/或表位标签。示例性的标签包括但不限于,谷胱甘肽S-转移酶(GST)、甲壳素结合蛋白(CBP)、麦芽糖结合蛋白质、硫氧还蛋白(TRX)、多聚(NANP)、串联亲和纯化(TAP)标签、myc、AcV5、AU1、AU5、E、ECS、E2、FLAG、HA、nus、Softag 1、Softag 3、Strep、SBP、Glu-Glu、HSV、KT3、S、S1、T7、V5、VSV-G、6xHis、生物素羧基载体蛋白(BCCP)和钙调蛋白。
在某些实施方式中,Cpf1或Csm1多肽可以是含有引导RNA的蛋白质-RNA复合物的一部分。引导RNA与Cpf1或Csm1多肽相互作用将Cpf1或Csm1多肽导向特定靶位点,其中引导RNA的5'端可与植物基因组中感兴趣的核苷酸序列的特定原型间隔子序列碱基配对,无论是核、质体和/或线粒体基因组的任何部分。本文所用术语“DNA-靶向RNA”表示这样的引导RNA,其与植物细胞基因组中感兴趣的核苷酸序列靶位点以及Cpf1或Csm1多肽相互作用。DNA-靶向RNA,或编码DNA-靶向RNA的DNA多核苷酸,可以包括:包括与靶DNA中序列互补的核苷酸序列的第一区段,以及与Cpf1或Csm1多肽相互作用的第二区段。
编码本文所公开的Cpf1和Csm1多肽的多核苷酸可以用于分离来自其它原核或真核生物的相应序列。由此,PCR、杂交和其他类似方法可用于根据此类序列与本文所示序列的序列同源性或同一性来鉴定该序列。根据该序列与本文所示完整的Cpf1和Csm1序列或其变体和片段的序列同一性而分离的序列涵盖在本发明中。此类序列包括公开的Cpf1和Csm1序列的直向同源物序列。“直向同源物”是指源自共同祖先基因且由于物种形成而在不同物种中发现的基因。当在不同物种中发现的基因的核苷酸序列和/或它们的编码蛋白质序列具有至少约75%、约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%或更大的序列同一性时,它们被认为是直向同源物。直向同源物的功能通常在物种之间高度保守。因此,本发明涵盖分离的核苷酸,其编码具有Cpf1和Csm1内切核酸酶活性的多肽,并且与本文公开的序列具有至少约75%或更大的序列同一性。如本文所用,Cpf1或Csm1内切核酸酶活性表示CRISPR内切核酸酶活性,其中与Cpf1或Csm1多肽关联的引导RNA(gRNA)引起Cpf1-gRNA或Csm1-gRNA复合物结合至预定的核苷酸序列,该核苷酸序列与gRNA互补;并且其中Cpf1或Csm1活性可以向gRNA靶向的位点或其附近引入双链断裂。在某些实施方式中,该双链断裂可以是交错的DNA双链断裂。本文所用“交错的DNA双链断裂”可以使双链断裂在切割后在3'或5'端上具有约1个、约2个、约3个、约4个、约5个、约6个、约7个、约8个、约9个或约10个核苷酸的突出端。在具体实施方式中,Cpf1或Csm1多肽引入具有4或5nt的5'突出端的交错的DNA双链断裂。该双链断裂可以发生在DNA-靶向RNA(例如,引导RNA)序列所靶向的序列或其附近。
本文包括Cpf1和Csm1多核苷酸的片段和变体以及由其编码的Cpf1和Csm1氨基酸序列。“片段”是指多核苷酸的部分或氨基酸序列的部分。“变体”是指基本相似的序列。对于多核苷酸,变体包括具有以下的多核苷酸:在5'和/或3'端处的缺失(即,截短);在天然多核苷酸中一个或多个内部位点处的缺失和/或添加;和/或在天然多核苷酸中一个或多个位点处一个或多个核苷酸的取代。本文所用的“原始”多核苷酸或多肽分别包含天然产生的核苷酸序列或氨基酸序列。一般而言,本发明的特定多核苷酸的变体将与特定核苷酸有至少约75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更大的序列同一性,如由本文他处所述的序列比对程序和参数所确定。
“变体”氨基酸或蛋白是指通过在天然蛋白质的N-末端和/或C-末端处缺失(也称为截短)一个或多个氨基酸;在天然蛋白质的一个或多个内部位点处缺失和/或添加一个或多个氨基酸;或在天然蛋白质的一个或多个位点处取代一个或多个氨基酸衍生的氨基酸或蛋白质。本发明包括的变体蛋白质有生物活性,即它们继续具有原始蛋白质的所需生物活性。原始多肽的生物活性变体将与由本文所述的序列比对程序和参数确定的原始序列的氨基酸序列具有至少约80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更大的序列同一性。本发明的蛋白质的生物活性变体与该蛋白质可相差少至1-15个氨基酸残基,少至1-10个,如6-10个,少至4、3、2或甚至1个氨基酸残基。
也可通过分析测序的基因组的现有数据库来鉴定变体序列。在这种方式中,可鉴定相应序列并用于本发明的方法中。
比对序列用于比较的方法是本领域熟知的。因此,可采用数学算法确定两个序列的序列同一性百分数。该数学算法的非限制性示例是Myers和Miller(1988)CABIOS 4:11-17的算法;Smith等.(1981)Adv.Appl.Math.2:482的局部比对算法;Needleman和Wunsch(1970)J.Mol.Biol.48:443-453的全局比对算法;Pearson和Lipman(1988)Proc.Natl.Acad.Sci.85:2444-2448的搜索局部比对方法;Karlin和Altschul(1990)Proc.Natl.Acad.Sci.USA 87:2264-2268的算法,由Karlin和Altschul(1993)Proc.Natl.Acad.Sci.USA 90:5873-5877改良。
这些数学算法的计算机实施手段可用于比较序列来确定序列同一性。这类实施手段包括但不限于:PC/Gene程序中的CLUSTAL(购自美国加利福尼亚州芒廷维尤的智慧遗传公司(Intelligenetics,Mountain View,California);ALIGN程序(2.0版)和GCGWisconsin遗传软件包中的GAP,BESTFIT、BLAST、FASTA和TFASTA,10版(购自阿克赛勒里公司(Accelrys Inc.),美国加利福尼亚州圣地亚哥Scranton路9685号)。可用默认参数来进行使用这些程序的比对。CLUSTAL程序由以下详细描述:Higgins等,(1988)Gene 73:237-244;Higgins等,(1989)CABIOS 5:151-153;Corpet等,(1988)Nucleic Acids Res.16:10881-90;Huang等,(1992)CABIOS 8:155-65;和Pearson等,(1994)Meth.Mol.Biol.24:307-331。ALIGN程序基于Myers和Miller(1988)同上的算法。比较氨基酸序列时,PAM120权重残基表、缺口长度罚分12、和缺口罚分4可与ALIGN程序联用。Altschul等,(1990)J.Mol.Biol.215:403的BLAST程序基于Karlin和Altschul(1990)同上的算法。可利用BLASTN程序进行BLAST核苷酸搜索(评分=100,字长=12),以获得与编码本发明蛋白质的核苷酸序列同源的核苷酸序列。可利用BLASTX程序进行BLAST蛋白质搜索(评分=50,字长=3),以获得与本发明蛋白质或多肽同源的氨基酸序列。为了获得缺口比对(出于比较目的),可如Altschul等,(1997)Nucleic Acids Res.,25:33893402所述利用缺口BLAST(在BLAST 2.0中)。或者,可利用PSI-BLAST(在BLAST 2.0中)进行迭代搜索,其用来检测分子之间的远近关系。参见Altschul等,(1997)同上。利用BLAST、缺口BLAST和PSI-BLAST程序时,可使用各程序(例如针对蛋白质的BLASTX,针对核苷酸的BLASTN)的默认参数。参见网站www.ncbi.nlm.nih.gov。也可通过检查来人工进行比对。
编码Cpf1和Csm1多肽的核酸分子或其片段或变体可以经密码子优化,用于在感兴趣的植物或感兴趣的其它细胞或生物体中表达。"密码子优化的基因"是这样的基因,其密码子使用频率经指定以模拟宿主细胞的优选的密码子使用频率。核酸分子可以是完全或部分优化的密码子。因为任一氨基酸(除了甲硫氨酸和色氨酸)均由多种密码子编码,所述核酸分子的序列可变化但不改变编码的氨基酸。密码子优化是在核酸水平上改变一种或多种密码子时,致使氨基酸不变,但在具体的宿主生物体中的表达增加。本领域普通技术人员将知晓密码子表格,并且,提供关于广泛生物体的偏好信息的其它参考文献是本领域中可得的(参见例如,Zhang等.(1991)Gene 105:61-72;Murray等.(1989)Nucl.Acids Res.17:477-508)。就植物中表达优化核苷酸序列的方法提供于例如美国专利号6,015,891和其中引用的参考文献。用于在植物中表达的密码子优化的多核苷酸的示例示于SEQ ID NO:5、8、11、14、17、19、22、25和174-206。
II.融合蛋白
本文提供了融合蛋白,其包括Cpf1或Csm1多肽或其片段或变体以及效应物结构域。通过引导RNA可以将Cpf1或Csm1多肽导向靶位点,在该位点效应物结构域可以修饰或影响靶向的核酸序列。效应物结构域可以是切割结构域、表观遗传修饰结构域、转录激活结构域或转录抑制物结构域。融合蛋白可以进一步包括选自下述的至少一个其它结构域:核定位信号、质体信号肽、线粒体信号肽、能够运输蛋白质至多个亚细胞位置的信号肽、细胞穿透结构域或标志物结构域,这些中的任何一种都可以定位于融合蛋白的N末端、C末端或内部位置。Cpf1或Csm1多肽可以定位于N末端,C末端,或融合蛋白的内部位置。Cpf1或Csm1多肽可以直接融合效应物结构域,或者可以通过接头融合。在具体实施方式中,将Cpf1或Csm1多肽与效应物结构域融合的接头序列可以是至少1、2、3、4、5、6、7、8、9、10、15、20、25、30、40或50个氨基酸长度。例如,接头的长度可以在1-5、1-10、1-20、1-50、2-3、3-10、3-20、5-20或10-50个氨基酸之间。
在一些实施方式中,融合蛋白的Cpf1或Csm1多肽可以源自野生型Cpf1或Csm1蛋白。Cpf1源或Csm1源蛋白可以是经修饰的变体或片段。在一些实施方式中,Cpf1或Csm1多肽可以经修饰以含有核酸酶活性减弱或消除的核酸酶结构域(例如,RuvC样结构域)。例如,Cpf1源或Csm源多肽可以经修饰,从而使得核酸酶结构域缺失或突变,进而使其不再具有功能性(即,不存在核酸酶活性)。具体而言,当进行最大同一性比对时,Cpf1或Csm1多肽在对应FnCpf1(SEQ ID NO:3)的位置917或1006或者SmCsm1(SEQ ID NO:160)的位置701或922的位置中可以具有突变。例如,RuvC样结构域中天冬氨酸向丙氨酸(D917A)的转化以及谷氨酸向丙氨酸(E1006A)完全灭活FnCpf1的DNA切割活性,而天冬氨酸向丙氨酸(D1255A)显著地降低切割活性(Zetsche等(2015)Cell 163:759-771)。在RuvC结构域中具有突变的Cpf1多肽的示例在SEQ ID NO:26-41和63-70中示出。可以使用已知的方法通过一个或多个缺失突变、插入突变和/或取代突变灭活核酸酶结构域,如定点诱变,PCR介导的诱变,和全基因合成,以及本领域已知的任何其它方法。在示例性的实施方式中,融合蛋白的Cpf1或Csm1多肽通过使RuvC样结构域突变来修饰,从而使得Cpf1或Csm1多肽不具有核酸酶活性。
融合蛋白还包括效应物结构域,其定位于N末端,C末端,或融合蛋白的内部位置。在一些实施方式中,效应物结构域是切割结构域。本文所用“切割结构域”表示切割DNA的结构域。切割结构域可获自任何内切核酸酶或外切核酸酶。可衍生出切割结构域的内切核酸酶的非限制示例包括但不限于,限制性内切核酸酶和寻靶内切核酸酶。参见例如,新英格兰生物实验室公司(New England Biolabs)产品目录或Belfort等(1997)Nucleic AcidsRes.25:3379-3388。已知切割DNA的其它酶(例如,S1核酸酶、绿豆核酸酶、胰DNA酶I、微球菌核酸酶、酵母HO核酸内切酶),还参见Linn等编,Nucleases(《核酸酶》),冷泉港实验室出版社(Cold Spring Harbor Laboratory Press),1993。可将一种或多种这些酶(或其功能性片段)用作切割结构域的来源。
在一些实施方式中,切割结构域可以源自II-S型内切核酸酶。II-S型内切核酸酶在这样的位点切割DNA,所述位点通常离识别位点几个碱基对远并且(例如)具有单独的识别和切割结构域。这些酶通常是这样的单体,其瞬时地组合在一起形成二聚体以在交错位置切割DNA的各链。合适的II-S内切核酸酶的非限制性示例包括BfiI、BpmI、BsaI、BsgI、BsmBI、BsmI、BspMI、FokI、MbolI和SapI。
在某些实施方式中,II-S型切割可经修饰以促进两个不同的切割结构域的二聚化(其各自连接Cpf1或Csm1多肽或其片段)。在效应物结构域是切割结构域的实施方式中,可以如本文所讨论的修饰Cpf1或Csm1多肽,从而消除其内切核酸酶活性。例如,Cpf1或Csm1多肽可以通过使RuvC样结构域突变来修饰,从而使得多肽不再展现出内切核酸酶活性。
在其他实施方式中,融合蛋白的效应物结构域可以是表观遗传修饰结构域。通常,表观遗传修饰结构域在不改变DNA序列的情况下改变组蛋白结构和/或染色体结构。组蛋白和/或染色质结构的改变可以导致基因表达的改变。表观遗传修饰的示例包括但不限于,组蛋白中赖氨酸残基的乙酰化作用或甲基化作用,和DNA中胞嘧啶残基的甲基化。合适的表观遗传修饰结构域的非限制性示例包括,组蛋白乙酰基转移酶(acetyltansferase)结构域,组蛋白脱乙酰酶结构域,组蛋白甲基转移酶结构,组蛋白脱甲基酶结构,DNA甲基转移酶结构域和DNA脱甲基酶结构域。
在效应物结构域是组蛋白乙酰基转移酶(HAT)结构域的实施方式中,HAT结构域可以源自EP300(即E1A结合蛋白p300)、CREBBP(即CREB结合蛋白)、CDY1、CDY2、CDYL1、CLOCK、ELP3、ESA1、GCN5(KAT2A)、HAT1、KAT2B、KAT5、MYST1、MYST2、MYST3、MYST4、NCOA1、NCOA2、NCOA3、NCOAT、P/CAF、Tip60、TAFII250或TF3C4。在效应物结构域是表观遗传修饰结构域的实施方式中,可以如本文所讨论的修饰Cpf1或Csm1多肽,从而消除其内切核酸酶活性。例如,Cpf1或Csm1多肽可以通过使RuvC样结构域突变来修饰,从而使得多肽不再具有核酸酶活性。
在一些实施方式中,融合蛋白的效应物结构域可以是转录激活结构域。通常,转录激活结构域与转录控制元件和/或转录调节蛋白(即,转录因子,RNA聚合酶等)相互作用以增强和/或激活一种或多种基因的转录。在一些实施方式中,转录激活结构域可以是但不限于单纯性疱疹病毒VP16激活结构域,VP64(其是VP16的四聚物衍生物),NFκB p65激活结构域,p53激活结构域1和2,CREB(cAMP响应元件结合蛋白)激活结构域,E2A激活结构域,和NFAT(活化的T细胞的核因子)激活结构域。在其他实施方式中,转录激活结构域可以是Gal4、Gcn4、MLL、Rtg3、Gln3、Oaf1、Pip2、Pdr1、Pdr3、Pho4和Leu3。转录激活结构域可以是野生型的,或者其可以是原始转录激活结构域的修饰型。在一些实施方式中,融合蛋白的效应物结构域是VP16或VP64转录激活结构域。在效应物结构域是转录激活结构域的实施方式中,可以如本文所讨论的修饰Cpf1或Csm1多肽,从而消除其内切核酸酶活性。例如,Cpf1或Csm1多肽可以通过使RuvC样结构域突变来修饰,从而使得多肽不再具有核酸酶活性。
在其他实施方式中,融合蛋白的效应物结构域可以是转录抑制物结构域。通常,转录抑制物结构域与转录控制元件和/或转录调节蛋白(即,转录因子,RNA聚合酶等)相互作用以降低和/或终止一种或多种基因的转录。合适的转录抑制物结构域的非限制性示例包括诱导性cAMP早期抑制物(ICER)结构域,Kruppel-相关盒A(KRAB-A)抑制物结构域,YY1富甘氨酸抑制物结构域,Sp1样抑制物,E(spl)抑制物,I.κ.B抑制物和MeCP2。在效应物结构域是转录抑制物结构域的实施方式中,可以如本文所讨论的修饰Cpf1或Csm1多肽,从而消除其内切核酸酶活性。例如,Cpf1或Csm1多肽可以通过使RuvC样结构域突变来修饰,从而使得多肽不再具有核酸酶活性。
在一些实施方式中,融合蛋白还包括至少一个其它结构域。合适的其它结构域的非限制性示例包括核定位信号、细胞穿透或易位结构域和标志物结构域。
当融合蛋白的效应物结构域是切割结构域时,可以形成包括至少一个融合蛋白的二聚体。二聚体可以是同二聚体或异二聚体。在一些实施方式中,异二聚体包括两个不同的融合蛋白。在其他实施方式中,异二聚体包括一个融合蛋白和一个其它蛋白。
二聚体可以是同二聚体,其中两个融合蛋白单体的一级氨基酸序列是相同的。在二聚体是同二聚体的实施方式中,可以修饰Cpf1或Csm1多肽,从而消除内切核酸酶活性。在某些实施方式中,Cpf1或Csm多肽被修饰,从而使得内切酶活性被消除,各融合蛋白单体可以包括相同的Cpf1或Csm1多肽以及相同的切割结构域。切割结构域可以是任何结构域,如本文所提供的各种示例性切割结构域中的任一种。在这样的实施方式中,特定的引导RNA会将融合蛋白单体导向不同但是非常邻近的位点,从而在二聚体形成后使两个单体的核酸酶结构域在靶DNA中产生双链断裂。
二聚体还可以是两个不同融合蛋白的异二聚体。例如,各融合蛋白的Cpf1或Csm1多肽可以源自不同的Cpf1或Csm1多肽或源自不同细菌物种的直向同源的Cpf1或Csm1多肽。例如,各融合蛋白可以包括源自不同细菌物种的Cpf1或Csm1多肽。在这些实施方式中,各融合蛋白将识别不同的靶位点(即,由原型间隔子和/或PAM序列所指定)。例如,引导RNA可以将异二聚体定位于不同但是非常邻近的位点,从而使其核酸酶结构域在靶DNA中产生有效的双链断裂。
或者,异二聚体的两个融合蛋白可以具有不同的效应物结构域。在效应物结构域是切割结构域的实施方式中,各融合蛋白可以含有不同的修饰型切割结构域。在这些实施方式中,Cpf1或Csm1多肽可以经修饰,从而消除其内切核酸酶活性。形成异二聚体的两个融合蛋白的Cpf1或Csm1多肽结构域和效应物结构域可以不同。
在上述任一所述实施方式中,同二聚体或异二聚体可以包括选自下述的至少一个其它结构域:核定位信号(NLS),质体信号肽,线粒体信号肽,能够运输蛋白质至多个亚细胞位置的信号肽,细胞穿透,易位结构域和标志物结构域(如上所述)。在上述任一所述实施方式中,可以修饰Cpf1或Csm1多肽中的一个或两者,从而消除或修饰多肽的内切核酸酶活性。
异二聚体还可以包括一个融合蛋白和一个其它蛋白。例如,其它蛋白可以是核酸酶。在一实施方式中,核酸酶是锌指核酸酶。锌指核酸酶包括锌指DNA结合结构域和切割结构域。锌指识别并结合三个(3)核苷酸。锌指DNA结合结构域可以包括约3个锌指至约7个锌指。锌指DNA结合结构域可以源自天然产生的蛋白质或者其可以经工程改造。参见例如,Beerli等(2002)Nat.Biotechnol.20:135-141;Pabo等(2001)Ann.Rev.Biochem.70:313-340;Isalan等(2001)Nat.Biotechnol.19:656-660;Segal等(2001)Curr.Opin.Biotechnol.12:632-637;Choo等(2000)Curr.Opin.Struct.Biol.10:411-416;Zhang等(2000)J.Biol.Chem.275(43):33850-33860;Doyon等(2008)Nat.Biotechnol.26:702-708;和Santiago等(2008)Proc.Natl.Acad.Sci.USA 105:5809-5814。锌指核酸酶的切割结构域可以是本文所详述任何切割结构域。在一些实施方式中,锌指核酸酶可以包括选自下述的至少一个其它结构域:核定位信号(NLS),质体信号肽,线粒体信号肽,能够运输蛋白质至多个亚细胞位置的信号肽,细胞穿透或易位结构域(本文对其进行详述)。
在某些实施方式中,以上详述的任一融合蛋白或包括至少一种融合蛋白的二聚体可以是包括至少一个引导RNA的蛋白质-RNA复合物的部分。引导RNA与融合蛋白的Cpf1或Csm1多肽相互作用以将融合蛋白导向特定靶位点,其中引导RNA的5'端与特定原型间隔子序列碱基配对。
III.编码Cpf1或Csm1多肽或融合蛋白的核酸
提供了编码本文所述任一Cpf1和Csm1多肽或融合蛋白的核酸。核酸可以是RNA或DNA。编码Cpf1多肽的多核苷酸示例示于SEQ ID NO:4、5、7、8、10、11、13、14、16、17、19、21、22、24、25和174-184、187-192、194-201和203-206。编码Csm1多肽的多核苷酸示例示于SEQID NO:185、186、193和202。在一实施方式中,编码Cpf1或Csm1多肽或融合蛋白的核酸是mRNA。该mRNA可以是5′-加帽和/或3′-多腺苷酸化。在另一实施方式中,编码Cpf1或Csm1多肽或融合蛋白的核酸是DNA。DNA可以存在于载体中。
编码Cpf1或Csm1多肽或融合蛋白的核酸可以经密码子优化,用于在感兴趣的植物细胞中高效翻译成蛋白质。本领域已知用于密码子优化的程序(例如,位于genomes.urv.es/OPTIMIZER的OPTIMIZER;OptimumGene.TM.来自GenScript,网址:www.genscript.com/codon_opt.html)。
在某些实施方式中,编码Cpf1或Csm1多肽或融合蛋白的DNA可以操作性地连接至少一个启动子序列。DNA编码序列可以操作性地连接启动子控制序列,用于在感兴趣的宿主细胞中表达。在一些实施方式中,宿主细胞是植物细胞。“操作性地连接”是指2个或更多个元件之间的功能性连接。例如,启动子和感兴趣的编码区域(例如,编码Cpf1或Csm1多肽或引导RNA的区域)之间的操作性连接是能够表达感兴趣的编码区域的功能性连接。操作性地连接的元件可以是连续的或非连续的。当用于两个蛋白质编码区域之间的接合时,述及“操作性地连接的”意在表示这些编码区域处于同一阅读框中。
启动子序列可以是组成型的、调节型的、生长阶段特异性的或组织特异性的。认识到通过在核酸分子中使用不同的启动子来调节Cpf1或Csm1多肽和/或引导RNA表达时间、位置和/或水平可以增强不同应用。这样的核酸分子还可以含有(如果需要)启动子调节区(例如,产生诱导型、组成型,环境或发育调节的,或细胞或组织特异性/选择性表达),转录起始起始位点,核糖体结合位点,RNA处理信号,转录终止位点,和/或多聚腺苷酸化信号。
在一些实施方式中,本文所提供的核酸分子可与组成型、组织优选(tissue-preferred)、发育优选或其它启动子组合用于在植物中表达。植物细胞中组成型启动子的示例包括花椰菜花叶病病毒(CaMV)35S转录起始区域,源自根癌农壤杆菌(Agrobacteriumtumafaciens)T-DNA的1'-或2'-启动子,泛素1启动子,Smas启动子,肉桂醇脱氢酶启动子(美国专利号5,683,439),Nos启动子,pEmu启动子,rubisco启动子,GRP1-8启动子和来自本领域技术人员已知的多种植物基因的其它转录起始区域。如果需要低表达,可以使用弱启动子。弱组成型启动子包括例如Rsyn7启动子的核心启动子(WO 99/43838和美国专利号6,072,050),核心35S CaMV启动子等。其它组成型启动子包括例如美国专利号5,608,149;5,608,144;5,604,121;5,569,597;5,466,785;5,399,680;5,268,463;和5,608,142。参见美国专利号6,177,611,其通过引用纳入本文。
诱导型启动子的示例是可通过缺氧或冷应激诱导的Adh1启动子,可通过热应激诱导的Hsp70启动子,可通过光诱导的PPDK启动子和PEP羧化酶(pepcarboxylase)启动子。同样可用的是化学诱导的启动子,如安全剂诱导的In2-2启动子(美国专利号5,364,780),雄性激素诱导的ERE启动子,和Axig1启动子,其经植物生长素诱导并且是绒毡层特异性,但是同样在愈伤组织具有活性(PCT US01/22169)。
植物中受发育控制的启动子的示例包括在某些组织诸如叶、根、果实、种子或花中优先启动转录的启动子。“组织特异性”启动子是仅能在某些组织中启动转录的启动子。不同于基因的组成型表达,组织特异性表达是基因调节的几个相互作用水平的结果。因此,同源性或密切相关的植物物质的启动子可以优先用于实现特定组织中高效和可靠的转基因表达。在一些实施方式中,表达包括组织优选启动子。“组织优选”启动子是这样的启动子,其在某些组织中优先启动转录,但并不必需完全或仅在某些组织中启动。
在一些实施方式中,编码Cpf1或Csm1多肽和/或引导RNA的核酸分子包括细胞类型特异性启动子。“细胞类型特异性”启动子是在一种或多种器官中的某些细胞类型中主要驱动表达的启动子。细胞类型特异性启动子在植物中的功能性可以被首先激活的植物细胞的一些示例包括例如,BETL细胞,根、叶、茎细胞中的维管细胞,和干细胞。核酸分子还可以包括细胞类型优选启动子。“细胞类型优选”启动子是这样一种启动子,在一种或多种器官中的某些细胞类型中主要驱动表达,但并不必需完全或仅在某些细胞类型中。细胞类型优选启动子在植物中的功能性可以被优先激活的植物细胞的一些示例包括例如,BETL细胞,根、叶、茎细胞中的维管细胞,和干细胞。本文所述核酸分子还可以包括种子优选启动子。在一些实施方式中,种子优选启动子在胚囊、早期胚胎、早期胚乳、糊粉和/或基底胚乳转移细胞层(BETL)中表达。
种子优选启动子的示例包括但不限于,27kDγ玉米蛋白启动子和糯性基因启动子(waxy promoter),Boronat,A.等(1986)Plant Sci.47:95-102;Reina,M.等Nucl.AcidsRes.18(21):6426;和Kloesgen,R.B.等(1986)Mol.Gen.Genet.203:237-244。胚,果皮和胚乳中表达的启动子公开于美国专利号6,225,529和PCT公开WO 00/12733中。这些各自的公开内容都各自通过引用全文纳入本文。
可以驱动基因表达以植物种子优选方式在胚囊、早期胚胎、早期胚乳、糊粉和/或基底胚乳转移细胞层(BETL)中表达的启动子可以用于本文所公开的组合物和方法。这样的启动子包括但不限于这样的启动子,其天然地连接玉米(Zea mays)早期胚乳5基因,玉米早期胚乳1基因,玉米早期胚乳2基因,GRMZM2G124663,GRMZM2G006585,GRMZM2G120008,GRMZM2G157806,GRMZM2G176390,GRMZM2G472234,GRMZM2G138727,玉米CLAVATA1,玉米MRP1,水稻(Oryza sativa)PR602,水稻PR9a,玉米BET1,玉米BETL-2,玉米BETL-3,玉米BETL-4,玉米BETL-9,玉米BETL-10,玉米MEG1,玉米TCCR1,玉米ASP1,水稻ASP1,硬粒小麦(Triticum durum)PR60,硬粒小麦PR91,硬粒小麦GL7,AT3G10590,AT4G18870,AT4G21080,AT5G23650,AT3G05860,AT5G42910,AT2G26320,AT3G03260,AT5G26630,AtIPT4,AtIPT8,AtLEC2,LFAH12。其它这类启动子述于美国专利号7803990,8049000,7745697,7119251,7964770,7847160,7700836,美国专利申请公开号20100313301,20090049571,20090089897,20100281569,20100281570,20120066795,20040003427;PCT公开号WO/1999/050427,WO/2010/129999,WO/2009/094704,WO/2010/019996和WO/2010/147825,其各自通过引用纳入其全部内容用于所用目的。本文所述启动子的功能性变体或功能性片段也可以操作性地连接本文所述核酸。
化学调节启动子通过应用外源性化学调节物可以用于调整基因的表达。取决于目标,启动子可以是应用化学物时诱导基因表达的化学诱导型启动子,或是应用化学物时抑制基因表达的化学阻遏型启动子。本领域已知化学诱导型启动子并且包括但不限于,由苯磺酰胺除草安全剂活化的玉米In2-2启动子,由用作芽前除草剂的疏水亲电子化合物活化的玉米GST启动子,以及由水杨酸活化的烟草PR-1a启动子。其它感兴趣的化学调节启动子包括类固醇响应性启动子(参见例如,Schena等.(1991)Proc.Natl.Acad.Sci.USA 88:10421-10425和McNellis等(1998)Plant J.14(2):247-257)中的糖皮质激素诱导型启动子,以及四环素诱导型和四环素阻遏型启动子(参见例如,Gatz等(1991)Mol.Gen.Genet.227:229-237以及美国专利号5,814,618和5,789,156),通过引用纳入本文。
组织优选启动子可以被用于靶向特定组织内表达构建体增强的表达。在某些实施方式中,组织优选启动子可以在植物组织中活化。组织优选启动子是本领域已知的。参见例如,Yamamoto等,(1997)Plant J.12(2):255-265;Kawamata等,(1997)Plant CellPhysiol.38(7):792-803;Hansen等,(1997)Mol.Gen Genet.254(3):337-343;Russell等,(1997)Transgenic Res.6(2):157-168;Rinehart等,(1996)Plant Physiol.112(3):1331-1341;Van Camp等,(1996)Plant Physiol.112(2):525-535;Canevascini等,(1996)PlantPhysiol.112(2):513-524;Yamamoto等,(1994)Plant Cell Physiol.35(5):773-778;Lam(1994)Results Probl.Cell Differ.20:181-196;Orozco等,(1993)Plant Mol Biol.23(6):1129-1138;Matsuoka等,(1993)Proc Natl.Acad.Sci.USA 90(20):9586-9590;和Guevara-Garcia等,(1993)Plant J.4(3):495-505。这类启动子可以经修饰,如果需要,用于弱表达。
叶优选启动子是本领域已知的。参见,例如,Yamamoto等,(1997)Plant J.12(2):255-265;Kwon等,(1994)Plant Physiol.105:357-67;Yamamoto等,(1994)Plant CellPhysiol.35(5):773-778;Gotor等,(1993)Plant J.3:509-18;Orozco等,(1993)PlantMol.Biol.23(6):1129-1138;和Matsuoka等,(1993)Proc.Natl.Acad.Sci.USA 90(20):9586-9590。此外,也可以使用cab和rubisco启动子。参见例如,Simpson等(1958)EMBO J 4:2723-2729和Timko等(1988)Nature318:57-58。
根优选启动子是已知的并且可以选自文献中可得的许多或由各种相容物种从头分离。参见例如,Hire等(1992)Plant Mol.Biol.20(2):207-218(大豆根特异性谷氨酰胺合成酶基因);Keller和Baumgartner(1991)Plant Cell3(10):1051-1061(法国豆GRP 1.8基因的根特异性控制元件);Sanger等(1990)Plant Mol.Biol.14(3):433-443(根癌农杆菌(Agrobacterium tumefaciens)甘露碱合酶(MAS)基因的根特异性启动子);和Miao等(1991)Plant Cell 3(1):11-22(编码胞质谷氨酰胺合成酶(GS)的全长cDNA克隆,其在大豆的根和根瘤中表达)。同样参见Bogusz等(1990)Plant Cell 2(7):633-641,其中描述了分离自血红蛋白基因的两种根特异性启动子,该血红蛋白基因来自固氮非豆科植物山黄麻(Parasponia andersonii)以及相关的非固氮非豆科植物山油麻(Trema tomentosa)。这些基因的启动子连接β-葡萄糖醛酸酶启动子基因,并且被引入非豆科植物烟草和豆科植物百脉根(Lotus corniculatus),并且在两个实例中,根特异性启动子的活性被保留。Leach和Aoyagi(1991)描述了它们对毛根农杆菌(Agrobacterium rhizogenes)高表达roIC和roID根诱导型基因的启动子的分析(参见Plant Science(Limerick)79(1):69-76)。他们总结了增强子和组织优选DNA决定簇在这些启动子中是分离的。Teeri等(1989)使用对lacZ的基因融合来证明编码章鱼碱合成酶的农杆菌T-DNA基因在根尖的表皮中特别活跃,并且TR2'基因在完整的植物中是根特异性的并且通过叶组织中的创伤所刺激,用于杀虫或杀灭幼虫基因的特征特别理想的组合(参见EMBO J.8(2):343-350)。融合nptII(新霉素磷酸转移酶II)的TR1'基因表现相似的特征。其它根优选启动子包括VfENOD-GRP3基因启动子(Kuster等(1995)Plant Mol.Biol.29(4):759-772);和roIB启动子(Capana等(1994)PlantMol.Biol.25(4):681-691。同样参见美国专利号5,837,876;5,750,386;5,633,363;5,459,252;5,401,836;5,110,732和5,023,179。菜豆素基因(Murai等(1983)Science 23:476-482和Sengopta-Gopalen等(1988)PNAS 82:3320-3324。启动子序列可以是野生型的,或者其可以经修饰用于更高效或有效的表达。
编码Cpf1或Csm1多肽或融合蛋白的核酸序列可以操作性地连接由噬菌体RNA聚合酶识别的启动子序列用于体外mRNA合成。这样的实施方式中,体外转录的RNA可以经纯化用于本文所述的基因组修饰的方法中。例如,启动子序列可以是T7、T3或SP6启动子序列或T7、T3或SP6启动子序列的变化形式。在一些实施方式中,编码Cpf1或Csm1多肽或融合蛋白的序列可以操作性地连接启动子序列,用于在植物细胞中体外表达Cpf1或Csm1多肽或融合蛋白。这样的实施方式中,表达的蛋白质可以经纯化用于本文所述的基因组修饰的方法中。
在某些实施方式中,编码Cpf1或Csm1多肽或融合蛋白的DNA还可以连接聚腺苷酸化信号(例如,SV40多聚A信号和在植物中起作用的其它信号)和/或至少一个转录终止序列。此外,编码Cpf1或Csm1多肽或融合蛋白的序列还可以连接这样的序列,所述序列编码本文他处所述的至少一个核定位信号,至少一个质体信号肽,至少一个线粒体信号肽,能够运输蛋白质至多个亚细胞位置的至少一个信号肽,至少一个细胞穿透结构域,和/或至少一个标志物结构域。
编码Cpf1或Csm1多肽或融合蛋白的DNA可以存在于载体中。合适的载体包括质粒载体、噬菌粒、粘粒、人工/迷你染色体、转座子和病毒载体(例如,慢病毒,腺相关病毒载体等)。在一实施方式中,编码Cpf1或Csm1多肽或融合蛋白的DNA可以存在于质粒载体中。合适的质粒载体的非限制性实例包括pUC、pBR322、pET、pBluescript、pCAMBIA以及其变体。载体可以包括其它表达控制序列(例如,增强子序列,Kozak序列,聚腺苷酸化序列,转录终止序列等),可选择标志物序列(例如,抗生素抗性基因),复制的起点等。其它信息可以在《新编分子生物学实验指南(Current Protocols in Molecular Biology)》Ausubel等,约翰韦利森出版社(John Wiley&Sons),纽约,2003或《分子克隆:实验室手册(Molecular Cloning:ALaboratory Manual)》Sambrook和Russell,冷泉港实验室出版社(Cold Spring HarborPress),纽约州冷泉港,第三版,2001。
在一些实施方式中,包括编码Cpf1或Csm1多肽或融合蛋白的序列的表达载体可以还包括编码引导RNA的序列。编码引导RNA的序列可以操作性地连接至少一个转录控制序列,用于在植物中或感兴趣的植物细胞中表达引导RNA。例如,编码引导RNA的DNA可以操作性地连接由RNA聚合酶III(Pol III)识别的启动子序列。合适的Pol III启动子的实例包括但不限于,哺乳动物U6,U3,H1,和7SL RNA启动子和水稻U6和U3启动子。
IV.在植物基因组中修饰核苷酸序列的方法
本文提供了用于修饰植物细胞、植物细胞器或植物胚胎核苷酸序列的方法。该方法包括向植物细胞、细胞器或胚胎引入DNA-靶向RNA或编码DNA-靶向RNA的DNA多核苷酸,其中DNA-靶向RNA包括:(a)第一区段,其包括与靶DNA中序列互补的核苷酸序列;和(b)第二区段,其与Cpf1或Csm1多肽相互作用并且向植物细胞引入Cpf1或Csm1多肽或编码Cpf1或Csm1多肽的多核苷酸,其中Cpf1或Csm1多肽包括:(a)RNA-结合部分,其与DNA-靶向RNA相互作用;和(b)活性部分,其显示定点酶促活性。然后可以在Cpf1或Csm1多肽表达并且切割核苷酸序列的条件下培养植物细胞或植物胚胎。需指出的是,本文所述系统不需要添加外源性Mg2+或其他离子。最终,可以选择包括经修饰核苷酸序列的植物细胞或细胞器。
在一些实施方式中,该方法包括向植物细胞、细胞器或胚胎中引入一个Cpf1或Csm1多肽(或编码核酸)和一个引导RNA(或编码DNA),其中Cpf1或Csm1多肽在植物染色体DNA的靶核苷酸序列中引入一个双链断裂。在不存在任选供体多核苷酸实施方式中,核苷酸序列中的双链断裂可以通过非同源末端连接(NHEJ)修复过程进行修复。因为NHEJ是易错的,缺失至少一个核苷酸、插入至少一个核苷酸、取代至少一个核苷酸或其组合可能会出现在修复断裂期间。因此,靶向的核苷酸序列可以经修饰或灭活。例如,单核苷酸改变(SNP)可以产生改变的蛋白产物,或者编码序列阅读框的移动可以灭活或“敲除”序列,从而不再产生蛋白产物。在存在任选供体多核苷酸的实施方式中,供体多核苷酸中的供体序列在修复双链断裂期间可与位于靶向的位点的核苷酸序列交换或整合至其中。例如,在供体序列侧接这样上游和下游序列的实施方式中,所述上游和下游序列分别具有与植物核苷酸序列中靶向的位点的上游和下游序列实质上的序列同一性,供体序列在通过同源性导向的修复过程介导的修复期间可以与靶向的位点的核苷酸序列交换或整合至其中。或者,在供体序列侧接相容突出端(或者该相容突出端由Cpf1或Csm1多肽原位生成)的实施方式中,供体序列在双链断裂修复期间通过非同源性修复过程可以直接连接切割的核苷酸序列。将供体序列交换或整合至核苷酸序列修饰植物靶向的核苷酸序列,或者将外源性序列引入植物细胞、植物细胞器或植物胚胎的核苷酸序列。
本文所公开的方法可以还包括向植物细胞、细胞器或胚胎中引入两个Cpf1或Csm1多肽(或编码核酸)和两个引导RNA(或编码DNA),其中Cpf1或Csm1多肽在核和/或细胞器染色体DNA的核苷酸序列中引入两个双链断裂。两个断裂可以在数个碱基对内,数十个碱基对内,或者可以由数千个碱基对所分隔。在不存在任选供体多核苷酸的实施方式中,得到的双链断裂可以通过非同源性修复过程修复,这样的话两个切割位点之间的序列丢失和/或在修复断裂期间可能会出现缺失至少一个核苷酸,插入至少一个核苷酸,取代至少一个核苷酸或其组合。在任选供体多核苷酸存在的实施方式中,在通过基于同源性的修复过程(例如,在供体序列侧接这样上游和下游序列的实施方式中,所述上游和下游序列分别具有与核苷酸序列中靶向的位点的上游和下游序列实质上的序列同一性)或非同源性的修复过程(例如,在供体序列侧接相容突出端的实施方式中)的双链断裂修复期间,供体多核苷酸中的供体序列可以与植物的核苷酸序列交换或整合至其中。
“改变”或“调节”基因的表达水平是指上调或下调所述基因的表达。公认地,在一些情况中,通过增加编码光合作用中涉及的蛋白质的一种或多种基因的表达水平(即,上调表达)来增加植物生长和产量。类似地,在一些情况中,可通过降低编码光合作用中涉及的蛋白质的一种或多种基因的表达水平(即,下调表达)来增加植物生长和产量。因此,本发明包括使用本文所公开的Cpf1或Csm1多肽上调或下调编码光合作用中涉及的蛋白质的一种或多种基因。此外,所述方法包括上调编码在感兴趣的植物中的光合作用中涉及的蛋白质的至少一种基因,和,下调编码在感兴趣的植物中的光合作用中涉及的蛋白质的至少一种基因。通过调节编码所需转基因植物中的光合作用中涉及的蛋白质的至少一种基因的浓度和/或活性,所述浓度和/或活性相对于不具有导入本发明的序列的原始对照植物、植物部分或细胞来说增大或减小至少约1%、约5%、约10%、约20%、约30%、约40%、约50%、约60%、约70%、约80%,或约90%,或更多。
植物细胞具有核、质体和线粒体基因组。本发明的组合物和方法可以用于修饰核、质体和/或线粒体基因组的序列,或者可以用于调节由核、质体和/或线粒体基因组编码的一种或多种基因的表达。因此,“染色体”或“染色体的”指核、质体或线粒体基因组DNA。当“基因组”适用于植物细胞时,其不但包括存在于细胞核的染色体DNA,也包括存在于细胞亚细胞组分(例如,线粒体或质体)中的细胞器DNA。植物细胞、细胞器或胚胎中感兴趣的任何核苷酸序列可以使用本文所述方法修饰。在具体实施方式中,本文所公开的方法被用于修饰编码农艺学重要性状的核苷酸序列,如植物激素,植物防御蛋白,营养转运蛋白,生物结合蛋白,所需输入性状,所需输出性状,应激抗性基因,疾病/病原体抗性基因,雄性不育,发育基因,调节基因,参与光合作用的基因,DNA修复基因,转录调节基因或任何其他感兴趣的多核苷酸和/或多肽。也可以修饰农艺学重要性状如油脂、淀粉和蛋白质含量。修饰包括增加油酸、饱和和不饱和油脂的含量,增加赖氨酸和硫的水平,提供必需氨基酸,以及淀粉的改性。大麦硫堇(Hordothionin)蛋白修饰述于美国专利号5,703,049、5,885,801、5,885,802和5,990,389,通过引用纳入本文。另一实例是富赖氨酸和/或硫种子蛋白,其由美国专利号5,850,016中所述大豆2S白蛋白所编码,以及来自大麦的糜蛋白酶抑制物,述于Williamson等(1987)Eur.J.Biochem.165:99-106,其公开通过引用纳入本文。
可以使用本文所公开的方法制备编码序列的衍生物,从而在编码的多肽中增加预选氨基酸的水平。例如,编码大麦高赖氨酸多肽(BHL)的基因源自1996年11月1日提交的美国专利申请序列号08/740,682和WO 98/20133的大麦糜蛋白酶抑制物,其公开通过引用纳入本文。其它蛋白包括富蛋氨酸植物蛋白,如来自向日葵籽(Lilley等(1989)关于人类食品和动物饲料中植物蛋白利用的世界大会报告(Proceedings of the World Congress onVegetable Protein Utilization in Human Foods and Animal Feedstuffs),Applewhite编著(伊利诺伊州香槟市美国油脂化学会(American Oil ChemistsSociety)),第497-502页;通过引用纳入本文);玉米(Pedersen等(1986)J.Biol.Chem.261:6279;Kirihara等(1988)Gene 71:359;两者通过引用纳入本文);和水稻(Musumura等(1989)Plant Mol.Biol.12:123通过引用纳入本文)。其它农艺学重要的基因编码乳胶、Floury 2、生长因子、种子储存因子和转录因子。
本文所公开的方法可以用于修饰除草剂抗性特性,包括编码除草剂抗性的基因,其能够抑制乙酰乳酸合酶(ALS)的作用,尤其是磺酰脲类除草剂(例如,含有导致这类抗性的突变的乙酰乳酸合酶(ALS)基因,尤其是S4和/或Hra突变),编码除草剂抗性的基因,其能够抑制谷氨酰胺合成酶的作用,如草丁膦或巴斯达(basta)(例如,bar基因);草甘膦(例如,EPSPS基因和GAT基因;参见例如美国公开号20040082770和WO 03/092360);其它为本领域已知的这类基因。bar基因编码对除草剂巴斯达的抗性,nptII基因编码对抗生素卡那霉素和遗传霉素的抗性,并且ALS基因突变体编码对除草剂氯磺隆的抗性。例如,美国专利申请2016/0208243中描述了其它除草剂抗性性状,其通过引用纳入本文。
不育基因也可以经修饰并且提供另一种方式的物理去雄。以这样方式使用的基因的实例包括雄性组织优选基因以及具有雄性不育表型的基因如QM,述于美国专利号5,583,210中。其它基因包括激酶以及编码对雄性和雌性配子体发育具有毒性的化合物的那些。其它不育性状述于例如美国专利申请2016/0208243中,其通过引用纳入本文。
谷物的质量可以通过修饰编码性状的基因来改变,如油脂的类型和水平,饱和和未饱和,必需氨基酸的数量和质量,以及纤维素的水平。在玉米中,经修饰的大麦硫堇蛋白述于美国专利号5,703,049、5,885,801、5,885,802和5,990,389。
商业性状也可以通过修饰基因来改变,或者其将可以例如增加用于乙醇生产的淀粉,或提供蛋白质的表达。经修饰植物的另一项重要的商业用途是生产聚合物和生物塑料,如美国专利号5,602,321中所述。诸如β-酮硫解酶(β-Ketothiolase)、PHB酶(聚羟基丁酸合成酶)和乙酰乙酰辅酶A还原酶(参见Schubert等(1988)J.Bacteriol.170:5837-5847)促进聚羟基链烷酸酯(PHA)的表达。
外源性产物包括植物酶和产物,以及来自包括原核生物或其它真核生物的那些。这类产物包括酶、辅酶因子、激素等。可以增加蛋白质的水平,特别是具有改善的氨基酸分布的经修饰的蛋白质以改善植物的营养价值。这通过表达具有增强的蛋白质含量的这些蛋白质来实现。
本文所公开的方法还可以用于插入异源性基因和/或修饰天然植物基因表达以实现所需的植物性状。这类植物性状包括例如抗病性,除草剂耐受性,耐旱性,耐盐性,抗虫性,抗寄生杂草,改善植物营养价值,改善饲草消化率,增加谷物产量,细胞质雄性不育,改变果实成熟,增加植物或植物部分的贮藏期,减少过敏原的产生,增加或减少木质素含量。美国专利申请2016/0208243中公开了能够赋予这些所需性状的基因,其通过引用纳入本文。
(a)Cpf1或Csm1多肽
本文所公开的方法包括如本文所述向植物细胞、植物细胞器或植物胚胎导入至少一种Cpf1或Csm多肽或编码至少一种Cpf1或Csm1多肽的核酸。在一些实施方式中,Cpf1或Csm1多肽可以分离的蛋白质导入植物细胞、细胞器或植物胚胎。在这样的实施方式中,Cpf1或Csm1多肽可以还包括至少一个细胞穿透结构域,其促进蛋白质的细胞摄取。在一些实施方式中,Cpf1或Csm1多肽可以与引导RNA复合的核糖核蛋白导入植物细胞、细胞器或植物胚胎。在其它实施方式中,Cpf1或Csm1多肽可以mRNA分子导入植物细胞、细胞器或植物胚胎。在其它实施方式中,Cpf1或Csm1多肽可以DNA分子导入植物细胞、细胞器或植物胚胎。通常,编码Cpf1或Csm1多肽或本文所述融合蛋白的DNA序列操作性地连接启动子序列,所述启动子将在感兴趣的植物细胞、细胞器或植物胚胎中作用。该DNA序列可以是线性的,或者该DNA序列可以是载体的部分。在其它一些实施方式中,Cpf1或Csm1多肽或融合蛋白可以RNA-蛋白复合物导入植物细胞、细胞器或植物胚胎,所述RNA-蛋白复合物包括引导RNA或融合蛋白和引导RNA。
在某些实施方式中,编码Cpf1或Csm1多肽的mRNA可以靶向细胞器(例如,质体或线粒体)。在某些实施方式中,编码一种或多种引导RNA的mRNA可以靶向细胞器(例如,质体或线粒体)。在某些实施方式中,编码Cpf1或Csm1多肽和一种或多种引导RNA的mRNA可以靶向细胞器(例如,质体或线粒体)。靶向mRNA至细胞器的方法为本领域已知(参见例如,美国专利申请号2011/0296551;美国专利申请号2011/0321187;Gómez和Pallás(2010)PLoS One5:e12269),并且通过引用纳入本文。
在某些实施方式中,编码Cpf1或Csm1多肽的DNA可以还包括编码引导RNA的序列。通常,编码Cpf1或Csm1多肽和引导RNA的各序列操作性地连接一个或多个适当的启动子控制序列,这样允许Cpf1或Csm1多肽和引导RNA分别表达在植物细胞、细胞器或植物胚胎中。编码Cpf1或Csm1多肽和引导RNA的DNA序列进一步包括其它表达对照、调控、和/或处理序列。编码Cpf1或Csm1多肽和引导RNA的DNA序列可以是线性的或是载体的部分。
(b)引导RNA
本文所述方法还可以包括向植物细胞、细胞器或植物胚胎导入至少一种引导RNA或编码至少一种引导RNA的DNA。引导RNA与Cpf1或Csm1多肽相互作用以将Cpf1或Csm1多肽导向特定靶位点,在这里引导RNA的5'端与植物核苷酸序列中的特定原型间隔子序列碱基配对。引导RNA可以包括三个区域:与靶向的染色体序列中靶位点互补的第一区域,形成茎环结构的第二区域,和基本保持单链的第三区域。各引导RNA的第一区域是不同的,因此各引导RNA将Cpf1或Csm1多肽导向特定靶位点。各引导RNA的第二和第三区域在所有引导RNA中可以相同。
引导RNA的一个区域与包括核染色体序列以及质体或线粒体序列的植物基因组中靶位点的序列(即原型间隔子序列)互补,因此引导RNA的第一区域可以与靶位点碱基配对。在各种实施方式中,引导RNA的第一区域可以包括约8个核苷酸至超过约30个核苷酸。例如,引导RNA的第一区域与核苷酸序列中靶位点之间碱基配对区域的长度可以是约8、约9、约10、约11、约12、约13、约14、约15、约16、约17、约18、约19、约20、约22、约23、约24、约25、约27、约30或超过30个核苷酸。在一个示例性实施方式中,引导RNA的第一区域的长度是约23、24或25个核苷酸。引导RNA还可以包括形成二级结构的第二区域。在一些实施方式中,二级结构包括茎或发夹。茎的长度可以不同。例如,茎的长度可以在约6至约10,至约15,至约20,至约25个碱基对的范围。茎可以包括1至约10个核苷酸的一个或多个凸起。因此,第二区域整体的长度可以在约16至约25个核苷酸。在某些实施方式中,环的长度是约5个核苷酸,并且茎包括约10个碱基对。
引导RNA还可以包括基本上保持单链的第三区域。因此,第三区域不具有与感兴趣的细胞中任何核苷酸序列的互补性,并且不与引导RNA的其它部分互补。第三区域的长度可以不同。通常,第三区域的长度超过约4个核苷酸。例如,第三区域的长度可以在约5至约60个核苷酸。引导RNA的第二和第三区域(也称为通用或支架区域)组合的长度可以在约30至约120个核苷酸。在一方面,引导RNA的第二和第三区域组合的长度可以在约40至约45个核苷酸。
在一些实施方式中,引导RNA包括含有所有三个区域的单个分子。在其他实施方式中,引导RNA可以包括两个不同的分子。第一RNA分子可以包括引导RNA的第一区域以及引导RNA第二区域“茎”的一半。第二RNA分子可以包括引导RNA第二区域“茎”的另一半以及引导RNA的第三区域。因此,在该实施方式中,第一和第二RNA分子各自含有彼此之间相互互补的核苷酸序列。例如,在一实施方式中,第一和第二RNA分子各自包括与其它序列碱基配对的序列(约6至约25个核苷酸)以形成功能性引导RNA。在具体实施方式中,引导RNA是单个分子(即crRNA),其在不需要第二引导RNA(即tracrRNA)的情况下与染色体中的靶位点和Cpf1多肽相互作用。
在某些实施方式中,引导RNA可以RNA分子导入植物细胞、细胞器或植物胚胎。可以体外转录RNA分子。或者,可以化学合成RNA分子。在其它实施方式中,引导RNA可以DNA分子导入植物细胞、细胞器或植物胚胎。在这样的情况中,编码引导RNA的序列可以操作性地连接启动子控制序列,用于在感兴趣的植物细胞、细胞器或植物胚胎中表达引导RNA。例如,RNA编码序列可以操作性地连接由RNA聚合酶III(Pol III)识别的启动子序列。在示例性实施方式中,RNA编码序列连接植物特异性启动子。
编码引导RNA的DNA分子可以是线性或环状的。在一些实施方式中,编码引导RNA的DNA序列可以是载体的部分。合适的载体包括质粒载体、噬菌粒、粘粒、人工/迷你染色体、转座子和病毒载体。在示例性实施方式中,编码Cpf1或Csm1多肽的DNA可以存在于质粒载体中。合适的质粒载体的非限制性实例包括pUC、pBR322、pET、pBluescript、pCAMBIA以及其变体。载体可以包括其它表达控制序列(例如,增强子序列,Kozak序列,聚腺苷酸化序列,转录终止序列等),可选择标志物序列(例如,抗生素抗性基因),复制的起点等。
在Cpf1或Csm1多肽和引导RNA两者以DNA分子引入植物细胞、细胞器或胚胎的实施方式中,其各自可以是不同的分子的部分(例如,含有Cpf1或Csm1多肽或编码序列的融合蛋白的一个载体,以及含有引导RNA编码序列的第二载体),或者其可以是相同分子的部分(例如,一个载体,其含有Cpf1或Csm1多肽或融合蛋白和引导RNA的编码(和调节)序列)。
(c)靶位点
将与引导RNA联合的Cpf1或Csm1多肽导向植物中的靶位点,包括植物、植物细胞、植物细胞器(例如,质粒或线粒体)或植物胚胎的染色体序列,其中Cpf1或Csm1多肽将双链断裂引入染色体序列。该靶位点没有序列限制,除了该序列紧接着共有序列(下游)。该共有序列也称为原型间隔子邻近基序(protospacer adjacent motif)。PAM序列的示例包括但不限于,TTN、CTN、TCN、CCN、TTTN、TCTN、TTCN、CTTN、ATTN、TCCN、TTGN、GTTN、CCCN、CCTN、TTAN、TCGN、CTCN、ACTN、GCTN、TCAN、GCCN和CCGN(其中N定义为任何核苷酸)。本领域已知对给定核酸酶具有特异性的PAM序列受到酶浓度的影响(Karvelis等(2015)Genome Biol 16:253)。因此,调整递送至细胞或感兴趣的体外系统的Cpf1或Csm1蛋白的浓度提供了一种改变PAM位点或与Cpf1或Csm1酶相关位点的方式。例如通过改变用于表达Cpf1编码或Csm1编码基因的启动子,通过改变递送至细胞或体外系统的核糖核蛋白浓度,或通过添加或去除在调节基因表达水平中可能起作用的内含子,可以实现调整感兴趣的系统中的Cpf1或Csm1蛋白浓度。如本文所详述,引导RNA的第一区域与靶序列的原型间隔子互补。通常,引导RNA的第一区域的长度是19-21个核苷酸。
靶位点可以在基因的编码区域中,基因的内含子中,基因的控制区域中,基因间的非编码区域等。基因可以是蛋白质编码基因或RNA编码基因。基因可以是如本文所述的任何感兴趣的基因。
(d)供体多核苷酸
在一些实施方式中,本文所公开的方法还包括向植物细胞、细胞器或植物胚胎引入至少一种供体多核苷酸。供体多核苷酸包括至少一种供体序列。在一些方面,供体多核苷酸的供体序列对应细胞核中或感兴趣的细胞器(例如,质体或线粒体)中存在的内源性或天然植物基因组序列。例如,供体序列可以与位于或接近靶位点的染色体序列的部分基本相同,但是其包括至少一个核苷酸变化。因此,供体序列可以包括位于靶向的位点的野生型序列的修饰型,因此在与天然序列整合或交换之后,位于靶向的位点的序列包括至少一个核苷酸变化。例如,变化可以是一个或多个核苷酸的插入,一个或多个核苷酸的缺失,一个或多个核苷酸的取代或其组合。整合修饰序列的结果是植物、植物细胞或植物胚胎可以由靶向的染色体序列生成经修饰的基因产物。
供体多核苷酸的供体序列也可以对应外源性序列。本文所用“外源性”序列指代对于植物细胞、细胞器或胚胎并不是天然的序列,或者其在细胞、细胞器或胚胎基因组中的天然位置是不同位置的序列。例如,外源性序列可以包括蛋白质编码序列,其可以操作性地连接外源性启动子控制序列,因此在整合到基因组后,植物细胞或细胞器能够表达该整合序列所编码的蛋白质。例如,供体序列可以是感兴趣的任何基因,诸如编码本文他处所述的农艺学重要性状的那些。或者,可以将外源性序列整合到核、质体和/或线粒体染色体序列中,从而使其表达受到内源性启动子控制序列的调控。在其他的迭代中,外源性序列可以是转录控制序列,其它的表达控制序列或RNA编码序列。将外源性序列整合到染色体序列被称为“敲入”。供体序列可以具有各种长度,从几个核苷酸到数百个核苷酸到数千个核苷酸。
在一些实施方式中,供体多核苷酸中的供体序列侧接上游序列和下游序列,其分别具有与植物核、质体和/或线粒体基因组序列中靶向的位点上游和下游处序列实质上的序列同一性。因为这些序列相似性,供体多核苷酸的上游和下游序列允许供体多核苷酸和靶向的序列之间的同源重组,从而使得供体序列被整合到靶向的植物序列(或之交换)。
本文所用上游序列指这样的核酸序列,其具有与靶向的位点上游的染色体序列实质上的序列同一性。类似地,下游序列指这样的核酸序列,其具有与靶向的位点下游的染色体序列实质上的序列同一性。本文所用短语“实质上的序列同一性”指序列具有至少约75%的序列同一性。因此,供体多核苷酸中的上游和下游序列与靶向的位点上游或下游序列可以具有约75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性。在示例性的实施方式中,供体多核苷酸中的上游和下游序列与靶向的位点上游或下游的核苷酸序列可以具有约95%或100%的序列同一性。在一实施方式中,上游序列与位于靶向的位点上游紧邻的(即邻近靶向的位点)核苷酸序列具有实质上的序列同一性。在其它实施方式中,上游序列与位于靶向的位点上游约一百个(100)核苷酸内的核苷酸序列具有实质上的序列同一性。因此例如,上游序列与位于靶向的位点上游约1-约20,约21-约40,约41-约60,约61-约80,或约81-约100核苷酸内的核苷酸序列具有实质上的序列同一性。在一实施方式中,下游序列与位于靶向的位点下游紧邻的(即邻近靶向的位点)核苷酸序列具有实质上的序列同一性。在其它实施方式中,下游序列与位于靶向的位点下游约一百个(100)核苷酸内的核苷酸序列具有实质上的序列同一性。因此例如,下游序列与位于靶向的位点下游约1-约20,约21-约40,约41-约60,约61-约80,或约81-约100核苷酸内的核苷酸序列具有实质上的序列同一性。
各上游或下游序列的长度可以在约20个核苷酸至约5000个核苷酸。在一些实施方式中,上游和下游序列可以包括约50、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2800、3000、3200、3400、3600、3800、4000、4200、4400、4600、4800或5000个核苷酸。在示例性的实施方式中,上游或下游序列的长度可以在约50个核苷酸至约1500个核苷酸。
包括与靶向的核苷酸序列具有序列相似的上游和下游序列的供体多核苷酸可以是线性或环状的。在供体多核苷酸是环状的实施方式中,其可以是载体的部分。例如,载体可以是质粒载体。
在某些实施方式中,供体多核苷酸还可以包括由Cpf1或Csm1多肽识别的至少一个靶向的切割位点。将该靶向的切割位点添加到供体多核苷酸可以替换供体序列的上游或下游或上下游两者。例如,供体序列可以由靶向的切割位点侧接,因此在通过Cpf1或Csm1多肽切割后,供体序列由突出端侧接,所述突出端与通过Cpf1或Csm1多肽切割后生成的核苷酸序列中的那些相容。因此,可以用切割的核苷酸序列在通过非同源性修复过程修复双链断裂期间连接供体序列。通常,包括靶向的切割位点的供体多核苷酸是环状的(例如,可以是质粒载体的部分)。
供体多核苷酸可以是包括具有任选的短突出端的短供体序列的线性分子,所述任选的短突出端与Cpf1或Csm1多肽生成的突出端相容。在这样的实施方式中,供体序列在双链断裂的修复期间可以与切割的染色体序列直接连接。在一些情况中,供体序列可以少于约1,000,少于约500,少于约250,或少于约100个核苷酸。在具体情况中,供体多核苷酸可以是线性分子,其包括具有钝端的短供体序列。在其它的迭代中,供体多核苷酸可以是线性分子,其包括具有5'和/或3'突出端的短供体序列。该突出端可以包括1、2、3、4或5个核苷酸。
在一些实施方式中,供体多核苷酸将是DNA。DNA可以是单链或双链和/或线性或环状。供体多核苷酸可以是DNA质粒、细菌人工染色体(BAC)、酵母人工染色体(YAC)、病毒载体、DNA的线性部分、PCR片段、裸核酸或与递送载剂如脂质体或泊咯沙姆复合的核酸。在具体实施方式中,包括供体序列的供体多核苷酸可以是质粒载体的部分。在这些情况中的任一种情况中,包括供体序列的供体多核苷酸可以还包括至少一种其它序列。
(e)引入植物细胞
Cpf1或Csm1多肽(或编码核酸)、引导RNA(或编码DNA)和任选的供体多核苷酸可以通过包括转化的各种方法引入植物细胞、细胞器或植物胚胎。转化方案以及向植物中导入多肽或多核苷酸序列的方案可根据转化靶向的植物或植物细胞的类型变化,即,单子叶或双子叶。向植物细胞中导入多肽和多核苷酸的合适方法包括微注射(Crossway等,(1986)Biotechniques 4:320-334)、电穿孔(Riggs等,(1986)Proc.Natl.Acad.Sci.USA 83:5602-5606),农杆菌-介导的转化(美国专利号5,563,055和美国专利号5,981,840),直接基因转化(Paszkowski等,(1984)EMBO J.3:2717-2722),和弹道颗粒加速(参见例如,美国专利号4,945,050;美国专利号5,879,918;美国专利号5,886,244;和5,932,782;Tomes等,(1995)《植物细胞、组织和器官培养中的基础方法》(Plant Cell,Tissue,and Organ Culture:Fundamental Methods),Gamborg和Phillips编(Springer-Verlag,Berlin);McCabe等,(1988)Biotechnology 6:923-926);和Lec1转化(WO 00/28058)。还参见Weissinger等,(1988)Ann.Rev.Genet.22:421-477;Sanford等,(1987)Particulate Science andTechnology 5:27-37(洋葱);Christou等,(1988)Plant Physiol.87:671-674(大豆);McCabe等,(1988)Bio/Technology6:923-926(大豆);Finer和McMullen(1991)In VitroCell Dev.Biol.27P:175-182(大豆);Singh等,(1998)Theor.Appl.Genet.96:319-324(大豆);Datta等,(1990)Biotechnology 8:736(水稻);Klein等,(1988)Proc.Natl.Acad.Sci.USA85:4305-4309(玉米);Klein等,(1988)Biotechnology 6:559-563(玉米);美国专利号5,240,855;5,322,783;和5,324,646;Klein等,(1988)PlantPhysiol.91:440-444(玉米);Fromm等,(1990)Biotechnology 8:833-839(玉米);Hooykaas-Van Slogteren等,(1984)Nature(伦敦)311:763-764;美国专利号5,736,369(谷类);Bytebier等,(1987)Proc.Natl.Acad.Sci.USA 84:5345-5349(百合);De Wet等,(1985)《胚珠组织实验操作》(The Experimental Manipulation of Ovule Tissues),Chapman等编,(纽约朗文出版社(Longman,New York),第197-209页(花粉);Kaeppler等,(1990)Plant Cell Reports 9:415-418和Kaeppler等,(1992)Theor.Appl.Genet.84:560-566(须-介导的转化);D'Halluin等,(1992)Plant Cell 4:1495-1505(电穿孔);Li等,(1993)Plant Cell Reports12:250-255以及Christou和Ford(1995)Annals of Botany75:407-413(水稻);Osjoda等,(1996)Nature Biotechnology 14:745-750(玉米,通过根癌农杆菌);其全部通过引用纳入本文。已经证明了通过生物弹射引入包括核酸酶以及合适的引导RNA的核糖核蛋白进行的对植物细胞的位点特异性基因组编辑(Svitashev等(2016)Nat Commun doi:10.1038/ncomms13274);这些方法通过引用纳入本文。“稳定转化”是指导入植物的核苷酸构建体整合到植物的基因组中并且能够被其后代遗传。核苷酸构建体可以被整合到植物的核、质体或线粒体基因组中。用于质体转化的方法为本领域已知(参见例如,《叶绿体生物技术:方法和方案(Chloroplast Biotechnology:Methods andProtocols)》(2014)Pal Maliga编著和美国专利申请号2011/0321187),并且本领域已经描述了用于植物线粒体转化的方法(参见例如美国专利申请号2011/0296551),通过引用纳入本文。
按照常规方式,已经转化的细胞可长成植物(即培养)。参见,例如,McCormick等,(1986)Plant Cell Reports 5:81-84。由此,本发明提供了具有稳定整合到其基因组中核酸修饰的转化的种子(也称为“转基因种子”)。
“引入”在将核酸片段(例如重组DNA构建体)插入细胞的上下文中表示“转染”或“转化”或“转导”并且包括将核酸片段纳入植物细胞,其中核酸片段可以被纳入细胞的基因组中(例如,核染色体、质粒、质体染色体或线粒体染色体),转化成独立复制的复制子,或瞬时表达(例如,转染的mRNA)。
本发明可用于任何植物物种的转化,包括但不限于单子叶和双子叶(即单子叶植物和双子叶植物)。感兴趣植物物种的示例包括但不限于,玉米(Zea mays),油菜种(例如,甘蓝型油菜(B.napus)、白菜型油菜(B.rapa)、芥菜型油菜(B.juncea)),尤其是用作菜籽油来源的那些油菜物种,苜蓿(Medicago sativa),水稻(Oryza sativa),黑麦(Secalecereale),高粱(Sorghum bicolor,Sorghum vulgare),粟(例如,珍珠粟(Pennisetumglaucum),黍(Panicum miliaceum),小米(Setaria italica),穇子(Eleusinecoracana)),向日葵(Helianthus annuus),红花(Carthamus tinctorius),小麦(Triticumaestivum),大豆(Glycine max),烟草(Nicotiana tabacum),马铃薯(Solanumtuberosum),花生(Arachis hypogaea),棉花(Gossypium barbadense,Gossypiumhirsutum),甘薯(Ipomoea batatas),木薯(Manihot esculenta),咖啡(Coffea spp.),椰子(Cocos nucifera),菠萝(Ananas comosus),柠檬树(Citrus spp.),可可(Theobromacacao),茶(Camellia sinensis),香蕉(Musa spp.),鳄梨(Persea americana),无花果(Ficus casica),番石榴(Psidium guajava),芒果(Mangifera indica),橄榄(Oleaeuropaea),番木瓜(Carica papaya),腰果(Anacardium occidentale),澳洲坚果(Macadamia integrifolia),杏(Prunus amygdalus)、甜菜(Beta vulgaris)、甘蔗(Saccharum spp.)、油棕榈(Elaeis guineensis)、杨树(Populus sp.)、桉树(Eucalyptussp.)、燕麦(Avena sativa)、大麦(Hordeum vulgare)、蔬菜、观赏植物和针叶树。
Cpf1或Csm1多肽(或编码核酸)、引导RNA(或编码引导RNA的DNA)和任选的供体多核苷酸可以同时或依次引入植物细胞、细胞器或植物胚胎。Cpf1多肽(或编码核酸)与引导RNA(或编码DNA)的比例通常将会是约化学剂量,因此两种组分可以与靶DNA形成RNA-蛋白质复合物。在一实施方式中,编码Cpf1或Csm1多肽的DNA以及编码引导RNA的DNA被一起在质粒载体中递送。
本发明的组合物和方法可以用于改变植物中感兴趣基因的表达,如参与光合作用的基因的表达。因此,可与对照植物相比调节编码光合作用中涉及的蛋白质的基因的表达。“对象植物或植物细胞”是其中已经实现感兴趣基因的遗传改变如突变,或者是源自如此改变的植物或细胞并包含改变的植物或植物细胞。“对照”或“对照植物”或“对照植物细胞”提供了测量对象植物或植物细胞的表型变化的参照点。因此,根据本发明的方法,表达水平高于或低于对照植物中的表达水平。
一种对照植物或植物细胞可包含,例如:(a)野生型植物或细胞,即具有与用于产生对象植物或细胞的遗传改变的起始材料相同的基因型;(b)与起始材料有相同基因型的植物或植物细胞,但其已经用无效构建体(即,用对感兴趣性状没有已知影响的构建体,如包含标记基因的构建体)转化;(c)植物或植物细胞,其是对象植物或植物细胞的后代中的非转化分离体;(d)与对象植物或植物细胞在遗传上相同但没有接触会诱导感兴趣基因表达的条件或刺激的植物或植物细胞;或(e)在不表达感兴趣基因的条件下的对象植物或植物细胞本身。
虽然本发明以转化的植物描述,应认识到本发明的转化的生物体可包括植物细胞、植物原生质体、植物可再生的植物组织培养物、植物愈伤组织、植物块、和在植物或植物部分中完整的植物细胞如胚胎、花粉、胚珠、种子、叶、花、枝条、果实、仁、谷穗、穗轴、外壳、柄、根、根尖、花粉囊等。谷粒是指由种植户处于生长或繁殖物种以外的目的产生的成熟种子。再生植物的后代、变体和突变体也包括在本发明的范围内,只要这些部分包含导入的多核苷酸。
(f)使用融合蛋白修饰植物序列或调节植物序列表达的方法
本文所公开的方法还包括修饰核苷酸序列或调节植物细胞、植物细胞器或植物胚胎中核苷酸序列的表达。该方法可以包括向植物细胞或植物胚胎中引入编码至少一种融合蛋白或编码至少一种融合蛋白的核酸,其中融合蛋白包括Cpf1或Csm1多肽或其片段或变体和效应物结构域,和(b)至少一种引导RNA或编码引导RNA的DNA,其中引导RNA引导融合蛋白的Cpf1或Csm1多肽至染色体序列中的靶位点,并且融合蛋白的效应物结构域修饰染色体序列或调节染色体序列的表达。
本文描述了融合蛋白,其包括Cpf1或Csm1多肽或其片段或变体以及效应物结构域。通常,本文所公开的融合蛋白可以还包括至少一种核定位信号、质体信号肽、线粒体信号肽或能够运输蛋白质至多个亚细胞位置的信号肽。本文描述了编码融合蛋白的核酸。在一些实施方式中,融合蛋白可以分离的蛋白质(其可以还包括细胞穿透结构域)导入细胞或胚胎。此外,分离的融合蛋白可以是包括引导RNA的蛋白质-RNA复合物的部分。在其它实施方式中,融合蛋白可以RNA分子(其可以经加帽和/或多聚腺苷化)导入细胞或胚胎。在其它实施方式中,融合蛋白可以DNA分子导入细胞或胚胎。例如,融合蛋白和引导RNA可以离散的DNA分子或以相同的DNA分子的部分导入细胞或胚胎。这类DNA分子可以是质粒载体。
在一些实施方式中,该方法还包括向细胞、细胞器或胚胎引入本文所述的至少一种供体多核苷酸。本文描述了向植物细胞、细胞器或植物胚胎引入分子的方法,以及培养细胞(包括含有细胞器的细胞)或胚胎的方法。
在其中融合蛋白效应物结构域是切割结构域的具体实施方式中,该方法可以包括向植物细胞、细胞器或植物胚胎引入一种融合蛋白(或编码一种融合蛋白的核酸)和两种引导RNA(或编码两种引导RNA的DNA)。两种引导RNA将融合蛋白引导至染色体序列中的两个不同靶位点,其中融合蛋白二聚化(例如,形成同二聚体),因此两个切割结构域可以将双链断裂引入染色体序列。在不存在任选供体多核苷酸实施方式中,染色体序列中的双链断裂可以通过非同源末端连接(NHEJ)修复过程进行修复。因为NHEJ是易错的,缺失至少一个核苷酸、插入至少一个核苷酸、取代至少一个核苷酸或其组合可能会出现在修复断裂期间。因此,靶向的染色体序列可以经修饰或灭活。例如,单核苷酸改变(SNP)可以产生改变的蛋白产物,或者编码序列阅读框的移动可以灭活或“敲除”序列,从而不再产生蛋白产物。在存在任选供体多核苷酸的实施方式中,供体多核苷酸中的供体序列在修复双链断裂期间可与靶位点的染色体序列交换或整合至其中。例如,在供体序列侧接这样上游和下游序列的实施方式中,所述上游和下游序列具有分别与染色体序列中靶位点的上游和下游序列实质上的序列同一性,供体序列在通过同源性导向的修复过程介导的修复期间可以与靶位点的染色体序列交换或整合至其中。或者,在供体序列侧接相容突出端(或者该相容突出端由Cpf1或Csm1多肽原位生成)的实施方式中,供体序列在双链断裂修复期间通过非同源性修复过程可以直接连接切割的染色体序列。将供体序列交换或整合至染色体序列修饰靶向的染色体序列,或者将外源性序列引入植物细胞、植物细胞器或植物胚胎的染色体序列。
在其中融合蛋白效应物结构域是切割结构域的其它实施方式中,该方法可以包括向植物细胞、细胞器或植物胚胎引入两种不同的融合蛋白(或编码两种不同的融合蛋白的核酸)和两种引导RNA(或编码两种引导RNA的DNA)。该融合蛋白可与本文他处详述不同。各引导RNA将融合蛋白导向染色体序列中的特定靶位点,其中融合蛋白可以二聚化(例如,形成同二聚体),因此两个切割结构域可以将双链断裂引入染色体序列。在不存在任选供体多核苷酸的实施方式中,得到的双链断裂可以通过非同源性修复过程修复,这样的话在断裂修复期间可能会出现缺失至少一个核苷酸,插入至少一个核苷酸,取代至少一个核苷酸或其组合。在任选供体多核苷酸存在的实施方式中,在通过基于同源性的修复过程(例如,在供体序列侧接这样上游和下游序列的实施方式中,所述上游和下游序列具有分别与染色体序列中靶位点的上游和下游序列实质上的序列同一性中)或非同源性的修复过程(例如,在供体序列侧接相容突出端的实施方式中)的双链断裂修复期间,供体多核苷酸中的供体序列可以与染色体序列交换或整合至其中。
在其中融合蛋白效应物结构域是转录激活结构域或转录抑制物结构域的具体实施方式中,该方法可以包括向植物细胞、细胞器或植物胚胎引入一种融合蛋白(或编码一种融合蛋白的核酸)和一种引导RNA(或编码一种引导RNA的DNA)。引导RNA将融合蛋白导向特定染色体序列,其中转录激活结构域或转录抑制物结构域分别激活或抑制位于靶向的染色体序列附近的一个或多个基因的表达。也就是,转录可能受到非常接近靶向的染色体序列的基因的影响,或可能受到位于与靶向的染色体序列非常远的基因的影响。本领域已知可以通过远距离序列(distantly located sequence)调控基因转录,所述远距离序列可能离转录起始位点数千碱基远的位置或者甚至在不同的染色体上(Harmston和Lenhard(2013)Nucleic Acids Res 41:7185-7199)。
在其中融合蛋白效应物结构域是表观遗传修饰结构域的其它实施方式中,该方法可以包括向植物细胞、细胞器或植物胚胎引入一种融合蛋白(或编码一种融合蛋白的核酸)和一种引导RNA(或编码一种引导RNA的DNA)。该引导RNA将融合蛋白导向特定染色体序列,其中表观遗传修饰结构域修饰将靶向的染色体序列的结构。表观遗传修饰包括组蛋白的乙酰化、甲基化和/或核苷酸的甲基化。在一些情况中,染色体序列的结构修饰导致染色体序列表达的改变。
V.包括基因修饰的植物和植物细胞
本文提供了植物、植物细胞、植物细胞器和植物胚胎,其包括已经使用本文所述的Cpf1或Csm1多肽介导的或融合蛋白介导的方法修饰的至少一种核苷酸序列。还提供了植物细胞、细胞器和植物胚胎,其包括至少一种DNA或RNA分子,其编码Cpf1或Csm1多肽或靶向感兴趣的染色体序列或融合蛋白的融合蛋白,至少一种引导RNA,以及任选的一种或多种供体多核苷酸。本文所公开的遗传修饰的植物可以是修饰的核苷酸序列的杂合子或者可以是修饰的核苷酸序列的纯合子。在细胞器DNA中包括一种或多种基因修饰的植物细胞可以是异质的或同质的。
可以对植物、植物细胞器或植物细胞经修饰的染色体序列进行修饰从而使其灭活,具有上调的或下调的表达,或生成改变的蛋白产物,或包括整合的序列。可以将修饰的染色体序列灭活,从而使序列不再转录和/或功能性蛋白质产物不再生成。因此,包括灭活的染色体序列的遗传修饰的植物可以被称为“敲除”或“条件性敲除”。灭活的染色体序列可以包括缺失突变(即缺失一个或多个核苷酸)、插入突变(即插入一个或多个核苷酸)或无义突变(即为了另一核苷酸取代单个核苷酸从而引入终止密码子)。突变的后果是灭活靶向的染色体序列并且不再生成功能性蛋白质。灭活的染色体序列不包括外源性引入的序列。本文还包括遗传修饰的植物,其中2、3、4、5、6、7、8、9或10个或更多个染色体序列被灭活。
修饰的染色体序列还可以被改变,从而使其编码变体蛋白产物。例如,含有修饰的染色体序列的遗传修饰的植物可以包括靶向的点突变或其它修饰,从而生成改变的蛋白产物。在一实施方式中,染色体序列可以经修饰,从而使至少一个核苷酸改变,并且使表达的蛋白质包括一个改变的氨基酸残基(错义突变)。在其它实施方式中,染色体序列可经修饰以包括超过一个错义突变,从而使超过一个氨基酸改变。此外,染色体序列可经修饰以具有三个核苷酸缺失或插入,从而使表达的蛋白质包括单个氨基酸缺失或插入。改变的或变体蛋白质相较于野生型蛋白质可以具有改变的性质或活性,如改变的底物特性,改变的酶活性,改变的动力速率等。
在一些实施方式中,遗传修饰的植物可以包括至少一个染色体整合的核苷酸序列。包括整合序列的遗传修饰的植物可以被称为“敲入”或“条件性敲入”。例如,为整合序列的核苷酸序列可以编码直向同源蛋白、内源性蛋白或两者的组合。在一实施方式中,编码直向同源蛋白或内源性蛋白的序列可以被整合到编码蛋白质的核或细胞器染色体序列中,从而灭活染色体序列,但是表达外源性序列。在这样的情况中,编码直向同源蛋白或内源性蛋白的序列可以操作性地连接启动子控制序列。或者,在不影响染色体序列表达的情况下,可以将编码直向同源蛋白或内源性蛋白的序列整合到核或细胞器染色体序列中。例如,编码蛋白质的序列可以被整合到“安全港”基因座中。本公开还包括遗传修饰的植物,其中2、3、4、5、6、7、8、9或10个或更多个序列(包括编码蛋白质的序列)被整合到基因组中。本文所公开的任何感兴趣的基因可以被引入整合至植物细胞核或细胞器的染色体序列中。在特定实施方式中,将增加植物生长或产量的基因整合到染色体中。
编码蛋白质的染色体整合的序列可以编码感兴趣的蛋白质的野生型或者可以编码包括至少一种修饰的蛋白质,从而生成蛋白质的改变形式。例如,编码与疾病或病症相关的蛋白质的染色体整合的序列可以包括至少一种修饰,从而使生成的蛋白质的改变形式导致或给予相关病症。或者,编码与疾病或病症相关的蛋白质的染色体整合的序列可以包括至少一种修饰,从而使生成的蛋白质的改变保护植物避免相关疾病或病症的发展。
在某些实施方式中,遗传修饰的植物可以包括编码蛋白质的至少一种修饰的染色体序列,从而改变蛋白质的表达模式。例如,控制蛋白质表达的调控区域如启动子或转录因子结合位点可以经改变,从而使蛋白质过表达,或者改变蛋白质的组织特异性或时序性表达或其组合。或者,可以使用条件性敲除系统改变蛋白质的表达模式。条件性敲除系统的非限制示例包括Cre-lox重组系统。Cre-lox重组系统包括Cre重组酶,其是一种位点特异性DNA重组酶,可以催化核酸分子中特定位点(lox位点)之间的核酸序列的重组。本领域已知使用该系统生成时序和组织特异性表达的方法。
VI.在非植物真核基因组中修饰核苷酸序列的方法和包括基因修饰的非植物真核细胞
本文提供了用于修饰非植物真核细胞或非植物真核细胞器核苷酸序列的方法。该方法包括向靶细胞或细胞器引入DNA-靶向RNA或编码DNA-靶向RNA的DNA多核苷酸,其中DNA-靶向RNA包括:(a)第一区段,其包括与靶DNA中序列互补的核苷酸序列;和(b)第二区段,其与Cpf1或Csm1多肽相互作用并且向靶细胞或细胞器引入Cpf1或Csm1多肽或编码Cpf1或Csm1多肽的多核苷酸,其中Cpf1或Csm1多肽包括:(a)RNA-结合部分,其与DNA-靶向RNA相互作用;和(b)活性部分,其显示定点酶促活性。然后可以在嵌合的核酸酶多肽表达并且切割核苷酸序列的条件下培养靶细胞或细胞器。需指出的是,本文所述系统不需要添加外源性Mg2+或任何其他离子。最终,可以选择包括经修饰核苷酸序列的非植物真核细胞或细胞器。
在一些实施方式中,该方法可以包括向非植物真核细胞或细胞器中引入一个Cpf1或Csm1多肽(或编码核酸)和一个引导RNA(或编码DNA),其中Cpf1或Csm1多肽在核或细胞器染色体DNA的靶核苷酸序列中引入一个双链断裂。在一些实施方式中,该方法可以包括向非植物真核细胞或细胞器中引入一个Cpf1或Csm1多肽(或编码核酸)和至少一个引导RNA(或编码DNA),其中Cpf1或Csm1多肽在核或细胞器染色体DNA的靶核苷酸序列中引入超过一个(即2、3或超过3个双链断裂)双链断裂。在不存在任选供体多核苷酸实施方式中,核苷酸序列中的双链断裂可以通过非同源末端连接(NHEJ)修复过程进行修复。因为NHEJ是易错的,缺失至少一个核苷酸、插入至少一个核苷酸、取代至少一个核苷酸或其组合可能会出现在修复断裂期间。因此,靶向的核苷酸序列可以经修饰或灭活。例如,单核苷酸改变(SNP)可以产生改变的蛋白质产物,或者编码序列阅读框的移动可以灭活或“敲除”序列,从而不再产生蛋白质产物。在存在任选供体多核苷酸的实施方式中,供体多核苷酸中的供体序列在修复双链断裂期间可与靶位点的核苷酸序列交换或整合至其中。例如,在供体序列侧接这样上游和下游序列的实施方式中,所述上游和下游序列具有分别与非植物真核细胞或细胞器核苷酸序列中靶位点的上游和下游序列实质上的序列同一性,供体序列在通过同源性导向的修复过程介导的修复期间可以与靶位点的核苷酸序列交换或整合至其中。或者,在供体序列侧接相容突出端(或者该相容突出端由Cpf1或Csm1多肽原位生成)的实施方式中,供体序列在双链断裂修复期间通过非同源性修复过程可以直接连接切割的核苷酸序列。将供体序列交换或整合至核苷酸序列修饰靶向的核苷酸序列,或者将外源性序列引入非植物真核细胞或细胞器靶向的核苷酸序列。
在一些实施方式中,由一种或多种Cpf1或Csm1核酸酶作用所导致的双链断裂以这样的方式修复,所述方式使DNA从非植物真核细胞或细胞器染色体中缺失。在一些实施方式中,一个碱基、数个碱基(即2、3、4、5、6、7、8、9或10个碱基)或大部分的DNA(即,超过10、超过50、超过100、或超过500个碱基)从非植物真核细胞或细胞器中缺失。
在一些实施方式中,因为一种或多种Cpf1或Csm1核酸酶所导致的双链断裂,非植物真核基因的表达可能会被调节。在一些实施方式中,非植物真核基因的表达可能会被变体Cpf1或Csm1酶所调节,所述变体Cpf1或Csm1酶包括使Cpf1或Csm1核酸酶不可以生成双链断裂的突变。在一些优选实施方式中,包括使Cpf1或Csm1核酸酶不可以生成双链断裂的突变的变体Cpf1或Csm1核酸酶可以融合转录激活或转录抑制结构域。
在一些实施方式中,培养这样的真核细胞以生成真核生物,所述真核细胞在其核和/或细胞器染色体DNA包括由一种或多种Cpf1或Csm1核酸酶作用所导致的突变。在一些实施方式中,培养这样的真核细胞以生成真核生物,所述真核细胞中的基因表达因为一种或多种Cpf1或Csm1核酸酶或一种或多种变体Cpf1或Csm1核酸酶而被调节。培养非植物真核细胞以生成真核生物的方法为本领域已知,例如美国专利申请号2016/0208243和2016/0138008,通过引用纳入本文。
本发明可用于任何真核物种的转化,包括但不限于动物(包括但不限于哺乳动物、昆虫、鱼类、鸟类和爬行动物)、真菌、变形虫和酵母。
向非植物真核细胞或细胞器引入核酸酶蛋白质、编码核酸酶蛋白质的DNA或RNA分子、引导RNA或编码引导RNA的DNA分子、和任选的供体序列DNA分子的方法为本领域已知,例如美国专利申请号2016/0208243,通过引用纳入本文。对工业应用特别具有价值的非植物真核细胞或细胞器的示例性遗传修饰也为本领域已知,例如美国专利申请号2016/0208243,通过引用纳入本文。
VII.在原核基因组中修饰核苷酸序列的方法和包括基因修饰的原核细胞
本文提供了用于修饰原核(例如,细菌或古细菌)细胞核苷酸序列的方法。该方法包括向靶细胞引入DNA-靶向RNA或编码DNA-靶向RNA的DNA多核苷酸,其中DNA-靶向RNA包括:(a)第一区段,其包括与靶DNA中序列互补的核苷酸序列;和(b)第二区段,其与Cpf1或Csm1多肽相互作用;以及向靶细胞引入Cpf1或Csm1多肽或编码Cpf1或Csm1多肽的多核苷酸,其中Cpf1或Csm1多肽包括:(a)RNA-结合部分,其与DNA-靶向RNA相互作用;和(b)活性部分,其显示定点酶促活性。然后可以在Cpf1或Csm1多肽表达并且切割核苷酸序列的条件下培养靶细胞。需指出的是,本文所述系统不需要添加外源性Mg2+或任何其他离子。最终,可以选择包括经修饰核苷酸序列的原核细胞。需要进一步指出的是包括一个或多个经修饰的核苷酸序列的原核细胞并不是编码感兴趣的Cpf1或Csm1多肽的多核苷酸的天然宿主细胞,并且非天然产生的引导RNA被用于在一个或多个原核核苷酸序列中实现所需的改变。需要进一步指出的是靶向的DNA可能作为原核染色体的部分存在或者存在于原核细胞中的一个或多个质粒或其它非染色体DNA分子。
在一些实施方式中,该方法可以包括向原核细胞中引入一个Cpf1或Csm1多肽(或编码核酸)和一个引导RNA(或编码DNA),其中Cpf1或Csm1多肽在原核细胞DNA的靶核苷酸序列中引入一个双链断裂。在一些实施方式中,该方法可以包括向原核细胞中引入一个Cpf1或Csm1多肽(或编码核酸)和至少一个引导RNA(或编码DNA),其中Cpf1或Csm1多肽在原核细胞DNA的靶核苷酸序列中引入超过一个双链断裂(即2、3或超过3个双链断裂)。在不存在任选供体多核苷酸实施方式中,核苷酸序列中的双链锻炼可以通过非同源末端连接(NHEJ)修复过程进行修复。因为NHEJ是易错的,缺失至少一个核苷酸、插入至少一个核苷酸、取代至少一个核苷酸或其组合可能会出现在修复断裂期间。因此,靶向的核苷酸序列可以经修饰或灭活。例如,单核苷酸改变(SNP)可以产生改变的蛋白质产物,或者编码序列阅读框的移动可以灭活或“敲除”序列,从而不再产生蛋白质产物。在存在任选供体多核苷酸的实施方式中,供体多核苷酸中的供体序列在修复双链断裂期间可与靶位点的核苷酸序列交换或整合至其中。例如,在供体序列侧接这样上游和下游序列的实施方式中,所述上游和下游序列具有分别与原核细胞核苷酸序列中靶位点的上游和下游序列实质上的序列同一性,供体序列在通过同源性导向的修复过程介导的修复期间可以与靶位点的核苷酸序列交换或整合至其中。或者,在供体序列侧接相容突出端(或者该相容突出端由Cpf1或Csm1多肽原位生成)的实施方式中,供体序列在双链断裂修复期间通过非同源性修复过程可以直接连接切割的核苷酸序列。将供体序列交换或整合至核苷酸序列修饰靶向的核苷酸序列,或者将外源性序列引入原核细胞DNA的靶向的核苷酸序列。
在一些实施方式中,由一种或多种Cpf1或Csm1核酸酶作用所导致的双链断裂以这样的方式修复,所述方式使DNA从原核细胞DNA中缺失。在一些实施方式中,一个碱基、数个碱基(即2、3、4、5、6、7、8、9或10个碱基)或大部分的DNA(即,超过10、超过50、超过100、或超过500个碱基)从原核细胞DNA中缺失。
在一些实施方式中,因为一种或多种Cpf1或Csm1核酸酶所导致的双链断裂,原核基因的表达可能会被调节。在一些实施方式中,原核基因的表达可能会被变体Cpf1或Csm1核酸酶所调节,所述变体Cpf1或Csm1核酸酶包括使Cpf1或Csm1核酸酶不可以生成双链断裂的突变。在一些优选实施方式中,包括使Cpf1或Csm1核酸酶不可以生成双链断裂的突变的变体Cpf1或Csm1核酸酶可以融合转录激活或转录抑制结构域。
本发明可以用于转化任何原核生物,包括但不限于蓝藻细菌,棒状杆菌(Corynebacterium sp.),双歧杆菌(Bifidobacterium sp.),分枝杆菌(Mycobacteriumsp.),链霉菌(Streptomyces sp.),温双岐菌(Thermobifida sp.),衣原体(Chlamydiasp.),原绿球藻(Prochlorococcus sp.),聚球藻(Synechococcus sp.),热聚球藻(Thermosynechococcus sp.),泉栖热菌(Thermus sp.),芽孢杆菌(Bacillus sp.),梭菌(Clostridium sp.),土芽孢杆菌(Geobacillus sp.),乳杆菌(Lactobacillus sp.),李斯特菌(Listeria sp.),葡萄球菌(Staphylococcus sp.),链球菌(Streptococcus sp.),梭菌(Fusobacterium sp.),农杆菌(Agrobacterium sp.),慢生根瘤菌(Bradyrhizobiumsp.),埃立克体(Ehrlichia sp.),中慢生根瘤菌(Mesorhizobium sp.),硝酸菌(Nitrobacter sp.),立克次体(Rickettsia sp.),沃尔巴克氏体(Wolbachia sp.),单胞发酵菌(Zymomonas sp.),伯克霍尔德菌(Burkholderia sp.),奈瑟氏菌(Neisseria sp.),罗尔斯通菌(Ralstonia sp.),不动杆菌(Acinetobacter sp.),欧文氏菌(Erwinia sp.),埃希氏杆菌(Escherichia sp.),嗜血杆菌(Haemophilus sp.),军团杆菌(Legionella sp.),巴斯德菌(Pasteurella sp.),假单胞菌(Pseudomonas sp.),嗜冷杆菌(Psychrobactersp.),沙门氏菌(Salmonella sp.),希瓦氏菌(Shewanella sp.),志贺氏杆菌(Shigellasp.),弧菌(Vibrio sp.),黄单胞菌(Xanthomonas sp.),木杆菌(Xylella sp.),耶尔森菌(Yersinia sp.),弯曲杆菌(Campylobacter sp.),脱硫弧菌(Desulfovibrio sp.),螺杆菌(Helicobacter sp.),地杆菌(Geobacter sp.),细螺旋体(Leptospira sp.),密螺旋体(Treponema sp.),支原菌(Mycoplasma sp.)和热袍菌(Thermotoga sp.)。
向原核细胞或细胞器引入核酸酶蛋白质、编码核酸酶蛋白质的DNA或RNA分子、引导RNA或编码引导RNA的DNA分子、和任选的供体序列DNA分子的方法为本领域已知,例如美国专利申请号2016/0208243,通过引用纳入本文。对工业应用特别具有价值的原核细胞或细胞器的示例性遗传修饰也为本领域已知,例如美国专利申请号2016/0208243,通过引用纳入本文。
本说明书中涉及的所有专利申请和出版物指示本发明涉及领域技术人员的水平。所有发表物和专利申请通过引用纳入本文,就好像将各篇单独的发表物或专利申请具体和单独地通过引用纳入本文那样。
虽然出于方便理解的目的,通过阐述和举例的方式详细描述了上述发明,但可明显看出,某些改变和修改应属于所附权利要求书的范围。
本发明的实施方式包括:
1.一种修饰真核细胞基因组中靶位点的核苷酸序列的方法,其包括:
向所述真核细胞中导入
(i)DNA-靶向RNA,或编码DNA-靶向RNA的DNA多核苷酸,其中所述DNA-靶向RNA包括:(a)第一区段,其包括与靶DNA中序列互补的核苷酸序列;和(b)第二区段,其与Cpf1或Csm1多肽相互作用;以及
(ii)Cpf1或Csm1多肽,或编码Cpf1或Csm1多肽的多核苷酸,其中所述Cpf1或Csm1多肽包括:(a)RNA-结合部分,其与DNA-靶向RNA相互作用;和(b)活性部分,其显示定点酶促活性。
2.一种修饰原核细胞基因组中靶位点的核苷酸序列的方法,其包括:
向所述原核细胞中导入
(i)DNA-靶向RNA,或编码DNA-靶向RNA的DNA多核苷酸,其中所述DNA-靶向RNA包括:(a)第一区段,其包括与靶DNA中序列互补的核苷酸序列;和(b)第二区段,其与Cpf1或Csm1多肽相互作用;以及
(ii)Cpf1或Csm1多肽,或编码Cpf1或Csm1多肽的多核苷酸,其中所述Cpf1或Csm1多肽包括:(a)RNA-结合部分,其与DNA-靶向RNA相互作用;和(b)活性部分,其显示定点酶促活性,
其中所述原核细胞不是编码所述Cpf1或Csm1多肽的基因的天然宿主。
3.一种修饰植物细胞基因组中靶位点的核苷酸序列的方法,其包括:
向所述植物细胞中导入
(i)DNA-靶向RNA,或编码DNA-靶向RNA的DNA多核苷酸,其中所述DNA-靶向RNA包括:(a)第一区段,其包括与靶DNA中序列互补的核苷酸序列;和(b)第二区段,其与Cpf1或Csm1多肽相互作用;以及
(ii)Cpf1或Csm1多肽,或编码Cpf1或Csm1多肽的多核苷酸,其中所述Cpf1或Csm1多肽包括:(a)RNA-结合部分,其与DNA-靶向RNA相互作用;和(b)活性部分,其显示定点酶促活性。
4.如实施方式1-3中任一项所述的方法,其还包括:
在表达所述Cpf1或Csm1多肽并在所述靶位点切割所述核苷酸序列以生成修饰的核苷酸序列的条件下培养所述植物;并且
选择包括所述修饰的核苷酸序列的植物。
5.如实施方式1-4中任一项所述的方法,其中切割靶位点的核苷酸序列包括双链断裂,所述双链断裂位于或邻近DNA-靶向RNA序列靶向的序列。
6.如实施方式5所述的方法,其中所述双链断裂是交错的双链断裂。
7.如实施方式6所述的方法,其中所述交错的双链断裂产生3-6个核苷酸的5'突出端。
8.如实施方式1-7中任一项所述的方法,其中所述DNA-靶向RNA是引导RNA(gRNA)。
9.如实施方式1-8中任一项所述的方法,其中所述修饰的核苷酸序列包括细胞基因组中异源性DNA的插入,细胞基因组中核苷酸序列的缺失,或细胞基因组中至少一个核苷酸的突变。
10.如实施方式1-9中任一项所述的方法,其中所述Cpf1或Csm1多肽选自:SEQ IDNO:3、6、9、12、15、18、20、23、106-173和230-236。
11.如实施方式1-10中任一项所述的方法,其中所述编码Cpf1或Csm1多肽的多核苷酸选自:SEQ ID NO:4、5、7、8、10、11、13、14、16、17、19、21、22、24、25和174-206。
12.如实施方式1-11中任一项所述的方法,其中所述Cpf1或Csm1多肽与选自下述的一个或多个多肽序列具有至少80%的同一性:SEQ ID NO:3、6、9、12、15、18、20、23、106-173和230-236。
13.如实施方式1-12中任一项所述的方法,其中所述编码Cpf1或Csm1多肽的多核苷酸与选自下述的一个或多个核酸序列具有至少70%的同一性:SEQ ID NO:4、5、7、8、10、11、13、14、16、17、19、21、22、24、25和174-206。
14.如实施方式1-13中任一项所述的方法,其中所述Cpf1或Csm1多肽形成同二聚体或异二聚体。
15.如实施方式1-14中任一项所述的方法,其中所述植物细胞来自单子叶植物物种。
16.如实施方式1-14中任一项所述的方法,其中所述植物细胞来自双子叶植物物种。
17.如实施方式1-16中任一项所述的方法,其中所述Cpf1或Csm1多肽的表达在诱导型或组成型启动子的控制下。
18.如实施方式1-17中任一项所述的方法,其中所述Cpf1或Csm1多肽的表达在细胞类型特异性或发育优选启动子的控制下。
19.如实施方式1-18中任一项所述的方法,其中PAM序列包括5'-TTN,其中N可以是任何核苷酸。
20.如实施方式1-19中任一项所述的方法,其中位于细胞基因组靶位点的所述核苷酸序列编码SBP酶,FBP酶,FBP醛缩酶,AGP酶大亚基,AGP酶小亚基,蔗糖磷酸合成酶,淀粉合成酶,PEP羧化酶,丙酮酸磷酸二激酶,转酮醇酶,rubisco小亚基,或rubisco活化酶蛋白,或编码调节一个或多个基因表达的转录因子,所述基因编码SBP酶,FBP酶,FBP醛缩酶,AGP酶大亚基,AGP酶小亚基,蔗糖磷酸合成酶,淀粉合成酶,PEP羧化酶,丙酮酸磷酸二激酶,转酮醇酶,rubisco小亚基或rubisco活化酶蛋白。
21.如实施方式1-20中任一项所述的方法,所述方法还包括将靶位点与供体多核苷酸接触,其中供体多核苷酸、供体多核苷酸的部分、供体多核苷酸的拷贝或供体多核苷酸拷贝的部分整合至靶DNA中。
22.如实施方式1-21中任一项所述的方法,其中所述靶DNA经修饰,从而使靶DNA内的核苷酸缺失。
23.如实施方式1-22中任一项所述的方法,其中所述编码Cpf1或Csm1多肽的多核苷酸为在植物细胞中表达进行了密码子优化。
24.如实施方式1-23中任一项所述的方法,其中所述核苷酸序列的表达增加或降低。
25.如实施方式1-24中任一项所述的方法,其中所述编码Cpf1或Csm1多肽的多核酸操作性连接至启动子,所述启动子是组成型、细胞特异型、诱导型或被自杀外显子的可变剪接激活的启动子。
26.如实施方式1-25中任一项所述的方法,其中所述Cpf1或Csm1多肽包括一个或多个突变,所述突变减弱或消除所述Cpf1或Csm1多肽的核酸酶活性。
27.如实施方式26所述的方法,其中当进行最大同一性比对时,所述突变的Cpf1或Csm1多肽在对应FnCpf1(SEQ ID NO:3)位置917或1006或者SmCsm1(SEQ ID NO:160)位置701或922的位置中包括突变,或者当进行最大同一性比对时,所述突变的Cpf1或Csm1多肽包括在FnCpf1(SEQ ID NO:3)位置917和1006或SmCsm1(SEQ ID NO:160)位置701和922的突变。
28.如实施方式27所述的方法,其中所述对应FnCpf1(SEQ ID NO:3)位置917或1006的位置中的突变分别是D917A和E1006A,或者其中所述对应SmCsm1(SEQ ID NO:160)位置701或922的位置中的突变分别是D701A和E922A。
29.如实施方式26-28中任一项所述的方法,其中所述突变的Cpf1或Csm1多肽包括SEQ ID NO:26-41和63-70中所示的氨基酸序列。
30.如实施方式26-29中任一项所述的方法,其中所述突变的Cpf1或Csm1多肽与转录激活结构域融合。
31.如实施方式30所述的方法,其中所述突变的Cpf1或Csm1多肽直接融合至转录激活结构域或经由接头融合至转录激活结构域。
32.如实施方式26-29中任一项所述的方法,其中所述突变的Cpf1或Csm1多肽与转录抑制物结构域融合。
33.如实施方式32所述的方法,其中所述突变的Cpf1或Csm1多肽与转录抑制物结构域经由接头融合。
34.如实施方式1-33中任一项所述的方法,其中所述Cpf1或Csm1多肽进一步包括核定位信号。
35.如实施方式34所述的方法,其中所述核定位信号包括SEQ ID NO:1,或其由SEQID NO:2编码。
36.如实施方式1-33中任一项所述的方法,其中所述Cpf1或Csm1多肽进一步包括叶绿体信号肽。
37.如实施方式1-33中任一项所述的方法,其中所述Cpf1或Csm1多肽进一步包括线粒体信号肽。
38.如实施方式1-33中任一项所述的方法,其中所述Cpf1或Csm1多肽进一步包括信号肽,所述信号肽靶向Cpf1或Csm1多肽至多个亚细胞位置。
39.一种核酸分子,其包括编码Cpf1或Csm1多肽的多核苷酸序列,其中所述多核苷酸序列为在植物细胞中表达进行了密码子优化。
40.一种核酸分子,其包括编码Cpf1或Csm1多肽的多核苷酸序列,其中所述多核苷酸序列已经密码子优化,用于在真核细胞中表达。
41.一种核酸分子,其包括编码Cpf1或Csm1多肽的多核苷酸序列,其中所述多核苷酸序列已经密码子优化,用于在原核细胞中表达,其中所述原核细胞不是所述Cpf1或Csm1多肽的天然宿主。
42.如实施方式39-41中任一项所述的核酸分子,其中所述多核苷酸序列选自:SEQID NO:4、5、7、8、10、11、13、14、16、17、19、21、22、24、25和174-206或其片段或变体,或者其中所述多核苷酸序列编码选自SEQ ID NO:3、6、9、12、15、18、20、23、106-173和230-236的Cpf1或Csm1多肽,并且其中所述编码Cpf1或Csm1多肽的多核苷酸序列操作性连接至启动子,所述启动子对编码Cpf1或Csm1多肽的多核苷酸序列是异源性的。
43.如实施方式39-41中任一项所述的核酸分子,其中所述变体多核苷酸序列与选自下述的多核苷酸序列具有至少70%序列同一性:SEQ ID NO:4、5、7、8、10、11、13、14、16、17、19、21、22、24、25和174-206,或者其中所述多核苷酸序列编码与下述的多肽具有至少80%序列同一性的Cpf1或Csm1多肽,并且其中所述编码Cpf1或Csm1多肽的多核苷酸序列操作性连接至启动子,所述启动子对编码Cpf1或Csm1多肽的多核苷酸序列是异源性的。
44.如实施方式39-41中任一项所述的核酸分子,其中所述Cpf1或Csm1多肽包括氨基酸序列,所述氨基酸序列选自:SEQ ID NO:3、6、9、12、15、18、20、23、106-173和230-236或其片段或变体。
45.如实施方式44所述的核酸分子,其中所述变体多肽序列与选自下述的多肽序列序列具有至少70%序列同一性:SEQ ID NO:3、6、9、12、15、18、20、23、106-173和230-236。
46.如实施方式39-45中任一项所述的核酸分子,其中所述编码Cpf1或Csm1多肽的多核苷酸序列操作性地连接在植物细胞中有活性的启动子。
47.如实施方式39-45中任一项所述的核酸分子,其中所述编码Cpf1或Csm1多肽的多核苷酸序列操作性地连接在真核细胞中有活性的启动子。
48.如实施方式39-45中任一项所述的核酸分子,其中所述编码Cpf1或Csm1多肽的多核苷酸序列操作性地连接在原核细胞中有活性的启动子。
49.如实施方式39-45中任一项所述的核酸分子,其中所述编码Cpf1或Csm1多肽的多核苷酸序列操作性地连接组成型启动子、诱导型启动子、细胞类型特异性启动子或发育优选启动子。
50.如实施方式39-45中任一项所述的核酸分子,其中所述核酸分子编码包括所述Cpf1或Csm1多肽和效应物结构域的融合蛋白。
51.如实施方式50所述的核酸分子,其中所述效应物结构域选自:转录激活因子、转录抑制物、核定位信号和细胞穿透信号。
52.如实施方式51所述的核酸分子,其中所述Cpf1或Csm1多肽经突变以使核酸酶活性降低或消除。
53.如实施方式52所述的核酸分子,其中当进行最大同一性比对时,所述突变的Cpf1或Csm1多肽在对应FnCpf1(SEQ ID NO:3)位置917或1006或者SmCsm1(SEQ ID NO:160)位置701或922的位置中包括突变,或者当进行最大同一性比对时,所述突变的Cpf1或Csm1多肽在对应FnCpf1(SEQ ID NO:3)位置917和1006或SmCsm1(SEQ ID NO:160)位置701和922的位置处包括突变。
54.如实施方式50-53中任一项所述的核酸分子,其中所述Cpf1或Csm1多肽经由接头与所述效应物结构域融合。
55.如实施方式39-54中任一项所述的核酸分子,其中所述Cpf1或Csm1多肽形成二聚体。
56.由实施方式50-55中任一项所述的核酸分子编码的融合蛋白。
57.一种通过实施方式39-45中任一项所述的核酸分子编码的Cpf1或Csm1多肽。
58.一种经变异以降低或消除核酸酶活性的Cpf1或Csm1多肽。
59.如实施方式58所述的Cpf1或Csm1多肽,其中当进行最大同一性比对时,所述突变的Cpf1或Csm1多肽在对应FnCpf1(SEQ ID NO:3)位置917或1006或者SmCsm1(SEQ ID NO:160)位置701或922的位置中包括突变,或者当进行最大同一性比对时,所述突变的Cpf1或Csm1多肽在对应FnCpf1(SEQ ID NO:3)位置917和1006或SmCsm1(SEQ ID NO:160)位置701和922的位置处包括突变。
60.包括实施方式39-55中任一项所述的核酸分子的植物细胞、真核细胞或原核细胞。
61.一种包括实施方式56-59中任一项所述的融合蛋白或多肽的植物细胞、真核细胞或原核细胞。
62.一种通过实施方式1和3-38中任一项所述方法产生的植物细胞。
63.一种包括实施方式39-55中任一项所述的核酸分子的植物。
64.一种包括实施方式56-59中任一项所述的融合蛋白或多肽的植物。
65.一种通过实施方式1和3-38中任一项所述方法产生的植物。
66.如实施方式63-65中任一项所述的植物的种子。
67.如实施方式1和3-38中任一项所述的方法,其中,所述修饰的核苷酸序列包括多核苷酸的插入,所述多核苷酸编码向转化的细胞赋予抗生素或除草剂耐受的蛋白质。
68.如实施方式67所述的方法,其中,所述编码赋予抗生素或除草剂耐受的蛋白质的多核苷酸包括SEQ ID NO:76,或编码包括SEQ ID NO:77的蛋白质。
69.如实施方式3-38中任一项所述的方法,其中所述植物细胞基因组中的靶位点包括SEQ ID NO:71,或与SEQ ID NO:71的部分或片段具有至少80%同一性。
70.如实施方式1-38中任一项所述的方法,其中所述编码DNA靶向RNA的DNA多核苷酸包括SEQ ID NO:73、SEQ ID NO:91、SEQ ID NO:92、SEQ ID NO:93或SEQ ID NO:95。
71.如实施方式39-55中任一项所述的核酸分子,其中所述编码Cpf1或Csm1多肽的多核苷酸序列进一步包括编码核定位信号的多核苷酸序列。
72.如实施方式71所述的核酸分子,其中所述核定位信号包括SEQ ID NO:1,或其由SEQ ID NO:2编码。
73.如实施方式39-55中任一项所述的核酸分子,其中所述编码Cpf1或Csm1多肽的多核苷酸序列进一步包括编码叶绿体信号肽的多核苷酸序列。
74.如实施方式39-55中任一项所述的核酸分子,其中所述编码Cpf1或Csm1多肽的多核苷酸序列进一步包括编码线粒体信号肽的多核苷酸序列。
75.如实施方式39-55中任一项所述的核酸分子,其中所述编码Cpf1或Csm1多肽的多核苷酸序列进一步包括编码信号肽的多核苷酸序列,所述信号肽靶向所述Cpf1或Csm1多肽至多个亚细胞位置。
76.如实施方式56所述的融合蛋白,其中所述融合蛋白还包括核定位信号,叶绿体信号肽,线粒体信号肽或靶向所述Cpf1或Csm1多肽至多个亚细胞位置的信号肽。
77.如实施方式57-59中任一项所述的Cpf1或Csm1多肽,其中所述Cpf1或Csm1多肽还包括核定位信号,叶绿体信号肽,线粒体信号肽或靶向所述Cpf1或Csm1多肽至多个亚细胞位置的信号肽。
通过说明的方式,而非限制性方式提供以下实施例。
实验部分
实施例1–克隆cpf1构建体
表1总结了含Cpf1的构建体(构建体序号131306-131311和131313)。简言之,通过GenScript(新泽西州的皮斯卡塔韦(Piscataway))重头合成cpf1基因,并且通过PCR扩增以将N-末端SV40核定位标签(SEQ ID NO:2)添加到感兴趣的cpf1编码序列以及克隆的限制性酶位点的框架中。利用适当的限制性酶位点,将各独立的cpf1基因克隆至2x35s启动子(SEQID NO:43)的下游。
通过整合DNA技术公司(Integrated DNA Technologies)(爱荷华州克拉威尔)合成靶向DNA区域的引导RNA的完整盒,所述DNA区域横跨启动子和GFP编码区5’端之间的连接。各盒包括操作性地连接适当gRNA(SEQ ID NO:47-53)的水稻U3启动子(SEQ ID NO:42),所述适当gRNA(SEQ ID NO:47-53)操作性地连接水稻U3终止子(SEQ ID NO:44)。尽管各gRNA靶向启动子和GFP基因相同的区域,但是各gRNA被设计成保证其包括适当的支架以正确地与其相应的Cpf1酶相互作用。
组装构建体并且将其克隆至含有hptII基因的经修饰的pSB11载体主链,所述hptII基因可以赋予植物潮霉素B耐药性(SEQ ID NO:45)。hptII基因位于玉米泛素启动子和5’UTR(pZmUbi;SEQ ID NO:46)下游。
表1:Cpf1载体
Figure BDA0001785043450000521
Figure BDA0001785043450000531
1–各cpf1基因与SV40核定位信号(SEQ ID NO:2,编码氨基酸序列SEQ ID NO:1)在其5’端框内融合。
实施例2–农杆菌介导的水稻转化
用含有超级二元质粒的农杆菌细胞感染水稻(Oryza sativa cv.Kitaake)愈伤组织,所述超级二元质粒包含操作性连接组成型启动子的编码绿色荧光蛋白(GFP;编码SEQID NO:56的SEQ ID NO:55)的基因。选择基于目测检测显示出高水平GFP来源荧光的3个感染的愈伤组织,并且将其分成多个区段。允许这些区段在选择性培养基上繁殖。在允许这些愈伤组织块恢复和长大后,用含有编码Cpf1酶的基因以及相应引导RNA(gRNA)的细胞的农杆菌再感染这些愈伤组织。在用含cpf1的载体感染后,愈伤组织在含有潮霉素b的选择性培养基上繁殖。通过检测愈伤组织块不再具有可见荧光的区域的目测选择推定表达功能性Cpf1蛋白的愈伤组织块。荧光的丢失可能是由于Cpf1介导的GFP编码序列编辑的成功所导致,这导致非功能性GFP基因。例如,首先用GFP构建体然后用构建体131307转化的水稻愈伤组织,其包含来自氨基酸球菌的编码Cpf1蛋白的基因。BV3L6(SEQ ID NO:8,编码SEQ IDNO:6)导致部分愈伤组织显示明显的GFP源荧光丢失。含有不显示GFP源荧光的细胞群的这些水稻愈伤组织块被优先考虑深度分子表征。
实施例3–T7EI试验
T7内切核酸酶I(T7EI)试验被用于鉴定在所需位置具有插入和/或缺失的样品,并且用于评价基因组编辑酶的靶向活性。该试验方案改良至Shan等(2014)Nature Protocols9:2395-2410。该试验的基础是T7EI识别并切割非完美匹配的DNA。简言之,进行PCR反应以扩增含有被gRNA靶向的DNA序列的DNA区域。因为编辑的和未编辑的DNA都被认为将包括在样品中,所以获得PCR产物的混合物。融化PRC产物,并且其后允许其再退火。当未编辑的RCR产物与编辑的PCR产物再退火时候,产生DNA错配。这些DNA错配通过T7EI消化,并且通过基于凝胶的试验鉴定。由水稻愈伤组织提取看起来显示出GFP源荧光丢失的DNA。使用设计为扩增DNA区域以该DNA作为模板进行PCR,所述DNA区域跨越启动子和GFP开放阅读框之间的连接。融化PCR产物并且再退火,然后根据生产商的方法使用T7EI(马萨诸塞州伊普斯维奇新英格兰生物实验室)进行消化。获得的DNA在2%琼脂糖凝胶上电泳。在Cpf1在所需位置产生插入或缺失的这些样品中,消化初始条带以生成两个更小的条带。
实施例4–对来自水稻愈伤组织的DNA进行测序
根据荧光丢失的目测检测和/或基于T7EI试验的结果,选择提取自水稻愈伤组织的DNA进行基于序列的分析,所述DNA看起来包括因为功能性Cpf1酶积累而编辑的基因组DNA。使用提取自合适水稻愈伤组织块的DNA和引物由该DNA对GFP编码序列进行PCR扩增。将获得的PCR产物克隆到质粒中随后将其转染至大肠杆菌细胞。回收这些质粒,并且使用Sanger测序分析DNA以鉴定GFP编码DNA中的插入、缺失和/或点突变。
实施例5–使用失活的Cpf1蛋白质调节基因表达
已经证明Cpf1的RuvC样结构域利用在来自新杀手土拉弗朗西斯菌亚种(Fancisella tularensis subsp.novicida)U112(即D917和E1006)的Cpf1酶中确定的特定残基介导DNA切割(Zetsche等(2015)Cell 163:759-771),所述特定残基当从天然氨基酸突变到丙氨酸时完全灭活DNA切割活性。对此处研究的8个Cpf1酶使用Clustal W多重比对(Thompson等(1994)Nucleic Acid Research22:4673-4680)进行基于氨基酸的比对,以在其它酶中鉴定对应的氨基酸残基。表2列出这些氨基酸残基。对应表2所列各氨基酸残基的点突变的灭活Cpf1蛋白的氨基酸序列示于SEQ ID NO:26-41。在表2中各cpf1蛋白的两个残基包括突变的双重突变的灭活Cpf1蛋白的氨基酸序列示于SEQ ID NO:63-70。
表2:经突变以生成灭活Cpf1酶的氨基酸残基
<u>蛋白质</u> <u>第一氨基酸(a.a.)</u> <u>第二氨基酸</u>
FnCpf1(SEQ ID NO:3) D917 E1006
AsCpf1(SEQ ID NO:6) D908 E993
Lb2Cpf1(SEQ ID NO:9) D815 E906
CMtCpf1(SEQ ID NO:12) D859 E944
MbCpf1(SEQ ID NO:15) D986 E1080
LbCpf1(SEQ ID NO:18) D832 E925
PcCpf1(SEQ ID NO:20) D878 E963
PdCpf1(SEQ ID NO:23) D943 E1032
设计合适的引物,从而可以进行Quikchange PCR(加利福尼亚州圣克拉拉的安捷伦科技公司(Agilent Technologies))以生成SEQ ID NO:26-41中所列编码灭活Cpf1序列的基因,并且生成编码SEQ ID NO:63-70中所列灭活Cpf1序列的基因。进行PCR来生成编码融合蛋白的基因,所述融合蛋白含有融合基因表达激活或抑制结构域如EDLL或TAL激活结构域或SRDX抑制物结构域的灭活Cpf1蛋白,具有融合于基因5'端框架中的SV40核定位信号(SEQ ID NO:2,编码SEQ ID NO:1)。将引导RNA(gRNA)设计成允许gRNA与灭活Cpf1蛋白相互作用以及引导灭活Cpf1蛋白至植物基因组中所需位置。将这样的盒克隆到适合植物转化的载体中,所述盒含有感兴趣的gRNA,操作性地连接在植物细胞中可操作的启动子,并且含有编码融合激活和/或抑制结构域的Cpf1融合蛋白的基因。转化该载体到植物细胞中,导致gRNA和Cpf1融合蛋白在植物细胞中生成。含有灭活Cpf1蛋白和激活或抑制物结构域的融合蛋白在植物基因组中产生对附近基因表达的调节。
实施例6–编辑玉米(Zea mays)中的预定基因组基因座
设计一种或多种gRNA以在玉米基因组中所需位点退火,并且允许与一个或多个Cpf1或Csm1蛋白的相互作用。将这些gRNA克隆至载体,从而使其操作性地连接在植物细胞中可操作的启动子(“gRNA盒”)。将编码Cpf1或Csm1蛋白的一种或多种基因克隆到载体,从而使其操作性地连接在植物细胞中可操作的启动子(“cpf1盒”或“csm1盒”)。将gRNA盒和cpf1盒或csm1盒各自克隆到适合植物转化的载体中,并且随后将该载体转化至农杆菌细胞。将这些细胞与适合转化的玉米组织接触。在与农杆菌细胞孵育后,在适合再生完整植物的组织培养基上培养玉米细胞。玉米植物由与农杆菌细胞接触的细胞再生,所述农杆菌细胞具有包含cpf1或csm1盒和gRNA盒的载体。在玉米植物再生后,收获植物组织并且从组织提取DNA。酌情进行T7EI试验和/或测序试验以确定DNA序列中的改变是否发生在所需基因组位置。
或者,使用颗粒轰击将cpf1或csm1盒和gRNA盒引入玉米细胞。将含有cpf1或csm1盒和gRNA盒的载体涂覆于金珠或钛珠上,然后将其用于轰击适合用于再生的玉米组织。轰击后,将玉米组织转移至用于再生玉米植物的组织培养基。在玉米植物再生后,收获植物组织并且从组织提取DNA。酌情进行T7EI试验和/或测序试验以确定DNA序列中的改变是否发生在所需基因组位置。
实施例7–编辑狗尾草(Setaria viridis)中的预定基因组基因座
设计一种或多种gRNA以在狗尾草基因组中所需位点退火,并且允许与一个或多个Cpf1或Csm1蛋白的相互作用。将这些gRNA克隆至载体,从而使其操作性地连接在植物细胞中可操作的启动子(“gRNA盒”)。将编码Cpf1或Csm1蛋白的一种或多种基因克隆到载体,从而使其操作性地连接在植物细胞中可操作的启动子(“cpf1盒”或“csm1盒”)。将gRNA盒和cpf1盒或csm1盒各自克隆到适合植物转化的载体中,并且随后将该载体转化至农杆菌细胞。将这些细胞与适合转化的狗尾草组织接触。在与农杆菌细胞孵育后,在适合再生完整植物的组织培养基上培养狗尾草细胞。狗尾草植物由与农杆菌细胞接触的细胞再生,所述农杆菌细胞具有包含cpf1盒或csm1盒和gRNA盒的载体。在狗尾草植物再生后,收获植物组织并且从组织提取DNA。酌情进行T7EI试验和/或测序试验以确定DNA序列中的改变是否发生在所需基因组位置。
或者,使用颗粒轰击将cpf1盒或csm1盒和gRNA盒引入狗尾草细胞。将含有cpf1盒或csm1盒和gRNA盒的载体涂覆于金珠或钛珠上,然后将其用于轰击适合用于再生的狗尾草组织。轰击后,将狗尾草组织转移至用于再生完整植物的组织培养基。在植物再生后,收获植物组织并且从组织提取DNA。酌情进行T7EI试验和/或测序试验以确定DNA序列中的改变是否发生在所需基因组位置。
实施例8–从预定基因组基因座的DNA缺失
设计第一gRNA以在感兴趣的植物基因组中第一所需位点退火,并且允许与一个或多个Cpf1或Csm1蛋白的相互作用。设计第二gRNA以在感兴趣的植物基因组中第二所需位点退火,并且允许与一个或多个Cpf1或Csm1蛋白的相互作用。这些gRNA各自操作性地连接在植物细胞中可操作的启动子,并且随后被克隆到适合植物转化的载体。将编码Cpf1或Csm1蛋白的一种或多种基因克隆到载体,从而使其操作性地连接在植物细胞中可操作的启动子(“cpf1盒”或“csm1盒”)。将cpf1盒或csm1盒和gRNA盒克隆到单个植物转化载体中,并且随后将其转化至农杆菌细胞。将这些组织与适合转化的植物组织接触。在与农杆菌细胞孵育后,在适合再生完整植物的组织培养基上培养植物细胞。或者,将含有cpf1盒或csm1盒和gRNA盒的载体涂覆于适合轰击植物细胞的金或钛珠。轰击细胞,然后转移至适合再生完整植物的组织培养基。gRNA-Cpf1或gRNA-Csm1复合物在所需基因组基因座中实现双链断裂,并且在一些情况中,DNA修复机制导致DNA以这样的方式修复,在所述方式中位于两个靶向的基因组基因座之间的天然DNA序列缺失。植物由与农杆菌细胞接触的细胞再生,所述农杆菌细胞具有包含cpf1盒或csm1盒和gRNA盒的载体,或者被涂覆该载体的珠轰击。在植物再生后,收获植物组织并且从组织提取DNA。酌情进行T7EI试验和/或测序试验以确定已经使DNA序列从所需一个或多个基因组位置缺失。
实施例9–在预定基因组基因座插入DNA
设计gRNA以在感兴趣的植物基因组中所需位点退火,并且允许与一个或多个Cpf1或Csm1蛋白的相互作用。gRNA操作性地连接在植物细胞中可操作的启动子,并且随后被克隆到适合植物转化的载体。将编码Cpf1或Csm1蛋白的一种或多种基因克隆到载体,从而使其操作性地连接在植物细胞中可操作的启动子(“cpf1盒”或“csm1盒”)。将cpf1盒或csm1盒和gRNA盒两者克隆到单个植物转化载体中,并且随后将其转化至农杆菌细胞。将这些组织与适合转化的植物组织接触。同时,将供体DNA引入这些相同的植物细胞中。所述供体DNA包括DNA分子,其将插入植物基因座中所需位点,由上游和下游侧接区域侧接。上游侧接区域与gRNA靶向的基因组基因座的基因组DNA上游区域具有同源性,并且下游侧接区域与gRNA靶向的基因组基因座的基因组DNA下游区域具有同源性。上游和下游侧接区域介导DNA插入植物基因组所需位点。在与农杆菌细胞孵育以及孵育供体DNA后,在适合再生完整植物的组织培养基上培养植物细胞。植物由与农杆菌细胞接触的细胞再生,所述农杆菌细胞具有包含cpf1盒或csm1盒和gRNA盒的载体。在植物再生后,收获植物组织并且从组织提取DNA。酌情进行T7EI试验和/或测序试验以确定已经使DNA序列插入所需一个或多个基因组位置。
实施例10–在水稻CAO1基因组基因座处生物弹射式插入DNA
为了在预定基因组基因座处生物弹射式插入DNA,设计具有cpf1盒或csm1盒的载体。这些载体含有cpf1或csm1ORF上游的2X35S启动子(SEQ ID NO:43)以及cpf1或csm1ORF下游的35S多聚A终止子序列(SEQ ID NO:54)。表3总结了这些cpf1和sms1载体。
表3:用于生物弹射实验的cpf1和csm1载体的总结
Figure BDA0001785043450000591
Figure BDA0001785043450000601
Figure BDA0001785043450000611
Figure BDA0001785043450000621
除了表3中所述的cpf1和csm1载体,设计了具有gRNA盒的载体,从而使gRNA将与水稻(Oryza sativa)基因组(SEQ ID NO:71)中CAO1基因座区域退火,并且将允许与合适的Cpf1或Csm1蛋白相互作用。在这些载体中,gRNA操作性地连接水稻U6启动子(SEQ ID NO:72)和终止子(SEQ ID NO:74)。表4总结了这些gRNA载体。
表4:用于在水稻CAO1基因组基因座处生物弹射实验的gRNA载体的总结
Figure BDA0001785043450000622
Figure BDA0001785043450000631
为了促进潮霉素基因盒插入水稻CAO1基因组基因座,设计了具有约1,000碱基对的修复供体盒,所述碱基对与目标双链断裂位点的上游和下游具有同源性,所述目标双链断裂将由Cpf1或Csm1酶与靶向该基因座的gRNA偶联的作用所产生。图1提供了CAO1基因组基因座和同源性臂的示意图,所述同源性臂用于引导潮霉素基因盒同源性重组和插入CAO1基因座。被插入水稻CAO1基因组基因座的潮霉素基因盒包括驱动潮霉素抗性基因(SEQ IDNO:76,编码SEQ ID NO:77)表达的玉米泛素启动子(SEQ ID NO:46),其在其3’端侧接花椰菜花叶病毒35S多聚A序列(SEQ ID NO:54)。表5总结了构建的用于将潮霉素插入水稻CAO1基因组基因座的修复供体盒载体。
表5:用于潮霉素抗性基因插入的水稻CAO1修复供体盒
Figure BDA0001785043450000632
Figure BDA0001785043450000641
为了将cpf1盒或csm1盒、含gRNA的质粒和修复供体盒引入水稻细胞,使用了颗粒轰击。对于轰击,称取2mg的0.6μm金颗粒,并将其转移至无菌1.5-mL试管。添加500mL的100%乙醇,然后对试管进行10-15秒的超声处理。离心后,移除乙醇。然后将1毫升灭菌双蒸水加入含有金珠的试管。简单涡旋珠沉淀,然后通过离心重新形成,然后将水从试管中移除。在无菌层流净化罩中,DNA被涂覆于珠上。表6示出添加到珠上的DNA的量。将含有Cpf1盒或Csm1盒的质粒、含有gRNA的质粒和修复供体盒添加到珠,并且添加灭菌双蒸水以使总体积达到50μL。为此,添加20μL的亚精胺(1M),然后是50μL的CaCl2(2.5M)。允许金颗粒通过重力沉淀数分钟,并且然后通过离心沉淀。移除上清液液体,并且添加800μL的100%乙醇。短暂的超声处理后,允许金颗粒通过重力沉淀3-5分钟,然后将试管离心以产生沉淀。移除上清液,并且向试管添加30μL的100%乙醇。DNA涂覆的金颗粒通过涡旋重悬于该乙醇中,并将10μL重悬的金颗粒各自添加到3个大型运载体(加利福尼亚州州赫尔克里斯的伯乐公司(Bio-Rad))。允许大型运载体在层流净化罩中风干5-10分钟以允许乙醇蒸发。
表6:用于颗粒轰击实验的DNA的量(所有量为每2mg金颗粒)
Figure BDA0001785043450000642
Figure BDA0001785043450000651
使用水稻愈伤组织进行轰击。在轰击之前,将水稻愈伤组织在愈伤组织诱导培养基(CIM;3.99g/L N6盐和维生素,0.3g/L酪蛋白水解物,30g/L蔗糖,2.8g/L L-脯氨酶,2mg/L 2,4-D,8g/L琼脂,调整至pH 5.8)以28℃在黑暗中维持4-7天。颗粒轰击之前,将各自大小为0.2-0.3cm且重量为总计1-1.5g的大约80-100个愈伤组织块置于含有渗透固体培养基(补充有0.4M山梨醇和0.4M甘露醇的CIM)的皮氏培养皿中心进行4小时渗透预处理。对于轰击,含有涂覆DNA的金颗粒的大型运载体被组装成大型运载体支持物(holder)。按照生产商的说明组装防爆片(1,100psi)、停止屏(stopping screen)和大型运载体支持物。将含有待轰击的水稻愈伤组织的平板置于停止屏下6cm,并且在真空室达到25-28汞柱后轰击愈伤组织块。轰击后,将愈伤组织置于渗透培养基16-20小时,然后将愈伤组织块转移至选择培养基(补充有50mg/L潮霉素和100mg/L特美汀的CIM)。将平板转移至孵育器,并维持在28℃黑暗中以开始转化细胞的恢复。每两周,将愈伤组织在新鲜选择培养基上继代培养。在大约5-6周后的选择培养基上出现潮霉素抗性愈伤组织块。将个别潮霉素抗性愈伤组织块转移至新的选择平板以允许细胞分裂并且生长,从而生成足够多的组织用于分子分析取样。表7总结了用于这些水稻轰击实验的DNA载体的组合。
表7:将潮霉素抗性基因插入CAO1基因座的水稻颗粒轰击实验的总结
Figure BDA0001785043450000652
Figure BDA0001785043450000661
Figure BDA0001785043450000671
在将来自各实验的潮霉素抗性愈伤组织块转移至新平板后,他们生长至足够进行采样的大小。由潮霉素抗性水稻愈伤组织各独立的块收获少量组织,并由这些组织样品中提取DNA用于PCR和DNA测序分析。对于使用修复供体质粒131760或131632的这些实验,使用具有SEQ ID NO:78和79序列的引物对这些DNA提取物进行PCR,如图1所示,所述引物被设计成扩增从ZmUbi启动子跨越到落入下游修复供体臂之外的水稻基因组区域的DNA区域。对于使用修复供体质粒131633的这些实验,如图1所示,使用具有SEQ ID NO:102和103序列的引物扩增从CaMV 35S终止子跨越到落入上游修复供体臂之外的水稻基因组区域的DNA区域,如图1所示。PCR反应不由野生型水稻DNA生成扩增子,也不从修复供体质粒产生扩增子,并且因此是水稻CAO1基因座插入事件的指示。表8总结了由表7中所述各实验生成的潮霉素抗性愈伤组织块的数量以及其中出现推定插入事件的PCR阳性愈伤组织块的数量。用于各轰击实验的愈伤组织块数量通过基于10个平板调查的重量估计,即159±11.1愈伤组织块/平板。
表8:水稻愈伤组织轰击实验的总结
Figure BDA0001785043450000681
Figure BDA0001785043450000691
Figure BDA0001785043450000701
对于表8中所列PCR阳性愈伤组织块,进行了其它PCR分析以沿着同源性臂和水稻基因组之间的连接扩增。对于那些使用修复供体质粒131760或131632的实验而言,使用具有序列SEQ ID NO:96和97的引物扩增上游区域。这些引物结合位点的位置示于图1。
对使用上述引物对扩增插入事件下游区域生成的PCR扩增子进行的Sanger测序显示预期序列存在于转化的水稻愈伤组织中,这确认了由Cpf1或Csm1酶生成的双链断裂介导的潮霉素基因盒在预期的基因组基因座的插入。对使用上述引物对扩增插入事件上游区域生成的PCR扩增子进行的Sanger测序显示预期序列存在于转化的水稻愈伤组织中,这进一步确认了由Cpf1或Csm1酶生成的双链断裂介导的潮霉素基因盒在预期的基因组基因座的插入。重要的是,在Cpf1介导的DSB形成后,预测上游插入位点将出现水稻基因组序列5个碱基对(GCCTT)的缺失,而该缺失由测序数据所确认,因此进一步证明观察到的插入事件是由Cpf1的作用所介导的。图2A示出总结确认测序数据的比对,所述测序数据确认实验1中靶向的水稻CAO1基因座处插入事件(参见表7)。
进行PCR产物测序,用于确认实验5和7中靶向的水稻CAO1基因座处靶向插入的存在(参见表7)。具有序列SEQ ID NO:104和105的引物被用于扩增这些插入事件的下游区域。对这些PCR产物进行测序,并且观测预测序列由FnCpf1(实验5)和MbCpf1(实验7)生成的DSB所介导的插入事件。hph盒在靶位点处插入CAO1基因座,并且在下游臂中没有碱基改变。
实验70(表7)导致存在于质粒131633的35S终止子的部分插入水稻CAO基因组基因座中的目标插入位点,而非插入整个hph盒。序列分析显示35S终止子包括11个碱基对区域,其与下游臂共有10个碱基(图4A)。似乎35S终止子中的该区域介导与水稻愈伤组织块#70-15中的下游臂的非目标同源性重组事件,而质粒131663中的上游臂介导质粒和引导RNA和Cpf1酶靶向的水稻CAO1基因中基因座序列上游之间的目标重组事件,产生如图4B所示的插入序列。产生的插入在水稻CAO基因座中导致179个碱基对缺失以及133个碱基插入。尽管实验70中所揭示的插入事件仅包括35S终止子的部分而非旨在插入的完整的hph盒,所获得的事件是在布氏普雷沃氏菌(Prevotella bryanti)Cpf1酶(SEQ ID NO:138,由SEQ ID NO:179编码)靶向的CAO1基因座中的目标位点,这表明该Cpf1酶在CAO1基因组基因座中有效生成目标DSB。
实验75(表7)导致存在于质粒131633的35S终止子的部分插入水稻CAO基因组基因座中的目标插入位点,而非插入整个hph盒。序列分析显示35S终止子包括12个碱基对区域,其与下游臂共有8个碱基(图4C)。似乎35S终止子中的该区域介导与水稻愈伤组织块#75-46中的下游臂的非目标同源性重组事件,而质粒131663中的上游臂介导质粒和引导RNA和Cpf1酶靶向的水稻CAO1基因中基因座序列上游之间的目标重组事件,导致如图4D所示的插入序列。产生的插入在水稻CAO基因座中导致47个碱基对缺失以及24个碱基插入。尽管实验75中所揭示的插入事件仅包括35S终止子的部分而非旨在插入的完整的hph盒,所获得的事件是在企鹅源波特卡亚菌(Proteocatella sphenisci)Cpf1酶(SEQ ID NO:142,由SEQ IDNO:191编码)靶向的CAO1基因座中的目标位点,这表面该Cpf1酶在CAO1基因组基因座中有效生成目标DSB。
实验46(表7)导致毛螺科菌(Lachnospiraceae bacterium)ND2006Cpf1酶(SEQ IDNO:18,由SEQ ID NO:19编码)介导的水稻CAO1基因组基因座中目标位点的插入。对CAO1基因座目标插入位点区域的PCR分析获得愈伤组织块#46-161中诊断插入的条带的扩增。对该基因组区域进行序列分析以确认水稻CAO1基因座处目标DNA插入的存在。图5示出这一序列分析的结果,来自131633载体的预期插入存在于水稻DNA的预期位点。也在来自愈伤组织块#46-161的水稻DNA中检测到存在于131633载体中的突变的PAM位点(TTTC>TAGC),这进一步证明了如毛螺科菌ND2006Cpf1酶介导的位点特异性DSB诱导一样,HDR介导的131633载体插入将插入水稻CAO1基因座。
实验58(表7)导致厌氧弧菌属(Anaerovibrio sp.)RM50 Cpf1酶(SEQ ID NO:143,由SEQ ID NO:176编码)介导的水稻CAO1基因组基因座中目标位点的插入。对CAO1基因座目标插入位点区域的PCR分析获得愈伤组织块#58-169中诊断插入的条带的扩增。对该基因组区域进行序列分析以确认水稻CAO1基因座目标DNA插入的存在。
实施例11–水稻CAO1基因座处Cpf1介导的基因组DNA修饰
如上所述用金珠轰击水稻愈伤组织,所述金珠用cpf1载体和gRNA载体涂覆。将如实验01(表7)所述轰击的水稻愈伤组织在轰击后置于渗透培养基16-20小时,然后将愈伤组织块转移至选择培养基(补充有50mg/L潮霉素和100mg/L特美汀的CIM)。将平板转移至孵育器,并维持在28℃黑暗中以开始转化细胞的恢复。每两周,将愈伤组织在新鲜选择培养基上继代培养。在大约5-6周后的选择培养基上出现潮霉素抗性愈伤组织块。将个别潮霉素抗性愈伤组织块转移至新的选择平板以允许细胞分裂并且生长,从而生成足够多的组织用于分子分析取样。
从实验01中生成的16个潮霉素抗性愈伤组织块提取DNA(表7),并且使用具有序列SEQ ID NO:100和101的引物进行PCR以检测cpf1盒的存在。该PCR反应显示提取自编号为1、2、4、6、7和15的愈伤组织块的DNA生成预期的853个碱基对扩增子,其与水稻基因组中cpf1盒的插入一致(图2B)。同样用具有序列SEQ ID NO:98和99的引物对提取自这些潮霉素抗性水稻愈伤组织块的DNA进行PCR以扩增被载体131608中gRNA靶向的水稻CAO1基因组基因座区域。当使用野生型水稻DNA作为模板时,该PCR反应生成595碱基对的扩增子。在用SEQ IDNO:98和99作为引物的PCR反应后,用获得的PCR产物进行T7内切核酸酶试验以测试该基因座处的小插入和/或缺失。来自序号15愈伤组织块的DNA显示与小插入或缺失一致的条带模式(图2C)。按照生产商的说明使用
Figure BDA0001785043450000721
系统(美国威斯康星州麦迪逊的普罗麦格公司(Promega))将由使用具有SEQ ID NO:98和99的引物的反应生成的PCR产物克隆至大肠杆菌细胞中。由8个单个大肠杆菌克隆提取DNA用于测序。8个克隆中的5个在CAO1基因座中预计的Cpf1介导的双链断裂位点处显示出相同的7个碱基对缺失(图2D)。并不希望受限于理论,对于该缺失极有可能的解释是水稻细胞DNA修复机制在修复FnCpf1所导致的CAO1基因座处的双链断裂后产生该缺失。
用另外一块水稻愈伤组织重复实验01(表7)以证明最初获得的结果的可重复性。对实验01的重复导致鉴定4个其它愈伤组织块,基于T7EI试验结果,它们似乎呈插入缺失生成阳性。从这些愈伤组织块提取DNA用于序列分析。进行PCR以扩增围绕CAO1基因中靶向的位点的水稻基因组区域并且进行Sanger测序。该测序结果证实了T7EI试验结果。表2D显示了获得的序列数据。这4个愈伤组织块显示了全部位于FnCpf1(SEQ ID NO:3,由SEQ ID NO:5编码)靶向的预期位点处不同的缺失大小,从3个碱基对到75个碱基对缺失。
实验31和46(表7)检测了LbCpf1(SEQ ID NO:18,由SEQ ID NO:19编码)在水稻CAO1基因座中两个不同位置产生DSB的能力。实验31使用质粒132033作为gRNA源,而实验46使用质粒132054作为gRNA源。在用这些实验中所用质粒轰击水稻愈伤组织后,从潮霉素抗性水稻愈伤组织块中提取DNA,并且进行T7EI试验。PCR扩增水稻CAO1基因组基因座后,T7EI试验鉴定来自实验31的一个愈伤组织块以及来自实验46的5个愈伤组织块,其似乎在预期位点处包含插入缺失。通过Sanger测序对来自这些水稻愈伤组织块的PCR产物进行分析以鉴定存在于这些愈伤组织块中CAO1基因座的序列。图3示出Sanger测序分析的结果,其确认了插入缺失存在于水稻CAO1基因座中的预期位置。图3A示出来自实验31的结果,而图3B示出来自实验46的结果。如图3A所示,愈伤组织块31-21示出56个碱基对缺失以及10个碱基对插入。来自实验46的愈伤组织(数据存在于图3B)示出大小在3-15个碱基对的缺失。应当指出的是,愈伤组织块46-38和46-77示出了两种不同的插入缺失,这表明在这些愈伤组织块内独立的细胞中发生了多个插入缺失生成事件。来自这些实验的所有插入缺失都位于相应引导RNA靶向的CAO1基因座中预测位点,这表明通过LbCpf1酶在该位点生成准确的DSB。
实验80(表7)检测了卡氏莫拉氏菌(Moraxella caprae)Cpf1酶(SEQ ID NO:133,由SEQ ID NO:175编码)在水稻CAO1基因座中产生DSB的能力。在用该实验中所用质粒轰击水稻愈伤组织后,从潮霉素抗性水稻愈伤组织块中提取DNA,并且进行T7EI试验。PCR扩增水稻CAO1基因组基因座后,T7EI试验鉴定来自实验的一个愈伤组织块,其在预期位点处包含插入缺失。通过Sanger测序对来自该水稻愈伤组织块的PCR产物进行分析以鉴定存在于该愈伤组织块中CAO1基因座的序列。图3A示出这些测序试验的结果,其中愈伤组织块#80-33在相应引导RNA靶向的CAO1基因座中的预测位点存在8个碱基对缺失,这表明卡氏莫拉氏菌(Moraxella caprae)Cpf1酶在该位点生成准确的DSB。
实验91(表7)检测了Lachnospiraceae bacterium(毛螺科菌)COE1Cpf1酶(SEQ IDNO:125,由SEQ ID NO:189编码)在水稻CAO1基因座中产生DSB的能力。在用该实验中所用质粒轰击水稻愈伤组织后,从潮霉素抗性水稻愈伤组织块中提取DNA,并且进行T7EI试验。PCR扩增水稻CAO1基因组基因座后,T7EI试验鉴定来自实验的一个愈伤组织块在预期位点包含插入缺失。通过Sanger测序对来自该水稻愈伤组织块的PCR产物进行分析以鉴定存在于该愈伤组织块中CAO1基因座的序列。图3A示出这些测序试验的结果,其中愈伤组织块#91-4在相应引导RNA靶向的CAO1基因座中的预测位点存在9个碱基对缺失,这表明毛螺科菌(Lachnospiraceae bacterium)COE1Cpf1酶在该位点生成准确的DSB。
实验119(表7)检测了产粪甾醇真细菌(Eubacterium coprostanoligenes)Cpf1酶(SEQ ID NO:173,由SEQ ID NO:205编码)在水稻CAO1基因座中产生DSB的能力。在用该实验中所用质粒轰击水稻愈伤组织后,从潮霉素抗性水稻愈伤组织块中提取DNA,并且进行T7EI试验。PCR扩增水稻CAO1基因组基因座后,T7EI试验鉴定来自实验的2个愈伤组织块在预期位点处包含插入缺失。通过Sanger测序对来自这些水稻愈伤组织块的PCR产物进行分析以鉴定存在于这些愈伤组织块中CAO1基因座的序列。图3A示出这些测序试验的结果,其中愈伤组织块#119-4和#119-11两者在相应引导RNA靶向的CAO1基因座中的预测位点存在8个碱基对缺失,这表明产粪甾醇真细菌(Eubacterium coprostanoligenes)Cpf1酶在该位点生成准确的DSB。
实施例12–再生具有在CAO1基因座处的插入的水稻植物
在组织培养基上培养水稻愈伤组织以生成萌芽,所述水稻愈伤组织用通过实验1中FnCpf1介导的DSB靶向CAO1基因座的hph盒转化(参见表7和8)。随后将这些萌芽转移至生根培养基,然后将生根的植物转移至土壤以在温室里栽培。生根的植物在土壤中似乎是表型正常的。从这些生根的植物提取DNA用于PCR分析。上游和下游臂的PCR扩增确认hph盒存在于水稻CAO基因组基因座中。
培养实验1中生成的CAO1基因座处具有hph盒插入的T0代水稻植物,并且自花授粉以生成T1代种子。种植该种子,对得到的T1代植物进行基因分型以鉴定纯合的,半合子的和无效的植物。T1植物如预期分离,约25%的T1植物是hph插入半合子,25%是无效分离子,50%是杂合子。在表型上观察到具有敲除CAO1基因相关的预期黄叶表型的纯合植物(Lee等(2005)Plant Mol Biol 57:805-818)。
由GE0046愈伤组织编号33、40、62和90再生T0代植物,通过T7EI试验和(对于愈伤组织块#90)序列验证(图3B),证明了其对插入缺失的阳性结果。基于使用提取自再生植物组织的DNA的T7EI试验,衍生自愈伤组织块46-33、40、62和90的再生植物对CAO1基因座处插入缺失的存在呈阳性。也由之前已经证明在CAO1基因座处具有潮霉素标志物插入的GE0046愈伤组织块46-96和46-161再生植物。如PCR筛选所检测,衍生自愈伤组织块46-96和46-167的植物对插入呈阳性。从愈伤组织块#46-90再生的2个植物提取的DNA所获得的序列数据显示了与在愈伤组织中检测的相同的8个碱基对缺失(图3B),这表明该缺失在再生过程中稳定。从愈伤组织块#46-40以及#46-62衍生的植物中提取的DNA获得的序列数据显示了8、9、10和11个碱基对缺失(数据未示出)。
实施例13–鉴定Cpf1样蛋白的推定新类型
对推定Cpf1蛋白的系统发生树(Zetsche等.(2015)Cell 163:759-771,数据未示出)的检验以及通过BLAST检索鉴定的Cpf1蛋白和Cpf1样蛋白序列分析揭示:一小组蛋白质似乎与Cpf1蛋白相关,但是相对于已知的Cpf1蛋白其具有显著改变的序列。由于这些蛋白质中的两种存在于密斯氏菌(Smithella sp.)SCADC和微基因组菌(Microgenomates),这一推定新型蛋白质被命名为Csm1(来自密斯氏菌(Smithella sp)和微基因组菌(Microgenomates)的CRISPR相关蛋白)。与Cpf1蛋白类似,这些Csm1蛋白包括RuvCI、RuvCII和RuvCIII结构域,但是更重要的是这些结构域的氨基酸序列相较于存在于Cpf1蛋白氨基酸序列中的那些通常相当不同。此外,RuvCI-RuvCII和RuvCII-RuvCIII间隔在Csm1蛋白中相对于Cpf1蛋白显著地改变。
密斯氏菌(Smithella sp)SCADC Csm1蛋白(SmCsm1;SEQ ID NO:160)与已知Cpf1蛋白使用BLASTP算法默认参数的比对(blast.ncbi.nlm.nih.gov/Blast.cgi)显示这些蛋白质之间非常小的明显的序列同一性。特别明显的是,尽管SmCsm1蛋白中的RuvCI结构域看似存在并且与Cpf1蛋白中的对应序列对齐,但是在Cpf1蛋白中充分保守的RuvCII和RuvCIII区域(Shmakov等(2016)Mol Cell60:385-397)似乎最初并不存在于推定Csm1蛋白。使用HHPred(toolkit.tuebingen.mpg.de/hhpred;
Figure BDA0001785043450000761
等(2006)Nucleic AcidsRes34:W374-W378)的其它分析在该SmCsm1蛋白中揭示了推定RuvCII和RuvCIII结构域。表9显示了数个Cpf1和推定Csm1蛋白中的推定RuvCII结构域,和代表性C2c1蛋白,以及对应所列RuvCII序列的所列各序列中氨基酸残基数量。所列各蛋白质的推定活性残基带下划线。
表9:来自Cpf1和Csm1蛋白的RuvCII序列。
蛋白质 RuvCII序列 氨基酸残基编号
AsCpf1(SEQ ID NO:6) Q--AVVVL<u>E</u>NLNFGF 987-999
LbCpf1(SEQ ID NO:18) D--AVIAL<u>E</u>DLNSGF 919-931
SsCsm1(SEQ ID NO:147) K--AYISL<u>E</u>DLSRAY 1057-1069
SmCsm1(SEQ ID NO:160) R--GIISI<u>E</u>DLKQTK 920-932
ObCsm(SEQ ID NO:230) FPETIVAL<u>E</u>NLAKGT 931-945
Sm2Csm1(SEQ ID NO:159) R--GIISI<u>E</u>DLKQTK 920-932
MbCsm1(SEQ ID NO:134) Q--GVIAL<u>E</u>NLDTVR 916-928
AacC2c1(SEQ ID NO:237) PPCQLILL<u>E</u>ELS-EY 840-853
表10显示了数个Cpf1和推定Csm1蛋白中推定RuvCIII结构域,以及代表性C2c1蛋白,以及对应所列RuvCIII序列的各所列序列中氨基酸残基数量。所列各蛋白质的推定活性残基带下划线。
表10:来自Cpf1和Csm1蛋白的RuvCIII序列。
Figure BDA0001785043450000771
如表9和10所示,通过推定Csm1蛋白(SEQ ID NO:134、147、159、160和230)的HHPred鉴定的RuvCII和RuvCIII结构域与Cpf1蛋白(代表性序列SEQ ID NO:6和18如上所示)中存在的那些结构域显著的不同。特别要注意的是,RuvCIII结构域中活性残基后的ANGAY基序在Cpf1蛋白中极为保守(Shmakov等(2016)Mol Cell 60:385-397,数据未示出),但是在这些Csm1蛋白中的大部分中不存在或被改变。对Csm1、Cpf1和C2c1蛋白中RuvCII和RuvCIII蛋白质的分析(Shmakov等(2016)Mol Cell 60:385-397)表明Csm1蛋白似乎是介于Cpf1和C2c1蛋白之间的中间物,因为Csm1RuvCII序列与Cpf1蛋白中存在的那些序列相似,而Csm1RuvCIII序列与C2c1蛋白中存在的那些序列相似。Csm1蛋白的RuvCIII结构域大部分含有在C2c1蛋白序列中保守的DXXAA基序。
尽管Csm1蛋白与C2c1蛋白之间具有一些序列相似性,但是它们基因组结构表明Csm1蛋白功能在很多方面类似Cpf1蛋白。具体地,C2c1蛋白需要crRNA和tracrRNA,并且tracrRNA与crRNA序列部分互补。包括来自密斯氏菌(Smithella sp.)SCADC(SEQ ID NO:238)的Csm1编码ORF的基因组基因座包括具有Cpf1样直接重复的CRISPR阵列,其前面有Csm1ORF、Cas4ORF、Cas1ORF和Cas2ORF。这与存在于Cpf1编码基因组中的基因组织形式一致(Shmakov等(2017)Nat Rev Microbiol doi:10.1038/nrmicro.2016.184)。相反,
C2c1基因组组织形式趋向于包含融合的Cas1/Cas4ORF。此外,含C2c1的基因组基因座趋向于编码crRNA阵列和与crRNA直接重复部分互补的tracrRNA。检验含有Csm1编码ORF和相关crRNA的密斯氏菌(Smithella sp.)SCADC基因组基因座并未揭示任何tracrRNA样序列,这强烈表明Csm1不需要tracrRNA来生成双链断裂。
近期,人们叙述了被称为CasX蛋白的一类新的核酸酶(Burstein等.(2016)Naturehttp://dx.doi.org10.1038/nature20159)。来自δ变形菌(Deltaproteobacteria)(SEQ IDNO:239)的CasX蛋白被描述为存在于基因组区域的约980氨基酸蛋白质,所述基因组区域包括Cas1、Cas4和Cas2蛋白编码区域以及CRISPR重复区域和tracrRNA。叙述CasX的报告明确地显示内切核酸酶功能需要tracrRNA,同不需要tracrRNA的Csm1蛋白形成鲜明对照。SmCsm1(SEQ ID NO:160)和δ变形菌(Deltaproteobacterial)CasX(SEQ ID NO:239)的BLASTP比对显示非常差的对齐(数据未示出)。使用对该CasX蛋白的HHPred分析来鉴定推定RuvCI、RuvCII和RuvCIII结构域以及其相应的活性位点残基。
除了相对于Cpf1蛋白的Csm1蛋白中推定RuvCII和RuvCIII结构域改变的氨基酸序列,蛋白质组织形式被明显地改变,从而使得这些结构域之间的间隔在Csm1和Cpf1蛋白质之间显著不同。表11显示了比较已知的Cpf1蛋白(AsCpf1和LbCpf1;SEQ ID NO:6和18)中RuvC亚结构域中的活性残基之间的间隔与这些推定Csm1蛋白(SEQ ID NO:134、147、159、160和230)、δ变形菌(Deltaproteobacterial)CasX蛋白(SEQ ID NO:239)和代表性C2c1蛋白(SEQ ID NO:237)中间隔的比较。表11中的数据清楚地显示Cpf1、CasX、C2c1和Csm1蛋白具有这样的特征RuvC结构域间隔,其具有与Cpf1类似的CasX RuvCI-RuvCII间隔以及与Csm1/C2c1间隔类似的RuvCII-RuvCIII间隔。.C2c1和Csm1中RuvCI、RuvCII和RuvCIII结构域的间隔类似,但是不同的RuvCIII序列以及Csm1系统缺少tracrRNA支持将Csm1核酸酶分为独立于C2c1核酸酶的类别。
表11:RuvC亚结构域间隔的比较
Figure BDA0001785043450000781
Figure BDA0001785043450000791
连同不同RuvCII和RuvCIII氨基酸序列以及Csm1蛋白中这些结构域相对于Cpf1蛋白改变的间隔,应当注意的是,在许多情况中,HHPred分析并未找到对应氨基酸残基的任何Csm1序列,所述氨基酸残基对应FnCpf1(SEQ ID NO:3)中的D1225(AsCpf1(SEQ ID NO:6)中的D1234和LbCpf1(SEQ ID NO:18)中的D1148)。FnCpf1D1225残基的突变分析显示突变该残基显著地降低了该核酸酶的催化活性(Zetsche等.(2015)Cell 163:759-771),这表明该残基的酶促作用对于Cpf1酶十分重要。
除了Csm1蛋白中推定RuvC结构域相对于Cpf1蛋白改变的氨基酸序列,以Csm1蛋白的HHPred分析显示在它们的N末端与Cpf1蛋白没有匹配,这与基于已知Cpf1蛋白的HHPred分析相反。以FnCpf1氨基酸序列(SEQ ID NO:3)的HHPred分析仅导致对AsCpf1(SEQ ID NO:6)和LbCpf1(SEQ ID NO:18)100%可能性的两个匹配,并且涵盖FnCpf1氨基酸序列的全部。与之相反,以SmCsm1(SEQ ID NO:160)的HHPred分析仅发现与Cpf1蛋白的匹配,涵盖SmCsm1中氨基酸391-1017和1003-1064区域。发现氨基酸1003-1030与多种蛋白质匹配,包括可能的赖氨酸生物合成蛋白,氨基酸运载体蛋白,转录起始因子,50S和30S核糖体蛋白和DNA引导的RNA聚合酶。在该HHPred分析中并未发现Csm1的前390个氨基酸匹配。以其它Csm1蛋白(SEQ ID NO:134、147、159、160和230)进行的相似的HHPred分析也没有发现这些Csm1蛋白N末端部分的任何匹配,这进一步证明了这样的结果,即这些蛋白质与Cpf1蛋白相似,但是不是真实的Cpf1蛋白。
实施例14–Csm1功能性表征
鉴于Csm1蛋白相对Cpf1蛋白的不同性质,我们试图确认这些蛋白质能够在体内生成DSB。尽管Csm1蛋白的氨基酸序列相对Cpf1蛋白而言非常不同,但是对这些Csm1蛋白来源的生物体的基因组分析揭示了CRISPR阵列(数据未示出),这表明这些蛋白质事实上可以是功能性的。
实验81(表7)检测了密斯氏菌(Smithella sp.)SCADC Csm1酶(SEQ ID NO:160,由SEQ ID NO:185编码)在水稻CAO1基因座中产生DSB的能力。在用该实验中所用质粒轰击水稻愈伤组织后,从潮霉素抗性水稻愈伤组织块中提取DNA,并且进行T7EI试验。PCR扩增水稻CAO1基因组基因座后,T7EI试验鉴定来自实验的3个愈伤组织块在预期位点包含插入缺失。通过Sanger测序对来自这些水稻愈伤组织块的PCR产物进行分析以鉴定存在于该愈伤组织块中CAO1基因座的序列。图3A示出这些测序试验的结果,其中相应引导RNA靶向的CAO基因座中预测位点处,愈伤组织块#81-46中存在8个碱基对缺失,愈伤组织#81-30中存在相同的8个碱基对缺失,并且愈伤组织#81-9中存在12个碱基对缺失,这表明密斯氏菌(Smithellasp.)SCADC Csm1酶在该位点生成准确的DSB。
实验93(表7)检测了硫曲菌(Sulfuricurvum sp.)Csm1酶(SEQ ID NO:147,由SEQID NO:186编码)在水稻CAO1基因座中产生DSB的能力。在用该实验中所用质粒轰击水稻愈伤组织后,从潮霉素抗性水稻愈伤组织块中提取DNA,并且进行T7EI试验。PCR扩增水稻CAO1基因组基因座后,T7EI试验鉴定来自实验的一个愈伤组织块在预期位点包含插入缺失。通过Sanger测序对来自该水稻愈伤组织块#93-47的PCR产物进行分析以鉴定存在于该愈伤组织块中CAO1基因座的序列。图3A示出这些测序试验的结果,其中愈伤组织块#93-47在相应引导RNA靶向的CAO1基因座中的预测位点处存在42个碱基对缺失,这表明硫曲菌(Sulfuricurvum sp.)Csm1酶在该位点生成准确的DSB。
实验97(表7)检测了微基因组菌(罗兹曼细菌)细菌(Microgenomates(Roizmanbacteria)bacterium)Csm1酶(SEQ ID NO:134,由SEQ ID NO:193编码)在水稻CAO1基因座中产生DSB的能力。在用该实验中所用质粒轰击水稻愈伤组织后,从潮霉素抗性水稻愈伤组织块中提取DNA,并且进行T7EI试验。PCR扩增水稻CAO1基因组基因座后,T7EI试验鉴定来自实验的3个愈伤组织块在预期位点包含插入缺失。愈伤组织块#97-112、97-130和97-141在T7EI实验中显示的条带图案与在该位点通过微基因组菌(罗兹曼细菌)细菌(Microgenomates(Roizmanbacteria)bacterium)Csm1酶生成的DSB一致。对愈伤组织块#97-112和#97-141提取的DNA进行序列分析(图3A)。该序列分析显示在这两种愈伤组织中存在相同的8个碱基对缺失,这表明微基因组菌(罗兹曼细菌)细菌(Microgenomates(Roizmanbacteria)bacterium)Csm1酶在该位点处生成准确的DSB。

Claims (16)

1.一种修饰真核细胞基因组中靶位点处的核苷酸序列的方法,所述方法不以疾病治疗为目的,其包括:
向所述真核细胞中导入
(i) DNA-靶向RNA,或编码DNA-靶向RNA的DNA多核苷酸,其中所述DNA-靶向RNA包括:(a) 第一区段,其包括与靶DNA中序列互补的核苷酸序列;和(b) 第二区段,其与Cpf1多肽相互作用;以及
(ii) Cpf1多肽,或编码Cpf1多肽的多核苷酸,其中所述Cpf1多肽包括:(a) RNA-结合部分,其与DNA-靶向RNA相互作用;和(b) 活性部分,其显示定点酶促活性,
其中所述Cpf1多肽选自:SEQ ID NO: 125、133、138、142、143和173的氨基酸序列,其中靶位点紧接所述细胞基因组的PAM位点TTTC 的3’位置,并且其中所述真核细胞的基因组是核、质体或线粒体基因组。
2.如权利要求1所述的方法,其特征在于,所述真核细胞是植物细胞。
3.如权利要求2所述的方法,其还包括:
在表达所述Cpf1多肽并在所述靶位点处切割所述核苷酸序列以生成修饰的核苷酸序列的条件下培养所述植物细胞,以生成包含所述修饰的核苷酸序列的植物;并且选择包括所述修饰的核苷酸序列的植物。
4.如权利要求1所述的方法,其特征在于,所述DNA-靶向RNA是引导RNA 。
5.如权利要求1所述的方法,其特征在于,经修饰的核苷酸序列包括细胞基因组中异源性DNA的插入,细胞基因组中核苷酸序列的缺失,或细胞基因组中至少一个核苷酸的突变。
6.如权利要求1所述的方法,其特征在于,经修饰的所述核苷酸序列包括多核苷酸的插入,所述多核苷酸编码向转化的细胞赋予抗生素或除草剂耐受的蛋白质。
7.如权利要求6所述的方法,其特征在于,所述编码赋予抗生素或除草剂耐受的蛋白质的多核苷酸包括SEQ ID NO:76,或编码包括SEQ ID NO:77的蛋白质。
8.如权利要求2所述的方法,其特征在于,所述编码Cpf1多肽的多核苷酸为在植物细胞中表达进行了密码子优化。
9.一种修饰原核细胞基因组中靶位点处的核苷酸序列的方法,其包括:
向所述原核细胞中导入
(i) DNA-靶向RNA,或编码DNA-靶向RNA的DNA多核苷酸,其中所述DNA-靶向RNA包括:(a) 第一区段,其包括与靶DNA中序列互补的核苷酸序列;和(b) 第二区段,其与Cpf1多肽相互作用;以及
(ii) Cpf1多肽,或编码Cpf1多肽的多核苷酸,其中所述Cpf1多肽包括:(a) RNA-结合部分,其与DNA-靶向RNA相互作用;和(b) 活性部分,其显示定点酶促活性,
其中所述Cpf1多肽选自SEQ ID NO: 125、133、138、142、143和173的氨基酸序列,其中靶位点紧接所述细胞基因组的PAM位点TTTC 的3’位置,其中所述原核细胞的基因组是染色体、质粒或其它细胞内DNA序列,并且其中所述原核细胞不是编码所述Cpf1多肽的基因的天然宿主。
10.如权利要求9所述的方法,其特征在于,所述DNA-靶向RNA是引导RNA。
11.如权利要求9所述的方法,其特征在于,经修饰的核苷酸序列包括细胞基因组中异源性DNA的插入,细胞基因组中核苷酸序列的缺失,或细胞基因组中至少一个核苷酸的突变。
12. 一种组合物,其包含:
(i)核酸分子,其包括编码Cpf1多肽的多核苷酸序列,其中所述多核苷酸序列选自SEQID NO:175、176、179、189、191和205的序列,或其中所述多核苷酸序列编码Cpf1多肽,所述Cpf1多肽选自SEQ ID NO: 125、133、138、142、143和173的氨基酸序列并具有Cpf1核酸酶活性,并且其中所述编码Cpf1多肽的多核苷酸序列操作性地连接至启动子,所述启动子对编码Cpf1多肽的多核苷酸序列是异源性的,且其中所述Cpf1多肽识别PAM位点TTTC,和
(ii) 编码DNA-靶向RNA的DNA多核苷酸,其中所述DNA-靶向RNA包括:(a) 第一区段,其包括紧接所述Cpf1多肽识别的PAM位3’位置的靶序列互补的核苷酸序列;和(b) 第二区段,其与Cpf1多肽相互作用。
13.如权利要求12所述的组合物,其特征在于,所述编码Cpf1多肽的多核苷酸序列为在植物细胞中表达进行了密码子优化。
14. 一种核糖核酸蛋白复合物,其包含:
(1)由权利要求12所述组合物中的核酸分子编码的Cpf1多肽,和
(ii)DNA-靶向RNA或编码DNA-靶向RNA的DNA多核苷酸,其中所述DNA-靶向RNA包括:(a)第一区段,其包括紧接所述Cpf1多肽识别的PAM位3’位置的靶序列互补的核苷酸序列;和(b) 第二区段,其与Cpf1多肽相互作用。
15. 一种核酸分子编码的融合蛋白,所述核酸分子包括:
(i) 选自SEQ ID NO:175、176、179、189、191和205的多核苷酸序列,其中所述多核苷酸序列编码Cpf1多肽;和
(ii) 编码效应物结构域的核酸分子,所述效应物结构域选自切割结构域、表观遗传修饰结构域、转录激活结构域或转录抑制物结构域。
16.一种包括权利要求15所述的融合蛋白的原核细胞。
CN201780014661.1A 2016-02-15 2017-02-15 修饰基因组的组合物和方法 Active CN109312316B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211143483.1A CN115927440A (zh) 2016-02-15 2017-02-15 修饰基因组的组合物和方法

Applications Claiming Priority (11)

Application Number Priority Date Filing Date Title
US201662295325P 2016-02-15 2016-02-15
US62/295,325 2016-02-15
US201662372108P 2016-08-08 2016-08-08
US62/372,108 2016-08-08
US201662403854P 2016-10-04 2016-10-04
US62/403,854 2016-10-04
US201662429112P 2016-12-02 2016-12-02
US62/429,112 2016-12-02
US201762450743P 2017-01-26 2017-01-26
US62/450,743 2017-01-26
PCT/IB2017/050845 WO2017141173A2 (en) 2016-02-15 2017-02-15 Compositions and methods for modifying genomes

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202211143483.1A Division CN115927440A (zh) 2016-02-15 2017-02-15 修饰基因组的组合物和方法

Publications (2)

Publication Number Publication Date
CN109312316A CN109312316A (zh) 2019-02-05
CN109312316B true CN109312316B (zh) 2022-10-14

Family

ID=58162971

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202211143483.1A Pending CN115927440A (zh) 2016-02-15 2017-02-15 修饰基因组的组合物和方法
CN201780014661.1A Active CN109312316B (zh) 2016-02-15 2017-02-15 修饰基因组的组合物和方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202211143483.1A Pending CN115927440A (zh) 2016-02-15 2017-02-15 修饰基因组的组合物和方法

Country Status (14)

Country Link
US (3) US9896696B2 (zh)
EP (3) EP4306642A2 (zh)
JP (3) JP2019504649A (zh)
KR (2) KR20230165368A (zh)
CN (2) CN115927440A (zh)
AU (3) AU2017220789B2 (zh)
BR (1) BR112018016408A2 (zh)
CA (2) CA3014988A1 (zh)
ES (1) ES2973207T3 (zh)
IL (3) IL308791A (zh)
MX (2) MX2018009761A (zh)
MY (1) MY197523A (zh)
PH (1) PH12018501722A1 (zh)
WO (1) WO2017141173A2 (zh)

Families Citing this family (182)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2853829C (en) 2011-07-22 2023-09-26 President And Fellows Of Harvard College Evaluation and improvement of nuclease cleavage specificity
US20150044192A1 (en) 2013-08-09 2015-02-12 President And Fellows Of Harvard College Methods for identifying a target site of a cas9 nuclease
US9359599B2 (en) 2013-08-22 2016-06-07 President And Fellows Of Harvard College Engineered transcription activator-like effector (TALE) domains and uses thereof
US9388430B2 (en) 2013-09-06 2016-07-12 President And Fellows Of Harvard College Cas9-recombinase fusion proteins and uses thereof
US9340800B2 (en) 2013-09-06 2016-05-17 President And Fellows Of Harvard College Extended DNA-sensing GRNAS
US9526784B2 (en) 2013-09-06 2016-12-27 President And Fellows Of Harvard College Delivery system for functional nucleases
US20150166982A1 (en) 2013-12-12 2015-06-18 President And Fellows Of Harvard College Methods for correcting pi3k point mutations
US10077453B2 (en) 2014-07-30 2018-09-18 President And Fellows Of Harvard College CAS9 proteins including ligand-dependent inteins
WO2016073990A2 (en) 2014-11-07 2016-05-12 Editas Medicine, Inc. Methods for improving crispr/cas-mediated genome-editing
GB201506509D0 (en) 2015-04-16 2015-06-03 Univ Wageningen Nuclease-mediated genome editing
CA2986310A1 (en) 2015-05-11 2016-11-17 Editas Medicine, Inc. Optimized crispr/cas9 systems and methods for gene editing in stem cells
JP7396783B2 (ja) 2015-06-09 2023-12-12 エディタス・メディシン、インコーポレイテッド 移植を改善するためのcrispr/cas関連方法および組成物
US10648020B2 (en) 2015-06-18 2020-05-12 The Broad Institute, Inc. CRISPR enzymes and systems
CA2999500A1 (en) 2015-09-24 2017-03-30 Editas Medicine, Inc. Use of exonucleases to improve crispr/cas-mediated genome editing
EP4269577A3 (en) 2015-10-23 2024-01-17 President and Fellows of Harvard College Nucleobase editors and uses thereof
US9896696B2 (en) 2016-02-15 2018-02-20 Benson Hill Biosystems, Inc. Compositions and methods for modifying genomes
WO2017165826A1 (en) 2016-03-25 2017-09-28 Editas Medicine, Inc. Genome editing systems comprising repair-modulating enzyme molecules and methods of their use
EP4047092A1 (en) 2016-04-13 2022-08-24 Editas Medicine, Inc. Cas9 fusion molecules, gene editing systems, and methods of use thereof
US10337051B2 (en) 2016-06-16 2019-07-02 The Regents Of The University Of California Methods and compositions for detecting a target RNA
US11293021B1 (en) 2016-06-23 2022-04-05 Inscripta, Inc. Automated cell processing methods, modules, instruments, and systems
WO2018022634A1 (en) * 2016-07-26 2018-02-01 The General Hospital Corporation Variants of crispr from prevotella and francisella 1 (cpf1)
SG11201900907YA (en) 2016-08-03 2019-02-27 Harvard College Adenosine nucleobase editors and uses thereof
WO2018031683A1 (en) 2016-08-09 2018-02-15 President And Fellows Of Harvard College Programmable cas9-recombinase fusion proteins and uses thereof
US11542509B2 (en) 2016-08-24 2023-01-03 President And Fellows Of Harvard College Incorporation of unnatural amino acids into proteins using base editing
US20190225974A1 (en) 2016-09-23 2019-07-25 BASF Agricultural Solutions Seed US LLC Targeted genome optimization in plants
EA201990861A1 (ru) * 2016-09-30 2019-09-30 Те Риджентс Оф Те Юниверсити Оф Калифорния Рнк-направляемые модифицирующие нуклеиновые кислоты ферменты и способы их применения
CA3038982A1 (en) 2016-09-30 2018-04-05 The Regents Of The University Of California Rna-guided nucleic acid modifying enzymes and methods of use thereof
EP3523439A1 (en) 2016-10-07 2019-08-14 Altria Client Services LLC Composition and methods for producing tobacco plants and products having reduced tobacco-specific nitrosamines (tsnas)
CN110214180A (zh) 2016-10-14 2019-09-06 哈佛大学的校长及成员们 核碱基编辑器的aav递送
WO2018119124A1 (en) 2016-12-21 2018-06-28 Altria Client Services Llc Compositions and methods for producing tobacco plants and products having altered alkaloid levels
US10745677B2 (en) 2016-12-23 2020-08-18 President And Fellows Of Harvard College Editing of CCR5 receptor gene to protect against HIV infection
US11859219B1 (en) 2016-12-30 2024-01-02 Flagship Pioneering Innovations V, Inc. Methods of altering a target nucleotide sequence with an RNA-guided nuclease and a single guide RNA
EP3592853A1 (en) 2017-03-09 2020-01-15 President and Fellows of Harvard College Suppression of pain by gene editing
EP3592777A1 (en) 2017-03-10 2020-01-15 President and Fellows of Harvard College Cytosine to guanine base editor
CN110914426A (zh) 2017-03-23 2020-03-24 哈佛大学的校长及成员们 包含核酸可编程dna结合蛋白的核碱基编辑器
CA3059956A1 (en) 2017-04-21 2018-10-25 The General Hospital Corporation Variants of cpf1 (cas12a) with altered pam specificity
US11667677B2 (en) 2017-04-21 2023-06-06 The General Hospital Corporation Inducible, tunable, and multiplex human gene regulation using CRISPR-Cpf1
WO2018201086A1 (en) 2017-04-28 2018-11-01 Editas Medicine, Inc. Methods and systems for analyzing guide rna molecules
WO2018209320A1 (en) 2017-05-12 2018-11-15 President And Fellows Of Harvard College Aptazyme-embedded guide rnas for use with crispr-cas9 in genome editing and transcriptional activation
CN110719956A (zh) 2017-06-06 2020-01-21 齐默尔根公司 用于改良真菌菌株的高通量基因组工程改造平台
CA3064612A1 (en) 2017-06-06 2018-12-13 Zymergen Inc. A htp genomic engineering platform for improving escherichia coli
CN110997908A (zh) 2017-06-09 2020-04-10 爱迪塔斯医药公司 工程化的cas9核酸酶
US9982279B1 (en) 2017-06-23 2018-05-29 Inscripta, Inc. Nucleic acid-guided nucleases
US10011849B1 (en) * 2017-06-23 2018-07-03 Inscripta, Inc. Nucleic acid-guided nucleases
NZ760730A (en) * 2017-06-23 2023-04-28 Inscripta Inc Nucleic acid-guided nucleases
SI3645719T1 (sl) 2017-06-30 2022-07-29 Inscripta, Inc., Postopki, moduli, instrumenti in sistemi za avtomatizirano obdelavo celic
EP3652312A1 (en) 2017-07-14 2020-05-20 Editas Medicine, Inc. Systems and methods for targeted integration and genome editing and detection thereof using integrated priming sites
WO2019023680A1 (en) 2017-07-28 2019-01-31 President And Fellows Of Harvard College METHODS AND COMPOSITIONS FOR EVOLUTION OF BASIC EDITORS USING PHAGE-ASSISTED CONTINUOUS EVOLUTION (PACE)
KR102631985B1 (ko) * 2017-08-09 2024-02-01 라이스텍, 인크. 게놈을 변형시키기 위한 조성물 및 방법
US11359207B2 (en) 2017-08-17 2022-06-14 Benson Hill, Inc. Increasing plant growth and yield by using a glutaredoxin
RU2020111575A (ru) * 2017-08-22 2021-09-23 Напиджен, Инк. Модификация генома органелл с использованием направляемой полинуклеотидом эндонуклеазы
BR112020003596A2 (pt) 2017-08-23 2020-09-01 The General Hospital Corporation nucleases de crispr-cas9 engenheiradas com especificidade de pam alterada
US10738327B2 (en) 2017-08-28 2020-08-11 Inscripta, Inc. Electroporation cuvettes for automation
US11319532B2 (en) 2017-08-30 2022-05-03 President And Fellows Of Harvard College High efficiency base editors comprising Gam
GB201713926D0 (en) * 2017-08-30 2017-10-11 Univ Edinburgh Gene editing method
WO2019041296A1 (zh) * 2017-09-01 2019-03-07 上海科技大学 一种碱基编辑系统及方法
WO2019055838A1 (en) 2017-09-15 2019-03-21 Covercress Inc. LOW-FIBER-BASED ECO-BASED FOOD AND METHODS OF PREPARATION
US10443074B2 (en) 2017-09-30 2019-10-15 Inscripta, Inc. Modification of cells by introduction of exogenous material
JP2021500036A (ja) 2017-10-16 2021-01-07 ザ ブロード インスティテュート, インコーポレーテッドThe Broad Institute, Inc. アデノシン塩基編集因子の使用
WO2019084148A1 (en) * 2017-10-25 2019-05-02 Monsanto Technology Llc TARGETED RNA GUIDED ENDONUCLEASE ENDONUCLEASE ACTIVITY IN EUKARYOTES
CN117487776A (zh) 2017-11-01 2024-02-02 加利福尼亚大学董事会 Casz组合物和使用方法
WO2019089808A1 (en) 2017-11-01 2019-05-09 The Regents Of The University Of California Class 2 crispr/cas compositions and methods of use
BR112020011350A2 (pt) 2017-12-08 2020-11-17 Synthetic Genomics, Inc. aperfeiçoamento da produtividade lipídica de algas através da modificação genética de uma proteína que contém domínio de tpr
WO2019123246A1 (en) 2017-12-19 2019-06-27 Benson Hill Biosystems, Inc. Modified agpase large subunit sequences and methods for detection of precise genome edits
US20190246596A1 (en) 2018-01-12 2019-08-15 Altria Client Services Llc Compositions and methods for producing tobacco plants and products having altered alkaloid levels
JP2021516055A (ja) 2018-03-05 2021-07-01 アルトリア クライアント サーヴィシーズ リミテッド ライアビリティ カンパニー 変化したアルカロイドレベルと望ましい葉品質とを有するタバコ植物およびタバコ製品を作製するための組成物および方法
CN112204131A (zh) 2018-03-29 2021-01-08 因思科瑞普特公司 用于诱导和转化的细胞生长速率的自动化控制
US11377665B2 (en) 2018-04-03 2022-07-05 Altria Client Services Llc Composition and methods for producing tobacco plants and products having increased phenylalanine and reduced tobacco-specific nitrosamines (TSNAs)
WO2019200004A1 (en) 2018-04-13 2019-10-17 Inscripta, Inc. Automated cell processing instruments comprising reagent cartridges
US10508273B2 (en) 2018-04-24 2019-12-17 Inscripta, Inc. Methods for identifying selective binding pairs
US10858761B2 (en) 2018-04-24 2020-12-08 Inscripta, Inc. Nucleic acid-guided editing of exogenous polynucleotides in heterologous cells
US10557216B2 (en) 2018-04-24 2020-02-11 Inscripta, Inc. Automated instrumentation for production of T-cell receptor peptide libraries
CN108546712B (zh) * 2018-04-26 2020-08-07 中国农业科学院作物科学研究所 一种利用CRISPR/LbCpf1系统实现目的基因在植物中同源重组的方法
WO2019213910A1 (en) * 2018-05-10 2019-11-14 Syngenta Participations Ag Methods and compositions for targeted editing of polynucleotides
BR112020025349A2 (pt) 2018-06-15 2021-03-09 KWS SAAT SE & Co. KGaA Métodos para melhorar a engenharia e regeneração do genoma em planta
BR112020025311A2 (pt) 2018-06-15 2021-03-09 KWS SAAT SE & Co. KGaA Métodos para melhorar a engenharia e regeneração do genoma em planta ii
CN114854720A (zh) 2018-06-30 2022-08-05 因思科瑞普特公司 用于改进活细胞中编辑序列的检测的仪器、模块和方法
US11384361B2 (en) 2018-07-26 2022-07-12 Altria Client Services Llc Compositions and methods based on PMT engineering for producing tobacco plants and products having altered alkaloid levels
EP3830301B1 (en) 2018-08-01 2024-05-22 Mammoth Biosciences, Inc. Programmable nuclease compositions and methods of use thereof
WO2020033774A1 (en) * 2018-08-08 2020-02-13 Integrated Dna Technologies, Inc. Novel mutations that enhance the dna cleavage activity of acidaminococcus sp. cpf1
WO2020032711A1 (ko) * 2018-08-09 2020-02-13 (주)지플러스 생명과학 신규한 crispr 연관 단백질 및 이의 용도
CN113227367B (zh) * 2018-08-09 2023-05-12 G+Flas生命科学公司 用cas12a蛋白进行基因组工程的组合物和方法
US10532324B1 (en) 2018-08-14 2020-01-14 Inscripta, Inc. Instruments, modules, and methods for improved detection of edited sequences in live cells
US11142740B2 (en) 2018-08-14 2021-10-12 Inscripta, Inc. Detection of nuclease edited sequences in automated modules and instruments
US10752874B2 (en) 2018-08-14 2020-08-25 Inscripta, Inc. Instruments, modules, and methods for improved detection of edited sequences in live cells
US20210309981A1 (en) * 2018-08-22 2021-10-07 Junjie Liu Variant type v crispr/cas effector polypeptides and methods of use thereof
AU2019363487A1 (en) 2018-08-30 2021-04-15 Inscripta, Inc. Improved detection of nuclease edited sequences in automated modules and instruments
US11479762B1 (en) 2018-08-31 2022-10-25 Inari Agriculture Technology, Inc. Compositions, systems, and methods for genome editing
EP3623379A1 (en) 2018-09-11 2020-03-18 KWS SAAT SE & Co. KGaA Beet necrotic yellow vein virus (bnyvv)-resistance modifying gene
US11214781B2 (en) 2018-10-22 2022-01-04 Inscripta, Inc. Engineered enzyme
US10604746B1 (en) 2018-10-22 2020-03-31 Inscripta, Inc. Engineered enzymes
US11407995B1 (en) 2018-10-26 2022-08-09 Inari Agriculture Technology, Inc. RNA-guided nucleases and DNA binding proteins
MX2021005028A (es) 2018-10-31 2021-08-24 Zymergen Inc Ensamble determinista multiplexado de genotecas de adn.
US11434477B1 (en) 2018-11-02 2022-09-06 Inari Agriculture Technology, Inc. RNA-guided nucleases and DNA binding proteins
WO2020117758A1 (en) 2018-12-04 2020-06-11 Altria Client Services Llc Low-nicotine tobacco plants and tobacco products made therefrom
CN109593743A (zh) * 2018-12-12 2019-04-09 广州普世利华科技有限公司 新型CRISPR/ScCas12a蛋白及其制备方法
EP3931313A2 (en) 2019-01-04 2022-01-05 Mammoth Biosciences, Inc. Programmable nuclease improvements and compositions and methods for nucleic acid amplification and detection
EP3914069A1 (en) 2019-01-24 2021-12-01 Altria Client Services LLC Tobacco plants comprising reduced nicotine and reduced tobacco specific nitrosamines
WO2020160125A1 (en) * 2019-01-29 2020-08-06 Flagship Pioneering Innovations V, Inc. Compositions comprising an endonuclease and methods for purifying an endonuclease
CN113490747A (zh) 2019-01-29 2021-10-08 华威大学 用于提高基因组工程化效率的方法
KR20210127947A (ko) 2019-02-15 2021-10-25 저스트-에보텍 바이오로직스, 아이엔씨. 자동화된 바이오 제조 시스템, 설비 및 공정
US11053515B2 (en) 2019-03-08 2021-07-06 Zymergen Inc. Pooled genome editing in microbes
JP2022524043A (ja) 2019-03-08 2022-04-27 ザイマージェン インコーポレイテッド 微生物の反復ゲノム編集
BR112021018607A2 (pt) 2019-03-19 2021-11-23 Massachusetts Inst Technology Métodos e composições para editar sequências de nucleotídeos
US11001831B2 (en) 2019-03-25 2021-05-11 Inscripta, Inc. Simultaneous multiplex genome editing in yeast
US10815467B2 (en) 2019-03-25 2020-10-27 Inscripta, Inc. Simultaneous multiplex genome editing in yeast
AU2020278906A1 (en) 2019-05-23 2021-11-25 Nomad Bioscience Gmbh RNA viral RNA molecule for gene editing
WO2020247587A1 (en) 2019-06-06 2020-12-10 Inscripta, Inc. Curing for recursive nucleic acid-guided cell editing
GB2600274A (en) 2019-06-07 2022-04-27 Scribe Therapeutics Inc Engineered CasX systems
US10907125B2 (en) 2019-06-20 2021-02-02 Inscripta, Inc. Flow through electroporation modules and instrumentation
US10920189B2 (en) 2019-06-21 2021-02-16 Inscripta, Inc. Genome-wide rationally-designed mutations leading to enhanced lysine production in E. coli
US10927385B2 (en) 2019-06-25 2021-02-23 Inscripta, Inc. Increased nucleic-acid guided cell editing in yeast
WO2021046526A1 (en) * 2019-09-05 2021-03-11 Benson Hill, Inc. Compositions and methods for modifying genomes
AU2020358863A1 (en) 2019-10-03 2022-05-12 Artisan Development Labs, Inc. CRISPR systems with engineered dual guide nucleic acids
CN114929880A (zh) 2019-10-10 2022-08-19 奥驰亚客户服务有限公司 用于生产具有改变的生物碱水平的烟草植物和制品的基于qpt工程改造的组合物和方法
EP4041898A1 (en) 2019-10-10 2022-08-17 Altria Client Services LLC Compositions and methods for producing tobacco plants and products having altered alkaloid levels with desirable leaf quality via manipulating leaf quality genes
CN111235130B (zh) * 2019-11-15 2022-11-25 武汉大学 II类V型CRISPR蛋白CeCas12a及其在基因编辑的应用
US20230002453A1 (en) * 2019-11-18 2023-01-05 Shanghai Bluecross Medical Science Institute Gene editing system derived from flavobacteria
WO2021102059A1 (en) 2019-11-19 2021-05-27 Inscripta, Inc. Methods for increasing observed editing in bacteria
US20230002761A1 (en) * 2019-11-19 2023-01-05 Benson Hill, Inc. Anti-bacterial crispr compositions and methods
WO2021108324A1 (en) * 2019-11-27 2021-06-03 Technical University Of Denmark Constructs, compositions and methods thereof having improved genome editing efficiency and specificity
EP4069854A1 (en) 2019-12-03 2022-10-12 Altria Client Services LLC Compositions and methods for producing tobacco plants and products having altered alkaloid levels
EP4069845A1 (en) 2019-12-06 2022-10-12 Scribe Therapeutics Inc. Compositions and methods for the targeting of rhodopsin
KR20220110778A (ko) 2019-12-10 2022-08-09 인스크립타 인코포레이티드 신규 mad 뉴클레아제
US10704033B1 (en) 2019-12-13 2020-07-07 Inscripta, Inc. Nucleic acid-guided nucleases
JP2023507566A (ja) 2019-12-18 2023-02-24 インスクリプタ, インコーポレイテッド 核酸誘導ヌクレアーゼ編集済み細胞のin vivo検出のためのカスケード/dCas3相補性アッセイ
US11746352B2 (en) 2019-12-30 2023-09-05 Eligo Bioscience Microbiome modulation of a host by delivery of DNA payloads with minimized spread
US11584781B2 (en) 2019-12-30 2023-02-21 Eligo Bioscience Chimeric receptor binding proteins resistant to proteolytic degradation
US10689669B1 (en) 2020-01-11 2020-06-23 Inscripta, Inc. Automated multi-module cell processing methods, instruments, and systems
WO2021146585A1 (en) 2020-01-17 2021-07-22 Altria Client Services Llc Methods and compositions related to improved nitrogen use efficiency
KR20220133257A (ko) 2020-01-27 2022-10-04 인스크립타 인코포레이티드 전기천공 모듈 및 기구
WO2021154738A1 (en) 2020-01-27 2021-08-05 Altria Client Services Llc Compositions and methods based on pmt engineering for producing tobacco plants and products having altered alkaloid levels
CN115552015A (zh) * 2020-02-28 2022-12-30 香港中文大学 经由同时敲入和基因破坏来改造免疫细胞
EP3878958A1 (en) 2020-03-11 2021-09-15 B.R.A.I.N. Biotechnology Research And Information Network AG Crispr-cas nucleases from cpr-enriched metagenome
US20210332388A1 (en) 2020-04-24 2021-10-28 Inscripta, Inc. Compositions, methods, modules and instruments for automated nucleic acid-guided nuclease editing in mammalian cells
CN111471702B (zh) * 2020-04-30 2022-07-26 福建农林大学 一种慢生型根瘤菌稳定红色荧光标记载体及其应用
CN116096873A (zh) 2020-05-08 2023-05-09 布罗德研究所股份有限公司 同时编辑靶标双链核苷酸序列的两条链的方法和组合物
US11787841B2 (en) 2020-05-19 2023-10-17 Inscripta, Inc. Rationally-designed mutations to the thrA gene for enhanced lysine production in E. coli
WO2021243283A1 (en) * 2020-05-28 2021-12-02 University Of Southern California Scalable trio guide rna approach for integration of large donor dna
US20220010324A1 (en) 2020-06-03 2022-01-13 Altria Client Services Llc Compositions and methods for producing tobacco plants and products having altered alkaloid levels
ES2890491T1 (es) 2020-06-12 2022-01-20 Eligo Bioscience Descolonización específica de bacterias resistentes a los antibióticos para fines profilácticos
US20230235361A1 (en) 2020-07-03 2023-07-27 Eligo Bioscience Method of containment of nucleic acid vectors introduced in a microbiome population
EP3943600A1 (en) 2020-07-21 2022-01-26 B.R.A.I.N. Biotechnology Research And Information Network AG Novel, non-naturally occurring crispr-cas nucleases for genome editing
US11299731B1 (en) 2020-09-15 2022-04-12 Inscripta, Inc. CRISPR editing to embed nucleic acid landing pads into genomes of live cells
KR20230074525A (ko) * 2020-09-24 2023-05-30 플래그쉽 파이어니어링 이노베이션스 브이, 인크. 유전자 발현을 억제하기 위한 조성물 및 방법
AU2021372972A1 (en) * 2020-11-05 2023-06-22 Locus Biosciences, Inc. Phage compositions for escherichia comprising crispr-cas systems and methods of use thereof
TW202233832A (zh) * 2020-11-05 2022-09-01 美商羅卡斯生物科學公司 針對假單胞菌屬之包含crispr-cas系統的噬菌體組合物及其使用方法
US11512297B2 (en) 2020-11-09 2022-11-29 Inscripta, Inc. Affinity tag for recombination protein recruitment
WO2022101286A1 (en) 2020-11-11 2022-05-19 Leibniz-Institut Für Pflanzenbiochemie Fusion protein for editing endogenous dna of a eukaryotic cell
EP4263820A1 (en) * 2020-12-17 2023-10-25 Monsanto Technology LLC Engineered ssdnase-free crispr endonucleases
WO2022144382A1 (en) 2020-12-30 2022-07-07 Eligo Bioscience Chimeric receptor binding proteins resistant to proteolytic degradation
EP4271802A1 (en) 2021-01-04 2023-11-08 Inscripta, Inc. Mad nucleases
EP4274890A1 (en) 2021-01-07 2023-11-15 Inscripta, Inc. Mad nucleases
CN112778399A (zh) * 2021-01-21 2021-05-11 南开大学 一类源自毒性淀粉样纤维纳米抗菌肽的制备及性质表征方法
CN117043194A (zh) 2021-01-29 2023-11-10 默沙东有限责任公司 程序性死亡受体1(pd-1)抗体的组合物以及获得所述组合物的方法
JP2024506906A (ja) * 2021-02-12 2024-02-15 ザ ボード オブ トラスティーズ オブ ザ レランド スタンフォード ジュニア ユニバーシティー 増強された多重遺伝子制御及び編集のための合成cas12a
US11884924B2 (en) 2021-02-16 2024-01-30 Inscripta, Inc. Dual strand nucleic acid-guided nickase editing
CN117255855A (zh) 2021-03-02 2023-12-19 Brain生物技术有限公司 来自宏基因组的新颖的CRISPR-Cas核酸酶
CN114277015B (zh) * 2021-03-16 2023-12-15 山东舜丰生物科技有限公司 Crispr酶以及应用
WO2022236147A1 (en) 2021-05-06 2022-11-10 Artisan Development Labs, Inc. Modified nucleases
CN112920263B (zh) * 2021-05-11 2021-08-10 上海浦东复旦大学张江科技研究院 表观遗传修饰OsMOF蛋白在改良水稻产量性状中的应用
IL308147A (en) 2021-05-12 2023-12-01 Eligo Bioscience Production of bacterial cells and their use in production methods
CN113373130B (zh) * 2021-05-31 2023-12-22 复旦大学 Cas12蛋白、含有Cas12蛋白的基因编辑系统及应用
WO2022256448A2 (en) 2021-06-01 2022-12-08 Artisan Development Labs, Inc. Compositions and methods for targeting, editing, or modifying genes
EP4370676A2 (en) 2021-06-18 2024-05-22 Artisan Development Labs, Inc. Compositions and methods for targeting, editing or modifying human genes
WO2023283636A1 (en) * 2021-07-09 2023-01-12 Acrigen Biosciences Compositions and methods for nucleic acid modifications
EP4370647A1 (en) 2021-07-15 2024-05-22 Just-Evotec Biologics, Inc. Bidirectional tangential flow filtration (tff) perfusion system
WO2023027041A1 (ja) * 2021-08-23 2023-03-02 グランドグリーン株式会社 部位特異的ヌクレアーゼ
WO2023097316A1 (en) * 2021-11-29 2023-06-01 Editas Medicine, Inc. Engineered crispr/cas12a effector proteins, and uses thereof
WO2023167882A1 (en) 2022-03-01 2023-09-07 Artisan Development Labs, Inc. Composition and methods for transgene insertion
CN114277029B (zh) * 2022-03-08 2022-05-10 农业农村部环境保护科研监测所 一种高效提取蚯蚓肠道内容物及其胞外dna的方法
WO2023225410A2 (en) 2022-05-20 2023-11-23 Artisan Development Labs, Inc. Systems and methods for assessing risk of genome editing events
WO2023240061A2 (en) * 2022-06-06 2023-12-14 Board Of Regents, The University Of Texas System Compositions and methods related to modified cas12a2 molecules
EP4299733A1 (en) 2022-06-30 2024-01-03 Inari Agriculture Technology, Inc. Compositions, systems, and methods for genome editing
WO2024005863A1 (en) 2022-06-30 2024-01-04 Inari Agriculture Technology, Inc. Compositions, systems, and methods for genome editing
EP4299739A1 (en) 2022-06-30 2024-01-03 Inari Agriculture Technology, Inc. Compositions, systems, and methods for genome editing
WO2024005864A1 (en) 2022-06-30 2024-01-04 Inari Agriculture Technology, Inc. Compositions, systems, and methods for genome editing
WO2024062138A1 (en) 2022-09-23 2024-03-28 Mnemo Therapeutics Immune cells comprising a modified suv39h1 gene
CN116286737B (zh) * 2023-01-02 2023-09-22 华中农业大学 无pam限制的核酸内切酶及其介导的基因编辑系统
CN116179513B (zh) * 2023-03-10 2023-12-22 之江实验室 一种Cpf1蛋白及其在基因编辑中的应用
CN116179511B (zh) * 2023-03-10 2023-12-22 之江实验室 Cpf1蛋白在制备用于核酸检测的试剂盒中的应用
CN116751763B (zh) * 2023-05-08 2024-02-13 珠海舒桐医疗科技有限公司 一种Cpf1蛋白、V型基因编辑系统及应用

Family Cites Families (70)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4945050A (en) 1984-11-13 1990-07-31 Cornell Research Foundation, Inc. Method for transporting substances into living cells and tissues and apparatus therefor
US5569597A (en) 1985-05-13 1996-10-29 Ciba Geigy Corp. Methods of inserting viral DNA into plant material
US5268463A (en) 1986-11-11 1993-12-07 Jefferson Richard A Plant promoter α-glucuronidase gene construct
US5608142A (en) 1986-12-03 1997-03-04 Agracetus, Inc. Insecticidal cotton plants
US5990387A (en) 1988-06-10 1999-11-23 Pioneer Hi-Bred International, Inc. Stable transformation of plant cells
US6015891A (en) 1988-09-09 2000-01-18 Mycogen Plant Science, Inc. Synthetic insecticidal crystal protein gene having a modified frequency of codon usage
US5023179A (en) 1988-11-14 1991-06-11 Eric Lam Promoter enhancer element for gene expression in plant roots
US5110732A (en) 1989-03-14 1992-05-05 The Rockefeller University Selective gene expression in plants
HU218717B (hu) 1989-03-17 2000-11-28 E. I. Du Pont De Nemours And Co. Nukleinsav-termelést fokozó növényi eredetű génfragmentek és eljárás előállításukra
US5879918A (en) 1989-05-12 1999-03-09 Pioneer Hi-Bred International, Inc. Pretreatment of microprojectiles prior to using in a particle gun
US5240855A (en) 1989-05-12 1993-08-31 Pioneer Hi-Bred International, Inc. Particle gun
US5322783A (en) 1989-10-17 1994-06-21 Pioneer Hi-Bred International, Inc. Soybean transformation by microparticle bombardment
DE69133128T2 (de) 1990-04-12 2003-06-18 Syngenta Participations Ag Gewebe-spezifische Promotoren
US5498830A (en) 1990-06-18 1996-03-12 Monsanto Company Decreased oil content in plant seeds
US5932782A (en) 1990-11-14 1999-08-03 Pioneer Hi-Bred International, Inc. Plant transformation method using agrobacterium species adhered to microprojectiles
US5459252A (en) 1991-01-31 1995-10-17 North Carolina State University Root specific gene promoter
US5399680A (en) 1991-05-22 1995-03-21 The Salk Institute For Biological Studies Rice chitinase promoter
ES2140416T3 (es) 1991-08-27 2000-03-01 Novartis Ag Proteinas con propiedades insecticidas contra insectos homopteros y su uso en la proteccion de plantas.
DE69233410D1 (de) 1991-10-04 2004-10-21 Univ North Carolina State Pathogenresistente transgene pflanzen
US5324646A (en) 1992-01-06 1994-06-28 Pioneer Hi-Bred International, Inc. Methods of regeneration of Medicago sativa and expressing foreign DNA in same
US5401836A (en) 1992-07-16 1995-03-28 Pioneer Hi-Bre International, Inc. Brassica regulatory sequence for root-specific or root-abundant gene expression
EP0652965A1 (en) 1992-07-27 1995-05-17 Pioneer Hi-Bred International, Inc. An improved method of agrobacterium-mediated transformation of cultured soybean cells
CA2127807A1 (en) 1992-11-20 1994-06-09 John Maliyakal Transgenic cotton plants producing heterologous bioplastic
AU6162294A (en) 1993-01-13 1994-08-15 Pioneer Hi-Bred International, Inc. High lysine derivatives of alpha-hordothionin
US5583210A (en) 1993-03-18 1996-12-10 Pioneer Hi-Bred International, Inc. Methods and compositions for controlling plant development
US5814618A (en) 1993-06-14 1998-09-29 Basf Aktiengesellschaft Methods for regulating gene expression
US5789156A (en) 1993-06-14 1998-08-04 Basf Ag Tetracycline-regulated transcriptional inhibitors
US5470353A (en) 1993-10-20 1995-11-28 Hollister Incorporated Post-operative thermal blanket
US5633363A (en) 1994-06-03 1997-05-27 Iowa State University, Research Foundation In Root preferential promoter
US5736369A (en) 1994-07-29 1998-04-07 Pioneer Hi-Bred International, Inc. Method for producing transgenic cereal plants
US5608144A (en) 1994-08-12 1997-03-04 Dna Plant Technology Corp. Plant group 2 promoters and uses thereof
BR9609200A (pt) 1995-06-02 1999-05-11 Pioneer Hi Bred Int Derivados de alta treonina de alpha-hordotionina
WO1996038563A1 (en) 1995-06-02 1996-12-05 Pioneer Hi-Bred International, Inc. HIGH METHIONINE DERIVATIVES OF α-HORDOTHIONIN
US5837876A (en) 1995-07-28 1998-11-17 North Carolina State University Root cortex specific gene promoter
US5703049A (en) 1996-02-29 1997-12-30 Pioneer Hi-Bred Int'l, Inc. High methionine derivatives of α-hordothionin for pathogen-control
US5850016A (en) 1996-03-20 1998-12-15 Pioneer Hi-Bred International, Inc. Alteration of amino acid compositions in seeds
US6072050A (en) 1996-06-11 2000-06-06 Pioneer Hi-Bred International, Inc. Synthetic promoters
EP0946729A2 (en) 1996-11-01 1999-10-06 Pioneer Hi-Bred International, Inc. Proteins with enhanced levels of essential amino acids
US5981840A (en) 1997-01-24 1999-11-09 Pioneer Hi-Bred International, Inc. Methods for agrobacterium-mediated transformation
ATE278782T1 (de) 1998-02-26 2004-10-15 Pioneer Hi Bred Int Konstitutive maispromotoren
AU3600299A (en) 1998-03-27 1999-10-18 Max-Plack-Gesellschaft Zur Forderung Der Wissenschaften E.V. Novel basal endosperm transfer cell layer (betl) specific genes
ES2252964T3 (es) 1998-08-20 2006-05-16 Pioneer Hi-Bred International, Inc. Promotores preferidos de semillas.
WO2000012733A1 (en) 1998-08-28 2000-03-09 Pioneer Hi-Bred International, Inc. Seed-preferred promoters from end genes
WO2000028058A2 (en) 1998-11-09 2000-05-18 Pioneer Hi-Bred International, Inc. Transcriptional activator lec1 nucleic acids, polypeptides and their uses
US7531723B2 (en) 1999-04-16 2009-05-12 Pioneer Hi-Bred International, Inc. Modulation of cytokinin activity in plants
US7462481B2 (en) * 2000-10-30 2008-12-09 Verdia, Inc. Glyphosate N-acetyltransferase (GAT) genes
AU2003234328A1 (en) 2002-04-30 2003-11-17 Pioneer Hi-Bred International, Inc. Novel glyphosate-n-acetyltransferase (gat) genes
EP1528104A1 (en) 2003-11-03 2005-05-04 Biogemma MEG1 endosperm-specific promoters and genes
US20090049569A1 (en) 2007-08-13 2009-02-19 Pioneer Hi-Bred International, Inc. Seed-Preferred Regulatory Elements
US7847160B2 (en) 2007-08-15 2010-12-07 Pioneer Hi-Bred International, Inc. Seed-preferred promoters
US7964770B2 (en) 2007-09-28 2011-06-21 Pioneer Hi-Bred International, Inc. Seed-preferred promoter from Sorghum kafirin gene
AU2009208377B2 (en) 2008-01-31 2015-01-22 Grains Research & Development Corporation Seed specific expression in plants
WO2010019996A1 (en) 2008-08-18 2010-02-25 Australian Centre For Plant Functional Genomics Pty Ltd Seed active transcriptional control sequences
GB2465748B (en) 2008-11-25 2012-04-25 Algentech Sas Plant cell transformation method
GB2465749B (en) 2008-11-25 2013-05-08 Algentech Sas Plant cell transformation method
JP5208842B2 (ja) 2009-04-20 2013-06-12 株式会社カプコン ゲームシステム、ゲーム制御方法、プログラム、および、このプログラムを記録したコンピュータ読み取り可能な記録媒体
US20100281570A1 (en) 2009-05-04 2010-11-04 Pioneer Hi-Bred International, Inc. Maize 18kd oleosin seed-preferred regulatory element
US8466341B2 (en) 2009-05-04 2013-06-18 Pioneer Hi-Bred International, Inc. Maize 17KD oleosin seed-preferred regulatory element
AU2010246909B2 (en) 2009-05-13 2013-10-03 Basf Plant Science Company Gmbh Plant promoter operable in basal endosperm transfer layer of endosperm and uses thereof
US8466342B2 (en) 2009-06-09 2013-06-18 Pioneer Hi Bred International Inc Early endosperm promoter and methods of use
BR112014014105B1 (pt) * 2011-12-16 2023-10-10 Targetgene Biotechnologies Ltd Método para modificar um sítio-alvo predeterminado no interior de um ácido nucleico genômico ou organelar alvo em uma célula hospedeira eucariótica por um complexo núcleoproteína
MX362866B (es) 2012-05-25 2019-02-20 Univ California Metodos y composiciones para la modificacion de adn objetivo dirigida por arn y para la modulacion de la transcripcion dirigida por arn.
US20140356956A1 (en) 2013-06-04 2014-12-04 President And Fellows Of Harvard College RNA-Guided Transcriptional Regulation
JP2016537028A (ja) 2013-11-18 2016-12-01 クリスパー セラピューティクス アーゲー Crispr−casシステムの材料及び方法
FI3250691T3 (fi) * 2015-01-28 2023-08-24 Caribou Biosciences Inc Crispr hybridi dna/rna polynukleotidit ja käyttömenetelmät
US9790490B2 (en) * 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
WO2017015015A1 (en) 2015-07-17 2017-01-26 Emory University Crispr-associated protein from francisella and uses related thereto
US20190233814A1 (en) * 2015-12-18 2019-08-01 The Broad Institute, Inc. Novel crispr enzymes and systems
US9896696B2 (en) 2016-02-15 2018-02-20 Benson Hill Biosystems, Inc. Compositions and methods for modifying genomes
WO2018013990A1 (en) * 2016-07-15 2018-01-18 Zymergen Inc. Scarless dna assembly and genome editing using crispr/cpf1 and dna ligase

Also Published As

Publication number Publication date
PH12018501722A1 (en) 2019-05-20
ES2973207T3 (es) 2024-06-19
JP2022184892A (ja) 2022-12-13
IL261082A (en) 2018-11-04
AU2017220789B2 (en) 2023-06-08
BR112018016408A2 (pt) 2018-12-18
EP3307884A2 (en) 2018-04-18
US20170233756A1 (en) 2017-08-17
JP2024028753A (ja) 2024-03-05
CA3221070A1 (en) 2017-08-24
WO2017141173A3 (en) 2017-11-02
KR20180107155A (ko) 2018-10-01
US20180148735A1 (en) 2018-05-31
US20190071688A1 (en) 2019-03-07
EP3307884C0 (en) 2024-01-03
EP4063501A1 (en) 2022-09-28
MX2018009761A (es) 2018-11-29
MY197523A (en) 2023-06-20
US9896696B2 (en) 2018-02-20
WO2017141173A2 (en) 2017-08-24
EP3307884B1 (en) 2024-01-03
AU2023270322A1 (en) 2023-12-14
JP2019504649A (ja) 2019-02-21
US10113179B2 (en) 2018-10-30
IL304398A (en) 2023-09-01
CA3014988A1 (en) 2017-08-24
KR20230165368A (ko) 2023-12-05
AU2023226754A1 (en) 2023-09-28
AU2017220789A1 (en) 2018-08-30
CN115927440A (zh) 2023-04-07
IL308791A (en) 2024-01-01
EP4306642A2 (en) 2024-01-17
CN109312316A (zh) 2019-02-05
MX2023014014A (es) 2023-12-11

Similar Documents

Publication Publication Date Title
CN109312316B (zh) 修饰基因组的组合物和方法
US11624070B2 (en) Compositions and methods for modifying genomes
US20210180076A1 (en) Compositions and methods for genome editing in plants
US20220333124A1 (en) Compositions and methods for modifying genomes
WO2023119135A1 (en) Compositions and methods for modifying genomes
BR122023025443A2 (pt) Composições e métodos para modificar genomas
WO2022236071A1 (en) Genome editing in plants using cas12a nucleases

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: Missouri, USA

Applicant after: Benson Hill S.A.

Address before: North Carolina, USA

Applicant before: BENSON HILL BIOSYSTEMS, Inc.

GR01 Patent grant
GR01 Patent grant