CN118076742A - 修饰油菜素内酯受体基因以改善产量性状 - Google Patents

修饰油菜素内酯受体基因以改善产量性状 Download PDF

Info

Publication number
CN118076742A
CN118076742A CN202280068221.5A CN202280068221A CN118076742A CN 118076742 A CN118076742 A CN 118076742A CN 202280068221 A CN202280068221 A CN 202280068221A CN 118076742 A CN118076742 A CN 118076742A
Authority
CN
China
Prior art keywords
seq
plant
amino acid
gene
mutation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280068221.5A
Other languages
English (en)
Inventor
N·贝特
L·G·马修
D·奥康纳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pairing Plant Service Co ltd
Original Assignee
Pairing Plant Service Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Pairing Plant Service Co ltd filed Critical Pairing Plant Service Co ltd
Publication of CN118076742A publication Critical patent/CN118076742A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8291Hormone-influenced development
    • C12N15/8298Brassinosteroids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8213Targeted insertion of genes into the plant genome by homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/11Protein-serine/threonine kinases (2.7.11)
    • C12Y207/11001Non-specific serine/threonine protein kinase (2.7.11.1), i.e. casein kinase or checkpoint kinase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Botany (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Endocrinology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Steroid Compounds (AREA)

Abstract

本发明涉及用于修饰植物中油菜素内酯不敏感‑1(BRI1)基因的组合物和方法,所述组合物和方法任选地提高产量性状。本发明还涉及使用本发明的方法和组合物产生的具有增加的改善的产量性状的植物。

Description

修饰油菜素内酯受体基因以改善产量性状
优先权声明
本申请根据35U.S.C.§119(e)要求于2021年8月12日提交的美国临时申请号63/232,297的权益,其全部内容通过引用并入本文。
关于电子提交序列表的声明
根据37C.F.R.§1.831-1.834提交的XML文本格式的序列表,标题为1499.69.WO_ST26.xml,大小为294,430字节,于2022年7月28日生成并以电子方式提交,以代替纸质副本。该序列表在此通过引用并入说明书中作为其公开内容。
技术领域
本发明涉及用于修饰植物中的油菜素内酯不敏感-1(BRI1)基因的组合物和方法,任选地用于改善产量性状。本发明还涉及使用本发明的方法和组合物产生的具有增加的改善的产量性状的植物。
技术背景
行间作物的集约化育种导致植物产量不断增加。然而,来自育种的遗传增益已开始趋于稳定,并且在育种计划中组装多个微效基因大大增加了研发成本。单基因解决方案对于诸如产量等的复杂性状一直具有挑战性,其中背景遗传和环境相结合减少了单个基因的影响。通过将许多贡献较小的单个基因组合起来,育种取得了成功,但需要更多的资源来找到具有改善的效应的独特组合。为了提高产量增加率,需要在有助于产量的重要基因和途径中引入新的变异。
涉及稳定转化以提高产量的转基因方法基本上不成功,并且没有商业化的相关单基因方法能够成功地实现产量的显著变化。通过GM方法修饰激素相关途径尚未取得成果,因为通过转基因技术简单的过表达或低表达与提高植物产量所需的微调效应不一致。
本发明通过提供用于改善/增强植物(包括大豆、玉米和其他植物物种)产量性状的新组合物和方法来解决本领域中的这些缺点。
发明内容
本发明的一个方面提供了一种植物或其植物部分,其包含编码BRI1多肽(油菜素内酯受体多肽)的内源性油菜素内酯不敏感-1(BRI1)基因中的至少一个突变,任选地其中所述突变可以是非天然突变。
本发明的第二个方面提供了一种植物细胞,其包含编辑系统,所述编辑系统包含:(a)CRISPR-Cas效应蛋白;和(b)向导核酸(例如,gRNA、gDNA、crRNA、crDNA、sgRNA、sgDNA),其包含与编码油菜素内酯不敏感-1(BRI1)多肽(油菜素内酯受体多肽)的内源性靶基因互补的间隔序列。
本发明的第三个方面提供了一种植物细胞,其包含内源性油菜素内酯不敏感-1(BRI1)基因内的至少一个突变,其中所述突变是使用包含核酸结合结构域的编辑系统引入的置换、插入或缺失,所述核酸结合结构域结合内源性BRI1基因中的靶位点,任选地其中所述突变可以是非天然突变。
本发明的第四个方面提供了产生/培育无转基因的编辑植物的方法,包括:使本发明的植物与无转基因的植物杂交,从而将至少一个突变引入无转基因的植物中;以及选择包含所述至少一个突变并且无转基因的后代植物,从而产生无转基因的编辑植物,任选地其中所述突变可以是非天然突变。
本发明的第五个方面提供了一种提供具有一种或多种改善的产量性状,任选地增加的种子大小(例如种子面积和/或种子重量)和/或种子油含量的多种植物的方法,该方法包括在种植区域中种植本发明的两种或更多种植物,从而提供与不包含所述至少一种突变的多种对照植物相比具有一种或多种改善的产量性状的多种植物。
本发明的第六个方面提供了一种在油菜素内酯不敏感-1(BRI1)多肽的区域中产生变异的方法,包括:将编辑系统引入植物细胞中,其中所述编辑系统靶向油菜素内酯不敏感-1(BRI1)基因中的编码BRI1多肽区域的区域,并使BRI1基因的所述区域与所述编辑系统接触,从而将突变引入BRI1基因中并在植物细胞的BRI1多肽中产生变异。
第七个方面提供了一种用于编辑植物细胞基因组中特定位点的方法,所述方法包括:以位点特异性方式裂解所述植物细胞中内源性油菜素内酯不敏感-1(BRI1)基因内的靶位点,所述内源性BRI1基因:
(a)包含与SEQ ID NO:69、70、85、86、99、100、112、113、123或124中任一个核苷酸序列具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:72-76、89-94、102-106、115-118或126-130中任一个核苷酸序列具有至少80%序列同一性的区域;(c)编码与SEQ IDNO:71、87、88、101、114或125中任一个具有至少80%序列同一性的氨基酸序列,和/或(d)编码与SEQ ID NO:77-81、95-98、107-111、119-122或131-135中任一个氨基酸序列具有至少80%序列同一性的区域,从而在所述植物细胞的内源性BRI1基因中产生编辑,并产生包含所述内源性BRI1基因中的所述编辑的植物细胞。
第八个方面提供了一种产生植物的方法,包括:(a)使包含内源性油菜素内酯不敏感-1(BRI1)基因的植物细胞群体和与核酸结合结构域(例如,编辑系统)连接的核酸酶接触,所述核酸结合结构域结合下列序列:(a)与SEQ ID NO:69、70、85、86、99、100、112、113、123或124中任一个核苷酸序列具有至少80%序列同一性的序列,(b)编码与SEQ ID NO:71、87、88、101、114或125中任一个具有至少80%序列同一性的氨基酸序列的序列,(c)编码包含与SEQ ID NO:77-81、95-98、107-111、119-122或131-135中任一个具有至少80%序列同一性的区域的氨基酸序列的序列,和/或(d)包含与SEQ ID NO:72-76、89-94、102-106、115-118或126-130中任一个具有至少80%同一性的区域的序列;(b)从内源性BRI1基因发生突变的群体中选择植物细胞,从而产生包含所述内源性BRI1基因中的突变的植物细胞;以及(c)使所选择的植物细胞生长成植物。
第九个方面提供了一种改善植物的一种或多种产量性状的方法,包括:(a)使包含内源性油菜素内酯不敏感-1(BRI1)基因的植物细胞与靶向所述内源性BRI1基因的核酸酶接触,其中所述核酸酶与结合所述内源性BRI1基因中的靶位点的核酸结合结构域(例如,编辑系统)连接,其中所述内源性BRI1基因:(i)包含与SEQ ID NO:69、70、85、86、99、100、112、113、123或124中任一个核苷酸序列具有至少80%序列同一性的序列;(ii)包含与SEQ IDNO:72-76、89-94、102-106、115-118或126-130中任一个具有至少80%同一性的区域;(iii)编码与SEQ ID NO:71、87、88、101、114或125中任一个具有至少80%序列同一性的氨基酸序列;和/或(iv)编码包含与SEQ ID NO:77-81、95-98、107-111、119-122或131-135中任一个具有至少80%同一性的区域的氨基酸序列,以产生包含所述内源性BRI1基因中的突变的植物细胞;以及(b)使所述植物细胞生长成包含所述内源性BRI1基因中的所述突变的植物,从而产生具有突变的内源性BRI1基因和一种或多种改善的产量性状的植物。
第十个方面提供产生植物或其部分的方法,所述植物或其部分包含至少一个具有突变的内源性油菜素内不敏感-1(BRI1)基因的细胞,所述方法包括:使所述植物或植物部分中的内源性BRI1基因中的靶位点与包含裂解结构域和核酸结合结构域的核酸酶接触,其中所述核酸结合结构域与所述内源性BRI1基因中的靶位点结合,其中所述内源性BRI1基因:(a)包含与SEQ ID NO:69、70、85、86、99、100、112、113、123或124中任一个核苷酸序列具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:72-76、89-94、102-106、115-118或126-130中任一个具有至少80%同一性的区域;(c)编码与SEQ ID NO:71、87、88、101、114或125中任一个具有至少80%序列同一性的氨基酸序列;和/或(d)编码包含与SEQ ID NO:77-81、95-98、107-111、119-122或131-135中任一个具有至少80%同一性的区域的氨基酸序列,从而产生包含至少一个具有所述内源性BRI1基因中的突变的细胞的所述植物或其部分。
本发明的第十一个方面提供了一种产生包含突变的内源性油菜素内酯不敏感-1(BRI1)基因并表现出一种或多种改善的产量性状的植物或其部分的方法,所述方法包括使所述植物或植物部分的内源性BRI1基因中的靶位点与包含裂解结构域和核酸结合结构域的核酸酶接触,其中所述核酸结合结构域与所述内源性BRI1基因中的靶位点结合,其中所述内源性BRI1基因:(a)包含与SEQ ID NO:69、70、85、86、99、100、112、113、123或124中任一个核苷酸序列具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:72-76、89-94、102-106、115-118或126-130中任一个具有至少80%同一性的区域;(c)编码与SEQ ID NO:71、87、88、101、114或125中任一个具有至少80%序列同一性的氨基酸序列;和/或(d)编码包含与SEQ ID NO:77-81、95-98、107-111、119-122或131-135中任一个具有至少80%同一性的区域的氨基酸序列,从而产生包含具有突变的内源性BRI1基因并表现出一种或多种改善的产量性状的植物或其部分。
第十二个方面提供了一种在植物的内源性油菜素内酯不敏感-1(BRI1)基因中产生突变的方法,所述方法包括:(a)将基因编辑系统靶向所述BRI1基因的一部分,所述BRI1基因:(i)包含与SEQ ID NO:72-76、89-94、102-106、115-118或126-130中任一个具有至少80%序列同一性的序列;和/或(ii)编码与SEQ ID NO:77-81、95-98、107-111、119-122或131-135中任一个具有至少80%同一性的序列,以及(b)选择包含修饰的氨基酸残基的植物,所述修饰的氨基酸残基位于:大约位置955-975,参考SEQ ID NO:71的氨基酸位置编号;大约位置1023-1043,参考SEQ ID NO:87或SEQ ID NO:88的氨基酸位置编号;大约位置1081-1101,参考SEQ ID NO:101的氨基酸位置编号;大约位置1065-1085,参考SEQ ID NO:114的氨基酸位置编号;和/或大约位置1026-1046,参考SEQ ID NO:125的氨基酸位置编号;任选地位于:位置965处,参考SEQ ID NO:71的氨基酸位置编号;位置1033处,参考SEQ IDNO:87或SEQ ID NO:88的氨基酸位置编号;位置1091处,参考SEQ ID NO:101的氨基酸位置编号;位置1075处,参考SEQ ID NO:114的氨基酸位置编号;或位置1036处,参考SEQ ID NO:125的氨基酸位置编号。
第十三个方面提供了一种检测突变的BRI1基因的方法,所述方法包括检测植物基因组中编码包含激酶结构域中的突变的BRI1多肽的内源性BRI1基因,任选地其中所述激酶结构域位于BRI1多肽中位于以下的区域:(a)大约位置929-1002、942-994、949-987、956-975和/或960-970,参考SEQ ID NO:74的氨基酸位置编号(例如,SEQ ID NO:80-84),(b)大约位置997-1070、1008-1059、1018-1048和/或1028-1039,参考SEQ ID NO:90或SEQ ID NO:91的氨基酸位置编号(例如,SEQ ID NO:98-101),(c)大约位置1048-1122、1068-1102、1075-1095、1085-1096,参考SEQ ID NO:104的氨基酸位置编号(例如,SEQ ID NO:110-114),(d)大约位置1051-1097、1057-1090、1064-1082和/或1069-1080,参考SEQ ID NO:117的氨基酸位置编号(例如,SEQ ID NO:122-125),和/或(e)大约位置1000-1073、1013-1059、1020-1053、1027-1046和/或1031-1042,参考SEQ ID NO:128的氨基酸位置编号(例如,SEQID NO:101、134-137)。
第十四个方面提供了一种与油菜素内酯不敏感-1(BRI1)基因中的靶位点结合的向导核酸,其中所述靶位点是在位于所述BRI1基因的下列位置的区域中:(a)大约核苷酸3096-3235、3136-3295、3156-3275、3176-3255和/或3176-3237,参考SEQ ID NO:69的核苷酸位置编号(例如,SEQ ID NO:72-76),(b)大约核苷酸2784-3023、2824-2983、2844-2963、2864-2943和/或2864-2924,参考SEQ ID NO:70的核苷酸位置编号(例如,SEQ ID NO:72-76),(c)大约核苷酸3198-3420、3238-3380、3258-3360、3278-3340和/或3291-3327,参考SEQ ID NO:85的核苷酸位置编号(例如,SEQ ID NO:89-94),(d)大约核苷酸1944-2166、1984-2126、2004-2106、2024-2085和/或2036-2073,参考SEQ ID NO:86的核苷酸位置编号(例如,SEQ ID NO:89-94),(e)大约核苷酸3070-3292、3110-3252、3130-3232、3150-3212和/或3180-3228,参考SEQ ID NO:99或SEQ ID NO:100的核苷酸位置编号(例如,SEQ IDNO:102-106),(f)大约核苷酸3109-3331、3149-3291、3169-3271、3189-3251和/或3204-3244,参考SEQ ID NO:113或SEQ ID NO:114的核苷酸位置编号(例如,SEQ ID NO:115-118),(g)大约核苷酸3289-3511、3329-3471、3349-3451、3369-3431和/或3381-3419,参考SEQ ID NO:123的核苷酸位置编号(例如,SEQ ID NO:126-130)和/或(h)大约核苷酸2997-3219、3037-3179、3057-3159、3077-3139和/或3089-3126,参考SEQ ID NO:124的核苷酸位置编号(例如,SEQ ID NO:126-130)。
在第十五个方面,提供了一种系统,所述系统包含本发明的向导核酸和与所述向导核酸缔合的CRISPR-Cas效应蛋白。
在第十六个方面,提供了一种基因编辑系统,所述基因编辑系统包含与向导核酸缔合的CRISPR-Cas效应蛋白,其中所述向导核酸包含与内源性油菜素内酯不敏感-1(BRI1)基因结合的间隔序列。
在第十七个方面,提供了一种包含向导核酸和包含裂解结构域的CRISPR-Cas效应蛋白的复合物,其中所述向导核酸与内源性油菜素内酯不敏感-1(BRI1)基因中的靶位点结合,其中所述内源性BRI1基因:(a)包含与SEQ ID NO:69、70、85、86、99、100、112、113、123或124中任一个核苷酸序列具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:72-76、89-94、102-106、115-118或126-130中任一个具有至少80%同一性的区域;(c)编码与SEQID NO:71、87、88、101、114或125中任一个具有至少80%序列同一性的氨基酸序列;和/或(d)编码包含与SEQ ID NO:77-81、95-98、107-111、119-122或131-135中任一个具有至少80%同一性的区域的氨基酸序列,其中所述裂解结构域裂解所述BRI1基因中的靶链。
在第十八个方面,提供了一种表达盒,所述表达盒包含:(a)编码包含裂解结构域的CRISPR-Cas效应蛋白的多核苷酸,和(b)与内源性油菜素内酯不敏感-1(BRI1)基因中的靶位点结合的向导核酸,其中所述向导核酸包含与下列互补并结合的间隔序列:(i)与SEQID NO:69、70、85、86、99、100、112、113、123或124中任一个核苷酸序列具有至少80%序列同一性的核酸部分;(ii)与SEQ ID NO:72-76、89-94、102-106、115-118或126-130中任一个具有至少80%序列同一性的核酸部分;(iii)编码与SEQ ID NO:71、87、88、101、114或125中任一个具有至少80%序列同一性的氨基酸序列的核酸部分;和/或(iv)编码与SEQ ID NO:77-81、95-98、107-111、119-122或131-135中任一个具有至少80%同一性的氨基酸序列的核酸部分。
在第十九个方面,提供了编码油菜素内酯不敏感-1(BRI1)多肽的显性负性突变或无效突变的核酸。
在第二十个方面,提供了一种修饰的油菜素内酯不敏感-1(BRI1)多肽,所述修饰的BRI1多肽包含位于下列位置的氨基酸残基的突变:大约位置955-975,参考SEQ ID NO:71的氨基酸位置编号;大约位置1023-1043,参考SEQ ID NO:87或SEQ ID NO:88的氨基酸位置编号;大约位置1081-1101,参考SEQ ID NO:101的氨基酸位置编号;大约位置1065-1085,参考SEQ ID NO:114的氨基酸位置编号;和/或大约位置1026-1046,参考SEQ ID NO:125的氨基酸位置编号;任选地位于:位置965处,参考SEQ ID NO:71的氨基酸位置编号;位置1033处,参考SEQ ID NO:87或SEQ ID NO:88的氨基酸位置编号;位置1091处,参考SEQ ID NO:101的氨基酸位置编号;位置1075处,参考SEQ ID NO:114的氨基酸位置编号;或位置1036处,参考SEQ ID NO:125的氨基酸位置编号。
在另一个方面,提供了通过本发明的方法产生的在其基因组中包含一个或多个突变的油菜素内酯不敏感-1(BRI1)基因的植物。
本发明的又一方面提供了一种玉米植物或其植物部分,包含至少一个内源性油菜素内酯不敏感-1(BRI1)基因中的至少一个突变,所述BRI1基因具有GRMZM6G437417(基因座370)的基因识别号(基因ID),任选地其中所述突变是非天然突变。
在附加的方面,提供了一种大豆植物或其植物部分,所述大豆植物包含至少一个内源性油菜素内酯不敏感-1(BRI1)基因中的至少一个突变,所述BRI1基因具有Glyma.06g147600(基因座325)、Glyma.04g115700(基因座326)、Glyma.06g320600(基因座327)和/或Glyma.04g218300(基因座328)的基因识别号(基因ID),任选地其中所述突变是非天然突变。
在进一步的方面,提供了一种与油菜素内酯不敏感-1(BRI1)基因内的靶核酸结合的向导核酸,所述BRI1基因具有GRMZM6G437417(基因座370)、Glyma.06g147600(基因座325)、Glyma.04g115700(基因座326)、Glyma.06g320600(基因座327)和/或Glyma.04g218300(基因座328)的基因识别号(基因ID)。本发明进一步提供了用于产生本发明的植物的多肽、多核苷酸、核酸构建体、表达盒以及载体。
本发明的这些方面和其他方面在下面的发明描述中作了更详细的阐述。
序列的简要说明
SEQ ID NO:1-17是可用于本发明的示例性Cas12a氨基酸序列。
SEQ ID NO:18-20是可用于本发明的示例性Cas12a核苷酸序列。
SEQ ID NO:21-22是编码启动子和内含子的示例性调控序列。
SEQ ID NO:23-29是可用于本发明的示例性胞嘧啶脱氨酶序列。
SEQ ID NO:30-40是可用于本发明的示例性腺嘌呤脱氨酶氨基酸序列。
SEQ ID NO:41是可用于本发明的示例性尿嘧啶-DNA糖基化酶抑制剂(UGI)序列。
SEQ ID NO:42-44提供了可用于本发明的示例性肽标签和亲和多肽。
SEQ ID NO:45-55提供了可用于本发明的示例性RNA募集基序和相应的亲和多肽。
SEQ ID NO:56-57是可用于本发明的示例性Cas9多肽序列。
SEQ ID NO:58-68是可用于本发明的示例性Cas9多核苷酸序列。
SEQ ID NO:69是来自玉米的示例性BRI1基因组序列。
SEQ ID NO:70是来自玉米的示例性BRI1 cDNA序列。
SEQ ID NO:71是来自玉米的示例性BRI1多肽序列。
SEQ ID NO:72-76是玉米BRI1基因组和编码序列的示例性部分或区域。
SEQ ID NO:77-81是玉米BRI1多肽序列的示例性部分或区域。
SEQ ID NO:85、99、112和123是来自大豆的示例性BRI1基因组序列。
SEQ ID NO:86和SEQ ID NO:100是来自大豆的示例性BRI1 cDNA序列,SEQ ID NO:113和SEQ ID NO:124是来自大豆的示例性BRI1编码序列。
SEQ ID NO:87、88、101、114和125是来自大豆的示例性BRI1多肽序列。
SEQ ID NO:89-94、102-106、115-118和126-130是大豆BRI1基因组和编码序列的示例性部分或区域。
SEQ ID NO:95-98、107-111、119-122和131-135是大豆BRI1多肽序列的示例性部分或区域。
SEQ ID NO:82-84和136-139是可用于本发明的向导核酸的示例性间隔序列。
SEQ ID NO:140-142是如本文所述在大豆中已被编辑的BRI1基因组序列的实例。
SEQ ID NO:143-145是如本文所述在玉米中已被编辑的BRI1基因组序列的实例。
具体实施方式
现在将在下文中参考附图和实施例来描述本发明,在附图和实施例中示出了本发明的实施方案。该描述并不旨在成为可实施本发明的所有不同方式或可添加到本发明的所有特征的详细目录。例如,关于一个实施方案示出的特征可以合并到其他实施方案中,并且关于特定实施方案示出的特征可以从该实施方案中删除。因此,本发明预期在本发明的一些实施方案中,可以排除或省略本文阐述的任何特征或特征的组合。另外,根据本公开,对本文提出的各种实施方案的多种变化和添加对于本领域技术人员来说将是显而易见的,这些变化和添加不背离本发明。因此,以下描述旨在说明本发明的一些特定实施方案,而不是穷举地指定其所有排列、组合和变化。
除非另外定义,本文中使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常理解的相同含义。本文中在本发明的描述中使用的术语仅用于描述特定实施方案的目的,并且不旨在限制本发明。
本文引用的所有出版物、专利申请、专利和其他参考文献均通过引用以其整体并入,以用于与其中呈现参考文献的句子和/或段落相关的教导。
除非上下文另有说明,否则具体意在本文描述的本发明的各种特征可以以任何组合使用。此外,本发明还考虑到在本发明的一些实施方案中,可以排除或省略本文阐述的任何特征或特征的组合。为了说明,如果说明书陈述组合物包含组分A、B和C,则具体意在A、B或C中的任一个或其组合可以单独地或以任何组合地被省略和放弃。
如本发明的描述和所附权利要求中所使用的,单数形式“一种”、“一个”和“该”也旨在包括复数形式,除非上下文明确地另有说明。
同样如本文所使用的,“和/或”指并涵盖一个或多个相关的列出项目的任何和所有可能的组合,以及当以替代方式(“或”)解释时缺少组合。
如本文所用的术语“约”当指可测量值诸如量或浓度等时,意在涵盖规定值的±10%、±5%、±1%、±0.5%或甚至±0.1%的变化以及规定值。例如,“约X”,其中X是可测量值,意在包括X以及X的±10%、±5%、±1%、±0.5%或甚至±0.1%的变化。本文提供的可测量值的范围可以包括其中的任何其他范围和/或单个值。
如本文所用,短语诸如“在X和Y之间”和“在约X和Y之间”应当解释为包括X和Y。如本文所用,短语诸如“在约X和Y之间”是指“在约X和约Y之间”,短语诸如“从约X到Y”是指“从约X到约Y”。
除非本文另有说明,本文中数值范围的列举仅旨在用作单独提及落入该范围内的每个单独值的速记方法,并且每个单独值并入说明书中,如同其在本文中被单独描述一样。例如,如果公开了范围10至15,则也公开了11、12、13和14。
如本文所用的术语“包含”(comprise、comprises和comprising)指定所陈述的特征、整数、步骤、操作、元件和/或组件的存在,但不排除一个或多个其他特征、整数、步骤、操作、元件、组件和/或其组的存在或添加。
如本文所用,过渡短语“基本上由......组成”意味着权利要求的范围应被解释为涵盖权利要求中列举的指定材料或步骤以及不实质上影响所要求保护的发明的基本和新颖特征的那些材料或步骤。因此,当用在本发明的权利要求中时,术语“基本上由......组成”不旨在被解释为等同于“包含”。
如本文所用,术语“增加”(increase、increasing、increased)、“增强”(enhance、enhanced、enhancing和enhancement)(及其语法变体)描述了与对照相比,至少约5%、10%、15%、20%、25%、50%、75%、100%、150%、200%、300%、400%、500%或更多的升高。例如,如本文所述的包含油菜素内酯不敏感-1(BRI1)基因中的突变的植物可以表现出改善的产量性状(例如,一种或多种改善的产量性状;例如,任选增加的种子大小(例如,种子面积和/或种子重量)和/或增加的种子油含量),所述改善的产量形状比不包含相同突变的对照植物至少高约5%或更高。对照植物通常是与编辑的植物相同的植物,但对照植物没有经过类似的编辑,因此没有突变。对照植物可以是同基因植物和/或野生型植物。因此,对照植物可以是与如本文所述的突变渗入其中的主题植物相同的育种系、品种或栽培品种,但对照育种系、品种或栽培品种不含突变。在一些实施方案中,在相同的生长条件下,例如相同的环境条件(土壤、水合作用、光、热、营养物等)下进行本发明的植物和对照植物之间的比较。
如本文所用,术语“减少”(reduce、reduced、reducing、reduction)、“减小”和“降低”(及其语法变体)描述,例如,与对照相比,至少约5%、10%、15%、20%、25%、35%、50%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%的减少。在一些实施方案中,突变可以导致BRI1多肽的量或BRI1酶活性的降低,例如,可以导致没有或基本上没有(即,微不足道的量,例如小于约10%或甚至5%)可检测到的活性或量。
如本文所用,关于核酸分子和/或核苷酸序列(例如,RNA或DNA)的术语“表达”(express、expresses、expressed或expression)等表示核酸分子和/或核苷酸序列被转录并且任选地被翻译。因此,核酸分子和/或核苷酸序列可以表达感兴趣的多肽或例如,功能性非翻译RNA。
“异源”或“重组”核苷酸序列是与其引入的宿主细胞不天然相关的核苷酸序列,包括天然存在的核苷酸序列的非天然存在的多个拷贝。“异源”核苷酸/多肽可以源自外来物种,或者,如果源自相同物种,则通过有意的人为干预在组成和/或基因组基因座上对其天然形式进行了实质性修饰。
“天然”或“野生型”核酸、核苷酸序列、多肽或氨基酸序列是指天然存在的或内源的核酸、核苷酸序列、多肽或氨基酸序列。在一些情况下,“野生型”核酸是如本文所述的未编辑的核酸,并且可以不同于如本文所述的可被编辑的“内源”基因(例如,突变的内源基因)。在一些情况下,“野生型”核酸(例如,未编辑的)可以与其中发现野生型核酸的生物体(例如,转基因生物体)异源。作为实例,“野生型内源性油菜素内酯不敏感-1(BRI1)基因”是天然存在于参考生物体中或参考生物体内源性的BRI1基因,所述参考生物体例如植物,例如大豆植物、玉米植物,并且可以经历如本文所述的修饰,此后,这种修饰的内源基因不再是野生型。
如本文所用,术语“杂合的”是指其中不同等位基因位于同源染色体上的相应基因座处的遗传状态。
如本文所用,术语“纯合的”是指其中相同等位基因位于同源染色体上的相应基因座处的遗传状态。
如本文所用,术语“等位基因”是指在特定基因座处出现的两个或更多个不同核苷酸或核苷酸序列之一。
“无效等位基因”是由基因突变引起的无功能等位基因,其导致相应蛋白质的产生完全缺乏或产生无功能的蛋白质。
“隐性突变”是基因中的当纯合时产生表型,但当基因座杂合时表型不可观察到的突变。
“显性突变”是基因中的在基因的非突变拷贝的存在下产生突变表型的突变。显性突变可以是功能丧失或功能获得突变、亚效等位基因突变、超等位基因突变或弱功能丧失或弱功能获得。
“显性负性突变”是产生改变的基因产物(例如,相对于野生型具有异常功能)的突变,该基因产物不利地影响野生型等位基因或基因产物的功能。例如,“显性负性突变”可以阻断野生型基因产物的功能。显性负性突变也可称为“反效等位基因突变”。
“半显性突变”是指杂合生物体中表型的外显率小于纯合生物体中观察到的表型外显率的突变。
“弱功能丧失突变”是导致基因产物与野生型基因产物相比具有部分功能或功能降低(部分失活)的突变。
“亚效等位突变”是导致基因功能部分丧失的突变,其可以通过表达减少(例如,蛋白质减少和/或RNA减少)或功能性能降低(例如,活性降低)而发生,但不是完全丧失功能/活性。“亚效”等位基因是由基因突变引起的半功能等位基因,其导致产生以正常效率的1%-99%之间的任何水平发挥作用的相应蛋白质。
“超等位基因突变”是导致基因产物的表达增加和/或基因产物的活性增加的突变。
“基因座”是染色体上基因或标记或等位基因所在的位置。在一些实施方案中,基因座可涵盖一个或多个核苷酸。
如本文所用,术语“所需等位基因”、“靶等位基因”和/或“感兴趣的等位基因”可互换使用以指与所需性状相关的等位基因。在一些实施方案中,所需等位基因可以与给定性状的增加或减少(相对于对照)相关,这取决于所需表型的性质。
当所述性状与标记连锁时,并且当该标记的存在是包含该标记的植物/种质中是否和/或以何种程度出现所需性状或性状形式的指示时,该标记与该性状“相关”。类似地,当标记与等位基因或染色体区间连锁并且当标记的存在是等位基因或染色体区间是否存在于包含标记的植物/种质中的指示时,该标记与该等位基因或染色体区间“相关”。
如本文所用,术语“回交(backcross和backcrossing)是指后代植物与其亲本之一杂交一次或多次(例如1、2、3、4、5、6、7、8次等)。在回交方案中,“供体”亲本是指具有要渗入的所需基因或基因座的亲本植物。“受体”亲本(使用一次或多次)或“轮回”亲本(使用两次或更多次)是指基因或基因座渗入其中的亲本植物。例如,参见Ragot,M.等人,Marker-assisted Backcrossing:A Practical Example,in TECHNIQUES ET UTILISATIONS DESMARQUEURS MOLECULAIRES LES COLLOQUES,Vol.72,第45-56页(1995);和Openshaw等人,Marker-assisted Selection in Backcross Breeding,in PROCEEDINGS OF THESYMPOSIUM"ANALYSIS OF MOLECULAR MARKER DATA,"第41-43页(1994)。初始的杂交产生F1代。术语“BC1”是指轮回亲本的第二次使用,“BC2”是指轮回亲本的第三次使用,依此类推。
如本文所用,术语“杂交(cross或crossed)”是指通过授粉的配子融合以产生后代(例如,细胞、种子或植物)。该术语涵盖有性杂交(一株植物通过另一株植物授粉)和自交(自花授粉,例如当花粉和胚珠来自同一植物时)。术语“杂交”是指通过授粉融合配子以产生后代的行为。
如本文所用,术语“基因渗入(introgression、introgressing和introgressed)”是指一个或多个遗传基因座的所需等位基因或所需等位基因的组合从一种遗传背景到另一种遗传背景的天然和人工传递。例如,特定基因座处的所需等位基因可以通过同一物种的两个亲本之间的有性杂交传递给至少一个(例如,一个或多个)后代,其中至少一个亲本在其基因中具有所需等位基因。备选地,例如,等位基因的传递可以通过两个供体基因组之间的重组而发生,例如在融合的原生质体中,其中至少一个供体原生质体在其基因组中具有所需的等位基因。所需的等位基因可以是标记、QTL、转基因等的选定等位基因。包含所需等位基因的后代可以与具有所需遗传背景的品系回交一次或多次(例如,1、2、3、4或更多次),选择所需等位基因,结果是所需等位基因固定在所需的遗传背景中。例如,与非水胁迫条件下增加的产量相关的标记可以从供体渗入到不包含该标记并且在非水胁迫条件下不表现出增加的产量的轮回亲本中。然后可以将所得后代回交一次或多次并进行选择,直到后代拥有与轮回亲本背景中非水胁迫条件下产量增加相关的遗传标记为止。
“遗传图谱”是对给定物种内一个或多个染色体上的基因座之间遗传连锁关系的描述,通常以图表或表格形式描绘。对于每个遗传图谱,基因座之间的距离是通过它们之间的重组频率来测量的。可以使用多种标记来检测基因座之间的重组。遗传图谱是做图群体、所用标记类型以及不同群体之间每个标记的多态性潜力的产物。基因座之间的顺序和遗传距离可以因遗传图谱而异。
如本文所用,术语“基因型”是指个体(或个体群体)在一个或多个遗传基因座处的遗传构成,与可观察和/或可检测和/或表现的性状(表型)形成对比。基因型是由个体从其亲本遗传的一个或多个已知基因座的等位基因定义的。术语基因型可用于指代个体在单个基因座、多个基因座处的遗传构成,或更一般地,术语基因型可用于指代个体基因组中所有基因的遗传组成。基因型可以例如使用标记间接表征和/或通过核酸测序直接表征。
如本文所用,术语“种质”是指个体(例如植物)、一组个体(例如植物品系、品种或科)或衍生自品系、品种、物种或栽培物的克隆的遗传物质或来自个体(例如植物)、一组个体(例如植物品系、品种或科)或衍生自品系、品种、物种或栽培物的克隆的遗传物质。种质可以是生物体或细胞的一部分或者可以与生物体或细胞分开。一般来说,种质提供具有特定遗传组成的遗传物质,为生物体或细胞培养物的部分或全部遗传品质提供基础。如本文所用,种质包括可生长新植物的细胞、种子或组织,以及可培养成完整植物的植物部分(例如叶、茎、芽、根、花粉、细胞等)。
如本文所用,术语“栽培品种”和“品种”是指通过结构或遗传特征和/或性能可与同一物种内的其他品种区分开的一组相似植物。
如本文所用,术语“外来”、“外来品系”和“外来种质”是指非良种的任何植物、品系或种质。一般而言,外来植物/种质并非源自任何已知的优良植物或种质,而是被选择以将一种或多种所需的遗传元件引入育种计划中(例如,将新的等位基因引入育种计划中)。
如本文所用,术语“杂种”在植物育种的背景下是指通过将不同品系或品种或物种的植物杂交产生的遗传上不同的亲本的后代的植物,包括但不限于两个自交系之间的杂交。
如本文所用,术语“近交”是指基本上纯合的植物或品种。该术语可以指在整个基因组中基本上纯合的植物或植物品种,或者关于特别感兴趣的基因组的一部分基本上纯合的植物或植物品种。
“单倍型”是个体在多个遗传基因座处的基因型,即等位基因的组合。通常,定义单倍型的遗传基因座在物理上和遗传上是连锁的,即在相同的染色体节段上。术语“单倍型”可以指特定基因座处的多态性,诸如单个标记基因座,或者沿着染色体节段的多个基因座处的多态性。
如本文所用,术语“异源”是指源自外来物种的核苷酸/多肽,或者如果源自相同物种,则是通过有意的人为干预在组成和/或基因组基因座上对其天然形式进行了实质性修饰的核苷酸/多肽。
其中至少一个(例如,一个或多个,例如,1、2、3或4个或更多个)内源性BRIl基因如本文所述被修饰(例如,包含如本文所述的修饰)的植物与在至少一个BRI1基因中不包含所述修饰的植物相比可以具有改善的产量性状。如本文所用,“改善的产量性状”是指与生长相关的任何植物性状,例如生物量、产量、氮利用效率(NUE)、花序大小/重量、果实产量、果实品质、果实大小、种子大小(例如,种子面积、种子大小)、种子数、叶组织重量、结瘤数、结瘤质量、结瘤活性、种穗数、分蘖数、分枝数、花数、块茎数、块茎质量、球茎质量、种子数量、种子总质量、叶出苗率、分蘖/分枝出苗率、幼苗出苗率、根长度、根数量、根群的大小和/或重量或其任意组合。因此,在一些方面,“改善的产量性状”可以包括但不限于与对照植物或其部分(例如,不包含突变的内源性BRI1核酸(例如,突变的BRI1基因)的植物)相比,增加的花序产量,增加的果实产量(例如,增加的果实的数量、重量和/或大小;例如,增加的穗的数量、重量和/或长度,例如对玉米来说),增加的果实质量,增加的根的数量、大小和/或重量,增加的分生组织大小,增加的种子大小(例如,种子面积和/或种子重量),增加的生物量,增加的叶大小,提高的氮利用效率,增加的高度,增加的节间数量和/或增加的节间长度。在一些实施方案中,改善的产量性状可以表示为每个土地面积生产的谷物数量(例如,每英亩土地的蒲式耳)。在一些实施方案中,一种或多种改善的产量性状可以指种子数量的增加。
如本文所用,“增加的种子大小”可以指面积增加的种子。在一些实施方案中,与来自对照植物(例如,不包含如本文所述的内源性BRI1基因中的突变的植物)的种子相比,种子的面积可增加高达约70%(例如,约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70%)。在一些实施方案中,与来自对照植物(例如,不包含如本文所述的内源性BRI1基因中的突变的植物)的种子相比,种子的重量可增加高达约50%(例如,约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50%)。在一些实施方案中,种子大小的增加可以包括种子面积和种子大小两者的增加。
如本文所用,“对照植物”是指不含有编辑的BRI1基因或如本文所述的赋予增强/改善的性状(例如,产量性状)或改变的表型的基因的植物。对照植物用于鉴定和选择如本文所述编辑的并且与对照植物相比具有增强的性状或改变的表型的植物。合适的对照植物可以是用于产生包含突变的BRI1基因的植物的亲本系的植物,例如,缺乏如本文所述的内源性BRI1基因中的编辑的野生型植物。合适的对照植物还可以是含有赋予其他性状的重组核酸的植物,例如,具有增强的除草剂耐受性的转基因植物。在一些情况下,合适的对照植物可以是缺乏如本文所述的突变的BRI1基因的杂合或半合转基因植物品系的后代,称为负分离体或负等基因系。
增强的性状(例如,改善的产量性状)可以包括,与对照植物相比,例如从种植到成熟的天数减少、增加的茎大小、增加的叶数、增加的营养阶段株高生长速率、增加的穗大小、增加的每株植物穗干重、增加的每穗籽粒数、增加的每籽粒重量、增加的每株籽粒数、减少的穗空、延长的灌浆期、降低的株高、增加的根分枝数量、增加的总根长、增加的产量、提高的氮利用效率和提高的水利用效率。改变的表型可以是,例如,株高、生物量、冠层面积、花青素含量、叶绿素含量、施用的水、含水量和水利用效率。
在一些实施方案中,本发明的植物可包含一种或多种改善的产量性状,包括但不限于,与不含突变的对照植物相比,更高的产量(蒲式耳/英亩)、增加的生物量、增加的株高、增加的茎直径、增加的叶面积、增加的花数、增加的籽粒行数(任选地其中穗长不显著减少)、增加的籽粒数、增加的籽粒大小、增加的穗长、减少的分蘖数、减少的雄穗分枝数、增加的荚果数量(包括每个节增加的荚果数量和/或每株植物增加的荚果数量)、每个荚果增加的种子数量、增加的种子数量、增加的种子大小和/或增加的种子重量(例如,增加的百粒种子重量)。在一些实施方案中,本发明的植物可以包含一种或多种改善的产量性状,包括但不限于,增加的籽粒行数(其中穗长度没有显著减少)、增加的穗长、增加的荚果数量和/或增加的种子数量。
如本文所用,“性状”是植物或特定植物材料或细胞的生理学、形态学、生物化学或物理特征。在一些情况下,该特征是人眼可见的并且可以机械地测量,诸如种子或植物的大小、重量、形状、形式、长度、高度、生长速率和发育阶段,或者可以通过生物化学技术测量,诸如检测种子或叶的蛋白质、淀粉、某些代谢物或油含量,或通过观察代谢或生理过程,例如,通过测量对缺水或特定盐或糖浓度的耐受性,或通过测量一个或多个基因的表达水平,例如,通过采用Northern分析、RT-PCR、微阵列基因表达阵列或报告基因表达系统,或通过农业观察诸如高渗胁迫耐受性或产量。然而,任何技术都可以用来测量转基因植物中任何选定的化学化合物或大分子的量、比较水平或差异。
如本文所用,“增强的性状”是指由如本文所述的BRI1基因中的突变引起的植物特征。此类性状包括但不限于,增强的农艺性状,其特征在于增强的植物形态学、生理学、生长和发育、产量、营养增强、病害或害虫抗性、或环境或化学耐受性。在一些实施方案中,增强的性状/改变的表型可以是,例如,从种植到成熟的天数减少、增加的茎大小、增加的叶数、增加的营养阶段株高生长速率、增加的穗大小、增加的每株植物穗干重、增加的每穗籽粒数、增加的每籽粒重量、增加的每株植物籽粒数、减少的穗空、延长的灌浆期、降低的株高、增加的根分枝数量、增加的总根长、耐旱性、提高的水利用效率、耐寒性、提高的氮利用效率和增加的产量。在一些实施方案中,性状是在非胁迫条件下增加的产量或在环境胁迫条件下增加的产量。胁迫条件可包括生物胁迫和非生物胁迫,例如,干旱、荫蔽、真菌病、病毒病、细菌病、昆虫侵扰、线虫侵扰、低温暴露、热暴露、渗透胁迫、氮养分利用度降低、磷养分利用度降低和高植株密度。“产量”可以受到许多特性的影响,包括但不限于株高、植物生物量、荚果数、植株上的荚果位置、节间数、荚果破碎的发生率、谷粒大小、穗大小、穗尖充盈度、籽粒败育、结瘤和固氮效率、养分同化效率、生物和非生物胁迫抗性、碳同化、植物结构、抗倒伏性、种子发芽率、幼苗活力和子苗性状。产量还可能受到以下因素的影响:发芽效率(包括胁迫条件下的发芽)、生长速率(包括胁迫条件下的生长速率)、开花时间和持续时间、穗数、穗大小、穗重量、每穗或荚果的种子数、种子大小、种子的成分(淀粉、油、蛋白质)和种子饱满的特征。
还如本文所用,术语“性状修饰”涵盖通过在包含如本文所述的内源性BRI1基因中的突变的植物中相对于不包含该突变的植物(诸如野生植型物,或负分离体)产生可检测到的特征差异来改变天然存在的性状。在某些情况下,可以定量评估性状修饰。例如,与对照植物相比,性状修饰可以导致观察到的性状特征或表型的增加或减少。众所周知,在经过修饰的性状中可以存在自然变异。因此,与对照植物相比,观察到的性状修饰导致植物中性状特征或表型的正态分布和幅度的变化。
本公开涉及具有改善的经济相关特性、更具体地增加的产量的植物。更具体地,本公开涉及包含如本文所述的一个或多个BRI1基因中的突变的植物,其中所述植物与缺乏所述突变的对照植物相比具有增加的产量。在一些实施方案中,如本文所述产生的植物与对照植物相比表现出增加的产量或改善的产量性状成分。在一些实施方案中,本公开的植物表现出与产量相关的改善的性状,包括但不限于,提高的氮利用效率、增加的氮胁迫耐受性、提高的水利用效率和增加的耐旱性,如下文所定义和讨论的。
产量可以定义为作物的可测量的农产品经济价值。产量可以在数量和/或质量的范围内定义。产量可以直接取决于几个因素,例如器官的数量和大小、植物结构(诸如分枝的数量、植物生物量,例如增加的根生物量、更陡的根角和/或更长的根等)、开花时间和持续时间、灌浆期。根系结构和发育、光合效率、养分吸收、胁迫耐受性、早期活力、延迟衰老和功能性滞绿表型可能是决定产量的因素。因此,优化上述因素有助于提高作物产量。
本文提及的产量相关性状的增加/改善也可以被认为是指植物的一个或多个部分的生物量(重量)的增加,其可以包括地上和/或地下(可收获)植物部分。具体地,此类可收获部分是种子,并且本公开的方法的实施导致相对于合适的对照植物的种子产量具有增加的产量、特别是增加的种子产量的植物。术语植物的“产量”可以涉及该植物的营养生物量(根和/或枝条生物量)、繁殖器官和/或繁殖体(诸如种子)。
本公开的植物增加的产量可以通过多种方式测量,包括测试重量、每株植物的种子数、种子重量、每单位面积的种子数(例如,每英亩的种子或种子的重量)、每英亩蒲式耳数、每英亩吨数或每公顷公斤数。增加的产量可以通过改善关键生化化合物(诸如氮、磷和碳水化合物)的利用,或改善对环境胁迫(诸如冷、热、干旱、盐、荫蔽、高植物密度以及害虫或病原体攻击)的反应来实现。
“增加的产量”可以表现为以下一种或多种:(i)植物的一个或多个部分,特别是植物的地上(可收获)部分的增加的植物生物量(重量),增加的根生物量(增加的根数、增加根厚度、增加根长度)或增加的任何其他可收获部分的生物量;或(ii)增加的早期活力,本文定义为发芽后约三周的幼苗地上面积的提高。
“早期活力”是指活跃健康的植物生长,尤其是在植物生长的早期阶段,并且可以由于例如植物更好地适应其环境(例如,优化对能源的利用、对养分的吸收以及在芽和根之间分配碳)引起的植物适应度增加产生。例如,早期活力可以是种子在种植后发芽和出苗的能力以及幼苗在出苗后生长和发育的能力的组合。具有早期活力的植物还表现出增加的幼苗存活率和更好的作物种植,这通常导致高度均匀的田地,其中大多数植物基本上同时达到各个发育阶段,这通常导致产量增加。因此,早期活力可以通过测量各种因素来确定,诸如籽粒重量、发芽率、出苗率、幼苗生长、幼苗高度、根长、根和芽生物量、冠层大小和颜色等。
此外,增加的产量还可以表现为增加的总种子产量,这可以由于下列中的一种或多种所致:由于基于每株植物和/或单个种子的种子重量的增加所致的种子生物量(种子重量)的增加,例如,每株植物的花/圆锥花序数量增加;荚果数量增加;节数量增加;每个圆锥花序/植物的花(“小花”)数量增加;种子饱满率提高;饱满种子的数量增加;种子大小(长度、宽度、面积、周长和/或重量)的增加,这也会影响种子的组成;和/或种子体积增加,这也会影响种子的组成。在一个实施方案中,增加的产量可以是增加的种子产量,例如,增加的种子重量;增加的饱满种子数量;和增加的收获指数。
产量的增加还可以导致结构改变,或者可以由于植物结构改变而发生。
产量的增加也可以表现为收获指数的增加,收获指数表示为可收获部分(诸如种子)的产量与总生物量的比率。
本公开还延伸至植物的可收获部分,诸如但不限于种子、叶、果实、花、棉铃、荚果、长角果、坚果、茎、根茎、块茎和球茎。本公开还涉及源自此类植物的可收获部分的产品,诸如干颗粒、粉末、油、脂肪和脂肪酸、淀粉或蛋白质。
本公开提供了用于增加植物的“产量”或植物或植物部分的“泛英亩产量(broadacre yield)”的方法,其被定义为每单位面积可收获的植物部分,例如种子,或种子的重量,每英亩,每英亩磅数、每英亩蒲式耳数、每英亩吨数(tones per acre)、每英亩吨数、每公顷公斤数。
如本文所用,“氮利用效率”是指导致施用的每单位氮的植物产量、生物量、活力和生长速率增加的过程。这些过程可以包括植物对氮的吸收、同化、积累、信号传导、传感、再转移(在植物内)和利用。
如本文所用,“提高的氮利用效率”是指在经受与正常或标准条件下相同的可利用/施用量的氮时,植物比正常情况更快或更好地生长、发育或产出的能力;在经受低于最适的可利用/施用量的氮,或在氮限制条件下植物正常生长、发育或产出的能力,或更快或更好地生长、发育或产出的能力。
如本文所用,“氮限制条件”是指提供低于植物充分或成功的代谢、生长、繁殖成功和/或存活所需的最适氮量的生长条件或环境。
如本文所用,“增加的氮胁迫耐受性”是指在经受低于最适的可利用/施用量的氮时,或在氮限制条件下植物正常生长、发育或产出的能力,或更快或更好地生长、发育或产出的能力。
植物氮利用效率的提高可以在田间转化为在供应较少的氮的同时收获相似数量的产量,或者通过供应最适/足够量的氮来获得增加的产量。提高的氮利用效率可以提高植物氮胁迫耐受性,还可以改善作物品质和种子的生化成分,诸如蛋白质产量和油产量。术语“增加的氮利用效率”、“提高的氮利用效率”和“氮胁迫耐受性”在本公开中可互换使用,是指在氮限制条件下具有提高的生产力的植物。
如本文所用,“水利用效率”是指每单位蒸腾的水蒸气被叶子同化的二氧化碳的量。它是控制干燥环境中植物生产力的最重要性状之一。“耐旱性”是指植物适应干旱或干旱条件的程度。植物对缺水的生理反应包括叶子枯萎、叶面积减小、叶离现象以及通过将养分引导到植物的地下部分来刺激根部生长。通常,植物在开花和种子发育(繁殖阶段)期间更容易受到干旱的影响,因为植物的资源被用来支持根系生长。此外,脱落酸(ABA)是一种植物应激激素,诱导叶片气孔(参与气体交换的微孔)关闭,从而减少蒸腾作用造成的水分损失,并降低光合作用速率。这些反应在短期内提高了植物的水利用效率。术语“增加的水利用效率”、“提高的水利用效率”和“增加的耐旱性”在本公开中可互换使用,是指在水限制条件下具有提高的生产力的植物。
如本文所用,“增加的水利用效率”是指在经受与正常或标准条件下相同的可利用/施用量的水时,植物比正常情况更快或更好地生长、发育或产出的能力;在经受减少的可利用/施用量的水(水输入)时,或在水分胁迫或缺水胁迫的条件下植物正常生长、发育或产出的能力,或更快或更好地生长、发育或产出的能力。
如本文所用,“增强的耐旱性”是指在经受减少的可利用/施用量的水和/或在短期或长期干旱的条件下,植物正常生长、发育或产出的能力,或者比正常情况更快或更好地生长、发育或产出的能力;在经受减少的可利用/施用量的水(水输入)时,或在缺水胁迫的条件下或短期或长期干旱的条件下植物正常生长、发育或产出的能力。
如本文所用,“干旱胁迫”是指导致缺水并使植物受到胁迫和/或对植物组织造成损害和/或对谷物/作物产量产生负面影响的干旱期(短期或长期/延长);导致缺水和/或温度升高并使植物受到胁迫和/或对植物组织造成损害和/或对谷物/作物产量产生负面影响的干旱期(短期或长期/延长)。
如本文所用,“缺水”是指提供低于植物充分/成功的生长和发育所需的最适水量的条件或环境。
如本文所用,“水分胁迫”是指提供相对于植物/作物充分/成功的生长和发育所需的水量不适当(较少/不足或更多/过量)的水量的条件或环境,从而使植物受到胁迫和/或对植物组织造成损害和/或对谷物/作物产量产生负面影响。
如本文所用,“缺水胁迫”是指提供相对于植物/作物充分/成功的生长和发育所需的水量较少/不足的水量的条件或环境,从而使植物受到胁迫和/或对植物组织造成损害和/或对谷物产量产生负面影响。
如本文所用,术语“核酸”、“核酸分子”、“核苷酸序列”和“多核苷酸”是指线性或支链、单链或双链的RNA或DNA,或其杂交体。该术语还涵盖RNA/DNA杂交体。当合成产生dsRNA时,不太常见的碱基,诸如肌苷、5-甲基胞嘧啶、6-甲基腺嘌呤、次黄嘌呤等也可用于反义、dsRNA和核酶配对。例如,含有尿苷和胞苷的C-5丙炔类似物的多核苷酸已被证明以高亲和力结合RNA,并且是基因表达的有效反义抑制剂。也可以进行其他修饰,诸如对磷酸二酯骨架或RNA核糖基团中的2'-羟基的修饰。
如本文所用,术语“核苷酸序列”是指核苷酸的异聚物或这些核苷酸从核酸分子的5'至3'端的序列,包括DNA或RNA分子,包括cDNA、DNA片段或部分、基因组DNA、合成(例如化学合成)DNA、质粒DNA、mRNA和反义RNA,其中任何一个都可以是单链或双链。术语“核苷酸序列”、“核酸”、“核酸分子”、“核酸构建体”、“寡核苷酸”和“多核苷酸”在本文中也可互换使用,以指代核苷酸的异聚物。本文提供的核酸分子和/或核苷酸序列在此从左到右以5'至3'方向呈现,并使用美国序列规则37CFR§§1.821-1.825中规定的用于表示核苷酸字符的标准代码和世界知识产权组织(WIPO)标准ST.25表示。本文中使用的“5'区域”可以表示最接近多核苷酸5'端的多核苷酸区域。因此,例如,多核苷酸5'区域中的元素可以位于从位于多核苷酸5'端的第一个核苷酸到位于多核苷酸中间的核苷酸的任何位置。如本文中使用的“3'区域”可以表示最接近多核苷酸3'端的多核苷酸区域。因此,例如,多核苷酸3'区域中的元素可以位于从位于多核苷酸3'端的第一个核苷酸到位于多核苷酸中间的核苷酸的任何位置。
如本文所用。关于核酸,术语“片段”或“部分”是指相对于参考核酸长度减少的核酸(例如,减少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、20、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、400、450、500、550、600、650、700、750、800、850或900个或更多个核苷酸或其中的任何范围或值),并且包含下列序列,或基本上由下列序列组成和/或由下列序列组成:与参考核酸的对应部分相同或几乎相同(例如,70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同)的连续核苷酸的核苷酸序列。在适当情况下,这种核酸片段可以包含在较大的多核苷酸中,所述核酸片段是所述较大的多核苷酸的组成部分。作为示例,本发明的向导核酸的重复序列可以包括野生型CRISPR-Cas重复序列的“部分”(例如,野生型CRISPR-Cas重复序列;例如,来自CRISPR Cas系统的重复序列,例如,Cas9、Cas12a(Cpf1)、Cas12b、Cas12c(C2c3)、Cas12d(CasY)、Cas12e(CasX)、Cas12g、Cas12h、Cas12i、C2c4、C2c5、C2c8、C2c9、C2c10、Cas14a、Cas14b和/或Cas14c等。
在一些实施方案中,核酸片段或部分可以包含下列连续核苷酸、基本上由下列连续核苷酸组成或由下列核苷酸组成:编码BRI1多肽的核酸的约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、285、290、300、310、320、330、340、350、360、370、380、390、395、396、397、398、399、400、410、411、412、413、414、415、420、425、430、435、440、445、450或500个或更多个连续核苷酸,或其中的任何范围或值,任选地BRI1基因的片段的长度可以是约5、6、7、8、9或10个连续核苷酸至约300、320、350、375、400个或更多个连续核苷酸,可以是约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个连续核苷酸至约30、35、40、45、50、55、60、65、70、75、80、85、90、95或100个连续核苷酸,或约80、85、90、95或100个连续核苷酸至约150、155、160、165、170、175、180、185、190、195、200、205、210、215、220、225、230或更多个连续核苷酸,或其中的任何范围或值(例如,SEQ IDNO:69、70、85、86、99、100、112、113、123或124中任一个的片段或部分(例如,SEQ ID NO:72-76、89-94、102-106、115-118或126-130))。
在一些实施方案中,“序列特异性核酸结合结构域”可以结合到编码例如本文所述的BRI1多肽的核苷酸序列(例如,DNA、RNA)的一个或多个片段或部分。
如本文所用,关于多肽,术语“片段”或“部分”可以指相对于参考多肽长度减少的多肽,并且包含下列氨基酸序列,基本上由下列氨基酸序列组成和/或由下列氨基酸序列组成:与参考多肽的对应部分相同或几乎相同(例如,90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同)的连续氨基酸的氨基酸序列。在适当情况下,这种多肽片段可以包含在较大的多肽中,所述多肽片段是所述较大的多肽的组成部分。在一些实施方案中,多肽片段可以包含下列连续氨基酸,基本上由下列连续氨基酸组成或由下列连续氨基酸组成:参考多肽的至少约2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200、225、250、260、270、280或290个或更多个连续氨基酸。在一些实施方案中,多肽片段可以包含下列连续氨基酸残基,基本上由下列连续氨基酸残基组成或由下列连续氨基酸残基组成:BRI1多肽的约10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100个或更多个连续氨基酸残基,或其中的任何范围或值(例如,SEQ ID NO:71、87、88、101、114或125的片段或部分(例如,SEQ ID NO:77-81、95-98、107-111、119-122或131-135))。
在一些实施方案中,核酸中的“部分”是指来自基因的至少2、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、120、130、140、141、142、143、144、145、150、160、170、180、190、200、210、220、221、222、223、224、225、230、240、250、260、270、280、285、290、300、310、320、330、340、350、360、370、380、390、395、396、397、398、399、400、401、402、403、404、405、406、407、408、409、410、411、412、413、414、415、416、417、418、419、420、425、430、435、440、445、450或500个或更多个连续核苷酸(例如,来自BRI1基因的连续核苷酸)(例如,SEQ ID NO:69、70、85、86、99、100、112、113、123或124中任一个的片段或部分(例如,SEQ ID NO:72-76、89-94、102-106、115-118或126-130))。
在一些实施方案中,BRI1多肽序列的部分或片段的长度可以是约10至约100个或更多个连续氨基酸残基(例如,约10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100个或更多个连续氨基酸残基(例如,SEQ ID NO:71、87、88、101、114或125中任一个的部分(例如,SEQ ID NO:77-81、95-98、107-111、119-122或131-135))。
如本文所用,关于核酸,术语“功能片段”是指编码多肽的功能片段的核酸。关于多肽,“功能片段”是保留了天然参考多肽的一种或多种活性的多肽片段。
如本文所用,术语“基因”是指能够用于产生mRNA、反义RNA、miRNA、抗微小RNA反义寡脱氧核糖核苷酸(AMO)等的核酸分子。基因可以或不可以能够用于产生功能性蛋白质或基因产物。基因可以包括编码区和非编码区(例如,内含子、调控元件、启动子、增强子、终止序列和/或5'和3'非翻译区)两者。基因可以是“分离的”,这意味着基本上或实质上不含通常与天然状态的核酸相关的组分的核酸。这些组分包括其他细胞材料、来自重组生产的培养基和/或用于化学合成核酸的各种化学品。
术语“突变”是指点突变(例如,错义或无义,或导致移码的单个碱基对的插入或缺失)、插入、缺失、反转和/或截短。当突变是氨基酸序列中的一个残基被另一个残基置换,或者序列中的一个或多个残基的缺失或插入时,突变通常通过指明原始残基、然后指明残基在序列中的位置以及指明新置换的残基的身份来描述。截短可以包括在多肽的C-末端或多肽的N-末端的截短。多肽的截短可以是编码多肽的基因的相应5'端或3'端缺失的结果。当一个或多个碱基对的缺失或插入被引入基因时,可以发生移码突变,任选地导致框外突变或框内突变。基因中的移码突变可以导致产生比野生型多肽更长、更短或相同长度的多肽,取决于第一个终止密码子何时出现在基因突变区域之后。作为实例,产生过早终止密码子的框外突变可以产生比野生型多肽短的多肽,或者,在一些实施方案中,多肽可以不存在/检测不到。在一些实施方案中,突变可以是DNA倒位,任选地是具有长度为约10至约2000个连续碱基对的DNA倒位。
如本文所用,术语“互补的”或“互补性”是指多核苷酸在允许的盐和温度条件下通过碱基配对的天然结合。例如,序列“A-G-T”(5'至3')与互补序列“T-C-A”(3'至5')结合。两个单链分子之间的互补性可以是“部分的”,其中只有一些核苷酸结合,或者当单链分子之间存在完全互补性时,它可以是完全的。核酸链之间的互补程度对核酸链之间的杂交效率和强度有显著影响。
如本文所用,“互补体”可以表示与比较核苷酸序列的100%互补性,或者它可以表示与比较核苷酸序列的互补性小于100%(例如,约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%等互补性)。
具有同源性的不同核酸或蛋白质在本文中称为“同源物”。术语同源物包括来自同一物种和其他物种的同源序列以及来自同一物种和其他物种的直系同源序列。“同源性”是指两个或更多个核酸和/或氨基酸序列之间的相似程度,以位置同一性(即序列相似性或同一性)的百分比表示。同源性也指不同核酸或蛋白质之间具有相似功能特性的概念。因此,本发明的组合物和方法还包括本发明的核苷酸序列和多肽序列的同源物。如本文所用,“直系同源”是指不同物种中的同源核苷酸序列和/或氨基酸序列,这些序列在物种形成过程中产生于共同的祖先基因。本发明的核苷酸序列的同源物与本发明的所述核苷酸序列具有实质性的序列同一性(例如,至少约70%、71%、72%、73%、74%、75%、76%、77%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或100%)。
如本文所用,“序列同一性”是指两个最佳比对的多核苷酸或多肽序列在整个组分(例如核苷酸或氨基酸)比对窗中不变的程度。“同一性”可以很容易地通过已知的方法计算,包括但不限于以下方法:Computational Molecular Biology(Lesk,A.M.编辑)OxfordUniversity Press,New York(1988);Biocomputing:Informatics and Genome Projects(Smith,D.W.编辑)Academic Press,New York(1993);Computer Analysis of SequenceData,Part I(Griffin,A.M.和Griffin,H.G.编辑)Humana Press,New Jersey(1994);Sequence Analysis in Molecular Biology(von Heinje,G.编辑)Academic Press(1987);和Sequence Analysis Primer(Gribskov,M.和Devereux,J.编辑)StocktonPress,New York(1991)。
如本文所用,术语“百分比序列同一性”或“百分比同一性”是指当两个序列最佳比对时,与测试(“对象”)多核苷酸分子(或其互补链)相比,参考(“查询”)多核苷酸分子(或其互补链)的线性多核苷酸序列中相同核苷酸的百分比。在一些实施方案中,“百分比序列同一性”可以指与参考多肽相比,氨基酸序列中相同氨基酸的百分比。
如本文所用,短语“基本上相同”或“实质同一性”在两个核酸分子、核苷酸序列或多肽序列的上下文中,是指两个或更多个序列或子序列,当比较和比对最大对应关系时,使用以下序列比较算法之一或目视检查进行测量,其具有至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或100%的核苷酸或氨基酸残基同一性。在本发明的一些实施方案中,在本发明的核苷酸序列的连续核苷酸区域存在实质同一性,所述区域的长度为约10个核苷酸至约20个核苷酸,约10个核苷酸至约25个核苷酸,约10个核苷酸至约30个核苷酸,约15个核苷酸至约25个核苷酸,约30个核苷酸至约40个核苷酸,约50个核苷酸至约60个核苷酸,约70个核苷酸至约80个核苷酸,约90个核苷酸至约100个核苷酸,约100个核苷酸至约200个核苷酸,约100个核苷酸至约300个核苷酸,约100个核苷酸至约400个核苷酸,约100个核苷酸至约500个核苷酸,约100个核苷酸至约600个核苷酸,约100个核苷酸至约800个核苷酸,约100个核苷酸至约900个核苷酸,或更多个核苷酸,或其中的任何范围,至多达全长序列。在一些实施方案中,在至少约20个核苷酸(例如,约20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、50、60、70或80个核苷酸或更多个核苷酸)的范围内核苷酸序列可以是基本上相同的。
在本发明的一些实施方案中,在本发明的多肽的连续氨基酸残基区域存在实质同一性,所述区域的长度为约3个氨基酸残基至约20个氨基酸残基,约5个氨基酸残基至约25个氨基酸残基,约7个氨基酸残基至约30个氨基酸残基,约10个氨基酸残基至约25个氨基酸残基,约15个氨基酸残基至约30个氨基酸残基,约20个氨基酸残基至约40个氨基酸残基,约25个氨基酸残基至约40个氨基酸残基,约25个氨基酸残基至约50个氨基酸残基,约30个氨基酸残基至约50个氨基酸残基,约40个氨基酸残基至约50个氨基酸残基,约40个氨基酸残基至约70个氨基酸残基,约50个氨基酸残基至约70个氨基酸残基,约60个氨基酸残基至约80个氨基酸残基,约70个氨基酸残基至约80个氨基酸残基,约90个氨基酸残基至约100个氨基酸残基,或更多个氨基酸残基,以及其中的任何范围,至多达全长序列。在一些实施方案中,多肽序列可以在至少约8个连续氨基酸残基(例如,长度为约8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、130、140、150、175、200、225、250、300、350个或更多个氨基酸或更多个连续氨基酸残基)的范围与另一个序列基本上相同。在一些实施方案中,两个或更多个BRI1多肽可以在至少10个氨基酸至约350个氨基酸或更多个氨基酸的范围内相同或基本上相同(例如,至少70%至99.9%相同;例如,约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.9%相同,或其中的任何范围或值)。
对于序列比较,通常一个序列充当与测试序列比较的参考序列。当使用序列比较算法时,将测试序列和参考序列输入计算机,必要时指定子序列坐标,并指定序列算法程序参数。然后,序列比较算法根据指定的程序参数计算测试序列相对于参考序列的序列同一性百分比。
用于比对比较窗口的序列最佳比对是本领域技术人员所熟知的,并且可以通过诸如Smith和Waterman的局部同源算法,Needleman和Wunsch的同源比对算法,Pearson和Lipman的相似性搜索方法等工具进行,并且任选地通过这些算法的计算机化形式来实施,诸如GAP、BESTFIT、FASTA和TFASTA,它们可作为Wisconsin/>(AccelrysInc.,San Diego,CA)的一部分获得。用于测试序列和参考序列的比对节段的“同一性分数”是两个比对序列共享的相同组分的数量除以参考序列节段(例如,整个参考序列或参考序列的较小定义部分)中的组分总数。百分比序列同一性表示为同一性分数乘以100。一个或多个多核苷酸序列的比较可以是全长多核苷酸序列或其部分,或者是较长的多核苷酸序列。就本发明的目的而言,还可以使用BLASTX 2.0版为翻译的核苷酸序列确定“百分比同一性”,以及使用BLASTN 2.0版为多核苷酸序列确定“百分比同一性”。
当两个核苷酸序列在严格条件下彼此杂交时,也可以认为这两个核苷酸序列基本上是互补的。在一些实施方案中,被认为基本上互补的两个核苷酸序列在高度严格的条件下彼此杂交。
在核酸杂交实验(诸如Southern和Northern杂交)的背景下,“严格杂交条件”和“严格杂交洗涤条件”是序列依赖性的,并且在不同的环境参数下是不同的。在TijssenLaboratory Techniques in Biochemistry and Molecular Biology-Hybridizationwith Nucleic Acid Probes part I chapter 2"Overview of principles ofhybridization and the strategy of nucleic acid probe assays"Elsevier,New York(1993)中提供了有关核酸杂交的广泛指南。通常,高度严格的杂交和洗涤条件选择为,在规定的离子强度和pH值下,比具体序列的解链温度(Tm)低约5℃。
Tm是50%靶序列与完美匹配的探针杂交时的温度(在规定的离子强度和pH值下)。非常严格的条件选择为等于特定探针的Tm。在Southern或Northern印迹中,具有超过100个互补残基的互补核苷酸序列在滤器上杂交的严格杂交条件的实例是50%甲酰胺与1mg肝素在42℃,杂交过夜。高度严格的洗涤条件的实例是0.1 5M NaCl在72℃约15分钟。严格洗涤条件的实例是在65℃用0.2x SSC洗涤15分钟(对于SSC缓冲液的描述,参见Sambrook,同前所述)。通常,在进行高度严格清洗之前,先进行低严格清洗,以去除背景探针信号。例如,超过100个核苷酸的双联体的中等严格洗涤的实例是在45℃1x SSC 15分钟。例如,超过100个核苷酸的双联体的低严格洗涤的实例是在40℃4-6x SSC 15分钟。对于短探针(例如,约10个至50个核苷酸),严格的条件通常涉及低于约1.0M Na离子的盐浓度,通常约0.01至1.0MNa离子浓度(或其他盐)在pH 7.0至8.3,温度通常至少为约30℃。通过添加诸如甲酰胺等去稳定剂也可以达到严格的条件。通常,在特定的杂交测定中,为对不相关探针观察到的信噪比2倍(或更高)的信噪比表明检测到特异性杂交。如果核苷酸序列编码的蛋白质基本相同,则在严格条件下彼此不杂交的核苷酸序列仍然基本相同。例如,当使用遗传密码允许的最大密码子简并性生成核苷酸序列的拷贝时,就会发生这种情况。
本发明的多核苷酸和/或重组核酸构建体(例如,表达盒和/或载体)可以针对表达进行密码子优化。在一些实施方案中,本发明的编辑系统的多核苷酸、核酸构建体、表达盒和/或载体(例如,包含/编码序列特异性核酸结合结构域(例如,来自以下的序列特异性核酸结合结构域(例如DNA结合结构域):多核苷酸引导的核酸内切酶、锌指核酸酶、转录激活因子样效应物核酸酶(TALEN)、Argonaute蛋白和/或CRISPR-Cas核酸内切酶(例如,CRISPR-Cas效应蛋白)(例如,I型CRISPR-Cas效应蛋白、II型CRISPR-Cas效应蛋白、III型CRISPR-Cas效应蛋白、IV型CRISPR-Cas效应蛋白、V型CRISPR-Cas效应蛋白或VI型CRISPR-Cas效应蛋白)),核酸酶(例如,核酸内切酶(例如,Fok1),多核苷酸引导的核酸内切酶,CRISPR-Cas核酸内切酶(例如,CRISPR-Cas效应蛋白),锌指核酸酶和/或转录激活因子样效应物核酸酶(TALEN)),脱氨酶蛋白/结构域(例如,腺嘌呤脱氨酶,胞嘧啶脱氨酶),编码逆转录酶蛋白或结构域的多核苷酸,编码5'-3'核酸外切酶多肽的多核苷酸,和/或亲和多肽,肽标签等)可以对植物中的表达进行密码子优化。在一些实施方案中,本发明的密码子优化的核酸、多核苷酸、表达盒和/或载体与没有进行密码子优化的参考核酸、多核苷酸、表达盒和/或载体具有约70%至约99.9%(例如,70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.9%或100%)或更高的同一性。
在本文描述的任何实施方案中,本发明的多核苷酸或核酸构建体可以与多种启动子和/或其它调节元件可操作缔合以用于在植物和/或植物细胞中表达。因此,在一些实施方案中,本发明的多核苷酸或核酸构建体还可以包含与一个或多个核苷酸序列可操作连接的一个或多个启动子、内含子、增强子和/或终止子。在一些实施方案中,启动子可以与内含子可操作地缔合(例如,Ubi1启动子和内含子)。在一些实施方案中,与内含子缔合的启动子可以被称为“启动子区域”(例如,Ubi1启动子和内含子)。
如本文所用,提及多核苷酸时“可操作地连接”或“可操作地缔合”,意指所指示的元件在功能上彼此相关,并且通常也在物理上相关。因此,如本文所用的术语“可操作地连接”或“可操作地缔合”是指单个核酸分子上功能上关联的核苷酸序列。因此,可操作地连接到第二核苷酸序列的第一核苷酸序列意指第一核苷酸序列以与第二核苷酸序列功能相关的关系进行定位的情形。例如,如果启动子影响所述核苷酸序列的转录或表达,则启动子与该核苷酸序列可操作地缔合。本领域技术人员将理解,控制序列(例如,启动子)不必和与其可操作地缔合的核苷酸序列相邻,只要控制序列的功能是指导其表达即可。因此,例如,启动子和核苷酸序列之间可以存在介于中间的未翻译但转录的核酸序列,并且启动子仍可被视为与核苷酸序列“可操作地连接”。
如本文所用,在提及多肽时,术语“连接”是指一个多肽与另一个多肽的连接。多肽可以直接(例如,通过肽键)或通过接头与另一个多肽(在N-端或C-端)连接。
术语“接头”是本领域公认的,是指连接两个分子或部分的化学基团或分子,所述两个分子或部分例如融合蛋白的两个结构域,诸如,例如,核酸结合多肽或结构域和肽标签和/或逆转录酶和与肽标签结合的亲和多肽;或DNA核酸内切酶多肽或结构域和肽标签和/或逆转录酶和与肽标签结合的亲和多肽。接头可以由单个连接分子组成,或可以包含多个连接分子。在一些实施方案中,接头可以是有机分子、基团、聚合物或化学部分,诸如二价有机部分。在一些实施方案中,接头可以是氨基酸,或者也可以是肽。在一些实施方案中,接头是肽。
在一些实施方案中,可用于本发明的肽接头可以是约2至约100个或更多个氨基酸的长度,例如,约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100个或更多个氨基酸的长度(例如,约2至约40、约2至约50、约2至约60、约4至约40、约4至约50、约4至约60、约5至约40、约5至约50、约5至约60、约9至约40、约9至约50、约9至约60、约10至约40、约10至约50、约10至约60,或约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25个氨基酸至约26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100个或更多个氨基酸的长度(例如,约105、110、115、120、130、140、150个或更多个氨基酸的长度)。在一些实施方案中,肽接头可以是GS接头。
如本文所用,在提及多核苷酸时,术语“连接”或“融合”是指一个多核苷酸与另一个多核苷酸的连接。在一些实施方案中,两个或更多个多核苷酸分子可以通过接头连接,接头可以是有机分子、基团、聚合物或化学部分,诸如二价有机部分。多核苷酸可以通过共价或非共价键或结合与另一个多核苷酸(在5'端或3'端)连接或融合,包括例如通过Watson-Crick碱基配对或通过一个或多个连接核苷酸连接或融合。在一些实施方案中,某种结构的多核苷酸基序可以插入到另一个多核苷酸序列中(例如,向导RNA中发夹结构的延伸)。在一些实施方案中,连接核苷酸可以是天然存在的核苷酸。在一些实施方案中,连接核苷酸可以是非天然的核苷酸。
“启动子”是控制或调节与启动子可操作地缔合的核苷酸序列(例如,编码序列)转录的核苷酸序列。由启动子控制或调节的编码序列可以编码多肽和/或功能性RNA。通常,“启动子”是指包含RNA聚合酶II的结合位点并指导转录起始的核苷酸序列。通常,启动子位于相对于对应编码序列的编码区起点的5'或上游。启动子可以包含作为基因表达调节物的其他元件;例如,启动子区。这些包括TATA盒共有序列,通常还包括CAAT盒共有序列(Breathnach和Chambon,(1981)Annu.Rev.Biochem.50:349)。在植物中,CAAT盒可以被AGGA盒替代(Messing等人,(1983)在Genetic Engineering of Plants中,T.Kosuge,C.Meredith和A.Hollaender(编辑),Plenum Press,第211-227页)。
可用于本发明的启动子可以包括,例如,组成性、诱导性、时间调控性、发育调控性、化学调控性、组织偏好性和/或组织特异性的启动子,用于制备重组核酸分子,例如,“合成核酸构建体”或“蛋白质-RNA复合物”。这些不同类型的启动子是本领域已知的。
对启动子的选择可以因表达的时间和空间要求而异,也可以因要转化的宿主细胞而异。许多不同生物体的启动子在本领域是众所周知的。基于本领域存在的广泛知识,可以为感兴趣的特定宿主生物体选择适当的启动子。因此,例如,模式生物体中高度组成性表达的基因上游的启动子是已知的,并且这些知识可以很容易地获得,并酌情在其他系统中实施。
在一些实施方案中,在植物中有功能的启动子可以与本发明的构建体一起使用。可用于驱动在植物中表达的启动子的非限制性实例包括RubisCo小亚基基因1的启动子(PrbcS1)、肌动蛋白基因的启动子(Pactin)、硝酸还原酶基因的启动子(Pnr)和双拷贝碳酸酐酶基因1的启动子(Pdca1)(参见Walker等人,Plant Cell Rep.23:727-735(2005);Li等人,Gene403:132-142(2007);Li等人,Mol Biol.Rep.37:1143-1154(2010))。PrbcS1和Pactin是组成性启动子,Pnr和Pdca1是诱导性启动子。Pnr由硝酸盐诱导并被铵抑制(Li等人,Gene 403:132-142(2007)),Pdca1由盐诱导(Li等人,Mol Biol.Rep.37:1143-1154(2010))。在一些实施方案中,可用于本发明的启动子是RNA聚合酶II(Pol II)启动子。在一些实施方案中,来自玉米的U6启动子或7SL启动子可以用于本发明的构建体。在一些实施方案中,来自玉米的U6c启动子和/或7SL启动子可以用于驱动向导核酸的表达。在一些实施方案中,来自大豆(Glycine max)的U6c启动子、U6i启动子和/或7SL启动子可用于本发明的构建体。在一些实施方案中,来自大豆的U6c启动子、U6i启动子和/或7SL启动子可以用于驱动向导核酸的表达。
对植物有用的组成性启动子的实例包括但不限于,洋丁香病毒启动子(cmp)(美国专利号7,166,770)、水稻肌动蛋白1启动子(Wang等人,(1992)Mol.Cell.Biol.12:3399-3406;以及美国专利号5,641,876)、CaMV 35S启动子(Odell等人,(1985)Nature 313:810-812)、CaMV 19S启动子(Lawton等人,(1987)Plant Mol.Biol.9:315-324)、nos启动子(Ebert等人(1987)Proc.Natl.Acad.Sci USA 84:5745-5749)、Adh启动子(Walker等人(1987)Proc.Natl.Acad.Sci.USA 84:6624-6629)、蔗糖合酶启动子(Yang&Russell(1990)Proc.Natl.Acad.Sci.USA 87:4144-4148)和泛素启动子。源自泛素的组成性启动子在许多细胞类型中积累。泛素启动子已从几种植物物种中克隆出来,用于转基因植物,例如,向日葵(Binet等人,1991.Plant Science 79:87-94),玉米(Christensen等人,1989.PlantMolec.Biol.12:619-632)和拟南芥(Norris等人1993.Plant Molec.Biol.21:895-906)。玉米泛素启动子(UbiP)已在转基因单子叶植物系统中开发,构建用于单子叶植物转化的其序列和载体在专利公布EP 0 342 926中公开。泛素启动子适用于本发明的核苷酸序列在转基因植物中的表达,特别是单子叶植物。此外,McElroy等人(Mol.Gen.Genet.231:150-160(1991))描述的启动子表达盒可以很容易地被改良用于本发明的核苷酸序列的表达,并且特别适用于单子叶植物宿主。
在一些实施方案中,组织特异性/组织偏好性启动子可用于在植物细胞中表达异源多核苷酸。组织特异性或偏好表达模式包括但不限于,绿色组织特异性或偏好性、根特异性或偏好性、茎特异性或偏好性、花特异性或偏好性或花粉特异性或偏好性。适合在绿色组织中表达的启动子包括调节参与光合作用的基因的许多启动子,其中许多是从单子叶植物和双子叶植物克隆而来的。在一个实施方案中,可用于本发明的启动子是来自磷酸烯醇羧化酶基因的玉米PEPC启动子(Hudspeth&Grula,Plant Molec.Biol.12:579-589(1989))。组织特异性启动子的非限制性实例包括与编码种子储存蛋白(诸如β-伴大豆球蛋白、十字花科蛋白、油菜贮藏蛋白和菜豆蛋白)、玉米醇溶蛋白或油体蛋白(诸如油质蛋白)或参与脂肪酸生物合成的蛋白(包括酰基载体蛋白、硬脂酰-ACP去饱和酶和脂肪酸去饱和酶(fad 2-1))的基因缔合的那些,以及胚发育过程中表达的其他核酸(诸如Bce4,参见,例如,Kridl等人(1991)Seed Sci.Res.1:209-219;以及EP专利号255378)。可用于在植物、特别是玉米中表达本发明的核苷酸序列的组织特异性或组织偏好性启动子包括但不限于那些直接在根、髓、叶或花粉中表达的启动子。例如,在WO 93/07278(其全部内容通过引用并入本文)中公开了此类启动子。可用于本发明的组织特异性或组织偏好性启动子的其它非限制性实例是美国专利6,040,504中公开的棉花rubisco启动子;在美国专利5,604,121中公开的水稻蔗糖合酶启动子;由de Framond(FEBS290:103-106(1991);Ciba-Geigy的EP 0 452 269)所述的根特异性启动子;在美国专利5,625,136(Ciba-Geigy)中描述的茎特异性启动子,其可驱动玉米trpA基因的表达;在WO 01/73087中公开的洋丁香黄曲叶病毒启动子;以及花粉特异性或偏好性启动子,包括但不限于,来自水稻的ProOsLPS10和ProOsLPS11(Nguyen等人Plant Biotechnol.Reports 9(5):297-306(2015)),来自玉米的ZmSTK2_USP(Wang等人Genome 60(6):485-495(2017))、来自番茄的LAT52和LAT59(Twell等人Development 109(3):705-713(1990))、Zm13(美国专利号10,421,972)、来自拟南芥的PLA2-δ启动子(美国专利号7,141,424)和/或来自玉米的ZmC5启动子(国际PCT公开号WO1999/042587)。
植物组织特异性/组织偏好性启动子的其他实例包括但不限于,根毛特异性顺式元件(RHE)(Kim等人The Plant Cell 18:2958-2970(2006))、根特异性启动子RCc3(Jeong等人Plant Physiol.153:185-197(2010))和RB7(美国专利号5459252)、凝集素启动子(Lindstrom等人(1990)Der.Genet.11:160-167;和Vodkin(1983)Prog.Clin.Biol.Res.138:87-98)、玉米醇脱氢酶1启动子(Dennis等人(1984)NucleicAcids Res.12:3983-4000)、S-腺苷-L-蛋氨酸合成酶(SAMS)(Vander Mijnsbrugge等人(1996)Plant and Cell Physiology,37(8):1108-1115)、玉米光捕获复合物启动子(Bansal等人(1992)Proc.Natl.Acad.Sci.USA 89:3654-3658)、玉米热休克蛋白启动子(O'Dell等人(1985)EMBO J.5:451-458;和Rochester等人(1986)EMBO J.5:451-458)、豌豆小亚基RuBP羧化酶启动子(Cashmore,"Nuclear genes encoding the small subunit ofribulose-l,5-bisphosphate carboxylase"第29-39页,In:Genetic Engineering ofPlants(Hollaender编辑,Plenum Press 1983;和Poulsen等人(1986)Mol.Gen.Genet.205:193-200)、Ti质粒甘露糖碱合酶启动子(Langridge等人(1989)Proc.Natl.Acad.Sci.USA86:3219-3223)、Ti质粒胭脂碱合酶启动子(Langridge等人(1989),见上)、矮牵牛查尔酮异构酶启动子(van Tunen等人(1988)EMBO J.7:1257-1263)、豆类富甘氨酸蛋白1启动子(Keller等人(1989)Genes Dev.3:1639-1646)、截短的CaMV 35S启动子(O'Dell等人(1985)Nature 313:810-812)、马铃薯块茎储藏蛋白启动子(Wenzler等人(1989)PlantMol.Biol.13:347-354)、根细胞启动子(Yamamoto等人(1990)Nucleic Acids Res.18:7449)、玉米醇溶蛋白启动子(Kriz等人(1987)Mol.Gen.Genet.207:90-98;Langridge等人(1983)Cell34:1015-1022;Reina等人(1990)Nucleic Acids Res.18:6425;Reina等人(1990)Nucleic Acids Res.18:7449;和Wandelt等人(1989)Nucleic Acids Res.17:2354)、球蛋白-1启动子(Belanger等人(1991)Genetics 129:863-872)、α-微管蛋白cab启动子(Sullivan等人(1989)Mol.Gen.Genet.215:431-440)、PEPCase启动子(Hudspeth&Grula(1989)Plant Mol.Biol.12:579-589)、R基因复合物相关启动子(Chandler等人(1989)Plant Cell 1:1175-1183)和查尔酮合酶启动子(Franken等人(1991)EMBO J.10:2605-2612)。
可用于种子特异性表达的是豌豆球蛋白启动子(Czako等人(1992)Mol.Gen.Genet.235:33-40;以及美国专利号5,625,136中公开的种子特异性启动子。可用于在成熟叶片中表达的启动子是那些在衰老开始时切换的启动子,诸如来自拟南芥的SAG启动子(Gan等人(1995)Science 270:1986-1988)。
此外,还可以使用叶绿体中起作用的启动子。这种启动子的非限制性实例包括噬菌体T3基因9 5'UTR和美国专利号7,579,516中公开的其它启动子。可用于本发明的其它启动子包括但不限于S-E9小亚基RuBP羧化酶启动子和Kunitz胰蛋白酶抑制剂基因启动子(Kti3)。
可用于本发明的其他调控元件包括但不限于内含子、增强子、终止序列和/或5'和3'非翻译区。
可用于本发明的内含子可以是在植物中鉴定并从中分离,然后插入到用于植物转化的表达盒中的内含子。正如本领域技术人员所理解的那样,内含子可以包含自我切除所需的序列,并被框内掺入到核酸构建体/表达盒中。内含子可以用作间隔区以在一个核酸构建体中分开多个蛋白质编码序列,或者也可以在一个蛋白质编码序列内使用内含子,例如,以稳定mRNA。如果它们在蛋白质编码序列中使用,则将它们“框内”插入,并包括切除位点。内含子也可以与启动子缔合以改善或修饰表达。作为实例,可用于本发明的启动子/内含子组合包括但不限于玉米Ubi1启动子和内含子的启动子/内含子组合(参见,例如,SEQ IDNO:21和SEQ ID NO:22)。
可用于本发明的内含子的非限制性实例包括来自以下的内含子:ADHI基因(例如,Adh1-S内含子1、2和6),泛素基因(Ubi1),RuBisCO小亚基(rbcS)基因,RuBisCO大亚基(rbcL)基因,肌动蛋白基因(例如,肌动蛋白-1内含子),丙酮酸脱氢酶激酶基因(pdk),硝酸还原酶基因(nr),双拷贝碳酸酐酶基因1(Tdca1),psbA基因、atpA基因或其任意组合。
在一些实施方案中,本发明的多核苷酸和/或核酸构建体可以是“表达盒”,或可以包含在表达盒内。如本文所用,“表达盒”是指重组核酸分子,包含例如,本发明的一个或多个多核苷酸(例如,编码序列特异性核酸结合结构域的多核苷酸、编码脱氨酶蛋白或结构域的多核苷酸、编码逆转录酶蛋白或结构域的多核苷酸、编码5'-3'核酸外切酶多肽或结构域的多核苷酸、向导核酸和/或逆转录酶(RT)模板),其中一个或多个多核苷酸可操作地缔合一个或多个控制序列(例如,启动子、终止子等)。因此,在一些实施方案中,可以提供一个或多个表达盒,其设计用于表达,例如,本发明的核酸构建体(例如,编码序列特异性核酸结合结构域的多核苷酸、编码核酸酶多肽/结构域的多核苷酸、编码脱氨酶蛋白/结构域的多核苷酸、编码逆转录酶蛋白/结构域的多核苷酸、编码5'-3'核酸外切酶多肽/结构域的多核苷酸、编码肽标签的多核苷酸和/或编码亲和多肽的多核苷酸等,或包含向导核酸、延伸的向导核酸和/或RT模板等)。当本发明的表达盒包含多于一个多核苷酸时,多核苷酸可以可操作地连接到驱动所有多核苷酸表达的单个启动子,或者该多核苷酸可以可操作地连接到一个或多个单独的启动子(例如,三个多核苷酸可以由一个、两个或三个启动子以任意组合驱动)。当使用两个或更多个单独的启动子时,启动子可以是同一个启动子,或它们可以是不同的启动子。因此,当包含在单个表达盒中时,编码序列特异性核酸结合结构域的多核苷酸、编码核酸酶蛋白/结构域的多核苷酸、编码CRISPR-Cas效应蛋白/结构域的多核苷酸、编码脱氨酶蛋白/结构域的多核苷酸、编码逆转录酶多肽/结构域的多核苷酸(例如,RNA依赖性DNA聚合酶)和/或编码5'-3'核酸外切酶多肽/结构域的多核苷酸、向导核酸、延伸的向导核酸和/或RT模板可以各自可操作地连接单个启动子或任意组合的独立启动子。
包含本发明的核酸构建体的表达盒可以是嵌合的,这意味着其至少一个(例如,一个或多个)组分相对于其至少一个其他组分是异源的(例如,来自宿主生物体的启动子可操作地连接到要在宿主生物体中表达的感兴趣多核苷酸,其中所述感兴趣多核苷酸来自与宿主不同的生物体,或者通常不与该启动子缔合)。表达盒也可以是天然存在的,但已以可用于异源表达的重组形式获得。
表达盒可以任选地包括转录和/或翻译终止区(即终止区)和/或在所选宿主细胞中起作用的增强子区。本领域已知多种转录终止子和增强子,可用于表达盒。转录终止子负责终止转录和纠正mRNA多聚腺苷酸化。终止区和/或增强子区可以对转录起始区来说是天然的,可以对下列来说是天然的:例如,编码序列特异性核酸结合蛋白的基因、编码核酸酶的基因、编码逆转录酶的基因、编码脱氨酶的基因等,或者可以对宿主细胞来说天然的,或者可以对另一来源(例如,外源的或异源的,例如,对启动子、编码序列特异性核酸结合蛋白的基因、编码核酸酶的基因、编码逆转录酶的基因、编码脱氨酶的基因等,或对宿主细胞,或它们的任意组合)来说是天然的。
本发明的表达盒还可以包括编码可选择标记物的多核苷酸,其可用于选择转化的宿主细胞。如本文所用,“可选择标记物”是指这样的多核苷酸序列:当表达时,赋予表达该标记物的宿主细胞独特的表型,从而允许将这种转化的细胞与没有该标记物的细胞区分开来。这种多核苷酸序列可以编码可选择或可筛选的标记物,这取决于该标记物是否赋予可以通过化学手段选择的性状,诸如使用选择性剂(例如,抗生素等),或者该标记物是否只是人们可以通过观察或测试识别的性状,诸如通过筛选(例如,荧光)识别。许多合适的可选择标记物的实例是本领域已知的,并且可用于本文所述的表达盒中。
除表达盒外,本文所述的核酸分子/构建体和多核苷酸序列可与载体结合使用。术语“载体”是指用于将核酸(或多个核酸)转移、递送或引入细胞的组合物。载体包括包含要转移、递送或引入的核苷酸序列的核酸构建体(例如,表达盒)。用于转化宿主生物体的载体是本领域公知的。一般类别载体的非限制性实例包括病毒载体、质粒载体、噬菌体载体、噬菌粒载体、粘粒载体、fosmid载体、噬菌体、人工染色体、微环或双链或单链线性或环状形式的农杆菌二元载体,这些载体可以是或可以不是可自我传播或可动员的。在一些实施方案中,病毒载体可以包括但不限于逆转录病毒、慢病毒、腺病毒、腺相关病毒或单纯疱疹病毒载体。本文定义的载体可以通过整合到细胞基因组中或染色体外存在(例如,具有复制起点的自主复制质粒)来转化原核或真核宿主。此外,还包括穿梭载体,其是指天然地或通过设计能够在两种不同的宿主生物体中复制的DNA载体,其可以选自放线菌和相关物种、细菌和真核生物(例如,高等植物、哺乳动物、酵母或真菌细胞)。在一些实施方案中,载体中的核酸受适当的启动子或其他调节元件的控制,并可操作地与适当的启动子或其他调节元件连接,以便在宿主细胞中进行转录。该载体可以是在多个宿主中起作用的双功能表达载体。在基因组DNA的情况下,这可以包含其自己的启动子和/或其他调节元件,而在cDNA的情况下,这可以在适当的启动子和/或其他调节元件的控制下,以便在宿主细胞中表达。因此,本发明的核酸或多核苷酸和/或包含所述核酸或多核苷酸的表达盒可以包含在本文所述和本领域已知的载体中。
如本文所用,“接触”(contact,contacting,contacted)及其语法变体,是指在适合进行所需反应(例如,转化、转录控制、基因组编辑、做切口和/或裂解)的条件下将所需反应的组分放在一起。作为实例,靶核酸可以与序列特异性核酸结合蛋白(例如,多核苷酸引导的核酸内切酶、CRISPR-Cas核酸内切酶(例如,CRISPR-Cas效应蛋白)、锌指核酸酶、转录激活因子样效应物核酸酶(TALEN)和/或Argonaute蛋白))和脱氨酶或编码这些的核酸构建体在以下的条件下接触:序列特异性核酸结合蛋白、逆转录酶和/或脱氨酶表达,序列特异性核酸结合蛋白与靶核酸结合,逆转录酶和/或脱氨酶可以与序列特异性核酸结合蛋白融合或募集到序列特异性核酸结合蛋白(例如,通过与序列特异性核酸结合蛋白融合的肽标签和与逆转录酶和/或脱氨酶融合的亲和标签),因此,脱氨酶和/或逆转录酶位于靶核酸附近,从而修饰靶核酸。可以使用其他募集逆转录酶和/或脱氨酶的方法,利用其他蛋白质-蛋白质相互作用,并且RNA-蛋白质相互作用和化学相互作用也可用于蛋白质-蛋白质和蛋白质-核酸募集。
如本文所用,提及靶核酸,“修饰”(modifying或modification)包括编辑(例如,突变)、共价修饰、交换/置换核酸/核苷酸碱基、缺失、裂解、做切口和/或改变对靶核酸的转录控制。在一些实施方案中,修饰可以包括任何类型的一个或多个单碱基变化(SNP)。
在感兴趣多核苷酸的背景下,“引入”(introducing、introduce、introduced)(及其语法变体)意指将感兴趣的核苷酸序列(例如,多核苷酸、RT模板、核酸构建体和/或向导核酸)呈递给植物、其植物部分或其细胞,使核苷酸序列能够进入细胞内部。
术语“转化”或“转染”可以互换使用,如本文所用是指将异源核酸引入细胞。细胞的转化可以是稳定的或瞬时的。因此,在一些实施方案中,宿主细胞或宿主生物体(例如,植物)可以用本发明的多核苷酸/核酸分子稳定地转化。在一些实施方案中,宿主细胞或宿主生物体可以用本发明的多核苷酸/核酸分子瞬时转化。
在多核苷酸的背景下,“瞬时转化”意指多核苷酸被引入细胞中,并且不整合到细胞的基因组中。
在将多核苷酸引入细胞的背景下,通过“稳定引入”或“被稳定引入”,意指将引入的多核苷酸稳定地掺入细胞的基因组中,从而使细胞被多核苷酸稳定地转化。
如本文所用,“稳定转化”或“稳定地转化”意指将核酸分子引入细胞并整合到细胞的基因组中。因此,整合的核酸分子能够被其后代继承,更具体地说,能够被连续多代的后代继承。如本文所用的“基因组”包括核基因组和质体基因组,因此包括将核酸整合到例如叶绿体或线粒体基因组中。如本文所用的稳定转化也可以指在染色体外维持的转基因,例如,作为微染色体或质粒。
瞬时转化可以通过例如酶联免疫吸附测定(ELISA)或蛋白质印迹法来检测,其可以检测由引入生物体的一个或多个转基因编码的肽或多肽的存在。例如,可以通过对细胞的基因组DNA与核酸序列进行Southern印迹杂交测定来检测细胞的稳定转化,所述核酸序列与引入生物体(例如,植物)的转基因的核苷酸序列特异性杂交。例如,可以通过对细胞的RNA与核酸序列进行Northern印迹杂交测定来检测细胞的稳定转化,所述核酸序列与引入宿主生物体的转基因的核苷酸序列特异性杂交。细胞的稳定转化也可以通过,例如,聚合酶链反应(PCR)或本领域公知的其它扩增反应来检测,采用与转基因的靶序列杂交的特异性引物序列,从而扩增转基因序列,其可以根据标准方法检测。转化也可以通过本领域公知的直接测序和/或杂交方案来检测。
因此,在一些实施方案中,本发明的核苷酸序列、多核苷酸、核酸构建体和/或表达盒可以被瞬时表达和/或它们可以稳定地掺入宿主生物体的基因组中。因此,在一些实施方案中,本发明的核酸构建体(例如,一个或多个包含如本文所述的用于编辑的多核苷酸的表达盒)可以瞬时引入到具有向导核酸的细胞中,因此,没有DNA在细胞中维持。
本发明的核酸构建体可以通过本领域技术人员已知的任何方法引入植物细胞中。转化方法的非限制性实例包括通过细菌介导的核酸递送(例如,通过农杆菌)的转化、病毒介导的核酸递送、碳化硅或核酸晶须介导的核酸递送、脂质体介导的核酸递送、显微注射、微粒轰击、磷酸钙介导的转化、环糊精介导的转化、电穿孔、纳米颗粒介导的转化、超声处理、浸润、PEG介导的核酸摄取,以及导致将核酸引入植物细胞的任何其他电、化学、物理(机械)和/或生物机制,包括它们的任意组合。转化真核生物和原核生物的程序在本领域是众所周知和常规的,并且其描述遍布文献(参见,例如,Jiang等人2013.Nat.Biotechnol.31:233-239;Ran等人Nature Protocols8:2281–2308(2013))。对本领域已知的各种植物转化方法的一般指南包括Miki等人("Procedures for Introducing Foreign DNA intoPlants"in Methods in Plant Molecular Biology and Biotechnology,Glick,B.R.和Thompson,J.E.编辑(CRC Press,Inc.,Boca Raton,1993),第67-88页)和Rakowoczy-Trojanowska(Cell.Mol.Biol.Lett.7:849-858(2002))。
在本发明的一些实施方案中,细胞的转化可以包括核转化。在其它实施方案中,细胞的转化可以包括质体转化(例如,叶绿体转化)。在进一步的实施方案中,本发明的核酸可以通过常规育种技术引入细胞中。在一些实施方案中,一种或多种多核苷酸、表达盒和/或载体可以通过农杆菌转化引入植物细胞中。
因此,多核苷酸可以以本领域公知的任意数量的方式引入植物、植物部分、植物细胞中。本发明的方法不依赖于将一个或多个核苷酸序列引入植物的特定方法,只要它们能够进入细胞内部即可。如果要引入多个多核苷酸,它们可以组装为单个核酸构建体的一部分,也可以组装为单独的核酸构建体,并且可以位于相同或不同的核酸构建体上。因此,多核苷酸可以在单个转化事件中引入感兴趣细胞,或者,也可以在单独的转化事件中引入感兴趣细胞,或者,备选地,可以将多核苷酸作为育种方案的一部分掺入植物中。
植物激素调节植物的生长和发育,以及对生长环境变化的反应(例如,对干旱或其他非生物胁迫的反应)。植物激素信号可以通过植物激素在代谢水平上的生物合成或分解,或通过控制植物激素信号传导来调节。油菜素内酯是一类多羟基化甾体植物激素,是植物中促进生长的植物激素。芸苔素内酯是第一个分离出的油菜素内酯,从那时起,又从植物中分离出70多种其他的油菜素内酯化合物。油菜素内酯植物激素与植物的产量和非生物胁迫有关(Divi和Krishna 2009New Biotechnology 26(3-4),131-136;Gruszka2020Intl.J.Molecular Sci.21(1),354)。植物中的油菜素内酯信号转导受到多层转录和转录后调控的严格控制(Li和Jin 2007Trends Plant Sci.12(1):37-41;Gendron和Wang2007Curr.Opin.Plant Biol.10(5),436-441)。
本发明旨在通过编辑技术修饰植物中的油菜素内酯基因,即油菜素内酯不敏感-1(BRI1),以提供表现出一种或多种改善的产量性状的植物。例如,可用于产生具有一种或多种改善的产量性状的植物的突变包括置换、缺失和/或插入。在某些方面,编辑技术产生的突变可以是点突变。
在一些实施方案中,本发明提供一种植物或其植物部分,包含编码BRI1多肽(油菜素内酯受体多肽)的内源性油菜素内酯不敏感-1(BRI1)基因中的至少一个突变。在一些实施方案中,至少一个突变可以是非天然突变。在一些实施方案中,BRI1多肽包括激酶结构域,任选地,其中突变降低BRI1激酶结构域的磷酸化。在一些实施方案中,突变增加了BRI1多肽的自磷酸化,任选地,在油菜素内酯植物激素存在下,增加了编码的BRI1多肽的油菜素内酯受体信号传导。
如本文所用,“非天然突变”是指通过人为干预产生的突变,并且不同于在自然界中发生的同一基因中发现的突变(例如,天然发生的))。
在一些实施方案中,提供一种植物细胞,所述植物细胞包含编辑系统,所述编辑系统包含:(a)CRISPR-Cas效应蛋白;和(b)向导核酸(例如,gRNA、gDNA、crRNA、crDNA、sgRNA、sgDNA),其包含与编码BRI1多肽的内源性靶基因互补的间隔序列。该编辑系统可用于在编码BRI1多肽的内源性靶基因中产生突变。在一些实施方案中,突变是非天然突变。在一些实施方案中,编辑系统的向导核酸可以包含SEQ ID NO:82-84和/或SEQ ID NO:136-139(例如,SEQ ID NO:82(PWsp1405),SEQ ID NO:83,SEQ ID NO:84(PWsp3877),SEQ ID NO:136,SEQ ID NO:137(PWsp1504),SEQ ID NO:138(PWsp1568)和/或SEQ ID NO:139(PWsp1569))中任一个的核苷酸序列(间隔序列,例如,一个或多个间隔区)。
植物、其植物部分或可用于本发明的植物细胞的BRI1基因中的突变可以是任何类型的突变,包括碱基置换、碱基缺失、和/或碱基插入。在一些实施方案中,突变可能是非天然突变。在一些实施方案中,突变可以包括碱基置换为A、T、G或C,任选地碱基置换可以是从A到G。在一些实施方案中,突变可以是至少一个碱基对的缺失(例如,1个碱基对至约15个碱基对;例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14或15个连续碱基对)或插入至少一个碱基对(例如,1个碱基对至约15个碱基对;例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14或15个连续碱基对),任选地框内缺失或插入。在一些实施方案中,突变可以是3、6、9、12或15个连续碱基对的缺失,任选地导致一个氨基酸残基至约5个连续氨基酸残基的缺失。在一些实施方案中,包含本文所述的BRI1基因中的突变的植物、植物部分或植物细胞包含与SEQ ID NO:140-145中任一个具有至少90%序列同一性的核酸序列。在一些实施方案中,包含BRI1基因中的突变的植物、植物部分或植物细胞是大豆,突变的BRI1基因包括与SEQ ID NO:140-142中任一个具有至少90%序列同一性的核酸序列。在一些实施方案中,包含BRI1基因中的突变的植物、植物部分或植物细胞是玉米,突变的BRI1基因包含与SEQ ID NO:143-145中任一个具有至少90%序列同一性的核酸序列。
在一些实施方案中,与不包含所述缺失的植物相比,这种缺失或插入当包含在植物中时可导致植物表现出一种或多种改善的产量性状。BRI1基因可以在一个或多个位置进行编辑(并使用一种或多种不同的编辑工具),从而提供包含一个或多个突变的BRI1基因。在一些实施方案中,如本文所述突变的BRI1多肽可包含一个或多个可导致多肽具有一个或多个氨基酸缺失的编辑,任选地其中,该多肽包含1、2、3、4或5个氨基酸缺失。
可用于在BRI1基因中产生这些突变和其他突变的编辑工具的类型包括任何碱基编辑器或切割器,它们使用与本文所述的BRI1基因的一部分至少80%(例如,80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%99%、99.5%、99.9%或100%)互补的间隔区被引导到靶位点。
在一些实施方案中,BRI1基因的突变可以位于编码BRI1多肽的内源性BRI1基因的一部分内(例如,编码区(外显子))。作为实例,突变可以在编码BRI1多肽的激酶结构域的BRI1基因区域,任选地,其中突变导致BRI1多肽与野生型成熟BRI1多肽相比具有氨基酸置换。
在一些实施方案中,BRI1基因的突变是在内源性BRI1基因位于下列位置的部分或区域内:(a)大约位置929-1002、942-994、949-987、956-975和/或960-970,参考SEQ ID NO:71的氨基酸位置编号(例如,SEQ ID NO:77-81),(b)大约位置997-1070、1008-1059、1018-1048和/或1028-1039,参考SEQ ID NO:87或SEQ ID NO:88的氨基酸位置编号(例如,SEQ IDNO:95-98),(c)大约位置1048-1122、1068-1102、1075-1095、1085-1096,参考SEQ ID NO:101的氨基酸位置编号(例如,SEQ ID NO:107-111),(d)大约位置1051-1097、1057-1090、1064-1082和/或1069-1080,参考SEQ ID NO:114的氨基酸位置编号(例如,SEQ ID NO:119-122),和/或(e)大约位置1000-1073、1013-1059、1020-1053、1027-1046和/或1031-1042,参考SEQ ID NO:125的氨基酸位置编号(例如,SEQ ID NO:98、131-135)。
在一些实施方案中,内源性BRI1基因中的至少一个突变导致位于下列区域中的一个或多个氨基酸残基的突变:(a)大约位置929-1002、942-994、949-987、956-975和/或960-970,参考SEQ ID NO:71的氨基酸位置编号(例如,SEQ ID NO:77-81),(b)大约位置997-1070、1008-1059、1018-1048和/或1028-1039,参考SEQ ID NO:87或SEQ ID NO:88的氨基酸位置编号(例如,SEQ ID NO:95-98),(c)大约位置1048-1122、1068-1102、1075-1095、1085-1096,参考SEQ ID NO:101的氨基酸位置编号(例如,SEQ ID NO:107-111),(d)大约位置1051-1097、1057-1090、1064-1082和/或1069-1080,参考SEQ ID NO:114的氨基酸位置编号(例如,SEQ ID NO:119-122),和/或(e)大约位置1000-1073、1013-1059、1020-1053、1027-1046和/或1031-1042,参考SEQ ID NO:125的氨基酸位置编号(例如,SEQ ID NO:98、131-135)。在一些实施方案中,至少一个突变可以是非天然突变。
在一些实施方案中,至少一个突变可以导致位于下列位置的任一个或多个氨基酸残基的置换:大约位置955-975,参考SEQ ID NO:71的氨基酸位置编号;大约位置1023-1043,参考SEQ ID NO:87或SEQ ID NO:88的氨基酸位置编号;大约位置1081-1101,参考SEQID NO:101的氨基酸位置编号;大约位置1065-1085,参考SEQ ID NO:114的氨基酸位置编号;和/或大约位置1026-1046,参考SEQ ID NO:125的氨基酸位置编号。在一些实施方案中,至少一个突变可以导致位于下列位置的氨基酸残基的置换:位置965处,参考SEQ ID NO:71的氨基酸位置编号;位置1033处,参考SEQ ID NO:87或SEQ ID NO:88的氨基酸位置编号;位置1091处,参考SEQ ID NO:101的氨基酸位置编号;位置1075处,参考SEQ ID NO:114的氨基酸位置编号;或位置1036处,参考SEQ ID NO:125的氨基酸位置编号;任选地其中所述置换是苏氨酸置换为丙氨酸(T>A)。在一些实施方案中,至少一个突变可以是非天然突变。
可用于本发明的内源性BRI1基因(例如,内源性靶基因)编码油菜素内酯不敏感-1(BRI1)多肽。在一些实施方案中,内源性BRI1基因(例如,内源性靶基因)可以包含与SEQ IDNO:69、70、85、86、99、100、112、113、123或124中任一个具有至少80%(例如,80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.9%或100%)序列同一性的核酸序列,可以包含与SEQ ID NO:72-76、89-94、102-106、115-118或126-130中任一个具有至少80%序列同一性的区域,可以编码与SEQ ID NO:71、87、88、101、114或125中任一个具有至少80%序列同一性的BRI1多肽,和/或可以编码SEQ ID NO:77-81、95-98、107-111、119-122或131-135中任一个具有至少80%序列同一性的区域。
在一些实施方案中,包含内源BRI1中的如本文所述的至少一个(例如,一个或多个)突变的植物(例如,玉米植物,大豆植物)与没有所述至少一个突变的植物(例如,同基因植物(例如,野生型未编辑植物或空缺分离体))相比,表现出一种或多种改善的产量性状,任选地其中突变可以是非天然突变。在一些实施方案中,一种或多种改善的产量性状可以包括但不限于,与没有所述至少一个突变的对照植物相比,更高的产量(蒲式耳/英亩)、增加的生物量、增加的株高、增加的茎直径、增加的叶面积、增加的花数、增加的籽粒行数(任选地其中穗长不显著减少)、增加的籽粒数、增加的籽粒大小、增加的穗长、减少的分蘖数、减少的雄穗分枝数、每个节增加的荚果数量、每株植物增加的荚果数量、增加的种子数量、每个荚果增加的种子数量、增加的种子大小和/或增加的种子重量(例如,增加的百粒种子重量)。在一些实施方案中,一种或多种改善的产量性状可以包括但不限于:增加的籽粒行数(任选地其中穗长不显著减少)、增加的穗长、增加的荚果数量和/或增加的种子重量。在一些实施方案中,包含如本文所述的BRI1基因中的至少一个突变并且具有一种或多种改善的产量性状的植物可以包含与SEQ ID NO:140-145中任一个具有至少90%序列同一性的核酸序列。在一些实施方案中,包含BRI1基因中的突变的植物是大豆,且突变的BRI1基因包括与SEQ ID NO:140-142中任一个具有至少90%序列同一性的核酸序列。在一些实施方案中,包含BRI1基因中的突变的植物是玉米,突变的BRI1基因包含与SEQ ID NO:143-145中任一个具有至少90%序列同一性的核酸序列。
在一些实施方案中,植物可以从包含如本文所述的BRI1基因中的突变的本发明的植物部分和/或植物细胞再生而来,其中所述再生的植物包含内源性BRI1基因中的突变,且与没有BRI1基因中的相同突变的植物相比包含一个或多个产量性状改善的表型。
如本文所用,术语“穗长不显著减少”是指由于本文所述的一个或多个BRI1基因中的一个或多个突变而导致具有增加的籽粒行数的穗长,其中与没有相同BRI1基因中的相同突变的植物的穗相比,所述穗长减少不超过约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30%。
在一些实施方案中,提供了植物细胞,所述植物细胞包含内源性油菜素内酯不敏感-1(BRI1)基因内的至少一个(例如,一个或多个)突变,其中该突变是使用包含与内源性BRI1基因中的靶位点结合的核酸结合结构域的编辑系统引入的置换、插入或缺失。在一些实施方案中,至少一个突变可以是非天然突变。在一些实施方案中,置换、插入或删除导致,例如,氨基酸置换。在一些实施方案中,至少一个突变是点突变。在一些实施方案中,BRI1基因内的至少一个突变是插入和/或缺失,任选地,至少一个突变是框内插入或缺失。在一些实施方案中,包含如本文所述的BRI1基因中的至少一个突变的植物细胞可以包含与SEQ IDNO:140-145中任一个具有至少90%(例如,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,99.5%.99.9%或100%)的序列同一性的核酸序列。在一些实施方案中,包含BRI1基因中的突变的植物细胞来自大豆,且突变的BRI1基因包含与SEQ ID NO:140-142中任一个具有至少90%序列同一性的核酸序列。在一些实施方案中,包含BRI1基因中的突变的植物细胞来自玉米,突变的BRI1基因包含与SEQ ID NO:143-145中任一个具有至少90%序列同一性的核酸序列。
在一些实施方案中,植物细胞的BRI1基因中的靶位点是在位于下列位置的BRI1基因区域内:(a)大约核苷酸3096-3235、3136-3295、3156-3275、3176-3255和/或3176-3237,参考SEQ ID NO:69的核苷酸位置编号(例如,SEQ ID NO:72-76),(b)大约核苷酸2784-3023、2824-2983、2844-2963、2864-2943和/或2864-2924,参考SEQ ID NO:70的核苷酸位置编号(例如,SEQ ID NO:72-76),(c)大约核苷酸3198-3420、3238-3380、3258-3360、3278-3340和/或3291-3327,参考SEQ ID NO:85的核苷酸位置编号(例如,SEQ ID NO:89-94),(d)大约核苷酸1944-2166、1984-2126、2004-2106、2024-2085和/或2036-2073,参考SEQ IDNO:86的核苷酸位置编号(例如,SEQ ID NO:89-94),(e)大约核苷酸3070-3292、3110-3252、3130-3232、3150-3212和/或3180-3228,参考SEQ ID NO:99或SEQ ID NO:100的核苷酸位置编号(例如,SEQ ID NO:102-106),(f)大约核苷酸3109-3331、3149-3291、3169-3271、3189-3251和/或3204-3244,参考SEQ ID NO:113或SEQ ID NO:114的核苷酸位置编号(例如,SEQID NO:115-118),(g)大约核苷酸3289-3511、3329-3471、3349-3451、3369-3431和/或3381-3419,参考SEQ ID NO:123的核苷酸位置编号(例如,SEQ ID NO:126-130)和/或(h)大约核苷酸2997-3219、3037-3179、3057-3159、3077-3139和/或3089-3126,参考SEQ ID NO:124的核苷酸位置编号(例如,SEQ ID NO:126-130)。在一些实施方案中,BRI1基因中的靶位点在编码包含位于下列位置的连续氨基酸残基的氨基酸序列的BRI1基因区域内:(a)大约位置929-1002、942-994、949-987、956-975和/或960-970,参考SEQ ID NO:71的氨基酸位置编号(例如,SEQ ID NO:77-81),(b)大约位置997-1070、1008-1059、1018-1048和/或1028-1039,参考SEQ ID NO:87或SEQ ID NO:88的氨基酸位置编号(例如,SEQ ID NO:95-98),(c)大约位置1048-1122、1068-1102、1075-1095、1085-1096,参考SEQ ID NO:101的氨基酸位置编号(例如,SEQ ID NO:107-111),(d)大约位置1051-1097、1057-1090、1064-1082和/或1069-1080,参考SEQ ID NO:114的氨基酸位置编号(例如,SEQ ID NO:119-122),和/或(e)大约位置1000-1073、1013-1059、1020-1053、1027-1046和/或1031-1042,参考SEQ ID NO:125的氨基酸位置编号(例如,SEQ ID NO:98、131-135)。
在一些实施方案中,突变是在裂解后由编辑系统进行的,所述编辑系统包含核酸酶和核酸结合结构域,所述核酸结合结构域与序列内的靶位点结合,所述序列与编码SEQID NO:69、70、85、86、99、100、112、113、123或124中任一个的序列具有至少80%(例如,80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.9%或100%)的序列同一性,或与编码SEQ ID NO:72-76、89-94、102-106、115-118或126-130中任一个的序列具有至少80%的序列同一性,并且BRI1基因中的至少一个突变是在被核酸酶裂解后发生的。在一些实施方案中,所述至少一个突变导致位于以下位置的修饰的氨基酸:位置965处,参考SEQ ID NO:71的氨基酸位置编号;位置1033处,参考SEQ ID NO:87或SEQ ID NO:88的氨基酸位置编号;位置1091处,参考SEQ ID NO:101的氨基酸位置编号;位置1075处,参考SEQ ID NO:114的氨基酸位置编号;或位置1036处,参考SEQ ID NO:125的氨基酸位置编号。在一些实施方案中,至少一个突变可以是非天然突变。
在一些实施方案中,植物细胞被再生为包含至少一个突变的植物,任选地,其中,与不包含/缺乏等位基因的野生型植物(例如,同基因野生型植物)相比,从植物细胞再生的植物表现出至少一种(一种或多种)改善的产量性状的表型,任选地,其中一种或多种改善的产量性状包括,但不限于,与没有所述至少一个突变的对照植物相比,更高的产量(蒲式耳/英亩)、增加的生物量、增加的株高、增加的茎直径、增加的叶面积、增加的花数、增加的籽粒行数(任选地其中穗长不显著减少)、增加的籽粒数、增加的籽粒大小、增加的穗长、减少的分蘖数、减少的雄穗分枝数、每个节增加的荚果数量、每株植物增加的荚果数量、增加的种子数量、每个荚果增加的种子数量、增加的种子大小和/或增加的种子重量(例如,增加的百粒种子重量)。在一些实施方案中,由如本文所述的突变产生的一种或多种改善的产量性状包括但不限于,增加的籽粒行数(其中穗长不显著减少)、增加的穗长、增加的荚果数量和/或增加的种子数量。在一些实施方案中,如本文所述的再生植物可以包含如本文所述的突变BRI1基因,任选地,其中突变的BRI基因包含与SEQ ID NO:140-145中任一个具有至少90%序列同一性的核酸序列。在一些实施方案中,包含BRI1基因中的突变的再生植物是大豆植物,突变的BRI1基因包含与SEQ ID NO:140-142中任一个具有至少90%序列同一性的核酸序列。在一些实施方案中,包含BRI1基因中的突变的再生植物是玉米植物,突变的BRI1基因包含与SEQ ID NO:143-145中任一个具有至少90%序列同一性的核酸序列。在一些实施方案中,至少一个突变可以是非天然突变。
在一些实施方案中,提供一种产生/育种无转基因的编辑植物(例如,玉米植物、大豆植物)的方法,该方法包括:将本发明的植物(例如,包含一个或多个BRI1基因中的一个或多个突变(例如,非天然突变)并具有一种或多种改善的产量性状的植物)与无转基因的植物杂交,从而将该突变引入无转基因的植物中;并选择包含突变且无转基因的后代植物,从而产生无转基因的编辑植物。
本文还提供一种提供具有一种或多种改善的产量性状的多种植物(例如,玉米植物、大豆植物)的方法,该方法包括在种植区(例如,田地(例如,耕地、农田)、生长室、温室、休闲区、草坪和/或路边等)种植两种或更多种本发明的植物(例如,2、3、4、5、6、7、8、9、10、20、30、40、50、100、200、300、400、500、1000、2000、3000、400、5000或10,000种或更多种包含一个或多个BRI1基因中的一个或多个突变(例如,非天然突变)并且具有一种或多种改善的产量性状的植物,从而提供与多种没有突变的对照植物相比具有一种或多种改善的产量性状的多种植物。
本发明还提供一种在油菜素内酯不敏感-1(BRI1)多肽的区域中产生变异的方法,包括:将编辑系统引入植物细胞中,其中该编辑系统靶向油菜素内酯不敏感-1(BRI1)基因中编码BRI1多肽的所述区域的区域,并使BRI1基因的所述区域与编辑系统接触,从而将突变引入BRI1基因并在植物细胞的BRI1多肽中产生变异。在一些实施方案中,BRI1基因包含与SEQ ID NO:69、70、85、86、99、100、112、113、123或124中任一个具有至少80%(例如,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,99.5%,99.9%或100%)的序列同一性的核苷酸序列和/或编码与SEQ ID NO:71、87、88、101、114或125中任一个具有至少80%序列同一性的氨基酸序列,并且突变是在编辑系统裂解后进行的,所述编辑系统包含核酸酶和与序列中的靶位点结合的核酸结合结构域,所述序列与SEQ ID NO:69、70、85、86、99、100、112、113、123或124的核苷酸序列中任一个具有至少80%的序列同一性。在一些实施方案中,如本文所述的BRI1基因中产生的变异导致核酸序列与SEQ ID NO:140-145中任一个具有至少90%(90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,99.5%.99.9%或100%)的序列同一性。
在一些实施方案中,被靶向以在BRI1多肽中产生变异的BRI1基因区域包含与SEQID NO:72-76、89-94、102-106、115-118或126-130中任一个的至少80%序列同一性,和/或位于:(a)大约核苷酸3096-3235、3136-3295、3156-3275、3176-3255和/或3176-3237,参考SEQ ID NO:69的核苷酸位置编号(例如,SEQ ID NO:72-76),(b)大约核苷酸2784-3023、2824-2983、2844-2963、2864-2943和/或2864-2924,参考SEQ ID NO:70的核苷酸位置编号(例如,SEQ ID NO:72-76),(c)大约核苷酸3198-3420、3238-3380、3258-3360、3278-3340和/或3291-3327,参考SEQ ID NO:85的核苷酸位置编号(例如,SEQ ID NO:89-94),(d)大约核苷酸1944-2166、1984-2126、2004-2106、2024-2085和/或2036-2073,参考SEQ ID NO:86的核苷酸位置编号(例如,SEQ ID NO:89-94),(e)大约核苷酸3070-3292、3110-3252、3130-3232、3150-3212和/或3180-3228,参考SEQ ID NO:99或SEQ ID NO:100的核苷酸位置编号(例如,SEQ ID NO:102-106),(f)大约核苷酸3109-3331、3149-3291、3169-3271、3189-3251和/或3204-3244,参考SEQ ID NO:113或SEQ ID NO:114的核苷酸位置编号(例如,SEQ IDNO:115-118),(g)大约核苷酸3289-3511、3329-3471、3349-3451、3369-3431和/或3381-3419,参考SEQ ID NO:123的核苷酸位置编号(例如,SEQ ID NO:126-130)和/或(h)大约核苷酸2997-3219、3037-3179、3057-3159、3077-3139和/或3089-3126,参考SEQ ID NO:124的核苷酸位置编号(例如,SEQ ID NO:126-130)。
在一些实施方案中,产生变异的BRI1多肽的区域编码与SEQ ID NO:77-81、95-98、107-111、119-122或131-135中任一个具有至少80%序列同一性的氨基酸序列,和/或编码位于下列位置的连续氨基酸残基的序列:(a)大约位置929-1002、942-994、949-987、956-975和/或960-970,参考SEQ ID NO:71的氨基酸位置编号(例如,SEQ ID NO:77-81),(b)大约位置997-1070、1008-1059、1018-1048和/或1028-1039,参考SEQ ID NO:87或SEQ ID NO:88的氨基酸位置编号(例如,SEQ ID NO:95-98),(c)大约位置1048-1122、1068-1102、1075-1095、1085-1096,参考SEQ ID NO:101的氨基酸位置编号(例如,SEQ ID NO:107-111),(d)大约位置1051-1097、1057-1090、1064-1082和/或1069-1080,参考SEQ ID NO:114的氨基酸位置编号(例如,SEQ ID NO:119-122),和/或(e)大约位置1000-1073、1013-1059、1020-1053、1027-1046和/或1031-1042,参考SEQ ID NO:125的氨基酸位置编号(例如,SEQ IDNO:98、131-135)。
在一些实施方案中,提供了一种用于编辑植物细胞基因组中特定位点的方法,所述方法包括:以位点特异性方式裂解所述植物细胞中内源性油菜素内酯不敏感-1(BRI1)基因内的靶位点,所述内源性BRI1基因:(a)包含与SEQ ID NO:69、70、85、86、99、100、112、113、123或124中任一个核苷酸序列具有至少80%序列同一性的序列,(b)包含与SEQ IDNO:72-76、89-94、102-106、115-118或126-130中任一个核苷酸序列具有至少80%序列同一性的区域,(c)编码与SEQ ID NO:71、87、88、101、114或125中任一个具有至少80%序列同一性的氨基酸序列,和/或(d)编码与SEQ ID NO:77-81、95-98、107-111、119-122或131-135中任一个氨基酸序列具有至少80%序列同一性的区域,从而在所述植物细胞的内源性BRI1基因中产生编辑,并产生包含所述内源性BRI1基因中的所述编辑的植物细胞。
在一些实施方案中,编辑导致突变,任选地非天然突变,其中突变包括但不限于缺失、置换或插入。在一些实施方案中,编辑可以是将A替换为G(A>G)的核苷酸置换。在一些实施方案中,编辑导致BRI1多肽的编码区中的氨基酸变异,任选地在BRI1多肽的激酶结构域中。作为实例,编辑可以导致与SEQ ID NO:77-81、95-98、107-111、119-122或131-135中任一个具有至少80%序列同一性的序列中的变异和/或导致位于下列位置处的氨基酸残基中的变异:(a)大约位置929-1002、942-994、949-987、956-975和/或960-970,参考SEQ ID NO:71的氨基酸位置编号(例如,SEQ ID NO:77-81),(b)大约位置997-1070、1008-1059、1018-1048和/或1028-1039,参考SEQ ID NO:87或SEQ ID NO:88的氨基酸位置编号(例如,SEQ IDNO:95-98),(c)大约位置1048-1122、1068-1102、1075-1095、1085-1096,参考SEQ ID NO:101的氨基酸位置编号(例如,SEQ ID NO:107-111),(d)大约位置1051-1097、1057-1090、1064-1082和/或1069-1080,参考SEQ ID NO:114的氨基酸位置编号(例如,SEQ ID NO:119-122),和/或(e)大约位置1000-1073、1013-1059、1020-1053、1027-1046和/或1031-1042,参考SEQ ID NO:125的氨基酸位置编号(例如,SEQ ID NO:98、131-135)。在一些实施方案中,编辑产生了BRI1多肽中苏氨酸(T)替换为丙氨酸(A)的氨基酸置换。在一些实施方案中,如本文所述的编辑导致突变的BRI1基因,所述突变的BRI1基因包含与SEQ ID NO:140-145中任一个具有至少90%序列同一性的核酸序列。
在一些实施方案中,编辑方法还可以包括由包含内源性BRI1基因中的编辑的植物细胞中再生植物,从而产生在其内源性BRI1基因中包含编辑的植物,并且所述植物与没有编辑的对照植物相比具有一种或多种改善的产量性状的表型。在一些实施方案中,再生植物可以包含如本文所述的突变的BRI1基因,任选地其中突变的BRI1基因包含与SEQ ID NO:140-145中任一个具有至少90%(例如,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,99.5%.99.9%或100%)序列同一性的核酸序列。在一些实施方案中,包含BRI1基因中的突变的再生植物是大豆植物,突变的BRI1基因包含与SEQ ID NO:140-142中任一个具有至少90%序列同一性的核酸序列。在一些实施方案中,包含BRI1基因中的突变的再生植物是玉米植物,突变的BRI1基因包含与SEQ ID NO:143-145中任一个具有至少90%序列同一性的核酸序列。
在一些实施方案中,提供了一种产生植物的方法,(a)使包含内源性油菜素内酯不敏感-1(BRI1)基因的植物细胞群体和与核酸结合结构域(例如,编辑系统)连接的核酸酶接触,所述核酸结合结构域结合下列序列:(i)与SEQ ID NO:69、70、85、86、99、100、112、113、123或124中任一个核苷酸序列具有至少80%序列同一性的序列,(ii)编码与SEQ ID NO:71、87、88、101、114或125中任一个具有至少80%序列同一性的氨基酸序列的序列,(iii)编码包含与SEQ ID NO:77-81、95-98、107-111、119-122或131-135中任一个具有至少80%序列同一性的区域的氨基酸序列的序列,和/或(iv)包含与SEQ ID NO:72-76、89-94、102-106、115-118或126-130中任一个具有至少80%同一性的区域;(b)从内源性BRI1基因发生突变的群体中选择植物细胞,从而产生包含所述内源性BRI1基因中的突变的植物细胞;以及(c)使所选择的植物细胞生长为植物。在一些实施方案中,产生的植物包含突变的BRI1基因,所述突变的BRI1基因包含与SEQ ID NO:140-145中任一个具有至少90%序列同一性的核酸序列。在一些实施方案中,包含BRI1基因中的突变的植物是大豆植物,突变的BRI1基因包含与SEQ ID NO:140-142中任一个具有至少90%序列同一性的核酸序列。在一些实施方案中,包含BRI1基因中的突变的植物是玉米植物,突变的BRI1基因包含与SEQ ID NO:143-145中任一个具有至少90%序列同一性的核酸序列。
在一些实施方案中,提供了一种改善植物的一种或多种产量性状的方法,所述方法包括:(a)使包含内源性油菜素内酯不敏感-1(BRI1)基因的植物细胞与靶向所述内源性BRI1基因的核酸酶接触,其中所述核酸酶与结合所述内源性BRI1基因中的靶位点的核酸结合结构域(例如,编辑系统)连接,其中所述内源性BRI1基因:(i)包含与SEQ ID NO:69、70、85、86、99、100、112、113、123或124中任一个核苷酸序列具有至少80%序列同一性的序列;(ii)包含与SEQ ID NO:72-76、89-94、102-106、115-118或126-130中任一个具有至少80%同一性的区域;(iii)编码与SEQ ID NO:71、87、88、101、114或125中任一个具有至少80%序列同一性的氨基酸序列;和/或(iv)编码包含与SEQ ID NO:77-81、95-98、107-111、119-122或131-135中任一个具有至少80%同一性的区域的氨基酸序列,以产生包含所述内源性BRI1基因中的突变的植物细胞;以及(b)使所述植物细胞生长成包含所述内源性BRI1基因中的所述突变的植物,从而产生具有突变的内源性BRI1基因和一种或多种改善的产量性状的植物。在一些实施方案中,具有一种或多种改善的产量性状的植物包含突变的内源性BRI1基因,所述突变的内源性BRI1基因与SEQ ID NO:140-145中任一个具有至少90%序列同一性。在一些实施方案中,具有一种或多种改善的产量性状并包含突变的BRI1基因的植物是大豆植物,且所述BRI1基因包含与SEQ ID NO:140-142中任一个具有至少90%序列同一性的核酸序列。在一些实施方案中,具有一种或多种改善的产量性状并包含突变的BRI1基因的植物是玉米植物,所述BRI1基因包含与SEQ ID NO:143-145中任一个具有至少90%序列同一性的核酸序列。
在一些实施方案中,提供了一种产生植物或其部分的方法,所述植物或其部分包含至少一个具有突变的内源性BRI1基因的细胞,所述方法包括:使所述植物或植物部分中的内源性BRI1基因中的靶位点与包含裂解结构域和核酸结合结构域的核酸酶接触,其中所述核酸结合结构域与所述内源性BRI1基因中的靶位点结合,其中所述内源性BRI1基因:(a)包含与SEQ ID NO:69、70、85、86、99、100、112、113、123或124中任一个核苷酸序列具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:72-76、89-94、102-106、115-118或126-130中任一个具有至少80%同一性的区域;(c)编码与SEQ ID NO:71、87、88、101、114或125中任一个具有至少80%序列同一性的氨基酸序列;和/或(d)编码包含与SEQ ID NO:77-81、95-98、107-111、119-122或131-135中任一个具有至少80%同一性的区域的氨基酸序列,从而产生包含至少一个具有所述内源性BRI1基因中的突变的细胞的所述植物或其部分。在一些实施方案中,包含至少一个细胞并且具有内源性BRI1基因中的突变的植物或其部分包含突变的BRI1基因,所述突变的BRI1基因与SEQ ID NO:140-145中任一个具有至少90%序列同一性。在一些实施方案中,包含至少一个具有突变的BRI1基因的细胞的植物或其部分是大豆植物,且所述突变的BRI1基因包含与SEQ ID NO:140-142中任一个具有至少90%序列同一性的核酸序列。在一些实施方案中,包含至少一个具有突变的BRI1基因的细胞的植物或其部分是玉米植物,且所述突变的BRI1基因包含与SEQ ID NO:143-145中任一个具有至少90%序列同一性的核酸序列。
本文还提供一种产生包含突变的内源性油菜素内酯不敏感-1(BRI1)基因并表现出一种或多种改善的产量性状的植物或其部分的方法,所述方法包括使所述植物或植物部分的内源性BRI1基因中的靶位点与包含裂解结构域和核酸结合结构域的核酸酶接触,其中所述核酸结合结构域与所述内源性BRI1基因中的靶位点结合,其中所述内源性BRI1基因:(a)包含与SEQ ID NO:69、70、85、86、99、100、112、113、123或124中任一个核苷酸序列具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:72-76、89-94、102-106、115-118或126-130中任一个具有至少80%同一性的区域;(c)编码与SEQ ID NO:71、87、88、101、114或125中任一个具有至少80%序列同一性的氨基酸序列;和/或(d)编码包含与SEQ ID NO:77-81、95-98、107-111、119-122或131-135中任一个具有至少80%同一性的区域的氨基酸序列,从而产生包含具有突变的内源性BRI1基因并表现出一种或多种改善的产量性状的植物或其部分,任选地其中所述一种或多种改善的产量性状包括但不限于,与没有所述至少一个突变的对照植物相比,更高的产量(蒲式耳/英亩)、增加的生物量、增加的株高、增加的茎直径、增加的叶面积、增加的花数、增加的籽粒行数(任选地其中穗长不显著减少)、增加的籽粒数、增加的籽粒大小、增加的穗长、减少的分蘖数、减少的雄穗分枝数、每个节增加的荚果数量、每株植物增加的荚果数量,增加的种子数量、每个荚果增加的种子数量、增加的种子大小和/或增加的种子重量(例如,增加的百粒种子重量)。在一些实施方案中,所述一种或多种改善的产量性状包括但不限于,增加的籽粒行数(其中穗长不显著减少)、增加的穗长、增加的荚果数量和/或增加的种子数量。在一些实施方案中,包含如本文所述的突变的内源性BRI1基因的植物或其部分包含与SEQ ID NO:140-145中任一个具有至少90%序列同一性的核酸序列。在一些实施方案中,包含如本文所述的突变的内源性BRI1基因的植物或其部分是大豆植物,且突变的BRI1基因包含与SEQ ID NO:140-142中任一个具有至少90%序列同一性的核酸序列。在一些实施方案中,包含如本文所述的突变的内源性BRI1基因的植物或其部分是玉米植物,且突变的BRI1基因包含与SEQ ID NO:143-145中任一个具有至少90%序列同一性的核酸序列。
在一些实施方案中,核酸酶可以裂解内源性BRI1基因,从而将突变引入内源性BRI1基因。可用于本发明的核酸酶可以是可用于编辑/修饰靶核酸的任何核酸酶。这种核酸酶包括但不限于,锌指核酸酶、转录激活因子样效应物核酸酶(TALEN)、核酸内切酶(例如,Fok1)或CRISPR-Cas效应蛋白。同样,可用于本发明的任何核酸结合结构域可以是可用于编辑/修饰靶核酸的任何DNA结合结构域或RNA结合结构域。这种核酸结合结构域包括但不限于,锌指、转录激活因子样DNA结合结构域(TAL)、argonaute或CRISPR-Cas效应物DNA结合结构域。
在一些实施方案中,核酸结合结构域(例如,DNA结合结构域)包含在核酸结合多肽中。如本文所用的“核酸结合蛋白”或“核酸结合多肽”是指以位点和/或序列特异性方式结合核酸和/或能够以位点和/或序列特异性方式结合核酸的多肽。在一些实施方案中,核酸结合多肽可以是序列特异性核酸结合多肽(例如,序列特异性DNA结合结构域),诸如,但不限于,来自下列的序列特异性结合多肽和/或结构域:例如多核苷酸引导的核酸内切酶、CRISPR-Cas效应蛋白(例如,CRISPR-Cas核酸内切酶)、锌指核酸酶、转录激活因子样效应物核酸酶(TALEN)和/或Argonute蛋白。在一些实施方案中,核酸结合多肽包括裂解多肽(例如,核酸酶多肽和/或结构域),诸如,但不限于,核酸内切酶(例如,Fok1),多核苷酸引导的核酸内切酶,CRISPR-Cas核酸内切酶,锌指核酸酶,和/或转录激活因子样效应物核酸酶(TALEN)。在一些实施方案中,核酸结合多肽与一个或多个核酸分子(例如,与如本文所述的向导核酸形成复合物)缔合(例如,形成复合物)和/或能够与一个或多个核酸分子(例如,与如本文所述的向导核酸形成复合物)缔合(例如,形成复合物),所述核酸分子可以将核酸结合多肽指引或引导到与一个或多个核酸分子(或其部分或区域)互补的特异性靶核苷酸序列(例如,基因组的基因座),从而使核酸结合多肽与特异性靶位点处的核苷酸序列结合。在一些实施方案中,所述核酸结合多肽是如本文所述的CRISPR-Cas效应蛋白。在一些实施方案中,为简单起见,具体提到了CRISPR-Cas效应蛋白,但可以使用如本文所述的核酸结合多肽。在一些实施方案中,本发明的多核苷酸和/或核酸构建体可以是“表达盒”,或可以包含在表达盒内。
在一些实施方案中,提供了一种在植物或植物部分编辑内源性BRI1基因的方法,该方法包括将植物或植物部分中的内源性BRI1基因中的靶位点与胞嘧啶碱基编辑系统接触,所述胞嘧啶碱基编辑系统包括胞嘧啶脱氨酶和与内源性BRI1基因中的靶位点结合的核酸结合结构域,其中所述内源性BRI1基因:(a)包含与SEQ ID NO:69、70、85、86、99、100、112、113、123或124中任一个核苷酸序列具有至少80%序列同一性的序列;(b)包含与SEQID NO:72-76、89-94、102-106、115-118或126-130中任一个具有至少80%同一性的区域;(c)编码与SEQ ID NO:71、87、88、101、114或125中任一个具有至少80%序列同一性的氨基酸序列;和/或(d)编码包含与SEQ ID NO:77-81、95-98、107-111、119-122或131-135中任一个具有至少80%同一性的区域的氨基酸序列,从而编辑植物或其部分中的内源性BRI1基因,并产生包含至少一个具有内源性BRI1基因中的突变的细胞的植物或其部分。
在一些实施方案中,提供了一种在植物或植物部分编辑内源性BRI1基因的方法,该方法包括将植物或植物部分中的内源性BRI1基因中的靶位点与腺嘌呤碱基编辑系统接触,所述腺嘌呤碱基编辑系统包括腺嘌呤脱氨酶和与内源性BRI1基因中的靶位点结合的核酸结合结构域,所述BRI1基因:(a)包含与SEQ ID NO:69、70、85、86、99、100、112、113、123或124中任一个核苷酸序列具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:72-76、89-94、102-106、115-118或126-130中任一个具有至少80%同一性的区域;(c)编码与SEQID NO:71、87、88、101、114或125中任一个具有至少80%序列同一性的氨基酸序列;和/或(d)编码包含与SEQ ID NO:77-81、95-98、107-111、119-122或131-135中任一个具有至少80%同一性的区域的氨基酸序列,从而编辑植物或其部分中的内源性BRI1基因,并产生包含至少一个具有内源性BRI1基因中的突变的细胞的植物或其部分。
在一些实施方案中,提供了一种在植物的油菜素内酯不敏感-1(BRI1)基因中产生突变的方法,包括:(a)将基因编辑系统靶向所述BRI1基因的一部分,所述BRI1基因:(i)包含与SEQ ID NO:72-76、89-94、102-106、115-118或126-130中任一个具有至少80%序列同一性的序列;和/或(ii)编码与SEQ ID NO:77-81、95-98、107-111、119-122或131-135中任一个具有至少80%同一性的序列,以及(b)选择包含修饰的氨基酸残基的植物,所述修饰的氨基酸残基位于:大约位置955-975,参考SEQ ID NO:71的氨基酸位置编号;大约位置1023-1043,参考SEQ ID NO:87或SEQ ID NO:88的氨基酸位置编号;大约位置1081-1101,参考SEQID NO:101的氨基酸位置编号;大约位置1065-1085,参考SEQ ID NO:114的氨基酸位置编号;和/或大约位置1026-1046,参考SEQ ID NO:125的氨基酸位置编号;任选地位于:位置965处,参考SEQ ID NO:71的氨基酸位置编号;位置1033处,参考SEQ ID NO:87或SEQ IDNO:88的氨基酸位置编号;位置1091处,参考SEQ ID NO:101的氨基酸位置编号;位置1075处,参考SEQ ID NO:114的氨基酸位置编号;或位置1036处,参考SEQ ID NO:125的氨基酸位置编号。在一些实施方案中,BRI1基因中的突变可以包含与SEQ ID NO:140-145中任一个具有至少90%序列同一性的核酸序列。
由本发明的方法提供的突变可以是,例如,非天然突变。在一些实施方案中,突变可以是置换、插入和/或缺失,任选地,其中插入或缺失是框内插入或框内缺失。在一些实施方案中,突变可以是缺失约1个碱基对至约15个连续碱基对,任选地缺失3、6、9、12或15个连续碱基对。在一些实施方案中,缺失3、6、9、12或15个连续碱基对会导致从BRI1多肽中缺失1至约5个连续氨基酸残基。在一些实施方案中,突变位于由内源性BRI1基因编码的BRI1激酶结构域中。在一些实施方案中,由BRI1基因编码的BRI1激酶结构域位于:(a)大约核苷酸3156-3275、3176-3255和/或3176-3237,参考SEQ ID NO:69的核苷酸位置编号(例如,SEQID NO:72-76),(b)大约核苷酸2844-2963、2864-2943和/或2864-2924,参考SEQ ID NO:70的核苷酸位置编号(例如,SEQ ID NO:72-76),(c)大约核苷酸3258-3360、3278-3340和/或3291-3327,参考SEQ ID NO:85的核苷酸位置编号(例如,SEQ ID NO:89-94),(d)大约核苷酸2004-2106、2024-2085和/或2036-2073,参考SEQ ID NO:86的核苷酸位置编号(例如,SEQID NO:89-94),(e)大约核苷酸3130-3232、3150-3212和/或3180-3228,参考SEQ ID NO:99或SEQ ID NO:100的核苷酸位置编号(例如,SEQ ID NO:102-106),(f)大约核苷酸3169-3271、3189-3251和/或3204-3244,参考SEQ ID NO:113或SEQ ID NO:114的核苷酸位置编号(例如,SEQ ID NO:115-118),(g)大约核苷酸3349-3451、3369-3431和/或3381-3419,参考SEQ ID NO:123的核苷酸位置编号(例如,SEQ ID NO:126-130)和/或(h)大约核苷酸3057-3159、3077-3139和/或3089-3126,参考SEQ ID NO:124的核苷酸位置编号(例如,SEQ IDNO:126-130)。
在一些实施方案中,突变导致位于下列位置的修饰的氨基酸残基:大约位置955-975,参考SEQ ID NO:74的氨基酸位置编号;大约位置1023-1043,参考SEQ ID NO:90或SEQID NO:91的氨基酸位置编号;大约位置1081-1101,参考SEQ ID NO:104的氨基酸位置编号;大约位置1065-1085,参考SEQ ID NO:117的氨基酸位置编号;和/或大约位置1026-1046,参考SEQ ID NO:128的氨基酸位置编号;任选地位于:位置965处,参考SEQ ID NO:74的氨基酸位置编号;位置1033处,参考SEQ ID NO:90或SEQ ID NO:91的氨基酸位置编号;位置1091处,参考SEQ ID NO:104的氨基酸位置编号;位置1075处,参考SEQ ID NO:117的氨基酸位置编号;或位置1036处,参考SEQ ID NO:128的氨基酸位置编号。
在一些实施方案中,提供了一种检测突变的BRI1基因的方法,所述方法包括检测植物基因组中编码包含激酶结构域中的突变的BRI1多肽的内源性BRI1基因,任选地其中所述激酶结构域位于BRI1多肽中位于以下的区域中:(a)大约位置929-1002、942-994、949-987、956-975和/或960-970,参考SEQ ID NO:74的氨基酸位置编号(例如,SEQ ID NO:80-84),(b)大约位置997-1070、1008-1059、1018-1048和/或1028-1039,参考SEQ ID NO:90或SEQ ID NO:91的氨基酸位置编号(例如,SEQ ID NO:98-101),(c)大约位置1048-1122、1068-1102、1075-1095、1085-1096,参考SEQ IDNO:104的氨基酸位置编号(例如,SEQ IDNO:110-114),(d)大约位置1051-1097、1057-1090、1064-1082和/或1069-1080,参考SEQ IDNO:117的氨基酸位置编号(例如,SEQ ID NO:122-125),和/或(e)大约位置1000-1073、1013-1059、1020-1053、1027-1046和/或1031-1042,参考SEQ ID NO:128的氨基酸位置编号(例如,SEQ ID NO:101、134-137)。在一些实施方案中,提供了一种检测突变的BRI1基因的方法,该方法包括检测植物基因组中编码SEQ ID NO:71、87、88、101、114或125中任一个的氨基酸序列的核酸,其中SEQ ID NO:71、87、88、101、114或125中任一个的氨基酸序列包含位于下列位置的一个或多个氨基酸残基中的突变:大约位置955-975,参考SEQ ID NO:74的氨基酸位置编号;大约位置1023-1043,参考SEQ ID NO:90或SEQ ID NO:91的氨基酸位置编号;大约位置1081-1101,参考SEQ ID NO:104的氨基酸位置编号;大约位置1065-1085,参考SEQ ID NO:117的氨基酸位置编号;和/或大约位置1026-1046,参考SEQ ID NO:128的氨基酸位置编号;任选地位于:位置965处,参考SEQ ID NO:74的氨基酸位置编号;位置1033处,参考SEQ ID NO:90或SEQ ID NO:91的氨基酸位置编号;位置1091处,参考SEQ ID NO:104的氨基酸位置编号;位置1075处,参考SEQ ID NO:117的氨基酸位置编号;或位置1036处,参考SEQ ID NO:128的氨基酸位置编号。在一些实施方案中,所述突变是A至G(A>G)的核苷酸置换的结果。在一些实施方案中,突变的BRI1多肽包含至少一个突变,所述至少一个突变包含苏氨酸对丙氨酸的置换。在一些实施方案中,检测到的突变可以是非天然突变。
在一些实施方案中,本发明提供了一种产生植物的方法,所述植物包含内源性油菜素内酯不敏感-1(BRI1)基因中的突变和至少一个感兴趣的多核苷酸,所述方法包括:将本发明的包含内源性BRI1基因中的至少一个突变的植物(第一植物)与包含所述至少一个感兴趣的多核苷酸的第二植物杂交以产生后代植物;以及选择包含BRI1基因中的至少一个突变和至少一个感兴趣的多核苷酸的后代植物,从而产生包含内源性BRI1基因中的突变和至少一个感兴趣的多核苷酸的植物。
本发明还提供了一种产生包含内源性BRI1基因中的突变和至少一个感兴趣的多核苷酸的植物的方法,该方法包括将至少一个感兴趣的多核苷酸引入到本发明的包含BRI1基因中的至少一个突变的植物中,从而产生包含BRI1基因中至少一个突变和至少一个感兴趣的多核苷酸的植物。在一些实施方案中,植物是玉米植物。在一些实施方案中,植物是大豆植物。
在一些实施方案中,还提供一种产生植物的方法,所述植物包含内源性BRI1基因中的突变并表现出改善的产量性状、改善的植物结构和/或改善的防御性状的表型,所述方法包括:将第一植物(即,本发明的包含BRI1基因中的至少一个突变的植物)与表现出改善的产量性状、改善的植物结构和/或改善的防御性状的表型的第二植物杂交;以及选择包含所述BRI1基因中的所述突变以及改善的产量性状、改善的植物结构和/或改善的防御性状的表型的后代植物,从而产生包含内源性BRI1基因中的突变并与对照植物相比表现出改善的产量性状、改善的植物结构和/或改善的防御性状的表型的植物。
进一步提供一种防治容器(例如,花盆或育苗盘等)、生长室、温室、田地、休闲区、草坪中或路边的杂草的方法,所述方法包括:对在容器、生长室、温室、田地、休闲区、草坪中或路边生长的本发明的一种或多种(多种)植物施用除草剂,从而防治其中生长有所述一种或多种植物的所述容器、所述生长室、所述温室、所述田地、所述休闲区、所述草坪中或所述路边的杂草。
在一些实施方案中,提供了一种减少昆虫对植物的捕食的方法,该方法包括将杀虫剂施用于本发明的一种或多种植物,任选地,其中一种或多种植物生长在容器、生长室、温室、田地、休闲区、草坪或路边,从而减少昆虫对一种或多种植物的捕食。
在一些实施方案中,提供了一种减少植物上的真菌病害的方法,该方法包括将杀真菌剂施用于本发明的一种或多种植物,任选地,其中一种或多种植物生长在容器、生长室、温室、田地、休闲区、草坪或路边,从而减少一种或多种植物上的真菌病害。
感兴趣的多核苷酸可以是可以赋予植物以期望的表型或另外改变表型或基因型的任何多核苷酸。在一些实施方案中,感兴趣的多核苷酸可以是赋予除草剂耐性、抗虫性、线虫抗性、抗病性、增加的产量、增加的养分利用效率或抗非生物胁迫性的多核苷酸。
因此,根据本发明优选的待处理的植物或植物品种包括通过基因修饰获得遗传物质的所有植物,这些遗传物质赋予这些植物特别有利的有用特性(“性状”)。这些特性的例子是更好的植物生长、活力、抗胁迫性、站立性、抗倒伏性、养分吸收、植物营养和/或产量,特别是改善的生长、增加的对高温或低温的耐受性、增加的对干旱或对水或土壤盐度的耐受性、增强的开花性能、更容易收获、加速成熟、更高的产量、更高的质量和/或收获产品的更高营养价值,更长的储存寿命和/或收获产品的可加工性。
这些特性的进一步实例是对动物和微生物害虫的抵抗力提高,诸如对昆虫、蛛形纲动物、线虫、螨虫、蛞蝓和蜗牛的抵抗力,例如,因植物中形成的毒素所致。在编码赋予对此类动物和微生物害虫,特别是昆虫的耐受性特性的蛋白质的DNA序列中,将特别提到来自苏云金芽孢杆菌的编码Bt蛋白的遗传物质,Bt蛋白在文献中被广泛描述并为本领域技术人员所熟知。还将提到从细菌中提取的蛋白质,所述细菌诸如发光杆菌属(Photorhabdus)(WO97/17432和WO98/08932)。特别要提到的是Bt Cry或VIP蛋白,包括CrylA、CryIAb、CryIAc、CryIIA、CryIIIA、CryIIIB2、Cry9c Cry2Ab、Cry3Bb和CryIF蛋白或其毒性片段,以及它们的杂交体或组合,特别是CrylF蛋白或源自CrylF蛋白的杂交体(例如杂交CrylA-CrylF蛋白或其毒性片段),CrylA型蛋白或其毒性片段,优选CrylAc蛋白或衍生自CrylAc蛋白的杂交体(例如,杂交CrylAb-CrylAc蛋白)或CrylAb或Bt2蛋白或其毒性片段,Cry2Ae、Cry2Af或Cry2Ag蛋白或其毒性片段,CrylA.105蛋白或其毒性片段,VIP3Aa19蛋白,VIP3Aa20蛋白,在COT202或COT203棉花事件中产生的VIP3A蛋白,VIP3Aa蛋白或其毒性片段,如Estruch等人(1996),Proc Natl Acad Sci USA.28;93(11):5389-94中所述,如WO2001/47952中所述的Cry蛋白,来自致病杆菌属(Xenorhabdus)的杀虫蛋白(如WO98/50427中所述)、沙雷氏菌属(特别是来自嗜虫沙雷氏菌)或发光杆菌属菌株,诸如WO98/08932中所述的来自发光杆菌属的Tc蛋白。此外,这些蛋白质中任一个在某些氨基酸(1-10个,优选1-5个)上与上述命名的序列中任一个不同的任何变体或突变体,特别是它们的毒性片段的序列,或与转运肽融合,诸如质体转运肽,或另一种蛋白质或肽,都包括在本文中。
这种特性的另一个特别强调的实例是赋予对一种或多种除草剂的耐受性,所述除草剂例如咪唑啉酮、磺酰脲类、草甘膦或草丁膦。在编码蛋白质(即,感兴趣的多核苷酸)的DNA序列中,这些蛋白质赋予经转化的植物细胞和植物对某些除草剂的耐受性的特性,将特别提到WO2009/152359中描述的bar或PAT基因或天蓝链霉菌(Streptomyces coelicolor)基因,该基因赋予对草铵膦除草剂的耐受性;编码合适的EPSPS(5-烯醇丙酮酰莽草酸-3-磷酸-合酶)的基因赋予对以EPSPS为靶标的除草剂的耐受性,特别是诸如草甘膦及其盐类的除草剂;编码草甘膦-n-乙酰转移酶的基因,或编码草甘膦氧化还原酶的基因。其他合适的耐除草剂性状包括至少一种ALS(乙酰乳酸合酶)抑制剂(例如,WO2007/024782),突变的拟南芥ALS/AHAS基因(例如,美国专利6,855,533),编码2,4-D-单加氧酶的基因赋予对2,4-D(2,4-二氯苯氧乙酸)的耐受性和编码麦草畏单加氧酶的基因赋予对麦草畏(3,6-二氯-2-甲氧基苯甲酸)的耐受性。
这些特性的进一步实例是对植物病原真菌、细菌和/或病毒的抗性增强,例如,因系统获得性抗性(SAR)、系统素(systemin)、植物抗毒素、诱导子以及抗性基因和相应表达的蛋白质和毒素所致。
可以优先地根据本发明处理的转基因植物或植物品种中的特别有用的转基因事件包括:事件531/PV-GHBK04(棉花,昆虫防治,记载于WO2002/040677),事件1143-14A(棉花,昆虫防治,未保藏,记载于WO2006/128569);事件1143-51B(棉花,昆虫防治,未保藏,记载于WO2006/128570);事件1445(棉花,除草剂耐受性,未保藏,记载于US-A2002-120964或WO2002/034946);事件17053(水稻,除草剂耐受性,保藏为PTA-9843,记载于WO2010/117737);事件17314(水稻,除草剂耐受性,保藏为PTA-9844,记载于WO2010/117735);事件281-24-236(棉花,昆虫防治-除草剂耐受性,保藏为PTA-6233,记载于WO2005/103266或US-A2005-216969);事件3006-210-23(棉花,昆虫防治-除草剂耐受性,保藏为PTA-6233,记载于US-A 2007-143876或WO2005/103266);事件3272(玉米,质量性状,保藏为PTA-9972,记载于WO2006/098952或US-A2006-230473);事件33391(小麦,除草剂耐受性,保藏为PTA-2347,记载于WO2002/027004),事件40416(玉米,昆虫防治-除草剂耐受性,保藏为ATCC PTA-11508,记载于WO 11/075593);事件43A47(玉米,昆虫防治-除草剂耐受性,保藏为ATCCPTA-11509,记载于WO2011/075595);事件5307(玉米,昆虫防治,保藏为ATCC PTA-9561,记载于WO2010/077816);事件ASR-368(翦股颖,除草剂耐受性,保藏为ATCC PTA-4816,记载于US-A 2006-162007或WO2004/053062);事件B16(玉米,除草剂耐受性,未保藏,记载于US-A2003-126634);事件BPS-CV127-9(大豆,除草剂耐受性,保藏为NCIMB No.41603,记载于WO2010/080829);事件BLRl(油菜,恢复雄性不育,保藏为NCIMB 41193,记载于WO2005/074671),事件CE43-67B(棉花,昆虫防治,保藏为DSMACC2724,记载于US-A 2009-217423或WO2006/128573);事件CE44-69D(棉花,昆虫防治,未保藏,记载于US-A 2010-0024077);事件CE44-69D(棉花,昆虫防治,未保藏,记载于WO2006/128571);事件CE46-02A(棉花,昆虫防治,未保藏,记载于WO2006/128572);事件COT102(棉花,昆虫防治,未保藏,记载于US-A2006-130175或WO2004/039986);事件COT202(棉花,昆虫防治,未保藏,记载于US-A 2007-067868或WO2005/054479);事件COT203(棉花,昆虫防治,未保藏,记载于WO2005/054480););事件DAS21606-3/1606(大豆,除草剂耐受性,保藏为PTA-11028,记载于WO2012/033794),事件DAS40278(玉米,除草剂耐受性,保藏为ATCC PTA-10244,记载于WO2011/022469);事件DAS-44406-6/pDAB8264.44.06.l(大豆,除草剂耐受性,保藏为PTA-11336,记载于WO2012/075426),事件DAS-14536-7/pDAB8291.45.36.2(大豆,除草剂耐受性,保藏为PTA-11335,记载于WO2012/075429),事件DAS-59122-7(玉米,昆虫防治-除草剂耐受性,保藏为ATCC PTA 11384,记载于US-A2006-070139);事件DAS-59132(玉米,昆虫防治-除草剂耐受性,未保藏,记载于WO2009/100188);事件DAS68416(大豆,除草剂耐受性,保藏为ATCCPTA-10442,记载于WO2011/066384或WO2011/066360);事件DP-098140-6(玉米,除草剂耐受性,保藏为ATCC PTA-8296,记载于US-A 2009-137395或WO 08/112019);事件DP-305423-1(大豆,质量性状,未保藏,记载于US-A 2008-312082或WO2008/054747);事件DP-32138-1(玉米,杂交系统,保藏为ATCC PTA-9158,记载于US-A 2009-0210970或WO2009/103049);事件DP-356043-5(大豆,除草剂耐受性,保藏为ATCC PTA-8287,记载于US-A 2010-0184079或WO2008/002872);事件EE-I(茄子,昆虫防治,未保藏,记载于WO 07/091277);事件Fil 17(玉米,除草剂耐受性,保藏为ATCC 209031,记载于US-A 2006-059581或WO 98/044140);事件FG72(大豆,除草剂耐受性,保藏为PTA-11041,记载于WO2011/063413),事件GA21(玉米,除草剂耐受性,保藏为ATCC 209033,记载于US-A 2005-086719或WO 98/044140);事件GG25(玉米,除草剂耐受性,保藏为ATCC 209032,记载于US-A 2005-188434或WO98/044140);事件GHB119(棉花,昆虫防治-除草剂耐受性,保藏为ATCC PTA-8398,记载于WO2008/151780);事件GHB614(棉花,除草剂耐受性,保藏为ATCC PTA-6878,记载于US-A 2010-050282或WO2007/017186);事件GJ11(玉米,除草剂耐受性,保藏为ATCC 209030,记载于US-A 2005-188434或WO98/044140);事件GM RZ13(糖用甜菜,抗病毒性,保藏为NCIMB-41601,记载于WO2010/076212);事件H7-l(糖用甜菜,除草剂耐受性,保藏为NCIMB 41158或NCIMB 41159,记载于US-A 2004-172669或WO 2004/074492);事件JOPLINl(小麦,抗病性,未保藏,记载于US-A2008-064032);事件LL27(大豆,除草剂耐受性,保藏为NCIMB41658,记载于WO2006/108674或US-A 2008-320616);事件LL55(大豆,除草剂耐受性,保藏为NCIMB 41660,记载于WO 2006/108675或US-A2008-196127);事件LLcotton25(棉花,除草剂耐受性,保藏为ATCCPTA-3343,记载于WO2003/013224或US-A 2003-097687);事件LLRICE06(水稻,除草剂耐受性,保藏为ATCC 203353,记载于US 6,468,747或WO2000/026345);事件LLRice62(水稻,除草剂耐受性,保藏为ATCC 203352,记载于WO2000/026345),事件LLRICE601(水稻,除草剂耐受性,保藏为ATCC PTA-2600,记载于US-A 2008-2289060或WO2000/026356);事件LY038(玉米,质量性状,保藏为ATCC PTA-5623,记载于US-A2007-028322或WO2005/061720);事件MIR162(玉米,昆虫防治,保藏为PTA-8166,记载于US-A 2009-300784或WO2007/142840);事件MIR604(玉米,昆虫防治,未保藏,记载于US-A 2008-167456或WO2005/103301);事件MON15985(棉花,昆虫防治,保藏为ATCC PTA-2516,记载于US-A2004-250317或WO2002/100163);事件MON810(玉米,昆虫防治,未保藏,记载于US-A 2002-102582);事件MON863(玉米,昆虫防治,保藏为ATCC PTA-2605,记载于WO2004/011601或US-A 2006-095986);事件MON87427(玉米,人工授粉,保藏为ATCC PTA-7899,记载于WO2011/062904);事件MON87460(玉米,胁迫抗性,保藏为ATCC PTA-8910,记载于WO2009/111263或US-A 2011-0138504);事件MON87701(大豆,昆虫防治,保藏为ATCC PTA-8194,记载于US-A 2009-130071或WO2009/064652);事件MON87705(大豆,质量性状-除草剂耐受性,保藏为ATCC PTA-9241,记载于US-A 2010-0080887或WO2010/037016);事件MON87708(大豆,除草剂耐受性,保藏为ATCC PTA-9670,记载于WO2011/034704);事件MON87712(大豆,产量,保藏为PTA-10296,记载于WO2012/051199),事件MON87754(大豆,质量性状,保藏为ATCC PTA-9385,记载于WO2010/024976);事件MON87769(大豆,质量性状,保藏为ATCC PTA-8911,记载于US-A 2011-0067141或WO2009/102873);事件MON88017(玉米,昆虫防治-除草剂耐受性,保藏为ATCCPTA-5582,记载于US-A 2008-028482或WO2005/059103);事件MON88913(棉花,除草剂耐受性,保藏为ATCC PTA-4854,记载于WO2004/072235或US-A2006-059590);事件MON88302(油菜,除草剂耐受性,保藏为PTA-10955,记载于WO2011/153186),事件MON88701(棉花,除草剂耐受性,保藏为PTA-11754,记载于WO2012/134808),事件MON89034(玉米,昆虫防治,保藏为ATCC PTA-7455,记载于WO 07/140256或US-A 2008-260932);事件MON89788(大豆,除草剂耐受性,保藏为ATCC PTA-6708,记载于US-A2006-282915或WO2006/130436);事件MSl 1(油菜,人工授粉-除草剂耐受性,保藏为ATCC PTA-850或PTA-2485,记载于WO2001/031042);事件MS8(油菜,人工授粉-除草剂耐受性,保藏为ATCC PTA-730,记载于WO2001/041558或US-A2003-188347);事件NK603(玉米,除草剂耐受性,保藏为ATCC PTA-2478,记载于US-A 2007-292854);事件PE-7(水稻,昆虫防治,未保藏,记载于WO2008/114282);事件RF3(油菜,人工授粉-除草剂耐受性,保藏为ATCC PTA-730,记载于WO2001/041558或US-A 2003-188347);事件RT73(油菜,除草剂耐受性,未保藏,记载于WO2002/036831或US-A 2008-070260);事件SYHT0H2/SYN-000H2-5(大豆,除草剂耐受性,保藏为PTA-11226,记载于WO2012/082548),事件T227-1(糖用甜菜,除草剂耐受性,未保藏,记载于WO2002/44407或US-A2009-265817);事件T25(玉米,除草剂耐受性,未保藏,记载于US-A2001-029014或WO2001/051654);事件T304-40(棉花,昆虫防治-除草剂耐受性,保藏为ATCC PTA-8171,记载于US-A 2010-077501或WO2008/122406);事件T342-142(棉花,昆虫防治,未保藏,记载于WO2006/128568);事件TC1507(玉米,昆虫防治-除草剂耐受性,未保藏,记载于US-A 2005-039226或WO2004/099447);事件VIP1034(玉米,昆虫防治-除草剂耐受性,保藏为ATCC PTA-3925,记载于WO2003/052073),事件32316(玉米,昆虫防治-除草剂耐受性,保藏为PTA-11507,记载于WO2011/084632),事件4114(玉米,昆虫防治-除草剂耐受性,保藏为PTA-11506,记载于WO2011/084621),事件EE-GM3/FG72(大豆,除草剂耐受性,ATCC登录号N°PTA-11041)任选地叠加事件EE-GM1/LL27或事件EE-GM2/LL55(WO2011/063413A2),事件DAS-68416-4(大豆,除草剂耐受性,ATCC登录号N°PTA-10442,WO2011/066360A1),事件DAS-68416-4(大豆,除草剂耐受性,ATCC登录号N°PTA-10442,WO2011/066384A1),事件DP-040416-8(玉米,昆虫防治,ATCC登录号N°PTA-11508,WO2011/075593A1),事件DP-043A47-3(玉米,昆虫防治,ATCC登录号N°PTA-11509,WO2011/075595A1),事件DP-004114-3(玉米,昆虫防治,ATCC登录号N°PTA-11506,WO2011/084621A1),事件DP-032316-8(玉米,昆虫防治,ATCC登录号N°PTA-11507,WO2011/084632A1),事件MON-88302-9(油菜,除草剂耐受性,ATCC登录号N°PTA-10955,WO2011/153186A1),事件DAS-21606-3(大豆,除草剂耐受性,ATCC登录号No.PTA-11028,WO2012/033794A2),事件MON-87712-4(大豆,质量性状,ATCC登录号N°.PTA-10296,WO2012/051199A2),事件DAS-44406-6(大豆,叠加了除草剂耐受性,ATCC登录号N°.PTA-11336,WO2012/075426A1),事件DAS-14536-7(大豆,叠加了除草剂耐受性,ATCC登录号N°.PTA-11335,WO2012/075429A1),事件SYN-000H2-5(大豆,除草剂耐受性,ATCC登录号N°.PTA-11226,WO2012/082548A2),事件DP-061061-7(油菜,除草剂耐受性,无保藏N°可获得,WO2012071039A1),事件DP-073496-4(油菜,除草剂耐受性,无保藏N°可获得,US2012131692),事件8264.44.06.1(大豆,叠加了除草剂耐受性,登录号N°PTA-11336,WO2012075426A2),事件8291.45.36.2(大豆,叠加了除草剂耐受性,登录号N°.PTA-11335,WO2012075429A2),事件SYHT0H2(大豆,ATCC登录号N°.PTA-11226,WO2012/082548A2),事件MON88701(棉花,ATCC登录号N°PTA-11754,WO2012/134808A1),事件KK179-2(苜蓿,ATCC登录号N°PTA-11833,WO2013/003558A1),事件pDAB8264.42.32.1(大豆,叠加了除草剂耐受性,ATCC登录号N°PTA-11993,WO2013/010094A1),事件MZDT09Y(玉米,ATCC登录号N°PTA-13025,WO2013/012775A1)。
赋予关心的期望性状的基因/事件(例如,感兴趣的多核苷酸)也可以在转基因植物中与另一基因/事件彼此组合存在。可以提及的转基因植物的实例是重要作物植物,诸如谷物(小麦、水稻、黑小麦、大麦、黑麦、燕麦)、玉米、大豆、马铃薯、糖用甜菜、甘蔗、番茄、豌豆和其他类型的蔬菜、棉花、烟草、油菜和水果植物(水果有苹果、梨、柑橘类水果和葡萄),特别强调玉米、大豆、小麦、水稻、马铃薯、棉花、甘蔗、烟草和油菜。特别强调的性状是植物对昆虫、蛛形纲动物、线虫、蛞蝓和蜗牛的抗性增强,以及植物对一种或多种除草剂的抗性增强。
根据本发明可以优先处理的此类植物、植物部分或植物种子的市售实例包括商业产品,诸如以RIB/>ROUNDUP/>VT DOUBLE/>VT TRIPLE/>BOLLGARDROUNDUP READY 2/>ROUNDUP/>2XTENDTM、INTACTA RR2/>VISTIVE/>和/或XTENDFLEXTM商品名销售或分销的植物种子。
可用于本发明的BRI1基因包括任何BRI1基因,其中如本文所述的突变可以赋予包含该突变的植物或其部分中的一个或多个产量性状的改善。在一些实施方案中,内源性BRI1基因:(a)包含与SEQ ID NO:69、70、85、86、99、100、112、113、123或124中任一个核苷酸序列具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:72-76、89-94、102-106、115-118或126-130中任一个具有至少80%同一性的区域;(c)编码与SEQ ID NO:71、87、88、101、114或125中任一个具有至少80%序列同一性的氨基酸序列;和/或(d)编码包含与SEQ IDNO:77-81、95-98、107-111、119-122或131-135中任一个具有至少80%同一性的区域的氨基酸序列。
在一些实施方案中,植物中内源性BRI1基因中的至少一个突变可以是碱基置换、碱基缺失和/或碱基插入,任选地,其中突变可以是非天然突变。在一些实施方案中,与没有编辑/突变的对照植物相比,植物中内源性BRI1基因的至少一个突变可以导致具有一种或多种改善的产量性状的表型的植物,任选地其中改善的产量性状可以包括但不限于,更高的产量(蒲式耳/英亩)、增加的生物量、增加的株高、增加的茎直径、增加的叶面积、增加的花数、增加的籽粒行数(任选地其中穗长不显著减少)、增加的籽粒数、增加的籽粒大小、增加的穗长、减少的分蘖数、减少的雄穗分枝数、每个节增加的荚果数量、每株植物增加的荚果数量,增加的种子数量、每个荚果增加的种子数量、增加的种子大小和/或增加的种子重量(例如,增加的百粒种子重量)。在一些实施方案中,所述一种或多种改善的产量性状包括但不限于,增加的籽粒行数(其中穗长不显著减少)、增加的穗长、增加的荚果数量和/或增加的种子数量。在一些实施方案中,内源性BRI1基因中的突变可以是至少1个核苷酸至约15个核苷酸(例如,约1、2、3、4、5、6、7、8、9、10、11、12、13、14或15个核苷酸,或其中的任何范围或值)的碱基置换、碱基缺失和/或碱基插入,任选地其中所述突变可以导致BRI1多肽的一个或多个氨基酸残基(例如,1、2、3、4、5个氨基酸)的置换、缺失和/或插入。在一些实施方案中,至少一个突变可以是碱基置换为A,T,G,或C。在一些实施方案中,所述至少一个突变可以是,例如从A至G的碱基置换(A>G)。突变可以是点突变。在一些实施方案中,突变可以导致位于下列位置的置换的氨基酸残基:大约位置955-975,参考SEQ ID NO:71的氨基酸位置编号;大约位置1023-1043,参考SEQ ID NO:87或SEQ ID NO:88的氨基酸位置编号;大约位置1081-1101,参考SEQ ID NO:103的氨基酸位置编号;大约位置1065-1085,参考SEQ ID NO:114的氨基酸位置编号;和/或大约位置1026-1046,参考SEQ ID NO:125的氨基酸位置编号;任选地位于:位置965处,参考SEQ ID NO:71的氨基酸位置编号;位置1033处,参考SEQ IDNO:87或SEQ ID NO:88的氨基酸位置编号;位置1091处,参考SEQ ID NO:103的氨基酸位置编号;位置1075处,参考SEQ ID NO:114的氨基酸位置编号;或位置1036处,参考SEQ ID NO:125的氨基酸位置编号。
在一些实施方案中,内源性BRI1基因中的突变可以通过编辑系统在裂解后进行,该编辑系统包括核酸酶和与靶核酸(例如,BRI1基因)内的靶位点结合的核酸结合结构域,所述靶核酸包含与SEQ ID NO:69,70,85,86,99,100,112,113,123,或124中任一个核苷酸序列具有至少80%序列同一性的序列和/或编码与SEQ ID NO:71、87、88、101、114或125中任一个具有至少80%序列同一性的氨基酸序列的序列,任选地其中靶位点位于BRI1基因的区域:所述区域包含与SEQ ID NO:72-76、89-94、102-106、115-118或126-130中任一个具有至少80%序列同一性的序列和/或编码与SEQ ID NO:77-81、95-98、107-111、119-122或131-135中任一个具有至少80%的同一性的氨基酸序列的序列。
进一步提供了与油菜素内酯不敏感-1(BRI1)基因中的靶位点结合的向导核酸(例如,gRNA,gDNA,crRNA,crDNA),其中靶位点位于BRI1基因中的区域,所述区域位于:(a)大约核苷酸3096-3235、3136-3295、3156-3275、3176-3255和/或3176-3237,参考SEQ ID NO:69的核苷酸位置编号(例如,SEQ ID NO:72-76),(b)大约核苷酸2784-3023、2824-2983、2844-2963、2864-2943和/或2864-2924,参考SEQ ID NO:70的核苷酸位置编号(例如,SEQ ID NO:72-76),(c)大约核苷酸3198-3420、3238-3380、3258-3360、3278-3340和/或3291-3327,参考SEQ ID NO:85的核苷酸位置编号(例如,SEQ ID NO:89-94),(d)大约核苷酸1944-2166、1984-2126、2004-2106、2024-2085和/或2036-2073,参考SEQ ID NO:86的核苷酸位置编号(例如,SEQ ID NO:89-94),(e)大约核苷酸3070-3292、3110-3252、3130-3232、3150-3212和/或3180-3228,参考SEQ ID NO:99或SEQ ID NO:100的核苷酸位置编号(例如,SEQ IDNO:102-106),(f)大约核苷酸3109-3331、3149-3291、3169-3271、3189-3251和/或3204-3244,参考SEQ ID NO:113或SEQ ID NO:114的核苷酸位置编号(例如,SEQ ID NO:115-118),(g)大约核苷酸3289-3511、3329-3471、3349-3451、3369-3431和/或3381-3419,参考SEQ ID NO:123的核苷酸位置编号(例如,SEQ ID NO:126-130)和/或(h)大约核苷酸2997-3219、3037-3179、3057-3159、3077-3139和/或3089-3126,参考SEQ ID NO:124的核苷酸位置编号(例如,SEQ ID NO:126-130)。在一些实施方案中,向导核酸包含间隔区,所述间隔区包含SEQ ID NO:82-84和/或SEQ ID NO:136-139中任一核苷酸序列。
在一些实施方案中,提供了一种玉米植物或其植物部分,包含至少一个内源性油菜素内酯不敏感-1(BRI1)基因中的至少一个突变,所述BRI1基因具有GRMZM6G437417(基因座370)的基因识别号(基因ID),任选地其中突变可以是非天然突变。
在一些实施方案中,提供了一种大豆植物或其植物部分,包含至少一个内源性油菜素内酯不敏感-1(BRI1)基因中的至少一个突变,所述BRI1基因具有Glyma.06g147600(基因座325)、Glyma.04g115700(基因座326)、Glyma.06g320600(基因座327)和/或Glyma.04g218300(基因座328)的基因识别号(基因ID),任选地其中突变可以是非天然突变。
在一些实施方案中,提供了一种与油菜素内酯不敏感-1(BRI1)基因中的靶核酸结合的向导核酸,所述BRI1基因具有GRMZM6G437417(基因座370)、Glyma.06g147600(基因座325)、Glyma.04g115700(基因座326)、Glyma.06g320600(基因座327)和/或Glyma.04g218300(基因座328)的基因识别号(基因ID)。
在一些实施方案中,提供了一种包含向导核酸和与所述向导核酸缔合的CRISPR-Cas效应蛋白的系统,所述向导核酸包含具有SEQ ID NO:82-84和/或SEQ ID NO:136-139中任一个核苷酸序列的间隔序列。在一些实施方案中,该系统还包含与向导核酸和CRISPR-Cas效应蛋白缔合的tracr核酸,任选地其中所述tracr核酸和所述向导核酸共价连接。
如本文所用,“与向导核酸缔合的CRISPR-Cas效应蛋白”是指在CRISPR-Cas效应蛋白和向导核酸之间形成的复合物,以便将CRISPR-Cas效应蛋白引导至基因中的靶位点。
本发明还提供了一种基因编辑系统,该基因编辑系统包含与向导核酸缔合的CRISPR-Cas效应蛋白,并且该向导核酸包含与内源性油菜素内酯不敏感-1(BRI1)基因结合的间隔序列,任选地其中BRI1基因:(a)包含与SEQ ID NO:69、70、85、86、99、100、112、113、123或124中任一个核苷酸序列具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:72-76、89-94、102-106、115-118或126-130中任一个具有至少80%同一性的区域;(c)编码与SEQ ID NO:71、87、88、101、114或125中任一个具有至少80%序列同一性的氨基酸序列;和/或(d)编码包含与SEQ ID NO:77-81、95-98、107-111、119-122或131-135中任一个具有至少80%同一性的区域的氨基酸序列。在一些实施方案中,所述向导核酸的间隔序列可以包含SEQ ID NO:82-84和/或SEQ ID NO:136-139中任一个的核苷酸序列。在一些实施方案中,基因编辑系统还可以包含与向导核酸和CRISPR-Cas效应蛋白缔合的tracr核酸,任选地其中所述tracr核酸和所述向导核酸共价连接。
本发明还提供了一种包含含有裂解结构域的CRISPR-Cas效应蛋白和向导核酸的复合物,其中所述向导核酸与内源性油菜素内酯不敏感-1(BRI1)基因中的靶位点结合,其中所述内源性BRI1基因:(a)包含与SEQ ID NO:69、70、85、86、99、100、112、113、123或124中任一个核苷酸序列具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:72-76、89-94、102-106、115-118或126-130中任一个具有至少80%同一性的区域;(c)编码与SEQ ID NO:71、87、88、101、114或125中任一个具有至少80%序列同一性的氨基酸序列;和/或(d)编码包含与SEQ ID NO:77-81、95-98、107-111、119-122或131-135中任一个具有至少80%同一性的区域的氨基酸序列,其中所述裂解结构域裂解所述BRI1基因中的靶链。
在一些实施方案中,提供了一种表达盒,包含:(a)编码包含裂解结构域的CRISPR-Cas效应蛋白的多核苷酸,和(b)与内源性油菜素内酯不敏感-1(BRI1)基因中的靶位点结合的向导核酸,其中所述向导核酸包含与下列互补并结合的间隔序列:(i)与SEQ ID NO:69、70、85、86、99、100、112、113、123或124中任一个核苷酸序列具有至少80%序列同一性的核酸部分;(ii)与SEQ ID NO:72-76、89-94、102-106、115-118或126-130中任一个具有至少80%序列同一性的核酸部分;(iii)编码与SEQ ID NO:71、87、88、101、114或125中任一个具有至少80%序列同一性的氨基酸序列的核酸部分;和/或(iv)编码与SEQ ID NO:77-81、95-98、107-111、119-122或131-135中任一个具有至少80%同一性的氨基酸序列的核酸部分。
在一些实施方案中,提供了一种修饰的油菜素内酯不敏感-1(BRI1)多肽,包含位于下列位置的氨基酸残基的突变:大约位置955-975,参考SEQ ID NO:71的氨基酸位置编号;大约位置1023-1043,参考SEQ ID NO:87或SEQ ID NO:88的氨基酸位置编号;大约位置1081-1101,参考SEQ ID NO:101的氨基酸位置编号;大约位置1065-1085,参考SEQ ID NO:114的氨基酸位置编号;和/或大约位置1026-1046,参考SEQ ID NO:125的氨基酸位置编号;任选地位于:位置965处,参考SEQ ID NO:71的氨基酸位置编号;位置1033处,参考SEQ IDNO:87或SEQ ID NO:88的氨基酸位置编号;位置1091处,参考SEQ ID NO:101的氨基酸位置编号;位置1075处,参考SEQ ID NO:114的氨基酸位置编号;或位置1036处,参考SEQ ID NO:125的氨基酸位置编号。还提供了编码突变的BRI1多肽的核酸,任选地其中,当存在于植物或植物部分中时,突变的BRI1多肽/BRI1基因导致与没有突变的植物或植物部分相比包含一种或多种改善的产量性状的表型的植物。
本发明的核酸构建体(例如,包含序列特异性核酸结合结构域(例如,序列特异性DNA结合结构域)、CRISPR-Cas效应结构域、脱氨酶结构域、逆转录酶(RT)、RT模板和/或向导核酸等的构建体)以及包含所述核酸构建体的表达盒/载体,可用作本发明的编辑系统,用于修饰靶核酸(例如,内源性BRI1基因)和/或它们的表达。
任何包含内源性BRI1基因的植物可以如本文所述(例如,使用本发明的多肽、多核苷酸、RNP、核酸构建体、表达盒和/或载体)进行修饰(例如,突变,例如,碱基编辑、裂解、做切口等)以改善植物的一种或多种产量性状,所述植物在如本文所述修饰时能够赋予至少一种改善的产量性状。表现出改善的产量性状的植物可以显示出,与不含突变的内源性BRI1基因的植物或植物部分相比,产量性状的约5%至约100%的改善(例如,约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99,或100%或更多或其中的任何范围或值;例如,约5%至约10%,约5%至约15%,约5%至约20%,约10%至约50%,约10%至约80%,约10%至约90%,约10%至约100%,约20%至约50%,约20%至约80%,约20%至约90%,约20%至约100%,约30%至约50%,约30%至约80%,约30%至约90%,约30%至约100%,约50%至约100%,约75%至约100%或更多,以及其中的任何范围或值)。
可用于本发明的编辑系统可以是现在已知或以后开发的任何位点特异性(序列特异性)基因组编辑系统,该系统可以以靶标特异性的方式引入突变。例如,编辑系统(例如,位点或序列特异性编辑系统)可以包括但不限于,CRISPR-Cas编辑系统、兆核酸酶编辑系统、锌指核酸酶(ZFN)编辑系统、转录激活因子样效应物核酸酶(TALEN)编辑系统、碱基编辑系统和/或先导编辑系统,其中每个系统可以包含一个或多个多肽和/或一个或多个多核苷酸,当在细胞中作为一个系统表达时可以以序列特异性方式修饰(突变)靶核酸。在一些实施方案中,编辑系统(例如,位点或序列特异性编辑系统)可以包含一个或多个多核苷酸和/或一个或多个多肽,包括但不限于核酸结合结构域(DNA结合结构域)、核酸酶、和/或其他多肽、和/或多核苷酸。
在一些实施方案中,编辑系统可以包含一个或多个序列特异性核酸结合结构域(DNA结合结构域),这些结构域可以来自,例如,多核苷酸引导的核酸内切酶、CRISPR-Cas核酸内切酶(例如,CRISPR-Cas效应蛋白)、锌指核酸酶、转录激活因子样效应物核酸酶(TALEN)和/或Argonaute蛋白。在一些实施方案中,编辑系统可以包含一个或多个裂解结构域(例如,核酸酶),包括但不限于,核酸内切酶(例如,Fok1)、多核苷酸引导的核酸内切酶、CRISPR-Cas核酸内切酶(例如,CRISPR-Cas效应蛋白)、锌指核酸酶和/或转录激活因子样效应物核酸酶(TALEN)。在一些实施方案中,编辑系统可以包含一种或多种多肽,包括但不限于,脱氨酶(例如,胞嘧啶脱氨酶、腺嘌呤脱氨酶)、逆转录酶、Dna2多肽和/或5'flap核酸内切酶(FEN)。在一些实施方案中,编辑系统可以包含一个或多个多核苷酸,包括但不限于,CRISPR阵列(CRISPR向导)核酸、延伸的向导核酸和/或逆转录酶模板。
在一些实施方案中,修饰或编辑油菜素内酯不敏感-1(BRI1)基因的方法可以包括将靶核酸(例如,编码BRI1多肽的核酸)与融合到脱氨酶结构域(例如,腺嘌呤脱氨酶和/或胞嘧啶脱氨酶)和向导核酸的碱基编辑融合蛋白(例如,序列特异性DNA结合蛋白(例如,CRISPR-Cas效应蛋白或结构域)接触,其中所述向导核酸能够引导碱基编辑融合蛋白至靶核酸/使碱基编辑融合蛋白靶向靶核酸,从而编辑靶核酸内的位点。在一些实施方案中,碱基编辑融合蛋白和向导核酸可以包含在一个或多个表达盒中。在一些实施方案中,靶核酸可以与碱基编辑融合蛋白和包含向导核酸的表达盒接触。在一些实施方案中,序列特异性核酸结合融合蛋白和向导物可以作为核糖核蛋白(RNP)提供。在一些实施方案中,细胞可以与多于一个碱基编辑融合蛋白和/或一个或多个向导核酸接触,所述向导核酸可以靶向细胞中的一个或多个靶核酸。
在一些实施方案中,修饰或编辑油菜素内酯不敏感-1(BRI1)基因的方法可以包括将靶核酸(例如,编码BRI1多肽的核酸)与融合到肽标签的序列特异性核酸结合融合蛋白(例如,序列特异性DNA结合蛋白(例如,CRISPR-Cas效应蛋白或结构域)、融合到亲和多肽(能够与肽标签结合)的包含脱氨酶结构域(例如,腺嘌呤脱氨酶和/或胞嘧啶脱氨酶)的脱氨酶融合蛋白和向导核酸接触,其中向导核酸能够引导序列特异性核酸结合融合蛋白到靶核酸/使序列特异性核酸结合融合蛋白靶向靶核酸,并且序列特异性核酸结合融合蛋白能够通过肽标签-亲和多肽相互作用将脱氨酶融合蛋白募集到靶核酸,从而编辑靶核酸内的位点。在一些实施方案中,序列特异性核酸结合融合蛋白可以与结合肽标签的亲和多肽融合,脱氨酶可以与肽标签融合,从而将脱氨酶募集到序列特异性核酸结合融合蛋白和靶核酸上。在一些实施方案中,序列特异性结合融合蛋白、脱氨酶融合蛋白和向导核酸可以包含在一个或多个表达盒中。在一些实施方案中,靶核酸可以与序列特异性结合融合蛋白、脱氨酶融合蛋白和包含向导核酸的表达盒接触。在一些实施方案中,序列特异性核酸结合融合蛋白、脱氨酶融合蛋白和向导物可以作为核糖核蛋白(RNP)提供。
在一些实施方案中,诸如先导编辑的方法可用于在内源性BRI1基因中产生突变。在先导编辑中,RNA依赖性DNA聚合酶(逆转录酶,RT)和逆转录酶模板(RT模板)与序列特异性核酸结合结构域组合使用,这些结构域赋予以序列特异性方式识别和结合靶标的能力,并且还可以导致靶标内含PAM的链出现缺口。核酸结合结构域可以是CRISPR-Cas效应蛋白,在这种情况下,CRISPR阵列或向导RNA可以是延伸的向导,其包括包含引物结合位点(PSB)和要掺入基因组的编辑(模板)的延伸部分。与碱基编辑类似,先导编辑可以利用各种募集蛋白质的方法用于对靶位点进行编辑,这些方法包括在选定的基因组编辑过程中使用的蛋白质和核酸之间的非共价和共价相互作用两者。
如本文所用,“CRISPR-Cas效应蛋白”是裂解或切割核酸、结合核酸(例如,靶核酸和/或向导核酸)和/或鉴定、识别或结合如本文定义的向导核酸的蛋白质或多肽或其结构域。在一些实施方案中,CRISPR-Cas效应蛋白可以是酶(例如,核酸酶、核酸内切酶、切口酶等)或其部分和/或可以作为酶起作用。在一些实施方案中,CRISPR-Cas效应蛋白是指CRISPR-Cas核酸酶多肽或其结构域,其包含核酸酶活性或其中核酸酶活性已降低或消除,和/或包含切口酶活性或其中切口酶已降低或消除,和/或包含单链DNA裂解活性(ss DNAse活性)或其中ss DNAse活性已降低或消除,和/或包含自加工RNAse活性或其中自加工RNAse活性已降低或消除。CRISPR-Cas效应蛋白可以与靶核酸结合。
在一些实施方案中,序列特异性核酸结合结构域可以是CRISPR-Cas效应蛋白。在一些实施方案中,CRISPR-Cas效应蛋白可以来自I型CRISPR-Cas系统、II型CRISPR-Cas系统、III型CRISPR-Cas系统、IV型CRISPR-Cas系统、V型CRISPR-Cas系统或VI型CRISPR-Cas系统。在一些实施方案中,本发明的CRISPR-Cas效应蛋白可以来自II型CRISPR-Cas系统或V型CRISPR-Cas系统。在一些实施方案中,CRISPR-Cas效应蛋白可以是II型CRISPR-Cas效应蛋白,例如,Cas9效应蛋白。在一些实施方案中,CRISPR-Cas效应蛋白可以是V型CRISPR-Cas效应蛋白,例如Cas12效应蛋白。
在一些实施方案中,CRISPR-Cas效应蛋白可以包括但不限于,Cas9、C2c1、C2c3、Cas12a(也称为Cpf1)、Cas12b、Cas12c、Cas12d、Cas12e、Cas13a、Cas13b、Cas13c、Cas13d、Casl、CaslB、Cas2、Cas3、Cas3'、Cas3”、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也称为Csnl和Csx12)、Cas10、Csyl、Csy2、Csy3、Csel、Cse2、Cscl、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmrl、Cmr3、Cmr4、Cmr5、Cmr6、Csbl、Csb2、Csb3、Csxl7、Csxl4、Csx10、Csx16、CsaX、Csx3、Csxl、Csxl5、Csfl、Csf2、Csf3、Csf4(dinG),和/或Csf5核酸酶,任选地其中CRISPR-Cas效应蛋白可以是Cas9、Cas12a(Cpf1)、Cas12b、Cas12c(C2c3)、Cas12d(CasY)、Cas12e(CasX)、Cas12g、Cas12h、Cas12i、C2c4、C2c5、C2c8、C2c9、C2c10、Cas14a、Cas14b,和/或Cas14c效应蛋白。
在一些实施方案中,可用于本发明的CRISPR-Cas效应蛋白可以包含在其核酸酶活性位点(例如,Cas12a核酸酶结构域的RuvC、HNH,例如,RuvC位点;例如,Cas9核酸酶结构域的RuvC位点和/或HNH位点)中的突变。CRISPR-Cas效应蛋白在其核酸酶活性位点发生突变,因此不再包含核酸酶活性,通常称为“死”,例如,dCas。在一些实施方案中,与没有突变的相同CRISPR-Cas效应蛋白(例如,切口酶,例如,Cas9切口酶,Cas12a切口酶)相比,在其核酸酶活性位点中具有突变的CRISPR-Cas效应蛋白结构域或多肽可以具有活性受损或活性降低。
可用于本发明的CRISPR Cas9效应蛋白或CRISPR Cas9效应结构域可以是任何已知或后来鉴定的Cas9核酸酶。在一些实施方案中,CRISPR Cas9多肽可以是来自例如链球菌属(例如,酿脓链球菌、嗜热链球菌)、乳杆菌属(Lactobacillus spp.)、双歧杆菌属(Bifidobacterium spp.)、坎德尔菌属(Kandleria spp.)、明串珠菌属(Leuconostocspp.)、酒球菌属(Oenococcus spp.)、片球菌属(Pediococcus spp.)、魏斯氏菌属(Weissella spp.)和/或欧鲁森氏菌属(Olsenella spp.)的Cas9多肽。示例性Cas9序列包括但不限于,SEQ ID NO:56和SEQ ID NO:57的氨基酸序列或SEQ ID NO:58-68的核苷酸序列。
在一些实施方案中,CRISPR-Cas效应蛋白可以是源自酿脓链球菌的Cas9多肽,并识别PAM序列基序NGG、NAG、NGA(Mali等人,Science 2013;339(6121):823-826)。在一些实施方案中,CRISPR-Cas效应蛋白可以是源自嗜热链球菌的Cas9多肽,并识别PAM序列基序NGGNG和/或NNAGAAW(W=A或T)(参见,例如,Horvath等人,Science,2010;327(5962):167-170,和Deveau等人,J Bacteriol 2008;190(4):1390-1400)。在一些实施方案中,CRISPR-Cas效应蛋白可以是源自变形链球菌的Cas9多肽,并识别PAM序列基序NGG和/或NAAR(R=A或G)(参见,例如,Deveau等人,J BACTERIOL 2008;190(4):1390-1400)。在一些实施方案中,CRISPR-Cas效应蛋白可以是源自金黄色葡萄球菌的Cas9多肽,并识别PAM序列基序NNGRR(R=A或G)。在一些实施方案中,CRISPR-Cas效应蛋白可以是源自金黄色葡萄球菌的Cas9蛋白,其识别PAM序列基序N GRRT(R=A或G)。在一些实施方案中,CRISPR-Cas效应蛋白可以是源自金黄色葡萄球菌的Cas9多肽,其识别PAM序列基序N GRRV(R=A或G)。在一些实施方案中,CRISPR-Cas效应蛋白可以是源自脑膜炎奈瑟氏菌的Cas9多肽,并识别PAM序列基序N GATT或N GCTT(R=A或G,V=A,G或C)(参见,例如,Hou等人,PNAS2013,1-6)。在上述实施方案中,N可以是任何核苷酸残基,例如,A、G、C或T中的任一种。在一些实施方案中,CRISPR-Cas效应蛋白可以是来源于沙氏纤毛菌(Leptotrichia shahii)的Cas13a蛋白,其识别单个3'A、U或C的原间隔区侧翼序列(PFS)(或RNA PAM(rPAM))序列基序,其可以位于靶核酸内。
在一些实施方案中,CRISPR-Cas效应蛋白可以来源于Cas12a,Cas12a是一种V型簇状规则间隔的短回文重复序列(CRISPR)-Cas核酸酶,参见,例如,SEQ ID NO:1-17的氨基酸序列,SEQ ID NO:18-20的核酸序列。Cas12a在几个方面与更知名的II型CRISPR Cas9核酸酶不同。例如,Cas9识别富含G的原间隔区邻接基序(PAM),该基序在其向导RNA(gRNA、sgRNA、crRNA、crDNA、CRISPR阵列)结合位点(原间隔区、靶核酸、靶DNA)的3'(3'-NGG),而Cas12a识别富含T的PAM,其位于靶核酸的5'(5'-TTN,5'-TTTN)。事实上,Cas9和Cas12a结合其向导RNA的方向相对于它们的N和C末端几乎是相反的。此外,Cas12a酶使用单一向导RNA(gRNA、CRISPR阵列、crRNA)而不是天然Cas9系统中发现的双向导RNA(sgRNA(例如,crRNA和tracrRNA)),并且Cas12a处理自己的gRNA。此外,Cas12a核酸酶活性产生交错的DNA双链断裂,而不是Cas9核酸酶活性产生的平端,Cas12a依靠单个RuvC结构域切割两条DNA链,而Cas9利用HNH结构域和RuvC结构域进行切割。
可用于本发明的CRISPR Cas12a效应蛋白/结构域可以是任何已知的或后来鉴定的Cas12a多肽(以前称为Cpf1)(参见,例如,美国专利号9,790,490,其公开的Cpf1(Cas12a)序列通过引用并入)。术语“Cas12a”、“Cas12a多肽”或“Cas12a结构域”是指包含Cas12a多肽或其片段的RNA引导的核酸酶,其包含Cas12a的向导核酸结合结构域和/或Cas12a的活性、无活性或部分活性DNA裂解结构域。在一些实施方案中,可用于本发明的Cas12a可以包含核酸酶活性位点(例如,Cas12a结构域的RuvC位点)中的突变。Cas12a结构域或Cas12a多肽在其核酸酶活性位点具有突变,因此不再包含核酸酶活性,通常称为deadCas12a(例如,dCas12a)。在一些实施方案中,在其核酸酶活性位点具有突变的Cas12a结构域或Cas12a多肽可以具有受损的活性,例如,可以具有切口酶活性。
任何可用于碱基编辑的脱氨酶结构域/多肽都可以用于本发明。在一些实施方案中,脱氨酶结构域可以是胞嘧啶脱氨酶结构域或腺嘌呤脱氨酶结构域。可用于本发明的胞嘧啶脱氨酶(或胞苷脱氨酶)可以是来自任何生物体的任何已知或后来鉴定的胞嘧啶脱氨酶(参见,例如,美国专利号10,167,457和Thuronyi等人Nat.Biotechnol.37:1070–1079(2019),其中每一篇文献关于胞嘧啶脱氨酶的公开内容通过引用并入本文)。胞嘧啶脱氨酶可分别催化胞苷或脱氧胞苷水解脱氨为尿苷或脱氧尿苷。因此,在一些实施方案中,可用于本发明的脱氨酶或脱氨酶结构域可以是胞苷脱氨酶结构域,催化胞嘧啶水解脱氨为尿嘧啶。在一些实施方案中,胞嘧啶脱氨酶可以是天然存在的胞嘧啶脱氨酶的变体,包括但不限于,灵长类动物(例如,人、猴、黑猩猩、大猩猩)、狗、牛、大鼠或小鼠。因此,在一些实施方案中,可用于本发明的胞嘧啶脱氨酶可以与野生型胞嘧啶脱氨酶约70%至约100%相同(例如,与天然存在的胞嘧啶脱氨酶约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同,以及其中的任何范围或值)。
在一些实施方案中,可用于本发明的胞嘧啶脱氨酶可以是载脂蛋白BmRNA-编辑复合物(APOBEC)家族脱氨酶。在一些实施方案中,胞嘧啶脱氨酶可以是APOBEC1脱氨酶、APOBEC2脱氨酶、APOBEC3A脱氨酶、APOBEC3B脱氨酶、APOBEC3C脱氨酶、APOBEC3D脱氨酶、APOBEC3F脱氨酶、APOBEC3G脱氨酶、APOBEC3H脱氨酶、APOBEC4脱氨酶、人激活诱导脱氨酶(hAID)、rAPOBEC1、FERNY,和/或CDA1,任选地pmCDA1、atCDA1(例如,At2g19570)及其进化形式(例如,SEQ ID NO:27、SEQ ID NO:28或SEQ ID NO:29)。在一些实施方案中,胞嘧啶脱氨酶可以是具有SEQ ID NO:23的氨基酸序列的APOBEC1脱氨酶。在一些实施方案中,胞嘧啶脱氨酶可以是具有SEQ ID NO:24的氨基酸序列的APOBEC3A脱氨酶。在一些实施方案中,胞嘧啶脱氨酶可以是CDA1脱氨酶,任选地是具有SEQ ID NO:25的氨基酸序列的CDA1。在一些实施方案中,胞嘧啶脱氨酶可以是FERNY脱氨酶,任选地是具有SEQ ID NO:26的氨基酸序列的FERNY。在一些实施方案中,可用于本发明的胞嘧啶脱氨酶可以与天然存在的胞嘧啶脱氨酶(例如,进化的脱氨酶)的氨基酸序列约70%至约100%相同(例如,70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或100%相同)。在一些实施方案中,可用于本发明的胞嘧啶脱氨酶可以与SEQ ID NO:23、SEQ ID NO:24、SEQID NO:25或SEQ ID NO:26的氨基酸序列约70%至约99.5%相同(例如,约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或99.5%相同)(例如,与SEQ ID NO:23、SEQ ID NO:24、SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:27、SEQ IDNO:28或SEQ ID NO:29至少80%、至少85%、至少90%、至少92%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同)。在一些实施方案中,编码胞嘧啶脱氨酶的多核苷酸可以进行密码子优化以在植物中表达,并且密码子优化的多肽可以与参考多核苷酸约70%至99.5%相同。
在一些实施方案中,本发明的核酸构建体可以进一步编码尿嘧啶糖基化酶抑制剂(UGI)(例如,尿嘧啶-DNA糖基化酶抑制剂)多肽/结构域。因此,在一些实施方案中,编码CRISPR-Cas效应蛋白和胞嘧啶脱氨酶结构域的核酸构建体(例如,编码融合蛋白,所述融合蛋白包含融合到胞嘧啶脱氨酶结构域的CRISPR-Cas效应蛋白结构域,和/或融合到肽标签或融合到能够结合肽标签的亲和多肽的CRISPR-Cas效应蛋白结构域和/或融合到肽标签或融合到能够结合肽标签的亲和多肽的脱氨酶蛋白结构域)可以进一步编码尿嘧啶-DNA糖基化酶抑制剂(UGI),任选地其中UGI可以进行密码子优化以在植物中表达。在一些实施方案中,本发明提供融合蛋白,其包含CRISPR-Cas效应多肽、脱氨酶结构域和UGI和/或编码它们的一个或多个多核苷酸,任选地其中一个或多个多核苷酸可以进行密码子优化以在植物中表达。在一些实施方案中,本发明提供融合蛋白,其中CRISPR-Cas效应多肽、脱氨酶结构域和UGI可以融合到如本文所述的肽标签和亲和多肽的任意组合,从而将脱氨酶结构域和UGI募集到CRISPR-Cas效应多肽和靶核酸。在一些实施方案中,向导核酸可以与募集RNA基序连接,并且一个或多个脱氨酶结构域和/或UGI可以融合到能够与募集RNA基序相互作用的亲和多肽,从而将脱氨酶结构域和UGI募集到靶核酸。
可用于本发明的“尿嘧啶糖基化酶抑制剂”可以是能够抑制尿嘧啶-DNA糖基化酶碱基切除修复酶的任何蛋白质。在一些实施方案中,UGI结构域包括野生型UGI或其片段。在一些实施方案中,可用于本发明的UGI结构域可以与天然存在的UGI结构域的氨基酸序列约70%至约100%相同(例如,70%、71%、72%、73%、75%、76%、77%、79%、80%、81%、82%、83%、84%、85%、86%、87%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或100%相同,以及其中的任何范围或值)。在一些实施方案中,UGI结构域可以包含SEQ ID NO:41的氨基酸序列或与SEQ ID NO:41的氨基酸序列具有约70%至约99.5%序列同一性的多肽(例如,与SEQ ID NO:41的氨基酸序列至少80%、至少85%、至少90%、至少92%、至少95%、至少96%、至少97%、至少98%、至少99%或至少99.5%相同)。例如,在一些实施方案中,UGI结构域可以包含SEQ ID NO:41的氨基酸序列片段,该片段与SEQ ID NO:41的氨基酸序列的一部分连续核苷酸100%相同(例如,10、15、20、25、30、35、40、45、50、55、60、65、70、75、80个连续核苷酸;例如,约10、15、20、25、30、35、40、45至约50、55、60、65、70、75、80个连续核苷酸)。在一些实施方案中,UGI结构域可以是已知UGI(例如,SEQ ID NO:41)的变体,与已知UGI具有约70%至约99.5%的序列同一性(例如,70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%序列同一性,以及其中的任何范围或值)。在一些实施方案中,编码UGI的多核苷酸可以进行密码子优化以在植物(例如,植物)中表达,并且密码子优化的多肽可以与参考多核苷酸约70%至约99.5%相同。
可用于本发明的腺嘌呤脱氨酶(或腺苷脱氨酶)可以是任何已知或后来鉴定的来自任何生物体的腺嘌呤脱氨酶(参见,例如,美国专利号10,113,163,其关于腺嘌呤脱氨酶的公开内容而通过引用并入本文)。腺嘌呤脱氨酶可以催化腺嘌呤或腺苷的水解脱氨反应。在一些实施方案中,腺嘌呤脱氨酶可分别催化腺苷或脱氧腺苷的水解脱氨为肌苷或脱氧肌苷。在一些实施方案中,腺苷脱氨酶可以催化DNA中腺嘌呤或腺苷的水解脱氨反应。在一些实施方案中,由本发明的核酸构建体编码的腺嘌呤脱氨酶可以产生靶核酸的有义(例如,“+”;模板)链中的A→G转换或靶核酸的反义(例如,“-”,互补)链中的T→C转换。
在一些实施方案中,腺苷脱氨酶可以是天然存在的腺嘌呤脱氨酶的变体。因此,在一些实施方案中,腺苷脱氨酶可以与野生型腺嘌呤脱氨酶约70%至100%相同(例如,与天然存在的腺嘌呤脱氨酶约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%相同,以及其中的任何范围或值)。在一些实施方案中,腺嘌呤脱氨酶或腺苷脱氨酶在自然界中不存在,可称为工程化、突变或进化的腺苷脱氨酶。因此,例如,工程化、突变或进化的腺嘌呤脱氨酶多肽或腺嘌呤脱氨酶结构域可以与天然存在的腺嘌呤脱氨酶多肽/结构域约70%至99.9%相同(例如,与天然存在的腺嘌呤脱氨酶多肽或腺嘌呤脱氨酶结构域约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%或99.9%相同,以及其中的任何范围或值)。在一些实施方案中,腺苷脱氨酶可以来自细菌,(例如,大肠杆菌、金黄色葡萄球菌、流感嗜血杆菌、新月柄杆菌等)。在一些实施方案中,编码腺嘌呤脱氨酶多肽/结构域的多核苷酸可以进行密码子优化以在植物中表达。
在一些实施方案中,腺嘌呤脱氨酶结构域可以是野生型tRNA特异性腺苷脱氨酶结构域,例如,tRNA-特异性腺苷脱氨酶(TadA)和/或突变/进化的腺苷脱氨酶结构域,例如,突变/进化的tRNA-特异性腺苷脱氨酶结构域(TadA*)。在一些实施方案中,TadA结构域可以来自大肠杆菌。在一些实施方案中,TadA可以被修饰,例如,截短,相对于全长TadA丢失一个或多个N-末端和/或C末端氨基酸(例如,可以相对于全长TadA缺失1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个N-末端和/或C末端氨基酸残基)。在一些实施方案中,TadA多肽或TadA结构域不包含N-末端蛋氨酸。在一些实施方案中,野生型大肠杆菌TadA包含SEQ ID NO:30的氨基酸序列。在一些实施方案中,突变/进化的大肠杆菌TadA*包含SEQID NO:31-40的氨基酸序列(例如,SEQ ID NO:31、32、33、34、35、36、37、38、39或40)。在一些实施方案中,编码TadA/TadA*的多核苷酸可以进行密码子优化以在植物中表达。
胞嘧啶脱氨酶催化胞嘧啶脱氨并产生胸苷(通过尿嘧啶中间体),导致基因组中的互补链中C到T转换或G到A转换。因此,在一些实施方案中,由本发明的多核苷酸编码的胞嘧啶脱氨酶产生靶核酸的有义(例如,“+”;模板)链中的C→T转换或靶核酸的反义(例如,“-”,互补)链中的G→A转换。
在一些实施方案中,由本发明的核酸构建体编码的腺嘌呤脱氨酶产生靶核酸的有义(例如,“+”;模板)链中的A→G转换或靶核酸的反义(例如,“-”,互补)链中的T→C转换。
编码包含序列特异性核酸结合蛋白和胞嘧啶脱氨酶多肽的碱基编辑器的本发明的核酸构建体,以及编码它们的核酸构建体/表达盒/载体,可以与向导核酸组合用于修饰靶核酸,包括但不限于,在靶核酸中产生C→T或G→A突变,包括,但不限于质粒序列;在编码序列中产生C→T或G→A突变以改变氨基酸身份;在编码序列中产生C→T或G→A突变以产生终止密码子;在编码序列中产生C→T或G→A突变以破坏起始密码子;在基因组DNA中产生点突变以破坏功能;和/或在基因组DNA中产生点突变以破坏剪接连接。
编码包含序列特异性核酸结合蛋白和腺嘌呤脱氨酶多肽的碱基编辑器的本发明的核酸构建体,以及编码它们的表达盒和/或载体,可以与向导核酸组合用于修饰靶核酸,包括但不限于,在靶核酸中产生A→G或T→C突变,包括,但不限于质粒序列;在编码序列中产生A→G或T→C突变以改变氨基酸身份;在编码序列中产生A→G或T→C突变以产生终止密码子;在编码序列中产生A→G或T→C突变以破坏起始密码子;在基因组DNA中产生点突变以破坏功能;和/或在基因组DNA中产生点突变以破坏剪接连接。
包含CRISPR-Cas效应蛋白或其融合蛋白的本发明的核酸构建体可以与向导RNA(gRNA,CRISPR阵列,CRISPR RNA,crRNA)组合使用,设计用于与编码的CRISPR-Cas效应蛋白或结构域一起发挥作用,以修饰靶核酸。可用于本发明的向导核酸包含至少一个间隔序列和至少一个重复序列。向导核酸能够与CRISPR-Cas核酸酶结构域形成复合物,CRISPR-Cas核酸酶结构域由本发明的核酸构建体编码和表达,并且间隔序列能够与靶核酸杂交,从而引导复合物(例如,CRISPR-Cas效应融合蛋白(例如,融合到脱氨酶结构域的CRISPR-Cas效应结构域和/或融合到肽标签或亲和多肽的CRISPR-Cas效应结构域以募集脱氨酶结构域和任选地,UGI)到靶核酸,其中靶核酸可以被脱氨酶结构域修饰(例如,裂解或编辑)或调节(例如,调节转录)。
作为实例,编码与胞嘧啶脱氨酶结构域(例如,融合蛋白)相连的Cas9结构域的核酸构建体可以与Cas9向导核酸组合使用来修饰靶核酸,其中融合蛋白的胞嘧啶脱氨酶结构域使靶核酸中的胞嘧啶碱基脱氨,从而编辑靶核酸。在另一个实例中,编码与腺嘌呤脱氨酶结构域(例如,融合蛋白)相连的Cas9结构域的核酸构建体可以与Cas9向导核酸组合使用以修饰靶核酸,其中融合蛋白的腺嘌呤脱氨酶结构域使靶核酸中的腺苷碱基脱氨,从而编辑靶核酸。
同样,编码与胞嘧啶脱氨酶结构域或腺嘌呤脱氨酶结构域(例如,融合蛋白)相连的Cas12a结构域(或其他选定的CRISPR-Cas核酸酶,例如,C2c1,C2c3,Cas12b,Cas12c,Cas12d,Cas12e,Cas13a,Cas13b,Cas13c,Cas13d,Casl,CaslB,Cas2,Cas3,Cas3',Cas3",Cas4,Cas5,Cas6,Cas7,Cas8,Cas9(也称为Csnl和Csx12),Cas10,Csyl,Csy2,Csy3,Csel,Cse2,Cscl,Csc2,Csa5,Csn2,Csm2,Csm3,Csm4,Csm5,Csm6,Cmrl,Cmr3,Cmr4,Cmr5,Cmr6,Csbl,Csb2,Csb3,Csxl7,Csxl4,Csx10,Csx16,CsaX,Csx3,Csxl,Csxl5,Csfl,Csf2,Csf3,Csf4(dinG)和/或Csf5)的核酸构建体可以与Cas12a向导核酸(或其他选定的CRISPR-Cas核酸酶的向导核酸)组合使用来修饰靶核酸,其中融合蛋白的胞嘧啶脱氨酶结构域或腺嘌呤脱氨酶结构域将靶核酸中的胞嘧啶碱基脱氨,从而编辑靶核酸。
如本文所用,“向导核酸”、“向导RNA”、“gRNA”、“CRISPR RNA/DNA”“crRNA”或“crDNA”是指包含至少一个间隔序列和至少一个重复序列的核酸,所述间隔序列与靶DNA(例如,原间隔区)互补(并杂交),(所述至少一个重复序列例如:V型Cas12a CRISPR-Cas系统的重复序列,或其片段或部分;II型Cas9 CRISPR-Cas系统的重复序列,或其片段或部分;V型C2c1 CRISPR Cas系统的重复序列,或其片段;CRISPR-Cas系统的重复序列,例如,C2c3,Cas12a(也称为Cpf1),Cas12b,Cas12c,Cas12d,Cas12e,Cas13a,Cas13b,Cas13c,Cas13d,Casl,CaslB,Cas2,Cas3,Cas3',Cas3",Cas4,Cas5,Cas6,Cas7,Cas8,Cas9(也称为Csnl和Csx12),Cas10,Csyl,Csy2,Csy3,Csel,Cse2,Cscl,Csc2,Csa5,Csn2,Csm2,Csm3,Csm4,Csm5,Csm6,Cmrl,Cmr3,Cmr4,Cmr5,Cmr6,Csbl,Csb2,Csb3,Csxl7,Csxl4,Csx10,Csx16,CsaX,Csx3,Csxl,Csxl5,Csfl,Csf2,Csf3,Csf4(dinG)和/或Csf5,或其片段),其中重复序列可以连接到间隔序列的5'端和/或3'端。本发明的gRNA的设计可以基于I型、II型、III型、IV型、V型或VI型CRISPR-Cas系统。
在一些实施方案中,Cas12a gRNA可以在5'至3'包含重复序列(全长或部分(“手柄”);例如,假结样结构)和间隔序列。
在一些实施方案中,向导核酸可以包含多个重复序列-间隔序列(例如,2、3、4、5、6、7、8、9、10个或更多个重复序列-间隔序列)(例如,重复序列-间隔序列-重复序列,例如,重复序列-间隔序列-重复序列-间隔序列-重复序列-间隔序列-重复序列-间隔序列-重复序列-间隔序列等)。本发明的向导核酸是合成的、人造的,在自然界中没有发现。gRNA可以很长,可以用作适配体(如MS2募集策略)或是悬挂间隔序列的其他RNA结构。
如本文所用,“重复序列”是指,例如,野生型CRISPR Cas基因座(例如,Cas9基因座、Cas12a基因座、C2c1基因座等)的任何重复序列,或与由本发明的核酸构建体编码的CRISPR-Cas效应蛋白一起发挥作用的合成crRNA的重复序列。可用于本发明的重复序列可以是CRISPR-Cas基因座(例如,I型、II型、III型、IV型、V型或VI型)的任何已知或后来鉴定的重复序列,或可以是设计用于在I、II、III、IV、V或VI型CRISPR-Cas系统中起作用的合成重复序列。重复序列可以包含发夹结构和/或茎环结构。在一些实施方案中,重复序列可以在其5'端形成假结样结构(即“手柄”)。因此,在一些实施方案中,重复序列可以与来自野生型I型CRISPR-Cas基因座、II型CRISPR-Cas基因座、III型CRISPR-Cas基因座、IV型CRISPR-Cas基因座、V型CRISPR-Cas基因座和/或VI型CRISPR-Cas基因座的重复序列相同或基本相同。来自野生型CRISPR-Cas基因座的重复序列可以通过已建立的算法来确定,诸如使用CRISPRdb提供的CRISPRfinder(参见,Grissa等人Nucleic Acids Res.35(Web Serverissue):W52-7)。在一些实施方案中,重复序列或其部分在其3'端与间隔序列的5'端相连,从而形成重复序列-间隔序列(例如,向导核酸、向导RNA/DNA、crRNA、crDNA)。
在一些实施方案中,重复序列包括至少10个核苷酸,基本上由或由至少10个核苷酸组成,这取决于特定的重复序列以及包含该重复序列的向导核酸是经过处理还是未处理(例如,约10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50至100个或更多个核苷酸,或其中的任何范围或值)。在一些实施方案中,重复序列包含约10至约20、约10至约30、约10至约45、约10至约50、约15至约30、约15至约40、约15至约45、约15至约50、约20至约30、约20至约40、约20至约50、约30至约40、约40至约80、约50至约100个或更多个核苷酸,基本上由或由约10至约20、约10至约30、约10至约45、约10至约50、约15至约30、约15至约40、约15至约45、约15至约50、约20至约30、约20至约40、约20至约50、约30至约40、约40至约80、约50至约100个或更多个核苷酸组成。
连接到间隔序列的5'端的重复序列可以包含重复序列的一部分(例如,野生型重复序列的5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35或更多个连续核苷酸)。在一些实施方案中,连接到间隔序列的5'端的重复序列的一部分可以是约5至约10个连续核苷酸的长度(例如,约5、6、7、8、9、10个核苷酸)并且与野生型CRISPR Cas重复核苷酸序列的相同区域(例如,5'端)具有至少90%序列同一性(例如,至少约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,或更多(例如,99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9或100%))。在一些实施方案中,重复序列的一部分可以在其5'端包含假结样结构(例如,“手柄”)。
如本文中所用,“间隔序列”是与靶核酸(例如,靶DNA)(例如,原间隔区)基本上互补的核苷酸序列(例如,与BRI1核苷酸序列的一部分/区域的连续核苷酸基本上互补,所述部分/区域:(a)包含与SEQ ID NO:69、70、85、86、99、100、112、113、123或124中任一个核苷酸序列具有至少80%序列同一性的序列;(b)包含与SEQ ID NO:72-76、89-94、102-106、115-118或126-130中任一个核苷酸序列具有至少80%同一性的区域;(c)编码与SEQ IDNO:71、87、88、101、114或125中任一个具有至少80%序列同一性的氨基酸序列;和/或(d)编码与SEQ ID NO:77-81、95-98、107-111、119-122或131-135中任一个氨基酸序列具有至少80%同一性的区域。在一些实施方案中,间隔序列(例如,一个或多个间隔区)可以包括但不限于,SEQ ID NO:82-84和/或136-139中任一个的核苷酸序列。间隔序列可以是与靶核酸完全互补或基本互补(例如,至少约70%互补(例如,约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多(例如,99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%))。因此,在一些实施方案中,与靶核酸相比,间隔序列可以有一个、两个、三个、四个或五个错配,这些错配可以是连续的或不连续的。在一些实施方案中,间隔序列可以与靶核酸有70%的互补性。在其他实施方案中,间隔区核苷酸序列可以与靶核酸具有80%的互补性。在其它实施方案中,间隔核苷酸序列可以与靶核酸(原间隔区)具有85%、90%、95%、96%、97%、98%、99%或99.5%的互补性,等等。在一些实施方案中,间隔序列与靶核酸100%互补。间隔序列的长度可以从约15个核苷酸到约30个核苷酸(例如,15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸,或其中的任何范围或值)。因此,在一些实施方案中,间隔序列可以在靶核酸(例如,原间隔区)长度至少为约15个核苷酸至约30个核苷酸的区域上具有完全互补性或实质互补性。在一些实施方案中,间隔区长度约为20个核苷酸。在一些实施方案中,间隔区的长度为约21、22或23个核苷酸。
在一些实施方案中,向导核酸的间隔序列的5'区可以与靶DNA相同,而间隔区的3'区可以与靶DNA基本上互补(例如,V型CRISPR-Cas),或者向导核酸的间隔序列的3'区可以与靶DNA相同,而间隔区的5'区可以与靶DNA基本上互补(例如,II型CRISPR-Cas),因此,间隔序列与靶DNA的整体互补性可以小于100%。因此,例如,在V型CRISPR-Cas系统的向导物中,例如,20个核苷酸间隔序列的5'区域(即种子区域)中的前1、2、3、4、5、6、7、8、9、10个核苷酸可以与靶DNA 100%互补,而间隔序列的3'区域中的剩余核苷酸与靶DNA基本上互补(例如,至少约70%互补)。在一些实施方案中,间隔序列的5'端的前1至8个核苷酸(例如,前1、2、3、4、5、6、7、8个核苷酸,以及其中的任何范围)可以与靶DNA100%互补,而间隔序列的3'区域中的剩余核苷酸与靶DNA基本上互补(例如,至少约50%互补(例如,50%、55%、60%、65%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多))。
作为另一个实例,在II型CRISPR-Cas系统的向导物中,例如,20个核苷酸间隔序列的3'区域(即种子区域)中的前1、2、3、4、5、6、7、8、9、10个核苷酸可以与靶DNA 100%互补,而间隔序列的5'区域中的剩余核苷酸与靶DNA基本上互补(例如,至少约70%互补)。在一些实施方案中,间隔序列的3'端的前1至10个核苷酸(例如,前1、2、3、4、5、6、7、8、9、10个核苷酸,以及其中的任何范围)可以与靶DNA 100%互补,而间隔序列的5'区域中的剩余核苷酸与靶DNA基本上互补(例如,至少约50%互补(例如,至少约50%、55%、60%、65%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多,或其中的任何范围或值))。
在一些实施方案中,间隔区的种子区域的长度可以为约8至约10个核苷酸,长度为约5至约6个核苷酸,或长度为约6个核苷酸。
如本文所用,“靶核酸”、“靶DNA”、“靶核苷酸序列”、“靶区”或“基因组中的靶区”是指植物基因组中与本发明的向导核酸中的间隔序列完全互补(100%互补)或基本上互补(例如,至少70%互补(例如,70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多))的区域。可用于CRISPR-Cas系统的靶区可以位于生物体基因组(例如,植物基因组)中PAM序列的紧邻3'(诸如对于V型CRISPR-Cas系统)或紧邻5'(诸如对于II型CRISPR-Cas系统)的位置。靶区可以选自紧邻PAM序列的至少15个连续核苷酸(例如,16、17、18、19、20、21、22、23、24、25、26、27、28、29、30个核苷酸等)的任何区域。
“原间隔序列”是指靶双链DNA,特别是靶DNA中与CRISPR重复序列-间隔序列(例如,向导核酸、CRISPR阵列、crRNA)的间隔序列完全或基本上互补(和杂交)的部分(例如,或基因组中的靶区)。
在V型CRISPR-Cas(例如,Cas12a)系统和II型CRISPR-Cas(Cas9)系统的情况下,原间隔序列的两侧是(例如,紧邻)原间隔区邻接基序(PAM)。对于IV型CRISPR-Cas系统,PAM位于非靶链的5'端和靶链的3'端(见下文,作为实例)。
在II型CRISPR-Cas(例如,Cas9)系统的情况下,PAM紧邻靶区的3'。I型CRISPR-Cas系统的PAM位于靶链的5'。目前尚无针对III型CRISPR-Cas系统的已知PAM。Makarova等人描述了CRISPR系统的所有类别、类型和亚型的命名法(Nature Reviews Microbiology 13:722–736(2015))。R.Barrangou(Genome Biol.16:247(2015))描述了向导结构和PAM。
经典的Cas12a PAM富含T。在一些实施方案中,经典的Cas12a PAM序列可以是5'-TTN、5'-TTTN或5'-TTTV。在一些实施方案中,经典的Cas9(例如,酿脓链球菌)PAM可以是5'-NGG-3'。在一些实施方案中,可以使用非经典PAM,但效率可能较低。
其他PAM序列可由本领域技术人员通过已建立的实验和计算方法确定。因此,例如,实验方法包括靶向侧翼为所有可能的核苷酸序列的序列,并识别不进行靶向的序列成员,诸如通过对靶质粒DNA的转化(Esvelt等人2013.Nat.Methods 10:1116-1121;Jiang等人2013.Nat.Biotechnol.31:233-239)。在某些方面,计算方法可以包括对天然间隔区进行BLAST搜索,以识别噬菌体或质粒中的原始靶DNA序列,并对这些序列进行比对以确定与靶序列相邻的保守序列(Briner和Barrangou.2014.Appl.Environ.Microbiol.80:994-1001;Mojica等人2009.Microbiology 155:733-740)。
在一些实施方案中,本发明提供包含本发明的核酸构建体的表达盒和/或载体(例如,本发明编辑系统的一个或多个组分)。在一些实施方案中,可以提供包含本发明的核酸构建体和/或一种或多种向导核酸的表达盒和/或载体。在一些实施方案中,本发明的编码碱基编辑器的核酸构建体(例如,包含CRISPR-Cas效应蛋白和脱氨酶结构域(例如,融合蛋白)的构建体)或用于碱基编辑的组分(例如,融合到肽标签或亲和多肽的CRISPR-Cas效应蛋白,融合到肽标签或亲和多肽的脱氨酶结构域,和/或融合到肽标签或亲和多肽的UGI)可以包含在与包含一种或多种向导核酸的表达盒或载体相同的或分开的表达盒或载体上。当编码碱基编辑器的核酸构建体或用于碱基编辑的组分包含在与包含所述向导核酸的表达盒或载体分开的表达盒或载体上时,靶核酸可以与编码碱基编辑器的表达盒或载体或用于碱基编辑的组分以彼此的任何顺序以及向导核酸接触(例如,向所述靶核酸提供后者),例如,在提供包含向导核酸的表达盒之前、同时或之后(例如,与靶核酸接触)。
本发明的融合蛋白可以包含序列特异性核酸结合结构域(例如,序列特异性DNA结合结构域)、CRISPR-Cas多肽、和/或融合到肽标签或亲和多肽(亲和多肽与肽标签相互作用)的脱氨酶结构域,如本领域所知,用于将脱氨酶募集到靶核酸。募集方法还可以包括与RNA募集基序相连的向导核酸和与能够与RNA募集基序相互作用的亲和多肽融合的脱氨酶,从而将脱氨酶募集到靶核酸。备选地,化学相互作用可用于将多肽(例如,脱氨酶)募集到靶核酸。
可用于本发明的肽标签(例如,表位)可以包括但不限于,GCN4肽标签(例如,Sun-Tag)、c-Myc亲和标签、HA亲和标签、His亲和标签、S亲和标签、蛋氨酸-His亲和标签、RGD-His亲和标签、FLAG八肽、strep标签或strep标签II、V5标签、和/或VSV-G表位。任何表位可以在本发明中用作肽标签,所述表位可以与多肽连接并且存在可以与另一种多肽连接的相应亲和多肽。在一些实施方案中,肽标签可以包含1个或2个或更多个肽标签拷贝(例如,重复单元,多聚化表位(例如,串联重复序列))(例如,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25或更多个重复单元)。在一些实施方案中,与肽标签相互作用/结合的亲和多肽可以是抗体。在一些实施方案中,该抗体可以是scFv抗体。在一些实施方案中,与肽标签结合的亲和多肽可以是合成的(例如,进化为亲和相互作用),包括但不限于,亲和体、抗运载蛋白、monobody和/或DARPin(参见,例如,Sha等人,Protein Sci.26(5):910-924(2017));Gilbreth(Curr Opin Struc Biol 22(4):413-420(2013)),美国专利号9,982,053,每一项关于与亲和体、抗运载蛋白、monobodies和/或DARPin相关的教导通过引用全部并入)。肽标签序列及其亲和多肽实例包括但不限于SEQ ID NO:42-44的氨基酸序列。
在一些实施方案中,向导核酸可以与RNA募集基序连接,并且要募集的多肽(例如,脱氨酶)可以融合到与RNA募集基序结合的亲和多肽,其中向导与靶核酸结合,RNA募集基序与亲和多肽结合,从而将多肽募集到向导并使靶核酸与多肽(例如,脱氨酶)接触。在一些实施方案中,可以将两个或更多个多肽募集到向导核酸,从而使两个或更多个多肽(例如,脱氨酶)接触靶核酸。RNA募集基序及其亲和多肽的实例包括但不限于,SEQ ID NO:45-55的序列。
在一些实施方案中,与亲和多肽融合的多肽可以是逆转录酶,而向导核酸可以是与RNA募集基序相连的延伸的向导核酸。在一些实施方案中,RNA募集基序可以位于延伸的向导核酸的延伸部分的3'端(例如,5'-3',重复序列-间隔序列-延伸部分(RT模板-引物结合位点)-RNA募集基序)。在一些实施方案中,RNA募集基序可以嵌入到延伸部分中。
在本发明的一些实施方案中,延伸的向导RNA和/或向导RNA可以连接到一个或连接到两个或更多个RNA募集基序(例如,1、2、3、4、5、6、7、8、9、10个或更多个基序;例如,至少10至约25个基序),任选地,其中两个或更多个RNA募集基序可以是相同的RNA募集基序或不同的RNA募集基序。在一些实施方案中,RNA募集基序和相应的亲和多肽可以包括但不限于,端粒酶Ku结合基序(例如,Ku结合发夹)和相应的亲和多肽Ku(例如,Ku异二聚体),端粒酶Sm7结合基序和相应的亲和多肽Sm7,MS2噬菌体操纵子茎环和相应的亲和多肽MS2外壳蛋白(MCP),PP7噬菌体操纵子茎环和相应的亲和多肽PP7外壳蛋白(PCP),SfMu噬菌体Com茎环和相应的亲和多肽Com RNA结合蛋白,PUF结合位点(PBS)和亲和多肽Pumilio/fem-3mRNA结合因子(PUF),和/或合成RNA适配体和作为相应的亲和多肽的适配体配体。在一些实施方案中,RNA募集基序和相应的亲和多肽可以是MS2噬菌体操纵子茎环和亲和多肽MS2外壳蛋白(MCP)。在一些实施方案中,RNA募集基序和相应的亲和多肽可以是PUF结合位点(PBS)和亲和多肽Pumilio/fem-3mRNA结合因子(PUF)。
在一些实施方案中,用于募集多肽和核酸的组分可以是那些通过化学相互作用起作用的组分,其可以包括但不限于,雷帕霉素诱导的FRB–FKBP二聚化;生物素-链霉亲和素;SNAP标签;Halo标签;CLIP标签;化合物诱导的DmrA-DmrC异二聚体;双功能配体(例如,将两个结合蛋白质的化学物质融合在一起,例如,二氢叶酸还原酶(DHFR)。
在一些实施方案中,被优化以在植物中表达的本发明的核酸构建体、表达盒或载体与包含相同的多核苷酸但没有进行密码子优化以在植物中表达的核酸构建体、表达盒或载体可以约70%至100%相同(例如,约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%或100%)。
本文还提供包含本发明的一种或多种多核苷酸、向导核酸、核酸构建体、表达盒或载体的细胞。
本发明的核酸构建体(例如,包含序列特异性DNA结合结构域、CRISPR-Cas效应结构域、脱氨酶结构域、逆转录酶(RT)、RT模板和/或向导核酸等的构建体)和包含这些的表达盒/载体可用作本发明的编辑系统用于修饰靶核酸和/或其表达。
可以使用本发明的多肽、多核苷酸、核糖核蛋白(RNP)、核酸构建体、表达盒和/或载体修饰(例如,突变,例如,碱基编辑,裂解,做切口等)任何植物或植物部分(或植物的分组,例如,分为属或更高阶分类)的靶核酸,植物包括被子植物、裸子植物、单子叶植物、双子叶植物、C3、C4、CAM植物、苔藓植物、蕨类植物和/或拟蕨植物、微藻,和/或大型藻类。可以如本文所述修饰的植物和/或植物部分可以是任何植物物种/品种/栽培品种的植物和/或植物部分。在一些实施方案中,可以如本文所述修饰的植物是单子叶植物。在一些实施方案中,可以如本文所述修饰的植物是双子叶植物。
如本文所用,术语“植物部分”包括但不限于繁殖组织(例如,花瓣、萼片、雄蕊、雌蕊、花托、花药、花粉、花、果实、花蕾、胚珠、种子、胚、坚果、核仁、穗、玉米棒和壳);营养组织(例如,叶柄、茎、根、根毛、根尖、髓、胚芽、茎杆、芽、枝、树皮、顶端分生组织、腋芽、子叶、下胚轴和叶);维管组织(例如,韧皮部和木质部);特化细胞,诸如表皮细胞、薄壁细胞、厚角细胞(chollenchyma cells)、厚壁组织细胞、气孔细胞、保卫细胞、角质层、叶肉细胞;愈伤组织;和插条。术语“植物部分”还包括植物细胞,包括在植物和/或植物部分中完整的植物细胞、植物原生质体、植物组织、植物器官、植物细胞组织培养物、植物愈伤组织、植物团块等。如本文所用,“枝条”是指地上部分,包括叶和茎。如本文所用,术语“组织培养物”包括组织、细胞、原生质体和愈伤组织的培养物。
如本文所用,“植物细胞”是指植物的结构和生理单元,其通常包含细胞壁但也包含原生质体。本发明的植物细胞可以是分离的单细胞的形式,或可以是培养的细胞,或者可以是更高组织单元的一部分,诸如,例如,植物组织(包括愈伤组织)或植物器官的一部分。在一些实施方案中,植物细胞可以是藻类细胞。“原生质体”是一种分离的植物细胞,没有细胞壁或只有部分细胞壁。因此,在本发明的一些实施方案中,包含本发明的核酸分子和/或核苷酸序列的转基因细胞是任何植物或植物部分的细胞,包括但不限于,根细胞、叶细胞、组织培养细胞、种子细胞、花细胞、果实细胞、花粉细胞等。在本发明的某些方面,植物部分可以是植物种质。在某些方面,植物细胞可以是不繁殖的植物细胞,不会再生为植物。
“植物细胞培养物”是指植物单位的培养物,诸如,例如,原生质体、细胞培养物细胞、植物组织中的细胞、花粉、花粉管、胚珠、胚囊、受精卵和处于不同发育阶段的胚。
如本文所用,“植物器官”是植物的独特且可见的结构和分化部分(诸如根、茎、叶、花蕾或胚)。
如本文所用,“植物组织”是指一组组织成结构和功能单元的植物细胞。原位植物或培养物中的任何组织都包括在内。该术语包括但不限于,整个植物、植物器官、植物种子、组织培养物和组织成结构和/或功能单元的任何植物细胞组。将该术语与上述任何特定类型的植物组织结合使用或在缺少上述任何特定类型的植物组织,或在本定义所包含的任何特定类型的植物组织的情况下使用,并不意味着排除任何其他类型的植物组织。
在本发明的一些实施方案中,提供了转基因组织培养物或转基因植物细胞培养物,其中转基因组织或细胞培养物包含本发明的核酸分子/核苷酸序列。在一些实施方案中,转基因可以从由转基因组织或细胞发育的植物中消除,方法是将转基因植物与非转基因植物杂交,并在后代中选择包含所需基因编辑而不含用于产生该编辑的转基因的植物。
任何含有内源性油菜素内酯不敏感-1(BRI1)基因的植物都可以如本文所述进行修饰,以改善一种或多种产量性状。可如本文所述修饰的植物的非限制性实例可包括但不限于,草坪草(例如,蓝草、本特草、黑麦草、羊茅)、羽苇草、簇毛草、芒草属、芒草(arundo)、柳枝稷、蔬菜作物,包括洋蓟、大头菜、芝麻菜、韭菜、芦笋、莴苣(例如,结球莴苣、散叶莴苣、长叶莴苣)、马兰加、瓜(例如,甜瓜、西瓜、克伦肖瓜、蜜瓜、哈密瓜)、菜类作物(例如,抱子甘蓝、卷心菜、花椰菜、西兰花、散叶甘蓝、羽衣甘蓝、大白菜、小白菜)、cardoni、胡萝卜、纳帕、秋葵、洋葱、芹菜、欧芹、鹰嘴豆、欧洲防风草、菊苣、辣椒、马铃薯、葫芦(例如,西葫芦、黄瓜、密生西葫芦、笋瓜、南瓜、蜜瓜、西瓜、哈密瓜)、萝卜、干球洋葱、芜菁甘蓝、茄子、婆罗门参、茅菜、小葱、菊苣、大蒜、菠菜、大葱、南瓜、绿色蔬菜、甜菜(糖用甜菜和饲料甜菜)、红薯、莙荙菜、辣根、番茄、芜菁和香料;水果作物如苹果、杏、樱桃、油桃、桃、梨、梅子、李子、樱桃、木瓜、无花果、坚果(例如,栗子、山核桃、开心果、榛子、开心果、花生、核桃、澳洲坚果、扁桃仁等)、柑橘(例如,小柑桔、金桔、橙子、葡萄柚、橘子、柑橘、柠檬、酸橙等)、蓝莓、黑树莓、博伊森莓、蔓越莓、红醋栗、醋栗、罗根莓、覆盆子、草莓、黑莓、葡萄(酿酒葡萄和鲜食葡萄)、鳄梨、香蕉、猕猴桃、柿子、石榴、菠萝、热带水果、梨果、甜瓜、芒果、木瓜和荔枝、大田作物植物,如三叶草、苜蓿、梯牧草、月见草、白池花、玉米/玉蜀黍(饲料玉米、甜玉米、爆米花)、蛇麻草、荷荷巴油、荞麦、红花、藜麦、小麦、水稻、大麦、黑麦、小米、高粱、燕麦、黑小麦、高粱、烟草、木棉、豆科植物(豆类(例如,四季豆和干豆)、扁豆、豌豆、大豆)、油料植物(油菜、油菜籽、芥菜、罂粟、橄榄、向日葵、椰子、蓖麻油植物、可可豆、花生、油棕)、浮萍、拟南芥、纤维植物(棉花、亚麻、麻类植物、黄麻)、大麻属(例如,火麻、印度大麻和莠草大麻)、月桂科(肉桂、樟脑)或诸如咖啡、甘蔗、茶和天然橡胶植物等植物;和/或花坛植物,如开花植物、仙人掌、多肉植物和/或观赏植物(例如,玫瑰、郁金香、紫罗兰),以及树木,如森林树木(阔叶树和常青树,如针叶树;例如,榆树、白蜡树、橡树、枫树、冷杉、云杉、雪松、松树、桦树、柏树、桉树、柳树),以及灌木和其他苗木。在一些实施方案中,本发明的核酸构建体和/或编码其的表达盒和/或载体可用于修饰玉米、大豆、小麦、油菜、水稻、番茄、辣椒或向日葵。
在一些实施方案中,可如本文所述进行修饰的植物可包括但不限于,玉米、大豆、油菜、小麦、水稻、棉花、甘蔗、甜菜、大麦、燕麦、苜蓿、向日葵、红花、油棕、芝麻、椰子、烟草、马铃薯、红薯、木薯、咖啡、苹果、李子、杏、桃、樱桃、梨、无花果、香蕉、柑橘、可可、鳄梨、橄榄、扁桃、核桃、草莓、西瓜、辣椒、葡萄、番茄、黄瓜或芸苔属(例如,甘蓝型油菜、甘蓝、芜菁、芥菜型油莱和/或黑芥菜)。在一些实施方案中,可以如本文所述修饰的植物是双子叶植物。在一些实施方案中,可以如本文所述修饰的植物是单子叶植物。在一些实施方案中,可以如本文所述修饰的植物是玉米(即Zea Mays)。在一些实施方案中,可以如本文所述修饰的植物是大豆(即Glycine max)。
现在将参考以下实施例来描述本发明。应该理解的是,这些实施例并非旨在将权利要求书的范围限制为本发明,而是旨在作为某些实施方案的实例。对于本领域技术人员来说,所示例的方法的任何变化都旨在包括在本发明的范围内。
实施例
实施例1.编辑策略
在Glyma.06g147600(基因座325)(SEQ ID NO:88)和Glyma.04g218300(基因座328)(SEQ ID NO:126)的大豆油菜素内酯不敏感-1(BRI1)基因的激酶结构域中生成编辑的策略,以降低激酶活性并随后增加BRI1基因产物的自磷酸化,导致基于油菜素内酯不敏感-1(BRI1)的信号转导增加,最终目的是产生更旺盛生长的大豆植株。为了产生一系列等位基因,设计了包含间隔区(例如,SEQ ID NO:136-139)的Cas12a向导核酸,这些间隔区与每个BRI1大豆基因中的靶标具有互补性,并将所述向导核酸放入载体构建体中。
筛选携带BRI1基因中的编辑的再生品系,并将那些显示有被靶向基因中的编辑的品系转移到温室中以设为E1种子。
设计包含不同间隔区的其他向导构建体以改造对BRI1基因(包括其他BRI1大豆基因)的激酶结构域的靶向编辑。
实施例2.大豆中的编辑等位基因
选择如实施例1所述生成并包含框内缺失的三个E1植物以进行进一步分析。大豆品系CE94379包含BRI1a基因Glyma06g147600(SEQ ID NO:85)的编辑等位基因,该等位基因被发现是序列(TGAGCA)的6bp缺失,位于SEQ ID NO:85的3302位,从而产生SEQ ID NO:140的Glyma06g147600的编辑等位基因。大豆品系CE94453包含BRI1a基因Glyma06g147600(SEQID NO:85)的编辑等位基因,该等位基因被发现是序列(GTGAGCACA)的9bp缺失,位于SEQ IDNO:85的3301位,产生SEQ ID NO:141的Glyma06g147600的编辑等位基因。大豆品系CE94394包含BRI1d基因Glyma04g218300(SEQ ID NO:123)的编辑等位基因,该等位基因被发现是序列(AGCACA)的6bp缺失,位于SEQ ID NO:123的3395位,从而产生了SEQ ID NO:142的Glyma04g218300的编辑等位基因。
实施例3.E1代的大豆产量表型
实施例2中描述的E1植物在R6生长阶段进行评估,以评估可能指示产量增加的植物结构特征,以及直接指示植物产量的种子计数。测量的植物表型包括株高、主茎上的节数、分枝数、分枝上的豆荚数、主茎上的豆荚数、主茎上每个节的豆荚数、每株植物的豆荚数、每个豆荚的种子数和每株植物的种子数。结果总结在表1中。标有星号(*)的值表示与未编辑/野生型植物不同的表型性状。这些观察结果表明,大豆BRI1基因的编辑等位基因会影响产量性状。
表1.表型分析
/>
实施例4.E2代的大豆产量表型
允许实施例2中描述的E1植物产生E2种子。收集并种植E2种子,并在R6生长阶段评估所得E2植物,以评估可能指示产量增加的植物结构特征,以及直接指示植物产量的种子计数。测量的植物表型包括株高、主茎上的节数、分枝数、分枝上的豆荚数、主茎上的豆荚数、主茎上每个节的豆荚数、每株植物的豆荚数、每个豆荚的种子数和每株植物的种子数。结果总结在表2中,表明在BRI1基因中获得的编辑改变植物结构,并可能影响植物产量。
表2.大豆表型分析
*表示当与未编辑/野生型对照相比在<0.05的概率下统计学验证的观察结果
实施例5.玉米编辑等位基因
开发了一种编辑策略,以在玉米BRI1基因(GRMZM6G437417,SEQ ID NO:69)的激酶结构域中生成编辑。为了生成编辑的等位基因,设计了包含间隔区PWsp1407(GTGGCACGTAACCTGGAGTGCCG,SEQ ID NO:84)的CRISPR向导核酸,所述间隔区与BRI1基因内的靶标具有互补性(反向),并将所述向导核酸置入构建体中。筛选携带BRI1基因中的编辑的品系,并将在被靶向基因中具有编辑的显示约10%的测序读长的品系推进到下一代。回收的玉米BRI1基因的编辑等位基因在下表3中进一步描述。
表3.编辑的玉米等位基因
实施例6.玉米表型分析
玉米植株在温室条件下生长至开花。开花时,植物是自花授粉的。穗在植物上成熟并变干。收获成熟的穗,并直接测量从基部(柄顶部)到尖端的穗长,包括任何尖端空隙。直接在穗最宽的部分测量收获的穗的穗宽。除了直接测量外,还根据收获的穗的图像分析计算穗长和穗宽。如下表4所示,与野生型植物相比,所有编辑的等位基因组合都显示出穗长的增加,并且那些用星号(*)标识的条目确定了统计学上的显著差异。这些观察结果表明,玉米中BRI1基因的编辑等位基因正在影响穗结构。
表4.对具有编辑的BRI1基因的玉米的表型分析
上述内容是对本发明的举例说明,不应被解释为对本发明的限制。本发明由以下权利要求书定义,并包含与权利要求等同的内容。

Claims (104)

1.一种植物或其植物部分,包含编码BRI1多肽(油菜素内酯受体多肽)的内源性油菜素内酯不敏感-1(BRI1)基因中的至少一个突变。
2.根据权利要求1所述的植物或其植物部分,其中所述BRI1多肽包含激酶结构域,任选地,其中所述突变降低所述BRI1激酶结构域的磷酸化。
3.根据权利要求1或权利要求2所述的植物或其植物部分,其中所述至少一个突变是碱基置换、碱基缺失和/或碱基插入。
4.根据前述权利要求中任一项所述的植物或其植物部分,其中所述至少一个突变包括对A、T、G或C的碱基置换。
5.根据前述权利要求中任一项所述的植物或其植物部分,其中所述至少一个突变包括从A到G的碱基置换。
6.根据权利要求1-4中任一项所述的植物或其植物部分,其中所述至少一个突变是至少一个碱基的缺失或插入。
7.根据权利要求1-4或6中任一项所述的植物或其植物部分,其中所述至少一个突变是缺失约1个碱基对至约15个连续碱基对。
8.根据权利要求7所述的植物或其植物部分,其中所述缺失为约3、6、9、12或15个连续碱基对,任选地导致一个氨基酸残基至约5个连续氨基酸残基的缺失。
9.根据权利要求4或权利要求7所述的植物或其植物部分,其中所述插入或缺失是框内插入或框内缺失。
10.根据前述权利要求中任一项所述的植物或其植物部分,其中所述内源性BRI1基因包含与SEQ ID NO:69、70、85、86、99、100、112、113、123或124中任一个具有至少80%序列同一性的核苷酸序列,或包含与SEQ ID NO:72-76、89-94、102-106、115-118或126-130中任一个具有至少80%序列同一性的区域。
11.根据前述权利要求中任一项所述的植物或其植物部分,其中所述内源性BRI1基因编码与SEQ ID NO:71、87、88、101、114或125中任一个具有至少80%序列同一性的BRI1多肽,或编码与SEQ ID NO:77-81、95-98、107-111、119-122或131-135中任一个具有至少80%序列同一性的区域。
12.根据前述权利要求中任一项所述的植物或其植物部分,其中所述至少一个突变位于所述BRI1基因的编码所述BRI1多肽的激酶结构域的区域中。
13.根据前述权利要求中任一项所述的植物或其植物部分,其中所述内源性BRI1基因中的至少一个突变导致位于以下区域中的一个或多个氨基酸残基的突变:(a)大约位置929-1002、942-994、949-987、956-975和/或960-970,参考SEQ ID NO:71的氨基酸位置编号(例如,SEQ ID NO:77-81),(b)大约位置997-1070、1008-1059、1018-1048和/或1028-1039,参考SEQ ID NO:87或SEQ ID NO:88的氨基酸位置编号(例如,SEQ ID NO:95-98),(c)大约位置1048-1122、1068-1102、1075-1095、1085-1096,参考SEQ ID NO:101的氨基酸位置编号(例如,SEQ ID NO:107-111),(d)大约位置1051-1097、1057-1090、1064-1082和/或1069-1080,参考SEQ ID NO:114的氨基酸位置编号(例如,SEQ ID NO:119-122),和/或(e)大约位置1000-1073、1013-1059、1020-1053、1027-1046和/或1031-1042,参考SEQ ID NO:125的氨基酸位置编号(例如,SEQ ID NO:98、131-135)。
14.根据前述权利要求中任一项所述的植物或其植物部分,其中所述至少一个突变位于内源性BRI1基因中的位于以下的区域中:(a)大约核苷酸3096-3235、3136-3295、3156-3275、3176-3255和/或3176-3237,参考SEQ ID NO:69的核苷酸位置编号(例如,SEQ ID NO:72-76),(b)大约核苷酸2784-3023、2824-2983、2844-2963、2864-2943和/或2864-2924,参考SEQ ID NO:70的核苷酸位置编号(例如,SEQ ID NO:72-76),(c)大约核苷酸3198-3420、3238-3380、3258-3360、3278-3340和/或3291-3327,参考SEQ ID NO:85的核苷酸位置编号(例如,SEQ ID NO:89-94),(d)大约核苷酸1944-2166、1984-2126、2004-2106、2024-2085和/或2036-2073,参考SEQ ID NO:86的核苷酸位置编号(例如,SEQ ID NO:89-94),(e)大约核苷酸3070-3292、3110-3252、3130-3232、3150-3212和/或3180-3228,参考SEQ ID NO:99或SEQ ID NO:100的核苷酸位置编号(例如,SEQ ID NO:102-106),(f)大约核苷酸3109-3331、3149-3291、3169-3271、3189-3251和/或3204-3244,参考SEQ ID NO:113或SEQ IDNO:114的核苷酸位置编号(例如,SEQ ID NO:115-118),(g)大约核苷酸3289-3511、3329-3471、3349-3451、3369-3431和/或3381-3419,参考SEQ ID NO:123的核苷酸位置编号(例如,SEQ ID NO:126-130)和/或(h)大约核苷酸2997-3219、3037-3179、3057-3159、3077-3139和/或3089-3126,参考SEQ ID NO:124的核苷酸位置编号(例如,SEQ ID NO:126-130)。
15.根据前述权利要求中任一项所述的植物或其植物部分,其中所述至少一个突变导致位于以下位置的任一个或多个氨基酸残基的置换:大约位置955-975,参考SEQ ID NO:71的氨基酸位置编号;大约位置1023-1043,参考SEQ ID NO:87或SEQ ID NO:88的氨基酸位置编号;大约位置1081-1101,参考SEQ ID NO:101的氨基酸位置编号;大约位置1065-1085,参考SEQ ID NO:114的氨基酸位置编号;和/或大约位置1026-1046,参考SEQ ID NO:125的氨基酸位置编号。
16.根据前述权利要求中任一项所述的植物或其植物部分,其中所述至少一个突变导致位于以下位置的氨基酸残基的置换:位置965处,参考SEQ ID NO:71的氨基酸位置编号;位置1033处,参考SEQ ID NO:87或SEQ ID NO:88的氨基酸位置编号;位置1091处,参考SEQID NO:101的氨基酸位置编号;位置1075处,参考SEQ ID NO:114的氨基酸位置编号;或位置1036处,参考SEQ ID NO:125的氨基酸位置编号。
17.根据权利要求16所述的植物或植物部分,其中所述置换是苏氨酸置换为丙氨酸(T>A)。
18.根据前述权利要求中任一项所述的植物或其植物部分,其中所述植物是玉米、大豆、油菜、小麦、水稻、棉花、甘蔗、甜菜、大麦、燕麦、苜蓿、向日葵、红花、油棕、芝麻、椰子、烟草、马铃薯、红薯、木薯、咖啡、苹果、李子、杏、桃、樱桃、梨、无花果、香蕉、柑橘、可可、鳄梨、橄榄、扁桃、核桃、草莓、西瓜、胡椒、葡萄、番茄、黄瓜或芸苔属。
19.根据前述权利要求中任一项所述的植物或其植物部分,其中所述植物是大豆或玉米。
20.根据前述权利要求中任一项所述的植物或其植物部分,其中与没有所述至少一个突变的植物(例如,同基因植物(例如,野生型未编辑植物或空缺分离体))相比,包含所述至少一个突变的植物具有一种或多种改善的产量性状的表型。
21.根据权利要求20所述的植物或其植物部分,其中所述一种或多种改善的产量性状包括更高的产量(蒲式耳/英亩)、增加的生物量、增加的株高、增加的茎直径、增加的叶面积、增加的花数、增加的籽粒行数任选地其中穗长不显著减少、增加的籽粒数、增加的籽粒大小、增加的穗长、减少的分蘖数、减少的雄穗分枝数、增加的荚果数量包括每个节增加的荚果数量和/或每株植物增加的荚果数量、每个荚果增加的种子数量、增加的种子数量、增加的种子大小和/或增加的种子重量(例如,增加的百粒种子重量),任选地增加的籽粒行数、增加的穗长、增加的荚果数量和/或增加的种子数量。
22.根据前述权利要求中任一项所述的植物或其植物部分,其中所述至少一个突变导致突变的BRI1基因,所述突变的BRI1基因包含与SEQ ID NO:140-145中任一个具有至少90%序列同一性的核苷酸序列。
23.根据前述权利要求中任一项所述的植物或其植物部分,其中所述突变为非天然突变。
24.一种植物细胞,包含编辑系统,所述编辑系统包括:
(a)CRISPR-Cas效应蛋白;和
(b)向导核酸,所述向导核酸包含与编码油菜素内酯不敏感-1(BRI1)多肽的内源性靶基因互补的间隔序列。
25.根据权利要求24所述的植物细胞,其中所述内源性靶基因:(a)包含与SEQ ID NO:69、70、85、86、99、100、112、113、123或124中任一个具有至少80%序列同一性的核苷酸序列,(b)包含与SEQ ID NO:72-76、89-94、102-106、115-118或126-130中任一个具有至少80%序列同一性的区域,(c)编码与SEQ ID NO:71、87、88、101、114或125中任一个具有至少80%序列同一性的序列,或(d)编码与SEQ ID NO:77-81、95-98、107-111、119-122或131-135中任一个具有至少80%序列同一性的区域。
26.根据权利要求24或权利要求25所述的植物细胞,其中所述向导核酸包含SEQ IDNO:82-84和/或136-139中任一核苷酸序列的序列。
27.根据权利要求24-26中任一项所述的植物细胞,其中所述植物细胞为玉米细胞或大豆细胞。
28.根据权利要求24-27中任一项所述的植物细胞,其中所述至少一个突变导致突变的BRI1基因,所述突变的BRI1基因包含与SEQ ID NO:140-145具有至少90%序列同一性的核苷酸序列。
29.根据权利要求24-28中任一项所述的植物细胞,其中所述突变为非天然突变。
30.由根据权利要求1-23中任一项所述的植物部分或根据权利要求24-29中任一项所述的植物细胞再生的植物。
31.根据权利要求30所述的植物,其中所述一种或多种改善的产量性状包括更高的产量(蒲式耳/英亩)、增加的生物量、增加的株高、增加的茎直径、增加的叶面积、增加的花数、增加的籽粒行数任选地其中穗长不显著减少、增加的籽粒数(与种子数量相同)、增加的籽粒大小(与种子大小相同)、增加的穗长、减少的分蘖数、减少的雄穗分枝数、增加的荚果数量包括每个节增加的荚果数量和/或每株植物增加的荚果数量、每个荚果增加的种子数量、增加的种子数量、增加的种子大小和/或增加的种子重量(例如,增加的百粒种子重量),任选地增加的籽粒行数、增加的穗长、增加的荚果数量和/或增加的种子数量。
32.一种包含内源性油菜素内酯不敏感-1(BRI1)基因中的至少一个突变的植物细胞,其中所述突变是使用包含与内源性BRI1基因中的靶位点结合的核酸结合结构域的编辑系统引入的置换、插入或缺失。
33.根据权利要求32所述的植物细胞,其中所述至少一个突变是碱基缺失或碱基置换。
34.根据权利要求32或权利要求33所述的植物细胞,其中所述内源性BRI1基因中的靶位点位于以下的区域内:(a)大约核苷酸3096-3235、3136-3295、3156-3275、3176-3255和/或3176-3237,参考SEQ ID NO:69的核苷酸位置编号(例如,SEQ ID NO:72-76),(b)大约核苷酸2784-3023、2824-2983、2844-2963、2864-2943和/或2864-2924,参考SEQ ID NO:70的核苷酸位置编号(例如,SEQ ID NO:72-76),(c)大约核苷酸3198-3420、3238-3380、3258-3360、3278-3340和/或3291-3327,参考SEQ ID NO:85的核苷酸位置编号(例如,SEQ ID NO:89-94),(d)大约核苷酸1944-2166、1984-2126、2004-2106、2024-2085和/或2036-2073,参考SEQ ID NO:86的核苷酸位置编号(例如,SEQ ID NO:89-94),(e)大约核苷酸3070-3292、3110-3252、3130-3232、3150-3212和/或3180-3228,参考SEQ ID NO:99或SEQ ID NO:100的核苷酸位置编号(例如,SEQ ID NO:102-106),(f)大约核苷酸3109-3331、3149-3291、3169-3271、3189-3251和/或3204-3244,参考SEQ ID NO:113或SEQ ID NO:114的核苷酸位置编号(例如,SEQ ID NO:115-118),(g)大约核苷酸3289-3511、3329-3471、3349-3451、3369-3431和/或3381-3419,参考SEQ ID NO:123的核苷酸位置编号(例如,SEQ ID NO:126-130)和/或(h)大约核苷酸2997-3219、3037-3179、3057-3159、3077-3139和/或3089-3126,参考SEQ IDNO:124的核苷酸位置编号(例如,SEQ ID NO:126-130)。
35.根据权利要求32-34中任一项所述的植物细胞,其中编码包含连续氨基酸残基的氨基酸序列的所述内源性BRI1基因的区域内的靶位点位于:(a)大约位置929-1002、942-994、949-987、956-975和/或960-970,参考SEQ ID NO:71的氨基酸位置编号(例如,SEQ ID NO:77-81),(b)大约位置997-1070、1008-1059、1018-1048和/或1028-1039,参考SEQ ID NO:87或SEQ ID NO:88的氨基酸位置编号(例如,SEQ ID NO:95-98),(c)大约位置1048-1122、1068-1102、1075-1095、1085-1096,参考SEQ ID NO:101的氨基酸位置编号(例如,SEQ IDNO:107-111),(d)大约位置1051-1097、1057-1090、1064-1082和/或1069-1080,参考SEQ IDNO:114的氨基酸位置编号(例如,SEQ ID NO:119-122),和/或(e)大约位置1000-1073、1013-1059、1020-1053、1027-1046和/或1031-1042,参考SEQ ID NO:125的氨基酸位置编号(例如,SEQ ID NO:98、131-135)。
36.根据权利要求32-35中任一项所述的植物细胞,其中所述编辑系统还包含核酸酶,所述核酸结合结构域与序列内的靶位点结合,所述序列与编码SEQ ID NO:69、70、85、86、99、100、112、113、123或124中任一个的序列具有至少80%的序列同一性,或与编码SEQ IDNO:72-76、89-94、102-106、115-118或126-130中任一个的序列具有至少80%的序列同一性,并且BRI1基因中的至少一个突变是在被核酸酶裂解后发生的。
37.根据权利要求36所述的植物细胞,其中所述核酸酶是锌指核酸酶、转录激活因子样效应物核酸酶(TALEN)、核酸内切酶(例如,Fok1)或CRISPR-Cas效应蛋白。
38.根据权利要求32-37中任一项所述的植物细胞,其中所述核酸结合结构域是锌指、转录激活因子样DNA结合结构域(TAL)、argonaute或CRISPR-Cas效应物核酸结合结构域。
39.根据权利要求32-38中任一项所述的植物细胞,其中所述内源性BRI1基因内的至少一个突变是插入和/或缺失,任选地,所述至少一个突变是框内插入或缺失。
40.根据权利要求32-39中任一项所述的植物细胞,所述至少一个突变导致位于以下位置的任一个或多个氨基酸残基的置换:大约位置955-975,参考SEQ ID NO:71的氨基酸位置编号;大约位置1023-1043,参考SEQ ID NO:87或SEQ ID NO:88的氨基酸位置编号;大约位置1081-1101,参考SEQ ID NO:101的氨基酸位置编号;大约位置1065-1085,参考SEQ IDNO:114的氨基酸位置编号;和/或大约位置1026-1046,参考SEQ ID NO:125的氨基酸位置编号;任选地位于:位置965处,参考SEQ ID NO:71的氨基酸位置编号;位置1033处,参考SEQID NO:87或SEQ ID NO:88的氨基酸位置编号;位置1091处,参考SEQ ID NO:101的氨基酸位置编号;位置1075处,参考SEQ ID NO:114的氨基酸位置编号;或位置1036处,参考SEQ IDNO:125的氨基酸位置编号。
41.根据权利要求32-40中任一项所述的植物细胞,其中所述至少一个突变导致突变的BRI1基因,所述突变的BRI1基因包含与SEQ ID NO:140-145中任一个具有至少90%序列同一性的核苷酸序列。
42.根据权利要求32-41中任一项所述的植物细胞,其中所述突变为非天然突变。
43.由根据权利要求32-42中任一项所述的植物细胞再生的植物,包括内源性BRI1基因内的至少一个突变。
44.根据权利要求43所述的植物,其中与没有所述至少一个突变的植物(例如,同基因植物(例如,野生型未编辑植物或空缺分离体))相比,所述植物表现出一种或多种改善的产量性状的表型。
45.根据权利要求44所述的植物,其中所述一种或多种改善的产量性状包括更高的产量(蒲式耳/英亩)、增加的生物量、增加的株高、增加的茎直径、增加的叶面积、增加的花数、增加的籽粒行数任选地其中穗长不显著减少、增加的籽粒数、增加的籽粒大小、增加的穗长、减少的分蘖数、减少的雄穗分枝数、增加的荚果数量包括每个节增加的荚果数量和/或每株植物增加的荚果数量、每个荚果增加的种子数量、增加的种子数量、增加的种子大小和/或增加的种子重量(例如,增加的百粒种子重量),任选地增加的籽粒行数、增加的穗长、增加的荚果数量和/或增加的种子数量。
46.根据权利要求43-45中任一项所述的植物,其中所述至少一个突变导致突变的BRI1基因,所述突变的BRI1基因包含与SEQ ID NO:140-145中任一个具有至少90%序列同一性的核苷酸序列。
47.根据权利要求43-46中任一项所述的植物,其中所述突变为非天然突变。
48.一种产生/培育无转基因的编辑植物的方法,包括:
将根据权利要求1-23、30、31或43-47中任一项所述的植物与无转基因的植物杂交,从而将所述至少一个突变引入到无转基因的植物中;以及
选择包含所述至少一个突变且无转基因的后代植物,从而产生无转基因的编辑植物。
49.一种提供多种具有一种或多种改善的产量性状的植物的方法,所述方法包括在种植区种植根据权利要求1-23、30、31或43-47中任一项所述的两种或更多种植物,从而提供与不包含所述至少一个突变的多种对照植物相比具有一种或多种改善的产量性状的植物。
50.一种在油菜素内酯不敏感-1(BRI1)多肽的区域中产生变异的方法,包括:
将编辑系统引入植物细胞,其中所述编辑系统靶向油菜素内酯不敏感-1(BRI1)基因中编码所述BRI1多肽的所述区域的区域,以及
使所述BRI1基因的所述区域与所述编辑系统接触,从而将突变引入所述BRI1基因,并在所述植物细胞的BRI1多肽中产生变异。
51.根据权利要求50所述的方法,其中所述BRI1基因包含与SEQ ID NO:69、70、85、86、99、100、112、113、123或124中任一个具有至少80%序列同一性的核苷酸序列和/或编码与SEQ ID NO:71、87、88、101、114或125中任一个具有至少80%序列同一性的氨基酸序列。
52.根据权利要求50或权利要求51所述的方法,其中被靶向的所述内源性BRI1基因的区域包含与SEQ ID NO:72-76、89-94、102-106、115-118或126-130中任一个的至少80%序列同一性和/或位于:(a)大约核苷酸3096-3235、3136-3295、3156-3275、3176-3255和/或3176-3237,参考SEQ ID NO:69的核苷酸位置编号(例如,SEQ ID NO:72-76),(b)大约核苷酸2784-3023、2824-2983、2844-2963、2864-2943和/或2864-2924,参考SEQ ID NO:70的核苷酸位置编号(例如,SEQ ID NO:72-76),(c)大约核苷酸3198-3420、3238-3380、3258-3360、3278-3340和/或3291-3327,参考SEQ ID NO:85的核苷酸位置编号(例如,SEQ ID NO:89-94),(d)大约核苷酸1944-2166、1984-2126、2004-2106、2024-2085和/或2036-2073,参考SEQ ID NO:86的核苷酸位置编号(例如,SEQ ID NO:89-94),(e)大约核苷酸3070-3292、3110-3252、3130-3232、3150-3212和/或3180-3228,参考SEQ ID NO:99或SEQ ID NO:100的核苷酸位置编号(例如,SEQ ID NO:102-106),(f)大约核苷酸3109-3331、3149-3291、3169-3271、3189-3251和/或3204-3244,参考SEQ ID NO:113或SEQ ID NO:114的核苷酸位置编号(例如,SEQ ID NO:115-118),(g)大约核苷酸3289-3511、3329-3471、3349-3451、3369-3431和/或3381-3419,参考SEQ ID NO:123的核苷酸位置编号(例如,SEQ ID NO:126-130)和/或(h)大约核苷酸2997-3219、3037-3179、3057-3159、3077-3139和/或3089-3126,参考SEQ IDNO:124的核苷酸位置编号(例如,SEQ ID NO:126-130)。
53.根据权利要求50-52中任一项所述的方法,其中产生变异的所述BRI1多肽的所述区域编码与SEQ ID NO:77-81、95-98、107-111、119-122或131-135中任一个具有至少80%序列同一性的氨基酸序列,和/或编码位于下列位置的连续氨基酸残基的序列:(a)大约位置929-1002、942-994、949-987、956-975和/或960-970,参考SEQ ID NO:71的氨基酸位置编号(例如,SEQ ID NO:77-81),(b)大约位置997-1070、1008-1059、1018-1048和/或1028-1039,参考SEQ ID NO:87或SEQ ID NO:88的氨基酸位置编号(例如,SEQ ID NO:95-98),(c)大约位置1048-1122、1068-1102、1075-1095、1085-1096,参考SEQ ID NO:101的氨基酸位置编号(例如,SEQ ID NO:107-111),(d)大约位置1051-1097、1057-1090、1064-1082和/或1069-1080,参考SEQ ID NO:114的氨基酸位置编号(例如,SEQ ID NO:119-122),和/或(e)大约位置1000-1073、1013-1059、1020-1053、1027-1046和/或1031-1042,参考SEQ ID NO:125的氨基酸位置编号(例如,SEQ ID NO:98、131-135)。
54.根据权利要求50-53中任一项所述的方法,其中所述BRI1多肽中的变异导致突变的BRI1多肽,所述突变的BRI1多肽由与SEQ ID NO:140-145中任一个具有至少90%序列同一性的核酸编码。
55.一种用于编辑植物细胞基因组中特定位点的方法,所述方法包括:以位点特异性方式裂解所述植物细胞中内源性油菜素内酯不敏感-1(BRI1)基因内的靶位点,所述内源性BRI1基因:
(a)包含与SEQ ID NO:69、70、85、86、99、100、112、113、123或124中任一个核苷酸序列具有至少80%序列同一性的序列,
(b)包含与SEQ ID NO:72-76、89-94、102-106、115-118或126-130中任一个核苷酸序列具有至少80%序列同一性的区域,
(c)编码与SEQ ID NO:71、87、88、101、114或125中任一个具有至少80%序列同一性的氨基酸序列,和/或
(d)编码与SEQ ID NO:77-81、95-98、107-111、119-122或131-135中任一个氨基酸序列具有至少80%序列同一性的区域,
从而在所述植物细胞的内源性BRI1基因中产生编辑,并产生包含所述内源性BRI1基因中的所述编辑的植物细胞。
56.根据权利要求55所述的方法,还包括由包含所述内源性BRI1基因中的所述编辑的所述植物细胞再生植物,以产生在其内源性BRI1基因中包含所述编辑的植物。
57.根据权利要求55或权利要求56所述的方法,其中所述编辑导致突变,任选地非天然突变。
58.根据权利要求55-57中任一项所述的方法,其中在其内源性BRI1基因中包含所述编辑的所述植物与没有所述至少一个突变的植物(例如,同基因植物(例如,野生型未编辑植物或空缺分离体))相比,表现出一种或多种改善的产量性状的表型,任选地其中所述一种或多种改善的产量性状包括更高的产量(蒲式耳/英亩)、增加的生物量、增加的株高、增加的茎直径、增加的叶面积、增加的花数、增加的籽粒行数任选地其中穗长不显著减少、增加的籽粒数(与种子数量相同)、增加的籽粒大小(与种子大小相同)、增加的穗长、减少的分蘖数、减少的雄穗分枝数、增加的荚果数量包括每个节增加的荚果数量和/或每株植物增加的荚果数量、每个荚果增加的种子数量、增加的种子数量、增加的种子大小和/或增加的种子重量(例如,增加的百粒种子重量),任选地增加的籽粒行数、增加的穗长、增加的荚果数量和/或增加的种子数量。
59.根据权利要求55-58中任一项所述的方法,其中所述内源性BRI1基因编码BRI1多肽,并且所述编辑导致位于下列位置处的氨基酸残基中的变异:大约位置955-975,参考SEQID NO:71的氨基酸位置编号;大约位置1023-1043,参考SEQ ID NO:87或SEQ ID NO:88的氨基酸位置编号;大约位置1081-1101,参考SEQ ID NO:101的氨基酸位置编号;大约位置1065-1085,参考SEQ ID NO:114的氨基酸位置编号;和/或大约位置1026-1046,参考SEQ IDNO:125的氨基酸位置编号。
60.根据权利要求55-59中任一项所述的方法,其中所述编辑导致突变的BRI1核酸,所述突变的BRI1核酸与SEQ ID NO:140-145中任一个核苷酸序列具有至少90%序列同一性。
61.一种产生植物的方法,包括:
(a)使包含内源性油菜素内酯不敏感-1(BRI1)基因的植物细胞群体和与核酸结合结构域(例如,编辑系统)连接的核酸酶接触,所述核酸结合结构域结合下列序列:(i)与SEQ IDNO:69、70、85、86、99、100、112、113、123或124中任一个核苷酸序列具有至少80%序列同一性的序列,(ii)编码与SEQ ID NO:71、87、88、101、114或125中任一个具有至少80%序列同一性的氨基酸序列的序列,(iii)编码包含与SEQ ID NO:77-81、95-98、107-111、119-122或131-135中任一个具有至少80%序列同一性的区域的氨基酸序列的序列,和/或(iv)包含与SEQ ID NO:72-76、89-94、102-106、115-118或126-130中任一个具有至少80%同一性的区域的序列;
(b)从内源性BRI1基因发生突变的群体中选择植物细胞,从而产生包含所述内源性BRI1基因中的突变的植物细胞;以及
(c)使所选择的植物细胞生长为植物。
62.一种改善植物的一种或多种产量性状的方法,包括:
(a)使包含内源性油菜素内酯不敏感-1(BRI1)基因的植物细胞与靶向所述内源性BRI1基因的核酸酶接触,以产生包含所述内源性BRI1基因中的突变的植物细胞,其中所述核酸酶与结合所述内源性BRI1基因中的靶位点的核酸结合结构域(例如,编辑系统)连接,其中所述内源性BRI1基因:
(i)包含与SEQ ID NO:69、70、85、86、99、100、112、113、123或124中任一个核苷酸序列具有至少80%序列同一性的序列;
(ii)包含与SEQ ID NO:72-76、89-94、102-106、115-118或126-130中任一个具有至少80%同一性的区域;
(iii)编码与SEQ ID NO:71、87、88、101、114或125中任一个具有至少80%序列同一性的氨基酸序列;和/或
(iv)编码包含与SEQ ID NO:77-81、95-98、107-111、119-122或131-135中任一个具有至少80%同一性的区域的氨基酸序列;以及
(b)使所述植物细胞生长成包含所述内源性BRI1基因中的所述突变的植物,从而产生具有突变的内源性BRI1基因和一种或多种改善的产量性状的植物。
63.一种产生植物或其部分的方法,所述植物或其部分包含至少一个具有突变的内源性油菜素内不敏感-1(BRI1)基因的细胞,所述方法包括:
使所述植物或植物部分中的内源性BRI1基因中的靶位点与包含裂解结构域和核酸结合结构域的核酸酶接触,其中所述核酸结合结构域与所述内源性BRI1基因中的靶位点结合,
其中所述内源性BRI1基因:
(a)包含与SEQ ID NO:69、70、85、86、99、100、112、113、123或124中任一个核苷酸序列具有至少80%序列同一性的序列;
(b)包含与SEQ ID NO:72-76、89-94、102-106、115-118或126-130中任一个具有至少80%同一性的区域;
(c)编码与SEQ ID NO:71、87、88、101、114或125中任一个具有至少80%序列同一性的氨基酸序列;和/或
(d)编码包含与SEQ ID NO:77-81、95-98、107-111、119-122或131-135中任一个具有至少80%同一性的区域的氨基酸序列,从而产生包含至少一个具有所述内源性BRI1基因中的突变的细胞的所述植物或其部分。
64.一种产生包含突变的内源性油菜素内酯不敏感-1(BRI1)基因并表现出一种或多种改善的产量性状的植物或其部分的方法,所述方法包括使所述植物或植物部分的内源性BRI1基因中的靶位点与包含裂解结构域和核酸结合结构域的核酸酶接触,其中所述核酸结合结构域与所述内源性BRI1基因中的靶位点结合,
其中所述内源性BRI1基因:
(a)包含与SEQ ID NO:69、70、85、86、99、100、112、113、123或124中任一个核苷酸序列具有至少80%序列同一性的序列;
(b)包含与SEQ ID NO:72-76、89-94、102-106、115-118或126-130中任一个具有至少80%同一性的区域;
(c)编码与SEQ ID NO:71、87、88、101、114或125中任一个具有至少80%序列同一性的氨基酸序列;和/或
(d)编码包含与SEQ ID NO:77-81、95-98、107-111、119-122或131-135中任一个具有至少80%同一性的区域的氨基酸序列,从而产生包含具有突变的内源性BRI1基因并表现出一种或多种改善的产量性状的所述植物或其部分。
65.根据权利要求62或权利要求64所述的方法,其中所述一种或多种改善的产量性状包括与没有所述至少一个突变的对照植物相比,更高的产量(蒲式耳/英亩)、增加的生物量、增加的株高、增加的茎直径、增加的叶面积、增加的花数、增加的籽粒行数任选地其中穗长不显著减少、增加的籽粒数、增加的籽粒大小、增加的穗长、减少的分蘖数、减少的雄穗分枝数、增加的荚果数量包括每个节增加的荚果数量和/或每株植物增加的荚果数量、每个荚果增加的种子数量、增加的种子数量、增加的种子大小和/或增加的种子重量(例如,增加的百粒种子重量),任选地增加的籽粒行数、增加的穗长、增加的荚果数量和/或增加的种子数量。
66.根据权利要求61-65中任一项所述的方法,其中所述核酸酶裂解所述内源性BRI1基因,从而将所述突变引入所述内源性BRI1基因中。
67.根据权利要求61-66中任一项所述的方法,其中所述突变为非天然突变。
68.根据权利要求61-67中任一项的方法,其中所述突变是置换、插入和/或缺失。
69.根据权利要求68所述的方法,其中所述插入或缺失为框内插入或框内缺失,任选地,其中所述突变位于由所述内源性BRI1基因编码的激酶结构域中。
70.根据权利要求69所述的方法,其中由所述内源性BRI1基因编码的激酶结构域位于:(a)大约核苷酸3096-3235、3136-3295、3156-3275、3176-3255和/或3176-3237,参考SEQ IDNO:69的核苷酸位置编号(例如,SEQ ID NO:72-76),(b)大约核苷酸2784-3023、2824-2983、2844-2963、2864-2943和/或2864-2924,参考SEQ ID NO:70的核苷酸位置编号(例如,SEQID NO:72-76),(c)大约核苷酸3198-3420、3238-3380、3258-3360、3278-3340和/或3291-3327,参考SEQ ID NO:85的核苷酸位置编号(例如,SEQ ID NO:89-94),(d)大约核苷酸1944-2166、1984-2126、2004-2106、2024-2085和/或2036-2073,参考SEQ ID NO:86的核苷酸位置编号(例如,SEQ ID NO:89-94),(e)大约核苷酸3070-3292、3110-3252、3130-3232、3150-3212和/或3180-3228,参考SEQ ID NO:99或SEQ ID NO:100的核苷酸位置编号(例如,SEQ ID NO:102-106),(f)大约核苷酸3109-3331、3149-3291、3169-3271、3189-3251和/或3204-3244,参考SEQ ID NO:113或SEQ ID NO:114的核苷酸位置编号(例如,SEQ ID NO:115-118),(g)大约核苷酸3289-3511、3329-3471、3349-3451、3369-3431和/或3381-3419,参考SEQ ID NO:123的核苷酸位置编号(例如,SEQ ID NO:126-130)和/或(h)大约核苷酸2997-3219、3037-3179、3057-3159、3077-3139和/或3089-3126,参考SEQ ID NO:124的核苷酸位置编号(例如,SEQ ID NO:126-130)。
71.根据权利要求61-70中任一项所述的方法,其中所述突变是缺失约1个碱基对至约15个连续碱基对。
72.根据权利要求61-71中任一项所述的方法,其中所述突变是缺失3、6、9、12或15个连续碱基对,任选地导致缺失1至约5个连续氨基酸残基。
73.根据权利要求61-72中任一项所述的方法,其中所述突变导致的修饰的氨基酸残基位于:大约位置955-975,参考SEQ ID NO:71的氨基酸位置编号;大约位置1023-1043,参考SEQ ID NO:87或SEQ ID NO:88的氨基酸位置编号;大约位置1081-1101,参考SEQ ID NO:103的氨基酸位置编号;大约位置1065-1085,参考SEQ ID NO:114的氨基酸位置编号;和/或大约位置1026-1046,参考SEQ ID NO:125的氨基酸位置编号;任选地位于:位置965处,参考SEQ ID NO:71的氨基酸位置编号;位置1033处,参考SEQ ID NO:87或SEQ ID NO:88的氨基酸位置编号;位置1091处,参考SEQ ID NO:103的氨基酸位置编号;位置1075处,参考SEQ IDNO:114的氨基酸位置编号;或位置1036处,参考SEQ ID NO:125的氨基酸位置编号。
74.根据权利要求61-73中任一项所述的方法,其中所述核酸酶是锌指核酸酶、转录激活因子样效应物核酸酶(TALEN)、核酸内切酶或CRISPR-Cas效应蛋白。
75.根据权利要求61-74中任一项所述的方法,其中所述核酸结合结构域是锌指、转录激活因子样DNA结合结构域(TAL)、argonaute或CRISPR-Cas效应物DNA结合结构域。
76.根据权利要求61-75中任一项所述的方法,其中所述突变导致突变的BRI基因,所述突变的BRI基因与SEQ ID NO:140-145中任一个核苷酸序列具有至少90%的序列同一性。
77.通过权利要求61-76中任一项所述的方法产生的植物。
78.一种在植物的内源性油菜素内酯不敏感-1(BRI1)基因中产生突变的方法,包括:
(a)将基因编辑系统靶向所述BRI1基因的一部分,所述BRI1基因:
(i)包含与SEQ ID NO:72-76、89-94、102-106、115-118或126-130中任一个具有至少80%序列同一性的序列;和/或
(ii)编码与SEQ ID NO:77-81、95-98、107-111、119-122或131-135中任一个具有至少80%同一性的序列,以及
(b)选择包含修饰的氨基酸残基的植物,所述修饰的氨基酸残基位于:大约位置955-975,参考SEQ ID NO:71的氨基酸位置编号;大约位置1023-1043,参考SEQ ID NO:87或SEQID NO:88的氨基酸位置编号;大约位置1081-1101,参考SEQ ID NO:101的氨基酸位置编号;大约位置1065-1085,参考SEQ ID NO:114的氨基酸位置编号;和/或大约位置1026-1046,参考SEQ ID NO:125的氨基酸位置编号;任选地位于:位置965处,参考SEQ ID NO:71的氨基酸位置编号;位置1033处,参考SEQ ID NO:87或SEQ ID NO:88的氨基酸位置编号;位置1091处,参考SEQ ID NO:101的氨基酸位置编号;位置1075处,参考SEQ ID NO:114的氨基酸位置编号;或位置1036处,参考SEQ ID NO:125的氨基酸位置编号。
79.一种检测突变的BRI1基因的方法,所述方法包括检测植物基因组中编码包含激酶结构域中的突变的BRI1多肽的内源性BRI1基因,任选地其中所述激酶结构域位于BRI1多肽中位于以下的区域:(a)大约位置929-1002、942-994、949-987、956-975和/或960-970,参考SEQ ID NO:74的氨基酸位置编号(例如,SEQ ID NO:80-84),(b)大约位置997-1070、1008-1059、1018-1048和/或1028-1039,参考SEQ ID NO:90或SEQ ID NO:91的氨基酸位置编号(例如,SEQ ID NO:98-101),(c)大约位置1048-1122、1068-1102、1075-1095、1085-1096,参考SEQ ID NO:104的氨基酸位置编号(例如,SEQ ID NO:110-114),(d)大约位置1051-1097、1057-1090、1064-1082和/或1069-1080,参考SEQ ID NO:117的氨基酸位置编号(例如,SEQID NO:122-125),和/或(e)大约位置1000-1073、1013-1059、1020-1053、1027-1046和/或1031-1042,参考SEQ ID NO:128的氨基酸位置编号(例如,SEQ ID NO:101、134-137)。
80.根据权利要求79的方法,其中检测到的所述突变是在位于以下位置的一个或多个氨基酸残基中:大约位置955-975,参考SEQ ID NO:74的氨基酸位置编号;大约位置1023-1043,参考SEQ ID NO:90或SEQ ID NO:91的氨基酸位置编号;大约位置1081-1101,参考SEQID NO:104的氨基酸位置编号;大约位置1065-1085,参考SEQ ID NO:117的氨基酸位置编号;和/或大约位置1026-1046,参考SEQ ID NO:128的氨基酸位置编号;任选地位于:位置965处,参考SEQ ID NO:74的氨基酸位置编号;位置1033处,参考SEQ ID NO:90或SEQ IDNO:91的氨基酸位置编号;位置1091处,参考SEQ ID NO:104的氨基酸位置编号;位置1075处,参考SEQ ID NO:117的氨基酸位置编号;或位置1036处,参考SEQ ID NO:128的氨基酸位置编号。
81.根据权利要求73-75所述的方法,其中检测到的所述突变是A至G(A>G)的核苷酸置换的结果。在一些实施方案中,突变的BRI1多肽包含至少一个突变,所述至少一个突变包含苏氨酸对丙氨酸的置换。
82.一种与油菜素内酯不敏感-1(BRI1)基因中的靶位点结合的向导核酸,其中所述靶位点是在位于所述BRI1基因的下列位置的区域中:(a)大约核苷酸3096-3235、3136-3295、3156-3275、3176-3255和/或3176-3237,参考SEQ ID NO:69的核苷酸位置编号(例如,SEQID NO:72-76),(b)大约核苷酸2784-3023、2824-2983、2844-2963、2864-2943和/或2864-2924,参考SEQ ID NO:70的核苷酸位置编号(例如,SEQ ID NO:72-76),(c)大约核苷酸3198-3420、3238-3380、3258-3360、3278-3340和/或3291-3327,参考SEQ ID NO:85的核苷酸位置编号(例如,SEQ ID NO:89-94),(d)大约核苷酸1944-2166、1984-2126、2004-2106、2024-2085和/或2036-2073,参考SEQ ID NO:86的核苷酸位置编号(例如,SEQ ID NO:89-94),(e)大约核苷酸3070-3292、3110-3252、3130-3232、3150-3212和/或3180-3228,参考SEQ ID NO:99或SEQ ID NO:100的核苷酸位置编号(例如,SEQ ID NO:102-106),(f)大约核苷酸3109-3331、3149-3291、3169-3271、3189-3251和/或3204-3244,参考SEQ ID NO:113或SEQ ID NO:114的核苷酸位置编号(例如,SEQ ID NO:115-118),(g)大约核苷酸3289-3511、3329-3471、3349-3451、3369-3431和/或3381-3419,参考SEQ ID NO:123的核苷酸位置编号(例如,SEQ ID NO:126-130)和/或(h)大约核苷酸2997-3219、3037-3179、3057-3159、3077-3139和/或3089-3126,参考SEQ ID NO:124的核苷酸位置编号(例如,SEQ ID NO:126-130)。
83.根据权利要求82所述的向导核酸,其中所述向导核酸包含间隔序列,所述间隔序列包含SEQ ID NO:82-84和/或SEQ ID NO:136-139中任一个核苷酸序列。
84.一种系统,所述系统包含根据权利要求82或权利要求83所述的向导核酸和与所述向导核酸缔合的CRISPR-Cas效应蛋白。
85.根据权利要求84所述的系统,还包含与向导核酸和CRISPR-Cas效应蛋白缔合的tracr核酸,任选地其中所述tracr核酸和所述向导核酸共价连接。
86.一种基因编辑系统,所述系统包含与向导核酸缔合的CRISPR-Cas效应蛋白,其中所述向导核酸包括与内源性油菜素内酯不敏感-1(BRI1)基因结合的间隔序列。
87.根据权利要求86所述的基因编辑系统,其中所述BRI1基因:
(a)包含与SEQ ID NO:69、70、85、86、99、100、112、113、123或124中任一个核苷酸序列具有至少80%序列同一性的序列;
(b)包含与SEQ ID NO:72-76、89-94、102-106、115-118或126-130中任一个具有至少80%同一性的区域;
(c)编码与SEQ ID NO:71、87、88、101、114或125中任一个具有至少80%序列同一性的氨基酸序列;和/或
(d)编码包含与SEQ ID NO:77-81、95-98、107-111、119-122或131-135中任一个具有至少80%同一性的区域的氨基酸序列。
88.根据权利要求86或权利要求87所述的基因编辑系统,其中所述向导核酸包含间隔序列,所述间隔序列包含SEQ ID NO:82-84和/或SEQ ID NO:136-139中任一个核苷酸序列。
89.根据权利要求86-88中任一项所述的基因编辑系统,还包含与向导核酸和CRISPR-Cas效应蛋白缔合的tracr核酸,任选地其中所述tracr核酸和所述向导核酸共价连接。
90.一种包含向导核酸和包含裂解结构域的CRISPR-Cas效应蛋白的复合物,其中所述向导核酸与内源性油菜素内酯不敏感-1(BRI1)基因中的靶位点结合,其中所述内源性BRI1基因:
(a)包含与SEQ ID NO:69、70、85、86、99、100、112、113、123或124中任一个核苷酸序列具有至少80%序列同一性的序列;
(b)包含与SEQ ID NO:72-76、89-94、102-106、115-118或126-130中任一个具有至少80%同一性的区域;
(c)编码与SEQ ID NO:71、87、88、101、114或125中任一个具有至少80%序列同一性的氨基酸序列;和/或
(d)编码包含与SEQ ID NO:77-81、95-98、107-111、119-122或131-135中任一个具有至少80%同一性的区域的氨基酸序列,其中所述裂解结构域裂解所述BRI1基因中的靶链。
91.一种表达盒,包含:(a)编码包含裂解结构域的CRISPR-Cas效应蛋白的多核苷酸,和(b)与内源性油菜素内酯不敏感-1(BRI1)基因中的靶位点结合的向导核酸,其中所述向导核酸包含与下列互补并结合的间隔序列:
(i)与SEQ ID NO:69、70、85、86、99、100、112、113、123或124中任一个核苷酸序列具有至少80%序列同一性的核酸部分;
(ii)与SEQ ID NO:72-76、89-94、102-106、115-118或126-130中任一个具有至少80%序列同一性的核酸部分;
(iii)编码与SEQ ID NO:71、87、88、101、114或125中任一个具有至少80%序列同一性的氨基酸序列的核酸部分;和/或
(iv)编码与SEQ ID NO:77-81、95-98、107-111、119-122或131-135中任一个具有至少80%同一性的氨基酸序列的核酸部分。
92.一种修饰的油菜素内酯不敏感-1(BRI1)多肽,包含位于下列位置的氨基酸残基的突变:大约位置955-975,参考SEQ ID NO:71的氨基酸位置编号;大约位置1023-1043,参考SEQ ID NO:87或SEQ ID NO:88的氨基酸位置编号;大约位置1081-1101,参考SEQ ID NO:101的氨基酸位置编号;大约位置1065-1085,参考SEQ ID NO:114的氨基酸位置编号;和/或大约位置1026-1046,参考SEQ ID NO:125的氨基酸位置编号;任选地位于:位置965处,参考SEQ ID NO:71的氨基酸位置编号;位置1033处,参考SEQ ID NO:87或SEQ ID NO:88的氨基酸位置编号;位置1091处,参考SEQ ID NO:101的氨基酸位置编号;位置1075处,参考SEQ IDNO:114的氨基酸位置编号;或位置1036处,参考SEQ ID NO:125的氨基酸位置编号。
93.根据权利要求92所述的修饰的BRI1多肽,其中所述修饰的BRI1多肽由与SEQ IDNO:140-145中任一个具有至少90%序列同一性的BRI1核苷酸序列编码。
94.一种玉米植物或其植物部分,包含至少一个内源性油菜素内酯不敏感-1(BRI1)基因中的至少一个突变,所述BRI1基因具有GRMZM6G437417(基因座370)的基因识别号(基因ID),任选地其中所述至少一个突变是非天然突变。
95.一种大豆植物或其植物部分,包含至少一个内源性油菜素内酯不敏感-1(BRI1)基因中的至少一个突变,所述BRI1基因具有Glyma.06g147600(基因座325)、Glyma.04g115700(基因座326)、Glyma.06g320600(基因座327)和/或Glyma.04g218300(基因座328)的基因识别号(基因ID),任选地其中所述至少一个突变是非天然突变。
96.一种与油菜素内酯不敏感-1(BRI1)基因中的靶核酸结合的向导核酸,所述BRI1基因具有GRMZM6G437417(基因座370)、Glyma.06g147600(基因座325)、Glyma.04g115700(基因座326)、Glyma.06g320600(基因座327)和/或Glyma.04g218300(基因座328)的基因识别号(基因ID)。
97.一种产生植物的方法,所述植物包含内源性油菜素内酯不敏感-1(BRI1)基因中的突变和至少一个感兴趣的多核苷酸,所述方法包括:
将第一植物与包含所述至少一个感兴趣的多核苷酸的第二植物杂交以产生后代植物,所述第一植物是根据权利要求1-22、28、29、40-42或72中任一项所述的植物;以及
选择包含所述BRI1基因中的所述突变和至少一个感兴趣的多核苷酸的后代植物,从而产生包含内源性BRI1基因中的突变和至少一个感兴趣的多核苷酸的所述植物。
98.一种产生植物的方法,所述植物包含内源性BRI1基因中的突变和至少一个感兴趣的多核苷酸,所述方法包括:
将至少一个感兴趣的多核苷酸引入到根据权利要求1-23、30、31、43-47或77中任一项所述的植物中,从而产生包含BRI1基因中的突变和至少一个感兴趣的多核苷酸的植物。
99.一种产生植物的方法,所述植物包含内源性BRI1基因中的突变并表现出改善的产量性状、改善的植物结构和/或改善的防御性状的表型,所述方法包括:
将第一植物与表现出改善的产量性状、改善的植物结构和/或改善的防御性状的表型的第二植物杂交,所述第一植物是根据权利要求1-23、30、31、43-47或77中任一项所述的植物;以及
选择包含所述BRI1基因中的所述突变以及改善的产量性状、改善的植物结构和/或改善的防御性状的表型的后代植物,从而产生包含内源性BRI1基因中的突变并与对照植物相比表现出改善的产量性状、改善的植物结构和/或改善的防御性状的表型的植物。
100.一种防治容器(例如,花盆或育苗盘等)、生长室、温室、田地、休闲区、草坪中或路边的杂草的方法,所述方法包括:
对在容器、生长室、温室、田地、休闲区、草坪中或路边生长的根据权利要求1-23、30、31、43-47或77中任一项所述的一种或多种(多株)植物施用除草剂,从而防治其中生长有所述一种或多种植物的所述容器、所述生长室、所述温室、所述田地、所述休闲区、所述草坪中或所述路边的杂草。
101.一种减少昆虫对植物的捕食的方法,所述方法包括:
对根据权利要求1-23、30、31、43-47或77中任一项所述的一种或多种植物施用杀虫剂,从而减少昆虫对所述一种或多种植物的捕食。
102.一种减少植物上的真菌病害的方法,所述方法包括:
对权利要求1-23、30、31、43-47或77中任一项所述的一种或多种植物施用杀真菌剂,从而减少所述一种或多种植物上的真菌病害。
103.根据权利要求101或权利要求102所述的方法,其中所述一种或多种植物在容器、生长室、温室、田地、休闲区、草坪中或路边生长。
104.根据权利要求97-103中任一项所述的方法,其中所述感兴趣的多核苷酸是赋予除草剂耐性、抗虫性、抗病性、增加的产量、增加的养分利用效率或抗非生物胁迫性的多核苷酸。
CN202280068221.5A 2021-08-12 2022-08-11 修饰油菜素内酯受体基因以改善产量性状 Pending CN118076742A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202163232297P 2021-08-12 2021-08-12
US63/232,297 2021-08-12
PCT/US2022/074790 WO2023019188A1 (en) 2021-08-12 2022-08-11 Modification of brassinosteroid receptor genes to improve yield traits

Publications (1)

Publication Number Publication Date
CN118076742A true CN118076742A (zh) 2024-05-24

Family

ID=83188400

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280068221.5A Pending CN118076742A (zh) 2021-08-12 2022-08-11 修饰油菜素内酯受体基因以改善产量性状

Country Status (6)

Country Link
US (1) US20230078990A1 (zh)
EP (1) EP4384626A1 (zh)
CN (1) CN118076742A (zh)
AR (1) AR126786A1 (zh)
CA (1) CA3229056A1 (zh)
WO (1) WO2023019188A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023168217A1 (en) * 2022-03-02 2023-09-07 Pairwise Plants Services, Inc. Modification of brassinosteroid receptor genes to improve yield traits

Family Cites Families (119)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US137395A (en) 1873-04-01 Improvement in nuts
US2009A (en) 1841-03-18 Improvement in machines for boring war-rockets
US2010A (en) 1841-03-18 Machine foe
US24077A (en) 1859-05-17 Window-sash supporter
NZ221259A (en) 1986-07-31 1990-05-28 Calgene Inc Seed specific transcriptional regulation
US6040504A (en) 1987-11-18 2000-03-21 Novartis Finance Corporation Cotton promoter
DE68918494T2 (de) 1988-05-17 1995-03-23 Lubrizol Genetics Inc Pflanzliches Ubiquitinpromotorsystem.
US5641876A (en) 1990-01-05 1997-06-24 Cornell Research Foundation, Inc. Rice actin gene and promoter
EP0452269B1 (en) 1990-04-12 2002-10-09 Syngenta Participations AG Tissue-preferential promoters
US6395966B1 (en) 1990-08-09 2002-05-28 Dekalb Genetics Corp. Fertile transgenic maize plants containing a gene encoding the pat protein
US5459252A (en) 1991-01-31 1995-10-17 North Carolina State University Root specific gene promoter
HU219057B (hu) 1991-08-27 2001-02-28 Novartis Ag. Inszekticid hatású proteinek Homoptera rovarok ellen és alkalmazásuk a növényvédelemben
UA48104C2 (uk) 1991-10-04 2002-08-15 Новартіс Аг Фрагмент днк, який містить послідовність,що кодує інсектицидний протеїн, оптимізовану для кукурудзи,фрагмент днк, який забезпечує направлену бажану для серцевини стебла експресію зв'язаного з нею структурного гена в рослині, фрагмент днк, який забезпечує специфічну для пилку експресію зв`язаного з нею структурного гена в рослині, рекомбінантна молекула днк, спосіб одержання оптимізованої для кукурудзи кодуючої послідовності інсектицидного протеїну, спосіб захисту рослин кукурудзи щонайменше від однієї комахи-шкідника
BR9604993B1 (pt) 1995-04-20 2009-05-05 dna mutante codificando uma proteìna ahas mutante de sìntese de ácido acetohidróxi e proteìnas ahas mutantes.
HUP9900768A3 (en) 1995-11-06 2002-10-28 Wisconsin Alumni Res Found Insecticidal protein toxins from photorhabdus
AU2829997A (en) 1996-08-29 1998-03-19 Dowelanco Insecticidal protein toxins from (photorhabdus)
AU6882298A (en) 1997-04-03 1998-10-22 Dekalb Genetics Corporation Glyphosate resistant maize lines
DK0915909T3 (da) 1997-05-05 2007-10-08 Dow Agrosciences Llc Insektdræbende proteintoksiner fra Xenorhabdus
CN1301300A (zh) 1998-02-20 2001-06-27 曾尼卡有限公司 花粉特异性启动子
US6333449B1 (en) 1998-11-03 2001-12-25 Plant Genetic Systems, N.V. Glufosinate tolerant rice
WO2000026356A1 (en) 1998-11-03 2000-05-11 Aventis Cropscience N. V. Glufosinate tolerant rice
US6509516B1 (en) 1999-10-29 2003-01-21 Plant Genetic Systems N.V. Male-sterile brassica plants and methods for producing same
US6506963B1 (en) 1999-12-08 2003-01-14 Plant Genetic Systems, N.V. Hybrid winter oilseed rape and methods for producing same
BR0016851A (pt) 1999-12-28 2002-10-08 Bayer Crospscience N V Proteìnas inseticidas do bacillus thuringiensis
US6395485B1 (en) 2000-01-11 2002-05-28 Aventis Cropscience N.V. Methods and kits for identifying elite event GAT-ZM1 in biological samples
AR044724A1 (es) 2000-03-27 2005-10-05 Syngenta Participations Ag Promotores del virus de la rizadura amarilla del cestrum
US7166770B2 (en) 2000-03-27 2007-01-23 Syngenta Participations Ag Cestrum yellow leaf curling virus promoters
BRPI0100752B1 (pt) 2000-06-22 2015-10-13 Monsanto Co moléculas e pares de moléculas de dna, processos para detectar molécula de dna e para criar um traço tolerante a glifosato em plantas de milho, bem como kit de detecção de dna
US6713259B2 (en) 2000-09-13 2004-03-30 Monsanto Technology Llc Corn event MON810 and compositions and methods for detection thereof
WO2002027004A2 (en) 2000-09-29 2002-04-04 Monsanto Technology Llc Glyphosate tolerant wheat plant 33391 and compositions and methods for detection thereof
AU2002215363B2 (en) 2000-10-25 2006-10-12 Monsanto Technology Llc Cotton event PV-GHGT07(1445) and compositions and methods for detection thereof
ATE509110T1 (de) 2000-10-30 2011-05-15 Monsanto Technology Llc Canola event pv-bngt(rt73), zusammensetzungen und verfahren zum nachweis davon
AR035215A1 (es) 2000-11-20 2004-05-05 Monsanto Technology Llc Polinucleotido aislado, primer y segundo polinucleotido cebador, metodo para detectar el suceso vegetal de algodon 531, molecula de polinucleotido aislado obtenida por dicho metodo, equipo de deteccion de acido nucleico y metodo para determinar la cigosidad del genoma de una planta de algodon.
WO2002044407A2 (en) 2000-11-30 2002-06-06 Ses Europe N.V. Glyphosate resistant transgenic sugar beet characterised by a specific transgene insertion (t227-1), methods and primers for the detection of said insertion
EG26529A (en) 2001-06-11 2014-01-27 مونسانتو تكنولوجى ل ل سى Prefixes for detection of DNA molecule in cotton plant MON15985 which gives resistance to damage caused by insect of squamous lepidoptera
US6818807B2 (en) 2001-08-06 2004-11-16 Bayer Bioscience N.V. Herbicide tolerant cotton plants having event EE-GH1
AU2002361696A1 (en) 2001-12-17 2003-06-30 Syngenta Participations Ag Novel corn event
UA87808C2 (ru) 2002-07-29 2009-08-25 Монсанто Текнолоджи, Ллс Зерновые растения pv-zmir13 (mon863) и композиции и способы их обнаружения
GB0225129D0 (en) 2002-10-29 2002-12-11 Syngenta Participations Ag Improvements in or relating to organic compounds
EP1567000A4 (en) 2002-12-05 2007-09-05 Monsanto Technology Llc EVENT ASSOCIATED WITH AGROSTIDE ASR-368 AND COMPOSITIONS AND METHODS FOR DETECTING THE PRESENCE THEREOF
WO2004072235A2 (en) 2003-02-12 2004-08-26 Monsanto Technology Llc Cotton event mon 88913 and compositions and methods for detection thereof
US7335816B2 (en) 2003-02-28 2008-02-26 Kws Saat Ag Glyphosate tolerant sugar beet
PT1597373E (pt) 2003-02-20 2012-09-27 Kws Saat Ag Beterraba açucareira tolerante a glifosato
EP1620571B1 (en) 2003-05-02 2015-07-01 Dow AgroSciences LLC Corn event tc1507 and methods for detection thereof
WO2005037993A2 (en) 2003-10-06 2005-04-28 Syngenta Participations Ag Promoters functional in plant plastids
KR100537955B1 (ko) 2003-10-29 2005-12-20 학교법인고려중앙학원 꽃가루 특이적 유전자 발현 프로모터
WO2005054480A2 (en) 2003-12-01 2005-06-16 Syngenta Participations Ag Insect resistant cotton plants and methods of detecting the same
CN1886513A (zh) 2003-12-01 2006-12-27 先正达公司 昆虫抗性棉花植株及对其进行探测的方法
US7157281B2 (en) 2003-12-11 2007-01-02 Monsanto Technology Llc High lysine maize compositions and event LY038 maize plants
WO2005059103A2 (en) 2003-12-15 2005-06-30 Monsanto Technology Llc Corn plant mon88017 and compositions and methods for detection thereof
GB0402106D0 (en) 2004-01-30 2004-03-03 Syngenta Participations Ag Improved fertility restoration for ogura cytoplasmic male sterile brassica and method
CN102260668B (zh) 2004-03-25 2016-08-10 辛根塔参与股份公司 玉米事件mir604
EP2333082B1 (en) 2004-03-26 2015-01-07 Dow AgroSciences LLC Cry1F and Cry1AC transgenic cotton lines and event-specific identification thereof
AU2005292090B2 (en) 2004-09-29 2011-02-03 Corteva Agriscience Llc Corn event DAS-59122-7 and methods for detection thereof
EP1868426B1 (en) 2005-03-16 2018-02-21 Syngenta Participations AG Corn event 3272 and methods of detection thereof
CA2603944C (en) 2005-04-08 2015-06-23 Bayer Bioscience N.V. Elite event a2704-12 comprising the integration of the phosphinothricin acetyltransferase (pat) gene into soybeans, and methods and kits for identifying such event in biological samples
PT1871901E (pt) 2005-04-11 2011-09-29 Bayer Bioscience Nv Acontecimento elite a5547-127 e processos e kits para identificar um tal acontecimento em amostras biológicas
AP2693A (en) 2005-05-27 2013-07-16 Monsanto Technology Llc Soybean event MON89788 and methods for detection thereof
BRPI0611504A2 (pt) 2005-06-02 2010-09-08 Syngenta Participations Ag algodão inseticida ce43-67b
WO2006128572A1 (en) 2005-06-02 2006-12-07 Syngenta Participations Ag Ce46-02a insecticidal cotton
BRPI0611508A2 (pt) 2005-06-02 2010-09-14 Syngenta Participations Ag algodão inseticida ce44-69d
WO2006128568A2 (en) 2005-06-02 2006-12-07 Syngenta Participations Ag T342-142, insecticidal transgenic cotton expressing cry1ab
WO2006128570A1 (en) 2005-06-02 2006-12-07 Syngenta Participations Ag 1143-51b insecticidal cotton
WO2006128569A2 (en) 2005-06-02 2006-12-07 Syngenta Participations Ag 1143-14a, insecticidal transgenic cotton expressing cry1ab
EP1922409B1 (en) 2005-08-08 2017-11-08 Bayer CropScience NV Herbicide tolerant cotton plants and methods for identifying same
AR055128A1 (es) 2005-08-24 2007-08-08 Du Pont Metodos y composiciones para la expresion de un polinucleotido de interes
WO2011066360A1 (en) 2009-11-24 2011-06-03 Dow Agrosciences Llc Detection of aad-12 soybean event 416
CN101421404A (zh) 2006-02-10 2009-04-29 马哈拉施特拉杂交种子有限公司 表达cry1ac基因的转基因茄子(solanum melongena)
EP2021476B1 (en) 2006-05-26 2014-07-09 Monsanto Technology, LLC Corn plant and seed corresponding to transgenic event mon89034 and methods for detection and use thereof
AP2726A (en) 2006-06-03 2013-08-31 Syngenta Participations Ag Corn event MIR 162
US7951995B2 (en) 2006-06-28 2011-05-31 Pioneer Hi-Bred International, Inc. Soybean event 3560.4.3.5 and compositions and methods for the identification and detection thereof
US7928295B2 (en) 2006-08-24 2011-04-19 Bayer Bioscience N.V. Herbicide tolerant rice plants and methods for identifying same
US20080064032A1 (en) 2006-09-13 2008-03-13 Syngenta Participations Ag Polynucleotides and uses thereof
US7928296B2 (en) 2006-10-30 2011-04-19 Pioneer Hi-Bred International, Inc. Maize event DP-098140-6 and compositions and methods for the identification and/or detection thereof
BR122017006111B8 (pt) 2006-10-31 2022-12-06 Du Pont Métodos para controlar ervas daninhas
WO2008114282A2 (en) 2007-03-19 2008-09-25 Maharashtra Hybrid Seeds Company Limited Transgenic rice (oryza sativa) comprising pe-7 event and method of detection thereof
CN103773863A (zh) 2007-04-05 2014-05-07 拜尔作物科学公司 抗虫棉花植物及其鉴定方法
EP2615173B1 (en) 2007-06-11 2020-09-16 Basf Agricultural Solutions Seed Us Llc Insect resistant cotton plants and methods for identifying same
CN101861392B (zh) 2007-11-15 2016-01-20 孟山都技术公司 对应于转基因事件mon87701的大豆植物和种子及其检测方法
WO2009100188A2 (en) 2008-02-08 2009-08-13 Dow Agrosciences Llc Methods for detection of corn event das-59132
BRPI0908831A2 (pt) 2008-02-14 2015-08-04 Pioneer Hi Bred Int Métodos para identificar o evento e6611.32.1.38 em amostra biológica, para detectar a presença do evento e6611.32.1.38 ou a progênie deste em uma amostra biológica, para detectar a presença de dna correspondente ao evento e6611.32.1.38 em uma amostra, para selecionar sementes com a presença do evento e6611.32.1.38, molécula de dna isolada, sequência de nucleotídeos de primer de dna, par de sequências de dna isoladas, planta, célula, tecido, semente transgênicos ou partes destes contendo dna.
CA2712445C (en) 2008-02-15 2018-11-06 Monsanto Technology Llc Soybean plant and seed corresponding to transgenic event mon87769 and methods for detection thereof
MX341747B (es) 2008-02-29 2016-08-31 Monsanto Technology Llc Evento de maiz mon87460 y composiciones y metodos para detectarlo.
BRPI0915154A2 (pt) 2008-06-11 2017-06-13 Dow Agrosciences Llc construtos para expressão de genes de tolerância a herbicida, plantas relacionadas e combinações de traços relacionados
US9078406B2 (en) 2008-08-29 2015-07-14 Monsanto Technology Llc Soybean plant and seed corresponding to transgenic event MON87754 and methods for detection thereof
MX356687B (es) 2008-09-29 2018-06-07 Monsanto Technology Llc Evento transgénico de frijol de soya mon87705 y métodos para detección del mismo.
MX2011006292A (es) 2008-12-16 2011-06-27 Syngenta Participations Ag Evento 5307 del maiz.
WO2010076212A1 (en) 2008-12-19 2010-07-08 Syngenta Participations Ag Transgenic sugar beet event gm rz13
CN104789649A (zh) 2009-01-07 2015-07-22 巴斯夫农化产品有限公司 大豆事件127和与其相关的方法
CN102448288B (zh) 2009-03-30 2015-07-15 孟山都技术公司 转基因水稻事件17314及其使用方法
WO2010117737A1 (en) 2009-03-30 2010-10-14 Monsanto Technology Llc Rice transgenic event17053 and methods of use thereof
CN102573452B (zh) 2009-08-19 2015-07-22 陶氏益农公司 Aad-1事件das-40278-9、相关的转基因玉米品系及其事件特异性鉴定
CN107779520A (zh) 2009-09-17 2018-03-09 孟山都技术公司 大豆转基因事件mon 87708及其使用方法
WO2011063413A2 (en) 2009-11-23 2011-05-26 Bayer Bioscience N.V. Herbicide tolerant soybean plants and methods for identifying same
BR112012012404B1 (pt) 2009-11-23 2019-03-06 Monsanto Technology Llc "molécula de dna reconbinante de amplicon, sonda de dna, par de moléculas de dna mètodo para detectar a presença de uma molècula de dna e kit de detecçao de dna".
US8581046B2 (en) 2010-11-24 2013-11-12 Pioneer Hi-Bred International, Inc. Brassica gat event DP-073496-4 and compositions and methods for the identification and/or detection thereof
CA2781375C (en) 2009-11-24 2020-05-05 Dow Agrosciences Llc Aad-12 event 416, related transgenic soybean lines, and event-specific identification thereof
US20110154525A1 (en) 2009-12-17 2011-06-23 Pioneer Hi-Bred International, Inc. Maize event DP-040416-8 and methods for detection thereof
WO2011075595A1 (en) 2009-12-17 2011-06-23 Pioneer Hi-Bred International, Inc. Maize event dp-043a47-3 and methods for detection thereof
PL2512226T3 (pl) 2009-12-17 2019-10-31 Pioneer Hi Bred Int Modyfikacja DP-004114-3 kukurydzy i sposoby jej wykrywania
US20110154524A1 (en) 2009-12-17 2011-06-23 Pioneer Hi-Bred International, Inc. Maize event DP-032316-8 and methods for detection thereof
NZ603506A (en) 2010-06-04 2013-11-29 Monsanto Technology Llc Transgenic brassica event mon 88302 and methods of use thereof
WO2012033794A2 (en) 2010-09-08 2012-03-15 Dow Agrosciences Llc Aad-12 event 1606 and related transgenic soybean lines
WO2012051199A2 (en) 2010-10-12 2012-04-19 Monsanto Technology Llc Soybean plant and seed corresponding to transgenic event mon87712 and methods for detection thereof
WO2012071039A1 (en) 2010-11-24 2012-05-31 Pioner Hi-Bred International, Inc. Brassica gat event dp-061061-7 and compositions and methods for the identification and/or detection thereof
WO2012075429A1 (en) 2010-12-03 2012-06-07 Dow Agrosciences Llc Stacked herbicide tolerance event 8291.45.36.2, related transgenic soybean lines, and detection thereof
CA2819684C (en) 2010-12-03 2024-05-07 Dow Agrosciences Llc Stacked herbicide tolerance event 8264.44.06.1, related transgenic soybean lines, and detection thereof
TWI667347B (zh) 2010-12-15 2019-08-01 瑞士商先正達合夥公司 大豆品種syht0h2及偵測其之組合物及方法
CN103597079B (zh) 2011-03-30 2017-04-05 孟山都技术公司 棉花转基因事件mon88701及其使用方法
CA2840630C (en) 2011-06-30 2021-11-30 Monsanto Technology Llc Alfalfa plant and seed corresponding to transgenic event kk 179-2 and methods for detection thereof
EP2731419A4 (en) 2011-07-13 2015-04-29 Dow Agrosciences Llc STACKED HERBIC TOLERANT EVENT 8264.42.32.1, CORRESPONDING TRANSGENIC SOYBEAN LINE AND EVIDENCE OF THIS
WO2013012643A1 (en) 2011-07-15 2013-01-24 Syngenta Participations Ag Polynucleotides encoding trehalose-6-phosphate phosphatase and methods of use thereof
US9540654B2 (en) 2012-02-01 2017-01-10 Dow Agrosciences Llc Synthetic brassica-derived chloroplast transit peptides
WO2014150879A1 (en) * 2013-03-15 2014-09-25 Targeted Growth, Inc. Compositions and methods for increasing plant seed number and/or yield
ES2847311T3 (es) 2014-08-05 2021-08-02 MabQuest SA Reactivos inmunológicos que se unen a PD-1
US9790490B2 (en) 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
CN108513575A (zh) 2015-10-23 2018-09-07 哈佛大学的校长及成员们 核碱基编辑器及其用途
WO2018027078A1 (en) 2016-08-03 2018-02-08 President And Fellows Of Harard College Adenosine nucleobase editors and uses thereof
AR113458A1 (es) * 2017-10-19 2020-05-06 Inst Genetics & Developmental Biology Cas Método para regular la expresión génica

Also Published As

Publication number Publication date
CA3229056A1 (en) 2023-02-16
US20230078990A1 (en) 2023-03-16
EP4384626A1 (en) 2024-06-19
AR126786A1 (es) 2023-11-15
WO2023019188A1 (en) 2023-02-16

Similar Documents

Publication Publication Date Title
CN118076742A (zh) 修饰油菜素内酯受体基因以改善产量性状
US20230212600A1 (en) Methods for controlling meristem size for crop improvement
WO2022173885A1 (en) Methods and compositions for modifying cytokinin oxidase levels in plants
US20210395767A1 (en) Methods for controlling meristem size for crop improvement
CN118176205A (zh) 用于改善植物结构和产量性状的方法和组合物
CN118302434A (zh) 用于改善小花育性和种子产量的方法
US20230074699A1 (en) Modification of ubiquitin binding peptidase genes in plants for yield trait improvement
WO2023168217A1 (en) Modification of brassinosteroid receptor genes to improve yield traits
US20230383305A1 (en) Methods and compositions for improving yield traits
US20220380792A1 (en) Methods and compositions for modifying root architecture in plants
US20240060081A1 (en) Methods and compositions for controlling meristem size for crop improvement
WO2023215809A1 (en) Methods and compositions for modifying root architecture and/or improving plant yield traits
WO2024054880A1 (en) Methods and compositions for improving yield characteristics in plants
US20230108968A1 (en) Methods for improving floret fertility and seed yield
US20230348922A1 (en) Methods and compositions for enhancing yield and disease resistance
CA3224730A1 (en) Modification of hect e3 ubiquitin ligase genes to improve yield traits
WO2023023496A1 (en) Methods and compositions for modifying cytokinin receptor histidine kinase genes in plants
CN118355126A (zh) 用于修饰植物中的细胞分裂素受体组氨酸激酶基因的组合物和方法
WO2024006679A1 (en) Methods and compositions for modifying shade avoidance in plants

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination