CN116529379A - 通过以细胞类型特异性方式改变基因表达模式来工程化增加木栓质水平 - Google Patents

通过以细胞类型特异性方式改变基因表达模式来工程化增加木栓质水平 Download PDF

Info

Publication number
CN116529379A
CN116529379A CN202180074784.0A CN202180074784A CN116529379A CN 116529379 A CN116529379 A CN 116529379A CN 202180074784 A CN202180074784 A CN 202180074784A CN 116529379 A CN116529379 A CN 116529379A
Authority
CN
China
Prior art keywords
plant
nucleic acid
myb41
seq
gene
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180074784.0A
Other languages
English (en)
Inventor
J·A·劳
M·罗斯塔姆扎
J·P·诺尔
S·托马斯
J·T·明德雷柏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Salk Institute for Biological Studies
Original Assignee
Salk Institute for Biological Studies
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Salk Institute for Biological Studies filed Critical Salk Institute for Biological Studies
Publication of CN116529379A publication Critical patent/CN116529379A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8222Developmentally regulated expression systems, tissue, organ specific, temporal or spatial regulation
    • C12N15/8223Vegetative tissue-specific promoters
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H1/00Processes for modifying genotypes ; Plants characterised by associated natural traits
    • A01H1/10Processes for modifying non-agronomic quality output traits, e.g. for industrial processing; Value added, non-agronomic traits
    • A01H1/101Processes for modifying non-agronomic quality output traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine or caffeine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Botany (AREA)
  • Developmental Biology & Embryology (AREA)
  • Environmental Sciences (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本公开提供了用于增加植物中木栓质产量的组合物和方法。

Description

通过以细胞类型特异性方式改变基因表达模式来工程化增加 木栓质水平
技术领域
本公开总体上涉及增加植物中木栓质产量的领域。更具体地,本公开涉及用于产生具有增强的根细胞类型特异性表达的植物的组合物和方法。
相关申请的交叉引用
本申请要求于2020年10月17日的美国临时专利申请第63/093,205号的优先权和权益,所述临时申请以引用的方式整体并入本文用于所有目的。以电子方式提交的文本文件的描述
与本申请相关的序列表以文本格式提供,而不是纸质副本。以电子方式提交的文本文件的内容以引用的方式整体并入本文:序列表的计算机可读格式副本(文件名:SALK_006_01WO_SeqList_ST25.txt,记录日期:2021年10月11日;文件大小:≈140千字节)。
背景技术
在植物根中,木栓质沉积在特定位置中,包括周皮,在那里其充当植物与其环境之间的屏障(Vishwanath等人,2015)。木栓质分子含有大量的碳,这些碳被认为可以在土壤中长期存在(Carrington等人,2012;Feng及Simpson,2011;Preston等人,1997;Winkler等人,2005)。因此,通过增加根中的木栓质水平,可以通过光合作用从大气中螯合更多的碳,并长期储存,作为减缓气候变化的一种手段。然而,已知使用35S启动子的木栓质调控因子的全局过表达负面地影响植物健康(Mahmood等人,2019)。
在这里,我们描述了转基因植物的产生,其在根发育的早期阶段形成额外的周皮层和/或在周皮细胞中沉积更多的木栓质,而不会负面地影响植物健康。
发明内容
本公开通过鉴定在特定根组织中(诸如在木栓形成层、中柱鞘或原形成层中)表达的启动子,解决了上述增加植物中木栓质产量的目标。此外,本公开教导了一种方法,通过所述方法,这种增加木栓质的能力可以被导入任何植物属或物种。这种遗传结构的引入可以采取多种形式,如本文所述,包括:传统植物育种、转基因遗传工程、下一代植物育种(CRISPR、碱基编辑、MAS等)以及其他方法。
在一些实施方案中,本文提供了分离的核酸分子,其包含编码与SEQ ID NO:14具有至少80%序列同源性的MYB41氨基酸序列的核酸序列和/或SEQ ID NO:13或SEQ ID NO:15中所示的核酸,其与编码异源启动子的核酸序列可操作地连接,其中与缺乏所述分离的核酸分子的野生型对照植物相比,所述分离的核酸分子在植物中的表达导致木栓质水平增加。在本发明的一些实施方案中,所述木栓质水平的增加通过产生额外的周皮细胞和/或在现有的周皮细胞中沉积更多的木栓质而发生。
在本发明的一些实施方案中,所述分离的核酸分子与SEQ ID NO:14具有至少85%同源性、至少90%同源性、至少95%同源性、至少96%同源性、至少97%同源性、至少98%同源性和至少99%同源性的氨基酸序列同源性。在本发明的一些实施方案中,所述分离的核酸分子具有与SEQ ID NO:14 100%同源的氨基酸序列同源性。在本发明的一些实施方案中,所述分离的核酸分子与SEQ ID NO:13或SEQ ID NO:15具有至少85%同源性、至少90%同源性、至少95%同源性、至少96%同源性、至少97%同源性、至少98%同源性或至少99%同源性的核酸序列同源性。
在本发明的一些实施方案中,编码异源启动子的分离的核酸分子包含选自包含以下的组的分离的核酸序列:SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ IDNO:5和SEQ ID NO:6。在一些实施方案中,所述异源启动子是FACT基因的天然启动子。在一些实施方案中,所述异源启动子是HORST基因的天然启动子。在一些实施方案中,所述异源启动子是ASFT基因的天然启动子。在一些实施方案中,所述异源启动子是GPAT5基因的天然启动子。在一些实施方案中,所述异源启动子是RALPH基因的天然启动子。在一些实施方案中,所述异源启动子是MYB84基因的天然启动子。
在一些实施方案中,本文提供了转化载体,其包含本发明的核酸分子中的一者或多者。
在一些实施方案中,本文提供了转化植物细胞的方法,其包括将本发明的转化载体引入植物细胞中,由此与未转化的野生型对照植物细胞相比,转化的植物细胞产生增加水平的木栓质。在本发明的一些实施方案中,所述方法还包括从转化的植物细胞产生转化的植物组织。在本发明的一些实施方案中,所述方法还包括从转化的植物组织产生转化的小植株,其中与缺乏分离的核酸分子的未转化的野生型对照小植株相比,所述转化的小植株产生增加水平的木栓质。
在本文提供的一些实施方案中,所述方法还包括产生转化的小植株的后代,其中与缺乏分离的核酸分子的未转化的野生型对照小植株相比,所述后代产生增加水平的木栓质。
在本文提供的一些实施方案中,所述方法包括使转化的小植株或转化的小植株的后代生长成成熟的转化植物,其中与缺乏分离的核酸分子的成熟的未转化的野生型对照相比,所述成熟的转化植物产生增加水平的木栓质。在一些实施方案中,本文提供的方法导致通过产生额外的周皮细胞和/或在现有的周皮细胞中沉积更多的木栓质实现的木栓质水平的增加。在一些实施方案中,本文提供的方法导致在与正常木栓质产量无关的细胞中,核酸分子极少表达或不表达。在一些实施方案中,所述方法导致核酸分子在莲座叶中极少表达或不表达。
在本文提供的一些实施方案中,所述方法还包括在育种方法中使用成熟的转化植物或成熟的转化植物的克隆。在一些实施方案中,所述育种方法包括使成熟的转化植物或成熟的转化植物的克隆自交或杂交。
在本文提供的一些实施方案中,所述植物育种方法包括将包含本发明的核酸分子的第一种植物与相同物种的第二种植物杂交,并且基于与野生型对照植物相比木栓质水平的增加来选择所得杂交后代。在一些实施方案中,所述植物育种方法还包括产生所得杂交后代的克隆,其中基于与野生型对照植物相比木栓质水平的增加来选择克隆。在一些实施方案中,使用基于本发明的核酸分子设计的分子标志来选择与野生型对照植物相比显示木栓质水平增加的杂交后代。在一些实施方案中,所述方法还包括在育种方法中使用所选择的后代。
在本发明的一些实施方案中,所述方法还包括使成熟的转化植物或成熟的转化植物的克隆在温室或室外生长。在一些实施方案中,室外生长可以在农场、沼泽地、苗圃、牧场、草原、空地、林地和木材生产地进行。
在阅读本申请后,分子遗传学、植物育种、植物管理、农业生产和其他植物相关技术领域的技术人员将容易确定本发明的其他实施方案。
附图说明
图1A-1G说明了具有启动子HORST(proHORST)的实施例1和3的方面。图1A提供了启动子HORST构建体的示意图。图1B显示了在Col-0和proHORST的一个纯合子(MR13)和两个T2拟南芥(Arabidopsis)品系(MR270和MR276)中的GUS活性测定。使植物在1/2MS培养基下生长14天。黄色箭头表示在周皮(二次生长)和内皮层细胞中的GUS表达。图1C提供了拟南芥初生根纵切面和横切面的示意图。分化区中的拟南芥根横切面具有简单的结构,由中柱(中柱鞘和维管结构)构成,被八个单细胞层内皮层和一个单细胞层皮层和表皮包围。拟南芥根横切面在由维管结构(信息素和木质部)和周皮细胞层构成的成熟根中进行二次生长。图1D提供了GUS结果的图形摘要。深灰色和/或浅灰色显示检测到GUS活性的位置。图1E提供了proHORST::MYB41构建体的示意图。实验中使用的MYB41DNA是全长基因组DNA,包括内含子和外显子。图1F提供了在1/2MS培养基下生长14天的Col-0和proHORST::MYB41纯合系的代表性图像。图1G显示Nile染色,显示在proHORST::MYB41纯合系中周皮的第一层(白色箭头)比在相同阶段和曝光成像的Col-0对照更亮。
图2A-2H说明了具有启动子FACT(proFACT)的实施例1和2的方面。图2A提供了启动子FACT构建体的示意图。图2B显示了在Col-0和proFACT的3个不同T2拟南芥品系中的GUS活性测定。使植物在1/2MS培养基下生长14天。黄色箭头表示在周皮(二次生长)和内皮层细胞中的GUS表达。图2C提供了拟南芥初生根纵切面和横切面的示意图。分化区中的拟南芥根横切面具有简单的结构,由中柱(中柱鞘和维管结构)构成,被八个单细胞层内皮层和一个单细胞层皮层和表皮包围。拟南芥根横切面在由维管结构(信息素和木质部)和周皮细胞层构成的成熟根中进行二次生长。图2D提供了GUS结果的图形摘要。深灰色和/或浅灰色显示检测到GUS活性的位置。图2E提供了proFACT::MYB41构建体的示意图。实验中使用的MYB41DNA是全长基因组DNA,包括内含子和外显子。图2F显示MYB41在proFACT::MYB41中相对于两个对照的表达水平;(i)经β-雌二醇处理的阳性对照proB-est::MYB41和(ii)未经β-雌二醇处理的阴性对照proB-est::MYB41(模拟)。图2G提供了在1/2MS培养基上14天的Col-0和proFACT::MYB41纯合系的代表性图像。图2H尼罗染色(Nile Staining),显示不同proFACT::MYB41纯合系中的第一层(白色箭头)和第二层周皮(灰色箭头),而在相同阶段和曝光成像的Col-0对照仅具有第一层周皮。
图3A-3E说明了通过反应性热解-气相色谱-质谱法(pyGCMS)对木栓质生物标志的定量。图3A和图3D提供了显示分别来自野生型、14天龄拟南芥品系或表达proFACT::MYB41或proHORST::MYB41构建体的品系的干燥根组织的木栓质生物标志水平的条形图。每个条显示三个重复样品的平均值,其中单个值由指示的形状表示,并且误差条表示平均值的标准误差(SEM)。在图3A中,来自三个独立品系(每个品系包含proFACT::MYB41构建体)的数据由三个不同的灰色阴影表示。在图3D中,来自两个独立品系(每个品系包含proHORST::MYB41构建体)的数据显示为由两个暗灰色阴影指示。在这种情况下,每个品系使用三个同胞品系(使用符号区分)。图3C提供了图3A中显示的相同品系的分析,但是使用干燥的茎干组织。图3B和图3E提供了使用来自28天龄根的组织对图3A和图3D中所示的相同品系的分析。在所有图中,黑色箭头表示与野生型(WT)对照样品相比,生物标志持续增加。
具体实施方式
本公开提供了一种通过利用从地球大气中去除过量碳的改良植物来对抗气候变化的解决方案。本公开提供了鉴定可驱动植物细胞、植物组织、植物部分和整株植物中碳螯合增加的遗传物质的方法,其中碳储存在木栓质中。此外,本公开提供了将遗传物质转移至植物的方法,以产生增加植物细胞、植物组织、植物部分和整株植物的木栓质含量的性状。此外,本公开教导了新鉴定的遗传组分和产生遗传修饰的植物、植物细胞、组织和种子的方法,其具有修饰的碳螯合。
I.定义
除非另有定义,否则本文使用的所有技术和科学术语具有本公开所属领域中普通技术人员通常所理解的相同含义。虽然以下术语被认为是本领域普通技术人员所充分理解的,但是提出以下定义以便于解释本公开的主题。虽然与本文所述的那些相似或等同的任何方法和材料均可用于实践或检验本公开,但是将描述优选的方法和材料。以下术语定义如下。这些定义是为了说明的目的,并不旨在限制所定义的术语在本领域中的通常含义。
术语“一个/种(a/an)”是指一个或多个所述实体,即可以指复数指代物。因此,术语“一个/种(a/an)”、“一个/种或多个/种”和“至少一个/种”在本文中可互换使用。此外,不定冠词“一个/种(a/an)”提及的“要素”的引用不排除存在多于一个要素的可能性,除非上下文清楚地要求存在一个且仅一个要素。
如在本说明书所用,除非另有说明,术语“和/或”在本公开中用于表示“和”或“或”二者之一。
在本说明书通篇,除非上下文另有要求,否则词“包含”或变型将被理解为暗指包括陈述的元素或整数或一组元素或整数,但是不排除任何其他元素或整数或其他组的元素或整数。
如本申请所用,术语“约”和“大约”用作等同物。在本申请中使用的具有或不具有约/近似的任何数字意在覆盖相关领域的普通技术人员所理解的任何正常波动。在某些实施方案中,除非另有说明或另外从上下文明显可见(除非此数字将超过可能值的100%),否则术语“大约”或“约”是指在任一方向(大于或小于)上落入所述参考值的25%、20%、19%、18%、17%、16%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%、1%或更小范围内的一系列值。
如本文所用,术语核酸或多肽的“至少一部分”或“片段”是指具有此类序列的最小尺寸特征的部分,或全长分子的任何较大片段,直至并包括全长分子。本公开的多核苷酸的片段可以编码遗传调控元件的生物活性部分。遗传调控元件的生物活性部分可以通过分离包含遗传调控元件的本公开的多核苷酸之一的一部分并评估如本文所述的活性来制备。类似地,多肽的一部分可以是4个氨基酸、5个氨基酸、6个氨基酸、7个氨基酸等,直至全长多肽。待使用的部分的长度将取决于特定应用。可用作杂交探针的核酸的一部分可以短至12个核苷酸;在一些实施方案中,其为20个核苷酸。可用作表位的多肽的一部分可以短至4个氨基酸。执行全长多肽功能的多肽部分一般长于4个氨基酸。在一些实施方案中,多肽或多核苷酸的片段包含参考多肽或多核苷酸全长的至少10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、96%、97%、98%或99%。在一些实施方案中,多肽或多核苷酸片段可含有5、10、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000或更多个核苷酸或氨基酸。
如本文所用,术语“密码子优化”意指DNA或RNA的密码子使用与目的细胞或生物体的密码子使用相适应,以改善所述重组核酸在目的细胞或生物体中的转录速率。本领域技术人员充分意识到以下事实:由于密码子简并性,靶核酸可在一个位置被修饰,而这种修饰仍将导致翻译后所述位置处的相同氨基酸序列,这是通过考虑靶细胞或生物体的物种特异性密码子使用的密码子优化来实现的。
如本文所用,术语“内源”或“内源基因”是指天然存在的基因,其位于宿主细胞基因组中天然存在的位置。如本文所用,“内源基因”与“天然基因”同义。如本文所述的内源基因可包括已根据本公开的任何方法突变的天然存在的基因的等位基因,即内源基因可通过传统植物育种方法和/或下一代植物育种方法在某点进行修饰。
如本文所用,术语“外源”是指来自除其天然来源之外的一些来源的物质。例如,术语“外源蛋白”或“外源基因”是指来自非天然来源并且已经人工供应给生物系统的蛋白或基因。如本文所用,术语“外源”可与术语“异源”互换使用,并且是指来自除其天然来源之外的一些来源的物质。
术语“基因工程化的宿主细胞”、“重组宿主细胞”和“重组品系”在本文中可互换使用,并且是指已经通过本公开的方法进行基因工程化的宿主细胞。因此,所述术语包括已经遗传改变,修饰或工程化的宿主细胞(例如,细菌、酵母细胞、真菌细胞、CHO、人细胞、植物细胞、源自植物的原生质体、愈伤组织等),使得与其源自的天然存在的宿主细胞相比,其表现出改变的,修饰的或不同的基因型和/或表型(例如,当遗传修饰影响编码核酸序列时)。应当理解,所述术语不仅指所述的特定重组宿主细胞,而且指此类宿主细胞的后代或潜在后代。
如本文所用,术语“异源”是指来自除其天然来源或位置之外的一些来源或位置的物质。在一些实施方案中,术语“异源核酸”是指在特定生物体中并非天然存在的核酸序列。例如,术语“异源启动子”可以指已从一种来源生物体中获取并用于另一种生物体中的启动子,其中所述启动子不是天然存在的。然而,术语“异源启动子”还可以指来自相同源生物体内的启动子,但仅移动到所述启动子通常不位于其中的新位置。
异源基因序列可以通过使用“表达载体”引入靶细胞,所述表达载体可以是真核表达载体,例如,植物表达载体。用于构建载体的方法是本领域技术人员众所周知的,并描述于各种出版物中。具体地,在现有技术中综述了用于构建合适载体的技术,包括对功能组分的描述,诸如启动子、增强子、终止和聚腺苷酸化信号、选择性标志、复制起点和剪接信号。载体可包括但不限于质粒载体、噬菌粒、粘粒、人工/微型染色体(例如,ACE)或病毒载体,诸如杆状病毒、逆转录病毒、腺病毒、腺相关病毒、单纯疱疹病毒、逆转录病毒、噬菌体。真核表达载体通常还含有促进载体在细菌中增殖的原核序列,诸如复制起点和用于在细菌中选择的抗生素抗性基因。多种真核表达载体是本领域众所周知的,其含有多核苷酸可操作地连接到其中的克隆位点,并且一些真核表达载体可从公司诸如Stratagene,La Jolla,Calif.;Invitrogen,Carlsbad,Calif.;Promega,Madison,Wis.或BD BiosciencesClontech,Palo Alto,Calif.商购获得。在一个实施方案中,表达载体包含至少一个核酸序列,其是编码目的肽/多肽/蛋白质的核苷酸序列的转录和翻译所必需的调控序列。
如本文所用,应用于核酸、多肽、细胞或生物体的术语“天然存在的”是指在自然界中发现的核酸、多肽、细胞或生物体。术语“天然存在的”可以指源自天然存在的来源的基因或序列。因此,为了本公开的目的,“非天然存在的”序列是已被合成、突变、工程化、编辑或以其他方式修饰的序列以具有与已知天然序列不同的序列。在一些实施方案中,修饰可以在蛋白质水平(例如,氨基酸取代)。在其他实施方案中,修饰可以在DNA水平(例如,核苷酸取代)。
如本文所用,术语“核苷酸改变”或“核苷酸修饰”是指如本领域中充分理解的例如,核苷酸取代,缺失和/或插入。例如,此类核苷酸改变/修饰包含含有产生沉默取代、添加或缺失的改变的突变,但不改变所编码蛋白质的性质或活性或蛋白质的制备方式。作为另一个实例,此类核苷酸改变/修饰包含含有产生置换取代、添加或缺失的改变的突变,其改变编码蛋白的性质或活性或蛋白质的制备方式。
如本文所用,术语“蛋白质修饰”是指例如,本领域众所周知的氨基酸取代、氨基酸修饰、缺失和/或插入。
术语“下一代植物育种”是指当今育种者可用的许多植物育种工具和方法。下一代植物育种的关键区别特征是育种者不再局限于依赖于观察到的表型变异,以便推断给定性状的潜在遗传原因。更确切地说,下一代植物育种可以包括利用分子标志和标志辅助选择(MAS),使得育种者可以直接观察目的等位基因和遗传元件从育种种群中的一个植物到另一个植物的移动,并且不限于仅观察表型。此外,下一代植物育种方法不限于利用在植物种群中发现的天然遗传变异。更确切地说,利用下一代植物育种方法的育种者可以以靶向方式进入宿主,所述宿主具有直接改变/改变/编辑植物的基础遗传结构的现代基因工程工具,以便产生目的表型性状。在多个方面,用下一代植物育种方法育种的植物与以传统方式育种的植物无法区分,因为所得最终产品植物理论上可以通过两个方法中的任一种方法开发。在多个特定方面,下一代植物育种方法可产生包含以下各项的植物:任何大小的缺失或插入的遗传修饰;一个或多个碱基对取代的遗传修饰;引入核酸序列的遗传修饰,所述核酸序列来自植物的天然基因库(例如,能够与目的植物杂交或培育的任何植物)或来自植物中的核酸序列编辑以对应于已知在植物的天然基因库中出现的序列;以及所述植物的后代。
如本文所用,术语“可操作地连接”是指核酸序列在单个核酸片段上的缔合,使得一个核酸序列的功能受另一个核酸序列的调控。例如,启动子在能够调控编码序列的表达(即编码序列处于启动子的转录控制下)时,启动子与所述编码序列可操作地连接。编码序列可以在有义或反义方向与调控序列可操作地连接。在另一个实例中,本公开的互补RNA区可以直接或间接地可操作地连接至靶mRNA的5’,或靶mRNA的3’,或在靶mRNA内,或第一互补区是靶mRNA的5’并且其互补是靶mRNA的3’。
本文中可互换使用的术语“多核苷酸”、“核酸”和“核苷酸序列”是指任何长度的核苷酸(核糖核苷酸或脱氧核糖核苷酸或其类似物两者之一)的聚合形式。此术语是指分子的一级结构,因此包括双链和单链DNA以及双链和单链RNA。此术语包括但不限于单链、双链或多链DNA或RNA、基因组DNA、cDNA、DNA-RNA杂合体、或包括嘌呤和嘧啶碱基或其他天然的、化学或生物化学修饰的、非天然的或衍生的核苷酸碱基的聚合物。它还包括经修饰的核酸,诸如甲基化和/或封端核酸,含有经修饰的碱基的核酸,主链修饰等。“寡核苷酸”一般是指具有约5-约100个核苷酸的多核苷酸的单链或双链DNA。然而,为了本公开的目的,寡核苷酸的长度没有上限。寡核苷酸也称为“寡聚物”或“低聚物”,并且可以从基因中分离,或通过本领域已知的方法化学合成。术语“多核苷酸”、“核酸”和“核苷酸序列”应理解为包括如适用于所述实施方案的单链(诸如有义或反义)和双链多核苷酸。
如本文互换使用的术语“肽”、“多肽”和“蛋白质”是指任何长度的氨基酸的聚合形式,所述氨基酸可包括遗传编码的和非遗传编码的氨基酸、化学或生物化学修饰的或衍生的氨基酸,以及具有经修饰的肽骨架的多肽。
如本文所用,短语“重组构建体”、“表达构建体”、“嵌合构建体”、“构建体”和“重组DNA构建体”在本文中可互换使用。重组构建体包含核酸片段的人工组合,例如,在自然界中并不存在的调控和编码序列。例如,嵌合构建体可以包含源自不同来源的调控序列和编码序列,或源自相同来源但以不同于自然界中发现的方式排列的调控序列和编码序列。此类构建体可以单独使用或与载体联合使用。如果使用载体,则载体的选择取决于如本领域技术人员众所周知的用于转化宿主细胞的方法。例如,可以使用质粒载体。技术人员充分意识到在载体上必须存在遗传元件以便成功地转化、选择和增殖包含本公开的任何分离的核酸片段的宿主细胞。本领域技术人员还会认识到,不同的独立转化事件将导致不同的表达水平和模式(Jones等人,(1985)EMBO J.4:2411-2418;De Almeida等人,(1989)Mol.Gen.Genetics 218:78-86),因此必须筛选多个事件,以获得显示所需表达水平和模式的系。此类筛选可以通过DNA的Southern分析,mRNA表达的Northern分析,蛋白质表达的免疫印迹分析或表型分析等来完成。载体可以是自动复制或可以整合到宿主细胞的染色体中的质粒、病毒、噬菌体、前病毒、噬菌粒、转座子、人工染色体等。载体还可以是裸RNA多核苷酸、裸DNA多核苷酸、由相同链内的DNA和RNA组成的多核苷酸、多赖氨酸缀合的DNA或RNA、肽缀合的DNA或RNA、脂质体缀合的DNA等,其不是自主复制的。如本文所用,术语“表达”是指产生功能性终产物,例如,mRNA或蛋白质(前体或成熟)。
术语“传统植物育种”是指利用在植物种群中发现的天然变异作为赋予给定植物目的性状的等位基因和遗传变体的来源。传统的育种方法利用主要依赖于观察到的表型变异的杂交程序来推断因果等位基因关联。也就是说,传统的植物育种依赖于对给定植物的表达表型的观察以推断潜在的遗传原因。这些观察结果用于告知育种方法,以便将等位基因变异转移到目的种质中。此外,传统植物育种的特征还在于包括随机诱变技术,其可用于将遗传变异引入给定种质中。这些随机诱变技术可以包括基于化学和/或辐射的诱变方法。因此,传统植物育种的一个关键特征是育种者不利用以靶向方式直接改变/改变/编辑植物的潜在遗传结构的基因工程工具,以便引入遗传多样性并产生目的表型性状。
如本文所用,“CRISPR相关的效应因子”因此可以被定义为与CRISPR相关的任何核酸酶、切口酶或重组酶(成簇的规则间隔的短回文重复),其具有将单链或双链裂解引入基因组靶位点中的能力,或具有将靶向的修饰(包括点突变、插入或缺失)引入目的基因组靶位点中的能力。至少一种CRISPR相关效应因子可以其自身起作用,或与其他分子组合作为分子复合物的一部分起作用。CRISPR相关效应因子可以作为融合分子,或作为单个分子存在,其通过与gRNA和/或靶位点的共价或非共价相互作用中的至少一种缔合或被缔合,使得CRISPR相关复合物的组分紧密地物理接近。
术语“Cas9核酸酶”和“Cas9”在本文中可互换使用,其是指与CRISPR(成簇的规则间隔的短回文重复)相关的RNA指导的DNA核酸内切酶,包括Cas9蛋白或其片段(诸如包含Cas9的活性DNA裂解结构域和/或Cas9的gRNA结合结构域的蛋白)。Cas9是CRISPR/Cas基因组编辑系统的组分,其在指导RNA的指导下靶向并裂解DNA靶序列以形成DNA双链断裂(DSB)。
术语“CRISPR RNA”或“crRNA”是指负责与靶DNA序列杂交并募集CRISPR核酸内切酶和/或CRISPR相关效应因子的RNA链。crRNA可以是天然存在的或可以根据任何已知的产生RNA的方法合成。
术语“tracrRNA”指小的反式编码RNA。TracrRNA与crRNA互补并与crRNA形成碱基对以形成crRNA/tracrRNA杂交体,所述杂交体能够将CRISPR核酸内切酶和/或CRISPR相关效应因子募集至靶序列。
如本文所用,术语“指导RNA”或“gRNA”是指能够将CRISPR核酸内切酶和/或CRISPR相关效应因子募集至靶序列的RNA序列或序列组合。通常,gRNA由通过部分互补形成复合物的crRNA和tracrRNA分子组成,其中crRNA包含与用于杂交的靶序列充分互补的序列并且指导CRISPR复合物(即Cas9-crRNA/tracrRNA杂合体)特异性结合靶序列。此外,可以设计单链指导RNA(sgRNA),其包含crRNA和tracrRNA两者的特征。因此,如本文所用,指导RNA可以是天然或合成的crRNA(例如,对于Cpf1),天然或合成的crRNA/tracrRNA杂交体(例如,对于Cas9)或单链指导RNA(sgRNA)。
术语“指导序列”或“间隔区序列”是指负责与靶DNA杂交的crRNA或指导RNA(gRNA)的部分。
术语“原间隔区”是指由crRNA或gRNA的指导序列靶向的DNA序列。在一些实施方案中,原间隔区与CRISPR复合物的crRNA或gRNA指导(间隔区)序列杂交。
如本文所用,术语“CRISPR着陆位点”是指能够被CRISPR-Cas复合物靶向的DNA序列。在一些实施方案中,CRISPR着陆位点包含能够被CRISPR复合物裂解的邻近放置的原间隔区/原间隔区相邻基序组合序列。
术语“CRISPR复合物”、“CRISPR核酸内切酶复合物”、“CRISPR Cas复合物”或“CRISPR-gRNA复合物”在本文中可互换使用。“CRISPR复合物”是指与指导RNA(gRNA)复合的Cas9核酸酶和/或CRISPR相关效应因子。因此,术语“CRISPR复合物”是指能够在CRISPR着陆位点诱导双链断裂的CRISPR核酸内切酶和指导RNA的组合。在一些实施方案中,本公开的“CRISPR复合物”是指催化性死亡的Cas9蛋白和指导RNA的组合,其能够靶向靶序列,但不能诱导CRISPR着陆位点处的双链断裂,因为它失去核酸酶活性。在其他实施方案中,本公开的“CRISPR复合物”是指Cas9切口酶和指导RNA的组合,其能够将gRNA靶向的单链断裂引入DNA中,而不是由野生型Cas酶产生的双链断裂。
如本文所用,在CRISPR复合物的上下文中,术语“指导序列特异性结合”指的是指导RNA将CRISPR核酸内切酶和/或CRISPR相关效应因子募集到CRISPR着陆位点的能力。
如本文所用,术语“靶向”是指预期一个物品或分子将以一定程度的特异性与另一个物品或分子相互作用,从而排除非靶向物品或分子。例如,根据本公开,靶向第二多核苷酸的第一多核苷酸已被设计成以序列特异性方式(例如,经由沃森-克里克碱基配对)与第二多核苷酸杂交。在一些实施方案中,杂交的所选区被设计成使得杂交对于一个或多个靶向区是唯一的。如果第二多核苷酸的靶向序列(杂交区)突变或以其他方式从第二多核苷酸去除/分离,则第二多核苷酸可以不再是第一靶向多核苷酸的靶标。此外,“靶向”可与“位点特异性”或“位点定向”互换使用,其是指分子生物学的作用,其使用关于待修饰的目的基因组区的序列的信息,并且其进一步依赖于分子工具的作用机制的信息,所述分子工具例如,核酸酶(包括CRISPR核酸酶及其变体)、TALEN、ZFN、大范围核酸酶或重组酶、DNA修饰酶(包括碱基修饰酶如胞苷脱氨酶、组蛋白修饰酶等)、DNA结合蛋白、cr/tracrRNA、指导RNA等。
术语“种子区”是指最易与其靶标错配的crRNA或指导RNA的指导序列的关键部分。在一些实施方案中,crRNA/gRNA的种子区中的单个错配可以使CRISPR复合物在所述结合位点处无活性。在一些实施方案中,Cas9核酸内切酶的种子区位于沿着指导序列的3’部分的约后12个nt定位,其对应于(杂交)邻近PAM的原间隔区靶序列的部分。在一些实施方案中,Cpf1核酸内切酶的种子区沿着指导序列的5’部分的约前5个nt定位,其对应于(杂交)邻近PAM的原间隔区靶序列的部分。
术语“序列同一性”是指相同和在相对位置相同的两个多核苷酸或多肽序列之间的碱基或氨基酸的百分比。因此,一种多核苷酸或多肽序列与另一种多核苷酸或多肽序列相比具有一定百分比的序列同一性。对于序列比较,通常一个序列作为参考序列,与测试序列进行比较。术语“参考序列”是指与测试序列比较的分子。当参考蛋白质使用序列同一性百分比时,一般认为不相同的残基位置通常因保守氨基酸取代而不同,其中氨基酸残基被具有相似化学性质(例如,电荷或疏水性)的其他氨基酸残基取代,因此不改变分子的功能特性。当序列在保守取代方面不同时,可向上调整序列同一性百分比以校正取代的保守性质。通过此类保守取代而不同的序列被称为具有“序列相似性”或“相似性”。用于进行这种调节的装置是本领域技术人员众所周知的。通常,这包括将保守取代计为部分错配而不是完全错配,从而增加序列同一性百分比。因此,例如,当相同氨基酸的分数为1,非保守取代的分数为0时,保守取代的分数在0和1之间。例如,根据Meyers和Miller,ComputerApplic.Biol.Sci.,4:11-17(1988)的算法计算保守取代的评分。
“互补”是指通过碱基堆积和特异性氢键在两个序列之间配对的能力,所述两个序列包含天然或非天然存在的碱基或其类似物。例如,如果核酸的一个位置处的碱基能够与靶的相应位置处的碱基氢键合,则认为所述位置处的碱基彼此互补。核酸可包含通用碱基或对氢键键合不提供正或负贡献的惰性脱碱基间隔基。碱基配对可以包括规范的沃森-克里克碱基配对和非沃森-克里克碱基配对(例如,Wobble碱基配对和Hoogsteen碱基配对)。应当理解,对于互补碱基配对,腺苷型碱基(A)与胸苷型碱基(T)或尿嘧啶型碱基(U)互补,胞嘧啶型碱基(C)与鸟苷型碱基(G)互补,并且通用碱基诸如3-硝基吡咯或5-硝基吲哚可与任何A、C、U或T杂交并被认为是互补的。Nichols等人,Nature,1994;369:492-493和Loakes等人,Nucleic Acids Res.,1994;22:4039-4043。肌苷(I)在本领域中也被认为是通用碱基并且被认为与任何A、C、U或T互补。参见Watkins和Santa Lucia,Nucl.Acids Research,2005;33(19):6258-6267。
如本文所提及的,“互补核酸序列”是包含核苷酸序列的核酸序列,所述核苷酸序列使其能够在适当的温度和溶液离子强度的体外和/或体内条件下以序列特异性,反平行方式非共价结合至另一核酸(即,核酸特异性结合至互补核酸)。
用于比较和确定序列同一性百分比和互补性百分比的序列比对方法是本领域众所周知的。用于比较的序列的最佳比对可以例如通过Needleman和Wunsch,(1970)J.Mol.Biol.48:443中的同源性比对算法进行,通过Pearson和Lipman,(1988)Proc.Nat’l.Acad.Sci.USA 85:2444中的相似性搜索方法,通过计算机化实施使用这些算法(在Wisconsin Genetics Software Package中的GAP、BESTFIT、FASTA和TFASTA,GeneticsComputer Group,575Science Dr.,Madison,WI),通过手动比对和目视检查(参见例如,Brent等人,(2003)Current Protocols in Molecular Biology),通过使用本领域已知的算法,包括BLAST和BLAST 2.0算法,所述算法分别描述于Altschul等人,(1977)Nuc.AcidsRes.25:3389-3402;和Altschul等人,(1990)J.Mol.Biol.215:403-410中。执行BLAST分析的软件可通过美国国家生物技术信息中心(National Center for BiotechnologyInformation)公开获得。一些比对程序是MacVector(Oxford Molecular Ltd,Oxford,U.K.)、ALIGN Plus(Scientific and Educational Software,Pennsylvania)和AlignX(Vector NTI,Invitrogen,Carlsbad,CA)。另一种比对程序是Sequencher(Gene Codes,AnnArbor,Michigan),使用默认参数,和MUSCLE(多重序列比对,通过Log-Expection进行多序列比较;作为公共领域许可的计算机软件)。
在本文中,术语“杂交”是指互补核苷酸碱基之间的配对(例如,腺嘌呤(A)与DNA分子中的胸腺嘧啶(T)和RNA分子中的尿嘧啶(U)形成碱基对,鸟嘌呤(G)与DNA和RNA两者分子中的胞嘧啶(C)形成碱基对)以形成双链核酸分子。(参见,例如,Wahl和Berger(1987)Methods Enzymol.152:399;Kimmel,(1987)Methods Enzymol.152:507)。此外,本领域还已知,对于两个RNA分子(例如,dsRNA)之间的杂交,鸟嘌呤(G)碱基对与尿嘧啶(U)。例如,在tRNA反密码子与mRNA中的密码子碱基配对的情况下,G/U碱基配对部分负责遗传密码的简并性(即,冗余性)。在本公开的上下文中,指导RNA分子的蛋白质结合区段(dsRNA双链体)的鸟嘌呤(G)被认为与尿嘧啶(U)互补,反之亦然。因此,当可以在指导RNA分子的蛋白质结合区段(dsRNA双链体)的给定核苷酸位置产生G/U碱基对时,所述位置不被认为是非互补的,而是被认为是互补的。本领域应理解,多核苷酸的序列不必与其待特异性杂交的靶核酸的序列100%互补。此外,多核苷酸可以在一个或多个区段上杂交,使得插入或邻近区段不参与杂交事件(例如,环结构或发夹结构)。多核苷酸可包含与它们所靶向的靶核酸序列内的靶区至少70%、至少80%、至少90%、至少95%、至少99%或100%的序列互补性。
术语“修饰的”是指与相应的未经修饰的物质或化合物相比已被改变或改变的物质或化合物(例如,细胞、多核苷酸序列和/或多肽序列)
“分离的”是指与在其天然状态下发现的通常伴随它的组分在不同程度上游离的材料。
如本文所用,术语“基因编辑的植物、部分或细胞”是指包含由基因编辑系统编辑的一种或多种内源基因的植物、部分或细胞。本公开的基因编辑系统包含靶向元件和/或编辑元件。靶向元件能够识别靶基因组序列。编辑元件能够修饰靶基因组序列,例如,通过在基因组序列中一个或多个核苷酸的取代或插入,在基因组序列中一个或多个核苷酸的缺失,改变基因组序列以包括调控序列,在安全港基因组位点或基因组中其他特定位置插入转基因,或任何它们的组合。靶向元件和编辑元件可以在相同的核酸分子或不同的核酸分子上。
术语“植物部分”包括分化的和未分化的组织,包括但不限于:植物器官、植物组织、根、茎、芽、砧木(rootstock)、接穗、托叶、花瓣、叶片、花、胚珠、花粉、苞片、叶柄、节间、树皮、绒毛、分蘖、地下茎(rhizome)、叶状体(frond)、叶子(blade)、雄蕊、果实、种子、肿瘤组织和植物细胞(例如,单细胞、原生质体、胚和愈伤组织)。植物细胞包括但不限于来自种子、悬浮培养物、胚、分生组织区、愈伤组织(callus tissue)、叶片、根、芽、配子体、孢子体、花粉和小孢子的细胞。植物组织可以在植物中或在植物器官、组织或细胞培养物中。
如本文所用,当讨论植物时,术语“胚珠”是指雌性配子体,而术语“花粉”是指雄性配子体。
如本文所用,术语“植物组织”是指植物的任何部分。植物器官的实例包括但不限于叶片、茎、根、块茎、种子、分枝、绒毛、根瘤、叶腋、花、花粉、雄蕊、雌蕊、花瓣、花序梗(peduncle)、秆、柱头、花柱(style)、苞片、果实、树干、心皮、萼片、花药、胚珠、花梗(pedicel)、针叶、球果、地下茎(rhizome)、匍匐枝、芽、果皮、胚乳、胎座、浆果、雄蕊和叶鞘。
如本文所用,术语“表型”是指由个体的遗传组成(即,基因型)与环境之间的相互作用产生的个体细胞,细胞培养物,生物体(例如,植物)或生物群的可观察特征。
如本文所用,术语“转基因”或“转基因的”是指至少一种核酸序列从一种生物体的基因组获取或合成产生,然后将其引入目的宿主细胞或生物体或组织,随后通过“稳定的”转化或转染方法将其整合到宿主的基因组中。相比之下,术语“瞬时”转化或转染或引入是指引入分子工具的方式,所述分子工具包括至少一种核酸(DNA、RNA、单链或双链或其混合物)和/或至少一种氨基酸序列,任选地包含合适的化学或生物试剂,以实现转移到细胞的至少一个目的区室中,所述细胞包括但不限于细胞质、细胞器(包括细胞核)、线粒体、液泡、叶绿体或膜中,导致引入的所述至少一种分子的转录和/或翻译和/或缔合和/或活性,而没有实现引入细胞基因组中的相应的至少一种分子的稳定整合或掺入和由此的遗传。术语“无转基因”是指在目的宿主细胞或组织或生物体的基因组中不存在或发现转基因的状况。
如本文所用,术语“组织培养物”是指包含组织成植物的一部分的相同或不同类型的分离的细胞或此类细胞的集合的组合物。示例性类型的组织培养物是原生质体、愈伤组织(calli)、植物团块(plant clump)和植物细胞、其可以产生在植物或植物部分中完整的组织培养物、诸如胚、花粉、花、种子、叶片、茎、根、根尖、花药、雌蕊、分生组织细胞、腋芽、子房、种皮、胚乳、下胚轴、子叶等。术语“植物器官”是指构成植物的形态学和功能上不同的部分的植物组织或一组组织。“后代”包括植物的任何后续世代。
分子和细胞生物化学中的一般方法可见于此类标准教科书,如MolecularCloning:A Laboratory Manual,第3版(Sambrook等人,HaRBor Laboratory Press 2001);Short Protocols in Molecular Biology,第4版(Ausubel等人编,John Wiley&Sons1999);Protein Methods(Bollag等人,John Wiley&Sons 1996);Nonviral Vectors forGene Therapy(Wagner等人编,Academic Press 1999);Viral Vectors(Kaplift&Loewy编,Academic Press 1995);Immunology Methods Manual(I.Lefkovits编,Academic Press1997);以及Cell and Tissue Culture:Laboratory Procedures in Biotechnology(Doyle&Griffiths,John Wiley&Sons 1998),上述文献的公开内容以引用的方式并入本文。
“生物活性部分”是指保留亲本分子活性的全长亲本肽或多肽的一部分。例如,本公开的多肽的生物活性部分将保留增加和/或增强植物细胞,组织和完整植物中的木栓质水平的能力。如本文所用,术语“生物活性部分”包括缺失突变体和肽,例如包含亲本分子的活性的至少约8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、40、50、60、70、80、90、100、120、150、300、400、500、600、700、800、900或1000个连续氨基酸的缺失突变体和肽。这种类型的部分可以通过应用标准重组核酸技术获得或使用常规液相或固相合成技术合成。例如,可以参考例如Atherton和Shephard在标题为“Peptide Synthesis”的第9章中描述的溶液合成或固相合成,其包括在由Nicholson编辑并由Blackwell ScientificPublications出版的标题为“Synthetic Vaccines”的出版物中。可替代地,可以通过用蛋白酶诸如endoLys-C、endoArg-C、endoGlu-C和葡萄球菌V8-蛋白酶消化本公开的肽或多肽来产生肽。消化的片段可以通过例如高效液相色谱(HPLC)技术纯化。重组核酸技术也可用于产生此类部分。
“相对应”或“对应于”是指多核苷酸(a)具有与参考多核苷酸序列的全部或部分基本上相同或互补的核苷酸序列,或(b)编码与肽或蛋白质中的氨基酸序列相同的氨基酸序列。此短语在其范围内还包括具有与参考肽或蛋白质中的氨基酸序列基本相同的氨基酸序列的肽或多肽。
本文所用的术语“生长”或“再生”是指从植物细胞、植物细胞群、植物部分(包括种子)或植物段(plant piece)(例如,来自原生质体、愈伤组织或组织部分)生长整个分化的植物。
如本文所用,术语“源自”是指起源或来源,并且可包括天然存在的、重组的、未纯化的或纯化的分子。源自起源或来源的核酸或氨基酸可以具有如本文别处定义的所有种类的核苷酸改变或蛋白质修饰。
“获自”是指样品诸如,例如核酸提取物或多肽提取物分离自或源自特定来源。例如,提取物可以直接从植物中分离。
“变体”多肽是指通过天然蛋白质的N-末端和/或C-末端端部缺失(所谓的截短)或添加一个或多个氨基酸而源自天然蛋白质的多肽;在天然蛋白质的一个或多个位点缺失或添加一个或多个氨基酸;或在天然蛋白质中的一个或多个位点处取代一个或多个氨基酸。本公开所涵盖的变体蛋白质具有生物活性,即它们继续具有天然蛋白质的所需生物活性,即如本文所述的调节或调控活性。此类变体可由,例如,遗传多态性或人类操控产生。本公开的天然R蛋白质的生物活性变体将与天然蛋白质的氨基酸序列具有至少40%、50%、60%、70%、一般至少75%、80%、85%,优选约90%至95%或更多,并且更优选约98%或更多的序列同一性,如由本文别处描述的使用默认参数序列比对程序确定的。本公开的蛋白质的生物活性变体可与所述蛋白质相差少至1-15个氨基酸残基、少至1-10个、诸如6-10个、少至5个、少至4个、3个、2个或甚至1个氨基酸残基。
本公开的蛋白质可以多种方式改变,包括氨基酸取代、缺失、截短和插入。用于这种操作的方法通常是本领域已知的。例如,可以通过DNA中的突变制备R蛋白质的氨基酸序列变体。用于诱变和核苷酸序列改变的方法是本领域众所周知的。参见,例如,Kunkel(1985)Proc.Natl.Acad.Sci.USA 82:488-492;Kunkel等人(1987)Methods inEnzymol.154:367-382;美国专利第4,873,192号;Walker和Gaastra,编(1983)Techniquesin Molecular Biology(MacMillan Publishing Company,New York)以及其中引用的参考文献。关于不影响目的蛋白质生物活性的合适氨基酸取代的指导可见于Dayhoff等人(1978)Atlas of Protein Sequence and Structure(Natl.Biomed.Res.Found.,Washington,D.C.)的模型,以引用的方式并入本文。可以优选保守取代,诸如将一种氨基酸与另一种具有类似特性的氨基酸进行交换。
在编码的序列中改变、添加或缺失单个氨基酸或小百分比的氨基酸(通常小于5%,更通常小于1%)的个别取代、缺失或添加是“保守性修饰的变异”,其中所述改变导致氨基酸被化学上类似的氨基酸取代。提供功能相似氨基酸的保守取代表是本领域众所周知的。以下五个组各自含有彼此保守取代的氨基酸,脂肪族氨基酸:甘氨酸(G)、丙氨酸(A)、缬氨酸(V)、亮氨酸(L)、异亮氨酸(I);芳香族氨基酸:苯丙氨酸(F)、酪氨酸(Y)、色氨酸(W);含硫氨基酸:蛋氨酸(M)、半胱氨酸(C);碱性氨基酸:精氨酸I、赖氨酸(K)、组氨酸(H);酸性氨基酸:天冬氨酸(D)、谷氨酸(E)、天冬酰胺(N)、谷氨酰胺(Q)。还参见,Creighton,1984。此外,在编码序列中改变、添加或缺失单个氨基酸或小百分比氨基酸的个别取代、缺失或添加也是“保守修饰的变异”。
如本文所用,“表达盒”是指能够指导特定核苷酸序列在合适的宿主细胞中表达的DNA序列,其包含与目的核苷酸序列可操作地连接的启动子,所述目的核苷酸序列与终止信号可操作地连接。它通常还包含正确翻译核苷酸序列所需的序列。编码区通常编码目的蛋白,但也可以编码目的功能性RNA,例如在有义或反义方向上的反义RNA或非翻译RNA。包含目的核苷酸序列的表达盒可以是嵌合的,意味着它的组分中的至少一个相对于它的至少一个其他组分是异源的。表达盒也可以是天然存在的,但是已经以可用于异源表达的重组形式获得的。表达盒中的核苷酸序列的表达可在组成型启动子或诱导型启动子的控制下,所述启动子仅在宿主细胞暴露于一些特定外部刺激时起始转录。在多细胞生物体的情况下,启动子还可以对动物和/或植物中的特定组织或器官或发育阶段具有特异性。
本文所用的术语“载体”、“质粒”或“构建体”广泛地指编码外源核酸的任何质粒或病毒。所述术语还应当解释为包括促进核酸转移到病毒体或细胞中的非质粒和非病毒化合物,诸如,例如聚赖氨酸化合物等。所述载体可以是适合作为将核酸或其突变体递送至细胞的递送媒介物的病毒载体,或者所述载体可以是适合于相同目的的非病毒载体。用于将DNA递送至细胞和组织的病毒和非病毒载体的实例是本领域众所周知的,并且描述于例如Ma等人(1997,Proc.Natl.Acad.Sci.U.S.A.94:12744-12746)。病毒载体的实例包括但不限于重组植物病毒。植物病毒的非限制性实例包括将介导的TMV(瞬时)转染到烟草中(Tuipe,T-H等人(1993),J.Virology Meth,42:227-239),ssDNA基因组病毒(例如,双生病毒科(Geminiviridae)),逆转录病毒(例如,花椰菜花叶病毒科(Caulimoviridae)、假病毒科(Pseudoviridae)和变位病毒科(Metaviridae)),dsNRA病毒(例如,呼肠病毒科(Reoviridae)和分体病毒科(Partitiviridae)),(-)ssRNA病毒(例如,弹状病毒科(Rhabdoviridae)和布尼亚病毒科(Bunyaviridae)),(+)ssRNA病毒(例如,雀麦花叶病毒科(Bromoviridae)、长线形病毒科(Closteroviridae)、豇豆花叶病毒科(Comoviridae)、黄症病毒科(Luteoviridae)、马铃薯Y病毒科(Potyviridae)、伴生病毒科(Sequiviridae)和番茄丛矮病毒科(Tombusviridae))和类病毒(例如,马铃薯纺锤块茎类病毒科(Pospiviroldae)和鳄梨白斑类病毒科(Avsunviroidae))。植物病毒的详细分类信息可见于Fauquet等人(2008,“Geminivirus strain demarcation and nomenclature”.Archivesof Virology153:783–821,以全文引用的方式并入本文)和Khan等人(Plant viruses asmolecular pathogens;Publisher Routledge,2002,ISBN 1560228954,9781560228950)。非病毒载体的实例包括但不限于脂质体、DNA的多胺衍生物等。
此外,“载体”被定义为包括,尤其是,双链或单链线性或环状形式的任何质粒、粘粒、噬菌体或土壤杆菌属二元载体,其可以是或可以不是自身可传播的或可移动的,并且其可以要么通过整合到细胞基因组中要么存在于染色体外转化原核或真核宿主(例如,具有复制起点的自主复制质粒)。
具体包括的是穿梭载体,其意指能够在两种不同宿主生物体中天然地或通过设计复制的DNA媒介物,所述宿主生物体可选自放线菌和相关物种、细菌和真核细胞(例如高等植物、哺乳动物、酵母或真菌细胞)。
优选地,载体中的核酸在合适的启动子或其他调控元件的控制下,并可操作地连接到所述启动子或其他调控元件,用于在宿主细胞诸如微生物,例如细菌或植物细胞中转录。载体可以是在多种宿主中起作用的双功能表达载体。在基因组DNA的情况下,其可含有其自身的启动子或其他调控元件,而在cDNA的情况下,其可处于用于在宿主细胞中表达的适当启动子或其他调控元件的控制下。
“克隆载体”通常含有一个或少数限制性核酸内切酶识别位点,在所述位点可以以可确定的方式插入外来DNA序列,而不丧失载体的基本生物学功能,以及适于鉴定和选择用克隆载体转化的细胞的标志基因。标志基因通常包括提供四环素抗性、潮霉素抗性或氨苄青霉素抗性的基因。
如本文所用,术语“子代(offspring)”是指由来自一个或多个亲本植物或其子代的营养性或有性繁殖产生为后代的任何植物。比如,可以通过亲本植物的克隆或自交或通过杂交两个亲本植物获得后代植物,并且包括自交以及F1或F2或更进一步的世代。F1是由亲本产生的第一代后代,其中至少一个亲本第一次用作性状的供体,而第二代(F2)或后续世代(F3、F4等)的后代是由F1's、F2's等的自交产生的样品。因此,F1可以是(并且通常是)由两个真育种亲本之间的杂交产生的杂种(纯育对于性状是纯合的),而F2可以是(并且通常是)由所述F1杂种的自花授粉产生的后代。
术语“植物”包括完整植物、植物器官、植物组织和植物细胞及其后代,但不限于被子植物和裸子植物,诸如拟南芥属、马铃薯、番茄、烟草、苜蓿、莴苣、胡萝卜、草莓、糖用甜菜、木薯、甘薯、大豆、利马豆、菜豆、豌豆、鹰嘴豆、玉蜀黍(maize)(玉米(corn))、草坪草、小麦、稻、大麦、高粱、燕麦、橡树、桉树、胡桃、棕榈和浮萍以及蕨类和苔藓。因此,植物可以是单子叶植物,双子叶植物,从孢子诸如蕨类繁殖的维管植物或非维管植物诸如藓类、苔类、金鱼藻和藻类。本文所用的词语“植物”还包括植物细胞、种子、植物后代、繁殖体(无论是有性产生还是无性产生)以及任何这些植物的子代,诸如插条(cutting)或种子。植物细胞包括悬浮培养物、愈伤组织(callus)、胚、分生组织区、愈伤组织(callus tissue)、叶片、根、芽、配子体、孢子体、花粉、种子和小孢子。植物可以处于不同的成熟阶段,并且可以在液体或固体培养物中生长,或者在土壤或合适的培养基中在盆、温室或田地中生长。引入的前导序列、尾随序列或基因序列在植物中的表达可以是瞬时的或永久的。“所选植物物种”可以是但不限于这些“植物”中任何一种的物种。
在本公开中,所述植物旨在包括但不限于被子植物和裸子植物,诸如阿拉伯胶、苜蓿(alfalfa)、苋菜(amaranth)、苹果、杏、洋蓟、白蜡树(ash tree)、芦笋(asparagus)、鳄梨、香蕉、大麦、豆类、甜菜、桦树(birch)、山毛榉、黑莓、黑树莓、蓝莓、西兰花(broccoli)、抱子甘蓝(Brussel’ssprouts)、甘蓝(cabbage)、藤本浆果(cane berry)、卡诺拉油菜(canola)、甜瓜(cantaloupe)、胡萝卜、木薯、花椰菜(cauliflower)、雪松(cedar)、谷类、芹菜(celery)、栗、樱桃、白菜(Chinese cabbage)、柑橘、克莱门氏柑橘(Clementine)、三叶草(clover)、咖啡、玉米(corn)、棉花、豇豆、黄瓜、柏树、茄子(eggplant)、榆树、苦苣(endive)、桉树、茴香、无花果、冷杉、天竺葵、葡萄、葡萄柚、落花生、地樱桃(groundcherry)、树胶铁杉(gum hemlock)、山核桃(hickory)、羽衣甘蓝、奇异果(kiwifruit)、苤蓝(kohlrabi)、落叶松(larch)、莴苣(lettuce)、韭葱(leek)、柠檬、酸橙(lime)、洋槐(locust)、松(pine)、铁线蕨(maidenhair)、玉蜀黍(maize)、芒果、枫树(maple)、瓜、小米(millet)、蘑菇、芥菜、坚果、橡树、燕麦、油棕、秋葵(okra)、洋葱、橙、观赏植物或花或树、木瓜(papaya)、棕榈(palm)、香芹(parsley)、欧洲防风(parsnip)、豌豆、桃、花生、梨、泥炭藓(peat)、胡椒、柿(persimmon)、木豆、桃、松、菠萝、车前草(plantain)、李(plum)、石榴、马铃薯、南瓜、菊苣(radicchio)、萝卜、油菜籽(rapeseed)、覆盆子、稻、黑麦、高粱(sorghum)、红花(safflower)、黄桦柳(sallow)、大豆、菠菜、云杉、笋瓜(squash)、草莓、糖用甜菜(sugarbeet)、甘蔗、向日葵、甘薯、甜玉米、柑桔(tangerine)、茶、烟草、番茄、树、黑小麦、草坪草、芜菁、藤本植物、胡桃、水田芥(watercress)、西瓜、小麦、野生草莓、山药、红豆杉(yew)和绿皮笋瓜(zucchini)。
被子植物定义为种子包裹在子房中的维管植物。被子植物是产生结实的花的种子植物。被子植物分为双子叶和单子叶植物。
双子叶植物(Dicot)定义为开花植物,其胚具有两个种子半部或子叶,分支叶脉和四或五的倍数的花部分。双子叶植物的实例包括但不限于桉树、杨属、金盏花属、金合欢属、柚木、桃花心木、烟草、拟南芥属、番茄、马铃薯、糖用甜菜、西兰花、木薯、甘薯、胡椒、一品红、菜豆、油菜籽/卡诺拉油菜、紫花苜蓿、萝卜、绛三叶草(crimson clover)、败酱草(fieldpennycress)、大豆、胡萝卜、草莓、莴苣、橡树、枫树、胡桃、玫瑰、薄荷、笋瓜、雏菊、天竺葵、鳄梨、棉花/棉籽和仙人掌。
菥蓂(Thlaspi arvense)是卷心菜科十字花科中的开花植物,通称为败酱草(field pennycress,又名pennycress)。CoverCress是在正常全季玉米和大豆之间越冬生长的新的油料种子作物。CoverCress由菥蓂开发的。美国专利第10,709,151号中提供了低纤维菥蓂系,所述专利转让至CoverCress Inc。
单子叶植物(Monocot)被定义为具有胚的开花植物,所述胚具有一个子叶或种子叶,平行的叶脉和三的倍数的花部分。单子叶植物的实例包括但不限于草坪草、玉米/玉蜀黍、稻、燕麦、一年生黑麦草、小麦、大麦、高粱、兰花、鸢尾、百合、洋葱和棕榈。草坪草的实例包括但不限于剪股颖属种(Agrostis spp.)(包括殖吸虫翦股颖和匍匐翦股颖的翦股颖物种(bentgrass species)),草地早熟禾(Poa pratensis)(肯塔基蓝草(Kentuckybluegrass)),黑麦草属种(Lolium spp.)(包括一年生黑麦草和多年生黑麦草的黑麦草物种(ryegrass species)),苇状羊茅(Festuca arundinacea)(高羊茅(tall fescue)),紫羊茅(Festuca rubra commutata)(邱氏羊茅(Chewings fescue)),狗牙根(Cynodondactylon)(百慕大草(bermudagrass)),铺地狼尾草(Pennisetum clandestinum)(克育草(kikuyu grass)),钝叶草(Stenotaphrum secundatum)(圣奧古斯丁草(St.Augustinegrass)),日本结缕草(Zoysia japonica)(结缕草(Zoysiagrass))和马蹄金属(Dichondra micrantha)。
本文所述的靶向基因编辑系统的方法可用于赋予基本上任何植物所需的性状。可使用本公开的核酸构建体和多种多样的转化方法对于本文所述的所需生理和农艺学特征来工程化多种植物和植物细胞系统。在优选的实施方案中,用于工程化的靶植物和植物细胞包括但不限于那些单子叶和双子叶植物,诸如作物,包括谷物作物(例如,小麦、玉蜀黍、稻、粟、大麦),水果作物(例如,番茄、苹果、葡萄、桃、梨、李、树莓、黑树莓、黑莓、甘蔗浆果、樱桃、鳄梨、草莓、野生草莓、橙),饲用作物(例如,苜蓿),根类蔬菜作物(例如,胡萝卜、马铃薯、糖用甜菜、山药),叶类蔬菜作物(例如,莴苣、菠菜);开花植物(例如,矮牵牛、玫瑰、菊花),针叶树和松树(例如,松树、冷杉、云杉);用于植物修复的植物(例如,重金属积累植物);油料作物(例如,向日葵、油菜籽)和用于实验目的的植物(例如,拟南芥属(Arabidopsis))。在一些实施方案中,水果作物例如番茄、苹果、桃、梨、李、树莓、黑树莓、黑莓、甘蔗浆果、樱桃、鳄梨、草莓、野生草莓、葡萄和橙。
如本文所用,术语“基因”是指与生物功能相关的任何DNA区段。因此,基因包括但不限于编码序列和/或其表达所需的调控序列。基因还可以包括例如形成其他蛋白质的识别序列的非表达DNA片段。基因可以从多种来源获得,包括从目的来源克隆或从已知或预测的序列信息合成,并且可以包括设计成具有所需参数的序列。
如本文所用,术语“基因型”是指个体细胞,细胞培养物,组织,生物体(例如植物)或生物群的遗传组成。
如本文所用,术语“等位基因”意指基因的一种或多种替代形式中的任一种,所有所述等位基因与至少一种性状或特征有关。在二倍体细胞中,给定基因的两个等位基因占据一对同源染色体上的相应基因座。由于本公开涉及QTL,即可能包含一个或多个基因或调控序列的基因组区,因此在一些情况下提及“单倍型”(即染色体区段的等位基因)而不是“等位基因”是更准确的,然而,在那些情况下,术语“等位基因”应理解为包含术语“单倍型”。当等位基因表达相似的表型时,等位基因被认为是相同的。序列上的差异是可能的,但并不重要,只要它们不影响表型。
如本文所用,术语“基因座(locus)”(复数:“基因座(loci)”)是指已经遗传定义的任何位点。基因座可以是基因,或基因的一部分,或具有一些调控作用的DNA序列,并且可以被不同的序列占据。
如本文所用,术语“分子标志”或“遗传标志”是指用于使核酸序列的特征差异可视化的方法中使用的指示物。此类指示物的实例是限制性片段长度多态性(RFLP)标志、扩增片段长度多态性(AFLP)标志、单核苷酸多态性(SNP)、插入突变、微卫星标志(SSR)、序列表征的扩增区(SCAR)、裂解的扩增多态性序列(CAPS)标志或同工酶标志或本文所述的标志的组合,其限定特异性遗传和染色体位置。在等位基因附近进行分子标记作图是分子生物学技术领域普通技术人员可以很容易执行的方法,所述技术比如描述于Lefebvre和Chevre,1995;Lorez和Wenzel,2007,Srivastava和Narula,2004,Meksem和Kahl,2005,Phillips和Vasil,2001。有关AFLP技术的一般信息可见于Vos等人(1995,AFLP:a new technique forDNA fingerprinting,Nucleic Acids Res.1995November 11;23(21):4407–4414)。
如本文所用,术语“半合子”是指其中基因在基因型中仅存在一次的细胞,组织或生物体,如单倍体细胞或生物体中的基因,异配性别中的性连锁基因,或二倍体细胞或生物体(其中其配偶体区段已缺失)中染色体区段中的基因。
如本文所用,术语“杂合子”是指具有存在于至少一个基因座的不同等位基因(给定基因的形式)的二倍体或多倍体个体细胞或植物。
如本文所用,术语“杂合的”是指在特定基因座存在不同的等位基因(给定基因的形式)。
如本文所用,术语“纯合子”是指在一个或多个基因座具有相同等位基因的个体细胞或植物。
如本文所用,术语“纯合”是指在同源染色体区段中的一个或多个基因座处存在相同的等位基因。
如本文所用,术语“同源”或“同源物”是本领域已知的,并且是指拥有共同的祖先或家族成员并且基于序列同一性程度来确定的相关序列。术语“同源性”、“同源的”、“基本上类似的”和“基本上对应的”在本文中可互换使用。同源物通常控制、介导或影响相同或相似的生物化学途径,但特定的同源物可能产生不同的表型。因此应理解,如本领域技术人员会理解本公开涵盖多于特定的示例性序列。这些术语描述在一个物种、亚种、品种、栽培品种或品系中发现的基因与在另一个物种、亚种、品种、栽培品种或品系中的对应或等同基因之间的关系。为了本公开的目的,比较同源序列。
术语“同源物”有时用于应用于由物种形成事件分离的基因之间的关系(参见“直系同源物”)或应用于由遗传复制事件分离的基因之间的关系(参见“旁系同源物”)。
术语“部分同源物”是指由多倍性或染色体重复事件产生的同源基因或染色体。这与以上刚定义的更常见的“同源物”形成对比。
术语“直系同源物”是指通过物种形成从共同的祖先基因进化的不同物种中的基因。通常,直系同源物在进化过程中保持相同的功能。直系同源物的鉴定对于新测序基因组中基因功能的可靠预测是关键的。
术语“旁系同源物”是指与基因组内的复制相关的基因。虽然直系同源物在进化过程中通常保持相同的功能,但旁系同源物可进化新的功能,即使这些功能与原始功能相关。
“同源序列”或“同源物”或“直系同源物”被认为、相信或已知是功能相关的。功能关系可以多种方式中的任一种来表明,包括但不限于:(a)序列同一性程度和/或(b)相同或相似的生物学功能。优选地,以(a)和(b)两者来表示。序列同一性的程度可以变化,但在一个实施方案中,为至少50%(当使用本领域已知的标准序列比对程序时)、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、或至少98.5%、或至少约99%、或至少99.5%、或至少99.8%或至少99.9%。同源性可以使用本领域容易获得的软件程序来确定,诸如在Current Protocols in Molecular Biology(F.M.Ausubel等人编,1987)Supplement 30,section 7.718,Table 7.71所论述的那些。一些比对程序是MacVector(Oxford Molecular Ltd,Oxford,U.K.)和ALIGN Plus(Scientific andEducational Software,Pennsylvania)。其他非限制性比对程序包括Sequencher(GeneCodes,Ann Arbor,Michigan)、AlignX和Vector NTI(Invitrogen,Carlsbad,CA)。
如本文所用,术语“杂种”是指由亲本之间的杂交产生的一个或多个基因不同的任何个体细胞、组织或植物。
如本文所用,术语“近交”或“近交系”是指相对纯种的品系。
如本文所用,术语“单等位基因转化的植物”是指通过称为回交的植物育种技术发育的那些植物,其中除了通过回交技术转移到近交系中的单等位基因之外,近交系的基本上恢复所有所需形态和生理特征。
如本文所用,术语“系”广泛地用于包括但不限于通过组织培养技术从单亲本植物无性繁殖的一组植物或由于来自共同亲本的后代而在遗传上非常相似的一组近交植物。如果植物(a)是从特定系的材料再生的初级转化体(T0)植物,则认为所述植物“属于”所述品系;(b)具有由所述品系的T0植物组成的谱系;或(c)由于共同祖先而在遗传上非常相似(例如,通过近交或自交)。在本文中,术语“谱系”表示植物的谱系,例如根据受影响的有性杂交,使得杂合(半合子)或纯合条件下的基因或基因组合赋予植物所需的性状。
如本文所用,术语“野生型对照(wildtype check)”、“野生型(wildtype)”或“对照(check)”均是指第一细胞、组织培养物、部分或生物体,其在遗传上分别与第二细胞、组织培养物、部分或生物体基本相同,除了相应的第二细胞、组织培养物、部分或生物体包含不存在于第一细胞、组织培养物、部分或生物体中的异源遗传元件。因此,例如,第一植物相对于第二植物将是野生型对照,其中两者之间唯一有意义的遗传差异是第二植物包含第一植物中不存在的异源基因(例如,MYB41)。
如本文所用,术语“基因渗入”是指通过杂交这些物种将一个物种、品种或栽培品种的基因移至另一个物种、品种或栽培品种的基因组中的方法。杂交可以是天然的或人工的。所述过程可以任选地通过与轮回亲本(recurrent parent)回交来完成,在这种情况下基因渗入是指一个物种的基因通过与其亲本之一的种间杂种的重复回交而渗入另一个物种的基因库中。基因渗入也可描述为稳定整合在受体植物基因组中的异源遗传物质。
如本文所用,术语“种群”意指拥有共同遗传来源的植物的遗传同质或异质集合。
如本文所用,术语“品种”或“栽培品种”意指通过结构特征和性能可从相同物种内的其他品种鉴别的类似植物群。本文所用的术语“品种”具有与1961年12月2日的《保护植物新品种的国际公约(UPOV条约)》中的相应定义相同的含义,所述公约于1972年11月10日,1978年10月23日和1991年3月19日在日内瓦修订。因此,“品种”意指已知等级最低的单一植物分类群内的植物分组,无论是否完全满足授予育种者权利的条件,所述分组可以是i)通过由给定基因型或基因型组合产生的特征的表达来定义,ii)通过所述特征中的至少一种的表达与任何其他植物分组区分开,以及iii)其对于不变地繁殖的适合性视为单元。
在以下情况下,一种品种被视为基本上源自另一种品种(“初始品种”):(i)它主要源自初始品种,或其自身主要源自初始品种的品种,同时保留由初始品种的基因型或基因型组合产生的必要特征的表达;(ii)它与所述初始品种明显可区分;以及(iii)除了由来源的行为产生的差异外,它在由初始品种的基因型或基因型组合产生的必要特征的表达上与初始品种一致。UPOV,第14(5)(b)条。
如本文所用,术语“混合选择”是指其中选择个体植物并从其种子的聚集体繁殖下一代的选择形式。在本说明书中描述了混合选择的更多细节。
如本文所用,术语“自由授粉”是指自由暴露于一些基因流的植物种群,与其中存在对基因流的有效屏障的封闭种群相反。
如本文所用,术语“自由授粉的种群”或“自由授粉的品种”是指通常能够根据标准选择的至少一些杂交育种的植物,其可显示出变异,但还具有一种或多种基因型或表型特征,通过所述特征可将群体或品种与其他区分开。对异花授粉没有障碍的杂种是自由授粉种群或自由授粉品种。
如本文所用,术语“自交”,“自花授粉”或“自授粉”意指将一种植物上的一朵花的花粉(人工或天然地)施用至相同植物上的相同或不同花的胚珠(柱头)。
本文所用的术语“杂交”、“杂交的”,“异花授粉”或“杂交育种”是指将一株植物上一朵花的花粉(人工或天然地)施用于另一株植物上一朵花的胚珠(柱头)的过程。
如本文所用,术语“源自”是指起源或来源,并且可包括天然存在的、重组的、未纯化的或纯化的分子。源自起源或来源的核酸或氨基酸可以具有如本文别处定义的所有种类的核苷酸改变或蛋白质修饰。
本文所用的术语“引物”是指能够与扩增靶标退火以使DNA聚合酶附着的寡核苷酸,从而当置于诱导引物延伸产物合成的条件下时用作DNA合成的起始点,即在核苷酸和聚合剂诸如DNA聚合酶存在下以及在合适的温度和pH下。为了使扩增效率最大化,(扩增)引物优选是单链的。优选地,引物是寡脱氧核糖核苷酸。引物必须足够长以在用于聚合的试剂存在下引发延伸产物的合成。引物的确切长度取决于许多因素,包括温度和引物的组成(A/T和G/C含量)。一对双向引物由DNA扩增领域(诸如PCR扩增)中常用的一个正向和一个反向引物组成。
探针包含识别靶核酸序列的可识别的分离核酸。探针包括与可寻址位置、可检测标记或其他报道分子连接并与靶序列杂交的核酸。典型的标记包括放射性同位素、酶底物、辅因子、配体、化学发光剂或荧光剂、半抗原和酶。用于选择适用于多种目的的标签的标记和指导的方法在例如Sambrook等人(编),Molecular Cloning:A Laboratory Manual,第2版,第1-3卷,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY,1989和Ausubel等人Short Protocols in Molecular Biology,第4版,John Wiley&Sons,Inc.,1999中论述。
用于制备和使用核酸探针和引物的方法例如在Sambrook等人(编),MolecularCloning:A Laboratory Manual,第2版,第1-3卷,Cold Spring Harbor LaboratoryPress,Cold Spring Harbor,NY,1989;Ausubel等人Short Protocols in MolecularBiology,第4版,John Wiley&Sons,Inc.,1999;和Innis等人中论述。PCR Protocols,AGuide to Methods and Applications,Academic Press,Inc.,San Diego,CA,1990中描述。扩增引物对可以源自已知序列,例如通过使用预期用于所述目的的计算机程序,诸如PRIMER(Version 0.5,1991,Whitehead Institute for Biomedical Research,Cambridge,MA)。本领域普通技术人员将理解,特定探针或引物的特异性随其长度而增加。因此,为了获得更大的特异性,可以选择包含靶核苷酸序列的至少20、25、30、35、40、45、50或更多个连续核苷酸的探针和引物。
对于本文公开的多核苷酸的PCR扩增,可以设计寡核苷酸引物用于PCR反应,以扩增来自cDNA的相应DNA序列或从任何所关注生物提取的基因组DNA。用于设计PCR引物和PCR克隆的方法通常是本领域已知的,并且公开于Sambrook等人(2001)Molecular Cloning:ALaboratory Manual(第3版,Cold Spring Harbor Laboratory Press,Plainview,NewYork)。还参见Innis等人,编(1990)PCR Protocols:A Guide to Methods andApplications(Academic Press,New York);Innis和Gelfand,编(1995)PCR Strategies(Academic Press,New York);和Innis和Gelfand,编(1999)PCR Methods Manual(Academic Press,New York)。已知的PCR方法包括但不限于使用配对引物、巢式引物、单特异性引物、简并引物、基因特异性引物、载体特异性引物、部分错配引物等的方法。
本公开提供了一种分离的核酸序列,其包含选自由以下组成的组的序列:MYB41、MYB41的同源物、MYB41的直系同源物、MYB41的旁系同源物以及它们的片段和变体。在一个实施方案中,本发明提供了一种分离的多核苷酸,其编码由MYB41的核酸序列(例如,SEQ IDNO:13或SEQ ID NO:15)产生的蛋白质,包含与MYB41共有至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.1%、至少99.2%、至少99.3%、至少99.4%、至少99.5%、至少99.6%、至少99.7%、至少99.8%或至少99.9%同一性的核酸序列(例如SEQID NO:13或SEQ ID NO:15)。
用于比较的序列比对方法在本领域中是众所周知的。多种程序和比对算法描述于:Smith和Waterman(Adv.Appl.Math.,2:482,1981);Needleman和Wunsch(J.Mol.Biol.,48:443,1970);Pearson和Lipman(Proc.Natl.Acad.Sci.,85:2444,1988);Higgins和Sharp(Gene,73:237-44,1988);Higgins和Sharp(CABIOS,5:151-53,1989);Corpet等人(Nuc.Acids Res.,16:10881-90,1988);Huang等人(Comp.Appls Biosci.,8:155-65,1992);以及Pearson等人(Meth.Mol.Biol.,24:307-31,1994).Altschul等人(NatureGenet.,6:119-29,1994)提出了序列比对方法和同源性计算的详细考虑。
本公开还提供了嵌合基因,其包含与合适的调节序列可操作地连接的上述任何一种多核苷酸的分离的核酸序列。在一些实施方案中,嵌合基因包含分离的核酸序列,其包含选自由以下组成的组的序列:MYB41、MYB41的同源物、MYB41的直系同源物、MYB41的旁系同源物以及它们的片段和变体。
在一些实施方案中,嵌合基因包含SEQ ID NO:13中所示的核酸序列(拟南芥MYB41基因)。在一些实施方案中,嵌合基因包含SEQ ID NO:15中所示的核酸序列(拟南芥MYB41编码序列(MYB41 CDS))。在一些实施方案中,嵌合基因包含编码SEQ ID NO:14的核酸序列(拟南芥MYB41蛋白)。
在一些实施方案中,嵌合基因包含上述分离的核酸序列,其与合适的调控序列可操作地连接,所述调控序列包括但不限于FACT、HORST、ASFT、GPAT5、RALPH和/或MYB84的天然启动子。
本公开还提供了包含如上所述的嵌合基因的重组构建体。在一个实施方案中,所述重组构建体是基因沉默构建体,诸如用于RNAi基因沉默。在另一个实施方案中,所述重组构建体是基因编辑构建体,诸如在CRISPR-Cas基因编辑系统中使用的。
本公开的表达载体可包括至少一个选择性标志。此类标志包括二氢叶酸还原酶、G418或用于真核细胞培养的新霉素抗性和用于培养大肠杆菌和其他细菌的四环素、卡那霉素或氨苄青霉素抗性基因。
本公开还提供了包含如上所述的嵌合基因的经转化的宿主细胞。’在一个实施方案中,所述宿主细胞选自细菌、酵母、丝状真菌、藻类、动物和植物。
这些序列允许设计MYB41、MYB41的同源物、MYB41的直向同源物、MYB41的同源物、MYB41的旁系同源物以及它们的片段和变体的基因特异性引物和探针。
新的育种技术(NBT)是指开发和/或用于通过遗传变异在植物中产生新特征的多种新技术,目的是靶向诱变,靶向引入新基因或基因沉默(RdDM)。以下育种技术在NBT范围内:通过使用锌指核酸酶(ZFN)技术(ZFN-1、ZFN-2和ZFN-3,参见美国专利第9,145,565号,以引用的方式整体并入),寡核苷酸定向诱变(ODM,又名定点诱变),同源转基因(Cisgenesis)和内源转基因(intragenesis),表观遗传方法诸如RNA依赖性DNA甲基化(RdDM,其不一定改变核苷酸序列但可以改变序列的生物活性),嫁接(在GM砧木上),反向育种,用于瞬时基因表达的土壤杆菌渗入(土壤杆菌渗入“sensu stricto”,土壤杆菌接种,花序浸渍),转录激活因子样效应因子核酸酶(TALENs,参见美国专利第8,586,363号和第9,181,535号,以引用的方式整体并入),CRISPR/Cas系统(参见美国专利第8,697,359号;第8,771,945号;第8,795,965号;第8,865,406号;第8,871,445号;第8,889,356号;第8,895,308号;第8,906,616号;第8,932,814号;第8,945,839号;第8,993,233号;和第8,999,641号,其全部以引用的方式并入),工程化的大范围核酸酶,再工程化归巢核酸内切酶(re-engineered homing endonucleases),DNA指导的基因组编辑(Gao等人,NatureBiotechnology(2016),doi:10.1038/nbt.3547,以引用的方式整体并入)和合成基因组学。当今靶向基因组编辑的主要部分,即新育种技术的另一个名称,是在基因组中预期修饰的所选位置诱导DNA双链断裂(DSB)的应用。DSB的定向修复允许靶向基因组编辑。此类应用可用于产生突变(例如,靶向突变或精确的天然基因编辑)以及基因的精确插入(例如,同源转基因(cisgene)、内源转基因(intragene)或异源转基因(transgene))。导致突变的应用通常被鉴定为定点核酸酶(SDN)技术,诸如SDN1、SDN2和SDN3。对于SDN1,结果是靶向的非特异性遗传缺失突变:精确选择DNA DSB的位置,但由宿主细胞进行的DNA修复是随机的,并导致小的核苷酸缺失、添加或取代。对于SDN2,SDN用于生成靶向DSB,DNA修复模板(除了一个或几个核苷酸改变外,与靶向DSB DNA序列相同的短DNA序列)用于修复DSB:这导致所需目的基因中的靶向和预定点突变。关于SDN3,SDN与含有新DNA序列(例如基因)的DNA修复模板一起使用。技术的结果是将所述DNA序列整合到植物基因组中。说明使用SDN3的最可能的应用是在所选的基因组位置插入同源转基因的、内源转基因的或异源转基因的(transgenic)表达盒。关于每种技术的完整描述,可以在欧洲委员会的联合研究中心(JRC)预期技术研究所于2011年作出的题为“新植物育种技术-最新技术水平和商业开发前景”的报告中找到,其全文以引用方式并入本文。
如本文所用,“木栓质”是指高度疏水且稍微“橡胶状”的物质。在根中,木栓质沉积在内胚层细胞的径向和横向细胞壁中。被称为凯氏带(Casparian strip)或凯氏带(Casparian band)的这种结构的作用是防止根吸收的水分和养分通过质外体进入中柱。相反,水必须通过共质体绕过内皮层。这允许植物选择进一步进入植物的溶质。因此,其对有害溶质形成了一个重要的屏障。例如,红树林植物使用木栓质来减少沿海栖息地的盐分摄入。
木栓质存在于周皮(或软木)的木栓层中。这是树皮的最外层。此层中的细胞是死亡的并且富含木栓质,从而防止水从下面的组织中流失。还可以在多种其他植物结构中发现木栓质。例如,它们存在于许多植物的茎上的皮孔中,并且网纹甜瓜的外皮中的网状结构由栓化的细胞组成。
II.MYB41
Myb转录因子广泛存在于动物、植物和真菌中。它们与多种植物特异性反应有关,包括次生代谢、细胞形状决定、细胞分化和应激反应。来自拟南芥(Arabidopsis)(拟南芥(Arabidopsis thaliana))的AtMYB41已被描述为响应于盐度、干燥、寒冷和脱落酸而被转录调控的基因。Lippold等人(Plant Physiology,2009年4月,Plant Physiology,149:1761-1772)通过独立地对AtMYB41过表达系进行详细的转录组和代谢组分析来进一步表征所述基因。他们的分子数据表明,所述基因参与不同的细胞过程,包括初级代谢的控制和对渗透胁迫的短期转录反应的负调控。
Kosma等人(The Plant Journal,2014,80:216-229)显示AtMYB41的过表达可以激活拟南芥和烟草(Nicotiana benthamiana)的叶的表皮和叶肉细胞中脂肪族木栓质合成和细胞壁相关的木栓质样片层沉积所必需的步骤。虽然确切的生物学功能仍不清楚,但作者的证据表明,这种转录因子在非生物胁迫条件下在增加脂肪木栓化中起作用。
已知脂肪酰基-CoA还原酶(FAR)通过在木栓质生物合成中还原脂肪酸来催化脂肪伯醇的生成。Wei等人(Horticulture Research,2020,7:86,10页)从猕猴桃(kiwifruit)(猕猴桃(Actinidia chinensis))中分离FAR,并且在烟草(tobacco)(烟草(Nicotianabenthamiana))叶中瞬时过表达分离的AchnFAR。他们的研究确定了转录因子(包括AchnMY41)在调控AchnFAR中的积极作用。
根据本公开,AtMYB41基因及其许多直系同源物在合适的启动子控制下时将有助于构建与合适的对照或对照植物相比具有增加或增强的木栓质水平的作物植物。因此,异源启动子MYB41核酸序列可用于育种程序。,参见,例如Gentzbittel等人(1998,Theor.Appl.Genet.96:519-523)。所述序列也可用于调节植物发育过程,诸如对渗透胁迫的代谢反应、FAR的调控和保护植物免受其他环境胁迫。一般来说,参见Sambrook等人(1989)Molecular Cloning:A Laboratory Manual(第2版,Cold Spring HarborLaboratory Press,Plainview,N.Y.)。本公开的序列也可用于产生变体(例如,通过“结构域交换”),以用于产生具有增加或增强的木栓质水平的新植物类型,特别是在根细胞、结构和组织中。
本公开涵盖分离的或基本上纯化的核酸或蛋白质组合物。“分离的”或“纯化的”核酸分子或蛋白质,或其生物活性部分,基本上或基本上不含如在其天然存在的环境中发现的通常与核酸分子或蛋白质伴随或相互作用的组分。因此,分离或纯化的多核苷酸或多肽在通过重组技术产生时基本上不含其他细胞物质或培养基,或在化学合成时基本上不含化学前体或其他化学物质。适当地,“分离的”多核苷酸不含在衍生所述多核苷酸的生物体的基因组DNA中天然侧接所述多核苷酸(即,位于所述多核苷酸的5’和3’端的序列)的序列(尤其是蛋白质编码序列)。例如,在多种实施方案中,分离的多核苷酸可含有少于约5kb、4kb、3kb、2kb、1kb、0.5kb或0.1kb的核苷酸序列,所述核苷酸序列天然位于多核苷酸来源的细胞的基因组DNA中的多核苷酸侧翼。基本上不含细胞物质的多肽包括具有少于约30%、20%、10%、5%(以干重计)的污染蛋白(contaminating protein)的蛋白质制剂。当重组产生本公开的蛋白质或其生物活性部分时,培养基适当地代表少于约30%、20%、10%或5%(以干重计)的化学前驱体或非目的蛋白质化学品。
拟南芥MYB41基因(AtMYB41)长1,497个核酸碱基对(bp),包括5’和3’UTR(序列名称:AT4G28110.1;Tair登录号:1009098575;基因库登录号:NM_118951;arabidopsis.org/servlets/TairObject?type=sequence&id=1002502859)。
本发明的实施例中使用的一个示例性MYB41基因是SEQ ID NO:13的基因,其长度为1,216个核酸碱基对(bp),包括3个外显子和2个内含子,并且没有终止密码子。相应的氨基酸序列提供于SEQ ID NO:14中。此MYB41蛋白序列长282个氨基酸(不包括终止密码子)。此外,编码MYB41蛋白的AtMYB41基因的互补DNA(cDNA)提供于SEQ ID NO:15(AtMYB41CDS)中。在去除终止密码子序列(TAA)后,此AtMYB41 CDS可用作MYB41表达的SEQ ID NO:13(AtMYB41基因)的替代物。根据所用的克隆方法,可以包括终止密码子序列。
编码本公开的MYB41多肽的生物活性部分的MYB41核苷酸序列的一部分将编码至少约5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、30个、40个、50个、60个、70个、80个、90个、100个、120个、150个、300个、400个、500个、600个、700个、800个、900个或1000个连续氨基酸残基,或几乎高达本公开的全长MYB41多肽中存在的氨基酸的总数(例如,SEQ ID NO:14的282个氨基酸残基)。用作杂交探针或PCR引物的MYB41核苷酸序列的部分和/或MYB41基因的上游和下游通常不需要编码MYB41多肽的生物活性部分。
因此,MYB41核苷酸序列的一部分可以编码MYB41多肽的生物活性部分,或其可以是可以使用本领域已知的标准方法用作杂交探针或PCR引物的片段。MYB41多肽的生物活性部分可通过分离本公开的MYB41核苷酸序列中的一个的一部分来制备,表达MYB41多肽的编码部分(例如,通过体外重组表达),并且评估MYB41多肽的编码部分的活性。作为MYB41核苷酸序列的一部分的核酸分子包含至少约15个、16个、17个、18个、19个、20个、25个、30个、50个、75个、100个、150个、200个、250个、300个、350个、400个、450个、500个、550个、600个、650个、700个、750个、800个、850个、900个、950个、1000个、1050个、1100个、1150个、1200个、1250个或1300个核苷酸,或几乎高达本文公开的全长MYB41核苷酸序列中存在的核苷酸的数目(例如,SEQ ID NO:13的约150个至1300个核苷酸)。
本公开还考虑使用公开的核苷酸序列的变体。核酸变体可以是天然存在的,例如等位基因变体(相同基因座),同源物(不同基因座)和直系同源物(不同生物体),或者可以是非天然存在的。天然存在的变体和诸如此类的变体可以使用众所周知的分子生物学技术(如例如使用本领域已知的聚合酶链反应(PCR)和杂交技术)来鉴定。非天然存在的变体可以通过诱变技术制备,包括应用于多核苷酸、细胞或生物体的那些。变体可以含有核苷酸取代、缺失、倒位和插入。变异可以在编码区和非编码区两者之一发生或两者都发生。变异可产生保守和非保守氨基酸取代两者(如在编码产物中比较的)。对于核苷酸序列,保守变体包括由于遗传密码的简并性而编码本公开的MYB41多肽之一的氨基酸序列的那些序列。变体核苷酸序列还包括合成衍生的核苷酸序列,诸如例如通过使用定点诱变产生但仍编码本公开的MYB41多肽的那些核苷酸序列。通常,如通过本文别处描述的序列比对程序使用默认参数所确定的,本公开的特定核苷酸序列的变体与所述特定核苷酸序列具有至少约30%、40%、50%、55%、60%、65%、70%通常至少约75%、80%、85%,理想地约90%至95%或更大,并且更合适地约98%或更大的序列同一性。
变体核苷酸序列还涵盖源自诱变或重组方法的序列,诸如“DNA混编”,其可用于将目的多肽中的结构域与其他多肽的结构域交换。通过DNA混编,可以操纵一个或多个不同的MYB41编码序列以产生具有所需性质的新MYB41序列。在此方法中,重组多核苷酸文库由相关多核苷酸群体产生,所述多核苷酸群体包含具有基本序列同一性的序列区,并且可以在体外或体内同源重组。例如,使用这种方法,可以在本公开的MYB41基因和其他已知MYB41基因之间混编编码目的结构域的序列基序,以获得编码具有改善的目的性质的蛋白质的新基因,诸如增加的植物细胞、植物组织、植物部分和完整植物的木栓质含量。DNA混编的策略是本领域已知的。参见,例如Stemmer(1994,Proc.Natl.Acad.Sci.USA 91:10747-10751;1994,Nature 370:389-391);Crameri等人(1997,Nature Biotech.15:436-438);Moore等人(1997,J.Mol.Biol.272:336-347);Zhang等人(1997Proc.Natl.Acad.Sci.USA 94:450-44509);Crameri等人(1998,Nature 391:288-291);以及美国专利第5,605,793号和第5,837,458号。
本公开提供了核苷酸序列,其包含由MYB41、MYB41的同源物、MYB41的直系同源物、MYB41的旁系同源物以及它们的片段和变体的核苷酸序列编码的分离的蛋白质的至少一部分。
在一些实施方案中,本公开提供了编码MYB41和/或其功能性片段和变体的核苷酸序列,其包含与SEQ ID NO:13或SEQ ID NO:15共有至少约70%、约75%、约80%、约81%、约82%、约83%、约84%、约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%、约99.1%、约99.2%、约99.3%、约99.4%、约99.5%、约99.6%、约99.7%、约99.8%或约99.9%序列同一性的核苷酸序列。在一些实施方案中,编码MYB41的核苷酸序列具有SEQ ID NO:13或SEQ ID NO:15的核酸序列。
在一些实施方案中,本公开提供了MYB41、MYB41的同源物、MYB41的直系同源物、MYB41的旁系同源物以及它们的片段和变体的核苷酸序列,其包含与SEQ ID NO:13或SEQID NO:15共有至少约70%、约75%、约80%、约81%、约82%、约83%、约84%、约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%或约99%、约99.1%、约99.2%、约99.3%、约99.4%、约99.5%、约99.6%、约99.7%、约99.8%或约99.9%序列同一性的核苷酸序列。
在一些实施方案中,可使用MYB41、MYB41的同源物、MYB41的直系同源物、MYB41的旁系同源物以及它们的片段和变体的核苷酸序列在植物中表达。在一些实施方案中,所述核苷酸序列可用于整合到表达盒中,所述表达盒能够指导MYB41、MYB41的同源物、MYB41的直系同源物、MYB41的旁系同源物以及它们的片段和变体在植物细胞、植物组织、植物部分或整株植物中的表达。此表达盒包含与感兴趣的核苷酸序列(即MYB41、MYB41的直系同源物以及它们的片段和变体)可操作地连接的启动子,所述启动子与终止信号可操作地连接。它通常还包含正确翻译核苷酸序列所需的序列。编码区通常编码目的蛋白质(即MYB41)。在一些实施方案中,包含MYB41、MYB41的同源物、MYB41的直系同源物、MYB41的旁系同源物以及它们的片段和变体的核苷酸序列的表达盒是嵌合的,使得其的组分中的至少一种相对于它的其他组分中的至少一种是异源的。
在其他实施方案中,表达盒是天然存在的,但以用于异源表达的重组形式获得。表达盒中的核苷酸序列的表达可以在组成型启动子或诱导型启动子的控制下,所述启动子仅当宿主细胞暴露于一些特定的外部刺激时才启动转录。此外,表达盒中的核苷酸序列的表达可以在组织特异性启动子的控制下,诸如特定的根组织,包括但不限于,木栓形成层、中柱鞘或原形成层。在多细胞生物体的情况下,启动子还可以对动物和/或植物中的特定组织或器官或发育阶段具有特异性。
本公开提供了多肽和氨基酸序列,其包含由MYB41、MYB41的同源物、MYB41的直系同源物、MYB41的同源物、MYB41的旁系同源物以及它们的片段和变体的核苷酸序列编码的蛋白质的至少一部分。
本公开还提供了由MYB41、MYB41的同源物、MYB41的直系同源物、MYB41的旁系同源物和/或它们的片段和变体的核酸序列编码的氨基酸序列。在一些实施方案中,本公开提供了一种分离的多肽,其包含与由MYB41、MYB41的同源物、MYB41的直系同源物、MYB41的旁系同源物和/或它们的片段和变体的核酸序列编码的氨基酸序列共有至少约70%、约75%、约80%、约85%、至少约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%、约99.1%、约99.2%、约99.3%、约99.4%、约99.5%、约99.6%、约99.7%、约99.8%或约99.9%同一性的氨基酸序列。在一个实施方案中,本公开提供了一种分离的多肽,其包含编码与由MYB41、MYB41的同源物、MYB41的直系同源物、MYB41的旁系同源物和/或它们的片段和变体的核酸序列编码的氨基酸序列共有至少约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%、约99.1%、约99.2%、约99.3%、约99.4%、约99.5%、约99.6%、约99.7%、约99.8%或约99.9%同一性的氨基酸序列的氨基酸序列。
本公开还包括由MYB41、MYB41的同源物、MYB41的直系同源物和/或MYB41的旁系同源物的核酸序列编码的氨基酸序列的蛋白质的变体和片段。变体可以包含组成蛋白的氨基酸序列的改变。关于多肽的术语“变体”是指相对于参考序列被一个或多个氨基酸改变的氨基酸序列。变体可具有“保守”或“非保守”的改变,例如类似的微小变化还可包括氨基酸缺失或插入,或两者。
多肽的功能性片段和变体包括保持亲本多肽的一种或多种功能的那些片段和变体。一般认为,编码多肽的基因或cDNA可以显著突变而不实质性改变多肽的一种或多种功能。第一,众所周知遗传密码是简并的,因此不同的密码子编码相同的氨基酸。第二,即使在引入氨基酸取代的情况下,突变也可以是保守的并且对蛋白质的基本功能没有实质影响。参见,例如Stryer Biochemistry第3版,1988.第三,可以缺失部分多肽链而不损害或消除其所有功能。第四,可以在多肽链中进行插入或添加,例如,添加表位标签,而不损害或消除其功能(Ausubel等人J.Immunol.159(5):2502-12,1997)。可在不实质上损害多肽的一种或多种功能的情况下进行的其他修饰可包括例如体内或体外化学和生物化学修饰或掺入不常见的氨基酸。此类修饰包括但不限于例如乙酰化、羧化、磷酸化、糖基化、泛素化,例如用放射性核苷酸标记和多种酶修饰,如本领域技术人员容易理解的。用于标记多肽的多种方法和可用于此类目的的标记是本领域众所周知的,并且包括放射性同位素诸如32P、与标记的特异性结合配偶体(例如抗体)结合或被结合的配体、荧光团、化学发光剂、酶和抗配体。功能性片段和变体可以具有不同的长度。例如,一些片段具有至少10、25、50、75、100、200个或甚至更多个氨基酸残基。这些突变可以是天然的或特意改变的。在一些实施方案中,含有产生沉默取代、添加或缺失的改变的突变,但不改变蛋白质的性质或活性或制备蛋白质的方式,是本公开的实施方案。
保守氨基酸取代是那些在制备时对原始蛋白质的特性的干扰最小,即,蛋白质的结构且特别是功能是保守的,并且不被这种取代显著改变。保守取代通常维持(a)取代区域中多肽主链的结构,例如,作为片层或螺旋构象,(b)靶位点处分子的电荷或疏水性,或(c)侧链的主体。关于保守取代的进一步信息可见于例如Ben Bassat等人(J.Bacteriol.,169:751 757,1987),O’Regan等人(Gene,77:237 251,1989),Sahin Toth等人(Protein Sci.,3:240247,1994),Hochuli等人(Bio/Technology,6:1321 1325,1988)以及在广泛使用的遗传学和分子生物学教科书。Blosum矩阵通常用于确定多肽序列的相关性。使用可信序列比对的大数据库(BLOCKS数据库)创建Blosum矩阵,其中计数与小于一些阈值百分比同一性相关的成对序列比对(Henikoff等人,Proc.Natl.Acad.Sci.USA,89:10915-10919,1992)。90%同一性的阈值用于BLOSUM90矩阵的高度保守的靶频率。BLOSUM65矩阵使用65%同一性的阈值。在所选的百分比同一性下,Blosum矩阵中的零和零以上得分被认为是“保守取代”。下表显示了示例性保守氨基酸取代。
表1.列出的示例性保守氨基酸取代
/>
在一些实例中,变体可以具有不超过3、5、10、15、20、25、30、40、50或100个保守氨基酸改变(如非常高度保守或高度保守的氨基酸取代)。在其他实例中,变体序列中的一个或几个疏水残基(诸如Leu、Ile、Val、Met、Phe或Trp)可以用不同的疏水残基(诸如Leu、Ile、Val、Met、Phe或Trp)替换,以产生功能上类似于公开的氨基酸序列的变体,所述氨基酸序列由MYB41、MYB41的同源物、MYB41的直系同源物和/或MYB41的旁系同源物和/或它们的片段和变体的核酸序列编码。
在一些实施方案中,变体可通过改变编码区以配合待引入分子的特定生物体的密码子使用偏好而不同于所公开的序列。在其他实施方案中,可以通过利用遗传密码的简并性改变编码序列来改变编码区,使得虽然核苷酸序列被基本上改变,但其仍然编码具有与所公开的氨基酸序列基本上相似的氨基酸序列的蛋白质,所述氨基酸序列由MYB41、MYB41的同源物、MYB41的直系同源物和/或MYB41的旁系同源物和/或它们的片段和变体的核酸序列编码。
在一些实施方案中,提供了源自本公开的MYB41直系同源物的功能性片段。当在植物中表达时,功能性片段仍然可以赋予增加植物细胞、植物组织、植物部分和完整植物中的木栓质含量的能力。在一些实施方案中,功能性片段至少含有野生型MYB41直系同源物或其功能性变体的保守区或Bowman-Birk抑制因子结构域。在一些实施方案中,功能性片段含有一个或多个保守区,所述一个或多个保守区由两个或更多个MYB41直系同源物共有,由相同植物属中的两个或更多个MYB41直系同源物共有,由两个或更多个双子叶植物MYB41直系同源物共有和/或由两个或更多个单子叶植物MYB41直系同源物共有。保守区或Bowman-Birk抑制因子结构域可通过任何合适的计算机程序(诸如NCBI蛋白质BLAST程序和NCBI比对程序或等同程序)来确定。在一些实施方案中,与本公开的MYB41直系同源物相比,功能性片段短1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、50个或更多个氨基酸。在一些实施方案中,通过使本公开的MYB41直系同源物缺失一个或多个氨基酸来制备功能性片段。在一些实施方案中,功能性片段与本公开的MYB41直系同源物共有至少80%、85%、90%、95%、96%、97%、98%、99%或更多同一性。
在一些实施方案中,提供了源自本公开的MYB41直系同源物的功能性嵌合或合成多肽。当在植物中表达时,功能性嵌合或合成多肽仍可赋予增加木栓质含量的能力。在一些实施方案中,功能性嵌合或合成多肽至少含有野生型MYB41直系同源物或其功能性变体的保守区或Bowman-Birk抑制因子结构域。在一些实施方案中,功能性嵌合或合成多肽含有一个或多个保守区,所述一个或多个保守区由两个或更多个MYB41直系同源物共有,由相同植物属中的两个或更多个MYB41直系同源物共有,由两个或更多个单子叶植物MYB41直系同源物共有和/或由两个或更多个双子叶植物MYB41直系同源物共有。保守区或Bowman-Birk抑制因子结构域可通过任何合适的计算机程序(诸如NCBI蛋白质BLAST程序和NCBI比对程序或等同程序)来确定。在一些实施方案中,功能性嵌合或合成多肽与本公开的MYB41直系同源物共有至少80%、85%、90%、95%、96%、97%、98%、99%或更多同一性。
FW敏感等位基因独特的保守区序列也可用于敲低一个或多个MYB41直系同源物的水平。在一些实施方案中,保守区的序列可用于制备基因沉默分子以靶向一个或多个MYB41直系同源物。在一些实施方案中,基因沉默分子选自双链多核苷酸、单链多核苷酸或混合双链寡核苷酸。在一些实施方案中,基因沉默分子包含约10bp、15bp、19bp、20bp、21bp、25bp、30bp、40bp、50bp、60bp、70bp、80bp、90bp、100bp、150bp、200pb、250bp、300bp、350bp、400bp、500bp、600bp、700bp、800bp、900bp、1000bp或更多的多核苷酸的DNA/RNA片段,其中所述DNA/RNA片段与本公开的MYB41直系同源物序列或其互补序列的保守区共有至少90%、95%、99%或更多同一性。
III.启动子序列
如本文所述,本发明人发现与MYB41基因可操作地连接并转化到植物中的某些启动子使得那些转基因植物能够在根发育的早期发育额外的周皮层和/或在周皮细胞中沉积更多的木栓质,而不会负面地影响植物健康。
Bevan和Walsh(The Arabidopsis genome:A foundation for plant research,2005,Genome Research,15:1632-1642)得出结论,拟南芥和水稻基因组的测序为支持跨模式和作物物种的综合植物科学提供了一个强大的平台(第1639页,第二列,观点)。自拟南芥分离的启动子已经显示驱动重要作物物种中的基因表达。例如,Jiang等人(Characterization of a strong and constitutive promoter from the Arabidopsisserine carboxypeptidase-like gene AtSCPL30 as a potential tool for croptransgenic breeding,2018,BMC Biotechnology,18:59,13页)从拟南芥中分离出全长启动子(PD1),并且证明其赋予转基因在烟草转基因植物的几乎所有组织和发育阶段中的强组成型表达。当用于转化玉米和大豆时,从拟南芥中鉴定和分离的干旱响应启动子HVA22E和PLDdelta驱动转基因基因表达(美国专利第7,632,982号和第8,692,071号)。从拟南芥分离的两个种子特异性启动子(即AtS1和AtS3)赋予转基因拟南芥和转基因烟草中GUS活性的种子特异性积累(美国专利第6,100,450号)。
示例性启动子提供于下表中。对于表2中列出的所有这些启动子,在周皮和内皮层中观察到GUS表达。在一些皮层和一些表皮细胞中也观察到弱的GUS表达。除了proMYB84以外,在启动子的莲座叶中没有检测到GUS表达。这些结果显示,这些启动子是根特异性表达的,在第14天在莲座叶中没有可检测的表达。
表2.驱动MYB41表达的示例性启动子序列
本公开提供了一种分离的核酸分子,其包含编码感兴趣的蛋白质(例如MYB41)的分离的核酸序列,所述核酸序列与编码异源启动子的核酸序列可操作地连接,所述异源启动子选自包含以下的组:SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ IDNO:5和SEQ ID NO:6。在一些实施方案中,所述异源启动子是FACT基因的天然启动子。在一些实施方案中,所述异源启动子是HORST基因的天然启动子。在一些实施方案中,所述异源启动子是ASFT基因的天然启动子。在一些实施方案中,所述异源启动子是GPAT5基因的天然启动子。在一些实施方案中,所述异源启动子是RALPH基因的天然启动子。在一些实施方案中,所述异源启动子是MYB84基因的天然启动子。
在另外的实施方案中,FACT基因、HORST基因、ASFT基因、GPAT5基因、RALPH基因和/或MYB84基因的天然启动子可以从各种植物(包括单子叶植物、双子叶植物、从孢子繁殖的维管植物)中衍生、获得、分离。在另外的实施方案中,从拟南芥和本文教导的其他植物(包括单子叶植物、双子叶植物、从孢子繁殖的维管植物)衍生、获得、分离的FACT基因、HORST基因、ASFT基因、GPAT5基因、RALPH基因和/或MYB84的启动子通过以细胞类型特异性方式改变基因表达模式与靶基因或感兴趣的转基因(诸如野生型MYB41基因、MYB41的同源物、MYB41的直系同源物和/或MYB41的旁系同源物和/或它们的片段和变体)可操作地连接,以用于增加木栓质水平。
IV.构建体
如本文所述,本发明人创建了包含表达盒的构建体,所述表达盒包含表1中列出的与MYB41基因可操作地连接的启动子。当这些构建体被转化到植物中时,它们使得那些转基因植物能够在根发育的早期阶段发育额外的周皮层和/或在周皮细胞中沉积更多的木栓质,而不会负面地影响植物健康。示例性构建体提供于下表中。SEQ ID NO:7-12是完整转化构建体的DNA序列,每个都包括表达盒(SEQ ID NO:16-21;即MYB41基因,分别与SEQ ID NO:1-6中所示的每个启动子可操作地连接的3’UTR和基因间区)。
表3.驱动MYB41表达的示例性转化构建体和表达盒序列
V.植物转化
本公开的编码MYB41、MYB41的同源物、MYB41的直系同源物和/或MYB41的旁系同源物和/或它们的片段和变体的本多核苷酸可被转化到植物细胞、植物组织、植物部分和整株植物中。
产生转基因植物的方法是本领域普通技术人员众所周知的。转基因植物现在可以通过多种不同的转化方法产生,包括但不限于电穿孔;显微注射;微弹轰击,也称为粒子加速或生物射弹轰击;病毒介导的转化;以及土壤杆菌介导的转化。参见例如,美国专利第5,405,765号;第5,472,869号;第5,538,877号;第5,538,880号;第5,550,318号;第5,641,664号;第5,736,369和第5,736,369号;国际专利申请公开第WO2002/038779号和第WO/2009/117555号;Lu等人,(Plant Cell Reports,2008,27:273-278);Watson等人,RecombinantDNA,Scientific American Books(1992);Hinchee等人,Bio/Tech.6:915-922(1988);McCabe等人,Bio/Tech.6:923-926(1988);Toriyama等人,Bio/Tech.6:1072-1074(1988);Fromm等人,Bio/Tech.8:833-839(1990);Mullins等人,Bio/Tech.8:833-839(1990);Hiei等人,Plant Molecular Biology 35:205-218(1997);Ishida等人,Nature Biotechnology14:745-750(1996);Zhang等人,Molecular Biotechnology8:223-231(1997);Ku等人,Nature Biotechnology 17:76-80(1999);以及Raineri等人,Bio/Tech.8:33-38(1990)),其中每一者的全部内容通过引用明确地并入本文。
根癌土壤杆菌(Agrobacterium tumefaciens)是天然存在的细菌,其能够将它的DNA(遗传信息)插入植物中,导致对植物的一种类型的损伤,称为冠瘿。现在可以使用此方法转化大多数植物物种,包括葫芦科物种。
微弹轰击也称为粒子加速,生物射弹轰击和基因枪(基因枪)。基因枪用于将包覆有基因(例如,用于所需性状)的颗粒射到植物种子或植物组织中,以获得植物细胞,然后表达新基因。基因枪使用实际爆炸物(.22口径空弹(blank))来推进材料。压缩空气或蒸汽也可用作推进剂。/>基因枪由John Sanford、Edward Wolf和NelsonAllen于1983-1984年在康奈尔大学发明。它及它的注册商标现在归E.I.du Pont deNemours and Company所有。大多数植物物种已经使用此方法转化。
将新的遗传物质引入植物基因组的最常见的方法涉及使用细菌病原体根癌土壤杆菌的活细胞,将称为转移或T-DNA的一段DNA精确地注射到个体植物细胞中(通常在组织受伤后),在那里它靶向植物细胞核以进行染色体整合。有许多控制土壤杆菌属介导转化的专利和特别设计用于以土壤杆菌属递送特定的DNA质粒,例如,US4536475、EP0265556、EP0270822、WO8504899、WO8603516、US5591616、EP0604662、EP0672752、WO8603776、WO9209696、WO9419930、WO9967357、US4399216、WO8303259、US5731179、EP068730、WO9516031、US5693512、US6051757和EP904362A1。土壤杆菌属介导的植物转化涉及将克隆在质粒上的DNA片段置于活的土壤杆菌属细胞中作为第一步,所述活的土壤杆菌属细胞随后用于转化到单独的植物细胞中。因此,土壤杆菌属介导的植物转化是间接的植物转化方法。涉及使用不含T-DNA的载体的土壤杆菌属介导的植物转化的方法也是本领域技术人员众所周知的,并且可以在本公开中具有适用性。参见,例如美国专利第7,250,554号,其在转化载体中使用P-DNA代替T-DNA。
使用土壤杆菌属的转化方法形成的转基因植物通常在一个染色体上含有单一基因,但多个拷贝是可能的。此类转基因植物对于添加的基因可以被称为是半合子的。此类植物的更准确的名称是独立的分离子,因为每个转化的植物代表独特的T-DNA整合事件(美国专利第6,156,953号)。转基因基因座通常的特征在于存在和/或不存在转基因。其中一个等位基因对应于转基因不存在的杂合基因型也称为半合子(美国专利第6,008,437号)。
还报道了使用DNA的直接植物转化方法。在历史上首次报道的是电穿孔,其利用施加到含有植物细胞的溶液的电流(M.E.Fromm等人,Nature,319,791(1986);H.Jones等人,Plant Mol.Biol.,13,501(1989)以及H.Yang等人,Plant Cell Reports,7,421(1988)。另一种称为“生物射弹”的直接方法使用超细颗粒,通常是钨或金,所述超细颗粒包覆有DNA,然后以足够的力喷射到植物组织的表面上,以使所述颗粒穿透植物细胞,所述植物细胞包括厚的细胞壁、膜和核被膜,但不会杀死它们中的至少一些(US 5,204,253、US 5,015,580)。第三种直接方法使用由尖锐、多孔或中空的针状突出部组成的金属或陶瓷的纤维结构,所述突出部实际上包住细胞以及核被膜。碳化硅和硼酸铝晶须两者都已用于植物转化(Mizuno等人,2004;Petolino等人,2000;US5302523 US Application 20040197909)以及细菌和动物转化(Kaepler等人,1992;Raloff,1990;Wang,1995)。报道了其他方法,并且无疑将开发另外的方法。然而,这些间接或直接方法中的每一种在将外来DNA引入植物细胞中的效率总是极低的,使得有必要使用一些方法来仅选择那些已经转化的细胞,并且进一步地,仅使那些已经转化的细胞生长和再生到植物中。
为了有效的植物转化,必须使用选择方法,使得完整植物从单个转化的细胞再生,并且转化植物的每个细胞携带目的DNA。这些方法可以采用阳性选择,由此将外来基因供应给植物细胞,所述植物细胞使其利用存在于培养基中本来不能使用的底物,诸如甘露糖或木糖(例如,参见US 5767378;US 5994629)。然而,更典型地,使用阴性选择,因为它更有效,利用选择性试剂,诸如要么杀死要么抑制未转化的植物细胞的生长并降低嵌合体的可能性的除草剂或抗生素。在用于植物转化的引入的外来DNA上提供有效抗阴性选择性试剂的抗性基因。例如,使用的最流行的选择性试剂之一是抗生素卡那霉素,以及抗性基因新霉素磷酸转移酶(nptII),其赋予对卡那霉素和相关抗生素的抗性(参见例如Messing&Vierra,Gene 19:259-268(1982);Bevan等人,Nature 304:184-187(1983))。然而,许多不同的抗生素和抗生素抗性基因可用于转化目的(参见US 5034322,US 6174724和US 6255560)。此外,几种除草剂和除草剂抗性基因已用于转化目的,包括bar基因,其赋予对除草剂草铵膦(phosphinothricin)的抗性(White等人,Nucl Acids Res 18:1062(1990),Spencer等人,Theor Appl Genet 79:625-631(1990),US 4795855、US 5378824和US 6107549)。此外,赋予抗癌剂甲氨蝶呤抗性的dhfr基因已用于选择(Bourouis等人,EMBO J.2(7):1099-1104(1983))。
用于调节给定蛋白质表达的表达控制元件要么可以是通常发现与编码序列相关的表达控制元件(同源表达元件),要么可以是异源表达控制元件。多种同源和异源表达控制元件是本领域已知的,并且可以容易地用于制备用于本公开的表达单元。例如,转录起始区可包括在根癌土壤杆菌的Ti质粒中发现的多种冠瘿碱起始区中的任一种,诸如章鱼碱、甘露碱、胭脂碱等。可替代地,也可以使用植物病毒启动子,诸如花椰菜花叶病毒19S和35S启动子(分别为CaMV 19S和CaMV 35S启动子)以控制植物中的基因表达(例如美国专利第5,352,605号;第5,530,196号和第5,858,742号)。也可以使用源自CaMV的增强子序列(例如美国专利第5,164,316号;第5,196,525号;第5,322,938号;第5,530,196号;第5,352,605号;第5,359,142号;和第5,858,742号)。最后,也可以使用植物启动子,诸如增殖启动子、果实特异性启动子、Ap3启动子、热休克启动子、种子特异性启动子等。
通常使用本领域已知的标准技术将蛋白质或反义编码区连接至要么配子特异性启动子、组成型启动子(诸如CaMV或Nos启动子)、器官特异性启动子(诸如来自番茄的E8启动子),要么诱导型启动子。表达单元可通过采用诸如转录终止子和/或增强子元件的补充元件进一步优化。
因此,为了在植物中表达,除了蛋白质序列之外,表达单元通常还含有植物启动子区,转录起始位点和转录终止序列。通常包括在表达单元中的5’和3’端的独特限制性内切酶位点,以使得容易地插入到预先存在的载体中。
在异源启动子/结构基因或反义组合的构建中,启动子优选位于异源转录起始位点的距离与其在其天然环境中的转录起始位点的距离大约相同。然而,如本领域已知的,可以在不损失启动子功能的情况下调节此距离的一些变化。
除了启动子序列之外,表达盒还可以含有结构基因下游的转录终止区以提供有效的终止。终止区可以从与启动子序列相同的基因获得,或者可以从不同的基因获得。如果由结构基因编码的mRNA要被有效加工,则指导RNA聚腺苷酸化的DNA序列也通常添加到载体构建体中。聚腺苷酸化序列包括但不限于土壤杆菌属章鱼碱合酶信号(Gielen等人,EMBO J3:835-846(1984))或胭脂碱合酶信号(Depicker等人,Mol.and Appl.Genet.1:561-573(1982))。将所得表达单元连接到或构建成包括在适合于高等植物转化的载体中。一个或多个表达单元可以包括在同一载体中。载体通常含有选择性标志基因表达单元,通过所述选择性标志基因表达单元可以在培养物中鉴定转化的植物细胞。通常,标志基因将编码对抗生素诸如G418、潮霉素、博来霉素、卡那霉素或庆大霉素或对除草剂诸如草甘膦(Round-Up)或草丁膦(glyphosate)(BASTA)或莠去津(atrazine)的抗性。通常还包括细菌或病毒来源的复制序列,以使载体在细菌或噬菌体宿主中克隆;优选包括原核复制起源的广泛宿主范围。还可以包括细菌的选择性标志以使得选择携带所需构建体的细菌细胞。适当的原核选择性标志包括对抗生素诸如氨苄青霉素、卡那霉素或四环素的抗性。如本领域已知的,编码其他功能的其他DNA序列也可存在于载体中。比如,在土壤杆菌属转化的情况下,还将包括T-DNA序列用于随后转移至植物染色体。
为了通过常规方法引入所需基因或基因的组,需要在两个系之间进行有性杂交,然后在杂交后代和亲本之一之间重复回交,直到获得具有所需特征的植物。然而,此方法限于可有性杂交的植物,并且除了所需基因之外的基因将被转移。
重组DNA技术使得植物研究人员通过让植物遗传学家能够鉴定和克隆用于所需性状的特异性基因,诸如改进的脂肪酸组成,并将这些基因引入已经有用的植物品种中,从而规避这些限制。一旦外来基因已被引入植物,所述植物然后可用于使植物育种方案(例如,谱系育种、单粒传代(single-seed-descent)育种方案、正反反复选择法(reciprocalrecurrent selection))以产生还含有目的基因的后代。
可以使用同源重组以定向位点的方式引入基因。同源重组允许内源基因中的位点特异性修饰,因此可以校正遗传或获得突变,和/或可以将新的改变工程化到基因组中。植物中的同源重组和定点整合在例如美国专利第5,451,513号;第5,501,967号和第5,527,695号中论述。
在将本发明付诸实践时,本发明人可以构建表达构建体,其包括编码MYB41、MYB41的同源物、MYB41的直系同源物和/或MYB41的旁系同源物和/或它们的片段和变体的核苷酸序列。可以将本发明的表达构建体引入任何植物属或种的胚胎发生愈伤组织中,并且可以将所得的转化细胞再生为植物。预期转基因植物具有MYB41蛋白的表达。
本文使用的短语“胚性愈伤组织细胞”是指在体外产生的细胞群中含有的胚性细胞。
可以利用几种方法在植物细胞中转化和共表达这些多核苷酸。
尽管不太优选,但是上述多核苷酸序列中的每一个都可以通过使用三个单独的核酸构建体单独引入植物细胞中。在一些实施方案中,三个多核苷酸序列可以使用单一核酸构建体在植物细胞中共引入和共表达。这种构建体可以设计为具有单一启动子序列,其可以转录包括所有三个多核苷酸序列的多顺反子信息。为了使多顺反子信息编码的三种多肽能够共翻译,多核苷酸序列可以经由内部核糖体进入位点(IRES)序列相互连接,所述内部核糖体进入位点序列促进位于IRES序列下游的多核苷酸序列的翻译。在这种情况下,编码上述三种多肽的转录的多顺反子RNA分子将从多顺反子RNA分子的加帽的5’端和两个内部IRES序列两者翻译,从而在细胞中产生所有三种多肽。
可替代地,编码能够在植物细胞、植物组织、植物部分和完整植物中赋予增加的木栓质含量的多种多肽的多核苷酸片段可经由可被待用核酸构建体转化的细胞表达的蛋白酶裂解的蛋白酶识别位点进行翻译融合。在这种情况下,经翻译的嵌合多肽将被细胞表达的蛋白酶裂解,从而产生多种多肽。
在其他实施方案中,本发明利用了包括三个启动子序列的核酸构建体,每个启动子序列能够指导上述多核苷酸序列中的特定多核苷酸序列的转录。
可与本发明的核酸一起使用的合适的启动子包括组成型、诱导型或组织特异性启动子。
合适的组成型启动子包括例如CaMV 35S启动子(Odell等人,Nature313:810-812,1985);玉米Ubi 1(Christensen等人,Plant Sol.Biol.18:675-689,1992);稻肌动蛋白(McElroy等人,Plant Cell 2:163-171,1990);pEMU(Last等人,Theor.Appl.Genet.81:581-588,1991);和合成超级MAS(Ni等人,The Plant Journal 7:661-76,1995)。其他组成型启动子包括在美国专利第5,659,026号;第5,608,149号;第5,608,144号;第5,604,121号;第5,569,597号;第5,466,785号;第5,399,680号;第5,268,463号;和第5,608,142号中的那些组成型启动子。
合适的诱导型启动子可以是病原体诱导型启动子,诸如,例如苜蓿PR10启动子(Coutos-Thevenot等人,Journal of Experimental Botany 52:901-910,2001和Marineau等人,Plant Mol.Biol.9:335-342,1987;Matton等人Molecular Plant-MicrobeInteractions 2:325-331,1989;Somsisch等人,Proc.Natl.Acad.Sci.USA 83:2427-2430,1986:Somsisch等人,Mol.Gen.Genet.2:93-98,1988;和Yang,Proc.Natl.Acad.Sci.USA93:14972-14977,1996。
合适的组织特异性启动子包括但不限于叶片特异性启动子,诸如,例如Yamamoto等人,Plant J.12:255-265,1997;Kwon等人,Plant Physiol.105:357-67,1994;Yamamoto等人,Plant Cell Physiol.35:773-778,1994;Gotor等人,Plant J.3:509-18,1993;Orozco等人,Plant Mol.Biol.23:1129-1138,1993;以及Matsuoka等人,Proc.Natl.Acad.Sci.USA 90:9586-9590,1993中所述。
本发明的核酸构建体还可以包括至少一种选择性标志,例如nptII。优选地,核酸构建体是穿梭载体,其可以在大肠杆菌中繁殖(其中所述构建体包含合适的选择性标志和复制起点)并且与细胞中的增殖相容。根据本发明的构建体可以是例如质粒、杆粒(bacmid)、噬菌粒、粘粒、噬菌体、病毒或人工染色体,优选质粒。
本发明的核酸构建体可用于稳定地转化植物细胞。使外源DNA稳定整合到植物基因组中的基本方法包括两种主要方法:
(i)土壤杆菌属介导的基因转移:Klee等人(1987)Annu.Rev.Plant Physiol.38:467-486;Klee and Rogers in Cell Culture and Somatic Cell Genetics of Plants,第6卷,Molecular Biology of Plant Nuclear Genes,编Schell,J.和Vasil,L.K.,Academic Publishers,San Diego,Calif.(1989)p.2-25;Gatenby,Plant Biotechnology,编Kung,S.和Arntzen,C.J.,Butterworth Publishers,Boston,Mass.(1989)p.93-112。
(ii)直接DNA摄取:Paszkowski等人,Cell Culture and Somatic Cell Geneticsof Plants,第6卷,Molecular Biology of Plant Nuclear Genes编Schell,J.和Vasil,L.K.,Academic Publishers,San Diego,Calif.(1989)p.52-68;包括将DNA直接摄入原生质体的方法,Toriyama,K.等人(1988)Bio/Technology6:1072-1074.通过植物细胞的短暂电击诱导的DNA摄取:Zhang等人Plant Cell Rep.(1988)7:379-384.Fromm等人Nature(1986)319:791-793.通过粒子轰击将DNA注射到植物细胞或组织中,Klein等人Bio/Technology(1988)6:559-563;McCabe等人Bio/Technology(1988)6:923-926;Sanford,Physiol.Plant.(1990)79:206-209;通过使用微量移液管系统:Neuhaus等人,Theor.Appl.Genet.(1987)75:30-36;Neuhaus和Spangenberg,Physiol.Plant.(1990)79:213-217;玻璃纤维或碳化硅晶须转化细胞培养物、胚或愈伤组织,美国专利第5,464,765号或通过将DNA与萌发的花粉直接温育,DeWet等人,Experimental Manipulation of OvuleTissue,编Chapman,G.P.和Mantell,S.H.和Daniels,W.Longman,London,(1985)p.197-209;和Ohta,Proc.Natl.Acad.Sci.USA(1986)83:715-719。
土壤杆菌属系统包括使用含有整合到植物基因组DNA中的限定DNA片段的质粒载体。植物组织的接种方法根据植物种类和土壤杆菌属递送系统而变化。一种广泛使用的方法是叶盘法,其可以用任何组织外植体进行,所述组织外植体提供了引发完整植物分化的良好来源。Horsch等人,Plant Molecular Biology Manual A5,Kluwer AcademicPublishers,Dordrecht(1988)p.1-9.一种补充方法采用与真空浸润(vacuuminfiltration)结合的土壤杆菌属递送系统。用于将外源DNA引入植物细胞的合适的农杆菌介导的程序由Dougale等人(Journal of General Virology,79:2301-2311,1998)和美国专利第6,395,962号所述。
存在将DNA直接转移到植物细胞中的多种方法。在电穿孔中,将原生质体短暂地暴露于强电场。在显微注射中,使用非常小的微量移液管将DNA直接机械注射到细胞中。在微弹轰击中,DNA被吸附在微弹诸如硫酸镁晶体或钨颗粒上,并且微弹被物理加速进入细胞或植物组织。
可替代地,本发明的核酸构建体可以通过微弹轰击引入植物细胞中。在此技术中,用外源DNA包覆的钨或金颗粒朝向靶细胞加速。通过微弹轰击的合适的植物转化方法由Sagi等人(Biotechnology 13:481-485,1995)以及由Dougale等人(Journal of GeneralVirology,79:2301-2311,1998)所述。优选地,本发明的核酸构建体通过如下文实施例4所述的微弹轰击方法引入植物细胞中。
转化后,将转化的细胞微繁殖以提供转化材料的快速、一致的复制。
微繁殖是从已经从所选亲本植物或栽培品种切除的单一的一段组织中生长新一代植物的过程。此方法使得具有表达融合蛋白的优选组织的植物大量繁殖。所产生的新一代植物在遗传上与原始植物相同,并且具有原始植物的所有特征。微繁殖使得在短时间内大量产生优质植物材料,并且提供所选栽培品种快速繁殖,以保存原始转基因或转化植物的特征。克隆植物的优点是植物繁殖的速度和产生的植物的质量和均匀性。
微繁殖是需要在阶段之间改变培养基或生长条件的多阶段方法。因此,微繁殖方法包括四个基本阶段:第一阶段,初始组织培养;第二阶段,组织培养增殖;第三阶段,分化和植物形成;以及第四阶段,温室培养和炼苗(hardening)。在第一阶段,初始组织培养期间,建立组织培养物且证实无污染物。在第二阶段,将初始组织培养物增殖,直到产生足够数量的组织样品以满足生产目标。在第三阶段,将在第二阶段生长的组织样品分开并生长成单个小植株。在第四阶段,将转化的小植株转移到温室中用于炼苗,其中植物对光的耐受性逐渐增加,使得其可在自然环境中生长。
外源DNA序列在转化的植物的基因组中的稳定整合可以使用本领域众所周知的标准分子生物学技术诸如PCR和Southern印迹杂交来确定。
尽管目前稳定转化是优选的,但本发明也设想了培养细胞、叶细胞、分生组织细胞或完整植物的瞬时转化。
瞬时转化可通过上述任何直接DNA转移方法或通过使用经修饰的植物病毒的病毒感染来实现。
病毒感染是优选的,因为它能够从培养的细胞规避完整植物的微繁殖和再生。已示出可用于转化植物宿主的病毒包括CaMV、TMV和BV。使用植物病毒进行转化植物描述于美国专利第4,855,237号(BGV),EP-A67,553(TMV),日本公开的专利申请第63-14693号(TMV),EPA 194,809(BV),EPA 278,667(BV);和Gluzman等人(Communications in MolecularBiology:Viral Vectors,Cold Spring Harbor Laboratory,New York,pp.172-189,1988)。用于在许多宿主(包括植物)中表达外来DNA的假病毒粒子描述于WO 87/06261中。
用于在植物中引入和表达非病毒外源核酸序列的植物RNA病毒的构建体由上述参考文献以及由Dawson等人(Virology 172:285-292,1989;Takamatsu等人EMBO J.6:307-311,1987;French等人(Science 231:1294-1297,1986);和Takamatsu等人(FEBS Letters269:73-76,1990)证实。
当病毒是DNA病毒时,可以对病毒本身进行合适的修饰。可替代地,可以首先将病毒克隆到细菌质粒中,以便用外来DNA构建所需的病毒载体。然后可以从质粒上切除病毒。如果病毒是DNA病毒,可以将细菌复制来源附着到病毒DNA,然后由细菌复制。此DNA的转录和翻译将产生衣壳化病毒DNA的外壳蛋白。
如果病毒是RNA病毒,通常将病毒克隆为cDNA并插入质粒中。然后用质粒制备所有的构建体。然后通过转录质粒的病毒序列并翻译病毒基因以产生衣壳化病毒RNA的外壳蛋白来产生RNA病毒。
用于在植物中引入和表达非病毒外源核酸序列(诸如本发明所包括的那些构建体)的植物RNA病毒的构建体由以上参考文献以及美国专利第5,316,931号所述。
在一个实施方案中,提供了植物病毒核酸,其中从病毒核酸中已经缺失了天然外壳蛋白编码序列,插入了非天然植物病毒外壳蛋白编码序列和非天然启动子,优选地非天然外壳蛋白编码序列的亚基因组启动子,其能够在植物宿主中表达,包装重组植物病毒核酸,并确保重组植物病毒核酸对宿主的系统性感染。可替代地,外壳蛋白基因可通过在其中插入非天然核酸序列而失活,从而产生蛋白质。重组植物病毒核酸可以含有一个或多个另外的非天然亚基因组启动子。每个非天然亚基因组启动子能够在植物宿主中转录或表达邻近基因或核酸序列,并且不能彼此重组和与天然亚基因组启动子重组。如果包括多于一个核酸序列,非天然(外来)核酸序列可以邻近天然植物病毒亚基因组启动子或天然和非天然植物病毒亚基因组启动子插入。非天然核酸序列在宿主植物中在亚基因组启动子的控制下转录或表达以产生所需产物。
在第二个实施方案中,提供了如第一个实施方案中的重组植物病毒核酸,除了将天然外壳蛋白编码序列置于邻近非天然外壳蛋白亚基因组启动子之一,而不是非天然外壳蛋白编码序列。
在第三个实施方案中,提供了重组植物病毒核酸,其中天然外壳蛋白基因邻近其亚基因组启动子,并且一个或多个非天然亚基因组启动子已被插入到病毒核酸中。插入的非天然亚基因组启动子能够在植物宿主中转录或表达邻近基因,并且不能彼此重组和与天然亚基因组启动子重组。非天然核酸序列可邻近非天然亚基因组植物病毒启动子插入,使得在亚基因组启动子的控制下在宿主植物中转录或表达序列,以产生所需产物。
在第四个实施方案中,提供了如第三个实施方案中的重组植物病毒核酸,除了天然外壳蛋白编码序列被非天然外壳蛋白编码序列替换。
病毒载体被重组植物病毒核酸编码的外壳蛋白包裹以产生重组植物病毒。重组植物病毒核酸或重组植物病毒用于感染合适的宿主植物。重组植物病毒核酸能够在宿主中复制,在宿主中系统性传播,并且外来基因(分离的核酸)在宿主中转录或表达,以产生所需蛋白质。
除了上述之外,还可以将本发明的核酸分子引入叶绿体基因组中,从而实现叶绿体表达。
将外源核酸序列引入叶绿体基因组的技术是已知的。此技术包括以下步骤。第一,对植物细胞进行化学处理,以便将每个细胞的叶绿体数目减少到约1。然后,通过粒子轰击将外源核酸引入细胞,目的是将至少一种外源核酸分子引入叶绿体。选择外源核酸,使得其经由同源重组整合到叶绿体基因组中,所述同源重组容易受到叶绿体固有的酶的影响。为此,除了目的基因外,外源核酸包括至少一个源自叶绿体基因组的核酸延伸段(stretch)。另外,外源核酸包括选择性标志,其通过连续的选择方法起作用,以确定在此类选择后叶绿体基因组的所有或基本上所有拷贝都将包括外源核酸。关于此技术的更多细节可见于美国专利第4,945,050号;和第5,693,507号,上述专利以引用的方式并入本文。因此,多肽可由叶绿体的蛋白质表达系统产生并整合到叶绿体的内膜中。
VI.育种方法
自由授粉种群.诸如黑麦、许多玉米和糖用甜菜、牧草、豆类(诸如苜蓿和三叶草)和热带树作物(诸如可可、椰子、油棕和一些橡胶)的自由授粉种群的改进基本上取决于改变基因频率以固定有利的等位基因,同时维持高(但远非最大)程度的杂合度。此类种群的均匀性是不可能的,并且自由授粉品种中的典型性(trueness-to-type)是整个种群的统计特征,而不是个体植物的特征。因此,自由授粉种群的异质性与近交系、克隆和杂种的同质性(或实际上如此)形成对比。
种群改进方法自然分成两组,两组基于纯表型选择,通常称为混合选择(massselection),两组基于用后代检验进行选择。种群间改良利用了开放育种种群的概念;使基因从一个种群流向另一个种群。一个种群中的植物(栽培品种、品系、生态型或任何种质来源)天然地(例如通过风)或通过手或通过蜜蜂(通常是意大利蜜蜂(Apis mellifera L.)或苜蓿切叶蜂(Megachile rotundata F.))与来自其他种群的植物杂交。通过从两个来源分离具有期望的性状的植物,应用选择来改进一个(或有时两个)种群。
基本上有两种改进自由授粉种群的主要方法。首先,存在这种情况,即通过所选择的选择程序大规模改变种群。结果是改进的种群,其通过独立地在其自身内随机交配无限地繁殖。第二,综合种获得与种群改进相同的最终结果,但本身不能像这样繁殖;它必须从亲本系或克隆中重建。用于改进自由授粉种群的这些植物育种方法是本领域技术人员熟知的,并且在许多文本和文章中提供了常规用于改进异花授粉植物的育种方法的全面综述,包括:Allard,Principles of Plant Breeding,John Wiley&Sons,Inc.(1960);Simmonds,Principles of Crop Improvement,Longman Group Limited(1979);Hallauer和Miranda,Quantitative Genetics in Maize Breeding,Iowa State University Press(1981);以及Jensen,Plant Breeding Methodology,John Wiley&Sons,Inc.(1988)。对于大豆特有的种群改进方法,参见例如,J.R.Wilcox,editor(1987)SOYBEANS:Improvement,Production,and Uses,Second Edition,American Society of Agronomy,Inc.,Crop ScienceSociety of America,Inc.,和Soil Science Society of America,Inc.,publishers,888页。
混合选择.在混合选择中,选择、收获所需的个体植物,并且在不进行后代检验的情况下将种子组合以产生之后的世代。由于选择仅基于亲本,并且不存在对授粉的控制,因此混合选择相当于选择随机交配的形式。如上所述,混合选择的目的是增加种群中优良基因型的比例。
综合种通过在所有可能的杂交组合中相互杂交选择具有良好结合能力的许多基因型,随后通过自由授粉维持所述品种,产生综合种。无论亲本是(或多或少近交)种子繁殖系(如在一些糖用甜菜和豆类(Vicia))中还是克隆,如在牧草、三叶草和苜蓿中,原则上没有差异。根据一般的结合能力选择亲本,有时通过检验杂交或顶交,更一般地通过多向杂交。亲本种子系可以是有意近交的(例如通过自交或同胞杂交)。然而,即使亲本不是有意近交的,在系维持期间在系内的选择将确保发生一些近交。克隆亲本当然将保持不变并且是高度杂合的。
是否综合可以直接从亲本种子生产地到农户或必须首先经历一个或两个增殖周期,取决于种子生产和种子需求规模。实际上,禾草和三叶草通常增殖一次或两次,因此从原始综合种中显著地去除。
虽然有时使用混合选择,但后代检验通常优选用于多向杂交,因为它们的操作简单且与目的明显相关,即利用综合种中的一般结合能力。
进入综合种的亲本系或克隆的数目变化很大。实际上,亲本系的数目为10到几百,平均为100-200。从100个或更多个克隆形成的基于宽范围的综合种预期在种子增殖期间比基于窄范围的综合种更稳定。
杂种.如上所述,杂种是由不同基因型亲本之间的杂交产生的个体植物。商业杂种现在广泛用于许多作物,包括玉米(玉蜀黍)、高粱、糖用甜菜、向日葵和西兰花。可以以多种不同的方式形成杂交体,包括通过直接杂交两个亲本(单杂交体),通过将单杂交体与另一个亲本杂交(三杂交体或三杂交体),或通过杂交两个不同的杂交体(四杂交体或双杂交体)。
严格地说,在远系育种(out breeding)(即,自由授粉)种群中的大多数个体是杂种,但所述术语通常保留用于这种情况,其中亲本是基因组足够不同以将它们识别为不同物种或亚种的个体。根据两个亲本基因组的定性和/或定量差异,杂种可以是可育的或不育的。杂种优势或杂交优势通常与杂合性增加有关,与用于形成杂种的亲本系相比,杂合性增加导致杂种的生长、存活和可育性活力增加。通常通过杂交两种遗传上不同的高度近交系来实现最大的杂种优势。
杂种的生产是一个成熟的产业,涉及亲本系和杂交产生的杂种的分离生产。关于杂种产生方法的详细讨论,参见,例如Wright,Commercial Hybrid Seed Production 8:161-176,In Hybridization of Crop Plants.
混合分组分析(BSA).BSA,又名又名分离群体分组法或混合分组分析是由Michelmore等人(Michelmore等人,1991,Identification of markers linked todisease-resistance genes by bulked segregant analysis:a rapid method todetect markers in specific genomic regions by using segregatingpopulations.Proceedings of the National Academy of Sciences,USA,99:9828-9832)以及Quarrie等人(Quarrie等人,Bulk segregant analysis with molecular markersand its use for improving drought resistance in maize,1999,Journal ofExperimental Botany,50(337):1299-1306)所述的方法。
对于目的性状的BSA,选择具有某些不同表型的亲本系并杂交,以产生具有QTL分析的F2,双单倍体或重组近交种群。然后对种群进行表型分析,以鉴定具有高或低性状表达的个体植物或系。制备两种DNA原液,一种来自具有一种表型(例如对病原体具有抗性)的个体,另一种来自具有反向表型(例如对病原体敏感)的个体,并用分子标志分析等位基因频率。如果标志是显性的(例如,RAPD),则在每个群体中仅需要少数个体(例如,每10个植株)。当标志是共显性的(例如,RFLP)时,需要更多的个体。与表型相关的标志可被鉴定并用于育种或QTL作图。
基因聚合将不同亲本中鉴定的一系列靶基因组合成单个基因型的方法通常称为基因聚合。基因聚合育种的第一部分称为系谱,目的是在单个基因型(称为根基因型)中累积所有靶基因的一个拷贝。第二部分称为固定步骤,其目的是将靶基因固定为纯合状态,即从根基因型得到理想基因型(理想株型(ideotype))。基因聚合可与标志辅助选择组合(MAS,参见Hospital等人,1992、1997a和1997b,以及Moreau等人,1998)或基于标志的轮回选择(MBRS,参见Hospital等人,2000)。
VII.基因编辑
如本文所用,术语“基因编辑系统”是指包含一个或多个DNA结合结构域或组分和一个或多个DNA修饰结构域或组分,或编码所述DNA结合和DNA修饰结构域或组分的分离的核酸(例如一个或多个载体)的系统。基因编辑系统用于修饰靶基因的核酸和/或用于调节靶基因的表达。在已知的基因编辑系统中,例如,一个或多个DNA结合结构域或组分与一个或多个DNA修饰结构域或组分相关联,使得一个或多个DNA结合结构域将一个或多个DNA修饰结构域或组分靶向特定的核酸位点。用于增强基因编辑的方法和组合物是本领域众所周知的。参见实例美国专利申请公开第2018/0245065号,其以全文引用的方式并入。
某些基因编辑系统是本领域已知的,包括但不限于锌指核酸酶,转录激活因子样效应因子核酸酶(TALEN);成簇的规则间隔的短回文重复(CRISPR)/Cas系统,大范围核酸酶系统和病毒载体介导的基因编辑。
在一些实施方案中,本公开教导利用DNA核酸酶进行基因编辑/克隆的方法。CRISPR复合物、转录激活因子样效应因子核酸酶(TALEN),锌指核酸酶(ZFN)和FokI限制性内切酶,它们是已经用作基因编辑工具的一些序列特异性核酸酶。这些酶能够通过与被工程化以识别目的序列的引导区的相互作用将它们的核酸酶活性靶向所需靶基因座。在一些实施方案中,本公开教导基于CRISPR的基因编辑方法,以遗传工程改造本公开的植物物种的基因组,以便刺激、增强或调节植物细胞,植物组织、植物部分或完整植物的木栓质含量。
(i)CRISPR系统
CRISPR(成簇的规则间隔的短回文重复)和CRISPR相关(cas)核酸内切酶最初被发现为由细菌和古细菌进化的适应性免疫系统,以保护免受病毒和质粒侵入。细菌中天然存在的CRISPR/Cas系统由一个或多个Cas基因和一个或多个CRISPR阵列组成,所述CRISPR阵列由碱基序列的短回文重复序列组成,所述碱基序列由从先前遇到的病毒和质粒获得的基因组靶向序列分开(称为间隔区)。(Wiedenheft,B.,等人.Nature.2012;482:331;Bhaya,D.,等人,Annu.Rev.Genet.2011;45:231;和Terms,M.P.等人,Curr.Opin.Microbiol.2011;14:321)。具有一个或多个CRISPR基因座的细菌和古核生物通过在CRISPR阵列的近端将外来序列的短片段(原间隔区)整合到宿主染色体中来响应病毒或质粒攻击。CRISPR基因座的转录产生含有与先前遇到的侵入核酸互补的序列的CRISPR衍生的RNA(crRNA)的文库(Haurwitz,R.E.,等人,Science.2012:329;1355;Gesner,E.M.,等人,Nat.Struct.Mol.Biol.2001,18:688;Jinek,M.,等人,Science.2012:337;816-21)。crRNA的靶识别通过与靶DNA的互补碱基配对发生,其通过Cas蛋白指导外来序列的裂解。(Jinek等人2012“A Programmable dual-RNA-guided DNA endonuclease in adaptivebacterial immunity.”Science.2012:337;816-821)。
存在至少五种主要的CRISPR系统类型(I、II、III、IV和V型)和至少16种不同的亚型(Makarova,K.S.,等人,Nat Rev Microbiol.2015.Nat.Rev.Microbiol.13,722–736)。CRISPR系统也基于它们的效应因子蛋白分类。第1类系统具有多亚基crRNA效应因子复合物,而在第2类系统中,效应因子复合物的所有功能由单一蛋白质(例如Cas9或Cpf1)实现。在一些实施方案中,本公开提供了使用II型和/或V型单亚基效应因子系统。
由于这些天然存在于许多不同类型的细菌中,CRISPR的确切排列和Cas基因及其产物的结构、功能和数量因物种而异。Haft等人(2005)PLoS Comput.Biol.1:e60;Kunin等人(2007)Genome Biol.8:R61;Mojica等人(2005)J.Mol.Evol.60:174-182;Bolotin等人(2005)Microbiol.151:2551-2561;Pourcel等人(2005)Microbiol.151:653-663;和Stern等人(2010)Trends.Genet.28:335-340。例如,Cse(Cas亚型,大肠杆菌(E.coli))蛋白(例如,CasA)形成功能性复合物,Cascade,其将CRISPR RNA转录物加工成Cascade保留的间隔-重复单位。Brouns等人(2008)Science 321:960-964。在其他原核生物中,Cas6加工CRISPR转录物。大肠杆菌中基于CRISPR的噬菌体失活需要Cascade和Cas3,但不需要Cas1或Cas2。激烈热球菌(Pyrococcus furiosus)和其他原核生物中的Cmr(Cas RAMP模块)蛋白与识别并裂解互补靶RNA的小CRISPR RNA形成功能性复合物。更简单的CRISPR系统依赖于蛋白质Cas9,其是具有两个活性切割位点的核酸酶,双螺旋中每条链一个。将Cas9和经修饰的CRISPR基因座RNA组合可用于用于基因编辑的系统。Pennisi(2013)Science 341:833-836。
(ii)CRISPR/Cas9
在一些实施方案中,本公开提供了使用II型CRISPR系统进行基因编辑的方法。II型系统依赖于i)单核酸内切酶蛋白,ii)反式激活crRNA(tracrRNA),和iii)crRNA,其中crRNA的5’端的约20个核苷酸(nt)部分与靶核酸互补。CRISPR crRNA链与其靶DNA原间隔区互补的区在此称为“指导序列”。
在一些实施方案中,II型系统的tracrRNA和crRNA组分可以被单一指导RNA(sgRNA)(也称为指导RNA(gRNA))替代。sgRNA可以包括例如包含与靶DNA序列(指导序列)互补的至少12-20个核苷酸序列的核苷酸序列,并且可以在其3’端包括共同的支架RNA序列。如本文所用,“共同支架RNA”是指模仿tracrRNA序列的任何RNA序列或充当tracrRNA的任何RNA序列。
Cas9核酸内切酶产生平端DNA断裂并通过crRNA和tracrRNA寡核苷酸的组合募集到靶DNA,所述crRNA和tracrRNA寡核苷酸通过RNA CRISPR复合物的互补杂交束缚核酸内切酶。
在一些实施方案中,crRNA/核酸内切酶复合物的DNA识别需要与位于靶DNA的3'部分中原间隔区序(PAM)(例如,5’-NGG-3’)在靶原间隔区下游进行另外的互补碱基配对。(Jinek,M.,等人,Science.2012,337:816-821)。在一些实施方案中,由Cas9识别的PAM基序对于不同的Cas9蛋白是不同的。
在一些实施方案中,本文公开的Cas9可以是源自或分离自任何来源的任何变体。在其他实施方案中,本公开的Cas9肽可包含文献中描述的一种或多种突变,包括但不限于以下文献中描述的功能性突变:Fonfara等人Nucleic Acids Res.2014年2月;42(4):2577-90;Nishimasu H.等人.Cell.2014年2月27日,156(5):935-49;Jinek M.等人.Science.2012 337:816-21;和Jinek M.等人。Science.2014年3月14日,343(6176);还参见美国专利申请第13/842,859号,2013年3月15提交,其据此以引用方式并入本文;另外,参见美国专利第8,697,359号;第8,771,945号;第8,795,965号;第8,865,406号;第8,871,445号;第8,889,356号;第8,895,308号;第8,906,616号;第8,932,814号;第8,945,839号;第8,993,233号;和第8,999,641号,这些专利均以引用的方式并入本文。因此,在一些实施方案中,本文公开的系统和方法可与具有双链核酸酶活性的野生型Cas9蛋白,充当单链切口酶的Cas9突变体或具有修饰的核酸酶活性的其他突变体一起使用。
根据本公开,源自或基于多种物种的Cas9蛋白的Cas9分子可用于本文所述的方法和组合物中。例如,源自或基于例如酿脓链球菌(S.pyogenes)、嗜热链球菌(S.thermophilus)、金黄色葡萄球菌(Staphylococcus aureus)的Cas9分子和/或脑膜炎奈瑟氏菌(Neisseria meningitidis)的Cas9分子可用于本文所述的系统,方法和组合物中。其他Cas9种类包括:燕麦噬酸菌(Acidovorax avenae)、胸膜肺炎放线杆菌(Actinobacillus pleuropneumoniae)、琥珀酸放线杆菌(Actinobacillussuccinogenes)、猪放线杆菌(Actinobacillus suis)、放线菌属(Actinomyces sp.)、反硝化嗜环菌(cycliphilus denitrificans)、嗜氨单胞菌(Aminomonas paucivorans)、蜡样芽胞杆菌(Bacillus cereus)、史氏芽孢杆菌(Bacillus smithii)、苏云金芽孢杆菌(Bacillus thuringiensis)、拟杆菌属(Bacteroides sp.)、滨海芽生螺旋菌(Blastopirellula marina)、慢生根瘤菌属(Bradyrhiz obium sp.)、侧孢短芽孢杆菌(Brevibacillus latemsporus)、结肠弯曲菌(Campylobacter coli)、空肠弯曲杆菌(Campylobacter jejuni)、弯曲杆菌(Campylobacter lad)、古螺旋菌暂定种(CandidatusPuniceispirillum)、解纤维梭菌(Clostridiu cellulolyticum)、产气荚膜梭菌(Clostridium perfringens)、拥挤棒杆菌(Corynebacterium accolens)、白喉棒杆菌(Corynebacterium diphtheria)、马氏棒杆菌(Corynebacterium matruchotii)、雄芝氏沟鞭藻玫瑰杆菌(Dinoroseobacter sliibae)、细长真杆菌(Eubacterium dolichum)、γ变形杆菌(gamma proteobacterium)、固氮葡糖醋杆菌(Gluconacetobacler diazotrophicus)、副流感嗜血杆菌(Haemophilus parainfluenzae)、生痰嗜血杆菌(Haemophilussputorum)、加拿大螺杆菌(Helicobacter canadensis)、同性恋螺杆菌(Helicobactercinaedi)、(Helicobacter mustelae)、鼬鼠螺杆菌(Ilyobacler polytropus)、金格杆菌(Kingella kingae)、卷曲乳杆菌(Lactobacillus crispatus)、伊氏李斯特菌(Listeriaivanovii)、单核细胞增生李斯特菌(Listeria monocytogenes)、李斯特氏菌科细菌(Listeriaceae bacterium)、甲基胞囊菌属(Methylocystis sp.)、发孢甲基弯菌(Methylosinus trichosporium)、羞怯动弯杆菌(Mobiluncus mulieris)、杆菌状奈瑟氏菌(Neisseria bacilliformis)、灰色奈瑟氏菌(Neisseria cinerea)、浅黄奈瑟氏菌(Neisseria flavescens)、乳糖奈瑟氏菌(Neisseria lactamica)、奈瑟氏菌属(Neisseriasp.)、瓦茨瓦尔西奈瑟氏菌(Neisseria wadsworthii)、亚硝化单胞菌属(Nitrosomonas sp.)、食清洁剂细小棒菌(Parvibaculum lavamentivorans)、多杀巴斯德菌(Pasteurella multocida)、琥珀酸考拉杆菌(Phascolarctobacteriumsuccinatutens)、丁香罗尔斯通菌(Ralstonia syzygii)、沼泽红假单胞菌(Rhodopseudomonas palustris)、小红卵菌属(Rhodovulum sp.)、米氏西蒙斯氏菌(Simonsiella muelleri)、鞘氨醇单胞菌属(Sphingomonas sp.)、葡萄园芽孢乳杆菌(Sporolactobacillus vineae)、路邓葡萄球菌(Staphylococcus lugdunensis)、链球菌属(Streptococcus sp.)、罕见小球菌属(Subdoligranulum sp.)、运动替斯崔纳菌(Tislrella mobilis)、密螺旋体属(Treponema sp.)或艾森氏蠕形杆菌(Verminephrobacter eiseniae)。
在一些实施方案中,本公开教导用于植物(诸如作物)中的基因组编辑技术的工具的用途以及使用包括SpyCas9、SaCas9、St1Cas9的CRISPR相关(cas)核酸内切酶进行基因编辑的方法。这些用于基因组编辑的强大工具是本领域众所周知的,其可以应用于植物基因组编辑。参见实例,Song等人(2016),CRISPR/Cas9:A powerful tool for crop genomeediting,The Crop Journal 4:75-82,Mali等人(2013)RNA-guided human genomeengineering via cas9,Science 339:823-826;Ran等人(2015)In vivo genome editingusing staphylococcus aureus cas9,Nature 520:186-191;Esvelt等人(2013)Orthogonal cas9 proteins for rna-guided gene regulation and editing,Naturemethods 10(11):1116-1121,其中每一个据此以引用的方式整体并入用于所有目的。
(iii)CRISPR/Cpf1
在其他实施方案中,本公开提供了使用V型CRISPR系统进行基因编辑的方法。在些实施方案中,本公开提供了使用来自普雷沃氏菌属(Prevotella),弗朗西斯氏菌属(Francisella),氨基酸球菌属(Acidaminococcus),毛螺菌科(Lachnospiraceae)以及莫拉菌属(Moraxella)(Cpf1)的CRISPR进行基因编辑的方法。
本公开的Cpf1 CRISPR系统包含i)单核酸内切酶蛋白,和ii)crRNA,其中crRNA的3’端的一部分含有与靶核酸互补的指导序列。在此系统中,Cpf1核酸酶通过crRNA直接募集到靶DNA。在一些实施方案中,Cpf1的指导序列必须是至少12nt、13nt、14nt、15nt或16nt以实现可检测的DNA裂解,并且至少14nt、15nt、16nt、17nt或18nt以实现有效的DNA裂解切割。
本公开的Cpf1系统以多种方式不同于Cas9。首先,与Cas9不同,Cpf1不需要单独的tracrRNA用于裂解。在一些实施方案中,Cpf1 crRNA可以短至约42-44个碱基长,其中23-25nt是指导序列,19nt是组成性直接重复序列。相反,组合的Cas9 tracrRNA和crRNA合成序列可以是约100个碱基长。
第二,某些Cpf1系统优选位于其靶标5’上游的“TTN”PAM基序。这与位于普通Cas9系统(诸如酿脓链球菌(Streptococcus pyogenes)Cas9)的靶DNA的3'上的“NGG”PAM基序形成对比。在一些实施方案中,直接位于指导序列之前的尿嘧啶碱基不能被取代(Zetsche,B.等人,2015.“Cpf1 Is aSingle RNA-Guided Endonuclease of a Class 2CRISPR-CasSystem”Cell 163,759-771,其以引用的方式整体并入本文用于所有目的)。
第三,Cpf1的切割位点交错约3-5个碱基,其产生“粘性末端”(Kim等人,2016.“Genome-wide analysis reveals specificities of Cpf1 endonucleases in humancells”,2016年6月6日在线公布)这些具有3-5nt突出端的粘性末端被认为促进NHEJ介导的连接,并改善具有匹配末端的DNA片段的基因编辑。切割位点在靶DNA的3’端,在PAM所在的5’端的远端。切割位置通常遵循未杂交链上的第18个碱基和与crRNA杂交的互补链上的相应第23个碱基。
第四,在Cpf1复合物中,“种子”区位于指导序列的前5nt内。Cpf1crRNA种子区对突变高度敏感,并且甚至此区中的单碱基取代也可以显著降低裂解活性(参见Zetsche B.等人2015“Cpf1 Is a Single RNA-Guided Endonuclease of a Class 2CRISPR-CasSystem”Cell 163,759-771)。关键地,与Cas9 CRISPR靶不同,Cpf1系统的裂解位点和种子区不重叠。关于设计Cpf1 crRNA靶向寡核苷酸的另外指导可在Zetsche B.等人2015获得。(“Cpf1 Is a Single RNA-Guided Endonuclease of a Class 2CRISPR-Cas System”Cell163,759-771)。
(iv)指导RNA(gRNA)
在一些实施方案中,本公开的指导RNA包含分别编码crRNA和tracrRNA的两个编码区。在其他实施方案中,指导RNA是单指导RNA(sgRNA)合成的crRNA/tracrRNA杂交体。在其他实施方案中,指导RNA是Cpf1核酸内切酶的crRNA。
本领域技术人员将理解,除非另外指明,否则本公开中对单个指导RNA(sgRNA)的所有提及均可解读为提及指导RNA(gRNA)。因此,本公开中描述的涉及单指导RNA(sgRNA)的实施方案也将被理解为涉及指导RNA(gRNA)。
设计了指导RNA以便将CRISPR核酸内切酶募集到靶DNA区。在一些实施方案中,本公开传授了鉴定可行的靶标CRISPR着陆位点并且设计用于靶向这些位点的指导RNA的方法。例如,在一些实施方案中,本公开传授了被设计成便于识别靶DNA区内的CRISPR着陆位点的算法。
在一些实施方案中,本公开传授了软件程序的使用,所述软件程序被设计成用于基于所希望的指导序列长度和特定CRISPR酶的CRISPR基序序列(PAM,原间隔区相邻基序)来鉴定输入DNA序列的两条链上的候选CRISPR靶序列。例如,具有PAM序列TTN的来自弗朗西斯氏菌(Francisella novicida)U112的Cpf1的靶位点可以通过在输入序列和输入的反向互补序列上搜索5′-TTN-3′来鉴定。具有PAM序列TTTN的来自毛螺菌科细菌和氨基酸球菌属物种的Cpf1的靶位点可以通过在输入序列和输入的反向互补序列上搜索5’-TTTN-3’来鉴定。同样地,具有PAM序列NNAGAAW的嗜热链球菌CRISPR的Cas9的靶位点可以通过在输入序列和输入的反向互补序列两者上搜索5′-Nx-NNAGAAW-3′来鉴定。酿脓链球菌的Cas9的PAM序列是5’-NGG-3’。
由于DNA靶位点在基因组中的多次出现可能导致非特异性基因组编辑,在鉴定所有潜在的位点之后,可以基于它们在相关参考基因组或模块化CRISPR构建体中出现的次数来筛选出序列。对于通过‘种子’序列(诸如Cpf1介导的裂解的指导序列的前5bp)确定序列特异性的那些CRISPR酶,过滤步骤还可以考虑任何种子序列限制。
在一些实施方案中,算法工具还可以鉴定特定指导序列的潜在脱靶位点。例如,在一些实施方案中,Cas-Offinder可用于鉴定Cpf1的潜在脱靶位点(参见Kim等人,2016.“Genome-wide analysis reveals specificities of Cpf1endonucleases in humancells”Nature Biotechnology 34,863-868)。也可以使用任何其他可公开获得的CRISPR设计/鉴定工具,包括例如Zhang lab crispr.mit.edu tool工具(参见Hsu等人,2013“DNAtargeting specificity of RNA guided Cas9 nucleases”Nature Biotech 31,827-832)。
在一些实施方案中,可以允许用户选择种子序列的长度。也可以允许用户指定基因组中种子:PAM序列出现的次数,以便通过过滤器。默认为筛单一序列。通过改变种子序列的长度和基因组中序列的出现次数来改变筛选水平。所述程序可另外或可替代地通过提供鉴定的靶序列的反向互补来提供与报道的(一个或多个)靶序列互补的指导序列的序列。
在指导RNA中,“间隔区/指导序列”序列与DNA靶中的“原间隔区”序列互补。单链gRNA结构的gRNA“支架”被Cas9蛋白识别。
在一些实施方案中,本公开中教导的转基因植物、植物部分、植物细胞或植物组织培养物包含重组构建体,其包含至少一种编码指导RNA的核酸序列。在一些实施方案中,核酸与启动子可操作地连接。在其他实施方案中,重组构建体还包含编码成簇的规则间隔的短回文重复(CRISPR)核酸内切酶的核酸序列。在其他实施方案中,指导RNA能够与所述CRISPR核酸内切酶形成复合物,并且所述复合物能够结合至所述植物基因组的基因组靶序列并在其中产生双链断裂。在其他实施方案中,CRISPR核酸内切酶是Cas9。
在另外的实施方案中,靶序列是MYB41、MYB41的同源物、MYB41的直系同源物和/或MYB41的旁系同源物和/或它们的片段和变体的核酸。在一些实施方案中,本公开教导了使用本文所述的遗传工程技术对植物中的MYB41进行基因编辑。
在一些实施方案中,修饰的植物细胞在内源靶基因的基因组DNA序列中包含一个或多个修饰(例如,一个或多个核酸的插入、缺失或突变),导致内源基因改变的功能,从而调节、刺激或增强植物细胞、植物组织、植物部分和完整植物中的木栓质含量。在此类实施方案中,修饰的植物细胞包含“修饰的内源靶基因”。在一些实施方案中,基因组DNA序列中的修饰导致突变,从而改变MYB41蛋白质的功能。在一些实施方案中,基因组DNA序列中的修饰导致氨基酸取代,从而改变所编码蛋白质的正常功能。在一些实施方案中,与未修饰形式的内源蛋白相比,基因组DNA序列中的修饰编码具有调节、改变、刺激或增强的功能的修饰的内源蛋白。
在一些实施方案中,本文所述的经修饰的植物细胞包含一种或多种经修饰的内源靶基因,其中与未经修饰的植物细胞相比,所述一种或多种修饰导致由所述内源靶基因编码的基因产物(即蛋白质)的改变的功能。例如,在一些实施方案中,经修饰的植物细胞表现出蛋白的表达或所述蛋白的表达上调。在一些实施方案中,与基因产物(诸如MYB41)在未经修饰的植物细胞中的表达相比,基因产物(诸如遗传工程化的MYB41)在经修饰的植物细胞中的表达增强了至少0.5%、1%、2%、3%、4%、5%或更高。在其他实施方案中,与基因产物(诸如MYB41)在未经修饰的植物细胞中的表达相比,基因产物(诸如遗传工程化的MYB41)在经修饰的植物细胞中的表达增强了至少10%、20%、30%、40%、50%、60%、70%、80%、90%或更多。在一些实施方案中,与基因产物在未经修饰的植物细胞中的表达相比,本文所述经修饰的植物细胞证实由多个(例如,两个或更多个)内源靶基因编码的基因产物的表达和/或功能增强。例如,在一些实施方案中,与基因产物在经未经修饰的植物细胞中的表达相比,经修饰的植物细胞表现出来自2、3、4、5、6、7、8、9、10个或更多个内源靶基因的基因产物的增强的表达和/或功能。
在一些实施方案中,本文所述的经修饰的植物细胞包含一种或多种经修饰的内源靶基因,与未经修饰的植物细胞中表达的相应蛋白质(例如,“未经修饰的内源蛋白质”)的功能相比,其中对靶DNA序列的一种或多种修饰导致表达降低或改变功能的蛋白质(例如,“经修饰的内源蛋白质”)的表达。在一些实施方案中,本文所述的经修饰的植物细胞包含编码2、3、4、5、6、7、8、9、10个或更多个经修饰的内源蛋白的2、3、4、5、6、7、8、9、10个或更多个经修饰的内源靶基因。在一些实施方案中,所述经修饰的内源表现出增强的或改变的对由经修饰的植物细胞表达的或由另一细胞表达的另一蛋白的增强或改变的结合亲和力;增强的或改变的信号传导能力;增强或改变的酶活性;增强或改变的DNA结合活性;或降低或改变作为支架蛋白的能力。
实施例
本发明通过以下实施例进一步说明,这些实施例不应被解释为限制性的。在本申请中引用的所有参考文献、专利和公开的专利申请以及附图的内容以引用的方式整体并入本文用于所有目的。
实施例1:选择用于工程化木栓质产量增加的候选启动子
我们进行了广泛的研究,寻找可能驱动更多木栓质产生的启动子。更具体地,为了在特定植物层中设计更多的木栓质,我们寻找具有根细胞类型特异性表达的启动子,所述启动子可能驱动木栓质相关基因,导致转化植物的根中木栓质产量增加。
作为这项工作的部分,我们通过产生具有双GUS-GFP报道基因的启动子融合体评估了被认为是木栓质生物合成所需的两个基因HORST(Vishwanath等人,2015;等人,2008;Wei等人,2020)和FACT(Kosma,2012;Molina等人,2009)的表达模式(图1A和2A)。对于每个报道基因(分别为“proFACT”或“proHORST”),三个独立产生的拟南芥品系被表征并显示具有正常的根生长(数据未显示),在14天龄根的周皮和内皮层中具有高GUS表达(图1B-D和图2B-D)。虽然在皮层和表皮细胞中观察到一些微弱的表达,但在莲座叶中没有检测到表达,从而表明这些启动子在与正常木栓质产生无关的细胞中显示出最低限度的表达。
按照类似的实验步骤,另外五个启动子也显示在周皮和内皮层中具有GUS表达(数据未显示)。这些另外的启动子是proASFT、proRALPH、proMYB84、proHORST和proGPAT5。ProASFT、proRALPH、proHORST和proGPAT5在莲座叶中没有GUS表达,而proMYB84具有一些莲座叶表达。
实施例2:使用ProFACT驱动MYB41转录因子的异位表达
FACT的启动子用于驱动MYB41转录因子的异位表达,所述转录因子先前被证明以根层特异性方式诱导烟草叶中木栓质的产生(Kosma等人,2014)。使用proFACT::MYB41构建体(图2E)(SEQ ID NO:7)和使用花卉浸渍法的农杆菌介导的转化(S.J.Clough和A.F.Bent,2008,Foral dip:asimplified method for Agrobacterium-mediated transformationof Arabadopsis thaliana,The Plant Journal 16(6),33页),四个独立产生的拟南芥品系被表征并显示表达MYB41(图2F)并具有正常的根生长(图2G)。
通过尼罗红染色和共聚焦成像在这些品系中评估此构建体对木栓质沉积的影响。这些分析显示,对于四个独立的纯合T3品系(LS110-LS621、LS112-LS214、LS108-MR219和LS107-LS442)和两个同胞品系(LS107-LS442和LS107-LS444),与野生型对照(Col-0)相比,正在形成另外的尼罗红染色的周皮层(图2H)。因此,与野生型植物相比,我们已经鉴定了通过产生另外的周皮细胞来增加木栓质水平的高度可重复的方法。
实施例3:使用ProHORST驱动MYB41转录因子的异位表达
HORST的启动子用于驱动MYB41转录因子的异位表达,所述转录因子先前被证明以根层特异性方式诱导烟草叶中木栓质的产生(Kosma等人,2014)。使用proHORST::MYB41构建体(图1E)(SEQ ID NO:8)和农杆菌介导的转化(Clough和Brent,2008),两个独立产生的拟南芥品系被表征并显示具有正常的根生长(图1F)。
通过尼罗红染色和共聚焦成像在这些品系中评估此构建体对木栓质沉积的影响。在这种情况下,我们发现在两个独立的纯合T3品系(LS140-LS766和LS141-LS788)和两个同胞品系(LS140-LS766和LS140-LS767)中,与野生型对照(Col-0)相比,在周皮中观察到更多的尼罗红信号(图1G)。因此,我们已经鉴定了与野生型植物相比,通过在现有周皮细胞中沉积更多的木栓质来增加木栓质水平的高度可重复的方法。
实施例4:木栓质生物标志的定量
为了量化具有更多周皮层和/或尼罗红染色增加的proFACT::MYB41和proHORST::MYB41品系中的木栓质生物标志的水平,使用来自14天或28天龄幼苗的干燥根组织进行反应性热解-气相色谱-质谱(RxPyGC-MS)实验。对于每个品系,包括三个技术重复,绘制了与木栓质组成相关的选定脂肪酸、ω-羟基酸、α,ω-二酸和酚类的丰度的平均值和平均值的标准误差(图3A-3E)。
对于proFACT::MYB41,分析了三个独立的T3纯合品系(图3A和图3B),并且在第14天和第28天时间点,这些品系一致地显示许多木栓质生物标志水平的增加。对于这些相同的品系,还使用来自14天龄幼苗的干燥茎干组织进行RxPyGC-MS,并且没有观察到木栓质生物标志的增加(图3C)。这些发现与特别是在植物根中木栓质生物合成的许多关键步骤的上调一致。此外,来自28天龄根样品的数据表明,与非工程化野生型对照品系相比,成熟时工程化品系含有更多的木栓质。
对于proHORST::MYB41,分析了来自两个独立的T3纯合亲本的三个同胞品系(图3D和图3E),并且在第14天和第28天时间点,这些品系一致地显示一种木栓质生物标志C18:1ω-羟基酸水平的增加。鉴于这些品系在周皮组织中显示更强的尼罗红染色,这些发现表明C18:1ω-羟基酸的产生可能是木栓质生物合成途径中的部分限速因素。总的来说,对pFACT::MYB41和pHORST::MYB41品系的这些分析显示,根据MYB41表达的位置,可以在体内产生不同的木栓质染色模式,并且这些变化与不同的木栓质生物标志信号相关,特别是在根组织中。
实施例5:使用另外的启动子驱动MYB41转录因子的异位表达
ASFT、GPAT5、RALPH和MYB84的启动子均可用于驱动MYB41转录因子的异位表达,所述转录因子先前被证明以根层特异性方式诱导烟草叶中木栓质的产生(Kosma等人,2014)。使用proASFT::MYB41、proGPAT5::MYB41、proRALPH::MYB41和proMYB84:MYB41构建体(分别为SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11和SEQ ID NO:12)中的任一种或多种和农杆菌介导的转化,独立产生的拟南芥品系可以被表征并显示具有正常的根生长。
可以通过尼罗红染色和共聚焦成像在这些品系中评估这些构建体对木栓质沉积的影响。使用此方法,可以发现独立的纯合T3品系和同胞品系,其中与野生型对照(Col-0)相比,在周皮中观察到更多的尼罗红信号。因此,通过这种方式,我们提供了与野生型植物相比,通过在现有周皮细胞中沉积更多的木栓质来增加木栓质的水平的高度可重复的方法。
实施例6.使用启动子驱动烟草中MYB41转录因子的异位表达
自拟南芥、烟草或其他植物物种衍生或分离的FACT、HORST、ASFT、GPAT5、RALPH和MYB84的启动子均可用于驱动MYB41转录因子的异位表达,所述转录因子先前已显示以根层特异性方式诱导烟草叶中木栓质的产生(Kosma等人,2014)。使用proFACT::MYB41、proHORST::MYB41、proASFT::MYB41、proGPAT5::MYB41、proRALPH::MYB41和proMYB84:MYB41构建体(分别为SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11和SEQ ID NO:12)和农杆菌介导的转化(Kosma等人,2014),独立产生的烟草(tobacco)(烟草(Nicotiana tabacum))品系可以被表征并显示具有正常的根生长。
可以通过尼罗红染色和共聚焦成像在这些品系中评估这些构建体对木栓质沉积的影响。使用此方法,可以发现独立的纯合品系和同胞品系,其中与野生型对照相比,在周皮中观察到更多的尼罗红信号。因此,通过这种方式,我们提供了与野生型植物相比,通过在现有周皮细胞中沉积更多的木栓质来增加木栓质的水平的高度可重复的方法。
实施例7:使用启动子驱动稻中MYB41转录因子的异位表达
拟南芥、稻或其他植物物种衍生或分离的FACT、HORST、ASFT、GPAT5、RALPH和MYB84的启动子均可用于驱动MYB41转录因子以根层特异性方式异位表达。使用proFACT::MYB41、proHORST::MYB41、proASFT::MYB41、proGPAT5::MYB41、proRALPH::MYB41和proMYB84:MYB41构建体(分别为SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11和SEQ ID NO:12)中的任一种或多种和农杆菌介导的转化(参见,例如Ratanasut等人,2017,In planta Agrobacterium-Mediated Transormation of Rice,Rice Science 24(3):181-186),独立产生的稻(稻属(genus Oryza))品系可以被表征并显示具有正常的根生长。
可以通过尼罗红染色和共聚焦成像在这些品系中评估这些构建体对木栓质沉积的影响。使用此方法,可以发现独立的纯合品系和同胞品系,其中与野生型对照相比,在周皮中观察到更多的尼罗红信号。因此,通过这种方式,我们提供了与野生型植物相比,通过在现有周皮细胞中沉积更多的木栓质来增加木栓质的水平的高度可重复的方法。
实施例8:使用启动子驱动玉米中MYB41转录因子的异位表达
自拟南芥、玉米或其他植物物种衍生或分离的FACT、HORST、ASFT、GPAT5、RALPH和MYB84的启动子均可用于驱动MYB41转录因子以根层特异性方式异位表达。使用proFACT::MYB41、proHORST::MYB41、proASFT::MYB41、proGPAT5::MYB41、proRALPH::MYB41和proMYB84:MYB41构建体(分别为SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11和SEQ IDNo:12)中的任一种或多种和标准玉米转化方法(参见,第五节,植物转化),独立产生的玉米(corn)(玉米(Zea mays),又名玉蜀黍)品系可以被表征并显示具有正常的根生长。
可以通过尼罗红染色和共聚焦成像在这些品系中评估这些构建体对木栓质沉积的影响。使用此方法,可以发现独立的纯合品系和同胞品系,其中与野生型对照相比,在周皮中观察到更多的尼罗红信号。因此,通过这种方式,我们提供了与野生型植物相比,通过在现有周皮细胞中沉积更多的木栓质来增加木栓质的水平的高度可重复的方法。
实施例9:使用启动子驱动大豆中MYB41转录因子的异位表达
自拟南芥、大豆或其他植物物种衍生或分离的FACT、HORST、ASFT、GPAT5、RALPH和MYB84的启动子均可用于驱动MYB41转录因子以根层特异性方式异位表达。使用proFACT::MYB41、proHORST::MYB41、proASFT::MYB41、proGPAT5::MYB41、proRALPH::MYB41和proMYB84:MYB41构建体(分别为SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11和SEQ IDNO:12)中的任一种或多种和标准大豆转化方法(参见,第五节,植物转化),独立产生的大豆(soybean)(大豆(Glycine max),又名大豆(soya))品系可以被表征并显示具有正常的根生长。
可以通过尼罗红染色和共聚焦成像在这些品系中评估这些构建体对木栓质沉积的影响。使用此方法,可以发现独立的纯合品系和同胞品系,其中与野生型对照相比,在周皮中观察到更多的尼罗红信号。因此,通过这种方式,我们提供了与野生型植物相比,通过在现有周皮细胞中沉积更多的木栓质来增加木栓质的水平的高度可重复的方法。
实施例10:使用启动子驱动小麦中MYB41转录因子的异位表达
自拟南芥、小麦或其他植物物种衍生或分离的FACT、HORST、ASFT、GPAT5、RALPH和MYB84的启动子均可用于驱动MYB41转录因子以根层特异性方式异位表达。使用proFACT::MYB41、proHORST::MYB41、proASFT::MYB41、proGPAT5::MYB41、proRALPH::MYB41和proMYB84:MYB41构建体(分别为SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11和SEQ ID NO:12)中的任一种或多种和标准小麦转化方法(参见,第五节,植物转化),独立产生的小麦(小麦属(genus Triticum))品系可以被表征并显示具有正常的根生长。
可以通过尼罗红染色和共聚焦成像在这些品系中评估这些构建体对木栓质沉积的影响。使用此方法,可以发现独立的纯合品系和同胞品系,其中与野生型对照相比,在周皮中观察到更多的尼罗红信号。因此,通过这种方式,我们提供了与野生型植物相比,通过在现有周皮细胞中沉积更多的木栓质来增加木栓质的水平的高度可重复的方法。
实施例11:使用启动子驱动棉花中MYB41转录因子的异位表达
自拟南芥、棉花或其他植物物种衍生或分离的FACT、HORST、ASFT、GPAT5、RALPH和MYB84的启动子均可用于驱动MYB41转录因子以根层特异性方式异位表达。使用proFACT::MYB41、proHORST::MYB41、proASFT::MYB41、proGPAT5::MYB41、proRALPH::MYB41和proMYB84:MYB41构建体(分别为SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11和SEQ ID NO:12)中的任一种或多种和标准棉花转化方法(参见,第五节,植物转化),独立产生的棉花(棉子属(genus Gossypium))品系可以被表征并显示具有正常的根生长。
可以通过尼罗红染色和共聚焦成像在这些品系中评估这些构建体对木栓质沉积的影响。使用此方法,可以发现独立的纯合品系和同胞品系,其中与野生型对照相比,在周皮中观察到更多的尼罗红信号。因此,通过这种方式,我们提供了与野生型植物相比,通过在现有周皮细胞中沉积更多的木栓质来增加木栓质的水平的高度可重复的方法。
实施例12:使用启动子驱动MYB41转录因子在卡诺拉油菜中的异位表达
自拟南芥、卡诺拉油菜或其他植物物种衍生或分离的FACT、HORST、ASFT、GPAT5、RALPH和MYB84的启动子均可用于驱动MYB41转录因子以根层特异性方式异位表达。使用proFACT::MYB41、proHORST::MYB41、proASFT::MYB41、proGPAT5::MYB41、proRALPH::MYB41和proMYB84:MYB41构建体(分别为SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11和SEQ ID NO:12)中的任一种或多种和标准的卡诺拉油菜转化方法(参见,第五节,植物转化),独立产生的卡诺拉油菜(甘蓝型油菜属(Brassica napus L.),油茶(spp.Oleifera),又名油菜籽)品系可以表征并显示具有正常的根生长。
可以通过尼罗红染色和共聚焦成像在这些品系中评估这些构建体对木栓质沉积的影响。使用此方法,可以发现独立的纯合品系和同胞品系,其中与野生型对照相比,在周皮中观察到更多的尼罗红信号。因此,通过这种方式,我们提供了与野生型植物相比,通过在现有周皮细胞中沉积更多的木栓质来增加木栓质的水平的高度可重复的方法。
实施例13:使用启动子驱动萝卜中MYB41转录因子的异位表达
自拟南芥、萝卜或其他植物物种衍生或分离的FACT、HORST、ASFT、GPAT5、RALPH和MYB84的启动子均可用于驱动MYB41转录因子以根层特异性方式异位表达。使用proFACT::MYB41、proHORST::MYB41、proASFT::MYB41、proGPAT5::MYB41、proRALPH::MYB41和proMYB84:MYB41构建体(分别为SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11和SEQ IDNo:12)中的任一种或多种和标准萝卜转化方法(参见,第五节,植物转化),独立产生的萝卜(radish)(萝卜(Raphanus sativus))品系可以被表征并显示具有正常的根生长。
可以通过尼罗红染色和共聚焦成像在这些品系中评估这些构建体对木栓质沉积的影响。使用此方法,可以发现独立的纯合品系和同胞品系,其中与野生型对照相比,在周皮中观察到更多的尼罗红信号。因此,通过这种方式,我们提供了与野生型植物相比,通过在现有周皮细胞中沉积更多的木栓质来增加木栓质的水平的高度可重复的方法。
实施例14:使用启动子驱动绛三叶草中MYB41转录因子的异位表达
自拟南芥、绛三叶草或其他植物物种衍生或分离的FACT、HORST、ASFT、GPAT5、RALPH和MYB84的启动子均可用于驱动MYB41转录因子以根层特异性方式异位表达。使用proFACT::MYB41、proHORST::MYB41、proASFT::MYB41、proGPAT5::MYB41、proRALPH::MYB41和proMYB84:MYB41构建体(分别为SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11和SEQ IDNo:12)中的任一种或多种和标准的绛三叶草转化方法(参见,第五节,植物转化),独立产生的绛三叶草(crimson clover)(绛三叶草(Trifoliumincarnatum))品系可以被表征并显示具有正常的根生长。
可以通过尼罗红染色和共聚焦成像在这些品系中评估这些构建体对木栓质沉积的影响。使用此方法,可以发现独立的纯合品系和同胞品系,其中与野生型对照相比,在周皮中观察到更多的尼罗红信号。因此,通过这种方式,我们提供了与野生型植物相比,通过在现有周皮细胞中沉积更多的木栓质来增加木栓质的水平的高度可重复的方法。
实施例15:使用启动子驱动高粱中MYB41转录因子的异位表达
自拟南芥、高粱或其他植物物种衍生或分离的FACT、HORST、ASFT、GPAT5、RALPH和MYB84的启动子均可用于驱动MYB41转录因子以根层特异性方式异位表达。使用proFACT::MYB41、proHORST::MYB41、proASFT::MYB41、proGPAT5::MYB41、proRALPH::MYB41和proMYB84:MYB41构建体(分别为SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11和SEQ IDNo:12)中的任一种或多种和标准高粱转化方法(参见,第五节,植物转化),独立产生的高粱(sorghum)(高粱(Sorghum bicolor))品系可以被表征并显示具有正常的根生长。
可以通过尼罗红染色和共聚焦成像在这些品系中评估这些构建体对木栓质沉积的影响。使用此方法,可以发现独立的纯合品系和同胞品系,其中与野生型对照相比,在周皮中观察到更多的尼罗红信号。因此,通过这种方式,我们提供了与野生型植物相比,通过在现有周皮细胞中沉积更多的木栓质来增加木栓质的水平的高度可重复的方法。
实施例16:使用启动子驱动败酱草/CoverCress中MYB41转录因子的异位表达
自拟南芥、败酱草或其他植物物种衍生或分离的FACT、HORST、ASFT、GPAT5、RALPH和MYB84的启动子均可用于驱动MYB41转录因子以根层特异性方式异位表达。使用proFACT::MYB41、proHORST::MYB41、proASFT::MYB41、proGPAT5::MYB41、proRALPH::MYB41和proMYB84:MYB41构建体(分别为SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11和SEQ ID NO:12)中的任一种或多种和标准的败酱草和CoverCress转化方法(参见,第五节,植物转化),独立产生的败酱草(菥蓂)或CoverCress品系可以被表征并显示具有正常的根生长。
可以通过尼罗红染色和共聚焦成像在这些品系中评估这些构建体对木栓质沉积的影响。使用此方法,可以发现独立的纯合品系和同胞品系,其中与野生型对照相比,在周皮中观察到更多的尼罗红信号。因此,通过这种方式,我们提供了与野生型植物相比,通过在现有周皮细胞中沉积更多的木栓质来增加木栓质的水平的高度可重复的方法。
实施例17:使用启动子驱动一年生黑麦草中MYB41转录因子的异位表达
自拟南芥、一年生黑麦草或其他植物物种衍生或分离的FACT、HORST、ASFT、GPAT5、RALPH和MYB84的启动子均可用于驱动MYB41转录因子以根层特异性方式异位表达。使用proFACT::MYB41、proHORST::MYB41、proASFT::MYB41、proGPAT5::MYB41、proRALPH::MYB41和proMYB84:MYB41构建体(分别为SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11和SEQ ID NO:12)中的任一种或多种和标准的一年生黑麦草转化方法(参见,第五节,植物转化),独立产生的一年生黑麦草(黑麦草(Lolium perenne))品系可以被表征并显示具有正常的根生长。
可以通过尼罗红染色和共聚焦成像在这些品系中评估这些构建体对木栓质沉积的影响。使用此方法,可以发现独立的纯合品系和同胞品系,其中与野生型对照相比,在周皮中观察到更多的尼罗红信号。因此,通过这种方式,我们提供了与野生型植物相比,通过在现有周皮细胞中沉积更多的木栓质来增加木栓质的水平的高度可重复的方法。
本公开的进一步编号的实施方案
本发明所涵盖的其他主题在以下编号的实施方案中阐述:
1.一种分离的核酸分子,其包含编码与SEQ ID NO:14具有至少80%序列同源性的MYB41氨基酸序列的核酸序列和/或SEQ ID NO:13或SEQ ID NO:15中所示的核酸,所述核酸序列与编码异源启动子的核酸序列可操作地连接,其中与缺乏所述分离的核酸分子的野生型对照植物相比,所述分离的核酸分子在植物中的表达导致木栓质水平增加。
2.如实施方案1所述的分离的核酸分子,其中所述木栓质水平的增加通过产生额外的周皮细胞和/或在现有的周皮细胞中沉积更多的木栓质而发生。
3.如实施方案1或实施方案2所述的分离的核酸分子,其中氨基酸序列同源性选自由以下组成的组:与SEQ ID NO:14的至少85%同源性、至少90%同源性、至少95%同源性、至少96%同源性、至少97%同源性、至少98%同源性和至少99%同源性。
4.如实施方案1或实施方案2所述的分离的核酸分子,其中氨基酸序列同源性是与SEQ ID NO:14的100%同源性。
5.如实施方案1至4所述的分离的核酸分子,其中所述分离的核酸分子包含选自包含以下的组的分离的核酸序列:SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9、SEQ ID NO:10、SEQ ID NO:11和SEQ ID NO:12。
6.一种转化载体,其包含如实施方案1至5和22至28的核酸分子中的一者或多者。
7.一种转化植物细胞的方法,其包括将如实施方案6所述的转化载体引入植物细胞中,由此与未转化的野生型对照植物细胞相比,转化的植物细胞产生增加水平的木栓质。
8.如实施方案7所述的方法,其还包括从所述转化的植物细胞产生转化的植物组织。
9.如实施方案8所述的方法,其还包括从所述转化的植物组织产生转化的小植株,其中与缺乏所述分离的核酸分子的未转化的野生型对照小植株相比,所述转化的小植株产生增加水平的木栓质。
10.如实施方案9所述的方法,其还包括产生所述转化的小植株的后代,其中与缺乏所述分离的核酸分子的未转化的野生型对照小植株相比,所述后代产生增加水平的木栓质。
11.如实施方案9或实施方案10所述的方法,其还包括使所述转化的小植株或所述转化的小植株的后代生长成成熟的转化植物,其中与缺乏所述分离的核酸分子的成熟的未转化的野生型对照相比,所述成熟的转化植物产生增加水平的木栓质。
12.如实施方案9至11所述的方法,其中所述木栓质水平的增加通过产生额外的周皮细胞和/或在现有的周皮细胞中沉积更多的木栓质而发生。
13.如实施方案9至12所述的方法,其中在与正常木栓质产生无关的细胞中,所述核酸分子极少表达或不表达。
14.如实施方案9至13所述的方法,其中所述核酸分子在莲座叶中极少表达或不表达。
15.如实施方案11至14所述的方法,其还包括在育种方法中使用所述成熟的转化植物或所述成熟的转化植物的克隆。
16.如实施方案15所述的方法,其中所述育种方法包括使所述成熟的转化植物或所述成熟的转化植物的克隆自交或杂交。
17.一种植物育种方法,其包括将包含如实施方案1至5和22至28所述的核酸分子的第一种植物与相同物种的第二种植物杂交,并且基于与野生型对照植物相比木栓质水平的增加来选择所得杂交后代。
18.如实施方案17所述的植物育种方法,其还包括产生所述所得杂交后代的克隆,其中基于与野生型对照植物相比木栓质水平的增加来选择所述克隆。
19.如实施方案17或实施方案18所述的植物育种方法,其中使用基于如实施方案1至5和22至28所述的核酸分子设计的分子标志来选择与野生型对照植物相比显示木栓质水平增加的所述杂交后代。
20.如实施方案17所述的方法,其还包括在育种方法中使用所选择的后代。
21.如实施方案11至14所述的方法,其还包括使所述成熟的转化植物或所述成熟的转化植物的克隆在温室或室外生长。
22.如实施方案1至4所述的分离的核酸分子,其中所述异源启动子包含选自包含以下的组的分离的核酸序列:SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQID NO:5和SEQ ID NO:6。
23.如实施方案1至4所述的分离的核酸分子,其中所述异源启动子是FACT基因的启动子。
24.如实施方案1至4所述的分离的核酸分子,其中所述异源启动子是HORST基因的启动子。
25.如实施方案1至4所述的分离的核酸分子,其中所述异源启动子是ASFT基因的启动子。
26.如实施方案1至4所述的分离的核酸分子,其中所述异源启动子是GPAT5基因的启动子。
27.如实施方案1至4所述的分离的核酸分子,其中所述异源启动子是RALPH基因的启动子。
28.如实施方案1至4所述的分离的核酸分子,其中所述异源启动子是MYB84基因的启动子。
以引用方式并入
本文在上述和/或下文中引用的所有参考文献、文章、出版物、专利、专利出版物和专利申请均以引用的方式整体并入用于所有目的。然而,本文引用的任何参考文献、文章、出版物、专利、专利出版物和专利申请的提及不得且不应被视为承认或以任何形式表明,它们构成有效的现有技术或形成世界上任何国家公知常识的一部分。
参考文献
Vishwanath,S.J.,Delude,C.,Domergue,F.&Rowland,O.Suberin:biosynthesis,regulation,and polymer assembly of a protective extracellular barrier.Plantcell reports 34,573-586(2015).
Carrington,E.M.,Hernes,P.J.,Dyda,R.Y.,Plante,A.F.&Six,J.Biochemicalchanges across a carbon saturation gradient:Lignin,cutin,and suberindecomposition and stabilization in fractionated carbon pools.Soil Biology andBiochemistry 47,179-190(2012).
Feng,X.&Simpson,M.J.Molecular-level methods for monitoring soilorganic matter responses to global climate change.Journal of environmentalmonitoring:JEM 13,1246-1254(2011).
Preston,C.M.,Trofymow,J.A.,Niu,J.&Sayer,B.G.13C nuclearmagneticresonance spectroscopy with cross-polarization and magic-anglespinninginvestigation of the proximate-analysis fractions used to assesslitterquality in decomposition studies.Canadian Journal of Botany 75(1997).
Winkler,A.,Haumaier,L.&Zech,W.Insoluble alkyl carbon componentsinsoils derive mainly from cutin and suberin.Organic Geochemistry 36,519-529,(2005).
Mahmood,K.et al.Overexpression of ANAC046 PromotesSuberinBiosynthesis in Roots of Arabidopsis thaliana.International journal ofmolecularsciences 20(2019).
R.et al.The Arabidopsis cytochrome P450 CYP86A1 encodes afattyacid omega-hydroxylase involved in suberin monomer biosynthesis.Journalofexperimental botany 59,2347-2360(2008).
Wei,X.et al.Three Transcription Activators of ABA SignalingPositivelyRegulate Suberin Monomer Synthesis by Activating CytochromeP450CYP86A1 in Kiwifruit.Frontiers in Plant Science 10,1650(2020).
Kosma,D.K.,Molina,I.,Ohlrogge,J.B.&Pollard,M.Identification ofanArabidopsis Fatty Alcohol:Caffeoyl-Coenzyme A Acyltransferase Requiredforthe Synthesis of Alkyl Hydroxycinnamates in Root Waxes.Plant Physiology160,237(2012).
Molina,I.,Li-Beisson,Y.,Beisson,F.,Ohlrogge,J.B.&Pollard,M.Identification of an Arabidopsis Feruloyl-Coenzyme A Transferase RequiredforSuberin Synthesis.Plant Physiology 151,1317,(2009).
Kosma,D.K.et al.AtMYB41 activates ectopic suberin synthesisandassembly in multiple plant species and cell types.Plant J 80,216-229,(2014).
序列表
<110> 索尔克生物研究所(Salk Institute For Biological Studies)
<120> 通过以细胞类型特异性方式改变基因表达模式来工程化增加木栓质水平
<130> SALK-006/01WO 190310-2012
<150> US 63/093,205
<151> 2020-10-17
<160> 21
<170> PatentIn版本3.5
<210> 1
<211> 1582
<212> DNA
<213> 拟南芥
<400> 1
ggttaagagt ttcgttttcc ttcgttcaaa atctaatgtg aaggaaagca aaactgacac 60
aacttttgtg tgaaccagag caagtgaaag tgtgtcgaat ctgtactttt gtactgtgta 120
atctctatag tctgactctc attatgtagt tttaagtgtc ttttacttgt gtagctgtta 180
cctgttacct gttaggtttt ctaatccttg ttttatttga tagccagata ctttagggaa 240
ttttacttct tcttttcttg ggtttaattt aagacatatt cgtatatttc atttaattct 300
gttatctgat ttgtgagatc atgaaaacga atgttgaact tgaaacttga gtgggttcag 360
aaaaactact ctgtattaaa aatcccagtg tcacatgata atgatccttc agtaaaggta 420
gacatagctt ttttgcagtg tgatatgcac aaatacaatc tatattttta tgtaaaagat 480
atatttcttt gaaagtactt ataaaaatat gtttttcata aaaaaaatta tatgtaattc 540
tgaaagtatg tgatatgcac aagcacaacc tatatttcct acattcaaat tcgggttttt 600
cttgacgcca agttacattc aattatcaat aatagggcta gttcaactaa tgctatttat 660
ttatacaatc cacccactac taaatctcaa tctccaagga tctttatata ttaataagaa 720
aagctactat ccaaatgcga ccttgttcgt gaagtgtttg gtttataatt tggtggctta 780
agactatagc ccaccattga cccaaaaaaa gaaaggaaaa ttaatagtag actatatagc 840
taccaactcc ctataattta ccttgaaatt aaaccagctt tgtatttttt taatagaagt 900
cagggctcta cagtttcatt ttaaactttt ttttttgtta tattacatcc tgcaggttag 960
ttgtaatttg taaacgtaat caacataata aaaccattta catagactga ttaaagttga 1020
ttccatttga taatatttag ctatttatat atcaatcaac caccagctct taaatatatg 1080
tattcaaatt gttttgttga ctctttttgc tacactttaa atttgaatct agaatgttgt 1140
cctgaaacaa aaatctgtgg attgaacaaa attatacacc aggtaaaatt ttgaagtttt 1200
taaaagcagg atcacatact cctaatttta gattggatag atctagtata aaaatatgaa 1260
gtttttttcc caaaaaataa taataccatt tagctcttaa ttaaatgcat gcaaactaaa 1320
gataaaaaga ggaattattt taaccattct aactcgtcac aacatgccta atcattccag 1380
gttaatttta gagttttcaa atcgtcatat taacatgtga tcctgaagac tcttctcttc 1440
tttcttctac cattagctga aatctttact tgtaccacaa ttaacctcaa accctagccc 1500
ctaaatcccc ctagaaatca atccatcctc agttctccaa aaagatatct ttggtttttc 1560
ttcactgaca aaacccctaa aa 1582
<210> 2
<211> 2082
<212> DNA
<213> 拟南芥
<400> 2
catctacaaa gcctataaaa tggaaagatg tatgcatcga tgatgattct gcctcactta 60
gaagaatcaa aaagctaaaa ggagctgcga atcctgggca acgatgactt agtatgtata 120
gaagaaaaaa aaagctttta cttggtatca aacagagcat gtgttgttgt atttgctacc 180
tttttctgca aagttattgg caattgtatt gttgttccac ttgtatatat acagagacca 240
tttatgttaa tatacaactt cgtatgggga aagatgattc catcaagtcc aaaatgccaa 300
aaccatgcac gatcttgtct gatcaagtat gataagatgt gagattttaa gaacgtgaag 360
cttttcatat tgtattctca atgaacgaag aattaataat tagagttaga aatgcagatt 420
acagagatta cacaatttga tctcatttct tggcaaagag gcccaggcca ccgaagccac 480
cgtccttctt tggattcctg tgtgttaatt ttcgtgtggc tttagttaca aagggattat 540
attgtcagcg aatctgagcc gttggatcgt tttgacatga gctttccata agtgtcttat 600
cctttgtttc tctcattttt cacatatgta tcagacattt aatcaagcac atatctacgt 660
gttgattatg ttgatgatgc tgagattatg ttgatttaga gaatgagtat tggtgatgat 720
ggtacacgtt agtaaacata tgaatttgga agtgccacgt gagagggagc agagttttgg 780
gctttctttt ggttatgtat ttgcattctt gttgtaacaa attctcttat taaaagcatt 840
gtgaaaaaaa ccaaatacca catagtctat gtttcaagat ttgtttttta atactataat 900
tttctattac tttagtttgt gtaatttttg aaaagagaaa attggtattt tttaggattg 960
ggtgatctga aatttgacta caaaaatttt cttggacaca gacacacagt cacacaaata 1020
agctaattat tggaatttta tcttaagttg cattcacttt gcaaattaat attgaattat 1080
agactattag tgtatggcgt gatggcaaac aaaaaaatca gtgtgtgata ttgtggacta 1140
gccaaaaaaa ttttctgatg atttttttgc ctaaataatt tgaattgttg agaccgaaac 1200
tcttactaat atactaacaa tgtaacgcga caaataaaac attgttgaga ataaaatctg 1260
aaccatcata actatagtct atagtaaccg tccgaattca accacatatg tatgatcttt 1320
gccatttttg atcatatttt ccgttgcgtt ttctttgaat tttctcaata tatttttagt 1380
gttttgattt gtacttttat ctaatttata taattgtttt tcaaatgttt cgcaattgtg 1440
cgtttaagta ttcgactcga agtaaaccca gtttcttaga atgggctaac tgccattgac 1500
caaatcttta tccgcgaaga aagatcttta gcagctaggc ttatttcata tcaacaaaag 1560
tatatattta tctctaacta aattcctaca attatttcaa aaacatagaa attaaaattt 1620
gaaatgccta ttcttttttg gttatacatt gcaaaggtta tgtatgtaat ttctgatctt 1680
gaaatttaag ttctttagcc catatctagt tgattttcac gaaatattgt cgtttactct 1740
cgtttttata tataaagcat gtacatataa catataatca atgcttcaaa agaaaaaaat 1800
aatcataact aaattgaaac gggaaaacta atttgctttc gtgttctatt atgccaaact 1860
gtactcacaa tagtcttatc ctatcgaccc aaatttaatc ttcccaacta cttactccta 1920
attgaaacaa aatataacct ttcttactat agcctatatt taaaaaatat ctatgatttc 1980
tacatttata tatatacgca cacggcacat acctctcatt caccatatat gcctcttaac 2040
aatctctcca cagaacaaaa gcaaaaagcc taaaccggga ta 2082
<210> 3
<211> 2010
<212> DNA
<213> 拟南芥
<400> 3
agctcaaacc tttaaatggc ttttaattag atatatttag cgagaatgtg attgctagtg 60
aaatctcaaa cttgatagct tattcatagc ttattttact tcgatcagca agagaacaat 120
ggttcctaaa gctcaaacct tttttggcgt ttgctttaga ttgtgcatac ataaagtgag 180
aagatgaaat atggttttgc tgaaatctca atgtgctcat tcatagttta ttttgctcga 240
cctttcttta atcaatagct ttgatgtact gattacttta taaagttaag aagtaagttc 300
tgctctttaa actgtactga atggaggctt ctctgcataa ttaagcaaac actctgatga 360
ttgagtttcg ttgtacaaag gaaagttttt gccttagtta gaaattcatc ttgtttcttt 420
gcccagaagc tggcttgctg atagaatttg gactacgcta cgttttcttg ggtgaaaaac 480
aatccgcgtc cttccacgag aacagtgaaa ctgtacgatg ttcttattgt attgtgtcaa 540
cagcccataa tcaatgaaat gggcctcaat gacagtataa gccgaaaaat attcgaatgc 600
gatctagaac taatctgaaa ccaaacttct caaatcatta acatttgatt agggcctaaa 660
agtccatccg tattttaaaa aaaagttgat aacaaatgca aaaatacaaa tatacattac 720
tattaaaact caatctttct gattatatgt ggatggagaa gctgttttgc agtgtggatt 780
tgaattttga agttcttgtt caaaaaagaa aagaaacttg gtcaagcttc aaaagaaaga 840
aagaaataaa gacaagtata caaatacgtt gacttcaatt aatatgaaga tagaagagaa 900
agatatagaa atgcgtttta aattggcggt gggagatatg tgattccctt ggtcccgctt 960
tctcgtttga ttcggtaacc taaaccttct ccatccaaga agacacaaac aaggaagaaa 1020
ttaacctacg tacgtacatc atttgaacta cttatatcta ttataaatgg aaaatctatt 1080
ttcttcttct ctctctttta accgaaaaag gaaaagtcct cgaaataact ctttaatata 1140
attcatgtgg aaaccttcta tatatttttt gcatgctttt ttgaaattaa gtaatggcat 1200
actaattaga agaagacgaa aaataatatg tctaagtaat tgagtttcgt ggtcaaggca 1260
aatcaagatt gcattcttta attaagtgta caaattatga tgtaagaacc gttatttggc 1320
ataacctaat atatattaaa aactgatttt tttttttttt aacttctgta agaaatggtt 1380
ttcttaatta ccaatcatga tctattattg taaaatgtgt aattttgtgt tgcgattgaa 1440
gtgttcttag ataaagatat gtcatatgca tgatatcatc tatttgattt tgagaaaata 1500
aaaacataac atgagaacat cgtagagagt aagatacatg acaaagagaa agaataagct 1560
aagaagtcat ccaaaaattg ggaggcctac tctcaactac caaaaataca agtgtttgtt 1620
gtgttaggtc atttattcag tcacctaacc ctaactatat gaaatacgtt aaaattcata 1680
tatagaaaaa taaagaagaa atactattag tcaatataat tttttttaac aaaataaaaa 1740
taaagaaaga aacactatta gtcaatgaat taaaaaaaaa aaaatccatc tttcgatcaa 1800
gaccgtccaa gtattctcct ttcacataac tcttacgttt tacactaaac aagacgagat 1860
ttttatgagc ttgtggctcc cacaacaatc ctcattgatt tctccatata tatcacatga 1920
gaatccaact cgacttcata ctaacattca tcccaaaagt tccattcttt ttcacaaagc 1980
cattgtgctg ttttctccat ttggatcaaa 2010
<210> 4
<211> 2146
<212> DNA
<213> 拟南芥
<400> 4
tgatcgcaaa cgtcaatggt ctatatccat ctcttgggga tacaccattc agatatacac 60
ttacttcttg actgctacgg agctgactac gccgttgcag accttcaaaa cttggcggtc 120
ttccagcgat ggacctttcg tgtttaacac tcggcccttg aaacctgacc cctgtgagcg 180
tccggtcact tatttcatgg atggtgccga ggatgtacgg gatagtggga cgaaaacttg 240
gtatagcata ggggataaga actatggtca ttgcggaaag attgagcata ctcgattaac 300
taaagtgaag aggatattgg tgacttcaat gaagacggat cctgagtatt ggaacaaggt 360
acttagtgtt tgtatatttc tcatattgaa tttaacattt tgggtgagtt taggttacat 420
cttttttttt attttttgct tttgttgata ggcaccgagg agacagtgtt gtgaggtgat 480
ggaaggaaaa gtaggaaaaa gaaaagagaa agaaatgttg ttaaggatta gaaaatgcag 540
atctttggag aagatataaa aaaagcgttt taattagaga gatttttgca catacagatt 600
tagattcgat cattagttat ttgtttctaa attcctcaat tcctagtacc aagagaatga 660
cgattttctc tagtaatact ggcactcttc gtttttcaac atgtaaacat tactttgtat 720
aattagtcta tatcaaataa atagttacaa catgaacgta actatttata cacgagggta 780
aatttttaac aaatttaaac cgaaccaaaa agatttcagt taatcatagt tttgttacaa 840
gcgaaatctg aaatattcac cctcaagttt gttacgtaat tgtctaatct gtgttttttt 900
gtgctagtgt tataattgtt tcctcgaatg ttaagcacca catagaagta tacacttttc 960
ttttattatt ttcgttcttc ttccatttag aaacttttat taattctact gttaaatcca 1020
acgttattag tttattttct ctgatgaagt tctaattttt tttgtttgtt ggaaaaaggg 1080
ttacttttct gatgaagttg ccgatttgtt tccaaccaaa cctcagctaa tatagttagg 1140
gagacggata agaaattgca taaagggaga ggctttgtaa acacgcaagt ttacgtcaac 1200
ttgacacata taaactcgta tataggaatt gtgtaaaatg ttaatcaata tatgtttatg 1260
aatatagtcc ttttatttcc ttaatctata gtcatgttat catcatatcg gcaagaaaat 1320
tactattaca acatatgttt ccgtgcttcg atttgtcgat caggtaggca accaaaccgg 1380
gccagattag tcacaaatga aattaggctc cactttggca agttttttca caattaaaaa 1440
ttagaaagtc taaccaaact aatagaaact gaaccaaaca aaaatgttca cgcaattacg 1500
tagcacttct ctatgaaata ctgtggataa ttcgatttga gctaatctat ggtaagtcgt 1560
ttctctcaaa ctgaattaag ctaaaccaaa ccgaaaataa accgttgtag aacacccata 1620
ataaacatat atatgttctc tactcttatt tggctatttt tccatttgca gatacgtgtg 1680
acaacattcc aaatataggc acatgataca aattacaaag ccagaaatta taatttataa 1740
actatacata ataaggtcag tagcctaatt acatccatat atttagttgg gcataataag 1800
gatagcctaa ttttggtgca tcccgccaaa aattcggaca aatggtgaat ttcaaaccat 1860
gaatttcttt gttatacata cattacgtgc actattacat caaagaaaaa tagtgacgtg 1920
cataaacgta ttttcttcac ataatctata tataatatat acagccatgt acatttttca 1980
acatagaaaa atcatgtata caaatacggt aggtgcaata ctgataaact gccattccca 2040
ttgcattaga cgctagtcaa tccaaacctt ataacataaa aagttatagt ccatttcttt 2100
catatccaat cgagtcaaaa taatattcga gcaaaaaaca aaagaa 2146
<210> 5
<211> 1649
<212> DNA
<213> 拟南芥
<400> 5
ctttcctctg aaacgattct ccacgctctt tgtttataag gattgcaaga aattactgaa 60
gaacatcagg aatcgcgaga gcttggggcg aatcaaaaac ctccattgat gaagaagact 120
gcatctagta ctttacttac tcggtagcac acctccatgg gcaggctcca gcaccatggt 180
tgggcccatt tcttattaat gggcctaaaa tagagcttct agggcctcta tatattttgt 240
cttttctctt ccgtttaggc gttttgctaa ctttcttacg tatatgaatg tgaattatag 300
ttagttaact ttagaactgt tgagcggcca atgccacgtc ctttgtacgt aaattatgtt 360
attcatgcta ttatttatgt accaattttc tattctaata tatattctaa gttttttttg 420
tatcaatact aagtatttat acaatttttg caaattttga cagaaagata gtacaaaaaa 480
tatgaaagac caaaaactac ataaaccacc aaaaattaca acacaaacag aaaacggaaa 540
gaaaactcaa tcgaaaactc tacaagtaga gaccttaaaa gaaacttaga ttccaaacca 600
caaagctcaa atatttgtgt ggtttcctca acttaaaaga tctcaaatac ttatagttgt 660
tgccactagc aatccaaacc taggccagtt ttcaaaatct ctaaaaaaga gcttaccatt 720
ccaaacttag gacaatcctc ataatatttt aaattttatg acatttttta gttttttctt 780
accgaacata gagatacaac gaataacaca aaataccaaa ttttactaaa caaacaatta 840
ctgcacaaat gaaaaagtaa tcaacaacat gagctcattt cacgaaaaaa gaagcgaaaa 900
agccaacggt cttgccacaa attagtatat tgcaaattac aaatgcttaa aaaaattcac 960
agatatattc atcaattata ccttttgatt atcttgcaaa taaatcttcc aattcatatt 1020
acctacgtca aaatttagcc atctaccctt attatcccat tatgaaaatt tcaaaatcga 1080
taagatgaca gacacccaac aacgaattat cattttatat actataggta ttagatacct 1140
acaatttatt tggtttattg ggaatatacg attcataaat tccctcataa aaatataaag 1200
caaatgtgga cggaagcaaa aaaactaaat atagaatgga gagaaattgt attattaact 1260
taggttaccc atcgccaaca acctctcatt tcctttccta aactatttca caattttggt 1320
caaaaacaca atctaacccc aaaaaagatt cgacctttga aattcccaaa accagaagca 1380
aaacccccaa aagaacccta cttatagtga aagaaaagta acataataat atatatacac 1440
gagaaccaag agccacttga atataaagtt cacagttttt gtctgctcac caaatcaaac 1500
caatttctcc tgatagccaa agtttttgtc cccaacaaga aactcatgca acattcttca 1560
cccactagct aactaacgac ttccattctt attaatctct ctcaattctt catttctgag 1620
attcatcgct ctctcttctc tttgtcaca 1649
<210> 6
<211> 2247
<212> DNA
<213> 拟南芥
<400> 6
tctgagacat cattgatatc taacaatcaa aaactaaaaa gtgaagtatt aacattttaa 60
tcagattcaa accagaactt atcagtcatc aaaaatgttg gcaaataaca aatcaaactt 120
aagtttttgg atggagaaag caagctagat tcgaatctct aagaagcgtg gacttggact 180
tgtttacgac ctgaaaagat gtcatgatta tctcatgatt acgagataat aacatgtctt 240
atctactaaa ctaatctaaa aagtagtgag gatgacttga aacttaagtc ttatatgaat 300
tatctttaaa tatagaaaaa gaaaggagat agagaggtgt gtttttcatg tgaacaactt 360
ttttttacct ttagagtact tccagaagac ttattgggtc cttaataaaa gtagaccaaa 420
ttattgaaga gctaaaaaaa aatgcctact caaaatatcc aaacctcttc ttttagcctt 480
ttgttttttt caatattcat actaatgtaa actacaatca ttgtatcatt ctataatcat 540
atgaattttt tgtcaacacc atgcattatg ctagtttaaa tttaggtgat gatataaaga 600
tattttaagt acaaatcaat aggggcgatg ttcttatgtc tttatctaac tttatgaatt 660
tgtgttttat atattatgaa aaattggaaa agaagagatg gcctacgctc aagaccaatt 720
cctaccaatg ggcaatggtg ttgaaatctg aacaaaaaaa tttcctttct ttaacgttag 780
ctttaaagtt caaaaaactt tatttacttt ttcagtgata attctgtata aaataacata 840
taacaatgag gaaaaaactc aataatttga atcgcttatg actttatttc tccaagtgct 900
tgacttttaa aaccctaatg tccaatctca actaaagtca acctttttcg ttcgtctaga 960
agagtcagtc attaagtttc aattgaagta tacagtaaat tattagtact ttttatttta 1020
ttttaaccac agttcattgg ctgtatgaga tttctgttca agaaaacata taaatcgaaa 1080
ccaaagcaaa agacattatt tgcttcggtt tcttctactc aagctcattt ttagtaaaac 1140
taaattgtat tttcattttc ttaaaaagtt aattgttttt tttgtaaaat cagttttacc 1200
aaattggaca caataatgaa tatatgtcta tgtctagttt tttttagctc agaatatatc 1260
ttatgtgaat agaatcgtct atcagatatt tttgtgatgc agatagaact taccgttata 1320
gaatcatttg tagattgttc atcgtgattg ttaagattag attcccattt gtaatataac 1380
agaaactcga aaagtactta tattaagtat taacgatgta tcatgtgacc aaaatagaaa 1440
atactacgta atgatatgat tattaagcga gtgtgtaggt aattcaaata tttcaattaa 1500
tcaatctttg atatcactct ttagagtaat gtattatctt tcttattgtt ttaccctggg 1560
attaataagt ttaccggatc cggagtagaa tttcttcggt ttggcaattt tgttcaccta 1620
ccataacgaa cttttaccct tatacttagt ttcaatctac ttttggtgca tcctttcatt 1680
ttcaactgca aagaagtagt taaaagatcc aatacataat atatttaatt tatcataagt 1740
aacttagtgt aaagaaagac taaagtactt tttaaaatat gtatttgtat ttcccgatgt 1800
gaaagaaaag aaaattgaat ttgcacatat caataatatt agctaggaaa aaacttgtga 1860
gaaatttctt tgacgacttg cgtgtgcaat agtcttcctt atcttctcta ccatttctta 1920
attccactat tgtatagtat ttacttatgt tgaattaata aattaaaaca tttaaatttc 1980
cctaaagtta ctttttgatt tttgattttc tatttttatt acaactttcc tactttttga 2040
catcttttct tacaaagact ttttgacatc tccccctcca gctattatat agtctccttt 2100
tttcttttct gcattcacat aatatttccc ctatatagtt tacacaacat catacccacc 2160
aacatatata atcttgatca tagagagata aacagaggcc gctatcaaga acaagactaa 2220
gaacaagact tcactaggag tacaagt 2247
<210> 7
<211> 11506
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> pFACT::MYB41构建体
<400> 7
agctcgaatt atcatacatg agaattaagg gagtcacgtt atgacccccg ccgatgacgc 60
gggacaagcc gttttacgtt tggaactgac agaaccgcaa cgttgaagga gccactgagc 120
cgcgggtttc tggagtttaa tgagctaagc acatacgtca gaaaccatta ttgcgcgttc 180
aaaagtcgcc taaggtcact atcagctagc aaatatttct tgtcaaaaat gctccactga 240
cgttccataa attcccctcg gtatccaatt agagtctcat attcactctc aactcgatcg 300
aggggatcta ccatgagccc agaacgacgc ccggccgaca tccgccgtgc caccgaggcg 360
gacatgccgg cggtctgcac catcgtcaac cactacatcg agacaagcac ggtcaacttc 420
cgtaccgagc cgcaggaacc gcaggagtgg acggacgacc tcgtccgtct gcgggagcgc 480
tatccctggc tcgtcgccga ggtggacggc gaggtcgccg gcatcgccta cgcgggtccc 540
tggaaggcac gcaacgccta cgactggacg gccgagtcga ccgtgtacgt ctccccccgc 600
caccagcgga cgggactggg ctccacgctc tacacccacc tgctgaagtc cctggaggca 660
cagggcttca agagcgtggt cgctgtcatc gggctgccca acgacccgag cgtgcgcatg 720
cacgaggcgc tcggatatgc cccccgcggc atgctgcggg cggccggctt caagcacggg 780
aactggcatg acgtgggttt ctggcagctg gacttcagcc tgccggtgcc gccccgtccg 840
gtcctgcccg tcaccgaaat ctgatgaccc ctagagtcaa gcagatcgtt caaacatttg 900
gcaataaagt ttcttaagat tgaatcctgt tgccggtctt gcgatgatta tcatataatt 960
tctgttgaat tacgttaagc atgtaataat taacatgtaa tgcatgacgt tatttatgag 1020
atgggttttt atgattagag tcccgcaatt atacatttaa tacgcgatag aaaacaaaat 1080
atagcgcgca aactaggata aattatcgcg cgcggtgtca tctatatgtt actagatcga 1140
ccggcatgca agctgataat tcaattcggc gttaattcag tacattaaaa acgtccgcaa 1200
tgtgttatta agttgtctaa gcgtcaattt gtttacacca caatatatcc tgccaccagc 1260
cagccaacag ctccccgacc ggcagctcgg cacaaaatca ccactcgata caggcagccc 1320
atcagtccgg gacggcgtca gcgggagagc cgttgtaagg cggcagactt tgctcatgtt 1380
accgatgcta ttcggaagaa cggcaactaa gctgccgggt ttgaaacacg gatgatctcg 1440
cggagggtag catgttgatt gtaacgatga cagagcgttg ctgcctgtga tcaattcggg 1500
cacgaaccca gtggacataa gcctcgttcg gttcgtaagc tgtaatgcaa gtagcgtaac 1560
tgccgtcacg caactggtcc agaaccttga ccgaacgcag cggtggtaac ggcgcagtgg 1620
cggttttcat ggcttcttgt tatgacatgt ttttttgggg tacagtctat gcctcgggca 1680
tccaagcagc aagcgcgtta cgccgtgggt cgatgtttga tgttatggag cagcaacgat 1740
gttacgcagc agggcagtcg ccctaaaaca aagttaaaca tcatggggga agcggtgatc 1800
gccgaagtat cgactcaact atcagaggta gttggcgtca tcgagcgcca tctcgaaccg 1860
acgttgctgg ccgtacattt gtacggctcc gcagtggatg gcggcctgaa gccacacagt 1920
gatattgatt tgctggttac ggtgaccgta aggcttgatg aaacaacgcg gcgagctttg 1980
atcaacgacc ttttggaaac ttcggcttcc cctggagaga gcgagattct ccgcgctgta 2040
gaagtcacca ttgttgtgca cgacgacatc attccgtggc gttatccagc taagcgcgaa 2100
ctgcaatttg gagaatggca gcgcaatgac attcttgcag gtatcttcga gccagccacg 2160
atcgacattg atctggctat cttgctgaca aaagcaagag aacatagcgt tgccttggta 2220
ggtccagcgg cggaggaact ctttgatccg gttcctgaac aggatctatt tgaggcgcta 2280
aatgaaacct taacgctatg gaactcgccg cccgactggg ctggcgatga gcgaaatgta 2340
gtgcttacgt tgtcccgcat ttggtacagc gcagtaaccg gcaaaatcgc gccgaaggat 2400
gtcgctgccg actgggcaat ggagcgcctg ccggcccagt atcagcccgt catacttgaa 2460
gctagacagg cttatcttgg acaagaagaa gatcgcttgg cctcgcgcgc agatcagttg 2520
gaagaatttg tccactacgt gaaaggcgag atcaccaagg tagtcggcaa ataatgtcta 2580
gctagaaatt cgttcaagcc gacgccgctt cgccggcgtt aactcaagcg attagatgca 2640
ctaagcacat aattgctcac agccaaacta tcaggtcaag tctgctttta ttatttttaa 2700
gcgtgcataa taagccctac acaaattggg agatatatca tgcatgacca aaatccctta 2760
acgtgagttt tcgttccact gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg 2820
agatcctttt tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac cgctaccagc 2880
ggtggtttgt ttgccggatc aagagctacc aactcttttt ccgaaggtaa ctggcttcag 2940
cagagcgcag ataccaaata ctgtccttct agtgtagccg tagttaggcc accacttcaa 3000
gaactctgta gcaccgccta catacctcgc tctgctaatc ctgttaccag tggctgctgc 3060
cagtggcgat aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac cggataaggc 3120
gcagcggtcg ggctgaacgg ggggttcgtg cacacagccc agcttggagc gaacgaccta 3180
caccgaactg agatacctac agcgtgagct atgagaaagc gccacgcttc ccgaagggag 3240
aaaggcggac aggtatccgg taagcggcag ggtcggaaca ggagagcgca cgagggagct 3300
tccaggggga aacgcctggt atctttatag tcctgtcggg tttcgccacc tctgacttga 3360
gcgtcgattt ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg ccagcaacgc 3420
ggccttttta cggttcctgg ccttttgctg gccttttgct cacatgttct ttcctgcgtt 3480
atcccctgat tctgtggata accgtattac cgcctttgag tgagctgata ccgctcgccg 3540
cagccgaacg accgagcgca gcgagtcagt gagcgaggaa gcggaagagc gcctgatgcg 3600
gtattttctc cttacgcatc tgtgcggtat ttcacaccgc atatggtgca ctctcagtac 3660
aatctgctct gatgccgcat agttaagcca gtatacactc cgctatcgct acgtgactgg 3720
gtcatggctg cgccccgaca cccgccaaca cccgctgacg cgccctgacg ggcttgtctg 3780
ctcccggcat ccgcttacag acaagctgtg accgtctccg ggagctgcat gtgtcagagg 3840
ttttcaccgt catcaccgaa acgcgcgagg cagggtgcct tgatgtgggc gccggcggtc 3900
gagtggcgac ggcgcggctt gtccgcgccc tggtagattg cctggccgta ggccagccat 3960
ttttgagcgg ccagcggccg cgataggccg acgcgaagcg gcggggcgta gggagcgcag 4020
cgaccgaagg gtaggcgctt tttgcagctc ttcggctgtg cgctggccag acagttatgc 4080
acaggccagg cgggttttaa gagttttaat aagttttaaa gagttttagg cggaaaaatc 4140
gccttttttc tcttttatat cagtcactta catgtgtgac cggttcccaa tgtacggctt 4200
tgggttccca atgtacgggt tccggttccc aatgtacggc tttgggttcc caatgtacgt 4260
gctatccaca ggaaagagac cttttcgacc tttttcccct gctagggcaa tttgccctag 4320
catctgctcc gtacattagg aaccggcgga tgcttcgccc tcgatcaggt tgcggtagcg 4380
catgactagg atcgggccag cctgccccgc ctcctccttc aaatcgtact ccggcaggtc 4440
atttgacccg atcagcttgc gcacggtgaa acagaacttc ttgaactctc cggcgctgcc 4500
actgcgttcg tagatcgtct tgaacaacca tctggcttct gccttgcctg cggcgcggcg 4560
tgccaggcgg tagagaaaac ggccgatgcc gggatcgatc aaaaagtaat cggggtgaac 4620
cgtcagcacg tccgggttct tgccttctgt gatctcgcgg tacatccaat cagctagctc 4680
gatctcgatg tactccggcc gcccggtttc gctctttacg atcttgtagc ggctaatcaa 4740
ggcttcaccc tcggataccg tcaccaggcg gccgttcttg gccttcttcg tacgctgcat 4800
ggcaacgtgc gtggtgttta accgaatgca ggtttctacc aggtcgtctt tctgctttcc 4860
gccatcggct cgccggcaga acttgagtac gtccgcaacg tgtggacgga acacgcggcc 4920
gggcttgtct cccttccctt cccggtatcg gttcatggat tcggttagat gggaaaccgc 4980
catcagtacc aggtcgtaat cccacacact ggccatgccg gccggccctg cggaaacctc 5040
tacgtgcccg tctggaagct cgtagcggat cacctcgcca gctcgtcggt cacgcttcga 5100
cagacggaaa acggccacgt ccatgatgct gcgactatcg cgggtgccca cgtcatagag 5160
catcggaacg aaaaaatctg gttgctcgtc gcccttgggc ggcttcctaa tcgacggcgc 5220
accggctgcc ggcggttgcc gggattcttt gcggattcga tcagcggccg cttgccacga 5280
ttcaccgggg cgtgcttctg cctcgatgcg ttgccgctgg gcggcctgcg cggccttcaa 5340
cttctccacc aggtcatcac ccagcgccgc gccgatttgt accgggccgg atggtttgcg 5400
accgtcacgc cgattcctcg ggcttggggg ttccagtgcc attgcagggc cggcagacaa 5460
cccagccgct tacgcctggc caaccgcccg ttcctccaca catggggcat tccacggcgt 5520
cggtgcctgg ttgttcttga ttttccatgc cgcctccttt agccgctaaa attcatctac 5580
tcatttattc atttgctcat ttactctggt agctgcgcga tgtattcaga tagcagctcg 5640
gtaatggtct tgccttggcg taccgcgtac atcttcagct tggtgtgatc ctccgccggc 5700
aactgaaagt tgacccgctt catggctggc gtgtctgcca ggctggccaa cgttgcagcc 5760
ttgctgctgc gtgcgctcgg acggccggca cttagcgtgt ttgtgctttt gctcattttc 5820
tctttacctc attaactcaa atgagttttg atttaatttc agcggccagc gcctggacct 5880
cgcgggcagc gtcgccctcg ggttctgatt caagaacggt tgtgccggcg gcggcagtgc 5940
ctgggtagct cacgcgctgc gtgatacggg actcaagaat gggcagctcg tacccggcca 6000
gcgcctcggc aacctcaccg ccgatgcgcg tgcctttgat cgcccgcgac acgacaaagg 6060
ccgcttgtag ccttccatcc gtgacctcaa tgcgctgctt aaccagctcc accaggtcgg 6120
cggtggccca tatgtcgtaa gggcttggct gcaccggaat cagcacgaag tcggctgcct 6180
tgatcgcgga cacagccaag tccgccgcct ggggcgctcc gtcgatcact acgaagtcgc 6240
gccggccgat ggccttcacg tcgcggtcaa tcgtcgggcg gtcgatgccg acaacggtta 6300
gcggttgatc ttcccgcacg gccgcccaat cgcgggcact gccctgggga tcggaatcga 6360
ctaacagaac atcggccccg gcgagttgca gggcgcgggc tagatgggtt gcgatggtcg 6420
tcttgcctga cccgcctttc tggttaagta cagcgataac cttcatgcgt tccccttgcg 6480
tatttgttta tttactcatc gcatcatata cgcagcgacc gcatgacgca agctgtttta 6540
ctcaaataca catcaccttt ttagacggcg gcgctcggtt tcttcagcgg ccaagctggc 6600
cggccaggcc gccagcttgg catcagacaa accggccagg atttcatgca gccgcacggt 6660
tgagacgtgc gcgggcggct cgaacacgta cccggccgcg atcatctccg cctcgatctc 6720
ttcggtaatg aaaaacggtt cgtcctggcc gtcctggtgc ggtttcatgc ttgttcctct 6780
tggcgttcat tctcggcggc cgccagggcg tcggcctcgg tcaatgcgtc ctcacggaag 6840
gcaccgcgcc gcctggcctc ggtgggcgtc acttcctcgc tgcgctcaag tgcgcggtac 6900
agggtcgagc gatgcacgcc aagcagtgca gccgcctctt tcacggtgcg gccttcctgg 6960
tcgatcagct cgcgggcgtg cgcgatctgt gccggggtga gggtagggcg ggggccaaac 7020
ttcacgcctc gggccttggc ggcctcgcgc ccgctccggg tgcggtcgat gattagggaa 7080
cgctcgaact cggcaatgcc ggcgaacacg gtcaacacca tgcggccggc cggcgtggtg 7140
gtgtcggccc acggctctgc caggctacgc aggcccgcgc cggcctcctg gatgcgctcg 7200
gcaatgtcca gtaggtcgcg ggtgctgcgg gccaggcggt ctagcctggt cactgtcaca 7260
acgtcgccag ggcgtaggtg gtcaagcatc ctggccagct ccgggcggtc gcgcctggtg 7320
ccggtgatct tctcggaaaa cagcttggtg cagccggccg cgtgcagttc ggcccgttgg 7380
ttggtcaagt cctggtcgtc ggtgctgacg cgggcatagc ccagcaggcc agcggcggcg 7440
ctcttgttca tggcgtaatg tctccggttc tagtcgcaag tattctactt tatgcgacta 7500
aaacacgcga caagaaaacg ccaggaaaag ggcagggcgg cagcctgtcg cgtaacttag 7560
gacttgtgcg acatgtcgtt ttcagaagac ggctgcactg aacgtcagaa gccgactgca 7620
ctatagcagc ggaggggttg gatcaaagta ctttgatccc gaggggaacc ctgtggttgg 7680
catgcacata caaatggacg aacggataaa ccttttcacg cccttttaaa tatccgttat 7740
tctaataaac gctcttttct cttaggttta cccgccaata tatcctgtca aacactgata 7800
gtttaaactg aaggcgggaa acgacaatct gatccaagct caagctaagc ttgggcccga 7860
gcggataaca atttcacaca ggaaacagct atgaccatga ttacgccaag ctatcaactt 7920
tgtatagaaa agttgtaggt taagagtttc gttttccttc gttcaaaatc taatgtgaag 7980
gaaagcaaaa ctgacacaac ttttgtgtga accagagcaa gtgaaagtgt gtcgaatctg 8040
tacttttgta ctgtgtaatc tctatagtct gactctcatt atgtagtttt aagtgtcttt 8100
tacttgtgta gctgttacct gttacctgtt aggttttcta atccttgttt tatttgatag 8160
ccagatactt tagggaattt tacttcttct tttcttgggt ttaatttaag acatattcgt 8220
atatttcatt taattctgtt atctgatttg tgagatcatg aaaacgaatg ttgaacttga 8280
aacttgagtg ggttcagaaa aactactctg tattaaaaat cccagtgtca catgataatg 8340
atccttcagt aaaggtagac atagcttttt tgcagtgtga tatgcacaaa tacaatctat 8400
atttttatgt aaaagatata tttctttgaa agtacttata aaaatatgtt tttcataaaa 8460
aaaattatat gtaattctga aagtatgtga tatgcacaag cacaacctat atttcctaca 8520
ttcaaattcg ggtttttctt gacgccaagt tacattcaat tatcaataat agggctagtt 8580
caactaatgc tatttattta tacaatccac ccactactaa atctcaatct ccaaggatct 8640
ttatatatta ataagaaaag ctactatcca aatgcgacct tgttcgtgaa gtgtttggtt 8700
tataatttgg tggcttaaga ctatagccca ccattgaccc aaaaaaagaa aggaaaatta 8760
atagtagact atatagctac caactcccta taatttacct tgaaattaaa ccagctttgt 8820
atttttttaa tagaagtcag ggctctacag tttcatttta aacttttttt tttgttatat 8880
tacatcctgc aggttagttg taatttgtaa acgtaatcaa cataataaaa ccatttacat 8940
agactgatta aagttgattc catttgataa tatttagcta tttatatatc aatcaaccac 9000
cagctcttaa atatatgtat tcaaattgtt ttgttgactc tttttgctac actttaaatt 9060
tgaatctaga atgttgtcct gaaacaaaaa tctgtggatt gaacaaaatt atacaccagg 9120
taaaattttg aagtttttaa aagcaggatc acatactcct aattttagat tggatagatc 9180
tagtataaaa atatgaagtt tttttcccaa aaaataataa taccatttag ctcttaatta 9240
aatgcatgca aactaaagat aaaaagagga attattttaa ccattctaac tcgtcacaac 9300
atgcctaatc attccaggtt aattttagag ttttcaaatc gtcatattaa catgtgatcc 9360
tgaagactct tctcttcttt cttctaccat tagctgaaat ctttacttgt accacaatta 9420
acctcaaacc ctagccccta aatcccccta gaaatcaatc catcctcagt tctccaaaaa 9480
gatatctttg gtttttcttc actgacaaaa cccctaaaaa caagtttgta caaaaaagca 9540
ggctccatgg gaagatcacc ttgttgtgat aaaaatggag tgaagaaggg accatggact 9600
gctgaggagg atcagaaact catcgattat attcgatttc atggtcctgg caattggcgt 9660
acgctcccca aaaatgctgg tacgtataaa ctacacaccg ttccttatat tttgttctca 9720
tagattaata tatatgttct ctatttattg agtcacacac ttataagtcg tattgtacaa 9780
attaaaggac tccatagatg tggaaaaagc tgccgtcttc gatggaccaa ttatctaaga 9840
ccggacatca agagaggaag attctcgttc gaggaagaag aaactatcat tcagctacac 9900
agtgttatgg gaaacaagta agcctgatca ttcacaccat aatttttgtc tgaaattcat 9960
attcatcagc tacatgcttt tgtatgttaa ttaatgtaaa actcaaaaag ggagagtgta 10020
cgtttgcatg cgggggtaca tgtcaaatgt aggccatcaa ctccaataaa ctattattag 10080
tactttacta gtacgtattg acctatatta gaataataat aaaggagttt tgtattgatc 10140
atagattaat gtcactaata ttgaattgat gaatattagg tggtcagcaa tagccgctcg 10200
tctaccaggg aggaccgata acgaaataaa aaaccattgg aacactcaca tccgcaagag 10260
acttgtaagg agtggtatcg accctgttac tcattctcca cgccttgatc ttcttgattt 10320
gtcctcactt ttgagtgcac ttttcaacca gccaaacttt tcagcagttg caacacatgc 10380
gtcttctctt cttaatcctg atgtattgag gttggcctct ctactactgc cacttcaaaa 10440
ccctaatcca gtttacccat cgaacctcga ccaaaatctt caaactccaa atacatcatc 10500
agaatcgtct caaccacaag ctgagactag tacagtccca acaaactatg aaacttcatc 10560
attggagcct atgaacgcaa gactcgacga cgttggtctt gcagatgtat taccaccttt 10620
gtcagagagt tttgacttag actcgctcat gtcaacgcca atgtcttctc cacgacaaaa 10680
tagcattgaa gcagaaacca actccagcac tttcttcgac tttggaattc cggaagattt 10740
catcttagat gactttatgt ttgacccagc tttcttgtac aaagtggcct aattttcaac 10800
atttgcatac acatgtcttg ctttcacaca tatgattctt tgttgcattc tttcttttgt 10860
ttgatgtata aatttcttgt ttttattctc tcaaaagata ttaagttatt agtctataaa 10920
attttcatga atgtttatgt attatctgct taggcgagat atctaaattc tgctccatta 10980
gtccatatac acagttgacg gaagcaaaca tagaattatt agcgtcaaac acatcacata 11040
ttcatattgc tttgttcgaa tcatcgtcaa tcaagttaat cagtttatgc gagttctatc 11100
atttaggccc aattcaaggc ccaattcaag ttcattttaa agccgttaat ttggccagca 11160
actttattat acatagttga taattcactg gccgtcgttt tacaacgtcg tgactgggaa 11220
aacgatctaa ctgactagcc gcggccatgg cggccgggag cggccatgct agagtccgca 11280
aaaatcacca gtctctctct acaaatctat ctctctctat ttttctccag aataatgtgt 11340
gagtagttcc cagataaggg aattagggtt cttatagggt ttcgctcatg tgttgagcat 11400
ataagaaacc cttagtatgt atttgtattt gtaaaatact tctatcaata aaatttctaa 11460
ttcctaaaac caaaatccag tgacctgcag gtcgaccata tgggag 11506
<210> 8
<211> 12006
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> proHORST::MYB41构建体
<400> 8
agctcgaatt atcatacatg agaattaagg gagtcacgtt atgacccccg ccgatgacgc 60
gggacaagcc gttttacgtt tggaactgac agaaccgcaa cgttgaagga gccactgagc 120
cgcgggtttc tggagtttaa tgagctaagc acatacgtca gaaaccatta ttgcgcgttc 180
aaaagtcgcc taaggtcact atcagctagc aaatatttct tgtcaaaaat gctccactga 240
cgttccataa attcccctcg gtatccaatt agagtctcat attcactctc aactcgatcg 300
aggggatcta ccatgagccc agaacgacgc ccggccgaca tccgccgtgc caccgaggcg 360
gacatgccgg cggtctgcac catcgtcaac cactacatcg agacaagcac ggtcaacttc 420
cgtaccgagc cgcaggaacc gcaggagtgg acggacgacc tcgtccgtct gcgggagcgc 480
tatccctggc tcgtcgccga ggtggacggc gaggtcgccg gcatcgccta cgcgggtccc 540
tggaaggcac gcaacgccta cgactggacg gccgagtcga ccgtgtacgt ctccccccgc 600
caccagcgga cgggactggg ctccacgctc tacacccacc tgctgaagtc cctggaggca 660
cagggcttca agagcgtggt cgctgtcatc gggctgccca acgacccgag cgtgcgcatg 720
cacgaggcgc tcggatatgc cccccgcggc atgctgcggg cggccggctt caagcacggg 780
aactggcatg acgtgggttt ctggcagctg gacttcagcc tgccggtgcc gccccgtccg 840
gtcctgcccg tcaccgaaat ctgatgaccc ctagagtcaa gcagatcgtt caaacatttg 900
gcaataaagt ttcttaagat tgaatcctgt tgccggtctt gcgatgatta tcatataatt 960
tctgttgaat tacgttaagc atgtaataat taacatgtaa tgcatgacgt tatttatgag 1020
atgggttttt atgattagag tcccgcaatt atacatttaa tacgcgatag aaaacaaaat 1080
atagcgcgca aactaggata aattatcgcg cgcggtgtca tctatatgtt actagatcga 1140
ccggcatgca agctgataat tcaattcggc gttaattcag tacattaaaa acgtccgcaa 1200
tgtgttatta agttgtctaa gcgtcaattt gtttacacca caatatatcc tgccaccagc 1260
cagccaacag ctccccgacc ggcagctcgg cacaaaatca ccactcgata caggcagccc 1320
atcagtccgg gacggcgtca gcgggagagc cgttgtaagg cggcagactt tgctcatgtt 1380
accgatgcta ttcggaagaa cggcaactaa gctgccgggt ttgaaacacg gatgatctcg 1440
cggagggtag catgttgatt gtaacgatga cagagcgttg ctgcctgtga tcaattcggg 1500
cacgaaccca gtggacataa gcctcgttcg gttcgtaagc tgtaatgcaa gtagcgtaac 1560
tgccgtcacg caactggtcc agaaccttga ccgaacgcag cggtggtaac ggcgcagtgg 1620
cggttttcat ggcttcttgt tatgacatgt ttttttgggg tacagtctat gcctcgggca 1680
tccaagcagc aagcgcgtta cgccgtgggt cgatgtttga tgttatggag cagcaacgat 1740
gttacgcagc agggcagtcg ccctaaaaca aagttaaaca tcatggggga agcggtgatc 1800
gccgaagtat cgactcaact atcagaggta gttggcgtca tcgagcgcca tctcgaaccg 1860
acgttgctgg ccgtacattt gtacggctcc gcagtggatg gcggcctgaa gccacacagt 1920
gatattgatt tgctggttac ggtgaccgta aggcttgatg aaacaacgcg gcgagctttg 1980
atcaacgacc ttttggaaac ttcggcttcc cctggagaga gcgagattct ccgcgctgta 2040
gaagtcacca ttgttgtgca cgacgacatc attccgtggc gttatccagc taagcgcgaa 2100
ctgcaatttg gagaatggca gcgcaatgac attcttgcag gtatcttcga gccagccacg 2160
atcgacattg atctggctat cttgctgaca aaagcaagag aacatagcgt tgccttggta 2220
ggtccagcgg cggaggaact ctttgatccg gttcctgaac aggatctatt tgaggcgcta 2280
aatgaaacct taacgctatg gaactcgccg cccgactggg ctggcgatga gcgaaatgta 2340
gtgcttacgt tgtcccgcat ttggtacagc gcagtaaccg gcaaaatcgc gccgaaggat 2400
gtcgctgccg actgggcaat ggagcgcctg ccggcccagt atcagcccgt catacttgaa 2460
gctagacagg cttatcttgg acaagaagaa gatcgcttgg cctcgcgcgc agatcagttg 2520
gaagaatttg tccactacgt gaaaggcgag atcaccaagg tagtcggcaa ataatgtcta 2580
gctagaaatt cgttcaagcc gacgccgctt cgccggcgtt aactcaagcg attagatgca 2640
ctaagcacat aattgctcac agccaaacta tcaggtcaag tctgctttta ttatttttaa 2700
gcgtgcataa taagccctac acaaattggg agatatatca tgcatgacca aaatccctta 2760
acgtgagttt tcgttccact gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg 2820
agatcctttt tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac cgctaccagc 2880
ggtggtttgt ttgccggatc aagagctacc aactcttttt ccgaaggtaa ctggcttcag 2940
cagagcgcag ataccaaata ctgtccttct agtgtagccg tagttaggcc accacttcaa 3000
gaactctgta gcaccgccta catacctcgc tctgctaatc ctgttaccag tggctgctgc 3060
cagtggcgat aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac cggataaggc 3120
gcagcggtcg ggctgaacgg ggggttcgtg cacacagccc agcttggagc gaacgaccta 3180
caccgaactg agatacctac agcgtgagct atgagaaagc gccacgcttc ccgaagggag 3240
aaaggcggac aggtatccgg taagcggcag ggtcggaaca ggagagcgca cgagggagct 3300
tccaggggga aacgcctggt atctttatag tcctgtcggg tttcgccacc tctgacttga 3360
gcgtcgattt ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg ccagcaacgc 3420
ggccttttta cggttcctgg ccttttgctg gccttttgct cacatgttct ttcctgcgtt 3480
atcccctgat tctgtggata accgtattac cgcctttgag tgagctgata ccgctcgccg 3540
cagccgaacg accgagcgca gcgagtcagt gagcgaggaa gcggaagagc gcctgatgcg 3600
gtattttctc cttacgcatc tgtgcggtat ttcacaccgc atatggtgca ctctcagtac 3660
aatctgctct gatgccgcat agttaagcca gtatacactc cgctatcgct acgtgactgg 3720
gtcatggctg cgccccgaca cccgccaaca cccgctgacg cgccctgacg ggcttgtctg 3780
ctcccggcat ccgcttacag acaagctgtg accgtctccg ggagctgcat gtgtcagagg 3840
ttttcaccgt catcaccgaa acgcgcgagg cagggtgcct tgatgtgggc gccggcggtc 3900
gagtggcgac ggcgcggctt gtccgcgccc tggtagattg cctggccgta ggccagccat 3960
ttttgagcgg ccagcggccg cgataggccg acgcgaagcg gcggggcgta gggagcgcag 4020
cgaccgaagg gtaggcgctt tttgcagctc ttcggctgtg cgctggccag acagttatgc 4080
acaggccagg cgggttttaa gagttttaat aagttttaaa gagttttagg cggaaaaatc 4140
gccttttttc tcttttatat cagtcactta catgtgtgac cggttcccaa tgtacggctt 4200
tgggttccca atgtacgggt tccggttccc aatgtacggc tttgggttcc caatgtacgt 4260
gctatccaca ggaaagagac cttttcgacc tttttcccct gctagggcaa tttgccctag 4320
catctgctcc gtacattagg aaccggcgga tgcttcgccc tcgatcaggt tgcggtagcg 4380
catgactagg atcgggccag cctgccccgc ctcctccttc aaatcgtact ccggcaggtc 4440
atttgacccg atcagcttgc gcacggtgaa acagaacttc ttgaactctc cggcgctgcc 4500
actgcgttcg tagatcgtct tgaacaacca tctggcttct gccttgcctg cggcgcggcg 4560
tgccaggcgg tagagaaaac ggccgatgcc gggatcgatc aaaaagtaat cggggtgaac 4620
cgtcagcacg tccgggttct tgccttctgt gatctcgcgg tacatccaat cagctagctc 4680
gatctcgatg tactccggcc gcccggtttc gctctttacg atcttgtagc ggctaatcaa 4740
ggcttcaccc tcggataccg tcaccaggcg gccgttcttg gccttcttcg tacgctgcat 4800
ggcaacgtgc gtggtgttta accgaatgca ggtttctacc aggtcgtctt tctgctttcc 4860
gccatcggct cgccggcaga acttgagtac gtccgcaacg tgtggacgga acacgcggcc 4920
gggcttgtct cccttccctt cccggtatcg gttcatggat tcggttagat gggaaaccgc 4980
catcagtacc aggtcgtaat cccacacact ggccatgccg gccggccctg cggaaacctc 5040
tacgtgcccg tctggaagct cgtagcggat cacctcgcca gctcgtcggt cacgcttcga 5100
cagacggaaa acggccacgt ccatgatgct gcgactatcg cgggtgccca cgtcatagag 5160
catcggaacg aaaaaatctg gttgctcgtc gcccttgggc ggcttcctaa tcgacggcgc 5220
accggctgcc ggcggttgcc gggattcttt gcggattcga tcagcggccg cttgccacga 5280
ttcaccgggg cgtgcttctg cctcgatgcg ttgccgctgg gcggcctgcg cggccttcaa 5340
cttctccacc aggtcatcac ccagcgccgc gccgatttgt accgggccgg atggtttgcg 5400
accgtcacgc cgattcctcg ggcttggggg ttccagtgcc attgcagggc cggcagacaa 5460
cccagccgct tacgcctggc caaccgcccg ttcctccaca catggggcat tccacggcgt 5520
cggtgcctgg ttgttcttga ttttccatgc cgcctccttt agccgctaaa attcatctac 5580
tcatttattc atttgctcat ttactctggt agctgcgcga tgtattcaga tagcagctcg 5640
gtaatggtct tgccttggcg taccgcgtac atcttcagct tggtgtgatc ctccgccggc 5700
aactgaaagt tgacccgctt catggctggc gtgtctgcca ggctggccaa cgttgcagcc 5760
ttgctgctgc gtgcgctcgg acggccggca cttagcgtgt ttgtgctttt gctcattttc 5820
tctttacctc attaactcaa atgagttttg atttaatttc agcggccagc gcctggacct 5880
cgcgggcagc gtcgccctcg ggttctgatt caagaacggt tgtgccggcg gcggcagtgc 5940
ctgggtagct cacgcgctgc gtgatacggg actcaagaat gggcagctcg tacccggcca 6000
gcgcctcggc aacctcaccg ccgatgcgcg tgcctttgat cgcccgcgac acgacaaagg 6060
ccgcttgtag ccttccatcc gtgacctcaa tgcgctgctt aaccagctcc accaggtcgg 6120
cggtggccca tatgtcgtaa gggcttggct gcaccggaat cagcacgaag tcggctgcct 6180
tgatcgcgga cacagccaag tccgccgcct ggggcgctcc gtcgatcact acgaagtcgc 6240
gccggccgat ggccttcacg tcgcggtcaa tcgtcgggcg gtcgatgccg acaacggtta 6300
gcggttgatc ttcccgcacg gccgcccaat cgcgggcact gccctgggga tcggaatcga 6360
ctaacagaac atcggccccg gcgagttgca gggcgcgggc tagatgggtt gcgatggtcg 6420
tcttgcctga cccgcctttc tggttaagta cagcgataac cttcatgcgt tccccttgcg 6480
tatttgttta tttactcatc gcatcatata cgcagcgacc gcatgacgca agctgtttta 6540
ctcaaataca catcaccttt ttagacggcg gcgctcggtt tcttcagcgg ccaagctggc 6600
cggccaggcc gccagcttgg catcagacaa accggccagg atttcatgca gccgcacggt 6660
tgagacgtgc gcgggcggct cgaacacgta cccggccgcg atcatctccg cctcgatctc 6720
ttcggtaatg aaaaacggtt cgtcctggcc gtcctggtgc ggtttcatgc ttgttcctct 6780
tggcgttcat tctcggcggc cgccagggcg tcggcctcgg tcaatgcgtc ctcacggaag 6840
gcaccgcgcc gcctggcctc ggtgggcgtc acttcctcgc tgcgctcaag tgcgcggtac 6900
agggtcgagc gatgcacgcc aagcagtgca gccgcctctt tcacggtgcg gccttcctgg 6960
tcgatcagct cgcgggcgtg cgcgatctgt gccggggtga gggtagggcg ggggccaaac 7020
ttcacgcctc gggccttggc ggcctcgcgc ccgctccggg tgcggtcgat gattagggaa 7080
cgctcgaact cggcaatgcc ggcgaacacg gtcaacacca tgcggccggc cggcgtggtg 7140
gtgtcggccc acggctctgc caggctacgc aggcccgcgc cggcctcctg gatgcgctcg 7200
gcaatgtcca gtaggtcgcg ggtgctgcgg gccaggcggt ctagcctggt cactgtcaca 7260
acgtcgccag ggcgtaggtg gtcaagcatc ctggccagct ccgggcggtc gcgcctggtg 7320
ccggtgatct tctcggaaaa cagcttggtg cagccggccg cgtgcagttc ggcccgttgg 7380
ttggtcaagt cctggtcgtc ggtgctgacg cgggcatagc ccagcaggcc agcggcggcg 7440
ctcttgttca tggcgtaatg tctccggttc tagtcgcaag tattctactt tatgcgacta 7500
aaacacgcga caagaaaacg ccaggaaaag ggcagggcgg cagcctgtcg cgtaacttag 7560
gacttgtgcg acatgtcgtt ttcagaagac ggctgcactg aacgtcagaa gccgactgca 7620
ctatagcagc ggaggggttg gatcaaagta ctttgatccc gaggggaacc ctgtggttgg 7680
catgcacata caaatggacg aacggataaa ccttttcacg cccttttaaa tatccgttat 7740
tctaataaac gctcttttct cttaggttta cccgccaata tatcctgtca aacactgata 7800
gtttaaactg aaggcgggaa acgacaatct gatccaagct caagctaagc ttgggcccga 7860
gcggataaca atttcacaca ggaaacagct atgaccatga ttacgccaag ctatcaactt 7920
tgtatagaaa agttgcccat ctacaaagcc tataaaatgg aaagatgtat gcatcgatga 7980
tgattctgcc tcacttagaa gaatcaaaaa gctaaaagga gctgcgaatc ctgggcaacg 8040
atgacttagt atgtatagaa gaaaaaaaaa gcttttactt ggtatcaaac agagcatgtg 8100
ttgttgtatt tgctaccttt ttctgcaaag ttattggcaa ttgtattgtt gttccacttg 8160
tatatataca gagaccattt atgttaatat acaacttcgt atggggaaag atgattccat 8220
caagtccaaa atgccaaaac catgcacgat cttgtctgat caagtatgat aagatgtgag 8280
attttaagaa cgtgaagctt ttcatattgt attctcaatg aacgaagaat taataattag 8340
agttagaaat gcagattaca gagattacac aatttgatct catttcttgg caaagaggcc 8400
caggccaccg aagccaccgt ccttctttgg attcctgtgt gttaattttc gtgtggcttt 8460
agttacaaag ggattatatt gtcagcgaat ctgagccgtt ggatcgtttt gacatgagct 8520
ttccataagt gtcttatcct ttgtttctct catttttcac atatgtatca gacatttaat 8580
caagcacata tctacgtgtt gattatgttg atgatgctga gattatgttg atttagagaa 8640
tgagtattgg tgatgatggt acacgttagt aaacatatga atttggaagt gccacgtgag 8700
agggagcaga gttttgggct ttcttttggt tatgtatttg cattcttgtt gtaacaaatt 8760
ctcttattaa aagcattgtg aaaaaaacca aataccacat agtctatgtt tcaagatttg 8820
ttttttaata ctataatttt ctattacttt agtttgtgta atttttgaaa agagaaaatt 8880
ggtatttttt aggattgggt gatctgaaat ttgactacaa aaattttctt ggacacagac 8940
acacagtcac acaaataagc taattattgg aattttatct taagttgcat tcactttgca 9000
aattaatatt gaattataga ctattagtgt atggcgtgat ggcaaacaaa aaaatcagtg 9060
tgtgatattg tggactagcc aaaaaaattt tctgatgatt tttttgccta aataatttga 9120
attgttgaga ccgaaactct tactaatata ctaacaatgt aacgcgacaa ataaaacatt 9180
gttgagaata aaatctgaac catcataact atagtctata gtaaccgtcc gaattcaacc 9240
acatatgtat gatctttgcc atttttgatc atattttccg ttgcgttttc tttgaatttt 9300
ctcaatatat ttttagtgtt ttgatttgta cttttatcta atttatataa ttgtttttca 9360
aatgtttcgc aattgtgcgt ttaagtattc gactcgaagt aaacccagtt tcttagaatg 9420
ggctaactgc cattgaccaa atctttatcc gcgaagaaag atctttagca gctaggctta 9480
tttcatatca acaaaagtat atatttatct ctaactaaat tcctacaatt atttcaaaaa 9540
catagaaatt aaaatttgaa atgcctattc ttttttggtt atacattgca aaggttatgt 9600
atgtaatttc tgatcttgaa atttaagttc tttagcccat atctagttga ttttcacgaa 9660
atattgtcgt ttactctcgt ttttatatat aaagcatgta catataacat ataatcaatg 9720
cttcaaaaga aaaaaataat cataactaaa ttgaaacggg aaaactaatt tgctttcgtg 9780
ttctattatg ccaaactgta ctcacaatag tcttatccta tcgacccaaa tttaatcttc 9840
ccaactactt actcctaatt gaaacaaaat ataacctttc ttactatagc ctatatttaa 9900
aaaatatcta tgatttctac atttatatat atacgcacac ggcacatacc tctcattcac 9960
catatatgcc tcttaacaat ctctccacag aacaaaagca aaaagcctaa accgggatag 10020
caagtttgta caaaaaagca ggctccatgg gaagatcacc ttgttgtgat aaaaatggag 10080
tgaagaaggg accatggact gctgaggagg atcagaaact catcgattat attcgatttc 10140
atggtcctgg caattggcgt acgctcccca aaaatgctgg tacgtataaa ctacacaccg 10200
ttccttatat tttgttctca tagattaata tatatgttct ctatttattg agtcacacac 10260
ttataagtcg tattgtacaa attaaaggac tccatagatg tggaaaaagc tgccgtcttc 10320
gatggaccaa ttatctaaga ccggacatca agagaggaag attctcgttc gaggaagaag 10380
aaactatcat tcagctacac agtgttatgg gaaacaagta agcctgatca ttcacaccat 10440
aatttttgtc tgaaattcat attcatcagc tacatgcttt tgtatgttaa ttaatgtaaa 10500
actcaaaaag ggagagtgta cgtttgcatg cgggggtaca tgtcaaatgt aggccatcaa 10560
ctccaataaa ctattattag tactttacta gtacgtattg acctatatta gaataataat 10620
aaaggagttt tgtattgatc atagattaat gtcactaata ttgaattgat gaatattagg 10680
tggtcagcaa tagccgctcg tctaccaggg aggaccgata acgaaataaa aaaccattgg 10740
aacactcaca tccgcaagag acttgtaagg agtggtatcg accctgttac tcattctcca 10800
cgccttgatc ttcttgattt gtcctcactt ttgagtgcac ttttcaacca gccaaacttt 10860
tcagcagttg caacacatgc gtcttctctt cttaatcctg atgtattgag gttggcctct 10920
ctactactgc cacttcaaaa ccctaatcca gtttacccat cgaacctcga ccaaaatctt 10980
caaactccaa atacatcatc agaatcgtct caaccacaag ctgagactag tacagtccca 11040
acaaactatg aaacttcatc attggagcct atgaacgcaa gactcgacga cgttggtctt 11100
gcagatgtat taccaccttt gtcagagagt tttgacttag actcgctcat gtcaacgcca 11160
atgtcttctc cacgacaaaa tagcattgaa gcagaaacca actccagcac tttcttcgac 11220
tttggaattc cggaagattt catcttagat gactttatgt ttgacccagc tttcttgtac 11280
aaagtggcct aattttcaac atttgcatac acatgtcttg ctttcacaca tatgattctt 11340
tgttgcattc tttcttttgt ttgatgtata aatttcttgt ttttattctc tcaaaagata 11400
ttaagttatt agtctataaa attttcatga atgtttatgt attatctgct taggcgagat 11460
atctaaattc tgctccatta gtccatatac acagttgacg gaagcaaaca tagaattatt 11520
agcgtcaaac acatcacata ttcatattgc tttgttcgaa tcatcgtcaa tcaagttaat 11580
cagtttatgc gagttctatc atttaggccc aattcaaggc ccaattcaag ttcattttaa 11640
agccgttaat ttggccagca actttattat acatagttga taattcactg gccgtcgttt 11700
tacaacgtcg tgactgggaa aacgatctaa ctgactagcc gcggccatgg cggccgggag 11760
cggccatgct agagtccgca aaaatcacca gtctctctct acaaatctat ctctctctat 11820
ttttctccag aataatgtgt gagtagttcc cagataaggg aattagggtt cttatagggt 11880
ttcgctcatg tgttgagcat ataagaaacc cttagtatgt atttgtattt gtaaaatact 11940
tctatcaata aaatttctaa ttcctaaaac caaaatccag tgacctgcag gtcgaccata 12000
tgggag 12006
<210> 9
<211> 11934
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> proASFT::MYB41构建体
<400> 9
agctcgaatt atcatacatg agaattaagg gagtcacgtt atgacccccg ccgatgacgc 60
gggacaagcc gttttacgtt tggaactgac agaaccgcaa cgttgaagga gccactgagc 120
cgcgggtttc tggagtttaa tgagctaagc acatacgtca gaaaccatta ttgcgcgttc 180
aaaagtcgcc taaggtcact atcagctagc aaatatttct tgtcaaaaat gctccactga 240
cgttccataa attcccctcg gtatccaatt agagtctcat attcactctc aactcgatcg 300
aggggatcta ccatgagccc agaacgacgc ccggccgaca tccgccgtgc caccgaggcg 360
gacatgccgg cggtctgcac catcgtcaac cactacatcg agacaagcac ggtcaacttc 420
cgtaccgagc cgcaggaacc gcaggagtgg acggacgacc tcgtccgtct gcgggagcgc 480
tatccctggc tcgtcgccga ggtggacggc gaggtcgccg gcatcgccta cgcgggtccc 540
tggaaggcac gcaacgccta cgactggacg gccgagtcga ccgtgtacgt ctccccccgc 600
caccagcgga cgggactggg ctccacgctc tacacccacc tgctgaagtc cctggaggca 660
cagggcttca agagcgtggt cgctgtcatc gggctgccca acgacccgag cgtgcgcatg 720
cacgaggcgc tcggatatgc cccccgcggc atgctgcggg cggccggctt caagcacggg 780
aactggcatg acgtgggttt ctggcagctg gacttcagcc tgccggtgcc gccccgtccg 840
gtcctgcccg tcaccgaaat ctgatgaccc ctagagtcaa gcagatcgtt caaacatttg 900
gcaataaagt ttcttaagat tgaatcctgt tgccggtctt gcgatgatta tcatataatt 960
tctgttgaat tacgttaagc atgtaataat taacatgtaa tgcatgacgt tatttatgag 1020
atgggttttt atgattagag tcccgcaatt atacatttaa tacgcgatag aaaacaaaat 1080
atagcgcgca aactaggata aattatcgcg cgcggtgtca tctatatgtt actagatcga 1140
ccggcatgca agctgataat tcaattcggc gttaattcag tacattaaaa acgtccgcaa 1200
tgtgttatta agttgtctaa gcgtcaattt gtttacacca caatatatcc tgccaccagc 1260
cagccaacag ctccccgacc ggcagctcgg cacaaaatca ccactcgata caggcagccc 1320
atcagtccgg gacggcgtca gcgggagagc cgttgtaagg cggcagactt tgctcatgtt 1380
accgatgcta ttcggaagaa cggcaactaa gctgccgggt ttgaaacacg gatgatctcg 1440
cggagggtag catgttgatt gtaacgatga cagagcgttg ctgcctgtga tcaattcggg 1500
cacgaaccca gtggacataa gcctcgttcg gttcgtaagc tgtaatgcaa gtagcgtaac 1560
tgccgtcacg caactggtcc agaaccttga ccgaacgcag cggtggtaac ggcgcagtgg 1620
cggttttcat ggcttcttgt tatgacatgt ttttttgggg tacagtctat gcctcgggca 1680
tccaagcagc aagcgcgtta cgccgtgggt cgatgtttga tgttatggag cagcaacgat 1740
gttacgcagc agggcagtcg ccctaaaaca aagttaaaca tcatggggga agcggtgatc 1800
gccgaagtat cgactcaact atcagaggta gttggcgtca tcgagcgcca tctcgaaccg 1860
acgttgctgg ccgtacattt gtacggctcc gcagtggatg gcggcctgaa gccacacagt 1920
gatattgatt tgctggttac ggtgaccgta aggcttgatg aaacaacgcg gcgagctttg 1980
atcaacgacc ttttggaaac ttcggcttcc cctggagaga gcgagattct ccgcgctgta 2040
gaagtcacca ttgttgtgca cgacgacatc attccgtggc gttatccagc taagcgcgaa 2100
ctgcaatttg gagaatggca gcgcaatgac attcttgcag gtatcttcga gccagccacg 2160
atcgacattg atctggctat cttgctgaca aaagcaagag aacatagcgt tgccttggta 2220
ggtccagcgg cggaggaact ctttgatccg gttcctgaac aggatctatt tgaggcgcta 2280
aatgaaacct taacgctatg gaactcgccg cccgactggg ctggcgatga gcgaaatgta 2340
gtgcttacgt tgtcccgcat ttggtacagc gcagtaaccg gcaaaatcgc gccgaaggat 2400
gtcgctgccg actgggcaat ggagcgcctg ccggcccagt atcagcccgt catacttgaa 2460
gctagacagg cttatcttgg acaagaagaa gatcgcttgg cctcgcgcgc agatcagttg 2520
gaagaatttg tccactacgt gaaaggcgag atcaccaagg tagtcggcaa ataatgtcta 2580
gctagaaatt cgttcaagcc gacgccgctt cgccggcgtt aactcaagcg attagatgca 2640
ctaagcacat aattgctcac agccaaacta tcaggtcaag tctgctttta ttatttttaa 2700
gcgtgcataa taagccctac acaaattggg agatatatca tgcatgacca aaatccctta 2760
acgtgagttt tcgttccact gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg 2820
agatcctttt tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac cgctaccagc 2880
ggtggtttgt ttgccggatc aagagctacc aactcttttt ccgaaggtaa ctggcttcag 2940
cagagcgcag ataccaaata ctgtccttct agtgtagccg tagttaggcc accacttcaa 3000
gaactctgta gcaccgccta catacctcgc tctgctaatc ctgttaccag tggctgctgc 3060
cagtggcgat aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac cggataaggc 3120
gcagcggtcg ggctgaacgg ggggttcgtg cacacagccc agcttggagc gaacgaccta 3180
caccgaactg agatacctac agcgtgagct atgagaaagc gccacgcttc ccgaagggag 3240
aaaggcggac aggtatccgg taagcggcag ggtcggaaca ggagagcgca cgagggagct 3300
tccaggggga aacgcctggt atctttatag tcctgtcggg tttcgccacc tctgacttga 3360
gcgtcgattt ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg ccagcaacgc 3420
ggccttttta cggttcctgg ccttttgctg gccttttgct cacatgttct ttcctgcgtt 3480
atcccctgat tctgtggata accgtattac cgcctttgag tgagctgata ccgctcgccg 3540
cagccgaacg accgagcgca gcgagtcagt gagcgaggaa gcggaagagc gcctgatgcg 3600
gtattttctc cttacgcatc tgtgcggtat ttcacaccgc atatggtgca ctctcagtac 3660
aatctgctct gatgccgcat agttaagcca gtatacactc cgctatcgct acgtgactgg 3720
gtcatggctg cgccccgaca cccgccaaca cccgctgacg cgccctgacg ggcttgtctg 3780
ctcccggcat ccgcttacag acaagctgtg accgtctccg ggagctgcat gtgtcagagg 3840
ttttcaccgt catcaccgaa acgcgcgagg cagggtgcct tgatgtgggc gccggcggtc 3900
gagtggcgac ggcgcggctt gtccgcgccc tggtagattg cctggccgta ggccagccat 3960
ttttgagcgg ccagcggccg cgataggccg acgcgaagcg gcggggcgta gggagcgcag 4020
cgaccgaagg gtaggcgctt tttgcagctc ttcggctgtg cgctggccag acagttatgc 4080
acaggccagg cgggttttaa gagttttaat aagttttaaa gagttttagg cggaaaaatc 4140
gccttttttc tcttttatat cagtcactta catgtgtgac cggttcccaa tgtacggctt 4200
tgggttccca atgtacgggt tccggttccc aatgtacggc tttgggttcc caatgtacgt 4260
gctatccaca ggaaagagac cttttcgacc tttttcccct gctagggcaa tttgccctag 4320
catctgctcc gtacattagg aaccggcgga tgcttcgccc tcgatcaggt tgcggtagcg 4380
catgactagg atcgggccag cctgccccgc ctcctccttc aaatcgtact ccggcaggtc 4440
atttgacccg atcagcttgc gcacggtgaa acagaacttc ttgaactctc cggcgctgcc 4500
actgcgttcg tagatcgtct tgaacaacca tctggcttct gccttgcctg cggcgcggcg 4560
tgccaggcgg tagagaaaac ggccgatgcc gggatcgatc aaaaagtaat cggggtgaac 4620
cgtcagcacg tccgggttct tgccttctgt gatctcgcgg tacatccaat cagctagctc 4680
gatctcgatg tactccggcc gcccggtttc gctctttacg atcttgtagc ggctaatcaa 4740
ggcttcaccc tcggataccg tcaccaggcg gccgttcttg gccttcttcg tacgctgcat 4800
ggcaacgtgc gtggtgttta accgaatgca ggtttctacc aggtcgtctt tctgctttcc 4860
gccatcggct cgccggcaga acttgagtac gtccgcaacg tgtggacgga acacgcggcc 4920
gggcttgtct cccttccctt cccggtatcg gttcatggat tcggttagat gggaaaccgc 4980
catcagtacc aggtcgtaat cccacacact ggccatgccg gccggccctg cggaaacctc 5040
tacgtgcccg tctggaagct cgtagcggat cacctcgcca gctcgtcggt cacgcttcga 5100
cagacggaaa acggccacgt ccatgatgct gcgactatcg cgggtgccca cgtcatagag 5160
catcggaacg aaaaaatctg gttgctcgtc gcccttgggc ggcttcctaa tcgacggcgc 5220
accggctgcc ggcggttgcc gggattcttt gcggattcga tcagcggccg cttgccacga 5280
ttcaccgggg cgtgcttctg cctcgatgcg ttgccgctgg gcggcctgcg cggccttcaa 5340
cttctccacc aggtcatcac ccagcgccgc gccgatttgt accgggccgg atggtttgcg 5400
accgtcacgc cgattcctcg ggcttggggg ttccagtgcc attgcagggc cggcagacaa 5460
cccagccgct tacgcctggc caaccgcccg ttcctccaca catggggcat tccacggcgt 5520
cggtgcctgg ttgttcttga ttttccatgc cgcctccttt agccgctaaa attcatctac 5580
tcatttattc atttgctcat ttactctggt agctgcgcga tgtattcaga tagcagctcg 5640
gtaatggtct tgccttggcg taccgcgtac atcttcagct tggtgtgatc ctccgccggc 5700
aactgaaagt tgacccgctt catggctggc gtgtctgcca ggctggccaa cgttgcagcc 5760
ttgctgctgc gtgcgctcgg acggccggca cttagcgtgt ttgtgctttt gctcattttc 5820
tctttacctc attaactcaa atgagttttg atttaatttc agcggccagc gcctggacct 5880
cgcgggcagc gtcgccctcg ggttctgatt caagaacggt tgtgccggcg gcggcagtgc 5940
ctgggtagct cacgcgctgc gtgatacggg actcaagaat gggcagctcg tacccggcca 6000
gcgcctcggc aacctcaccg ccgatgcgcg tgcctttgat cgcccgcgac acgacaaagg 6060
ccgcttgtag ccttccatcc gtgacctcaa tgcgctgctt aaccagctcc accaggtcgg 6120
cggtggccca tatgtcgtaa gggcttggct gcaccggaat cagcacgaag tcggctgcct 6180
tgatcgcgga cacagccaag tccgccgcct ggggcgctcc gtcgatcact acgaagtcgc 6240
gccggccgat ggccttcacg tcgcggtcaa tcgtcgggcg gtcgatgccg acaacggtta 6300
gcggttgatc ttcccgcacg gccgcccaat cgcgggcact gccctgggga tcggaatcga 6360
ctaacagaac atcggccccg gcgagttgca gggcgcgggc tagatgggtt gcgatggtcg 6420
tcttgcctga cccgcctttc tggttaagta cagcgataac cttcatgcgt tccccttgcg 6480
tatttgttta tttactcatc gcatcatata cgcagcgacc gcatgacgca agctgtttta 6540
ctcaaataca catcaccttt ttagacggcg gcgctcggtt tcttcagcgg ccaagctggc 6600
cggccaggcc gccagcttgg catcagacaa accggccagg atttcatgca gccgcacggt 6660
tgagacgtgc gcgggcggct cgaacacgta cccggccgcg atcatctccg cctcgatctc 6720
ttcggtaatg aaaaacggtt cgtcctggcc gtcctggtgc ggtttcatgc ttgttcctct 6780
tggcgttcat tctcggcggc cgccagggcg tcggcctcgg tcaatgcgtc ctcacggaag 6840
gcaccgcgcc gcctggcctc ggtgggcgtc acttcctcgc tgcgctcaag tgcgcggtac 6900
agggtcgagc gatgcacgcc aagcagtgca gccgcctctt tcacggtgcg gccttcctgg 6960
tcgatcagct cgcgggcgtg cgcgatctgt gccggggtga gggtagggcg ggggccaaac 7020
ttcacgcctc gggccttggc ggcctcgcgc ccgctccggg tgcggtcgat gattagggaa 7080
cgctcgaact cggcaatgcc ggcgaacacg gtcaacacca tgcggccggc cggcgtggtg 7140
gtgtcggccc acggctctgc caggctacgc aggcccgcgc cggcctcctg gatgcgctcg 7200
gcaatgtcca gtaggtcgcg ggtgctgcgg gccaggcggt ctagcctggt cactgtcaca 7260
acgtcgccag ggcgtaggtg gtcaagcatc ctggccagct ccgggcggtc gcgcctggtg 7320
ccggtgatct tctcggaaaa cagcttggtg cagccggccg cgtgcagttc ggcccgttgg 7380
ttggtcaagt cctggtcgtc ggtgctgacg cgggcatagc ccagcaggcc agcggcggcg 7440
ctcttgttca tggcgtaatg tctccggttc tagtcgcaag tattctactt tatgcgacta 7500
aaacacgcga caagaaaacg ccaggaaaag ggcagggcgg cagcctgtcg cgtaacttag 7560
gacttgtgcg acatgtcgtt ttcagaagac ggctgcactg aacgtcagaa gccgactgca 7620
ctatagcagc ggaggggttg gatcaaagta ctttgatccc gaggggaacc ctgtggttgg 7680
catgcacata caaatggacg aacggataaa ccttttcacg cccttttaaa tatccgttat 7740
tctaataaac gctcttttct cttaggttta cccgccaata tatcctgtca aacactgata 7800
gtttaaactg aaggcgggaa acgacaatct gatccaagct caagctaagc ttgggcccga 7860
gcggataaca atttcacaca ggaaacagct atgaccatga ttacgccaag ctatcaactt 7920
tgtatagaaa agttgccagc tcaaaccttt aaatggcttt taattagata tatttagcga 7980
gaatgtgatt gctagtgaaa tctcaaactt gatagcttat tcatagctta ttttacttcg 8040
atcagcaaga gaacaatggt tcctaaagct caaacctttt ttggcgtttg ctttagattg 8100
tgcatacata aagtgagaag atgaaatatg gttttgctga aatctcaatg tgctcattca 8160
tagtttattt tgctcgacct ttctttaatc aatagctttg atgtactgat tactttataa 8220
agttaagaag taagttctgc tctttaaact gtactgaatg gaggcttctc tgcataatta 8280
agcaaacact ctgatgattg agtttcgttg tacaaaggaa agtttttgcc ttagttagaa 8340
attcatcttg tttctttgcc cagaagctgg cttgctgata gaatttggac tacgctacgt 8400
tttcttgggt gaaaaacaat ccgcgtcctt ccacgagaac agtgaaactg tacgatgttc 8460
ttattgtatt gtgtcaacag cccataatca atgaaatggg cctcaatgac agtataagcc 8520
gaaaaatatt cgaatgcgat ctagaactaa tctgaaacca aacttctcaa atcattaaca 8580
tttgattagg gcctaaaagt ccatccgtat tttaaaaaaa agttgataac aaatgcaaaa 8640
atacaaatat acattactat taaaactcaa tctttctgat tatatgtgga tggagaagct 8700
gttttgcagt gtggatttga attttgaagt tcttgttcaa aaaagaaaag aaacttggtc 8760
aagcttcaaa agaaagaaag aaataaagac aagtatacaa atacgttgac ttcaattaat 8820
atgaagatag aagagaaaga tatagaaatg cgttttaaat tggcggtggg agatatgtga 8880
ttcccttggt cccgctttct cgtttgattc ggtaacctaa accttctcca tccaagaaga 8940
cacaaacaag gaagaaatta acctacgtac gtacatcatt tgaactactt atatctatta 9000
taaatggaaa atctattttc ttcttctctc tcttttaacc gaaaaaggaa aagtcctcga 9060
aataactctt taatataatt catgtggaaa ccttctatat attttttgca tgcttttttg 9120
aaattaagta atggcatact aattagaaga agacgaaaaa taatatgtct aagtaattga 9180
gtttcgtggt caaggcaaat caagattgca ttctttaatt aagtgtacaa attatgatgt 9240
aagaaccgtt atttggcata acctaatata tattaaaaac tgattttttt tttttttaac 9300
ttctgtaaga aatggttttc ttaattacca atcatgatct attattgtaa aatgtgtaat 9360
tttgtgttgc gattgaagtg ttcttagata aagatatgtc atatgcatga tatcatctat 9420
ttgattttga gaaaataaaa acataacatg agaacatcgt agagagtaag atacatgaca 9480
aagagaaaga ataagctaag aagtcatcca aaaattggga ggcctactct caactaccaa 9540
aaatacaagt gtttgttgtg ttaggtcatt tattcagtca cctaacccta actatatgaa 9600
atacgttaaa attcatatat agaaaaataa agaagaaata ctattagtca atataatttt 9660
ttttaacaaa ataaaaataa agaaagaaac actattagtc aatgaattaa aaaaaaaaaa 9720
atccatcttt cgatcaagac cgtccaagta ttctcctttc acataactct tacgttttac 9780
actaaacaag acgagatttt tatgagcttg tggctcccac aacaatcctc attgatttct 9840
ccatatatat cacatgagaa tccaactcga cttcatacta acattcatcc caaaagttcc 9900
attctttttc acaaagccat tgtgctgttt tctccatttg gatcaaagca agtttgtaca 9960
aaaaagcagg ctccatggga agatcacctt gttgtgataa aaatggagtg aagaagggac 10020
catggactgc tgaggaggat cagaaactca tcgattatat tcgatttcat ggtcctggca 10080
attggcgtac gctccccaaa aatgctggta cgtataaact acacaccgtt ccttatattt 10140
tgttctcata gattaatata tatgttctct atttattgag tcacacactt ataagtcgta 10200
ttgtacaaat taaaggactc catagatgtg gaaaaagctg ccgtcttcga tggaccaatt 10260
atctaagacc ggacatcaag agaggaagat tctcgttcga ggaagaagaa actatcattc 10320
agctacacag tgttatggga aacaagtaag cctgatcatt cacaccataa tttttgtctg 10380
aaattcatat tcatcagcta catgcttttg tatgttaatt aatgtaaaac tcaaaaaggg 10440
agagtgtacg tttgcatgcg ggggtacatg tcaaatgtag gccatcaact ccaataaact 10500
attattagta ctttactagt acgtattgac ctatattaga ataataataa aggagttttg 10560
tattgatcat agattaatgt cactaatatt gaattgatga atattaggtg gtcagcaata 10620
gccgctcgtc taccagggag gaccgataac gaaataaaaa accattggaa cactcacatc 10680
cgcaagagac ttgtaaggag tggtatcgac cctgttactc attctccacg ccttgatctt 10740
cttgatttgt cctcactttt gagtgcactt ttcaaccagc caaacttttc agcagttgca 10800
acacatgcgt cttctcttct taatcctgat gtattgaggt tggcctctct actactgcca 10860
cttcaaaacc ctaatccagt ttacccatcg aacctcgacc aaaatcttca aactccaaat 10920
acatcatcag aatcgtctca accacaagct gagactagta cagtcccaac aaactatgaa 10980
acttcatcat tggagcctat gaacgcaaga ctcgacgacg ttggtcttgc agatgtatta 11040
ccacctttgt cagagagttt tgacttagac tcgctcatgt caacgccaat gtcttctcca 11100
cgacaaaata gcattgaagc agaaaccaac tccagcactt tcttcgactt tggaattccg 11160
gaagatttca tcttagatga ctttatgttt gacccagctt tcttgtacaa agtggcctaa 11220
ttttcaacat ttgcatacac atgtcttgct ttcacacata tgattctttg ttgcattctt 11280
tcttttgttt gatgtataaa tttcttgttt ttattctctc aaaagatatt aagttattag 11340
tctataaaat tttcatgaat gtttatgtat tatctgctta ggcgagatat ctaaattctg 11400
ctccattagt ccatatacac agttgacgga agcaaacata gaattattag cgtcaaacac 11460
atcacatatt catattgctt tgttcgaatc atcgtcaatc aagttaatca gtttatgcga 11520
gttctatcat ttaggcccaa ttcaaggccc aattcaagtt cattttaaag ccgttaattt 11580
ggccagcaac tttattatac atagttgata attcactggc cgtcgtttta caacgtcgtg 11640
actgggaaaa cgatctaact gactagccgc ggccatggcg gccgggagcg gccatgctag 11700
agtccgcaaa aatcaccagt ctctctctac aaatctatct ctctctattt ttctccagaa 11760
taatgtgtga gtagttccca gataagggaa ttagggttct tatagggttt cgctcatgtg 11820
ttgagcatat aagaaaccct tagtatgtat ttgtatttgt aaaatacttc tatcaataaa 11880
atttctaatt cctaaaacca aaatccagtg acctgcaggt cgaccatatg ggag 11934
<210> 10
<211> 12070
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> proGPAT5::MYB41构建体
<400> 10
agctcgaatt atcatacatg agaattaagg gagtcacgtt atgacccccg ccgatgacgc 60
gggacaagcc gttttacgtt tggaactgac agaaccgcaa cgttgaagga gccactgagc 120
cgcgggtttc tggagtttaa tgagctaagc acatacgtca gaaaccatta ttgcgcgttc 180
aaaagtcgcc taaggtcact atcagctagc aaatatttct tgtcaaaaat gctccactga 240
cgttccataa attcccctcg gtatccaatt agagtctcat attcactctc aactcgatcg 300
aggggatcta ccatgagccc agaacgacgc ccggccgaca tccgccgtgc caccgaggcg 360
gacatgccgg cggtctgcac catcgtcaac cactacatcg agacaagcac ggtcaacttc 420
cgtaccgagc cgcaggaacc gcaggagtgg acggacgacc tcgtccgtct gcgggagcgc 480
tatccctggc tcgtcgccga ggtggacggc gaggtcgccg gcatcgccta cgcgggtccc 540
tggaaggcac gcaacgccta cgactggacg gccgagtcga ccgtgtacgt ctccccccgc 600
caccagcgga cgggactggg ctccacgctc tacacccacc tgctgaagtc cctggaggca 660
cagggcttca agagcgtggt cgctgtcatc gggctgccca acgacccgag cgtgcgcatg 720
cacgaggcgc tcggatatgc cccccgcggc atgctgcggg cggccggctt caagcacggg 780
aactggcatg acgtgggttt ctggcagctg gacttcagcc tgccggtgcc gccccgtccg 840
gtcctgcccg tcaccgaaat ctgatgaccc ctagagtcaa gcagatcgtt caaacatttg 900
gcaataaagt ttcttaagat tgaatcctgt tgccggtctt gcgatgatta tcatataatt 960
tctgttgaat tacgttaagc atgtaataat taacatgtaa tgcatgacgt tatttatgag 1020
atgggttttt atgattagag tcccgcaatt atacatttaa tacgcgatag aaaacaaaat 1080
atagcgcgca aactaggata aattatcgcg cgcggtgtca tctatatgtt actagatcga 1140
ccggcatgca agctgataat tcaattcggc gttaattcag tacattaaaa acgtccgcaa 1200
tgtgttatta agttgtctaa gcgtcaattt gtttacacca caatatatcc tgccaccagc 1260
cagccaacag ctccccgacc ggcagctcgg cacaaaatca ccactcgata caggcagccc 1320
atcagtccgg gacggcgtca gcgggagagc cgttgtaagg cggcagactt tgctcatgtt 1380
accgatgcta ttcggaagaa cggcaactaa gctgccgggt ttgaaacacg gatgatctcg 1440
cggagggtag catgttgatt gtaacgatga cagagcgttg ctgcctgtga tcaattcggg 1500
cacgaaccca gtggacataa gcctcgttcg gttcgtaagc tgtaatgcaa gtagcgtaac 1560
tgccgtcacg caactggtcc agaaccttga ccgaacgcag cggtggtaac ggcgcagtgg 1620
cggttttcat ggcttcttgt tatgacatgt ttttttgggg tacagtctat gcctcgggca 1680
tccaagcagc aagcgcgtta cgccgtgggt cgatgtttga tgttatggag cagcaacgat 1740
gttacgcagc agggcagtcg ccctaaaaca aagttaaaca tcatggggga agcggtgatc 1800
gccgaagtat cgactcaact atcagaggta gttggcgtca tcgagcgcca tctcgaaccg 1860
acgttgctgg ccgtacattt gtacggctcc gcagtggatg gcggcctgaa gccacacagt 1920
gatattgatt tgctggttac ggtgaccgta aggcttgatg aaacaacgcg gcgagctttg 1980
atcaacgacc ttttggaaac ttcggcttcc cctggagaga gcgagattct ccgcgctgta 2040
gaagtcacca ttgttgtgca cgacgacatc attccgtggc gttatccagc taagcgcgaa 2100
ctgcaatttg gagaatggca gcgcaatgac attcttgcag gtatcttcga gccagccacg 2160
atcgacattg atctggctat cttgctgaca aaagcaagag aacatagcgt tgccttggta 2220
ggtccagcgg cggaggaact ctttgatccg gttcctgaac aggatctatt tgaggcgcta 2280
aatgaaacct taacgctatg gaactcgccg cccgactggg ctggcgatga gcgaaatgta 2340
gtgcttacgt tgtcccgcat ttggtacagc gcagtaaccg gcaaaatcgc gccgaaggat 2400
gtcgctgccg actgggcaat ggagcgcctg ccggcccagt atcagcccgt catacttgaa 2460
gctagacagg cttatcttgg acaagaagaa gatcgcttgg cctcgcgcgc agatcagttg 2520
gaagaatttg tccactacgt gaaaggcgag atcaccaagg tagtcggcaa ataatgtcta 2580
gctagaaatt cgttcaagcc gacgccgctt cgccggcgtt aactcaagcg attagatgca 2640
ctaagcacat aattgctcac agccaaacta tcaggtcaag tctgctttta ttatttttaa 2700
gcgtgcataa taagccctac acaaattggg agatatatca tgcatgacca aaatccctta 2760
acgtgagttt tcgttccact gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg 2820
agatcctttt tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac cgctaccagc 2880
ggtggtttgt ttgccggatc aagagctacc aactcttttt ccgaaggtaa ctggcttcag 2940
cagagcgcag ataccaaata ctgtccttct agtgtagccg tagttaggcc accacttcaa 3000
gaactctgta gcaccgccta catacctcgc tctgctaatc ctgttaccag tggctgctgc 3060
cagtggcgat aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac cggataaggc 3120
gcagcggtcg ggctgaacgg ggggttcgtg cacacagccc agcttggagc gaacgaccta 3180
caccgaactg agatacctac agcgtgagct atgagaaagc gccacgcttc ccgaagggag 3240
aaaggcggac aggtatccgg taagcggcag ggtcggaaca ggagagcgca cgagggagct 3300
tccaggggga aacgcctggt atctttatag tcctgtcggg tttcgccacc tctgacttga 3360
gcgtcgattt ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg ccagcaacgc 3420
ggccttttta cggttcctgg ccttttgctg gccttttgct cacatgttct ttcctgcgtt 3480
atcccctgat tctgtggata accgtattac cgcctttgag tgagctgata ccgctcgccg 3540
cagccgaacg accgagcgca gcgagtcagt gagcgaggaa gcggaagagc gcctgatgcg 3600
gtattttctc cttacgcatc tgtgcggtat ttcacaccgc atatggtgca ctctcagtac 3660
aatctgctct gatgccgcat agttaagcca gtatacactc cgctatcgct acgtgactgg 3720
gtcatggctg cgccccgaca cccgccaaca cccgctgacg cgccctgacg ggcttgtctg 3780
ctcccggcat ccgcttacag acaagctgtg accgtctccg ggagctgcat gtgtcagagg 3840
ttttcaccgt catcaccgaa acgcgcgagg cagggtgcct tgatgtgggc gccggcggtc 3900
gagtggcgac ggcgcggctt gtccgcgccc tggtagattg cctggccgta ggccagccat 3960
ttttgagcgg ccagcggccg cgataggccg acgcgaagcg gcggggcgta gggagcgcag 4020
cgaccgaagg gtaggcgctt tttgcagctc ttcggctgtg cgctggccag acagttatgc 4080
acaggccagg cgggttttaa gagttttaat aagttttaaa gagttttagg cggaaaaatc 4140
gccttttttc tcttttatat cagtcactta catgtgtgac cggttcccaa tgtacggctt 4200
tgggttccca atgtacgggt tccggttccc aatgtacggc tttgggttcc caatgtacgt 4260
gctatccaca ggaaagagac cttttcgacc tttttcccct gctagggcaa tttgccctag 4320
catctgctcc gtacattagg aaccggcgga tgcttcgccc tcgatcaggt tgcggtagcg 4380
catgactagg atcgggccag cctgccccgc ctcctccttc aaatcgtact ccggcaggtc 4440
atttgacccg atcagcttgc gcacggtgaa acagaacttc ttgaactctc cggcgctgcc 4500
actgcgttcg tagatcgtct tgaacaacca tctggcttct gccttgcctg cggcgcggcg 4560
tgccaggcgg tagagaaaac ggccgatgcc gggatcgatc aaaaagtaat cggggtgaac 4620
cgtcagcacg tccgggttct tgccttctgt gatctcgcgg tacatccaat cagctagctc 4680
gatctcgatg tactccggcc gcccggtttc gctctttacg atcttgtagc ggctaatcaa 4740
ggcttcaccc tcggataccg tcaccaggcg gccgttcttg gccttcttcg tacgctgcat 4800
ggcaacgtgc gtggtgttta accgaatgca ggtttctacc aggtcgtctt tctgctttcc 4860
gccatcggct cgccggcaga acttgagtac gtccgcaacg tgtggacgga acacgcggcc 4920
gggcttgtct cccttccctt cccggtatcg gttcatggat tcggttagat gggaaaccgc 4980
catcagtacc aggtcgtaat cccacacact ggccatgccg gccggccctg cggaaacctc 5040
tacgtgcccg tctggaagct cgtagcggat cacctcgcca gctcgtcggt cacgcttcga 5100
cagacggaaa acggccacgt ccatgatgct gcgactatcg cgggtgccca cgtcatagag 5160
catcggaacg aaaaaatctg gttgctcgtc gcccttgggc ggcttcctaa tcgacggcgc 5220
accggctgcc ggcggttgcc gggattcttt gcggattcga tcagcggccg cttgccacga 5280
ttcaccgggg cgtgcttctg cctcgatgcg ttgccgctgg gcggcctgcg cggccttcaa 5340
cttctccacc aggtcatcac ccagcgccgc gccgatttgt accgggccgg atggtttgcg 5400
accgtcacgc cgattcctcg ggcttggggg ttccagtgcc attgcagggc cggcagacaa 5460
cccagccgct tacgcctggc caaccgcccg ttcctccaca catggggcat tccacggcgt 5520
cggtgcctgg ttgttcttga ttttccatgc cgcctccttt agccgctaaa attcatctac 5580
tcatttattc atttgctcat ttactctggt agctgcgcga tgtattcaga tagcagctcg 5640
gtaatggtct tgccttggcg taccgcgtac atcttcagct tggtgtgatc ctccgccggc 5700
aactgaaagt tgacccgctt catggctggc gtgtctgcca ggctggccaa cgttgcagcc 5760
ttgctgctgc gtgcgctcgg acggccggca cttagcgtgt ttgtgctttt gctcattttc 5820
tctttacctc attaactcaa atgagttttg atttaatttc agcggccagc gcctggacct 5880
cgcgggcagc gtcgccctcg ggttctgatt caagaacggt tgtgccggcg gcggcagtgc 5940
ctgggtagct cacgcgctgc gtgatacggg actcaagaat gggcagctcg tacccggcca 6000
gcgcctcggc aacctcaccg ccgatgcgcg tgcctttgat cgcccgcgac acgacaaagg 6060
ccgcttgtag ccttccatcc gtgacctcaa tgcgctgctt aaccagctcc accaggtcgg 6120
cggtggccca tatgtcgtaa gggcttggct gcaccggaat cagcacgaag tcggctgcct 6180
tgatcgcgga cacagccaag tccgccgcct ggggcgctcc gtcgatcact acgaagtcgc 6240
gccggccgat ggccttcacg tcgcggtcaa tcgtcgggcg gtcgatgccg acaacggtta 6300
gcggttgatc ttcccgcacg gccgcccaat cgcgggcact gccctgggga tcggaatcga 6360
ctaacagaac atcggccccg gcgagttgca gggcgcgggc tagatgggtt gcgatggtcg 6420
tcttgcctga cccgcctttc tggttaagta cagcgataac cttcatgcgt tccccttgcg 6480
tatttgttta tttactcatc gcatcatata cgcagcgacc gcatgacgca agctgtttta 6540
ctcaaataca catcaccttt ttagacggcg gcgctcggtt tcttcagcgg ccaagctggc 6600
cggccaggcc gccagcttgg catcagacaa accggccagg atttcatgca gccgcacggt 6660
tgagacgtgc gcgggcggct cgaacacgta cccggccgcg atcatctccg cctcgatctc 6720
ttcggtaatg aaaaacggtt cgtcctggcc gtcctggtgc ggtttcatgc ttgttcctct 6780
tggcgttcat tctcggcggc cgccagggcg tcggcctcgg tcaatgcgtc ctcacggaag 6840
gcaccgcgcc gcctggcctc ggtgggcgtc acttcctcgc tgcgctcaag tgcgcggtac 6900
agggtcgagc gatgcacgcc aagcagtgca gccgcctctt tcacggtgcg gccttcctgg 6960
tcgatcagct cgcgggcgtg cgcgatctgt gccggggtga gggtagggcg ggggccaaac 7020
ttcacgcctc gggccttggc ggcctcgcgc ccgctccggg tgcggtcgat gattagggaa 7080
cgctcgaact cggcaatgcc ggcgaacacg gtcaacacca tgcggccggc cggcgtggtg 7140
gtgtcggccc acggctctgc caggctacgc aggcccgcgc cggcctcctg gatgcgctcg 7200
gcaatgtcca gtaggtcgcg ggtgctgcgg gccaggcggt ctagcctggt cactgtcaca 7260
acgtcgccag ggcgtaggtg gtcaagcatc ctggccagct ccgggcggtc gcgcctggtg 7320
ccggtgatct tctcggaaaa cagcttggtg cagccggccg cgtgcagttc ggcccgttgg 7380
ttggtcaagt cctggtcgtc ggtgctgacg cgggcatagc ccagcaggcc agcggcggcg 7440
ctcttgttca tggcgtaatg tctccggttc tagtcgcaag tattctactt tatgcgacta 7500
aaacacgcga caagaaaacg ccaggaaaag ggcagggcgg cagcctgtcg cgtaacttag 7560
gacttgtgcg acatgtcgtt ttcagaagac ggctgcactg aacgtcagaa gccgactgca 7620
ctatagcagc ggaggggttg gatcaaagta ctttgatccc gaggggaacc ctgtggttgg 7680
catgcacata caaatggacg aacggataaa ccttttcacg cccttttaaa tatccgttat 7740
tctaataaac gctcttttct cttaggttta cccgccaata tatcctgtca aacactgata 7800
gtttaaactg aaggcgggaa acgacaatct gatccaagct caagctaagc ttgggcccga 7860
gcggataaca atttcacaca ggaaacagct atgaccatga ttacgccaag ctatcaactt 7920
tgtatagaaa agttgcctga tcgcaaacgt caatggtcta tatccatctc ttggggatac 7980
accattcaga tatacactta cttcttgact gctacggagc tgactacgcc gttgcagacc 8040
ttcaaaactt ggcggtcttc cagcgatgga cctttcgtgt ttaacactcg gcccttgaaa 8100
cctgacccct gtgagcgtcc ggtcacttat ttcatggatg gtgccgagga tgtacgggat 8160
agtgggacga aaacttggta tagcataggg gataagaact atggtcattg cggaaagatt 8220
gagcatactc gattaactaa agtgaagagg atattggtga cttcaatgaa gacggatcct 8280
gagtattgga acaaggtact tagtgtttgt atatttctca tattgaattt aacattttgg 8340
gtgagtttag gttacatctt tttttttatt ttttgctttt gttgataggc accgaggaga 8400
cagtgttgtg aggtgatgga aggaaaagta ggaaaaagaa aagagaaaga aatgttgtta 8460
aggattagaa aatgcagatc tttggagaag atataaaaaa agcgttttaa ttagagagat 8520
ttttgcacat acagatttag attcgatcat tagttatttg tttctaaatt cctcaattcc 8580
tagtaccaag agaatgacga ttttctctag taatactggc actcttcgtt tttcaacatg 8640
taaacattac tttgtataat tagtctatat caaataaata gttacaacat gaacgtaact 8700
atttatacac gagggtaaat ttttaacaaa tttaaaccga accaaaaaga tttcagttaa 8760
tcatagtttt gttacaagcg aaatctgaaa tattcaccct caagtttgtt acgtaattgt 8820
ctaatctgtg tttttttgtg ctagtgttat aattgtttcc tcgaatgtta agcaccacat 8880
agaagtatac acttttcttt tattattttc gttcttcttc catttagaaa cttttattaa 8940
ttctactgtt aaatccaacg ttattagttt attttctctg atgaagttct aatttttttt 9000
gtttgttgga aaaagggtta cttttctgat gaagttgccg atttgtttcc aaccaaacct 9060
cagctaatat agttagggag acggataaga aattgcataa agggagaggc tttgtaaaca 9120
cgcaagttta cgtcaacttg acacatataa actcgtatat aggaattgtg taaaatgtta 9180
atcaatatat gtttatgaat atagtccttt tatttcctta atctatagtc atgttatcat 9240
catatcggca agaaaattac tattacaaca tatgtttccg tgcttcgatt tgtcgatcag 9300
gtaggcaacc aaaccgggcc agattagtca caaatgaaat taggctccac tttggcaagt 9360
tttttcacaa ttaaaaatta gaaagtctaa ccaaactaat agaaactgaa ccaaacaaaa 9420
atgttcacgc aattacgtag cacttctcta tgaaatactg tggataattc gatttgagct 9480
aatctatggt aagtcgtttc tctcaaactg aattaagcta aaccaaaccg aaaataaacc 9540
gttgtagaac acccataata aacatatata tgttctctac tcttatttgg ctatttttcc 9600
atttgcagat acgtgtgaca acattccaaa tataggcaca tgatacaaat tacaaagcca 9660
gaaattataa tttataaact atacataata aggtcagtag cctaattaca tccatatatt 9720
tagttgggca taataaggat agcctaattt tggtgcatcc cgccaaaaat tcggacaaat 9780
ggtgaatttc aaaccatgaa tttctttgtt atacatacat tacgtgcact attacatcaa 9840
agaaaaatag tgacgtgcat aaacgtattt tcttcacata atctatatat aatatataca 9900
gccatgtaca tttttcaaca tagaaaaatc atgtatacaa atacggtagg tgcaatactg 9960
ataaactgcc attcccattg cattagacgc tagtcaatcc aaaccttata acataaaaag 10020
ttatagtcca tttctttcat atccaatcga gtcaaaataa tattcgagca aaaaacaaaa 10080
gaagcaagtt tgtacaaaaa agcaggctcc atgggaagat caccttgttg tgataaaaat 10140
ggagtgaaga agggaccatg gactgctgag gaggatcaga aactcatcga ttatattcga 10200
tttcatggtc ctggcaattg gcgtacgctc cccaaaaatg ctggtacgta taaactacac 10260
accgttcctt atattttgtt ctcatagatt aatatatatg ttctctattt attgagtcac 10320
acacttataa gtcgtattgt acaaattaaa ggactccata gatgtggaaa aagctgccgt 10380
cttcgatgga ccaattatct aagaccggac atcaagagag gaagattctc gttcgaggaa 10440
gaagaaacta tcattcagct acacagtgtt atgggaaaca agtaagcctg atcattcaca 10500
ccataatttt tgtctgaaat tcatattcat cagctacatg cttttgtatg ttaattaatg 10560
taaaactcaa aaagggagag tgtacgtttg catgcggggg tacatgtcaa atgtaggcca 10620
tcaactccaa taaactatta ttagtacttt actagtacgt attgacctat attagaataa 10680
taataaagga gttttgtatt gatcatagat taatgtcact aatattgaat tgatgaatat 10740
taggtggtca gcaatagccg ctcgtctacc agggaggacc gataacgaaa taaaaaacca 10800
ttggaacact cacatccgca agagacttgt aaggagtggt atcgaccctg ttactcattc 10860
tccacgcctt gatcttcttg atttgtcctc acttttgagt gcacttttca accagccaaa 10920
cttttcagca gttgcaacac atgcgtcttc tcttcttaat cctgatgtat tgaggttggc 10980
ctctctacta ctgccacttc aaaaccctaa tccagtttac ccatcgaacc tcgaccaaaa 11040
tcttcaaact ccaaatacat catcagaatc gtctcaacca caagctgaga ctagtacagt 11100
cccaacaaac tatgaaactt catcattgga gcctatgaac gcaagactcg acgacgttgg 11160
tcttgcagat gtattaccac ctttgtcaga gagttttgac ttagactcgc tcatgtcaac 11220
gccaatgtct tctccacgac aaaatagcat tgaagcagaa accaactcca gcactttctt 11280
cgactttgga attccggaag atttcatctt agatgacttt atgtttgacc cagctttctt 11340
gtacaaagtg gcctaatttt caacatttgc atacacatgt cttgctttca cacatatgat 11400
tctttgttgc attctttctt ttgtttgatg tataaatttc ttgtttttat tctctcaaaa 11460
gatattaagt tattagtcta taaaattttc atgaatgttt atgtattatc tgcttaggcg 11520
agatatctaa attctgctcc attagtccat atacacagtt gacggaagca aacatagaat 11580
tattagcgtc aaacacatca catattcata ttgctttgtt cgaatcatcg tcaatcaagt 11640
taatcagttt atgcgagttc tatcatttag gcccaattca aggcccaatt caagttcatt 11700
ttaaagccgt taatttggcc agcaacttta ttatacatag ttgataattc actggccgtc 11760
gttttacaac gtcgtgactg ggaaaacgat ctaactgact agccgcggcc atggcggccg 11820
ggagcggcca tgctagagtc cgcaaaaatc accagtctct ctctacaaat ctatctctct 11880
ctatttttct ccagaataat gtgtgagtag ttcccagata agggaattag ggttcttata 11940
gggtttcgct catgtgttga gcatataaga aacccttagt atgtatttgt atttgtaaaa 12000
tacttctatc aataaaattt ctaattccta aaaccaaaat ccagtgacct gcaggtcgac 12060
catatgggag 12070
<210> 11
<211> 11573
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> proRALPH::MYB41构建体
<400> 11
agctcgaatt atcatacatg agaattaagg gagtcacgtt atgacccccg ccgatgacgc 60
gggacaagcc gttttacgtt tggaactgac agaaccgcaa cgttgaagga gccactgagc 120
cgcgggtttc tggagtttaa tgagctaagc acatacgtca gaaaccatta ttgcgcgttc 180
aaaagtcgcc taaggtcact atcagctagc aaatatttct tgtcaaaaat gctccactga 240
cgttccataa attcccctcg gtatccaatt agagtctcat attcactctc aactcgatcg 300
aggggatcta ccatgagccc agaacgacgc ccggccgaca tccgccgtgc caccgaggcg 360
gacatgccgg cggtctgcac catcgtcaac cactacatcg agacaagcac ggtcaacttc 420
cgtaccgagc cgcaggaacc gcaggagtgg acggacgacc tcgtccgtct gcgggagcgc 480
tatccctggc tcgtcgccga ggtggacggc gaggtcgccg gcatcgccta cgcgggtccc 540
tggaaggcac gcaacgccta cgactggacg gccgagtcga ccgtgtacgt ctccccccgc 600
caccagcgga cgggactggg ctccacgctc tacacccacc tgctgaagtc cctggaggca 660
cagggcttca agagcgtggt cgctgtcatc gggctgccca acgacccgag cgtgcgcatg 720
cacgaggcgc tcggatatgc cccccgcggc atgctgcggg cggccggctt caagcacggg 780
aactggcatg acgtgggttt ctggcagctg gacttcagcc tgccggtgcc gccccgtccg 840
gtcctgcccg tcaccgaaat ctgatgaccc ctagagtcaa gcagatcgtt caaacatttg 900
gcaataaagt ttcttaagat tgaatcctgt tgccggtctt gcgatgatta tcatataatt 960
tctgttgaat tacgttaagc atgtaataat taacatgtaa tgcatgacgt tatttatgag 1020
atgggttttt atgattagag tcccgcaatt atacatttaa tacgcgatag aaaacaaaat 1080
atagcgcgca aactaggata aattatcgcg cgcggtgtca tctatatgtt actagatcga 1140
ccggcatgca agctgataat tcaattcggc gttaattcag tacattaaaa acgtccgcaa 1200
tgtgttatta agttgtctaa gcgtcaattt gtttacacca caatatatcc tgccaccagc 1260
cagccaacag ctccccgacc ggcagctcgg cacaaaatca ccactcgata caggcagccc 1320
atcagtccgg gacggcgtca gcgggagagc cgttgtaagg cggcagactt tgctcatgtt 1380
accgatgcta ttcggaagaa cggcaactaa gctgccgggt ttgaaacacg gatgatctcg 1440
cggagggtag catgttgatt gtaacgatga cagagcgttg ctgcctgtga tcaattcggg 1500
cacgaaccca gtggacataa gcctcgttcg gttcgtaagc tgtaatgcaa gtagcgtaac 1560
tgccgtcacg caactggtcc agaaccttga ccgaacgcag cggtggtaac ggcgcagtgg 1620
cggttttcat ggcttcttgt tatgacatgt ttttttgggg tacagtctat gcctcgggca 1680
tccaagcagc aagcgcgtta cgccgtgggt cgatgtttga tgttatggag cagcaacgat 1740
gttacgcagc agggcagtcg ccctaaaaca aagttaaaca tcatggggga agcggtgatc 1800
gccgaagtat cgactcaact atcagaggta gttggcgtca tcgagcgcca tctcgaaccg 1860
acgttgctgg ccgtacattt gtacggctcc gcagtggatg gcggcctgaa gccacacagt 1920
gatattgatt tgctggttac ggtgaccgta aggcttgatg aaacaacgcg gcgagctttg 1980
atcaacgacc ttttggaaac ttcggcttcc cctggagaga gcgagattct ccgcgctgta 2040
gaagtcacca ttgttgtgca cgacgacatc attccgtggc gttatccagc taagcgcgaa 2100
ctgcaatttg gagaatggca gcgcaatgac attcttgcag gtatcttcga gccagccacg 2160
atcgacattg atctggctat cttgctgaca aaagcaagag aacatagcgt tgccttggta 2220
ggtccagcgg cggaggaact ctttgatccg gttcctgaac aggatctatt tgaggcgcta 2280
aatgaaacct taacgctatg gaactcgccg cccgactggg ctggcgatga gcgaaatgta 2340
gtgcttacgt tgtcccgcat ttggtacagc gcagtaaccg gcaaaatcgc gccgaaggat 2400
gtcgctgccg actgggcaat ggagcgcctg ccggcccagt atcagcccgt catacttgaa 2460
gctagacagg cttatcttgg acaagaagaa gatcgcttgg cctcgcgcgc agatcagttg 2520
gaagaatttg tccactacgt gaaaggcgag atcaccaagg tagtcggcaa ataatgtcta 2580
gctagaaatt cgttcaagcc gacgccgctt cgccggcgtt aactcaagcg attagatgca 2640
ctaagcacat aattgctcac agccaaacta tcaggtcaag tctgctttta ttatttttaa 2700
gcgtgcataa taagccctac acaaattggg agatatatca tgcatgacca aaatccctta 2760
acgtgagttt tcgttccact gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg 2820
agatcctttt tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac cgctaccagc 2880
ggtggtttgt ttgccggatc aagagctacc aactcttttt ccgaaggtaa ctggcttcag 2940
cagagcgcag ataccaaata ctgtccttct agtgtagccg tagttaggcc accacttcaa 3000
gaactctgta gcaccgccta catacctcgc tctgctaatc ctgttaccag tggctgctgc 3060
cagtggcgat aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac cggataaggc 3120
gcagcggtcg ggctgaacgg ggggttcgtg cacacagccc agcttggagc gaacgaccta 3180
caccgaactg agatacctac agcgtgagct atgagaaagc gccacgcttc ccgaagggag 3240
aaaggcggac aggtatccgg taagcggcag ggtcggaaca ggagagcgca cgagggagct 3300
tccaggggga aacgcctggt atctttatag tcctgtcggg tttcgccacc tctgacttga 3360
gcgtcgattt ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg ccagcaacgc 3420
ggccttttta cggttcctgg ccttttgctg gccttttgct cacatgttct ttcctgcgtt 3480
atcccctgat tctgtggata accgtattac cgcctttgag tgagctgata ccgctcgccg 3540
cagccgaacg accgagcgca gcgagtcagt gagcgaggaa gcggaagagc gcctgatgcg 3600
gtattttctc cttacgcatc tgtgcggtat ttcacaccgc atatggtgca ctctcagtac 3660
aatctgctct gatgccgcat agttaagcca gtatacactc cgctatcgct acgtgactgg 3720
gtcatggctg cgccccgaca cccgccaaca cccgctgacg cgccctgacg ggcttgtctg 3780
ctcccggcat ccgcttacag acaagctgtg accgtctccg ggagctgcat gtgtcagagg 3840
ttttcaccgt catcaccgaa acgcgcgagg cagggtgcct tgatgtgggc gccggcggtc 3900
gagtggcgac ggcgcggctt gtccgcgccc tggtagattg cctggccgta ggccagccat 3960
ttttgagcgg ccagcggccg cgataggccg acgcgaagcg gcggggcgta gggagcgcag 4020
cgaccgaagg gtaggcgctt tttgcagctc ttcggctgtg cgctggccag acagttatgc 4080
acaggccagg cgggttttaa gagttttaat aagttttaaa gagttttagg cggaaaaatc 4140
gccttttttc tcttttatat cagtcactta catgtgtgac cggttcccaa tgtacggctt 4200
tgggttccca atgtacgggt tccggttccc aatgtacggc tttgggttcc caatgtacgt 4260
gctatccaca ggaaagagac cttttcgacc tttttcccct gctagggcaa tttgccctag 4320
catctgctcc gtacattagg aaccggcgga tgcttcgccc tcgatcaggt tgcggtagcg 4380
catgactagg atcgggccag cctgccccgc ctcctccttc aaatcgtact ccggcaggtc 4440
atttgacccg atcagcttgc gcacggtgaa acagaacttc ttgaactctc cggcgctgcc 4500
actgcgttcg tagatcgtct tgaacaacca tctggcttct gccttgcctg cggcgcggcg 4560
tgccaggcgg tagagaaaac ggccgatgcc gggatcgatc aaaaagtaat cggggtgaac 4620
cgtcagcacg tccgggttct tgccttctgt gatctcgcgg tacatccaat cagctagctc 4680
gatctcgatg tactccggcc gcccggtttc gctctttacg atcttgtagc ggctaatcaa 4740
ggcttcaccc tcggataccg tcaccaggcg gccgttcttg gccttcttcg tacgctgcat 4800
ggcaacgtgc gtggtgttta accgaatgca ggtttctacc aggtcgtctt tctgctttcc 4860
gccatcggct cgccggcaga acttgagtac gtccgcaacg tgtggacgga acacgcggcc 4920
gggcttgtct cccttccctt cccggtatcg gttcatggat tcggttagat gggaaaccgc 4980
catcagtacc aggtcgtaat cccacacact ggccatgccg gccggccctg cggaaacctc 5040
tacgtgcccg tctggaagct cgtagcggat cacctcgcca gctcgtcggt cacgcttcga 5100
cagacggaaa acggccacgt ccatgatgct gcgactatcg cgggtgccca cgtcatagag 5160
catcggaacg aaaaaatctg gttgctcgtc gcccttgggc ggcttcctaa tcgacggcgc 5220
accggctgcc ggcggttgcc gggattcttt gcggattcga tcagcggccg cttgccacga 5280
ttcaccgggg cgtgcttctg cctcgatgcg ttgccgctgg gcggcctgcg cggccttcaa 5340
cttctccacc aggtcatcac ccagcgccgc gccgatttgt accgggccgg atggtttgcg 5400
accgtcacgc cgattcctcg ggcttggggg ttccagtgcc attgcagggc cggcagacaa 5460
cccagccgct tacgcctggc caaccgcccg ttcctccaca catggggcat tccacggcgt 5520
cggtgcctgg ttgttcttga ttttccatgc cgcctccttt agccgctaaa attcatctac 5580
tcatttattc atttgctcat ttactctggt agctgcgcga tgtattcaga tagcagctcg 5640
gtaatggtct tgccttggcg taccgcgtac atcttcagct tggtgtgatc ctccgccggc 5700
aactgaaagt tgacccgctt catggctggc gtgtctgcca ggctggccaa cgttgcagcc 5760
ttgctgctgc gtgcgctcgg acggccggca cttagcgtgt ttgtgctttt gctcattttc 5820
tctttacctc attaactcaa atgagttttg atttaatttc agcggccagc gcctggacct 5880
cgcgggcagc gtcgccctcg ggttctgatt caagaacggt tgtgccggcg gcggcagtgc 5940
ctgggtagct cacgcgctgc gtgatacggg actcaagaat gggcagctcg tacccggcca 6000
gcgcctcggc aacctcaccg ccgatgcgcg tgcctttgat cgcccgcgac acgacaaagg 6060
ccgcttgtag ccttccatcc gtgacctcaa tgcgctgctt aaccagctcc accaggtcgg 6120
cggtggccca tatgtcgtaa gggcttggct gcaccggaat cagcacgaag tcggctgcct 6180
tgatcgcgga cacagccaag tccgccgcct ggggcgctcc gtcgatcact acgaagtcgc 6240
gccggccgat ggccttcacg tcgcggtcaa tcgtcgggcg gtcgatgccg acaacggtta 6300
gcggttgatc ttcccgcacg gccgcccaat cgcgggcact gccctgggga tcggaatcga 6360
ctaacagaac atcggccccg gcgagttgca gggcgcgggc tagatgggtt gcgatggtcg 6420
tcttgcctga cccgcctttc tggttaagta cagcgataac cttcatgcgt tccccttgcg 6480
tatttgttta tttactcatc gcatcatata cgcagcgacc gcatgacgca agctgtttta 6540
ctcaaataca catcaccttt ttagacggcg gcgctcggtt tcttcagcgg ccaagctggc 6600
cggccaggcc gccagcttgg catcagacaa accggccagg atttcatgca gccgcacggt 6660
tgagacgtgc gcgggcggct cgaacacgta cccggccgcg atcatctccg cctcgatctc 6720
ttcggtaatg aaaaacggtt cgtcctggcc gtcctggtgc ggtttcatgc ttgttcctct 6780
tggcgttcat tctcggcggc cgccagggcg tcggcctcgg tcaatgcgtc ctcacggaag 6840
gcaccgcgcc gcctggcctc ggtgggcgtc acttcctcgc tgcgctcaag tgcgcggtac 6900
agggtcgagc gatgcacgcc aagcagtgca gccgcctctt tcacggtgcg gccttcctgg 6960
tcgatcagct cgcgggcgtg cgcgatctgt gccggggtga gggtagggcg ggggccaaac 7020
ttcacgcctc gggccttggc ggcctcgcgc ccgctccggg tgcggtcgat gattagggaa 7080
cgctcgaact cggcaatgcc ggcgaacacg gtcaacacca tgcggccggc cggcgtggtg 7140
gtgtcggccc acggctctgc caggctacgc aggcccgcgc cggcctcctg gatgcgctcg 7200
gcaatgtcca gtaggtcgcg ggtgctgcgg gccaggcggt ctagcctggt cactgtcaca 7260
acgtcgccag ggcgtaggtg gtcaagcatc ctggccagct ccgggcggtc gcgcctggtg 7320
ccggtgatct tctcggaaaa cagcttggtg cagccggccg cgtgcagttc ggcccgttgg 7380
ttggtcaagt cctggtcgtc ggtgctgacg cgggcatagc ccagcaggcc agcggcggcg 7440
ctcttgttca tggcgtaatg tctccggttc tagtcgcaag tattctactt tatgcgacta 7500
aaacacgcga caagaaaacg ccaggaaaag ggcagggcgg cagcctgtcg cgtaacttag 7560
gacttgtgcg acatgtcgtt ttcagaagac ggctgcactg aacgtcagaa gccgactgca 7620
ctatagcagc ggaggggttg gatcaaagta ctttgatccc gaggggaacc ctgtggttgg 7680
catgcacata caaatggacg aacggataaa ccttttcacg cccttttaaa tatccgttat 7740
tctaataaac gctcttttct cttaggttta cccgccaata tatcctgtca aacactgata 7800
gtttaaactg aaggcgggaa acgacaatct gatccaagct caagctaagc ttgggcccga 7860
gcggataaca atttcacaca ggaaacagct atgaccatga ttacgccaag ctatcaactt 7920
tgtatagaaa agttgccctt tcctctgaaa cgattctcca cgctctttgt ttataaggat 7980
tgcaagaaat tactgaagaa catcaggaat cgcgagagct tggggcgaat caaaaacctc 8040
cattgatgaa gaagactgca tctagtactt tacttactcg gtagcacacc tccatgggca 8100
ggctccagca ccatggttgg gcccatttct tattaatggg cctaaaatag agcttctagg 8160
gcctctatat attttgtctt ttctcttccg tttaggcgtt ttgctaactt tcttacgtat 8220
atgaatgtga attatagtta gttaacttta gaactgttga gcggccaatg ccacgtcctt 8280
tgtacgtaaa ttatgttatt catgctatta tttatgtacc aattttctat tctaatatat 8340
attctaagtt ttttttgtat caatactaag tatttataca atttttgcaa attttgacag 8400
aaagatagta caaaaaatat gaaagaccaa aaactacata aaccaccaaa aattacaaca 8460
caaacagaaa acggaaagaa aactcaatcg aaaactctac aagtagagac cttaaaagaa 8520
acttagattc caaaccacaa agctcaaata tttgtgtggt ttcctcaact taaaagatct 8580
caaatactta tagttgttgc cactagcaat ccaaacctag gccagttttc aaaatctcta 8640
aaaaagagct taccattcca aacttaggac aatcctcata atattttaaa ttttatgaca 8700
ttttttagtt ttttcttacc gaacatagag atacaacgaa taacacaaaa taccaaattt 8760
tactaaacaa acaattactg cacaaatgaa aaagtaatca acaacatgag ctcatttcac 8820
gaaaaaagaa gcgaaaaagc caacggtctt gccacaaatt agtatattgc aaattacaaa 8880
tgcttaaaaa aattcacaga tatattcatc aattatacct tttgattatc ttgcaaataa 8940
atcttccaat tcatattacc tacgtcaaaa tttagccatc tacccttatt atcccattat 9000
gaaaatttca aaatcgataa gatgacagac acccaacaac gaattatcat tttatatact 9060
ataggtatta gatacctaca atttatttgg tttattggga atatacgatt cataaattcc 9120
ctcataaaaa tataaagcaa atgtggacgg aagcaaaaaa actaaatata gaatggagag 9180
aaattgtatt attaacttag gttacccatc gccaacaacc tctcatttcc tttcctaaac 9240
tatttcacaa ttttggtcaa aaacacaatc taaccccaaa aaagattcga cctttgaaat 9300
tcccaaaacc agaagcaaaa cccccaaaag aaccctactt atagtgaaag aaaagtaaca 9360
taataatata tatacacgag aaccaagagc cacttgaata taaagttcac agtttttgtc 9420
tgctcaccaa atcaaaccaa tttctcctga tagccaaagt ttttgtcccc aacaagaaac 9480
tcatgcaaca ttcttcaccc actagctaac taacgacttc cattcttatt aatctctctc 9540
aattcttcat ttctgagatt catcgctctc tcttctcttt gtcacagcaa gtttgtacaa 9600
aaaagcaggc tccatgggaa gatcaccttg ttgtgataaa aatggagtga agaagggacc 9660
atggactgct gaggaggatc agaaactcat cgattatatt cgatttcatg gtcctggcaa 9720
ttggcgtacg ctccccaaaa atgctggtac gtataaacta cacaccgttc cttatatttt 9780
gttctcatag attaatatat atgttctcta tttattgagt cacacactta taagtcgtat 9840
tgtacaaatt aaaggactcc atagatgtgg aaaaagctgc cgtcttcgat ggaccaatta 9900
tctaagaccg gacatcaaga gaggaagatt ctcgttcgag gaagaagaaa ctatcattca 9960
gctacacagt gttatgggaa acaagtaagc ctgatcattc acaccataat ttttgtctga 10020
aattcatatt catcagctac atgcttttgt atgttaatta atgtaaaact caaaaaggga 10080
gagtgtacgt ttgcatgcgg gggtacatgt caaatgtagg ccatcaactc caataaacta 10140
ttattagtac tttactagta cgtattgacc tatattagaa taataataaa ggagttttgt 10200
attgatcata gattaatgtc actaatattg aattgatgaa tattaggtgg tcagcaatag 10260
ccgctcgtct accagggagg accgataacg aaataaaaaa ccattggaac actcacatcc 10320
gcaagagact tgtaaggagt ggtatcgacc ctgttactca ttctccacgc cttgatcttc 10380
ttgatttgtc ctcacttttg agtgcacttt tcaaccagcc aaacttttca gcagttgcaa 10440
cacatgcgtc ttctcttctt aatcctgatg tattgaggtt ggcctctcta ctactgccac 10500
ttcaaaaccc taatccagtt tacccatcga acctcgacca aaatcttcaa actccaaata 10560
catcatcaga atcgtctcaa ccacaagctg agactagtac agtcccaaca aactatgaaa 10620
cttcatcatt ggagcctatg aacgcaagac tcgacgacgt tggtcttgca gatgtattac 10680
cacctttgtc agagagtttt gacttagact cgctcatgtc aacgccaatg tcttctccac 10740
gacaaaatag cattgaagca gaaaccaact ccagcacttt cttcgacttt ggaattccgg 10800
aagatttcat cttagatgac tttatgtttg acccagcttt cttgtacaaa gtggcctaat 10860
tttcaacatt tgcatacaca tgtcttgctt tcacacatat gattctttgt tgcattcttt 10920
cttttgtttg atgtataaat ttcttgtttt tattctctca aaagatatta agttattagt 10980
ctataaaatt ttcatgaatg tttatgtatt atctgcttag gcgagatatc taaattctgc 11040
tccattagtc catatacaca gttgacggaa gcaaacatag aattattagc gtcaaacaca 11100
tcacatattc atattgcttt gttcgaatca tcgtcaatca agttaatcag tttatgcgag 11160
ttctatcatt taggcccaat tcaaggccca attcaagttc attttaaagc cgttaatttg 11220
gccagcaact ttattataca tagttgataa ttcactggcc gtcgttttac aacgtcgtga 11280
ctgggaaaac gatctaactg actagccgcg gccatggcgg ccgggagcgg ccatgctaga 11340
gtccgcaaaa atcaccagtc tctctctaca aatctatctc tctctatttt tctccagaat 11400
aatgtgtgag tagttcccag ataagggaat tagggttctt atagggtttc gctcatgtgt 11460
tgagcatata agaaaccctt agtatgtatt tgtatttgta aaatacttct atcaataaaa 11520
tttctaattc ctaaaaccaa aatccagtga cctgcaggtc gaccatatgg gag 11573
<210> 12
<211> 12171
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> proMYB84::MYB41构建体
<400> 12
agctcgaatt atcatacatg agaattaagg gagtcacgtt atgacccccg ccgatgacgc 60
gggacaagcc gttttacgtt tggaactgac agaaccgcaa cgttgaagga gccactgagc 120
cgcgggtttc tggagtttaa tgagctaagc acatacgtca gaaaccatta ttgcgcgttc 180
aaaagtcgcc taaggtcact atcagctagc aaatatttct tgtcaaaaat gctccactga 240
cgttccataa attcccctcg gtatccaatt agagtctcat attcactctc aactcgatcg 300
aggggatcta ccatgagccc agaacgacgc ccggccgaca tccgccgtgc caccgaggcg 360
gacatgccgg cggtctgcac catcgtcaac cactacatcg agacaagcac ggtcaacttc 420
cgtaccgagc cgcaggaacc gcaggagtgg acggacgacc tcgtccgtct gcgggagcgc 480
tatccctggc tcgtcgccga ggtggacggc gaggtcgccg gcatcgccta cgcgggtccc 540
tggaaggcac gcaacgccta cgactggacg gccgagtcga ccgtgtacgt ctccccccgc 600
caccagcgga cgggactggg ctccacgctc tacacccacc tgctgaagtc cctggaggca 660
cagggcttca agagcgtggt cgctgtcatc gggctgccca acgacccgag cgtgcgcatg 720
cacgaggcgc tcggatatgc cccccgcggc atgctgcggg cggccggctt caagcacggg 780
aactggcatg acgtgggttt ctggcagctg gacttcagcc tgccggtgcc gccccgtccg 840
gtcctgcccg tcaccgaaat ctgatgaccc ctagagtcaa gcagatcgtt caaacatttg 900
gcaataaagt ttcttaagat tgaatcctgt tgccggtctt gcgatgatta tcatataatt 960
tctgttgaat tacgttaagc atgtaataat taacatgtaa tgcatgacgt tatttatgag 1020
atgggttttt atgattagag tcccgcaatt atacatttaa tacgcgatag aaaacaaaat 1080
atagcgcgca aactaggata aattatcgcg cgcggtgtca tctatatgtt actagatcga 1140
ccggcatgca agctgataat tcaattcggc gttaattcag tacattaaaa acgtccgcaa 1200
tgtgttatta agttgtctaa gcgtcaattt gtttacacca caatatatcc tgccaccagc 1260
cagccaacag ctccccgacc ggcagctcgg cacaaaatca ccactcgata caggcagccc 1320
atcagtccgg gacggcgtca gcgggagagc cgttgtaagg cggcagactt tgctcatgtt 1380
accgatgcta ttcggaagaa cggcaactaa gctgccgggt ttgaaacacg gatgatctcg 1440
cggagggtag catgttgatt gtaacgatga cagagcgttg ctgcctgtga tcaattcggg 1500
cacgaaccca gtggacataa gcctcgttcg gttcgtaagc tgtaatgcaa gtagcgtaac 1560
tgccgtcacg caactggtcc agaaccttga ccgaacgcag cggtggtaac ggcgcagtgg 1620
cggttttcat ggcttcttgt tatgacatgt ttttttgggg tacagtctat gcctcgggca 1680
tccaagcagc aagcgcgtta cgccgtgggt cgatgtttga tgttatggag cagcaacgat 1740
gttacgcagc agggcagtcg ccctaaaaca aagttaaaca tcatggggga agcggtgatc 1800
gccgaagtat cgactcaact atcagaggta gttggcgtca tcgagcgcca tctcgaaccg 1860
acgttgctgg ccgtacattt gtacggctcc gcagtggatg gcggcctgaa gccacacagt 1920
gatattgatt tgctggttac ggtgaccgta aggcttgatg aaacaacgcg gcgagctttg 1980
atcaacgacc ttttggaaac ttcggcttcc cctggagaga gcgagattct ccgcgctgta 2040
gaagtcacca ttgttgtgca cgacgacatc attccgtggc gttatccagc taagcgcgaa 2100
ctgcaatttg gagaatggca gcgcaatgac attcttgcag gtatcttcga gccagccacg 2160
atcgacattg atctggctat cttgctgaca aaagcaagag aacatagcgt tgccttggta 2220
ggtccagcgg cggaggaact ctttgatccg gttcctgaac aggatctatt tgaggcgcta 2280
aatgaaacct taacgctatg gaactcgccg cccgactggg ctggcgatga gcgaaatgta 2340
gtgcttacgt tgtcccgcat ttggtacagc gcagtaaccg gcaaaatcgc gccgaaggat 2400
gtcgctgccg actgggcaat ggagcgcctg ccggcccagt atcagcccgt catacttgaa 2460
gctagacagg cttatcttgg acaagaagaa gatcgcttgg cctcgcgcgc agatcagttg 2520
gaagaatttg tccactacgt gaaaggcgag atcaccaagg tagtcggcaa ataatgtcta 2580
gctagaaatt cgttcaagcc gacgccgctt cgccggcgtt aactcaagcg attagatgca 2640
ctaagcacat aattgctcac agccaaacta tcaggtcaag tctgctttta ttatttttaa 2700
gcgtgcataa taagccctac acaaattggg agatatatca tgcatgacca aaatccctta 2760
acgtgagttt tcgttccact gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg 2820
agatcctttt tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac cgctaccagc 2880
ggtggtttgt ttgccggatc aagagctacc aactcttttt ccgaaggtaa ctggcttcag 2940
cagagcgcag ataccaaata ctgtccttct agtgtagccg tagttaggcc accacttcaa 3000
gaactctgta gcaccgccta catacctcgc tctgctaatc ctgttaccag tggctgctgc 3060
cagtggcgat aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac cggataaggc 3120
gcagcggtcg ggctgaacgg ggggttcgtg cacacagccc agcttggagc gaacgaccta 3180
caccgaactg agatacctac agcgtgagct atgagaaagc gccacgcttc ccgaagggag 3240
aaaggcggac aggtatccgg taagcggcag ggtcggaaca ggagagcgca cgagggagct 3300
tccaggggga aacgcctggt atctttatag tcctgtcggg tttcgccacc tctgacttga 3360
gcgtcgattt ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg ccagcaacgc 3420
ggccttttta cggttcctgg ccttttgctg gccttttgct cacatgttct ttcctgcgtt 3480
atcccctgat tctgtggata accgtattac cgcctttgag tgagctgata ccgctcgccg 3540
cagccgaacg accgagcgca gcgagtcagt gagcgaggaa gcggaagagc gcctgatgcg 3600
gtattttctc cttacgcatc tgtgcggtat ttcacaccgc atatggtgca ctctcagtac 3660
aatctgctct gatgccgcat agttaagcca gtatacactc cgctatcgct acgtgactgg 3720
gtcatggctg cgccccgaca cccgccaaca cccgctgacg cgccctgacg ggcttgtctg 3780
ctcccggcat ccgcttacag acaagctgtg accgtctccg ggagctgcat gtgtcagagg 3840
ttttcaccgt catcaccgaa acgcgcgagg cagggtgcct tgatgtgggc gccggcggtc 3900
gagtggcgac ggcgcggctt gtccgcgccc tggtagattg cctggccgta ggccagccat 3960
ttttgagcgg ccagcggccg cgataggccg acgcgaagcg gcggggcgta gggagcgcag 4020
cgaccgaagg gtaggcgctt tttgcagctc ttcggctgtg cgctggccag acagttatgc 4080
acaggccagg cgggttttaa gagttttaat aagttttaaa gagttttagg cggaaaaatc 4140
gccttttttc tcttttatat cagtcactta catgtgtgac cggttcccaa tgtacggctt 4200
tgggttccca atgtacgggt tccggttccc aatgtacggc tttgggttcc caatgtacgt 4260
gctatccaca ggaaagagac cttttcgacc tttttcccct gctagggcaa tttgccctag 4320
catctgctcc gtacattagg aaccggcgga tgcttcgccc tcgatcaggt tgcggtagcg 4380
catgactagg atcgggccag cctgccccgc ctcctccttc aaatcgtact ccggcaggtc 4440
atttgacccg atcagcttgc gcacggtgaa acagaacttc ttgaactctc cggcgctgcc 4500
actgcgttcg tagatcgtct tgaacaacca tctggcttct gccttgcctg cggcgcggcg 4560
tgccaggcgg tagagaaaac ggccgatgcc gggatcgatc aaaaagtaat cggggtgaac 4620
cgtcagcacg tccgggttct tgccttctgt gatctcgcgg tacatccaat cagctagctc 4680
gatctcgatg tactccggcc gcccggtttc gctctttacg atcttgtagc ggctaatcaa 4740
ggcttcaccc tcggataccg tcaccaggcg gccgttcttg gccttcttcg tacgctgcat 4800
ggcaacgtgc gtggtgttta accgaatgca ggtttctacc aggtcgtctt tctgctttcc 4860
gccatcggct cgccggcaga acttgagtac gtccgcaacg tgtggacgga acacgcggcc 4920
gggcttgtct cccttccctt cccggtatcg gttcatggat tcggttagat gggaaaccgc 4980
catcagtacc aggtcgtaat cccacacact ggccatgccg gccggccctg cggaaacctc 5040
tacgtgcccg tctggaagct cgtagcggat cacctcgcca gctcgtcggt cacgcttcga 5100
cagacggaaa acggccacgt ccatgatgct gcgactatcg cgggtgccca cgtcatagag 5160
catcggaacg aaaaaatctg gttgctcgtc gcccttgggc ggcttcctaa tcgacggcgc 5220
accggctgcc ggcggttgcc gggattcttt gcggattcga tcagcggccg cttgccacga 5280
ttcaccgggg cgtgcttctg cctcgatgcg ttgccgctgg gcggcctgcg cggccttcaa 5340
cttctccacc aggtcatcac ccagcgccgc gccgatttgt accgggccgg atggtttgcg 5400
accgtcacgc cgattcctcg ggcttggggg ttccagtgcc attgcagggc cggcagacaa 5460
cccagccgct tacgcctggc caaccgcccg ttcctccaca catggggcat tccacggcgt 5520
cggtgcctgg ttgttcttga ttttccatgc cgcctccttt agccgctaaa attcatctac 5580
tcatttattc atttgctcat ttactctggt agctgcgcga tgtattcaga tagcagctcg 5640
gtaatggtct tgccttggcg taccgcgtac atcttcagct tggtgtgatc ctccgccggc 5700
aactgaaagt tgacccgctt catggctggc gtgtctgcca ggctggccaa cgttgcagcc 5760
ttgctgctgc gtgcgctcgg acggccggca cttagcgtgt ttgtgctttt gctcattttc 5820
tctttacctc attaactcaa atgagttttg atttaatttc agcggccagc gcctggacct 5880
cgcgggcagc gtcgccctcg ggttctgatt caagaacggt tgtgccggcg gcggcagtgc 5940
ctgggtagct cacgcgctgc gtgatacggg actcaagaat gggcagctcg tacccggcca 6000
gcgcctcggc aacctcaccg ccgatgcgcg tgcctttgat cgcccgcgac acgacaaagg 6060
ccgcttgtag ccttccatcc gtgacctcaa tgcgctgctt aaccagctcc accaggtcgg 6120
cggtggccca tatgtcgtaa gggcttggct gcaccggaat cagcacgaag tcggctgcct 6180
tgatcgcgga cacagccaag tccgccgcct ggggcgctcc gtcgatcact acgaagtcgc 6240
gccggccgat ggccttcacg tcgcggtcaa tcgtcgggcg gtcgatgccg acaacggtta 6300
gcggttgatc ttcccgcacg gccgcccaat cgcgggcact gccctgggga tcggaatcga 6360
ctaacagaac atcggccccg gcgagttgca gggcgcgggc tagatgggtt gcgatggtcg 6420
tcttgcctga cccgcctttc tggttaagta cagcgataac cttcatgcgt tccccttgcg 6480
tatttgttta tttactcatc gcatcatata cgcagcgacc gcatgacgca agctgtttta 6540
ctcaaataca catcaccttt ttagacggcg gcgctcggtt tcttcagcgg ccaagctggc 6600
cggccaggcc gccagcttgg catcagacaa accggccagg atttcatgca gccgcacggt 6660
tgagacgtgc gcgggcggct cgaacacgta cccggccgcg atcatctccg cctcgatctc 6720
ttcggtaatg aaaaacggtt cgtcctggcc gtcctggtgc ggtttcatgc ttgttcctct 6780
tggcgttcat tctcggcggc cgccagggcg tcggcctcgg tcaatgcgtc ctcacggaag 6840
gcaccgcgcc gcctggcctc ggtgggcgtc acttcctcgc tgcgctcaag tgcgcggtac 6900
agggtcgagc gatgcacgcc aagcagtgca gccgcctctt tcacggtgcg gccttcctgg 6960
tcgatcagct cgcgggcgtg cgcgatctgt gccggggtga gggtagggcg ggggccaaac 7020
ttcacgcctc gggccttggc ggcctcgcgc ccgctccggg tgcggtcgat gattagggaa 7080
cgctcgaact cggcaatgcc ggcgaacacg gtcaacacca tgcggccggc cggcgtggtg 7140
gtgtcggccc acggctctgc caggctacgc aggcccgcgc cggcctcctg gatgcgctcg 7200
gcaatgtcca gtaggtcgcg ggtgctgcgg gccaggcggt ctagcctggt cactgtcaca 7260
acgtcgccag ggcgtaggtg gtcaagcatc ctggccagct ccgggcggtc gcgcctggtg 7320
ccggtgatct tctcggaaaa cagcttggtg cagccggccg cgtgcagttc ggcccgttgg 7380
ttggtcaagt cctggtcgtc ggtgctgacg cgggcatagc ccagcaggcc agcggcggcg 7440
ctcttgttca tggcgtaatg tctccggttc tagtcgcaag tattctactt tatgcgacta 7500
aaacacgcga caagaaaacg ccaggaaaag ggcagggcgg cagcctgtcg cgtaacttag 7560
gacttgtgcg acatgtcgtt ttcagaagac ggctgcactg aacgtcagaa gccgactgca 7620
ctatagcagc ggaggggttg gatcaaagta ctttgatccc gaggggaacc ctgtggttgg 7680
catgcacata caaatggacg aacggataaa ccttttcacg cccttttaaa tatccgttat 7740
tctaataaac gctcttttct cttaggttta cccgccaata tatcctgtca aacactgata 7800
gtttaaactg aaggcgggaa acgacaatct gatccaagct caagctaagc ttgggcccga 7860
gcggataaca atttcacaca ggaaacagct atgaccatga ttacgccaag ctatcaactt 7920
tgtatagaaa agttgcctct gagacatcat tgatatctaa caatcaaaaa ctaaaaagtg 7980
aagtattaac attttaatca gattcaaacc agaacttatc agtcatcaaa aatgttggca 8040
aataacaaat caaacttaag tttttggatg gagaaagcaa gctagattcg aatctctaag 8100
aagcgtggac ttggacttgt ttacgacctg aaaagatgtc atgattatct catgattacg 8160
agataataac atgtcttatc tactaaacta atctaaaaag tagtgaggat gacttgaaac 8220
ttaagtctta tatgaattat ctttaaatat agaaaaagaa aggagataga gaggtgtgtt 8280
tttcatgtga acaacttttt tttaccttta gagtacttcc agaagactta ttgggtcctt 8340
aataaaagta gaccaaatta ttgaagagct aaaaaaaaat gcctactcaa aatatccaaa 8400
cctcttcttt tagccttttg tttttttcaa tattcatact aatgtaaact acaatcattg 8460
tatcattcta taatcatatg aattttttgt caacaccatg cattatgcta gtttaaattt 8520
aggtgatgat ataaagatat tttaagtaca aatcaatagg ggcgatgttc ttatgtcttt 8580
atctaacttt atgaatttgt gttttatata ttatgaaaaa ttggaaaaga agagatggcc 8640
tacgctcaag accaattcct accaatgggc aatggtgttg aaatctgaac aaaaaaattt 8700
cctttcttta acgttagctt taaagttcaa aaaactttat ttactttttc agtgataatt 8760
ctgtataaaa taacatataa caatgaggaa aaaactcaat aatttgaatc gcttatgact 8820
ttatttctcc aagtgcttga cttttaaaac cctaatgtcc aatctcaact aaagtcaacc 8880
tttttcgttc gtctagaaga gtcagtcatt aagtttcaat tgaagtatac agtaaattat 8940
tagtactttt tattttattt taaccacagt tcattggctg tatgagattt ctgttcaaga 9000
aaacatataa atcgaaacca aagcaaaaga cattatttgc ttcggtttct tctactcaag 9060
ctcattttta gtaaaactaa attgtatttt cattttctta aaaagttaat tgtttttttt 9120
gtaaaatcag ttttaccaaa ttggacacaa taatgaatat atgtctatgt ctagtttttt 9180
ttagctcaga atatatctta tgtgaataga atcgtctatc agatattttt gtgatgcaga 9240
tagaacttac cgttatagaa tcatttgtag attgttcatc gtgattgtta agattagatt 9300
cccatttgta atataacaga aactcgaaaa gtacttatat taagtattaa cgatgtatca 9360
tgtgaccaaa atagaaaata ctacgtaatg atatgattat taagcgagtg tgtaggtaat 9420
tcaaatattt caattaatca atctttgata tcactcttta gagtaatgta ttatctttct 9480
tattgtttta ccctgggatt aataagttta ccggatccgg agtagaattt cttcggtttg 9540
gcaattttgt tcacctacca taacgaactt ttacccttat acttagtttc aatctacttt 9600
tggtgcatcc tttcattttc aactgcaaag aagtagttaa aagatccaat acataatata 9660
tttaatttat cataagtaac ttagtgtaaa gaaagactaa agtacttttt aaaatatgta 9720
tttgtatttc ccgatgtgaa agaaaagaaa attgaatttg cacatatcaa taatattagc 9780
taggaaaaaa cttgtgagaa atttctttga cgacttgcgt gtgcaatagt cttccttatc 9840
ttctctacca tttcttaatt ccactattgt atagtattta cttatgttga attaataaat 9900
taaaacattt aaatttccct aaagttactt tttgattttt gattttctat ttttattaca 9960
actttcctac tttttgacat cttttcttac aaagactttt tgacatctcc ccctccagct 10020
attatatagt ctcctttttt cttttctgca ttcacataat atttccccta tatagtttac 10080
acaacatcat acccaccaac atatataatc ttgatcatag agagataaac agaggccgct 10140
atcaagaaca agactaagaa caagacttca ctaggagtac aagtgcaagt ttgtacaaaa 10200
aagcaggctc catgggaaga tcaccttgtt gtgataaaaa tggagtgaag aagggaccat 10260
ggactgctga ggaggatcag aaactcatcg attatattcg atttcatggt cctggcaatt 10320
ggcgtacgct ccccaaaaat gctggtacgt ataaactaca caccgttcct tatattttgt 10380
tctcatagat taatatatat gttctctatt tattgagtca cacacttata agtcgtattg 10440
tacaaattaa aggactccat agatgtggaa aaagctgccg tcttcgatgg accaattatc 10500
taagaccgga catcaagaga ggaagattct cgttcgagga agaagaaact atcattcagc 10560
tacacagtgt tatgggaaac aagtaagcct gatcattcac accataattt ttgtctgaaa 10620
ttcatattca tcagctacat gcttttgtat gttaattaat gtaaaactca aaaagggaga 10680
gtgtacgttt gcatgcgggg gtacatgtca aatgtaggcc atcaactcca ataaactatt 10740
attagtactt tactagtacg tattgaccta tattagaata ataataaagg agttttgtat 10800
tgatcataga ttaatgtcac taatattgaa ttgatgaata ttaggtggtc agcaatagcc 10860
gctcgtctac cagggaggac cgataacgaa ataaaaaacc attggaacac tcacatccgc 10920
aagagacttg taaggagtgg tatcgaccct gttactcatt ctccacgcct tgatcttctt 10980
gatttgtcct cacttttgag tgcacttttc aaccagccaa acttttcagc agttgcaaca 11040
catgcgtctt ctcttcttaa tcctgatgta ttgaggttgg cctctctact actgccactt 11100
caaaacccta atccagttta cccatcgaac ctcgaccaaa atcttcaaac tccaaataca 11160
tcatcagaat cgtctcaacc acaagctgag actagtacag tcccaacaaa ctatgaaact 11220
tcatcattgg agcctatgaa cgcaagactc gacgacgttg gtcttgcaga tgtattacca 11280
cctttgtcag agagttttga cttagactcg ctcatgtcaa cgccaatgtc ttctccacga 11340
caaaatagca ttgaagcaga aaccaactcc agcactttct tcgactttgg aattccggaa 11400
gatttcatct tagatgactt tatgtttgac ccagctttct tgtacaaagt ggcctaattt 11460
tcaacatttg catacacatg tcttgctttc acacatatga ttctttgttg cattctttct 11520
tttgtttgat gtataaattt cttgttttta ttctctcaaa agatattaag ttattagtct 11580
ataaaatttt catgaatgtt tatgtattat ctgcttaggc gagatatcta aattctgctc 11640
cattagtcca tatacacagt tgacggaagc aaacatagaa ttattagcgt caaacacatc 11700
acatattcat attgctttgt tcgaatcatc gtcaatcaag ttaatcagtt tatgcgagtt 11760
ctatcattta ggcccaattc aaggcccaat tcaagttcat tttaaagccg ttaatttggc 11820
cagcaacttt attatacata gttgataatt cactggccgt cgttttacaa cgtcgtgact 11880
gggaaaacga tctaactgac tagccgcggc catggcggcc gggagcggcc atgctagagt 11940
ccgcaaaaat caccagtctc tctctacaaa tctatctctc tctatttttc tccagaataa 12000
tgtgtgagta gttcccagat aagggaatta gggttcttat agggtttcgc tcatgtgttg 12060
agcatataag aaacccttag tatgtatttg tatttgtaaa atacttctat caataaaatt 12120
tctaattcct aaaaccaaaa tccagtgacc tgcaggtcga ccatatggga g 12171
<210> 13
<211> 1216
<212> DNA
<213> 拟南芥
<400> 13
atgggaagat caccttgttg tgataaaaat ggagtgaaga agggaccatg gactgctgag 60
gaggatcaga aactcatcga ttatattcga tttcatggtc ctggcaattg gcgtacgctc 120
cccaaaaatg ctggtacgta taaactacac accgttcctt atattttgtt ctcatagatt 180
aatatatatg ttctctattt attgagtcac acacttataa gtcgtattgt acaaattaaa 240
ggactccata gatgtggaaa aagctgccgt cttcgatgga ccaattatct aagaccggac 300
atcaagagag gaagattctc gttcgaggaa gaagaaacta tcattcagct acacagtgtt 360
atgggaaaca agtaagcctg atcattcaca ccataatttt tgtctgaaat tcatattcat 420
cagctacatg cttttgtatg ttaattaatg taaaactcaa aaagggagag tgtacgtttg 480
catgcggggg tacatgtcaa atgtaggcca tcaactccaa taaactatta ttagtacttt 540
actagtacgt attgacctat attagaataa taataaagga gttttgtatt gatcatagat 600
taatgtcact aatattgaat tgatgaatat taggtggtca gcaatagccg ctcgtctacc 660
agggaggacc gataacgaaa taaaaaacca ttggaacact cacatccgca agagacttgt 720
aaggagtggt atcgaccctg ttactcattc tccacgcctt gatcttcttg atttgtcctc 780
acttttgagt gcacttttca accagccaaa cttttcagca gttgcaacac atgcgtcttc 840
tcttcttaat cctgatgtat tgaggttggc ctctctacta ctgccacttc aaaaccctaa 900
tccagtttac ccatcgaacc tcgaccaaaa tcttcaaact ccaaatacat catcagaatc 960
gtctcaacca caagctgaga ctagtacagt cccaacaaac tatgaaactt catcattgga 1020
gcctatgaac gcaagactcg acgacgttgg tcttgcagat gtattaccac ctttgtcaga 1080
gagttttgac ttagactcgc tcatgtcaac gccaatgtct tctccacgac aaaatagcat 1140
tgaagcagaa accaactcca gcactttctt cgactttgga attccggaag atttcatctt 1200
agatgacttt atgttt 1216
<210> 14
<211> 282
<212> PRT
<213> 拟南芥
<400> 14
Met Gly Arg Ser Pro Cys Cys Asp Lys Asn Gly Val Lys Lys Gly Pro
1 5 10 15
Trp Thr Ala Glu Glu Asp Gln Lys Leu Ile Asp Tyr Ile Arg Phe His
20 25 30
Gly Pro Gly Asn Trp Arg Thr Leu Pro Lys Asn Ala Gly Leu His Arg
35 40 45
Cys Gly Lys Ser Cys Arg Leu Arg Trp Thr Asn Tyr Leu Arg Pro Asp
50 55 60
Ile Lys Arg Gly Arg Phe Ser Phe Glu Glu Glu Glu Thr Ile Ile Gln
65 70 75 80
Leu His Ser Val Met Gly Asn Lys Trp Ser Ala Ile Ala Ala Arg Leu
85 90 95
Pro Gly Arg Thr Asp Asn Glu Ile Lys Asn His Trp Asn Thr His Ile
100 105 110
Arg Lys Arg Leu Val Arg Ser Gly Ile Asp Pro Val Thr His Ser Pro
115 120 125
Arg Leu Asp Leu Leu Asp Leu Ser Ser Leu Leu Ser Ala Leu Phe Asn
130 135 140
Gln Pro Asn Phe Ser Ala Val Ala Thr His Ala Ser Ser Leu Leu Asn
145 150 155 160
Pro Asp Val Leu Arg Leu Ala Ser Leu Leu Leu Pro Leu Gln Asn Pro
165 170 175
Asn Pro Val Tyr Pro Ser Asn Leu Asp Gln Asn Leu Gln Thr Pro Asn
180 185 190
Thr Ser Ser Glu Ser Ser Gln Pro Gln Ala Glu Thr Ser Thr Val Pro
195 200 205
Thr Asn Tyr Glu Thr Ser Ser Leu Glu Pro Met Asn Ala Arg Leu Asp
210 215 220
Asp Val Gly Leu Ala Asp Val Leu Pro Pro Leu Ser Glu Ser Phe Asp
225 230 235 240
Leu Asp Ser Leu Met Ser Thr Pro Met Ser Ser Pro Arg Gln Asn Ser
245 250 255
Ile Glu Ala Glu Thr Asn Ser Ser Thr Phe Phe Asp Phe Gly Ile Pro
260 265 270
Glu Asp Phe Ile Leu Asp Asp Phe Met Phe
275 280
<210> 15
<211> 849
<212> DNA
<213> 拟南芥
<400> 15
atgggaagat caccttgttg tgataaaaat ggagtgaaga agggaccatg gactgctgag 60
gaggatcaga aactcatcga ttatattcga tttcatggtc ctggcaattg gcgtacgctc 120
cccaaaaatg ctggactcca tagatgtgga aaaagctgcc gtcttcgatg gaccaattat 180
ctaagaccgg acatcaagag aggaagattc tcgttcgagg aagaagaaac tatcattcag 240
ctacacagtg ttatgggaaa caagtggtca gcaatagccg ctcgtctacc agggaggacc 300
gataacgaaa taaaaaacca ttggaacact cacatccgca agagacttgt aaggagtggt 360
atcgaccctg ttactcattc tccacgcctt gatcttcttg atttgtcctc acttttgagt 420
gcacttttca accagccaaa cttttcagca gttgcaacac atgcgtcttc tcttcttaat 480
cctgatgtat tgaggttggc ctctctacta ctgccacttc aaaaccctaa tccagtttac 540
ccatcgaacc tcgaccaaaa tcttcaaact ccaaatacat catcagaatc gtctcaacca 600
caagctgaga ctagtacagt cccaacaaac tatgaaactt catcattgga gcctatgaac 660
gcaagactcg acgacgttgg tcttgcagat gtattaccac ctttgtcaga gagttttgac 720
ttagactcgc tcatgtcaac gccaatgtct tctccacgac aaaatagcat tgaagcagaa 780
accaactcca gcactttctt cgactttgga attccggaag atttcatctt agatgacttt 840
atgttttaa 849
<210> 16
<211> 3220
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> proFACT::MYB41表达盒
<400> 16
ggttaagagt ttcgttttcc ttcgttcaaa atctaatgtg aaggaaagca aaactgacac 60
aacttttgtg tgaaccagag caagtgaaag tgtgtcgaat ctgtactttt gtactgtgta 120
atctctatag tctgactctc attatgtagt tttaagtgtc ttttacttgt gtagctgtta 180
cctgttacct gttaggtttt ctaatccttg ttttatttga tagccagata ctttagggaa 240
ttttacttct tcttttcttg ggtttaattt aagacatatt cgtatatttc atttaattct 300
gttatctgat ttgtgagatc atgaaaacga atgttgaact tgaaacttga gtgggttcag 360
aaaaactact ctgtattaaa aatcccagtg tcacatgata atgatccttc agtaaaggta 420
gacatagctt ttttgcagtg tgatatgcac aaatacaatc tatattttta tgtaaaagat 480
atatttcttt gaaagtactt ataaaaatat gtttttcata aaaaaaatta tatgtaattc 540
tgaaagtatg tgatatgcac aagcacaacc tatatttcct acattcaaat tcgggttttt 600
cttgacgcca agttacattc aattatcaat aatagggcta gttcaactaa tgctatttat 660
ttatacaatc cacccactac taaatctcaa tctccaagga tctttatata ttaataagaa 720
aagctactat ccaaatgcga ccttgttcgt gaagtgtttg gtttataatt tggtggctta 780
agactatagc ccaccattga cccaaaaaaa gaaaggaaaa ttaatagtag actatatagc 840
taccaactcc ctataattta ccttgaaatt aaaccagctt tgtatttttt taatagaagt 900
cagggctcta cagtttcatt ttaaactttt ttttttgtta tattacatcc tgcaggttag 960
ttgtaatttg taaacgtaat caacataata aaaccattta catagactga ttaaagttga 1020
ttccatttga taatatttag ctatttatat atcaatcaac caccagctct taaatatatg 1080
tattcaaatt gttttgttga ctctttttgc tacactttaa atttgaatct agaatgttgt 1140
cctgaaacaa aaatctgtgg attgaacaaa attatacacc aggtaaaatt ttgaagtttt 1200
taaaagcagg atcacatact cctaatttta gattggatag atctagtata aaaatatgaa 1260
gtttttttcc caaaaaataa taataccatt tagctcttaa ttaaatgcat gcaaactaaa 1320
gataaaaaga ggaattattt taaccattct aactcgtcac aacatgccta atcattccag 1380
gttaatttta gagttttcaa atcgtcatat taacatgtga tcctgaagac tcttctcttc 1440
tttcttctac cattagctga aatctttact tgtaccacaa ttaacctcaa accctagccc 1500
ctaaatcccc ctagaaatca atccatcctc agttctccaa aaagatatct ttggtttttc 1560
ttcactgaca aaacccctaa aaacaagttt gtacaaaaaa gcaggctcca tgggaagatc 1620
accttgttgt gataaaaatg gagtgaagaa gggaccatgg actgctgagg aggatcagaa 1680
actcatcgat tatattcgat ttcatggtcc tggcaattgg cgtacgctcc ccaaaaatgc 1740
tggtacgtat aaactacaca ccgttcctta tattttgttc tcatagatta atatatatgt 1800
tctctattta ttgagtcaca cacttataag tcgtattgta caaattaaag gactccatag 1860
atgtggaaaa agctgccgtc ttcgatggac caattatcta agaccggaca tcaagagagg 1920
aagattctcg ttcgaggaag aagaaactat cattcagcta cacagtgtta tgggaaacaa 1980
gtaagcctga tcattcacac cataattttt gtctgaaatt catattcatc agctacatgc 2040
ttttgtatgt taattaatgt aaaactcaaa aagggagagt gtacgtttgc atgcgggggt 2100
acatgtcaaa tgtaggccat caactccaat aaactattat tagtacttta ctagtacgta 2160
ttgacctata ttagaataat aataaaggag ttttgtattg atcatagatt aatgtcacta 2220
atattgaatt gatgaatatt aggtggtcag caatagccgc tcgtctacca gggaggaccg 2280
ataacgaaat aaaaaaccat tggaacactc acatccgcaa gagacttgta aggagtggta 2340
tcgaccctgt tactcattct ccacgccttg atcttcttga tttgtcctca cttttgagtg 2400
cacttttcaa ccagccaaac ttttcagcag ttgcaacaca tgcgtcttct cttcttaatc 2460
ctgatgtatt gaggttggcc tctctactac tgccacttca aaaccctaat ccagtttacc 2520
catcgaacct cgaccaaaat cttcaaactc caaatacatc atcagaatcg tctcaaccac 2580
aagctgagac tagtacagtc ccaacaaact atgaaacttc atcattggag cctatgaacg 2640
caagactcga cgacgttggt cttgcagatg tattaccacc tttgtcagag agttttgact 2700
tagactcgct catgtcaacg ccaatgtctt ctccacgaca aaatagcatt gaagcagaaa 2760
ccaactccag cactttcttc gactttggaa ttccggaaga tttcatctta gatgacttta 2820
tgtttgaccc agctttcttg tacaaagtgg cctaattttc aacatttgca tacacatgtc 2880
ttgctttcac acatatgatt ctttgttgca ttctttcttt tgtttgatgt ataaatttct 2940
tgtttttatt ctctcaaaag atattaagtt attagtctat aaaattttca tgaatgttta 3000
tgtattatct gcttaggcga gatatctaaa ttctgctcca ttagtccata tacacagttg 3060
acggaagcaa acatagaatt attagcgtca aacacatcac atattcatat tgctttgttc 3120
gaatcatcgt caatcaagtt aatcagttta tgcgagttct atcatttagg cccaattcaa 3180
ggcccaattc aagttcattt taaagccgtt aatttggcca 3220
<210> 17
<211> 3720
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> proHORST::MYB41表达盒
<400> 17
catctacaaa gcctataaaa tggaaagatg tatgcatcga tgatgattct gcctcactta 60
gaagaatcaa aaagctaaaa ggagctgcga atcctgggca acgatgactt agtatgtata 120
gaagaaaaaa aaagctttta cttggtatca aacagagcat gtgttgttgt atttgctacc 180
tttttctgca aagttattgg caattgtatt gttgttccac ttgtatatat acagagacca 240
tttatgttaa tatacaactt cgtatgggga aagatgattc catcaagtcc aaaatgccaa 300
aaccatgcac gatcttgtct gatcaagtat gataagatgt gagattttaa gaacgtgaag 360
cttttcatat tgtattctca atgaacgaag aattaataat tagagttaga aatgcagatt 420
acagagatta cacaatttga tctcatttct tggcaaagag gcccaggcca ccgaagccac 480
cgtccttctt tggattcctg tgtgttaatt ttcgtgtggc tttagttaca aagggattat 540
attgtcagcg aatctgagcc gttggatcgt tttgacatga gctttccata agtgtcttat 600
cctttgtttc tctcattttt cacatatgta tcagacattt aatcaagcac atatctacgt 660
gttgattatg ttgatgatgc tgagattatg ttgatttaga gaatgagtat tggtgatgat 720
ggtacacgtt agtaaacata tgaatttgga agtgccacgt gagagggagc agagttttgg 780
gctttctttt ggttatgtat ttgcattctt gttgtaacaa attctcttat taaaagcatt 840
gtgaaaaaaa ccaaatacca catagtctat gtttcaagat ttgtttttta atactataat 900
tttctattac tttagtttgt gtaatttttg aaaagagaaa attggtattt tttaggattg 960
ggtgatctga aatttgacta caaaaatttt cttggacaca gacacacagt cacacaaata 1020
agctaattat tggaatttta tcttaagttg cattcacttt gcaaattaat attgaattat 1080
agactattag tgtatggcgt gatggcaaac aaaaaaatca gtgtgtgata ttgtggacta 1140
gccaaaaaaa ttttctgatg atttttttgc ctaaataatt tgaattgttg agaccgaaac 1200
tcttactaat atactaacaa tgtaacgcga caaataaaac attgttgaga ataaaatctg 1260
aaccatcata actatagtct atagtaaccg tccgaattca accacatatg tatgatcttt 1320
gccatttttg atcatatttt ccgttgcgtt ttctttgaat tttctcaata tatttttagt 1380
gttttgattt gtacttttat ctaatttata taattgtttt tcaaatgttt cgcaattgtg 1440
cgtttaagta ttcgactcga agtaaaccca gtttcttaga atgggctaac tgccattgac 1500
caaatcttta tccgcgaaga aagatcttta gcagctaggc ttatttcata tcaacaaaag 1560
tatatattta tctctaacta aattcctaca attatttcaa aaacatagaa attaaaattt 1620
gaaatgccta ttcttttttg gttatacatt gcaaaggtta tgtatgtaat ttctgatctt 1680
gaaatttaag ttctttagcc catatctagt tgattttcac gaaatattgt cgtttactct 1740
cgtttttata tataaagcat gtacatataa catataatca atgcttcaaa agaaaaaaat 1800
aatcataact aaattgaaac gggaaaacta atttgctttc gtgttctatt atgccaaact 1860
gtactcacaa tagtcttatc ctatcgaccc aaatttaatc ttcccaacta cttactccta 1920
attgaaacaa aatataacct ttcttactat agcctatatt taaaaaatat ctatgatttc 1980
tacatttata tatatacgca cacggcacat acctctcatt caccatatat gcctcttaac 2040
aatctctcca cagaacaaaa gcaaaaagcc taaaccggga tagcaagttt gtacaaaaaa 2100
gcaggctcca tgggaagatc accttgttgt gataaaaatg gagtgaagaa gggaccatgg 2160
actgctgagg aggatcagaa actcatcgat tatattcgat ttcatggtcc tggcaattgg 2220
cgtacgctcc ccaaaaatgc tggtacgtat aaactacaca ccgttcctta tattttgttc 2280
tcatagatta atatatatgt tctctattta ttgagtcaca cacttataag tcgtattgta 2340
caaattaaag gactccatag atgtggaaaa agctgccgtc ttcgatggac caattatcta 2400
agaccggaca tcaagagagg aagattctcg ttcgaggaag aagaaactat cattcagcta 2460
cacagtgtta tgggaaacaa gtaagcctga tcattcacac cataattttt gtctgaaatt 2520
catattcatc agctacatgc ttttgtatgt taattaatgt aaaactcaaa aagggagagt 2580
gtacgtttgc atgcgggggt acatgtcaaa tgtaggccat caactccaat aaactattat 2640
tagtacttta ctagtacgta ttgacctata ttagaataat aataaaggag ttttgtattg 2700
atcatagatt aatgtcacta atattgaatt gatgaatatt aggtggtcag caatagccgc 2760
tcgtctacca gggaggaccg ataacgaaat aaaaaaccat tggaacactc acatccgcaa 2820
gagacttgta aggagtggta tcgaccctgt tactcattct ccacgccttg atcttcttga 2880
tttgtcctca cttttgagtg cacttttcaa ccagccaaac ttttcagcag ttgcaacaca 2940
tgcgtcttct cttcttaatc ctgatgtatt gaggttggcc tctctactac tgccacttca 3000
aaaccctaat ccagtttacc catcgaacct cgaccaaaat cttcaaactc caaatacatc 3060
atcagaatcg tctcaaccac aagctgagac tagtacagtc ccaacaaact atgaaacttc 3120
atcattggag cctatgaacg caagactcga cgacgttggt cttgcagatg tattaccacc 3180
tttgtcagag agttttgact tagactcgct catgtcaacg ccaatgtctt ctccacgaca 3240
aaatagcatt gaagcagaaa ccaactccag cactttcttc gactttggaa ttccggaaga 3300
tttcatctta gatgacttta tgtttgaccc agctttcttg tacaaagtgg cctaattttc 3360
aacatttgca tacacatgtc ttgctttcac acatatgatt ctttgttgca ttctttcttt 3420
tgtttgatgt ataaatttct tgtttttatt ctctcaaaag atattaagtt attagtctat 3480
aaaattttca tgaatgttta tgtattatct gcttaggcga gatatctaaa ttctgctcca 3540
ttagtccata tacacagttg acggaagcaa acatagaatt attagcgtca aacacatcac 3600
atattcatat tgctttgttc gaatcatcgt caatcaagtt aatcagttta tgcgagttct 3660
atcatttagg cccaattcaa ggcccaattc aagttcattt taaagccgtt aatttggcca 3720
<210> 18
<211> 3648
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> proASFT::MYB41表达盒
<400> 18
agctcaaacc tttaaatggc ttttaattag atatatttag cgagaatgtg attgctagtg 60
aaatctcaaa cttgatagct tattcatagc ttattttact tcgatcagca agagaacaat 120
ggttcctaaa gctcaaacct tttttggcgt ttgctttaga ttgtgcatac ataaagtgag 180
aagatgaaat atggttttgc tgaaatctca atgtgctcat tcatagttta ttttgctcga 240
cctttcttta atcaatagct ttgatgtact gattacttta taaagttaag aagtaagttc 300
tgctctttaa actgtactga atggaggctt ctctgcataa ttaagcaaac actctgatga 360
ttgagtttcg ttgtacaaag gaaagttttt gccttagtta gaaattcatc ttgtttcttt 420
gcccagaagc tggcttgctg atagaatttg gactacgcta cgttttcttg ggtgaaaaac 480
aatccgcgtc cttccacgag aacagtgaaa ctgtacgatg ttcttattgt attgtgtcaa 540
cagcccataa tcaatgaaat gggcctcaat gacagtataa gccgaaaaat attcgaatgc 600
gatctagaac taatctgaaa ccaaacttct caaatcatta acatttgatt agggcctaaa 660
agtccatccg tattttaaaa aaaagttgat aacaaatgca aaaatacaaa tatacattac 720
tattaaaact caatctttct gattatatgt ggatggagaa gctgttttgc agtgtggatt 780
tgaattttga agttcttgtt caaaaaagaa aagaaacttg gtcaagcttc aaaagaaaga 840
aagaaataaa gacaagtata caaatacgtt gacttcaatt aatatgaaga tagaagagaa 900
agatatagaa atgcgtttta aattggcggt gggagatatg tgattccctt ggtcccgctt 960
tctcgtttga ttcggtaacc taaaccttct ccatccaaga agacacaaac aaggaagaaa 1020
ttaacctacg tacgtacatc atttgaacta cttatatcta ttataaatgg aaaatctatt 1080
ttcttcttct ctctctttta accgaaaaag gaaaagtcct cgaaataact ctttaatata 1140
attcatgtgg aaaccttcta tatatttttt gcatgctttt ttgaaattaa gtaatggcat 1200
actaattaga agaagacgaa aaataatatg tctaagtaat tgagtttcgt ggtcaaggca 1260
aatcaagatt gcattcttta attaagtgta caaattatga tgtaagaacc gttatttggc 1320
ataacctaat atatattaaa aactgatttt tttttttttt aacttctgta agaaatggtt 1380
ttcttaatta ccaatcatga tctattattg taaaatgtgt aattttgtgt tgcgattgaa 1440
gtgttcttag ataaagatat gtcatatgca tgatatcatc tatttgattt tgagaaaata 1500
aaaacataac atgagaacat cgtagagagt aagatacatg acaaagagaa agaataagct 1560
aagaagtcat ccaaaaattg ggaggcctac tctcaactac caaaaataca agtgtttgtt 1620
gtgttaggtc atttattcag tcacctaacc ctaactatat gaaatacgtt aaaattcata 1680
tatagaaaaa taaagaagaa atactattag tcaatataat tttttttaac aaaataaaaa 1740
taaagaaaga aacactatta gtcaatgaat taaaaaaaaa aaaatccatc tttcgatcaa 1800
gaccgtccaa gtattctcct ttcacataac tcttacgttt tacactaaac aagacgagat 1860
ttttatgagc ttgtggctcc cacaacaatc ctcattgatt tctccatata tatcacatga 1920
gaatccaact cgacttcata ctaacattca tcccaaaagt tccattcttt ttcacaaagc 1980
cattgtgctg ttttctccat ttggatcaaa gcaagtttgt acaaaaaagc aggctccatg 2040
ggaagatcac cttgttgtga taaaaatgga gtgaagaagg gaccatggac tgctgaggag 2100
gatcagaaac tcatcgatta tattcgattt catggtcctg gcaattggcg tacgctcccc 2160
aaaaatgctg gtacgtataa actacacacc gttccttata ttttgttctc atagattaat 2220
atatatgttc tctatttatt gagtcacaca cttataagtc gtattgtaca aattaaagga 2280
ctccatagat gtggaaaaag ctgccgtctt cgatggacca attatctaag accggacatc 2340
aagagaggaa gattctcgtt cgaggaagaa gaaactatca ttcagctaca cagtgttatg 2400
ggaaacaagt aagcctgatc attcacacca taatttttgt ctgaaattca tattcatcag 2460
ctacatgctt ttgtatgtta attaatgtaa aactcaaaaa gggagagtgt acgtttgcat 2520
gcgggggtac atgtcaaatg taggccatca actccaataa actattatta gtactttact 2580
agtacgtatt gacctatatt agaataataa taaaggagtt ttgtattgat catagattaa 2640
tgtcactaat attgaattga tgaatattag gtggtcagca atagccgctc gtctaccagg 2700
gaggaccgat aacgaaataa aaaaccattg gaacactcac atccgcaaga gacttgtaag 2760
gagtggtatc gaccctgtta ctcattctcc acgccttgat cttcttgatt tgtcctcact 2820
tttgagtgca cttttcaacc agccaaactt ttcagcagtt gcaacacatg cgtcttctct 2880
tcttaatcct gatgtattga ggttggcctc tctactactg ccacttcaaa accctaatcc 2940
agtttaccca tcgaacctcg accaaaatct tcaaactcca aatacatcat cagaatcgtc 3000
tcaaccacaa gctgagacta gtacagtccc aacaaactat gaaacttcat cattggagcc 3060
tatgaacgca agactcgacg acgttggtct tgcagatgta ttaccacctt tgtcagagag 3120
ttttgactta gactcgctca tgtcaacgcc aatgtcttct ccacgacaaa atagcattga 3180
agcagaaacc aactccagca ctttcttcga ctttggaatt ccggaagatt tcatcttaga 3240
tgactttatg tttgacccag ctttcttgta caaagtggcc taattttcaa catttgcata 3300
cacatgtctt gctttcacac atatgattct ttgttgcatt ctttcttttg tttgatgtat 3360
aaatttcttg tttttattct ctcaaaagat attaagttat tagtctataa aattttcatg 3420
aatgtttatg tattatctgc ttaggcgaga tatctaaatt ctgctccatt agtccatata 3480
cacagttgac ggaagcaaac atagaattat tagcgtcaaa cacatcacat attcatattg 3540
ctttgttcga atcatcgtca atcaagttaa tcagtttatg cgagttctat catttaggcc 3600
caattcaagg cccaattcaa gttcatttta aagccgttaa tttggcca 3648
<210> 19
<211> 3784
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> proGPAT5::MYB41表达盒
<400> 19
tgatcgcaaa cgtcaatggt ctatatccat ctcttgggga tacaccattc agatatacac 60
ttacttcttg actgctacgg agctgactac gccgttgcag accttcaaaa cttggcggtc 120
ttccagcgat ggacctttcg tgtttaacac tcggcccttg aaacctgacc cctgtgagcg 180
tccggtcact tatttcatgg atggtgccga ggatgtacgg gatagtggga cgaaaacttg 240
gtatagcata ggggataaga actatggtca ttgcggaaag attgagcata ctcgattaac 300
taaagtgaag aggatattgg tgacttcaat gaagacggat cctgagtatt ggaacaaggt 360
acttagtgtt tgtatatttc tcatattgaa tttaacattt tgggtgagtt taggttacat 420
cttttttttt attttttgct tttgttgata ggcaccgagg agacagtgtt gtgaggtgat 480
ggaaggaaaa gtaggaaaaa gaaaagagaa agaaatgttg ttaaggatta gaaaatgcag 540
atctttggag aagatataaa aaaagcgttt taattagaga gatttttgca catacagatt 600
tagattcgat cattagttat ttgtttctaa attcctcaat tcctagtacc aagagaatga 660
cgattttctc tagtaatact ggcactcttc gtttttcaac atgtaaacat tactttgtat 720
aattagtcta tatcaaataa atagttacaa catgaacgta actatttata cacgagggta 780
aatttttaac aaatttaaac cgaaccaaaa agatttcagt taatcatagt tttgttacaa 840
gcgaaatctg aaatattcac cctcaagttt gttacgtaat tgtctaatct gtgttttttt 900
gtgctagtgt tataattgtt tcctcgaatg ttaagcacca catagaagta tacacttttc 960
ttttattatt ttcgttcttc ttccatttag aaacttttat taattctact gttaaatcca 1020
acgttattag tttattttct ctgatgaagt tctaattttt tttgtttgtt ggaaaaaggg 1080
ttacttttct gatgaagttg ccgatttgtt tccaaccaaa cctcagctaa tatagttagg 1140
gagacggata agaaattgca taaagggaga ggctttgtaa acacgcaagt ttacgtcaac 1200
ttgacacata taaactcgta tataggaatt gtgtaaaatg ttaatcaata tatgtttatg 1260
aatatagtcc ttttatttcc ttaatctata gtcatgttat catcatatcg gcaagaaaat 1320
tactattaca acatatgttt ccgtgcttcg atttgtcgat caggtaggca accaaaccgg 1380
gccagattag tcacaaatga aattaggctc cactttggca agttttttca caattaaaaa 1440
ttagaaagtc taaccaaact aatagaaact gaaccaaaca aaaatgttca cgcaattacg 1500
tagcacttct ctatgaaata ctgtggataa ttcgatttga gctaatctat ggtaagtcgt 1560
ttctctcaaa ctgaattaag ctaaaccaaa ccgaaaataa accgttgtag aacacccata 1620
ataaacatat atatgttctc tactcttatt tggctatttt tccatttgca gatacgtgtg 1680
acaacattcc aaatataggc acatgataca aattacaaag ccagaaatta taatttataa 1740
actatacata ataaggtcag tagcctaatt acatccatat atttagttgg gcataataag 1800
gatagcctaa ttttggtgca tcccgccaaa aattcggaca aatggtgaat ttcaaaccat 1860
gaatttcttt gttatacata cattacgtgc actattacat caaagaaaaa tagtgacgtg 1920
cataaacgta ttttcttcac ataatctata tataatatat acagccatgt acatttttca 1980
acatagaaaa atcatgtata caaatacggt aggtgcaata ctgataaact gccattccca 2040
ttgcattaga cgctagtcaa tccaaacctt ataacataaa aagttatagt ccatttcttt 2100
catatccaat cgagtcaaaa taatattcga gcaaaaaaca aaagaagcaa gtttgtacaa 2160
aaaagcaggc tccatgggaa gatcaccttg ttgtgataaa aatggagtga agaagggacc 2220
atggactgct gaggaggatc agaaactcat cgattatatt cgatttcatg gtcctggcaa 2280
ttggcgtacg ctccccaaaa atgctggtac gtataaacta cacaccgttc cttatatttt 2340
gttctcatag attaatatat atgttctcta tttattgagt cacacactta taagtcgtat 2400
tgtacaaatt aaaggactcc atagatgtgg aaaaagctgc cgtcttcgat ggaccaatta 2460
tctaagaccg gacatcaaga gaggaagatt ctcgttcgag gaagaagaaa ctatcattca 2520
gctacacagt gttatgggaa acaagtaagc ctgatcattc acaccataat ttttgtctga 2580
aattcatatt catcagctac atgcttttgt atgttaatta atgtaaaact caaaaaggga 2640
gagtgtacgt ttgcatgcgg gggtacatgt caaatgtagg ccatcaactc caataaacta 2700
ttattagtac tttactagta cgtattgacc tatattagaa taataataaa ggagttttgt 2760
attgatcata gattaatgtc actaatattg aattgatgaa tattaggtgg tcagcaatag 2820
ccgctcgtct accagggagg accgataacg aaataaaaaa ccattggaac actcacatcc 2880
gcaagagact tgtaaggagt ggtatcgacc ctgttactca ttctccacgc cttgatcttc 2940
ttgatttgtc ctcacttttg agtgcacttt tcaaccagcc aaacttttca gcagttgcaa 3000
cacatgcgtc ttctcttctt aatcctgatg tattgaggtt ggcctctcta ctactgccac 3060
ttcaaaaccc taatccagtt tacccatcga acctcgacca aaatcttcaa actccaaata 3120
catcatcaga atcgtctcaa ccacaagctg agactagtac agtcccaaca aactatgaaa 3180
cttcatcatt ggagcctatg aacgcaagac tcgacgacgt tggtcttgca gatgtattac 3240
cacctttgtc agagagtttt gacttagact cgctcatgtc aacgccaatg tcttctccac 3300
gacaaaatag cattgaagca gaaaccaact ccagcacttt cttcgacttt ggaattccgg 3360
aagatttcat cttagatgac tttatgtttg acccagcttt cttgtacaaa gtggcctaat 3420
tttcaacatt tgcatacaca tgtcttgctt tcacacatat gattctttgt tgcattcttt 3480
cttttgtttg atgtataaat ttcttgtttt tattctctca aaagatatta agttattagt 3540
ctataaaatt ttcatgaatg tttatgtatt atctgcttag gcgagatatc taaattctgc 3600
tccattagtc catatacaca gttgacggaa gcaaacatag aattattagc gtcaaacaca 3660
tcacatattc atattgcttt gttcgaatca tcgtcaatca agttaatcag tttatgcgag 3720
ttctatcatt taggcccaat tcaaggccca attcaagttc attttaaagc cgttaatttg 3780
gcca 3784
<210> 20
<211> 3287
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> proRALPH::MYB41表达盒
<400> 20
ctttcctctg aaacgattct ccacgctctt tgtttataag gattgcaaga aattactgaa 60
gaacatcagg aatcgcgaga gcttggggcg aatcaaaaac ctccattgat gaagaagact 120
gcatctagta ctttacttac tcggtagcac acctccatgg gcaggctcca gcaccatggt 180
tgggcccatt tcttattaat gggcctaaaa tagagcttct agggcctcta tatattttgt 240
cttttctctt ccgtttaggc gttttgctaa ctttcttacg tatatgaatg tgaattatag 300
ttagttaact ttagaactgt tgagcggcca atgccacgtc ctttgtacgt aaattatgtt 360
attcatgcta ttatttatgt accaattttc tattctaata tatattctaa gttttttttg 420
tatcaatact aagtatttat acaatttttg caaattttga cagaaagata gtacaaaaaa 480
tatgaaagac caaaaactac ataaaccacc aaaaattaca acacaaacag aaaacggaaa 540
gaaaactcaa tcgaaaactc tacaagtaga gaccttaaaa gaaacttaga ttccaaacca 600
caaagctcaa atatttgtgt ggtttcctca acttaaaaga tctcaaatac ttatagttgt 660
tgccactagc aatccaaacc taggccagtt ttcaaaatct ctaaaaaaga gcttaccatt 720
ccaaacttag gacaatcctc ataatatttt aaattttatg acatttttta gttttttctt 780
accgaacata gagatacaac gaataacaca aaataccaaa ttttactaaa caaacaatta 840
ctgcacaaat gaaaaagtaa tcaacaacat gagctcattt cacgaaaaaa gaagcgaaaa 900
agccaacggt cttgccacaa attagtatat tgcaaattac aaatgcttaa aaaaattcac 960
agatatattc atcaattata ccttttgatt atcttgcaaa taaatcttcc aattcatatt 1020
acctacgtca aaatttagcc atctaccctt attatcccat tatgaaaatt tcaaaatcga 1080
taagatgaca gacacccaac aacgaattat cattttatat actataggta ttagatacct 1140
acaatttatt tggtttattg ggaatatacg attcataaat tccctcataa aaatataaag 1200
caaatgtgga cggaagcaaa aaaactaaat atagaatgga gagaaattgt attattaact 1260
taggttaccc atcgccaaca acctctcatt tcctttccta aactatttca caattttggt 1320
caaaaacaca atctaacccc aaaaaagatt cgacctttga aattcccaaa accagaagca 1380
aaacccccaa aagaacccta cttatagtga aagaaaagta acataataat atatatacac 1440
gagaaccaag agccacttga atataaagtt cacagttttt gtctgctcac caaatcaaac 1500
caatttctcc tgatagccaa agtttttgtc cccaacaaga aactcatgca acattcttca 1560
cccactagct aactaacgac ttccattctt attaatctct ctcaattctt catttctgag 1620
attcatcgct ctctcttctc tttgtcacag caagtttgta caaaaaagca ggctccatgg 1680
gaagatcacc ttgttgtgat aaaaatggag tgaagaaggg accatggact gctgaggagg 1740
atcagaaact catcgattat attcgatttc atggtcctgg caattggcgt acgctcccca 1800
aaaatgctgg tacgtataaa ctacacaccg ttccttatat tttgttctca tagattaata 1860
tatatgttct ctatttattg agtcacacac ttataagtcg tattgtacaa attaaaggac 1920
tccatagatg tggaaaaagc tgccgtcttc gatggaccaa ttatctaaga ccggacatca 1980
agagaggaag attctcgttc gaggaagaag aaactatcat tcagctacac agtgttatgg 2040
gaaacaagta agcctgatca ttcacaccat aatttttgtc tgaaattcat attcatcagc 2100
tacatgcttt tgtatgttaa ttaatgtaaa actcaaaaag ggagagtgta cgtttgcatg 2160
cgggggtaca tgtcaaatgt aggccatcaa ctccaataaa ctattattag tactttacta 2220
gtacgtattg acctatatta gaataataat aaaggagttt tgtattgatc atagattaat 2280
gtcactaata ttgaattgat gaatattagg tggtcagcaa tagccgctcg tctaccaggg 2340
aggaccgata acgaaataaa aaaccattgg aacactcaca tccgcaagag acttgtaagg 2400
agtggtatcg accctgttac tcattctcca cgccttgatc ttcttgattt gtcctcactt 2460
ttgagtgcac ttttcaacca gccaaacttt tcagcagttg caacacatgc gtcttctctt 2520
cttaatcctg atgtattgag gttggcctct ctactactgc cacttcaaaa ccctaatcca 2580
gtttacccat cgaacctcga ccaaaatctt caaactccaa atacatcatc agaatcgtct 2640
caaccacaag ctgagactag tacagtccca acaaactatg aaacttcatc attggagcct 2700
atgaacgcaa gactcgacga cgttggtctt gcagatgtat taccaccttt gtcagagagt 2760
tttgacttag actcgctcat gtcaacgcca atgtcttctc cacgacaaaa tagcattgaa 2820
gcagaaacca actccagcac tttcttcgac tttggaattc cggaagattt catcttagat 2880
gactttatgt ttgacccagc tttcttgtac aaagtggcct aattttcaac atttgcatac 2940
acatgtcttg ctttcacaca tatgattctt tgttgcattc tttcttttgt ttgatgtata 3000
aatttcttgt ttttattctc tcaaaagata ttaagttatt agtctataaa attttcatga 3060
atgtttatgt attatctgct taggcgagat atctaaattc tgctccatta gtccatatac 3120
acagttgacg gaagcaaaca tagaattatt agcgtcaaac acatcacata ttcatattgc 3180
tttgttcgaa tcatcgtcaa tcaagttaat cagtttatgc gagttctatc atttaggccc 3240
aattcaaggc ccaattcaag ttcattttaa agccgttaat ttggcca 3287
<210> 21
<211> 3885
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> proMYB84::MYB41表达盒
<400> 21
tctgagacat cattgatatc taacaatcaa aaactaaaaa gtgaagtatt aacattttaa 60
tcagattcaa accagaactt atcagtcatc aaaaatgttg gcaaataaca aatcaaactt 120
aagtttttgg atggagaaag caagctagat tcgaatctct aagaagcgtg gacttggact 180
tgtttacgac ctgaaaagat gtcatgatta tctcatgatt acgagataat aacatgtctt 240
atctactaaa ctaatctaaa aagtagtgag gatgacttga aacttaagtc ttatatgaat 300
tatctttaaa tatagaaaaa gaaaggagat agagaggtgt gtttttcatg tgaacaactt 360
ttttttacct ttagagtact tccagaagac ttattgggtc cttaataaaa gtagaccaaa 420
ttattgaaga gctaaaaaaa aatgcctact caaaatatcc aaacctcttc ttttagcctt 480
ttgttttttt caatattcat actaatgtaa actacaatca ttgtatcatt ctataatcat 540
atgaattttt tgtcaacacc atgcattatg ctagtttaaa tttaggtgat gatataaaga 600
tattttaagt acaaatcaat aggggcgatg ttcttatgtc tttatctaac tttatgaatt 660
tgtgttttat atattatgaa aaattggaaa agaagagatg gcctacgctc aagaccaatt 720
cctaccaatg ggcaatggtg ttgaaatctg aacaaaaaaa tttcctttct ttaacgttag 780
ctttaaagtt caaaaaactt tatttacttt ttcagtgata attctgtata aaataacata 840
taacaatgag gaaaaaactc aataatttga atcgcttatg actttatttc tccaagtgct 900
tgacttttaa aaccctaatg tccaatctca actaaagtca acctttttcg ttcgtctaga 960
agagtcagtc attaagtttc aattgaagta tacagtaaat tattagtact ttttatttta 1020
ttttaaccac agttcattgg ctgtatgaga tttctgttca agaaaacata taaatcgaaa 1080
ccaaagcaaa agacattatt tgcttcggtt tcttctactc aagctcattt ttagtaaaac 1140
taaattgtat tttcattttc ttaaaaagtt aattgttttt tttgtaaaat cagttttacc 1200
aaattggaca caataatgaa tatatgtcta tgtctagttt tttttagctc agaatatatc 1260
ttatgtgaat agaatcgtct atcagatatt tttgtgatgc agatagaact taccgttata 1320
gaatcatttg tagattgttc atcgtgattg ttaagattag attcccattt gtaatataac 1380
agaaactcga aaagtactta tattaagtat taacgatgta tcatgtgacc aaaatagaaa 1440
atactacgta atgatatgat tattaagcga gtgtgtaggt aattcaaata tttcaattaa 1500
tcaatctttg atatcactct ttagagtaat gtattatctt tcttattgtt ttaccctggg 1560
attaataagt ttaccggatc cggagtagaa tttcttcggt ttggcaattt tgttcaccta 1620
ccataacgaa cttttaccct tatacttagt ttcaatctac ttttggtgca tcctttcatt 1680
ttcaactgca aagaagtagt taaaagatcc aatacataat atatttaatt tatcataagt 1740
aacttagtgt aaagaaagac taaagtactt tttaaaatat gtatttgtat ttcccgatgt 1800
gaaagaaaag aaaattgaat ttgcacatat caataatatt agctaggaaa aaacttgtga 1860
gaaatttctt tgacgacttg cgtgtgcaat agtcttcctt atcttctcta ccatttctta 1920
attccactat tgtatagtat ttacttatgt tgaattaata aattaaaaca tttaaatttc 1980
cctaaagtta ctttttgatt tttgattttc tatttttatt acaactttcc tactttttga 2040
catcttttct tacaaagact ttttgacatc tccccctcca gctattatat agtctccttt 2100
tttcttttct gcattcacat aatatttccc ctatatagtt tacacaacat catacccacc 2160
aacatatata atcttgatca tagagagata aacagaggcc gctatcaaga acaagactaa 2220
gaacaagact tcactaggag tacaagtgca agtttgtaca aaaaagcagg ctccatggga 2280
agatcacctt gttgtgataa aaatggagtg aagaagggac catggactgc tgaggaggat 2340
cagaaactca tcgattatat tcgatttcat ggtcctggca attggcgtac gctccccaaa 2400
aatgctggta cgtataaact acacaccgtt ccttatattt tgttctcata gattaatata 2460
tatgttctct atttattgag tcacacactt ataagtcgta ttgtacaaat taaaggactc 2520
catagatgtg gaaaaagctg ccgtcttcga tggaccaatt atctaagacc ggacatcaag 2580
agaggaagat tctcgttcga ggaagaagaa actatcattc agctacacag tgttatggga 2640
aacaagtaag cctgatcatt cacaccataa tttttgtctg aaattcatat tcatcagcta 2700
catgcttttg tatgttaatt aatgtaaaac tcaaaaaggg agagtgtacg tttgcatgcg 2760
ggggtacatg tcaaatgtag gccatcaact ccaataaact attattagta ctttactagt 2820
acgtattgac ctatattaga ataataataa aggagttttg tattgatcat agattaatgt 2880
cactaatatt gaattgatga atattaggtg gtcagcaata gccgctcgtc taccagggag 2940
gaccgataac gaaataaaaa accattggaa cactcacatc cgcaagagac ttgtaaggag 3000
tggtatcgac cctgttactc attctccacg ccttgatctt cttgatttgt cctcactttt 3060
gagtgcactt ttcaaccagc caaacttttc agcagttgca acacatgcgt cttctcttct 3120
taatcctgat gtattgaggt tggcctctct actactgcca cttcaaaacc ctaatccagt 3180
ttacccatcg aacctcgacc aaaatcttca aactccaaat acatcatcag aatcgtctca 3240
accacaagct gagactagta cagtcccaac aaactatgaa acttcatcat tggagcctat 3300
gaacgcaaga ctcgacgacg ttggtcttgc agatgtatta ccacctttgt cagagagttt 3360
tgacttagac tcgctcatgt caacgccaat gtcttctcca cgacaaaata gcattgaagc 3420
agaaaccaac tccagcactt tcttcgactt tggaattccg gaagatttca tcttagatga 3480
ctttatgttt gacccagctt tcttgtacaa agtggcctaa ttttcaacat ttgcatacac 3540
atgtcttgct ttcacacata tgattctttg ttgcattctt tcttttgttt gatgtataaa 3600
tttcttgttt ttattctctc aaaagatatt aagttattag tctataaaat tttcatgaat 3660
gtttatgtat tatctgctta ggcgagatat ctaaattctg ctccattagt ccatatacac 3720
agttgacgga agcaaacata gaattattag cgtcaaacac atcacatatt catattgctt 3780
tgttcgaatc atcgtcaatc aagttaatca gtttatgcga gttctatcat ttaggcccaa 3840
ttcaaggccc aattcaagtt cattttaaag ccgttaattt ggcca 3885

Claims (27)

1.一种分离的核酸分子,其包含编码与SEQ ID NO:14具有至少80%序列同源性的MYB41氨基酸序列的核酸序列和/或SEQ ID NO:13或SEQ ID NO:15中所示的核酸,所述核酸序列与编码异源启动子的核酸序列可操作地连接,其中与缺乏所述分离的核酸分子的野生型对照植物相比,所述分离的核酸分子在植物中的表达导致木栓质水平增加。
2.如权利要求1所述的分离的核酸分子,其中所述木栓质水平的增加通过产生额外的周皮细胞和/或在现有的周皮细胞中沉积更多的木栓质而发生。
3.如权利要求1或权利要求2所述的分离的核酸分子,其中氨基酸序列同源性选自由以下组成的组:与SEQ ID NO:14的至少85%同源性、至少90%同源性、至少95%同源性、至少96%同源性、至少97%同源性、至少98%同源性和至少99%同源性。
4.如权利要求1或权利要求2所述的分离的核酸分子,其中氨基酸序列同源性是与SEQID NO:14的100%同源性。
5.如权利要求1所述的分离的核酸分子,其中所述异源启动子包含选自包含以下的组的分离的核酸序列:SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5和SEQ ID NO:6。
6.一种转化载体,其包含如权利要求1至5所述的核酸分子中的一者或多者。
7.一种转化植物细胞的方法,其包括将如权利要求6所述的转化载体引入植物细胞中,由此与未转化的野生型对照植物细胞相比,转化的植物细胞产生增加水平的木栓质。
8.如权利要求7所述的方法,其还包括从所述转化的植物细胞产生转化的植物组织。
9.如权利要求8所述的方法,其还包括从所述转化的植物组织产生转化的小植株,其中与缺乏所述分离的核酸分子的未转化的野生型对照小植株相比,所述转化的小植株产生增加水平的木栓质。
10.如权利要求9所述的方法,其还包括产生所述转化的小植株的后代,其中与缺乏所述分离的核酸分子的未转化的野生型对照小植株相比,所述后代产生增加水平的木栓质。
11.如权利要求9或权利要求10所述的方法,其还包括使所述转化的小植株或所述转化的小植株的后代生长成成熟的转化植物,其中与缺乏所述分离的核酸分子的成熟的未转化的野生型对照相比,所述成熟的转化植物产生增加水平的木栓质。
12.如权利要求9至11所述的方法,其中所述木栓质水平的增加通过产生额外的周皮细胞和/或在现有的周皮细胞中沉积更多的木栓质而发生。
13.如权利要求9至12所述的方法,其中在与正常木栓质产生无关的细胞中,所述核酸分子极少表达或不表达。
14.如权利要求9至13所述的方法,其中所述核酸分子在莲座叶中极少表达或不表达。
15.如权利要求11至14所述的方法,其还包括在育种方法中使用所述成熟的转化植物或所述成熟的转化植物的克隆。
16.如权利要求15所述的方法,其中所述育种方法包括使所述成熟的转化植物或所述成熟的转化植物的克隆自交或杂交。
17.一种植物育种方法,其包括将包含如权利要求1至5所述的核酸分子的第一种植物与相同物种的第二种植物杂交,并且基于与野生型对照植物相比木栓质水平的增加来选择所得杂交后代。
18.如权利要求17所述的植物育种方法,其还包括产生所述所得杂交后代的克隆,其中基于与野生型对照植物相比木栓质水平的增加来选择所述克隆。
19.如权利要求17或权利要求18所述的植物育种方法,其中使用基于如权利要求1至5所述的核酸分子设计的分子标志来选择与野生型对照植物相比显示木栓质水平增加的所述杂交后代。
20.如权利要求17所述的方法,其还包括在育种方法中使用所选择的后代。
21.如权利要求11至14所述的方法,其还包括使所述成熟的转化植物或所述成熟的转化植物的克隆在温室或室外生长。
22.如权利要求1所述的分离的核酸分子,其中所述异源启动子是FACT基因的启动子。
23.如权利要求1所述的分离的核酸分子,其中所述异源启动子是HORST基因的启动子。
24.如权利要求1所述的分离的核酸分子,其中所述异源启动子是ASFT基因的启动子。
25.如权利要求1所述的分离的核酸分子,其中所述异源启动子是GPAT5基因的启动子。
26.如权利要求1所述的分离的核酸分子,其中所述异源启动子是RALPH基因的启动子。
27.如权利要求1所述的分离的核酸分子,其中所述异源启动子是MYB84基因的启动子。
CN202180074784.0A 2020-10-17 2021-10-15 通过以细胞类型特异性方式改变基因表达模式来工程化增加木栓质水平 Pending CN116529379A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063093205P 2020-10-17 2020-10-17
US63/093,205 2020-10-17
PCT/US2021/055246 WO2022082020A1 (en) 2020-10-17 2021-10-15 Engineering increased suberin levels by altering gene expression patterns in a cell-type specific manner

Publications (1)

Publication Number Publication Date
CN116529379A true CN116529379A (zh) 2023-08-01

Family

ID=81208689

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180074784.0A Pending CN116529379A (zh) 2020-10-17 2021-10-15 通过以细胞类型特异性方式改变基因表达模式来工程化增加木栓质水平

Country Status (7)

Country Link
US (1) US20230392159A1 (zh)
EP (1) EP4229073A1 (zh)
CN (1) CN116529379A (zh)
AU (1) AU2021359853A1 (zh)
CA (1) CA3194996A1 (zh)
MX (1) MX2023004254A (zh)
WO (1) WO2022082020A1 (zh)

Also Published As

Publication number Publication date
CA3194996A1 (en) 2022-04-21
EP4229073A1 (en) 2023-08-23
AU2021359853A1 (en) 2023-05-11
WO2022082020A1 (en) 2022-04-21
US20230392159A1 (en) 2023-12-07
AU2021359853A9 (en) 2023-07-06
MX2023004254A (es) 2023-05-29

Similar Documents

Publication Publication Date Title
US9745596B2 (en) Identification and use of KRP mutants in wheat
JP2009515522A (ja) Dof(dnabindingwithonefinger)配列および使用方法
US11913009B2 (en) Identification of resistance genes from wild relatives of banana and their uses in controlling panama disease
US20150322537A1 (en) Delayed fruit deterioration allele in plants and methods of detection
CN111988988A (zh) 鉴定、选择和产生抗白叶枯病水稻的方法
WO2020239984A1 (en) Gene for parthenogenesis
WO2020018528A2 (en) Overcoming self-incompatibility in diploid plants for breeding and production of hybrids
EP4025589A1 (en) Methods of improving seed size and quality
EP3390641B1 (en) Compositions and methods for manipulating the development of plants
CA2873360A1 (en) New plant resistance gene
CA3154052A1 (en) Plants having a modified lazy protein
US20230203520A1 (en) Expression of ipt7 from tss promoter increases root mass and carbon sequestration
WO2014164668A1 (en) Compositions of methods for increasing seed number, seed weight and/or yield in plants
CN116529379A (zh) 通过以细胞类型特异性方式改变基因表达模式来工程化增加木栓质水平
WO2014112875A1 (en) A new method to provide resistance to bacterial soft rot in plants
CN110959043A (zh) 利用bcs1l基因和向导rna/cas核酸内切酶系统改良植物农艺性状的方法
WO2023164515A2 (en) Compositions and methods for increasing periderm in plant roots
OA20947A (en) Identification of resistance genes from wild relatives of banana and their uses in controlling Panama disease
CA3132694A1 (en) Overcoming self-incompatibility in diploid plants for breeding and production of hybrids through modulation of ht
CN117925684A (zh) 水稻抗逆性相关蛋白gnp3及其编码基因与应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination