CN115485377A - 糖基转移酶、编码这些糖基转移酶的多核苷酸及其使用方法 - Google Patents

糖基转移酶、编码这些糖基转移酶的多核苷酸及其使用方法 Download PDF

Info

Publication number
CN115485377A
CN115485377A CN202180024664.XA CN202180024664A CN115485377A CN 115485377 A CN115485377 A CN 115485377A CN 202180024664 A CN202180024664 A CN 202180024664A CN 115485377 A CN115485377 A CN 115485377A
Authority
CN
China
Prior art keywords
plant
leu
polypeptide
ser
trilobatin
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180024664.XA
Other languages
English (en)
Inventor
王娱乐
R·G·阿特金森
Y-K·亚克
李鹏民
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
New Zealand Insitiute for Plant and Food Research Ltd
Original Assignee
New Zealand Insitiute for Plant and Food Research Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by New Zealand Insitiute for Plant and Food Research Ltd filed Critical New Zealand Insitiute for Plant and Food Research Ltd
Publication of CN115485377A publication Critical patent/CN115485377A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H15/00Compounds containing hydrocarbon or substituted hydrocarbon radicals directly attached to hetero atoms of saccharide radicals
    • C07H15/20Carbocyclic rings
    • C07H15/203Monocyclic carbocyclic rings other than cyclohexane rings; Bicyclic carbocyclic ring systems
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • C12N15/8245Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine involving modified carbohydrate or sugar alcohol metabolism, e.g. starch biosynthesis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1025Acyltransferases (2.3)
    • C12N9/1029Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
    • C12N9/1037Naringenin-chalcone synthase (2.3.1.74), i.e. chalcone synthase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1085Transferases (2.) transferring alkyl or aryl groups other than methyl groups (2.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/18Preparation of compounds containing saccharide radicals produced by the action of a glycosyl transferase, e.g. alpha-, beta- or gamma-cyclodextrins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/44Preparation of O-glycosides, e.g. glucosides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/44Preparation of O-glycosides, e.g. glucosides
    • C12P19/46Preparation of O-glycosides, e.g. glucosides having an oxygen atom of the saccharide radical bound to a cyclohexyl radical, e.g. kasugamycin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/44Preparation of O-glycosides, e.g. glucosides
    • C12P19/56Preparation of O-glycosides, e.g. glucosides having an oxygen atom of the saccharide radical directly bound to a condensed ring system having three or more carbocyclic rings, e.g. daunomycin, adriamycin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y203/00Acyltransferases (2.3)
    • C12Y203/01Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
    • C12Y203/01074Naringenin-chalcone synthase (2.3.1.74), i.e. chalcone synthase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/01Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/01Hexosyltransferases (2.4.1)
    • C12Y204/01286Chalcone 4'-O-glucosyltransferase (2.4.1.286)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y205/00Transferases transferring alkyl or aryl groups, other than methyl groups (2.5)
    • C12Y205/01Transferases transferring alkyl or aryl groups, other than methyl groups (2.5) transferring alkyl or aryl groups, other than methyl groups (2.5.1)
    • C12Y205/010934-Hydroxybenzoate geranyltransferase (2.5.1.93)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Nutrition Science (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Cell Biology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明提供产生具有增加的三叶苷含量或增加的4’‑O‑糖基转移酶活性的宿主细胞、植物细胞或植物的方法,所述方法包括用编码具有4’‑O‑糖基转移酶活性的多肽的多核苷酸转化所述宿主细胞或植物细胞。本发明还提供经遗传修饰以包含和/或表达所述多核苷酸的宿主细胞、植物细胞和植物。

Description

糖基转移酶、编码这些糖基转移酶的多核苷酸及其使用方法
技术领域
本发明涉及用于产生具有改变的4’-O-糖基转移酶活性和/或改变的三叶苷含量的植物的组合物和方法。
背景技术
三叶苷是据报道比蔗糖甜约100倍的基于植物的甜味剂(Jia等,2008)。在包括三裂海棠(Malus trilobata)、三叶海棠(Malus sieboldii)和变叶海棠(Malus toringo)在内的一系列海棠(苹果属(Malus))种的叶片中发现高水平的三叶苷(Williams,1982;Gutierrez等,2018b)。其在栽培苹果(M.x domestica)中未发现,但已报道其在野生葡萄属(Vitis)种的叶片中水平较低(Tanaka等,1983)。一些石栎属(Lithocarpus)种也含有三叶苷并且叶片在中国被用来制备甜茶(Sun等,2015)。三叶苷作为甜味剂的潜在实用性在例如许多食品和饮料制剂中是公认的(Jia等,2008;WALTON等,2013),然而其有用性受限于其稀缺性。已记录从一系列组织(Sun和Zhang,2017)和依照柑橘废物的生物转化(Lei等,2018)的提取方法。虽然在酵母中生物合成三叶苷也已实现(Eichenberger等,2017),但由于缺乏对生物合成途径中所有酶的了解而阻碍了有效产生。
三叶苷(根皮素-4’-O-葡糖苷)和根皮苷(根皮素-2’-O-葡糖苷)是在苯丙素(phenylpropanoid)途径的侧支上产生的二氢查耳酮(DHC)根皮素的位置异构体。DHC生物合成中的第一关键步骤可被将对香豆酰-CoA转化成对二氢香豆酰-CoA的双键还原酶(DBR)催化(Dare等,2013;Yahyaa等,2017)。下一步骤涉及通过查耳酮合酶(CHS)使对二氢香豆酰-CoA和三个单位的丙二酰-CoA脱羧缩合和环化以产生根皮素(Gosch等,2009;Ibdah等,2014)。所述途径的最后一步需要UDP-糖基转移酶(UGT)在查耳酮A环的2’或4’位处连接葡萄糖的作用。另一苹果DHC,3-羟基根皮苷(sieboldin)(3-羟基根皮素-4’-O-葡糖苷),在根皮素转化为羟基根皮素之后或通过将三叶苷直接转化为3-羟基根皮苷,也在4’位被糖基化。
UGT通常由大型基因家族编码,所述大型基因家族在拟南芥中描述了超过100个基因(Ross等,2001)并且在栽培苹果基因组中描述了超过200个基因(Caputi等,2012)。所有UGT均含有结合活化糖的UDP部分的保守植物次级产物糖基转移酶(PSPG)基序(Li等,2001)。虽然一些UGT可利用宽范围的受体底物(Hsu等,2017;Yauk等,2014),但其他UGT已被证明是高度特异性的(Fukuchi-Mizutani等,2003;Jugdé等,2008)。系统分类可有助于鉴别一些UGT活性;然而,仅通过系统发生相关性通常难以归属功能性。在苹果中,已鉴别催化根皮素2’-O-糖基化为根皮苷的多个UGT:UGT88F1/MdPGT1(Jugdé等,2008)、UGT88F8(Elejalde-Palmett等,2019)、UGT88F4、UGT71K1(Gosch等,2010)和UGT71A15(Gosch等,2012)。UGT71A15在转基因苹果中的过表达不影响植物形态或不显著增加根皮苷浓度,但确实增加根皮苷与根皮素的摩尔比(Gosch等,2012)。相比之下,UGT88F1(MdPGT1)敲低品系显示显著减少的根皮苷积累、严重的表型变化,并且显示对腐烂病(Valsacanker)感染的增加抗性(Dare等,2017;Zhou等,2019)。
已报道体外于4’位糖基化根皮素的两种苹果酶UGT71A15和UGT75L17(MdPh-4’-OGT)(Gosch等,2012;Yahyaa等,2016)。然而,这些酶在仅产生根皮苷的栽培苹果的叶片和果实中天然表达。迄今为止,尚未完全弄清产生植物中三叶苷的生物合成途径。
具有提高植物中的三叶苷水平的手段将是有益的。具有产生三叶苷的手段也将是有益的。
本发明的至少优选实施方案的目的是提供用于调节植物、酵母和/或细菌中的4’-O-糖基转移酶活性和/或三叶苷含量的组合物和方法,和/或至少向公众提供有用的选择。
在本说明书中,在已提到专利说明书、其他外部文件或其他信息来源时,这通常是为了提供上下文讨论本发明的特征的目的。除非另有明确说明,否则对此类外部文件或此类信息来源的引用不应解释为承认此类文件或此类信息来源在任何司法管辖权内是现有技术或构成本领域公知常识的一部分。
发明内容
在第一方面,本发明广义地在于产生具有增加的三叶苷含量的植物细胞或植物的方法,所述方法包括用编码具有SEQ ID NO:1到9中任一个的氨基酸序列的多肽或所述多肽的变体的多核苷酸转化植物细胞。
在一个实施方案中,提供产生具有增加的4’-O-糖基转移酶活性的植物细胞或植物的方法,所述方法包括用编码具有SEQ ID NO:1到9中任一个的氨基酸序列的多肽或所述多肽的变体的多核苷酸转化植物细胞。
在优选实施方案中,变体具有4’-O-糖基转移酶活性。
优选地,变体与具有SEQ ID NO:1到9中任一个的氨基酸序列的多肽具有至少70%序列同一性。
更优选地,多核苷酸编码具有与SEQ ID NO:1的序列具有至少85%同一性的氨基酸序列的多肽。
最优选地,多核苷酸编码具有SEQ ID NO:1的氨基酸序列的多肽。
在另一实施方案中,提供产生具有增加的三叶苷含量的植物细胞或植物的方法,所述方法包括用包含选自序列SEQ ID NO:10到18中任一个的核苷酸序列或其变体的多核苷酸转化植物细胞。
在另一实施方案中,提供产生具有增加的4’-O-糖基转移酶活性的植物细胞或植物的方法,所述方法包括用包含选自序列SEQ ID NO:10到18中任一个的核苷酸序列或其变体的多核苷酸转化植物细胞。
在优选实施方案中,变体编码具有4’-O-糖基转移酶活性的多肽。
优选地,变体包含与SEQ ID NO:10到18中任一个的核苷酸序列具有至少70%序列同一性的序列。
更优选地,变体包含与SEQ ID NO:10的核苷酸序列具有至少85%序列同一性的序列。
最优选地,多核苷酸包含SEQ ID NO:10的序列。
在另一实施方案中,提供产生具有增加的三叶苷含量或增加的4’-O-糖基转移酶活性的植物细胞或植物的方法,所述方法包括在所述植物细胞或植物中上调具有SEQ IDNO:1到9中任一个的氨基酸序列的多肽或所述多肽的变体的表达。
在另一实施方案中,提供产生具有增加的三叶苷含量或增加的4’-O-糖基转移酶活性的植物细胞或植物的方法,所述方法包括在所述植物细胞或植物中上调包含选自序列SEQ ID NO:10到18中任一个的核苷酸序列或其变体的多核苷酸的表达。
根据一些实施方案,上调包括遗传工程。
根据一些实施方案,上调包括与表达包含氨基酸序列的多肽的植物杂交,所述多肽与具有SEQ ID NO:1到9中任一个的氨基酸序列的多肽具有至少70%序列同一性。
根据一些实施方案,上调包括与表达包含选自序列SEQ ID NO:10到18中任一个的核苷酸序列的多核苷酸的植物杂交。
在某些实施方案中,所述植物细胞或植物包含编码查耳酮合酶(CHS)或查耳酮合酶(CHS)和双键还原酶(DBR)的多核苷酸或也用所述多核苷酸转化。
适合的查耳酮合酶包括HaCHS(NCBI蛋白质保藏号:Q9FUB7.1)和HvCHS2(NCBI蛋白质保藏号:Q96562.1),更优选HaCHS。适合的双键还原酶包括ScTSC13(NCBI蛋白质保藏号:NP_010269.1)和KITSC13(NCBI蛋白质保藏号XP_452392.1),更优选ScTSC13。
在另一实施方案中,提供一种遗传构建体,其包含编码具有SEQ ID NO:1到9中任一个的氨基酸序列的多肽或所述多肽的变体的多核苷酸。
在另一实施方案中,提供包含多核苷酸的遗传构建体,所述多核苷酸包含选自序列SEQ ID NO:10到18中任一个的核苷酸序列或其变体。
优选地,遗传构建体进一步包含如本文所公开的编码查耳酮合酶(CHS)和/或双键还原酶(DBR)的多核苷酸。
在另一实施方案中,提供一种宿主细胞,其经遗传修饰以表达编码具有SEQ IDNO:1到9中任一个的氨基酸序列的多肽或所述多肽的变体的多核苷酸。
在另一实施方案中,提供一种宿主细胞,其经遗传修饰以表达包含选自序列SEQID NO:10到18中任一个的核苷酸序列或其变体的多核苷酸。
在另一实施方案中,提供包含如本文所公开的遗传构建体的宿主细胞。
宿主细胞可以是细菌细胞、真菌细胞或酵母细胞、昆虫细胞、植物细胞或哺乳动物细胞。
在一些实施方案中,宿主细胞是选自由以下组成的列表的细菌细胞:大肠杆菌属(Escherichia)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、棒杆菌属(Cornebacterium)、醋杆菌属(Acetobacter)、不动杆菌属(Acinetobacter)和假单胞菌属(Pseudomonas)。优选地,宿主细胞是兼性厌氧微生物,优选变形菌,特别是例如大肠杆菌属的肠细菌,优选大肠杆菌,尤其是大肠杆菌Rosetta、大肠杆菌BL21、大肠杆菌K12、大肠杆菌MG1655、大肠杆菌SE1和它们的衍生物。
在一些实施方案中,宿主细胞是选自由以下种组成的列表的酵母细胞:酿酒酵母(Saccharomyces cerevisiae)、粟酒裂殖酵母(Schizosaccharomyces pombe)、解脂耶氏酵母(Yarrowia lipolytica)、光滑假丝酵母(Candida glabrata)、棉阿舒囊霉(Ashbyagossypii)、杰丁塞伯林德纳氏酵母(Cyberlindnera jadinii)、巴斯德毕赤酵母(Pichiapastoris)、甲醇毕赤酵母(Pichia methanolica)、乳酸克鲁维酵母(Kluyveromyceslactis)、多形汉逊酵母(Hansenula polymorpha)、博伊丁假丝酵母(Candida boidinii)、解腺嘌呤阿氏酵母(Arxula adeninivorans)、法夫酵母(Xanthophyllomycesdendrorhous)和白假丝酵母(Candida albicans)。在一些实施方案中,酵母细胞是酵母菌。
在一些实施方案中,宿主细胞是选自由曲霉属(Aspergillus)种和木霉属种组成的列表的真菌细胞。
在另一实施方案中,提供用于生物合成三叶苷的方法,其包括在可供应到宿主细胞或可存在于宿主细胞中的根皮素存在下培养如本文所公开的宿主细胞的步骤,所述宿主细胞能够表达4’-O-糖基转移酶。
在一些实施方案中,UDP-葡萄糖可被供应到宿主细胞,或可存在于宿主细胞中。
在另一实施方案中,提供产生三叶苷的方法,所述方法包括从如本文所公开的宿主细胞中提取三叶苷。
在另一实施方案中,提供一种植物细胞,其经遗传修饰以表达编码具有SEQ IDNO:1到9中任一个的氨基酸序列的多肽或所述多肽的变体的多核苷酸。
在另一实施方案中,提供一种植物细胞,其经遗传修饰以表达包含选自序列SEQID NO:10到18中任一个的核苷酸序列或其变体的多核苷酸。
在另一实施方案中,提供包含如本文所公开的植物细胞的植物。
在另一实施方案中,提供用于选择具有改变的4’-O-糖基转移酶活性的植物的方法,所述方法包括针对编码具有SEQ ID NO:1到9中任一个的氨基酸序列的多肽或所述多肽的变体的多核苷酸的改变表达测试植物。
在另一实施方案中,提供用于选择具有改变的4’-O-糖基转移酶活性的植物的方法,所述方法包括针对包含选自序列SEQ ID NO:10到18中任一个的核苷酸序列或其变体的多核苷酸的改变表达测试植物。
在另一实施方案中,提供用于选择具有改变的三叶苷含量的植物的方法,所述方法包括针对编码具有SEQ ID NO:1到9中任一个的氨基酸序列的多肽或所述多肽的变体的多核苷酸的改变表达测试植物。
在另一实施方案中,提供用于选择具有改变的三叶苷含量的植物的方法,所述方法包括针对包含选自序列SEQ ID NO:10到18中任一个的核苷酸序列或其变体的多核苷酸的改变表达测试植物。
在另一实施方案中,提供通过如本文所公开的产生具有增加的三叶苷含量或增加的4’-O-糖基转移酶活性的植物细胞或植物的方法产生的植物细胞或植物。
在另一实施方案中,提供通过如本文所公开的用于选择具有改变的三叶苷含量或改变的4’-O-糖基转移酶活性的植物的方法选择的植物细胞或植物。
在另一实施方案中,提供通过如本文所公开的任何一种方法产生的一组或一群植物。
在另一实施方案中,提供产生三叶苷的方法,所述方法包括从如本文所公开的具有改变的三叶苷含量或改变的4’-O-糖基转移酶活性的植物细胞或植物中提取三叶苷。
在另一实施方案中,提供产生三叶苷的方法,所述方法包括使根皮素与UDP-葡萄糖和编码具有SEQ ID NO:1到9中任一个的氨基酸序列的多肽或所述多肽的变体的表达构建体或包含选自SEQ ID NO:10到18中任一个的核苷酸序列或其变体的多核苷酸的表达产物接触,以获得三叶苷。
意在对本文所公开的数字范围(例如,1到10)的引用还包括对该范围内所有有理数(例如,1、1.1、2、3、3.9、4、5、6、6.5、7、8、9和10)以及该范围内任何有理范围(例如,2到8、1.5到5.5和3.1到4.7)的引用,并且因此在此明确公开本文明确公开的所有范围的所有子范围。这些仅仅是明确意图的示例,并且认为在本申请中以类似方式明确陈述了在列举的最低值和最高值之间的数值的所有可能组合。
本发明还可被广义地认为在于本申请的说明书中单独或统一提到或指示的部件、元件和特征以及任何两个或更多个所述部件、元件或特征的任何或所有组合,并且在本文中提及的特定整体在本发明所涉及的领域中具有已知等同物的情况下,此类已知等同物被认为并入本文,如同单独陈述一样。
虽然本发明广义地如上文所定义,但本领域技术人员将了解本发明不限于此,并且本发明还包括以下描述给出实施例的实施方案。
附图说明
现在将参考附图描述本发明,其中:
图1显示‘皇家嘎啦(Royal Gala)’×Y3分离群体中的三叶苷产生的遗传作图。(A)使用IRSC 8K SNP阵列(Chagné等,2012)靠近Y3的LG7的基底对三叶苷基因座作图。将以厘摩(cM)计的遗传位置显示在左侧,并且将以碱基对计的物理位置显示在右侧(基于‘金冠(Golden Delicious)’双单倍体组装体(assembly)GDDH13 v1.1)。指示三个HRM-SNP标志物的物理位置(表1)。(B)‘金冠’v1.0p组装体(顶部)和双单倍体组装体GDDH13 v1.1(底部)中的三叶苷基因座的基因组区。在每个组装体中的基因座处鉴别的两个UDP-葡糖基转移酶基因的物理位置示于基因模型下方。黑色基因模型对应于PGT2并且散斑(speckled)模型对应于PGT3。
图2显示从‘亚当(Adams)’海棠杂交体的花进行4’-oGT活性的活性导向纯化。活性级分显示为深灰色条。(A)通过Q-琼脂糖凝胶(Q-sepharose)色谱纯化。(B)使用来自Q-琼脂糖凝胶的汇集级分,通过苯基琼脂糖凝胶色谱纯化。(C)使用来自苯基琼脂糖凝胶的汇集级分,通过Superdex 75色谱纯化。指示洗脱缓冲液中的蛋白质浓度(280nm)、酶活性、汇集级分和NaCl或(NH4)2SO4梯度。(D)在通过Superdex 75色谱纯化后的四种活性级分的SDS-PAGE分析示于泳道1-4中。M=预混合的宽蛋白质标志物(Takara,Dalian,China)。箭头指示发送用于LC-MS/MS分析的条带。
图3显示来自西府海棠(Malus micromalus‘Makino’)花瓣的2’-oGT活性的活性导向纯化。在通过Superdex 75色谱(A)纯化之后,通过SDS-PAGE(B)泳道1-3分析具有不同2’-O-GT酶活性的3种蛋白质级分(灰色条)。M=预混合的宽蛋白质标志物(Takara,Dalian,China)。箭头指示发送用于LC-MS/MS分析的条带。
图4显示PGT1-3的表达和生物化学分析。在3份仅含有三叶苷的苹果属保藏物(accession)(黑色条)、3份含有三叶苷和根皮苷的苹果属保藏物(白色条)以及3份仅含有根皮苷的苹果属保藏物(灰色条)中,使用基因特异性引物(表2)通过qRT-PCR分析PGT2(A)、PGT3(B)和PGT1(C)的表达。RG=‘皇家嘎啦’。数据是3个生物重复的平均值(±SE)。表达在(A)和(B)中相对于‘富士’栽培苹果(M.x domestica‘Fuji’)呈现,且在(C)中相对变叶海棠(Malus toringoides)呈现(值设置为1)。通过HPLC分析在根皮素和UDP-葡萄糖存在下由来自变叶海棠的重组PGT2(E)、来自三叶海棠的PGT3(F)、来自‘富士’栽培苹果的PGT1(G)以及空载体对照(H)形成的产物并且将其与真实的标准品(D)进行比较。P=根皮苷,T=三叶苷并且Pt=根皮素。
图5显示通过Ni2+亲和色谱纯化的重组PGT2(泳道1-6)和PGT1(泳道8-13)的SDS-PAGE。用40mM咪唑缓冲液洗脱的PGT2的粗制酶级分(泳道1、2)和用250mM咪唑缓冲液洗脱的四个纯化级分(泳道3-6)。用250mM咪唑缓冲液洗脱的PGT1的四个纯化级分(泳道8-11)和用40mM咪唑缓冲液洗脱的粗制酶级分(泳道12、13)。M=预混合的宽蛋白质标志物(Takara,Dalian,China)。箭头指示纯化的重组PGT2(右)和PGT1(右)。
图6显示来自苹果属的PGT2序列的氨基酸比对。使用Geneious(R10版,www.geneious.com)对氨基酸序列进行比对。加下划线的是在所有UFGT中发现的保守PSPG基序(Li等,2001)。
图7显示由PGT2形成的产物的LC-MS/MS分析。基峰图:(A)根皮素(Pt)和三叶苷(T)的混合标准;(B)PGT2+根皮素+UDP-葡萄糖;(C)3-OH根皮素(3Pt)+3-羟基根皮苷(S)的混合标准;(D)PGT2+3-OH根皮素+UDP-葡萄糖;质谱:(E)根皮素的全扫描、MS2和MS3数据;(F)三叶苷的全扫描、MS2和MS3数据;(G)3-OH根皮素的全扫描、MS2和MS3数据;以及H)3-羟基根皮苷的全扫描、MS2和MS3数据。
图8显示含有PGT2、槲皮素和UDP-葡萄糖的反应的LC-MS/MS分析。基峰图:(A)槲皮素(Q)和槲皮素-7-O-葡糖苷(Q7G)的混合标准;(B)PGT2+槲皮素+UDP-葡萄糖;(C)槲皮素-3-O-葡糖苷(Q3G)的标准;质谱:(D)槲皮素的全扫描、MS2和MS3数据;(E)槲皮素-7-O-葡糖苷的全扫描、MS2和MS3数据;(F)槲皮素-3-O-葡糖苷的全扫描、MS2和MS3数据。
图9显示重组PGT2和PGT1的生物化学性质。使用三种缓冲体系在37℃在pH范围4-12内测试PGT2(A)和PGT1(B)的活性。PGT2和PGT1的温度依赖性活性分别示于(C)和(D)中。在2-500μM的浓度与500μM的固定根皮素浓度下确定UDP-葡萄糖(F)的Km值。所有数据均为三个重复的平均值(±SE)。在Sigmaplot中通过非线性回归计算Km值。
图10显示烟草中产生三叶苷和根皮苷的工程。用含有pHEX2_PGT2、pHEX2_PGT1或阴性对照pHEX2_GUS(各自与pHEX2_MdMyb10、pHEX2_MdCHS、pHEX2_MdDBR+pBIN61-p19组合)的土壤杆菌属(Agrobacterium)悬浮液浸润本氏烟草(Nicotiana benthamiana)叶片。浸润后7d通过Dionex-HPLC分析三叶苷和根皮苷的产生。以一式三份进行实验并且显示单个代表性迹线。(A)pHEX2_PGT2;(B)三叶苷[T]标准品:(C)pHEX2_PGT1;(D)根皮苷[P]标准品:(E)阴性对照pHEX2_GUS。
图11显示转基因‘GL3’苹果品系中的PGT2表达水平和二氢查耳酮含量。(A)使用从幼叶提取的RNA通过qRT-PCR确定的14个转基因‘GL3’品系(编号)中PGT2的相对表达。针对Mdactin校正表达并且相对于野生型(WT)‘GL3’对照(值设定为1)给出。(B)通过HPLC确定的DHC含量。数据呈现为平均值±SE,n=3个生物重复。在GraphPad Prism中使用相对于WT的杜奈特多重比较检验(Dunnett′s Multiple Comparison Test)进行统计分析。未观察到根皮苷或根皮素含量的显著差异。显示了相对于对照显著更高的PGT2表达和三叶苷含量,P<0.001=***、P<0.01=**、P<0.05=*、ns=不显著。
图12显示过表达PGT2的转基因‘GL3’植物的HPLC和qRT-PCR分析。(A)野生型(WT)‘GL3’和每个转基因品系(编号)中根皮苷(P)+三叶苷(T)的总含量。使用从幼叶提取的RNA通过qRT-PCR确定14个转基因‘GL3’苹果品系中PGT1(B)、MdCHS(C)和PGT3(D)的相对表达。针对Mdactin校正表达并且相对于野生型对照(值设定为1)给出。数据呈现为平均值±SE,n=3。在GraphPad Prism中使用相对于WT的杜奈特多重比较检验进行统计分析。在P+T含量的总含量(A)、PGT1的表达(B)或MdCHS的表达(C)方面未观察到显著差异。对于PGT3表达(D),显著高于对照,P<0.001=***,P<0.01=**,P<0.05=*,ns=不显著。
图13显示转基因‘皇家嘎啦’PGT2过表达品系中的二氢查耳酮含量。将酚类化合物从野生型(WT)‘皇家嘎啦’和11个转基因PGT2品系(编号)的幼叶提取到含有70%甲醇和2%甲酸的溶液中并且通过Dionex-HPLC确定二氢查耳酮(DHC)含量。(A)每个品系中单个二氢查耳酮的浓度。(B)每个品系中根皮苷(P)+三叶苷(T)的总含量。
图14显示对苹果叶茶和三叶苷等甜度(isosweetness)的分析。(A)通过HPLC确定的由野生型(WT)和过表达PGT2的两个转基因‘GL3’品系(编号1、编号9)制备的苹果叶茶中的单个根皮苷(P)和三叶苷(T)含量。数据呈现为平均值±SE,对于干叶材料(DM),n≥7,对于苹果叶茶(LT),n=3。在GraphPad Prism中使用相对于WT的杜奈特多重比较检验进行统计分析。显著高于WT,P<0.001=***。(B)三叶苷与蔗糖之间的等甜度比较测试。将等甜度确定为35.2±1.66(R2=0.98)。呈现的数据为平均值±SE,n=5名参与者。
图15显示用于产生三叶苷的代谢途径。TAL-酪氨酸解氨酶;4CL-4-香豆酸-CoA连接酶;DBR-双键还原酶;CHS-查耳酮合酶;PGT1-根皮素2′-O-糖基转移酶1;PGT2-根皮素′-O-糖基转移酶2。
图16显示由表达三叶苷生产途径组分的大肠杆菌产生的三叶苷浓度。‘ERED+PGT2’显示由表达TAL、4CL、CHS2、ERED和PGT2的细胞产生的浓度。‘ScTSC13+PGT2’显示由表达TAL、4CL、CHS2、TSC13和PGT2的细胞产生的三叶苷浓度。C-1’显示由表达TAL、4CL、CHS2和PGT2但缺乏双键还原酶的细胞产生的浓度。C-2显示由表达TAL、4CL和CHS2的细胞产生的浓度。C-3显示由表达TAL和4CL的细胞产生的浓度。
图17显示由表达PGT2的酿酒酵母在含有HaCHS、ScTSC13、At4CL2、AtPAL2、AmC4H和ScCPR1的背景下在48小时和72小时产生的三叶苷浓度。根皮素菌株对照(Pt)未检测到三叶苷产生。
具体实施方式
在本发明的一些实施方案中,本发明涉及产生三叶苷和用于产生宿主细胞的方法,所述宿主细胞包括具有增加的三叶苷含量或增加的4’-O-糖基转移酶活性的植物细胞或植物。
本发明基于对负责植物中三叶苷产生的立体特异性糖基转移酶(根皮素糖基转移酶2(PGT2))的鉴别,尽管本文描述了遗传、生物化学和分子表征。栽培苹果叶片中PGT2的过表达显著增加了转基因苹果叶茶的三叶苷水平和感知甜度两者。
负责产生三叶苷的特定糖基转移酶的鉴别允许开发标志物辅助选择以繁育含有三叶苷的植物,并且允许通过生物技术手段(诸如作物植物中的生物制药和诸如酵母的宿主细胞的代谢工程)产生高水平的这种天然低热量甜味剂。
因此,根据本发明的一个方面,提供产生具有增加的三叶苷含量或增加的4’-O-糖基转移酶活性的宿主细胞、植物细胞或植物的方法,所述方法包括用编码具有SEQ ID NO:1到9中任一个的氨基酸序列的多肽或所述多肽的变体的多核苷酸转化所述宿主细胞或植物细胞。
本发明还提供产生具有增加的三叶苷含量或增加的4’-O-糖基转移酶活性的宿主细胞、植物细胞或植物的方法,所述方法包括用包含选自序列SEQ ID NO:10到18中任一个的核苷酸序列或其变体的多核苷酸转化所述宿主细胞或植物细胞。
如本文所用的术语“三叶苷”是指二氢查耳酮糖苷,也被称为根皮素-4′-O-葡糖苷,其结构示于下文(式I):
Figure BDA0003864585190000131
三叶苷具有IUPAC名称1-[2,6-二羟基-4-[(2S,3R,4S,5S,6R)-3,4,5-三羟基-6-(羟甲基)环氧乙烷-2-基]氧基苯基]-3-(4-羟基苯基)丙-1-酮和和CAS编号4192-90-9。
如本文所用的术语“根皮素”是指二氢查耳酮,也被称为二氢柚皮素、三羟苯酚丙酮(phloretol)或3-(4-羟基苯基)-1-(2,4,6-三羟基苯基)丙-1-酮,其结构示于下文(式II):
Figure BDA0003864585190000141
如本文所用的术语“具有4’-O-糖基转移酶活性”是指葡萄糖部分在4-羟基处连接到底物。
三叶苷生物合成通常需要共底物(根皮素和UDP-葡萄糖),并且涉及葡萄糖部分在4-羟基处连接到根皮素。通常通过具有4′-O-糖基转移酶活性的酶来实现葡萄糖部分在4-羟基处连接到根皮素。此类糖基转移酶催化糖部分(例如葡萄糖)从活化核苷酸糖(例如UDP-葡萄糖)转移到受体分子(例如根皮素)的4-羟基。发明人已鉴别出负责植物中的三叶苷产生的立体特异性糖基转移酶,其被称为根皮素糖基转移酶2(PGT2)。
申请人已鉴别编码具有4’-O-糖基转移酶活性的多肽(SEQ ID NO:1到9)的多核苷酸(SEQ ID NO:10到18),如表12中所概述。
申请人已证明所有公开的4’-O-糖基转移酶多肽序列(SEQ ID NO:1到9)均具有显著的序列保守性并且是彼此的变体(图6)。
类似地,申请人已证明所有公开的4’-O-糖基转移酶多核苷酸序列(SEQ ID NO:10到18)均具有显著的序列保守性并且是彼此的变体。
本文公开了含有这些多核苷酸序列(SEQ ID NO:10到18)或编码多肽序列(SEQ IDNO:1到9)的序列的遗传构建体、载体和植物。
在某些实施方案中,提供包含本文所公开的遗传构建体和载体的植物和宿主细胞。
在一些实施方案中,提供相对于适合的对照植物在4’-O-糖基转移酶活性方面改变的植物和相对于适合的对照植物在三叶苷含量方面改变的植物。在一些实施方案中,提供具有增加的4’-O-糖基转移酶活性和增加的三叶苷的植物。
在其他实施方案中,提供用于生产此类植物的方法和选择此类植物的方法。
适合的对照植物包括相同种或变种的非转化植物或用对照构建体转化的植物。
多核苷酸和片段
如本文所用的术语“多核苷酸”意指任何长度但优选至少15个核苷酸的单链或双链脱氧核糖核苷酸或核糖核苷酸聚合物,并且作为非限制性示例包括基因的编码序列和非编码序列、正义和反义序列互补体、外显子、内含子、基因组DNA、cDNA、前体mRNA、mRNA、rRNA、siRNA、miRNA、tRNA、核酶、重组多肽、分离和纯化的天然存在的DNA或RNA序列、合成RNA和DNA序列、核酸探针、引物和片段。
本文所提供的多核苷酸序列的“片段”是能够与目的靶标特异性杂交的连续核苷酸的子序列,例如,长度为至少15个核苷酸的序列。如本文所公开的片段包含如本文所公开的多核苷酸的连续核苷酸的15个核苷酸、优选至少20个核苷酸、更优选至少30个核苷酸、更优选至少50个核苷酸、更优选至少50个核苷酸且最优选至少60个核苷酸。多核苷酸序列的片段可用于反义、基因沉默、三股螺旋或核酶技术中,或用作引物、探针,包括在微阵列中,或用于如本文所公开的基于多核苷酸的选择方法中。
术语“引物”是指通常具有自由的3’OH基团的短多核苷酸,其与模板杂交并且用于引发与模板互补的多核苷酸的聚合。此类引物的长度优选至少5个、更优选至少6个、更优选至少7个、更优选至少9个、更优选至少10个、更优选至少11个、更优选至少12个、更优选至少13个、更优选至少14个、更优选至少15个、更优选至少16个、更优选至少17个、更优选至少18个、更优选至少19个、更优选至少20个核苷酸。
术语“探针”是指在基于杂交的测定中用于检测与探针互补的多核苷酸序列的短多核苷酸。探针可由如本文所定义的多核苷酸的“片段”组成。优选地,此类探针的长度为至少5个、更优选至少10个、更优选至少20个、更优选至少30个、更优选至少40个、更优选至少50个、更优选至少100个、更优选至少200个、更优选至少300个、更优选至少400个且最优选至少500个核苷酸。
多肽和片段
如本文所用的术语“多肽”涵盖任何长度但优选至少5个氨基酸的氨基酸链,包括全长蛋白质,其中氨基酸残基通过共价肽键连接。如本文所公开的多肽可以是纯化的天然产物,或可部分或完全使用重组或合成技术来产生。该术语可以是指多肽、多肽的聚集体(诸如二聚体或其他多聚体)、融合多肽、多肽片段、多肽变体或其衍生物。
多肽的“片段”是执行生物活性所需的功能和/或提供多肽的三维结构的多肽子序列。该术语可以是指能够执行上述酶活性的多肽、多肽的聚集体(诸如二聚体或其他多聚体)、融合多肽、多肽片段、多肽变体或其衍生物。
如应用于本文所公开的多核苷酸或多肽序列的术语“分离的”用于指从其天然细胞环境中去除的序列。分离的分子可通过包括生物化学、重组和合成技术在内的任何方法或方法组合获得。
术语“重组”是指从在天然背景中围绕它的序列去除和/或与在天然背景中不存在的序列重组的多核苷酸序列。
通过从“重组”多核苷酸序列翻译来产生“重组”多肽序列。
关于如本文所公开的来源于特定属或种的多核苷酸或多肽的术语“来源于”意指所述多核苷酸或多肽具有与在该属或种中天然发现的多核苷酸或多肽相同的序列。因此,可以合成或重组方式产生来源于特定属或种的多核苷酸或多肽。
变体
如本文所用的术语“变体”是指不同于具体鉴别序列的多核苷酸或多肽序列,其中缺失、取代或添加一个或多个核苷酸或氨基酸残基。变体可以是天然存在的等位基因变体或非天然存在的变体。变体可来自相同物种或来自其他物种,并且可涵盖同源物、旁系同源物和直系同源物。本文所述的变体还可经由多肽的编码序列的定点诱变或通过组合来自不同天然存在的多肽的编码序列的结构域(“结构域交换”)来产生。用于修饰编码本文所述的功能多肽的基因的技术是已知的并且尤其包括定向进化技术、定点诱变技术和随机诱变技术,并且可用于以期望的方式增加多肽的比活性、改变底物特异性、改变表达水平、改变亚细胞定位或改良多肽-多肽相互作用。此类修饰的多肽被视为变体。
在某些实施方案中,本文所公开的多核苷酸和多肽的变体具有与本文所公开的多核苷酸或多肽相同或相似的生物活性。关于多核苷酸和多肽的术语“变体”涵盖如本文所定义的多核苷酸和多肽的所有形式。
多核苷酸变体
变体多核苷酸序列优选展现与如本文所公开的序列至少70%、更优选至少71%、更优选至少72%、更优选至少73%、更优选至少74%、更优选至少75%、更优选至少76%、更优选至少77%、更优选至少78%、更优选至少79%、更优选至少80%、更优选至少81%、更优选至少82%、更优选至少83%、更优选至少84%、更优选至少85%、更优选至少86%、更优选至少87%、更优选至少88%、更优选至少89%、更优选至少90%、更优选至少91%、更优选至少92%、更优选至少93%、更优选至少94%、更优选至少95%、更优选至少96%、更优选至少97%、更优选至少98%且最优选至少99%的同一性。在在本文所公开的多核苷酸的至少20个核苷酸位置、优选至少50个核苷酸位置、更优选至少100个核苷酸位置、更优选至少200个核苷酸位置、更优选至少300个核苷酸位置、更优选至少400个核苷酸位置、更优选至少500个核苷酸位置,且最优选其全长的比较窗口中,找到同一性。
可以如下方式确定多核苷酸序列同一性。使用bl2seq(Tatiana A.Tatusova,Thomas L.Madden(1999),“BLAST 2序列-用于比较蛋白质和核苷酸序列的新工具(Blast 2sequences-a new tool for comparing protein and nucleotide sequences)”,FEMSMicrobiol Lett.174:247-250)中的BLASTN(来自BLAST程序套件,2.2.5版[2002年11月])(其可从NCBI(ftp://ftp.ncbi.nih.gov/blast/公开获得)比较主题多核苷酸序列与候选多核苷酸序列。除了应当关闭低复杂性部分的滤除之外,利用bl2seq的默认参数。
可使用以下unix命令行参数检查多核苷酸序列的同一性:
bl2seq-i nucleotideseq1-j nucleotideseq2-F F-p blastn
参数-F F关闭低复杂性区段的滤除。参数-p为序列对选择适当的算法。bl2seq程序将序列同一性报告为行“同一性=”中的相同核苷酸的数目和百分比。
还可使用全局序列比对程序在候选多核苷酸序列与主题多核苷酸序列之间的整个重叠长度上计算多核苷酸序列同一性(例如,Needleman,S.B.和Wunsch,C.D.(1970)J.Mol.Biol.48,443-453)。在可从http://www.hgmp.mrc.ac.uk/Software/EMBOSS/获得的EMBOSS程序包(Rice,P.Longden,I.和Bleasby,A.EMBOSS:欧洲分子生物学开放软件套装(The European Molecular Biology Open Software Suite),Trends in Genetics2000年6月,第16卷,第6期,第276-277页)中的needle程序中找到了Needleman-Wunsch全局比对算法的完整实施方式。欧洲生物信息学研究所(European Bioinformatics Institute)服务器也提供工具而在http:/www.ebi.ac.uk/emboss/align/上在线进行两个序列之间的EMBOSS-needle全局比对。
或者,可使用GAP程序,其计算两个序列的最佳全局比对而不对末端空位进行罚分。GAP描述于以下论文中:Huang,X.(1994)论全局序列比对(on Global SequenceAlignment).Computer Applications in the Biosciences 10,227-235。
用于计算多核苷酸%序列同一性的另一方法基于使用Clustal X对待比较的序列比对(Jeanmougin等,1998,Trends Biochem.Sci.23,403-5.)。
本发明的多核苷酸变体还涵盖那些与一个或多个特定鉴别的序列展现相似性的序列,其可能保留那些序列的功能等同性,并且不能合理地被预期通过随机的机会产生。可使用来自上文所述的BLAST程序套件的公开可获得的bl2seq程序确定关于多肽的此类序列相似性。
可使用以下unix命令行参数检查多核苷酸序列的相似性:
bl2seq-i nucleotideseq1-j nucleotideseq2-F F-p tblastx
参数-F F关闭低复杂性区段的滤除。参数-p为序列对选择适当的算法。该程序在序列间找到相似性区域,并且对于每个这样的区域报告一个“E值”,E值是在含有随机序列的固定参考大小的数据库中可预期随机见到这样的匹配的预期次数。该数据库的大小在bl2seq程序中默认设置。对于远小于1的小E值,E值大约是这样的随机匹配的概率。
当与任一具体鉴别的序列比较时,变体多核苷酸序列优选展现小于1×10-10、更优选小于1×10-20、更优选小于1×10-30、更优选小于1×10-40、更优选小于1×10-50、更优选小于1×10-60、更优选小于1×10-70、更优选小于1×10-80、更优选小于1×10-90且最优选小于1×10-100的E值。
或者,使如本文所公开的变体多核苷酸在严格条件下与指定的多核苷酸序列或其互补体杂交。
术语“在严格条件下杂交”和其语法等同物是指在限定的温度和盐浓度的条件下,多核苷酸分子与靶多核苷酸分子(诸如固定于DNA或RNA印迹诸如Southern印迹或Northern印迹上的靶多核苷酸分子)杂交的能力。可通过最初在较不严格的条件下杂交,然后将严格性增加到期望的严格性来确定在严格杂交条件下杂交的能力。
关于长度大于约100个碱基的多核苷酸分子,典型的严格杂交条件为低于天然双链体的解链温度(Tm)不超过25到30℃(例如,10℃)(通常参见Sambrook等编辑,1987,分子克隆实验室手册(Molecular Cloning,A Laboratory Manual),第2版,Cold SpringHarbor Press;Ausubel等,1987,分子生物学现行方案(Current Protocols in MolecularBiology),Greene Publishing)。可通过公式Tm=81.5+0.41%(G+C-log(Na+)计算大于约100个碱基的多核苷酸分子的Tm。(Sambrook等编辑,1987,分子克隆实验室手册,第2版,Cold Spring Harbor Press;Bolton和McCarthy,1962,PNAS 84:1390)。对于长度大于100个碱基的多核苷酸,典型的严格条件将是诸如以下的杂交条件:在6×SSC、0.2%SDS的溶液中预洗涤;在65℃、6×SSC、0.2%SDS下杂交过夜;之后在65℃在1×SSC、0.1%SDS中洗涤两次,每次30分钟,并且在65℃在0.2×SSC、0.1%SDS中洗涤两次,每次30分钟。
关于长度小于100个碱基的多核苷酸分子,示例性严格杂交条件为低于Tm 5℃到10℃。平均来说,长度小于100bp的多核苷酸分子的Tm减小大约(500/寡核苷酸长度)℃。
关于被称为肽核酸(PNA)的DNA模拟物(Nielsen等,Science.1991年12月6日;254(5037):1497-500),其Tm值高于DNA-DNA或DNA-RNA杂交体的Tm值,并且可使用Giesen等,Nucleic Acids Res.1998年11月1日;26(21):5004-6中所述的公式计算。用于长度小于100个碱基的DNA-PNA杂交体的示例性严格杂交条件为低于Tm 5℃到10℃。
如本文所公开的变体多核苷酸还涵盖不同于如本文所公开的序列、但由于遗传密码的简并性而编码与由本发明的多核苷酸编码的多肽具有类似活性的多肽的多核苷酸。不改变多肽的氨基酸序列的序列改变为“沉默变异”。除了ATG(甲硫氨酸)和TGG(色氨酸)之外,可通过本领域公认的技术改变用于相同氨基酸的其他密码子,例如,以优化特定宿主生物体中的密码子使用。
在本发明中还包括导致所编码多肽序列中的不显著改变其生物活性的一个或多个氨基酸的保守取代的多核苷酸序列改变。本领域技术人员将知道用于进行表型沉默氨基酸取代的方法(参见,例如,Bowie等,1990,Science 247,1306)。
可使用从NCBI(ftp://ftp.ncbi.nih.gov/blast/)公开获得的来自BLAST程序套件(2.2.5版[2002年11月])的bl2seq程序,通过如上文所述的tblastx算法确定由于编码的多肽序列中的沉默变异和保守取代而产生的变体多核苷酸。
可例如如实施例部分中所述,通过在细菌中表达此类序列并且测试编码蛋白质的活性来评估本文所公开的变体多核苷酸作为4’-O-糖基转移酶的功能。变体的功能还可针对其改变植物中的4’-O-糖基转移酶活性或三叶苷含量的能力来测试,也如本文的实施例部分中所述。
多肽变体
关于多肽的术语“变体”涵盖天然存在、重组和合成产生的多肽。变体多肽序列优选展现与本发明的序列至少70%、更优选至少71%、更优选至少72%、更优选至少73%、更优选至少74%、更优选至少75%、更优选至少76%、更优选至少77%、更优选至少78%、更优选至少79%、更优选至少80%、更优选至少81%、更优选至少82%、更优选至少83%、更优选至少84%、更优选至少85%、更优选至少86%、更优选至少87%、更优选至少88%、更优选至少89%、更优选至少90%、更优选至少91%、更优选至少92%、更优选至少93%、更优选至少94%、更优选至少95%、更优选至少96%、更优选至少97%、更优选至少98%且最优选至少99%的同一性。在如本文所公开的多肽的至少20个氨基酸位置、优选至少50个氨基酸位置、更优选至少100个氨基酸位置且最优选其全长的比较窗口中,找到同一性。
可以如下方式确定多肽序列同一性。使用bl2seq中的BLASTP(来自BLAST程序套件,2.2.5版[2002年11月])(其可从NCBI(ftp://ftp.ncbi.nih.gov/blast/)公开获得)比较主题多肽序列与的候选多肽序列。除了应当关闭低复杂性区域的滤除之外,利用bl2seq的默认参数。
还可使用全局序列比对程序在候选多肽序列与主题多肽序列之间的整个重叠长度上计算多肽序列同一性序列同一性。如上文所讨论的EMBOSS-needle(可于http:/www.ebi.ac.uk/emboss/align/获得)和GAP(Huang,X.(1994)论全局序列比对(On GlobalSequence Alignment).Computer Applications in the Biosciences 10,227-235.)也是用于计算多肽序列同一性的适合的全局序列比对程序。
用于计算多肽%序列同一性的另一方法基于待使用Clustal X比较的比对序列(Jeanmougin等,1998,Trends Biochem.Sci.23,403-5.)。
如本文所公开的多肽变体还涵盖那些与一个或多个特定鉴别的序列展现相似性的序列,其可能保留那些序列的功能等同性,并且不能合理地被预期通过随机的机会产生。可使用从NCBI(ftp://ftp.ncbi.nih.gov/blast/)公开可获得的来自BLAST程序套件(2.2.5版[2002年11月])的bl2seq程序确定关于多肽的此类序列相似性。可使用以下unix命令行参数检查多肽序列的相似性:
bl2seq-i peptideseq1-j peptideseq2-F F-p blastp
参数-F F关闭低复杂性区段的滤除。参数-p为序列对选择适当的算法。该程序在序列间找到相似性区域,并且对于每个这样的区域报告一个“E值”,E值是在含有随机序列的固定参考大小的数据库中可预期随机见到这样的匹配的预期次数。对于远小于1的小E值,这大约是这种随机匹配的概率。
当与任一特定鉴别的序列比较时,变体多肽序列优选展现小于1×10-10、更优选小于1×10-20、更优选小于1×10-30、更优选小于1×10-40、更优选小于1×10-50、更优选小于1×10-60、更优选小于1×10-70、更优选小于1×10-80、更优选小于1×10-90且最优选小于1×10-100的E值。
在本发明中还包括所述多肽序列的不显著改变其生物活性的一个或多个氨基酸的保守取代。本领域技术人员将知道用于进行表型沉默氨基酸取代的方法(参见,例如,Bowie等,1990,Science 247,1306)。
测定′-O-糖基转移酶活性的方法是本领域所熟知的,并且包括例如用于LC-MS的标准糖基转移酶测定和用于UDP-葡萄糖焦磷酸化酶的放射性测定。还可通过本文实施例部分中所述的方法来评估多肽变体作为4’-O-糖基转移酶的功能。
用于鉴别变体的方法
物理方法
可使用基于PCR的方法(Mullis等编辑,1994,聚合酶链式反应(The PolymeraseChain Reaction),Birkhauser)鉴别变体多肽。通常,可用于通过PCR扩增如本文所公开的多核苷酸分子的变体的引物的多核苷酸序列可基于编码相应氨基酸序列的保守区的序列。
或者,可采用本领域技术人员所熟知的文库筛选方法(Sambrook等,分子克隆:实验室手册,第2版,Cold Spring Harbor Press,1987)。当鉴别探针序列的变体时,杂交和/或洗涤严格性通常将相对于寻找精确序列匹配时降低。
还可通过物理方法,例如通过使用针对本文所公开的多肽产生的抗体筛选表达文库(Sambrook等,分子克隆:实验室手册,第2版,Cold Spring Harbor Press,1987)或通过借助于此类抗体从天然来源鉴别多肽,来鉴别多肽变体。
基于计算机的方法
还可使用公共的结构域序列比对算法和序列相似性搜索工具(以搜索序列数据库)(公共的结构域数据库包括Genbank、EMBL、Swiss-Prot、PIR等),通过本领域技术人员熟知的基于计算机的方法来鉴别如本文所公开的变体序列,包括多核苷酸和多肽变体两者。关于在线资源的示例,参见例如Nucleic Acids Res.29:1-10和11-16,2001。相似性搜索检索和比对靶序列以供与待分析的序列(即,查询序列)进行比较。序列比较算法使用评分矩阵来向每个比对分配总体评分。
可用于在序列数据库中鉴别变体的示例性程序系列是BLAST程序套件(2.2.5版[2002年11月]),包括BLASTN、BLASTP、BLASTX、tBLASTN和tBLASTX,其可从(ftp://ftp.ncbi.nih.gov/blast/)或从国家生物技术信息中心(National Center forBiotechnology Information)(NCBI)、国家医学图书馆(National Library of Medicine)(Building 38A,Room 8N805,Bethesda,MD 20894 USA)公开获得。NCBI服务器还提供设施,以使用所述程序来筛选大量可公开获得的序列数据库。BLASTN将核苷酸查询序列与核苷酸序列数据库进行比较。BLASTP将氨基酸查询序列与蛋白质序列数据库进行比较。BLASTX比较所有阅读框中翻译的核苷酸查询序列与蛋白质序列数据库。tBLASTN比较蛋白质查询序列与在所有阅读框中动态翻译的核苷酸序列数据库。tBLASTX比较核苷酸查询序列的六框翻译与核苷酸序列数据库的六框翻译。BLAST程序可以默认参数使用,或者可根据需要改变参数以改进筛选。
包括BLASTN、BLASTP和BLASTX的BLAST算法系列的用途描述于Altschul等,Nucleic Acids Res.25:3389-3402,1997中。
由通过BLASTN、BLASTP、BLASTX、tBLASTN、tBLASTX或相似算法产生的查询序列对一个或多个数据库序列的“命中(hit)”比对并鉴别序列的相似部分。以相似性程度和序列重叠的长度排列命中。对数据库序列的命中通常表示仅在查询序列的一部分序列长度上的重叠。
BLASTN、BLASTP、BLASTX、tBLASTN和tBLASTX算法还产生用于比对的“预期”值。预期值(E)指示当搜索含有随机邻接序列的相同大小的数据库时可“预期”随机见到的命中的数目。预期值用作确定对数据库的命中是否指示实际相似性的显著性阈值。例如,分配给多核苷酸命中的E值为0.1被解释为意指在所筛选的数据库大小的数据库中,可预期在具有相似评分的序列比对的部分上简单地随机见到0.1个匹配。对于在比对和匹配部分上具有0.01或更小的E值的序列,使用BLASTN、BLASTP、BLASTX、tBLASTN或tBLASTX算法在该数据库中随机发现匹配的概率为1%或更小。
可利用CLUSTALW(Thompson,J.D.,Higgins,D.G.和Gibson,T.J.(1994)CLUSTALW:通过序列加权、位置特异性空位惩罚和加权矩阵选择来改善渐进多序列比对的灵敏度(CLUSTALW:improving the sensitivity of progressive multiple sequencealignment through sequence weighting,positions-specific gap penalties andweight matrix choice).Nucleic Acids Research,22:4673-4680,http://www-igbme.u-strasbg.fr/BioInfo/ClustalW/Top.html)或T-COFFEE(Cedric Notredame,DesmondG.Higgins,Jaap Heringa,T-Coffee:用于快速且准确的多序列比对的新方法(T-Coffee:Anovel method for fast and accurate multiple sequence alignment),J.Mol.Biol.(2000)302:205-217))或PILEUP(其使用渐进成对比对)(Feng和Doolittle,1987,J.Mol.Evol.25,351)进行一组相关序列的多序列比对。
模式识别软件应用程序可用于寻找基序或标志序列(signature sequence)。例如,MEME(用于基序引出的多重Em,Multiple Em for Motif Elicitation)在一组序列中寻找基序和标志序列,并且MAST(基序比对和搜索工具,Motif Alignment and Search Tool)使用这些基序在查询序列中鉴别相似或相同的基序。MAST结果作为一系列具有适当的的统计数据的比对和所发现的基序的可视概况而提供。MEME和MAST由University ofCalifornia,San Diego开发。
PROSITE(Bairoch和Bucher,1994,Nucleic Acids Res.22,3583;Hofmann等,1999,Nucleic Acids Res.27,215)是鉴别从基因组或cDNA序列翻译的未表征蛋白质的功能的方法。PROSITE数据库(www.expasy.org/prosite)含有生物显著模式和概述,其被设计成使其可与适当的计算工具使用,以将新序列分配给已知的蛋白质家族或确定序列中存在何种已知的结构域(Falquet等,2002,Nucleic Acids Res.30,235)。Prosearch是可以给定序列模式或标志搜索SWISS-PROT和EMBL数据库的工具。
蛋白质结构域模型数据库的另一示例是Pfam(Sonnhammer等,1997,基于种子比对的蛋白质家族综合数据库(A comprehensive database of protein families based onseed alignments),Proteins,28:405-420;Finn等,2010,Pfam蛋白家族数据库’(The Pfamprotein families database’),Nucl.Acids Res.,38:D211-D222)。“Pfam”是指由Pfam协会(Pfam Consortium)维护且可在若干受资助的万维网站点(包括pfam.xfam.org/(欧洲生物信息学研究所(EMBL-EBI))上获得的蛋白质结构域和蛋白质家族的大型集合。Pfam的最新版本是Pfam30.0(2016年6月)。使用多序列比对和隐马尔可夫模型(hidden Markovmodel)(HMM)鉴别Pfam结构域和家族。Pfam-A家族或结构域分配是通过使用蛋白质家族的代表性成员的策划种子比对(curated seed alignment)和基于种子比对的分布型隐马尔可夫模型(profile hidden Markov model)生成的高质量分配。(除非另有说明,否则查询蛋白质与Pfam结构域或家族的匹配为Pfam-A匹配。)然后使用所有经鉴别属于所述家族的序列自动生成所述家族的完全比对(Sonnhammer(1998)Nucleic Acids Research 26,320-322;Bateman(2000)Nucleic Acids Research 26,263-266;Bateman(2004)Nucleic AcidsResearch 32,Database Issue,D138-D141;Finn(2006)Nucleic Acids ResearchDatabase Issue 34,D247-251;Finn(2010)Nucleic Acids Research Database Issue38,D211-222)。通过例如使用上述网站访问Pfam数据库,可使用HMMER同源性搜索软件(例如,HMMER2、HMMER3或更高版本,hmmer.org)针对HMM查询蛋白质序列。将查询蛋白质鉴别为在pfam家族中(或鉴别为具有特定Pfam结构域)的重要匹配是比特评分(bit score)大于或等于Pfam结构域的集聚阈值的匹配。还可使用预期值(e值)作为用于在pfam中包括所查询蛋白质或用于确定所查询蛋白质是否具有特定pfam结构域的准则,其中低e值(远小于1.0,例如小于0.1或小于或等于0.01)代表因偶然而匹配的低概率。
可测试如本文所公开的变体多核苷酸作为编码4’-O-糖基转移酶的功能的活性,或者可通过本文实施例部分中所述的方法测试其改变植物中的三叶苷含量的能力。
用于分离或产生多核苷酸的方法
还可通过使用本领域普通技术人员已知的多种技术来分离本文所公开的多核苷酸分子。举例来说,可通过使用Mullis等编辑,1994,聚合酶链式反应,Birkhauser(以引用方式并入本文)中所述的方法分离此类多核苷酸。可使用衍生自如本文所公开的多核苷酸序列的如本文所定义的引物来扩增如本文所公开的多核苷酸。
用于分离如本文所公开的多核苷酸的其他方法包括使用具有本文所述的序列的多核苷酸的全部或部分作为杂交探针。将标记的多核苷酸探针与固定在固体载体(诸如硝酸纤维素滤膜或尼龙膜)上的多核苷酸杂交的技术可用于筛选基因组或cDNA文库。示例性杂交和洗涤条件是:于65℃在5.0×SSC、0.5%十二烷基硫酸钠、1×Denhardt′s溶液中杂交20小时;在1.0×SSC、1%(w/v)十二烷基硫酸钠中洗涤(在55℃洗涤三次,每次20分钟),并且任选地于60℃在0.5×SSC、1%(w/v)十二烷基硫酸钠中洗涤一次(20分钟)。可在0.1×SSC、1%(w/v)十二烷基硫酸钠的条件下,在60℃进行任选的进一步洗涤(持续20分钟)。
可通过本领域所熟知的技术(诸如限制性内切核酸酶消化、寡核苷酸合成和PCR扩增)产生如本文所公开的多核苷酸片段。
可在本领域所熟知的方法中使用部分多核苷酸序列来鉴别相应的全长多核苷酸序列。此类方法包括基于PCR的方法、5’RACE(Frohman MA,1993,Methods Enzymol.218:340-56)和基于杂交的方法、基于计算机/数据库的方法。此外,举例来说,反向PCR允许从基于已知区域的引物开始获取侧接本文所公开的多核苷酸序列的未知序列(Triglia等,1998,Nucleic Acids Res 16,8186,以引用方式并入本文)。所述方法使用若干限制酶在基因的已知区域中生成适合的片段。然后通过分子内连接使片段环化并且将其用作PCR模板。从已知区域设计趋异引物(Divergent primer)。为了物理组装全长克隆,可利用标准分子生物学方法(Sambrook等,分子克隆:实验室手册,第2版,Cold Spring Harbor Press,1987)。
当从特定物种产生转基因植物时,用来源于所述物种的一个或多个序列转化此类植物可能有益。益处可能是减轻公众对生成转基因生物的跨物种转化的担忧。另外,当基因的下调是期望的结果时,可能需要利用与植物中期望降低表达的序列相同(或至少高度相似)的序列。尤其出于这些原因,期望能够在若干不同植物物种中鉴别和分离特定基因的直系同源物。
可通过本文所述的方法鉴别变体(包括直系同源物)。
用于分离或产生多肽的方法
可使用本领域所熟知的肽合成方法(诸如使用固相技术(例如Stewart等,1969,固相肽合成(Solid-Phase Peptide Synthesis),WH Freeman Co,San FranciscoCalifornia)的使用直接肽合成或例如使用Applied Biosystems 431A肽合成仪(FosterCity,California)的自动化合成)来制备如本文所公开的多肽,包括变体多肽。在此类合成期间还可产生多肽的突变形式。
还可使用本领域所熟知的多种技术(例如Deutscher编辑,1990,酶学方法(Methods in Enzymology),第182卷,蛋白质纯化指南(Guide to ProteinPurification))从天然来源纯化如本文所公开的多肽和变体多肽。
或者,如本文所公开的多肽和变体多肽可在如本文所公开的适合宿主细胞中重组表达并且如下文所讨论的从细胞中分离。
构建体、载体和其组分
根据一个实施方案,可用于根据本发明的一些实施方案的方法中的多核苷酸可提供于可用于转化植物或宿主细胞的核酸构建体中。本文描述了适合的植物和宿主细胞。
术语“遗传构建体”是指这样的多核苷酸分子,其通常为双链DNA,其中可能已插入另一多核苷酸分子(插入的多核苷酸分子),诸如但不限于cDNA分子。遗传构建体可含有允许转录插入的多核苷酸分子并且任选地将转录物翻译成多肽的必要元件。插入的多核苷酸分子可来源于宿主细胞,或可来源于不同的细胞或生物体和/或可以是合成或重组多核苷酸。一旦在宿主细胞内,遗传构建体就可整合在宿主细胞染色体DNA中。遗传构建体可连接到载体。
术语“载体”是指用于将遗传构建体转运到宿主细胞中的多核苷酸分子,通常是双链DNA。载体可以能够在至少一个另外的宿主系统(诸如大肠杆菌)中复制。
术语“表达构建体”是指包含允许转录插入的多核苷酸分子并且任选地将转录物翻译成多肽的必要调控元件的遗传构建体。表达构建体通常在5’到3’方向上包含:
a)在构建体转化进入的宿主细胞中有功能的启动子,
b)待表达的多核苷酸,和
c)在构建体转化进入的宿主细胞中有功能的终止子。
术语“编码区”或“开放阅读框”(ORF)是指能够在适当调控序列的控制下产生转录产物和/或多肽的基因组DNA序列或cDNA序列的有义链。通过5’翻译起始密码子和3’翻译终止密码子的存在来鉴别编码序列。当插入遗传构建体中时,“编码序列”能够在可操作地连接到启动子和终止子序列时表达。
由于许多微生物能够从多顺反子mRNA表达多种基因产物,因此如果期望,可在用于那些微生物的单个调控区的控制下表达多种多肽。
“可操作地连接”意指将待表达的序列置于调控元件的控制之下,所述调控元件包括启动子、组织特异性调控元件、时间调控元件、增强子、阻遏物和终止子。通常,编码序列的翻译阅读框的翻译起始位点定位在用于单顺反子基因的调控区的下游1到约50个核苷酸之间处。
“调控区”是指具有影响转录或翻译起始和速率、以及转录或翻译产物的稳定性和/或移动性的核苷酸序列的核酸。调控区包括但不限于启动子序列、增强子序列、应答元件、蛋白质识别位点、诱导元件、蛋白质结合序列、5′和3′非翻译区(UTR)、转录起始位点、终止序列、多聚腺苷酸化序列、内含子和其组合。调控区通常至少包含核心(基本)启动子。调控区还可包含至少一个控制元件,诸如增强子序列、上游元件或上游活化区(UAR)。通过定位调控区和编码序列,将调控区可操作地连接到编码序列,使得调控区对于调控序列的转录或翻译有效。例如,为了可操作地连接编码序列和启动子序列,编码序列的翻译阅读框的翻译起始位点通常定位在启动子下游的一个与约50个核苷酸之间处。然而,调控区可定位在翻译起始位点上游多达约5,000个核苷酸处,或转录起始位点上游约2,000个核苷酸处。
待包括的调控区的选择取决于若干因素,其包括但不限于效率、可选择性、可诱导性、期望的表达水平以及在某些培养阶段期间的优先表达。本领域技术人员通常通过相对于编码序列适当地选择和定位调控区来调节编码序列的表达。应当理解,可存在超过一个调控区,例如,内含子、增强子、上游活化区、转录终止子和诱导元件。
术语“非编码区”包含翻译起始位点上游和翻译终止位点下游的非翻译序列。这些序列也分别被称为5’UTR和3’UTR。这些序列可包括转录起始和终止以及调控翻译效率所需的元件。术语“非编码”还包括基因组克隆内的内含子序列。
终止子是终止转录的序列,并且见于翻译序列下游的基因的3’非翻译末端中。终止子是mRNA稳定性的重要决定因素,并且在一些情况下已发现具有空间调控功能。
术语“启动子”是指编码区上游调控基因转录的非转录顺式调控元件。启动子包含顺式起始元件(其指定转录起始位点)和保守盒(诸如TATA盒)以及被转录因子结合的基序。
“转基因”是取自一种生物体并通过转化引入不同生物体中的多核苷酸。转基因可来源于与引入转基因的生物体的物种相同的物种或不同的物种。
“反向重复”是重复序列,其中所述重复的第二半部在互补链中,例如,
(5’)GATCTA.......TAGATC(3’)
(3’)CTAGAT.......ATCTAG(5’)
通读转录(Read-through transcription)将产生这样的转录物,其经历互补性碱基配对以形成发夹结构,条件是在重复区域之间存在3-5pb的间隔子。
用于产生构建体和载体的方法
如本文所公开的遗传构建体包含一个或多个如本文所公开的多核苷酸序列和/或编码如本文所公开的多肽的多核苷酸,并且可用于转化例如细菌、真菌、昆虫、哺乳动物或植物生物体。本文所公开的遗传构建体意在包括如本文所定义的表达构建体。
用于产生和使用遗传构建体和载体的方法是本领域所熟知的,并且在Sambrook等,分子克隆:实验室手册,第2版,Cold Spring Harbor Press,1987;Ausubel等,分子生物学现行方案,Greene Publishing,1987)中有一般描述。
宿主细胞
在其他实施方案中,提供包含如本文所公开的遗传构建体或载体的宿主细胞。在优选实施方案中,宿主细胞经遗传修饰以i)表达编码具有SEQ ID NO:1到9中任一个的氨基酸序列的多肽或所述多肽的变体的多核苷酸,或ii)表达包含选自序列SEQ ID NO:10到18中任一个的核苷酸序列或其变体的多核苷酸。
包含如本文所公开的遗传构建体(诸如表达构建体)的宿主细胞可用于本领域所熟知的方法(例如Sambrook等,分子克隆:实验室手册,第2版,Cold Spring Harbor Press,1987;Ausubel等,分子生物学现行方案,Greene Publishing,1987)用于重组产生本文所公开的多肽。此类方法可涉及在适于或有助于本文所公开的多核苷酸或多肽表达的条件下在适当培养基中培养宿主细胞。然后可通过本领域所熟知的方法(例如Deutscher编辑,1990,酶学方法,第182卷,蛋白质纯化指南)从介质、宿主细胞或培养基中分离可任选地分泌到培养物中的经表达的重组多肽。
因此,根据一些实施方案,如本文所公开的宿主细胞可用于根据本发明的一些实施方案产生三叶苷的方法中。如本文所公开或根据如本文所公开的方法使用的宿主细胞优选是或用作生物技术产生如本文所公开的三叶苷的产生菌株。
首先分析经选择用作三叶苷产生菌株的物种和菌株以确定对该菌株为内源性的产生基因以及不存在的基因。有利地在一种或多种表达构建体中组装内源对应物不存在于所述菌株中的基因,然后将其转化到所述菌株中以便供应缺失的功能。
下文更详细地描述示例性原核物种和真核物种。然而,应当了解,其他物种可能适合。例如,适合的种可在诸如以下的属中:蘑菇属(Agaricus)、曲霉属(Aspergillus)、芽孢杆菌属(Bacillus)、假丝酵母属Candida、棒状杆菌属(Corynebacterium)、假囊酵母属(Eremothecium)、大肠杆菌属、镰刀菌属(Fusarium)/赤霉菌属(Gibberella)、克鲁维酵母属(Kluyveromyces)、多孔菌属(Laetiporus)、香菇属(Lentinus)、发夫酵母属(Phaffia)、平革菌属(Phanerochaete)、毕赤酵母属(Pichia)、立碗藓属(Physcomitrella)、红酵母属(Rhodoturula)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)、痂圆孢属(Sphaceloma)、法夫酵母属(Xanthophyllomyces)或耶氏酵母属(Yarrowia)。来自此类属的示例性种包括虎皮香菇(Lentinus tigrinus)、硫色多孔菌(Laetiporus sulphureus)、黄孢原毛平革菌(Phanerochaete chrysosporium)、巴斯德毕赤酵母、甲醇毕赤酵母、杰丁塞伯林德纳氏酵母、小立碗藓(Physcomitrella patens)、粘红酵母(Rhodoturula glutinis)32、胶红酵母(Rhodoturula mucilaginosa)、红发夫酵母(Phaffia rhodozyma)UBV-AX、法夫酵母、藤仓镰刀菌(Fusarium fujikuroi)/藤仓赤霉菌(Gibberella fujikuroi)、产朊假丝酵母(Candida utilis)、光滑假丝酵母、白假丝酵母和解脂耶氏酵母。
在一些实施方案中,微生物可以是原核生物,诸如大肠杆菌、酿酒酵母、球形红杆菌(Rhodobacter sphaeroides)、荚膜红细菌(Rhodobacter capsulatus)或圆红酵母(Rhodotorula toruloides)。
在一些实施方案中,微生物可以是子囊菌纲(Ascomycete),诸如藤仓赤霉菌、乳酸克鲁维酵母、粟酒裂殖酵母、黑曲霉(Aspergillus niger)、解脂耶氏酵母、棉阿舒囊霉或酿酒酵母。
在一些实施方案中,微生物可以是诸如以下种的藻类或蓝细菌细胞:三孢布拉霉(Blakeslea trispora)、盐生杜氏藻(Dunaliella salina)、雨生红球藻(Haematococcuspluvialis)、小球藻属种(Chlorella sp.)、裙带菜(Undaria pinnatifida)、马尾藻属(Sargassum)、海带(Laminaria japonica)、阿尔默瑞珊列藻(Scenedesmus almeriensis)。
酵母属种.
酵母属是广泛用于合成生物学中的底盘(chassis)生物体,并且可用作重组微生物平台。例如,存在可用于酿酒酵母的突变体、质粒、代谢的详细计算机模型和其他信息的文库,从而允许合理设计各种模块以提高产物产率。已知用于制备重组微生物的方法。
曲霉属种
诸如米曲霉(A.oryzae)、黑曲霉和酱油曲霉(A.sojae)的曲霉属种是广泛用于食品生产中的微生物,并且还可用作重组微生物平台。核苷酸序列可用于构巢曲霉(A.nidulaus)、烟曲霉(A.fumigatus)、米曲霉、棒曲霉(A.clavatus)、黄曲霉(A.flavus)、黑曲霉和土曲霉(A.terreus)的基因组,从而允许合理设计和修改内源途径以提高通量和增加产物产率。已开发用于曲霉属的代谢模型。通常,培养黑曲霉用于工业生产许多食物成分,诸如柠檬酸和葡糖酸,因此诸如黑曲霉的种通常适于生产三叶苷。
大肠杆菌
大肠杆菌是合成生物学中另一种广泛使用的平台生物体,也可用作重组微生物平台。类似于酵母属,存在可用于大肠杆菌的突变体、质粒、代谢的详细计算机模型和其他信息的文库,从而允许合理设计各种模块以提高产物产率。类似于上文针对酵母属所述的方法的方法可用于制备重组大肠杆菌微生物。
蘑菇属种、赤霉菌属种和平革菌属种.
蘑菇属种、赤霉菌属种和平革菌属种可能有用,因为已知它们在培养中产生大量类异戊二烯。因此,已由内源基因产生用于产生大量苯丙素(包括三叶苷)的前体。
解腺嘌呤阿氏酵母(食腺嘌呤芽生葡萄孢酵母(Blastobotrys adeninivorans))
解腺嘌呤阿氏酵母是具有不寻常生物化学特征的二型酵母。它可以在宽范围的底物上生长并且可同化硝酸盐。它已成功被应用于生成可产生天然塑料的菌株或开发针对环境样品中的雌激素的生物传感器。
解脂耶氏酵母.
解脂耶氏酵母也是二型酵母,并且属于半子囊菌纲(Hemiascomycetes)。已知解脂耶氏酵母的完整基因组。耶氏酵母属是需氧的并且被认为是非病原性的。耶氏酵母属在使用疏水性底物(例如烷烃、脂肪酸、油)方面是有效的并且可在糖上生长。它具有很高的工业应用潜力并且是产油微生物。解脂耶氏酵母可将脂质含量积累到其干细胞重量的大约40%,并且是用于脂质积累和再移动的模型生物体。
红酵母属种
红酵母属是单细胞有色酵母。已显示产油红酵母粘红酵母由粗制甘油产生脂质和类胡萝卜素。圆红酵母菌株已被证明是用于提高生物量和脂质生产力的有效补料分批发酵系统。
圆红酵母
圆红酵母是产油酵母并且可用于改造脂质产生途径。
红杆菌属种.
红细菌属可用作重组微生物平台。类似于大肠杆菌,存在可用的突变体以及适合的质粒载体的文库,从而允许合理设计各种模块以提高产物产率。已在红细菌属的膜细菌种中改造类异戊二烯途径以增加类胡萝卜素和CoQ10的产生。类似于上文针对大肠杆菌所述的方法的方法可用于制备重组红细菌属微生物。
博伊丁假丝酵母
博伊丁假丝酵母是甲基营养型酵母。与诸如多形汉逊酵母和巴斯德毕赤酵母的其他甲基营养种一样,它为产生异源蛋白质提供极佳的平台。已报道分泌的外来蛋白质的多克范围内的产率。计算方法IPRO最近预测了实验性地将博伊丁假丝酵母木糖还原酶的辅因子特异性从NADPH转换到NADH的突变。
多形汉逊酵母(安格斯毕赤酵母(Pichia angusta))
多形汉逊酵母是另一甲基营养型酵母(参见博伊丁假丝酵母)。它还可在宽范围的其他底物上生长;它是耐热的并且可同化硝酸盐(还参见乳酸克鲁维酵母)。它已被应用于生产乙型肝炎疫苗、胰岛素和用于治疗丙型肝炎的干扰素α-2a,此外还应用于一系列工业酶(technical enzyme)。
乳酸克鲁维酵母
乳酸克鲁维酵母是定期应用于生产开菲尔(kefir)的酵母。它可以在几种糖上生长,最重要的是在存在于乳汁和乳清中的乳糖上生长。它已被成功地尤其应用于生产凝乳酶(通常存在于小牛胃中的酶)以用于生产干酪。在40,000 L规模的发酵器中进行生产。
巴斯德毕赤酵母
巴斯德毕赤酵母是甲基营养型酵母(参见博伊丁假丝酵母和多形汉逊酵母)。它为生产外来蛋白质提供有效平台。平台元件可用作试剂盒,并且它在全世界被学术界用于生产蛋白质。已改造可产生复杂的人N-聚糖的菌株(酵母聚糖与人中发现的聚糖类似但不完全相同)。
立碗藓属种.
当在悬浮培养中生长时,立碗藓属藓类具有类似于酵母或其他真菌培养物的特征。该属正在成为用于产生植物次级代谢物的重要细胞类型,这些次级代谢产物在其他类型的细胞中可能难以产生。
培养、表达和分离
在其他实施方案中,提供用于生物合成三叶苷的方法,其包括在可供应到宿主细胞或可存在于宿主细胞中的根皮素存在下培养如本文所公开的宿主细胞的步骤,所述宿主细胞能够表达4’-O-糖基转移酶。
三叶苷生物合成通常需要共底物(根皮素和UDP-葡萄糖)。因此,根据一个实施方案,宿主细胞包含根皮素和UDP-葡萄糖。在另一实施方案中,UDP-葡萄糖和/或根皮素可被供应到宿主细胞。根皮素和UDP-葡萄糖各自单独地或组合地可以是细胞内源性的或外源添加的。另外,为了产生三叶苷或上调三叶苷的产生,可将底物(例如根皮素和/或UDP-葡萄糖)外源性添加到包含内源水平的这些底物的细胞。与未外源接收底物的宿主细胞相比,这一步骤通常导致底物水平(例如根皮素和/或UDP-葡萄糖)增加至少约5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、100%或更多。
另外或可选择地,为了产生三叶苷或上调三叶苷的产生,可通过引入或增加根皮素和/或UDP-葡萄糖生物合成途径中的组分的水平来提供或上调细胞中的底物(例如根皮素和/或UDP-葡萄糖)水平。因此,为了产生根皮素或上调的根皮素水平,可提供或上调柚皮苷二氢查耳酮、根皮苷、根皮素-4′-O-葡糖苷或对二氢香豆酰-CoA。或者,查耳酮合酶或柚皮素-查耳酮合酶(CHS)可连同共底物3×丙二酰-CoA一起提供或上调以用于根皮素的产生或上调合成。同样,对于UDP-葡萄糖的产生或上调,可产生或上调葡萄糖-1-磷酸。或者,UDP-葡萄糖-焦磷酸化酶可连同共底物UTP一起提供或上调以用于UDP-葡萄糖的合成。
可使用本领域已知的任何方法,诸如通过使宿主细胞与底物(例如根皮素和/或UDP-葡萄糖)诸如在细胞培养基中接触来实现底物(例如根皮素和/或UDP-葡萄糖)的外源添加。
可使用核酸构建体或使用如本文所述的基因组编辑(例如,用于表达包含SEQ IDNO:1到9中任一个的氨基酸序列的多肽)来实现另外的酶在细胞中的表达。应当了解,可在单一核酸构建体中提供超过一个外源多核苷酸(例如2个、3个、4个、5个等),或者,可将两个或更多个(例如3个、4个、5个等)核酸构建体引入单一宿主细胞中。
在优选实施方案中,可在宿主细胞中存在或引入查耳酮合酶(CHS)、或查耳酮合酶(CHS)和双键还原酶(DBR)。例如,适合的查耳酮合酶包括HaCHS(NCBI蛋白质保藏号:Q9FUB7.1)和HvCHS2(NCBI蛋白质保藏号:Q96562.1),并且优选HaCHS。适合的双键还原酶包括ScTSC13(NCBI蛋白质保藏号:NP_010269.1)和KITSC13(NCBI蛋白质保藏号XP_452392.1),并且优选ScTSC13。
本文所公开的宿主细胞可用于产生如本文所公开的三叶苷的方法中,并且可使用常规发酵工艺来培养,所述常规发酵工艺尤其包括恒化器培养、分批培养、补料分批培养、连续灌注发酵和连续灌注细胞培养。
例如,如果宿主细胞是微生物(例如大肠杆菌),则所述方法可包括在表达催化本发明一些实施方案的方法的步骤的酶(例如4′-O-糖基转移酶(例如PGT2))的条件下使所述微生物在培养基中生长。可使重组微生物在补料分批或连续工艺中生长。通常,使重组微生物在发酵器中在限定的温度下生长期望的时间段。此类确定在本领域技术人员的技能范围内。
例如,在根据本发明的方法的一个实施方案中,在有氧条件下培养重组微生物,优选直到达到最大生物量浓度。在这方面,OD600应优选地至少在1到15或更高的范围内,优选在5到300的范围内,特别是在10到275的范围内,优选在15到250的范围内。然后优选在厌氧条件下培养微生物,其中例如借助于异丙基β-D-1-硫代吡喃半乳糖苷(IPTG)和/或乳糖(当使用相应的适合启动子或相应的适合的表达系统时)进行期望的氨基酸序列或期望的酶基于所引入的遗传构建体或载体的表达。
优选地,至少部分或完全在厌氧条件下进行培养。
取决于微生物,本领域技术人员可创造用于培养目的的适合的环境条件,并且特别可提供适合的(培养)介质。优选在LB或TB培养基中进行培养。或者,使用由植物原材料,特别是柑橘、葡萄柚和橙子植物组成或包含所述植物原材料的(更复杂的)培养基。例如在超过20℃、优选超过25℃、特别是超过30℃(优选在30℃到40℃范围内)的温度下进行培养。
如果将一种或多种适合的诱导剂(例如IPTG或乳糖)用于诱导(例如lac操纵子),则优选关于含有重组微生物的(培养)介质以0.001到1mM、优选0.005到0.9mM、特别优选0.01到0.8mM的量使用诱导物。
为了分离或纯化三叶苷,可例如进行用有机溶剂的提取。这些溶剂优选选自以下列表:异丁烷、2-丙醇、甲苯、乙酸甲酯、2-丁醇、己烷、1-丙醇、轻质石油、1,1,1,2-四氟乙烷、甲醇、丙烷、1-丁醇、丁烷、乙基甲基酮、乙酸乙酯、乙醚、乙醇、二丁醚、CO2、叔丁基甲醚、丙酮、二氯甲烷和N2O。特别优选与水形成视觉上可识别的相界的那些溶剂。此后,可进行溶剂中的残余水的去除以及溶剂本身的去除,进而之后可将三叶苷再溶解于(可能不同的)溶剂中,所述溶剂例如适于任选地随后的结晶和产物干燥。或者或另外,可进行吸附纯化、蒸馏纯化和/或色谱纯化。
或者,干燥方法可用于分离或纯化形成的三叶苷,特别是真空带式干燥、喷雾干燥、蒸馏或冻干含细胞或不含细胞的发酵溶液。
用于产生包含构建体和载体的植物细胞和植物的方法
在其他实施方案中,提供包含如本文所公开的遗传构建体的植物细胞和经修饰以改变如本文所公开的多核苷酸或多肽的表达的植物细胞。还提供包含此类细胞的植物。
可通过根据本发明的一些实施方案的方法在植物中改变4’-O-糖基转移酶活性。此类方法可涉及用构建体转化植物细胞和植物,所述构建体被设计成改变调节此类植物细胞和植物中4’-O-糖基转移酶活性或三叶苷含量的多核苷酸或多肽的表达。此类方法还包括用如本文所公开的构建体与一种或多种其他构建体的组合转化植物细胞和植物,所述其他构建体被设计成改变调节此类植物细胞和植物中4’-O-糖基转移酶活性和/或三叶苷含量的一种或多种多核苷酸或多肽的表达。
用于用多肽转化植物细胞、植物和其部分的方法描述于以下文献中:Draper等,1988,植物遗传转化和基因表达(Plant Genetic Transformation and GeneEXpression).实验室手册(A Laboratory Manual).Blackwell Sci.Pub.Oxford,第365页;Potrykus和Spangenburg,1995,向植物的基因转移(Gene Transfer to Plants).Springer-Verlag,Berlin.;和Gelvin等,1993,植物分子生物学手册(Plant MolecularBiol.Manual).Kluwer Acad.Pub.Dordrecht。Galun和Breiman,1997,转基因植物(Transgenic Plants),Imperial College Press,London中提供了对转基因植物的综述,包括转化技术。
用于遗传操纵植物的方法
可利用许多植物转化策略(例如Birch,1997,Ann Rev Plant Phys Plant MolBiol,48,297,Hellens RP等(2000)Plant Mol Biol 42:819-32,Hellens R等Plant Meth1:13)。例如,策略可被设计成在正常表达多核苷酸/多肽的植物细胞、器官和/或特定发育阶段中增加多核苷酸/多肽的表达,或者在不正常表达多核苷酸/多肽的细胞、组织、器官和/或特定发育阶段中异位表达多核苷酸/多肽。表达的多核苷酸/多肽可来源于待转化的植物物种或可来源于不同的植物物种。
转化策略可被设计成在正常表达多核苷酸/多肽的植物细胞、组织、器官或特定发育阶段中减少多核苷酸/多肽的表达。此类策略被称为基因沉默策略。
转基因植物中用于基因表达的遗传构建体通常包括用于驱动一个或多个克隆的多核苷酸表达的启动子、终止子和检测在转化植物中存在遗传构建体的选择性标志物序列。
适用于如本文所述的构建体中的启动子在单子叶植物或双子叶植物的细胞、组织或器官中有功能,并且包括细胞、组织和器官特异性的启动子,细胞周期特异性启动子,时序启动子(temporal promoter),诱导型启动子,在多数植物组织中有活性的组成型启动子,和重组启动子。启动子的选择将取决于所期望的克隆的多核苷酸的时间和空间表达。启动子可以是那些通常与目的转基因相连的启动子,或来源于其它植物、病毒和植物病原性细菌和真菌的基因的启动子。本领域技术人员将无需过多实验即能够选择适用于使用包含如本文所公开的多核苷酸序列的遗传构建体而改变和调节植物性状的启动子。组成型植物启动子的示例包括CaMV 35S启动子、胭脂碱合酶启动子和章鱼碱合酶启动子,以及来自玉米的Ubi 1启动子。在特定组织中有活性、对内部发育信号或外部非生物或生物应激有反应的植物启动子描述于科学文献中。示例性的促进剂描述于例如WO 02/00894(其以引用方式并入本文)中。
通常用于植物转化遗传构建体中的示例性终止子包括例如花椰菜花叶病毒(CaMV)35S终止子、根癌土壤杆菌(Agrobacterium tumefaciens)胭脂碱合酶或章鱼碱合酶终止子、玉米(Zea mays)玉米醇溶蛋白基因终止子、水稻(Oryza sativa)ADP-葡萄糖焦磷酸化酶终止子和马铃薯(Solanum tuberosum)PI-II终止子。
通常用于植物转化中的选择性标志物包括赋予卡那霉素抗性的新霉素磷酸转移酶II基因(NPT II)、赋予壮观霉素和链霉素抗性的aadA基因、赋予Ignite(AgrEvo)和Basta(Hoechst)抗性的草丁膦(phosphinothricin)乙酰转移酶(bar基因)以及赋予潮霉素抗性的潮霉素磷酸转移酶基因(hpt)。
还涵盖可用于分析植物和植物组织中的启动子表达的包含报告基因(其编码表达对于宿主来说为外来的活性(通常为酶活性和/或可见信号(例如荧光素酶、GUS、GFP))的序列)的遗传构建体的用途。报告基因文献综述于Herrera-Estrella等,1993,Nature 303,209和Schrott,1995,向植物的基因转移(Potrykus,T.,Spangenberg.编辑)SpringerVerlag.Berline,第325-336页中。
基因沉默策略可集中在基因本身或影响编码多肽的表达的调控元件。“调控元件”在本文中以尽可能广泛的意义使用并且包括与目的基因相互作用的其他基因。
设计成减少如本文所公开的多核苷酸/多肽的表达或使其沉默的遗传构建体可包括如本文所公开的多核苷酸的反义拷贝。在此类构建体中,多核苷酸相对于启动子和终止子置于反义取向。
通过将多核苷酸或多核苷酸的区段倒置来获得“反义”多核苷酸,使得产生的转录物将与基因的mRNA转录物互补,例如,
5’-GATCTA-3’(编码链) 3’-CTAGAT-5’(反义链)
3’-CUAGAU-5’mRNA 5’-GAUCUA-3’反义RNA
设计用于基因沉默的遗传构建体还可包含反向重复。‘反向重复’是重复序列,其中所述重复的第二半部在互补链中,例如,
5’-GATCTA.........TAGATC-3’
3’-CTAGAT.........ATCTAG-5’
所形成的转录物可经历互补碱基配对以形成发夹结构。通常需要重复区域之间有至少3-5bp的间隔子以允许发夹形成。
另一沉默方法涉及使用靶向等同于miRNA的转录物的小反义RNA(Llave等,2002,Science 297,2053)。明确涵盖对应于如本文所公开的多核苷酸的此类小反义RNA的用途。
如本文所用的术语遗传构建体还包括小反义RNA和影响基因沉默的其他此类多肽。
用如本文所定义的表达构建体进行转化还可通过称为有义抑制的过程导致基因沉默(例如,Napoli等,1990,Plant Cell 2,279;de Carvalho Niebel等,1995,PlantCell,7,347)。在一些情况下,有义抑制可涉及全部或部分编码序列的过表达,但还可涉及基因的非编码区域(诸如内含子或5’或3’非翻译区域(UTR))的表达。嵌合部分有义构建体可用于协调地使多个基因沉默(Abbott等,2002,Plant Physiol.128(3):844-53;Jones等,1998,Planta 204:499-505)。还涵盖使用此类有义抑制策略以使如本文所公开的多核苷酸的表达沉默。
设计用于基因沉默的遗传构建体中的多核苷酸插入物可对应于编码序列和/或非编码序列,诸如启动子和/或内含子和/或5’或3’UTR序列,或相应基因。
其他基因沉默策略包括显性负性方法和使用核酶构建体(McIntyre,1996,Transgenic Res,5,257)
可通过基因本身或其调控元件的突变引起转录前沉默。此类突变可包括点突变、移码、插入、缺失和取代。
以下是公开可用于对下列植物物种进行遗传转化的遗传转化方案的代表性出版物:水稻(Alam等,1999,Plant Cell Rep.18,572);苹果(Yao等,1995,Plant Cell Reports14,407-412);玉米(美国专利号5,177,010和5,981,840);小麦(Ortiz等,1996,Plant CellRep.15,1996,877);番茄(美国专利序列号5,159,135);马铃薯(Kumar等,1996,PlantJ.9,:821);木薯(Li等,1996 Nat.Biotechnology 14,736);莴苣(Michelmore等,1987,Plant Cell Rep.6,439);烟草(Horsch等,1985,Science 227,1229);棉花(美国专利号5,846,797和5,004,863);草(美国专利号5,187,073和6.020,539);薄荷(Niu等,1998,PlantCell Rep.17,165);柑橘植物(Pena等,1995,Plant Sci.104,183);葛缕子(Krens等,1997,Plant Cell Rep,17,39);香蕉(美国专利序列号5,792,935);大豆(美国专利号5,416,011;5,569,834;5,824,877;5,563,04455和5,968,830);菠萝(美国专利序列号5,952,543);白杨(美国专利号4,795,855);一般性单子叶植物(美国专利号5,591,616和6,037,522);芸苔(美国专利号5,188,958;5,463,174和5,750,871);谷物(美国专利号6,074,877);梨(Matsuda等,2005,Plant Cell Rep.24(1):45-51);李(Ramesh等,2006Plant Cell Rep.25(8):821-8;Song和Sink 2005Plant Cell Rep.2006;25(2):117-23;Gonzalez Padilla等,2003Plant Cell Rep.22(1):38-45);草莓(Oosumi等,2006Planta.223(6):1219-30;Folta等,2006 Planta 4月14日;PMID:16614818);蔷薇(Li等,2003);悬钩子属(Rubus)(Graham等,1995Methods Mol Biol.1995;44:129-33);番茄(Dan等,2006,Plant Cell ReportsV25:432-441);苹果(Yao等,1995,Plant Cell Rep.14,407-412)和毛花猕猴桃(Actinidiaeriantha)(Wang等,2006,Plant Cell Rep.25,5:425-31)。本发明还涵盖其他物种的转化。可在科学文献中获得适合的方法和方案。
在一个实施方案中,提供产生具有增加的三叶苷含量或增加的4’-O-糖基转移酶活性的植物细胞或植物的方法,所述方法包括在所述植物细胞或植物中上调具有SEQ IDNO:1到9中任一个的氨基酸序列的多肽或所述多肽的变体的表达。
在另一实施方案中,提供产生具有增加的三叶苷含量或增加的4’-O-糖基转移酶活性的植物细胞或植物的方法,所述方法包括在所述植物细胞或植物中上调包含选自序列SEQ ID NO:10到18中任一个的核苷酸序列或其变体的多核苷酸的表达。
可采用本领域已知的若干方法来改变如本文所公开的核苷酸和/或多肽的表达。此类方法包括但不限于Tilling(Till等,2003,Methods Mol Biol,2%,205)和所谓的“Deletagene”技术(Li等,2001,lant Journal27(3),235)。
其他方法可涉及使用在目的基因中生成靶向双链DNA断裂的序列特异性核酸酶。此类方法的示例包括:锌指核酸酶(Curtin等,2011,Sander等,2011)、转录活化子样效应子核酸酶或“TALEN”(Cermak等,2011,Mahfouz等,2011,Li等,2012)和LAGLIDADG归巢核酸内切酶,也称为“巨核酸酶(meganuclease)”(Tzfira等,2012)。
使用经改造核酸酶进行靶向基因组编辑(诸如成簇、规则间隔的短回文重复(CRISPR)技术)是用于生成具有可定制特异性的RNA导向性核酸酶(诸如Cas9)的重要新方法。由这些核酸酶介导的基因组编辑已被用于快速、容易且有效地修饰多种生物医学上重要的细胞类型中和传统上对遗传操纵具有挑战性的生物体中的内源性基因。已开发CRISPR-Cas9系统的修改形式以募集可调控内源基因表达或标记活细胞中的特定基因组基因座的异源结构域(Sander和Joung,2014)。所述技术适用于真菌(Nodvig等,2015)。
例如通过基因组编辑来上调多肽在植物中的表达可通过以下方式实现:(i)替代编码目的多肽的内源序列或所述内源序列置于其控制下的调控序列,和/或(ii)在基因组的靶向区域中插入编码目的多肽的新基因,和/或(iii)引入导致编码目的多肽的内源基因上调的点突变(例如,通过改变诸如启动子、增强子、5′-UTR和/或3′-UTR的调控序列,或编码序列中的突变)。
以这种方式,可上调编码具有SEQ ID NO:1到9中任一个的氨基酸序列的多肽或所述多肽的变体、或包含选自序列SEQ ID NO:10到18中任一个的核苷酸序列或其变体的内源基因,导致三叶苷含量增加或4’-O-糖基转移酶活性增加。
靶向特定多肽的抗体或其片段也可在植物中表达以调节该多肽的活性(Jobling等,2003,Nat.Biotechnol.,21(1),35)。还可应用转座子标记方法。另外,可通过诸如噬菌体展示(Dyax公司)的技术鉴别与如本文所公开的多肽相互作用的肽。此类相互作用肽可在植物中表达或应用于植物以影响如本文所公开的多肽的活性。特别涵盖每种上述方法在改变如本文所公开的核苷酸和/或多肽的表达中的用途。
术语“改变如本文所公开的多核苷酸或多肽的表达”和“如本文所公开的多核苷酸或多肽的改变表达”意在涵盖如下情况:对应于如本文所公开的多核苷酸的基因组DNA被修饰,由此引起如本文所公开的多核苷酸或多肽的改变表达。基因组DNA的修饰可通过遗传转化或本领域已知用于诱导突变的其他方法。“改变的表达”可与信使RNA和/或产生的多肽的量的增加或减少有关,并且还可由于多核苷酸和产生的多肽的序列改变而引起多肽的活性改变。
选择植物的方法
还提供用于选择具有改变的4’-O-糖基转移酶或三叶苷含量的植物的方法。此类方法涉及测试植物中如本文所公开的多核苷酸或多肽的表达的改变。当改变的4’-O-糖基转移酶活性或三叶苷含量不一定易于测量时,此类方法可应用于幼年或早期发育阶段。
多核苷酸(诸如信使RNA)的表达经常用作相应多肽的表达的指标。用于测量多核苷酸表达的示例性方法包括但不限于Northern分析、RT-PCR和斑点印迹分析(Sambrook等,分子克隆:实验室手册,第2版,Cold Spring Harbor Press,1987)。因此,如本文所公开的多核苷酸或多核苷酸的部分可用作如本文所定义的用于鉴别具有改变水平的4’-O-糖基转移酶或三叶苷的植物的方法中的探针或引物。如本文所公开的多核苷酸可用作杂交实验中的探针,或用作基于PCR的实验中的引物,其被设计成鉴别此类植物。
或者,可针对如本文所公开的多肽产生抗体。用于产生和使用抗体的方法是本领域的标准(参见例如:抗体实验室手册(Antibodies,A Laboratory Manual),Harlow ALane编辑,Cold Spring Harbour Laboratory,1998)。此类抗体可用于检测本文所公开的多肽的改变表达的方法中。此类方法可包括ELISA(Kemeny,1991,ELISA实践指南(APractical Guide to ELISA),NY Pergamon Press)和Western分析(Towbin&Gordon,1994,J Immunol Methods,72,313)。
这些用于分析多核苷酸或多肽表达并选择具有改变的4’-O-糖基转移酶或改变的三叶苷含量的植物的方法可用于设计成产生具有改变的4’-O-糖基转移酶活性或三叶苷含量的品种的常规育种程序中。
植物
术语“植物”意在包括完整植物、植物的任何部分、繁殖体和植物的子代。
术语“繁殖体”意指可用于再生或繁殖(无论有性的还是无性的)的植物的任何部分,包括种子和插条(cutting)。
“转基因”或转化”植物是指由于遗传操纵或转化而含有新遗传材料的植物。新的遗传材料可来源于与所得转基因或转化植物相同的物种的植物或来源于不同物种。转化的植物包括用新的遗传材料稳定或瞬时转化的植物。
根据本发明的一些实施方案的植物可生长并自交或与不同的植物品系杂交,并且可鉴别具有期望的表型特征的所得杂种。可生长两代或更多代以确保主题表型特征稳定地维持和遗传。由此类标准育种方法产生的植物也构成本发明的一个方面。
可例如如本文实施例部分中所述,通过在细菌中表达此类序列并且测试编码蛋白质的活性来评估本文所公开的变体多核苷酸作为编码4’-O-糖基转移酶的功能。
还可通过根据本发明的一些实施方案的方法在植物中改变4’-O-糖基转移酶活性和/或三叶苷含量。此类方法可涉及用如本文所公开的构建体转化植物细胞和植物,所述构建体被设计成改变调节此类植物细胞和植物中4’-O-糖基转移酶活性和/或三叶苷含量的多核苷酸或多肽的表达。此类方法优选还包括用如本文所公开的构建体与一种或多种其他构建体的组合转化植物细胞和植物,所述其他构建体被设计成改变调节此类植物细胞和植物中三叶苷含量的一种或多种其他多核苷酸或多肽的表达。优选地,在植物细胞或植物中表达4’-O-糖基转移酶、查耳酮合酶(CHS)和双键还原酶(DBR)的组合。
特别可用于本文所公开的本发明方法中的植物包括所有属于绿色植物(Viridiplantae)超科(superfamily)的植物,特别是单子叶植物和双子叶植物,包括选自尤其包括以下的列表的饲料或草料豆类(fodder or forage legume)、观赏植物、粮食作物、乔木或灌木:金合欢属种(Acacia spp.)、槭属种(Acer spp.)、猕猴桃属种(Actinidiaspp.)、七叶树属(Aesculus spp.)、澳洲贝壳杉(Agathis australis)、苦合欢(Albiziaamara)、三色桫椤(Alsophila tricolor)、须芒草属种(Andropogon spp.)、拟南芥属种(Arabidopsis spp.)、落花生属种(Arachis spp)、槟榔(Areca catechu)、Asteliafragrans、鹰嘴紫云英(Astragalus cicer)、多小叶红苏木(Baikiaea plurijuga)、桦木属种(Betula spp.)、芸苔属种(Brassica spp.)、木榄(Bruguiera gymnorrhiza)、伯克苏木(Burkea africana)、紫铆(Butea frondosa)、Cadaba farinosa、朱缨花属种(Calliandraspp)、茶(Camellia sinensis)、美人蕉(Canna indica)、辣椒属种(Capsicum spp.)、决明属种(Cassia spp.)、距瓣豆(Centroema pubescens)、木瓜属种(Chaenomeles spp.)、肉桂(Cinnamomum cassia)、小粒咖啡(Coffea arabica)、可乐豆木(Colophospermum mopane)、变异小冠花(Coronillia varia)、晚熟枸子(Cotoneaster serotina)、山楂属种(Crataegus spp.)、黄瓜属种(Cucumis spp.)、柏木属种(Cupressus spp.)、银叶蕨(Cyathea dealbata)、榅椁(Cydonia oblonga)、日本柳杉(Cryptomeria japonica)、香茅属种(Cymbopogon spp.)、货贝黄檀(Dalbergia monetaria)、大叶骨碎补(Davalliadivaricata)、山蚂蝗属种(Desmodium spp.)、粗糙蚌壳蕨(Dicksonia squarosa)、Diheteropogon amplectens、迪奥豆属种(Dioclea spp)、镰扁豆属种(Dolichos spp.)、直矛豆(Dorycnium rectum)、金字塔稗(Echinochloa pyramidalis)、Ehrartia spp.、龙爪稷(Eleusine coracana)、画眉草属种(Eragrestis spp.)、刺桐属种(Erythrina spp.)、桉树属种(Eucalyptus spp.)、希氏假乌木(Euclea schimperi)、毛金茅(Eulalia villosa)、荞麦属种(Fagopyrum spp.)、南美棯(Feijoa sellowiana)、草莓属种(Fragaria spp.)、千斤拔属种(Flemingia spp)、彭氏藤露兜树(Freycinetia banksii)、童氏老鹳草(Geraniumthunbergii)、银杏(Ginkgo biloba)、爪哇大豆(Glycine javanica)、南洋樱属种(Gliricidia spp)、陆地棉(Gossypium hirsutum)、银桦属种(Grevillea spp.)、非洲红木(Guibourtia coleosperma)、岩黄耆属种(Hedysarum spp.)、牛鞭草(Hemarthiaaltissima)、黄茅(Heteropogon contortus)、大麦(Hordeum vulgare)、红苞茅(Hyparrhenia rufa)、小连翘(Hypericum erectum)、Hyperthelia dissoluta、白花庭蓝(Indigo incarnata)、莺尾属种(Iris spp.)、檀郎草(Leptarrhena pyrolifolia)、胡枝子属种(Lespediza spp.)、莴苣属种(Lettuca spp.)、银合欢(Leucaena leucocephala)、Loudetia simplex、Lotonus bainesii、百脉根属种(Lotus spp.)、大结豆(Macrotylomaaxillare)、苹果属种(Malus spp.)、木薯(Manihot esculenta)、紫苜蓿(Medicagosativa)、水杉(Metasequoia glyptostroboides)、大蕉(Musa sapientum)、烟草属种(Nicotianum spp.)、驴食豆属种(Onobrychis spp.)、鸟足豆属种(Ornithopus spp.)、稻属种(Oryza spp.)、非洲双翼豆(Peltophorum afficanum)、狼尾草属种(Pennisetumspp.)、鳄梨(Persea gratissima)、碧冬茄属(Petunia spp.)、菜豆属种(Phaseolusspp.)、加拿利刺葵(Phoenix canariensis)、新西兰剑麻(Phormium cookianum)、石楠属种(Photinia spp.)、白云杉(Picea glauca)、松属种(Pinus spp.)、豌豆(Pisum sativum)、桃柘罗汉松(Podocarpus totara)、Pogonarthria fleckii、Pogonarthria squarrosa、杨属种(Populus spp.)、牧豆树(Prosopis cineraria)、花旗松(Pseudotsuga menziesii)、星状老虎刺(Pterolobium stellatum)、梨属种(Pyrus spp.)、栎属种(Quercus spp.)、厚叶石斑木(Rhaphiolepsis umbellata)、香棕(Rhopalostylis sapida)、纳塔尔盐肤木(Rhus natalensis)、欧洲醋栗(Ribes grossularia)、茶蔗子属种(Ribes spp.)、刺槐(Robinia pseudoacacia)、蔷薇属种(Rosa spp.)、悬钩子属种、柳属种(Salix spp.)、红裂稃草(Schyzachyrium sanguineum)、金松(Sciadopitys verticillata)、北美红杉(Sequoia sempervirens)、巨杉(Sequoiadendron giganteum)、高梁(Sorghum bicolor)、菠菜属种(Spinacia spp.)、流苏状鼠尾粟(Sporobolus fimbriatus)、Stiburusalopecuroides、矮笔花豆(Stylosanthos humilis)、葫芦茶属种(Tadehagi spp)、落羽杉(Taxodium distichum)、阿拉伯黄背草(Themeda triandra)、车轴草属种(Trifoliumspp.)、小麦属种(Triticum spp.)、异叶铁杉(Tsuga heterophylla)、越桔属种(Vacciniumspp.)、野豌豆属种(Vicia spp.)、葡萄(Vitis vinifera)、锥穗沃森花(Watsoniapyramidata)、马蹄莲(Zantedeschia aethiopica)、玉米(Zea mays)、苋属植物、洋蓟(Artichoke)、芦笋、青花椰菜、抱子甘蓝(Brussels sprouts)、卷心菜、油菜(canola)、胡萝卜、花椰菜、芹菜、羽衣甘蓝(collard greens)、亚麻、散叶甘蓝(kale)、小扁豆、油籽油菜(oilseed rape)、秋葵、洋葱、马铃薯、水稻、大豆、稻秆(straw)、糖用甜菜、甘蔗、向日葵、番茄、南瓜和茶树。
在一些实施方案中,可使用特别针对“生物量”生长的植物。例如,适合的植物包括玉米、柳枝稷、高粱属植物(sorghum)、芒属植物(miscanthus)、甘蔗、白杨、松树、小麦、水稻、大豆、棉花、大麦、草皮草、烟草、马铃薯、竹、油菜、糖用甜菜、向日葵、柳树和桉树。在其他实施方案中,植物尤其是柳枝稷(Panicum virgatum)、芦竹(Arundo donax)、虉草(Phalaris arundinacea)、巨芒草(Miscanthus×giganteus)、芒属种(Miscanthus sp.)、截叶胡枝子(sericea lespedeza)(截叶铁扫帚(Lespedeza cuneata))、小米(millet)、黑麦草(多花黑麦草(Lolium multiflorum)、黑麦草属种(Lolium sp.)、梯牧草(timothy)、地肤属(Kochia)(地肤(Kochia scoparia))、草料大豆、苜蓿、三叶草、印度麻(sunn hemp)、洋麻、美洲雀稗(bahiagrass)、狗牙根(bermudagrass)、毛花雀稗(dallisgrass)、盘固草(pangolagrass)、大须芒草(big bluestem)、假高粱属(indiangrass)、羊茅草(羊茅属种(Festuca sp.))、鸭茅属种(Dactylis sp.)、二穗短柄草(Brachypodium distachyon)、无芒雀麦(smooth bromegrass)、鸭茅属(orchardgrass)或草地早熟禾(Kentuckybluegrass)。
或者,藻类和其他非绿色植物可用于本发明的一些实施方案的方法。在一个实施方案中,植物是葫芦科(Cucurbitaceae)植物,诸如罗汉果(S.grosvenorii)。
根据一个实施方案,植物是蔷薇科(Rosaceae)植物,诸如但不限于苹果树、梨树、榅椁树、杏树、李树、樱桃树、桃树、覆盆子灌木、枇杷树、草莓植物、扁桃树以及观赏树和灌木(例如,玫瑰、绣线菊(meadowsweet)、石楠属植物、火荆属植物(firethorn)、花楸(rowan)和山楂)。
优选的梨属是梨属(Pyrus)。
优选的梨种包括:豆梨(Pyrus calleryana)、高加索梨(Pyrus caucasica)、西洋梨(Pyrus communis)、胡颓子叶梨(Pyrus elaeagrifolia)、杂交梨品种栽培种(Pyrushybrid cultivar)、沙梨(Pyrus pyrifolia)、柳叶梨(Pyrus salicifolia)、秋子梨(Pyrusussuriensis)和白梨(Pyrus x bretschneideri)。
特别优选的属是苹果属。
优选的苹果属种包括:八仙海棠(Malus aldenhamensis)、窄叶海棠(Malusangustifolia)、花红(Malus asiatica)、山荆子(Malus baccata)、花冠海棠(Maluscoronaria)、栽培苹果、台湾林檎(Malus doumeri)、佛罗伦萨苹果(Malus florentina)、多花海棠(Malus floribunda)、褐海棠(Malus fusca)、垂丝海棠(Malus halliana)、河南海棠(Malus honanensis)、湖北海棠(Malus hupehensis)、草原海棠(Malus ioensis)、陇东海棠(Malus kansuensis)、毛山荆子(Malus mandshurica)、西府海棠、红肉苹果(Malusniedzwetzkyana)、沧江海棠(Malus ombrophilia)、东方苹果(Malus orientalis)、西蜀海棠(Malus prattii)、楸子(Malus prunifolia)、苹果(Malus pumila)、萨金特海棠(Malussargentii)、三叶海棠、新疆野苹果(Malus sieversii)、欧洲野海棠(Malus sylvestris)、变叶海棠、花叶海棠(Malus transitoria)、三裂叶海棠、柱形海棠(Malus tschonoskii)、栽培苹果、栽培苹果×新疆野苹果、栽培苹果×西洋梨小金海棠(Malus xiaojinensis)、滇池海棠(Malus yunnanensis)、苹果属种和欧楂(Mespilus germanica)。
特别优选的植物物种是栽培苹果。
在具体实施方案中,植物为栽培苹果、三裂叶海棠或三叶海棠。
在另一实施方案中,植物是葡萄属种植物。示例性的葡萄属种包括但不限于变叶葡萄(Vitis piasezkii maxim)和糖葡萄(Vitis saccharifera makino)。
在优选的实施方案中,所述植物是选自包括但不限于以下属的组的物种的植物:菝葜属(Smilax)(例如甜菝葜(Smilax glyciphylla))、石栎属(例如多穗石栎(Lithocarpus polystachyus))和草莓属(Fragaria)。
用于从植物提取三叶苷的方法
还提供根据本发明的一些实施方案通过从植物中提取三叶苷来产生三叶苷的方法。三叶苷可通过本领域技术人员已知的许多不同方法从植物中提取。
已知用于提取二氢查耳酮的各种方法。例如,Sun等(2015)(以引用方式并入本文)使用两相溶剂系统(正己烷-乙酸乙酯-乙醇-水)从甜茶(多穗石栎)中提取三叶苷。以98.4%的纯度从130mg粗制甜茶提取物获得48.4mg产量的三叶苷。Tanaka T.等,从变叶葡萄和糖葡萄的叶片中分离三叶苷(甜型二氢查耳酮-葡糖苷)(a Sweet Dihydrochalcone-Glucoside from Leaves of Vitis piasezkii Maxim,and V.saccharifera Makino),Agricultural and Biological Chemistry,(1983)47:10,2403-2404(以引用方式并入本文)提供从葡萄属叶片中分离三叶苷的方法。Xiang-Dong Qin和Ji-Kai Liu Z.,Naturforsch.(2003)58c,759-761(以引用方式并入本文)提供从厚叶石栎(Lithocarpuspachyphyllus)叶片中分离三叶苷的方法。Qin,X.等,从海棠叶片中分离的二氢查耳酮化合物显示对人癌细胞系的抗癌作用(Dihydrochalcone Compounds Isolated fromCrabapple Leaves Showed Anticancer Effects on Human Cancer Cell Lines).Molecules 2015,20,21193-21203(以引用方式并入本文)提供使用50%乙醇/水从海棠叶片中提取三叶苷的方法。此外,Xiao Z.等,从‘红丽’海棠果实中进行七种二氢查耳酮的提取、鉴别、抗氧化以及抗癌测试(Extraction,identification,and antioxidant andanticancer tests of seven dihydrochalcones from Malus ′Red Splendor′fruit).Food Chem.2017年9月15日;231:324-331)(以引用方式并入本文)通过80%乙醇中提取,之后在石油醚中提取,然后在乙酸乙酯中提取,从‘红丽’海棠果实中提取三叶苷和其他二氢查耳酮。
这些方法可使用本领域技术人员所熟知的方法按比例扩大以用于更大规模的三叶苷提取。
如本说明书和权利要求书中所用的术语“包含”意指“至少部分地由…组成”。当解释本说明书和权利要求书中包括术语‘包含’的语句时,还可存在除每个语句中以该术语开头的特征之外的其他特征。诸如“包含(comprise)”和“包含(comprised)”的相关术语应以类似方式解释。
如本文所用的术语“和/或”意指“和”或“或”,或在上下文允许的情况下,意指这两者。
如本文所用,名词后的术语‘(s)’意指该名词的复数和/或单数形式。
本发明还可被广义地认为在于本申请的说明书中单独或统一提到或指示的部件、元件和特征以及任何两个或更多个所述部件、元件或特征的任何或所有组合,并且在本文中提及的特定整体在本发明所涉及的领域中具有已知等同物的情况下,此类已知等同物被认为并入本文,如同单独陈述一样。
实施例
现在将参考以下非限制性实施例来说明本发明。
并不意图将本发明的范围仅限于上述实施例。如本领域技术人员将了解的,在不脱离本发明的范围的情况下,许多变化是可能的。
1.实施例1-苹果中的4’-O-糖基转移酶基因的鉴别。
1.1材料和方法
1.1.1植物材料
在新西兰奥克兰阿尔伯特山植物和食品研究中心(PFR)(Mt Albert ResearchCentre of Plant&Food Research(PFR),Auckland,New Zealand)温室中生长的‘皇家嘎拉’和Y3之间的F1幼苗群体中对三叶苷产量作图。Y3来源于‘Aotea’海棠杂交体בM9’栽培苹果。‘Aotea’来源于三叶海棠(其产生3-羟基根皮苷)的开放性杂交(open cross)。三裂叶海棠和‘Aotea’海棠生长在新西兰北哈夫洛克(Havelock North,New Zealand)的PFR研究果园。西府海棠以及用于‘绚丽(Radiant)’海棠杂交体和‘富士’栽培苹果之间的差异基因表达分析的F1群体生长在中国陕西西西北农林大学(Northwest A&F University,Shaanxi,China)洛川苹果实验站(Luochuan Apple Experimental Station)。所有其他材料均生长在中国陕西杨陵西北农林大学的一个实验性果园中。所有树木均生长在其自身的根上,并且使用标准园艺生长做法以及疾病和害虫控制管理进行管理。
1.1.2化学品
从‘红丽’海棠中纯化三叶苷(Xiao等,2017)。3-羟基根皮苷、3-OH根皮素和槲皮素糖苷购自PlantMetaChem(www.PlantMetaChem.com)且矢车菊素购自Extrasynthese(www.extrasynthese.com)。从Sigma Aldrich(sigmaaldrich.com)获得所有其它化学品,包括根皮苷和根皮素。
1.1.3三叶苷基因座的作图
收获来自‘皇家嘎啦’×Y3群体中的幼苗的叶片组织并称重,然后在液氮中快速冷冻。如Dare等,(2017)中所述从100-250mg叶片组织提取酚类,并且如Andre等,(2012)中所述,在装配有二极管阵列检测器的Ultimate 3000系统(Dionex,Sunnyvale,CA,USA)上通过Dionex-HPLC在280nm下定量多酚类。使用DNAeasy Plant Mini Kit(Qiagen)提取幼苗DNA并且使用IRSC 8K SNP阵列(Chagné等,2012)确定基因型。使用GenomeStudio数据分析软件(Illumina)的基因分型模块分析SNP阵列数据。使用JoinMap 4.0版(van Ooijen等,2006)和所鉴别的三叶苷基因座在Y3的LG7上的位置构建遗传图谱。然后使用在PGT2候选基因内设计的HRM引物(图1、表1)和如Chagné等(2012)中的PCR条件来界定PGT2的位置。
HRM分析
Figure BDA0003864585190000521
Figure BDA0003864585190000531
表1.用于HRM分析的引物序列。
1.1.4活性导向的蛋白质纯化
以下方案用于从‘亚当’海棠杂交体进行4’-oGT活性的活性导向纯化以及从西府海棠进行2’-oGT活性的活性导向纯化。将花瓣(50g)在液氮中用来自
Figure BDA0003864585190000532
Works的A11研磨机(VWR,Radnor,PA,USA)研磨成细粉末。在添加40ml提取缓冲液(100mM Tris-HCl,pH7.0,14mM β-巯基乙醇,5mM DTT,10%甘油,2mM EDTA二钠盐和0.5%Triton X-100)和0.05g.ml-1聚乙烯聚吡咯烷酮之后,使用XHF-D高速分散器(Ningbo ScientzBiotechnology,Ningbo,China)将冷冻粉末均质化。将均质物以12000g离心20分钟,并将上清液收集为蛋白质粗制提取物。通过硫酸铵以30%-70%饱和度使上清液中的蛋白质沉淀。将收集的沉淀物溶解于提取缓冲液中并使用PD-10脱盐柱(GE Healthcare)与缓冲液A(20mM Tris-HCl,pH 8.0,2mM DTT)脱盐。将蛋白质溶液加载到预先用缓冲液A平衡的填充有10ml Q-sepharose High Performance(GE Healthcare)的XK16/20柱上,使用AKTAPrime Plus蛋白质色谱系统(GE Healthcare)。利用10个柱体积的0%-100%线性梯度的缓冲液B(缓冲液A+1MNaCl)以1ml·min-1的流速洗脱蛋白质。收集2ml各级分并使用HPLC测定GT活性。汇集具有高GT活性的级分并用超滤离心管(Vivaspin Turbo15,www.sartorius.com)将溶剂交换为缓冲液C(20mM磷酸盐缓冲液,pH 7.0,2mM DTT,1M硫酸铵)。然后将该级分加载到用缓冲液C平衡的填充有10ml Phenyl Sepharose HighPerformance(GE Healthcare)的另一XK16/20柱上。用10×柱体积的100%-0%线性梯度的缓冲液C以1ml·min-1的流速洗脱蛋白质。收集2ml各级分并汇集活性级分并且使用超滤离心管在缓冲液A中进行脱盐。将蛋白质在填充有120ml制备级Superdex 75(GE Healthcare)的XK16/70柱上进一步纯化,平衡并且用缓冲液A以0.8ml·min-1的流速洗脱。收集1ml各级分并测定GT活性。使用超滤离心管将各活性级分单独浓缩,然后用于SDS-PAGE分析。在0-4℃进行所有蛋白质纯化步骤。使用THD-06H循环水浴(Tianheng Instruments,Ningbo,China)控制柱温。
在12%SDS-PAGE凝胶上分离纯化的蛋白质级分并通过考马斯蓝R-250染色显现。根据Gao等(2017)切割靶带并用胰蛋白酶于凝胶中消化。然后将肽混合物加载到于缓冲液A(0.1%甲酸)中连接到C18反相分析柱(Thermo Scientific Easy柱,10em长,75μm内径,3μm树脂)的反相捕获柱(Thermo Scientific Acclaim PepMap 100,100μm×2cm,nanoViperC18)上,并且用线性梯度的缓冲液B(84%乙腈和0.1%甲酸)以通过IntelliFlow技术控制的300nL·min-1流速分离。在耦合到Easy nLC(Proxeon Biosystems,现为ThermoScientific)的QExactive质谱仪(Thermo Scientific)上进行60分钟LC-MS/MS分析,并且以正离子模式操作质谱仪。针对NCBI和于www.rosaceae.org上获得的栽培苹果数据库(Malus_x_domestica.v1.0-primary.protein.fa.gz)使用MaxQuant软件1.5.3.17版(德国马丁斯里德的马克斯-普朗克研究所(Max Planck Institute of Biochemistry,Martinsried,Germany))搜索MS/MS谱。
1.1.5差异基因表达分析
通过HPLC筛选由‘绚丽’海棠杂交体和‘富士’栽培苹果之间的杂交而产生的F1群体的三叶苷和根皮苷。鉴别了81株含有三叶苷+根皮苷(T+P)的植物和81株仅含有根皮苷(P)的植物。从每个幼苗(约20em高)收集一个膨大叶并且制备用于T+P和P的三个汇集重复样品(每个重复含有来自27株植物的叶片)。依照制造商说明书书,使用Trizol试剂(LifeTechnologies)从冷冻研磨粉末中提取总RNA并且在Agilent生物分析仪2100上检查RNA的完整性。依照制造商的建议,使用用于Illumina(Thermo Fisher)的NEBNext Ultra RNA文库制备型试剂盒从每个样品3μgRNA生成测序文库,并且添加索引代码以将序列归属为每个样品。使用Illumina HiSeq4000平台通过Novogene(中国北京)对RNA进行测序。
对于转录组分析,由Novogene(中国北京)使用Illumina Hiseq4000平台对来自每个样品的三个生物复制的RNA进行测序。利用BOWTIE v2.2.3和TopHat v2.0.12将读段(Read)与‘金冠’栽培苹果v1.0p组装体(https://www.rosaceae.org/species/malus/malus_x_domestica/genome_v1.0)进行比对。使用DEGSeq R程序包(1.26.0)进行差异基因表达分析。
1.1.6 qRT-PCR分析
如Malnoy等(2001)所述从幼叶提取总RNA。根据制造商说明书,使用PrimeScriptRT试剂盒(Takara,Dalian,China)从1μg总RNA合成第一链cDNA。用Bio-Rad CFX96系统(Bio-Rad Laboratories,Hercules,CA,USA)使用TB Green Premix Ex Taq(Takara,Dalian,China)进行qRT-PCR。将MdActin用作参考基因。根据2-ΔΔCT方法(Livak和Schmittgen,2001)计算相对表达水平。将各有三个技术重复的三个生物重复用于qRT-PCR分析。基因特异性引物列于表2中。
qRT-PCR
Figure BDA0003864585190000551
表2.用于qRT-PCR的引物序列。所有引物效率均>1.85。
1.2结果
1.2.1分离群体中的三叶苷的作图水平
在由栽培苹果和野生苹果之间的杂交产生的分离群体(‘皇家嘎啦’×Y3)中对三叶苷水平作图。雌性亲本‘皇家嘎啦’(栽培苹果)仅产生根皮苷,而雄性亲本Y3(来源于三叶海棠)产生三叶苷和根皮苷两者。在51株经表型分析的植物中,30株含有三叶苷和根皮苷,且21株仅含根皮苷。分离比率(1∶0.7∶χ2=1.58)表明三叶苷含量作为由单一基因控制的定性性状分离。使用JoinMap 4.0版(van Ooijen等,2006)分析通过使用国际RosBREED SNP协会(Intemational RosBREED SNP Consortium)(IRSC)8K SNP阵列(Chagné等,2012)筛选叶片DNA获得的数据。在位于‘金冠’双单倍体基因组组装体(GDDH13 v1.1)(Daccord等,2017)上32,527,873bp位置(图1A)的单核苷酸多态性(SNP)标志物远侧的连锁群(LG)7的下臂上鉴别了用于控制三叶苷生物合成的单个基因座(Trilobatin)。使用从靠近LG7(LG7的总长度在GDDH13 v1.1中为36,691,129)的基底的34,460,00-34,461,000bp(图1A、图1B)处的两个候选PGT基因产生的高分辨率熔解(HRM)SNP标志物进一步界定基因座。使用连锁和关联分析(Gutierrez等,2018a),在LG7上作图的位置与最近在苹果属中报告的针对二氢查耳酮含量的三个独立分离基因座之一一致。
1.2.2通过活性导向的蛋白质纯化鉴别的候选糖基转移酶
将以下组织用于通过活性导向的蛋白质纯化来鉴别候选4’-oGT:所述组织具有三叶苷产生所需的高4’-oGT活性,但含有用于根皮苷合成的非常低的2’-oGT活性。‘亚当’海棠杂交体的花瓣被鉴别为适合的实验材料,因为它们与叶片相比具有低水平的Rubisco,但与果实相比具有更高的4’-OGT活性。纯化涉及依序色谱步骤(Q-sepharose、phenylsepharose和Superdex 75;图2A-C),之后汇集具有高4’-oGT活性的级分并用于进一步纯化。在最后步骤中,在尺寸排阻色谱之后,通过SDS-PAGE分析具有不同4’-oGT酶活性的四个蛋白质级分。44-66kDa(典型UGT的预期大小)的单条带的丰度以类似于4’-oGT活性的模式(图2C)的模式(图2D)改变。对该条带进行LC-MS/MS分析,并且在栽培苹果ב金冠’苹果v1.0基因组组装体(Velasco等,2010)中鉴别出对应于50种蛋白质的肽。最丰富的5种蛋白质列于表3中。通过NCBI的BLASTn检索获得第2栏中的基因模型说明。IBAQ=所有肽强度的总和除以蛋白质的可观察肽的数目。进行两次分析,并且在第3栏和第4栏中给出在两次分析(R1、R2)中均发现的最丰富蛋白质。以最高丰度(总肽的26%)观察到对应于编码预测性UDP-糖基转移酶88A1样蛋白质的基因模型MDP0000836043/MDP0000318032的肽。
Figure BDA0003864585190000571
表3.通过在从‘亚当’海棠杂交体(含有三叶苷且不含根皮苷)的花进行4’-oGT活性的活性导向纯化后分离的条带的LC-MS/MS分析鉴别的丰富蛋白质。
将显示对于根皮苷生物合成的高2’-oGT活性但不显示4’-oGT活性的西府海棠花瓣用于使用上述方法对候选2’-oGT的活性导向纯化。在尺寸排阻色谱之后,44-66kDa的单条带的丰度以对应于2’-oGT活性的模式改变(图3)。在对该条带进行LC-MS/MS分析之后,以最高丰度(总肽的88%)观察到对应于MDP0000219282/MDP0000052862的肽。MDP0000219282编码MdPGT1(UDP-糖基转移酶88F1)(先前由Jugdé等(2008)描述的根皮素特异性2’-oGT)。
1.2.3通过差异基因表达分析鉴别的候选糖基转移酶
使用如第1.1.5部分中所述的差异基因表达(DGE)分析的第二方法用于鉴别三叶苷高但根皮苷低的组织中的候选4’-oGT。在观赏用‘绚丽’海棠杂交体(含有三叶苷和根皮苷两者)与‘富士’栽培苹果(仅含根皮苷)之间产生杂交。将F1子代分离成两种具有或不具有三叶苷的表型以用于RNA提取和转录组分析。109个基因的表达水平在产生三叶苷的子代中上调至少>4的log2倍数变化。显示最大log-倍数变化的五个基因示于表4中。通过NCBI的BLASTn检索获得第2栏中的基因模型说明。预测性UDP-糖基转移酶88A1样蛋白质MDP0000836043的表达水平展现出最大的差异表达,并且与不具有三叶苷的植物相比,在具有三叶苷的植物中上调超过>7的log2倍数变化。
Figure BDA0003864585190000581
表4.在‘绚丽’海棠杂交体(含有三叶苷和根皮苷两者)和‘富士’栽培苹果(仅含根皮苷)之间的F1群体的汇集叶片样品的转录组分析后鉴别的五种最差异表达的基因。
1.2.4候选基因的遗传作图和表达分析
通过基因模型MDP0000836043(通过活性导向的蛋白质纯化和DEG分析鉴别的候选UDP-糖基转移酶88A1样蛋白)的HRM标志物分析的遗传作图证实其与LG7上针对三叶苷产生鉴别的基因座共定位(图1A)。在‘金冠’v1.0p组装体(Velasco等,2010)中,MDP0000836043位于约24,531,751bp处并且对应于双单倍体组装体GDDH13 v1.1中的基因模型MD07G1281000/1100(位于34,459,260bp处)(图1B)。由MDP0000318032(MD07G1280800)编码的通过活性导向的蛋白质纯化鉴别的第二UDP-糖基转移酶88A1样蛋白质在两种组装体中均位于约10.3kb之外(图1B)。在这两种UDP糖基转移酶基因模型的区域中鉴别的四种SNP变体用于产生用于HRM分析的标志物(表1中的HRM引物序列)。作图结果验证了MDP0000836043和MDP0000318032在LG7上的位置(图1A),并且三种标志物(HRM1-3)显示与分离子代中三叶苷的存在/缺失精确一致。
Figure BDA0003864585190000591
在9份苹果属保藏物的叶片中通过qRT-PCR确定MDP0000836043(下文称为PGT2)和MDP0000318032(下文称为PGT3)的相对表达(图4);3份主要产生三叶苷,3份产生三叶苷和根皮苷两者,并且3份仅产生根皮苷。PGT2在产生三叶苷的所有6份苹果属保藏物中均高度表达,然而在不合成三叶苷的3份保藏物中基本上不存在表达(图4A)。相反,PGTl的表达在6份产生根皮苷的苹果属保藏物中较高(图4B)。PGT3的表达在所有9份保藏物中均观察到,并且与样品中三叶苷或根皮苷的存在/缺失无关(图4C)。
1.3讨论
糖基转移酶由大的基因家族编码,并且很难基于同源性以比活性鉴别酶。已报道能够将根皮素体外4’-O-糖基化的两种酶(Gosch等,2012;Yahyaa等,2016),但这些基因在仅产生根皮苷的组织中表达。在该实施例中,发明人使用了多种方法来证明根皮素糖基转移酶2负责苹果中三叶苷的产生。用于三叶苷产生的遗传基因座与PGT2基因共定位并且针对PGT2产生的HRM标志物与三叶苷产生严格分离。另外,实施例2中所述的分子和生物化学分析证实,PGT2仅在产生三叶苷(或3-羟基根皮苷)的保藏物中表达,并且该酶在体外显示4’-oGT活性。
2.实施例2-PGT2和PGT3在大肠杆菌中的表达和生物化学分析
2.1材料和方法
2.1.1化学品
从‘红丽’海棠中纯化三叶苷(Xiao等,2017)。3-羟基根皮苷、3-OH根皮素和槲皮素糖苷购自PlantMetaChem(www.PlantMetaChem.com)且矢车菊素购自Extrasynthese(www.extrasynthese.com)。从Sigma Aldrich(sigmaaldrich.com)获得所有其它化学品,包括根皮苷和根皮素。
2.1.2克隆
使用表6中的引物扩增PGT1-3的ORF并且使用One Step Cloning Kit(www.vazyme.com)将其连接到pET28a(+)(www.novagen.com)中。
克隆
Figure BDA0003864585190000611
表6.用于克隆的引物序列。用于克隆的限制位点加下划线。
2.1.3大肠杆菌中的蛋白质表达
在16℃在80rpm下利用0.5mM异丙基-1-硫代-β-半乳糖吡喃(IPTG)在大肠杆菌BL21(DE3)细胞中表达重组蛋白质24h。使用Ni-NTA琼脂糖(Millipore)进行重组蛋白质的纯化。将洗脱级分用于确定酶活性且用于SDS-PAGE分析(图5)。使用Vivaspin 2浓缩器(Sartorius,Germany)浓缩活性级分。
2.1.4糖基转移酶活性测定
200μL含有50mM Tris-HCl(pH 9.0)、1mM DTT、0.5mM根皮素、0.5mM UDP-葡萄糖和30-80ng酶的反应物中进行GT活性测定。在40℃将反应混合物培育10min且通过添加40μL1M HCl终止反应。将NaOH(1M)用于将pH调节到中性,用于产物在280nm下的HPLC分析。
使用多种缓冲体系在37℃在pH范围4-12内测试PGT2和PGT1的活性:pH 4.0、5.0、6.0的0.1M柠檬酸钠缓冲液:pH 7.0、8.0、9.0、10.0的0.1M Tris-HCl缓冲液和pH 11.0、12.0的0.1M Na2HPO4-NaOH;pH 8.6、9.0、10.0、10.6的甘氨酸-NaOH缓冲液;以及pH 6.0-11.0的勃-罗二氏缓冲液(Britton-Robinson)。
为了确定PGT2和PGTl的温度最佳值,分别在15-50℃和15-60℃,在0.1M Tris-HCl缓冲液中在pH 9.0下进行反应。为了确定Km值,在40℃,在0.1M Tris-HCl缓冲液中在pH9.0下反应10min。在4-500μM的浓度下,在500μM的固定UDP-葡萄糖浓度下确定根皮素(E)的Km值。在2-500μM的浓度与500μM的固定根皮素浓度下确定UDP-葡萄糖的Km值。在Sigmaplot中通过非线性回归计算Km值。
2.2结果
2.2.1克隆PGT2和PGT3
从6份苹果属保藏物的叶片扩增PGT2的完整开放阅读框(ORF)。来自合成三叶苷的5份保藏物的PGT2 ORF显示与来自可在www.rosaceae.org上获得的‘金冠’栽培苹果v1.0p组装体的MDP0000836043基因模型91-94%氨基酸同一性(图6)。GenBank保藏号:‘富士’栽培苹果-1(MN381003)、变叶海棠-1(MN380999)、变叶海棠-2(MN381000)、三叶海棠-1(MN381001)、‘亚当’海棠杂交体-1(MN381002)、‘Aotea’海棠杂交体-1(MN381006)、三裂叶海棠-1(MN381004)和三裂叶海棠-2(MN381005)。
除‘富士’栽培苹果以外的所有保藏物均产生三叶苷。尽管由于表达水平极低而难以从‘富士’获得PGT2,但从‘富士’栽培苹果的叶片获得的PGT2的完整ORF与从变叶海棠获得的PGT2的完整ORF相同。
2.2.2大肠杆菌中的表达和活性测定
在大肠杆菌中表达来自5份苹果属保藏物的PGT2和PGT3以及来自‘富士’的PGT1,并且通过HPLC确定使用根皮素和UDP-葡糖苷作为底物形成的产物。所有PGT2酶均在7.5分钟处产生单峰,所述单峰以与三叶苷标准品相同的保留时间运行(图4D)。由来自变叶海棠的PGT2产生的产物的代表性HPLC迹线示于图4E中。所有PGT3酶(图4F)和来自‘富士’的PGT1(图4G)均在6.0分钟产生峰,保留时间与根皮苷(图4D)相同,但与三叶苷不同。空载体对照不产生根皮苷或三叶苷(图4H)。
使用UDP-葡糖苷作为糖供体和通常发现于苹果中或与根皮素具有结构同源性的12种底物进一步表征来自变叶海棠的重组PGT2的底物特异性。通过LC-MS/MS确定各反应的产物。根皮素是PGT2的最佳受体,并且基峰图表明在21.5分钟形成与三叶苷标准物共洗脱的单峰(图7A、图7B)。PGT2还催化3-OH根皮素的糖基化以约60%的相对高转化率(表7)产生3-羟基根皮苷(图7C、图7D)。使用槲皮素(图8A-F)以9.1%的较低转化率(表7)检测到槲皮素-3-O-葡糖苷作为反应产物。
Figure BDA0003864585190000631
表7.从变叶海棠克隆的重组PGT2的底物特异性。通过LC-MS/MS确定使用UDP-葡糖苷作为糖供体和显示的12种底物的反应产物。转化%是所形成的产物相对于根皮素向三叶苷的转化(设定为100%)的量。nd=未检测到产物。
这一结果令人惊讶,因为二氢查耳酮的4’位对应于槲皮素的7位,但未观察到槲皮素-7-O-葡糖苷。在与其他底物的反应中未检测到产物。将全扫描和MS/MS质谱数据用于进一步表征PGT2反应产物。根皮素(图7E)被检测为其伪分子离子m/z 273[M-1]-),而三叶苷(图7F)、3-OH根皮素(图7G)和3-羟基根皮苷(图7H)主要被检测为相应的甲酸盐加合物[M+甲酸盐])-1。在甲酸盐加合物上的MS2鉴别出三叶苷和3-羟基根皮苷葡糖苷在m/z 435和451[M-1]-)处的预期伪分子离子。对m/z 435和451[M-1]-)葡糖苷离子的MS3分别鉴别出根皮素和3-OH根皮素糖苷配基的m/z 273和m/z 289[M-1]-)离子。
如下在4-12的pH范围内与15-60℃的温度下比较PGT2和PGT1的酶活性:
使用三种缓冲体系在37℃在pH范围4-12内测试PGT2(A)和PGT1(B)的活性:黑色线=pH 4.0、5.0、6.0的0.1M柠檬酸钠缓冲液;pH 7.0、8.0、9.0、10.0的0.1M Tris-HCl缓冲液和pH 11.0、12.0的0.1M Na2HPO4-NaOH。红色线=pH 8.6、9.0、10.0、10.6的甘氨酸-NaOH缓冲液。绿色线=pH 6.0-11.0的勃-罗二氏缓冲液。两种酶的pH最佳值为pH 8.0-9.0(图9A、图9B)。
PGT2和PGT1的温度依赖性活性分别示于(C)和(D)中。在4-500μM的浓度下,在500μM的固定UDP-葡萄糖浓度下确定根皮素(E)的Km值。最佳温度为约40℃(图9C、图9D)。
在2-500μM的浓度与500μM的固定根皮素浓度下确定UDP-葡萄糖(F)的Km值。PGT2对于根皮素的Km值为18.0±6.7μM(Vmax=1.85±0.17nmol·min-1),且对于UDP-葡萄糖的Km值为103.6±23.0μM:(Vmax=2.07±0.17·nmol-1)(图9E、图9F)。这些Km值与在相同纯化条件下针对PGT1对于根皮素获得的Km值(4.1±1.2μM)(Vmax=1.54±0.08nmol·min-1)以及对于UDP-葡萄糖获得的Km值(491±41μM)(Vmax=8.84±0.35nmol·min-1)相当(图9E、图9F)。
2.3讨论
在该实施例中,发明人进一步证明PGT2负责三叶苷生物合成。他们还证明PGT2可在大肠杆菌中表达并产生具有4-O-糖基转移酶活性的酶,并且该酶在与根皮素和UDP-葡萄糖接触时可产生三叶苷。
3.实施例3-结构分析
3.1材料和方法
将PGT1-3的序列独立地提交给iTASSER服务器(Yang和Zhang,2015)。用于结构分析的最佳模型的C评分对于PGT1、PGT2和PGT3分别为-0.38、0.94和1.52。使用PyMOLMolecular Graphics System 2.0版(
Figure BDA0003864585190000653
LLC,2015)进行叠加、结构分析和数据分析(figure)。
3.2结果
为了研究UDP-葡萄糖位置特异性差异的结构基础,使用iTASSER服务器(Yang和Zhang,2015)针对PGT1-3独立地获得结构同源性模型。将模型叠加,并和与UDP-葡萄糖(供体)和2,4,5-三氯苯酚(TCP,受体;Brazier-Hicks等,2007;PDB条目2VCE)结合的UGT72B1的晶体结构进行比较。总之,所有结构均非常相似,彼此之间的RMSD为约
Figure BDA0003864585190000651
PGT2/PGT1、PGT2/PGT3和PGT1/PGT3之间的序列同一性分别为48%、86%和47%。然而,在预测的UDP结合位点周围,三种酶之间的氨基酸保守性高得多(>95%同一性)(表8),与这些酶结合相同供体分子的能力一致。此外,模型中的催化二分体(dyad)残基(PGT2和PGT3中的His16/Asp118、PGT1中的His15/Asp118)的位置与UGT72B1的晶体结构极为一致。相比之下,在形成受体结合袋的13个氨基酸中,PGT2与PGT1之间的氨基酸保守性显著较低(23%同一性:3个残基)。类似地,虽然不太明显,但受体结合袋周围的PGT2与PGT3之间的氨基酸保守性下降到69%(9个残基)。
Figure BDA0003864585190000652
Figure BDA0003864585190000661
表8.从各自的3D模型鉴别的PGT1-PGT3中的供体和受体结合位点周围的氨基酸。当与PGT2相比时,PGT1和PGT3中以粗体突出显示的残基不同。
3.3讨论
相同受体(根皮素)酶促转化为两种不同的异构体(根皮苷对三叶苷)是由于酶能够以特定构象在活性位点内部结合受体,将待糖基化受体的羟基(分别在根皮素的2′和4′位置)定位在催化组氨酸和供体糖基附近。PGT2和PGT1的建模结果,突出了其各自受体结合袋的氨基酸组成的巨大变化,与这两种酶具有不同活性和生成不同产物的能力一致。然而,由于单个侧链在3D模型中的位置的固有不确定性,因此不能进行受体结合袋内的根皮素构象的进一步建模。在PGT3的情况下,3D模型分析表明低酶活性可归因于受体结合袋中四个与PGT2不同的氨基酸中的一个(或组合)。其中,PGT2中的Asn在145位处取代为PGT3中体积较大的Phe可限制袋的大小并损害受体的结合。然而,需要结晶学研究来确认这一假设并与PGT2的4’-oGT活性相比,进一步理解PGT3的2’-oGT活性。
4.实施例4-烟草中的三叶苷产生的代谢工程
4.1材料和方法
使用以下引物从三裂叶海棠扩增PGT2,从‘皇家嘎啦’扩增pHEX2-MdCHS和MdDBR:
克隆
Figure BDA0003864585190000671
Figure BDA0003864585190000681
将基因克隆到pHEX2中以分别生成二元载体pHEX2-PGT2、pHEX2-CHS和pHEX2-DBR。先前已报道pHEX2-Myb10、pBIN61-p19(含有基因沉默抑制剂p19)和对照构建体pHEX2-GUS的构建(Voinnet等,2003;Espley等,2007;Nieuwenhuizen等,2013)。将所有构建体在根癌土壤杆菌菌株GV3101中电穿孔。如Hellens等(2005)中所述,将新鲜生长的培养物以相等的比率混合并浸润到本氏烟草叶片中。在7d后,收获叶并提取酚类化合物用于Dionex-HPLC分析。
4.2结果
为了在本氏烟草中重建用于三叶苷和根皮苷产生的完整苹果途径,将MdMyb10以及两个生物合成基因(MdDBR和MdCHS)一起瞬时表达以催化合成用于糖基化的根皮素底物。需要MdMyb10转录因子来增加穿过苯丙素途径的底物通量。通过Dionex-HPLC分析用MdMyb10、MdDBR、MdCHS和PGT2浸润的叶片并且展现出在32分钟处对应于三叶苷标准品的峰(图10A、图10B),而用PGT1浸润的那些叶片展现出在27.2分钟处对应于根皮苷的峰(图10C、图10D)。在接种GUS对照载体的叶片中未检测到根皮苷和三叶苷(图10E)。这些结果表明,三个生物合成基因和一个转录因子足以重建用于生物技术应用的烟草(以及可能任何其他植物)中的三叶苷和根皮苷产生途径。
4.3讨论
在该实施例中,发明人证明植物的4’-oGT活性和三叶苷含量可通过PGT2的表达来增加。
鉴别用于三叶苷产生的4’-oGT和在烟草中重建三叶苷和根皮苷产生的苹果途径可允许通过生物技术手段(诸如通过酵母中的生物制药和代谢工程)产生高水平的三叶苷。这种方法的效用已在酵母中对PGT1进行了证实(Eichenberger等,2017),但在植物中没有。产生大量三叶苷的能力将允许将其在食品和饮料工业中作为天然甜味剂进行测试,而且还对其潜在的健康益处进行测试(Fan等,2015;Xiao等,2017)。
5.实施例5-PGT2在栽培苹果中的过表达和感官评价
5.1材料和方法
5.1.1转基因苹果植物的生成
使用以下引物从变叶海棠扩增PGT2的编码区并且使用One Step Cloning Kit(www.vazyme.com)将其克隆到pCAMBIA2300中:
克隆
Figure BDA0003864585190000691
然后将PGT2:pCAMBIA质粒转化到为根癌土壤杆菌(菌株GV3101)细胞中。根据Dai等(2013)和Sun等(2018),通过土壤杆菌属介导的转化生成转基因‘GL3’苹果植物。用pHEX2-PGT2转化转基因‘皇家嘎啦’植物并如Yao等(1995,2013)所述使植物再生。
使用qRT-PCR和HPLC确定转基因‘GL3’苹果品系中的PGT2表达水平和二氢查耳酮含量。使用从幼叶提取的RNA通过qRT-PCR确定14个转基因‘GL3’品系(编号)中PGT2的相对表达。针对Mdactin校正表达并且相对于野生型(WT)‘GL3’对照(值设定为1)给出。引物和产物大小在表2中给出。将酚类化合物从幼叶中提取到含有50%甲醇和2%甲酸的溶液中并且通过HPLC确定单个DHC含量。
5.1.2感官小组(panel)分析
将来自野生型和两个PGT2转基因‘GL3’品系的苹果叶用水洗涤并在室温下干燥。将叶片在200℃下保持1分钟以使酶失活,然后在烘箱中在80℃干燥60分钟。使用5g干叶制备苹果叶茶,叶片:水的比率为1∶100(g∶ml)。将约80℃的水添加到叶片中持续15分钟,然后去除所有叶片以停止进一步提取。然后将茶保持在50℃的水浴中用于感官分析。感官小组由23人组成且包括14名女性和9名男性(年龄均为20-30岁)。参与是自愿的,且所有参与者均在参与研究之前提供了书面同意书。对于三角测试(triangle test),向参与者提供三个托盘,每个托盘具有三个杯子(每个杯子中有2ml茶),其中转基因叶茶和野生型叶茶处于随机设计中,即两个转基因和一个野生型,或者两个野生型和一个转基因。要求参与者依序品尝每个托盘上的三个样品并选择那个不同的样品。为了评估野生型苹果叶茶相对于转基因苹果叶茶的相对甜度,呈现两个样品(一个转基因和一个野生型),并且要求23名小组成员以1-10的未锚定标度的甜度量表(unanchored scale sweetness scale)对这两个样品进行评分。对于所有的品尝测试,参与者均将样品在其口腔中保持1-2秒,然后将其吐到废物容器中。参与者在样品之间用水冲洗其口腔,并在每个样品组之间提供干饼干。
选择了5名在三角测试中对三叶苷具有高敏度的参与者来进行三叶苷和蔗糖之间的等甜度比较测试。每名参与者均被给予一种三叶苷溶液和八种不同浓度的蔗糖溶液来品尝。如上文针对苹果叶茶所述制备溶液。三叶苷溶液呈现为12.3、18.5、27.8和41.7mg/100ml,而蔗糖溶液呈现为296.3、444.4、592.6、666.7、888.9、1000、1333.3和2000mg/100ml。
5.2结果
5.2.1栽培苹果中的过表达
PGT2在两种背景(‘GL3’和‘皇家嘎啦’)的栽培苹果中过表达。获得14个转基因‘GL3’品系并且与野生型相比,PGT2表达在来自8个品系(编号为1、4、5、6、7、9、11、14)的4周龄植物的叶片中显著增加(图11A)。与野生型相比,三叶苷水平在相同的8个品系+编号10品系中显著增加,水平在5.4-11.0mg·g-1FW范围(图11B)。在‘Gl3’转基因品系中未观察到根皮苷、根皮素(图11B)或三叶苷和根皮苷的总含量(图12A)的显著差异。还使11个过表达PGT2的转基因‘皇家嘎啦’品系再生并且显示与野生型相比含有增加的三叶苷水平,其中水平在3-11mg·g-1FW范围(图13A)并且具有三叶苷和根皮苷的类似总含量(图13B)。
还通过qRT-PCR在‘GL3’转基因PGT2过表达品系中分析PGT1、MdCHS和PGT3的相对表达。PGT1(图12B)和MdCHS(图12C)的表达水平在14个转基因苹果品系中没有显著改变。有趣的是,PGT3在所有13/14转基因‘GL3’品系中的相对表达均显著减少(图12d)。在以最低水平表达PGT2和三叶苷的品系中观察到最强的抑制,表明所引入的PGT2转基因对内源性PGT3基因的共抑制。
5.2.2来自PGT2转基因植物的苹果叶茶的感官评价
使用感官分析研究PGT2过表达对苹果叶茶口味的影响。从4月龄野生型‘GL3’植物和两个转基因品系(编号1、9)收获叶片。在干燥后,野生型叶片和转基因叶片中的根皮苷含量相似(约150mg·g-1DW)。转基因品系还含有三叶苷(约100mg·g-1DW),而野生型不含三叶苷(图14A)。在浸渍后,将约27%的根皮苷和16%的三叶苷提取到茶中(图14A)。
在三角测试中,小组成员能够清楚地区分与由野生型产生的茶相比,由转基因PGT2叶片产生的茶的味道(p<0.01,n=70个观察值)。为了确定这种区别的基础,然后要求小组成员以非锚定甜度量表(1-10)评定每个样品的甜度。与野生型被评定为3.2的平均甜度相比,两个转基因品系的平均甜度被评定为显著(p<0.05,n=23)更高,分别为4.8和4.6。
从‘亚当’海棠杂交体的叶片纯化的三叶苷与蔗糖之间的等甜度比较测试表明三叶苷比蔗糖甜约35倍(图14B)。该数字略低于先前报道的数字(Jia等,2008),这可能与所测试的三叶苷的纯度、递送系统或小组成员对蔗糖或三叶苷的敏感性的变化有关。
5.3讨论
对由过表达PGT2的转基因植物制成的苹果叶茶的感官分析证实,可将它们与野生型苹果叶片制成的茶明确区分开。提取到茶中的三叶苷的水平(图14A,约150mg·L-1)高于针对三叶苷所报道的甜度检测阈值(3-200mg·L-1;Jia等,2008)。转基因叶茶中甜度增加的感觉与三叶苷产生的增加一致且与苦味根皮苷水平的降低不一致。
转基因植物叶片中三叶苷和根皮苷两者的产生表明PGT2与PGT1合理地竞争叶片中可获得的根皮素底物库(pool),并且PGT2还应该与PGT1竞争果实中产生的较小根皮素库。预期当转基因‘皇家嘎啦’植物达到成熟时,对来自在果实中具有PGT2过表达的转基因植物的苹果果实的感官分析还应证实所述果实可与来自野生型植物的苹果果实区分开。
已经仅以举例的方式描述了本发明的优选实施方案,并且在不脱离本发明的范围的情况下可对其进行修改。
6.实施例6-在大肠杆菌中产生三叶苷
6.1材料和方法
6.1.1克隆
来自变叶海棠的PGT2-2的编码序列(SEQ ID NO.11;NCBI保藏号MN381000;Wang等,2020)在GeneArt中经密码子优化以用于大肠杆菌并且由TWIST Bioscience USA(https://www.twistbioscience.com/)合成。通过使用EcoRV和KpnI限制位点进行限制/连接克隆,将PGT2-2编码序列克隆到pCDFDuetTM-1(Novagen,USA)中。
使用相同方法将三叶苷生产途径(图15)的其他组分克隆到如表9中所示的共表达质粒中。
Figure BDA0003864585190000731
表9.用于在大肠杆菌中表达的质粒构建体.
通过
Figure BDA0003864585190000732
质粒试剂盒(Macherey-Nagel,Germany)提取质粒DNA并通过Sanger测序进行测序。
6.1.2表达
将BL21(DE3)电感受态大肠杆菌细胞与提供除双键还原酶之外的所有三叶苷代谢途径的质粒1和2和提供双键还原酶的质粒3或4共转化。还获得了对照菌株-缺乏双键还原酶的C-1’;缺乏双键还原酶和PGT2的C-2;和缺乏双键还原酶、PGT2和CHS2的C-3。
使细菌菌株在LB(1%w/v胰蛋白胨,0.5%w/v酵母提取物,1%w/v NaCl)中在37℃、180rpm生长,直到OD600=0.7。然后,添加1mM异丙基-D-硫代吡喃半乳糖苷(IPTG)以诱导基因表达和蛋白质积累,并使培养物在28℃、100rpm生长16h。通过离心收获细胞并且将其再悬浮于相同体积(20mL)的补充有1mM IPTG和250μM L-酪氨酸的极品肉汤(terrificbroth)(1.2%w/v胰蛋白胨、2.4%w/v酵母提取物、0.4%v/v甘油、0.17M KH2PO4、0.72MK2HPO4)中。在28℃、100rpm进行L-酪氨酸进给4h,直到进行代谢物提取。
6.1.3代谢物提取和分析
用等体积的乙酸乙酯(EtOAc),通过混合1min,之后以16,000g离心2min,提取大肠杆菌BL21(DE3)培养物(1mL)。去除EtOAc相,并且如前所述重新提取剩余的下层水相。收集上清液,并通过在Eppendorf Concentrator PlusTM中在30℃负压下培育1h 30min来蒸发乙酸乙酯。将颗粒再悬浮于200μL 80%v/v甲醇中并且储存在4℃。
如先前所报道的(Vrhovsek等,2012),在UHPLC/QqQ-MS/MS系统上进行代谢产物分析。注入2μL,并通过用可靠标准品的校准曲线计算浓度。以一式三份分析样品。
6.2结果
测试了两种不同的双键还原酶(ERED和TSC13)在大肠杆菌中作为三叶苷生产途径的一部分发挥功能的能力。
TAL、4CL、CHS2、ERED和PGT2在大肠杆菌中的共表达导致三叶苷的产生(表10;图16)。使用酿酒酵母TSC13代替ERED作为双键还原酶并未导致任何可检测到的三叶苷产生。
缺乏双键还原酶的对照实验未产生任何可检测到的三叶苷(表10和图16中的C-1’)。缺乏双键还原酶和PGT2的对照、或缺乏双键还原酶、PGT2和CHS2的对照也均未产生任何可检测到的三叶苷(表10和图16中分别为C-2和C-3)。
Figure BDA0003864585190000741
Figure BDA0003864585190000751
*还表达TAL、4CL和CHS2。
表10.大肠杆菌中的代谢物产生
6.3讨论
在该实施例中,本发明人证明,参与三叶苷产生途径的基因可在大肠杆菌中表达,并且三叶苷可由在培养物中生长的大肠杆菌产生。
7.实施例7-在酿酒酵母中产生三叶苷
7.1材料和方法
7.1.1克隆
来自变叶海棠的PGT2-2的编码序列(SEQ ID NO.11;NCBI保藏号MN381000;Wang等,2020)在GeneArt中经密码子优化以用于酿酒酵母并且由TWIST Bioscience USA(https://www.twistbioscience.com/)合成。通过使用SalI和NotI限制位点进行限制/连接克隆,将PGT2-2编码序列克隆到pAT425中(Ishii等,2014)。
将连接的质粒转化到大肠杆菌TOP10细胞中,并如实施例6的第6.1.1节中所述进行测序。
7.1.2表达
将产生根皮素的酿酒酵母的尿嘧啶营养缺陷型菌株(含有HaCHS(金丝桃(Hypericum androsaemum);UniProt:Q9FUB7.1)、ScTSC13(酿酒酵母;GenBank:NM_001180074.1),At4CL2(拟南芥(Arabidopsis thaliana);GenBank:NP_188761.1)、AtPAL2(拟南芥;GenBank:NP_190894)、AmC4H(白芷(Ammimajus);GenBank:AA062904.1)和ScCPR1(酿酒酵母;GenBank:NP_011908))根据Gietz和Schiestl(2007),用含PGT2-2载体或空载体转化,平铺于不含尿嘧啶和亮氨酸的合成营养缺陷(drop-out)(SD)培养基(Sigma-Aldrich,Germany)(SD-U-L)中并且在30℃培育3天。然后,将单个转化体菌落在5mL SD-U-L中在30℃、200rpm生长过夜,并用于接种50mL SD-U-L。使酵母培养物在30℃、200rpm生长48h和72h。
7.1.3代谢物分析
如实施例6的第6.1.3节中所述进行代谢物分析。
7.2结果
在48小时和72小时确定酿酒酵母对三叶苷的产生。在PGT2-2表达菌株在两个时间点均可检测到三叶苷产生,而根皮素菌株对照未检测到产生(表11和图17)。
Figure BDA0003864585190000761
nd=未检测到。Pt=根皮素菌株对照。
表11.酿酒酵母中的代谢物产生
7.3讨论
在该实施例中,本发明人证明,参与三叶苷产生途径的基因可在酿酒酵母中表达,并且三叶苷可由在培养物中生长的酿酒酵母产生。
序列汇总
Figure BDA0003864585190000762
Figure BDA0003864585190000771
表12:PGT2序列。
序列表:
>SEQ1[生物体=变叶海棠]根皮素4’-O-糖基转移酶(MtgPGT2-1),多肽
Figure BDA0003864585190000772
Figure BDA0003864585190000781
>SEQ2[生物体=变叶海棠]根皮素4’-O-糖基转移酶(MtgPGT2-2),多肽
Figure BDA0003864585190000782
>SEQ3[生物体=三叶海棠]根皮素4’-O-糖基转移酶(MsPGT2-1),多肽
Figure BDA0003864585190000783
>SEQ4[生物体=苹果属]根皮素4’-O-糖基转移酶(亚当PGT2-1),多肽
Figure BDA0003864585190000784
>SEQ5[生物体=栽培苹果]根皮素4’-O-糖基转移酶(MdPGT2-1),多肽
Figure BDA0003864585190000785
Figure BDA0003864585190000791
>SEQ6[生物体=三裂叶海棠]根皮素4’-O-糖基转移酶(MtbPGT2-1),多肽
Figure BDA0003864585190000792
>SEQ7[生物体=三裂叶海棠]根皮素4’-O-糖基转移酶(MtbPGT2-2),多肽
Figure BDA0003864585190000793
>SEQ8[生物体=苹果属]根皮素4’-O-糖基转移酶(AoteaPGT2-1),多肽
Figure BDA0003864585190000794
>SEQ9[生物体=栽培苹果]Cazyme ID:MDP0000836043.UDP-葡糖基转移酶88A1,多肽
Figure BDA0003864585190000795
Figure BDA0003864585190000801
>Seq10[生物体=变叶海棠]根皮素4’-O-糖基转移酶(MtgPGT2-1),完整编码序列
Figure BDA0003864585190000802
>Seq11[生物体=变叶海棠]根皮素4’-O-糖基转移酶(MtgPGT2-2),完整编码序列
Figure BDA0003864585190000803
Figure BDA0003864585190000811
>Seq12[生物体=三叶海棠]根皮素4’-O-糖基转移酶(MsPGT2-1),完整编码序列
Figure BDA0003864585190000812
>Seq13[生物体=苹果属]根皮素4’-O-糖基转移酶(亚当PGT2-1),完整编码序列
Figure BDA0003864585190000813
Figure BDA0003864585190000821
>Seq14[生物体=栽培苹果]根皮素4’-O-糖基转移酶(MdPGT2-1),完整编码序列
Figure BDA0003864585190000822
>Seq15[生物体=三裂叶海棠]根皮素4’-O-糖基转移酶(MtbPGT2-1),完整编码序列
Figure BDA0003864585190000831
>Seq16[生物体=三裂叶海棠]根皮素4’-O-糖基转移酶(MtbPGT2-2),完整编码序列
Figure BDA0003864585190000832
Figure BDA0003864585190000841
>Seq17[生物体=苹果属]根皮素4’-O-糖基转移酶(AoteaPGT2-1),完整编码序列
Figure BDA0003864585190000842
>Seq18[生物体=栽培苹果]Cazyme ID:MDP0000836043.UDP-葡糖基转移酶88A1,完整编码序列
Figure BDA0003864585190000843
Figure BDA0003864585190000851
参考文献
Andre,C.M.,Greenwood,J.M.,Walker,E.G.,Rassam,M.,Sullivan,M.,Evers,D.,Perry,N.B.,Laing,W.A.,2012.109个苹果品种中的抗炎原花青素和三萜(Anti-inflammatort procyanidins and triterpenes in 109 apple varieties).J.Agric.Food Chem.60,10546-10554.https://doi.org/10.1021/jf302809k
Brazier-Hicks,M.,Offen,W.A.,Gershater,M.C.,Revett,T.J.,Lim,E.-K.,Bowles,D.J.,Davies,G.J.,Edwards,R.,2007.参与植物中的异生物代谢的双官能N-和O-葡糖基转移酶的表征和工程化(Characterization and engineering of thebifunctional N-and O-glucosyltransferase involved in xenobiotic metabolism inplants.).Proc.Natl.Acad.Sci.U.S.A.104,20238-20243.https://doi.org/10.1073/pnas.0706421104
Caputi,L.,Malnoy,M.,Goremykin,V.,Nikiforova,S.,Martens,S.,2012.家族1UDP-糖基转移酶的全基因组系统发生重建揭示了在植物适应陆地生活期间家族的扩大(Agenome-wide phylogenetic reconstruction of family 1 UDP-glycosyltransferasesrevealed the expansion of the family during the adaptation of plants to lifeon land).Plant J.Cell Mol.Biol.69,1030-1042.https://doi.org/10.1111/j.1365-313X.2011.04853.x
Chagné,D.,Crowhurst,R.N.,Troggio,M.,Davey,M.W.,Gilmore,B.,Lawley,C.,Vanderzande,S.,Hellens,R.P.,Kumar,S.,Cestaro,A.,Velasco,R.,Main,D.,Rees,J.D.,Iezzoni,A.,Mockler,T.,Wilhelm,L.,Van de Weg,E.,Gardincr,S.E.,Bassil,N.,Pcace,C.,2012.用于苹果的8K SNP阵列的全基因组SNP检测、验证和开发(Genome-wide SNPdetection,validation,and development of an 8K SNP array for apple).PloS One7,e31745.https://doi.org/10.1371/journal.pone.0031745
Daccord,N.,Celton,J.-M.,Linsmith,G.,Becker,C.,Choisne,N.,Schijlen,E.,van de Geest,H.,Bianco,L.,Micheletti,D.,Velasco,R.,Di Pierro,E.A.,Gouzy,J.,Rees,D.J.G.,Guérif,P.,Muranty,H.,Durel,C.-E.,Laurens,F.,Lespinasse,Y.,Gaillard,S.,Aubourg,S.,Quesneville,H.,Weigel,D.,van de Weg,E.,Troggio,M.,Bucher,E.,2017.苹果基因组的高质量从头组装和早期果实发育的甲基化组动力学(High-quality de novo assembly of the apple genome and methylome dynamics of earlyfruit development).Nat.Genet.49,1099-1106.https://doi.org/10.1038/ng.3886
Dai,H.,Li,W.,Han,G.,Yang,Y.,Ma,Y.,Li,H.,Zhang,Z.,2013.在苹果中开发具有高再生能力和对土壤杆菌属具易感性的幼苗克隆(Development of a seedling clonewith high regeneration capacity and susceptibility to Agrobacterium inapple).Sci.Hortic.164,202-208.https://doi.org/10.1016/j.scienta.2013.09.033
Dare,A.P.,Tomes,S.,Jones,M.,McGhie,T.K.,Stevenson,D.E.,Johnson,R.A.,Greenwood,D.R.,Hellens,R.P.,2013.苹果中与查耳酮合酶的RNA干扰沉默相关的表型变化(Phenotypic changes associated with RNA interference silencing of chalconesynthase in apple(Malus×domestica)).Plant J.Cell Mol.Biol.74,398-410.https://doi.org/10.1111/tpj.12140
Dare,A.P.,Yauk,Y.-K.,Tomes,S.,McGhie,T.K.,Rebstock,R.S.,Cooney,J.M.,Atkinson,R.G.,2017.使根皮素特异性糖基转移酶沉默扰乱一般苯丙素生物合成和植物发育(Silencing a phloretin-specific glycosyltransferase perturbs both generalphenylpropanoid biosynthesis and plant development).Plant J.Cell Mol.Biol.91,237-250.https://doi.org/10.1111/tpj.13559
Eichenberger,M.,Lehka,B.J.,Folly,C.,Fischer,D.,Martens,S.,Simón,E.,Naesby,M.,2017.酿酒酵母用于从头产生具有已知抗氧化、抗糖尿病和甜味性质的二氢查耳酮的代谢工程(Metabolic engineering of Saceharomyces cerevisiae for de novoproduction of dihydrochalcones with known antioxidant,antidiabetic,and sweettasting properties).Metab.Eng.39,80-89.https://doi.org/10.1016/j.ymben.2016.10.019
Elejalde-Palmett,C.,Billet,K.,Lanoue,A.,De Craene,J.-O.,Glévarec,G.,Pichon,O.,Clastre,M.,Courdavault,V.,St-PierTe,B.,Giglioli-Guivarc’h,N.,DugédeBernonville,T.,Besseau,S.,2019.苹果中UGT88F亚家族的全基因组鉴别和生物化学表征(Genome-wide identification and biochemical characterization of the UGT88Fsubfamily in Malus x domestica Borkh).Phytochemistry 157,135-144.https://doi.org/10.1016/j.phytochem.2018.10.019
Espley,R.V.,Hellens,R.P.,Putterill,J.,Stevenson,D.E.,Kutty-Amma,S.,Allan,A.C.,2007.苹果果实中的红色着色归因于MYB转录因子MdMYB10的活性(Redcolouration in apple fruit is due to the activity of the MYB transcriptionfactor,MdMYB10).Plant J.49,414-427.https://doi.org/10.1111/j.1365-313X.2006.02964.x
Fan,X.,Zhang,Y.,Dong,H.,Wang,B.,Ji,H.,Liu,X.,2015.三叶苷通过抑制NF-κB信号传导途径来减弱LPS-介导的炎症反应(Trilobatin attenuates the LPS-mediatedinnammatory response by suppressing the NF-κB signaling pathway).FoodChem.166,609-615.https://doi.org/10.1016/j.foodchem.2014.06.022
Fukuchi-Mizutani,M.,Okuhara,H.,Fukui,Y.,Nakao,M.,Katsumoto,Y.,Yonekura-Sakakibara,K.,Kusumi,T.,Hase,T.,Tanaka,Y.,2003.从龙胆属进行新颖UDP-葡萄糖:花青苷3’-O-葡糖基转移酶(用于蓝色花青苷生物合成的关键酶)的生物化学和分子表征(Biochemical and molecular characterization of a novel UDP-glucose:anthocyanin 3’-O-glucosyltransferase,a key enzymefor blue anthocyaninbiosynthesis,from gentian).Plant Physiol.132,1652-1663.https://doi.org/10.1104/pp.102.018242
Gao,L.,Li,Z.,Xia,C.,Qu,Y.,Liu,M.,Yang,P.,Yu,L.,Song,X.,2017.组合转录因子的操纵和靶基因的过表达以增强草酸青霉中的木质纤维素分解酶的产生(Combiningmanipulation of transcription factors and overexpression of the target genesto enhance lignocellulolttic enzyme production in Penicillium oxalicum).Biotechnol.Biofuels 10,100.https://doi.org/10.1186/s13068-017-0783-3
Gietz,R.D.和Schiestl,R.H.(2007)使用LiAc/SS载体DNA/PEG方法进行快速简便的酵母转化(Quick and easy yeast transformation using the LiAc/SS carrier DNA/PEG method).Nat.Protoc.,2,35-37.
Gosch,C.,Flachowsky,H.,Halbwirth,H.,Thill,J.,Mjka-Wittmann,R.,Treutter,D.,Richter,K.,Hanke,M.-V.,Stich,K.,2012.糖基转移酶UGT71A15的底物特异性和对根皮苷生物合成的作用(Substrate specificity and contribution of theglyCosyltransferase UGT71A15 to phloridzin biosynthesis).Trees 26,259-271.https://doi.org/10.1007/s00468-011-0669-0
Gosch,C.,Halbwirth,H.,Kuhn,J.,Miosic,S.,Stich,K.,2009.苹果中根皮苷的生物合成(Biosynthesis of phloridzin in apple(Malus domestica Borkh.)).PlantSci.176,223-231.https://doi.org/10.1016/j.plantsci.2008.10.011
Gosch,C.,Halbwirth,H.,Schneider,B.,
Figure BDA0003864585190000871
D.,Stich,K.,2010.从栽培苹果和西洋梨克隆和异源表达将根皮素转化为根皮素2′-O-葡糖苷(根皮苷)的糖基转移酶(Cloning and heterologous expression of glycosyltransferases from Malus xdomestica and Pyrus communis,which convert phloretin to phloretin 2′-O-glucoside(phloridzin)).Plant Sci.178,299-306.https://doi.org/10.1016/j.plantsci.2009.12.009
Gutierrez,B.L.,Arro,J.,Zhong,G.-Y.,Brown,S.K.,2018a.苹果属中的二氢查耳酮(根皮苷、3-羟基根皮苷和三叶苷)的连锁和相关性分析(Linkage and associationanalysis of dihydrochalcones phloridzin,sieboldin,and trilobatin in Malus).Tree Genet.Genomes 14,91.https://doi.org/10.1007/s11295-018-1304-7
Gutierrez,B.L.,Zhong,G.-Y.,Brown,S.K.,2018b.苹果属种质中二氢查耳酮含量的遗传多样性(Genetic diversity of dihydrochalcone content in Malusgermplasm).Genet.Resour.Crop Evol.65,1485-1502.https://doi.org/10.1007/s10722-018-0632-7
Hellens,R.P.,Allan,A.C.,Friel,E.N.,Bolitho,K.,Grafton,K.,Templeton,M.D.,Karunairetnam,S.,Gleave,A.P.,Laing,W.A.,2005.用于植物中的功能基因组学、启动子活性的定量和RNA沉默的瞬时表达载体(Transient expression vectors forfunctional genomics,quantification of promoter activity and RNA silencing inplants).Plant Methods 1,13.https://doi.org/10.1186/1746-4811-1-13
Hsu,Y.-H.,Tagami,T.,Matsunaga,K.,Okuyama,M.,Suzuki,T.,Noda,N.,Suzuki,M.,Shimura,H.,2017.参与花青苷修饰的UDP-鼠李糖依赖性鼠李糖基转移酶(确定六倍利中的蓝色着色的关键酶)的功能表征(Functional characterization of UDP-rhamnose-dependent rhamnosyltransferase involved in anthocyanin modification,a keyenzyme determining blue coloration in Lobelia erinus).Plant J.CellMol.Biol.89,325-337.https://doi.org/10.1111/tpj.13387
Ibdah,M.,Berim,A.,Martens,S.,Valderrama,A.L.H.,Palmieri,L.,Lewinsohn,E.,Gang,D.R.,2014.栽培苹果中参与二氢查耳酮形成的NADPH依赖性羟基肉桂酰基-CoA双键还原酶的鉴别和克隆(Identification and cloning of an NADPH-dependenthydroxycinnamoyl-CoA double bond reductase involved in dihydrochalconeformation in Malus×domestica Borkh).Phytochemistry 107,24-31.https://doi.org/10.1016/j.phytochem.2014.07.027
Ishii,J.,Kondo,T.,Makino,H.,Ogura,A.,Matsuda,F.和Kondo,A.(2014)用于在酿酒酵母中同时表达多个基因的三个基因表达载体组(Three gene expression vectorsets for concurrently expressing multiple genes in Saccharomyces cerevisiae).FEMS Yeast Res.,14,399-411.
Jia,Z.,Yang,X.,Hansen,C.A.,Naman,C.B.,Simons,C.T.,Slack,J.P.,Gray,K.,2008.消耗品(Consumables).WO2008148239A1.
Jugdé,H.,Nguy,D.,Moller,I.,Cooney,J.M.,Atkinson,R.G.,2008.在苹果中分离和表征将根皮素转化为根皮苷(有效抗氧化剂)的新颖糖基转移酶(Isolation andcharacterization of a novel glycosyltransferase that converts phloretin tophlorizin,a potent antioxidant in apple).FEBS J.275,3804-3814.https://doi.org/10.1111/j.1742-4658.2008.06526.x
Lei,L.,Huang,B.,Liu,A.,Lu,Y.-J.,Zhou,J.-L.,Zhang,J.,Wong,W.-L.,2018.使用固定的α-1-鼠李糖苷酶作为催化剂从柑橘黄烷酮柚皮苷酶促产生天然甜味剂三叶苷(Enzymatic production of natural sweetener trilobatin from citrus flavanonenaringin using immobilised α-l-rhamnosidase as the catalyst).Int.J.FoodSci.Technol.53,2097-2103.https://doi.org/10.1111/ijfs.13796
Li,Y.,Baldauf,S.,Lim,E.K.,Bowles,D.J.,2001.拟南芥UDP-糖基转移酶多基因家族的系统发生分析(Phylogenetic analysis ofthe UDP-glycosyltransferasemultigene family of Arabidopsis thaliana).J.Biol.Chem.276,4338-4343.https://doi.org/10.1074/jbc.M007447200
Livak,K.J.,Schmittgen,T.D.,2001.使用实时定量PCR和2(-ΔΔC(T))方法对相对基因表达数据的分析(Analtsis of relative gene expression data using real-time quantitative PCR and the 2(-Delta Delta C(T))Method).Methods San DiegoCalif 25,402-408.https://doi.org/10.1006/meth.2001.1262
Malnoy,M.,Retnoird,J.P.,Mourgues,F.,Chevreau,E.,Simoneau,P.,2001.用于从梨叶中分离总RNA的方法(A method for isolating total RNA from pear leaves).Plant Mol.Biol.Report.19,69-69.https://doi.org/10.1007/BF02824081
Nieuwenhuizen,N.J.,Green,S.A.,Chen,X.,Bailleul,E.J.D.,Matich,A.J.,Wang,M.Y.,Atkinson,R.G.,2013.功能基因组学揭示紧凑型萜合酶基因家族可促成苹果中的萜挥发物产生(Functional genomics reveals that a compact terpene synthasegene family can account for terpene volatile production in apple).PlantPhysiol.161,787-804.https://doi.org/10.1104/pp.112.208249
Ross,J.,Li,Y.,Lim,E.,Bowles,D.J.,2001.更高的植物糖基转移酶(Higherplant glycosyltransferases).Genome Biol.2,REVIEWS3004.https://doi.org/10.1186/gb-2001-2-2-reviews3004
Figure BDA0003864585190000881
LLC,2015.The PyMOL Molecular Graphics System,2.0版.
Sun,X.,Wang,P.,Jia,X.,Huo,L.,Che,R.,Ma,F.,2018.在转基因苹果中通过改良的抗氧化系统和活化的自噬介导通过过表达MdATG18a对耐旱性的改善(Improvement ofdrought tolerance by overexpressing MdATG18a is mediated by modifiedantioxidant system and activated autophagy in transgenic apple).PlantBiotechnol.J.16,545-557.https://doi.org/10.1111/pbi.12794
Sun,Y.,Li,W.,Liu,Z.,2015.从甜茶(多穗石栎)中进行二氢查耳酮的制备分离、定量和抗氧化活性确定(Preparative isolation,quantification and antioxidantactivity of dihydrochalcones from Sweet Tea(Lithocarpus polystachyus Rehd.)).J.Chromatogr.B Analyt.Technol.Biomed.Life.Sci.1002,372-378.https://doi.org/10.1016/j.jchromb.2015.08.045
Sun,Y.-S.,Zhang,Y.,2017.用于甜化天然批量分离三叶苷的方法(A method ofsweetening natural bulk separation trilobatin).CN104974201B.
Tanaka,T.,Tanaka,O.,Kohda,H.(Hiroshima U.(Japan)F.of M.,Chou,W.H.,Chen,F.H.,1983.从变叶葡萄和糖葡萄的叶片中分离三叶苷(甜型二氢查耳酮-葡糖苷)(Isolation of trilobatin,a sweet dihydrochalcone-glucoside from leaves ofVitis piasezkii Maxim.and V.saccharifera Makino).Agric.Biol.Chem.Jpn.
van Ooijen,J.W.,Van Ooijen,J.W.,van Ooijen,J.W.,Van Ooijen,J.W.,VanOoijen,J.,van’t Verlaat,J.W.,Ooijen,J.W.,van Tol,J.,Dalen,J.,Ooijen,J.W.van,Buren,J.,van der Meer,J.,Van Krieken,J.H.,Ooijen,J.W.V.,van Kessel,J.,Van,O.,Voorrips,R.,van den Heuvel,L.P.W.J.,2006.
Figure BDA0003864585190000891
4.用于计算实验群体中的遗传连锁图的软件(Software for the calculation of genetic linkage maps inexperimental populations).
Velasco,R.,Zharkikh,A.,Affourtit,J.,Dhingra,A.,Cestaro,A.,Kalyanaraman,A.,Fontana,P.,Bhatnagar,S.K.,Troggio,M.,Pruss,D.,Salvi,S.,Pindo,M.,Baldi,P.,Castelletti,S.,Cavaiuolo,M.,Coppola,G.,Costa,F.,Cova,V.,Dal Ri,A.,Goremykin,V.,Komjanc,M.,Longhi,S.,Magnago,P.,Malacarne,G.,Malnoy,M.,Micheletti,D.,Moretto,M.,Perazzolli,M.,Si-Ammour,A.,Vezzulli,S.,Zini,E.,Eldredge,G.,Fitzgerald,L.M.,Gutin,N.,Lanchbury,J.,Macalma,T.,Mitchell,J.T.,Reid,J.,Wardell,B.,Kodira,C.,Chen,Z.,Desany,B.,Niazi,F.,Palmer,M.,Koepke,T.,Jiwan,D.,Schaeffer,S.,Krishnan,V.,Wu,C.,Chu,V.T.,King,S.T.,Vick,J.,Tao,Q.,Mraz,A.,Stormo,A.,Stormo,K.,Bogden,R.,Ederle,D.,Stella,A.,Vecchietti,A.,Kater,M.M.,Masiero,S.,Lasserre,P.,Lespinasse,Y.,Allan,A.C.,Bus,V.,Chagné,D.,Crowhurst,R.N.,Gleave,A.P.,Lavezzo,E.,Fawcett,J.A.,Proost,S.,Rouzé,P.,Sterck,L.,Toppo,S.,Lazzari,B.,Hellens,R.P.,Durel,C.-E.,Gutin,A.,Bumgarner,R.E.,Gardiner,S.E.,Skolnick,M.,Egholm,M.,Van de Peer,Y.,Salamini,F.,Viola,R.,2010.栽培苹果的基因组(The genome of the domesticated apple(Malus×domesticaBorkh.)).Nat.Genet.42,833-839.https://doi.org/10.1038/ng.654
Voinnet,O.,Rivas,S.,Mestre,P.,Baulcombe,D.,2003.植物中基于番茄丛矮病毒p19蛋白质抑制基因沉默的增强的瞬时表达系统(An enhanced transient expressionsystem in plants based on suppression of gene silencing by the p19 protein oftomato bushy stunt virus).Plant J.Cell Mol.Biol.33,949-956.
Vrhovsek,U.,Masuero,D.,Gasperotti,M.,Franceschi,P.,Caputi,L.,Viola,R.和Mattivi,F.(2012)一种用于快速定量水果和饮料中多种酚类物质的通用靶向代谢组学方法(A versatile targeted metabolomics method for the rapid quantification ofmultiple classes of phenolics in fruits and beverages).J.Agric.Food Chgm.,60,8831-8840.
WALTON,S.K.,DENARDO,T.N.M.I.,ZANNO,P.R.,TOPALOVIC,M.N.M.I.,2013.味觉改良剂(Taste modifiers).WO2013074811A1.
Wang,Y.,Yauk,Y.-K.,Zhao,Q.等(2020)二氢查耳酮甜味剂三叶苷的生物合成需要根皮素糖基转移酶2(Biosynthesis of the dihydrochalcone sweetener trilobatinrequires Phloretin Glycosyltransferase 2).Plant Physiol.,184,738-752.
Williams,A.H.,1982.来自与苹果属种分类相关的类黄酮的化学证据(Chemicalevidence from the flavonoids relevant to the classification of Malusspecies).Bot.J.Linn.Soc.84,31-39.https://doi.org/10.1111/j.1095-8339.1982.tb00358.x
Xiao,Z.,Zhang,Y.,Chen,X.,Wang,Y.,Chen,W.,Xu,Q.,Li,P.,Ma,F.,2017.从“红丽”海棠果实中进行七种二氢查耳酮的提取、鉴别、抗氧化以及抗癌测试(Extraction,identification,and antioxidant and anticancer tests of seven dihydrochalconesfrom Malus“Red Splendor”fruit).Food Chem.231,324-331.https://doi.org/10.1016/j.foodchem.2017.03.111
Yahyaa,M.,Ali,S.,Davidovich-Rikanati,R.,Ibdah,Muhammad,Shachtier,A.,Eyal,Y.,Lewinsohn,E.,Ibdah,Mwafaq,2017.从苹果中表征三个查耳酮合酶样基因(Characterization of three chalcone synthase-like genes from apple(Malus xdomestica Borkh.)).Phytochemistry 140,125-133.https://doi.org/10.1016/j.phytochem.2017.04.022
Yahyaa,M.,Davidovich-Rikanati,R.,Eyal,Y.,Sheachter,A.,Marzouk,S.,Lewinsohn,E.,Ibdah,M.,2016.从栽培苹果中鉴别和表征UDP-葡萄糖:根皮素4’-O-糖基转移酶(Identification and characterization of UDP-glucose:Phloretin 4’-O-glycosyltransferase from Malus x domestica Borkh).Phytochemistry 130,47-55.https://doi.org/10.1016/j.phytochem.2016.06.004
Yang,J.,Zhang,Y.,2015.I-TASSER服务器:蛋白质结构和功能预测的新开发(I-TASSER server:new development for protein structure and functionpredictions).Nucleic Acids Res.43,W174-W181.https://doi.org/10.1093/nar/gkv342
Yao,J.-L.,Cohen,D.,Atkinson,R.,Richardson,K.,Morris,B.,1995.从商业苹果栽培种皇家嘎啦再生转基因植物(Regeneration of transgenic plants from thecommercial apple cultivar Royal Gala).Plant Cell Rep.14,407-412.https://doi.org/10.1007/BF00234044
Yao,J.-L.,Tomes,S.,Gleave,A.P.,2013.使用苹果乙酰乳酸合酶的突变体作为选择性标志物对苹果的转化以及对T-DNA整合位点的分析(Transformation of apple(Malus×domestica)using mutants of apple acetolactate synthase as aselectable marker and analtsis of the T-DNA integration sites).Plant CellRep.32,703-714.https://doi.org/10.1007/s00299-013-1404-7
Yauk,Y.-K.,Ged,C.,Wang,M.Y.,Matich,A.J.,Tessarotto,L.,Cooney,J.M.,Chervin,C.,Atkinson,R.G.,2014.使用对萜醇具有特异性的糖基转移酶对风味和香味化合物固存和释放的操纵(Manipulation of flavour and aroma compound sequestratiomand release using a gltcosyltramsferase with specificity for terpenealcohols).Plant J.Cell Mol.Biol.80,317-330.https://doi.org/10.1111/tpi.12634
Zhou,K.,Hu,L.,Li,Y.,Chem,X.,Zhang,Z.,Liu,B.,Li,P.,Gong,X.,Ma,F.,2019.MdUGT88F1-介导的根皮苷生物合成调控苹果发育和腐烂病抗性(MdUGT88F1-Mediated Phloridzin Biosynthesis Regulates Apple Development and Valsa CankerResistance).Plant Physiol.180,2290-2305.https://doi.org/10.1104/pp.19.00494
序列表
<110> 新西兰植物与食品研究所
王娱乐
R·G·阿特金森
Y-K·亚克
李鹏民
<120> 三叶苷基因
<130> 891628
<150> NZ 761877
<151> 2020-02-19
<160> 18
<170> PatentIn version 3.5
<210> 1
<211> 474
<212> PRT
<213> 变叶海棠
<400> 1
Met Glu Ala Thr Ala Ile Val Leu Tyr Pro Ser Pro Leu Ile Gly His
1 5 10 15
Leu Val Ser Met Val Glu Leu Gly Lys Leu Ile Leu Thr Arg His Pro
20 25 30
Ser Leu Cys Ile His Ile Leu Ile Thr Thr Pro Pro Tyr Arg Ala Asn
35 40 45
Asp Thr Asp Ser Tyr Ile Thr Ser Val Ser Ala Ala Asn Pro Ser Leu
50 55 60
Ile Phe His His Leu Pro Thr Ile Ser Leu Pro Pro Ser Leu Ala Ser
65 70 75 80
Ser Arg Asn His Glu Ile Leu Ala Phe Glu Leu Ala Pro Leu Tyr Asn
85 90 95
Pro Asn Val His Gln Ala Leu Val Ser Ile Ser His Asn Phe Ser Ile
100 105 110
Lys Ala Phe Val Met Asp Phe Phe Cys Tyr Val Gly Leu Pro Val Ala
115 120 125
Thr Glu Leu Asn Ile Pro Ser Tyr Phe Phe Phe Thr Ser Ser Ala Asn
130 135 140
Thr Leu Ala Ser Ser Leu Tyr Leu Pro Thr Leu His Asn Ile Ile Asp
145 150 155 160
Lys Ser Leu Lys Asp Leu Asn Ile Leu Leu Asn Ile Pro Gly Val Pro
165 170 175
Pro Met Pro Ser Ser Asp Met Pro Gln Pro Thr Leu Asp Arg Asn Gln
180 185 190
Lys Val Tyr Glu His Val Gln Gly Ser Ser Lys Gln Phe Pro Lys Ser
195 200 205
Ala Gly Ile Ile Val Asn Thr Phe Glu Ser Leu Glu Pro Arg Ala Leu
210 215 220
Arg Ala Ile Trp Asp Gly Leu Cys Leu Pro Glu Asn Val Pro Thr Pro
225 230 235 240
Pro Val Tyr Pro Ile Gly Pro Leu Ile Val Ser His Gly Gly Gly Gly
245 250 255
Arg Gly Ala Glu Cys Leu Lys Trp Leu Asp Ser Gln Pro Ser Gly Ser
260 265 270
Val Val Phe Leu Cys Phe Gly Ser Leu Gly Leu Phe Ser Lys Glu Gln
275 280 285
Leu Lys Glu Ile Ala Ile Gly Leu Glu Asn Ser Gly His Arg Phe Leu
290 295 300
Trp Val Val Arg Asn Pro Pro Ala Gln Asn Gln Ile Gly Leu Asp Ile
305 310 315 320
Lys Glu Ser Asp Pro Glu Leu Lys Ser Leu Leu Pro Asp Gly Phe Leu
325 330 335
Asp Arg Thr Lys Asp Arg Gly Leu Val Val Lys Ser Trp Ala Pro Gln
340 345 350
Ala Ala Val Leu Asn His Asn Ser Val Gly Gly Phe Val Ser His Cys
355 360 365
Gly Trp Asn Ser Val Leu Glu Ser Val Cys Ala Gly Val Pro Ile Val
370 375 380
Ala Trp Pro Leu Tyr Ala Glu Gln Arg Phe Asn Arg Val Val Leu Val
385 390 395 400
Lys Glu Ile Lys Ile Ala Met Pro Met Asn Glu Ser Glu Asp Gly Phe
405 410 415
Val Arg Ala Ala Glu Val Glu Lys Arg Ile Thr Glu Leu Met Asp Ser
420 425 430
Glu Glu Gly Ala Ser Ile Arg Lys Arg Thr Lys Asp Leu Gln Asn Asn
435 440 445
Ala His Ala Ala Leu Gly Glu Thr Gly Ser Ser Gly Val Ala Leu Thr
450 455 460
Lys Leu Leu Glu Leu Trp Gly Lys Thr Cys
465 470
<210> 2
<211> 474
<212> PRT
<213> 变叶海棠
<400> 2
Met Glu Ala Thr Ala Ile Val Leu Tyr Pro Ser Pro Leu Ile Gly His
1 5 10 15
Leu Val Ser Met Val Glu Leu Gly Lys Leu Ile Leu Thr Arg His Pro
20 25 30
Ser Leu Cys Ile His Ile Leu Ile Thr Thr Pro Pro Tyr Arg Ala Asn
35 40 45
Asp Thr Asp Ser Tyr Ile Thr Ser Val Ser Ala Ala Asn Pro Ser Leu
50 55 60
Ile Phe His His Leu Pro Thr Ile Ser Leu Pro Pro Ser Leu Ala Ser
65 70 75 80
Ser Arg Asn His Glu Ile Leu Ala Phe Glu Leu Ala Pro Leu Tyr Asn
85 90 95
Pro Asn Val His Gln Ala Leu Val Ser Ile Ser His Asn Phe Ser Ile
100 105 110
Lys Ala Phe Val Met Asp Phe Phe Cys Tyr Val Gly Leu Pro Val Ala
115 120 125
Thr Glu Leu Asn Ile Pro Ser Tyr Phe Phe Phe Thr Ser Ser Ala Asn
130 135 140
Thr Leu Ala Ser Ser Leu Tyr Leu Pro Thr Leu His Asn Ile Ile Asp
145 150 155 160
Lys Ser Leu Lys Asp Leu Asn Ile Leu Leu Asn Ile Pro Gly Val Pro
165 170 175
Pro Met Pro Ser Ser Asp Met Pro Gln Pro Thr Leu Asp Arg Asn Gln
180 185 190
Lys Val Tyr Glu His Val Gln Gly Ser Ser Lys Gln Phe Pro Lys Ser
195 200 205
Ala Gly Ile Ile Val Asn Thr Phe Glu Ser Leu Glu Pro Arg Ala Leu
210 215 220
Arg Ala Ile Trp Asp Gly Leu Cys Leu Pro Glu Asn Val Pro Thr Pro
225 230 235 240
Pro Val Tyr Pro Ile Gly Pro Leu Ile Val Ser His Gly Gly Gly Gly
245 250 255
Arg Gly Ala Glu Cys Leu Lys Trp Leu Asp Ser Gln Pro Ser Gly Ser
260 265 270
Val Val Phe Leu Cys Phe Gly Ser Leu Gly Leu Phe Ser Lys Glu Gln
275 280 285
Leu Lys Glu Ile Ala Ile Gly Leu Glu Asn Ser Gly His Arg Phe Leu
290 295 300
Trp Val Val Arg Asn Pro Pro Ala Gln Asn Gln Ile Gly Leu Asp Ile
305 310 315 320
Lys Glu Ser Asp Pro Glu Leu Lys Ser Leu Leu Pro Asp Gly Phe Leu
325 330 335
Asp Arg Thr Lys Asp Arg Gly Leu Val Val Lys Ser Trp Ala Pro Gln
340 345 350
Ala Ala Val Leu Asn His Asn Ser Val Gly Gly Phe Val Ser His Cys
355 360 365
Gly Trp Asn Ser Val Leu Glu Ser Val Cys Ala Gly Val Pro Ile Val
370 375 380
Ala Trp Pro Leu Tyr Ala Glu Gln Arg Phe Asn Arg Val Val Leu Val
385 390 395 400
Lys Glu Ile Lys Ile Ala Met Pro Met Asn Glu Ser Glu Asp Gly Phe
405 410 415
Val Arg Ala Ala Glu Val Glu Lys Arg Ile Thr Glu Leu Met Asp Ser
420 425 430
Glu Glu Gly Ala Ser Ile Arg Lys Arg Thr Lys Asp Leu Gln Asn Asn
435 440 445
Ala His Ala Ala Leu Gly Glu Thr Gly Ser Ser Gly Val Ala Leu Thr
450 455 460
Lys Leu Leu Glu Phe Trp Gly Lys Thr Cys
465 470
<210> 3
<211> 474
<212> PRT
<213> 三叶海棠
<400> 3
Met Glu Ala Thr Ala Ile Val Leu Tyr Pro Ser Pro Leu Ile Gly His
1 5 10 15
Leu Val Ser Met Val Glu Leu Gly Lys Leu Ile Leu Thr Arg His Pro
20 25 30
Ser Leu Cys Ile His Ile Leu Ile Thr Thr Pro Pro Tyr Arg Ala Asn
35 40 45
Asp Thr Asp Ser Tyr Ile Thr Ser Val Ser Ala Ala Asn Pro Ser Leu
50 55 60
Ile Phe His His Leu Pro Thr Ile Ser Leu Pro Pro Ser Leu Ala Ser
65 70 75 80
Ser Arg Asn His Glu Ile Leu Ala Phe Glu Leu Ala Pro Leu Tyr Asn
85 90 95
Pro Asn Val His Gln Ala Leu Val Ser Ile Ser His Asn Phe Ser Ile
100 105 110
Lys Ala Phe Val Met Asp Phe Phe Cys Tyr Val Gly Leu Pro Val Ala
115 120 125
Thr Glu Leu Asn Ile Pro Ser Tyr Phe Phe Phe Thr Ser Ser Ala Asn
130 135 140
Thr Leu Ala Ser Ser Leu Tyr Leu Pro Thr Leu His Asn Ile Ile Asp
145 150 155 160
Lys Ser Leu Lys Asp Leu Asn Ile Leu Leu Asn Ile Pro Gly Val Pro
165 170 175
Pro Met Pro Ser Ser Asp Met Pro Gln Pro Thr Leu Asp Arg Asn Gln
180 185 190
Lys Val Tyr Glu His Val Gln Gly Ser Ser Lys Gln Phe Pro Lys Ser
195 200 205
Ala Gly Ile Ile Val Asn Thr Phe Glu Ser Leu Glu Pro Arg Ala Leu
210 215 220
Arg Ala Ile Trp Asp Gly Leu Cys Leu Pro Glu Asn Val Pro Thr Pro
225 230 235 240
Pro Val Tyr Pro Ile Gly Pro Leu Ile Val Ser His Gly Gly Gly Gly
245 250 255
Arg Gly Ala Glu Cys Leu Lys Trp Leu Asp Ser Gln Pro Ser Gly Ser
260 265 270
Val Val Phe Leu Cys Phe Gly Ser Leu Gly Leu Phe Ser Lys Glu Gln
275 280 285
Leu Lys Glu Ile Ala Ile Gly Leu Glu Asn Ser Gly His Arg Phe Leu
290 295 300
Trp Val Val Arg Asn Pro Pro Ala Gln Asn Gln Ile Gly Leu Asp Ile
305 310 315 320
Lys Glu Ser Asp Pro Glu Leu Lys Ser Leu Leu Pro Asp Gly Phe Leu
325 330 335
Asp Arg Thr Lys Asp Arg Gly Leu Val Val Lys Ser Trp Ala Pro Gln
340 345 350
Ala Ala Val Leu Asn His Asn Ser Val Gly Gly Phe Val Ser His Cys
355 360 365
Gly Trp Asn Ser Val Leu Glu Ser Val Cys Ala Gly Val Pro Ile Val
370 375 380
Ala Trp Pro Leu Tyr Ala Glu Gln Arg Phe Asn Arg Val Val Leu Val
385 390 395 400
Lys Glu Ile Lys Ile Ala Met Pro Met Asn Glu Ser Glu Asp Gly Phe
405 410 415
Val Arg Ala Ala Glu Val Glu Lys Arg Ile Thr Glu Leu Met Asp Ser
420 425 430
Glu Glu Gly Ala Ser Ile Arg Lys Arg Thr Lys Asp Leu Gln Asn Asn
435 440 445
Ala His Ala Ala Leu Gly Glu Thr Gly Ser Ser Gly Val Ala Leu Thr
450 455 460
Lys Leu Leu Glu Phe Trp Gly Lys Thr Cys
465 470
<210> 4
<211> 474
<212> PRT
<213> ‘亚当’海棠
<400> 4
Met Glu Ala Thr Ala Ile Val Leu Tyr Pro Ser Pro Leu Ile Gly His
1 5 10 15
Leu Val Ser Met Val Glu Leu Gly Lys Leu Ile Leu Thr Arg His Pro
20 25 30
Ser Leu Cys Ile His Ile Leu Ile Thr Thr Pro Pro Tyr Arg Ala Asn
35 40 45
Asp Thr Asp Ser Tyr Ile Thr Ser Val Ser Ala Ala Asn Pro Ser Leu
50 55 60
Ile Phe His His Leu Pro Thr Ile Ser Leu Pro Pro Ser Leu Ala Ser
65 70 75 80
Ser Arg Asn His Glu Ile Leu Ala Phe Glu Leu Ala Pro Leu Tyr Asn
85 90 95
Pro Asn Val His Gln Ala Leu Val Ser Ile Ser His Asn Phe Ser Ile
100 105 110
Lys Ala Phe Val Met Asp Phe Phe Cys Tyr Val Gly Leu Pro Val Ala
115 120 125
Thr Glu Leu Asn Ile Pro Ser Tyr Phe Phe Phe Thr Ser Ser Ala Asn
130 135 140
Thr Leu Ala Ser Ser Leu Tyr Leu Pro Thr Leu His Asn Ile Ile Asp
145 150 155 160
Lys Ser Leu Lys Asp Leu Asn Ile Leu Leu Asn Ile Pro Gly Val Pro
165 170 175
Pro Met Pro Ser Ser Asp Met Pro Gln Pro Thr Leu Asp Arg Asn Gln
180 185 190
Lys Val Tyr Glu His Val Gln Gly Ser Ser Lys Gln Phe Pro Lys Ser
195 200 205
Ala Gly Ile Ile Val Asn Thr Phe Glu Ser Leu Glu Pro Arg Ala Leu
210 215 220
Arg Ala Ile Trp Asp Gly Leu Cys Leu Pro Glu Asn Val Pro Thr Pro
225 230 235 240
Pro Val Tyr Pro Ile Gly Pro Leu Ile Val Ser His Gly Gly Gly Gly
245 250 255
Arg Gly Ala Glu Cys Leu Lys Trp Leu Asp Ser Gln Pro Ser Gly Ser
260 265 270
Val Val Phe Leu Cys Phe Gly Ser Leu Gly Leu Phe Ser Lys Glu Gln
275 280 285
Leu Lys Glu Ile Ala Ile Gly Leu Glu Asn Ser Gly His Arg Phe Leu
290 295 300
Trp Val Val Arg Asn Pro Pro Ala Gln Asn Gln Ile Gly Leu Asp Ile
305 310 315 320
Lys Glu Ser Asp Pro Glu Leu Lys Ser Leu Leu Pro Asp Gly Phe Leu
325 330 335
Asp Arg Thr Lys Asp Arg Gly Leu Val Val Lys Ser Trp Ala Pro Gln
340 345 350
Ala Ala Val Leu Asn His Asn Ser Val Gly Gly Phe Val Ser His Cys
355 360 365
Gly Trp Asn Ser Val Leu Glu Ser Val Cys Ala Gly Val Pro Ile Val
370 375 380
Ala Trp Pro Leu Tyr Ala Glu Gln Arg Phe Asn Arg Val Val Leu Val
385 390 395 400
Lys Glu Ile Lys Ile Ala Met Pro Met Asn Glu Ser Glu Asp Gly Phe
405 410 415
Val Arg Ala Ala Glu Val Glu Lys Arg Ile Thr Glu Leu Met Asp Ser
420 425 430
Glu Glu Gly Ala Ser Ile Arg Lys Arg Thr Lys Asp Leu Gln Asn Asn
435 440 445
Ala His Ala Ala Leu Gly Glu Thr Gly Ser Ser Gly Val Ala Leu Thr
450 455 460
Lys Leu Leu Glu Phe Trp Gly Lys Thr Cys
465 470
<210> 5
<211> 474
<212> PRT
<213> 栽培苹果
<400> 5
Met Glu Ala Thr Ala Ile Val Leu Tyr Pro Ser Pro Leu Ile Gly His
1 5 10 15
Leu Val Ser Met Val Glu Leu Gly Lys Leu Ile Leu Thr Arg His Pro
20 25 30
Ser Leu Cys Ile His Ile Leu Ile Thr Thr Pro Pro Tyr Arg Ala Asn
35 40 45
Asp Thr Asp Ser Tyr Ile Thr Ser Val Ser Ala Ala Asn Pro Ser Leu
50 55 60
Ile Phe His His Leu Pro Thr Ile Ser Leu Pro Pro Ser Leu Ala Ser
65 70 75 80
Ser Arg Asn His Glu Ile Leu Ala Phe Glu Leu Ala Pro Leu Tyr Asn
85 90 95
Pro Asn Val His Gln Ala Leu Val Ser Ile Ser His Asn Phe Ser Ile
100 105 110
Lys Ala Phe Val Met Asp Phe Phe Cys Tyr Val Gly Leu Pro Val Ala
115 120 125
Thr Glu Leu Asn Ile Pro Ser Tyr Phe Phe Phe Thr Ser Ser Ala Asn
130 135 140
Thr Leu Ala Ser Ser Leu Tyr Leu Pro Thr Leu His Asn Ile Ile Asp
145 150 155 160
Lys Ser Leu Lys Asp Leu Asn Ile Leu Leu Asn Ile Pro Gly Val Pro
165 170 175
Pro Met Pro Ser Ser Asp Met Pro Gln Pro Thr Leu Asp Arg Asn Gln
180 185 190
Lys Val Tyr Glu His Val Gln Gly Ser Ser Lys Gln Phe Pro Lys Ser
195 200 205
Ala Gly Ile Ile Val Asn Thr Phe Glu Ser Leu Glu Pro Arg Ala Leu
210 215 220
Arg Ala Ile Trp Asp Gly Leu Cys Leu Pro Glu Asn Val Pro Thr Pro
225 230 235 240
Pro Val Tyr Pro Ile Gly Pro Leu Ile Val Ser His Gly Gly Gly Gly
245 250 255
Arg Gly Ala Glu Cys Leu Lys Trp Leu Asp Ser Gln Pro Ser Gly Ser
260 265 270
Val Val Phe Leu Cys Phe Gly Ser Leu Gly Leu Phe Ser Lys Glu Gln
275 280 285
Leu Lys Glu Ile Ala Ile Gly Leu Glu Asn Ser Gly His Arg Phe Leu
290 295 300
Trp Val Val Arg Asn Pro Pro Ala Gln Asn Gln Ile Gly Leu Asp Ile
305 310 315 320
Lys Glu Ser Asp Pro Glu Leu Lys Ser Leu Leu Pro Asp Gly Phe Leu
325 330 335
Asp Arg Thr Lys Asp Arg Gly Leu Val Val Lys Ser Trp Ala Pro Gln
340 345 350
Ala Ala Val Leu Asn His Asn Ser Val Gly Gly Phe Val Ser His Cys
355 360 365
Gly Trp Asn Ser Val Leu Glu Ser Val Cys Ala Gly Val Pro Ile Val
370 375 380
Ala Trp Pro Leu Tyr Ala Glu Gln Arg Phe Asn Arg Val Val Leu Val
385 390 395 400
Lys Glu Ile Lys Ile Ala Met Pro Met Asn Glu Ser Glu Asp Gly Phe
405 410 415
Val Arg Ala Ala Glu Val Glu Lys Arg Ile Thr Glu Leu Met Asp Ser
420 425 430
Glu Glu Gly Ala Ser Ile Arg Lys Arg Thr Lys Asp Leu Gln Asn Asn
435 440 445
Ala His Ala Ala Leu Gly Glu Thr Gly Ser Ser Gly Val Ala Leu Thr
450 455 460
Lys Leu Leu Glu Phe Trp Gly Lys Thr Cys
465 470
<210> 6
<211> 474
<212> PRT
<213> 三裂叶海棠
<400> 6
Met Glu Ala Ala Ala Ile Val Leu Tyr Pro Ser Pro Pro Ile Gly His
1 5 10 15
Leu Val Ser Met Val Glu Leu Gly Lys Leu Ile Leu Thr Arg His Pro
20 25 30
Ser Leu Cys Ile His Ile Leu Ile Thr Thr Pro Pro Tyr Arg Ala Asn
35 40 45
Asp Thr Asp Ser Tyr Ile Thr Ser Val Ser Ala Ala Asn Pro Ser Leu
50 55 60
Ile Phe His His Leu Pro Thr Ile Ser Leu Pro Pro Ser Leu Ala Ser
65 70 75 80
Ser Arg Asn His Glu Thr Leu Thr Phe Gly Leu Ala Pro Leu Asn Asn
85 90 95
Pro Asn Val His Gln Ala Leu Leu Ser Ile Ser His Asn Phe Ser Ile
100 105 110
Lys Ala Phe Val Met Asp Phe Phe Cys Ser Val Gly Leu Pro Ile Ala
115 120 125
Thr Glu Leu Asn Ile Pro Ser Tyr Phe Phe Phe Thr Ser Ser Ala Thr
130 135 140
Thr Leu Ala Ser Phe Leu Tyr Leu Pro Thr Ile His Asn Ile Thr Asp
145 150 155 160
Lys Ser Leu Lys Asp Leu Asn Ile Leu Leu Asn Ile Pro Gly Val Pro
165 170 175
Pro Ile Pro Ser Ser Asp Met Pro Gln Pro Ile Leu Glu Arg Asn Asn
180 185 190
Lys Val Tyr Glu Gln Cys Gln Glu Ser Ser Lys Gln Phe Pro Lys Ser
195 200 205
Ala Gly Ile Ile Val Asn Thr Phe Glu Ser Leu Glu Pro Arg Ala Leu
210 215 220
Arg Ala Ile Trp Asp Gly Leu Cys Leu Thr Glu Asn Val Pro Thr Pro
225 230 235 240
Pro Val Tyr Pro Ile Gly Pro Leu Ile Val Ser His Gly Gly Gly Gly
245 250 255
Arg Gly Ala Glu Cys Leu Lys Trp Leu Asp Ser Gln Pro Ser Gly Ser
260 265 270
Val Val Phe Leu Cys Phe Gly Ser Leu Gly Leu Phe Ser Lys Glu Gln
275 280 285
Leu Lys Glu Ile Ala Ile Gly Leu Glu Asn Ser Gly His Arg Phe Leu
290 295 300
Trp Val Val Arg Asn Pro Pro Ala Gln Asn Gln Ile Gly Leu Val Ile
305 310 315 320
Lys Glu Ser Asp Pro Glu Leu Lys Ser Leu Leu Pro Asp Gly Phe Leu
325 330 335
Asp Arg Thr Lys Asp Arg Gly Leu Val Val Lys Ser Trp Val Pro Gln
340 345 350
Val Ala Val Leu Asn His Asn Ser Val Gly Gly Phe Val Ser His Cys
355 360 365
Gly Trp Asn Ser Val Leu Glu Ser Val Cys Ala Gly Val Pro Ile Val
370 375 380
Ser Trp Pro Leu Tyr Ala Glu Gln Arg Leu Asn Arg Val Val Leu Val
385 390 395 400
Glu Glu Ile Lys Ile Ala Met Pro Met Asn Glu Ser Glu Asp Gly Phe
405 410 415
Val Arg Ala Ala Glu Val Glu Lys Arg Val Thr Glu Leu Met Asp Ser
420 425 430
Glu Glu Gly Glu Ser Ile Arg Lys Arg Thr Lys Asp Leu Gln Asn Asp
435 440 445
Ala His Ala Ala Leu Gly Glu Thr Gly Ser Ser Gly Val Ala Phe Thr
450 455 460
Lys Leu Leu Glu Leu Trp Gly Lys Thr Gly
465 470
<210> 7
<211> 474
<212> PRT
<213> 三裂叶海棠
<400> 7
Met Glu Ala Ala Ala Ile Val Leu Tyr Pro Ser Pro Val Ile Gly His
1 5 10 15
Leu Ile Ala Met Val Glu Leu Gly Lys Leu Ile Ile Thr Arg His Pro
20 25 30
Ser Leu Cys Ile His Ile Leu Ile Thr Thr Pro Pro Tyr Arg Ala Asn
35 40 45
Asp Thr Asp Ser Tyr Ile Thr Ser Val Ser Ala Ala Asn Pro Ser Leu
50 55 60
Ile Phe His His Leu Pro Thr Ile Ser Leu Pro Pro Ser Leu Ala Ser
65 70 75 80
Ser Arg Asn His Glu Thr Leu Thr Phe Gly Leu Ala Pro Leu Asn Asn
85 90 95
Pro Asn Val His Gln Ala Leu Leu Ser Ile Ser His Asn Phe Ser Ile
100 105 110
Lys Ala Phe Val Met Asp Phe Phe Cys Ser Val Gly Leu Pro Ile Ala
115 120 125
Thr Glu Leu Asn Ile Pro Ser Tyr Phe Phe Phe Thr Ser Ser Ala Thr
130 135 140
Thr Leu Ala Ser Phe Leu Tyr Leu Pro Thr Ile His Asn Ile Thr Asp
145 150 155 160
Lys Ser Leu Lys Asp Leu Asn Ile Leu Leu Asn Ile Pro Gly Val Pro
165 170 175
Pro Ile Pro Ser Ser Asp Met Pro Gln Pro Ile Leu Glu Arg Asn Asn
180 185 190
Lys Val Tyr Glu Gln Cys Gln Glu Ser Ser Lys Gln Phe Pro Lys Ser
195 200 205
Ala Gly Ile Ile Val Asn Thr Phe Glu Ser Leu Glu Pro Arg Ala Leu
210 215 220
Arg Ala Ile Trp Asp Gly Leu Cys Leu Thr Glu Asn Val Pro Thr Pro
225 230 235 240
Pro Val Tyr Pro Ile Gly Pro Leu Ile Val Ser His Gly Gly Gly Gly
245 250 255
Arg Gly Ala Glu Cys Leu Lys Trp Leu Asp Ser Gln Pro Ser Gly Ser
260 265 270
Val Val Phe Leu Cys Phe Gly Ser Leu Gly Leu Phe Ser Lys Glu Gln
275 280 285
Leu Lys Glu Ile Ala Ile Gly Leu Glu Asn Ser Gly His Arg Phe Leu
290 295 300
Trp Val Val Arg Asn Pro Pro Ala Gln Asn Gln Ile Gly Leu Val Ile
305 310 315 320
Lys Glu Ser Asp Pro Glu Leu Lys Ser Leu Leu Pro Asp Gly Phe Leu
325 330 335
Asp Arg Thr Lys Asp Arg Gly Leu Val Val Lys Ser Trp Val Pro Gln
340 345 350
Val Ala Val Leu Asn His Asn Ser Val Gly Gly Phe Val Ser His Cys
355 360 365
Gly Trp Asn Ser Val Leu Glu Ser Val Cys Ala Gly Val Pro Ile Val
370 375 380
Ser Trp Pro Leu Tyr Ala Glu Gln Arg Leu Asn Arg Val Val Leu Val
385 390 395 400
Glu Glu Ile Lys Ile Ala Met Pro Met Asn Glu Ser Glu Asp Gly Phe
405 410 415
Val Arg Ala Ala Glu Val Glu Lys Arg Val Thr Glu Leu Met Asp Ser
420 425 430
Glu Glu Gly Glu Ser Ile Arg Lys Arg Thr Lys Asp Leu Gln Asn Asp
435 440 445
Ala His Ala Ala Leu Gly Glu Thr Gly Ser Ser Gly Val Ala Phe Thr
450 455 460
Lys Leu Leu Glu Leu Trp Gly Lys Thr Gly
465 470
<210> 8
<211> 474
<212> PRT
<213> ‘Aotea’苹果
<400> 8
Met Glu Ala Ala Ala Ile Val Leu Tyr Pro Ser Pro Leu Ile Gly His
1 5 10 15
Leu Val Ser Met Val Glu Leu Gly Lys Leu Ile Leu Thr Arg His Pro
20 25 30
Ser Leu Cys Ile His Ile Leu Ile Thr Thr Pro Pro Tyr Arg Ala Asn
35 40 45
Asp Thr Asp Ser Tyr Ile Thr Ser Val Ser Ala Ala Asn Pro Ser Leu
50 55 60
Ile Phe His His Leu Pro Thr Ile Ser Leu Pro Pro Ser Leu Ala Ser
65 70 75 80
Ser Arg Asn His Glu Ile Leu Ala Phe Glu Leu Ala Pro Leu Tyr Asn
85 90 95
Pro Asn Val His Gln Ala Leu Val Ser Ile Ser His Asn Phe Ser Ile
100 105 110
Lys Ala Phe Val Met Asp Phe Phe Cys Tyr Val Gly Leu Pro Val Ala
115 120 125
Thr Glu Leu Asn Ile Pro Ser Tyr Phe Phe Phe Thr Ser Ser Ala Asn
130 135 140
Thr Leu Ala Ser Ser Leu Tyr Leu Pro Thr Leu His Asn Ile Ile Asp
145 150 155 160
Lys Ser Leu Lys Asp Leu Asn Ile Leu Leu Asn Ile Pro Gly Val Pro
165 170 175
Pro Met Pro Ser Ser Asp Met Pro Gln Pro Thr Leu Asp Arg Asn Gln
180 185 190
Lys Val Tyr Glu His Val Gln Gly Ser Ser Lys Gln Phe Pro Lys Ser
195 200 205
Ala Gly Ile Ile Val Asn Thr Phe Glu Ser Leu Glu Pro Arg Ala Leu
210 215 220
Arg Ala Ile Trp Asp Gly Leu Cys Leu Pro Glu Asn Val Pro Thr Pro
225 230 235 240
Pro Val Tyr Pro Ile Gly Pro Leu Ile Val Ser His Gly Gly Gly Gly
245 250 255
Arg Gly Ala Glu Cys Leu Lys Trp Leu Asp Ser Gln Pro Ser Gly Ser
260 265 270
Val Val Phe Leu Cys Phe Gly Ser Leu Gly Leu Phe Ser Lys Glu Gln
275 280 285
Leu Lys Glu Ile Ala Ile Gly Leu Glu Asn Ser Gly His Arg Phe Leu
290 295 300
Trp Val Val Arg Asn Pro Pro Ala Gln Asn Gln Ile Gly Leu Asp Ile
305 310 315 320
Lys Glu Ser Asp Pro Glu Leu Lys Ser Leu Leu Pro Asp Gly Phe Leu
325 330 335
Asp Arg Thr Lys Asp Arg Gly Leu Val Val Lys Ser Trp Ala Pro Gln
340 345 350
Ala Ala Val Leu Asn His Asn Ser Val Gly Gly Phe Val Ser His Cys
355 360 365
Gly Trp Asn Ser Val Leu Glu Ser Val Cys Ala Gly Val Pro Ile Val
370 375 380
Ala Trp Pro Leu Tyr Ala Glu Gln Arg Phe Asn Arg Val Val Leu Val
385 390 395 400
Lys Glu Ile Lys Ile Ala Met Pro Met Asn Glu Ser Glu Asp Gly Phe
405 410 415
Val Arg Ala Ala Glu Val Glu Lys Arg Ile Thr Glu Leu Met Asp Ser
420 425 430
Glu Glu Gly Ala Ser Ile Arg Lys Arg Thr Lys Asp Leu Gln Asn Asn
435 440 445
Ala His Ala Ala Leu Gly Glu Thr Gly Ser Ser Gly Val Ala Leu Thr
450 455 460
Lys Leu Leu Glu Leu Trp Gly Lys Thr Gly
465 470
<210> 9
<211> 474
<212> PRT
<213> 栽培苹果
<400> 9
Met Glu Ala Thr Ala Ile Val Leu Tyr Pro Ser Pro Leu Ile Gly His
1 5 10 15
Leu Val Ser Met Val Glu Leu Gly Lys Leu Ile Leu Thr Arg His Pro
20 25 30
Ser Leu Cys Ile His Ile Leu Ile Thr Thr Pro Pro Tyr Arg Ala Asn
35 40 45
Asp Thr Asp Ser Tyr Ile Thr Ser Val Ser Ala Ala Asn Pro Ser Leu
50 55 60
Ile Phe His His Leu Pro Thr Ile Ser Leu Pro Pro Ser Leu Ser Pro
65 70 75 80
Ser Arg Asn His Glu Thr Pro Ile Phe Glu Val Leu Leu Leu Asn Asn
85 90 95
Pro Tyr Val His Gln Ala Leu Leu Ser Ile Ser His Asn Phe Ser Ile
100 105 110
Lys Ala Phe Val Met Asp Phe Phe Cys Ser Val Gly Leu Pro Ile Ala
115 120 125
Thr Glu Leu Asn Ile Pro Ser Tyr Phe Phe Phe Thr Ser Ser Ala Ala
130 135 140
Asn Leu Ala Cys Phe Leu Tyr Leu Pro Thr Ile His Ser Ile Thr Asp
145 150 155 160
Lys Ser Leu Lys Asp Leu Asn Ile Leu Leu Asn Ile Pro Gly Val Gln
165 170 175
Pro Ile Pro Ser Ser Asp Met Pro Lys Pro Ile Leu Glu Arg Asn Asn
180 185 190
Lys Val Tyr Glu His Phe Gln Glu Ser Ser Lys Gln Phe Pro Lys Ser
195 200 205
Ala Gly Ile Ile Val Asn Thr Phe Glu Ser Leu Glu Pro Arg Val Leu
210 215 220
Arg Ala Ile Trp Asp Gly Leu Cys Leu Thr Glu Asn Val Pro Thr Pro
225 230 235 240
Pro Val Tyr Pro Ile Gly Pro Leu Ile Ile Ser His Gly Gly Gly Gly
245 250 255
Arg Gly Ala Glu Tyr Leu Lys Trp Leu Asp Ser Gln Pro Ser Gly Ser
260 265 270
Val Val Phe Leu Cys Phe Gly Ser Leu Gly Leu Phe Ser Lys Glu Gln
275 280 285
Leu Lys Glu Ile Ala Ile Gly Leu Glu Asn Ser Gly His Arg Phe Leu
290 295 300
Trp Val Val Arg Asn Pro Pro Ala Gln Asn Gln Ile Gly Leu Ala Ile
305 310 315 320
Lys Glu Ser Asp Pro Glu Leu Lys Ser Leu Leu Pro Asp Gly Phe Leu
325 330 335
Asp Arg Thr Lys Gly Arg Gly Leu Val Val Lys Ser Trp Ala Pro Gln
340 345 350
Val Ala Val Leu Asn His Asn Ser Val Gly Gly Phe Val Ser His Cys
355 360 365
Gly Trp Asn Ser Val Leu Glu Ser Val Cys Ala Gly Val Pro Ile Val
370 375 380
Ala Trp Pro Leu Tyr Ala Glu Gln Arg Phe Asn Arg Val Val Leu Val
385 390 395 400
Glu Glu Ile Lys Ile Ala Met Pro Met Asn Glu Ser Glu Asp Gly Phe
405 410 415
Val Arg Ala Ala Glu Val Glu Lys Arg Val Thr Glu Leu Met Asp Ser
420 425 430
Glu Glu Gly Glu Ser Ile Arg Lys Arg Thr Lys Asp Leu Gln Asn Asp
435 440 445
Ala His Ala Ala Leu Gly Glu Thr Gly Ser Ser Arg Val Ala Phe Thr
450 455 460
Lys Leu Leu Glu Phe Trp Gly Lys Thr Cys
465 470
<210> 10
<211> 1425
<212> DNA
<213> 变叶海棠
<300>
<308> GenBank MN380999
<309> 2020-08-07
<313> (1)..(1425)
<400> 10
atggaggcga cagctatagt tttatatcca tcaccgctaa ttgggcactt agtctccatg 60
gtagagctag gcaagctcat actcacccgc cacccttctc tgtgcatcca catcctcatc 120
accaccccgc cctaccgcgc caacgacacc gactcataca tcacctccgt ctccgctgcc 180
aacccttccc tcatcttcca ccacctcccc accatctccc tccctccctc cctcgcctcc 240
tcccgcaacc acgaaatcct agccttcgaa ctcgcccccc tctacaaccc taacgtccac 300
caagccctcg tctccatctc ccacaacttc tccatcaaag cttttgtcat ggacttcttc 360
tgctatgtcg ggctccccgt tgccaccgag ctgaacatcc ccagctactt cttcttcaca 420
tccagcgcca acaccctcgc ttcctccctc tacctcccca cccttcacaa catcattgac 480
aaaagcctca aagacctaaa tatccttctc aacattccag gagtcccgcc gatgccttcc 540
tccgatatgc cgcaaccgac tcttgaccga aaccaaaaag tgtatgaaca tgtccaagga 600
agctcaaagc agttcccgaa atcagctggg attatcgtaa acacgtttga atctctcgaa 660
cccagagctc tcagagcaat atgggacggt ctgtgcttgc ccgagaacgt tccaactcca 720
ccggtctacc ccatcggacc gctgattgtt tcccatggcg gtggaggccg cggggccgag 780
tgtttgaaat ggctggactc acagccaagt ggaagcgtgg tgttcctctg ttttgggagc 840
ttgggattgt tttcaaagga gcagttgaag gaaattgcga ttgggttgga gaatagtggg 900
cacagatttt tgtgggtggt ccgtaatcct ccagcccaaa atcaaattgg gctggatatt 960
aaagagtccg atccggaatt gaaatctttg cttccggacg ggtttttgga tcggactaag 1020
gatcggggtc tcgtggtcaa gtcatgggcc ccgcaagcgg cagtgttgaa tcataactcg 1080
gtgggtgggt ttgtgagtca ttgcgggtgg aactcggtgt tggaatcggt gtgtgccggt 1140
gtgccgattg tggcttggcc gctctacgcg gagcagagat tcaatcgagt ggttttggtg 1200
aaggagatta agattgctat gccgatgaac gagtcagaag acgggtttgt gagagcagcg 1260
gaggtggaga agcgaattac ggagttgatg gactcggagg agggcgcgtc gatcaggaag 1320
cgtacaaagg atttgcaaaa caatgcccat gcagcattgg gtgagaccgg gtcgtctggg 1380
gttgcattga ctaaactact tgaattgtgg ggcaaaacct gttag 1425
<210> 11
<211> 1425
<212> DNA
<213> 变叶海棠
<300>
<308> GenBank MN381000
<309> 2020-08-07
<313> (1)..(1425)
<400> 11
atggaggcga cagctatagt tttatatcca tcaccgctaa ttgggcactt agtctccatg 60
gtagagctag gcaagctcat actcacccgc cacccttctc tgtgcatcca catcctcatc 120
accaccccgc cctaccgcgc caacgacacc gactcataca tcacctccgt ctccgctgcc 180
aacccttccc tcatcttcca ccacctcccc accatctccc tccctccctc cctcgcctcc 240
tcccgcaacc acgaaatcct agccttcgaa ctcgcccccc tctacaaccc taacgtccac 300
caagccctcg tctccatctc ccacaacttc tccatcaaag cttttgtcat ggacttcttc 360
tgctatgtcg ggctccccgt tgccaccgag ctgaacatcc ccagctactt cttcttcaca 420
tccagcgcca acaccctcgc ttcctccctc tacctcccca cccttcacaa catcattgac 480
aaaagcctca aagacctaaa tatccttctc aacattccag gagtcccgcc gatgccttcc 540
tccgatatgc cgcaaccgac tcttgaccga aaccaaaaag tgtatgaaca tgtccaagga 600
agctcaaagc agttcccgaa atcagctggg attatcgtaa acacgtttga atctctcgaa 660
cccagagctc tcagagcaat atgggacggt ctgtgcttgc ccgagaacgt tccaactcca 720
ccggtctacc ccatcggacc gctgattgtt tcccatggcg gtggaggccg cggggccgag 780
tgtttgaaat ggctggactc acagccaagt ggaagcgtgg tgttcctctg ttttgggagc 840
ttgggattgt tttcaaagga gcagttgaag gaaattgcga ttgggttgga gaatagtggg 900
cacagatttt tgtgggtggt ccgtaatcct ccagcccaaa atcaaattgg gctggatatt 960
aaagagtccg atccggaatt gaaatctttg cttccggacg ggttcttgga tcggactaag 1020
gatcggggtc tcgtggtcaa gtcatgggcc ccgcaagcgg cagtgttgaa tcacaactcg 1080
gtgggtgggt ttgtgagtca ttgcgggtgg aactcggtgt tggaatcggt gtgtgccggt 1140
gtgccgattg tggcttggcc gctctacgcg gagcagagat tcaatcgagt ggttttggtg 1200
aaggagatta agattgctat gccgatgaac gagtcagaag acgggtttgt gagagcagcg 1260
gaggtggaga agcgaattac ggagttgatg gactcggagg agggcgcgtc gatcaggaag 1320
cgtacaaagg atttgcaaaa caatgcccat gcagcattgg gtgagaccgg gtcgtctggg 1380
gttgcattga ctaaactact tgaattctgg ggcaaaacct gttag 1425
<210> 12
<211> 1425
<212> DNA
<213> 三叶海棠
<300>
<308> GenBank MN381001
<309> 2020-08-07
<313> (1)..(1425)
<400> 12
atggaggcga cagctatagt tttatatcca tcaccgctaa ttgggcactt agtctccatg 60
gtagagctag gcaagctcat actcacccgc cacccttctc tgtgcatcca catcctcatc 120
accaccccgc cctaccgcgc caacgacacc gactcataca tcacctccgt ctccgctgcc 180
aacccttccc tcatcttcca ccacctcccc accatctccc tccctccctc cctcgcctcc 240
tcccgcaacc acgaaatcct agccttcgaa ctcgcccccc tctacaaccc taacgtccac 300
caagccctcg tctccatctc ccacaacttc tccatcaaag cttttgtcat ggacttcttc 360
tgctatgtcg ggctccccgt tgccaccgag ctgaacatcc ccagctactt cttcttcaca 420
tccagcgcca acaccctcgc ttcctccctc tacctcccca cccttcacaa catcattgac 480
aaaagcctca aagacctaaa tatccttctc aacattccag gagtcccgcc gatgccttcc 540
tccgatatgc cgcaaccgac tcttgaccga aaccaaaaag tgtatgaaca tgtccaagga 600
agctcaaagc agttcccgaa atcagctggg attatcgtaa acacgtttga atctctcgaa 660
cccagagctc tcagagcaat atgggacggt ctgtgcttgc ccgagaacgt tccaactcca 720
ccggtctacc ccatcggacc gctgattgtt tcccatggcg gtggaggccg cggggccgag 780
tgtttgaaat ggctggactc acagccaagt ggaagcgtgg tgttcctctg ttttgggagc 840
ttgggattgt tttcaaagga gcagttgaag gaaattgcga ttgggttgga gaatagtggg 900
cacagatttt tgtgggtggt ccgtaatcct ccagcccaaa atcaaattgg gctggatatt 960
aaagagtccg atccggaatt gaaatctttg cttccggacg ggttcttgga tcggactaag 1020
gatcggggtc tcgtggtcaa gtcatgggcc ccgcaagcgg cagtgttgaa tcacaactcg 1080
gtgggtgggt ttgtgagtca ttgcgggtgg aactcggtgt tggaatcggt gtgtgccggt 1140
gtgccgattg tggcttggcc gctctacgcg gagcagagat tcaatcgagt ggttttggtg 1200
aaggagatta agattgctat gccgatgaac gagtcagaag acgggtttgt gagagcagcg 1260
gaggtggaga agcgaattac ggagttgatg gactcggagg agggcgcgtc gatcaggaag 1320
cgtacaaagg atttgcaaaa caatgcccat gcagcattgg gtgagaccgg gtcgtctggg 1380
gttgcattga ctaaactact tgaattctgg ggcaaaacct gttag 1425
<210> 13
<211> 1425
<212> DNA
<213> ‘亚当’海棠
<300>
<308> GenBank MN381002
<309> 2020-08-07
<313> (1)..(1425)
<400> 13
atggaggcga cagctatagt tttatatcca tcaccgctaa ttgggcactt agtctccatg 60
gtagagctag gcaagctcat actcacccgc cacccttctc tgtgcatcca catcctcatc 120
accaccccgc cctaccgcgc caacgacacc gactcataca tcacctccgt ctccgctgcc 180
aacccttccc tcatcttcca ccacctcccc accatctccc tccctccctc cctcgcctcc 240
tcccgcaacc acgaaatcct agccttcgaa ctcgcccccc tctacaaccc taacgtccac 300
caagccctcg tctccatctc ccacaacttc tccatcaaag cttttgtcat ggacttcttc 360
tgctatgtcg ggctccccgt tgccaccgag ctgaacatcc ccagctactt cttcttcaca 420
tccagcgcca acaccctcgc ttcctccctc tacctcccca cccttcacaa catcattgac 480
aaaagcctca aagacctaaa tatccttctc aacattccag gagtcccgcc gatgccttcc 540
tccgatatgc cgcaaccgac tcttgaccga aaccaaaaag tgtatgaaca tgtccaagga 600
agctcaaagc agttcccgaa atcagctggg attatcgtaa acacgtttga atctctcgaa 660
cccagagctc tcagagcaat atgggacggt ctgtgcttgc ccgagaacgt tccaactcca 720
ccggtctacc ccatcggacc gctgattgtt tcccatggcg gtggaggccg cggggccgag 780
tgtttgaaat ggctggactc acagccaagt ggaagcgtgg tgttcctctg ttttgggagc 840
ttgggattgt tttcaaagga gcagttgaag gaaattgcga ttgggttgga gaatagtggg 900
cacagatttt tgtgggtggt ccgtaatcct ccagcccaaa atcaaattgg gctggatatt 960
aaagagtccg atccggaatt gaaatctttg cttccggacg ggtttttgga tcggactaag 1020
gatcggggtc tcgtggtcaa gtcatgggcc ccgcaagcgg cagtgttgaa tcataactcg 1080
gtgggtgggt ttgtgagtca ttgcgggtgg aactcggtgt tggaatcggt gtgtgccggt 1140
gtgccgattg tggcttggcc gctctacgcg gagcagagat tcaatcgagt ggttttggtg 1200
aaggagatta agattgctat gccgatgaac gagtcagaag acgggtttgt gagagcagcg 1260
gaggtggaga agcgaattac ggagttgatg gactcggagg agggcgcgtc gatcaggaag 1320
cgtacaaagg atttgcaaaa caatgcccat gcagcattgg gtgagaccgg gtcgtctggg 1380
gttgcattga ctaaactact tgaattctgg ggcaaaacct gttag 1425
<210> 14
<211> 1425
<212> DNA
<213> 栽培苹果
<300>
<308> GenBank MN381003
<309> 2020-08-07
<313> (1)..(1425)
<400> 14
atggaggcga cagctatagt tttatatcca tcaccgctaa ttgggcactt agtctccatg 60
gtagagctag gcaagctcat actcacccgc cacccttctc tgtgcatcca catcctcatc 120
accaccccgc cctaccgcgc caacgacacc gactcataca tcacctccgt ctccgctgcc 180
aacccttccc tcatcttcca ccacctcccc accatctccc tccctccctc cctcgcctcc 240
tcccgcaacc acgaaatcct agccttcgaa ctcgcccccc tctacaaccc taacgtccac 300
caagccctcg tctccatctc ccacaacttc tccatcaaag cttttgtcat ggacttcttc 360
tgctatgtcg ggctccccgt tgccaccgag ctgaacatcc ccagctactt cttcttcaca 420
tccagcgcca acaccctcgc ttcctccctc tacctcccca cccttcacaa catcattgac 480
aaaagcctca aagacctaaa tatccttctc aacattccag gagtcccgcc gatgccttcc 540
tccgatatgc cgcaaccgac tcttgaccga aaccaaaaag tgtatgaaca tgtccaagga 600
agctcaaagc agttcccgaa atcagctggg attatcgtaa acacgtttga atctctcgaa 660
cccagagctc tcagagcaat atgggacggt ctgtgcttgc ccgagaacgt tccaactcca 720
ccggtctacc ccatcggacc gctgattgtt tcccatggcg gtggaggccg cggggccgag 780
tgtttgaaat ggctggactc acagccaagt ggaagcgtgg tgttcctctg ttttgggagc 840
ttgggattgt tttcaaagga gcagttgaag gaaattgcga ttgggttgga gaatagtggg 900
cacagatttt tgtgggtggt ccgtaatcct ccagcccaaa atcaaattgg gctggatatt 960
aaagagtccg atccggaatt gaaatctttg cttccggacg ggttcttgga tcggactaag 1020
gatcggggtc tcgtggtcaa gtcatgggcc ccgcaagcgg cagtgttgaa tcacaactcg 1080
gtgggtgggt ttgtgagtca ttgcgggtgg aactcggtgt tggaatcggt gtgtgccggt 1140
gtgccgattg tggcttggcc gctctacgcg gagcagagat tcaatcgagt ggttttggtg 1200
aaggagatta agattgctat gccgatgaac gagtcagaag acgggtttgt gagagcagcg 1260
gaggtggaga agcgaattac ggagttgatg gactcggagg agggcgcgtc gatcaggaag 1320
cgtacaaagg atttgcaaaa caatgcccat gcagcattgg gtgagaccgg gtcgtctggg 1380
gttgcattga ctaaactact tgaattctgg ggcaaaacct gttag 1425
<210> 15
<211> 1425
<212> DNA
<213> 三裂叶海棠
<300>
<308> GenBank MN381004
<309> 2020-08-07
<313> (1)..(1425)
<400> 15
atggaggcgg cagctatagt tttatatcca tcaccaccaa ttggccactt agtctccatg 60
gtagagctag gcaagctcat actcacccgc cacccttctc tgtgcatcca catcctcatc 120
accaccccgc cctaccgcgc caacgacacc gactcataca tcacctccgt ctccgctgcc 180
aacccttccc tcatcttcca ccacctcccc accatctccc tccctccctc cctcgcctcc 240
tcccgcaacc acgaaaccct aaccttcgga ctcgcccccc tcaacaaccc taacgtccac 300
caagccctcc tctccatctc ccacaacttc tccatcaaag cttttgtcat ggacttcttc 360
tgctctgtcg ggctccccat tgccaccgag ctgaacatcc ccagctactt cttcttcaca 420
tccagcgcca ccaccctcgc ttccttcctc tacctcccca ccattcacaa catcactgac 480
aaaagcctca aagacctaaa tatccttctc aacattccag gagtcccgcc gattccttcc 540
tccgatatgc cgcaaccgat tcttgaacga aacaacaaag tgtatgaaca gtgccaagaa 600
agctcaaagc agttcccgaa atcagctggg attatcgtaa acacgtttga atctctcgaa 660
cccagagctc tcagagcaat atgggacggt ctgtgcttga ccgagaacgt tccaactcca 720
ccggtctacc ccatcggacc gctgattgtt tcccacggcg gtggaggccg cggggccgag 780
tgtttgaaat ggctggactc acagccaagt ggaagcgtgg tgttcctctg ttttgggagc 840
ttgggattgt tttcaaagga gcagttgaag gaaattgcga ttgggttgga gaatagtggg 900
cacagatttt tgtgggtggt ccgtaatcct ccagcccaaa atcaaattgg gctggttatt 960
aaagagtccg atccggaatt gaaatctttg cttccggacg ggttcttgga tcggactaag 1020
gatcggggtc tggtggtcaa gtcatgggtc ccgcaagtgg cagtgttgaa tcacaactcg 1080
gtgggtgggt ttgtgagtca ttgcgggtgg aactcggtgt tggaatcggt gtgtgccggt 1140
gtgccgattg tgtcttggcc gctctacgcg gagcagagat taaatcgagt ggttttggtg 1200
gaggagatta agattgctat gccgatgaac gagtctgaag acgggtttgt gagagcagcg 1260
gaggtggaga agcgagttac ggagttgatg gactcggagg agggcgagtc gatcaggaag 1320
cgtacaaagg atttgcaaaa cgatgcccat gcagcattgg gtgagaccgg gtcgtctggg 1380
gttgcattta ctaaactact tgaattgtgg ggcaaaactg gttag 1425
<210> 16
<211> 1425
<212> DNA
<213> 三裂叶海棠
<300>
<308> GenBank MN381005
<309> 2020-08-07
<313> (1)..(1425)
<400> 16
atggaggcgg cagctatagt tttatatcca tcaccagtaa ttggccactt gatcgccatg 60
gtagagctag gcaagctcat aatcacccgc cacccttctc tgtgcatcca catcctcatc 120
accaccccgc cctaccgcgc caacgacacc gactcataca tcacctccgt ctccgctgcc 180
aacccttccc tcatcttcca ccacctcccc accatctccc tccctccctc cctcgcctcc 240
tcccgcaacc acgaaaccct aaccttcgga ctcgcccccc tcaacaaccc taacgtccac 300
caagccctcc tctccatctc ccacaacttc tccatcaaag cttttgtcat ggacttcttc 360
tgctctgtcg ggctccccat tgccaccgag ctgaacatcc ccagctactt cttcttcaca 420
tccagcgcca ccaccctcgc ttccttcctc tacctcccca ccattcacaa catcactgac 480
aaaagcctca aagacctaaa tatccttctc aacattccag gagtcccgcc gattccttcc 540
tccgatatgc cgcaaccgat tcttgaacga aacaacaaag tgtatgaaca gtgccaagaa 600
agctcaaagc agttcccgaa atcagctggg attatcgtaa acacgtttga atctctcgaa 660
cccagagctc tcagagcaat atgggacggt ctgtgcttga ccgagaacgt tccaactcca 720
ccggtctacc ccatcggacc gctgattgtt tcccacggcg gtggaggccg cggggccgag 780
tgtttgaaat ggctggactc acagccaagt ggaagcgtgg tgttcctctg ttttgggagc 840
ttgggattgt tttcaaagga gcagttgaag gaaattgcga ttgggttgga gaatagtggg 900
cacagatttt tgtgggtggt ccgtaatcct ccagcccaaa atcaaattgg gctggttatt 960
aaagagtccg atccggaatt gaaatctttg cttccggacg ggttcttgga tcggactaag 1020
gatcggggtc tggtggtcaa gtcatgggtc ccgcaagtgg cagtgttgaa tcacaactcg 1080
gtgggtgggt ttgtgagtca ttgcgggtgg aactcggtgt tggaatcggt gtgtgccggt 1140
gtgccgattg tgtcttggcc gctctacgcg gagcagagat taaatcgagt ggttttggtg 1200
gaggagatta agattgctat gccgatgaac gagtctgaag acgggtttgt gagagcagcg 1260
gaggtggaga agcgagttac ggagttgatg gactcggagg agggcgagtc gatcaggaag 1320
cgtacaaagg atttgcaaaa cgatgcccat gcagcattgg gtgagaccgg gtcgtctggg 1380
gttgcattta ctaaactact tgaattgtgg ggcaaaactg gttag 1425
<210> 17
<211> 1425
<212> DNA
<213> ‘Aotea’苹果
<300>
<308> GenBank MN381006
<309> 2020-08-07
<313> (1)..(1425)
<400> 17
atggaggcgg cagctatagt tttatatcca tcaccgctaa ttgggcactt agtctccatg 60
gtagagctag gcaagctcat actcacccgc cacccttctc tgtgcatcca catcctcatc 120
accaccccgc cctaccgcgc caacgacacc gactcataca tcacctccgt ctccgctgcc 180
aacccttccc tcatcttcca ccacctcccc accatctccc tccctccctc cctcgcctcc 240
tcccgcaacc acgaaatcct agccttcgaa ctcgcccccc tctacaaccc taacgtccac 300
caagccctcg tctccatctc ccacaacttc tccatcaaag cttttgtcat ggacttcttc 360
tgctatgtcg ggctccccgt tgccaccgag ctgaacatcc ccagctactt cttcttcaca 420
tccagcgcca acaccctcgc ttcctccctc tacctcccca cccttcacaa catcattgac 480
aaaagcctca aagacctaaa tatccttctc aacattccag gagtcccgcc gatgccttcc 540
tccgatatgc cgcaaccgac tcttgatcga aaccaaaaag tgtatgaaca tgtccaagga 600
agctcaaagc agttcccgaa atcagctggg attatcgtaa acacgtttga atctctcgaa 660
cccagagctc tcagagcaat atgggacggt ctgtgcttgc ccgagaacgt tccaactcca 720
ccggtctacc ccatcggacc gctgattgtt tcccatggcg gtggaggccg cggggccgag 780
tgtttgaaat ggctggactc acagccaagt ggaagcgtgg tgttcctctg ttttgggagc 840
ttgggattgt tttcaaagga gcagttgaag gaaattgcga ttgggttgga gaatagtggg 900
cacagatttt tgtgggtggt ccgtaatcct ccagcccaaa atcaaattgg gctggatatt 960
aaagagtccg atccggaatt gaaatctttg cttccggacg ggtttttgga tcggactaag 1020
gatcggggtc tcgtggtcaa gtcatgggcc ccgcaagcgg cagtgttgaa tcataactcg 1080
gtgggtgggt ttgtgagtca ttgcgggtgg aactcggtgt tggaatcggt gtgtgccggt 1140
gtgccgattg tggcttggcc gctctacgcg gagcagagat tcaatcgagt ggttttggtg 1200
aaggagatta agattgctat gccgatgaac gagtcagaag acgggtttgt gagagcagcg 1260
gaggtggaga agcgaattac ggagttgatg gactcggagg agggcgcgtc gatcaggaag 1320
cgtacaaagg atttgcaaaa caatgcccat gcagcattgg gtgagaccgg gtcgtctggg 1380
gttgcattga ctaaactact tgaattgtgg ggcaaaactg gttag 1425
<210> 18
<211> 1425
<212> DNA
<213> 栽培苹果
<400> 18
atggaggcga cagctatagt tttatatcca tcacctctaa ttgggcactt agtctccatg 60
gtagagctag gcaagctcat actcacccgc cacccttctc tgtgcatcca catcctcatc 120
accaccccgc cctaccgtgc caacgacacc gactcataca tcacctccgt ctccgccgcc 180
aacccttccc tcattttcca ccacctcccc accatctccc tccctccctc cctctccccc 240
tcccgcaacc acgaaacccc aatcttcgaa gtccttctcc tcaacaaccc ttacgtccac 300
caagccctcc tctccatctc ccacaacttc tccatcaaag cttttgtcat ggacttcttc 360
tgctctgtcg ggctccccat tgccaccgag ctgaacatcc ccagctactt cttcttcaca 420
tccagcgccg ccaacctcgc ttgcttcctc tacctcccca ccattcacag catcactgac 480
aaaagcctca aagacctaaa tatccttctc aacattccag gagtccagcc gattccttcc 540
tccgatatgc cgaaaccgat tcttgaacga aacaacaaag tgtatgaaca tttccaagaa 600
agctcaaagc agttcccgaa atcagctggg attatcgtaa acacgtttga atctctcgaa 660
cccagagttc tcagagcaat atgggacggt ctgtgcttga cggagaacgt tccaactcca 720
ccggtctacc ccatcggacc gctgattatt tcccatggcg gtggaggccg cggggccgag 780
tatttgaaat ggctggactc acagccaagt ggaagcgtgg tgttcctctg ttttgggagc 840
ttgggattgt tttcaaagga gcagttgaag gaaattgcga ttgggttgga gaatagtggg 900
cacagatttt tgtgggtggt ccgtaatcct ccagcccaaa atcaaattgg gctggctatt 960
aaagagtccg atccggaatt gaaatctttg cttccggacg ggttcttgga tcggactaag 1020
ggtcggggtc tcgtggtcaa gtcatgggcc ccgcaagtgg cagtgttgaa tcacaactcg 1080
gtgggtgggt ttgtgagtca ttgcgggtgg aactcggtgt tggaatcggt gtgtgccggt 1140
gtgccgattg tggcttggcc gctctacgcg gagcagagat tcaatcgagt ggttttggtg 1200
gaggagatta agattgctat gccgatgaac gagtcagaag acgggtttgt gagagcagcg 1260
gaggtggaga agcgagttac ggagttgatg gactcggagg agggcgagtc gatcaggaag 1320
cgtacaaagg atttgcaaaa cgatgcccat gcagcattgg gtgagaccgg gtcgtctcgg 1380
gttgcattta ctaaactact tgaattctgg ggcaaaacct gttag 1425

Claims (41)

1.一种产生具有增加的三叶苷含量的植物细胞或植物的方法,所述方法包括用编码具有SEQ ID NO:1到9中任一个的氨基酸序列的多肽或所述多肽的变体的多核苷酸转化植物细胞。
2.一种产生具有增加的4’-O-糖基转移酶活性的植物细胞或植物的方法,所述方法包括用编码具有SEQ ID NO:1到9中任一个的氨基酸序列的多肽或所述多肽的变体的多核苷酸转化植物细胞。
3.根据权利要求1或2所述的方法,其中所述变体具有4’-O-糖基转移酶活性。
4.根据权利要求1到3中任一项所述的方法,其中所述变体与具有SEQ ID NO:1到9中任一个的所述氨基酸序列的多肽具有至少70%序列同一性。
5.根据权利要求1到3中任一项所述的方法,其中所述多核苷酸编码具有与SEQ ID NO:1的所述序列具有至少85%同一性的氨基酸序列的多肽。
6.根据权利要求1到3中任一项所述的方法,其中所述多核苷酸编码具有SEQ ID NO:1的氨基酸序列的多肽。
7.根据权利要求1到6中任一项所述的方法,其中所述植物细胞或植物也用编码查耳酮合酶(CHS)或查耳酮合酶(CHS)和双键还原酶(DBR)的多核苷酸转化。
8.一种产生具有增加的三叶苷含量的植物细胞或植物的方法,所述方法包括用包含选自序列SEQ ID NO:10到18中任一个的核苷酸序列或其变体的多核苷酸转化植物细胞。
9.一种产生具有增加的4’-O-糖基转移酶活性的植物细胞或植物的方法,所述方法包括用包含选自序列SEQ ID NO:10到18中任一个的核苷酸序列或其变体的多核苷酸转化植物细胞。
10.根据权利要求8或9所述的方法,其中所述变体编码具有4’-O-糖基转移酶活性的多肽。
11.根据权利要求8到10中任一项所述的方法,其中所述变体包含与所述SEQ ID NO:10到18中任一个的核苷酸序列具有至少70%序列同一性的序列。
12.根据权利要求8到10中任一项所述的方法,其中所述变体包含与SEQ ID NO:10的核苷酸序列具有至少85%序列同一性的序列。
13.根据权利要求8到10中任一项所述的方法,其中所述多核苷酸包括SEQ ID NO:10的序列。
14.根据权利要求8到13中任一项所述的方法,其中所述植物细胞或植物也用编码查耳酮合酶(CHS)或查耳酮合酶(CHS)和双键还原酶(DBR)的多核苷酸转化。
15.一种产生具有增加的三叶苷含量或增加的4’-O-糖基转移酶活性的植物细胞或植物的方法,所述方法包括在所述植物细胞或植物中上调具有SEQ ID NO:1到9中任一个的氨基酸序列的多肽或所述多肽的变体的表达。
16.一种产生具有增加的三叶苷含量或增加的4’-O-糖基转移酶活性的植物细胞或植物的方法,所述方法包括在所述植物细胞或植物中上调包含选自序列SEQ ID NO:10到18中任一个的核苷酸序列或其变体的多核苷酸的表达。
17.根据权利要求15或16所述的方法,其中所述上调包括遗传工程。
18.根据权利要求15或16所述的方法,其中所述上调包括与表达包含氨基酸序列的多肽的植物杂交,所述多肽与具有SEQ ID NO:1到9中任一个的氨基酸序列的多肽具有至少70%序列同一性。
19.根据权利要求15或16所述的方法,其中所述上调包括与表达包含选自所述序列SEQID NO:10到18中任一个的核苷酸序列的多核苷酸的植物杂交。
20.根据权利要求15到19中任一项所述的方法,其中所述植物细胞或植物包含编码查耳酮合酶(CHS)或查耳酮合酶(CHS)和双键还原酶(DBR)的多核苷酸或也用所述多核苷酸转化。
21.一种遗传构建体,其包含编码具有SEQ ID NO:1到9中任一个的氨基酸序列的多肽或所述多肽的变体的多核苷酸。
22.一种遗传构建体,其包含多核苷酸,所述多核苷酸包含选自序列SEQ ID NO:10到18中任一个的核苷酸序列或其变体。
23.根据权利要求21或22所述的遗传构建体,其中所述遗传构建体进一步包含编码查耳酮合酶(CHS)和/或双键还原酶(DBR)的多核苷酸。
24.一种宿主细胞,其包含根据权利要求21到23中任一项所述的遗传构建体。
25.一种宿主细胞,其经遗传修饰以表达编码具有SEQ ID NO:1到9中任一个的氨基酸序列的多肽或所述多肽的变体的多核苷酸。
26.一种宿主细胞,其经遗传修饰以表达包含选自序列SEQ ID NO:10到18中任一个的核苷酸序列或其变体的多核苷酸。
27.根据权利要求24到26中任一项所述的宿主细胞,其中所述宿主细胞是细菌细胞、真菌细胞或酵母细胞、昆虫细胞、植物细胞或哺乳动物细胞。
28.一种用于生物合成三叶苷的方法,其包括在可供应到宿主细胞或可天然存在于所述宿主细胞中的根皮素存在下培养根据权利要求24到27中任一项所述的宿主细胞的步骤,所述宿主细胞能够表达4’-O-糖基转移酶。
29.一种产生三叶苷的方法,所述方法包括从根据权利要求24到27中任一项所述的宿主细胞中提取三叶苷。
30.一种植物细胞,其经遗传修饰以表达编码具有SEQ ID NO:1到9中任一个的氨基酸序列的多肽或所述多肽的变体的多核苷酸。
31.一种植物细胞,其经遗传修饰以表达包含选自序列SEQ ID NO:10到18中任一个的核苷酸序列或其变体的多核苷酸。
32.一种植物,其包含根据权利要求30或31所述的植物细胞。
33.一种用于选择具有改变的4’-O-糖基转移酶活性的植物的方法,所述方法包括针对编码具有SEQ ID NO:1到9中任一个的氨基酸序列的多肽或所述多肽的变体的多核苷酸的改变表达测试植物。
34.一种用于选择具有改变的4’-O-糖基转移酶活性的植物的方法,所述方法包括针对包含选自序列SEQ ID NO:10到18中任一个的核苷酸序列或其变体的多核苷酸的改变表达测试植物。
35.一种用于选择具有改变的三叶苷含量的植物的方法,所述方法包括针对编码具有SEQ ID NO:1到9中任一个的氨基酸序列的多肽或所述多肽的变体的多核苷酸的改变表达测试植物。
36.一种用于选择具有改变的三叶苷含量的植物的方法,所述方法包括针对包含选自序列SEQ ID NO:10到18中任一个的核苷酸序列或其变体的多核苷酸的改变表达测试植物。
37.一种通过根据权利要求1到20中任一项所述的方法产生的植物细胞或植物。
38.一种通过根据权利要求33到36中任一项所述的方法选择的植物细胞或植物。
39.一种通过根据权利要求1到20中任一项所述的方法产生的植物群或群体。
40.一种产生三叶苷的方法,所述方法包括从根据权利要求30、31、32、37或38中任一项所述的植物细胞或植物中提取三叶苷。
41.一种产生三叶苷的方法,所述方法包括使根皮素与UDP-葡萄糖和编码具有SEQ IDNO:1到9中任一个的氨基酸序列的多肽或所述多肽的变体的表达构建体或包含选自所述序列SEQ ID NO:10到18中任一个的核苷酸序列或其变体的多核苷酸的表达产物接触,以获得三叶苷。
CN202180024664.XA 2020-02-19 2021-02-19 糖基转移酶、编码这些糖基转移酶的多核苷酸及其使用方法 Pending CN115485377A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
NZ76187720 2020-02-19
NZ761877 2020-02-19
PCT/IB2021/051407 WO2021165890A1 (en) 2020-02-19 2021-02-19 Glycosyltransferases, polynucleotides encoding these and methods of use

Publications (1)

Publication Number Publication Date
CN115485377A true CN115485377A (zh) 2022-12-16

Family

ID=77391488

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180024664.XA Pending CN115485377A (zh) 2020-02-19 2021-02-19 糖基转移酶、编码这些糖基转移酶的多核苷酸及其使用方法

Country Status (8)

Country Link
US (1) US20230114811A1 (zh)
EP (1) EP4107260A4 (zh)
JP (1) JP2023514687A (zh)
CN (1) CN115485377A (zh)
AU (1) AU2021223171A1 (zh)
CA (1) CA3171655A1 (zh)
MX (1) MX2022010284A (zh)
WO (1) WO2021165890A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115341047B (zh) * 2021-10-26 2023-03-21 西北农林科技大学 一种与苹果属植物三叶苷有无性状相关的分子标记及应用
CN117417921A (zh) * 2023-10-19 2024-01-19 西北农林科技大学 蛋白酶在水解制备根皮素及植物抗虫中的应用

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NZ564691A (en) * 2007-12-21 2010-03-26 Nz Inst Plant & Food Res Ltd Glycosyltransferases, polynucleotides encoding these and methods of use
US10767187B2 (en) * 2016-03-09 2020-09-08 The State Of Israel, Ministry Of Agriculture & Rural Development, Agricultural Research Organization (Aro) (Volcani Center) Identification and characterization of UDP-glucose:phloretin 4′-O-glucosyl transferase from Malus x domestica Borkh

Also Published As

Publication number Publication date
CA3171655A1 (en) 2021-08-26
EP4107260A4 (en) 2024-03-27
MX2022010284A (es) 2022-10-20
WO2021165890A1 (en) 2021-08-26
JP2023514687A (ja) 2023-04-07
US20230114811A1 (en) 2023-04-13
EP4107260A1 (en) 2022-12-28
AU2021223171A1 (en) 2022-09-08

Similar Documents

Publication Publication Date Title
Sun et al. Chalcone isomerase a key enzyme for anthocyanin biosynthesis in Ophiorrhiza japonica
Feng et al. An R2R3-MYB transcription factor, OjMYB1, functions in anthocyanin biosynthesis in Oenanthe javanica
EP0746615B1 (en) Dna constructs, cells and plants derived therefrom
Sui et al. cDNA cloning and characterization of UDP-glucose: anthocyanidin 3-O-glucosyltransferase in Freesia hybrida
AU2008221696B2 (en) Transferases, epimerases, polynucleotides encoding these and uses thereof
US8859848B2 (en) Phloretin glycosyltransferases, polynucleotides encoding these and methods of use
CN115485377A (zh) 糖基转移酶、编码这些糖基转移酶的多核苷酸及其使用方法
WO2015017786A1 (en) Increasing leaf longevity and disease resistance by altering salicylic acid catabolism
US8110722B2 (en) Aromatic acyltransferase genes
US20040002105A1 (en) Methods of identifying genes for the manipulation of triterpene saponins
WO2016016826A1 (en) Methods and materials for manipulating phloridzin production
US20160108416A1 (en) Atsp1, an e3 ubiquitin ligase, and its use
US8273950B2 (en) Polynucleotides encoding phenylpropanoid and flavonoid biosynthetic pathway enzymes in coffee
WO2001005984A2 (en) Flavonoid biosynthesis
Xiao et al. Metabolic engineering of vitamin C production in Arabidopsis
KR102603683B1 (ko) 종자 식물 특이 익스텐신 모티브를 포함하는 단백질을 코딩하는 식물 생장조절 유전자 및 이의 용도
WO2006011815A2 (en) Phosphatases, polynucleotides encoding these and uses thereof
Tateno Investigation into the Cell Wall and Cellulose Biosynthesis in Model Species and in the C4 Model Plant Setaria viridis
Yoshihara et al. Molecular Characterization of cDNA Clones Encoding Flavanone 3-Hydroxylase from Dutch Iris (Iris× hollandica)
US20030073828A1 (en) Epimerase gene and use thereof

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination