CN112969785A - 纤维素合酶样酶及其用途 - Google Patents

纤维素合酶样酶及其用途 Download PDF

Info

Publication number
CN112969785A
CN112969785A CN201980072955.9A CN201980072955A CN112969785A CN 112969785 A CN112969785 A CN 112969785A CN 201980072955 A CN201980072955 A CN 201980072955A CN 112969785 A CN112969785 A CN 112969785A
Authority
CN
China
Prior art keywords
plant
cell
seq
derivative
metabolite
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980072955.9A
Other languages
English (en)
Inventor
A·阿哈罗尼
P·索纳韦恩
M·伊特金
A·乔兹维亚克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yeda Research and Development Co Ltd
Original Assignee
Yeda Research and Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US16/123,248 external-priority patent/US10806119B2/en
Priority claimed from IL268269A external-priority patent/IL268269A/en
Application filed by Yeda Research and Development Co Ltd filed Critical Yeda Research and Development Co Ltd
Publication of CN112969785A publication Critical patent/CN112969785A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H6/00Angiosperms, i.e. flowering plants, characterised by their botanic taxonomy
    • A01H6/82Solanaceae, e.g. pepper, tobacco, potato, tomato or eggplant
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8218Antisense, co-suppression, viral induced gene silencing [VIGS], post-transcriptional induced gene silencing [PTGS]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • C12N15/8247Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine involving modified lipid metabolism, e.g. seed oil composition
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • C12N9/1059Cellulose synthases (2.4.1.12; 2.4.1.29)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/01Hexosyltransferases (2.4.1)
    • C12Y204/01017Glucuronosyltransferase (2.4.1.17)

Abstract

本文提供了具有表达增加或减少的纤维素合酶样G(CSLG)酶的遗传修饰的细胞以及遗传修饰的植物。这些细胞和植物可以具有与相应的未修饰的细胞或植物相比,含量增加或减少的甾体生物碱、甾体皂苷或三萜皂苷。本文还提供在遗传修饰的细胞中生产甾体生物碱、甾体皂苷或三萜皂苷的方法;以及减少植物或植物部分的细胞中甾体生物碱、甾体皂苷或三萜皂苷的含量的方法;以及增加植物或植物部分的细胞中甾体生物碱、甾体皂苷或三萜皂苷的含量的方法。

Description

纤维素合酶样酶及其用途
相关申请的交叉引用
本申请要求于2018年9月6日提交的第16/123,248号美国专利申请的权益,该申请是于2015年12月1日提交的第14/895,059号美国专利申请的部分继续申请,而该第14/895,059号美国专利申请是国际申请日期为2014年6月2日的PCT国际申请PCT/IL2014/050497的国家阶段申请,该PCT国际申请要求于2013年6月5日提交的第61/831,164号美国临时申请的权益,所有这些专利申请均全文以引用方式并入本文中;并且本申请还要求于2019年7月25日提交的第268269号以色列专利申请的权益,该申请全文以引用方式并入本文中。
背景技术
植物界会产生成千上万种不同的小化合物,这些小化合物通常是对应植物属或植物科所特有的。通过其核心结构的各种修饰致使300,000多种植物特有代谢物(SM)产生大量的结构多样性。植物SM是最经常被糖基化的,并且这种糖基化会显著影响其区室化、活性、溶解性、稳定性和毒性。它们是低分子量含氮有机化合物,通常为杂环结构。
众多皂苷生物碱化合物广泛存在于植物中,并且来源于细胞溶质甲羟戊酸类异戊二烯生物合成途径。皂苷和甾体生物碱(SA)是两大类植物产生的SM。
皂苷是存在于无数个植物种及100多个植物科中的一大类SM,表示掺杂有一个或多个糖苷部分的亲脂性三萜或甾体主链(糖苷配基)。
如其名称中所暗示(拉丁语的sāpō意为肥皂),皂苷由于其两亲性结构而在水性溶液中呈现类似肥皂的性质。这些化合物的独特理化性质提供了广泛的在植物中的功能,包括抗真菌、抗菌和杀虫功能。皂苷的活性取决于糖苷配基的结构,但在许多情况下,甚至取决于所附着的糖。例如,齐墩果酸和苜蓿酸(medicagenic acid,MA)衍生的皂苷由于其C-28位置处存在羧基而呈现溶血活性,而燕麦碱A-1需要使其C-3位置处附着有L-阿拉伯糖而具有杀真菌功能。此外,胆固醇衍生的甾体皂苷广泛存在于植物界中,其结构高度多样化,并且在C-5,6位置可以是饱和的(例如,洋菝葜皂甙配基(sarasapogenin))或不饱和的(例如,薯蓣皂苷配基(diosgenin))。
大量报告中均强调了皂苷对人体健康和医疗应用的从抗炎和免疫增强(佐剂)到抗癌性质益处。碳水化合物活性酶(CAZY)糖基转移酶1(GT1)总科的UDP-糖基转移酶(UGT)成员对皂苷和所有其他SM类进行糖转移反应。掺杂皂苷的最常见糖类包括D-葡萄糖、D-半乳糖、L-阿拉伯糖、D-葡萄糖醛酸、D-木糖、L-鼠李糖和D-岩藻糖。
存在附着在皂苷配基C-3位置处的葡萄糖醛酸对于石竹目的种类特别常见,但是,所涉及的酶仍是未知的。
因此,产生包括三萜皂苷在内的皂苷的代谢途径中所涉及的酶的知识,包括将葡萄糖醛酸附着到例如皂皮酸的纤维素合酶样G的知识的需求仍然未得到满足。一旦已知,就可以在植物中调节关键酶,以改变天然产物的含量。例如,酶可能被过表达或具有更高的稳定性,从而产生数量增加的天然甜味剂,或酶可能在基因水平上被下调以减少为植物产品例如奎藜籽(quinoa)添加苦味的化合物的产生。此外,采用相关方法在异源系统生成这些皂苷,以便提供商业数量的高价值皂苷,例如但不限于三萜皂苷的需求仍然未得到满足。这些高价值皂苷可以用作例如但不限于甜味剂、发泡剂、乳化剂、防腐剂、抗癌剂、降血胆固醇制剂、抗炎剂、抗氧化剂、生物佐剂、杀菌剂、杀虫剂、拒食剂、抗真菌剂,或其任何组合。
此外,某些SM例如生物碱通常被称为次级代谢物,因为这些SM虽然对于产生该它们的细胞而言并不是不可或缺的,但有助于有机体的整体适应性。生物碱是低分子量的含氮有机化合物、通常具有杂环结构。在植物发育过程中并且响应于应激和病原体中,生物碱在植物中的生物合成受严格控制。
例如,已经发现甾体生物碱(SA)是许多植物科中的众多植物中的常见生物碱,由于其普遍存在于许多茄目(Solanales)成员中,有时也被称为“茄属生物碱”(Solanumalkaloids)。SA具有各种结构组成和生物活性。它们是胆固醇衍生的低分子量含氮有机化合物,通常具有由C-27胆甾烷骨架和杂环氮组分构成的杂环结构。
估计在在1350个种类的目中,茄属是开花植物的最大属之一,约占茄科(属于茄目(Solanales order))物种的一半。茄属物种包括食物植物,例如番茄(Solanumlycopersicum)、马铃薯(Solanum tuberosum)、南蛇藤(Solanum dulcamara)和茄子(Solanum melogena),并且茄科还包括辣椒属(例如胡椒)以及许多其他属。百合科植物中的许多物种也会产生甾体生物碱。因此,SA已成为广泛研究的主题(Eich E.,2008,《茄科和旋花科:次级代谢物:生物合成、化学分类学、生物学和经济意义(手册)》,柏林,Springer)。
鉴于SA由C-27胆甾烷骨架和杂环氮组分构成,因此建议采用胆固醇在细胞溶质中来合成SA。胆固醇向氨基醇SA的转化需要若干次羟基化、氧化和氨基转移反应(Eich 2008,同上),并且在大多数情况下,还需要进一步糖基化以形成甾体糖苷生物碱(SGA)(ArnqvistL.等,2003年,《植物生理学》(Plant Physiol.)第131期第1792-1799页)。SA的糖基化产生甾体糖苷生物碱(steroidal glycoalkaloids)(SGA),其中添加的寡糖部分组分直接缀合到氨基醇甾体骨架(糖苷配基)的C-3-β(C-3β)处的羟基。SGA的生物合成取决于编码UDP-糖基转移酶(UGT)的基因,该酶采用各种寡糖部分,包括D-葡萄糖、D-半乳糖、L-鼠李糖、D-木糖和L-阿拉伯糖(其中前两个单糖是主要单元)来修饰糖苷配基。
SGA是由许多茄科成员以及许多其他植物科产生的。这些化合物的实例包括番茄(Solanum lycopersicum)中的α-番茄素和脱氢番茄素、马铃薯(Solanum tuberosum)中的α-查茄碱和α-茄碱,以及茄子(Solanum melongena)中的α-澳洲茄边碱和α-澳洲茄碱。SGA也于各类辣椒属胡椒中发现。现已从番茄中鉴定出100多种SGA(Itkin等人,2011年,《植物细胞》(Plant Cell)第23期第4507-4525页),并且已从马铃薯中鉴定出50多种SGA(Shakya和Navarre,2008年,《农业与食品化学杂志》(J.Agric.Food Chem.)第56期第6949-6958页)。茄子也含有至少一种SGA(Friedmann,2006年,《农业与食品化学杂志》(J.Agric.FoodChem.)第54期第8655-8681页)。
SA和SGA在保护植物免受各种病原体中发挥作用,并被称为植物抗菌素(phytoanticipins)(抗菌化合物)。SGA有助于植物抵抗多种病原体和捕食者,包括细菌、真菌、卵菌、病毒、昆虫和大型动物。由于其毒性作用,植物可食部分中的某些SGA对人类和其他哺乳动物而言被认为是抗营养化合物。例如,SGAα-查茄碱和α-茄碱是马铃薯中的主要有毒物质,可能引起胃肠道和神经系统疾病,并且在高浓度下对人类可能是致命的。毒性机理包括破坏膜以及抑制乙酰胆碱酯酶活性(Roddick J.G.,1989年,《植物化学》(Phytochemistry)第28期第2631-2634页)。出于此原因,超过200mg/kg可食用块茎的鲜重的SGA总水平被认为对人类食用是不安全的。
人们不断试图阐明甾体生物碱的生物合成途径并控制甾体生物碱的产生。美国专利5,959,180中公开了来自马铃薯的DNA序列,其编码酶:茄啶UDP-葡萄糖:葡糖基转移酶(SGT)。还公开了用于抑制茄科植物例如马铃薯中SGT的产生,从而降低糖苷生物碱水平的装置和方法。
类似地,美国专利7,375,259和7,439,419中公开了来自马铃薯的核酸序列,其分别编码以下酶:UDP-葡萄糖:茄啶葡糖基转移酶(SGT2)和β-茄碱/β-查茄碱鼠李糖基转移酶(SGT3)。还描述了含有该序列的重组DNA分子及其用途,确切地说,使用所述序列和反义构建体来抑制SGT2/SGT3的生成,从而降低茄科植物例如马铃薯中主要甾体糖苷生物碱,即α.-查茄碱和α-茄碱的水平的用途。
近期还确定了番茄甾体生物碱代谢(糖苷生物碱代谢1-3(GAME1-3))中假定涉及的三种糖基转移酶。更具体地说,GAME1表达的改变修饰了番茄植物中再生性部分和植物性部分这两部分中的SA概况。由此可见,这些基因通过生成番茄四糖(lycotetrose)部分而部分地参与番茄碱(α-番茄素前体)的代谢中(Itkin等,2011年,同上)。
国际专利申请公开案WO 00/66716中公开了一种生成转基因有机体或细胞的方法,所述转基因有机体或细胞包含编码固醇糖基转移酶的DNA序列。转基因有机体包括与野生型有机体或细胞相比,呈现出增加的甾体糖苷、甾体生物碱和/或固醇糖苷生成的细菌、真菌、植物和动物。合成的化合物可用于制药和食品工业以及植物保护。
美国专利申请公开案2012/0159676中公开了一种编码衍生自属于茄科的植物例如马铃薯(Solanum tuberosum)的糖苷生物碱生物合成酶的基因。还公开了一种使用编码该蛋白质的基因来产生/检测新型有机体的方法。
美国专利申请公开案2013/0167271和国际申请公开案WO 2012/095843涉及甾体皂苷和甾体生物碱的生物合成中的关键基因,和涉及改变甾体皂苷和甾体生物碱的基因表达和生成的装置和方法。
本发明的发明人在本发明优先权日之后公开的论文描述了参与SGA生物合成的10个基因的阵列。所述基因中的5-7个基因被发现以簇的形式存在于7号染色体上,而另外两个临近地存在于12号染色体的重复基因组区域中。经过系统的功能分析,提出了一种新的SGA生物合成途径,此途径始于胆固醇,直至连接到番茄SGA糖苷配基的四糖部分(Itkin M.等人,2013年,《科学》(Science)第341(6142)期第175-179页)。
还已经发现植物胆固醇的生物合成途径与植物固醇代谢是重叠的(Sonawane等人,2016年,《自然植物》(Nat.Plants)第3期第16205页)。例如,胆固醇(((3-β)-胆甾-5-en-3-ol)是固醇(或经修饰的甾体),一类由所有动物细胞生物合成,作为所有动物细胞膜的必要结构组分、并且对膜结构完整性和流动性至关重要,从而使得动物细胞能够在没有细胞壁的情况下发挥功能的脂质分子。它也是甾体激素、胆汁酸和维生素D以及皂苷、SA和SGA的生物合成前体。胆甾烷醇(5-β-胆甾烷-3-β-醇;粪甾醇;5-β-粪甾醇)是存在于粪便和其他生物物质中的胆固醇衍生物。胆固醇是27碳甾烷醇,是通过胆固醇的转化在大多数高等动物(鸟类和哺乳动物)的肠道中通过胆固醇的生物氢化作用而形成的。
植物产生的胆固醇非常少,但还会制造植物固醇(包括植物固醇和植物甾烷醇,类似于胆固醇和胆甾烷醇),其可以与胆固醇竞争在肠道中的重吸收,从而可能减少胆固醇的重吸收。胆固醇通常用于制造药品、化妆品和其他应用中。对于生成更高水平的植物固醇和植物基胆固醇的兴趣日益浓厚。
例如,在番茄(例如Solanum lycopersicum、Solanum pennellii))中,α-番茄素和脱氢番茄素代表主要累积在绿色组织;嫩叶和成熟叶、花芽、表皮和未成熟与成熟绿色果实种子中的主要SGA。脱氢番茄碱(即番茄登醇(tomatidenol))是SGA生物合成中形成的第一SA糖苷配基,其可以在C-5位置处进一步氢化以形成番茄碱。两种糖苷配基都进一步被糖基化(四糖部分,即番茄四糖),以分别产生脱氢番茄素和α-番茄素。因此,SGA途径在脱氢番茄碱上分支,以形成番茄碱衍生SGA或糖基化脱氢番茄素衍生物。值得注意的是,脱氢番茄碱和番茄碱在结构上的不同之处仅为C-5位置处是否存在双键。过去假设脱氢番茄碱向番茄碱的转化是在假定氢化酶的催化下发生的单个反应。在大多数番茄植物组织中,脱氢番茄素与α-番茄素相比,其相对比例为约2.5%到约10%。随着番茄果实成熟并且达到红色阶段,整个α-番茄素和脱氢番茄素库在很大程度上分别转化为七叶皂苷(esculeosides)(主要SGA)和脱氢七叶皂苷(dehydroesculeosides)(次要SGA)。
在栽培的马铃薯(例如Solanum tuberosum)中,α-查茄碱和α-茄碱是拥有相同糖苷配基、茄啶(其中存在C-5,6双键)的主要SGA,并且分别拥有马铃薯三糖和茄三糖部分。由于在栽培马铃薯中未检测到垂茄啶或垂茄碱,因此表明这些物种中缺少能够将茄啶转化为垂茄啶的氢化酶。预计含有活性氢化酶的多种野生马铃薯物种(例如,S.demissum、S.chacoense、S.commersonii)及其体细胞杂种(S.brevidens X S.tuberosum)的确可产生垂茄啶或其糖基化形式,其中垂茄碱是其主要SGA之一。
在茄子(例如Solanum melongena)中,α-澳洲茄边碱和α-澳洲茄碱是衍生自澳洲茄次碱糖苷配基(其中存在C-5,6双键)的最丰富的SGA;而一些野生茄属种植物中,例如欧白英(S.dulcamara,南蛇藤)产生蜀羊泉次碱(soladulcidine)或其糖基化形式、蜀羊泉碱A(soladulcine A)和β-蜀羊泉碱(不存在C-5,6双键),作为澳洲茄次碱糖苷配基的主要SGA。
除了SGA以外,许多茄属物种(例如茄子)也会生成胆固醇衍生的不饱和或饱和甾体皂苷。不饱和及饱和甾体皂苷普遍存在于植物界,尤其是单子叶植物,例如龙舌兰科(例如龙舌兰和丝兰)、天门冬科(例如芦笋)、薯蓣科和百合科植物中。与SGA相似,甾体皂苷在结构上是高度多样的,并且在C-5,6位置处可以是饱和的(例如洋菝葜皂甙配基)或不饱和的(例如薯蓣皂苷配基)。
胆固醇是所有动物产生的主要固醇,作为SGA生物合成的关键构造块。近年来,报道了参与始于胆固醇的核心SGA生物合成的一系列番茄和马铃薯糖生物碱代谢(GAME)基因。番茄SGA的生物合成途径可分为两个主要部分。首先,SA糖苷配基在GAME6酶、GAME8酶、GAME11酶、GAME4酶和GAME12酶的可能作用下从胆固醇形成。第二部分通过UDP-糖基转移酶(UGT)的作用而生成SGA:番茄中的GAME1、GAME2、GAME17和GAME18,以及马铃薯中的固醇生物碱糖基糖基转移酶1(SGT1)、SGT2和SGT3。
因此,产生包括三萜皂苷在内的皂苷的代谢途径中所涉及的酶,包括将葡萄糖醛酸附着到例如皂皮酸的纤维素合酶样G酶的知识的需求仍然未被满足。一旦已知,就可以在植物中调节关键酶,以改变天然生产产物的含量。例如,酶可能被过表达或具有更高的稳定性,从而产生数量增加的天然甜味剂,或酶可能在基因水平上被下调以减少化合物的产生,从而为植物产品例如奎藜籽添加苦味。此外,采用相关方法在异源系统生成这些皂苷,以便提供商业数量的高价值皂苷,例如但不限于三萜皂苷的需求仍然未得到满足。这些高价值皂苷可以用于例如但不限于用作甜味剂、发泡剂、乳化剂、防腐剂、抗癌剂、降血胆固醇制剂、抗炎剂、抗氧化剂、生物佐剂、杀菌剂、杀虫剂、拒食剂、抗真菌剂,或其任何组合。
此外,对更高食品数量和更高质量食品的需求持续增长。对改善营养品质以及消除抗营养性状的需求仍较高。在作物驯化过程中,可通过育种降低抗营养物质的含量。但是,许多作物仍然含有大量抗营养物质,尤其是甾体糖苷生物碱。
或者,操纵这些SGA合成的能力将提供通过经典育种或基因工程开发SGA水平和组成得到修饰的作物的方法,从而使植物具有抵御各种昆虫和其他病原体的内源化学屏障。
另外,既存在对基于植物的胆固醇的需求,同时反之,也存在对植物甾醇或其他植物固醇水平增加的植物的需求。
因此,还存在对控制有有益效果,特别是治疗效果的皂苷、甾体生物碱和甾体糖苷生物碱的产生的装置和方法的需求,并且这样将是极为有利的。
下文提供的公开内容满足这些未满足的需求,其通过在一些实施方案中描述至少关于植物SM,更确切地说皂苷,不仅仅被UGT 1族酶糖基化的知识。以其在初生细胞壁生物合成中的作用而闻名的纤维素合酶(CESA)相关蛋白质似乎可以使葡萄糖醛酸附着在皂苷的C-3位置。通过使纤维素合酶样(CSL)酶新功能化以拥有三萜糖基转移酶活性的新形式的代谢进化伴随着其亚细胞定位的改变,将其导向至内质网(ER)。此蛋白质的修饰还导致对甾体皂苷和甾体糖苷生物碱的生成的严格控制,而基因沉默导致胆固醇库的累积。
本文以下提供的公开内容也满足这些未得到满足的需求,其在一些实施方案中描述至少关于将胆固醇转化成甾体皂苷、三萜皂苷、甾体生物碱和甾体糖苷生物碱的生物合成途径中的关键基因和酶的知识。
发明内容
根据一个方面,本文提供一种遗传修饰的细胞,所述遗传修饰的细胞与相应的未修饰的细胞相比,具有表达增加的至少一种异源基因,所述至少一种异源基因编码纤维素合酶样G(CSLG)酶,其中所述遗传修饰的细胞包含与相应的未修饰的细胞相比,含量增加的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体。
根据另一个方面,本文提供一种遗传修饰的植物,所述遗传修饰的植物包含与相应的未修饰的植物中的CSLG的表达相比,具有至少一种纤维素合酶样G(CSLG)基因表达改变的至少一种细胞,并且其中所述遗传修饰的植物与相应的未修饰的植物相比,具有含量改变的至少一种甾体生物碱、其衍生物、其代谢物;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体。
根据又一个方面,本文提供一种在遗传修饰的细胞中生产甾体生物碱、甾体皂苷或三萜皂苷的方法,所述方法包含:(a)将至少一种异源基因引入所述细胞中,所述至少一种异源基因编码纤维素合酶样G(CSLG)酶,其中所述异源基因任选地被包含在载体中;以及(b)在所述细胞中表达所述至少一种异源基因;其中所述细胞包含与相应的未修饰的细胞相比含量增加的至少一种甾体生物碱、至少一种甾体皂苷或至少一种三萜皂苷。
根据又一方面,本文提供一种降低至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体在植物或植物部分的至少一种细胞中含量的方法,所述方法包含对所述至少一种植物细胞进行遗传修饰,所述遗传修饰包含:(a)使用靶向编码纤维素合酶样G(CSLG)酶的核酸基因序列的至少一种沉默分子来转化所述至少一种植物细胞;或(b)诱变编码纤维素合酶样G(CSLG)酶的至少一个核酸序列,其中所述诱变包含(1)将一个或多个点突变引入所述核酸序列中,(2)将缺失引入所述核酸序列内;或(3)将插入引入所述核酸内,或(4)其任何组合,其中所述引入包含对编码或非编码序列进行诱变;其中编码所述CSLG酶的基因的表达与其在相应的未修饰的植物细胞中的表达相比,在所述遗传修饰的植物细胞中降低,其中包含所述遗传修饰的细胞的所述植物包含与相应的未修饰的植物相比,含量减少的以下物质:至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体。
根据又一方面,本文提供一种提高至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体在植物或植物部分的至少一种细胞中含量的方法,所述方法包含对所述至少一种植物细胞进行遗传修饰,所述遗传修饰包含:(a)诱变编码纤维素合酶样G(CSLG)酶的至少一个核酸序列,其中所述诱变包含(1)将一个或多个点突变引入所述核酸序列中,(2)在所述核酸序列内引入缺失;或(3)在所述核酸内引入插入,或(4)引入其任何组合,其中所述引入包含对编码或非编码序列进行诱变;以及(b)表达编码所述CSLG的所述核酸;其中包含所述遗传修饰的细胞的所述植物包含与相应的未修饰的植物相比,含量增加的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体。
附图说明
说明书结论部分中特别指出并明确要求保护与生成甾体糖苷生物碱、甾体皂苷和三萜皂苷的方法及其用途相关的主题。但是,所述生成甾体糖苷生物碱、甾体皂苷和三萜皂苷的方法及其用途就其结构和操作方法以及其目的、特征和优点而言,可以通过参考可结合以下附图阅读的下述详细说明而被最好地理解:
图1示出在茄科植物中的三萜生物合成途径中,从胆固醇到α-番茄素的甾体糖苷生物碱的所提出生物合成途径。虚线箭头和实线箭头分别表示此途径中的多个或单个酶促反应。
图2中汇总了茄科植物中甾体生物碱相关基因的共表达分析。对于来自番茄(SlGAME1和SlGAME4)和马铃薯(StSGT1和StGAME4)的“饵(baits)”共表达的基因的共用同源物(homologs)。实线(r值>0.8)和虚线(r值>0.63)连接共表达的基因。*,位于番茄或马铃薯7号染色体簇中。St:马铃薯(Solanum tuberosum),Sl:番茄(S.lycopersicum)。基因名称的背景对应于被发现与其共表达的饵(上文的图例)。SP:丝氨酸蛋白酶(serineproteinase);PI:蛋白酶抑制因子(proteinase inhibitor);UPL:泛素蛋白连接酶(ubiquitin protein ligase);ELP:类伸展素蛋白(extensin-like protein);PK:蛋白激酶(protein kinase);SR:固醇还原酶(sterol reductase);RL:受体样(receptor-like)。
图3示出在番茄和马铃薯的重复基因组区域中鉴定的基因及其共表达的示意图。与作为饵的GAME1/SGT1(7号染色体)和GAME4(12号染色体)一起在马铃薯或番茄中的共表达以热图的形式呈现(表5-8)。特定的基因族用深色箭头指示,而其他基因族成员用白色箭头指示。
图4A-4H示出番茄GAME基因的功能分析。(图4A)与野生型相比,GAME8沉默的转基因(RNAi)叶中累积了22-(R)-羟基胆固醇。(图4B)一系列胆固醇型甾体皂苷(STS)在GAME11VIGS沉默的叶中累积。(图4C)STS(m/z=753.4)在GAME12 VIGS-叶中累积。(图4D)番茄碱,即甾体生物碱糖苷配基,在GAME1-沉默的转基因叶中累积。(图4E图4H)4种重组番茄GAME糖基转移酶的酶活性测定。
图5A-5D示出与野生型植物相比,GAME9表达改变的马铃薯植物系块茎果皮中的茄碱/查茄碱水平。GAME9沉默植物块茎中的茄碱(图5A)和查茄碱(图5B)水平;GAME9过表达植物块茎中茄碱(图5C)和查茄碱(图5D)水平。
图6示出与野生型植物相比,具有沉默(RNAi)或过表达(OX)GAME9的马铃薯植物系叶中的茄碱/查茄碱水平。
图7示出与野生型植物相比,GAME9沉默(RNAi,品系5871)或过表达(OX,品系5879)的番茄植物系叶中的番茄碱水平。
图8A-8D示出番茄中GAME11双加氧酶沉默的作用。(图8A)叶中的α-番茄素水平(m/z=1034.5);(图8B)叶中的胆甾烷醇型甾体皂苷(STS)(m/z=1331.6,1333.6,1199.6,1201.6(主要皂苷))。(图8C)m/z=1331.6的MS/MS谱(在19.28分钟)。(图8D)在19.28分钟洗脱、并且在GAME11-沉默叶中累积的皂苷的碎裂过程图形。对应的质量信号在图8C的MS/MS色谱图中以星号标示。
图9A-9E示出从GAME18-沉默的成熟绿色番茄果实中提取的代谢物。示出了对应于γ-番茄素标准品(m/z=740.5)(图9A-C)和γ-番茄素戊糖苷(m/z=872.5)(图9D-E)的新累积化合物的峰。
图10A-10D示出番茄中GAME12转氨酶的沉默作用。(图10A)呋喃甾醇型STS的累积。(图10B到10C)GAME12沉默的叶累积STS(m/z=753.4),而其在WT叶中仅少量存在。(图10D)m/z=753.4在19.71分钟时的MS/MS谱,并具有相关碎片的解释。
图11A-11D示出GAME8在番茄植物中的沉默作用。GAME8-沉默的叶累积了22-(S)和-(R)-胆固醇(图11A)。其中示出化合物的通过EI-GC/MS采集的色谱图(质量范围172.5-173.5)、MS谱和结构(三甲基硅烷基衍生物)。使用22-(R)-(图11B)和22-(S)-胆固醇(图11C)的商业标准品来验证推定的标识。(图11D)与WT(Q)相比,GAME8-沉默的品系中累积两种异构体。
图12示出植物CYP450蛋白家族中GAME基因的系统树。分支上的数字表示支持每个节点的引导程序迭代的比例。
图13示出一种提出的茄科植物中的扩展生物合成途径,该生物合成途径始于环阿乔醇(Cycloartenol,第I部分),经由胆固醇(第II部分)、番茄碱(第III部分)、甾体糖苷生物碱,包括α-番茄素,直到Lycoperosides/七叶皂苷(第IV部分)。虚线箭头表示此途径中的多个酶促反应。
图14A-14D示出(A)番茄、(B)马铃薯和(C)茄子中SGA生物合成的概况。图14D示出茄科植物中从番茄碱到番茄碱3-O-葡萄糖醛酸苷的SGA生物合成途径的提议部分,其中GAME15纤维素合酶样G酶催化在番茄碱的羟基位置处的葡萄糖醛酸添加。
图15A-15C示出通过LC-MS测定的野生型(未转化)和GAME15-RNAi番茄品系中的(A)叶、(B)绿色果实和(C)红色果实中的主要SGA的水平。#21、#22和#23是三个独立的GAME15-RNAi转基因番茄品系。值表示三次生物学重复的平均值±标准误差。星号表示通过学生t检验计算出的野生型样本存在显著变化(*P值<0.05;**P值<0.01;***P值<0.001)。
图16示出通过LC-MS测定的GAME15-RNAi品系叶中α-茄碱和α-查茄碱的含量。#1、#2和#3是三个独立的GAME15i转基因马铃薯品系。值表示平均值±标准误差(n=3)。采用学生t检验来评估转基因品系与野生型植物之间是否存在显著差异(*P值<0.05;**P值<0.01;***P值<0.001)。
图17示出来自GAME15沉默植物的番茄叶的胆固醇含量。值代表三次生物学重复的平均值±标准误差。星号表示通过学生t检验计算出的,三个独立转基因(#21、#22和#23)叶与野生型(即,未转化)叶相比存在显著变化(*P值<0.05;**P值<0.01;***P值<0.001)。采用表胆固醇作为样品制备中的内标品,并且将相对胆固醇水平表示为样品中胆固醇峰值面积与内标品的比率。使用GC-MS进行分析。
图18是菠菜皂苷的液相色谱-电喷射离子化-四极飞行时间质谱(LC-ESI-QTOF-MS)扫描。上部的扫描示出以负离子模式采集的菠菜叶提取物的总离子色谱图(TIC)。以红色显示的色谱片段用于表明样品中存在皂苷。下部的扫描示出色谱图的扩展区域,其中主要皂苷已编号。这些数字代表实施例15中的表13中所列的不同Yossoside。
图19A-19P中提供Yossoside IV的串联质谱(MS/MS)结果和结构(图19A-19D);Yossoside Va的串联质谱(MS/MS)结果和结构(图19E-19G);Yossoside V的串联质谱(MS/MS)结果和结构(图19H-19J);Yossoside IX的串联质谱(MS/MS)结果和结构(图19K-19M);以及Yossoside X的串联质谱(MS/MS)结果和结构(图19N-19P)。示出结果和结构的MS/MS数据的详细信息如下:(图19A)源自[M-H]11963.56=-m/z范围300-1300的质谱片段;(图19B)源自葡萄糖醛酸残基裂解、-m/z范围为50-1900的质谱片段;(图19C)Yossoside IV的结构,箭头指示碎裂过程图形;(图19D)列举源自与MA结合的葡萄糖醛酸的碎裂的MS/MS峰的指定的表;(图19E)源自[M-H]1305.57190=-m/z范围300-1400的质谱片段;(图19F)源自葡萄糖醛酸残基的裂解、-m/z范围为50-1900的质谱片段;(图19G)Yossoside Va的结构,箭头指示碎裂过程图形。乙酰基的位置(以红色突出显示)是推定的。(图19H)源自[M-H]1305.5737=-m/z范围300-1400的质谱片段;(图19I)源自葡萄糖醛酸残基的裂解、-m/z范围为50-1900的质谱片段;(图19J)Yossoside V的结构,箭头指示碎裂过程图形;(图19K)源自[M-H]1407.6060=-m/z范围300-1500的质谱片段;(图19L)源自葡萄糖醛酸残基的裂解、-m/z范围为50-1900的质谱片段;(图19M)Yossoside IX的结构,箭头指示碎裂过程图形。戊糖的附着结构和位置是推定的;(图19N)源自[M-H]1437.6150=-m/z范围300-1500的质谱片段;(图19O)源自葡萄糖醛酸残基的裂解、-m/z范围为50-1900的质谱片段;(图19P)Yossosidex的结构,箭头指示碎裂过程图形。戊糖的结构和附着是推定的。
图20A-20C示出菠菜皂苷的生物合成途径,该菠菜皂苷包含共表达的皂苷β-香树素合酶(SOAP)基因。(图20A)致使Yossoside V生成的完整生物合成途径;附着在C-20位置处的含有葡萄糖醛酸的乙酰化的三萜皂苷(红色突出显示)。SOAP酶活性的每种产物均以绿色突出显示。SOAP酶是菠菜中皂苷生成中所涉及的酶。(图20B)基因共表达网络。红色的圆点表示饵(SOAP1、SOAP2和SoCYP716A268v2),带有绿色圆点的圆圈表示与所有饵共表达的基因。放大且带注释的点表示菠菜中通过病毒诱导的基因沉默(VIGS)而沉默的基因。(图20C)与来自与仅表达SOAP1-20的植物、仅表达SOAP1-2的植物以及对照植物(用毛根土壤杆菌浸润的植物,带有空载体-EV)相比,瞬时表达SOAP1-4的植物的齐墩果酸、奥古斯丁酸和苜蓿酸的提取离子色谱图(EIC)[m/z=455.205(OA);m/z=471.205(AA);m/z=501.202(MA);阴离子模式]。
图21呈现Yossoside v的氢的重要异核多键(HMBC)相关性。黑色箭头表示Yossoside v的六个甲基的HMBC相关性。红色箭头表示其他重要氢的HMBC相关性。数字对应于苜蓿酸和糖部分中的碳原子。有关更多详细信息,请参见表1。表1列出了汇总在分为两部分的表格中的光谱数据。第一部分对应于苜蓿酸的原子(糖苷配基部分),而第二部分对应于糖部分的原子。图21和图35D分别示出了Yossoside v具有编号原子的苜蓿酸3-O-葡萄糖醛酸苷的结构。在表1中:ax(轴向)和eq(赤道方向)描绘了糖苷配基和糖的环状结构中的质子。
表1:Yossoside V(3-O-[β-D-木糖吡喃糖基-(1->3)-β-D-葡萄糖醛酸吡喃糖基]-28-O-[β-D-葡糖吡喃糖基-(1->4)-α-L-鼠李糖吡喃糖基-(1->2)-4-乙酰基-β-D-岩藻糖呋喃糖基]-苜蓿酸)和苜蓿酸-3-O-葡萄糖醛酸苷的1H和13C NMR频谱数据。
Figure BDA0003051611980000081
Figure BDA0003051611980000091
Figure BDA0003051611980000101
图22A和22B示出,参与糖苷配基生物合成的第一步中的基因以彼此接近的方式位于染色体上。(图22A)具有齐墩果酸生物合成中所涉及的基因的染色体区域的示意图。半透明的灰色框含有SOAP1(bAS)(SEQ ID NO:422)、CYP716A268(SOAP2;SEQ ID NO:46)及其截短重复CYP716A268v2(SEQ ID NO:47)。深灰色标记的基因不直接参与三萜皂苷的生物合成。(图22B)五个菠菜转录组中SOAP1、SOAP2和CYP716A268v2的表达谱;SO4WOLLD-来自长日照下生长的四周龄植物的成熟叶;SO8WOLSL-来自短日照下生长的八周龄植物的成熟叶;SO4WYLLD-来自长日照下生长的四周龄植物的嫩叶;SO8WOLSL-来自短日照下生长的八周龄植物的嫩叶;SO4WFBLD-来自长日照下生长的四周龄植物的花芽。有关详细信息,请参见“材料和方法”。
图23A-图23D呈现通过菠菜中的沉默(VIGS)来提供SOAP1(bAS)和SOAP2(CYP7123A2238)的功能表征的数据。(图23A)在具有沉默的镁螯合酶亚单位H(CHLH)的植物中观察到的萎黄病表型。采用CHLH作为VIGS基因沉默的对照和标志物。通常,该基因与SOAP基因和皂苷生物合成不直接相关。EV代表空载体,并且代表对照叶。(图23B)沉默植物中SOAP1和SOAP2表达的实时qPCR分析。数值(±SD)表示三次独立生物学实验的平均值。其中示出与对照植物(CHLH沉默)相比的统计学显著差异;***P<0.001。(图23C)来自具有与对照(CHLH)相比静默的SOAP1或SOAP2的植物的P-香树素[m/z=218,主片段]的对准气相色谱-质谱(GC-MS)提取离子色谱图(EIC)。仅在具有沉默SOAP2的植物中检测到P-香树素,而该沉默SOAP2的进一步转化被阻止。(图23D)来自具有与对照(CHLH)相比静默的SOAP1或SOAP2的植物的Yossoside IV的对准液相色谱-质谱(LC-MS)EIC[m/z=12233.23,(-)-模式]。Yossoside IV的含量在SOAP1和SOAP2沉默品系中分别降低到40%和30%。
图24A和24B呈现了通过在本塞姆氏烟草(N.benthamiana)中的异源表达提供SOAP1(bAS;SEQ ID NO:45)和SOAP2(CYP2416A268;SEQ ID NO:46)的功能表征的数据。(图24A)与单独空载体(EV)和真实标准品相比的SOAP1瞬时表达中所产生的p-香树素的对准GC-MS提取离子色谱图(EIC)[m/z=218,主片段]。仅来自植物原位(in planta)实验的色谱图是按比例绘制的。(图24B)通过具有与单独空载体(EV)和真实标准品相比的SOAP1和SOAP2瞬时表达产生的齐墩果酸的对GC-MS EIC[m/z=203,主碎片]。仅来自植物原位实验的色谱图是按比例绘制的。有关GC-MS分析的详细信息,请参见“材料和方法”。
图25呈现了示出具有(VIGS)沉默的细胞色素P450候选基因的菠菜中的选定皂苷的液相色谱-质谱(LC-MS)分析。具有沉默SOAP3(CYP72A655;SEQ ID NO:51)、SOAP4(CYP72A654;SEQ ID NO:53)和另外三种其他CYP(p450细胞色素基因)的植物中的选定皂苷化合物的相对含量(标准化峰值面积);有关登录号,请参见表11。数值(±SD)表示三次独立生物学实验的平均值。其中示出与对照植物(CHLH沉默)相比的统计学显著差异;*P<0.05、**P<0.01。
图26A-26L示出细胞色素P450基因(VIGS)沉默后累积在菠菜中的皂苷的特征。(图26A、26D、26G和26J)具有沉默SOAP3(CYP72A655;SEQ ID NO:51)、SOAP4(CYP72A654;SEQ IDNO:53)和另外三种细胞色素P450基因的菠菜叶中的选定三萜皂苷化合物的相对含量(标准化峰面积);有关登录号,请参见表11。数值(±SD)表示三次独立生物学实验的平均值。其中示出与对照植物(CHLH沉默)相比的统计学显著差异;*P<0.05、**P<0.01。AA-奥古斯丁酸(图26B、26E、26H和26K)串联质谱(MS/MS)频谱,带有标记的主碎片。(图26C、26F、26I和26L)基于精确质量测量、碎裂过程图形和文献的推定皂苷化合物结构。有关更多详细信息,请参见表16。
图27呈现了具有沉默CYP P450的菠菜植物中皂苷糖苷配基的GC-MS分析。从与对照品(CHLH沉默)和真实齐墩果酸和苜蓿酸标准品相比,仅具有沉默SOAP3、仅具有SOAP4和仅具有CYP2的植物中所累积的皂苷中释放的三萜糖苷配基的EIC[m/z=203和262;所有香树素型糖苷配基的公共片段]。将每个EIC的尺度依据最充足的信号而标准化。数字1-7表示所检测到的化合物的名称,其中1:齐墩果酸;2:常春藤苷配基(hederagenin);3:奥古斯丁酸(augustic acid);4:丝石竹皂苷配基(gypsogenin);5:巴约甙元(Bayogenin);6:未知;7-苜蓿酸。
图28A-28C呈现具有沉默CYP P450的菠菜中的糖苷配基的分析和推定特征。(图28A)在以沉默SOAP3、SOAP4、CYP2和CHLH作为对照的植物中检测到的皂苷配基的相对含量。(图28B)所表征的糖苷配基的结构。数字1-7表示所检测到的化合物的名称,其中1:齐墩果酸;2:常春藤苷配基(hederagenin);3:奥古斯丁酸(augustic acid);4:丝石竹皂苷配基(gypsogenin);5:巴约甙元(Bayogenin);6:未知;7-苜蓿酸。(图28C)所描述化合物的碎裂过程图形,及其与真实齐墩果酸和苜蓿酸标准品的碎裂过程图形的比较。
图29呈现具有沉默(VIGS)的菠菜中选定的皂苷对糖基转移酶基因的LC-MS分析。具有沉默SOAP6-9(SEQ ID NO分别为55、57、59和61)、SoGT1(SEQ ID NO:117[基因]和SEQID NO:118[多肽])和SoGT2(SEQ ID NO:119[基因]和SEQ ID NO:120[多肽])植物中选定的皂苷化合物的相对含量(标准峰面积);有关登录号,请参见表11。下文中提供了用于糖基转移酶的序列。
菠菜GT1核酸基因序列如下:atggccgcctcaaacaaagagcaaagcaagctacatattgctatgtttccttggtttgcatatggtcatataaacccattcatccagctctctaacaagctttcctcccatggcatccaaatctctttcttctcaataccaggaaacattgatcgtatcaaatcctcccttaatctctcacctcccaaccagctcatccccctcactattcccccaactgaaggactctctcccaactttgacagcagctctgaagtaacacctcaaactgctcagcttctcacactagcacttgatcaaatgcagccccaagtcaaagctctattccctcacccccagccacaagttatcctctttgattttgcatatcactggcttccctcagtagcttctgaactaggcatcaaagctgttcatttcaatacattcccagctgttatcaattcatatctcactgtcccttcaagaatgactgatccaaataaaccaccgacatttgaggacttgaagaaccctcctcaaggctatcccaaaacctcaaccgcctcagtgaaaaccttcgaagctcaagattacctattccttttcaagagtttcgatggcggaccgtgccatttcgaaaagatattggcattcacaaacagctgtgatgctatactttacaggacctgcaatgaaatagaaggtccattcatagattacttcaagacccaaataaataaaccactgcttttagctggcccaagtgttcctctaccaccctctggtgaactggatgaaaaatgggagatgtggttaggtaaatttcctgaaaagtcagtcatatactgcagcttcggaagcgagacatacttgaatgatgctcagattcaggagcttacacttgggttggagctcactggtctgccctttatcttggttttgaattttggaacaagtaacagcaccgatgcccacaataagctagaagcatcattaccagaaggatttagagagagaatcaaagacaggggcgttctgcatacaggatgggtgcaacagcaaaacattttagcacacagaagcataggatgctttcttactcacgcagggttcagctctgtaatagagggtattgtgaatgactgtcaattagcatttctacctctaaaggctgaccagtttatgatcgctaagctatttagtggggatctgaaagcaggggtggaggtaaatcgaagagatgaagatgggtcttttgccaaagaagatattttcgaagcaataaagacgatcatggtggatactgataaagaaccaagtagatccatcagggagaatcatagcaattggagaaagtttttgatgaataaggagattgaagctagttatattgcaaatttagctcatgaactcaaggcattggttcaaaaagcttag(SEQ ID NO:117)。菠菜GT1氨基酸蛋白序列如下:MAASNKEQSKLHIAMFPWFAYGHINPFIQLSNKLSSHGIQISFFSIPGNIDRIKSSLNLSPPNQLIPLTIPPTEGLSPNFDSSSEVTPQTAQLLTLALDQMQPQVKALFPHPQPQVILFDFAYHWLPSVASELGIKAVHFNTFPAVINSYLTVPSRMTDPNKPPTFEDLKNPPQGYPKTSTASVKTFEAQDYLFLFKSFDGGPCHFEKILAFTNSCDAILYRTCNEIEGPFIDYFKTQINKPLLLAGPSVPLPPSGELDEKWEMWLGKFPEKSVIYCSFGSETYLNDAQIQELTLGLELTGLPFILVLNFGTSNSTDAHNKLEASLPEGFRERIKDRGVLHTGWVQQQNILAHRSIGCFLTHAGFSSVIEGIVNDCQLAFLPLKADQFMIAKLFSGDLKAGVEVNRRDEDGSFAKEDIFEAIKTIMVDTDKEPSRSIRENHSNWRKFLMNKEIEASYIANLAHELKALVQKA(SEQ ID NO:118)。
菠菜GT2核酸基因序列如下:atgtgtgacgacaaaaaatcatctgttttgagcatagcattttatccgtggtttgctcttggtcaccttacttcatttctccgattagccaacaaacttgcacaaaatggtcacaatgtgtcctattttatcccaactaatacattacctagattacttcctcacaaccattaccctggccaccttactttcatccccgtcaccgtcccacccgttgacggcctccctctcagagccgagaccaccaacgatgtcccctcctcggctatacaccttcttatgactgccatggatttgacccgtgacactatcgaggcccatttggttagtatcaaacccgatgttgttttctacgactttgcttattggattcccgatctagcccgaaaacacgggttcaagtcagtactctacattacatcctatatagcaagatgtgcttattttgcccccgatttgaagtcgggtcatcagtccactggggccgaaattattgcgccaccaccgggttttccgtctcagcatttccggatgcaagcacacgaggctgagactgtggcagacgtaggtaaagagcaagatggattacaaggtataactatttctgaaaggatgcgcattgcttttggaaaatgcgacgcaattggagtaaagagttgtaaggagatggaaaaggtgtatattgactactgtgagaagatatttggtaagtctgtactactagcaggtcctatggtccctaaaaccccatcttccaaacttgatgaatattttgatggttggcttacgggttttggtgctgctactgtgatttattgtgcatttgggagtgaatgtgttctcgaaattaaccaatttcaacaacttcttcttggactagagctcacaggaaggccatttttggtggccatgaagccgcctaagaagtatgaaacaatagagtcggccttaccagaagggtttgagaagagaacaaaaggaaggggaatcgtacatgagggttgggtgcagcaacaactgatattgcaacatccatcagtaggatgtttcataactcattgtggagttgggtctctttcggaagctatggtcagcaaatgtcaagtagtgttgatgcctcaagctgtagaccaattcatcaatgcgaggatgatgagtttagagttgaagattggggttgaggttgagaagagagaagatgatggtttgttcacaaaggaggctgtgcataaggcggtctctttggtgatggaggaagaaagtgaagtcgcaaaagagatgagggtaagtcatgataaatggagagaattcttattacaggaaggtcttgaggattcttatatcagtagcttcattcagagtctacgacagttaacgattggatga(SEQ ID NO:119)。
菠菜GT2氨基酸基因多肽如下:MCDDKKSSVLSIAFYPWFALGHLTSFLRLANKLAQNGHNVSYFIPTNTLPRLLPHNHYPGHLTFIPVTVPPVDGLPLRAETTNDVPSSAIHLLMTAMDLTRDTIEAHLVSIKPDVVFYDFAYWIPDLARKHGFKSVLYITSYIARCAYFAPDLKSGHQSTGAEIIAPPPGFPSQHFRMQAHEAETVADVGKEQDGLQGITISERMRIAFGKCDAIGVKSCKEMEKVYIDYCEKIFGKSVLLAGPMVPKTPSSKLDEYFDGWLTGFGAATVIYCAFGSECVLEINQFQQLLLGLELTGRPFLVAMKPPKKYETIESALPEGFEKRTKGRGIVHEGWVQQQLILQHPSVGCFITHCGVGSLSEAMVSKCQVVLMPQAVDQFINARMMSLELKIGVEVEKREDDGLFTKEAVHKAVSLVMEEESEVAKEMRVSHDKWREFLLQEGLEDSYISSFIQSLRQLTIG(SEQ ID NO:120)。
数(±SD)表示三次独立生物学实验的平均值。其中示出与对照植物(CHLH沉默)相比的统计学显著差异;*P<0.05、**P<0.01、***P<0.001。
图30A-30C呈现示出在沉默了(VIGS)糖基转移酶的菠菜中累积的皂苷的推定特性的数据。(图30A)具有沉默SOAP6-SOAP9(SEQ ID NO分别为55、57、59和61)和另外两个GT的植物中的选定化合物的相对含量。值(±SD)表示三次独立生物学实验的平均值。其中示出与对照植物(CHLH沉默)相比的统计学显著差异;**P<0.01、***P<0.001。(图30B)具有标记的主碎片的MS/MS谱图。(图30C)所累积皂苷的推定结构基于精确质量测量和碎裂过程图形。
图31A-31F呈现在植物原位(菠菜)和体外SOAP10乙酰基转移酶的表征。(图31A)VIGS沉默SOAP10(红色迹线)或CHLH(黑色迹线)的菠菜植物作为对照的样品的LC-MS分析。分别含有脱乙酰基和乙酰化皂苷色谱图的蓝色和黄色区域。菠菜叶中SOAP10的沉默致使乙酰化皂苷产量降低并且脱乙酰基对应物的累积增加。(图31B)以VIGS沉默酰基转移酶和CHLH为对照的菠菜植物中的选定脱乙酰皂苷(Yossoside IV和XII)及其乙酰化对应物(Yossoside V和VII)的相对含量。纵轴是log10标度。(图31C)在VIGS沉默的菠菜植物中脱乙酰基与乙酰化皂苷的比率。SOAP10的沉默会导致脱乙酰基皂苷的累积增加。(图31D、31E和31F)SOAP10重组蛋白在体外的活性。脱乙酰皂苷的EIC(图31D-m/z 1101.51;图31E-m/z1263.57;图31F-m/z 1395.61)和乙酰化对应物的EIC(图31D-m/z 1313.52;图31E-m/z1305.58;图31F–m/z 3137.62):在底物(黑色迹线)–菠菜中脱乙酰基皂苷的纯化馏分中;在乙酰基-辅酶A(橙色迹线)存在下,将重组SOAP10与底物一起孵育的体外酶促测定;以及在菠菜叶提取物中(绿色迹线),进行比较。虚线分离色谱图上的区域,左侧和右侧分别为脱乙酰基和乙酰化皂苷。“Δm/z=42.01”描述了由乙酰化产生的化合物的分子量差异。(SoAT1(SEQ ID NO:109[基因]和SEQ ID NO:113[多肽])、SoAT2(SEQ ID NO:110[基因]和SEQ IDNO:131[多肽])、SoAT3(SEQ ID NO:111[基因]和SEQ ID NO:115[多肽])以及SoAT4(SEQ IDNO:112[基因]和SEQ ID NO:116[多肽]),关于SoAT1-SoAT4的功能活性,请参见表15。)
图32A-32D呈现了来自本塞姆氏烟草中的SOAP 1-4和6-10的表达的数据。(图32A)来自与对照相比,瞬时表达单独SOAP1-4,或瞬时表达除SOAP5(SEQ ID NO:65或93[基因],SEQ ID NO:66[多肽])之外的所有九个SOAP的苜蓿酸及其(聚)糖基化衍生物的EIC[m/z=501.32(MA);m/z=663.38(MA+hex);m/z=825.43(MA+2hex);m/z=987.48(MA+3hex);m/z=1149.53(MA+4hex);负离子模式]。插图示出放大20倍的色谱图区域。(图32B、32C和32D)分别示出了单己糖基苜蓿酸、双己糖基苜蓿酸和三己糖基苜蓿酸的MSE谱。箭头代表己糖基部分的损失。
图33A-33F提供了纤维素合酶样G基因(SOAP5;SEQ ID NO:65或93[基因],SEQ IDNO:66[多肽])的技术分析。SOAP5编码的酶将葡萄糖醛酸附着到三萜糖苷配基,并且在菠菜皂苷生物合成途径中起关键作用。(图33A)病毒诱导基因沉默(VIG)后菠菜叶中SOAP5的相对表达的分析。给出的值是从4次独立生物学重复中获得的。将SOAP5的表达与对照(仅含沉默的镁螯合酶亚单元H的植物–CHLH)进行比较。(图33B)与对照(CHLH)相比,具有沉默的SOAP5和其他糖基转移酶的菠菜叶中的苜蓿酸累积。显示出显著差异,***P<0.001。(图33C)与仅单独表达SOAP1-4的植物以及对照(空载体-EV)相比,瞬时表达SOAP1-5的植物的苜蓿酸3-O-葡萄糖醛酸苷[m/z=677.35(MA-3-GlcA),负离子模式]的EIC。(图33D)与表达SOAP1-5的酵母,酵母对照(SOAP1-4+SoUGD1;仅表达SOAP5以及与EV一起转化的酵母细胞)相比,表达SOAP1-5+SoUGD1的酵母的MA-3-GlcA的EIC[m/z=677.35,负离子模式]。(图33E)菠菜中SOAP5活性的示意图。SOAP5在C-3位置处将葡萄糖醛酸(红色突出显示)附着到苜蓿酸。(图33F)本塞姆氏烟草中菠菜皂苷生物合成途径的重建。与对照植物(EV)和菠菜叶提取物相比,来自瞬时表达所有十个SOAP基因的本塞姆氏烟草叶的样品中的Yossoside V的EIC[m/z=1305.57,负离子模式]。
图34A-34B提供了显示菠菜(VIGS)中的沉默SOAP5的结果的数据。(图34A)与对照(CHLH沉默)和野生型(WT)相比,来自具有沉默SOAP5(SEQ ID NO:65或93)的植物的苜蓿酸的EIC[m/z=501.3,负离子模式]。仅来自植物原位实验的色谱图是按比例绘制的。(图34B)与真实标准品相比,累积在植物中的苜蓿酸[25V,正离子模式]的串联质谱(MS/MS)。MA-苜蓿酸。
图35A-35C呈现了示出本塞姆氏烟草中SOAP5(SEQ ID NO:65或93)的瞬时表达的数据。(图35A)与仅表达SOAP 1-4(SEQ ID NO分别为:45、46、51和53)、仅表达SOAP5(SEQ IDNO:65或93)和对照(空载体-EV)相比,来自瞬时表达SOAP 1-5(SEQ ID NO分别为45、46、51、53和65)的植物的苜蓿酸和苜蓿酸3-葡萄糖醛酸苷的EIC[m/z=501.32(MA);m/z=677.35(MA-3-GlcA),负离子模式]。色谱图是按比例绘制的。(图35B)具有显著碎裂途径的MA-3-GlcA的结构(图35C)MA-3-GlcA的MS/MS[45V,负离子模式],箭头表示葡萄糖醛酸部分的缺失。(图35D)示出苜蓿酸3-O-葡萄糖醛酸苷(MA-3-GlcA)的氢的重要HMBC相关性。黑色箭头表示MA-3-GlcA的六个甲基之间的HMBC相关性。红色箭头表示MA-3-GlcA的其他(选定)氢之间的HMBC相关性。数字对应于苜蓿酸和葡萄糖醛酸部分中的碳原子。有关更多详细信息,请参见表1。
图36A-36F示出SOAP5(SEQ ID NO:66)的底物特异性(参见表16)。与表达不含SOAP5的相同一组SOAP以及对照(EV)相比,来自瞬时表达SOAP1/2/5(图36A)、SOAP1/2/3/5(图36B)、SOAP1/2/4/5(图36C)的植物的齐墩果酸3-GlcA的EIC(图36A)、奥古斯丁酸3-GlcA的EIC(图36B)和丝石竹酸3-GlcA的EIC(图36C)[m/z=631.38(OA-3-GlcA);m/z=647.38(AA-3-GlcA);m/z=661.35(GA-3-GlcA),负离子模式)。色谱图是按比例绘制的。(图36D、36E和36F分别示出来自图36A、36B和36C的葡萄糖醛酸酯衍生物的串联质谱图(MS/MS)[40V,负离子模式],箭头表示葡萄糖醛酸的缺失(Am/z=176.03;GlcA-H2O)。
图37A-37F示出本塞姆氏烟草中SOAP活性的产物。来自瞬时表达每个色谱图上所指示的SOAP基因的组合的植物的Yossoside I的EIC(m/z=823.42)(图37A)、Yossoside II的EIC(m/z=969.27)(图37B)、Yossoside III的EIC(m/z=1131.52)(图37C)、YossosideIV的EIC(m/z=1263.57)(图37D)以及Yossoside V的EIC(m/z=1305.58)(图37E)。有关MS/MS谱,请参见图40B。
图38A-38E示出对本塞姆氏烟草中SOAP活性的主要产物的基于质谱(MS)的鉴定。(图38A)Yossoside I(化合物7),即MA-3-GlcA上SOAP6活性产物的MS/MS。(图38B)Yossoside II(化合物8),即Yossoside I上的SOAP7活性产物的MS/MS。(图38C)YossosideIII(化合物9),即Yossoside II上的SOAP8活性产物的MS/MS。(图38D)Yossoside IV(化合物10),即Yossoside III上的SOAP9活性产物的MS/MS。(图38E)Yossoside V(化合物11),即Yossoside IV上的SOAP10活性产物的MS/MS。
图39A-39C示出本塞姆氏烟草中SOAP9活性的结果。(图39A)与仅表达SOAP1-5和对照(EV)的植物相比,来自瞬时表达SOAP1-5+SOAP9的植物的苜蓿酸3-GlcA-Xyl的EIC[m/z=809.40,负离子模式)]。(参见表16)(图39B)809.4的MS/MS(45V),箭头指示glcA-xyl部分的缺失(Am/z=308.07)。(图39C)带有箭头指示的碎裂过程图形的SOAP9产物的结构(化合物10)。
图40A-40B示出酵母中SOAP5的表达的结果。(图40A)与表达SOAP1-5的植物、酵母对照以及真实苜蓿酸标准品相比,来自表达SOAP1-5+UGD1(SEQ ID NO:74[基因]和SEQ IDNO:75[蛋白])的酵母的苜蓿酸和苜蓿酸3-GlcA的EIC[m/z=501.32(MA);m/z=677.35(MA-3-GlcA);负离子模式)。色谱图是按比例绘制的。(图40B)来自酵母细胞的苜蓿酸3-GlcA的MS/MS[45V,负离子模式],箭头指示葡萄糖醛酸的缺失。
图41A-41F示出酵母细胞中的SOAP5底物特异性。与仅表达SOAP1-4+UGD、仅表达SOAP1-5,仅表达SOAP1-4、SOAP1-2、SOAP5的细胞以及与对照(EV)相比,来自表达SOAP1-5+UGD1的酵母中的齐墩果酸3-GlcA(图41A)、丝石竹酸3-GlcA(图41B)和巴约甙元(Bayogenin)3-GlcA(图41C)的EIC[m/z=631.38(OA-3-GlcA);m/z=661.35(GA-3-GlcA);m/z=663.37(Bayogenin-3-GlcA),负离子模式)。色谱图是按比例绘制的。(图41D、41E和41F)分别示出来自A、B和C的葡萄糖醛酸酯衍生物的MS/MS[45V,负离子模式],箭头表示葡萄糖醛酸的缺失(Am/z=176.03;GlcA-H2O)。
图42A-42F示出在系统发生远缘目物种中,纤维素合酶样G(CSLG)酶的葡糖醛酸基转移酶活性是保守的。(图42A)系统发生树描绘菠菜中的SOAP5与一些来自石竹目(Caryophyllales)、锦葵目(Malvales)、伞形目(Apiales)、豆目(Fabales)和茄目(Solanales)的CSLG蛋白之间的紧密进化关系。该树由属于纤维素合酶(CESA)的蛋白质以及纤维素合酶样酶的多个酶家族(CSLA、CSLB、CSLE和CSLG)组成。虚线包围带CSLG蛋白的进化枝,而放大区域对应于与豆目中的菠菜SOAP5密切相关的CSLG,包括GAME15和CSLG。(图42B)苜蓿酸被来自许多物种的CSLG葡萄糖醛酸糖苷化。与仅表达SOAP1-4的植物以及对照(EV)相比,来自瞬时表达SOAP1-4与来自菠菜(SOAP5;SEQ ID NO:66)、奎奴亚藜(Chenopodium quinoa,CqCSL;SEQ ID NO:96)、甜菜(Beta vulgaris,BvCSL;SEQ ID NO:94)、紫苜蓿(Medicago sativa,MsCSL;SEQ ID NO:98)、橹豆(Glycine max,GmCSL;SEQ IDNO:100)、甘草(Glycyrrhiza uralensis,GuCSL;SEQ ID NO:81或SEQ ID NO:102)和百脉根(Lotus japonicus,LjCSL;SEQ ID NO:104)的CSLG蛋白的组合的本塞姆氏烟草样品中的MA-3-GlcA的EIC[m/z=677.35,负离子模式]。(图42C)纤维素合酶样G蛋白是多种植物物种中三萜皂苷生物合成中的关键酶。β-香树素(在中心)被细胞色素P450(蓝色圆圈)氧化,产生由CSLG(粉红色圆圈)和其他糖基转移酶修饰的多种糖苷配基(1-巴约甙元;2-瓜瓶藤酸(serjanic acid);3-齐墩果酸;4-苜蓿酸;5-甘草次酸;6-大豆甾醇A;7–大豆皂醇B),进而产生三萜皂苷(8–巴约甙元-hexA-hex-hex(紫苜蓿(M.sativa));9-瓜瓶藤酸-hexA-hex(奎奴亚藜(C.quinoa));10-甜菜糖苷IV(B.Vulgaris);11-Yossoside V(菠菜(S.oleracea));12-甘草皂苷(甘草(G.uralensis));13-大豆甾醇A-hexA-hex-pent(百脉根(L.japonicus));14–大豆皂苷VI(橹豆(G.max))。(图42D)甘草(G.uralensis.)中的甘草皂苷生物合成途径。突出显示的官能团是特定酶活性的结果。(图42E)与表达四种基因(-UGT73P12;(SEQ ID NO:84))的样品以及对照(bAS(SEQ ID NO:45)+CYP88D6(SEQ ID NO:76)+CYP72A154(SEQ ID NO:78))相比,来自瞬时表达甘草皂苷生物合成途径中的五个基因(bAS(SEQ ID NO:45)+CYP88D6(SEQ ID NO:76)+CYP72A154(SEQ ID NO:78)+GuCSL(SEQ IDNO:80或SEQ ID NO:103)和UGT73P12(SEQ ID NO:84))的本塞姆氏烟草样品中的甘草次酸3-O-葡萄糖醛酸苷和甘草皂苷的提取离子层析图谱(EIC)测量值[m/z 645.36和m/z821.40,负离子模式]。(图42F)呈现纤维素合酶样(CSL)多肽的系统树,特别着重于纤维素合酶样G(CSLG)。蓝色背景区域由来自许多植物目(例如,石竹目(Carylophyllales)、豆目(Fabales)、伞形目(Apiales)、锦葵目(Malvales)和茄目(Solanales))的CSLG酶组成。在CSLG酶(蓝色背景)内,相关的亚分支包括朝向三萜糖苷配基、用红色绘制的亚分支,其中包括具有已证明的葡糖醛酸基转移酶活性的CSCS酶(以粗体显示),即来自大豆、甘草、百脉根、紫苜蓿、红甜菜、奎藜籽和菠菜的CSLG;以及以蓝色绘制的亚分支,此亚分支由来自茄目(马铃薯(Solanum tuberosum)、番茄(Solanum lycopersicum)、南蛇藤)和其他目的CSLG组成;加粗显示的酶是甾体生物碱和甾体皂苷的生物合成中所涉及的。
图43A-43C示出奎藜籽、甜菜根和紫苜蓿中皂苷的LC-ESI-QTOF-MS分析。(图43A)一个月龄奎藜籽植物(奎奴亚藜变体Read Head)、(图43B)一个月龄甜菜根(甜菜变体Bohan)和(图43C)2周龄幼苗紫苜蓿(紫苜蓿(Medicago sativa))的80%甲醇提取物的总离子色谱层析图(TIC)。半透明矩形用皂苷标记色谱区域。有关假定的表征,请参见表12。
图44A-44C显示红甜菜中CSLG的病毒诱导基因沉默(VIGS)(图44A)红甜菜中的病毒诱导基因沉默;EV-空载体,CHLH-镁螯合酶亚基H,BvCSL-甜菜根纤维素合酶样G(SEQ IDNO:95[基因];VIG沉默序列SEQ ID NO:107)。(图44B)分析具有沉默BvCSL的红甜菜植物中三萜皂苷和齐墩果酸的相对含量(峰面积)。纵坐标轴为log10标度。值代表三次独立生物学实验的平均值。示出与对照植物(仅CHLH沉默)相比的统计学差异;*P<0.05,***P<0.001。(图44C)与对照(CHLH和WT)和真实标准品相比,具有沉默BvCSL的植物的齐墩果酸的EIC[m/z=455.35,负离子模式]。(关于代谢物的鉴定,请参见表12紫苜蓿(M.sativa)。)
图45A-45B示出紫苜蓿毛状根中CSLG的沉默。(图45A)与对照(EV)相比,来自具有类沉默紫苜蓿(Medicago sativa)纤维素合酶样(MsCSL)的毛状根培养物,含有附着到糖苷配基的葡萄糖醛酸的代表性皂苷的EIC。(图45B)用沉默MsCSL对紫苜蓿毛状根中的三萜皂苷的分析。纵坐标轴为log10标度。值代表五次独立生物学实验的平均值。示出与对照(仅利用EV转化的根)相比的统计学差异;*P<0.05,***P<0.01,***P<0.001。(asRNA-反义RNA)此处使用的asRNA序列如下所示:CTACCCACTCTTCCGCTTCATAGATATAATCCCCTCCACAATAGGATGACTTAGAGCAAGTATATAGATAATGAGGAAAAGTTGACCAAACATTTCATCAAAATCCCTCACATTGAGTAGTCTCCATAAACCACCAAAGAAGCAAACAATATTTATTGTGAGTAACACAATCACTGGTGCCATGAGCAATGCTGCACCATCAAAATTAAACTTACCCTGCTCATATTTCTTTAGCTTATCTTTGTCAATTGCTTTGTCCGATAAAGTGAATTTTGCCTTGTTCAACCCAAACTTTTTTTTCGCTGTTTCTATAATTGCGAAAACGCACCCAATTGATTTTACAATCCCACTTCTTTGTTCATTCCACCAAATCATCGAGGAGCCACCAGTTGAAATTACCTCAATATAATGATGAATTTGACTGGATAGATACAATACTGTAAACACTATAAACCAAGGATCTGTAACCTTTGGATATACAGGTATTCCCTTCAAGAAGCAAATCTGAGGAACGAATCCATATAAGATGTAGGCTGTTGCAAATTGGGTTGTGCTTACCAAGTAACAAAAAGTTAAACAATGAATAGTGGGCAATCTTGAAAGGCCATAAGTGAATGGGCTATATTTAGAGATTGCAAGCAACAAAAGTTCAGATGACCACTTTATCGGTTGAATCAATCCCTCTTTCATGTCAGTTGGAGCACATCCTAAGAAACATGGTCTTTTAGGGTAAAGATAAGTTGATCTCCATCCTCTACAATGGAGGAGATAGCCAGTAACGGTACTCTCAAGTTTTATAGCATACGAGAATCCCACCTCATTACCCCAATTTGTGTTTCTCTCATAGGAACAAGAAGCCACTTCACATGCTTCTTGTAAAATTACATCTCTTGAAATATTCTGCTTCTTAGTTTGTTGACCACGTAACGCTTTTAGTGATTCTACATACATGTTAGACTTGCCAAAGTTGTATAGAGCATCAAGTAGATAGTCCCCTTTTTGGTTTGGACTTCCAAAGAGTAATGCACTTCTACTTATATAATTTCCACTGCCAGTTAGACCTGGACCTCTTAATCCATCCATTCCCTTCCACTTTGTCGTAAAAGCAGTCCTAGTCTGACTATCATATATGTCTTTCTTGCTAAGGTTGTGAAACATTTGAGGGAATTGAACAAAAGCAACATCTTTAGAGGTTTCAGGATCAAGAAAAAAGCACATGGATTGTTTGGCTGATGATGCATCATTACAATTCATATCACAATCTACGACAAGTACATAAGGTCCATTGCTGATTAGCCCTGACACCCTAAGCAATGTATTGAGAGCTCCTCCTTTGAATCTGTGAGGAACAGATGGTCTTTTTTCACGAGATACATAAACAACTAGTGGCATTTCTTTTTGGTCATTAATGATCTCGATCCGAGAAGGTCTATCGGTCACCATACAAAGATTCTTTAGGTTGCTTCCGAATTTCTCAATATTTTTCTGCATTTTCTCGTATTTGGCTTTGGTGGGCATATGTTCCTTGGAGTTTTCAACTTGTGATGAGTTAGGATCCACTCTATTTAATCTCTTCTTAATCTGGTCCCTCACTTCTTCAAATTCACGAGGTCGATGAAGTCGTTCATTCTCACCCAAAGCAGTGAAGAAAAACTTAGGACACCTTGACTTAACATCATATTTTTTACAAAAAGGAACCCAAACTTTAGCAAATTCAAAAGCCTCTTTGATCCCAAAAAGAGTAATAGGAGAACCTCCATCATCAGAAAGATAAATAGAAAGTTTATTAGAAGGGTAATCCATTGCAATAGCAGAAATAACAGTGTTCATAACATCAACCGTTGGTTCTTTTTCAGGATCAATGGTACACACAAATATGTCGAGTCCCGGCAACTTCTCCTCCGGCGGTAATTTCTCGGTCATAACTGAACGATTCACCAGCCTCCAACGGAATGCTTGGTTGAAAAACCATAGAAATGATAGAATAATCTCAGCTATTGTCATTAGAAACCATGGATATGAAATAAACAAATTGCTGATACGGTAGTAAAAGAGAAACAAGACACATGTGAAGTGGAAGATTATGTAAGCTCTTCTTAGAGGTAACAATGGTTGAACTGTTTCTTTGTGAAATGTGAAGGTTGCCAT(SEQ ID NO:108)
图46A-46E表明,GuCSLG催化了甘草次酸3-O-单葡萄糖醛酸苷的形成。(图46A)表达来自甘草(Glycyrrhiza uralensis)的蛋白质的本塞姆氏烟草的样品的甘草次酸3-O-单葡萄糖醛酸苷的EIC(m/z=645.36,负离子模式]:bAS-β-香树素合酶(SEQ ID NO:48);CYP88D6-β-香树素11-氧化酶(SEQ ID NO:77);CYP72A154-11-oxo-b-香树素30-氧化酶(SEQ ID NO:79);GuUGAT(SEQ ID NO:83)-之前报道过的进行甘草次酸的葡萄糖醛酸化的糖基转移酶;UGT73P12(SEQ ID NO:85)-将glcA转移到甘草次酸3-O-单葡萄糖醛酸苷上的糖基转移酶;GuCSL-纤维素合酶样G。(图46B)654.36的MS/MS(甘草次酸3-O-单葡萄糖醛酸苷异构体1;55V)。(图46C)654.36的MS/MS(异构体2;55V)。(图46D)具有箭头指示的碎裂过程图形的甘草次酸3-O-单葡萄糖醛酸苷的结构。(图46E)葡萄糖醛酸与所检测到离子之间的交叉环断裂的名称汇编。
图47A-47F示出,本塞姆氏烟草中需要GuCSLG来形成甘草皂苷(甘草次酸3-O-二葡萄糖醛酸苷)。(图47A)来自表达甘草中蛋白质的本塞姆氏烟草样品的甘草皂苷的EIC[m/z=821.40,负离子模式:bAS-b-香树素合酶[β-香树素合酶](SEQ ID NO:48);CYP88D6-β-香树素11-氧化酶(SEQ ID NO:76[基因]和SEQ ID NO:77[多肽]);CYP72A154-11-oxo-b-香树素47-氧化酶(SEQ ID NO:78[基因]和SEQ ID NO:79[多肽]);GuUGAT(SEQ ID NO:82[基因]和SEQ ID NO:83[多肽])-先前报道过的对甘草次酸进行葡萄糖醛酸化的糖基转移酶;UGT73P12-将glcA转移到甘草次酸3-O-单葡萄糖醛酸苷上的糖基转移酶(SEQ ID NO:84[基因]和SEQ ID NO:85[多肽]);GuCSL-纤维素合酶样G(SEQ ID NO:80或SEQ ID NO:103[基因],以及SEQ ID NO:81或SEQ ID NO:102[多肽])。(图47B)821.40(异构体1)的MS/MS(65V)-bAS(SEQ ID NO:45)+CYP88D6(SEQ ID NO:77)+CYP72A154(SEQ ID NO:79)+GuCSL(SEQ ID NO:81or SEQ ID NO:102)+UGT73P12(SEQ ID NO:85)的产物。(图47C)821.40(异构体2)的MS/MS(65V)-bAS(SEQ ID NO:45)+CYP88D6(SEQ ID NO:77)+CYP72A154(SEQ IDNO:79)+GuCSL(SEQ ID NO:81or SEQ ID NO:102)+UGT73P12(SEQ ID NO:85)的产物。(图47D)和(图47E)甘草皂苷真实标准品、异构体1和2各自的MS/MS。(图47F)具有箭头指示的碎裂过程图形的甘草皂苷的结构。
图48示出SOAP5的结构。(图48)拟南芥属(Arabidopsis)AtCESA1(SEQ ID NO:67)、AtCESA3(SEQ ID NO:68)及其在菠菜中的直系同源体(SoCESA1(SEQ ID NO:70)和SoCESA3(SEQ ID NO:71))与SOAP5(SEQ ID NO:66)及其在拟南芥属中的对应物-AtCSLGl(SEQ IDNO:69)的蛋白质序列比对。
图49A-49C示出SOAP5的预测3D结构。(图49A和49B)具有预测隧道,从而使苜蓿酸能够到达酶的活性位点(蓝色-1,2,3),并且形成(黄色-4)脂质双分子层的疏水环境的的SOAP5 3D模型。(图49C)(图49A)中所示隧道的轮廓和性质。
图50A和50B呈现SOAP5的定点诱变数据。(图50A)与仅表达天然SOAP5的植物、表达SOAP1-4的植物以及对照(EV)相比,来自瞬时表达具有变异型SOAP5的SOAP1-4的植物的苜蓿酸[m/z=501.32]和苜蓿酸3-GlcA[m/z=677.35]的EIC。(图50B)MA和MA-3-GlcA在表达SOAP5突变变体的植物中的累积,表示为MA-3-GlcA与游离MA之间的比率。纵坐标轴为log10标度。值代表三次独立生物学实验的平均值。示出与表达天然SOAP5的植物相比的显著统计学差异;***P<0.001。
图51A-51H示出显微照片,这些显微照片示出,包括SOAP5在内的SOAP蛋白共定位化于内质网(ER)膜中。(图51A-51F)本塞姆氏烟草叶中SOAP5:RFP与(图51A)ER:GFP标志物;(图51B)Golgi:GFP标志物;(图51C)SOAP1:GFP;(图51D)SOAP2:GFP;(图51E)SOAP3:GFP和SOAP4:GFP(图51F)的瞬时共表达的共焦图像。每个区块中含有GFP、RFP和两个通道合并的图像。比例尺是50μm。(图51G)示出具有保守基序(红色)、取代的氨基酸(蓝色,箭头所示)和六个跨膜结构域的SOAP5拓扑模型。(图51H)表达所示构建体的细胞的FRET指数。值是平均值±标准误差(SE)。示出与表达游离GFP和RFP(NC)的阴性对照相比的显著差异;*P<0.05;**P<0.01。
图52A-52F示出显微照片,这些显微照片示出,三萜糖苷配基形成中所涉及的SOAP共定位化并且存在于内质网(ER)中。(图52A-52F)与本塞姆氏烟草叶中瞬时共表达的荧光蛋白(GFP和RFP)融合的SOAP的共焦图像。(图52A)SOAP1:GFP+SOAP2:RFP;(图52B)SOAP1:GFP+SOAP3:RFP;(图52C)SOAP1:GFP+SOAP4:RFP;(图52D)SOAP2:GFP+SOAP3:RFP;(图52E)SOAP2-GFP+SOAP4:RFP;(图35F)SOAP3:GFP+SOAP4:RFP(F)。每个区块中含有GFP、RFP和两个通道合并的图像。比例尺是50微微米。
图53呈现数据表明,与荧光蛋白(FP)融合的SOAP仍然具备活性。与仅表达天然SOAP5、表达SOAP1-4以及对照(EV)相比,来自瞬时表达SOAP1:eGFP,SOAP2:eGFP、SOAP3:mRFP、SOAP4:eGFP和SOAP5:mRFP的本塞姆氏烟草植物的苜蓿酸[m/z=501.32]的EIC和苜蓿酸3-GlcA的EIC[m/z=677.35]。与天然SOAP1-5、单独的SOAP1-4和对照(EV)相比,SOAP1:GFP、SOAP2:GFP、SOAP3:RFP、SOAP4:GFP和SOAP5:RFPP。
图54A-54B表明,与荧光蛋白(FP)融合的SOAP仍然具备活性。(图54A)表达所示构建体的细胞的荧光共振能量转移(FRET)指数。值是平均值±标准误差(SE)。以星号示出与表达游离GFP和RFP(NC)的阴性对照相比的显著差异;*P<0.05;**P<0.01。(图54B)ER内可能的蛋白质定位化的示意图。
具体实施方式
以下详细描述中阐述了许多具体细节,以便提供对本发明的透彻理解。但是,所属领域中的技术人员应理解,可以在没有这些具体细节的情况下来实践本发明。在其他情况下,对公知的方法、程序和组件未做详细描述,以免本发明模糊不清。
本文具体地公开一种遗传修饰的细胞,所述遗传修饰的细胞与相应的未修饰的细胞相比,具有表达增加的至少一种异源基因,所述至少一种异源基因编码纤维素合酶样G(CSLG)酶,其中所述遗传修饰的细胞包括与相应的未修饰的细胞相比,含量增加的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体。在一些实施方案中,表达异源CSLG的遗传修饰的细胞还表达编码酶的至少一种其他异源基因,所述酶选自以下:皂苷β-香树素合酶、细胞色素P450、糖基转移酶、酰基转移酶和UDP-葡萄糖6-脱氢酶1或其任何组合。
术语“CSLG”涵盖来自G家族的纤维素合酶样酶。各种纤维素合酶样(CSL)家族,每个均带有不同后缀,例如A、B、E和G。每个家族的后缀都是根据酶与拟南芥(Arabidopsisthaliana)中先前鉴定的蛋白的相似性而指定的。来自不同家族的CSL酶具有不同的技术特征。如本文全文中所使用,在某些实施例中,不带后缀A、B或E的术语“CSL”可以与具有所有相同含义和性质的术语“CSLG”互换使用。
在某些实施方案中,“CSLG”蛋白可以包括“GAME15”蛋白和“SOAP5”蛋白。
本文描述了六个经过测试的CSLG基因。在某些实施方案中,这些CSLG基因包括GAME15基因及被其编码的酶(来自6个物种,即番茄、野生番茄、马铃薯、野生马铃薯、茄子和胡椒的6种酶),其可以转移葡萄糖醛酸或生成甾体生物碱的其他糖部分,并且其将葡萄糖醛酸或其他糖部分转移到呋喃甾醇型皂苷(糖苷配基)上,以生成甾体皂苷或其前体,或生成甾体生物碱或其前体(参见例如图1)。
本文中描述七种经测试的CSLG基因(也称为SOAP5基因)及被其编码的酶(来自7个物种,即菠菜、中国甘草、红甜菜、奎藜籽、紫苜蓿、大豆和百脉根(Lotus japonicus)的7种酶),该CSLG基因及被其编码的酶将葡萄糖醛酸转移到三萜糖苷配基上。在一些实施方案中,术语“三萜糖苷配基”可以涵盖衍生自β-香树素的化合物组。因此,本文公开的CSLG酶提供独特的活性。
所属领域中的技术人员将理解,改变细胞例如植物细胞、酵母细胞、藻细胞、细菌细胞中至少一种甾体生物碱、甾体皂苷或三萜皂苷的含量可以包含使内源CSLG基因突变或调节CSLG基因的表达,或可以包含将异源CSLG添加到不表达CSLG酶的细胞中,或以补充在异源细胞中表达的CSLG酶的活性。在一些实施方案中,植物细胞可以包含在植物或植物部分内。
根据某些实施方案,改变所述至少一种基因或其任何组合的表达,所述改变包含诱变所述至少一种基因,其中所述诱变包含引入一个或多个点突变或基因组编辑,或使用细菌CRISPR/CAS系统,或其组合。在某些实施方案中,例如通过缺失、插入或修饰或通过引入靶向CSLG基因的至少一种沉默分子来沉默、抑制或降低CSLG基因或多核苷酸的表达。
应理解,可以通过多种方式来提高至少一种基因或其组合的表达,所有这些方式均明确地涵盖在本发明的范围内。根据某些实施方案,可以使用增强转录和/或翻译的多种分子,包括但不限于转录因子,在基因组和/或转录水平上来影响CSLG表达的增强。也可以使用向至少一种基因插入突变,包括添加启动子、增强子等,只要该突变导致基因表达的上调即可。根据其他实施方案,使用激动剂等在蛋白质水平上提高表达。
在一些实施方案中,这些遗传修饰的细胞产生甾体生物碱。在一些实施方案中,这些遗传修饰的细胞产生甾体皂苷。在一些实施方案中,这些遗传修饰的细胞产生三萜皂苷。在一些实施方案中,遗传修饰的细胞包含与相应的未修饰的细胞相比,含量增加的至少以下物质:甾体生物碱、其衍生物、其代谢物或其生物合成中间体。在一些实施方案中,遗传修饰的细胞包含与相应的未修饰的细胞相比,含量增加的至少以下物质:甾体皂苷、其衍生物、其代谢物或其生物合成中间体。在一些实施方案中,遗传修饰的细胞包含与相应的未修饰的细胞相比,含量增加的至少以下物质:三萜皂苷、其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,甾体生物碱的衍生物、甾体皂苷的衍生物或三萜皂苷的衍生物分别包含甾体生物碱的糖基化衍生物、甾体皂苷的糖基化衍生物或三萜皂苷的糖基化衍生物。
在一些实施方案中,编码所述至少一种异源CSLG基因的核酸序列在SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101、103或105中的任一;或与SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101、103或105中的任一所示的其核酸序列具有至少55%的同一性和至少55%的覆盖度的其同源物中示出。在一些实施方案中,编码所述至少一种异源CSLG基因的核酸序列在SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101、103或105中的任一;或与SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101、103或105中的任一所示的其核酸序列具有至少55%的同一性和至少80%的覆盖度的其同源物中示出。
在一些实施方案中,CSLG酶同源物与氨基酸序列具有至少55%、60%、65%、70%、75%、80%、85%、90%、95%、98%或99%的同一性。在一些实施方案中,编码CSLG酶同源物的基因与核酸序列具有至少55%、60%、65%、70%、75%、80%、85%、90%、95%、98%或99%的同一性。
在一些实施方案中,CSLG酶同源物与氨基酸序列具有至少55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或100%的覆盖度。在一些实施方案中,编码CSLG酶同源物的基因与核酸序列具有至少55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或100%的覆盖度。
在一些实施方案中,编码所述至少一种异源CSLG基因的核酸序列在SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101、103或105中的任一;或与SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101、103或105中的任一所示的其核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出。
在一些实施方案中,所述被编码的CSLG酶的氨基酸序列在SEQ ID NO:31、33、35、37、39、41、66、81、94、96、98、100、102或104中的任一;或与SEQ ID NO:31、33、35、37、39、41、66、81、94、96、98、100、102或104中的任一所示的氨基酸序列具有至少55%的同一性和至少55%的覆盖度的其同源物中示出。在一些实施方案中,所述被编码的CSLG酶的氨基酸序列在SEQ ID NO:31、33、35、37、39、41、66、81、94、96、98、100、102或104中的任一;或与SEQ IDNO:31、33、35、37、39、41、66、81、94、96、98、100、102或104中的任一所示的氨基酸序列具有至少55%的同一性和至少80%的覆盖度的其同源物中示出。
在一些实施方案中,所述被编码的CSLG酶的氨基酸序列在SEQ ID NO:31、33、35、37、39、41、66、81、94、96、98、100、102或104中的任一;或与SEQ ID NO:31、33、35、37、39、41、66、81、94、96、98、100、102或104中的任一所示的氨基酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出。
在一些实施方案中,编码所述至少一种其他异源基因的核酸序列对以下进行编码:(a)β-香树素合酶,所述核酸序列在SEQ ID NO:45;或与SEQ ID NO:45所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;或(b)细胞色素P450,所述核酸序列在SEQ ID NO:46、51或53中的任一;或与SEQ ID NO:46、51或53中的任一所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;或(c)糖基转移酶,所述核酸序列在SEQ ID NO:55、57、59或61中的任一;或与SEQ ID NO:55、57、59或61中的任一所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;或(d)乙酰基转移酶,所述核酸序列在SEQ ID NO:63;或与SEQ ID NO:63所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;或(e)UDP-葡萄糖6-脱氢酶1,所述核酸序列在SEQ ID NO:74;或与SEQ ID NO:74所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;或(f)上述(a)、(b)、(c)、(d)和(e)的任意组合。
在一些实施方案中,所述经编码的至少一种其他异源基因的核酸序列对以下进行编码:(a)β-香树素合酶,所述氨基酸序列在SEQ ID NO:48;或与SEQ ID NO:48所示的氨基酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;或(b)细胞色素P450,所述氨基酸序列在SEQ ID NO:49、52或54中的任一;或与SEQ ID NO:49、52或54中的任一所示的氨基酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;或(c)糖基转移酶,所述氨基酸序列在SEQ ID NO:56、58、60或62中的任一;或与SEQ ID NO:56、58、60或62中的任一所示的氨基酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;或(d)乙酰基转移酶,所述氨基酸序列在SEQ ID NO:64;或与SEQ ID NO:64所示的氨基酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;或(e)UDP-葡萄糖6-脱氢酶1,所述氨基酸序列在SEQ ID NO:75;或与SEQ ID NO:75所示的氨基酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;或(f)上述(a)、(b)、(c)、(d)和(e)的任意组合。
异源表达涵盖宿主细胞或宿主有机体中基因或基因一部分的表达,例如但不限于天然不具有该基因或基因节段的植物细胞、酵母细胞、藻类或植物。基因在异源宿主中的插入可以通过所属领域中已知的任何重组DNA技术来进行,或例如在酵母的情况下,可以通过交配来进行。
三萜皂苷或所述其衍生物、其代谢物或其生物合成中间体可以具有广泛的商业用途,并且在一些实施方案中可以包含甜味剂、发泡剂、乳化剂、防腐剂、抗癌剂、降血胆固醇制剂、消炎剂、抗氧化剂、生物佐剂、杀菌剂、杀虫剂、拒食剂、抗真菌剂或其任何组合。
在一些实施方案中,(a)所述甾体糖苷生物碱包含α-番茄素、番茄素、脱氢番茄素、羟基番茄碱、乙酰氧基番茄碱、二羟基番茄碱、α-查茄碱、α-茄碱、α-澳洲茄碱、α-澳洲茄边碱,及其衍生物,相关化合物或其任何组合;(b)所述甾体皂苷包含龙葵皂苷(Uttroside)B、番茄甙(tomatoside)及其衍生物,相关化合物或其任何组合;(c)所述三萜皂苷包含苜蓿酸3-O-葡萄糖醛酸苷(MA-3-GlcA)(化合物6)、化合物7、化合物8、化合物9、化合物10、化合物11、甘草皂苷(化合物14)、甘草次酸3-O-单葡萄糖醛酸苷(化合物15)、巴约甙元(化合物25)、巴约甙元-hexA-hex-hex(化合物31)、瓜瓶藤酸(化合物26)、瓜瓶藤酸-hexA-hex(化合物32)、大豆甾醇A(化合物29)、大豆皂醇B(化合物30)、大豆甾醇A-hexA-hex-pent(化合物34)、大豆皂甙VI(化合物35)、甜菜甙IV(betavulgaroside IV)(化合物33)、常春藤苷配基-3GlcA、丝石竹皂苷配基-3GlcA、丝石竹酸-3GlcA或QS-21佐剂或其任何组合;(d)所述三萜皂苷的生物合成中间体包含化合物1、化合物2、苜蓿酸(化合物5)、齐墩果酸(化合物3)、齐墩果酸-3GlcA、奥古斯丁酸(化合物4)、奥古斯丁酸-3GlcA或甘草次酸(化合物13)或其任何组合;或(e)以上各项的其任何组合。
根据某些示例性实施方案,下游甾体糖苷生物碱选自七叶皂苷或脱氢七叶皂苷。
在一些实施方案中,所述遗传修饰的细胞还包含含量改变的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆固醇、其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇、或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,“含量改变的”包括含量增加的植物固醇/植物甾醇/植物胆甾烯醇、其衍生物、其代谢物或其生物合成中间体。在一些实施方案中,“含量改变的”包括含量增加的植物固醇、其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,所述遗传修饰的细胞还包含含量减少的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆固醇、其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇、或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,所述遗传修饰的细胞是植物细胞、酵母细胞或藻细胞。在一些实施方案中,所述遗传修饰的植物细胞包含在植物或植物部分内。在一些实施方案中,所述遗传修饰的细胞是酵母细胞。在一些实施方案中,所述遗传修饰的细胞是藻细胞。
在一些实施方案中,所述植物细胞包含来自禾本目(Poales)、石竹目(Caryophyllales)、茄目(Solanales)、豆目(Fabales)、锦葵目(Malvales)、伞形目(Apiales)、十字花目(Brassicales)、天门冬目(Asparagales)、薯蓣目(Dioscoreales)或百合目(Liliales)植物的细胞。
在一些实施方案中,(a)当所述植物细胞包含来自禾本目(Poales)植物的细胞时,所述植物选自稻属(Oryza)、大麦属(Hordeum)、燕麦属(Avena)和小麦属(Triticum);(b)当所述植物细胞包含来自石竹目植物的细胞时,所述植物选自菠菜属(Spinacia)、藜属(Chenopodium)、甜菜属(Beta genus)、大黄属(Rheum)、麦蓝菜属(Vaccaria)、肥皂草属(Saponaria)和石头花属(Gypsophila);(c)当所述植物细胞包含来自茄目植物的细胞时,所述植物选自茄属(Solanum)、辣椒属(Capsicum)、烟草属(Nicotiana)、莨菪属(Hyoscyamus)、曼陀罗属(Datura)和颠茄属(Atropa);(d)当所述植物细胞包含来自豆目(Fabales)植物的细胞时,所述植物选自甘草属(Glycyrrhiza)、苜蓿属(Medicago)、大豆属(Glycine)、百脉根属(Lotus)、鹰嘴豆属(Cicer)、菜豆属(Phaseolus)、豌豆属(Pisum)、花生属(Arachis)、羽扇豆属(Lupinus)和金合欢属(Acacia);(e)当所述植物细胞包含来自锦葵目(Malvales)植物的细胞时,所述植物选自可可属(Theobroma);(f)当所述植物细胞包含来自伞形目(Apiales)植物的细胞时,所述植物选自胡萝卜属(Daucus)、芹属(Apium)、香芹菜属(Petroselinum)、人参属(Panax)、柴胡属(Bupleurum)、常春藤属(Hedera)和积雪草属(Centella);或(g)当所述植物细胞包含来自十字花目(Brassicales)植物的细胞时,所述植物选自拟南芥属(Arabidopsis)、芸苔属(Brassica)、山柑属(Capparis)和番木瓜属(Carica)。
在一些实施方案中,(a)当所述植物细胞包含来自石竹目植物的细胞时,所述植物选自菠菜、甜菜根和奎藜籽;(b)当所述植物细胞包含来自茄目(Solanales)植物的细胞时,所述植物选自番茄、野生番茄、马铃薯、野生马铃薯、茄子、胡椒、甜椒、卡宴辣椒(cayennepepper)、红辣椒(chili pepper)、甘椒(pimiento)、塔巴斯科辣椒(tabasco pepper)、地樱桃(ground cherry)、烟草和南蛇藤(bittersweet);或(c)当所述植物细胞包含来自豆目(Fabales)植物的细胞时,所述植物选自紫苜蓿(alfalfa)、大豆、百脉根(Lotusjaponicus)和甘草(licorice)。
在一些实施方案中,所述植物细胞来自番茄植物,其具有:(i)含量增加的α-番茄素或其衍生物、其代谢物或其生物合成中间体;或番茄碱或其衍生物、其代谢物或其生物合成中间体;或甾体皂苷或其衍生物、其代谢物或其生物合成中间体;或(ii)含量改变的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,所述植物细胞来自番茄植物,其具有:(i)含量增加的α-番茄素或其衍生物、其代谢物或其生物合成中间体;或番茄碱或其衍生物、其代谢物或其生物合成中间体;或甾体皂苷或其衍生物、其代谢物或其生物合成中间体;或(ii)含量减少的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,所述植物细胞来自马铃薯植物,其具有:(i)含量增加的α-查茄碱或其衍生物、其代谢物或其生物合成中间体;或α-茄碱或其衍生物、其代谢物或其生物合成中间体;或甾体皂苷或其衍生物、其代谢物或其生物合成中间体;或(ii)含量改变的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,所述植物细胞来自马铃薯植物,其具有:(i)含量增加的α-查茄碱或其衍生物、其代谢物或其生物合成中间体;或α-茄碱或其衍生物、其代谢物或其生物合成中间体;或甾体皂苷或其衍生物、其代谢物或其生物合成中间体;或(ii)含量减少的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,所述植物细胞来自茄子植物,其具有:(i)含量增加的α-澳洲茄碱或其衍生物、其代谢物或其生物合成中间体;或α-澳洲茄边碱或其衍生物、其代谢物或其生物合成中间体;或甾体皂苷或其衍生物、其代谢物或其生物合成中间体;或(ii)含量改变的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,所述植物细胞来自茄子植物,其具有:(i)含量增加的α-澳洲茄碱或其衍生物、其代谢物或其生物合成中间体;或α-澳洲茄边碱或其衍生物、其代谢物或其生物合成中间体;或甾体皂苷或其衍生物、其代谢物或其生物合成中间体;或(ii)含量减少的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,所述植物细胞包括叶细胞、叶柄细胞、植物茎或柄细胞(plantstem or stalk cell)、根细胞、芽细胞、块茎细胞、豆细胞、谷粒或果仁细胞、果实细胞、坚果细胞、豆荚细胞、种子或种子细胞、愈伤组织细胞、苞片细胞或花细胞。在一些实施方案中,所述植物细胞包括在植物或其部分中,所述其部分包括植物叶、植物叶柄、植物茎或柄、植物根、植物芽、植物块茎、植物豆、植物谷粒或果仁、植物果实、植物坚果、植物豆荚、植物种子、植物苞片或植物花。
在一些实施方案中,所述酵母选自酵母菌属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)、毕赤酵母属(Pichia)、子囊菌酵母属(Yarrowia)、克鲁维酵母菌属(Kluyveromyces)或假丝酵母属(Candida)。
在一些实施方案中,所述藻选自微藻、多细胞藻、蓝藻菌(cyanobacterium)、硅藻、绿藻门(绿藻)、红藻门(红藻)或褐色植物门(褐藻)、盐藻(Dunaliella)、衣藻属(Chlamydamonas)或血球藻属(Hematococus)。
本文中具体地公开一种遗传修饰的植物,所述遗传修饰的植物包含与相应的未修饰的植物中的纤维素合酶样G(CSLG)的表达相比,具有至少一种CSLG基因表达改变的至少一种细胞,并且其中所述遗传修饰的植物与相应的未修饰的植物相比,具有含量改变的至少一种甾体生物碱、其衍生物、其代谢物;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体。
根据某些实施方案,改变所述至少一种基因或其任何组合的表达,所述改变包含诱变所述至少一种基因,其中所述诱变包含引入一个或多个点突变,或基因组编辑,或细菌CRISPR/CAS系统的使用,或其组合。
根据某些实施方案,与编码至少一种CSLG的基因分别在相应的未修饰的细胞或植物中的表达相比,所述编码至少一种CSLG的基因在所述遗传修饰的植物中的表达增加。根据某些实施方案,所述遗传修饰的细胞或遗传修饰的植物包含编码CSLG的多核苷酸,其中,选择性地增加所述多核苷酸的表达。根据某些实施方案,所述遗传修饰的植物包含至少一种细胞,所述至少一种细胞包含至少一种可转录多核苷酸,所述至少一种可转录多核苷酸编码选自至少一种CSLG的至少一种蛋白质。
根据某些实施方案,所述遗传修饰的植物是转基因植物,所述转基因植物包含至少一种细胞,所述至少一种细胞包含靶向编码至少一种CSLG的多核苷酸的至少一种沉默分子。根据某些实施方案,所述转基因植物包含编码CSLG的多核苷酸,其中,选择性地沉默、抑制或降低所述多核苷酸的表达。根据某些实施方案,所述转基因植物包含编码CSLG的多核苷酸,其中通过缺失、插入或修饰选择性地对所述多核苷酸进行编辑,从而沉默、抑制或减少其表达,或其中所述遗传修饰的植物是所述被基因编辑的植物的后代。根据某些实施方案,所述转基因植物包含至少一种细胞,所述至少一种细胞包含靶向CSLG基因的至少一种沉默分子。根据某些实施方案,所述沉默分子选自RNA干扰分子和反义分子,或其中所述沉默分子是病毒诱导基因沉默系统的组分。根据某些实施方案,所述沉默分子包含具有与CSLG基因的区域基本互补的核酸序列的多核苷酸。
根据一些实施方案,所述转基因植物包含多种细胞,所述多种细胞包含靶向所述至少一种CSLG基因的沉默分子。根据另外的实施方案,所述植物细胞中的大多数包含沉默分子。
应理解,抑制所述至少一种基因或其组合的表达可以通过各种方式来实现,所有这些方式均明确地涵盖在本发明的范围内。根据某些实施方案,可以使用干扰转录和/或翻译的多种分子在基因组和/或转录水平上抑制CSLG的表达,所述分子包含但不限于反义、siRNA、核糖酶或脱氧核酶(DNAzyme)分子。也可以使用将突变插入至少一个基因中,包括缺失、插入、位点特异性突变、锌指核酸酶等,只要该突变致使基因表达的下调即可。根据其他实施方案,使用拮抗剂、裂解多肽的酶等来在蛋白质水平上抑制表达。
在一些实施方案中,所述CSLG基因包含内源CSLG基因。
在一些实施方案中,所述内源CSLG基因包含突变,所述突变包含至少一个或多个点突变,或插入,或缺失或其任何组合,并且:(a)其中所述被表达的CSLG酶具有增加的稳定性或增加的活性或这两者兼有,并且改变的含量包含与相应的未修饰的植物相比,增加量的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;所述至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体;或(b)其中所述被表达的CSLG酶具有降低的稳定性或降低的活性或这两者兼有,并且改变的含量包含与相应的未修饰的植物相比,降低量的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;所述至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;至少一种三萜皂苷或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,(a)选择性地沉默、抑制所述内源CSLG基因,或降低其表达,并且所述改变的含量包含与相应的未修饰的植物相比,减少量的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;所述至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体;或(b)所述内源CSLG基因过表达,并且所述改变的含量包含与相应的未修饰的植物相比,增加量的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;或所述至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或至少一种三萜皂苷或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,当选择性地沉默、抑制所述内源CSLG基因,或具有降低的表达时,所述细胞还包含靶向编码所述CSLG基因的多核苷酸的至少一种沉默分子,其中所述沉默分子选自RNA干扰分子或反义分子,或其中所述沉默分子是病毒诱导基因沉默系统的组分。
在一些实施方案中,所述CSLG基因包含异源CSLG基因,并且所述表达的改变包含所述基因的从头表达。
在一些实施方案中,所述表达包含与相应的未修饰的细胞相比而言增加的表达,并且所述改变的含量包含与相应的未修饰的植物相比,含量增加的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,编码所述CSLG基因的核酸序列在SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101、103或105中的任一;或与SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101、103或105中的任一所示的其核酸序列具有至少55%的同一性和至少55%的覆盖度的其同源物中示出。在一些实施方案中,编码所述CSLG基因的核酸序列在SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101、103或105中的任一;或与SEQID NO:30、32、34、36、38、40、65、80、93、95、97、99、101、103或105中的任一所示的其核酸序列具有至少55%的同一性和至少80%的覆盖度的其同源物中示出。
在一些实施方案中,编码所述CSLG基因的核酸序列在SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101、103或105中的任一;或与SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101、103或105中的任一所示的其核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出。
在一些实施方案中,所述CSLG酶的氨基酸序列在SEQ ID NO:31、33、35、37、39、41、66、81、94、96、98、100、102或104中的任一;或与SEQ ID NO:31、33、35、37、39、41、66、81、94、96、98、100、102或104中的任一所示的氨基酸序列具有至少55%的同一性和至少55%的覆盖度的其同源物中示出。在一些实施方案中,所述CSLG酶的氨基酸序列在SEQ ID NO:31、33、35、37、39、41、66、81、94、96、98、100、102或104中的任一;或与SEQ ID NO:31、33、35、37、39、41、66、81、94、96、98、100、102或104中的任一所示的氨基酸序列具有至少55%的同一性和至少80%的覆盖度的其同源物中示出。
在一些实施方案中,所述CSLG酶的氨基酸序列在SEQ ID NO:31、33、35、37、39、41、66、81、94、96、98、100、102或104中的任一;或与SEQ ID NO:31、33、35、37、39、41、66、81、94、96、98、100、102或104中的任一所示的氨基酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出。
在一些实施方案中,通过(1)将一个或多个点突变引入核酸序列中,(2)将缺失引入核酸序列内,或(3)将插入引入核酸其任何组合内,或(4)其任何组合来改变所述至少一种纤维素合酶样G(GSLG)基因的表达,其中所述引入包含诱变编码或非编码序列。
在一些实施方案中,通过引入靶向至少一种CSLG基因的沉默分子来改变至少一种CSLG基因的表达,并且其中:(a)当CSLG的核酸在SEQ ID NO:30中示出时,沉默分子在SEQID NO:42或其互补序列,或与SEQ ID NO:42或其互补序列所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;(b)当CSLG的核酸在SEQ ID NO:34中示出时,沉默分子在SEQ ID NO:43或其互补序列,或与SEQ ID NO:43或其互补序列所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;(c)当CSLG的核酸在SEQ ID NO:38中示出时,沉默分子在SEQ ID NO:44或其互补序列或与SEQ ID NO:44或其互补序列所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;(d)当CSLG的核酸在SEQ ID NO:65或SEQ ID NO:93中示出时,沉默分子在SEQ ID NO:106中或其互补序列,或与SEQ ID NO:65所示的核酸序列或SEQ ID NO:93所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;或(e)当CSLG的核酸在SEQ IDNO:95中示出时,所述沉默分子在SEQ ID NO:107或其互补序列,或与SEQ ID NO:95所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出。
三萜皂苷或其衍生物、其代谢物或其生物合成中间体可以具有广泛的商业用途,并且在一些实施方案中可以包含甜味剂、发泡剂、乳化剂、防腐剂、抗癌剂、降血胆固醇制剂、消炎剂、抗氧化剂、生物佐剂、杀菌剂、杀虫剂、拒食剂、抗真菌剂,或其任何组合。
在一些实施方案中,(a)所述甾体糖苷生物碱包含α-番茄素、番茄素、脱氢番茄素、羟基番茄素、乙酰氧基番茄素、二羟基番茄素、α-查茄碱、α-茄碱、α-澳洲茄碱、α-澳洲茄边碱或其衍生物和途径中间体,或其任何组合;(b)所述甾体皂苷包含龙葵皂苷B、番茄甙及其相关化合物,或其衍生物和途径中间体,或其任何组合;(c)所述三萜皂苷包含苜蓿酸3-O-葡萄糖醛酸苷(MA-3-GlcA)(化合物6)、化合物7、化合物8、化合物9、化合物10、化合物11、甘草皂苷(化合物14)、甘草次酸3-O-单葡萄糖醛酸苷(化合物15)、巴约甙元(化合物25)、巴约甙元-hexA-hex-hex(化合物31)、瓜瓶藤酸(化合物26)、瓜瓶藤酸-hexA-hex(化合物32)、大豆甾醇A(化合物29)、大豆皂醇B(化合物30)、大豆甾醇A-hexA-hex-pent(化合物34)、大豆皂苷VI(化合物35)、甜菜甙IV(化合物33)、常春藤苷配基-3GlcA、丝石竹皂苷配基-3GlcA、丝石竹酸-3GlcA或QS-21佐剂,或其任何组合;(d)所述三萜皂苷的生物合成中间体包含化合物1、化合物2、苜蓿酸(化合物5)、齐墩果酸(化合物3)、齐墩果酸-3GlcA、奥古斯丁酸(化合物4)、奥古斯丁酸-3GlcA或甘草次酸(化合物13)或其任何组合;或(e)这些的其任何组合。
在一些实施方案中,所述遗传修饰的植物具有含量改变的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆固醇、其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇、或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,所述遗传修饰的植物具有含量改变的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆固醇、其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇、或其衍生物、其代谢物或其生物合成中间体,其中:(a)当含量改变的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体包含与相应的未修饰的植物相比而言增加的量时,所述含量改变的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或胆甾烯醇,或包含与相应的未修饰的植物相比而言减少的量,或其衍生物、其代谢物或其生物合成中间体;或(b)当含量改变的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体包含与相应的未修饰的植物相比而言减少的量时,所述含量改变的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其代谢物或其生物合成中间体包含与相应的未修饰的植物相比而言增加的量。
在某些实施方案中,甾体皂苷、甾体生物碱和/或三萜皂苷中的每一者或全部的增加可能致使另一者或其他多者的含量水平发生变化。在一些实施方案中,所述变化包含含量增加。在一些实施方案中,所述变化包含含量降低。在一些实施方案中,所述变化包含一者的含量提高,而另一者的含量降低。
在一些实施方案中,所述植物包含禾本目(Poales)、石竹目(Caryophyllales)、茄目(Solanales)、豆目(Fabales)、锦葵目(Malvales)、伞形目(Apiales)、十字花目(Brassicales)、天门冬目(Asparagales)、薯蓣目(Dioscoreales)或百合目(Liliales)植物。
在一些实施方案中,(a)当所述植物包含禾本目(Poales)植物时,所述植物选自稻属(Oryza)、大麦属(Hordeum)、燕麦属(Avena)和小麦属(Triticum);(b)当所述植物包含石竹目植物时,所述植物选自菠菜属、藜属、甜菜属、大黄属、麦蓝菜属、肥皂草属和石头花属;(c)当所述植物包含茄目植物时,所述植物选自茄属、辣椒属、烟草属、莨菪属、曼陀罗属和颠茄属;(d)当所述植物包含豆目(Fabales)植物时,所述植物选自甘草属、苜蓿属、大豆属、百脉根属、鹰嘴豆属、菜豆属、豌豆属、花生属、羽扇豆属和金合欢属;(e)当所述植物包含锦葵目(Malvales)植物时,所述植物选自可可属;(f)当所述植物细胞包含伞形目(Apiales)植物时,所述植物选自胡萝卜属、芹属、香芹菜属、人参属、柴胡属、常春藤属和积雪草属;或(g)当所述植物包含十字花目(Brassicales)植物时,所述植物选自拟南芥属、芸苔属、山柑属和番木瓜属。
在一些实施方案中,(a)当所述植物包含石竹目植物时,所述植物选自菠菜、甜菜根和奎藜籽;(b)当所述植物包含茄目(Solanales)植物时,所述植物选自番茄、野生番茄、马铃薯、野生马铃薯、茄子、胡椒、甜椒、卡宴辣椒、红辣椒、甘椒、塔巴斯科辣椒、地樱桃、烟草和南蛇藤;或(c)当所述植物包含豆目(Fabales)植物时,所述植物选自紫苜蓿、大豆、百脉根和甘草。
在一些实施方案中,所述植物是番茄植物,其具有:(i)含量增加的α-番茄素或其衍生物、其代谢物或其生物合成中间体;或番茄碱或其衍生物、其代谢物或其生物合成中间体;或甾体皂苷或其衍生物、其代谢物或其生物合成中间体;或(ii)含量改变的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,所述植物是番茄植物,其具有:(i)含量增加的α-番茄素或其衍生物、其代谢物或其生物合成中间体;或番茄碱或其衍生物、其代谢物或其生物合成中间体;或甾体皂苷或其衍生物、其代谢物或其生物合成中间体;或(ii)含量减少的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,所述植物是马铃薯植物,其具有:(i)含量增加的α-查茄碱或其衍生物、其代谢物或其生物合成中间体;或α-茄碱或其衍生物、其代谢物或其生物合成中间体;或甾体皂苷或其衍生物、其代谢物或其生物合成中间体;或(ii)含量改变的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,所述植物是马铃薯植物,其具有:(i)含量增加的α-查茄碱或其衍生物、其代谢物或其生物合成中间体;或α-茄碱或其衍生物、其代谢物或其生物合成中间体;或甾体皂苷或其衍生物、其代谢物或其生物合成中间体;或(ii)含量减少的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,所述植物是茄子植物,其具有:(i)含量增加的α-澳洲茄碱或其衍生物、其代谢物或其生物合成中间体;或α-澳洲茄边碱或其衍生物、其代谢物或其生物合成中间体;或甾体皂苷或其衍生物、其代谢物或其生物合成中间体;或(ii)含量改变的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,所述植物是茄子植物,其具有:(i)含量增加的α-澳洲茄碱或其衍生物、其代谢物或其生物合成中间体;或α-澳洲茄边碱或其衍生物、其代谢物或其生物合成中间体;或甾体皂苷或其衍生物、其代谢物或其生物合成中间体;或(ii)含量减少的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,所述植物细胞包含叶细胞、叶柄细胞、植物茎或柄细胞、根细胞、芽细胞、块茎细胞、豆细胞、谷粒或果仁细胞、果实细胞、坚果细胞、豆荚细胞、种子或种子细胞、愈伤组织细胞、苞片细胞、愈伤组织细胞和花细胞。
本文具体地公开一种在遗传修饰的细胞中生产甾体生物碱、甾体皂苷或三萜皂苷的方法,所述方法包含:(a)将至少一种异源基因引入所述细胞中,所述至少一种异源基因编码纤维素合酶样G(CSLG)酶,其中所述异源基因任选地被包含在载体中;以及(b)在所述细胞中表达所述至少一种异源基因;其中所述细胞包含与相应的未修饰的细胞相比含量增加的至少一种甾体生物碱、至少一种甾体皂苷或至少一种三萜皂苷。
在一些实施方案中,所述引入还包含将至少一种其他异源基因引入所述细胞中,所述异源基因选自编码皂苷β-香树素合酶、细胞色素P450、糖基转移酶、酰基转移酶和UDP-葡萄糖6-脱氢酶I或其任何组合的组,其中所述至少一种其他异源基因任选地包含在载体中;并且还包含在所述细胞中表达所述至少一种其他异源基因。
在一些实施方案中,(a)所述至少一种异源基因可操作地连接到启动子、转录终止序列或其组合;或(b)所述至少一种其他异源基因可操作地连接到启动子、转录终止序列或其组合;或(c)
(a)和(b)的其组合。
在一些实施方案中,所述引入包含用以下来转化所述至少一种细胞:(a)所述至少一种异源基因或编码所述至少一种异源基因的多核苷酸序列,或包含所述至少一种异源基因的载体;或(b)所述至少一种其他异源基因或编码所述至少一种其他异源基因的多核苷酸序列,或包含所述至少一种其他异源基因的载体;或(c)(a)及(b)的组合;其中所述表达包含瞬时表达或组成型表达。
本文中具体地公开一种降低至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体在植物或植物部分的至少一种细胞中含量的方法,所述方法包含对所述至少一种植物细胞进行遗传修饰,所述遗传修饰包含:(a)使用靶向编码纤维素合酶样G(CSLG)酶的核酸基因序列的至少一种沉默分子来转化所述至少一种植物细胞;或(b)诱变编码纤维素合酶样G(CSLG)酶的至少一个核酸序列,其中所述诱变包含(1)将一个或多个点突变引入所述核酸序列中,(2)将缺失引入所述核酸序列内;或(3)将插入引入所述核酸内,或(4)其任何组合,其中所述引入包含对编码或非编码序列进行诱变;其中编码所述CSLG酶的基因的表达与其在相应的未修饰的植物细胞中的表达相比,在所述遗传修饰的植物细胞中降低,其中包含所述遗传修饰的细胞的所述植物包含与相应的未修饰的植物相比,含量减少的以下物质:至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体。
在某些实施方案中:(a)当CSLG的核酸在SEQ ID NO:30中示出时,沉默分子在SEQID NO:42或其互补序列,或与SEQ ID NO:42或其互补序列所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;(b)当CSLG的核酸在SEQ ID NO:34中示出时,沉默分子在SEQ ID NO:43或其互补序列,或与SEQ ID NO:43或其互补序列所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;(c)当CSLG的核酸在SEQ ID NO:38中示出时,沉默分子在SEQ ID NO:44或其互补序列或与SEQ ID NO:44或其互补序列所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;(d)当CSLG的核酸在SEQ ID NO:65或SEQ ID NO:93中示出时,沉默分子在SEQ ID NO:106中或其互补序列,或与SEQ ID NO:65所示的核酸序列或SEQ ID NO:93所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;或(e)当CSLG的核酸在SEQ IDNO:95中示出时,所述沉默分子在SEQ ID NO:107或其互补序列,或与SEQ ID NO:95所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出。
在某些实施方案中:(a)所述甾体生物碱、所述甾体皂苷或所述三萜皂苷包含毒性或苦味化合物或具有激素模拟特性,或其组合;或(b)所述甾体糖苷生物碱包含α-番茄素、番茄素、α-查茄碱、α-茄碱、α-澳洲茄碱、α-澳洲茄边碱或其任何组合;或(c)所述甾体皂苷包含龙葵皂苷B和番茄甙及其相关化合物(所有甾体皂苷家族)、途径中间体和衍生物,或其任何组合;或(d)所述三萜皂苷包含苜蓿酸3-O-葡萄糖醛酸苷(MA-3-GlcA)(化合物6)、化合物7、化合物8、化合物9、化合物10、化合物11、甘草皂苷(化合物14)、甘草次酸3-O-单葡萄糖醛酸苷(化合物15)、巴约甙元(化合物25)、巴约甙元-hexA-hex-hex(化合物31)、瓜瓶藤酸(化合物26)、瓜瓶藤酸-hexA-hex(化合物32)、大豆甾醇A(化合物29)、大豆皂醇B(化合物30)、大豆甾醇A-hexA-hex-pent(化合物34)、大豆皂苷VI(化合物35)、甜菜甙IV(化合物33)、常春藤苷配基-3GlcA、丝石竹皂苷配基-3GlcA、丝石竹酸-3GlcA或QS-21佐剂或其任何组合;或(e)所述中间体包含化合物1、化合物2、苜蓿酸(化合物5)、齐墩果酸(化合物3)、齐墩果酸-3GlcA、奥古斯丁酸(化合物4)、奥古斯丁酸-3GlcA或甘草次酸(化合物13)或其任何组合;或(f)其组合。
在某些实施方案中,需要减少三萜皂苷,例如但不限于在奎藜籽中具有苦味或有毒的三萜皂苷。可能需要减少三萜皂苷的其他实例包括具有毒性或拟态激素的三萜皂苷。因此,在某些实施方案中,增加三萜皂苷的生成量是有益的,而在其他实施方案中,减少三萜皂苷的生成量是有益的。
在一些实施方案中,所述方法还包含改变以下物质的含量:植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,所述方法还包含增加以下物质的含量:植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
根据一些实施方案,所述方法还包含纯化从被转化植物中提取的以下物质:植物固醇或其衍生物、代谢物或其生物合成中间体;胆固醇或其衍生物、代谢物或生物合成中间体;植物甾醇或其衍生物、代谢物或生物合成中间体;胆甾烯醇或其衍生物、代谢物或生物合成中间体;或植物胆甾烯醇或其衍生物、代谢物或生物合成中间体。根据某些实施方案,所述植物固醇包含植物甾醇。根据一些实施方案,从被转化植物中提取的植物固醇或其衍生物、代谢物或生物合成中间体;胆固醇或其衍生物、代谢物或生物合成中间体;植物甾醇或其衍生物、代谢物或生物合成中间体;胆甾烯醇或其衍生物、代谢物或生物合成中间体;或植物胆甾烯醇或其衍生物、代谢物或生物合成中间体包含:营养素或食品添加剂、高价值甾体化合物(例如前维生素D和/或薯蓣皂苷配基)、抗胆固醇剂(例如在哺乳动物或禽类内脏中与膳食胆固醇竞争的植物固醇)或美容剂。
本文中具体地公开一种增加至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体在植物或植物部分的至少一种细胞中含量的方法,所述方法包含对所述至少一种植物细胞进行遗传修饰,所述遗传修饰包含:(a)诱变编码纤维素合酶样G(CSLG)酶的至少一个核酸序列,其中所述诱变包含(1)将一个或多个点突变引入所述核酸序列中,(2)将缺失引入所述核酸序列内;或(3)将插入引入所述核酸内,或(4)其任何组合,其中所述引入包含对编码或非编码序列进行诱变;以及(b)表达编码所述CSLG的所述核酸;其中包含所述遗传修饰的细胞的所述植物包含与相应的未修饰的植物相比,含量增加的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体。
在某些实施方案中:(a)所述甾体生物碱、所述甾体皂苷或所述三萜皂苷包含毒性或苦味化合物或具有激素模拟特性,或其组合;或(b)所述甾体糖苷生物碱包含α-番茄素、番茄素、α-查茄碱、α-茄碱、α-澳洲茄碱、α-澳洲茄边碱或其任何组合;或(c)所述甾体皂苷包含龙葵皂苷B、番茄甙或其任何组合;或(d)所述三萜皂苷包含苜蓿酸3-O-葡萄糖醛酸苷(MA-3-GlcA)(化合物6)、化合物7、化合物8、化合物9、化合物10、化合物11、甘草皂苷(化合物14)、甘草次酸3-O-单葡萄糖醛酸苷(化合物15)、巴约甙元(化合物25)、巴约甙元-hexA-hex-hex(化合物31)、瓜瓶藤酸(化合物26)、瓜瓶藤酸-hexA-hex(化合物32)、大豆甾醇A(化合物29)、大豆皂醇B(化合物30)、大豆甾醇A-hexA-hex-pent(化合物34)、大豆皂苷VI(化合物35)、甜菜甙IV(化合物33)、常春藤苷配基-3GlcA、丝石竹皂苷配基-3GlcA、丝石竹酸-3GlcA或QS-21佐剂,或其任何组合;或(e)所述中间体包含化合物1、化合物2、苜蓿酸(化合物5)、齐墩果酸(化合物3)、齐墩果酸-3GlcA、奥古斯丁酸(化合物4)、奥古斯丁酸-3GlcA或甘草次酸(化合物13),或其任何组合;或(f)其组合。
在某些实施方案中:(a)与编码CSLG酶的基因在相应的未修饰的植物细胞中的表达相比,所述编码CSLG酶的基因在所述遗传修饰的植物细胞中的表达增加,或(b)与所述被编码的CSLG酶在相应的未修饰的植物细胞中的活性相比,所述被编码的CSLG酶在所述遗传修饰的植物细胞中的活性增加,或(c)与所述被编码的CSLG酶在相应的未修饰的植物细胞中的稳定性相比,所述被编码的CSLG酶在所述遗传修饰的植物细胞中的稳定性增加,或(d)以上(a)、(b)和(c)的其任何组合。
在一些实施方案中,所述方法还包含改变植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体的含量。
在一些实施方案中,所述方法还包含降低以下物质的含量:植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
本文的每种可能性代表本发明的单独的实施方案。
遗传修饰的细胞以及遗传修饰的植物
本文公开了遗传修饰的细胞以及遗传修饰的植物,其中甾体糖苷生物碱/甾体皂苷/三萜皂苷代谢途径(甾体生物碱、甾体皂苷和三萜皂苷的生物合成途径)中关键基因的表达已被改变。改变这些基因的表达会致使甾体生物碱谱、甾体皂苷谱或三萜化合物谱随之变化。在非限制性实施例中,改变甾体生物碱的生产水平可以致使植物中对病原体抗性更高的甾体生物碱含量增加,进而使得植物得到改良,或可致使这些次要化合物在植物可食部分中的含量减少,从而产生改良的作物,其中所述改良作物中的抗营养物成分减少或被消除。替代地或附加地,在另一个非限制性实施例中,控制本文公开的基因的表达可以用于生成预期的甾体生物碱或植物基胆固醇,以进一步用于例如营养、化妆品或制药工业。在另一个非限制性实施例中,本文公开了用于生成茄目和其他目作物植物的装置和方法,所述作物植物中不含通常存在于这些植物的可食用部分中的毒性量的有害甾体生物碱。因此,本文公开的细胞和植物具有显著的营养和商业价值。
本文公开了参与甾体生物碱、甾体皂苷或三萜皂苷的生物合成途径中的共表达基因的阵列。本发明进一步公开此途径中的关键基因,其中改变所述关键基因的表达会致使甾体生物碱谱、甾体皂苷谱或三萜谱随之改变。在一个非限制性实施例中,改变甾体生物碱的生产水平可以致使植物中对病原体抗性更高的甾体生物碱含量增加,进而使得植物得到改良,或可致使这些次要化合物在植物可食部分中的含量减少,从而产生改良的作物。替代地或附加地,在一个非限制性实施例中,控制本文公开的基因的表达可以用于生成预期的甾体生物碱或植物基胆固醇或其他植物固醇,以进一步用于例如营养、化妆品或制药工业中。因此,本发明的细胞和植物因此具有显著的营养、美容、药物和商业价值。
本文公开了遗传修饰的细胞(例如,植物细胞、酵母细胞、藻细胞、细菌细胞、昆虫细胞)以及包含至少一种遗传修饰的细胞的植物,其中所述遗传修饰的细胞表达对所述甾体生物碱/甾体皂苷/三萜皂苷的生物合成途径中的酶进行编码的至少一种异源基因。在一些实施方案中,这些酶包括纤维素合酶样G(CSLG)酶,以及皂苷β-香树素合酶、细胞色素P450、糖基转移酶和酰基转移酶。
在一些实施方案中,本文所公开的遗传修饰的细胞表达对酶进行编码的至少一种异源CSLG,所述酶选自皂苷β-香树素合酶、细胞色素P450、糖基转移酶、酰基转移酶、UDP-葡萄糖6-脱氢酶1和纤维素合酶样G(CSLG)。图1提供茄科植物(此处为番茄)的始于胆固醇的三萜生物合成途径中的甾体生物碱和甾体皂苷的非限制性实施例,其中技术人员应认识到,所述途径可以包含皂苷糖苷配基和糖基化甾体生物碱生物合成中间体和糖基化皂苷生物合成中间体的生成,进而致使甾体生物碱(例如α-番茄素)或甾体皂苷(例如龙葵皂苷B)的产生。图20A提供菠菜中三萜皂苷途径的非限制性实施例,其中技术人员应认识到,此途径可以包含皂苷糖苷配基和糖基化皂苷生物合成中间体的生成,进而致使三萜皂苷的生成(Yossoside V;化合物11)。
在一些实施方案中,改变甾体生物碱/甾体皂苷/三萜皂苷生物合成途径中至少一种基因的表达,致使此途径的甾体生物碱谱或中间体、此途径的甾体皂苷谱或中间体,或此途径的三萜皂苷谱或中间体随之改变。在一些实施方案中,与相应的未修饰的细胞相比,所述遗传修饰的细胞中的表达改变包含表达的增加。在一些实施方案中,表达的增加包含从编码先前不存在于细胞中的酶的基因的从头表达。在一些实施方案中,表达的增加包含对细胞中已经存在的基因的表达的增加。在一些实施方案中,表达的增加导致被编码的酶的量增加。
在一些实施方案中,所述甾体生物碱谱的改变包含至少一种甾体生物碱或其中间体的增加。在一些实施方案中,所述甾体生物碱谱的改变包含至少一种甾体生物碱或其中间体的减少。
在一些实施方案中,所述甾体皂苷谱的改变包含至少一种甾体皂苷或其中间体的增加。在一些实施方案中,所述甾体皂苷谱的改变包含至少一种甾体皂苷或其中间体的减少。
在一些实施方案中,所述三萜皂苷谱的改变包含至少一种三萜皂苷或其中间体的增加。在一些实施方案中,所述三萜皂苷谱的改变包含至少一种三萜皂苷或其中间体的减少。
在一些实施方案中,将编码甾体生物碱/甾体皂苷/三萜皂苷生物合成途径中的至少一种酶的核苷酸序列引入异源细胞(例如但不限于植物细胞、藻细胞、酵母细胞、昆虫细胞或细菌细胞)或有机体(例如但不限于植物),致使所述至少一种酶的表达增加,进而致使甾体生物碱、甾体皂苷或三萜皂苷的生成量增加。在一些实施方案中,将编码甾体生物碱/甾体皂苷/三萜皂苷生物合成途径中的至少一种酶的核苷酸序列引入异源细胞或有机体中,致使生成非异源细胞(例如但不限于植物细胞、藻细胞、酵母细胞、昆虫细胞或细菌细胞)或有机体(例如但不限于植物)天然产生的甾体生物碱、甾体皂苷或三萜皂苷。
本文通篇描述了遗传修饰的细胞及其用途。在一些实施方案中,遗传修饰的细胞选自藻细胞、酵母细胞、昆虫细胞或细菌细胞中的任一。本领域技术人员将了解如何使用本文公开的基因和核酸序列对真核细胞例如哺乳动物细胞,或原核细胞例如细菌进行遗传修饰,以产生至少一种甾体生物碱、甾体皂苷、或三萜皂苷。此外,所属领域中的技术人员可以使用本文公开的基因和核酸序列在无细胞体外系统中产生至少一种甾体生物碱、甾体皂苷或三萜皂苷。在一些实施方案中,所述遗传修饰的细胞是植物细胞,并且所述植物细胞用于生成至少一种甾体生物碱、甾体皂苷或三萜皂苷。在一些实施方案中,所述遗传修饰的细胞是植物细胞或酵母细胞,并且所述植物细胞或酵母用于生成至少一种甾体生物碱、甾体皂苷或三萜皂苷。在一些实施方案中,所述遗传修饰的细胞是酵母细胞,并且所述酵母细胞用于生成至少一种甾体生物碱、甾体皂苷或三萜皂苷。在一些实施方案中,所述遗传修饰的细胞是藻细胞,并且所述藻细胞用于生成至少一种甾体生物碱、甾体皂苷或三萜皂苷。在一些实施方案中,所述遗传修饰的细胞是昆虫细胞,并且所述昆虫细胞用于生成至少一种甾体生物碱、甾体皂苷或三萜皂苷。在一些实施方案中,所述遗传修饰的细胞是细菌,并且所述细菌用于生成至少一种甾体生物碱、甾体皂苷或三萜皂苷。在一些实施方案中,所述遗传修饰的细胞是包含在植物或植物部分内的植物细胞,并且所述植物细胞用于生成所述植物或植物部分内的至少一种甾体生物碱、甾体皂苷或三萜皂苷。在一些实施方案中,所述遗传修饰的细胞是包含在植物或植物部分内的植物细胞,并且所述植物细胞用于减少所述植物或植物部分内的至少一种甾体生物碱、甾体皂苷或三萜皂苷的生成。在一些实施方案中,所述遗传修饰的细胞是包含在植物或植物部分内的植物细胞,并且所述植物细胞用于增加所述植物或植物部分内的至少一种甾体生物碱、甾体皂苷或三萜皂苷的生成。
在一些实施方案中,异源表达包含在第二植物物种中表达来自一种植物物种的至少一种异源植物基因(参见例如下文中的实施例23)。在一些实施方案中,异源表达包含在酵母细胞中表达来自一种植物物种的至少一种异源植物基因(参见例如下文中的实施例21)。在一些实施方案中,异源表达包含在藻细胞中表达来自一种植物物种的至少一种异源植物基因。在一些实施方案中,异源表达包含在细菌细胞中表达来自一种植物物种的至少一种异源植物基因。在一些实施方案中,异源表达包含在昆虫细胞中表达来自一种植物物种的至少一种异源植物基因。在一些实施方案中,异源表达包含在植物细胞中表达来自一种植物物种的至少一种异源植物基因,其中所述植物属于不同的物种。
在一些实施方案中,表达编码选自甾体生物碱、甾体皂苷或三萜皂苷生物合成途径中的酶的至少一种异源基因会改变此该途径所生成的甾体生物碱、甾体皂苷或三萜皂苷的含量,或改变其至少一种生物合成中间体的含量,或其组合。在一些实施方案中,表达编码选自甾体生物碱,甾体皂苷或三萜皂苷生物合成途径中的至少两种酶的多种异源基因会改变此该途径所生成的甾体生物碱、甾体皂苷或三萜皂苷的含量,或改变其至少一种生物合成中间体的含量,或其组合。在一些实施方案中,表达编码选自甾体生物碱、甾体皂苷或三萜皂苷生物合成途径中的至少三种酶的多种异源基因会改变此该途径所生成的甾体生物碱、甾体皂苷或三萜皂苷的含量,或改变其至少一种生物合成中间体的含量,或其组合。在一些实施方案中,表达编码选自甾体生物碱、甾体皂苷或三萜皂苷生物合成途径中的至少四种酶的多种异源基因会改变此该途径所生成的甾体生物碱、甾体皂苷或三萜皂苷的含量,或改变其至少一种生物合成中间体的含量,或其组合。在一些实施方案中,表达编码选自甾体生物碱、甾体皂苷或三萜皂苷生物合成途径中的至少五种酶的多种异源基因会改变此该途径所生成的甾体生物碱、甾体皂苷或三萜皂苷的含量,或改变其至少一种生物合成中间体的含量,或其组合。在一些实施方案中,表达编码选自甾体生物碱、甾体皂苷或三萜皂苷生物合成途径中的至少六种酶的多种异源基因会改变此该途径所生成的甾体生物碱、甾体皂苷或三萜皂苷的含量,或改变其至少一种生物合成中间体的含量,或其组合。在一些实施方案中,表达编码选自甾体生物碱、甾体皂苷或三萜皂苷生物合成途径中的至少七种酶的多种异源基因会改变此该途径所生成的甾体生物碱、甾体皂苷或三萜皂苷的含量,或改变其至少一种生物合成中间体的含量,或其组合。在一些实施方案中,表达编码选自甾体生物碱、甾体皂苷或三萜皂苷生物合成途径中的至少八种酶的多种异源基因会改变此该途径所生成的甾体生物碱、甾体皂苷或三萜皂苷的含量,或改变其至少一种生物合成中间体的含量,或其组合。在一些实施方案中,表达编码选自甾体生物碱、甾体皂苷或三萜皂苷生物合成途径中的至少九种酶的多种异源基因会改变此该途径所生成的甾体生物碱、甾体皂苷或三萜皂苷的含量,或改变其至少一种生物合成中间体的含量,或其组合。在一些实施方案中,表达编码选自甾体生物碱、甾体皂苷或三萜皂苷生物合成途径中的至少十种酶的多种异源基因会改变此该途径所生成的甾体生物碱、甾体皂苷或三萜皂苷的含量,或改变其至少一种生物合成中间体的含量,或其组合。
在一些实施方案中,本文提供一种遗传修饰的细胞,所述遗传修饰的细胞与相应的未修饰的细胞相比,具有表达增加的至少一种异源基因,所述至少一种异源基因编码纤维素合酶样G(CSLG)酶,其中所述遗传修饰的细胞包含与相应的未修饰的细胞相比,含量增加的至少一种甾体生物碱、甾体皂苷或三萜皂苷、其衍生物、其代谢物或其生物合成中间体。在一些实施方案中,所述遗传修饰的细胞还表达编码酶的至少一种其他异源基因,所述酶选自皂苷β-香树素合酶、细胞色素P450、糖基转移酶、酰基转移酶和UDP-葡萄糖6-脱氢酶1或其任何组合。
在一些实施方案中,甾体生物碱的衍生物、甾体皂苷的衍生物或三萜皂苷的衍生物分别包含甾体生物碱的糖基化衍生物、甾体皂苷的糖基化衍生物或三萜皂苷的糖基化衍生物。
在一些实施方案中,遗传修饰的细胞表达异源CSLG和异源皂苷β-香树素合酶。在一些实施方案中,遗传修饰的细胞表达异源CSLG和至少一种异源细胞色素P450。在一些实施方案中,遗传修饰的细胞表达异源CSLG以及1、2或3种异源细胞色素P450。在一些实施方案中,遗传修饰的细胞表达异源CSLG、异源皂苷β-香树素合酶,以及1、2或3种异源细胞色素P450。在一些实施方案中,遗传修饰的细胞表达异源CSLG以及至少一种异源糖基转移酶。在一些实施方案中,遗传修饰的细胞表达异源CSLG以及至少1、2、3或4种异源糖基转移酶。在一些实施方案中,遗传修饰的细胞表达异源CSLG、异源皂苷β-香树素合酶,以及至少1、2、3或4种异源糖基转移酶。在一些实施方案中,遗传修饰的细胞表达异源CSLG、异源皂苷β-香树素合酶,至少1、2或3种异源细胞色素P450,以及至少1、2、3或4种异源糖基转移酶。
在某些情况下,可能有必要表达并非特别为甾体生物碱、甾体皂苷或三萜皂苷途径一部分的额外同源或异源基因,以使得必要物质是可获得的。在一些实施方案中,遗传修饰的细胞表达异源基因,所述异源基因编码生成甾体生物碱、甾体皂苷或三萜皂苷生物合成途径的底物所必需的酶。
在一些实施方案中,编码选自皂苷β-香树素合酶、细胞色素P450、C-2羟化酶、C-23氧化酶、糖基转移酶、UDP-葡萄糖6-脱氢酶1、酰基转移酶或纤维素样合酶G(CSLG)中的酶的异源基因在遗传修饰的细胞中表达。在一些实施方案中,编码选自皂苷β-香树素合酶、细胞色素P450、C-2羟化酶、C-23氧化酶、糖基转移酶、酰基转移酶或纤维素样合酶G(CSLG)中的酶的异源基因在遗传修饰的细胞中表达。在一些实施方案中,编码选自皂苷β-香树素合酶、细胞色素P450、糖基转移酶、UDP-糖基转移酶、岩藻糖基转移酶、木糖基转移酶、酰基转移酶、BAHD-酰基转移酶或纤维素样合酶G(CSLG)中的酶的异源基因在遗传修饰的细胞中表达。
在一些实施方案中,遗传修饰的细胞表达至少一种异源基因,所述至少一种异源基因编码包含CSLG活性的酶。在一些实施方案中,遗传修饰的细胞表达至少一种异源基因,所述至少一种异源基因编码包含皂苷β-香树素合酶活性的酶。在一些实施方案中,遗传修饰的细胞表达至少一种异源基因,所述至少一种异源基因编码包含细胞色素P450活性的酶。在一些实施方案中,遗传修饰的细胞表达至少两种异源基因,所述至少两种异源基因编码包含细胞色素P450活性的两种酶。在一些实施方案中,遗传修饰的细胞表达至少三种异源基因,所述至少三种异源基因编码包含细胞色素P450活性的酶。在一些实施方案中,包含细胞色素P450活性的酶包含C-2羟化酶活性。在一些实施方案中,包含细胞色素P450活性的酶包含C-23氧化酶活性。
在一些实施方案中,遗传修饰的细胞表达异源基因,所述异源基因编码包含皂苷β-香树素合酶活性、细胞色素P450活性和CSLG活性的酶,其中所述细胞色素P450酶可以包含提供C-2羟化酶活性的酶、提供C-23氧化酶活性的酶;以及提供细胞色素P450活性的酶、提供C-2羟化酶活性的酶以及提供C-23氧化酶活性的酶的组合。
在一些实施方案中,遗传修饰的细胞表达至少一种异源基因,所述至少一种异源基因编码糖基转移酶活性。在一些实施方案中,糖基转移酶包含UDP-糖基转移酶、岩藻糖基转移酶或木糖基转移酶。在一些实施方案中,遗传修饰的细胞表达多种异源基因,所述多种异源基因编码糖基转移酶。在一些实施方案中,遗传修饰的细胞表达多种异源基因,所述多种异源基因编码选自UDP-糖基转移酶、岩藻糖基转移酶或木糖基转移酶或其组合中的糖基转移酶。在一些实施方案中,遗传修饰的细胞表达多种异源基因,所述多种异源基因编码选自所属领域中已知的糖基转移酶的组合中的糖基转移酶。在一些实施方案中,遗传修饰的细胞表达编码CSLG活性的异源基因以及编码至少一种糖基转移酶活性的异源基因。在一些实施方案中,遗传修饰的细胞表达编码CSLG活性的异源基因,以及编码选自UDP-糖基转移酶、岩藻糖基转移酶或木糖基转移酶或其组合中的至少一种糖基转移酶活性的异源基因。在一些实施方案中,遗传修饰的细胞表达编码CSLG活性的异源基因,以及编码选自UDP-糖基转移酶、岩藻糖基转移酶或木糖基转移酶,或所属领域中的任何糖基转移酶,或其组合中的至少一种糖基转移酶活性的异源基因。
在一些实施方案中,遗传修饰的细胞表达编码糖基转移酶的异源基因。在一些实施方案中,遗传修饰的细胞表达异源基因,所述异源基因编码苄醇乙酰基-、花色素苷-O-羟基-苯乙烯醛基-、邻氨基苯甲酸盐-N-羟基-苯乙烯醛基/苯甲酰基-、脱乙酰基温都林乙酰基转移酶(BAHD)酰基转移酶。在一些实施方案中,遗传修饰的细胞表达编码提供CSLG活性的酶的异源基因以及编码提供乙酰基转移酶活性的酶的异源基因。在一些实施方案中,遗传修饰的细胞表达编码提供CSLG活性的异源基因以及编码提供BAHD乙酰基转移酶活性的酶的异源基因。
在一些实施方案中,遗传修饰的细胞表达异源基因,所述异源基因编码提供三萜皂苷底物的酶活性的酶,其中此酶包含糖基转移酶。在一些实施方案中,遗传修饰的细胞表达异源基因,所述异源基因编码提供三萜皂苷底物的酶活性的酶,其中此酶包含UDP-葡萄糖6-脱氢酶1。在一些实施方案中,例如当细胞是细菌细胞时,异源基因编码角鲨烯环氧酶或细胞色素P450还原酶或UDP-葡萄糖6-脱氢酶1或其任何组合。
在一些实施方案中,本文公开了一种遗传修饰的植物,所述遗传修饰的植物包含与相应的未修饰的细胞中的CSLG表达相比,至少CSLG基因的表达改变的至少一种细胞,其中所述至少一种细胞包含异源CSLG基因,并且所述表达改变包含所述异源基因的从头表达。在一些实施方案中,本文公开了一种遗传修饰的植物,所述遗传修饰的植物包含与相应的未修饰的细胞中的CSLG表达相比,至少CSLG基因的表达改变的至少一种细胞,其中所述至少一种细胞包含异源CSLG基因,并且所述表达改变包含所述异源基因在内源基因的存在下的表达,所述内源基因可以是功能性的或非功能性的。
在一些实施方案中,异源CSLG基因的表达是遗传修饰的植物,所述遗传修饰的植物包含与相应的未修饰的细胞相比而言增加的表达,并且其中所述植物中的所述细胞包含与相应的未修饰的植物相比,含量改变的以下物质:至少三萜皂苷、其代谢物、其衍生物或其生物合成中间体。
在一些实施方案中,本文公开了参与三萜皂苷生物合成途径中的酶的阵列,其中所述生物合成途径包括皂苷糖苷配基和糖基化皂苷以及糖基化三萜皂苷的生成。在一些实施方案中,本文公开了编码参与三萜皂苷生物合成途径中的酶的基因阵列,其中所述生物合成途径包括以下物质的生成:皂苷糖苷配基和糖基化皂苷,以及糖基化三萜皂苷,包括但不限于3-O-[β-D-吡喃木糖基-(1–>3)-β-D-葡萄糖醛酸吡喃糖基]-28-O-[β-D-葡糖吡喃糖-(1–>4)-α-L-吡喃鼠李糖基-(1–>2)-4-乙酰基-β-D-岩藻糖吡喃糖基]-苜蓿酸(Yossoside V;化合物11);3-O-[β-D-吡喃木糖基-(1–>3)-β-D-葡萄糖醛酸吡喃糖基]-28-O-[β-D-葡糖吡喃糖基-(1->4)-α-L-吡喃鼠李糖基-(1->2)-β-D-岩藻糖吡喃糖基]-苜蓿酸(Yossoside IV;化合物10);3-O-[β-D-葡萄糖醛酸吡喃糖基]-28-O-[β-D-葡糖吡喃糖基-(1->4)-α-L-吡喃鼠李糖基-(1->2)-β-D-葡糖呋喃糖基]-苜蓿酸(Yossoside III;化合物9);3-O-[β-D-葡萄糖醛酸吡喃糖基]-28-O-[α-L-吡喃鼠李糖基-(1–>2)-β-D-葡糖呋喃糖基]-苜蓿酸(Yossoside II;化合物8);以及3-O-β-D-葡萄糖醛酸吡喃糖基-28-O-β-D-葡糖呋喃糖基-苜蓿酸(Yossoside I;化合物7)(参见图20A)。
例如但不限于在化合物11的菠菜三萜生物合成途径中具有活性的酶,其在实施例中有详细描述。实施例20中提供的表16提供菠菜生物合成途径中酶的氨基酸和核酸序列,其中CSLG酶将葡萄糖醛酸添加至苜蓿酸,以制备三萜皂苷苜蓿酸3-葡萄糖醛酸苷。实施例24中公开的表19提供从拟南芥属分离的CSLG的氨基酸序列。实施例中公开的表17提供了来自其他植物物种的CSLG同源物的核酸和氨基酸序列。
在一些实施方案中,本文所公开的遗传修饰的细胞表达至少一种异源基因,所述至少一种异源基因编码包含在甾体生物碱、甾体皂苷或三萜生物合成途径中的一种酶。在一些实施方案中,本文所公开的遗传修饰的细胞表达异源基因阵列,所述异源基因阵列编码包含在甾体生物碱、甾体皂苷或三萜生物合成途径中的多种酶。在一些实施方案中,本文所公开的遗传修饰的细胞表达至少两种异源基因,所述至少两种异源基因编码包含在甾体生物碱、甾体皂苷或三萜生物合成途径中的两种酶。在一些实施方案中,本文所公开的遗传修饰的细胞表达至少三种异源基因,所述至少三种异源基因编码包含在甾体生物碱、甾体皂苷或三萜生物合成途径中的三种酶。在一些实施方案中,本文所公开的遗传修饰的细胞表达至少四种异源基因,所述至少四种异源基因编码包含在甾体生物碱、甾体皂苷或三萜生物合成途径中的四种酶。在一些实施方案中,本文所公开的遗传修饰的细胞表达至少5种异源基因,所述至少5种异源基因编码包含在甾体生物碱、甾体皂苷或三萜生物合成途径中的五种酶。在一些实施方案中,本文所公开的遗传修饰的细胞表达至少六种异源基因,所述至少六种异源基因编码包含在甾体生物碱、甾体皂苷或三萜生物合成途径中的六种酶。在一些实施方案中,本文所公开的遗传修饰的细胞表达至少七种异源基因,所述至少七种异源基因编码包含在甾体生物碱、甾体皂苷或三萜生物合成途径中的七种酶。在一些实施方案中,本文所公开的遗传修饰的细胞表达至少八种异源基因,所述至少八种异源基因编码包含在甾体生物碱、甾体皂苷或三萜生物合成途径中的八种酶。在一些实施方案中,本文所公开的遗传修饰的细胞表达至少九种异源基因,所述至少九种异源基因编码包含在甾体生物碱、甾体皂苷或三萜生物合成途径中的九种酶。在一些实施方案中,本文所公开的遗传修饰的细胞表达至少十种异源基因,所述至少十种异源基因编码包含在甾体生物碱、甾体皂苷或三萜生物合成途径中的十种酶。
在一些实施方案中,本文中公开一种遗传修饰的植物,所述遗传修饰的植物包含与相应的未修饰的植物中的纤维素合酶样G(CSLG)的表达相比,具有至少一种CSLG基因的表达改变的至少一种细胞,并且其中所述遗传修饰的植物与相应的未修饰的植物相比,具有含量改变的至少一种甾体生物碱、其衍生物、其代谢物,或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体。在一些实施方案中,所述CSLG基因包含内源CSLG基因。在一些实施方案中,所述CSLG基因包含异源CSLG基因。
在一些实施方案中,甾体生物碱的衍生物、甾体皂苷的衍生物或三萜皂苷的衍生物分别包含甾体生物碱的糖基化衍生物、甾体皂苷的糖基化衍生物或三萜皂苷的糖基化衍生物。
在一些实施方案中,本文所公开的遗传修饰的植物或植物部分表达至少一种异源基因,所述至少一种异源基因编码包含在甾体生物碱、甾体皂苷或三萜生物合成途径中的一种酶。在一些实施方案中,本文所公开的遗传修饰的植物或植物部分表达异源基因阵列,所述异源基因阵列编码包含在甾体生物碱、甾体皂苷或三萜生物合成途径中的多种酶。在一些实施方案中,本文所公开的遗传修饰的植物或植物部分表达至少两种异源基因,所述至少两种异源基因编码包含在甾体生物碱、甾体皂苷或三萜生物合成途径中的两种酶。在一些实施方案中,本文所公开的遗传修饰的植物或植物部分表达至少三种异源基因,所述至少三种异源基因编码包含在甾体生物碱、甾体皂苷或三萜生物合成途径中的三种酶。在一些实施方案中,本文所公开的遗传修饰的植物或植物部分表达至少四种异源基因,所述至少四种异源基因编码包含在甾体生物碱、甾体皂苷或三萜生物合成途径中的四种酶。在一些实施方案中,本文所公开的遗传修饰的植物或植物部分表达至少5种异源基因,所述至少5种异源基因编码包含在甾体生物碱、甾体皂苷或三萜生物合成途径中的五种酶。在一些实施方案中,本文所公开的遗传修饰的植物或植物部分表达至少六种异源基因,所述至少六种异源基因编码包含在甾体生物碱、甾体皂苷或三萜生物合成途径中的六种酶。在一些实施方案中,本文所公开的遗传修饰的植物或植物部分表达至少七种异源基因,所述至少七种异源基因编码包含在甾体生物碱、甾体皂苷或三萜生物合成途径中的七种酶。在一些实施方案中,本文所公开的遗传修饰的植物或植物部分表达至少八种异源基因,所述至少八种异源基因编码包含在甾体生物碱、甾体皂苷或三萜生物合成途径中的八种酶。在一些实施方案中,本文所公开的遗传修饰的植物或植物部分表达至少九种异源基因,所述至少九种异源基因编码包含在甾体生物碱、甾体皂苷或三萜生物合成途径中的九种酶。在一些实施方案中,本文所公开的遗传修饰的植物或植物部分表达至少十种异源基因,所述至少十种异源基因编码包含在甾体生物碱、甾体皂苷或三萜生物合成途径中的十种酶。
在一些实施方案中,编码甾体生物碱、甾体皂苷或三萜生物合成途径中的酶的异源基因包含选自以下中的酶:β-香树素合酶、细胞色素P450、多种细胞色素P450、糖基转移酶、多种糖基转移酶、酰基转移酶或CSLG,或其任何组合。在一些实施方案中,编码甾体生物碱、甾体皂苷或三萜生物合成途径中的酶的异源基因包含选自以下中的酶:β-香树素合酶、细胞色素P450、多种细胞色素P450、糖基转移酶、多种糖基转移酶、酰基转移酶或CSLG,或其任何组合;并且另外地表达提供一种或多种生物合成途径底物所必需的至少一种异源基因。在一些实施方案中,异源基因编码甾体生物碱、甾体皂苷或三萜生物合成途径中的酶,其包含β-香树素合酶、细胞色素P450、多种细胞色素P450、糖基转移酶、多种糖基转移酶、酰基转移酶或CSLG,或其任何组合;并且另外地表达提供多种生物合成途径底物所必需的异源基因,例如但不限于UDP-葡萄糖6-脱氢酶1酶。
在一些实施方案中,遗传修饰的细胞表达编码甾体生物碱/甾体皂苷/三萜皂苷生物合成途径中的酶的至少一种异源基因,所述至少一种异源基因编码CSLG酶。
在一些实施方案中,所述至少一种异源基因编码细胞色素P450,其中所述细胞色素P450包含C2-羟化酶或C-23氧化酶,或糖基转移酶,其中所述糖基转移酶包含果糖基转移酶、木糖基转移酶或UDP-糖基转移酶,或酰基转移酶,其中所述酰基转移酶包含苄醇乙酰基-、花色素苷-O-羟基-苯乙烯醛基-、邻氨基苯甲酸盐-N-羟基-苯乙烯醛基/苯甲酰基-、脱乙酰基温都林乙酰基转移酶(BAHD)酰基转移酶,或其任何组合。
在一些实施方案中,一种或多种异源基因的表达包含与相应的未修饰的细胞相比而言增加的表达。在一些实施方案中,基因表达的增加致使与相应的未修饰的细胞中酶的含量相比,此基因所编码的酶的含量增加。所属领域中的技术人员应了解,在一些实施方案中,表达的增加可以包含一种或多种基因的过表达,致使与相应的未修饰的细胞相比,所述一种或多种基因所编码的酶的存在增加。在一些实施方案中,表达增加可以包含一种或多种基因的表达,以及产生并非细胞或有机体,例如但不限于植物细胞、植物、酵母细胞、藻细胞、昆虫细胞或细菌细胞中天然存在的一种或多种组合酶活性。
技术人员将理解,在某些实施方案中,相应的未修饰的细胞可以提供对照细胞,其中所述异源基因不表达或不过表达。
在一些实施方案中,异源细胞中一种或多种基因的表达包含所述一种或多种基因的瞬时表达。在一些实施方案中,异源细胞中一种或多种基因的表达包含所述一种或多种基因的组成型表达。在一些实施方案中,异源细胞中一种或多种基因的表达包含所述一种或多种基因的瞬时表达或组成型表达,或其组合。
所属领域中技术人员将理解,瞬时表达涵盖在将核酸引入真核细胞例如植物细胞或酵母细胞后在短时间内表达的一种或多种基因的临时表达。相反,组成型表达,也称为稳定表达,涵盖一种或多种基因的连续表达。
所属领域中的普通技术人员应理解,术语“基因”可以涵盖包含生成RNA或多肽所必需的编码序列的核酸(例如,DNA或RNA)序列。多肽可以由全长编码序列或其任何部分编码。当参照基因使用时,术语“其部分”是指该基因的节段。该节段的大小范围可以从几个核苷酸到减去一个核苷酸的整个基因序列。因此,“包含基因的至少一部分的核酸序列”可以包含此基因的节段或整个基因。
技术人员应理解,术语“基因”还任选地涵盖结构基因的编码区,并且包括在5'端和3'端这两者上与编码区相邻、且在任一端上与其相隔约1kb的距离,从而使得该基因与全长mRNA的长度相对应的序列。位于编码区中的5'处并且存在于mRNA上的序列被称为5'非翻译序列。位于编码区的3'处或编码区的下游并且存在于mRNA上的序列被称为3'非翻译序列。
在一些实施方案中,基因包含DNA序列,所述DNA序列中包含编码区。在一些实施方案中,基因包含DNA序列,所述DNA序列包含上游和下游区域以及编码区,所述编码区包含基因的外显子和任何中间内含子。在一些实施方案中,上游和下游区域包含非编码调节区。在一些实施方案中,上游和下游区域包含调节序列,例如但不限于启动子、增强子和沉默子。调节序列的非限制性实例包括但不限于AGGA区、TATA区、Inr、DPE、ZmUbi1、PvUbi1、PvUbi2、CaMV、35S、OsAct1、zE19、E8、TA29、A9、pDJ3S、B33、PAT1、alcA、G-box、ABRE、DRE和PCNA。
在一些实施方案中,调节区可以增加或减少细胞,例如但不限于本文的酵母细胞、藻细胞、昆虫细胞、细菌细胞或植物细胞或植物内特定基因的表达。在一些实施方案中,调节区可以增加或减少植物细胞内特定基因的表达。在一些实施方案中,调节区可以增加或减少藻细胞内特定基因的表达。在一些实施方案中,调节区可以增加或减少酵母细胞内特定基因的表达。在一些实施方案中,调节区可以增加或减少昆虫细胞内特定基因的表达。在一些实施方案中,调节区可以增加或减少细菌内特定基因的表达。
在一些实施方案中,基因包含所述基因的编码区,所述编码区中包含所述基因的外显子以及任何中间内含子。在一些实施方案中,基因包含其调节序列。在一些实施方案中,基因包含该基因启动子。在一些实施方案中,基因包含其增强子区。在一些实施方案中,基因包含5'非编码序列。在一些实施方案中,基因包含3'非编码序列。
在一些实施方案中,所属领域中的技术人员应了解,DNA包含基因,其可以包含上游和下游序列以及此基因的编码区。在其他实施方案中,DNA包含cDNA(互补DNA)。所属领域中普通技术人员应理解,cDNA可以包含通过逆转录酶的作用从RNA逆转录的合成DNA。cDNA可以是单链或双链的,并且可以包括具有与RNA序列的一部分基本相同的序列,或RNA序列的一部分的补体(complement)这两者中的一者或两者的链。此外,cDNA可以包含上游和下游调节序列。在另一些其他实施方案中,DNA包含CDS(完整编码序列)。所属领域中的普通技术人员应理解,CDS可以包含编码全长度蛋白质或多肽的DNA序列。CDS通常始于起始密码子(“ATG”),并且止于第一个框内终止密码子(“TAA”、“TAG”或“TGA”)处(或之前一个)。所属领域中的技术人员应认识到,在一个实施方案中,cDNA包含CDS。
术语“多核苷酸”、“多核苷酸序列”、“核酸序列”和“分离的多核苷酸”在本文可互换使用。这些术语包含核苷酸序列等。多核苷酸可以是RNA或DNA或其杂合体的聚合物,其是单链或双链、线性或分支的,并且任选地含有合成的、非天然的或改变的核苷酸碱基。此术语还涵盖RNA/DNA杂合体。
本文所使用的术语“互补”或“其补体”是指能够在整个互补区域的整个范围内与另一种指定多核苷酸形成沃森&克里克碱基配对(Watson&Crick base pairing)的多核苷酸的序列。此术语仅基于其序列而不是两个多核苷酸实际结合的条件的任何特定集合而应用于多核苷酸对。
本文所用的术语“构建体”是指人工组装或分离的核酸分子,其中包括目的多核苷酸。通常,构建体可以包括一种或多种目的多核苷酸、标志物基因以及适当调节序列,其中在某些情况下,所述标志物基因也可以是目的基因。应理解,调节序列包含在构建体中是任选的,例如,在要使用宿主细胞的调节序列的情况下,可能不需要这些序列。调节元件包括但不限于启动子、增强子、复制起始点、转录终止序列、聚腺苷酸化信号等。术语“构建体”包括载体,但不应视为限于此。
术语“可操作地连接”是指单个核酸节段上的核酸序列的联合,从而其中一者的功能被另一者调节。例如,当启动子能够调节编码序列的表达(即,此编码序列在此启动子的转录控制之下)时,此启动子与此编码序列可操作地连接。编码序列可以以有义或反义定向可操作地连接到调节序列。在一些实施例中,术语“可操作地连接”和“功能上连接”可以互换使用,具有所有相同的含义和特性。
本文所使用的术语“启动子元件”、“启动子”或“启动子序列”是指通常位于DNA聚合物的编码区的5'端(即,在其之前)的DNA序列。自然界中已知的大多数启动子的位置均在被转录区域之前。启动子用作开关,激活基因的表达。如果该基因被激活,则其称为被转录或参与转录。转录涉及从基因合成mRNA。因此,启动子用作转录调节元件,并且还提供了基因转录成mRNA的启始位点。
包含异源基因的多核苷酸序列可以例如在指导组成型表达或调节(瞬时)表达的启动子的控制下,在植物细胞、藻细胞、酵母细胞、昆虫细胞或细菌中表达。在一些实施方案中,所述植物细胞是整个植物的一部分,或植物部分的一部分。调节表达包含时间或空间调节表达以及任何其他形式的诱导或可抑制表达。时间调节表达(Temporally)是指在特定时间点,例如,当获得植物细胞培养物的特定生长速率时被诱导的表达(例如,仅在静止期或发育的特定阶段诱导启动子)。空间调节表达(Spatially)是指启动子仅在特定器官、组织或细胞中有活性(例如,对于仅在根、叶、表皮、保卫细胞等中的植物而言)。调节表达的其他实例包含通过向植物细胞或酵母细胞或藻细胞或昆虫细胞或细菌中添加化学或物理刺激而诱导或抑制其活性的启动子。在一些实施方案中,启动子是可诱导启动子。在一些实施方案中,启动子是组成型启动子。在一些实施方案中,三萜生物合成途径中异源基因,例如但不限于CSLG的调节表达包含通过向植物细胞中添加化学或物理刺激来诱导或抑制基因表达。在一些实施方案中,三萜生物合成途径中异源基因,例如但不限于CSLG的调节表达包含通过向酵母细胞中添加化学或物理刺激来诱导或抑制基因表达。在一些实施方案中,三萜生物合成途径中异源基因,例如但不限于CSLG的调节表达包含通过向藻细胞中添加化学或物理刺激来诱导或抑制基因表达。在一些实施方案中,三萜生物合成途径中异源基因,例如但不限于CSLG的调节表达包含通过向昆虫细胞中添加化学或物理刺激来诱导或抑制基因表达。在一些实施方案中,三萜生物合成途径中异源基因,例如但不限于CSLG的调节表达包含通过向细菌中添加化学或物理刺激来诱导或抑制基因表达。
在一些实施方案中,所述表达在环境、激素、化学和/或发育信号的控制下。植物细胞的此类启动子包括受以下因素调节的启动子:(1)热量、(2)光照、(3)激素例如脱落酸和茉莉酸甲酯(methyl jasmonate)、(4)损伤,或(5)化学品,例如水杨酸、壳聚糖或金属。组成型启动子引导多种细胞在多种条件下的表达。可用于在植物细胞中表达异源多肽的组成型植物启动子的实例包括但不限于花椰菜花叶病毒(CaMV)35S启动子、胭脂碱合酶启动子和章鱼碱合酶启动子,其中所述花椰菜花叶病毒(CaMV)35S启动子赋予包括单子叶植物在内的大多数植物组织中的组成型高水平表达。在一些实施方案中,启动子是可诱导启动子。在本文提供的一些实施方案中,可诱导植物启动子包括但不限于GAL1、GAL10、PHO5和CUP1。在一些实施方案中,酵母启动子是组成型启动子。在本文提供的一些实施方案中,组成型酵母启动子包括但不限于PGK1、TDHS、ADH1、CYC1、ACT1、TEF1。在一些实施方案中,藻类启动子是可诱导启动子。在一些实施方案中,可以通过光照、pH、盐度、温度或营养物的变化来调节本文提供的藻类启动子。在一些实施方案中,可诱导藻类启动子响应于氮水平、氮胁迫或氮饥饿。在一些实施方案中,藻类启动子是组成型启动子。在一些实施方案中,用于昆虫细胞中的可诱导启动子响应于环境或营养物信号。
表达盒通常提供于包含至少一种异源基因的DNA或RNA构建体中,所述异源基因通常被称为“表达载体”,所述表达载体是表现为细胞内的自主多核苷酸复制单元(即能够在其自身的控制下进行复制),或通过插入在其上附着有另一个多核苷酸节段的宿主细胞染色体来实现所附着节段的复制和/或表达,从而呈现为具备复制能力的任何遗传元件,例如质粒、染色体、病毒。适当的载体包括但不限于质粒、噬菌体、粘粒、植物病毒和人工染色体。表达盒可以提供于DNA构建体中,所述DNA构建体也具有至少一个复制系统。除复制系统外,通常还会存在至少一个标志物,所述标志物可以适用于一个或多个宿主内,或各宿主适用不同的标志物。
在另一个实施方案中,选择基因提供赋予对选择剂例如抗生素或除草剂的抗性的选择标志物。潜在转化的细胞暴露于选择剂中。存活细胞群体中的将是通常已经以足以允许细胞存活的水平整合并且表达赋予抗性基因的细胞。可以进一步测试细胞以确认外源DNA的稳定整合。
有效的选择性标志物基因包括赋予对抗生素的抗性的基因,例如卡那霉素(nptII)、潮霉素B(aph IV)、nptII、hpt、aadA和庆大霉素(aac3和aacC4),或对除草剂的抗性的基因,例如草铵膦(bar或pat)和草甘膦(EPSPS)。在另一个实施方案中,选择基因是抗代谢物。在一个实施方案中,抗代谢物是dhf。
也可以使用提供视觉上识别转化体的能力的可筛选标志物,例如表达有色或荧光蛋白的基因,例如cat、lacZ、uidA、萤光素酶或绿色荧光蛋白(GFP),或表达β-葡萄糖醛酸苷酶的基因,或其各种生色底物是已知的uidA基因(GUS)。另外预期的是,可筛选和可选择标志物的组合将对识别已转化细胞而言是有效的。
在一个实施方案中,选择基因是以非毒性制剂为条件的阳性可选择标志物基因,所述非毒性制剂可以是生长的底物,也可以是诱导已被转化组织的生长和分化的制剂。
在一个实施方案中,可以将暴露于选择剂中时存活的植物细胞,或在筛选测定中被评分为阳性的细胞置于再生培养基中培养,并且使其成熟成植物。可以将发育中的小植株转移到无土的植物生长混合物中,并且在例如环境受控箱内、在约85%相对湿度、600ppmCO2以及25-250microeinstein m-2s-1光照的条件下进行幼苗健化,然后再转移到温室或生长箱进行成熟。植物优选地在生长箱或温室中成熟。取决于初始组织,在识别出转化体后的约6周到10个月对植物进行再生。在再生期间,细胞在约19℃至28℃的固体培养基上生长成植物。再生植物达到芽和根发育阶段后,可将其转移到温室中进一步生长和测试。可以使用所属领域中技术人员已知的常规植物育种方法对植物进行授粉,并且产生种子。
可以从转化后的植物中回收后代,并且测试外源重组多核苷酸的表达。有效测定包括例如“分子生物”测定,例如Southern和Northern印迹法和PCR;“生化”测定,例如通过例如免疫学方法(ELISA和Western印迹)或通过酶促功能来检测RNA,例如双链RNA或蛋白质产物的存在;植物部分测定,例如叶或根测定;以及,通过分析整个再生植物的表型进行测定。
所属领域中的技术人员将能够选择合适载体以相对完整的状态引入编码核酸序列。因此,任何能产生携带被引入编码核酸的宿主细胞的载体,例如植物原生质体,均应该是足够的。载体的选择,或是否使用载体,通常依据所选的转化方法而定。
对于植物细胞,标志物可以是:a)防护杀生物剂,例如抗生素、毒性、重金属、某些糖等的编码;b)通过向营养缺陷的宿主赋予原营养来提供互补作用;或c)通过在植物中生成新型化合物来提供可见的表型。在一些实施方案中,可以采用的基因包括新霉素磷酸转移酶(NPTII)、潮霉素磷酸转移酶(HPT)、氯霉素乙酰基转移酶(CAT)、腈水解酶和庆大霉素抗性基因。对于植物宿主的选择,适当标志物的非限制性实例是提供靛蓝生成的β-葡萄糖醛酸苷酶、提供可见光生成的萤光素酶、绿色荧光蛋白及其变体、提供卡那霉素抗性或对G418的抗性的NPTII、提供潮霉素抗性的HPT,以及提供草甘膦抗性的突变aroA基因。
对于酵母细胞,标志物可以包含通过向营养缺陷型宿主赋予原营养来提供互补的标志物,例如但不限于编码必要互补活性的HIS、LEU、TRP和URA标志物基因。在一些实施方案中,酵母标志物提供对有毒于酵母的化合物的抗性,例如但不限于kanMX4-对G418的抗性;natMX4-对诺尔丝菌素(nourseothricin)的抗性;hphMX4-对潮霉素B的抗性;patMX3-对草铵膦的抗性;以及ZEO-对博莱霉素(Zeocin)的抗性。
启动子活性包含与启动子活性被测量的启动子可操作地连接的多核苷酸序列、其同源物、其变体或其节段的转录程度。启动子活性可以例如使用Northern印迹法直接通过测量所生成的RNA转录本的量来测量,或通过测量由RNA转录本编码的产物来间接地测量,例如当报告基因与启动子连接时。
在一些实施方案中,本文公开的编码酶的至少一种异源基因可操作地连接到启动子。在一些实施方案中,与启动子的可操作连接会引发瞬时表达。在一些实施方案中,与启动子的可操作连接会引发组成型表达。在一些实施方案中,一个异源基因可以可操作地连接到组成型启动子,而另一个异源基因可操作地连接到提供瞬时表达的启动子。在一些实施方案中,多核苷酸序列包含编码酶的至少一种异源基因,其中所述多核苷酸任选地包含在载体内。
本文所用术语“增强子”是指可以刺激启动子活性的DNA序列,并且可以是启动子的先天元件或被插入以强化启动子的水平或组织特异性的异源元件。
本文所用术语“表达”是指功能性最终产物例如mRNA或蛋白质的生成。在一些实施方案中,遗传修饰的细胞表达至少一种异源基因,其中所述功能性最产物包含mRNA,其进而被转录而生成包含甾体生物碱、甾体皂苷或三萜皂苷的功能性最终产物。
术语“遗传修饰的细胞”是指经人进行遗传修饰的细胞。在一些实施方案中,遗传修饰包括用包含编码酶的基因的异源多核苷酸来转化植物细胞或酵母细胞或藻细胞或昆虫细胞或细菌。在一些实施方案中,遗传修饰包括用异源多核苷酸来转化植物细胞或酵母细胞,所述异源多核苷酸包含编码在三萜皂苷生物合成途径中呈活性的酶的基因。本文所用的“遗传修饰的细胞”和“相应的未修饰的细胞”分别是指遗传修饰的细胞以及缺乏所述修饰的相同类型的细胞。
在一些实施方案中,所述“遗传修饰的细胞”以及“相应的未修饰的细胞”分别是相同类型的遗传修饰的植物细胞以及相应的未修饰的植物细胞。在其他实施方案中,所述“遗传修饰的细胞”以及“相应的未修饰的细胞”分别是相同类型的遗传修饰的酵母细胞以及相应的未修饰酵母细胞。
术语“遗传修饰的植物”是指包含至少一种经人进行遗传修饰的细胞的植物。所述遗传修饰包括内源基因的修饰,例如通过将突变缺失、插入、转座元件等引入内源多核苷酸或目的基因中。附加地或替代地,所述遗传修饰包括用异源多核苷酸来转化植物细胞。本文所用的“遗传修饰的植物”和“相应的未修饰的植物”分别是指包含至少一种遗传修饰的细胞的植物,以及缺乏所述修饰的相同类型的植物。
在一些实施方案中,也包含遗传修饰的细胞的悬浮液,以及源自所述遗传修饰的细胞的组织培养物。所述细胞悬浮液或组织培养物可以用于生成所需的甾体生物碱、其代谢物、其衍生物或其生物合成中间体,或其组合;甾体皂苷、其代谢物、其衍生物或其生物合成中间体,或其组合;或三萜皂苷、其代谢物、其衍生物或其生物合成中间体,或其组合。在一些实施方案中,所述遗传修饰的细胞或组织培养物用于再生具有CSLG酶表达改变的至少一种细胞的遗传修饰的植物。
所属领域中的普通技术人员应理解,一些实施方案还包含所述遗传修饰的植物的种子,其中与从相应的未修饰种子或来自相应未修饰植物的种子生长的植物相比,从所述种子生长的植物中至少一种细胞中的至少一种CSLG的表达改变,从而使得其中的至少一种细胞具有改变含量的以下物质:至少一种甾体生物碱、甾体皂苷或三萜皂苷。
如果转化技术中需要使用组织培养物,则可以根据所属领域中的技术人员所公知的技术将被转化细胞再生为植物。然后可以使所再生的植物生长,并且使用常规育种技术与相同或不同的植物品种杂交以产生种子,然后在适当条件下对所述种子进行选择。
所属领域中的普通技术人员应理解,所述遗传修饰的植物可以包含其中具有至少一种经人进行遗传修饰的细胞的植物。在一些实施方案中,所述遗传修饰包括用包含本文所述异源基因的异源多核苷酸来转化至少一种植物细胞或酵母细胞或藻细胞或昆虫细胞或细菌。在一些实施方案中,所述遗传修饰包含用包含各自对一种酶进行编码的多种异源基因的异源多核苷酸来转化至少一种植物细胞或酵母细胞或藻细胞或昆虫细胞或细菌。在一些实施方案中,所述遗传修饰包含用包含编码多种酶的多种异源基因的异源多核苷酸来转化至少一种植物细胞或酵母细胞或藻细胞或昆虫细胞或细菌。
所属领域中的技术人员应理解,在某些实施方案中,包含用一种或多种异源多核苷酸来转化至少一个植物细胞的遗传修饰的植物可以称为“转基因植物”。
所属领域中的技术人员应理解,本文所用的“遗传修饰的植物”和“相应的未修饰的植物”之间的对比包含:将包含至少一种遗传修饰的细胞的植物与缺乏所述修饰的相同类型的植物进行对比。
所属领域中的技术人员应理解,术语“转基因”当用于本文所公开的植物时,包含在其一种或多种细胞中包含至少一种异源可转录多核苷酸的植物。所属领域中的技术人员应理解,术语“转基因”当用于本文所公开的酵母时包含:含有至少一种异源可转录多核苷酸的酵母。术语“转基因材料”广泛地涵盖植物或其部分,包括至少一种细胞、在至少一种细胞中含有至少一种异源多核苷酸的多种细胞或组织。因此,“转基因植物”与“相应的非转基因植物”之间的比较,或“包含表达改变的至少一种细胞的遗传修饰的植物,其中所述植物包含含有异源可转录多核苷酸的至少一种细胞”与“相应的未修饰的植物”之间的比较包含:将“转基因植物”或“遗传修饰的植物”与缺乏所述异源可转录多核苷酸的相同类型植物进行比较。所属领域中的技术人员应理解,在一些实施方案中,“可转录多核苷酸”包含可以通过RNA聚合酶转录成RNA分子的多核苷酸。
术语“转化体”或“转化细胞”包括原代转化细胞以及衍生自该细胞的培养物,而与转移次数无关。由于故意或无意突变,所有后代的DNA含量可能并不完全相同。功能与在最初转化细胞中筛选的功能相同的突变后代包括在转化体的定义中。
细胞的转化可以是稳定的或瞬时的。术语“瞬时转化”或“瞬时转化的”是指在没有将外源多核苷酸整合到宿主细胞基因组中的情况下将一种或多种外源多核苷酸引入细胞中。相反,术语“稳定转化”或“稳定转化的”是指将一种或多种外源多核苷酸引入并整合到细胞的基因组中。术语“稳定转化体”是指已将一种或多种外源多核苷酸稳定整合到基因组或细胞器DNA中的细胞。应理解,用本文公开的核酸、构建体和/或载体转化的有机体或其细胞可以被瞬时以及稳定地转化。
所述领域中的技术人应理解,术语“构建体”可以涵盖包含目的多核苷酸的人工组装或分离的核酸分子。通常,构建体可以包括一种或多种目的多核苷酸、标志物基因以及适当调节序列,其中在某些情况下,所述标志物基因也可以是目的基因。应理解,调节序列包含在构建体中是任选的,例如,在要使用宿主细胞的调节序列的情况下,可能不需要这些序列。术语“构建体”包括载体,但不应视为限于此。
附加地或可替代地,在一些实施方案中,所述遗传修饰包括用一种异源多核苷酸或多种异源多核苷酸来转化至少一种植物细胞。所属领域中的技术人员应理解,在某些实施方案中,包含用一种异源多核苷酸或多种异源多核苷酸来转化至少一个植物细胞的遗传修饰的植物可以称为“转基因植物”。
病毒载体可用于转化更抗转化的植物(例如大豆或菜豆(common bean))。在一些实施方案中,病毒载体例如豆荚斑点病毒(BPMV;豇豆花叶病毒属(Comovirus))载体用于外源基因表达和病毒诱导基因沉默(VIGS)(Zhang等人,(2010年5月),《植物生理学》(PlantPhysiol),第153期:第52-65页[“Zhang 2010”]))。例如,通过生物弹(biolistics)或通过直接DNA摩擦接种来转化细胞(Zhang 2010)。
在一个实施方案中,基因枪或生物弹颗粒递送系统(生物弹)用于植物转化以将外源DNA(转基因)递送至细胞(Rech等人,(2008),《自然实验步骤》(Nature Protocols),第3(3)期:第410-418页[“Rech 2008”])。在一些实施方案中,对质粒进行设计,并且用微粒包被的DNA轰击植物(例如大豆、豆、棉花)的顶端分生组织,随后进行体外培养和转基因植物选择(Rech 2008)。在其他实施方案中,未分化植物细胞的愈伤组织或一组未成熟胚在体外在凝胶培养基上生长。在一些实施方案中,然后用一系列植物激素例如植物生长素或赤霉素处理细胞以获得植物。甾体生物碱、其代谢物、其衍生物或其生物合成中间体,或其组合;甾体皂苷、其代谢物、其衍生物或其生物合成中间体,或其组合;或三萜皂苷、其代谢物、其衍生物或其生物合成中间体或其组合可以通过此类转基因植物或植物细胞生成。
蛋白质的“瞬时表达”可以通过所属领域中已知的多种方式来实现。在一个实施方案中,通过使用遗传修饰的病毒来实现蛋白质的瞬时表达。在一些实施方案中,采用农业浸润来诱导基因在植物或分离的叶或另一植物部分中的瞬时表达。通过例如直接注射或真空过滤将土壤杆菌属(例如根癌土壤杆菌(Agrobacterium tumefaciens))的悬浮液引入植物中,或使其与固定在多孔支柱(植物细胞包装)上的植物细胞联合。细菌通过Ti质粒衍生的T-DNA的转移将所需的基因转移到植物细胞中。
在一些实施方案中,藻类的转化方法包含上文的任何方法。在一个实施方案中,使用玻璃珠辅助转化、粒子枪介导的(生物弹)转化、用纤维素分解酶处理以减弱其细胞壁,或同源重组来完成藻类的转化。
在另一方面中,可以将本文公开的核酸转化进藻类。在一个实施方案中,藻类是单细胞藻。在另一个实施方案中,藻类是多细胞藻。在一个实施方案中,藻类是蓝藻菌、硅藻、衣藻(Chlamydomonas)、盐藻(Dunaliella)或血球藻属(Hematococus)。基因可以在藻类中过表达。甾体生物碱、其代谢物、其衍生物或其生物合成中间体,或其组合;甾体皂苷、其代谢物、其衍生物或其生物合成中间体,或其组合;或三萜皂苷、其代谢物、其衍生物或其生物合成中间体或其组合可以通过此类转基因藻类生成。用于藻类转化的方法在所属领域中是众所周知的,并且在美国专利申请公开案US 20150011008;US 20150004704;US20130130389;US 20120094385;US 20120034698;US 20110300633;和US 20040133937中有完整描述,这些专利申请公开案全文以引用方式并入本文中。此外,微藻类的培养是所属领域中公知的,并且已在Vuppaladadiyam等人(2018)“微藻类的培养和代谢物生成:全面综述”(Microalgae cultivation and metabolites production:a comprehensivereview),《生物燃料、生物产品与生物精炼》(Biofuls,Bioprod.Bioref.)第12期:第304-324页中进行描述,其全文以引用方式并入本文中。
在另一方面中,可以将本文公开的核酸转化进酵母。基因可以在酵母中过表达。用于酵母转化的方法如本文中的下文中所述并且是所属领域中公知的,并且在美国专利申请公开案US 20090264320;US 20010031724;US 20030049785;US 20050158861;US20070264716;US 20090325247;和US 20100190223中有完整描述,这些专利申请公开案全文以引用方式并入本文中。甾体生物碱、其代谢物、其衍生物或其生物合成中间体,或其组合;甾体皂苷、其代谢物、其衍生物或其生物合成中间体,或其组合;或三萜皂苷、其代谢物、其衍生物或其生物合成中间体或其组合可以通过此类转基因酵母生成。
在另一实施方案中,可以将本文公开的核酸转化进病毒。在另一个实施方案中,核酸可以在病毒中过表达。甾体生物碱、其代谢物、其衍生物或其生物合成中间体,或其组合;甾体皂苷、其代谢物、其衍生物或其生物合成中间体,或其组合;或三萜皂苷、其代谢物、其衍生物或其生物合成中间体或其组合可以通过此类病毒过表达生成。
在一些实施方案中,在细菌系统中,可以根据旨在用于被表达多肽的用途来有利地选择许多表达载体。在一实施方案中,需要大量的多肽。在一个实施方案中,所需要的是引导高水平表达蛋白产物表达的载体,其可能与疏水信号序列融合,所述载体将被表达的产物引入易于纯化蛋白产物的细菌或培养基的周质中。在一个实施方案中,某些融合蛋白经工程改造具有特定切割位点以帮助多肽的回收。在一个实施方案中,适于该操作的载体包括但不限于大肠杆菌表达载体的pET系列(Studier等人,《酶学方法》(Methods inEnzymol),第185期:第60-89页,1990)。
在一些实施方案中,多核苷酸序列包含至少一种异源基因。在一些实施方案中,多核苷酸序列对酶进行编码。在一些实施方案中,多核苷酸序列编码甾体生物碱、甾体皂苷或三萜皂苷生物合成途径中的酶。在一些实施方案中,多核苷酸序列编码生成甾体生物碱、甾体皂苷或三萜皂苷生物合成途径的一个或多个底物所必需的酶。
在一些实施方案中,多核苷酸序列包含至少2、3、4、5、6、7、8、9或10种或更多种异源基因。在一些实施方案中,多核苷酸序列编码2、3、4、5、6、7、8、9或10种或更多种酶,其中每种基因编码单个酶。在一些实施方案中,多核苷酸序列编码甾体生物碱、甾体皂苷或三萜皂苷生物合成途径中的2、3、4、5、6、7、8、9或10种酶。在一些实施方案中,多核苷酸序列编码2、3、4、5、6、7、8、9或10种或更多种甾体生物碱、甾体皂苷或三萜皂苷途径的酶,以及生成甾体生物碱、甾体皂苷或三萜皂苷生物途径的底物所必需的额外酶。在一些实施方案中,多核苷酸序列编码2、3、4、5、6、7、8、9或10种或更多种甾体生物碱、甾体皂苷或三萜皂苷途径的多种酶,以及生成甾体生物碱、甾体皂苷或三萜皂苷生物途径的多种底物所必需的多种额外酶。
在一些实施方案中,术语“核苷酸序列”或“多核苷酸序列”涵盖单个连续的多核苷酸序列,并且在其他实施方案中,该术语涵盖多个连续的核苷酸序列。
基于本文公开的共表达基因阵列,提出了从胆固醇到例如α-番茄素的途径(图1)。如上文中所描述,胆固醇在C22处被GAME7(US 2012/0159676)羟基化,随后在C26位置处被GAME8羟基化。然后,将22,26-二羟胆固醇在C16处羟基化,并且在C22处氧化,然后通过GAME11和GAME6封闭E环以形成呋喃甾醇型糖苷配基。该反应顺序由本文中的发现提供支持,其示出当使GAME11沉默时胆甾烷醇型皂苷的累积、在C16和半缩醛E环上缺乏羟基化(图8A-D)。呋喃甾醇中间体被GAME4氧化成其26-醛,后者是被GAME12催化的转氨底物。氨基氮在C22处的亲核攻击致使形成番茄登醇,后者被脱氢成番茄碱。随后将番茄碱经GAME1转化成T-Gal(Itkin等人,2011,同上)。T-Gal进而被GAME17糖基化为γ-番茄素,然后被GAME18糖基化为β1-番茄素,进而最终被GAME2转化为α-番茄素(图1)。
如本文所述,通过修饰生物合成途径中所涉及的酶和/或其他蛋白质的表达,可以改变甾体生物碱、甾体糖苷生物碱和甾体皂苷的水平。
马铃薯植物中与成簇的酶编码基因共表达的一个单个基因的沉默致使甾体糖苷生物碱α-查茄碱和α-茄碱含量显著减少,而该基因的过表达致使这些物质的含量显著增加(图5和图6)。该基因被发现包括含有AP2结构域的编码序列,因此推测是由GAME9编码的转录因子,在本文中称为GAME9转录因子。
一种遗传修饰的植物,其中包含其至少一种基因的表达改变的至少一种细胞,所述至少一种基因选自编码GAME9转录因子的基因、编码2-酮戊二酸依赖的双加氧酶的基因、编码碱性螺旋-环-螺旋(BHLH)-转录因子的基因,或组合,其中所述遗传修饰的植物与相应的未修饰的植物相比,具有含量改变的至少一种甾体生物碱或其衍生物、其代谢物或其生物合成中间体。如本文针对2-酮戊二酸依赖的双加氧酶(GAME11)所例示的,操纵本发明的基因表达可进一步致使甾体皂苷合成的操纵。
因此,根据另一方面,本文提供一种遗传修饰的有机体,所述遗传修饰的有机体与未修饰或未经编辑的有机体相比,包含具有表达改变的至少一种基因的至少一个细胞,所述至少一种基因选自编码GAME9转录因子的基因、编码2-酮戊二酸依赖的双加氧酶的基因、编码碱性螺旋-环-螺旋(BHLH)转录因子的基因或其组合,其中所述遗传修饰的有机体与相应的未修饰或未编辑有机体相比,具有含量改变的至少一种化合物,所述至少一种化合物选自甾体皂苷和/或甾体生物碱及其糖基化和其他衍生物、其代谢物或其生物合成中间体。
意外的是,本发明现在表明,通过修饰甾体生物碱生物合成途径中所涉及的酶和/或转录因子的表达,可以显著减少马铃薯块茎中的SGA水平。
根据某些实施方案,与其在相应未修饰或未编辑植物中的表达相比,选自编码GAME9转录因子的基因、编码2-酮戊二酸依赖的双加氧酶的基因、编码BHLH转录因子的基因或其组合中的至少一种基因在所述遗传修饰的植物中的表达受到抑制,因此所述遗传修饰的植物包含与相应的未修饰的植物相比,含量减少的至少一种甾体生物碱或其衍生物、其代谢物或其生物合成中间体。
将实施例中详细描述在化合物11的菠菜三萜生物合成途径中呈活性的基因及其编码的酶。实施例20中提供的表17提供这些酶以及编码这些酶的基因的氨基酸和核酸序列。实施例24中提供的表19提供从拟南芥属分离的额外CSLG酶的氨基酸序列。
在一些实施方案中,所述至少一种异源基因的多核苷酸序列在SEQ ID NO:30、32、34、36、38、40、45、46、47、51、53、55、57、59、61、63、65、80、93、95、97、99、101、103或105中的任一示出。在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含与SEQ ID NO:30、32、34、36、38、40、45、46、47、51、53、55、57、59、61、63、65、80、93、95、97、99、101、103或105中的任一所示的核酸序列具有至少55%的同一性的核酸序列。
在一些实施方案中,所述至少一种异源基因的多核苷酸序列在SEQ ID NO:30、32、34、36、38、40、45、46、47、51、53、55、57、59、61、63、65、80、93、95、97、99、101、103或105中的任一示出。在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含与SEQ ID NO:30、32、34、36、38、40、45、46、47、51、53、55、57、59、61、63、65、80、93、95、97、99、101、103或105中的任一所示的核酸序列具有至少80%的同一性的核酸序列。
在一些实施方案中,编码所述至少一种异源CSLG酶的核酸序列在SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101、103或105中的任一示出。在一些实施方案中,编码所述至少一种异源CSLG酶的核酸序列在与SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101、103或105中的任一所示的其核酸序列具有至少55%的同一性和至少55%的覆盖度的其同源物中示出。在一些实施方案中,编码所述至少一种异源CSLG酶的核酸序列在SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101、103或105中的任一示出。在一些实施方案中,编码所述至少一种异源CSLG酶的核酸序列在与SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101、103或105中的任一所示的其核酸序列具有至少55%的同一性和至少80%的覆盖度的其同源物中示出。
在一些实施方案中,编码所述至少一种异源CSLG酶的核酸序列在SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101、103或105中的任一示出。在一些实施方案中,编码所述至少一种异源CSLG酶的核酸序列在与SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101、103或105中的任一所示的其核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出。
在一些实施方案中,所述至少一种异源基因的多核苷酸序列在SEQ ID NO:30中示出。在一些实施方案中,所述至少一种异源基因的多核苷酸序列在SEQ ID NO:32中示出。在一些实施方案中,所述至少一种异源基因的多核苷酸序列在SEQ ID NO:34中示出。在一些实施方案中,所述至少一种异源基因的多核苷酸序列在SEQ ID NO:36中示出。在一些实施方案中,所述至少一种异源基因的多核苷酸序列在SEQ ID NO:38中示出。在一些实施方案中,所述至少一种异源基因的多核苷酸序列在SEQ ID NO:40中示出。在一些实施方案中,所述至少一种异源基因的多核苷酸序列在SEQ ID NO:45中示出。在一些实施方案中,所述至少一种异源基因的多核苷酸序列在SEQ ID NO:46中示出。在一些实施方案中,所述至少一种异源基因的多核苷酸序列在SEQ ID NO:47中示出。在一些实施方案中,所述至少一种异源基因的多核苷酸序列在SEQ ID NO:51中示出。在一些实施方案中,所述至少一种异源基因的多核苷酸序列在SEQ ID NO:53中示出。在一些实施方案中,所述至少一种异源基因的多核苷酸序列在SEQ ID NO:55中示出。在一些实施方案中,所述至少一种异源基因的多核苷酸序列在SEQ ID NO:57中示出。在一些实施方案中,所述至少一种异源基因的多核苷酸序列在SEQ ID NO:59中示出。在一些实施方案中,所述至少一种异源基因的多核苷酸序列在SEQ ID NO:61中示出。在一些实施方案中,所述至少一种异源基因的多核苷酸序列在SEQID NO:163中示出。在一些实施方案中,所述至少一种异源基因的多核苷酸序列在SEQ IDNO:65中示出。在一些实施方案中,所述至少一种异源基因的多核苷酸序列在SEQ ID NO:80中示出。在一些实施方案中,所述至少一种异源基因的多核苷酸序列在SEQ ID NO:93中示出。在一些实施方案中,所述至少一种异源基因的多核苷酸序列在SEQ ID NO:95中示出。在一些实施方案中,所述至少一种异源基因的多核苷酸序列在SEQ ID NO:97中示出。在一些实施方案中,所述至少一种异源基因的多核苷酸序列在SEQ ID NO:99中示出。在一些实施方案中,所述至少一种异源基因的多核苷酸序列在SEQ ID NO:101中示出。在一些实施方案中,所述至少一种异源基因的多核苷酸序列在SEQ ID NO:103中示出。在一些实施方案中,所述至少一种异源基因的多核苷酸序列在SEQ ID NO:105中示出。
在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含与SEQ ID NO:30中所示的核酸序列具有至少55%的同一性的核酸序列。在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含与SEQ ID NO:32中所示的核酸序列具有至少55%的同一性的核酸序列。在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含与SEQ IDNO:34中所示的核酸序列具有至少55%的同一性的核酸序列。在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含与SEQ ID NO:36中所示的核酸序列具有至少55%的同一性的核酸序列。在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含与SEQID NO:38中所示的核酸序列具有至少55%的同一性的核酸序列。在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含与SEQ ID NO:40中所示的核酸序列具有至少55%的同一性的核酸序列。在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含与SEQ ID NO:45中所示的核酸序列具有至少55%的同一性的核酸序列。在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含与SEQ ID NO:46中所示的核酸序列具有至少55%的同一性的核酸序列。在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含与SEQ ID NO:47中所示的核酸序列具有至少55%的同一性的核酸序列。在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含与SEQ ID NO:51中所示的核酸序列具有至少55%的同一性的核酸序列。在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含与SEQ ID NO:53中所示的核酸序列具有至少55%的同一性的核酸序列。在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含与SEQ ID NO:55中所示的核酸序列具有至少55%的同一性的核酸序列。在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含与SEQ ID NO:57中所示的核酸序列具有至少55%的同一性的核酸序列。在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含与SEQ ID NO:59中所示的核酸序列具有至少55%的同一性的核酸序列。在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含与SEQ ID NO:61中所示的核酸序列具有至少55%的同一性的核酸序列。在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含与SEQ ID NO:63中所示的核酸序列具有至少55%的同一性的核酸序列。在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含与SEQ ID NO:65中所示的核酸序列具有至少55%的同一性的核酸序列。在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含与SEQ ID NO:80中所示的核酸序列具有至少55%的同一性的核酸序列。在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含与SEQ ID NO:93中所示的核酸序列具有至少55%的同一性的核酸序列。在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含与SEQ ID NO:95中所示的核酸序列具有至少55%的同一性的核酸序列。在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含与SEQ ID NO:97中所示的核酸序列具有至少55%的同一性的核酸序列。在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含与SEQ ID NO:99中所示的核酸序列具有至少55%的同一性的核酸序列。在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含与SEQ ID NO:101中所示的核酸序列具有至少55%的同一性的核酸序列。在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含与SEQ ID NO:103中所示的核酸序列具有至少55%的同一性的核酸序列。在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含与SEQ ID NO:105中所示的核酸序列具有至少55%的同一性的核酸序列。
在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含与SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101、103或105中的任一所示的核酸序列具有至少55%、60%、65%、70%、75%、80%、85%、90%、95%、98%或99%的同一性的核酸序列。在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含与SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101、103或105中的任一所示的核酸序列具有至少55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或100%的覆盖度的核酸序列。
在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含与SEQ ID NO:30中所示的核酸序列具有至少80%的同一性的核酸序列。在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含与SEQ ID NO:32中所示的核酸序列具有至少80%的同一性的核酸序列。在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含与SEQ IDNO:34中所示的核酸序列具有至少80%的同一性的核酸序列。在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含与SEQ ID NO:36中所示的核酸序列具有至少80%的同一性的核酸序列。在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含与SEQID NO:38中所示的核酸序列具有至少80%的同一性的核酸序列。在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含与SEQ ID NO:40中所示的核酸序列具有至少80%的同一性的核酸序列。在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含与SEQ ID NO:45中所示的核酸序列具有至少80%的同一性的核酸序列。在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含与SEQ ID NO:46中所示的核酸序列具有至少80%的同一性的核酸序列。在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含与SEQ ID NO:47中所示的核酸序列具有至少80%的同一性的核酸序列。在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含与SEQ ID NO:51中所示的核酸序列具有至少80%的同一性的核酸序列。在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含与SEQ ID NO:53中所示的核酸序列具有至少80%的同一性的核酸序列。在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含与SEQ ID NO:55中所示的核酸序列具有至少80%的同一性的核酸序列。在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含与SEQ ID NO:57中所示的核酸序列具有至少80%的同一性的核酸序列。在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含与SEQ ID NO:59中所示的核酸序列具有至少80%的同一性的核酸序列。在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含与SEQ ID NO:61中所示的核酸序列具有至少80%的同一性的核酸序列。在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含与SEQ ID NO:63中所示的核酸序列具有至少80%的同一性的核酸序列。在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含与SEQ ID NO:65中所示的核酸序列具有至少80%的同一性的核酸序列。在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含与SEQ ID NO:80中所示的核酸序列具有至少80%的同一性的核酸序列。在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含与SEQ ID NO:93中所示的核酸序列具有至少80%的同一性的核酸序列。在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含与SEQ ID NO:95中所示的核酸序列具有至少80%的同一性的核酸序列。在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含与SEQ ID NO:97中所示的核酸序列具有至少80%的同一性的核酸序列。在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含与SEQ ID NO:99中所示的核酸序列具有至少80%的同一性的核酸序列。在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含与SEQ ID NO:101中所示的核酸序列具有至少80%的同一性的核酸序列。在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含与SEQ ID NO:103中所示的核酸序列具有至少80%的同一性的核酸序列。在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含与SEQ ID NO:105中所示的核酸序列具有至少80%的同一性的核酸序列。
在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含编码至少一种甾体生物碱生物合成酶、甾体皂苷生物合成酶或三萜皂苷生物合成酶的多核苷酸序列。在一些实施方案中,所述至少一种异源基因的多核苷酸序列包含编码2、3、4、5、6、7、8、9或10种或更多种的至少一种甾体生物碱生物合成酶、甾体皂苷生物合成酶或三萜皂苷生物合成酶或其组合的多核苷酸序列。
所属领域中的技术人员应理解,序列同源性涵盖归因于来自共同祖先的世代的序列相似性。同源生物成分(基因、蛋白质、结构)称为同源物。核苷酸或蛋白质序列相关的程度。两个序列(DNA、RNA或氨基酸)之间的相似性可以表示为序列同一性百分比和/或正取代百分比。
所属领域中的技术人员应理解,术语“同源物”涵盖通过来自共同祖先DNA或多肽(蛋白质)序列的世代而分别与第二基因或多肽(蛋白质)相关的基因或多肽(蛋白质)。因此,在一些实施方案中,基因的同源物包含与该基因相似的核苷酸序列。在一些实施方案中,基因同源物对于与此基因所编码的多肽完全相同的多肽进行编码。在一些实施方案中,基因同源物对于与此基因所编码的多肽具有相同功能的多肽进行编码。在一些实施方案中,基因同源物编码包含与此基因所编码的多肽具有相似氨基酸序列的多肽。在一个实施方案中,多肽同源物包含与多肽相似的氨基酸序列。在一些实施方案中,多肽同源物包含与多肽相同的功能性质。在一些实施方案中,多肽同源物包含与多肽相似的功能性质。在一些实施方案中,多肽同源物包含与多肽相同的结构域。在一些实施方案中,多肽同源物包含与多肽相似的结构域。
所属领域中的技术人员应理解,同源性百分比或同一性百分比可以例如但不限于使用国家生物技术信息中心(NCBI)的BlastP软件以默认参数来确定。同源物也可以指直系同源物(ortholog)、缺失、插入或取代变体,包含氨基酸取代。在一些实施方案中,可以使用任何蛋白质或核酸序列比对算法,例如Blast、ClustalW、MUSCLE和HHpred来确定序列同一性或同源性。
所属领域中的技术人员应理解,在某些实施方案中,同源物可以具有相同的活性。在一些实施方案中,SOAP基因同源物具有与相应的SOAP基因相同的活性。在一些实施方案中,SOAP多肽同源物具有与相应的SOAP多肽相同的酶活性。在一些实施方案中,SOAP5同源物具有与SOAP5相同的酶活性。在一些实施方案中,GAME基因同源物具有与相应的GAME基因相同的活性。在一些实施方案中,GAME多肽同源物具有与相应的GAME多肽相同的酶活性。在一些实施方案中,GAME15同源物具有与GAME15相同的酶活性。在某些实施方案中,CSLG基因的同源物编码具有纤维素合酶样G活性的酶。在某些实施方案中,CSLG基因的同源物编码具有葡萄糖醛酸转移酶活性的酶。在某些实施方案中,CSLG基因的同源物编码具有纤维素合酶样G活性和葡萄糖醛酸转移酶活性的酶。图42A和42F提供纤维素合酶样酶的系统树,其中所述纤维素合酶样G亚分支包括本文的SOAP5和GAME15酶。
在一些实施方案中,本文公开的遗传修饰的细胞包含编码所述至少一种异源CSLG基因的核酸序列,其中所述CSLG的核酸序列在SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101、103或105中的任一;或与SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101、103或105中的任一所示的其核酸序列具有至少55%的同一性和至少55%的覆盖度的其同源物中示出。在一些实施方案中,本文公开的遗传修饰的细胞包含编码所述至少一种异源CSLG基因的核酸序列,其中所述CSLG的核酸序列在SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101、103或105中的任一;或与SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101、103或105中的任一所示的其核酸序列具有至少55%的同一性和至少80%的覆盖度的其同源物中示出。
在一些实施方案中,本文公开的遗传修饰的细胞包含编码所述至少一种异源CSLG基因的核酸序列,其中所述CSLG的核酸序列在SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101、103或105中的任一;或与SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101、103或105中的任一所示的其核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出。
在一些实施方案中,本文公开的遗传修饰的细胞还包含编码除异源CSLG基因外的至少一种其他异源基因的核酸序列,其中所述额外基因编码
(a)β-香树素合酶,并且所述核酸序列在SEQ ID NO:45;或与SEQ ID NO:45所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;或
(b)细胞色素P450,所述核酸序列在SEQ ID NO:46、51或53中的任一;或与SEQ IDNO:46、51或53中的任一所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;或
(c)糖基转移酶,所述核酸序列在SEQ ID NO:55、57、59或61中的任一;或与SEQ IDNO:55、57、59或61中的任一所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;或
(d)乙酰基转移酶,所述核酸序列在SEQ ID NO:63;或与SEQ ID NO:63所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;或
(e)UDP-葡萄糖6-脱氢酶1,所述核酸序列在SEQ ID NO:74;或与SEQ ID NO:74所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;或
(f)(a)、(b)、(c)、(d)和(e)的其任何组合。
在一些实施方案中,本文公开的遗传修饰的植物包含编码所述至少一种异源CSLG基因的核酸序列,其中所述CSLG的核酸序列在SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101、103或105中的任一;或与SEQ ID NO:30、32、36、38、40、65、80、93、95、97、99、101、103或105中的任一所示的核酸序列具有至少55%的同一性和至少55%的覆盖度的其同源物中示出。在一些实施方案中,本文公开的遗传修饰的植物包含编码所述至少一种异源CSLG基因的核酸序列,其中所述CSLG的核酸序列在SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101、103或105中的任一;或与SEQ ID NO:30、32、36、38、40、65、80、93、95、97、99、101、103或105中的任一所示的核酸序列具有至少55%的同一性和至少80%的覆盖度的其同源物中示出。
在一些实施方案中,本文公开的遗传修饰的植物包含编码所述至少一种异源CSLG基因的核酸序列,其中所述CSLG的核酸序列在SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101、103或105中的任一;或与SEQ ID NO:30、32、36、38、40、65、80、93、95、97、99、101、103或105中的任一所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出。
在一些实施方案中,本文公开的遗传修饰的植物还包含编码除异源CSLG基因外的至少一种其他异源基因的核酸序列,其中所述额外基因编码
(a)β-香树素合酶,并且所述核酸序列在SEQ ID NO:45;或与SEQ ID NO:45所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;或
(b)细胞色素P450,所述核酸序列在SEQ ID NO:46、51或53中的任一;或与SEQ IDNO:46、51或53中的任一所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;或
(c)糖基转移酶,所述核酸序列在SEQ ID NO:55、57、59或61中的任一;或与SEQ IDNO:55、57、59或61中的任一所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;或
(d)乙酰基转移酶,所述核酸序列在SEQ ID NO:63;或与SEQ ID NO:63所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;或
(e)UDP-葡萄糖6-脱氢酶1,所述核酸序列在SEQ ID NO:74;或与SEQ ID NO:74所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;或
(f)(a)、(b)、(c)、(d)和(e)的其任何组合。
在一些实施方案中,包含本文公开的编码酶的至少一种异源基因的多核苷酸序列,包含与选自30、32、34、36、38、40、45、46、47、51、53、55、57、59、61、63、65、80、93、95、97、99、101、103或105或其组合中的序列具有至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%的同源性的核酸序列。在一些实施方案中,本文公开的编码酶的至少一种异源基因的核酸序列,包含与选自30、32、34、36、38、40、45、46、47、51、53、55、57、59、61、63、65、80、93、95、97、99、101、103或105或其组合中的序列具有至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%的同一性的核酸序列。
在一些实施方案中,本文公开的编码酶的至少一种异源基因的核酸序列,包含选自30、32、34、36、38、40、45、46、47、51、53、55、57、59、61、63、65、80、93、95、97、99、101、103或105或其组合中的核酸序列。
在一些实施方案中,与选自30、32、34、36、38、40、45、46、47、51、53、55、57、59、61、63、65、80、93、95、97、99、101、103或105中的序列具有至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%的同一性的核酸序列包含密码子优化的基因序列。
在一些实施方案中,优化基因需要使密码子使用适应宿主基因的密码子偏倚(bias),所述宿主基因在一个实施方案中包含植物宿主。在一些实施方案中,优化基因需要使密码子使用适应宿主基因的密码子偏倚,所述宿主基因在一个实施方案中包含酵母宿主。在一些实施方案中,优化基因需要使密码子使用适应宿主基因的密码子偏倚,所述宿主基因在一个实施方案中包含藻类宿主。在一些实施方案中,密码子优化的基因序列可以通过增加本文的至少一种异源基因的转移效率来改善有生命的有机体中的蛋白质表达水平。在一些实施方案中,密码子优化包含用于酵母中表达的密码子优化。在一些实施方案中,密码子优化包含用于藻类中表达的密码子优化。在一些实施方案中,密码子优化包含用于植物细胞中表达的密码子优化。
在一些实施方案中,术语“优化的”涵盖预期改变,所述改变在一个实施方案中是基因表达的改变,并且在另一实施方案中是蛋白质表达的改变。在一个实施方案中,优化的基因表达是基因表达的优化调节。在一个实施方案中,优化的基因表达是基因表达的增加。根据此方面并且在一个实施方案中,预期的是,基因表达与野生型相比而言增加2倍到1000倍。预期的是:在另一个实施方案中,基因表达增加2倍到500倍,在另一个实施方案中,基因表达增加2倍到100倍,在另一个实施方案中,基因表达增加2倍到50倍,在另一个实施方案中,基因表达增加2倍到20倍,在另一个实施方案中,基因表达增加2倍到10倍,在另一个实施方案中,基因表达增加3倍到5倍。
在另一个实施方案中,优化的基因表达可以是基因表达在特定环境条件下的增加。在另一个实施方案中,优化的基因表达可以包含基因表达的减少,所述基因表达减少在一个实施方案中可以仅在特定的环境条件下发生。
在一个实施方案中,优化的基因表达是基因表达持续时间的增加。根据此方面并且在一个实施方案中,预期的是,基因表达持续时间与野生型相比而言增加2倍到1000倍。预期的是:在另一个实施方案中,基因表达持续时间增加2倍到500倍,在另一个实施方案中,基因表达持续时间增加2倍到100倍,在另一个实施方案中,基因表达持续时间增加2倍到50倍,在另一个实施方案中,基因表达持续时间增加2倍到20倍,在另一个实施方案中,基因表达持续时间增加2倍到10倍,在另一个实施方案中,基因表达持续时间增加3倍到5倍。在另一个实施方案中,将增加的基因表达持续时间与在非载体表达对照中的基因表达相比较,或与在野生型载体表达对照中的基因表达相比较。
所属领域中的技术人员应理解,在一些实施方案中,在遗传修饰的细胞中表达编码酶的多种异源基因。在一些实施方案中,细胞包含编码多种异源基因的多核苷酸序列。在其他实施方案中,当在遗传修饰的细胞中表达编码酶的多种异源基因时,可以使用多个多核苷酸序列来编码所述多种异源基因,其中多核苷酸序列可以包含一种或多种基因。在一些实施方案中,当在遗传修饰的细胞中表达编码酶的多种异源基因时,可以使用多个多核苷酸序列来编码所述多种异源基因,其中每个多核苷酸序列可以包含一种单一基因。在一些实施方案中,当在遗传修饰的细胞中表达编码酶的多种异源基因时,可以使用多个多核苷酸序列来编码所述多种异源基因,其中每个多核苷酸序列包含一种或多种基因。
如本文全文中所公开,在一些实施方案中,遗传修饰的细胞包含植物细胞。在一些实施方案中,遗传修饰的植物细胞包含在植物或植物部分内。在其他实施方案中,遗传修饰的细胞包含酵母细胞。在其他实施方案中,遗传修饰的细胞包含藻细胞。在其他实施方案中,遗传修饰的细胞包含昆虫细胞。在其他实施方案中,遗传修饰的细胞包含细菌。
附加地,所属领域中的技术人员应理解,在一些实施方案中,在遗传修饰的植物中表达编码酶的多种异源基因。在一些实施方案中,植物包含编码多种异源基因的多核苷酸序列。在其他实施方案中,当在遗传修饰的植物中表达编码酶的多种异源基因时,可以使用多个多核苷酸序列来编码所述多种异源基因,其中多核苷酸序列可以包含一种或多种基因。在一些实施方案中,当在遗传修饰的植物中表达编码酶的多种异源基因时,可以使用多个多核苷酸序列来编码所述多种异源基因,其中每个多核苷酸序列可以包含一种单一基因。在一些实施方案中,当在遗传修饰的植物中表达编码酶的多种异源基因时,可以使用多个多核苷酸序列来编码所述多种异源基因,其中每个多核苷酸序列包含一种或多种基因。
在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列包含甾体生物碱生物合成酶、甾体皂苷生物合成酶和/或三萜生物合成酶的氨基酸序列。
在一些实施方案中,由至少一种异源基因编码的氨基酸序列在SEQ ID NO:31、33、35、37、39、41、48、49、50、52、54、56、58、60、62、64、64、81、94、96、98、100、102或104中的任一示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在SEQ ID NO:31中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在SEQ ID NO:33中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在SEQ ID NO:35中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在SEQ ID NO:37中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在SEQ ID NO:39中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在SEQ ID NO:41中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在SEQ ID NO:48中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在SEQ ID NO:49中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在SEQ ID NO:50中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在SEQ ID NO:52中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在SEQ ID NO:54中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在SEQ ID NO:56中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在SEQ ID NO:58中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在SEQ ID NO:60中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在SEQ ID NO:62中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在SEQ ID NO:64中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在SEQ ID NO:66中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在SEQ ID NO:69中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在SEQ ID NO:81中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在SEQ ID NO:94中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在SEQ ID NO:96中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在SEQ ID NO:98中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在SEQ ID NO:100中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在SEQ ID NO:102中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在SEQ ID NO:104中示出。
在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在与SEQ ID NO:31、33、35、37、39、41、48、49、50、52、54、56、58、60、62、64、64、81、94、96、98、100、102或104中的任一所示氨基酸序列具有至少55%的同一性的序列中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在与SEQ ID NO:31所示的氨基酸序列具有至少55%同一性的序列中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在与SEQ ID NO:33所示的氨基酸序列具有至少55%同一性的序列中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在与SEQ ID NO:35所示的氨基酸序列具有至少55%同一性的序列中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在与SEQ ID NO:37所示的氨基酸序列具有至少55%同一性的序列中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在与SEQ ID NO:39所示的氨基酸序列具有至少55%同一性的序列中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在与SEQ ID NO:41所示的氨基酸序列具有至少55%同一性的序列中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在与SEQ ID NO:48所示的氨基酸序列具有至少55%同一性的序列中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在与SEQ ID NO:49所示的氨基酸序列具有至少55%同一性的序列中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在与SEQ ID NO:50所示的氨基酸序列具有至少55%同一性的序列中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在与SEQ ID NO:52所示的氨基酸序列具有至少55%同一性的序列中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在与SEQID NO:54所示的氨基酸序列具有至少55%同一性的序列中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在与SEQ ID NO:56所示的氨基酸序列具有至少55%同一性的序列中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在与SEQ ID NO:58所示的氨基酸序列具有至少55%同一性的序列中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在与SEQ ID NO:60所示的氨基酸序列具有至少55%同一性的序列中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在与SEQ ID NO:62所示的氨基酸序列具有至少55%同一性的序列中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在与SEQ ID NO:64所示的氨基酸序列具有至少55%同一性的序列中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在与SEQ ID NO:66所示的氨基酸序列具有至少55%同一性的序列中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在与SEQ ID NO:69所示的氨基酸序列具有至少55%同一性的序列中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在与SEQ ID NO:81所示的氨基酸序列具有至少55%同一性的序列中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在与SEQ ID NO:94所示的氨基酸序列具有至少55%同一性的序列中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在与SEQ ID NO:96所示的氨基酸序列具有至少55%同一性的序列中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在与SEQID NO:98所示的氨基酸序列具有至少55%同一性的序列中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在与SEQ ID NO:100所示的氨基酸序列具有至少55%同一性的序列中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在与SEQ ID NO:102所示的氨基酸序列具有至少55%同一性的序列中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在与SEQ ID NO:104所示的氨基酸序列具有至少55%同一性的序列中示出。
在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在与SEQ ID NO:31、33、35、37、39、41、48、49、50、52、54、56、58、60、62、64、64、81、94、96、98、100、102或104中的任一所示氨基酸序列具有至少55%、60%、65%、70%、75%、80%、85%、90%、95%、98%或99%同一性的序列中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在与SEQ ID NO:31、33、35、37、39、41、48、49、50、52、54、56、58、60、62、64、64、81、94、96、98、100、102或104中的任一所示氨基酸序列具有至少55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或100%覆盖度的序列中示出。
在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在与SEQ ID NO:31、33、35、37、39、41、48、49、50、52、54、56、58、60、62、64、64、81、94、96、98、100、102或104中的任一所示氨基酸序列具有至少80%的同一性的序列中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在与SEQ ID NO:31所示的氨基酸序列具有至少80%同一性的序列中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在与SEQ ID NO:33所示的氨基酸序列具有至少80%同一性的序列中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在与SEQ ID NO:35所示的氨基酸序列具有至少80%同一性的序列中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在与SEQ ID NO:37所示的氨基酸序列具有至少80%同一性的序列中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在与SEQ ID NO:39所示的氨基酸序列具有至少80%同一性的序列中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在与SEQ ID NO:41所示的氨基酸序列具有至少80%同一性的序列中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在与SEQ ID NO:48所示的氨基酸序列具有至少80%同一性的序列中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在与SEQ ID NO:49所示的氨基酸序列具有至少80%同一性的序列中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在与SEQ ID NO:50所示的氨基酸序列具有至少80%同一性的序列中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在与SEQ ID NO:52所示的氨基酸序列具有至少80%同一性的序列中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在与SEQID NO:54所示的氨基酸序列具有至少80%同一性的序列中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在与SEQ ID NO:56所示的氨基酸序列具有至少80%同一性的序列中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在与SEQ ID NO:58所示的氨基酸序列具有至少80%同一性的序列中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在与SEQ ID NO:60所示的氨基酸序列具有至少80%同一性的序列中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在与SEQ ID NO:62所示的氨基酸序列具有至少80%同一性的序列中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在与SEQ ID NO:64所示的氨基酸序列具有至少80%同一性的序列中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在与SEQ ID NO:66所示的氨基酸序列具有至少80%同一性的序列中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在与SEQ ID NO:69所示的氨基酸序列具有至少80%同一性的序列中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在与SEQ ID NO:81所示的氨基酸序列具有至少80%同一性的序列中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在与SEQ ID NO:94所示的氨基酸序列具有至少80%同一性的序列中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在与SEQ ID NO:96所示的氨基酸序列具有至少80%同一性的序列中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在与SEQID NO:98所示的氨基酸序列具有至少80%同一性的序列中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在与SEQ ID NO:100所示的氨基酸序列具有至少80%同一性的序列中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在与SEQ ID NO:102所示的氨基酸序列具有至少80%同一性的序列中示出。在一些实施方案中,由至少一种异源基因编码的酶的氨基酸序列在与SEQ ID NO:104所示的氨基酸序列具有至少80%同一性的序列中示出。
在一些实施方案中,由至少一种异源基因编码的酶包含与选自31、33、35、37、39、41、48、49、50、52、54、56、58、60、62、64、66、81、94、96、98、100、102或104中的序列具有至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%同源性的氨基酸序列。在一些实施方案中,由至少一种异源基因编码的酶包含与选自31、33、35、37、39、41、48、49、50、52、54、56、58、60、62、64、66、81、94、96、98、100、102或104中的序列具有至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少95%同一性的氨基酸序列。
在一些实施方案中,由至少一种异源基因编码的酶包含与选自31、33、35、37、39、41、48、49、50、52、54、56、58、60、62、64、66、81、94、96、98、100、102或104中的序列具有至少80%、至少85%、至少90%或至少95%同源性的氨基酸序列。在一些实施方案中,由至少一种异源基因编码的酶包含与选自31、33、35、37、39、41、48、49、50、52、54、56、58、60、62、64、66、81、94、96、98、100、102或104中的序列具有至少80%、至少85%、至少95%同一性的氨基酸序列。
在一些实施方案中,所述被编码的CSLG酶的氨基酸序列在SEQ ID NO:31、33、35、37、39、41、66、81、94、96、98、100、102或104中的任一;或与SEQ ID NO:31、33、35、37、39、41、66、81、94、96、98、100、102或104中的任一所示的氨基酸序列具有至少55%的同一性和至少55%的覆盖度的其同源物中示出。在一些实施方案中,所述被编码的CSLG酶的氨基酸序列在SEQ ID NO:31、33、35、37、39、41、66、81、94、96、98、100、102或104中的任一;或与SEQ IDNO:31、33、35、37、39、41、66、81、94、96、98、100、102或104中的任一所示的氨基酸序列具有至少55%的同一性和至少80%的覆盖度的其同源物中示出。
在一些实施方案中,所述被编码的CSLG酶的氨基酸序列在SEQ ID NO:31、33、35、37、39、41、66、81、94、96、98、100、102或104中的任一;或与SEQ ID NO:31、33、35、37、39、41、66、81、94、96、98、100、102或104中的任一所示的氨基酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出。
在一些实施方案中,所述被编码的至少一种其他异源基因的氨基酸序列编码β-香树素合酶,所述氨基酸序列在SEQ ID NO:45中示出;或其与SEQ ID NO:45所示的氨基酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物。在一些实施方案中,所述被编码的至少一种其他异源基因的氨基酸序列编码细胞色素P450,所述氨基酸序列在SEQ IDNO:46、51或53中的任一示出;其与SEQ ID NO:46、51或53中的任一的氨基酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物。在一些实施方案中,所述被编码的至少一种其他异源基因的氨基酸序列编码糖基转移酶,所述氨基酸序列在SEQ ID NO:55、57、59或61中的任一示出;其与SEQ ID NO:55、57、59或61中的任一的氨基酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物。在一些实施方案中,所述被编码的至少一种其他异源基因的氨基酸序列编码乙酰基转移酶,所述氨基酸序列在SEQ ID NO:63中示出;或其与SEQ ID NO:63所示的氨基酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物。在一些实施方案中,所述被编码的至少一种其他异源基因的氨基酸序列编码UDP-葡萄糖6-脱氢酶1,所述氨基酸序列在SEQ ID NO:74中示出;或其与SEQ ID NO:74所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物。
在一些实施方案中,与内源CSLG在相应的未修饰的细胞中的表达相比,遗传修饰的植物细胞具有至少内源CSLG基因的改变表达。在一些实施方案中,与内源CSLG在相应的未修饰的细胞中的表达相比,遗传修饰的植物细胞具有至少内源CSLG基因的改变表达,其中所述细胞具有含量改变的至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体。
改变内源CSLG的表达影响甾体生物碱生物合成途径、甾体皂苷生物合成途径和/或三萜皂苷生物合成途径,并且在一些实施方案中,分别致使该途径的甾体生物碱谱或中间体、该途径的甾体皂苷谱或中间体,或该途径的三萜皂苷谱或中间体随之改变。
在一些实施方案中,与相应的未修饰的细胞相比,所述遗传修饰的细胞中的表达改变包含CSLG表达的增加。在一些实施方案中,表达的增加导致被编码的酶的量增加。在一些实施方案中,CSLG表达的增加致使所述甾体生物碱谱改变,所述甾体生物碱谱的改变包含至少一种甾体生物碱或其中间体的增加。在一些实施方案中,CSLG表达的增加致使所述甾体皂苷谱改变,所述甾体皂苷谱的改变包含至少一种甾体皂苷或其中间体的增加。在一些实施方案中,CSLG表达的增加致使所述三萜皂苷谱改变,所述三萜皂苷谱的改变包含至少一种三萜皂苷或其中间体的增加。
在一些实施方案中,与相应的未修饰的细胞相比,所述遗传修饰的细胞中的表达改变包含CSLG表达的减少。在一些实施方案中,表达的减少导致被编码的酶的量减少。在一些实施方案中,CSLG表达的减少致使所述甾体生物碱谱改变,所述甾体生物碱谱的改变包含至少一种甾体生物碱或其中间体的减少。在一些实施方案中,CSLG表达的减少致使所述甾体皂苷谱改变,所述甾体皂苷谱的改变包含至少一种甾体皂苷或其中间体的减少。在一些实施方案中,CSLG表达的减少致使所述三萜皂苷谱改变,所述三萜皂苷谱的改变包含至少一种三萜皂苷或其中间体的减少。
在一些实施方案中,具有改变的内源CSLG基因表达的至少一种细胞包含植物细胞。在一些实施方案中,具有改变的内源CSLG基因表达的至少一种细胞包含植物细胞,所述植物细胞包含在植物或植物部分内。在一些实施方案中,具有改变的内源CSLG基因表达的至少一种细胞是所述CSLG基因中突变的结果。在一些实施方案中,所述突变包含至少一个或多个点突变、或插入、或缺失、或其任何组合,其中所述被表达的CSLG酶具有增加的稳定性或增加的活性或这两者,并且含量的改变包含与相应的未修饰的植物相比,增加量的至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体。在一些实施方案中,所述突变包含至少一个或多个点突变、或插入、或缺失、或其任何组合,其中所述被表达的CSLG酶具有降低的稳定性或降低的活性或这两者,并且含量的改变包含与相应的未修饰的植物相比,减少量的至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体。
根据某些实施方案,改变内源CSLG基因的表达,所述改变包含诱变CSLG基因,其中该诱变包含引入一个或多个点突变、插入、缺失或基因组编辑,或使用细菌CRISPR/CAS系统或其组合。根据某些实施方案,与其在相应的未修饰的植物中的表达相比,编码CLSG酶的基因的表达增加,因此所述遗传修饰的植物包含与相应的未修饰的植物相比,含量增加的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;含量增加的至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或含量增加的至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体。根据某些实施方案,与其在相应的未修饰的植物中的表达相比,编码CLSG酶的基因的表达减少,因此所述遗传修饰的植物包含与相应的未修饰的植物相比,含量减少的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;含量减少的至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或含量减少的至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,甾体生物碱的衍生物、甾体皂苷的衍生物或三萜皂苷的衍生物分别包含甾体生物碱的糖基化衍生物、甾体皂苷的糖基化衍生物或三萜皂苷的糖基化衍生物。
将突变引入CSLG基因内,所述突变包括缺失、插入、位点特异性突变、锌指核酸酶等,可用于例如基因表达的上调、被表达CSLG酶的稳定性提高、CSLG酶的活性提高、基因表达的下调、被表达CSLG酶的稳定性降低、CSLG酶的活性降低,或或CSLG酶活性的消除。
根据某些实施方案,突变的CSLG基因包含在CSLG基因的核酸序列中具有至少一个突变的多核苷酸,其中所述CSLG的核酸序列在SEQ ID NO:31、33、35、37、39、41、65、80、93、95、97、99、101、103或105或其互补序列中示出。
所属领域中的普通技术人员应理解,所述遗传修饰的植物可以包含含有至少一种经人进行遗传修饰的细胞的植物。在某些实施方案中,所述遗传修饰包括内源基因的修饰,例如通过将突变缺失、插入、转座元件等引入内源多核苷酸或目的基因中。附加地或可替代地,在一些实施方案中,所述遗传修饰包括用一种异源多核苷酸或多种异源多核苷酸来转化至少一种植物细胞。所属领域中的技术人员应理解,在某些实施方案中,包含用一种或多种异源多核苷酸来转化至少一个植物细胞的遗传修饰的植物可以称为“转基因植物”或“遗传修饰的植物”,这两者具有相同的含义和性质。
在某些实施方案中,可以通过将一种或多种点突变引入编码相应蛋白质的核酸分子中来实现改变内源CSLG基因的表达。可以使用例如定点诱变来引入突变(参见,例如,WuEd,1993,《酶学方法》(Meth.In Enzymol),第217卷,圣地亚哥:学术出版社(San Diego:Academic Press);Higuchi,“重组PCR”(Recombinant PCR),Innis等人,Eds.,1990PCRProtocols,San Diego:Academic Press,Inc)。该诱变可用于引入特异性预期氨基酸插入、缺失或取代。几种靶向诱变技术基于在基因组中靶向诱导双链断裂(DSB),然后进行容易出错的DNA修复。通过这些方法最常用于基因组编辑的是定制设计的核酸酶,包括锌指核酸酶、核酸内切酶,包括大范围核酸酶,以及黄单胞菌属衍生的类转录激活因子效应子核酸酶(TALEN)酶。
在一些实施方案中,当CSLG基因的表达改变时,所述改变包含诱变CSLG基因,所述突变存在于所述CSLG基因的编码区或所述CSLG基因的调节序列中,或其组合中。
可以使用各种类型的诱变来修饰CSLG及其编码的酶,以生成保守或非保守的变体。可以使用任何可用的诱变程序。在一些实施方案中,诱变程序包含定点诱变。在一些实施方案中,诱变程序包含随机点诱变。在一些实施方案中,诱变程序包含体外或体内同源重组(DNA改组)。在一些实施方案中,诱变程序包含使用含尿嘧啶的模板诱变。在一些实施方案中,诱变程序包含寡核苷酸定向诱变。在一些实施方案中,诱变程序包含硫代磷酸酯修饰的DNA诱变。在一些实施方案中,诱变程序包含使用有缺口的双链体DNA诱变。在一些实施方案中,诱变程序包含点错配修复。在一些实施方案中,诱变程序包含使用修复缺陷型宿主菌株的诱变。在一些实施方案中,诱变程序包含限制选择和限制纯化。在一些实施方案中,诱变程序包含缺失诱变。在一些实施方案中,诱变程序包含通过总基因合成的诱变。在一些实施方案中,诱变程序包含双链断裂修复。在一些实施方案中,诱变程序包含通过嵌合构建体的诱变。在一些实施方案中,诱变程序包含通过CRISPR/Cas的诱变。在一些实施方案中,诱变方法包含通过大范围核酸酶诱变。在一些实施方案中,诱变程序包含通过锌指核酸酶(ZFN)的诱变。在一些实施方案中,诱变程序包含通过类转录激活因子效应子核酸酶(TALEN)的诱变。在一些实施方案中,诱变程序包含所属领域中的技术人员已知的任何其他诱变程序。
在一些实施方案中,诱变可以受关于天然存在的分子和/或突变的分子的已知信息的引导。例如,所述已知信息可以包含序列、序列比较、物理性质、晶体结构等。在一些实施方案中,诱变基本上是随机的。在一些实施方案中,诱变程序包含DNA改组。
技术人员将理解,规律成簇间隔短回文重复序列(CRISPR)/CRISPR相关蛋白(Cas)系统包含基于细菌CRISPR/Cas原核适应性免疫系统的基因组工程工具。这项基于RNA的技术是非常特异的,可通过可定制的小型非编码RNA靶向切割基因组DNA,从而通过非同源末端连接(NHEJ)和同源定向修复(HDR)机制进行遗传修饰(Belhaj K.等人,2013,《植物方法》(Plant Methods),2013,9:39)。在一些实施方案中,CRISPR/Cas系统包含CRISPR/Cas9系统。
在一些实施方案中,CRISPR/Cas系统包含所属领域中已知的单引导RNA(sgRNA)和/或Cas蛋白。在一些实施方案中,CRISPR/Cas系统包含新创建以在预选位点切割的单引导RNA(sgRNA)和/或Cas蛋白。技术人员将理解,术语“单引导RNA”、“sgRNA”和“gRNA”是可互换的,具有所有相同的性质和含义,其中sgRNA可以包含由CRISPR RNA和反编码的CRISPRRNA(tracrRNA)组成的嵌合RNA分子(crRNA)。在一些实施方案中,crRNA与GAME15 DNA的预选区域互补,其中crRNA将CRISPR相关多肽(Cas)核酸酶蛋白“靶向”至预选择的靶位点。
在一些实施方案中,crRNA序列互补的长度为19-22个核苷酸长,例如与靶位点互补的19-22个连续核苷酸。在另一个实施方案中,与DNA区域互补的crRNA序列的长度为约15-30个核苷酸长。在另一个实施方案中,与DNA区域互补的crRNA序列的长度为约15、16、17、18、19、20、21、22、23、24、25、26、27、28、29或30个核苷酸长。在另一个实施方案中,与DNA区域互补的crRNA序列的长度为20个核苷酸长。在一些实施方案中,crRNA位于sgRNA分子的5'端。在另一个实施方案中,crRNA在预选靶序列内包含100%互补。在另一个实施方案中,crRNA在预选靶序列内包含至少80%互补。在另一个实施方案中,crRNA在预选靶序列内包含至少85%互补。在另一个实施方案中,crRNA在预选靶序列内包含至少90%互补。在另一个实施方案中,crRNA在预选靶序列内包含至少95%互补。在另一个实施方案中,crRNA在预选靶序列内包含至少97%互补。在另一个实施方案中,crRNA在预选靶序列内包含至少99%互补。在另一个实施方案中,tracrRNA为100-300个核苷酸长,并且提供Cas核酸酶,例如形成CRISPR/Cas9复合物的Cas9蛋白的结合位点。
在一个实施方案中,诱变系统包含CRISPR/Cas系统。在另一个实施方案中,CRISPR/Cas系统包含Cas核酸酶和gRNA分子,其中所述gRNA分子在所述预选内源靶位点内结合,从而引导所述Cas核酸酶在所述预选内源靶位点内切割DNA。
在一些实施方案中,CRISPR/Cas系统包含酶系统,所述酶系统包括引导RNA序列(“gRNA”或“sgRNA”),该引导RNA序列包含与靶多核苷酸的区域例如预选内源靶位点互补或大体上互补的核苷酸序列,以及具有核酸酶活性的蛋白质。
在另一个实施方案中,CRISPR/Cas系统包含I型CRISPR-Cas系统、II型CRISPR-Cas系统、III型CRISPR-Cas系统或其衍生物。在另一个实施方案中,CRISPR-Cas系统包含源自天然产生的CRISPR-Cas系统的工程和/或程序化核酸酶系统。在另一个实施方案中,CRISPR-Cas系统包含工程化和/或突变的Cas蛋白。在另一个实施方案中,CRISPR-Cas系统包含工程化和/或程序化的引导RNA。
所属领域中技术人员应理解,引导RNA可以含有除与靶DNA序列的区域例如预选内源靶位点互补或大体上互补的区域以外的核苷酸序列。在另一个实施方案中,引导RNA包含crRNA或其衍生物。在另一个实施方案中,引导RNA包含crRNA:tracrRNA嵌合体。
在另一个实施方案中,gRNA分子包含与至少一个同源染色体上的预选内源靶位点互补并结合的结构域。在另一个实施方案中,gRNA分子包含与至少一个同源染色体上的多态等位基因互补并结合的结构域。在另一个实施方案中,gRNA分子包含与两个同源染色体上的预选内源靶位点互补并结合的结构域。在另一个实施方案中,gRNA分子包含与两个同源染色体上的多态等位基因互补并结合的结构域。
Cas酶包含能够在DNA中生成双链断裂(DSB)的RNA引导的DNA核酸内切酶。术语“Cas酶”可以与具有所有相同的性质和含义的术语“CRISPR相关核酸内切酶”或“CRISPR相关多肽”互换使用。在一个实施方案中,Cas酶选自Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9、Cas10、C2cl、CasX、NgAgo、Cpf1、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3和Csf4或其同源物,或其经修饰版本。在另一个实施方案中,Cas酶包含Cas9。在另一个实施方案中,Cas酶包含Cas1。在另一个实施方案中,Cas酶包含Cas1B。在另一个实施方案中,Cas酶包含Cas2。在另一个实施方案中,Cas酶包含Cas3。在另一个实施方案中,Cas酶包含Cas4。在另一个实施方案中,Cas酶包含Cas5。在另一个实施方案中,Cas酶包含Cas6。在另一个实施方案中,Cas酶包含Cas7。在另一个实施方案中,Cas酶包含Cas8。在另一个实施方案中,Cas酶包含Cas10。在另一个实施方案中,Cas酶包含Cpf1。在另一个实施方案中,Cas酶包含Csy1。在另一个实施方案中,Cas酶包含Csy2。在另一个实施方案中,Cas酶包含Csy3。在另一个实施方案中,Cas酶包含Cse1。在另一个实施方案中,Cas酶包含Cse2。在另一个实施方案中,Cas酶包含Csc1。在另一个实施方案中,Cas酶包含Csc2。在另一个实施方案中,Cas酶包含Csa5。在另一个实施方案中,Cas酶包含Csn2。在另一个实施方案中,Cas酶包含Csm2。在另一个实施方案中,Cas酶包含Csm3。在另一个实施方案中,Cas酶包含Csm4。在另一个实施方案中,Cas酶包含Csm5。在另一个实施方案中,Cas酶包含Csm6。在另一个实施方案中,Cas酶包含Cmr1。在另一个实施方案中,Cas酶包含Cmr3。在另一个实施方案中,Cas酶包含Cmr4。在另一个实施方案中,Cas酶包含Cmr5。在另一个实施方案中,Cas酶包含Cmr6。在另一个实施方案中,Cas酶包含Csb1。在另一个实施方案中,Cas酶包含Csb2。在另一个实施方案中,Cas酶包含Csb3。在另一个实施方案中,Cas酶包含Csx17。在另一个实施方案中,Cas酶包含Csx14。在另一个实施方案中,Cas酶包含Csx10。在另一个实施方案中,Cas酶包含Csx16、CsaX。在另一个实施方案中,Cas酶包含Csx3。在另一个实施方案中,Cas酶包含Csx1、Csx15、Csf1。在另一个实施方案中,Cas酶包含Csf2。在另一个实施方案中,Cas酶包含Csf3。在另一个实施方案中,Cas酶包含Csf4。在另一个实施方案中,Cas酶包含Cpf1。在另一个实施方案中,Cas酶包含C2cl。在另一个实施方案中,Cas酶包含CasX。在另一个实施方案中,Cas酶包含NgAgo。在另一个实施方案中,Cas酶包含Cas同源物。在另一个实施方案中,Cas酶包含Cas直系同源物。在另一个实施方案中,Cas酶包含经修饰的Cas酶。在另一个实施方案中,Cas酶是所属领域中已知的任何CRISPR相关核酸内切酶。
所属领域中的技术人员应理解,术语“锌指核酸酶”或“ZFN”是可互换的,具有所有相同的含义和性质,其中ZFN涵盖嵌合蛋白分子,所述嵌合蛋白分子包含可操作地连接到能够双链切割DNA的至少一种核酸酶的至少一种锌指DNA结合结构域。在一些实施方案中,ZFN系统包含所属领域中已知的ZFN。在一些实施方案中,ZFN系统包含新创建以在预选位点切割的ZFN。
在一些实施方案中,ZFN在预选内源靶位点处产生双链断裂。在一些实施方案中,ZFN包含DNA结合结构域和DNA切割结构域,其中所述DNA结合结构域包含至少一个锌指并且可操作地连接到DNA切割结构域。在另一个实施方案中,锌指DNA结合结构域位于嵌合蛋白分子的N末端,并且DNA切割结构域位于分子的C末端。在另一个实施方案中,锌指DNA结合结构域位于嵌合蛋白分子的C末端,并且DNA切割结构域位于分子的N末端。在另一个实施方案中,锌指结合结构域涵盖锌指核酸酶中能够结合靶位点,例如本文公开的预选内源靶位点的区域。在另一个实施方案中,锌指DNA结合结构域包含与至少一个同源染色体上的预选内源靶位点结合的蛋白质结构域。在另一个实施方案中,锌指DNA结合结构域包含与至少一个同源染色体上的多态等位基因结合的蛋白质结构域。在另一个实施方案中,锌指DNA结合结构域包含与两个同源染色体上的预选内源靶位点结合的蛋白结构域。在另一个实施方案中,锌指DNA结合结构域包含与两个同源染色体上的多态等位基因结合的蛋白质结构域。
所属领域中技术人员应理解,术语“嵌合蛋白”用于描述从已经通过可操作地连接两个或更多个DNA节段而产生的DNA分子表达的蛋白质。DNA节段可以来自相同物种,或可以来自不同物种。DNA节段可以来自相同或不同基因。所属领域中的技术人员应理解,ZFN的术语“DNA切割结构域”涵盖锌指核酸酶中的能够破坏核苷酸链中的核酸之间的化学键的区域。含有切割结构域的蛋白质的实例包括限制酶、拓扑异构酶、重组酶、整合酶和DNA酶。
所属领域中的技术人员应理解,核酸内切酶包括大范围核酸酶,也称为归巢核酸内切酶(HEase),其与限制性核酸内切酶一样,在特定DSB靶位点结合并切割,但是大范围核酸酶的DSB靶位点通常更长,约18bp或更长。大范围核酸酶结构域、结构和功能是已知的,参见,例如,Guhan和Muniyappa(2003)《生物化学与分子生物学批判性评论》(Crit RevBiochem Mol Biol)第38期:第199-248页;Lucas等人,(2001)《核酸研究》(Nucleic AcidsRes)第29期:第960-9页;Jurica和Stoddard,(1999)《细胞和分子生命科学》(Cell MolLife Sci)第55期:第1304-26页;Stoddard,(2006)《生物物理学季评》(Q Rev Biophys)第38期:第49-95页;以及Moure等人,(2002)《自然-结构与分子生物学》(Nat Struct Biol)第9期:第764页。在一些实施例中,使用天然存在的变体和/或工程化的衍生物大范围核酸酶(meganudease)。本文中可以使用任何大范围核酸酶,包括但不限于l-Scel,l-Scell,l-Scelll,l-ScelV,l-SceV,l-SceVI,l-SceVII,l-Ceul,l-CeuAIIP,l-Crel,I-CrepsblP,l-CrepsbllP,l-CrepsblllP,l-CrepsblVP,l-Tlil,l-Ppol,Pl-Pspl,F-Scel,F-Scell,F-Suvl,F-Tevl,F-Tevll,l-Amal,l-Anil,l-Chul,l-Cmoel,l-Cpal,l-Cpall,I-Csml,l-Cvul,l-CvuAIP,l-Ddil,l-Ddill,l-Dirl,l-Dmol,l-Hmul,l-Hmull,l-HsNIP,l-Llal,l-Msol,l-Naal,l-Nanl,l-NcllP,l-NgrIP,l-Nitl,l-Njal,l-Nsp236IP,l-Pakl,l-PbolP,I-PculP,l-PcuAI,l-PcuVI,l-PgrIP,l-PoblP,l-Porl,l-PorllP,l-PbpIP,l-SpBetalP,I-Scal,l-SexlP,l-SnelP,l-Spoml,l-SpomCP,l-SpomlP,l-SpomllP,l-SqulP,I-Ssp6803l,l-SthPhiJP,l-SthPhiST3P,l-SthPhiSTe3bP,l-TdelP,l-Tevl,l-Tevll,I-Tevlll,l-UarAP,l-UarHGPAIP,l-UarHGPA13P,l-VinIP,l-ZbilP,Pl-Mtul,PI-MtuHIP PI-MtuHIIP,Pl-Pful,Pl-Pfull,Pl-Pkol,Pl-Pkoll,PI-Rma43812IP,PI-SpBetalP,Pl-Scel,Pl-Tful,Pl-Tfull,Pl-Thyl,Pl-Tlil,Pl-Tlill,或期任何有效变体或节段。TAL效应子核酸酶可以用于在植物或其他有机体的基因组中的特定靶序列处产生双链断裂。TAL效应子核酸酶可以通过将天然或工程化的类转录激活因子(TAL)效应子或其功能部分融合到核酸内切酶的催化结构域例如Fokl中来生成。独特的模块化TAL效应子DNA结合结构域可以设计具有任何给定DNA识别特异性的蛋白质。因此,可以将TAL效应子核酸酶的DNA结合结构域工程化以识别特定的DNA靶位点,从而用于在预期靶序列处进行双链断裂。参见WO 2010/079430;Morbitzer等人,(2010)《美国国家科学院院刊》(PNAS)10.1073/pnas.1013133107;Scholze&Boch(2010)《病毒性》(Virulence)1:428-432;Christian等人,《遗传学》(Genetics)(2010)第186期:第757-761页;Li等人(2010),《核酸研究》(Nuc.Acids Res.)(2010)doi:10.1093/nar/gkq704;以及Miller等人(2011)《自然-生物技术》(NatureBiotechnology)第29期:第143-148页;所有这些均以引用方式并入本文中。
在一些实施方案中,TALEN系统包含TAL效应子DNA结合结构域和DNA切割结构域,其中所述TAL效应子DNA结合结构域在所述预选内源靶位点内结合,从而靶向DNA切割域以在所述预选内源靶标内切割DNA。
所属领域中技术人员应理解,术语“类转录激活因子效应子核酸酶”、“TALEN”和“TAL效应子核酸酶”可以互换使用,具有所有相同的含义和性质,其中TALEN包含能够识别和切割其靶位点的核酸酶,例如本文公开的预选内源性靶位点。在另一个实施方案中,TALEN包含含有TALE结构域和核苷酸切割结构域的融合蛋白。在另一个实施方案中,TALE结构域包含通过一个或多个TALE重复模块以序列特异性方式与核苷酸结合的蛋白质结构域。所属领域中的技术人员应认识到,TALE-重复模块包含识别植物DNA序列的可变数目的约34个氨基酸重复。此外,可以根据简单的密码来重新排列重复模块,以靶向新的DNA序列。在另一个实施方案中,TALE结构域包含与至少一个同源染色体上的预选内源靶位点结合的蛋白质结构域。在另一个实施方案中,TALE结构域包含与至少一个同源染色体上的多态等位基因结合的蛋白质结构域。在另一个实施方案中,TALE结构域包含与两个同源染色体上的预选内源靶位点结合的蛋白结构域。在另一个实施方案中,TALE结构域包含与两个同源染色体上的多态等位基因结合的蛋白质结构域。
在一个实施方案中,TALE结构域包含TALE重复模块中的至少一个。在一个实施方案中,TALE结构域包含一个到三十个TALE重复模块。在另一个实施方案中,TALE结构域包含三十个以上的TALE重复模块。在另一个实施方案中,TALEN融合蛋白包含N端结构域、一个或多个TALE重复模块,其后是半重复模块、接头和核苷酸切割结构域。
可以使用使用试剂例如甲磺酸乙酯(EMS)进行化学诱变来获得点突变群体,并且筛选可能沉默或下调的CSGL基因突变。在植物中,可以使用基于自然种群基因的基因渗入的方法。对培养物种和野生型物种反复杂交,从而分离出包含给定野生基因组节段的植物。某些植物物种,例如玉蜀黍(玉米)和金鱼草具有天然的转座子。这些转座子是自主的,即转座酶位于转座子序列内;或是非自主的,即没有转座酶。所属领域中的技术人员可以使转座子“跳跃”并产生突变。替代地,可以合成在一个或多个预定位置具有随机核苷酸的核酸序列,以产生随机氨基酸取代。
在一些实施方案中,可以通过将一个或多个点突变引入其调节序列内来改变内源CSLG基因的表达。在一些实施方案中,可以通过将一个或多个点突变引入其调节序列内来改变异源CSLG基因的表达。
所属领域中的技术人员应理解,“调节序列”是指位于编码序列上游(5'非编码序列)、内部或下游(3'非编码序列)的核苷酸序列,其影响转录、RNA加工或稳定性,或相关编码序列的翻译。在一些实施方案中,调节序列包含启动子。在一些实施方案中,调节序列包含翻译前导序列。在一些实施方案中,调节序列包含内含子。在一些实施方案中,调节序列包含聚腺苷酸化识别序列。在一些实施方案中,调节序列包含RNA加工位点。在一些实施方案中,调节序列包含效应子结合位点。在一些实施方案中,调节序列包含茎环结构。
所属领域中的技术人员应理解,“启动子”是指能够控制编码序列或功能性RNA的表达的DNA序列。在一些实施方案中,编码序列位于启动子序列的3'处。所属领域中的技术人员应理解,不同的启动子可以引导基因在不同组织或细胞类型中,或在不同发育阶段,或响应于不同环境或生理条件的表达。在一些实施方案中,所述启动子包含组成型启动子,即致使基因在大多数时间在大多数细胞类型中表达的启动子。在一些实施方案中,启动子包含受调节的启动子,即致使基因响应于偶发性特异性刺激而表达的启动子。进一步认识到,在许多情况下,调节序列的确切边界尚未完全定义。
所属领域中的技术人员应理解,术语“3'非编码序列”或“转录终止子”是指位于编码序列下游的DNA序列。在一些实施方案中,3’非编码序列包含聚腺苷酸化识别序列。在一些实施方案中,3'非编码序列包含编码能够影响mRNA加工的调节信号的序列。在一些实施方案中,3'非编码序列包含编码能够影响基因表达的调节信号的序列。聚腺苷酸化信号通常特征在于影响向mRNA前体的3'末端添加聚腺苷酸节段。在一些实施方案中,3'非编码序列中的突变影响基因转录。在一些实施方案中,3'非编码序列中的突变影响RNA加工。在一些实施方案中,3'非编码序列中的突变影响基因稳定性。在一些实施方案中,3'非编码序列中的突变影响相关编码序列的翻译。
根据某些实施方案,与其在相应的未修饰的植物中的表达相比,编码CSLG酶的基因的表达减少,因此所述遗传修饰的植物包含与相应的未修饰的植物相比,含量减少的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;含量减少的至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或含量减少的至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,甾体生物碱的衍生物、甾体皂苷的衍生物或三萜皂苷的衍生物分别包含甾体生物碱的糖基化衍生物、甾体皂苷的糖基化衍生物或三萜皂苷的糖基化衍生物。
根据某些实施方案,所述遗传修饰的植物是转基因植物,所述转基因植物包含至少一种细胞,所述至少一种细胞包含靶向编码CSLG酶的多核苷酸的至少一种沉默分子。根据某些实施方案,所述转基因植物包含编码CLSG酶的多核苷酸,其中,选择性地沉默、抑制或降低所述多核苷酸的表达。根据某些实施方案,所述转基因植物包含编码CSLG酶的多核苷酸,其中通过缺失、插入或修饰选择性地对所述多核苷酸进行编辑,从而沉默、抑制或减少其表达,或其中所述遗传修饰的植物是所述被基因编辑的植物的后代。
根据某些实施方案,所述转基因植物包含至少一种细胞,所述至少一种细胞包含靶向CSLG基因的至少一种沉默分子。
在一些实施方案中,选择性地沉默、抑制所述内源CSLG基因,或降低其表达,并且所述改变的含量包含与相应的未修饰的植物相比,减少量的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;减少量的所述至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或减少量的至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体;其中当选择性沉默、抑制所述内源CSLG基因,或具有降低的表达时,所述细胞还包含靶向编码所述CSLG基因的多核苷酸的至少一种沉默分子,其中所述沉默分子选自RNA干扰分子或反义分子,或其中所述沉默分子是病毒诱导的基因沉默系统的组分。
根据某些实施方案,转基因植物包含至少一种细胞,所述至少一种细胞包含靶向SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101、103或105中的任一所示的核酸序列的至少一种沉默分子。
根据某些实施方案,所述转基因植物包含至少一种细胞,所述至少一种细胞包含靶向SEQ ID NO:30所示核酸序列的至少一种沉默分子。根据某些实施方案,所述转基因植物包含至少一种细胞,所述至少一种细胞包含靶向SEQ ID NO:32所示核酸序列的至少一种沉默分子。根据某些实施方案,所述转基因植物包含至少一种细胞,所述至少一种细胞包含靶向SEQ ID NO:34所示核酸序列的至少一种沉默分子。根据某些实施方案,所述转基因植物包含至少一种细胞,所述至少一种细胞包含靶向SEQ ID NO:36所示核酸序列的至少一种沉默分子。根据某些实施方案,所述转基因植物包含至少一种细胞,所述至少一种细胞包含靶向SEQ ID NO:38所示核酸序列的至少一种沉默分子。根据某些实施方案,所述转基因植物包含至少一种细胞,所述至少一种细胞包含靶向SEQ ID NO:40所示核酸序列的至少一种沉默分子。根据某些实施方案,所述转基因植物包含至少一种细胞,所述至少一种细胞包含靶向SEQ ID NO:65所示核酸序列的至少一种沉默分子。根据某些实施方案,所述转基因植物包含至少一种细胞,所述至少一种细胞包含靶向SEQ ID NO:80所示核酸序列的至少一种沉默分子。根据某些实施方案,所述转基因植物包含至少一种细胞,所述至少一种细胞包含靶向SEQ ID NO:93所示核酸序列的至少一种沉默分子。根据某些实施方案,所述转基因植物包含至少一种细胞,所述至少一种细胞包含靶向SEQ ID NO:95所示核酸序列的至少一种沉默分子。根据某些实施方案,所述转基因植物包含至少一种细胞,所述至少一种细胞包含靶向SEQ ID NO:97所示核酸序列的至少一种沉默分子。根据某些实施方案,所述转基因植物包含至少一种细胞,所述至少一种细胞包含靶向SEQ ID NO:99所示核酸序列的至少一种沉默分子。根据某些实施方案,所述转基因植物包含至少一种细胞,所述至少一种细胞包含靶向SEQ ID NO:101所示核酸序列的至少一种沉默分子。根据某些实施方案,所述转基因植物包含至少一种细胞,所述至少一种细胞包含靶向SEQ ID NO:103所示核酸序列的至少一种沉默分子。根据某些实施方案,所述转基因植物包含至少一种细胞,所述至少一种细胞包含靶向SEQ ID NO:105所示核酸序列的至少一种沉默分子。
根据某些实施方案,所述沉默分子选自RNA干扰分子和反义分子,或其中所述沉默分子是病毒诱导基因沉默系统的组分。根据某些实施方案,所述沉默分子包含具有与CSLG基因的区域大体上互补的核酸序列的多核苷酸,所述多核苷酸具有SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101、103或105或其互补序列中的任一所示的核酸序列。在一些实施方案中,在植物或植物细胞中沉默、抑制或减少CSLG表达的反义分子包含多核苷酸,所述多核苷酸具有与CSLG基因的区域大体上互补的核酸序列,所述CSLG基因具有SEQID NO:30、32、34、36、38、40、65、80、93、95、97、99、101、103或105或其互补序列中的任一所示的核酸序列。在一些实施方案中,使植物或植物细胞中沉默、抑制或减少CSLG表达的反义分子具有SEQ ID NO:108所示的核苷酸序列。在一些实施方案中,在植物或植物细胞中沉默、抑制或降低CSLG表达的VIG分子具有SEQ ID NO:42、SEQ ID NO:43、SEQ ID NO:44、SEQID NO:106或SEQ ID NO:107所示的核苷酸序列。根据某些实施方案,所述沉默分子靶向CSLG节段,所述CSLG节段具有在SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101、103或105或其互补序列中示出的核酸序列内的核酸序列。在一些实施方案中,包含所述植物细胞的遗传修饰的植物具有含量减少的三萜皂苷、其代谢物、其衍生物或其生物合成中间体。
根据某些实施方案,所述遗传修饰的或基因编辑的植物包含至少一种细胞,所述至少一种细胞包含靶向CSLG基因的至少一种沉默分子。根据一些实施方案,所述至少一种沉默分子选自RNA干扰分子和反义分子。根据这些实施方案,所述遗传修饰的植物包含含量减少的甾体生物碱或其生物合成中间体、甾体皂苷或其生物合成中间体,或三萜皂苷或其生物合成中间体。
靶向CSLG基因的沉默分子可以按照所属领域中的技术人员已知的知识来设计。根据某些实施方案,所述沉默分子包含具有与CSLG基因的区域大体上互补的核酸序列的多核苷酸,例如但不限于本文公开的番茄、野生番茄、马铃薯、野生马铃薯、茄子中的GAME15或其同源物,或GAME15基因的互补序列。根据某些实施方案,沉默分子包含具有与CSLG基因的区域大体上互补的核酸序列的多核苷酸,例如但不限于本文公开的中国甘草、拟南芥(Arabidopsis)、红甜菜、奎藜籽、紫苜蓿、大豆或百脉根中的SOAP5或其同源物,或SOAP5基因的互补序列。
根据某些实施方案,所述沉默分子是反义RNA。
根据某些示例性实施方案,所述沉默分子是RNA干扰(RNAi)分子。根据一些实施方案,所述沉默分子是双链(ds)RNA分子。根据某些实施方案,第一多核苷酸和第二多核苷酸被间隔区分开。根据一些实施方案,间隔区序列是内含子。根据另外的实施方案,第一多核苷酸和第二多核苷酸的表达衍生自一个启动子。根据其他实施方案,所述第一多核苷酸和第二多核苷酸的表达衍生自两个启动子;即启动子可以相同或不同。
在一些实施方案中,术语“RNA干扰”或“RNAi”涵盖由小双链RNA介导的基因表达的沉默或降低。这是由抑制性RNA(iRNA)启动、动植物中序列特异性转录后基因沉默的过程,所述抑制性RNA在其双链体区域中与沉默基因的序列是同源的。此基因可以是有机体的内源或外源基因,可以整合到染色体中,也可以存在于未整合到基因组中的转染载体中。此基因的表达被完全或部分抑制。RNAi也可以被视作可以抑制靶RNA的功能;所述靶RNA的功能可以是完全的或部分的。
通常,术语RNAi分子是指同时包含有义和反义序列的单链或双链RNA分子。例如,RNA干扰分子可以是包含自身互补的有义和反义区域的双链多核苷酸分子,其中反义区域包含与靶核酸分子的互补性。替代地,RNAi分子可以是具有自身互补的有义和反义区域的单链发夹多核苷酸,其中所述反义区域与靶核酸分子具有互补性,或可以是具有两个或更多个环结构的环状单链多核苷酸,以及包含自身互补的有义和反义区域的茎,其中所述反义区域与靶核酸分子具有互补性,并且其中所述环状多核苷酸可以在体内或体外加工以生成能够介导RNAi的活性分子。
反义技术是反义RNA或DNA分子与靶有义DNA或RNA链相互作用的过程。有义链是5'到3'mRNA分子或DNA分子。相对有义的互补链或镜像链称为反义。当反义链与有义mRNA链相互作用时,双螺旋被识别为对细胞而言是异源的,并且将被降解,从而致使蛋白质产量减少或缺失。尽管DNA已经是双链分子,但是可以将反义技术应用于DNA,从而形成三链体。
所属领域中的技术人员应理解,本文所使用的术语“互补”或“其补体”涵盖能够在整个互补区域的整个范围内与另一种指定多核苷酸形成沃森与克里克碱基配对的多核苷酸的序列。此术语仅基于其序列而不是两个多核苷酸实际结合的任何特定条件集合而应用于多核苷酸对。
CSLG的细胞和/或组织水平的反义调节可以通过用至少一种反义化合物,包括反义DNA、反义RNA、核酶、DNA酶、锁核酸(LNA)和适体转化细胞或组织来实现。在一些实施方案中,该分子被化学修饰。在其他实施方案中,反义分子是反义DNA或反义DNA类似物。
RNA反义链可以是催化性的或非催化性的。催化反义链,也称为核酶,以特定序列切割RNA分子。非催化RNA反义链会阻止进一步的RNA加工。
CSLG基因的细胞和/或组织浓度的反义调节可以通过用至少一种反义化合物,包含反义DNA、反义RNA、核酶、DNA酶、锁核酸(LNA)、VIG和适体转化有机体细胞或组织来实现。在一些实施方案中,分子被化学修饰。在其他实施方案中,反义分子是反义DNA或反义DNA类似物。
RNAi是指引入同源双链RNA(dsRNA)以靶向特定的基因产物,从而引发此基因的转录后沉默。这种现象最早由Guo和Kemphues(1995,《细胞》(Cell),第81(4)期:第611-620页)在秀丽隐杆线虫(Caenorhabditis elegans)中发现的,随后由Fire等人(1998,《自然》(Nature)第391期:第806-811页)发现dsRNA的存在,其是由体外RNA制备物中存在的有义和反义链的缓冷形成的,负责产生干扰活性。
在植物和动物中,RNAi均由RNA诱导的沉默复合物(RISC)介导,RISC是一种序列特异性的多组分核酸酶,可破坏与沉默触发子同源的信使RNA。已知RISC包含衍生自双链RNA触发因子的短RNA(约22个核苷酸)。短核苷酸RNA序列与被抑制的靶基因是同源的。因此,短核苷酸序列似乎作为指导序列,以指示多组分核酸酶RISC破坏特定的mRNA。
用于起始RNAi的dsRNA可以从天然来源分离或通过已知的方法生成,例如从DNA转录。现在可容易地从商业来源获得用于生成针对靶序列的RNAi分子的质粒和载体。
dsRNA可以从载体转录成两条独立的链。在其他实施方案中,用于形成dsRNA的两条DNA链可以属于相同或两个不同的双链体,其各自形成为具有至少部分互补序列的DNA链。当通过此方式生成dsRNA时,待转录的DNA序列两侧有两个启动子,一个启动子控制一条链的转录,另一条控制互补链的转录。这两个启动子可以相同或不同的。替代地,单个启动子可以衍生单链发夹多核苷酸的转录,所述单链发夹多核苷酸具有缓冷以生成dsRNA的自互补有义和反义区域。
抑制是序列特异性的,因为对应于RNA双链体区域的核苷酸序列被靶向进行遗传抑制。含有与靶基因的一部分相同的核苷酸序列的RNA分子对于抑制而言是优选的。相对于靶序列具有插入、缺失和单点突变的RNA序列还被发现对于抑制是有效的。因此,可以执行所属领域中已知的序列比较和比对算法(参见Gribskov和Devereux,《序列分析入门》(Sequence Analysis Primer),Stockton Press,1991,以及书中引用的参考文献),并且例如使用BESTFIT软件程序以默认参数(例如,威斯康星大学遗传计算小组(University ofWisconsin Genetic Computing Group))执行史密斯-沃特曼算法(Smith-Watermanalgorithm)以计算核苷酸序列之间的百分比差异,从而优化序列同一性。抑制性RNA与靶基因的部分之间具有90%以上的序列同一性,或甚至100%以上的序列同一性是优选地。替代地,RNA的双链体区域可以在功能上定义为能够与靶基因转录本的一部分杂交的核苷酸序列。相同核苷酸序列的长度可以是至少25、50、100、200、300或400个碱基。可以使用的dsRNA的长度没有上限。例如,dsRNA的范围可以从基因的约21个碱基对(bp)到基因的全长或更多。
术语“RNA干扰”或“RNAi”是指由小双链RNA介导的基因表达的沉默或降低。这是由抑制性RNA(iRNA)启动、动植物中序列特异性转录后基因沉默的过程,所述抑制性RNA在其双链体区域中与沉默基因的序列是同源的。此基因可以是有机体的内源或外源基因,可以整合到染色体中,也可以存在于未整合到基因组中的转染载体中。此基因的表达被完全或部分抑制。RNAi也可以被视作可以抑制靶RNA的功能;所述靶RNA的功能可以是完全的或部分的。
所属领域中的普通技术人员应理解,术语RNAi分子是指包含有义和反义序列的单链或双链RNA分子。例如,RNA干扰分子可以是包含自身互补的有义和反义区域的双链多核苷酸分子,其中反义区域包含与靶核酸分子的互补性。替代地,RNAi分子可以是具有自身互补的有义和反义区域的单链发夹多核苷酸,其中所述反义区域与靶核酸分子具有互补性,或可以是具有两个或更多个环结构的环状单链多核苷酸,以及包含自身互补的有义和反义区域的茎,其中所述反义区域与靶核酸分子具有互补性,并且其中所述环状多核苷酸可以在体内或体外加工以生成能够介导RNAi的活性分子。
在一些实施方案中,使用RNA干扰(RNAi)下调CSLG基因的表达来减弱植物或其细胞或其部分中的水平。在植物和动物中,RNAi均由RNA诱导的沉默复合物(RISC)介导,RISC是一种序列特异性的多组分核酸酶,可破坏与沉默触发子同源的信使RNA。已知RISC包含衍生自双链RNA触发因子的短RNA(约22个核苷酸)。短核苷酸RNA序列与被抑制的靶基因是同源的。因此,短核苷酸序列似乎作为指导序列,以指示多组分核酸酶RISC破坏特定的mRNA。
用于起始RNAi的dsRNA可以从天然来源分离或通过已知的方法生成,例如从DNA转录。现在可以容易地获得用于生成针对靶序列的RNAi分子的质粒和载体,如下文中举例说明。
根据某些示例性实施方案,dsRNA是靶向CSLG的。
在一些实施方案中,使用RNA干扰(RNAi)下调CSLG基因的表达来减弱植物或其细胞或其部分中的水平。在植物和动物中,RNAi均由RNA诱导的沉默复合物(RISC)介导,RISC是一种序列特异性的多组分核酸酶,可破坏与沉默触发子同源的信使RNA。已知RISC含有衍生自双链RNA触发因子的短RNA(约22个核苷酸)。短核苷酸RNA序列与被抑制的靶基因是同源的。因此,短核苷酸序列似乎作为指导序列,以指示多组分核酸酶RISC破坏特定的mRNA。
用于起始RNAi的dsRNA可以从天然来源分离或通过已知的方法生成,例如从DNA转录。现在可以容易地获得用于生成针对靶序列的RNAi分子的质粒和载体,如下文中举例说明。
dsRNA可以从载体转录成两条独立的链。在其他实施方案中,用于形成dsRNA的两条DNA链可以属于相同或两个不同的双链体,其各自形成为具有至少部分互补序列的DNA链。当通过此方式生成dsRNA时,待转录的DNA序列两侧有两个启动子,一个启动子控制一条链的转录,另一条控制互补链的转录。这两个启动子可以相同或不同的。替代地,单个启动子可以衍生单链发夹多核苷酸的转录,所述单链发夹多核苷酸具有缓冷以生成dsRNA的自互补有义和反义区域。
抑制是序列特异性的,因为对应于RNA双链体区域的核苷酸序列被靶向进行遗传抑制。含有与靶基因的一部分相同的核苷酸序列的RNA分子对于抑制而言是优选的。相对于靶序列具有插入、缺失和单点突变的RNA序列还被发现对于抑制是有效的。因此,可以执行所属领域中已知的序列比较和比对算法(参见Gribskov和Devereux,《序列分析入门》(Sequence Analysis Primer),Stockton Press,1991,以及书中引用的参考文献),并且例如使用BESTFIT软件程序以默认参数(例如,威斯康星大学遗传计算小组(University ofWisconsin Genetic Computing Group))执行史密斯-沃特曼算法(Smith-Watermanalgorithm)以计算核苷酸序列之间的百分比差异,从而优化序列同一性。抑制性RNA与靶基因的部分之间具有90%以上的序列同一性,或甚至100%以上的序列同一性是优选地。替代地,RNA的双链体区域可以在功能上定义为能够与靶基因转录本的一部分杂交的核苷酸序列。相同核苷酸序列的长度可以是至少25、50、100、200、300或400个碱基。可以使用的dsRNA的长度没有上限。例如,dsRNA的范围可以从基因的约21个碱基对(bp)到基因的全长或更多。
能够下调CSLG表达的另一种试剂是共抑制分子。共抑制是转录后机制,其中转基因和内源基因均被沉默。
能够下调CSLG表达的另一种试剂是DNA酶分子,其能够特异性切割CSLG的mRNA转录本或DNA序列。DNA酶是能够切割单链和双链靶序列的单链多核苷酸。已经提出了DNA酶的通用模型(“10-23”模型)。“10-23”DNA酶具有15个脱氧核糖核苷酸的催化结构域,其侧翼是两个底物识别结构域,每个底物识别结构域分别为7到9个脱氧核糖核苷酸。这种类型的DNA酶可以有效地在嘌呤:嘧啶连接处切割其底物RNA(有关DNA酶的综述,请参见:Khachigian,L.M.(2002)《分子治疗学新见》(Curr Opin Mol Ther)4,119-121)。
美国专利号6,326,174中公开了识别单链和双链靶切割位点的合成工程改造DNA酶的构建和扩增的实例。
术语“酶促核酸分子”或“酶促寡核苷酸”是指在底物结合区域中与特定基因靶标互补的核酸分子,并且还具有可特异性裂解CSLG的靶RNA的酶活性,从而使基因沉默。互补区使得酶促核酸分子能够与靶RNA充分杂交并随后切割。术语酶促核酸可与例如核酶、催化RNA、酶促RNA、催化DNA、适体酶或适体结合核酶、催化寡核苷酸、nucleozyme、DNA酶、RNA酶互换使用。本申请中描述的特定酶促核酸分子不是限制性的,并且本文公开的酶促核酸分子需要与一个或多个靶核酸区域互补的特定底物结合位点,并且其具有在其中或围绕该底物结合位点、赋予该分子核酸切割和/或连接活性的核苷酸序列。第4,987,071号美国专利中公开了此类分子的实例。
根据某些实施方案,CSLG基因或靶向此基因的沉默分子形成表达载体的一部分,该表达载体包含用于表达该基因或其沉默分子的所有必需元件。根据某些实施方案,表达由组成型启动子控制。根据某些实施方案,组成型启动子对植物组织是特异性的。根据这些实施方案,组织特异性启动子选自根特异性启动子、块茎特异性启动子、叶特异性启动子和果实特异性启动子。例如Martinez,E.等人,2003,《当代生物学》(Curr.Biol.),第13期:第1435-1441页中描述了根特异性启动子。Estornell L.H等人,2009,《植物生物技术杂志》(Plant Biotechnol.J.)第7期:第298-309页以及Fernandez A.I等人,2009,《植物生理学》(Plant Physiol.)第151期:第1729-1740页中描述了果实特异性启动子。例如Rocha-SosaM等人,1989,《欧洲分子生物学学会会刊》(EMBO J.)第8期:第23-29页;McKibbin R.S.等人,2006,《植物生物技术杂志》(Plant Biotechnol J.)第4(4)期:第409-18页中描述了块茎特异性启动子。例如Yutao Yang、Guodong Yang、Shijuan Liu、Xingqi Guo和ChengchaoZheng,《中国科学C辑:生命科学》(Science in China Series C:Life Sciences)第46期:第651-660页中描述了叶特异性启动子。
根据某些实施方案,表达载体还包含3'非编码序列处的调节元件。本文所用的“3'非编码序列”是指位于编码序列下游的DNA序列,并且包含聚腺苷酸化识别序列以及编码能够影响mRNA加工或基因表达的调节信号的其他序列。聚腺苷酸化信号通常特征在于影响向mRNA前体的3'末端添加聚腺苷酸节段。Ingelbrecht I L等人(1989,《植物细胞》(PlantCell)第1期:第671-680页)中举例说明了使用不同的3'非编码序列。
所属领域中的领域技术人员应理解,本文的核酸序列和转化载体的各种组分可操作地连接,从而引发所述核酸或核酸节段的表达。可操作地连接本文公开的构建体和载体组分的技术是所属领域中的技术人员所公知的。此类技术包括使用接头,诸如合成接头,例如包括一个或多个限制酶位点。
使用所属领域中的普通技术人员已知的标准分子遗传学方法来检测突变的CSLG基因和/或靶向该基因的沉默分子的存在和/或该基因的过表达。
为了测量基因或沉默分子的表达,应从表达核酸的器官获得cDNA或mRNA。可以在检测步骤之前对样品做进一步处理。例如,细胞或组织样品中的多核苷酸可以与样品中的其他组分分离、可以扩增等。从有机体获得的所有样品,包括经过任何类型的进一步处理的样品,均被认为是从所述有机体获得的。
基因或沉默分子的检测通常需要扩增来自候选改变的有机体的多核苷酸。DNA扩增的方法是所属领域中的技术人员已知的。用于DNA扩增的最常用方法是PCR(聚合酶链式反应;参见例如“PCR基础知识:从背景到实践”(PCR Basics:from background to Bench),《施普林格》(Springer Verlag),2000;Eckert等人,1991,《PCR方法和应用》(PCR Methodsand Applications),1:17)。其他适当的扩增方法包括连接酶链式反应(LCR)、转录扩增和自我维持序列复制以及基于核酸的序列扩增(NASBA)。
根据某些实施方案,包含CSLG基因或其沉默分子的核酸序列还包含编码可选择标志物的核酸序列。根据某些实施方案,所述可选择标志物赋予对抗生素或除草剂的抗性;在这些实施方案中,根据其对抗生素或除草剂的抗性来选择转基因植物。
在一些实施方案中,所述内源CSLG基因被选择性地过表达,并且所述含量改变包含与相应的未修饰的植物相比增加量的至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体。
CSLG基因的过表达可以通过所属领域中的技术人员已知的任何方法获得。根据某些实施方案,本文公开遗传修饰的植物或其部分,所述遗传修饰的植物或其部分包含至少一种细胞,所述至少一种细胞包含被过表达并且编码至少一种CSLG酶的至少一种可转录的多核苷酸,其中所述遗传修饰的植物或植物部分包含与相应的未遗传修饰的植物相比,含量增加的至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体。
根据一些实施方案,将本文公开的多核苷酸掺入DNA构建体中,使其能够在植物细胞中表达。适用于植物的DNA构建体是所属领域中的技术人员已知的。根据一个实施方案,所述DNA构建体包含选自启动子、增强子、复制起始点、转录终止序列、聚腺苷酸化信号等的至少一种表达调节元件。
根据要获得的结果来设计本文公开的DNA构建体。
在作物植物中,需要减少植物可食用部分,包含但不限于果实、种子、根、叶和块茎中的有毒甾体生物碱或甾体糖苷生物碱或其衍生物、其代谢物或其生物合成中间体。另一方面,富集植物非食用部分,包括但不限于非食用根和叶中的有毒甾体糖苷生物碱或其生物合成中间体的含量,有助于植物抵抗多种病原体。在示例性实施方案中,过表达甾体糖苷生物碱的植物可以用于在制药工业中生产该甾体糖苷生物碱。
在作物植物中,还需要调节甾体皂苷。所属领域中的技术人员应理解,在某些实施方案中,甾体皂苷的调节可以从某种化合物生成高价值产品,例如但不限于用于食品、化妆品和制药工业的产品。在一些实施方案中,甾体皂苷的调节会在植物中生成化合物,其将有助于保护植物免受病原体的侵害,例如但不限于针对细菌、害虫、病毒和昆虫的保护。在一些实施方案中,甾体皂苷的调节会从植物中去除抗营养物化合物。
在作物植物中,需要减少植物可食用部分,包括例如但不限于果实和种子中毒性或苦味或激素模拟的三萜皂苷或生物合成中间体。在另一方面中,富集甜味三萜皂苷或其生物合成中间体的含量是有益的,并且可用于生产天然甜味剂。三萜皂苷例如QS-21含量增加的植物可以用于生产制药工业的佐剂。
根据另外的实施方案,本文公开了具有至少CSLG基因表达增强的遗传修饰的或基因编辑的植物,其中所述遗传修饰的或基因编辑的植物具有与相应的未修饰或未编辑植物相比,增加量的至少一种甾体生物碱、至少一种甾体皂苷或至少一种三萜皂苷。根据另外的实施方案,本文公开了具有至少CSLG基因表达减少的遗传修饰的或基因编辑的植物,其中所述遗传修饰的或基因编辑的植物具有与相应的未修饰或未编辑植物相比,减少量的至少一种甾体生物碱、减少量的至少一种甾体皂苷,减少量的至少一种三萜皂苷。
本文和以下实施例中的公开内容表明,通过提供编码甾体生物碱、甾体皂苷和/或三萜皂苷生物合成途径中所涉及的酶或其他蛋白质的至少一种异源基因,例如但不限于异源CSLG,或通过修饰三萜合成途径的内源基因,例如但不限于CSLG基因,其中所述修饰改变其表达,或所编码酶的活性或稳定性,可以改变以下物质水平:至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,甾体生物碱的衍生物、甾体皂苷的衍生物或三萜皂苷的衍生物分别包含甾体生物碱的糖基化衍生物、甾体皂苷的糖基化衍生物或三萜皂苷的糖基化衍生物。
在一些实施方案中,以下物质在植物细胞中的量被改变:至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体。在一些实施方案中,以下物质在藻细胞中的量被改变:至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体。在一些实施方案中,以下物质在酵母中的量被改变:至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体。在一些实施方案中,以下物质在昆虫细胞中的量被改变:至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体。在一些实施方案中,以下物质在细菌中的量被改变:至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体。在一些实施方案中,以下物质在植物中的量被改变:至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体。在一些实施方案中,以下物质在植物部分中的量被改变:至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,甾体生物碱的衍生物、甾体皂苷的衍生物或三萜皂苷的衍生物分别包含甾体生物碱的糖基化衍生物、甾体皂苷的糖基化衍生物或三萜皂苷的糖基化衍生物。
例如,在一些实施方案中,如以下实施例中举例说明,已显示出,在皂苷β-香树素合酶、细胞色素P450、糖基转移酶、酰基转移酶、葡萄糖苷酰转移酶或CSLG或其组合的表达增加的遗传修饰的细胞,例如酵母细胞或植物细胞或藻细胞或昆虫细胞或细菌,或遗传修饰的植物或其部分中,三萜皂苷、其衍生物、其代谢物或其生物合成中间体的水平增加。在其他实施方案中,如实施例中所示,已经显示,降低或沉默皂苷β-香树素合酶、细胞色素P450、糖基转移酶、酰基转移酶、葡萄糖苷酰转移酶或CSLG基因的表达可致使相应三萜皂苷、其衍生物、其代谢物或其生物合成中间体的水平降低。
甾体生物碱、其衍生物、其代谢物和其生物合成中间体
在一些实施方案中,本文公开的遗传修饰的细胞包含含量增加的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体,其任何组合。在一些实施方案中,包含本文公开的至少一种遗传修饰的细胞的遗传修饰的植物包含含量增加的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体,其任何组合。在一些实施方案中,体外生物合成系统生成至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体,其任何组合。在一些实施方案中,本文公开的遗传修饰的植物包含含量增加的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体,其任何组合。在一些实施方案中,包含本文公开的至少一种遗传修饰的细胞的遗传修饰的植物包含含量减少的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体,其任何组合。在一些实施方案中,包含至少一种遗传修饰的细胞的本文公开的遗传修饰的植物包含含量增加的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体,其任何组合,以及含量减少的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体,其任何组合。
在一些实施方案中,一种在本文公开的遗传修饰的细胞中生成甾体生物碱的方法包含生成至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体,其任何组合。在一些实施方案中,一种在本文公开的遗传修饰的植物或植物部分中生成甾体生物碱的方法包含生成至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体,其任何组合。在一些实施方案中,本文公开了一种减少至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体,其任何组合在包含本文的至少一种遗传修饰的细胞的植物或植物部分中的含量的方法。在一些实施方案中,本文公开了一种增加至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体,其任何组合在包含本文的至少一种遗传修饰的细胞的植物或植物部分中的含量的方法。
在甾体生物碱生物合成途径中,甾体生物碱在呋喃甾醇型皂苷糖苷配基的形成之后从甾体皂苷中分支出(图1)。至少部分地涉及氧化、转氨作用、成环等的进一步步骤引发甾体生物碱的生物合成(图1)。
甾体糖苷生物碱的实例包括但不限于α-番茄素、番茄素、脱氢番茄素、α-查茄碱、α-茄碱、α-澳洲茄碱、α-澳洲茄边碱或其任何组合。
在一些实施方案中,包含所述增加含量的所述遗传修饰的细胞包含植物细胞、酵母细胞、藻细胞、昆虫细胞或细菌。在一些实施方案中,包含所述增加含量的所述遗传修饰的细胞包含植物细胞。在一些实施方案中,包含所述增加含量的所述遗传修饰的细胞包含酵母细胞。在一些实施方案中,包含所述增加含量的所述遗传修饰的细胞包含藻细胞。在一些实施方案中,包含所述增加含量的所述遗传修饰的细胞包含昆虫细胞。在一些实施方案中,包含所述增加含量的所述遗传修饰的细胞包含细菌。
根据某些示例性实施方案,下游甾体糖苷生物碱选自七叶皂苷或脱氢七叶皂苷。
在一些实施方案中,本文公开的所述遗传修饰的植物包含含量增加的至少一种甾体生物碱,所述至少一种甾体生物碱选自α-番茄素、番茄素、脱氢番茄素、α-查茄碱、α-茄碱、α-澳洲茄碱、α-澳洲茄边碱或其任何组合的任一。在一些实施方案中,本文公开的遗传修饰的植物包含含量增加的α-番茄素。在一些实施方案中,本文公开的遗传修饰的植物包含含量增加的番茄素。在一些实施方案中,本文公开的遗传修饰的植物包含含量增加的脱氢番茄素。在一些实施方案中,本文公开的遗传修饰的植物包含含量增加的α-查茄碱。在一些实施方案中,本文公开的遗传修饰的植物包含含量增加的α-茄碱。在一些实施方案中,本文公开的遗传修饰的植物包含含量增加的α-澳洲茄碱。在一些实施方案中,本文公开的遗传修饰的植物包含含量增加的α-澳洲茄边碱。
在一些实施方案中,本文公开的所述遗传修饰的植物包含含量减少的至少一种甾体生物碱,所述至少一种甾体生物碱选自以下中的任一:α-番茄素、番茄素、脱氢番茄素、α-查茄碱、α-茄碱、α-澳洲茄碱、α-澳洲茄边碱或其任何组合。在一些实施方案中,本文公开的遗传修饰的植物包含含量增加的α-番茄素。在一些实施方案中,本文公开的遗传修饰的植物包含含量增加的番茄素。在一些实施方案中,本文公开的遗传修饰的植物包含含量增加的脱氢番茄素。在一些实施方案中,本文公开的遗传修饰的植物包含含量增加的α-查茄碱。在一些实施方案中,本文公开的遗传修饰的植物包含含量增加的α-茄碱。在一些实施方案中,本文公开的遗传修饰的植物包含含量增加的α-澳洲茄碱。在一些实施方案中,本文公开的遗传修饰的植物包含含量增加的α-澳洲茄边碱。
在一些实施方案中,本文公开的所述遗传修饰的植物包含含量增加的至少一种甾体生物碱以及含量减少的至少一种甾体生物碱,所述至少一种甾体生物碱选自α-番茄素、番茄素、脱氢番茄素、α-查茄碱、α-茄碱、α-澳洲茄碱、α-澳洲茄边碱或其任何组合中的任一。
在一些实施方案中,在遗传修饰的细胞中生成甾体生物碱的方法包含生成至少一种甾体生物碱,所述至少一种甾体生物碱选自α-番茄素、番茄素、脱氢番茄素、α-查茄碱、α-茄碱、α-澳洲茄碱、α-澳洲茄边碱,或其任何组合中的任一。在一些实施方案中,在遗传修饰的细胞中生成甾体生物碱的方法包含生成α-番茄素。在一些实施方案中,在遗传修饰的细胞中生成甾体生物碱的方法包含生成番茄碱。在一些实施方案中,在遗传修饰的细胞中生成甾体生物碱的方法包含生成脱氢番茄素。在一些实施方案中,在遗传修饰的细胞中生成甾体生物碱的方法包含生成α-查茄碱。在一些实施方案中,在遗传修饰的细胞中生成甾体生物碱的方法包含生成α-茄碱。在一些实施方案中,在遗传修饰的细胞中生成甾体生物碱的方法包含生成α-澳洲茄碱。在一些实施方案中,在遗传修饰的细胞中生成甾体生物碱的方法包含生成α-澳洲茄边碱。
在一些实施方案中,在遗传修饰的细胞中生成至少一种甾体生物碱的方法包含在植物细胞、酵母细胞、藻细胞、昆虫细胞或细菌中生成至少一种甾体生物碱。在一些实施方案中,在遗传修饰的细胞中生成至少一种甾体生物碱的方法包含在植物细胞中生成至少一种甾体生物碱。在一些实施方案中,在遗传修饰的细胞中生成至少一种甾体生物碱的方法包含在酵母细胞中生成至少一种甾体生物碱。在一些实施方案中,在遗传修饰的细胞中生成至少一种甾体生物碱的方法包含在藻细胞中生成至少一种甾体生物碱。在一些实施方案中,在遗传修饰的细胞中生成至少一种甾体生物碱的方法包含在昆虫细胞中生成至少一种甾体生物碱。在一些实施方案中,在遗传修饰的细胞中生成至少一种甾体生物碱的方法包含在细菌中生成至少一种甾体生物碱。在一些实施方案中,所述植物细胞包含在植物或植物部分中。
在一些实施方案中,在遗传修饰的植物中生成甾体生物碱的方法包含生成至少一种甾体生物碱,所述至少一种甾体生物碱选自α-番茄素、番茄素、脱氢番茄素、α-查茄碱、α-茄碱、α-澳洲茄碱、α-澳洲茄边碱,或其任何组合中的任一。在一些实施方案中,在遗传修饰的植物中生成甾体生物碱的方法包含生成α-番茄素。在一些实施方案中,在遗传修饰的植物中生成甾体生物碱的方法包含生成番茄素。在一些实施方案中,在遗传修饰的植物中生成甾体生物碱的方法包含生成脱氢番茄素。在一些实施方案中,在遗传修饰的植物中生成甾体生物碱的方法包含生成α-查茄碱。在一些实施方案中,在遗传修饰的植物中生成甾体生物碱的方法包含生成α-茄碱。在一些实施方案中,在遗传修饰的植物中生成甾体生物碱的方法包含生成α-澳洲茄碱。在一些实施方案中,在遗传修饰的植物中生成甾体生物碱的方法包含生成α-澳洲茄边碱。在一些实施方案中,在遗传修饰的植物中生成甾体生物碱的方法包含生成胆固醇。在一些实施方案中,在遗传修饰的植物中生成甾体生物碱的方法包含生成22-羟基胆固醇。在一些实施方案中,在遗传修饰的植物中生成甾体生物碱的方法包含生成22,26-二羟胆固醇。在一些实施方案中,在遗传修饰的植物中生成甾体生物碱的方法包含生成呋喃甾醇型皂苷糖苷配基。在一些实施方案中,在遗传修饰的植物中生成甾体生物碱的方法包含生成呋喃甾醇-26-醛。在一些实施方案中,在遗传修饰的植物中生成甾体生物碱的方法包含生成26-氨基-呋喃甾醇。在一些实施方案中,在遗传修饰的植物中生成甾体生物碱的方法包含生成番茄登醇。在一些实施方案中,在遗传修饰的植物中生成甾体生物碱的方法包含生成番茄碱。在一些实施方案中,在遗传修饰的植物中生成甾体生物碱的方法包含生成番茄碱半乳糖苷。在一些实施方案中,在遗传修饰的植物中生成甾体生物碱的方法包含生成γ-番茄素。在一些实施方案中,在遗传修饰的植物中生成甾体生物碱的方法包含生成β-1-番茄素。
在一些实施方案中,在体外翻译体系中生成甾体生物碱的方法包含生成至少一种甾体生物碱,所述至少一种甾体生物碱选自α-番茄素、脱氢番茄素、番茄素、α-查茄碱、α-茄碱、α-澳洲茄碱、α-澳洲茄边碱,或其任何组合中的任一。在一些实施方案中,在体外翻译体系中生成甾体生物碱的方法包含生成α-番茄素。在一些实施方案中,在体外翻译体系中生成甾体生物碱的方法包含生成番茄素。在一些实施方案中,在体外翻译体系中生成甾体生物碱的方法包含生成α-查茄碱。在一些实施方案中,在体外翻译体系中生成甾体生物碱的方法包含生成α-茄碱。在一些实施方案中,在体外翻译体系中生成甾体生物碱的方法包含生成α-澳洲茄碱。在一些实施方案中,在体外翻译体系中生成甾体生物碱的方法包含生成α-澳洲茄边碱。
在一些实施方案中,减少至少一种甾体生物碱的方法包含减少选自以下的任一的至少一种甾体生物碱:α-番茄素、脱氢番茄素、番茄素、α-查茄碱、α-茄碱、α-澳洲茄碱、α-澳洲茄边碱,或其任何组合。在一些实施方案中,一种减少至少一种甾体生物碱含量的方法包含减少α-番茄素。在一些实施方案中,一种减少至少一种甾体生物碱含量的方法包含减少番茄素。在一些实施方案中,一种减少至少一种甾体生物碱含量的方法包含减少脱氢番茄素。在一些实施方案中,一种减少至少一种甾体生物碱含量的方法包含减少α-查茄碱。在一些实施方案中,一种减少至少一种甾体生物碱含量的方法包含减少α-茄碱。在一些实施方案中,一种减少至少一种甾体生物碱含量的方法包含减少α-澳洲茄碱。在一些实施方案中,一种减少至少一种甾体生物碱含量的方法包含减少α-澳洲茄边碱。
在一些实施方案中,增加至少一种甾体生物碱的方法包含增加选自以下的任一的至少一种甾体生物碱:α-番茄素、脱氢番茄素、番茄素、α-查茄碱、α-茄碱、α-澳洲茄碱、α-澳洲茄边碱,或其任何组合。在一些实施方案中,一种增加至少一种甾体生物碱含量的方法包含增加苜蓿酸α-番茄素。在一些实施方案中,一种增加至少一种甾体生物碱含量的方法包含增加番茄碱。在一些实施方案中,一种增加至少一种甾体生物碱含量的方法包含增加α-查茄碱。在一些实施方案中,一种增加至少一种甾体生物碱含量的方法包含增加α-茄碱。在一些实施方案中,一种增加至少一种甾体生物碱含量的方法包含增加α-澳洲茄碱。在一些实施方案中,一种增加至少一种甾体生物碱含量的方法包含增加α-澳洲茄边碱。
在一些实施方案中,改变至少一种甾体生物碱和至少一种甾体生物碱生物合成中间体的含量。在一些实施方案中,增加至少一种甾体生物碱和至少一种甾体生物碱生物合成中间体。在一些实施方案中,减少至少一种甾体生物碱和至少一种甾体生物碱生物合成中间体。在一些实施方案中,增加至少一种甾体生物碱,并且减少至少一种甾体生物碱生物合成中间体。在一些实施方案中,减少至少一种甾体生物碱,并且增加至少一种甾体生物碱生物合成中间体。在一些实施方案中,在没有可测量地改变甾体生物碱中间体的含量的情况下改变甾体生物碱的含量。在一些实施方案中,在没有可测量地改变甾体生物碱的含量的情况下改变甾体生物碱中间体的含量。
术语“中间体”在一些实施方案中可以与具有所有相同性质和含义的术语“生物合成中间体”互换使用。
在一些实施方案中,甾体生物碱的生物合成中间体包含胆固醇、22-羟基胆固醇、22,26-二羟胆固醇、呋喃甾醇型皂苷糖苷配基、呋喃甾醇-26-醛、26-氨基-呋喃甾醇、番茄登醇、番茄碱、番茄碱半乳糖苷、γ-番茄素、β-1-番茄素或其任何组合(图1)。
在一些实施方案中,本文公开的遗传修饰的细胞包含含量增加的至少一种甾体生物碱生物合成中间体,所述至少一种甾体生物碱生物合成中间体包含胆固醇、22-羟基胆固醇、22,26-二羟胆固醇、呋喃甾醇型皂苷糖苷配基、呋喃甾醇-26-醛、26-氨基-呋喃甾醇、番茄登醇、番茄碱、番茄碱半乳糖苷、γ-番茄素、β-1-番茄素或其任何组合。在一些实施方案中,遗传修饰的细胞包含含量增加的包含胆固醇的至少一种甾体生物碱生物合成中间体。在一些实施方案中,遗传修饰的细胞包含含量增加的包含22-羟基胆固醇的至少一种甾体生物碱生物合成中间体。在一些实施方案中,遗传修饰的细胞包含含量增加的包含22,26-二羟胆固醇的至少一种甾体生物碱生物合成中间体。在一些实施方案中,遗传修饰的细胞包含含量增加的包含呋喃甾醇型皂苷糖苷配基的至少一种甾体生物碱生物合成中间体。在一些实施方案中,遗传修饰的细胞包含含量增加的包含呋喃甾醇-26-醛的至少一种甾体生物碱生物合成中间体。在一些实施方案中,遗传修饰的细胞包含含量增加的包含26-氨基-呋喃甾醇的至少一种甾体生物碱生物合成中间体。在一些实施方案中,遗传修饰的细胞包含含量增加的包含番茄登醇的至少一种甾体生物碱生物合成中间体。在一些实施方案中,遗传修饰的细胞包含含量增加的包含番茄碱的至少一种甾体生物碱生物合成中间体。在一些实施方案中,遗传修饰的细胞包含含量增加的包含番茄碱半乳糖苷的至少一种甾体生物碱生物合成中间体。在一些实施方案中,遗传修饰的细胞包含含量增加的包含γ-番茄素的至少一种甾体生物碱生物合成中间体。在一些实施方案中,遗传修饰的细胞包含含量增加的包含β-1-番茄素的至少一种甾体生物碱生物合成中间体。
在一些实施方案中,本文公开的遗传修饰的植物包含含量减少的至少一种甾体生物碱生物合成中间体,所述至少一种甾体生物碱生物合成中间体包含胆固醇、22-羟基胆固醇、22,26-二羟胆固醇、呋喃甾醇型皂苷糖苷配基、呋喃甾醇-26-醛、26-氨基-呋喃甾醇、番茄登醇、番茄碱、番茄碱半乳糖苷、γ-番茄素、β-1-番茄素或其任何组合。在一些实施方案中,遗传修饰的植物包含含量减少的包含胆固醇的至少一种甾体生物碱生物合成中间体。在一些实施方案中,遗传修饰的植物包含含量减少的包含22-羟基胆固醇的至少一种甾体生物碱生物合成中间体。在一些实施方案中,遗传修饰的植物包含含量减少的包含22,26-二羟胆固醇的至少一种甾体生物碱生物合成中间体。在一些实施方案中,遗传修饰的植物包含含量减少的包含呋喃甾醇型皂苷糖苷配基的至少一种甾体生物碱生物合成中间体。在一些实施方案中,遗传修饰的植物包含含量减少的包含呋喃甾醇-26-醛的至少一种甾体生物碱生物合成中间体。在一些实施方案中,遗传修饰的植物包含含量减少的包含26-氨基-呋喃甾醇的至少一种甾体生物碱生物合成中间体。在一些实施方案中,遗传修饰的植物包含含量减少的包含番茄登醇的至少一种甾体生物碱生物合成中间体。在一些实施方案中,遗传修饰的植物包含含量减少的包含番茄碱的至少一种甾体生物碱生物合成中间体。在一些实施方案中,遗传修饰的植物包含含量减少的包含番茄碱半乳糖苷的至少一种甾体生物碱生物合成中间体。在一些实施方案中,遗传修饰的植物包含含量减少的包含γ-番茄素的至少一种甾体生物碱生物合成中间体。在一些实施方案中,遗传修饰的植物包含含量减少的包含β-1-番茄素的至少一种甾体生物碱生物合成中间体。
在一些实施方案中,本文公开的遗传修饰的植物包含含量增加的至少一种甾体生物碱生物合成中间体以及含量减少的至少一种甾体生物碱生物合成中间体,所述中间体选自以下中的任一:胆固醇、22-羟基胆固醇、22,26-二羟胆固醇、呋喃甾醇型皂苷糖苷配基、呋喃甾醇-26-醛、26-氨基-呋喃甾醇、番茄登醇、番茄碱、番茄碱半乳糖苷、γ-番茄素、β-1-番茄素或其任何组合。
在一些实施方案中,减少至少一种甾体生物碱的方法包含减少至少一种甾体生物碱生物合成中间体,所述至少一种甾体生物碱生物合成中间体选自以下中的任一:胆固醇、22-羟基胆固醇、22,26-二羟胆固醇、呋喃甾醇型皂苷糖苷配基、呋喃甾醇-26-醛、26-氨基-呋喃甾醇、番茄登醇、番茄碱、番茄碱半乳糖苷、γ-番茄素、β-1-番茄素或其任何组合。。在一些实施方案中,一种减少至少一种甾体生物碱的方法包含减少至少胆固醇。在一些实施方案中,一种减少至少一种甾体生物碱的方法包含减少至少22-羟基胆固醇。在一些实施方案中,减少至少一种甾体生物碱的方法包含减少至少22,26-二羟胆固醇。在一些实施方案中,减少至少一种甾体生物碱的方法包含减少至少呋喃甾醇型皂苷糖苷配基。在一些实施方案中,一种减少至少一种甾体生物碱的方法包含减少至少呋喃甾醇-26-醛。在一些实施方案中,一种减少至少一种甾体生物碱的方法包含减少至少26-氨基-呋喃甾醇。在一些实施方案中,一种减少至少一种甾体生物碱的方法包含减少至少番茄登醇。在一些实施方案中,一种减少至少一种甾体生物碱的方法包含减少至少番茄碱。在一些实施方案中,一种减少至少一种甾体生物碱的方法包含减少至少番茄碱半乳糖苷。在一些实施方案中,一种减少至少一种甾体生物碱的方法包含减少至少γ-番茄素。在一些实施方案中,一种减少至少一种甾体生物碱的方法包含减少至少β-1-番茄素。
在一些实施方案中,增加至少一种甾体生物碱的方法包含增加至少一种甾体生物碱生物合成中间体,所述至少一种甾体生物碱生物合成中间体选自以下中的任一:胆固醇、22-羟基胆固醇、22,26-二羟胆固醇、呋喃甾醇型皂苷糖苷配基、呋喃甾醇-26-醛、26-氨基-呋喃甾醇、番茄登醇、番茄碱、番茄碱半乳糖苷、γ-番茄素、β-1-番茄素或其任何组合。在一些实施方案中,一种增加至少一种甾体生物碱的方法包含增加至少胆固醇。在一些实施方案中,一种增加至少一种甾体生物碱的方法包含增加至少22-羟基胆固醇。在一些实施方案中,一种增加至少一种甾体生物碱含量的方法包含增加至少22,26-二羟胆固醇。在一些实施方案中,增加至少一种甾体生物碱的方法包含增加至少呋喃甾醇型皂苷糖苷配基。在一些实施方案中,增加至少一种甾体生物碱的方法包含增加至少呋喃甾醇-26-醛。在一些实施方案中,一种增加至少一种甾体生物碱的方法包含增加至少26-氨基-呋喃甾醇。在一些实施方案中,一种增加至少一种甾体生物碱的方法包含增加至少番茄登醇。在一些实施方案中,一种增加至少一种甾体生物碱的方法包含增加至少番茄碱。在一些实施方案中,一种增加至少一种甾体生物碱的方法包含增加至少番茄碱半乳糖苷。在一些实施方案中,一种增加至少一种甾体生物碱的方法包含增加至少γ-番茄素。在一些实施方案中,一种增加至少一种甾体生物碱的方法包含增加至少β-1-番茄素。
在一些实施方案中,甾体生物碱生物合成中间体包含以下中的任一:胆固醇、22-羟基胆固醇、22,26-二羟胆固醇、呋喃甾醇型皂苷糖苷配基、呋喃甾醇-26-醛、26-氨基-呋喃甾醇、番茄登醇、番茄碱、番茄碱半乳糖苷、γ-番茄素、β-1-番茄素或其任何组合。
出乎意料的是,本公开现在显示,甾体生物碱或其衍生物、其代谢物或其生物合成中间体在细胞例如植物细胞或酵母细胞或藻细胞或昆虫细胞或细菌或植物中的水平可以通过遗传修饰所述细胞或植物以表达编码酶,例如是甾体生物碱生物合成途径的一种或多种酶的至少一种异源基因来得以增加。在其他实施方案中,本文描述和举例说明的是在植物细胞中遗传修饰至少一种内源基因,例如但不限于CSLG基因以调节表达、活性或稳定性或其任何组合的方法。以下实施例公开了酶活性以及以前未知为甾体生物碱生物合成途径的一部分的酶。没有这些知识,就不可能生成甾体生物碱化合物。
在一些实施方案中,所述甾体生物碱代谢途径可以致使细胞或植物包含含量增加的甾体生物碱、其衍生物、其代谢物或其生物合成中间体,或致使植物或植物部分中这些化合物的含量增加。在一些实施方案中,植物,包含但不限于作物,其中所述作物具有含量增加的有用一种或多种甾体生物碱。在一些实施方案中,本文公开用于生成细胞的装置和方法,所述细胞包含但不限于植物细胞、酵母或藻细胞;植物包括但不限于作物或植物的一部分;具有水平增加的一种或多种甾体生物碱、或其衍生物、或其代谢物或其生物合成中间体。替代地或附加地,控制本文公开的基因的表达可以用于生成预期的甾体生物碱以供进一步使用,例如在制药工业中或用于饮食或其他补充物的配制,例如但不限于甜味剂。在一些实施方案中,这些高价值皂苷可以纯化并且使用,例如甜味剂、发泡剂、乳化剂、防腐剂、抗癌剂、降血胆固醇制剂、抗炎剂、抗氧化剂、生物佐剂、杀菌剂、杀虫剂、拒食剂、抗真菌剂,或其任何组合。本文公开的细胞和植物包含具有重要营养、药学和商业价值的化合物。
在一些实施方案中,甾体生物碱的衍生物包含甾体生物碱的糖基化衍生物。
在一些实施方案中,遗传修饰的细胞或遗传修饰的植物或植物部分包含本文的至少一种遗传修饰的植物细胞,所述至少一种遗传修饰的植物细胞包含与相应的未修饰的细胞或未修饰植物相比,含量改变的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体。在一些实施方案中,所述含量改变包含含量增加。在一些实施方案中,例如,遗传修饰的细胞或遗传修饰的植物具有含量增加的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体,其任何组合。
在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的至少一种甾体生物碱。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的至少两种甾体生物碱。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的至少三种甾体生物碱。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的至少四种甾体生物碱。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的至少五种甾体生物碱。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的至少六种甾体生物碱。
在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的一种甾体生物碱的至少一种衍生物。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的一种或多种甾体生物碱的至少两种衍生物。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的一种或多种甾体生物碱的至少三种衍生物。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的一种或多种甾体生物碱的至少四种衍生物。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的一种或多种甾体生物碱的至少五种衍生物。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的一种或多种甾体生物碱的至少六种衍生物。
在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的一种甾体生物碱的至少一种代谢物。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的一种或多种甾体生物碱的至少两种代谢物。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的一种或多种甾体生物碱的至少三种代谢物。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的一种或多种甾体生物碱的至少四种代谢物。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的一种或多种甾体生物碱的至少五种代谢物。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的一种或多种甾体生物碱的至少六种代谢物。
在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的一种甾体生物碱的至少一种生物合成中间体。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的一种或多种甾体生物碱的至少两种生物合成中间体。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的一种或多种甾体生物碱的至少三种生物合成中间体。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的一种或多种甾体生物碱的至少四种生物合成中间体。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的一种或多种甾体生物碱的至少五种生物合成中间体。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的一种或多种甾体生物碱的至少六种生物合成中间体。
所属领域中的技术人员应认识到,说明三萜皂苷、其衍生物、其代谢物或其生物合成中间体时使用的术语“含量”和“水平”涵盖与对照细胞或对照植物相比,化合物例如甾体生物碱、其衍生物、其代谢物或其生物合成中间体在遗传修饰的细胞或遗传修饰的植物中的量。在此上下文中,术语“含量”和”水平”可以互换使用,具有所有相同的含义和特性。
在一些实施方案中,具有增加含量的甾体生物碱包含营养物、化妆品或药剂或其任何组合。在一些实施方案中,具有增加含量的甾体生物碱包含选自以下中的甾体生物碱:α-番茄素、番茄素、脱氢番茄素、α-查茄碱、α-茄碱、α-澳洲茄碱、α-澳洲茄边碱,或其任何组合。在一些实施方案中,具有增加含量的甾体生物碱包含选自以下中的至少1、2、3、4、5、6或更多种甾体生物碱:α-番茄素、番茄素、脱氢番茄素、α-查茄碱、α-茄碱、α-澳洲茄碱、α-澳洲茄边碱,或其任何组合。
在一些实施方案中,具有增加含量的甾体生物碱包含选自以下中的至少1、2、3、4、5、6或更多种甾体生物碱:α-番茄素、番茄素、脱氢番茄素、α-查茄碱、α-茄碱、α-澳洲茄碱、α-澳洲茄边碱,或其任何组合。
在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌中,或遗传修饰的植物或其部分中具有含量增加的甾体生物碱包含选自以下中的甾体生物碱:α-番茄素、番茄素、脱氢番茄素、α-查茄碱、α-茄碱、α-澳洲茄碱、α-澳洲茄边碱,或其任何组合。
在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌,或遗传修饰的植物或其部分包含含量增加的α-番茄素。在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌,或遗传修饰的植物或其部分包含含量增加的番茄碱。在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌,或遗传修饰的植物或其部分包含含量增加的脱氢番茄素。在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌,或遗传修饰的植物或其部分包含含量增加的α-查茄碱。在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌,或遗传修饰的植物或其部分包含含量增加的α-茄碱。在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌,或遗传修饰的植物或其部分包含含量增加的α-澳洲茄碱。在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌,或遗传修饰的植物或其部分包含含量增加的α-澳洲茄边碱。所属领域中的技术人员应理解,在一些实施方案中,在一种甾体生物碱的含量增加的情况下,也可以在同一时间间隔中增加额外甾体生物碱或中间体或其组合。
在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞,或遗传修饰的植物或其部分包含含量增加的甾体生物碱生物合成中间体,所述中间体包含胆固醇、22-羟基胆固醇、22,26-二羟胆固醇、呋喃甾醇型皂苷糖苷配基、呋喃甾醇-26-醛、26-氨基-呋喃甾醇、番茄登醇、番茄碱、番茄碱半乳糖苷、γ-番茄素、β-1-番茄素或其任何组合。在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母细胞或藻细胞或昆虫细胞或细菌,或遗传修饰的植物或其部分包含含量增加的一种或多种甾体生物碱的至少两种生物合成中间体,所述中间体包含胆固醇、22-羟基胆固醇、22,26-二羟胆固醇、呋喃甾醇型皂苷糖苷配基、呋喃甾醇-26-醛、26-氨基-呋喃甾醇、番茄登醇、番茄碱、番茄碱半乳糖苷、γ-番茄素、β-1-番茄素或其任何组合。
在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌,或遗传修饰的植物或其部分包含含量增加的甾体生物碱生物合成中间体,所述中间体包含胆固醇。在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌,或遗传修饰的植物或其部分包含含量增加的甾体生物碱生物合成中间体,所述中间体包含22-羟基胆固醇。在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌,或遗传修饰的植物或其部分包含含量增加的甾体生物碱生物合成中间体,所述中间体包含22,26-二羟胆固醇。在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌,或遗传修饰的植物或其部分包含含量增加的甾体生物碱生物合成中间体,所述中间体包含呋喃甾醇型皂苷糖苷配基。在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌,或遗传修饰的植物或其部分包含含量增加的甾体生物碱生物合成中间体,所述中间体包含呋喃甾醇-26-醛。在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌,或遗传修饰的植物或其部分包含含量增加的甾体生物碱生物合成中间体,所述中间体包含26-氨基-呋喃甾醇,或其任何组合。在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌,或遗传修饰的植物或其部分包含含量增加的甾体生物碱生物合成中间体,所述中间体包含番茄登醇。在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌,或遗传修饰的植物或其部分包含含量增加的甾体生物碱生物合成中间体,所述中间体包含番茄碱。在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌,或遗传修饰的植物或其部分包含含量增加的甾体生物碱生物合成中间体,所述中间体包含番茄碱半乳糖苷,或其任何组合。在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌,或遗传修饰的植物或其部分包含含量增加的甾体生物碱生物合成中间体,所述中间体包含γ-番茄素,或其任何组合。在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌,或遗传修饰的植物或其部分包含含量增加的甾体生物碱生物合成中间体,所述中间体包含β-1-番茄素,或其任何组合。
在一些实施方案中,包含至少一种遗传修饰的细胞的植物或植物部分中含量减少的甾体生物碱包含具有苦味或毒性的化合物。在一些实施方案中,具有减少含量的甾体生物碱包含选自以下中的甾体生物碱:α-番茄素、番茄素、脱氢番茄素、α-查茄碱、α-茄碱、α-澳洲茄碱、α-澳洲茄边碱,或其任何组合。在一些实施方案中,具有减少含量的甾体生物碱包含所选的至少1、2、3、4、5、6种或更多种甾体皂苷。在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌中,或遗传修饰的植物或其部分中含量增加的甾体皂苷包含选自以下中的甾体生物碱:α-番茄素、番茄素、脱氢番茄素、α-查茄碱、α-茄碱、α-澳洲茄碱、α-澳洲茄边碱,或其任何组合。
在一些实施方案中,具有减少含量的甾体生物碱包含所选的至少1、2、3、4、5、6种或更多种甾体皂苷。在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌中,或遗传修饰的植物或其部分中含量增加的甾体生物碱包含选自以下中的甾体生物碱:α-番茄素、番茄素、脱氢番茄素、α-查茄碱、α-茄碱、α-澳洲茄碱、α-澳洲茄边碱,或其任何组合。
在一些实施方案中,包含至少一种遗传修饰的细胞的遗传修饰的植物或其部分中含量减少的甾体生物碱包含选自以下中的甾体生物碱:α-番茄素、番茄素、脱氢番茄素、α-查茄碱、α-茄碱、α-澳洲茄碱、α-澳洲茄边碱,或其任何组合。
在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的植物或其部分包含含量减少的α-番茄素。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的植物或其部分包含含量减少的番茄碱。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的植物或其部分包含含量减少的脱氢番茄素。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的植物或其部分包含含量减少的α-查茄碱。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的植物或其部分包含含量减少的α-茄碱。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的植物或其部分包含含量减少的α-澳洲茄碱。
在一些实施方案中,包含至少一种遗传修饰的细胞的遗传修饰的植物或其部分包含含量减少的甾体生物碱生物合成中间体,所述中间体包含胆固醇、22-羟基胆固醇、22,26-二羟胆固醇、呋喃甾醇型皂苷糖苷配基、呋喃甾醇-26-醛、26-氨基-呋喃甾醇、番茄登醇、番茄碱、番茄碱半乳糖苷、γ-番茄素、β-1-番茄素或其任何组合。
在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的植物或其部分包含含量减少的甾体生物碱生物合成中间体,所述中间体包含胆固醇。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的植物或其部分包含含量减少的甾体生物碱生物合成中间体,所述中间体包含22-羟基胆固醇。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的植物或其部分包含含量减少的甾体生物碱生物合成中间体,所述中间体包含22,26-二羟胆固醇。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的植物或其部分包含含量减少的甾体生物碱生物合成中间体,所述中间体包含呋喃甾醇型皂苷糖苷配基。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的植物或其部分包含含量减少的甾体生物碱生物合成中间体,所述中间体包含呋喃甾醇-26-醛。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的植物或其部分包含含量减少的甾体生物碱生物合成中间体,所述中间体包含26-氨基-呋喃甾醇。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的植物或其部分包含含量减少的甾体生物碱生物合成中间体,所述中间体包含番茄登醇。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的植物或其部分包含含量减少的甾体生物碱生物合成中间体,所述中间体包含番茄碱。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的植物或其部分包含含量减少的甾体生物碱生物合成中间体,所述中间体包含番茄碱半乳糖苷。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的植物或其部分包含含量减少的甾体生物碱生物合成中间体,所述中间体包含γ-番茄素。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的植物或其部分包含含量减少的甾体生物碱生物合成中间体,所述中间体包含β-1-番茄素。
在一些实施方案中,本文所公开的遗传修饰的细胞包含含量增加的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体,以及含量改变的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,本文所公开的遗传修饰的细胞包含含量增加的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体,以及含量减少的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,本文所公开的遗传修饰的细胞包含含量减少的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体,以及含量改变的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,本文所公开的遗传修饰的细胞包含含量减少的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体,以及含量减少的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,本文所公开的遗传修饰的植物包含含量增加的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体,以及含量改变的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,本文所公开的遗传修饰的植物包含含量增加的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体,以及含量减少的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,本文所公开的遗传修饰的植物包含含量减少的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体,以及含量改变的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,本文所公开的遗传修饰的植物包含含量减少的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体,以及含量增加的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,一种在遗传修饰的细胞或遗传修饰的植物内生成至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体的方法包含与未修饰的细胞或未修饰植物相比,增加至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体的含量,以及改变植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体的含量。
在一些实施方案中,一种在遗传修饰的细胞或遗传修饰的植物内生成至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体的方法包含与未修饰的细胞或未修饰植物相比,增加至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体的含量,以及减少植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体的含量。
在一些实施方案中,减少至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体的含量的方法包含遗传修饰至少一种植物细胞或植物或植物部分的至少一种细胞,所述遗传修饰的植物细胞包含含量减少的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体,以及含量改变的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,减少至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体的含量的方法包含遗传修饰至少一种植物细胞或植物或植物部分的至少一种细胞,所述遗传修饰的植物细胞包含含量减少的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体,以及含量增加的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,增加至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体的含量的方法包含遗传修饰至少一种植物细胞或植物或植物部分的至少一种细胞,所述遗传修饰的植物细胞包含含量改变的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体,以及含量减少的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,增加至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体的含量的方法包含遗传修饰至少一种植物细胞或植物或植物部分的至少一种细胞,所述遗传修饰的植物细胞包含含量增加的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体,以及含量减少的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
甾体皂苷、其衍生物、其代谢物和其生物合成中间体
在一些实施方案中,本文公开的遗传修饰的细胞包含含量增加的至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体,其任何组合。在一些实施方案中,包含本文公开的至少一种遗传修饰的细胞的遗传修饰的植物包含含量增加的至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体,其任何组合。在一些实施方案中,体外生物合成系统生成至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体,其任何组合。在一些实施方案中,本文公开的遗传修饰的植物包含含量增加的至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体,其任何组合。在一些实施方案中,包含本文公开的至少一种遗传修饰的细胞的遗传修饰的植物包含含量减少的至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体,其任何组合。在一些实施方案中,包含至少一种遗传修饰的细胞的本文公开的遗传修饰的植物包含含量增加的至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体,其任何组合,以及含量减少的至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体,其任何组合。
在一些实施方案中,一种在本文公开的遗传修饰的细胞中生成甾体生物碱的方法包含生成至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体,其任何组合。在一些实施方案中,一种在本文公开的遗传修饰的植物或植物部分中生成甾体生物碱的方法包含生成至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体,其任何组合。在一些实施方案中,本文公开了一种减少至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体,其任何组合在包含本文的至少一种遗传修饰的细胞的植物或植物部分中的含量的方法。在一些实施方案中,本文公开了一种增加至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体,其任何组合在包含本文的至少一种遗传修饰的细胞的植物或植物部分中的含量的方法。
甾体皂苷在呋喃甾醇型皂苷糖苷配基的形成之后从甾体生物碱中分支出(图1)。
常用皂苷名称是基于其糖苷配基的结构和生化背景来区分三萜皂苷(也称为三萜烯皂苷)与甾体皂苷。这两种皂苷配基类型均被认为源自2,3-氧化角鲨烯,其为固醇生物合成中的主要代谢物。在植物固醇组成代谢中,2,3-氧化角鲨烯主要被环化为环阿乔醇。“甾体皂苷配基”被视作源于环阿乔醇形成下游的植物固醇途径中的中间体。
甾体皂苷包含但不限于龙葵皂苷B)、番茄甙或其任何组合。
在一些实施方案中,包含所述增加含量的所述遗传修饰的细胞包含植物细胞、酵母细胞、藻细胞、昆虫细胞或细菌。在一些实施方案中,包含所述增加含量的所述遗传修饰的细胞包含植物细胞。在一些实施方案中,包含所述增加含量的所述遗传修饰的细胞包含酵母细胞。在一些实施方案中,包含所述增加含量的所述遗传修饰的细胞包含藻细胞。在一些实施方案中,包含所述增加含量的所述遗传修饰的细胞包含昆虫细胞。在一些实施方案中,包含所述增加含量的所述遗传修饰的细胞包含细菌。
在一些实施方案中,本文公开的遗传修饰的植物包含含量增加的至少一种甾体皂苷,所述至少一种甾体皂苷选自龙葵皂苷B(uttroside B)、番茄甙或其任何组合中的任一。在一些实施方案中,本文公开的遗传修饰的植物包含含量增加的龙葵皂苷B(uttrosideB)。
在一些实施方案中,甾体皂苷的衍生物包含甾体皂苷的糖基化衍生物。
在一些实施方案中,本文公开的遗传修饰的植物包含含量减少的至少一种甾体皂苷,所述至少一种甾体皂苷选自龙葵皂苷B(uttroside B)、番茄甙或其任何组合中的任一。在一些实施方案中,本文公开的遗传修饰的植物包含含量减少的龙葵皂苷B(uttrosideB)。
在一些实施方案中,本文公开的遗传修饰的植物包含含量增加的至少一种甾体皂苷以及含量减少的至少一种甾体皂苷,所述至少一种甾体皂苷选自龙葵皂苷B(uttrosideB)、番茄甙或其任何组合中的任一。
在一些实施方案中,在遗传修饰的细胞中生成甾体皂苷的方法包含生成至少一种甾体皂苷,所述至少一种甾体皂苷选自龙葵皂苷B(uttroside B)、番茄甙或其任何组合中的任一。在一些实施方案中,在遗传修饰的细胞中生成甾体皂苷的方法包含生成龙葵皂苷B。
在一些实施方案中,在遗传修饰的细胞中生成至少一种甾体皂苷的方法包含在植物细胞、酵母细胞、藻细胞、昆虫细胞或细菌中生成至少一种甾体皂苷。在一些实施方案中,在遗传修饰的细胞中生成至少一种甾体皂苷的方法包含在植物细胞中生成至少一种甾体皂苷。在一些实施方案中,在遗传修饰的细胞中生成至少一种甾体皂苷的方法包含在酵母细胞中生成至少一种甾体皂苷。在一些实施方案中,在遗传修饰的细胞中生成至少一种甾体皂苷的方法包含在藻细胞中生成至少一种甾体皂苷。在一些实施方案中,在遗传修饰的细胞中生成至少一种甾体皂苷的方法包含在昆虫细胞中生成至少一种甾体皂苷。在一些实施方案中,在遗传修饰的细胞中生成至少一种甾体皂苷的方法包含在细菌中生成至少一种甾体皂苷。在一些实施方案中,所述植物细胞包含在植物或植物部分中。
在一些实施方案中,在遗传修饰的植物中生成甾体皂苷的方法包含生成至少一种甾体皂苷,所述至少一种甾体皂苷选自龙葵皂苷B、番茄甙或其任何组合中的任一。在一些实施方案中,在遗传修饰的植物中生成甾体皂苷的方法包含生成龙葵皂苷B。
在一些实施方案中,在体外翻译体系中生成甾体皂苷的方法包含生成至少一种甾体皂苷,所述至少一种甾体皂苷选自龙葵皂苷B、番茄甙或其任何组合中的任一。在一些实施方案中,在体外翻译体系中生成甾体生物碱的方法包含生成龙葵皂苷B。
在一些实施方案中,减少至少一种甾体皂苷的方法包含减少至少一种甾体皂苷,所述至少一种甾体皂苷选自龙葵皂苷B、番茄甙或其任何组合中的任一。在一些实施方案中,减少至少一种甾体皂苷含量的方法包含减少龙葵皂苷B。
在一些实施方案中,增加至少一种甾体皂苷的方法包含增加至少一种甾体皂苷,所述至少一种甾体皂苷选自龙葵皂苷B、番茄甙或其任何组合中的任一。在一些实施方案中,所述至少一种甾体皂苷包含龙葵皂苷B。在一些实施方案中,至少一种甾体皂苷包含番茄甙。
在一些实施方案中,改变至少一种甾体皂苷和至少一种甾体皂苷生物合成中间体的含量。在一些实施方案中,增加至少一种甾体皂苷和至少一种甾体皂苷生物合成中间体。在一些实施方案中,减少至少一种甾体皂苷和至少一种甾体皂苷生物合成中间体。在一些实施方案中,增加至少一种甾体皂苷,并且减少至少一种甾体皂苷生物合成中间体。在一些实施方案中,减少至少一种甾体皂苷,并且增加至少一种甾体皂苷生物合成中间体。在一些实施方案中,在没有可测量地改变甾体皂苷中间体的含量的情况下改变甾体皂苷的含量。在一些实施方案中,在没有可测量地改变甾体皂苷的含量的情况下改变甾体皂苷中间体的含量。
术语“中间体”在一些实施方案中可以与具有所有相同性质和含义的术语“生物合成中间体”互换使用。
在一些实施方案中,甾体皂苷的生物合成中间体包含胆固醇、22-羟基胆固醇、22,26-二羟胆固醇、呋喃甾醇型皂苷糖苷配基或其任何组合。
在一些实施方案中,本文公开的遗传修饰的细胞包含含量增加的至少一种甾体皂苷生物合成中间体,所述至少一种甾体皂苷生物合成中间体包含胆固醇、22-羟基胆固醇、22,26-二羟胆固醇、呋喃甾醇型皂苷糖苷配基,或其任何组合。在一些实施方案中,遗传修饰的细胞包含含量增加的包含胆固醇的至少一种甾体皂苷生物合成中间体。在一些实施方案中,遗传修饰的细胞包含含量增加的包含22-羟基胆固醇的至少一种甾体皂苷生物合成中间体。在一些实施方案中,遗传修饰的细胞包含含量增加的包含22,26-二羟胆固醇的至少一种甾体皂苷生物合成中间体。在一些实施方案中,遗传修饰的细胞包含含量增加的包含呋喃甾醇型皂苷糖苷配基的至少一种甾体皂苷生物合成中间体。
在一些实施方案中,本文公开的遗传修饰的植物包含含量减少的至少一种甾体皂苷生物合成中间体,所述至少一种甾体皂苷生物合成中间体包含胆固醇、22-羟基胆固醇、22,26-二羟胆固醇、呋喃甾醇型皂苷糖苷配基,或其任何组合。在一些实施方案中,遗传修饰的植物包含含量减少的包含胆固醇的至少一种甾体皂苷生物合成中间体。在一些实施方案中,遗传修饰的植物包含含量减少的包含22-羟基胆固醇的至少一种甾体皂苷生物合成中间体。在一些实施方案中,遗传修饰的植物包含含量减少的包含22,26-二羟胆固醇的至少一种甾体皂苷生物合成中间体。在一些实施方案中,遗传修饰的植物包含含量减少的包含呋喃甾醇型皂苷糖苷配基的至少一种甾体皂苷生物合成中间体。
在一些实施方案中,本文公开的遗传修饰的植物包含含量增加的至少一种甾体皂苷生物合成中间体以及含量减少的至少一种甾体皂苷生物合成中间体,所述中间体选自以下中的任一:胆固醇、22-羟基胆固醇、22,26-二羟胆固醇、呋喃甾醇型皂苷糖苷配基,或其任何组合。
在一些实施方案中,减少至少一种甾体皂苷的方法包含减少至少一种甾体皂苷生物合成中间体,所述至少一种甾体皂苷生物合成中间体选自以下中的任一:胆固醇、22-羟基胆固醇、22,26-二羟胆固醇、呋喃甾醇型皂苷糖苷配基,或其任何组合。在一些实施方案中,一种减少至少一种甾体皂苷的方法包含减少至少胆固醇。在一些实施方案中,一种减少至少一种甾体皂苷的方法包含减少至少22-羟基胆固醇。在一些实施方案中,一种减少至少一种甾体皂苷的方法包含减少至少22,26-二羟胆固醇。在一些实施方案中,一种减少至少一种甾体皂苷的方法包含减少至少呋喃甾醇型皂苷糖苷配基。
在一些实施方案中,增加至少一种甾体皂苷的方法包含增加至少一种甾体皂苷生物合成中间体,所述至少一种甾体皂苷生物合成中间体选自以下中的任一:胆固醇、22-羟基胆固醇、22,26-二羟胆固醇、呋喃甾醇型皂苷糖苷配基,或其任何组合。在一些实施方案中,一种增加至少一种甾体皂苷的方法包含增加至少胆固醇。在一些实施方案中,一种增加至少一种甾体皂苷的方法包含增加至少22-羟基胆固醇。在一些实施方案中,一种增加至少一种甾体皂苷的方法包含增加至少22,26-二羟胆固醇。在一些实施方案中,一种减少至少一种甾体皂苷的方法包含增加至少呋喃甾醇型皂苷糖苷配基。
在一些实施方案中,甾体皂苷的生物合成中间体包含任何胆固醇、22-羟基胆固醇、22,26-二羟胆固醇、呋喃甾醇型皂苷糖苷配基或其任何组合。
出乎意料的是,本公开现在显示,甾体皂苷或其衍生物、其代谢物或其生物合成中间体在细胞例如植物细胞或酵母细胞或藻细胞或昆虫细胞或细菌或植物中的浓度可以通过遗传修饰所述细胞或植物以表达编码酶,例如是甾体皂苷生物合成途径的一种或多种酶的至少一种异源基因来得以增加。在其他实施方案中,本文描述和举例说明的是在植物细胞中遗传修饰至少一种内源基因,例如但不限于CSLG基因以调节表达、活性或稳定性或其任何组合的方法。以下实施例公开了酶活性以及以前未知为甾体皂苷生物合成途径的一部分的酶。没有这些知识,就不可能生成甾体皂苷化合物。
在一些实施方案中,所述甾体皂苷代谢途径可以致使细胞或植物包含含量增加的甾体皂苷、其衍生物、其代谢物或其生物合成中间体,或致使植物或植物部分中这些化合物的含量增加。在一些实施方案中,植物,包括但不限于作物,其中所述作物具有含量增加的有用一种或多种甾体皂苷。在一些实施方案中,本文公开用于生成细胞的装置和方法,所述细胞包含但不限于植物细胞、酵母或藻细胞;植物包括但不限于作物或植物的一部分;具有含量增加的一种或多种甾体皂苷、或其衍生物、或其代谢物或其生物合成中间体。替代地或附加地,控制本文公开的基因的表达可以用于生成预期的甾体皂苷以供进一步使用,例如在制药工业中或用于饮食或其他补充物的配制,例如但不限于甜味剂。在一些实施方案中,这些高价值皂苷可以纯化并且使用,例如甜味剂、发泡剂、乳化剂、防腐剂、抗癌剂、降血胆固醇制剂、抗炎剂、抗氧化剂、生物佐剂、杀菌剂、杀虫剂、拒食剂、抗真菌剂,或其任何组合。本文公开的细胞和植物包含具有重要营养、药学和商业价值的化合物。
在一些实施方案中,遗传修饰的细胞或遗传修饰的植物或植物部分包含本文的至少一种遗传修饰的植物细胞,所述至少一种遗传修饰的植物细胞包含与相应的未修饰的细胞或未修饰植物相比,含量改变的至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体。在一些实施方案中,所述含量改变包含含量增加。在一些实施方案中,例如,遗传修饰的细胞或遗传修饰的植物具有含量增加的至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体,其任何组合。
在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的至少一种甾体皂苷。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的至少两种甾体皂苷。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的至少三种甾体皂苷。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的至少四种甾体皂苷。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的至少五种甾体皂苷。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的至少六种甾体皂苷。
在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的一种甾体皂苷的至少一种衍生物。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的一种或多种甾体皂苷的至少两种衍生物。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的一种或多种甾体皂苷的至少三种衍生物。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的一种或多种甾体皂苷的至少四种衍生物。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的一种或多种甾体皂苷的至少五种衍生物。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的一种或多种甾体皂苷的至少六种衍生物。
在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的一种甾体皂苷的至少一种代谢物。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的一种或多种甾体皂苷的至少两种代谢物。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的一种或多种甾体皂苷的至少三种代谢物。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的一种或多种甾体皂苷的至少四种代谢物。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的一种或多种甾体皂苷的至少五种代谢物。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的一种或多种甾体皂苷的至少六种代谢物。
在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的一种甾体皂苷的至少一种生物合成中间体。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的一种或多种甾体皂苷的至少两种生物合成中间体。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的一种或多种甾体皂苷的至少三种生物合成中间体。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的一种或多种甾体皂苷的至少四种生物合成中间体。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的一种或多种甾体皂苷的至少五种生物合成中间体。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的一种或多种甾体皂苷的至少六种生物合成中间体。
所属领域中的技术人员应认识到,说明三萜皂苷、其衍生物、其代谢物或其生物合成中间体使用的术语“含量”和”水平”涵盖与对照细胞或对照植物相比,化合物例如甾体生物碱、其衍生物、其代谢物或其生物合成中间体在遗传修饰的细胞或遗传修饰的植物中的量。在此上下文中,术语“含量”和”水平”可以互换使用,具有所有相同的含义和特性。
在一些实施方案中,具有增加含量的甾体皂苷包含营养物、化妆品或药剂或其任何组合。在一些实施方案中,具有增加含量的甾体皂苷包含选自龙葵皂苷B、番茄甙或其任何组合中的甾体皂苷。在一些实施方案中,具有增加含量的甾体生物碱包含选自以下中的至少1、2、3、4、5、6或更多种甾体生物碱:龙葵皂苷B、番茄甙或其任何组合。
在一些实施方案中,具有增加含量的甾体皂苷包含选自以下中的至少1、2、3、4、5、6或更多种甾体生物碱:龙葵皂苷B、番茄甙或其任何组合中的甾体皂苷。
在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌中,或遗传修饰的植物或其部分中含量增加的甾体皂苷包含选自以下中的甾体皂苷:龙葵皂苷B、番茄甙或其任何组合。
在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌中,或遗传修饰的植物或其部分中包含含量增加的龙葵皂苷B。在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母细胞或藻细胞或昆虫细胞或细菌中,或遗传修饰的植物或其部分中包含含量增加的番茄甙。
在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母细胞或藻细胞,或遗传修饰的植物或其部分包含含量增加的甾体皂苷生物合成中间体,所述中间体包含胆固醇、22-羟基胆固醇、22,26-二羟胆固醇、呋喃甾醇型皂苷糖苷配基,或其任何组合。在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母细胞或藻细胞或昆虫细胞或细菌,或遗传修饰的植物或其部分包含含量增加的一种或多种甾体皂苷的至少两种生物合成中间体,所述中间体包含胆固醇、22-羟基胆固醇、22,26-二羟胆固醇、呋喃甾醇型皂苷糖苷配基,或其任何组合。
在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌,或遗传修饰的植物或其部分包含含量增加的甾体皂苷生物合成中间体,所述中间体包含胆固醇。在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌,或遗传修饰的植物或其部分包含含量增加的甾体皂苷生物合成中间体,所述中间体包含22-羟基胆固醇。在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌,或遗传修饰的植物或其部分包含含量增加的甾体皂苷生物合成中间体,所述中间体包含22,26-二羟胆固醇。在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌,或遗传修饰的植物或其部分包含含量增加的甾体皂苷生物合成中间体,所述中间体包含呋喃甾醇型皂苷糖苷配基。
在一些实施方案中,包含至少一种遗传修饰的细胞的植物或植物部分中含量减少的甾体皂苷包含具有苦味或毒性的化合物。在一些实施方案中,具有减少含量的甾体皂苷包含选自龙葵皂苷B、番茄甙或其任何组合中的甾体皂苷。在一些实施方案中,具有减少含量的甾体皂苷包含所选的至少1、2、3、4、5、6种或更多种甾体皂苷。在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌中,或遗传修饰的植物或其部分中含量增加的甾体皂苷包含选自以下中的甾体皂苷:龙葵皂苷B、番茄甙或其任何组合。
在一些实施方案中,具有减少含量的甾体皂苷包含所选的至少1、2、3、4、5、6种或更多种甾体皂苷。在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌中,或遗传修饰的植物或其部分中含量增加的甾体皂苷包含选自以下中的甾体皂苷:龙葵皂苷B、番茄甙或其任何组合。
在一些实施方案中,包含至少一种遗传修饰的细胞的遗传修饰的植物或其部分中含量减少的甾体皂苷包含选自以下中的甾体皂苷:龙葵皂苷B、番茄甙或其任何组合。
在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的植物或其部分包含含量减少的龙葵皂苷B。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的植物或其部分包含含量减少的番茄甙。
在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的植物或其部分包含含量减少的甾体皂苷生物合成中间体,所述中间体包含胆固醇、22-羟基胆固醇、22,26-二羟胆固醇、呋喃甾醇型皂苷糖苷配基,或其任何组合。
在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的植物或其部分包含含量减少的甾体皂苷生物合成中间体,所述中间体包含胆固醇。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的植物或其部分包含含量减少的甾体皂苷生物合成中间体,所述中间体包含22-羟基胆固醇。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的植物或其部分包含含量减少的甾体皂苷生物合成中间体,所述中间体包含22,26-二羟胆固醇。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的植物或其部分包含含量减少的甾体皂苷生物合成中间体,所述中间体包含呋喃甾醇型皂苷糖苷配基。
在一些实施方案中,本文所公开的遗传修饰的细胞包含含量增加的至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体,以及含量改变的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,本文所公开的遗传修饰的细胞包含含量增加的至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体,以及含量减少的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,本文所公开的遗传修饰的细胞包含含量减少的至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体,以及含量改变的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,本文所公开的遗传修饰的细胞包含含量减少的至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体,以及含量增加的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,本文所公开的遗传修饰的植物包含含量增加的至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体,以及含量改变的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,本文所公开的遗传修饰的植物包含含量增加的至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体,以及含量减少的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,本文所公开的遗传修饰的植物包含含量减少的至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体,以及含量改变的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,本文所公开的遗传修饰的植物包含含量减少的至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体,以及含量增加的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,一种在遗传修饰的细胞或遗传修饰的植物内生成至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体的方法包含与未修饰的细胞或未修饰植物相比,增加至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体的含量,以及改变植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体的含量。
在一些实施方案中,一种在遗传修饰的细胞或遗传修饰的植物内生成至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体的方法包含与未修饰的细胞或未修饰植物相比,增加至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体的含量,以及减少植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体的含量。
在一些实施方案中,减少至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体的含量的方法包含遗传修饰至少一种植物细胞或植物或植物部分的至少一种细胞,所述遗传修饰的植物细胞包含含量减少的至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体,以及含量改变的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,减少至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体的含量的方法包含遗传修饰至少一种植物细胞或植物或植物部分的至少一种细胞,所述遗传修饰的植物细胞包含含量减少的至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体,以及含量增加的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,增加至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体的含量的方法包含遗传修饰至少一种植物细胞或植物或植物部分的至少一种细胞,所述遗传修饰的植物细胞包含含量改变的至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体,以及含量减少的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,增加至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体的含量的方法包含遗传修饰至少一种植物细胞或植物或植物部分的至少一种细胞,所述遗传修饰的植物细胞包含含量增加的至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体,以及含量减少的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
三萜皂苷、其衍生物、其代谢物和其生物合成中间体
在一些实施方案中,本文公开的遗传修饰的细胞包含含量增加的至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体,其任何组合。在一些实施方案中,包含本文公开的至少一种遗传修饰的细胞的遗传修饰的植物包含含量增加的至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体,其任何组合。在一些实施方案中,体外生物合成系统生成至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体,其任何组合。在一些实施方案中,本文公开的遗传修饰的植物包含含量增加的至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体,其任何组合。在一些实施方案中,包含本文公开的至少一种遗传修饰的细胞的遗传修饰的植物包含含量减少的至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体,其任何组合。在一些实施方案中,包含至少一种遗传修饰的细胞的本文公开的遗传修饰的植物包含含量增加的至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体,其任何组合,以及含量减少的至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体,其任何组合。
在一些实施方案中,一种在本文公开的遗传修饰的细胞中生成三萜皂苷的方法包含生成至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体,其任何组合。在一些实施方案中,一种在本文公开的遗传修饰的植物或植物部分中生成三萜皂苷的方法包含生成至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体,其任何组合。在一些实施方案中,本文公开了一种减少至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体,其任何组合在包含本文的至少一种遗传修饰的细胞的植物或植物部分中的含量的方法。在一些实施方案中,本文公开了一种增加至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体,其任何组合在包含本文的至少一种遗传修饰的细胞的植物或植物部分中的含量的方法。
常用皂苷名称是基于其糖苷配基的结构和生化背景来区分三萜皂苷(也称为三萜烯皂苷)与甾体皂苷。这两种皂苷配基类型均被认为源自2,3-氧化角鲨烯,其为固醇生物合成中的主要代谢物。在植物固醇组成代谢中,2,3-氧化角鲨烯主要被环化为环阿乔醇。“三萜皂苷配基”通过2,3-氧化角鲨烯的交替环化作用从植物固醇途径分支出来,而“甾体皂苷配基”被认为是从环阿乔醇形成下游的植物固醇途径中的中间体衍生而来的(参见图3A)。
皂苷可以选自包含以下的组中:达玛烷型皂苷、甘遂烷型皂苷(tirucallane-typesaponin)、羽扇多环烷型皂苷、齐墩果烷型皂苷、蒲公英烷型皂苷(taraxasterane-typesaponin)、乌斯烷型皂苷、忽布烷型皂苷(hopane-type saponin)、葫芦烷型皂苷、环木菠萝烷型皂苷(cycloartane-type saponin)、羊毛甾烷型皂苷和甾体型皂苷。糖苷配基主链、皂苷配基可以类似地分类,并且可以选自包含以下的组中:达玛烷型皂苷配基、甘遂烷型皂苷配基、羽扇多环烷型皂苷配基、齐墩果烷型皂苷配基、蒲公英烷型皂苷配基(taraxasterane-type sapogenin)、乌斯烷型皂苷配基、忽布烷型皂皂苷配基(hopane-type sapogenin)、葫芦烷型皂皂苷配基、环木菠萝烷型皂皂苷配基(cycloartane-typesapogenin)、羊毛甾烷型皂苷配基和甾体型皂苷配基。
在一些实施方案中,本文公开的“三萜皂苷配基”可以选自包含以下的组中:达玛烷型皂苷配基、甘遂烷型皂苷配基、羽扇多环烷型皂苷配基、齐墩果烷型皂苷配基、乌斯烷型皂苷配基,以及忽布烷型皂皂苷配基(hopane-type sapogenin)。在一些实施方案中,本公开方法所生成的三萜皂苷配基是达玛烷型皂苷配基或甘遂烷型皂苷配基或羽扇多环烷型皂苷配基或齐墩果烷型皂苷配基或乌斯烷型皂苷配基,或忽布烷型皂皂苷配基(hopane-type sapogenin)。
三萜皂苷配基通常具有四环或五环骨架。在一些实施方案中,所述皂苷配基构建块本身可以具有多种修饰,例如但不限于前体皂苷配基主链例如β-香树素、羽扇醇和达玛烯二醇的小官能团,包括羟基、酮基、醛基和羧基部分。
术语“三萜烯”和“三萜”可以互换使用,具有所有相同的含义和特性。三萜皂苷包含多种功能并且可以用于不同作用中,例如但不限于用作甜味剂、发泡剂、乳化剂、防腐剂、抗癌剂、降血胆固醇制剂、抗炎剂、抗氧化剂、生物佐剂、杀菌剂、杀虫剂、拒食剂、抗真菌剂,或其任何组合。
在一些实施方案中,本文所公开的三萜皂苷配基也涵盖对自然来说新的三萜化合物,其在结构上与天然存在的三萜皂苷配基有关。这些新的三萜皂苷配基可以是可以在合成真核宿主细胞,例如植物细胞或酵母细胞的基因工程后获得的新型化合物。
三萜皂苷及其生物合成中间体的实例在下表2中给出。
表2:三萜皂苷及其生物合成中间体
Figure BDA0003051611980000801
Figure BDA0003051611980000811
Figure BDA0003051611980000821
Figure BDA0003051611980000831
Figure BDA0003051611980000841
Figure BDA0003051611980000851
Figure BDA0003051611980000861
在一些实施方案中,三萜皂苷的衍生物包含三萜皂苷的糖基化衍生物。
在一些实施方案中,本文公开的三萜皂苷包含以下中的任一:苜蓿酸3-O-葡萄糖醛酸苷(MA-3-GlcA)(化合物6)、化合物7、化合物8、化合物9、化合物10、化合物11、甘草皂苷(化合物14)、甘草次酸3-O-单葡萄糖醛酸苷(化合物15)、巴约甙元(化合物25)、巴约甙元-hexA-hex-hex(化合物31)、瓜瓶藤酸(化合物26)、瓜瓶藤酸-hexA-hex(化合物32)、大豆甾醇A(化合物29)、大豆皂醇B(化合物30)、大豆甾醇A-hexA-hex-pent(化合物34)、大豆皂苷VI(化合物35)、甜菜甙IV(化合物33)、常春藤苷配基-3GlcA、丝石竹皂苷配基-3GlcA、丝石竹酸-3GlcA或QS-21佐剂,或其任何组合。
在一些实施方案中,三萜皂苷包含苜蓿酸3-O-葡萄糖醛酸苷(MA-3-GlcA)(化合物6)。在一些实施方案中,三萜皂苷包含化合物7。在一些实施方案中,三萜皂苷包含化合物8。在一些实施方案中,三萜皂苷包含化合物9。在一些实施方案中,三萜皂苷包含化合物10。在一些实施方案中,三萜皂苷包含化合物11。在一些实施方案中,三萜皂苷包含甘草皂苷(化合物14)。在一些实施方案中,三萜皂苷包含甘草次酸3-O-单葡萄糖醛酸苷(化合物15)。在一些实施方案中,三萜皂苷包含巴约甙元(化合物25)。在一些实施方案中,三萜皂苷包含巴约甙元-hexA-hex-hex(化合物31)。在一些实施方案中,三萜皂苷包含瓜瓶藤酸(化合物26)。在一些实施方案中,三萜皂苷包含瓜瓶藤酸-hexA-hex(化合物32)。在一些实施方案中,三萜皂苷包含大豆甾醇A(化合物29)。在一些实施方案中,三萜皂苷包含大豆皂醇B(化合物30)。在一些实施方案中,三萜皂苷包含大豆甾醇A-hexA-hex-pent(化合物34)。在一些实施方案中,三萜皂苷包含大豆皂苷VI(化合物35)。在一些实施方案中,三萜皂苷包含甜菜甙IV(化合物33)。在一些实施方案中,三萜皂苷包含常春藤苷配基-3GlcA。在一些实施方案中,三萜皂苷包含丝石竹皂苷配基-3GlcA。在一些实施方案中,三萜皂苷包含丝石竹酸-3GlcA。在一些实施方案中,三萜皂苷包含QS-21佐剂。
在一些实施方案中,改变三萜皂苷的含量在商业上可能是有益的,例如但不限于产生甜味剂,甘草皂苷(化合物14)的能力。在一些实施方案中,生产包含以下中的任一的三萜皂苷在商业上是有益的:甜味剂、发泡剂、乳化剂、防腐剂、抗癌剂、降血胆固醇制剂、抗炎剂、抗氧化剂、生物佐剂、杀菌剂、杀虫剂、拒食剂、抗真菌剂,或其任何组合。在其他实施方案中,改变三萜皂苷的含量可能是有益的,例如但不限于减少或消除例如但不限于奎藜籽中的苦味三萜皂苷,所述奎藜籽是从石竹目(Caryophyllales)植物中的奎奴亚藜(Chenopodium quinoa)植物中获得的。在其他实施方案中,改变三萜皂苷的含量可能是有益的,例如但不限于减少或消除具有激素模拟特性的三萜皂苷。
在一些实施方案中,本文公开的遗传修饰的细胞包含含量增加的至少一种三萜皂苷,所述至少一种三萜皂苷选自以下中的任一:苜蓿酸3-O-葡萄糖醛酸苷(MA-3-GlcA)(化合物6)、化合物7、化合物8、化合物9、化合物10、化合物11、甘草皂苷(化合物14)、甘草次酸3-O-单葡萄糖醛酸苷(化合物15)、巴约甙元(化合物25)、巴约甙元-hexA-hex-hex(化合物31)、瓜瓶藤酸(化合物26)、瓜瓶藤酸-hexA-hex(化合物32)、大豆甾醇A(化合物29)、大豆皂醇B(化合物30)、大豆甾醇A-hexA-hex-pent(化合物34)、大豆皂苷VI(化合物35)、甜菜甙IV(化合物33)、常春藤苷配基-3GlcA、丝石竹皂苷配基-3GlcA、丝石竹酸-3GlcA或QS-21佐剂,或其任何组合。在一些实施方案中,本文公开的遗传修饰的细胞包含含量增加的苜蓿酸3-O-葡萄糖醛酸苷(MA-3-GlcA)(化合物6)。在一些实施方案中,本文公开的遗传修饰的细胞包含含量增加的化合物7。在一些实施方案中,本文公开的遗传修饰的细胞包含含量增加的化合物8。在一些实施方案中,本文公开的遗传修饰的细胞包含含量增加的化合物9。在一些实施方案中,本文公开的遗传修饰的细胞包含含量增加的化合物10。在一些实施方案中,本文公开的遗传修饰的细胞包含含量增加的化合物11。在一些实施方案中,本文公开的遗传修饰的细胞包含含量增加的甘草皂苷(化合物14)。在一些实施方案中,本文公开的遗传修饰的细胞包含含量增加的甘草次酸3-O-单葡萄糖醛酸苷(化合物15)。在一些实施方案中,本文公开的遗传修饰的细胞包含含量增加的巴约甙元(化合物25)。在一些实施方案中,本文公开的遗传修饰的细胞包含含量增加的巴约甙元-hexA-hex-hex(化合物31)。在一些实施方案中,本文公开的遗传修饰的细胞包含含量增加的瓜瓶藤酸(化合物26)。在一些实施方案中,本文公开的遗传修饰的细胞包含含量增加的瓜瓶藤酸-hexA-hex(化合物32)。在一些实施方案中,本文公开的遗传修饰的细胞包含含量增加的大豆甾醇A(化合物29)。在一些实施方案中,本文公开的遗传修饰的细胞包含含量增加的大豆皂醇B(化合物30)。在一些实施方案中,本文公开的遗传修饰的细胞包含含量增加的大豆甾醇A-hexA-hex-pent(化合物34)。在一些实施方案中,本文公开的遗传修饰的细胞包含含量增加的大豆皂苷VI(化合物35)。在一些实施方案中,本文公开的遗传修饰的细胞包含含量增加的甜菜甙IV(化合物33)。在一些实施方案中,本文公开的遗传修饰的细胞包含含量增加的常春藤苷配基-3GlcA。在一些实施方案中,本文公开的遗传修饰的细胞包含含量增加的丝石竹皂苷配基-3GlcA。在一些实施方案中,本文公开的遗传修饰的细胞包含含量增加的丝石竹酸-3GlcA。在一些实施方案中,本文公开的遗传修饰的细胞包含含量增加的QS-21佐剂。
在一些实施方案中,包含所述增加含量的所述遗传修饰的细胞包含植物细胞、酵母细胞、藻细胞、昆虫细胞或细菌。在一些实施方案中,包含所述增加含量的所述遗传修饰的细胞包含植物细胞。在一些实施方案中,包含所述增加含量的所述遗传修饰的细胞包含酵母细胞。在一些实施方案中,包含所述增加含量的所述遗传修饰的细胞包含藻细胞。在一些实施方案中,包含所述增加含量的所述遗传修饰的细胞包含昆虫细胞。在一些实施方案中,包含所述增加含量的所述遗传修饰的细胞包含细菌。
在一些实施方案中,本文公开的遗传修饰的植物包含含量增加的至少一种三萜皂苷,所述至少一种三萜皂苷选自以下中的任一:苜蓿酸3-O-葡萄糖醛酸苷(MA-3-GlcA)(化合物6)、化合物7、化合物8、化合物9、化合物10、化合物11、甘草皂苷(化合物14)、甘草次酸3-O-单葡萄糖醛酸苷(化合物15)、巴约甙元(化合物25)、巴约甙元-hexA-hex-hex(化合物31)、瓜瓶藤酸(化合物26)、瓜瓶藤酸-hexA-hex(化合物32)、大豆甾醇A(化合物29)、大豆皂醇B(化合物30)、大豆甾醇A-hexA-hex-pent(化合物34)、大豆皂苷VI(化合物35)、甜菜甙IV(化合物33)、常春藤苷配基-3GlcA、丝石竹皂苷配基-3GlcA、丝石竹酸-3GlcA或QS-21佐剂,或其任何组合。在一些实施方案中,本文公开的遗传修饰的植物包含含量增加的苜蓿酸3-O-葡萄糖醛酸苷(MA-3-GlcA)(化合物6)。在一些实施方案中,本文公开的遗传修饰的植物包含含量增加的化合物7。在一些实施方案中,本文公开的遗传修饰的植物包含含量增加的化合物8。在一些实施方案中,本文公开的遗传修饰的植物包含含量增加的化合物9。在一些实施方案中,本文公开的遗传修饰的植物包含含量增加的化合物10。在一些实施方案中,本文公开的遗传修饰的植物包含含量增加的化合物11。在一些实施方案中,本文公开的遗传修饰的植物包含含量增加的甘草皂苷(化合物14)。在一些实施方案中,本文公开的遗传修饰的植物包含含量增加的甘草次酸3-O-单葡萄糖醛酸苷(化合物15)。在一些实施方案中,本文公开的遗传修饰的植物包含含量增加的巴约甙元(化合物25)。在一些实施方案中,本文公开的遗传修饰的植物包含含量增加的巴约甙元-hexA-hex-hex(化合物31)。在一些实施方案中,本文公开的遗传修饰的植物包含含量增加的瓜瓶藤酸(化合物26)。在一些实施方案中,本文公开的遗传修饰的植物包含含量增加的瓜瓶藤酸-hexA-hex(化合物32)。在一些实施方案中,本文公开的遗传修饰的植物包含含量增加的大豆甾醇A(化合物29)。在一些实施方案中,本文公开的遗传修饰的植物包含含量增加的大豆皂醇B(化合物30)。在一些实施方案中,本文公开的遗传修饰的植物包含含量增加的大豆甾醇A-hexA-hex-pent(化合物34)。在一些实施方案中,本文公开的遗传修饰的植物包含含量增加的大豆皂苷VI(化合物35)。在一些实施方案中,本文公开的遗传修饰的植物包含含量增加的甜菜甙IV(化合物33)。在一些实施方案中,本文公开的遗传修饰的植物包含含量增加的常春藤苷配基-3GlcA。在一些实施方案中,本文公开的遗传修饰的植物包含含量增加的丝石竹皂苷配基-3GlcA。在一些实施方案中,本文公开的遗传修饰的植物包含含量增加的丝石竹酸-3GlcA。在一些实施方案中,本文公开的遗传修饰的植物包含含量增加的QS-21佐剂。
在一些实施方案中,本文公开的遗传修饰的植物包含含量减少的至少一种三萜皂苷,所述至少一种三萜皂苷选自以下中的任一:苜蓿酸3-O-葡萄糖醛酸苷(MA-3-GlcA)(化合物6)、化合物7、化合物8、化合物9、化合物10、化合物11、甘草皂苷(化合物14)、甘草次酸3-O-单葡萄糖醛酸苷(化合物15)、巴约甙元(化合物25)、巴约甙元-hexA-hex-hex(化合物31)、瓜瓶藤酸(化合物26)、瓜瓶藤酸-hexA-hex(化合物32)、大豆甾醇A(化合物29)、大豆皂醇B(化合物30)、大豆甾醇A-hexA-hex-pent(化合物34)、大豆皂苷VI(化合物35)、甜菜甙IV(化合物33)、常春藤苷配基-3GlcA、丝石竹皂苷配基-3GlcA、丝石竹酸-3GlcA或QS-21佐剂,或其任何组合。在一些实施方案中,本文公开的遗传修饰的植物包含含量减少的苜蓿酸3-O-葡萄糖醛酸苷(MA-3-GlcA)(化合物6)。在一些实施方案中,本文公开的遗传修饰的植物包含含量减少的化合物7。在一些实施方案中,本文公开的遗传修饰的植物包含含量减少的化合物8。在一些实施方案中,本文公开的遗传修饰的植物包含含量减少的化合物9。在一些实施方案中,本文公开的遗传修饰的植物包含含量减少的化合物10。在一些实施方案中,本文公开的遗传修饰的植物包含含量减少的化合物11。在一些实施方案中,本文公开的遗传修饰的植物包含含量减少的甘草皂苷(化合物14)。在一些实施方案中,本文公开的遗传修饰的植物包含含量减少的甘草次酸3-O-单葡萄糖醛酸苷(化合物15)。在一些实施方案中,本文公开的遗传修饰的植物包含含量减少的巴约甙元(化合物25)。在一些实施方案中,本文公开的遗传修饰的植物包含含量减少的巴约甙元-hexA-hex-hex(化合物31)。在一些实施方案中,本文公开的遗传修饰的植物包含含量减少的瓜瓶藤酸(化合物26)。在一些实施方案中,本文公开的遗传修饰的植物包含含量减少的瓜瓶藤酸-hexA-hex(化合物32)。在一些实施方案中,本文公开的遗传修饰的植物包含含量减少的大豆甾醇A(化合物29)。在一些实施方案中,本文公开的遗传修饰的植物包含含量减少的大豆皂醇B(化合物30)。在一些实施方案中,本文公开的遗传修饰的植物包含含量减少的大豆甾醇A-hexA-hex-pent(化合物34)。在一些实施方案中,本文公开的遗传修饰的植物包含含量减少的大豆皂苷VI(化合物35)。在一些实施方案中,本文公开的遗传修饰的植物包含含量减少的甜菜甙IV(化合物33)。在一些实施方案中,本文公开的遗传修饰的植物包含含量减少的常春藤苷配基-3GlcA。在一些实施方案中,本文公开的遗传修饰的植物包含含量减少的丝石竹皂苷配基-3GlcA。在一些实施方案中,本文公开的遗传修饰的植物包含含量减少的丝石竹酸-3GlcA。在一些实施方案中,本文公开的遗传修饰的植物包含含量减少的QS-21佐剂。
在一些实施方案中,本文公开的遗传修饰的植物包含含量增加的至少一种三萜皂苷以及含量减少的至少一种三萜皂苷,所述至少一种三萜皂苷选自以下中的任一:苜蓿酸3-O-葡萄糖醛酸苷(MA-3-GlcA)(化合物6)、化合物7、化合物8、化合物9、化合物10、化合物11、甘草皂苷(化合物14)、甘草次酸3-O-单葡萄糖醛酸苷(化合物15)、巴约甙元(化合物25)、巴约甙元-hexA-hex-hex(化合物31)、瓜瓶藤酸(化合物26)、瓜瓶藤酸-hexA-hex(化合物32)、大豆甾醇A(化合物29)、大豆皂醇B(化合物30)、大豆甾醇A-hexA-hex-pent(化合物34)、大豆皂苷VI(化合物35)、甜菜甙IV(化合物33)、常春藤苷配基-3GlcA、丝石竹皂苷配基-3GlcA、丝石竹酸-3GlcA或QS-21佐剂,或其任何组合。
在一些实施方案中,在遗传修饰的细胞中生成三萜皂苷的方法包含生成至少一种三萜皂苷,所述至少一种三萜皂苷选自以下中的任一:苜蓿酸3-O-葡萄糖醛酸苷(MA-3-GlcA)(化合物6)、化合物7、化合物8、化合物9、化合物10、化合物11、甘草皂苷(化合物14)、甘草次酸3-O-单葡萄糖醛酸苷(化合物15)、巴约甙元(化合物25)、巴约甙元-hexA-hex-hex(化合物31)、瓜瓶藤酸(化合物26)、瓜瓶藤酸-hexA-hex(化合物32)、大豆甾醇A(化合物29)、大豆皂醇B(化合物30)、大豆甾醇A-hexA-hex-pent(化合物34)、大豆皂苷VI(化合物35)、甜菜甙IV(化合物33)、常春藤苷配基-3GlcA、丝石竹皂苷配基-3GlcA、丝石竹酸-3GlcA或QS-21佐剂,或其任何组合。在一些实施方案中,在遗传修饰的细胞中生成三萜皂苷的方法包含生成苜蓿酸3-O-葡萄糖醛酸苷(MA-3-GlcA)(化合物6)。在一些实施方案中,在遗传修饰的细胞中生成三萜皂苷的方法包含生成化合物7。在一些实施方案中,在遗传修饰的细胞中生成三萜皂苷的方法包含生成化合物8。在一些实施方案中,在遗传修饰的细胞中生成三萜皂苷的方法包含生成化合物9。在一些实施方案中,在遗传修饰的细胞中生成三萜皂苷的方法包含生成化合物10。在一些实施方案中,在遗传修饰的细胞中生成三萜皂苷的方法包含生成化合物11。在一些实施方案中,在遗传修饰的细胞中生成三萜皂苷的方法包含生成甘草皂苷(化合物14)。在一些实施方案中,在遗传修饰的细胞中生成三萜皂苷的方法包含生成甘草次酸3-O-单葡萄糖醛酸苷(化合物15)。在一些实施方案中,在遗传修饰的细胞中生成三萜皂苷的方法包含生成巴约甙元(化合物25)。在一些实施方案中,在遗传修饰的细胞中生成三萜皂苷的方法包含生成巴约甙元-hexA-hex-hex(化合物31)。在一些实施方案中,在遗传修饰的细胞中生成三萜皂苷的方法包含生成瓜瓶藤酸(化合物26)。在一些实施方案中,在遗传修饰的细胞中生成三萜皂苷的方法包含生成瓜瓶藤酸-hexA-hex(化合物32)。在一些实施方案中,在遗传修饰的细胞中生成三萜皂苷的方法包含生成大豆甾醇A(化合物29)。在一些实施方案中,在遗传修饰的细胞中生成三萜皂苷的方法包含生成大豆皂醇B(化合物30)。在一些实施方案中,在遗传修饰的细胞中生成三萜皂苷的方法包含生成大豆甾醇A-hexA-hex-pent(化合物34)。在一些实施方案中,在遗传修饰的细胞中生成三萜皂苷的方法包含生成大豆皂苷VI(化合物35)。在一些实施方案中,在遗传修饰的细胞中生成三萜皂苷的方法包含生成甜菜甙IV(化合物33)。在一些实施方案中,在遗传修饰的细胞中生成三萜皂苷的方法包含生成常春藤苷配基-3GlcA。在一些实施方案中,在遗传修饰的细胞中生成三萜皂苷的方法包含生成丝石竹皂苷配基-3GlcA。在一些实施方案中,在遗传修饰的细胞中生成三萜皂苷的方法包含生成丝石竹酸-3GlcA。在一些实施方案中,在遗传修饰的细胞中生成三萜皂苷的方法包含生成QS-21佐剂。
在一些实施方案中,在遗传修饰的细胞中生成至少一种三萜皂苷的方法包含在植物细胞、酵母细胞、藻细胞、昆虫细胞或细菌中生成至少一种三萜皂苷。在一些实施方案中,在遗传修饰的细胞中生成至少一种三萜皂苷的方法包含在植物细胞中生成至少一种三萜皂苷。在一些实施方案中,在遗传修饰的细胞中生成至少一种三萜皂苷的方法包含在酵母细胞中生成至少一种三萜皂苷。在一些实施方案中,在遗传修饰的细胞中生成至少一种三萜皂苷的方法包含在藻细胞中生成至少一种三萜皂苷。在一些实施方案中,在遗传修饰的细胞中生成至少一种三萜皂苷的方法包含在昆虫细胞中生成至少一种三萜皂苷。在一些实施方案中,在遗传修饰的细胞中生成至少一种三萜皂苷的方法包含在细菌中生成至少一种三萜皂苷。在一些实施方案中,所述植物细胞包含在植物或植物部分中。
在一些实施方案中,在遗传修饰的植物中生成三萜皂苷的方法包含生成至少一种三萜皂苷,所述至少一种三萜皂苷选自以下中的任一:苜蓿酸3-O-葡萄糖醛酸苷(MA-3-GlcA)(化合物6)、化合物7、化合物8、化合物9、化合物10、化合物11、甘草皂苷(化合物14)、甘草次酸3-O-单葡萄糖醛酸苷(化合物15)、巴约甙元(化合物25)、巴约甙元-hexA-hex-hex(化合物31)、瓜瓶藤酸(化合物26)、瓜瓶藤酸-hexA-hex(化合物32)、大豆甾醇A(化合物29)、大豆皂醇B(化合物30)、大豆甾醇A-hexA-hex-pent(化合物34)、大豆皂苷VI(化合物35)、甜菜甙IV(化合物33)、常春藤苷配基-3GlcA、丝石竹皂苷配基-3GlcA、丝石竹酸-3GlcA或QS-21佐剂,或其任何组合。在一些实施方案中,在遗传修饰的植物中生成三萜皂苷的方法包含生成苜蓿酸3-O-葡萄糖醛酸苷(MA-3-GlcA)(化合物6)。在一些实施方案中,在遗传修饰的植物中生成三萜皂苷的方法包含生成化合物7。在一些实施方案中,在遗传修饰的植物中生成三萜皂苷的方法包含生成化合物8。在一些实施方案中,在遗传修饰的植物中生成三萜皂苷的方法包含生成化合物9。在一些实施方案中,在遗传修饰的植物中生成三萜皂苷的方法包含生成化合物10。在一些实施方案中,在遗传修饰的植物中生成三萜皂苷的方法包含生成化合物11。在一些实施方案中,在遗传修饰的植物中生成三萜皂苷的方法包含生成甘草皂苷(化合物14)。在一些实施方案中,在遗传修饰的植物中生成三萜皂苷的方法包含生成甘草次酸3-O-单葡萄糖醛酸苷(化合物15)。在一些实施方案中,在遗传修饰的植物中生成三萜皂苷的方法包含生成巴约甙元(化合物25)。在一些实施方案中,在遗传修饰的植物中生成三萜皂苷的方法包含生成巴约甙元-hexA-hex-hex(化合物31)。在一些实施方案中,在遗传修饰的植物中生成三萜皂苷的方法包含生成瓜瓶藤酸(化合物26)。在一些实施方案中,在遗传修饰的植物中生成三萜皂苷的方法包含生成瓜瓶藤酸-hexA-hex(化合物32)。在一些实施方案中,在遗传修饰的植物中生成三萜皂苷的方法包含生成大豆甾醇A(化合物29)。在一些实施方案中,在遗传修饰的植物中生成三萜皂苷的方法包含生成大豆皂醇B(化合物30)。在一些实施方案中,在遗传修饰的植物中生成三萜皂苷的方法包含生成大豆甾醇A-hexA-hex-pent(化合物34)。在一些实施方案中,在遗传修饰的植物中生成三萜皂苷的方法包含生成大豆皂苷VI(化合物35)。在一些实施方案中,在遗传修饰的植物中生成三萜皂苷的方法包含生成甜菜甙IV(化合物33)。在一些实施方案中,在遗传修饰的植物中生成三萜皂苷的方法包含生成常春藤苷配基-3GlcA。在一些实施方案中,在遗传修饰的植物中生成三萜皂苷的方法包含生成丝石竹皂苷配基-3GlcA。在一些实施方案中,在遗传修饰的植物中生成三萜皂苷的方法包含生成丝石竹酸-3GlcA。在一些实施方案中,在遗传修饰的植物中生成三萜皂苷的方法包含生成QS-21佐剂。
在一些实施方案中,在体外翻译体系中生成三萜皂苷的方法包含生成至少一种三萜皂苷,所述至少一种三萜皂苷选自以下中的任一:苜蓿酸3-O-葡萄糖醛酸苷(MA-3-GlcA)(化合物6)、化合物7、化合物8、化合物9、化合物10、化合物11、甘草皂苷(化合物14)、甘草次酸3-O-单葡萄糖醛酸苷(化合物15)、巴约甙元(化合物25)、巴约甙元-hexA-hex-hex(化合物31)、瓜瓶藤酸(化合物26)、瓜瓶藤酸-hexA-hex(化合物32)、大豆甾醇A(化合物29)、大豆皂醇B(化合物30)、大豆甾醇A-hexA-hex-pent(化合物34)、大豆皂苷VI(化合物35)、甜菜甙IV(化合物33)、常春藤苷配基-3GlcA、丝石竹皂苷配基-3GlcA、丝石竹酸-3GlcA或QS-21佐剂,或其任何组合。在一些实施方案中,在体外翻译体系中生成三萜皂苷的方法包含生成苜蓿酸3-O-葡萄糖醛酸苷(MA-3-GlcA)(化合物6)。在一些实施方案中,在体外翻译体系中生成三萜皂苷的方法包含生成化合物7。在一些实施方案中,在体外翻译体系中生成三萜皂苷的方法包含生成化合物8。在一些实施方案中,在体外翻译体系中生成三萜皂苷的方法包含生成化合物9。在一些实施方案中,在体外翻译体系中生成三萜皂苷的方法包含生成化合物10。在一些实施方案中,在体外翻译体系中生成三萜皂苷的方法包含生成化合物11。在一些实施方案中,在体外翻译体系中生成三萜皂苷的方法包含生成甘草皂苷(化合物14)。在一些实施方案中,在体外翻译体系中生成三萜皂苷的方法包含生成甘草次酸3-O-单葡萄糖醛酸苷(化合物15)。在一些实施方案中,在体外翻译体系中生成三萜皂苷的方法包含生成巴约甙元(化合物25)。在一些实施方案中,在体外翻译体系中生成三萜皂苷的方法包含生成巴约甙元-hexA-hex-hex(化合物31)。在一些实施方案中,在体外翻译体系中生成三萜皂苷的方法包含生成瓜瓶藤酸(化合物26)。在一些实施方案中,在体外翻译体系中生成三萜皂苷的方法包含生成瓜瓶藤酸-hexA-hex(化合物32)。在一些实施方案中,在体外翻译体系中生成三萜皂苷的方法包含生成大豆甾醇A(化合物29)。在一些实施方案中,在体外翻译体系中生成三萜皂苷的方法包含生成大豆皂醇B(化合物30)。在一些实施方案中,在体外翻译体系中生成三萜皂苷的方法包含生成大豆甾醇A-hexA-hex-pent(化合物34)。在一些实施方案中,在体外翻译体系中生成三萜皂苷的方法包含生成大豆皂苷VI(化合物35)。在一些实施方案中,在体外翻译体系中生成三萜皂苷的方法包含生成甜菜甙IV(化合物33)。在一些实施方案中,在体外翻译体系中生成三萜皂苷的方法包含生成常春藤苷配基-3GlcA。在一些实施方案中,在体外翻译体系中生成三萜皂苷的方法包含生成丝石竹皂苷配基-3GlcA。在一些实施方案中,在体外翻译体系中生成三萜皂苷的方法包含生成丝石竹酸-3GlcA。在一些实施方案中,在体外翻译体系中生成三萜皂苷的方法包含生成QS-21佐剂。
在一些实施方案中,减少至少一种三萜皂苷的方法包含减少至少一种三萜皂苷,所述至少一种三萜皂苷选自以下中的任一:苜蓿酸3-O-葡萄糖醛酸苷(MA-3-GlcA)(化合物6)、化合物7、化合物8、化合物9、化合物10、化合物11、甘草皂苷(化合物14)、甘草次酸3-O-单葡萄糖醛酸苷(化合物15)、巴约甙元(化合物25)、巴约甙元-hexA-hex-hex(化合物31)、瓜瓶藤酸(化合物26)、瓜瓶藤酸-hexA-hex(化合物32)、大豆甾醇A(化合物29)、大豆皂醇B(化合物30)、大豆甾醇A-hexA-hex-pent(化合物34)、大豆皂苷VI(化合物35)、甜菜甙IV(化合物33)、常春藤苷配基-3GlcA、丝石竹皂苷配基-3GlcA、丝石竹酸-3GlcA或QS-21佐剂,或其任何组合。在一些实施方案中,减少至少一种三萜皂苷的含量的方法包含生成苜蓿酸3-O-葡萄糖醛酸苷(MA-3-GlcA)(化合物6)。在一些实施方案中,一种减少至少一种三萜皂苷的方法包含减少化合物7。在一些实施方案中,一种减少至少一种三萜皂苷的方法包含减少化合物8。在一些实施方案中,一种减少至少一种三萜皂苷的方法包含减少化合物9。在一些实施方案中,一种减少至少一种三萜皂苷的方法包含减少化合物10。在一些实施方案中,一种减少至少一种三萜皂苷的方法包含减少化合物11。在一些实施方案中,一种减少至少一种三萜皂苷的方法包含减少甘草皂苷(化合物14)。在一些实施方案中,一种减少至少一种三萜皂苷的方法包含减少甘草次酸3-O-单葡萄糖醛酸苷(化合物15)。在一些实施方案中,一种减少至少一种三萜皂苷的方法包含减少巴约甙元(化合物25)。在一些实施方案中,一种减少至少一种三萜皂苷的方法包含减少巴约甙元-hexA-hex-hex(化合物31)。在一些实施方案中,一种减少至少一种三萜皂苷的方法包含减少瓜瓶藤酸(化合物26)。在一些实施方案中,一种减少至少一种三萜皂苷的方法包含减少瓜瓶藤酸-hexA-hex(化合物32)。在一些实施方案中,一种减少至少一种三萜皂苷的方法包含减少大豆甾醇A(化合物29)。在一些实施方案中,一种减少至少一种三萜皂苷的方法包含减少大豆皂醇B(化合物30)。在一些实施方案中,一种减少至少一种三萜皂苷的方法包含减少大豆甾醇A-hexA-hex-pent(化合物34)。在一些实施方案中,一种减少至少一种三萜皂苷的方法包含减少大豆皂苷VI(化合物35)。在一些实施方案中,一种减少至少一种三萜皂苷的方法包含减少甜菜甙IV(化合物33)。在一些实施方案中,一种减少至少一种三萜皂苷的方法包含减少常春藤苷配基-3GlcA。在一些实施方案中,一种减少至少一种三萜皂苷的方法包含减少丝石竹皂苷配基-3GlcA。在一些实施方案中,一种减少至少一种三萜皂苷的方法包含减少丝石竹酸-3GlcA。在一些实施方案中,一种减少至少一种三萜皂苷的方法包含减少QS-21佐剂。
在一些实施方案中,增加至少一种三萜皂苷的方法包含增加至少一种三萜皂苷,所述至少一种三萜皂苷选自以下中的任一:苜蓿酸3-O-葡萄糖醛酸苷(MA-3-GlcA)(化合物6)、化合物7、化合物8、化合物9、化合物10、化合物11、甘草皂苷(化合物14)、甘草次酸3-O-单葡萄糖醛酸苷(化合物15)、巴约甙元(化合物25)、巴约甙元-hexA-hex-hex(化合物31)、瓜瓶藤酸(化合物26)、瓜瓶藤酸-hexA-hex(化合物32)、大豆甾醇A(化合物29)、大豆皂醇B(化合物30)、大豆甾醇A-hexA-hex-pent(化合物34)、大豆皂苷VI(化合物35)、甜菜甙IV(化合物33)、常春藤苷配基-3GlcA、丝石竹皂苷配基-3GlcA、丝石竹酸-3GlcA或QS-21佐剂,或其任何组合。在一些实施方案中,增加至少一种三萜皂苷的含量的方法包含生成苜蓿酸3-O-葡萄糖醛酸苷(MA-3-GlcA)(化合物6)。在一些实施方案中,一种增加至少一种三萜皂苷的方法包含增加化合物7。在一些实施方案中,一种增加至少一种三萜皂苷的方法包含增加化合物8。在一些实施方案中,一种增加至少一种三萜皂苷的方法包含增加化合物9。在一些实施方案中,一种增加至少一种三萜皂苷的方法包含增加化合物10。在一些实施方案中,一种增加至少一种三萜皂苷的方法包含增加化合物11。在一些实施方案中,一种增加至少一种三萜皂苷的方法包含增加甘草皂苷(化合物14)。在一些实施方案中,一种增加至少一种三萜皂苷的方法包含增加甘草次酸3-O-单葡萄糖醛酸苷(化合物15)。在一些实施方案中,一种增加至少一种三萜皂苷的方法包含增加巴约甙元(化合物25)。在一些实施方案中,一种增加至少一种三萜皂苷的方法包含增加巴约甙元-hexA-hex-hex(化合物31)。在一些实施方案中,一种增加至少一种三萜皂苷的方法包含增加瓜瓶藤酸(化合物26)。在一些实施方案中,一种增加至少一种三萜皂苷的方法包含增加瓜瓶藤酸-hexA-hex(化合物32)。在一些实施方案中,一种增加至少一种三萜皂苷的方法包含增加大豆甾醇A(化合物29)。在一些实施方案中,一种增加至少一种三萜皂苷的方法包含增加大豆皂醇B(化合物30)。在一些实施方案中,一种增加至少一种三萜皂苷的方法包含增加大豆甾醇A-hexA-hex-pent(化合物34)。在一些实施方案中,一种增加至少一种三萜皂苷的方法包含增加大豆皂苷VI(化合物35)。在一些实施方案中,一种增加至少一种三萜皂苷的方法包含增加甜菜甙IV(化合物33)。在一些实施方案中,一种增加至少一种三萜皂苷的方法包含增加常春藤苷配基-3GlcA。在一些实施方案中,一种增加至少一种三萜皂苷的方法包含增加丝石竹皂苷配基-3GlcA。在一些实施方案中,一种增加至少一种三萜皂苷的方法包含增加丝石竹酸-3GlcA。在一些实施方案中,一种增加至少一种三萜皂苷的方法包含增加QS-21佐剂。
在一些实施方案中,改变至少一种三萜皂苷和至少一种三萜皂苷生物合成中间体的含量。在一些实施方案中,增加至少一种三萜皂苷和至少一种三萜皂苷生物合成中间体。在一些实施方案中,减少至少一种三萜皂苷和至少一种三萜皂苷生物合成中间体。在一些实施方案中,增加至少一种三萜皂苷,并且减少至少一种三萜皂苷生物合成中间体。在一些实施方案中,减少至少一种三萜皂苷,并且增加至少一种三萜皂苷生物合成中间体。在一些实施方案中,在没有可测量地改变三萜皂苷中间体的含量的情况下改变三萜皂苷的含量。在一些实施方案中,在没有可测量地改变三萜皂苷的含量的情况下改变三萜皂苷中间体的含量。
术语“中间体”在一些实施方案中可以与具有所有相同性质和含义的术语“生物合成中间体”互换使用。
在一些实施方案中,三萜皂苷的生物合成中间体包含化合物1、化合物2、苜蓿酸(化合物5)、齐墩果酸(化合物3)、齐墩果酸-3GlcA、奥古斯丁酸(化合物4)、奥古斯丁酸-3GlcA或甘草次酸(化合物13)或其任何组合。
在一些实施方案中,本文公开的遗传修饰的细胞包含含量增加的至少一种三萜皂苷生物合成中间体,所述至少一种三萜皂苷生物合成中间体包含化合物1、化合物2、苜蓿酸(化合物5)、齐墩果酸(化合物3)、齐墩果酸-3GlcA、奥古斯丁酸(化合物4)、奥古斯丁酸-3GlcA或甘草次酸(化合物13)或其任何组合。在一些实施方案中,遗传修饰的细胞包含含量增加的包含化合物1的至少一种三萜皂苷生物合成中间体。在一些实施方案中,遗传修饰的细胞包含含量增加的包含化合物2的至少一种三萜皂苷生物合成中间体。在一些实施方案中,遗传修饰的细胞包含含量增加的包含苜蓿酸(化合物5)的至少一种三萜皂苷生物合成中间体。在一些实施方案中,遗传修饰的细胞包含含量增加的包含齐墩果酸(化合物3)的至少一种三萜皂苷生物合成中间体。在一些实施方案中,遗传修饰的细胞包含含量增加的包含齐墩果酸-3GlcA的至少一种三萜皂苷生物合成中间体。在一些实施方案中,遗传修饰的细胞包含含量增加的包含奥古斯丁酸(化合物4)的至少一种三萜皂苷生物合成中间体。在一些实施方案中,遗传修饰的细胞包含含量增加的包含奥古斯丁酸-3GlcA的至少一种三萜皂苷生物合成中间体。在一些实施方案中,遗传修饰的细胞包含含量增加的包含甘草次酸(化合物13)的至少一种三萜皂苷生物合成中间体。
在一些实施方案中,本文公开的遗传修饰的植物包含含量减少的至少一种三萜皂苷生物合成中间体,所述至少一种三萜皂苷生物合成中间体包含化合物1、化合物2、苜蓿酸(化合物5)、齐墩果酸(化合物3)、齐墩果酸-3GlcA、奥古斯丁酸(化合物4)、奥古斯丁酸-3GlcA或甘草次酸(化合物13)或其任何组合。在一些实施方案中,遗传修饰的植物包含含量减少的包含化合物1的至少一种三萜皂苷生物合成中间体。在一些实施方案中,遗传修饰的植物包含含量减少的包含化合物2的至少一种三萜皂苷生物合成中间体。在一些实施方案中,遗传修饰的植物包含含量减少的包含苜蓿酸(化合物5)的至少一种三萜皂苷生物合成中间体。在一些实施方案中,遗传修饰的植物包含含量减少的包含齐墩果酸(化合物3)的至少一种三萜皂苷生物合成中间体。在一些实施方案中,遗传修饰的植物包含含量减少的包含齐墩果酸-3GlcA的至少一种三萜皂苷生物合成中间体。在一些实施方案中,遗传修饰的植物包含含量减少的包含奥古斯丁酸(化合物4)的至少一种三萜皂苷生物合成中间体。在一些实施方案中,遗传修饰的植物包含含量减少的包含奥古斯丁酸-3GlcA的至少一种三萜皂苷生物合成中间体。在一些实施方案中,遗传修饰的植物包含含量减少的包含甘草次酸(化合物13)的至少一种三萜皂苷生物合成中间体。
在一些实施方案中,本文公开的遗传修饰的植物包含含量增加的至少一种三萜皂苷生物合成中间体以及含量减少的至少一种三萜皂苷生物合成中间体,所述中间体包含化合物1、化合物2、苜蓿酸(化合物5)、齐墩果酸(化合物3)、齐墩果酸-3GlcA、奥古斯丁酸(化合物4)、奥古斯丁酸-3GlcA或甘草次酸(化合物13)或其任何组合。
在一些实施方案中,减少至少一种三萜皂苷的方法包含减少至少一种三萜皂苷生物合成中间体,所述至少一种三萜皂苷生物合成中间体选自化合物1、化合物2、苜蓿酸(化合物5)、齐墩果酸(化合物3)、齐墩果酸-3GlcA、奥古斯丁酸(化合物4)、奥古斯丁酸-3GlcA或甘草次酸(化合物13)或其任何组合的任一。在一些实施方案中,一种减少至少一种三萜皂苷的方法包含减少至少化合物1。在一些实施方案中,一种减少至少一种三萜皂苷的方法包含减少至少化合物2。在一些实施方案中,减少至少一种三萜皂苷的方法包含减少至少一种苜蓿酸(化合物5)。在一些实施方案中,减少至少一种三萜皂苷的方法包含减少至少一种齐墩果酸(化合物3)。在一些实施方案中,减少至少一种三萜皂苷的方法包含减少至少齐墩果酸-3GlcA。在一些实施方案中,减少至少一种三萜皂苷的方法包含减少至少奥古斯丁酸(化合物4)。在一些实施方案中,减少至少一种三萜皂苷的方法包含减少至少奥古斯丁酸-3GlcA。在一些实施方案中,减少至少一种三萜皂苷的方法包含减少至少甘草次酸(化合物13)。
在一些实施方案中,增加至少一种三萜皂苷的方法包含增加至少一种三萜皂苷生物合成中间体,所述至少一种三萜皂苷生物合成中间体包含化合物1、化合物2、苜蓿酸(化合物5)、齐墩果酸(化合物3)、齐墩果酸-3GlcA、奥古斯丁酸(化合物4)、奥古斯丁酸-3GlcA或甘草次酸(化合物13)或其任何组合。在一些实施方案中,一种增加至少一种三萜皂苷的方法包含增加至少化合物1。在一些实施方案中,一种增加至少一种三萜皂苷的方法包含增加至少化合物2。在一些实施方案中,增加至少一种三萜皂苷的方法包含增加至少一种苜蓿酸(化合物5)。在一些实施方案中,增加至少一种三萜皂苷的方法包含增加至少一种齐墩果酸(化合物3)。在一些实施方案中,增加至少一种三萜皂苷的方法包含增加至少齐墩果酸-3GlcA。在一些实施方案中,增加至少一种三萜皂苷的方法包含增加至少奥古斯丁酸(化合物4)。在一些实施方案中,增加至少一种三萜皂苷的方法包含增加至少奥古斯丁酸-3GlcA。在一些实施方案中,增加至少一种三萜皂苷的方法包含增加至少甘草次酸(化合物13)。
在一些实施方案中,三萜皂苷生物合成中间体包含任何化合物1、化合物2、苜蓿酸(化合物5)、齐墩果酸(化合物3)、齐墩果酸-3GlcA、奥古斯丁酸(化合物4)、奥古斯丁酸-3GlcA或甘草次酸(化合物13)或其组合。
出乎意料的是,本公开现在显示,三萜皂苷或其衍生物、其代谢物或其生物合成中间体在细胞例如植物细胞或酵母细胞或藻细胞或昆虫细胞或细菌或植物中的浓度可以通过遗传修饰所述细胞或植物以表达编码酶,例如是三萜皂苷生物合成途径的一种或多种酶的至少一种异源基因来得以增加。在其他实施方案中,本文描述和举例说明的是在植物细胞中遗传修饰至少一种内源基因,例如但不限于CSLG基因以调节表达、活性或稳定性或其任何组合的方法。以下实施例公开了酶活性以及以前未知为三萜皂苷生物合成途径的一部分的酶。没有这些知识,就不可能生成三萜皂苷化合物。
在一些实施方案中,所述三萜皂苷代谢途径可以致使细胞或植物包含含量增加的三萜皂苷、其衍生物、其代谢物或其生物合成中间体,或致使植物或植物部分中这些化合物的含量增加。在一些实施方案中,植物,包括但不限于作物,其中所述作物具有含量增加的有用的一种或多种三萜皂苷。在一些实施方案中,本文公开用于生成细胞的装置和方法,所述细胞包括但不限于植物细胞、酵母或藻细胞;植物包括但不限于作物或植物的一部分;具有水平增加的一种或多种三萜皂苷、或其衍生物、或其代谢物或其生物合成中间体。替代地或附加地,控制本文公开的基因的表达可以用于生成预期的三萜皂苷以供进一步使用,例如在制药工业中或用于饮食或其他补充物的配制,例如但不限于甜味剂。在一些实施方案中,这些高价值皂苷可以纯化并且使用,例如甜味剂、发泡剂、乳化剂、防腐剂、抗癌剂、降血胆固醇制剂、抗炎剂、抗氧化剂、生物佐剂、杀菌剂、杀虫剂、拒食剂、抗真菌剂,或其任何组合。本文公开的细胞和植物包含具有重要营养、药学和商业价值的化合物。
在一些实施方案中,遗传修饰的细胞或遗传修饰的植物或植物部分包含本文的至少一种遗传修饰的植物细胞,所述至少一种遗传修饰的植物细胞包含与相应的未修饰的细胞或未修饰植物相比,含量改变的至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体。在一些实施方案中,所述含量改变包含含量增加。在一些实施方案中,例如,遗传修饰的细胞或遗传修饰的植物具有含量增加的至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体,其任何组合。
在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的至少一种三萜皂苷。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的至少两种三萜皂苷。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的至少三种三萜皂苷。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的至少四种三萜皂苷。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的至少五种三萜皂苷。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的至少六种三萜皂苷。
在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的一种三萜皂苷的至少一种衍生物。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的一种或多种三萜皂苷的至少两种衍生物。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的一种或多种三萜皂苷的至少三种衍生物。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的一种或多种三萜皂苷的至少四种衍生物。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的一种或多种三萜皂苷的至少五种衍生物。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的一种或多种三萜皂苷的至少六种衍生物。
在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的一种三萜皂苷的至少一种代谢物。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的一种或多种三萜皂苷的至少两种代谢物。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的一种或多种三萜皂苷的至少三种代谢物。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的一种或多种三萜皂苷的至少四种代谢物。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的一种或多种三萜皂苷的至少五种代谢物。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的一种或多种三萜皂苷的至少六种代谢物。
在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的一种三萜皂苷的至少一种生物合成中间体。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的一种或多种三萜皂苷的至少两种生物合成中间体。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的一种或多种三萜皂苷的至少三种生物合成中间体。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的一种或多种三萜皂苷的至少四种生物合成中间体。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的一种或多种三萜皂苷的至少五种生物合成中间体。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的细胞或遗传修饰的植物或植物部分具有含量增加的一种或多种三萜皂苷的至少六种生物合成中间体。
所属领域中的技术人员应认识到,相对于三萜皂苷、其衍生物、其代谢物或其生物合成中间体使用的术语“含量”和”水平”涵盖与对照细胞或对照植物相比,化合物例如三萜皂苷、其衍生物、其代谢物或其生物合成中间体在遗传修饰的细胞或遗传修饰的植物中的量。在此上下文中,术语“含量”和”水平”可以互换使用,具有所有相同的含义和特性。
在一些实施方案中,具有增加含量的三萜皂苷包含:甜味剂、发泡剂、乳化剂、防腐剂、抗癌剂、降血胆固醇制剂、抗炎剂、抗氧化剂、生物佐剂、杀菌剂、杀虫剂、拒食剂、抗真菌剂,或其任何组合。在一些实施方案中,具有增加含量的三萜皂苷包含选自以下中的三萜皂苷:苜蓿酸3-O-葡萄糖醛酸苷(MA-3-GlcA)(化合物6)、化合物7、化合物8、化合物9、化合物10、化合物11、甘草皂苷(化合物14)、甘草次酸3-O-单葡萄糖醛酸苷(化合物15)、巴约甙元(化合物25)、巴约甙元-hexA-hex-hex(化合物31)、瓜瓶藤酸(化合物26)、瓜瓶藤酸-hexA-hex(化合物32)、大豆甾醇A(化合物29)、大豆皂醇B(化合物30)、大豆甾醇A-hexA-hex-pent(化合物34)、大豆皂苷VI(化合物35)、甜菜甙IV(化合物33)、常春藤苷配基-3GlcA、丝石竹皂苷配基-3GlcA、丝石竹酸-3GlcA或QS-21佐剂,或其任何组合。在一些实施方案中,具有增加含量的三萜皂苷包含选自以下中的至少1、2、3、4、5、6种或更多种三萜皂苷:苜蓿酸3-O-葡萄糖醛酸苷(MA-3-GlcA)(化合物6)、化合物7、化合物8、化合物9、化合物10、化合物11、甘草皂苷(化合物14)、甘草次酸3-O-单葡萄糖醛酸苷(化合物15)、巴约甙元(化合物25)、巴约甙元-hexA-hex-hex(化合物31)、瓜瓶藤酸(化合物26)、瓜瓶藤酸-hexA-hex(化合物32)、大豆甾醇A(化合物29)、大豆皂醇B(化合物30)、大豆甾醇A-hexA-hex-pent(化合物34)、大豆皂苷VI(化合物35)、甜菜甙IV(化合物33)、常春藤苷配基-3GlcA、丝石竹皂苷配基-3GlcA、丝石竹酸-3GlcA或QS-21佐剂,或其任何组合。
在一些实施方案中,具有增加含量的三萜皂苷包含选自以下中的至少1、2、3、4、5、6种或更多种三萜皂苷:苜蓿酸3-O-葡萄糖醛酸苷(MA-3-GlcA)(化合物6)、化合物7、化合物8、化合物9、化合物10、化合物11、甘草皂苷(化合物14)、甘草次酸3-O-单葡萄糖醛酸苷(化合物15)、巴约甙元(化合物25)、巴约甙元-hexA-hex-hex(化合物31)、瓜瓶藤酸(化合物26)、瓜瓶藤酸-hexA-hex(化合物32)、大豆甾醇A(化合物29)、大豆皂醇B(化合物30)、大豆甾醇A-hexA-hex-pent(化合物34)、大豆皂苷VI(化合物35)、甜菜甙IV(化合物33)、常春藤苷配基-3GlcA、丝石竹皂苷配基-3GlcA、丝石竹酸-3GlcA或QS-21佐剂,或其任何组合。
在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌中,或遗传修饰的植物或其部分中含量增加的三萜皂苷包含选自以下中的三萜皂苷:苜蓿酸3-O-葡萄糖醛酸苷(MA-3-GlcA)(化合物6)、化合物7、化合物8、化合物9、化合物10、化合物11、甘草皂苷(化合物14)、甘草次酸3-O-单葡萄糖醛酸苷(化合物15)、巴约甙元(化合物25)、巴约甙元-hexA-hex-hex(化合物31)、瓜瓶藤酸(化合物26)、瓜瓶藤酸-hexA-hex(化合物32)、大豆甾醇A(化合物29)、大豆皂醇B(化合物30)、大豆甾醇A-hexA-hex-pent(化合物34)、大豆皂苷VI(化合物35)、甜菜甙IV(化合物33)、常春藤苷配基-3GlcA、丝石竹皂苷配基-3GlcA、丝石竹酸-3GlcA或QS-21佐剂,或其任何组合。
在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌,或遗传修饰的植物或其部分包含含量增加的化合物11在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌,或遗传修饰的植物或其部分包含含量增加的苜蓿酸3-O-葡萄糖醛酸苷(MA-3-GlcA)(化合物6)。在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌,或遗传修饰的植物或其部分包含含量增加的化合物7在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌,或遗传修饰的植物或其部分包含含量增加的化合物8在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌,或遗传修饰的植物或其部分包含含量增加的化合物9在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌,或遗传修饰的植物或其部分包含含量增加的化合物10在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌,或遗传修饰的植物或其部分包含含量增加甘草皂苷(化合物14)。在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌,或遗传修饰的植物或其部分包含含量增加的甘草次酸3-O-单葡萄糖醛酸苷(化合物15)。在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌,或遗传修饰的植物或其部分包含含量增加的巴约甙元(化合物25)。在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌,或遗传修饰的植物或其部分包含含量增加的巴约甙元-hexA-hex-hex(化合物31)。在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌,或遗传修饰的植物或其部分包含含量增加的瓜瓶藤酸(化合物26)。在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌,或遗传修饰的植物或其部分包含含量增加的瓜瓶藤酸-hexA-hex(化合物32)。在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌,或遗传修饰的植物或其部分包含含量增加的大豆甾醇A(化合物29)。在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌,或遗传修饰的植物或其部分包含含量增加的大豆皂醇B(化合物30)。在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌,或遗传修饰的植物或其部分包含含量增加的大豆甾醇A-hexA-hex-pent(化合物34)。在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌,或遗传修饰的植物或其部分包含含量增加的大豆皂苷VI(化合物35)。在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌,或遗传修饰的植物或其部分包含含量增加的甜菜甙IV(化合物33)。在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌,或遗传修饰的植物或其部分包含含量增加的常春藤苷配基-3GlcA。在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌,或遗传修饰的植物或其部分包含含量增加的丝石竹皂苷配基-3GlcA。在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌,或遗传修饰的植物或其部分包含含量增加的丝石竹酸-3GlcA。在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌,或遗传修饰的植物或其部分包含含量增加的QS-21佐剂。所属领域中的技术人员应理解,在一些实施方案中,在一种三萜皂苷的含量增加的情况下,也可以在同一时间间隔中增加额外三萜皂苷或中间体或其组合。
在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞,或遗传修饰的植物或其部分包含含量增加的至少一种三萜皂苷生物合成中间体,所述中间体包含化合物1、化合物2、苜蓿酸(化合物5)、齐墩果酸(化合物3)、齐墩果酸-3GlcA、奥古斯丁酸(化合物4)、奥古斯丁酸-3GlcA或甘草次酸(化合物13)或其任何组合。在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母细胞或藻细胞或昆虫细胞或细菌,或遗传修饰的植物或其部分包含含量增加的一种或多种三萜皂苷的至少两种生物合成中间体,所述中间体包含化合物1、化合物2、苜蓿酸(化合物5)、齐墩果酸(化合物3)、齐墩果酸-3GlcA、奥古斯丁酸(化合物4)、奥古斯丁酸-3GlcA或甘草次酸(化合物13)或其任何组合;或其任何组合。
在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌,或遗传修饰的植物或其部分包含含量增加的三萜皂苷生物合成中间体,所述中间体包含苜蓿酸(化合物5)。在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌,或遗传修饰的植物或其部分包含含量增加的三萜皂苷生物合成中间体,所述中间体包含化合物1。在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌,或遗传修饰的植物或其部分包含含量增加的三萜皂苷生物合成中间体,所述中间体包含化合物2。在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌,或遗传修饰的植物或其部分包含含量增加的三萜皂苷生物合成中间体,所述中间体包含齐墩果酸(化合物3)。在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌,或遗传修饰的植物或其部分包含含量增加的三萜皂苷生物合成中间体,所述中间体包含齐墩果酸-3GlcA。在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌,或遗传修饰的植物或其部分包含含量增加的三萜皂苷生物合成中间体,所述中间体包含奥古斯丁酸(化合物4))。在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌,或遗传修饰的植物或其部分包含含量增加的三萜皂苷生物合成中间体,所述中间体包含奥古斯丁酸-3GlcA。在一些实施方案中,遗传修饰的细胞,例如植物细胞或酵母或藻细胞或昆虫细胞或细菌,或遗传修饰的植物或其部分包含含量增加的三萜皂苷生物合成中间体,所述中间体包含甘草次酸(化合物13),或其任何组合。
在一些实施方案中,包含至少一种遗传修饰的细胞的植物或植物部分中含量减少的三萜皂苷包含具有苦味或毒性的化合物。在一些实施方案中,具有减少含量的三萜皂苷包含选自以下中的三萜皂苷:苜蓿酸3-O-葡萄糖醛酸苷(MA-3-GlcA)(化合物6)、化合物7、化合物8、化合物9、化合物10、化合物11、甘草皂苷(化合物14)、甘草次酸3-O-单葡萄糖醛酸苷(化合物15)、巴约甙元(化合物25)、巴约甙元-hexA-hex-hex(化合物31)、瓜瓶藤酸(化合物26)、瓜瓶藤酸-hexA-hex(化合物32)、大豆甾醇A(化合物29)、大豆皂醇B(化合物30)、大豆甾醇A-hexA-hex-pent(化合物34)、大豆皂苷VI(化合物35)、甜菜甙IV(化合物33)、常春藤苷配基-3GlcA、丝石竹皂苷配基-3GlcA、丝石竹酸-3GlcA或QS-21佐剂,或其任何组合。在一些实施方案中,具有减少含量的三萜皂苷包含选自以下中的至少1、2、3、4、5、6种或更多种三萜皂苷:苜蓿酸3-O-葡萄糖醛酸苷(MA-3-GlcA)(化合物6)、化合物7、化合物8、化合物9、化合物10、化合物11、甘草皂苷(化合物14)、甘草次酸3-O-单葡萄糖醛酸苷(化合物15)、巴约甙元(化合物25)、巴约甙元-hexA-hex-hex(化合物31)、瓜瓶藤酸(化合物26)、瓜瓶藤酸-hexA-hex(化合物32)、大豆甾醇A(化合物29)、大豆皂醇B(化合物30)、大豆甾醇A-hexA-hex-pent(化合物34)、大豆皂苷VI(化合物35)、甜菜甙IV(化合物33)、常春藤苷配基-3GlcA、丝石竹皂苷配基-3GlcA、丝石竹酸-3GlcA或QS-21佐剂,或其任何组合。
在一些实施方案中,具有减少含量的三萜皂苷包含选自以下中的至少1、2、3、4、5、6种或更多种三萜皂苷:苜蓿酸3-O-葡萄糖醛酸苷(MA-3-GlcA)(化合物6)、化合物7、化合物8、化合物9、化合物10、化合物11、甘草皂苷(化合物14)、甘草次酸3-O-单葡萄糖醛酸苷(化合物15)、巴约甙元(化合物25)、巴约甙元-hexA-hex-hex(化合物31)、瓜瓶藤酸(化合物26)、瓜瓶藤酸-hexA-hex(化合物32)、大豆甾醇A(化合物29)、大豆皂醇B(化合物30)、大豆甾醇A-hexA-hex-pent(化合物34)、大豆皂苷VI(化合物35)、甜菜甙IV(化合物33)、常春藤苷配基-3GlcA、丝石竹皂苷配基-3GlcA、丝石竹酸-3GlcA或QS-21佐剂,或其任何组合。
在一些实施方案中,在包含至少一种遗传修饰的细胞的遗传修饰的植物或其部分内的含量减少的三萜皂苷包含选自以下中的三萜皂苷:苜蓿酸3-O-葡萄糖醛酸苷(MA-3-GlcA)(化合物6)、化合物7、化合物8、化合物9、化合物10、化合物11、甘草皂苷(化合物14)、甘草次酸3-O-单葡萄糖醛酸苷(化合物15)、巴约甙元(化合物25)、巴约甙元-hexA-hex-hex(化合物31)、瓜瓶藤酸(化合物26)、瓜瓶藤酸-hexA-hex(化合物32)、大豆甾醇A(化合物29)、大豆皂醇B(化合物30)、大豆甾醇A-hexA-hex-pent(化合物34)、大豆皂苷VI(化合物35)、甜菜甙IV(化合物33)、常春藤苷配基-3GlcA、丝石竹皂苷配基-3GlcA、丝石竹酸-3GlcA或QS-21佐剂,或其任何组合。
在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的植物或其部分包含含量减少的化合物11。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的植物或其部分包含含量减少的苜蓿酸3-O-葡萄糖醛酸苷(MA-3-GlcA)(化合物6)。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的植物或其部分包含含量减少的化合物7。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的植物或其部分包含含量减少的化合物8。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的植物或其部分包含含量减少的化合物9。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的植物或其部分包含含量减少的化合物10。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的植物或其部分包含含量减少的甘草皂苷(化合物14)。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的植物或其部分包含含量减少的甘草次酸3-O-单葡萄糖醛酸苷(化合物15)。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的植物或其部分包含含量减少的巴约甙元(化合物25)。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的植物或其部分包含含量减少的巴约甙元-hexA-hex-hex(化合物31)。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的植物或其部分包含含量减少的瓜瓶藤酸(化合物26)。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的植物或其部分包含含量减少的瓜瓶藤酸-hexA-hex(化合物32)。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的植物或其部分包含含量减少的大豆甾醇A(化合物29)。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的植物或其部分包含含量减少的大豆皂醇B(化合物30)。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的植物或其部分包含含量减少的大豆甾醇A-hexA-hex-pent(化合物34)。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的植物或其部分包含含量减少的大豆皂苷VI(化合物35)。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的植物或其部分包含含量减少的甜菜甙IV(化合物33)。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的植物或其部分包含含量减少的常春藤苷配基-3GlcA。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的植物或其部分包含含量减少的丝石竹皂苷配基-3GlcA。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的植物或其部分包含含量减少的丝石竹酸-3GlcA。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的植物或其部分包含含量减少的QS-21佐剂。所属领域中的技术人员应理解,在一些实施方案中,在一种三萜皂苷的含量减少的情况下,也可以在同一时间间隔中减少额外三萜皂苷或中间体或其组合。
在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的植物或其部分包含含量减少的三萜皂苷生物合成中间体,所述中间体包含化合物1、化合物2、苜蓿酸(化合物5)、齐墩果酸(化合物3)、齐墩果酸-3GlcA、奥古斯丁酸(化合物4)、奥古斯丁酸-3GlcA或甘草次酸(化合物13)或其任何组合。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的植物或其部分包含含量减少的一种或多种三萜皂苷的至少两种生物合成中间体,所述中间体包含化合物1、化合物2、苜蓿酸(化合物5)、齐墩果酸(化合物3)、齐墩果酸-3GlcA、奥古斯丁酸(化合物4)、奥古斯丁酸-3GlcA或甘草次酸(化合物13)或其任何组合;或其任何组合。
在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的植物或其部分包含含量减少的三萜皂苷生物合成中间体,所述中间体包含苜蓿酸(化合物5)。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的植物或其部分包含含量减少的三萜皂苷生物合成中间体,所述中间体包含化合物1。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的植物或其部分包含含量减少的三萜皂苷生物合成中间体,所述中间体包含化合物2。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的植物或其部分包含含量减少的三萜皂苷生物合成中间体,所述中间体包含齐墩果酸(化合物3)。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的植物或其部分包含含量减少的三萜皂苷生物合成中间体,所述中间体包含齐墩果酸-3GlcA。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的植物或其部分包含含量减少的三萜皂苷生物合成中间体,所述中间体包含奥古斯丁酸(化合物4)。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的植物或其部分包含含量减少的三萜皂苷生物合成中间体,所述中间体包含奥古斯丁酸-3GlcA。在一些实施方案中,包含至少一种遗传修饰的植物细胞的遗传修饰的植物或其部分包含含量减少的三萜皂苷生物合成中间体,所述中间体包含甘草次酸(化合物13),或其任何组合。
在一些实施方案中,本文所公开的遗传修饰的细胞包含含量增加的至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体,以及含量改变的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,本文所公开的遗传修饰的细胞包含含量增加的至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体,以及含量减少的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,本文所公开的遗传修饰的细胞包含含量减少的至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体,以及含量改变的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,本文所公开的遗传修饰的细胞包含含量减少的至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体,以及含量增加的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,本文所公开的遗传修饰的植物包含含量增加的至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体,以及含量改变的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,本文所公开的遗传修饰的植物包含含量增加的至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体,以及含量减少的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,本文所公开的遗传修饰的植物包含含量减少的至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体,以及含量改变的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,本文所公开的遗传修饰的植物包含含量减少的至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体,以及含量增加的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,一种在遗传修饰的细胞或遗传修饰的植物内生成至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体的方法包含与未修饰的细胞或未修饰植物相比,改变至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体的含量,以及减少植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体的含量。
在一些实施方案中,一种在遗传修饰的细胞或遗传修饰的植物内生成至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体的方法包含与未修饰的细胞或未修饰植物相比,增加至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体的含量,以及减少植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体的含量。
在一些实施方案中,减少至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体的含量的方法包含遗传修饰至少一种植物细胞或植物或植物部分的至少一种细胞,所述遗传修饰的植物细胞包含含量减少的至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体,以及含量改变的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,减少至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体的含量的方法包含遗传修饰至少一种植物细胞或植物或植物部分的至少一种细胞,所述遗传修饰的植物细胞包含含量减少的至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体,以及含量增加的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,增加至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体的含量的方法包含遗传修饰至少一种植物细胞或植物或植物部分的至少一种细胞,所述遗传修饰的植物细胞包含含量增加的至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体,以及含量改变的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,增加至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体的含量的方法包含遗传修饰至少一种植物细胞或植物或植物部分的至少一种细胞,所述遗传修饰的植物细胞包含含量增加的至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体,以及含量减少的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
植物、植物部分和细胞
根据一些实施方案,包含编码酶的至少一种异源基因的本文的细胞或有机体具有分别与相应的非遗传修饰的细胞或非转基因植物相比,含量增加的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体。在其他实施方案中,包含本文的至少一种遗传修饰的细胞的遗传修饰的植物或植物部分包含编码甾体生物碱途径、甾体皂苷途径或三萜合成途径的酶的至少一种经修饰内源基因;所述遗传修饰的植物或植物部分与相应的未遗传修饰的植物相比,具有增加含量的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体。在其他实施方案中,包含本文的至少一种遗传修饰的细胞的遗传修饰的植物或植物部分包含编码甾体生物碱合成途径、甾体皂苷合成途径或三萜合成途径的酶的至少一种异源基因;所述遗传修饰的植物或植物部分与相应的未遗传修饰的植物相比,具有增加含量的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体。在其他实施方案中,包含本文的至少一种遗传修饰的细胞的遗传修饰的植物或植物部分包含编码甾体生物碱合成途径、甾体皂苷合成途径或三萜合成途径的酶的至少一种经修饰内源基因;所述遗传修饰的植物或植物部分与相应的未遗传修饰的植物相比,具有减少含量的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体。如全文中所描述的,所属领域中的技术人员应理解,内源基因的修饰包括但不限于增加表达、减少表达或突变基因,或其组合,如本文中详细描述。
根据一些实施方案,包含编码CSLG酶的至少一种异源CSLG基因的本文的细胞或有机体具有分别与相应的非遗传修饰的细胞或非转基因植物相比,含量增加的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体。在其他实施方案中,包含本文的至少一种遗传修饰的细胞的遗传修饰的植物或植物部分包含编码甾体生物碱合成途径、甾体皂苷合成途径或三萜合成途径的CSLG酶的至少一种经修饰内源CSLG基因;所述遗传修饰的植物或植物部分与相应的未遗传修饰的植物相比,具有含量增加的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体。在其他实施方案中,包含本文的至少一种遗传修饰的细胞的遗传修饰的植物或植物部分包含编码甾体生物碱合成途径、甾体皂苷合成途径或三萜合成途径的酶的至少一种异源CSLG基因;所述遗传修饰的植物或植物部分与相应的未遗传修饰的植物相比,具有增加含量的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体。在其他实施方案中,包含本文的至少一种遗传修饰的细胞的遗传修饰的植物或植物部分包含编码甾体生物碱合成途径、甾体皂苷合成途径或三萜合成途径的酶的至少一种经修饰内源CSLG基因;所述遗传修饰的植物或植物部分与相应的未遗传修饰的植物相比,具有增加减少的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,甾体生物碱的衍生物、甾体皂苷的衍生物或三萜皂苷的衍生物分别包含甾体生物碱的糖基化衍生物、甾体皂苷的糖基化衍生物或三萜皂苷的糖基化衍生物。
在一些实施方案中,对正常情况下不表达例如至少皂苷β-香树素合酶、细胞色素P450、糖基转移酶、酰基转移酶、葡萄糖苷酰转移酶或CSLG,并且/或正常情况下不生成特定甾体生物碱、其衍生物、其代谢物或其生物合成中间体;特定甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或特定三萜皂苷、其衍生物、其代谢物或其生物合成中间体的细胞或植物物种或植物部分进行遗传修饰以表达皂苷β-香树素合酶、细胞色素P450、糖基转移酶、酰基转移酶、葡萄糖苷酰转移酶或CSLG,或其任何组合。在一些实施方案中,对正常情况下不表达皂苷β-香树素合酶、细胞色素P450、糖基转移酶、酰基转移酶、葡萄糖苷酰转移酶或CSLG,并且/或正常情况下不生成特定甾体生物碱、其衍生物、其代谢物或其生物合成中间体;特定甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或特定三萜皂苷、其衍生物、其代谢物或其生物合成中间体的细胞或植物物种或植物部分进行遗传修饰以生成甾体生物碱、其衍生物、其代谢物或其生物合成中间体;甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或三萜皂苷、其衍生物、其代谢物或其生物合成中间体,或其任何组合。在其他实施方案中,对正常情况下表达给定量的皂苷β-香树素合酶、细胞色素P450、糖基转移酶、酰基转移酶、葡萄糖苷酰转移酶或CSLG或其任何组合的细胞或植物物种或植物部分进行遗传修饰以过表达皂苷β-香树素合酶、细胞色素P450、糖基转移酶、酰基转移酶、葡萄糖苷酰转移酶或CSLG,或其任何组合。在其他实施方案中,对正常情况下表达给定量的皂苷β-香树素合酶、细胞色素P450、糖基转移酶、酰基转移酶、葡萄糖苷酰转移酶或CSLG或其任何组合的细胞或植物物种或植物部分进行遗传修饰以减少或沉默皂苷β-香树素合酶、细胞色素P450、糖基转移酶、酰基转移酶、葡萄糖苷酰转移酶或CSLG,或其任何组合的表达。
在一些实施方案中,对正常情况下生成给定量的甾体生物碱、其衍生物、其代谢物或其生物合成中间体;甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或三萜皂苷、其衍生物、其代谢物或其生物合成中间体的细胞或植物物种或植物部分进行遗传修饰以过表达皂苷β-香树素合酶、细胞色素P450、糖基转移酶、酰基转移酶、葡萄糖苷酰转移酶或CSLG或其任何组合,进而致使甾体生物碱、其衍生物、其代谢物或其生物合成中间体;甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或三萜皂苷、其衍生物、其代谢物或其生物合成中间体,或其任何组合的生成量增加。
在其他实施方案中,对正常情况下生成给定量的甾体生物碱、其衍生物、其代谢物或其生物合成中间体;甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或三萜皂苷、其衍生物、其代谢物或其生物合成中间体的细胞或植物物种或植物部分进行遗传修饰,以减少或沉默皂苷β-香树素合酶、细胞色素P450、糖基转移酶、酰基转移酶、葡萄糖苷酰转移酶或CSLG或其任何组合的表达,进而致使甾体生物碱、其衍生物、其代谢物或其生物合成中间体;甾体皂苷、其衍生物、其代谢物或其生物合成中间体;三萜皂苷、其衍生物、其代谢物或其生物合成中间体,或其任何组合的生成量减少。
在一些实施方案中,本文公开了遗传修饰的植物的种子,其中与从相应未修饰植物种子生长的植物相比,从所述种子生长并且表达至少一种皂苷β-香树素合酶、细胞色素P450、糖基转移酶、酰基转移酶、葡萄糖苷酰转移酶或CSLG的植物因此而含有至少一种皂苷β-香树素合酶、细胞色素P450、糖基转移酶、酰基转移酶、葡萄糖苷酰转移酶或CSLG的表达或过表达,并且/或具有含量增加的甾体生物碱、其衍生物、其代谢物或其生物合成中间体;甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或三萜皂苷、其衍生物、其代谢物或其生物合成中间体。
本文公开的细胞包含多种变体,包含但不限于酵母、藻类、昆虫、细菌和植物细胞。在一些实施方案中,遗传修饰的细胞包含植物细胞。在一些实施方案中,遗传修饰的细胞包含酵母细胞。在一些实施方案中,遗传修饰的细胞包含藻细胞。在一些实施方案中,遗传修饰的细胞包含昆虫细胞。在一些实施方案中,遗传修饰的细胞包含细菌。
通常,大多数酵母、藻类、昆虫细胞和细菌不会天然合成甾体生物碱、甾体皂苷或三萜皂苷。在一些实施方案中,为了在酵母或藻细胞或昆虫细胞或细菌中生成甾体生物碱、甾体皂苷或三萜皂苷,酵母或藻细胞或昆虫细胞或细菌的遗传修饰包含引入生成三萜皂苷生物合成途径的前体或底物或其组合所必需的一种或多种酶。例如,参见下文的实施例14,其中酿酒酵母(S.cerevisiae)被遗传修饰以表达异源UDP-葡萄糖6-脱氢酶1,以便生成三萜皂苷生物合成途径的底物所必需的前体。在一些实施方案中,遗传修饰的细胞表达至少一种异源基因,用于生成甾体生物碱生物合成途径、甾体皂苷生物合成途径或三萜生物合成途径的前体、底物或其组合。在一些实施方案中,遗传修饰的细胞表达至少一种异源基因,用于生成甾体生物碱生物合成途径、甾体皂苷生物合成途径或三萜生物合成途径的前体、底物或其组合,并且表达编码甾体生物碱生物合成途径、甾体皂苷生物合成途径或三萜生物合成途径的酶的至少一种异源基因。
在一些实施方案中,细胞包含微生物。在一些实施方案中,所述遗传修饰的细胞是酵母细胞。在一些实施方案中,酵母来自酵母菌目(Saccharomycetes)。在一些实施方案中,酵母来自酵母菌目(Saccharomycetes),并且选自以下:酵母菌属(例如,酿酒酵母(Saccharomyces cerevisiae))、裂殖酵母属、毕赤酵母属(例如毕赤酵母(Pichiapastoris))、克鲁维酵母菌属(例如克鲁维酵母菌(Hansenula polymorpha))、子囊菌酵母属(例如解脂耶氏酵母(Yarrowia lipollytica))、克鲁维酵母菌属(例如乳酸克鲁维酵母(Kluyveromyces lactis))或假丝酵母属(例如白色念珠菌(Candida albicans)、产朊假丝酵母(Candida utilis))。在一些实施方案中,酵母选自酵母菌属、裂殖酵母属、毕赤酵母属、子囊菌酵母属、克鲁维酵母菌属或假丝酵母属。在一些实施方案中,酵母选自酿酒酵母或白色念珠菌(Candida albicans)。
在一些实施方案中,遗传修饰的酵母可用于生成本文的甾体生物碱、甾体皂苷或三萜皂苷的方法中。
在一些实施方案中,所述遗传修饰的细胞是藻细胞。在一些实施方案中,细胞是多种藻类中的任何一种,包括但不限于绿藻门(绿藻)、红藻门(红藻)或褐色植物门(褐藻)。在一些实施方案中,绿藻植物来自团藻目(Chlamydomonadales)或小球藻目(Chlorellales)。在一些实施方案中,绿藻植物来自团藻目(Chlamydomonadales),并且选自衣藻属(例如莱茵衣藻(Chlamydomonas reinhardtii))和盐藻。在一些实施方案中,绿藻植物来自小球藻目(Chlorellales),并且选自小球藻属(Chlorella)。
在一些实施方案中,遗传修饰的藻类可用于生成本文的甾体生物碱、甾体皂苷或三萜皂苷的方法中。
在一些实施方案中,本文公开的遗传修饰的细胞是细菌细胞。在一个实施方案中,细菌细胞是大肠杆菌细胞。在另一个实施方案中,所述细胞是粉红头孢枝顶孢(Acremoniumrutilum)、米曲霉(Aspergillus oryzae)、解脂耶氏酵母(Yarrowia lipolytica)、Bacillus sp.JPJ、Brevundimonas sp.SGJ、大肠杆菌(E.herbicola)、弗氏柠檬酸杆菌(Citrobacter freundii)、共生细菌(Symbiobacterium)或绿脓杆菌(Pseudomonasaeruginosa)细胞。在另一个实施方案中,细菌细胞来自与乳制品发酵有关的细菌。在一个实施方案中,细菌是乳链球菌(Streptococcus lactis)。在一个实施方案中,细菌是乳酸杆菌(Lactobacillus)。在一个实施方案中,所述乳酸杆菌是保加利亚乳杆菌(Lactobacillusbulgaricus)。在另一个实施方案中,细菌是乳球菌属(Lactococcus)或明串珠菌属(Leuconostoc)。
在一些实施方案中,遗传修饰的细菌可用于生成本文的甾体生物碱、甾体皂苷或三萜皂苷的方法中。
在一些实施方案中,本文所公开的遗传修饰的植物包含含量增加的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体,以及含量改变的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,本文所公开的遗传修饰的植物包含含量增加的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体,以及含量减少的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,本文所公开的遗传修饰的植物包含含量减少的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体,以及含量改变的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,本文所公开的遗传修饰的植物包含含量减少的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体,以及含量增加的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,一种在遗传修饰的细胞或遗传修饰的植物内生成至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体的方法包含与未修饰的细胞或未修饰植物相比,增加至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体的含量,以及改变植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体的含量。
在一些实施方案中,一种在遗传修饰的细胞或遗传修饰的植物内生成至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体的方法包含与未修饰的细胞或未修饰植物相比,增加至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体的含量,以及减少植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体的含量。
在一些实施方案中,减少至少一种至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体的含量的方法包含遗传修饰至少一种植物细胞或植物或植物部分的至少一种细胞,所述遗传修饰的植物细胞包含含量减少的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体,以及含量改变的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,减少至少一种至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体的含量的方法包含遗传修饰至少一种植物细胞或植物或植物部分的至少一种细胞,所述遗传修饰的植物细胞包含含量减少的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体,以及含量增加的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,增加至少一种至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体的含量的方法包含遗传修饰至少一种植物细胞或植物或植物部分的至少一种细胞,所述遗传修饰的植物细胞包含含量增加的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体,以及含量改变的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,增加至少一种至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体的含量的方法包含遗传修饰至少一种植物细胞或植物或植物部分的至少一种细胞,所述遗传修饰的植物细胞包含含量增加的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体,以及含量减少的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,所述遗传修饰的细胞是植物细胞。如下所述,可以从多种植物中获得植物细胞。所述植物细胞可以是叶细胞、叶柄细胞、植物茎或柄细胞、根细胞、芽细胞、块茎细胞、豆细胞、谷粒或果仁细胞、果实细胞、坚果细胞、豆荚细胞、种子或种子细胞、苞片细胞、愈伤组织细胞和花细胞。在一些实施方案中,所述遗传修饰的细胞之后可以包含在植物叶、植物叶柄、植物茎或柄、植物根、植物芽、植物块茎、植物豆、植物谷粒或果仁、植物果实、植物坚果、植物豆荚、植物种子、植物苞片、植物愈伤组织或植物花中。
在一些实施方案中,遗传修饰的植物细胞按此在培养物中生长,而与植物或植物部分无关。培养植物和植物部位的方法是所属领域中公知的,例如参见Ochoa-VillarrealM、Howat S、Hong S等人,“用于生产天然产物的植物细胞培养策略”(Plant cell culturestrategies for the production of natural products),《BMB报告》(BMB Rep.),2016,第49(3)期第149–158页,该文献全文以引用方式并入本文中。
在一些实施方案中,遗传修饰的植物细胞按此在培养物中生长,而与植物或植物部分无关,并且用于本文提供的方法中以生成甾体生物碱、甾体皂苷或三萜皂苷。本文所述范围内也包含遗传修饰的细胞的悬浮液,以及源自所述遗传修饰的细胞的组织培养物。细胞悬浮液和组织培养物可用于生成预期甾体生物碱、其衍生物、其代产物或其生物合成中间体;预期甾体皂苷、其衍生物、其代谢物或其生物合成中间体;预期三萜皂苷、其衍生物、其代谢物或其生物合成中间体,然后从细胞或生长培养基中提取这些产物。替代地,遗传修饰的植物细胞和/或组织培养物用于再生转基因植物,所述转基因植物具有经修饰的皂苷β-香树素合酶、细胞色素P450、糖基转移酶、酰基转移酶、葡萄糖苷酰转移酶或CSLG的表达或过表达,因此分别与相应的未稀释细胞或植物相比,在细胞或植物中表达或过表达皂苷β-香树素合酶、细胞色素P450、糖基转移酶、酰基转移酶、UDP-葡萄糖6-脱氢酶1以及纤维素合酶样G(CSLG)。因此而具有含量改变的甾体生物碱、其衍生物、其代谢物或其生物合成中间体;甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或三萜皂苷、其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,遗传修饰的植物细胞包含在植物内。在一些实施方案中,遗传修饰的植物细胞包含在植物中生长,其中所述植物用于本文提供的方法中以生成甾体生物碱、甾体皂苷或三萜皂苷。在一些实施方案中,遗传修饰的植物细胞包含在植物组织内。在一些实施方案中,遗传修饰的植物细胞包含在植物组织内,其中所述植物组织用于本文提供的方法中以生成甾体生物碱、甾体皂苷或三萜皂苷。在一些实施方案中,遗传修饰的植物细胞包含在植物部分内。在一些实施方案中,遗传修饰的植物细胞包含在植物部分内,其中所述植物部分用于本文提供的方法中以生成甾体生物碱、甾体皂苷或三萜皂苷。在一些实施方案中,遗传修饰的植物细胞包含在植物部分内。在一些实施方案中,遗传修饰的植物细胞包含在植物部分内,其中所述植物部分用于本文提供的方法中以生成甾体生物碱、甾体皂苷或三萜皂苷。
在一些实施方案中,遗传修饰的细胞包含植物细胞,所述植物细胞包含叶细胞、叶柄细胞、植物茎或柄细胞、根细胞、芽细胞、块茎细胞、豆细胞、谷粒或果仁细胞、果实细胞、坚果细胞、豆荚细胞、种子或种子细胞、苞片细胞、愈伤组织细胞或花细胞。在一些实施方案中,遗传修饰的细胞包含植物细胞,所述植物细胞包含在植物叶、植物叶柄、植物茎或柄、植物根、植物芽、植物块茎、植物豆、植物谷粒或果仁、植物果实、植物坚果、植物豆荚、植物种子、植物苞片、植物愈伤组织或植物花,或其组合中。在一些实施方案中,遗传修饰的植物细胞包含在植物部分内,其中所述植物部分包含叶、叶柄、植物茎或柄、根、芽、块茎、豆、谷粒或果仁、果实、坚果、豆荚、种子或籽、苞片、愈伤组织或花。
在一些实施方案中,遗传修饰的植物细胞可用于生成本文的甾体生物碱、甾体皂苷或三萜皂苷的方法中。
在一些实施方案中,遗传修饰的细胞包含遗传修饰的植物细胞(例如,培养的植物细胞)。在其他实施方案中,遗传修饰的植物细胞包含在植物或植物部分、植物组织或植物部分内。在一些实施方案中,术语“植物”可以与具有所有相同含义和性质的术语“植物部分”互换使用。
在一些实施方案中,遗传修饰的植物细胞、植物、植物部分、植物组织或植物部分可用于生成本文的甾体生物碱、甾体皂苷或三萜皂苷的方法中。
存在于遗传修饰的细胞或植物或植物部分中的甾体生物碱、甾体皂苷或三萜皂苷、其衍生物、其代谢物或其生物合成中间体的含量如下文所举例说明地进行测量,并且是所属领域中的技术人员已知的。
在一些实施方案中,后代植物包含与至少一种祖代植物相比,含量增加的甾体生物碱、其衍生物、其代谢物或其生物合成中间体;甾体皂苷、其衍生物、其代谢物或其生物合成中间体;三萜皂苷、其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,本文公开的植物或植物细胞或植物组织或植物部分选自石竹目(Caryophyllales)、茄目(Solanales)、豆目(Fabales)、锦葵目(Malvales)、伞形目(Apiales)、十字花目(Brassicales)、禾本目(Poales)、唇形目(Lamiales)、葫芦目(Cucurbitales)、菊目(Asterales)、金虎尾目(Malpighiales)、蔷薇目(Rosales)、壳斗目(Fagales)、无患子目(Sapindales)、棕榈目(Arecales)、杜鹃花目(Ericales)、龙胆目(Gentianales)、毛茛目(Ranunculales)、姜目(Zingiberales)、虎耳草目(Saxifragales)、葡萄目(Vitales)、松柏目(Pinales)、山茱萸目(Cornales)、天门冬目(Asparagales)、薯蓣目(Dioscoreales)和百合目(Liliales)。在一些实施方案中,本文公开的植物或植物细胞或植物组织或植物部分包含来自选自以下中的植物的细胞:石竹目(Caryophyllales)、茄目(Solanales)、豆目(Fabales)、锦葵目(Malvales)、伞形目(Apiales)、十字花目(Brassicales)、禾本目(Poales)、唇形目(Lamiales)、葫芦目(Cucurbitales)、菊目(Asterales)、金虎尾目(Malpighiales)、蔷薇目(Rosales)、壳斗目(Fagales)、无患子目(Sapindales)、棕榈目(Arecales)、杜鹃花目(Ericales)、龙胆目(Gentianales)、毛茛目(Ranunculales)、姜目(Zingiberales)、虎耳草目(Saxifragales)、葡萄目(Vitales)、松柏目(Pinales)、山茱萸目(Cornales)、天门冬目(Asparagales)、薯蓣目(Dioscoreales)和百合目(Liliales)。
在一些实施方案中,本文公开的植物或植物细胞或植物组织或植物部分包含来自以下中的植物的细胞:禾本目(Poales)、石竹目(Caryophyllales)、茄目(Solanales)、豆目(Fabales)、锦葵目(Malvales)、伞形目(Apiales)、十字花目(Brassicales)、天门冬目(Asparagales)、薯蓣目(Dioscoreales)或百合目(Liliales)植物的细胞。
在一些实施方案中,本文公开的植物或植物细胞或植物组织或植物部分是石竹目(Caryophyllales),并且选自以下构成的属中:菠菜属(例如菠菜(Spinacia oleracea))、藜属(例如奎奴亚藜(Chenopodium quinoa))、甜菜属(例如甜菜(Beta vulgaris))、大黄属(例如大黄(Rheum hybridum)、食用大黄(Rheum rhaponticum)、波叶大黄(Rheumrhabarbarum)、穗序大黄(Rheum ribes))、麦蓝菜属(例如麦蓝菜(Vaccaria hispanica))、肥皂草属(王不留行(Saponaria vaccaria))和石头花属(圆锥石头花(Gypsophilapaniculata))。在一些实施方案中,石竹目植物选自菠菜、甜菜根和奎藜籽。
在一些实施方案中,本文公开的植物或植物细胞或植物组织或植物部分归属于茄目,并且选自以下构成的属中:烟草属(例如,本赛姆氏烟草(Nicotiana benthamiana))、茄属(例如,番茄(Solanum lycopersicum)、马铃薯(Solanum tuberosum)、茄子(Solanummelongena)、潘那利番茄(Solanum pennellii)、查科茄(Solanum chacoense)、欧白英(Solanum dulcamara))、辣椒属(例如辣椒(Capsicum annuum))、莨菪属(Hyoscyamus)、曼陀罗属(Datura)和颠茄属(Atropa)。在一些实施方案中,本文公开的植物包含茄科作物植物。在一些实施方案中,茄科作物植物选自:番茄(Solanum lycopersicum)、潘那利番茄(Solanum pennellii)、马铃薯(Solanum tuberosum)、查科茄(Solanumchacoense)、辣椒(Capsicum annuum)、欧白英(Solanum dulcamara)和茄子(Solanum melongena)。在一些实施方案中,茄科或茄目植物选自地樱桃、茄子、马铃薯、番茄、野生番茄、马铃薯、野生马铃薯、胡椒、甜椒、卡宴辣椒、红辣椒、甘椒、塔巴斯科辣椒、烟草和南蛇藤。
在一些实施方案中,该植物是豆目(Fabales)的,并且选自由以下属:甘草属(例如,甘草(Glycyrrhiza uralensis)、甘草(Glycyrrhiza glabra))、苜蓿属(例如,紫苜蓿(Medicago sativa)、蒺藜状苜蓿(Medicago truncatula))、皂皮树属(例如皂树(Quillajasaponaria))、大豆属(例如橹豆[大豆/黄豆])、百脉根属(例如百脉根(Lotusjaponicus))、鹰嘴豆属(例如鹰嘴豆[鸡豆、鹰嘴豆])、菜豆属(例如菜豆[四季豆、刀豆、芸豆])、豌豆属(例如豌豆[Pisum sativum])、落花生属(如花生[Arachis hypogaea])、羽扇豆属(例如,白羽扇豆[羽扇豆/羽扇豆蓝])和金合欢属(Acacia)。在一些实施方案中,豆目植物选自紫苜蓿、大豆、百脉根和甘草。
在一些实施方案中,植物来自锦葵目(Malvales),并且选自可可属(Theobroma,例如可可树(Theobroma cacao)。
在一些实施方案中,植物来自伞形目(Apiales),并且选自以下属:胡萝卜属(例如,胡萝卜(Daucus carota))、芹属(例如,旱芹(Apium graveolens))、香芹菜属(例如香芹(Petroselinum crispum))、人参属(例如高丽参(Panax ginseng))、柴胡属(Bupleurum)、常春藤属(Hedera)和积雪草属(例如积雪草(Centella asiatica))。
在一些实施方案中,植物来自十字花目(Brassicales),并且选自以下属:腰果属(例如,腰果,拟南芥(Arabidopsis thaliana))、芸苔属(例如,甘蓝[卷心菜]、芥菜[白芥]、黑芥菜(Brassica nigra)、西洋油菜(Brassica napus))、山柑属(例如续随子[刺山柑])和番木瓜属(例如番木瓜[Carica papaya])。
在一些实施方案中,所述植物来自禾本目(Poales),并且选自以下属:稻属(例如水稻(Oryza sativa)和光稃稻[稻谷])、大麦属(例如大麦[Hordeum vulgare])、燕麦属(例如燕麦[Avena sativa]、毛燕麦(Avena strigosa))和小麦属(例如斯佩耳特小麦[Triticum spelta])。
在一些实施方案中,所述植物来自唇形目(Lamiales),并且选自以下属:鼠尾草属(例如,芡欧鼠尾草(Salvia hispanica)[Salvia hispanica])、胡麻属(例如,Sesamumindicum[芝麻、胡麻])和木犀榄属(例如油橄榄(Olea europaea)[油橄榄])。
在一些实施方案中,所述植物来自葫芦目,并且选自以下:南瓜属(例如南瓜/南瓜芦,包含但不限于美洲南瓜(Cucurbita pepo)、笋瓜(Cucurbita maxima)、灰籽南瓜(Cucurbita argyrosperma)或中国南瓜(Cucurbita moschata))。
在一些实施方案中,植物来自菊目(Asterales),并且选自以下属:向日葵属(例如,向日葵[Helianthus annuus]、向日葵向日葵[Helianthus verticallatus]、菊芋[块根向日葵])、蒿属(例如,黄花蒿(Artemesia annua))、乳菀属(紫菀属)(例如,硬枝乳菀(Galatella sedifolia))和蒲公英属(例如,西洋蒲公英(Taraxacum officinale)[蒲公英])。
在一些实施方案中,该植物来自金虎尾目(Malpighiales),并且选自以下属:亚麻属(例如亚麻(Linum usitatissimum)[亚麻、亚麻籽])、木榄属(例如木榄(Bruguieragymnorhiza))、大戟属(例如绿玉树(Euphorbia tirucalli))、蓖麻属(例如蓖麻[Ricinuscommunis])、秋茄树属(例如秋茄树(Kandelia candel))以及红树属(例如红海榄(Rhizophora stylosa))。
在一些实施方案中,所述植物来自蔷薇目(Rosales),并且选自以下属:李属(例如扁桃(Prunus dulcis)[杏仁]、甜扁桃(Prunus amygdalus))和大麻属(例如,大麻,包含大麻草(Cannabis sativa))。
在一些实施方案中,植物来自壳斗目(Fagales),并且选自以下属:榛属(例如,榛/榛/榛木/榛果,包含但不限于欧榛(Corylus avellana))、桦木属(例如,垂枝桦(Betulapendula)[银桦]、毛桦(Betula pubescens)[白桦或柔毛桦]、亚洲白桦(Betulaplatyphylla)),以及胡桃属(例如,普通胡桃(Juglans regia)[胡桃或英国胡桃]、黑胡桃[Juglans nigra]、白胡桃木[Juglans cinera])。
在一些实施方案中,植物来自无患子目(Sapindales),并且选自以下属:腰果属(例如,腰果,腰果[Anacardium occidentale])、黄连木属(例如开心果[Pistacia vera])、柑桔属(许多物种和杂种)、七叶树属(例如欧洲七叶树(Aesculus hippocastanum)、日本七叶树(Aesculus turbinata))和骆驼蓬属(Peganum)。
在一些实施方案中,植物来自棕榈目(Arecales),并且选自椰子属(例如椰子[Cocus nucifera])。
在一些实施方案中,植物来自杜鹃花目(Ericales),并且选自杜茎山属(Maesa)。
在一些实施方案中,所述植物来自龙胆目(Gentianales),并且选自来自以下属的组中:夹竹桃属(例如夹竹桃(Nerium oleander))、秦艽属(例如大叶秦艽(Gentianamacrophylla straminea))、长春花属(例如长春花(Catharanthus roseus))、萝芙藤属(Rauwolfia)和金鸡纳树属(Cinchona)。
在一些实施方案中,植物来自毛茛目(Ranunculales),并且选自以下属:黑种草属(例如,家黑种草(Nigella sativa))、罂粟属(Papaver)、花菱草属(例如,花菱草(Eschscholtzia californica))、黄连属(Coptis)、小檗属(Berberis),以及唐松草属(Thalictrum)。
在一些实施方案中,植物来自姜目(Zingiberales),并且选自闭鞘姜属(例如闭鞘姜(Cheilocostus speciosus)。
在一些实施方案中,植物来自虎耳草目(Saxifragales),并且选自伽蓝菜属(例如大叶落地生根(Kalanchoe daigremontiana)。
在一些实施方案中,植物来自鼠李目(Vitales),并且选自葡萄属(例如葡萄[Vitis vinifera])。
在一些实施方案中,植物来自松柏目(Pinales),并且选自红豆杉属(例如,短叶红豆杉(Taxus brevifolia)、欧洲红豆杉(Taxus baccdata)、东北红豆杉(Taxuscuspidata)、加拿大红豆杉(Taxus canadensis)、佛罗里达紫衫(Taxus floridana))。
在一些实施方案中,植物来自山茱萸目(Cornales),并且选自喜树属(例如喜树(Camptotheca acuminata)。在一些实施方案中,植物来自天门冬目(Asparagales),并且选自龙舌兰属(例如美洲龙舌兰(Agave americana)、狐尾龙舌兰(Agave attenuata)、蓝色龙舌兰(Agave tequilana))、天门冬属(例如芦笋(Asparagus officinalis)),或丝兰属(例如凤尾丝兰(Yucca filamentosa))。在一些实施方案中,植物来自薯蓣目,并且选自纹果薯蓣属(Borderea)、薯蓣属(Dioscorea)、丝柄薯蓣属(Epipetrum)、闭果薯蓣属(Rajania)、多子薯蓣属(Stenomeris)或浆果薯蓣属(Tamus)。在一些实施方案中,植物来自百合目(Liliales),并且选自百合科(例如,北方七筋姑(Clintonia borealis)、开瓣豹子花(Nomocharis aperta)、蝴蝶百合(Calochortus catalinae)、披针叶扭柄花(Streptopuslariceolatus)。
所属领域中的技术人员应理解,可以通过许多不同的技术来完成植物育种,这些技术各种各样,从简单地选择具有所需繁殖特性的植物到利用遗传学和染色体知识的方法,再到更复杂的分子技术。
所属领域中的技术人员应理解,术语“杂交植物”可以涵盖通过使两种目的植物杂交,通过种子或组织繁殖然后生长所述植物而产生的植物。当植物性杂交时,授粉步骤可以包含异花授粉或自花授粉或与未转化植物或另一种转化植物回交。杂种植物包含第一代和后代植物。
生物活性
在一些实施方案中,遗传修饰的细胞或遗传修饰的植物包含内源酶,所述内源酶具有与至少一种异源基因所编码的酶相同或相似的活性。在其他实施方案中,遗传修饰的细胞或遗传修饰的植物不包含内源酶,所述内源酶具有与至少一种异源基因所编码的酶相同或相似的活性。在一些实施方案中,遗传修饰的植物细胞或植物包含内源酶,所述内源酶包含甾体生物碱、甾体皂苷或三萜皂苷生物合成酶的改变活性。
在一些实施方案中,与内源皂苷β-香树素合酶、细胞色素P450、糖基转移酶、酰基转移酶、葡萄糖苷酰转移酶或CSLG蛋白相比,存在于遗传修饰的细胞或遗传修饰的植物内、被异源基因编码的至少一种皂苷β-香树素合酶、细胞色素P450、糖基转移酶、酰基转移酶、葡萄糖苷酰转移酶或CSLG或其组合的生物活性被改变。在一些实施方案中,与存在于未遗传修饰的细胞或未遗传修饰的植物内的内源皂苷β-香树素合酶、细胞色素P450、糖基转移酶、酰基转移酶、葡萄糖苷酰转移酶或CSLG蛋白相比,至少一种内源皂苷β-香树素合酶、细胞色素P450、糖基转移酶、酰基转移酶、葡萄糖苷酰转移酶或CSLG或其组合的生物活性被改变。
所属领域中的技术人员应认识到,术语“生物活性”是指与可以通过测定法测量的蛋白质相关的任何活性。在一些实施方案中,皂苷β-香树素合酶、细胞色素P450、糖基转移酶、酰基转移酶、葡萄糖苷酰转移酶或CSLG的生物活性包含细胞或植物中甾体生物碱、其衍生物、其代谢物或其生物合成中间体;甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或三萜皂苷、其衍生物、其代谢物或其生物合成中间体的合成中所必需的酶活性。在一些实施方案中,皂苷β-香树素合酶、细胞色素P450、糖基转移酶、酰基转移酶、葡萄糖苷酰转移酶或CSLG的生物活性影响以下物质在至少植物一部分中的含量:甾体生物碱、其衍生物、其代谢物或其生物合成中间体;甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或三萜皂苷、其衍生物、其代谢物或其生物合成中间体。在一些实施方案中,改变的生物活性包含增加的酶活性。在一些实施方案中,改变的生物活性包含降低的酶活性。在一些实施方案中,改变的生物活性包含增加的多肽稳定性。在一些实施方案中,改变的生物活性包含降低的多肽稳定性。在一些实施方案中,改变的生物活性包含表达增加,进而引发更高浓度的酶多肽。在一些实施方案中,改变的生物活性包含酶多肽的表达减少。
在一些实施方案中,与对照酶相比,酶的生物学活性被改变。
在一些实施方案中,改变的生物学活性包含:(a)皂苷β-香树素合酶、细胞色素P450、糖基转移酶、酰基转移酶、葡萄糖苷酰转移酶或CSLG的酶活性增加;或皂苷β-香树素合酶、细胞色素P450、糖基转移酶、酰基转移酶、葡萄糖苷酰转移酶或CSLG的稳定性增加;或皂苷β-香树素合酶、细胞色素P450、糖基转移酶、酰基转移酶、葡萄糖苷酰转移酶或CSLG的酶活性降低;或皂苷β-香树素合酶、细胞色素P450、糖基转移酶、酰基转移酶、葡萄糖苷酰转移酶或CSLG的稳定性降低。
在一些实施方案中,皂苷β-香树素合酶、细胞色素P450、糖基转移酶、酰基转移酶、葡萄糖苷酰转移酶或CSLG的生物活性增加。在一些实施方案中,皂苷β-香树素合酶、细胞色素P450、糖基转移酶、酰基转移酶、葡萄糖苷酰转移酶或CSLG的生物活性降低。在一些实施方案中,皂苷β-香树素合酶、细胞色素P450、糖基转移酶、酰基转移酶、葡萄糖苷酰转移酶或CSLG的稳定性提高。在一些实施方案中,皂苷β-香树素合酶、细胞色素P450、糖基转移酶、酰基转移酶、葡萄糖苷酰转移酶或CSLG的稳定性降低。
在一些实施方案中,与所述遗传修饰的细胞或遗传修饰的植物内的内源酶(如有)的生物活性相比,改变的生物学活性包含:至少一种皂苷β-香树素合酶、细胞色素P450、糖基转移酶、酰基转移酶、葡萄糖苷酰转移酶或CSLG的酶活性增加;或至少一种皂苷β-香树素合酶、细胞色素P450、糖基转移酶、酰基转移酶、葡萄糖苷酰转移酶或CSLG的稳定性增加;或至少一种皂苷β-香树素合酶、细胞色素P450、糖基转移酶、酰基转移酶、葡萄糖苷酰转移酶或CSLG的酶活性降低;或至少一种皂苷β-香树素合酶、细胞色素P450、糖基转移酶、酰基转移酶、葡萄糖苷酰转移酶或CSLG的稳定性降低。
转基因植物、转基因酵母、转基因藻类、转基因昆虫细胞、转基因细菌
可以通过所属领域中的技术人员已知的任何方法来克隆编码至少一种异源基因所编码的酶的多核苷酸,其中所述酶包含至少一种皂苷β-香树素合酶、细胞色素P450、糖基转移酶、酰基转移酶、葡萄糖苷酰转移酶或CSLG。可以通过所属领域中的技术人员已知的任何方法来克隆编码本文的至少一种皂苷β-香树素合酶、细胞色素P450、糖基转移酶、酰基转移酶、葡萄糖苷酰转移酶或CSLG的多核苷酸。在某些实施方案中,克隆编码CSLG酶的多核苷酸。各种DNA构建体可用于在所需细胞或有机体中表达所需基因。在一些实施方案中,各种DNA构建体用于在细胞中表达CSLG基因。在一些实施方案中,各种DNA构建体用于在植物细胞、酵母细胞、昆虫细胞、藻细胞或细菌中表达CSLG基因。在一些实施方案中,各种DNA构建体用于在植物细胞中表达CSLG基因。在一些实施方案中,各种DNA构建体用于在酵母细胞中表达CSLG基因。在一些实施方案中,各种DNA构建体用于在植物细胞或酵母细胞中表达CSLG基因。在一些实施方案中,各种DNA构建体用于在藻细胞中表达CSLG基因。在一些实施方案中,各种DNA构建体用于在昆虫细胞中表达CSLG基因。在一些实施方案中,各种DNA构建体用于在细菌中表达CSLG基因。在一些实施方案中,各种DNA构建体用于在细胞中表达异源CSLG基因。在一些实施方案中,当细胞是植物细胞时,CSLG基因是异源基因。在一些实施方案中,当细胞是植物细胞时,CSLG基因是同源基因,其中所述表达被改变,例如增加或减少,或所述CSLG基因被突变以改变CSLG酶的活性。在一些实施方案中,当细胞是植物细胞时,所述植物细胞包含在植物或植物部分内。
根据某些实施方案,基因可以包含表达载体的一部分,所述表达载体包含用于表达该基因或任选调节组合的所有必需元件。
根据某些实施方案,表达由组成型启动子控制。根据其他实施方案,表达由瞬时启动子控制。根据某些实施方案,组成型启动子对细胞或植物或植物组织具备特异性。根据一些实施方案,组织特异性启动子选自根、块茎、叶和果实特异性启动子。例如Martinez,E.等人,2003,《当代生物学》(Curr.Biol.),第13期:第1435-1441页中描述了根特异性启动子。Estornell L.H等人,2009,《植物生物技术杂志》(Plant Biotechnol.J.)第7期:第298-309页以及Fernandez A.I等人,2009,《植物生理学》(Plant Physiol.)第151期:第1729-1740页中描述了果实特异性启动子。例如Rocha-Sosa M等人,1989,《欧洲分子生物学学会会刊》(EMBO J.)第8期:第23-29页;McKibbin R.S.等人,2006,《植物生物技术杂志》(PlantBiotechnol J.)第4(4)期:第409-18页中描述了块茎特异性启动子。例如Yutao Yang、Guodong Yang、Shijuan Liu、Xingqi Guo和Chengchao Zheng,《中国科学C辑:生命科学》(Science in China Series C:Life Sciences)第46期:第651-660页中描述了叶特异性启动子。相应地,在一些实施方案中,启动子包含酵母特异性启动子。相应的,在一些实施方案中,启动子包含藻类特异性启动子。
根据某些实施方案,表达载体还包含3'非编码序列处的调节元件。本文所用的“3'非编码序列”是指位于编码序列下游的DNA序列,并且包括聚腺苷酸化识别序列以及编码能够影响mRNA加工或基因表达的调节信号的其他序列。聚腺苷酸化信号通常特征在于影响向mRNA前体的3'末端添加聚腺苷酸节段。对于植物,Ingelbrecht I L等人(1989,《植物细胞》(Plant Cell)第1期:第671-680页)中举例说明了使用不同的3'非编码序列。
所属领域中的领域技术人员应理解,本文的核酸序列和转化载体的各种组分可操作地连接,从而引发所述核酸或核酸节段的表达。可操作地连接本文的构建体和载体组分的技术是所属领域中的技术人员所公知的。此类技术包括使用接头,例如合成接头,例如包括一个或多个限制酶位点。
所属领域中的技术人员应了解,术语“可操作地连接”可以涵盖单个核酸节段上的核酸序列的联合,从而一者的功能被另一者调节。例如,当启动子能够调节编码序列的表达(即,此编码序列在此启动子的转录控制之下)时,此启动子与此编码序列可操作地连接。编码序列可以以有义或反义定向可操作地连接到调节序列。
根据本文公开的教导的用于转化植物的方法是所属领域中的技术人员已知的。本文所用术语“转化”描述以下过程:外来DNA例如DNA构建体,包括表达载体,进入受体细胞并且将其改变为经转化、遗传改变的或转基因的细胞。转化可以是稳定的,其中核酸序列被整合到有机体基因组中,并且因此代表稳定和遗传的性状,或是瞬时的,其中核酸序列由转化的细胞表达但不整合到基因组中,并且因此而代表暂态的形状。根据一些实施方案,本文公开的核酸序列被稳定地转化到细胞中。
所述经遗传改变的细胞或植物具有改变含量的至少一种皂苷β-香树素合酶、细胞色素P450、糖基转移酶、酰基转移酶、葡萄糖苷酰转移酶或CSLG;以及改变含量的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体。在一些实施方案中,通常首先基于基因或蛋白质的表达来选择本文所述生成的遗传修饰的细胞或植物。表达由至少一种由异源基因编码的酶的细胞或植物可以被识别出,然后分析以下物质的含量:至少一种皂苷β-香树素合酶、细胞色素P450、糖基转移酶、酰基转移酶、葡萄糖苷酰转移酶或CSLG;以及/或至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或三萜皂苷、其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,首先基于基因或蛋白质的表达而选择根据本文所述教导而具有改变含量的以下所需物质的遗传改变的植物:至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体。然后分析基因或蛋白质表达增强或异常的植物中以下物质的含量:至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体。在一些实施方案中,甾体生物碱的衍生物、甾体皂苷的衍生物或三萜皂苷的衍生物分别包含甾体生物碱的糖基化衍生物、甾体皂苷的糖基化衍生物或三萜皂苷的糖基化衍生物。
使用所属领域中的技术人员已知的标准分子遗传学方法来检测以下物质:至少一种皂苷β-香树素合酶、细胞色素P450、糖基转移酶、酰基转移酶、葡萄糖苷酰转移酶或CSLG;以及/或至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或三萜皂苷、其衍生物、其代谢物或其生物合成中间体。类似地,使用所属领域中的技术人员已知的标准分子遗传学或蛋白质化学方法来纯化和/或检测以下物质:至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或三萜皂苷、其衍生物、其代谢物或其生物合成中间体。
为了测量基因,应该从表达核酸的细胞或植物获得cDNA或mRNA。可以在检测步骤之前对样品做进一步处理。例如,细胞或组织样品中的多核苷酸可以与样品中的其他组分分离、可以扩增等。从有机体获得的所有样品,包含经过任何类型的进一步处理的样品,均被认为是从所述有机体获得的。
为了测量基因或沉默分子的表达,应从表达核酸的器官获得cDNA或mRNA。可以在检测步骤之前对样品做进一步处理。例如,细胞或组织样品中的多核苷酸可以与样品中的其他组分分离、可以扩增等。从有机体获得的所有样品,包含经过任何类型的进一步处理的样品,均被认为是从所述有机体获得的。
在一些实施方案中,基因的检测需要扩增从候选遗传修饰的细胞或遗传修饰的植物或其部分中获得的多核苷酸。在一些实施方案中,植物部分包含植物部分或植物组织。
DNA扩增的方法是所属领域中的技术人员已知的。用于DNA扩增的最常用方法是PCR(聚合酶链式反应;参见例如“PCR基础知识:从背景到实践”(PCR Basics:frombackground to Bench),《施普林格》(Springer Verlag),2000;Eckert等人,1991,《PCR方法和应用》(PCR Methods and Applications),1:17)。其他适当的扩增方法包括连接酶链式反应(LCR)、转录扩增和自我维持序列复制以及基于核酸的序列扩增(NASBA)。
根据某些实施方案,包含至少一种皂苷β-香树素合酶、细胞色素P450、糖基转移酶、酰基转移酶、葡萄糖苷酰转移酶或CSLG,或其任何组合的核酸序列在至少一些实施方案中可以还包含编码可选择标志物的核酸序列。根据某些实施方案,所述可选择标志物赋予对抗生素或除草剂的抗性;在这些实施方案中,根据其对抗生素或除草剂的抗性来选择转基因细胞或植物。
育种
在一些实施方案中,可以使用转化技术,包括通过转基因编辑的育种、使用转基因、使用一种或多种基因的瞬时表达或使用分子标志物或其任何组合来对具有改变表达的植物进行育种。如果转化技术中需要使用组织培养物,则可以根据所属领域中的技术人员所共知的技术将被转化细胞再生为植物。然后可以使所再生的植物生长,并且使用常规育种技术与相同或不同的植物品种杂交以产生种子,然后在适当条件下对所述种子进行选择。
甾体生物碱和/或甾体皂苷的含量如下文所举例说明并且所属领域中的技术人员已知的方法来进行测量。
在一些实施方案中,与至少一种祖代植物相比,后代植物包含减少的抗营养含量或减少的毒性。在一些实施方案中,与至少一种祖代植物相比,后代植物包含对植物病原体、害虫或天敌的抵性得到改善。
在一些实施方案中,本文公开的植物包含来自上一节中示出的任何植物目的作物植物。在一些实施方案中,本文所公开的植物包含禾本目(Poales)、石竹目(Caryophyllales)、茄目(Solanales)、豆目(Fabales)、锦葵目(Malvales)、伞形目(Apiales)、十字花目(Brassicales)、天门冬目(Asparagales)、薯蓣目(Dioscoreales)或百合目(Liliales)的作物植物。
在一些实施方案中,当植物包含禾本目(Poales)的作物植物时,所述植物选自稻属(Oryza)、大麦属(Hordeum)、燕麦属(Avena)和小麦属(Triticum)。
在一些实施方案中,当植物包含石竹目(Caryophyllales)的作物植物时,所述植物选自以下属:菠菜属、藜属、甜菜属、大黄属、麦蓝菜属、肥皂草属和石头花属。在一些实施方案中,石竹目植物选自菠菜、甜菜根和奎藜籽。
在一些实施方案中,当植物包含茄目(Solanales)的作物植物时,所述植物选自以下属:茄属、辣椒属、烟草属、莨菪属、曼陀罗属和颠茄属。在一些实施方案中,当植物是茄目(Solanales)的作物植物时,所述植物选自以下:番茄(Solanum lycopersicum)、潘那利番茄(Solanum pennellii)、马铃薯(Solanum tuberosum)、查科茄(Solanum chacoense)、辣椒(Capsicum annuum)、茄子(Solanum melongena)、欧白英(Solanum dulcamara)和本塞姆氏烟草(Nicotiana benthamiana)。在一些实施方案中,茄目植物选自以下:地樱桃、茄子、马铃薯、番茄、胡椒、甜椒、卡宴辣椒、红辣椒、甘椒、塔巴斯科辣椒、烟草和南蛇藤。在一些实施方案中,茄目植物包含茄科植物。
在一些实施方案中,当植物为豆目(Fabales)的作物植物时,所述植物选自以下属:甘草属、苜蓿属、大豆属、百脉根属、鹰嘴豆属、菜豆属、豌豆属、花生属、羽扇豆属和金合欢属。在一些实施方案中,豆目植物选自紫苜蓿、大豆、百脉根和甘草。
在一些实施方案中,当植物是锦葵目(Malvales)的作物植物时,所述植物选自可可属。
在一些实施方案中,当植物为伞形目(Apiales)的作物植物时,所述植物选自以下属:胡萝卜属、芹属、香芹菜属、人参属、柴胡属、常春藤属和积雪草属。
在一些实施方案中,当植物为十字花目(Brassicales)的作物植物时,所述植物选自以下属:拟南芥属、芸苔属、山柑属和番木瓜属。
在一些实施方案中,植物是本文公开的任何目、科、属或种的作物植物。
所属领域中的技术人员应理解,可以通过许多不同的技术来完成植物育种,这些技术各种各样,从简单地选择具有所需繁殖特性的植物到利用遗传学和染色体知识的方法,再到更复杂的分子技术。
所属领域中的技术人员应理解,术语“杂交植物”可以涵盖通过使两种目的植物杂交,通过种子或组织繁殖然后生长所述植物而产生的植物。当植物性杂交时,授粉步骤可以包括异花授粉或自花授粉或与未转化植物或另一种转化植物回交。杂种植物包括第一代和后代植物。本文公开一种操纵和改善植物性状的方法,例如在非限制性实施例中:增加植物抗性、减少植物中的抗营养物特性、减少植物中的毒性或苦味化合物、增加植物中的药物特性,或其任何组合。
生物标志物
所属领域中的技术人员应理解,术语“生物标志物”包括存在于有机体中、且其存在指示所关注的生物学状态或状况的任何可测量物质。在一些实施方案中,生物标志物的存在指示目标化合物或一组目标化合物的存在。在一些实施方案中,生物标志物的浓度指示目标化合物或一组目标化合物的浓度。在一些实施方案中,生物标志物的浓度指示有机体表型。
CSLG酶在本文中特此公开为在许多植物中发现的甾体生物碱、甾体皂苷和三萜皂苷的生物合成中具有重要作用。因此,在一些实施方案中,CSLG的表达水平指示植物生成甾体生物碱、其衍生物、其代谢物或其生物合成中间体;甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或三萜皂苷、其衍生物、其代谢物或其生物合成中间体;或其组合的能力。
生成甾体生物碱、甾体皂苷和三萜皂苷的方法
本文提供在包含遗传修饰的植物细胞中,或在包含遗传修饰的植物细胞的植物中,或在包含遗传修饰的植物部分的植物部分中生产甾体生物碱、甾体皂苷或三萜皂苷的方法,所述方法包含:将多核苷酸序列引入所述细胞中,其中所述多核苷酸序列任选地包含在载体中,其中所述多核苷酸序列包含编码酶的至少一种异源基因,所述酶选自皂苷β-香树素合酶、细胞色素P450、糖基转移酶、酰基转移酶、UDP-葡萄糖6-脱氢酶1或纤维素合酶样G(CSLG);以及在所述细胞中表达所述至少一种异源基因。在一些实施方案中,所引入的多核苷酸序列包含多个多核苷酸序列,其中每个多核苷酸序列包含编码酶的至少一种异源基因,所述酶选自以下:皂苷β-香树素合酶、细胞色素P450、糖基转移酶、酰基转移酶、UDP-葡萄糖6-脱氢酶1以及纤维素合酶样G(CSLG)。在一些实施方案中,所引入的多核苷酸序列包含2、3、4、5、6、7、8、9、10个或更多个多核苷酸序列,每个多核苷酸序列包含编码酶的至少一种异源基因,所述酶选自以下:皂苷β-香树素合酶、细胞色素P450、糖基转移酶、酰基转移酶、UDP-葡萄糖6-脱氢酶1及其任何组合。在一些实施方案中,所引入的多核苷酸序列包含2、3、4、5、6、7、8、9、10个或更多个多核苷酸序列,每个多核苷酸序列仅包含编码酶的一种异源基因,所述酶选自以下:皂苷β-香树素合酶、细胞色素P450、糖基转移酶、酰基转移酶、UDP-葡萄糖6-脱氢酶1以及纤维素合酶样G(CSLG)。在一些实施方案中,所引入的多核苷酸序列包含2、3、4、5、6、7、8、9、10个或更多个多核苷酸序列,每个多核苷酸序列包含编码酶的1、2、3、4、5、6、7、8、9或10种或更多种异源基因的其任何组合,所述酶选自以下:皂苷β-香树素合酶、细胞色素P450、糖基转移酶、酰基转移酶、UDP-葡萄糖6-脱氢酶1以及纤维素合酶样G(CSLG)。所属领域中的技术人员应理解,将一个或多个多核苷酸序列引入表达该多核苷酸序列的细胞中,从而致使在遗传修饰的细胞中表达一种或多种编码的酶。
根据一些实施方案,本文公开一种在遗传修饰的细胞中生产甾体生物碱、甾体皂苷或三萜皂苷的方法,所述方法包含:
(a)将至少一种异源基因引入所述细胞中,所述至少一种异源基因编码纤维素合酶样G(CSLG)酶,其中所述异源基因任选地包含在载体中;以及
(b)在所述细胞中表达所述至少一种异源基因;
其中所述细胞包含与相应的未修饰的细胞相比,含量增加的至少一种甾体生物碱、至少一种甾体皂苷或至少一种三萜皂苷。
在一些实施方案中,所述引入还包含将至少一种其他异源基因引入所述细胞中,所述异源基因选自编码皂苷β-香树素合酶、细胞色素P450、糖基转移酶、酰基转移酶和UDP-葡萄糖6-脱氢酶1或其任何组合的组,其中所述至少一种其他异源基因任选地包含在载体中;并且还包含在所述细胞中表达所述至少一种其他异源基因。在一些实施方案中,所述至少一种异源基因可操作地连接到启动子、转录终止序列或其组合;或所述至少一种其他异源基因可操作地连接到启动子、转录终止序列;或(a)和(b)的其组合。
在一些实施方案中,所述引入包含用以下来转化所述至少一种细胞:所述至少一种异源基因或编码所述至少一种异源基因的多核苷酸序列,或包含所述至少一种异源基因的载体;或所述至少一种其他异源基因或编码所述至少一种其他异源基因的多核苷酸序列,或包含所述至少一种其他异源基因的载体;或(a)和(b)的其组合;其中所述表达包含瞬时表达或组成型表达。
编码CSLG酶的纤维素合酶样G核酸序列在全文中详细描述,并在实施例中举例说明。在一些实施方案中,编码所述至少一种异源CSLG基因的核酸序列在SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101、103或105中的任一;或与SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101、103或105中的任一所示的其核酸序列具有至少55%的同一性和至少55%的覆盖度的其同源物中示出。编码CSLG酶的纤维素合酶样G核酸序列在全文中详细描述,并在实施例中举例说明。在一些实施方案中,编码所述至少一种异源CSLG基因的核酸序列在SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101、103或105中的任一;或与SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101、103或105中的任一所示的其核酸序列具有至少55%的同一性和至少80%的覆盖度的其同源物中示出。
编码CSLG酶的纤维素合酶样G核酸序列在全文中详细描述,并在实施例中举例说明。在一些实施方案中,编码所述至少一种异源CSLG基因的核酸序列在SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101、103或105中的任一;或与SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101、103或105中的任一所示的其核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出。
在一些实施方案中,在生成三萜皂苷的方法中,所述被编码的CSLG酶的氨基酸序列在SEQ ID NO:31、33、35、37、39、41、66、81、94、96、98、100、102或104中的任一;或与SEQID NO:31、33、35、37、39、41、66、81、94、96、98、100、102或104中的任一所示的氨基酸序列具有至少55%的同一性和至少55%的覆盖度的其同源物中示出。在一些实施方案中,在生成三萜皂苷的方法中,所述被编码的CSLG酶的氨基酸序列在SEQ ID NO:31、33、35、37、39、41、66、81、94、96、98、100、102或104中的任一;或与SEQ ID NO:31、33、35、37、39、41、66、81、94、96、98、100、102或104中的任一所示的氨基酸序列具有至少55%的同一性和至少80%的覆盖度的其同源物中示出。
在一些实施方案中,在生成三萜皂苷的方法中,所述被编码的CSLG酶的氨基酸序列在SEQ ID NO:31、33、35、37、39、41、66、81、94、96、98、100、102或104中的任一;或与SEQID NO:31、33、35、37、39、41、66、81、94、96、98、100、102或104中的任一所示的氨基酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出。
如本文实施例中所述,将GAME蛋白GAME1和GAME4用作马铃薯或番茄中的饵。与GAME1或GAME4共表达的基因显示在表5-8中,甾体生物碱途径的酶以及甾体皂苷途径的部分酶示于图1中,并在全文中详细描述并且在实施例中举例说明。图20A中呈现的分别编码三萜皂苷途径的SOAP酶的SOAP核酸序列在全文中进行了详细描述,并在实施例中进行了举例说明。
在一些实施方案中,在生产甾体生物碱、甾体皂苷或三萜皂苷的方法中,编码所述至少一种其他异源基因的所述核酸序列编码:β-香树素合酶,所述核酸序列在SEQ ID NO:45;或与SEQ ID NO:45所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;或细胞色素P450,所述核酸序列在SEQ ID NO:46、51或53中的任一;或与SEQID NO:46、51或53中的任一所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;或糖基转移酶,所述核酸序列在SEQ ID NO:55、57、59或61中的任一;或与SEQ ID NO:55、57、59或61中的任一所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;或酰基转移酶,所述核酸序列在SEQ ID NO:63;或与SEQ ID NO:63所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;或UDP-葡萄糖6-脱氢酶1,所述核酸序列在SEQ ID NO:74;或与SEQ ID NO:74所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;或其任何组合。
在一些实施方案中,在生产甾体生物碱、甾体皂苷或三萜皂苷的方法中,所述被编码的至少一种其他异源基因的氨基酸序列编码:β-香树素合酶,所述氨基酸序列在SEQ IDNO:48;或与SEQ ID NO:48所示的氨基酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;或细胞色素P450,所述氨基酸序列在SEQ ID NO:49、52或54中的任一;或与SEQ ID NO:49、52或54中的任一所示的氨基酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;或糖基转移酶,所述氨基酸序列在SEQ ID NO:56、58、60或62中的任一;或与SEQ ID NO:56、58、60或62中的任一所示的氨基酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;或酰基转移酶,所述氨基酸序列在SEQ ID NO:64;或与SEQ ID NO:64所示的氨基酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;或UDP-葡萄糖6-脱氢酶1,所述氨基酸序列在SEQ ID NO:75;或与SEQ IDNO:75所示的氨基酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;或其任何组合。
在一些实施方案中,在生成甾体生物碱或甾体皂苷的方法中,所述甾体生物碱或甾体皂苷包含抗营养剂、美容剂或药剂或其任何组合。在一些实施方案中,在生成甾体生物碱或甾体皂苷的方法中,所述甾体生物碱或甾体皂苷选自抗营养剂、美容剂或药剂或其任何组合。
在一些实施方案中,在生成三萜皂苷的方法中,所述三萜皂苷包含:甜味剂、发泡剂、乳化剂、防腐剂、抗癌剂、降血胆固醇制剂、抗炎剂、抗氧化剂、生物佐剂、杀菌剂、杀虫剂、拒食剂、抗真菌剂,或其任何组合。在一些实施方案中,在生成三萜皂苷的方法中,所述三萜皂苷选自:甜味剂、发泡剂、乳化剂、防腐剂、抗癌剂、降血胆固醇制剂、抗炎剂、抗氧化剂、生物佐剂、杀菌剂、杀虫剂、拒食剂、抗真菌剂,或其任何组合。
在一些实施方案中,在生成甾体生物碱的方法中,所述甾体生物碱包含:α-番茄素、番茄碱、α-查茄碱、α-茄碱、α-澳洲茄碱、α-澳洲茄边碱,或其任何组合。在一些实施方案中,在生成甾体生物碱的方法中,所述甾体生物碱选自以下:α-番茄素、番茄碱、α-查茄碱、α-茄碱、α-澳洲茄碱、α-澳洲茄边碱,或其任何组合。
在一些实施方案中,在生成甾体皂苷的方法中,所述甾体皂苷包含龙葵皂苷B、番茄甙或其任何组合。在一些实施方案中,在生成甾体生物碱的方法中,所述甾体生物碱选自以下:龙葵皂苷B、番茄甙或其任何组合。
在一些实施方案中,在生成三萜皂苷的方法中,所述三萜皂苷包含:苜蓿酸3-O-葡萄糖醛酸苷(MA-3-GlcA)(化合物6)、化合物7、化合物8、化合物9、化合物10、化合物11、甘草皂苷(化合物14)、甘草次酸3-O-单葡萄糖醛酸苷(化合物15)、巴约甙元(化合物25)、巴约甙元-hexA-hex-hex(化合物31)、瓜瓶藤酸(化合物26)、瓜瓶藤酸-hexA-hex(化合物32)、大豆甾醇A(化合物29)、大豆皂醇B(化合物30)、大豆甾醇A-hexA-hex-pent(化合物34)、大豆皂苷VI(化合物35)、甜菜甙IV(化合物33)、常春藤苷配基-3GlcA、丝石竹皂苷配基-3GlcA、丝石竹酸-3GlcA或QS-21佐剂,或其任何组合。在一些实施方案中,在生成三萜皂苷的方法中,所述三萜皂苷选自:苜蓿酸3-O-葡萄糖醛酸苷(MA-3-GlcA)(化合物6)、化合物7、化合物8、化合物9、化合物10、化合物11、甘草皂苷(化合物14)、甘草次酸3-O-单葡萄糖醛酸苷(化合物15)、巴约甙元(化合物25)、巴约甙元-hexA-hex-hex(化合物31)、瓜瓶藤酸(化合物26)、瓜瓶藤酸-hexA-hex(化合物32)、大豆甾醇A(化合物29)、大豆皂醇B(化合物30)、大豆甾醇A-hexA-hex-pent(化合物34)、大豆皂苷VI(化合物35)、甜菜甙IV(化合物33)、常春藤苷配基-3GlcA、丝石竹皂苷配基-3GlcA、丝石竹酸-3GlcA或QS-21佐剂,或其任何组合。
在一些实施方案中,甾体生物碱的衍生物、甾体皂苷的衍生物或三萜皂苷的衍生物分别包含甾体生物碱的糖基化衍生物、甾体皂苷的糖基化衍生物或三萜皂苷的糖基化衍生物。
在一些实施方案中,在生产甾体生物碱、甾体皂苷或三萜皂苷的方法中,所述细胞包含植物细胞、酵母细胞、藻细胞、昆虫细胞或细菌。在一些实施方案中,在生产甾体生物碱、甾体皂苷或三萜皂苷的方法中,所述细胞包含植物细胞、酵母细胞或藻细胞。在一些实施方案中,在生产甾体生物碱、甾体皂苷或三萜皂苷的方法中,所述细胞包含植物细胞或酵母细胞。在一些实施方案中,在生产甾体生物碱、甾体皂苷或三萜皂苷的方法中,所述细胞包含植物细胞。在一些实施方案中,在生产甾体生物碱、甾体皂苷或三萜皂苷的方法中,所述细胞包含酵母细胞。在一些实施方案中,在生产甾体生物碱、甾体皂苷或三萜皂苷的方法中,所述细胞包含藻细胞。在一些实施方案中,在生产甾体生物碱、甾体皂苷或三萜皂苷的方法中,所述细胞包含昆虫细胞。在一些实施方案中,在生产甾体生物碱、甾体皂苷或三萜皂苷的方法中,所述细胞包含细菌。
在一些实施方案中,至少一种异源基因可操作地连接到启动子、转录终止序列或其组合。
在一些实施方案中,引入步骤包含用所述多核苷酸序列或包含所述多核苷酸序列的载体转化所述至少一种细胞,并且其中所述表达包含瞬时表达或组成型表达。在一些实施方案中,所述载体包含表达载体。在一些实施方案中,所述载体包含含量质粒载体。在一些实施方案中,载体整合到宿主细胞DNA中。在一些实施方案中,包含在载体内的多核苷酸的一部分整合到宿主细胞DNA中。在一些实施方案中,载体不整合到宿主细胞DNA中并且作为宿主细胞内的单独实体复制。
在一些实施方案中,用于生成遗传修饰的植物细胞的表达载体包括土壤杆菌属载体和非土壤杆菌属载体。土壤杆菌介导的基因转移利用了根癌土壤杆菌将DNA转移到植物染色体中的天然能力,详见G.Gheysen、G.Angenon和M.Van Montagu,1998年,“土壤杆菌介导的植物转化:具备重大应用价值的科学有趣故事”(Agrobacterium-mediated planttransformation:a scientifically intriguing story with significantapplications),K.Lindsey(编辑),《转基因植物研究》(Transgenic Plant Research),Harwood Academic Publishers,阿姆斯特丹,第1-33页中;以及H.A.Stafford(2000),《植物学评论》(Botanical Review)第66期:第99-118页中。第二类转化方法是非土壤杆菌介导的转化,这些方法被称为直接基因转移法。P.Barcelo和P.A.Lazzeri(1998)“直接基因转移:化学、电和物理方法”(Direct gene transfer:chemical,electrical and physicalmethods),K.Lindsey(编辑),《转基因植物研究》(Transgenic Plant Research),HarwoodAcademic Publishers,阿姆斯特丹,第35-55页中进行了概述。方法包括粒子枪递送、显微注射、完整细胞电穿孔、聚乙二醇介导的原生质体转化、原生质体的电穿孔、脂质体介导的转化、硅须晶介导的转化等。适当的对照植物应包括用于生成转基因植物的未经遗传改变或非转基因的亲本系植物。
可以通过用强毒性毛根土壤杆菌株进行转化,以获得遗传转化的毛状根培养物。用于建立毛状根培养物的方案以及植物物种对土壤杆菌感染的敏感性各不相同(Toivounen等人,1993;Vanhala等人,1995)。已知用于转化的土壤杆菌菌株对毛状根培养物中的根形态和次生代谢物累积的程度有很大的影响。可以通过系统克隆选择,例如通过原生质体,从单细胞来源的毛状根克隆中找到高产、稳定的克隆体。这是可能的,因为毛状根培养物具有巨大的体细胞克隆变异。另一种转化可能性是使用病毒载体(Turpen 1999)。
能够随后通过器官发生或胚胎发生进行克隆繁殖的任何植物组织或植物细胞可以使用目的表达载体来转化。术语“器官发生”是指从分生组织中心依次生长出芽和根的过程。术语“胚发生”是指芽和根以一致的方式(不是顺序方式)从体细胞或配子共同发育的过程。选择的特定组织将根据可用于且最适合于被转化的特定物种的克隆繁殖系统而变化。示例性的组织靶标包括原生质体、叶盘、花粉、胚、子叶、下胚轴、大配子体、愈伤组织、现有的分生组织(例如,顶端分生组织、腋芽和根分生组织)以及诱导的分生组织(例如,子叶分生组织和下胚轴分生组织)。
在一些实施方案中,本文公开了包含上述多核苷酸序列或编码酶的至少一种异源基因的载体。在一些实施方案中,本文公开的是宿主细胞,例如但不限于植物细胞、酵母或藻细胞,包含多核苷酸序列或上述编码酶的至少一种异源基因,或包含多核苷酸或全文的编码酶的至少一种异源基因的载体。
在某些实施方案中,术语“载体”涵盖能够输送与其可操作或连续连接的另一核酸分子的核酸分子。载体可以是任何适当类型,包括但不限于噬菌体、病毒、质粒、噬菌粒、粘粒、杆粒,甚至是人工染色体。某些载体能够在引入目的的宿主细胞中自主复制(例如,具有在宿主细胞中起作用的复制起始点的载体)。在将其他载体引入宿主细胞后,可以将其整合到宿主细胞的基因组中,从而与宿主基因组一起复制。此外,在一些实施方案中,载体能够引导某些目的基因的表达。此类载体在本文中称为“重组表达载体”(或简称为“表达载体”)。适当载体根据需要并根据特定宿主有机体(例如植物细胞、酵母细胞或藻细胞)具有调节序列,例如启动子、增强子、终止子序列等。
通常,根据本发明的重组载体包含“编码酶的至少一种异源基因”或“包含编码酶的至少一种异源基因的表达盒”。表达盒通常是DNA构建体,所述DNA构建体在一些实施方案中包括(在转录方向上的5'至3'):启动子区;多核苷酸序列,该多核苷酸序列包含上文详细描述的编码酶的至少一种异源基因、同源物、变体或节段,其与转录起始区域可操作性地连接;以及终止序列,所述终止序列包括RNA聚合酶的终止信号和聚腺苷酸化信号。应理解,所有这些区域都应该能够在待转化的生物细胞例如植物细胞或酵母细胞或藻细胞中起作用。包含转录起始区域的启动子区域,其优选地包含RNA聚合酶结合位点,以及聚腺苷酸化信号对于待转化的生物细胞可以是天然的,或可以衍生自替代来源,其中该区域在生物细胞中具备功能性。
本文所用的术语“重组宿主细胞”(“表达宿主细胞”、“表达宿主系统”、“表达系统”或简称为“宿主细胞”)涵盖已引入重组载体的细胞。应理解,这些术语不仅旨在指特定的对象细胞,而且还指该细胞的后代。因为由于突变或环境影响,某些修饰可能在后代中发生,因此该后代实际上可能与亲本细胞不同,但仍包括在本文所用的术语“宿主细胞”的范围内。重组宿主细胞可以是在培养物中生长的分离出的细胞或细胞系,或可以是存在于活组织或有机体中的细胞。宿主细胞可以是真菌、植物或藻类来源的。
在一些实施方案中,本文公开了用上述载体转化的转基因植物或其衍生细胞。
在一些实施方案中,在生产甾体生物碱、甾体皂苷或三萜皂苷的方法中,被编码的酶包含皂苷β-香树素合酶、细胞色素P450、糖基转移酶、酰基转移酶、UDP-葡萄糖6-脱氢酶1以及纤维素合酶样G(CSLG)。在一些实施方案中,在生产甾体生物碱、甾体皂苷或三萜皂苷的方法中,多种酶被异源基因编码,其中所述被编码的酶包含皂苷β-香树素合酶、细胞色素P450、糖基转移酶、酰基转移酶、UDP-葡萄糖6-脱氢酶1以及纤维素合酶样G(CSLG)的组合。在一些实施方案中,在生产甾体生物碱、甾体皂苷或三萜皂苷的方法中,1、2、3、4、5、6、7、8、9、10种或更多种酶被异源基因编码,其中被编码的酶包含皂苷β-香树素合酶、细胞色素P450、糖基转移酶、酰基转移酶、UDP-葡萄糖6-脱氢酶1以及纤维素合酶样G(CSLG)的组合。在一些实施方案中,在生产甾体生物碱、甾体皂苷或三萜皂苷的方法中,所述被编码的酶包含CSLG。
在一些实施方案中,细胞色素P450包含C2-羟化酶或是C-23氧化酶。在一些实施方案中,糖基转移酶包含果糖基转移酶、木糖基转移酶或UDP-糖基转移酶或其组合。在一些实施方案中,酰基转移酶包含苄醇乙酰基-、花色素苷-O-羟基-苯乙烯醛基-、邻氨基苯甲酸盐-N-羟基-苯乙烯醛基/苯甲酰基-、脱乙酰基温都林乙酰基转移酶(BAHD)酰基转移酶。在一些实施方案中,在生成三萜皂苷的方法中,被编码的细胞色素P4500包含C2-羟化酶或是C-23氧化酶,或其组合;所述糖基转移酶包含果糖基转移酶、木糖基转移酶或UDP-糖基转移酶或其组合;所述酰基转移酶包含苄醇乙酰基-、花色素苷-O-羟基-苯乙烯醛基-、邻氨基苯甲酸盐-N-羟基-苯乙烯醛基/苯甲酰基-、脱乙酰基温都林乙酰基转移酶(BAHD)酰基转移酶;或被编码的酶包含这些酶中任何一种的组合,其中任选地,额外的酶包含在一个或多个多核苷酸序列中。
在一些实施方案中,在生产甾体生物碱、甾体皂苷或三萜皂苷的方法中,所述至少一种异源基因的多核苷酸在SEQ ID NO:30、32、34、36、38、40、45、46、47、51、53、55、57、59、61、63、65、80、93、95、97、99、101、103或105中的任一示出;或所述至少一种异源基因的多核苷酸包含与SEQ ID NO:30、32、34、36、38、40、45、46、47、51、53、55、57、59、61、63、65、80、93、95、97、99、101、103或105中的任一所示的核酸序列具有至少55%的同一性的核酸序列。在表达多种异源基因的一些实施方案中,所属领域中的技术人员应理解,一个或多个多核苷酸序列可以包含SEQ ID NO:30、32、34、36、38、40、45、46、47、51、53、55、57、59、61、63、65、80、93、95、97、99、101、103或105中的任一的组合,如上文中详细描述。在表达多种异源基因的一些实施方案中,所属领域中的技术人员应理解,一个或多个多核苷酸序列可以包含与SEQ ID NO:30、32、34、36、38、40、45、46、47、51、53、55、57、59、61、63、65、80、93、95、97、99、101、103或105中的任一所示的核酸序列具有至少55%的同一性的核酸序列。
在一些实施方案中,在生产甾体生物碱、甾体皂苷或三萜皂苷的方法中,所述至少一种异源基因的多核苷酸在SEQ ID NO:30、32、34、36、38、40、45、46、47、51、53、55、57、59、61、63、65、80、93、95、97、99、101、103或105中的任一示出;或所述至少一种异源基因的多核苷酸包含与SEQ ID NO:30、32、34、36、38、40、45、46、47、51、53、55、57、59、61、63、65、80、93、95、97、99、101、103或105中的任一所示的核酸序列具有至少80%的同一性的核酸序列。在表达多种异源基因的一些实施方案中,所属领域中的技术人员应理解,一个或多个多核苷酸序列可以包含SEQ ID NO:30、32、34、36、38、40、45、46、47、51、53、55、57、59、61、63、65、80、93、95、97、99、101、103或105中的任一的组合,如上文中详细描述。在表达多种异源基因的一些实施方案中,所属领域中的技术人员应理解,一个或多个多核苷酸序列可以包含与SEQ ID NO:30、32、34、36、38、40、45、46、47、51、53、55、57、59、61、63、65、80、93、95、97、99、101、103或105中的任一所示的核酸序列具有至少80%的同一性的核酸序列。
在一些实施方案中,在生产甾体生物碱、甾体皂苷或三萜皂苷的方法中,所述至少一种异源基因的多核苷酸编码在SEQ ID NO:31、33、35、37、39、41、48、49、50、52、54、56、58、60、62、64、64、81、94、96、98、100、102或104中的任一所示的所述酶的氨基酸序列;或所述至少一种异源基因的多核苷酸编码与SEQ ID NO:31、33、35、37、39、41、48、49、50、52、54、56、58、60、62、64、64、81、94、96、98、100、102或104中的任一所示的氨基酸序列具有至少55%的同一性的所述酶的氨基酸序列。
在一些实施方案中,在生产甾体生物碱、甾体皂苷或三萜皂苷的方法中,所述至少一种异源基因的多核苷酸编码在SEQ ID NO:31、33、35、37、39、41、48、49、50、52、54、56、58、60、62、64、64、81、94、96、98、100、102或104中的任一所示的所述酶的氨基酸序列;或所述至少一种异源基因的多核苷酸编码与SEQ ID NO:31、33、35、37、39、41、48、49、50、52、54、56、58、60、62、64、64、81、94、96、98、100、102或104中的任一所示的氨基酸序列具有至少80%的同一性的所述酶的氨基酸序列。
在一些实施方案中,在生产甾体生物碱、甾体皂苷或三萜皂苷的方法中,遗传修饰的细胞,例如但不限于植物细胞、酵母或藻细胞,包含与相应的未修饰的细胞相比,含量增加的至少甾体生物碱、甾体皂苷或三萜皂苷。在一些实施方案中,在生产甾体生物碱、甾体皂苷或三萜皂苷的方法中,遗传修饰的细胞,例如但不限于植物细胞、酵母、藻细胞、昆虫细胞或细菌,包含与相应的未修饰的细胞相比,含量增加的至少甾体生物碱、甾体皂苷或三萜皂苷。在一些实施方案中,在生产甾体生物碱、甾体皂苷或三萜皂苷的方法中,遗传修饰的细胞包含植物细胞,所述植物细胞包含与相应的未修饰的细胞相比,含量增加的至少甾体生物碱、甾体皂苷或三萜皂苷。在一些实施方案中,在生产甾体生物碱、甾体皂苷或三萜皂苷的方法中,遗传修饰的细胞包含酵母细胞,所述酵母细胞包含与相应的未修饰的细胞相比,含量增加的至少甾体生物碱、甾体皂苷或三萜皂苷。在一些实施方案中,在生产甾体生物碱、甾体皂苷或三萜皂苷的方法中,遗传修饰的细胞包含藻细胞,所述藻细胞包含与相应的未修饰的细胞相比,含量增加的至少甾体生物碱、甾体皂苷或三萜皂苷。在一些实施方案中,在生产甾体生物碱、甾体皂苷或三萜皂苷的方法中,遗传修饰的细胞包含植物细胞,所述植物细胞包含与相应的未修饰的细胞相比,含量增加的至少甾体生物碱、甾体皂苷或三萜皂苷,其中所述植物细胞包含在植物或植物部分中。
在一些实施方案中,在生成甾体生物碱的方法中,所生产的甾体生物碱包含抗营养剂、美容剂或药剂或其任何组合;或甾体生物碱包含七叶皂苷或脱氢七叶皂苷;或甾体生物碱包含α-番茄素、番茄素、脱氢番茄素、α-查茄碱、α-茄碱、α-澳洲茄碱、α-澳洲茄边碱或其任何组合。在一些实施方案中,在生成甾体生物碱的方法中,所生成的甾体生物碱包含:α-番茄素、番茄素、脱氢番茄素、α-查茄碱、α-茄碱、α-澳洲茄碱、α-澳洲茄边碱,或其任何组合。
在一些实施方案中,在生成甾体生物碱的方法中,所生成的甾体生物碱包含α-番茄素。在一些实施方案中,在生成甾体生物碱的方法中,所生成的甾体生物碱包含番茄碱。在一些实施方案中,在生成甾体生物碱的方法中,所生成的甾体生物碱包含脱氢番茄素。在一些实施方案中,在生成甾体生物碱的方法中,所生成的甾体生物碱包含α-查茄碱。在一些实施方案中,在生成甾体生物碱的方法中,所生成的甾体生物碱包含α-茄碱。在一些实施方案中,在生成甾体生物碱的方法中,所生成的甾体生物碱包含α-澳洲茄碱。在一些实施方案中,在生成甾体生物碱的方法中,所生成的甾体生物碱包含α-澳洲茄边碱。
在一些实施方案中,在生成甾体皂苷的方法中,所生成的甾体皂苷包含抗营养剂、美容剂或药剂或其任何组合;或甾体生物碱包含龙葵皂苷B、番茄甙或其任何组合。在一些实施方案中,在生成甾体皂苷的方法中,所生成的甾体皂苷包含龙葵皂苷B、番茄甙或其任何组合。
在一些实施方案中,在生成甾体皂苷的方法中,所生成的甾体皂苷包含龙葵皂苷B。在一些实施方案中,在生成甾体皂苷的方法中,所生成的甾体皂苷包含番茄甙。
在一些实施方案中,在生成三萜皂苷的方法中,所生成的三萜皂苷包含甜味剂、发泡剂、乳化剂、防腐剂、抗癌剂、降血胆固醇制剂、抗炎剂、抗氧化剂、生物佐剂、杀菌剂、杀虫剂、拒食剂、抗真菌剂或其任何组合;或所述三萜皂苷包含:苜蓿酸3-O-葡萄糖醛酸苷(MA-3-GlcA)(化合物6)、化合物7、化合物8、化合物9、化合物10、化合物11、甘草皂苷(化合物14)、甘草次酸3-O-单葡萄糖醛酸苷(化合物15)、巴约甙元(化合物25)、巴约甙元-hexA-hex-hex(化合物31)、瓜瓶藤酸(化合物26)、瓜瓶藤酸-hexA-hex(化合物32)、大豆甾醇A(化合物29)、大豆皂醇B(化合物30)、大豆甾醇A-hexA-hex-pent(化合物34)、大豆皂苷VI(化合物35)、甜菜甙IV(化合物33)、常春藤苷配基-3GlcA、丝石竹皂苷配基-3GlcA、丝石竹酸-3GlcA或QS-21佐剂,或其任何组合;或其组合。在一些实施方案中,在生成三萜皂苷的方法中,所生成的三萜皂苷包含:苜蓿酸3-O-葡萄糖醛酸苷(MA-3-GlcA)(化合物6)、化合物7、化合物8、化合物9、化合物10、化合物11、甘草皂苷(化合物14)、甘草次酸3-O-单葡萄糖醛酸苷(化合物15)、巴约甙元(化合物25)、巴约甙元-hexA-hex-hex(化合物31)、瓜瓶藤酸(化合物26)、瓜瓶藤酸-hexA-hex(化合物32)、大豆甾醇A(化合物29)、大豆皂醇B(化合物30)、大豆甾醇A-hexA-hex-pent(化合物34)、大豆皂苷VI(化合物35)、甜菜甙IV(化合物33)、常春藤苷配基-3GlcA、丝石竹皂苷配基-3GlcA、丝石竹酸-3GlcA或QS-21佐剂,或其任何组合。
在一些实施方案中,在生成三萜皂苷的方法中,所生成的三萜皂苷包含生成苜蓿酸3-O-葡萄糖醛酸苷(MA-3-GlcA)(化合物6)。在一些实施方案中,在生成三萜皂苷的方法中,所生成的三萜皂苷包含化合物7。在一些实施方案中,在生成三萜皂苷的方法中,所生成的三萜皂苷包含化合物8。在一些实施方案中,在生成三萜皂苷的方法中,所生成的三萜皂苷包含化合物9。在一些实施方案中,在生成三萜皂苷的方法中,所生成的三萜皂苷包含化合物10。在一些实施方案中,在生成三萜皂苷的方法中,所生成的三萜皂苷包含化合物11。在一些实施方案中,在生成三萜皂苷的方法中,所生成的三萜皂苷包含甘草皂苷(化合物14)。在一些实施方案中,在生成三萜皂苷的方法中,所生成的三萜皂苷包含甘草次酸3-O-单葡萄糖醛酸苷(化合物15)。在一些实施方案中,在生成三萜皂苷的方法中,所生成的三萜皂苷包含巴约甙元(化合物25)。在一些实施方案中,在生成三萜皂苷的方法中,所生成的三萜皂苷包含巴约甙元-hexA-hex-hex(化合物31)。在一些实施方案中,在生成三萜皂苷的方法中,所生成的三萜皂苷包含瓜瓶藤酸(化合物26)。在一些实施方案中,在生成三萜皂苷的方法中,所生成的三萜皂苷包含瓜瓶藤酸-hexA-hex(化合物32)。在一些实施方案中,在生成三萜皂苷的方法中,所生成的三萜皂苷包含大豆甾醇A(化合物29)。在一些实施方案中,在生成三萜皂苷的方法中,所生成的三萜皂苷包含大豆皂醇B(化合物30)。在一些实施方案中,在生成三萜皂苷的方法中,所生成的三萜皂苷包含大豆甾醇A-hexA-hex-pent(化合物34)。在一些实施方案中,在生成三萜皂苷的方法中,所生成的三萜皂苷包含大豆皂苷VI(化合物35)。在一些实施方案中,在生成三萜皂苷的方法中,所生成的三萜皂苷包含甜菜甙IV(化合物33)。在一些实施方案中,在生成三萜皂苷的方法中,所生成的三萜皂苷包含常春藤苷配基-3GlcA、丝石竹皂苷配基-3GlcA。在一些实施方案中,在生成三萜皂苷的方法中,所生成的三萜皂苷包含丝石竹酸-3GlcA。在一些实施方案中,在生成三萜皂苷的方法中,所生成的三萜皂苷包含QS-21佐剂,或其任何组合。
在一些实施方案中,生产甾体生物碱、甾体皂苷或三萜皂苷的方法包含与未修饰的细胞或未修饰植物相比,增加甾体生物碱、甾体皂苷或三萜皂苷的含量,以及改变植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体的含量。
在一些实施方案中,生产甾体生物碱、甾体皂苷或三萜皂苷的方法包含与未修饰的细胞或未修饰植物相比,增加甾体生物碱、甾体皂苷或三萜皂苷的含量,以及减少植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体的含量。
在一些实施方案中,在生产甾体生物碱、甾体皂苷或三萜皂苷的方法中,向其中引入多核苷酸序列的细胞包含植物细胞或酵母细胞。替代地,在一些实施方案中,所述细胞包含藻细胞。上文已经详细公开了可以如本文所述进行遗传修饰的植物和酵母细胞。在一些实施方案中,相同的植物和酵母细胞可以用于生产甾体生物碱、甾体皂苷或三萜皂苷的方法中。在一些实施方案中,在生产甾体生物碱、甾体皂苷或三萜皂苷的方法中,向其中引入多核苷酸序列的细胞包含植物细胞或酵母细胞或藻细胞或昆虫细胞或细菌。
在一些实施方案中,在生产甾体生物碱、甾体皂苷或三萜皂苷的方法中,所述细胞包含植物细胞,所述植物细胞包含叶细胞、叶柄细胞、植物茎或柄细胞、根细胞、芽细胞、块茎细胞、豆细胞、谷粒或果仁细胞、果实细胞、坚果细胞、豆荚细胞、种子或种子细胞、苞片细胞、愈伤组织细胞和花细胞。
在一些实施方案中,在生产甾体生物碱、甾体皂苷或三萜皂苷的方法中,所述酵母细胞、藻细胞或植物细胞来自本文的目、属或种植物中。例如但不限于包含来自以下植物中的细胞的植物细胞:禾本目(Poales)、石竹目(Caryophyllales)、茄目(Solanales)、豆目(Fabales)、锦葵目(Malvales)、伞形目(Apiales)、十字花目(Brassicales)、天门冬目(Asparagales)、薯蓣目(Dioscoreales)或百合目(Liliales);或选自以下中的酵母:酵母菌属、裂殖酵母属、毕赤酵母属、子囊菌酵母属、克鲁维酵母菌属或假丝酵母属。
在生成甾体生物碱、甾体皂苷或三萜皂苷的一些实施方案中,石竹目(Caryophyllales)植物选自菠菜属(Spinacia)、藜属(Chenopodium)、甜菜属(Betagenus)、大黄属(Rheum);或茄目(Solanales)植物选自烟草属(Nicotiana)、茄属(Solanum)和辣椒属(Capsicum);豆目(Fabales)植物选自甘草属(Glycyrrhiza)、苜蓿属(Medicago)、皂皮树属(Quillaja)、大豆属(Glycine)和百脉根属(Lotus);或伞形目(Apiales)植物选自人参属(Panax)、胡萝卜属(Daucus)、芹属(Apium)和香芹菜属(Petroselinum);禾本目(Poales)植物选自稻属(例如水稻(Oryza sativa)和光稃稻[稻谷])、大麦属(例如大麦[Hordeum vulgare])、燕麦属(例如燕麦[Avena sativa]、毛燕麦(Avena strigosa))和小麦属(例如斯佩耳特小麦[Triticum spelta]);或十字花目(Brassicales)植物选自腰果属(例如,腰果,拟南芥(Arabidopsis thaliana))、芸苔属(例如,甘蓝[卷心菜]、芥菜[白芥]、黑芥菜(Brassica nigra)、西洋油菜(Brassica napus))、山柑属(例如续随子[刺山柑])和番木瓜属(例如番木瓜[Carica papaya])。
在一些实施方案中,在生产甾体生物碱、甾体皂苷或三萜皂苷的方法中,茄目(Solanales)植物选自本赛姆氏烟草(Nicotiana benthamiana)、番茄(Solanumlycopersicum)、马铃薯(Solanum tuberosum)、茄子(Solanum melongena)、潘那利番茄(Solanum pennellii)、查科茄(Solanum chacoense)、欧白英(Solanum dulcamara)和辣椒(Capsicum annuum);豆目(Fabales)植物选自甘草(Glycyrrhiza uralensis)、花苜蓿(Medicago sativa)、蒺藜状苜蓿(Medicago truncatula)、皂树(Quillaja saponaria)、橹豆(Glycine max)和百脉根(Lotus japonicus);锦葵目(Malvales)植物选自可可属(Theobroma);或伞形目(Apiales)选自高丽参(Panax ginseng)、胡萝卜(Daucus carota)、旱芹(Apium graveolens)和香芹(Petroselinum crispum);或所述植物选自可可树(Theobroma cacao),或禾本目(Poales)植物选自稻属(例如水稻(Oryza sativa)和光稃稻[稻谷])、大麦属(例如大麦[Hordeum vulgare])、燕麦属(例如燕麦[Avena sativa]、毛燕麦(Avena strigosa))和小麦属(例如斯佩耳特小麦[Triticum spelta]);或十字花目(Brassicales)植物选自腰果属(例如,腰果,拟南芥(Arabidopsis thaliana))、芸苔属(例如,甘蓝[卷心菜]、芥菜[白芥]、黑芥菜(Brassica nigra)、西洋油菜(Brassica napus))、山柑属(例如续随子[刺山柑])和番木瓜属(例如番木瓜[Carica papaya])。
在一些实施方案中,在生产甾体生物碱、甾体皂苷或三萜皂苷的方法中,酵母选自酵母菌属、裂殖酵母属、毕赤酵母属、子囊菌酵母属、克鲁维酵母菌属或假丝酵母属。在一些实施方案中,所述酵母是酿酒酵母或白色念珠菌(Candida albicans)。在一些实施方案中,在生产甾体生物碱、甾体皂苷或三萜皂苷的方法中,所述方法还包含纯化所述甾体生物碱、甾体皂苷或三萜皂苷的步骤。
纯化甾体生物碱、甾体皂苷或三萜化合物的方法可以包括所属领域中已知的标准纯化技术,例如但不限于柱液相色谱法、制备型中压液相色谱仪和制备型HPLC。这些技术可用于从植物、植物部分或植物细胞中纯化甾体生物碱、甾体皂苷或三萜皂苷的实施方案中。或,可以不纯化甾体生物碱、甾体皂苷或三萜皂苷而直接使用植物细胞或植物部分。
在一些实施方案中,当在酵母细胞中生成甾体生物碱、甾体皂苷或三萜皂苷时,从细胞分泌甾体生物碱、甾体皂苷或三萜皂苷。在一些实施方案中,在分泌的甾体生物碱、甾体皂苷或三萜皂苷从酵母细胞培养基中纯化。
在一些实施方案中,使用所属领域中已知的方法从植物细胞、植物部分、植物、藻类、酵母、昆虫细胞或细菌培养物中提取甾体生物碱、甾体皂苷或三萜皂苷。
在一些实施方案中,本文提供一种生成至少一种甾体生物碱、甾体皂苷或三萜皂苷的方法,所述方法还包含从植物、植物部分、菌落、器官、组织或细胞中提取所述甾体生物碱、甾体皂苷或三萜皂苷以生成所述甾体生物碱、甾体皂苷或三萜皂苷的步骤。在一个实施方案中,所述植物部分包含叶、叶柄、植物茎或柄、根、芽、块茎、豆、谷粒或果仁、果实、坚果、豆荚、种子或籽、苞片或花。
改变植物或植物部分或植物细胞中甾体生物碱、甾体皂苷和三萜皂苷含量的方法
在一些实施方案中,本文公开了改变遗传修饰的植物、遗传修饰的植物部分或遗传修饰的植物细胞中至少一种甾体生物碱、甾体皂苷或三萜皂苷的含量的方法,所述方法包含遗传修饰所述植物、植物部分或所述细胞中的CSLG基因,其中所述修饰包含增加所述CSLG基因的表达,或增加所表达的CSLG酶的活性,或增加所表达的CSLG酶的稳定性,或其任何组合;其中,所述植物、植物部分或植物细胞包含与相应的未修饰的植物、植物部分或植物细胞相比,含量增加的至少一种甾体生物碱、甾体皂苷或三萜皂苷。在其他实施方案中,本文公开了改变遗传修饰的植物、遗传修饰的植物部分或遗传修饰的植物细胞中至少一种甾体生物碱、甾体皂苷或三萜皂苷的含量的方法,所述方法包含遗传修饰所述植物、植物部分或所述细胞中的CSLG基因,其中所述修饰包含减少或消除所述CSLG基因的表达,或降低所表达的CSLG酶的活性,或降低所表达的CSLG酶的稳定性,或其任何组合;其中,所述植物、植物部分或细胞包含与相应的未修饰的植物、植物部分或植物细胞相比,含量减少的至少一种甾体生物碱、甾体皂苷或三萜皂苷。
在一些实施方案中,本文详细描述的遗传修饰的植物包含含量改变的本文公开的至少一种甾体生物碱、甾体皂苷或三萜皂苷。
在某些实施方案中,本文公开一种降低至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体在植物或植物部分的至少一种细胞中含量的方法,所述方法包含对所述至少一种植物细胞进行遗传修饰,所述遗传修饰包含:
(a)用靶向编码纤维素合酶样G(CSLG)酶的核酸基因序列的至少一种沉默分子来转化所述至少一种植物细胞;或
(b)诱变编码纤维素合酶样G(CSLG)酶的至少一个核酸序列,其中所述诱变包含(1)将一个或多个点突变引入核酸序列中,(2)将缺失引入核酸序列内,或(3)将插入引入核酸序列内,或其任何组合,其中所述引入包含诱变编码或非编码序列;
其中编码所述CSLG酶的基因的表达与其在相应的未修饰的植物细胞中的表达相比,在所述遗传修饰的植物细胞中降低,其中包含所述遗传修饰的细胞的所述植物包含与相应的未修饰的植物相比,含量减少的以下物质:一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体。
在某些实施方案中,本文公开一种增加至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体在植物或植物部分的至少一种细胞中含量的方法,所述方法包含对所述至少一种植物细胞进行遗传修饰,所述遗传修饰包含:
(a)诱变编码纤维素合酶样G(CSLG)酶的至少一个核酸序列,其中所述诱变包含(1)将一个或多个点突变引入核酸序列中,(2)将缺失引入核酸序列内,或(3)将插入引入核酸序列内,或其任何组合,其中所述引入包含诱变编码或非编码序列;以及
(b)表达编码所述CSLG的所述核酸;以及
其中包含遗传修饰的细胞的所述植物包含与相应的未修饰的植物相比,含量增加的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体。
上文已在标题为“遗传修饰的细胞和遗传修饰的植物”的部分中详细描述了诱变编码甾体生物碱生物合成酶、甾体皂苷生物合成酶或三萜皂苷生物合成酶,例如但不限于CSLG酶的至少一个核酸序列的方法。类似地,上文已在标题为“遗传修饰的细胞和遗传修饰的植物”的部分中详细描述了使用靶向编码甾体生物碱生物合成酶、甾体皂苷生物合成酶或三萜皂苷生物合成酶,例如但不限于CSLG酶的核酸序列的至少一种沉默分子来转化植物细胞的方法。这些方法整体并入本文中,其中所属领域中的技术人员应理解,某些实施方案中用于生成包含在遗传修饰的植物或植物部分中的遗传修饰的细胞的方法与用于减少或增加植物或植物部分中的至少一种甾体生物碱、甾体皂苷或三萜皂苷的方法是相同的,特别是所描述的遗传修饰的植物或植物部位中具有含量改变的至少一种甾体生物碱、甾体皂苷或三萜皂苷及其衍生物、代谢物或其生物合成中间体。
在一些实施方案中,当至少一种沉默分子靶向编码CSLG酶的核酸基因序列时,编码所述CSLG基因的核酸序列在SEQ ID NO:30、32、34、36 38、40、65、80、93、95、97、99、101、103或105中的任一;或与SEQ ID NO:30、32、34、36 38、40、65、80、93、95、97、99、101、103或105中的任一所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出。在一些实施方案中,当编码CSLG酶的核酸基因序列被突变时,编码所述CSLG基因的核酸序列在SEQ ID NO:30、32、34、36 38、40、65、80、93、95、97、99、101、103或105中的任一;或与SEQ ID NO:30、32、34、36 38、40、65、80、93、95、97、99、101、103或105中的任一所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出。在一些实施方案中,在增加或减少至少一种甾体生物碱、甾体皂苷或三萜皂苷的方法中,所述CSLG酶的氨基酸序列在SEQ ID NO:31、33、35、37、39、41、66、81、94、96、98、100、102或104中的任一;或与SEQID NO:31、33、35、37、39、41、66、81、94、96、98、100、102或104中的任一所示的氨基酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出。
在一些实施方案中,甾体生物碱的衍生物、甾体皂苷的衍生物或三萜皂苷的衍生物分别包含甾体生物碱的糖基化衍生物、甾体皂苷的糖基化衍生物或三萜皂苷的糖基化衍生物。
在一些实施方案中,突变包含非编码区中的突变。在一些实施方案中,突变包含编码区中的突变。非编码区突变的非限制性实例是增加或降低CSLG基因表达的突变。在一些实施方案中,突变包含CSLG基因的过表达,其中遗传修饰的植物细胞包含增加量的至少一种甾体生物碱、甾体皂苷或三萜皂苷。本文详细描述了过表达的方法,其中技术人员应理解,可以将组成型或诱导型启动子掺入包含编码CSLG基因的核酸序列的构建体中。在一些实施方案中,突变包含CSLG基因表达的减少,其中遗传修饰的植物细胞包含减少量的至少一种甾体生物碱、甾体皂苷或三萜皂苷。全文详细描述了特异性靶向核酸序列以减少表达的方法,其中所属领域中的技术人员应理解,在某些实施方案中,表达减少将致使至少一种甾体生物碱、甾体皂苷或三萜皂苷的含量减少。
在一些实施方案中,在增加甾体生物碱、其衍生物、其代谢物或其生物合成中间体;甾体皂苷、其衍生物、其代谢物或其生物合成中间体;三萜皂苷、其衍生物、其代谢物或其生物合成中间体的含量的方法中,与在相应的未修饰的植物细胞中表达相比,编码CSLG酶的基因在遗传修饰的植物细胞中增加;或与在相应的未修饰的植物细胞中的活性相比,所述编码的CSLG酶在遗传修饰的植物细胞中的活性增加;或与在相应的未修饰的植物细胞中的稳定性相比,所述编码的CSLG酶在遗传修饰的植物细胞中的稳定性提高;或其任何组合。用于突变编码甾体生物碱、甾体皂苷或三萜皂苷生物合成途径的基因,例如但不限于CSLG基因的核酸的方法在上文中详细描述,并且包含使编码区突变以提高酶稳定性或活性,或其组合,以及/或使表达CSLG基因的核酸序列突变以进行过表达。所属领域中的技术人员应理解,这些突变方法也可以在某些实施方案中在本文中使用。
在一些实施方案中,与包含未修饰的植物细胞的植物或植物部分中甾体生物碱的含量相比,减少至少一种甾体生物碱的方法减少包含毒性或苦味化合物或其组合的甾体生物碱。在一些实施方案中,与包含未修饰的植物细胞的植物或植物部分中甾体生物碱的含量相比,减少至少一种甾体生物碱的方法消除包含毒性或苦味化合物或其组合的甾体生物碱。在一些实施方案中,与包含未修饰的植物细胞的植物或植物部分中甾体生物碱、其衍生物、其代谢物或其生物合成中间体的含量相比,减少至少一种甾体生物碱的方法减少包含毒性或苦味化合物或其组合的甾体生物碱、其衍生物、其代谢物或其生物合成中间体。在一些实施方案中,与包含未修饰的植物细胞的植物或植物部分中甾体生物碱的含量相比,减少至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体的方法消除包含毒性或苦味化合物或其组合的甾体生物碱、其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,至少一种甾体生物碱包含七叶皂苷或脱氢七叶皂苷。在一些实施方案中,所述至少一种甾体生物碱包含:α-番茄素、番茄素、脱氢番茄素、α-查茄碱、α-茄碱、α-澳洲茄碱、α-澳洲茄边碱,或其任何组合。在一些实施方案中,所述减少的至少一种甾体生物碱包含七叶皂苷或脱氢七叶皂苷。在一些实施方案中,所述减少的至少一种甾体生物碱包含:α-番茄素、番茄素、脱氢番茄素、α-查茄碱、α-茄碱、α-澳洲茄碱、α-澳洲茄边碱,或其任何组合。在一些实施方案中,所述减少的至少一种甾体生物碱生物合成中间体包含:胆固醇、22-羟基胆固醇、22,26-二羟胆固醇、呋喃甾醇型皂苷糖苷配基、呋喃甾醇-26-醛、26-氨基-呋喃甾醇、番茄登醇、番茄碱、番茄碱半乳糖苷、γ-番茄素、β-1-番茄素或其任何组合。
在一些实施方案中,所述减少至少一种甾体生物碱包含消除或大体上消除七叶皂苷或脱氢七叶皂苷。在一些实施方案中,所述减少至少一种甾体生物碱包含消除或大体上消除α-番茄素、番茄素、脱氢番茄素、α-查茄碱、α-茄碱、α-澳洲茄碱、α-澳洲茄边碱,或其任何组合。在一些实施方案中,所述减少至少一种甾体生物碱生物合成中间体包含消除或大体上消除胆固醇、22-羟基胆固醇、22,26-二羟胆固醇、呋喃甾醇型皂苷糖苷配基、呋喃甾醇-26-醛、26-氨基-呋喃甾醇、番茄登醇、番茄碱、番茄碱半乳糖苷、γ-番茄素、β-1-番茄素或其任何组合。在一些实施方案中,减少至少一种甾体生物碱的方法包含消除至少一种甾体生物碱和至少一种甾体生物中间体的组合。
在一些实施方案中,与包含未修饰的植物细胞的植物或植物部分中甾体生物碱的含量相比,增加至少一种甾体生物碱的方法增加包含毒性或苦味化合物或其组合的甾体生物碱。在一些实施方案中,增加甾体生物碱、其衍生物、其代谢物或其生物合成中间体的含量的方法可增加包含七叶皂苷或脱氢七叶皂苷的甾体生物碱。在一些实施方案中,增加甾体生物碱、其衍生物、其代谢物或其生物合成中间体的含量的方法可增加包含甾体生物碱,所述甾体生物碱包含α-番茄素、番茄素、脱氢番茄素、α-查茄碱、α-茄碱、α-澳洲茄碱、α-澳洲茄边碱,或其任何组合。
在一些实施方案中,增加甾体生物碱、其衍生物、其代谢物或其生物合成中间体的含量的方法可增加包含至少一种甾体生物碱生物合成中间体,所述至少一种甾体生物碱生物合成中间体包含:胆固醇、22-羟基胆固醇、22,26-二羟胆固醇、呋喃甾醇型皂苷糖苷配基、呋喃甾醇-26-醛、26-氨基-呋喃甾醇、番茄登醇、番茄碱、番茄碱半乳糖苷、γ-番茄素、β-1-番茄素或其任何组合。在一些实施方案中,增加甾体生物碱、其衍生物、其代谢物或其生物合成中间体的含量的方法可增加其组合。
在一些实施方案中,与包含未修饰的植物细胞的植物或植物部分中甾体皂苷的含量相比,减少至少一种甾体皂苷的方法减少包含毒性或苦味化合物或其组合的甾体皂苷。在一些实施方案中,与包含未修饰的植物细胞的植物或植物部分中甾体皂苷的含量相比,减少至少一种甾体皂苷的方法消除包含毒性或苦味化合物或其组合的甾体皂苷。在一些实施方案中,与包含未修饰的植物细胞的植物或植物部分中甾体皂苷、其衍生物、其代谢物或其生物合成中间体的含量相比,减少至少一种甾体皂苷的方法减少包含毒性或苦味化合物或其组合的甾体皂苷、其衍生物、其代谢物或其生物合成中间体。在一些实施方案中,与包含未修饰的植物细胞的植物或植物部分中甾体皂苷的含量相比,减少至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体的方法消除包含毒性或苦味化合物或其组合的甾体皂苷、其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,所述至少一种甾体皂苷包含龙葵皂苷B、番茄甙或其任何组合。在一些实施方案中,所述减少的至少一种甾体皂苷包含龙葵皂苷B、番茄甙或其任何组合。在一些实施方案中,所减少的至少一种甾体生物碱生物合成中间体包含胆固醇、22-羟基胆固醇、22,26-二羟胆固醇、呋喃甾醇型皂苷糖苷配基。
在一些实施方案中,所述减少至少一种甾体皂苷包含消除或大体上消除龙葵皂苷B、番茄甙或其任何组合。在一些实施方案中,所述减少至少一种甾体生物碱生物合成中间体包含消除或大体上消除胆固醇、22-羟基胆固醇、22,26-二羟胆固醇、呋喃甾醇型皂苷糖苷配基。在一些实施方案中,减少至少一种甾体皂苷的方法包含消除至少一种甾体皂苷和至少一种甾体皂苷生物中间体的组合。
在一些实施方案中,与包含未修饰的植物细胞的植物或植物部分中甾体皂苷的含量相比,增加至少一种甾体皂苷的方法增加包含毒性或苦味化合物或其组合的甾体皂苷。在一些实施方案中,增加甾体皂苷、其衍生物、其代谢物或其生物合成中间体的含量的方法可增加包含龙葵皂苷B、番茄甙或其任何组合的甾体皂苷。
在一些实施方案中,增加甾体皂苷、其衍生物、其代谢物或其生物合成中间体的含量的方法可增加包含至少一种甾体皂苷生物合成中间体,所述至少一种甾体皂苷生物合成中间体包含:胆固醇、22-羟基胆固醇、22,26-二羟胆固醇、呋喃甾醇型皂苷糖苷配基或其任何组合。在一些实施方案中,增加甾体皂苷、其衍生物、其代谢物或其生物合成中间体的含量的方法可增加其组合。
在一些实施方案中,与包含未修饰的植物细胞的植物或植物部分中三萜皂苷的含量相比,减少至少一种三萜皂苷的方法减少包含毒性或苦味化合物或其组合的三萜皂苷。在一些实施方案中,与包含未修饰的植物细胞的植物或植物部分中三萜皂苷的含量相比,减少至少一种三萜皂苷的方法消除包含毒性或苦味化合物或其组合的三萜皂苷。在一些实施方案中,与包含未修饰的植物细胞的植物或植物部分中三萜皂苷、其衍生物、其代谢物或其生物合成中间体的含量相比,减少至少一种三萜皂苷的方法减少包含毒性或苦味化合物或其组合的三萜皂苷、其衍生物、其代谢物或其生物合成中间体。在一些实施方案中,与包含未修饰的植物细胞的植物或植物部分中三萜皂苷的含量相比,减少至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体的方法消除包含毒性或苦味化合物或其组合的三萜皂苷、其衍生物、其代谢物或其生物合成中间体。
在一些实施方案中,所述减少的至少一种三萜皂苷包含:苜蓿酸3-O-葡萄糖醛酸苷(MA-3-GlcA)(化合物6)、化合物7、化合物8、化合物9、化合物10、化合物11、甘草皂苷(化合物14)、甘草次酸3-O-单葡萄糖醛酸苷(化合物15)、巴约甙元(化合物25)、巴约甙元-hexA-hex-hex(化合物31)、瓜瓶藤酸(化合物26)、瓜瓶藤酸-hexA-hex(化合物32)、大豆甾醇A(化合物29)、大豆皂醇B(化合物30)、大豆甾醇A-hexA-hex-pent(化合物34)、大豆皂苷VI(化合物35)、甜菜甙IV(化合物33)、常春藤苷配基-3GlcA、丝石竹皂苷配基-3GlcA、丝石竹酸-3GlcA或QS-21佐剂,或其任何组合。在一些实施方案中,所述减少的三萜皂苷中间体包含:化合物1、化合物2、苜蓿酸(化合物5)、齐墩果酸(化合物3)、齐墩果酸-3GlcA、奥古斯丁酸(化合物4)、奥古斯丁酸-3GlcA或甘草次酸(化合物13)或其任何组合。在一些实施方案中,减少至少一种三萜皂苷的方法包含减少至少一种三萜皂苷和一种三萜皂苷生物合成中间体的组合。
在一些实施方案中,所述减少至少一种三萜皂苷包含消除或大体上消除苜蓿酸3-O-葡萄糖醛酸苷(MA-3-GlcA)(化合物6)、化合物7、化合物8、化合物9、化合物10、化合物11、甘草皂苷(化合物14)、甘草次酸3-O-单葡萄糖醛酸苷(化合物15)、巴约甙元(化合物25)、巴约甙元-hexA-hex-hex(化合物31)、瓜瓶藤酸(化合物26)、瓜瓶藤酸-hexA-hex(化合物32)、大豆甾醇A(化合物29)、大豆皂醇B(化合物30)、大豆甾醇A-hexA-hex-pent(化合物34)、大豆皂苷VI(化合物35)、甜菜甙IV(化合物33)、常春藤苷配基-3GlcA、丝石竹皂苷配基-3GlcA、丝石竹酸-3GlcA或QS-21佐剂,或其任何组合。在一些实施方案中,所述减少三萜皂苷中间体包含消除或大体上消除化合物1、化合物2、苜蓿酸(化合物5)、齐墩果酸(化合物3)、齐墩果酸-3GlcA、奥古斯丁酸(化合物4)、奥古斯丁酸-3GlcA或甘草次酸(化合物13)或其任何组合。在一些实施方案中,减少至少一种三萜皂苷的方法包含消除至少一种三萜皂苷和一种三萜皂苷生物合成中间体的组合。
在一些实施方案中,增加三萜皂苷、其衍生物、其代谢物或其生物合成中间体的含量的方法增加三萜皂苷,所述三萜皂苷包含甜味剂、发泡剂、乳化剂、防腐剂、抗癌剂、降血胆固醇制剂、抗炎剂、抗氧化剂、生物佐剂、杀菌剂、杀虫剂、拒食剂、抗真菌剂,或其任何组合。在一些实施方案中,增加三萜皂苷、其衍生物、其代谢物或其生物合成中间体的含量的方法增加三萜皂苷,所述三萜皂苷包含:苜蓿酸3-O-葡萄糖醛酸苷(MA-3-GlcA)(化合物6)、化合物7、化合物8、化合物9、化合物10、化合物11、甘草皂苷(化合物14)、甘草次酸3-O-单葡萄糖醛酸苷(化合物15)、巴约甙元(化合物25)、巴约甙元-hexA-hex-hex(化合物31)、瓜瓶藤酸(化合物26)、瓜瓶藤酸-hexA-hex(化合物32)、大豆甾醇A(化合物29)、大豆皂醇B(化合物30)、大豆甾醇A-hexA-hex-pent(化合物34)、大豆皂苷VI(化合物35)、甜菜甙IV(化合物33)、常春藤苷配基-3GlcA、丝石竹皂苷配基-3GlcA、丝石竹酸-3GlcA或QS-21佐剂,或其任何组合。在一些实施方案中,增加三萜皂苷的含量的方法可增加三萜皂苷甘草皂苷(化合物14)。在一些实施方案中,增加三萜皂苷的含量的方法可增加三萜皂苷QS-21佐剂。
在一些实施方案中,增加三萜皂苷、其衍生物、其代谢物或其生物合成中间体的方法可增加三萜皂苷生物合成中间体,所述三萜皂苷生物合成中间体包含化合物1、化合物2、苜蓿酸(化合物5)、齐墩果酸(化合物3)、齐墩果酸-3GlcA、奥古斯丁酸(化合物4)、奥古斯丁酸-3GlcA或甘草次酸(化合物13)或其任何组合。在一些实施方案中,增加三萜皂苷、其衍生物、其代谢物或其生物合成中间体的含量的方法可增加其组合。
在一些实施方案中,一种增加至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体的含量的方法包含增加至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体的含量,以及改变植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体的含量。
在一些实施方案中,一种增加至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体的含量的方法包含增加至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体的含量,以及减少植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体的含量。
在一些实施方案中,至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体的含量可减少至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体的含量,以及改变植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体的含量。
在一些实施方案中,至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体的含量可减少至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体的含量,以及含量增加的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体的含量。
在一些实施方案中,在改变(增加或减少)甾体生物碱、其衍生物、其代谢物或其生物合成中间体;甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或三萜皂苷、其衍生物、其代谢物或其生物合成中间体的含量的方法中,所述方法包含遗传修饰至少一种植物细胞,其中在一些实施方案中,所述植物细胞包含叶细胞、叶柄细胞、植物茎或柄细胞、根细胞、芽细胞、块茎细胞、豆细胞、谷粒或果仁细胞、果实细胞、坚果细胞、豆荚细胞、种子或种子细胞、苞片细胞、愈伤组织细胞和花细胞。
在一些实施方案中,在改变(增加或减少)甾体生物碱、其衍生物、其代谢物或其生物合成中间体;甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或三萜皂苷、其衍生物、其代谢物或其生物合成中间体的含量的方法中,所述方法包含遗传修饰至少一种植物细胞,其中在一些实施方案中,所述植物细胞包含本文详述的目、属或种的植物中。例如但不限于,植物细胞包含来自禾本目(Poales)、石竹目(Caryophyllales)、茄目(Solanales)、豆目(Fabales)、锦葵目(Malvales)、伞形目(Apiales)、十字花目(Brassicales)、天门冬目(Asparagales)、薯蓣目(Dioscoreales)或百合目(Liliales)植物的细胞。
在改变(增加或减少)甾体生物碱、甾体皂苷或三萜皂苷的方法的一些实施方案中,石竹目(Caryophyllales)植物选自菠菜属(Spinacia)、藜属(Chenopodium)、甜菜属(Beta genus)、大黄属(Rheum);或茄目(Solanales)植物选自烟草属(Nicotiana)、茄属(Solanum)和辣椒属(Capsicum);豆目(Fabales)植物选自甘草属(Glycyrrhiza)、苜蓿属(Medicago)、皂皮树属(Quillaja)、大豆属(Glycine)和百脉根属(Lotus);或伞形目(Apiales)植物选自人参属(Panax)、胡萝卜属(Daucus)、芹属(Apium)和香芹菜属(Petroselinum);禾本目(Poales)植物选自稻属(例如水稻(Oryza sativa)和光稃稻[稻谷])、大麦属(例如大麦[Hordeum vulgare])、燕麦属(例如燕麦[Avena sativa]、毛燕麦(Avena strigosa))和小麦属(例如斯佩耳特小麦[Triticum spelta]);或十字花目(Brassicales)植物选自腰果属(例如,腰果,拟南芥(Arabidopsis thaliana))、芸苔属(例如,甘蓝[卷心菜]、芥菜[白芥]、黑芥菜(Brassica nigra)、西洋油菜(Brassica napus))、山柑属(例如续随子[刺山柑])和番木瓜属(例如番木瓜[Carica papaya])。
在改变(增加或减少)甾体生物碱、甾体皂苷或三萜皂苷的方法的一些实施方案中,茄目(Solanales)植物选自本赛姆氏烟草(Nicotiana benthamiana)、番茄(Solanumlycopersicum)、马铃薯(Solanum tuberosum)、茄子(Solanum melongena)、潘那利番茄(Solanum pennellii)、查科茄(Solanumchacoense)、欧白英(Solanum dulcamara)和辣椒(Capsicum annuum);豆目(Fabales)植物选自甘草(Glycyrrhiza uralensis)、花苜蓿(Medicago sativa)、蒺藜状苜蓿(Medicago truncatula)、皂树(Quillaja saponaria)、橹豆(Glycine max)和百脉根(Lotus japonicus);锦葵目(Malvales)植物选自可可属(Theobroma);或伞形目(Apiales)选自高丽参(Panax ginseng)、胡萝卜(Daucus carota)、旱芹(Apium graveolens)和香芹(Petroselinum crispum);或所述植物选自可可树(Theobroma cacao)。
在体外系统中生产甾体生物碱、甾体皂苷或三萜皂苷的方法
体外系统是所属领域中公知的。在一些实施方案中,在本文公开的生成三萜皂苷的方法中使用的体外翻译体系包含兔网织红细胞裂解物、小麦胚芽提取物或无大肠杆菌细胞的系统。使用无细胞系统的详细方法是所属领域中已知且可免费获得的,例如但不限于以下网址中所提供的信息:https://www.thermofisher.com/il/en/home/references/ambion-tech-support/large-scale-transcription/general-articles/the-basics-in-vitro-translation.html。
根据一些实施方案,本文公开一种在体外系统中生成甾体生物碱或甾体皂苷的方法,所述方法包含:
(a)组合编码以下基因的一个或多个核酸序列:细胞色素P450(GAME7)基因、细胞色素P450(GAME8)基因、2-酮戊二酸依赖的双加氧酶(GAME11)基因、细胞色素P450(GAME6)基因、细胞色素P450(GAME 4)基因、转氨酶(GAME 12)基因、番茄碱UDP-半乳糖基转移酶(GAME1/SGT1)基因、UDP-糖基转移酶(GAME17)基因、UDP-糖基转移酶(GAME18)基因、UDP-糖基转移酶/木糖基转移酶(GAME2/SGT3)基因和纤维素合酶样G基因(CSLG或GAME15),其中所述一个或多个核酸序列任选地包含在一个或多个载体中;以及
(b)表达所述基因;
(c)将所述表达的酶的组合一起温育;
其中所述温育的产物包含至少一种甾体生物碱或甾体皂苷。
在一些实施方案中,上述核酸序列还包含乙烯反应性元素结合因子13(GAME9)和/或BHLH转录因子。
根据一些实施方案,本文公开一种在体外系统中生成甾体生物碱或甾体皂苷的方法,所述方法包含:
(d)编码编码以下基因的一个或多个核酸序列:细胞色素P450(GAME7)基因、细胞色素P450(GAME8)基因、2-酮戊二酸依赖的双加氧酶(GAME11)基因、细胞色素P450(GAME6)基因和纤维素合酶样G基因(CSLG或GAME15),其中所述一个或多个核酸序列任选地包含在一个或多个载体中;以及
(e)表达所述基因;
(f)将所述表达的酶的组合一起温育;
其中所述温育的产物包含至少一种甾体生物碱或甾体皂苷,或其组合。参见例如但不限于图1、8D、13和14A-14D中呈现的生物合成途径和所得中间体和产物。
在一些实施方案中,生物合成的GAME基因和/或CSLG基因可操作地连接到启动子、转录终止序列或其组合,如本文中已针对制备构建体而详细描述。在一些实施方案中,在生成甾体生物碱或甾体皂苷的方法中,编码所述CSLG基因的核酸序列在SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101、103或105中的任一;或与SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101中的任一所示的核酸序列具有至少55%的同一性和至少55%的覆盖度的其同源物中示出。在一些实施方案中,在生成甾体生物碱或甾体皂苷的方法中,编码所述CSLG基因的核酸序列在SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101、103或105中的任一;或与SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101中的任一所示的核酸序列具有至少55%的同一性和至少80%的覆盖度的其同源物中示出。
在一些实施方案中,生物合成的GAME基因和/或CSLG基因可操作地连接到启动子、转录终止序列或其组合,如本文中已针对制备构建体而详细描述。在一些实施方案中,在生成甾体生物碱或甾体皂苷的方法中,编码所述CSLG基因的核酸序列在SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101、103或105中的任一;或与SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101中的任一所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出。
在某些实施方案中,生成甾体生物碱的体外方法包含生成选自七叶皂苷或脱氢七叶皂苷的甾体生物碱。在某些实施方案中,生成甾体生物碱的体外方法包含生成甾体生物碱,所述甾体生物碱选自:α-番茄素、番茄碱、α-查茄碱、α-茄碱、α-澳洲茄碱、α-澳洲茄边碱,或其任何组合。
在某些实施方案中,生成甾体皂苷的体外方法包含生成甾体皂苷,所述甾体皂苷选自龙葵皂苷B、番茄甙或其任何组合。
根据一些实施方案,本文公开一种在体外系统中生成三萜皂苷的方法,所述方法包含:
(g)组合编码以下基因的一个或多个核酸序列:皂苷β-香树素合酶基因(SOAP1)、细胞色素P450基因(SOAP2)、表达C-2羟化酶的细胞色素P450基因(SOAP3)、表达C-23氧化酶的细胞色素P450基因(SOAP4)、表达UDP-糖基转移酶的糖基转移酶基因或岩藻糖基转移酶(SOAP6)、表达UDP-糖基转移酶的糖基转移酶基因(SOAP7)、表达UDP-糖基转移酶的糖基转移酶基因(SOAP8);表达UDP-糖基转移酶或木糖基转移酶的糖基转移酶基因(SOAP9)、酰基转移酶基因(SOAP10)以及纤维素合酶样G基因(CSLG),其中所述一个或多个核酸序列或核酸序列任选地包含在一个或多个载体中;以及
(h)表达所述基因;
(i)将所述表达的酶的组合一起温育;
其中所述温育的产物包含至少一种三萜皂苷。
在一些实施方案中,生物合成的SOAP基因和/或CSLG基因可操作地连接到启动子、转录终止序列或其组合,如本文中已针对制备构建体而详细描述。在一些实施方案中,在生成三萜皂苷的方法中,编码所述CSLG基因的核酸序列在SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101、103或105中的任一;或与SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101中的任一所示的核酸序列具有至少55%的同一性和至少55%的覆盖度的其同源物中示出。在一些实施方案中,在生成三萜皂苷的方法中,编码所述CSLG基因的核酸序列在SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101、103或105中的任一;或与SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101中的任一所示的核酸序列具有至少55%的同一性和至少80%的覆盖度的其同源物中示出。
在一些实施方案中,生物合成的SOAP基因和/或CSLG基因可操作地连接到启动子、转录终止序列或其组合,如本文中已针对制备构建体而详细描述。在一些实施方案中,在生成三萜皂苷的方法中,编码所述CSLG基因的核酸序列在SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101、103或105中的任一;或与SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101中的任一所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出。
在一些实施方案中,编码其他三萜皂苷生物合成酶的一个或多个核酸基因序列如下所示:
(a)编码所述β-香树素合酶基因的核酸序列在SEQ ID NO:45中;或与SEQ ID NO:45所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物示出;以及
(b)编码细胞色素P450基因的一种或多种核酸序列在SEQ ID NO:46、51或53中的任一;或与SEQ ID NO:46、51或53中的任一所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物示出;以及
(c)编码所述糖基转移酶基因的一种或多种核酸序列在SEQ ID NO:55、57、59或61中的任一;或与SEQ ID NO:55、57、59或61中的任一所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物示出;以及
(d)编码所述酰基转移酶的核酸序列在SEQ ID NO:63中;或与SEQ ID NO:63所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物示出。
在一些实施方案中,体外生成三萜皂苷的方法包含生成三萜皂苷,所述三萜皂苷选自:甜味剂、发泡剂、乳化剂、防腐剂、抗癌剂、降血胆固醇制剂、抗炎剂、抗氧化剂、生物佐剂、杀菌剂、杀虫剂、拒食剂、抗真菌剂,或其任何组合。
在某些实施方案中,体外生成三萜皂苷的方法生成三萜皂苷,所述三萜皂苷选自:苜蓿酸3-O-葡萄糖醛酸苷(MA-3-GlcA)(化合物6)、化合物7、化合物8、化合物9、化合物10、化合物11、甘草皂苷(化合物14)、甘草次酸3-O-单葡萄糖醛酸苷(化合物15)、巴约甙元(化合物25)、巴约甙元-hexA-hex-hex(化合物31)、瓜瓶藤酸(化合物26)、瓜瓶藤酸-hexA-hex(化合物32)、大豆甾醇A(化合物29)、大豆皂醇B(化合物30)、大豆甾醇A-hexA-hex-pent(化合物34)、大豆皂苷VI(化合物35)、甜菜甙IV(化合物33)、常春藤苷配基-3GlcA、丝石竹皂苷配基-3GlcA、丝石竹酸-3GlcA或QS-21佐剂,或其任何组合。
除非上下文另外明确指出,否则说明书和权利要求属中的单数形式“一个”、“一种”和“该”也包括复数形式。例如,术语“一种分子”也包括多种分子。
在本申请各处,可以以范围格式来呈现各种实施方案。应理解,范围格式的描述仅是为了方便和简洁,而不应被解释为不灵活的限制。因此,应该将范围的描述视为已明确公开了所有可能的子范围以及该范围内的各个数值。例如,对从1到6等范围的描述应视为已明确公开了从1到3、从1到4、从1到5、从2到4、从2到6、从3到6等子范围,以及该范围内的各个数字,例如1、2、3、4、5和6。无论范围的广度如何,这都适用。
每当在本文中指示数值范围时,其意图是包括所指示范围内的任何被引用数字(分数或整数)。短语“第一指示数字与第二指示数字之间的一个或多个范围”以及“从第一指示数字到第二指示数字的一个或多个范围”在本文中可互换使用,并且意在包括第一和第二指示数字,以及它们之间的所有小数和整数。
此外,所属领域中的技术人员应理解,通篇使用的术语“包含”旨在表示本文公开的遗传修饰的或基因编辑的植物,以及改变基因表达并改变这些遗传修饰的或基因编辑的植物中SA和/或SGA生成的方法包含所列举的要素,但不排除可能是可选的其他要素。因此,“由...组成”将意味着排除多于其他元素的痕迹。所属领域中的技术人员应理解,尽管在一些实施例中使用了术语“包含”,但是该术语可以被术语“由……组成”代替,其中这样的替代将缩小未具体叙述的元件的包含范围。
提出以下实施例以更充分地说明本发明的一些实施方案。但是,这些实施例绝不应被解释为限制本发明的广泛范围。但是,这些实施例决不应被解释为限制本文公开的遗传修饰的细胞和植物的广泛范围或所述细胞和植物用于生成甾体生物碱、甾体皂苷或三萜皂苷的用途;或增加或减少植物或植物部分中甾体生物碱、甾体皂苷或三萜皂苷的含量的方法。在不脱离本文公开的范围的情况下,所属领域中的技术人员可以容易地设计本文公开的原理的许多变型和修饰。
实施例
实施例1:实施例2-13的材料和方法
转基因植物的植物材料、处理以及生成
如先前所述(Itkin等人,2001,同上)收集番茄(Solanum lycopersicum;cv.MicroTom)和马铃薯(Solanum tuberosum;栽培品种Desiree)植物。在马铃薯中,当绿色部分开始变干时,收集成熟的块茎(第3阶段)、洗净土壤、干燥,并且将其保存在完全黑暗、4℃。
将相应的GAME9 DNA节段分别引入pK7GWIWG2(II)和pJCV52二元载体中,从而建立GAME9沉默(RNAi)和过表达(OX)构建体。生成使番茄和马铃薯中的GAME9沉默和过表达的转基因品系,并且根据Itkin等人(2011,同上)的方法制备组织提取物并对其进行分析。
下表3描述用于生成本文的构建体的寡核苷酸。如先前所述(Itkin等人,2001,同上;WO2012/095843)生成GAME4-沉默(RNAi;GAME4i)、GAME4过表达(GAME400e)和GAME8沉默的构建体。
表3:用于生成构建体的寡核苷酸
Figure BDA0003051611980001291
Figure BDA0003051611980001301
共表达分析
番茄GAME1(Solyc07g043490)及其马铃薯直系同源物SGT1(PGSC003DMG400011749)在共表达分析中被用作“饵”,从而生成共表达基因(对于每个“饵”单独的)列表(按r值>0.8降序排列)。随后识别出两个同源基因(分别在番茄和马铃薯中的Solyc12g006460和PGSC0003DMG400024274),它们与“饵”基因高度相关(两个物种的r值>0.9)。这些基因被识别为糖苷生物碱代谢4(GAME4,WO 2012/095843)。GAME4基因进一步作为“饵”添加到先前的(GAME1)共表达分析中。使用两种物种的GAME1(SGT1)和GAME4的共表达列表来构建共表达相关网络。进行如下分析:来自不同组织和器官(果肉、果皮、种子、根、叶、芽、花、花粉)和发育阶段的番茄RNAseq转录组数据(总共25个实验)(Itkin等人,2011;出处同上)以及来自不同组织和器官的马铃薯RNAseq转录组数据(共40个实验)(US 2012/0159676)。首先,使用R脚本(针对每个物种)进行共表达分析,并使用Perl脚本将共表达的基因列表构建为FASTA文件。最后,使用BLASTall工具(Camacho C.等人,2009,《BMC生物信息学》(BMC Bioinform)第10期:第421页)来发现两个物种之间的共有同源物。将tblastx同源物相似性标准设置为p值>0.05,最少25个核苷酸和至少60%相似性,作为每个基因的整体同一性。共表达网络通过Cytoscape程序可视化(Shannon P.等人,2003,《基因组研究》(Genome Res)第13期:第2498-2504页)。
系统发育分析
使用Muscle算法对蛋白质序列进行比对,并且使用PhyML 3.0(Expósito-Rodríguez M等人,2008,《BMC植物生物学》(BMC Plant Biol)第8期:第131页)使用最大似然方法,通过SeaView v4.3.5程序,采用以下设置对系统树进行分析和可视化:型号-LG;使用近似似然比检验(aLRT)Shimodaira-Hasegawa类(SH-like)程序作为统计检验来计算分支支持度(分支支持–aLRT(SH-like));不变位点-优化;跨位点速率变化-优化;树搜索操作-最适合NNI和SPR;起始树-BioNJ,优化树拓扑。分支上的数字表示支持每个节点的引导程序迭代的比例。下表4列出用于制备此树的蛋白质登录号和有机体名称;该树如图12所示。
表4:用于构建系统树的序列登录号
Figure BDA0003051611980001311
Figure BDA0003051611980001321
代谢物分析
通过UPLC-qTOF-MS制备植物组织提取物并分析半极性化合物(包括甾体生物碱和甾体皂苷),并且按照先前的描述进行番茄叶中植物固醇含量的测定(Itkin等人,2011,同上)。
实时定量PCR测定
如先前所述(Itkin等人,2011,同上)分离RNA并进行定量实时PCR。此外,使用TIP41基因(23)作为马铃薯样品的内源对照。寡核苷酸在上文表3中示出。
重组酶的生成
从cDNA扩增GAME2、GAME17和GAME18,并且使用BamH I和Pst I(GAME2、GAME18)或BamHI和XhoI(GAME17)限制位点亚克隆到pACYCDUET-1中,并且通过测序来验证插入节段。将得到的质粒pAC-GAME2/17/18转化到大肠杆菌BL21 DE3中。为了表达GAME酶,将新鲜过夜培养物在含30μg/ml氯霉素的25ml 2xYT培养基中以1:100稀释,并在37℃和250rpm下温育,直到A600nm为0.4。随后,加入IPTG使其浓度为0.5mM,并在18℃和250rpm下继续温育过夜。第二天,通过离心收集细胞,并将沉淀重悬于2ml 50mM Tris HCl pH=7.0、15%甘油,0.1mMEDTA和5mMβ-巯基乙醇中。通过超声破碎细胞后,通过离心去除不溶物,并使用可溶级分对酶进行表征。将蛋白质储存在-20℃,直至进一步分析。
底物制备
为了水解,将35mg的α-番茄素溶解在3ml的1N HCl中,并且在100℃温育15分钟。随后,将溶液置于冰上,并添加NH3直至溶液pH为9.0。用4ml水饱和丁醇来萃取溶液。在真空下将丁醇相蒸发至干,将残留颗粒溶解在1ml甲醇中,并且储存在-20℃直至进一步使用。将α-番茄素的降解产物在Luna 5μm C18(2)
Figure BDA0003051611980001331
色谱柱150x21.2mm(美国,Phenomenex)上,使用25%乙腈和0.1%甲酸等度洗脱来进行分离。使用3100Mass Detector(Waters)检测并收集化合物。将级分冷冻干燥,并通过LC-MS验证化合物的纯度。为了对产品进行识别,使用连接到Waters 2996PDA检测器的Waters Alliance 2795HPLC,并且随后使用在正离子模式下运行的QTOF Ultima V4.00.00质谱仪(Waters,MS Technologies,英国)进行液相色谱结合四极飞行时间质谱(LC-QTOF-MS)分析。所用的色谱柱为分析型Luna 3μm C18(2)
Figure BDA0003051611980001332
150×2.0mm(Phenomenex,美国)连接到C18预层析柱(2.0×4mm;AJO-4286;Phenomenex,美国)。以流速0.19ml/分钟使用脱气的洗脱液A[超纯水:甲酸(1000:1,v/v)]和洗脱液B[乙腈:甲酸(1000:1,v/v)]。梯度从5%B开始,并在45分钟内线性增加至75%B,然后将色谱柱洗涤并平衡15分钟,直到下一次注射。注射量为5μl。该过程生成几毫克的纯γ-番茄素(番茄碱-半乳糖苷-葡萄糖苷,T-Gal-Glu)和β1-番茄素(番茄碱-半乳糖苷-二葡萄糖苷,T-Gal-Glu-Glu)。番茄碱半乳糖苷(T-Gal)由于被T-Gal-Glu强烈污染而无法以这种方式纯化。因此,如先前所述(Itkin等人,2011,同上),将5mg番茄碱与GAME1和UDP-半乳糖一起在1ml反应混合物中温育。通过固相萃取从UDP-半乳糖中纯化出T-Gal。将Waters OASIS HLB 3色谱柱(Waters Corp.,Milford,MA)用6mL 100%甲醇处理,然后用4mL超纯水冲洗。加载补充有10%甲醇的反应,然后用4mL超纯水洗涤柱体。用1mL 75%甲醇超纯水(v:v)和0.4mL100%甲醇来洗脱化合物。使用高速真空浓缩器从合并的洗脱液中除去溶剂,直到获得完全干燥的颗粒。
酶测定
将底物T-Gal、β1-和γ-番茄素溶于50%DMSO中直至1mM。在最终反应体积100μl中,使用5μg/ml酶、8mM UDP-木糖和0.02mM底物,在含有5μM/ml巯基乙醇的50mM Tris HClpH=7.0中进行酶测定。在37℃搅拌温育2小时之后,通过加入300μl甲醇和0.1%甲酸终止反应,然后短暂涡旋并超声处理15分钟。随后,在13,000rpm下将提取物离心分离5分钟,通过0.45μm过滤器(Minisart SRP4,德国生物技术有限公司)过滤,然后通过LC-MS进行分析(参见上文)。通过LC-MS色谱图中的峰表面积来测量产物的量,并且将其与以含有空pACYCDUET-1的大肠杆菌酶制剂进行的对照温育进行比较。检测所用物质如下:α-番茄素(C50H83NO21;m/z=1034.55([M+H]+))、β1-番茄素T-Gal-Glu-Glu(C45H75NO17;m/z=902.51([M+H]))、β2-番茄素(C44H73NO16;m/z=872.50([M+H]+))、γ-番茄素T-Gal-Glu(C39H65NO12;m/z=740.46([M+H]))和T-Gal(C33H55NO7;m/z=578.41([M+H]))。
病毒诱导基因沉默(VIGS)实验
如先前所述构建含有GAME基因节段的载体,并且进行VIGS实验(Orzaea D等人,2009,《植物生理学》(Plant Physiol.),第150期:第1122-1134页;Li R等人,2006,《质谱测定法杂志》(J.Mass Spec.)第41期:第1-22页)。使用含有空载体和辅助载体pTRV1、且已感染土壤杆菌感染的植物作为对照。上文表3中示出用于制备pTRV2_DR_GW载体的寡核苷酸。
野生番茄物种的基因组序列分析
对三个野生番茄种基因组(即潘那利番茄(Solanum pennellii)、野生醋栗番茄(S.pimpinellifolium)和克梅留斯基番茄(S.chmielewskii))进行重新测序,对所获得的部分基因组数据(Arnaud G.Bovy博士,未发表数据)进行分析,以确定是否存在与番茄7号和12号染色体上的SGA生物合成基因簇对齐的序列(重叠群)。使用TopHat工具盒(TrapnellC,2012,《自然实验步骤》(Nat.Protoc.),第7期:第562-578页)将野生种的读段(reads)基因定位(mapping)到番茄基因组(ITAG 2.4),作为参考基因组。使用IGV基因组浏览器将被基因定位的读段可视化(Robinson J T等人,2011,《自然-生物技术》(Nat.Biotechnol)第29期:第24–26页)。为了将来自三个野生种的重叠群的序列与基因簇比对,并将其组装到染色体7和12的当前培养番茄序列上,使用CLC工作台、CAP3 BWA和SAMtools软件包以及内置Perl脚本的组合。
实施例2:与SGA生物合成相关的基因
为了发现与SGA生物合成相关的基因,使用番茄和马铃薯植物的转录组数据进行共表达分析。与GAME1/SGT1(7号染色体)和GAME4(12号染色体)一起作为饵在马铃薯或番茄中的共表达以热图的形式在下文中的表5-8中呈现。与GAME1/SGT1(7号染色体)或GAME4(12号染色体)高度共表达的基因以大号字体和粗体显示。
表5:登录号、推定蛋白质和共表达r值-番茄、第7号染色体
Figure BDA0003051611980001341
Figure BDA0003051611980001351
表6:登录号、推定蛋白质和共表达r值-马铃薯、第7号染色体
Figure BDA0003051611980001352
Figure BDA0003051611980001361
表7:登录号、推定蛋白质和共表达r值-番茄、第12号染色体
Figure BDA0003051611980001362
Figure BDA0003051611980001371
表8:登录号、推定蛋白质和共表达r值-马铃薯、第12号染色体
Figure BDA0003051611980001372
Figure BDA0003051611980001381
来自每个物种的十六个基因与GAME1/SGT1共表达(表9、图2)。这些基因中的一者以前称为糖苷生物碱代谢4(GAME4),其编码细胞色素P450蛋白88D子家族的一个成员(图3)。GAME4和GAME1/SGT1在番茄和马铃薯中呈现出非常相似的表达谱(WO 2010/095843)。番茄和马铃薯中的GAME1/SGT1和GAME4基因位于7号和12号染色体上,因此它们在物理上紧邻其几个共表达的基因(图2)。
GAME1/SGT1共表达的基因簇跨越第7号染色体上约200Kbp的基因组区域。番茄簇与GAME1一起由7个共表达的基因组成。这些包括3个UDP-糖基转移酶[GAME2(在马铃薯中称为SGT3);GAME17和GAME18]、72A亚家族的细胞色素P450(GAME6)、2-酮戊二酸依赖的双加氧酶(GAME11)和纤维素合酶样蛋白(GAME15)。在马铃薯中,该簇似乎包含5个共表达的基因,因为其缺乏编码GAME17和GAME18 UDP-糖基转移酶的番茄基因的同源物。用四种重组簇集番茄UDP-糖基转移酶进行酶活性测定。GAME17和GAME18在与番茄碱半乳糖苷(T-Gal)和γ-番茄素(T-Gal-Glu)作为底物一起温育时呈现出UDP-葡萄糖基转移酶活性,而GAME2在与β1-番茄素(T-Gal-Glu-Glu)作为底物一起与温育时呈现出UDP-木糖基转移酶活性。(图4E、4F和4G)。先前已证明GAME1在番茄中起番茄碱UDP-半乳糖基转移酶的作用(Itkin等人,2011,同上)。当在单个试管中使用番茄碱对4种重组UGT酶中进行温育,并且全部采用糖苷供体(UDP-半乳糖、-葡萄糖和-木糖)时,观测最终SGA产物α-番茄素的累积(图4H)。
在与GAME1/SGT1和GAME4共表达的基因中识别出编码推定转录因子的两种基因(图4):一种基因名为GAME9,且标识为番茄ID Solyc01g090340和马铃薯IDPGSC0003DMG400025989。该基因被描述为乙烯反应性元素结合因子13,并且含有推定的AP2结构域。另一种基因是BHLH转录因子,且标识为番茄ID Solyc03g046570和马铃薯IDPGSC0003DMG400012262。
表9:图2示出马铃薯和番茄这两者中与已知和推定甾体生物碱相关基因共表达的同源物的详细信息
番茄和马铃薯序列可得自Sol Genomics Network(茄科基因组网络,solgenomics.net)。共表达r值≥0.8。TCON编号,发明人在RNAsec数据汇编中给出的重叠群参考名称。N/A-不适用。
Figure BDA0003051611980001382
Figure BDA0003051611980001391
Figure BDA0003051611980001401
实施例3:GAME9转录因子的功能分析
将相应的GAME9 DNA节段分别引入pK7GWIWG2(II)和pJCV52二元载体中,从而建立GAME9沉默(RNAi)和过表达(OX)构建体。如先前所述(Itkin等人,2011,同上)生成用相应GAME9沉默和过表达构建体转化的转基因番茄和马铃薯品系。如Itkin等人(2011,同上)所述制备组织提取物,并且对其进行分析。SEQ ID NO:18示出GAME9 RNAi沉默分子的序列。在得自转基因和野生型番茄和/或马铃薯植物的叶和/或块茎中的提取物上,使用UPLC-TQ-MS对甾体生物碱进行代谢谱分析。在得自编码GAME9的基因被沉默的马铃薯品系(GAME9-RNAi品系)的马铃薯块茎皮提取物中,观测α-茄碱和α-查茄碱的减少(分别参见图5A和5B)。与野生型相比,来自马铃薯GAME9过表达品系的叶含有更高水平的α-茄碱(图5C)和α-查茄碱(图5D)。在马铃薯叶中观测到类似累积模式,其中RNAi品系中α-查茄碱和α-茄碱的含量减少,而过表达GAME9转录因子的品系中这些甾体生物碱的含量增加(图6)。
在番茄中,与其在得自野生型植物的叶提取物中的含量相比,过表达GAME9转录因子的品系的叶提取物(命名为5879)中含有更高含量的α-番茄素。相反,GAME9转录因子表达的下调(品系5871)致使α-番茄素含量显著降低。
实施例4:GAME基因的功能表征
GAME11沉默的植物
病毒诱导的基因沉默(VIGS)是一种常用技术,可对各个植物部分中的基因进行系统性沉默(Dinesh-Kumar S P等人,2003,《分子生物学方法》(Methods Mol Biol),第236期:第287-294页)。SEQ ID NO:19示出GAME11 RNAi沉默分子的序列。
用簇中的推定双加氧酶,即VIGS沉默的GAME11对番茄叶进行分析,结果表明α-番茄素浓度显著降低,并且存在若干种胆甾烷醇型甾体皂苷的累积。
使番茄中的GAME11双加氧酶沉默,可致使叶中α-番茄素浓度耗尽(m/z=1034.5)(图8A),同时累积胆甾烷醇型甾体皂苷[即STS,m/z=1331.6,1333.6,1199.6,1201.6(主要皂苷)](图8B)。图8C示出m/z=1331.6的MS/MS谱(19.28分钟处)。图8D示出在19.28分钟洗脱、并且累积在GAME11沉默叶中的皂苷的碎裂过程图形。对应的质量信号在图8C的MS/MS色谱图中以星号标示。元素组成和碎裂过程图形表明,化合物是胆甾烷醇型皂苷,其缺乏一个羟基和E环(与呋喃甾醇型皂苷相比),进而致使发生破裂,并且涉及多个水分子缺失,而不是E环的互变异构化以及麦克拉佛特重排(McLafferty rearrangement)。
GAME18沉默的植物
病毒诱导的基因沉默(VIGS)测定验证了GAME18在生成α-番茄素的四糖部分中的作用,因为GAME18沉默的果实中累积了对照样品中不存在的γ-番茄素(图9)。
在提取自GAME18沉默的成熟绿色果实中,检测新累积化合物的峰,其对应于γ-番茄素标准品(m/z=740.5)(图9A-C)和γ-番茄素戊糖苷(m/z=872.5)(图9D-E)。
GAME12沉默的植物
番茄中GAME12转氨酶的沉默引发呋甾烷醇型甾体皂苷的累积(图4D)。如图10A示出,GAME12沉默的叶中累积STS(m/z=753.4),而野生型叶中仅存在少量STS(图10B)。图10C示出19.71分钟、m/z=753.4的MS/MS谱,以及相关碎片的解释。所提出的STS结构位于19.71分钟处,如图10D中所示,由MS/MS实验中观测到的特性质量碎片得出。
GAME7和GAME8的功能
同样对紧密共表达并位于基因组其他位置的基因进行功能检查。命名为GAME7和GAME8的两种基因属于细胞色素P450的CYP72亚家族。GAME7在两种物种(马铃薯和番茄)中共表达,而StGAME8a和StGAME8b与StSGT1和StGAME4在马铃薯中强烈共表达。目前,我们无法证明GAME7的SGA相关活性,尽管就GAME6而言,它被认为参与SGA代谢(US 20120159676)。但是,GAME8沉默的番茄叶累积22-(R)-羟基胆固醇(图11A-11D),其是所提出的SGA生物合成途径中间体(图1)。与野生型相比,GAME8沉默的品系中累积这两种异构体(图11D)。(R)-异构体更丰富,因此最有可能是GAME8的底物。
图12示出植物CYP450蛋白家族中GAME基因的系统树。分支上的数字表示支持每个节点的引导程序迭代的比例。
实施例5:所提出的茄科植物生物合成途径
已经提出茄科植物中的扩展生物合成途径,如图13的示意图所示(虚线箭头代表该途径中的多种酶促反应)。为方便起见,此途径可分为四个部分。在第一部分中,一系列反应(例如,由SSR2、SMO3、SM04催化)将环阿乔醇转化为胆固醇。副产物包括三萜化合物和植物固醇。在第二部分中,一系列反应(例如,由GAME11、GAME6、GAME4、GAME12、GAME25催化)将胆固醇转化成番茄碱(糖苷配基)。副产物包括甾体皂苷(龙葵皂苷B)。在第三部分中,一系列反应(例如,由GAME1、GAME 17、GAME18、GAME2催化)将番茄碱转化成甾体糖苷生物碱(例如α-番茄素)。在第四部分中,一系列反应将绿番茄的甾体糖苷生物碱(例如α-番茄素)转化成红番茄的lycoperoside和/或七叶皂苷(例如七叶皂苷A)。
实施例6涉及番茄、马铃薯和茄子中甾体糖苷生物碱(SGA)生物合成的途径
番茄、马铃薯和茄子中的纤维素合酶样基因(GAME15)已被确定与甾体糖苷生物碱(SGA)生物合成有关(图14A-14C)。此基因呈现出与其他SGA生物合成基因(例如,GAME4、GAME12)以及SGA生物合成调节基因(例如,GAME9)强烈共表达。图14D提供所提出的茄科植物途径的非限制性实例,例如但不限于,所属领域中的技术人员应认识到,此途径涵盖通过GAME15葡萄糖醛酸转移酶活性从番茄碱生成番茄碱3-O-葡萄糖醛酸苷。在某些实施方案中,GAME15酶包含茄科植物中存在的GAME15,所述茄科植物例如但不限于马铃薯(Solanumtuberosum);番茄(Solanum lycopersicum);南蛇藤(Solanum dulcamara);以及茄子(Solanum melogena)。
识别出以下序列:
纤维素合酶样_番茄
ATGAAAAAAACCATGGAGCTCAACAAAAGCACTGTTCCACAACCTATCACCACCGTATACCGACTCCACATGTTCATCCACTCAATAATCATGCTTGCATTAATATACTACCGTGTATCTAATTTGTTTAAATTCGAAAACATTCTCAGTTTACAAGCACTTGCTTGGGCGCTCATCACTTTTGGTGAATTTAGTTTCATTCTCAAGTGGTTCTTCGGACAAGGTACTCGTTGGCGCCCCGTTGAACGAGATGTTTTCCCTGAAAACATTACTTGCAAAGATTCCGATCTACCGCCAATTGACGTAATGGTATTCACTGCCAATCCTAAGAAAGAGCCAATTGTAGATGTCATGAACACTGTGATATCCGCAATGGCTCTTGATTATCCCACCGATAAATTGGCTGTGTATCTCGCTGATGATGGAGGATGTCCATTGTCGTTGTACGCCATGGAACAAGCGTGTTTGTTTGCAAAGCTATGGTTACCTTTCTGTAGAAACTATGGAATTAAAACGAGATGCCCAAAAGCATTTTTTTCTCCGTTAGGAGATGATGACCGTGTTCTTAAGAATGATGATTTTGCTGCTGAAATGAAAGAAATTAAATTGAAATATGAAGAGTTCCAGCAGAAGGTGGAACATGCTGGTGAATCTGGAAAAATCAATGGTAACGTAGTGCCTGATAGAGCTTCGCTTATTAAGGTAATAAACGAGAGGGAGAACGAAAAGAGTGTGGATGATATGACGAAAATGCCCTTGCTAGTTTATGTATCCCGTGAAAGAAGATTCAACCGTCTTCATCATTTCAAGGGTGGATCTGCAAATGCTCTACTTCGAGTTTCTGGAATAATGAGTAATGCCCCCTATGTACTGGTGTTAGATTGTGATTTCTTCTGTCATGATCCAATATCAGCTAGGAAGGCAATGTGTTTTCATCTTGATCCAAAGCTATCATCTGATTTAGCCTATGTTCAGTTCCCTCAAGTCTTTTACAATGTCAGCAAGTCAGATATTTATGATGTCAAAATTAGACAGGCTTACAAGACAATATGGCATGGAATGGATGGTATCCAAGGCCCAGTGTTATCTGGGACTGGTTATTTTCTCAAGAGGAAAGCGTTATACACAAGTCCAGGAGTAAAAGAGGCGTATCTTAGTTCACCGGAAAAGCATTTTGGAAGGAGTAAAAGGTTTCTTGCTTCATTAGAGGAGAAAAATGGTTATGTTAAGGCAGATAAAGTCATATCAGAAGATATCATAGAGGAAGCTAAGATGTTAGCTACTTGTGCATATGAGGATGGCACACATTGGGGTCAAGAGATTGGTTATTCATACGATTGTCATTTGGAGAGCACTTTTACTGGTTATCTATTACACTGCAAAGGGTGGACATCTACTTATTTGTATCCAGACAGGCCATCTTTCTTGGGTTGTGCCCCAGTTGATATGCAAGGTTTCTCATCACAGCTCATCAAATGGGTTGCTGCACTTACACAAGCTGGTTTATCACATCTCAATCCCATCACTTATGGTTTGAGTAGTAGGATGAGGACTCTCCAATGCATGTGCTATGCCTATTTGATGTATTTCACTCTTTATTCTTGGGGAATGGTTATGTATGCTAGTGTTCCTTCTATTGGCCTTTTGTTTGACTTCCAAGTCTATCCTGAGGTACATGATCCGTGGTTTGCAGTGTATGTGATTGCTTTCATATCGACAATTTTGGAGAATATGTCGGAGTCAATTCCAGAAGGGGGATCAGTTAAAACGTGGTGGATGGAATACAGGGCATTGATGATGATGGGAGTTAGCGCAATATGGTTAGGAGGATTGAAAGCTATATATGACAAGATAGTCGGAACACAAGGAGAGAAATTGTATTTGTCGGACAAGGCAATTGACAAGGAAAAGCTCAAGAAATACGAGAAGGGCAAATTTGATTTCCAAGGAATAGGGATACTTGCTCTGCCACTGATAGCATTTTCCGTGTTGAACCTCGTAGGCTTCATTGTTGGAGCTAATCATGTCTTTATTACTATGAACTACGCAGGCGTGCTGGGCCAACTCCTCGTATCATCGTTCTTCGTCTTTGTTGTCGTCACTGTTGTCATTGATGTTGTATCTTTCTTAAAGGTTTCTTAA[SEQ ID NO:30]
纤维素合酶样(番茄)
MKKTMELNKSTVPQPITTVYRLHMFIHSIIMLALIYYRVSNLFKFENILSLQALAWALITFGEFSFILKWFFGQGTRWRPVERDVFPENITCKDSDLPPIDVMVFTANPKKEPIVDVMNTVISAMALDYPTDKLAVYLADDGGCPLSLYAMEQACLFAKLWLPFCRNYGIKTRCPKAFFSPLGDDDRVLKNDDFAAEMKEIKLKYEEFQQKVEHAGESGKINGNVVPDRASLIKVINERENEKSVDDMTKMPLLVYVSRERRFNRLHHFKGGSANALLRVSGIMSNAPYVLVLDCDFFCHDPISARKAMCFHLDPKLSSDLAYVQFPQVFYNVSKSDIYDVKIRQAYKTIWHGMDGIQGPVLSGTGYFLKRKALYTSPGVKEAYLSSPEKHFGRSKRFLASLEEKNGYVKADKVISEDIIEEAKMLATCAYEDGTHWGQEIGYSYDCHLESTFTGYLLHCKGWTSTYLYPDRPSFLGCAPVDMQGFSSQLIKWVAALTQAGLSHLNPITYGLSSRMRTLQCMCYAYLMYFTLYSWGMVMYASVPSIGLLFDFQVYPEVHDPWFAVYVIAFISTILENMSESIPEGGSVKTWWMEYRALMMMGVSAIWLGGLKAIYDKIVGTQGEKLYLSDKAIDKEKLKKYEKGKFDFQGIGILALPLIAFSVLNLVGFIVGANHVFITMNYAGVLGQLLVSSFFVFVVVTVVIDVVSFLKVS[SEQ ID NO:31]
纤维素合酶样(潘那利番茄(Solanum pennellii))
ATGAAAAAAACCATGGAGCTCAACAAAAGCACTGTTCCACAACCTATCACCACCGTATACCGACTCCACATGTTCATCCACTCAATAATCATGCTTGCATTAATATACTACCGTGTATCTAATTTGTTTAAATTCGAAAACATTCTCAGTTTACAAGCACTTGCTTGGCTACTCATCACTTTTGGTGAATTTAGTTTCATTCTCAAGTGGTTCTTCGGACAAGGAACTCGTTGGCGCCCCGTTGAACGAGATGTTTTCCCTGAAAACATTACTTGCAAAGATTCCGATCTACCGCCAATTGACGTAATGGTGTTCACTGCCAATCCTAAGAAAGAGCCAATTGTAGATGTCATGAACACTGTGATATCCGCAATGGCTCTTGATTATCCCACCGATAAATTGGCTGTGTATCTGGCCGATGATGGAGGATGTCCATTGTCCTTGTACGCCATGGAACAAGCATGTTTGTTTGCAAAGCTATGGTTACCTTTCTGTAGAAAGTATGGAATTAAAACGAGATGCCCAAAAGCATTTTTTTCTCCGTTAGGAGATGATGACCGTGTTCTTAAGAATGATGATTTTGCTGCTGAAATGAAAGAAATTAAATTGAAATATGAAGAGTTCCAGCAGAACGTGGAACATGCTGGTGAATCTGGAAAAATCAATGGCAACGTAGTGCCTGACAGAGCTTCGCTTATTAAGGTAATAAACGAGAGGGAGAACGAAAAGAGTGTCGATGATTTAACGAAAATGCCCTTGCTAGTTTATGTATCCCGTGAAAGAAGATTCAACCGTCTTCATCATTTCAAGGGTGGATCTGCAAATGCTCTACTTCGAGTTTCTGGAATAATGAGTAATGCCCCCTATGTACTGGTGTTAGATTGTGATTTCTTCTGTCATGATCCGATATCAGCTAGGAAAGCAATGTGTTTTCATCTTGATCCAAAGCTATCATCTGATTTAGCCTATGTTCAGTTCCCTCAAGTCTTTTACAATGTCAGCAAGTCCGATATTTATGATGTCAAAATTAGACAGGCTTACAAGACAATATGGCATGGAATGGATGGTATCCAAGGCCCAGTGTTATCTGGAACTGGTTATTTTCTCAAGAGGAAGGCGTTATACACAAGTCCAGGAGTAAAAGAGGCGTATCTTAGTTCACCGGAAAAGCATTTTGGAAGGAGTAAAAAGTTCCTTGCTTCATTAGAGGAGAAAAATGGTTATGTTAAGGCAGATAAAGTCATATCAGAAGATATCATAGAGGAAGCTAAGATCTTAGCTACTTGTGCATATGAGGATGGCACACATTGGGGTCAAGAGATTGGTTATTCATACGATTGTCATTTGGAGAGCACTTTTACTGGTTATCTATTACACTGCAAAGGGTGGACATCTACTTATTTGTATCCAGACAGGCCATCTTTCTTGGGTTGTGCCCCAGTTGATATGCAAGGTTTCTCATCACAGCTCATAAAATGGGTTGCTGCACTTACACAAGCTGGTCTATCACATCTCAATCCCATCACTTATGGTTTGAGTAGTAGGATGAGAACTCTCCAATGCATGTGCTATGCCTATTTGATGTATTTCACTCTTTATTCTTGGGGAATGGTTATGTATGCTAGTGTTCCTTCTATTGGCCTTTTGTTTGGCTTCCAAGTCTACCCTGAGGTACATGATCCATGGTTTGCAGTGTATGTGATTGCTTTCATATCGACAATTTTGGAGAATATGTCGGAGTCAATTCCAGAAGGGGGATCAGTTAAAACGTGGTGGATGGAATACAGGGCATTGATGATGATGGGAGTTAGCGCAATATGGTTAGGAGGATTGAAAGCTATATATGACAAGATAGTCGGAACACAAGGAGAGAAATTGTATTTGTCGGACAAGGCAATTGACAAGGAAAAGCTCAAGAAATACGAGAAGGGCAAATTTGATTTCCAAGGAATAGGGATACTTGCTCTGCCATTGATAGCATTTTCCGTGTTGAACCTCGTAGGCTTCATTGTTGGAGCTAATCATGTCTTTATTACTATGAACTACGCAGGCGTGCTGGGCCAACTCCTCGTATCATCATTCTTCGTCTTTGTTGTCGTCACTGTTGTCATTGATGTTGTATCTTTCTTAAAGGTTTCTTAA[SEQ ID NO:32]
纤维素合酶样(潘那利番茄(Solanum pennellii))
MKKTMELNKSTVPQPITTVYRLHMFIHSIIMLALIYYRVSNLFKFENILSLQALAWLLITFGEFSFILKWFFGQGTRWRPVERDVFPENITCKDSDLPPIDVMVFTANPKKEPIVDVMNTVISAMALDYPTDKLAVYLADDGGCPLSLYAMEQACLFAKLWLPFCRKYGIKTRCPKAFFSPLGDDDRVLKNDDFAAEMKEIKLKYEEFQQNVEHAGESGKINGNVVPDRASLIKVINERENEKSVDDLTKMPLLVYVSRERRFNRLHHFKGGSANALLRVSGIMSNAPYVLVLDCDFFCHDPISARKAMCFHLDPKLSSDLAYVQFPQVFYNVSKSDIYDVKIRQAYKTIWHGMDGIQGPVLSGTGYFLKRKALYTSPGVKEAYLSSPEKHFGRSKKFLASLEEKNGYVKADKVISEDIIEEAKILATCAYEDGTHWGQEIGYSYDCHLESTFTGYLLHCKGWTSTYLYPDRPSFLGCAPVDMQGFSSQLIKWVAALTQAGLSHLNPITYGLSSRMRTLQCMCYAYLMYFTLYSWGMVMYASVPSIGLLFGFQVYPEVHDPWFAVYVIAFISTILENMSESIPEGGSVKTWWMEYRALMMMGVSAIWLGGLKAIYDKIVGTQGEKLYLSDKAIDKEKLKKYEKGKFDFQGIGILALPLIAFSVLNLVGFIVGANHVFITMNYAGVLGQLLVSSFFVFVVVTVVIDVVSFLKVS[SEQ ID NO:33]
纤维素合酶样(马铃薯)
ATGAAAAAAACCATGGAGCTCAACAAAAGCACTGTTCCACAACCTATCACCACCATATACCGACTCCACATGTTTATCCACTCTATAATCATGGTTGCATTAATATACTACCGTGTATCTAATTTGTTTAAATTCGAAAACATTCTGAGTTTACAAGCACTTGCTTGGGTACTCATCACTTTTGGTGAATTTAGTTTCATTCTCAAGTGGTTCTTCGGACAAGGAACTCGTTATCGCCCTGTTGAAAGAGATGTTTTCCCTGAAAACATAACTTGCAAAGATTCCGATCTACCACCAATTGACGTAATGGTATTCACTGCCAATCCTAAGAAAGAGCCAATTGTGGATGTCATGAACACTGTGATATCCGCAATGGCTCTTGATTATCCTACGGATAAATTGGCTGTGTATCTGGCTGATGATGGAGGATGTCCTTTGTCATTGTACGCCATGGAAGAAGCATGTGTGTTTGCAAAGCTGTGGCTACCTTTCTGTAGGAAGTATGGAATTAAAACTAGATGCCCTAAAGCGTTTTTTTCTCCTTTAGGAGATGATGAACGTGTTCTTAAGAATGATGATTTTGATGCTGAAATGAAAGAAATTAAATTGAAATATGAAGAGTTCCAGCAGAATGTGGAACGTGCTGGTGAATCTGGAAAAATCAATGGTAACGTAGTGCCTGATAGAGCCTCGTTTATTAAGGTAATAAACGACAGAAAAGCGGAGAGCGAAAAGAGTGCCGATGATTTAACGAAAATGCCCTTGCTAGTTTATGTATCCCGTGAAAGAAGATTCAACCGTCTTCATCACTTCAAGGGTGGATCTGCAAATGCTCTTCTTCGAGTTTCTGGAATAATGAGTAATGCCCCCTATATACTGGTGTTAGATTGTGATTTCTTCTGTCATGATCCAATATCAGCTAGGAAGGCAATGTGTTTTCATCTTGATCCAAAGCTATCATCTGATTTAGCTTATGTTCAGTTCCCTCAAGTCTTTTACAATGTCAGCAAGTCCGATATTTATGATGTCAAAATTAGACAGGCTTACAAGACAATATGGCATGGAATGGATGGTATCCAAGGCCCAGTGTTATCAGGAACTGGTTATTTTCTGAAGAGGAAGGCGTTATACACGAGTCCAGGAGTAAAGGAGGAGTATCTTAGTTCACCGGAAAAGCATTTTGGAAGGAGTAAAAAGTTCCTTGCTTCACTAGAGGAGAAAAATGGTTATGTTAAGGCAGAGAAAGTCATATCAGAAGATATCGTAGAGGAAGCTAAGACCTTAGCTACTTGTGCATATGAGGATGGCACACATTGGGGTCAAGAGATTGGTTATTCATACGATTGTCATTTGGAGAGCACTTTTACTGGTTATCTATTACACTGCAAAGGGTGGAGATCGACTTATTTGTATCCAGACAGGCCATCTTTCTTGGGTTGTGCCCCAGTTGATATGCAAGGTTTCTCCTCACAGCTCATAAAATGGGTTGCTGCACTTACACAAGCTGGTTTATCACATCTCAATCCCATCACTTATGGCTTTAGTAGCAGGATGAAAACTCTCCAATGCATGTGCTATGCCTATTTGATATATTTCACTCTTTATTCTTGGGGAATGGTTCTATATGCTAGTGTTCCTTCTATTGGCCTTTTGTTTGGCTTCCAAGTCTATCCCGATGTACATGATCCATGGTTTGCAGTGTATGTGATTGCTTTCATATCGGCAATTTTGGAGAATATGTCGGAGTCAATTCCTGATGGGGGATCATTTAAATCTTGGTGGATGGAATACAGGGCACTGATGATGATGGGAGTTAGTGCAATATGGTTAGGAGGATTGAAAGCTATATTAGACAGGATAATCGGAACAGAAGGAGAGAAATTGTATTTATCGGACAAGGCAATTGACAAGGAAAAGCTCAAGAAATACGAGAAGGGGAAATTTGATTTCCAAGGAATAGGGATACTTGCTGTACCATTGATAGCATTTTCCTTGTTGAACCTCGTAGGCTTCATTGTTGGAGCTAATCATGTCTTTATTACTATGAACTACGCAGGTGTGCTTGGCCAACTCCTCGTATCATCCTTCTTCGTCTTTGTCGTGGTCACTGTTGTCATTGATGTCGTTTCTTTCTTAAAGGTTTCTTAA[SEQ ID NO:34]
纤维素合酶样(马铃薯)
MELNKSTVPQPITTIYRLHMFIHSIIMVALIYYRVSNLFKFENILSLQALAWVLITFGEFSFILKWFFGQGTRYRPVERDVFPENITCKDSDLPPIDVMVFTANPKKEPIVDVMNTVISAMALDYPTDKLAVYLADDGGCPLSLYAMEEACVFAKLWLPFCRKYGIKTRCPKAFFSPLGDDERVLKNDDFDAEMKEIKLKYEEFQQNVERAGESGKINGNVVPDRASFIKVINDRKAESEKSADDLTKMPLLVYVSRERRFNRLHHFKGGSANALLRVSGIMSNAPYILVLDCDFFCHDPISARKAMCFHLDPKLSSDLAYVQFPQVFYNVSKSDIYDVKIRQAYKTIWHGMDGIQGPVLSGTGYFLKRKALYTSPGVKEEYLSSPEKHFGRSKKFLASLEEKNGYVKAEKVISEDIVEEAKTLATCAYEDGTHWGQEIGYSYDCHLESTFTGYLLHCKGWRSTYLYPDRPSFLGCAPVDMQGFSSQLIKWVAALTQAGLSHLNPITYGFSSRMKTLQCMCYAYLIYFTLYSWGMVLYASVPSIGLLFGFQVYPDVHDPWFAVYVIAFISAILENMSESIPDGGSFKSWWMEYRALMMMGVSAIWLGGLKAILDRIIGTEGEKLYLSDKAIDKEKLKKYEKGKFDFQGIGILAVPLIAFSLLNLVGFIVGANHVFITMNYAGVLGQLLVSSFFVFVVVTVVIDVVSFLKVS[SEQ ID NO:35]
纤维素合酶样(查科茄(Solanum chacoense))
ATGAAAAAAACCATGGAGCTCAACAAAAGCACTGTTCCACAACCTATCACCACCATATACCGACTCCACATGTTCGTCCATTCTATAATCATGGCTGCATTAATATACTACCGTGTATCTAATTTGTTTAAATTCGAAAACATTCTGAGTTTACAAGCACTTGCTTGGGTACTCATCACTTTTGGTGAATTTAGTTTCATTCTCAAGTGGTTCTTCGGACAAGGAACTCGTTGGCGCCCTGTTGAAAGAGATGTTTTCCCTGAAAACATAACTTGCAAAGATTCCGATCTACCACCAATTGACGTAATGGTATTCACTGCCAATCCTAAGAAAGAGCCAATTGTGGATGTCATGAACACTGTGATATCCGCAATGGCTCTAGATTATCCTACGGATAAATTGGCTGTGTATCTGGCTGATGATGGAGGATGTCCTTTGTCATTGTACGCCATGGAAGAAGCATGTGTGTTTGCAAAGCTGTGGCTACCTTTCTGTAGGAAGTATGGAATTAAAACCAGATGCCCTAAAGCGTTTTTTTCTCCTTTAGGAGATGATGACCGTGTTCTTAAGAATGATGATTTTGATGCTGAAATGAAAGAAATTAAATTGAAATATGAAGAGTTCCAGCAGAATGTGGAACGTGCTGGTGAATCTGGAAAAATCAATGGTAACGTAGTGCCTGATAGAGCCTCGTTTATTAAGGTAATAAACGACAGAAAAACGGAGAGCGAAAAGAGTGCCGATGATTTAACGAAAATGCCCTTGCTAGTTTATGTATCCCGTGAAAGAAGATTCAACCGTCTTCATCACTTCAAGGGTGGATCTGCAAATGCTCTTCTTCGAGTTTCTGGAATAATGAGTAATGCCCCCTATATACTGGTGTTAGATTGTGATTTCTTCTGTCATGATCCAATATCAGCTAGGAAGGCAATGTGTTTTCATCTTGATCCAAAGCTATCATCTGATTTAGCTTATGTTCAGTTCCCTCAAGTCTTTTACAATGTCAGCAAGTCCGATATTTATGATGTCAAAATTAGACAGGCTTACAAGACAATATGGCATGGAATGGATGGTATCCAAGGCCCAGTGTTATCAGGAACTGGTTATTTTCTGAAGAGGAAGGCGTTATACACGAGTCCAGGAGTAAAGGAGGAGTATCTTAGTTCACCGGAAAAGCATTTTGGAAGGAGTAAAAAGTTCCTTGCTTCACTAGAGGAGAAAAATGGTTATGTTAAGGCAGAGAAAGTCATATCAGAAGATATCGTAGAGGAAGCTAAGACCTTAGCTACTTGTGCATATGAGGATGGTACACATTGGGGTCAAGAGATCGGTTATTCATACGATTGTCATTTGGAGAGCACTTTTACTGGTTATCTATTACACTGCAAAGGGTGGACATCGACTTATTTGTATCCAGACAGGCCATCTTTCTTGGGTTGTGCTCCAGTTGATATGCAAGGTTTCTCCTCACAGCTCATAAAATGGGTTGCTGCACTTACACAAGCTGGTTTATCACATCTCAATCCCATCACTTATGGCTTGAGTAGCAGGATGAAAACTCTCCAATGCATGTGCTATGCCTATTTGATATATTTCACTCTTTATTCTTGGGGAATGGTTCTATATGCTAGTATTCCTTCTATTGGTCTTTTGTTTGGCTTCCAAGTCTATCCGGAGGTACATGATCCATGGTTTGCAGTGTATGTGATTGCTTTCATATCGACAATTTTGGAGAATATGTCGGAGTCAATTCCAGAAGGGGGATCATTTAAATCGTGGTGGATGGAATACAGGGCACTGATGATGATGGGAGTTAGTGCAATATGGTTAGGAGGATTGAAAGCTATATTAGACAAGATAATCGGAACAGAAGGAGAGAAATTGTATTTGTCAGACAAGGCAATTGACAAGGAAAAGCTCAAGAAATACGAGAAGGGGAAATTTGATTTCCAAGGAATAGGGATACTTGCTGTACCATTGATAGCATTTTCCCTGTTGAACCTGGTAGGCTTCATTGTTGGAGCTAATCATGTCTTTATTACTATGAACTACGCAGGTGTGCTTGGCCAACTCCTCGTATCATCCTTCTTCGTCTTTGTCGTGGTCACTGTTGTCATTGATGTCGTTTCTTTCTTAAAGGTTTCTTAA[SEQ ID NO:36]
纤维素合酶样(查科茄(Solanum chacoense))
MKKTMELNKSTVPQPITTIYRLHMFVHSIIMAALIYYRVSNLFKFENILSLQALAWVLITFGEFSFILKWFFGQGTRWRPVERDVFPENITCKDSDLPPIDVMVFTANPKKEPIVDVMNTVISAMALDYPTDKLAVYLADDGGCPLSLYAMEEACVFAKLWLPFCRKYGIKTRCPKAFFSPLGDDDRVLKNDDFDAEMKEIKLKYEEFQQNVERAGESGKINGNVVPDRASFIKVINDRKTESEKSADDLTKMPLLVYVSRERRFNRLHHFKGGSANALLRVSGIMSNAPYILVLDCDFFCHDPISARKAMCFHLDPKLSSDLAYVQFPQVFYNVSKSDIYDVKIRQAYKTIWHGMDGIQGPVLSGTGYFLKRKALYTSPGVKEEYLSSPEKHFGRSKKFLASLEEKNGYVKAEKVISEDIVEEAKTLATCAYEDGTHWGQEIGYSYDCHLESTFTGYLLHCKGWTSTYLYPDRPSFLGCAPVDMQGFSSQLIKWVAALTQAGLSHLNPITYGLSSRMKTLQCMCYAYLIYFTLYSWGMVLYASIPSIGLLFGFQVYPEVHDPWFAVYVIAFISTILENMSESIPEGGSFKSWWMEYRALMMMGVSAIWLGGLKAILDKIIGTEGEKLYLSDKAIDKEKLKKYEKGKFDFQGIGILAVPLIAFSLLNLVGFIVGANHVFITMNYAGVLGQLLVSSFFVFVVVTVVIDVVSFLKVS[SEQ ID NO:37]
纤维素合酶样(茄子)
ATGAAAAAACAAATGGAGCTCAACAGAAGTGTTGTACCGCAACCTATCACCACCATTTACCGTCTCCACATGTTTATCCATGCCCTAATCATGCTAGCACTAATATACTACCGTGTCTCTAATTTGGCCAAATTCGAAAACATCCTCAGTTTACAAGCACTTGCTTGGGCTCTTATCACGTTAGGTGAACTTTGTTTCATAGTCAAGTGGTTCTTCGGACAAGGGACTCGTTGGCGTCCTGTTGATAGGGATGTCTTCCCTGAAAACATCACTTGTCCAGATTCCGAGCTACCCCCCATTGATGTCATGGTTTTCACTGCAAATCCTAAGAAAGAGCCAATTGTGGATGTCATGAACACTGTCATATCCGCAATGGCTCTTGATTACCCGACCGACAAATTGGCCGTTTATTTGTCTGATGATGGAGGATGCCCCTTGACGTTGTACGCAATGGAGGAAGCTTGTTCCTTTGCCAAGTTGTGGCTACCTTTTTGTAGGAAGTATGGAATCAAAACAAGGTGCCCTAAGGCGTTTTTTTCTCCATTAGGAGAAGATGACCGTGTATTGAAGAGTGATGACTTTGTTTCTGAAATGAAAGAAATGAAGTCAAAATATGAAGAGTTCCAGCAGAACGTGGACCGTGCTGGTGAATCCGGAAAAATCAAAGGTGACGTAGTGCCTGATAGACCCGCGTTTCTTAAGGTACTAAATGACAGGAAGACGGAGAACGAGAAGAGTGCAGACGATTTAACTAAAATGCCTTTGCTAGTATACGTATCCCGTGAAAGAAGAACTCACCGTCGCCATCACTTCAAGGGTGGATCTGCAAATGCTCTTCTTCGAGTTTCTGGGATAATCAGTAATGCCCCCTATATACTGGTTTTAGATTGTGATTTCTTCTGTCATGATCCAATATCAGCTCGGAAGGCAATGTGTTTCCATCTTGATCCAAAACTATCACCTGACTTAGCTTACGTGCAGTTCCCTCAAGTGTTTTACAATGTTAGCAAGTCCGATATTTACGACGTCAAAATTAGACAGGCTTACAAGACAATATGGCACGGGATGGATGGTATCCAAGGCCCAGTGTTATCGGGAACTGGTTATTTTTTAAAAAAGAAGGCGTTGTACACGAGTCCAGGTCTAAAAGATGAGTATCTTAGTTCACCGGAAAAGCATTTCGGAACGAGTAGAAAGTTCATTGCTTCACTAGAGGAGAATAATTATGTTAAGCAAGAGAAAGTCATATCAGAAGATATCATAGAGGAAGCTAAGAGACTGGCTACTTGTGCATACGAGGATGGCACACATTGGGGTCAAGAGGCAAACAGGCCATCTTTCTTGGGTTGTGCCCCAGTTGATATGCAAGGTTTCTCCTCACAGCTCATAAAATGGGTTGCTGCACTCACACAAGCAGGTCTATCACATCTCAATCCCATCACTTACGGCTTCAAGAGCAGAATGAGAACTCTCCAAGTCTTGTGTTATGCCTATTTGATGTATTTCTCTCTTTATTCTTGGGGAATGGTTCTACATGCTAGTGTTCCTTCTATTGGCCTTCTCTCTGGCATTAAAATCTACCCGGAGGTGTATGATCCATGGTTTGTTGTGTATGTGATTGCTTTCATATCAACAATTTTGGAGAATATGTCGGAATCAATTCCGGAAGGGGGATCGGTTAAAACGTGGTGGATGGAATACAGGGCACTGATGATGATGGGAGTTAGTGCAATATGGCTAGGAGGAGTGAAAGCCATAGTAGACAAGATCATCGGAACGCAAGGAGAGAAATTGTATTTGTCGGACAAAGCAATTGACAAGGAAAAGCTCAAGAAATACGAGAAGGGGAAATTTGATTTCCAAGGAATAGGAATACTTGCTGTACCATTGATAACATTTTCTGTGTTGAACCTGGTAGGCTTCTTGGTTGGAATTAATCAAGTGTTGATAACGATGAAGTTCGCAGGCGTGCTGGGCCAACTCCTCGTATCATCCTTCTTCGTCTTTGTCGTCGTTACTGTTGTCATTGATGTCGTATCTTTCTTAAAGGATTCTTAA[SEQ ID NO:38]
纤维素合酶样(茄子)
MKKQMELNRSVVPQPITTIYRLHMFIHALIMLALIYYRVSNLAKFENILSLQALAWALITLGELCFIVKWFFGQGTRWRPVDRDVFPENITCPDSELPPIDVMVFTANPKKEPIVDVMNTVISAMALDYPTDKLAVYLSDDGGCPLTLYAMEEACSFAKLWLPFCRKYGIKTRCPKAFFSPLGEDDRVLKSDDFVSEMKEMKSKYEEFQQNVDRAGESGKIKGDVVPDRPAFLKVLNDRKTENEKSADDLTKMPLLVYVSRERRTHRRHHFKGGSANALLRVSGIISNAPYILVLDCDFFCHDPISARKAMCFHLDPKLSPDLAYVQFPQVFYNVSKSDIYDVKIRQAYKTIWHGMDGIQGPVLSGTGYFLKKKALYTSPGLKDEYLSSPEKHFGTSRKFIASLEENNYVKQEKVISEDIIEEAKRLATCAYEDGTHWGQEANRPSFLGCAPVDMQGFSSQLIKWVAALTQAGLSHLNPITYGFKSRMRTLQVLCYAYLMYFSLYSWGMVLHASVPSIGLLSGIKIYPEVYDPWFVVYVIAFISTILENMSESIPEGGSVKTWWMEYRALMMMGVSAIWLGGVKAIVDKIIGTQGEKLYLSDKAIDKEKLKKYEKGKFDFQGIGILAVPLITFSVLNLVGFLVGINQVLITMKFAGVLGQLLVSSFFVFVVVTVVIDVVSFLKDS[SEQ ID NO:39]
纤维素合酶样(辣椒(Capsicum annuum))
ATGGAGCTCAACAGATGTACGGTGCAGCAACCTACCACTGCCATATACCGACTACACATGTTTCTCCACTCTCTAATCATGCTTGCATTAGTATACTATCGTTTGTCTAATCTGTTTTACTTCGAAAACGTCCTCACTTTACAAGCATTTGCATGGGGGCTTATCACCTTAGGTGAAATTTGTTTCATTGTCAAGTGGTTCTTTGGTCAAGGGACTCGTTGGCGCCCCGTTGTCAGGGAAGTGTTCCTGGACAATATTACTTGCCAAGATTCCGAGCTGCCCGCACTAGATGTGATGGTTTTCACTGCCAATCCCAAGAAAGAGCCAATTGTGGATGTCATGAACACTGTGATATCCGCAATGGCTCTTGATTACCCGACGGATAAATTGGCTGTGTATCTGGCTGATGATGGAGGATGCCCCTTGACGTTGTACGCCATGGAGGAGGCCTGTTCTTTTGCCAAGTTGTGGCTACCTTTCTGTAGGAAGTATGGAATCAAAACAAGGTGCCCCAAAGCGTTTTTTTCTCCATTAGGAGAAGATGATCGTATCCTTAAGAACGATGACTTTGTAGCTGAAATGAAAGAAATTAAATTAAAATATGAGGAGTTCCAGCAGAATGTAAACCTTGCTGGTGAATCCGGAAAAATCAAAGGTGACGTAGTGCCTGATAGAGCCTCGTTTATTAAGGTAATAAATGACAGGAAAATGGAGAACAAGAAGAGTGCCGACGATATAACGAAAATGCCTTTGCTAGTATACGTATCCCGTGAAAGAAGATTTAACAGTCGTCATCACTTCAAGGGTGGATCTGCAAATGCTCTTCTTCGAGTTTCAGGGATAATGAGTAATGCCCCCTATTTACTGGTCTTAGATTGTGATTTCTTCTGTCATGATCCAACATCAGCTCGGAAGGCAATGTGTTTCCATCTTGATCCAAAACTATCACCTTCCTTAGCTTATGTGCAGTTCCCTCAAGTGTTTTACAATGTCAGCAAGTCCGATATATACGATGTCAAAATTAGACAGGCTTACAAGACAATATGGCACGGAATGGATGGTATCCAAGGCCCAGTGTTATCGGGAACTGGGTATTTTCTGAAGAGGAAAGCGTTATACACGAGTCCAGGTCTAAAGGATGAGTATCTTATTTCACCGGAAAAGCATTTCGGATCAAGTAGAAAGTTCATTGCTTCTCTAGAGGAGAACAATGGTTATGTTAAGCAAGAGAAACTCATAACAGAAGATATTATAGAGGAAGCGAAGACCTTGTCTACTTGTGCATACGAGGATGGTACACGATGGGGCGAAGAGATCGGTTATACCTACAATTGCCATTTGGAGAGCACTTTTACCGGCTATCTTTTGCACTGCAAAGGGTGGACATCAACATATTTGTATCCAGAAAGGCCATCTTTCTTGGGTTGTGCCCCAGTTGATATGCAAGGATTCTCCTCACAACTCACAAAATGGGTTGCTGCACTCACACAAGCTGGTCTATCACATCTCAATCCCATCACTTACGGCATGAAGAGCAGGATTAAGACTATCCAATGCTTGTGCTATGCCTATTTGATGTATTTCTCTCTCTATTCTTGGGGAATGGTTCTGCATGCTAGTGTTCCTTCTATTAGCCTTTTGCTTGGCATTCAAGTCTACCCCGAGGTCTATGATCCATGGTTTGCAGTGTATGTGCTTGCTTTCATATCGACAATTTTGGAGAACATGTCAGAGTCAATTCCAGAAGGCGGTTCAGTTAAAACTTGGTGGATGGAATACAGGGCACTGATGATGATGGGAGTTAGTGCAATATGGTTAGGAGGAGTGAAAGCTATAGTAGAAAAGATCATCGGAACTCAAGGAGAGAAATTATATTTGTCGGACAAAGCAATTGACAAGGAAAAGCTCAAGAAATATGAGAAGGGGAAATTTGATTTCCAAGGGATAGGGATACTTGCTGTTCCATTGATAACATTCTCAGCGTTGAATTTGGTAGGCTTCATGGTTGGAGCTAATCAAGTGATTCTTACTATGAAGTTCGAAGCTTTGCTAGGCCAACTCCTTGTGTCATCCTTCTTCGTCTTTGTGGTGGTCACCGTTGTCATAGATGTCCTATCTTTCTTAAAAGACTCTTAA[SEQ ID NO:40]
纤维素合酶样(辣椒(Capsicum annuum))
MELNRCTVQQPTTAIYRLHMFLHSLIMLALVYYRLSNLFYFENVLTLQAFAWGLITLGEICFIVKWFFGQGTRWRPVVREVFLDNITCQDSELPALDVMVFTANPKKEPIVDVMNTVISAMALDYPTDKLAVYLADDGGCPLTLYAMEEACSFAKLWLPFCRKYGIKTRCPKAFFSPLGEDDRILKNDDFVAEMKEIKLKYEEFQQNVNLAGESGKIKGDVVPDRASFIKVINDRKMENKKSADDITKMPLLVYVSRERRFNSRHHFKGGSANALLRVSGIMSNAPYLLVLDCDFFCHDPTSARKAMCFHLDPKLSPSLAYVQFPQVFYNVSKSDIYDVKIRQAYKTIWHGMDGIQGPVLSGTGYFLKRKALYTSPGLKDEYLISPEKHFGSSRKFIASLEENNGYVKQEKLITEDIIEEAKTLSTCAYEDGTRWGEEIGYTYNCHLESTFTGYLLHCKGWTSTYLYPERPSFLGCAPVDMQGFSSQLTKWVAALTQAGLSHLNPITYGMKSRIKTIQCLCYAYLMYFSLYSWGMVLHASVPSISLLLGIQVYPEVYDPWFAVYVLAFISTILENMSESIPEGGSVKTWWMEYRALMMMGVSAIWLGGVKAIVEKIIGTQGEKLYLSDKAIDKEKLKKYEKGKFDFQGIGILAVPLITFSALNLVGFMVGANQVILTMKFEALLGQLLVSSFFVFVVVTVVIDVLSFLKDS[SEQ ID NO:41]
生成以下序列,用于在其各自的植物中沉默GAME15:
用于番茄中GAME15沉默的区域
GGCTCTTGATTATCCCACCGATAAATTGGCTGTGTATCTCGCTGATGATGGAGGATGTCCATTGTCGTTGTACGCCATGGAACAAGCGTGTTTGTTTGCAAAGCTATGGTTACCTTTCTGTAGAAACTATGGAATTAAAACGAGATGCCCAAAAGCATTTTTTTCTCCGTTAGGAGATGATGACCGTGTTCTTAAGAATGATGATTTTGCTGCTGAAATGAAAGAAATTAAATTGAAATATGAAGAGTTCCAGCAGAAGGTGGAACATGC[SEQ ID NO:42]
用于马铃薯中GAME15沉默的区域
GGCTCTTGATTATCCTACGGATAAATTGGCTGTGTATCTGGCTGATGATGGAGGATGTCCTTTGTCATTGTACGCCATGGAAGAAGCATGTGTGTTTGCAAAGCTGTGGCTACCTTTCTGTAGGAAGTATGGAATTAAAACTAGATGCCCTAAAGCGTTTTTTTCTCCTTTAGGAGATGATGAACGTGTTCTTAAGAATGATGATTTTGATGCTGAAATGAAAGAAATTAAATTGAAATATGAAGAGTTCCAGCAGAATGTGGAACGTGCTGGTG[SEQ ID NO:43]
用于茄子中GAME15沉默的区域
GGCTCTTGATTACCCGACCGACAAATTGGCCGTTTATTTGTCTGATGATGGAGGATGCCCCTTGACGTTGTACGCAATGGAGGAAGCTTGTTCCTTTGCCAAGTTGTGGCTACCTTTTTGTAGGAAGTATGGAATCAAAACAAGGTGCCCTAAGGCGTTTTTTTCTCCATTAGGAGAAGATGACCGTGTATTGAAGAGTGATGACTTTGTTTCTGAAATGAAAGAAATGAAGTCAAAATATGAAGAGTTCCAGCAGAACGTGGACCGTGCTGGTGAATCCGGAAAAATCAAAGGTGACGTAGTGCCTGATAGACCCGCGTTTCTTAAGGTACTAAATGACAGGAAGACGGAGAACGAGAAGAGTGCAGACGATTTAACTAAAATGCCTTTGCTAGTATACGTATCCCGTGAAAGAAGAACTCACCGTCGCCATCACTTCAAGGGTGG[SEQ ID NO:44]
生成番茄和马铃薯中GAME15基因的RNAi品系。GAME15-RNAi转基因番茄植物叶子中的α-番茄素和下游SGA显著减少,并且GAME15沉默的绿色果实中未检测到α-番茄素。此外,在番茄果实发育阶段(例如,破乳剂和红色果实)未检测到七叶皂苷或其他SGA。此外,在GAME15-RNAi番茄植物的叶和绿色果实中观测到胆固醇增加15-20倍,而胆固醇是SGA的前体。在马铃薯中,GAME15沉默致使α-查茄碱和α-茄碱大量减少,而这些品系中的胆固醇集合体增加。
实施例7:GAME15-RNAi转基因番茄马铃薯和茄子植物的生成
GAME15-RNAi构建体是通过将选定节段(沉默序列SEQ ID NO:42(番茄)、SEQ IDNO:43(马铃薯)和SEQ ID NO:44(茄子))引入pENTR/D-TOPO(英杰生命技术有限公司(Invitrogen))(通过NotI和AscI),然后使用Gateway LR Clonase II酶混合物(英杰生命技术有限公司(Invitrogen))将该节段进一步亚克隆至pK7GWIWG2(II)二元载体。如前所述,将载体转化成番茄、马铃薯和茄子(Itkin等人,《植物细胞》(Plant Cell)第23期:第4507-25页;Sonawane等人,美国国家科学院院刊(PNAS),第115(23)期:E5418-E5428)。将阳性GAME25下调品系进一步用于LC-MS分析中。
实施例8:GAME15沉默的番茄植物呈现出显著减少的SGA谱
为了确定GAME15在SGA代谢中的确切作用,使用上述番茄沉默序列(SEQ ID NO:42)生成GAME15-RNAi(GAME15i)转基因番茄品系(#21、#22和#23)。
与野生型番茄叶相比,GAME15-RNAi叶呈现出α-番茄素的显著减少(图15A)。此外,随后将GAME15i果实的SGA谱与处于不同发育和成熟阶段的野生型SGA谱进行比较。在番茄从绿色果实转变成红色果实的过程中,α-番茄素转化成七叶皂苷和Lycoperosides,而脱氢番茄素转化成七氢七叶皂苷和dehydrolycoperosides(图14A)。
GAME15i绿色果实和红色果实未呈现出任何微量SGA(例如α-番茄素或七叶皂苷A),表明由于GAME15i沉默而致使番茄果实中的SGA完全丧失(图15B和15C)。
实施例9:改变GAME15表达对马铃薯中的SGA具有重大影响
与番茄相似,也使用以上马铃薯沉默序列(SEQ ID NO:43)使得马铃薯(#1、#2和#3)中的GAME15i沉默,以确定其对马铃薯SGA代谢的影响。
与野生型马铃薯叶组织相比,马铃薯中GAME15的沉默致使马铃薯叶组织(图16)中主要SGA的α-查茄碱(阴影条)和α-茄碱(空心条)急剧减少。
实施例10:GAME15沉默的番茄叶片中的高胆固醇累积
胆固醇用作SGA生物合成的关键前体(Sonawane等人,2016,《自然植物》(Nat.Plants),第3期:第16205页)。由于观测到GAME15i沉默的番茄植物中的SGA显著减少并且在之后完全丧失,因此检查了这些植物中的胆固醇水平。与野生型番茄植物叶相比,观测到GAME15i沉默的番茄植物叶中胆固醇(SGA前体)增加约15-20倍(图17)。
实施例11:改变GAME15表达并观测其对茄子中SGA的影响
与马铃薯相似,使用上述茄子沉默序列(SEQ ID NO:44)使茄子中的GAME15i沉默,以确定其对马铃薯SGA代谢的影响。
与野生型茄子相比,观测到茄子中GAME15沉默对降低α-澳洲茄碱和/或α-澳洲茄边碱水平的影响(图14C)。
实施例12:番茄、马铃薯和茄子中GAME15的过表达
替代地,对番茄、马铃薯和/或茄子植物进行遗传修饰或基因编辑以过表达GAME15。
为增加番茄植物中α-番茄素和七叶皂苷和/或Lycoperosides的生成(图14A),对番茄植物进行了遗传修饰或基因编辑以过表达GAME15。
为增加马铃薯植物中α-茄碱和/或α-查茄碱的生成(图14B),对马铃薯植物进行了遗传修饰或基因编辑以过表达GAME15。
为了增加茄子中α-澳洲茄碱和/或α-澳洲茄边碱的生成(图14C),对茄子植物进行遗传修饰或基因编辑以过表达GAME15。
实施例13:SGA水平和组成改变的植物和作物
基于以上内容,例如通过经典育种或基因工程(例如,遗传修饰的植物或转基因植物、基因编辑植物等)来制备SGA浓度和组成改变的茄科植物(例如番茄、马铃薯、茄子和/或胡椒植物)和/或作物,从而赋予植物抵御各种昆虫和其他病原体的化学屏障和/或去除抗营养化合物(例如,马铃薯中的查茄碱和/或茄碱)。
此外,例如通过合成生物工具,使用高胆固醇或高植物固醇番茄品系对高价值甾体化合物(例如,前维生素D和/或薯蓣皂苷配基)进行工程设计。
另外,使用高植物固醇(例如植物甾醇)品系来生成化妆品中使用的组分。
在其他情况下,制备SGA浓度增加和/或植物固醇水平降低的茄科植物(例如,番茄、马铃薯、茄子和/或胡椒植物)和/或作物。
实施例14-实施例14-25的材料和方法
皂苷分析的液相色谱–质谱(LC-MS)和串联质谱(MS/MS)参数
采用样品的四个生物学复制体(n=4)进行代谢分析。简言之,将100mg冷冻粉末状植物组织用300μL 80%内标物甲醇混合液(松甾酮A(Ponasterone A),C=1.5μg/mL)萃取,短暂涡旋,然后在室温下超声处理20分钟。将提取物在14,000x g下离心分离10分钟,并且通过0.22μm过滤器过滤。使用高分辨率UPLC/qTOF系统对样品进行分析,该系统由连接到SYNAPT-G2 qTOF检测器(串联四极/飞行时间质谱仪,沃特世公司(Waters))的UPLC(WatersAcquity)组成。在100x2.1mm内径、1.7μm UPLC BEH C18色谱柱(Waters Acquity)上对代谢物进行分离。流动相由0.1%甲酸的乙腈:水(5:95,v/v;A相)溶液以及0.1%甲酸的乙腈溶液(B相)组成。流速为0.3mL/分钟,并且柱温度保持在35℃。
在体外使用SOAP10以以下线性梯度分析菠菜、甜菜、酵母细胞中生成的三萜化合物:以100%到85%相A洗脱5分钟,以85%到75%相A洗脱2分钟,然后在75%相A下维持3分钟;继续在10分钟内梯度转到65%相A,以65%到40%相A洗脱10分钟;1分钟内从40%相A转到100%相B,然后在100%相B下维持3.5分钟,然后在0.5分钟内恢复到初始状态(100%相A),并且在100%相A下调节1分钟。
为分析奎奴亚藜和紫苜蓿中的三萜皂苷,以以下梯度进行层析40分钟:以100%到72%相A洗脱22分钟、以72%到0%相A洗脱14分钟,然后在100%相B下维持2分钟;然后在0.5分钟内恢复到初始条件(100%相A),并且在100%相A下调节1.5分钟。
使用以下设置:毛细管2kV;圆锥体27V;离子源温度设定为140℃,去溶剂化温度设置为140℃,去溶剂化温度450℃,去溶剂化气流流量800L/h。氩气用作碰撞气体。在50-1600Da的m/z范围内以负离子模式使用电喷雾离子化(ESI)。使用甲酸钠校准质谱(MS)系统,并且使用亮内啡肽(Leu-enkephalin)作为锁定质量。使用4.1版MassLynx软件(Waters)来控制仪器,并且计算准确的质量和元素组成。此外,使用在10个样品中的每个样品之后注入的15种标准代谢物的混合物作为质量对照。在MSE模式下进行数据采集,以能量坡度记录精确的质量前体以及来自样品中每个可检测组分的碎片离子信息。MSE模式在两个功能之间快速交替:第一个功能采集低能量精确质量前提离子图谱,而第二个功能采集高能量精确质量碎片离子图谱。低能量功能的碰撞能量设置为4eV,高能量功能的碰撞能量设置为15–50eV坡度。
使用另一个梯度来分离本塞姆氏烟草(N.benthamiana)中的甘草(Glycyrrhizauralensis)酶产物:初始以75%相A洗脱5分钟,然后以75%到50%相A洗脱15分钟,以50%到30%相A洗脱2分钟,继而从30%相A转到100%相B,然后在100%相B下维持3.5分钟,然后在0.5分钟内返回到初始条件(75%相A),并且在75%相A下调节1分钟。流速为0.3mL/分钟,并且柱温保持在35℃。使用高分辨率UPLC/qTOF系统分析样品,该系统由连接到Impact HDUHR-QqTOF(布鲁克公司(Bruker))的UPLC(1290Infinity II,安捷伦科技公司(Agilent))组成。在100x2.1mm内径、1.7μm UPLC BEH C18色谱柱(Waters Acquity)上对代谢物进行分离。流动相由0.1%甲酸的乙腈:水(5:95,v/v;A相)溶液以及0.1%甲酸的乙腈溶液(B相)组成。在50-1700Da的m/z范围内以负离子模式使用电喷雾离子化(ESI),参数如下:干燥气体:200℃,8L/分钟;喷雾器:2巴;毛细管:4.2kV。
通过比较标准化合物的保留时间和质量碎片来识别代谢物。如果没有相应的标准品,则可通过将其保留时间、元素组成和碎裂过程图形与文献中的参数进行比较(表14)来确定化合物。使用TargetLynx(Waters)程序对菠菜中三萜皂苷进行相对定量。将每个样品中的皂苷峰面积标准化为内标物的峰面积,以减少源自样品处理的变率。
菠菜三萜糖苷配基的气相色谱–质谱分析(GC-MS)
用600μL 80%MeOH提取粉状冷冻组织(200mg)3次。收集的馏分在真空浓缩系统speed-vac(25℃、78mbar,隔夜(O/N))中蒸发。将干燥的残留物溶于500μL 2M HCl的50%MeOH溶液中,并在65℃加热5小时。将水解后的样品在speed-vac(50℃、78mbar、1.5小时)下蒸发至干燥。将干燥的残余物溶于200μL甲苯:MeOH(3:2;v/v)中,并且加入75μL三甲基硅烷基重氮甲烷(TMSCHN2)。将甲基化混合物在室温下温育40分钟,蒸发至干燥,然后重悬于80μL MSTFA中,在室温下温育20分钟,并且65℃温育10分钟。如前所述(31),将样品转移到玻璃插入物上,并且将1μL样品注入到GC-MS中。GC-MS系统包含COMBI PAL自动进样器(CTCAnalytics)、配有可编程温度蒸发(PTV)注射器的TRACE GC Ultra气相色谱仪以及DSQ四极质谱仪(Thermo Electron)。在30m×0.25mm×0.25μm Zebron ZB-5ms MS色谱柱(Phenomenex)上进行气相色谱(GC)。按照以下方案执行可编程温度蒸发(PTV)分流技术:在恒温不分流模式下对样品进行分析。PTV入口温度设定为280℃。使用以下色谱条件对分析物进行分离:氦气以1.2mL/分钟的流速用作载气。执行以下热梯度:以170℃开始,在该温度下保持1.5分钟,以37℃/分钟的速率坡度升到280℃,以1.5℃/分钟的速度坡度升到300℃,并且维持在300℃5.0分钟。以70eV的离子电压在电子碰撞模式下破碎洗脱液。使用Xcalibur软件(ThermoFinnigan)评估重建的离子色谱图和质谱图。将化合物的保留指数和质谱图与在同一仪器上分析的真实标准品以及相关文献报道中的对应保留指数和质谱图进行比较,以确定相关化合物(E.Biazzi等人,“CYP72A67催化了蒺藜状苜蓿溶血皂苷生物合成中的关键氧化步骤”(CYP72A67 Catalyzes a Key Oxidative Step in Medicagotruncatula Hemolytic Saponin Biosynthesis),《分子植物》(Molecular Plant),第9期第1493-1506页(2015))。
皂苷纯化以用于NMR分析
该系统由以下部件组成:配备有四元泵、自动取样器、二极管阵列检测器的Agilent 1290 Infinity II UPLC系统;Bruker/Spark Prospekt II LC-SPE系统(Spark);以及经由Bruker NMR MS Interface(BNMI-HP)连接的Impact HD UHR-QqTOF质谱仪(Bruker),如上文所述(B.Khakimov,L.H.Tseng,M.Godejohann,S.Bak,S.B.Engelsen,“使用联用分析平台筛选植物中的三萜皂苷”(Screening for Triterpenoid Saponins inPlants Using Hyphenated Analytical Platforms),《分子》(Molecules),第21期,pii:E1614(2016))。以50到1700的m/z、在负离子模式下采集MS质谱图。使用10mM三氟乙酸钠(NaTFA,Sigma-Aldrich)自动进行校准,所述校准在每次色谱运行的开始和结束时引入。在XBridge LC色谱柱(BEH C18、粒径5μm、250mm×4.6mm;Waters)上进行分离。色谱条件如下:以0.9mL/分钟的流速以及初始溶剂组成74%A(5%ACN+0.1%FA)和26%B(100%ACN+0.1%Fa),以线性梯度在60分钟时转到70%A,然后用另一线性梯度在62分钟时转到100%B,在100%B下维持3分钟,然后以线性梯度在65.5分钟时转到74%A并且在此保持4.5分钟,从而实现平衡。在预设的时间窗口中将皂苷收集在SPE柱体上,并且通过强度阈值触发捕集(trapping)。Yossoside IV(m/z 1263.58、阈值200’000、时间窗18-23分钟);YossosideXII(m/z 1233.57、阈值58’000、时间窗27-32分钟);Yossoside Va(m/z 1305.59、阈值200’000、时间窗32-40分钟);Yossoside X(m/z 1437.64、阈值150’000、时间窗40-48min);以及Yossoside V(m/z 1305.59、阈值200’000、时间窗54-65分钟)。对于该捕集过程,将水以2.5mL/分钟的流速添加到洗脱液中,然后使其通过SPE柱体,以增加分析物在柱体上的保留时间。对所述捕集使用装有GP树脂的10mm×2mm SPE柱体。以相同化合物加载每个柱体五次,捕集一次皂苷使用5-10个柱体。在进行NMR测量之前,将SPE柱体用氮气流干燥,每个柱体的馏分用总计150μL的氘代甲醇洗脱。将样品洗脱到96孔板中。合并含有相同化合物的洗脱液,使其在氮气流下干燥、冷冻干燥、重悬于200μL的D2O中,然后再次冷冻干燥以除去痕量的H2O。将干燥的化合物溶60μL 90%MeOD-d4 10%D2O中,添加0.01%的3-丙酸-2,2,3,3-d4酸钠盐(TMSP,用作1H和13C的内部化学位移参考),然后转移到1.7mm NMR试管中。
核磁共振(NMR)方法
在配备有1.7mm TXI-z和5mm TCI-xyz CryoProbe探头的Bruker AVANCE NEO-600NMR谱仪上记录NMR频谱,其中所述TCI-xyz CryoProbe探头配有屏蔽梯度线圈。所有频谱均在293K下采集。Yossoside V的NMR数据记录在1.7和5mm的CryoProbe上,并且苜蓿酸3-O-葡萄糖醛酸苷(MA-3-GlcA)的频谱在5mm CryoProbe上采集(使用专用NMR转子将1.7mm试管固定在5mm探头中)。
1H和13C化学位移分配基于不同的1D和2D NMR技术,全部使用脉冲场梯度选择。
通过1D 1H和13C、2D同核COZY以及2D异核HSQC和HMBC谱确定糖苷配基单元的结构和立体化学性质。识别单糖单元还需要记录2D同核TOCSY谱,以完成分配并且描绘各个糖单元内1H信号之间的连通性。对于Yossoside V和MA-3-GlcA,观测到HMBC谱中在间隔2-3个键的1H与13C之间存在相关性,如图21和图35D中分别示出。
以16k数据点和2.5秒的循环延迟采集1H 1D NMR谱。以65k数据点和3秒的循环延迟采集13C谱编辑的DEPTQ NMR谱。
使用16384-8192(t2)x400-512(t1)数据点采集2D 1H-1H COSY、TOCSY和ROESY谱。使用100-300ms的各向同性混合时间采集2D TOCSY谱。此项研究中使用T-ROESY实验,即无TOCSY的ROESY以有效抑制ROESY实验中的TOCSY转移。使用100-400ms的自旋锁定脉冲记录2DT-ROESY谱。
使用4096(t2)x400-512(t1)数据点记录2D 1H-13C HSQC和HMBC谱。对HSQC进行多重性编辑,进而区分生成正相关性的甲基和次甲基,以及呈现为负峰的亚甲基。设置针对长距离偶联演化的HMBC延迟,以观测JH,C=8Hz的长距离偶联。
化学位移分配以源自HMBC连通性(图21和图35D)和TOCSY相关性(数据未显示)的组合信息为基础。
表1中示出Yossoside V和MA-3-GlcA的1H和13C化学位移值。如所期望的,两种化合物的糖苷配基单元的化学位移值很好地拟合,并且观测到相似的HMBC相关性模式(图21和图35D)。质子是轴向还是沿中纬线分配是基于观测到的邻位J偶联;高值(>10Hz)表示轴向质子,ROESY谱中观测到的相关性进一步验证了这点。
糖苷配基区域中的HMBC相关性与在其他三萜皂苷中观测到的相关性一致(H.
Figure BDA0003051611980001521
等人,“来自治疝草的三萜皂苷”(A triterpene saponin from Herniariaglabra),《植物化学》(Phytochemistry),第34期第1609-13页(1993);EP Mazzola等人,“偶联HSQC实验在来自阿开木的三种复杂皂苷完整结构解释中的效用”(Utility of coupled-HSQC experiments in the intact structural elucidation of three complexsaponins from Blighia sapida),《碳水化合物研究》(Carbohydr Res.),第346期第759-68页(2011))。基于GlcA的差向氢与糖苷配基C3之间的强HMBC连通性以及所观测到的GlcA的MA-H3/差向C1之间的互补相关性,验证了MA-3-GlcA中苜蓿酸和葡萄糖醛酸之间的连接位点(图18D中的红色箭头)。类似地,根据一种糖的差向氢/碳与直接附着的聚糖的质子/碳之间的互补3-键HMBC连通性来确定糖单元之间的连接位点,如Fuc-Rha-Glc之间的糖间箭头所示(图21)。基于缺乏先前观测到的GlcA与糖苷配基之间的相关性以及GlcA中缺乏J偶联,表明Yossoside V(连接到GlcA的Xyl)中添加木糖似乎限制GlcA的构象空间。但是,化学位移预测进一步验证了Yossoside V的GlcA分配。
RNA-Seq库编制和数据分析
在做微量更改的情况下,如先前所述编制RNA-Seq库(S.Zhong等人,“高通量照明链特异性RNA测序库编制”(High-throughput illumina strand-specific RNAsequencing library preparation),《冷泉港实验方案》(Cold Spring Harb Protoc),第8期第940-9页(2011))。简言之,使用Dynabeads Oligo(dT)25(Invitrogen),以5μg的全部RNA进行poly(A)RNA捕获,将其在94℃裂解5分钟,然后洗脱。使用带有随机引物和dNTP的逆转录酶SuperScript III(Invitrogen)来合成第一链cDNA,并且使用dUTP,通过DNA聚合酶I(Enzymatics)来生成第二链cDNA。对具有Klenow 3′-5′(Enzymatics)的dA谱尾进行末端修复(Enzymatics)并且进行接头连接(Quick T4 DNA Ligase,NEB)之后,通过尿嘧啶DNA糖基化酶(Enzymatics)消化含dUTP的第二链。使用所得的第一链接头连接cDNA进行PCR富集(NEBNext High-Fidelity PCR Master Mix,NEB)14个循环。在皇冠基因组学研究所(CrownInstitute for Genomics)、南希和斯蒂芬·格兰以色列国家个性化医学中心(Nancy andStephen Grand Israel National Center for Personalized Medicine)、魏茨曼科学研究所(Weizmann Institute of Science)HiSeq2500(Illumina)的单泳道(lane)上对已编制索引的库进行合并和测序(配对末端,125bp)。使用FastQC评估原始数据的质量(S.W.Wingett、S.Andrews,“FastQ Screen:多基因组定位和质量控制工具”(FastQScreen:A tool for multi-genome mapping and quality control)第2版,《F1000Res》第7期第1338页(2018))。使用Tophat v2.0.13(C.Trapnell,L.Pachter,S.L.Salzberg,“TopHat:使用RNA-Seq发现剪接点”(TopHat:discovering splice junctions with RNA-Seq),《生物信息学》(Bioinformatics),第25期第1105-11页(2009)),将原始读段与菠菜参考基因组1.0.1版(甜菜资源(http://bvseq.boku.ac.at/Genome/Download/index.shtml))进行比对。使用HTSeq(S.Anders S、P.T.Pyl、W.Huber,“HTSeq:处理高通量测序数据的Python框架”(HTSeq--a Python framework to work with high-throughputsequencing data),《生物信息学》(Bioinformatics),第31期第166-9页(2015))进行定量,然后使用DESeq2进行标准化和差异基因表达分析(M.I.Love、W.Huber、S.Anders,“使用DESeq2对RNA-seq数据的倍数变化和分散度进行适度估计”(Moderated estimation offold change and dispersion for RNA-seq data with DESeq2),《基因组生物学》(Genome Biol),第15期第550页(2014))。
共表达分析
使用CoExpNetViz软件进行共表达分析(O.Tzfadia、T.Diels、S.De Meyer、K.Vandepoele、A.Aharoni、Y.Van de Peer,“CoExpNetViz:比较共表达网络的构建和可视化工具”(CoExpNetViz:Comparative Co-Expression Networks Construction andVisualization Tool),《植物科学前沿》(Front Plant Sci.),第6期第1194页(2016))。简言之,在共表达分析中,使用菠菜bAS(SOAP1)、CYP716A268(SOAP2)和CYP716A268v2(SOAP2样)为“饵”,将相关性的百分等级下限和上限阈值分别设置为5和95。根据每种饵的相关性系数(r>0.9;PCC)进一步筛选共表达基因的列表(表14)。使用来自不同组织和发育阶段(SO4WOLLD-来自长日照下生长的四周龄植物的成熟叶;SO8WOLSL-来自短日照下生长的八周龄植物的成熟叶;SO4WYLLD-来自长日照下生长的四周龄植物的嫩叶;SO8WOLSL-来自短日照下生长的八周龄植物的嫩叶;SO4WFBLD-来自长日照下生长的四周龄植物的花芽)的菠菜RNA-Seq转录组数据进行分析。用Cytoscape软件将共表达网络可视化(P.Shannon P等人,“Cytoscape:生物分子相互作用网络集成模型的软件环境”(Cytoscape:a softwareenvironment for integrated models of biomolecular interaction networks),《基因组研究》(Genome Res),第13期第2498-504页(2003))。
克隆
根据制造商的说明,将Phusion高保真DNA聚合酶(New England Biolabs)用于所有PCR扩增步骤。用于克隆中的限制酶和T4连接酶购自New England Biolabs。寡核苷酸引物购自Sigma-Aldrich。使用Gel/PCR提取试剂盒(Hy-Labs)纯化从琼脂糖凝胶上切除的DNA。在转化为其他异源宿主之前,使用大肠杆菌TOP10细胞(Invitrogen)进行质粒分离。使用
Figure BDA0003051611980001531
PlaSMid Mini提取试剂盒(Bioneer)从大肠杆菌培养物中分离质粒DNA。有关克隆所用引物的列表,请参见表11。
VIGS构建体制备
为了使菠菜中的候选基因沉默,从菠菜叶cDNA模板中扩增所有基因序列(200-400bp)。将纯化的扩增子插入经SacI消化的修饰pTRV2载体(插入EcoRi的约200bp的镁螯合酶亚单位H)中。
GoldenBraid系统及其在本塞姆氏烟草中的表达
对于来自同一土壤杆菌菌株的多种基因的本塞姆氏烟草瞬时表达,使用GoldenBraid 3.0(GB)系统创建多基因构建体(M.Vazquez-Vilar等人,“GB3.0:将功能性DNA元素与相关生物学数据相关联的植物生物设计平台”(GB3.0:a platform for plantbio-design that connects functional DNA elements with associated biologicaldata),《核酸研究》(Nucleic Acids Res),第45期第2196-2209页(2017))。在第一步中,通过去除BsaI和BSMBI限制位点并将其插入pUPD2 GoldenBraid入门载体中来驯化所有CDS和番茄泛激素启动子和终止子。在下一步中,将基因与终止子和启动子一起亚克隆到pDGB3α1或pDGB3α2GB载体中。一级α载体使得单个基因能够在本塞姆氏烟草中瞬时表达。随后,将pDGB3α1:SOAP1与pDGB3α2:SOAP2合并为pDGB3Ω1:SOAP1+SOAP2,并且将pDGB3α1:SOAP3和pDGB3α2:SOAP4合并为pDGB3Ω2:SOAP3+SOAP4。Ω载体的合并使得能够表达四种基因,从而实现在本生本塞姆氏烟草中生成苜蓿酸。将其他基因、纤维素合酶样G(SOAP5)、糖基转移酶(SOAP6-9)和酰基转移酶(SOAP10)用于α载体中。使用相同的方法克隆来自奎奴亚藜(C.quinoa)、甜菜(B.vulgaris)、百脉根(L.japonicus)、橹豆(G.max)、紫苜蓿(M.sativa)和甘草(G.uralensis)的基因。对于cDNA模板制备,使用从2周龄幼苗(百脉根(L.japonicus)、橹豆(G.max)、紫苜蓿(M.sativa)和甘草(G.uralensis))、成熟叶(甜菜(B.vulgaris))或花芽周边叶(奎奴亚藜(C.quinoa))中提取RNA。
克隆到酵母系统(pESC)中
对SOAP1(bAS)、CYP(SOAP2-4)和CSLG(SOAP5)在酿酒酵母(S.cerevisiae)中的表达,从带有目的序列克隆pDGB3α载体扩增序列,并且将纯化的扩增子插入pESC(AmpR)系列中,从而实现来自同一个质粒的两种基因的同时表达。分别使用NotI/SacI和BamHI/SalI限制酶将SOAP1和SOAP2插入pESC-HIS质粒中。分别使用NotI/SacI和BamHI/XhoI限制酶将SOAP3和SOAP4插入pESC-LEU质粒中。分别使用NotI/SacI和SalI/XhoI限制酶将SOAP5和SoUGD1插入pESC-LEU质粒中。
克隆到pET-28b中并在大肠杆菌中表达
使用NdeI/NotI限制性酶位点将SOAP10克隆到pET-28b(KanR)载体中,并在大肠杆菌BL21(DE3)细胞中表达。
用SOAP10进行体外酶促测定
使得用pET-28b:SOAP10转化的细菌细胞在LB培养基中在37℃生长。当培养物达到A600=0.6时,在15℃用200μM异丙基-1-硫代-β-D-半乳吡喃糖苷(IPTG)诱导蛋白表达24小时。通过在50mM Tris-HCl pH 8.0、10%甘油、0.1%粹通(Triton)X-100、1mM PMSF和100mg/mL溶菌酶中进行超声处理以裂解细菌细胞。
将菠菜脱乙酰皂苷的馏分用作SOAP10酶测定中的底物。在200μL试管中,将6μL细胞裂解液与2μL 6.18mM乙酰基辅酶A(乙酰基-辅酶)和2mL皂苷底物(10μg)混合。在28℃进行反应2.5小时。将没有SOAP10的细胞裂解液用作对照。加入20μL甲醇终止反应,然后短暂涡旋。最后,将提取物离心分离10分钟。如上所述,以14,000x g提取并通过LC-MS进行分析。
VIGS程序
如先前所述进行病毒诱导的基因沉默(M.Senthil-Kumar、K.S.Mysore等人,“本赛姆氏烟草中基于烟草脆裂病毒诱导的基因沉默”(Tobacco rattle virus-based virus-induced gene silencing in Nicotiana benthamiana),《自然实验步骤》(Nat Protoc.)第9期第1549-62页(2014))。简言之,将具有沉默序列的pTRV1和pTRV2构建体转化到根癌土壤杆菌(Agrobacterium tumefaciens)(GV3101)电感受态细胞中。使转化株在28℃,在含有50μg/mL卡那霉素和50μg/mL庆大霉素的LB平板中生长。用单个菌落接种补充有抗生素的10mL LB培养基,并且使其在28℃隔夜(O/N)生长。将细胞以3,000x g离心分离10分钟,并且除去上清液。将颗粒重悬于5mL浸润培养基(100mM MES缓冲液、2mM Na3PO4·12H2O,100μM乙酰丁香酮)中并且再次离心分离。将颗粒再次重悬于10mL渗透培养基中,并且在室温下温育2小时。用无针1mL注射器将根癌土壤杆菌悬浮液(每种菌株的OD600=0.3)浸入1周龄菠菜子叶(每株植物一个)的下侧。使植物在23℃的光照下生长16小时。2周后,首先观测到镁螯合酶亚单位H(CHCL)沉默的迹象。在收集组织之前,使植物再生长2周。收获叶,将其冷冻在液氮中,并且储存在-80℃以备后期使用。生物复制体由来自不同植物的4个叶组成。下表10提供用于使红甜菜和菠菜中的CSLG沉默的菠菜和红甜菜核酸序列
表10:VIG序列
Figure BDA0003051611980001541
Figure BDA0003051611980001551
SOAP5的定点诱变
根据制造商的说明,使用QuikChange定点诱变试剂盒(Agilent)执行SOAP5的定点诱变。
基因表达分析–qPCR
对每个VIGS沉默品系的三/四个生物复制体(n=3/4)进行基因表达分析。通过Trizol方法(Sigma-Aldrich)进行RNA分离。使用高容量cDNA逆转录试剂盒(AppliedBiosystems)对经DNase I(Sigma-Aldrich)处理的RNA进行逆转录。用Primer Blast软件(NCBI)来设计基因特异性寡核苷酸。将翻译延伸因子α1(EF1-α)基因用作内源性对照。所用的寡核苷酸在表11中示出。
表11:所用引物列表
Figure BDA0003051611980001561
Figure BDA0003051611980001571
Figure BDA0003051611980001581
Figure BDA0003051611980001591
Figure BDA0003051611980001601
Figure BDA0003051611980001611
Figure BDA0003051611980001621
Figure BDA0003051611980001631
Figure BDA0003051611980001641
Figure BDA0003051611980001651
Figure BDA0003051611980001661
Figure BDA0003051611980001671
Figure BDA0003051611980001681
Figure BDA0003051611980001691
Figure BDA0003051611980001701
本塞姆氏烟草的瞬时表达和候选基因筛选
将具有pDBG3α和pDBG3Ω构建体转化到根癌土壤杆菌(Agrobacteriumtumefaciens)(GV3101)电感受态细胞中。使转化株在28℃,在含有50μg/mL卡那霉素(pDBG3α)或200μg/mL大观霉素(pDBG3Ω)和50μg/mL庆大霉素的LB平板中生长。用单个菌落接种补充有抗生素的10mL LB培养基,并且使其在28℃隔夜(O/N)生长。将细胞以3,000x g离心分离10分钟,并且除去上清液。将颗粒重悬于5ml浸润培养基(100mM MES缓冲液、2mM Na3PO4·12H2O,100μM乙酰丁香酮)中并且再次离心分离。将颗粒再次重悬于10mL渗透培养基中,并在室温下温育2小时。用无针1mL注射器将根癌土壤杆菌悬浮液(每种菌株的OD 600=0.3)浸入本塞姆氏烟草叶的下侧。使植物在16小时光照周期下生长4-5周,然后进行浸入。浸入之后的4天收获叶,将其冷冻在液氮中,并且储存在-80℃以备后期使用。生物复制体由来自不同烟草植物的若干个叶组成。
SOAP基因在酿酒酵母WAT 11中的表达和代谢物提取
使用YeastmakerTM酵母转化系统(Clontech)将pESC构建体转化为酿酒酵母WAT11。用pESC载体的各种组合转化酵母细胞,从而表达一种(SOAP5)、两种(SOAP1-2)、四种(SOAP1-4)、五种(SOAP1-5或SOAP1-4+SoUGD1)和6种基因(SOAP1-5+SoUGD1)。使转化的酵母在补充有适当氨基酸和2%葡萄糖的SD基本培养基上生长。筛选菌落,并且通过菌落PCR确认转基因的存在。为诱导基因表达,将转化的细胞转移到含2%半乳糖的基本培养基中,使其在30℃生长24小时。以700x g将培养物离心分离10分钟,将颗粒重悬于1mL H2O中,转移至2mL Eppendorf管中,并且再次以8,000x g离心分离一分钟。将细胞颗粒称重,加入等量的水和两倍量的玻璃珠(直径500μm)并且涡旋5次,持续1分钟,每次涡旋之间将细胞置于冰上1分钟。将裂解的细胞与500μL甲醇混合,并以14'000rpm离心分离5分钟,收集澄清的上清液,并在SpeedVac中隔夜(O/N)干燥。将干燥残余物溶于150μL 80%甲醇中,通过0.22μm过滤器过滤,并在LC-MS上进行分析。
亚细胞定位和共聚焦显微镜分析
使用GoldenBraid系统制备使得能够表达与荧光蛋白(FP)融合的研究蛋白的质粒(M.Vazquez-Vilar等人,(2017),同上)。使用SOAP1:GFP、与-GFP或-RFP融合的SOAP 2-4以及SOAP5:RFP。使用从ABRC(ER-gk CD3-955和G-gk CD3-963)获得的质粒作为细胞室标志物(B.K.Nelson、X.Cai、A.Nebenführ,彩色体内细胞器标志物组用于拟南芥和其他植物中的共定位研究”(Amulticolored set of in vivo organelle markers for co-localization studies in Arabidopsis and other plants),《植物杂志》(Plant J),第51期第1126-36页(2007))。
对于菠菜纤维素合酶G的亚细胞定位研究,SOAP5:RFP与ER或Golgi标志物一起在本塞姆氏烟草表皮细胞中瞬时表达。使用0.15的A600nm细菌吸光度渗透每种根癌土壤杆菌菌株。渗透后72小时后,收集叶盘(直径约0.4厘米),并通过共聚焦显微镜使用以下参数来进行荧光分析:用Nikon eclipse A1显微镜在488nm的激光下观测激发的荧光,并且采集GFP(ER或Golgi标志物)的图像和561nm的红色荧光蛋白(RFP)信号的图像。为了增加信噪比,对每个扫描像素进行采样四次并取平均值。使用相同的参数来检查SOAP基因的共定位。
荧光共振能量转移(FRET)分析
使用FRET分析器插件(M.Hachet-Haas等人,“FRET和共定位分析仪:用于验证通过共聚焦显微镜采集敏化发射FRET的测量值的方法、可作为ImageJ Plug-in插件提供”(FRETand colocalization analyzer a method to validate measurements of sensitizedemission FRET acquired by confocal microscopy and available as an ImageJPlug-in),《显微镜研究与技术》(Microsc Res Tech),第69期第941-56页(2006))FIJI/ImageJ来计算平均FRET指数(即,应用阈值以去除背景噪声后,由于FRET引起强度下每个像素中受体、mRFP融合蛋白的平均值)。对于每个蛋白质组合的邻近/相互作用测试,针对三个独立的图像计算平均FRET指数。使用仅表达GFP和RFP的细胞来计算供体和受体渗出。
系统发育分析
使用Blastp选项在NC表12非冗余蛋白数据库(http://blast.ncbi.nlm.nih.gov/Blast.cgi)上使用各种查询序列进行同源性搜索。使用Muscle算法对蛋白质序列进行比对,并且通过RAxML快速引导和随后的ML搜索来推断系统发育树(A.Stamatakis,“RAxML版本8:大型系统发育分析和后分析工具”(RAxML version 8:a tool for phylogeneticanalysis and post-analysis of large phylogenies),《生物信息学》(Bioinformatics),第30期第1312-3页(2014))。在跨位点速率异质性的GAMMA模型下,对最终树的可能性进行评估和优化。以最高达0.1000000000对数似然值单位的精度对GAMMA模型参数进行估计。使用RAxML的快速引导程序选项执行一千个引导程序复制。所用的替换矩阵为DAYHOFF。用iTOL将系统发育树可视化(I.Letunic、P.Bork,“交互式生命树(iTOL)v3:显示和注释系统发育树和其他树的在线工具(Interactive tree of life(iTOL)v3:anonline tool for the display and annotation of phylogenetic and other trees),《核酸研究》(Nucleic Acids Res),第44期,W242-5(2016))。
紫苜蓿(M.sativa)毛状根中MsCSL的沉默
使用GoldenBraid系统生成具有在35S启动子下靶向MsCSL的反义RNA和35S:KanR盒的载体pDBG3α2。如前所述进行紫苜蓿的转化以及转基因毛状根的生成(A.Boisson-Dernier、M.Chabaud、F.Garcia、G.Bécard、C.Rosenberg、DG Barker,“毛根土壤杆菌转化的蒺藜状苜蓿根,用于固氮和内生菌根共生关系的研究”(Agrobacterium rhizogenes-transformed roots of Medicago truncatula for the study of nitrogen-fixing andendomycorrhizal symbiotic associations),《分子植物-微生物相互作用》(Mol PlantMicrobe Interact),第14期第695-700页(2001年))。代替Arqua1,使用ATCC15834发根毛根土壤杆菌菌株。如上所述收集转基因根、研磨并提取代谢物。
基于模板的蛋白质结构建模
以与环二GMP和UDP的复合物中的类球红细菌(Rhodobacter sphaeroides)纤维素合酶的晶体结构为模板(PDB条目:4P00)(J.L.Morgan、J.T.McNamara、J.Zimmer,“环二GMP激活细菌纤维素合酶的机制”(MechaniSM of activation of bacterial cellulosesynthase by cyclic di-GMP),《自然-结构与分子生物学》(Nat Struct Mol Biol),第21期第489-96页(2014)),使用RaptorX生成SOAP5同源模型(M.
Figure BDA0003051611980001721
等人,“使用RaptorXWeb服务器的基于模板的蛋白质结构建模”(Template-based protein structuremodeling using the RaptorX web server),《自然实验步骤》(Nature Protocols),第7期第1511–1522页(2012))。将最佳模型用作MOLE 2.5的模板。MOLE 2.5是用于自动定位和表征通道、隧道和孔隙的通用工具包(L.Pravda等人,“MOLEonline:基于网络的通道,隧道和孔隙分析工具”(MOLEonline:a web-based tool for analyzing channels,tunnels andpores)(2018年更新)《核酸研究》(Nucleic Acids Res),第46期,W368-W373(2018))。用Protter生成表示SOAP5跨膜拓扑的方案(U.Omasits、C.H.Ahrens、S.Müller、B.Wollscheid,“Protter:交互式蛋白质特征可视化以及与实验蛋白质组学数据的集成”(eid,Protter:interactive protein feature visualization and integration withexperimental),《生物信息学》(Bioinformatics)第30期第884-6页(2014))。
实施例15:菠菜中三萜皂苷的生物合成途径
目标:发现石竹目(Caryophyllales)成员菠菜(Spinacia oleracea)中三萜皂苷生物合成途径(菠菜),特别是参与三萜皂苷糖基化的酶。
方法:使用液相色谱-质谱法对菠菜叶中皂苷进行分析。参见以上材料和方法。
结果:
菠菜叶的分析(使用LC-MS)揭示一种复杂的三萜皂苷混合物(图18、图19A-19P、表12),其中包含20多种以苜蓿酸作为糖苷配基的分子,其中约一半被乙酰化。下表13提供图18下部扫描中由数字标识的每种化合物的详细信息。下表12使用以下术语:样品-产生样品的实验类型/基因型;保留时间-保留时间,以分钟为单位;指定名称-推定代谢物标识;分子式-代谢物或其FA加合物的分子式;理论m/z-针对离子[M-H]-、[M+H]+计算的理论单一同位素质量;实测m/z-实测质量;m/z误差(ppm)-理论值与实测m/z值之间的差异,以ppm为单位;MS/MS碎片-从离子[M-H]-、[M+H]+获得的碎片;MS/MS CE(eV)-用于碎片的碰撞能量;UV/Vis-最大UV/Vis吸光度。如“材料和方法”中所述,在LC条件下,在配备有Acquity 2996PDA检测器的UPLC(Waters,Acquity)仪器上获得UV/Vis谱(200–600nm)。(S)-由标准化合物确认的标识;(NMR)-通过NMR确认的标识;MA-苜蓿酸;AA-奥古斯丁酸(2-羟基齐墩果酸);B-巴约甙元;PG-聚galagenin;OA-齐墩果酸;G-丝石竹皂苷配基;GA-丝石竹酸;H-常春藤苷配基;GhA-甘草次酸;hexA-己糖醛酸;hex-己糖;dhex-脱氧己糖;pent-戊糖;GlcA-葡萄糖醛酸;Ac–乙酰基。
表12:基于质谱的研究植物中三萜皂苷识别。
Figure BDA0003051611980001741
Figure BDA0003051611980001751
Figure BDA0003051611980001761
Figure BDA0003051611980001771
Figure BDA0003051611980001781
Figure BDA0003051611980001791
Figure BDA0003051611980001801
Figure BDA0003051611980001811
Figure BDA0003051611980001821
Figure BDA0003051611980001831
Figure BDA0003051611980001841
Figure BDA0003051611980001851
Figure BDA0003051611980001861
Figure BDA0003051611980001871
Figure BDA0003051611980001881
Figure BDA0003051611980001891
表13:菠菜中皂苷成分汇总
Figure BDA0003051611980001901
经过质谱碎片化分析以及一系列1D和2D-NMR实验,确定菠菜皂苷含量最高的结构(此处称为Yossoside V)。其中包含具有附着到C-3位置处羟基的葡萄糖醛酸和木糖的苜蓿酸(糖苷配基),以及连接到C-28处的羧基的乙酰基岩藻糖、鼠李糖和葡萄糖(图20A-20C、图21)。
概述:识别菠菜中的11种三萜皂苷,其中Yossiside V的丰度最高。
实施例16:使用菠菜转录组数据识别皂苷生物合成基因
目标:识别三萜皂苷生物合成途径中的三萜糖苷配基生物合成基因。
方法:参见以上材料和方法。
结果:从呈现出不同皂苷含量的五个菠菜组织生成转录组数据,并且根据其在高含量皂苷和低含量皂苷样品之间的差异表达以及其与已知三萜糖苷配基生物合成基因的同源性来选择候选基因(E.Biazzi等人,“CYP72A67催化蒺藜状苜蓿溶血皂苷生物合成中的关键氧化步骤”(CYP72A67 Catalyzes a Key Oxidative Step in Medicago truncatulaHemolytic Saponin Biosynthesis),《分子植物》(Molecular Plant),第8期第1493-1506页(2015))。
检查三个候选物的基因组位置,包含:皂苷β-香树素合酶(SobAS;命名为SOAP1;Sp_107620_kpnh;SEQ ID NO:45[基因序列]、SEQ ID NO:48[多肽序列])、细胞色素P450CYP716A268(SOAP2;Sp_107660_kiqg;SEQ ID NO:46[基因序列]、SEQ ID NO:49[多肽序列])以及CYP716A268v2(SOAP2样;Sp_107670_ptqx;SEQ ID NO:47[基因序列]、SEQ IDNO:6[多肽序列]),其以代谢基因簇的形式揭示其紧密物理基因组位置(图22A和22B)。
菠菜中SOAP1和SOAP2的病毒诱导基因沉默(VIGS)测定致使皂苷含量降低(图23A-23D),而其在本塞姆氏烟草中的过表达致使生成β-香树素和齐墩果酸(图24A和24B)。
概述:这些结果为这些基因是菠菜皂苷生物合成中所涉及的基因提供了有力证据。
实施例17:共表达分析,用于识别其他皂苷生物合成基因和编码酶的表征
目标:识别三萜皂苷生物合成途径中的额外三萜糖苷配基生物合成基因。
方法:参见以上材料和方法。
结果:随后将SOAP1、SOAP2和SOAP2样核苷酸(表达的核苷酸序列SEQ ID NO:45-47后续用作共表达分析中的饵(r>0.9;Pearson相关系数-PCC)),并且使用VIGS识别出编码p450细胞色素的另外五种基因、编码糖基转移酶的八种基因以及编码酰基转移酶的五种基因以进行功能表征(图20A和20B;表14)。[SOAP1、Soap2和SOAP2类核苷酸分别编码多肽序列:SEQ ID NO:48、SEQ ID NO:49和SEQ ID NO:50)。这些实验表明,CYP72A655(SOAP3;Sp_085340_meek;SEQ ID NO:51[核苷酸]、SEQ ID NO:52[多肽])和CYP72A654(SOAP4;Sp_040350_wdny;SEQ ID NO:53[核苷酸]、SEQ ID NO:54[多肽])参与Yossoside糖苷配基的生物合成(图25)。在下表14中,所使用的术语包含:共表达的基因-共表达相关系数大于0.9的基因;注解-基于针对拟南芥蛋白质组(TAIR10)blast分析的基因功能注解;以及aa seq-共表达基因的氨基酸序列;
表14:菠菜基因与三种饵-SOAP1、SOAP2和SOAP2类基因的共表达分析
Figure BDA0003051611980001921
Figure BDA0003051611980001931
Figure BDA0003051611980001941
Figure BDA0003051611980001951
Figure BDA0003051611980001961
Figure BDA0003051611980001971
Figure BDA0003051611980001981
Figure BDA0003051611980001991
Figure BDA0003051611980002001
Figure BDA0003051611980002011
Figure BDA0003051611980002021
Figure BDA0003051611980002031
Figure BDA0003051611980002041
Figure BDA0003051611980002051
Figure BDA0003051611980002061
Figure BDA0003051611980002071
Figure BDA0003051611980002081
Figure BDA0003051611980002091
Figure BDA0003051611980002101
Figure BDA0003051611980002111
Figure BDA0003051611980002121
Figure BDA0003051611980002131
Figure BDA0003051611980002141
Figure BDA0003051611980002151
Figure BDA0003051611980002161
Figure BDA0003051611980002171
Figure BDA0003051611980002181
Figure BDA0003051611980002191
Figure BDA0003051611980002201
Figure BDA0003051611980002211
Figure BDA0003051611980002221
Figure BDA0003051611980002231
Figure BDA0003051611980002241
Figure BDA0003051611980002251
Figure BDA0003051611980002261
Figure BDA0003051611980002271
Figure BDA0003051611980002281
Figure BDA0003051611980002291
Figure BDA0003051611980002301
Figure BDA0003051611980002311
Figure BDA0003051611980002321
Figure BDA0003051611980002331
Figure BDA0003051611980002341
Figure BDA0003051611980002351
Figure BDA0003051611980002361
Figure BDA0003051611980002371
Figure BDA0003051611980002381
Figure BDA0003051611980002391
Figure BDA0003051611980002401
Figure BDA0003051611980002411
Figure BDA0003051611980002421
Figure BDA0003051611980002431
Figure BDA0003051611980002441
Figure BDA0003051611980002451
Figure BDA0003051611980002461
Figure BDA0003051611980002471
Figure BDA0003051611980002481
Figure BDA0003051611980002491
Figure BDA0003051611980002501
Figure BDA0003051611980002511
Figure BDA0003051611980002521
Figure BDA0003051611980002531
Figure BDA0003051611980002541
Figure BDA0003051611980002551
Figure BDA0003051611980002561
Figure BDA0003051611980002571
Figure BDA0003051611980002581
Figure BDA0003051611980002591
Figure BDA0003051611980002601
Figure BDA0003051611980002611
Figure BDA0003051611980002621
Figure BDA0003051611980002631
Figure BDA0003051611980002641
Figure BDA0003051611980002651
Figure BDA0003051611980002661
Figure BDA0003051611980002671
Figure BDA0003051611980002681
Figure BDA0003051611980002691
Figure BDA0003051611980002701
Figure BDA0003051611980002711
Figure BDA0003051611980002721
Figure BDA0003051611980002731
Figure BDA0003051611980002741
Figure BDA0003051611980002751
Figure BDA0003051611980002761
Figure BDA0003051611980002771
Figure BDA0003051611980002781
Figure BDA0003051611980002791
Figure BDA0003051611980002801
Figure BDA0003051611980002811
Figure BDA0003051611980002821
Figure BDA0003051611980002831
Figure BDA0003051611980002841
Figure BDA0003051611980002851
Figure BDA0003051611980002861
Figure BDA0003051611980002871
Figure BDA0003051611980002881
Figure BDA0003051611980002891
Figure BDA0003051611980002901
Figure BDA0003051611980002911
Figure BDA0003051611980002921
Figure BDA0003051611980002931
Figure BDA0003051611980002941
Figure BDA0003051611980002951
Figure BDA0003051611980002961
Figure BDA0003051611980002971
Figure BDA0003051611980002981
Figure BDA0003051611980002991
Figure BDA0003051611980003001
Figure BDA0003051611980003011
Figure BDA0003051611980003021
Figure BDA0003051611980003031
Figure BDA0003051611980003041
Figure BDA0003051611980003051
Figure BDA0003051611980003061
Figure BDA0003051611980003071
Figure BDA0003051611980003081
Figure BDA0003051611980003091
Figure BDA0003051611980003101
Figure BDA0003051611980003111
Figure BDA0003051611980003121
Figure BDA0003051611980003131
Figure BDA0003051611980003141
Figure BDA0003051611980003151
Figure BDA0003051611980003161
Figure BDA0003051611980003171
Figure BDA0003051611980003181
Figure BDA0003051611980003191
Figure BDA0003051611980003201
Figure BDA0003051611980003211
Figure BDA0003051611980003221
Figure BDA0003051611980003231
Figure BDA0003051611980003241
Figure BDA0003051611980003251
Figure BDA0003051611980003261
Figure BDA0003051611980003271
Figure BDA0003051611980003281
Figure BDA0003051611980003291
Figure BDA0003051611980003301
Figure BDA0003051611980003311
Figure BDA0003051611980003321
Figure BDA0003051611980003331
Figure BDA0003051611980003341
Figure BDA0003051611980003351
Figure BDA0003051611980003361
Figure BDA0003051611980003371
Figure BDA0003051611980003381
Figure BDA0003051611980003391
Figure BDA0003051611980003401
Figure BDA0003051611980003411
Figure BDA0003051611980003421
Figure BDA0003051611980003431
Figure BDA0003051611980003441
Figure BDA0003051611980003451
Figure BDA0003051611980003461
Figure BDA0003051611980003471
Figure BDA0003051611980003481
Figure BDA0003051611980003491
Figure BDA0003051611980003501
Figure BDA0003051611980003511
Figure BDA0003051611980003521
Figure BDA0003051611980003531
Figure BDA0003051611980003541
Figure BDA0003051611980003551
Figure BDA0003051611980003561
Figure BDA0003051611980003571
Figure BDA0003051611980003581
Figure BDA0003051611980003591
Figure BDA0003051611980003601
Figure BDA0003051611980003611
Figure BDA0003051611980003621
Figure BDA0003051611980003631
Figure BDA0003051611980003641
Figure BDA0003051611980003651
Figure BDA0003051611980003661
Figure BDA0003051611980003671
Figure BDA0003051611980003681
Figure BDA0003051611980003691
Figure BDA0003051611980003701
Figure BDA0003051611980003711
Figure BDA0003051611980003721
Figure BDA0003051611980003731
Figure BDA0003051611980003741
Figure BDA0003051611980003751
Figure BDA0003051611980003761
Figure BDA0003051611980003771
Figure BDA0003051611980003781
Figure BDA0003051611980003791
Figure BDA0003051611980003801
Figure BDA0003051611980003811
Figure BDA0003051611980003821
Figure BDA0003051611980003831
Figure BDA0003051611980003841
Figure BDA0003051611980003851
Figure BDA0003051611980003861
Figure BDA0003051611980003871
Figure BDA0003051611980003881
Figure BDA0003051611980003891
Figure BDA0003051611980003901
Figure BDA0003051611980003911
Figure BDA0003051611980003921
Figure BDA0003051611980003931
Figure BDA0003051611980003941
Figure BDA0003051611980003951
Figure BDA0003051611980003961
Figure BDA0003051611980003971
Figure BDA0003051611980003981
Figure BDA0003051611980003991
Figure BDA0003051611980004001
Figure BDA0003051611980004011
Figure BDA0003051611980004021
Figure BDA0003051611980004031
Figure BDA0003051611980004041
Figure BDA0003051611980004051
Figure BDA0003051611980004061
Figure BDA0003051611980004071
Figure BDA0003051611980004081
Figure BDA0003051611980004091
Figure BDA0003051611980004101
Figure BDA0003051611980004111
Figure BDA0003051611980004121
Figure BDA0003051611980004131
Figure BDA0003051611980004141
Figure BDA0003051611980004151
Figure BDA0003051611980004161
Figure BDA0003051611980004171
Figure BDA0003051611980004181
Figure BDA0003051611980004191
Figure BDA0003051611980004201
Figure BDA0003051611980004211
Figure BDA0003051611980004221
Figure BDA0003051611980004231
Figure BDA0003051611980004241
Figure BDA0003051611980004251
Figure BDA0003051611980004261
Figure BDA0003051611980004271
Figure BDA0003051611980004281
Figure BDA0003051611980004291
Figure BDA0003051611980004301
Figure BDA0003051611980004311
Figure BDA0003051611980004321
Figure BDA0003051611980004331
Figure BDA0003051611980004341
Figure BDA0003051611980004351
Figure BDA0003051611980004361
Figure BDA0003051611980004371
Figure BDA0003051611980004381
Figure BDA0003051611980004391
Figure BDA0003051611980004401
Figure BDA0003051611980004411
Figure BDA0003051611980004421
Figure BDA0003051611980004431
Figure BDA0003051611980004441
Figure BDA0003051611980004451
Figure BDA0003051611980004461
Figure BDA0003051611980004471
Figure BDA0003051611980004481
Figure BDA0003051611980004491
Figure BDA0003051611980004501
Figure BDA0003051611980004511
Figure BDA0003051611980004521
Figure BDA0003051611980004531
Figure BDA0003051611980004541
Figure BDA0003051611980004551
Figure BDA0003051611980004561
Figure BDA0003051611980004571
Figure BDA0003051611980004581
Figure BDA0003051611980004591
Figure BDA0003051611980004601
Figure BDA0003051611980004611
Figure BDA0003051611980004621
Figure BDA0003051611980004631
Figure BDA0003051611980004641
Figure BDA0003051611980004651
Figure BDA0003051611980004661
Figure BDA0003051611980004671
Figure BDA0003051611980004681
Figure BDA0003051611980004691
Figure BDA0003051611980004701
Figure BDA0003051611980004711
Figure BDA0003051611980004721
Figure BDA0003051611980004731
Figure BDA0003051611980004741
Figure BDA0003051611980004751
Figure BDA0003051611980004761
Figure BDA0003051611980004771
Figure BDA0003051611980004781
Figure BDA0003051611980004791
Figure BDA0003051611980004801
Figure BDA0003051611980004811
Figure BDA0003051611980004821
Figure BDA0003051611980004831
Figure BDA0003051611980004841
Figure BDA0003051611980004851
Figure BDA0003051611980004861
Figure BDA0003051611980004871
Figure BDA0003051611980004881
Figure BDA0003051611980004891
Figure BDA0003051611980004901
Figure BDA0003051611980004911
Figure BDA0003051611980004921
Figure BDA0003051611980004931
Figure BDA0003051611980004941
Figure BDA0003051611980004951
Figure BDA0003051611980004961
Figure BDA0003051611980004971
Figure BDA0003051611980004981
Figure BDA0003051611980004991
Figure BDA0003051611980005001
Figure BDA0003051611980005011
Figure BDA0003051611980005021
Figure BDA0003051611980005031
Figure BDA0003051611980005041
Figure BDA0003051611980005051
Figure BDA0003051611980005061
Figure BDA0003051611980005071
Figure BDA0003051611980005081
Figure BDA0003051611980005091
Figure BDA0003051611980005101
Figure BDA0003051611980005111
Figure BDA0003051611980005121
Figure BDA0003051611980005131
Figure BDA0003051611980005141
Figure BDA0003051611980005151
Figure BDA0003051611980005161
Figure BDA0003051611980005171
Figure BDA0003051611980005181
Figure BDA0003051611980005191
Figure BDA0003051611980005201
Figure BDA0003051611980005211
Figure BDA0003051611980005221
Figure BDA0003051611980005231
Figure BDA0003051611980005241
Figure BDA0003051611980005251
Figure BDA0003051611980005261
Figure BDA0003051611980005271
Figure BDA0003051611980005281
Figure BDA0003051611980005291
Figure BDA0003051611980005301
Figure BDA0003051611980005311
Figure BDA0003051611980005321
Figure BDA0003051611980005331
Figure BDA0003051611980005341
Figure BDA0003051611980005351
Figure BDA0003051611980005361
Figure BDA0003051611980005371
Figure BDA0003051611980005381
Figure BDA0003051611980005391
Figure BDA0003051611980005401
Figure BDA0003051611980005411
Figure BDA0003051611980005421
Figure BDA0003051611980005431
Figure BDA0003051611980005441
Figure BDA0003051611980005451
Figure BDA0003051611980005461
Figure BDA0003051611980005471
Figure BDA0003051611980005481
Figure BDA0003051611980005491
Figure BDA0003051611980005501
Figure BDA0003051611980005511
Figure BDA0003051611980005521
Figure BDA0003051611980005531
Figure BDA0003051611980005541
Figure BDA0003051611980005551
Figure BDA0003051611980005561
Figure BDA0003051611980005571
Figure BDA0003051611980005581
Figure BDA0003051611980005591
Figure BDA0003051611980005601
Figure BDA0003051611980005611
Figure BDA0003051611980005621
Figure BDA0003051611980005631
Figure BDA0003051611980005641
Figure BDA0003051611980005651
Figure BDA0003051611980005661
Figure BDA0003051611980005671
Figure BDA0003051611980005681
Figure BDA0003051611980005691
Figure BDA0003051611980005701
Figure BDA0003051611980005711
Figure BDA0003051611980005721
Figure BDA0003051611980005731
Figure BDA0003051611980005741
Figure BDA0003051611980005751
Figure BDA0003051611980005761
Figure BDA0003051611980005771
Figure BDA0003051611980005781
Figure BDA0003051611980005791
Figure BDA0003051611980005801
Figure BDA0003051611980005811
Figure BDA0003051611980005821
Figure BDA0003051611980005831
Figure BDA0003051611980005841
Figure BDA0003051611980005851
Figure BDA0003051611980005861
Figure BDA0003051611980005871
Figure BDA0003051611980005881
Figure BDA0003051611980005891
Figure BDA0003051611980005901
Figure BDA0003051611980005911
Figure BDA0003051611980005921
Figure BDA0003051611980005931
Figure BDA0003051611980005941
Figure BDA0003051611980005951
Figure BDA0003051611980005961
Figure BDA0003051611980005971
Figure BDA0003051611980005981
Figure BDA0003051611980005991
Figure BDA0003051611980006001
Figure BDA0003051611980006011
Figure BDA0003051611980006021
Figure BDA0003051611980006031
Figure BDA0003051611980006041
Figure BDA0003051611980006051
Figure BDA0003051611980006061
Figure BDA0003051611980006071
Figure BDA0003051611980006081
Figure BDA0003051611980006091
Figure BDA0003051611980006101
Figure BDA0003051611980006111
Figure BDA0003051611980006121
Figure BDA0003051611980006131
Figure BDA0003051611980006141
Figure BDA0003051611980006151
Figure BDA0003051611980006161
Figure BDA0003051611980006171
Figure BDA0003051611980006181
Figure BDA0003051611980006191
Figure BDA0003051611980006201
Figure BDA0003051611980006211
Figure BDA0003051611980006221
Figure BDA0003051611980006231
Figure BDA0003051611980006241
Figure BDA0003051611980006251
Figure BDA0003051611980006261
Figure BDA0003051611980006271
Figure BDA0003051611980006281
Figure BDA0003051611980006291
Figure BDA0003051611980006301
Figure BDA0003051611980006311
Figure BDA0003051611980006321
Figure BDA0003051611980006331
Figure BDA0003051611980006341
Figure BDA0003051611980006351
Figure BDA0003051611980006361
Figure BDA0003051611980006371
Figure BDA0003051611980006381
Figure BDA0003051611980006391
Figure BDA0003051611980006401
Figure BDA0003051611980006411
Figure BDA0003051611980006421
Figure BDA0003051611980006431
Figure BDA0003051611980006441
Figure BDA0003051611980006451
Figure BDA0003051611980006461
Figure BDA0003051611980006471
Figure BDA0003051611980006481
Figure BDA0003051611980006491
Figure BDA0003051611980006501
Figure BDA0003051611980006511
Figure BDA0003051611980006521
Figure BDA0003051611980006531
Figure BDA0003051611980006541
Figure BDA0003051611980006551
Figure BDA0003051611980006561
Figure BDA0003051611980006571
Figure BDA0003051611980006581
Figure BDA0003051611980006591
Figure BDA0003051611980006601
Figure BDA0003051611980006611
Figure BDA0003051611980006621
Figure BDA0003051611980006631
Figure BDA0003051611980006641
Figure BDA0003051611980006651
Figure BDA0003051611980006661
Figure BDA0003051611980006671
Figure BDA0003051611980006681
Figure BDA0003051611980006691
Figure BDA0003051611980006701
Figure BDA0003051611980006711
Figure BDA0003051611980006721
Figure BDA0003051611980006731
Figure BDA0003051611980006741
Figure BDA0003051611980006751
Figure BDA0003051611980006761
Figure BDA0003051611980006771
Figure BDA0003051611980006781
Figure BDA0003051611980006791
Figure BDA0003051611980006801
Figure BDA0003051611980006811
Figure BDA0003051611980006821
Figure BDA0003051611980006831
Figure BDA0003051611980006841
Figure BDA0003051611980006851
Figure BDA0003051611980006861
Figure BDA0003051611980006871
Figure BDA0003051611980006881
Figure BDA0003051611980006891
Figure BDA0003051611980006901
Figure BDA0003051611980006911
Figure BDA0003051611980006921
Figure BDA0003051611980006931
Figure BDA0003051611980006941
Figure BDA0003051611980006951
Figure BDA0003051611980006961
Figure BDA0003051611980006971
Figure BDA0003051611980006981
Figure BDA0003051611980006991
Figure BDA0003051611980007001
Figure BDA0003051611980007011
Figure BDA0003051611980007021
Figure BDA0003051611980007031
Figure BDA0003051611980007041
Figure BDA0003051611980007051
Figure BDA0003051611980007061
Figure BDA0003051611980007071
Figure BDA0003051611980007081
Figure BDA0003051611980007091
Figure BDA0003051611980007101
Figure BDA0003051611980007111
Figure BDA0003051611980007121
Figure BDA0003051611980007131
Figure BDA0003051611980007141
Figure BDA0003051611980007151
Figure BDA0003051611980007161
Figure BDA0003051611980007171
Figure BDA0003051611980007181
Figure BDA0003051611980007191
Figure BDA0003051611980007201
Figure BDA0003051611980007211
Figure BDA0003051611980007221
Figure BDA0003051611980007231
Figure BDA0003051611980007241
Figure BDA0003051611980007251
Figure BDA0003051611980007261
SOAP3和SOAP4表达的下调致使苜蓿酸衍生皂苷的累积减少,并且引发糖基化中间体(奥古斯丁酸、巴约甙元和常春藤苷配基)的累积(图25、图26A-26L、图27、图28A-28C)。
所得途径中间体的结构证明,已经识别出的SOAP3(SEQ ID NO:52)是C-2羟化酶,并且SOAP4(SEQ ID NO:54)是C-23氧化酶(图20A)。CYP2(CYP72A656;Sp_148230_dgra)(SEQID NO:72[基因]和SEQ ID NO:73[多肽])与SOAP4具有高度同源性(在氨基酸浓度上同源性几乎为92%),可能在皂苷生物合成途径中呈现相同活性。另外,在以下基因沉默的植物中观测到皂苷含量降低:SOAP6(UGT74BB2;Sp_170930_hjgq;SEQ ID NO:55[基因]和SEQ IDNO:56[多肽])、SOAP7(UGT79K1;Sp_020820_yeau;SEQ ID NO:57[基因]和SEQ ID NO:58[多肽])、SOAP8(UGT79L2;Sp_113700_suxh;SEQ ID NO:59[基因]和SEQ ID NO:60[多肽])和SOAP9(UGT73BS1;Sp_170320_dmqi;SEQ ID NO:61[基因]和SEQ ID NO:62[多肽])糖基转移酶(图29)。
相同植物累积的途径中间体缺乏某些糖:脱氧己糖(SOAP6(SEQ ID NO:56)和SOAP7(SEQ ID NO:58))、己糖(SOAP8(SEQ ID NO:60))和戊糖(SOAP9(SEQ ID NO:62))(图30A-30C)。此外,五种共表达酰基转移酶(AT)中的一者的VIGS(即,SOAP10;Sp_125800_kzws;SEQ ID NO:63[基因]、SEQ ID NO:64[多肽])致使脱乙酰基与乙酰化皂苷之间的比例增加(从20%到80%)(图31A-31C)。随后在体外证实了在大肠杆菌中表达的重组SOAP10的乙酰基转移酶活性,因为它将Yossoside IV和其他Yossoside(例如Yossoside VI和Yossoside XII)乙酰化,并在C-28位置处附着两种脱氧己糖(图14A-14C)。
实施例18:SOAP基因的验证
目标:验证所有九种基因的功能[即β-香树素合酶(bAS;SOAP1;SEQ ID NO:45);细胞色素P450(CYP450;SOAP2、3、4;分别为SEQ ID NO:46、51、53);UDP-糖基转移酶(UGT;SOAP6、7、8、9;分别为SEQ ID NO:55、57、59、61)和酰基转移酶(AT;SOAP10;SEQ ID NO:63)]]
方法:参见以上材料和方法。
结果:九种目的基因(SOAP 1-4和6-10)在本塞姆氏烟草叶中瞬时表达。前四种生物合成基因(SOAP1至SOAP4)的表达致使形成苜蓿酸(图20A)。奇怪的是,所有9种基因的共表达并没有致使生成以前在菠菜叶中检测到的任何皂苷。但是,检测到菠菜叶中通常不存在的苜蓿酸和糖基化衍生物[MA+hex;MA+2 x hex;MA+3 x hex](图32A-32D)。
概述:尽管实现了苜蓿酸的重构,但九种基因SOAP1-4和6-10的表达并未致使生成任何皂苷。
实施例19:纤维素合酶样G菠菜同源物作为皂苷生物合成途径组分的分析。
目标:识别出缺失的皂苷生物合成途径重构所必需的一种或多种基因。
方法:参见以上材料和方法。
结果:此时可认识到,重构皂苷生物合成途径所需的至少一种酶缺失。为识别出一种或多种缺失的酶,对通过共表达分析获得的基因列表进行修饰。唯一与共表达集中似乎与糖类代谢相关的所有饵共表达的基因是纤维素合酶样G菠菜同源物(SoCSLG)(T.Richmond,“高等植物纤维素合酶”(Higher plant cellulose synthases),《GenomeBiology》(基因组生物学),第1卷第3001.1-3001.6页(2000))。尽管基于此功能注解,其对皂苷生物合成有贡献似乎不太可能,但已研究了其在该途径中的功能。
值得注意的是,SoCSLG沉默致使菠菜叶中苜蓿酸大量累积(图33A-33F;图34A和34B),表明其在三萜皂苷生物合成中的作用。接下来,将SoCSLG(SEQ ID NO:65或93)与SOAP1-4(分别为SEQ ID NO:45、SEQ ID NO:46、SEQ ID NO:51、SEQ ID NO:53)与本塞姆氏烟草叶一起瞬时表达。这五种酶的综合活性致使形成苜蓿酸3-O-葡萄糖醛酸苷(MA-3-GlcA);菠菜三萜皂苷生物合成途径中的第一糖基化中间体(图20A-20C和图32A-32F;图35A-35C)。
此外,CSLG(SOAP5、Sp_076690_ejcm(SEQ ID NO:65或93[基因]、SEQ ID NO:66[多肽])与bAS(SOAP1;SEQ ID NO:45)和CYP450(SOAP2[SEQ ID NO:46]、SOAP3[SEQ ID NO:51]和SOAP4[SEQ ID NO:53])的组合表达证明,除苜蓿酸外,SOAP5[SEQ ID NO:66]可以葡萄糖醛酸酯化其他三萜糖苷配基,包含齐墩果酸、奥古斯丁酸、常春藤苷配基、丝石竹皂苷配基、丝石竹酸,尽管菠菜中从未检出过该糖苷配基(图36A-36F)。SOAP5(SoCSLG)被识别成菠菜皂苷葡萄糖醛酸转移酶。相反,在一些实施方案中,对SOAP5(SEQ ID NO:65或93)的表达的抑制可以致使葡萄糖醛酸化三萜糖苷配基的减少或抑制,包含但不限于苜蓿酸、齐墩果酸、奥古斯丁酸、常春藤苷配基、丝石竹皂苷配基和丝石竹酸。
为检查SOAP5是否确实是菠菜皂苷途径中缺失的成分,将全部十种SOAP基因的组合(参见表16)在本塞姆氏烟草中瞬时表达。代谢物分析显示,菠菜皂苷Yossoside V含量最高,表明已识别出天然途径中所有必需的步骤和酶(图33A-33F)。
概述:菠菜皂苷Yossoside V(化合物11)天然途径中所有必需步骤的酶已被识别,并且证明在异源植物系统中具有功能活性。
实施例20:三萜生物合成途径的特征
目标:阐明菠菜皂苷代谢途径的更多细节。
方法:参见以上材料和方法。
结果:将SOAP5(SEQ ID NO:66)识别为菠菜皂苷葡萄糖醛酸转移酶,可以进一步破译该途径。已经发现,SOAP6(SEQ ID NO:56)直接作用于将岩藻糖连接到糖苷配基C-28位置处的羧基的MA-3-GlcA上,进而生成Yossoside I(化合物7)。实际上,这使得SOAP6成为三萜化合物代谢中所涉及的第一个特征性岩藻糖基转移酶(T.Louveau等人,“对属于碳水化合物活性酶(CAZY)糖基转移酶家族1的两种新阿拉伯糖基转移酶的分析,提供了对疾病抗性和糖供体特异性的见解”(Analysis of two new arabinosyltransferases belonging tothe carbohydrate-active enzyme(CAZY)glycosyl transferase family 1 providesinsights into disease resistance and sugar donor specificity),《植物细胞》(ThePant Cell)第30期第3038–3057页(2018))。(图37A-37F、图38A-38E)
仅当与其他六种SOAP1-6基因一起表达时,SOAP7的表达(SEQ ID NO:57)才生成Yossoside II产物(见表16)。基于LC-MS/MS分析,SOAP7(SEQ ID NO:58)是一种糖基转移酶,其将鼠李糖转移至Yossoside I的岩藻糖上(图37A-37F、图38A-38E)。Yossoside II通过SOAP8(SEQ ID NO:60)进一步转化为Yossoside III,这是一种葡糖基转移酶,仅接受在C-28位置处附着有岩藻糖和鼠李糖的糖苷配基作为底物(图20A;图37A-37F、图38A-38E)。SOAP9的表达(SEQ ID NO:61[基因]、SEQ ID NO:62[多肽])表明它是一种木糖基转移酶,其将戊糖连接到葡萄糖醛酸,葡萄糖醛酸在C-3处连接至MA。在SOAP9的情况下,在C-28处装饰三萜主链的糖部分对其活性不是至关重要的(图39A-39C)。植物原位和体外研究表明,SOAP10参与菠菜中皂苷生物合成的最后一步,将乙酰基转移至岩藻糖部分(图31A-31F)。下表15中示出用于比较的乙酰基转移酶的核苷酸和氨基酸序列。
表15:乙酰基转移酶的核苷酸和氨基酸序列
Figure BDA0003051611980007281
Figure BDA0003051611980007291
Figure BDA0003051611980007301
Figure BDA0003051611980007311
据我们所知,SOAP10(SEQ ID NO:64)是被报告涉及到三萜皂苷生成合成中的苄醇乙酰基-、花色素苷-O-羟基-苯乙烯醛基-、邻氨基苯甲酸盐-N-羟基-苯乙烯醛基/苯甲酰基-、脱乙酰基温都林乙酰基转移酶(BAHD)酰基转移酶超家族的第一个成员。
下表16列出10种酶的氨基酸和核苷酸序列,以及编码这些酶的基因,它们构成菠菜中生成化合物11(Yossoside V)的生物合成三萜皂苷的生物合成途径。
表16:菠菜中三萜生物合成途径酶的核苷酸和氨基酸序列
Figure BDA0003051611980007321
Figure BDA0003051611980007331
Figure BDA0003051611980007341
Figure BDA0003051611980007351
Figure BDA0003051611980007361
Figure BDA0003051611980007371
Figure BDA0003051611980007381
Figure BDA0003051611980007391
Figure BDA0003051611980007401
Figure BDA0003051611980007411
概述:这项研究发现了许多令人惊讶的细节。例如,可以以SOAP6可以为模板,基于同源物搜寻装饰QS-21生物合成途径中皂皮酸的岩藻糖基转移酶,其中QS-21是来自皂树(Quillaja saponaria)的疫苗佐剂(D.J.Marciani,“岩藻糖是否能解决皂皮树皂苷的免疫调节悖论?”(Is fucose the answer to the immunomodulatory paradox of Quillajasaponins?),《国际免疫药理学》(Int Immunopharmacol)第29期第908-913页(2015))。同样,SOAP10是三萜皂苷生物合成中所涉及的酰基转移酶BAHD超家族的成员。
实施例21:酵母中三萜中间体的生成
目标:就酿酒酵母而言,在额外异源系统中生成三萜中间体。
方法:参见以上材料和方法。
结果:为排除额外植物酶参与MA-3-GlcA的形成,我们在酿酒酵母中表达SOAP5(图33D)。由于酵母既不生成香树素型三萜化合物也不生成UDP-葡萄糖醛酸盐,因此需要表达生成这些前体的酶才能提供SOAP5活性所必需的底物(P.Arendt等人,“用于过量生成三萜化合物的内质网工程酵母平台”(An endoplaSMic reticulum-engineered yeastplatform for overproduction of triterpenoids)第40期第165–175页(2017);T.Oka、Y.Jigami,“从酿酒酵母中固有的UDP葡萄糖从头重构合成UDP-葡萄糖醛酸和UDP-木糖的途径”(Reconstruction of de novopathway for synthesis of UDP-glucuronic acid andUDP-xylose from intrinsic UDP-glucose in Saccharomyces cerevisiae),《欧洲生物化学联合会杂志》(FEBS Journal)第273期第2645–2657页(2006))。
酵母中SOAP 1、2、3和4的表达致使形成苜蓿酸(图40A-40B)。但是,添加SOAP5不足以产生苜蓿酸3-O-葡萄糖醛酸苷(图33A-33F)。为了提供用于SOAP5的活化糖,表达来自菠菜的UDP-葡萄糖6-脱氢酶1(SoUGD1、Sp_189830_psca),其催化UDP-葡萄糖向UDP-葡萄糖醛酸盐的转化(SEQ ID NO:74[基因]和SEQ ID NO:75[多肽])。
Figure BDA0003051611980007412
Figure BDA0003051611980007421
因此,只有表达SOAP5和所有其他五种基因的酵母细胞才能够生成MA-3-GlcA(图33A-33F;图40A-40B)。类似于本塞姆氏烟草测定,SOAP5能够对酵母细胞中的三萜中间体(齐墩果酸、丝石竹酸和巴约甙元)进行葡萄糖醛酸化(图41A-41F)。
概述:证明有可能在相对于源酶而言异源的系统中生成和葡萄糖醛酸化三萜中间体。
实施例22:在其他植物中检查纤维素合酶样酶
目标:识别和分析非菠菜植物中功能性纤维素合酶样G(CSLG)酶。
方法:参见以上材料和方法。
结果:葡萄糖醛酸通过C-3位置处的羟基与皂苷苷元相连,是植物中已发现的许多皂苷的共同特征,尤其是在石竹亚纲(Caryophyllidae)、原始蔷薇亚纲(Rosidae)和菊亚纲(Asteridae)中(M.Henry,“皂苷和系统发育:“丝石竹皂苷配基组”皂苷原基团的实例”(Saponins and Phylogeny:Example of the“Gypsogenin group”Saponins),《植物化学评论》(Phytochem Rev)第4期第89–94页(2005))。为检查CSLG酶将葡萄糖醛酸与三萜主链的结合是否不仅限于菠菜及其家族,在70多个植物物种,包含苔藓、裸子植物和开花植物中进行CSLG蛋白的系统发育分析。菠菜SOAP5似乎与来自石竹目(Caryophyllales)、锦葵目(Malvales)、伞形目(Apiales)和茄目(Solanales)的CSLG蛋白相关(图42A-42E)。
选定物种的皂苷谱分析以及已公开的数据表明,大豆(Glycine max),紫苜蓿(Medicago sativa)、百脉根(Lotus japonicus)和甘草(Glycyrrhiza uralensis)以及石竹目(Caryophyllales)物种例如甜菜根(Beta vulgaris)和奎奴亚藜(Chenopodiumquinoa)中均存在葡萄糖醛酸苷-齐墩果烷型皂苷(图43A-43C)。
然后从所有上述物种中克隆菠菜SOAP5的最接近同源物,并与SOAP1-4一起在本塞姆氏烟草中瞬时表达。对于所有被测试CSLG酶,观测到MA-3-GlcA形成(图42A-42E)。下表17提供这些SOAP5同源物的核酸和氨基酸序列。
表17:SOAP5纤维素合酶样G同源物(具有葡萄糖醛酸转移酶活性)
Figure BDA0003051611980007431
Figure BDA0003051611980007441
Figure BDA0003051611980007451
Figure BDA0003051611980007461
Figure BDA0003051611980007471
Figure BDA0003051611980007481
Figure BDA0003051611980007491
Figure BDA0003051611980007501
与菠菜SOAP5的情况一样,使甜菜根CSLG(BvSOAP5)沉默可致使皂苷浓度降低和齐墩果酸累积增加(图44A-44C)。类似地,紫苜蓿毛状根中CLSG的表达受到抑制,致使具备附着有葡萄糖醛酸的皂苷的累积减少(图45A和45B)。
概述:这些结果证明了皂苷生物合成途径中酶的异源功能。
实施例23:使用甘草中的纤维素合酶样G异源生成甘草皂苷。
目标:CSLG葡萄糖醛糖基转移酶活性的发现填补了众多葡萄糖醛酸苷型三萜皂苷生物合成途径中的一个巨大知识空白。迄今为止,仅部分被破译的一种此类途径生成甘草皂苷;甘草皂苷是在甘草中生成的三萜皂苷,由甘草次酸组成,在C-3位置修饰有两个葡萄糖醛酸部分。甘草皂苷(即GL)和甘草次酸单葡萄糖醛酸苷(即GAMG)是单一的葡萄糖醛酸化衍生物,是重要的天然产物,长期用于中药和日药中,并且应用于当今的食品、化妆品和制药行业中。这些分子是低卡路里的甜味剂,升糖指数为零;GAMG比蔗糖甜941倍,并且比GL甜5倍(K.Mizutani、T.Kuramoto、Y.Tamura、N.Ohtake、S.Doi、M.Nakaura、O.Tanaka,“甘草次酸3-O-β-D-单葡萄糖醛酸苷和相关糖苷的甜度”(Sweetness of glycyrrhetic acid 3-O-beta-D-monoglucuronide and the related glycosides),《生物科学、生物技术与生物化学》(Biosci Biotechnol Biochem)第58期第554-5页(1994))。GL和GAMG的商业生产取决于目前野生甘草(G.uralensis)的有限供应和低效率工业加工。尽管它很重要,但由于无法确定第一葡萄糖醛酸对糖苷配基的催化酶连接,目前尚无法在异源系统中持续生产GL和GAMG(Y.Nomura等人,“甘草中可生成甜三萜皂苷甘草皂苷的UDP-糖基转移酶73P12的功能专业化”(Functional specialization of UDP-glycosyltransferase 73P12 in licorice toproduce a sweet triterpenoid saponin,glycyrrhizin),《植物学报》(Plant J),doi:1111/tpj.14409(2019))。目的是在异源系统中生成甘草皂苷
方法:参见以上材料和方法。
结果:一些皂苷,尤其是由茄目(Solanales)植物生成的皂苷,由于其独特的特性而具有很高的重要性。甘草皂苷是由甘草次酸组成的三萜皂苷,在C-3位置处装饰有两个葡萄糖醛酸部分,由甘草(G.uralensis)生产,并且在许多亚洲国家广泛用作无卡路里的甜味剂和药物。已经识别出甘草皂苷生成中所涉及的五种酶中的四种(bAS、CYP88D6和CYP72A154,UGT73P12),但是缺少将第一个葡萄糖醛酸附着于糖苷配基的酶(Y.Nomura等人,“甘草中可生成甜三萜皂苷甘草皂苷的UDP-糖基转移酶73P12的功能专业化”(Functional specialization of UDP-glycosyltransferase 73P12 in licorice toproduce a sweet triterpenoid saponin,glycyrrhizin),《植物学报》(Plant J),doi:10.1111/tpj.14409(2019))这里问的问题是来自甘草(GuCSL)的纤维素合酶样G是否能够进行此反应。
识别出来自甘草(G.uralensis)的纤维素合酶样G基因,并且用于在异源系统中表达。下表18提供被表达基因和编码的多肽的核苷酸和氨基酸序列。
表18:三萜甘草皂苷生物合成途径的组成
Figure BDA0003051611980007502
Figure BDA0003051611980007511
Figure BDA0003051611980007521
Figure BDA0003051611980007531
Figure BDA0003051611980007541
Figure BDA0003051611980007551
Figure BDA0003051611980007561
Figure BDA0003051611980007571
Figure BDA0003051611980007581
菠菜bAS(SoSOAP1;SEQ ID NO:45)、GuCYP88D6(SEQ ID NO:76)、GuCYP72A154(SEQID NO:78)和GuCSL(SEQ ID NO:80)在本塞姆氏烟草中的表达致使形成甘草次酸3-O-单葡萄糖醛酸苷(GA-3-GlcA)(图46A-46E)。另一方面,先前报道的GuUGAT(SEQ ID NO:82)被认为催化甘草次酸的连续两步葡萄糖醛酸化以生成甘草皂苷,但在此处进行的测定中未能将GlcA附着于糖苷配基上(G.Xu、W.Cai、W.Gao、C Liu,“一种新型的葡糖醛酸基转移酶具有催化甘草次酸连续两步葡萄糖醛酸糖基化以生成甘草皂苷的空前能力”(A novelglucuronosyltransferase has an unprecedented ability to catalyse continuoustwo-step glucuronosylation of glycyrrhetinic acid to yield glycyrrhizin),《新植物学家》(New Phytol),第212期第123-35页(2016))。
先前显示与第二个GlcA结合的GuUGT73P12(SEQ ID NO:84)与GuCSL和其他酶的瞬时表达使得在本塞姆氏烟草中生成甘草皂苷作为最终产物(图47A-47F)。该测定还表明,GuCSL(SEQ ID NO:81)可以将第二葡萄糖醛酸部分添加到GA-3-GlcA,但是效率非常低。
此外,将显示在异源系统(本塞姆氏烟草)中,由从皂树(Q.saponaria)的QS-21生物合成第一糖基化步骤可以通过CSLG进行,该CSLG将葡萄糖醛酸结合到C-3位置处的皂角酸上。
概述:由纤维素合酶样G酶执行的新型生物合成反应的发现,为对重要专门代谢物途径的工程设计及其在异源系统(植物或真菌)中的可持续生产提供了有价值的策略。
实施例24:纤维素合酶样G的结构分析
目标:分析纤维素合酶样G(CSLG)的结构,并将其与经典纤维素合酶A(CESA)进行比较。
方法:参见以上材料和方法。
结果:系统发育分析表明,CSLG与经典纤维素合酶A(CESA)酶在进化上不同,后者介导纤维素的生物合成(约30%的氨基酸序列相似性)。但是,这两种蛋白质组具有几个结构特征。通过对菠菜SOAP5 CSLG蛋白进行基于模板的三级结构建模而获得的预测3D模型表明,它由两个在氨基末端穿过脂质双层(TMD)的结构域以及在羧基末端额外四个TMD构成(M.
Figure BDA0003051611980007592
等人,“使用RaptorX Web服务器的基于模板的蛋白质结构建模”(Template-based protein structure modeling using the RaptorX web server),《自然实验步骤》(Nature Protocols)第7期第1511-1522页(2012))。从脂质双层突出的445个氨基酸的长环位于跨膜结构域之间(图48;图49A)。菠菜SOAP5酶的氨基酸序列、拟南芥属的纤维素合酶样G酶和拟南芥属的纤维素合酶A酶亚单位及其在菠菜中的直系同源物在下表19中示出。另外,也存在来自A、B和E家族的其他纤维素合酶样基因。目前的理解是,来自A、B和E家族的纤维素合酶样基因各自具有完全不同的活性。直到这里介绍的工作为止,只有很少的CSL已知,而不存在对CSLG家族任何表征。被分析的物质涉及在糖代谢,β-葡聚糖和半纤维素的生物合成中。从未显示过任何CSL(尽管属于该家族)都可以在三萜化合物上起作用。因此,在整个实施例中给出的结果提供了令人惊奇和出乎意料的纤维素样合酶活性。
表12:拟南芥CSLG和CESA酶的氨基酸和核苷酸序列
Figure BDA0003051611980007591
Figure BDA0003051611980007601
Figure BDA0003051611980007611
Figure BDA0003051611980007621
Figure BDA0003051611980007631
Figure BDA0003051611980007641
Figure BDA0003051611980007651
Figure BDA0003051611980007661
Figure BDA0003051611980007671
Figure BDA0003051611980007681
还检测到可能形成三萜糖苷配基进入酶活性位点的三个通道,以及可能是葡萄糖醛酸化产物的出口路径的通道(图49A-49C)。在纤维素合酶A(CESA)蛋白中,跨膜结构域(TMD)形成一个孔,使得多糖链能够通过膜进入细胞外空间。CESA的膜外结构域拥有酶活性位点,以及在所有此类蛋白质中保守并预计参与底物和/或受体结合的四个基序,即DD、DCD、ED和QVLRW(L.Sethaphong等人,“植物纤维素合酶的第三级模型”(Tertiary model ofa plant cellulose synthase),《美国国家科学院学报》(Proc.Natl.Acad.Sci),第18期第7512-7页(2013))。(图48-红色框)。菠菜中CESA和SOAP5氨基酸序列的比对表明ED5(在SOAP5:ES中)和QVLRW(在SOAP5:QLIKW中)基序在SOAP5中不保守(图48)。
为检查CESA型氨基酸基序的存在是否可以影响SOAP5的活性,建立SOAP5的三个突变版本,如下所示:(i)被天冬氨酸(S442D)取代的丝氨酸442,(ii)与精氨酸(K483R)交换的赖氨酸483和(iii)两种取代(S442D/K483R)。本塞姆氏烟草中突变蛋白与SOAP1-4的表达表明,对SOAP5中这些基序的修饰会改变酶的性能。野生型SOAP5将整个苜蓿酸库转化成MA-3-GlcA(MA-3-GlcA:MA比率0:1),SOAP5-S442D或SOAP5-K483R仍可以有效地将葡萄糖醛酸盐MA(MA-3-GlcA:MA比率分别为0.03:1和0.09:1),而SOAP5-S442D/K483R仅能部分处理MA(MA-3-GlcA:MA比率是0.90:1)(图50A和50B)。我们的观测结果表明,中性氨基酸变为带负电荷的氨基酸除了会影响阴离子底物(UDP-GlcA)的结合外,还会引起酶活性位点的空间位阻,从而同时降低了酶的效率。在酶进化过程中,活性位点中的氨基酸(S442D和K483R)的变化对于接受UDP-GlcA而不是UDP-Glc可能是至关重要的,并且导致CESA蛋白的新功能化。
概述:看来,CESA关键氨基酸残基的差异致使该酶向CSLG酶活性新功能化。CSLG对其新三萜化合物相关功能至关重要的另一个特征是定位化于内质网(ER)中。
实施例25:三萜皂苷生物合成途径的亚细胞定位化
目标:调查三萜皂苷生物合成途径的亚细胞定位化。
方法:参见以上材料和方法。
结果:研究了三萜皂苷生物合成途径的亚细胞定位化。ER膜系统是生成专门代谢物例如甾体和三萜化合物的适当环境。三萜生物合成中所以涉及的许多酶,包含角鲨烯合酶、角鲨烯环氧酶、氧化角鲨烯环化酶和大多数已知的CYP450,均被膜结合并在ER隔室内起作用(CA Hasemann等人,“细胞色素P450的结构和功能:三种晶体结构的比较分析”(Structure and function of cytochromes P450:a comparative analysis of threecrystal structures),《结构》(Structure)第1期第41-62页(1995);K.B.Linscott、T.D.Niehaus、X.Zhuang、S.A.Bell、J.Chappell,“角鲨烯合酶的界特定功能域的基因定位化”(Mapping a kingdom-specific functional domain of squalene synthase),《BBA-脂质分子和细胞生物学》(BBA-Molecular and Cell Biology of Lipids),1861,1049–1057(2016);M.Christen等人,“胆固醇内合成的结构见解:角鲨烯和2,3-氧化角鲨烯与上清蛋白因子的结合”(Structural insights on cholesterol endosynthesis:Binding ofsqualene and 2,3-oxidosqualene to supernatant protein factor),《结构生物学杂志》(Journal of Structural Biology),190,261–270(2015);R.Thoma等人,“从人氧化角鲨烯环化酶的结构了解甾体支架的形成”(Insight into steroid scaffold formationfrom the structure of human oxidosqualene cyclase),《自然》,7013,118-22(2004))。
与荧光报道分子(SOAP5:mRFP)融合在一起的SOAP5瞬时表达与细胞区室标志物(与GFP融合的ER标志物)一起证明了其在ER网络中的定位化(图51A-51F)。以前的研究表明,发芽大豆种子的微粒体级分含有能够葡糖苷酸化大豆皂醇B的蛋白质,支持SOAP5的跨膜定位化(Y.Kurosawa、H.Takahara、M Shiraiwa,“UDP-葡萄糖醛酸:大豆皂醇葡萄糖醛糖基转移酶参与大豆种子萌发过程中皂苷的生物合成”(UDP-glucuronic acid:soyasapogenol glucuronosyltransferase involved in saponin biosynthesis ingerminating soybean seeds),《植物学报》(Planta)第215期第620-9页(2002))。接下来,以各种组合表达以荧光标记的形式的SOAP 1、2、3、4和5,并且观测到所有被检查蛋白的ER共定位化(图35A-35F、图52A-52F)。检测到叶中存在同时表达所有融合蛋白的大量MA-3-GlcA表明,所观测到的荧光信号源自功能性,因此折叠得适当且位于亚细胞内的蛋白(图53)。使用荧光共振能量转移(FRET)还观测到SOAP1-5蛋白彼此靠近,因此可能相互作用(图54A-54B)。所研究蛋白质的精确共定位化可以通过减少中间体的扩散来解释所进行反应的高效率。
概述:这些研究表明,至少酶SOAP1-5定位化于ER中彼此紧邻。
实施例所得出的总体结论
这些对番茄、马铃薯、茄子和菠菜中甾体生物碱、甾体皂苷和三萜皂苷生物合成的研究中发现和表征了可以完成复杂三萜皂苷生物合成途径的基因,并且阐明复杂甾体生物碱和甾体皂苷生物合成途径。在属于两个不同目的七个植物物种中发现了纤维素合酶样G蛋白作为三萜糖苷配基的葡萄糖醛糖基转移酶的空前功能,这证明特定代谢物的糖基化并非仅由属于1个家族糖类活性酶数据库(CAZY)的GT进行的。这一发现很可能会触发发现与其他专门代谢物(SM)相关的CSL酶的其他功能。此外,还证明了独特SOAP6岩藻糖基转移酶活性的发现,以及能够乙酰化的三萜皂苷糖部分的第一种BAHD酰基转移酶(SOAP10)的表征。类似地,在某些实施方案中,GAME15可以糖基化甾体生物碱和甾体皂苷。在一些实施方案中,GAME15糖基化包括葡萄糖醛酸的转移(葡糖醛酸基转移酶活性)。此外,甾体生物碱和甾体皂苷的表达降低,进而提供增加可用作营养剂、化妆品和药物的植物甾醇、植物胆甾醇、胆甾烯醇、植物胆甾烯醇和植物固醇的含量的一种新方法。
CSLG蛋白作为三萜葡糖醛酸基转移酶的意外发现表明,SM的糖基化并非仅由1型UGT家族执行。因此,可能基于此报告而发现在修饰其他类三萜化合物和SM以及类甾体生物碱和/或甾体皂苷中起作用的CSL酶。此外,它提供了一个基本的示例,说明如何“劫持”少数几个主要植物过程中的一个,即构成细胞壁的纤维素合成机器中的酶活性,以生成一组无关的防御性专门代谢物。SOAP5与大多数其他途径蛋白而不是胞质溶胶(UGT定位化于其中)在菠菜ER膜上的共定位化是其新功能演变的一部分。这表明这些酶之间物理接近对于有效生成三萜化合物的重要性。对于作为番茄中基因簇的GAME基因,这种物理上的接近也反映在基因水平上。除葡萄糖醛酸外,还识别出尚未公开的作用于代谢物的岩藻糖基转移酶(即SOAP6),因为迄今为止所有植物岩藻糖基转移酶均与细胞壁多糖和糖蛋白的岩藻糖基化有关。尽管BAHD型酰基转移酶经常与SM的修饰有关,但在任何情况下都没有关于其酰化三萜化合物的报告,如本文所证明的乙酰化菠菜三萜皂苷的C-28岩藻糖部分的SOAP10。与葡萄糖醛酸化相似,三萜皂苷中的酰化岩藻糖结构域对于其作为治疗剂的功效而言非常重要,例如,著名的QS-21,一种来自皂树(Quillaja saponaria)的有效皂苷疫苗佐剂。
这项工作为异源工程植物或酵母或其他真核细胞系统提供了通过填补许多葡萄糖醛酸苷型三萜皂苷生物合成途径中的空白来可持续地生产食品和制药行业的高价值代谢物(例如甘草皂苷、大豆皂苷、QS-21佐剂)的无与伦比策略。此外,它支持植物三萜皂苷生物合成途径中的内源基因进行工程设计,以增加有益的三萜皂苷,例如但不限于中国甘草中的甘草皂苷,或减少苦味或有害的三萜皂苷,例如但不限于在降低其在奎藜籽中的含量。同样,毒性和苦味化合物通过减少不需要的甾体生物碱和/或甾体皂苷而减少。
尽管本文已经举例说明和描述了遗传修饰的细胞的某些特征及其在生成甾体生物碱、甾体皂苷和三萜皂苷中的用途,但是所属领域中的普通技术人员现在可得出许多修饰、替代、变化和等同形式。上文对特定实施方案的描述将充分地揭示本发明的一般性质,以至于其他人可以通过应用当前的知识而容易地修饰和/或适应于该具体实施方案的各种应用,而无需过度的实验并且不背离通用概念,并且因此,该更改和修饰应当并且旨在被理解为在所公开实施方案的等同形式的含义和范围内。应理解,本文采用的措词或术语是出于描述的目的而非限制。用于执行各种公开的功能的装置、材料和步骤可以采取多种替代形式,而不背离本发明。因此,应理解,随附权利要求书旨在涵盖落入本文公开内容的真实精神内的所有此类修饰和改变。
序列表
<110> 耶达研究及发展有限公司
A·阿哈罗尼
P·索纳韦恩
M·伊特金
A·乔兹维亚克
<120> 纤维素合酶样酶及其用途
<130> P-79520-PC1
<150> 61/831,164
<151> 2013-06-05
<150> PCT/IL2014/050497
<151> 2014-06-02
<150> 14/895,059
<151> 2015-12-01
<150> 16/123,248
<151> 2018-09-06
<150> IL 268269
<151> 2019-07-25
<160> 124
<170> PatentIn version 3.5
<210> 1
<211> 35
<212> DNA
<213> Artificial Sequence
<220>
<223> Syn. Polynucl.
<400> 1
aaaaagaatt ccggatcttc tctcgaactg gtcaa 35
<210> 2
<211> 39
<212> DNA
<213> Artificial Sequence
<220>
<223> Syn. Polynucl.
<400> 2
aaaaagaatt ccactttcat tgcttcatcc attagatct 39
<210> 3
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Syn. Polynucl.
<400> 3
aaaaagaatt ccttagctta tggccacatc acacctt 37
<210> 4
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Syn. Polynucl.
<400> 4
aaaaagaatt cactcaagat ttggtgaagc tgtggtt 37
<210> 5
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<223> Syn. Polynucl.
<400> 5
aaaaaggcgc gccaatcata gagaagaaag aagacg 36
<210> 6
<211> 38
<212> DNA
<213> Artificial Sequence
<220>
<223> Syn. Polynucl.
<400> 6
aaaaagcggc cgcactcctg caggaattgt catttctc 38
<210> 7
<211> 43
<212> DNA
<213> Artificial Sequence
<220>
<223> Syn. Polynucl.
<400> 7
aaaaagcggc cgcatgagta ttgtaattga tgatgatgaa atc 43
<210> 8
<211> 33
<212> DNA
<213> Artificial Sequence
<220>
<223> Syn. Polynucl.
<400> 8
aaaaggcgcg cccacacgcc acagatggtt ctt 33
<210> 9
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<223> Syn. Polynucl.
<400> 9
ggggacaagt ttgtacaaaa aagcaggcta tgagtattgt aattgatgat gatgaaatc 59
<210> 10
<211> 54
<212> DNA
<213> Artificial Sequence
<220>
<223> Syn. Polynucl.
<400> 10
ggggaccact ttgtacaaga aagctgggtt catactacct tctgtcctaa gcct 54
<210> 11
<211> 55
<212> DNA
<213> Artificial Sequence
<220>
<223> Syn. Polynucl.
<400> 11
ggggacaagt ttgtacaaaa aagcaggcta tgaatattgc aattgatgat gatga 55
<210> 12
<211> 59
<212> DNA
<213> Artificial Sequence
<220>
<223> Syn. Polynucl.
<400> 12
ggggaccact ttgtacaaga aagctgggtt catttgtatc aacatttgta aattcacac 59
<210> 13
<211> 219
<212> PRT
<213> Solanum Lycopersicum
<400> 13
Met Ser Ile Val Ile Asp Asp Asp Glu Ile Phe Ser Leu Pro Ser Leu
1 5 10 15
Asp Glu Leu Glu Ser Ile Thr His Leu Leu Tyr Asp Asp Asp Ser Asp
20 25 30
Phe Phe Glu Thr Leu Ser Pro Met Ser Leu Asp Val Thr Thr Leu Leu
35 40 45
Pro Asn Ile Pro Thr Ser Asn Ser Ile Glu Ser Pro Val Thr Pro Glu
50 55 60
Glu Thr Lys Glu Pro Ser Val Ala Cys Glu Asp Ala Pro Gln Asp Trp
65 70 75 80
Arg Arg Phe Ile Gly Val Arg Arg Arg Gln Trp Gly Thr Phe Ser Ala
85 90 95
Glu Ile Arg Asp Pro Asn Arg Arg Gly Ala Arg Leu Trp Leu Gly Thr
100 105 110
Tyr Glu Ser Pro Arg Asp Ala Ala Leu Ala Tyr Asp Gln Ala Ala Tyr
115 120 125
Lys Ile Arg Gly Thr Lys Val Arg Leu Asn Phe Pro Asp Leu Ile Gly
130 135 140
Ser Asp Val Pro Met Pro Pro Arg Val Thr Ala Arg Arg Arg Thr Arg
145 150 155 160
Ser Arg Ser Arg Ser Pro Glu Pro Leu Thr Thr Ser Ser Ser Ser Ser
165 170 175
Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Glu Asn Gly Thr Lys
180 185 190
Lys Arg Lys Ile Asp Leu Ile Asn Ser Ile Ala Lys Ser Lys Leu Leu
195 200 205
Cys Gly Met Asp Leu Gln Met Leu Ile Gln Met
210 215
<210> 14
<211> 222
<212> PRT
<213> Solanum tuberosum
<400> 14
Met Asn Ile Ala Ile Asp Asp Asp Glu Ile Phe Ser Leu Pro Ser Leu
1 5 10 15
Asp Glu Leu Glu Ser Ile Thr His Leu Leu Tyr Asp Asp Asp Ser Asp
20 25 30
Phe Phe Glu Thr Leu Ser Pro Met Ser Leu Asp Ser Thr Thr Leu Leu
35 40 45
Pro Asn Asn Pro Thr Pro Asn Ser Leu Glu Ser Pro Val Arg Pro Glu
50 55 60
Gly Thr Lys Glu Thr Phe Val Ala Arg Glu His Glu Glu Ser Ala Pro
65 70 75 80
Gln Asp Trp Arg Arg Phe Ile Gly Val Arg Arg Arg Gln Trp Gly Thr
85 90 95
Phe Ser Ala Glu Ile Arg Asp Pro Asn Arg Arg Gly Ala Arg Leu Trp
100 105 110
Leu Gly Thr Tyr Glu Ser Pro Gln Asp Ala Ala Leu Ala Tyr Asp Gln
115 120 125
Ala Ala Tyr Lys Ile Arg Gly Thr Lys Ala Arg Leu Asn Phe Pro Asp
130 135 140
Leu Ile Gly Ser Asp Val Pro Met Pro Pro Arg Val Thr Ala Arg Arg
145 150 155 160
Arg Thr Arg Ser Arg Ser Arg Ser Pro Glu Pro Ser Thr Thr Ser Ser
165 170 175
Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Met Glu Asn
180 185 190
Gly Thr Lys Lys Arg Lys Ile Asp Leu Ile Asn Ser Ile Ala Lys Ala
195 200 205
Lys Leu Leu Cys Gly Val Asn Leu Gln Met Leu Ile Gln Met
210 215 220
<210> 15
<211> 988
<212> DNA
<213> Solanum Lycopersicum
<400> 15
taatattaca ttacattcat cacatattat tcatccaaaa caagaatgag tattgtaatt 60
gatgatgatg aaatcttctc tttacctagc cttgatgaac ttgaatccat cacacatctt 120
ctttatgacg acgattccga ttttttcgaa actctttccc caatgagttt agatgttaca 180
acattattgc ctaatattcc tacctccaat tcaattgaat cccccgtaac accggaggaa 240
acaaaagaac catctgtggc gtgtgaggac gcgccacaag attggaggcg gttcataggg 300
gtgaggcgga ggcagtgggg cacgttttca gccgaaataa gagatccaaa taggagagga 360
gcgaggctgt ggctcggaac ttatgagtcc ccgagggatg cagcattagc ttatgaccaa 420
gccgcttaca agattcgggg aaccaaagtt cggcttaatt ttcctgacct gattggctcg 480
gacgtaccta tgccacctag agtaacggct aggcgtcgta cacgctcacg ctcacgctca 540
cccgagccat taacaacttc gtcctcgtca tcctcatcat cctcgtcctc gtcctcgtcc 600
tcgtcggaaa atggaacgaa gaaaaggaaa atagatttga taaactcaat agcaaaatcc 660
aaattacttt gtgggatgga tttacaaatg ttaatacaaa tgtgagaaaa gagcaaaggt 720
ttatttttct tcgtttgaca attaagtact acgtcgtata attaatagac tcatcaaggt 780
cattgtgtaa atgcacttct ttcacgacct tctcctttat gagattgtta tgaattttac 840
attatttcct ttatcaacta tatatttatc gttttcatac gcggtggagt tcatctgaat 900
ttctctttct aaggttatat atagagaagg atgttgaatt tttcgtcttc ttttttttat 960
taaataaaaa atctatcttc tacatcag 988
<210> 16
<211> 754
<212> DNA
<213> Solanum tuberosum
<400> 16
gaaaatttca ttcatccaaa agaagaatga atattgcaat tgatgatgat gaaatcttct 60
ctttacctag cctcgatgaa cttgaatcta tcacacatct tctttatgat gatgattccg 120
atttttttga aactctttca ccaatgagtt tagatagcac aacattattg cctaataatc 180
ctactccaaa ttcacttgaa tcccccgtaa gaccggaggg aacaaaggaa acatttgtgg 240
cgcgcgaaca cgaagaaagc gcgccacaag attggaggcg gttcatagga gtgaggcgaa 300
ggcagtgggg cacgttttca gccgaaataa gagatccaaa taggagaggc gcgaggctgt 360
ggctaggaac ttatgagtcc ccgcaggatg cagcattggc ttatgaccaa gctgcttaca 420
agattcgggg taccaaagct cggctcaatt ttccggactt aattggctcg gacgtgccta 480
tgccaccaag agtaacggct aggcgtcgta ctcgctcacg ctcgcgctca cccgagccat 540
caacaacttc ttcgtcctca tcctcgtcct cgtcctcatc ctcgtcctcg tccatggaaa 600
atgggacgaa aaaaaggaaa atagatttga taaactcaat agccaaagcc aaattactct 660
gtggtgtgaa tttacaaatg ttgatacaaa tgtgagaaaa gagcaaaggt ttattttttt 720
cttcgtttaa caattaagta ttacgtataa ttaa 754
<210> 17
<211> 224
<212> PRT
<213> Solanum Lycopersicum
<400> 17
Met Pro Ser Leu Gly Val Phe Ser Ile Leu Ile Ser Arg Met Ala Cys
1 5 10 15
Tyr Ile Ile Val Asn Leu Ser Ser Leu Ile Ala Ile Ser Arg Ser Thr
20 25 30
Pro Gly Pro Val Glu Gly Ser Val Glu His Ser Gln Ile Ile Arg Asn
35 40 45
Gly Ser Thr His Glu Asp Asp Ile Val Ile Asn Pro Thr Leu Leu Ala
50 55 60
Ser Val Gln Ser Phe Val Glu Pro Asn Leu Thr Ala Ala Ala Leu Tyr
65 70 75 80
Arg Ala Thr His Asp Ser His Met Ala Ala Asp Glu Ala Ile Ala Phe
85 90 95
Asn Met Pro Leu Gln Pro Asn Leu Phe Glu Asn Ala Ser Val Glu Pro
100 105 110
Ser Pro Asp Ala Glu His Pro Ser Gln Thr Gln Ser Leu Cys Trp Pro
115 120 125
Asp Lys Arg Asp Thr Ile Glu Ser Glu Val Leu Ser Tyr Gly Arg Asn
130 135 140
Asp Gln Glu Glu Val Lys Phe Asp Gly Glu Ala Val Gly Arg Ser His
145 150 155 160
Ala Tyr Ser Gln Arg Leu Leu Asn Ile Ile Asn Gln Thr Leu Ala Ser
165 170 175
Val Gly Val Asp Pro Ser Leu Ala Asp Val Arg Val Gln Leu Asp Ile
180 185 190
Ser Lys Lys Thr Ser Ser Gly Ala Thr Thr Thr Arg Leu Ser Ser Gly
195 200 205
Glu Asn Tyr Gly Gly Ala Pro Lys Arg Leu Arg Thr Glu Gly Ser Met
210 215 220
<210> 18
<211> 2497
<212> DNA
<213> Solanum Lycopersicum
<400> 18
atgccaagtt taggggtgtt ttcaatactc atctctagaa tggcttgcta tatcattgtt 60
aatttaagtt ctcttattgc tatttctgct gttgagtaaa aagcatagta gttccttgca 120
tcatttgcac tttcatctgt ttgatgttat gctgtggatt cttttcctaa gtgttgactt 180
tttctctacc tccctattta ggaaaaagag gcaatagtat tttaagtcca tctcttaagg 240
aatggctaat gttgaaatat aacaaagaac ttccttcttt ggcaacacat ggttggcttc 300
ttgtccttta gctatgtgat tttctgtact tcgattttat tccctcctcc acttcttatt 360
tggcagttta gttgtagcat taaaatagat tcattctaac cagatggctt acttatggaa 420
tcttcaactc tttaataata gtaatggaaa attatgaagt cagtgcacca tgagaaagaa 480
gacattgttt gacccaagag aagtaaactg agctatataa aattggattg agcgctttaa 540
ttactgcaga tattaccctc tgaaaagtac tggatcaaag aaaaaaatgt tctctgatgt 600
tacctatacc tgtatgcccc agttgctgta cagtaaaggt ataattcagt agtcatttcg 660
tatgcttgcc aaatacagaa aaatgcagac gttagctgta tttctagggg aaactcctcg 720
cctacagttc aaacaaaggt tttacatttg cttataattt cctccctcca aagcaaagtg 780
accggatttt gggctctttt aggaggagag ttgggcacaa ctttaggatg gaagcagtaa 840
tgcttttctg gaagtaaaac taatgctctt ctcttattat tgacagagaa gtactcctgg 900
gcccgtggaa ggctctgttg aacattctca aataatcaga aacggctcta ctcatgagga 960
tgatattgtc attaacccaa cattgcttgc aagtgtccag agctttgtag aaccgaactt 1020
gactgctgct gctttatata gagcaacaca cgattctcat atggcagcgg atgaggcaat 1080
tgcctttaac atgccactgc aacctaattt atttgaaaat gcatctgttg aaccatctcc 1140
tgatgctgag cacccttctc agacacaatc attatgttgg ccagataaac gagatacaat 1200
tgagtcggag gttctgagct atggcagaaa tgatcaagaa gaagtgaaat tcgatggtga 1260
agcagttgga agatcacatg catatagtca aaggtaagat gatttatcag gagttcaata 1320
gctatgactt gatgtccttg taaggtggaa attcaaattt atttcttcta tgaccccatg 1380
acttgctaat ttctgtaatg atgccaaact tgtattacac ctacgaagta ggcatgtgat 1440
acagtatcac tttaagtccc ttggacccag tgggcctagt ggcagtcacg gtcttagaag 1500
aattatccta tggttgtcaa gtgcatgaaa tagatttaga ctagttaatg tttctcgtgg 1560
ttattagctg gttggctaga atgcaaagtg tagccttttt aagccccttc cagcatgagt 1620
ttttttgtaa aacctgctgt aacttgtggg tttgcatttt ttttgtgaat aaaattgcca 1680
gttcaacaaa gatttcagtg gcttgaagga agtcatttta tatgacccgg catggtttac 1740
ctgttgaagg ttaataacaa gcggaaccct ggatttcgag atttgagtct cactttagga 1800
tttttcagac ttcccattaa cacaaagtca tgtataacac acatgttcgt atcattctta 1860
cttgtgcagt tgtcctctgt acctttaggc acattttaat ctgaactcgg ttgatctgaa 1920
attatattat gatgccagta aactactgat tttggattct atttatgtga catattgggt 1980
cttggtattg agcaggttgc ttaatatcat aaaccagact ctagcatctg tgggagtgga 2040
tccgtcactg gccgatgtta gagtacagct tgatatcagc aaaaaaacaa gcagtggagc 2100
cacaactaca agattaagca gtggagagaa ctatggtggt gctcctaaaa ggcttaggac 2160
agaaggtagt atgtgattat taatctagca tggctccact cctaattttt ctgcatcttg 2220
tcatcgtttt gatggggaga tagttgaagt ggttggtctc cgtggatgag gtggtgcaca 2280
aacagcttat ggttgtccag ttaggtttcc atttaaatat gagaagctgc attgtcattc 2340
ttaagggtat ttagttttga attgagataa gtcgactttg atagttctgt cagtgtgata 2400
tggttatgcc tatcgatttg ccatggatct gttttcgtag ttgatattta aacagggaaa 2460
tttgaagttg tttcaaatgt tagcatgaag aatttta 2497
<210> 19
<211> 996
<212> DNA
<213> Solanum Lycopersicum
<400> 19
atgccaagtt taggggtgtt ttcaatactc atctctagaa tggcttgcta tatcattgtt 60
aatttaagtt ctcttattgc tatttctaga agtactcctg ggcccgtgga aggctctgtt 120
gaacattctc aaataatcag aaacggctct actcatgagg atgatattgt cattaaccca 180
acattgcttg caagtgtcca gagctttgta gaaccgaact tgactgctgc tgctttatat 240
agagcaacac acgattctca tatggcagcg gatgaggcaa ttgcctttaa catgccactg 300
caacctaatt tatttgaaaa tgcatctgtt gaaccatctc ctgatgctga gcacccttct 360
cagacacaat cattatgttg gccagataaa cgagatacaa ttgagtcgga ggttctgagc 420
tatggcagaa atgatcaaga agaagtgaaa ttcgatggtg aagcagttgg aagatcacat 480
gcatatagtc aaaggttgct taatatcata aaccagactc tagcatctgt gggagtggat 540
ccgtcactgg ccgatgttag agtacagctt gatatcagca aaaaaacaag cagtggagcc 600
acaactacaa gattaagcag tggagagaac tatggtggtg ctcctaaaag gcttaggaca 660
gaaggtagta tgtgattatt aatctagcat ggctccactc ctaatttttc tgcatcttgt 720
catcgttttg atggggagat agttgaagtg gttggtctcc gtggatgagg tggtgcacaa 780
acagcttatg gttgtccagt taggtttcca tttaaatatg agaagctgca ttgtcattct 840
taagggtatt tagttttgaa ttgagataag tcgactttga tagttctgtc agtgtgatat 900
ggttatgcct atcgatttgc catggatctg ttttcgtagt tgatatttaa acagggaaat 960
ttgaagttgt ttcaaatgtt agcatgaaga atttta 996
<210> 20
<211> 3899
<212> DNA
<213> Solanum tuberosum
<400> 20
tttttttaca aaaaactttt tatccaacac caccgagtag cttgactcgc ccccttaaaa 60
aattatttta aaaataaaat attttttttt tcttatccca ctcctctccc ctaaaaaaaa 120
aataagttca aaagaattct ttttgggggt gagtgggtag tgaggtggga ggctaggggg 180
ggtactgggt agaggatggg gtgggtgata agaaaaaata aatcttcaaa aagaaaaaaa 240
agttctttta tcttcttaaa ttgctaaatt cttaacattt aattatttaa atgttcttta 300
aaaaaatttc tattacatat atttatgtgt acacaccatt accattttca aaaaaaataa 360
atatttatgt atacacaacg tcaacagaaa attctacata tatgcccatg tggcataaga 420
agggtgtttt taaattcact taatcaagta aaggggtgtt tttaaggctg ttaatagttg 480
gaggattaaa gtaataattc atgccaagtt taggggtgtt ttcaatactt atctctagaa 540
tggtctccct attccttgct atattgttgt taatttaagt tctcttattg ctattctgct 600
atgttgagta aaaagcacag tagttccttg catcatttgc acttctcatc tgtttgatgg 660
tatgctgtgg attctttttt caagtggtgt tggacttgtt tgcttggatg ataatctttc 720
atgtttactc cttattgttg aacttttttt ctacctccct attaaggaaa aaaaggcaat 780
agtattttca gtccatctct taaggaatgg ctaatgttga agatataatg aagaacttcc 840
ttctttggca acacatggtt ggcttcttgt cctctagcta tgtgatattt tatacttcga 900
tttttattcc ctccttcact tcttgtttgg cagtttagtt atagcattaa aatagattca 960
ttataaccag atggcttact gaaggaatct tctactcttt aataatagtg ttaaattagg 1020
tcttaggcct aactcacacc ccaaaagcta gctcaaaggg aggaggattg ttcaagcctt 1080
gtaaggagtc cacccatctc aaagggagga ggcttgttca agccttataa ggagtccacc 1140
catctcatta accaccgatg tgggactttt gtcattcttt aacaaatagt attagaaaat 1200
tatgaagtca gtgcaccatg agaaagaaga cattgtttga cccaagagaa gtaaactgag 1260
ctatataaaa tcggattgag actttaattt actgcagata ttaccctctg aaaagtactg 1320
gattaaagaa aaaaatgttc tctgatgtta ccctatacct gtgtgcccca gttactgtac 1380
agtaaagtca taattcagta gttattttgg atgctttcca aatacagaaa aatgcagacg 1440
ttagctgttt ttgtagggga aactcctcgc ctatggttca aacaaaggct ttacatttgt 1500
ttttaatttt ctccctccaa agcaaagtta ccggatttca ggctgtttta ggaggagagt 1560
tgggcacaac tttaggatgg aagcagtagt gtttttctga aagtaaaact aatgctcttc 1620
tcttattatt gacagagaag cactcctggg cccgtggaag gctctgttga acattctcaa 1680
ataatcagaa acggctctac tcatgaggat gatattgtca ttaacgcaac attgctttcg 1740
agtgcccaga gctttgtaga accgaacttg actgctgctg ctttatatag agcaacacac 1800
gattctcata tggcagcgga tgaagcaatt gcctttaaca tgccactgca acctaattta 1860
tttgaaaatg catctgttga accatctcct gatgctgagc acccttccca gccacaatca 1920
ttatgttggc caggtaaacg agatacaatt gagtcggagg ttctgagcta tggcagaaat 1980
gatcaggaag aagtgaaatg cgatggtgaa gcagttgcaa gatcacatgc gtatactcaa 2040
aggtaagatg atttatcacg agttcaatag ctatgacttg atgtcctggt aaggtggaaa 2100
ttcaaattta tttcttctac gcccccatga cttgctaatt tctgtaatga tgccaaactt 2160
gtattacacc tacgaaatag gcatgtgata cagaatcact ttaagtacct tggacccagt 2220
gggcctagtg gcagtcaagg tcttagaaga attacctgta gtgttccaat ttcttattgt 2280
cctgtgattg ccaagtgcat gaaatagatt cagactaggt aatgtttctc gtggttatta 2340
gctggttggt tgaaatgcag attgtagcct ttctgagccc cttccagtat agtttttttt 2400
gtaaaacctg ctgcaacttg tgggtttgca tttttttgtg aataaaattg ccaattcaaa 2460
aaagatttca gtggcttgaa ggaagtcatt tatatgaccc ggcattgttt acccgagcaa 2520
tcaaatatca atcaggtttc cctgcatggc ttcccccaac ttttctacct gacccatcaa 2580
atggaaatct aagttgaagg ttaataacaa gcggatctct ggatttcgag gtttgagtct 2640
cacttaagga ttttccagac ttcccattaa aacgaagaaa tgtataacaa acatgtacat 2700
atcattctga cttgagcagt tgtcctctga acctttaggc acattctgat ctgatttcag 2760
ttgatctgaa attatattat gatgctagta tactactgat tttggattct atttatgtga 2820
catattgagt cttggtattg agcaggttgc ttaatatcat aaaccagaca ctagcatctg 2880
tgggagtgga tccttcactg gccgatgtta gagtacagct tgatatcagc aaaaaaccaa 2940
gcagtggagc cacaactaca acattaagca gtgaagagaa ctatgatggt gctcctaaaa 3000
ggcttaggac agaaggtagt atgtgattgt caatctagca tggttccact cctaattttt 3060
ctgcatcttg tcattgtttc gatggggaga tacttgaagt ggttggtctc tgtggatgag 3120
gtggtgcaca aacagcttat ggttgtccag ttaggtttcc atttaaatat gagaagctgc 3180
attgtcattc ttaagggtat ttagatagtc gactttggaa attctgtcag tgtgatgtgg 3240
ttatgcctat cgatttgaga tgcctccatg gatctggttt catagttgat atttaaacag 3300
ggaaatttga agttgtttca aatgtcagca tgaagaattt tatgtacatt accaaatctt 3360
ttccttttca gtattttgtg attagttcac ttaaacagga tgctggcttt tcaattgtgt 3420
tttcagaaat aaaagtcagc acttgtatca ttgtgaaaaa ctgaaaattt tggtctttaa 3480
gtcgaatcaa caacataatg caagtattta ctgataacgg cgtttggtca gatgaatacg 3540
gcagtttcac aatgattgca tatgaatatg ctcatgttag tccatggtat atattgtaat 3600
tttatcctaa agatatcgta atgagaagtt agatgagttt gatgcgatga actgatgaag 3660
cattggtaat gggttattgg tttagcagtt ttgctaattc tcatttatat ttgggatatc 3720
cgttgtcaaa tgtttgaggt tcttttctta acacattaat cgaattaata aattaaactc 3780
tcggctattc tactaggtgc caatatttgc ttttgagcaa gatgcaatat gtcgttcatt 3840
tggtttgtca ccttgtttct aagtgagttt taatctataa cagaatgttt gttggtaaa 3899
<210> 21
<211> 990
<212> DNA
<213> Solanum tuberosum
<400> 21
atgccaagtt taggggtgtt ttcaatactt atctctagaa tggcttgcta tattgttgtt 60
aatttaagtt ctcttattgc tattagaagc actcctgggc ccgtggaagg ctctgttgaa 120
cattctcaaa taatcagaaa cggctctact catgaggatg atattgtcat taacgcaaca 180
ttgctttcga gtgcccagag ctttgtagaa ccgaacttga ctgctgctgc tttatataga 240
gcaacacacg attctcatat ggcagcggat gaagcaattg cctttaacat gccactgcaa 300
cctaatttat ttgaaaatgc atctgttgaa ccatctcctg atgctgagca cccttcccag 360
ccacaatcat tatgttggcc aggtaaacga gatacaattg agtcggaggt tctgagctat 420
ggcagaaatg atcaggaaga agtgaaatgc gatggtgaag cagttgcaag atcacatgcg 480
tatactcaaa ggtaggttgc ttaatatcat aaaccagaca ctagcatctg tgggagtgga 540
tccttcactg gccgatgtta gagtacagct tgatatcagc aaaaaaccaa gcagtggagc 600
cacaactaca acattaagca gtgaagagaa ctatgatggt gctcctaaaa ggcttaggac 660
agaaggtagt atgtgattgt caatctagca tggttccact cctaattttt ctgcatcttg 720
tcattgtttc gatggggaga tacttgaagt ggttggtctc tgtggatgag gtggtgcaca 780
aacagcttat ggttgtccag ttaggtttcc atttaaatat gagaagctgc attgtcattc 840
ttaagggtat ttagagtcga ctttggaaat tctgtcagtg tgatgtggtt atgcctatcg 900
atttgagatg cctccatgga tctggtttca tagttgatat ttaaacaggg aaatttgaag 960
ttgtttcaaa tgtcagcatg aagaatttta 990
<210> 22
<211> 342
<212> PRT
<213> Solanum Lycopersicum
<400> 22
Met Ala Asp Leu Leu Ser Asn Trp Ser Ser Thr Leu Glu Ala Val Pro
1 5 10 15
Lys Ser His Cys Ile Pro Glu His Glu Arg Pro Ser Asp Pro Val Glu
20 25 30
Ile Gly Asp Ser Ile Pro Val Ile Asp Leu Gly Lys Ala Asn Gly Glu
35 40 45
Glu Arg Ser Val Val Val Lys Asp Leu Leu Lys Ala Phe Glu Glu Tyr
50 55 60
Gly Phe Phe Gln Ile Ile Asn His Gly Val Pro Val Asp Leu Met Asp
65 70 75 80
Glu Ala Met Lys Val Tyr Lys Glu Phe Phe Ser Leu Pro Ala Glu Glu
85 90 95
Lys Glu Asn Tyr Ala Lys Asp Ala Ala Asn Asn Thr Asn Arg Gly Ala
100 105 110
Ala Thr Leu Tyr Ser Ser Ser Ala Lys His Tyr Asp Ser Glu Glu His
115 120 125
Arg Tyr Trp Arg Asp Val Leu Glu His Ser Cys Asn Leu Asp Gly Glu
130 135 140
Asp Lys Lys Thr Trp Pro Asp Asn Pro Pro Arg Tyr Arg Glu Val Ile
145 150 155 160
Gly Ala Tyr Gly Asp Glu Leu Arg Arg Val Ser Lys Val Ile Leu Gly
165 170 175
Met Leu Ser Glu Gly Leu Gly Leu Glu Ala Gly Phe Phe Asp Lys Glu
180 185 190
Leu Gly Gln Arg Met Leu Val Asn His Tyr Pro Ala Cys Pro Asn Pro
195 200 205
Ser Leu Thr Leu Gly Val Gly Gly His Cys Asp Pro Asn Leu Ile Thr
210 215 220
Ile Ile Gln Gln Glu Val Tyr Gly Leu Gln Ile Leu Lys Asp Asp Lys
225 230 235 240
Trp Ile Gly Val Gln Pro Ile Arg Asn Ala Phe Val Val Asn Ser Gly
245 250 255
Leu Pro Ile Thr Val Tyr Ser Asn Gly Lys Leu Thr Ser Val Ala His
260 265 270
Arg Val Val Thr Asn Thr Thr Glu Ser Arg Thr Ser Ile Gly Thr Phe
275 280 285
Ile Cys Pro His Glu Ile Val Glu Pro Ala Lys Ala Leu Val Gly Pro
290 295 300
Glu Asn Pro Pro Gln Phe Lys Pro Phe His Trp Gly Ile Asp Phe Met
305 310 315 320
Pro His Tyr Leu Ser Lys Lys Ser Val Tyr His Ala Ser Leu Glu Pro
325 330 335
Phe Lys Thr Glu Ala Asn
340
<210> 23
<211> 341
<212> PRT
<213> Solanum tuberosum
<400> 23
Met Ala Asp Leu Leu Ser Asn Trp Ser Ser Thr Leu Glu Ala Val Pro
1 5 10 15
Pro Ser His Cys Ile Pro Val His Glu Arg Pro Ser Asp Pro Val Glu
20 25 30
Ile Val Asp Asn Ile Pro Val Ile Asp Leu Gly Lys Ala Asn Gly Glu
35 40 45
Glu Arg Ser Val Val Val Lys Glu Leu Leu Lys Ala Phe Glu Glu Tyr
50 55 60
Gly Phe Phe Gln Ile Ile Asn His Gly Val Pro Val Asp Leu Met Asp
65 70 75 80
Glu Ala Met Lys Val Tyr Lys Glu Phe Phe Ser Leu Pro Ala Ala Glu
85 90 95
Lys Ala Glu Tyr Ala Lys Asp Ala Ala Asn Asp Thr Asn Arg Gly Ala
100 105 110
Ala Thr Leu Tyr Ser Ser Ser Ala Lys His Tyr Asp Ser Glu Glu His
115 120 125
Arg Tyr Trp Arg Asp Val Leu Glu His Ser Cys Asn Leu Asp Gly Lys
130 135 140
Asp Lys Lys Thr Trp Pro Ser Asn Pro Pro Arg Tyr Arg Glu Val Ile
145 150 155 160
Gly Ala Tyr Gly Asp Glu Leu Arg Arg Val Ser Lys Val Ile Leu Gly
165 170 175
Leu Leu Ala Glu Gly Leu Gly Leu Glu Ala Gly Phe Phe Asp Thr Glu
180 185 190
Leu Gly Gln Arg Met Leu Val Asn His Tyr Pro Ala Cys Pro Asp Pro
195 200 205
Ser Leu Thr Leu Gly Val Gly Gly His Cys Asp Pro Asn Leu Ile Thr
210 215 220
Ile Ile Gln Gln Glu Val Tyr Gly Leu Gln Ile Leu Lys Asp Asp Lys
225 230 235 240
Trp Ile Gly Val Gln Pro Ile Arg Asn Ala Phe Val Val Asn Ser Gly
245 250 255
Leu Pro Ile Thr Val Val Ser Asn Gly Lys Leu Thr Ser Val Ala His
260 265 270
Arg Val Val Thr Asn Thr Thr His Ser Arg Thr Ser Ile Gly Thr Phe
275 280 285
Ile Cys Pro His Asp Ile Val Glu Pro Ala Lys Ala Leu Val Gly Pro
290 295 300
Glu Asn Pro Pro Gln Phe Lys Ser Phe Asn Trp Gly Ile Asp Phe Met
305 310 315 320
Pro His Tyr Leu Ser Lys Lys Ser Val Tyr His Ala Ser Leu Glu Pro
325 330 335
Phe Lys Ile Asp Ala
340
<210> 24
<211> 1726
<212> DNA
<213> Solanum Lycopersicum
<400> 24
aaaaaatatt tgtttttaaa atgtgtaatt tttagtggca tgctctaaaa aaaaataaaa 60
ttatctgagc atcagttttg gttatgcaat ttccttccct ataaatggcc ctccatatct 120
caaatgagat atcaaacaat ttgcagaagt agtagtatta acatttagaa gataactttg 180
tttcccaggt aaataaatca ataaatcctc cttttctttg tttgtttgtt tatttgttga 240
gatatttatg atttttggtt ttggtttaga ttgattgtca atggcggatc ttctctcgaa 300
ctggtcaagc acattagaag cagttcctaa aagtcattgc atcccagagc atgaaagacc 360
atcagatcca gttgaaattg gcgacagtat tccagtcatt gatttgggaa aagctaatgg 420
tgaagaacga agtgttgttg ttaaagatct gttgaaagct tttgaagaat atgggttttt 480
tcaggtacgc aactctgttt cttttttttt tgttcccgtt aatgtgaaat tgaaatgatg 540
atatatgaac aaacagataa tcaatcatgg agtacctgta gatctaatgg atgaagcaat 600
gaaagtgtac aaagaatttt tcagtcttcc agctgaagaa aaagaaaatt atgcaaaaga 660
tgcagctaat aataccaata ggggtgcagc tacactgtac agtagcagtg ctaagcatta 720
tgattcagag gagcatcgtt actggagaga tgtgttggaa catagctgca atcttgatgg 780
agaagacaaa aaaacttggc ccgataaccc tccaagatat aggtacctac ctatctaaac 840
tatgtatggt ttagcaatta atttccctct tttcttacac atgtattttg gttgtacttc 900
agggaggtta ttggtgccta tggtgatgaa ttgagaaggg tgagcaaagt tatcttgggt 960
atgttaagtg aagggctagg tttggaggca gggttctttg acaaagaact tgggcagaga 1020
atgcttgtga atcactatcc agcatgtcca aatccaagtt taactttggg agttggtgga 1080
cattgtgatc ctaatctcat aaccattatc caacaagaag tctatggtct tcaaatattg 1140
aaggatgaca aatggattgg tgtgcagcct attcgcaatg catttgtggt taattctggt 1200
ttaccaatta cggtatgtat gtgtgtaggt cttctctaac accccctttt tttcttctct 1260
tataatgttt gctatgcata caggtatata gcaatggaaa gctaactagt gttgcacatc 1320
gtgtggtgac aaacacaact gagtcacgaa cctccattgg tacttttatt tgcccacatg 1380
agattgttga acctgcaaaa gcacttgttg gtcctgagaa tcctccacag ttcaaaccct 1440
tccattgggg aatcgatttt atgccacatt acctcagcaa gaaatcagtg taccacgctt 1500
cattggagcc cttcaaaaca gaagctaatt aagcattaag gatatatcaa atctatgctg 1560
ctgctgctac tacttctttt aatttccact gaaataagag ctttaattca aaatgtcttt 1620
ctagtttgta ttctacttac ttcatgaata agaaacttcc aatcctattc tctactggtt 1680
tcgatctaca tgaatatttt attatttcca ttgcattttc aatcag 1726
<210> 25
<211> 1422
<212> DNA
<213> Solanum Lycopersicum
<400> 25
aaaaaatatt tgtttttaaa atgtgtaatt tttagtggca tgctctaaaa aaaaataaaa 60
ttatctgagc atcagttttg gttatgcaat ttccttccct ataaatggcc ctccatatct 120
caaatgagat atcaaacaat ttgcagaagt agtagtatta acatttagaa gataactttg 180
tttcccagat tgattgtcaa tggcggatct tctctcgaac tggtcaagca cattagaagc 240
agttcctaaa agtcattgca tcccagagca tgaaagacca tcagatccag ttgaaattgg 300
cgacagtatt ccagtcattg atttgggaaa agctaatggt gaagaacgaa gtgttgttgt 360
taaagatctg ttgaaagctt ttgaagaata tgggtttttt cagataatca atcatggagt 420
acctgtagat ctaatggatg aagcaatgaa agtgtacaaa gaatttttca gtcttccagc 480
tgaagaaaaa gaaaattatg caaaagatgc agctaataat accaataggg gtgcagctac 540
actgtacagt agcagtgcta agcattatga ttcagaggag catcgttact ggagagatgt 600
gttggaacat agctgcaatc ttgatggaga agacaaaaaa acttggcccg ataaccctcc 660
aagatatagg gaggttattg gtgcctatgg tgatgaattg agaagggtga gcaaagttat 720
cttgggtatg ttaagtgaag ggctaggttt ggaggcaggg ttctttgaca aagaacttgg 780
gcagagaatg cttgtgaatc actatccagc atgtccaaat ccaagtttaa ctttgggagt 840
tggtggacat tgtgatccta atctcataac cattatccaa caagaagtct atggtcttca 900
aatattgaag gatgacaaat ggattggtgt gcagcctatt cgcaatgcat ttgtggttaa 960
ttctggttta ccaattacgg tatatagcaa tggaaagcta actagtgttg cacatcgtgt 1020
ggtgacaaac acaactgagt cacgaacctc cattggtact tttatttgcc cacatgagat 1080
tgttgaacct gcaaaagcac ttgttggtcc tgagaatcct ccacagttca aacccttcca 1140
ttggggaatc gattttatgc cacattacct cagcaagaaa tcagtgtacc acgcttcatt 1200
ggagcccttc aaaacagaag ctaattaagc attaaggata tatcaaatct atgctgctgc 1260
tgctactact tcttttaatt tccactgaaa taagagcttt aattcaaaat gtctttctag 1320
tttgtattct acttacttca tgaataagaa acttccaatc ctattctcta ctggtttcga 1380
tctacatgaa tattttatta tttccattgc attttcaatc ag 1422
<210> 26
<211> 1619
<212> DNA
<213> Solanum tuberosum
<400> 26
ctttgttatg caattttctt ccctataaat ggccctccat agctcaaatg agatatcaga 60
caatttaaag aagtactatt aacatttaga agatttcttt ctttcccagg taaataaatc 120
attttccctc tttccttctt gctctttctt tgtttatttg ttcagatttt tacccttttt 180
gttttggtta gattcattga caatggcgga ccttctttca aactggtcaa gcacattaga 240
agcagttcct ccaagtcatt gcatcccagt gcatgaaaga ccatcggatc cagttgaaat 300
tgtggacaat attccagtca ttgatttggg aaaagctaat ggtgaagaac gaagtgttgt 360
tgttaaagaa cttttgaaag cttttgaaga atatgggttt tttcaggttt attatttata 420
caatagtaca actctgttct tttttctttt tttttcttat tgtatttaaa aatgatctga 480
aattgaaatg atgaaataga taatcaatca tggagtaccc gtagatctaa tggatgaagc 540
aatgaaagtg tacaaagaat ttttcagtct gccagcagca gagaaagcag aatatgcaaa 600
ggatgcagct aatgatacaa ataggggtgc agctacactg tacagtagca gcgctaagca 660
ttatgattca gaggagcatc gttactggag agatgtcttg gaacatagct gcaatcttga 720
tgggaaagac aaaaaaactt ggcctagtaa ccctccaaga tataggtacc tacctaaact 780
atgcttagca aaattccctc ttgttatttt tcttacctag tatttgcttg tccttcaggg 840
aggttattgg tgcatatgga gatgaattga gaagggtgag caaagttatc ttgggtctgt 900
tagctgaagg gctaggtttg gaggcagggt tctttgacac agaacttggg cagagaatgc 960
ttgtgaatca ctatccagca tgcccagatc caagtttaac cttgggagtt ggtggacatt 1020
gtgatcctaa tctcataacc attatccaac aagaagtgta tggtcttcaa atattgaagg 1080
atgacaaatg gattggtgtg cagcctatcc gcaatgcatt tgtggtcaat tctggtttac 1140
caattacggt aggtgtaaca ctttctctta attttcatgg tctacaagcg attctcttat 1200
tgctctgttt tttttgtata aatacaggta gttagcaatg gaaagctaac tagtgttgca 1260
catcgtgtgg tgacaaacac aactcattca cgaacctcca ttggtacttt tatttgccca 1320
cacgatattg ttgagcctgc aaaagcactt gttggtccgg agaatcctcc acagttcaaa 1380
tcctttaatt ggggaattga ttttatgcca cattacctca gcaagaaatc agtttaccac 1440
gcatcattgg agcccttcaa aatcgatgct taagcatttg tgtgccagaa ggatcaagtc 1500
tatgctgcta cttttaattt ccactaaaat aagagcttta atttacaatg tctttctagt 1560
ttgtatccta cctttgttac ctatttcatg aataagaatc tttctttcct attctcttc 1619
<210> 27
<211> 1292
<212> DNA
<213> Solanum tuberosum
<400> 27
ctttgttatg caattttctt ccctataaat ggccctccat agctcaaatg agatatcaga 60
caatttaaag aagtactatt aacatttaga agatttcttt ctttcccaga ttcattgaca 120
atggcggacc ttctttcaaa ctggtcaagc acattagaag cagttcctcc aagtcattgc 180
atcccagtgc atgaaagacc atcggatcca gttgaaattg tggacaatat tccagtcatt 240
gatttgggaa aagctaatgg tgaagaacga agtgttgttg ttaaagaact tttgaaagct 300
tttgaagaat atgggttttt tcagataatc aatcatggag tacccgtaga tctaatggat 360
gaagcaatga aagtgtacaa agaatttttc agtctgccag cagcagagaa agcagaatat 420
gcaaaggatg cagctaatga tacaaatagg ggtgcagcta cactgtacag tagcagcgct 480
aagcattatg attcagagga gcatcgttac tggagagatg tcttggaaca tagctgcaat 540
cttgatggga aagacaaaaa aacttggcct agtaaccctc caagatatag ggaggttatt 600
ggtgcatatg gagatgaatt gagaagggtg agcaaagtta tcttgggtct gttagctgaa 660
gggctaggtt tggaggcagg gttctttgac acagaacttg ggcagagaat gcttgtgaat 720
cactatccag catgcccaga tccaagttta accttgggag ttggtggaca ttgtgatcct 780
aatctcataa ccattatcca acaagaagtg tatggtcttc aaatattgaa ggatgacaaa 840
tggattggtg tgcagcctat ccgcaatgca tttgtggtca attctggttt accaattacg 900
gtagttagca atggaaagct aactagtgtt gcacatcgtg tggtgacaaa cacaactcat 960
tcacgaacct ccattggtac ttttatttgc ccacacgata ttgttgagcc tgcaaaagca 1020
cttgttggtc cggagaatcc tccacagttc aaatccttta attggggaat tgattttatg 1080
ccacattacc tcagcaagaa atcagtttac cacgcatcat tggagccctt caaaatcgat 1140
gcttaagcat ttgtgtgcca gaaggatcaa gtctatgctg ctacttttaa tttccactaa 1200
aataagagct ttaatttaca atgtctttct agtttgtatc ctacctttgt tacctatttc 1260
atgaataaga atctttcttt cctattctct tc 1292
<210> 28
<211> 220
<212> DNA
<213> Artificial Sequence
<220>
<223> Syn. Polynucl.
<400> 28
atgagtattg taattgatga tgatgaaatc ttctctttac ctagccttga tgaacttgaa 60
tccatcacac atcttcttta tgacgacgat tccgattttt tcgaaactct ttccccaatg 120
agtttagatg ttacaacatt attgcctaat attcctacct ccaattcaat tgaatccccc 180
gtaacaccgg aggaaacaaa agaaccatct gtggcgtgtg 220
<210> 29
<211> 251
<212> DNA
<213> Artificial Sequence
<220>
<223> Syn. Polynucl.
<400> 29
cggatcttct ctcgaactgg tcaagcacat tagaagcagt tcctaaaagt cattgcatcc 60
cagagcatga aagaccatca gatccagttg aaattggcga cagtattcca gtcattgatt 120
tgggaaaagc taatggtgaa gaacgaagtg ttgttgttaa agatctgttg aaagcttttg 180
aagaatatgg gttttttcag ataatcaatc atggagtacc tgtagatcta atggatgaag 240
caatgaaagt g 251
<210> 30
<211> 2142
<212> DNA
<213> Solanum Lycopersicum
<400> 30
atgaaaaaaa ccatggagct caacaaaagc actgttccac aacctatcac caccgtatac 60
cgactccaca tgttcatcca ctcaataatc atgcttgcat taatatacta ccgtgtatct 120
aatttgttta aattcgaaaa cattctcagt ttacaagcac ttgcttgggc gctcatcact 180
tttggtgaat ttagtttcat tctcaagtgg ttcttcggac aaggtactcg ttggcgcccc 240
gttgaacgag atgttttccc tgaaaacatt acttgcaaag attccgatct accgccaatt 300
gacgtaatgg tattcactgc caatcctaag aaagagccaa ttgtagatgt catgaacact 360
gtgatatccg caatggctct tgattatccc accgataaat tggctgtgta tctcgctgat 420
gatggaggat gtccattgtc gttgtacgcc atggaacaag cgtgtttgtt tgcaaagcta 480
tggttacctt tctgtagaaa ctatggaatt aaaacgagat gcccaaaagc atttttttct 540
ccgttaggag atgatgaccg tgttcttaag aatgatgatt ttgctgctga aatgaaagaa 600
attaaattga aatatgaaga gttccagcag aaggtggaac atgctggtga atctggaaaa 660
atcaatggta acgtagtgcc tgatagagct tcgcttatta aggtaataaa cgagagggag 720
aacgaaaaga gtgtggatga tatgacgaaa atgcccttgc tagtttatgt atcccgtgaa 780
agaagattca accgtcttca tcatttcaag ggtggatctg caaatgctct acttcgagtt 840
tctggaataa tgagtaatgc cccctatgta ctggtgttag attgtgattt cttctgtcat 900
gatccaatat cagctaggaa ggcaatgtgt tttcatcttg atccaaagct atcatctgat 960
ttagcctatg ttcagttccc tcaagtcttt tacaatgtca gcaagtcaga tatttatgat 1020
gtcaaaatta gacaggctta caagacaata tggcatggaa tggatggtat ccaaggccca 1080
gtgttatctg ggactggtta ttttctcaag aggaaagcgt tatacacaag tccaggagta 1140
aaagaggcgt atcttagttc accggaaaag cattttggaa ggagtaaaag gtttcttgct 1200
tcattagagg agaaaaatgg ttatgttaag gcagataaag tcatatcaga agatatcata 1260
gaggaagcta agatgttagc tacttgtgca tatgaggatg gcacacattg gggtcaagag 1320
attggttatt catacgattg tcatttggag agcactttta ctggttatct attacactgc 1380
aaagggtgga catctactta tttgtatcca gacaggccat ctttcttggg ttgtgcccca 1440
gttgatatgc aaggtttctc atcacagctc atcaaatggg ttgctgcact tacacaagct 1500
ggtttatcac atctcaatcc catcacttat ggtttgagta gtaggatgag gactctccaa 1560
tgcatgtgct atgcctattt gatgtatttc actctttatt cttggggaat ggttatgtat 1620
gctagtgttc cttctattgg ccttttgttt gacttccaag tctatcctga ggtacatgat 1680
ccgtggtttg cagtgtatgt gattgctttc atatcgacaa ttttggagaa tatgtcggag 1740
tcaattccag aagggggatc agttaaaacg tggtggatgg aatacagggc attgatgatg 1800
atgggagtta gcgcaatatg gttaggagga ttgaaagcta tatatgacaa gatagtcgga 1860
acacaaggag agaaattgta tttgtcggac aaggcaattg acaaggaaaa gctcaagaaa 1920
tacgagaagg gcaaatttga tttccaagga atagggatac ttgctctgcc actgatagca 1980
ttttccgtgt tgaacctcgt aggcttcatt gttggagcta atcatgtctt tattactatg 2040
aactacgcag gcgtgctggg ccaactcctc gtatcatcgt tcttcgtctt tgttgtcgtc 2100
actgttgtca ttgatgttgt atctttctta aaggtttctt aa 2142
<210> 31
<211> 713
<212> PRT
<213> Solanum Lycopersicum
<400> 31
Met Lys Lys Thr Met Glu Leu Asn Lys Ser Thr Val Pro Gln Pro Ile
1 5 10 15
Thr Thr Val Tyr Arg Leu His Met Phe Ile His Ser Ile Ile Met Leu
20 25 30
Ala Leu Ile Tyr Tyr Arg Val Ser Asn Leu Phe Lys Phe Glu Asn Ile
35 40 45
Leu Ser Leu Gln Ala Leu Ala Trp Ala Leu Ile Thr Phe Gly Glu Phe
50 55 60
Ser Phe Ile Leu Lys Trp Phe Phe Gly Gln Gly Thr Arg Trp Arg Pro
65 70 75 80
Val Glu Arg Asp Val Phe Pro Glu Asn Ile Thr Cys Lys Asp Ser Asp
85 90 95
Leu Pro Pro Ile Asp Val Met Val Phe Thr Ala Asn Pro Lys Lys Glu
100 105 110
Pro Ile Val Asp Val Met Asn Thr Val Ile Ser Ala Met Ala Leu Asp
115 120 125
Tyr Pro Thr Asp Lys Leu Ala Val Tyr Leu Ala Asp Asp Gly Gly Cys
130 135 140
Pro Leu Ser Leu Tyr Ala Met Glu Gln Ala Cys Leu Phe Ala Lys Leu
145 150 155 160
Trp Leu Pro Phe Cys Arg Asn Tyr Gly Ile Lys Thr Arg Cys Pro Lys
165 170 175
Ala Phe Phe Ser Pro Leu Gly Asp Asp Asp Arg Val Leu Lys Asn Asp
180 185 190
Asp Phe Ala Ala Glu Met Lys Glu Ile Lys Leu Lys Tyr Glu Glu Phe
195 200 205
Gln Gln Lys Val Glu His Ala Gly Glu Ser Gly Lys Ile Asn Gly Asn
210 215 220
Val Val Pro Asp Arg Ala Ser Leu Ile Lys Val Ile Asn Glu Arg Glu
225 230 235 240
Asn Glu Lys Ser Val Asp Asp Met Thr Lys Met Pro Leu Leu Val Tyr
245 250 255
Val Ser Arg Glu Arg Arg Phe Asn Arg Leu His His Phe Lys Gly Gly
260 265 270
Ser Ala Asn Ala Leu Leu Arg Val Ser Gly Ile Met Ser Asn Ala Pro
275 280 285
Tyr Val Leu Val Leu Asp Cys Asp Phe Phe Cys His Asp Pro Ile Ser
290 295 300
Ala Arg Lys Ala Met Cys Phe His Leu Asp Pro Lys Leu Ser Ser Asp
305 310 315 320
Leu Ala Tyr Val Gln Phe Pro Gln Val Phe Tyr Asn Val Ser Lys Ser
325 330 335
Asp Ile Tyr Asp Val Lys Ile Arg Gln Ala Tyr Lys Thr Ile Trp His
340 345 350
Gly Met Asp Gly Ile Gln Gly Pro Val Leu Ser Gly Thr Gly Tyr Phe
355 360 365
Leu Lys Arg Lys Ala Leu Tyr Thr Ser Pro Gly Val Lys Glu Ala Tyr
370 375 380
Leu Ser Ser Pro Glu Lys His Phe Gly Arg Ser Lys Arg Phe Leu Ala
385 390 395 400
Ser Leu Glu Glu Lys Asn Gly Tyr Val Lys Ala Asp Lys Val Ile Ser
405 410 415
Glu Asp Ile Ile Glu Glu Ala Lys Met Leu Ala Thr Cys Ala Tyr Glu
420 425 430
Asp Gly Thr His Trp Gly Gln Glu Ile Gly Tyr Ser Tyr Asp Cys His
435 440 445
Leu Glu Ser Thr Phe Thr Gly Tyr Leu Leu His Cys Lys Gly Trp Thr
450 455 460
Ser Thr Tyr Leu Tyr Pro Asp Arg Pro Ser Phe Leu Gly Cys Ala Pro
465 470 475 480
Val Asp Met Gln Gly Phe Ser Ser Gln Leu Ile Lys Trp Val Ala Ala
485 490 495
Leu Thr Gln Ala Gly Leu Ser His Leu Asn Pro Ile Thr Tyr Gly Leu
500 505 510
Ser Ser Arg Met Arg Thr Leu Gln Cys Met Cys Tyr Ala Tyr Leu Met
515 520 525
Tyr Phe Thr Leu Tyr Ser Trp Gly Met Val Met Tyr Ala Ser Val Pro
530 535 540
Ser Ile Gly Leu Leu Phe Asp Phe Gln Val Tyr Pro Glu Val His Asp
545 550 555 560
Pro Trp Phe Ala Val Tyr Val Ile Ala Phe Ile Ser Thr Ile Leu Glu
565 570 575
Asn Met Ser Glu Ser Ile Pro Glu Gly Gly Ser Val Lys Thr Trp Trp
580 585 590
Met Glu Tyr Arg Ala Leu Met Met Met Gly Val Ser Ala Ile Trp Leu
595 600 605
Gly Gly Leu Lys Ala Ile Tyr Asp Lys Ile Val Gly Thr Gln Gly Glu
610 615 620
Lys Leu Tyr Leu Ser Asp Lys Ala Ile Asp Lys Glu Lys Leu Lys Lys
625 630 635 640
Tyr Glu Lys Gly Lys Phe Asp Phe Gln Gly Ile Gly Ile Leu Ala Leu
645 650 655
Pro Leu Ile Ala Phe Ser Val Leu Asn Leu Val Gly Phe Ile Val Gly
660 665 670
Ala Asn His Val Phe Ile Thr Met Asn Tyr Ala Gly Val Leu Gly Gln
675 680 685
Leu Leu Val Ser Ser Phe Phe Val Phe Val Val Val Thr Val Val Ile
690 695 700
Asp Val Val Ser Phe Leu Lys Val Ser
705 710
<210> 32
<211> 2142
<212> DNA
<213> Solanum pennellii
<400> 32
atgaaaaaaa ccatggagct caacaaaagc actgttccac aacctatcac caccgtatac 60
cgactccaca tgttcatcca ctcaataatc atgcttgcat taatatacta ccgtgtatct 120
aatttgttta aattcgaaaa cattctcagt ttacaagcac ttgcttggct actcatcact 180
tttggtgaat ttagtttcat tctcaagtgg ttcttcggac aaggaactcg ttggcgcccc 240
gttgaacgag atgttttccc tgaaaacatt acttgcaaag attccgatct accgccaatt 300
gacgtaatgg tgttcactgc caatcctaag aaagagccaa ttgtagatgt catgaacact 360
gtgatatccg caatggctct tgattatccc accgataaat tggctgtgta tctggccgat 420
gatggaggat gtccattgtc cttgtacgcc atggaacaag catgtttgtt tgcaaagcta 480
tggttacctt tctgtagaaa gtatggaatt aaaacgagat gcccaaaagc atttttttct 540
ccgttaggag atgatgaccg tgttcttaag aatgatgatt ttgctgctga aatgaaagaa 600
attaaattga aatatgaaga gttccagcag aacgtggaac atgctggtga atctggaaaa 660
atcaatggca acgtagtgcc tgacagagct tcgcttatta aggtaataaa cgagagggag 720
aacgaaaaga gtgtcgatga tttaacgaaa atgcccttgc tagtttatgt atcccgtgaa 780
agaagattca accgtcttca tcatttcaag ggtggatctg caaatgctct acttcgagtt 840
tctggaataa tgagtaatgc cccctatgta ctggtgttag attgtgattt cttctgtcat 900
gatccgatat cagctaggaa agcaatgtgt tttcatcttg atccaaagct atcatctgat 960
ttagcctatg ttcagttccc tcaagtcttt tacaatgtca gcaagtccga tatttatgat 1020
gtcaaaatta gacaggctta caagacaata tggcatggaa tggatggtat ccaaggccca 1080
gtgttatctg gaactggtta ttttctcaag aggaaggcgt tatacacaag tccaggagta 1140
aaagaggcgt atcttagttc accggaaaag cattttggaa ggagtaaaaa gttccttgct 1200
tcattagagg agaaaaatgg ttatgttaag gcagataaag tcatatcaga agatatcata 1260
gaggaagcta agatcttagc tacttgtgca tatgaggatg gcacacattg gggtcaagag 1320
attggttatt catacgattg tcatttggag agcactttta ctggttatct attacactgc 1380
aaagggtgga catctactta tttgtatcca gacaggccat ctttcttggg ttgtgcccca 1440
gttgatatgc aaggtttctc atcacagctc ataaaatggg ttgctgcact tacacaagct 1500
ggtctatcac atctcaatcc catcacttat ggtttgagta gtaggatgag aactctccaa 1560
tgcatgtgct atgcctattt gatgtatttc actctttatt cttggggaat ggttatgtat 1620
gctagtgttc cttctattgg ccttttgttt ggcttccaag tctaccctga ggtacatgat 1680
ccatggtttg cagtgtatgt gattgctttc atatcgacaa ttttggagaa tatgtcggag 1740
tcaattccag aagggggatc agttaaaacg tggtggatgg aatacagggc attgatgatg 1800
atgggagtta gcgcaatatg gttaggagga ttgaaagcta tatatgacaa gatagtcgga 1860
acacaaggag agaaattgta tttgtcggac aaggcaattg acaaggaaaa gctcaagaaa 1920
tacgagaagg gcaaatttga tttccaagga atagggatac ttgctctgcc attgatagca 1980
ttttccgtgt tgaacctcgt aggcttcatt gttggagcta atcatgtctt tattactatg 2040
aactacgcag gcgtgctggg ccaactcctc gtatcatcat tcttcgtctt tgttgtcgtc 2100
actgttgtca ttgatgttgt atctttctta aaggtttctt aa 2142
<210> 33
<211> 713
<212> PRT
<213> Solanum pennellii
<400> 33
Met Lys Lys Thr Met Glu Leu Asn Lys Ser Thr Val Pro Gln Pro Ile
1 5 10 15
Thr Thr Val Tyr Arg Leu His Met Phe Ile His Ser Ile Ile Met Leu
20 25 30
Ala Leu Ile Tyr Tyr Arg Val Ser Asn Leu Phe Lys Phe Glu Asn Ile
35 40 45
Leu Ser Leu Gln Ala Leu Ala Trp Leu Leu Ile Thr Phe Gly Glu Phe
50 55 60
Ser Phe Ile Leu Lys Trp Phe Phe Gly Gln Gly Thr Arg Trp Arg Pro
65 70 75 80
Val Glu Arg Asp Val Phe Pro Glu Asn Ile Thr Cys Lys Asp Ser Asp
85 90 95
Leu Pro Pro Ile Asp Val Met Val Phe Thr Ala Asn Pro Lys Lys Glu
100 105 110
Pro Ile Val Asp Val Met Asn Thr Val Ile Ser Ala Met Ala Leu Asp
115 120 125
Tyr Pro Thr Asp Lys Leu Ala Val Tyr Leu Ala Asp Asp Gly Gly Cys
130 135 140
Pro Leu Ser Leu Tyr Ala Met Glu Gln Ala Cys Leu Phe Ala Lys Leu
145 150 155 160
Trp Leu Pro Phe Cys Arg Lys Tyr Gly Ile Lys Thr Arg Cys Pro Lys
165 170 175
Ala Phe Phe Ser Pro Leu Gly Asp Asp Asp Arg Val Leu Lys Asn Asp
180 185 190
Asp Phe Ala Ala Glu Met Lys Glu Ile Lys Leu Lys Tyr Glu Glu Phe
195 200 205
Gln Gln Asn Val Glu His Ala Gly Glu Ser Gly Lys Ile Asn Gly Asn
210 215 220
Val Val Pro Asp Arg Ala Ser Leu Ile Lys Val Ile Asn Glu Arg Glu
225 230 235 240
Asn Glu Lys Ser Val Asp Asp Leu Thr Lys Met Pro Leu Leu Val Tyr
245 250 255
Val Ser Arg Glu Arg Arg Phe Asn Arg Leu His His Phe Lys Gly Gly
260 265 270
Ser Ala Asn Ala Leu Leu Arg Val Ser Gly Ile Met Ser Asn Ala Pro
275 280 285
Tyr Val Leu Val Leu Asp Cys Asp Phe Phe Cys His Asp Pro Ile Ser
290 295 300
Ala Arg Lys Ala Met Cys Phe His Leu Asp Pro Lys Leu Ser Ser Asp
305 310 315 320
Leu Ala Tyr Val Gln Phe Pro Gln Val Phe Tyr Asn Val Ser Lys Ser
325 330 335
Asp Ile Tyr Asp Val Lys Ile Arg Gln Ala Tyr Lys Thr Ile Trp His
340 345 350
Gly Met Asp Gly Ile Gln Gly Pro Val Leu Ser Gly Thr Gly Tyr Phe
355 360 365
Leu Lys Arg Lys Ala Leu Tyr Thr Ser Pro Gly Val Lys Glu Ala Tyr
370 375 380
Leu Ser Ser Pro Glu Lys His Phe Gly Arg Ser Lys Lys Phe Leu Ala
385 390 395 400
Ser Leu Glu Glu Lys Asn Gly Tyr Val Lys Ala Asp Lys Val Ile Ser
405 410 415
Glu Asp Ile Ile Glu Glu Ala Lys Ile Leu Ala Thr Cys Ala Tyr Glu
420 425 430
Asp Gly Thr His Trp Gly Gln Glu Ile Gly Tyr Ser Tyr Asp Cys His
435 440 445
Leu Glu Ser Thr Phe Thr Gly Tyr Leu Leu His Cys Lys Gly Trp Thr
450 455 460
Ser Thr Tyr Leu Tyr Pro Asp Arg Pro Ser Phe Leu Gly Cys Ala Pro
465 470 475 480
Val Asp Met Gln Gly Phe Ser Ser Gln Leu Ile Lys Trp Val Ala Ala
485 490 495
Leu Thr Gln Ala Gly Leu Ser His Leu Asn Pro Ile Thr Tyr Gly Leu
500 505 510
Ser Ser Arg Met Arg Thr Leu Gln Cys Met Cys Tyr Ala Tyr Leu Met
515 520 525
Tyr Phe Thr Leu Tyr Ser Trp Gly Met Val Met Tyr Ala Ser Val Pro
530 535 540
Ser Ile Gly Leu Leu Phe Gly Phe Gln Val Tyr Pro Glu Val His Asp
545 550 555 560
Pro Trp Phe Ala Val Tyr Val Ile Ala Phe Ile Ser Thr Ile Leu Glu
565 570 575
Asn Met Ser Glu Ser Ile Pro Glu Gly Gly Ser Val Lys Thr Trp Trp
580 585 590
Met Glu Tyr Arg Ala Leu Met Met Met Gly Val Ser Ala Ile Trp Leu
595 600 605
Gly Gly Leu Lys Ala Ile Tyr Asp Lys Ile Val Gly Thr Gln Gly Glu
610 615 620
Lys Leu Tyr Leu Ser Asp Lys Ala Ile Asp Lys Glu Lys Leu Lys Lys
625 630 635 640
Tyr Glu Lys Gly Lys Phe Asp Phe Gln Gly Ile Gly Ile Leu Ala Leu
645 650 655
Pro Leu Ile Ala Phe Ser Val Leu Asn Leu Val Gly Phe Ile Val Gly
660 665 670
Ala Asn His Val Phe Ile Thr Met Asn Tyr Ala Gly Val Leu Gly Gln
675 680 685
Leu Leu Val Ser Ser Phe Phe Val Phe Val Val Val Thr Val Val Ile
690 695 700
Asp Val Val Ser Phe Leu Lys Val Ser
705 710
<210> 34
<211> 2148
<212> DNA
<213> Solanum tuberosum
<400> 34
atgaaaaaaa ccatggagct caacaaaagc actgttccac aacctatcac caccatatac 60
cgactccaca tgtttatcca ctctataatc atggttgcat taatatacta ccgtgtatct 120
aatttgttta aattcgaaaa cattctgagt ttacaagcac ttgcttgggt actcatcact 180
tttggtgaat ttagtttcat tctcaagtgg ttcttcggac aaggaactcg ttatcgccct 240
gttgaaagag atgttttccc tgaaaacata acttgcaaag attccgatct accaccaatt 300
gacgtaatgg tattcactgc caatcctaag aaagagccaa ttgtggatgt catgaacact 360
gtgatatccg caatggctct tgattatcct acggataaat tggctgtgta tctggctgat 420
gatggaggat gtcctttgtc attgtacgcc atggaagaag catgtgtgtt tgcaaagctg 480
tggctacctt tctgtaggaa gtatggaatt aaaactagat gccctaaagc gtttttttct 540
cctttaggag atgatgaacg tgttcttaag aatgatgatt ttgatgctga aatgaaagaa 600
attaaattga aatatgaaga gttccagcag aatgtggaac gtgctggtga atctggaaaa 660
atcaatggta acgtagtgcc tgatagagcc tcgtttatta aggtaataaa cgacagaaaa 720
gcggagagcg aaaagagtgc cgatgattta acgaaaatgc ccttgctagt ttatgtatcc 780
cgtgaaagaa gattcaaccg tcttcatcac ttcaagggtg gatctgcaaa tgctcttctt 840
cgagtttctg gaataatgag taatgccccc tatatactgg tgttagattg tgatttcttc 900
tgtcatgatc caatatcagc taggaaggca atgtgttttc atcttgatcc aaagctatca 960
tctgatttag cttatgttca gttccctcaa gtcttttaca atgtcagcaa gtccgatatt 1020
tatgatgtca aaattagaca ggcttacaag acaatatggc atggaatgga tggtatccaa 1080
ggcccagtgt tatcaggaac tggttatttt ctgaagagga aggcgttata cacgagtcca 1140
ggagtaaagg aggagtatct tagttcaccg gaaaagcatt ttggaaggag taaaaagttc 1200
cttgcttcac tagaggagaa aaatggttat gttaaggcag agaaagtcat atcagaagat 1260
atcgtagagg aagctaagac cttagctact tgtgcatatg aggatggcac acattggggt 1320
caagagattg gttattcata cgattgtcat ttggagagca cttttactgg ttatctatta 1380
cactgcaaag ggtggagatc gacttatttg tatccagaca ggccatcttt cttgggttgt 1440
gccccagttg atatgcaagg tttctcctca cagctcataa aatgggttgc tgcacttaca 1500
caagctggtt tatcacatct caatcccatc acttatggct ttagtagcag gatgaaaact 1560
ctccaatgca tgtgctatgc ctatttgata tatttcactc tttattcttg gggaatggtt 1620
ctatatgcta gtgttccttc tattggcctt ttgtttggct tccaagtcta tcccgatgta 1680
catgatccat ggtttgcagt gtatgtgatt gctttcatat cggcaatttt ggagaatatg 1740
tcggagtcaa ttcctgatgg gggatcattt aaatcttggt ggatggaata cagggcactg 1800
atgatgatgg gagttagtgc aatatggtta ggaggattga aagctatatt agacaggata 1860
atcggaacag aaggagagaa attgtattta tcggacaagg caattgacaa ggaaaagctc 1920
aagaaatacg agaaggggaa atttgatttc caaggaatag ggatacttgc tgtaccattg 1980
atagcatttt ccttgttgaa cctcgtaggc ttcattgttg gagctaatca tgtctttatt 2040
actatgaact acgcaggtgt gcttggccaa ctcctcgtat catccttctt cgtctttgtc 2100
gtggtcactg ttgtcattga tgtcgtttct ttcttaaagg tttcttaa 2148
<210> 35
<211> 711
<212> PRT
<213> Solanum tuberosum
<400> 35
Met Glu Leu Asn Lys Ser Thr Val Pro Gln Pro Ile Thr Thr Ile Tyr
1 5 10 15
Arg Leu His Met Phe Ile His Ser Ile Ile Met Val Ala Leu Ile Tyr
20 25 30
Tyr Arg Val Ser Asn Leu Phe Lys Phe Glu Asn Ile Leu Ser Leu Gln
35 40 45
Ala Leu Ala Trp Val Leu Ile Thr Phe Gly Glu Phe Ser Phe Ile Leu
50 55 60
Lys Trp Phe Phe Gly Gln Gly Thr Arg Tyr Arg Pro Val Glu Arg Asp
65 70 75 80
Val Phe Pro Glu Asn Ile Thr Cys Lys Asp Ser Asp Leu Pro Pro Ile
85 90 95
Asp Val Met Val Phe Thr Ala Asn Pro Lys Lys Glu Pro Ile Val Asp
100 105 110
Val Met Asn Thr Val Ile Ser Ala Met Ala Leu Asp Tyr Pro Thr Asp
115 120 125
Lys Leu Ala Val Tyr Leu Ala Asp Asp Gly Gly Cys Pro Leu Ser Leu
130 135 140
Tyr Ala Met Glu Glu Ala Cys Val Phe Ala Lys Leu Trp Leu Pro Phe
145 150 155 160
Cys Arg Lys Tyr Gly Ile Lys Thr Arg Cys Pro Lys Ala Phe Phe Ser
165 170 175
Pro Leu Gly Asp Asp Glu Arg Val Leu Lys Asn Asp Asp Phe Asp Ala
180 185 190
Glu Met Lys Glu Ile Lys Leu Lys Tyr Glu Glu Phe Gln Gln Asn Val
195 200 205
Glu Arg Ala Gly Glu Ser Gly Lys Ile Asn Gly Asn Val Val Pro Asp
210 215 220
Arg Ala Ser Phe Ile Lys Val Ile Asn Asp Arg Lys Ala Glu Ser Glu
225 230 235 240
Lys Ser Ala Asp Asp Leu Thr Lys Met Pro Leu Leu Val Tyr Val Ser
245 250 255
Arg Glu Arg Arg Phe Asn Arg Leu His His Phe Lys Gly Gly Ser Ala
260 265 270
Asn Ala Leu Leu Arg Val Ser Gly Ile Met Ser Asn Ala Pro Tyr Ile
275 280 285
Leu Val Leu Asp Cys Asp Phe Phe Cys His Asp Pro Ile Ser Ala Arg
290 295 300
Lys Ala Met Cys Phe His Leu Asp Pro Lys Leu Ser Ser Asp Leu Ala
305 310 315 320
Tyr Val Gln Phe Pro Gln Val Phe Tyr Asn Val Ser Lys Ser Asp Ile
325 330 335
Tyr Asp Val Lys Ile Arg Gln Ala Tyr Lys Thr Ile Trp His Gly Met
340 345 350
Asp Gly Ile Gln Gly Pro Val Leu Ser Gly Thr Gly Tyr Phe Leu Lys
355 360 365
Arg Lys Ala Leu Tyr Thr Ser Pro Gly Val Lys Glu Glu Tyr Leu Ser
370 375 380
Ser Pro Glu Lys His Phe Gly Arg Ser Lys Lys Phe Leu Ala Ser Leu
385 390 395 400
Glu Glu Lys Asn Gly Tyr Val Lys Ala Glu Lys Val Ile Ser Glu Asp
405 410 415
Ile Val Glu Glu Ala Lys Thr Leu Ala Thr Cys Ala Tyr Glu Asp Gly
420 425 430
Thr His Trp Gly Gln Glu Ile Gly Tyr Ser Tyr Asp Cys His Leu Glu
435 440 445
Ser Thr Phe Thr Gly Tyr Leu Leu His Cys Lys Gly Trp Arg Ser Thr
450 455 460
Tyr Leu Tyr Pro Asp Arg Pro Ser Phe Leu Gly Cys Ala Pro Val Asp
465 470 475 480
Met Gln Gly Phe Ser Ser Gln Leu Ile Lys Trp Val Ala Ala Leu Thr
485 490 495
Gln Ala Gly Leu Ser His Leu Asn Pro Ile Thr Tyr Gly Phe Ser Ser
500 505 510
Arg Met Lys Thr Leu Gln Cys Met Cys Tyr Ala Tyr Leu Ile Tyr Phe
515 520 525
Thr Leu Tyr Ser Trp Gly Met Val Leu Tyr Ala Ser Val Pro Ser Ile
530 535 540
Gly Leu Leu Phe Gly Phe Gln Val Tyr Pro Asp Val His Asp Pro Trp
545 550 555 560
Phe Ala Val Tyr Val Ile Ala Phe Ile Ser Ala Ile Leu Glu Asn Met
565 570 575
Ser Glu Ser Ile Pro Asp Gly Gly Ser Phe Lys Ser Trp Trp Met Glu
580 585 590
Tyr Arg Ala Leu Met Met Met Gly Val Ser Ala Ile Trp Leu Gly Gly
595 600 605
Leu Lys Ala Ile Leu Asp Arg Ile Ile Gly Thr Glu Gly Glu Lys Leu
610 615 620
Tyr Leu Ser Asp Lys Ala Ile Asp Lys Glu Lys Leu Lys Lys Tyr Glu
625 630 635 640
Lys Gly Lys Phe Asp Phe Gln Gly Ile Gly Ile Leu Ala Val Pro Leu
645 650 655
Ile Ala Phe Ser Leu Leu Asn Leu Val Gly Phe Ile Val Gly Ala Asn
660 665 670
His Val Phe Ile Thr Met Asn Tyr Ala Gly Val Leu Gly Gln Leu Leu
675 680 685
Val Ser Ser Phe Phe Val Phe Val Val Val Thr Val Val Ile Asp Val
690 695 700
Val Ser Phe Leu Lys Val Ser
705 710
<210> 36
<211> 2148
<212> DNA
<213> Solanum chacoense
<400> 36
atgaaaaaaa ccatggagct caacaaaagc actgttccac aacctatcac caccatatac 60
cgactccaca tgttcgtcca ttctataatc atggctgcat taatatacta ccgtgtatct 120
aatttgttta aattcgaaaa cattctgagt ttacaagcac ttgcttgggt actcatcact 180
tttggtgaat ttagtttcat tctcaagtgg ttcttcggac aaggaactcg ttggcgccct 240
gttgaaagag atgttttccc tgaaaacata acttgcaaag attccgatct accaccaatt 300
gacgtaatgg tattcactgc caatcctaag aaagagccaa ttgtggatgt catgaacact 360
gtgatatccg caatggctct agattatcct acggataaat tggctgtgta tctggctgat 420
gatggaggat gtcctttgtc attgtacgcc atggaagaag catgtgtgtt tgcaaagctg 480
tggctacctt tctgtaggaa gtatggaatt aaaaccagat gccctaaagc gtttttttct 540
cctttaggag atgatgaccg tgttcttaag aatgatgatt ttgatgctga aatgaaagaa 600
attaaattga aatatgaaga gttccagcag aatgtggaac gtgctggtga atctggaaaa 660
atcaatggta acgtagtgcc tgatagagcc tcgtttatta aggtaataaa cgacagaaaa 720
acggagagcg aaaagagtgc cgatgattta acgaaaatgc ccttgctagt ttatgtatcc 780
cgtgaaagaa gattcaaccg tcttcatcac ttcaagggtg gatctgcaaa tgctcttctt 840
cgagtttctg gaataatgag taatgccccc tatatactgg tgttagattg tgatttcttc 900
tgtcatgatc caatatcagc taggaaggca atgtgttttc atcttgatcc aaagctatca 960
tctgatttag cttatgttca gttccctcaa gtcttttaca atgtcagcaa gtccgatatt 1020
tatgatgtca aaattagaca ggcttacaag acaatatggc atggaatgga tggtatccaa 1080
ggcccagtgt tatcaggaac tggttatttt ctgaagagga aggcgttata cacgagtcca 1140
ggagtaaagg aggagtatct tagttcaccg gaaaagcatt ttggaaggag taaaaagttc 1200
cttgcttcac tagaggagaa aaatggttat gttaaggcag agaaagtcat atcagaagat 1260
atcgtagagg aagctaagac cttagctact tgtgcatatg aggatggtac acattggggt 1320
caagagatcg gttattcata cgattgtcat ttggagagca cttttactgg ttatctatta 1380
cactgcaaag ggtggacatc gacttatttg tatccagaca ggccatcttt cttgggttgt 1440
gctccagttg atatgcaagg tttctcctca cagctcataa aatgggttgc tgcacttaca 1500
caagctggtt tatcacatct caatcccatc acttatggct tgagtagcag gatgaaaact 1560
ctccaatgca tgtgctatgc ctatttgata tatttcactc tttattcttg gggaatggtt 1620
ctatatgcta gtattccttc tattggtctt ttgtttggct tccaagtcta tccggaggta 1680
catgatccat ggtttgcagt gtatgtgatt gctttcatat cgacaatttt ggagaatatg 1740
tcggagtcaa ttccagaagg gggatcattt aaatcgtggt ggatggaata cagggcactg 1800
atgatgatgg gagttagtgc aatatggtta ggaggattga aagctatatt agacaagata 1860
atcggaacag aaggagagaa attgtatttg tcagacaagg caattgacaa ggaaaagctc 1920
aagaaatacg agaaggggaa atttgatttc caaggaatag ggatacttgc tgtaccattg 1980
atagcatttt ccctgttgaa cctggtaggc ttcattgttg gagctaatca tgtctttatt 2040
actatgaact acgcaggtgt gcttggccaa ctcctcgtat catccttctt cgtctttgtc 2100
gtggtcactg ttgtcattga tgtcgtttct ttcttaaagg tttcttaa 2148
<210> 37
<211> 715
<212> PRT
<213> Solanum chacoense
<400> 37
Met Lys Lys Thr Met Glu Leu Asn Lys Ser Thr Val Pro Gln Pro Ile
1 5 10 15
Thr Thr Ile Tyr Arg Leu His Met Phe Val His Ser Ile Ile Met Ala
20 25 30
Ala Leu Ile Tyr Tyr Arg Val Ser Asn Leu Phe Lys Phe Glu Asn Ile
35 40 45
Leu Ser Leu Gln Ala Leu Ala Trp Val Leu Ile Thr Phe Gly Glu Phe
50 55 60
Ser Phe Ile Leu Lys Trp Phe Phe Gly Gln Gly Thr Arg Trp Arg Pro
65 70 75 80
Val Glu Arg Asp Val Phe Pro Glu Asn Ile Thr Cys Lys Asp Ser Asp
85 90 95
Leu Pro Pro Ile Asp Val Met Val Phe Thr Ala Asn Pro Lys Lys Glu
100 105 110
Pro Ile Val Asp Val Met Asn Thr Val Ile Ser Ala Met Ala Leu Asp
115 120 125
Tyr Pro Thr Asp Lys Leu Ala Val Tyr Leu Ala Asp Asp Gly Gly Cys
130 135 140
Pro Leu Ser Leu Tyr Ala Met Glu Glu Ala Cys Val Phe Ala Lys Leu
145 150 155 160
Trp Leu Pro Phe Cys Arg Lys Tyr Gly Ile Lys Thr Arg Cys Pro Lys
165 170 175
Ala Phe Phe Ser Pro Leu Gly Asp Asp Asp Arg Val Leu Lys Asn Asp
180 185 190
Asp Phe Asp Ala Glu Met Lys Glu Ile Lys Leu Lys Tyr Glu Glu Phe
195 200 205
Gln Gln Asn Val Glu Arg Ala Gly Glu Ser Gly Lys Ile Asn Gly Asn
210 215 220
Val Val Pro Asp Arg Ala Ser Phe Ile Lys Val Ile Asn Asp Arg Lys
225 230 235 240
Thr Glu Ser Glu Lys Ser Ala Asp Asp Leu Thr Lys Met Pro Leu Leu
245 250 255
Val Tyr Val Ser Arg Glu Arg Arg Phe Asn Arg Leu His His Phe Lys
260 265 270
Gly Gly Ser Ala Asn Ala Leu Leu Arg Val Ser Gly Ile Met Ser Asn
275 280 285
Ala Pro Tyr Ile Leu Val Leu Asp Cys Asp Phe Phe Cys His Asp Pro
290 295 300
Ile Ser Ala Arg Lys Ala Met Cys Phe His Leu Asp Pro Lys Leu Ser
305 310 315 320
Ser Asp Leu Ala Tyr Val Gln Phe Pro Gln Val Phe Tyr Asn Val Ser
325 330 335
Lys Ser Asp Ile Tyr Asp Val Lys Ile Arg Gln Ala Tyr Lys Thr Ile
340 345 350
Trp His Gly Met Asp Gly Ile Gln Gly Pro Val Leu Ser Gly Thr Gly
355 360 365
Tyr Phe Leu Lys Arg Lys Ala Leu Tyr Thr Ser Pro Gly Val Lys Glu
370 375 380
Glu Tyr Leu Ser Ser Pro Glu Lys His Phe Gly Arg Ser Lys Lys Phe
385 390 395 400
Leu Ala Ser Leu Glu Glu Lys Asn Gly Tyr Val Lys Ala Glu Lys Val
405 410 415
Ile Ser Glu Asp Ile Val Glu Glu Ala Lys Thr Leu Ala Thr Cys Ala
420 425 430
Tyr Glu Asp Gly Thr His Trp Gly Gln Glu Ile Gly Tyr Ser Tyr Asp
435 440 445
Cys His Leu Glu Ser Thr Phe Thr Gly Tyr Leu Leu His Cys Lys Gly
450 455 460
Trp Thr Ser Thr Tyr Leu Tyr Pro Asp Arg Pro Ser Phe Leu Gly Cys
465 470 475 480
Ala Pro Val Asp Met Gln Gly Phe Ser Ser Gln Leu Ile Lys Trp Val
485 490 495
Ala Ala Leu Thr Gln Ala Gly Leu Ser His Leu Asn Pro Ile Thr Tyr
500 505 510
Gly Leu Ser Ser Arg Met Lys Thr Leu Gln Cys Met Cys Tyr Ala Tyr
515 520 525
Leu Ile Tyr Phe Thr Leu Tyr Ser Trp Gly Met Val Leu Tyr Ala Ser
530 535 540
Ile Pro Ser Ile Gly Leu Leu Phe Gly Phe Gln Val Tyr Pro Glu Val
545 550 555 560
His Asp Pro Trp Phe Ala Val Tyr Val Ile Ala Phe Ile Ser Thr Ile
565 570 575
Leu Glu Asn Met Ser Glu Ser Ile Pro Glu Gly Gly Ser Phe Lys Ser
580 585 590
Trp Trp Met Glu Tyr Arg Ala Leu Met Met Met Gly Val Ser Ala Ile
595 600 605
Trp Leu Gly Gly Leu Lys Ala Ile Leu Asp Lys Ile Ile Gly Thr Glu
610 615 620
Gly Glu Lys Leu Tyr Leu Ser Asp Lys Ala Ile Asp Lys Glu Lys Leu
625 630 635 640
Lys Lys Tyr Glu Lys Gly Lys Phe Asp Phe Gln Gly Ile Gly Ile Leu
645 650 655
Ala Val Pro Leu Ile Ala Phe Ser Leu Leu Asn Leu Val Gly Phe Ile
660 665 670
Val Gly Ala Asn His Val Phe Ile Thr Met Asn Tyr Ala Gly Val Leu
675 680 685
Gly Gln Leu Leu Val Ser Ser Phe Phe Val Phe Val Val Val Thr Val
690 695 700
Val Ile Asp Val Val Ser Phe Leu Lys Val Ser
705 710 715
<210> 38
<211> 2058
<212> DNA
<213> Solanum melongena
<400> 38
atgaaaaaac aaatggagct caacagaagt gttgtaccgc aacctatcac caccatttac 60
cgtctccaca tgtttatcca tgccctaatc atgctagcac taatatacta ccgtgtctct 120
aatttggcca aattcgaaaa catcctcagt ttacaagcac ttgcttgggc tcttatcacg 180
ttaggtgaac tttgtttcat agtcaagtgg ttcttcggac aagggactcg ttggcgtcct 240
gttgataggg atgtcttccc tgaaaacatc acttgtccag attccgagct accccccatt 300
gatgtcatgg ttttcactgc aaatcctaag aaagagccaa ttgtggatgt catgaacact 360
gtcatatccg caatggctct tgattacccg accgacaaat tggccgttta tttgtctgat 420
gatggaggat gccccttgac gttgtacgca atggaggaag cttgttcctt tgccaagttg 480
tggctacctt tttgtaggaa gtatggaatc aaaacaaggt gccctaaggc gtttttttct 540
ccattaggag aagatgaccg tgtattgaag agtgatgact ttgtttctga aatgaaagaa 600
atgaagtcaa aatatgaaga gttccagcag aacgtggacc gtgctggtga atccggaaaa 660
atcaaaggtg acgtagtgcc tgatagaccc gcgtttctta aggtactaaa tgacaggaag 720
acggagaacg agaagagtgc agacgattta actaaaatgc ctttgctagt atacgtatcc 780
cgtgaaagaa gaactcaccg tcgccatcac ttcaagggtg gatctgcaaa tgctcttctt 840
cgagtttctg ggataatcag taatgccccc tatatactgg ttttagattg tgatttcttc 900
tgtcatgatc caatatcagc tcggaaggca atgtgtttcc atcttgatcc aaaactatca 960
cctgacttag cttacgtgca gttccctcaa gtgttttaca atgttagcaa gtccgatatt 1020
tacgacgtca aaattagaca ggcttacaag acaatatggc acgggatgga tggtatccaa 1080
ggcccagtgt tatcgggaac tggttatttt ttaaaaaaga aggcgttgta cacgagtcca 1140
ggtctaaaag atgagtatct tagttcaccg gaaaagcatt tcggaacgag tagaaagttc 1200
attgcttcac tagaggagaa taattatgtt aagcaagaga aagtcatatc agaagatatc 1260
atagaggaag ctaagagact ggctacttgt gcatacgagg atggcacaca ttggggtcaa 1320
gaggcaaaca ggccatcttt cttgggttgt gccccagttg atatgcaagg tttctcctca 1380
cagctcataa aatgggttgc tgcactcaca caagcaggtc tatcacatct caatcccatc 1440
acttacggct tcaagagcag aatgagaact ctccaagtct tgtgttatgc ctatttgatg 1500
tatttctctc tttattcttg gggaatggtt ctacatgcta gtgttccttc tattggcctt 1560
ctctctggca ttaaaatcta cccggaggtg tatgatccat ggtttgttgt gtatgtgatt 1620
gctttcatat caacaatttt ggagaatatg tcggaatcaa ttccggaagg gggatcggtt 1680
aaaacgtggt ggatggaata cagggcactg atgatgatgg gagttagtgc aatatggcta 1740
ggaggagtga aagccatagt agacaagatc atcggaacgc aaggagagaa attgtatttg 1800
tcggacaaag caattgacaa ggaaaagctc aagaaatacg agaaggggaa atttgatttc 1860
caaggaatag gaatacttgc tgtaccattg ataacatttt ctgtgttgaa cctggtaggc 1920
ttcttggttg gaattaatca agtgttgata acgatgaagt tcgcaggcgt gctgggccaa 1980
ctcctcgtat catccttctt cgtctttgtc gtcgttactg ttgtcattga tgtcgtatct 2040
ttcttaaagg attcttaa 2058
<210> 39
<211> 685
<212> PRT
<213> Solanum melongena
<400> 39
Met Lys Lys Gln Met Glu Leu Asn Arg Ser Val Val Pro Gln Pro Ile
1 5 10 15
Thr Thr Ile Tyr Arg Leu His Met Phe Ile His Ala Leu Ile Met Leu
20 25 30
Ala Leu Ile Tyr Tyr Arg Val Ser Asn Leu Ala Lys Phe Glu Asn Ile
35 40 45
Leu Ser Leu Gln Ala Leu Ala Trp Ala Leu Ile Thr Leu Gly Glu Leu
50 55 60
Cys Phe Ile Val Lys Trp Phe Phe Gly Gln Gly Thr Arg Trp Arg Pro
65 70 75 80
Val Asp Arg Asp Val Phe Pro Glu Asn Ile Thr Cys Pro Asp Ser Glu
85 90 95
Leu Pro Pro Ile Asp Val Met Val Phe Thr Ala Asn Pro Lys Lys Glu
100 105 110
Pro Ile Val Asp Val Met Asn Thr Val Ile Ser Ala Met Ala Leu Asp
115 120 125
Tyr Pro Thr Asp Lys Leu Ala Val Tyr Leu Ser Asp Asp Gly Gly Cys
130 135 140
Pro Leu Thr Leu Tyr Ala Met Glu Glu Ala Cys Ser Phe Ala Lys Leu
145 150 155 160
Trp Leu Pro Phe Cys Arg Lys Tyr Gly Ile Lys Thr Arg Cys Pro Lys
165 170 175
Ala Phe Phe Ser Pro Leu Gly Glu Asp Asp Arg Val Leu Lys Ser Asp
180 185 190
Asp Phe Val Ser Glu Met Lys Glu Met Lys Ser Lys Tyr Glu Glu Phe
195 200 205
Gln Gln Asn Val Asp Arg Ala Gly Glu Ser Gly Lys Ile Lys Gly Asp
210 215 220
Val Val Pro Asp Arg Pro Ala Phe Leu Lys Val Leu Asn Asp Arg Lys
225 230 235 240
Thr Glu Asn Glu Lys Ser Ala Asp Asp Leu Thr Lys Met Pro Leu Leu
245 250 255
Val Tyr Val Ser Arg Glu Arg Arg Thr His Arg Arg His His Phe Lys
260 265 270
Gly Gly Ser Ala Asn Ala Leu Leu Arg Val Ser Gly Ile Ile Ser Asn
275 280 285
Ala Pro Tyr Ile Leu Val Leu Asp Cys Asp Phe Phe Cys His Asp Pro
290 295 300
Ile Ser Ala Arg Lys Ala Met Cys Phe His Leu Asp Pro Lys Leu Ser
305 310 315 320
Pro Asp Leu Ala Tyr Val Gln Phe Pro Gln Val Phe Tyr Asn Val Ser
325 330 335
Lys Ser Asp Ile Tyr Asp Val Lys Ile Arg Gln Ala Tyr Lys Thr Ile
340 345 350
Trp His Gly Met Asp Gly Ile Gln Gly Pro Val Leu Ser Gly Thr Gly
355 360 365
Tyr Phe Leu Lys Lys Lys Ala Leu Tyr Thr Ser Pro Gly Leu Lys Asp
370 375 380
Glu Tyr Leu Ser Ser Pro Glu Lys His Phe Gly Thr Ser Arg Lys Phe
385 390 395 400
Ile Ala Ser Leu Glu Glu Asn Asn Tyr Val Lys Gln Glu Lys Val Ile
405 410 415
Ser Glu Asp Ile Ile Glu Glu Ala Lys Arg Leu Ala Thr Cys Ala Tyr
420 425 430
Glu Asp Gly Thr His Trp Gly Gln Glu Ala Asn Arg Pro Ser Phe Leu
435 440 445
Gly Cys Ala Pro Val Asp Met Gln Gly Phe Ser Ser Gln Leu Ile Lys
450 455 460
Trp Val Ala Ala Leu Thr Gln Ala Gly Leu Ser His Leu Asn Pro Ile
465 470 475 480
Thr Tyr Gly Phe Lys Ser Arg Met Arg Thr Leu Gln Val Leu Cys Tyr
485 490 495
Ala Tyr Leu Met Tyr Phe Ser Leu Tyr Ser Trp Gly Met Val Leu His
500 505 510
Ala Ser Val Pro Ser Ile Gly Leu Leu Ser Gly Ile Lys Ile Tyr Pro
515 520 525
Glu Val Tyr Asp Pro Trp Phe Val Val Tyr Val Ile Ala Phe Ile Ser
530 535 540
Thr Ile Leu Glu Asn Met Ser Glu Ser Ile Pro Glu Gly Gly Ser Val
545 550 555 560
Lys Thr Trp Trp Met Glu Tyr Arg Ala Leu Met Met Met Gly Val Ser
565 570 575
Ala Ile Trp Leu Gly Gly Val Lys Ala Ile Val Asp Lys Ile Ile Gly
580 585 590
Thr Gln Gly Glu Lys Leu Tyr Leu Ser Asp Lys Ala Ile Asp Lys Glu
595 600 605
Lys Leu Lys Lys Tyr Glu Lys Gly Lys Phe Asp Phe Gln Gly Ile Gly
610 615 620
Ile Leu Ala Val Pro Leu Ile Thr Phe Ser Val Leu Asn Leu Val Gly
625 630 635 640
Phe Leu Val Gly Ile Asn Gln Val Leu Ile Thr Met Lys Phe Ala Gly
645 650 655
Val Leu Gly Gln Leu Leu Val Ser Ser Phe Phe Val Phe Val Val Val
660 665 670
Thr Val Val Ile Asp Val Val Ser Phe Leu Lys Asp Ser
675 680 685
<210> 40
<211> 2136
<212> DNA
<213> Capsicum annuum
<400> 40
atggagctca acagatgtac ggtgcagcaa cctaccactg ccatataccg actacacatg 60
tttctccact ctctaatcat gcttgcatta gtatactatc gtttgtctaa tctgttttac 120
ttcgaaaacg tcctcacttt acaagcattt gcatgggggc ttatcacctt aggtgaaatt 180
tgtttcattg tcaagtggtt ctttggtcaa gggactcgtt ggcgccccgt tgtcagggaa 240
gtgttcctgg acaatattac ttgccaagat tccgagctgc ccgcactaga tgtgatggtt 300
ttcactgcca atcccaagaa agagccaatt gtggatgtca tgaacactgt gatatccgca 360
atggctcttg attacccgac ggataaattg gctgtgtatc tggctgatga tggaggatgc 420
cccttgacgt tgtacgccat ggaggaggcc tgttcttttg ccaagttgtg gctacctttc 480
tgtaggaagt atggaatcaa aacaaggtgc cccaaagcgt ttttttctcc attaggagaa 540
gatgatcgta tccttaagaa cgatgacttt gtagctgaaa tgaaagaaat taaattaaaa 600
tatgaggagt tccagcagaa tgtaaacctt gctggtgaat ccggaaaaat caaaggtgac 660
gtagtgcctg atagagcctc gtttattaag gtaataaatg acaggaaaat ggagaacaag 720
aagagtgccg acgatataac gaaaatgcct ttgctagtat acgtatcccg tgaaagaaga 780
tttaacagtc gtcatcactt caagggtgga tctgcaaatg ctcttcttcg agtttcaggg 840
ataatgagta atgcccccta tttactggtc ttagattgtg atttcttctg tcatgatcca 900
acatcagctc ggaaggcaat gtgtttccat cttgatccaa aactatcacc ttccttagct 960
tatgtgcagt tccctcaagt gttttacaat gtcagcaagt ccgatatata cgatgtcaaa 1020
attagacagg cttacaagac aatatggcac ggaatggatg gtatccaagg cccagtgtta 1080
tcgggaactg ggtattttct gaagaggaaa gcgttataca cgagtccagg tctaaaggat 1140
gagtatctta tttcaccgga aaagcatttc ggatcaagta gaaagttcat tgcttctcta 1200
gaggagaaca atggttatgt taagcaagag aaactcataa cagaagatat tatagaggaa 1260
gcgaagacct tgtctacttg tgcatacgag gatggtacac gatggggcga agagatcggt 1320
tatacctaca attgccattt ggagagcact tttaccggct atcttttgca ctgcaaaggg 1380
tggacatcaa catatttgta tccagaaagg ccatctttct tgggttgtgc cccagttgat 1440
atgcaaggat tctcctcaca actcacaaaa tgggttgctg cactcacaca agctggtcta 1500
tcacatctca atcccatcac ttacggcatg aagagcagga ttaagactat ccaatgcttg 1560
tgctatgcct atttgatgta tttctctctc tattcttggg gaatggttct gcatgctagt 1620
gttccttcta ttagcctttt gcttggcatt caagtctacc ccgaggtcta tgatccatgg 1680
tttgcagtgt atgtgcttgc tttcatatcg acaattttgg agaacatgtc agagtcaatt 1740
ccagaaggcg gttcagttaa aacttggtgg atggaataca gggcactgat gatgatggga 1800
gttagtgcaa tatggttagg aggagtgaaa gctatagtag aaaagatcat cggaactcaa 1860
ggagagaaat tatatttgtc ggacaaagca attgacaagg aaaagctcaa gaaatatgag 1920
aaggggaaat ttgatttcca agggataggg atacttgctg ttccattgat aacattctca 1980
gcgttgaatt tggtaggctt catggttgga gctaatcaag tgattcttac tatgaagttc 2040
gaagctttgc taggccaact ccttgtgtca tccttcttcg tctttgtggt ggtcaccgtt 2100
gtcatagatg tcctatcttt cttaaaagac tcttaa 2136
<210> 41
<211> 711
<212> PRT
<213> Capsicum annuum
<400> 41
Met Glu Leu Asn Arg Cys Thr Val Gln Gln Pro Thr Thr Ala Ile Tyr
1 5 10 15
Arg Leu His Met Phe Leu His Ser Leu Ile Met Leu Ala Leu Val Tyr
20 25 30
Tyr Arg Leu Ser Asn Leu Phe Tyr Phe Glu Asn Val Leu Thr Leu Gln
35 40 45
Ala Phe Ala Trp Gly Leu Ile Thr Leu Gly Glu Ile Cys Phe Ile Val
50 55 60
Lys Trp Phe Phe Gly Gln Gly Thr Arg Trp Arg Pro Val Val Arg Glu
65 70 75 80
Val Phe Leu Asp Asn Ile Thr Cys Gln Asp Ser Glu Leu Pro Ala Leu
85 90 95
Asp Val Met Val Phe Thr Ala Asn Pro Lys Lys Glu Pro Ile Val Asp
100 105 110
Val Met Asn Thr Val Ile Ser Ala Met Ala Leu Asp Tyr Pro Thr Asp
115 120 125
Lys Leu Ala Val Tyr Leu Ala Asp Asp Gly Gly Cys Pro Leu Thr Leu
130 135 140
Tyr Ala Met Glu Glu Ala Cys Ser Phe Ala Lys Leu Trp Leu Pro Phe
145 150 155 160
Cys Arg Lys Tyr Gly Ile Lys Thr Arg Cys Pro Lys Ala Phe Phe Ser
165 170 175
Pro Leu Gly Glu Asp Asp Arg Ile Leu Lys Asn Asp Asp Phe Val Ala
180 185 190
Glu Met Lys Glu Ile Lys Leu Lys Tyr Glu Glu Phe Gln Gln Asn Val
195 200 205
Asn Leu Ala Gly Glu Ser Gly Lys Ile Lys Gly Asp Val Val Pro Asp
210 215 220
Arg Ala Ser Phe Ile Lys Val Ile Asn Asp Arg Lys Met Glu Asn Lys
225 230 235 240
Lys Ser Ala Asp Asp Ile Thr Lys Met Pro Leu Leu Val Tyr Val Ser
245 250 255
Arg Glu Arg Arg Phe Asn Ser Arg His His Phe Lys Gly Gly Ser Ala
260 265 270
Asn Ala Leu Leu Arg Val Ser Gly Ile Met Ser Asn Ala Pro Tyr Leu
275 280 285
Leu Val Leu Asp Cys Asp Phe Phe Cys His Asp Pro Thr Ser Ala Arg
290 295 300
Lys Ala Met Cys Phe His Leu Asp Pro Lys Leu Ser Pro Ser Leu Ala
305 310 315 320
Tyr Val Gln Phe Pro Gln Val Phe Tyr Asn Val Ser Lys Ser Asp Ile
325 330 335
Tyr Asp Val Lys Ile Arg Gln Ala Tyr Lys Thr Ile Trp His Gly Met
340 345 350
Asp Gly Ile Gln Gly Pro Val Leu Ser Gly Thr Gly Tyr Phe Leu Lys
355 360 365
Arg Lys Ala Leu Tyr Thr Ser Pro Gly Leu Lys Asp Glu Tyr Leu Ile
370 375 380
Ser Pro Glu Lys His Phe Gly Ser Ser Arg Lys Phe Ile Ala Ser Leu
385 390 395 400
Glu Glu Asn Asn Gly Tyr Val Lys Gln Glu Lys Leu Ile Thr Glu Asp
405 410 415
Ile Ile Glu Glu Ala Lys Thr Leu Ser Thr Cys Ala Tyr Glu Asp Gly
420 425 430
Thr Arg Trp Gly Glu Glu Ile Gly Tyr Thr Tyr Asn Cys His Leu Glu
435 440 445
Ser Thr Phe Thr Gly Tyr Leu Leu His Cys Lys Gly Trp Thr Ser Thr
450 455 460
Tyr Leu Tyr Pro Glu Arg Pro Ser Phe Leu Gly Cys Ala Pro Val Asp
465 470 475 480
Met Gln Gly Phe Ser Ser Gln Leu Thr Lys Trp Val Ala Ala Leu Thr
485 490 495
Gln Ala Gly Leu Ser His Leu Asn Pro Ile Thr Tyr Gly Met Lys Ser
500 505 510
Arg Ile Lys Thr Ile Gln Cys Leu Cys Tyr Ala Tyr Leu Met Tyr Phe
515 520 525
Ser Leu Tyr Ser Trp Gly Met Val Leu His Ala Ser Val Pro Ser Ile
530 535 540
Ser Leu Leu Leu Gly Ile Gln Val Tyr Pro Glu Val Tyr Asp Pro Trp
545 550 555 560
Phe Ala Val Tyr Val Leu Ala Phe Ile Ser Thr Ile Leu Glu Asn Met
565 570 575
Ser Glu Ser Ile Pro Glu Gly Gly Ser Val Lys Thr Trp Trp Met Glu
580 585 590
Tyr Arg Ala Leu Met Met Met Gly Val Ser Ala Ile Trp Leu Gly Gly
595 600 605
Val Lys Ala Ile Val Glu Lys Ile Ile Gly Thr Gln Gly Glu Lys Leu
610 615 620
Tyr Leu Ser Asp Lys Ala Ile Asp Lys Glu Lys Leu Lys Lys Tyr Glu
625 630 635 640
Lys Gly Lys Phe Asp Phe Gln Gly Ile Gly Ile Leu Ala Val Pro Leu
645 650 655
Ile Thr Phe Ser Ala Leu Asn Leu Val Gly Phe Met Val Gly Ala Asn
660 665 670
Gln Val Ile Leu Thr Met Lys Phe Glu Ala Leu Leu Gly Gln Leu Leu
675 680 685
Val Ser Ser Phe Phe Val Phe Val Val Val Thr Val Val Ile Asp Val
690 695 700
Leu Ser Phe Leu Lys Asp Ser
705 710
<210> 42
<211> 270
<212> DNA
<213> Artificial Sequence
<220>
<223> Syn. Polynucl.
<400> 42
ggctcttgat tatcccaccg ataaattggc tgtgtatctc gctgatgatg gaggatgtcc 60
attgtcgttg tacgccatgg aacaagcgtg tttgtttgca aagctatggt tacctttctg 120
tagaaactat ggaattaaaa cgagatgccc aaaagcattt ttttctccgt taggagatga 180
tgaccgtgtt cttaagaatg atgattttgc tgctgaaatg aaagaaatta aattgaaata 240
tgaagagttc cagcagaagg tggaacatgc 270
<210> 43
<211> 275
<212> DNA
<213> Artificial Sequence
<220>
<223> Syn. Polynucl.
<400> 43
ggctcttgat tatcctacgg ataaattggc tgtgtatctg gctgatgatg gaggatgtcc 60
tttgtcattg tacgccatgg aagaagcatg tgtgtttgca aagctgtggc tacctttctg 120
taggaagtat ggaattaaaa ctagatgccc taaagcgttt ttttctcctt taggagatga 180
tgaacgtgtt cttaagaatg atgattttga tgctgaaatg aaagaaatta aattgaaata 240
tgaagagttc cagcagaatg tggaacgtgc tggtg 275
<210> 44
<211> 447
<212> DNA
<213> Artificial Sequence
<220>
<223> Syn. Polynucl.
<400> 44
ggctcttgat tacccgaccg acaaattggc cgtttatttg tctgatgatg gaggatgccc 60
cttgacgttg tacgcaatgg aggaagcttg ttcctttgcc aagttgtggc tacctttttg 120
taggaagtat ggaatcaaaa caaggtgccc taaggcgttt ttttctccat taggagaaga 180
tgaccgtgta ttgaagagtg atgactttgt ttctgaaatg aaagaaatga agtcaaaata 240
tgaagagttc cagcagaacg tggaccgtgc tggtgaatcc ggaaaaatca aaggtgacgt 300
agtgcctgat agacccgcgt ttcttaaggt actaaatgac aggaagacgg agaacgagaa 360
gagtgcagac gatttaacta aaatgccttt gctagtatac gtatcccgtg aaagaagaac 420
tcaccgtcgc catcacttca agggtgg 447
<210> 45
<211> 2292
<212> DNA
<213> Spinacia oleracea
<400> 45
atgtggaggt tgaaggttgg agaaggggct aatgacccat acttatatag cactaataac 60
tttgttgggc gtcaaacttg ggagtttgat cctaactatg gcacccctga ggatattcaa 120
gaggtcgaag atgctcgccg cgatttttac aataatcggt ttaaagtgaa gccttgtaac 180
gatctcttat ggcgttttca gttcttaaga gagaaaaact tcaagcaaac catacctcaa 240
gtgaaggtgg gtgacgggga ggagatcaca tatgagaccg cctcgacgac attaaagaga 300
gcggtgaata ttttcacagc cttgcagtct gaacatggcc attggccggc tgaaattgct 360
ggccctcagt tcttccttcc tcctttggta ttttgcttat acattacagg agatcttaac 420
tctgttttcg gaccagaaca tcgtagagaa attcttcgca gcatctacta tcaccagaac 480
gaagatggag gttggggatt acatattgaa ggacatagca ccatgttctg taccgcactg 540
aattacatat gtttacgaat gcttggaata ggacctgatg aaggtgatga caacgcgtgc 600
cctagagcgc gtaaatggat tctcgaccat ggtagcgtta cacatatccc ttcttggggt 660
aaaacttggt tatctatact gggcctgttc gattggtctg gaagtaaccc aatgccacct 720
gagttctgga tccttcctac ttttctccct atgcatccag caaaaatgtg gtgctactgt 780
cgaatggtgt atatgccaat gtcatacttg tatgggaaga gattcgtagg tccaatcaca 840
cctctcatta aacaacttag ggaagaactc tacaacgaac cctttgaaca aattagttgg 900
aagaaaatgc gacatttgtg tgcaccggag gatctctact atcctcatcc attgattcaa 960
gacttgatgt gggacgctct ttaccttttt acggaacctc tcctgacccg ttggcctttc 1020
aacaagttga tacgaaagaa agcattagag gttacaatgg aacacataca ttatgaagat 1080
gagaacagtc gttacataac aattggatgt gtcgagaagg ttttatgtat gttagcctgt 1140
tgggtggaag accctaaagg ggatcattac aagaaacatc ttgcaagagt acaagattac 1200
atttggattg ctgaagatgg attgaaaatg cagagttttg gaagtcaaca atgggattgt 1260
gggttttcag tacaggcatt attagcttct aatcttagtc tcgacgaaat tggacctgct 1320
cttaagaaag gccatttctt cattaaggag tcacaggtga aggacaatcc atccggcgac 1380
ttcaaagcta tgcatcgcca tatctcaaag ggatcgtgga ctttctccga ccaagatcat 1440
ggttggcaag tctccgattg cactgccgaa ggccttaagt gttgtctaat cttatcaaca 1500
atgcccccgg aaattgttgg agaaaagatg gaccctgaac gcctttatga ttctgtcaat 1560
gtcttgcttt ctctacagag taataaagga gggctagctg cctgggaacc agcaggggct 1620
caagaatggt tggaggtcct aaacccaaca gaattctttg aagacattgt gattgaacat 1680
gagtatgtag agtgtacggc ttcagcaatt caagctttaa taatgttcaa gaagttatac 1740
ccaggacaca ggaaaaaaga gattgaaaat tttgtagtaa acgcagtcaa gtaccttgaa 1800
aacacccaat atcctagtgg aggatggtat ggaaattggg ggatttgttt catatatgga 1860
acatggtttg cactaggagg gctagcagca ggtgggaaga catactataa ttgtgctgct 1920
gttaggaagg gtgttgattt tttgcttact acacaaaagg aggatggtgg ttggggtgaa 1980
agttatattt cttgtcccaa taaggaattt gtgccaatag agggaaagtc caatttggtt 2040
cagactggtt gggctttgat gggtctactt catgctggac aggcggagag ggatccaact 2100
cctctgcatc gtgcagcaaa gcttttgatt aattcacaac tcgaaaatgg cgatttccct 2160
caacaggaaa taacaggagt cttcatgaag aattgcatgt tacattatcc gatgtacaga 2220
agcatttatc cactgtgggc aattgcagaa tacagaaagc gtgtttcatt accttctatc 2280
aactctactt ga 2292
<210> 46
<211> 1452
<212> DNA
<213> Spinacia oleracea
<400> 46
atggaactct tctttatgtg tgggctagtc cttttcctct ccctatctct agcctccttc 60
ttccttttct ataaccacca tagaacccgg gggtacaagc tacccccggg caagatgggg 120
tggccggtgg tgggcgagtc atttgaattt tttcaaaccg ggtggaaagg ttacccggaa 180
aagttcatat ttgatagact gaacaagtac accccaagcc aagtgttcaa gacttccatc 240
gtaggagaaa aggttgcggt tttatgtggc gcggcgggta acaagttctt gtactcaaac 300
gagaacaagt tagtacaagc ttggtggcct agctctgttg ataagatctt tccttcttct 360
acccaaactt cctccaaaga agaggctaag aagatgcgga aactcctccc taacttcctc 420
aagcccgagg ctttacatag gtacataccc atcatggata gcattgccat ccggcacatg 480
gagtccgggt gggagggaaa ggacaaggta gaagtcttcc ctttggctaa gaattacacc 540
ttctggctgg cttgccgact cttcttaagc gtcgaggacc cggctcatgt agccaagttc 600
tccgaaccat tcaacgacat agccgcaggg atcatctcga tgccaatcga cctccccgga 660
acacccttca accgagggat caagtcgtct aacgtcgtaa ggaaagagtt gagggccatc 720
ataaagcaga ggaaacttga cttagcagat ggcaaggctt cacctacaca agatattctg 780
tctcatatgt tgttgacttg tactgaagat ggcaagttta tgagtgaaat ggatattgct 840
gataagattc tgggacttct tattggtgga catgatactg ctagtgcttc ttgtactttt 900
gttgttaagt ttcttgctga gcttcctcac atatatgaag gtgtctacaa agagcaaatg 960
gagatagcaa attcaaaaaa agcaggagaa cttctaaatt gggaggacat acaaaaaatg 1020
aaatactcat ggaatgtagc ttgtgaagtt atgcgtttgg ctcctccact tcaaggtggt 1080
ttcagggaag ccctttctga tttcatgtat aacggattcc aaatccccaa gggctggaag 1140
ttatattgga gtgcaaattc aacacatatg aacccggaat gcttcccgga gcccaagacg 1200
ttcgacccat cgaggttcga cggtacggga ccagcaccat acacatacgt ccccttcgga 1260
ggaggaccga gaatgtgccc gggcaaggag tatgcaaggc tagagatatt agtgttcatg 1320
cacaacgttg tcaagaggtt taaatgggaa aaaatgcttc ctgatgagaa ggttattgtc 1380
aatcccatgc ctatcccaga acatggcctt cctgtccgcc ttttccctca tcctcgaact 1440
gtagctgctt aa 1452
<210> 47
<211> 279
<212> DNA
<213> Spinacia oleracea
<400> 47
atggagttct tctttctgtg tggtctagtc ttttacttct ccatatctct agcctccttc 60
ttccttttct ataaccacca tacaacccgg gtttacccgc tacccgcggg cgagatgggg 120
tggccggtgg tgggcgactc gtttgaattt tttcaaaccg ggtggaacgg ttacccggaa 180
aatttcatct ttgatagact caacaaatac accccaagcc aagtgttcaa gactttcatc 240
ctaagagaaa aggttgtgtt ttatttgaga aggttgtag 279
<210> 48
<211> 483
<212> PRT
<213> Spinacia oleracea
<400> 48
Met Glu Leu Phe Phe Met Cys Gly Leu Val Leu Phe Leu Ser Leu Ser
1 5 10 15
Leu Ala Ser Phe Phe Leu Phe Tyr Asn His His Arg Thr Arg Gly Tyr
20 25 30
Lys Leu Pro Pro Gly Lys Met Gly Trp Pro Val Val Gly Glu Ser Phe
35 40 45
Glu Phe Phe Gln Thr Gly Trp Lys Gly Tyr Pro Glu Lys Phe Ile Phe
50 55 60
Asp Arg Leu Asn Lys Tyr Thr Pro Ser Gln Val Phe Lys Thr Ser Ile
65 70 75 80
Val Gly Glu Lys Val Ala Val Leu Cys Gly Ala Ala Gly Asn Lys Phe
85 90 95
Leu Tyr Ser Asn Glu Asn Lys Leu Val Gln Ala Trp Trp Pro Ser Ser
100 105 110
Val Asp Lys Ile Phe Pro Ser Ser Thr Gln Thr Ser Ser Lys Glu Glu
115 120 125
Ala Lys Lys Met Arg Lys Leu Leu Pro Asn Phe Leu Lys Pro Glu Ala
130 135 140
Leu His Arg Tyr Ile Pro Ile Met Asp Ser Ile Ala Ile Arg His Met
145 150 155 160
Glu Ser Gly Trp Glu Gly Lys Asp Lys Val Glu Val Phe Pro Leu Ala
165 170 175
Lys Asn Tyr Thr Phe Trp Leu Ala Cys Arg Leu Phe Leu Ser Val Glu
180 185 190
Asp Pro Ala His Val Ala Lys Phe Ser Glu Pro Phe Asn Asp Ile Ala
195 200 205
Ala Gly Ile Ile Ser Met Pro Ile Asp Leu Pro Gly Thr Pro Phe Asn
210 215 220
Arg Gly Ile Lys Ser Ser Asn Val Val Arg Lys Glu Leu Arg Ala Ile
225 230 235 240
Ile Lys Gln Arg Lys Leu Asp Leu Ala Asp Gly Lys Ala Ser Pro Thr
245 250 255
Gln Asp Ile Leu Ser His Met Leu Leu Thr Cys Thr Glu Asp Gly Lys
260 265 270
Phe Met Ser Glu Met Asp Ile Ala Asp Lys Ile Leu Gly Leu Leu Ile
275 280 285
Gly Gly His Asp Thr Ala Ser Ala Ser Cys Thr Phe Val Val Lys Phe
290 295 300
Leu Ala Glu Leu Pro His Ile Tyr Glu Gly Val Tyr Lys Glu Gln Met
305 310 315 320
Glu Ile Ala Asn Ser Lys Lys Ala Gly Glu Leu Leu Asn Trp Glu Asp
325 330 335
Ile Gln Lys Met Lys Tyr Ser Trp Asn Val Ala Cys Glu Val Met Arg
340 345 350
Leu Ala Pro Pro Leu Gln Gly Gly Phe Arg Glu Ala Leu Ser Asp Phe
355 360 365
Met Tyr Asn Gly Phe Gln Ile Pro Lys Gly Trp Lys Leu Tyr Trp Ser
370 375 380
Ala Asn Ser Thr His Met Asn Pro Glu Cys Phe Pro Glu Pro Lys Thr
385 390 395 400
Phe Asp Pro Ser Arg Phe Asp Gly Thr Gly Pro Ala Pro Tyr Thr Tyr
405 410 415
Val Pro Phe Gly Gly Gly Pro Arg Met Cys Pro Gly Lys Glu Tyr Ala
420 425 430
Arg Leu Glu Ile Leu Val Phe Met His Asn Val Val Lys Arg Phe Lys
435 440 445
Trp Glu Lys Met Leu Pro Asp Glu Lys Val Ile Val Asn Pro Met Pro
450 455 460
Ile Pro Glu His Gly Leu Pro Val Arg Leu Phe Pro His Pro Arg Thr
465 470 475 480
Val Ala Ala
<210> 49
<211> 763
<212> PRT
<213> Spinacia oleracea
<400> 49
Met Trp Arg Leu Lys Val Gly Glu Gly Ala Asn Asp Pro Tyr Leu Tyr
1 5 10 15
Ser Thr Asn Asn Phe Val Gly Arg Gln Thr Trp Glu Phe Asp Pro Asn
20 25 30
Tyr Gly Thr Pro Glu Asp Ile Gln Glu Val Glu Asp Ala Arg Arg Asp
35 40 45
Phe Tyr Asn Asn Arg Phe Lys Val Lys Pro Cys Asn Asp Leu Leu Trp
50 55 60
Arg Phe Gln Phe Leu Arg Glu Lys Asn Phe Lys Gln Thr Ile Pro Gln
65 70 75 80
Val Lys Val Gly Asp Gly Glu Glu Ile Thr Tyr Glu Thr Ala Ser Thr
85 90 95
Thr Leu Lys Arg Ala Val Asn Ile Phe Thr Ala Leu Gln Ser Glu His
100 105 110
Gly His Trp Pro Ala Glu Ile Ala Gly Pro Gln Phe Phe Leu Pro Pro
115 120 125
Leu Val Phe Cys Leu Tyr Ile Thr Gly Asp Leu Asn Ser Val Phe Gly
130 135 140
Pro Glu His Arg Arg Glu Ile Leu Arg Ser Ile Tyr Tyr His Gln Asn
145 150 155 160
Glu Asp Gly Gly Trp Gly Leu His Ile Glu Gly His Ser Thr Met Phe
165 170 175
Cys Thr Ala Leu Asn Tyr Ile Cys Leu Arg Met Leu Gly Ile Gly Pro
180 185 190
Asp Glu Gly Asp Asp Asn Ala Cys Pro Arg Ala Arg Lys Trp Ile Leu
195 200 205
Asp His Gly Ser Val Thr His Ile Pro Ser Trp Gly Lys Thr Trp Leu
210 215 220
Ser Ile Leu Gly Leu Phe Asp Trp Ser Gly Ser Asn Pro Met Pro Pro
225 230 235 240
Glu Phe Trp Ile Leu Pro Thr Phe Leu Pro Met His Pro Ala Lys Met
245 250 255
Trp Cys Tyr Cys Arg Met Val Tyr Met Pro Met Ser Tyr Leu Tyr Gly
260 265 270
Lys Arg Phe Val Gly Pro Ile Thr Pro Leu Ile Lys Gln Leu Arg Glu
275 280 285
Glu Leu Tyr Asn Glu Pro Phe Glu Gln Ile Ser Trp Lys Lys Met Arg
290 295 300
His Leu Cys Ala Pro Glu Asp Leu Tyr Tyr Pro His Pro Leu Ile Gln
305 310 315 320
Asp Leu Met Trp Asp Ala Leu Tyr Leu Phe Thr Glu Pro Leu Leu Thr
325 330 335
Arg Trp Pro Phe Asn Lys Leu Ile Arg Lys Lys Ala Leu Glu Val Thr
340 345 350
Met Glu His Ile His Tyr Glu Asp Glu Asn Ser Arg Tyr Ile Thr Ile
355 360 365
Gly Cys Val Glu Lys Val Leu Cys Met Leu Ala Cys Trp Val Glu Asp
370 375 380
Pro Lys Gly Asp His Tyr Lys Lys His Leu Ala Arg Val Gln Asp Tyr
385 390 395 400
Ile Trp Ile Ala Glu Asp Gly Leu Lys Met Gln Ser Phe Gly Ser Gln
405 410 415
Gln Trp Asp Cys Gly Phe Ser Val Gln Ala Leu Leu Ala Ser Asn Leu
420 425 430
Ser Leu Asp Glu Ile Gly Pro Ala Leu Lys Lys Gly His Phe Phe Ile
435 440 445
Lys Glu Ser Gln Val Lys Asp Asn Pro Ser Gly Asp Phe Lys Ala Met
450 455 460
His Arg His Ile Ser Lys Gly Ser Trp Thr Phe Ser Asp Gln Asp His
465 470 475 480
Gly Trp Gln Val Ser Asp Cys Thr Ala Glu Gly Leu Lys Cys Cys Leu
485 490 495
Ile Leu Ser Thr Met Pro Pro Glu Ile Val Gly Glu Lys Met Asp Pro
500 505 510
Glu Arg Leu Tyr Asp Ser Val Asn Val Leu Leu Ser Leu Gln Ser Asn
515 520 525
Lys Gly Gly Leu Ala Ala Trp Glu Pro Ala Gly Ala Gln Glu Trp Leu
530 535 540
Glu Val Leu Asn Pro Thr Glu Phe Phe Glu Asp Ile Val Ile Glu His
545 550 555 560
Glu Tyr Val Glu Cys Thr Ala Ser Ala Ile Gln Ala Leu Ile Met Phe
565 570 575
Lys Lys Leu Tyr Pro Gly His Arg Lys Lys Glu Ile Glu Asn Phe Val
580 585 590
Val Asn Ala Val Lys Tyr Leu Glu Asn Thr Gln Tyr Pro Ser Gly Gly
595 600 605
Trp Tyr Gly Asn Trp Gly Ile Cys Phe Ile Tyr Gly Thr Trp Phe Ala
610 615 620
Leu Gly Gly Leu Ala Ala Gly Gly Lys Thr Tyr Tyr Asn Cys Ala Ala
625 630 635 640
Val Arg Lys Gly Val Asp Phe Leu Leu Thr Thr Gln Lys Glu Asp Gly
645 650 655
Gly Trp Gly Glu Ser Tyr Ile Ser Cys Pro Asn Lys Glu Phe Val Pro
660 665 670
Ile Glu Gly Lys Ser Asn Leu Val Gln Thr Gly Trp Ala Leu Met Gly
675 680 685
Leu Leu His Ala Gly Gln Ala Glu Arg Asp Pro Thr Pro Leu His Arg
690 695 700
Ala Ala Lys Leu Leu Ile Asn Ser Gln Leu Glu Asn Gly Asp Phe Pro
705 710 715 720
Gln Gln Glu Ile Thr Gly Val Phe Met Lys Asn Cys Met Leu His Tyr
725 730 735
Pro Met Tyr Arg Ser Ile Tyr Pro Leu Trp Ala Ile Ala Glu Tyr Arg
740 745 750
Lys Arg Val Ser Leu Pro Ser Ile Asn Ser Thr
755 760
<210> 50
<211> 92
<212> PRT
<213> Spinacia oleracea
<400> 50
Met Glu Phe Phe Phe Leu Cys Gly Leu Val Phe Tyr Phe Ser Ile Ser
1 5 10 15
Leu Ala Ser Phe Phe Leu Phe Tyr Asn His His Thr Thr Arg Val Tyr
20 25 30
Pro Leu Pro Ala Gly Glu Met Gly Trp Pro Val Val Gly Asp Ser Phe
35 40 45
Glu Phe Phe Gln Thr Gly Trp Asn Gly Tyr Pro Glu Asn Phe Ile Phe
50 55 60
Asp Arg Leu Asn Lys Tyr Thr Pro Ser Gln Val Phe Lys Thr Phe Ile
65 70 75 80
Leu Arg Glu Lys Val Val Phe Tyr Leu Arg Arg Leu
85 90
<210> 51
<211> 1563
<212> DNA
<213> Spinacia oleracea
<400> 51
atgatagaaa tcgggtatat tgtaaaatgg gtaatttgtt tagtgattgt tagatgggta 60
tggaagattg tgaattgggt ttggtttaca ccaaaaaggc ttgagaagtt tctaagaaaa 120
caaggtttag atggaaattc atacagattt ttgttgggtg atctcaaaga tatgtctaaa 180
atgcgtaaag aagctagaca aaaacctatt ccttttactc atgacttctt tcatcgtatc 240
ttgcctttcc acaatcacca tttcaataaa tacggggaaa gcttcttttc atggatgggg 300
cctataccag ttgtgaatgt tgcagaacaa gagcaagtaa agggtgtgtt cactaggata 360
aaagagtttc agaaggccaa attaaaccca cttgttgcat tgcttgtccc tggacttgtg 420
agcgctgaag gtgataaatg ggtcaagcac aggaagctca tcaacccggc ttttcatatg 480
gaaaagctta agcttatgca tccagcattt ggcgccagtg ttttggatat ggtgaacaag 540
tgggagaaga tagtatctaa aacaggttcc tctgaagtgg atgtgtggcc gtttgtttcc 600
agcctgactg cagatgctat ctctcgtgct gcttttggca gtagctatga tgaaggaaga 660
aagatatttg agttggttct tgaacaaact gaaatcaccc tacgccttct gcaatcagtt 720
tatatccctg gatggatgta tgtgccaaca aagaccaaca ggaggatgaa aacagtaaac 780
tctgaaatac aaaatttatt aaccgggata atcgttaaga gaaagaaggc aatggaggcc 840
ggcgaagctg ccaaggatga tttgttgggg atattgttgg agtccaacta caaagatact 900
gaaaatgttc tcagtaataa gaaaaaacta agcatgactt tccaggaatt gattgatgag 960
tgcaaactgt tctacttagc agggcaagag tcgacctcgg tgttgctagc atggacaatg 1020
attctgttgg gaaagcacac agagtggcaa gcacgagcac gagaagaagt agttgcaacg 1080
tttggtaaaa acgaacctga ttttgaaggc ttaaaccatt tgaagatagt gacaatgata 1140
ctgaatgagg tgttgaggtt gtaccctcca gtgtgtacaa tcacccgtaa gaatttcaac 1200
cacgacgtac agcttggaaa tctgacagtc cctcgtggtg ctatggttac gatgtcagca 1260
tatcgtattc aaagagatcc taaaatatgg ggtgatgatg caaaagagtt taacccacag 1320
agattttcag aaggggttgc aaaggctaca aaggggaata ttgcattctt tccgtttggt 1380
tgggggccgc gaatttgcat cggacagaac tttgcactta ttgaagctaa aatggcagtg 1440
tccatggttt tacaacgctt ttcttttgag ctatcaccgt cttatactca tgctcctacc 1500
actatcctca ctcttcaacc ccaacaaggt gctcatctca ttatacataa gctcagggac 1560
taa 1563
<210> 52
<211> 520
<212> PRT
<213> Spinacia oleracea
<400> 52
Met Ile Glu Ile Gly Tyr Ile Val Lys Trp Val Ile Cys Leu Val Ile
1 5 10 15
Val Arg Trp Val Trp Lys Ile Val Asn Trp Val Trp Phe Thr Pro Lys
20 25 30
Arg Leu Glu Lys Phe Leu Arg Lys Gln Gly Leu Asp Gly Asn Ser Tyr
35 40 45
Arg Phe Leu Leu Gly Asp Leu Lys Asp Met Ser Lys Met Arg Lys Glu
50 55 60
Ala Arg Gln Lys Pro Ile Pro Phe Thr His Asp Phe Phe His Arg Ile
65 70 75 80
Leu Pro Phe His Asn His His Phe Asn Lys Tyr Gly Glu Ser Phe Phe
85 90 95
Ser Trp Met Gly Pro Ile Pro Val Val Asn Val Ala Glu Gln Glu Gln
100 105 110
Val Lys Gly Val Phe Thr Arg Ile Lys Glu Phe Gln Lys Ala Lys Leu
115 120 125
Asn Pro Leu Val Ala Leu Leu Val Pro Gly Leu Val Ser Ala Glu Gly
130 135 140
Asp Lys Trp Val Lys His Arg Lys Leu Ile Asn Pro Ala Phe His Met
145 150 155 160
Glu Lys Leu Lys Leu Met His Pro Ala Phe Gly Ala Ser Val Leu Asp
165 170 175
Met Val Asn Lys Trp Glu Lys Ile Val Ser Lys Thr Gly Ser Ser Glu
180 185 190
Val Asp Val Trp Pro Phe Val Ser Ser Leu Thr Ala Asp Ala Ile Ser
195 200 205
Arg Ala Ala Phe Gly Ser Ser Tyr Asp Glu Gly Arg Lys Ile Phe Glu
210 215 220
Leu Val Leu Glu Gln Thr Glu Ile Thr Leu Arg Leu Leu Gln Ser Val
225 230 235 240
Tyr Ile Pro Gly Trp Met Tyr Val Pro Thr Lys Thr Asn Arg Arg Met
245 250 255
Lys Thr Val Asn Ser Glu Ile Gln Asn Leu Leu Thr Gly Ile Ile Val
260 265 270
Lys Arg Lys Lys Ala Met Glu Ala Gly Glu Ala Ala Lys Asp Asp Leu
275 280 285
Leu Gly Ile Leu Leu Glu Ser Asn Tyr Lys Asp Thr Glu Asn Val Leu
290 295 300
Ser Asn Lys Lys Lys Leu Ser Met Thr Phe Gln Glu Leu Ile Asp Glu
305 310 315 320
Cys Lys Leu Phe Tyr Leu Ala Gly Gln Glu Ser Thr Ser Val Leu Leu
325 330 335
Ala Trp Thr Met Ile Leu Leu Gly Lys His Thr Glu Trp Gln Ala Arg
340 345 350
Ala Arg Glu Glu Val Val Ala Thr Phe Gly Lys Asn Glu Pro Asp Phe
355 360 365
Glu Gly Leu Asn His Leu Lys Ile Val Thr Met Ile Leu Asn Glu Val
370 375 380
Leu Arg Leu Tyr Pro Pro Val Cys Thr Ile Thr Arg Lys Asn Phe Asn
385 390 395 400
His Asp Val Gln Leu Gly Asn Leu Thr Val Pro Arg Gly Ala Met Val
405 410 415
Thr Met Ser Ala Tyr Arg Ile Gln Arg Asp Pro Lys Ile Trp Gly Asp
420 425 430
Asp Ala Lys Glu Phe Asn Pro Gln Arg Phe Ser Glu Gly Val Ala Lys
435 440 445
Ala Thr Lys Gly Asn Ile Ala Phe Phe Pro Phe Gly Trp Gly Pro Arg
450 455 460
Ile Cys Ile Gly Gln Asn Phe Ala Leu Ile Glu Ala Lys Met Ala Val
465 470 475 480
Ser Met Val Leu Gln Arg Phe Ser Phe Glu Leu Ser Pro Ser Tyr Thr
485 490 495
His Ala Pro Thr Thr Ile Leu Thr Leu Gln Pro Gln Gln Gly Ala His
500 505 510
Leu Ile Ile His Lys Leu Arg Asp
515 520
<210> 53
<211> 1596
<212> DNA
<213> Spinacia oleracea
<400> 53
atgatttcaa agagcgcgag tggtgttgca attgcttcat tgggttgcat tatcatactg 60
tattggatgt ggaaattact aaaagggcta tggttaacac caaaaaagct agagaaatgt 120
ctaaaacaac aaggtcttgt tggtaattcc tacaaatttt tgattggaga tatgaaagaa 180
agctcaaaat tgcgtaacga agctttacaa aaacccattc ctttcactca tgattattac 240
aaccgtattc agcctttcat ccatcagatt ctcaacaatt ctggtgcagg caaaaatatc 300
tacacatggt tgggaccagt gccaacaata ctaattacac aacctgagtt aataaaggat 360
gctttcaata ggatgaacaa ttttcagaaa ccaagattaa atccatatac tcaaatgctt 420
tcaactggac ttccgaacta tgagggtcag aaatgggcta aacacaggaa gcttctcaac 480
cctgcttttc aacttgataa gctcaagctt atgatccata cttttgaaac ctgtgttacg 540
gatacactga ataagtggga gaagctagtt tgtaaaacag gttcttcaga ggttgatata 600
tggccatatt tgacaacttt aacgggagat ggtattgcta gagctgcatt tggaagtagc 660
tttgaagatg gaagaagaat attcgagctt ctcacactgc agaaggatat tgttattagt 720
cttctcaaat attcttatat tccaggattt aaatatatgc caataaaggg taaccggaag 780
atgaaagaag cggacaatga aataaaacct ctgttgacga atataattaa tagaaggagg 840
aaagcgatgg aggccggaga agctcccaaa gacgacttgt tagggatgct acttgaatcc 900
aatgcaaacg aggctcgaca agttaatgaa aatgaaagtg gtagtagcaa gcgaaaatct 960
gatctaacga tgagcttccc tgagatgatc gatgcttgca agcagttctt cttggctggt 1020
caagagacca cctcagtggc cctaacatgg acaatgcttt tgttagccaa gcaccaagat 1080
tggcaaacac gagctcgaca agaagtactt gctacatttg gaatgaatac cccagacttt 1140
gatggcatac ataatcgtct taagattgtg acaatgatac tctacgaggt gttaaggttg 1200
tatccgccag tccctgcaac atcgcgaagg gttcatgatc gtgaaacaaa gctaggagat 1260
ttggtaatac cacaaggggt aggagtttca ttttccatac ttcatgcaca cttgaaccct 1320
gaaatttggg gtgatgatgc caaagaattc aagcctgata gatttgcaga agggattgca 1380
aaagcaacaa aagggaataa ctcttacttc ccctttggtt ggggacctag gatttgcatt 1440
ggccaaaact tcgcactagt tgaggcgaaa atggcattgt gtatgatttt gcagcgtttc 1500
tctttcgatc tctcgccttc atacatccat gctccgacta gtctcatatc ccttcaacct 1560
cagcatggtg cccacattat tttacatcga ttttaa 1596
<210> 54
<211> 531
<212> PRT
<213> Spinacia oleracea
<400> 54
Met Ile Ser Lys Ser Ala Ser Gly Val Ala Ile Ala Ser Leu Gly Cys
1 5 10 15
Ile Ile Ile Leu Tyr Trp Met Trp Lys Leu Leu Lys Gly Leu Trp Leu
20 25 30
Thr Pro Lys Lys Leu Glu Lys Cys Leu Lys Gln Gln Gly Leu Val Gly
35 40 45
Asn Ser Tyr Lys Phe Leu Ile Gly Asp Met Lys Glu Ser Ser Lys Leu
50 55 60
Arg Asn Glu Ala Leu Gln Lys Pro Ile Pro Phe Thr His Asp Tyr Tyr
65 70 75 80
Asn Arg Ile Gln Pro Phe Ile His Gln Ile Leu Asn Asn Ser Gly Ala
85 90 95
Gly Lys Asn Ile Tyr Thr Trp Leu Gly Pro Val Pro Thr Ile Leu Ile
100 105 110
Thr Gln Pro Glu Leu Ile Lys Asp Ala Phe Asn Arg Met Asn Asn Phe
115 120 125
Gln Lys Pro Arg Leu Asn Pro Tyr Thr Gln Met Leu Ser Thr Gly Leu
130 135 140
Pro Asn Tyr Glu Gly Gln Lys Trp Ala Lys His Arg Lys Leu Leu Asn
145 150 155 160
Pro Ala Phe Gln Leu Asp Lys Leu Lys Leu Met Ile His Thr Phe Glu
165 170 175
Thr Cys Val Thr Asp Thr Leu Asn Lys Trp Glu Lys Leu Val Cys Lys
180 185 190
Thr Gly Ser Ser Glu Val Asp Ile Trp Pro Tyr Leu Thr Thr Leu Thr
195 200 205
Gly Asp Gly Ile Ala Arg Ala Ala Phe Gly Ser Ser Phe Glu Asp Gly
210 215 220
Arg Arg Ile Phe Glu Leu Leu Thr Leu Gln Lys Asp Ile Val Ile Ser
225 230 235 240
Leu Leu Lys Tyr Ser Tyr Ile Pro Gly Phe Lys Tyr Met Pro Ile Lys
245 250 255
Gly Asn Arg Lys Met Lys Glu Ala Asp Asn Glu Ile Lys Pro Leu Leu
260 265 270
Thr Asn Ile Ile Asn Arg Arg Arg Lys Ala Met Glu Ala Gly Glu Ala
275 280 285
Pro Lys Asp Asp Leu Leu Gly Met Leu Leu Glu Ser Asn Ala Asn Glu
290 295 300
Ala Arg Gln Val Asn Glu Asn Glu Ser Gly Ser Ser Lys Arg Lys Ser
305 310 315 320
Asp Leu Thr Met Ser Phe Pro Glu Met Ile Asp Ala Cys Lys Gln Phe
325 330 335
Phe Leu Ala Gly Gln Glu Thr Thr Ser Val Ala Leu Thr Trp Thr Met
340 345 350
Leu Leu Leu Ala Lys His Gln Asp Trp Gln Thr Arg Ala Arg Gln Glu
355 360 365
Val Leu Ala Thr Phe Gly Met Asn Thr Pro Asp Phe Asp Gly Ile His
370 375 380
Asn Arg Leu Lys Ile Val Thr Met Ile Leu Tyr Glu Val Leu Arg Leu
385 390 395 400
Tyr Pro Pro Val Pro Ala Thr Ser Arg Arg Val His Asp Arg Glu Thr
405 410 415
Lys Leu Gly Asp Leu Val Ile Pro Gln Gly Val Gly Val Ser Phe Ser
420 425 430
Ile Leu His Ala His Leu Asn Pro Glu Ile Trp Gly Asp Asp Ala Lys
435 440 445
Glu Phe Lys Pro Asp Arg Phe Ala Glu Gly Ile Ala Lys Ala Thr Lys
450 455 460
Gly Asn Asn Ser Tyr Phe Pro Phe Gly Trp Gly Pro Arg Ile Cys Ile
465 470 475 480
Gly Gln Asn Phe Ala Leu Val Glu Ala Lys Met Ala Leu Cys Met Ile
485 490 495
Leu Gln Arg Phe Ser Phe Asp Leu Ser Pro Ser Tyr Ile His Ala Pro
500 505 510
Thr Ser Leu Ile Ser Leu Gln Pro Gln His Gly Ala His Ile Ile Leu
515 520 525
His Arg Phe
530
<210> 55
<211> 1092
<212> DNA
<213> Spinacia oleracea
<400> 55
atgacgggaa aaggaagaac gatggaggtg atcatgatgc catttcacca ccaaggtcac 60
ttaaccccga tgctccaatt cgcgaagcgc ttcgcttgga aaggtgctgg ctcgatccgg 120
atcaccctcg ccaccaccct ctccaccgcc caaaatatga ccaattccaa aaacaacaac 180
aacaataacg attacgattt cctgacggtc gaaagcatct acgacgatac cgatgattct 240
cagctcaaat tcatgggtcg tatgggaaag ttcaagtccg aagcctcact ccaacttggc 300
cgtctaatca ctactaagag catcgacaat aataaatgta tgctcgttta tgatgcgtat 360
ctgccttggg cactggatgt gggcaaggac cataacatac aggctgcggc tttcttcgtc 420
caggcttgtg cgtatatggc atccttttac cctatgtttt tagaggaatt tgggtcggat 480
gatcaacatc ctgttgttgc ggctgctaag gctgaatctg ttcctagttt gtcggttgag 540
ctgccgtcgc gggaggaaat ggaacgatac gcgccgaaat gtgcacaatc cccgagttct 600
gatgataaac ccaatactgt taagaaatcg cttcaccctg tctaccggat ggtggtttca 660
tcaattacaa cccttcatct tgctgatttc gtgctcatca actcctttga tcaccttgaa 720
catcagctgg atgtcttagc acatgaagca gtagggtgtt tcataaccca ttgcggttgg 780
aactcgataa ttgaggcgac caactttggg gttccgatgt tggggatgcc acagttcatg 840
gaccagtttt tggatgctca ttttatggag aaggtttggg gtgttggaat tagggctaag 900
gctgatgaga aaaactttgt tacttgtgac gaaatcaagt gcggtgtcaa tgaaattatg 960
tacggagata aggcaaatat gatcaaggag aatgcagcaa agtggaaaga cttggctaag 1020
gaggcagttg gtgaaggagg cagttcagat aagaatatcg acgagatcat taactggctt 1080
gcgtcctcct aa 1092
<210> 56
<211> 363
<212> PRT
<213> Spinacia oleracea
<400> 56
Met Thr Gly Lys Gly Arg Thr Met Glu Val Ile Met Met Pro Phe His
1 5 10 15
His Gln Gly His Leu Thr Pro Met Leu Gln Phe Ala Lys Arg Phe Ala
20 25 30
Trp Lys Gly Ala Gly Ser Ile Arg Ile Thr Leu Ala Thr Thr Leu Ser
35 40 45
Thr Ala Gln Asn Met Thr Asn Ser Lys Asn Asn Asn Asn Asn Asn Asp
50 55 60
Tyr Asp Phe Leu Thr Val Glu Ser Ile Tyr Asp Asp Thr Asp Asp Ser
65 70 75 80
Gln Leu Lys Phe Met Gly Arg Met Gly Lys Phe Lys Ser Glu Ala Ser
85 90 95
Leu Gln Leu Gly Arg Leu Ile Thr Thr Lys Ser Ile Asp Asn Asn Lys
100 105 110
Cys Met Leu Val Tyr Asp Ala Tyr Leu Pro Trp Ala Leu Asp Val Gly
115 120 125
Lys Asp His Asn Ile Gln Ala Ala Ala Phe Phe Val Gln Ala Cys Ala
130 135 140
Tyr Met Ala Ser Phe Tyr Pro Met Phe Leu Glu Glu Phe Gly Ser Asp
145 150 155 160
Asp Gln His Pro Val Val Ala Ala Ala Lys Ala Glu Ser Val Pro Ser
165 170 175
Leu Ser Val Glu Leu Pro Ser Arg Glu Glu Met Glu Arg Tyr Ala Pro
180 185 190
Lys Cys Ala Gln Ser Pro Ser Ser Asp Asp Lys Pro Asn Thr Val Lys
195 200 205
Lys Ser Leu His Pro Val Tyr Arg Met Val Val Ser Ser Ile Thr Thr
210 215 220
Leu His Leu Ala Asp Phe Val Leu Ile Asn Ser Phe Asp His Leu Glu
225 230 235 240
His Gln Leu Asp Val Leu Ala His Glu Ala Val Gly Cys Phe Ile Thr
245 250 255
His Cys Gly Trp Asn Ser Ile Ile Glu Ala Thr Asn Phe Gly Val Pro
260 265 270
Met Leu Gly Met Pro Gln Phe Met Asp Gln Phe Leu Asp Ala His Phe
275 280 285
Met Glu Lys Val Trp Gly Val Gly Ile Arg Ala Lys Ala Asp Glu Lys
290 295 300
Asn Phe Val Thr Cys Asp Glu Ile Lys Cys Gly Val Asn Glu Ile Met
305 310 315 320
Tyr Gly Asp Lys Ala Asn Met Ile Lys Glu Asn Ala Ala Lys Trp Lys
325 330 335
Asp Leu Ala Lys Glu Ala Val Gly Glu Gly Gly Ser Ser Asp Lys Asn
340 345 350
Ile Asp Glu Ile Ile Asn Trp Leu Ala Ser Ser
355 360
<210> 57
<211> 1374
<212> DNA
<213> Spinacia oleracea
<400> 57
atgggtaaaa cagtagcagc ttcagagcag ttacacatag taatgatccc atggtttgct 60
tatggacaca ttcttcccta ttttgagctt tcaaacaaac ttgctgaaaa aggccataaa 120
atcaccttgg tagttccaaa caaagtcaaa cttgatttag aaccaaagat ccgtcatcct 180
tccttaatca gcttacatgc attcactgtc ccacacattg aacccttacc tccggggact 240
gagacatgtt cagacgtccc cattgaactt cagcaccacc ttgctgttgc catggacagg 300
gcccggcctg aggtggagtc catcatatca gccattgacg atccgaagcc ggatctgttg 360
ttctacgata acgcttactg ggtgcctgag atagccacaa agctggggat gaagtctgtg 420
ttttaccaga ttgcatgtgc tttaagtatc acccgcatta agcaaacccc gagtgcgagt 480
gcgagtgcga gtgcgagtgc caagctcttc actttaccca agtgggtgct gacgcctaag 540
gtgttaggcg acgcaagagc caattatgga gaagggatca cctattacca gagagtgaag 600
aaggctctaa gttcctgtga tgctatcgcc ttacgcacat gccgggagat tgaaggggaa 660
tcctctgata tcctggctgc acaatataac aagccagtct tcttaacagg tccggtccta 720
cccgaggttg aattcctccc ccctttggac aattcctggg ctgagtggct agccaagttt 780
gggcctaagt ccgtggtttt atgttgcttc ggaagccagt acgtccctga caaggctcaa 840
ctacaggaga tggcccttgc ccttgaggat actggtcttc ccttcttgat gtccgttaag 900
ccacccacag agtgcgccac catagaggag gcgttgccag aagggttctc agagagagtc 960
aaggaacgcg gggtggttca tggtggatgg gtgcaacagc tacaaatact agctcaccca 1020
tcagtgggtt gctttatttg tcattgtggg tacgggtcaa tgtgggaggg gttgttgagt 1080
gataaccagc tagtcttatt accacagctt cctgaccagt taatgatggc tcaaatgttg 1140
gcagaaaagc tcaaggtggg tgtgatggtg gacagagaag aagatgatgg gtgggtttcc 1200
aggaagaact tgtgccaagc agtcaagtct gtcatggatc ctcattccga gtttgcagct 1260
ttactcaaga acaaccatgc taacttcaga gacaagttgc taaccaacgg ttttatggct 1320
aattaccttg aagtttttga ccaggatttg aaacgctttc ttactgcaaa ttaa 1374
<210> 58
<211> 457
<212> PRT
<213> Spinacia oleracea
<400> 58
Met Gly Lys Thr Val Ala Ala Ser Glu Gln Leu His Ile Val Met Ile
1 5 10 15
Pro Trp Phe Ala Tyr Gly His Ile Leu Pro Tyr Phe Glu Leu Ser Asn
20 25 30
Lys Leu Ala Glu Lys Gly His Lys Ile Thr Leu Val Val Pro Asn Lys
35 40 45
Val Lys Leu Asp Leu Glu Pro Lys Ile Arg His Pro Ser Leu Ile Ser
50 55 60
Leu His Ala Phe Thr Val Pro His Ile Glu Pro Leu Pro Pro Gly Thr
65 70 75 80
Glu Thr Cys Ser Asp Val Pro Ile Glu Leu Gln His His Leu Ala Val
85 90 95
Ala Met Asp Arg Ala Arg Pro Glu Val Glu Ser Ile Ile Ser Ala Ile
100 105 110
Asp Asp Pro Lys Pro Asp Leu Leu Phe Tyr Asp Asn Ala Tyr Trp Val
115 120 125
Pro Glu Ile Ala Thr Lys Leu Gly Met Lys Ser Val Phe Tyr Gln Ile
130 135 140
Ala Cys Ala Leu Ser Ile Thr Arg Ile Lys Gln Thr Pro Ser Ala Ser
145 150 155 160
Ala Ser Ala Ser Ala Ser Ala Lys Leu Phe Thr Leu Pro Lys Trp Val
165 170 175
Leu Thr Pro Lys Val Leu Gly Asp Ala Arg Ala Asn Tyr Gly Glu Gly
180 185 190
Ile Thr Tyr Tyr Gln Arg Val Lys Lys Ala Leu Ser Ser Cys Asp Ala
195 200 205
Ile Ala Leu Arg Thr Cys Arg Glu Ile Glu Gly Glu Ser Ser Asp Ile
210 215 220
Leu Ala Ala Gln Tyr Asn Lys Pro Val Phe Leu Thr Gly Pro Val Leu
225 230 235 240
Pro Glu Val Glu Phe Leu Pro Pro Leu Asp Asn Ser Trp Ala Glu Trp
245 250 255
Leu Ala Lys Phe Gly Pro Lys Ser Val Val Leu Cys Cys Phe Gly Ser
260 265 270
Gln Tyr Val Pro Asp Lys Ala Gln Leu Gln Glu Met Ala Leu Ala Leu
275 280 285
Glu Asp Thr Gly Leu Pro Phe Leu Met Ser Val Lys Pro Pro Thr Glu
290 295 300
Cys Ala Thr Ile Glu Glu Ala Leu Pro Glu Gly Phe Ser Glu Arg Val
305 310 315 320
Lys Glu Arg Gly Val Val His Gly Gly Trp Val Gln Gln Leu Gln Ile
325 330 335
Leu Ala His Pro Ser Val Gly Cys Phe Ile Cys His Cys Gly Tyr Gly
340 345 350
Ser Met Trp Glu Gly Leu Leu Ser Asp Asn Gln Leu Val Leu Leu Pro
355 360 365
Gln Leu Pro Asp Gln Leu Met Met Ala Gln Met Leu Ala Glu Lys Leu
370 375 380
Lys Val Gly Val Met Val Asp Arg Glu Glu Asp Asp Gly Trp Val Ser
385 390 395 400
Arg Lys Asn Leu Cys Gln Ala Val Lys Ser Val Met Asp Pro His Ser
405 410 415
Glu Phe Ala Ala Leu Leu Lys Asn Asn His Ala Asn Phe Arg Asp Lys
420 425 430
Leu Leu Thr Asn Gly Phe Met Ala Asn Tyr Leu Glu Val Phe Asp Gln
435 440 445
Asp Leu Lys Arg Phe Leu Thr Ala Asn
450 455
<210> 59
<211> 1347
<212> DNA
<213> Spinacia oleracea
<400> 59
atgggtggag agaaagagtt gcggatagtg atgttcccat ggcttgcctt tggacatttt 60
atcccatacc ttcacctttc aaacaaactt gctgaaaaag gccacaaaat caccttgttg 120
cttcccaaca aagctaggct tcagttggag tcacttaacc ttcatccttc tctcataact 180
ttccattcaa ttactgtccc acccctcgaa actctccctt atggcactga aacaactgcg 240
gatatctccc tcgaccaaca tggtgaactc tcgatttcca tggaccgcac tcggcccgag 300
gtggagtctt tcctatcaac ccataagccc gacctcgtcc tctacgacat ggcccattgg 360
gtacccgaga ttgctgctaa ggtcgggatt aagtcagttt catacaacgt tgtatgtgct 420
attgctgtat ctcatgttag acctagcctc cctcttccaa aaggaacggc agcacatgta 480
cccctgccat tgtcgtctgt ccctaagtgg agtcttaatc agcacggttc atcaacacca 540
tattttgggg aagggataac gttacttgaa cggtctgtaa tctccctctc gtctgcggat 600
gcaatagcca tccgcacgtg cagggagatt gaaggggtat attgtgaccg tgttgctgcc 660
acattcaaca agcctgtcct tgtcaccagc cacgccttgc ctgatcttga actcgaactc 720
tctccgttgg agactcgctg ggccgagtgg ctagctaggt tcgagccagg gtcagtgatc 780
ttttgctgcc ttggtagtca gcatgtctta gacgcacccc aactgcaaga gttggccctg 840
gggttggaaa tgacaggact acccttcttg atggctgtaa aaccccctgt ggggtgtacc 900
tccttggagg aggtgcttcc agaagggttt aatgatcggg ttagcgggcg aggggtggtt 960
cacggtgggt gggtgcagca gcagcagata atggcgcacc catcgttagg gtgctttgtg 1020
accctttgtg ggtcttcgtc gatgtgggag gggttagtga gtgaaagtca gttggtatta 1080
ctcccacaac tggcagacca aactctgtat gccaagttaa tggcagatga gctcaaggtg 1140
ggtgtgaagg tggagagaga agagaacggg tggatgacga agcgaagtct atgtgaagct 1200
atcaagagtg tgatggatga agatagtgat ataagtcatg tagttaggaa aaatcatgct 1260
aaatatagaa gtatgttgat tagccctggc tttattagtg gctacattga caacttcatc 1320
aaggatttac aagcccttgt tccttag 1347
<210> 60
<211> 448
<212> PRT
<213> Spinacia oleracea
<400> 60
Met Gly Gly Glu Lys Glu Leu Arg Ile Val Met Phe Pro Trp Leu Ala
1 5 10 15
Phe Gly His Phe Ile Pro Tyr Leu His Leu Ser Asn Lys Leu Ala Glu
20 25 30
Lys Gly His Lys Ile Thr Leu Leu Leu Pro Asn Lys Ala Arg Leu Gln
35 40 45
Leu Glu Ser Leu Asn Leu His Pro Ser Leu Ile Thr Phe His Ser Ile
50 55 60
Thr Val Pro Pro Leu Glu Thr Leu Pro Tyr Gly Thr Glu Thr Thr Ala
65 70 75 80
Asp Ile Ser Leu Asp Gln His Gly Glu Leu Ser Ile Ser Met Asp Arg
85 90 95
Thr Arg Pro Glu Val Glu Ser Phe Leu Ser Thr His Lys Pro Asp Leu
100 105 110
Val Leu Tyr Asp Met Ala His Trp Val Pro Glu Ile Ala Ala Lys Val
115 120 125
Gly Ile Lys Ser Val Ser Tyr Asn Val Val Cys Ala Ile Ala Val Ser
130 135 140
His Val Arg Pro Ser Leu Pro Leu Pro Lys Gly Thr Ala Ala His Val
145 150 155 160
Pro Leu Pro Leu Ser Ser Val Pro Lys Trp Ser Leu Asn Gln His Gly
165 170 175
Ser Ser Thr Pro Tyr Phe Gly Glu Gly Ile Thr Leu Leu Glu Arg Ser
180 185 190
Val Ile Ser Leu Ser Ser Ala Asp Ala Ile Ala Ile Arg Thr Cys Arg
195 200 205
Glu Ile Glu Gly Val Tyr Cys Asp Arg Val Ala Ala Thr Phe Asn Lys
210 215 220
Pro Val Leu Val Thr Ser His Ala Leu Pro Asp Leu Glu Leu Glu Leu
225 230 235 240
Ser Pro Leu Glu Thr Arg Trp Ala Glu Trp Leu Ala Arg Phe Glu Pro
245 250 255
Gly Ser Val Ile Phe Cys Cys Leu Gly Ser Gln His Val Leu Asp Ala
260 265 270
Pro Gln Leu Gln Glu Leu Ala Leu Gly Leu Glu Met Thr Gly Leu Pro
275 280 285
Phe Leu Met Ala Val Lys Pro Pro Val Gly Cys Thr Ser Leu Glu Glu
290 295 300
Val Leu Pro Glu Gly Phe Asn Asp Arg Val Ser Gly Arg Gly Val Val
305 310 315 320
His Gly Gly Trp Val Gln Gln Gln Gln Ile Met Ala His Pro Ser Leu
325 330 335
Gly Cys Phe Val Thr Leu Cys Gly Ser Ser Ser Met Trp Glu Gly Leu
340 345 350
Val Ser Glu Ser Gln Leu Val Leu Leu Pro Gln Leu Ala Asp Gln Thr
355 360 365
Leu Tyr Ala Lys Leu Met Ala Asp Glu Leu Lys Val Gly Val Lys Val
370 375 380
Glu Arg Glu Glu Asn Gly Trp Met Thr Lys Arg Ser Leu Cys Glu Ala
385 390 395 400
Ile Lys Ser Val Met Asp Glu Asp Ser Asp Ile Ser His Val Val Arg
405 410 415
Lys Asn His Ala Lys Tyr Arg Ser Met Leu Ile Ser Pro Gly Phe Ile
420 425 430
Ser Gly Tyr Ile Asp Asn Phe Ile Lys Asp Leu Gln Ala Leu Val Pro
435 440 445
<210> 61
<211> 1476
<212> DNA
<213> Spinacia oleracea
<400> 61
atggagcttt caaaccctac cacaacccct accttaaacg caacccaacc cttacgaggc 60
tatttcattc cattaatcac agttccaagc cacatttcca atcttgttga cattgctaaa 120
ctcttctcat cacggggagt acatgtgact atcctcacca cccaccacac ctccctccgc 180
ttcaaacaat ccatacatga ttggggcttc aaaatcgacc tccacatcgt cgacttcccg 240
ttcagggaag tcggcttacc ggaaggagtg gaaaattaca gtgatgccac ccctgagcaa 300
gcaagccagc ttttccaggc ctttatgatg cttcagaagc ctatggagga tgccattcgg 360
gctgctaagc ccgacttcat cgtttccgat aggtattatc attggtctac tgatcttgca 420
cgtgagcttg ctattccacg gctcatcttt catgtcagat gttattttgc attgtgtgct 480
gctgaggttg ttgccaagtt tgcccctcat gagaaggttg aatctgacac tgacctcttt 540
ttccttcctg acctccctga taccatccac atgacccgtt tgcagcttcc cgaatggatt 600
cagacccgaa acatgttcac tgttctcaat gagagaatgg acgaggccga tagggagtgc 660
tacggtgtta ttgtaaacag ctgctacgag ttggagagag cttatgctga cttctaccgc 720
agcaacttgg gtcgacgtgc ttggtgtatc ggtccctatc cggtacactg cgacaaggtt 780
ggtaaaaaga aaggagatga cagcaaaaaa cattcatgtt ttgaatggct tgataaaatg 840
ggagaaggag aagttatata cgtgagtttt ggcactctgt cgtgtttcag ccctgctcaa 900
atctcagagc tggctactgc actcgaaatg tctggtcacc cgtttatctg ggtagtaagg 960
aatggtgaga aattgttacc tgatggattt gaagaaagaa ttacagagca ggacaaaggg 1020
gtgttaataa aagactgggc gccacaagtg aaaatacttg agcacccagc tgtaggcgga 1080
tttctgactc attgtggatg gaactcaact gtagaaagtt tagcagcagg tgtgccaatg 1140
gtcacatggc cgcttggtgc cgagcaattc ttcaatgaaa agttgattag tggagttttg 1200
aaggtggggg tcgaggtcgg gtctgagaag tggagtaggg gtatagtacc gaatactgat 1260
atgattgaga aggataaaat agaaagggcg attaaagagc tgatgagtaa agaacccgag 1320
gccgaggaaa ggaggcagaa ggttaaggag ttgagtaagg ctccaagaaa tgcggttgaa 1380
gaaggtggtt cgtctcgtaa caatttaagt gatttgattg aaaaattaca acgtttaaag 1440
gcgaatgaaa tatcagtgtc cacaaactca gaataa 1476
<210> 62
<211> 491
<212> PRT
<213> Spinacia oleracea
<400> 62
Met Glu Leu Ser Asn Pro Thr Thr Thr Pro Thr Leu Asn Ala Thr Gln
1 5 10 15
Pro Leu Arg Gly Tyr Phe Ile Pro Leu Ile Thr Val Pro Ser His Ile
20 25 30
Ser Asn Leu Val Asp Ile Ala Lys Leu Phe Ser Ser Arg Gly Val His
35 40 45
Val Thr Ile Leu Thr Thr His His Thr Ser Leu Arg Phe Lys Gln Ser
50 55 60
Ile His Asp Trp Gly Phe Lys Ile Asp Leu His Ile Val Asp Phe Pro
65 70 75 80
Phe Arg Glu Val Gly Leu Pro Glu Gly Val Glu Asn Tyr Ser Asp Ala
85 90 95
Thr Pro Glu Gln Ala Ser Gln Leu Phe Gln Ala Phe Met Met Leu Gln
100 105 110
Lys Pro Met Glu Asp Ala Ile Arg Ala Ala Lys Pro Asp Phe Ile Val
115 120 125
Ser Asp Arg Tyr Tyr His Trp Ser Thr Asp Leu Ala Arg Glu Leu Ala
130 135 140
Ile Pro Arg Leu Ile Phe His Val Arg Cys Tyr Phe Ala Leu Cys Ala
145 150 155 160
Ala Glu Val Val Ala Lys Phe Ala Pro His Glu Lys Val Glu Ser Asp
165 170 175
Thr Asp Leu Phe Phe Leu Pro Asp Leu Pro Asp Thr Ile His Met Thr
180 185 190
Arg Leu Gln Leu Pro Glu Trp Ile Gln Thr Arg Asn Met Phe Thr Val
195 200 205
Leu Asn Glu Arg Met Asp Glu Ala Asp Arg Glu Cys Tyr Gly Val Ile
210 215 220
Val Asn Ser Cys Tyr Glu Leu Glu Arg Ala Tyr Ala Asp Phe Tyr Arg
225 230 235 240
Ser Asn Leu Gly Arg Arg Ala Trp Cys Ile Gly Pro Tyr Pro Val His
245 250 255
Cys Asp Lys Val Gly Lys Lys Lys Gly Asp Asp Ser Lys Lys His Ser
260 265 270
Cys Phe Glu Trp Leu Asp Lys Met Gly Glu Gly Glu Val Ile Tyr Val
275 280 285
Ser Phe Gly Thr Leu Ser Cys Phe Ser Pro Ala Gln Ile Ser Glu Leu
290 295 300
Ala Thr Ala Leu Glu Met Ser Gly His Pro Phe Ile Trp Val Val Arg
305 310 315 320
Asn Gly Glu Lys Leu Leu Pro Asp Gly Phe Glu Glu Arg Ile Thr Glu
325 330 335
Gln Asp Lys Gly Val Leu Ile Lys Asp Trp Ala Pro Gln Val Lys Ile
340 345 350
Leu Glu His Pro Ala Val Gly Gly Phe Leu Thr His Cys Gly Trp Asn
355 360 365
Ser Thr Val Glu Ser Leu Ala Ala Gly Val Pro Met Val Thr Trp Pro
370 375 380
Leu Gly Ala Glu Gln Phe Phe Asn Glu Lys Leu Ile Ser Gly Val Leu
385 390 395 400
Lys Val Gly Val Glu Val Gly Ser Glu Lys Trp Ser Arg Gly Ile Val
405 410 415
Pro Asn Thr Asp Met Ile Glu Lys Asp Lys Ile Glu Arg Ala Ile Lys
420 425 430
Glu Leu Met Ser Lys Glu Pro Glu Ala Glu Glu Arg Arg Gln Lys Val
435 440 445
Lys Glu Leu Ser Lys Ala Pro Arg Asn Ala Val Glu Glu Gly Gly Ser
450 455 460
Ser Arg Asn Asn Leu Ser Asp Leu Ile Glu Lys Leu Gln Arg Leu Lys
465 470 475 480
Ala Asn Glu Ile Ser Val Ser Thr Asn Ser Glu
485 490
<210> 63
<211> 1539
<212> DNA
<213> Spinacia oleracea
<400> 63
atgggggaag tcaaccatga agaagtagaa attgaaataa tatcaataga aaccataaaa 60
ccatcatcac tacttccacc aaaaactcct ccaaaaacca tcacactttc tcacctcgat 120
caagctgccc ctttgtacta ctatccttta cttttatact acactaacac tactactact 180
accccaacat cacaaattcg agttgacata acaagtaccc taaaaacttc acttagcaaa 240
acacttgaca aattccaccc tattgcaggt cgatgtgtgg acgactctac aatttgttgc 300
aaccaccaag gaataccatt cattgaaacc aaagttgact ccaatatctt ggatgtcatg 360
aactcgcctg agaaaatgaa gttgcttatc aagtttctcc ctcatgcaga gtttcaagat 420
gtgactcgac cagtctcgga tttaaaccat ttggcgtttc aagtcaatgt tttccggtgt 480
ggtggggtga tcattggctc ctatgtgctc cacaagctcc ttgatggaat ctctcttgga 540
actttcttta aaaattggtc aaccattgct aatgatgagc gagttaagga cgacgaccta 600
gtacaacctg actttgaagc cactattaag gcgttccctc cgcgtacagc aactccaatg 660
cttcctcgta atcaacaact tccaaaggcg gctgaaaaac caaataataa tccagtcaaa 720
gttcttgtga caaagagctt cgtatttgac attgtttctt taaagaagat gatgttcatg 780
gctaagagtg aattggttcc taaacccacc aaatttgaga ccgtgacagg gtttatttgg 840
gaacaaacct tatcaacatt gcgtaattct ggagttgaag ttgaacatac atcgcttata 900
atacctgtaa acatccgccc aaggatgagt ccgccactcc caagaggatc catgggtaac 960
ttgctcaaga atgcaaaggc acaggccaac accagcagca gcaatgggct tcaagacctt 1020
gttaaagaaa tccattcatc tttgtctcaa acaacccaga aaattaatac tcctcctcct 1080
cctcctcctc ctcctcctac tactactgct acaacaatcc attcatcttt gtctcaaaca 1140
acccagaaaa ttaatactcc tcctcctact actacaacaa tccattcatc tttgtctcaa 1200
acaacccaga aaattaatac tactactact acagcagagg ttattttgac taaacggaaa 1260
gttgacaatc cagttacaca gaatcgagaa ggaaactacc tcttcaccag ttggtgcaag 1320
attgggttgg atgaggctga cttcgggttc ggaaagcccg tttgggtaat tcccaacgat 1380
gggagacccc ctaaggtcag gaatatgatt ttccttactg attataggca tcccgaaaca 1440
ggcgttgaag gaattgcagc atggattacg ttggaagaga aacaaatgca atgtttaaag 1500
tcaaacccag aattccttgc ttttgctact cctaattag 1539
<210> 64
<211> 512
<212> PRT
<213> Spinacia oleracea
<400> 64
Met Gly Glu Val Asn His Glu Glu Val Glu Ile Glu Ile Ile Ser Ile
1 5 10 15
Glu Thr Ile Lys Pro Ser Ser Leu Leu Pro Pro Lys Thr Pro Pro Lys
20 25 30
Thr Ile Thr Leu Ser His Leu Asp Gln Ala Ala Pro Leu Tyr Tyr Tyr
35 40 45
Pro Leu Leu Leu Tyr Tyr Thr Asn Thr Thr Thr Thr Thr Pro Thr Ser
50 55 60
Gln Ile Arg Val Asp Ile Thr Ser Thr Leu Lys Thr Ser Leu Ser Lys
65 70 75 80
Thr Leu Asp Lys Phe His Pro Ile Ala Gly Arg Cys Val Asp Asp Ser
85 90 95
Thr Ile Cys Cys Asn His Gln Gly Ile Pro Phe Ile Glu Thr Lys Val
100 105 110
Asp Ser Asn Ile Leu Asp Val Met Asn Ser Pro Glu Lys Met Lys Leu
115 120 125
Leu Ile Lys Phe Leu Pro His Ala Glu Phe Gln Asp Val Thr Arg Pro
130 135 140
Val Ser Asp Leu Asn His Leu Ala Phe Gln Val Asn Val Phe Arg Cys
145 150 155 160
Gly Gly Val Ile Ile Gly Ser Tyr Val Leu His Lys Leu Leu Asp Gly
165 170 175
Ile Ser Leu Gly Thr Phe Phe Lys Asn Trp Ser Thr Ile Ala Asn Asp
180 185 190
Glu Arg Val Lys Asp Asp Asp Leu Val Gln Pro Asp Phe Glu Ala Thr
195 200 205
Ile Lys Ala Phe Pro Pro Arg Thr Ala Thr Pro Met Leu Pro Arg Asn
210 215 220
Gln Gln Leu Pro Lys Ala Ala Glu Lys Pro Asn Asn Asn Pro Val Lys
225 230 235 240
Val Leu Val Thr Lys Ser Phe Val Phe Asp Ile Val Ser Leu Lys Lys
245 250 255
Met Met Phe Met Ala Lys Ser Glu Leu Val Pro Lys Pro Thr Lys Phe
260 265 270
Glu Thr Val Thr Gly Phe Ile Trp Glu Gln Thr Leu Ser Thr Leu Arg
275 280 285
Asn Ser Gly Val Glu Val Glu His Thr Ser Leu Ile Ile Pro Val Asn
290 295 300
Ile Arg Pro Arg Met Ser Pro Pro Leu Pro Arg Gly Ser Met Gly Asn
305 310 315 320
Leu Leu Lys Asn Ala Lys Ala Gln Ala Asn Thr Ser Ser Ser Asn Gly
325 330 335
Leu Gln Asp Leu Val Lys Glu Ile His Ser Ser Leu Ser Gln Thr Thr
340 345 350
Gln Lys Ile Asn Thr Pro Pro Pro Pro Pro Pro Pro Pro Pro Thr Thr
355 360 365
Thr Ala Thr Thr Ile His Ser Ser Leu Ser Gln Thr Thr Gln Lys Ile
370 375 380
Asn Thr Pro Pro Pro Thr Thr Thr Thr Ile His Ser Ser Leu Ser Gln
385 390 395 400
Thr Thr Gln Lys Ile Asn Thr Thr Thr Thr Thr Ala Glu Val Ile Leu
405 410 415
Thr Lys Arg Lys Val Asp Asn Pro Val Thr Gln Asn Arg Glu Gly Asn
420 425 430
Tyr Leu Phe Thr Ser Trp Cys Lys Ile Gly Leu Asp Glu Ala Asp Phe
435 440 445
Gly Phe Gly Lys Pro Val Trp Val Ile Pro Asn Asp Gly Arg Pro Pro
450 455 460
Lys Val Arg Asn Met Ile Phe Leu Thr Asp Tyr Arg His Pro Glu Thr
465 470 475 480
Gly Val Glu Gly Ile Ala Ala Trp Ile Thr Leu Glu Glu Lys Gln Met
485 490 495
Gln Cys Leu Lys Ser Asn Pro Glu Phe Leu Ala Phe Ala Thr Pro Asn
500 505 510
<210> 65
<211> 2091
<212> DNA
<213> Spinacia oleracea
<400> 65
atggcaactt ctcacattcg caatgtccaa ttaaccagag ccattgttaa ccgtctccac 60
atcttcctcc attccgtagc catcttctcg ctcttctact accgtttcac ttccttcttc 120
aactccgaca tctccatact tgcttactcc ttactcacca ccgccgaact cttcttaacc 180
tttctatggg cttttactca ggctttccgg tggcgtcccg taatgaggga agtctccggg 240
tacgaatcca tcaaacccga acaactaccg ggtttggatg tcttcattgt cactgctgac 300
ccgacaaagg agccagttct ggaggtgatg aactccgtga tatcatccat ggctttggat 360
tatccggttg atagactggc ggtttacttg tcggatgacg gtggttctcc gttgtcgaag 420
gaggcgatta agaaggctta tgagtttgct aagctttgga ttcctttttg taataagtat 480
aatgttaaga caaggtgtcc tcaggctttc ttctcgcctc ttgctgatgg ggaaaggctt 540
gattggaatt ctgagtttat ggctgatcaa ttggaactcc agaccaaata tgaagctttt 600
agaaactatg tggagaaaga aagtggagat aacaccaaat gtactgcagt tcatgatcga 660
cctccttgcg ttgagattat acatgacaac aaacagaacg gagaaagtga tgtgaagatg 720
ccccttctgg tttatgtagc cagggaaaag agacctggtc gtcctcatcg tttcaaagct 780
ggagccctta atgctcttct tcgagtatcc agtttaatga gcaatgcacc ttacttattg 840
gtgttggatt gtgatatgta ctgccatgat ccaacttctg ctcgtcaatc tatgtgcttc 900
catcttgaca caaacatggc ttcctctctt gcatatgtgc aataccctca aattttctat 960
aatgttagca aaaatgacat ctatgatggc caagccagat cagctcatat gacgaaatgg 1020
aaaggcatgg atggactcag aggcccggtc ttgaatggaa ctgggtatta tttgaagcga 1080
aaagcattat ttggaaagcc taataacgaa gatgaatacc tcaacagtca accagaaaag 1140
gcctttggct cctccacaaa attaattgct gcactaagag agaactccaa gcaaaatctt 1200
gccataaagg aattgacaga agatgagttg taccaagagg ctagaaattt ggctacttgc 1260
acatatgaag caaacacact atggggcagt gaggtaggat attcgtatga gtgcttgttg 1320
gagagtacat tcactggata tatgttacat tgcagaggat ggaaatctgt gtatctttac 1380
ccaaaaagac catgcttctt gggatgcaca acgattgata tgaaggatgc tacggttcaa 1440
ctaataaaat ggacctcctc attacttgga attgccctgt cgaagtctag ccctctaact 1500
ttggccatgt ccagtatgtc aatcctgcaa agcatgtgtt acgcgtacat cacatttaca 1560
ggcctttttg cagctccatt ggttatatat ggtgttgtcc ttccaataag cctattgaag 1620
ggctttccta ttttccctaa ggtatcggat ccatggattt tgccatttgt gttgatattt 1680
gtatcctccc atcttcaaca tctatatgag gtcctggaaa gtgacaaatc agcaacacaa 1740
tggtggaatg aggtgagaat ttggatgatg aaatcagtga cagcctgttt gtttgggttg 1800
acggaagcga taatgaagaa gattggagta caaactgcaa cattcagatt aacaaataag 1860
gtagttgaga aggaaaagat ggataaatac gagaaggaga ggtttgattt ctcaggagca 1920
gctatgctta tggttcctct taatattttg gtggtactaa atatggtgtc attcattggt 1980
ggactcatga gggtcataat caacaacagt tatgatcaaa tgtttgcaca acttttcctc 2040
tccttttttg tcctacttct tagctaccct gttgttaagg gatggttata a 2091
<210> 66
<211> 696
<212> PRT
<213> Spinacia oleracea
<400> 66
Met Ala Thr Ser His Ile Arg Asn Val Gln Leu Thr Arg Ala Ile Val
1 5 10 15
Asn Arg Leu His Ile Phe Leu His Ser Val Ala Ile Phe Ser Leu Phe
20 25 30
Tyr Tyr Arg Phe Thr Ser Phe Phe Asn Ser Asp Ile Ser Ile Leu Ala
35 40 45
Tyr Ser Leu Leu Thr Thr Ala Glu Leu Phe Leu Thr Phe Leu Trp Ala
50 55 60
Phe Thr Gln Ala Phe Arg Trp Arg Pro Val Met Arg Glu Val Ser Gly
65 70 75 80
Tyr Glu Ser Ile Lys Pro Glu Gln Leu Pro Gly Leu Asp Val Phe Ile
85 90 95
Val Thr Ala Asp Pro Thr Lys Glu Pro Val Leu Glu Val Met Asn Ser
100 105 110
Val Ile Ser Ser Met Ala Leu Asp Tyr Pro Val Asp Arg Leu Ala Val
115 120 125
Tyr Leu Ser Asp Asp Gly Gly Ser Pro Leu Ser Lys Glu Ala Ile Lys
130 135 140
Lys Ala Tyr Glu Phe Ala Lys Leu Trp Ile Pro Phe Cys Asn Lys Tyr
145 150 155 160
Asn Val Lys Thr Arg Cys Pro Gln Ala Phe Phe Ser Pro Leu Ala Asp
165 170 175
Gly Glu Arg Leu Asp Trp Asn Ser Glu Phe Met Ala Asp Gln Leu Glu
180 185 190
Leu Gln Thr Lys Tyr Glu Ala Phe Arg Asn Tyr Val Glu Lys Glu Ser
195 200 205
Gly Asp Asn Thr Lys Cys Thr Ala Val His Asp Arg Pro Pro Cys Val
210 215 220
Glu Ile Ile His Asp Asn Lys Gln Asn Gly Glu Ser Asp Val Lys Met
225 230 235 240
Pro Leu Leu Val Tyr Val Ala Arg Glu Lys Arg Pro Gly Arg Pro His
245 250 255
Arg Phe Lys Ala Gly Ala Leu Asn Ala Leu Leu Arg Val Ser Ser Leu
260 265 270
Met Ser Asn Ala Pro Tyr Leu Leu Val Leu Asp Cys Asp Met Tyr Cys
275 280 285
His Asp Pro Thr Ser Ala Arg Gln Ser Met Cys Phe His Leu Asp Thr
290 295 300
Asn Met Ala Ser Ser Leu Ala Tyr Val Gln Tyr Pro Gln Ile Phe Tyr
305 310 315 320
Asn Val Ser Lys Asn Asp Ile Tyr Asp Gly Gln Ala Arg Ser Ala His
325 330 335
Met Thr Lys Trp Lys Gly Met Asp Gly Leu Arg Gly Pro Val Leu Asn
340 345 350
Gly Thr Gly Tyr Tyr Leu Lys Arg Lys Ala Leu Phe Gly Lys Pro Asn
355 360 365
Asn Glu Asp Glu Tyr Leu Asn Ser Gln Pro Glu Lys Ala Phe Gly Ser
370 375 380
Ser Thr Lys Leu Ile Ala Ala Leu Arg Glu Asn Ser Lys Gln Asn Leu
385 390 395 400
Ala Ile Lys Glu Leu Thr Glu Asp Glu Leu Tyr Gln Glu Ala Arg Asn
405 410 415
Leu Ala Thr Cys Thr Tyr Glu Ala Asn Thr Leu Trp Gly Ser Glu Val
420 425 430
Gly Tyr Ser Tyr Glu Cys Leu Leu Glu Ser Thr Phe Thr Gly Tyr Met
435 440 445
Leu His Cys Arg Gly Trp Lys Ser Val Tyr Leu Tyr Pro Lys Arg Pro
450 455 460
Cys Phe Leu Gly Cys Thr Thr Ile Asp Met Lys Asp Ala Thr Val Gln
465 470 475 480
Leu Ile Lys Trp Thr Ser Ser Leu Leu Gly Ile Ala Leu Ser Lys Ser
485 490 495
Ser Pro Leu Thr Leu Ala Met Ser Ser Met Ser Ile Leu Gln Ser Met
500 505 510
Cys Tyr Ala Tyr Ile Thr Phe Thr Gly Leu Phe Ala Ala Pro Leu Val
515 520 525
Ile Tyr Gly Val Val Leu Pro Ile Ser Leu Leu Lys Gly Phe Pro Ile
530 535 540
Phe Pro Lys Val Ser Asp Pro Trp Ile Leu Pro Phe Val Leu Ile Phe
545 550 555 560
Val Ser Ser His Leu Gln His Leu Tyr Glu Val Leu Glu Ser Asp Lys
565 570 575
Ser Ala Thr Gln Trp Trp Asn Glu Val Arg Ile Trp Met Met Lys Ser
580 585 590
Val Thr Ala Cys Leu Phe Gly Leu Thr Glu Ala Ile Met Lys Lys Ile
595 600 605
Gly Val Gln Thr Ala Thr Phe Arg Leu Thr Asn Lys Val Val Glu Lys
610 615 620
Glu Lys Met Asp Lys Tyr Glu Lys Glu Arg Phe Asp Phe Ser Gly Ala
625 630 635 640
Ala Met Leu Met Val Pro Leu Asn Ile Leu Val Val Leu Asn Met Val
645 650 655
Ser Phe Ile Gly Gly Leu Met Arg Val Ile Ile Asn Asn Ser Tyr Asp
660 665 670
Gln Met Phe Ala Gln Leu Phe Leu Ser Phe Phe Val Leu Leu Leu Ser
675 680 685
Tyr Pro Val Val Lys Gly Trp Leu
690 695
<210> 67
<211> 1081
<212> PRT
<213> Arabodopsis thaliana
<400> 67
Met Glu Ala Ser Ala Gly Leu Val Ala Gly Ser Tyr Arg Arg Asn Glu
1 5 10 15
Leu Val Arg Ile Arg His Glu Ser Asp Gly Gly Thr Lys Pro Leu Lys
20 25 30
Asn Met Asn Gly Gln Ile Cys Gln Ile Cys Gly Asp Asp Val Gly Leu
35 40 45
Ala Glu Thr Gly Asp Val Phe Val Ala Cys Asn Glu Cys Ala Phe Pro
50 55 60
Val Cys Arg Pro Cys Tyr Glu Tyr Glu Arg Lys Asp Gly Thr Gln Cys
65 70 75 80
Cys Pro Gln Cys Lys Thr Arg Phe Arg Arg His Arg Gly Ser Pro Arg
85 90 95
Val Glu Gly Asp Glu Asp Glu Asp Asp Val Asp Asp Ile Glu Asn Glu
100 105 110
Phe Asn Tyr Ala Gln Gly Ala Asn Lys Ala Arg His Gln Arg His Gly
115 120 125
Glu Glu Phe Ser Ser Ser Ser Arg His Glu Ser Gln Pro Ile Pro Leu
130 135 140
Leu Thr His Gly His Thr Val Ser Gly Glu Ile Arg Thr Pro Asp Thr
145 150 155 160
Gln Ser Val Arg Thr Thr Ser Gly Pro Leu Gly Pro Ser Asp Arg Asn
165 170 175
Ala Ile Ser Ser Pro Tyr Ile Asp Pro Arg Gln Pro Val Pro Val Arg
180 185 190
Ile Val Asp Pro Ser Lys Asp Leu Asn Ser Tyr Gly Leu Gly Asn Val
195 200 205
Asp Trp Lys Glu Arg Val Glu Gly Trp Lys Leu Lys Gln Glu Lys Asn
210 215 220
Met Leu Gln Met Thr Gly Lys Tyr His Glu Gly Lys Gly Gly Glu Ile
225 230 235 240
Glu Gly Thr Gly Ser Asn Gly Glu Glu Leu Gln Met Ala Asp Asp Thr
245 250 255
Arg Leu Pro Met Ser Arg Val Val Pro Ile Pro Ser Ser Arg Leu Thr
260 265 270
Pro Tyr Arg Val Val Ile Ile Leu Arg Leu Ile Ile Leu Cys Phe Phe
275 280 285
Leu Gln Tyr Arg Thr Thr His Pro Val Lys Asn Ala Tyr Pro Leu Trp
290 295 300
Leu Thr Ser Val Ile Cys Glu Ile Trp Phe Ala Phe Ser Trp Leu Leu
305 310 315 320
Asp Gln Phe Pro Lys Trp Tyr Pro Ile Asn Arg Glu Thr Tyr Leu Asp
325 330 335
Arg Leu Ala Ile Arg Tyr Asp Arg Asp Gly Glu Pro Ser Gln Leu Val
340 345 350
Pro Val Asp Val Phe Val Ser Thr Val Asp Pro Leu Lys Glu Pro Pro
355 360 365
Leu Val Thr Ala Asn Thr Val Leu Ser Ile Leu Ser Val Asp Tyr Pro
370 375 380
Val Asp Lys Val Ala Cys Tyr Val Ser Asp Asp Gly Ser Ala Met Leu
385 390 395 400
Thr Phe Glu Ser Leu Ser Glu Thr Ala Glu Phe Ala Lys Lys Trp Val
405 410 415
Pro Phe Cys Lys Lys Phe Asn Ile Glu Pro Arg Ala Pro Glu Phe Tyr
420 425 430
Phe Ala Gln Lys Ile Asp Tyr Leu Lys Asp Lys Ile Gln Pro Ser Phe
435 440 445
Val Lys Glu Arg Arg Ala Met Lys Arg Glu Tyr Glu Glu Phe Lys Val
450 455 460
Arg Ile Asn Ala Leu Val Ala Lys Ala Gln Lys Ile Pro Glu Glu Gly
465 470 475 480
Trp Thr Met Gln Asp Gly Thr Pro Trp Pro Gly Asn Asn Thr Arg Asp
485 490 495
His Pro Gly Met Ile Gln Val Phe Leu Gly His Ser Gly Gly Leu Asp
500 505 510
Thr Asp Gly Asn Glu Leu Pro Arg Leu Ile Tyr Val Ser Arg Glu Lys
515 520 525
Arg Pro Gly Phe Gln His His Lys Lys Ala Gly Ala Met Asn Ala Leu
530 535 540
Ile Arg Val Ser Ala Val Leu Thr Asn Gly Ala Tyr Leu Leu Asn Val
545 550 555 560
Asp Cys Asp His Tyr Phe Asn Asn Ser Lys Ala Ile Lys Glu Ala Met
565 570 575
Cys Phe Met Met Asp Pro Ala Ile Gly Lys Lys Cys Cys Tyr Val Gln
580 585 590
Phe Pro Gln Arg Phe Asp Gly Ile Asp Leu His Asp Arg Tyr Ala Asn
595 600 605
Arg Asn Ile Val Phe Phe Asp Ile Asn Met Lys Gly Leu Asp Gly Ile
610 615 620
Gln Gly Pro Val Tyr Val Gly Thr Gly Cys Cys Phe Asn Arg Gln Ala
625 630 635 640
Leu Tyr Gly Tyr Asp Pro Val Leu Thr Glu Glu Asp Leu Glu Pro Asn
645 650 655
Ile Ile Val Lys Ser Cys Cys Gly Ser Arg Lys Lys Gly Lys Ser Ser
660 665 670
Lys Lys Tyr Asn Tyr Glu Lys Arg Arg Gly Ile Asn Arg Ser Asp Ser
675 680 685
Asn Ala Pro Leu Phe Asn Met Glu Asp Ile Asp Glu Gly Phe Glu Gly
690 695 700
Tyr Asp Asp Glu Arg Ser Ile Leu Met Ser Gln Arg Ser Val Glu Lys
705 710 715 720
Arg Phe Gly Gln Ser Pro Val Phe Ile Ala Ala Thr Phe Met Glu Gln
725 730 735
Gly Gly Ile Pro Pro Thr Thr Asn Pro Ala Thr Leu Leu Lys Glu Ala
740 745 750
Ile His Val Ile Ser Cys Gly Tyr Glu Asp Lys Thr Glu Trp Gly Lys
755 760 765
Glu Ile Gly Trp Ile Tyr Gly Ser Val Thr Glu Asp Ile Leu Thr Gly
770 775 780
Phe Lys Met His Ala Arg Gly Trp Ile Ser Ile Tyr Cys Asn Pro Pro
785 790 795 800
Arg Pro Ala Phe Lys Gly Ser Ala Pro Ile Asn Leu Ser Asp Arg Leu
805 810 815
Asn Gln Val Leu Arg Trp Ala Leu Gly Ser Ile Glu Ile Leu Leu Ser
820 825 830
Arg His Cys Pro Ile Trp Tyr Gly Tyr His Gly Arg Leu Arg Leu Leu
835 840 845
Glu Arg Ile Ala Tyr Ile Asn Thr Ile Val Tyr Pro Ile Thr Ser Ile
850 855 860
Pro Leu Ile Ala Tyr Cys Ile Leu Pro Ala Phe Cys Leu Ile Thr Asp
865 870 875 880
Arg Phe Ile Ile Pro Glu Ile Ser Asn Tyr Ala Ser Ile Trp Phe Ile
885 890 895
Leu Leu Phe Ile Ser Ile Ala Val Thr Gly Ile Leu Glu Leu Arg Trp
900 905 910
Ser Gly Val Ser Ile Glu Asp Trp Trp Arg Asn Glu Gln Phe Trp Val
915 920 925
Ile Gly Gly Thr Ser Ala His Leu Phe Ala Val Phe Gln Gly Leu Leu
930 935 940
Lys Val Leu Ala Gly Ile Asp Thr Asn Phe Thr Val Thr Ser Lys Ala
945 950 955 960
Thr Asp Glu Asp Gly Asp Phe Ala Glu Leu Tyr Ile Phe Lys Trp Thr
965 970 975
Ala Leu Leu Ile Pro Pro Thr Thr Val Leu Leu Val Asn Leu Ile Gly
980 985 990
Ile Val Ala Gly Val Ser Tyr Ala Val Asn Ser Gly Tyr Gln Ser Trp
995 1000 1005
Gly Pro Leu Phe Gly Lys Leu Phe Phe Ala Leu Trp Val Ile Ala
1010 1015 1020
His Leu Tyr Pro Phe Leu Lys Gly Leu Leu Gly Arg Gln Asn Arg
1025 1030 1035
Thr Pro Thr Ile Val Ile Val Trp Ser Val Leu Leu Ala Ser Ile
1040 1045 1050
Phe Ser Leu Leu Trp Val Arg Ile Asn Pro Phe Val Asp Ala Asn
1055 1060 1065
Pro Asn Ala Asn Asn Phe Asn Gly Lys Gly Gly Val Phe
1070 1075 1080
<210> 68
<211> 1065
<212> PRT
<213> Arabodopsis thaliana
<400> 68
Met Glu Ser Glu Gly Glu Thr Ala Gly Lys Pro Met Lys Asn Ile Val
1 5 10 15
Pro Gln Thr Cys Gln Ile Cys Ser Asp Asn Val Gly Lys Thr Val Asp
20 25 30
Gly Asp Arg Phe Val Ala Cys Asp Ile Cys Ser Phe Pro Val Cys Arg
35 40 45
Pro Cys Tyr Glu Tyr Glu Arg Lys Asp Gly Asn Gln Ser Cys Pro Gln
50 55 60
Cys Lys Thr Arg Tyr Lys Arg Leu Lys Gly Ser Pro Ala Ile Pro Gly
65 70 75 80
Asp Lys Asp Glu Asp Gly Leu Ala Asp Glu Gly Thr Val Glu Phe Asn
85 90 95
Tyr Pro Gln Lys Glu Lys Ile Ser Glu Arg Met Leu Gly Trp His Leu
100 105 110
Thr Arg Gly Lys Gly Glu Glu Met Gly Glu Pro Gln Tyr Asp Lys Glu
115 120 125
Val Ser His Asn His Leu Pro Arg Leu Thr Ser Arg Gln Asp Thr Ser
130 135 140
Gly Glu Phe Ser Ala Ala Ser Pro Glu Arg Leu Ser Val Ser Ser Thr
145 150 155 160
Ile Ala Gly Gly Lys Arg Leu Pro Tyr Ser Ser Asp Val Asn Gln Ser
165 170 175
Pro Asn Arg Arg Ile Val Asp Pro Val Gly Leu Gly Asn Val Ala Trp
180 185 190
Lys Glu Arg Val Asp Gly Trp Lys Met Lys Gln Glu Lys Asn Thr Gly
195 200 205
Pro Val Ser Thr Gln Ala Ala Ser Glu Arg Gly Gly Val Asp Ile Asp
210 215 220
Ala Ser Thr Asp Ile Leu Ala Asp Glu Ala Leu Leu Asn Asp Glu Ala
225 230 235 240
Arg Gln Pro Leu Ser Arg Lys Val Ser Ile Pro Ser Ser Arg Ile Asn
245 250 255
Pro Tyr Arg Met Val Ile Met Leu Arg Leu Val Ile Leu Cys Leu Phe
260 265 270
Leu His Tyr Arg Ile Thr Asn Pro Val Pro Asn Ala Phe Ala Leu Trp
275 280 285
Leu Val Ser Val Ile Cys Glu Ile Trp Phe Ala Leu Ser Trp Ile Leu
290 295 300
Asp Gln Phe Pro Lys Trp Phe Pro Val Asn Arg Glu Thr Tyr Leu Asp
305 310 315 320
Arg Leu Ala Leu Arg Tyr Asp Arg Glu Gly Glu Pro Ser Gln Leu Ala
325 330 335
Ala Val Asp Ile Phe Val Ser Thr Val Asp Pro Leu Lys Glu Pro Pro
340 345 350
Leu Val Thr Ala Asn Thr Val Leu Ser Ile Leu Ala Val Asp Tyr Pro
355 360 365
Val Asp Lys Val Ser Cys Tyr Val Phe Asp Asp Gly Ala Ala Met Leu
370 375 380
Ser Phe Glu Ser Leu Ala Glu Thr Ser Glu Phe Ala Arg Lys Trp Val
385 390 395 400
Pro Phe Cys Lys Lys Tyr Ser Ile Glu Pro Arg Ala Pro Glu Trp Tyr
405 410 415
Phe Ala Ala Lys Ile Asp Tyr Leu Lys Asp Lys Val Gln Thr Ser Phe
420 425 430
Val Lys Asp Arg Arg Ala Met Lys Arg Glu Tyr Glu Glu Phe Lys Ile
435 440 445
Arg Ile Asn Ala Leu Val Ser Lys Ala Leu Lys Cys Pro Glu Glu Gly
450 455 460
Trp Val Met Gln Asp Gly Thr Pro Trp Pro Gly Asn Asn Thr Gly Asp
465 470 475 480
His Pro Gly Met Ile Gln Val Phe Leu Gly Gln Asn Gly Gly Leu Asp
485 490 495
Ala Glu Gly Asn Glu Leu Pro Arg Leu Val Tyr Val Ser Arg Glu Lys
500 505 510
Arg Pro Gly Phe Gln His His Lys Lys Ala Gly Ala Met Asn Ala Leu
515 520 525
Val Arg Val Ser Ala Val Leu Thr Asn Gly Pro Phe Ile Leu Asn Leu
530 535 540
Asp Cys Asp His Tyr Ile Asn Asn Ser Lys Ala Leu Arg Glu Ala Met
545 550 555 560
Cys Phe Leu Met Asp Pro Asn Leu Gly Lys Gln Val Cys Tyr Val Gln
565 570 575
Phe Pro Gln Arg Phe Asp Gly Ile Asp Lys Asn Asp Arg Tyr Ala Asn
580 585 590
Arg Asn Thr Val Phe Phe Asp Ile Asn Leu Arg Gly Leu Asp Gly Ile
595 600 605
Gln Gly Pro Val Tyr Val Gly Thr Gly Cys Val Phe Asn Arg Thr Ala
610 615 620
Leu Tyr Gly Tyr Glu Pro Pro Ile Lys Val Lys His Lys Lys Pro Ser
625 630 635 640
Leu Leu Ser Lys Leu Cys Gly Gly Ser Arg Lys Lys Asn Ser Lys Ala
645 650 655
Lys Lys Glu Ser Asp Lys Lys Lys Ser Gly Arg His Thr Asp Ser Thr
660 665 670
Val Pro Val Phe Asn Leu Asp Asp Ile Glu Glu Gly Val Glu Gly Ala
675 680 685
Gly Phe Asp Asp Glu Lys Ala Leu Leu Met Ser Gln Met Ser Leu Glu
690 695 700
Lys Arg Phe Gly Gln Ser Ala Val Phe Val Ala Ser Thr Leu Met Glu
705 710 715 720
Asn Gly Gly Val Pro Pro Ser Ala Thr Pro Glu Asn Leu Leu Lys Glu
725 730 735
Ala Ile His Val Ile Ser Cys Gly Tyr Glu Asp Lys Ser Asp Trp Gly
740 745 750
Met Glu Ile Gly Trp Ile Tyr Gly Ser Val Thr Glu Asp Ile Leu Thr
755 760 765
Gly Phe Lys Met His Ala Arg Gly Trp Arg Ser Ile Tyr Cys Met Pro
770 775 780
Lys Leu Pro Ala Phe Lys Gly Ser Ala Pro Ile Asn Leu Ser Asp Arg
785 790 795 800
Leu Asn Gln Val Leu Arg Trp Ala Leu Gly Ser Val Glu Ile Leu Phe
805 810 815
Ser Arg His Cys Pro Ile Trp Tyr Gly Tyr Asn Gly Arg Leu Lys Phe
820 825 830
Leu Glu Arg Phe Ala Tyr Val Asn Thr Thr Ile Tyr Pro Ile Thr Ser
835 840 845
Ile Pro Leu Leu Met Tyr Cys Thr Leu Leu Ala Val Cys Leu Phe Thr
850 855 860
Asn Gln Phe Ile Ile Pro Gln Ile Ser Asn Ile Ala Ser Ile Trp Phe
865 870 875 880
Leu Ser Leu Phe Leu Ser Ile Phe Ala Thr Gly Ile Leu Glu Met Arg
885 890 895
Trp Ser Gly Val Gly Ile Asp Glu Trp Trp Arg Asn Glu Gln Phe Trp
900 905 910
Val Ile Gly Gly Val Ser Ala His Leu Phe Ala Val Phe Gln Gly Ile
915 920 925
Leu Lys Val Leu Ala Gly Ile Asp Thr Asn Phe Thr Val Thr Ser Lys
930 935 940
Ala Ser Asp Glu Asp Gly Asp Phe Ala Glu Leu Tyr Leu Phe Lys Trp
945 950 955 960
Thr Thr Leu Leu Ile Pro Pro Thr Thr Leu Leu Ile Val Asn Leu Val
965 970 975
Gly Val Val Ala Gly Val Ser Tyr Ala Ile Asn Ser Gly Tyr Gln Ser
980 985 990
Trp Gly Pro Leu Phe Gly Lys Leu Phe Phe Ala Phe Trp Val Ile Val
995 1000 1005
His Leu Tyr Pro Phe Leu Lys Gly Leu Met Gly Arg Gln Asn Arg
1010 1015 1020
Thr Pro Thr Ile Val Val Val Trp Ser Val Leu Leu Ala Ser Ile
1025 1030 1035
Phe Ser Leu Leu Trp Val Arg Ile Asp Pro Phe Thr Ser Arg Val
1040 1045 1050
Thr Gly Pro Asp Ile Leu Glu Cys Gly Ile Asn Cys
1055 1060 1065
<210> 69
<211> 760
<212> PRT
<213> Arabodopsis thaliana
<400> 69
Met Glu Thr His Arg Lys Asn Ser Val Val Gly Asn Ile Leu His Thr
1 5 10 15
Cys His Pro Cys Arg Arg Thr Ile Pro Tyr Arg Ile Tyr Ala Ile Phe
20 25 30
His Thr Cys Gly Ile Ile Ala Leu Met Tyr His His Val His Ser Leu
35 40 45
Val Thr Ala Asn Asn Thr Leu Ile Thr Cys Leu Leu Leu Leu Ser Asp
50 55 60
Ile Val Leu Ala Phe Met Trp Ala Thr Thr Thr Ser Leu Arg Leu Asn
65 70 75 80
Pro Val His Arg Thr Glu Cys Pro Glu Lys Tyr Ala Ala Lys Pro Glu
85 90 95
Asp Phe Pro Lys Leu Asp Val Phe Ile Cys Thr Ala Asp Pro Tyr Lys
100 105 110
Glu Pro Pro Met Met Val Val Asn Thr Ala Leu Ser Val Met Ala Tyr
115 120 125
Glu Tyr Pro Ser Asp Lys Ile Ser Val Tyr Val Ser Asp Asp Gly Gly
130 135 140
Ser Ser Leu Thr Phe Phe Ala Leu Ile Glu Ala Ala Lys Phe Ser Lys
145 150 155 160
Gln Trp Leu Pro Phe Cys Lys Lys Asn Asn Val Gln Asp Arg Ser Pro
165 170 175
Glu Val Tyr Phe Ser Ser Glu Ser His Ser Arg Ser Asp Glu Ala Glu
180 185 190
Asn Leu Lys Met Met Tyr Glu Asp Met Lys Ser Arg Val Glu His Val
195 200 205
Val Glu Ser Gly Lys Val Glu Thr Ala Phe Ile Thr Cys Asp Gln Phe
210 215 220
Arg Gly Val Phe Asp Leu Trp Thr Asp Lys Phe Ser Arg His Asp His
225 230 235 240
Pro Thr Ile Ile Gln Val Leu Gln Asn Ser Glu Thr Asp Met Asp Asn
245 250 255
Thr Arg Lys Tyr Ile Met Pro Asn Leu Ile Tyr Val Ser Arg Glu Lys
260 265 270
Ser Lys Val Ser Pro His His Phe Lys Ala Gly Ala Leu Asn Thr Leu
275 280 285
Leu Arg Val Ser Gly Val Met Thr Asn Ser Pro Ile Ile Leu Thr Leu
290 295 300
Asp Cys Asp Met Tyr Ser Asn Asp Pro Ala Thr Leu Val Arg Ala Leu
305 310 315 320
Cys Tyr Leu Thr Asp Pro Glu Ile Lys Ser Gly Leu Gly Tyr Val Gln
325 330 335
Phe Pro Gln Lys Phe Leu Gly Ile Ser Lys Asn Asp Ile Tyr Ala Cys
340 345 350
Glu Asn Lys Arg Leu Phe Ile Ile Asn Met Val Gly Phe Asp Gly Leu
355 360 365
Met Gly Pro Thr His Val Gly Thr Gly Cys Phe Phe Asn Arg Arg Ala
370 375 380
Phe Tyr Gly Pro Pro Tyr Met Leu Ile Leu Pro Glu Ile Asn Glu Leu
385 390 395 400
Lys Pro Tyr Arg Ile Ala Asp Lys Ser Ile Lys Ala Gln Asp Val Leu
405 410 415
Ser Leu Ala His Asn Val Ala Gly Cys Ile Tyr Glu Tyr Asn Thr Asn
420 425 430
Trp Gly Ser Lys Ile Gly Phe Arg Tyr Gly Ser Leu Val Glu Asp Tyr
435 440 445
Tyr Thr Gly Phe Met Leu His Cys Glu Gly Trp Arg Ser Val Phe Cys
450 455 460
Asn Pro Lys Lys Ala Ala Phe Tyr Gly Asp Ser Pro Lys Cys Leu Val
465 470 475 480
Asp Leu Val Gly Gln Gln Ile Arg Trp Ala Val Gly Leu Phe Glu Met
485 490 495
Ser Phe Ser Lys Tyr Ser Pro Ile Thr Tyr Gly Ile Lys Ser Leu Asp
500 505 510
Leu Leu Met Gly Leu Gly Tyr Cys Asn Ser Pro Phe Lys Pro Phe Trp
515 520 525
Ser Ile Pro Leu Thr Val Tyr Gly Leu Leu Pro Gln Leu Ala Leu Ile
530 535 540
Ser Gly Val Ser Val Phe Pro Lys Ala Ser Asp Pro Trp Phe Trp Leu
545 550 555 560
Tyr Ile Ile Leu Phe Phe Gly Ala Tyr Ala Gln Asp Leu Ser Asp Phe
565 570 575
Leu Leu Glu Gly Gly Thr Tyr Arg Lys Trp Trp Asn Asp Gln Arg Met
580 585 590
Leu Met Ile Lys Gly Leu Ser Ser Phe Phe Phe Gly Phe Ile Glu Phe
595 600 605
Ile Leu Lys Thr Leu Asn Leu Ser Thr Pro Lys Phe Asn Val Thr Ser
610 615 620
Lys Ala Asn Asp Asp Asp Glu Gln Arg Lys Arg Tyr Glu Gln Glu Ile
625 630 635 640
Phe Asp Phe Gly Thr Ser Ser Ser Met Phe Leu Pro Leu Thr Thr Val
645 650 655
Ala Ile Val Asn Leu Leu Ala Phe Val Trp Gly Leu Tyr Gly Ile Leu
660 665 670
Phe Cys Gly Gly Glu Leu Tyr Leu Glu Leu Met Leu Val Ser Phe Ala
675 680 685
Val Val Asn Cys Leu Pro Ile Tyr Gly Ala Met Val Leu Arg Lys Asp
690 695 700
Asp Gly Lys Leu Ser Lys Arg Thr Cys Phe Leu Ala Gly Asn Leu His
705 710 715 720
Val Gly Ser Tyr Cys Val Lys Leu Leu Arg Pro Gln Val Thr Ser Pro
725 730 735
Leu Arg Leu Ile His Asn Asn Asn Thr Ser Gly Trp Phe Lys Arg Lys
740 745 750
Lys His Asn Met Asn Glu Ser Val
755 760
<210> 70
<211> 1086
<212> PRT
<213> Spinacia oleracea
<400> 70
Met Glu Ala Thr Gly Gly Met Val Ala Gly Ser Tyr Lys Arg Asn Glu
1 5 10 15
Leu Val Arg Ile Arg His Asp Ser Thr Asp Ser Gly Ser Lys Ser Leu
20 25 30
Lys Asn Leu Asp Gly Gln Ile Cys Gln Ile Cys Gly Asp Thr Val Gly
35 40 45
Val Thr Ser Asn Gly Gly Val Phe Val Ala Cys Asn Glu Cys Ala Phe
50 55 60
Pro Val Cys Arg Pro Cys Tyr Glu Tyr Glu Arg Lys Asp Gly Asn Gln
65 70 75 80
Cys Cys Pro Gln Cys Lys Thr Arg Tyr Lys Arg Gln Lys Gly Ser Leu
85 90 95
Arg Val Glu Gly Asp Asp Glu Glu Glu Asp Val Asp Asp Leu Asp Asn
100 105 110
Glu Phe Asn Tyr Glu Arg Gly Thr Ser Lys Ala Arg His Gln Trp Gln
115 120 125
Gly Glu Asp Val Asp Leu Ser Ser Ser Ser Arg His Gly Ser Gln Pro
130 135 140
Ile Pro Leu Leu Thr Asn Gly Gln Val Val Ser Gly Glu Ile Pro Ser
145 150 155 160
Ala Thr Pro Asp Asn Gln Ser Val Arg Ser Thr Ser Gly Pro Ile Gly
165 170 175
Pro Glu Lys Arg Gly Asn His Ser Leu Pro Tyr Ile Asp Pro Cys Leu
180 185 190
Pro Val Pro Val Arg Ile Val Asp Pro Ser Lys Asp Leu Asn Ser Tyr
195 200 205
Gly Leu Gly Ser Val Asp Trp Lys Glu Arg Val Glu Ser Trp Lys Leu
210 215 220
Lys Gln Glu Lys Asn Met Thr His Thr Gly Asn Arg Tyr Ser Glu Gly
225 230 235 240
Lys Gly Gly Asp Val Glu Gly Ser Gly Ser Asn Gly Glu Glu Leu Gln
245 250 255
Leu Ala Asp Asp Val Arg Gln Pro Met Ser Arg Ile Val Pro Ile Pro
260 265 270
Ser Ser His Leu Thr Pro Tyr Arg Ala Val Ile Ile Phe Arg Leu Ile
275 280 285
Ile Leu Val Phe Phe Leu Gln Phe Arg Ile Thr His Pro Val Glu Asp
290 295 300
Ala Tyr Pro Leu Trp Leu Thr Ser Val Ile Cys Glu Ile Trp Phe Ala
305 310 315 320
Met Ser Trp Ile Leu Asp Gln Phe Pro Lys Trp Tyr Pro Ile Asn Arg
325 330 335
Glu Thr Tyr Leu Asp Arg Leu Ala Phe Arg His Asp Arg Glu Gly Glu
340 345 350
Pro Ser Gln Leu Ala Pro Ile Asp Val Phe Val Ser Thr Val Asp Pro
355 360 365
Leu Lys Glu Pro Pro Ile Ile Thr Ala Asn Thr Val Leu Ser Ile Leu
370 375 380
Ala Val Asp Tyr Pro Val Asp Lys Val Ser Cys Tyr Val Ser Asp Asp
385 390 395 400
Gly Ser Ala Met Leu Thr Phe Glu Gly Leu Ser Glu Thr Ala Glu Phe
405 410 415
Ala Arg Lys Trp Val Pro Phe Cys Lys Lys Phe Ser Ile Glu Pro Arg
420 425 430
Ala Pro Glu Phe Tyr Phe Gln Gln Lys Ile Asp Tyr Leu Lys Asp Lys
435 440 445
Ile Gln Pro Ser Phe Val Lys Glu Arg Arg Ala Met Lys Arg Glu Tyr
450 455 460
Glu Glu Phe Lys Val Arg Ile Asn Ala Leu Val Ala Lys Ala Gln Lys
465 470 475 480
Val Pro Glu Glu Gly Trp Thr Met Gln Asp Gly Thr Ala Trp Pro Gly
485 490 495
Asn Asn Pro Arg Asp His Pro Gly Met Ile Gln Val Phe Leu Gly His
500 505 510
Ser Gly Gly Leu Asp Met Asp Gly Asn Glu Leu Pro Arg Leu Val Tyr
515 520 525
Val Ser Arg Glu Lys Arg Pro Gly Phe Gln His His Lys Lys Ala Gly
530 535 540
Ala Met Asn Ala Leu Ile Arg Val Ser Ala Val Leu Thr Asn Gly Ala
545 550 555 560
Tyr Ile Leu Asn Val Asp Cys Asp His Tyr Phe Asn Asn Ser Lys Cys
565 570 575
Leu Lys Glu Ala Met Cys Phe Met Met Asp Pro Ala Leu Gly Lys Lys
580 585 590
Val Cys Tyr Val Gln Phe Pro Gln Arg Phe Asp Gly Ile Asp Leu His
595 600 605
Asp Arg Tyr Ala Asn Arg Asn Ile Val Phe Phe Asp Ile Asn Met Lys
610 615 620
Gly Gln Asp Gly Ile Gln Gly Pro Val Tyr Val Gly Thr Gly Cys Cys
625 630 635 640
Phe Asn Arg Gln Ala Leu Tyr Gly Tyr Asp Pro Val Leu Thr Glu Glu
645 650 655
Asp Phe Glu Pro Asn Phe Ile Ile Lys Asn Cys Phe Gly Ser Arg Lys
660 665 670
Lys Gly Lys Ser Gly Asn Lys Lys Tyr Met Asp Lys Lys Arg Gly Pro
675 680 685
Lys Arg Ser Glu Ser Ser Ile Pro Ile Phe Asn Met Glu Asp Ile Glu
690 695 700
Glu Gly Val Glu Gly Tyr Glu Asp Glu Lys Ser Leu Leu Met Ser Gln
705 710 715 720
Lys Arg Leu Glu Lys Arg Phe Gly Gln Ser Pro Val Phe Ile Ala Ala
725 730 735
Thr Phe Met Glu Met Gly Gly Ile Pro Pro Thr Thr Asn Pro Ala Thr
740 745 750
Leu Leu Lys Glu Ala Ile His Val Ile Ser Cys Gly Tyr Glu Asp Lys
755 760 765
Ser Glu Trp Gly Lys Glu Ile Gly Trp Ile Tyr Gly Ser Val Thr Glu
770 775 780
Asp Ile Leu Thr Gly Phe Lys Met His Ala Arg Gly Trp Met Ser Ile
785 790 795 800
Tyr Cys Met Pro Pro Arg Pro Ala Phe Lys Gly Ser Ala Pro Leu Asn
805 810 815
Leu Ser Asp Arg Leu Asn Gln Val Leu Arg Trp Ala Leu Gly Ser Ile
820 825 830
Glu Ile Met Leu Ser Arg His Cys Pro Ile Trp Tyr Gly Tyr Lys Gly
835 840 845
Arg Leu Arg Phe Leu Glu Arg Leu Ala Tyr Ile Asn Thr Val Val Tyr
850 855 860
Pro Leu Thr Ser Ile Pro Leu Ile Ala Tyr Cys Ile Leu Pro Ala Ile
865 870 875 880
Cys Leu Leu Thr Asn Lys Phe Ile Ile Pro Thr Leu Ser Asn Phe Ala
885 890 895
Ser Ile Leu Phe Ile Met Leu Phe Met Ser Ile Ala Ala Thr Gly Ile
900 905 910
Leu Glu Leu Arg Trp Ser Gly Val Ser Ile Glu Asp Trp Trp Arg Asn
915 920 925
Glu Gln Phe Trp Val Ile Gly Gly Thr Ser Ala His Leu Phe Ala Val
930 935 940
Phe Gln Gly Leu Leu Lys Val Leu Ala Gly Ile Asp Thr Asn Phe Thr
945 950 955 960
Val Thr Ser Lys Ala Ala Asp Glu Asp Gly Asp Phe Ala Glu Leu Tyr
965 970 975
Ile Phe Lys Trp Thr Ala Leu Leu Ile Pro Pro Thr Thr Val Leu Ile
980 985 990
Val Asn Leu Val Gly Val Val Ala Gly Val Ser Tyr Ala Ile Asn Ser
995 1000 1005
Gly Tyr Gln Ser Trp Gly Pro Leu Phe Gly Lys Leu Phe Phe Ser
1010 1015 1020
Phe Trp Val Ile Ala His Leu Tyr Pro Phe Leu Lys Gly Leu Leu
1025 1030 1035
Gly Arg Gln Asn Arg Thr Pro Thr Ile Val Ile Val Trp Ser Val
1040 1045 1050
Leu Leu Ala Ser Ile Phe Ser Leu Leu Trp Val Arg Ile Asn Pro
1055 1060 1065
Phe Thr Thr Asp Ala Glu Lys Ala Ala Ala Gly Asn Gln Cys Gly
1070 1075 1080
Ile Asn Cys
1085
<210> 71
<211> 1060
<212> PRT
<213> Spinacia oleracea
<400> 71
Met Met Glu Asp Ser Gln Ser Gly Val Lys Pro Thr Lys Gln Ala Asn
1 5 10 15
Glu Gln Val Cys Gln Ile Cys Ser Asp Asn Ile Gly Thr Thr Val Asp
20 25 30
Gly Glu Pro Phe Val Ala Cys Asp Val Cys Ser Phe Pro Val Cys Arg
35 40 45
Ala Cys Tyr Glu Tyr Glu Arg Lys Asp Gly Thr Gln Ser Cys Pro Gln
50 55 60
Cys Lys Thr Arg Tyr Lys Arg Gln Lys Gly Ser Pro Ala Ile His Gly
65 70 75 80
Glu Lys Val Glu Asp Ser Asp Val Glu Asp Val Val Ser Asp Val Asn
85 90 95
Glu Pro Leu Gly Ser Ser Ile Leu Lys Glu Lys Pro Gln Glu Arg Met
100 105 110
Leu Gly Trp His Met Asn His Gly Gln Ser Gly Glu Leu Gly Pro Pro
115 120 125
Thr Tyr Asp Lys Glu Ala Pro Ile Ser His Ile Pro Arg Leu Ala Thr
130 135 140
Gly Arg Thr Val Ser Gly Asp Leu Ser Ala Ala Ser Pro Gly Arg Phe
145 150 155 160
Ser Met Pro Ser Pro Gly Ala Ser Thr Gly Ala Asn Ile Arg Val Ser
165 170 175
Arg Glu Phe Ala Ser Pro Gly Phe Gly Asn Val Ala Trp Lys Glu Arg
180 185 190
Ile Asp Gly Trp Lys Met Lys Gln Glu Lys Ser Thr Gly Pro Pro Ser
195 200 205
Val Ser His Ala Pro Ser Glu Gly Arg Phe Ala Asn Asp Ile Asp Ala
210 215 220
Ser Thr Glu Ile Ala Met Asp Asp Pro Leu Leu Asn Asp Glu Thr Arg
225 230 235 240
Gln Pro Leu Ser Arg Lys Val Pro Ile Pro Ser Ser Arg Ile Asn Pro
245 250 255
Tyr Arg Met Val Ile Val Leu Arg Leu Ala Val Leu Gly Ile Phe Leu
260 265 270
His Tyr Arg Val Thr Asn Pro Val Pro Asn Ala Tyr Ala Leu Trp Leu
275 280 285
Ile Ser Val Ile Cys Glu Ile Trp Phe Ala Phe Ser Trp Ile Leu Asp
290 295 300
Gln Phe Pro Lys Trp Leu Pro Ile Asn Arg Glu Thr Tyr Leu Asp Arg
305 310 315 320
Leu Ala Leu Arg Tyr Asp Arg Glu Gly Glu Pro Ser Gln Leu Ala Ala
325 330 335
Val Asp Ile Phe Val Ser Thr Val Asp Pro Leu Lys Glu Pro Pro Leu
340 345 350
Val Thr Ala Asn Thr Val Leu Ser Ile Leu Ala Val Asp Tyr Pro Val
355 360 365
Asp Lys Val Ser Cys Tyr Val Ser Asp Asp Gly Ala Ala Met Leu Thr
370 375 380
Phe Glu Ala Leu Ser Glu Thr Ser Glu Phe Ala Arg Lys Trp Val Pro
385 390 395 400
Phe Thr Lys Lys Tyr Asn Ile Glu Pro Arg Ala Pro Glu Trp Tyr Phe
405 410 415
Ser Gln Lys Ile Asp Tyr Leu Lys Asp Lys Val Gln Thr Thr Phe Val
420 425 430
Lys Asp Arg Arg Ala Met Lys Arg Glu Tyr Glu Glu Phe Lys Ile Arg
435 440 445
Ile Asn Gly Leu Val Ala Lys Ala Thr Lys Val Pro Glu Glu Gly Trp
450 455 460
Val Met Gln Asp Gly Thr Pro Trp Pro Gly Asn Asn Thr Arg Asp His
465 470 475 480
Pro Gly Met Ile Gln Val Phe Leu Gly Gln Ser Gly Gly Leu Asp Thr
485 490 495
Asp Gly Asn Glu Leu Pro Arg Leu Val Tyr Val Ser Arg Glu Lys Arg
500 505 510
Pro Gly Phe Thr His His Lys Lys Ala Gly Ala Met Asn Ser Leu Val
515 520 525
Arg Val Ser Ala Val Leu Thr Asn Gly Pro Phe Met Leu Asn Leu Asp
530 535 540
Cys Asp His Tyr Ile Asn Asn Ser Lys Ala Leu Arg Glu Ala Met Cys
545 550 555 560
Phe Met Met Asp Pro Asn Leu Gly Lys Tyr Cys Cys Tyr Val Gln Phe
565 570 575
Pro Gln Arg Phe Asp Gly Ile Asp Arg Asn Asp Arg Tyr Ala Asn Arg
580 585 590
Asn Thr Val Phe Phe Asp Ile Asn Leu Arg Gly Leu Asp Gly Ile Gln
595 600 605
Gly Pro Val Tyr Val Gly Thr Gly Cys Val Phe Asn Arg Thr Ala Leu
610 615 620
Tyr Gly Tyr Glu Pro Pro Ile Lys Pro Lys Pro Lys Lys Lys Gly Ile
625 630 635 640
Leu Ser Ser Cys Phe Gly Gly Ser Arg Lys Lys Ser Ser Lys Lys Asp
645 650 655
Ser Lys Lys Lys Ser Lys His Ala Asp Pro Thr Val Pro Ile Phe Asn
660 665 670
Leu Glu Asp Ile Glu Glu Gly Val Glu Gly Thr Gly Phe Asp Asp Glu
675 680 685
Lys Ser Leu Leu Met Ser Gln Ile Ser Leu Glu Lys Arg Phe Gly Lys
690 695 700
Ser Glu Val Phe Val Ala Ser Thr Leu Met Glu Asn Gly Gly Val Pro
705 710 715 720
Gln Ser Ala Thr Pro Asp Thr Leu Leu Lys Glu Ala Ile His Val Ile
725 730 735
Ser Cys Gly Tyr Glu Asp Lys Thr Asp Trp Gly Ala Glu Ile Gly Trp
740 745 750
Ile Tyr Gly Ser Val Thr Glu Asp Ile Leu Thr Gly Phe Lys Met His
755 760 765
Ala Arg Gly Trp Arg Ser Ile Tyr Cys Met Pro Lys Leu Ala Ala Phe
770 775 780
Lys Gly Ser Ala Pro Ile Asn Leu Ser Asp Arg Leu Asn Gln Val Leu
785 790 795 800
Arg Trp Ala Leu Gly Ser Val Glu Ile Leu Phe Ser Arg His Cys Pro
805 810 815
Leu Trp Tyr Gly Tyr Gly Gly Arg Leu Lys Trp Leu Glu Arg Phe Ala
820 825 830
Tyr Ile Asn Thr Thr Ile Tyr Pro Leu Thr Ser Ile Pro Leu Leu Ala
835 840 845
Tyr Cys Thr Leu Pro Ala Val Cys Leu Leu Thr Gly Lys Phe Ile Ile
850 855 860
Pro Gln Ile Ser Asn Leu Ala Ser Val Trp Phe Leu Ser Leu Phe Leu
865 870 875 880
Ser Ile Phe Ala Thr Gly Ile Leu Glu Met Arg Trp Ser Gly Val Gly
885 890 895
Ile Asp Glu Trp Trp Arg Asn Glu Gln Phe Trp Val Ile Gly Gly Ile
900 905 910
Ser Ala His Leu Phe Ala Val Phe Gln Gly Leu Leu Lys Val Leu Ala
915 920 925
Gly Ile Asp Thr Asn Phe Thr Val Thr Ser Lys Ala Ser Asp Glu Asp
930 935 940
Gly Asp Phe Thr Glu Leu Tyr Leu Phe Lys Trp Thr Thr Leu Leu Ile
945 950 955 960
Pro Pro Thr Thr Ile Leu Ile Val Asn Leu Val Ala Val Val Ala Gly
965 970 975
Ile Ser Tyr Ala Ile Asn Ser Gly Tyr Gln Ser Trp Gly Pro Leu Phe
980 985 990
Gly Lys Leu Phe Phe Ala Phe Trp Val Ile Val His Leu Tyr Pro Phe
995 1000 1005
Leu Lys Gly Leu Met Gly Arg Gln Asn Arg Thr Pro Thr Ile Val
1010 1015 1020
Val Val Trp Ser Ile Leu Leu Ala Ser Ile Phe Ser Leu Leu Trp
1025 1030 1035
Val Arg Val Asp Pro Phe Thr Thr Arg Val Thr Gly Pro Asp Val
1040 1045 1050
His Ile Cys Gly Ile Asn Cys
1055 1060
<210> 72
<211> 1431
<212> DNA
<213> Spinacia oleracea
<400> 72
atgaaagaaa gctctacttt gcgtgctcaa gctttgaaca aacccattcc ttttactcat 60
gattactacc aacgtattca gcctttcacc catcagattc tcaacaattc ttgtgcaggt 120
gcaggtaaaa atatctacac atggttggga ccagtgccaa caatactaat tacacagcct 180
gagttaataa aggatgcttt caataggatg aacaatttcc aaaaaccaag attgaatcca 240
tatactcaaa tactttcaac tggacttccg aactatgagg gccagaaatg ggctaaacac 300
aggaagcttc tcaaccctgc ttttcaactt gataagctca agcttatgat ccctgctttt 360
gaaacctgcg ttactgatac actaaataag tgggagaagc tagtttctaa aacaggttct 420
tcagaggttg atgtgtggcc acatttcaca actctaacgg gagatggtat tgctagagct 480
gcatttggaa gtagctttga ggatggaaga aggatattcg accttcttaa agagcaaaag 540
gatcttgtta ttagtcttct caaatattct tatattccag gattcaaata tttgcccaca 600
aaaggtaaca agatgatgaa agaaacggaa aacgaaatca aacctttatt gacgaatttg 660
attcacaaaa ggaagaaggc aatggaggct ggagaagctc ccaaagacga cttgttggga 720
atgctacttg aatccaatgc aaacgaggct cgacaagtta acgaaaatga aagtggaagt 780
aggaagcgac aatccgatat aacaatgagc ttccatgaga tgattgacgc gtgcaagttg 840
ttcttcttgg ctggccaaga gactacttct gtggcgctaa catgggcaat gattttgttg 900
gcgaagcacc aagattacca aacacgagca cgagaagaag tacttgctac atttggaacg 960
aaaactcctg actttgatgg tgtacataat cgccttaaga ttgtgacaac tatagtccac 1020
gaggtgctaa gattgtatcc gccaatccct gcaacatcac gaagggcaca tgaacgcgaa 1080
acaaaactag gagatttggt aataccacaa ggggtaggag tttcattttc catactacat 1140
gctcacttga accctgaaat ttggggtgat gatgccaaag aattcaagcc tgaaagattt 1200
tcagaaggga ttgcaaaggc aaccaaagga aataactctt acttcccctt tggttgggga 1260
cctaggattt gcattggtca agccttcgca ctaatccagg ttaaaatggc attgtctatg 1320
attttacaac gtttctcttt cgagctttca ccgtcctaca tccatgctcc aactagtcta 1380
ttagcccttc aaccccagca tggtgctcat gttatcttac atcgacttta a 1431
<210> 73
<211> 476
<212> PRT
<213> Spinacia oleracea
<400> 73
Met Lys Glu Ser Ser Thr Leu Arg Ala Gln Ala Leu Asn Lys Pro Ile
1 5 10 15
Pro Phe Thr His Asp Tyr Tyr Gln Arg Ile Gln Pro Phe Thr His Gln
20 25 30
Ile Leu Asn Asn Ser Cys Ala Gly Ala Gly Lys Asn Ile Tyr Thr Trp
35 40 45
Leu Gly Pro Val Pro Thr Ile Leu Ile Thr Gln Pro Glu Leu Ile Lys
50 55 60
Asp Ala Phe Asn Arg Met Asn Asn Phe Gln Lys Pro Arg Leu Asn Pro
65 70 75 80
Tyr Thr Gln Ile Leu Ser Thr Gly Leu Pro Asn Tyr Glu Gly Gln Lys
85 90 95
Trp Ala Lys His Arg Lys Leu Leu Asn Pro Ala Phe Gln Leu Asp Lys
100 105 110
Leu Lys Leu Met Ile Pro Ala Phe Glu Thr Cys Val Thr Asp Thr Leu
115 120 125
Asn Lys Trp Glu Lys Leu Val Ser Lys Thr Gly Ser Ser Glu Val Asp
130 135 140
Val Trp Pro His Phe Thr Thr Leu Thr Gly Asp Gly Ile Ala Arg Ala
145 150 155 160
Ala Phe Gly Ser Ser Phe Glu Asp Gly Arg Arg Ile Phe Asp Leu Leu
165 170 175
Lys Glu Gln Lys Asp Leu Val Ile Ser Leu Leu Lys Tyr Ser Tyr Ile
180 185 190
Pro Gly Phe Lys Tyr Leu Pro Thr Lys Gly Asn Lys Met Met Lys Glu
195 200 205
Thr Glu Asn Glu Ile Lys Pro Leu Leu Thr Asn Leu Ile His Lys Arg
210 215 220
Lys Lys Ala Met Glu Ala Gly Glu Ala Pro Lys Asp Asp Leu Leu Gly
225 230 235 240
Met Leu Leu Glu Ser Asn Ala Asn Glu Ala Arg Gln Val Asn Glu Asn
245 250 255
Glu Ser Gly Ser Arg Lys Arg Gln Ser Asp Ile Thr Met Ser Phe His
260 265 270
Glu Met Ile Asp Ala Cys Lys Leu Phe Phe Leu Ala Gly Gln Glu Thr
275 280 285
Thr Ser Val Ala Leu Thr Trp Ala Met Ile Leu Leu Ala Lys His Gln
290 295 300
Asp Tyr Gln Thr Arg Ala Arg Glu Glu Val Leu Ala Thr Phe Gly Thr
305 310 315 320
Lys Thr Pro Asp Phe Asp Gly Val His Asn Arg Leu Lys Ile Val Thr
325 330 335
Thr Ile Val His Glu Val Leu Arg Leu Tyr Pro Pro Ile Pro Ala Thr
340 345 350
Ser Arg Arg Ala His Glu Arg Glu Thr Lys Leu Gly Asp Leu Val Ile
355 360 365
Pro Gln Gly Val Gly Val Ser Phe Ser Ile Leu His Ala His Leu Asn
370 375 380
Pro Glu Ile Trp Gly Asp Asp Ala Lys Glu Phe Lys Pro Glu Arg Phe
385 390 395 400
Ser Glu Gly Ile Ala Lys Ala Thr Lys Gly Asn Asn Ser Tyr Phe Pro
405 410 415
Phe Gly Trp Gly Pro Arg Ile Cys Ile Gly Gln Ala Phe Ala Leu Ile
420 425 430
Gln Val Lys Met Ala Leu Ser Met Ile Leu Gln Arg Phe Ser Phe Glu
435 440 445
Leu Ser Pro Ser Tyr Ile His Ala Pro Thr Ser Leu Leu Ala Leu Gln
450 455 460
Pro Gln His Gly Ala His Val Ile Leu His Arg Leu
465 470 475
<210> 74
<211> 1443
<212> DNA
<213> Spinacia oleracea
<400> 74
atggtgaaga tttgctgcat tggggctggt tatgtaggag gccctactat ggctgttata 60
gcactcaagt gcccaaagat tgaagttgta gtggttgata tatctgtgtc tcggatcact 120
gcatggaaca gcgagcagct tccaatctat gagccgggtc tagatgatgt ggttaaggaa 180
tgccgtggaa ggaacctttt cttcagcact gatgtagaaa agcatgttgc tgaggctgat 240
attgtttttg tctctgtgaa tacccctacc aaaaccacag gtcttggagc aggcaaagct 300
gctgatttga cctactggga gagtgctgcc cgtatgattg ctgatgtttc aaagtctgac 360
aaaatcgttg ttgagaaatc aactgtgcca gtgaaaactg ctgaggcaat cgaaaagatt 420
ctgacgcaca acagcaaggg aatcaactac cagatccttt caaatccgga gttccttgct 480
gaaggtactg ctattcagga cctttttcac cctgacaggg ttctcatcgg tggccgggaa 540
accccagcag gcctcaaggc agtccaagca ttgaaggatg tgtatgctca atgggttcct 600
gatgaacgga tcttaaccac caatctttgg tctgctgagc tctcaaagct tgctgccaac 660
gccttcttag cacagaggat ttcatctgtc aatgcaatgt cagctctttg tgaggctact 720
ggagcagatg ttacccaagt cgcatatgct gttggtaagg acagtaggat tgggcaaaag 780
tttttgaacg ctagtgttgg ttttggaggg tcttgcttcc agaaagacat tctgaacttg 840
gtttacattt gtgagtgcaa cggtctccct gaggtggccg agtattggaa acaggtaatc 900
aaggtgaatg attatcagaa gaatcgtttt gtgaataggg ttgtggcctc catgttcaac 960
actgtatcga acaagaagat tgctgttctt ggatttgcat tcaaaaagga tacaggggat 1020
actagggaga cacccgccat agatgtgtgc aagggtttgt tgggagacaa ggcaaggttg 1080
agcatctacg atccacaagt cactgaggat cagattcagc gagatctcac catgaacaag 1140
tttgactggg accacccaat tcacctccag cccacaagtc ccacaactgt taagcaagtg 1200
agtgttgttt gggacgctta tgaggccacc aaagatgctc atgctgtgtg tattctgact 1260
gagtgggatg aatttaagaa acttgattac aaaaggattt ttgacaacat gcagaagcca 1320
gcttttgtgt ttgatggaag gaacattgtg aatgcagatg agctgaggca gattgggttc 1380
attgtgtact caattggtaa acctttggat tcatggctca aggacatgcc tgctgtggct 1440
taa 1443
<210> 75
<211> 480
<212> PRT
<213> Spinacia oleracea
<400> 75
Met Val Lys Ile Cys Cys Ile Gly Ala Gly Tyr Val Gly Gly Pro Thr
1 5 10 15
Met Ala Val Ile Ala Leu Lys Cys Pro Lys Ile Glu Val Val Val Val
20 25 30
Asp Ile Ser Val Ser Arg Ile Thr Ala Trp Asn Ser Glu Gln Leu Pro
35 40 45
Ile Tyr Glu Pro Gly Leu Asp Asp Val Val Lys Glu Cys Arg Gly Arg
50 55 60
Asn Leu Phe Phe Ser Thr Asp Val Glu Lys His Val Ala Glu Ala Asp
65 70 75 80
Ile Val Phe Val Ser Val Asn Thr Pro Thr Lys Thr Thr Gly Leu Gly
85 90 95
Ala Gly Lys Ala Ala Asp Leu Thr Tyr Trp Glu Ser Ala Ala Arg Met
100 105 110
Ile Ala Asp Val Ser Lys Ser Asp Lys Ile Val Val Glu Lys Ser Thr
115 120 125
Val Pro Val Lys Thr Ala Glu Ala Ile Glu Lys Ile Leu Thr His Asn
130 135 140
Ser Lys Gly Ile Asn Tyr Gln Ile Leu Ser Asn Pro Glu Phe Leu Ala
145 150 155 160
Glu Gly Thr Ala Ile Gln Asp Leu Phe His Pro Asp Arg Val Leu Ile
165 170 175
Gly Gly Arg Glu Thr Pro Ala Gly Leu Lys Ala Val Gln Ala Leu Lys
180 185 190
Asp Val Tyr Ala Gln Trp Val Pro Asp Glu Arg Ile Leu Thr Thr Asn
195 200 205
Leu Trp Ser Ala Glu Leu Ser Lys Leu Ala Ala Asn Ala Phe Leu Ala
210 215 220
Gln Arg Ile Ser Ser Val Asn Ala Met Ser Ala Leu Cys Glu Ala Thr
225 230 235 240
Gly Ala Asp Val Thr Gln Val Ala Tyr Ala Val Gly Lys Asp Ser Arg
245 250 255
Ile Gly Gln Lys Phe Leu Asn Ala Ser Val Gly Phe Gly Gly Ser Cys
260 265 270
Phe Gln Lys Asp Ile Leu Asn Leu Val Tyr Ile Cys Glu Cys Asn Gly
275 280 285
Leu Pro Glu Val Ala Glu Tyr Trp Lys Gln Val Ile Lys Val Asn Asp
290 295 300
Tyr Gln Lys Asn Arg Phe Val Asn Arg Val Val Ala Ser Met Phe Asn
305 310 315 320
Thr Val Ser Asn Lys Lys Ile Ala Val Leu Gly Phe Ala Phe Lys Lys
325 330 335
Asp Thr Gly Asp Thr Arg Glu Thr Pro Ala Ile Asp Val Cys Lys Gly
340 345 350
Leu Leu Gly Asp Lys Ala Arg Leu Ser Ile Tyr Asp Pro Gln Val Thr
355 360 365
Glu Asp Gln Ile Gln Arg Asp Leu Thr Met Asn Lys Phe Asp Trp Asp
370 375 380
His Pro Ile His Leu Gln Pro Thr Ser Pro Thr Thr Val Lys Gln Val
385 390 395 400
Ser Val Val Trp Asp Ala Tyr Glu Ala Thr Lys Asp Ala His Ala Val
405 410 415
Cys Ile Leu Thr Glu Trp Asp Glu Phe Lys Lys Leu Asp Tyr Lys Arg
420 425 430
Ile Phe Asp Asn Met Gln Lys Pro Ala Phe Val Phe Asp Gly Arg Asn
435 440 445
Ile Val Asn Ala Asp Glu Leu Arg Gln Ile Gly Phe Ile Val Tyr Ser
450 455 460
Ile Gly Lys Pro Leu Asp Ser Trp Leu Lys Asp Met Pro Ala Val Ala
465 470 475 480
<210> 76
<211> 1482
<212> DNA
<213> Glycyrrhiza uralensis
<400> 76
atggaagtac attgggtttg catgtccgct gccactttgt tggtatgcta catttttgga 60
agcaagtttg tgaggaattt gaatgggtgg tattatgatg taaaactaag aaggaaagaa 120
cacccactac ccccaggtga catgggatgg cctcttatcg gcgatctatt gtccttcatc 180
aaagatttct catcgggtca ccctgattca ttcatcaaca accttgttct caaatatgga 240
cgaagtggta tctacaagac tcacttgttt gggaatccaa gcatcattgt ttgygagcct 300
cagatgtgta ggcgagttct cactgatgat gtgaacttta agcttggtta tccaaaatct 360
atcaaagagt tggcacgatg tagacccatg attgatgtct ctaatgcgga acataggctt 420
tttcgacgcc tcattacttc cccaatcgtg ggtcacaagg cgctagcaat gtacctagag 480
cgtcttgagg aaattgtgat caattcgttg gaagaattgt ccagcatgaa gcaccccgtt 540
gagctcttga aagagatgaa gaaggtttcc tttaaagcca ttgtccacgt yttcatgggc 600
tcttccaatc aggacatcat taaaaaaatt ggaagttcgt ttactgattt gtacaatggc 660
atgttctcta tccccattaa cgtacctggt tttacattcc acaaagcact cgaggcacgt 720
aagaagctag ccaaaatagt tcaacccgtt gtggatgaaa ggcggttgat gatagaaaat 780
ggtccacaag aagggagcca aagaaaagat cttattgata ttcttttgga agtcaaagat 840
gagaatggac gaaaattgga ggacgaggat attagcgatt tattaatagg gcttttgttt 900
gctggccatg aaagtacagc aaccagttta atgtggtcaa ttacatatct tacacagcat 960
ccccatatct tgaaaaaggc taaggaagag caggaagaaa taacgaggac aagattttcc 1020
tcgcagaaac aattaagtct taaggaaatt aagcaaatgg tttatctttc tcaggtaatt 1080
gatgaaactt tacgatgtgc caatattgcc tttgcaactt ttcgagaggc aactgctgat 1140
gtgaacatca atggttatat cataccaaag ggatggagag tgctaatttg ggcaagagcc 1200
attcatatgg attctgaata ttacccaaat ccagaagaat ttaatccatc gagatgggat 1260
gattacaatg ccaaagcagg aaccttcctt ccttttggag caggaagtag actttgtcct 1320
ggagccgact tggcgaaact tgaaatttcc atatttcttc attatttcct ccttaattac 1380
aggttggaga gaataaatcc agaatgtcac gttaccagct taccagtatc taarcccaca 1440
gacaattgtc tcgctaaggt gataaaggtc tcatgtgctt ag 1482
<210> 77
<211> 493
<212> PRT
<213> Glycyrrhiza uralensis
<220>
<221> misc_feature
<222> (98)..(98)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (478)..(478)
<223> Xaa can be any naturally occurring amino acid
<400> 77
Met Glu Val His Trp Val Cys Met Ser Ala Ala Thr Leu Leu Val Cys
1 5 10 15
Tyr Ile Phe Gly Ser Lys Phe Val Arg Asn Leu Asn Gly Trp Tyr Tyr
20 25 30
Asp Val Lys Leu Arg Arg Lys Glu His Pro Leu Pro Pro Gly Asp Met
35 40 45
Gly Trp Pro Leu Ile Gly Asp Leu Leu Ser Phe Ile Lys Asp Phe Ser
50 55 60
Ser Gly His Pro Asp Ser Phe Ile Asn Asn Leu Val Leu Lys Tyr Gly
65 70 75 80
Arg Ser Gly Ile Tyr Lys Thr His Leu Phe Gly Asn Pro Ser Ile Ile
85 90 95
Val Xaa Glu Pro Gln Met Cys Arg Arg Val Leu Thr Asp Asp Val Asn
100 105 110
Phe Lys Leu Gly Tyr Pro Lys Ser Ile Lys Glu Leu Ala Arg Cys Arg
115 120 125
Pro Met Ile Asp Val Ser Asn Ala Glu His Arg Leu Phe Arg Arg Leu
130 135 140
Ile Thr Ser Pro Ile Val Gly His Lys Ala Leu Ala Met Tyr Leu Glu
145 150 155 160
Arg Leu Glu Glu Ile Val Ile Asn Ser Leu Glu Glu Leu Ser Ser Met
165 170 175
Lys His Pro Val Glu Leu Leu Lys Glu Met Lys Lys Val Ser Phe Lys
180 185 190
Ala Ile Val His Val Phe Met Gly Ser Ser Asn Gln Asp Ile Ile Lys
195 200 205
Lys Ile Gly Ser Ser Phe Thr Asp Leu Tyr Asn Gly Met Phe Ser Ile
210 215 220
Pro Ile Asn Val Pro Gly Phe Thr Phe His Lys Ala Leu Glu Ala Arg
225 230 235 240
Lys Lys Leu Ala Lys Ile Val Gln Pro Val Val Asp Glu Arg Arg Leu
245 250 255
Met Ile Glu Asn Gly Pro Gln Glu Gly Ser Gln Arg Lys Asp Leu Ile
260 265 270
Asp Ile Leu Leu Glu Val Lys Asp Glu Asn Gly Arg Lys Leu Glu Asp
275 280 285
Glu Asp Ile Ser Asp Leu Leu Ile Gly Leu Leu Phe Ala Gly His Glu
290 295 300
Ser Thr Ala Thr Ser Leu Met Trp Ser Ile Thr Tyr Leu Thr Gln His
305 310 315 320
Pro His Ile Leu Lys Lys Ala Lys Glu Glu Gln Glu Glu Ile Thr Arg
325 330 335
Thr Arg Phe Ser Ser Gln Lys Gln Leu Ser Leu Lys Glu Ile Lys Gln
340 345 350
Met Val Tyr Leu Ser Gln Val Ile Asp Glu Thr Leu Arg Cys Ala Asn
355 360 365
Ile Ala Phe Ala Thr Phe Arg Glu Ala Thr Ala Asp Val Asn Ile Asn
370 375 380
Gly Tyr Ile Ile Pro Lys Gly Trp Arg Val Leu Ile Trp Ala Arg Ala
385 390 395 400
Ile His Met Asp Ser Glu Tyr Tyr Pro Asn Pro Glu Glu Phe Asn Pro
405 410 415
Ser Arg Trp Asp Asp Tyr Asn Ala Lys Ala Gly Thr Phe Leu Pro Phe
420 425 430
Gly Ala Gly Ser Arg Leu Cys Pro Gly Ala Asp Leu Ala Lys Leu Glu
435 440 445
Ile Ser Ile Phe Leu His Tyr Phe Leu Leu Asn Tyr Arg Leu Glu Arg
450 455 460
Ile Asn Pro Glu Cys His Val Thr Ser Leu Pro Val Ser Xaa Pro Thr
465 470 475 480
Asp Asn Cys Leu Ala Lys Val Ile Lys Val Ser Cys Ala
485 490
<210> 78
<211> 1617
<212> DNA
<213> Glycyrrhiza uralensis
<220>
<221> misc_feature
<222> (1009)..(1009)
<223> n is a, c, g, or t
<400> 78
atggatgcat cttccacacc aggggctatc tgggttgttc tgacagtgat actagctgcg 60
attcccatat gggcatgcca tatggtgaac acgctgtggc tgaggccaaa gaggttggaa 120
aggcatctca gagctcaagg tcttcatggt gacccttaca agctctcact tgacaactcc 180
aagcaaacct atatgctcaa gttgcaacaa gaagcacaat caaaatccat tggtctctcc 240
aaagatgatg ctgcaccacg aatcttctcc cttgcccatc aaactgtaca caaatatgga 300
aagaactcct ttgcatggga agggacagca ccaaaggtga tcatcacaga cccagagcaa 360
attaaggaag tctttaacaa gattcaggac ttccccaaac caaaattaaa tcccatcgcc 420
aagtatatta gcatcggtct aatacagtat gagggtgaca aatgggccaa acatcgaaag 480
attatcaatc cggcattcca cttagaaaaa ttgaaaggta tgctgccagc attttctcat 540
agctgccatg aaatgattag caaatggaag gggttattgt catcagatgg aacatgtgag 600
gttgatgttt ggcccttcct tcaaaatctc acttgtgatg taatttctag gacggcattc 660
ggaagcagct atgcagaagg agcaaaaata tttgaacttt tgaaaaggca gggatatgct 720
ttgatgacag cacgatacgc acgcattcca ttatggtggc ttctaccatc aactaccaaa 780
aggaggatga aggaaattga aagaggcata cgtgattcac ttgaaggtat cattagaaaa 840
cgagaaaaag cattgaagag tggcaaaagc accgatgacg acttattagg catacttttg 900
caatcaaatc acattgaaaa taaaggagat gaaaacagta agagtgctgg aatgaccacc 960
caagaagtaa tggaggaatg caaacttttt tacctggcag ggcaagagnt tgaaaataaa 1020
ggagatgaaa acagtaagag tgctggaatg accacccaag aagtaatgga ggaatgcaaa 1080
cttttttacc tggcagggca agagaccacc gcagctttgc tggcctggac aatggtgtta 1140
ttaggcaagc atcctgaatg gcaagcacgc gcaaggcagg aagttttgca agtaaccatg 1200
attttatatg aggtactcag gctgtaccca cctgggattt acctcacccg agctcttcga 1260
aaggatttga aacttggaaa ccttttgcta cctgctggag tacaggtttc cgtaccaata 1320
cttttgattc accatgatga aggtatatgg ggcaatgatg caaaggagtt caatcctgaa 1380
aggtttgctg aaggaattgc aaaggcaaca aaaggccaag tttgctattt cccttttgga 1440
tggggtccta gaatatgtgt tgggcaaaac tttgccttat tagaagccaa gattgtattg 1500
tcattgctgc tgcagaattt ctcatttgag ctatctccga cttatgcaca tgttcctacc 1560
acggtgctta ctttgcagcc aaaacatggg gcacccatca ttctgcataa actgtaa 1617
<210> 79
<211> 538
<212> PRT
<213> Glycyrrhiza uralensis
<220>
<221> misc_feature
<222> (337)..(337)
<223> Xaa can be any naturally occurring amino acid
<400> 79
Met Asp Ala Ser Ser Thr Pro Gly Ala Ile Trp Val Val Leu Thr Val
1 5 10 15
Ile Leu Ala Ala Ile Pro Ile Trp Ala Cys His Met Val Asn Thr Leu
20 25 30
Trp Leu Arg Pro Lys Arg Leu Glu Arg His Leu Arg Ala Gln Gly Leu
35 40 45
His Gly Asp Pro Tyr Lys Leu Ser Leu Asp Asn Ser Lys Gln Thr Tyr
50 55 60
Met Leu Lys Leu Gln Gln Glu Ala Gln Ser Lys Ser Ile Gly Leu Ser
65 70 75 80
Lys Asp Asp Ala Ala Pro Arg Ile Phe Ser Leu Ala His Gln Thr Val
85 90 95
His Lys Tyr Gly Lys Asn Ser Phe Ala Trp Glu Gly Thr Ala Pro Lys
100 105 110
Val Ile Ile Thr Asp Pro Glu Gln Ile Lys Glu Val Phe Asn Lys Ile
115 120 125
Gln Asp Phe Pro Lys Pro Lys Leu Asn Pro Ile Ala Lys Tyr Ile Ser
130 135 140
Ile Gly Leu Ile Gln Tyr Glu Gly Asp Lys Trp Ala Lys His Arg Lys
145 150 155 160
Ile Ile Asn Pro Ala Phe His Leu Glu Lys Leu Lys Gly Met Leu Pro
165 170 175
Ala Phe Ser His Ser Cys His Glu Met Ile Ser Lys Trp Lys Gly Leu
180 185 190
Leu Ser Ser Asp Gly Thr Cys Glu Val Asp Val Trp Pro Phe Leu Gln
195 200 205
Asn Leu Thr Cys Asp Val Ile Ser Arg Thr Ala Phe Gly Ser Ser Tyr
210 215 220
Ala Glu Gly Ala Lys Ile Phe Glu Leu Leu Lys Arg Gln Gly Tyr Ala
225 230 235 240
Leu Met Thr Ala Arg Tyr Ala Arg Ile Pro Leu Trp Trp Leu Leu Pro
245 250 255
Ser Thr Thr Lys Arg Arg Met Lys Glu Ile Glu Arg Gly Ile Arg Asp
260 265 270
Ser Leu Glu Gly Ile Ile Arg Lys Arg Glu Lys Ala Leu Lys Ser Gly
275 280 285
Lys Ser Thr Asp Asp Asp Leu Leu Gly Ile Leu Leu Gln Ser Asn His
290 295 300
Ile Glu Asn Lys Gly Asp Glu Asn Ser Lys Ser Ala Gly Met Thr Thr
305 310 315 320
Gln Glu Val Met Glu Glu Cys Lys Leu Phe Tyr Leu Ala Gly Gln Glu
325 330 335
Xaa Glu Asn Lys Gly Asp Glu Asn Ser Lys Ser Ala Gly Met Thr Thr
340 345 350
Gln Glu Val Met Glu Glu Cys Lys Leu Phe Tyr Leu Ala Gly Gln Glu
355 360 365
Thr Thr Ala Ala Leu Leu Ala Trp Thr Met Val Leu Leu Gly Lys His
370 375 380
Pro Glu Trp Gln Ala Arg Ala Arg Gln Glu Val Leu Gln Val Thr Met
385 390 395 400
Ile Leu Tyr Glu Val Leu Arg Leu Tyr Pro Pro Gly Ile Tyr Leu Thr
405 410 415
Arg Ala Leu Arg Lys Asp Leu Lys Leu Gly Asn Leu Leu Leu Pro Ala
420 425 430
Gly Val Gln Val Ser Val Pro Ile Leu Leu Ile His His Asp Glu Gly
435 440 445
Ile Trp Gly Asn Asp Ala Lys Glu Phe Asn Pro Glu Arg Phe Ala Glu
450 455 460
Gly Ile Ala Lys Ala Thr Lys Gly Gln Val Cys Tyr Phe Pro Phe Gly
465 470 475 480
Trp Gly Pro Arg Ile Cys Val Gly Gln Asn Phe Ala Leu Leu Glu Ala
485 490 495
Lys Ile Val Leu Ser Leu Leu Leu Gln Asn Phe Ser Phe Glu Leu Ser
500 505 510
Pro Thr Tyr Ala His Val Pro Thr Thr Val Leu Thr Leu Gln Pro Lys
515 520 525
His Gly Ala Pro Ile Ile Leu His Lys Leu
530 535
<210> 80
<211> 2088
<212> DNA
<213> Glycyrrhiza uralensis
<400> 80
atggcaagct tcacccttca cacagaaacc gttcagtcat ggctactcct cagcagactt 60
cacatactgc tgcacctcgc agttgtactg ctcctcttat actaccgcat cacacgtttc 120
cccttccatg ctccsactct accgtggact ctgatgaccg taggtgaggc tattatggca 180
gtgctgtggt tcttcaacca ggccttccgg tggcggccgg tgagccgctc ggtgatgacg 240
gagaagctgc ccagcgacgc gaagctgccg gggcttgaca tattcgtgtg cacgcttgac 300
cccgagaagg agcccaccgt ggaggtgatg aacactctgg tctctgccct tgccatggac 360
tacccccctg acaagctctc cgtttacctc tccgacgatg gcgccgcccc ggtcactctt 420
tacggcgtga gagaggcttc tgagttcgcg agggtgtggg tccctttctg caaaaagtat 480
gggatcaagt caaggtgtcc caaggttttc ttctctccca gtgctgagga tgaacacctt 540
cttcgcaccg acgagttcag gtcagagcga gacctcatca aggctaaata cgagaaaatg 600
cagaaaaata ttgagaaatt tggttcggat gccaaaaatt gtcgtatggt gactgacaga 660
cctcctcgga tcgagatatt gattgaccaa ccagacatgc cacgtgttgt ttacgtgtct 720
cgggaaagaa ggccatcact ccctcacaag ttcaaaggag gagccctcaa tacattgctc 780
agagtctcag gtctaatcag caatgggcct tatgtacttg tagtggactg tgatatgtat 840
tgcaatgacc catcctcagc caaacaagcc atgtgtttct ttcttgatcc tgaaacctct 900
aaatytattg catttgtcca attccctcaa atgtttcaca accttggcaa aaaagacatc 960
tatgacaatc aatctaggac tgcttttaag acaatgtggc aagggatgga tggactaaga 1020
ggtcctggtc tttctggcag cggtaattac ttgaatagaa gtgcattact atttggaagt 1080
ccaaatcaaa aagatgacta tctggatgat gcccaaaact acttrggcaa gtctaccatg 1140
tacatagaat cactaaaggc cattcgtgga caaaaaacta tgaaaaagaa tatttcaaga 1200
gatgaaattt tacgagaagc tcaagtatta gcctcttgtt cctatgagac aaacacagaa 1260
tggggagcag aggtaggatt ctcatatggc atcttactgg agagttcaat cactggctat 1320
cttttycact gcagaggatg gaaatcagca tatctttacc caaagacacc atgtttctta 1380
gggtgtgccc caactgacat caaggaagga atgctccaat tggtgaagtg gttgtctgaa 1440
tactgcttgc trggattctc taaatacagc cctttcactt atggcttttc aagaatgccc 1500
attatgccta ccttagtcta ttgcttcttg acaacwacaa ccctttattc cattgtcttc 1560
atcctttatg gcattgtccc ccaagtttgc ttcttaaaag gaatacccgt gtttccaaag 1620
gtcacagacc cttggtttgc agtgtttgca acactgtata tatccaccca gattcaacat 1680
ttgatagagg tcctttctgg tgatggctct gtggcaatgt ggtgggatga acagkgaatc 1740
tggattctga agtcagtcac tagcgtgttc gcaatcatag aggcagctaa gaaagggtta 1800
ggattgaaca agaagaaatt catgttgtca aacaaagcaa ttgacaagga gaagctcaag 1860
aagtatgagc aaggtaggtt tgatttccaa ggtgcagctc tgttcatgtc cccaatggtt 1920
gtgttgctca tagtgaacgt tgtttccttc attggtggca tatggagact attcaatgca 1980
aaggatattg aagatatgtt tggtcagctt ttcctagtta gttatgtaat ggcccttagt 2040
tatcccattt ttgaagggat aataaccatg aaaagcaaga gtggatag 2088
<210> 81
<211> 695
<212> PRT
<213> Glycyrrhiza uralensis
<220>
<221> misc_feature
<222> (302)..(302)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (375)..(375)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (442)..(442)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (579)..(579)
<223> Xaa can be any naturally occurring amino acid
<400> 81
Met Ala Ser Phe Thr Leu His Thr Glu Thr Val Gln Ser Trp Leu Leu
1 5 10 15
Leu Ser Arg Leu His Ile Leu Leu His Leu Ala Val Val Leu Leu Leu
20 25 30
Leu Tyr Tyr Arg Ile Thr Arg Phe Pro Phe His Ala Pro Thr Leu Pro
35 40 45
Trp Thr Leu Met Thr Val Gly Glu Ala Ile Met Ala Val Leu Trp Phe
50 55 60
Phe Asn Gln Ala Phe Arg Trp Arg Pro Val Ser Arg Ser Val Met Thr
65 70 75 80
Glu Lys Leu Pro Ser Asp Ala Lys Leu Pro Gly Leu Asp Ile Phe Val
85 90 95
Cys Thr Leu Asp Pro Glu Lys Glu Pro Thr Val Glu Val Met Asn Thr
100 105 110
Leu Val Ser Ala Leu Ala Met Asp Tyr Pro Pro Asp Lys Leu Ser Val
115 120 125
Tyr Leu Ser Asp Asp Gly Ala Ala Pro Val Thr Leu Tyr Gly Val Arg
130 135 140
Glu Ala Ser Glu Phe Ala Arg Val Trp Val Pro Phe Cys Lys Lys Tyr
145 150 155 160
Gly Ile Lys Ser Arg Cys Pro Lys Val Phe Phe Ser Pro Ser Ala Glu
165 170 175
Asp Glu His Leu Leu Arg Thr Asp Glu Phe Arg Ser Glu Arg Asp Leu
180 185 190
Ile Lys Ala Lys Tyr Glu Lys Met Gln Lys Asn Ile Glu Lys Phe Gly
195 200 205
Ser Asp Ala Lys Asn Cys Arg Met Val Thr Asp Arg Pro Pro Arg Ile
210 215 220
Glu Ile Leu Ile Asp Gln Pro Asp Met Pro Arg Val Val Tyr Val Ser
225 230 235 240
Arg Glu Arg Arg Pro Ser Leu Pro His Lys Phe Lys Gly Gly Ala Leu
245 250 255
Asn Thr Leu Leu Arg Val Ser Gly Leu Ile Ser Asn Gly Pro Tyr Val
260 265 270
Leu Val Val Asp Cys Asp Met Tyr Cys Asn Asp Pro Ser Ser Ala Lys
275 280 285
Gln Ala Met Cys Phe Phe Leu Asp Pro Glu Thr Ser Lys Xaa Ile Ala
290 295 300
Phe Val Gln Phe Pro Gln Met Phe His Asn Leu Gly Lys Lys Asp Ile
305 310 315 320
Tyr Asp Asn Gln Ser Arg Thr Ala Phe Lys Thr Met Trp Gln Gly Met
325 330 335
Asp Gly Leu Arg Gly Pro Gly Leu Ser Gly Ser Gly Asn Tyr Leu Asn
340 345 350
Arg Ser Ala Leu Leu Phe Gly Ser Pro Asn Gln Lys Asp Asp Tyr Leu
355 360 365
Asp Asp Ala Gln Asn Tyr Xaa Gly Lys Ser Thr Met Tyr Ile Glu Ser
370 375 380
Leu Lys Ala Ile Arg Gly Gln Lys Thr Met Lys Lys Asn Ile Ser Arg
385 390 395 400
Asp Glu Ile Leu Arg Glu Ala Gln Val Leu Ala Ser Cys Ser Tyr Glu
405 410 415
Thr Asn Thr Glu Trp Gly Ala Glu Val Gly Phe Ser Tyr Gly Ile Leu
420 425 430
Leu Glu Ser Ser Ile Thr Gly Tyr Leu Xaa His Cys Arg Gly Trp Lys
435 440 445
Ser Ala Tyr Leu Tyr Pro Lys Thr Pro Cys Phe Leu Gly Cys Ala Pro
450 455 460
Thr Asp Ile Lys Glu Gly Met Leu Gln Leu Val Lys Trp Leu Ser Glu
465 470 475 480
Tyr Cys Leu Leu Gly Phe Ser Lys Tyr Ser Pro Phe Thr Tyr Gly Phe
485 490 495
Ser Arg Met Pro Ile Met Pro Thr Leu Val Tyr Cys Phe Leu Thr Thr
500 505 510
Thr Thr Leu Tyr Ser Ile Val Phe Ile Leu Tyr Gly Ile Val Pro Gln
515 520 525
Val Cys Phe Leu Lys Gly Ile Pro Val Phe Pro Lys Val Thr Asp Pro
530 535 540
Trp Phe Ala Val Phe Ala Thr Leu Tyr Ile Ser Thr Gln Ile Gln His
545 550 555 560
Leu Ile Glu Val Leu Ser Gly Asp Gly Ser Val Ala Met Trp Trp Asp
565 570 575
Glu Gln Xaa Ile Trp Ile Leu Lys Ser Val Thr Ser Val Phe Ala Ile
580 585 590
Ile Glu Ala Ala Lys Lys Gly Leu Gly Leu Asn Lys Lys Lys Phe Met
595 600 605
Leu Ser Asn Lys Ala Ile Asp Lys Glu Lys Leu Lys Lys Tyr Glu Gln
610 615 620
Gly Arg Phe Asp Phe Gln Gly Ala Ala Leu Phe Met Ser Pro Met Val
625 630 635 640
Val Leu Leu Ile Val Asn Val Val Ser Phe Ile Gly Gly Ile Trp Arg
645 650 655
Leu Phe Asn Ala Lys Asp Ile Glu Asp Met Phe Gly Gln Leu Phe Leu
660 665 670
Val Ser Tyr Val Met Ala Leu Ser Tyr Pro Ile Phe Glu Gly Ile Ile
675 680 685
Thr Met Lys Ser Lys Ser Gly
690 695
<210> 82
<211> 1445
<212> DNA
<213> Glycyrrhiza uralensis
<400> 82
atgaccatgg gtaacgagaa tcgggagctg cacataatct tcttcccctt tctggcgaac 60
ggccacatca tcccctgcgt ggacttggcc agagtcttcg ccgcaagagg aatcagagcc 120
accatagtca ccacccacct caacgttccc tacatttcca gaaccatcgg aaaagccaac 180
atcaacatca gaaccatcaa gttcccttcc accgaagact ctggccttcc cgaaggctgc 240
gagaataccg agtcagcact cgcccctgac aagttcatca agttcatgaa ggccaccctg 300
ctcctgaggg acccacttga acacgtgtta caggaagagc aaccacactc ttggtcgccg 360
acatgttctt cccttgggcc accgactccg ccgcaaaatt cggcatccct aggatcgtgt 420
tccacggcct cggttacttc ccactctgcg ttcttgcatg cacgagacag tacaagcctc 480
aggacaaggt ttcatcttac acggaaccct tcgtggttcc gaatctcccg ggtgaaataa 540
cactgacgaa gatgcagctg ccgcagttgc ctcagcacga caaggtcttc acccagttgt 600
tggaagagtc aaacgaatcg gagttgaaga gcttcggtgt gattgtaaac agcttctacg 660
aacttgaacc ggtttacgcg gatcattaca ggaacgagct tgggagaaga gcttggcatt 720
tgggtccggt ttcattatgc agtagggaca cggaggaaaa atcgcggagg ggaagggaag 780
ctgcaattga tgagaacgag tgcttgaagt ggcttcaatc aaaggaaccc aattcggttg 840
tttatgtttg tttcggtagc atgatggttt tcagtgacgc tcagctaaaa gagattgcga 900
tgggtcttga ggcttcaggg aagccattca tatgggtggt gaagaaagga ggggctaaaa 960
gtgaaggtga gaaattggag tggcttccag aagggtttga ggagagaatg ggggaaagta 1020
ataagggact aatcataagg ggttgggcac cacaggtgat gattttggac catggagcgg 1080
ttggagggtt tgtgacacat tgtgggtgga attcaacgct ggaaggagtg tgtgcagggg 1140
tgccaatggt gacttggccc atgtatgggg aacaatttta caacgccaag tttctgacgg 1200
acatagtgaa aattggggtg ggtgttgggg ttcaaacgtg gattgggatg ggaggaggag 1260
agcctgtgaa gaaggaagtg atagagcagg cagtgagaag gataatggtg gggcaggaag 1320
cagaggaaat gagaaacaga gccaaggaac tgagccagat ggcaaagcgt gctgtggagg 1380
aaggaggatc gtctcacaac gattttaact ctttaattga ggatttgagg tcgcgtgccc 1440
attaa 1445
<210> 83
<211> 481
<212> PRT
<213> Glycyrrhiza uralensis
<400> 83
Met Thr Met Gly Asn Glu Asn Arg Glu Leu His Ile Ile Phe Phe Pro
1 5 10 15
Phe Leu Ala Asn Gly His Ile Ile Pro Cys Val Asp Leu Ala Arg Val
20 25 30
Phe Ala Ala Arg Gly Ile Arg Ala Thr Ile Val Thr Thr His Leu Asn
35 40 45
Val Pro Tyr Ile Ser Arg Thr Ile Gly Lys Ala Asn Ile Asn Ile Arg
50 55 60
Thr Ile Lys Phe Pro Ser Thr Glu Asp Ser Gly Leu Pro Glu Gly Cys
65 70 75 80
Glu Asn Thr Glu Ser Ala Leu Ala Pro Asp Lys Phe Ile Lys Phe Met
85 90 95
Lys Ala Thr Leu Leu Leu Arg Asp Pro Leu Glu His Val Leu Gln Glu
100 105 110
Glu Gln Pro His Cys Leu Val Ala Asp Met Phe Phe Pro Trp Ala Thr
115 120 125
Asp Ser Ala Ala Lys Phe Gly Ile Pro Arg Ile Val Phe His Gly Leu
130 135 140
Gly Tyr Phe Pro Leu Cys Val Leu Ala Cys Thr Arg Gln Tyr Lys Pro
145 150 155 160
Gln Asp Lys Val Ser Ser Tyr Thr Glu Pro Phe Val Val Pro Asn Leu
165 170 175
Pro Gly Glu Ile Thr Leu Thr Lys Met Gln Leu Pro Gln Leu Pro Gln
180 185 190
His Asp Lys Val Phe Thr Gln Leu Leu Glu Glu Ser Asn Glu Ser Glu
195 200 205
Leu Lys Ser Phe Gly Val Ile Val Asn Ser Phe Tyr Glu Leu Glu Pro
210 215 220
Val Tyr Ala Asp His Tyr Arg Asn Glu Leu Gly Arg Arg Ala Trp His
225 230 235 240
Leu Gly Pro Val Ser Leu Cys Ser Arg Asp Thr Glu Glu Lys Ser Arg
245 250 255
Arg Gly Arg Glu Ala Ala Ile Asp Glu Asn Glu Cys Leu Lys Trp Leu
260 265 270
Gln Ser Lys Glu Pro Asn Ser Val Val Tyr Val Cys Phe Gly Ser Met
275 280 285
Met Val Phe Ser Asp Ala Gln Leu Lys Glu Ile Ala Met Gly Leu Glu
290 295 300
Ala Ser Gly Lys Pro Phe Ile Trp Val Val Lys Lys Gly Gly Ala Lys
305 310 315 320
Ser Glu Gly Glu Lys Leu Glu Trp Leu Pro Glu Gly Phe Glu Glu Arg
325 330 335
Met Gly Glu Ser Asn Lys Gly Leu Ile Ile Arg Gly Trp Ala Pro Gln
340 345 350
Val Met Ile Leu Asp His Gly Ala Val Gly Gly Phe Val Thr His Cys
355 360 365
Gly Trp Asn Ser Thr Leu Glu Gly Val Cys Ala Gly Val Pro Met Val
370 375 380
Thr Trp Pro Met Tyr Gly Glu Gln Phe Tyr Asn Ala Lys Phe Leu Thr
385 390 395 400
Asp Ile Val Lys Ile Gly Val Gly Val Gly Val Gln Thr Trp Ile Gly
405 410 415
Met Gly Gly Gly Glu Pro Val Lys Lys Glu Val Ile Glu Gln Ala Val
420 425 430
Arg Arg Ile Met Val Gly Gln Glu Ala Glu Glu Met Arg Asn Arg Ala
435 440 445
Lys Glu Leu Ser Gln Met Ala Lys Arg Ala Val Glu Glu Gly Gly Ser
450 455 460
Ser His Asn Asp Phe Asn Ser Leu Ile Glu Asp Leu Arg Ser Arg Ala
465 470 475 480
His
<210> 84
<211> 1521
<212> DNA
<213> Glycyrrhiza uralensis
<400> 84
atggactcct ttggggttga aggtgatcac caagccgaca ccacagtgct gaaggcggtt 60
tttcttccct tcatctcaaa aagtcatctc atccgtgagg tggacaaagc aaggatcttc 120
gccatgcacg gcgtggatgt caccatcatc accacgccgg ccaacgctgc cactttccaa 180
acctccattg accgcgactc cagccgcggc cgctccatca gaacgcacat cgttccgttc 240
ccccaagtcc ccggtctacc acagggactc gagagactcg acgccgacac tcctcaacac 300
ttgctctcca agatctacca tggactatcc attctgcaag agcagttcca acaactgttc 360
cgtgaaatga ggccagattt catagtcact gacatgtact acccttggag cgtcgatgcc 420
gccgccgagt tggggattcc gaggttggtt tgtaacggtg gaagctactt cgctcagtca 480
gctgttaact ccgttgagct attttcacca caagccaagg ttgattcaaa taccgagact 540
tttctgcttc ctgggttacc ccatgaggtt gagatgacac gtttgcaact accggattgg 600
cttagaggag caccgaatga gtacacctat ttgatgaaga tgatcaagga ttcagagagg 660
aagagttatg ggtcattgtt caatagcttt tatgagcttg aagggactta tgaggaacat 720
tacaagaaag ccatgggaac caagagttgg agtgtggggc cagtttcttt gtgggtgaac 780
caagatgctt ctgataaggc ttgtaggggg gatgttaaag aaggaaaagg agatggggtg 840
gtgcttactt ggctggattc taaaacagag gactctgttt tgtatgtgag ttttgggagc 900
atgaacaagt tccctaaaac tcagcttgtt gagatagctc atgccctcga agattctggc 960
catgatttca tttgggtcgt tggcaaaatt gaagaaggtg aaggtggtgc tgattttttg 1020
agggaatttg agaagaaagt gaaagaaaaa aacagaggtt atctgatatg gggttgggca 1080
ccacagcttc tgattctgga gcatcctgcg gttggagcag tggtgactca ttgtgggtgg 1140
aacaccgtta tggaaagtgt gaatgcaagt ttgccattgg caacttggcc attgtttgcg 1200
gagcagttct tcaatgagaa gctagtggtt gatgtggtga agattggtgt gccagttggg 1260
gttaaggaat ggagaaattg gaatgagttt ggggatgagg ttgtgaagag ggaggacata 1320
ggaaaggcca ttgctttttt gatgggtggt ggggatgaat ccttggaaat gaggaagagg 1380
gtcaaggtgc tcagtggtgc tacaaagaaa gctattcagg ttggtgggtc ttctcacacc 1440
aagttgaaag aactcataga agagctcaag tcaatcaagc tacaaaaggt caacaacaaa 1500
ttaatggagg cagtggctta a 1521
<210> 85
<211> 506
<212> PRT
<213> Glycyrrhiza uralensis
<400> 85
Met Asp Ser Phe Gly Val Glu Gly Asp His Gln Ala Asp Thr Thr Val
1 5 10 15
Leu Lys Ala Val Phe Leu Pro Phe Ile Ser Lys Ser His Leu Ile Arg
20 25 30
Glu Val Asp Lys Ala Arg Ile Phe Ala Met His Gly Val Asp Val Thr
35 40 45
Ile Ile Thr Thr Pro Ala Asn Ala Ala Thr Phe Gln Thr Ser Ile Asp
50 55 60
Arg Asp Ser Ser Arg Gly Arg Ser Ile Arg Thr His Ile Val Pro Phe
65 70 75 80
Pro Gln Val Pro Gly Leu Pro Gln Gly Leu Glu Arg Leu Asp Ala Asp
85 90 95
Thr Pro Gln His Leu Leu Ser Lys Ile Tyr His Gly Leu Ser Ile Leu
100 105 110
Gln Glu Gln Phe Gln Gln Leu Phe Arg Glu Met Arg Pro Asp Phe Ile
115 120 125
Val Thr Asp Met Tyr Tyr Pro Trp Ser Val Asp Ala Ala Ala Glu Leu
130 135 140
Gly Ile Pro Arg Leu Val Cys Asn Gly Gly Ser Tyr Phe Ala Gln Ser
145 150 155 160
Ala Val Asn Ser Val Glu Leu Phe Ser Pro Gln Ala Lys Val Asp Ser
165 170 175
Asn Thr Glu Thr Phe Leu Leu Pro Gly Leu Pro His Glu Val Glu Met
180 185 190
Thr Arg Leu Gln Leu Pro Asp Trp Leu Arg Gly Ala Pro Asn Glu Tyr
195 200 205
Thr Tyr Leu Met Lys Met Ile Lys Asp Ser Glu Arg Lys Ser Tyr Gly
210 215 220
Ser Leu Phe Asn Ser Phe Tyr Glu Leu Glu Gly Thr Tyr Glu Glu His
225 230 235 240
Tyr Lys Lys Ala Met Gly Thr Lys Ser Trp Ser Val Gly Pro Val Ser
245 250 255
Leu Trp Val Asn Gln Asp Ala Ser Asp Lys Ala Cys Arg Gly Asp Val
260 265 270
Lys Glu Gly Lys Gly Asp Gly Val Val Leu Thr Trp Leu Asp Ser Lys
275 280 285
Thr Glu Asp Ser Val Leu Tyr Val Ser Phe Gly Ser Met Asn Lys Phe
290 295 300
Pro Lys Thr Gln Leu Val Glu Ile Ala His Ala Leu Glu Asp Ser Gly
305 310 315 320
His Asp Phe Ile Trp Val Val Gly Lys Ile Glu Glu Gly Glu Gly Gly
325 330 335
Ala Asp Phe Leu Arg Glu Phe Glu Lys Lys Val Lys Glu Lys Asn Arg
340 345 350
Gly Tyr Leu Ile Trp Gly Trp Ala Pro Gln Leu Leu Ile Leu Glu His
355 360 365
Pro Ala Val Gly Ala Val Val Thr His Cys Gly Trp Asn Thr Val Met
370 375 380
Glu Ser Val Asn Ala Ser Leu Pro Leu Ala Thr Trp Pro Leu Phe Ala
385 390 395 400
Glu Gln Phe Phe Asn Glu Lys Leu Val Val Asp Val Val Lys Ile Gly
405 410 415
Val Pro Val Gly Val Lys Glu Trp Arg Asn Trp Asn Glu Phe Gly Asp
420 425 430
Glu Val Val Lys Arg Glu Asp Ile Gly Lys Ala Ile Ala Phe Leu Met
435 440 445
Gly Gly Gly Asp Glu Ser Leu Glu Met Arg Lys Arg Val Lys Val Leu
450 455 460
Ser Gly Ala Thr Lys Lys Ala Ile Gln Val Gly Gly Ser Ser His Thr
465 470 475 480
Lys Leu Lys Glu Leu Ile Glu Glu Leu Lys Ser Ile Lys Leu Gln Lys
485 490 495
Val Asn Asn Lys Leu Met Glu Ala Val Ala
500 505
<210> 86
<211> 1563
<212> DNA
<213> Arabodopsis thaliana
<400> 86
atgtctctat ttctgaagcc cttcctcttc ctatacgaca ccactcttag tcttctctta 60
cttctgttca atggatggag tcttgaggat acagcagcag cccaaaagag gcgtgaagca 120
gacaaaaatg ctgcagaaac tgaatggatc caactccaat acttgtggac caaaacaagg 180
agtgttgtac tacttcccgt tttcaagggt ttggtggtta tgtgtttggt tctatccatt 240
atagtgttct tcgagagttt ttacatgaac tttgtgatac tcttcgtcaa gttatttaaa 300
cgtaaacccc ataaagtgta caaatgggag gccatgcaag aagatgttga ggttggaccc 360
gataactacc caatggttct tatccaaata ccaatgtaca atgaaaaaga ggaaggtgtg 420
gacgtagaga ttgcaaaatg gcaaagccaa ggcataaaca taaggtgtga aaggagagat 480
aacaggaacg gctacaaagc cggagctatg aaagaagctc ttacgcagag ctacgtcaag 540
caatgcgact tcgtagcagt cttcgatgct gatttccaac ccgagcccga ttatctcatc 600
cgcgctgtcc ctttccttgt ccacaaccct gacgttgctc tagttcaagc ccgatggata 660
tttgttaacg cgaacaaatg cttgatgacg aggatgcaag agatgtctct caactatcat 720
ttcaaagtgg aacaagaatc agggtcgact agacatgctt tcttcgggtt taatggaacc 780
gcgggtgtat ggagaatatc ggcaatggaa gcagcaggag gatggaaatc aaggaccaca 840
gtagaggaca tggacttggc tgttcgtgtt ggtcttcatg gctggaaatt tgtctacctt 900
aacgacctca cggtgagaaa cgagcttcca agcaaattta aggcctacag attccagcaa 960
cataggtggt cctgtggacc ggcgaatcta tttagaaaaa tgacgatgga gatcattttc 1020
aataagagag tatcaatttg gaagaagttt tatgtgatct acagcttttt cttcgtaagg 1080
aaagtggcgg tacacttctt gacattcttc ttctactgta taattgtgcc aacaagtgtc 1140
ttcttccctg aaatccacat cccatcttgg tctaccattt acgttccctc tttgatcagt 1200
atcttccaca ccctggcaac tccaagatcc ttctacctcg tgatattttg ggtcttgttc 1260
gagaatgtaa tggctatgca tcgaaccaaa ggtacgtgca ttggcctact tgaaggagga 1320
agagtaaacg aatgggttgt gaccgaaaaa ctaggagatg ctttgaagag taagctactc 1380
tctcgggtag tccaaagaaa atcttgttat caaagagtga attccaagga agtgatggtg 1440
ggggtataca tattaggatg tgcactctat ggcctgatct atgggcacac atggttacat 1500
ttctatcttt ttcttcaggc cacagccttt ttcgtctccg gttttggttt tgtcggaacc 1560
taa 1563
<210> 87
<211> 520
<212> PRT
<213> Arabodopsis thaliana
<400> 87
Met Ser Leu Phe Leu Lys Pro Phe Leu Phe Leu Tyr Asp Thr Thr Leu
1 5 10 15
Ser Leu Leu Leu Leu Leu Phe Asn Gly Trp Ser Leu Glu Asp Thr Ala
20 25 30
Ala Ala Gln Lys Arg Arg Glu Ala Asp Lys Asn Ala Ala Glu Thr Glu
35 40 45
Trp Ile Gln Leu Gln Tyr Leu Trp Thr Lys Thr Arg Ser Val Val Leu
50 55 60
Leu Pro Val Phe Lys Gly Leu Val Val Met Cys Leu Val Leu Ser Ile
65 70 75 80
Ile Val Phe Phe Glu Ser Phe Tyr Met Asn Phe Val Ile Leu Phe Val
85 90 95
Lys Leu Phe Lys Arg Lys Pro His Lys Val Tyr Lys Trp Glu Ala Met
100 105 110
Gln Glu Asp Val Glu Val Gly Pro Asp Asn Tyr Pro Met Val Leu Ile
115 120 125
Gln Ile Pro Met Tyr Asn Glu Lys Glu Glu Gly Val Asp Val Glu Ile
130 135 140
Ala Lys Trp Gln Ser Gln Gly Ile Asn Ile Arg Cys Glu Arg Arg Asp
145 150 155 160
Asn Arg Asn Gly Tyr Lys Ala Gly Ala Met Lys Glu Ala Leu Thr Gln
165 170 175
Ser Tyr Val Lys Gln Cys Asp Phe Val Ala Val Phe Asp Ala Asp Phe
180 185 190
Gln Pro Glu Pro Asp Tyr Leu Ile Arg Ala Val Pro Phe Leu Val His
195 200 205
Asn Pro Asp Val Ala Leu Val Gln Ala Arg Trp Ile Phe Val Asn Ala
210 215 220
Asn Lys Cys Leu Met Thr Arg Met Gln Glu Met Ser Leu Asn Tyr His
225 230 235 240
Phe Lys Val Glu Gln Glu Ser Gly Ser Thr Arg His Ala Phe Phe Gly
245 250 255
Phe Asn Gly Thr Ala Gly Val Trp Arg Ile Ser Ala Met Glu Ala Ala
260 265 270
Gly Gly Trp Lys Ser Arg Thr Thr Val Glu Asp Met Asp Leu Ala Val
275 280 285
Arg Val Gly Leu His Gly Trp Lys Phe Val Tyr Leu Asn Asp Leu Thr
290 295 300
Val Arg Asn Glu Leu Pro Ser Lys Phe Lys Ala Tyr Arg Phe Gln Gln
305 310 315 320
His Arg Trp Ser Cys Gly Pro Ala Asn Leu Phe Arg Lys Met Thr Met
325 330 335
Glu Ile Ile Phe Asn Lys Arg Val Ser Ile Trp Lys Lys Phe Tyr Val
340 345 350
Ile Tyr Ser Phe Phe Phe Val Arg Lys Val Ala Val His Phe Leu Thr
355 360 365
Phe Phe Phe Tyr Cys Ile Ile Val Pro Thr Ser Val Phe Phe Pro Glu
370 375 380
Ile His Ile Pro Ser Trp Ser Thr Ile Tyr Val Pro Ser Leu Ile Ser
385 390 395 400
Ile Phe His Thr Leu Ala Thr Pro Arg Ser Phe Tyr Leu Val Ile Phe
405 410 415
Trp Val Leu Phe Glu Asn Val Met Ala Met His Arg Thr Lys Gly Thr
420 425 430
Cys Ile Gly Leu Leu Glu Gly Gly Arg Val Asn Glu Trp Val Val Thr
435 440 445
Glu Lys Leu Gly Asp Ala Leu Lys Ser Lys Leu Leu Ser Arg Val Val
450 455 460
Gln Arg Lys Ser Cys Tyr Gln Arg Val Asn Ser Lys Glu Val Met Val
465 470 475 480
Gly Val Tyr Ile Leu Gly Cys Ala Leu Tyr Gly Leu Ile Tyr Gly His
485 490 495
Thr Trp Leu His Phe Tyr Leu Phe Leu Gln Ala Thr Ala Phe Phe Val
500 505 510
Ser Gly Phe Gly Phe Val Gly Thr
515 520
<210> 88
<211> 2274
<212> DNA
<213> Arabodopsis thaliana
<400> 88
atggcggatt caagcttttc tcttcctcct ctttgtgaaa ggatctcata cacgaactat 60
tttctaagag ctgtatatct cacggttcta ggccttttct tttctcttct cttgcaccga 120
atccgacata cgagcgaata cgacaacgtt tggctcgtgg ctttcttttg tgaatcttgt 180
ttcttcttgg tatgtctgct tattacttgc ctaaaatgga gtcctgctga tactaaaccc 240
tttcctgata gacttgatga aagggttcat gaccttcctt cggtggatat gttcgtgccc 300
acagcagatc cggttcgaga gccaccgatt atggttgtgg acaccgtgct ttcgctgtta 360
gctgtaaatt atccggcaaa taaactagct tgttatgtgt cggacgatgg atgctcacct 420
ctcacttatt tctctctcaa ggaagcttct aagttcgcca agatttgggt accgttctgc 480
aaaaagtaca acactagagt tagagctcct tctagatatt ttctgaaacc tataagcgtc 540
gcaacagagg attatgaatt caatagagac tgggaaaaga cgaagaggga gtacgagaag 600
ttgaggcgga aagtggaaga tgccaccgga gattctcata tgttggatgt agaagatgat 660
tttgaagcat tctcaaacac aaaaccaaat gatcattcaa ctctagttaa ggtggtatgg 720
gagaacaagg gaggtgtagg agacgagaaa gagatccctc atatcatata catatcaaga 780
gagaaaagac caaattatgt tcataatcaa aaatgtggag ccatgaactt tctggcaaga 840
gtgtcagggt tgatgacaaa cgcaccatac atcttgaacg tggattgcga catgtatgcc 900
aatgatgcag atgtagtccg acaagcaatg tgtatacttc tgcaagaatc attaaatatg 960
aaacattgtg cttttgttca attccgtcaa gaattctatg attcaagcac cgagctaata 1020
gtcgtcctac aatcacattt gggacgagga atcgcgggaa tccaaggacc gatatatata 1080
ggatcaggat gcgtccacac gagaagagtt atgtatggtt tatctccaga cgatttcgaa 1140
gttgatggaa gtctttcttc agttgctaca agggagtttt tggttaagga tagtttagcg 1200
agaagatttg gtaattctaa agagatgatg aaatcagtgg ttgatgcaat acaaagaaat 1260
ccaaatccac aaaatatact tacaaactcc atagaagcgg ctcgagaagt gggacattgt 1320
cagtacgagt accaaaccag ctggggaaac accatcggct ggttatatga ttcagtggcg 1380
gaagatttaa acacgagtat cggaatacat tcgagaggtt ggactagctc atacatttct 1440
ccggatacac ctgcatttct tggatctatg ccggcaggag tacccgaggc gttactccag 1500
cagcgtcgat gggcgacagg atggatcgaa atccttttca acaagcaaag tccgttgcga 1560
ggattgttta gcaagaaaat aagattccga caacgattag cttatctttg cattatcacc 1620
tgtctaaggt caatccctga gcttatttat tgtctccttc ctgcttattg cctactccac 1680
aactctacct tattccccaa gggactttat ttaggcataa ctgtcacact tgttgggata 1740
cattgtctct atactctatg ggaatttatg agccttggtt attccgtaca atcgtggcta 1800
gtctcccaat cagtttggag aatagtagcc actagtagtt ggttatttag catctttgat 1860
atcacactca agcttcttgg catctcggaa acggtgttca taatcactaa aaagactgtg 1920
gctgggacca agtcagcatt agggtctgga ccctctcaag gagaagacgt tggtccaaac 1980
tcagacttgt ttaaatttga atttgatggc tcactttgtt tcttgcctgg cacatttatt 2040
gtgttggtga atatagccgc tctagctgtt ttttctgtgg gtctacaacg gtcgagttac 2100
agccatgaag gaggtggttc gggtctggca gaggcttgcg gatgtgtttt ggtaatgatg 2160
ttgttccttc catttctaat gggtttgttt aagaaaggaa aatatggaac cccattgtct 2220
actctctcta tagctggctt tttagcagtt ttatttgttg ttttctctgt ttga 2274
<210> 89
<211> 757
<212> PRT
<213> Arabodopsis thaliana
<400> 89
Met Ala Asp Ser Ser Phe Ser Leu Pro Pro Leu Cys Glu Arg Ile Ser
1 5 10 15
Tyr Thr Asn Tyr Phe Leu Arg Ala Val Tyr Leu Thr Val Leu Gly Leu
20 25 30
Phe Phe Ser Leu Leu Leu His Arg Ile Arg His Thr Ser Glu Tyr Asp
35 40 45
Asn Val Trp Leu Val Ala Phe Phe Cys Glu Ser Cys Phe Phe Leu Val
50 55 60
Cys Leu Leu Ile Thr Cys Leu Lys Trp Ser Pro Ala Asp Thr Lys Pro
65 70 75 80
Phe Pro Asp Arg Leu Asp Glu Arg Val His Asp Leu Pro Ser Val Asp
85 90 95
Met Phe Val Pro Thr Ala Asp Pro Val Arg Glu Pro Pro Ile Met Val
100 105 110
Val Asp Thr Val Leu Ser Leu Leu Ala Val Asn Tyr Pro Ala Asn Lys
115 120 125
Leu Ala Cys Tyr Val Ser Asp Asp Gly Cys Ser Pro Leu Thr Tyr Phe
130 135 140
Ser Leu Lys Glu Ala Ser Lys Phe Ala Lys Ile Trp Val Pro Phe Cys
145 150 155 160
Lys Lys Tyr Asn Thr Arg Val Arg Ala Pro Ser Arg Tyr Phe Leu Lys
165 170 175
Pro Ile Ser Val Ala Thr Glu Asp Tyr Glu Phe Asn Arg Asp Trp Glu
180 185 190
Lys Thr Lys Arg Glu Tyr Glu Lys Leu Arg Arg Lys Val Glu Asp Ala
195 200 205
Thr Gly Asp Ser His Met Leu Asp Val Glu Asp Asp Phe Glu Ala Phe
210 215 220
Ser Asn Thr Lys Pro Asn Asp His Ser Thr Leu Val Lys Val Val Trp
225 230 235 240
Glu Asn Lys Gly Gly Val Gly Asp Glu Lys Glu Ile Pro His Ile Ile
245 250 255
Tyr Ile Ser Arg Glu Lys Arg Pro Asn Tyr Val His Asn Gln Lys Cys
260 265 270
Gly Ala Met Asn Phe Leu Ala Arg Val Ser Gly Leu Met Thr Asn Ala
275 280 285
Pro Tyr Ile Leu Asn Val Asp Cys Asp Met Tyr Ala Asn Asp Ala Asp
290 295 300
Val Val Arg Gln Ala Met Cys Ile Leu Leu Gln Glu Ser Leu Asn Met
305 310 315 320
Lys His Cys Ala Phe Val Gln Phe Arg Gln Glu Phe Tyr Asp Ser Ser
325 330 335
Thr Glu Leu Ile Val Val Leu Gln Ser His Leu Gly Arg Gly Ile Ala
340 345 350
Gly Ile Gln Gly Pro Ile Tyr Ile Gly Ser Gly Cys Val His Thr Arg
355 360 365
Arg Val Met Tyr Gly Leu Ser Pro Asp Asp Phe Glu Val Asp Gly Ser
370 375 380
Leu Ser Ser Val Ala Thr Arg Glu Phe Leu Val Lys Asp Ser Leu Ala
385 390 395 400
Arg Arg Phe Gly Asn Ser Lys Glu Met Met Lys Ser Val Val Asp Ala
405 410 415
Ile Gln Arg Asn Pro Asn Pro Gln Asn Ile Leu Thr Asn Ser Ile Glu
420 425 430
Ala Ala Arg Glu Val Gly His Cys Gln Tyr Glu Tyr Gln Thr Ser Trp
435 440 445
Gly Asn Thr Ile Gly Trp Leu Tyr Asp Ser Val Ala Glu Asp Leu Asn
450 455 460
Thr Ser Ile Gly Ile His Ser Arg Gly Trp Thr Ser Ser Tyr Ile Ser
465 470 475 480
Pro Asp Thr Pro Ala Phe Leu Gly Ser Met Pro Ala Gly Val Pro Glu
485 490 495
Ala Leu Leu Gln Gln Arg Arg Trp Ala Thr Gly Trp Ile Glu Ile Leu
500 505 510
Phe Asn Lys Gln Ser Pro Leu Arg Gly Leu Phe Ser Lys Lys Ile Arg
515 520 525
Phe Arg Gln Arg Leu Ala Tyr Leu Cys Ile Ile Thr Cys Leu Arg Ser
530 535 540
Ile Pro Glu Leu Ile Tyr Cys Leu Leu Pro Ala Tyr Cys Leu Leu His
545 550 555 560
Asn Ser Thr Leu Phe Pro Lys Gly Leu Tyr Leu Gly Ile Thr Val Thr
565 570 575
Leu Val Gly Ile His Cys Leu Tyr Thr Leu Trp Glu Phe Met Ser Leu
580 585 590
Gly Tyr Ser Val Gln Ser Trp Leu Val Ser Gln Ser Val Trp Arg Ile
595 600 605
Val Ala Thr Ser Ser Trp Leu Phe Ser Ile Phe Asp Ile Thr Leu Lys
610 615 620
Leu Leu Gly Ile Ser Glu Thr Val Phe Ile Ile Thr Lys Lys Thr Val
625 630 635 640
Ala Gly Thr Lys Ser Ala Leu Gly Ser Gly Pro Ser Gln Gly Glu Asp
645 650 655
Val Gly Pro Asn Ser Asp Leu Phe Lys Phe Glu Phe Asp Gly Ser Leu
660 665 670
Cys Phe Leu Pro Gly Thr Phe Ile Val Leu Val Asn Ile Ala Ala Leu
675 680 685
Ala Val Phe Ser Val Gly Leu Gln Arg Ser Ser Tyr Ser His Glu Gly
690 695 700
Gly Gly Ser Gly Leu Ala Glu Ala Cys Gly Cys Val Leu Val Met Met
705 710 715 720
Leu Phe Leu Pro Phe Leu Met Gly Leu Phe Lys Lys Gly Lys Tyr Gly
725 730 735
Thr Pro Leu Ser Thr Leu Ser Ile Ala Gly Phe Leu Ala Val Leu Phe
740 745 750
Val Val Phe Ser Val
755
<210> 90
<211> 2190
<212> DNA
<213> Arabodopsis thaliana
<400> 90
atggtaaaca aagacgaccg gattagaccg gttcatgaag ccgacggtga accgcttttt 60
gagactagga gaagaaccgg tagagtgatt gcgtaccggt ttttctcagc ctcggttttc 120
gtgtgtatct gtttgatttg gttctacaga attggtgaga ttggtgataa ccgtaccgtt 180
ttagatcgat taatctggtt tgttatgttt attgtggaga tttggttcgg tttatattgg 240
gtagtcacac aatcttcccg gtggaatccg gtttggcgat ttcccttctc cgatagactc 300
tctcggagat acggaagcga ccttccgagg ctcgacgtct tcgtttgcac ggcggatccg 360
gtgattgagc cgccgttgtt ggtggtaaac acagtcttat ctgtgacggc tcttgactac 420
ccaccggaga aactcgccgt ttatctctca gatgacggtg gttctgagct gacgttctat 480
gctctcacgg aggcagctga gtttgctaaa acttgggttc ccttctgcaa gaagttcaac 540
gttgagccaa catctcccgc tgcttacttg tcttccaagg caaactgtct tgattctgcg 600
gctgaggagg tggctaagct gtatagagaa atggcggcga ggattgaaac ggcggcgaga 660
ctgggacgaa taccggagga ggcgcgggtg aagtacggtg acgggttttc acagtgggat 720
gctgacgcta ctcgaagaaa ccatggaacc attcttcaag ttttggtaga tggaagagaa 780
gggaatacaa tagcaatacc aacgttggtg tatttatcaa gagaaaagag acctcaacat 840
catcataact tcaaggctgg agcaatgaac gcattgctga gggtttcttc gaaaattact 900
tgtgggaaaa tcatactaaa cttggactgt gatatgtacg caaacaactc aaagtcaaca 960
cgcgacgcgc tctgcatcct cctcgatgag aaagagggaa aagagattgc tttcgtgcag 1020
tttccgcagt gttttgacaa tgttacaaga aatgatttgt atggaagcat gatgcgagta 1080
ggaattgatg tggaatttct tggattggat ggaaatggtg gtccgttata cattggaact 1140
ggatgctttc acagaagaga tgtgatctgt ggaagaaagt atggagagga agaagaagaa 1200
gaagaatctg agagaattca cgaaaattta gagcctgaga tgattaaggc tctcgcgagc 1260
tgcacttatg aggaaaacac tcaatgggga aaggagatgg gtgtgaaata tggttgcccg 1320
gtagaggatg taataactgg tttgacgatt cagtgtcgcg gatggaaatc agcctacctg 1380
aacccggaaa agcaagcatt tctcggggta gcgccgacca atttgcatca aatgctagtg 1440
cagcagagga gatggtcaga gggagacttt cagattatgc tttcgaagta tagtccggtt 1500
tggtatggaa aaggaaagat cagtttagga ctgatacttg gttactgttg ctattgtctt 1560
tgggctccat cttcactacc tgtgctcatt tactctgttt tgacttctct ctgtctcttc 1620
aaaggcattc ctctgtttcc aaaggtctcg agctcgtggt ttattccgtt tggatacgtc 1680
actgttgcag ctaccgcata tagcctagcc gagttcttgt ggtgcggagg gacgttccgt 1740
ggatggtgga acgagcaaag gatgtggctt tatagaagaa caagctcgtt tcttttcgga 1800
tttatggaca cgattaagaa gctacttgga gtttctgagt ctgcgtttgt gatcacagca 1860
aaagtagcag aagaagaagc agcagagaga tacaaggaag aggtaatgga gtttggagtg 1920
gagtctccca tgtttctcgt cctcggaaca ctcggtatgc tcaatctctt ctgcttcgcc 1980
gcagcggttg cgagacttgt ttccggagac ggtggagatt tgaaaacaat ggggatgcaa 2040
tttgtgataa caggagtact agttgtcata aactggcctc tgtataaagg tatgttgttg 2100
aggcaagaca aaggaaagat gccaatgagc gttacagtta aatcagttgt tttagcttta 2160
tctgcctgta cctgtttagc gtttttgtaa 2190
<210> 91
<211> 729
<212> PRT
<213> Arabodopsis thaliana
<400> 91
Met Val Asn Lys Asp Asp Arg Ile Arg Pro Val His Glu Ala Asp Gly
1 5 10 15
Glu Pro Leu Phe Glu Thr Arg Arg Arg Thr Gly Arg Val Ile Ala Tyr
20 25 30
Arg Phe Phe Ser Ala Ser Val Phe Val Cys Ile Cys Leu Ile Trp Phe
35 40 45
Tyr Arg Ile Gly Glu Ile Gly Asp Asn Arg Thr Val Leu Asp Arg Leu
50 55 60
Ile Trp Phe Val Met Phe Ile Val Glu Ile Trp Phe Gly Leu Tyr Trp
65 70 75 80
Val Val Thr Gln Ser Ser Arg Trp Asn Pro Val Trp Arg Phe Pro Phe
85 90 95
Ser Asp Arg Leu Ser Arg Arg Tyr Gly Ser Asp Leu Pro Arg Leu Asp
100 105 110
Val Phe Val Cys Thr Ala Asp Pro Val Ile Glu Pro Pro Leu Leu Val
115 120 125
Val Asn Thr Val Leu Ser Val Thr Ala Leu Asp Tyr Pro Pro Glu Lys
130 135 140
Leu Ala Val Tyr Leu Ser Asp Asp Gly Gly Ser Glu Leu Thr Phe Tyr
145 150 155 160
Ala Leu Thr Glu Ala Ala Glu Phe Ala Lys Thr Trp Val Pro Phe Cys
165 170 175
Lys Lys Phe Asn Val Glu Pro Thr Ser Pro Ala Ala Tyr Leu Ser Ser
180 185 190
Lys Ala Asn Cys Leu Asp Ser Ala Ala Glu Glu Val Ala Lys Leu Tyr
195 200 205
Arg Glu Met Ala Ala Arg Ile Glu Thr Ala Ala Arg Leu Gly Arg Ile
210 215 220
Pro Glu Glu Ala Arg Val Lys Tyr Gly Asp Gly Phe Ser Gln Trp Asp
225 230 235 240
Ala Asp Ala Thr Arg Arg Asn His Gly Thr Ile Leu Gln Val Leu Val
245 250 255
Asp Gly Arg Glu Gly Asn Thr Ile Ala Ile Pro Thr Leu Val Tyr Leu
260 265 270
Ser Arg Glu Lys Arg Pro Gln His His His Asn Phe Lys Ala Gly Ala
275 280 285
Met Asn Ala Leu Leu Arg Val Ser Ser Lys Ile Thr Cys Gly Lys Ile
290 295 300
Ile Leu Asn Leu Asp Cys Asp Met Tyr Ala Asn Asn Ser Lys Ser Thr
305 310 315 320
Arg Asp Ala Leu Cys Ile Leu Leu Asp Glu Lys Glu Gly Lys Glu Ile
325 330 335
Ala Phe Val Gln Phe Pro Gln Cys Phe Asp Asn Val Thr Arg Asn Asp
340 345 350
Leu Tyr Gly Ser Met Met Arg Val Gly Ile Asp Val Glu Phe Leu Gly
355 360 365
Leu Asp Gly Asn Gly Gly Pro Leu Tyr Ile Gly Thr Gly Cys Phe His
370 375 380
Arg Arg Asp Val Ile Cys Gly Arg Lys Tyr Gly Glu Glu Glu Glu Glu
385 390 395 400
Glu Glu Ser Glu Arg Ile His Glu Asn Leu Glu Pro Glu Met Ile Lys
405 410 415
Ala Leu Ala Ser Cys Thr Tyr Glu Glu Asn Thr Gln Trp Gly Lys Glu
420 425 430
Met Gly Val Lys Tyr Gly Cys Pro Val Glu Asp Val Ile Thr Gly Leu
435 440 445
Thr Ile Gln Cys Arg Gly Trp Lys Ser Ala Tyr Leu Asn Pro Glu Lys
450 455 460
Gln Ala Phe Leu Gly Val Ala Pro Thr Asn Leu His Gln Met Leu Val
465 470 475 480
Gln Gln Arg Arg Trp Ser Glu Gly Asp Phe Gln Ile Met Leu Ser Lys
485 490 495
Tyr Ser Pro Val Trp Tyr Gly Lys Gly Lys Ile Ser Leu Gly Leu Ile
500 505 510
Leu Gly Tyr Cys Cys Tyr Cys Leu Trp Ala Pro Ser Ser Leu Pro Val
515 520 525
Leu Ile Tyr Ser Val Leu Thr Ser Leu Cys Leu Phe Lys Gly Ile Pro
530 535 540
Leu Phe Pro Lys Val Ser Ser Ser Trp Phe Ile Pro Phe Gly Tyr Val
545 550 555 560
Thr Val Ala Ala Thr Ala Tyr Ser Leu Ala Glu Phe Leu Trp Cys Gly
565 570 575
Gly Thr Phe Arg Gly Trp Trp Asn Glu Gln Arg Met Trp Leu Tyr Arg
580 585 590
Arg Thr Ser Ser Phe Leu Phe Gly Phe Met Asp Thr Ile Lys Lys Leu
595 600 605
Leu Gly Val Ser Glu Ser Ala Phe Val Ile Thr Ala Lys Val Ala Glu
610 615 620
Glu Glu Ala Ala Glu Arg Tyr Lys Glu Glu Val Met Glu Phe Gly Val
625 630 635 640
Glu Ser Pro Met Phe Leu Val Leu Gly Thr Leu Gly Met Leu Asn Leu
645 650 655
Phe Cys Phe Ala Ala Ala Val Ala Arg Leu Val Ser Gly Asp Gly Gly
660 665 670
Asp Leu Lys Thr Met Gly Met Gln Phe Val Ile Thr Gly Val Leu Val
675 680 685
Val Ile Asn Trp Pro Leu Tyr Lys Gly Met Leu Leu Arg Gln Asp Lys
690 695 700
Gly Lys Met Pro Met Ser Val Thr Val Lys Ser Val Val Leu Ala Leu
705 710 715 720
Ser Ala Cys Thr Cys Leu Ala Phe Leu
725
<210> 92
<211> 2283
<212> DNA
<213> Arabodopsis thaliana
<400> 92
atggagactc atagaaagaa ctcggtcgtc ggcaacatcc tccacacgtg tcatccttgc 60
cggcgcacca ttccatatag aatctacgcc atatttcaca cgtgtggcat catagctctc 120
atgtatcacc atgtacactc acttgtcaca gcaaacaaca ctcttataac atgtcttctt 180
ctcctctccg atattgttct cgccttcatg tgggcaacca caacttccct ccgcttaaac 240
ccggttcatc ggaccgagtg cccggagaaa tatgcagcta aaccggagga ctttccaaag 300
ctggacgtgt ttatatgcac ggctgatccg tacaaggagc ctccaatgat ggttgttaac 360
accgctttat cggtgatggc ttacgagtat ccgtcagata agatctcggt gtatgtatcg 420
gacgatggag gatcgtcgtt gactttcttt gctcttattg aagctgctaa gttctctaag 480
cagtggttgc ccttttgcaa gaagaataat gttcaagatc ggtctcctga agtttatttc 540
tcttcagagt cacattctcg aagtgatgaa gctgaaaacc ttaagatgat gtacgaagac 600
atgaagagta gagtagaaca tgtggtggag agtggaaaag ttgaaactgc gtttatcaca 660
tgcgaccaat ttcgtggggt attcgatttg tggaccgaca aattcagtcg tcatgaccat 720
cccacaatta ttcaggtgtt gcaaaatagc gagacagata tggacaatac cagaaaatat 780
ataatgccaa acctaatcta tgtttcaaga gagaagagta aagtttcacc acatcatttc 840
aaagctggtg ctcttaatac tttgctacga gtatcagggg tgatgacaaa ttcaccgatc 900
attctaacac tagactgtga tatgtattcg aacgacccgg caacactggt tcgtgctttg 960
tgctatttaa cagatcctga aatcaaatcc ggtttaggat atgtgcagtt tcctcagaaa 1020
tttctaggaa taagcaaaaa tgatatatat gcttgtgaaa acaaacgcct cttcattatt 1080
aatatggttg ggtttgatgg tctaatgggt ccaactcatg tgggaactgg ttgtttcttt 1140
aatcgacgag ctttctatgg acctccatat atgttgattt taccggagat aaatgaacta 1200
aagccttatc ggattgcgga taagtctatc aaagcccaag atgttttgtc attagcacac 1260
aatgtagcag gatgtatcta tgagtacaat accaattggg gatccaagat tggattcaga 1320
tatgggtcat tagtagaaga ctactacaca gggtttatgc tccattgtga aggatggaga 1380
tcagtatttt gcaacccaaa aaaagctgca ttttatggag attccccaaa gtgcctagtt 1440
gatcttgtgg gtcaacaaat ccgttgggca gttgggcttt tcgaaatgtc cttttcaaag 1500
tatagcccaa ttacctatgg aatcaagtca ctggaccttt taatgggttt aggttattgc 1560
aactctccgt ttaagccatt ttggtcaatt cctctgaccg tctatggact tttaccacag 1620
cttgcactca tttctggagt tagtgtcttc cccaaggcat ctgatccgtg gttttggctt 1680
tacatcattt tattctttgg ggcttatgcc caagatctat cagacttttt attggaagga 1740
ggaacttatc ggaaatggtg gaacgatcaa agaatgttga tgataaaagg actctcttca 1800
ttcttctttg gttttataga gttcattctc aaaaccctaa acctctccac acctaagttc 1860
aacgtcacca gtaaagccaa tgatgatgac gaacagagga agcggtacga gcaagaaatc 1920
tttgatttcg gaacctcttc gtccatgttc ttgcccttga ccacggttgc catagtgaat 1980
ctgcttgctt ttgtctgggg gctttatggt attctcttct gcggaggaga actctacctt 2040
gagctgatgc tggtgagctt cgcggtggtg aattgcttac cgatctacgg ggctatggtg 2100
ttgaggaaag atgatggaaa attatcaaaa agaacttgtt tcttagctgg gaacctccac 2160
gttggttctt attgtgtcaa gttacttcgt cctcaagtaa cttcacccct taggttaatt 2220
cacaacaata atacgtctgg ctggttcaag cggaagaaac acaatatgaa tgaatctgtg 2280
taa 2283
<210> 93
<211> 2088
<212> DNA
<213> Spinacia oleracea
<400> 93
atggcaactt ctcacattcg caatgtccaa ttaaccagag ccattgttaa ccgtctccac 60
atcttcctcc attccgtagc catcttctcg ctcttctact accgtttcac ttccttcttc 120
aactccgaca tctccatact tgcttactcc ttactcacca ccgccgaact cttcttaacc 180
tttctatggg cttttactca ggctttccgg tggcgtcccg taatgaggga agtctccggg 240
tacgaatcca tcaaacccga acaactaccg ggtttggatg tcttcattgt cactgctgac 300
ccgacaaagg agccagttct ggaggtgatg aactccgtga tatcatccat ggcgttggat 360
tatccggttg atagactggc ggtttacttg tcggatgacg gtggttctcc gttgtcgaag 420
gaggcgatta agaaggctta tgagtttgct aagctttgga ttcctttttg taataagtat 480
aatgttaaga caaggtgtcc tcaggctttc ttctcgcctc ttgctgatgg ggaaaggctt 540
gattggaatt ctgagtttat ggctgatcaa ttggaactcc agaccaaata tgaagctttt 600
agaaactatg tggagaaaga aagtggagat aacaccaaat gtactgcagt tcatgatcga 660
cctccttgcg ttgagattat acatgacaac aaacagaacg gagaaagtga tgtgaagatg 720
ccccttctgg tttatgtagc cagggaaaag agacctggtc gtcctcatcg tttcaaagct 780
ggagccctta atgctcttct tcgagtatcc agtttaatga gcaatgcacc ttacttattg 840
gtgttggatt gtgatatgta ctgccatgat ccaacttctg ctcgtcaatc tatgtgcttc 900
catcttgaca caaacatggc ttcctctctt gcatatgtgc aataccctca aattttctat 960
aatgttagca aaaatgacat ctatgatggc caagccagat cagctcatat gacgaaatgg 1020
aaaggcatgg atggactcag aggcccggtc ttgaatggaa ctgggtatta tttgaagcga 1080
aaagcattat ttggaaagcc taataacgaa gatgaatacc tcaacagtca accagaaaag 1140
gcctttggct cctccacaaa attaattgct gcactaagag agaactccaa gcaaaatctt 1200
gccataaagg aattgacaga agatgagttg taccaagagg ctagaaattt ggctacttgc 1260
acatatgaag caaacacact atggggcagt gaggtaggat attcgtatga gtgcttgttg 1320
gagagtacat tcactggata tatgttacat tgcagaggat ggaaatctgt gtatctttac 1380
ccaaaaagac catgcttctt gggatgcaca acgattgata tgaaggatgc tacggttcaa 1440
ctaataaaat ggacctcctc attacttgga attgccctgt cgaagtctag ccctctaact 1500
ttggccatgt ccagtatgtc aatcctgcaa agcatgtgtt acgcgtacat cacatttaca 1560
ggcctttttg cagctccatt ggttatatat ggtgttgtcc ttccaataag cctattgaag 1620
ggctttccta ttttccctaa ggtatcggat ccatggattt tgccatttgt gttgatattt 1680
gtatcctccc atcttcaaca tctatatgag gtcctggaaa gtgacaaatc agcaacacaa 1740
tggtggaatg aggtgagaat ttggatgatg aaatcagtga cagcctgttt gtttgggttg 1800
acggaagcga taatgaagaa gattggagta caaactgcaa cattcagatt aacaaataag 1860
gtagttgaga aggaaaagat ggataaatac gagaaggaga ggtttgattt ctcaggagca 1920
gctatgctta tggttcctct taatattttg gtggtactaa atatggtgtc attcattggt 1980
ggactcatga gggtcataat caacaacagt tatgatcaaa tgtttgcaca acttttcctc 2040
tccttttttg tcctacttct tagctaccct gttgttaagg gatggtta 2088
<210> 94
<211> 704
<212> PRT
<213> Beta vulgaris
<400> 94
Met Ser Ser Leu His Ile Cys Lys Val Gln Thr Thr Arg Ala Ile Leu
1 5 10 15
Ser Arg Phe His Ile Leu Phe His Ser Leu Ala Ile Leu Ala Leu Phe
20 25 30
Tyr Tyr Arg Phe Thr Ser Phe Ser Thr Thr Lys Ser Gly Ile Leu Pro
35 40 45
Trp Thr Leu Leu Thr Thr Ala Glu Val Val Leu Gly Phe Val Trp Ala
50 55 60
Leu Thr Gln Ala Phe Arg Trp Arg Pro Val Leu Arg Asp Val Ala Gly
65 70 75 80
Trp Asp Ser Ile Lys Glu Glu Gln Leu Pro Gly Val Asp Val Phe Ile
85 90 95
Cys Thr Ala Asp Pro Ile Lys Glu Pro Val Leu Glu Val Met Asn Thr
100 105 110
Val Leu Ser Ala Met Ala Leu Asp Tyr Pro Ala Glu Lys Leu Gly Val
115 120 125
Tyr Leu Ser Asp Asp Gly Gly Ser Pro Leu Thr Arg Glu Ala Ile Lys
130 135 140
Glu Ala Ser Lys Phe Ala Lys Val Trp Leu Pro Phe Cys Ser Lys Tyr
145 150 155 160
Gly Ile Lys Thr Arg Cys Pro Gln Ala Phe Phe Ser Ser Phe Cys Asp
165 170 175
Gly Glu Arg Leu Asp Trp Asn Gln Asp Phe Lys Ala Asp Glu Leu Val
180 185 190
Leu Lys Ser Lys Tyr Glu Ala Phe Lys Asn Tyr Val Glu Lys Ala Ser
195 200 205
Glu Asp Glu Ser Lys Cys Thr Met Ala His Asp Arg Ser Pro Cys Val
210 215 220
Glu Ile Ile His Asp Asn Lys Gln Asn Gly Glu Gly Glu Val Lys Met
225 230 235 240
Pro Leu Leu Val Tyr Val Ser Arg Glu Lys Arg Pro Asn Arg Pro His
245 250 255
Arg Phe Lys Ala Gly Ala Leu Asn Ala Leu Leu Arg Val Ser Gly Val
260 265 270
Leu Ser Asn Gly Pro Tyr Leu Leu Val Leu Asp Cys Asp Met Tyr Cys
275 280 285
Asn Asp Pro Thr Ser Ala Arg Gln Ser Met Cys Phe His Leu Asp Pro
290 295 300
Lys Leu Ala Pro Ser Leu Ala Phe Val Gln Tyr Pro Gln Ile Phe Tyr
305 310 315 320
Asn Thr Ser Lys Asn Asp Ile Tyr Asp Gly Gln Ala Arg Ser Ala Tyr
325 330 335
Lys Thr Lys Trp Gln Gly Met Asp Gly Ile Arg Gly Pro Val Leu Thr
340 345 350
Gly Thr Gly Tyr Tyr Leu Lys Arg Lys Ala Leu Tyr Gly Gln Pro His
355 360 365
Asn Glu Asp Glu Phe Leu Ile Asn Gln Pro Glu Lys Ala Phe Gly Ser
370 375 380
Ser Thr Lys Phe Ile Ala Ser Val Ser Ser Asn Ser Lys Gln Asn Met
385 390 395 400
Ala Leu Lys Glu Met Thr Arg Asp Asp Leu Leu Glu Glu Ala Lys Asn
405 410 415
Leu Ala Thr Cys Ala Tyr Glu Ser Asn Thr Glu Trp Gly Asn Lys Ile
420 425 430
Gly Tyr Ser Tyr Glu Cys Leu Leu Glu Ser Thr Phe Thr Gly Tyr Leu
435 440 445
Leu His Cys Lys Gly Trp Ile Ser Val Tyr Leu Tyr Pro Lys Arg Pro
450 455 460
Cys Phe Leu Gly Cys Thr Thr Ile Asp Met Lys Asp Ala Met Val Gln
465 470 475 480
Leu Met Lys Trp Thr Ser Gly Leu Leu Gly Val Gly Ile Ser Lys Phe
485 490 495
Ser Pro Leu Thr Tyr Ala Phe Ser Arg Met Ser Ile Leu Gln Ser Met
500 505 510
Cys Tyr Gly Tyr Phe Thr Phe Ser Ala Leu Phe Gly Val Ser Phe Leu
515 520 525
Ile Tyr Gly Ile Val Leu Pro Val Cys Leu Leu Lys Gly Val Pro Val
530 535 540
Phe Pro Lys Val Ser Asp Pro Trp Ile Gly Val Phe Val Val Val Phe
545 550 555 560
Ala Ser Ser Leu Leu Gln His Leu Tyr Glu Val Leu Ser Ser Asp Asp
565 570 575
Ser Ile Lys Thr Trp Trp Asn Glu Ile Arg Ile Trp Ile Ile Lys Ser
580 585 590
Val Thr Ala Ser Leu Phe Gly Thr Met Asp Ala Ile Met Lys Lys Ile
595 600 605
Gly Ile Gln Lys Ala Ser Phe Arg Leu Thr Asn Lys Val Val Asp Lys
610 615 620
Glu Lys Leu Glu Lys Tyr Glu Lys Gly Lys Phe Asp Phe Gln Gly Ala
625 630 635 640
Ala Val Phe Met Val Pro Leu Ile Ile Leu Val Val Leu Asn Met Val
645 650 655
Ser Phe Val Gly Gly Leu Arg Arg Ala Ile Ile Asn Lys Asn Cys Asp
660 665 670
Glu Met Phe Gly Gln Leu Phe Leu Ser Phe Phe Leu Leu Val Leu Ser
675 680 685
Tyr Pro Val Leu Glu Gly Ile Val Thr Lys Val Arg Lys Gly Arg Asp
690 695 700
<210> 95
<211> 2656
<212> DNA
<213> Beta vulgaris
<400> 95
catcacagcc acatgggaaa caaaaagtct taacctcggc catctcgtgt gcctcgtgca 60
cattcaacat tgattttaat tgtgtgcttt ctccaaaatg taccatacta tatcatcttg 120
tcagaattcc aaactccaac tataaccacc attgaagtca tctacacaca aacacacaca 180
ctctttctcc ctaaaaatgt cttctctcca catttgcaaa gtccaaacaa caagagcaat 240
acttagccgt ttccacatac tcttccactc cttagccatc cttgctttat tctactaccg 300
ttttacatcg ttctctacca ccaaatcagg catacttcca tggaccttac taaccacagc 360
agaggtggtt ctaggctttg tatgggcgtt aacacaggcc tttcgatggc ggcctgtgtt 420
gcgagatgta gctggatggg attccatcaa ggaggaacaa ctgccagggg tggacgtgtt 480
catatgcaca gctgatccaa taaaggagcc ggtgttagag gtgatgaaca cggtgctttc 540
ggcgatggca ttggattacc cggcagagaa gttgggtgtt tatctttcgg atgatggagg 600
ttctcccttg actagggagg ctattaagga ggcttctaag tttgctaagg tttggcttcc 660
tttttgtagt aagtatggta tcaagactag gtgtcctcag gctttcttct cttctttttg 720
tgatggggaa agacttgatt ggaatcagga ctttaaggct gatgaattgg tgctcaagtc 780
aaaatatgaa gcttttaaga attatgtgga gaaagcaagt gaagatgaaa gcaaatgcac 840
catggcacat gatcgttccc cttgcgttga gattatacat gacaacaagc aaaatggaga 900
aggcgaagtg aaaatgcccc ttttggtcta cgtatccagg gaaaagagac caaatcgtcc 960
tcatcgtttc aaagccggag ctcttaatgc tcttctcaga gtatcaggtg tattgagcaa 1020
cgggccttac ttattggtgt tggactgtga tatgtactgc aatgatccaa cttctgctcg 1080
tcaatctatg tgctttcatc ttgacccaaa attggctcct tcacttgcat ttgtgcaata 1140
cccacaaatt ttctacaaca ccagtaaaaa tgatatctat gatggccaag ctagatccgc 1200
gtacaagaca aaatggcaag gaatggatgg tattagagga ccagtcttga caggaacagg 1260
gtattacttg aagaggaaag cattgtatgg acaacctcat aacgaagatg aatttctcat 1320
taatcaacca gagaaggcct tcggctcctc cacaaaattc attgcgtcag ttagttcaaa 1380
ctccaagcaa aatatggcct tgaaggaaat gacaagagac gacttgttag aagaggctaa 1440
aaatttggct acttgtgcat atgaatcaaa cactgaatgg ggtaacaaga ttggatattc 1500
gtatgagtgt ttgttggaga gtacatttac cggatatctc ttacattgca aaggatggat 1560
ttccgtgtat ctttacccaa aaagaccctg cttcttagga tgcacgacga ttgacatgaa 1620
agatgccatg gttcaactaa tgaaatggac ctctggatta ctaggagttg gcatatcaaa 1680
gtttagccct ctaacttatg ccttttcgag gatgtctata ttacaaagca tgtgctacgg 1740
ttacttcaca ttttcagccc ttttcggagt ttcgttctta atatatggca tcgtccttcc 1800
agtatgccta ttgaagggtg ttcctgtttt tcctaaggta tcggatccat ggattggagt 1860
tttcgtggta gtatttgcat cctccctcct tcaacattta tacgaggttc tctcaagtga 1920
cgattccatt aaaacatggt ggaacgagat cagaatttgg atcatcaaat cggtaacagc 1980
ttccttattt ggaacaatgg atgcaataat gaaaaagatc ggcatacaaa aggctagttt 2040
ccgattaact aacaaggttg tggacaagga aaagctcgaa aaatatgaga agggcaagtt 2100
tgatttccaa ggagcagctg tgttcatggt tcctcttatc attttagtgg tactaaatat 2160
ggtgtcattt gttggcggat taagaagggc aataatcaac aagaattgtg atgaaatgtt 2220
tgggcaactt ttcctctcat tctttctctt agttcttagc taccccgttt tagaagggat 2280
agtaacaaaa gtaagaaaag gacgtgattg agatgaattt gcattgtttg gtaaaagatc 2340
caaacttaga gaaagagatt gcgtaggaga tcaaaggaaa caatgtgaga gatttacagg 2400
cttcatgagg cttaagacct cattaatttt tgtgacaatt tacaaattct gtctctatat 2460
tttggtcaag acgtatcatt tgaaaatttc catggttagg tagttagatt tcaatgttcc 2520
acgtttgtaa ataagaagat aaaataagga aatttgtgat tttagcttta catttctatg 2580
agatagtcct ttgttgtgat gaaagttgtg ttcttagtga aaataataaa acgtgacatc 2640
aaaattttga gtatat 2656
<210> 96
<211> 706
<212> PRT
<213> Chenopodium quinoa
<400> 96
Met Ala Ala Thr His Ile Cys Lys Val Gln Thr Lys Arg Val Ile Ile
1 5 10 15
Asn Arg Ile His Ile Leu Phe His Ser Leu Ala Ile Leu Ala Leu Phe
20 25 30
Tyr Tyr Arg Phe Ser Ser Phe Ser Asn Pro His Ile Ser Leu Phe Pro
35 40 45
Trp Val Leu Leu Thr Ile Ala Asp Leu Val Phe Thr Phe Ile Trp Ala
50 55 60
Met Thr Gln Ala Phe Arg Trp Arg Pro Val Leu His Asp Val Ser Gly
65 70 75 80
Tyr Glu Ser Ile Asn Pro Arg Asp Leu Pro Lys Ile Asp Ile Phe Ile
85 90 95
Cys Thr Ala Asp Pro Thr Lys Glu Pro Val Leu Glu Val Met Asn Ser
100 105 110
Val Ile Ser Ser Met Ala Leu Asp Tyr Pro Pro Glu Lys Met Ala Val
115 120 125
Tyr Leu Ser Asp Asp Gly Gly Ser Pro Leu Thr Arg Glu Ala Ile Lys
130 135 140
Lys Ala Val Glu Phe Ala Lys Val Trp Ile Pro Phe Cys Asn Met Tyr
145 150 155 160
Gly Ile Lys Thr Arg Cys Pro Asp Ala Phe Phe Ser Ala Leu Gly Asn
165 170 175
Asp Glu Arg Leu His Arg Asp Gln Asp Phe Asn Ala His Glu Ser Leu
180 185 190
Leu Lys Ser Lys Tyr Glu Ala Phe Lys Lys Tyr Val Glu Lys Glu Ser
195 200 205
Gly Asp Ile Asn Lys Cys Thr Val Val His Asp Arg Glu Pro Cys Ile
210 215 220
Glu Ile Ile His Asp Ser Lys Gln Asp Gly Glu Ala Glu Val Lys Met
225 230 235 240
Pro Leu Val Val Tyr Val Ala Arg Glu Lys Arg Pro Gly His Pro His
245 250 255
Arg Phe Lys Ala Gly Ala Leu Asn Ala Leu Leu Arg Val Ser Gly Leu
260 265 270
Leu Ser Asn Ala Pro Tyr Leu Leu Val Leu Asp Cys Asp Met Tyr Cys
275 280 285
His Asp Pro Thr Ser Ala Arg Gln Ser Met Cys Phe His Leu Asp Pro
290 295 300
Asn Met Ser Pro Ser Leu Ala Phe Val Gln Tyr Pro Gln Ile Phe Tyr
305 310 315 320
Asn Thr Ser Lys Asn Asp Ile Tyr Asp Gly Gln Ala Arg Ser Ala His
325 330 335
Thr Thr Lys Trp Gln Gly Met Asp Gly Leu Arg Gly Pro Val Leu Asn
340 345 350
Gly Thr Gly Tyr Tyr Leu Lys Lys Lys Ala Ile Tyr Gly Arg Pro His
355 360 365
Asn Glu Asp Glu Tyr Leu Ile Asn Glu Pro Glu Lys Ala Phe Gly Ser
370 375 380
Ser Thr Lys Phe Ile Ala Ser Leu Lys Glu Asn Ser Asn Gln Asp Leu
385 390 395 400
Val Leu Lys Glu Phe Thr Asn Asp Leu Leu Gln Glu Ala Arg Asn Leu
405 410 415
Ala Thr Cys Thr Tyr Glu Ala Asn Ser Leu Trp Gly Val Glu Val Gly
420 425 430
Phe Ser Tyr Asp Cys Leu Leu Glu Ser Ser Tyr Thr Gly Tyr Leu Leu
435 440 445
His Cys Lys Gly Trp Arg Ser Val Tyr Leu Tyr Pro Lys Arg Pro Cys
450 455 460
Phe Leu Gly Cys Thr Thr Ile Asp Met Lys Asp Ala Ile Val Gln Leu
465 470 475 480
Ile Lys Trp Thr Ser Gly Leu Leu Gly Val Ala Met Ser Lys Phe Ser
485 490 495
Pro Leu Thr Tyr Ala Met Ser Arg Met Ser Ile Leu Gln Ser Met Cys
500 505 510
Tyr Ala Tyr Ile Thr Cys Ser Gly Leu Leu Ala Val Pro Leu Phe Ile
515 520 525
Tyr Gly Val Val Leu Pro Phe Cys Leu Leu Lys Gly Val Pro Val Phe
530 535 540
Pro Lys Val Ser Asp Pro Trp Met Leu Gly Phe Val Phe Val Phe Val
545 550 555 560
Ser Ser His Val Gln His Leu Phe Glu Val Leu Ala Ser Asp His Ser
565 570 575
Val Gln Gln Trp Trp Asn Glu Val Arg Ile Trp Ile Met Lys Ala Ile
580 585 590
Thr Ala Cys Leu Phe Gly Ser Thr Glu Ala Ile Met Lys Lys Ile Gly
595 600 605
Ile Gln Lys Thr Thr Phe Arg Leu Thr Asn Lys Val Val Glu Lys Glu
610 615 620
Lys Leu Asp Lys Tyr Glu Lys Gly Lys Phe Asp Phe Ser Gly Ala Ala
625 630 635 640
Met Leu Met Val Pro Leu Ile Ile Leu Thr Ile Leu Asn Leu Val Ser
645 650 655
Phe Val Gly Gly Leu Val Arg Val Ile Asn His Asn Asn Tyr Asp Asp
660 665 670
Met Phe Gly Gln Leu Phe Leu Ser Phe Tyr Leu Leu Leu Leu Ser Tyr
675 680 685
Pro Thr Phe Glu Gly Ile Val Thr Lys Val Thr Asp Lys Leu Arg Lys
690 695 700
Lys Glu
705
<210> 97
<211> 2524
<212> DNA
<213> Chenopodium quinoa
<400> 97
aaaagtgaaa ctggtgactt agtcttgtgt cacccgggtt cctcgagcac atattcttca 60
agattttggt tttttgtacg gagtatttat atacacaaaa attaggaacc aaataggaag 120
actcatatca tttcaaaatg gcggcaacac acatttgcaa agtccaaacc aaaagagtca 180
ttatcaaccg tattcatatc ctctttcact ctttagccat tcttgctctc ttctactacc 240
gtttctcgtc tttctccaac cctcatatct ccctttttcc atgggtatta ttgactatcg 300
ccgacctcgt tttcaccttc atttgggcca tgactcaggc cttccgttgg cgccccgtct 360
tgcacgatgt gtctggctat gagtccatca atccacgcga tcttccaaag atcgatattt 420
ttatatgcac cgctgatccc accaaggagc ctgtgttgga agtgatgaac tcggtgatat 480
catccatggc gctcgattat ccgcctgaaa aaatggcggt gtatttgtcg gatgatggtg 540
gttctccttt gactagagag gctattaaga aggctgttga atttgctaag gtttggattc 600
ctttttgtaa tatgtatggt attaagacta ggtgtcctga tgctttcttc tccgctttgg 660
gtaatgatga aagacttcat cgtgatcaag actttaacgc tcatgaatca ctcctcaagt 720
cgaaatacga agcttttaag aaatatgtgg agaaagaaag cggtgatatt aataaatgca 780
ccgttgtgca tgatcgtgaa ccttgcattg agattataca tgacagtaaa caggatggag 840
aagctgaagt gaaaatgccc cttgtagttt atgtagccag ggaaaagaga ccaggtcatc 900
ctcatcgttt caaagctgga gcccttaacg ctcttctccg agtatcagga ctattgagca 960
atgcgcctta cttattggtg ttagactgtg atatgtactg tcatgatcca acctctgctc 1020
gtcaatctat gtgcttccat cttgacccga acatgtctcc ctctcttgcc tttgttcaat 1080
accctcaaat tttctacaac actagtaaaa atgatatcta tgatggtcaa gccagatcag 1140
ctcatacgac gaaatggcaa ggcatggatg gactcagagg accggtcttg aatggaactg 1200
ggtattatct gaagaagaag gcgatatatg gaaggcccca taatgaagat gaatacctca 1260
tcaatgaacc agaaaaggct tttggttctt ccacaaaatt cattgcttca cttaaagaaa 1320
actcgaacca ggatcttgtc ttgaaggaat tcacaaacga tttgttacaa gaggctagaa 1380
atttggctac ttgcacttat gaagcaaact cgctatgggg tgttgaggta gggttttcgt 1440
atgattgcct gttggagagt tcatacactg gatatctctt acattgtaaa ggatggagat 1500
ctgtgtatct ttatcccaaa agaccgtgct tcttgggatg cacgacaatt gacatgaagg 1560
atgctattgt tcaattaata aaatggactt ccggattact tggagttgcc atgtcaaagt 1620
ttagccctct tacttatgcc atgtccagaa tgtctatatt gcaaagcatg tgttacgcgt 1680
acatcacgtg ttcaggtctt ctagcagttc cactctttat atatggtgtt gttctaccat 1740
tctgcctact taagggcgtt cctgtttttc ctaaggtatc ggatccatgg atgttgggtt 1800
tcgtgtttgt atttgtatcc tcccatgttc aacatctatt cgaagtgcta gcaagtgatc 1860
attcagtgca acagtggtgg aatgaggtga gaatctggat catgaaagcg ataacagcct 1920
gcttgtttgg atcaactgaa gcaataatga agaagattgg gatacagaaa acaacattca 1980
gattaacaaa taaggttgtg gagaaagaga agttggataa atacgagaag ggaaagttcg 2040
atttctcagg agcagcaatg ctaatggttc ctctcatcat tttgactata ctaaatttgg 2100
tgtcgttcgt tgggggactt gtaagggtga tcaaccacaa caactatgat gatatgttcg 2160
ggcaactttt cctgtcattt tatctcctac ttcttagcta ccctactttc gaagggattg 2220
ttacaaaagt tacagacaaa cttagaaaga aagaataagg agtgattgag taactgccta 2280
gtacagtttt cacttcactt ctctagatta gtccttgttt ttgtttatgt ttattaagat 2340
cagcaacact tgtagacggt tgcaataatg agttcaatac cgtttgttct gtccctcttg 2400
caagaacaag tatataaata cttttcatta gccggttgca ttgttggatt catatagatg 2460
aatatttcaa atatttcatc tttttgaact tacacactaa tgatttatat ctggaatttt 2520
gaaa 2524
<210> 98
<211> 715
<212> PRT
<213> Medicago sativa
<400> 98
Met Ala Thr Phe Thr Phe His Lys Glu Thr Val Gln Pro Leu Leu Pro
1 5 10 15
Leu Arg Arg Ala Tyr Ile Ile Phe His Phe Thr Cys Val Leu Phe Leu
20 25 30
Phe Tyr Tyr Arg Ile Ser Asn Leu Phe Ile Ser Tyr Pro Trp Phe Leu
35 40 45
Met Thr Ile Ala Glu Ile Ile Leu Ser Phe Leu Trp Phe Phe Asn Gln
50 55 60
Ala Phe Arg Trp Arg Leu Val Asn Arg Ser Val Met Thr Glu Lys Leu
65 70 75 80
Pro Pro Glu Glu Lys Leu Pro Gly Leu Asp Ile Phe Val Cys Thr Ile
85 90 95
Asp Pro Glu Lys Glu Pro Thr Val Asp Val Met Asn Thr Val Ile Ser
100 105 110
Ala Ile Ala Met Asp Tyr Pro Ser Asn Lys Leu Ser Ile Tyr Leu Ser
115 120 125
Asp Asp Gly Gly Ser Pro Ile Thr Leu Phe Gly Ile Lys Glu Ala Phe
130 135 140
Glu Phe Ala Lys Val Trp Val Pro Phe Cys Lys Lys Tyr Asp Val Lys
145 150 155 160
Ser Arg Cys Pro Lys Phe Phe Phe Thr Ala Leu Gly Glu Asn Glu Arg
165 170 175
Leu His Arg Pro Arg Glu Phe Glu Glu Val Arg Asp Gln Ile Lys Lys
180 185 190
Arg Leu Asn Arg Val Asp Pro Asn Ser Ser Gln Val Glu Asn Ser Lys
195 200 205
Glu His Met Pro Thr Lys Ala Lys Tyr Glu Lys Met Gln Lys Asn Ile
210 215 220
Glu Lys Phe Gly Ser Asn Leu Lys Asn Leu Cys Met Val Thr Asp Arg
225 230 235 240
Pro Ser Arg Ile Glu Ile Ile Asn Asp Gln Lys Glu Met Pro Leu Val
245 250 255
Val Tyr Val Ser Arg Glu Lys Arg Pro Ser Val Pro His Arg Phe Lys
260 265 270
Gly Gly Ala Leu Asn Thr Leu Leu Arg Val Ser Gly Leu Ile Ser Asn
275 280 285
Gly Pro Tyr Val Leu Val Val Asp Cys Asp Met Asn Cys Asn Asp Ala
290 295 300
Ser Ser Ala Lys Gln Ser Met Cys Phe Phe Leu Asp Pro Glu Thr Ser
305 310 315 320
Lys Asp Val Ala Phe Val Gln Phe Pro Gln Met Phe His Asn Leu Ser
325 330 335
Lys Lys Asp Ile Tyr Asp Ser Gln Thr Arg Thr Ala Phe Thr Thr Lys
340 345 350
Trp Lys Gly Met Asp Gly Leu Arg Gly Pro Gly Leu Thr Gly Ser Gly
355 360 365
Asn Tyr Ile Ser Arg Ser Ala Leu Leu Phe Gly Ser Pro Asn Gln Lys
370 375 380
Gly Asp Tyr Leu Leu Asp Ala Leu Tyr Asn Phe Gly Lys Ser Asn Met
385 390 395 400
Tyr Val Glu Ser Leu Lys Ala Leu Arg Gly Gln Gln Thr Lys Lys Gln
405 410 415
Asn Ile Ser Arg Asp Val Ile Leu Gln Glu Ala Cys Glu Val Ala Ser
420 425 430
Cys Ser Tyr Glu Arg Asn Thr Asn Trp Gly Asn Glu Val Gly Phe Ser
435 440 445
Tyr Ala Ile Lys Leu Glu Ser Thr Val Thr Gly Tyr Leu Leu His Cys
450 455 460
Arg Gly Trp Arg Ser Thr Tyr Leu Tyr Pro Lys Arg Pro Cys Phe Leu
465 470 475 480
Gly Cys Ala Pro Thr Asp Met Lys Glu Gly Leu Ile Gln Pro Ile Lys
485 490 495
Trp Ser Ser Glu Leu Leu Leu Leu Ala Ile Ser Lys Tyr Ser Pro Phe
500 505 510
Thr Tyr Gly Leu Ser Arg Leu Pro Thr Ile His Cys Leu Thr Phe Cys
515 520 525
Tyr Leu Val Ser Thr Thr Gln Phe Ala Thr Ala Tyr Ile Leu Tyr Gly
530 535 540
Phe Val Pro Gln Ile Cys Phe Leu Lys Gly Ile Pro Val Tyr Pro Lys
545 550 555 560
Val Thr Asp Pro Trp Phe Ile Val Phe Thr Val Leu Tyr Leu Ser Ser
565 570 575
Gln Ile His His Tyr Ile Glu Val Ile Ser Thr Gly Gly Ser Ser Met
580 585 590
Ile Trp Trp Asn Glu Gln Arg Ser Gly Ile Val Lys Ser Ile Gly Cys
595 600 605
Val Phe Ala Ile Ile Glu Thr Ala Lys Lys Lys Phe Gly Leu Asn Lys
610 615 620
Ala Lys Phe Thr Leu Ser Asp Lys Ala Ile Asp Lys Asp Lys Leu Lys
625 630 635 640
Lys Tyr Glu Gln Gly Lys Phe Asn Phe Asp Gly Ala Ala Leu Leu Met
645 650 655
Ala Pro Val Ile Val Leu Leu Thr Ile Asn Ile Val Cys Phe Phe Gly
660 665 670
Gly Leu Trp Arg Leu Leu Asn Val Arg Asp Phe Asp Glu Met Phe Gly
675 680 685
Gln Leu Phe Leu Ile Ile Tyr Ile Leu Ala Leu Ser His Pro Ile Val
690 695 700
Glu Gly Ile Ile Ser Met Lys Arg Lys Ser Gly
705 710 715
<210> 99
<211> 2148
<212> DNA
<213> Medicago sativa
<400> 99
atggcaacct tcacatttca caaagaaaca gttcaaccat tgttacctct aagaagagct 60
tacataatct tccacttcac atgtgtcttg tttctctttt actaccgtat cagcaatttg 120
tttatttcat atccatggtt tctaatgaca atagctgaga ttattctatc atttctatgg 180
tttttcaacc aagcattccg ttggaggctg gtgaatcgtt cagttatgac cgagaaatta 240
ccgccggagg agaagttgcc gggactcgac atatttgtgt gtaccattga tcctgaaaaa 300
gaaccaacgg ttgatgttat gaacactgtt atttctgcta ttgcaatgga ttacccttct 360
aataaacttt ctatttatct ttctgatgat ggaggttctc ctattactct ttttgggatc 420
aaagaggctt ttgaatttgc taaagtttgg gttccttttt gtaaaaaata tgatgttaag 480
tcaaggtgtc ctaagttttt cttcactgct ttgggtgaga atgaacgact tcatcgacct 540
cgtgaatttg aagaagtgag ggaccagatt aagaagagat taaatagagt ggatcctaac 600
tcatcacaag ttgaaaactc caaggaacat atgcccacca aagccaaata cgagaaaatg 660
cagaaaaata ttgagaaatt cggaagcaac ctaaagaatc tttgtatggt gaccgataga 720
ccttctcgga tcgagatcat taatgaccaa aaagaaatgc cactagttgt ttatgtatct 780
cgtgaaaaaa gaccatctgt tcctcacaga ttcaaaggag gagctctcaa tacattgctt 840
agggtgtcag ggctaatcag caatggacct tatgtacttg tcgtagattg tgatatgaat 900
tgtaatgatg catcatcagc caaacaatcc atgtgctttt ttcttgatcc tgaaacctct 960
aaagatgttg cttttgttca attccctcaa atgtttcaca accttagcaa gaaagacata 1020
tatgatagtc agactaggac tgcttttacg acaaagtgga agggaatgga tggattaaga 1080
ggtccaggtc taactggcag tggaaattat ataagtagaa gtgcattact ctttggaagt 1140
ccaaaccaaa aaggggacta tctacttgat gctctataca actttggcaa gtctaacatg 1200
tatgtagaat cactaaaagc gttacgtggt caacaaacta agaagcagaa tatttcaaga 1260
gatgtaattt tacaagaagc atgtgaagtg gcttcttgtt cctatgagag aaacacaaat 1320
tggggtaatg aggtgggatt ctcgtatgct ataaaacttg agagtaccgt tactggctat 1380
ctcctccatt gtagaggatg gagatcaact tatctttacc ctaaaagacc atgtttctta 1440
ggatgtgctc caactgacat gaaagaggga ttgattcaac cgataaagtg gtcatctgaa 1500
cttttgttgc ttgcaatctc taaatatagc ccattcactt atggcctttc aagattgccc 1560
actattcatt gtttaacttt ttgttacttg gtaagcacaa cccaatttgc aacagcctac 1620
atcttatatg gattcgttcc tcagatttgc ttcttgaagg gaatacctgt atatccaaag 1680
gttacagatc cttggtttat agtgtttaca gtattgtatc tatccagtca aattcatcat 1740
tatattgagg taatttcaac tggtggctcc tcgatgattt ggtggaatga acaaagaagt 1800
gggattgtaa aatcaattgg gtgcgttttc gcaattatag aaacagcgaa aaaaaagttt 1860
gggttgaaca aggcaaaatt cactttatcg gacaaagcaa ttgacaaaga taagctaaag 1920
aaatatgagc agggtaagtt taattttgat ggtgcagcat tgctcatggc accagtgatt 1980
gtgttactca caataaatat tgtttgcttc tttggtggtt tatggagact actcaatgtg 2040
agggattttg atgaaatgtt tggtcaactt ttcctcatta tctatatact tgctctaagt 2100
catcctattg tggaggggat tatatctatg aagcggaaga gtgggtag 2148
<210> 100
<211> 696
<212> PRT
<213> Glycine max
<400> 100
Met Ala Thr Phe His Thr Glu Thr Val Gln Ser Gly Leu Ala Leu Ser
1 5 10 15
Arg Leu His Ile Leu Phe His Ser Val Ala Leu Leu Phe Leu Tyr Tyr
20 25 30
Tyr Arg Ile Ser His Ile Leu Leu Glu Pro Ser Phe Val Trp Ile Phe
35 40 45
Met Thr Ile Ala Glu Leu Ile Phe Gly Glu Leu Trp Leu Phe Lys Gln
50 55 60
Ala Phe Arg Trp Arg Pro Val Ser Arg Ala Val Met Pro Glu Lys Leu
65 70 75 80
Pro Ser Asp Gly Lys Leu Pro Ala Leu Asp Ile Phe Val Cys Thr Val
85 90 95
Asp Pro Glu Lys Glu Pro Thr Val Gln Val Met Asp Thr Val Ile Ser
100 105 110
Ala Ile Ala Met Asp Tyr Pro Ser Asn Lys Leu Ala Val Tyr Leu Ser
115 120 125
Asp Asp Gly Gly Cys Pro Val Thr Leu Tyr Gly Ile Arg Glu Ala Ser
130 135 140
Arg Phe Ala Lys Glu Trp Val Pro Phe Cys Arg Lys Tyr Gly Ile Asn
145 150 155 160
Ser Arg Cys Pro Lys Ala Phe Phe Ser Pro Met Gly Glu Asp Glu Arg
165 170 175
Glu Leu Leu Leu Leu Arg Asn His Glu Phe Leu Ala Glu Gln Glu Gln
180 185 190
Leu Lys Ala Lys Tyr Asn Ile Met Gln Lys Asn Ile Asp Glu Phe Gly
195 200 205
Arg Asp Pro Lys Asn Arg Ser Ile Val Phe Asp Arg Pro Ala Arg Ile
210 215 220
Glu Ile Ile Asn Glu Gln Ser Glu Ile Pro Leu Val Val Tyr Val Ser
225 230 235 240
Arg Glu Arg Arg Pro Asn Val Pro His Thr Tyr Lys Gly Gly Ala Leu
245 250 255
Asn Thr Leu Leu Arg Val Ser Gly Leu Phe Ser Asn Gly Pro Tyr Val
260 265 270
Leu Val Val Asp Cys Asp Met Tyr Cys Asn Asp Pro Ser Ser Ala Lys
275 280 285
Gln Ala Met Cys Phe Phe Leu Asp Pro Glu Thr Ser Lys Asp Ile Ala
290 295 300
Phe Val Gln Phe Pro Gln Met Phe His Asn Leu Ser Met Lys Asp Ile
305 310 315 320
Tyr Asp Ser Gln His Arg His Ala Phe Thr Thr Met Trp Gln Gly Met
325 330 335
Asp Gly Leu Arg Gly Pro Gly Leu Ser Gly Ser Gly Asn Tyr Leu Ser
340 345 350
Arg Ser Ala Leu Ile Phe Pro Ser Pro Tyr Glu Lys Asp Gly Tyr Glu
355 360 365
His Asn Ala Gln Asn Lys Phe Gly Asn Ser Thr Met Tyr Ile Glu Ser
370 375 380
Leu Lys Ala Ile Gln Gly Gln Gln Thr Tyr Lys Thr Ser Ile Ser Arg
385 390 395 400
Asn Val Ile Leu Gln Glu Ala Gln Ala Val Ala Ser Cys Ser Tyr Glu
405 410 415
Ile Asp Thr Asn Trp Gly Asn Glu Val Gly Phe Ser Tyr Val Ile Leu
420 425 430
Leu Glu Ser Thr Val Thr Gly Tyr Leu Leu His Cys Arg Gly Trp Arg
435 440 445
Ser Thr Tyr Leu Tyr Pro Lys Arg Pro Cys Phe Leu Gly Cys Ala Pro
450 455 460
Thr Asp Phe Met Glu Gly Met Leu Gln Leu Val Lys Trp Ser Ser Glu
465 470 475 480
Leu Phe Leu Leu Gly Ile Ser Lys Tyr Ser Pro Phe Thr Tyr Gly Ile
485 490 495
Ser Arg Ile Pro Ile Leu His Asn Phe Thr Phe Cys Tyr Phe Thr Ser
500 505 510
Thr Cys Gln Tyr Ile Val Ala Leu Ile Val Tyr Gly Ile Ile Pro Gln
515 520 525
Val Cys Phe Leu Lys Gly Thr Pro Val Phe Pro Lys Val Thr Glu Pro
530 535 540
Trp Phe Val Val Phe Ala Ile Leu Tyr Val Ser Ser Gln Ser Gln His
545 550 555 560
Leu Ile Glu Val Leu Tyr Gly Gly Gly Ser Leu Gly Thr Trp Trp Asp
565 570 575
Glu Gln Arg Ile Trp Ile Val Lys Ser Ile Val Gly Gly Ile Phe Gly
580 585 590
Ser Ile Leu Ala Ile Lys Lys Arg Phe Gly Leu Asn Lys Ala Lys Phe
595 600 605
Ile Leu Ser Asn Lys Val Val Ala Lys Glu Lys Phe Glu Lys Tyr Glu
610 615 620
Gln Gly Lys Phe Glu Phe Glu Asp Ala Ala Leu Phe Met Ser Pro Leu
625 630 635 640
Val Gly Leu Leu Ile Val Asn Ile Leu Cys Phe Phe Gly Gly Leu Trp
645 650 655
Arg Leu Phe Asn Val Lys Asp Phe Glu Lys Met Ser Gly Gln Leu Phe
660 665 670
Leu Leu Gly Tyr Leu Ala Ala Leu Ser Tyr Pro Ile Phe Glu Gly Ile
675 680 685
Ile Thr Met Lys Ser Lys Val Gln
690 695
<210> 101
<211> 2336
<212> DNA
<213> Glycine max
<400> 101
tatatgcatg ttgaccggta aacatggcga ccttccacac agaaaccgtg caatcagggt 60
tggccttgag cagactccac atcctattcc actcggtggc actcttgttt ctctattact 120
accgcataag ccacatctta ctggaaccaa gctttgtatg gattttcatg accatagcgg 180
agcttatctt cggcgagctc tggctcttca aacaggcgtt ccggtggcgg cccgtgtcga 240
gggccgtcat gccggagaag ctgccgagcg acggcaagct tccggcgctc gacatcttcg 300
tctgcacggt tgaccccgaa aaggagccga cggtgcaggt gatggacacc gtcatctccg 360
ccattgccat ggactacccc tccaacaagc tcgccgtgta cctttccgac gatggcgggt 420
gtccggtgac tctgtatggg atcagagagg cttctcggtt cgcaaaggag tgggttccgt 480
tctgcagaaa gtatgggatc aattcacggt gccccaaggc cttcttctct cccatggggg 540
aggatgaacg tgaactgctt cttcttcgca accatgaatt cttggcagag caagaacaac 600
tcaaggctaa atacaatata atgcaaaaaa atattgacga atttggaaga gaccctaaaa 660
atcgttccat tgtgtttgat agaccagctc gcattgagat tataaatgag caatccgaaa 720
taccactggt tgtttatgtg tctcgtgaaa gaaggccaaa tgttcctcat acatacaaag 780
ggggagccct caacacattg ctcagagtct cagggctatt cagtaacggg ccctatgtac 840
ttgtagttga ttgtgatatg tattgcaatg atccatcatc agctaaacaa gccatgtgct 900
tttttcttga tcctgaaacc tccaaagata ttgcttttgt ccaattccct caaatgtttc 960
acaaccttag catgaaagac atctacgata gtcaacatag gcatgctttt acaacaatgt 1020
ggcaaggaat ggatggacta agaggtccag gtctttctgg tagtggcaat tacttaagta 1080
gaagtgcatt aatctttcca agcccatatg aaaaagacgg ctatgaacat aatgcccaaa 1140
acaaatttgg caactctacc atgtacattg aatcattaaa ggccattcaa ggacaacaaa 1200
cttataaaac gagcatttca agaaatgtga ttttacagga agcacaagca gtggcctctt 1260
gttcctatga aatagacaca aattggggta atgaggtagg attctcatat gttatattac 1320
tggagagtac agttactggc tatcttcttc actgtagagg atggagatca acttaccttt 1380
accccaaaag accttgtttc ttgggatgtg cccccactga cttcatggaa ggcatgcttc 1440
agttggtgaa atggagttct gaacttttct tgctaggaat atccaaatac agccctttca 1500
cttatgggat ttcaagaatt cctattctgc acaactttac cttttgctac ttcacatcta 1560
catgtcaata tattgttgcc ttaatagtat atggcatcat tcctcaagta tgcttcttga 1620
aaggaactcc tgtgtttcct aaggttacag aaccatggtt tgtagttttt gcaatattat 1680
atgtatcctc tcaaagtcaa catttgattg aagtccttta tggtggtggc tctttgggaa 1740
catggtggga tgaacaaaga atatggattg taaagtcaat tgttggaggc atatttggat 1800
ctatactagc aatcaagaaa cgttttgggt taaacaaagc aaaattcatt ttatcaaata 1860
aagttgttgc caaagagaag tttgagaaat atgaacaagg taagttcgag ttcgaagatg 1920
cagctttgtt catgtctcca ttggttggat tactcatagt gaatattctt tgcttctttg 1980
gtggtttatg gagactattt aatgtgaaag attttgaaaa gatgtctggc caactttttc 2040
tacttggcta tctggcggcg ctcagttatc ccatttttga ggggataata accatgaaaa 2100
gcaaggtgca atagtagttt gtcaatgatt aggctaattt aggtatttga actttgttca 2160
caaataattt gcttcatatg aaaatctaaa gtgcatgcta aatgtttgta tcttaatatg 2220
taattagcgt gcttttattt catgcatgag aatatggcta tcgattttaa ttaggagcaa 2280
aatgtatgtt cttactccat ttttaatgca atttctttat tttcttgcca attaaa 2336
<210> 102
<211> 695
<212> PRT
<213> Glycyrrhiza uralensis
<400> 102
Met Ala Ser Phe Thr Leu His Thr Glu Thr Val Gln Ser Trp Leu Leu
1 5 10 15
Leu Ser Arg Leu His Ile Leu Leu His Leu Ala Val Val Leu Leu Leu
20 25 30
Leu Tyr Tyr Arg Ile Thr Arg Phe Pro Phe His Ala Pro Thr Leu Pro
35 40 45
Trp Thr Leu Met Thr Val Gly Glu Ala Ile Met Ala Val Leu Trp Phe
50 55 60
Phe Asn Gln Ala Phe Arg Trp Arg Pro Val Ser Arg Ser Val Met Thr
65 70 75 80
Glu Lys Leu Pro Ser Asp Ala Lys Leu Pro Gly Leu Asp Ile Phe Val
85 90 95
Cys Thr Leu Asp Pro Glu Lys Glu Pro Thr Val Glu Val Met Asn Thr
100 105 110
Leu Val Ser Ala Leu Ala Met Asp Tyr Pro Pro Asp Lys Leu Ser Val
115 120 125
Tyr Leu Ser Asp Asp Gly Ala Ala Pro Val Thr Leu Tyr Gly Val Arg
130 135 140
Glu Ala Ser Glu Phe Ala Arg Val Trp Val Pro Phe Cys Lys Lys Tyr
145 150 155 160
Gly Ile Lys Ser Arg Cys Pro Lys Val Phe Phe Ser Pro Ser Ala Glu
165 170 175
Asp Glu His Leu Leu Arg Thr Asp Glu Phe Arg Ser Glu Arg Asp Leu
180 185 190
Ile Lys Ala Lys Tyr Glu Lys Met Gln Lys Asn Ile Glu Lys Phe Gly
195 200 205
Ser Asp Ala Lys Asn Cys Arg Met Val Thr Asp Arg Pro Pro Arg Ile
210 215 220
Glu Ile Leu Ile Asp Gln Pro Asp Met Pro Arg Val Val Tyr Val Ser
225 230 235 240
Arg Glu Arg Arg Pro Ser Leu Pro His Lys Phe Lys Gly Gly Ala Leu
245 250 255
Asn Thr Leu Leu Arg Val Ser Gly Leu Ile Ser Asn Gly Pro Tyr Val
260 265 270
Leu Val Val Asp Cys Asp Met Tyr Cys Asn Asp Pro Ser Ser Ala Lys
275 280 285
Gln Ala Met Cys Phe Phe Leu Asp Pro Glu Thr Ser Lys Ser Ile Ala
290 295 300
Phe Val Gln Phe Pro Gln Met Phe His Asn Leu Gly Lys Lys Asp Ile
305 310 315 320
Tyr Asp Asn Gln Ser Arg Thr Ala Phe Lys Thr Met Trp Gln Gly Met
325 330 335
Asp Gly Leu Arg Gly Pro Gly Leu Ser Gly Ser Gly Asn Tyr Leu Asn
340 345 350
Arg Ser Ala Leu Leu Phe Gly Ser Pro Asn Gln Lys Asp Asp Tyr Leu
355 360 365
Asp Asp Ala Gln Asn Tyr Leu Gly Lys Ser Thr Met Tyr Ile Glu Ser
370 375 380
Leu Lys Ala Ile Arg Gly Gln Lys Thr Met Lys Lys Asn Ile Ser Arg
385 390 395 400
Asp Glu Ile Leu Arg Glu Ala Gln Val Leu Ala Ser Cys Ser Tyr Glu
405 410 415
Thr Asn Thr Glu Trp Gly Ala Glu Val Gly Phe Ser Tyr Gly Ile Leu
420 425 430
Leu Glu Ser Ser Ile Thr Gly Tyr Leu Phe His Cys Arg Gly Trp Lys
435 440 445
Ser Ala Tyr Leu Tyr Pro Lys Thr Pro Cys Phe Leu Gly Cys Ala Pro
450 455 460
Thr Asp Ile Lys Glu Gly Met Leu Gln Leu Val Lys Trp Leu Ser Glu
465 470 475 480
Tyr Cys Leu Leu Gly Phe Ser Lys Tyr Ser Pro Phe Thr Tyr Gly Phe
485 490 495
Ser Arg Met Pro Ile Met Pro Thr Leu Val Tyr Cys Phe Leu Thr Thr
500 505 510
Thr Thr Leu Tyr Ser Ile Val Phe Ile Leu Tyr Gly Ile Val Pro Gln
515 520 525
Val Cys Phe Leu Lys Gly Ile Pro Val Phe Pro Lys Val Thr Asp Pro
530 535 540
Trp Phe Ala Val Phe Ala Thr Leu Tyr Ile Ser Thr Gln Ile Gln His
545 550 555 560
Leu Ile Glu Val Leu Ser Gly Asp Gly Ser Val Ala Met Trp Trp Asp
565 570 575
Glu Gln Gly Ile Trp Ile Leu Lys Ser Val Thr Ser Val Phe Ala Ile
580 585 590
Ile Glu Ala Ala Lys Lys Gly Leu Gly Leu Asn Lys Lys Lys Phe Met
595 600 605
Leu Ser Asn Lys Ala Ile Asp Lys Glu Lys Leu Lys Lys Tyr Glu Gln
610 615 620
Gly Arg Phe Asp Phe Gln Gly Ala Ala Leu Phe Met Ser Pro Met Val
625 630 635 640
Val Leu Leu Ile Val Asn Val Val Ser Phe Ile Gly Gly Ile Trp Arg
645 650 655
Leu Phe Asn Ala Lys Asp Ile Glu Asp Met Phe Gly Gln Leu Phe Leu
660 665 670
Val Ser Tyr Val Met Ala Leu Ser Tyr Pro Ile Phe Glu Gly Ile Ile
675 680 685
Thr Met Lys Ser Lys Ser Gly
690 695
<210> 103
<211> 2088
<212> DNA
<213> Glycyrrhiza uralensis
<400> 103
atggcaagct tcacccttca cacagaaacc gttcagtcat ggctactcct cagcagactt 60
cacatactgc tgcacctcgc agttgtactg ctcctcttat actaccgcat cacacgtttc 120
cccttccatg ctccgactct accgtggact ctgatgaccg taggtgaggc tattatggca 180
gtgctgtggt tcttcaacca ggccttccgg tggcggccgg tgagccgctc ggtgatgacg 240
gagaagctgc ccagcgacgc gaagctgccg gggcttgaca tattcgtgtg cacgcttgac 300
cccgagaagg agcccaccgt ggaggtgatg aacactctgg tctctgccct tgccatggac 360
tacccccctg acaagctctc cgtttacctc tccgacgatg gcgccgcccc ggtcactctt 420
tacggcgtga gagaggcttc tgagttcgcg agggtgtggg tccctttctg caaaaagtat 480
gggatcaagt caaggtgtcc caaggttttc ttctctccca gtgctgagga tgaacacctt 540
cttcgcaccg acgagttcag gtcagagcga gacctcatca aggctaaata cgagaaaatg 600
cagaaaaata ttgagaaatt tggttcggat gccaaaaatt gtcgtatggt gactgacaga 660
cctcctcgga tcgagatatt gattgaccaa ccagacatgc cacgtgttgt ttacgtgtct 720
cgggaaagaa ggccatcact ccctcacaag ttcaaaggag gagccctcaa tacattgctc 780
agagtctcag gtctaatcag caatgggcct tatgtacttg tagtggactg tgatatgtat 840
tgcaatgacc catcctcagc caaacaagcc atgtgtttct ttcttgatcc tgaaacctct 900
aaatctattg catttgtcca attccctcaa atgtttcaca accttggcaa aaaagacatc 960
tatgacaatc aatctaggac tgcttttaag acaatgtggc aagggatgga tggactaaga 1020
ggtcctggtc tttctggcag cggtaattac ttgaatagaa gtgcattact atttggaagt 1080
ccaaatcaaa aagatgacta tctggatgat gcccaaaact acttaggcaa gtctaccatg 1140
tacatagaat cactaaaggc cattcgtgga caaaaaacta tgaaaaagaa tatttcaaga 1200
gatgaaattt tacgagaagc tcaagtatta gcctcttgtt cctatgagac aaacacagaa 1260
tggggagcag aggtaggatt ctcatatggc atcttactgg agagttcaat cactggctat 1320
cttttccact gcagaggatg gaaatcagca tatctttacc caaagacacc atgtttctta 1380
gggtgtgccc caactgacat caaggaagga atgctccaat tggtgaagtg gttgtctgaa 1440
tactgcttgc taggattctc taaatacagc cctttcactt atggcttttc aagaatgccc 1500
attatgccta ccttagtcta ttgcttcttg acaacaacaa ccctttattc cattgtcttc 1560
atcctttatg gcattgtccc ccaagtttgc ttcttaaaag gaatacccgt gtttccaaag 1620
gtcacagacc cttggtttgc agtgtttgca acactgtata tatccaccca gattcaacat 1680
ttgatagagg tcctttctgg tgatggctct gtggcaatgt ggtgggatga acagggaatc 1740
tggattctga agtcagtcac tagcgtgttc gcaatcatag aggcagctaa gaaagggtta 1800
ggattgaaca agaagaaatt catgttgtca aacaaagcaa ttgacaagga gaagctcaag 1860
aagtatgagc aaggtaggtt tgatttccaa ggtgcagctc tgttcatgtc cccaatggtt 1920
gtgttgctca tagtgaacgt tgtttccttc attggtggca tatggagact attcaatgca 1980
aaggatattg aagatatgtt tggtcagctt ttcctagtta gttatgtaat ggcccttagt 2040
tatcccattt ttgaagggat aataaccatg aaaagcaaga gtggatag 2088
<210> 104
<211> 694
<212> PRT
<213> Lotus japonicus
<400> 104
Met Ala Asn Phe Thr Leu His Thr Glu Thr Val Gln Ala Trp Leu Pro
1 5 10 15
Leu Ser Arg Leu His Ile Leu Ile His Ser Val Phe Val Ile Leu Leu
20 25 30
Leu Tyr Tyr Arg Thr Thr Arg Leu Ile His Ala Pro Thr Ala Pro Trp
35 40 45
Ile Leu Met Thr Val Ala Glu Ala Leu Leu Ala Val Leu Trp Leu Phe
50 55 60
Asn Gln Ala Phe Arg Trp Arg Pro Val Ser Arg Ser Val Lys Thr Glu
65 70 75 80
Lys Leu Pro Arg Asp Glu Asn Leu Pro Gly Leu Asp Ile Phe Val Cys
85 90 95
Thr Ile Asp Pro Glu Lys Glu Pro Thr Ala Gly Val Met Asp Thr Val
100 105 110
Val Ser Ala Val Ala Met Asp Tyr Pro Pro Asp Lys Leu Ser Val Tyr
115 120 125
Leu Ser Asp Asp Gly Gly Cys Ala Val Thr Glu Tyr Gly Ile Arg Glu
130 135 140
Ala Cys Glu Phe Ala Lys Val Trp Val Pro Phe Cys Arg Lys Tyr Gly
145 150 155 160
Ile Lys Ser Arg Cys Pro Lys Val Phe Phe Ser Pro Met Gly Glu Asp
165 170 175
Glu Glu Ile Leu Arg Thr Asp Glu Phe Arg Ala Glu Gln Glu Lys Ile
180 185 190
Lys Ala Gln Tyr Glu Thr Met Gln Lys Asn Ile Glu Lys Phe Gly Ser
195 200 205
Asp Pro Lys Asn Cys Arg Ile Val Thr Asp Arg Pro Ser Lys Ile Glu
210 215 220
Val Ile Asn Glu Gln Ser Glu Ile Pro Arg Val Val Tyr Val Ser Arg
225 230 235 240
Glu Arg Arg Pro Ser Leu Pro His Lys Phe Lys Gly Gly Ala Leu Asn
245 250 255
Thr Leu Val Arg Val Ser Gly Leu Ile Ser Asn Gly Pro Tyr Val Leu
260 265 270
Ala Val Asp Cys Asp Met Tyr Cys Asn Asp Pro Ser Ser Ala Lys Gln
275 280 285
Ala Met Cys Phe Phe Leu Asp Pro Glu Thr Ser Lys Tyr Ile Ala Phe
290 295 300
Val Gln Phe Pro Gln Met Phe His Asn Leu Ser Lys Lys Asp Ile Tyr
305 310 315 320
Asp Asn Gln Ser Arg Thr Ala Phe Lys Ala Met Trp Gln Gly Met Asp
325 330 335
Gly Leu Ser Gly Pro Gly Leu Ser Gly Ser Gly Asn Tyr Leu Ser Arg
340 345 350
Ser Ala Leu Leu Phe Gly Ser Pro Asn Gln Lys Gly Asp Tyr Leu Leu
355 360 365
Asp Ala Gln Asn Tyr Phe Gly Glu Ser Pro Leu Tyr Ile Glu Ser Leu
370 375 380
Lys Ala Ile Arg Gly Gln Gln Thr Thr Lys Lys Asn Ile Ser Arg Asp
385 390 395 400
Glu Ser Leu Leu Glu Ala Lys Val Val Ala Ser Ala Ser Tyr Glu Thr
405 410 415
Asn Thr Glu Trp Gly Ser Glu Val Gly Phe Ser Tyr Gly Ile Leu Leu
420 425 430
Glu Ser Thr Ile Thr Gly Tyr Leu Leu His Cys Arg Gly Trp Lys Ser
435 440 445
Ala Tyr Leu Tyr Pro Lys Thr Pro Cys Phe Leu Gly Cys Ala Pro Thr
450 455 460
Asp Ile Lys Glu Gly Met Leu Gln Leu Val Lys Trp Leu Ser Glu Leu
465 470 475 480
Cys Leu Phe Ala Val Ser Lys Tyr Ser Pro Phe Thr Tyr Gly Phe Ser
485 490 495
Arg Leu Pro Ile Met Pro Thr Phe Thr Tyr Cys Phe Leu Ala Ala Ser
500 505 510
Ser Leu Tyr Ala Ile Val Phe Ile Leu Tyr Gly Ile Val Pro Gln Val
515 520 525
Cys Phe Leu Lys Gly Ile Pro Val Phe Pro Lys Ala Thr Asp Pro Trp
530 535 540
Phe Ala Val Phe Ala Val Leu Tyr Val Ala Thr Gln Ile Gln His Leu
545 550 555 560
Ile Glu Val Leu Ser Gly Asn Gly Ser Val Ser Met Trp Trp Asp Glu
565 570 575
Gln Arg Ile Trp Ile Leu Lys Ser Val Thr Ser Val Phe Ala Met Ile
580 585 590
Glu Gly Ile Lys Lys Trp Leu Gly Leu Asn Lys Lys Lys Phe Asn Leu
595 600 605
Ser Asn Lys Ala Val Asp Lys Glu Lys Val Lys Lys Tyr Glu Gln Gly
610 615 620
Arg Phe Asp Phe Gln Gly Ala Ala Leu Tyr Met Ser Pro Met Val Val
625 630 635 640
Leu Leu Leu Val Asn Ile Val Cys Phe Phe Gly Gly Leu Trp Arg Leu
645 650 655
Phe Lys Glu Lys Asp Phe Ala Asp Met Phe Gly Gln Leu Phe Leu Leu
660 665 670
Ser Tyr Val Met Ala Leu Ser Tyr Pro Ile Leu Glu Gly Ile Val Thr
675 680 685
Met Lys Met Lys Ser Gly
690
<210> 105
<211> 2085
<212> DNA
<213> Lotus japonicus
<400> 105
atggccaatt tcactctcca cacagaaacc gttcaagcat ggctccctct aagcagactc 60
cacattctta tacactcagt gttcgtcatc cttctcctct actaccgcac aacgcgtctc 120
atccacgcgc cgaccgcgcc gtggatcctg atgaccgttg cggaggctct cctcgccgtg 180
ctttggctct tcaaccaggc cttccggtgg cgaccggtga gccgctccgt gaagacagag 240
aagctgccgc gcgacgagaa tctccccggg ctggacatat ttgtgtgcac gattgatcct 300
gagaaggagc caacggcagg ggtgatggac acggttgttt ccgccgtggc gatggattac 360
ccgccggata agctatccgt gtatctttct gatgatggtg gttgcgccgt gacggagtat 420
gggattagag aggcttgtga gtttgccaag gtgtgggttc ctttttgtag aaagtatggg 480
atcaagtcga ggtgtccaaa agttttcttc tctccgatgg gggaagatga agagattcta 540
aggacagatg agttcagagc agagcaagag aagatcaagg cccaatacga gactatgcag 600
aaaaacatcg agaaatttgg ttcagacccc aaaaattgtc gtattgtgac tgacagaccc 660
tctaagatcg aggttataaa tgagcaatca gaaatcccac gtgttgtgta cgtctctcgt 720
gaaagaaggc catcacttcc tcacaagttc aaaggaggag ctctcaacac attggtcaga 780
gtgtcaggtc taatcagcaa tggaccttat gtgcttgcag tggattgtga tatgtattgc 840
aatgatccat cctctgccaa gcaagcaatg tgcttcttcc ttgatccaga aacatctaaa 900
tacattgcat ttgtccaatt ccctcaaatg tttcacaacc ttagtaagaa agacatctat 960
gataatcaat ctaggactgc ttttaaggca atgtggcaag gcatggatgg actcagtggt 1020
ccaggtcttt ctggcagtgg taactacttg agtagaagtg cattgctatt tggaagtcca 1080
aaccaaaaag gtgactatct gcttgatgct caaaactact ttggcgagtc tcccttgtac 1140
attgaatcat tgaaggccat ccgtggacaa caaactacca aaaagaatat ctcaagagac 1200
gaaagtttac tagaagctaa agtggtggcc tctgcttcct acgagacaaa cacagaatgg 1260
ggctcagagg ttggattctc atatggcatc ttactggaga gtactattac tggttacctt 1320
ttgcactgca gaggatggaa atcagcttat ctttacccaa aaacaccatg tttcttaggg 1380
tgtgccccca ctgacattaa agaaggcatg cttcagttgg tgaagtggtt gtctgagctt 1440
tgcttgtttg ctgtctctaa gtacagccct tttacatatg ggttttcaag attgcccatt 1500
atgcctacct tcacttattg tttcctggca gcttcatccc tatatgctat tgtcttcatc 1560
ctttatggca ttgtacctca agtgtgcttc ttgaaaggaa tccctgtgtt tccaaaggcc 1620
acagaccctt ggtttgcagt gtttgcagta ttgtatgtag ccacccagat tcaacatttg 1680
attgaagtcc tttctggcaa tggctcggtc tcgatgtggt gggatgaaca aagaatttgg 1740
attctgaagt cagttactag cgtatttgca atgatagagg gaatcaagaa atggttagga 1800
ttgaacaaga aaaaattcaa cctgtcaaac aaagcggttg acaaggagaa ggtcaagaaa 1860
tatgagcaag gtaggtttga tttccaagga gcagctctgt acatgtctcc aatggttgtg 1920
ttgctcctag tgaacattgt ttgcttcttt ggcggtttat ggagactgtt taaggagaaa 1980
gattttgcag atatgtttgg tcaacttttc ctactcagct atgtgatggc tctcagttat 2040
cccattcttg aggggatagt aactatgaaa atgaagagtg ggtag 2085
<210> 106
<211> 350
<212> DNA
<213> Artificial Sequence
<220>
<223> SOAP5_VIGS_spinach
<400> 106
ttccgtagcc atcttctcgc tcttctacta ccgtttcact tccttcttca actccgacat 60
ctccatactt gcttactcct tactcaccac cgccgaactc ttcttaacct ttctatgggc 120
ttttactcag gctttccggt ggcgtcccgt aatgagggaa gtctccgggt acgaatccat 180
caaacccgaa caactaccgg gtttggatgt cttcattgtc actgctgacc cgacaaagga 240
gccagttctg gaggtgatga actccgtgat atcatccatg gcgttggatt atccggttga 300
tagactggcg gtttacttgt cggatgacgg tggttctccg ttgtcgaagg 350
<210> 107
<211> 438
<212> DNA
<213> Artificial Sequence
<220>
<223> BvCSL_VIGS_red beet
<400> 107
ccttcggctc ctccacaaaa ttcattgcgt cagttagttc aaactccaag caaaatatgg 60
ccttgaagga aatgacaaga gacgacttgt tagaagaggc taaaaatttg gctacttgtg 120
catatgaatc aaacactgaa tggggtaaca agattggata ttcgtatgag tgtttgttgg 180
agagtacatt taccggatat ctcttacatt gcaaaggatg gatttccgtg tatctttacc 240
caaaaagacc ctgcttctta ggatgcacga cgattgacat gaaagatgcc atggttcaac 300
taatgaaatg gacctctgga ttactaggag ttggcatatc aaagtttagc cctctaactt 360
atgccttttc gaggatgtct atattacaaa gcatgtgcta cggttacttc acattttcag 420
cccttttcgg agtttcgt 438
<210> 108
<211> 2148
<212> DNA
<213> Artificial Sequence
<220>
<223> MsCSL_asRNA_Medicago sativa
<400> 108
ctacccactc ttccgcttca tagatataat cccctccaca ataggatgac ttagagcaag 60
tatatagata atgaggaaaa gttgaccaaa catttcatca aaatccctca cattgagtag 120
tctccataaa ccaccaaaga agcaaacaat atttattgtg agtaacacaa tcactggtgc 180
catgagcaat gctgcaccat caaaattaaa cttaccctgc tcatatttct ttagcttatc 240
tttgtcaatt gctttgtccg ataaagtgaa ttttgccttg ttcaacccaa actttttttt 300
cgctgtttct ataattgcga aaacgcaccc aattgatttt acaatcccac ttctttgttc 360
attccaccaa atcatcgagg agccaccagt tgaaattacc tcaatataat gatgaatttg 420
actggataga tacaatactg taaacactat aaaccaagga tctgtaacct ttggatatac 480
aggtattccc ttcaagaagc aaatctgagg aacgaatcca tataagatgt aggctgttgc 540
aaattgggtt gtgcttacca agtaacaaaa agttaaacaa tgaatagtgg gcaatcttga 600
aaggccataa gtgaatgggc tatatttaga gattgcaagc aacaaaagtt cagatgacca 660
ctttatcggt tgaatcaatc cctctttcat gtcagttgga gcacatccta agaaacatgg 720
tcttttaggg taaagataag ttgatctcca tcctctacaa tggaggagat agccagtaac 780
ggtactctca agttttatag catacgagaa tcccacctca ttaccccaat ttgtgtttct 840
ctcataggaa caagaagcca cttcacatgc ttcttgtaaa attacatctc ttgaaatatt 900
ctgcttctta gtttgttgac cacgtaacgc ttttagtgat tctacataca tgttagactt 960
gccaaagttg tatagagcat caagtagata gtcccctttt tggtttggac ttccaaagag 1020
taatgcactt ctacttatat aatttccact gccagttaga cctggacctc ttaatccatc 1080
cattcccttc cactttgtcg taaaagcagt cctagtctga ctatcatata tgtctttctt 1140
gctaaggttg tgaaacattt gagggaattg aacaaaagca acatctttag aggtttcagg 1200
atcaagaaaa aagcacatgg attgtttggc tgatgatgca tcattacaat tcatatcaca 1260
atctacgaca agtacataag gtccattgct gattagccct gacaccctaa gcaatgtatt 1320
gagagctcct cctttgaatc tgtgaggaac agatggtctt ttttcacgag atacataaac 1380
aactagtggc atttcttttt ggtcattaat gatctcgatc cgagaaggtc tatcggtcac 1440
catacaaaga ttctttaggt tgcttccgaa tttctcaata tttttctgca ttttctcgta 1500
tttggctttg gtgggcatat gttccttgga gttttcaact tgtgatgagt taggatccac 1560
tctatttaat ctcttcttaa tctggtccct cacttcttca aattcacgag gtcgatgaag 1620
tcgttcattc tcacccaaag cagtgaagaa aaacttagga caccttgact taacatcata 1680
ttttttacaa aaaggaaccc aaactttagc aaattcaaaa gcctctttga tcccaaaaag 1740
agtaatagga gaacctccat catcagaaag ataaatagaa agtttattag aagggtaatc 1800
cattgcaata gcagaaataa cagtgttcat aacatcaacc gttggttctt tttcaggatc 1860
aatggtacac acaaatatgt cgagtcccgg caacttctcc tccggcggta atttctcggt 1920
cataactgaa cgattcacca gcctccaacg gaatgcttgg ttgaaaaacc atagaaatga 1980
tagaataatc tcagctattg tcattagaaa ccatggatat gaaataaaca aattgctgat 2040
acggtagtaa aagagaaaca agacacatgt gaagtggaag attatgtaag ctcttcttag 2100
aggtaacaat ggttgaactg tttctttgtg aaatgtgaag gttgccat 2148
<210> 109
<211> 1431
<212> DNA
<213> Spinacia oleracea
<400> 109
atggccaaat ctgagcaaga aacaatggcc aaatctgagc aagaaacatc catcaaactt 60
gtttcagaat gctttgtaaa accaaaatat gagattaaat ccgctaagca accttaccac 120
ttaggtccca tggatctagt tatgttaact atcgatccta tacaaaaagg tcttgtcttt 180
acaataaaga attccccact ctttttgtca tccgaatccc atgataatat tgaaattatt 240
cgaaccaaag ttgtgtcacg tttattagaa aagcttaaac actcactttc tatagctcta 300
gtccacttct acccgttagc aggtcgtttc actacacaaa aacaacccga gcataacacg 360
agcttggtct ttattgattg caacaaaggt cccggagcgc ggttcatcca cgctacttcc 420
cttgacttta ctatctccga tatactttca ccggttgatg tttccatcgt tcattctttc 480
tttgatctcg gtgaaaagca tgtaaactac gattgtcata ctaaggcgtt gctatcgatc 540
caggtaacag aacttttaga tggggtgttt attgggttta gcatgagtca tagtgtggtt 600
gatggtacct cttttattca ttttgtcaat accttgtctg aaatttttaa atctgatgat 660
tttaccacta tttcacgtgc cccaatactt aattataggc cttgtgatat tccgatcctt 720
aaatttccgt ttcttgatgt ggaggggttt atatgtcgtg cgtataaccc tgggccgtta 780
agggaaagaa tcttccactt ttcactaaat tcgatgctga gactcaaggc catggctaac 840
caagaatgtg gtacccaaaa tgttttatca tctttccaag ctttgactgc ggttgtatgg 900
aggtccatca cccgagttcg gaacttacca aaggatgagc aaaccacgtg ttttatggct 960
atgggttctc gaactaggct caacccgcct ctttcggatg actattttgg gaattttatg 1020
attagtacca aatttgcttg caaggcagag gaattattgg gtaacagttt aggttgggta 1080
gcaatgaatt tacgtaaaat cattatgtcc actgacgaga aatcgatact tgctacgtac 1140
aaagcattgg ctgattcccc aatagtgatt ccgcgtgaaa cgatccccgg tcctcatggg 1200
atgaccagag taataattgg aggatcttca aggttcgata tgtatgggcc tgaatttgga 1260
ttgggtcgag ctttggccgc tcgcatgggt tatgggaata aggatgatgg gaaaataaca 1320
gcaaatcctg ggtgtgaagg aggtggaagt gttgatttgg aaatttgcct taggcctcat 1380
attatggcct ctcttgaagt tgatcaagag tttatgggtt ttgtgtccta g 1431
<210> 110
<211> 1191
<212> DNA
<213> Spinacia oleracea
<400> 110
atgactccaa atctgcaaat agtaaccaac ggaggcaaac cggaaaatga tgaagcagaa 60
cccgtatcac ctaccggaca atacttcaac agcaaagtgt tgtctgtttg tgtccttgcc 120
attctagaaa ttgatgttcc tatagatgac tcgtgtgtaa ttccacaact ccgtgatgtc 180
ttcctaccca tgaaccccag attttcatct atcatgatat ctgacaataa agatgtaaaa 240
caatggaaaa gagtggaagt gaaccttcaa gatcatgttg tcgtccctag cgtcccagat 300
ggcttatcgg ttgaatcata cgacaagtac tttgatgaat atctgacaaa aataacagtg 360
gatccattac cacaggatag gcctttatgg gaacttcatg ttataaaata cccaacaagc 420
aaagcagcgg gtcatttcat ctggaagctt caccatgcac ttggtgacgg ctacactcta 480
atgggagtac ttctgtccgg cgtgaacaga gcagatgatc cttcccttcc gttaactttc 540
ccttcaacac gatcaagctc actagttaca aacaacaaga tgaatattat cagctgggtg 600
ccaagaactt tttcagcaat ctacaacggt gtttataatt ttggatggag ttttctaaaa 660
agcacttgca aggcagatga taagacacct atcagatccg gaaatgaagg tctgggtttc 720
cacccaatga agatctcgac aatagaacta tccctagacc aaatcaaatt tatcaaaaca 780
aaactcggcg caacggtaaa tgacattctt gcaggcataa ttttcctcgg ggttcgaaaa 840
tacatgcaag caactgatac agaatctgga aactcagaat caacggcatt ggtgctgttt 900
aacactagga acattggagg ttatatgacc gctgagcaaa tgaagaaagc acaaatgaaa 960
atatggggga accaatttgc atttttgcat atagcaatac ctcaattaat caatgacaaa 1020
tgctcgaacc cccttgacta tgtctatgaa gcacgaaaac agatctctag gttcaaaagc 1080
tcaccatcag tctatctaac agctcagtgc ctagagctgc taggaaatgc aaaggacctg 1140
aggcagcagc tgaatttatc cagagtacaa cgaataaagc aagcatatta a 1191
<210> 111
<211> 1043
<212> DNA
<213> Spinacia oleracea
<400> 111
atgttagagc tagcagaaga cgaggtgaag aacttcttca aggtatgggc aatagttttt 60
gcatctttaa gctattgtta ttacataggc aagctaatta atccaaaagg ttatacaaga 120
ttagtagcaa taatcccaat tattactctc tttttagcac ttcctttaaa tctcacatct 180
tttcatcttg gtggtatgac ttgtttcttt attgcttggc ttgctaattt caaactcttg 240
ctttttgctt ttgataaggg cccactttgc gctaattctt caatctcatt cgccaaattt 300
cttgcacttt cttgcttacc catcaaaatc caacacccac ctcataaaaa gtcattaaaa 360
tcacacccat ctatttataa ttacatcatt aaagggatac ttttatgtct aataattaaa 420
atctatgatt atggtgatta cattcatcca aaaatcatat ggctaatctt tttcttccac 480
tcctatttta ccatagagtt agtctttgca ttcctagcaa catcgactaa tattttgtta 540
gggctcgaac tggagccaca gttcaatgaa cccttaatat caacctcatt gcaagacttt 600
tggggtaaga gatggaatat catggtgaca aggatactta ggcctacggt gtaccttccc 660
acactagagt actccactaa ggtcgttgga cgcacgtggg ccacacttcc ggcggtgatg 720
tccacgttct ttgtgtcagc cattatgcac gagctcatct tctactactt ggggcgcaac 780
tggcccacat tcgaggtgac gtggttcttt ctcctgcatg gattatgtct ttgtgttgag 840
attgtcgcta agaagttagt tggtgggaaa tggaggatcc cacggtggat ttccggccct 900
gccacggtgt tgtttgtggt gggtactggg ttttggctgt tcttgccgcc gttgttgaag 960
gctgggttgg atactagacc gtttcaagag tttgcggccg ttgccaagtt tgtaaggagt 1020
ttgaaggcag ctctcacatt ttg 1043
<210> 112
<211> 1530
<212> DNA
<213> Spinacia oleracea
<400> 112
atggctcctc cttcttcttc ttcaactacg ggttctggta atggttctag ttttgcagtc 60
aatataatgg cgtcgttcta catttcccca caacaacctt ccaccacaaa ttcacattct 120
atccctctca ctttctttga cattccttgg cttcaatatc ctccgctcca acctctcttc 180
ttctttcaac ttccatctac accccaatct tcttcttctt cttcttcttc ttcttcttct 240
tctttcgacc acaacttgta cttggagttt agctccacca tcctccctag gctcaaacac 300
tccctcgctt ctgccttgca atattacttt cccttttctg gaaaactcac cactactacc 360
catactatcc cgaataacct agttttctcg acagactcat cagattctgt tgagttgact 420
gtttctctgt gtgatgctga ttttaatggt ctatgcagct ttctacccag gtctactcat 480
ctcttccaac aattggttcc ctccttgcca aatattgaat cctccaacct cactacattc 540
cctgcacctt tattagctat tcagatcaca ttctttccca cctcttctcc tggtttctct 600
attggctttg cttctcatcc tgtgctttct gatcagagga ccttcagtaa cttcctttac 660
tcttgggcct ctttctccaa gtttgataat ctaaacattt cacttgcccc ttccttccct 720
gtctctgaca ggtctgtcat tctcgaccct gatagacttg agccccttct gttggagcag 780
tggttgggat tggagtccaa accaaccatg tcaacaaaga tgaagctacg tcctcctcct 840
gcttatgtcc gtggctcgct ccggtccaca ttcgtcatgg gcccatctga tattgctaat 900
gctacacaat ggttacaaac ccagtgtgag aagctcaaca gatcatatcc tgttctcttg 960
tcaccctacg tcgtcacttg tgcctttata tggacctgtt ttctgagagc ccgagtccag 1020
aacagtgctg ttactaaagc caaagcaaaa ggcaccatgt actttggatt tattgctggt 1080
ggtattaccc gtttacccta tcgggtacct gctaagtatc ttggcaactg tgtcgggttt 1140
ggacgggcag cagcgcagag ggaggagcta ctgaaggaag gtgaggggat gttggcagct 1200
gctgatgcaa ttgggctaac cattaaaaag ttggataaag atgttttagg aggagctgag 1260
aaatggatat atgaatggca gacattaatg gaatccgaag atcatattca tgtggttggg 1320
tcgcccaagg tgaaccttta tgagacggat ttttggtggg ggaaaccgaa gaagatagag 1380
gaaatttcaa ctgatgttac cagagccatc tctcttacac agagcaggga catgaaaagg 1440
ggaattgaaa ttggcctcac tttaccaaac tccattatgg atgacttctc ctctatcttc 1500
actcaaggcc tccttgtttt tcaaaattag 1530
<210> 113
<211> 476
<212> PRT
<213> Spinacia oleracea
<400> 113
Met Ala Lys Ser Glu Gln Glu Thr Met Ala Lys Ser Glu Gln Glu Thr
1 5 10 15
Ser Ile Lys Leu Val Ser Glu Cys Phe Val Lys Pro Lys Tyr Glu Ile
20 25 30
Lys Ser Ala Lys Gln Pro Tyr His Leu Gly Pro Met Asp Leu Val Met
35 40 45
Leu Thr Ile Asp Pro Ile Gln Lys Gly Leu Val Phe Thr Ile Lys Asn
50 55 60
Ser Pro Leu Phe Leu Ser Ser Glu Ser His Asp Asn Ile Glu Ile Ile
65 70 75 80
Arg Thr Lys Val Val Ser Arg Leu Leu Glu Lys Leu Lys His Ser Leu
85 90 95
Ser Ile Ala Leu Val His Phe Tyr Pro Leu Ala Gly Arg Phe Thr Thr
100 105 110
Gln Lys Gln Pro Glu His Asn Thr Ser Leu Val Phe Ile Asp Cys Asn
115 120 125
Lys Gly Pro Gly Ala Arg Phe Ile His Ala Thr Ser Leu Asp Phe Thr
130 135 140
Ile Ser Asp Ile Leu Ser Pro Val Asp Val Ser Ile Val His Ser Phe
145 150 155 160
Phe Asp Leu Gly Glu Lys His Val Asn Tyr Asp Cys His Thr Lys Ala
165 170 175
Leu Leu Ser Ile Gln Val Thr Glu Leu Leu Asp Gly Val Phe Ile Gly
180 185 190
Phe Ser Met Ser His Ser Val Val Asp Gly Thr Ser Phe Ile His Phe
195 200 205
Val Asn Thr Leu Ser Glu Ile Phe Lys Ser Asp Asp Phe Thr Thr Ile
210 215 220
Ser Arg Ala Pro Ile Leu Asn Tyr Arg Pro Cys Asp Ile Pro Ile Leu
225 230 235 240
Lys Phe Pro Phe Leu Asp Val Glu Gly Phe Ile Cys Arg Ala Tyr Asn
245 250 255
Pro Gly Pro Leu Arg Glu Arg Ile Phe His Phe Ser Leu Asn Ser Met
260 265 270
Leu Arg Leu Lys Ala Met Ala Asn Gln Glu Cys Gly Thr Gln Asn Val
275 280 285
Leu Ser Ser Phe Gln Ala Leu Thr Ala Val Val Trp Arg Ser Ile Thr
290 295 300
Arg Val Arg Asn Leu Pro Lys Asp Glu Gln Thr Thr Cys Phe Met Ala
305 310 315 320
Met Gly Ser Arg Thr Arg Leu Asn Pro Pro Leu Ser Asp Asp Tyr Phe
325 330 335
Gly Asn Phe Met Ile Ser Thr Lys Phe Ala Cys Lys Ala Glu Glu Leu
340 345 350
Leu Gly Asn Ser Leu Gly Trp Val Ala Met Asn Leu Arg Lys Ile Ile
355 360 365
Met Ser Thr Asp Glu Lys Ser Ile Leu Ala Thr Tyr Lys Ala Leu Ala
370 375 380
Asp Ser Pro Ile Val Ile Pro Arg Glu Thr Ile Pro Gly Pro His Gly
385 390 395 400
Met Thr Arg Val Ile Ile Gly Gly Ser Ser Arg Phe Asp Met Tyr Gly
405 410 415
Pro Glu Phe Gly Leu Gly Arg Ala Leu Ala Ala Arg Met Gly Tyr Gly
420 425 430
Asn Lys Asp Asp Gly Lys Ile Thr Ala Asn Pro Gly Cys Glu Gly Gly
435 440 445
Gly Ser Val Asp Leu Glu Ile Cys Leu Arg Pro His Ile Met Ala Ser
450 455 460
Leu Glu Val Asp Gln Glu Phe Met Gly Phe Val Ser
465 470 475
<210> 114
<211> 396
<212> PRT
<213> Spinacia oleracea
<400> 114
Met Thr Pro Asn Leu Gln Ile Val Thr Asn Gly Gly Lys Pro Glu Asn
1 5 10 15
Asp Glu Ala Glu Pro Val Ser Pro Thr Gly Gln Tyr Phe Asn Ser Lys
20 25 30
Val Leu Ser Val Cys Val Leu Ala Ile Leu Glu Ile Asp Val Pro Ile
35 40 45
Asp Asp Ser Cys Val Ile Pro Gln Leu Arg Asp Val Phe Leu Pro Met
50 55 60
Asn Pro Arg Phe Ser Ser Ile Met Ile Ser Asp Asn Lys Asp Val Lys
65 70 75 80
Gln Trp Lys Arg Val Glu Val Asn Leu Gln Asp His Val Val Val Pro
85 90 95
Ser Val Pro Asp Gly Leu Ser Val Glu Ser Tyr Asp Lys Tyr Phe Asp
100 105 110
Glu Tyr Leu Thr Lys Ile Thr Val Asp Pro Leu Pro Gln Asp Arg Pro
115 120 125
Leu Trp Glu Leu His Val Ile Lys Tyr Pro Thr Ser Lys Ala Ala Gly
130 135 140
His Phe Ile Trp Lys Leu His His Ala Leu Gly Asp Gly Tyr Thr Leu
145 150 155 160
Met Gly Val Leu Leu Ser Gly Val Asn Arg Ala Asp Asp Pro Ser Leu
165 170 175
Pro Leu Thr Phe Pro Ser Thr Arg Ser Ser Ser Leu Val Thr Asn Asn
180 185 190
Lys Met Asn Ile Ile Ser Trp Val Pro Arg Thr Phe Ser Ala Ile Tyr
195 200 205
Asn Gly Val Tyr Asn Phe Gly Trp Ser Phe Leu Lys Ser Thr Cys Lys
210 215 220
Ala Asp Asp Lys Thr Pro Ile Arg Ser Gly Asn Glu Gly Leu Gly Phe
225 230 235 240
His Pro Met Lys Ile Ser Thr Ile Glu Leu Ser Leu Asp Gln Ile Lys
245 250 255
Phe Ile Lys Thr Lys Leu Gly Ala Thr Val Asn Asp Ile Leu Ala Gly
260 265 270
Ile Ile Phe Leu Gly Val Arg Lys Tyr Met Gln Ala Thr Asp Thr Glu
275 280 285
Ser Gly Asn Ser Glu Ser Thr Ala Leu Val Leu Phe Asn Thr Arg Asn
290 295 300
Ile Gly Gly Tyr Met Thr Ala Glu Gln Met Lys Lys Ala Gln Met Lys
305 310 315 320
Ile Trp Gly Asn Gln Phe Ala Phe Leu His Ile Ala Ile Pro Gln Leu
325 330 335
Ile Asn Asp Lys Cys Ser Asn Pro Leu Asp Tyr Val Tyr Glu Ala Arg
340 345 350
Lys Gln Ile Ser Arg Phe Lys Ser Ser Pro Ser Val Tyr Leu Thr Ala
355 360 365
Gln Cys Leu Glu Leu Leu Gly Asn Ala Lys Asp Leu Arg Gln Gln Leu
370 375 380
Asn Leu Ser Arg Val Gln Arg Ile Lys Gln Ala Tyr
385 390 395
<210> 115
<211> 347
<212> PRT
<213> Spinacia oleracea
<400> 115
Met Leu Glu Leu Ala Glu Asp Glu Val Lys Asn Phe Phe Lys Val Trp
1 5 10 15
Ala Ile Val Phe Ala Ser Leu Ser Tyr Cys Tyr Tyr Ile Gly Lys Leu
20 25 30
Ile Asn Pro Lys Gly Tyr Thr Arg Leu Val Ala Ile Ile Pro Ile Ile
35 40 45
Thr Leu Phe Leu Ala Leu Pro Leu Asn Leu Thr Ser Phe His Leu Gly
50 55 60
Gly Met Thr Cys Phe Phe Ile Ala Trp Leu Ala Asn Phe Lys Leu Leu
65 70 75 80
Leu Phe Ala Phe Asp Lys Gly Pro Leu Cys Ala Asn Ser Ser Ile Ser
85 90 95
Phe Ala Lys Phe Leu Ala Leu Ser Cys Leu Pro Ile Lys Ile Gln His
100 105 110
Pro Pro His Lys Lys Ser Leu Lys Ser His Pro Ser Ile Tyr Asn Tyr
115 120 125
Ile Ile Lys Gly Ile Leu Leu Cys Leu Ile Ile Lys Ile Tyr Asp Tyr
130 135 140
Gly Asp Tyr Ile His Pro Lys Ile Ile Trp Leu Ile Phe Phe Phe His
145 150 155 160
Ser Tyr Phe Thr Ile Glu Leu Val Phe Ala Phe Leu Ala Thr Ser Thr
165 170 175
Asn Ile Leu Leu Gly Leu Glu Leu Glu Pro Gln Phe Asn Glu Pro Leu
180 185 190
Ile Ser Thr Ser Leu Gln Asp Phe Trp Gly Lys Arg Trp Asn Ile Met
195 200 205
Val Thr Arg Ile Leu Arg Pro Thr Val Tyr Leu Pro Thr Leu Glu Tyr
210 215 220
Ser Thr Lys Val Val Gly Arg Thr Trp Ala Thr Leu Pro Ala Val Met
225 230 235 240
Ser Thr Phe Phe Val Ser Ala Ile Met His Glu Leu Ile Phe Tyr Tyr
245 250 255
Leu Gly Arg Asn Trp Pro Thr Phe Glu Val Thr Trp Phe Phe Leu Leu
260 265 270
His Gly Leu Cys Leu Cys Val Glu Ile Val Ala Lys Lys Leu Val Gly
275 280 285
Gly Lys Trp Arg Ile Pro Arg Trp Ile Ser Gly Pro Ala Thr Val Leu
290 295 300
Phe Val Val Gly Thr Gly Phe Trp Leu Phe Leu Pro Pro Leu Leu Lys
305 310 315 320
Ala Gly Leu Asp Thr Arg Pro Phe Gln Glu Phe Ala Ala Val Ala Lys
325 330 335
Phe Val Arg Ser Leu Lys Ala Ala Leu Thr Phe
340 345
<210> 116
<211> 509
<212> PRT
<213> Spinacia oleracea
<400> 116
Met Ala Pro Pro Ser Ser Ser Ser Thr Thr Gly Ser Gly Asn Gly Ser
1 5 10 15
Ser Phe Ala Val Asn Ile Met Ala Ser Phe Tyr Ile Ser Pro Gln Gln
20 25 30
Pro Ser Thr Thr Asn Ser His Ser Ile Pro Leu Thr Phe Phe Asp Ile
35 40 45
Pro Trp Leu Gln Tyr Pro Pro Leu Gln Pro Leu Phe Phe Phe Gln Leu
50 55 60
Pro Ser Thr Pro Gln Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser
65 70 75 80
Ser Phe Asp His Asn Leu Tyr Leu Glu Phe Ser Ser Thr Ile Leu Pro
85 90 95
Arg Leu Lys His Ser Leu Ala Ser Ala Leu Gln Tyr Tyr Phe Pro Phe
100 105 110
Ser Gly Lys Leu Thr Thr Thr Thr His Thr Ile Pro Asn Asn Leu Val
115 120 125
Phe Ser Thr Asp Ser Ser Asp Ser Val Glu Leu Thr Val Ser Leu Cys
130 135 140
Asp Ala Asp Phe Asn Gly Leu Cys Ser Phe Leu Pro Arg Ser Thr His
145 150 155 160
Leu Phe Gln Gln Leu Val Pro Ser Leu Pro Asn Ile Glu Ser Ser Asn
165 170 175
Leu Thr Thr Phe Pro Ala Pro Leu Leu Ala Ile Gln Ile Thr Phe Phe
180 185 190
Pro Thr Ser Ser Pro Gly Phe Ser Ile Gly Phe Ala Ser His Pro Val
195 200 205
Leu Ser Asp Gln Arg Thr Phe Ser Asn Phe Leu Tyr Ser Trp Ala Ser
210 215 220
Phe Ser Lys Phe Asp Asn Leu Asn Ile Ser Leu Ala Pro Ser Phe Pro
225 230 235 240
Val Ser Asp Arg Ser Val Ile Leu Asp Pro Asp Arg Leu Glu Pro Leu
245 250 255
Leu Leu Glu Gln Trp Leu Gly Leu Glu Ser Lys Pro Thr Met Ser Thr
260 265 270
Lys Met Lys Leu Arg Pro Pro Pro Ala Tyr Val Arg Gly Ser Leu Arg
275 280 285
Ser Thr Phe Val Met Gly Pro Ser Asp Ile Ala Asn Ala Thr Gln Trp
290 295 300
Leu Gln Thr Gln Cys Glu Lys Leu Asn Arg Ser Tyr Pro Val Leu Leu
305 310 315 320
Ser Pro Tyr Val Val Thr Cys Ala Phe Ile Trp Thr Cys Phe Leu Arg
325 330 335
Ala Arg Val Gln Asn Ser Ala Val Thr Lys Ala Lys Ala Lys Gly Thr
340 345 350
Met Tyr Phe Gly Phe Ile Ala Gly Gly Ile Thr Arg Leu Pro Tyr Arg
355 360 365
Val Pro Ala Lys Tyr Leu Gly Asn Cys Val Gly Phe Gly Arg Ala Ala
370 375 380
Ala Gln Arg Glu Glu Leu Leu Lys Glu Gly Glu Gly Met Leu Ala Ala
385 390 395 400
Ala Asp Ala Ile Gly Leu Thr Ile Lys Lys Leu Asp Lys Asp Val Leu
405 410 415
Gly Gly Ala Glu Lys Trp Ile Tyr Glu Trp Gln Thr Leu Met Glu Ser
420 425 430
Glu Asp His Ile His Val Val Gly Ser Pro Lys Val Asn Leu Tyr Glu
435 440 445
Thr Asp Phe Trp Trp Gly Lys Pro Lys Lys Ile Glu Glu Ile Ser Thr
450 455 460
Asp Val Thr Arg Ala Ile Ser Leu Thr Gln Ser Arg Asp Met Lys Arg
465 470 475 480
Gly Ile Glu Ile Gly Leu Thr Leu Pro Asn Ser Ile Met Asp Asp Phe
485 490 495
Ser Ser Ile Phe Thr Gln Gly Leu Leu Val Phe Gln Asn
500 505
<210> 117
<211> 1419
<212> DNA
<213> Spinacia oleracea
<400> 117
atggccgcct caaacaaaga gcaaagcaag ctacatattg ctatgtttcc ttggtttgca 60
tatggtcata taaacccatt catccagctc tctaacaagc tttcctccca tggcatccaa 120
atctctttct tctcaatacc aggaaacatt gatcgtatca aatcctccct taatctctca 180
cctcccaacc agctcatccc cctcactatt cccccaactg aaggactctc tcccaacttt 240
gacagcagct ctgaagtaac acctcaaact gctcagcttc tcacactagc acttgatcaa 300
atgcagcccc aagtcaaagc tctattccct cacccccagc cacaagttat cctctttgat 360
tttgcatatc actggcttcc ctcagtagct tctgaactag gcatcaaagc tgttcatttc 420
aatacattcc cagctgttat caattcatat ctcactgtcc cttcaagaat gactgatcca 480
aataaaccac cgacatttga ggacttgaag aaccctcctc aaggctatcc caaaacctca 540
accgcctcag tgaaaacctt cgaagctcaa gattacctat tccttttcaa gagtttcgat 600
ggcggaccgt gccatttcga aaagatattg gcattcacaa acagctgtga tgctatactt 660
tacaggacct gcaatgaaat agaaggtcca ttcatagatt acttcaagac ccaaataaat 720
aaaccactgc ttttagctgg cccaagtgtt cctctaccac cctctggtga actggatgaa 780
aaatgggaga tgtggttagg taaatttcct gaaaagtcag tcatatactg cagcttcgga 840
agcgagacat acttgaatga tgctcagatt caggagctta cacttgggtt ggagctcact 900
ggtctgccct ttatcttggt tttgaatttt ggaacaagta acagcaccga tgcccacaat 960
aagctagaag catcattacc agaaggattt agagagagaa tcaaagacag gggcgttctg 1020
catacaggat gggtgcaaca gcaaaacatt ttagcacaca gaagcatagg atgctttctt 1080
actcacgcag ggttcagctc tgtaatagag ggtattgtga atgactgtca attagcattt 1140
ctacctctaa aggctgacca gtttatgatc gctaagctat ttagtgggga tctgaaagca 1200
ggggtggagg taaatcgaag agatgaagat gggtcttttg ccaaagaaga tattttcgaa 1260
gcaataaaga cgatcatggt ggatactgat aaagaaccaa gtagatccat cagggagaat 1320
catagcaatt ggagaaagtt tttgatgaat aaggagattg aagctagtta tattgcaaat 1380
ttagctcatg aactcaaggc attggttcaa aaagcttag 1419
<210> 118
<211> 472
<212> PRT
<213> Spinacia oleracea
<400> 118
Met Ala Ala Ser Asn Lys Glu Gln Ser Lys Leu His Ile Ala Met Phe
1 5 10 15
Pro Trp Phe Ala Tyr Gly His Ile Asn Pro Phe Ile Gln Leu Ser Asn
20 25 30
Lys Leu Ser Ser His Gly Ile Gln Ile Ser Phe Phe Ser Ile Pro Gly
35 40 45
Asn Ile Asp Arg Ile Lys Ser Ser Leu Asn Leu Ser Pro Pro Asn Gln
50 55 60
Leu Ile Pro Leu Thr Ile Pro Pro Thr Glu Gly Leu Ser Pro Asn Phe
65 70 75 80
Asp Ser Ser Ser Glu Val Thr Pro Gln Thr Ala Gln Leu Leu Thr Leu
85 90 95
Ala Leu Asp Gln Met Gln Pro Gln Val Lys Ala Leu Phe Pro His Pro
100 105 110
Gln Pro Gln Val Ile Leu Phe Asp Phe Ala Tyr His Trp Leu Pro Ser
115 120 125
Val Ala Ser Glu Leu Gly Ile Lys Ala Val His Phe Asn Thr Phe Pro
130 135 140
Ala Val Ile Asn Ser Tyr Leu Thr Val Pro Ser Arg Met Thr Asp Pro
145 150 155 160
Asn Lys Pro Pro Thr Phe Glu Asp Leu Lys Asn Pro Pro Gln Gly Tyr
165 170 175
Pro Lys Thr Ser Thr Ala Ser Val Lys Thr Phe Glu Ala Gln Asp Tyr
180 185 190
Leu Phe Leu Phe Lys Ser Phe Asp Gly Gly Pro Cys His Phe Glu Lys
195 200 205
Ile Leu Ala Phe Thr Asn Ser Cys Asp Ala Ile Leu Tyr Arg Thr Cys
210 215 220
Asn Glu Ile Glu Gly Pro Phe Ile Asp Tyr Phe Lys Thr Gln Ile Asn
225 230 235 240
Lys Pro Leu Leu Leu Ala Gly Pro Ser Val Pro Leu Pro Pro Ser Gly
245 250 255
Glu Leu Asp Glu Lys Trp Glu Met Trp Leu Gly Lys Phe Pro Glu Lys
260 265 270
Ser Val Ile Tyr Cys Ser Phe Gly Ser Glu Thr Tyr Leu Asn Asp Ala
275 280 285
Gln Ile Gln Glu Leu Thr Leu Gly Leu Glu Leu Thr Gly Leu Pro Phe
290 295 300
Ile Leu Val Leu Asn Phe Gly Thr Ser Asn Ser Thr Asp Ala His Asn
305 310 315 320
Lys Leu Glu Ala Ser Leu Pro Glu Gly Phe Arg Glu Arg Ile Lys Asp
325 330 335
Arg Gly Val Leu His Thr Gly Trp Val Gln Gln Gln Asn Ile Leu Ala
340 345 350
His Arg Ser Ile Gly Cys Phe Leu Thr His Ala Gly Phe Ser Ser Val
355 360 365
Ile Glu Gly Ile Val Asn Asp Cys Gln Leu Ala Phe Leu Pro Leu Lys
370 375 380
Ala Asp Gln Phe Met Ile Ala Lys Leu Phe Ser Gly Asp Leu Lys Ala
385 390 395 400
Gly Val Glu Val Asn Arg Arg Asp Glu Asp Gly Ser Phe Ala Lys Glu
405 410 415
Asp Ile Phe Glu Ala Ile Lys Thr Ile Met Val Asp Thr Asp Lys Glu
420 425 430
Pro Ser Arg Ser Ile Arg Glu Asn His Ser Asn Trp Arg Lys Phe Leu
435 440 445
Met Asn Lys Glu Ile Glu Ala Ser Tyr Ile Ala Asn Leu Ala His Glu
450 455 460
Leu Lys Ala Leu Val Gln Lys Ala
465 470
<210> 119
<211> 1386
<212> DNA
<213> Spinacia oleracea
<400> 119
atgtgtgacg acaaaaaatc atctgttttg agcatagcat tttatccgtg gtttgctctt 60
ggtcacctta cttcatttct ccgattagcc aacaaacttg cacaaaatgg tcacaatgtg 120
tcctatttta tcccaactaa tacattacct agattacttc ctcacaacca ttaccctggc 180
caccttactt tcatccccgt caccgtccca cccgttgacg gcctccctct cagagccgag 240
accaccaacg atgtcccctc ctcggctata caccttctta tgactgccat ggatttgacc 300
cgtgacacta tcgaggccca tttggttagt atcaaacccg atgttgtttt ctacgacttt 360
gcttattgga ttcccgatct agcccgaaaa cacgggttca agtcagtact ctacattaca 420
tcctatatag caagatgtgc ttattttgcc cccgatttga agtcgggtca tcagtccact 480
ggggccgaaa ttattgcgcc accaccgggt tttccgtctc agcatttccg gatgcaagca 540
cacgaggctg agactgtggc agacgtaggt aaagagcaag atggattaca aggtataact 600
atttctgaaa ggatgcgcat tgcttttgga aaatgcgacg caattggagt aaagagttgt 660
aaggagatgg aaaaggtgta tattgactac tgtgagaaga tatttggtaa gtctgtacta 720
ctagcaggtc ctatggtccc taaaacccca tcttccaaac ttgatgaata ttttgatggt 780
tggcttacgg gttttggtgc tgctactgtg atttattgtg catttgggag tgaatgtgtt 840
ctcgaaatta accaatttca acaacttctt cttggactag agctcacagg aaggccattt 900
ttggtggcca tgaagccgcc taagaagtat gaaacaatag agtcggcctt accagaaggg 960
tttgagaaga gaacaaaagg aaggggaatc gtacatgagg gttgggtgca gcaacaactg 1020
atattgcaac atccatcagt aggatgtttc ataactcatt gtggagttgg gtctctttcg 1080
gaagctatgg tcagcaaatg tcaagtagtg ttgatgcctc aagctgtaga ccaattcatc 1140
aatgcgagga tgatgagttt agagttgaag attggggttg aggttgagaa gagagaagat 1200
gatggtttgt tcacaaagga ggctgtgcat aaggcggtct ctttggtgat ggaggaagaa 1260
agtgaagtcg caaaagagat gagggtaagt catgataaat ggagagaatt cttattacag 1320
gaaggtcttg aggattctta tatcagtagc ttcattcaga gtctacgaca gttaacgatt 1380
ggatga 1386
<210> 120
<211> 461
<212> PRT
<213> Spinacia oleracea
<400> 120
Met Cys Asp Asp Lys Lys Ser Ser Val Leu Ser Ile Ala Phe Tyr Pro
1 5 10 15
Trp Phe Ala Leu Gly His Leu Thr Ser Phe Leu Arg Leu Ala Asn Lys
20 25 30
Leu Ala Gln Asn Gly His Asn Val Ser Tyr Phe Ile Pro Thr Asn Thr
35 40 45
Leu Pro Arg Leu Leu Pro His Asn His Tyr Pro Gly His Leu Thr Phe
50 55 60
Ile Pro Val Thr Val Pro Pro Val Asp Gly Leu Pro Leu Arg Ala Glu
65 70 75 80
Thr Thr Asn Asp Val Pro Ser Ser Ala Ile His Leu Leu Met Thr Ala
85 90 95
Met Asp Leu Thr Arg Asp Thr Ile Glu Ala His Leu Val Ser Ile Lys
100 105 110
Pro Asp Val Val Phe Tyr Asp Phe Ala Tyr Trp Ile Pro Asp Leu Ala
115 120 125
Arg Lys His Gly Phe Lys Ser Val Leu Tyr Ile Thr Ser Tyr Ile Ala
130 135 140
Arg Cys Ala Tyr Phe Ala Pro Asp Leu Lys Ser Gly His Gln Ser Thr
145 150 155 160
Gly Ala Glu Ile Ile Ala Pro Pro Pro Gly Phe Pro Ser Gln His Phe
165 170 175
Arg Met Gln Ala His Glu Ala Glu Thr Val Ala Asp Val Gly Lys Glu
180 185 190
Gln Asp Gly Leu Gln Gly Ile Thr Ile Ser Glu Arg Met Arg Ile Ala
195 200 205
Phe Gly Lys Cys Asp Ala Ile Gly Val Lys Ser Cys Lys Glu Met Glu
210 215 220
Lys Val Tyr Ile Asp Tyr Cys Glu Lys Ile Phe Gly Lys Ser Val Leu
225 230 235 240
Leu Ala Gly Pro Met Val Pro Lys Thr Pro Ser Ser Lys Leu Asp Glu
245 250 255
Tyr Phe Asp Gly Trp Leu Thr Gly Phe Gly Ala Ala Thr Val Ile Tyr
260 265 270
Cys Ala Phe Gly Ser Glu Cys Val Leu Glu Ile Asn Gln Phe Gln Gln
275 280 285
Leu Leu Leu Gly Leu Glu Leu Thr Gly Arg Pro Phe Leu Val Ala Met
290 295 300
Lys Pro Pro Lys Lys Tyr Glu Thr Ile Glu Ser Ala Leu Pro Glu Gly
305 310 315 320
Phe Glu Lys Arg Thr Lys Gly Arg Gly Ile Val His Glu Gly Trp Val
325 330 335
Gln Gln Gln Leu Ile Leu Gln His Pro Ser Val Gly Cys Phe Ile Thr
340 345 350
His Cys Gly Val Gly Ser Leu Ser Glu Ala Met Val Ser Lys Cys Gln
355 360 365
Val Val Leu Met Pro Gln Ala Val Asp Gln Phe Ile Asn Ala Arg Met
370 375 380
Met Ser Leu Glu Leu Lys Ile Gly Val Glu Val Glu Lys Arg Glu Asp
385 390 395 400
Asp Gly Leu Phe Thr Lys Glu Ala Val His Lys Ala Val Ser Leu Val
405 410 415
Met Glu Glu Glu Ser Glu Val Ala Lys Glu Met Arg Val Ser His Asp
420 425 430
Lys Trp Arg Glu Phe Leu Leu Gln Glu Gly Leu Glu Asp Ser Tyr Ile
435 440 445
Ser Ser Phe Ile Gln Ser Leu Arg Gln Leu Thr Ile Gly
450 455 460
<210> 121
<211> 1338
<212> DNA
<213> Spinacia oleracea
<400> 121
atggggtggc cggtggtggg cgagtcattt gaattttttc aaaccgggtg gaaaggttac 60
ccggaaaagt tcatatttga tagactgaac aagtacaccc caagccaagt gttcaagact 120
tccatcgtag gagaaaaggt tgcggtttta tgtggcgcgg cgggtaacaa gttcttgtac 180
tcaaacgaga acaagttagt acaagcttgg tggcctagct ctgttgataa gatctttcct 240
tcttctaccc aaacttcctc caaagaagag gctaagaaga tgcggaaact cctccctaac 300
ttcctcaagc ccgaggcttt acataggtac atacccatca tggatagcat tgccatccgg 360
cacatggagt ccgggtggga gggaaaggac aaggtagaag tcttcccttt ggctaagaat 420
tacaccttct ggctggcttg ccgactcttc ttaagcgtcg aggacccggc tcatgtagcc 480
aagttctccg aaccattcaa cgacatagcc gcagggatca tctcgatgcc aatcgacctc 540
cccggaacac ccttcaaccg agggatcaag tcgtctaacg tcgtaaggaa agagttgagg 600
gccatcataa agcagaggaa acttgactta gcagatggca aggcttcacc tacacaagat 660
attctgtctc atatgttgtt gacttgtact gaagatggca agtttatgag tgaaatggat 720
attgctgata agattctggg acttcttatt ggtggacatg atactgctag tgcttcttgt 780
acttttgttg ttaagtttct tgctgagctt cctcacatat atgaaggtgt ctacaaagag 840
caaatggaga tagcaaattc aaaaaaagca ggagaacttc taaattggga ggacatacaa 900
aaaatgaaat actcatggaa tgtagcttgt gaagttatgc gtttggctcc tccacttcaa 960
ggtggtttca gggaagccct ttctgatttc atgtataacg gattccaaat ccccaagggc 1020
tggaagttat attggagtgc aaattcaaca catatgaacc cggaatgctt cccggagccc 1080
aagacgttcg acccatcgag gttcgacggt acgggaccag caccatacac atacgtcccc 1140
ttcggaggag gaccgagaat gtgcccgggc aaggagtatg caaggctaga gatattagtg 1200
ttcatgcaca acgttgtcaa gaggtttaaa tgggaaaaaa tgcttcctga tgagaaggtt 1260
attgtcaatc ccatgcctat cccagaacat ggccttcctg tccgcctttt ccctcatcct 1320
cgaactgtag ctgcttaa 1338
<210> 122
<211> 1077
<212> DNA
<213> Spinacia oleracea
<400> 122
atggaccgca ctcggcctga ggtggagtct atcctatcaa cccagaagcc cgaccttgtc 60
ttctacgaca tggcccattg gatacccgat attgctagca agctcgggat caagtcagtg 120
tcatacaaca gtgtatgtgc tatttctatg tcccatgtca gacctagcgt ccttccaaaa 180
gcagcagcaa catcacaagt agctttgtca tcatcgtcat atgtcggtag tgtccctcag 240
tggagtcgca atgatcacaa ctcatcagtc tattttgggg atgagattac cttacttgaa 300
cgctctatca tctccctctc atctgcagat gcaatagcca tccgcacatg cagggagatt 360
gaaggagtat attgtgaccg tgttgctgcc acattcaaca agcctgtcct tgtcactagc 420
cacgccttgc ctgatcttga actccaactc tctccgttgg agactcgatg ggctgactgg 480
ctagctaggt ttgggccaag atcagtgatc ttttgctgcc ttggtagtca gcatgtctta 540
gacgcagccc aactgcagga gttagccttg gggttagaaa tgacaggact acccttcttg 600
atggctgtaa agcctcctgt aggctatgcc tcattgaagg agctgctgcc agaaggttat 660
aatgatcggg ttagtgggag aggggtggtt catggtgggt gggtgcagca acagcagata 720
ctggcgcacc catcattagg gtgctttgtg acccattgtg ggtcttcgtc catgtgggag 780
gggttagtga gtgaaactca gctggtacta ctcccacagc tgccagacca aactctgaac 840
gcaaagttga tggcagatga gctcaaggtg ggtgtgaagg tggagcgaca acagaacggg 900
tgggtgtcaa agcaaggtct atgtgaagcc atcaacagag tgatggatga agatagtgat 960
ataagtcatg tagtgagaaa gaatcatgct aaatacacaa gtatgttgat tagccctgac 1020
tttatcactg gctacattga caacttcatc aaggatttac aagcccttat ttcttag 1077
<210> 123
<211> 366
<212> PRT
<213> Spinacia oleracea
<400> 123
Met Leu Val Tyr Asp Ala Tyr Phe Pro Trp Ala Leu Asp Val Ala Lys
1 5 10 15
Asp His Asn Ile Leu Ala Ala Ala Tyr Phe Val Ser Ser Cys Ala Tyr
20 25 30
Val Ala Ser Phe Tyr Pro Met Phe Leu Glu Glu Phe Gly Ser Asp Asp
35 40 45
Gln His Pro Val Val Ala Ala Glu Ser Val Pro Gly Leu Leu Val Glu
50 55 60
Leu Pro Ser Arg Glu Glu Met Glu Arg Tyr Ala Pro Lys Cys Ala Gln
65 70 75 80
Ser Ser Ser Ser Asp Asp Lys Pro Asp Thr Gly Lys Lys Pro Leu His
85 90 95
Pro Val Tyr Gln Met Val Val Ser Ser Ile Thr Thr Leu His Leu Ala
100 105 110
Asp Phe Val Leu Phe Asn Ser Phe Asp His Leu Glu His Gln Val Val
115 120 125
Lys Trp Met Thr Asn Leu Trp Arg Val Lys Thr Val Gly Pro Leu Leu
130 135 140
Pro Ser Ala Tyr Leu Asp Lys Arg Ile Glu Ser Asp Val Asn Tyr Cys
145 150 155 160
Val Lys Pro Tyr Lys Pro Asn Asn Glu Ala Cys Met Ser Trp Leu Asn
165 170 175
Ala Lys Gln Val Ala Ser Val Val Tyr Val Ser Phe Gly Ser Val Ala
180 185 190
Lys Leu Ser Val Glu Gln Ile Ser Glu Ile Ala Lys Ala Leu Lys Gln
195 200 205
Ile Pro Ser Ser Phe Leu Trp Ile Val Arg Glu Ala Glu Gln Glu Lys
210 215 220
Leu Pro Asn Asp Phe Ile Thr Glu Thr Ser Glu Lys Gly Leu Val Met
225 230 235 240
Ser Trp Cys Pro Gln Leu Asp Val Leu Ala His Glu Ala Val Gly Cys
245 250 255
Phe Ile Thr His Cys Gly Trp Asn Ser Val Ile Glu Ala Thr Ser Phe
260 265 270
Gly Val Pro Met Leu Gly Met Pro Gln Phe Met Asp His Phe Leu Asp
275 280 285
Ala His Phe Leu Glu Lys Val Trp Gly Val Gly Ile Arg Val Lys Ala
290 295 300
Asp Glu Lys Asn Phe Val Thr Cys Asp Glu Ile Lys Arg Gly Leu Glu
305 310 315 320
Lys Ile Ile Tyr Gly Glu Arg Gly Asn Lys Ile Lys Glu Asn Ala Thr
325 330 335
Lys Trp Lys Glu Leu Ala Lys Glu Ala Val Gly Glu Gly Gly Ser Ser
340 345 350
Asp Asn Ser Thr Gly Glu Ile Ile Lys Trp Leu Ala Ser Ser
355 360 365
<210> 124
<211> 358
<212> PRT
<213> Spinacia oleracea
<400> 124
Met Asp Arg Thr Arg Pro Glu Val Glu Ser Ile Leu Ser Thr Gln Lys
1 5 10 15
Pro Asp Leu Val Phe Tyr Asp Met Ala His Trp Ile Pro Asp Ile Ala
20 25 30
Ser Lys Leu Gly Ile Lys Ser Val Ser Tyr Asn Ser Val Cys Ala Ile
35 40 45
Ser Met Ser His Val Arg Pro Ser Val Leu Pro Lys Ala Ala Ala Thr
50 55 60
Ser Gln Val Ala Leu Ser Ser Ser Ser Tyr Val Gly Ser Val Pro Gln
65 70 75 80
Trp Ser Arg Asn Asp His Asn Ser Ser Val Tyr Phe Gly Asp Glu Ile
85 90 95
Thr Leu Leu Glu Arg Ser Ile Ile Ser Leu Ser Ser Ala Asp Ala Ile
100 105 110
Ala Ile Arg Thr Cys Arg Glu Ile Glu Gly Val Tyr Cys Asp Arg Val
115 120 125
Ala Ala Thr Phe Asn Lys Pro Val Leu Val Thr Ser His Ala Leu Pro
130 135 140
Asp Leu Glu Leu Gln Leu Ser Pro Leu Glu Thr Arg Trp Ala Asp Trp
145 150 155 160
Leu Ala Arg Phe Gly Pro Arg Ser Val Ile Phe Cys Cys Leu Gly Ser
165 170 175
Gln His Val Leu Asp Ala Ala Gln Leu Gln Glu Leu Ala Leu Gly Leu
180 185 190
Glu Met Thr Gly Leu Pro Phe Leu Met Ala Val Lys Pro Pro Val Gly
195 200 205
Tyr Ala Ser Leu Lys Glu Leu Leu Pro Glu Gly Tyr Asn Asp Arg Val
210 215 220
Ser Gly Arg Gly Val Val His Gly Gly Trp Val Gln Gln Gln Gln Ile
225 230 235 240
Leu Ala His Pro Ser Leu Gly Cys Phe Val Thr His Cys Gly Ser Ser
245 250 255
Ser Met Trp Glu Gly Leu Val Ser Glu Thr Gln Leu Val Leu Leu Pro
260 265 270
Gln Leu Pro Asp Gln Thr Leu Asn Ala Lys Leu Met Ala Asp Glu Leu
275 280 285
Lys Val Gly Val Lys Val Glu Arg Gln Gln Asn Gly Trp Val Ser Lys
290 295 300
Gln Gly Leu Cys Glu Ala Ile Asn Arg Val Met Asp Glu Asp Ser Asp
305 310 315 320
Ile Ser His Val Val Arg Lys Asn His Ala Lys Tyr Thr Ser Met Leu
325 330 335
Ile Ser Pro Asp Phe Ile Thr Gly Tyr Ile Asp Asn Phe Ile Lys Asp
340 345 350
Leu Gln Ala Leu Ile Ser
355

Claims (62)

1.一种遗传修饰的细胞,所述遗传修饰的细胞与相应的未修饰细胞相比,具有表达增加的至少一种异源基因,所述至少一种异源基因编码纤维素合酶样G(CSLG)酶,其中所述遗传修饰的细胞包含与相应的未修饰细胞相比,含量增加的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体。
2.根据权利要求1的遗传修饰的细胞,其中包含含量增加的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体的所述遗传修饰的细胞还表达编码一种酶的至少一种其他异源基因,所述酶选自皂苷β-香树素合酶、细胞色素P450、糖基转移酶、酰基转移酶和UDP-葡萄糖6-脱氢酶1或其任何组合。
3.根据权利要求1-2的任一项的遗传修饰的细胞,其中编码所述至少一种异源CSLG基因的核酸序列在SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101、103或105中的任一;或与SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101、103或105中的任一所示的其核酸序列具有至少55%的同一性和至少55%的覆盖度的其同源物中示出。
4.根据权利要求1-2的任一项的遗传修饰的细胞,其中所述被编码的CSLG酶的氨基酸序列在SEQ ID NO:31、33、35、37、39、41、66、81、94、96、98、100、102或104中的任一;或与SEQID NO:31、33、35、37、39、41、66、81、94、96、98、100、102或104中的任一所示的氨基酸序列具有至少55%的同一性和至少55%的覆盖度的其同源物中示出。
5.根据权利要求2-4的任一项的遗传修饰的细胞,其中编码所述至少一种其他异源基因的核酸序列编码
(a)β-香树素合酶,所述核酸序列在SEQ ID NO:45;或与SEQ ID NO:45所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;或
(b)细胞色素P450,所述核酸序列在SEQ ID NO:46、51或53中的任一;或与SEQ ID NO:46、51或53中的任一所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;或
(c)糖基转移酶,所述核酸序列在SEQ ID NO:55、57、59或61中的任一;或与SEQ ID NO:55、57、59或61中的任一所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;或
(d)乙酰基转移酶,所述核酸序列在SEQ ID NO:63;或与SEQ ID NO:63所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;或
(e)UDP-葡萄糖6-脱氢酶1,所述核酸序列在SEQ ID NO:74;或与SEQ ID NO:74所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;或
(f)(a)、(b)、(c)、(d)和(e)的其任何组合。
6.根据权利要求2-4的任一项的遗传修饰的细胞,其中所述被编码的至少一种其他异源基因的氨基酸序列编码
(a)β-香树素合酶,所述氨基酸序列在SEQ ID NO:48;或与SEQ ID NO:48所示的氨基酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;或
(b)细胞色素P450,所述氨基酸序列在SEQ ID NO:49、52或54中的任一;或与SEQ IDNO:49、52或54中的任一所示的氨基酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;或
(c)糖基转移酶,所述氨基酸序列在SEQ ID NO:56、58、60或62中的任一;或与SEQ IDNO:56、58、60或62中的任一所示的氨基酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;或
(d)乙酰基转移酶,所述氨基酸序列在SEQ ID NO:64;或与SEQ ID NO:64所示的氨基酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;或
(e)UDP-葡萄糖6-脱氢酶1,所述氨基酸序列在SEQ ID NO:75;或与SEQ ID NO:75所示的氨基酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;或
(f)(a)、(b)、(c)、(d)和(e)的其任何组合。
7.根据权利要求1-6的任一项的遗传修饰的细胞,其中所述三萜皂苷或所述其衍生物、其代谢物或其生物合成中间体包含甜味剂、发泡剂、乳化剂、防腐剂、抗癌剂、降血胆固醇制剂、抗炎剂、抗氧化剂、生物佐剂、杀菌剂、杀虫剂、拒食剂、抗真菌剂,或其任何组合。
8.根据权利要求1-6的任一项的遗传修饰的细胞,
(a)其中所述甾体糖苷生物碱包含七叶皂苷、脱氢七叶皂苷、α-番茄素、番茄素、脱氢番茄素、α-查茄碱、α-茄碱、α-澳洲茄碱、α-澳洲茄边碱或其任何组合;或
(b)其中所述甾体皂苷包含龙葵皂苷B、番茄甙,或其任何组合;或
(c)其中所述三萜皂苷包含苜蓿酸3-O-葡萄糖醛酸苷(MA-3-GlcA)(化合物6)、化合物7、化合物8、化合物9、化合物10、化合物11、甘草皂苷(化合物14)、甘草次酸3-O-单葡萄糖醛酸苷(化合物15)、巴约甙元(化合物25)、巴约甙元-hexA-hex-hex(化合物31)、瓜瓶藤酸(化合物26)、瓜瓶藤酸-hexA-hex(化合物32)、大豆甾醇A(化合物29)、大豆皂醇B(化合物30)、大豆甾醇A-hexA-hex-pent(化合物34)、大豆皂苷VI(化合物35)、甜菜甙IV(化合物33)、常春藤苷配基-3GlcA、丝石竹皂苷配基-3GlcA、丝石竹酸-3GlcA或QS-21佐剂,或其任何组合;或
(d)其中所述三萜皂苷的所述生物合成中间体包含化合物1、化合物2、苜蓿酸(化合物5)、齐墩果酸(化合物3)、齐墩果酸-3GlcA、奥古斯丁酸(化合物4)、奥古斯丁酸-3GlcA或甘草次酸(化合物13)或其任何组合;或
(e)其组合。
9.根据权利要求1的遗传修饰的细胞,具有含量改变的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
10.根据权利要求1-9的任一项的遗传修饰的细胞,其中所述细胞包含植物细胞、酵母细胞或藻细胞。
11.根据权利要求10的遗传修饰的细胞,所述植物细胞包含来自禾本目(Poales)、石竹目(Caryophyllales)、茄目(Solanales)、豆目(Fabales)、锦葵目(Malvales)、伞形目(Apiales)、十字花目(Brassicales)、天门冬目(Asparagales)、薯蓣目(Dioscoreales)或百合目(Liliales)植物的细胞。
12.根据权利要求11的遗传修饰的细胞,其中:
(a)当所述植物细胞包含来自禾本目植物的细胞时,所述植物选自以下属:稻属(Oryza)、大麦属(Hordeum)、燕麦属(Avena)和小麦属(Triticum);
(b)当所述植物细胞包含来自石竹目植物的细胞时,所述植物选自以下属:菠菜属(Spinacia)、藜属(Chenopodium)、甜菜属(Beta genus)、大黄属(Rheum)、麦蓝菜属(Vaccaria)、肥皂草属(Saponaria)和石头花属(Gypsophila);
(c)当所述植物细胞包含来自茄目植物的细胞时,所述植物选自以下属:茄属(Solanum)、辣椒属(Capsicum)、烟草属(Nicotiana)、莨菪属(Hyoscyamus)、曼陀罗属(Datura)和颠茄属(Atropa);
(d)当所述植物细胞包含来自豆目植物的细胞时,所述植物选自以下属:甘草属(Glycyrrhiza)、苜蓿属(Medicago)、大豆属(Glycine)、百脉根属(Lotus)、鹰嘴豆属(Cicer)、菜豆属(Phaseolus)、豌豆属(Pisum)、花生属(Arachis)、羽扇豆属(Lupinus)和金合欢属(Acacia);
(e)当所述植物细胞包含来自锦葵目植物的细胞时,所述植物选自可可属(Theobroma);
(f)当所述植物细胞包含来自伞形目植物的细胞时,所述植物选自以下属:胡萝卜属(Daucus)、芹属(Apium)、香芹菜属(Petroselinum)、人参属(Panax)、柴胡属(Bupleurum)、常春藤属(Hedera)和积雪草属(Centella);或
(g)当所述植物细胞包含来自十字花目植物的细胞时,所述植物选自以下属:拟南芥属(Arabidopsis)、芸苔属(Brassica)、山柑属(Capparis)和番木瓜属(Carica)。
13.根据权利要求12的遗传修饰的细胞,其中:
(a)当所述植物细胞包含来自石竹目植物的细胞时,所述植物选自菠菜、甜菜根和奎藜籽;
(b)当所述植物细胞包含来自茄目植物的细胞时,所述植物选自番茄、野生番茄、马铃薯、野生马铃薯、茄子、胡椒、甜椒、卡宴辣椒(cayenne pepper)、红辣椒(chili pepper)、甘椒(pimiento)、塔巴斯科辣椒(tabasco pepper)、地樱桃(ground cherry)、烟草和南蛇藤(bittersweet);或
(c)当所述植物细胞包含来自豆目植物的细胞时,所述植物选自紫苜蓿(alfalfa)、大豆、百脉根(Lotus japonicus)和甘草(licorice)。
14.根据权利要求13的遗传修饰的细胞,其中:
(a)所述植物细胞来自番茄植物,所述番茄植物具有:
(i)含量增加的α-番茄素或其衍生物、其代谢物或其生物合成中间体;或番茄碱或其衍生物、其代谢物或其生物合成中间体;或脱氢番茄素或其衍生物、其代谢物或其生物合成中间体;或甾体皂苷或其衍生物、其代谢物或其生物合成中间体;或
(ii)含量改变的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或
(b)所述植物细胞来自马铃薯植物,所述马铃薯植物具有:
(i)含量增加的α-查茄碱或其衍生物、其代谢物或其生物合成中间体;或α-茄碱或其衍生物、其代谢物或其生物合成中间体;或甾体皂苷或其衍生物、其代谢物或其生物合成中间体;或
(ii)含量改变的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或
(c)所述植物细胞来自茄子植物,所述茄子植物具有:
(i)含量增加的α-澳洲茄碱或其衍生物、其代谢物或其生物合成中间体;或α-澳洲茄边碱或其衍生物、其代谢物或其生物合成中间体;或甾体皂苷或其衍生物、其代谢物或其生物合成中间体;
(ii)含量改变的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
15.根据权利要求10-14的任一项的遗传修饰的细胞,其中所述植物细胞包含叶细胞、叶柄细胞、植物茎或柄细胞、根细胞、芽细胞、块茎细胞、豆细胞、谷粒或果仁细胞、果实细胞、坚果细胞、荚果细胞、种子或种子细胞、愈伤组织细胞、苞片细胞或花细胞。
16.根据权利要求10-15的任一项的遗传修饰的细胞,其中所述植物细胞包含在植物或其部分中,所述其部分包含植物叶、植物叶柄、植物茎或柄、植物根、植物芽、植物块茎、植物豆、植物谷粒或果仁、植物果实、植物坚果、植物荚果、植物种子、植物苞片或植物花。
17.根据权利要求10的遗传修饰的细胞,其中所述酵母选自酵母菌属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)、毕赤酵母属(Pichia)、子囊菌酵母属(Yarrowia)、克鲁维酵母菌属(Kluyveromyces)或假丝酵母属(Candida)。
18.根据权利要求10的遗传修饰的细胞,其中所述藻选自微藻、多细胞藻、蓝藻菌(cyanobacterium)、硅藻、绿藻门(绿藻)、红藻门(红藻)或褐色植物门(褐藻)、盐藻(Dunaliella)、衣藻属(Chlamydamonas)或血球藻属(Hematococus)。
19.一种遗传修饰的植物,所述遗传修饰的植物包含与相应的未修饰的植物中的纤维素合酶样G(CSLG)的表达相比,具有至少一种CSLG基因表达改变的至少一种细胞,并且其中所述遗传修饰的植物与相应的未修饰的植物相比,具有含量改变的至少一种甾体生物碱、其衍生物、其代谢物;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体。
20.根据权利要求19的遗传修饰的植物,其中所述CSLG基因包含内源CSLG基因。
21.根据权利要求20的遗传修饰的植物,其中所述内源CSLG基因包含突变,所述突变包含至少一个或多个点突变、或插入、或缺失或其任何组合,并且
(a)其中所述被表达的CSLG酶具有增加的稳定性或增加的活性或这两者,并且所述含量的改变包含与相应的未修饰的植物相比,增加量的所述至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;所述至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或所述至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体;或
(b)其中所述被表达的CSLG酶具有降低的稳定性或降低的活性或这两者,并且所述含量的改变包含与相应的未修饰的植物相比,减少量的所述至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;所述至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或所述至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体。
22.根据权利要求20的遗传修饰的植物,其中:
(a)所述内源CSLG基因被选择性地沉默、抑制,或降低其表达,并且所述含量的改变包含与相应的未修饰的植物相比,减少量的所述至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;所述至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或所述至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体;或
(b)所述内源CSLG基因被过表达,并且所述含量的改变包含与相应的未修饰的植物相比,增加量的所述至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;所述至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或所述至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体。
23.根据权利要求22的遗传修饰的植物,其中当所述内源CSLG基因被选择性地沉默、抑制,或具有降低的表达时,所述细胞还包含靶向于编码所述CSLG基因的多核苷酸的至少一种沉默分子,其中所述沉默分子选自RNA干扰分子或反义分子,或其中所述沉默分子是病毒诱导基因沉默系统的组分。
24.根据权利要求19的遗传修饰的植物,其中所述CSLG基因包含异源CSLG基因,并且所述表达的改变包含所述基因的从头表达。
25.根据权利要求24的遗传修饰的植物,其中所述表达包含相比于相应的未修饰细胞而言增加的表达,并且所述改变的含量包含与相应的未修饰的植物相比,含量增加的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体。
26.根据权利要求19-25的任一项的遗传修饰的植物,其中编码所述CSLG基因的核酸序列在SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101、103或105中的任一;或与SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101、103或105中的任一所示的其核酸序列具有至少55%的同一性和至少55%的覆盖度的其同源物中示出。
27.根据权利要求19-25的任一项的遗传修饰的植物,其中所述CSLG酶的氨基酸序列在SEQ ID NO:31、33、35、37、39、41、66、81、94、96、98、100、102或104中的任一;或与SEQ IDNO:31、33、35、37、39、41、66、81、94、96、98、100、102或104中的任一所示的氨基酸序列具有至少55%的同一性和至少55%的覆盖度的其同源物中示出。
28.根据权利要求19-27的任一项的遗传修饰的植物,其中所述至少一种纤维素合酶样G(GSLG)基因的表达的改变通过(1)将一个或多个点突变引入所属核酸序列中,(2)将缺失引入所述核酸序列内,或(3)将插入引入所述核酸、其任何组合内,或(4)其任何组合来改变,其中所述引入包含诱变编码或非编码序列。
29.根据权利要求28的遗传修饰的植物,其中所述至少一种CSLG基因的表达的改变通过引入靶向所述至少一种CSLG基因的沉默分子来改变,并且其中:
(a)当所述CSLG的所述核酸在SEQ ID NO:30中示出时,所述沉默分子在SEQ ID NO:42或其互补序列或与SEQ ID NO:42或其互补序列所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;
(b)当所述CSLG的所述核酸在SEQ ID NO:34中示出时,所述沉默分子在SEQ ID NO:43或其互补序列或与SEQ ID NO:43或其互补序列所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;
(c)当所述CSLG的所述核酸在SEQ ID NO:38中示出时,所述沉默分子在SEQ ID NO:44或其互补序列或与SEQ ID NO:44或其互补序列所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;
(d)当所述CSLG的所述核酸在SEQ ID NO:65或SEQ ID NO:93中示出时,所述沉默分子在SEQ ID NO:106中或其互补序列,或与SEQ ID NO:65所示的核酸序列或SEQ ID NO:93所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;或
(e)当所述CSLG的所述核酸在SEQ ID NO:95中示出时,所述沉默分子在SEQ ID NO:107或其互补序列或与SEQ ID NO:95所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出。
30.根据权利要求19-29的任一项的遗传修饰的植物,其中所述三萜皂苷、其衍生物、其代谢物或其生物合成中间体包含甜味剂、发泡剂、乳化剂、防腐剂、抗癌剂、降血胆固醇制剂、抗炎剂、抗氧化剂、生物佐剂、杀菌剂、杀虫剂、拒食剂、抗真菌剂,或其任何组合。
31.根据权利要求19-31的任一项的遗传修饰的植物,
(a)其中所述甾体糖苷生物碱包含七叶皂苷、脱氢七叶皂苷、α-番茄素、番茄素、α-查茄碱、α-茄碱、α-澳洲茄碱、α-澳洲茄边碱或其任何组合;或
(b)其中所述甾体皂苷包含龙葵皂苷B、番茄甙,或其任何组合;或
(c)其中所述三萜皂苷包含苜蓿酸3-O-葡萄糖醛酸苷(MA-3-GlcA)(化合物6)、化合物7、化合物8、化合物9、化合物10、化合物11、甘草皂苷(化合物14)、甘草次酸3-O-单葡萄糖醛酸苷(化合物15)、巴约甙元(化合物25)、巴约甙元-hexA-hex-hex(化合物31)、瓜瓶藤酸(化合物26)、瓜瓶藤酸-hexA-hex(化合物32)、大豆甾醇A(化合物29)、大豆皂醇B(化合物30)、大豆甾醇A-hexA-hex-pent(化合物34)、大豆皂苷VI(化合物35)、甜菜甙IV(化合物33)、常春藤苷配基-3GlcA、丝石竹皂苷配基-3GlcA、丝石竹酸-3GlcA或QS-21佐剂,或其任何组合;或
(d)其中三萜皂苷的生物合成中间体包含化合物1、化合物2、苜蓿酸(化合物5)、齐墩果酸(化合物3)、齐墩果酸-3GlcA、奥古斯丁酸(化合物4)、奥古斯丁酸-3GlcA或甘草次酸(化合物13)或其任何组合;或
(e)其组合。
32.根据权利要求19的遗传修饰的植物,具有含量改变的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
33.根据权利要求19-32中的任一项的遗传修饰的植物,其中所述植物选自禾本目、石竹目、茄目、豆目、锦葵目、伞形目、十字花目、天门冬目、薯蓣目或百合目。
34.根据权利要求33的遗传修饰的植物,其中:
(a)当所述植物包含来自禾本目的植物时,所述植物选自以下属:稻属、大麦属、燕麦属和小麦属;
(b)当所述植物包含来自石竹目的植物时,所述植物选自以下属:菠菜属、藜属、甜菜属、大黄属、麦蓝菜属、肥皂草属和石头花属;
(c)当所述植物包含来自茄目的植物时,所述植物选自以下属:茄属、辣椒属、烟草属、莨菪属、曼陀罗属和颠茄属;
(d)当所述植物包含来自豆目的植物时,所述植物选自以下属:甘草属、苜蓿属、大豆属、百脉根属、鹰嘴豆属、菜豆属、豌豆属、花生属、羽扇豆属和金合欢属;
(e)当所述植物包含来自锦葵目的植物时,所述植物选自可可属;
(f)当所述植物包含来自伞形目的植物时,所述植物选自以下属:胡萝卜属、芹属、香芹菜属、人参属、柴胡属、常春藤属和积雪草属;或
(g)当所述植物包含来自十字花目的植物时,所述植物选自以下属:拟南芥属、芸苔属、山柑属和番木瓜属。
35.根据权利要求34的遗传修饰的植物,其中:
(a)当所述植物包含来自石竹目的植物时,所述植物选自菠菜、甜菜根和奎藜籽;
(b)当所述植物包含来自茄目的植物时,所述植物选自番茄、野生番茄、马铃薯、野生马铃薯、茄子、胡椒、甜椒、卡宴辣椒、红辣椒、甘椒、塔巴斯科辣椒、地樱桃、烟草和南蛇藤;或
(c)当所述植物包含来自豆目的植物时,所述植物选自紫苜蓿、大豆、百脉根和甘草。
36.根据权利要求35的遗传修饰的植物,其中:
(a)所述植物是番茄植物,所述番茄植物具有:
(i)含量增加的α-番茄素或其衍生物、其代谢物或其生物合成中间体;或番茄碱或其衍生物、其代谢物或其生物合成中间体;或脱氢番茄素或其衍生物、其代谢物或其生物合成中间体;或甾体皂苷或其衍生物、其代谢物或其生物合成中间体;或
(ii)含量改变的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或
(b)所述植物是马铃薯植物,所述马铃薯植物具有:
(i)含量增加的α-查茄碱或其衍生物、其代谢物或其生物合成中间体;或α-茄碱或其衍生物、其代谢物或其生物合成中间体;或甾体皂苷或其衍生物、其代谢物或其生物合成中间体;或
(ii)含量改变的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或
(c)所述植物是茄子植物,所述茄子植物具有:
(i)含量增加的α-澳洲茄碱或其衍生物、其代谢物或其生物合成中间体;或α-澳洲茄边碱或其衍生物、其代谢物或其生物合成中间体;或甾体皂苷或其衍生物、其代谢物或其生物合成中间体;
(ii)含量改变的植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体。
37.根据权利要求20-36的任一项的遗传修饰的植物,其中所述植物细胞包含叶细胞、叶柄细胞、植物茎或柄细胞、根细胞、芽细胞、块茎细胞、豆细胞、谷粒或果仁细胞、果实细胞、坚果细胞、荚果细胞、种子或种子细胞、愈伤组织细胞、苞片细胞、愈伤组织细胞或花细胞。
38.一种在遗传修饰的细胞中生产甾体生物碱、甾体皂苷或三萜皂苷的方法,所述方法包含:
(a)将至少一种异源基因引入所述细胞中,所述至少一种异源基因编码纤维素合酶样G(CSLG)酶,其中所述异源基因任选地包含在载体中;以及
(b)在所述细胞中表达所述至少一种异源基因;
其中所述细胞包含与相应的未修饰细胞相比,含量增加的至少一种甾体生物碱、至少一种甾体皂苷或至少一种三萜皂苷。
39.权利要求38的生产甾体生物碱、甾体皂苷或三萜皂苷的方法,所述引入还包含将至少一种其他异源基因引入所述细胞中,所述异源基因选自编码皂苷β-香树素合酶、细胞色素P450、糖基转移酶、酰基转移酶和UDP-葡萄糖6-脱氢酶I或其任何组合的组,其中所述至少一种其他异源基因任选地包含在载体中;并且还包含在所述细胞中表达所述至少一种其他异源基因。
40.权利要求38-39的任一项的生产甾体生物碱、甾体皂苷或三萜皂苷的方法,其中
(a)所述至少一种异源基因可操作地连接到启动子、转录终止序列或其组合;或
(b)所述至少一种其他异源基因可操作地连接到启动子、转录终止序列或其组合;或
(c)(a)和(b)的其组合。
41.根据权利要求38-40的任一项的生产甾体生物碱、甾体皂苷或三萜皂苷的方法,其中所述引入包含利用以下项来转化所述至少一个细胞:
(a)所述至少一种异源基因或编码所述至少一种异源基因的多核苷酸序列,或包含所述至少一种异源基因的载体;或
(b)所述至少一种其他异源基因或编码所述至少一种其他异源基因的多核苷酸序列,或包含所述至少一种其他异源基因的载体;或
(c)(a)和(b)的其组合;
其中所述表达包含瞬时表达或组成型表达。
42.根据权利要求38-41的任一项的生产甾体生物碱、甾体皂苷或三萜皂苷的方法,其中编码所述至少一种异源CSLG基因的核酸序列在SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101、103或105中的任一;或与SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101、103或105中的任一所示的其核酸序列具有至少55%的同一性和至少55%的覆盖度的其同源物中示出。
43.根据权利要求38-42的任一项的生产甾体生物碱、甾体皂苷或三萜皂苷的方法,其中所述被编码的CSLG酶的氨基酸序列在SEQ ID NO:31、33、35、37、39、41、66、81、94、96、98、100、102或104中的任一;或与SEQ ID NO:31、33、35、37、39、41、66、81、94、96、98、100、102或104中的任一所示的氨基酸序列具有至少55%的同一性和至少55%的覆盖度的其同源物中示出。
44.根据权利要求38-43的任一项的生产甾体生物碱、甾体皂苷或三萜皂苷的方法,其中编码所述至少一种其他异源基因的核酸序列编码
(a)β-香树素合酶,所述核酸序列在SEQ ID NO:45;或与SEQ ID NO:45所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;或
(b)细胞色素P450,所述核酸序列在SEQ ID NO:46、51或53中的任一;或与SEQ ID NO:46、51或53中的任一所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;或
(c)糖基转移酶,所述核酸序列在SEQ ID NO:55、57、59或61中的任一;或与SEQ ID NO:55、57、59或61中的任一所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;或
(d)酰基转移酶,所述核酸序列在SEQ ID NO:63;或与SEQ ID NO:63所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;或
(e)UDP-葡萄糖6-脱氢酶1,所述核酸序列在SEQ ID NO:74;或与SEQ ID NO:74所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;或
(f)(a)、(b)、(c)、(d)和(e)的其任何组合。
45.根据权利要求38-43的任一项的生产甾体生物碱、甾体皂苷或三萜皂苷的方法,其中所述被编码的至少一种其他异源基因的氨基酸序列编码
(a)β-香树素合酶,所述氨基酸序列在SEQ ID NO:48;或与SEQ ID NO:48所示的氨基酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;或
(b)细胞色素P450,所述氨基酸序列在SEQ ID NO:49、52或54中的任一;或与SEQ IDNO:49、52或54中的任一所示的氨基酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;或
(c)糖基转移酶,所述氨基酸序列在SEQ ID NO:56、58、60或62中的任一;或与SEQ IDNO:56、58、60或62中的任一所示的氨基酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;或
(d)酰基转移酶,所述氨基酸序列在SEQ ID NO:64;或与SEQ ID NO:64所示的氨基酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;或
(e)UDP-葡萄糖6-脱氢酶1,所述氨基酸序列在SEQ ID NO:75;或与SEQ ID NO:75所示的氨基酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;或
(f)(a)、(b)、(c)、(d)和(e)的其任何组合。
46.权利要求38-45的任一项的生产甾体生物碱、甾体皂苷或三萜皂苷的方法,其中
(a)所述三萜皂苷包含:甜味剂、发泡剂、乳化剂、防腐剂、抗癌剂、降血胆固醇制剂、抗炎剂、抗氧化剂、生物佐剂、杀菌剂、杀虫剂、拒食剂、抗真菌剂,或其任何组合;或
(b)所述甾体糖苷生物碱包含七叶皂苷、脱氢七叶皂苷、α-番茄素、番茄素、α-查茄碱、α-茄碱、α-澳洲茄碱、α-澳洲茄边碱或其任何组合;或
(c)所述甾体皂苷包含龙葵皂苷B、番茄甙,或其任何组合;或
(d)所述三萜皂苷包含苜蓿酸3-O-葡萄糖醛酸苷(MA-3-GlcA)(化合物6)、化合物7、化合物8、化合物9、化合物10、化合物11、甘草皂苷(化合物14)、甘草次酸3-O-单葡萄糖醛酸苷(化合物15)、巴约甙元(化合物25)、巴约甙元-hexA-hex-hex(化合物31)、瓜瓶藤酸(化合物26)、瓜瓶藤酸-hexA-hex(化合物32)、大豆甾醇A(化合物29)、大豆皂醇B(化合物30)、大豆甾醇A-hexA-hex-pent(化合物34)、大豆皂苷VI(化合物35)、甜菜甙IV(化合物33)、常春藤苷配基-3GlcA、丝石竹皂苷配基-3GlcA、丝石竹酸-3GlcA或QS-21佐剂,或其任何组合;或
(e)其组合。
47.根据权利要求38-46的任一项的方法,还包含改变植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体的含量。
48.根据权利要求38-47的任一项的生产甾体生物碱、甾体皂苷或三萜皂苷的方法,其中所述细胞包含植物细胞、酵母细胞或藻细胞。
49.根据权利要求48的生产甾体生物碱、甾体皂苷或三萜皂苷的方法,其中
(a)所述植物细胞包含来自禾本目、石竹目、茄目、豆目、锦葵目、伞形目、十字花目、天门冬目、薯蓣目或百合目植物的细胞;或
(b)所述酵母选自酵母菌属、裂殖酵母属、毕赤酵母属、子囊菌酵母属、克鲁维酵母菌属或假丝酵母属;或
(c)所述藻选自微藻、多细胞藻、蓝藻菌、硅藻、绿藻门(绿藻)、红藻门(红藻)或褐色植物门(褐藻)、盐藻、衣藻属或血球藻属。
50.根据权利要求49的生产甾体生物碱、甾体皂苷或三萜皂苷的方法,其中:
(a)当所述植物细胞包含来自禾本目植物的细胞时,所述植物选自以下属:稻属、大麦属、燕麦属和小麦属;
(b)当所述植物细胞包含来自石竹目植物的细胞时,所述植物选自以下属:菠菜属、藜属、甜菜属、大黄属、麦蓝菜属、肥皂草属和石头花属;
(c)当所述植物细胞包含来自茄目植物的细胞时,所述植物选自以下属:茄属、辣椒属、烟草属、莨菪属、曼陀罗属和颠茄属;
(d)当所述植物细胞包含来自豆目植物的细胞时,所述植物选自以下属:甘草属、苜蓿属、大豆属、百脉根属、鹰嘴豆属、菜豆属、豌豆属、花生属、羽扇豆属和金合欢属;
(e)当所述植物细胞包含来自锦葵目植物的细胞时,所述植物选自可可属;
(f)当所述植物细胞包含来自伞形目植物的细胞时,所述植物选自以下属:胡萝卜属、芹属、香芹菜属、人参属、柴胡属、常春藤属和积雪草属;或
(g)当所述植物细胞包含来自十字花目植物的细胞时,所述植物选自以下属:拟南芥属、芸苔属、山柑属和番木瓜属。
51.根据权利要求50的方法,其中:
(a)当所述植物细胞包含来自石竹目植物的细胞时,所述植物选自菠菜、甜菜根和奎藜籽;或
(b)当所述植物细胞包含来自茄目植物的细胞时,所述植物选自番茄、野生番茄、马铃薯、野生马铃薯、茄子、胡椒、甜椒、卡宴辣椒、红辣椒、甘椒、塔巴斯科辣椒、地樱桃、烟草和南蛇藤;或
(c)当所述植物细胞包含来自豆目植物的细胞时,所述植物选自紫苜蓿、大豆、百脉根和甘草。
52.一种降低至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体在植物或植物部分的至少一种细胞中含量的方法,所述方法包含对所述至少一种植物细胞进行遗传修饰,所述遗传修饰包含:
(a)用靶向编码纤维素合酶样G(CSLG)酶的核酸基因序列的至少一种沉默分子来转化所述至少一种植物细胞;或
(b)诱变编码纤维素合酶样G(CSLG)酶的至少一个核酸序列,其中所述诱变包含(1)将一个或多个点突变引入所述核酸序列中,(2)将缺失引入所述核酸序列内,或(3)将插入引入所述核酸内,或(4)其任何组合,其中所述引入包含对编码或非编码序列进行诱变;
其中编码所述CSLG酶的基因在所述遗传修饰的植物细胞中的表达与其在相应的未修饰的植物细胞中的表达相比是降低的,其中包含所述遗传修饰的细胞的所述植物与相应的未修饰的植物相比,包含含量减少的:至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体。
53.权利要求52的方法,其中编码所述CSLG基因的核酸序列在SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101、103或105中的任一;或与SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101、103或105中的任一所示的核酸序列具有至少55%的同一性和至少55%的覆盖度的其同源物中示出。
54.权利要求52或53的方法,其中:
(a)当所述CSLG的所述核酸在SEQ ID NO:30中示出时,所述沉默分子在SEQ ID NO:42或其互补序列或与SEQ ID NO:42所示的核酸序列或其互补序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;
(b)当所述CSLG的所述核酸在SEQ ID NO:34中示出时,所述沉默分子在SEQ ID NO:43或其互补序列或与SEQ ID NO:43所示的核酸序列或其互补序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;
(c)当所述CSLG的所述核酸在SEQ ID NO:38中示出时,所述沉默分子在SEQ ID NO:44或其互补序列或与SEQ ID NO:44所示的核酸序列或其互补序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;
(d)当所述CSLG的所述核酸在SEQ ID NO:65或SEQ ID NO:93中示出时,所述沉默分子在SEQ ID NO:106中或其互补序列,或与SEQ ID NO:65所示的核酸序列或SEQ ID NO:93所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出;或
(e)当所述CSLG的所述核酸在SEQ ID NO:95中示出时,所述沉默分子在SEQ ID NO:107或其互补序列或与SEQ ID NO:95所示的核酸序列具有至少80%的同一性和至少80%的覆盖度的其同源物中示出。
55.权利要求52-54的任一项的方法,其中
(a)所述甾体生物碱、所述甾体皂苷或所述三萜皂苷包含毒素或苦味化合物或具有激素模拟特性,或其组合;或
(b)所述甾体糖苷生物碱包含七叶皂苷、脱氢七叶皂苷、α-番茄素、番茄素、α-查茄碱、α-茄碱、α-澳洲茄碱、α-澳洲茄边碱或其任何组合;或
(c)所述甾体皂苷包含龙葵皂苷B、番茄甙,或其任何组合;或
(d)所述三萜皂苷包含苜蓿酸3-O-葡萄糖醛酸苷(MA-3-GlcA)(化合物6)、化合物7、化合物8、化合物9、化合物10、化合物11、甘草皂苷(化合物14)、甘草次酸3-O-单葡萄糖醛酸苷(化合物15)、巴约甙元(化合物25)、巴约甙元-hexA-hex-hex(化合物31)、瓜瓶藤酸(化合物26)、瓜瓶藤酸-hexA-hex(化合物32)、大豆甾醇A(化合物29)、大豆皂醇B(化合物30)、大豆甾醇A-hexA-hex-pent(化合物34)、大豆皂苷VI(化合物35)、甜菜甙IV(化合物33)、常春藤苷配基-3GlcA、丝石竹皂苷配基-3GlcA、丝石竹酸-3GlcA或QS-21佐剂,或其任何组合;或
(e)所述中间体包含化合物1、化合物2、苜蓿酸(化合物5)、齐墩果酸(化合物3)、齐墩果酸-3GlcA、奥古斯丁酸(化合物4)、奥古斯丁酸-3GlcA或甘草次酸(化合物13),或其任何组合;或
(f)其组合。
56.根据权利要求52-55的任一项的方法,还包含改变植物固醇或其衍生物、其代谢物或其生物合成中间体的含量;改变胆固醇或其衍生物、其代谢物或其生物合成中间体的含量;改变植物甾醇或其衍生物、其代谢物或其生物合成中间体的含量;改变胆甾烯醇或其衍生物、其代谢物或其生物合成中间体的含量;或改变植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体的含量。
57.一种增加至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体在植物或植物部分的至少一种细胞中含量的方法,所述方法包含对所述至少一种植物细胞进行遗传修饰,所述遗传修饰包含:
(a)诱变编码纤维素合酶样G(CSLG)酶的至少一个核酸序列,其中所述诱变包含(1)将一个或多个点突变引入所述核酸序列中,(2)将缺失引入所述核酸序列内,或(3)将插入引入所述核酸内,或(4)其任何组合,其中所述引入包含对编码或非编码序列进行诱变;以及
(b)表达编码所述CSLG的所述核酸;
其中包含所述遗传修饰的细胞的所述植物包含与相应的未修饰的植物相比,含量增加的至少一种甾体生物碱、其衍生物、其代谢物或其生物合成中间体;至少一种甾体皂苷、其衍生物、其代谢物或其生物合成中间体;或至少一种三萜皂苷、其衍生物、其代谢物或其生物合成中间体。
58.根据权利要求57的方法,其中编码所述CSLG基因的核酸序列在SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101、103或105中的任一;或与SEQ ID NO:30、32、34、36、38、40、65、80、93、95、97、99、101、103或105中的任一所示的其核酸序列具有至少55%的同一性和至少55%的覆盖度的其同源物中示出。
59.根据权利要求57的方法,其中所述CSLG酶的氨基酸序列在SEQ ID NO:31、33、35、37、39、41、66、81、94、96、98、100、102或104中的任一;或与SEQ ID NO:31、33、35、37、39、41、66、81、94、96、98、100、102或104中的任一所示的氨基酸序列具有至少55%的同一性和至少55%的覆盖度的其同源物中示出。
60.权利要求57-59的任一项的方法,其中
(a)所述甾体生物碱、所述甾体皂苷或所述三萜皂苷包含甜味剂、发泡剂、乳化剂、防腐剂、抗癌剂、降血胆固醇制剂、抗炎剂、抗氧化剂、生物佐剂、杀菌剂、杀虫剂、拒食剂、抗真菌剂,或其任何组合;或
(b)所述甾体糖苷生物碱包含七叶皂苷、脱氢七叶皂苷、α-番茄素、番茄素、α-查茄碱、α-茄碱、α-澳洲茄碱、α-澳洲茄边碱或其任何组合;或
(c)其中所述甾体皂苷包含龙葵皂苷B、番茄甙,或其任何组合;或
(d)所述三萜皂苷包含苜蓿酸3-O-葡萄糖醛酸苷(MA-3-GlcA)(化合物6)、化合物7、化合物8、化合物9、化合物10、化合物11、甘草皂苷(化合物14)、甘草次酸3-O-单葡萄糖醛酸苷(化合物15)、巴约甙元(化合物25)、巴约甙元-hexA-hex-hex(化合物31)、瓜瓶藤酸(化合物26)、瓜瓶藤酸-hexA-hex(化合物32)、大豆甾醇A(化合物29)、大豆皂醇B(化合物30)、大豆甾醇A-hexA-hex-pent(化合物34)、大豆皂苷VI(化合物35)、甜菜甙IV(化合物33)、常春藤苷配基-3GlcA、丝石竹皂苷配基-3GlcA、丝石竹酸-3GlcA或QS-21佐剂,或其任何组合;或
(e)所述中间体包含化合物1、化合物2、苜蓿酸(化合物5)、齐墩果酸(化合物3)、齐墩果酸-3GlcA、奥古斯丁酸(化合物4)、奥古斯丁酸-3GlcA或甘草次酸(化合物13),或其任何组合;或
(f)其组合。
61.权利要求57-60的任一项的方法,其中
(a)与编码CSLG酶的基因在相应的未修饰的植物细胞中的表达相比,所述编码CSLG酶的基因在所述遗传修饰的植物细胞中的表达增加,或
(b)与所述被编码的CSLG酶在相应的未修饰的植物细胞中的活性相比,所述被编码的CSLG酶在所述遗传修饰的植物细胞中的活性增加,或
(c)与所述被编码的CSLG酶在相应的未修饰的植物细胞中的稳定性相比,所述被编码的CSLG酶在所述遗传修饰的植物细胞中的稳定性增加,或
(d)(a)、(b)和(C)的其任何组合。
62.根据权利要求57-61的任一项的方法,还包含改变植物固醇或其衍生物、其代谢物或其生物合成中间体;胆固醇或其衍生物、其代谢物或其生物合成中间体;植物甾醇或其衍生物、其代谢物或其生物合成中间体;胆甾烯醇或其衍生物、其代谢物或其生物合成中间体;或植物胆甾烯醇或其衍生物、其代谢物或其生物合成中间体的含量。
CN201980072955.9A 2018-09-06 2019-09-05 纤维素合酶样酶及其用途 Pending CN112969785A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US16/123,248 US10806119B2 (en) 2013-06-05 2018-09-06 Plant with altered content of steroidal alkaloids
US16/123,248 2018-09-06
IL268269A IL268269A (en) 2019-07-25 2019-07-25 Production of high-value saponins by the use of cellulose-synthase-like family enzymes
IL268269 2019-07-25
PCT/IL2019/051000 WO2020049572A1 (en) 2018-09-06 2019-09-05 Cellulose-synthase-like enzymes and uses thereof

Publications (1)

Publication Number Publication Date
CN112969785A true CN112969785A (zh) 2021-06-15

Family

ID=69721605

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980072955.9A Pending CN112969785A (zh) 2018-09-06 2019-09-05 纤维素合酶样酶及其用途

Country Status (8)

Country Link
US (1) US20220217934A1 (zh)
EP (1) EP3847250A1 (zh)
JP (1) JP2022500023A (zh)
CN (1) CN112969785A (zh)
CA (1) CA3111386A1 (zh)
IL (1) IL281171A (zh)
SG (1) SG11202102106RA (zh)
WO (1) WO2020049572A1 (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB201909104D0 (en) 2019-06-25 2019-08-07 Plant Bioscience Ltd Transferase enzymes
WO2021075572A1 (ja) * 2019-10-17 2021-04-22 国立大学法人大阪大学 グルクロン酸転移酵素、それをコードする遺伝子及びその利用方法
CN113430194B (zh) * 2020-11-30 2023-04-07 东北林业大学 一种基于CRISPR/Cas9的白桦基因编辑方法
WO2023212651A2 (en) * 2022-04-27 2023-11-02 The Regents Of The University Of Colorado A Body Corporate Enhanced production of squalene in plant systems
GB202209588D0 (en) * 2022-06-29 2022-08-10 Plant Bioscience Ltd Methods and compositions
GB202209501D0 (en) * 2022-06-29 2022-08-10 Plant Bioscience Ltd Biosynthetic enzymes
WO2024047057A1 (en) * 2022-09-01 2024-03-07 Vib Vzw Means and methods to produce triterpene saponins in eukaryotic cells

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110219476A1 (en) * 2008-09-04 2011-09-08 Eiichiro Ono Glucuronyl transferase and polynucleotide encoding the same
WO2014195944A1 (en) * 2013-06-05 2014-12-11 Yeda Research And Development Co. Ltd. Plant with altered content of steroidal glycoalkaloids
EP2982752A1 (en) * 2013-04-04 2016-02-10 Riken Glucuronyl transferase, gene encoding same, and use thereof

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4987071A (en) 1986-12-03 1991-01-22 University Patents, Inc. RNA ribozyme polymerases, dephosphorylases, restriction endoribonucleases and methods
US5807718A (en) 1994-12-02 1998-09-15 The Scripps Research Institute Enzymatic DNA molecules
US5959180A (en) 1997-02-07 1999-09-28 The United States Of America As Represented By The Secretary Of Agriculture DNA sequences from potato encoding solanidine UDP-glucose glucosyltransferase and use to reduce glycoalkaloids in solanaceous plants
HUP0003541A3 (en) 1997-09-05 2003-08-28 Pentapharm Ag Expression vector for improved production of polypeptides in yeast
DE19919550A1 (de) 1999-04-29 2000-11-02 Norddeutsche Pflanzenzucht Han Verfahren zur Erzeugung von Organismen mit erhöhter Sterolglykosid-Produktion und Verwendung der Sterolglykoside
US6562595B2 (en) 2000-02-18 2003-05-13 Mcgill University Dominant selectable marker for gene transformation and disruption in yeasts
US20120094385A1 (en) 2000-07-31 2012-04-19 Kuehnle Agrosystems, Inc. Gene positioning system for plastidic transformation and products thereof
KR100430785B1 (ko) 2001-06-21 2004-05-10 송재만 영양요구성 우성유전자를 함유하는 효모 형질전환 벡터, 이를 함유하는 효모 형질전환체 및 그 제조방법
ATE542908T1 (de) 2002-10-15 2012-02-15 Syngenta Participations Ag Plastidtransformation
US7439419B1 (en) 2005-11-14 2008-10-21 The United States Of America As Represented By The Secretary Of Agriculture Solanum tuberosum β-solanine/β-chaconine rhamnosyl transferase sequences and uses thereof
US7375259B1 (en) 2005-11-14 2008-05-20 The United States Of America, As Represented By The Secretary Of Agriculture Solanum tuberosum sterol alkaloid glycosyltransferase (SGT) a novel solanidine glucosyltransferase SGT2 and uses thereof
JP4737531B2 (ja) 2005-12-05 2011-08-03 サントリーホールディングス株式会社 形質転換酵母を用いるセラミドの製造方法
EP1854878A1 (en) 2006-05-10 2007-11-14 Cosmoferm B.V. Methods and materials for the transformation of the yeast Pichia ciferrii
JP2009034036A (ja) 2007-08-01 2009-02-19 Toyota Motor Corp 形質転換用酵母、形質転換方法及び物質生産方法
EP2257638B1 (en) 2008-03-03 2014-12-31 AbbVie Inc. Methods for transforming yeast
EP2206723A1 (en) 2009-01-12 2010-07-14 Bonas, Ulla Modular DNA-binding domains
CN102292440B (zh) 2009-01-23 2014-02-12 国立大学法人高知大学 一种用于遗传转化藻类的新型启动子
KR20100095125A (ko) 2009-02-20 2010-08-30 주식회사 포비커 위치 기반 광고 시스템
WO2010113149A1 (en) 2009-04-02 2010-10-07 Rosetta Green Ltd. Compositions and methods for increasing oil content in algae
US9598699B2 (en) 2009-08-28 2017-03-21 Kirin Holdings Kobushiki Kaisha Protein having glycoalkaloid biosynthetic enzyme activity and gene encoding the same
JP5804601B2 (ja) 2010-02-17 2015-11-04 国立大学法人高知大学 藻類を形質転換するために用いられる新規プロモーター
JP5794770B2 (ja) 2010-08-31 2015-10-14 キリンホールディングス株式会社 グリコアルカロイド生合成酵素活性を有するタンパク質とそれをコードする遺伝子
WO2012095843A1 (en) 2011-01-13 2012-07-19 Yeda Research And Development Co. Ltd. Organisms with altered steroidal saponin and steroidal alkaloid levels and methods for producing same
US10806119B2 (en) * 2013-06-05 2020-10-20 Yeda Research And Development Co. Ltd. Plant with altered content of steroidal alkaloids
JP5721191B2 (ja) 2013-07-02 2015-05-20 国立大学法人京都大学 3段階方式矩形波多重パルスを利用した藻類細胞への遺伝子導入法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110219476A1 (en) * 2008-09-04 2011-09-08 Eiichiro Ono Glucuronyl transferase and polynucleotide encoding the same
EP2982752A1 (en) * 2013-04-04 2016-02-10 Riken Glucuronyl transferase, gene encoding same, and use thereof
US20160046912A1 (en) * 2013-04-04 2016-02-18 Riken Glucuronosyltransferase, gene encoding same and use thereof
WO2014195944A1 (en) * 2013-06-05 2014-12-11 Yeda Research And Development Co. Ltd. Plant with altered content of steroidal glycoalkaloids

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"Solanum lycopersicum cellulose synthase-like protein G2 (LOC101255510), mRNA ,XM_004243592.4", 《GENBANK》 *
GUOJIE XU等: "A novel glucuronosyltransferase has an unprecedented ability to catalyse continuous two-step glucuronosylation of glycyrrhetinic acid to yield glycyrrhizin", 《NEW PHYTOL.》, vol. 212, no. 1, pages 123 - 135, XP055324545, DOI: 10.1111/nph.14039 *

Also Published As

Publication number Publication date
IL281171A (en) 2021-04-29
JP2022500023A (ja) 2022-01-04
SG11202102106RA (en) 2021-04-29
WO2020049572A1 (en) 2020-03-12
CA3111386A1 (en) 2020-03-12
EP3847250A1 (en) 2021-07-14
US20220217934A1 (en) 2022-07-14

Similar Documents

Publication Publication Date Title
CN112969785A (zh) 纤维素合酶样酶及其用途
AU2022203048B2 (en) Recombinant production of steviol glycosides
US11412700B2 (en) Plant with altered content of steroidal alkaloids
KR102181638B1 (ko) 스테비올 글리코시드의 재조합 생산
KR101815063B1 (ko) 사프란 화합물의 재조합 생성을 위한 방법 및 물질
Yonekura‐Sakakibara et al. A flavonoid 3‐O‐glucoside: 2 ″‐O‐glucosyltransferase responsible for terminal modification of pollen‐specific flavonols in A rabidopsis thaliana
CN106459987B (zh) 使用源自于人参的糖基转移酶使人参皂苷糖基化的新方法
CN110225971B (zh) 一组催化糖链延伸的udp-糖基转移酶及其应用
US10100322B2 (en) Plant with altered content of steroidal glycoalkaloids
US20230106588A1 (en) Transferase enzymes
KR20150115002A (ko) 레바우디오시드 d 및 레바우디오시드 m의 개선된 생산 방법
JP2021510495A (ja) 代謝工学
CN109996879A (zh) 具有缩短的到开花时间的植物
KR20160039867A (ko) 올레아난계 진세노사이드 생합성 촉진용 조성물
JP7450867B2 (ja) 植物形質転換体
US11957102B2 (en) Plant with altered content of steroidal alkaloids
US20210317497A1 (en) Monbretin a (mba) synthesis using a heterologous nucleic acid(s) encoding a mba pathway enzyme
WO2024003012A1 (en) Saponarioside biosynthetic enzymes
CN112955545A (zh) 获得低三萜烯/三萜类化合物含量的天然橡胶乳胶的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination