CN114829587A - 调节植物中的还原糖含量(inv) - Google Patents

调节植物中的还原糖含量(inv) Download PDF

Info

Publication number
CN114829587A
CN114829587A CN202080069448.2A CN202080069448A CN114829587A CN 114829587 A CN114829587 A CN 114829587A CN 202080069448 A CN202080069448 A CN 202080069448A CN 114829587 A CN114829587 A CN 114829587A
Authority
CN
China
Prior art keywords
plant
polynucleotide
tobacco
seq
polypeptide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080069448.2A
Other languages
English (en)
Inventor
L·博维特
A·荷福克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Philip Morris Products SA
Original Assignee
Philip Morris Products SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Philip Morris Products SA filed Critical Philip Morris Products SA
Publication of CN114829587A publication Critical patent/CN114829587A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • C12N15/8245Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine involving modified carbohydrate or sugar alcohol metabolism, e.g. starch biosynthesis
    • C12N15/8246Non-starch polysaccharides, e.g. cellulose, fructans, levans
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • C12N15/8245Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine involving modified carbohydrate or sugar alcohol metabolism, e.g. starch biosynthesis
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H6/00Angiosperms, i.e. flowering plants, characterised by their botanic taxonomy
    • A01H6/82Solanaceae, e.g. pepper, tobacco, potato, tomato or eggplant
    • A01H6/823Nicotiana, e.g. tobacco
    • AHUMAN NECESSITIES
    • A24TOBACCO; CIGARS; CIGARETTES; SIMULATED SMOKING DEVICES; SMOKERS' REQUISITES
    • A24BMANUFACTURE OR PREPARATION OF TOBACCO FOR SMOKING OR CHEWING; TOBACCO; SNUFF
    • A24B15/00Chemical features or treatment of tobacco; Tobacco substitutes, e.g. in liquid form
    • A24B15/18Treatment of tobacco products or tobacco substitutes
    • A24B15/24Treatment of tobacco products or tobacco substitutes by extraction; Tobacco extracts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8213Targeted insertion of genes into the plant genome by homologous recombination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8216Methods for controlling, regulating or enhancing expression of transgenes in plant cells
    • C12N15/8218Antisense, co-suppression, viral induced gene silencing [VIGS], post-transcriptional induced gene silencing [PTGS]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • C12N9/1062Sucrose synthase (2.4.1.13)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2408Glucanases acting on alpha -1,4-glucosidic bonds
    • C12N9/2431Beta-fructofuranosidase (3.2.1.26), i.e. invertase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/01Hexosyltransferases (2.4.1)
    • C12Y204/01013Sucrose synthase (2.4.1.13)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01026Beta-fructofuranosidase (3.2.1.26), i.e. invertase

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Nutrition Science (AREA)
  • Medicinal Chemistry (AREA)
  • Virology (AREA)
  • Natural Medicines & Medicinal Plants (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Physiology (AREA)
  • Botany (AREA)
  • Developmental Biology & Embryology (AREA)
  • Environmental Sciences (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Manufacture Of Tobacco Products (AREA)

Abstract

本文描述一种植物细胞,其包含:(i)多核苷酸,其包含与SEQ IDNO:5(NtINV4‑S)具有至少81%序列同一性或与SEQ ID NO:7(NtINV4‑T)具有至少62%序列同一性的序列,由其组成或基本上由其组成;(ii)多肽,其由(i)中所示的所述多核苷酸编码;(iii)多肽,其包含与SEQ ID NO:6(NtINV4‑S)具有至少85%序列同一性或与SEQ ID NO:8(NtINV4‑T)具有至少85%序列同一性的序列,由其组成或基本上由其组成;或(iv)构建体、载体或表达载体,其包含(i)中所示的经分离的多核苷酸,其中与所述多核苷酸或多肽的表达或活性未被修饰的对照植物细胞相比,所述植物细胞包含至少一种修饰,其调节(a)所述多核苷酸的表达或活性或(b)所述多核苷酸或所述多肽的表达或活性。

Description

调节植物中的还原糖含量(INV)
相关申请的交叉引用
本申请要求2019年10月1日提交的欧洲专利申请第19200865.4号的优先权,所述申请的公开内容据此以引用方式并入。
技术领域
本发明涉及具有调节的转化酶(INV)表达或活性的植物细胞等。
背景技术
为了制造烟草产品,将不同类型的烟草以各种比率混合,以产生具有某些风味特征的共混物。烟道干制的烟草(例如,弗吉尼亚烟(Virginia))是生长最广泛的烟草,并且其特征在于糖与氮的高比率,但其风味特征有限。其他烟草类型-诸如晾干(例如,白肋烟(Burley)、马里兰烟(Maryland)和加尔泡烟(Galpao))或烘烤(例如,深色烟 (Dark))烟草类型-提供替代的风味特征。这些不同的风味特征在混合烟草产品的生产中非常重要。
风味特征是烟草植物中以一定水平存在的特定风味化合物或这些化合物的前体的结果。举例来说,改变干制烟草中糖的含量可导致烟草的不同风味和香味感觉。在气溶胶和烟雾中,葡萄糖和较小程度的果糖可通过美拉德反应生成阿马多里(Amadori)化合物。这可能产生面包、坚果或爆米花风味。
然而,由于用于商业生产的烟草的种类有限,这意味着开发具有不同风味和香味的烟草产品的机会也有限。这同样适用于制造用于降低风险产品的加热烟草棒的再造烟草材料。
本领域中仍需要改进生产烟草的机会,从而为消费者提供新的风味和感官体验,同时仍保持商业上可接受的产率和特性。本发明试图解决该需求和其他需要。
发明内容
本文公开了来自普通烟草(Nicotiana tabacum)的INV的多核苷酸和多肽序列。虽然许多不同基因被认为基于结构同一性编码植物中的可能INV,但这些基因作为植物中的INV在其功能上变得有活性的点通常是未知的。特别地,关于烟草中INV基因的表达,特别是在干制期间,知之甚少。本发明人现已在植物中鉴定出在干制过程中功能性表达的某些NtINV多核苷酸。令人惊讶的是,观察到调节这些某些NtINV基因的表达或由此编码的蛋白质的活性可以改变在叶干制期间产生的还原糖和蔗糖的总量。出人意料的是,某些INV基因的改变可导致在叶干制期间产生的还原糖和蔗糖的水平的改变。有利地,这现在提供了产生具有新风味和香味特征的烟草共混物的机会。这还可以导致在加热烟草共混物时产生的气溶胶或烟雾的不同风味或感官感觉。同样,从烟草获得的液体提取物可以具有不同的风味或感官感觉。改变还原糖与氨基酸的平衡可能还会影响丙烯酰胺在气溶胶和烟雾中的释放。
本文描述了来自普通烟草的几个INV基因组多核苷酸序列,即 NtINV3-S(SEQ IDNO:1)、NtINV3-T(SEQ ID NO:3)、NtINV4-S (SEQ ID NO:5)和NtINV4-T(SEQ ID NO:7)。本文还描述了来自普通烟草的几个INV多肽序列,即NtINV3-S(SEQ ID NO:2)、NtINV3- T(SEQID NO:4)、NtINV4-S(SEQ ID NO:6)和NtINV4-T(SEQ ID NO:8)。特别地,示出NtINV4-S和NtINV4-T在干制期间在糖代谢中起作用。在烟草干制期间,烟道干制烟草(例如弗吉尼亚烟)通常包含比晾干的烟草(例如白肋烟)多至少八倍的还原糖,这主要是由于其积累高水平的淀粉的基因倾向。在叶子收获之后和衰老过程(黄化阶段)中,大部分淀粉首先被转化为蔗糖,并且然后转化为可能涉及INV的还原糖。
NtINV4-S和NtINV4-T多肽序列非常相似,共有96%的同一性。 NtINV3-S和NtINV3-T多肽序列的情况相似,它们也非常相似并且共有 96%的同一性。值得注意的是,NtINV4-S和NtINV4-T对以及NtINV3-S 和NtINV3-T对共享仅约60%的低同一性,表明不同的功能或调节。令人惊讶的是,仅NtINV4-S和NtINV4-T在干制期间过表达,而NtINV3- S和NtINV3-T在干制期间未过表达。在某些实施方案中,NtINV3-S和 NtINV3-T的活性或表达未被调节。NtINV3-S和NtINV3-T可能参与其他代谢途径,并且其表达的变化可能导致农艺学上有害的表型(例如,缓慢生长)。知道哪些INV基因在干制期间过表达有利地允许选择仅在相关基因中有变化的植物,并减少对其他代谢过程的潜在负面影响。
对一种或多种INV的表达或活性的修饰可以与对一种或多种蔗糖合成酶(SUS)的表达或活性的修饰组合在一起,以进一步调节干制叶子中的糖的水平。相应地,公开了对INV和SUS的修改的组合。例如,降低如本文所述的一种或多种INV的表达或活性可以增加或降低干制叶子中的葡萄糖或果糖水平或其组合并增加蔗糖水平。作为另一个实例,增加如本文所述的一种或多种INV的表达或活性可以增加干制叶子中的葡萄糖或果糖水平或其组合并降低蔗糖水平。作为另一个的实例,与单独降低一种或多种INV的表达或活性相比,降低如本文所述的一种或多种INV和一种或多种SUS的表达或活性可以进一步降低干制叶片中的葡萄糖或果糖水平或其组合。作为另一个的实例,与单独增加一种或多种INV的表达或活性相比,增加如本文所述的一种或多种INV和一种或多种SUS的表达或活性可以进一步增加干制叶片中的葡萄糖或果糖水平或其组合。
公开了NtSUS1-S(SEQ ID NO:10)、NtSUS1-T(SEQ ID NO:12)、 NtSUS2-S(SEQ IDNO:14)、NtSUS2-T(SEQ ID NO:16)、NtSUS3-S (SEQ ID NO:18)、NtSUS3-T(SEQ ID NO:20)、NtSUS4-S(SEQ ID NO:22)、NtSUS4-T(SEQ ID NO:24)、NtSUS5-S(SEQ ID NO:26)、 NtSUS5-T(SEQ ID NO:28)、NtSUS6-S(SEQ ID NO:30)和NtSUS6-T (SEQ ID NO:32)。还公开了NtSUS1-S(SEQ ID NO:11)、NtSUS1- T(SEQ ID NO:13)、NtSUS2-S(SEQ ID NO:15)、NtSUS2-T(SEQ ID NO:17)、NtSUS3-S(SEQ ID NO:19)、NtSUS3-T(SEQ ID NO: 21)、NtSUS4-S(SEQID NO:23)、NtSUS4-T(SEQ ID NO:25)、 NtSUS5-S(SEQ ID NO:27)、NtSUS5-T(SEQ ID NO:29)、NtSUS6- S(SEQ ID NO:31)和NtSUS6-T(SEQ ID NO:33)的相应推导的多肽序列。NtSUS2-S、NtSUS2-T、NtSUS3-S、NtSUS3-T、NtSUS4-S和 NtSUS4-T可在干制期间在糖代谢中起作用。特别地,NtSUS2-S、 NtSUS3-S、NtSUS3-T和NtSUS4-S可在干制期间在糖代谢中起作用。
在一个方面,提供了一种植物细胞,所述植物细胞包含:(i)多核苷酸,所述多核苷酸包含与SEQ ID NO:5(NtINV4-S)具有至少81%序列同一性或与SEQ ID NO:7(NtINV4-T)具有至少62%序列同一性的序列,由其组成或基本上由其组成;(ii)多肽,所述多肽由(i)中所示的所述多核苷酸编码;(iii)多肽,所述多肽包含与SEQ ID NO:6 (NtINV4-S)具有至少84%或至少85%序列同一性或与SEQ ID NO:8 (NtINV4-T)具有至少85%序列同一性的序列,由其组成或基本上由其组成;或(iv)构建体、载体或表达载体,其包含(i)中所示的经分离的多核苷酸,其中与所述多核苷酸或多肽的表达或活性未被修饰的对照植物细胞相比,所述植物细胞包含至少一种修饰,所述至少一种修饰调节(a)所述多核苷酸的表达或活性或(b)所述多核苷酸或所述多肽的表达或活性。
适当地,与含有对照植物细胞的对照植物的干制叶子中的一种或多种还原糖的水平相比,调节的表达或调节的活性调节包含植物细胞的植物的干制叶子中的一种或多种还原糖的水平,合适地其中还原糖是葡萄糖或果糖或它们的组合。
适当地,调节的表达或调节的活性还调节包含植物细胞的植物的干制叶子中的蔗糖水平。
适当地,与对照干制叶子相比,干制叶子具有至少约63%的降低的葡萄糖水平。
适当地,与对照干制叶子相比,干制叶子具有至少约43%的降低的果糖水平。适当地,与对照干制叶子相比,干制叶子分别具有至少约63%和至少约43%的降低的葡萄糖和果糖水平。
适当地,干制叶子来自植物上的中间位置叶。
适当地,对包含植物细胞的植物的表型的影响可忽略不计。例如,植物的表型可以不变。
适当地,与包含对照植物细胞的对照植物相比,总游离氨基酸没有变化。
适当地,至少一种修饰是植物细胞基因组中的至少一种修饰,或者是构建体、载体或表达载体中的至少一种修饰,或者是至少一种转基因修饰。
适当地,至少一种修饰是多核苷酸中的遗传突变。
适当地,植物是普通烟草。
适当地,植物细胞还包含NtSUS多核苷酸或由其编码的多肽中的至少一种修饰,更适当地,其中NtSUS多核苷酸或由其编码的多肽选自由以下组成的组:NtSUS2-T、NtSUS3-S、NtSUS3-T、NtSUS4-S、NtSUS4-T 或其两种或更多种的组合,更适当地,其中NtSUS多核苷酸或由其编码的多肽选自由以下组成的组:NtSUS2-S、NtSUS3-S、NtSUS3-T和 NtSUS4-S或其两种或更多种的组合。
适当地,植物细胞包含NtINV4多核苷酸或NtINV4多肽中的至少一个突变,以及NtSUS多核苷酸或由其编码的多肽中的至少一个突变。
在另一方面,提供了一种包含本文所述的植物细胞的植物或其部分。
在另一方面,公开了从植物或部分衍生或获得的植物材料、干制植物材料或均质植物材料,适当地,其中植物材料选自由以下组成的组:生物质、种子、茎、花或叶或其两种或更多种的组合。干制植物材料可以选自由以下组成的组:烟道干制的植物材料、晒干的植物材料或晾干的植物材料或者其两种或更多种的组合。
在另一方面中,提供一种包含植物细胞、植物的一部分或植物材料的烟草产品。
在另一方面,提供了一种用于生产本文所述的植物的方法,所述方法包括以下步骤:(a)提供本文所述的包含至少一种修饰的植物细胞;以及(b)将植物细胞繁殖成植物。
适当地,在步骤(a)中,通过基因组编辑引入至少一种修饰,适当地,其中基因组编辑选自CRISPR介导的基因组编辑、锌指核酸酶介导的诱变、化学或放射诱变、同源重组、寡核苷酸定向诱变和大范围核酸酶介导的诱变。
适当地,在步骤(a)中,使用干扰多核苷酸或通过引入至少一种突变或其组合来引入至少一种修饰。
在另一方面,公开了一种用于制备干制植物材料的方法,与对照植物材料相比,所述干制植物材料具有改变量的还原糖,所述方法包括以下步骤:(a)提供如本文所述的植物或其部分或植物材料;(b) 自其收获植物材料;以及(c)干制植物材料。
在另一方面,提供了一种产生液体烟草提取物的方法,所述方法
包括以下步骤:(a)由含有植物细胞的植物或其部分制备烟草起始材料,所述植物细胞包含调节如本文所述的NtINV的表达或活性的至少一种修饰;(b)在合适的提取温度下加热烟草起始材料;(c)在加热期间收集从烟草起始材料释放的挥发性化合物;以及(d)合并从烟草起始材料释放的所收集的挥发性化合物并形成液体烟草提取物。
在另一方面,公开了一种产生液体烟草提取物的方法,所述方法包括以下步骤:(a)由含有其中NtINV的表达或活性如本文所述被修饰的植物细胞的植物或其部分制备第一烟草起始材料;(b)由含有其中 NtSUS的表达或活性如本文所述被修饰的植物细胞的植物或其部分制备第二烟草起始材料;(c)在第一提取温度下加热第一烟草起始材料; (d)在第二提取温度下加热第二烟草起始材料;(e)在加热期间收集从第一烟草起始材料和第二烟草起始材料释放的挥发性化合物;以及 (f)合并从第一烟草起始材料和第二烟草起始材料释放的所收集的挥发性化合物并由所合并的挥发性化合物形成液体烟草提取物。
在另一方面,公开了一种液体烟草提取物,其通过如本文所述的生产液体烟草提取物的方法生产、获得或能够获得。
在另一方面,公开了一种植物细胞,所述植物细胞包含:(i)多核苷酸,所述多核苷酸包含与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5和SEQ ID NO:7具有至少60%序列同一性的序列,由其组成或基本上由其组成;多肽,所述多肽包含与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8具有至少50%序列同一性的序列,由其组成或基本上由其组成;(ii)多肽,所述多肽由(i)中所示的多核苷酸编码;(iii)多肽,所述多肽包含与SEQ ID NO:2或SEQ ID NO:4具有至少80%序列同一性以及与SEQ ID NO:6或SEQ ID NO:8具有80%序列同一性的序列,由其组成或基本上由其组成;(iv)构建体、载体或表达载体,其包含(i)中所示的经分离的多核苷酸,其中与所述多核苷酸或多肽的表达或活性未被修饰的对照植物细胞相比,所述植物细胞包含至少一种修饰,所述至少一种修饰调节所述多核苷酸或所述多肽的表达或活性。
一些优点
有利地,改变烟草中的糖-氨基酸平衡可影响在气溶胶和烟雾中加热时的风味化合物和丙烯酰胺(由葡萄糖(果糖)与天冬酰胺相互作用产生的致癌化合物)的释放。
有利地,加热烟草棒的再造烟草材料需要还原糖用于适当的铸叶制备。本公开可影响糖的含量和平衡,从而影响铸叶制备。
有利地,可以产生消费者更可接受的非遗传修饰植物。
有利地,本公开不限于EMS突变植物的使用。
本公开可以应用于各种植物品种或农作物。通常,衰老叶(源叶) 产生蔗糖作为碳源和天冬酰胺作为库叶和种子的同化氮源。因此,蔗糖和天冬酰胺必须首先从薄壁(光合)衰老叶细胞转运到韧皮部,并且然后再转运到上部储存组织。操纵NtINV或由其编码的多肽可以影响还原糖(诸如葡萄糖和果糖)的水平,对游离氨基酸具有低影响。此方法可以允许开发具有较低葡萄糖和果糖以及更多蔗糖含量的新型烟草品种。
有利地,本公开可以与调节其他基因(诸如本文所述的NtSUS或由其编码的多肽)的表达组合在一起。
附图说明
图1是示出以下的一系列曲线图:(A)在弗吉尼亚烟烟道干制时间过程期间的还原糖(葡萄糖和果糖)的释放;(B)在弗吉尼亚烟烟道干制时间过程期间NtINV3-S、NtINV3-T、NtINV4-S和NtINV4-T的表达;以及(C)在弗吉尼亚烟烟道干制时间过程期间衰老相关基因SAG12的表达。
图2是示出以下的一系列曲线图:(A)葡萄糖的释放;(B)果糖的释放;以及(C)蔗糖在深色烟草的晾干时间过程期间的释放。数据由代谢区室的代谢分析生成(无可用单位)。
图3是示出使用GATEWAY载体使NtINV4-S和NtINV4-T沉默的结果以及在干制48小时后在弗吉尼亚烟叶中NtINV4-S和NtINV4-T表达的测量结果的图(qPCR)。T0-INV4是生成的转基因系,并且CT0-INV4 是对应的对照系。
图4是示出以下的一系列曲线图:(A)葡萄糖;(B)果糖;以及 (C)沉默的35S:INV4-RNAi(INV4-T0)干制叶子和对照(CT0)干制叶子中的蔗糖含量(CT0,n=4;以及T0,n=4)。呈现了箱形图以及T 检验统计分析。
图5是示出了在白肋烟、弗吉尼亚烟和东方烟中收获(成熟)后、干制两天(干制48小时)后和干制结束时每种还原糖含量的条形图。
具体实施方式
本公开中所用的章节标题用于组织目的并且不旨在进行限制。
1.定义
除非另外定义,否则本文所用的所有技术和科学术语都具有与所属领域普通技术人员通常所理解相同的含义。在有矛盾的情况下,将以本文档(包括定义)为准。下文描述优选方法和材料,但与本文所述的那些类似或等效的方法和材料可用于实施或测试本发明。本文所披露的所述材料、方法和实例仅仅是说明性的并且不打算是限制性的。
术语“包含”、“包括”、“具有(having/has)”、“可以”、“含有”以及它们的变体打算是开放性过渡短语、术语或措辞,不排除额外动作或结构的可能性。
除非上下文另外明确规定,否则单数形式的“一个”、“一种”和“该”包括多个指示物。
本公开考虑了“包含”本文呈现的实施方案或要素、“由其组成”和“基本上由其组成”的其他实施方案,无论是否明确地阐述。
为了叙述本文的数值范围,明确涵盖它们之间具有相同精确度的每一个插入数值。举例来说,对于范围6-9,除了6和9之外涵盖数值7和 8,并且对于范围6.0-7.0,明确涵盖数值6.0、6.1、6.2、6.3、6.4、6.5、 6.6、6.7、6.8、6.9以及7.0。
如整个说明书和权利要求书中所使用,以下术语具有以下含义:
“编码序列”或“多核苷酸编码”是指包含编码多肽的多核苷酸的核苷酸(RNA或DNA分子)。编码序列还可包括可操作地连接到调节元件的起始和终止信号,所述调节元件包括能够指导在施用多核苷酸的个体或哺乳动物的细胞中表达的启动子和聚腺苷酸化信号。编码序列可以经密码子优化。
“互补”或“互补的”可以指核苷酸或核苷酸类似物之间的Watson- Crick(例如,A-T/U和C-G)或Hoogsteen碱基配对。“互补性”是指两个多核苷酸之间共有的性质,使得当它们彼此反平行排列时,每个位置处的核苷酸碱基将是互补的。
“构建体”是指包含一种或多种多核苷酸的双链重组多核苷酸片段。构建体包括与互补“有义链或编码链”碱基配对的“模板链”。给定构建体可以在两个可能方向中插入载体内,所述两个可能方向是关于位于载体 (诸如表达载体)内的启动子方向来说相同(或有义)方向或相反(或反义)方向。
在对照植物或对照植物细胞的上下文中,术语“对照”是指其中一个或多个基因或多肽的表达、功能或活性未被修饰(例如,增加或减少) 并且因此其可以与其中相同的一个或多个基因或多肽的表达、功能或活性已被修饰的植物进行比较的植物或植物细胞。“对照植物”是除了测试参数以外全部参数大体上等效于测试植物或经修饰植物的植物。例如,当提及已引入多核苷酸的植物时,对照植物是没有引入这种多核苷酸的等同植物。对照植物可以是已引入对照多核苷酸的等同植物。在此类情况下,对照多核苷酸是预期对植物几乎不产生或不产生表型作用的多核苷酸。对照植物可以包含空白载体。对照植物可对应于野生型植物。对照植物可以是其中T1分离体不再具有转基因的空分离体。
术语“减少”或“减少的”是指减少约10%至约99%,或减少至少10%、至少20%、至少25%、至少30%、至少40%、至少50%、至少60%、至少70%、至少75%、至少80%、至少90%、至少95%、至少98%、至少 99%、或至少100%、或至少150%、或至少200%或更多的数量或功能,诸如多肽功能、转录功能或多肽表达。术语“减少的”或短语“减少的量”可以指数量或功能,其小于在以相同方式加工的未被修饰的植物或来自相同品种的植物的产品中发现的数量或功能。因此,在一些情况下,将已经以相同方式加工的相同品种的野生型植物用作对照,通过该对照测量是否获得数量的减少。
“供体DNA”或“供体模板”是指包括至少一部分目的基因的双链 DNA片段或分子。供体DNA可以编码功能性多肽。
“内源基因或多肽”是指源自生物体的基因组并且没有经历改变(诸如遗传物质的丢失、获得或交换)的基因或多肽。内源基因进行标准基因传递和基因表达。内源多肽经历正常表达。
“增强子序列”是指可以增加基因表达的序列。这些序列可以位于经转录区的上游、内含子内或下游。经转录区从启动子到转录终止区包含外显子和插入内含子。基因表达的增强可以通过多种机制进行,包括提高转录效率、稳定成熟的mRNA和翻译增强。
“表达”是指功能产物的产生。例如,多核苷酸片段的表达可以指多核苷酸片段的转录(例如,产生mRNA或功能RNA的转录)或mRNA 翻译成前体或成熟多肽,或其组合。
“过表达”指的是转基因生物体中产生的基因产物超过来自同一实验的空分离(或非转基因)生物体产生的水平。
“功能”描述具有生物学功能或活性的多肽。“功能基因”是指转录成 mRNA的基因,其被翻译成功能或活性多肽。
“基因构建体”是指包含编码多肽的多核苷酸的DNA或RNA分子。编码序列可包括可操作地连接到调节元件的起始和终止信号,所述调节元件包括能够指导表达的启动子和聚腺苷酸化信号。
“基因组编辑”通常指通过其改变细胞中的基因组核酸的过程。例如,这可以通过去除、插入或替换基因组核酸中的一个或多个核苷酸来进行。核酸内切酶可用于在基因组中的限定位置处产生特定的断裂或裂口,并且在本文中进一步描述。
术语“同源性”或“相似性”是指通过序列比对比较的两个多肽之间或两个多核苷酸分子之间的序列相似性程度。被比较的两个离散多核苷酸之间的同源性程度是在可比较位置处的相同或匹配核苷酸的数目的函数。同源性或相似性可在受试者序列的全长上确定。
在两个或更多个多核苷酸或多肽的上下文中,“相同”或“同一性”是指序列在特定区域上具有特定百分比的相同残基。百分比可以通过最佳比对两个序列,比较两个序列的指定区域,测定两个序列中存在相同残基的位置数产生匹配位置数,匹配位置数除以指定区域中的位置总数,并且结果乘以100产生序列一致性百分比来计算。在两个序列具有不同长度或比对产生一个或多个交错端并且指定比较区域仅包括单个序列的情况下,单个序列的残基包括于计算的分母而非分子中。当比较DNA 和RNA时,胸腺嘧啶(T)和尿嘧啶(U)视为相当。同一性可以人工鉴定或通过使用计算机序列算法诸如ClustalW、ClustalX、BLAST、FASTA或Smith-Waterman测定。ClustalW的合适参数可能如下:对于多核苷酸比对:缺口开放罚分=15.0,缺口延伸罚分=6.66,并且矩阵=同一性。对于多肽比对:缺口开放罚分=10.o,缺口延伸罚分=0.2,并且矩阵=Gonnet。对于DNA和蛋白质比对:ENDGAP=-1,并且GAPDIST=4。
术语“增加”或“增加的”是指增加约10%至约99%,或增加至少10%、至少20%、至少25%、至少30%、至少40%、至少50%、至少60%、至少70%、至少75%、至少80%、至少90%、至少95%、至少98%、至少 99%、至少100%、至少150%、或至少200%或更多的数量或功能或活性,诸如但不限于多肽功能或活性、转录功能或活性和多肽表达中的一种或多种。术语“增加的”或短语“增加的量”可以指植物或由植物产生的产物中的数量或功能或活性,其大于以相同方式加工的未经修饰的植物或来自相同品种的植物的产物中发现的数量或功能或活性。因此,在一些情况下,将已经以相同方式加工的相同品种的野生型植物用作对照,通过该对照测量是否获得数量的增加。
术语“抑制”或“被抑制”是指减少约98%至约100%,或减少至少98%、至少99%,但特别是100%的数量或功能或活性,诸如但不限于多肽功能或活性、转录功能或活性和多肽表达中的一种或多种。
术语“引入”是指将多核苷酸(例如,构建体)或多肽提供到细胞中。引入包括提及多核苷酸向真核细胞中的掺入,其中多核苷酸可掺入细胞的基因组中,并且包括提及多核苷酸或多肽向细胞的瞬时提供。引入包括稳定或短暂转型法,以及性别交叉。因此,在将多核苷酸(例如,重组构建体/表达构建体)插入细胞的上下文中,“引入”是指“转染”或“转化”或“转导”,并且包括提及多核苷酸向真核细胞中的掺入,其中多核苷酸可以掺入细胞的基因组(例如,染色体、质粒、质体或线粒体 DNA)中,转化为自主复制子或瞬时表达(例如,转染的mRNA)。
术语“分离的”或“纯化的”是指基本上或实质上不含在其天然状态下通常伴随其的组分的材料。纯度和均质性通常使用例如聚丙烯酰胺凝胶电泳或高效液相色谱等分析化学技术测定。作为制剂中存在的主要种类的多肽是基本上纯化的。特别地,分离的多核苷酸与位于所需基因侧面并编码除所需多肽之外的多肽的开放阅读框分离。术语“纯化的”表示多核苷酸或多肽在电泳凝胶中产生实质上一个带。特别地,它是指多核苷酸或多肽的纯度为至少85%,更优选为至少95%,并且最优选为至少 99%。分离的多核苷酸可以从其天然存在的宿主细胞纯化。技术人员已知的常规多核苷酸纯化方法可用于获得分离的多核苷酸。术语还涵盖重组多核苷酸和化学合成的多核苷酸。
“液体烟草提取物”描述对烟草起始材料进行的提取方法的直接产物。用于生产液体烟草提取物的提取方法可包括在特定的加热条件下加热烟草起始材料并收集所生成的挥发性化合物。液体烟草提取物可含有源自烟草起始材料并在提取过程期间去除的化合物的混合物组成,通常与液体载体或溶剂组合。
“调节(modulate/modulating)”是指引起或促进所关注的过程、途径、功能或活性的定性或定量变化、改变或修饰。非限制性地,这样的变化、改变或修饰可以是所关注的相关过程、途径、功能或活性的增加或减少。例如,可以调节基因表达或多肽表达或多肽功能或活性。通常,将通过与对照比较来确定相关变化、改变或修饰。
术语“非天然存在”描述的不是自然界形成的或自然界中不存在的实体,诸如多核苷酸、基因突变、多肽、植物、植物细胞和植物材料。可以通过本文中所描述或本领域已知的方法来制备、合成、起始、修饰、干预或操纵这类非天然存在的实体或人工实体。可以由人制备、合成、起始、修饰、干预或操纵这类非天然存在的实体或人工实体。因此,例如,非天然存在的植物、非天然存在的植物细胞或非天然存在的植物材料,可使用传统植物育种技术(例如回交)或通过遗传操纵技术(例如反义RNA、干扰RNA、大范围核酸酶等等)进行制备。进一步举例来说,可以通过第一植物或植物细胞基因渗入第二植物或植物细胞(其自身可以是天然存在的)内,或通过将一个或多个基因突变(例如一种或多种多态性)从第一植物或植物细胞转移到第二植物或植物细胞内来制备非天然存在的植物、非天然存在的植物细胞或非天然存在的植物材料,使得所得到的植物、植物细胞或植物材料或其后代包括并非天然形成或在自然界中不存在的基因组成(例如基因组、染色体或其区段)。所得到的植物、植物细胞或植物材料因此是人工的或非天然存在的。相应地,可以通过修饰第一天然存在的植物或植物细胞中的基因序列来制备人工的或非天然存在的植物或植物细胞,即使所得到的基因序列在第二植物或植物细胞中天然存在,所述第二植物或植物细胞包括与第一植物或植物细胞不同的基因背景。在某些实施方案中,突变不是天然存在于多核苷酸或多肽(诸如基因或多肽)中的天然发生的突变。遗传背景的差异可以通过表型差异或通过本领域已知的分子生物学技术来检测,这些分子生物学技术诸如多核苷酸测序、是否存在遗传标记(例如,微卫星 RNA标记)。
“寡核苷酸”或“多核苷酸”是指共价连接在一起的至少两个核苷酸。单链的描述还定义互补链的序列。因此,多核苷酸也涵盖所描绘的单链的互补链。多核苷酸的许多变体可以用于与给定多核苷酸相同的目的。因此,多核苷酸也涵盖基本上相同的多核苷酸及其互补物。单链提供可以在严格杂交条件下与给定序列杂交的探针。因此,多核苷酸也涵盖在严格杂交条件下杂交的探针。多核苷酸可以是单链或双链的,或者可以包含双链和单链序列的部分。多核苷酸可以是DNA(基因组DNA和 cDNA两者)、RNA或杂交体,其中多核苷酸可以包含脱氧核糖核苷酸和核糖核苷酸的组合,以及包括尿嘧啶、腺嘌呤、胸腺嘧啶、胞嘧啶、鸟嘌呤、肌苷、黄嘌呤、次黄嘌呤、异胞嘧啶和异鸟嘌呤的碱基的组合。多核苷酸可以通过化学合成方法或通过重组方法获得。
单链DNA杂交互补片段的特异性由反应条件的“严格性”决定 (Sambrook等人,Molecular Cloning and Laboratory Manual,Second Ed., Cold Spring Harbor(1989))。在“严格条件”下杂交描述了杂交方案,其中彼此至少60%同源的多核苷酸保持杂交。一般来说,选择严格条件比规定的离子强度和pH值下的特异性序列的热熔点(Tm)低约5℃。Tm 是与给定序列互补的50%探针与给定序列在平衡下杂交的温度(在确定的离子强度、pH和多核苷酸浓度下)。由于给定序列通常过量存在,因此在Tm下,50%的探针处于平衡状态。
严格条件通常包括:(1)低离子强度和高温洗涤,例如15mM氯化钠、1.5mM柠檬酸钠、0.1%十二烷基硫酸钠,在50℃下;(2)杂交过程中的变性剂,例如,50%(v/v)甲酰胺,0.1%牛血清白蛋白,0.1% Ficoll,0.1%聚乙烯吡咯烷酮,50mM磷酸钠缓冲液(750mM氯化钠, 75mM柠檬酸钠,pH 6.5),在42℃下;或(3)50%甲酰胺。洗涤通常还包含42℃下的5xSSC(0.75M NaCl、75mM柠檬酸钠)、50mM 磷酸钠(pH 6.8)、0.1%焦磷酸钠、5x邓波特溶液(Denhardt's solution)、超声处理的鲑鱼精子DNA(50μg/mL)、0.1%SDS以及10%硫酸葡聚糖,以及42℃下的0.2xSSC(氯化钠/柠檬酸钠)中以及55℃下的50%甲酰胺中,随后由55℃下的含有EDTA的0.1xSSC组成的高严格度洗涤。适当地,条件使得彼此至少约65%、70%、75%、85%、 90%、95%、98%或99%同源的序列通常保持彼此杂交。
“中等严格条件”使用洗涤溶液和较不严格的杂交条件,使得多核苷酸将与多核苷酸的整体,片段、衍生物或类似物杂交。一个实例包含在 55℃下在6xSSC、5x邓波特溶液、0.5%SDS以及100μg/mL变性鲑鱼精子DNA中杂交,随后在37℃下在1xSSC、0.1%SDS中一次或多次洗涤。可以调整温度、离子强度等来适应实验因素,例如探针长度。其他中等严格条件已经进行了描述(参见Ausubel等人,Current Protocols in Molecular Biology,第1-3卷,John Wiley&Sons,Inc.,Hoboken,N.J. (1993);Kriegler,Gene Transfer andExpression:A Laboratory Manual, Stockton Press,New York,N.Y.(1990);Perbal,APractical Guide to Molecular Cloning,第2版,John Wiley&Sons,New York,N.Y.(1988))。
“低严格条件”使用洗涤溶液和不如中等严格性的较不严格的杂交条件,使得多核苷酸将与多核苷酸的整体,片段、衍生物或类似物杂交。低严格性杂交条件的非限制性实例包括在35%甲酰胺、5xSSC、50mM Tris HCl(pH 7.5)、5mM EDTA、0.02%PVP、0.02%Ficoll、0.2% BSA、100μg/mL变性鲑鱼精子DNA、10%(重量/体积)硫酸葡聚糖在 40℃下杂交,然后在2xSSC、25mM Tris HCl(pH 7.4)、5mM EDTA 和0.1%SDS中在50℃下洗涤一次或多次。低严格性的其他条件(诸如跨物种杂交的条件)已进行了充分描述(参见Ausubel等人,1993;Kriegler,1990)。
“可操作地连接”是指基因的表达处于与其空间连接的启动子的控制之下。启动子在其控制下可以位于基因的5'(上游)或3'(下游)。启动子和基因之间的距离可以与启动子和产生启动子的基因中其控制的基因之间的距离大致相同。如所属领域中已知,可以调节这一距离的变化而不损失启动子功能。“可操作地连接”是指多核苷酸片段在单个片段中的缔合,从而一个片段的功能由另一个片段调节。例如,当启动子能够调节多核苷酸片段的转录时,其可操作地与该多核苷酸片段连接。
术语“植物”指处于其生命周期或发育的任何阶段的任何植物及其后代。在一个实施方案中,植物是烟草植物,它指的是属于烟草属的植物。该术语包括提及的完整植物、植物器官、植物组织、植物繁殖体、植物种子、植物细胞及其后代。植物细胞包括(但不限于)来自种子、悬浮培养物、胚芽、分生组织区域、愈伤组织、叶子、根、嫩枝、配子体、孢子体、花粉以及花粉粒的细胞。本文描述了烟草植物的合适的种类、栽培种、杂种和品种。
“植物材料”包括叶、根、萼片、根尖、花瓣、花、芽、茎、种子和梗。植物材料可以是活的或不可存活的植物材料。
“多核苷酸”、“多核苷酸序列”或“多核苷酸片段”在本文中可互换使用,并且是指单链或双链的RNA或DNA的聚合物,任选地包含合成的、非天然的或改变的核苷酸碱基。本公开的多核苷酸在所附序列表中列出。
“多肽”或“多肽序列”是指其中一种或多种氨基酸残基是对应的天然存在的氨基酸的人工化学类似物的氨基酸的聚合物,以及天然存在的氨基酸的聚合物。该术语还包括修饰,包括但不限于糖基化、脂质附着、硫酸化、谷氨酸残基的γ-羧化、羟基化和ADP-核糖基化。本公开的多肽在所附序列表中列出。
“启动子”是指能够赋予、激活或增强细胞中多核苷酸的表达的合成或天然来源的分子。该术语是指通常位于双链多核苷酸片段的上游并与其可操作地连接的多核苷酸元件/序列。启动子可以完全源自邻近感兴趣的天然基因的区域,或者可以由来源于不同天然启动子或合成多核苷酸片段的不同元件组成。启动子可以包含一个或多个特异性转录调节序列以进一步增强表达或改变空间表达或改变时间表达。启动子还可以包含末端强化子或抑制子元件,其可位于来自转录起始位点的多达几千个碱基对。启动子可以来源于包括病毒、细菌、真菌、植物、昆虫以及动物的源。启动子可以关于发生表达的细胞、组织或器官或关于发生表达的发育阶段,或回应于外部刺激(例如生理学压力、病原体、金属离子或诱发剂)组成性或有差异地调节基因组分的表达。
如本文可互换使用的“组织特异性启动子”和“组织优选启动子”指的是主要但并非必须专门在一种组织或器官中表达,而是还可以在一种特异性细胞中表达的启动子。“发育调节型启动子”是指其功能由发育事件决定的启动子。“组成型启动子”是指引起基因在大多数时间在大多数细胞类型中表达的启动子。响应于内源或外源刺激的存在,例如通过化合物(化学诱导剂)或响应于环境、激素、化学或发育信号或其两种或更多种的组合,“诱导型启动子”选择性表达可操作连接的DNA序列。诱导型或调节型启动子的实例包括由光、热、压力、洪水或干旱、病原体、植物激素、创伤或化学药品诸如乙醇、茉莉酮酸酯、水杨酸或安全剂调节的启动子。
“重组”是指两个另外分离的序列片段的人工组合,诸如通过化学合成或通过基因工程技术操作分离的多核苷酸片段。该术语还包括提及的已通过引入异源多核苷酸而被修饰的细胞或载体或来源于如此修饰的细胞的细胞,但不涵盖由于天然发生的事件(例如,自发突变、天然转化或转导或转座)诸如在没有人为干预的情况下发生的事件对细胞或载体的改变。
“重组构建体”是指自然界中通常不被一起发现的多核苷酸的组合。因此,重组构建体可包含来源于不同来源的调节序列和编码序列,或来源于相同来源但以不同于自然界通常发现的方式排列的调节序列和编码序列。重组构建体可以是重组DNA构建体。
本文可互换使用的“调节序列”和“调节元件”是指位于编码序列上游 (5'非编码序列)、内部或下游(3'非编码序列)并且影响相关编码序列的转录、RNA加工或稳定性或翻译的多核苷酸序列。调节序列包括启动子、翻译前导序列、内含子和聚腺苷酸化识别序列。术语“调节序列”和“调节元件”在本文中可以互换使用。
术语“烟草”在总体意义上用于指烟草作物(例如,在田间生长的多种烟草植物而不是水培生长的烟草)、烟草植物及其部分,包括但不限于如本文所述制备或获得的根、茎、叶、花和种子。应当理解,“烟草”包括普通烟草植物及其产品。
术语“烟草产品”是指消费者烟草产品,包括但不限于吸烟材料(例如,香烟、雪茄和烟斗烟草)、鼻烟、嚼用烟草、口香糖和锭剂,以及用于制造消费者烟草产品的组分、材料和成分。适宜地,这些烟草产品由从烟草收获的烟草的叶和茎制造,并且根据烟草制备中的常规技术对其进行切割、干燥、干制或发酵。
“转录终止子”、“终止序列”或“终止子”是指位于编码序列下游的 DNA序列,包括聚腺苷酸化识别序列和编码能够影响mRNA加工或基因表达的调节信号的其他序列。聚腺苷酸化信号通常特征为影响聚腺苷酸段向mRNA前驱体的3'端的添加。
“转基因”是指任何细胞、细胞系、愈伤组织、植物部分或植物,其基因组由于异源多核苷酸诸如重组构建体的存在而被改变,包括那些初始转基因事件以及通过有性杂交或无性繁殖从初始转基因事件产生的那些。该术语不包括通过常规植物育种方法或通过天然发生的事件(诸如随机交叉受精、非重组病毒感染、非重组细菌转化、非重组转座或自发突变)的基因组(染色体或染色体外)的改变。
“转基因植物”是指在其基因组内包含一种或多种异源多核苷酸的植物,即,含有通常在其中未发现的重组遗传物质并且已通过人工操作引入所述植物中(或引入植物的祖细胞中)的植物。例如,异源多核苷酸可以稳定地整合到基因组内,使得多核苷酸传递到连续的世代。异源多核苷酸可以单独或作为重组构建体的一部分整合到基因组中。基因改良胚质的商业开发还发展到向作物植物中引入多种特性的阶段,通常称为基因堆叠法。在这一方法中,可以向植物中引入赋予所关注的不同特征的多个基因。基因堆叠可以通过许多方式实现,包括(但不限于)共转型、重新转型以及用不同转基因品系交叉。因此,从通过转型引入重组 DNA的植物细胞生长的植物是转基因植物,全部是含有所以引入转基因的植物的子代(有性产生或无性产生)。应当理解,术语转基因植物包括整个植物或树木以及该植物或树木的部分,例如谷粒、种子、花、叶、根、果实、花粉、茎等。各异源多核苷酸可以赋予转基因植物不同性状。
“转基因”是指包含已从一种生物中分离并引入到不同生物中的基因序列的基因或遗传物质。这种DNA的非天然片段可以保留在转基因生物中产生RNA或多肽的能力,或者它可以改变转基因生物遗传密码的正常功能。
关于多核苷酸的“变体”是指:(i)多核苷酸的一部分或片段;(ii) 多核苷酸或其部分的互补物;(iii)与目的多核苷酸或其互补物基本上相同的多核苷酸;或(iv)在严格条件下与目的多核苷酸、其互补物或与其基本上相同的多核苷酸杂交的多核苷酸。
关于肽或多肽的“变体”是指通过氨基酸的插入、缺失或保守取代而在序列上不同但保留至少一种生物学功能或活性的肽或多肽。变体也可以指保留至少一种生物学功能或活性的多肽。氨基酸的保守取代,即,用性质(例如,亲水性、带电区域的程度和分布)相似的不同氨基酸取代氨基酸,在本领域中被认为通常涉及微小变化。
术语“品种”指共享恒定特征的植物群体,所述恒定特征使其与相同物种的其他植物分开。尽管具有一种或多种独特性状,但品种的特征进一步在于所述品种内个体之间的极小整体变化。品种通常在市场上有出售。
“载体”指包含用于使得能够转运多核苷酸的多核苷酸组分、多核苷酸构建体和多核苷酸缀合物等的组合的多核苷酸媒介物。载体可以是病毒载体、细菌噬菌体、细菌人工染色体或酵母人工染色体。载体可以是 DNA或RNA载体。合适的载体包括能够进行染色体外复制的附加体,例如环状双链核苷酸质粒;线性化的双链核苷酸质粒;以及任何来源的其他媒介。“表达载体”是包含用于使得能够表达多核苷酸的多核苷酸组分、多核苷酸构建体和多核苷酸缀合物等的组合的多核苷酸媒介物。合适的表达载体包括能够进行染色体外复制的附加体,例如环状双链核苷酸质粒;线性化的双链核苷酸质粒;以及任何来源的其他功能等效的表达载体。表达载体包含位于多核苷酸、多核苷酸构建体或多核苷酸缀合物的上游并与其可操作地连接的至少一个启动子,如下文所定义。
除非本文另外定义,否则结合本发明使用的科学与技术术语将具有所属领域普通技术人员通常所理解的含义。例如,本文所述的与细胞和组织培养、分子生物学、免疫学、微生物学、遗传学以及多肽和多核苷酸化学和杂交有关使用的任何命名和技术是本领域熟知和常用的那些。术语的含义和范围应该明确;然而在具有任何潜在不明确性的事件中,本文提供的定义优先于任何词典或外来定义。另外,除非上下文另外需要,否则单数术语应包括复数并且复数术语应包括单数。
2.多核苷酸
公开了一种经分离的多核苷酸,其包含与本文所述的任何序列具有至少60%序列同一性的序列,由其组成或基本上由其组成,所述序列包括序列表中所示的任何多核苷酸。适当地,经分离的多核苷酸包含与其具有至少60%、61%、62%、63%、64%、65%、66%、67%、68%、 69%、70%、75%、80%、85%、87%、88%、89%、90%、91%、92%、 93%、94%、95%、96%、97%、98%、99%或100%的序列同一性的序列,由其组成或基本上由其组成。
适当地,本文所述的多核苷酸编码具有序列表中所示多肽的至少约 50%、60%、70%、80%、90%、95%、96%、97%、98%、99%、100%或更多的功能或活性的活性多肽。
在另一个实施方案中,提供一种分离的NtINV多核苷酸,其包含与 SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9具有至少60%序列同一性的多核苷酸,由其组成或基本上由其组成。
在另一个实施方案中,提供一种分离的NtSUS多核苷酸,其包含与 SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22或SEQ ID NO:24;SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30或SEQ ID NO:32具有至少60%序列同一性的多核苷酸,由其组成或基本上由其组成。
适当地,经分离的多核苷酸包含与SEQ ID NO:1、SEQ ID NO:3、 SEQ ID NO:5、SEQID NO:7或SEQ ID NO:9具有至少约60%、61%、 62%、63%、64%、65%、66%、67%、68%、69%、70%、75%、80%、 85%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、 99.7%、99.8%、99.9%或100%序列同一性的序列,由其组成或基本上由其组成。
适当地,经分离的多核苷酸包含与SEQ ID NO:10、SEQ ID NO:12、 SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22或SEQ ID NO:24;SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30或SEQ ID NO:32具有至少约60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、75%、80%、85%、87%、88%、 89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、 99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%序列同一性的序列,由其组成或基本上由其组成。
适当地,经分离的多核苷酸包含与SEQ ID NO:1、SEQ ID NO:3、 SEQ ID NO:5、SEQID NO:7或SEQ ID NO:9具有至少约80%、81%、 82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%序列同一性的序列,由其组成或基本上由其组成。
适当地,经分离的多核苷酸包含与SEQ ID NO:10、SEQ ID NO:12、 SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22或SEQ ID NO:24;SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30或SEQ ID NO:32具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、 96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、 99.6%、99.7%、99.8%、99.9%或100%序列同一性的序列,由其组成或基本上由其组成。
适当地,经分离的多核苷酸包含与SEQ ID NO:1、SEQ ID NO:3、 SEQ ID NO:5、SEQID NO:7或SEQ ID NO:9具有至少约95%、96%、 97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、 99.7%、99.8%、99.9%或100%序列同一性的序列,由其组成或基本上由其组成。
适当地,经分离的多核苷酸包含与SEQ ID NO:10、SEQ ID NO:12、 SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22或SEQ ID NO:24;SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30或SEQ ID NO:32具有至少约95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%序列同一性的序列,由其组成或基本上由其组成。
在另一个实施方案中,提供了多核苷酸,所述多核苷酸包含与SEQ ID NO:1、SEQID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO: 9具有实质同源性(即,序列相似性)或实质同一性的多核苷酸,由其组成或基本上由其组成。
在另一个实施方案中,提供了多核苷酸,所述多核苷酸包含与SEQ ID NO:10、SEQID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22或SEQ ID NO:24;SEQ ID NO: 26、SEQ ID NO:28、SEQ ID NO:30或SEQ ID NO:32具有实质同源性 (即,序列相似性)或实质同一性的多核苷酸,由其组成或基本上由其组成。
在另一个实施方案中,提供与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ IDNO:7或SEQ ID NO:9具有实质同源性(即,序列相似性)或实质同一性的片段,所述片段与SEQ ID NO:1、SEQ ID NO:3、 SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9的对应片段具有至少约 60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、 75%、80%、85%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、 99.6%、99.7%、99.8%、99.9%或100%序列同一性。
在另一个实施方案中,提供与SEQ ID NO:10、SEQ ID NO:12、 SEQ ID NO:14、SEQID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22或SEQ ID NO:24;SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30或SEQ ID NO:32具有实质同源性(即,序列相似性)或实质同一性的片段,所述片段与SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO: 14、SEQ ID NO:16、SEQID NO:18、SEQ ID NO:20、SEQ ID NO:22 或SEQ ID NO:24;SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30或 SEQ ID NO:32的对应片段具有至少约60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、75%、80%、85%、87%、88%、 89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、 99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%序列同一性。
在另一个实施方案中,提供编码起INV作用的多肽的多核苷酸,所述多核苷酸包含与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9足够或相当程度的同一性或相似性。
在另一个实施方案中,提供编码起SUS作用的多肽的多核苷酸,所述多核苷酸包含与SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、 SEQ ID NO:16、SEQ ID NO:18、SEQ IDNO:20、SEQ ID NO:22或 SEQ ID NO:24;SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30或SEQ ID NO:32足够或相当程度的同一性或相似性。
在另一个实施方案中,提供了一种多核苷酸的聚合物,所述聚合物包含在本文中命名为SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、 SEQ ID NO:7或SEQ ID NO:9的多核苷酸,由其组成或基本上由其组成。
在另一个实施方案中,提供了一种多核苷酸的聚合物,所述聚合物包含在本文中命名为SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、 SEQ ID NO:16、SEQ ID NO:18、SEQID NO:20、SEQ ID NO:22或 SEQ ID NO:24;SEQ ID NO:26、SEQ ID NO:28、SEQ ID NO:30或SEQ ID NO:32的多核苷酸,由其组成或基本上由其组成。
适当地,本文所述的多核苷酸编码分别具有INV活性或SUS活性的INV家族或SUS家族的成员。
多核苷酸可包括核苷酸的聚合物,其可以是未经修饰的或经修饰的脱氧核糖核酸(DNA)或核糖核酸(RNA)。因此,多核苷酸可以是 (但不限于)基因组DNA、互补DNA(cDNA)、mRNA或反义RNA 或其片段。此外,多核苷酸可以是单链或双链DNA、单链和双链区混合的DNA、包括DNA和RNA的杂交分子或具有单链和双链区的混合物的杂交分子或其片段。另外,多核苷酸可以由包括DNA、RNA或两者的三链区或者其片段构成。多核苷酸可以含有一个或多个经修饰的碱基,如硫代磷酸酯,并且可以是肽核酸。一般来说,多核苷酸可以由分离的或克隆的cDNA片段、基因组DNA、寡核苷酸或个别核苷酸或前述的组合组装。尽管本文描述的多核苷酸显示为DNA序列,但是它们包括其相应的RNA序列以及它们的互补(例如,完全互补)的DNA或 RNA序列,包括其反向互补物。
多核苷酸的片段的范围可以是至少约25个核苷酸、约50个核苷酸、约75个核苷酸、约100个核苷酸、约150个核苷酸、约200个核苷酸、约250个核苷酸、约300个核苷酸、约400个核苷酸、约500个核苷酸、约600个核苷酸、约700个核苷酸、约800个核苷酸、约900个核苷酸、约1000个核苷酸、约1100个核苷酸、约1200个核苷酸、约1300个核苷酸或约1400个核苷酸,并且至多编码本文所述多肽的全长多核苷酸。
多核苷酸通常将含有磷酸二酯键,尽管在一些情况下,包括可能具有替代主链的多核苷酸类似物,包括例如氨基磷酸酯、硫代磷酸酯、二硫代磷酸酯或O-甲基亚磷酰胺键;以及肽多核苷酸主链和键。其他类似多核苷酸包含具有阳性主链;非离子主链和非核糖主链的多核苷酸。核糖-磷酸主链的修饰可以出于多种原因而完成,例如增加此类分子在生理环境中的稳定性和半衰期,或作为生物芯片上的探针。可以制备天然存在的多核苷酸和类似物的混合物;或者,可以制备不同多核苷酸类似物的混合物,以及天然存在的多核苷酸和类似物的混合物。
多种多核苷酸类似物是已知的,包括例如氨基磷酸酯、硫代磷酸酯、二硫代磷酸酯、O-甲基亚磷酰胺键以及肽多核苷酸主链和键。其他类似多核苷酸包含具有阳性主链、非离子主链和非核糖主链的多核苷酸。还包含含有一种或多种碳环糖的多核苷酸。
其他类似物包含作为肽多核苷酸类似物的肽多核苷酸。
在所公开的多核苷酸及其片段的用途中,有片段在杂交测定中作为探针的用途或在扩增测定中作为引物的用途。这类片段一般包括DNA 序列的至少约10、11、12、13、14、15、16、17、18、19或20个或更多个邻接核苷酸。在其他实施方案中,DNA片段包括DNA序列的至少约10、15、20、30、40、50或60个或更多个邻接核苷酸。因此,在一个方面,还提供了一种用于检测多核苷酸的方法,该方法包括使用探针或引物或两者。
影响杂交条件选择的基本参数和设计合适条件的指导由Sambrook, J.,E.F.Fritsch和T.Maniatis(1989,Molecular Cloning:A Laboratory Manual,ColdSpring Harbor Laboratory Press,Cold Spring Harbor,N.Y.)描述。使用遗传密码的知识与本文所述的多肽序列结合,可以制备简并寡核苷酸组。这类寡核苷酸可用作例如聚合酶链反应(PCR)中的引物,由此分离且扩增DNA片段。
至少一种修饰(例如,突变)可以包括在一种或多种NtINV3-S、 NtINV3-T、NtINV4-S和NtINV4-T中。
至少一种修饰(例如,突变)可以包括在一种或多种NtINV4-S和 NtINV4-T中。
至少一种修饰(例如,突变)可以包括在一种或多种NtINV3-S、 NtINV3-T、NtINV4-S和NtINV4-T中。任选地,至少一种或多种另外的修饰(例如,突变)可以包括在一种或多种NtSUS1-S、NtSUS1-T、 NtSUS2-S、NtSUS2-T、NtSUS3-S、NtSUS3-T、NtSUS4-S、NtSUS4-T、NtSUS5-S、NtSUS5-T、NtSUS6-S和NtSUS6-T中,适当地包括在一种或多种NtSUS2-S、NtSUS2-T、NtSUS3-S、NtSUS3-T、NtSUS4-S和NtSUS4- T中。
至少一种修饰(例如,突变)可以包括在一种或多种NtINV3-S、 NtINV3-T、NtINV4-S和NtINV4-T中,并且至少一种修饰(例如,突变) 可以包括在一种或多种NtSUS2-S、NtSUS2-T、NtSUS3-S、NtSUS3-T、 NtSUS4-S和NtSUS4-T中,然而没有修饰(例如,突变)包括在一种或多种NtSUS1-S、NtSUS1-T、NtSUS5-S、NtSUS5-T、NtSUS6-S和NtSUS6- T中。
至少一种修饰(例如,突变)可以包括在一种或多种NtINV3-S、 NtINV3-T、NtINV4-S和NtINV4-T中,并且至少一种修饰(例如,突变) 可以包括在一种或多种NtSUS2-S、NtSUS3-S、NtSUS3-T和NtSUS4-S中,然而没有修饰(例如,突变)包括在一种或多种NtSUS1-S、NtSUS1-T、 NtSUS2-T、NtSUS4-T、NtSUS5-S、NtSUS5-T、NtSUS6-S和NtSUS6-T中。
至少一种修饰(例如,突变)可以包括在一种或多种NtINV4-S和 NtINV4-T中,并且至少一种修饰(例如,突变)可以包括在一种或多种 NtSUS2-S、NtSUS2-T、NtSUS3-S、NtSUS3-T、NtSUS4-S和NtSUS4-T中,然而没有修饰(例如,突变)包括在一种或多种NtSUS1-S、NtSUS1-T、NtSUS5-S、NtSUS5-T、NtSUS6-S和NtSUS6-T中。
至少一种修饰(例如,突变)可以包括在一种或多种NtINV4-S和 NtINV4-T中,并且至少一种修饰(例如,突变)可以包括在一种或多种 NtSUS2-S、NtSUS3-S、NtSUS3-T和NtSUS4-S中,然而没有修饰(例如,突变)包括在一种或多种NtSUS1-S、NtSUS1-T、NtSUS2-T、NtSUS4-T、 NtSUS5-S、NtSUS5-T、NtSUS6-S和NtSUS6-T中。
3.多肽
还提供了一种经分离的多肽,所述多肽包含与本文所述的任何多肽具有至少60%序列同一性的多肽,由其组成或基本上由其组成,所述多肽包括序列表中所示的任何多肽。适当地,经分离的多肽包含与其具有至少60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、 70%、75%、80%、85%、87%、88%、89%、90%、91%、92%、93%、 94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、 99.5%、99.6%、99.7%、99.8%、99.9%或100%序列同一性的序列,由其组成或基本上由其组成。
还提供了一种NtINV多肽,所述NtINV多肽包含与SEQ ID NO:2、 SEQ ID NO:4、SEQID NO:6或SEQ ID NO:8具有至少69%、70%、 71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、 82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、 99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%序列同一性的序列,由其组成或基本上由其组成。
还提供了一种多肽,所述多肽包含与SEQ ID NO:2、SEQ ID NO:4、 SEQ ID NO:6或SEQ ID NO:8具有至少80%、81%、81%、82%、83%、 84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、 95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、 99.6%、99.7%、99.8%、99.9%或100%序列同一性的序列,由其组成或基本上由其组成。
还提供了一种多肽,所述多肽包含与SEQ ID NO:2、SEQ ID NO:4、 SEQ ID NO:6或SEQ ID NO:8具有至少95%、96%、97%、98%、99%、 99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或100%序列同一性的序列,由其组成或基本上由其组成。
还提供了由SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6或SEQ ID NO:8编码的多肽。
多肽可包含与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6或SEQ ID NO:8具有足够或相当程度的同一性或相似性以用作INV的序列。
还提供了一种NtSUS多肽,所述NtSUS多肽包含与SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29或SEQ ID NO:31;或SEQ ID NO:33具有至少69%、70%、71%、 72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、 83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、 94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、 99.5%、99.6%、99.7%、99.8%、99.9%或100%序列同一性的序列,由其组成或基本上由其组成。
还提供了一种多肽,所述多肽包含与SEQ ID NO:11、SEQ ID NO: 13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、 SEQ ID NO:23、SEQ ID NO:25、SEQ IDNO:27、SEQ ID NO:29或SEQ ID NO:31;或SEQ ID NO:33具有至少80%、81%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、 94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、 99.5%、99.6%、99.7%、99.8%、99.9%或100%序列同一性的序列,由其组成或基本上由其组成。
还提供了一种多肽,所述多肽包含与SEQ ID NO:11、SEQ ID NO: 13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、 SEQ ID NO:23、SEQ ID NO:25、SEQ IDNO:27、SEQ ID NO:29或 SEQ ID NO:31;或SEQ ID NO:33具有至少95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、 99.9%或100%序列同一性的序列,由其组成或基本上由其组成。
还提供了由SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ IDNO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29或SEQID NO:31;或SEQ ID NO:33编码的多肽。
多肽可包含与SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、 SEQ ID NO:17、SEQID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ ID NO:29或SEQ ID NO:31;或SEQ ID NO:33具有足够或相当程度的同一性或相似性以用作SUS的序列。
多肽的片段通常保留全长序列的一些或全部功能或活性,诸如INV 或SUS活性。多肽的片段的范围可以是至少约25个氨基酸、约50个氨基酸、约75个氨基酸、约100个氨基酸、约150个氨基酸、约200个氨基酸、约250个氨基酸、约300个氨基酸、约400个氨基酸、约500个氨基酸,并且至多本文所述的全长多肽。
多肽还包括通过引入任何类型的改变(例如,氨基酸的插入、缺失或取代;糖基化状态的改变;影响重折叠或异构化的改变、三维结构或自缔合状态)而产生的突变体,其可以被有意地工程化或天然地分离,条件是它们仍然具有其功能或活性中的一些或全部。合适地,该功能或活性被调节。
缺失是指从多肽中去除一种或多种氨基酸。插入指被引入多肽中的预定位点内的一个或多个氨基酸残基。插入可包含单个或多个氨基酸的序列内插入。取代指多肽的氨基酸由具有相似特性(诸如相似疏水性、亲水性、抗原性、形成或破坏a-螺旋结构或β-片层结构的倾向)的其他氨基酸取代。氨基酸取代通常为单个残基,但可以是成簇的,取决于对多肽施加的功能制约,并且范围可为约1至约10个氨基酸。氨基酸取代优选是如下所述的保守氨基酸取代。氨基酸取代、缺失或插入可使用肽合成技术例如固相肽合成或通过重组DNA操纵进行制备。用于操作 DNA序列以产生多肽的取代、插入或缺失变体的方法是本领域所熟知的。该变体可具有产生沉默变化并产生功能上等同的多肽的改变。可基于残基的极性、电荷、溶解性、疏水性、亲水性和两亲特性的相似性做出有意的氨基酸取代,只要该物质的次级结合得以保持即可。举例来说,带负电的氨基酸包含天冬氨酸和谷氨酸;带正电的氨基酸包含赖氨酸和精氨酸;并且具有相似亲水性值含不带电极性首基的氨基酸包含亮氨酸、异亮氨酸、缬氨酸、甘氨酸、丙氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、苯丙氨酸和酪氨酸。保守取代可以例如根据下表进行。第二列中的相同块和优选第三列中的相同行中的氨基酸可以彼此取代:
Figure BDA0003575216060000231
多肽可以是成熟多肽或不成熟多肽或来源于不成熟多肽的多肽。多肽可以采取线性形式或使用已知方法环化。多肽通常包含至少10、至少 20、至少30或至少40个邻接氨基酸。
至少一种修饰(例如,突变)可以包括在一种或多种NtINV3-S、 NtINV3-T、NtINV4-S和NtINV4-T中。
至少一种修饰(例如,突变)可以包括在一种或多种NtINV4-S和 NtINV4-T中。
至少一种修饰(例如,突变)可以包括在一种或多种NtINV3-S、 NtINV3-T、NtINV4-S和NtINV4-T中。任选地,至少一种或多种另外的修饰(例如,突变)可以包括在一种或多种NtSUS1-S、NtSUS1-T、 NtSUS2-S、NtSUS2-T、NtSUS3-S、NtSUS3-T、NtSUS4-S、NtSUS4-T、NtSUS5-S、NtSUS5-T、NtSUS6-S和NtSUS6-T中,适当地包括在一种或多种NtSUS2-S、NtSUS2-T、NtSUS3-S、NtSUS3-T、NtSUS4-S和 NtSUS4-T中。
至少一种修饰(例如,突变)可以包括在一种或多种NtINV3-S、 NtINV3-T、NtINV4-S和NtINV4-T中,并且至少一种修饰(例如,突变) 可以包括在一种或多种NtSUS2-S、NtSUS2-T、NtSUS3-S、NtSUS3-T、 NtSUS4-S和NtSUS4-T中,然而没有修饰(例如,突变)包括在一种或多种NtSUS1-S、NtSUS1-T、NtSUS5-S、NtSUS5-T、NtSUS6-S和 NtSUS6-T中。
至少一种修饰(例如,突变)可以包括在一种或多种NtINV3-S、NtINV3-T、NtINV4-S和NtINV4-T中,并且至少一种修饰(例如,突变) 可以包括在一种或多种NtSUS2-S、NtSUS3-S、NtSUS3-T和NtSUS4-S 中,然而没有修饰(例如,突变)包括在一种或多种NtSUS1-S、NtSUS1-T、NtSUS2-T、NtSUS4-T、NtSUS5-S、NtSUS5-T、NtSUS6-S 和NtSUS6-T中。
至少一种修饰(例如,突变)可以包括在一种或多种NtINV4-S和 NtINV4-T中,并且至少一种修饰(例如,突变)可以包括在一种或多种NtSUS2-S、NtSUS2-T、NtSUS3-S、NtSUS3-T、NtSUS4-S和 NtSUS4-T中,然而没有修饰(例如,突变)包括在一种或多种NtSUS1- S、NtSUS1-T、NtSUS5-S、NtSUS5-T、NtSUS6-S和NtSUS6-T中。
至少一种修饰(例如,突变)可以包括在一种或多种NtINV4-S和 NtINV4-T中,并且至少一种修饰(例如,突变)可以包括在一种或多种NtSUS2-S、NtSUS3-S、NtSUS3-T和NtSUS4-S中,然而没有修饰 (例如,突变)包括在一种或多种NtSUS1-S、NtSUS1-T、NtSUS2-T、 NtSUS4-T、NtSUS5-S、NtSUS5-T、NtSUS6-S和NtSUS6-T中。
4.修饰植物
a.转化
重组构建体可用于转化植物或植物细胞,以调节多肽表达、功能或活性。重组多核苷酸构建体可以包括编码如本文所述的一种或多种多核苷酸的多核苷酸,所述一种或多种多核苷酸可操作地连接于适合表达多肽的调节区。因此,多核苷酸可以包括编码如本文所述的多肽的编码序列。调节了多肽表达、功能或活性的植物或植物细胞可以包括突变的、非天然存在的、转基因的、人造的或基因工程的植物或植物细胞。适当地,转基因植物或植物细胞包括已通过重组DNA的稳定整合而改变的基因组。重组DNA包含已在细胞外部经基因工程改造和构建的DNA,并且包含含有天然存在的DNA或cDNA或合成DNA的DNA。转基因植物可包括由最初转化的植物细胞再生的植物,以及来自经转化的植物的以后世代或杂交的后代转基因植物。合适地,与对照植物相比,转基因修饰改变了本文所述的多核苷酸或多肽的表达、功能或活性。
由重组多核苷酸编码的多肽可以是天然多肽,或对于细胞可以是异源的。在一些情况下,重组构建体含有可操作地连接于调节区的调节表达的多核苷酸。在本文中描述了合适调节区的实例。
还提供含有重组多核苷酸构建体的载体,如本文中所描述的那些。合适的载体主链包含例如本领域常规使用的载体主链,如质粒、病毒、人工染色体、细菌人工染色体、酵母人工染色体或噬菌体人工染色体。合适的表达载体包含但不限于源自例如噬菌体、杆状病毒和逆转录病毒的质粒和病毒载体。众多载体和表达系统是商购可得的。
载体可以包含例如复制起点、支架附着区域或标记。标记基因可以赋予植物细胞可选择表型。举例来说,标记可以赋予杀生物剂抗性,如对抗生素(例如卡那霉素(kanamycin)、G418、博来霉素(bleomycin) 或潮霉素(hygromycin))或除草剂(例如草甘膦(glyphosate)、氯磺隆(chlorsulfuron)或草胺膦(phosphinothricin))的抗性。另外,表达载体可以包含设计为促进所表达多肽的操纵或检测(例如纯化或定位) 的标签序列。标签序列,诸如荧光素酶、β-葡糖醛酸酶、绿色荧光多肽、谷胱甘肽S-转移酶、聚组氨酸、c-myc或血凝素序列通常表达为与所编码的多肽的融合体。这类标签可以插入多肽内的任何地方,包括在羧基或氨基末端处。
植物或植物细胞可以通过使重组多核苷酸整合到其基因组来进行转化,以变得稳定转化。本文中所描述的植物或植物细胞可以是稳定转化的。稳定转化的细胞在每次细胞分裂中通常保留引入的多核苷酸。植物或植物细胞可以进行瞬时转化,使得重组多核苷酸不整合到其基因组内。瞬时转化的细胞在每次细胞分裂中通常失去引入的重组多核苷酸的全部或一部分,使得在足够数目的细胞分裂后,引入的重组多核苷酸无法在子细胞中检测到。
本领域中的许多方法可用于转化植物细胞,包括生物射弹、基因枪技术、农杆菌介导的转化、病毒载体介导的转化、冻融法、微粒轰击、直接DNA摄取、超声处理、显微注射、植物病毒介导的转移和电穿孔。
如果细胞或培养的组织用作转化的受体组织,那么需要时,通过本领域技术人员已知的技术,可以由经转化的培养物再生植物。
有待包含在重组构建体中的调节区的选择取决于几个因素,包含但不限于效率、可选择性、可诱导性、所需表达水平和细胞或组织优先表达。通过适当选择调节区且相对于编码序列放置调节区,调节编码序列的表达对于本领域技术人员是常规工作。多核苷酸的转录可以相似方式进行调节。一些合适的调节区仅或占优势地在某些细胞类型中起始转录。用于鉴定且表征植物基因组DNA中的调节区的方法是本领域已知的。
示例性启动子包括由组织特异性因子识别的组织特异性启动子,所述组织特异性启动子存在于不同组织或细胞类型中(例如根特异性启动子、枝条特异性启动子、木质部特异性启动子),或存在于不同发育阶段期间,或响应不同环境条件存在。合适的启动子包括组成型启动子,其可在大多数细胞类型中活化,而无需特异性诱导剂。用于控制多肽表达的启动子的实例包含花椰菜花叶病毒35S(CaMV/35S)、SSU、OCS、 lib4、usp、STLS1、B33、nos或泛素启动子或菜豆蛋白启动子。本领域技术人员能够产生重组启动子的多种变体。
组织特异性启动子是仅在植物发育期间的特定时间,在特定细胞或组织中(如在营养组织或生殖组织中)活跃的转录控制元件。在发育控制下的组织特异性启动子的实例包括可仅(或主要仅)在某些组织中起始转录的启动子,所述组织诸如营养组织(例如根或叶)或生殖组织 (诸如果实、胚珠、种子、花粉、雌蕊、花或任何胚胎组织)。生殖组织特异性启动子可以是例如花药特异性、胚珠特异性、胚特异性、胚乳特异性、珠被特异性、种子和种皮特异性、花粉特异性、花瓣特异性、萼片特异性或其组合。
示例性叶特异性启动子包括来自C4植物(玉蜀黍)的丙酮酸正磷酸双激酶(PPDK)启动子、来自玉蜀黍的cab-m1Ca+2启动子、拟南芥 (Arabidopsis thaliana)myb相关基因启动子(Atmyb5)、二磷酸核酮糖羧化酶(RBCS)启动子(例如,在叶和光生长幼苗中表达的番茄 RBCS 1、RBCS2和RBCS3A基因,在发育中的番茄果实中表达的 RBCS1和RBCS2,或几乎专一地以高水平在叶片和叶鞘的叶肉细胞中表达的二磷酸核酮糖羧化酶启动子)。
示例性衰老特异性启动子包含在果实催熟、叶枯萎和脱落期间活跃的番茄启动子、编码半胱氨酸蛋白酶的基因的玉蜀黍启动子、82E4的启动子和SAG基因的启动子。可使用示例性花药特异性启动子。可选择本领域技术人员已知的示例性根优先启动子。示例性种子优选的启动子包括种子特异性启动子(在种子发育期间有活性的那些启动子,诸如种子储存多肽的启动子)和种子发芽启动子(在种子发芽期间有活性的那些启动子)。
诱导型启动子的实例包含响应病原体攻击、厌氧条件、高温、光、干旱、寒冷温度或高盐浓度的启动子。病原体诱导型启动子包括来自与发病机理相关的多肽(PR多肽)的启动子,这些启动子在病原体(例如,PR多肽、SAR多肽、β-1,3-葡聚糖酶、几丁质酶)感染后被诱导。
除植物启动子之外,其他合适的启动子可以来源于细菌来源,例如,章鱼碱合酶启动子、胭脂碱合酶启动子,并且其他启动子来源于Ti质粒,或者可以来源于病毒启动子(例如,花椰菜花叶病毒(CaMV)的35S 和19S RNA启动子、烟草花叶病毒的组成型启动子、花椰菜花叶病毒 (CaMV)19S和35S启动子或玄参花叶病毒35S启动子)。
b.突变
公开了包含本文所述的一种或多种多核苷酸或多肽中的至少一个突变的植物或植物细胞,其中所述突变导致NtINV或由其编码的多肽的功能或活性,或NtINV和NtSUS或由其编码的多肽的功能或活性受调节。本文中讨论了这些突变的组合。
提供了一种用于调节(干制)植物或(干制)植物材料中的NtINV 多肽或NtINV多肽和NtSUS多肽的水平的方法,所述方法包括将调节至少一种NtINV基因或至少一种NtINV基因和至少一种NtSUS基因的表达的一个或多个突变引入所述植物的基因组中,其中所述至少一种基因选自根据本公开的任何序列。
还提供了一种用于鉴定具有调节的还原糖水平的植物的方法,所述方法包括针对根据本公开的序列中一个或多个突变(诸如NtINV或 NtINV和NtSUS或其组合)的存在筛选来自目的植物的多核苷酸样品,并且任选地将所鉴定的突变与已知调节的还原糖水平的突变相关联。
还公开了对于根据本公开的NtINV基因或NtINV基因和NtSUS基因中的一个或多个突变是杂合的或纯合的植物或植物细胞,其中所述突变导致基因的表达或由其编码的NtINV多肽或NtINV和NtSUS多肽的功能或活性受调节。
大量方法可用于组合一种植物中的突变,包含有性杂交。在根据本公开内容的基因中具有一个或多个有利的杂合或纯合突变(其调节基因的表达或由其编码的多肽的功能或活性)的植物可以与在一个或多个其他基因中具有一个或多个有利的杂合或纯合突变(其调节基因的表达或由其编码的多肽的功能或活性)的植物杂交。在一个实施方案中,进行杂交以在同一植物内在根据本公开的基因内引入一个或多个有利的杂合或纯合突变。
如果植物中本公开的一种或多种多肽的功能或活性低于或高于植物中相同多肽的功能或活性,则功能或活性增加或降低,所述植物未被修饰以抑制所述多肽的功能或活性并且已经使用相同方案培养、收获和干制。
在一些实施方案中,使用诱变方法将突变引入植物或植物细胞中,并且使用本领域技术人员已知的方法诸如Southern印迹分析、DNA测序、PCR分析或表型分析来鉴定或选择引入的突变。可以使用本领域众所周知的方法来确定影响基因表达或干扰所编码的多肽的功能的突变。基因外显子中的插入突变通常导致空突变。保守残基中的突变在抑制编码的多肽的代谢功能方面可以特别有效。例如,应当理解,一个或多个高度保守区域中的突变可能改变多肽功能,而那些高度保守区域之外的突变可能对多肽功能有很小影响或没有影响。此外,单个核苷酸中的突变可产生终止密码子,这将导致截短的多肽,并且取决于截短的程度,丧失功能。
还公开了用于获得突变型多核苷酸和多肽的方法。任何目的植物,包含植物细胞或植物材料,可以通过多种已知诱导诱变的方法进行遗传修饰,所述方法包含定点诱变、寡核苷酸指导的诱变、化学诱导的诱变、辐射诱导的诱变、利用经修饰的碱基的诱变、利用缺口双链体DNA的诱变、双链断裂诱变、利用修复缺陷型宿主株的诱变、通过全基因合成的诱变、DNA改组和其他等效方法。
本文所述的多核苷酸和多肽中的突变可包括人为突变或合成突变或基因工程突变。本文所述的多核苷酸和多肽中的突变可以是通过包括体外或体内操作步骤的过程获得或可获得的突变。本文所述的多核苷酸和多肽中的突变可以是通过包括人为干预的过程获得或可获得的突变。突变多肽变体的功能或活性可以更高、更低或与未突变多肽大约相同。
在多核苷酸中随机引入突变的方法可包括化学诱变和放射诱变。化学诱变涉及使用外源添加的化学物质(诸如诱变、致畸或致癌的有机化合物)来诱发突变。主要产生点突变和短缺失、插入、错义突变、简单序列重复、颠换或转换的诱变剂(包括化学诱变剂或辐射)可用于产生突变。诱变剂包括甲磺酸乙酯、甲磺酸甲酯、N-乙基-N-亚硝基脲、三乙基三聚氰胺、N-甲基-N-亚硝基脲、丙卡巴肼、苯丁酸氮芥、环磷酰胺、硫酸二乙酯、丙烯酰胺单体、美法仑、氮芥、长春新碱、二甲基亚硝胺、N-甲基-N'-硝基-亚硝基胍、亚硝基胍、2-氨基嘌呤、7,12-二甲基- 苯并(a)蒽、环氧乙烷、六甲基磷酰胺、白消安(bisulfan)、二环氧烷烃(二环氧辛烷、二环氧丁烷等)、2-甲氧基-6-氯-9-[3-(乙基-2-氯-乙基) 氨基丙基氨基]吖啶二盐酸盐和甲醛。
还设想了可能不是由诱变剂直接引起的基因座中的自发突变,只要它们产生所需表型。合适的诱变试剂还可以包含例如电离辐射,如X射线、γ射线、快中子照射和UV辐射。对于每种类型的植物组织,诱变化学物质或辐射的剂量通过实验确定,使得获得低于以致死性或繁殖不育为特征的阈值水平的突变频率。本领域技术人员已知的任何植物多核苷酸制备方法均可用于制备用于突变筛选的植物多核苷酸。
突变过程可包括一种或多种植物杂交步骤。
在突变后,可以执行筛选,以鉴定产生提前终止密码子或者无功能基因的突变。突变后,可以进行筛选以鉴定产生能够以增加或降低的水平表达的功能基因的突变。突变体的筛选可以通过测序或通过使用对该基因或多肽特异的一种或多种探针或引物来进行。还可在多核苷酸中产生特异性突变,其可导致调节的基因表达、调节的mRNA稳定性或调节的多肽稳定性。这类植物在本文中被称为“非天然存在的”或“突变型”植物。通常,突变型或非天然存在的植物将包括在被操作之前在植物中不存在的外来或合成或人造核苷酸的至少一部分(例如,DNA或RNA)。外来核苷酸可以是单个核苷酸、两个或更多个核苷酸、两个或更多个连续核苷酸或两个或更多个非连续核苷酸,例如至少10、20、30、40、50、 100、200、300、400、500、600、700、800、900、1000、1100、1200、 1300、1400或1500或更多个连续或非连续核苷酸。
c.转基因和基因组编辑
可干扰一个或多个内源基因转录的序列特异性多核苷酸;可干扰 RNA转录物(例如,双链RNA、siRNA、核酶)翻译的序列特异性多核苷酸;可干扰一种或多种多肽的稳定性的序列特异性多肽;可干扰一种或多种多肽的酶功能或一种或多种多肽相对于底物或调节多肽的结合功能的序列特异性多核苷酸;对一种或多种多肽表现出特异性的抗体;可干扰一种或多种多肽的稳定性或一种或多种多肽的酶功能或一种或多种多肽的结合功能的小分子化合物;结合一种或多种多核苷酸的锌指多肽;以及具有针对一种或多种多核苷酸的功能的大范围核酸酶可用于调节本文所述的一种或多种多核苷酸或多肽的表达或功能或活性。基因组编辑技术是本领域众所周知的,并且在下文进一步论述。
d.锌指核酸酶
锌指多肽可用于调节本文所述的一种或多种NtINV或NtINV和 NtSUS多核苷酸的表达或功能或活性。锌指核酸酶的使用描述于Nature Rev.Genet.(2010)11(9):636-646)中。
e.大范围核酸酶
大范围核酸酶诸如I-CreI可用于调节本文所述的一种或多种NtINV 或NtINV和NtSUS多核苷酸的表达或功能或活性。大范围核酸酶的使用描述于Curr Gene Ther.(2011)Feb;11(1):11-27以及Int J Mol Sci.(2019) 20(16),4045中。
f.TALEN
转录激活子样效应子核酸酶(TALEN)可用于调节本文所述的一种或多种NtINV或NtINV和NtSUS多核苷酸的表达或功能或活性。 TALEN的使用描述于Nature Rev.Mol.CellBiol.(2013)14:49-55以及Int J Mol Sci.(2019)20(16),4045中。
g.CRISPR
CRISPR系统可用于调节本文所述的一种或多种NtINV或NtINV和 NtSUS多核苷酸的表达或功能或活性,并且是优选的方法。该技术描述于例如Plant Methods(2016)12:8;Front Plant Sci.(2016)7:506; Biotechnology Advances(2015)33,1,第41-52页;ActaPharmaceutica Sinica B(2017)7,3,p292-302;Curr.Op.in Plant Biol.(2017)36,1–8以及 Int J Mol Sci(2019)20(16),4045中。如本领域众所周知的,CRISPR编辑系统通常包括两个组分:CRISPR相关核酸内切酶(Cas)(例如,Cas9) 和指导RNA(gRNA)。Cas在基因组中的位点处形成双链DNA断裂,所述位点由与Cas结合的gRNA分子的序列限定。Cas断裂DNA的位置由与其结合的gRNA的独特序列限定。gRNA是专门设计的RNA序列,其识别目的靶DNA区域并指导Cas核酸酶用于编辑。它具有两个区段: (i)充当Cas核酸酶的结合支架的tracrRNA;以及(ii)crispr RNA (crRNA),与靶DNA互补的17-20个核苷酸序。待靶向的DNA的确切区域将取决于具体应用。例如,为了活化或抑制靶多核苷酸,可以将gRNA靶向驱动靶多核苷酸表达的启动子。用于设计gRNA的方法是本领域众所周知的,包括Chop Chop Harvard。
基于Cas9的基因组编辑在拟南芥和烟草中的应用描述于例如 Methods Enzymol.(2014)546:459-72和Plant Physiol Biochem.(2018) 131:37-46中。CRISPR技术已在植物中广泛应用(参见例如 WO2015/189693)。
除Cas9之外,还描述了用于CRISPR系统的其他RNA引导的核酸酶,包括Casl、CaslB、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、 CaslO、Cpfl、Csyl、Csy2、Csy3、Csel、Cse2、Cscl、Csc2、Csa5、 Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmrl、Cmr3、Cmr4、 Cmr5、Cmr6、Csbl、Csb2、Csb3、Csxl7、Csxl4、CsxlO、Csxl6、 CsaX、Csx3、Csxl、Csxl5、Csfl、Csf2、Csf3和Csf4。在某些实施方案中,使用Cas9是优选的。
本公开还提供了包含RNA引导的核酸酶和gRNA的基于CRISPR的基因组编辑系统,其中基于CRISPR的基因组编辑系统调节本文所述的一种或多种多核苷酸的活性。本公开还提供了切割植物细胞中的一种或多种多核苷酸的方法,所述方法包括将gRNA和RNA引导的核酸酶引入植物细胞中,其中gRNA与RNA引导的核酸酶联合起作用以在本文所述的一种或多种多核苷酸中产生链断裂。还公开了CRISPR构建体,所述CRISPR构建体包含:(i)编码CRISPR相关核酸内切酶的多核苷酸;以及(ii)包含与待靶向的如本文所述的多核苷酸的DNA互补的多核苷酸序列(通常为约17-20个核苷酸)的gRNA。
h.反义修饰
反义技术是可以用于调节一种或多种NtINV多肽或一种或多种 NtINV和NtSUS多肽的表达或活性的另一熟知方法。参见例如Gene (1988)10;72(1-2):45-50。
i.可动遗传因子
作为另外一种选择,可通过将转座子(例如IS元件)引入目的植物的基因组内,靶向基因以灭活。参见例如Cytology and Genetics(2006) 40(4):68-81。
j.核酶
或者,可以通过将源自许多小环状RNA的核酶引入植物中来靶向 NtINV或NtINV和NtSUS多核苷酸以灭活,所述小环状RNA能够自切割和复制。参见例如FEMS MicrobiologyReviews(1999)23,3,257–275。
5.植物
突变型或非天然存在的植物或植物细胞可以具有一种或多种NtINV 或NtINV和NtSUS基因一种或一种或多种NtINV或NtINV和NtSUS中的一种或多种修饰(例如突变)的任何组合,其导致那些多核苷酸或其多核苷酸产物的表达或功能或活性受调节。例如,突变型或非天然存在的植物或植物细胞可以具有单个NtINV或单个NtINV和单个NtSUS多核苷酸或多肽中的单个修饰;单个NtINV或单个NtINV和单个NtSUS 多核苷酸或多肽中的多个修饰;两种或更多种或三种或更多种或四种或更多种NtINV或NtINV和NtSUS多核苷酸或多肽中的单个修饰;或两种或更多种或三种或更多种或四种或更多种NtINV或NtINV和NtSUS 多核苷酸或多肽中的多个修饰。作为另一个的实例,突变型或非天然存在的植物或植物细胞可以在NtINV或NtINV和NtSUS多核苷酸或多肽的特定部分中(诸如在编码NtINV或NtSUS多肽或其部分的活性位点的NtINV或NtINV和NtSUS的区域中)具有一种或多种修饰。作为另一个的实例,突变型或非天然存在的植物或植物细胞可以在一种或多种 NtINV或NtINV和NtSUS多核苷酸或多肽之外的区域(诸如在其调节的 NtINV或NtINV和NtSUS多核苷酸的上游或下游区域)中具有一种或多种修饰,条件是它们调节NtINV或NtINV和NtSUS多核苷酸的功能或表达。上游元件可以包括启动子、增强子或转录因子。一些元件如增强子可以置于它调节的基因的上游或下游。元件无需定位接近于它调节的基因,因为一些元件已发现位于它调节的基因上游或下游几十万个碱基对处。突变型或非天然存在的植物或植物细胞可以具有位于基因的前100 个核苷酸内、基因的前200个核苷酸内、基因的前300个核苷酸内、基因的前400个核苷酸内、基因的前500个核苷酸内、基因的前600个核苷酸内、基因的前700个核苷酸内、基因的前800个核苷酸内、基因的前900个核苷酸内、基因的前1000个核苷酸内、基因的前1100个核苷酸内、基因的前1200个核苷酸内、基因的前1300个核苷酸内、基因的前1400个核苷酸内、或基因的前1500个核苷酸内的一种或多种修饰。突变型或非天然存在的植物或植物细胞可以具有位于基因的100个核苷酸的第一、第二、第三、第四、第五、第六、第七、第八、第九、第十、第十一、第十二、第十三、第十四或第十五集合或其组合内的一种或多种修饰。公开了包括突变型多肽变体的突变型或非天然存在的植物或植物细胞(例如,如本文所述的突变型、非天然存在的或转基因植物或植物细胞等)。
在一个实施方案中,使来自植物的种子诱变且随后生长成第一代突变型植物。随后使第一代植物自花授粉,并且使来自第一代植物的种子生长成第二代植物,所述第二代植物随后就其基因座中的突变进行筛选。尽管诱变的植物材料可以针对突变进行筛选,但筛选第二代植物的优点在于所有体细胞突变都对应于生殖系突变。本领域技术人员应理解,包含但不限于种子、花粉、植物组织或植物细胞的多种植物材料可以进行诱变,以便产生突变型植物。然而,当筛选植物多核苷酸的突变时,诱变的植物材料的类型可能有影响。举例来说,当在非诱变植物授粉之前对花粉实施诱变时,使授粉获得的种子生长成第一代植物。第一代植物的每一个细胞将含有在花粉中产生的突变;因此这些第一代植物随后可针对突变进行筛选,而不是等到第二代进行。
6.修饰植物的制备、筛选和杂交
从个体植物、植物细胞或植物材料制备的NtINV或NtINV和NtSUS 多核苷酸可以任选地合并,以加速在源自诱变的植物组织、细胞或材料的植物群体中筛选突变。可以筛选植物、植物细胞或植物材料的一个或多个后续世代。任选合并的群组的大小取决于使用的筛选方法的灵敏度。
任选合并样品后,可以对其进行多核苷酸特异性扩增技术,诸如 PCR。对该基因或紧邻该基因的序列特异的任何一种或多种引物或探针可用于扩增任选合并的样品内的序列。合适地,一个或多个引物或探针设计为扩增最可能出现有用突变的基因座的区域。最优选地,引物设计为检测多核苷酸区域内的突变。另外,引物和探针优选避免已知的多态性位点,以便容易筛选点突变。为了便于扩增产物的检测,可以使用任何常规标记方法来标记一个或多个引物或探针。使用本领域充分理解的方法,可以基于本文中所描述的序列来设计引物或探针。
为了便于检测扩增产物,可以使用任何常规标记方法来标记引物或探针。使用本领域充分理解的方法,可以基于本文中所描述的序列来设计这些引物或探针。
可以通过本领域已知的方法鉴定多态性,并且一些多态性已在文献中得到描述。
在一些实施方案中,植物可以从植物、植物组织或植物细胞再生或生长。可以使用从植物细胞或植物组织再生或生长植物的任何适合方法,例如(但不限于)从原生质体组织培养或再生。适当地,植物可以通过在愈伤组织诱导培养基、嫩芽诱导培养基或根部诱导培养基上生长经转型植物细胞再生。参看例如McCormick等人,Plant Cell Reports 5:81-84(1986)。这些植物接着可生长,并且经相同经转型品系或不同品系授粉,并且鉴别具有所要表型特征表达的所得杂交体。可以生长两代或更多代来确保所要表型特征的表达稳定保持和遗传,并且采摘种子以确保获得所要表型特征的表达。因此,“经转型种子”指的是种子含有稳定整合到植物基因组中的核苷酸构建体。
因此,在另一方面,提供了制备突变型植物的方法。该方法涉及提供植物的至少一个细胞,所述植物包含编码本文所述的功能性多核苷酸 (或如本文所述的其任何组合)的NtINV或NtINV和NtSUS基因。接下来,在有效调节多核苷酸功能的条件下处理植物的至少一个细胞。然后将至少一个突变型植物细胞繁殖成突变型植物,其中与对照植物相比较,所述突变型植物具有本文所述的调节水平的NtINV或NtINV和NtSUS 多肽(或如本文所述的其任何组合)。在这一制备突变型植物的方法的一个实施方案中,处理步骤涉及在有效获得至少一个突变型植物细胞的条件下,使至少一个细胞经受如上所述的化学诱变剂。在这一方法的另一个实施方案中,处理步骤涉及在有效获得至少一个突变型植物细胞的条件下,使至少一个细胞经受辐射源。术语“突变型植物”包括其中与对照植物相比基因型被修饰(合适地,通过除基因工程或基因修饰之外的方式)的突变型植物。
在某些实施方案中,突变型植物、突变型植物细胞或突变型植物材料可以包括一个或多个突变,所述一个或多个突变在另一种植物、植物细胞或植物材料中天然存在,且赋予所需性状。该突变可引入(例如基因渗入)另一种植物、植物细胞或植物材料(例如具有与突变源自于其的植物不同的遗传背景的植物、植物细胞或植物材料)内,以对其赋予该性状。因此,例如,可以将在第一植物中天然发生的突变引入第二植物中,诸如具有与第一植物不同的遗传背景的第二植物。技术人员因此能够搜索且鉴定在基因组中天然携带本文中所描述基因的一种或多种突变等位基因的植物,所述基因赋予所需性状。可以通过多种方法(包含育种、回交和基因渗入)将天然存在的突变体等位基因转移到第二植物,以产生在本文中所描述基因中具有一个或多个突变的品系、品种或杂交物。相同的技术也可以应用于一个或多个非天然突变从第一植物到第二植物的基因渗入。可以在突变型植物的库中筛选展示所需性状的植物。合适地,利用如本文所述的多核苷酸的知识进行选择。因此,能够与对照相比筛选基因性状。这样的筛选方法可以涉及如本文讨论的常规扩增或杂交技术的应用。因此,本公开的另一方面涉及用于鉴定突变型植物的方法,该方法包括以下步骤:(a)提供包含来自植物的一种或多种 NtINV或NtINV和NtSUS多核苷酸的样品;以及(b)确定多核苷酸的序列,其中多核苷酸的序列与对照植物的多核苷酸相比的差异指示所述植物是突变型植物。在另一方面,提供了用于鉴定突变型植物的方法,所述突变型植物与对照植物相比累积了增加或降低水平的还原糖,该方法包括以下步骤:(a)提供来自待筛选植物的样品;(b)确定所述样品是否包含本文所述的一种或多种NtINV或NtINV和NtSUS多核苷酸中的一个或多个突变;以及(c)测定所述植物的至少一种还原糖(合适地葡萄糖或果糖或其组合)的水平。合适地,确定干制叶子中至少一种还原糖的水平。在另一方面,提供了制备突变型植物的方法,该突变型植物与对照植物相比具有增加或降低的至少一种还原糖(适当地葡萄糖或果糖或其组合)的水平,该方法包括以下步骤:(a)提供来自第一植物的样品;(b)确定所述样品是否在本文所述的一种或多种NtINV或 NtINV和NtSUS多核苷酸中包含导致至少一种还原糖的调节水平的一个或多个突变;以及(c)将一个或多个突变转移到第二植物中。合适地,确定干制叶子中至少一种还原糖的水平。可以使用本领域已知的多种方法,如通过基因工程改造、基因操纵、基因渗入、植物育种、回交等等,将突变转移到第二植物内。在一个实施方案中,第一植物是天然存在的植物。在一个实施方案中,第二植物具有与第一植物不同的基因背景。在另一方面,提供了制备突变型植物的方法,该突变型植物与对照植物相比具有增加或降低的至少一种还原糖(合适地葡萄糖或果糖或其组合) 的水平,该方法包括以下步骤:(a)提供来自第一植物的样品;(b) 确定所述样品是否在本文所述的一种或多种NtINV或NtINV和NtSUS多核苷酸中包含导致至少一种还原糖的调节水平的一个或多个突变;以及 (c)将一个或多个突变从第一植物基因渗入到第二植物中。合适地,确定干制叶子中至少一种还原糖的水平。在一个实施方案中,基因渗入步骤包括植物育种,任选地包含回交等等。在一个实施方案中,第一植物是天然存在的植物。在一个实施方案中,第二植物具有与第一植物不同的基因背景。在一个实施方案中,第一植物不是栽培品种或优良栽培品种。在一个实施方案中,第二植物是栽培品种或优良栽培品种。另一方面涉及通过本文中所描述的方法获得或可获得的突变型植物(包含栽培品种或优良栽培品种突变型植物)。在某些实施方案中,突变型植物可具有仅定位于植物的特定区域,诸如在本文所述的一种或多种NtINV 或NtINV和NtSUS多核苷酸的序列内的一个或多个突变。根据这一实施方案,突变型植物的剩余基因组序列将与诱变前的植物相同或基本上相同。
在某些实施方案中,突变型植物可具有位于植物的一个以上基因组区域中的一个或多个突变,诸如在本文所述的一种或多种NtINV或 NtINV和NtSUS多核苷酸的序列内以及在基因组的一个或多个其他区域内。根据这一实施方案,突变型植物的剩余基因组序列将与诱变前的植物不同或基本上不同。在某些实施方案中,突变型植物可以不具有本文所述的NtINV或NtINV和NtSUS多核苷酸的一个或多个、两个或更多个、三个或更多个、四个或更多个、或者五个或更多个外显子中的一个或多个突变;或可以不具有本文所述的NtINV或NtINV和NtSUS多核苷酸的一个或多个、两个或更多个、三个或更多个、四个或更多个、或者五个或更多个内含子中的一个或多个突变;或可以不具有本文所述的NtINV 或NtINV和NtSUS多核苷酸的启动子中的一个或多个突变;或可以不具有本文所述的NtINV或NtINV和NtSUS多核苷酸的3’非翻译区中的一个或多个突变;或可以不具有本文所述的NtINV或NtINV和NtSUS多核苷酸的5’非翻译区中的一个或多个突变;或可以不具有本文所述的NtINV 或NtINV和NtSUS多核苷酸的编码区中的一个或多个突变;或可以不具有本文所述的NtINV或NtINV和NtSUS多核苷酸的非编码区中的一个或多个突变;或其部分中的其两个或更多个、三个或更多个、四个或更多个、五个或更多个;或者六个或更多个的任何组合。
在另一方面,提供了鉴定植物、植物细胞或植物材料的方法,所述植物、植物细胞或植物材料包含编码本文所述的NtINV或NtINV和 NtSUS多核苷酸的基因中的突变,所述方法包括:(a)使植物、植物细胞或植物材料经受诱变;(b)从所述植物、植物细胞或植物材料或其后代获得样品;以及(c)确定NtINV或NtINV和NtSUS基因或其变体或片段的多核苷酸序列,其中所述序列的差异指示其中的一个或多个突变。该方法还允许选择具有突变的植物,所述突变发生在影响植物细胞中NtINV或NtINV和NtSUS基因表达的基因组区域中,诸如转录起始位点、起始密码子、内含子区域、外显子-内含子的边界、终止子或终止密码子。
7.植物科、物种、品种、种子和组织培养
适用于本公开中的植物包括单子叶和双子叶植物和植物细胞系统,并且可以包括山茶属、大麻属或烟草属的成员。山茶属和大麻属的合适的物种包括茶树(Camelliasinensis)(茶)、普通大麻(Cannabis sativa)、印度大麻(Cannabis indica)和野生大麻(Cannabis ruderalis)。
各种实施方案涉及突变型烟草、非自然存在的烟草或转基因烟草植物或烟草植物细胞,并且可以应用于烟草属的任何物种,包括黄花烟草 (N.rustica)和普通烟草(例如,LA B21、LN KY171、TI 1406、 Basma、Galpao、Perique、Beinhart 1000-1和Petico)。其他物种包括无茎烟草(N.acaulis)、尖叶烟草(N.acuminata)、非洲烟草(N. africana)、花叶烟草(N.alata)、阿米基诺氏烟草(N.ameghinoi)、抱茎烟草(N.amplexicaulis)、阿伦兹氏烟草(N.arentsii)、渐狭叶烟草(N.attenuata)、阿姆布吉烟草(N.azambujae)、贝纳莫特氏烟草 (N.benavidesii)、本赛姆氏烟草(N.benthamiana)、印度烟草(N. bigelovii)、博内里烟草(N.bonariensis)、洞生烟草(N.cavicola)、克利夫兰氏烟草(N.clevelandii)、心叶烟草(N.cordifolia)、伞床烟草(N.corymbosa)、迪伯纳氏烟草(N.debneyi)、木丝烟草(N.excelsior)、福尔吉特氏烟草(N.forgetiana)、香烟草(N.fragrans)、粉蓝烟草(N.glauca)、粘烟草(N.glutinosa)、古特斯比氏烟草(N. goodspeedii)、哥西氏烟草(N.gossei)、杂交烟草(N.hybrid)、因古儿巴烟草(N.ingulba)、卡瓦卡米氏烟草(N.kawakamii)、奈特氏烟草(N.knightiana)、郎氏烟草(N.Iangsdorffii)、渐尖叶烟草(N.linearis)、长花烟草(N.Iongiflora)、海滨烟草(N.maritima)、特大管烟草(N.megalosiphon)、摩西氏烟草(N.miersii)、夜花烟草(N. noctiflora)、裸茎烟草(N.nudicaulis)、欧布斯特烟草(N. obtusifolia)、西方烟草(N.occidentalis)、西方亚种香芥烟草(N. occidentalis subsp.hesperis)、耳状烟草(N.otophora)、圆维烟草(N.paniculata)、少花烟草(N.pauciflora)、矮牵牛状烟草(N. petunioides)、蓝茉莉叶烟草(N.plumbaginifolia)、夸德瑞伍氏烟草 (N.quadrivalvis)、雷蒙德氏烟草(N.raimondii)、波缘烟草(N. repanda)、莲座烟草(N.rosulata)、莲座亚种因古儿巴烟草(N. rosulata subsp.ingulba)、圆叶烟草(N.rotundifolia)、赛特氏烟草(N.setchellii)、拟似烟草(N.simulans)、前叶烟草(N.solanifolia)、斯佩格茨氏烟草(N.spegazzinii)、斯托可通氏烟草(N.stocktonii)、香甜烟草(N.suaveolens)、美花烟草(N.sylvestris)、拟穗状烟草(N. thyrsiflora)、绒毛烟草(N.tomentosa)、绒毛状烟草(N.tomentosiformis)、三角叶烟草(N.trigonophylla)、荫生烟草(N. umbratica)、波叶烟草(N.undulata)、颤毛烟草(N.velutina)、序叶烟草(N.wigandioides)和花烟草(N.xsanderae)。在一个实施方案中,植物是烟草。
本文还涵盖使用烟草栽培品种和优良烟草栽培品种。因此,转基因、非天然存在的或突变型植物可以是烟草品种或优良烟草栽培品种,其包括一种或多种转基因、或者一个或多个基因突变或其组合。基因突变 (例如,一种或多种多态性)可以是非天然存在于个别烟草品种或烟草栽培品种(例如,优良烟草栽培品种)中的突变,或可以是的确天然存在的基因突变,条件是所述突变并非天然存在于个别烟草品种或烟草栽培品种(例如,优良烟草栽培品种)中。
特别有用的烟草品种包括白肋烟型、黑烟型、烤烟型和东方型烟草。品种或栽培品种的非限制性实例是:BD 64、CC 101、CC 200、CC 27、 CC 301、CC 400、CC 500、CC 600、CC700、CC 800、CC 900、Coker 176、Coker 319、Coker 371 Gold、Coker 48、CD 263、DF911、DT538 LC Galpao烟草、GL 26H、GL 350、GL 600、GL 737、GL 939、GL 973、 HB 04P、HB 04PLC、HB3307PLC、杂交403LC、杂交404LC、杂交 501LC、K 149、K 326、K 346、K 358、K394、K399、K 730、KDH 959、KT 200、KT204LC、KY10、KY14、KY 160、KY 17、KY 171、 KY 907、KY907LC、KY14xL8 LC、Little Crittenden、McNair 373、 McNair 944、msKY 14xL8、窄叶Madole、窄叶Madole LC、NBH 98、 N-126、N-777LC、N-7371LC、NC 100、NC 102、NC 2000、NC291、 NC 297、NC 299、NC 3、NC 4、NC 5、NC 6、NC7、NC 606、NC 71、 NC 72、NC 810、NC BH129、NC 2002、Neal Smith Madole、OXFORD 207、PD 7302LC、PD 7309LC、PD 7312LC、'Perique'烟草、PVH03、 PVH09、PVH19、PVH50、PVH51、R 610、R 630、R 7-11、R 7-12、 RG 17、RG 81、RG H51、RGH 4、RGH 51、RS 1410、Speight 168、 Speight 172、Speight 179、Speight 210、Speight 220、Speight 225、 Speight 227、Speight 234、Speight G-28、Speight G-70、Speight H-6、Speight H20、Speight NF3、TI 1406、TI 1269、TN 86、TN86LC、TN 90、 TN 97、TN97LC、TN D94、TN D950、TR(Tom Rosson)Madole、VA 309、VA359、AA 37-1、B13P、Xanthi(Mitchell-Mor)、Bel-W3、79- 615、Samsun Holmes NN、KTRDC 2号杂交49、白肋21、KY8959、 KY9、MD 609、PG01、PG04、PO1、PO2、PO3、RG11、RG 8、 VA509、AS44、Banket A1、巴斯玛Drama B84/31、巴斯玛I Zichna ZP4/B、巴斯玛Xanthi BX 2A、Batek、Besuki Jember、C104、Coker 347、 Criollo Misionero、Delcrest、Djebel 81、DVH 405、
Figure BDA0003575216060000371
Comum、 HB04P、希克斯阔叶、Kabakulak Elassona、Kutsage E1、LA BU 21、NC2326、NC 297、PVH 2110、Red Russian、Samsun、Saplak、Simmaba、 Talgar 28、Wislica、Yayaldag、Prilep HC-72、Prilep P23、Prilep PB 156/1、Prilep P12-2/1、Yaka JK-48、Yaka JB 125/3、TI-1068、KDH-960、 TI-1070、TW136、巴斯玛、TKF 4028、L8、TKF 2002、GR141、Basma xanthi、GR149、GR153、Petit Havana。即使本文未特别指明,也设想上述的低转化亚变种。
实施方案还涉及用于产生已被修饰以调节本文所述的一种或多种 NtINV或NtINV和NtSUS多核苷酸(或如本文所述的其任何组合)的表达或功能的突变型植物、非天然存在的植物、杂交植物或转基因植物的组合物和方法。有利地,所获得的突变型植物、非天然存在的植物、杂交植物或转基因植物可以在整体外观上与对照植物相似或基本上相同。多种表型特征,如成熟程度、每一植物叶数、秆高、叶插入角度、叶大小(宽度和长度)、节间距离以及叶片-中脉比可以通过田地观测进行评价。
一个方面涉及本文所述的突变型植物、非天然存在的植物、杂交植物或转基因植物的种子。优选地,所述种子是烟草种子。另一方面涉及本文所述的突变型植物、非天然存在的植物、杂交植物或转基因植物的花粉或胚珠。此外,提供了如本文所述的突变型植物、非天然存在的植物、杂交植物或转基因植物,其还包含赋予雄性不育的多核苷酸。
还提供了如本文所述的突变型植物、非天然存在的植物、杂交植物或转基因植物或其一部分的可再生细胞的组织培养物,其中培养物再生能够表达亲本的所有形态和生理特征的植物。可再生细胞包括来自叶、花粉、胚、子叶、下胚轴、根、根尖、花药、花及其部分、胚珠、芽、茎、柄、髓和囊的细胞或来源于它们的愈伤组织或原生质体。
本文所述的植物材料可以是干制烟草材料,诸如来自弗吉尼亚烟型或东方烟型的干制烟草材料。干制烟草材料可以是烟道干制或晒干或晾干的烟草材料。
对于烟草干制的CORESTA推荐描述于:CORESTA Guide N 17, 2016年4月,Sustainability in Leaf Tobacco Production。
8.调节糖含量
本公开的突变型、转基因或非天然存在的植物或其部分在植物材料中,诸如在干制叶子中表现出至少一种还原糖(诸如葡萄糖或果糖或其组合)的调节水平。在某些实施方案中,当葡萄糖或果糖或其组合的水平降低时,蔗糖水平可以增加。
适当地,在至少干制叶子、适当地完全干制叶子中观察到至少一种还原糖的调节水平。适当地,干制叶子取自植物上的中间位置叶。适当地,与对照植物相比,表型上不存在或可忽略不计,诸如视觉植物适合度。适当地,与对照植物相比,总游离氨基酸没有变化或变化可忽略不计。在某些实施方案中,可以调节通过加热干制叶子或由其衍生的产品获得的烟雾中的丙烯酰胺水平。
另一个方面涉及如本文所述的突变型、非天然存在或转基因植物或细胞,与其中所述NtINV或NtINV和NtSUS多肽的表达或功能未被调节的对照植物相比,所述突变型、非天然存在或转基因植物或细胞中至少一种还原糖的水平降低至少5%。
在某些实施方案中,与对照植物相比,葡萄糖或果糖或其组合的水平降低约30%或更多,诸如约40%、或约50%、或约60%或约70%或约 80%或约90%或更多。
在某些实施方案中,与对照植物相比,葡萄糖或果糖或其组合的水平降低约40%或更多,诸如约50%、或约60%或约70%或约80%或约 90%或更多。
在某些实施方案中,与对照植物相比,葡萄糖的水平降低至少60%或更多或至少63%或更多,并且果糖的水平降低至少约40%或更多或至少63%或更多。
在某些实施方案中,与对照植物相比,葡萄糖的水平降低至少60%或更多或至少63%或更多,并且果糖的水平降低至少约40%或更多或至少63%或更多,并且蔗糖的水平增加至少2倍、至少3倍或至少4倍。
在某些实施方案中,与对照植物相比,葡萄糖和果糖的水平增加。
在某些实施方案中,与对照植物相比,葡萄糖的水平增加,果糖的水平增加,并且蔗糖的水平降低。
与对照植物相比,所述增加可以是约25%、50%、100%、250%或 500%或更多的增加。与对照植物相比,所述降低可以是约25%、50%或 75%或更多的降低。
又一方面涉及来源于或可来源于突变型、非天然存在的或转基因植物或细胞的干制植物材料,诸如干制叶子或干制烟草,其中本文所述的一种或多种NtINV或NtINV和NtSUS多核苷酸的表达或由此编码的 NtINV或NtINV和NtSUS多肽的功能被调节,并且其中与对照植物相比,葡萄糖、果糖和任选蔗糖的水平如上所述被调节。
实施方案还涉及用于产生突变型、非天然存在的或转基因植物或植物细胞的组合物和方法,所述突变型、非天然存在的或转基因植物或植物细胞已被修饰以调节本文所述的一种或多种NtINV或NtINV和NtSUS 多核苷酸或NtINV或NtINV和NtSUS多肽的表达或功能,其可产生具有调节的葡萄糖、果糖和任选蔗糖含量的植物或植物组分(例如,叶- 诸如干制叶子)或植物细胞。
在一个实施方案中,突变型、非天然存在的或转基因植物的表型与对照植物基本上相同。在一个实施方案中,突变型、非天然存在的或转基因植物的叶重与对照植物基本上相同。在一个实施方案中,突变型、非天然存在的或转基因植物的叶数目与对照植物基本上相同。在一个实施方案中,突变型、非天然存在的或转基因植物的叶重和叶数目与对照植物基本上相同。在一个实施方案中,例如在田间移植后一、二或三或更多个月或者在打顶后10、20、30或36或更多天,突变型、非天然存在的或转基因植物的秆高与对照植物基本上相同。例如,突变型、非天然存在的或转基因植物的秆高不低于对照植物的秆高。在另一个实施方案中,突变型、非天然存在的或转基因植物的叶绿素含量与对照植物基本上相同。在另一个实施方案中,突变型、非天然存在的或转基因植物的秆高与对照植物基本上相同,并且突变型、非天然存在的或转基因植物的叶绿素含量与对照植物基本上相同。在其他实施方案中,突变型、非天然存在的或转基因植物的叶的大小、或形状、或数目、或着色与对照植物基本上相同。
在另一方面,提供了一种用于调节植物的至少一部分(例如,叶子 (诸如干制叶子)或烟草)中的至少一种还原糖的量的方法,该方法包括以下步骤:(i)调节本文所述的一种或多种NtINV或NtINV和 NtSUS多肽(或如本文所述的其任何组合)的表达或功能,合适地,其中NtINV或NtINV和NtSUS多肽由本文所述的相应NtINV或NtINV和 NtSUS多核苷酸编码;(ii)测量步骤(i)中获得的突变型、非天然存在的或转基因植物的至少一部分(例如,叶子(诸如干制叶子)或烟草或烟雾)中的至少一种还原糖(例如,葡萄糖和果糖)和任选的至少一种非还原糖(诸如蔗糖)的水平;以及(iii)鉴定与对照植物相比其中至少一种还原糖和任选地至少一种非还原糖的水平已被调节的突变型、非天然存在的或转基因植物。
在另一方面,提供了一种用于调节干制植物材料(诸如干制叶子) 的至少一部分中的至少一种还原糖的量的方法,该方法包括以下步骤: (i)调节一种或多种NtINV或NtINV和NtSUS多肽(或如本文所述的其任何组合)的表达或功能,合适地其中NtINV或NtINV和NtSUS多肽由本文所述的相应NtINV或NtINV和NtSUS多核苷酸编码;(ii)收获植物材料(诸如一种或多种叶子)并干制一段时间;(iii)测量在步骤(ii)中或在步骤(ii)期间获得的干制植物材料的至少一部分中的至少一种还原糖(例如,葡萄糖和果糖)和任选地至少一种非还原糖(诸如蔗糖)的水平;以及(iv)鉴定与对照植物相比其中至少一种还原糖和任选地其中至少一种非还原糖的水平已被调节的干制植物材料。
与对照相比,表达的增加可以为约5%至约100%,或增加至少10%、至少20%、至少25%、至少30%、至少40%、至少50%、至少60%、至少70%、至少75%、至少80%、至少90%、至少95%、至少98%或100%或更多,诸如200%、300%、500%、1000%或更多,其包括转录功能或 NtINV或NtINV和NtSUS多核苷酸表达或NtINV或NtINV和NtSUS多肽表达或其组合的增加。
与对照相比,功能或活性的增加可以为约5%至约100%,或增加至少10%、至少20%、至少25%、至少30%、至少40%、至少50%、至少 60%、至少70%、至少75%、至少80%、至少90%、至少95%、至少 98%或100%或更多,诸如200%、300%、500%、1000%或更多,其包括转录功能或NtINV或NtINV和NtSUS多核苷酸表达或NtINV或NtINV 和NtSUS多肽表达或其组合的增加。
与对照相比,表达的减少可以为约5%至约100%,或减少至少10%、至少20%、至少25%、至少30%、至少40%、至少50%、至少60%、至少70%、至少75%、至少80%、至少90%、至少95%、至少98%或 100%,其包括转录功能或NtINV或NtINV和NtSUS多核苷酸表达或 NtINV或NtINV和NtSUS多肽表达或其组合的减少。
与对照相比,功能或活性的减少可以为约5%至约100%,或减少至少10%、至少20%、至少25%、至少30%、至少40%、至少50%、至少 60%、至少70%、至少75%、至少80%、至少90%、至少95%、至少 98%或100%,其包括转录功能或NtINV或NtINV和NtSUS多核苷酸表达或NtINV或NtINV和NtSUS多肽表达或其组合的减少。
本文所述的多核苷酸和重组构建体可用于调节目的植物物种(合适地为烟草)中的本文所述的NtINV或NtINV和NtSUS多核苷酸或NtINV 或NtINV和NtSUS多肽的表达或功能或活性。
许多基于多核苷酸的方法可用于增加基因在植物和植物细胞中的表达。作为实例,可以制备与待转化的植物相容的构建体、载体或表达载体,其包括目的基因连同能够在植物或植物细胞中过表达所述基因的上游启动子。示例性启动子在本文中描述。转化后,并且当在合适的条件下生长时,启动子可驱动表达,以调节植物或其特定组织中NtINV或NtINV和NtSUS的水平。在一个示例性实施方案中,生成携带本文所述的一种或多种NtINV或NtINV和NtSUS多核苷酸(或如本文所述的其任何组合)的载体,以在植物或植物细胞中过表达所述基因。所述载体携带位于转基因上游的合适启动子(如花椰菜花叶病毒CaMV 35S启动子),从而驱动所述转基因在植物的所有组织中的组成型表达。所述载体还携带抗生素抗性基因,以便对经转化的愈伤组织和细胞系赋予选择。
来自启动子的序列的表达可以通过包括表达控制序列来增强,所述表达控制序列是本领域众所周知的。专门指示与衰老相关的信号和在干制程序期间活跃的信号。
因此,各种实施方案涉及通过将NtINV或NtINV和NtSUS多核苷酸的多个拷贝整合到植物基因组中来调节本文所述的一种或多种NtINV或 NtINV和NtSUS多核苷酸(或如本文所述的其任何组合)的表达水平的方法,所述方法包括:用包含与本文所述的一种或多种NtINV或NtINV 和NtSUS多核苷酸可操作地连接的启动子的表达载体转化植物细胞宿主。由重组多核苷酸编码的多肽可以是天然多肽,或对于细胞可以是异源的。
在一个实施方案中,本公开中使用的植物是烟道干制的植物,因为这样的植物具有高还原糖含量(在干制结束时田间生长时大于约14%干重)。烟道干制的突变型、转基因或非天然存在的植物或其部分可具有在干制结束时田间生长时小于约14%干重的还原糖含量,诸如在干制结束时田间生长时小于约10%干重的还原糖含量,或在干制结束时田间生长时小于约5%干重的还原糖含量,或在干制结束时田间生长时小于约1%干重的还原糖含量。
在一个实施方案中,本公开中使用的植物是晒干的植物,因为这样的植物具有还原糖含量(在干制结束时田间生长时大于约6.8%干重)。晒干的突变型、转基因或非天然存在的植物或其部分可具有在干制结束时田间生长时小于约5%干重的还原糖含量,诸如在干制结束时田间生长时小于约2.5%干重的还原糖含量,或在干制结束时田间生长时小于约 1%干重的还原糖含量。
在一个实施方案中,本公开中使用的植物是晾干的植物。这样的植物在干制结束时田间生长时具有大于约1.7%干重的还原糖含量。晒干的突变型、转基因或非天然存在的植物或其部分可具有在干制结束时田间生长时小于约1.5%干重的还原糖含量,诸如在干制结束时田间生长时小于约1%干重的还原糖含量,或在干制结束时田间生长时小于约0.5%干重的还原糖含量。
在某些实施方案中,优选使用烟道干制或晒干的植物。
9.育种
携带本文中所描述的一种或多种NtINV或NtINV和NtSUS多核苷酸 (或如本文所述的其任何组合)的突变体等位基因的植物可以用于植物育种计划,以产生有用的品系、品种和杂种。特别地,可以使该突变体等位基因渗入到上述商业上重要的品种中。因此,提供了用于植物育种的方法,其包括将如本文所述的突变型植物、非天然存在的植物或转基因植物与含有不同遗传一致性的植物进行杂交。所述方法可以进一步包括将后代植物与另一植物杂交,且任选地重复杂交直到获得具有期望的基因性状或基因背景的后代。这类育种方法发挥的一个目的是将期望的基因性状引入其他品种、育种品系、杂种或栽培品种,尤其是具有商业利益的那些。另一个目的是便于在单个植物品种、品系、杂种或栽培品种中叠加不同基因的基因修饰。考虑种内以及种间交配。源自这类杂交的后代植物,也称为育种品系,是本公开的非天然存在的植物的实例。
在一个实施方案中,提供了用于产生非天然存在的植物的方法,该方法包括:(a)将突变型或转基因植物与第二植物杂交以产生后代烟草种子;(b)在植物生长条件下生长后代烟草种子以产生非天然存在的植物。该方法还可包括:(c)将上一代非天然存在的植物与其自身或另一种植物杂交以产生后代烟草种子;(d)在植物生长条件下生长步骤(c)的后代烟草种子,以产生另外的非天然存在的植物;以及(e) 重复(c)和(d)的杂交和生长步骤多次以产生非天然存在的植物的进一步后代。所述方法可以任选包括在步骤(a)之前提供亲本植物的步骤,所述亲本植物包含得到表征且不同于突变型或转基因植物的遗传一致性。在一些实施方案中,取决于育种计划,将杂交和生长步骤重复0 至2次、0至3次、0至4次、0至5次、0至6次、0至7次、0至8次, 0至9次或0至10次,以便产生非天然存在的植物的世代。回交是这类方法的实例,其中后代与其亲本之一或与其亲本基因相似的另一植物进行杂交,以便获得在下一代中具有更接近于亲本之一的基因一致性的后代植物。用于植物育种,特别是植物育种的技术是众所周知的,并且可用于本公开的方法中。本公开还提供了通过这些方法产生的非天然存在的植物。某些实施方案不包含选择植物的步骤。
在本文中所描述方法的一些实施方案中,使用标准田地程序在田地评估源自育种和筛选变体基因的品系。包含原始未诱变亲本的对照基因型包含在内,并且按随机化完全区组设计或其他适当的田地设计,将入选者(entry)排列于田地。对于烟草,使用标准的农学实践,例如将烟草收获、称量且取样,用于在干制之前和干制期间的化学及其他常见测试。执行数据的统计分析,以确认所选择品系与亲本品系之间的相似性。任选地执行所选植物的细胞基因学分析,以确认染色体组和染色体配对关系。
DNA指纹鉴定、单核苷酸多态性、微卫星标记或类似技术可用在标记辅助选择(MAS)的育种计划中,以如本文所述的,将基因的突变等位基因转移或培育到其他烟草内。举例来说,育种者可通过含有突变体等位基因的基因型与农学期望的基因型的杂交来产生分离的群体。可使用本文中所列出的技术之一,使用从基因组序列或其片段所开发的标记来筛选F2中的植物或回交世代。鉴定为具有突变体等位基因的植物可以回交或自花授粉,以产生待筛选的第二群体。取决于预期遗传模式或所用MAS技术,有必要在每轮回交之前对所选择的植物进行自花授粉,以帮助鉴定所需个体植物。可重复进行回交或其他育种操作,直到恢复轮回亲本的所需表型。
根据本公开内容,在育种计划中,成功的杂交获得能育的F1植物。所选择的F1植物可与亲本之一杂交,并且第一回交世代植物进行自花授粉,以产生再次筛选变体基因表达(例如,基因的无效版本)的群体。将回交、自花授粉和筛选的过程重复例如至少4次,直到最终筛选产生可育且与轮回亲本相当相似的植物。如果需要的话,这种植物进行自花授粉,并且随后再次筛选后代,以确认植物展现变体基因表达。在一些实施方案中,筛选F2代中植物群体的变体基因表达,例如根据标准方法鉴定由于缺乏基因而不能表达多肽的植物,例如通过使用PCR方法,其中引物基于本文所述的多核苷酸(或如本文所述的其任何组合)的多核苷酸序列信息。
杂交烟草品种可通过以下方式产生:阻止第一品种的雌性亲本植物 (即,种子亲本)的自花授粉,允许来自第二品种的雄性亲本植物的花粉使雌性亲本植物受精,且允许F1杂种种子在雌性植物上形成。可通过在花发育早期阶段将花朵去雄来阻止雌性植物的自花授粉。或者,可使用雄性不育的形式阻止在雌性亲本植物上形成花粉。举例来说,可通过细胞质雄性不育(CMS)或转基因雄性不育来产生雄性不育,其中转基因抑制小孢子或花粉形成、或自交不相容。含有CMS的雌性亲本植物是特别有用的。在雌性亲本植物是CMS的实施方案中,从雄性可育植物收获花粉并人工施用于CMS雌性亲本植物的柱头,并且收获所得到的F1种子。
本文所述品种和品系可用于形成单杂交烟草F1杂种。在这类实施方案中,亲本品种的植物可生长为基本上同质的相邻群体,以便于雄性亲本植物与雌性亲本植物的天然异花授粉。通过常规方式选择性地收获在雌性亲本植物上形成的F1种子。还可大批种植两个亲本植物品种,并收获由于自花授粉而在雌性亲本上形成的F1杂种种子和在雄性亲本上形成的种子的掺合物。或者,可进行三系杂交,其中单杂交F1杂种用作雌性亲本,并且与不同的雄性亲本杂交。作为另一替代方案,可产生双杂交杂种,其中两个不同单杂交的F1后代进行自身杂交。
可在突变型、非天然存在的或转基因植物群体中,筛选或选择具有所需性状或表型的那些群体成员。例如,可以筛选单个转化事件的后代群体中的具有所需表达水平或由其编码多肽的功能的那些植物。可使用物理和生物化学方法来鉴定表达或活性水平。这些方法包括用于检测多核苷酸的Southern分析或PCR扩增;用于检测RNA转录物的Northern印迹、S1 RNase保护、引物延伸或RT-PCR扩增;用于检测多肽和多核苷酸的酶或核酶功能的酶分析;以及用于检测多肽的多肽凝胶电泳、Western印迹、免疫沉淀和酶联免疫分析。其他技术诸如原位杂交、酶染色、免疫染色和酶测定也可用于检测NtINV或NtINV和NtSUS多肽或多核苷酸的存在或表达、功能或活性。
如本文所述的突变型、非天然存在的或转基因植物细胞和植物包括一种或多种重组多核苷酸、一种或多种多核苷酸构建体、一种或多种双链RNA、一种或多种结合物或者一种或多种载体/表达载体。
10.其他基因的修饰
非限制性地,本文所述的植物及其部分可以在根据本公开的一种或多种NtINV或NtINV和NtSUS多核苷酸或NtINV或NtINV和NtSUS多肽的表达、功能或活性已被调节之前或之后被修饰。
在突变型、非天然存在的或转基因植物及其部分中可以存在一种或多种下列进一步的基因修饰。
可以修饰涉及氮代谢中间体转化的一个或多个基因,从而降低至少一种烟草特异性亚硝胺(TSNA)的水平。此类基因的非限制性实例包括编码尼古丁脱甲基酶的那些(诸如WO2006/091194、WO2008/070274、 WO2009/064771和WO2011/088180中所述的CYP82E4、CYP82E5和 CYP82E10),以及硝酸还原酶,如WO2016/046288中所述的。
可以修饰参与重金属吸收或重金属转运的一个或多个基因,从而降低重金属含量。非限制性实例包括以下中的基因:多药抗性相关多肽家族、阳离子扩散促进因子(CDF)家族、Zrt-Irt样多肽(ZIP)家族、阳离子交换剂(CAX)家族、铜转运蛋白(COPT)家族、重金属ATP酶家族(例如HMA,如WO2009/074325和WO2017/129739中所述)、天然抗性相关巨噬细胞多肽(NRAMP)的同系物家族和ATP结合盒 (ABC)转运蛋白家族的其他成员(例如MRP),如WO2012/028309 中所述,其参与重金属诸如镉的转运。
其他示例性修饰可产生具有调节的表达或功能的异丙基苹果酸合酶的植物,这导致蔗糖酯组成的改变,其可用于改变喜好概况(参见 WO2013/029799)。
其他示例性修饰可产生具有调节的表达或功能的苏氨酸合酶的植物,其中甲硫氨酸的水平可以被调节(参见WO2013/029800)。
其他示例性修饰可产生具有调节的表达或功能的新黄质合酶、番茄红素β环化酶和9-顺式-环氧类胡萝卜素双加氧酶中的一种或多种的植物,以调节β-大马酮含量来改变风味特征(参见WO2013/064499)。
其他示例性修饰可产生具有调节的表达或功能放入氯化物通道的 CLC家族成员的植物,以调节其中的硝酸盐水平(参见WO2014/096283 和WO2015/197727)。
其他示例性修饰可产生具有调节的一种或多种天冬酰胺合成酶的表达或功能的植物,以调节叶子中的天冬酰胺的水平和调节在加热或燃烧叶子时产生的气溶胶中的丙烯酰胺的水平(参见WO2017/129739)。
其他示例性修饰可导致在干制期间具有调节的蛋白酶活性的植物 (参见WO2016/009006)。
其他示例性修饰可以通过改变硝酸还原酶(例如,Nia2)的基因表达或由其编码的蛋白质的活性而导致植物具有降低的硝酸盐水平(参见 WO2016/046288)。
其他示例性修饰可以通过改变推定的ABC-2转运蛋白NtABCGl-T和 NtABCGl-S的基因表达或由其编码的蛋白质的活性而导致植物具有修饰的生物碱水平(参见WO2019/086609)
其他示例性修饰可通过改变编码终花1(TFL1)的基因的基因表达或由其编码的蛋白质的活性而导致植物具有调节的开花时间(参见 WO2018/114641)。其他示例性修饰可产生具有调节的一种或多种天冬酰胺合成酶的表达或功能的植物,以调节叶子中的天冬酰胺的水平和调节在加热或燃烧叶子时产生的气溶胶中的丙烯酰胺的水平(参见 WO2017/042162)。
其他修饰的实例包括调节除草剂耐受性,例如,草甘膦是许多广谱除草剂的活性成分。通过转移aroA基因(来自鼠伤寒沙门氏菌 (Salmonella typhimurium)和大肠杆菌(E.coli)的草甘膦EPSP合成酶),已开发草甘膦抗性转基因植物。通过转化来自拟南芥的突变ALS (乙酰乳酸合成酶)基因已产生了抗磺脲植物。来自突变绿穗苋 (Amaranthushybridus)的光系统II的OB多肽已被转移到植物中以产生抗阿特拉津转基因植物;并且抗溴苯腈转基因植物已通过掺入来自细菌克雷伯氏肺炎菌(Klebsiella pneumoniae)的bxn基因而产生。
另一示例性修饰导致对昆虫具有抗性的植物。苏云金芽孢杆菌 (Bacillusthuringiensis,Bt)毒素可以提供一种有效方式来延迟抗Bt害虫的出现,如在花椰菜中最近说明的,其中金字塔形cry1Ac和cry1C Bt 基因控制对任一单个多肽具有抗性的小菜蛾,并且显著延迟抗性昆虫的进化。
另一示例性修饰产生对由病原体(例如病毒、细菌、真菌)引起的疾病具有抗性的植物。已经设计了表达Xa21基因(抗白叶枯病)的植物和表达Bt融合基因和几丁质酶基因(抗三化螟和耐鞘)的植物。
另一示例性修饰产生改变的生殖能力,例如雄性不育。
另一示例性修饰产生耐受非生物胁迫(例如,干旱、温度、盐度) 的植物,并且通过转移来自拟南芥属的酰基甘油磷酸酶,已产生耐受的转基因植物;编码甘露醇脱氢酶和山梨糖醇脱氢酶的基因改善抗旱性,所述甘露醇脱氢酶和山梨糖醇脱氢酶涉及甘露醇和山梨糖醇合成。
另一种示例性修饰产生其中一种或多种尼古丁N-脱甲基酶的活性被调节的植物,使得可以调节在干制期间形成的降烟碱和降烟碱代谢物的水平(参见WO2015169927)。
其他示例性修饰可以产生具有改善的储存多肽和油的植物、具有增强的光合效率的植物、具有延长的保存期限的植物、具有增强的碳水化合物含量的植物和抗真菌的植物。也可设想S-腺苷-L-甲硫氨酸(SAM) 或胱硫醚γ-合酶(CGS)或其组合的表达已被调节的转基因植物。
参与尼古丁合成途径的一个或多个基因可以被修饰,从而产生在干制时产生调节水平的尼古丁的植物或植物部分。尼古丁合成基因可以选自由以下组成的组:A622、BBLa、BBLb、JRE5L1、JRE5L2、MATE1、 MATE 2、MPO1、MPO2、MYC2a、MYC2b、NBB1、nic1、nic2、NUP1、NUP2、PMT1、PMT2、PMT3、PMT4和QPT或它们中的一个或多个的组合。
参与控制一种或多种生物碱的量的一个或多个基因可以被修饰,从而得到产生调节水平的生物碱的植物或植物部分。生物碱水平控制基因可以选自由以下组成的组:BBLa、BBLb、JRE5L1、JRE5L2、MATE1、 MATE 2、MYC2a、MYC2b、nic1、nic2、NUP1和NUP2或它们中的一个或多个的组合。
一种或多种此类性状可基因渗入来自另一栽培品种的突变型、非天然存在的或转基因植物,或可直接转化到其内。
各种实施方案提供了突变型植物、非天然存在的植物或转基因植物,以及生物质,其中根据本公开的一种或多种多核苷酸的表达水平被调节,从而调节由其编码的多肽的水平。
11.消耗品
本文所述植物的部分,特别是这些植物的叶片和中脉,可以掺入或用于制备各种消耗品,包括但不限于气溶胶形成材料、气溶胶形成装置、吸烟制品、可抽吸制品、无烟产品、医药或美容产品、静脉内制剂、片剂、粉末和烟草产品。气溶胶形成材料的实例包括烟草组合物、烟草、烟草提取物、烟丝、切丝填料、干制的烟草、膨胀烟草、均质烟草、再造烟草和烟斗烟草。吸烟制品和可抽吸制品是气溶胶形成装置的类型。吸烟制品或可抽吸制品的实例包含香烟、小雪茄和雪茄。无烟产品的实例包括嚼烟和鼻烟。在某些气溶胶形成装置而不是燃烧中,烟草组合物或另一气溶胶形成材料被一个或多个电加热元件进行加热,以产生气溶胶。在另一类型的被加热的气溶胶形成装置中,通过将热量从可燃性燃料元件或热源转移到物理上分开的气溶胶形成材料来产生气溶胶,所述气溶胶形成材料可以位于热源内、热源周围或热源下游。无烟烟草产品和多种含烟草的气雾形成材料可包含任何形式的烟草,包括沉积在其他成分上、混合于其他成分中、由其他成分包围或以其他方式与其他成分组合的干燥颗粒、碎片、小颗粒、粉末或浆料,所述其他成分采取任何形式,例如絮片、膜、卡(tab)、泡沫或珠。术语“烟雾”用于描述由例如香烟等吸烟制品或通过燃烧气溶胶形成材料而产生的一类气溶胶。
在一个实施方案中,本发明还提供了来自本文所述的突变型、转基因和非天然存在的植物的干制的植物材料。干制绿色烟叶的工艺是本领域技术人员已知的,并且包括但不限于如本文所述的晾干、火烤干制、烟道干制和晒干。
在另一个实施方案中,本发明描述了包括含有烟草的气雾形成材料的烟草产品,所述气雾形成材料包含来自本文所述的突变型烟草植物、转基因烟草植物或非天然存在的烟草植物的植物材料,例如叶,优选干制的叶。本文中所描述的烟草产品可以是掺合的烟草产品,其还可包括未修饰的烟草。
12.用于作物管理和农业的产品和方法
突变型、非天然存在的或转基因植物可具有在例如农业中的其他用途。
本公开还提供了用于产生种子的方法,其包括培养本文所述的突变型植物、非天然存在的植物或转基因植物,并且从栽培的植物收集种子。来自本文所述植物的种子可通过本领域中已知的方式进行条件处理,且包装在包装材料中,以形成制造物品。如纸和布等包装材料是本领域众所周知的。种子的包装可带有描述其中种子的性质的标记,例如固定到包装材料的标签或标记、印刷在包装上的标记。
用于对植物基因分型以鉴定、选择或育种的组合物、方法和试剂盒可包括检测多核苷酸样品中的NtINV或NtINV和NtSUS多核苷酸存在的方式。因此,描述了一种组合物,其包含用于特异性扩增一种或多种 NtINV或NtINV和NtSUS多核苷酸的至少一部分的一种或多种引物,以及用于进行扩增或检测的任选地一种或多种探针和任选地一种或多种试剂。
相应地,公开了基因特异性的寡核苷酸引物或探针,其包含对应于本文所述的NtINV或NtINV和NtSUS多核苷酸的约10个或更多个邻接多核苷酸。所述引物或探针可包含以下或由以下组成:约15、20、25、 30、40、45或50个或更多个邻接多核苷酸,所述引物或探针与本文所述的一种或多种NtINV或NtINV和NtSUS多核苷酸杂交(例如,特异性地杂交)。在一些实施方案中,引物或探针可包含约10至50个连续核苷酸、约10至40个连续核苷酸、约10至30个连续核苷酸或约15至30 个连续核苷酸,或由其组成,其可用于基因鉴定(例如,Southern杂交) 或分离(例如,细菌菌落或噬菌斑的原位杂交)或基因检测(例如,作为扩增或检测中的一种或多种扩增引物)的序列依赖性方法。可设计一个或多个特异性引物或探针,且用于扩增或检测多核苷酸的部分或全部。作为具体实例,可以在PCR方案中使用两种引物来扩增多核苷酸片段。 PCR也可以使用来源于多核苷酸序列的一种引物和与多核苷酸序列上游或下游序列杂交的第二种引物进行,所述多核苷酸序列诸如启动子序列、 mRNA前体的3'端或来源于载体的序列。用于体外扩增多核苷酸的热和等温技术的实例是本领域众所周知的。样品可以是或可源自植物、植物细胞或植物材料,或者由如本文所述的植物、植物细胞或植物材料制备或衍生的烟草产品。
在另一方面,还提供了检测样品中本文所述的NtINV或NtINV和 NtSUS多核苷酸(或如本文所述的其任何组合)的方法,该方法包括以下步骤:(a)提供包含或疑似包含多核苷酸的样品;(b)使所述样品与一种或多种引物或一种或多种探针接触,以特异性检测NtINV或 NtINV和NtSUS多核苷酸的至少一部分;以及(c)检测扩增产物的存在,其中扩增产物的存在指示样品中NtINV或NtINV和NtSUS多核苷酸的存在。在另一方面,还提供了一种或多种引物或探针用于特异性检测 NtINV或NtINV和NtSUS多核苷酸的至少一部分的用途。还提供了用于检测至少一部分NtINV或NtINV和NtSUS多核苷酸的试剂盒,其包含用于特异性检测至少一部分NtINV或NtINV和NtSUS多核苷酸的一种或多种引物或探针。试剂盒可包含用于多核苷酸扩增(如PCR)的试剂,或用于探针杂交检测技术(如DNA印迹、RNA印迹、原位杂交或微阵列) 的试剂。试剂盒可包括用于抗体结合检测技术(如蛋白质印迹、ELISA、 SELDI质谱法或测试条)的试剂。试剂盒可包括用于DNA测序的试剂。试剂盒可包括试剂和使用说明。
在一些实施方案中,试剂盒可包括用于所述方法中的一种或多种的说明书。所述试剂盒可用于遗传一致性确定、系统发生研究、基因分型、单倍体分型、谱系分析或植物育种,特别是共显性评分。
本公开还提供了对包括如本文所述的NtINV或NtINV和NtSUS多核苷酸的植物、植物细胞或植物材料进行基因分型的方法。基因分型提供了区分染色体对的同源物的手段,并且可用于区分植物群体中的分离体。分子标记方法可用于系统发生研究、表征作物品种之间的遗传关系、鉴定杂交或体细胞杂种、定位影响单基因性状的染色体区段、图位克隆和定量遗传研究。基因分型的具体方法可采用任意数目的分子标记分析技术,包含扩增片段长度多态性(AFLP)。AFLP是由多核苷酸变异性引起的扩增片段之间的等位基因差异的产物。因此,本公开进一步提供了使用诸如AFLP分析的技术来追踪一个或多个基因或多核苷酸以及与这些基因或多核苷酸基因连接的染色体序列的分离的方法。
13.烟草提取物
本文还公开了生产液体烟草提取物的方法和通过一种或多种方法生产的液体烟草提取物。
优选至少基于该烟草起始材料的还原糖含量和任选地尼古丁含量来选择烟草起始材料的特定提取温度。提取温度通常在约100摄氏度至约 160摄氏度的范围内选择。可以任选地控制加热步骤的持续时间以对源自烟草起始材料的提取物的组成提供一定控制程度。适当地,将烟草起始材料在提取温度下加热至少约90分钟,更适当地至少约120分钟。加热步骤通常在惰性气氛中进行。适当地,在加热步骤期间,使惰性气体流诸如氮气流通过起始烟草材料。挥发性烟草化合物在加热步骤期间释放到惰性气体流中,使得惰性气体充当挥发性组分的载体。惰性气体流的流动速率可以为至少约25升/分钟,更适当地至少约30升/分钟。相对高的惰性气体流速可有利地提高从烟草起始材料提取的效率。任选地,加热步骤可在真空下进行。用于进行烟草起始材料的加热的合适加热方法是技术人员已知的并包括:干蒸馏、水蒸馏、真空蒸馏、闪蒸蒸馏和薄膜水蒸馏。
当通过在液体溶剂中吸收来收集挥发性化合物时,形成液体烟草提取物的步骤可包括干燥挥发性化合物在液体溶剂中的溶液以浓缩该溶液。干燥可使用任何合适的措施进行,包括但不限于脱水、分子筛、冷冻干燥、相分离、蒸馏、膜渗透、水的受控结晶和过滤、反向吸湿、超速离心、液相色谱、反渗透或化学干燥。
液体烟草提取物特别适合于生产组合物或配制物或凝胶组合物,以用于气溶胶生成系统中。公开了一种气溶胶生成系统,其包含所述组合物或配制物或凝胶组合物。在此类气溶胶生成系统中,组合物或配制物或凝胶通常在气溶胶生成装置内加热以产生气溶胶,所述气溶胶生成装置诸如包括与掺入液体烟草提取物的组合物或配制物或凝胶相互作用的加热器元件的装置。在使用期间,挥发性化合物通过热传递释放并夹带在通过气溶胶生成装置抽吸的空气中。当所释放的化合物冷却时,所述化合物冷凝形成由消费者吸入的气溶胶。
还在以下实例中描述了本发明,提供所述实例以更详细地描述本发明。这些实例阐述目前设想用于进行本发明的优选模式,意图说明而不是限制本发明。
实施例
实施例1-材料和方法
DNA提取和植物基因分型
使用BioSprint 96(Qiagen,Hilden,Germany)以及BioSprint 96DNA 植物试剂盒(Qiagen,Hilden,Germany)来提取叶子样品。在TaqMan反应中使用DNA样品以便确定植物基因型。使用ABI PRISM 7900HT序列检测系统(Applied Biosystems,Life Technologies,Foster City,CA,USA) 和TaqMan快速高级预混液(Applied Biosystems,Foster City,CA,USA) 来进行Taqman。
测量游离氨基酸含量
氨基酸含量可以使用本领域已知的多种方法来测量。一种这样的方法是MethodMP 1471rev 5 2011,Resana,Italy:Chelab Silliker S.r.l,Mérieux NutriSciencesCompany。为了确定干制植物叶子中的氨基酸,如果需要,去除中脉后,将干制叶子在40℃下干燥2-3天。然后,在分析氨基酸含量之前,将烟草材料磨成细粉(约100uM)。测量植物材料中氨基酸含量的另一种方法描述在UNI EN ISO 13903:2005中。可以根据UNI EN ISO13903:2005进行游离氨基酸含量的测量。
测量还原糖含量
还原糖含量可以使用Skalar Instrument Co(West Chester,PA)开发并在Tobacco Science 20:139-144(1976)中描述的用于分析烟草样品的分段流比色法来测量。还原糖含量的测量也描述于Coresta Recommended Method 38、CRM38、CRM和ISO 15154:2003中。为了确定干制叶子中的还原糖,如果需要,去除中脉后,将干制叶子在40℃下干燥2-3天。然后,在分析还原糖之前,将烟草材料磨成细粉(约100uM)。还原糖含量的测量是根据ISO 15154:2003进行的。
实施例2-植物组织中NtINV4-S和NtINV4–T的表达的分析
表1显示了NtINV4-S和NtINV4–T在整个植物组织中表达,特别是在花瓣中,并且还在田间生长的弗吉尼亚烟草植物的未成熟花、萼片、底叶、中叶和上叶中表达程度较低。相比之下,NtINV3-S和NtINV3–T 在所研究组织中具有极低的表达,仅在田间生长的弗吉尼亚烟草植物的未成熟花朵中出现明显的表达,尽管非常低。
实施例3-还原糖(葡萄糖和果糖)在弗吉尼亚烟烟道干制时间过程期间的释放
在弗吉尼亚(烟道干制)烟草干制期间,还原糖,主要是葡萄糖和果糖在黄化叶中显著增加,在一两天后达到最高水平(参见图1A)。有趣的是,NtINV4-S和NtINV4-T表达在1或2天后增加约2倍(以log2 计)以达到平台期(参见图1A)。NtINV4-T在干制期间表达的程度大于NtINV4-S(参见图1B和表2)。NtINV3的两个拷贝均未在干制叶子 (参见图2B)或绿叶(参见表1)中显著表达。作为对照,SAG12,植物中衰老的一般标记物在干制一天后完全表达(参见图1C)。
实施例4-还原糖(葡萄糖和果糖)在深色烟草中的晾干时间过程期间的释放
为了确定NtINV4-S和NtINV4-T的诱导是否对弗吉尼亚烟草不具有特异性,研究了深色烟草中的表达数据。在这种情况下,叶子被晾干。在前120小时期间,在24、48、96和120小时后采集样本,冷冻、冻干并进行代谢组学分析。如在弗吉尼亚烟叶中所观察到的,葡萄糖和果糖 (还原糖)从0小时到120小时的干制(黄化期结束)增加4-6倍(参见图2)。在完全干制的叶中(在干制开始后约10天),葡萄糖和果糖水平在叶基质中与在烟道干制的烟草中一样降低(比较图1和2),但程度更大。蔗糖在前120小时干制期间保持几乎稳定,由此表明在叶黄化期间蔗糖分子的供应维持在深色烟草中。在干制结束时,蔗糖完全水解并且因此可能完全代谢(参见图2C)。
在相同样品中,冷冻叶材料用于分离RNA以分析NtINV3-S、 NtINV3-T、NtINV4-S和NtINV4-T的表达。如在烟道干制的烟草中所观测到的,NtINV3基因既不在收获的叶中表达,也不在深色烟草的晾干期间上调。另一方面,NtINV4-S和NtINV4-T上调因子>10,在5个干制日后达到最大(120小时,参见表2)。如在烟道干制的烟草中所观察到的, SAG12更快速地上调,并且然后在5个干制日后(120小时)降低。
实施例5-烟道干制的烟草中NtINV4的沉默
对烟道干制的烟草中NtINV4的沉默进行了研究,以确定这些基因是否有助于降低干制烟草叶中的还原糖含量。在NtINV4-S和NtINV4–T 两者的编码序列内的特定DNA片段(SEQ ID NO:9)与强组成型紫茉莉花叶病毒(MMV)启动子一起克隆在GATEWAY载体中。在MMV与根癌农杆菌(Agrobacterium tumefaciens)的胭脂碱合酶基因的3’nos 终止子序列之间侧接NtINV4基因片段。使用标准农杆菌介导的转化方案转化烟草品系K326。关于四种对照和四种转基因35S:INV4-RNAi品系的INV4表达水平的结果在图3中示出。为了能够选择低还原糖含量的植物,在干制48小时后分析独立的T0植物叶片和相应的对照品系,以确定对还原糖含量的影响。通过qPCR选择显示与对照品系相比最低水平的NtINV4表达的最佳T0品系。从这些最佳T0品系收获种子。操作NtINV4基因(例如,使用组成型启动子或特定的衰老启动子,诸如 SAG12或E4)可改变干制烟草叶的化学性质。类似地,使用基因编辑策略(诸如CRISPR或突变体选择)敲除NtINV4基因可改变商品烟草的主要品种的氨基酸叶子化学性质。
实施例6-四种对照和四种转基因35S:INV4-RNAi品系的完全干制叶片中的葡萄糖、果糖和蔗糖的分析
在图3中描述的四种对照和四种转基因35S:INV4-RNAi品系的五个中间位置叶在成熟时收集并经受烟道干制。在完全干制的叶中分析糖 (葡萄糖、果糖和蔗糖)。图4中呈现的数据显示,抗INV4植物中的葡萄糖和果糖强烈且显著地减少。葡萄糖和果糖的水平分别降低约63%和约43%。有趣的是,蔗糖在35S:INV4-RNAi品系中显著地高4.1倍,由此表明在叶干制期间累积的一部分蔗糖池不被沉默品系中的INV4基因水解。未观察到对视觉植物适合性和在对照与35S:INV4-RNAi品系之间的总游离氨基酸变化的影响。
敲除或下调NtINV4-S和NtINV4-T的表达可有助于减少干制叶子中还原糖的含量。为了甚至进一步减少还原糖的量,可以考虑敲除或下调 NtSUS和NtINV的组合。为了增加干制叶子中的还原糖汇集,可以考虑使用衰老诱导型启动子如SAG12或E4来过表达NtINV4-S或NtINV4-T (使用组成型启动子可能会强烈改变改变营养阶段下的植物新陈代谢。
实施例7-白肋烟、弗吉尼亚烟和东方烟烟草叶子干制后的SUS基因的鉴定
为了鉴定在白肋烟、弗吉尼亚烟和东方烟烟草叶子的早期干制期间导致蔗糖代谢的关键功能,在白肋烟、弗吉尼亚烟和东方烟中,对干制 48小时后的干制叶子中与收获时成熟的叶子相比上调的基因功能进行了过表达分析(log2倍数变化>2,调整的p值<0.05)。鉴定了涉及产生还原糖的基因,这些基因在干制48小时后是有活性的,与干制类型和烟草品种无关。鉴定了参与还原糖产生的烟草基因。
在叶子的早期干制期间直接参与还原糖产生的关键基因属于SUS基因家族。SUS可能是驱动还原糖在干制的离体叶子中积累的关键酶。
发现该烟草基因组具有12个NtSUS基因产物,分布在6个家族中,每个原型具有一个S和一个T拷贝:NtSUS1-S(SEQ ID NO:10)、 NtSUS1-T(SEQ ID NO:12)、NtSUS2-S(SEQ IDNO:14)、NtSUS2-T (SEQ ID NO:16)、NtSUS3-S(SEQ ID NO:18)、NtSUS3-T(SEQ ID NO:20)、NtSUS4-S(SEQ ID NO:22)、NtSUS4-T(SEQ ID NO:24)、 NtSUS5-S(SEQ ID NO:26)、NtSUS5-T(SEQ ID NO:28)、NtSUS6-S (SEQ ID NO:30)和NtSUS6-T(SEQ ID NO:32)。
SUS转录物来自基因组序列NtSUS2-S(SEQ ID NO:14)、NtSUS3- S(SEQ ID NO:18)、NtSUS3-T(SEQ ID NO:20)和NtSUS4-S(SEQ ID NO:22)。这些基因在叶子干制(衰老)期间被上调,如表3所示。这证实了S拷贝特别地参与了早期干制叶子的化学修饰,并且在这种特定情况下,葡萄糖和果糖增加。
尽管在白肋烟的干制叶子中发现的还原糖水平较低,但与弗吉尼亚烟和东方烟相比,NtSUS基因仍在白肋烟中被激活(参见表3),这可能是作为组成型响应,也确保了在早期干制阶段用于氨基酸合成的可用碳源。
在白肋烟(BU)和弗吉尼亚烟(FC)中,在早期干制期间未表达的NtSUS1-S和NtSUS1-T(参见表3)在根和茎中特别表达,表明在这些组织中可能存在特定功能来递送碳水化合物用于细胞壁合成或在缺氧状态下供应碳源(参见表4)。在另一方面,在叶子早期干制期间诱导的NtSUS3-S、NtSUS3-T、NtSUS4-S也在所有器官中表达,而NtSUS2-S 和NtSUS2-T主要在未成熟的花和花瓣中表达。NtSUS5-S、NtSUS5-T、NtSUS6-S和NtSUS6-T在所有分析的植物组织中均以低水平表达(见表 4)。
为了增加干制叶子中的还原糖库,可以考虑使用衰老诱导型启动子如SAG12或E4来过表达NtSUS2-S、NtSUS3-S、NtSUS3-T或NtSUS4-S 或其组合(使用组成型启动子可能会强烈改变植物的新陈代谢。在另一方面,敲除NtSUS2-S、NtSUS3-S、NtSUS3-T和/或NtSUS4-S可有助于降低干制叶子中还原糖的含量。
实施例8–弗吉尼亚烟烟草叶中NtSUS表达的沉默
对白肋烟中NtSUS的沉默进行了研究,以确定这些基因是否有助于降低干制的弗吉尼亚烟烟草叶中的还原糖含量。在NtSUS的编码序列内的特定DNA片段与强组成型紫茉莉花叶病毒(MMV)启动子一起克隆在GATEWAY载体中。在MMV与根癌农杆菌(Agrobacteriumtumefaciens)的胭脂碱合酶基因的3’nos终止子序列之间侧接NtSUS基因片段。
为了能够选择低还原糖含量的植物,在干制60小时后分析独立的 T0植物叶片和相应的对照品系,以确定对还原糖含量的影响。选择显示最低还原糖水平的最佳T0品系。从这些最佳T0品系收获种子。通过 qPCR测定T1子代以确定与降低还原糖含量相关的NtSUS沉默事件的效率。
操作NtSUS基因(例如,使用组成型启动子或特定的衰老启动子,诸如SAG12或E4)可改变干制烟草叶的化学性质。类似地,使用基因编辑策略(诸如CRISPR或突变体选择)敲除NtSUS基因可改变商品烟草的主要品种的氨基酸叶子化学性质。
实施例9-由NtINV4修饰的烟草植物和NtSUS修饰的烟草植物制备液体烟草提取物,其各自具有调节的还原糖含量。
烟草起始材料由根据本公开的NtINV4修饰的烟草植物或NtSUS修饰的烟草植物的干制叶子制备。将烟草材料切割以形成具有2.5毫米×2.5毫米的尺寸的烟草碎片,并且将烟草碎片装载到提取室中,而不进行压缩。在提取腔室内加热烟草起始材料。在加热期间,氮气流以约40 升/分钟的流速流经提取腔室。对于每种烟草起始材料,通过在负10摄氏度下和用750rpm的搅拌吸收到由丙二醇形成的液体溶剂中来收集加热步骤期间释放的挥发性化合物。将丙二醇与所收集的挥发性化合物的溶液在脱水过程中干燥以将溶液的水分水平降低到大约15%。收集从烟草起始材料收集的挥发物的浓缩溶液。
可以制备组合的液体烟草提取物。对于如上所述处理的每种烟草起始材料,第一烟草起始材料在不同于第二烟草起始材料的温度和时间段内加热。对于每种烟草起始材料,收集并干燥在加热步骤中释放的挥发性化合物。从第一和第二烟草起始材料收集的挥发物的所得浓缩溶液可以限定的比率共混以产生液体烟草提取物。
在本文中引用的或描述的任何出版物都提供了在本申请的提交日期之前公开的有关信息。本文中的陈述不应解释为承认发明人丧失先于这样的公开的资格。在上面的说明书中提及的所有出版物都通过引用并入本文。在不脱离本发明的范围和精神的情况下,本发明的各种修改和变化对于所属领域的技术人员来说将是显而易见的。尽管已经结合特定优选实施方案来描述本发明,但应理解,如所要求的本发明不应不恰当地限于此类特定实施方案。实际上,细胞生物学、分子生物学和植物生物学或有关领域的技术人员显而易见的用于实现本发明的所描述模式的不同改进意图在以下权利要求书的范围内。
表1
NtINV3和NtINV4基因在田间生长的白肋烟植物的根、茎、中叶、未成熟花、萼片和花瓣中的表达(RNAseq,FPKM)
Figure BDA0003575216060000541
表2
图2中呈现的深色烟草的晾干时间段期间NtINV3-S、NtINV3-T、 NtINV4-S和NtINV4-T的表达
Figure BDA0003575216060000542
表3
白肋烟(BU)、弗吉尼亚烟(FC)和东方烟(OR)在早期干制期间的NtSUS基因的表达
Figure BDA0003575216060000551
表4
NtSUS基因在田间生长的白肋烟(BU)和弗吉尼亚烟(FC)植物的根、茎、中叶、未成熟花(imflower)、萼片和花瓣中的表达
Figure BDA0003575216060000552
序列表
SEQ ID NO 1:NtINV3-S的多核苷酸序列
atggcggaaacaaacaatagcgttccttacacccaattaccggcggaggacaataacacctccgttaattctccggccggatgccggctacgacccaaaagagtgtcgtttatagtattaacagggctggtggcagctttgttactttttgtggcagtgaaatatgggaaaaacgaggcggaggatgtgaatccagggccagtaccaccacaagaa accgtgtgcaatatgcttggttctaatctaatgccgctgaccagcatgaagacggtggcgcgtggggtggcag aaggtgtctccgccaagtcacgcggtcgtttcttgggattacggccgtttccatggaccaaacaaatgttggctt ggcaaagaacatccttccactttcaacctaagaagaattggatgaatggttagtaattctttttctcttatgttattaattttcataaatcaactttattattattattatacaataaatcaacattgcttattgatgaattttaacataaacccgccttat gcttgacgagattaactagaactatatatacaatgaatgattatctccattccattacataaccatgaattatgtttctt aattaattaaagatttgacatgacattatatttcgtttatagtttaagaaaagctttgtattgatgtaaaagaaaccatt acagcttcgaatatgggataccttgtctttttcttttcctaagatggatctttgattgcaagaacagagtttgaattact caggaaacttatttgcttatttattattttttgaggtgaacattaatgatttattcttatttggcatgtgttggattatttgg cttggattgcgctgatcacggaaattgcctgattcttttcgtcagatcctaatggtaaagtccatatatttctacttgtt attgttgttgttcttcttattattatattattattgaaaattatcgacataatcgggacctcaaaacatactagtcgtagc agtttttaagtagacagattgtcaatatgatgaagacagttgttttcagacaattgcatgtgaattttctaggagcaa acacaaattcctagaatggtaagcaacttccaccctgtctgttccaattataacctcgctacttttgatccacttaat cttattcaaccaacagtggatcacttatttaattatatgtgacctagtttattgagacatttttacattaagccctttcgt atttacacttcaatatgcatcatacaaaaaaaaatgtacttcaaagttatacgttatattaatttctaactccaattttta aaaaaaaatatattttaggtcccttattctacaaaggatggtaccatttgttctatcaatacaatccagaggctgca gtatggggaaatattgtatggggacatgcagtttcaagagacttaattcactggcaacaccttccagttgctatgg ttgcggatcaatggtacgacattaatggtgtatggaccggatccgcaaccattttacccgatggtaaactcgtca tgttgtatactgggtcaaccaacgagtcagtacaggttcaaaatttagcgtacccggctgacccatcggatcctc tcctaataaaatgggtcaagtatgagggcaacccggttcttgtaccaccacccggaattgctgctaaggatttcc gtgaccccaccactgcatggaccacaccacaaggcaaatggcggattactattggttcaaaagttaataaaact ggaatttcattggtctatgacactattgattttaagaattttgagttgctggatggggtgctccatggtgtatcgggt acgggtatgtgggaatgtgtggatttttacccggtttcgaaagttgttgaaaatgggcttgacacttcagataatg ggcctgcagtaaaacatgtgttaaagtccagtcttgatgatgatagaaatgattattatgcacttggaacttatgat gctgtggctggaaaatgggttcctgataatcccactattgatgttggtattggattaagatatgattatggaaattttt atgcatcaaaaacattttatgaccaagagaaaaagagaagagtcctttgggcttggattactgaaagtgatagtg aagctgctgatatttgcaaaggttgggcatcacttcaggtacaattcaattgtgtcaagctagcgcttgcacatag atttagttgaaacctaaaaaatgagtatttgaaattccgtagaaaaataatttttgaaagttgaagttgtgtttgaatatgcattttatttgaaaaaaaaaacagttctaattttatgagaaagaaaaattcacctaaaaactgccctaaaccagattttaggaacttgaaaaaaaaataaactttttcaaaaactgattatattctatgaacaaacaatattatcaaaaatcta ttttttttttgccaaaatctatggccaaacaggagctaatttcctttattttttttttcaaacttcatgtcatatttgaatttt ggtctcatttaacactttggtaacgtgtgatgtaacacagcccattccaaggactataaaatatgacaagaagac aggaagcaatataattacttggccagtggcagaggttgagaatttgagatttaacagcaaggaattcgacaagg tggaggtcaagccaggaaatgttgttccactagaagttggcactgccactcaggtttgttcattaaatttagcttat atacactgactgcctaaaagaatttttttgacattattagtgtattttaagctattatagcacgtaacatgctaatgctc gaataagtttaacttactataacttgaattgttgatgattacagttggacataatggctgagtttgaagtagacccta aggtcttggagaaattagaaggaagtaatgctacatatgagtgcagaagcagcggtggatctgctgaacgtgg tgccttaggaccatttggtttattggttttaacagataagggattgtccgagcaaactccaatttacttctacattgct aaagacgctgctggaaatttcaccacattcttctgcaatgatcttaccaggttctaatttctcctctcttgcattttcat ctcatcaatgaagttttagcccttcaccccctcccccaaaaccaaactaataaattggagaaaaccctttattggtt cagtgcttaatagcagtacggaattcaggattttaagtcagtgggttctgcgatctatatatatataataatatttttct gcacatacatatagtccgagctagacatagtgagttccgttgaacctgttgcatttagtctgagtccgccactgct taagcacatccttctcataacaaccgagctttccaaaaacttaagtatttctcatgtccatacttttattcatgtttgaa aatgaagtcacattttgttttataaccgaaaaatcccgagggcaagtggccagtacatggttcgaagctcaatgg acactggcaccgcccctttatcgtgctccacttaaatactaagattttgtccgtggcagggtttcaaccaatcacg tacgtttaactcatatattaggaatagcttttaccactagaccaaaactcggggacaatgtatgaagccggatattt gttgcaattctttttaaattaaaatggggacaagatccgagacaaatcttgaaaatgcattacgaagtattgttaag taagtatgaaaatggtgattctcatctttttacttccttttttaggtcatctgaagcaacagatgttcgcaaactaatct acggaagcacagttccagtcctccaaggagagaagctttctctaagaacactggtaatatcccctttttctttctta atttcttaatccaaattcttaattagtgcttgttttcctttgtgcgtataattaagtttactaagtatcaattaatggggtat ttttgtcaatgtaataggtggatcattcaatagtagaaagttttgcacaaaatggaaggacagcaataacatcaag gttatatccaacaaaggcaatatatgaagatgctaagctctacttgtttaacaatgctacagatgttaccattactg cctcggtcaagatttggcaaatacattctgcaaatatacaatctagttaa
SEQ ID NO 2:NtINV3-S的多肽序列
MAETNNSVPYTQLPAEDNNTSVNSPAGCRLRPKRVSFIVLTGLV AALLLFVAVKYGKNEAEDVNPGPVPPQETVCNMLGSNLMPLTSMKT VARGVAEGVSAKSRGRFLGLRPFPWTKQMLAWQRTSFHFQPKKNW MNDPNGPLFYKGWYHLFYQYNPEAAVWGNIVWGHAVSRDLIHWQ HLPVAMVADQWYDINGVWTGSATILPDGKLVMLYTGSTNESVQVQ NLAYPADPSDPLLIKWVKYEGNPVLVPPPGIAAKDFRDPTTAWTTPQ GKWRITIGSKVNKTGISLVYDTIDFKNFELLDGVLHGVSGTGMWECV DFYPVSKVVENGLDTSDNGPAVKHVLKSSLDDDRNDYYALGTYDA VAGKWVPDNPTIDVGIGLRYDYGNFYASKTFYDQEKKRRVLWAWIT ESDSEAADICKGWASLQPIPRTIKYDKKTGSNIITWPVAEVENLRFNS KEFDKVEVKPGNVVPLEVGTATQLDIMAEFEVDPKVLEKLEGSNATY ECRSSGGSAERGALGPFGLLVLTDKGLSEQTPIYFYIAKDAAGNFTTF FCNDLTRSSEATDVRKLIYGSTVPVLQGEKLSLRTLVDHSIVESFAQN GRTAITSRLYPTKAIYEDAKLYLFNNATDVTITASVKIWQIHSANIQSS
SEQ ID NO 3:NtINV3-T的多核苷酸序列
atggcggaaacaaacaatagcgttccttacacccaattaccggcggaggacaataacacctccagtaattctc cggccaaatgccggcgacgacccaaaagagtgtcgttcatagtattaacagggctggtggcagctttgttactt tttgtggcagtgaaatatgggaataacgaggcggaggatgtaaatccagggccagtaccaccacaagaaaccgtgtgtaacatgcttggttctaatctaatgccgctgaccaccatgaggacggtggcgcgtggggtggcagaag gtgtctccgccaagtcacgcggtcgtttcttgggattacggccgtttccatggaccaaacaaatgttggcttggc aaagaacatccttccactttcaacctaagaagaattggatgaatggttagtaattctttttctcttatgttattttcataa atcagctttgtttttattaaacaataaatcaacagcttattgataattttaaacataaaaccgccttatgcttgacgag attaactagaactttatgtacaatgaatggttatctccattccattacatgcccatgaattttatgtgtcttaatttaaag atttgacaggacattacattacgtttatagtttaagaaaagcttggtattgatataaaaaaaaccattacagcttcga atatgggataccttgtctttttctttgcctaagatggatctttgattgcaagaacagagtttgaattactcaggaaaa atatgaaatcgttttggaacttatttgcttgtttattattttttgaggtgaacattaatgatttattcttatttggcatgtgtt ggattctttggctttggactgcgttgctcacggaaattacctgattctgttcgtcagatcctaatggtaagtccatat tttctgccggtattattattattattattgttattgttattattattattattattattaatttattttgatatattggaaaccatc gacaaaacggggacctcaaaacatactagtcggggtagtttgtaagtagacagattgacaatatgatgaagac agttgtctttagacaattgcatgtgaattttgtaggagcaaacacaaattcctagaatggtatacaacttcaatcct gtctgtccaattataacctcgctacttttgatccactacacctttttcgatcaacaggggatcacttatttaattatac ggaaccctttatataacaatcatatttgttcccgtattttttaggttttatattgagtggttgttatgcaaatattacagg atttgacgtttaaatatttttttggttgttatagataaaaattatctataaataaataatcattccttttttcatgttacatat aaaaaataaggaaattatttaaatttaaaatctcacaagctatgcatatttcactaattaaatattaaagaaagttaat acattattaataaattcataactaaaaatataaagatttaaactctaaggcagacattttaaggctaccaaaaaaat aatttttttcaagattgatggaagtggaacaactttgtaattgtagcttgtttcgtagatttcattctcttactagcgata taacacttgaattggcaaagatccgtgtctaaattttcagcaaaaaggtatccaatagtttttccttgaatacaatctaagagtttaaccgttaaattttctatccaagtattttttaaatttatccaataaaaaagatatcatgtgcaaatctataa atcttatattttatgcaagatagaaactttatttatttttagaattattattagcaatcttaaagattttatatggctgttata gaggggtaattttacaaaaagcgttctgctataaatatggttgttgctgttataggtaaaaagttgttataaaattgtt tatgaaagtcactttactttattttttaactgaaaagtcactatactttgcacattgtaactcaaaagtcaatcaacact tttagggcgttattaaacattatttttcatatttcttttcagcccaaccatttaaaaaataaaaaaaaatatttaaatcat gactcgacggttccatgacctgacccattttctcttatttatgttataaaaaacataaatattactttgttgtagtgtatt atattggttctcaatatagttatactaaatgtatacattggtttaagcaaagtattaaatagagaataaggaattaatc ttaacaaactagaggagttagatttgaaactgaaacaagaaaattagtagcgttgaagtgaaaaaaaataaaaa ggaggaagaaaaaataaaaaaagtatttatgcttgaaattttgactgagaaatattaatataagagtaaattaaaa gacaatatccttgatgttttagaacaagaacgcgcattttagtaaagataatgttactagacgaccatttttagtcg aactaatttaatactttgcttaaatcaatatgttgaaaatcaagacaattaacagtaaagtaatatttacgtttttttgta acaaaaataagagagtgggtcgagttaaagagcgggttgagtcacggtttaaatgggtatttttttattgtttaaat gattgagttaaaaaaaatatgaaaaaaaaaatttaatatggcctaaatgtattgagtgacttttgagttacaatgtgt aaagtatgatgactttccttttacaaaacaaagtaaagtgactttcataaacaattttcattagttcaatgacttctga gaaatggactccttaaaaaattgattctgaagaaaacttggtttttacggtgaatgactgttatatatgaatgttgtta tcgaaaggtctgactgtatgtgacctagtttattgagacgtttttacattaaagccctttcgtatttacacttcaatatg catcatacaaaaaatatgtgcttcataattatacattacattcatttctaactccacttttacaaaaaatattttaggtcc attattctacaaaggatggtaccatttgttctatcaatacaatccagaggctgcagtatggggaaatattgtatggg gccatgcagtttcaagagacttaattcactggcaacaccttccagttgctatggttgcggatcaatggtacgacat taacggtgtatggaccggatccgcaaccattttacccgatggtaaactcgtcatgttatataccgggtcaaccaa cgagtcagtacaggttcaaaatctagcgtacccggctgacccatcggatcctctcctaagaaaatgggtcaaat atgagggcaacccggtacttgtaccaccacccggaattgctactaaagattttcgtgaccccaccactgcatgg accacaccacaaggcaaatggaggattactattggttcaaaggttaataaaactggaatttcattggtctatgac actattgattttaagaaatttgagttgttggatggggtgctccatggtgtaccgggtacgggtatgtgggaatgtgt ggacttttacccggtttcgaaagttgttgaaaatgggcttgacacatcagataatgggcctgcagtaaaacatgt gttaaagtccagtctagatgatgatagaaatgattattatgcacttggaacttatgatgcagtggctggtaaatgg attcctgataatcccacaattgatgttggtattggattaagatatgattatggaaatttttacgcatcaaaaacatttta tgaccaagaaaaaaagagaagagtcctttgggcttggattactgaaggtgatagtgaagctgctgatatttgca aaggttgggcatcacttcaggtacaattcaattgtgtcgaagacaatttagctagtgttgggatatagatttggttg aaacttaaaaaaaaaaatatttaaaattatggacatgtattttatttgaaaaaaattaaaattctgtgagtggaagaa aaccttttacccaaaaactaccctaaaccagattttgggaatgtaaaaaaaagaatcagatcatattctatgaaca aacaatattatcaaaagttttttaaaaacaattttcaaaatctatggtcaatttcctcttttattttacttcattttgtcatat ttgaattttggtctcatttaacacttggtaacgtgtgatgtaaaacagcctattccaaggactataaaatatgacaa gaagacaggaagcaacataattacttggccagtggcggaggttgagaatttgagattaaacagtaaggaattc gacaaggtggaggtaaaaccagggtcagtttttccactagaagttggcactgccactcaggtttgttgattgaat ttaactatacacgtgtaaaagaatttctttacgttatcggtctattttaaactattatagcacgtaacatgctaatattc gataagtttaacttactataatttgaattgttgatgattatagttggacataatggctgagtttgaaatagaccctaag gtcttggagagattagaaggaaataatgctacatatgagtgcagaagcagtgggggatctgctgaacgtggtg ccttaggaccatttggtttattggttttaacagataagggcttgtccgagcaaactccaatttacttctacattgcaa aagacgctgctggaaatttcaccacattcttctgcaatgatcttaccaggttctaatttctcctctcttgcattttcatc tcatcaatgaagttttagcccctcccccccaccaaaaccaaactaagaaattggagaaaaacctttattggttca ctgcttaatagcagtacggaattcaggattttgagtcattaggttctgctctatatatatatatataataatatttttcta cacatatatatagttcgagctaaacataatgagttccgtcgaacctgttgcatctagtctgaatccgccactgcttt aacacatctttctcataataaccactatttccaagagcttaagtatttctcatgtccatacttctatccacgtttaaaaa tgaagtcagattttgttttatatccgagaaatcccgagggcaagtggccagtacatggttcgaagctcaatggac actggcaccgccctttatcgtgctctacttaaatattaagattttgtctgttgcagggttttaaccaaggacgtacgt ttaacccatatataacgagtagcttttaccactagaccaaaactcggggcaatatatgaagccagatatttgttgc aattctctttaattaaattaaaatggtgacaagatccgagacaaatcttggaagtgcattacgtagtatttttaagta agtatgataatggtgattctcatctttttacttccttttttttaggtcatctgaagcaacagatgttcgcaaactaatcta cggaagcacagttccagtcctccaaggagagaagctttctctaagaacactggtaattttcatttttcttcttttttta attgcttattcaaaattcttgattatattgcgtacacttaagtttaccaaatataaattaatggggtatttttgtgaatgt aataggtggatcattcaatagtagaaagttttgcacaaagtggaaggacagcaataacgtcaagggtatatcca acaaaggcaatatatgaagatgctaagctctacttatttaacaatgctacagatgttagcattactgcctcactcaa gatttggcaaatgaattctgcaaatatacaatctagttaa
SEQ ID NO 4:NtINV3-T的多肽序列
MAETNNSVPYTQLPAEDNNTSSNSPAKCRRRPKRVSFIVLTGLV AALLLFVAVKYGNNEAEDVNPGPVPPQETVCNMLGSNLMPLTTMRT VARGVAEGVSAKSRGRFLGLRPFPWTKQMLAWQRTSFHFQPKKNW MNGPLFYKGWYHLFYQYNPEAAVWGNIVWGHAVSRDLIHWQHLPV AMVADQWYDINGVWTGSATILPDGKLVMLYTGSTNESVQVQNLAY PADPSDPLLRKWVKYEGNPVLVPPPGIATKDFRDPTTAWTTPQGKW RITIGSKVNKTGISLVYDTIDFKKFELLDGVLHGVPGTGMWECVDFYP VSKVVENGLDTSDNGPAVKHVLKSSLDDDRNDYYALGTYDAVAGKWIPDNPTIDVGIGLRYDYGNFYASKTFYDQEKKRRVLWAWITEGDSE AADICKGWASLQPIPRTIKYDKKTGSNIITWPVAEVENLRLNSKEFDK VEVKPGSVFPLEVGTATQLDIMAEFEIDPKVLERLEGNNATYECRSSG GSAERGALGPFGLLVLTDKGLSEQTPIYFYIAKDAAGNFTTFFCNDLT RSSEATDVRKLIYGSTVPVLQGEKLSLRTLVDHSIVESFAQSGRTAITS RVYPTKAIYEDAKLYLFNNATDVSTASLKIWQMNSANIQSS
SEQ ID NO 5:NtINV4-S的多核苷酸序列
atggccacccaccattcccattatgacccggaaaactccacgacccattacactgtcctaccggatcaacccgaatccgccggcgccgggcgccggaagtctcttaaagttgtctccggcattttgctctcctctttctttttgctttctttagtctttgtgatcctcaaccagtcttcagatttatcacaagaaaactcccgctcgtcggagactttgacgcc ggcgttgtcacgaggtgtatctcagggagtttccgagaagactttcaaggatgtttccggtagaagcctttcgta ctacccgtggactaatgctatgcttacttggcaaaggactgcttaccattttcaacctcaaaagaattggatgaac ggtaaattttttggcttatctttctcttattaattcttttaataaaacatgaattttaagatacttatactggctttttcttatt gattcttatggctattttgttggggtatcctatggattctgattggatgatatgctgcagatcctaatggtgagtttact tattaccataattactttttattatttattattcccaaaccatgattagtgcatccggctattggttaaagattcacaaaa ccaataaaatagtaatcttgtcatagtttccataataatctacacgtacgctattgtttaatgacaagaaatttgacg ctcagcatagttaattctctcatatttgtattgtttactttatagcctttgagctaattaattctgggtttctttgaactaaa cctttataagttacaatcacacatagatgagttggcacattattcaggctaataatgaaagaaattggattacttga ctaatatggcaaatgcggccaatttaatttggattaacacgatatatgtgtggtaataatgcttttgtgcaacatctc tcatacaaggacacatgattaggtgattttgtaccaagtctcgggaccaatcacaatatatgggtcacaccttata tattattgtaagagttgggacccaccaaggatttgtctgtctttccaactagccacttgtctttttctcttttttatattttt aaatgaaatggtgtgggttttttatttttgggtcgatctaaccgcttctgcctattatcaatttagccttgtgattgtga gaatagaagagagaaatagaggataataataataaggataagaattaagaacgtaccttcttattgtcgaaatta tttgagaagactattcattgttctgattagtgtccatcgatgtccctttcctcctttttctatcttggagaggtttcctctt ctttgttttacttttcctttttctaaatatgcattccaaaatcttaacactactcgaacgtccattcttggaaagtctcttt gaaagtttagggcaacatcattcggacaacttaattagcattcactattaaaaattaatagaacagaaaagttcat gtatttttttagggagagtaagaggcggattcagaatttaaatcttatgtgtttagtttttaaaatttttaggattgataactgaacatggcgagaaacatgaacatgtgacataaattccgtgtttcaacactaaacaggtccattataccacaaaggatggtaccatcttttttatcaatacaatcctgattcagctgtttggggaaatatcacatggggccatgcaatatccacggacttgatccactggctttacttgcctttcgccatggttccgatcaatggtacgatatcaacggtgtctggaccgggtccgcgaccatcttgcccgacggtcagatcatgatgctatacaccggtgataccaatgattacgtgca ggtgcaaaatcttgcataccctgctaacttatcggatcctctcctcatcgactgggtcaagtaccaggacaatcc ggtcatggttcccccacccggcattggtgtcaaggacttcagagacccgacaactgcttggaccggacccca aaacgggcagtggctgctaaccatcgggtccaagattggtaaaacgggtattgcacttgtttatgatacgtcca acttcacaaactttaagctattggatggagttttgcatgcggttccgggtacgggtatgtgggagtgtgtggactt ttacccggtatcaaccgttgaggcaaacgggttggacacatcatataacgggccaggtataagcatgtgttaaa agcaagtttagatgacgataagcatgattactatgctattgggacatatgacccggtaaagaacaaatggactc ctgataacccggaattggatgtgggtatcgggttgagactggactacgggaaatactatgcgtcaaagacatttt atgacccgaaagaacaaagaagaatattgtggggatggattggagaaactgacagtgaagctgctgatctgct gaagggatgggcatctgtacaggtatggactcttttaagtacactacctcagcatccgaagagcattacactttta tttttgttttacattagaccacatgaatgggtgttttggcataactggtaaagttgttgccatgtgaccctgaggtca cgggttcgagccgtagaaatagcctcttgcagtaatgtaataaactcttagtgcatagggttgccttttttattaga ccacacacatgttcaagttatgtcatgttagtcgtgtcaattttttgtggaaatcaatttactgcacctcaatcttgaat tagttgagactagctataggaacctttgtattgagaggacttatcataatttgatcatttttgcactaactgtcacact atgatattcactttctttatccagtttagtagtgtgccaatacaccttaagcacgtgacaagaatttattagcagggt catctcgattttatgtaggagtacagaattgaattgaatcttttcttctagtaaattctcaattgcaacttgacaatgaa gtttttcagatgcaaaaaagatgaaatatctctaataatttccttttccaataacagagtattccaaggactctgcttt atgacaaggagacaaggacacatgtacttcagtggccagttaaagaaattgagagcttaagaattggtgatcct ctagtgaaacaggtcaatcttcaaccaggctcaattgagcttgtccatgttgactcagccgcacaggtttgctttc tcatccttcgaaattgaaaacgtttcacttatatgtgcttgatgtacagtcctaaaacttgtatgcgcaatggtgcag ttggatgtagaagcctcatttgaagtggacaaagcagcactcgcgggaacaattgaagcagatgtggtttcaac tgcagtactagtggaggtgctgctaaaagaggcattttgggaccatttggtgtcgttgtaattgctgatcaaacgc tttctgagctaaccccagtttacttctacattgccaaaggaactggtggccgagctgaaacctacttctgcgctga tgaaactaggtttgcttctactatgtttatcttgtatactctatcttaatagtccttgtcaaagtatagaggaataacat agcggcgtgatctgatgcagatcctcagaggctcctggagttgctaaacaagtgtatggtagttcagtaccagt gttagatggtgaacaacactcaatgagattattggtaagtgataatccctttattctgactttcttcaaatcaagaat aatatcaagcttattagttcttccagtcatcttacttaatttgtggaaatgctccaaagtagtcaatttggtaactattc aagataatgtggttcagaataatttgtgttatgaatgtatttgacagttgggatgatctgttttttagtaaaatttcttaa aaacttaattcaggtggaccactcaattgtggaaagctttgctcaaggaggaagaacagtcataacatcgcgaa tttacccaacaaaagcaatcaatggagcagcacgactgttcgttttcaacaatgccaccggggctagtgtgact gcctccctcaagatttggtcactcaaatcagctgatattcgatccttccccttggaccagttgtaa
SEQ ID NO 6:NtINV4-S的多肽序列
MATHHSHYDPENSTTHYTVLPDQPESAGAGRRKSLKVVSGILLS SFFLLSLVFVILNQSSDLSQENSRSSETLTPALSRGVSQGVSEKTFKDV SGRSLSYYPWTNAMLTWQRTAYHFQPQKNWMNDPNGPLYHKGWY HLFYQYNPDSAVWGNITWGHAISTDLIHWLYLPFAMVPDQWYDING VWTGSATILPDGQIMMLYTGDTNDYVQVQNLAYPANLSDPLLIDWV KYQDNPVMVPPPGIGVKDFRDPTTAWTGPQNGQWLLTIGSKIGKTGI ALVYDTSNFTNFKLLDGVLHAVPGTGMWECVDFYPVSTVEANGLDT SYNGPGIKHVLKASLDDDKHDYYAIGTYDPVKNKWTPDNPELDVGI GLRLDYGKYYASKTFYDPKEQRRILWGWIGETDSEAADLLKGWASV QSIPRTLLYDKETRTHVLQWPVKEIESLRIGDPLVKQVNLQPGSIELVH VDSAAQLDVEASFEVDKAALAGTIEADVGFNCSTSGGAAKRGILGPF GVVVIADQTLSELTPVYFYIAKGTGGRAETYFCADETRSSEAPGVAK QVYGSSVPVLDGEQHSMRLLVDHSIVESFAQGGRTVITSRIYPTKAIN GAARFVFNNATGASVTASLKIWSLKSADIRSFPLDQL
SEQ ID NO 7:NtINV4-T的多核苷酸序列
atgatgttatacaccggtgataccaatgattacgtgcaggtgcaaaatcttgcgtaccccgccaacttatcggat cccctcctcatcgactgggtcaagtaccggggcaacccggtcatggttccaccacccggcattggtgtcaagg actttagagacccaacgactgcttggaccggaccacaaaacgggcagtggctgcttaccatcgggtccaaga ttggtaaaacgggtattgcaattgtttatggtacttccaacttcacaaactttaagctattggatggagttttgcatgc ggttccgggtacgggtatgtgggagtgtgtggacttttacccggtatcaaccgatgaggcaaacgggttggac acatcatataacgggccaggtataaagcatgtgttaaaagcaagtttagatgacgataagcatgattactatgct attgggacatatgaccggtaaagaacaaatggactcctgataacccgcaattggatgtgggtatcgggttgag actggactacgggaaatactatgcgtcaaagacattttatgacccgaaggaacaaagaagaatattgtggggatggattggggaaactgacagtgaagctgctgatctgctgaagggatgggcatctgtacaggtatggacactttt caagtacactacctcagcttccgaagagcattacacatttatttttgtattacattagggtgccttggcgtaactctggtaaagtaagttctgaattgcaacgtgaaaatggaggtttttagatgcaaagagatgatatatccctaatagttttcctgttttaataacagagtattccaaggactgtgctttatgataaggagactaggacacatgttcttcagtggccagttaaagaaattgagagcttaagaattggtgatcctctagtgaaacgggtcaatcttcaaccaggctcaattgagctagtccatgttgactcagccgcacaggttgctttctcatccttggaaattgaaaacgtttcacttatatgtgcttaatg tgcagtcctaaaacttgtatgtgcaatggtgcagttggatgtagaagcctcatttgaagtggacaaagcagcact cgagggaacaattgaagcagatgttggtttcaactgcagtactagtggaggtgctgctaaaagaggcattttgggaccatttggtgtcgttgtaattgctgatcaaacgctttctgagctaactccagtttacttctacattgccaaaggac ctgatggccgagctgaaacctacttctgtgctgatgaaactaggtttgcttctactatgtttatcttgtatactctatct taatagtccttgtcaaagtatagatgaataacatagcggcgtgatctgatgcagatcctcagaggctcctggagt tgctaaacaagtgtatggtagttcagtaccagtgttagatgatgaacaacactcaatgagattattggtaagtgat aatcccgttattctgaccttcgtcaaatcagaataatatcaagcttattagttcttccagtcatcttattaaatttatgg aaatgctccaaagtagtcaatttggtaactattcaagataatgtggttcagaataatttgtgttatgaatgtatttgac agttgggatgatctgtgtttttgagtaaaatttcttaaaactgaactcaggtggaccactcaattgtggagagcttt gctcaaggaggaagaacagtcataacatcgcgaatttacccaacaaaggcaatcaatggagcagcacgact gttcgttttcaacaatgccacgagggcaaggtgactgcctccctgaagatttggtcactcgaatcagctgatatt cgatccttccccttggaccagttgtaa
SEQ ID NO 8:NtINV4-T的多肽序列
MATHHSHYDPENSTTHYTVLPDQPESAGSGHRKSLKVVSGILLSSFFL LSLVFVIVNQSSDLSQKNSHSSETLTPALSRGVSQGVSEKTFRDVSGG SLSYYPWTNAMLTWQRTAYHFQPQKNWMNGPLYHKGWYHLFYQY NPDSAIWGNITWGHAISTDLIHWLYLPFALVPDQWYDINGVWTGSAT FLPDGQIMMLYTGDTNDYVQVQNLAYPANLSDPLLIDWVKYRGNPV MVPPPGIGVKDFRDPTTAWTGPQNGQWLLTIGSKIGKTGIAIVYGTSN FTNFKLLDGVLHAVPGTGMWECVDFYPVSTDEANGLDTSYNGPGIK HVLKASLDDDKHDYYAIGTYDPVKNKWTPDNPQLDVGIGLRLDYGK YYASKTFYDPKEQRRILWGWIGETDSEAADLLKGWASVQSIPRTVLY DKETRTHVLQWPVKEIESLRIGDPLVKRVNLQPGSIELVHVDSAAQL DVEASFEVDKAALEGTIEADVGFNCSTSGGAAKRGILGPFGVVVIADQTLSELTPVYFYIAKGPDGRAETYFCADETRSSEAPGVAKQVYGSSVP VLDDEQHSMRLLVDHSIVESFAQGGRTVITSRIYPTKAINGAARLFVF NNATRSVTASLKIWSLESADIRSFPLDQ
SEQ ID NO 9:用于沉默NtINV4-T和NtINV4-S的核苷酸序列
ggtttcaactgcagtactagtggaggtgctgctaaaagaggcattttgggaccatttggtgtcgttgtaatt gctgatcaaacgctttctgagctaac
SEQ ID NO:10:NtSUS1-S的多核苷酸序列
atggcagctagtggtcttagcattaagaaaagtttggaggaatccattttggctcatccagatgaaattttg gctctcaagtcaaggtacattactacatataatgatattaagaactagaggcttatccaaggttttgttacatttttga aattataagtttagaacctaatagtacttggtagcacttgtttccttattatctagctgttgttactgcttgttgctactg ctttctgttcatctttccttgagcccggtctatcggaaacaacctctctattctcaaagtataaggtttgcgtacatac tacctccccagactctacttgtggaatttactgtttttgttgtgttgttgtaatctaatatttattagaattttactgattttt cacatatatatatctatgtcccctgtcgaaaattctatagctcatgttagctaaatacattagtaccattgtttttaattg ttttggttttggcacaggattgaaactgaagggaaaggggtaatgaaaccacttgatctcttgaaccatttggtttc tgttactagtaagacaaatggagtaaatattgtacctagtgcacttgtggaagttctcagttgcagccaagaagct gtgattgtaccaccaaaactagcactagctgtacgtccgaggcccggtgtatgggagtacttgtcactgaatctt aagacaaagaaagtggctgaattaagcattcctgaataccttcaattgaaagagaacactgttgatgaaaggta aagtattagtctgcgatttcgctttgtgaaattgaagtttttgttttgattcataatgttttgtgtatcaattatgttacca gtggaaacatattggagttggattttgagccatttacaacagttacaccaccaaaaacactttctgactctattggc aatggtttggagtttcttaatcgccacattgcttcgaaaatgtttcatgataaggagatttccagatgcctccttgac ttcctcagaaaccataactacaaaggaaaggtaataaaaaaaagtgtttctttaaacaagttgtatgattatgtgta tatttctaagtatgttaacttgaaaacagtcattgatggtgaaagaaagcattcaaagcctagagagtttccaactt gttctgaaaaaagcagaggaacatttgtgcacattgaatccagaaactccatactccaattttgaatcaaagtttg aagagattggcttggaaagagggtggggaaacaccgctgaacgcgtgcaagacactatcagtcatcttttgca tctccttgaggctcctaacgcgtcttctttggaaaatttccttggtagaatcccattggttttcaatgttgtgattctaa ctccacatggttattttgctcaagataatgtcttgggctatcctgacactggtggccaggtttgtgtccaatattttg cattcttgatcaagttctttataccatttgaaccaacaatcttnaacattctttttttggttgtgaaatgttgaataggtt gtttacattcttgatcaagttccagctatggagcgtgagatgcttcatcgtatgaagcttcaaggactcgatgatat catccctcgcatccttgttgtaagtggccttaattttcctagtttcatttacacctctaaatgaaattgatcttttttgttg ttttatatcaggtaacaaggctgctgcctgatgcagtaggaaccacctgtggcgagcggatggagaaagtatat ggggcagaacattctcatataattcgtgttccatttagaactgagaagggaatgttgcgcaaatggatctcacga ttcgaagtctggccatacatggaaactttcactgaggttggaacataaaaacaaataaaatccattggaatgttcc ttctgcaattgaaaatgtcttgctaactgaagacccatttttaaattgatcatcaggatgttgcagaagaacttgtcaaagaattgcaagctaaaccagacttgatcattggaaactacagtgagggaaatcttgctgcctctttgcttgcgaagaaatttggggctactcagtgtactattgctcatgccttggaaaaaactaagtatccaaactctgaccttaattggaagaagtttgatgacaagtatcatttctcaagtcagttcactgctgatctctttgccatgaatcacactgatttcatc atcaccagcactttccaagaaattgctggaaggtaaaagcaaatgcacaccatcatagtatttcatatttttaccct tgtttatactatttccattcaccgaccccgacttgtttaggattgagccatagttgttgttgttgtttgtttatactatttc catttgccgaccacaacttgtttaggactgaggtatagttgttgttgttggtttgttcatattattttcattcgctaaccc taacttgtttgggactgaggcatagtagtagtagtagttgttgctattagtttatactatttccatttgccaaccccaa cttgtttggtactgagacatagttgttgttgttgttgtttgtttatactatttccatttgccgaccccaacttgtttaggac tgaggtatagttgttgttgttggtttgttcatattattttcattcgctaaccccaacttgtttgggactgaggcatagta gtagtagtagtagttgttgctattagtttatactatttccatttgccaaccccaacttgtttggtactgagacatagttg ttgttgttgtttgtttatactatttcaatttgtcgaccccaatttgtttgggaccaaggcatggttgttgttgttgtttgttt gtttttactgtttccattgatattggaacatttgttatttgcagcaaaaacactgtaggacagtatgagagtcatactg cttttaccatgcctggattgtaccgagtagtccatggaatcgattcgtttgatccaaagttcaacattgtctcccctg gggctgatatgtcaatctacttcccttacactgagaaggagaaaaggctaaccaacttccacccggaaattgaa gaactcctctacagtcctgttgagaataaggaccacttgttagtctccttaatttgcttttatttcatcccatttatgat cgcttttatcccaacagatcgattaatcatttgttatcaacataaacagatgtgtgttgaaggaccggaacaagcc aattctctttaccatggcaaggctagatcgcgtgaagaatctaacagggctcgtggaatggtatgctaagaatg caaggctgagggagcttgttaaccttgtggttgtaggcggagacagaaggaaagaatccaaagatttagaag agcaagcagagatgaagaagatgtatgatcttatcgaaacctataacctgaacggccaattcaggtggatttctt cccaaatgaatcgtgtgaggaacggagaactctatcgttacattgcagacacgaggggtgctttcgttcaacca gcattctacgaggcttttggtttgacagttgtagagtctatgacttgtggtttgccaacttttgctacttgtaatggtg gaccatttgagattatagtgaatggaaaatctggtttccatattgatcctaatcaaggtgacaaggctgctgatatg ttggtaaatttctttgaaaaatctaaagaagatccaagttattgggatgctatttccaagggaggtctgcaacgtat tcttgaaaagtaagcttttgcatttgattagcacaagtgcacaaccaagatttaacttttgaacaaactaaaactaa cccttttttgtattttcttttgctaggtatacatggcaaatttattcacagaaagtgatcacactatctgggatttatgg attctggaagtatgcaaccaagaatgataaagttgctagtgcaaagaagcgctatcttgagatgttttatgaactt ggatttaagaaatcagtaagtgtcaattttaaaggggaaccttggatcaacggttaagttgtctttgtgcaacctat aggtcaggggtttgagccgtagaagtagccactaatatttacattagggtagactgtgtacatatcacacccctt ggggtacggccctttcctggatcctgtatgaacgcgggatgccttgtgcaccgggctgtatttttttttttagtgtc acttctgtattttgtttgagcttgtttataaagtttggaaatctgctgctaatttgtatatttgttggttgtgtatttcaggc tgagaaagttccattggctattgatgaatag
SEQ ID NO:11:NtSUS1-S的多肽序列
MAASGLSIKKSLEESILAHPDEILALKSRIETEGKGVMKPLDLLN HLVSVTSKTNGVNIVPSALVEVLSCSQEAVIVPPKLALAVRPRPGVWE YLSLNLKTKKVAELSIPEYLQLKENTVDESGNILELDFEPFTTVTPPKTLSDSIGNGLEFLNRHIASKMFHDKEISRCLLDFLRNHNYKGKSLMVKE SIQSLESFQLVLKKAEEHLCTLNPETPYSNFESKFEEIGLERGWGNTAE RVQDTISHLLHLLEAPNASSLENFLGRIPLVFNVVILTPHGYFAQDNVL GYPDTGGQVVYILDQVPAMEREMLHRMKLQGLDDIIPRILVVTRLLP DAVGTTCGERMEKVYGAEHSHIIRVPFRTEKGMLRKWISRFEVWPY METFTEDVAEELVKELQAKPDLIIGNYSEGNLAASLLAKKFGATQCTI AHALEKTKYPNSDLNWKKFDDKYHFSSQFTADLFAMNHTDFIITSTF QEIAGSKNTVGQYESHTAFTMPGLYRVVHGIDSFDPKFNIVSPGADM SIYFPYTEKEKRLTNFHPEIEELLYSPVENKDHLCVLKDRNKPILFTMA RLDRVKNLTGLVEWYAKNARLRELVNLVVVGGDRRKESKDLEEQA EMKKMYDLIETYNLNGQFRWISSQMNRVRNGELYRYIADTRGAFVQPAFYEAFGLTVVESMTCGLPTFATCNGGPFEIIVNGKSGFHIDPNQGD KAADMLVNFFEKSKEDPSYWDAISKGGLQRILEKYTWQIYSQKVITL SGIYGFWKYATKNDKVASAKKRYLEMFYELGFKKSAEKVPLAIDE
SEQ ID NO:12:NtSUS1-T的多核苷酸序列
atggcaggcagtggtcttagcattaaggaaagtttggaggaatccattttggctcatccagatgaaatttt ggctctcaagtcaaggtacattactgcataatgatattaagacctagaagcggatccaagattttgttacatttttg aaattataagtttagaatctaatatttgttatcgcttgtttccttattatcttgctgttgttactgcctgttgctactagtttc tgttcatccttccttgagctgagtttctatcggaaacaacctctctactctcaaagtaggaataagttatgcgtacac actaccctccccagactccacttgtgtaatttactgagtttgttgttgttgttgttgtaatctaatacttgttagaatttta ctgatttttcacatatatatctatgacccatgtcgaaaatactatagctcatgtgctaaatacattagtaccattgtttt gtaattgttttggttttggaacaggattgaaactgaagggaaaggggtaatgaaaccagttgatctcttgaaccat ttggtttctgttactagtaaaacaaatggagtaaatgttgtacctagtgcacttgtggaagttctcagttgcagcca agaagctgtgattgtaccaccaaaactagcactagctgtacgtccgaggcccggtgtatgggagtacttgtcac tgaatcttaagacaaagaaagtggctgaattgagcattcctgagtaccttcaattgaaagagaatactgttgatga aaggtaaagtaatagtctgcgatttcgctttgtgaaattgaagttttttgtttgattcttaatgttttgtgtatcaattatg ttaccagtggaaacatcttggagttggattttgagccatttacaactgttacaacaccaaaaacactttctgactct attggcaatggtttggagtttcttaatcgccacattgcttcgaaaatgtttcttgataaggagattgccaagtgcctc cttgactttctcagaaaccataactacaaaggaaaggtagtaaaaaaagtgtttctttaaacaagttgtatgattat gtgtgtatttctaaatatgtcaatttgaaaacagtcattgatggtgaaagaaagcattcaaagcctggagagtttcc aacttgttctgaaaaaagcagaggaatatttgcacacactgaatccagaaactccatactccaaatttgaatcca agtttgaagagattggcttggaaagagggtggggaaacaccgctgaacgcgtgcaagacaccattagtcatct tttgcatctccttgaggctcctaacgcgtcttccttggaaaatttccttggtagaatcccattggttttcaatgttgtg attctcaccccacatggttattttgctcaagataatgtcttgggctatcctgacactggtggccaggtttgtgtccg atataacatatcaagaaattttgcattcttgatcatgttctttataccatttgaaccaacattctttttttggttgtgaaat gttgaataggttgtttacattcttgatcaagttccagctatggagcgtgagatgcttcatcgtatgaagcttcaagg actcgacgatatcatccctcgcatccttgttgtaagtgcccttaattttcctggtttggtttacctctaaatgaaattg attttctggctttctaacttttttggattgatctttttgttgttttatatcaggtaactaggctgctgcctgatgctgtagg aaccacttgtggcgagtggatggagaaagtatatggggcagaacattctcatataattcgtgttccatttagaact gagaaaggaatgttgcgcaaatggatctcacgattcgaagtctggccatacatggaaactttcactgaggttgg aacataaaaacaaataaaaatcattggaatgttcttctgcatttgaaaatgtcttgctaactaaagactcatttttaaattaatcatcaggatgttgcagaagaacttgtcaaagaattgcaagctaaaccagacttgataattggaaactacagtgagggaaatcttgctgcctcattgcttgctaagaaatttggggctactcagtgtactattgctcatgccttggaaaaaactaagtatccaaactctgaccttaattggaagaagtttgatgacaagtatcatttctcaagtcagttcactgctgatctttttgccatgaatcacactgatttcattatcaccagcactttccaagaaattgctggaaggtaaaagcaaatgcacaccatcatagtatttcatatttttaccctagtttatactatttccatttgtcaactccaacttgtttgggattgaa ccatagttgttgtttgtttatactatttccattcgccgaccccaacttatttgggactgagacataattgttgttattatt gtttgtttgtttatactatttccattctcagaccccaacttctttgggactgagccgtagattgttgttgttgttgttgttg ttgtttgtttatgctatttccgttcaccgaccccaacttatttgggactgaggtgtagaagtagtcgttgttgtttgttta tacgacttccaattgatattcgaatgtttttatttttgcagcaagaacactgtaggacagtatgagagtcatactgct tttaccatgcctggattgtatcgagtagtccatggaatcaattcgtttgatccaaagttcaacattgtctcccctggg gctgatatgtcaatctacttcccttacactgagaaggagaaaagactaaccaacttccacccggaaattgaaga actcctctacagtcctgttgagaataaggaccacttgttagtcttctttatttcattcatttttctacaccttttttttcaac agattgattgattggttcttatcaacgtaaacagatgtgtgttgaaggaccagaacaagccaattctctttaccatg gcaaggctagatcgcgtgaagaatctaacagggctcgtggaatggtatgcaaagaatgcaaggctaaggga gctcgttaaccttgtggttgtaggcggagacagaaggaaagaatccaaagatttagaagagcaagcagagat gaagaagatgtatgatcttatcgaaacatacaacctgaatggccaattcaggtggatttcttcccaaatgaatcgt gtgaggaacggagaactttatcgatacattgcagacacgaggggtgctttcgttcaaccagcattttatgaggc atttggtttgacagttgttgagtctatgacttgtggtttgccaacttttgctacttgtaatggtggaccatttgagatta tagtgaatggaaaatctggtttccatattgatcctaatcaaggtgacaaggctgctgatatgttggttaatttcttcg aaaaatctaaagaagatccaagttattgggatactatttccaagggtggtctgcagcgtattcttgaaaagtaagc ttttgcatttgattagcacaagtgtacaaccaagatttaacttatgaacaaactaaaactaaccctttttttattttctttt gctaggtatacatggcaaatttattcacagaaagtgatcacattatctgggatttatggattctggaaatatgcaac caagaatgacaaagttgctagtgcgaagaagcgctatcttgaaatgttttatgaatttgggtttaagaaatcagta agtgtcacttctgtattttgtttgagcttgtttgtaaagtttggcaatcttctgctaatttgtactatatttgttgacttgtg catttcaggctgagaaagttccattggctattgatgaatag
SEQ ID NO:13:NtSUS1-T的多肽序列
MAGSGLSIKESLEESILAHPDEILALKSRIETEGKGVMKPVDLLN HLVSVTSKTNGVNVVPSALVEVLSCSQEAVIVPPKLALAVRPRPGVW EYLSLNLKTKKVAELSIPEYLQLKENTVDESGNILELDFEPFTTVTTPKTLSDSIGNGLEFLNRHIASKMFLDKEIAKCLLDFLRNHNYKGKSLMV KESIQSLESFQLVLKKAEEYLHTLNPETPYSKFESKFEEIGLERGWGNT AERVQDTISHLLHLLEAPNASSLENFLGRIPLVFNVVILTPHGYFAQDN VLGYPDTGGQVVYILDQVPAMEREMLHRMKLQGLDDIIPRILVVTRL LPDAVGTTCGEWMEKVYGAEHSHIIRVPFRTEKGMLRKWISRFEVW PYMETFTEDVAEELVKELQAKPDLIIGNYSEGNLAASLLAKKFGATQ CTIAHALEKTKYPNSDLNWKKFDDKYHFSSQFTADLFAMNHTDFIITS TFQEIAGSKNTVGQYESHTAFTMPGLYRVVHGINSFDPKFNIVSPGAD MSIYFPYTEKEKRLTNFHPEIEELLYSPVENKDHLCVLKDQNKPILFT MARLDRVKNLTGLVEWYAKNARLRELVNLVVVGGDRRKESKDLEE QAEMKKMYDLIETYNLNGQFRWISSQMNRVRNGELYRYIADTRGAF VQPAFYEAFGLTVVESMTCGLPTFATCNGGPFEIIVNGKSGFHIDPNQ GDKAADMLVNFFEKSKEDPSYWDTISKGGLQRILEKYTWQIYSQKVI TLSGIYGFWKYATKNDKVASAKKRYLEMFYEFGFKKSAEKVPLAIDE
SEQ ID NO:14:NtSUS2-S的多核苷酸序列
atggctgaacgtgctctgactcgtgttcacagccttcgtgaacgtcttgatgccactttggctgcacatcg caatgagatattgctgtttctttcaaggtattgcctaagtagtgttcttgtttcctacaaaagattcagttggtgttcaa aaaacgatatgtgatttgatttatctgcctaagtcttggtagtcataattatccggtacctgtgctggtgcgagttag ctggttcggaaactactcttatgaaaacgagagatttagttggtgttgtctgcaattctgtagtatggactattaagc agatagatcatgtttgatatcgaaaaggaatgtatatgtgatgttacttgaactggttttggttattacaggattgaa agccatggaaaagggatcttgaaacctcaccagctattggctgagttcgatgcaattcgccaagatgacaaaa agaagctgaatgatcatgcatttgaagaactcctgaaatctactcaggtaattttgattttggctaaatgtgttacca agctgaatgatcatgcatttgagtttgtgtccgactactacaatgatatgttataccaggaagcgattgttctgcca ccttgggttgcacttgccattcgtttgaggcctggtgtgtgggaatatgtccgtgtgaatgttaatgctctagtcgtt gaggagctgaccgtccctgagtatttgcattttaaggaagaacttgttgatggaacgtaagttttagtctcttatttg atactatgttagagaataggcagtggattcaatttatcagtgttgttttttacctaatgcagctccaatggaaatttcg ttctcgagttggattttgagcccttcactgcatcctttcctaaaccgaccctcaccaaatctattgggaatggagtt gaattcctcaataggcacctttctgcgaaaatgttccatgacaaggaaagcatgaccccgcttcttgaatttcttc gggttcacaattataagggcaaggtaactttgttattcccattcatatatatgttcagtttgtgcttatcatgcgccca atgatgtatgaatatgtactaaaggatagatgtacgatttcgtttgcagacaatgatgctgaatgacagaatacag aatttaaccactctgcaaaatgtcctaaggaaggcagaggaataccttattatgcttccccctgaaactccattttc cgaattcgaacacaagttccaagaaattggattggagaagggatggggcgacactgcggagcgcgtgctag agatgatatgcatgcttcttgatctacttgaggctcccgactcctgtactcttgagaagttcctagggagaattcct atggtgttcaacgtggttatcctttccccccatggatatttcgcccaggaaaatgtcttgggttatcccgacactgg tggccaggtgcattactttagtctttgtccgtgagtctatgttgctcagatcctctacaatgccactgtacccgtgta ggatactccaaatataatgcatttttggaggatctgtcaccggtgcaatggcattttggaggtcggagcaacaaa caactgctagtatgcttctaaagcttgcttccataaatgctaaggtccttcacccgtaatgtgcaggttgtctacat attagatcaagttccagccttggagcgtgaaatgcttaaacgcctaaaggagcaaggacttgatataacaccgc gtattcttattgttagtatttcttgtacttgtaattgctgcggattacacaaaattttctctttattggcaacttatcttgat attattcccaggttactcgtctgctgcctgatgcagttggaacaacttgtggtcagcggcttgagaaggtgtatgg agccgagcactcacatattcttagggtcccctttaggaccgagaagggcattgttcgcaaatggatatctcgctt tgaagtgtggccatacatggagactttcactgaggtgacactaagcttccttgtatttgtctatcttctaattggtatt aggaacaatttgctaattattaacgctttggcttttcgtacatcaggatgttgcaaaagaacttgctgcagaactgc aggccaagccagatttgataattggcaactatagcgagggaaatcttgtggcttcattgctggctcacaagttag gcgtaacgcaggtctgtgttatttttcacctcttataaatctgattgtatttccattagtctggaactaaaagtactaa aattttcttttcttcgctgtgttatttgccttctgcagtgcaccattgcccatgcattggagaaaacaaagtatcctga ttctgacatctactggaaaaaatttgacgaaaaataccatttctcgtcccagtttaccgctgatcttattgcaatgaa tcacaccgattttatcatcaccagcactttccaggagatagcaggaaggtataacatcaattgctaattcggttgc agtaacattttgttcgatttcttccccttatgcttaacctaataccctaatgaattttccagcaaggacactgtcggacagtacgagagtcaccaggcattcacaatgcctggattgtacagagtcgttcacggcattgatgtgttcgatcccaaattcaacattgtctcacctggagctgatataaacctgtatttcccatattccgagaaggaaaagagattgacagcacttcacccagaaattgaggagcttctgtacagtgatgttgagaacgaggaacatctgtaagtttctaacttactcgtaccgtcagtggcagagccagaattttcattaaaatggggtcaaaatataaagacataaattcacaaagaagc caaggggtgtcaatatgtagtataaatatattaaaaaaattacctagctacacaatgtaattttccgacaaaggggtatcggttgcacttcttgaatacatgtggctctgccactgggtacagttacaaagtcctgttacctatgtagatgagcttgtgctgaacatgttgtgattttggtaggtgtgtgctaaaggacaggaataagccaatcttattcacaatggcgagattggatcgtgtgaagaacttaaccggacttgttgagtggtacgccaagaacgcacggctaagggagttgg ttaaccttgttgtcgttggtggagaccgaaggaaggaatccaaagatttggaagagcaagcagagatgaagaa gatgtatgagctaataaagactcacaacttaaatggccaattcagatggatttcttcacagatgaaccgagtaag gaacggcgaactctaccgatacattgccgacactaggggagctttcgtgcagcctgcattctatgaggctttcg gtttgactgttgttgaggccatgacctgtggtttgcctacatttgcaactaatcatggcggtccagctgagatcatc gttaacggaaaatccggcttccatatcgatccatatcacggtgagcaagctgctgatctgctagctgatttctttg agaaatgtaagacggaaccttctcattgggaaactatttcaaccggtggcctgaagcgcatccaagagaagta agcaactctttcttgactctagtcattcaaattaacttgggatttgaggcatagttgattgataatttatcgcgtctctactactatatacaggtacacgtggcaaatctactcggagagattattgacgttggctgctgtttacggtttctggaaacatgtttctaagcttgatcgtctagaaatccgtcgatatctagaaatgttttatgctctcaaataccggaagatggt gagttcttctgcttcctgctcttctcatagtgtttaatatacacttgattgattgcattcacttagactaagttgctcgg acacgggtgtggatgtccgacacgagtgcggatctagagttcagatccttcaagatgtaaattataagattcgg ggatatggatcctagtacggatacgggtgcgagaatccggctaaaaataattttaaaaaaaattatctctaaatta tgagatattatgtggaatacttacgtataacttgtaaagtgtagattttttttaattctcaagttgtagattagtaaatga ttgatttcctagataagtatgctattttcttcaaatttactcttctgatttcgaaaatcaaattgtatctcgtctcgaatttt tccgtccgttatggtcaaagtacccaaaatcgtttgaccaaatcggtacggatcccatacccacacccacacta gtgtcgtattgacacgggtgccgcacctaaactgctatgtcggagcaacttagcacttagagaatcattgatgtt aaattttcttaattcttgaatctgctaatgaagattttatcttggtttttgtttaggctgaagctgttccattggctgctga atga
SEQ ID NO:15:NtSUS2-S的多肽序列
MAERALTRVHSLRERLDATLAAHRNEILLFLSRIESHGKGILKPH QLLAEFDAIRQDDKKKLNDHAFEELLKSTQEAIVLPPWVALAIRLRPG VWEYVRVNVNALVVEELTVPEYLHFKEELVDGTSNGNFVLELDFEPF TASFPKPTLTKSIGNGVEFLNRHLSAKMFHDKESMTPLLEFLRVHNY KGKTMMLNDRIQNLTTLQNVLRKAEEYLIMLPPETPFSEFEHKFQEIG LEKGWGDTAERVLEMICMLLDLLEAPDSCTLEKFLGRIPMVFNVVIL SPHGYFAQENVLGYPDTGGQVVYILDQVPALEREMLKRLKEQGLDIT PRILIVTRLLPDAVGTTCGQRLEKVYGAEHSHILRVPFRTEKGIVRKWI SRFEVWPYMETFTEDVAKELAAELQAKPDLIIGNYSEGNLVASLLAH KLGVTQCTIAHALEKTKYPDSDIYWKKFDEKYHFSSQFTADLIAMNH TDFIITSTFQEIAGSKDTVGQYESHQAFTMPGLYRVVHGIDVFDPKFNI VSPGADINLYFPYSEKEKRLTALHPEIEELLYSDVENEEHLCVLKDRN KPILFTMARLDRVKNLTGLVEWYAKNARLRELVNLVVVGGDRRKES KDLEEQAEMKKMYELIKTHNLNGQFRWISSQMNRVRNGELYRYIAD TRGAFVQPAFYEAFGLTVVEAMTCGLPTFATNHGGPAEIIVNGKSGF HIDPYHGEQAADLLADFFEKCKTEPSHWETISTGGLKRIQEKYTWQIY SERLLTLAAVYGFWKHVSKLDRLEIRRYLEMFYALKYRKMAEAVPL AAE
SEQ ID NO:16:NtSUS2-T的多核苷酸序列
atgctttttatgggagtaaattttatggccggtcattcaactttgtgttcattacgcaaaagtcatttttcttggt gtttattacgcaagtcatttttcttttttttttgttacgtaaaaatcattcaactatgtgtttattatctaaaattcaatttttttt ttccttttgttacacaaaaatcattttactttactctatttatcacaaaagtcaccttggccagattttataataggctttt atcttttgttacacaaaaattattttactttactctatttatcacaaaagtcaccttggccagattttataataggctttta tcttttgttacacaaaaattattttactttactctatttatcacaaaagtcaccttggccagattttacaatacttttacctt aaaagactattatgcccttgacattataaatcctctcatttatataataccttctatatgatacactatataatatattttt acctaggtattttacttataattaaaataatattaaattattttatttatctattttataatatattcatacatttaattttttcat ggcaaatcactttgtttaatcatatttaaacatgaacaaattttaaatatcaaaaaaataaaaaaataaaaaaaatat ttatttgaaataataacaaacagatttgtttaacaaatgatagtttttttttatagtcaataaaatttttaaaaaaattcaa agatatttgtttttaatattaatatttttaaagctttatctgttaatattatttatttgaaagtattaatctgatgtgtcattgt gttaaatgtgagtattttatttattggattaatgagtatggcttggctgataaaaagctttgattttataattttcattaaa aatattttattaagctagtacctgacaaatttaatatcttgaaaattaacgttaagaaaaaattaaatataaaaatatat tataaaaataataaataaataatatcaagttattttaattataaataaaatacatggttaaaaatatattatatagcatat aatatagaaggtattacataaatgagatgatttaaagggcataatagacttttcaggtgaatgatttgtaaaatatg gttaaagtgattattgtgataattagagcatagtaaaataatttttatgtaacaaaagaaaaaaaaaatgacttttgg gtaatgaacataaatttgaataacttttacgtaacaaaagaataaaataaattttggataataaacataaaattgaat gaccacctataaaatttattatttttttgggctcttcttgatttgattttttagtttagcctttgcagtaatcttggttgtcac gcgtagcgttgtgctttcgccacataagtatttagtagacttaattaatgtcattatatcggttggtgtggttttaatta cttaactgtactattatattaggtggaaggtttgaaaatttatagtagtaacattctagatcattgaaaatattggtgtt tcagtgactttttagtatgtcattttcattttctaagtggttgtactaatatagtatattaaaattttgattggttgagaaa caatctctctcacctacacggtacgggtaaggtatgcgtatacgcttatcctccctacactccatttgtgggactat tgttgttattttggataagctgaggtatccatcttctactaactgcactagtttattttttttgctgtttacagttgaaaca attgtctgaggatttctcacctgctgaatcaactgcaatggctgaacgtgtgctgactcgtgttcacagccttcgt gaacgtcttgatgctactttggctgctcatcgcaatgagatattactgtttctttcaaggtatagccaaagatagtat tcttgttaactaaaaaagattcagttggtgttcaaaaaacgatacgtttatctgcctaagtcttggtagtcagaattat ccggtacctatgctggtgtgagttagctggctaggaaaccactcttatgaaaacaagagatttagttagagttgtctgtaattctgtagtatggactatgtatgtgatgctatttgaactggttttggttattataggattgaaagccatggaaa agggatcttgaaaccgcatcagctattggctgagtttgatgcaattcgccaagatgacaaaaagaaactgaatg atcatgcatttgaagaactcctgaagtccactcaggtaatatggttttggctatatttgtcgccaacgccaagctca tatttttatattattttgagcttgtgtctgaatacgacgatgatatgttatactaggaagcaattgttctgccaccttgg gttgcacttgcgattcgtttgaggcctggtgtgtgggaatatgtccgtgtgaatgtcaatgcgctagtcgttgagg agctgactgtccctgagtatttgcatttcaaggaagaacttgtcgatggaacgtaagtgttagtcttcaatttgatg ctatgttagagaataggctgtggaatttattgatcaatgctgtgctttgtcctgatacagctccaatggaaatttcgt tctcgagttggattttgagcccttcaccgcatcctttcctaaaccaaccctcaccaaatctatcggaaatggagtt gaattcctcaataggcacctctctgcgaaaatgttccatgacaaggaaagcatgaccccgcttcttgaatttcttc gggttcacaattataagggcaaggtgacttgctatttccatttatctataggttcggtttgtgcttatcatgcgccca atgacatatgaatatgcgctaaaggatagatatatgatttcctttgcagacaatgatgctgaacgacagaataca gaatttaaccacactgcaaaatgtcctaaggaaggcagaggaatacctcattatgcttccccctgaaactccatt ttccgaattcgaacacaagttccaagaaattggattggagaagggatggggcgacactgcagagcgcgtgct ggagatgatatgcatgcttcttgatctcctcgaggctcccgattcctgtactcttgagaagttcttggggagaattc ctatggtgttcaatgtggttatcctttccccccacggatatttcgcccaggaaaatgtcttgggttatcccgacact ggtggccaggtgcattactttaatctttatccgtgagtctatgtttgttcgaatcctctagaaatgtcactgtacctat gtaggatactccaaatataatgcattttggggggatctgttatgggtgcgatggcatttttggaggtcggagcaa caaacaattgctatgtattcttctaaagcttgctttcataaatgctaaggtccttcacccttaatgtgcaggttgtctat atattagatcaagttccagccttggagcgtgaaatgcttaagcgcctaaaggagcaaggacttgatatcacacc gcgtattcttattgttagtatttcctgtacttgtaattactgcggattacacaaaatttcctttttatcttcttaacaactta tcttgatggtattcccaggttactcgtctgctacctgatgcagttggaacgacttgtggtcagcggcttgagaagg tgtatggagccgagcactcacatattctgagggtcccctttaggactgagaagggcattgttcgtaaatggatct ctcgctttgaagtgtggccatatatggagactttcactgaggtgacactaaaacttccttatatttgtctatcttctaa ttggtattaggaataatttgttaattgttaactctttgtcttttcgtacatcaggatgtcgcaaaagaacttgctgcag aattgcaggccaagccagatttgataataggcaactatagcgagggaaatcttgtggcttcattgctcgctcata agttaggcgtaacacaggtctgtgttgtttttcactctcttaaagatctgattgcatttccattagtctggaactagaa gtactaaaaagttcttttcttcactgtgttatttgccgtcggcagtgcaccatagctcatgcattggagaaaacaaa gtatcctgattctgacatctactggaaaaaattcgatgaaaaataccatttctcgtcccagtttaccgctgatcttatt gcaatgaatcacaccgattttatcatcaccagcactttccaggagatagcaggaaggtataacatcaatttgcta cttcgactgcaacagcattgtgttcccatttctttcccttatgcttaacctaataccgtcatgaattttccagcaagga cactgtcggacagtacgagagtcatcaggcattcacaatgcccggattgtacagagttgttcacggcattgatg tgttcgaccccaaattcaacattgtctcacctggagctgacataaacctctatttcccatattccgagaaggaaaa gagactgacagcacttcaccctgaaatcgaggagctgctgtacagtgacattgagaacgaggaacatctgtaa gtttctaccttactcgtacagtcagtggcggagccagaattttcactaaaataaggtcaaaatataaagacataaa tccacaaagaagccaagggtgtcaatatatagtataaatacattaaaaaaattacctatctacacagtgtaattttc cgacaaaggggtgtcggttgacactccttgaatacatgtggctctgccactgggtacagttacaaagttctgtta cctatgtagatgagcttgtgctgaacatgttgtgattttggcaggtgtgtgctaaaggacaggaataagccaatct tattcacaatggcgagattggatcgtgtgaagaatttaaccggacttgttgagtggtatgccaagaacgcacgg ctaagggagttggttaaccttgttgtggttggtggagatcgaaggaaagaatccaaagatttggaagagcaaac agaaatgaaaaagatgtatgagctaataaagactcacaatttaaatggccaattcagatggatttcttcacagatg aaccgagtgaggaacggtgaactctaccgatacattgctgacactagaggagctttcgtgcagcctgcattcta cgaggctttcggtttgactgttgttgaggccatgacctgtggtttgcctacatttgcaactaatcatggcggtcca gctgagatcatcgttaacggaaaatctggcttccacatcgatccatatcacggtgagcaagctgctgatctgcta gctgatttctttgagaaatgtaagacagaaccttctcattgggaaaccatttcaacgggtggcctgaagcgcatc caagagaagtaagcaactctttcttgactctagtcattgaaattaactttcttgactctagtcattgaaattaactcg ggatttgaggcgtagttgattgatattttatcgcgtctctactactgatatatacaggtacacgtggcaaatctactc ggagaggctattgacattggctgctgtttacgggttctggaaacatgtttctaagcttgatcgtctagaaatccgtc gatatcttgaaatgttttatgctctcaaataccgcaagatggtgagttcctcttcttccttgcccttctcctagtgttta agatacaatataattgattgcattatcttagagaatcattaatgttaaattttcttaattcttgaatctgttaatgaagttt ttctcttggtttttgtttaggctgaagctgttccattggctgctgagtga
SEQ ID NO:17:NtSUS2-T的多肽序列
MLFMGLKQLSEDFSPAESTAMAERVLTRVHSLRERLDATLAAH RNEILLFLSRIESHGKGILKPHQLLAEFDAIRQDDKKKLNDHAFEELLK STQEAIVLPPWVALAIRLRPGVWEYVRVNVNALVVEELTVPEYLHFK EELVDGTSNGNFVLELDFEPFTASFPKPTLTKSIGNGVEFLNRHLSAK MFHDKESMTPLLEFLRVHNYKGKTMMLNDRIQNLTTLQNVLRKAEE YLIMLPPETPFSEFEHKFQEIGLEKGWGDTAERVLEMICMLLDLLEAP DSCTLEKFLGRIPMVFNVVILSPHGYFAQENVLGYPDTGGQVVYILD QVPALEREMLKRLKEQGLDITPRILIVTRLLPDAVGTTCGQRLEKVYG AEHSHILRVPFRTEKGIVRKWISRFEVWPYMETFTEDVAKELAAELQ AKPDLIIGNYSEGNLVASLLAHKLGVTQCTIAHALEKTKYPDSDIYW KKFDEKYHFSSQFTADLIAMNHTDFIITSTFQEIAGSKDTVGQYESHQ AFTMPGLYRVVHGIDVFDPKFNIVSPGADINLYFPYSEKEKRLTALHP EIEELLYSDIENEEHLCVLKDRNKPILFTMARLDRVKNLTGLVEWYA KNARLRELVNLVVVGGDRRKESKDLEEQTEMKKMYELIKTHNLNG QFRWISSQMNRVRNGELYRYIADTRGAFVQPAFYEAFGLTVVEAMT CGLPTFATNHGGPAEIIVNGKSGFHIDPYHGEQAADLLADFFEKCKTE PSHWETISTGGLKRIQEKYTWQIYSERLLTLAAVYGFWKHVSKLDRLEIRRYLEMFYALKYRKMAEAVPLAAE
SEQ ID NO:18:NtSUS3-S的多核苷酸序列
atggcgaatccaaagttcacaagagtacctagcatgagggagagagttgaggatactctctctgctcaccgtaaccagcttgttgctctcctctccaggtatattaataaactctatatacttgttattttctttatttttttgtctttactg ataaatttaactgttttcttctttaaatcttgctttcgatgcatgatttctgttgtgttaaattgcgtaaccattttatctaaa agtttatgctgataaacacttttaaattttaatatgtaaattatattatgtctcaacatcaacatgtggatggccaaaa atataaagcttaattttcgttattttgaatgatttttctctgcgagtgttacggtttgcgtacacattacctaaacctcct ccctagtccccacttgtgggaatttaattttttttttctttgtttttttttgttgttgttgttgtctgagttcaattcctaccat gttagcttggcaaaaataagttggtaaagcttgaccccaactagttttagttgatcgatttatttggtgatttatagtt caataataataattactattagagaaagttccagcagcttttctgtttgtttttccagttttagtgattgatatatgtgtat atatattctttgtttcttttaagatacgtggcgcaggggaaggggatattgcaacctcaccacttgatcgatgagtt caacaacgctgtatgtgatgacactgcttgtgagaagctcaaagatggtccctttagtgaagtcttgaaagctac tcaggtatattcactaatccatgggaatcaagatgatactgtatatctttattatggtgtctttcagaaatttgacgat gatgaaatgcaacttttctctgtttgtcaccttatccagactgtttttttattttttatttttcattttttaacttgaaatgctct taatttcctttgtttatcgataagaccggatttacaatgtatgaacggagcatcttaagaaccttctggaatgaagat ataagatataaaacatggtgtccgttttctcctttgtggaatcagtgtacatatagactgttattttggtcccactttct ggatcttctgatcacaccttctcatgcagaggcgagcttgatggtttcaacctttaaattcttactattgaatccatttcactttcgaaattatgagttcgaaatctaatatttgttgaaatttttgcaaatgttcacatataagtttaagctttgtgtc aagaatactgggctcaatggattccaatagaccaggctgtatccgcctctgtctccactctccctgcatccacttc tttcgtgtgactaataatgcttaatgagctagaactcgttttaatgtttgaataagttgcttatatcagagcagcttttg atgtttcaatctttaacgggttatgcagtaccagcattctgcggctgaaaaacaggaatctgagatttacttgtctct ggctgaatttcttgttcattttgctaacaagtactttggagttaatgcttgctctctgttgtcaaaataggaagccatt gtgctgccaccatttgttgccatagcagttcgtccaaggccaggtgtttgggagtatgttcgtgttaatgtatatga tttgagcgttgaacaattgactgttcctgaatatcttcatttcaaggaagaacttgtggatggagagtaagctctttc ttatttcaatacgaaacataaaaatttacagaagttgaataattaacaaatttgttgatttttaatgtatgccaggggt aataatcactttgtgcttgagctggattttgagccatttaatgcatcagttcctcgtccatctcgatcgtcatccattg gcaatggagtccaattcctcaatcgtcatctttcctcaattatgtttcgcagcaaagactctctggaccccttacttg atttccttagaggacactgtcataaagggaatgtaagtaccaaaagcagttttccctttgtaaatgtctgcttgtcc ctgattatctactaaatctttcaacacgcgcaaccattataagaaatgtacaatacttctagttagaatttcatcatcg acaaactatctgctttactttttatttttcccatttgatggatgatagtttagtttatataacagatgatattttggttgaa gggtaccatgaactttttcacaaccacttaatggatacatagttgtaatagttgacattttggaataatattgtctcac ttggaaatgtttaagaagtattactacttctatttgtaagatggattgtttatctatgcaggtcttgatgttgaatgatc gtatacagcgaatctccaggctggagtctgctctttctaaagcagaggattatctctccaagctatcaccagata catcctataatgagttcgaatacgcgtgagcttgtacacatttgttttgttttctttcaagcatatgtaatttctcaaga aaagggaaatctataggagttgaaacattctttatggaaccatgtgcatgcagattgcaagaaatgggctttgag agaggttggggtgatactgccagacgtgttttggagacgatgcatcttctttctgacattcttcaggctccggatc catcaaccttggagacatttcttggtagactacctatggtgttcaatgtcgtcatattatcccctcatggatattttgg ccaagcaaatgtcttgggtttgcccgacactggtggccaggtaataacaaggagaatgaggtcttgtattatgta ctccctccgttccaatctatatgaacctatttgactgggtatggaaagaaatgaagacttgtaaaacttgtggttctt tagaaattccaaacattacatttggttttttccctcttcctggaaattatactactgaatcatctctagatgttccagtttaacttgagacgtaagggtaaataacggaccattactctgtcctttcttgcagtaggcttggtacaatgaatatagttcgcatagttgccggaagctagagctgtgttagaaaactcaggaacattaatttggcgatgctaatcactgctaatgttactgaagcatccatggttttccttgatgttattctccttttggttgcttcacaggttgtctatatactggatcaagt gcgtgccttggaggccgaaatgcttcttagaataaagcaacaaggacttaacttcaagcctagaatccttgtcgt gagtacatatatattatgcaagctcttatttggtttgtgggattgcagttgacatcaatttgcttactctgattactaaa ggtcacacggctgatacctgatgctaaaggaaccatgtgcaaccagaggttggagaggattagtggaactga atactcgcatattttacgtgtcccttttaggacagagaagggaatccttcataaatggatatctaggtttgatgtatg gccttacctggagaagttcactgaggtaacctctttgtcccttggaaattgccttttgttgctgatgtttctgctagtg tgcttaaatgacggatgttaactagtcacttgctagcgtttgcaatagcaacgggaaaagaaaggatttttgctag tttgaagtctgcctccaagaaaaattatattaaaagtttatggctagtggaaacatcagtcattcatgtaccttatttc tatgcccaagttgtttaagttgaaagtaatttggccaactatgcaaattgggagaacgtgtagccaactattgtgtt tgccgacatgttgatatactttttggtcctgatttatatttgttggtttgtcatactggatgaagcaattctcatgtttttc tgcttatatatattggaagaagagatacttgtcgtttcatcatttttctcgacctctctattaccaacactttgccaattt aatgtttggaaatgtcttcttgaccaggatgtggcaagtgaaatgaccgctgagctccagggaaagccagatct gattattggcaactacagtgatggaaatttagttgcctcccttttggcatataaaatgggtgtcacacaggtagga aatacatgattctttatcttgctagcactaagtcttgaggttatgtatctgcaatagaaattttacgctttgccttcattt ctttttaattatttttccagtgtaccattgctcatgccttggaaaaaacaaagtatcctgattctgacatctactggaa aaagtttgaggagaaatatcatttttcatgtcagtttactgctgatctactggcaatgaataattcagatttcattatc accagtacttatcaagagattgcaggaacgtaagtcattttaatctggtcgtttaaatctgatatttcttccctagtag tctattcaatccgaatttcagttcagtatatgatgtcatcggttgaggaactgtgattggtaaccttatcaaatccgt agctgctctataattttatttcgtaattggagaaacaattttttattattgagcttgtagtctgagctagaatttggttctt tatctatcaagtagcataatactacaactattttttatgtgtggcaatttgcaatttcaattttctatttctataagttgca gcttttcttcctgttctgatcatatttacatggctgaaactcaatagaaaactaggctagttgatcaaaagtagttgg atgctttaaaattagtagacgttttgctaaatgagtgaccaatgttattaaaaaaacgttcatgttttcaacccttttggcatacatttgaccactgcccaagattttggataagtacatgcagtgcttataattataaagcattttatcccacctt gtttttcattatgaaaattaagtaatttacgagtatttgtataagttacttcataaattagaagtaaatctggattgtgta aagttattcgccccgtatatactgaaagctacttgaacaagcaaaaaaacagacaaacgtaacattctccatgg attaatgagacttgtatatatatatatatatatatgtaaagagagagagagagagatttggcttgtaaccacatgtat attatgccatatggatgtgacattgatgtgactagacctaaatgttttgtttcaatgtccacgggagttttacgtaga gttaagaggagaagagagtgaggaatactaatgtttgatggtaccccttggcttcttgacctggatactcagtgtt cttattcatgcctatactttggtccttgatttcattctcccttttctagcttgagctgcatcaaagaaattccactgtaaa aaaaataatgctcaccatattggtgcaacatggcaaacatgtatcctatttgatgatcaatcaactttatttttctcct gttaattgacctcagtgtgtaactctctatgtatgatagcattgtaacttgtgtcatgattcataaatagggtactaga attggatggttgacatagtaaatggtcaattgatgatccacaaaatatgcacctactgattaaaatgtgatagggc aggtttatttttgtttgtggttaacacagtacttaaccctatatttaatacaatttggcttatctacaatcttttcttcagtg tttatgcgaattccttattgcacaacaatattgtctttctgagttctattctgttgttgcttacacttttattattccagtaa catagatgtgaagacattagattggttgcttgcaaattgatagccacttgtttcaggaagaatactgttggtcagta cgagagccatactgcattcaccctcccgggactatatcgcgtcgttcatggcattgatgttttcgatcccaaattc aatatagtgtctcctggagctgacatgacaatttatttcccatattctgacaaggaaaaaagactaacgtctttgca tggctcgattgaaaagttgttatttgatcctgcgcagaatgaagagcatatgtaagtggcatccgtttgtacttaatt tttttggaatagatgacatattatttgcatgaatatgaaaaggagggtctgatatgattttctatagataaactacca atgatattatttaaaaactcctggatactgtattaggagaagaagagaaccaggggtagatggcattagaatccc ttaaatcttgaagagtcgtcactaacgctcccaacacttctgcctcagaccctcaactaaatactattattgttgatt tctttggagaagctataagaatctctctctccttatggtgaaaattttacttggctttatacttaacttccaaggctccc tcttataaaatgcaaaaactgtctgtattcactctcttggttaacaattgatccaatcaaatgcatatggaacatcttt ctttacgtttcttctaaagttcgtttgaggataaggagtagaatctgagaagatagactagtaggtaaccttaggg acggatgtggaaattaacatatgggctcagcttttctgccgagtgcagaccatgtatatgcgttaaaaaattcact aaacaagtaaatgtttgattttgaacccagtaaatcaaatgagttgtggtagaatctcgaactcgaaccgataaa gttcaaatccaggatccgcttttaggtaaactctaccttgggaagtgttatatatatgtccctgattatttctttttccgtttcctttctattttaatttttaaagttatttttagatggttttattttttgataagtggtaagttgttaatattccaaattaaat gccattgtcataactatatacatttataaagaatgattgatcctagtttctcattcctaagatccaaataaggcaata aacaatgtcttagtaattggacctgcttctggtgatcaacgcttgatcgcgtagttagttatagatgactgtaaaaa ctttaaccattttaatggttttgtcaaagaacaaatatcggacatattatagagaatggactattgtactttgcttctg attggtcattttattgtgatccgtaaattggctgtgactgatgtcatatctttgcttacagaggtaatctgaatgataa atcaaaacccataattttttcaatggcaaggctagaccatgttaagaacattacgggactagttgagtgctatgct aaaaatgccacattgagggaattggcgaaccttgttgtagtagctggatacaacgatgtaaagaaatccagtga tagagaagaaataacagaaattgagaagatgcatgctcttattaaggagcataaattggatgggcaattcagat gggtatcagcccaaacaaaccgggcacgtaatggtgagctctatcgctatatagctgaccagagaggtatattt gttcaggtatgctatttgtattgtattagtccaatttcattttttgcaccaaaagaaaggttgttattgtgacgtatatgt ttgttttagcctgcattttatgaagcatttggactaacggtggttgaagctatgacttgtggtcttccaacatttgcaa cttgccatggtggtcctaatgagatcattgaacccggtgtatctgggttccatattgatccttatcatcccgataaa gctgctgaactcatgtcagaattctttcaacgctgcaaacaagatcctactcactgggaaaaaatatctgcatctg gtctccgaaggattcttgagaggtctgtagttgtgtacatgtatagaagattaaagaatgctaccttgatatttattt gaatcaaaaataacaggaacatctcttttttgaacatcactcaagttcttatattaaataatttttaggtatacgtgga agatttactccgagaggctgatgactttatctggcgtatatggtttctggaagcttgtttcaaaacttgagaggcgt gaaactagacgataccttgagatgttctacattctcaaattccgcgagttggtgagtgccttttagctccttttcagt tccaataaactatatatgtggtttaagtaagtattaagcataaacatgtccgtgcttggggctgtcgaaaatgctat ggacatatcctgagctaaggatttttcaagaaaattgatgttagctttactctatttacaggcaaaatctgtacctct agcaattgatgacaagtga
SEQ ID NO:19:NtSUS3-S的多肽序列
MANPKFTRVPSMRERVEDTLSAHRNQLVALLSRYVAQGKGILQ PHHLIDEFNNAVCDDTACEKLKDGPFSEVLKATQEAIVLPPFVAIAVR PRPGVWEYVRVNVYDLSVEQLTVPEYLHFKEELVDGEGNNHFVLEL DFEPFNASVPRPSRSSSIGNGVQFLNRHLSSIMFRSKDSLDPLLDFLRG HCHKGNVLMLNDRIQRISRLESALSKAEDYLSKLSPDTSYNEFEYALQ EMGFERGWGDTARRVLETMHLLSDILQAPDPSTLETFLGRLPMVFNV VILSPHGYFGQANVLGLPDTGGQVVYILDQVRALEAEMLLRIKQQGL NFKPRILVVTRLIPDAKGTMCNQRLERISGTEYSHILRVPFRTEKGILH KWISRFDVWPYLEKFTEDVASEMTAELQGKPDLIIGNYSDGNLVASL LAYKMGVTQCTIAHALEKTKYPDSDIYWKKFEEKYHFSCQFTADLL AMNNSDFIITSTYQEIAGTKNTVGQYESHTAFTLPGLYRVVHGIDVFD PKFNIVSPGADMTIYFPYSDKEKRLTSLHGSIEKLLFDPAQNEEHIGNL NDKSKPIIFSMARLDHVKNITGLVECYAKNATLRELANLVVVAGYND VKKSSDREEITEIEKMHALIKEHKLDGQFRWVSAQTNRARNGELYRY IADQRGIFVQPAFYEAFGLTVVEAMTCGLPTFATCHGGPNEIIEPGVS GFHIDPYHPDKAAELMSEFFQRCKQDPTHWEKISASGLRRILERYTW KIYSERLMTLSGVYGFWKLVSKLERRETRRYLEMFYILKFRELAKSV PLAIDDK
SEQ ID NO:20:NtSUS3-T的多核苷酸序列
atgtttacatggctgaaactcaatataaaaaacaagggtaggtgatcaaaaatcgttggatgcttaaaatc agtagacgttttgctaaatgagcgaccaatgttattgaaaacgttcatgttttcaacccttttggcatacatttgagc attgcccaagattttggataagtagatgcagtgcttataattttaaagcattgtatcctgccttgtttttcattgtcaaa attaattaacttacaagtatttctataagttgcttcataaattagaagtaaatctggattgtgtaatgttattcgcctcgt aaatactgaaagctgcttgaacaagtgaaaaaacacagacaaacgtaacattctccatggattgatgagacttg taaaatacatatatagaaatttggcttgtaaccacatgtatattatgccatatggatgtgacattgatgtgactagac ctaaatgttttgtttccatgtccactggagttttacgtatagttaagaggagaaaagactgaggaatactaatgtat gatggtacccctttgcttcttgacctggatacccagtgttcctattcatgcctatactttggtccttgatttcactctcc cttttctaacttgagctgcatcaaagaaatttccactgtaaaaaaataaataatgctcaccatatctctgcaacattg caaacatgtatcccatatgattgatattggtgcgacatggcaaacatgtatcctatttgatgatcaatcaaatttattt ttcccctgtcaaaatgacctcagtgtgtaattccctatgtatttgatagcattgtaactcgtgtcatgattcatgaata gggtactagaattgcatggttgacaaatattaactggtcgattgatgatccacaaaacatgcacttactgactaaa atgtgatgggacagatttatttttgtttgtgattaacacagtacttaaccctatacttaatacaatttggcctagctac aatcttttcttcagtgcaaattccttgttacacgaccaatattgtctttctgagttctattctgttgttacttacacttttatt attcgaataagacattagattgcttgcatgcaaattgatagccacttgtttcaggaagaatactgttggtcagtacg agagccatactgcattcaccctcccaggactatatcgcgtcgttcatggcattgatgttttcgatcccaaattcaat atagtgtctcctggagctgacatgacaatttacttcccatattctgacaaggaaaaaagactaacgtctttgcatg gctcgattgagaagttgttatttgatcctgcgcagaatgaagagcatatgtaagtgacatccatttgtacttatttta atttggaatagatgacatacttatttgcatgaatataaactgacaacccagagatttcctacattagaaaaggagg gtctgatatgattttctacaaataaattcccagtgatattgttcaaaaagtcctggatactttattatgagagaacca gggatagatggcactagaatcccttaatcttgagaagtcgccacttatcgctcccaacactttctgagaccctca agtaactactattattgtttgatatcttggagaagctataagaatctttttctccttattgtaattttttttacgtgacttta aacttaacttccaagctccttctgataaaatgcaaaaactgtctgtattcactgtcttggtttattaacaattgatccaatcaaatgcatatggaacatctttctttttgtttcttcaaaagttcgtttgaggataaggagtagaatctgagaagat agactagtaggtaaccttaggggcggatgtagaaatcaacgtatgggttcagctttgttgcagaccctgtatatg cattaaaaaaatcactaaataagtaaataattgattttgaacccagtaaatcaaaatgagttgtagtagaatcctga actcgaaccgataaagttggatccactaccgggtaaactctaccttgagaagtgtttatatatgtccctaattatttc ttttctgtttcctttctattttaattttttaagttcctttttagatggttttattttttgacaagtggtaagttgttagtattccaa attaaatgccattgccataactatatacatttataaagattgattgaccctagtttctcattcctaagatccaaataag gcaataaacaatatgtcttagtacttgaacctgcttctggtggtcaacacttgatcgcgtagttagttatagatgact gtaaaaaccttaatcattttaatggttttgtcaaagaacaaatatcggacatattatagcgaatggactattgtacttt tcttctgattggtcattttattgtgatccgtaagttggctgagactgatgtcatatctttgcttacagaggtaatctgaa tgataaatcaaaacccataattttttcaatggcaaggctagaccatgttaagaacattacgggactagttgagtgc tatgctaaaaatgccacattgagggaattggctaaccttgttgttgtagctggatacaacgatgtaaagaaatcca gtgatagagaagaaatagcagaaattgagaagatgcatgctcttattaaggagcataaattggatgggcaattc agatggatagcagcccaaacaaaccgggcacgtaatggtgagctctatcgctatatagctgacaagagaggt atatttgttcaggtacgctgtttgtattgtatttgtccacattcctttttttgcaccgaaagaaaggttgttattgtgaca aatatgtttgttttagcctgcattttatgaagcatttggactcacggtggttgaagctatgacttgtggtcttccaaca tttgcaacttgccatggtggtccgaacgagatcattgaacacggtgtatctgggttccatattgatccttatcatcc cgataaagctgctgaactcatggcagaattctttcaacgctgcaaacaagatcctactcactgggaaaaaatatc tgcatctggtctccgaaggattcttgagaggtttgtagttgtgtacatatatagaagattaaagattgttcccttgat attatttgaatgaaaaataacagtaacatctctttttgaacatcgctcaagttcttgtgttaaataattgttaggtatac gtggaaaatttactccgagaggctgatgactttgtctggtgtatatggtttctggaagcttgtttcaaaacttgaga ggcgcgaaactagacgataccttgagatgttctacattctcaaattccgcgagttggtgagtgcctttttgctcatt ttcagttacaatcaactatatatgtggtttaaatacgtattaagcataaacatgtccgtgattgcggctgtcgaaaat gctatggacatatcctgagctaaggagttttcaagagaattgatttggcttactctgtttacaggcaaaatctgttcctctggcaattgatgacaagtga
SEQ ID NO:21:NtSUS3-T的多肽序列
MFTWLKLNIKNKGRKNTVGQYESHTAFTLPGLYRVVHGIDVFD PKFNIVSPGADMTIYFPYSDKEKRLTSLHGSIEKLLFDPAQNEEHIGNL NDKSKPIIFSMARLDHVKNITGLVECYAKNATLRELANLVVVAGYND VKKSSDREEIAEIEKMHALIKEHKLDGQFRWIAAQTNRARNGELYRY IADKRGIFVQPAFYEAFGLTVVEAMTCGLPTFATCHGGPNEIIEHGVS GFHIDPYHPDKAAELMAEFFQRCKQDPTHWEKISASGLRRILERYTW KIYSERLMTLSGVYGFWKLVSKLERRETRRYLEMFYILKFRELAKSV PLAIDDK
SEQ ID NO:22:NtSUS4-S的多核苷酸序列
atggcggaacgtgtgctgactcgtgttcatagccttcgtgaacgtcttgatgctactttggctgctcatcg caatgagattttgctgtttctttcaaggtatagtcttagcagattgttctttgatttagttgttattgccagttctaatgta tgggcttatatataaacaaagtgttgaagtatgcaaccatataaactgacagcttaaaatgcttgagagaacaca cttttatttatttaattatgccttcagcacaagaagtggaacttgacgcaatggaaccataggtcacgggttcaagt cttggaacagcctgcaatctaaggctgcgtgtagtagaccctagtggtccggcccttccacatatctcgcttagt gtaccgggcccattgagtacgggttcggccgaacccagtcgctttggtccaatccatatatttgtcttaaaaatat attgaatatatacaaattgttaatttagtttaaatatgtgtatcatgggttattcatgctggttttggctgttgcaggatt gaaagccatggaaaagggatactgaaacctcaccagttgctggctgaatttgattcaattcacaaagaagaca aaaacaaactgaatgatcatgcttttgaagaagtcctgaaatccactcaggtatttgtggttttagtgttaggtgat ggatagcatttattgttttactaagatcacatatgtgtcagtttgtggctagtatttaaaatctggtgtattttgtcatac taggaagcaattgttttgtccccttgggttgcgcttgccattcgtctgaggcctggtgtgtgggaatacgttcgtgt gaatgtcaacgctcttgttgttgaggagcttaccgtgcctgagtatttgcaattcaaggaagaacttgttaatgga acgtaagttttaggttcgaatttgttgatttgttagataacatgttctgaactttttgattaaagttgtgtttttgactgat gcagctcgcacgataactttgttcttgagttggattttgagcccttcactgcatcatttccaaaaccaaccctcacc aaatcaattggaaatggagttgaattccttaaccgacacctctctgccaaaatgttccatgacaaggaaagcatg acccctcttctcgagtttcttcgagttcaccactacaagggcaaggtaaacttgtttttcctgtttgtctatgaattta gtttagttgttttgctccgcgaaaatttcagtggaaactgatttatgcaaccactgagtgattaatatgttcaaactta ccgacttctggttttctgtgtagacaatgatgctgaatgacagaattcaggacttaaatactctccaaaatgtccta aggaaagctgaggaatacctcactaccctttcccctgaaacttcatactcggcatttgagcacaagttccaagaa attggcttggagaggggttggggtgacactgcggagcgtgttctagagatgatctgcatgctcctggatctcct cgaggctcctgactcgtgcacgcttgagaagttccttggtagaattccaatggtttttaatgtggtcatactttcac cccatggttatttcgcccaggaaaatgtcttgggttaccccgacactggtggccaggtgcactgcttatctgtgtt cggtcttattatctctttaaaccctactgccacaagtgctgagatgaacctcctttaatttgcaggttgtctatattttg gatcaagttcctgctttggagcgtgagatgctcaagcgcataaaggagcaaggacttgacatcaaaccgcgta ttcttattgttcgtattcccagtaattgtgtttaaacttatgattatgcaggattttatctgttctaatacagcactcttgct taaattctcaggttactcggctgctgcctgatgcggttggtaccacttgtggtcagaggcttgagaaagtgtttgg aacagagcactcacacattcttagggtcccctttaggaccgagaagggcattgttcgcaaatggatctctcgctt tgaagtctggccatacatggagacattcactgaggtgaagcaagctttctctattcatttttcaatcttccaattggt tttggcagcaattttctgcttgctttgacttccgctaaaacttcggattttattgcattaggatgtggcgaaagaaatt gctgcagaattgcaggctaagccagatcttatcattggcaattatagtgagggcaaccttgctgcctccttgttgg ctcacaaattaggtgtaacacaggtcggcaatgtttgtgacatgtaatttcatctttgcatttcctttcgtttgcaact aaaagatttaagagttctctctctcttttttttttccgtctactttgccttatgcagtgcacgatagctcatgctttggag aaaacaaaatatcctgattctgatatctacttgaagaaatttgatgaaaaataccatttctcagcccagtttactgcc gatcttattgcaatgaatcacaccgatttcatcatcaccagcactttccaggagatagcgggaaggtatttttacat cagtttcccactctgattaaattacaatgtatttccctatatgattaaatactgtgtttgatcctaaatcatttctaaattt tccagcaaggacactgttggacagtacgagagccacatggcgttcacaatgcctggactgtatagagttgttca cggcattgatgtgtttgaccccaaatttaacattgtgtcaccaggagctgatatgaatctctatttcccatactacg agaaggaaaagagattgacagcatatcaccctgaaattgaggagctgctgtttagtgatgttgagaatgacgaa cacatgtatgttactaaactagcaatcctgctgcaaaattatggctaattatgtaaacaagtttgtactgaatagatt tgttattcgatcaggtgtgtgctgaagaacaggaataagcctatcatattcactatggctagattggatcgagtga agaacttaactggacttgtcgagctgtacgccaagaacccacggctaagggagttggttaaccttgtcgtggtt ggaggagaccgaaggaaagaatccaaagacttggaagaacaggcagagatgaagaagatgtacgaactta taaagactcacaatttgaacggccaattccgatggatttcttcccagatgaaccgcgtgaggaatggcgaactc tacaggtacattgccgatactaggggagctttcgtgcagcctgcattttacgaggcttttggtttgactgttgttga ggccatgacctgtggtttgcctacatttgcaactaatcacggtggtccagctgagatcatcgttcacgggaaatc tggtttccacattgatccataccacggggatcaggcagctgaacttctcgctgatttctttgagaaatgtaagaaa gaaccttcgcactgggaagccatttccgagggcggccttaagcgtatacaggagaagtaagcaaactgctact cttttcatttttgcaaaacctactatgatcattattaagctcatttttgcaaaacctacttgctgttgttattgtttgttgctt ccttttcactgttctttgagctgaaggtctatcagaaacagtctctctaccttcacaaggtaggggtaagatctgcg tgcacgttaccctcctcaaactctacttaattgtgagattacactaggtttgttgttgttgattctttgctaattaattaa aaggtacacatggcaaatatactcggatcggttgttgacactggctgctgtatatggattctggaagcatgtttcc aagcttgatcgtcttgaaattcgccgttatcttgaaatgttctatgctctcaaattccgcaagctggtgagtttcattg ctttctgcactcctgcaattgtatag
SEQ ID NO:23:NtSUS4-S的多肽序列
MAERVLTRVHSLRERLDATLAAHRNEILLFLSRIESHGKGILKPH QLLAEFDSIHKEDKNKLNDHAFEEVLKSTQEAIVLSPWVALAIRLRPG VWEYVRVNVNALVVEELTVPEYLQFKEELVNGTSHDNFVLELDFEPF TASFPKPTLTKSIGNGVEFLNRHLSAKMFHDKESMTPLLEFLRVHHY KGKTMMLNDRIQDLNTLQNVLRKAEEYLTTLSPETSYSAFEHKFQEI GLERGWGDTAERVLEMICMLLDLLEAPDSCTLEKFLGRIPMVFNVVI LSPHGYFAQENVLGYPDTGGQVVYILDQVPALEREMLKRIKEQGLDI KPRILIVTRLLPDAVGTTCGQRLEKVFGTEHSHILRVPFRTEKGIVRK WISRFEVWPYMETFTEDVAKEIAAELQAKPDLIIGNYSEGNLAASLLA HKLGVTQCTIAHALEKTKYPDSDIYLKKFDEKYHFSAQFTADLIAMN HTDFIITSTFQEIAGSKDTVGQYESHMAFTMPGLYRVVHGIDVFDPKF NIVSPGADMNLYFPYYEKEKRLTAYHPEIEELLFSDVENDEHMCVLK NRNKPIIFTMARLDRVKNLTGLVELYAKNPRLRELVNLVVVGGDRR KESKDLEEQAEMKKMYELIKTHNLNGQFRWISSQMNRVRNGELYRY IADTRGAFVQPAFYEAFGLTVVEAMTCGLPTFATNHGGPAEIIVHGKS GFHIDPYHGDQAAELLADFFEKCKKEPSHWEAISEGGLKRIQEKYTW QIYSDRLLTLAAVYGFWKHVSKLDRLEIRRYLEMFYALKFRKLVSFI AFCTPAIV
SEQ ID NO:24:NtSUS4-T的多核苷酸序列
atggccgaacgtgtgctaactcgtgttcacagccttcgcgaacgtcttgatgctactttggctgctcatcg caatgagattttgctgtttctttcaaggtatagtcttagcagattgttctttgatttagttggtgttatttgccagttctaa tgtatggactaatatatgaacaaagtgcgaccatttcaactgacaacttaaaatgtttgagagaatacacgtttattt acttaattatggcttgagcataggaagtgtatcttggcgtaactcgtaaagttgacctcatgtgacaaggaggtca cggtttcgagccgtggaaacagcctcttgcagaaatgcaggtaaggctgcgtgcaatagatcgcccttccacg gacccgcgcatagcgggaacttagtgcaccggttgggctgtccttttttatgtcttcagcacaaaaatttagtttaa acatgtgtatcatggattattcatgctggttttgccggttgcaggattgaaagccacggaaaagggatattgaaa cctcaccagttgctggctgagtttgaatcaattcacaaagaagacaaaaacaaactgaatgatcatgcttttgaa gaagtcctgaaatctactcaggtaatttgtggttttagtgttaggtgatggatagcatttattgtcttactaagatcat atatgtgtcagtttgtggctagtatttgaaaagtctggtgtggtttgtcatactaggaagcaattgtcttgtccccttg ggttgcgcttgccattcgtctgcggcctggtgtgtgggaatatgttcgtgtgaatgtcaatgcacttattgtcgag gagctgactgtgcctgaatatttgcaattcaaggaagaacttgttaatggaacgtaagttttaggttcgaaatgat gatttgttaaataatatgttctgaactttttgattaatgttgtgttttcccctgatgcagctcgaacgataactttgttctt gagctggattttgagcccttcactgcatcatttcccaaaccaaccctcaccaaatcaattggaaatggagttgaat tcctcaaccgacacctctctgccaaaatgttccatgacaaggaaagcatgacccctcttctcgagtttcttcgagt tcatcactacaagggcaaggtaaacttgtttttcctgtttgtctatgaatttagtttctgaaagttgctttgcttcgtga attttttagtggcaactgatttatgattttctgtgcagacaatgatgctgaatgacagagttcaggacttaaacactc tccaaaatgtcctaaggaaggctgaggaatatctcactaccctttcccctgaaacttcatactcggtatttgagca caagttccaagaaattggcctagagaggggctggggtgacaatgctgagcgtgttctagagatgatctgcatg ctcctggatctcctcgaggctccagactcatgcactcttgagaagttccttggtagaattcctatggtttttaatgtg gtcattctttcacctcacggatatttcgcccaggaaaatgtcttgggttaccccgatactggtggccaggtgcact gcttatttgtaacaccttacgcttttccctctgaaacttatttgcggcaagttctaaggtcctccttccttaatttgcag gttgtctatattttggatcaagttccggccttggagcgtgagatgctcaagcgcataaaggagcaaggacttgat atcaaaccgcgtattcttattgttcgtatctccaataattgcgtttaaacttatgattgtgcaggatttgatctgttcaa atctaatgactgattttcttttttttttttttttccctcaggttactcggctgctgcctgatgcggttggtaccacttgtgg tcagcggcttgagaaagtgtttggaacagagcattcacatattcttagggtcccctttaggaccgagaagggca tcgttcgcaaatggatctctcgctttgaagtctggccttacatggagacattcactgaggtgaagcaagctttctct attcatttttcaatcttccaatctgttttggcagcaatttttcacttactaacactttggctttcgctaaaacttcggatttt attacattaggatgtggcaaaagaaattgctgcagaactgcaggcaaagccagatcttataatcggcaactaca gcgagggcaaccttgctgcctccttgttggctcacaagttaggtgtaactcaggtctgtaatgtttgtcacctgtta tttcaactttgcatttcctttcatttgcaactagaagttaagagttctctctcttttatcttttccgtctattttgccttctgc agtgcaccatagctcatgcgttggagaaaacaaaatatcctgattctgatatctacttgaagaaatttgatgaaaa ataccatttctcagcccagtttactgccgatcttattgcaatgaatcacaccgatttcataatcaccagcactttcca ggagatagcgggaaggtattacatcacaatggatttccgatatgattaaattagttaatttaatcctacttcattgtg tttgatcctaaaacttttctaaatttcccagcaaggacactgttggacagtacgagagccacatggctttcacgat gcctggattgtatagagttgttcacggcattgatgtgttcgatcccaaattcaacattgtgtcaccaggagctgat atgaatctctatttcccctacttcgagaaggaaaagcgattgacagcatatcaccctgaaattgaggagctgctg tttagcgatgttgagaatgacgaacacatgtatgttactaaactagcaatcctgctgcaaaattgtggctaattatg taaaaaagtttttactgaatagatttgtgcttctatcaggtgtgtgctgaaggacaggaataagccaattatattcac catggctagattggatcgagtgaagaacttaactggacttgtggagttgtacgccaagaacccacggctaagg gagttggttaaccttgtcgtggttggtggagaccgaaggaaggaatccaaagatttggaagaacaggcagag atgaagaagatgtatgaacttataaagacgcacaatttaaacggccaattccgatggatttcttcccagatgaac cgcgtgaggaatggcgaactctacaggtacattgccgatactaggggagcttttgtgcagcctgcattttacga ggcttttggtttgactgttgttgaggccatgacctgtggtttgcctacgtttgcaactaatcacggtggtccagctg agatcatcgttcacgggaagtctggttttcacattgatccataccacggcgagcaggcagctgaacttctagctg atttctttgagagatgtaagaaagaaccttcacactgggaagccatttccgagggcggccttaagcgtatacag gagaagtaagcaagctgctactcttttcatttttgcaaaacctaccatgatcattattaagctcatttttgcaaaacct acttgttattctttgttgcttccttttccctgttttttgagccgaggttttatcgaaaacatgctttctaccttcacaaggt aggggtaaggtctgcgtttgttattattgttgttgttgattctctgcgaattaattaaaaggtacacatggcaaatcta ctcggatcggttgttgacactggctgctgtttatggattctggaagcatgtttccaaacttgatcgtcttgaaattcg tcgttatcttgaaatgttctatgctctaaaattccgcaaactggtgagtttcactgctttctgcactcttccaattgtta gttgagtgcactcatttaaactgtagctaaagctgttgtaaatcttcagttaagcagctgctaatgaagtttttatcttt tgtttttggttcaggctgaagctgtcccgttggctgttgagtaa
SEQ ID NO:25:NtSUS4-T的多肽序列
MAERVLTRVHSLRERLDATLAAHRNEILLFLSRIESHGKGILKPH QLLAEFESIHKEDKNKLNDHAFEEVLKSTQEAIVLSPWVALAIRLRPG VWEYVRVNVNALIVEELTVPEYLQFKEELVNGTSNDNFVLELDFEPF TASFPKPTLTKSIGNGVEFLNRHLSAKMFHDKESMTPLLEFLRVHHY KGKTMMLNDRVQDLNTLQNVLRKAEEYLTTLSPETSYSVFEHKFQEI GLERGWGDNAERVLEMICMLLDLLEAPDSCTLEKFLGRIPMVFNVVI LSPHGYFAQENVLGYPDTGGQVVYILDQVPALEREMLKRIKEQGLDI KPRILIVTRLLPDAVGTTCGQRLEKVFGTEHSHILRVPFRTEKGIVRK WISRFEVWPYMETFTEDVAKEIAAELQAKPDLIIGNYSEGNLAASLLA HKLGVTQCTIAHALEKTKYPDSDIYLKKFDEKYHFSAQFTADLIAMN HTDFIITSTFQEIAGSKDTVGQYESHMAFTMPGLYRVVHGIDVFDPKF NIVSPGADMNLYFPYFEKEKRLTAYHPEIEELLFSDVENDEHMCVLK DRNKPIIFTMARLDRVKNLTGLVELYAKNPRLRELVNLVVVGGDRR KESKDLEEQAEMKKMYELIKTHNLNGQFRWISSQMNRVRNGELYRY IADTRGAFVQPAFYEAFGLTVVEAMTCGLPTFATNHGGPAEIIVHGKS GFHIDPYHGEQAAELLADFFERCKKEPSHWEAISEGGLKRIQEKYTW QIYSDRLLTLAAVYGFWKHVSKLDRLEIRRYLEMFYALKFRKLAEAV PLAVE
SEQ ID NO:26:NtSUS5-S的多核苷酸序列
atggcctcaacagttgctgatagcatgcctgatgctttgaaacaaagccggtatcatatgaagagatgct tcgctaggtgaacacccttcttttatgttttttcccctctacgtgtttatgtcaaatttccatgcataatgctaactacttt tcttctttttgacttcaaaattggatgtgaaaggttcattgcaatgggaaggaggctaatgaagttgaaacatttaa cagaagaaatagaagaaactattgaagacaaggcagaaagaaccaggattttggagggttcacttggaaaaa ttatgagttccacacaggtcagcaccatttaaccaacttagttgaacaggaaaaaaagaaaaagcaaaagagtt attgcaaggcgtaacgattttctttgaaattttcaggaggcagctgttgttccaccttatgttgcttttgcagtaagg cacaatcctggcttctgggattatgtcaaagttaacgctgaaactctctctgtggaagctatttcagccagggaat atctcaaattcaaagagatgatctttgacgaagactggtaagtggaaaattgtatcattttaaagagaaacaatttt gtaacatacaagaatagttttgatggttgaatgtgcaagcagggcaaaggatgataatgcactggaagtagattt tggtgcttttgactactctaatcctcggttagccctttcctcttctgtcggaaatgggctcaactttatctcaaaagtt ctgtcttcaaagtttggtggaaagccagaggacgcccagcctttgcttgattacttactagctcttaatcatcaag gagaggtatgaaaatggactacctttgtttcttaaaggtattatataatgatgcgcgttataaagttcctttttaaatt gaaactttgcagaatctaatgatcaatgagaatctgaatggtgttgctaagcttcaagcagcattgatagtagctg aagtttttgtatcttcctttcccaaagacacaccttataaagactttgagcataagtaagcttctcatatgcttccatt gtcatatgcagtataccaatgacatgctaccgaaaagttgtttatgtttgtgacttgattatgaaaactctaggctca aagaatggggctttgataaagggtggggtcacaatgcaggaagagtaagagagacaatgagactgctttccg agataatccaagcaccagatcccataaatatggagtcctttttcagcaagcttcctactacattcaacattgttatct tctccattcatggttactttggccaagcagatgtccttggtctgcccgatactggaggccaggtctacatatacag caatttatctccttttgcctcatattgcttattagcgacacttgcatcattgaaatcagacttttacttcacaggttgttt atattctggatcaagtaagggctttagaggaggaaatgttacaaagaatcaagcagcaagggctaaacgtgaa gcccaagattcttgtggtgagttttgcaaaaatatgcttagacaggttttgagattgatcggagaagggattaaga tgatcaagatctttgtttcctgctttcatgatgtaaacaggtatctcgtctcataccagatgctcgagggacaacat gcaatcaggagatggaacctattcttaactcatcccattctcacatcctgagaattccattcaggactgagaaag gagttcttcgccaatgggtttctcggtttgatatctatccttacttggagaactatgccaaggcaagtcttctaacaa aattaccacctattcatacactttatttactttcttgaactaatcgtttggtttgtgacgtatatcattaggatgcttctgc taagatacttgagctcatggaaggtaaaccagacctcataattgggaactacactgatggaaatttagtggcatc tctattggccaacaaacttggagttactcaggttccgtagctgatcatatgatcatattttctacattgtttcttgataa ttaaatggaaatcttattggatgataacattttagggaaccattgctcatgcattagagaaaactaagtatgaagat tctgatgtgaagtggaagcagtttgatcccaagtaccacttttcttgccaatttactgccgatttattggcaatgaat gctgctgattttatcattaccagcacatatcaagaaatcgctggaaggttagcactgactctctcagtatatttggc aacttaatgaatttactgcagtggccaacactaaaagctatcattcgtccttcagcgaaactaggcctggacaat atgaaagtcacacagcatttaccatgccggggctttatagagctgtttcaggcatcaatgtatttgatccaaagtt caacattgctgctcctggggctgaacagtctacctatttccctttcactgagaaacagaaacgattcagcacattt cgtcctgctattaacgaattactttacagtaatgaggaaaacaatgagcacatgtaagtctaattgcccattttcct aatctaaccattgcttaaatcgttctgtttttaccggatgtgtggtacttatcagtaacatttttttttggatcagtggat ttcttgcagaccggaaaaaaccaattatattttcaatggcgagatttgatacagtgaagaacctgtcaggcttgac tgagtggtatgggaagaataagaagttgcggaacttggtaaaccttgttattgttgggggattcttcgatccatca aaatcaaaagaccgggaggaagcagctgaaatcaagaagatgcatgaattgattgagaaataccagctcaag ggacaaatgagatggatagcagctcaaactgataaatatcgaaatagtgagctataccgaactattgctgacac taagggagcttttgtccaaccggctttatatgaagcttttggactaaccgttattgaagcaatggattgtggattgc ctacgtttgcaactaatcaaggtggacctgcagaaatcattgttgatggggtttcaggtttccatattgatccttac aatggggacgaatcaagcaagaaaatagctgatttctttgagaagtgtaaggttgattctaaatattggaacagg atatctgagggaggtctcaagcgcattgaagaatggtaacaaactagttccaagtttaaaaaatggaaaaaatg cttatcatgttatattttcgtggttttaagttctgcttcgatgcagttatacgtggaagatttatgcaaacaaagtgttgaatatgggatcaatctatggattttggagacaattcaatgtggggcaaaagcaggctaagcaaagatactttga gatgttttacaatcctctcttcaggaaattggtaggttgtatatgttgaatacaatttactaagatcctcaaaatgacc aagaaatatacattgactatgctacttttgtaatttcacaggccaaaagcgtgccgatcccacatgaagagccatt gccacttgcaacatcagactctactcaatcccaagaattaaaactaccactaccagttccagcagcagtagcta aagttctgccattaacaaggcatgcttttaacttaattacttctctacctagagtaactggtaaagtggatgtcaagt ga
SEQ ID NO:27:NtSUS5-S的多肽序列
MASTVADSMPDALKQSRYHMKRCFARFIAMGRRLMKLKHLTE EIEETIEDKAERTRILEGSLGKIMSSTQEAAVVPPYVAFAVRHNPGFW DYVKVNAETLSVEAISAREYLKFKEMIFDEDWAKDDNALEVDFGAF DYSNPRLALSSSVGNGLNFISKVLSSKFGGKPEDAQPLLDYLLALNHQ GENLMINENLNGVAKLQAALIVAEVFVSSFPKDTPYKDFEHKLKEWG FDKGWGHNAGRVRETMRLLSEIIQAPDPINMESFFSKLPTTFNIVIFSIH GYFGQADVLGLPDTGGQVVYILDQVRALEEEMLQRIKQQGLNVKPK ILVVSRLIPDARGTTCNQEMEPILNSSHSHILRIPFRTEKGVLRQWDAS AKILELMEGKPDLIIGNYTDGNLVASLLANKLGVTQGTIAHALEKTK YEDSDVKWKQFDPKYHFSCQFTADLLAMNAADFIITSTYQEIAGSET RPGQYESHTAFTMPGLYRAVSGINVFDPKFNIAAPGAEQSTYFPFTEK QKRFSTFRPAINELLYSNEENNEHIGFLADRKKPIIFSMARFDTVKNLS GLTEWYGKNKKLRNLVNLVIVGGFFDPSKSKDREEAAEIKKMHELIE KYQLKGQMRWIAAQTDKYRNSELYRTIADTKGAFVQPALYEAFGLT VIEAMDCGLPTFATNQGGPAEIIVDGVSGFHIDPYNGDESSKKIADFFE KCKVDSKYWNRISEGGLKRIEECYTWKIYANKVLNMGSIYGFWRQF NVGQKQAKQRYFEMFYNPLFRKLAKSVPIPHEEPLPLATSDSTQSQEL KLPLPVPAAVAKVLPLTRHAFNLITSLPRVTGKVDVK
SEQ ID NO:28:NtSUS5-T的多核苷酸序列
atggcctcaactgttgctggtagcatgcctgatgctttgaaacaaagccgatatcatatgaagagatgctt cgctaggtgaacacccttcttgttctttttgttttttccctctaccatttatgtcaaatttcaatgcataatgctaactact ttttttctttttgacttcaaaattggacgtgaaaggttcattgcaatgggaaggaggttgatgaagctgaaacattta acagaagaaatagaaaaaactattgaagacaaggcagaaagaaccaagattttggagggttcacttggaaaa attatgagttccacacaggtcagcaccatttaaccaacttaattgaataggaagaaaaaaaaaagcaaaagagt tattgcaaggcgtaacgatttcctttgaaattttcaggaggcagctgttgtcccaccttatgttgcttttgcagtaag gcacaatcctggcttctgggattatgtcaaagttgacgctgaaactctctctgtggaagctatttcagccaggga ctatctcaaattcaaagagatgatctttgatgaagattggtaactggaagattgtatcattttaaagaaacaatttttt aatattcaagattagttttgatggttgaatgtgcaagcagggcaaaggatgaaaatgcactcgaagtagattttg gtgcttttgactactctaatcatcggttagccctttcctcttctgtcggaaatgggctaaacttcatctcgaaagtttt gtcttcaaagtttggtggaaaggcagaagatgcccagcctttgcttgattacttactagctcttaatcatcaagga gaggtatggaaatggactaccttcctttcttaaggaattatataatgatgtatgttataaagatcctttttaaacattg acactttgcagaatctaatgatcaatgagaatctgaatggcgtctctaagcttcaagcagcattgatagtagctga agtttttgtatcttcctttcccaaagacacaccttataaagactttgagcataagtaagcttttcaaacgcttctgttat catatgcaatataccaagaatatgttgccttttgaaaagttgtttatgtttatgacttgataatgaaaatactaggctc aaagaatggggctttgagaaagggtggggtcacaatgcaggaagagtaagagagacaatgagactgctttcc gagataatccaagcgccagatcccataaatatggagtcctttttcagcaggcttcctactacattcaacattgttat cttctccattcatggttactttggccaagcagatgtccttggtttgcccgatactggaggccaggtttacatacaca gcaatttatctccttttgcctcatatttacttattagcgacacttgcattattgaaatcacatttgtatttaacaggttgtt tatattctggatcaagtaagagccttagaggaggaaatgttacaaagaatcaagcagcaagggttaaatgtgaa gcccaagattcttgtggtgagttatgcaaaaatatgcgtagccaaggttttgaaattgttcagaggggattaagat gatcgagatatttgtttccttcttccattgatgtgtacaggtcactcgtctcattccagatgctcgagggactacatg caatcaggagatggaacctatacttaactcgtcccattctcacatcctgagaattccattcaggacagagaaag gagttcttcgccaatgggtttctcggtttgatatctatccttacttggagaactatgccaaggcaagtctcctacca aaattaccacctattcatacactttattcagttttttgagctaatcattctcatttgtcacgtatgtgattaggatgcttct gctaagatacttgagctcatggaaggtaaaccagacctcattattgggaactacactgatggaaatttagtggca tctctattggccaacaaacttggagttactcaggttctacagctgatcatttatctgatcagattttctacattgttttct tgataattaaacggaaatcttatgagattgtaacattttagggaaccattgctcatgcattagagaaaaccaagtat gaagattctgatgtcaagtggaagcagtttgattccaagtaccacttttcttgccaattcactgccgatttattggca atgaatgctgctgattttatcattaccagcacatatcaagaaatcgcaggaaggttagcactgactctctcagtat atttggcaacttaatgaatgtactgcttgtggccaacactaaaagctattactcgtccttcagcgaaactaggcct ggacaatatgaaagtcacacagcatttaccatgccggggctttatagagctgtttcaggcatcaatgtatttgatc caaagttcaacattgctgctcctggggctgaacagtctgcctatttccccttcactgagaaacagaaacgattca gcgcgtttcgtcctgctattgaggaactactttacagtaatgagcaaaacaacgagcacatgtaagtctaattgc cccattttcctaatctaaccattgcttaaatgttctgtttttacttgatatgtggtacttatcagtgatattttttattggaacagtggatttcttgcagaccgtaaaaaaccaattatattttcaatggcaagatttgatacggtgaagaacttgtcaggcttgactgagtggtatgggaagaataagaagttgcggaacttggttaacctcgttatcgttgggggattcttcgatccatcaaaatcaaaagaccgggaggaagcagctgaaatcaagaagatgcatgaattgattgagaaatac aagctcaagggacaaatgagatggatagcagctcaaactgataaatatcaaaacagtgagctatatcgaactat tgctgacactaaaggagctttcgtccaaccggctttatatgaagcttttggactaactgttattgaagcaatgaatt gtggactgcctacatttgctactaatcaaggcggacctgcagaaatcattgttgatggggtttcaggcttccatat tgatccttacaatggggatgaatcgagcaagaaaatagctgatttctttgagaagtgtaaggttgattctaaatattggaacaagatatgtggaggaggtctcaagcgcattgaagaatggtaa
SEQ ID NO:29:NtSUS5-T的多肽序列
MASTVAGSMPDALKQSRYHMKRCFARFIAMGRRLMKLKHLTE EIEKTIEDKAERTKILEGSLGKIMSSTQEAAVVPPYVAFAVRHNPGFW DYVKVDAETLSVEAISARDYLKFKEMIFDEDWAKDENALEVDFGAF DYSNHRLALSSSVGNGLNFISKVLSSKFGGKAEDAQPLLDYLLALNH QGENLMINENLNGVSKLQAALIVAEVFVSSFPKDTPYKDFEHKLKEW GFEKGWGHNAGRVRETMRLLSEIIQAPDPINMESFFSRLPTTFNIVIFSI HGYFGQADVLGLPDTGGQVVYILDQVRALEEEMLQRIKQQGLNVKP KILVVTRLIPDARGTTCNQEMEPILNSSHSHILRIPFRTEKGVLRQWDA SAKILELMEGKPDLIIGNYTDGNLVASLLANKLGVTQGTIAHALEKTK YEDSDVKWKQFDSKYHFSCQFTADLLAMNAADFIITSTYQEIAGSET RPGQYESHTAFTMPGLYRAVSGINVFDPKFNIAAPGAEQSAYFPFTEK QKRFSAFRPAIEELLYSNEQNNEHIGFLADRKKPIIFSMARFDTVKNLS GLTEWYGKNKKLRNLVNLVIVGGFFDPSKSKDREEAAEIKKMHELIE KYKLKGQMRWIAAQTDKYQNSELYRTIADTKGAFVQPALYEAFGLT VIEAMNCGLPTFATNQGGPAEIIVDGVSGFHIDPYNGDESSKKIADFFE KCKVDSKYWNKICGGGLKRIEEW
SEQ ID NO:30:NtSUS6-S的多核苷酸序列
atggctactgcaccagccctaaatagatcagagtccatagctgatagcatgccagaggccttaaggcaaagccggtaccacatgaagaaatgttttgccaagtacatagagcaaggaaagaggatgatgaaacttcataac ttgatggatgagttggagaaagtaattgatgatcctgctgaaaggaaccatgttttggaaggcttacttggctaca tattatgcactacaatggtatagctagattcatatgtacttatgatgcccttatattgtttcctgatgtattactcttaaa accttctttgatcaaatttacaggaggctgcagttgttcctccctacattgcctttgccacgagacagaatcctgga ttctgggaatatgtgaaagtgaatgctaatgatctttctgttgagggtattacagctacagaatacttgaaattcaa ggaaatgatagttgatgaatgctggtatagtatacgttgcagcttatcataccttttgtggttttataacttcaatcag aaaactcatcagagttacctttgtgtgaacatgaaatgcagggcaaaagatgaatatgcactggaaattgattttg gagcagtagacttctcaacgcctcgactgaccctatcctcttcaattggcaatggtctcagttatgtttccaagttt ctaacttcaaagctaaatgctacctccgcgagtgcacagtgtctggttgactacttgctcactttgaatcatcaag gagatgtacgtcaacaaaaatcaaactccataagtaaacttgtcaactctaagaagaaaaaataggaaaagaa gattcacgtaacaaattttctttatgttcaactgcagaaactgatgatcaatgagacactcagcactgtctcaaagc ttcaggctgcactggttgtagcagaagcatctatttcctctttaccaacagatacaccatatgagagctttgagcta aggtgatttgttttttcctctacttccctccacttgtgccatgctacgtagtactaagtaacttcaattcttgtaaagatt caaacagtggggttttgagaaaggatggggtgatacagctgaaagggtcagcgacaccatgagaacactgtc tgaggtgcttcaggcaccagatccattgaacattcagaagttctttggaagggttccaactgttttcaatattgtatt gttctctgtccatggatactttggccaagcagatgttcttggcttgccagacactggtggtcaggtaagcatttaat agcttttacatttaacttctatgcattgacaataaaataatttttaacagtttgaccacttctgctcttgttcaacaggta gtttatgttttggatcaagttgtagcttttgaagaagaaatgctacaaagaattaaacagcaggggctcaatattaa gcctcaaattcttgtggtgagttcctagacaatcgacgtgactatgcaattatgtagaggctgtttagaaaagttaa tatcatatgttgattgcacagttaacccgactgattccggatgcaaaaggaacaaagtgcaaccaggaactaga accaatcaagaatacaaaacattcacacatcctcagagttccatttaggacagaaaaaggagtgcttaatcaat gggtttcacgatttgatatctatccatatctggagagatatactcaggtatgtatttttatatcaaccttgctcatcaa agatgtgttgtttcctcaattccatttttccccttggcaaaaggatgctgctgacaaaatcgtcgagctaatggaag gcaaacctgatctaatcattggtaactacactgatgggaatctagtggcttcactaatggctagaaaacttgggat aactctggtaacttttcttaatcatatttgatgttgcttcttctccaagttagttcttaatctccactgacctagaccatc tttgcaacagggaactattgctcatgctttggagaagacaaaatatgaagactctgacataaaattgaaggaact cgatccgaagtaccacttctcttgccaattcacagctgatttgattgcaatgaattcagcagatttcattatcactag cacataccaagaaatagctggaaggtaagaattagagctaataagtaatgcattcatatgtatttcagcatcgctc tttcaccatcatcgaatacacaccactactcagtaaatgtatttgctcaaaagtttgcaacttaatggatctcattctt gaatgcttcaacatatgcagcaaagataaaccaggacagtatgagagccatagtgcatttacccttccagggct ttacagagttgcttcaggtatcaatgtctttgatccaaaatttaatattgctgcacctggggcagaccagtcggtgt atttcccttacacagaaaagcagaagcgtttgactgctttccgccctgccattgaggaactgctttttagtaaagt ggacaatgacgagcacgtgtaagtctaagtgttaaacttcagcttagtgcctagaacatcccactgctctatgtat tgatgtttcacttgtttcaaacagtggatatttagaagacagaaagaaacctatcctgtttaccatggcaaggctg gacacagtgaagaacacatctggactaacagaatggtatggcaagaacaagaggctcagaagcttagttaac cttgttgtggttggtggttcctttgatcctacaaaatccaaggatagggaagaagcagctgaaataaaaaagatg cacatgctgatagagaaataccagcttaagggtcagattagatggatagcagctcagactgacagatacagaa atagtgaactctaccgcacaatagcagattccaaaggagcttttgtgcagcctgcattgtatgaagcatttggtct aacagtcattgaggcaatgaactgtggattaccaacctttgctaccaaccaaggtggccctgctgagattattgtt gatggggtctcaggctttcatattgatccaaataatggggatgaatcaagcaacaaaattgccaactttttccaaa aatgcagggaggatcctgagtattggaacaggatttcagtccagggtctaaaccgtatatatgaatggtaactc acagataagccattcaaattgcaaagaggcacatatcttgcagaaaatttcttaatccttaaatcctaattttttgca gttacacatggaagatctatgcaaacaaggtattgaatatggggtccatctatactttttggaggacattgtacag agatcagaaacaagcaaagcaaagatacatcgagactttctacaatcttgagtttaggaacttggtatagtgctg catgacattgacagtataccacaaacatctttatgagatgaattacttttaataaaattgtttttaacctttgcttcctta atggcacttattgcaggtaaaaaatgtgcctatcagaaaggacgaaacaccacaaggaccaaaggagaggg agaaagttaagccacagatatcacaaaggcatgctctaaagcttttgcctacagtttttcaagagaccctagtata ttctagtactaaattagaattatacagcatgcagcttttgctgttcacctttctaaatcaccagttgtgtcaatcaagtt gacaaaatcaataaattgggattttccctttcctatgcttgattgttattactcctactttgtttatggtagtcttccttcattgttttctcctgtacttcttttactacaactgtactgacatactaattatttctgtgtaccaggcgctcacaatcaagg ttgcagaagtaagattagataaaattgctactgcatga
SEQ ID NO:31:NtSUS6-S的多肽序列
MATAPALNRSESIADSMPEALRQSRYHMKKCFAKYIEQGKRMM KLHNLMDELEKVIDDPAERNHVLEGLLGYILCTTMEAAVVPPYIAFA TRQNPGFWEYVKVNANDLSVEGITATEYLKFKEMIVDECWAKDEYA LEIDFGAVDFSTPRLTLSSSIGNGLSYVSKFLTSKLNATSASAQCLVDY LLTLNHQGDKLMINETLSTVSKLQAALVVAEASISSLPTDTPYESFEL RFKQWGFEKGWGDTAERVSDTMRTLSEVLQAPDPLNIQKFFGRVPT VFNIVLFSVHGYFGQADVLGLPDTGGQVVYVLDQVVAFEEEMLQRI KQQGLNIKPQILVLTRLIPDAKGTKCNQELEPIKNTKHSHILRVPFRTE KGVLNQWVSRFDIYPYLERYTQDAADKIVELMEGKPDLIIGNYTDGN LVASLMARKLGITLGTIAHALEKTKYEDSDIKLKELDPKYHFSCQFTA DLIAMNSADFIITSTYQEIAGSKDKPGQYESHSAFTLPGLYRVASGINV FDPKFNIAAPGADQSVYFPYTEKQKRLTAFRPAIEELLFSKVDNDEHV GYLEDRKKPILFTMARLDTVKNTSGLTEWYGKNKRLRSLVNLVVVG GSFDPTKSKDREEAAEIKKMHMLIEKYQLKGQIRWIAAQTDRYRNSE LYRTIADSKGAFVQPALYEAFGLTVIEAMNCGLPTFATNQGGPAEIIV DGVSGFHIDPNNGDESSNKIANFFQKCREDPEYWNRISVQGLNRIYEC YTWKIYANKVLNMGSIYTFWRTLYRDQKQAKQRYIETFYNLEFRNL VKNVPIRKDETPQGPKEREKVKPQISQRHALKLLPTVFQETLALTIKV AEVRLDKIATA
SEQ ID NO:32:NtSUS6-T的多核苷酸序列
atggctactgcaccagccctgaaaagatcagagtccatagctgatagcatgccagaggccttaaggcaaagccggtaccacatgaagaaatgttttgccaagtacatagagcaaggcaagaggatgatgaaacttcataac ttgatggatgaattggagaaagtaattgatgatcctgctgaaaggaaccatgttttggaaggcttacttggctaca tattatgtactacaatggtatagctagattcatatgtacttatgatgtccttatattgtttccggaggcattattcttaaa tccttctttgatcaaatttgtaggaggctgcagttgttcctccctatattgccttcgccacgagacagaatcctggat tctgggaatatgtgaaagtcaatgctaatgatctttctgttgagggtattacagctacagattacttgaaattcaag gaaatgatagttgatgaaagctggtatagaatactttgcagcttatcataccttttgtggttttataatttcaatcaga aaactcatcagagttacctttgtgtgaacatgacatgcagggcaaaagatgaatatgcactggaaattgattttg gagcagtagacttctcaacgcctcgactgaccctatcctcttcaattggaaatggtctcagttatgtttccaagttt ctaacttcaaagctaaatgctacctcagcgagtgcacagtgtctggttgactacttgctcactttgaatcaccaag gagatgtacgtcaacaaaaatcaaactccataagtaaacttgtcaactctaagaagtaaaaataggaaaagaag attcatgtaacaaattttctttatgttcaactgtagaaactgatgatcaatgagacactcggcactgtctcaaagctt caggctgcactggttgtagcagaagcatctatttcctccttaccaacagatacaccataccagagctttgagcta aggtgatttgttttttcctctacttccttccacttttggtgtgctacatagtactaagtaacttcaattcttgtaaagattc aaacagtggggttttgagaaaggatggggtgatacagctgaaagggtccgcgacaccatgagaacactttct gaggtacttcaggcgccagatccattgaacattgagaagttctttgggagggttccaactgttttcaatattgtatt gttctctgttcatggatactttggccaagcaaatgttcttggcttgccagacacaggtggtcaggtaagcatctaa tagcttttacatttaacttctatgcattgacaataaaataacttctacactaccaaataatttttgaaagtttgaccactt cggctcttgttcaacaggtggtttatgttttggatcaagttgtagcttttgaagaagaaatgctccaaagaattaaa cagcaggggctcaatattaagcctcaaattcttgtggtgagctcctagacaatgacgtgactatgcaattaagta gaggctgtttagaaaagttaatatcatatgttgattgcacagttaacccgactgattccggacgccaaaggaaca aagtgcaaccaggaactagaaccaatcaagaatacaaaacattcacacatcctcagagttccatttaggacag aaaaaggagtgcttaatcaatgggtttcacgatttgatatctatccatatctggagagatatactcaggtgtgtattt ttatatcaaccctgctcatcaaagatgtgttgtttcctcaattccatttttcgccttgacaaaaggacgctgctgaca aaatcatcgagctaatggaaggcaaacctgatctaatcattggtaactacactgatgggaatctagtggcttctct aatggctagaaagcttgggataactctggtaacttttcttatcatatttgatgttgtttcttctccaagttggttcttaat gtcaactaacccagaccatctttgtaacagggaactattgctcatgctctggagaagacaaaatatgaagactct gacatcaaattgaaggaactcgatccgaagtaccacttttcttgccaattcacagctgatttgattgcaatgaattc agcagatttcattatcacaagcacatatcaagaaatagccggaaggtaagaattggaactacggaagcagaga gctaataagtagtgcactcatatatttcagcatcgctctttcgcataatcgaatacacaccactactcagtaaatgt acttgctcaaaagtttacaagtttatggatcttattcttgaatgcttcaacatatgcagcaaagataggccaggaca gtatgagagccatagtgcatttacccttccagggctttacagagttgcttcaggcatcaatgtctttgatcctaaatt taatattgctgcacctggggcagaccaatcggtgtatttcccttacacagaaaagcagacgcgtttgactgctttc cgccctgccattgaggaactgctttttagtaaagtggacaatgacgagcacatgtaagtcttagtgttaaacttca gctttcagcttagtgcctagaacattccactggctctatgtattaatgtttcacttgtttcaaacacagtggatattta gaagacagaaagaaacctatcctgtttaccatggcaaggctggacacagtgaagaacacatctggactaaca gaatggtatggcaagaacaagaggctcagaagcttagttaaccttgttgtggttggtggttcctttgatcctacaa aatccaaggatagagaagaagcagctgaaataaaaaagatgcacatgctgatagagaaataccagcttaagg gtcagatcagatggatagcagctcagactgacagatatagaaacagtgaactctaccgcacaatagcagattc caaaggagcttttgtgcagcctgcattatatgaagcatttggtctaacagtcattgaggcaatgaactgtggatta ccaacctttgctaccaaccaaggtggccctgctgagattattgttgatggggtctcaggctttcatattgatccaa ataatggggatgaatcaagcaacaaagttgccaactttttccaaaaatgcagggaggatcctgagtattggaac aggatttcagtccagggtctaaaccgtatatatgaatggtaactcacagataagccattcaaattgcaaagaggc acatatcttgctgaaaatttcttaatcctttaatcctaaaattttgcagttacacatggaagatctatgcaaacaaggt attgaatatggggtccatctatactttttggaggacattgtacagagatcagaaacaagcaaagcaaagatacat cgagactttctacaatcttgagtttaggaacttggtatagtgctgcatgacattgacagtataccacaaacatcttt atgagatgaattacttttaataaaattgtttttaacctttgcctccttaatgacacttattgcaggtaaaaaatgtgcct atcagacaggacgaaacaccacaaggaccaaaggagaggagggagaaagttaagccacagatatcacaa aggcatgctctaaagcttttgcctatagtttttcaggagaccctagtatattctagtactaaattagaattatacagc atgcagcttgcttctgctgttcacctttctaaatcaccagttatgtcaatcaagttgacaaaatcaataaattcggctt ttccctttcctatgcttgattgttattactcctacttcgtttatggtagtcttccttcattgttttctcctgtacttcttttactacaactgtactga
SEQ ID NO:33:NtSUS6-T的多肽序列
MATAPALKRSESIADSMPEALRQSRYHMKKCFAKYIEQGKRMM KLHNLMDELEKVIDDPAERNHVLEGLLGYILCTTMEAAVVPPYIAFA TRQNPGFWEYVKVNANDLSVEGITATDYLKFKEMIVDESWAKDEYA LEIDFGAVDFSTPRLTLSSSIGNGLSYVSKFLTSKLNATSASAQCLVDY LLTLNHQGDKLMINETLGTVSKLQAALVVAEASISSLPTDTPYQSFEL RFKQWGFEKGWGDTAERVRDTMRTLSEVLQAPDPLNIEKFFGRVPT VFNIVLFSVHGYFGQANVLGLPDTGGQVVYVLDQVVAFEEEMLQRI KQQGLNIKPQILVLTRLIPDAKGTKCNQELEPIKNTKHSHILRVPFRTE KGVLNQWVSRFDIYPYLERYTQDAADKIIELMEGKPDLIIGNYTDGN LVASLMARKLGITLGTIAHALEKTKYEDSDIKLKELDPKYHFSCQFTA DLIAMNSADFIITSTYQEIAGSKDRPGQYESHSAFTLPGLYRVASGINV FDPKFNIAAPGADQSVYFPYTEKQTRLTAFRPAIEELLFSKVDNDEHIG YLEDRKKPILFTMARLDTVKNTSGLTEWYGKNKRLRSLVNLVVVGG SFDPTKSKDREEAAEIKKMHMLIEKYQLKGQIRWIAAQTDRYRNSEL YRTIADSKGAFVQPALYEAFGLTVIEAMNCGLPTFATNQGGPAEIIVD GVSGFHIDPNNGDESSNKVANFFQKCREDPEYWNRISVQGLNRIYEC YTWKIYANKVLNMGSIYTFWRTLYRDQKQAKQRYIETFYNLEFRNL VKNVPIRQDETPQGPKERREKVKPQISQRHALKLLPIVFQETLVYSST KLELYSMQLASAVHLSKSPVMSIKLTKSINSAFPFPMLDCYYSYFVYG SLPSLFSPVLLLLQLY
序列表
<110> Philip Morris Products S.A.
<120> 调节植物中的还原糖含量(INV)
<130> P10682EP
<160> 33
<170> PatentIn version 3.5
<210> 1
<211> 4237
<212> DNA
<213> 普通烟草(Nicotiana tabacum)
<400> 1
atggcggaaa caaacaatag cgttccttac acccaattac cggcggagga caataacacc 60
tccgttaatt ctccggccgg atgccggcta cgacccaaaa gagtgtcgtt tatagtatta 120
acagggctgg tggcagcttt gttacttttt gtggcagtga aatatgggaa aaacgaggcg 180
gaggatgtga atccagggcc agtaccacca caagaaaccg tgtgcaatat gcttggttct 240
aatctaatgc cgctgaccag catgaagacg gtggcgcgtg gggtggcaga aggtgtctcc 300
gccaagtcac gcggtcgttt cttgggatta cggccgtttc catggaccaa acaaatgttg 360
gcttggcaaa gaacatcctt ccactttcaa cctaagaaga attggatgaa tggttagtaa 420
ttctttttct cttatgttat taattttcat aaatcaactt tattattatt attatacaat 480
aaatcaacat tgcttattga tgaattttaa cataaacccg ccttatgctt gacgagatta 540
actagaacta tatatacaat gaatgattat ctccattcca ttacataacc atgaattatg 600
tttcttaatt aattaaagat ttgacatgac attatatttc gtttatagtt taagaaaagc 660
tttgtattga tgtaaaagaa accattacag cttcgaatat gggatacctt gtctttttct 720
tttcctaaga tggatctttg attgcaagaa cagagtttga attactcagg aaacttattt 780
gcttatttat tattttttga ggtgaacatt aatgatttat tcttatttgg catgtgttgg 840
attatttggc ttggattgcg ctgatcacgg aaattgcctg attcttttcg tcagatccta 900
atggtaaagt ccatatattt ctacttgtta ttgttgttgt tcttcttatt attatattat 960
tattgaaaat tatcgacata atcgggacct caaaacatac tagtcgtagc agtttttaag 1020
tagacagatt gtcaatatga tgaagacagt tgttttcaga caattgcatg tgaattttct 1080
aggagcaaac acaaattcct agaatggtaa gcaacttcca ccctgtctgt tccaattata 1140
acctcgctac ttttgatcca cttaatctta ttcaaccaac agtggatcac ttatttaatt 1200
atatgtgacc tagtttattg agacattttt acattaagcc ctttcgtatt tacacttcaa 1260
tatgcatcat acaaaaaaaa atgtacttca aagttatacg ttatattaat ttctaactcc 1320
aatttttaaa aaaaaatata ttttaggtcc cttattctac aaaggatggt accatttgtt 1380
ctatcaatac aatccagagg ctgcagtatg gggaaatatt gtatggggac atgcagtttc 1440
aagagactta attcactggc aacaccttcc agttgctatg gttgcggatc aatggtacga 1500
cattaatggt gtatggaccg gatccgcaac cattttaccc gatggtaaac tcgtcatgtt 1560
gtatactggg tcaaccaacg agtcagtaca ggttcaaaat ttagcgtacc cggctgaccc 1620
atcggatcct ctcctaataa aatgggtcaa gtatgagggc aacccggttc ttgtaccacc 1680
acccggaatt gctgctaagg atttccgtga ccccaccact gcatggacca caccacaagg 1740
caaatggcgg attactattg gttcaaaagt taataaaact ggaatttcat tggtctatga 1800
cactattgat tttaagaatt ttgagttgct ggatggggtg ctccatggtg tatcgggtac 1860
gggtatgtgg gaatgtgtgg atttttaccc ggtttcgaaa gttgttgaaa atgggcttga 1920
cacttcagat aatgggcctg cagtaaaaca tgtgttaaag tccagtcttg atgatgatag 1980
aaatgattat tatgcacttg gaacttatga tgctgtggct ggaaaatggg ttcctgataa 2040
tcccactatt gatgttggta ttggattaag atatgattat ggaaattttt atgcatcaaa 2100
aacattttat gaccaagaga aaaagagaag agtcctttgg gcttggatta ctgaaagtga 2160
tagtgaagct gctgatattt gcaaaggttg ggcatcactt caggtacaat tcaattgtgt 2220
caagctagcg cttgcacata gatttagttg aaacctaaaa aatgagtatt tgaaattccg 2280
tagaaaaata atttttgaaa gttgaagttg tgtttgaata tgcattttat ttgaaaaaaa 2340
aaacagttct aattttatga gaaagaaaaa ttcacctaaa aactgcccta aaccagattt 2400
taggaacttg aaaaaaaaat aaactttttc aaaaactgat tatattctat gaacaaacaa 2460
tattatcaaa aatctatttt ttttttgcca aaatctatgg ccaaacagga gctaatttcc 2520
tttatttttt ttttcaaact tcatgtcata tttgaatttt ggtctcattt aacactttgg 2580
taacgtgtga tgtaacacag cccattccaa ggactataaa atatgacaag aagacaggaa 2640
gcaatataat tacttggcca gtggcagagg ttgagaattt gagatttaac agcaaggaat 2700
tcgacaaggt ggaggtcaag ccaggaaatg ttgttccact agaagttggc actgccactc 2760
aggtttgttc attaaattta gcttatatac actgactgcc taaaagaatt tttttgacat 2820
tattagtgta ttttaagcta ttatagcacg taacatgcta atgctcgaat aagtttaact 2880
tactataact tgaattgttg atgattacag ttggacataa tggctgagtt tgaagtagac 2940
cctaaggtct tggagaaatt agaaggaagt aatgctacat atgagtgcag aagcagcggt 3000
ggatctgctg aacgtggtgc cttaggacca tttggtttat tggttttaac agataaggga 3060
ttgtccgagc aaactccaat ttacttctac attgctaaag acgctgctgg aaatttcacc 3120
acattcttct gcaatgatct taccaggttc taatttctcc tctcttgcat tttcatctca 3180
tcaatgaagt tttagccctt caccccctcc cccaaaacca aactaataaa ttggagaaaa 3240
ccctttattg gttcagtgct taatagcagt acggaattca ggattttaag tcagtgggtt 3300
ctgcgatcta tatatatata ataatatttt tctgcacata catatagtcc gagctagaca 3360
tagtgagttc cgttgaacct gttgcattta gtctgagtcc gccactgctt aagcacatcc 3420
ttctcataac aaccgagctt tccaaaaact taagtatttc tcatgtccat acttttattc 3480
atgtttgaaa atgaagtcac attttgtttt ataaccgaaa aatcccgagg gcaagtggcc 3540
agtacatggt tcgaagctca atggacactg gcaccgcccc tttatcgtgc tccacttaaa 3600
tactaagatt ttgtccgtgg cagggtttca accaatcacg tacgtttaac tcatatatta 3660
ggaatagctt ttaccactag accaaaactc ggggacaatg tatgaagccg gatatttgtt 3720
gcaattcttt ttaaattaaa atggggacaa gatccgagac aaatcttgaa aatgcattac 3780
gaagtattgt taagtaagta tgaaaatggt gattctcatc tttttacttc cttttttagg 3840
tcatctgaag caacagatgt tcgcaaacta atctacggaa gcacagttcc agtcctccaa 3900
ggagagaagc tttctctaag aacactggta atatcccctt tttctttctt aatttcttaa 3960
tccaaattct taattagtgc ttgttttcct ttgtgcgtat aattaagttt actaagtatc 4020
aattaatggg gtatttttgt caatgtaata ggtggatcat tcaatagtag aaagttttgc 4080
acaaaatgga aggacagcaa taacatcaag gttatatcca acaaaggcaa tatatgaaga 4140
tgctaagctc tacttgttta acaatgctac agatgttacc attactgcct cggtcaagat 4200
ttggcaaata cattctgcaa atatacaatc tagttaa 4237
<210> 2
<211> 649
<212> PRT
<213> 普通烟草
<400> 2
Met Ala Glu Thr Asn Asn Ser Val Pro Tyr Thr Gln Leu Pro Ala Glu
1 5 10 15
Asp Asn Asn Thr Ser Val Asn Ser Pro Ala Gly Cys Arg Leu Arg Pro
20 25 30
Lys Arg Val Ser Phe Ile Val Leu Thr Gly Leu Val Ala Ala Leu Leu
35 40 45
Leu Phe Val Ala Val Lys Tyr Gly Lys Asn Glu Ala Glu Asp Val Asn
50 55 60
Pro Gly Pro Val Pro Pro Gln Glu Thr Val Cys Asn Met Leu Gly Ser
65 70 75 80
Asn Leu Met Pro Leu Thr Ser Met Lys Thr Val Ala Arg Gly Val Ala
85 90 95
Glu Gly Val Ser Ala Lys Ser Arg Gly Arg Phe Leu Gly Leu Arg Pro
100 105 110
Phe Pro Trp Thr Lys Gln Met Leu Ala Trp Gln Arg Thr Ser Phe His
115 120 125
Phe Gln Pro Lys Lys Asn Trp Met Asn Asp Pro Asn Gly Pro Leu Phe
130 135 140
Tyr Lys Gly Trp Tyr His Leu Phe Tyr Gln Tyr Asn Pro Glu Ala Ala
145 150 155 160
Val Trp Gly Asn Ile Val Trp Gly His Ala Val Ser Arg Asp Leu Ile
165 170 175
His Trp Gln His Leu Pro Val Ala Met Val Ala Asp Gln Trp Tyr Asp
180 185 190
Ile Asn Gly Val Trp Thr Gly Ser Ala Thr Ile Leu Pro Asp Gly Lys
195 200 205
Leu Val Met Leu Tyr Thr Gly Ser Thr Asn Glu Ser Val Gln Val Gln
210 215 220
Asn Leu Ala Tyr Pro Ala Asp Pro Ser Asp Pro Leu Leu Ile Lys Trp
225 230 235 240
Val Lys Tyr Glu Gly Asn Pro Val Leu Val Pro Pro Pro Gly Ile Ala
245 250 255
Ala Lys Asp Phe Arg Asp Pro Thr Thr Ala Trp Thr Thr Pro Gln Gly
260 265 270
Lys Trp Arg Ile Thr Ile Gly Ser Lys Val Asn Lys Thr Gly Ile Ser
275 280 285
Leu Val Tyr Asp Thr Ile Asp Phe Lys Asn Phe Glu Leu Leu Asp Gly
290 295 300
Val Leu His Gly Val Ser Gly Thr Gly Met Trp Glu Cys Val Asp Phe
305 310 315 320
Tyr Pro Val Ser Lys Val Val Glu Asn Gly Leu Asp Thr Ser Asp Asn
325 330 335
Gly Pro Ala Val Lys His Val Leu Lys Ser Ser Leu Asp Asp Asp Arg
340 345 350
Asn Asp Tyr Tyr Ala Leu Gly Thr Tyr Asp Ala Val Ala Gly Lys Trp
355 360 365
Val Pro Asp Asn Pro Thr Ile Asp Val Gly Ile Gly Leu Arg Tyr Asp
370 375 380
Tyr Gly Asn Phe Tyr Ala Ser Lys Thr Phe Tyr Asp Gln Glu Lys Lys
385 390 395 400
Arg Arg Val Leu Trp Ala Trp Ile Thr Glu Ser Asp Ser Glu Ala Ala
405 410 415
Asp Ile Cys Lys Gly Trp Ala Ser Leu Gln Pro Ile Pro Arg Thr Ile
420 425 430
Lys Tyr Asp Lys Lys Thr Gly Ser Asn Ile Ile Thr Trp Pro Val Ala
435 440 445
Glu Val Glu Asn Leu Arg Phe Asn Ser Lys Glu Phe Asp Lys Val Glu
450 455 460
Val Lys Pro Gly Asn Val Val Pro Leu Glu Val Gly Thr Ala Thr Gln
465 470 475 480
Leu Asp Ile Met Ala Glu Phe Glu Val Asp Pro Lys Val Leu Glu Lys
485 490 495
Leu Glu Gly Ser Asn Ala Thr Tyr Glu Cys Arg Ser Ser Gly Gly Ser
500 505 510
Ala Glu Arg Gly Ala Leu Gly Pro Phe Gly Leu Leu Val Leu Thr Asp
515 520 525
Lys Gly Leu Ser Glu Gln Thr Pro Ile Tyr Phe Tyr Ile Ala Lys Asp
530 535 540
Ala Ala Gly Asn Phe Thr Thr Phe Phe Cys Asn Asp Leu Thr Arg Ser
545 550 555 560
Ser Glu Ala Thr Asp Val Arg Lys Leu Ile Tyr Gly Ser Thr Val Pro
565 570 575
Val Leu Gln Gly Glu Lys Leu Ser Leu Arg Thr Leu Val Asp His Ser
580 585 590
Ile Val Glu Ser Phe Ala Gln Asn Gly Arg Thr Ala Ile Thr Ser Arg
595 600 605
Leu Tyr Pro Thr Lys Ala Ile Tyr Glu Asp Ala Lys Leu Tyr Leu Phe
610 615 620
Asn Asn Ala Thr Asp Val Thr Ile Thr Ala Ser Val Lys Ile Trp Gln
625 630 635 640
Ile His Ser Ala Asn Ile Gln Ser Ser
645
<210> 3
<211> 5883
<212> DNA
<213> 普通烟草
<400> 3
atggcggaaa caaacaatag cgttccttac acccaattac cggcggagga caataacacc 60
tccagtaatt ctccggccaa atgccggcga cgacccaaaa gagtgtcgtt catagtatta 120
acagggctgg tggcagcttt gttacttttt gtggcagtga aatatgggaa taacgaggcg 180
gaggatgtaa atccagggcc agtaccacca caagaaaccg tgtgtaacat gcttggttct 240
aatctaatgc cgctgaccac catgaggacg gtggcgcgtg gggtggcaga aggtgtctcc 300
gccaagtcac gcggtcgttt cttgggatta cggccgtttc catggaccaa acaaatgttg 360
gcttggcaaa gaacatcctt ccactttcaa cctaagaaga attggatgaa tggttagtaa 420
ttctttttct cttatgttat tttcataaat cagctttgtt tttattaaac aataaatcaa 480
cagcttattg ataattttaa acataaaacc gccttatgct tgacgagatt aactagaact 540
ttatgtacaa tgaatggtta tctccattcc attacatgcc catgaatttt atgtgtctta 600
atttaaagat ttgacaggac attacattac gtttatagtt taagaaaagc ttggtattga 660
tataaaaaaa accattacag cttcgaatat gggatacctt gtctttttct ttgcctaaga 720
tggatctttg attgcaagaa cagagtttga attactcagg aaaaatatga aatcgttttg 780
gaacttattt gcttgtttat tattttttga ggtgaacatt aatgatttat tcttatttgg 840
catgtgttgg attctttggc tttggactgc gttgctcacg gaaattacct gattctgttc 900
gtcagatcct aatggtaagt ccatattttc tgccggtatt attattatta ttattgttat 960
tgttattatt attattatta ttattaattt attttgatat attggaaacc atcgacaaaa 1020
cggggacctc aaaacatact agtcggggta gtttgtaagt agacagattg acaatatgat 1080
gaagacagtt gtctttagac aattgcatgt gaattttgta ggagcaaaca caaattccta 1140
gaatggtata caacttcaat cctgtctgtc caattataac ctcgctactt ttgatccact 1200
acaccttttt cgatcaacag gggatcactt atttaattat acggaaccct ttatataaca 1260
atcatatttg ttcccgtatt ttttaggttt tatattgagt ggttgttatg caaatattac 1320
aggatttgac gtttaaatat ttttttggtt gttatagata aaaattatct ataaataaat 1380
aatcattcct tttttcatgt tacatataaa aaataaggaa attatttaaa tttaaaatct 1440
cacaagctat gcatatttca ctaattaaat attaaagaaa gttaatacat tattaataaa 1500
ttcataacta aaaatataaa gatttaaact ctaaggcaga cattttaagg ctaccaaaaa 1560
aataattttt ttcaagattg atggaagtgg aacaactttg taattgtagc ttgtttcgta 1620
gatttcattc tcttactagc gatataacac ttgaattggc aaagatccgt gtctaaattt 1680
tcagcaaaaa ggtatccaat agtttttcct tgaatacaat ctaagagttt aaccgttaaa 1740
ttttctatcc aagtattttt taaatttatc caataaaaaa gatatcatgt gcaaatctat 1800
aaatcttata ttttatgcaa gatagaaact ttatttattt ttagaattat tattagcaat 1860
cttaaagatt ttatatggct gttatagagg ggtaatttta caaaaagcgt tctgctataa 1920
atatggttgt tgctgttata ggtaaaaagt tgttataaaa ttgtttatga aagtcacttt 1980
actttatttt ttaactgaaa agtcactata ctttgcacat tgtaactcaa aagtcaatca 2040
acacttttag ggcgttatta aacattattt ttcatatttc ttttcagccc aaccatttaa 2100
aaaataaaaa aaaatattta aatcatgact cgacggttcc atgacctgac ccattttctc 2160
ttatttatgt tataaaaaac ataaatatta ctttgttgta gtgtattata ttggttctca 2220
atatagttat actaaatgta tacattggtt taagcaaagt attaaataga gaataaggaa 2280
ttaatcttaa caaactagag gagttagatt tgaaactgaa acaagaaaat tagtagcgtt 2340
gaagtgaaaa aaaataaaaa ggaggaagaa aaaataaaaa aagtatttat gcttgaaatt 2400
ttgactgaga aatattaata taagagtaaa ttaaaagaca atatccttga tgttttagaa 2460
caagaacgcg cattttagta aagataatgt tactagacga ccatttttag tcgaactaat 2520
ttaatacttt gcttaaatca atatgttgaa aatcaagaca attaacagta aagtaatatt 2580
tacgtttttt tgtaacaaaa ataagagagt gggtcgagtt aaagagcggg ttgagtcacg 2640
gtttaaatgg gtattttttt attgtttaaa tgattgagtt aaaaaaaata tgaaaaaaaa 2700
aatttaatat ggcctaaatg tattgagtga cttttgagtt acaatgtgta aagtatgatg 2760
actttccttt tacaaaacaa agtaaagtga ctttcataaa caattttcat tagttcaatg 2820
acttctgaga aatggactcc ttaaaaaatt gattctgaag aaaacttggt ttttacggtg 2880
aatgactgtt atatatgaat gttgttatcg aaaggtctga ctgtatgtga cctagtttat 2940
tgagacgttt ttacattaaa gccctttcgt atttacactt caatatgcat catacaaaaa 3000
atatgtgctt cataattata cattacattc atttctaact ccacttttac aaaaaatatt 3060
ttaggtccat tattctacaa aggatggtac catttgttct atcaatacaa tccagaggct 3120
gcagtatggg gaaatattgt atggggccat gcagtttcaa gagacttaat tcactggcaa 3180
caccttccag ttgctatggt tgcggatcaa tggtacgaca ttaacggtgt atggaccgga 3240
tccgcaacca ttttacccga tggtaaactc gtcatgttat ataccgggtc aaccaacgag 3300
tcagtacagg ttcaaaatct agcgtacccg gctgacccat cggatcctct cctaagaaaa 3360
tgggtcaaat atgagggcaa cccggtactt gtaccaccac ccggaattgc tactaaagat 3420
tttcgtgacc ccaccactgc atggaccaca ccacaaggca aatggaggat tactattggt 3480
tcaaaggtta ataaaactgg aatttcattg gtctatgaca ctattgattt taagaaattt 3540
gagttgttgg atggggtgct ccatggtgta ccgggtacgg gtatgtggga atgtgtggac 3600
ttttacccgg tttcgaaagt tgttgaaaat gggcttgaca catcagataa tgggcctgca 3660
gtaaaacatg tgttaaagtc cagtctagat gatgatagaa atgattatta tgcacttgga 3720
acttatgatg cagtggctgg taaatggatt cctgataatc ccacaattga tgttggtatt 3780
ggattaagat atgattatgg aaatttttac gcatcaaaaa cattttatga ccaagaaaaa 3840
aagagaagag tcctttgggc ttggattact gaaggtgata gtgaagctgc tgatatttgc 3900
aaaggttggg catcacttca ggtacaattc aattgtgtcg aagacaattt agctagtgtt 3960
gggatataga tttggttgaa acttaaaaaa aaaaatattt aaaattatgg acatgtattt 4020
tatttgaaaa aaattaaaat tctgtgagtg gaagaaaacc ttttacccaa aaactaccct 4080
aaaccagatt ttgggaatgt aaaaaaaaga atcagatcat attctatgaa caaacaatat 4140
tatcaaaagt tttttaaaaa caattttcaa aatctatggt caatttcctc ttttatttta 4200
cttcattttg tcatatttga attttggtct catttaacac ttggtaacgt gtgatgtaaa 4260
acagcctatt ccaaggacta taaaatatga caagaagaca ggaagcaaca taattacttg 4320
gccagtggcg gaggttgaga atttgagatt aaacagtaag gaattcgaca aggtggaggt 4380
aaaaccaggg tcagtttttc cactagaagt tggcactgcc actcaggttt gttgattgaa 4440
tttaactata cacgtgtaaa agaatttctt tacgttatcg gtctatttta aactattata 4500
gcacgtaaca tgctaatatt cgataagttt aacttactat aatttgaatt gttgatgatt 4560
atagttggac ataatggctg agtttgaaat agaccctaag gtcttggaga gattagaagg 4620
aaataatgct acatatgagt gcagaagcag tgggggatct gctgaacgtg gtgccttagg 4680
accatttggt ttattggttt taacagataa gggcttgtcc gagcaaactc caatttactt 4740
ctacattgca aaagacgctg ctggaaattt caccacattc ttctgcaatg atcttaccag 4800
gttctaattt ctcctctctt gcattttcat ctcatcaatg aagttttagc ccctcccccc 4860
caccaaaacc aaactaagaa attggagaaa aacctttatt ggttcactgc ttaatagcag 4920
tacggaattc aggattttga gtcattaggt tctgctctat atatatatat ataataatat 4980
ttttctacac atatatatag ttcgagctaa acataatgag ttccgtcgaa cctgttgcat 5040
ctagtctgaa tccgccactg ctttaacaca tctttctcat aataaccact atttccaaga 5100
gcttaagtat ttctcatgtc catacttcta tccacgttta aaaatgaagt cagattttgt 5160
tttatatccg agaaatcccg agggcaagtg gccagtacat ggttcgaagc tcaatggaca 5220
ctggcaccgc cctttatcgt gctctactta aatattaaga ttttgtctgt tgcagggttt 5280
taaccaagga cgtacgttta acccatatat aacgagtagc ttttaccact agaccaaaac 5340
tcggggcaat atatgaagcc agatatttgt tgcaattctc tttaattaaa ttaaaatggt 5400
gacaagatcc gagacaaatc ttggaagtgc attacgtagt atttttaagt aagtatgata 5460
atggtgattc tcatcttttt acttcctttt ttttaggtca tctgaagcaa cagatgttcg 5520
caaactaatc tacggaagca cagttccagt cctccaagga gagaagcttt ctctaagaac 5580
actggtaatt ttcatttttc ttcttttttt aattgcttat tcaaaattct tgattatatt 5640
gcgtacactt aagtttacca aatataaatt aatggggtat ttttgtgaat gtaataggtg 5700
gatcattcaa tagtagaaag ttttgcacaa agtggaagga cagcaataac gtcaagggta 5760
tatccaacaa aggcaatata tgaagatgct aagctctact tatttaacaa tgctacagat 5820
gttagcatta ctgcctcact caagatttgg caaatgaatt ctgcaaatat acaatctagt 5880
taa 5883
<210> 4
<211> 645
<212> PRT
<213> 普通烟草
<400> 4
Met Ala Glu Thr Asn Asn Ser Val Pro Tyr Thr Gln Leu Pro Ala Glu
1 5 10 15
Asp Asn Asn Thr Ser Ser Asn Ser Pro Ala Lys Cys Arg Arg Arg Pro
20 25 30
Lys Arg Val Ser Phe Ile Val Leu Thr Gly Leu Val Ala Ala Leu Leu
35 40 45
Leu Phe Val Ala Val Lys Tyr Gly Asn Asn Glu Ala Glu Asp Val Asn
50 55 60
Pro Gly Pro Val Pro Pro Gln Glu Thr Val Cys Asn Met Leu Gly Ser
65 70 75 80
Asn Leu Met Pro Leu Thr Thr Met Arg Thr Val Ala Arg Gly Val Ala
85 90 95
Glu Gly Val Ser Ala Lys Ser Arg Gly Arg Phe Leu Gly Leu Arg Pro
100 105 110
Phe Pro Trp Thr Lys Gln Met Leu Ala Trp Gln Arg Thr Ser Phe His
115 120 125
Phe Gln Pro Lys Lys Asn Trp Met Asn Gly Pro Leu Phe Tyr Lys Gly
130 135 140
Trp Tyr His Leu Phe Tyr Gln Tyr Asn Pro Glu Ala Ala Val Trp Gly
145 150 155 160
Asn Ile Val Trp Gly His Ala Val Ser Arg Asp Leu Ile His Trp Gln
165 170 175
His Leu Pro Val Ala Met Val Ala Asp Gln Trp Tyr Asp Ile Asn Gly
180 185 190
Val Trp Thr Gly Ser Ala Thr Ile Leu Pro Asp Gly Lys Leu Val Met
195 200 205
Leu Tyr Thr Gly Ser Thr Asn Glu Ser Val Gln Val Gln Asn Leu Ala
210 215 220
Tyr Pro Ala Asp Pro Ser Asp Pro Leu Leu Arg Lys Trp Val Lys Tyr
225 230 235 240
Glu Gly Asn Pro Val Leu Val Pro Pro Pro Gly Ile Ala Thr Lys Asp
245 250 255
Phe Arg Asp Pro Thr Thr Ala Trp Thr Thr Pro Gln Gly Lys Trp Arg
260 265 270
Ile Thr Ile Gly Ser Lys Val Asn Lys Thr Gly Ile Ser Leu Val Tyr
275 280 285
Asp Thr Ile Asp Phe Lys Lys Phe Glu Leu Leu Asp Gly Val Leu His
290 295 300
Gly Val Pro Gly Thr Gly Met Trp Glu Cys Val Asp Phe Tyr Pro Val
305 310 315 320
Ser Lys Val Val Glu Asn Gly Leu Asp Thr Ser Asp Asn Gly Pro Ala
325 330 335
Val Lys His Val Leu Lys Ser Ser Leu Asp Asp Asp Arg Asn Asp Tyr
340 345 350
Tyr Ala Leu Gly Thr Tyr Asp Ala Val Ala Gly Lys Trp Ile Pro Asp
355 360 365
Asn Pro Thr Ile Asp Val Gly Ile Gly Leu Arg Tyr Asp Tyr Gly Asn
370 375 380
Phe Tyr Ala Ser Lys Thr Phe Tyr Asp Gln Glu Lys Lys Arg Arg Val
385 390 395 400
Leu Trp Ala Trp Ile Thr Glu Gly Asp Ser Glu Ala Ala Asp Ile Cys
405 410 415
Lys Gly Trp Ala Ser Leu Gln Pro Ile Pro Arg Thr Ile Lys Tyr Asp
420 425 430
Lys Lys Thr Gly Ser Asn Ile Ile Thr Trp Pro Val Ala Glu Val Glu
435 440 445
Asn Leu Arg Leu Asn Ser Lys Glu Phe Asp Lys Val Glu Val Lys Pro
450 455 460
Gly Ser Val Phe Pro Leu Glu Val Gly Thr Ala Thr Gln Leu Asp Ile
465 470 475 480
Met Ala Glu Phe Glu Ile Asp Pro Lys Val Leu Glu Arg Leu Glu Gly
485 490 495
Asn Asn Ala Thr Tyr Glu Cys Arg Ser Ser Gly Gly Ser Ala Glu Arg
500 505 510
Gly Ala Leu Gly Pro Phe Gly Leu Leu Val Leu Thr Asp Lys Gly Leu
515 520 525
Ser Glu Gln Thr Pro Ile Tyr Phe Tyr Ile Ala Lys Asp Ala Ala Gly
530 535 540
Asn Phe Thr Thr Phe Phe Cys Asn Asp Leu Thr Arg Ser Ser Glu Ala
545 550 555 560
Thr Asp Val Arg Lys Leu Ile Tyr Gly Ser Thr Val Pro Val Leu Gln
565 570 575
Gly Glu Lys Leu Ser Leu Arg Thr Leu Val Asp His Ser Ile Val Glu
580 585 590
Ser Phe Ala Gln Ser Gly Arg Thr Ala Ile Thr Ser Arg Val Tyr Pro
595 600 605
Thr Lys Ala Ile Tyr Glu Asp Ala Lys Leu Tyr Leu Phe Asn Asn Ala
610 615 620
Thr Asp Val Ser Thr Ala Ser Leu Lys Ile Trp Gln Met Asn Ser Ala
625 630 635 640
Asn Ile Gln Ser Ser
645
<210> 5
<211> 4155
<212> DNA
<213> 普通烟草
<400> 5
atggccaccc accattccca ttatgacccg gaaaactcca cgacccatta cactgtccta 60
ccggatcaac ccgaatccgc cggcgccggg cgccggaagt ctcttaaagt tgtctccggc 120
attttgctct cctctttctt tttgctttct ttagtctttg tgatcctcaa ccagtcttca 180
gatttatcac aagaaaactc ccgctcgtcg gagactttga cgccggcgtt gtcacgaggt 240
gtatctcagg gagtttccga gaagactttc aaggatgttt ccggtagaag cctttcgtac 300
tacccgtgga ctaatgctat gcttacttgg caaaggactg cttaccattt tcaacctcaa 360
aagaattgga tgaacggtaa attttttggc ttatctttct cttattaatt cttttaataa 420
aacatgaatt ttaagatact tatactggct ttttcttatt gattcttatg gctattttgt 480
tggggtatcc tatggattct gattggatga tatgctgcag atcctaatgg tgagtttact 540
tattaccata attacttttt attatttatt attcccaaac catgattagt gcatccggct 600
attggttaaa gattcacaaa accaataaaa tagtaatctt gtcatagttt ccataataat 660
ctacacgtac gctattgttt aatgacaaga aatttgacgc tcagcatagt taattctctc 720
atatttgtat tgtttacttt atagcctttg agctaattaa ttctgggttt ctttgaacta 780
aacctttata agttacaatc acacatagat gagttggcac attattcagg ctaataatga 840
aagaaattgg attacttgac taatatggca aatgcggcca atttaatttg gattaacacg 900
atatatgtgt ggtaataatg cttttgtgca acatctctca tacaaggaca catgattagg 960
tgattttgta ccaagtctcg ggaccaatca caatatatgg gtcacacctt atatattatt 1020
gtaagagttg ggacccacca aggatttgtc tgtctttcca actagccact tgtctttttc 1080
tcttttttat atttttaaat gaaatggtgt gggtttttta tttttgggtc gatctaaccg 1140
cttctgccta ttatcaattt agccttgtga ttgtgagaat agaagagaga aatagaggat 1200
aataataata aggataagaa ttaagaacgt accttcttat tgtcgaaatt atttgagaag 1260
actattcatt gttctgatta gtgtccatcg atgtcccttt cctccttttt ctatcttgga 1320
gaggtttcct cttctttgtt ttacttttcc tttttctaaa tatgcattcc aaaatcttaa 1380
cactactcga acgtccattc ttggaaagtc tctttgaaag tttagggcaa catcattcgg 1440
acaacttaat tagcattcac tattaaaaat taatagaaca gaaaagttca tgtatttttt 1500
tagggagagt aagaggcgga ttcagaattt aaatcttatg tgtttagttt ttaaaatttt 1560
taggattgat aactgaacat ggcgagaaac atgaacatgt gacataaatt ccgtgtttca 1620
acactaaaca ggtccattat accacaaagg atggtaccat cttttttatc aatacaatcc 1680
tgattcagct gtttggggaa atatcacatg gggccatgca atatccacgg acttgatcca 1740
ctggctttac ttgcctttcg ccatggttcc gatcaatggt acgatatcaa cggtgtctgg 1800
accgggtccg cgaccatctt gcccgacggt cagatcatga tgctatacac cggtgatacc 1860
aatgattacg tgcaggtgca aaatcttgca taccctgcta acttatcgga tcctctcctc 1920
atcgactggg tcaagtacca ggacaatccg gtcatggttc ccccacccgg cattggtgtc 1980
aaggacttca gagacccgac aactgcttgg accggacccc aaaacgggca gtggctgcta 2040
accatcgggt ccaagattgg taaaacgggt attgcacttg tttatgatac gtccaacttc 2100
acaaacttta agctattgga tggagttttg catgcggttc cgggtacggg tatgtgggag 2160
tgtgtggact tttacccggt atcaaccgtt gaggcaaacg ggttggacac atcatataac 2220
gggccaggta taagcatgtg ttaaaagcaa gtttagatga cgataagcat gattactatg 2280
ctattgggac atatgacccg gtaaagaaca aatggactcc tgataacccg gaattggatg 2340
tgggtatcgg gttgagactg gactacggga aatactatgc gtcaaagaca ttttatgacc 2400
cgaaagaaca aagaagaata ttgtggggat ggattggaga aactgacagt gaagctgctg 2460
atctgctgaa gggatgggca tctgtacagg tatggactct tttaagtaca ctacctcagc 2520
atccgaagag cattacactt ttatttttgt tttacattag accacatgaa tgggtgtttt 2580
ggcataactg gtaaagttgt tgccatgtga ccctgaggtc acgggttcga gccgtagaaa 2640
tagcctcttg cagtaatgta ataaactctt agtgcatagg gttgcctttt ttattagacc 2700
acacacatgt tcaagttatg tcatgttagt cgtgtcaatt ttttgtggaa atcaatttac 2760
tgcacctcaa tcttgaatta gttgagacta gctataggaa cctttgtatt gagaggactt 2820
atcataattt gatcattttt gcactaactg tcacactatg atattcactt tctttatcca 2880
gtttagtagt gtgccaatac accttaagca cgtgacaaga atttattagc agggtcatct 2940
cgattttatg taggagtaca gaattgaatt gaatcttttc ttctagtaaa ttctcaattg 3000
caacttgaca atgaagtttt tcagatgcaa aaaagatgaa atatctctaa taatttcctt 3060
ttccaataac agagtattcc aaggactctg ctttatgaca aggagacaag gacacatgta 3120
cttcagtggc cagttaaaga aattgagagc ttaagaattg gtgatcctct agtgaaacag 3180
gtcaatcttc aaccaggctc aattgagctt gtccatgttg actcagccgc acaggtttgc 3240
tttctcatcc ttcgaaattg aaaacgtttc acttatatgt gcttgatgta cagtcctaaa 3300
acttgtatgc gcaatggtgc agttggatgt agaagcctca tttgaagtgg acaaagcagc 3360
actcgcggga acaattgaag cagatgtggt ttcaactgca gtactagtgg aggtgctgct 3420
aaaagaggca ttttgggacc atttggtgtc gttgtaattg ctgatcaaac gctttctgag 3480
ctaaccccag tttacttcta cattgccaaa ggaactggtg gccgagctga aacctacttc 3540
tgcgctgatg aaactaggtt tgcttctact atgtttatct tgtatactct atcttaatag 3600
tccttgtcaa agtatagagg aataacatag cggcgtgatc tgatgcagat cctcagaggc 3660
tcctggagtt gctaaacaag tgtatggtag ttcagtacca gtgttagatg gtgaacaaca 3720
ctcaatgaga ttattggtaa gtgataatcc ctttattctg actttcttca aatcaagaat 3780
aatatcaagc ttattagttc ttccagtcat cttacttaat ttgtggaaat gctccaaagt 3840
agtcaatttg gtaactattc aagataatgt ggttcagaat aatttgtgtt atgaatgtat 3900
ttgacagttg ggatgatctg ttttttagta aaatttctta aaaacttaat tcaggtggac 3960
cactcaattg tggaaagctt tgctcaagga ggaagaacag tcataacatc gcgaatttac 4020
ccaacaaaag caatcaatgg agcagcacga ctgttcgttt tcaacaatgc caccggggct 4080
agtgtgactg cctccctcaa gatttggtca ctcaaatcag ctgatattcg atccttcccc 4140
ttggaccagt tgtaa 4155
<210> 6
<211> 642
<212> PRT
<213> 普通烟草
<400> 6
Met Ala Thr His His Ser His Tyr Asp Pro Glu Asn Ser Thr Thr His
1 5 10 15
Tyr Thr Val Leu Pro Asp Gln Pro Glu Ser Ala Gly Ala Gly Arg Arg
20 25 30
Lys Ser Leu Lys Val Val Ser Gly Ile Leu Leu Ser Ser Phe Phe Leu
35 40 45
Leu Ser Leu Val Phe Val Ile Leu Asn Gln Ser Ser Asp Leu Ser Gln
50 55 60
Glu Asn Ser Arg Ser Ser Glu Thr Leu Thr Pro Ala Leu Ser Arg Gly
65 70 75 80
Val Ser Gln Gly Val Ser Glu Lys Thr Phe Lys Asp Val Ser Gly Arg
85 90 95
Ser Leu Ser Tyr Tyr Pro Trp Thr Asn Ala Met Leu Thr Trp Gln Arg
100 105 110
Thr Ala Tyr His Phe Gln Pro Gln Lys Asn Trp Met Asn Asp Pro Asn
115 120 125
Gly Pro Leu Tyr His Lys Gly Trp Tyr His Leu Phe Tyr Gln Tyr Asn
130 135 140
Pro Asp Ser Ala Val Trp Gly Asn Ile Thr Trp Gly His Ala Ile Ser
145 150 155 160
Thr Asp Leu Ile His Trp Leu Tyr Leu Pro Phe Ala Met Val Pro Asp
165 170 175
Gln Trp Tyr Asp Ile Asn Gly Val Trp Thr Gly Ser Ala Thr Ile Leu
180 185 190
Pro Asp Gly Gln Ile Met Met Leu Tyr Thr Gly Asp Thr Asn Asp Tyr
195 200 205
Val Gln Val Gln Asn Leu Ala Tyr Pro Ala Asn Leu Ser Asp Pro Leu
210 215 220
Leu Ile Asp Trp Val Lys Tyr Gln Asp Asn Pro Val Met Val Pro Pro
225 230 235 240
Pro Gly Ile Gly Val Lys Asp Phe Arg Asp Pro Thr Thr Ala Trp Thr
245 250 255
Gly Pro Gln Asn Gly Gln Trp Leu Leu Thr Ile Gly Ser Lys Ile Gly
260 265 270
Lys Thr Gly Ile Ala Leu Val Tyr Asp Thr Ser Asn Phe Thr Asn Phe
275 280 285
Lys Leu Leu Asp Gly Val Leu His Ala Val Pro Gly Thr Gly Met Trp
290 295 300
Glu Cys Val Asp Phe Tyr Pro Val Ser Thr Val Glu Ala Asn Gly Leu
305 310 315 320
Asp Thr Ser Tyr Asn Gly Pro Gly Ile Lys His Val Leu Lys Ala Ser
325 330 335
Leu Asp Asp Asp Lys His Asp Tyr Tyr Ala Ile Gly Thr Tyr Asp Pro
340 345 350
Val Lys Asn Lys Trp Thr Pro Asp Asn Pro Glu Leu Asp Val Gly Ile
355 360 365
Gly Leu Arg Leu Asp Tyr Gly Lys Tyr Tyr Ala Ser Lys Thr Phe Tyr
370 375 380
Asp Pro Lys Glu Gln Arg Arg Ile Leu Trp Gly Trp Ile Gly Glu Thr
385 390 395 400
Asp Ser Glu Ala Ala Asp Leu Leu Lys Gly Trp Ala Ser Val Gln Ser
405 410 415
Ile Pro Arg Thr Leu Leu Tyr Asp Lys Glu Thr Arg Thr His Val Leu
420 425 430
Gln Trp Pro Val Lys Glu Ile Glu Ser Leu Arg Ile Gly Asp Pro Leu
435 440 445
Val Lys Gln Val Asn Leu Gln Pro Gly Ser Ile Glu Leu Val His Val
450 455 460
Asp Ser Ala Ala Gln Leu Asp Val Glu Ala Ser Phe Glu Val Asp Lys
465 470 475 480
Ala Ala Leu Ala Gly Thr Ile Glu Ala Asp Val Gly Phe Asn Cys Ser
485 490 495
Thr Ser Gly Gly Ala Ala Lys Arg Gly Ile Leu Gly Pro Phe Gly Val
500 505 510
Val Val Ile Ala Asp Gln Thr Leu Ser Glu Leu Thr Pro Val Tyr Phe
515 520 525
Tyr Ile Ala Lys Gly Thr Gly Gly Arg Ala Glu Thr Tyr Phe Cys Ala
530 535 540
Asp Glu Thr Arg Ser Ser Glu Ala Pro Gly Val Ala Lys Gln Val Tyr
545 550 555 560
Gly Ser Ser Val Pro Val Leu Asp Gly Glu Gln His Ser Met Arg Leu
565 570 575
Leu Val Asp His Ser Ile Val Glu Ser Phe Ala Gln Gly Gly Arg Thr
580 585 590
Val Ile Thr Ser Arg Ile Tyr Pro Thr Lys Ala Ile Asn Gly Ala Ala
595 600 605
Arg Phe Val Phe Asn Asn Ala Thr Gly Ala Ser Val Thr Ala Ser Leu
610 615 620
Lys Ile Trp Ser Leu Lys Ser Ala Asp Ile Arg Ser Phe Pro Leu Asp
625 630 635 640
Gln Leu
<210> 7
<211> 1919
<212> DNA
<213> 普通烟草
<400> 7
atgatgttat acaccggtga taccaatgat tacgtgcagg tgcaaaatct tgcgtacccc 60
gccaacttat cggatcccct cctcatcgac tgggtcaagt accggggcaa cccggtcatg 120
gttccaccac ccggcattgg tgtcaaggac tttagagacc caacgactgc ttggaccgga 180
ccacaaaacg ggcagtggct gcttaccatc gggtccaaga ttggtaaaac gggtattgca 240
attgtttatg gtacttccaa cttcacaaac tttaagctat tggatggagt tttgcatgcg 300
gttccgggta cgggtatgtg ggagtgtgtg gacttttacc cggtatcaac cgatgaggca 360
aacgggttgg acacatcata taacgggcca ggtataaagc atgtgttaaa agcaagttta 420
gatgacgata agcatgatta ctatgctatt gggacatatg accggtaaag aacaaatgga 480
ctcctgataa cccgcaattg gatgtgggta tcgggttgag actggactac gggaaatact 540
atgcgtcaaa gacattttat gacccgaagg aacaaagaag aatattgtgg ggatggattg 600
gggaaactga cagtgaagct gctgatctgc tgaagggatg ggcatctgta caggtatgga 660
cacttttcaa gtacactacc tcagcttccg aagagcatta cacatttatt tttgtattac 720
attagggtgc cttggcgtaa ctctggtaaa gtaagttctg aattgcaacg tgaaaatgga 780
ggtttttaga tgcaaagaga tgatatatcc ctaatagttt tcctgtttta ataacagagt 840
attccaagga ctgtgcttta tgataaggag actaggacac atgttcttca gtggccagtt 900
aaagaaattg agagcttaag aattggtgat cctctagtga aacgggtcaa tcttcaacca 960
ggctcaattg agctagtcca tgttgactca gccgcacagg ttgctttctc atccttggaa 1020
attgaaaacg tttcacttat atgtgcttaa tgtgcagtcc taaaacttgt atgtgcaatg 1080
gtgcagttgg atgtagaagc ctcatttgaa gtggacaaag cagcactcga gggaacaatt 1140
gaagcagatg ttggtttcaa ctgcagtact agtggaggtg ctgctaaaag aggcattttg 1200
ggaccatttg gtgtcgttgt aattgctgat caaacgcttt ctgagctaac tccagtttac 1260
ttctacattg ccaaaggacc tgatggccga gctgaaacct acttctgtgc tgatgaaact 1320
aggtttgctt ctactatgtt tatcttgtat actctatctt aatagtcctt gtcaaagtat 1380
agatgaataa catagcggcg tgatctgatg cagatcctca gaggctcctg gagttgctaa 1440
acaagtgtat ggtagttcag taccagtgtt agatgatgaa caacactcaa tgagattatt 1500
ggtaagtgat aatcccgtta ttctgacctt cgtcaaatca gaataatatc aagcttatta 1560
gttcttccag tcatcttatt aaatttatgg aaatgctcca aagtagtcaa tttggtaact 1620
attcaagata atgtggttca gaataatttg tgttatgaat gtatttgaca gttgggatga 1680
tctgtgtttt tgagtaaaat ttcttaaaac tgaactcagg tggaccactc aattgtggag 1740
agctttgctc aaggaggaag aacagtcata acatcgcgaa tttacccaac aaaggcaatc 1800
aatggagcag cacgactgtt cgttttcaac aatgccacga gggcaaggtg actgcctccc 1860
tgaagatttg gtcactcgaa tcagctgata ttcgatcctt ccccttggac cagttgtaa 1919
<210> 8
<211> 638
<212> PRT
<213> 普通烟草
<400> 8
Met Ala Thr His His Ser His Tyr Asp Pro Glu Asn Ser Thr Thr His
1 5 10 15
Tyr Thr Val Leu Pro Asp Gln Pro Glu Ser Ala Gly Ser Gly His Arg
20 25 30
Lys Ser Leu Lys Val Val Ser Gly Ile Leu Leu Ser Ser Phe Phe Leu
35 40 45
Leu Ser Leu Val Phe Val Ile Val Asn Gln Ser Ser Asp Leu Ser Gln
50 55 60
Lys Asn Ser His Ser Ser Glu Thr Leu Thr Pro Ala Leu Ser Arg Gly
65 70 75 80
Val Ser Gln Gly Val Ser Glu Lys Thr Phe Arg Asp Val Ser Gly Gly
85 90 95
Ser Leu Ser Tyr Tyr Pro Trp Thr Asn Ala Met Leu Thr Trp Gln Arg
100 105 110
Thr Ala Tyr His Phe Gln Pro Gln Lys Asn Trp Met Asn Gly Pro Leu
115 120 125
Tyr His Lys Gly Trp Tyr His Leu Phe Tyr Gln Tyr Asn Pro Asp Ser
130 135 140
Ala Ile Trp Gly Asn Ile Thr Trp Gly His Ala Ile Ser Thr Asp Leu
145 150 155 160
Ile His Trp Leu Tyr Leu Pro Phe Ala Leu Val Pro Asp Gln Trp Tyr
165 170 175
Asp Ile Asn Gly Val Trp Thr Gly Ser Ala Thr Phe Leu Pro Asp Gly
180 185 190
Gln Ile Met Met Leu Tyr Thr Gly Asp Thr Asn Asp Tyr Val Gln Val
195 200 205
Gln Asn Leu Ala Tyr Pro Ala Asn Leu Ser Asp Pro Leu Leu Ile Asp
210 215 220
Trp Val Lys Tyr Arg Gly Asn Pro Val Met Val Pro Pro Pro Gly Ile
225 230 235 240
Gly Val Lys Asp Phe Arg Asp Pro Thr Thr Ala Trp Thr Gly Pro Gln
245 250 255
Asn Gly Gln Trp Leu Leu Thr Ile Gly Ser Lys Ile Gly Lys Thr Gly
260 265 270
Ile Ala Ile Val Tyr Gly Thr Ser Asn Phe Thr Asn Phe Lys Leu Leu
275 280 285
Asp Gly Val Leu His Ala Val Pro Gly Thr Gly Met Trp Glu Cys Val
290 295 300
Asp Phe Tyr Pro Val Ser Thr Asp Glu Ala Asn Gly Leu Asp Thr Ser
305 310 315 320
Tyr Asn Gly Pro Gly Ile Lys His Val Leu Lys Ala Ser Leu Asp Asp
325 330 335
Asp Lys His Asp Tyr Tyr Ala Ile Gly Thr Tyr Asp Pro Val Lys Asn
340 345 350
Lys Trp Thr Pro Asp Asn Pro Gln Leu Asp Val Gly Ile Gly Leu Arg
355 360 365
Leu Asp Tyr Gly Lys Tyr Tyr Ala Ser Lys Thr Phe Tyr Asp Pro Lys
370 375 380
Glu Gln Arg Arg Ile Leu Trp Gly Trp Ile Gly Glu Thr Asp Ser Glu
385 390 395 400
Ala Ala Asp Leu Leu Lys Gly Trp Ala Ser Val Gln Ser Ile Pro Arg
405 410 415
Thr Val Leu Tyr Asp Lys Glu Thr Arg Thr His Val Leu Gln Trp Pro
420 425 430
Val Lys Glu Ile Glu Ser Leu Arg Ile Gly Asp Pro Leu Val Lys Arg
435 440 445
Val Asn Leu Gln Pro Gly Ser Ile Glu Leu Val His Val Asp Ser Ala
450 455 460
Ala Gln Leu Asp Val Glu Ala Ser Phe Glu Val Asp Lys Ala Ala Leu
465 470 475 480
Glu Gly Thr Ile Glu Ala Asp Val Gly Phe Asn Cys Ser Thr Ser Gly
485 490 495
Gly Ala Ala Lys Arg Gly Ile Leu Gly Pro Phe Gly Val Val Val Ile
500 505 510
Ala Asp Gln Thr Leu Ser Glu Leu Thr Pro Val Tyr Phe Tyr Ile Ala
515 520 525
Lys Gly Pro Asp Gly Arg Ala Glu Thr Tyr Phe Cys Ala Asp Glu Thr
530 535 540
Arg Ser Ser Glu Ala Pro Gly Val Ala Lys Gln Val Tyr Gly Ser Ser
545 550 555 560
Val Pro Val Leu Asp Asp Glu Gln His Ser Met Arg Leu Leu Val Asp
565 570 575
His Ser Ile Val Glu Ser Phe Ala Gln Gly Gly Arg Thr Val Ile Thr
580 585 590
Ser Arg Ile Tyr Pro Thr Lys Ala Ile Asn Gly Ala Ala Arg Leu Phe
595 600 605
Val Phe Asn Asn Ala Thr Arg Ser Val Thr Ala Ser Leu Lys Ile Trp
610 615 620
Ser Leu Glu Ser Ala Asp Ile Arg Ser Phe Pro Leu Asp Gln
625 630 635
<210> 9
<211> 98
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 用于沉默NtINV4-T和NtINV4-S的核苷酸序列
<400> 9
ggtttcaact gcagtactag tggaggtgct gctaaaagag gcattttggg accatttggt 60
gtcgttgtaa ttgctgatca aacgctttct gagctaac 98
<210> 10
<211> 4384
<212> DNA
<213> 普通烟草
<220>
<221> misc_feature
<222> (1520)..(1520)
<223> n是a、c、g或t
<400> 10
atggcagcta gtggtcttag cattaagaaa agtttggagg aatccatttt ggctcatcca 60
gatgaaattt tggctctcaa gtcaaggtac attactacat ataatgatat taagaactag 120
aggcttatcc aaggttttgt tacatttttg aaattataag tttagaacct aatagtactt 180
ggtagcactt gtttccttat tatctagctg ttgttactgc ttgttgctac tgctttctgt 240
tcatctttcc ttgagcccgg tctatcggaa acaacctctc tattctcaaa gtataaggtt 300
tgcgtacata ctacctcccc agactctact tgtggaattt actgtttttg ttgtgttgtt 360
gtaatctaat atttattaga attttactga tttttcacat atatatatct atgtcccctg 420
tcgaaaattc tatagctcat gttagctaaa tacattagta ccattgtttt taattgtttt 480
ggttttggca caggattgaa actgaaggga aaggggtaat gaaaccactt gatctcttga 540
accatttggt ttctgttact agtaagacaa atggagtaaa tattgtacct agtgcacttg 600
tggaagttct cagttgcagc caagaagctg tgattgtacc accaaaacta gcactagctg 660
tacgtccgag gcccggtgta tgggagtact tgtcactgaa tcttaagaca aagaaagtgg 720
ctgaattaag cattcctgaa taccttcaat tgaaagagaa cactgttgat gaaaggtaaa 780
gtattagtct gcgatttcgc tttgtgaaat tgaagttttt gttttgattc ataatgtttt 840
gtgtatcaat tatgttacca gtggaaacat attggagttg gattttgagc catttacaac 900
agttacacca ccaaaaacac tttctgactc tattggcaat ggtttggagt ttcttaatcg 960
ccacattgct tcgaaaatgt ttcatgataa ggagatttcc agatgcctcc ttgacttcct 1020
cagaaaccat aactacaaag gaaaggtaat aaaaaaaagt gtttctttaa acaagttgta 1080
tgattatgtg tatatttcta agtatgttaa cttgaaaaca gtcattgatg gtgaaagaaa 1140
gcattcaaag cctagagagt ttccaacttg ttctgaaaaa agcagaggaa catttgtgca 1200
cattgaatcc agaaactcca tactccaatt ttgaatcaaa gtttgaagag attggcttgg 1260
aaagagggtg gggaaacacc gctgaacgcg tgcaagacac tatcagtcat cttttgcatc 1320
tccttgaggc tcctaacgcg tcttctttgg aaaatttcct tggtagaatc ccattggttt 1380
tcaatgttgt gattctaact ccacatggtt attttgctca agataatgtc ttgggctatc 1440
ctgacactgg tggccaggtt tgtgtccaat attttgcatt cttgatcaag ttctttatac 1500
catttgaacc aacaatcttn aacattcttt ttttggttgt gaaatgttga ataggttgtt 1560
tacattcttg atcaagttcc agctatggag cgtgagatgc ttcatcgtat gaagcttcaa 1620
ggactcgatg atatcatccc tcgcatcctt gttgtaagtg gccttaattt tcctagtttc 1680
atttacacct ctaaatgaaa ttgatctttt ttgttgtttt atatcaggta acaaggctgc 1740
tgcctgatgc agtaggaacc acctgtggcg agcggatgga gaaagtatat ggggcagaac 1800
attctcatat aattcgtgtt ccatttagaa ctgagaaggg aatgttgcgc aaatggatct 1860
cacgattcga agtctggcca tacatggaaa ctttcactga ggttggaaca taaaaacaaa 1920
taaaatccat tggaatgttc cttctgcaat tgaaaatgtc ttgctaactg aagacccatt 1980
tttaaattga tcatcaggat gttgcagaag aacttgtcaa agaattgcaa gctaaaccag 2040
acttgatcat tggaaactac agtgagggaa atcttgctgc ctctttgctt gcgaagaaat 2100
ttggggctac tcagtgtact attgctcatg ccttggaaaa aactaagtat ccaaactctg 2160
accttaattg gaagaagttt gatgacaagt atcatttctc aagtcagttc actgctgatc 2220
tctttgccat gaatcacact gatttcatca tcaccagcac tttccaagaa attgctggaa 2280
ggtaaaagca aatgcacacc atcatagtat ttcatatttt tacccttgtt tatactattt 2340
ccattcaccg accccgactt gtttaggatt gagccatagt tgttgttgtt gtttgtttat 2400
actatttcca tttgccgacc acaacttgtt taggactgag gtatagttgt tgttgttggt 2460
ttgttcatat tattttcatt cgctaaccct aacttgtttg ggactgaggc atagtagtag 2520
tagtagttgt tgctattagt ttatactatt tccatttgcc aaccccaact tgtttggtac 2580
tgagacatag ttgttgttgt tgttgtttgt ttatactatt tccatttgcc gaccccaact 2640
tgtttaggac tgaggtatag ttgttgttgt tggtttgttc atattatttt cattcgctaa 2700
ccccaacttg tttgggactg aggcatagta gtagtagtag tagttgttgc tattagttta 2760
tactatttcc atttgccaac cccaacttgt ttggtactga gacatagttg ttgttgttgt 2820
ttgtttatac tatttcaatt tgtcgacccc aatttgtttg ggaccaaggc atggttgttg 2880
ttgttgtttg tttgttttta ctgtttccat tgatattgga acatttgtta tttgcagcaa 2940
aaacactgta ggacagtatg agagtcatac tgcttttacc atgcctggat tgtaccgagt 3000
agtccatgga atcgattcgt ttgatccaaa gttcaacatt gtctcccctg gggctgatat 3060
gtcaatctac ttcccttaca ctgagaagga gaaaaggcta accaacttcc acccggaaat 3120
tgaagaactc ctctacagtc ctgttgagaa taaggaccac ttgttagtct ccttaatttg 3180
cttttatttc atcccattta tgatcgcttt tatcccaaca gatcgattaa tcatttgtta 3240
tcaacataaa cagatgtgtg ttgaaggacc ggaacaagcc aattctcttt accatggcaa 3300
ggctagatcg cgtgaagaat ctaacagggc tcgtggaatg gtatgctaag aatgcaaggc 3360
tgagggagct tgttaacctt gtggttgtag gcggagacag aaggaaagaa tccaaagatt 3420
tagaagagca agcagagatg aagaagatgt atgatcttat cgaaacctat aacctgaacg 3480
gccaattcag gtggatttct tcccaaatga atcgtgtgag gaacggagaa ctctatcgtt 3540
acattgcaga cacgaggggt gctttcgttc aaccagcatt ctacgaggct tttggtttga 3600
cagttgtaga gtctatgact tgtggtttgc caacttttgc tacttgtaat ggtggaccat 3660
ttgagattat agtgaatgga aaatctggtt tccatattga tcctaatcaa ggtgacaagg 3720
ctgctgatat gttggtaaat ttctttgaaa aatctaaaga agatccaagt tattgggatg 3780
ctatttccaa gggaggtctg caacgtattc ttgaaaagta agcttttgca tttgattagc 3840
acaagtgcac aaccaagatt taacttttga acaaactaaa actaaccctt ttttgtattt 3900
tcttttgcta ggtatacatg gcaaatttat tcacagaaag tgatcacact atctgggatt 3960
tatggattct ggaagtatgc aaccaagaat gataaagttg ctagtgcaaa gaagcgctat 4020
cttgagatgt tttatgaact tggatttaag aaatcagtaa gtgtcaattt taaaggggaa 4080
ccttggatca acggttaagt tgtctttgtg caacctatag gtcaggggtt tgagccgtag 4140
aagtagccac taatatttac attagggtag actgtgtaca tatcacaccc cttggggtac 4200
ggccctttcc tggatcctgt atgaacgcgg gatgccttgt gcaccgggct gtattttttt 4260
ttttagtgtc acttctgtat tttgtttgag cttgtttata aagtttggaa atctgctgct 4320
aatttgtata tttgttggtt gtgtatttca ggctgagaaa gttccattgg ctattgatga 4380
atag 4384
<210> 11
<211> 803
<212> PRT
<213> 普通烟草
<400> 11
Met Ala Ala Ser Gly Leu Ser Ile Lys Lys Ser Leu Glu Glu Ser Ile
1 5 10 15
Leu Ala His Pro Asp Glu Ile Leu Ala Leu Lys Ser Arg Ile Glu Thr
20 25 30
Glu Gly Lys Gly Val Met Lys Pro Leu Asp Leu Leu Asn His Leu Val
35 40 45
Ser Val Thr Ser Lys Thr Asn Gly Val Asn Ile Val Pro Ser Ala Leu
50 55 60
Val Glu Val Leu Ser Cys Ser Gln Glu Ala Val Ile Val Pro Pro Lys
65 70 75 80
Leu Ala Leu Ala Val Arg Pro Arg Pro Gly Val Trp Glu Tyr Leu Ser
85 90 95
Leu Asn Leu Lys Thr Lys Lys Val Ala Glu Leu Ser Ile Pro Glu Tyr
100 105 110
Leu Gln Leu Lys Glu Asn Thr Val Asp Glu Ser Gly Asn Ile Leu Glu
115 120 125
Leu Asp Phe Glu Pro Phe Thr Thr Val Thr Pro Pro Lys Thr Leu Ser
130 135 140
Asp Ser Ile Gly Asn Gly Leu Glu Phe Leu Asn Arg His Ile Ala Ser
145 150 155 160
Lys Met Phe His Asp Lys Glu Ile Ser Arg Cys Leu Leu Asp Phe Leu
165 170 175
Arg Asn His Asn Tyr Lys Gly Lys Ser Leu Met Val Lys Glu Ser Ile
180 185 190
Gln Ser Leu Glu Ser Phe Gln Leu Val Leu Lys Lys Ala Glu Glu His
195 200 205
Leu Cys Thr Leu Asn Pro Glu Thr Pro Tyr Ser Asn Phe Glu Ser Lys
210 215 220
Phe Glu Glu Ile Gly Leu Glu Arg Gly Trp Gly Asn Thr Ala Glu Arg
225 230 235 240
Val Gln Asp Thr Ile Ser His Leu Leu His Leu Leu Glu Ala Pro Asn
245 250 255
Ala Ser Ser Leu Glu Asn Phe Leu Gly Arg Ile Pro Leu Val Phe Asn
260 265 270
Val Val Ile Leu Thr Pro His Gly Tyr Phe Ala Gln Asp Asn Val Leu
275 280 285
Gly Tyr Pro Asp Thr Gly Gly Gln Val Val Tyr Ile Leu Asp Gln Val
290 295 300
Pro Ala Met Glu Arg Glu Met Leu His Arg Met Lys Leu Gln Gly Leu
305 310 315 320
Asp Asp Ile Ile Pro Arg Ile Leu Val Val Thr Arg Leu Leu Pro Asp
325 330 335
Ala Val Gly Thr Thr Cys Gly Glu Arg Met Glu Lys Val Tyr Gly Ala
340 345 350
Glu His Ser His Ile Ile Arg Val Pro Phe Arg Thr Glu Lys Gly Met
355 360 365
Leu Arg Lys Trp Ile Ser Arg Phe Glu Val Trp Pro Tyr Met Glu Thr
370 375 380
Phe Thr Glu Asp Val Ala Glu Glu Leu Val Lys Glu Leu Gln Ala Lys
385 390 395 400
Pro Asp Leu Ile Ile Gly Asn Tyr Ser Glu Gly Asn Leu Ala Ala Ser
405 410 415
Leu Leu Ala Lys Lys Phe Gly Ala Thr Gln Cys Thr Ile Ala His Ala
420 425 430
Leu Glu Lys Thr Lys Tyr Pro Asn Ser Asp Leu Asn Trp Lys Lys Phe
435 440 445
Asp Asp Lys Tyr His Phe Ser Ser Gln Phe Thr Ala Asp Leu Phe Ala
450 455 460
Met Asn His Thr Asp Phe Ile Ile Thr Ser Thr Phe Gln Glu Ile Ala
465 470 475 480
Gly Ser Lys Asn Thr Val Gly Gln Tyr Glu Ser His Thr Ala Phe Thr
485 490 495
Met Pro Gly Leu Tyr Arg Val Val His Gly Ile Asp Ser Phe Asp Pro
500 505 510
Lys Phe Asn Ile Val Ser Pro Gly Ala Asp Met Ser Ile Tyr Phe Pro
515 520 525
Tyr Thr Glu Lys Glu Lys Arg Leu Thr Asn Phe His Pro Glu Ile Glu
530 535 540
Glu Leu Leu Tyr Ser Pro Val Glu Asn Lys Asp His Leu Cys Val Leu
545 550 555 560
Lys Asp Arg Asn Lys Pro Ile Leu Phe Thr Met Ala Arg Leu Asp Arg
565 570 575
Val Lys Asn Leu Thr Gly Leu Val Glu Trp Tyr Ala Lys Asn Ala Arg
580 585 590
Leu Arg Glu Leu Val Asn Leu Val Val Val Gly Gly Asp Arg Arg Lys
595 600 605
Glu Ser Lys Asp Leu Glu Glu Gln Ala Glu Met Lys Lys Met Tyr Asp
610 615 620
Leu Ile Glu Thr Tyr Asn Leu Asn Gly Gln Phe Arg Trp Ile Ser Ser
625 630 635 640
Gln Met Asn Arg Val Arg Asn Gly Glu Leu Tyr Arg Tyr Ile Ala Asp
645 650 655
Thr Arg Gly Ala Phe Val Gln Pro Ala Phe Tyr Glu Ala Phe Gly Leu
660 665 670
Thr Val Val Glu Ser Met Thr Cys Gly Leu Pro Thr Phe Ala Thr Cys
675 680 685
Asn Gly Gly Pro Phe Glu Ile Ile Val Asn Gly Lys Ser Gly Phe His
690 695 700
Ile Asp Pro Asn Gln Gly Asp Lys Ala Ala Asp Met Leu Val Asn Phe
705 710 715 720
Phe Glu Lys Ser Lys Glu Asp Pro Ser Tyr Trp Asp Ala Ile Ser Lys
725 730 735
Gly Gly Leu Gln Arg Ile Leu Glu Lys Tyr Thr Trp Gln Ile Tyr Ser
740 745 750
Gln Lys Val Ile Thr Leu Ser Gly Ile Tyr Gly Phe Trp Lys Tyr Ala
755 760 765
Thr Lys Asn Asp Lys Val Ala Ser Ala Lys Lys Arg Tyr Leu Glu Met
770 775 780
Phe Tyr Glu Leu Gly Phe Lys Lys Ser Ala Glu Lys Val Pro Leu Ala
785 790 795 800
Ile Asp Glu
<210> 12
<211> 3926
<212> DNA
<213> 普通烟草
<400> 12
atggcaggca gtggtcttag cattaaggaa agtttggagg aatccatttt ggctcatcca 60
gatgaaattt tggctctcaa gtcaaggtac attactgcat aatgatatta agacctagaa 120
gcggatccaa gattttgtta catttttgaa attataagtt tagaatctaa tatttgttat 180
cgcttgtttc cttattatct tgctgttgtt actgcctgtt gctactagtt tctgttcatc 240
cttccttgag ctgagtttct atcggaaaca acctctctac tctcaaagta ggaataagtt 300
atgcgtacac actaccctcc ccagactcca cttgtgtaat ttactgagtt tgttgttgtt 360
gttgttgtaa tctaatactt gttagaattt tactgatttt tcacatatat atctatgacc 420
catgtcgaaa atactatagc tcatgtgcta aatacattag taccattgtt ttgtaattgt 480
tttggttttg gaacaggatt gaaactgaag ggaaaggggt aatgaaacca gttgatctct 540
tgaaccattt ggtttctgtt actagtaaaa caaatggagt aaatgttgta cctagtgcac 600
ttgtggaagt tctcagttgc agccaagaag ctgtgattgt accaccaaaa ctagcactag 660
ctgtacgtcc gaggcccggt gtatgggagt acttgtcact gaatcttaag acaaagaaag 720
tggctgaatt gagcattcct gagtaccttc aattgaaaga gaatactgtt gatgaaaggt 780
aaagtaatag tctgcgattt cgctttgtga aattgaagtt ttttgtttga ttcttaatgt 840
tttgtgtatc aattatgtta ccagtggaaa catcttggag ttggattttg agccatttac 900
aactgttaca acaccaaaaa cactttctga ctctattggc aatggtttgg agtttcttaa 960
tcgccacatt gcttcgaaaa tgtttcttga taaggagatt gccaagtgcc tccttgactt 1020
tctcagaaac cataactaca aaggaaaggt agtaaaaaaa gtgtttcttt aaacaagttg 1080
tatgattatg tgtgtatttc taaatatgtc aatttgaaaa cagtcattga tggtgaaaga 1140
aagcattcaa agcctggaga gtttccaact tgttctgaaa aaagcagagg aatatttgca 1200
cacactgaat ccagaaactc catactccaa atttgaatcc aagtttgaag agattggctt 1260
ggaaagaggg tggggaaaca ccgctgaacg cgtgcaagac accattagtc atcttttgca 1320
tctccttgag gctcctaacg cgtcttcctt ggaaaatttc cttggtagaa tcccattggt 1380
tttcaatgtt gtgattctca ccccacatgg ttattttgct caagataatg tcttgggcta 1440
tcctgacact ggtggccagg tttgtgtccg atataacata tcaagaaatt ttgcattctt 1500
gatcatgttc tttataccat ttgaaccaac attctttttt tggttgtgaa atgttgaata 1560
ggttgtttac attcttgatc aagttccagc tatggagcgt gagatgcttc atcgtatgaa 1620
gcttcaagga ctcgacgata tcatccctcg catccttgtt gtaagtgccc ttaattttcc 1680
tggtttggtt tacctctaaa tgaaattgat tttctggctt tctaactttt ttggattgat 1740
ctttttgttg ttttatatca ggtaactagg ctgctgcctg atgctgtagg aaccacttgt 1800
ggcgagtgga tggagaaagt atatggggca gaacattctc atataattcg tgttccattt 1860
agaactgaga aaggaatgtt gcgcaaatgg atctcacgat tcgaagtctg gccatacatg 1920
gaaactttca ctgaggttgg aacataaaaa caaataaaaa tcattggaat gttcttctgc 1980
atttgaaaat gtcttgctaa ctaaagactc atttttaaat taatcatcag gatgttgcag 2040
aagaacttgt caaagaattg caagctaaac cagacttgat aattggaaac tacagtgagg 2100
gaaatcttgc tgcctcattg cttgctaaga aatttggggc tactcagtgt actattgctc 2160
atgccttgga aaaaactaag tatccaaact ctgaccttaa ttggaagaag tttgatgaca 2220
agtatcattt ctcaagtcag ttcactgctg atctttttgc catgaatcac actgatttca 2280
ttatcaccag cactttccaa gaaattgctg gaaggtaaaa gcaaatgcac accatcatag 2340
tatttcatat ttttacccta gtttatacta tttccatttg tcaactccaa cttgtttggg 2400
attgaaccat agttgttgtt tgtttatact atttccattc gccgacccca acttatttgg 2460
gactgagaca taattgttgt tattattgtt tgtttgttta tactatttcc attctcagac 2520
cccaacttct ttgggactga gccgtagatt gttgttgttg ttgttgttgt tgtttgttta 2580
tgctatttcc gttcaccgac cccaacttat ttgggactga ggtgtagaag tagtcgttgt 2640
tgtttgttta tacgacttcc aattgatatt cgaatgtttt tatttttgca gcaagaacac 2700
tgtaggacag tatgagagtc atactgcttt taccatgcct ggattgtatc gagtagtcca 2760
tggaatcaat tcgtttgatc caaagttcaa cattgtctcc cctggggctg atatgtcaat 2820
ctacttccct tacactgaga aggagaaaag actaaccaac ttccacccgg aaattgaaga 2880
actcctctac agtcctgttg agaataagga ccacttgtta gtcttcttta tttcattcat 2940
ttttctacac cttttttttc aacagattga ttgattggtt cttatcaacg taaacagatg 3000
tgtgttgaag gaccagaaca agccaattct ctttaccatg gcaaggctag atcgcgtgaa 3060
gaatctaaca gggctcgtgg aatggtatgc aaagaatgca aggctaaggg agctcgttaa 3120
ccttgtggtt gtaggcggag acagaaggaa agaatccaaa gatttagaag agcaagcaga 3180
gatgaagaag atgtatgatc ttatcgaaac atacaacctg aatggccaat tcaggtggat 3240
ttcttcccaa atgaatcgtg tgaggaacgg agaactttat cgatacattg cagacacgag 3300
gggtgctttc gttcaaccag cattttatga ggcatttggt ttgacagttg ttgagtctat 3360
gacttgtggt ttgccaactt ttgctacttg taatggtgga ccatttgaga ttatagtgaa 3420
tggaaaatct ggtttccata ttgatcctaa tcaaggtgac aaggctgctg atatgttggt 3480
taatttcttc gaaaaatcta aagaagatcc aagttattgg gatactattt ccaagggtgg 3540
tctgcagcgt attcttgaaa agtaagcttt tgcatttgat tagcacaagt gtacaaccaa 3600
gatttaactt atgaacaaac taaaactaac ccttttttta ttttcttttg ctaggtatac 3660
atggcaaatt tattcacaga aagtgatcac attatctggg atttatggat tctggaaata 3720
tgcaaccaag aatgacaaag ttgctagtgc gaagaagcgc tatcttgaaa tgttttatga 3780
atttgggttt aagaaatcag taagtgtcac ttctgtattt tgtttgagct tgtttgtaaa 3840
gtttggcaat cttctgctaa tttgtactat atttgttgac ttgtgcattt caggctgaga 3900
aagttccatt ggctattgat gaatag 3926
<210> 13
<211> 803
<212> PRT
<213> 普通烟草
<400> 13
Met Ala Gly Ser Gly Leu Ser Ile Lys Glu Ser Leu Glu Glu Ser Ile
1 5 10 15
Leu Ala His Pro Asp Glu Ile Leu Ala Leu Lys Ser Arg Ile Glu Thr
20 25 30
Glu Gly Lys Gly Val Met Lys Pro Val Asp Leu Leu Asn His Leu Val
35 40 45
Ser Val Thr Ser Lys Thr Asn Gly Val Asn Val Val Pro Ser Ala Leu
50 55 60
Val Glu Val Leu Ser Cys Ser Gln Glu Ala Val Ile Val Pro Pro Lys
65 70 75 80
Leu Ala Leu Ala Val Arg Pro Arg Pro Gly Val Trp Glu Tyr Leu Ser
85 90 95
Leu Asn Leu Lys Thr Lys Lys Val Ala Glu Leu Ser Ile Pro Glu Tyr
100 105 110
Leu Gln Leu Lys Glu Asn Thr Val Asp Glu Ser Gly Asn Ile Leu Glu
115 120 125
Leu Asp Phe Glu Pro Phe Thr Thr Val Thr Thr Pro Lys Thr Leu Ser
130 135 140
Asp Ser Ile Gly Asn Gly Leu Glu Phe Leu Asn Arg His Ile Ala Ser
145 150 155 160
Lys Met Phe Leu Asp Lys Glu Ile Ala Lys Cys Leu Leu Asp Phe Leu
165 170 175
Arg Asn His Asn Tyr Lys Gly Lys Ser Leu Met Val Lys Glu Ser Ile
180 185 190
Gln Ser Leu Glu Ser Phe Gln Leu Val Leu Lys Lys Ala Glu Glu Tyr
195 200 205
Leu His Thr Leu Asn Pro Glu Thr Pro Tyr Ser Lys Phe Glu Ser Lys
210 215 220
Phe Glu Glu Ile Gly Leu Glu Arg Gly Trp Gly Asn Thr Ala Glu Arg
225 230 235 240
Val Gln Asp Thr Ile Ser His Leu Leu His Leu Leu Glu Ala Pro Asn
245 250 255
Ala Ser Ser Leu Glu Asn Phe Leu Gly Arg Ile Pro Leu Val Phe Asn
260 265 270
Val Val Ile Leu Thr Pro His Gly Tyr Phe Ala Gln Asp Asn Val Leu
275 280 285
Gly Tyr Pro Asp Thr Gly Gly Gln Val Val Tyr Ile Leu Asp Gln Val
290 295 300
Pro Ala Met Glu Arg Glu Met Leu His Arg Met Lys Leu Gln Gly Leu
305 310 315 320
Asp Asp Ile Ile Pro Arg Ile Leu Val Val Thr Arg Leu Leu Pro Asp
325 330 335
Ala Val Gly Thr Thr Cys Gly Glu Trp Met Glu Lys Val Tyr Gly Ala
340 345 350
Glu His Ser His Ile Ile Arg Val Pro Phe Arg Thr Glu Lys Gly Met
355 360 365
Leu Arg Lys Trp Ile Ser Arg Phe Glu Val Trp Pro Tyr Met Glu Thr
370 375 380
Phe Thr Glu Asp Val Ala Glu Glu Leu Val Lys Glu Leu Gln Ala Lys
385 390 395 400
Pro Asp Leu Ile Ile Gly Asn Tyr Ser Glu Gly Asn Leu Ala Ala Ser
405 410 415
Leu Leu Ala Lys Lys Phe Gly Ala Thr Gln Cys Thr Ile Ala His Ala
420 425 430
Leu Glu Lys Thr Lys Tyr Pro Asn Ser Asp Leu Asn Trp Lys Lys Phe
435 440 445
Asp Asp Lys Tyr His Phe Ser Ser Gln Phe Thr Ala Asp Leu Phe Ala
450 455 460
Met Asn His Thr Asp Phe Ile Ile Thr Ser Thr Phe Gln Glu Ile Ala
465 470 475 480
Gly Ser Lys Asn Thr Val Gly Gln Tyr Glu Ser His Thr Ala Phe Thr
485 490 495
Met Pro Gly Leu Tyr Arg Val Val His Gly Ile Asn Ser Phe Asp Pro
500 505 510
Lys Phe Asn Ile Val Ser Pro Gly Ala Asp Met Ser Ile Tyr Phe Pro
515 520 525
Tyr Thr Glu Lys Glu Lys Arg Leu Thr Asn Phe His Pro Glu Ile Glu
530 535 540
Glu Leu Leu Tyr Ser Pro Val Glu Asn Lys Asp His Leu Cys Val Leu
545 550 555 560
Lys Asp Gln Asn Lys Pro Ile Leu Phe Thr Met Ala Arg Leu Asp Arg
565 570 575
Val Lys Asn Leu Thr Gly Leu Val Glu Trp Tyr Ala Lys Asn Ala Arg
580 585 590
Leu Arg Glu Leu Val Asn Leu Val Val Val Gly Gly Asp Arg Arg Lys
595 600 605
Glu Ser Lys Asp Leu Glu Glu Gln Ala Glu Met Lys Lys Met Tyr Asp
610 615 620
Leu Ile Glu Thr Tyr Asn Leu Asn Gly Gln Phe Arg Trp Ile Ser Ser
625 630 635 640
Gln Met Asn Arg Val Arg Asn Gly Glu Leu Tyr Arg Tyr Ile Ala Asp
645 650 655
Thr Arg Gly Ala Phe Val Gln Pro Ala Phe Tyr Glu Ala Phe Gly Leu
660 665 670
Thr Val Val Glu Ser Met Thr Cys Gly Leu Pro Thr Phe Ala Thr Cys
675 680 685
Asn Gly Gly Pro Phe Glu Ile Ile Val Asn Gly Lys Ser Gly Phe His
690 695 700
Ile Asp Pro Asn Gln Gly Asp Lys Ala Ala Asp Met Leu Val Asn Phe
705 710 715 720
Phe Glu Lys Ser Lys Glu Asp Pro Ser Tyr Trp Asp Thr Ile Ser Lys
725 730 735
Gly Gly Leu Gln Arg Ile Leu Glu Lys Tyr Thr Trp Gln Ile Tyr Ser
740 745 750
Gln Lys Val Ile Thr Leu Ser Gly Ile Tyr Gly Phe Trp Lys Tyr Ala
755 760 765
Thr Lys Asn Asp Lys Val Ala Ser Ala Lys Lys Arg Tyr Leu Glu Met
770 775 780
Phe Tyr Glu Phe Gly Phe Lys Lys Ser Ala Glu Lys Val Pro Leu Ala
785 790 795 800
Ile Asp Glu
<210> 14
<211> 4532
<212> DNA
<213> 普通烟草
<400> 14
atggctgaac gtgctctgac tcgtgttcac agccttcgtg aacgtcttga tgccactttg 60
gctgcacatc gcaatgagat attgctgttt ctttcaaggt attgcctaag tagtgttctt 120
gtttcctaca aaagattcag ttggtgttca aaaaacgata tgtgatttga tttatctgcc 180
taagtcttgg tagtcataat tatccggtac ctgtgctggt gcgagttagc tggttcggaa 240
actactctta tgaaaacgag agatttagtt ggtgttgtct gcaattctgt agtatggact 300
attaagcaga tagatcatgt ttgatatcga aaaggaatgt atatgtgatg ttacttgaac 360
tggttttggt tattacagga ttgaaagcca tggaaaaggg atcttgaaac ctcaccagct 420
attggctgag ttcgatgcaa ttcgccaaga tgacaaaaag aagctgaatg atcatgcatt 480
tgaagaactc ctgaaatcta ctcaggtaat tttgattttg gctaaatgtg ttaccaagct 540
gaatgatcat gcatttgagt ttgtgtccga ctactacaat gatatgttat accaggaagc 600
gattgttctg ccaccttggg ttgcacttgc cattcgtttg aggcctggtg tgtgggaata 660
tgtccgtgtg aatgttaatg ctctagtcgt tgaggagctg accgtccctg agtatttgca 720
ttttaaggaa gaacttgttg atggaacgta agttttagtc tcttatttga tactatgtta 780
gagaataggc agtggattca atttatcagt gttgtttttt acctaatgca gctccaatgg 840
aaatttcgtt ctcgagttgg attttgagcc cttcactgca tcctttccta aaccgaccct 900
caccaaatct attgggaatg gagttgaatt cctcaatagg cacctttctg cgaaaatgtt 960
ccatgacaag gaaagcatga ccccgcttct tgaatttctt cgggttcaca attataaggg 1020
caaggtaact ttgttattcc cattcatata tatgttcagt ttgtgcttat catgcgccca 1080
atgatgtatg aatatgtact aaaggataga tgtacgattt cgtttgcaga caatgatgct 1140
gaatgacaga atacagaatt taaccactct gcaaaatgtc ctaaggaagg cagaggaata 1200
ccttattatg cttccccctg aaactccatt ttccgaattc gaacacaagt tccaagaaat 1260
tggattggag aagggatggg gcgacactgc ggagcgcgtg ctagagatga tatgcatgct 1320
tcttgatcta cttgaggctc ccgactcctg tactcttgag aagttcctag ggagaattcc 1380
tatggtgttc aacgtggtta tcctttcccc ccatggatat ttcgcccagg aaaatgtctt 1440
gggttatccc gacactggtg gccaggtgca ttactttagt ctttgtccgt gagtctatgt 1500
tgctcagatc ctctacaatg ccactgtacc cgtgtaggat actccaaata taatgcattt 1560
ttggaggatc tgtcaccggt gcaatggcat tttggaggtc ggagcaacaa acaactgcta 1620
gtatgcttct aaagcttgct tccataaatg ctaaggtcct tcacccgtaa tgtgcaggtt 1680
gtctacatat tagatcaagt tccagccttg gagcgtgaaa tgcttaaacg cctaaaggag 1740
caaggacttg atataacacc gcgtattctt attgttagta tttcttgtac ttgtaattgc 1800
tgcggattac acaaaatttt ctctttattg gcaacttatc ttgatattat tcccaggtta 1860
ctcgtctgct gcctgatgca gttggaacaa cttgtggtca gcggcttgag aaggtgtatg 1920
gagccgagca ctcacatatt cttagggtcc cctttaggac cgagaagggc attgttcgca 1980
aatggatatc tcgctttgaa gtgtggccat acatggagac tttcactgag gtgacactaa 2040
gcttccttgt atttgtctat cttctaattg gtattaggaa caatttgcta attattaacg 2100
ctttggcttt tcgtacatca ggatgttgca aaagaacttg ctgcagaact gcaggccaag 2160
ccagatttga taattggcaa ctatagcgag ggaaatcttg tggcttcatt gctggctcac 2220
aagttaggcg taacgcaggt ctgtgttatt tttcacctct tataaatctg attgtatttc 2280
cattagtctg gaactaaaag tactaaaatt ttcttttctt cgctgtgtta tttgccttct 2340
gcagtgcacc attgcccatg cattggagaa aacaaagtat cctgattctg acatctactg 2400
gaaaaaattt gacgaaaaat accatttctc gtcccagttt accgctgatc ttattgcaat 2460
gaatcacacc gattttatca tcaccagcac tttccaggag atagcaggaa ggtataacat 2520
caattgctaa ttcggttgca gtaacatttt gttcgatttc ttccccttat gcttaaccta 2580
ataccctaat gaattttcca gcaaggacac tgtcggacag tacgagagtc accaggcatt 2640
cacaatgcct ggattgtaca gagtcgttca cggcattgat gtgttcgatc ccaaattcaa 2700
cattgtctca cctggagctg atataaacct gtatttccca tattccgaga aggaaaagag 2760
attgacagca cttcacccag aaattgagga gcttctgtac agtgatgttg agaacgagga 2820
acatctgtaa gtttctaact tactcgtacc gtcagtggca gagccagaat tttcattaaa 2880
atggggtcaa aatataaaga cataaattca caaagaagcc aaggggtgtc aatatgtagt 2940
ataaatatat taaaaaaatt acctagctac acaatgtaat tttccgacaa aggggtatcg 3000
gttgcacttc ttgaatacat gtggctctgc cactgggtac agttacaaag tcctgttacc 3060
tatgtagatg agcttgtgct gaacatgttg tgattttggt aggtgtgtgc taaaggacag 3120
gaataagcca atcttattca caatggcgag attggatcgt gtgaagaact taaccggact 3180
tgttgagtgg tacgccaaga acgcacggct aagggagttg gttaaccttg ttgtcgttgg 3240
tggagaccga aggaaggaat ccaaagattt ggaagagcaa gcagagatga agaagatgta 3300
tgagctaata aagactcaca acttaaatgg ccaattcaga tggatttctt cacagatgaa 3360
ccgagtaagg aacggcgaac tctaccgata cattgccgac actaggggag ctttcgtgca 3420
gcctgcattc tatgaggctt tcggtttgac tgttgttgag gccatgacct gtggtttgcc 3480
tacatttgca actaatcatg gcggtccagc tgagatcatc gttaacggaa aatccggctt 3540
ccatatcgat ccatatcacg gtgagcaagc tgctgatctg ctagctgatt tctttgagaa 3600
atgtaagacg gaaccttctc attgggaaac tatttcaacc ggtggcctga agcgcatcca 3660
agagaagtaa gcaactcttt cttgactcta gtcattcaaa ttaacttggg atttgaggca 3720
tagttgattg ataatttatc gcgtctctac tactatatac aggtacacgt ggcaaatcta 3780
ctcggagaga ttattgacgt tggctgctgt ttacggtttc tggaaacatg tttctaagct 3840
tgatcgtcta gaaatccgtc gatatctaga aatgttttat gctctcaaat accggaagat 3900
ggtgagttct tctgcttcct gctcttctca tagtgtttaa tatacacttg attgattgca 3960
ttcacttaga ctaagttgct cggacacggg tgtggatgtc cgacacgagt gcggatctag 4020
agttcagatc cttcaagatg taaattataa gattcgggga tatggatcct agtacggata 4080
cgggtgcgag aatccggcta aaaataattt taaaaaaaat tatctctaaa ttatgagata 4140
ttatgtggaa tacttacgta taacttgtaa agtgtagatt ttttttaatt ctcaagttgt 4200
agattagtaa atgattgatt tcctagataa gtatgctatt ttcttcaaat ttactcttct 4260
gatttcgaaa atcaaattgt atctcgtctc gaatttttcc gtccgttatg gtcaaagtac 4320
ccaaaatcgt ttgaccaaat cggtacggat cccataccca cacccacact agtgtcgtat 4380
tgacacgggt gccgcaccta aactgctatg tcggagcaac ttagcactta gagaatcatt 4440
gatgttaaat tttcttaatt cttgaatctg ctaatgaaga ttttatcttg gtttttgttt 4500
aggctgaagc tgttccattg gctgctgaat ga 4532
<210> 15
<211> 805
<212> PRT
<213> 普通烟草
<400> 15
Met Ala Glu Arg Ala Leu Thr Arg Val His Ser Leu Arg Glu Arg Leu
1 5 10 15
Asp Ala Thr Leu Ala Ala His Arg Asn Glu Ile Leu Leu Phe Leu Ser
20 25 30
Arg Ile Glu Ser His Gly Lys Gly Ile Leu Lys Pro His Gln Leu Leu
35 40 45
Ala Glu Phe Asp Ala Ile Arg Gln Asp Asp Lys Lys Lys Leu Asn Asp
50 55 60
His Ala Phe Glu Glu Leu Leu Lys Ser Thr Gln Glu Ala Ile Val Leu
65 70 75 80
Pro Pro Trp Val Ala Leu Ala Ile Arg Leu Arg Pro Gly Val Trp Glu
85 90 95
Tyr Val Arg Val Asn Val Asn Ala Leu Val Val Glu Glu Leu Thr Val
100 105 110
Pro Glu Tyr Leu His Phe Lys Glu Glu Leu Val Asp Gly Thr Ser Asn
115 120 125
Gly Asn Phe Val Leu Glu Leu Asp Phe Glu Pro Phe Thr Ala Ser Phe
130 135 140
Pro Lys Pro Thr Leu Thr Lys Ser Ile Gly Asn Gly Val Glu Phe Leu
145 150 155 160
Asn Arg His Leu Ser Ala Lys Met Phe His Asp Lys Glu Ser Met Thr
165 170 175
Pro Leu Leu Glu Phe Leu Arg Val His Asn Tyr Lys Gly Lys Thr Met
180 185 190
Met Leu Asn Asp Arg Ile Gln Asn Leu Thr Thr Leu Gln Asn Val Leu
195 200 205
Arg Lys Ala Glu Glu Tyr Leu Ile Met Leu Pro Pro Glu Thr Pro Phe
210 215 220
Ser Glu Phe Glu His Lys Phe Gln Glu Ile Gly Leu Glu Lys Gly Trp
225 230 235 240
Gly Asp Thr Ala Glu Arg Val Leu Glu Met Ile Cys Met Leu Leu Asp
245 250 255
Leu Leu Glu Ala Pro Asp Ser Cys Thr Leu Glu Lys Phe Leu Gly Arg
260 265 270
Ile Pro Met Val Phe Asn Val Val Ile Leu Ser Pro His Gly Tyr Phe
275 280 285
Ala Gln Glu Asn Val Leu Gly Tyr Pro Asp Thr Gly Gly Gln Val Val
290 295 300
Tyr Ile Leu Asp Gln Val Pro Ala Leu Glu Arg Glu Met Leu Lys Arg
305 310 315 320
Leu Lys Glu Gln Gly Leu Asp Ile Thr Pro Arg Ile Leu Ile Val Thr
325 330 335
Arg Leu Leu Pro Asp Ala Val Gly Thr Thr Cys Gly Gln Arg Leu Glu
340 345 350
Lys Val Tyr Gly Ala Glu His Ser His Ile Leu Arg Val Pro Phe Arg
355 360 365
Thr Glu Lys Gly Ile Val Arg Lys Trp Ile Ser Arg Phe Glu Val Trp
370 375 380
Pro Tyr Met Glu Thr Phe Thr Glu Asp Val Ala Lys Glu Leu Ala Ala
385 390 395 400
Glu Leu Gln Ala Lys Pro Asp Leu Ile Ile Gly Asn Tyr Ser Glu Gly
405 410 415
Asn Leu Val Ala Ser Leu Leu Ala His Lys Leu Gly Val Thr Gln Cys
420 425 430
Thr Ile Ala His Ala Leu Glu Lys Thr Lys Tyr Pro Asp Ser Asp Ile
435 440 445
Tyr Trp Lys Lys Phe Asp Glu Lys Tyr His Phe Ser Ser Gln Phe Thr
450 455 460
Ala Asp Leu Ile Ala Met Asn His Thr Asp Phe Ile Ile Thr Ser Thr
465 470 475 480
Phe Gln Glu Ile Ala Gly Ser Lys Asp Thr Val Gly Gln Tyr Glu Ser
485 490 495
His Gln Ala Phe Thr Met Pro Gly Leu Tyr Arg Val Val His Gly Ile
500 505 510
Asp Val Phe Asp Pro Lys Phe Asn Ile Val Ser Pro Gly Ala Asp Ile
515 520 525
Asn Leu Tyr Phe Pro Tyr Ser Glu Lys Glu Lys Arg Leu Thr Ala Leu
530 535 540
His Pro Glu Ile Glu Glu Leu Leu Tyr Ser Asp Val Glu Asn Glu Glu
545 550 555 560
His Leu Cys Val Leu Lys Asp Arg Asn Lys Pro Ile Leu Phe Thr Met
565 570 575
Ala Arg Leu Asp Arg Val Lys Asn Leu Thr Gly Leu Val Glu Trp Tyr
580 585 590
Ala Lys Asn Ala Arg Leu Arg Glu Leu Val Asn Leu Val Val Val Gly
595 600 605
Gly Asp Arg Arg Lys Glu Ser Lys Asp Leu Glu Glu Gln Ala Glu Met
610 615 620
Lys Lys Met Tyr Glu Leu Ile Lys Thr His Asn Leu Asn Gly Gln Phe
625 630 635 640
Arg Trp Ile Ser Ser Gln Met Asn Arg Val Arg Asn Gly Glu Leu Tyr
645 650 655
Arg Tyr Ile Ala Asp Thr Arg Gly Ala Phe Val Gln Pro Ala Phe Tyr
660 665 670
Glu Ala Phe Gly Leu Thr Val Val Glu Ala Met Thr Cys Gly Leu Pro
675 680 685
Thr Phe Ala Thr Asn His Gly Gly Pro Ala Glu Ile Ile Val Asn Gly
690 695 700
Lys Ser Gly Phe His Ile Asp Pro Tyr His Gly Glu Gln Ala Ala Asp
705 710 715 720
Leu Leu Ala Asp Phe Phe Glu Lys Cys Lys Thr Glu Pro Ser His Trp
725 730 735
Glu Thr Ile Ser Thr Gly Gly Leu Lys Arg Ile Gln Glu Lys Tyr Thr
740 745 750
Trp Gln Ile Tyr Ser Glu Arg Leu Leu Thr Leu Ala Ala Val Tyr Gly
755 760 765
Phe Trp Lys His Val Ser Lys Leu Asp Arg Leu Glu Ile Arg Arg Tyr
770 775 780
Leu Glu Met Phe Tyr Ala Leu Lys Tyr Arg Lys Met Ala Glu Ala Val
785 790 795 800
Pro Leu Ala Ala Glu
805
<210> 16
<211> 5901
<212> DNA
<213> 普通烟草
<400> 16
atgcttttta tgggagtaaa ttttatggcc ggtcattcaa ctttgtgttc attacgcaaa 60
agtcattttt cttggtgttt attacgcaag tcatttttct tttttttttg ttacgtaaaa 120
atcattcaac tatgtgttta ttatctaaaa ttcaattttt tttttccttt tgttacacaa 180
aaatcatttt actttactct atttatcaca aaagtcacct tggccagatt ttataatagg 240
cttttatctt ttgttacaca aaaattattt tactttactc tatttatcac aaaagtcacc 300
ttggccagat tttataatag gcttttatct tttgttacac aaaaattatt ttactttact 360
ctatttatca caaaagtcac cttggccaga ttttacaata cttttacctt aaaagactat 420
tatgcccttg acattataaa tcctctcatt tatataatac cttctatatg atacactata 480
taatatattt ttacctaggt attttactta taattaaaat aatattaaat tattttattt 540
atctatttta taatatattc atacatttaa ttttttcatg gcaaatcact ttgtttaatc 600
atatttaaac atgaacaaat tttaaatatc aaaaaaataa aaaaataaaa aaaatattta 660
tttgaaataa taacaaacag atttgtttaa caaatgatag ttttttttta tagtcaataa 720
aatttttaaa aaaattcaaa gatatttgtt tttaatatta atatttttaa agctttatct 780
gttaatatta tttatttgaa agtattaatc tgatgtgtca ttgtgttaaa tgtgagtatt 840
ttatttattg gattaatgag tatggcttgg ctgataaaaa gctttgattt tataattttc 900
attaaaaata ttttattaag ctagtacctg acaaatttaa tatcttgaaa attaacgtta 960
agaaaaaatt aaatataaaa atatattata aaaataataa ataaataata tcaagttatt 1020
ttaattataa ataaaataca tggttaaaaa tatattatat agcatataat atagaaggta 1080
ttacataaat gagatgattt aaagggcata atagactttt caggtgaatg atttgtaaaa 1140
tatggttaaa gtgattattg tgataattag agcatagtaa aataattttt atgtaacaaa 1200
agaaaaaaaa aatgactttt gggtaatgaa cataaatttg aataactttt acgtaacaaa 1260
agaataaaat aaattttgga taataaacat aaaattgaat gaccacctat aaaatttatt 1320
atttttttgg gctcttcttg atttgatttt ttagtttagc ctttgcagta atcttggttg 1380
tcacgcgtag cgttgtgctt tcgccacata agtatttagt agacttaatt aatgtcatta 1440
tatcggttgg tgtggtttta attacttaac tgtactatta tattaggtgg aaggtttgaa 1500
aatttatagt agtaacattc tagatcattg aaaatattgg tgtttcagtg actttttagt 1560
atgtcatttt cattttctaa gtggttgtac taatatagta tattaaaatt ttgattggtt 1620
gagaaacaat ctctctcacc tacacggtac gggtaaggta tgcgtatacg cttatcctcc 1680
ctacactcca tttgtgggac tattgttgtt attttggata agctgaggta tccatcttct 1740
actaactgca ctagtttatt ttttttgctg tttacagttg aaacaattgt ctgaggattt 1800
ctcacctgct gaatcaactg caatggctga acgtgtgctg actcgtgttc acagccttcg 1860
tgaacgtctt gatgctactt tggctgctca tcgcaatgag atattactgt ttctttcaag 1920
gtatagccaa agatagtatt cttgttaact aaaaaagatt cagttggtgt tcaaaaaacg 1980
atacgtttat ctgcctaagt cttggtagtc agaattatcc ggtacctatg ctggtgtgag 2040
ttagctggct aggaaaccac tcttatgaaa acaagagatt tagttagagt tgtctgtaat 2100
tctgtagtat ggactatgta tgtgatgcta tttgaactgg ttttggttat tataggattg 2160
aaagccatgg aaaagggatc ttgaaaccgc atcagctatt ggctgagttt gatgcaattc 2220
gccaagatga caaaaagaaa ctgaatgatc atgcatttga agaactcctg aagtccactc 2280
aggtaatatg gttttggcta tatttgtcgc caacgccaag ctcatatttt tatattattt 2340
tgagcttgtg tctgaatacg acgatgatat gttatactag gaagcaattg ttctgccacc 2400
ttgggttgca cttgcgattc gtttgaggcc tggtgtgtgg gaatatgtcc gtgtgaatgt 2460
caatgcgcta gtcgttgagg agctgactgt ccctgagtat ttgcatttca aggaagaact 2520
tgtcgatgga acgtaagtgt tagtcttcaa tttgatgcta tgttagagaa taggctgtgg 2580
aatttattga tcaatgctgt gctttgtcct gatacagctc caatggaaat ttcgttctcg 2640
agttggattt tgagcccttc accgcatcct ttcctaaacc aaccctcacc aaatctatcg 2700
gaaatggagt tgaattcctc aataggcacc tctctgcgaa aatgttccat gacaaggaaa 2760
gcatgacccc gcttcttgaa tttcttcggg ttcacaatta taagggcaag gtgacttgct 2820
atttccattt atctataggt tcggtttgtg cttatcatgc gcccaatgac atatgaatat 2880
gcgctaaagg atagatatat gatttccttt gcagacaatg atgctgaacg acagaataca 2940
gaatttaacc acactgcaaa atgtcctaag gaaggcagag gaatacctca ttatgcttcc 3000
ccctgaaact ccattttccg aattcgaaca caagttccaa gaaattggat tggagaaggg 3060
atggggcgac actgcagagc gcgtgctgga gatgatatgc atgcttcttg atctcctcga 3120
ggctcccgat tcctgtactc ttgagaagtt cttggggaga attcctatgg tgttcaatgt 3180
ggttatcctt tccccccacg gatatttcgc ccaggaaaat gtcttgggtt atcccgacac 3240
tggtggccag gtgcattact ttaatcttta tccgtgagtc tatgtttgtt cgaatcctct 3300
agaaatgtca ctgtacctat gtaggatact ccaaatataa tgcattttgg ggggatctgt 3360
tatgggtgcg atggcatttt tggaggtcgg agcaacaaac aattgctatg tattcttcta 3420
aagcttgctt tcataaatgc taaggtcctt cacccttaat gtgcaggttg tctatatatt 3480
agatcaagtt ccagccttgg agcgtgaaat gcttaagcgc ctaaaggagc aaggacttga 3540
tatcacaccg cgtattctta ttgttagtat ttcctgtact tgtaattact gcggattaca 3600
caaaatttcc tttttatctt cttaacaact tatcttgatg gtattcccag gttactcgtc 3660
tgctacctga tgcagttgga acgacttgtg gtcagcggct tgagaaggtg tatggagccg 3720
agcactcaca tattctgagg gtccccttta ggactgagaa gggcattgtt cgtaaatgga 3780
tctctcgctt tgaagtgtgg ccatatatgg agactttcac tgaggtgaca ctaaaacttc 3840
cttatatttg tctatcttct aattggtatt aggaataatt tgttaattgt taactctttg 3900
tcttttcgta catcaggatg tcgcaaaaga acttgctgca gaattgcagg ccaagccaga 3960
tttgataata ggcaactata gcgagggaaa tcttgtggct tcattgctcg ctcataagtt 4020
aggcgtaaca caggtctgtg ttgtttttca ctctcttaaa gatctgattg catttccatt 4080
agtctggaac tagaagtact aaaaagttct tttcttcact gtgttatttg ccgtcggcag 4140
tgcaccatag ctcatgcatt ggagaaaaca aagtatcctg attctgacat ctactggaaa 4200
aaattcgatg aaaaatacca tttctcgtcc cagtttaccg ctgatcttat tgcaatgaat 4260
cacaccgatt ttatcatcac cagcactttc caggagatag caggaaggta taacatcaat 4320
ttgctacttc gactgcaaca gcattgtgtt cccatttctt tcccttatgc ttaacctaat 4380
accgtcatga attttccagc aaggacactg tcggacagta cgagagtcat caggcattca 4440
caatgcccgg attgtacaga gttgttcacg gcattgatgt gttcgacccc aaattcaaca 4500
ttgtctcacc tggagctgac ataaacctct atttcccata ttccgagaag gaaaagagac 4560
tgacagcact tcaccctgaa atcgaggagc tgctgtacag tgacattgag aacgaggaac 4620
atctgtaagt ttctacctta ctcgtacagt cagtggcgga gccagaattt tcactaaaat 4680
aaggtcaaaa tataaagaca taaatccaca aagaagccaa gggtgtcaat atatagtata 4740
aatacattaa aaaaattacc tatctacaca gtgtaatttt ccgacaaagg ggtgtcggtt 4800
gacactcctt gaatacatgt ggctctgcca ctgggtacag ttacaaagtt ctgttaccta 4860
tgtagatgag cttgtgctga acatgttgtg attttggcag gtgtgtgcta aaggacagga 4920
ataagccaat cttattcaca atggcgagat tggatcgtgt gaagaattta accggacttg 4980
ttgagtggta tgccaagaac gcacggctaa gggagttggt taaccttgtt gtggttggtg 5040
gagatcgaag gaaagaatcc aaagatttgg aagagcaaac agaaatgaaa aagatgtatg 5100
agctaataaa gactcacaat ttaaatggcc aattcagatg gatttcttca cagatgaacc 5160
gagtgaggaa cggtgaactc taccgataca ttgctgacac tagaggagct ttcgtgcagc 5220
ctgcattcta cgaggctttc ggtttgactg ttgttgaggc catgacctgt ggtttgccta 5280
catttgcaac taatcatggc ggtccagctg agatcatcgt taacggaaaa tctggcttcc 5340
acatcgatcc atatcacggt gagcaagctg ctgatctgct agctgatttc tttgagaaat 5400
gtaagacaga accttctcat tgggaaacca tttcaacggg tggcctgaag cgcatccaag 5460
agaagtaagc aactctttct tgactctagt cattgaaatt aactttcttg actctagtca 5520
ttgaaattaa ctcgggattt gaggcgtagt tgattgatat tttatcgcgt ctctactact 5580
gatatataca ggtacacgtg gcaaatctac tcggagaggc tattgacatt ggctgctgtt 5640
tacgggttct ggaaacatgt ttctaagctt gatcgtctag aaatccgtcg atatcttgaa 5700
atgttttatg ctctcaaata ccgcaagatg gtgagttcct cttcttcctt gcccttctcc 5760
tagtgtttaa gatacaatat aattgattgc attatcttag agaatcatta atgttaaatt 5820
ttcttaattc ttgaatctgt taatgaagtt tttctcttgg tttttgttta ggctgaagct 5880
gttccattgg ctgctgagtg a 5901
<210> 17
<211> 825
<212> PRT
<213> 普通烟草
<400> 17
Met Leu Phe Met Gly Leu Lys Gln Leu Ser Glu Asp Phe Ser Pro Ala
1 5 10 15
Glu Ser Thr Ala Met Ala Glu Arg Val Leu Thr Arg Val His Ser Leu
20 25 30
Arg Glu Arg Leu Asp Ala Thr Leu Ala Ala His Arg Asn Glu Ile Leu
35 40 45
Leu Phe Leu Ser Arg Ile Glu Ser His Gly Lys Gly Ile Leu Lys Pro
50 55 60
His Gln Leu Leu Ala Glu Phe Asp Ala Ile Arg Gln Asp Asp Lys Lys
65 70 75 80
Lys Leu Asn Asp His Ala Phe Glu Glu Leu Leu Lys Ser Thr Gln Glu
85 90 95
Ala Ile Val Leu Pro Pro Trp Val Ala Leu Ala Ile Arg Leu Arg Pro
100 105 110
Gly Val Trp Glu Tyr Val Arg Val Asn Val Asn Ala Leu Val Val Glu
115 120 125
Glu Leu Thr Val Pro Glu Tyr Leu His Phe Lys Glu Glu Leu Val Asp
130 135 140
Gly Thr Ser Asn Gly Asn Phe Val Leu Glu Leu Asp Phe Glu Pro Phe
145 150 155 160
Thr Ala Ser Phe Pro Lys Pro Thr Leu Thr Lys Ser Ile Gly Asn Gly
165 170 175
Val Glu Phe Leu Asn Arg His Leu Ser Ala Lys Met Phe His Asp Lys
180 185 190
Glu Ser Met Thr Pro Leu Leu Glu Phe Leu Arg Val His Asn Tyr Lys
195 200 205
Gly Lys Thr Met Met Leu Asn Asp Arg Ile Gln Asn Leu Thr Thr Leu
210 215 220
Gln Asn Val Leu Arg Lys Ala Glu Glu Tyr Leu Ile Met Leu Pro Pro
225 230 235 240
Glu Thr Pro Phe Ser Glu Phe Glu His Lys Phe Gln Glu Ile Gly Leu
245 250 255
Glu Lys Gly Trp Gly Asp Thr Ala Glu Arg Val Leu Glu Met Ile Cys
260 265 270
Met Leu Leu Asp Leu Leu Glu Ala Pro Asp Ser Cys Thr Leu Glu Lys
275 280 285
Phe Leu Gly Arg Ile Pro Met Val Phe Asn Val Val Ile Leu Ser Pro
290 295 300
His Gly Tyr Phe Ala Gln Glu Asn Val Leu Gly Tyr Pro Asp Thr Gly
305 310 315 320
Gly Gln Val Val Tyr Ile Leu Asp Gln Val Pro Ala Leu Glu Arg Glu
325 330 335
Met Leu Lys Arg Leu Lys Glu Gln Gly Leu Asp Ile Thr Pro Arg Ile
340 345 350
Leu Ile Val Thr Arg Leu Leu Pro Asp Ala Val Gly Thr Thr Cys Gly
355 360 365
Gln Arg Leu Glu Lys Val Tyr Gly Ala Glu His Ser His Ile Leu Arg
370 375 380
Val Pro Phe Arg Thr Glu Lys Gly Ile Val Arg Lys Trp Ile Ser Arg
385 390 395 400
Phe Glu Val Trp Pro Tyr Met Glu Thr Phe Thr Glu Asp Val Ala Lys
405 410 415
Glu Leu Ala Ala Glu Leu Gln Ala Lys Pro Asp Leu Ile Ile Gly Asn
420 425 430
Tyr Ser Glu Gly Asn Leu Val Ala Ser Leu Leu Ala His Lys Leu Gly
435 440 445
Val Thr Gln Cys Thr Ile Ala His Ala Leu Glu Lys Thr Lys Tyr Pro
450 455 460
Asp Ser Asp Ile Tyr Trp Lys Lys Phe Asp Glu Lys Tyr His Phe Ser
465 470 475 480
Ser Gln Phe Thr Ala Asp Leu Ile Ala Met Asn His Thr Asp Phe Ile
485 490 495
Ile Thr Ser Thr Phe Gln Glu Ile Ala Gly Ser Lys Asp Thr Val Gly
500 505 510
Gln Tyr Glu Ser His Gln Ala Phe Thr Met Pro Gly Leu Tyr Arg Val
515 520 525
Val His Gly Ile Asp Val Phe Asp Pro Lys Phe Asn Ile Val Ser Pro
530 535 540
Gly Ala Asp Ile Asn Leu Tyr Phe Pro Tyr Ser Glu Lys Glu Lys Arg
545 550 555 560
Leu Thr Ala Leu His Pro Glu Ile Glu Glu Leu Leu Tyr Ser Asp Ile
565 570 575
Glu Asn Glu Glu His Leu Cys Val Leu Lys Asp Arg Asn Lys Pro Ile
580 585 590
Leu Phe Thr Met Ala Arg Leu Asp Arg Val Lys Asn Leu Thr Gly Leu
595 600 605
Val Glu Trp Tyr Ala Lys Asn Ala Arg Leu Arg Glu Leu Val Asn Leu
610 615 620
Val Val Val Gly Gly Asp Arg Arg Lys Glu Ser Lys Asp Leu Glu Glu
625 630 635 640
Gln Thr Glu Met Lys Lys Met Tyr Glu Leu Ile Lys Thr His Asn Leu
645 650 655
Asn Gly Gln Phe Arg Trp Ile Ser Ser Gln Met Asn Arg Val Arg Asn
660 665 670
Gly Glu Leu Tyr Arg Tyr Ile Ala Asp Thr Arg Gly Ala Phe Val Gln
675 680 685
Pro Ala Phe Tyr Glu Ala Phe Gly Leu Thr Val Val Glu Ala Met Thr
690 695 700
Cys Gly Leu Pro Thr Phe Ala Thr Asn His Gly Gly Pro Ala Glu Ile
705 710 715 720
Ile Val Asn Gly Lys Ser Gly Phe His Ile Asp Pro Tyr His Gly Glu
725 730 735
Gln Ala Ala Asp Leu Leu Ala Asp Phe Phe Glu Lys Cys Lys Thr Glu
740 745 750
Pro Ser His Trp Glu Thr Ile Ser Thr Gly Gly Leu Lys Arg Ile Gln
755 760 765
Glu Lys Tyr Thr Trp Gln Ile Tyr Ser Glu Arg Leu Leu Thr Leu Ala
770 775 780
Ala Val Tyr Gly Phe Trp Lys His Val Ser Lys Leu Asp Arg Leu Glu
785 790 795 800
Ile Arg Arg Tyr Leu Glu Met Phe Tyr Ala Leu Lys Tyr Arg Lys Met
805 810 815
Ala Glu Ala Val Pro Leu Ala Ala Glu
820 825
<210> 18
<211> 8323
<212> DNA
<213> 普通烟草
<400> 18
atggcgaatc caaagttcac aagagtacct agcatgaggg agagagttga ggatactctc 60
tctgctcacc gtaaccagct tgttgctctc ctctccaggt atattaataa actctatata 120
cttgttattt tctttatttt tttgtcttta ctgataaatt taactgtttt cttctttaaa 180
tcttgctttc gatgcatgat ttctgttgtg ttaaattgcg taaccatttt atctaaaagt 240
ttatgctgat aaacactttt aaattttaat atgtaaatta tattatgtct caacatcaac 300
atgtggatgg ccaaaaatat aaagcttaat tttcgttatt ttgaatgatt tttctctgcg 360
agtgttacgg tttgcgtaca cattacctaa acctcctccc tagtccccac ttgtgggaat 420
ttaatttttt ttttctttgt ttttttttgt tgttgttgtt gtctgagttc aattcctacc 480
atgttagctt ggcaaaaata agttggtaaa gcttgacccc aactagtttt agttgatcga 540
tttatttggt gatttatagt tcaataataa taattactat tagagaaagt tccagcagct 600
tttctgtttg tttttccagt tttagtgatt gatatatgtg tatatatatt ctttgtttct 660
tttaagatac gtggcgcagg ggaaggggat attgcaacct caccacttga tcgatgagtt 720
caacaacgct gtatgtgatg acactgcttg tgagaagctc aaagatggtc cctttagtga 780
agtcttgaaa gctactcagg tatattcact aatccatggg aatcaagatg atactgtata 840
tctttattat ggtgtctttc agaaatttga cgatgatgaa atgcaacttt tctctgtttg 900
tcaccttatc cagactgttt ttttattttt tatttttcat tttttaactt gaaatgctct 960
taatttcctt tgtttatcga taagaccgga tttacaatgt atgaacggag catcttaaga 1020
accttctgga atgaagatat aagatataaa acatggtgtc cgttttctcc tttgtggaat 1080
cagtgtacat atagactgtt attttggtcc cactttctgg atcttctgat cacaccttct 1140
catgcagagg cgagcttgat ggtttcaacc tttaaattct tactattgaa tccatttcac 1200
tttcgaaatt atgagttcga aatctaatat ttgttgaaat ttttgcaaat gttcacatat 1260
aagtttaagc tttgtgtcaa gaatactggg ctcaatggat tccaatagac caggctgtat 1320
ccgcctctgt ctccactctc cctgcatcca cttctttcgt gtgactaata atgcttaatg 1380
agctagaact cgttttaatg tttgaataag ttgcttatat cagagcagct tttgatgttt 1440
caatctttaa cgggttatgc agtaccagca ttctgcggct gaaaaacagg aatctgagat 1500
ttacttgtct ctggctgaat ttcttgttca ttttgctaac aagtactttg gagttaatgc 1560
ttgctctctg ttgtcaaaat aggaagccat tgtgctgcca ccatttgttg ccatagcagt 1620
tcgtccaagg ccaggtgttt gggagtatgt tcgtgttaat gtatatgatt tgagcgttga 1680
acaattgact gttcctgaat atcttcattt caaggaagaa cttgtggatg gagagtaagc 1740
tctttcttat ttcaatacga aacataaaaa tttacagaag ttgaataatt aacaaatttg 1800
ttgattttta atgtatgcca ggggtaataa tcactttgtg cttgagctgg attttgagcc 1860
atttaatgca tcagttcctc gtccatctcg atcgtcatcc attggcaatg gagtccaatt 1920
cctcaatcgt catctttcct caattatgtt tcgcagcaaa gactctctgg accccttact 1980
tgatttcctt agaggacact gtcataaagg gaatgtaagt accaaaagca gttttccctt 2040
tgtaaatgtc tgcttgtccc tgattatcta ctaaatcttt caacacgcgc aaccattata 2100
agaaatgtac aatacttcta gttagaattt catcatcgac aaactatctg ctttactttt 2160
tatttttccc atttgatgga tgatagttta gtttatataa cagatgatat tttggttgaa 2220
gggtaccatg aactttttca caaccactta atggatacat agttgtaata gttgacattt 2280
tggaataata ttgtctcact tggaaatgtt taagaagtat tactacttct atttgtaaga 2340
tggattgttt atctatgcag gtcttgatgt tgaatgatcg tatacagcga atctccaggc 2400
tggagtctgc tctttctaaa gcagaggatt atctctccaa gctatcacca gatacatcct 2460
ataatgagtt cgaatacgcg tgagcttgta cacatttgtt ttgttttctt tcaagcatat 2520
gtaatttctc aagaaaaggg aaatctatag gagttgaaac attctttatg gaaccatgtg 2580
catgcagatt gcaagaaatg ggctttgaga gaggttgggg tgatactgcc agacgtgttt 2640
tggagacgat gcatcttctt tctgacattc ttcaggctcc ggatccatca accttggaga 2700
catttcttgg tagactacct atggtgttca atgtcgtcat attatcccct catggatatt 2760
ttggccaagc aaatgtcttg ggtttgcccg acactggtgg ccaggtaata acaaggagaa 2820
tgaggtcttg tattatgtac tccctccgtt ccaatctata tgaacctatt tgactgggta 2880
tggaaagaaa tgaagacttg taaaacttgt ggttctttag aaattccaaa cattacattt 2940
ggttttttcc ctcttcctgg aaattatact actgaatcat ctctagatgt tccagtttaa 3000
cttgagacgt aagggtaaat aacggaccat tactctgtcc tttcttgcag taggcttggt 3060
acaatgaata tagttcgcat agttgccgga agctagagct gtgttagaaa actcaggaac 3120
attaatttgg cgatgctaat cactgctaat gttactgaag catccatggt tttccttgat 3180
gttattctcc ttttggttgc ttcacaggtt gtctatatac tggatcaagt gcgtgccttg 3240
gaggccgaaa tgcttcttag aataaagcaa caaggactta acttcaagcc tagaatcctt 3300
gtcgtgagta catatatatt atgcaagctc ttatttggtt tgtgggattg cagttgacat 3360
caatttgctt actctgatta ctaaaggtca cacggctgat acctgatgct aaaggaacca 3420
tgtgcaacca gaggttggag aggattagtg gaactgaata ctcgcatatt ttacgtgtcc 3480
cttttaggac agagaaggga atccttcata aatggatatc taggtttgat gtatggcctt 3540
acctggagaa gttcactgag gtaacctctt tgtcccttgg aaattgcctt ttgttgctga 3600
tgtttctgct agtgtgctta aatgacggat gttaactagt cacttgctag cgtttgcaat 3660
agcaacggga aaagaaagga tttttgctag tttgaagtct gcctccaaga aaaattatat 3720
taaaagttta tggctagtgg aaacatcagt cattcatgta ccttatttct atgcccaagt 3780
tgtttaagtt gaaagtaatt tggccaacta tgcaaattgg gagaacgtgt agccaactat 3840
tgtgtttgcc gacatgttga tatacttttt ggtcctgatt tatatttgtt ggtttgtcat 3900
actggatgaa gcaattctca tgtttttctg cttatatata ttggaagaag agatacttgt 3960
cgtttcatca tttttctcga cctctctatt accaacactt tgccaattta atgtttggaa 4020
atgtcttctt gaccaggatg tggcaagtga aatgaccgct gagctccagg gaaagccaga 4080
tctgattatt ggcaactaca gtgatggaaa tttagttgcc tcccttttgg catataaaat 4140
gggtgtcaca caggtaggaa atacatgatt ctttatcttg ctagcactaa gtcttgaggt 4200
tatgtatctg caatagaaat tttacgcttt gccttcattt ctttttaatt atttttccag 4260
tgtaccattg ctcatgcctt ggaaaaaaca aagtatcctg attctgacat ctactggaaa 4320
aagtttgagg agaaatatca tttttcatgt cagtttactg ctgatctact ggcaatgaat 4380
aattcagatt tcattatcac cagtacttat caagagattg caggaacgta agtcatttta 4440
atctggtcgt ttaaatctga tatttcttcc ctagtagtct attcaatccg aatttcagtt 4500
cagtatatga tgtcatcggt tgaggaactg tgattggtaa ccttatcaaa tccgtagctg 4560
ctctataatt ttatttcgta attggagaaa caatttttta ttattgagct tgtagtctga 4620
gctagaattt ggttctttat ctatcaagta gcataatact acaactattt tttatgtgtg 4680
gcaatttgca atttcaattt tctatttcta taagttgcag cttttcttcc tgttctgatc 4740
atatttacat ggctgaaact caatagaaaa ctaggctagt tgatcaaaag tagttggatg 4800
ctttaaaatt agtagacgtt ttgctaaatg agtgaccaat gttattaaaa aaacgttcat 4860
gttttcaacc cttttggcat acatttgacc actgcccaag attttggata agtacatgca 4920
gtgcttataa ttataaagca ttttatccca ccttgttttt cattatgaaa attaagtaat 4980
ttacgagtat ttgtataagt tacttcataa attagaagta aatctggatt gtgtaaagtt 5040
attcgccccg tatatactga aagctacttg aacaagcaaa aaaacagaca aacgtaacat 5100
tctccatgga ttaatgagac ttgtatatat atatatatat atatgtaaag agagagagag 5160
agagatttgg cttgtaacca catgtatatt atgccatatg gatgtgacat tgatgtgact 5220
agacctaaat gttttgtttc aatgtccacg ggagttttac gtagagttaa gaggagaaga 5280
gagtgaggaa tactaatgtt tgatggtacc ccttggcttc ttgacctgga tactcagtgt 5340
tcttattcat gcctatactt tggtccttga tttcattctc ccttttctag cttgagctgc 5400
atcaaagaaa ttccactgta aaaaaaataa tgctcaccat attggtgcaa catggcaaac 5460
atgtatccta tttgatgatc aatcaacttt atttttctcc tgttaattga cctcagtgtg 5520
taactctcta tgtatgatag cattgtaact tgtgtcatga ttcataaata gggtactaga 5580
attggatggt tgacatagta aatggtcaat tgatgatcca caaaatatgc acctactgat 5640
taaaatgtga tagggcaggt ttatttttgt ttgtggttaa cacagtactt aaccctatat 5700
ttaatacaat ttggcttatc tacaatcttt tcttcagtgt ttatgcgaat tccttattgc 5760
acaacaatat tgtctttctg agttctattc tgttgttgct tacactttta ttattccagt 5820
aacatagatg tgaagacatt agattggttg cttgcaaatt gatagccact tgtttcagga 5880
agaatactgt tggtcagtac gagagccata ctgcattcac cctcccggga ctatatcgcg 5940
tcgttcatgg cattgatgtt ttcgatccca aattcaatat agtgtctcct ggagctgaca 6000
tgacaattta tttcccatat tctgacaagg aaaaaagact aacgtctttg catggctcga 6060
ttgaaaagtt gttatttgat cctgcgcaga atgaagagca tatgtaagtg gcatccgttt 6120
gtacttaatt tttttggaat agatgacata ttatttgcat gaatatgaaa aggagggtct 6180
gatatgattt tctatagata aactaccaat gatattattt aaaaactcct ggatactgta 6240
ttaggagaag aagagaacca ggggtagatg gcattagaat cccttaaatc ttgaagagtc 6300
gtcactaacg ctcccaacac ttctgcctca gaccctcaac taaatactat tattgttgat 6360
ttctttggag aagctataag aatctctctc tccttatggt gaaaatttta cttggcttta 6420
tacttaactt ccaaggctcc ctcttataaa atgcaaaaac tgtctgtatt cactctcttg 6480
gttaacaatt gatccaatca aatgcatatg gaacatcttt ctttacgttt cttctaaagt 6540
tcgtttgagg ataaggagta gaatctgaga agatagacta gtaggtaacc ttagggacgg 6600
atgtggaaat taacatatgg gctcagcttt tctgccgagt gcagaccatg tatatgcgtt 6660
aaaaaattca ctaaacaagt aaatgtttga ttttgaaccc agtaaatcaa atgagttgtg 6720
gtagaatctc gaactcgaac cgataaagtt caaatccagg atccgctttt aggtaaactc 6780
taccttggga agtgttatat atatgtccct gattatttct ttttccgttt cctttctatt 6840
ttaattttta aagttatttt tagatggttt tattttttga taagtggtaa gttgttaata 6900
ttccaaatta aatgccattg tcataactat atacatttat aaagaatgat tgatcctagt 6960
ttctcattcc taagatccaa ataaggcaat aaacaatgtc ttagtaattg gacctgcttc 7020
tggtgatcaa cgcttgatcg cgtagttagt tatagatgac tgtaaaaact ttaaccattt 7080
taatggtttt gtcaaagaac aaatatcgga catattatag agaatggact attgtacttt 7140
gcttctgatt ggtcatttta ttgtgatccg taaattggct gtgactgatg tcatatcttt 7200
gcttacagag gtaatctgaa tgataaatca aaacccataa ttttttcaat ggcaaggcta 7260
gaccatgtta agaacattac gggactagtt gagtgctatg ctaaaaatgc cacattgagg 7320
gaattggcga accttgttgt agtagctgga tacaacgatg taaagaaatc cagtgataga 7380
gaagaaataa cagaaattga gaagatgcat gctcttatta aggagcataa attggatggg 7440
caattcagat gggtatcagc ccaaacaaac cgggcacgta atggtgagct ctatcgctat 7500
atagctgacc agagaggtat atttgttcag gtatgctatt tgtattgtat tagtccaatt 7560
tcattttttg caccaaaaga aaggttgtta ttgtgacgta tatgtttgtt ttagcctgca 7620
ttttatgaag catttggact aacggtggtt gaagctatga cttgtggtct tccaacattt 7680
gcaacttgcc atggtggtcc taatgagatc attgaacccg gtgtatctgg gttccatatt 7740
gatccttatc atcccgataa agctgctgaa ctcatgtcag aattctttca acgctgcaaa 7800
caagatccta ctcactggga aaaaatatct gcatctggtc tccgaaggat tcttgagagg 7860
tctgtagttg tgtacatgta tagaagatta aagaatgcta ccttgatatt tatttgaatc 7920
aaaaataaca ggaacatctc ttttttgaac atcactcaag ttcttatatt aaataatttt 7980
taggtatacg tggaagattt actccgagag gctgatgact ttatctggcg tatatggttt 8040
ctggaagctt gtttcaaaac ttgagaggcg tgaaactaga cgataccttg agatgttcta 8100
cattctcaaa ttccgcgagt tggtgagtgc cttttagctc cttttcagtt ccaataaact 8160
atatatgtgg tttaagtaag tattaagcat aaacatgtcc gtgcttgggg ctgtcgaaaa 8220
tgctatggac atatcctgag ctaaggattt ttcaagaaaa ttgatgttag ctttactcta 8280
tttacaggca aaatctgtac ctctagcaat tgatgacaag tga 8323
<210> 19
<211> 810
<212> PRT
<213> 普通烟草
<400> 19
Met Ala Asn Pro Lys Phe Thr Arg Val Pro Ser Met Arg Glu Arg Val
1 5 10 15
Glu Asp Thr Leu Ser Ala His Arg Asn Gln Leu Val Ala Leu Leu Ser
20 25 30
Arg Tyr Val Ala Gln Gly Lys Gly Ile Leu Gln Pro His His Leu Ile
35 40 45
Asp Glu Phe Asn Asn Ala Val Cys Asp Asp Thr Ala Cys Glu Lys Leu
50 55 60
Lys Asp Gly Pro Phe Ser Glu Val Leu Lys Ala Thr Gln Glu Ala Ile
65 70 75 80
Val Leu Pro Pro Phe Val Ala Ile Ala Val Arg Pro Arg Pro Gly Val
85 90 95
Trp Glu Tyr Val Arg Val Asn Val Tyr Asp Leu Ser Val Glu Gln Leu
100 105 110
Thr Val Pro Glu Tyr Leu His Phe Lys Glu Glu Leu Val Asp Gly Glu
115 120 125
Gly Asn Asn His Phe Val Leu Glu Leu Asp Phe Glu Pro Phe Asn Ala
130 135 140
Ser Val Pro Arg Pro Ser Arg Ser Ser Ser Ile Gly Asn Gly Val Gln
145 150 155 160
Phe Leu Asn Arg His Leu Ser Ser Ile Met Phe Arg Ser Lys Asp Ser
165 170 175
Leu Asp Pro Leu Leu Asp Phe Leu Arg Gly His Cys His Lys Gly Asn
180 185 190
Val Leu Met Leu Asn Asp Arg Ile Gln Arg Ile Ser Arg Leu Glu Ser
195 200 205
Ala Leu Ser Lys Ala Glu Asp Tyr Leu Ser Lys Leu Ser Pro Asp Thr
210 215 220
Ser Tyr Asn Glu Phe Glu Tyr Ala Leu Gln Glu Met Gly Phe Glu Arg
225 230 235 240
Gly Trp Gly Asp Thr Ala Arg Arg Val Leu Glu Thr Met His Leu Leu
245 250 255
Ser Asp Ile Leu Gln Ala Pro Asp Pro Ser Thr Leu Glu Thr Phe Leu
260 265 270
Gly Arg Leu Pro Met Val Phe Asn Val Val Ile Leu Ser Pro His Gly
275 280 285
Tyr Phe Gly Gln Ala Asn Val Leu Gly Leu Pro Asp Thr Gly Gly Gln
290 295 300
Val Val Tyr Ile Leu Asp Gln Val Arg Ala Leu Glu Ala Glu Met Leu
305 310 315 320
Leu Arg Ile Lys Gln Gln Gly Leu Asn Phe Lys Pro Arg Ile Leu Val
325 330 335
Val Thr Arg Leu Ile Pro Asp Ala Lys Gly Thr Met Cys Asn Gln Arg
340 345 350
Leu Glu Arg Ile Ser Gly Thr Glu Tyr Ser His Ile Leu Arg Val Pro
355 360 365
Phe Arg Thr Glu Lys Gly Ile Leu His Lys Trp Ile Ser Arg Phe Asp
370 375 380
Val Trp Pro Tyr Leu Glu Lys Phe Thr Glu Asp Val Ala Ser Glu Met
385 390 395 400
Thr Ala Glu Leu Gln Gly Lys Pro Asp Leu Ile Ile Gly Asn Tyr Ser
405 410 415
Asp Gly Asn Leu Val Ala Ser Leu Leu Ala Tyr Lys Met Gly Val Thr
420 425 430
Gln Cys Thr Ile Ala His Ala Leu Glu Lys Thr Lys Tyr Pro Asp Ser
435 440 445
Asp Ile Tyr Trp Lys Lys Phe Glu Glu Lys Tyr His Phe Ser Cys Gln
450 455 460
Phe Thr Ala Asp Leu Leu Ala Met Asn Asn Ser Asp Phe Ile Ile Thr
465 470 475 480
Ser Thr Tyr Gln Glu Ile Ala Gly Thr Lys Asn Thr Val Gly Gln Tyr
485 490 495
Glu Ser His Thr Ala Phe Thr Leu Pro Gly Leu Tyr Arg Val Val His
500 505 510
Gly Ile Asp Val Phe Asp Pro Lys Phe Asn Ile Val Ser Pro Gly Ala
515 520 525
Asp Met Thr Ile Tyr Phe Pro Tyr Ser Asp Lys Glu Lys Arg Leu Thr
530 535 540
Ser Leu His Gly Ser Ile Glu Lys Leu Leu Phe Asp Pro Ala Gln Asn
545 550 555 560
Glu Glu His Ile Gly Asn Leu Asn Asp Lys Ser Lys Pro Ile Ile Phe
565 570 575
Ser Met Ala Arg Leu Asp His Val Lys Asn Ile Thr Gly Leu Val Glu
580 585 590
Cys Tyr Ala Lys Asn Ala Thr Leu Arg Glu Leu Ala Asn Leu Val Val
595 600 605
Val Ala Gly Tyr Asn Asp Val Lys Lys Ser Ser Asp Arg Glu Glu Ile
610 615 620
Thr Glu Ile Glu Lys Met His Ala Leu Ile Lys Glu His Lys Leu Asp
625 630 635 640
Gly Gln Phe Arg Trp Val Ser Ala Gln Thr Asn Arg Ala Arg Asn Gly
645 650 655
Glu Leu Tyr Arg Tyr Ile Ala Asp Gln Arg Gly Ile Phe Val Gln Pro
660 665 670
Ala Phe Tyr Glu Ala Phe Gly Leu Thr Val Val Glu Ala Met Thr Cys
675 680 685
Gly Leu Pro Thr Phe Ala Thr Cys His Gly Gly Pro Asn Glu Ile Ile
690 695 700
Glu Pro Gly Val Ser Gly Phe His Ile Asp Pro Tyr His Pro Asp Lys
705 710 715 720
Ala Ala Glu Leu Met Ser Glu Phe Phe Gln Arg Cys Lys Gln Asp Pro
725 730 735
Thr His Trp Glu Lys Ile Ser Ala Ser Gly Leu Arg Arg Ile Leu Glu
740 745 750
Arg Tyr Thr Trp Lys Ile Tyr Ser Glu Arg Leu Met Thr Leu Ser Gly
755 760 765
Val Tyr Gly Phe Trp Lys Leu Val Ser Lys Leu Glu Arg Arg Glu Thr
770 775 780
Arg Arg Tyr Leu Glu Met Phe Tyr Ile Leu Lys Phe Arg Glu Leu Ala
785 790 795 800
Lys Ser Val Pro Leu Ala Ile Asp Asp Lys
805 810
<210> 20
<211> 3604
<212> DNA
<213> 普通烟草
<400> 20
atgtttacat ggctgaaact caatataaaa aacaagggta ggtgatcaaa aatcgttgga 60
tgcttaaaat cagtagacgt tttgctaaat gagcgaccaa tgttattgaa aacgttcatg 120
ttttcaaccc ttttggcata catttgagca ttgcccaaga ttttggataa gtagatgcag 180
tgcttataat tttaaagcat tgtatcctgc cttgtttttc attgtcaaaa ttaattaact 240
tacaagtatt tctataagtt gcttcataaa ttagaagtaa atctggattg tgtaatgtta 300
ttcgcctcgt aaatactgaa agctgcttga acaagtgaaa aaacacagac aaacgtaaca 360
ttctccatgg attgatgaga cttgtaaaat acatatatag aaatttggct tgtaaccaca 420
tgtatattat gccatatgga tgtgacattg atgtgactag acctaaatgt tttgtttcca 480
tgtccactgg agttttacgt atagttaaga ggagaaaaga ctgaggaata ctaatgtatg 540
atggtacccc tttgcttctt gacctggata cccagtgttc ctattcatgc ctatactttg 600
gtccttgatt tcactctccc ttttctaact tgagctgcat caaagaaatt tccactgtaa 660
aaaaataaat aatgctcacc atatctctgc aacattgcaa acatgtatcc catatgattg 720
atattggtgc gacatggcaa acatgtatcc tatttgatga tcaatcaaat ttatttttcc 780
cctgtcaaaa tgacctcagt gtgtaattcc ctatgtattt gatagcattg taactcgtgt 840
catgattcat gaatagggta ctagaattgc atggttgaca aatattaact ggtcgattga 900
tgatccacaa aacatgcact tactgactaa aatgtgatgg gacagattta tttttgtttg 960
tgattaacac agtacttaac cctatactta atacaatttg gcctagctac aatcttttct 1020
tcagtgcaaa ttccttgtta cacgaccaat attgtctttc tgagttctat tctgttgtta 1080
cttacacttt tattattcga ataagacatt agattgcttg catgcaaatt gatagccact 1140
tgtttcagga agaatactgt tggtcagtac gagagccata ctgcattcac cctcccagga 1200
ctatatcgcg tcgttcatgg cattgatgtt ttcgatccca aattcaatat agtgtctcct 1260
ggagctgaca tgacaattta cttcccatat tctgacaagg aaaaaagact aacgtctttg 1320
catggctcga ttgagaagtt gttatttgat cctgcgcaga atgaagagca tatgtaagtg 1380
acatccattt gtacttattt taatttggaa tagatgacat acttatttgc atgaatataa 1440
actgacaacc cagagatttc ctacattaga aaaggagggt ctgatatgat tttctacaaa 1500
taaattccca gtgatattgt tcaaaaagtc ctggatactt tattatgaga gaaccaggga 1560
tagatggcac tagaatccct taatcttgag aagtcgccac ttatcgctcc caacactttc 1620
tgagaccctc aagtaactac tattattgtt tgatatcttg gagaagctat aagaatcttt 1680
ttctccttat tgtaattttt tttacgtgac tttaaactta acttccaagc tccttctgat 1740
aaaatgcaaa aactgtctgt attcactgtc ttggtttatt aacaattgat ccaatcaaat 1800
gcatatggaa catctttctt tttgtttctt caaaagttcg tttgaggata aggagtagaa 1860
tctgagaaga tagactagta ggtaacctta ggggcggatg tagaaatcaa cgtatgggtt 1920
cagctttgtt gcagaccctg tatatgcatt aaaaaaatca ctaaataagt aaataattga 1980
ttttgaaccc agtaaatcaa aatgagttgt agtagaatcc tgaactcgaa ccgataaagt 2040
tggatccact accgggtaaa ctctaccttg agaagtgttt atatatgtcc ctaattattt 2100
cttttctgtt tcctttctat tttaattttt taagttcctt tttagatggt tttatttttt 2160
gacaagtggt aagttgttag tattccaaat taaatgccat tgccataact atatacattt 2220
ataaagattg attgacccta gtttctcatt cctaagatcc aaataaggca ataaacaata 2280
tgtcttagta cttgaacctg cttctggtgg tcaacacttg atcgcgtagt tagttataga 2340
tgactgtaaa aaccttaatc attttaatgg ttttgtcaaa gaacaaatat cggacatatt 2400
atagcgaatg gactattgta cttttcttct gattggtcat tttattgtga tccgtaagtt 2460
ggctgagact gatgtcatat ctttgcttac agaggtaatc tgaatgataa atcaaaaccc 2520
ataatttttt caatggcaag gctagaccat gttaagaaca ttacgggact agttgagtgc 2580
tatgctaaaa atgccacatt gagggaattg gctaaccttg ttgttgtagc tggatacaac 2640
gatgtaaaga aatccagtga tagagaagaa atagcagaaa ttgagaagat gcatgctctt 2700
attaaggagc ataaattgga tgggcaattc agatggatag cagcccaaac aaaccgggca 2760
cgtaatggtg agctctatcg ctatatagct gacaagagag gtatatttgt tcaggtacgc 2820
tgtttgtatt gtatttgtcc acattccttt ttttgcaccg aaagaaaggt tgttattgtg 2880
acaaatatgt ttgttttagc ctgcatttta tgaagcattt ggactcacgg tggttgaagc 2940
tatgacttgt ggtcttccaa catttgcaac ttgccatggt ggtccgaacg agatcattga 3000
acacggtgta tctgggttcc atattgatcc ttatcatccc gataaagctg ctgaactcat 3060
ggcagaattc tttcaacgct gcaaacaaga tcctactcac tgggaaaaaa tatctgcatc 3120
tggtctccga aggattcttg agaggtttgt agttgtgtac atatatagaa gattaaagat 3180
tgttcccttg atattatttg aatgaaaaat aacagtaaca tctctttttg aacatcgctc 3240
aagttcttgt gttaaataat tgttaggtat acgtggaaaa tttactccga gaggctgatg 3300
actttgtctg gtgtatatgg tttctggaag cttgtttcaa aacttgagag gcgcgaaact 3360
agacgatacc ttgagatgtt ctacattctc aaattccgcg agttggtgag tgcctttttg 3420
ctcattttca gttacaatca actatatatg tggtttaaat acgtattaag cataaacatg 3480
tccgtgattg cggctgtcga aaatgctatg gacatatcct gagctaagga gttttcaaga 3540
gaattgattt ggcttactct gtttacaggc aaaatctgtt cctctggcaa ttgatgacaa 3600
gtga 3604
<210> 21
<211> 335
<212> PRT
<213> 普通烟草
<400> 21
Met Phe Thr Trp Leu Lys Leu Asn Ile Lys Asn Lys Gly Arg Lys Asn
1 5 10 15
Thr Val Gly Gln Tyr Glu Ser His Thr Ala Phe Thr Leu Pro Gly Leu
20 25 30
Tyr Arg Val Val His Gly Ile Asp Val Phe Asp Pro Lys Phe Asn Ile
35 40 45
Val Ser Pro Gly Ala Asp Met Thr Ile Tyr Phe Pro Tyr Ser Asp Lys
50 55 60
Glu Lys Arg Leu Thr Ser Leu His Gly Ser Ile Glu Lys Leu Leu Phe
65 70 75 80
Asp Pro Ala Gln Asn Glu Glu His Ile Gly Asn Leu Asn Asp Lys Ser
85 90 95
Lys Pro Ile Ile Phe Ser Met Ala Arg Leu Asp His Val Lys Asn Ile
100 105 110
Thr Gly Leu Val Glu Cys Tyr Ala Lys Asn Ala Thr Leu Arg Glu Leu
115 120 125
Ala Asn Leu Val Val Val Ala Gly Tyr Asn Asp Val Lys Lys Ser Ser
130 135 140
Asp Arg Glu Glu Ile Ala Glu Ile Glu Lys Met His Ala Leu Ile Lys
145 150 155 160
Glu His Lys Leu Asp Gly Gln Phe Arg Trp Ile Ala Ala Gln Thr Asn
165 170 175
Arg Ala Arg Asn Gly Glu Leu Tyr Arg Tyr Ile Ala Asp Lys Arg Gly
180 185 190
Ile Phe Val Gln Pro Ala Phe Tyr Glu Ala Phe Gly Leu Thr Val Val
195 200 205
Glu Ala Met Thr Cys Gly Leu Pro Thr Phe Ala Thr Cys His Gly Gly
210 215 220
Pro Asn Glu Ile Ile Glu His Gly Val Ser Gly Phe His Ile Asp Pro
225 230 235 240
Tyr His Pro Asp Lys Ala Ala Glu Leu Met Ala Glu Phe Phe Gln Arg
245 250 255
Cys Lys Gln Asp Pro Thr His Trp Glu Lys Ile Ser Ala Ser Gly Leu
260 265 270
Arg Arg Ile Leu Glu Arg Tyr Thr Trp Lys Ile Tyr Ser Glu Arg Leu
275 280 285
Met Thr Leu Ser Gly Val Tyr Gly Phe Trp Lys Leu Val Ser Lys Leu
290 295 300
Glu Arg Arg Glu Thr Arg Arg Tyr Leu Glu Met Phe Tyr Ile Leu Lys
305 310 315 320
Phe Arg Glu Leu Ala Lys Ser Val Pro Leu Ala Ile Asp Asp Lys
325 330 335
<210> 22
<211> 4030
<212> DNA
<213> 普通烟草
<400> 22
atggcggaac gtgtgctgac tcgtgttcat agccttcgtg aacgtcttga tgctactttg 60
gctgctcatc gcaatgagat tttgctgttt ctttcaaggt atagtcttag cagattgttc 120
tttgatttag ttgttattgc cagttctaat gtatgggctt atatataaac aaagtgttga 180
agtatgcaac catataaact gacagcttaa aatgcttgag agaacacact tttatttatt 240
taattatgcc ttcagcacaa gaagtggaac ttgacgcaat ggaaccatag gtcacgggtt 300
caagtcttgg aacagcctgc aatctaaggc tgcgtgtagt agaccctagt ggtccggccc 360
ttccacatat ctcgcttagt gtaccgggcc cattgagtac gggttcggcc gaacccagtc 420
gctttggtcc aatccatata tttgtcttaa aaatatattg aatatataca aattgttaat 480
ttagtttaaa tatgtgtatc atgggttatt catgctggtt ttggctgttg caggattgaa 540
agccatggaa aagggatact gaaacctcac cagttgctgg ctgaatttga ttcaattcac 600
aaagaagaca aaaacaaact gaatgatcat gcttttgaag aagtcctgaa atccactcag 660
gtatttgtgg ttttagtgtt aggtgatgga tagcatttat tgttttacta agatcacata 720
tgtgtcagtt tgtggctagt atttaaaatc tggtgtattt tgtcatacta ggaagcaatt 780
gttttgtccc cttgggttgc gcttgccatt cgtctgaggc ctggtgtgtg ggaatacgtt 840
cgtgtgaatg tcaacgctct tgttgttgag gagcttaccg tgcctgagta tttgcaattc 900
aaggaagaac ttgttaatgg aacgtaagtt ttaggttcga atttgttgat ttgttagata 960
acatgttctg aactttttga ttaaagttgt gtttttgact gatgcagctc gcacgataac 1020
tttgttcttg agttggattt tgagcccttc actgcatcat ttccaaaacc aaccctcacc 1080
aaatcaattg gaaatggagt tgaattcctt aaccgacacc tctctgccaa aatgttccat 1140
gacaaggaaa gcatgacccc tcttctcgag tttcttcgag ttcaccacta caagggcaag 1200
gtaaacttgt ttttcctgtt tgtctatgaa tttagtttag ttgttttgct ccgcgaaaat 1260
ttcagtggaa actgatttat gcaaccactg agtgattaat atgttcaaac ttaccgactt 1320
ctggttttct gtgtagacaa tgatgctgaa tgacagaatt caggacttaa atactctcca 1380
aaatgtccta aggaaagctg aggaatacct cactaccctt tcccctgaaa cttcatactc 1440
ggcatttgag cacaagttcc aagaaattgg cttggagagg ggttggggtg acactgcgga 1500
gcgtgttcta gagatgatct gcatgctcct ggatctcctc gaggctcctg actcgtgcac 1560
gcttgagaag ttccttggta gaattccaat ggtttttaat gtggtcatac tttcacccca 1620
tggttatttc gcccaggaaa atgtcttggg ttaccccgac actggtggcc aggtgcactg 1680
cttatctgtg ttcggtctta ttatctcttt aaaccctact gccacaagtg ctgagatgaa 1740
cctcctttaa tttgcaggtt gtctatattt tggatcaagt tcctgctttg gagcgtgaga 1800
tgctcaagcg cataaaggag caaggacttg acatcaaacc gcgtattctt attgttcgta 1860
ttcccagtaa ttgtgtttaa acttatgatt atgcaggatt ttatctgttc taatacagca 1920
ctcttgctta aattctcagg ttactcggct gctgcctgat gcggttggta ccacttgtgg 1980
tcagaggctt gagaaagtgt ttggaacaga gcactcacac attcttaggg tcccctttag 2040
gaccgagaag ggcattgttc gcaaatggat ctctcgcttt gaagtctggc catacatgga 2100
gacattcact gaggtgaagc aagctttctc tattcatttt tcaatcttcc aattggtttt 2160
ggcagcaatt ttctgcttgc tttgacttcc gctaaaactt cggattttat tgcattagga 2220
tgtggcgaaa gaaattgctg cagaattgca ggctaagcca gatcttatca ttggcaatta 2280
tagtgagggc aaccttgctg cctccttgtt ggctcacaaa ttaggtgtaa cacaggtcgg 2340
caatgtttgt gacatgtaat ttcatctttg catttccttt cgtttgcaac taaaagattt 2400
aagagttctc tctctctttt ttttttccgt ctactttgcc ttatgcagtg cacgatagct 2460
catgctttgg agaaaacaaa atatcctgat tctgatatct acttgaagaa atttgatgaa 2520
aaataccatt tctcagccca gtttactgcc gatcttattg caatgaatca caccgatttc 2580
atcatcacca gcactttcca ggagatagcg ggaaggtatt tttacatcag tttcccactc 2640
tgattaaatt acaatgtatt tccctatatg attaaatact gtgtttgatc ctaaatcatt 2700
tctaaatttt ccagcaagga cactgttgga cagtacgaga gccacatggc gttcacaatg 2760
cctggactgt atagagttgt tcacggcatt gatgtgtttg accccaaatt taacattgtg 2820
tcaccaggag ctgatatgaa tctctatttc ccatactacg agaaggaaaa gagattgaca 2880
gcatatcacc ctgaaattga ggagctgctg tttagtgatg ttgagaatga cgaacacatg 2940
tatgttacta aactagcaat cctgctgcaa aattatggct aattatgtaa acaagtttgt 3000
actgaataga tttgttattc gatcaggtgt gtgctgaaga acaggaataa gcctatcata 3060
ttcactatgg ctagattgga tcgagtgaag aacttaactg gacttgtcga gctgtacgcc 3120
aagaacccac ggctaaggga gttggttaac cttgtcgtgg ttggaggaga ccgaaggaaa 3180
gaatccaaag acttggaaga acaggcagag atgaagaaga tgtacgaact tataaagact 3240
cacaatttga acggccaatt ccgatggatt tcttcccaga tgaaccgcgt gaggaatggc 3300
gaactctaca ggtacattgc cgatactagg ggagctttcg tgcagcctgc attttacgag 3360
gcttttggtt tgactgttgt tgaggccatg acctgtggtt tgcctacatt tgcaactaat 3420
cacggtggtc cagctgagat catcgttcac gggaaatctg gtttccacat tgatccatac 3480
cacggggatc aggcagctga acttctcgct gatttctttg agaaatgtaa gaaagaacct 3540
tcgcactggg aagccatttc cgagggcggc cttaagcgta tacaggagaa gtaagcaaac 3600
tgctactctt ttcatttttg caaaacctac tatgatcatt attaagctca tttttgcaaa 3660
acctacttgc tgttgttatt gtttgttgct tccttttcac tgttctttga gctgaaggtc 3720
tatcagaaac agtctctcta ccttcacaag gtaggggtaa gatctgcgtg cacgttaccc 3780
tcctcaaact ctacttaatt gtgagattac actaggtttg ttgttgttga ttctttgcta 3840
attaattaaa aggtacacat ggcaaatata ctcggatcgg ttgttgacac tggctgctgt 3900
atatggattc tggaagcatg tttccaagct tgatcgtctt gaaattcgcc gttatcttga 3960
aatgttctat gctctcaaat tccgcaagct ggtgagtttc attgctttct gcactcctgc 4020
aattgtatag 4030
<210> 23
<211> 808
<212> PRT
<213> 普通烟草
<400> 23
Met Ala Glu Arg Val Leu Thr Arg Val His Ser Leu Arg Glu Arg Leu
1 5 10 15
Asp Ala Thr Leu Ala Ala His Arg Asn Glu Ile Leu Leu Phe Leu Ser
20 25 30
Arg Ile Glu Ser His Gly Lys Gly Ile Leu Lys Pro His Gln Leu Leu
35 40 45
Ala Glu Phe Asp Ser Ile His Lys Glu Asp Lys Asn Lys Leu Asn Asp
50 55 60
His Ala Phe Glu Glu Val Leu Lys Ser Thr Gln Glu Ala Ile Val Leu
65 70 75 80
Ser Pro Trp Val Ala Leu Ala Ile Arg Leu Arg Pro Gly Val Trp Glu
85 90 95
Tyr Val Arg Val Asn Val Asn Ala Leu Val Val Glu Glu Leu Thr Val
100 105 110
Pro Glu Tyr Leu Gln Phe Lys Glu Glu Leu Val Asn Gly Thr Ser His
115 120 125
Asp Asn Phe Val Leu Glu Leu Asp Phe Glu Pro Phe Thr Ala Ser Phe
130 135 140
Pro Lys Pro Thr Leu Thr Lys Ser Ile Gly Asn Gly Val Glu Phe Leu
145 150 155 160
Asn Arg His Leu Ser Ala Lys Met Phe His Asp Lys Glu Ser Met Thr
165 170 175
Pro Leu Leu Glu Phe Leu Arg Val His His Tyr Lys Gly Lys Thr Met
180 185 190
Met Leu Asn Asp Arg Ile Gln Asp Leu Asn Thr Leu Gln Asn Val Leu
195 200 205
Arg Lys Ala Glu Glu Tyr Leu Thr Thr Leu Ser Pro Glu Thr Ser Tyr
210 215 220
Ser Ala Phe Glu His Lys Phe Gln Glu Ile Gly Leu Glu Arg Gly Trp
225 230 235 240
Gly Asp Thr Ala Glu Arg Val Leu Glu Met Ile Cys Met Leu Leu Asp
245 250 255
Leu Leu Glu Ala Pro Asp Ser Cys Thr Leu Glu Lys Phe Leu Gly Arg
260 265 270
Ile Pro Met Val Phe Asn Val Val Ile Leu Ser Pro His Gly Tyr Phe
275 280 285
Ala Gln Glu Asn Val Leu Gly Tyr Pro Asp Thr Gly Gly Gln Val Val
290 295 300
Tyr Ile Leu Asp Gln Val Pro Ala Leu Glu Arg Glu Met Leu Lys Arg
305 310 315 320
Ile Lys Glu Gln Gly Leu Asp Ile Lys Pro Arg Ile Leu Ile Val Thr
325 330 335
Arg Leu Leu Pro Asp Ala Val Gly Thr Thr Cys Gly Gln Arg Leu Glu
340 345 350
Lys Val Phe Gly Thr Glu His Ser His Ile Leu Arg Val Pro Phe Arg
355 360 365
Thr Glu Lys Gly Ile Val Arg Lys Trp Ile Ser Arg Phe Glu Val Trp
370 375 380
Pro Tyr Met Glu Thr Phe Thr Glu Asp Val Ala Lys Glu Ile Ala Ala
385 390 395 400
Glu Leu Gln Ala Lys Pro Asp Leu Ile Ile Gly Asn Tyr Ser Glu Gly
405 410 415
Asn Leu Ala Ala Ser Leu Leu Ala His Lys Leu Gly Val Thr Gln Cys
420 425 430
Thr Ile Ala His Ala Leu Glu Lys Thr Lys Tyr Pro Asp Ser Asp Ile
435 440 445
Tyr Leu Lys Lys Phe Asp Glu Lys Tyr His Phe Ser Ala Gln Phe Thr
450 455 460
Ala Asp Leu Ile Ala Met Asn His Thr Asp Phe Ile Ile Thr Ser Thr
465 470 475 480
Phe Gln Glu Ile Ala Gly Ser Lys Asp Thr Val Gly Gln Tyr Glu Ser
485 490 495
His Met Ala Phe Thr Met Pro Gly Leu Tyr Arg Val Val His Gly Ile
500 505 510
Asp Val Phe Asp Pro Lys Phe Asn Ile Val Ser Pro Gly Ala Asp Met
515 520 525
Asn Leu Tyr Phe Pro Tyr Tyr Glu Lys Glu Lys Arg Leu Thr Ala Tyr
530 535 540
His Pro Glu Ile Glu Glu Leu Leu Phe Ser Asp Val Glu Asn Asp Glu
545 550 555 560
His Met Cys Val Leu Lys Asn Arg Asn Lys Pro Ile Ile Phe Thr Met
565 570 575
Ala Arg Leu Asp Arg Val Lys Asn Leu Thr Gly Leu Val Glu Leu Tyr
580 585 590
Ala Lys Asn Pro Arg Leu Arg Glu Leu Val Asn Leu Val Val Val Gly
595 600 605
Gly Asp Arg Arg Lys Glu Ser Lys Asp Leu Glu Glu Gln Ala Glu Met
610 615 620
Lys Lys Met Tyr Glu Leu Ile Lys Thr His Asn Leu Asn Gly Gln Phe
625 630 635 640
Arg Trp Ile Ser Ser Gln Met Asn Arg Val Arg Asn Gly Glu Leu Tyr
645 650 655
Arg Tyr Ile Ala Asp Thr Arg Gly Ala Phe Val Gln Pro Ala Phe Tyr
660 665 670
Glu Ala Phe Gly Leu Thr Val Val Glu Ala Met Thr Cys Gly Leu Pro
675 680 685
Thr Phe Ala Thr Asn His Gly Gly Pro Ala Glu Ile Ile Val His Gly
690 695 700
Lys Ser Gly Phe His Ile Asp Pro Tyr His Gly Asp Gln Ala Ala Glu
705 710 715 720
Leu Leu Ala Asp Phe Phe Glu Lys Cys Lys Lys Glu Pro Ser His Trp
725 730 735
Glu Ala Ile Ser Glu Gly Gly Leu Lys Arg Ile Gln Glu Lys Tyr Thr
740 745 750
Trp Gln Ile Tyr Ser Asp Arg Leu Leu Thr Leu Ala Ala Val Tyr Gly
755 760 765
Phe Trp Lys His Val Ser Lys Leu Asp Arg Leu Glu Ile Arg Arg Tyr
770 775 780
Leu Glu Met Phe Tyr Ala Leu Lys Phe Arg Lys Leu Val Ser Phe Ile
785 790 795 800
Ala Phe Cys Thr Pro Ala Ile Val
805
<210> 24
<211> 4054
<212> DNA
<213> 普通烟草
<400> 24
atggccgaac gtgtgctaac tcgtgttcac agccttcgcg aacgtcttga tgctactttg 60
gctgctcatc gcaatgagat tttgctgttt ctttcaaggt atagtcttag cagattgttc 120
tttgatttag ttggtgttat ttgccagttc taatgtatgg actaatatat gaacaaagtg 180
cgaccatttc aactgacaac ttaaaatgtt tgagagaata cacgtttatt tacttaatta 240
tggcttgagc ataggaagtg tatcttggcg taactcgtaa agttgacctc atgtgacaag 300
gaggtcacgg tttcgagccg tggaaacagc ctcttgcaga aatgcaggta aggctgcgtg 360
caatagatcg cccttccacg gacccgcgca tagcgggaac ttagtgcacc ggttgggctg 420
tcctttttta tgtcttcagc acaaaaattt agtttaaaca tgtgtatcat ggattattca 480
tgctggtttt gccggttgca ggattgaaag ccacggaaaa gggatattga aacctcacca 540
gttgctggct gagtttgaat caattcacaa agaagacaaa aacaaactga atgatcatgc 600
ttttgaagaa gtcctgaaat ctactcaggt aatttgtggt tttagtgtta ggtgatggat 660
agcatttatt gtcttactaa gatcatatat gtgtcagttt gtggctagta tttgaaaagt 720
ctggtgtggt ttgtcatact aggaagcaat tgtcttgtcc ccttgggttg cgcttgccat 780
tcgtctgcgg cctggtgtgt gggaatatgt tcgtgtgaat gtcaatgcac ttattgtcga 840
ggagctgact gtgcctgaat atttgcaatt caaggaagaa cttgttaatg gaacgtaagt 900
tttaggttcg aaatgatgat ttgttaaata atatgttctg aactttttga ttaatgttgt 960
gttttcccct gatgcagctc gaacgataac tttgttcttg agctggattt tgagcccttc 1020
actgcatcat ttcccaaacc aaccctcacc aaatcaattg gaaatggagt tgaattcctc 1080
aaccgacacc tctctgccaa aatgttccat gacaaggaaa gcatgacccc tcttctcgag 1140
tttcttcgag ttcatcacta caagggcaag gtaaacttgt ttttcctgtt tgtctatgaa 1200
tttagtttct gaaagttgct ttgcttcgtg aattttttag tggcaactga tttatgattt 1260
tctgtgcaga caatgatgct gaatgacaga gttcaggact taaacactct ccaaaatgtc 1320
ctaaggaagg ctgaggaata tctcactacc ctttcccctg aaacttcata ctcggtattt 1380
gagcacaagt tccaagaaat tggcctagag aggggctggg gtgacaatgc tgagcgtgtt 1440
ctagagatga tctgcatgct cctggatctc ctcgaggctc cagactcatg cactcttgag 1500
aagttccttg gtagaattcc tatggttttt aatgtggtca ttctttcacc tcacggatat 1560
ttcgcccagg aaaatgtctt gggttacccc gatactggtg gccaggtgca ctgcttattt 1620
gtaacacctt acgcttttcc ctctgaaact tatttgcggc aagttctaag gtcctccttc 1680
cttaatttgc aggttgtcta tattttggat caagttccgg ccttggagcg tgagatgctc 1740
aagcgcataa aggagcaagg acttgatatc aaaccgcgta ttcttattgt tcgtatctcc 1800
aataattgcg tttaaactta tgattgtgca ggatttgatc tgttcaaatc taatgactga 1860
ttttcttttt tttttttttt tccctcaggt tactcggctg ctgcctgatg cggttggtac 1920
cacttgtggt cagcggcttg agaaagtgtt tggaacagag cattcacata ttcttagggt 1980
cccctttagg accgagaagg gcatcgttcg caaatggatc tctcgctttg aagtctggcc 2040
ttacatggag acattcactg aggtgaagca agctttctct attcattttt caatcttcca 2100
atctgttttg gcagcaattt ttcacttact aacactttgg ctttcgctaa aacttcggat 2160
tttattacat taggatgtgg caaaagaaat tgctgcagaa ctgcaggcaa agccagatct 2220
tataatcggc aactacagcg agggcaacct tgctgcctcc ttgttggctc acaagttagg 2280
tgtaactcag gtctgtaatg tttgtcacct gttatttcaa ctttgcattt cctttcattt 2340
gcaactagaa gttaagagtt ctctctcttt tatcttttcc gtctattttg ccttctgcag 2400
tgcaccatag ctcatgcgtt ggagaaaaca aaatatcctg attctgatat ctacttgaag 2460
aaatttgatg aaaaatacca tttctcagcc cagtttactg ccgatcttat tgcaatgaat 2520
cacaccgatt tcataatcac cagcactttc caggagatag cgggaaggta ttacatcaca 2580
atggatttcc gatatgatta aattagttaa tttaatccta cttcattgtg tttgatccta 2640
aaacttttct aaatttccca gcaaggacac tgttggacag tacgagagcc acatggcttt 2700
cacgatgcct ggattgtata gagttgttca cggcattgat gtgttcgatc ccaaattcaa 2760
cattgtgtca ccaggagctg atatgaatct ctatttcccc tacttcgaga aggaaaagcg 2820
attgacagca tatcaccctg aaattgagga gctgctgttt agcgatgttg agaatgacga 2880
acacatgtat gttactaaac tagcaatcct gctgcaaaat tgtggctaat tatgtaaaaa 2940
agtttttact gaatagattt gtgcttctat caggtgtgtg ctgaaggaca ggaataagcc 3000
aattatattc accatggcta gattggatcg agtgaagaac ttaactggac ttgtggagtt 3060
gtacgccaag aacccacggc taagggagtt ggttaacctt gtcgtggttg gtggagaccg 3120
aaggaaggaa tccaaagatt tggaagaaca ggcagagatg aagaagatgt atgaacttat 3180
aaagacgcac aatttaaacg gccaattccg atggatttct tcccagatga accgcgtgag 3240
gaatggcgaa ctctacaggt acattgccga tactagggga gcttttgtgc agcctgcatt 3300
ttacgaggct tttggtttga ctgttgttga ggccatgacc tgtggtttgc ctacgtttgc 3360
aactaatcac ggtggtccag ctgagatcat cgttcacggg aagtctggtt ttcacattga 3420
tccataccac ggcgagcagg cagctgaact tctagctgat ttctttgaga gatgtaagaa 3480
agaaccttca cactgggaag ccatttccga gggcggcctt aagcgtatac aggagaagta 3540
agcaagctgc tactcttttc atttttgcaa aacctaccat gatcattatt aagctcattt 3600
ttgcaaaacc tacttgttat tctttgttgc ttccttttcc ctgttttttg agccgaggtt 3660
ttatcgaaaa catgctttct accttcacaa ggtaggggta aggtctgcgt ttgttattat 3720
tgttgttgtt gattctctgc gaattaatta aaaggtacac atggcaaatc tactcggatc 3780
ggttgttgac actggctgct gtttatggat tctggaagca tgtttccaaa cttgatcgtc 3840
ttgaaattcg tcgttatctt gaaatgttct atgctctaaa attccgcaaa ctggtgagtt 3900
tcactgcttt ctgcactctt ccaattgtta gttgagtgca ctcatttaaa ctgtagctaa 3960
agctgttgta aatcttcagt taagcagctg ctaatgaagt ttttatcttt tgtttttggt 4020
tcaggctgaa gctgtcccgt tggctgttga gtaa 4054
<210> 25
<211> 805
<212> PRT
<213> 普通烟草
<400> 25
Met Ala Glu Arg Val Leu Thr Arg Val His Ser Leu Arg Glu Arg Leu
1 5 10 15
Asp Ala Thr Leu Ala Ala His Arg Asn Glu Ile Leu Leu Phe Leu Ser
20 25 30
Arg Ile Glu Ser His Gly Lys Gly Ile Leu Lys Pro His Gln Leu Leu
35 40 45
Ala Glu Phe Glu Ser Ile His Lys Glu Asp Lys Asn Lys Leu Asn Asp
50 55 60
His Ala Phe Glu Glu Val Leu Lys Ser Thr Gln Glu Ala Ile Val Leu
65 70 75 80
Ser Pro Trp Val Ala Leu Ala Ile Arg Leu Arg Pro Gly Val Trp Glu
85 90 95
Tyr Val Arg Val Asn Val Asn Ala Leu Ile Val Glu Glu Leu Thr Val
100 105 110
Pro Glu Tyr Leu Gln Phe Lys Glu Glu Leu Val Asn Gly Thr Ser Asn
115 120 125
Asp Asn Phe Val Leu Glu Leu Asp Phe Glu Pro Phe Thr Ala Ser Phe
130 135 140
Pro Lys Pro Thr Leu Thr Lys Ser Ile Gly Asn Gly Val Glu Phe Leu
145 150 155 160
Asn Arg His Leu Ser Ala Lys Met Phe His Asp Lys Glu Ser Met Thr
165 170 175
Pro Leu Leu Glu Phe Leu Arg Val His His Tyr Lys Gly Lys Thr Met
180 185 190
Met Leu Asn Asp Arg Val Gln Asp Leu Asn Thr Leu Gln Asn Val Leu
195 200 205
Arg Lys Ala Glu Glu Tyr Leu Thr Thr Leu Ser Pro Glu Thr Ser Tyr
210 215 220
Ser Val Phe Glu His Lys Phe Gln Glu Ile Gly Leu Glu Arg Gly Trp
225 230 235 240
Gly Asp Asn Ala Glu Arg Val Leu Glu Met Ile Cys Met Leu Leu Asp
245 250 255
Leu Leu Glu Ala Pro Asp Ser Cys Thr Leu Glu Lys Phe Leu Gly Arg
260 265 270
Ile Pro Met Val Phe Asn Val Val Ile Leu Ser Pro His Gly Tyr Phe
275 280 285
Ala Gln Glu Asn Val Leu Gly Tyr Pro Asp Thr Gly Gly Gln Val Val
290 295 300
Tyr Ile Leu Asp Gln Val Pro Ala Leu Glu Arg Glu Met Leu Lys Arg
305 310 315 320
Ile Lys Glu Gln Gly Leu Asp Ile Lys Pro Arg Ile Leu Ile Val Thr
325 330 335
Arg Leu Leu Pro Asp Ala Val Gly Thr Thr Cys Gly Gln Arg Leu Glu
340 345 350
Lys Val Phe Gly Thr Glu His Ser His Ile Leu Arg Val Pro Phe Arg
355 360 365
Thr Glu Lys Gly Ile Val Arg Lys Trp Ile Ser Arg Phe Glu Val Trp
370 375 380
Pro Tyr Met Glu Thr Phe Thr Glu Asp Val Ala Lys Glu Ile Ala Ala
385 390 395 400
Glu Leu Gln Ala Lys Pro Asp Leu Ile Ile Gly Asn Tyr Ser Glu Gly
405 410 415
Asn Leu Ala Ala Ser Leu Leu Ala His Lys Leu Gly Val Thr Gln Cys
420 425 430
Thr Ile Ala His Ala Leu Glu Lys Thr Lys Tyr Pro Asp Ser Asp Ile
435 440 445
Tyr Leu Lys Lys Phe Asp Glu Lys Tyr His Phe Ser Ala Gln Phe Thr
450 455 460
Ala Asp Leu Ile Ala Met Asn His Thr Asp Phe Ile Ile Thr Ser Thr
465 470 475 480
Phe Gln Glu Ile Ala Gly Ser Lys Asp Thr Val Gly Gln Tyr Glu Ser
485 490 495
His Met Ala Phe Thr Met Pro Gly Leu Tyr Arg Val Val His Gly Ile
500 505 510
Asp Val Phe Asp Pro Lys Phe Asn Ile Val Ser Pro Gly Ala Asp Met
515 520 525
Asn Leu Tyr Phe Pro Tyr Phe Glu Lys Glu Lys Arg Leu Thr Ala Tyr
530 535 540
His Pro Glu Ile Glu Glu Leu Leu Phe Ser Asp Val Glu Asn Asp Glu
545 550 555 560
His Met Cys Val Leu Lys Asp Arg Asn Lys Pro Ile Ile Phe Thr Met
565 570 575
Ala Arg Leu Asp Arg Val Lys Asn Leu Thr Gly Leu Val Glu Leu Tyr
580 585 590
Ala Lys Asn Pro Arg Leu Arg Glu Leu Val Asn Leu Val Val Val Gly
595 600 605
Gly Asp Arg Arg Lys Glu Ser Lys Asp Leu Glu Glu Gln Ala Glu Met
610 615 620
Lys Lys Met Tyr Glu Leu Ile Lys Thr His Asn Leu Asn Gly Gln Phe
625 630 635 640
Arg Trp Ile Ser Ser Gln Met Asn Arg Val Arg Asn Gly Glu Leu Tyr
645 650 655
Arg Tyr Ile Ala Asp Thr Arg Gly Ala Phe Val Gln Pro Ala Phe Tyr
660 665 670
Glu Ala Phe Gly Leu Thr Val Val Glu Ala Met Thr Cys Gly Leu Pro
675 680 685
Thr Phe Ala Thr Asn His Gly Gly Pro Ala Glu Ile Ile Val His Gly
690 695 700
Lys Ser Gly Phe His Ile Asp Pro Tyr His Gly Glu Gln Ala Ala Glu
705 710 715 720
Leu Leu Ala Asp Phe Phe Glu Arg Cys Lys Lys Glu Pro Ser His Trp
725 730 735
Glu Ala Ile Ser Glu Gly Gly Leu Lys Arg Ile Gln Glu Lys Tyr Thr
740 745 750
Trp Gln Ile Tyr Ser Asp Arg Leu Leu Thr Leu Ala Ala Val Tyr Gly
755 760 765
Phe Trp Lys His Val Ser Lys Leu Asp Arg Leu Glu Ile Arg Arg Tyr
770 775 780
Leu Glu Met Phe Tyr Ala Leu Lys Phe Arg Lys Leu Ala Glu Ala Val
785 790 795 800
Pro Leu Ala Val Glu
805
<210> 26
<211> 3752
<212> DNA
<213> 普通烟草
<400> 26
atggcctcaa cagttgctga tagcatgcct gatgctttga aacaaagccg gtatcatatg 60
aagagatgct tcgctaggtg aacacccttc ttttatgttt tttcccctct acgtgtttat 120
gtcaaatttc catgcataat gctaactact tttcttcttt ttgacttcaa aattggatgt 180
gaaaggttca ttgcaatggg aaggaggcta atgaagttga aacatttaac agaagaaata 240
gaagaaacta ttgaagacaa ggcagaaaga accaggattt tggagggttc acttggaaaa 300
attatgagtt ccacacaggt cagcaccatt taaccaactt agttgaacag gaaaaaaaga 360
aaaagcaaaa gagttattgc aaggcgtaac gattttcttt gaaattttca ggaggcagct 420
gttgttccac cttatgttgc ttttgcagta aggcacaatc ctggcttctg ggattatgtc 480
aaagttaacg ctgaaactct ctctgtggaa gctatttcag ccagggaata tctcaaattc 540
aaagagatga tctttgacga agactggtaa gtggaaaatt gtatcatttt aaagagaaac 600
aattttgtaa catacaagaa tagttttgat ggttgaatgt gcaagcaggg caaaggatga 660
taatgcactg gaagtagatt ttggtgcttt tgactactct aatcctcggt tagccctttc 720
ctcttctgtc ggaaatgggc tcaactttat ctcaaaagtt ctgtcttcaa agtttggtgg 780
aaagccagag gacgcccagc ctttgcttga ttacttacta gctcttaatc atcaaggaga 840
ggtatgaaaa tggactacct ttgtttctta aaggtattat ataatgatgc gcgttataaa 900
gttccttttt aaattgaaac tttgcagaat ctaatgatca atgagaatct gaatggtgtt 960
gctaagcttc aagcagcatt gatagtagct gaagtttttg tatcttcctt tcccaaagac 1020
acaccttata aagactttga gcataagtaa gcttctcata tgcttccatt gtcatatgca 1080
gtataccaat gacatgctac cgaaaagttg tttatgtttg tgacttgatt atgaaaactc 1140
taggctcaaa gaatggggct ttgataaagg gtggggtcac aatgcaggaa gagtaagaga 1200
gacaatgaga ctgctttccg agataatcca agcaccagat cccataaata tggagtcctt 1260
tttcagcaag cttcctacta cattcaacat tgttatcttc tccattcatg gttactttgg 1320
ccaagcagat gtccttggtc tgcccgatac tggaggccag gtctacatat acagcaattt 1380
atctcctttt gcctcatatt gcttattagc gacacttgca tcattgaaat cagactttta 1440
cttcacaggt tgtttatatt ctggatcaag taagggcttt agaggaggaa atgttacaaa 1500
gaatcaagca gcaagggcta aacgtgaagc ccaagattct tgtggtgagt tttgcaaaaa 1560
tatgcttaga caggttttga gattgatcgg agaagggatt aagatgatca agatctttgt 1620
ttcctgcttt catgatgtaa acaggtatct cgtctcatac cagatgctcg agggacaaca 1680
tgcaatcagg agatggaacc tattcttaac tcatcccatt ctcacatcct gagaattcca 1740
ttcaggactg agaaaggagt tcttcgccaa tgggtttctc ggtttgatat ctatccttac 1800
ttggagaact atgccaaggc aagtcttcta acaaaattac cacctattca tacactttat 1860
ttactttctt gaactaatcg tttggtttgt gacgtatatc attaggatgc ttctgctaag 1920
atacttgagc tcatggaagg taaaccagac ctcataattg ggaactacac tgatggaaat 1980
ttagtggcat ctctattggc caacaaactt ggagttactc aggttccgta gctgatcata 2040
tgatcatatt ttctacattg tttcttgata attaaatgga aatcttattg gatgataaca 2100
ttttagggaa ccattgctca tgcattagag aaaactaagt atgaagattc tgatgtgaag 2160
tggaagcagt ttgatcccaa gtaccacttt tcttgccaat ttactgccga tttattggca 2220
atgaatgctg ctgattttat cattaccagc acatatcaag aaatcgctgg aaggttagca 2280
ctgactctct cagtatattt ggcaacttaa tgaatttact gcagtggcca acactaaaag 2340
ctatcattcg tccttcagcg aaactaggcc tggacaatat gaaagtcaca cagcatttac 2400
catgccgggg ctttatagag ctgtttcagg catcaatgta tttgatccaa agttcaacat 2460
tgctgctcct ggggctgaac agtctaccta tttccctttc actgagaaac agaaacgatt 2520
cagcacattt cgtcctgcta ttaacgaatt actttacagt aatgaggaaa acaatgagca 2580
catgtaagtc taattgccca ttttcctaat ctaaccattg cttaaatcgt tctgttttta 2640
ccggatgtgt ggtacttatc agtaacattt ttttttggat cagtggattt cttgcagacc 2700
ggaaaaaacc aattatattt tcaatggcga gatttgatac agtgaagaac ctgtcaggct 2760
tgactgagtg gtatgggaag aataagaagt tgcggaactt ggtaaacctt gttattgttg 2820
ggggattctt cgatccatca aaatcaaaag accgggagga agcagctgaa atcaagaaga 2880
tgcatgaatt gattgagaaa taccagctca agggacaaat gagatggata gcagctcaaa 2940
ctgataaata tcgaaatagt gagctatacc gaactattgc tgacactaag ggagcttttg 3000
tccaaccggc tttatatgaa gcttttggac taaccgttat tgaagcaatg gattgtggat 3060
tgcctacgtt tgcaactaat caaggtggac ctgcagaaat cattgttgat ggggtttcag 3120
gtttccatat tgatccttac aatggggacg aatcaagcaa gaaaatagct gatttctttg 3180
agaagtgtaa ggttgattct aaatattgga acaggatatc tgagggaggt ctcaagcgca 3240
ttgaagaatg gtaacaaact agttccaagt ttaaaaaatg gaaaaaatgc ttatcatgtt 3300
atattttcgt ggttttaagt tctgcttcga tgcagttata cgtggaagat ttatgcaaac 3360
aaagtgttga atatgggatc aatctatgga ttttggagac aattcaatgt ggggcaaaag 3420
caggctaagc aaagatactt tgagatgttt tacaatcctc tcttcaggaa attggtaggt 3480
tgtatatgtt gaatacaatt tactaagatc ctcaaaatga ccaagaaata tacattgact 3540
atgctacttt tgtaatttca caggccaaaa gcgtgccgat cccacatgaa gagccattgc 3600
cacttgcaac atcagactct actcaatccc aagaattaaa actaccacta ccagttccag 3660
cagcagtagc taaagttctg ccattaacaa ggcatgcttt taacttaatt acttctctac 3720
ctagagtaac tggtaaagtg gatgtcaagt ga 3752
<210> 27
<211> 840
<212> PRT
<213> 普通烟草
<400> 27
Met Ala Ser Thr Val Ala Asp Ser Met Pro Asp Ala Leu Lys Gln Ser
1 5 10 15
Arg Tyr His Met Lys Arg Cys Phe Ala Arg Phe Ile Ala Met Gly Arg
20 25 30
Arg Leu Met Lys Leu Lys His Leu Thr Glu Glu Ile Glu Glu Thr Ile
35 40 45
Glu Asp Lys Ala Glu Arg Thr Arg Ile Leu Glu Gly Ser Leu Gly Lys
50 55 60
Ile Met Ser Ser Thr Gln Glu Ala Ala Val Val Pro Pro Tyr Val Ala
65 70 75 80
Phe Ala Val Arg His Asn Pro Gly Phe Trp Asp Tyr Val Lys Val Asn
85 90 95
Ala Glu Thr Leu Ser Val Glu Ala Ile Ser Ala Arg Glu Tyr Leu Lys
100 105 110
Phe Lys Glu Met Ile Phe Asp Glu Asp Trp Ala Lys Asp Asp Asn Ala
115 120 125
Leu Glu Val Asp Phe Gly Ala Phe Asp Tyr Ser Asn Pro Arg Leu Ala
130 135 140
Leu Ser Ser Ser Val Gly Asn Gly Leu Asn Phe Ile Ser Lys Val Leu
145 150 155 160
Ser Ser Lys Phe Gly Gly Lys Pro Glu Asp Ala Gln Pro Leu Leu Asp
165 170 175
Tyr Leu Leu Ala Leu Asn His Gln Gly Glu Asn Leu Met Ile Asn Glu
180 185 190
Asn Leu Asn Gly Val Ala Lys Leu Gln Ala Ala Leu Ile Val Ala Glu
195 200 205
Val Phe Val Ser Ser Phe Pro Lys Asp Thr Pro Tyr Lys Asp Phe Glu
210 215 220
His Lys Leu Lys Glu Trp Gly Phe Asp Lys Gly Trp Gly His Asn Ala
225 230 235 240
Gly Arg Val Arg Glu Thr Met Arg Leu Leu Ser Glu Ile Ile Gln Ala
245 250 255
Pro Asp Pro Ile Asn Met Glu Ser Phe Phe Ser Lys Leu Pro Thr Thr
260 265 270
Phe Asn Ile Val Ile Phe Ser Ile His Gly Tyr Phe Gly Gln Ala Asp
275 280 285
Val Leu Gly Leu Pro Asp Thr Gly Gly Gln Val Val Tyr Ile Leu Asp
290 295 300
Gln Val Arg Ala Leu Glu Glu Glu Met Leu Gln Arg Ile Lys Gln Gln
305 310 315 320
Gly Leu Asn Val Lys Pro Lys Ile Leu Val Val Ser Arg Leu Ile Pro
325 330 335
Asp Ala Arg Gly Thr Thr Cys Asn Gln Glu Met Glu Pro Ile Leu Asn
340 345 350
Ser Ser His Ser His Ile Leu Arg Ile Pro Phe Arg Thr Glu Lys Gly
355 360 365
Val Leu Arg Gln Trp Asp Ala Ser Ala Lys Ile Leu Glu Leu Met Glu
370 375 380
Gly Lys Pro Asp Leu Ile Ile Gly Asn Tyr Thr Asp Gly Asn Leu Val
385 390 395 400
Ala Ser Leu Leu Ala Asn Lys Leu Gly Val Thr Gln Gly Thr Ile Ala
405 410 415
His Ala Leu Glu Lys Thr Lys Tyr Glu Asp Ser Asp Val Lys Trp Lys
420 425 430
Gln Phe Asp Pro Lys Tyr His Phe Ser Cys Gln Phe Thr Ala Asp Leu
435 440 445
Leu Ala Met Asn Ala Ala Asp Phe Ile Ile Thr Ser Thr Tyr Gln Glu
450 455 460
Ile Ala Gly Ser Glu Thr Arg Pro Gly Gln Tyr Glu Ser His Thr Ala
465 470 475 480
Phe Thr Met Pro Gly Leu Tyr Arg Ala Val Ser Gly Ile Asn Val Phe
485 490 495
Asp Pro Lys Phe Asn Ile Ala Ala Pro Gly Ala Glu Gln Ser Thr Tyr
500 505 510
Phe Pro Phe Thr Glu Lys Gln Lys Arg Phe Ser Thr Phe Arg Pro Ala
515 520 525
Ile Asn Glu Leu Leu Tyr Ser Asn Glu Glu Asn Asn Glu His Ile Gly
530 535 540
Phe Leu Ala Asp Arg Lys Lys Pro Ile Ile Phe Ser Met Ala Arg Phe
545 550 555 560
Asp Thr Val Lys Asn Leu Ser Gly Leu Thr Glu Trp Tyr Gly Lys Asn
565 570 575
Lys Lys Leu Arg Asn Leu Val Asn Leu Val Ile Val Gly Gly Phe Phe
580 585 590
Asp Pro Ser Lys Ser Lys Asp Arg Glu Glu Ala Ala Glu Ile Lys Lys
595 600 605
Met His Glu Leu Ile Glu Lys Tyr Gln Leu Lys Gly Gln Met Arg Trp
610 615 620
Ile Ala Ala Gln Thr Asp Lys Tyr Arg Asn Ser Glu Leu Tyr Arg Thr
625 630 635 640
Ile Ala Asp Thr Lys Gly Ala Phe Val Gln Pro Ala Leu Tyr Glu Ala
645 650 655
Phe Gly Leu Thr Val Ile Glu Ala Met Asp Cys Gly Leu Pro Thr Phe
660 665 670
Ala Thr Asn Gln Gly Gly Pro Ala Glu Ile Ile Val Asp Gly Val Ser
675 680 685
Gly Phe His Ile Asp Pro Tyr Asn Gly Asp Glu Ser Ser Lys Lys Ile
690 695 700
Ala Asp Phe Phe Glu Lys Cys Lys Val Asp Ser Lys Tyr Trp Asn Arg
705 710 715 720
Ile Ser Glu Gly Gly Leu Lys Arg Ile Glu Glu Cys Tyr Thr Trp Lys
725 730 735
Ile Tyr Ala Asn Lys Val Leu Asn Met Gly Ser Ile Tyr Gly Phe Trp
740 745 750
Arg Gln Phe Asn Val Gly Gln Lys Gln Ala Lys Gln Arg Tyr Phe Glu
755 760 765
Met Phe Tyr Asn Pro Leu Phe Arg Lys Leu Ala Lys Ser Val Pro Ile
770 775 780
Pro His Glu Glu Pro Leu Pro Leu Ala Thr Ser Asp Ser Thr Gln Ser
785 790 795 800
Gln Glu Leu Lys Leu Pro Leu Pro Val Pro Ala Ala Val Ala Lys Val
805 810 815
Leu Pro Leu Thr Arg His Ala Phe Asn Leu Ile Thr Ser Leu Pro Arg
820 825 830
Val Thr Gly Lys Val Asp Val Lys
835 840
<210> 28
<211> 3268
<212> DNA
<213> 普通烟草
<400> 28
atggcctcaa ctgttgctgg tagcatgcct gatgctttga aacaaagccg atatcatatg 60
aagagatgct tcgctaggtg aacacccttc ttgttctttt tgttttttcc ctctaccatt 120
tatgtcaaat ttcaatgcat aatgctaact actttttttc tttttgactt caaaattgga 180
cgtgaaaggt tcattgcaat gggaaggagg ttgatgaagc tgaaacattt aacagaagaa 240
atagaaaaaa ctattgaaga caaggcagaa agaaccaaga ttttggaggg ttcacttgga 300
aaaattatga gttccacaca ggtcagcacc atttaaccaa cttaattgaa taggaagaaa 360
aaaaaaagca aaagagttat tgcaaggcgt aacgatttcc tttgaaattt tcaggaggca 420
gctgttgtcc caccttatgt tgcttttgca gtaaggcaca atcctggctt ctgggattat 480
gtcaaagttg acgctgaaac tctctctgtg gaagctattt cagccaggga ctatctcaaa 540
ttcaaagaga tgatctttga tgaagattgg taactggaag attgtatcat tttaaagaaa 600
caatttttta atattcaaga ttagttttga tggttgaatg tgcaagcagg gcaaaggatg 660
aaaatgcact cgaagtagat tttggtgctt ttgactactc taatcatcgg ttagcccttt 720
cctcttctgt cggaaatggg ctaaacttca tctcgaaagt tttgtcttca aagtttggtg 780
gaaaggcaga agatgcccag cctttgcttg attacttact agctcttaat catcaaggag 840
aggtatggaa atggactacc ttcctttctt aaggaattat ataatgatgt atgttataaa 900
gatccttttt aaacattgac actttgcaga atctaatgat caatgagaat ctgaatggcg 960
tctctaagct tcaagcagca ttgatagtag ctgaagtttt tgtatcttcc tttcccaaag 1020
acacacctta taaagacttt gagcataagt aagcttttca aacgcttctg ttatcatatg 1080
caatatacca agaatatgtt gccttttgaa aagttgttta tgtttatgac ttgataatga 1140
aaatactagg ctcaaagaat ggggctttga gaaagggtgg ggtcacaatg caggaagagt 1200
aagagagaca atgagactgc tttccgagat aatccaagcg ccagatccca taaatatgga 1260
gtcctttttc agcaggcttc ctactacatt caacattgtt atcttctcca ttcatggtta 1320
ctttggccaa gcagatgtcc ttggtttgcc cgatactgga ggccaggttt acatacacag 1380
caatttatct ccttttgcct catatttact tattagcgac acttgcatta ttgaaatcac 1440
atttgtattt aacaggttgt ttatattctg gatcaagtaa gagccttaga ggaggaaatg 1500
ttacaaagaa tcaagcagca agggttaaat gtgaagccca agattcttgt ggtgagttat 1560
gcaaaaatat gcgtagccaa ggttttgaaa ttgttcagag gggattaaga tgatcgagat 1620
atttgtttcc ttcttccatt gatgtgtaca ggtcactcgt ctcattccag atgctcgagg 1680
gactacatgc aatcaggaga tggaacctat acttaactcg tcccattctc acatcctgag 1740
aattccattc aggacagaga aaggagttct tcgccaatgg gtttctcggt ttgatatcta 1800
tccttacttg gagaactatg ccaaggcaag tctcctacca aaattaccac ctattcatac 1860
actttattca gttttttgag ctaatcattc tcatttgtca cgtatgtgat taggatgctt 1920
ctgctaagat acttgagctc atggaaggta aaccagacct cattattggg aactacactg 1980
atggaaattt agtggcatct ctattggcca acaaacttgg agttactcag gttctacagc 2040
tgatcattta tctgatcaga ttttctacat tgttttcttg ataattaaac ggaaatctta 2100
tgagattgta acattttagg gaaccattgc tcatgcatta gagaaaacca agtatgaaga 2160
ttctgatgtc aagtggaagc agtttgattc caagtaccac ttttcttgcc aattcactgc 2220
cgatttattg gcaatgaatg ctgctgattt tatcattacc agcacatatc aagaaatcgc 2280
aggaaggtta gcactgactc tctcagtata tttggcaact taatgaatgt actgcttgtg 2340
gccaacacta aaagctatta ctcgtccttc agcgaaacta ggcctggaca atatgaaagt 2400
cacacagcat ttaccatgcc ggggctttat agagctgttt caggcatcaa tgtatttgat 2460
ccaaagttca acattgctgc tcctggggct gaacagtctg cctatttccc cttcactgag 2520
aaacagaaac gattcagcgc gtttcgtcct gctattgagg aactacttta cagtaatgag 2580
caaaacaacg agcacatgta agtctaattg ccccattttc ctaatctaac cattgcttaa 2640
atgttctgtt tttacttgat atgtggtact tatcagtgat attttttatt ggaacagtgg 2700
atttcttgca gaccgtaaaa aaccaattat attttcaatg gcaagatttg atacggtgaa 2760
gaacttgtca ggcttgactg agtggtatgg gaagaataag aagttgcgga acttggttaa 2820
cctcgttatc gttgggggat tcttcgatcc atcaaaatca aaagaccggg aggaagcagc 2880
tgaaatcaag aagatgcatg aattgattga gaaatacaag ctcaagggac aaatgagatg 2940
gatagcagct caaactgata aatatcaaaa cagtgagcta tatcgaacta ttgctgacac 3000
taaaggagct ttcgtccaac cggctttata tgaagctttt ggactaactg ttattgaagc 3060
aatgaattgt ggactgccta catttgctac taatcaaggc ggacctgcag aaatcattgt 3120
tgatggggtt tcaggcttcc atattgatcc ttacaatggg gatgaatcga gcaagaaaat 3180
agctgatttc tttgagaagt gtaaggttga ttctaaatat tggaacaaga tatgtggagg 3240
aggtctcaag cgcattgaag aatggtaa 3268
<210> 29
<211> 732
<212> PRT
<213> 普通烟草
<400> 29
Met Ala Ser Thr Val Ala Gly Ser Met Pro Asp Ala Leu Lys Gln Ser
1 5 10 15
Arg Tyr His Met Lys Arg Cys Phe Ala Arg Phe Ile Ala Met Gly Arg
20 25 30
Arg Leu Met Lys Leu Lys His Leu Thr Glu Glu Ile Glu Lys Thr Ile
35 40 45
Glu Asp Lys Ala Glu Arg Thr Lys Ile Leu Glu Gly Ser Leu Gly Lys
50 55 60
Ile Met Ser Ser Thr Gln Glu Ala Ala Val Val Pro Pro Tyr Val Ala
65 70 75 80
Phe Ala Val Arg His Asn Pro Gly Phe Trp Asp Tyr Val Lys Val Asp
85 90 95
Ala Glu Thr Leu Ser Val Glu Ala Ile Ser Ala Arg Asp Tyr Leu Lys
100 105 110
Phe Lys Glu Met Ile Phe Asp Glu Asp Trp Ala Lys Asp Glu Asn Ala
115 120 125
Leu Glu Val Asp Phe Gly Ala Phe Asp Tyr Ser Asn His Arg Leu Ala
130 135 140
Leu Ser Ser Ser Val Gly Asn Gly Leu Asn Phe Ile Ser Lys Val Leu
145 150 155 160
Ser Ser Lys Phe Gly Gly Lys Ala Glu Asp Ala Gln Pro Leu Leu Asp
165 170 175
Tyr Leu Leu Ala Leu Asn His Gln Gly Glu Asn Leu Met Ile Asn Glu
180 185 190
Asn Leu Asn Gly Val Ser Lys Leu Gln Ala Ala Leu Ile Val Ala Glu
195 200 205
Val Phe Val Ser Ser Phe Pro Lys Asp Thr Pro Tyr Lys Asp Phe Glu
210 215 220
His Lys Leu Lys Glu Trp Gly Phe Glu Lys Gly Trp Gly His Asn Ala
225 230 235 240
Gly Arg Val Arg Glu Thr Met Arg Leu Leu Ser Glu Ile Ile Gln Ala
245 250 255
Pro Asp Pro Ile Asn Met Glu Ser Phe Phe Ser Arg Leu Pro Thr Thr
260 265 270
Phe Asn Ile Val Ile Phe Ser Ile His Gly Tyr Phe Gly Gln Ala Asp
275 280 285
Val Leu Gly Leu Pro Asp Thr Gly Gly Gln Val Val Tyr Ile Leu Asp
290 295 300
Gln Val Arg Ala Leu Glu Glu Glu Met Leu Gln Arg Ile Lys Gln Gln
305 310 315 320
Gly Leu Asn Val Lys Pro Lys Ile Leu Val Val Thr Arg Leu Ile Pro
325 330 335
Asp Ala Arg Gly Thr Thr Cys Asn Gln Glu Met Glu Pro Ile Leu Asn
340 345 350
Ser Ser His Ser His Ile Leu Arg Ile Pro Phe Arg Thr Glu Lys Gly
355 360 365
Val Leu Arg Gln Trp Asp Ala Ser Ala Lys Ile Leu Glu Leu Met Glu
370 375 380
Gly Lys Pro Asp Leu Ile Ile Gly Asn Tyr Thr Asp Gly Asn Leu Val
385 390 395 400
Ala Ser Leu Leu Ala Asn Lys Leu Gly Val Thr Gln Gly Thr Ile Ala
405 410 415
His Ala Leu Glu Lys Thr Lys Tyr Glu Asp Ser Asp Val Lys Trp Lys
420 425 430
Gln Phe Asp Ser Lys Tyr His Phe Ser Cys Gln Phe Thr Ala Asp Leu
435 440 445
Leu Ala Met Asn Ala Ala Asp Phe Ile Ile Thr Ser Thr Tyr Gln Glu
450 455 460
Ile Ala Gly Ser Glu Thr Arg Pro Gly Gln Tyr Glu Ser His Thr Ala
465 470 475 480
Phe Thr Met Pro Gly Leu Tyr Arg Ala Val Ser Gly Ile Asn Val Phe
485 490 495
Asp Pro Lys Phe Asn Ile Ala Ala Pro Gly Ala Glu Gln Ser Ala Tyr
500 505 510
Phe Pro Phe Thr Glu Lys Gln Lys Arg Phe Ser Ala Phe Arg Pro Ala
515 520 525
Ile Glu Glu Leu Leu Tyr Ser Asn Glu Gln Asn Asn Glu His Ile Gly
530 535 540
Phe Leu Ala Asp Arg Lys Lys Pro Ile Ile Phe Ser Met Ala Arg Phe
545 550 555 560
Asp Thr Val Lys Asn Leu Ser Gly Leu Thr Glu Trp Tyr Gly Lys Asn
565 570 575
Lys Lys Leu Arg Asn Leu Val Asn Leu Val Ile Val Gly Gly Phe Phe
580 585 590
Asp Pro Ser Lys Ser Lys Asp Arg Glu Glu Ala Ala Glu Ile Lys Lys
595 600 605
Met His Glu Leu Ile Glu Lys Tyr Lys Leu Lys Gly Gln Met Arg Trp
610 615 620
Ile Ala Ala Gln Thr Asp Lys Tyr Gln Asn Ser Glu Leu Tyr Arg Thr
625 630 635 640
Ile Ala Asp Thr Lys Gly Ala Phe Val Gln Pro Ala Leu Tyr Glu Ala
645 650 655
Phe Gly Leu Thr Val Ile Glu Ala Met Asn Cys Gly Leu Pro Thr Phe
660 665 670
Ala Thr Asn Gln Gly Gly Pro Ala Glu Ile Ile Val Asp Gly Val Ser
675 680 685
Gly Phe His Ile Asp Pro Tyr Asn Gly Asp Glu Ser Ser Lys Lys Ile
690 695 700
Ala Asp Phe Phe Glu Lys Cys Lys Val Asp Ser Lys Tyr Trp Asn Lys
705 710 715 720
Ile Cys Gly Gly Gly Leu Lys Arg Ile Glu Glu Trp
725 730
<210> 30
<211> 3937
<212> DNA
<213> 普通烟草
<400> 30
atggctactg caccagccct aaatagatca gagtccatag ctgatagcat gccagaggcc 60
ttaaggcaaa gccggtacca catgaagaaa tgttttgcca agtacataga gcaaggaaag 120
aggatgatga aacttcataa cttgatggat gagttggaga aagtaattga tgatcctgct 180
gaaaggaacc atgttttgga aggcttactt ggctacatat tatgcactac aatggtatag 240
ctagattcat atgtacttat gatgccctta tattgtttcc tgatgtatta ctcttaaaac 300
cttctttgat caaatttaca ggaggctgca gttgttcctc cctacattgc ctttgccacg 360
agacagaatc ctggattctg ggaatatgtg aaagtgaatg ctaatgatct ttctgttgag 420
ggtattacag ctacagaata cttgaaattc aaggaaatga tagttgatga atgctggtat 480
agtatacgtt gcagcttatc ataccttttg tggttttata acttcaatca gaaaactcat 540
cagagttacc tttgtgtgaa catgaaatgc agggcaaaag atgaatatgc actggaaatt 600
gattttggag cagtagactt ctcaacgcct cgactgaccc tatcctcttc aattggcaat 660
ggtctcagtt atgtttccaa gtttctaact tcaaagctaa atgctacctc cgcgagtgca 720
cagtgtctgg ttgactactt gctcactttg aatcatcaag gagatgtacg tcaacaaaaa 780
tcaaactcca taagtaaact tgtcaactct aagaagaaaa aataggaaaa gaagattcac 840
gtaacaaatt ttctttatgt tcaactgcag aaactgatga tcaatgagac actcagcact 900
gtctcaaagc ttcaggctgc actggttgta gcagaagcat ctatttcctc tttaccaaca 960
gatacaccat atgagagctt tgagctaagg tgatttgttt tttcctctac ttccctccac 1020
ttgtgccatg ctacgtagta ctaagtaact tcaattcttg taaagattca aacagtgggg 1080
ttttgagaaa ggatggggtg atacagctga aagggtcagc gacaccatga gaacactgtc 1140
tgaggtgctt caggcaccag atccattgaa cattcagaag ttctttggaa gggttccaac 1200
tgttttcaat attgtattgt tctctgtcca tggatacttt ggccaagcag atgttcttgg 1260
cttgccagac actggtggtc aggtaagcat ttaatagctt ttacatttaa cttctatgca 1320
ttgacaataa aataattttt aacagtttga ccacttctgc tcttgttcaa caggtagttt 1380
atgttttgga tcaagttgta gcttttgaag aagaaatgct acaaagaatt aaacagcagg 1440
ggctcaatat taagcctcaa attcttgtgg tgagttccta gacaatcgac gtgactatgc 1500
aattatgtag aggctgttta gaaaagttaa tatcatatgt tgattgcaca gttaacccga 1560
ctgattccgg atgcaaaagg aacaaagtgc aaccaggaac tagaaccaat caagaataca 1620
aaacattcac acatcctcag agttccattt aggacagaaa aaggagtgct taatcaatgg 1680
gtttcacgat ttgatatcta tccatatctg gagagatata ctcaggtatg tatttttata 1740
tcaaccttgc tcatcaaaga tgtgttgttt cctcaattcc atttttcccc ttggcaaaag 1800
gatgctgctg acaaaatcgt cgagctaatg gaaggcaaac ctgatctaat cattggtaac 1860
tacactgatg ggaatctagt ggcttcacta atggctagaa aacttgggat aactctggta 1920
acttttctta atcatatttg atgttgcttc ttctccaagt tagttcttaa tctccactga 1980
cctagaccat ctttgcaaca gggaactatt gctcatgctt tggagaagac aaaatatgaa 2040
gactctgaca taaaattgaa ggaactcgat ccgaagtacc acttctcttg ccaattcaca 2100
gctgatttga ttgcaatgaa ttcagcagat ttcattatca ctagcacata ccaagaaata 2160
gctggaaggt aagaattaga gctaataagt aatgcattca tatgtatttc agcatcgctc 2220
tttcaccatc atcgaataca caccactact cagtaaatgt atttgctcaa aagtttgcaa 2280
cttaatggat ctcattcttg aatgcttcaa catatgcagc aaagataaac caggacagta 2340
tgagagccat agtgcattta cccttccagg gctttacaga gttgcttcag gtatcaatgt 2400
ctttgatcca aaatttaata ttgctgcacc tggggcagac cagtcggtgt atttccctta 2460
cacagaaaag cagaagcgtt tgactgcttt ccgccctgcc attgaggaac tgctttttag 2520
taaagtggac aatgacgagc acgtgtaagt ctaagtgtta aacttcagct tagtgcctag 2580
aacatcccac tgctctatgt attgatgttt cacttgtttc aaacagtgga tatttagaag 2640
acagaaagaa acctatcctg tttaccatgg caaggctgga cacagtgaag aacacatctg 2700
gactaacaga atggtatggc aagaacaaga ggctcagaag cttagttaac cttgttgtgg 2760
ttggtggttc ctttgatcct acaaaatcca aggataggga agaagcagct gaaataaaaa 2820
agatgcacat gctgatagag aaataccagc ttaagggtca gattagatgg atagcagctc 2880
agactgacag atacagaaat agtgaactct accgcacaat agcagattcc aaaggagctt 2940
ttgtgcagcc tgcattgtat gaagcatttg gtctaacagt cattgaggca atgaactgtg 3000
gattaccaac ctttgctacc aaccaaggtg gccctgctga gattattgtt gatggggtct 3060
caggctttca tattgatcca aataatgggg atgaatcaag caacaaaatt gccaactttt 3120
tccaaaaatg cagggaggat cctgagtatt ggaacaggat ttcagtccag ggtctaaacc 3180
gtatatatga atggtaactc acagataagc cattcaaatt gcaaagaggc acatatcttg 3240
cagaaaattt cttaatcctt aaatcctaat tttttgcagt tacacatgga agatctatgc 3300
aaacaaggta ttgaatatgg ggtccatcta tactttttgg aggacattgt acagagatca 3360
gaaacaagca aagcaaagat acatcgagac tttctacaat cttgagttta ggaacttggt 3420
atagtgctgc atgacattga cagtatacca caaacatctt tatgagatga attactttta 3480
ataaaattgt ttttaacctt tgcttcctta atggcactta ttgcaggtaa aaaatgtgcc 3540
tatcagaaag gacgaaacac cacaaggacc aaaggagagg gagaaagtta agccacagat 3600
atcacaaagg catgctctaa agcttttgcc tacagttttt caagagaccc tagtatattc 3660
tagtactaaa ttagaattat acagcatgca gcttttgctg ttcacctttc taaatcacca 3720
gttgtgtcaa tcaagttgac aaaatcaata aattgggatt ttccctttcc tatgcttgat 3780
tgttattact cctactttgt ttatggtagt cttccttcat tgttttctcc tgtacttctt 3840
ttactacaac tgtactgaca tactaattat ttctgtgtac caggcgctca caatcaaggt 3900
tgcagaagta agattagata aaattgctac tgcatga 3937
<210> 31
<211> 860
<212> PRT
<213> 普通烟草
<400> 31
Met Ala Thr Ala Pro Ala Leu Asn Arg Ser Glu Ser Ile Ala Asp Ser
1 5 10 15
Met Pro Glu Ala Leu Arg Gln Ser Arg Tyr His Met Lys Lys Cys Phe
20 25 30
Ala Lys Tyr Ile Glu Gln Gly Lys Arg Met Met Lys Leu His Asn Leu
35 40 45
Met Asp Glu Leu Glu Lys Val Ile Asp Asp Pro Ala Glu Arg Asn His
50 55 60
Val Leu Glu Gly Leu Leu Gly Tyr Ile Leu Cys Thr Thr Met Glu Ala
65 70 75 80
Ala Val Val Pro Pro Tyr Ile Ala Phe Ala Thr Arg Gln Asn Pro Gly
85 90 95
Phe Trp Glu Tyr Val Lys Val Asn Ala Asn Asp Leu Ser Val Glu Gly
100 105 110
Ile Thr Ala Thr Glu Tyr Leu Lys Phe Lys Glu Met Ile Val Asp Glu
115 120 125
Cys Trp Ala Lys Asp Glu Tyr Ala Leu Glu Ile Asp Phe Gly Ala Val
130 135 140
Asp Phe Ser Thr Pro Arg Leu Thr Leu Ser Ser Ser Ile Gly Asn Gly
145 150 155 160
Leu Ser Tyr Val Ser Lys Phe Leu Thr Ser Lys Leu Asn Ala Thr Ser
165 170 175
Ala Ser Ala Gln Cys Leu Val Asp Tyr Leu Leu Thr Leu Asn His Gln
180 185 190
Gly Asp Lys Leu Met Ile Asn Glu Thr Leu Ser Thr Val Ser Lys Leu
195 200 205
Gln Ala Ala Leu Val Val Ala Glu Ala Ser Ile Ser Ser Leu Pro Thr
210 215 220
Asp Thr Pro Tyr Glu Ser Phe Glu Leu Arg Phe Lys Gln Trp Gly Phe
225 230 235 240
Glu Lys Gly Trp Gly Asp Thr Ala Glu Arg Val Ser Asp Thr Met Arg
245 250 255
Thr Leu Ser Glu Val Leu Gln Ala Pro Asp Pro Leu Asn Ile Gln Lys
260 265 270
Phe Phe Gly Arg Val Pro Thr Val Phe Asn Ile Val Leu Phe Ser Val
275 280 285
His Gly Tyr Phe Gly Gln Ala Asp Val Leu Gly Leu Pro Asp Thr Gly
290 295 300
Gly Gln Val Val Tyr Val Leu Asp Gln Val Val Ala Phe Glu Glu Glu
305 310 315 320
Met Leu Gln Arg Ile Lys Gln Gln Gly Leu Asn Ile Lys Pro Gln Ile
325 330 335
Leu Val Leu Thr Arg Leu Ile Pro Asp Ala Lys Gly Thr Lys Cys Asn
340 345 350
Gln Glu Leu Glu Pro Ile Lys Asn Thr Lys His Ser His Ile Leu Arg
355 360 365
Val Pro Phe Arg Thr Glu Lys Gly Val Leu Asn Gln Trp Val Ser Arg
370 375 380
Phe Asp Ile Tyr Pro Tyr Leu Glu Arg Tyr Thr Gln Asp Ala Ala Asp
385 390 395 400
Lys Ile Val Glu Leu Met Glu Gly Lys Pro Asp Leu Ile Ile Gly Asn
405 410 415
Tyr Thr Asp Gly Asn Leu Val Ala Ser Leu Met Ala Arg Lys Leu Gly
420 425 430
Ile Thr Leu Gly Thr Ile Ala His Ala Leu Glu Lys Thr Lys Tyr Glu
435 440 445
Asp Ser Asp Ile Lys Leu Lys Glu Leu Asp Pro Lys Tyr His Phe Ser
450 455 460
Cys Gln Phe Thr Ala Asp Leu Ile Ala Met Asn Ser Ala Asp Phe Ile
465 470 475 480
Ile Thr Ser Thr Tyr Gln Glu Ile Ala Gly Ser Lys Asp Lys Pro Gly
485 490 495
Gln Tyr Glu Ser His Ser Ala Phe Thr Leu Pro Gly Leu Tyr Arg Val
500 505 510
Ala Ser Gly Ile Asn Val Phe Asp Pro Lys Phe Asn Ile Ala Ala Pro
515 520 525
Gly Ala Asp Gln Ser Val Tyr Phe Pro Tyr Thr Glu Lys Gln Lys Arg
530 535 540
Leu Thr Ala Phe Arg Pro Ala Ile Glu Glu Leu Leu Phe Ser Lys Val
545 550 555 560
Asp Asn Asp Glu His Val Gly Tyr Leu Glu Asp Arg Lys Lys Pro Ile
565 570 575
Leu Phe Thr Met Ala Arg Leu Asp Thr Val Lys Asn Thr Ser Gly Leu
580 585 590
Thr Glu Trp Tyr Gly Lys Asn Lys Arg Leu Arg Ser Leu Val Asn Leu
595 600 605
Val Val Val Gly Gly Ser Phe Asp Pro Thr Lys Ser Lys Asp Arg Glu
610 615 620
Glu Ala Ala Glu Ile Lys Lys Met His Met Leu Ile Glu Lys Tyr Gln
625 630 635 640
Leu Lys Gly Gln Ile Arg Trp Ile Ala Ala Gln Thr Asp Arg Tyr Arg
645 650 655
Asn Ser Glu Leu Tyr Arg Thr Ile Ala Asp Ser Lys Gly Ala Phe Val
660 665 670
Gln Pro Ala Leu Tyr Glu Ala Phe Gly Leu Thr Val Ile Glu Ala Met
675 680 685
Asn Cys Gly Leu Pro Thr Phe Ala Thr Asn Gln Gly Gly Pro Ala Glu
690 695 700
Ile Ile Val Asp Gly Val Ser Gly Phe His Ile Asp Pro Asn Asn Gly
705 710 715 720
Asp Glu Ser Ser Asn Lys Ile Ala Asn Phe Phe Gln Lys Cys Arg Glu
725 730 735
Asp Pro Glu Tyr Trp Asn Arg Ile Ser Val Gln Gly Leu Asn Arg Ile
740 745 750
Tyr Glu Cys Tyr Thr Trp Lys Ile Tyr Ala Asn Lys Val Leu Asn Met
755 760 765
Gly Ser Ile Tyr Thr Phe Trp Arg Thr Leu Tyr Arg Asp Gln Lys Gln
770 775 780
Ala Lys Gln Arg Tyr Ile Glu Thr Phe Tyr Asn Leu Glu Phe Arg Asn
785 790 795 800
Leu Val Lys Asn Val Pro Ile Arg Lys Asp Glu Thr Pro Gln Gly Pro
805 810 815
Lys Glu Arg Glu Lys Val Lys Pro Gln Ile Ser Gln Arg His Ala Leu
820 825 830
Lys Leu Leu Pro Thr Val Phe Gln Glu Thr Leu Ala Leu Thr Ile Lys
835 840 845
Val Ala Glu Val Arg Leu Asp Lys Ile Ala Thr Ala
850 855 860
<210> 32
<211> 3905
<212> DNA
<213> 普通烟草
<400> 32
atggctactg caccagccct gaaaagatca gagtccatag ctgatagcat gccagaggcc 60
ttaaggcaaa gccggtacca catgaagaaa tgttttgcca agtacataga gcaaggcaag 120
aggatgatga aacttcataa cttgatggat gaattggaga aagtaattga tgatcctgct 180
gaaaggaacc atgttttgga aggcttactt ggctacatat tatgtactac aatggtatag 240
ctagattcat atgtacttat gatgtcctta tattgtttcc ggaggcatta ttcttaaatc 300
cttctttgat caaatttgta ggaggctgca gttgttcctc cctatattgc cttcgccacg 360
agacagaatc ctggattctg ggaatatgtg aaagtcaatg ctaatgatct ttctgttgag 420
ggtattacag ctacagatta cttgaaattc aaggaaatga tagttgatga aagctggtat 480
agaatacttt gcagcttatc ataccttttg tggttttata atttcaatca gaaaactcat 540
cagagttacc tttgtgtgaa catgacatgc agggcaaaag atgaatatgc actggaaatt 600
gattttggag cagtagactt ctcaacgcct cgactgaccc tatcctcttc aattggaaat 660
ggtctcagtt atgtttccaa gtttctaact tcaaagctaa atgctacctc agcgagtgca 720
cagtgtctgg ttgactactt gctcactttg aatcaccaag gagatgtacg tcaacaaaaa 780
tcaaactcca taagtaaact tgtcaactct aagaagtaaa aataggaaaa gaagattcat 840
gtaacaaatt ttctttatgt tcaactgtag aaactgatga tcaatgagac actcggcact 900
gtctcaaagc ttcaggctgc actggttgta gcagaagcat ctatttcctc cttaccaaca 960
gatacaccat accagagctt tgagctaagg tgatttgttt tttcctctac ttccttccac 1020
ttttggtgtg ctacatagta ctaagtaact tcaattcttg taaagattca aacagtgggg 1080
ttttgagaaa ggatggggtg atacagctga aagggtccgc gacaccatga gaacactttc 1140
tgaggtactt caggcgccag atccattgaa cattgagaag ttctttggga gggttccaac 1200
tgttttcaat attgtattgt tctctgttca tggatacttt ggccaagcaa atgttcttgg 1260
cttgccagac acaggtggtc aggtaagcat ctaatagctt ttacatttaa cttctatgca 1320
ttgacaataa aataacttct acactaccaa ataatttttg aaagtttgac cacttcggct 1380
cttgttcaac aggtggttta tgttttggat caagttgtag cttttgaaga agaaatgctc 1440
caaagaatta aacagcaggg gctcaatatt aagcctcaaa ttcttgtggt gagctcctag 1500
acaatgacgt gactatgcaa ttaagtagag gctgtttaga aaagttaata tcatatgttg 1560
attgcacagt taacccgact gattccggac gccaaaggaa caaagtgcaa ccaggaacta 1620
gaaccaatca agaatacaaa acattcacac atcctcagag ttccatttag gacagaaaaa 1680
ggagtgctta atcaatgggt ttcacgattt gatatctatc catatctgga gagatatact 1740
caggtgtgta tttttatatc aaccctgctc atcaaagatg tgttgtttcc tcaattccat 1800
ttttcgcctt gacaaaagga cgctgctgac aaaatcatcg agctaatgga aggcaaacct 1860
gatctaatca ttggtaacta cactgatggg aatctagtgg cttctctaat ggctagaaag 1920
cttgggataa ctctggtaac ttttcttatc atatttgatg ttgtttcttc tccaagttgg 1980
ttcttaatgt caactaaccc agaccatctt tgtaacaggg aactattgct catgctctgg 2040
agaagacaaa atatgaagac tctgacatca aattgaagga actcgatccg aagtaccact 2100
tttcttgcca attcacagct gatttgattg caatgaattc agcagatttc attatcacaa 2160
gcacatatca agaaatagcc ggaaggtaag aattggaact acggaagcag agagctaata 2220
agtagtgcac tcatatattt cagcatcgct ctttcgcata atcgaataca caccactact 2280
cagtaaatgt acttgctcaa aagtttacaa gtttatggat cttattcttg aatgcttcaa 2340
catatgcagc aaagataggc caggacagta tgagagccat agtgcattta cccttccagg 2400
gctttacaga gttgcttcag gcatcaatgt ctttgatcct aaatttaata ttgctgcacc 2460
tggggcagac caatcggtgt atttccctta cacagaaaag cagacgcgtt tgactgcttt 2520
ccgccctgcc attgaggaac tgctttttag taaagtggac aatgacgagc acatgtaagt 2580
cttagtgtta aacttcagct ttcagcttag tgcctagaac attccactgg ctctatgtat 2640
taatgtttca cttgtttcaa acacagtgga tatttagaag acagaaagaa acctatcctg 2700
tttaccatgg caaggctgga cacagtgaag aacacatctg gactaacaga atggtatggc 2760
aagaacaaga ggctcagaag cttagttaac cttgttgtgg ttggtggttc ctttgatcct 2820
acaaaatcca aggatagaga agaagcagct gaaataaaaa agatgcacat gctgatagag 2880
aaataccagc ttaagggtca gatcagatgg atagcagctc agactgacag atatagaaac 2940
agtgaactct accgcacaat agcagattcc aaaggagctt ttgtgcagcc tgcattatat 3000
gaagcatttg gtctaacagt cattgaggca atgaactgtg gattaccaac ctttgctacc 3060
aaccaaggtg gccctgctga gattattgtt gatggggtct caggctttca tattgatcca 3120
aataatgggg atgaatcaag caacaaagtt gccaactttt tccaaaaatg cagggaggat 3180
cctgagtatt ggaacaggat ttcagtccag ggtctaaacc gtatatatga atggtaactc 3240
acagataagc cattcaaatt gcaaagaggc acatatcttg ctgaaaattt cttaatcctt 3300
taatcctaaa attttgcagt tacacatgga agatctatgc aaacaaggta ttgaatatgg 3360
ggtccatcta tactttttgg aggacattgt acagagatca gaaacaagca aagcaaagat 3420
acatcgagac tttctacaat cttgagttta ggaacttggt atagtgctgc atgacattga 3480
cagtatacca caaacatctt tatgagatga attactttta ataaaattgt ttttaacctt 3540
tgcctcctta atgacactta ttgcaggtaa aaaatgtgcc tatcagacag gacgaaacac 3600
cacaaggacc aaaggagagg agggagaaag ttaagccaca gatatcacaa aggcatgctc 3660
taaagctttt gcctatagtt tttcaggaga ccctagtata ttctagtact aaattagaat 3720
tatacagcat gcagcttgct tctgctgttc acctttctaa atcaccagtt atgtcaatca 3780
agttgacaaa atcaataaat tcggcttttc cctttcctat gcttgattgt tattactcct 3840
acttcgttta tggtagtctt ccttcattgt tttctcctgt acttctttta ctacaactgt 3900
actga 3905
<210> 33
<211> 913
<212> PRT
<213> 普通烟草
<400> 33
Met Ala Thr Ala Pro Ala Leu Lys Arg Ser Glu Ser Ile Ala Asp Ser
1 5 10 15
Met Pro Glu Ala Leu Arg Gln Ser Arg Tyr His Met Lys Lys Cys Phe
20 25 30
Ala Lys Tyr Ile Glu Gln Gly Lys Arg Met Met Lys Leu His Asn Leu
35 40 45
Met Asp Glu Leu Glu Lys Val Ile Asp Asp Pro Ala Glu Arg Asn His
50 55 60
Val Leu Glu Gly Leu Leu Gly Tyr Ile Leu Cys Thr Thr Met Glu Ala
65 70 75 80
Ala Val Val Pro Pro Tyr Ile Ala Phe Ala Thr Arg Gln Asn Pro Gly
85 90 95
Phe Trp Glu Tyr Val Lys Val Asn Ala Asn Asp Leu Ser Val Glu Gly
100 105 110
Ile Thr Ala Thr Asp Tyr Leu Lys Phe Lys Glu Met Ile Val Asp Glu
115 120 125
Ser Trp Ala Lys Asp Glu Tyr Ala Leu Glu Ile Asp Phe Gly Ala Val
130 135 140
Asp Phe Ser Thr Pro Arg Leu Thr Leu Ser Ser Ser Ile Gly Asn Gly
145 150 155 160
Leu Ser Tyr Val Ser Lys Phe Leu Thr Ser Lys Leu Asn Ala Thr Ser
165 170 175
Ala Ser Ala Gln Cys Leu Val Asp Tyr Leu Leu Thr Leu Asn His Gln
180 185 190
Gly Asp Lys Leu Met Ile Asn Glu Thr Leu Gly Thr Val Ser Lys Leu
195 200 205
Gln Ala Ala Leu Val Val Ala Glu Ala Ser Ile Ser Ser Leu Pro Thr
210 215 220
Asp Thr Pro Tyr Gln Ser Phe Glu Leu Arg Phe Lys Gln Trp Gly Phe
225 230 235 240
Glu Lys Gly Trp Gly Asp Thr Ala Glu Arg Val Arg Asp Thr Met Arg
245 250 255
Thr Leu Ser Glu Val Leu Gln Ala Pro Asp Pro Leu Asn Ile Glu Lys
260 265 270
Phe Phe Gly Arg Val Pro Thr Val Phe Asn Ile Val Leu Phe Ser Val
275 280 285
His Gly Tyr Phe Gly Gln Ala Asn Val Leu Gly Leu Pro Asp Thr Gly
290 295 300
Gly Gln Val Val Tyr Val Leu Asp Gln Val Val Ala Phe Glu Glu Glu
305 310 315 320
Met Leu Gln Arg Ile Lys Gln Gln Gly Leu Asn Ile Lys Pro Gln Ile
325 330 335
Leu Val Leu Thr Arg Leu Ile Pro Asp Ala Lys Gly Thr Lys Cys Asn
340 345 350
Gln Glu Leu Glu Pro Ile Lys Asn Thr Lys His Ser His Ile Leu Arg
355 360 365
Val Pro Phe Arg Thr Glu Lys Gly Val Leu Asn Gln Trp Val Ser Arg
370 375 380
Phe Asp Ile Tyr Pro Tyr Leu Glu Arg Tyr Thr Gln Asp Ala Ala Asp
385 390 395 400
Lys Ile Ile Glu Leu Met Glu Gly Lys Pro Asp Leu Ile Ile Gly Asn
405 410 415
Tyr Thr Asp Gly Asn Leu Val Ala Ser Leu Met Ala Arg Lys Leu Gly
420 425 430
Ile Thr Leu Gly Thr Ile Ala His Ala Leu Glu Lys Thr Lys Tyr Glu
435 440 445
Asp Ser Asp Ile Lys Leu Lys Glu Leu Asp Pro Lys Tyr His Phe Ser
450 455 460
Cys Gln Phe Thr Ala Asp Leu Ile Ala Met Asn Ser Ala Asp Phe Ile
465 470 475 480
Ile Thr Ser Thr Tyr Gln Glu Ile Ala Gly Ser Lys Asp Arg Pro Gly
485 490 495
Gln Tyr Glu Ser His Ser Ala Phe Thr Leu Pro Gly Leu Tyr Arg Val
500 505 510
Ala Ser Gly Ile Asn Val Phe Asp Pro Lys Phe Asn Ile Ala Ala Pro
515 520 525
Gly Ala Asp Gln Ser Val Tyr Phe Pro Tyr Thr Glu Lys Gln Thr Arg
530 535 540
Leu Thr Ala Phe Arg Pro Ala Ile Glu Glu Leu Leu Phe Ser Lys Val
545 550 555 560
Asp Asn Asp Glu His Ile Gly Tyr Leu Glu Asp Arg Lys Lys Pro Ile
565 570 575
Leu Phe Thr Met Ala Arg Leu Asp Thr Val Lys Asn Thr Ser Gly Leu
580 585 590
Thr Glu Trp Tyr Gly Lys Asn Lys Arg Leu Arg Ser Leu Val Asn Leu
595 600 605
Val Val Val Gly Gly Ser Phe Asp Pro Thr Lys Ser Lys Asp Arg Glu
610 615 620
Glu Ala Ala Glu Ile Lys Lys Met His Met Leu Ile Glu Lys Tyr Gln
625 630 635 640
Leu Lys Gly Gln Ile Arg Trp Ile Ala Ala Gln Thr Asp Arg Tyr Arg
645 650 655
Asn Ser Glu Leu Tyr Arg Thr Ile Ala Asp Ser Lys Gly Ala Phe Val
660 665 670
Gln Pro Ala Leu Tyr Glu Ala Phe Gly Leu Thr Val Ile Glu Ala Met
675 680 685
Asn Cys Gly Leu Pro Thr Phe Ala Thr Asn Gln Gly Gly Pro Ala Glu
690 695 700
Ile Ile Val Asp Gly Val Ser Gly Phe His Ile Asp Pro Asn Asn Gly
705 710 715 720
Asp Glu Ser Ser Asn Lys Val Ala Asn Phe Phe Gln Lys Cys Arg Glu
725 730 735
Asp Pro Glu Tyr Trp Asn Arg Ile Ser Val Gln Gly Leu Asn Arg Ile
740 745 750
Tyr Glu Cys Tyr Thr Trp Lys Ile Tyr Ala Asn Lys Val Leu Asn Met
755 760 765
Gly Ser Ile Tyr Thr Phe Trp Arg Thr Leu Tyr Arg Asp Gln Lys Gln
770 775 780
Ala Lys Gln Arg Tyr Ile Glu Thr Phe Tyr Asn Leu Glu Phe Arg Asn
785 790 795 800
Leu Val Lys Asn Val Pro Ile Arg Gln Asp Glu Thr Pro Gln Gly Pro
805 810 815
Lys Glu Arg Arg Glu Lys Val Lys Pro Gln Ile Ser Gln Arg His Ala
820 825 830
Leu Lys Leu Leu Pro Ile Val Phe Gln Glu Thr Leu Val Tyr Ser Ser
835 840 845
Thr Lys Leu Glu Leu Tyr Ser Met Gln Leu Ala Ser Ala Val His Leu
850 855 860
Ser Lys Ser Pro Val Met Ser Ile Lys Leu Thr Lys Ser Ile Asn Ser
865 870 875 880
Ala Phe Pro Phe Pro Met Leu Asp Cys Tyr Tyr Ser Tyr Phe Val Tyr
885 890 895
Gly Ser Leu Pro Ser Leu Phe Ser Pro Val Leu Leu Leu Leu Gln Leu
900 905 910
Tyr

Claims (15)

1.一种植物细胞,所述植物细胞包含:
(i)多核苷酸,所述多核苷酸包含与SEQ ID NO:5(NtINV4-S)具有至少81%序列同一性或与SEQ ID NO:7(NtINV4-T)具有至少62%序列同一性的序列,由其组成或基本上由其组成;
(ii)多肽,所述多肽由(i)中所示的所述多核苷酸编码;
(iii)多肽,所述多肽包含与SEQ ID NO:6(NtINV4-S)具有至少85%序列同一性或与SEQ ID NO:8(NtINV4-T)具有至少85%序列同一性的序列,由其组成或基本上由其组成;或者
(iv)构建体、载体或表达载体,其包含(i)中所示的经分离的多核苷酸,
其中与所述多核苷酸或多肽的表达或活性未被修饰的对照植物细胞相比,所述植物细胞包含至少一种修饰,所述至少一种修饰调节(a)所述多核苷酸的表达或活性或(b)所述多核苷酸或所述多肽的表达或活性。
2.根据权利要求1所述的植物细胞,其中与含有所述对照植物细胞的对照植物的干制叶子中的所述一种或多种还原糖的水平相比,所调节的表达或调节的活性调节包含所述植物细胞的植物的干制叶子中的一种或多种还原糖的水平,合适地其中所述还原糖是葡萄糖或果糖或它们的组合。
3.根据权利要求2所述的植物细胞,其中与对照中间位置干制叶子相比,中间位置干制叶子具有至少约63%的降低的葡萄糖水平;或
其中与对照中间位置干制叶子相比,中间位置干制叶子分别具有至少约43%的降低的果糖水平;或
其中与对照中间位置干制叶子相比,中间位置干制叶子分别具有至少约63%的降低的葡萄糖水平和至少约43%的降低的果糖水平。
4.根据前述权利要求中任一项所述的植物细胞,其中所述至少一种修饰是所述多核苷酸中的遗传突变,并且所述植物是普通烟草。
5.根据前述权利要求中任一项所述的植物细胞,所述植物细胞还包含NtSUS多核苷酸或由其编码的多肽中的至少一种修饰,
适当地,其中所述NtSUS多核苷酸或由其编码的多肽选自由以下组成的组:NtSUS2-T、NtSUS3-S、NtSUS3-T、NtSUS4-S、NtSUS4-T或其两种或更多种的组合,
更适当地,其中所述NtSUS多核苷酸或由其编码的多肽选自由以下组成的组:NtSUS2-S、NtSUS3-S、NtSUS3-T和NtSUS4-S或其两种或更多种的组合。
6.根据权利要求5所述的植物细胞,所述植物细胞包含根据权利要求1(i)所述的NtINV4多核苷酸或根据权利要求1(ii)或权利要求1(iii)所述的NtINV4多肽中的至少一个突变,以及所述NtSUS多核苷酸或由其编码的多肽中的至少一个突变。
7.一种植物或其部分,其包含根据权利要求1至6中任一项所述的植物细胞。
8.一种植物材料、干制植物材料或均质植物材料,其来源于或获自根据权利要求7所述的植物或其部分;适当地,
其中所述植物材料选自由以下组成的组:生物质、种子、茎、鲜花或叶子或其两种或更多种的组合;或
其中所述干制植物材料选自由以下组成的组:烟道干制的植物材料、晒干的植物材料或晾干的植物材料或者其两种或更多种的组合。
9.一种烟草产品,所述烟草产品包含根据权利要求1至6中任一项所述的植物细胞、根据权利要求7所述的植物的一部分或根据权利要求8所述的植物材料。
10.一种用于产生根据权利要求7所述的植物的方法,所述方法包括以下步骤:
(a)提供包含至少一种修饰的根据权利要求1至6中任一项所述的植物细胞;以及
(b)将所述植物细胞繁殖成植物。
11.根据权利要求10所述的方法,其中在步骤(a)中,通过基因组编辑引入所述至少一种修饰;适当地,
其中所述基因组编辑选自CRISPR介导的基因组编辑、锌指核酸酶介导的诱变、化学或放射诱变、同源重组、寡核苷酸定向诱变和大范围核酸酶介导的诱变。
12.根据权利要求10或权利要求11所述的方法,其中在步骤(a)中,使用干扰多核苷酸或通过引入至少一个突变或其组合来引入所述至少一种修饰。
13.一种用于制备干制植物材料的方法,与对照植物材料相比,所述干制植物材料具有改变量的还原糖,所述方法包括以下步骤:
(a)提供根据权利要求7所述的植物或其部分或根据权利要求8所述的植物材料;
(b)自其收获所述植物材料;以及
(c)干制所述植物材料。
14.一种产生液体烟草提取物的方法,所述方法包括以下步骤:
(a)由含有根据权利要求1至4中任一项所述的植物细胞的植物或其部分制备第一烟草起始材料;
(b)由含有植物细胞的植物或其部分制备第二烟草起始材料,所述植物细胞包含NtSUS多核苷酸或由其编码的多肽中的至少一种修饰,
适当地,其中所述NtSUS多核苷酸或由其编码的多肽选自由以下组成的组:NtSUS2-T、NtSUS3-S、NtSUS3-T、NtSUS4-S、NtSUS4-T或其两种或更多种的组合,或
更适当地,其中所述NtSUS多核苷酸或由其编码的多肽选自由以下组成的组:NtSUS2-S、NtSUS3-S、NtSUS3-T和NtSUS4-S或其两种或更多种的组合;
(c)在第一提取温度下加热所述第一烟草起始材料;
(d)在第二提取温度下加热所述第二烟草起始材料;
(e)收集加热期间从所述第一烟草起始材料和第二烟草起始材料释放的挥发性化合物;以及
(f)合并从所述第一烟草起始材料和第二烟草起始材料释放的所收集的挥发性化合物并从所合并的挥发性化合物形成液体烟草提取物。
15.一种液体烟草提取物,其通过根据权利要求14所述的方法产生、获得或能够获得。
CN202080069448.2A 2019-10-01 2020-09-28 调节植物中的还原糖含量(inv) Pending CN114829587A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP19200865 2019-10-01
EP19200865.4 2019-10-01
PCT/EP2020/077048 WO2021063860A1 (en) 2019-10-01 2020-09-28 Modulating reducing sugar content in a plant (inv)

Publications (1)

Publication Number Publication Date
CN114829587A true CN114829587A (zh) 2022-07-29

Family

ID=68136164

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080069448.2A Pending CN114829587A (zh) 2019-10-01 2020-09-28 调节植物中的还原糖含量(inv)

Country Status (7)

Country Link
US (1) US20220348944A1 (zh)
EP (1) EP4041896A1 (zh)
JP (1) JP2022550383A (zh)
KR (1) KR20220070305A (zh)
CN (1) CN114829587A (zh)
BR (1) BR112022005552A2 (zh)
WO (1) WO2021063860A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024160860A1 (en) 2023-02-02 2024-08-08 Philip Morris Products S.A. Modulation of genes coding for lysine ketoglutarate reductase
WO2024160864A1 (en) 2023-02-02 2024-08-08 Philip Morris Products S.A. Modulation of sugar transporters

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1618976A (zh) * 2004-07-13 2005-05-25 甘肃农业大学 导入AcInv反义基因培育抗低温糖化马铃薯品系的方法
WO2007038566A2 (en) * 2005-09-27 2007-04-05 Cornell University Invertase and inhibitors from coffee
CN105120656A (zh) * 2012-12-21 2015-12-02 塞尔克蒂斯股份有限公司 冷诱导甜味降低的马铃薯
WO2015184007A1 (en) * 2014-05-28 2015-12-03 Tyton Biosciences, Llc Transgenic tobacco plants for enhanced bioethanol production
CN105686070A (zh) * 2016-04-28 2016-06-22 湖南中烟工业有限责任公司 一种烟草源基础烟味原料的制备方法
US20180355366A1 (en) * 2014-01-29 2018-12-13 The University Of Queensland Yield promoter to increase sucrose and sucrose derivatives in plants

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050120418A1 (en) * 2003-11-06 2005-06-02 Anawah Inc. Tomatoes having altered acid invertase activity due to non-transgenic alterations in acid invertase genes
WO2006091194A1 (en) 2005-02-23 2006-08-31 North Carolina State University Alteration of tobacco alkaloid content through modification of specific cytochrome p450 genes
BRPI0717355B1 (pt) 2006-10-13 2018-01-16 North Carolina State University Método para obtenção de uma planta transgênica de nicotina, método para obtenção de uma semente; construto de ácido nucléico recombinante; método de redução da conversão de nicotina em nornicotina em uma planta de nicotina
EP2573177B1 (en) 2007-11-12 2022-12-28 North Carolina State University Alteration of tobacco alkaloid content through modification of specific cytochrome P450 genes
EP2231861B1 (en) 2007-12-13 2014-10-29 Philip Morris Products S.A. Transgenic plants modified for reduced cadmium transport, derivative products, and related methods
DE102008064184A1 (de) * 2008-12-22 2010-08-12 Südzucker AG Mannheim/Ochsenfurt Verfahren zur Steigerung des Saccharoseertrages beim landwirtschaftlichen Anbau von Zuckerrüben und Zuckerrohr
US20100199386A1 (en) * 2009-02-03 2010-08-05 Wisconsin Alumni Research Foundation Control of cold-induced sweetening and reduction of acrylamide levels in potato or sweet potato
AR080636A1 (es) 2010-01-15 2012-04-25 Univ North Carolina State Composiciones y metodos para minimizar la sintesis de nornicotina en tabaco
JP6388474B2 (ja) 2010-09-03 2018-09-12 フィリップ・モーリス・プロダクツ・ソシエテ・アノニム 植物中の重金属の削減
EP2565265A1 (en) 2011-09-02 2013-03-06 Philip Morris Products S.A. Isopropylmalate synthase from Nicotiana tabacum and methods and uses thereof
EP2565271A1 (en) 2011-09-02 2013-03-06 Philip Morris Products S.A. Threonine synthase from Nicotiana tabacum and methods and uses thereof
CA2853320A1 (en) 2011-10-31 2013-05-10 Philip Morris Products S.A. Modulating beta-damascenone in plants
US10563215B2 (en) 2012-12-21 2020-02-18 Philip Morris Products S.A. Tobacco specific nitrosamine reduction in plants
CA2944965A1 (en) 2014-05-08 2015-11-12 Philip Morris Products S.A. Reduction of nicotine to nornicotine conversion in plants
US11584936B2 (en) 2014-06-12 2023-02-21 King Abdullah University Of Science And Technology Targeted viral-mediated plant genome editing using CRISPR /Cas9
BR112016029591A2 (pt) 2014-06-25 2017-10-24 Philip Morris Products Sa modulação do teor de nitrato em plantas
AP2017009676A0 (en) 2014-07-18 2017-01-31 Philip Morris Products Sa Tobacco protease genes
US11666082B2 (en) 2014-09-26 2023-06-06 Philip Morris Products S.A. Reducing tobacco specific nitrosamines through alteration of the nitrate assimilation pathway
AU2016318423B2 (en) 2015-09-09 2022-01-20 Philip Morris Products S.A. Plants with reduced asparagine content
KR20180107123A (ko) 2016-01-29 2018-10-01 필립모리스 프로덕츠 에스.에이. 경지 재배된 담배 식물에서의 카드뮴 축적 감소
KR102606956B1 (ko) 2016-12-20 2023-11-29 필립모리스 프로덕츠 에스.에이. 개화까지의 시간이 단축된 식물
EP3480314A1 (en) 2017-11-03 2019-05-08 Philip Morris Products S.A. Regulation of alkaloid content

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1618976A (zh) * 2004-07-13 2005-05-25 甘肃农业大学 导入AcInv反义基因培育抗低温糖化马铃薯品系的方法
WO2007038566A2 (en) * 2005-09-27 2007-04-05 Cornell University Invertase and inhibitors from coffee
CN105120656A (zh) * 2012-12-21 2015-12-02 塞尔克蒂斯股份有限公司 冷诱导甜味降低的马铃薯
US20180355366A1 (en) * 2014-01-29 2018-12-13 The University Of Queensland Yield promoter to increase sucrose and sucrose derivatives in plants
WO2015184007A1 (en) * 2014-05-28 2015-12-03 Tyton Biosciences, Llc Transgenic tobacco plants for enhanced bioethanol production
CN105686070A (zh) * 2016-04-28 2016-06-22 湖南中烟工业有限责任公司 一种烟草源基础烟味原料的制备方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
NCBI REFERENCE SEQUENCE: NW_008903928.1: "Nicotiana tomentosiformis unplaced genomic scaffold, Ntom_v01 Ntom_scaffold24298, whole genome shotgun sequence", 《NCBI》 *
NCBI REFERENCE SEQUENCE: NW_015949542.1: "Nicotiana tabacum cultivar TN90 unplaced genomic scaffold, Ntab-TN90 Ntab-TN90_scaffold92491, whole genome shotgun sequence", 《NCBI》 *
唐煌: "四川4个主产区烟草淀粉和蔗糖分解酶类及其基因表达的差异分析", 中国优秀硕士学位论文全文数据库 农业科技辑》, pages 4 - 8 *
李影: "有机菌肥和生物炭配施对豫中烤烟生长、品质及植烟土壤性质的影响", 《中国优秀硕士学位论文全文数据库 农业科技辑》, pages 047 - 415 *

Also Published As

Publication number Publication date
BR112022005552A2 (pt) 2022-06-28
JP2022550383A (ja) 2022-12-01
WO2021063860A1 (en) 2021-04-08
EP4041896A1 (en) 2022-08-17
KR20220070305A (ko) 2022-05-30
US20220348944A1 (en) 2022-11-03

Similar Documents

Publication Publication Date Title
RU2735254C2 (ru) Снижение табак-специфичных нитрозаминов в растениях
CN109996879B (zh) 具有缩短的到开花时间的植物
KR102207550B1 (ko) 감소된 아스파라긴 함량을 갖는 식물
KR102136088B1 (ko) 식물계에서의 중금속 감소
JP6302407B2 (ja) 植物におけるβ−ダマセノンの調節
KR20170020416A (ko) 식물 내의 질산염 함량 조절
CN111793640A (zh) 烟草植物及使用此类植物的方法
KR20140057642A (ko) 니코티아나 타바쿰으로부터의 트레오닌 합성효소 및 그의 방법 및 용도
CN113271768B (zh) 经由硝酸盐还原酶的突变来调节植物中的硝酸盐水平
JP7463284B2 (ja) 植物におけるアミノ酸含有量の調節
CN114829587A (zh) 调节植物中的还原糖含量(inv)
US20230200344A1 (en) Modulating sugar and amino acid content in a plant (sultr3)
JP7525400B2 (ja) 植物体における還元糖含有量の調節
RU2801948C2 (ru) Модулирование содержания редуцирующих сахаров в растении
RU2826107C1 (ru) Модулирование содержания сахаров и аминокислот в растении (sultr3)
RU2799785C2 (ru) Модулирование содержания аминокислот в растении
RU2792235C2 (ru) Растения с сокращенным периодом времени до наступления цветения
WO2024160860A1 (en) Modulation of genes coding for lysine ketoglutarate reductase
WO2024160864A1 (en) Modulation of sugar transporters

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination