CN110914416A - 产生大麻素和大麻素衍生物的微生物和方法 - Google Patents

产生大麻素和大麻素衍生物的微生物和方法 Download PDF

Info

Publication number
CN110914416A
CN110914416A CN201880042884.3A CN201880042884A CN110914416A CN 110914416 A CN110914416 A CN 110914416A CN 201880042884 A CN201880042884 A CN 201880042884A CN 110914416 A CN110914416 A CN 110914416A
Authority
CN
China
Prior art keywords
polypeptide
seq
genetically modified
host cell
modified host
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201880042884.3A
Other languages
English (en)
Other versions
CN110914416B (zh
Inventor
J·D·凯斯林
L·德斯帕克斯
J·黄
罗小舟
M·雷特
C·登比
A·莱希纳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of California
Original Assignee
University of California
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of California filed Critical University of California
Publication of CN110914416A publication Critical patent/CN110914416A/zh
Application granted granted Critical
Publication of CN110914416B publication Critical patent/CN110914416B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1085Transferases (2.) transferring alkyl or aryl groups other than methyl groups (2.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07CACYCLIC OR CARBOCYCLIC COMPOUNDS
    • C07C63/00Compounds having carboxyl groups bound to a carbon atoms of six-membered aromatic rings
    • C07C63/04Monocyclic monocarboxylic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/40Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
    • C12P7/42Hydroxy-carboxylic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y101/00Oxidoreductases acting on the CH-OH group of donors (1.1)
    • C12Y101/01Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
    • C12Y101/01088Hydroxymethylglutaryl-CoA reductase (1.1.1.88)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y203/00Acyltransferases (2.3)
    • C12Y203/01Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
    • C12Y203/01086Fatty-acyl-CoA synthase (2.3.1.86)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y203/00Acyltransferases (2.3)
    • C12Y203/01Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
    • C12Y203/012063,5,7-Trioxododecanoyl-CoA synthase (2.3.1.206)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y203/00Acyltransferases (2.3)
    • C12Y203/03Acyl groups converted into alkyl on transfer (2.3.3)
    • C12Y203/0301Hydroxymethylglutaryl-CoA synthase (2.3.3.10)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y205/00Transferases transferring alkyl or aryl groups, other than methyl groups (2.5)
    • C12Y205/01Transferases transferring alkyl or aryl groups, other than methyl groups (2.5) transferring alkyl or aryl groups, other than methyl groups (2.5.1)
    • C12Y205/01102Geranyl-pyrophosphate—olivetolic acid geranyltransferase (2.5.1.102)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/01Phosphotransferases with an alcohol group as acceptor (2.7.1)
    • C12Y207/01036Mevalonate kinase (2.7.1.36)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/04Phosphotransferases with a phosphate group as acceptor (2.7.4)
    • C12Y207/04002Phosphomevalonate kinase (2.7.4.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y401/00Carbon-carbon lyases (4.1)
    • C12Y401/01Carboxy-lyases (4.1.1)
    • C12Y401/01033Diphosphomevalonate decarboxylase (4.1.1.33), i.e. mevalonate-pyrophosphate decarboxylase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y503/00Intramolecular oxidoreductases (5.3)
    • C12Y503/03Intramolecular oxidoreductases (5.3) transposing C=C bonds (5.3.3)
    • C12Y503/03002Isopentenyl-diphosphate DELTA-isomerase (5.3.3.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y602/00Ligases forming carbon-sulfur bonds (6.2)
    • C12Y602/01Acid-Thiol Ligases (6.2.1)
    • C12Y602/01003Long-chain-fatty-acid-CoA ligase (6.2.1.3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y604/00Ligases forming carbon-carbon bonds (6.4)
    • C12Y604/01Ligases forming carbon-carbon bonds (6.4.1)
    • C12Y604/01002Acetyl-CoA carboxylase (6.4.1.2)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Mycology (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nutrition Science (AREA)
  • Cell Biology (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)

Abstract

本发明提供了产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物的基因修饰的宿主细胞。本发明提供了合成大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物的方法。

Description

产生大麻素和大麻素衍生物的微生物和方法
相关申请的交叉引用
本申请要求2017年4月27日提交的第62/491,114号美国临时申请和2017年10月7日提交的第62/569,532号美国临时申请的权益,将其全部内容通过引用并入本文。
关于联邦资助研究的声明
本发明是在美国国家科学基金会授予的基金号1330914和1442724的政府支持下完成的。政府拥有本发明的某些权利。
对序列表的引用
与本申请相关联的序列表以文本格式代替纸质副本提供,并且在此通过引用将其并入说明书中。包含序列表的文本文件的名称为DEMT_001_00WOSeqList_ST25_txt。该文本文件约为673KB,创建于2018年4月25日,正在通过EFS-Web电子提交。
介绍
来自大麻属(Cannabis)的植物由于其药用特性已经被人类使用了数千年。在现代,大麻属的生物活性作用归因于一类称为“大麻素”的化合物,其中有数百种结构类似物,包括四氢大麻酚(THC)和大麻二酚(CBD)。这些分子和大麻属材料的制备物最近已发现可用作慢性疼痛、多发性硬化、癌症相关的恶心和呕吐、体重减轻、食欲不振、痉挛和其他病症的治疗剂。
Figure BDA0002337530530000011
某些大麻素的生理作用被认为是由它们与在人类和其他动物中发现的两种细胞受体的相互作用所介导的。大麻素1型受体(CB1)在大脑、生殖系统和眼睛中很常见。大麻素2型受体(CB2)在免疫系统中很常见,并在动物模型中介导与炎症相关的治疗作用。大麻素受体的发现及其与植物来源的大麻素的相互作用早于内源性配体的确定。
除了THC和CBD以外,在大麻属中还确定了数百种其他大麻素。然而,这些化合物中的许多以低含量存在,并且与更丰富的大麻素共存,使得难以从植物中获得纯净的样品来研究其治疗潜力。类似地,化学合成这些类型的产物的方法麻烦且昂贵,并且倾向于产生不足的产率。因此,需要制备纯大麻素、大麻素前体、大麻素衍生物或大麻素前体衍生物的另外的方法。
发明概述
本发明提供用于产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物的方法、多肽、编码所述多肽的核酸和基因修饰的宿主细胞。
本发明的一个方面涉及一种用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞,所述基因修饰的宿主细胞包含一种或多种编码香叶基焦磷酸:橄榄醇酸香叶基转移酶(GOT)多肽的异源核酸,其中所述GOT多肽以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由香叶基焦磷酸(GPP)和橄榄醇酸产生大麻萜酚酸。
本发明的另一个方面涉及一种用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞,所述基因修饰的宿主细胞包含一种或多种编码包含与SEQ ID NO:110具有至少65%的序列同一性的氨基酸序列的GOT多肽的异源核酸。
本发明的一个方面涉及一种用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞,所述基因修饰的宿主细胞包含一种或多种编码包含与SEQ ID NO:100具有至少65%的序列同一性的氨基酸序列的GOT多肽的异源核酸。
在前述或以下任一项的某些实施方案中,所述基因修饰的宿主细胞还包含一种或多种编码四酮体合成酶(TKS)多肽的异源核酸,和一种或多种编码橄榄醇酸(OAC)多肽的异源核酸,或一种或多种编码融合TKS和OAC多肽的异源核酸。在一些实施方案中,所述TKS多肽包含与SEQ ID NO:11或SEQ ID NO:76具有至少50%的序列同一性的氨基酸序列。在一些实施方案中,所述OAC多肽包含与SEQ ID NO:10或SEQ ID NO:78具有至少50%的序列同一性的氨基酸序列。
在前述或以下任一项的某些实施方案中,所述基因修饰的宿主细胞还包含以下中的一种或多种:a)一种或多种编码产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽的异源核酸;b)一种或多种编码产生GPP的多肽的异源核酸;或c)一种或多种编码产生丙二酰辅酶A的多肽的异源核酸。在一些实施方案中,所述基因修饰的宿主细胞还包含一种或多种编码产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽的异源核酸,其中所述产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽是酰基活化酶(AAE)多肽。在一些实施方案中,所述AAE多肽包含与SEQ ID NO:90具有至少50%的序列同一性的氨基酸序列。在一些实施方案中,所述AAE多肽包含与SEQ ID NO:92或SEQ ID NO:149具有至少50%的序列同一性的氨基酸序列。在一些实施方案中,所述基因修饰的宿主细胞还包含一种或多种编码产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽的异源核酸,其中所述产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽是脂肪酰辅酶A连接酶多肽。在一些实施方案中,所述脂肪酰辅酶A连接酶多肽包含与SEQ ID NO:145或SEQ ID NO:147具有至少50%的序列同一性的氨基酸序列。在一些实施方案中,所述基因修饰的宿主细胞还包含一种或多种编码产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽的异源核酸,其中所述产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽是脂肪酰辅酶A合成酶(FAA)多肽。在一些实施方案中,所述FAA多肽包含与SEQ ID NO:169、SEQ ID NO:192、SEQ ID NO:194、SEQID NO:196、SEQ ID NO:198或SEQ ID NO:200具有至少50%的序列同一性的氨基酸序列。在一些实施方案中,所述基因修饰的宿主细胞还包含一种或多种编码产生GPP的多肽的异源核酸,其中所述产生GPP的多肽是香叶基焦磷酸合成酶(GPPS)多肽。在一些实施方案中,所述GPPS多肽包含与SEQ ID NO:7、SEQ ID NO:8或SEQ ID NO:60具有至少50%的序列同一性的氨基酸序列。在一些实施方案中,所述基因修饰的宿主细胞还包含一种或多种编码产生丙二酰辅酶A的多肽的异源核酸,其中所述产生丙二酰辅酶A的多肽是乙酰辅酶A羧化酶-1(ACC1)多肽。在一些实施方案中,所述ACC1多肽包含与SEQ ID NO:9、SEQ ID NO:97或SEQID NO:207具有至少50%的序列同一性的氨基酸序列。
在前述或以下任一项的某些实施方案中,所述基因修饰的宿主细胞还包含以下中的一种或多种:a)一种或多种编码HMG-辅酶A合成酶(HMGS)多肽的异源核酸;b)一种或多种编码3-羟基-3-甲基-戊二酰辅酶A还原酶(HMGR)多肽的异源核酸;c)一种或多种编码甲羟戊酸激酶(MK)多肽的异源核酸;d)一种或多种编码磷酸甲羟戊酸激酶(PMK)多肽的异源核酸;e)一种或多种编码甲羟戊酸焦磷酸脱羧酶(MVD)多肽的异源核酸;或f)一种或多种编码异戊烯基焦磷酸异构酶(IDI)多肽的异源核酸。在一些实施方案中,所述基因修饰的宿主细胞还包含一种或多种编码IDI多肽的异源核酸。在一些实施方案中,IDI多肽包含与SEQ IDNO:58具有至少50%的序列同一性的氨基酸序列。在一些实施方案中,所述基因修饰的宿主细胞还包含一种或多种编码HMGR多肽的异源核酸。在一些实施方案中,所述HMGR多肽包含与SEQ ID NO:22具有至少50%的序列同一性的氨基酸序列。在一些实施方案中,所述基因修饰的宿主细胞还包含一种或多种编码HMGR多肽的异源核酸,其中所述HMGR多肽是截短的HMGR(tHMGR)多肽。在一些实施方案中,所述tHMGR多肽包含与SEQ ID NO:17、SEQ ID NO:52、SEQ ID NO:113或SEQ ID NO:208具有至少50%的序列同一性的氨基酸序列。在一些实施方案中,所述基因修饰的宿主细胞还包含一种或多种编码HMGS多肽的异源核酸。在一些实施方案中,所述HMGS多肽包含与SEQ ID NO:23、SEQ ID NO:24或SEQ ID NO:115具有至少50%的序列同一性的氨基酸序列。在一些实施方案中,所述基因修饰的宿主细胞还包含一种或多种编码MK多肽的异源核酸。在一些实施方案中,所述MK多肽包含与SEQ ID NO:64具有至少50%的序列同一性的氨基酸序列。在一些实施方案中,所述基因修饰的宿主细胞还包含一种或多种编码PMK多肽的异源核酸。在一些实施方案中,所述PMK多肽包含与SEQ IDNO:62或SEQ ID NO:205具有至少50%的序列同一性的氨基酸序列。在一些实施方案中,所述基因修饰的宿主细胞还包含一种或多种编码MVD多肽的异源核酸。在一些实施方案中,所述MVD多肽包含与SEQ ID NO:66具有至少50%的序列同一性的氨基酸序列。
在前述或以下任一项的某些实施方案中,所述基因修饰的宿主细胞还包含一种或多种编码使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽的异源核酸。在一些实施方案中,所述使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽是乙酰乙酰辅酶A硫解酶多肽。在一些实施方案中,所述乙酰乙酰辅酶A硫解酶多肽包含与SEQ ID NO:25具有至少50%的序列同一性的氨基酸序列。
在前述或以下任一项的某些实施方案中,所述基因修饰的宿主细胞还包含一种或多种编码丙酮酸脱氢酶复合物(PDC)多肽的异源核酸。在一些实施方案中,所述PDC多肽包含与SEQ ID NO:117具有至少50%的序列同一性的氨基酸序列。
在前述或以下任一项的某些实施方案中,所述基因修饰的宿主细胞是真核细胞。在一些实施方案中,所述真核细胞是酵母细胞。在一些实施方案中,所述酵母细胞是酿酒酵母(Saccharomyces cerevisiae)。在一些实施方案中,所述酿酒酵母是酿酒酵母的蛋白酶缺陷菌株。在一些实施方案中,所述基因修饰的宿主细胞是植物细胞。
在前述或以下任一项的某些实施方案中,所述基因修饰的宿主细胞是原核细胞。
在前述或以下任一项的某些实施方案中,一种或多种异源核酸中的至少一种整合到基因修饰的宿主细胞的染色体中。
在前述或以下任一项的某些实施方案中,一种或多种异源核酸中的至少一种保持在染色体外。
在前述或以下任一项的某些实施方案中,一种或多种异源核酸中的两种或更多种存在于单个表达载体中。
在前述或以下任一项的某些实施方案中,所述异源核酸中的至少一种可操作地连接到诱导型启动子。
在前述或以下任一项的某些实施方案中,所述异源核酸中的至少一种可操作地连接到组成型启动子。
在前述或以下任一项的某些实施方案中,在合适的培养基中培养所述基因修饰的宿主细胞以与在类似条件下培养的非基因修饰的宿主细胞相比增加的量提供所述大麻素或大麻素衍生物的合成。
在前述或以下任一项的某些实施方案中,所述基因修饰的宿主细胞还包含一种或多种编码大麻素合成酶多肽的异源核酸。在一些实施方案中,所述大麻素合成酶多肽是四氢大麻酚酸(THCA)合成酶多肽。在一些实施方案中,所述THCA合成酶多肽包含与SEQ IDNO:14、SEQ ID NO:86、SEQ ID NO:104、SEQ ID NO:153或SEQ ID NO:155具有至少50%的序列同一性的氨基酸序列。在一些实施方案中,所述大麻素合成酶多肽是大麻二酚酸(CBDA)合成酶多肽。在一些实施方案中,所述CBDA合成酶多肽包含与SEQ ID NO:88或SEQ ID NO:151具有至少50%的序列同一性的氨基酸序列。
在前述或以下任一项的某些实施方案中,所述大麻素是大麻萜酚酸、大麻萜酚、Δ9-四氢大麻酚酸、Δ9-四氢大麻酚、Δ8-四氢大麻酚酸、Δ8-四氢大麻酚、大麻二酚酸、大麻二酚、大麻色烯酸、大麻色烯、大麻酚酸、大麻酚、次大麻二酚酸、次大麻二酚、四氢次大麻酚酸、四氢次大麻酚、次大麻色酚酸、次大麻色酚、次大麻萜酚酸、次大麻萜酚、大麻环酚酸、大麻环酚、大麻艾尔松酸(cannabielsoinic acid)、大麻艾尔松(cannabielsoin)、大麻二吡喃环烷酸(cannabicitranic acid)或大麻二吡喃环烷(cannabicitran)。
本发明的一个方面涉及一种在基因修饰的宿主细胞中产生大麻素或大麻素衍生物的方法,所述方法包括:a)在合适的培养基中培养所述基因修饰的宿主细胞;和b)回收产生的大麻素或大麻素衍生物。
本发明的另一个方面涉及一种在基因修饰的宿主细胞中产生大麻素或大麻素衍生物的方法,所述方法包括:a)在包含羧酸的合适的培养基中培养所述基因修饰的宿主细胞;b)回收产生的大麻素或大麻素衍生物。
本发明的一个方面涉及一种在基因修饰的宿主细胞中产生大麻素或大麻素衍生物的方法,所述方法包括:a)在包含橄榄醇酸或橄榄醇酸衍生物的合适的培养基中培养所述基因修饰的宿主细胞;b)回收产生的大麻素或大麻素衍生物。
本发明的另一个方面涉及一种在基因修饰的宿主细胞中产生大麻素或大麻素衍生物的方法,所述方法包括:a)在合适的培养基中培养包含一种或多种编码GOT多肽的异源核酸的基因修饰的宿主细胞,其中所述GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸;和b)回收产生的大麻素或大麻素衍生物。
本发明的一个方面涉及一种在基因修饰的宿主细胞中产生大麻素或大麻素衍生物的方法,所述方法包括:a)在合适的培养基中培养包含一种或多种编码GOT多肽的异源核酸的基因修饰的宿主细胞,所述GOT多肽包含与SEQ ID NO:110具有至少65%的序列同一性的氨基酸序列;和b)回收产生的大麻素或大麻素衍生物。
本发明的另一个方面涉及一种在基因修饰的宿主细胞中产生大麻素或大麻素衍生物的方法,所述方法包括:a)在合适的培养基中培养包含一种或多种编码GOT多肽的异源核酸的基因修饰的宿主细胞,所述GOT多肽包含与SEQ ID NO:100具有至少65%的序列同一性的氨基酸序列;和b)回收产生的大麻素或大麻素衍生物。
在前述或以下任一项的某些实施方案中,所述合适的培养基包含可发酵的糖。在一些实施方案中,所述合适的培养基包含预处理的纤维素原料。
在前述或以下任一项的某些实施方案中,所述合适的培养基包含不可发酵的碳源。在一些实施方案中,所述不可发酵的碳源包括乙醇。
本发明的一个方面涉及分离或纯化的GOT多肽,其中所述GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。
本发明的另一个方面涉及分离或纯化的多肽,其包含与SEQ ID NO:110具有至少65%的序列同一性的氨基酸序列。
本发明的一个方面涉及分离或纯化的多肽,其包含与SEQ ID NO:100具有至少65%的序列同一性的氨基酸序列。
本发明的另一个方面涉及一种分离或纯化的核酸,其编码GOT多肽,其中所述GOT多肽以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。
本发明的一个方面涉及一种分离或纯化的核酸,其编码包含与SEQ ID NO:110具有至少65%的序列同一性的氨基酸序列的多肽。
本发明的另一个方面涉及一种分离或纯化的核酸,其编码包含与SEQ ID NO:100具有至少65%的序列同一性的氨基酸序列的多肽。
本发明的一个方面涉及一种载体,其包含编码GOT多肽的核酸,其中所述GOT多肽以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。
本发明的另一个方面涉及一种载体,其包含编码包含与SEQ ID NO:110具有至少65%的序列同一性的氨基酸序列的多肽的核酸。
本发明的一个方面涉及一种载体,其包含编码包含与SEQ ID NO:100具有至少65%的序列同一性的氨基酸序列的多肽的核酸。
本发明的另一个方面涉及一种制备用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞的方法,包括向所述基因修饰的宿主细胞中引入一种或多种编码GOT多肽的异源核酸,其中所述GOT多肽以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。
本发明的一个方面涉及一种制备用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞的方法,包括向所述基因修饰的宿主细胞中引入一种或多种编码GOT多肽的异源核酸,所述GOT多肽包含与SEQ ID NO:110具有至少65%的序列同一性的氨基酸序列。
本发明的另一个方面涉及一种制备用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞的方法,包括向所述基因修饰的宿主细胞中引入一种或多种编码GOT多肽的异源核酸,所述GOT多肽包含与SEQ ID NO:100具有至少65%的序列同一性的氨基酸序列。
本发明的一个方面涉及一种制备用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞的方法,包括向所述基因修饰的宿主细胞中引入包含编码GOT多肽的核酸的载体,其中所述GOT多肽以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸;载体,其包含编码包含与SEQ ID NO:110具有至少65%的序列同一性的氨基酸序列的多肽的核酸;或载体,其包含编码包含与SEQ ID NO:100具有至少65%的序列同一性的氨基酸序列的多肽的核酸。
附图简述
图1提供了用于产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物的生物合成途径的示意图。
图2描绘了使用途径1a和四酮体合成酶(TKS)多肽/橄榄醇酸环化酶(OAC)多肽的细胞内橄榄醇酸产生。
图3描绘了途径1a和1b的细胞内橄榄醇酸产生的比较。
图4提供了用于橄榄醇酸产生的3种表达构建体的示意图。
图5提供了用于橄榄醇酸产生的2种表达构建体的示意图。
图6提供了用于香叶基焦磷酸(GPP)产生的3种表达构建体的示意图。
图7提供了用于GPP产生的2种表达构建体的示意图。
图8提供了用于大麻素产生的3种表达构建体的示意图。
图9描绘了使用表达构建体3+4或表达构建体3+5产生橄榄醇酸。
图10描绘了使用构建体3并在包含己酸的培养基中培养细胞产生橄榄醇酸;或使用构建体1产生橄榄醇酸。
图11是通过进料各种代表性羧酸产生橄榄醇酸衍生物的途径的示意图,其中通过各种各样的酰基活化酶多肽(例如,CsAAE1;CsAAE3)将所述羧酸转化成其辅酶A形式,产生橄榄醇酸衍生物。
图12描绘了具有各种官能团的各种代表性羧酸,其可以用作橄榄醇酸或大麻素衍生物的生物合成的底物。图12还描绘了由这些羧酸产生橄榄醇酸或大麻素衍生物。
图13描绘了各种代表性大麻素衍生物,其可以通过进料不同的酸并通过化学反应进一步衍生化这些衍生物产生。
图14描绘了利用橙花基焦磷酸(NPP)或GPP的大麻素生物合成途径。
图15描绘了使用NphB多肽和底物橄榄醇酸和GPP产生大麻萜酚酸(CBGA)。
图16描绘了产生GPP的表达构建体。
图17描绘了产生己酰辅酶A和/或己酸的表达构建体。
图18描绘了产生己酰辅酶A和/或己酸的表达构建体。
图19描绘了产生橄榄醇酸的表达构建体。
图20描绘了产生CBGA的表达构建体。
图21描绘了产生大麻二酚酸(CBDA)的表达构建体。
图22描绘了产生CBDA的表达构建体。
图23描绘了产生CBDA的表达构建体。
图24描绘了产生四氢大麻酚酸(THCA)的表达构建体。
图25描绘了产生THCA的表达构建体。
图26A、图26B和图26C描绘了说明CBGA的产生的LC-MS迹线。这些图示出了yL444菌株的乙酸乙酯提取物(图26A)、10μM CBGA标准品(图26B)和yL444的乙酸乙酯提取物和10μMCBGA标准品的混合物(图26C)的LC-MS迹线(m/z=359.2)。在9.2min处观察到的峰表明在yL444的乙酸乙酯提取物中存在CBGA。
图27描绘了使用具有N末端截短和ProA信号序列的THCA合成酶多肽产生THCA。该图示出了yXL046菌落1的乙酸乙酯提取物(副本1,顶部)、yXL046菌落2的乙酸乙酯提取物(副本2,中间)和含有CBDA和THCA的标准品(标准,底部)的LC-MS迹线(m/z=357.2144)。在7.9min处的峰表明存在CBDA,在9.6min处的峰表明存在THCA。
图28描绘了使用具有N末端截短和ProA信号序列的CBDA合成酶多肽产生CBDA。该图示出了yXL047菌落1的乙酸乙酯提取物(副本1)、yXL047菌落2的乙酸乙酯提取物(副本2)、阴性对照(阴性)和含有CBDA和THCA的标准品(标准)的LC-MS迹线(m/z=357.2144)。在7.9min处的峰表明存在CBDA,在9.6min处的峰表明存在THCA。
图29A和29B描绘了在产生S21菌株中使用的表达构建体。在图29A和29B中描绘的表达构建体也用于产生以下菌株:S29、S31、S34、S35、S37、S38、S39、S41、S42、S43、S44、S45、S46、S47、S49、S50、S51、S78、S80、S81、S82、S83、S84、S85、S86、S87、S88、S89、S90、S91、S94、S95、S97、S104、S108、S112、S114、S115、S116、S118、S123、S147、S164、S165、S166、S167、S168、S169和S170。
图30A、30B和30C描绘了用于产生S31菌株的表达构建体。在图30A、30B和30C中描绘的表达构建体也用于产生以下菌株:S94、S95和S97。
图31描绘了用于产生S35菌株的表达构建体。
图32描绘了用于产生S37菌株的表达构建体。
图33描绘了用于产生S38菌株的表达构建体。
图34描绘了用于产生S39菌株的表达构建体。
图35描绘了用于产生S41菌株的表达构建体。
图36描绘了用于产生S42菌株的表达构建体。
图37描绘了用于产生S43菌株的表达构建体。
图38描绘了用于产生S44菌株的表达构建体。
图39描绘了用于产生S45菌株的表达构建体。
图40描绘了用于产生S46菌株的表达构建体。
图41描绘了用于产生S47菌株的表达构建体。
图42A、42B和42C描绘了用于产生S49菌株的表达构建体。
图43A、43B和43C描绘了用于产生S50菌株的表达构建体。
图44A、44B和44C描绘了用于产生S51菌株的表达构建体。图44A、44B和44C中描绘的表达构建体也用于产生以下菌株:S78、S80、S81、S82、S83、S84、S85、S86、S87、S88和S89。
图45描绘了用于产生S78菌株的表达构建体。
图46描绘了用于产生S80菌株的表达构建体。
图47描绘了用于产生S81菌株的表达构建体。
图48描绘了用于产生S82菌株的表达构建体。
图49描绘了用于产生S83菌株的表达构建体。
图50描绘了用于产生S84菌株的表达构建体。
图51描绘了用于产生S85菌株的表达构建体。
图52描绘了用于产生S86菌株的表达构建体。
图53描绘了用于产生S87菌株的表达构建体。
图54描绘了用于产生S88菌株的表达构建体。
图55描绘了用于产生S89菌株的表达构建体。
图56A、56B和56C描绘了用于产生S90菌株的表达构建体。
图57A、57B和57C描绘了用于产生S91菌株的表达构建体。
图58描绘了用于产生S94菌株的表达构建体。
图59描绘了用于产生S95菌株的表达构建体。
图60描绘了用于产生S97菌株的表达构建体。
图61描绘了用于产生S104菌株的表达构建体。
图62描绘了用于产生S108菌株的表达构建体。
图63描绘了用于产生S112菌株的表达构建体。
图64描绘了用于产生S114菌株的表达构建体。
图65描绘了用于产生S115菌株的表达构建体。
图66描绘了用于产生S116菌株的表达构建体。
图67描绘了用于产生S118菌株的表达构建体。
图68描绘了用于产生S123菌株的表达构建体。
图69描绘了用于产生S147菌株的表达构建体。
图70描绘了用于产生S164菌株的表达构建体。
图71描绘了用于产生S165菌株的表达构建体。
图72描绘了用于产生S166菌株的表达构建体。
图73描绘了用于产生S167菌株的表达构建体。
图74描绘了用于产生S168菌株的表达构建体。
图75描绘了用于产生S169菌株的表达构建体。
图76描绘了用于产生S170菌株的表达构建体。
图77描绘了表达CsPT4多肽的菌株(S29)产生的CBGA峰的MS/MS谱。
图78描绘了可信的CBGA标准品的MS/MS谱。
图79描绘了在1.06min处的由CsGOT多肽产生的CBGA(顶部)、在1.06min处的由CsPT4多肽产生的CBGA(中间)和在1.06min处的可信的CBGA标准品(底部)。
图80描绘了在1.06min处的由CsGOT多肽产生的CBGA(比例尺x 102单位)。
图81描绘了在1.06min处的由CsPT4多肽产生的CBGA(比例尺x 104单位)。
图82描绘了在1.06min处的可信的CBGA标准品(比例尺x 104单位)。
图83描绘了在1.02min处的由S34产生的CBDA(顶部)和在1.02min处的可信的CBDA标准品(底部)。
图84描绘了在1.29min处的由菌株D123产生的THCA(顶部)和在1.29min处的可信的THCA标准品(底部)。
图85描绘了用于产生S34菌株的表达构建体。
图86描绘了用于产生S29菌株的表达构建体。图86中描绘的表达构建体也用于产生以下菌株:S31、S34、S35、S37、S38、S39、S41、S42、S43、S44、S45、S46、S47、S49、S50、S51、S78、S80、S81、S82、S83、S84、S85、S86、S87、S88、S89、S90、S91、S94、S95、S97和S123。
详述
本发明提供用于产生大麻素、大麻素前体、大麻素衍生物(例如,非天然存在的大麻素)或大麻素前体衍生物(例如,非天然存在的大麻素前体)的方法、多肽、编码所述多肽的核酸和基因修饰的宿主细胞。
香叶基焦磷酸:橄榄醇酸香叶基转移酶(GOT,酶学委员会编号2.5.1.102)多肽在大麻素的生物合成中起重要作用,但在基因修饰的宿主细胞中重构其活性已证明具有挑战性,阻碍了产生大麻素或大麻素衍生物的进展。在本文中,已经鉴定、分离和表征了编码本发明的多肽的新基因,所述多肽催化由GPP和橄榄醇酸产生大麻萜酚酸(CBGA)。令人惊讶的是,本发明的这些多肽可以以比先前发现的催化由GPP和橄榄醇酸产生CBGA的大麻属多肽高至少十倍的量催化由GPP和橄榄醇酸产生CBGA(参见例如,美国第US20120144523号专利申请公开文件和其中公开的GOT多肽CsPT1;本文中的SEQ ID NO:82)。催化由GPP和橄榄醇酸产生CBGA的本发明的新多肽为GOT多肽(例如,CsPT4多肽),并且可以在体内(例如,在基因修饰的宿主细胞内)和在体外(例如,无细胞)产生大麻素和大麻素衍生物。这些新的GOT多肽以及编码所述GOT多肽的核酸可用于本发明的方法和基因修饰的宿主细胞中,以产生大麻素或大麻素衍生物。
本发明的方法可以包括使用基因工程改造的微生物(例如,基因修饰的宿主细胞)产生天然存在的和非天然存在的大麻素或大麻素前体。天然存在的大麻素和大麻素前体和非天然存在的大麻素和大麻素前体(例如,大麻素衍生物和大麻素前体衍生物)由于其复杂的结构而难以通过化学合成来合成。本发明的方法使得能够在活细胞内部构建代谢途径,以由简单的前体例如糖和羧酸产生定制的大麻素、大麻素前体、大麻素衍生物或大麻素前体衍生物。可将编码一种或多种本文公开的多肽的一种或多种本文公开的异源核酸引入宿主微生物中,以实现将廉价的原料例如糖逐步转化为最终产物:大麻素、大麻素前体、大麻素衍生物或大麻素前体衍生物。这些产物可以通过选择和构建包含一种或多种本文公开的异源核酸的表达构建体或载体来指定,以实现有效地生物生产选择的大麻素前体;大麻素,如THC或CBD,和大麻属中含量较低的较不常见的大麻素物质;或大麻素衍生物或大麻素前体衍生物。生物生产还可以合成具有确定的立体化学的大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物,这是使用化学合成方法难以做到的。
本文公开的核酸可以包括编码以下多肽的核酸:具有在用于生物合成大麻素CBGA的大麻素生物合成途径中存在的多肽(如GOT多肽)的至少一种活性的多肽(例如,CsPT4多肽);四酮体合成酶(TKS)多肽;橄榄醇酸环化酶(OAC)多肽;和CBDA或THCA合成酶多肽(参见图1和11)。本文公开的核酸还可以包括编码以下多肽的核酸:具有参与大麻素前体的合成的多肽的至少一种活性的多肽。这些多肽包括但不限于,具有在甲羟戊酸途径中存在的多肽的至少一种活性的多肽;产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽(例如,酰基活化酶多肽、脂肪酰辅酶A合成酶多肽或脂肪酰辅酶A连接酶多肽);产生GPP的多肽;产生丙二酰辅酶A的多肽;使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽;或丙酮酸脱氢酶复合物多肽(参见图1和11)。
本公开还提供了用产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽产生大麻素前体衍生物或大麻素衍生物,以及大麻素或其前体。在某些这样的实施方案中,本文公开的基因修饰的宿主细胞用一种或多种编码产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽的异源核酸修饰。这些多肽可以允许产生己酰辅酶A、酰基辅酶A化合物、己酰辅酶A的衍生物或酰基辅酶A化合物的衍生物。在一些实施方案中,己酸或除己酸以外的羧酸被进料给表达产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽的基因修饰的宿主细胞(例如,存在于细胞生长的培养基中),以产生己酰辅酶A、酰基辅酶A化合物、己酰辅酶A的衍生物或酰基辅酶A化合物的衍生物。然后通过一种或多种具有在大麻素生物合成途径中存在的或参与大麻素前体的合成的多肽的至少一种活性的多肽,将这些化合物转化为大麻素衍生物或大麻素前体衍生物,以及大麻素或其前体(参见图1和11)。
令人惊讶地,发现产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽,以及具有在大麻素生物合成途径中存在的多肽(如TKS多肽、OAC多肽、GOT多肽)的至少一种活性的许多多肽(例如,CsPT4多肽),和CBDA或THCA合成酶多肽具有广泛的底物特异性。该广泛的底物特异性不仅允许在基因修饰的宿主细胞内或包含本文公开的多肽中的一种或多种的无细胞反应混合物二者中产生大麻素和大麻素前体,还允许产生非天然存在的大麻素衍生物和大麻素前体衍生物。由于该广泛的底物特异性,通过产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽在基因修饰的宿主细胞中产生的己酰辅酶A、酰基辅酶A化合物、己酰辅酶A的衍生物或酰基辅酶A化合物的衍生物可以被TKS和OAC多肽利用,以制备橄榄醇酸或其衍生物。橄榄醇酸或其衍生物随后可以被GOT多肽利用,以产生大麻素或大麻素衍生物。供选择地,橄榄醇酸或其衍生物可以被进料给包含GOT多肽的基因修饰的宿主细胞,以产生大麻素或大麻素衍生物。这些大麻素或大麻素衍生物随后可以通过CBDA或THCA合成酶多肽被转化为THCA或CDBA或其衍生物。
除了实现产生期望的大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物以外,本发明提供了比基于农业的生产更可靠和经济的方法。微生物发酵可以在几天内完成,而对于农作物来说则需要几个月,而且微生物发酵不受气候变化或土壤污染(例如重金属)的影响,并且可以制备高效价的纯产物。
本发明还提供了经济地制备大麻素前体或其衍生物以及包括THC和CBD及其衍生物在内的高价值大麻素的平台。还提供了不存在可行的制备方法的不同大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物的制备。
另外,本发明提供了在体内或体外由简单前体产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物的方法、基因修饰的宿主细胞、多肽和编码所述多肽的核酸。本文公开的编码一种或多种本文公开的多肽的核酸可以被引入微生物(例如,基因修饰的宿主细胞)中,导致一种或多种多肽的表达或过表达,所述多肽随后可以在体外或体内被利用以产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。在一些实施方案中,所述体外方法是无细胞的。
为了产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物,并且在基因修饰的宿主细胞内产生生物合成途径,所述基因修饰的宿主细胞可以表达或过表达编码本文公开的多肽的本文公开的异源核酸的组合。
大麻素生物合成
编码具有在大麻素生物合成途径中存在的多肽的至少一种活性的多肽的核酸可以用于本文公开的方法和基因修饰的宿主细胞中,以用于合成大麻素、大麻素前体、大麻素衍生物或大麻素前体衍生物。
在大麻属中,通过迄今为止仅在大麻属中确定的三种多肽的作用,由常见的代谢物前体香叶基焦磷酸(GPP)和己酰辅酶A产生大麻素。己酰辅酶A和丙二酰辅酶A组合,以通过TKS多肽提供12-碳四酮体中间体。然后,通过OAC多肽环化该四酮体中间体以产生橄榄醇酸。通过GOT多肽(例如,CsPT4多肽)用常见的类异戊二烯前体GPP使橄榄醇酸异戊烯化,以产生CBGA,所述大麻素也称为“母体大麻素”。不同的合成酶多肽然后将CBGA转化为其他大麻素,例如THCA合成酶多肽产生THCA,CBDA合成酶多肽产生CBDA等。在热或光的存在下,酸性大麻素可能经历脱羧,例如THCA产生THC,或CBDA产生CBD。
GPP和己酰辅酶A可以通过几种途径产生(参见图1和11)。一种或多种编码一种或多种具有在这些途径中存在的多肽的至少一种活性的多肽的核酸可以用于合成大麻素、大麻素前体、大麻素衍生物或大麻素前体衍生物的方法和基因修饰的宿主细胞中。
产生GPP或作为产生GPP的生物合成途径的部分的多肽可以是具有在甲羟戊酸(MEV)途径中存在的多肽的至少一种活性的一种或多种多肽。如本文所使用,术语“甲羟戊酸途径”或“MEV途径”可以指将乙酰辅酶A转化为异戊烯基焦磷酸(IPP)和二甲基烯丙基焦磷酸(DMAPP)的生物合成途径。甲羟戊酸途径包含催化以下步骤的多肽:(a)使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A(例如,通过乙酰乙酰辅酶A硫解酶多肽的作用);(b)使乙酰乙酰辅酶A与乙酰辅酶A缩合以形成羟甲基戊二酰辅酶A(HMG-辅酶A)(例如,通过HMG-辅酶A合成酶(HMGS)多肽的作用);(c)将HMG-辅酶A转化为甲羟戊酸(例如,通过HMG-辅酶A还原酶(HMGR)多肽的作用);(d)使甲羟戊酸磷酸化为甲羟戊酸5-磷酸(例如,通过甲羟戊酸激酶(MK)多肽的作用);(e)将甲羟戊酸5-磷酸转化为甲羟戊酸5-焦磷酸(例如,通过磷酸甲羟戊酸激酶(PMK)多肽的作用);(f)将甲羟戊酸5-焦磷酸转化为异戊烯基焦磷酸(例如,通过甲羟戊酸焦磷酸脱羧酶(MVD)多肽的作用);和(g)将异戊烯基焦磷酸(IPP)转化为二甲基烯丙基焦磷酸(DMAPP)(例如,通过异戊烯基焦磷酸异构酶(IDI)多肽的作用)(图1和11)。香叶基二磷酸合成酶(GPPS)多肽随后作用于IPP和/或DMAPP以产生GPP。另外,产生GPP或作为产生GPP的生物合成途径的部分的多肽可以是一种或多种具有在脱氧木酮糖-5-磷酸(DXP)途径中而不是MEV途径中存在的多肽的至少一种活性的多肽(图1)。
产生己酰辅酶A的多肽可以包括产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽(例如,己酰辅酶A合成酶(HCS)多肽、酰基活化酶多肽、脂肪酰辅酶A合成酶多肽或脂肪酰辅酶A连接酶多肽)。己酰辅酶A还可以通过包含一种或多种产生丙二酰辅酶A的多肽,如乙酰辅酶A羧化酶(ACC)多肽的途径产生。另外,己酰辅酶A用一种或多种多肽产生,所述多肽是产生己酰辅酶A的生物合成途径的部分,包括但不限于:丙二酰辅酶A-酰基载体蛋白转酰酶(MCT1)多肽、PaaH1多肽、Crt多肽、Ter多肽和BktB多肽;MCT1多肽、PhaB多肽、PhaJ多肽、Ter多肽和BktB多肽;短链脂肪酰辅酶A硫酯酶(SCFA-TE)多肽;或脂肪酸合成酶(FAS)多肽(参见图1和11)。己酰辅酶A衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物也可以通过这样的途径和多肽形成。
Figure BDA0002337530530000171
大麻素的生物合成途径
GPP和己酰辅酶A还可以通过包含以下多肽的途径产生:使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽和由丙酮酸产生乙酰辅酶的丙酮酸脱氢酶复合物多肽(参见图1和11)。己酰辅酶A衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物也可以通过这样的途径形成。
通用信息
除非另外指出,本发明的实践将采用分子生物学(包括重组技术)、微生物学、细胞生物学、生物化学和免疫学的常规技术,其在本领域技术范围内。这样的技术在文献中有充分的解释:“Molecular Cloning:A Laboratory Manual,”第二版(Sambrook等人,1989);“Oligonucleotide Synthesis”(M.J.Gait编,1984);“Animal Cell Culture”(R.I.Freshney编,1987);“Methods in Enzymology”(Academic Press,Inc.);“CurrentProtocols in Molecular Biology”(F.M.Ausubel等人编,1987,以及定期更新);“PCR:ThePolymerase Chain Reaction,”(Mullis等人编,1994);Singleton等人,Dictionary ofMicrobiology and Molecular Biology第二版,J.Wiley&Sons(New York,N.Y.1994)和March,Advanced Organic Chemistry Reactions,Mechanisms and Structure第四版,John Wiley&Sons(New York,N.Y.1992),为本领域技术人员提供了本申请中使用的许多术语的通用指南。
如本文所使用的“大麻素”或“大麻素化合物”可以指到目前为止仅在大麻(Cannabis sativa)中发现的一类独特的杂萜的成员。大麻素可以包括但不限于,大麻色烯(CBC)型(例如大麻色烯酸)、大麻萜酚(CBG)型(例如大麻萜酚酸)、大麻二酚(CBD)型(例如大麻二酚酸)、Δ9-反式-四氢大麻酚(Δ9-THC)型(例如Δ9-四氢大麻酚酸)、Δ8-反式-四氢大麻酚(Δ8-THC)型、大麻环酚(CBL)型、大麻艾尔松(CBE)型、大麻酚(CBN)型、脱氢大麻二酚(cannabinodiol,CBND)型、大麻三酚(cannabitriol,CBT)型、大麻萜酚酸(CBGA)、大麻萜酚酸单甲醚(CBGAM)、大麻萜酚(CBG)、大麻萜酚单甲醚(CBGM)、次大麻萜酚酸(CBGVA)、次大麻萜酚(CBGV)、大麻色烯酸(CBCA)、大麻色烯(CBC)、次大麻色酚酸(CBCVA)、次大麻色酚(CBCV)、大麻二酚酸(CBDA)、大麻二酚(CBD)、大麻二酚单甲醚(CBDM)、大麻二酚-C4(CBD-C4)、次大麻二酚酸(CBDVA)、次大麻二酚(CBDV)、大麻二苔黑酚(cannabidiorcol,CBD-C1)、Δ9-四氢大麻酚酸A(THCA-A)、Δ9-四氢大麻酚酸B(THCA-B)、Δ9-四氢大麻酚(THC)、Δ9-四氢大麻酚酸-C4(THCA-C4)、Δ9-四氢大麻酚-C4(THC-C4)、Δ9-四氢次大麻酚酸(THCVA)、Δ9-四氢次大麻酚(THCV)、Δ9-四氢大麻苔黑酚酸(tetrahydrocannabiorcolic acid,THCA-C1)、Δ9-四氢大麻苔黑酚(tetrahydrocannabiorcol,THC-C1)、Δ7-顺式-异四氢次大麻酚、Δ8-四氢大麻酚酸(Δ8-THCA)、Δ8-四氢大麻酚(Δ8-THC)、大麻环酚酸(CBLA)、大麻环酚(CBL)、次大麻环酚(cannabicyclovarin,CBLV)、大麻艾尔松酸(cannabielsoic acid)A(CBEA-A)、大麻艾尔松酸B(CBEA-B)、大麻艾尔松(CBE)、大麻艾尔松酸、大麻二吡喃环烷酸、大麻酚酸(CBNA)、大麻酚(CBN)、大麻酚甲醚(CBNM)、大麻酚-C4(CBN-C4)、次大麻酚(CBV)、大麻酚-C2(CNB-C2)、大麻苔黑酚(CBN-C1)、脱氢大麻二酚(CBND)、次大麻二酚(CBVD)、大麻三酚(CBT)、10-乙氧基-9-羟基-δ-6a-四氢大麻酚、8,9-二羟基-δ-6a-四氢大麻酚、次大麻三酚(cannabitriolvarin,CBTVE)、脱氢大麻呋喃(DCBF)、大麻呋喃(CBF)、大麻色满酮(cannabichromanon,CBCN)、大麻二吡喃环烷(CBT)、10-氧代-δ-6a-四氢大麻酚(OTHC)、δ-9-顺式-四氢大麻酚(顺式-THC)、3,4,5,6-四氢-7-羟基-α-α-2-三甲基-9-正丙基-2,6-桥亚甲基-2H-1-苯并恶辛因-5-甲醇(3,4,5,6-tetrahydro-7-hydroxy-alpha-alpha-2-trimethyl-9-n-propyl-2,6-methano-2H-1-benzoxocin-5-methanol)(OH-异-HHCV)、cannabiripsol(CBR)和三羟基-δ-9-四氢大麻酚(三OH-THC)。
如本文所使用的“大麻素前体”可以指在产生“母体大麻素”大麻萜酚酸(CBGA)之前,在大麻素生物合成途径中存在的任何中间体。大麻素前体可以包括但不限于,GPP、橄榄醇酸、己酰辅酶A、丙酮酸、乙酰乙酰辅酶A、丁酰辅酶A、乙酰辅酶A、HMG-辅酶A、甲羟戊酸、甲羟戊酸-5-磷酸、甲羟戊酸二磷酸和丙二酰辅酶A。
如本文详述的酰基辅酶A化合物可以包括具有以下结构的化合物:
Figure BDA0002337530530000191
其中R是任选包含一个或多个如本文所公开的官能团和/或反应性基团的脂肪酸侧链(即酰基辅酶A化合物衍生物)。
如本文所使用,己酰辅酶A衍生物、酰基辅酶A化合物衍生物、大麻素衍生物或大麻素前体衍生物(例如,橄榄醇酸衍生物)由本文公开的基因修饰的宿主细胞产生或在包含本文公开的多肽中的一种或多种的无细胞反应混合物中产生,并且可以指包含一个或多个官能团和/或反应性基团的己酰辅酶A、酰基辅酶A化合物、大麻素或大麻素前体(例如,橄榄醇酸)。官能团可以包括但不限于,叠氮基、卤素(例如,氯、溴、碘、氟)、甲基、烷基(包括支链和直链烷基)、炔基、烯基、甲氧基、烷氧基、乙酰基、氨基、羧基、羰基、氧代基、酯基、羟基、硫基、氰基、芳基、杂芳基、环烷基、环烯基、环烷基烯基、环烷基炔基、环烯基烷基、环烯基烯基、环烯基炔基、杂环基烯基、杂环基炔基、杂芳基烯基、杂芳基炔基、芳基烯基、芳基炔基、杂环基、螺环基、杂螺环基、硫代烷基、砜基、磺酰基、亚砜基、酰胺基、烷基氨基、二烷基氨基、芳基氨基、烷基芳基氨基、二芳基氨基、N-氧化物、酰亚胺基、烯胺基、亚胺基、肟基、腙基、腈基、芳烷基、环烷基烷基、卤代烷基、杂环基烷基、杂芳基烷基、硝基、硫代基等等。参见例如图12和13。适合的反应性基团可以包括但不必限于,叠氮基、羧基、羰基、胺基(例如,烷基胺基(例如,低级烷基胺基)、芳基胺基)、卤化物基团、酯基(例如,烷基酯基(例如,低级烷基酯基、苄基酯基)、芳基酯基、取代的芳基酯基)、氰基、硫酯基、硫醚基、磺酰卤化物基、醇基、硫醇基、琥珀酰亚胺酯基、异硫氰酸酯基、碘乙酰胺基、马来酰亚胺基、肼基、炔基、烯基等。反应性基团可以有助于目标分子的共价连接。合适的目标分子可以包括但不限于,可检测标记;造影剂;毒素(包括细胞毒素);接头;肽;药物(例如小分子药物);特异性结合对的成员;表位标签;通过靶受体结合的配体;有助于纯化的标签;增加溶解度的分子;增强生物利用度的分子;增加体内半衰期的分子;靶向特定细胞类型的分子;靶向特定组织的分子;提供跨过血脑屏障的分子;促进选择性附着到表面的分子;等等。官能团和反应性基团可以任选地被一个或多个另外的官能团或反应性基团取代。
由本文公开的基因修饰的宿主细胞产生或在包含本文公开的多肽中的一种或多种的无细胞反应混合物中产生的大麻素衍生物或大麻素前体衍生物还可以指缺乏一个或多个化学部分的天然存在的大麻素或天然存在的大麻素前体。这样的化学部分可以包括但不限于,甲基、烷基、烯基、甲氧基、烷氧基、乙酰基、羧基、羰基、氧代基、酯基、羟基、芳基、杂芳基、环烷基、环烯基、环烷基烯基、环烯基烷基、环烯基烯基、杂环基烯基、杂芳基烯基、芳基烯基、杂环基、芳烷基、环烷基烷基、杂环基烷基、杂芳基烷基等。在一些实施方案中,缺乏一个或多个存在于天然存在的大麻素或天然存在的大麻素前体中的化学部分,并且由本文公开的基因修饰的宿主细胞产生或在包含本文公开的多肽中的一种或多种的无细胞反应混合物中产生的大麻素衍生物或大麻素前体衍生物也可以包含本文所述的官能团和/或反应性基团中的任何一个或多个。官能团和反应性基团可以任选地被一个或多个另外的官能团和反应性基团取代。
本文使用的术语“核酸”可以指任何长度的核苷酸(核糖核苷酸或脱氧核苷酸)的聚合形式。因此,该术语可以包括但不限于单链、双链或多链DNA或RNA,基因组DNA,cDNA,基因,合成DNA或RNA,DNA-RNA杂交体,或包含嘌呤和嘧啶碱基或其他天然存在的、化学或生物化学修饰的、非天然存在的或衍生的核苷酸碱基的聚合物。
术语“肽”、“多肽”和“蛋白”在本文中可以互换使用,并且可以指任何长度的氨基酸的聚合形式,其可以包括编码和非编码氨基酸、化学或生化修饰或衍生的氨基酸、全长多肽、多肽片段或具有修饰的肽主链的多肽。本文公开的多肽可以作为修饰或工程化形式存在,包括截短或融合形式,同时保留所述活性。本文公开的多肽还可以是通过氨基酸插入、缺失、突变和/或取代而区别于具体所述的“参考”多肽(例如,野生型多肽),但保留与参考多肽基本相似的活性的变体。
如本文所使用,术语“异源的”可以指自然界中通常不存在的。术语“异源核苷酸序列”可以指在自然界中在给定细胞中通常不存在的核苷酸序列。因此,异源核苷酸序列可以是:(a)对其宿主细胞而言是外来的(即对该细胞而言是“外源的”);(b)在宿主细胞中天然存在(即“内源的”),但以非天然的量存在于细胞中(即比宿主细胞中天然存在的量更多或更少);或(c)天然存在于宿主细胞中,但位于其天然部位之外。术语“异源酶”或“异源多肽”可以指在自然界中的给定细胞中通常不存在的酶或多肽。该术语涵盖以下酶或多肽:(a)对给定细胞而言是外源的(即由宿主细胞中非天然存在或在宿主细胞中的给定背景下非天然存在的核酸编码);和(b)在宿主细胞中天然存在(例如,酶或多肽由对细胞而言是内源性的核酸编码),但在宿主细胞中以非天然的量产生(例如,比天然存在的量更多或更少)。因此,异源核酸可以是:(a)对其宿主细胞而言是外来的(即对细胞而言是“外源的”);(b)在宿主细胞中天然存在(即“内源的”),但以非天然的量存在于细胞中(即比宿主细胞中天然存在的量更多或更少);或(c)天然存在于宿主细胞中,但位于其天然部位之外。
“可操作地连接的”可以指要素的布置,其中如此描述的组分被配置成便于执行其通常的功能。因此,可操作地连接到编码序列的控制序列能够实现编码序列的表达。控制序列不必与编码序列邻接,只要它们具有指导其表达的功能即可。因此,例如,在启动子序列和编码序列之间可以存在介于中间的未翻译但已经转录的序列,并且仍然可以认为该启动子序列与编码序列是“可操作地连接的”。
“分离的”可以指基本上或实质上不含通常以其天然状态伴随它们的组分的多肽或核酸。分离的多肽或核酸可以不同于其天然存在的形式或环境中的多肽或核酸。因此,分离的多肽和核酸可以与天然细胞中存在的多肽和核酸区分开来。如果存在一种或多种其他组分,则分离的核酸或多肽可以从具有分离的核酸或多肽的混合物中的一种或多种其他组分中进一步纯化出来。
“基因修饰的宿主细胞”(也称为“重组宿主细胞”)是已经引入异源核酸(例如表达载体或构建体)的宿主细胞。例如,原核宿主细胞是通过将异源核酸,例如对原核宿主细胞而言是外来的(不是正常存在于自然界中的)外源核酸,或通常不存在于原核宿主细胞中的重组核酸引入合适的原核宿主细胞而得到的基因修饰的原核宿主细胞(例如,细菌);真核宿主细胞是通过将异源核酸,例如对真核宿主细胞而言是外来的外源核酸,或通常不存在于真核宿主细胞中的重组核酸引入合适的真核宿主细胞而得到的基因修饰的真核宿主细胞。
如本文所使用,“无细胞系统”可以指细胞裂解物、细胞提取物或其他制备物,其中制备物中的基本上所有的细胞均已被破坏或以其他方式处理,使得所有或选择的细胞组分,例如细胞器、蛋白、核酸、细胞膜本身(或其片段或组分)等从细胞中释放出来或重悬于合适的培养基中和/或从细胞环境中纯化出来。无细胞系统可以包括由纯化或分离的多肽以及合适的试剂和缓冲液制备的反应混合物。
在一些实施方案中,可以在不破坏多肽的三维结构或功能的情况下在多肽的氨基酸序列中进行保守取代。保守取代可以由技术人员通过将具有相似疏水性、极性和R链长度的氨基酸取代另一个来实现。另外,通过比较来自不同物种的同源蛋白的比对序列,可以通过定位在物种之间已经突变的氨基酸残基,而不改变编码的蛋白的基本功能来确定保守取代。术语“保守氨基酸取代”可以指具有相似侧链的氨基酸残基在蛋白中的可互换性。例如,具有脂族侧链的一组氨基酸由甘氨酸、丙氨酸、缬氨酸、亮氨酸和异亮氨酸组成;具有脂族羟基侧链的一组氨基酸由丝氨酸和苏氨酸组成;具有包含酰胺的侧链的一组氨基酸由天冬酰胺和谷氨酰胺组成;具有芳族侧链的一组氨基酸由苯丙氨酸、酪氨酸和色氨酸组成;具有碱性侧链的一组氨基酸由赖氨酸、精氨酸和组氨酸组成;具有酸性侧链的一组氨基酸由谷氨酸和天冬氨酸组成;以及具有含硫侧链的一组氨基酸由半胱氨酸和甲硫氨酸组成。示例性的保守氨基酸取代组是:缬氨酸-亮氨酸-异亮氨酸,苯丙氨酸-酪氨酸,赖氨酸-精氨酸,丙氨酸-缬氨酸和天冬酰胺-谷氨酰胺。
多核苷酸或多肽与另一种多核苷酸或多肽具有一定的“序列同一性”百分比,这意味着当比对时,当比较两条序列时,该百分比的碱基或氨基酸相同并且在相同的相对位置。序列同一性可以以多种不同方式确定。为了确定序列同一性,可以使用各种方法和计算机程序(例如,BLAST、T-COFFEE、MUSCLE、MAFFT等)对序列进行比对,这些程序可以在包括ncbi.nlm.nili.gov/BLAST,ebi.ac.uk/Tools/msa/tcoffee/ebi.ac.uk/Tools/msa/muscle/mafft.cbrc.jp/alignment/software/在内的网站在万维网上得到。参见例如,Altschul等人(1990),J.Mol.Biol.215:403-10。
在进一步描述本发明之前,应理解,本发明不限于所描述的具体实施方案,因为其当然可以变化。还应理解,本文中使用的术语仅出于描述特定实施方案的目的,而无意于作为限制,因为本发明的范围将仅由所附权利要求书限制。
在提供值的范围的情况下,应理解,在该范围的上限和下限之间的每个中间值(除非上下文另有明确规定,至下限单位的十分之一)与该所述范围内的任何其他所述值或中间值均涵盖在本发明内。这些较小范围的上限和下限可以独立地包括在较小范围内,并且也应包括在本发明内,但要遵守所述范围内的任何明确排除的限制。在陈述的范围包括一个或两个极限值的情况下,排除那些所包括的极限值中的一个或两个的范围也包括在本发明中。
除非另有定义,否则本文中使用的所有技术和科学术语均具有与本发明所属领域的普通技术人员通常理解的相同的含义。尽管类似于或等同于本文描述的那些方法和材料的任何方法和材料也可以用于本发明的实践或测试中,但是现在描述优选的方法和材料。本文提及的所有出版物均通过引用并入本文,以公开和描述与引用出版物相关的方法和/或材料。
必须注意的是,如本文和所附权利要求书中所使用的,单数形式的“一(a)”、“一(an)”和“该(the)”可以包括复数指称,除非上下文另外明确指出。因此,例如,对“大麻素化合物”或“大麻素”的提及可以包括多种这样的化合物,对“基因修饰的宿主细胞”的提及可包括对一种或多种基因修饰的宿主细胞及本领域技术人员已知的其等同物的提及,等等。还应注意,权利要求书可以被撰写为排除任何任选的要素。因此,该陈述旨在充当与权利要求要素的叙述相关联的诸如“唯一”、“仅”等排他性术语的使用的在先基础,或“负面”限制的使用的在先基础。
应当理解,为清楚起见,在单独的实施方案的上下文中描述的本发明的某些特征也可以在单个实施方案中组合提供。相反,为简洁起见,在单个实施方案的上下文中描述的本发明的各种特征也可以单独地或以任何合适的子组合来提供。与本发明有关的实施方案的所有组合都被本发明明确地涵盖,并且在本文中公开,就如同各个和每个组合都单独且明确地被公开一样。另外,本发明还明确地涵盖了各种实施方案及其要素的所有子组合,并且在本文中公开,就如同各个和每个这样的子组合在本文中被单独且明确地公开一样。
香叶基焦磷酸:橄榄醇酸香叶基转移酶多肽和编码所述多肽的核酸
如本文所述,已经确定和表征了用于催化由GPP和橄榄醇酸产生大麻萜酚酸的新的多肽。令人惊讶地,本发明这些新的多肽可以以比之前发现的催化由GPP和橄榄醇酸产生大麻萜酚酸的大麻属多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸(参见例如,第US20120144523号美国专利申请公开文件和其中公开的GOT多肽CsPT1;在本文中为SEQ ID NO:82)。催化由GPP和橄榄醇酸产生大麻萜酚酸的本发明的新的多肽是新的香叶基焦磷酸:橄榄醇酸香叶基转移酶(GOT)多肽,即CsPT4多肽,和其截短形式。本发明的这些新的多肽可以在体内(例如,在基因修饰的宿主细胞内)和在体外(例如,无细胞)产生大麻素和大麻素衍生物。
这些新的GOT多肽,以及编码所述GOT多肽的核酸可用于本发明的方法和基因修饰的宿主细胞中,以产生大麻素或大麻素衍生物。在一些实施方案中,本发明的GOT多肽不能催化5-香叶基橄榄醇酸的产生。
CsPT4多肽在序列和活性方面与先前确定的CsPT1多肽,即GOT多肽显著不同。CsPT1多肽与CsPT4多肽仅具有57%的同源性。此外,与CsPT1多肽不同,CsPT4多肽或其截短形式的活性可以容易地在本发明的基因修饰的宿主细胞中重构,从而允许基因修饰的宿主细胞产生大麻素或大麻素衍生物。发现缺少SEQ ID NO:110所示的氨基酸序列(全长CsPT4多肽氨基酸序列)的N末端氨基酸1-76的CsPT4多肽的截短形式CsPT4t多肽容易催化由GPP和橄榄醇酸产生大麻萜酚酸,其活性类似于全长CsPT4多肽。然而,缺少N末端氨基酸1-112(SEQ ID NO:211)、1-131(SEQ ID NO:213)、1-142(SEQ ID NO:215)、1-166(SEQ ID NO:217)或1-186(SEQ ID NO:219)的CsPT4多肽的其他截短形式不能催化由GPP和橄榄醇酸形成大麻萜酚酸,表明这些截短多肽缺少催化活性所需的残基。
令人惊讶地,发现CsPT4多肽或其截短形式具有广泛的底物特异性,不仅允许产生大麻素,还允许产生大麻素衍生物。由于这种广泛的特异性,CsPT4多肽或其截短形式可以利用由TKS和OAC多肽在本文公开的基因修饰的宿主细胞中产生的橄榄醇酸或其衍生物,以提供大麻素和大麻素衍生物。供选择地,可以将橄榄醇酸或其衍生物进料给本文公开的包含CsPT4多肽或其截短形式的基因修饰的宿主细胞中,以提供大麻素和大麻素衍生物。然后可以通过CBDA或THCA合成酶多肽将大麻素和大麻素衍生物转化为其他大麻素或大麻素衍生物。
分离或纯化的编码GOT多肽的核酸
本发明的一些实施方案涉及编码GOT多肽的分离或纯化的核酸,其中所述GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。
本发明的一些实施方案涉及编码GOT多肽,即截短的CsPT4多肽(CsPT4t多肽,缺少SEQ ID NO:110所示的氨基酸序列的N末端氨基酸1-76)的分离或纯化的核酸,所述多肽包含SEQ ID NO:100所示的氨基酸序列。本发明的一些实施方案涉及编码GOT多肽,即CsPT4t多肽的分离或纯化的核酸,所述多肽包含SEQ ID NO:100所示的氨基酸序列或其保守取代的氨基酸序列。本发明的一些实施方案涉及编码GOT多肽,即CsPT4t多肽的分离或纯化的核酸,所述多肽包含与SEQ ID NO:100具有至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及编码GOT多肽,即CsPT4t多肽的分离或纯化的核酸,所述多肽包含与SEQ ID NO:100具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及编码GOT多肽,即CsPT4t多肽的分离或纯化的核酸,所述多肽包含与SEQ ID NO:100具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及编码GOT多肽,即CsPT4t多肽的分离或纯化的核酸,所述多肽包含与SEQ IDNO:100具有至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
本发明的一些实施方案涉及编码GOT多肽,即CsPT4t多肽的分离或纯化的核酸,所述多肽包含与SEQ ID NO:100具有至少65%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及编码GOT多肽,即CsPT4t多肽的分离或纯化的核酸,所述多肽包含与SEQID NO:100具有至少75%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及编码GOT多肽,即CsPT4t多肽的分离或纯化的核酸,所述多肽包含与SEQ ID NO:100具有至少85%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及编码GOT多肽,即CsPT4t多肽的分离或纯化的核酸,所述多肽包含与SEQ ID NO:100具有至少95%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及编码GOT多肽,即CsPT4t多肽的分离或纯化的核酸,所述多肽包含与SEQ ID NO:100具有至少65%的氨基酸序列同一性的氨基酸序列或其保守取代的氨基酸序列。本发明的一些实施方案涉及编码GOT多肽,即CsPT4t多肽的分离或纯化的核酸,所述多肽包含与SEQ ID NO:100具有至少75%的氨基酸序列同一性的氨基酸序列或其保守取代的氨基酸序列。本发明的一些实施方案涉及编码GOT多肽,即CsPT4t多肽的分离或纯化的核酸,所述多肽包含与SEQ ID NO:100具有至少85%的氨基酸序列同一性的氨基酸序列或其保守取代的氨基酸序列。本发明的一些实施方案涉及编码GOT多肽,即CsPT4t多肽的分离或纯化的核酸,所述多肽包含与SEQ ID NO:100具有至少95%的氨基酸序列同一性的氨基酸序列或其保守取代的氨基酸序列。
本发明的一些实施方案涉及编码全长GOT多肽,即CsPT4多肽的分离或纯化的核酸,所述多肽包含SEQ ID NO:110所示的氨基酸序列。本发明的一些实施方案涉及编码GOT多肽,即CsPT4多肽的分离或纯化的核酸,所述多肽包含SEQ ID NO:110所示的氨基酸序列或其保守取代的氨基酸序列。本发明的一些实施方案涉及编码GOT多肽,即CsPT4多肽的分离或纯化的核酸,所述多肽包含与SEQ ID NO:110具有至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及编码GOT多肽,即CsPT4多肽的分离或纯化的核酸,所述多肽包含与SEQ ID NO:110具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及编码GOT多肽,即CsPT4多肽的分离或纯化的核酸,所述多肽包含与SEQ ID NO:110具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及编码GOT多肽,即CsPT4多肽的分离或纯化的核酸,所述多肽包含与SEQID NO:110具有至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
本发明的一些实施方案涉及编码GOT多肽,即CsPT4多肽的分离或纯化的核酸,所述多肽包含与SEQ ID NO:110具有至少65%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及编码GOT多肽,即CsPT4多肽的分离或纯化的核酸,所述多肽包含与SEQID NO:110具有至少75%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及编码GOT多肽,即CsPT4多肽的分离或纯化的核酸,所述多肽包含与SEQ ID NO:110具有至少85%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及编码GOT多肽,即CsPT4多肽的分离或纯化的核酸,所述多肽包含与SEQ ID NO:110具有至少95%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及编码GOT多肽,即CsPT4多肽的分离或纯化的核酸,所述多肽包含与SEQ ID NO:110具有至少65%的氨基酸序列同一性的氨基酸序列或其保守取代的氨基酸序列。本发明的一些实施方案涉及编码GOT多肽,即CsPT4多肽的分离或纯化的核酸,所述多肽包含与SEQ ID NO:110具有至少75%的氨基酸序列同一性的氨基酸序列或其保守取代的氨基酸序列。本发明的一些实施方案涉及编码GOT多肽,即CsPT4多肽的分离或纯化的核酸,所述多肽包含与SEQ ID NO:110具有至少85%的氨基酸序列同一性的氨基酸序列或其保守取代的氨基酸序列。本发明的一些实施方案涉及编码GOT多肽,即CsPT4多肽的分离或纯化的核酸,所述多肽包含与SEQ ID NO:110具有至少95%的氨基酸序列同一性的氨基酸序列或其保守取代的氨基酸序列。
本发明的一些实施方案涉及分离或纯化的CsPT4核酸,其包含SEQ ID NO:111所示的核苷酸序列。本发明的一些实施方案涉及分离或纯化的CsPT4核酸,其包含SEQ ID NO:111所示的核苷酸序列或其密码子简并核苷酸序列。本发明的一些实施方案涉及分离或纯化的CsPT4核酸,其包含与SEQ ID NO:111具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。本发明的一些实施方案涉及分离或纯化的CsPT4核酸,其包含与SEQ ID NO:111具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。本发明的一些实施方案涉及分离或纯化的CsPT4核酸,其包含与SEQID NO:111具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
本发明的一些实施方案涉及分离或纯化的CsPT4核酸,其包含与SEQ ID NO:111具有至少85%的序列同一性的核苷酸序列。本发明的一些实施方案涉及分离或纯化的CsPT4核酸,其包含与SEQ ID NO:111具有至少95%的序列同一性的核苷酸序列。本发明的一些实施方案涉及分离或纯化的CsPT4核酸,其包含与SEQ ID NO:111具有至少85%的序列同一性的核苷酸序列或其密码子简并核苷酸序列。本发明的一些实施方案涉及分离或纯化的CsPT4核酸,其包含与SEQ ID NO:111具有至少95%的序列同一性的核苷酸序列或其密码子简并核苷酸序列。
本发明的一些实施方案涉及分离或纯化的CsPT4核酸,其包含SEQ ID NO:225所示的核苷酸序列。本发明的一些实施方案涉及分离或纯化的CsPT4核酸,其包含SEQ ID NO:225所示的核苷酸序列或其密码子简并核苷酸序列。本发明的一些实施方案涉及分离或纯化的CsPT4核酸,其包含与SEQ ID NO:225具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。本发明的一些实施方案涉及分离或纯化的CsPT4核酸,其包含与SEQ ID NO:225具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。本发明的一些实施方案涉及分离或纯化的CsPT4核酸,其包含与SEQID NO:225具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
本发明的一些实施方案涉及分离或纯化的CsPT4核酸,其包含与SEQ ID NO:225具有至少85%的序列同一性的核苷酸序列。本发明的一些实施方案涉及分离或纯化的CsPT4核酸,其包含与SEQ ID NO:225具有至少95%的序列同一性的核苷酸序列。本发明的一些实施方案涉及分离或纯化的CsPT4核酸,其包含与SEQ ID NO:225具有至少85%的序列同一性的核苷酸序列或其密码子简并核苷酸序列。本发明的一些实施方案涉及分离或纯化的CsPT4核酸,其包含与SEQ ID NO:225具有至少95%的序列同一性的核苷酸序列或其密码子简并核苷酸序列。
本发明的一些实施方案涉及分离或纯化的CsPT4t核酸,其包含SEQ ID NO:224所示的核苷酸序列。本发明的一些实施方案涉及分离或纯化的CsPT4t核酸,其包含SEQ IDNO:224所示的核苷酸序列或其密码子简并核苷酸序列。本发明的一些实施方案涉及分离或纯化的CsPT4t核酸,其包含与SEQ ID NO:224具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。本发明的一些实施方案涉及分离或纯化的CsPT4t核酸,其包含与SEQ ID NO:224具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。本发明的一些实施方案涉及分离或纯化的CsPT4t核酸,其包含与SEQ ID NO:224具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
本发明的一些实施方案涉及分离或纯化的CsPT4t核酸,其包含与SEQ ID NO:224具有至少85%的序列同一性的核苷酸序列。本发明的一些实施方案涉及分离或纯化的CsPT4t核酸,其包含与SEQ ID NO:224具有至少95%的序列同一性的核苷酸序列。本发明的一些实施方案涉及分离或纯化的CsPT4t核酸,其包含与SEQ ID NO:224具有至少85%的序列同一性的核苷酸序列或其密码子简并核苷酸序列。本发明的一些实施方案涉及分离或纯化的CsPT4t核酸,其包含与SEQ ID NO:224具有至少95%的序列同一性的核苷酸序列或其密码子简并核苷酸序列。
本发明的一些实施方案涉及分离或纯化的CsPT4t核酸,其包含SEQ ID NO:221所示的核苷酸序列。本发明的一些实施方案涉及分离或纯化的CsPT4t核酸,其包含SEQ IDNO:221所示的核苷酸序列或其密码子简并核苷酸序列。本发明的一些实施方案涉及分离或纯化的CsPT4t核酸,其包含与SEQ ID NO:221具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。本发明的一些实施方案涉及分离或纯化的CsPT4t核酸,其包含与SEQ ID NO:221具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。本发明的一些实施方案涉及分离或纯化的CsPT4t核酸,其包含与SEQ ID NO:221具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
本发明的一些实施方案涉及分离或纯化的CsPT4t核酸,其包含与SEQ ID NO:221具有至少85%的序列同一性的核苷酸序列。本发明的一些实施方案涉及分离或纯化的CsPT4t核酸,其包含与SEQ ID NO:221具有至少95%的序列同一性的核苷酸序列。本发明的一些实施方案涉及分离或纯化的CsPT4t核酸,其包含与SEQ ID NO:221具有至少85%的序列同一性的核苷酸序列或其密码子简并核苷酸序列。本发明的一些实施方案涉及分离或纯化的CsPT4t核酸,其包含与SEQ ID NO:221具有至少95%的序列同一性的核苷酸序列或其密码子简并核苷酸序列。
还包括与本文公开的核酸杂交的核酸。杂交条件可能是严格的,其中如果与编码本文公开的多肽的核酸中存在的核苷酸序列具有至少90%、95%或97%的序列同一性,则会发生杂交。严格条件可以包括用于已知的Southern杂交的条件,例如,在42℃下在具有50%甲酰胺、5×SSC(150mM NaCl,15mM柠檬酸三钠)、50mM磷酸钠(pH 7.6)、5×Denhardt溶液、10%硫酸葡聚糖和20微克/毫升变性、剪切的鲑鱼精DNA的溶液中孵育,然后在约65℃下在0.1×SSC中洗涤杂交载体。其他已知的杂交条件是众所周知的,并描述于Sambrook等人,Molecular Cloning:A Laboratory Manual,第三版,Cold Spring Harbor,N.Y.(2001)。
本文公开的核酸的长度可以取决于预期用途。例如,如果预期用途是用作引物或探针,例如用于PCR扩增或用于筛选文库,则核酸的长度将小于全长序列,例如15-50个核苷酸。在某些这样的实施方案中,引物或探针可以与核苷酸序列的高度保守区域基本相同,或者可以与核苷酸序列的5’或3’末端基本相同。在一些情况下,这些引物或探针可能在某些位置使用通用碱基,以便于“基本相同”,但仍提供序列识别的灵活性。值得注意的是,合适的引物和探针杂交条件是本领域众所周知的。还包括公开的核酸的cDNA分子。
分离或纯化的GOT多肽
本发明的一些实施方案涉及分离或纯化的GOT多肽,其中所述GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。
本发明的一些实施方案涉及分离或纯化的GOT多肽,即CsPT4t多肽,所述多肽包含SEQ ID NO:100所示的氨基酸序列。本发明的一些实施方案涉及分离或纯化的GOT多肽,即CsPT4t多肽,所述多肽包含SEQ ID NO:100所示的氨基酸序列或其保守取代的氨基酸序列。本发明的一些实施方案涉及分离或纯化的GOT多肽,即CsPT4t多肽,所述多肽包含与SEQ IDNO:100具有至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及分离或纯化的GOT多肽,即CsPT4t多肽,所述多肽包含与SEQ ID NO:100具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及分离或纯化的GOT多肽,即CsPT4t多肽,所述多肽包含与SEQID NO:100具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及分离或纯化的GOT多肽,即CsPT4t多肽,所述多肽包含与SEQ ID NO:100具有至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
本发明的一些实施方案涉及分离或纯化的GOT多肽,即CsPT4t多肽,所述多肽包含与SEQ ID NO:100具有至少65%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及分离或纯化的GOT多肽,即CsPT4t多肽,所述多肽包含与SEQ ID NO:100具有至少75%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及分离或纯化的GOT多肽,即CsPT4t多肽,所述多肽包含与SEQ ID NO:100具有至少85%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及分离或纯化的GOT多肽,即CsPT4t多肽,所述多肽包含与SEQ ID NO:100具有至少95%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及分离或纯化的GOT多肽,即CsPT4t多肽,所述多肽包含与SEQ ID NO:100具有至少65%的氨基酸序列同一性的氨基酸序列或其保守取代的氨基酸序列。本发明的一些实施方案涉及分离或纯化的GOT多肽,即CsPT4t多肽,所述多肽包含与SEQ ID NO:100具有至少75%的氨基酸序列同一性的氨基酸序列或其保守取代的氨基酸序列。本发明的一些实施方案涉及分离或纯化的GOT多肽,即CsPT4t多肽,所述多肽包含与SEQ ID NO:100具有至少85%的氨基酸序列同一性的氨基酸序列或其保守取代的氨基酸序列。本发明的一些实施方案涉及分离或纯化的GOT多肽,即CsPT4t多肽,所述多肽包含与SEQ ID NO:100具有至少95%的氨基酸序列同一性的氨基酸序列或其保守取代的氨基酸序列。
本发明的一些实施方案涉及分离或纯化的GOT多肽,即CsPT4多肽,所述多肽包含SEQ ID NO:110所示的氨基酸序列。本发明的一些实施方案涉及分离或纯化的GOT多肽,即CsPT4多肽,所述多肽包含SEQ ID NO:110所示的氨基酸序列或其保守取代的氨基酸序列。本发明的一些实施方案涉及分离或纯化的GOT多肽,即CsPT4多肽,所述多肽包含与SEQ IDNO:110具有至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及分离或纯化的GOT多肽,即CsPT4多肽,所述多肽包含与SEQ ID NO:110具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及分离或纯化的GOT多肽,即CsPT4多肽,所述多肽包含与SEQID NO:110具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及分离或纯化的GOT多肽,即CsPT4多肽,所述多肽包含与SEQ ID NO:110具有至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
本发明的一些实施方案涉及分离或纯化的GOT多肽,即CsPT4多肽,所述多肽包含与SEQ ID NO:110具有至少65%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及分离或纯化的GOT多肽,即CsPT4多肽,所述多肽包含与SEQ ID NO:110具有至少75%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及分离或纯化的GOT多肽,即CsPT4多肽,所述多肽包含与SEQ ID NO:110具有至少85%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及分离或纯化的GOT多肽,即CsPT4多肽,所述多肽包含与SEQID NO:110具有至少95%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及分离或纯化的GOT多肽,即CsPT4多肽,所述多肽包含与SEQ ID NO:110具有至少65%的氨基酸序列同一性的氨基酸序列或其保守取代的氨基酸序列。本发明的一些实施方案涉及分离或纯化的GOT多肽,即CsPT4多肽,所述多肽包含与SEQ ID NO:110具有至少75%的氨基酸序列同一性的氨基酸序列或其保守取代的氨基酸序列。本发明的一些实施方案涉及分离或纯化的GOT多肽,即CsPT4多肽,所述多肽包含与SEQ ID NO:110具有至少85%的氨基酸序列同一性的氨基酸序列或其保守取代的氨基酸序列。本发明的一些实施方案涉及分离或纯化的GOT多肽,即CsPT4多肽,所述多肽包含与SEQ ID NO:110具有至少95%的氨基酸序列同一性的氨基酸序列或其保守取代的氨基酸序列。
包含编码GOT多肽的核酸的载体
本发明的一些实施方案涉及包含一种或多种编码GOT多肽的核酸的载体,其中所述GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。
本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4t多肽的核酸的载体,所述多肽包含SEQ ID NO:100所示的氨基酸序列。本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4t多肽的核酸的载体,所述多肽包含SEQ ID NO:100所示的氨基酸序列或其保守取代的氨基酸序列。本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4t多肽的核酸的载体,所述多肽包含与SEQ ID NO:100具有至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4t多肽的核酸的载体,所述多肽包含与SEQ ID NO:100具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4t多肽的核酸的载体,所述多肽包含与SEQ ID NO:100具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4t多肽的核酸的载体,所述多肽包含与SEQ ID NO:100具有至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4t多肽的核酸的载体,所述多肽包含与SEQ ID NO:100具有至少65%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4t多肽的核酸的载体,所述多肽包含与SEQ ID NO:100具有至少75%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4t多肽的核酸的载体,所述多肽包含与SEQ ID NO:100具有至少85%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4t多肽的核酸的载体,所述多肽包含与SEQID NO:100具有至少95%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4t多肽的核酸的载体,所述多肽包含与SEQ ID NO:100具有至少65%的氨基酸序列同一性的氨基酸序列或其保守取代的氨基酸序列。本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4t多肽的核酸的载体,所述多肽包含与SEQ ID NO:100具有至少75%的氨基酸序列同一性的氨基酸序列或其保守取代的氨基酸序列。本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4t多肽的核酸的载体,所述多肽包含与SEQ ID NO:100具有至少85%的氨基酸序列同一性的氨基酸序列或其保守取代的氨基酸序列。本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4t多肽的核酸的载体,所述多肽包含与SEQ ID NO:100具有至少95%的氨基酸序列同一性的氨基酸序列或其保守取代的氨基酸序列。
本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4多肽的核酸的载体,所述多肽包含SEQ ID NO:110所示的氨基酸序列。本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4多肽的核酸的载体,所述多肽包含SEQ ID NO:110所示的氨基酸序列或其保守取代的氨基酸序列。本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4多肽的核酸的载体,所述多肽包含与SEQ ID NO:110具有至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4多肽的核酸的载体,所述多肽包含与SEQ ID NO:110具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4多肽的核酸的载体,所述多肽包含与SEQ ID NO:110具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4多肽的核酸的载体,所述多肽包含与SEQ ID NO:110具有至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4多肽的核酸的载体,所述多肽包含与SEQ ID NO:110具有至少65%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4多肽的核酸的载体,所述多肽包含与SEQ ID NO:110具有至少75%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4多肽的核酸的载体,所述多肽包含与SEQ ID NO:110具有至少85%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4多肽的核酸的载体,所述多肽包含与SEQ IDNO:110具有至少95%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4多肽的核酸的载体,所述多肽包含与SEQ ID NO:110具有至少65%的氨基酸序列同一性的氨基酸序列或其保守取代的氨基酸序列。本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4多肽的核酸的载体,所述多肽包含与SEQID NO:110具有至少75%的氨基酸序列同一性的氨基酸序列或其保守取代的氨基酸序列。本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4多肽的核酸的载体,所述多肽包含与SEQ ID NO:110具有至少85%的氨基酸序列同一性的氨基酸序列或其保守取代的氨基酸序列。本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4多肽的核酸的载体,所述多肽包含与SEQ ID NO:110具有至少95%的氨基酸序列同一性的氨基酸序列或其保守取代的氨基酸序列。
本发明的一些实施方案涉及包含CsPT4核酸的载体,所述核酸包含SEQ ID NO:111所示的核苷酸序列。本发明的一些实施方案涉及包含CsPT4核酸的载体,所述核酸包含SEQID NO:111所示的核苷酸序列或其密码子简并核苷酸序列。本发明的一些实施方案涉及包含CsPT4核酸的载体,所述核酸包含与SEQ ID NO:111具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。本发明的一些实施方案涉及包含CsPT4核酸的载体,所述核酸包含与SEQ ID NO:111具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。本发明的一些实施方案涉及包含CsPT4核酸的载体,所述核酸包含与SEQ ID NO:111具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
本发明的一些实施方案涉及包含CsPT4核酸的载体,所述核酸包含与SEQ ID NO:111具有至少85%的序列同一性的核苷酸序列。本发明的一些实施方案涉及包含CsPT4核酸的载体,所述核酸包含与SEQ ID NO:111具有至少95%的序列同一性的核苷酸序列。本发明的一些实施方案涉及包含CsPT4核酸的载体,所述核酸包含与SEQ ID NO:111具有至少85%的序列同一性的核苷酸序列或其密码子简并核苷酸序列。本发明的一些实施方案涉及包含CsPT4核酸的载体,所述核酸包含与SEQ ID NO:111具有至少95%的序列同一性的核苷酸序列或其密码子简并核苷酸序列。
本发明的一些实施方案涉及包含CsPT4核酸的载体,所述核酸包含SEQ ID NO:225所示的核苷酸序列。本发明的一些实施方案涉及包含CsPT4核酸的载体,所述核酸包含SEQID NO:225所示的核苷酸序列或其密码子简并核苷酸序列。本发明的一些实施方案涉及包含CsPT4核酸的载体,所述核酸包含与SEQ ID NO:225具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。本发明的一些实施方案涉及包含CsPT4核酸的载体,所述核酸包含与SEQ ID NO:225具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。本发明的一些实施方案涉及包含CsPT4核酸的载体,所述核酸包含与SEQ ID NO:225具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
本发明的一些实施方案涉及包含CsPT4核酸的载体,所述核酸包含与SEQ ID NO:225具有至少85%的序列同一性的核苷酸序列。本发明的一些实施方案涉及包含CsPT4核酸的载体,所述核酸包含与SEQ ID NO:225具有至少95%的序列同一性的核苷酸序列。本发明的一些实施方案涉及包含CsPT4核酸的载体,所述核酸包含与SEQ ID NO:225具有至少85%的序列同一性的核苷酸序列或其密码子简并核苷酸序列。本发明的一些实施方案涉及包含CsPT4核酸的载体,所述核酸包含与SEQ ID NO:225具有至少95%的序列同一性的核苷酸序列或其密码子简并核苷酸序列。
本发明的一些实施方案涉及包含CsPT4t核酸的载体,所述核酸包含SEQ ID NO:221所示的核苷酸序列。本发明的一些实施方案涉及包含CsPT4t核酸的载体,所述核酸包含SEQ ID NO:221所示的核苷酸序列或其密码子简并核苷酸序列。本发明的一些实施方案涉及包含CsPT4t核酸的载体,其包含与SEQ ID NO:221具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。本发明的一些实施方案涉及包含CsPT4t核酸的载体,其包含与SEQ ID NO:221具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。本发明的一些实施方案涉及包含CsPT4t核酸的载体,所述核酸包含与SEQ ID NO:221具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
本发明的一些实施方案涉及包含CsPT4t核酸的载体,所述核酸包含与SEQ ID NO:221具有至少85%的序列同一性的核苷酸序列。本发明的一些实施方案涉及包含CsPT4t核酸的载体,所述核酸包含与SEQ ID NO:221具有至少95%的序列同一性的核苷酸序列。本发明的一些实施方案涉及包含CsPT4t核酸的载体,所述核酸包含与SEQ ID NO:221具有至少85%的序列同一性的核苷酸序列或其密码子简并核苷酸序列。本发明的一些实施方案涉及包含CsPT4t核酸的载体,所述核酸包含与SEQ ID NO:221具有至少95%的序列同一性的核苷酸序列或其密码子简并核苷酸序列。
本发明的一些实施方案涉及包含CsPT4t核酸的载体,所述核酸包含SEQ ID NO:224所示的核苷酸序列。本发明的一些实施方案涉及包含CsPT4t核酸的载体,所述核酸包含SEQ ID NO:224所示的核苷酸序列或其密码子简并核苷酸序列。本发明的一些实施方案涉及包含CsPT4t核酸的载体,所述核酸包含与SEQ ID NO:224具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。本发明的一些实施方案涉及包含CsPT4t核酸的载体,所述核酸包含与SEQ ID NO:224具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。本发明的一些实施方案涉及包含CsPT4t核酸的载体,所述核酸包含与SEQ ID NO:224具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
本发明的一些实施方案涉及包含CsPT4t核酸的载体,所述核酸包含与SEQ ID NO:224具有至少85%的序列同一性的核苷酸序列。本发明的一些实施方案涉及包含CsPT4t核酸的载体,所述核酸包含与SEQ ID NO:224具有至少95%的序列同一性的核苷酸序列。本发明的一些实施方案涉及包含CsPT4t核酸的载体,所述核酸包含与SEQ ID NO:224具有至少85%的序列同一性的核苷酸序列或其密码子简并核苷酸序列。本发明的一些实施方案涉及包含CsPT4t核酸的载体,所述核酸包含与SEQ ID NO:224具有至少95%的序列同一性的核苷酸序列或其密码子简并核苷酸序列。
包含编码GOT多肽的核酸的表达构建体
本发明的一些实施方案涉及包含一种或多种编码GOT多肽的核酸的表达构建体,其中所述GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。
本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4t多肽的核酸的表达构建体,所述多肽包含SEQ ID NO:100所示的氨基酸序列。本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4t多肽的核酸的表达构建体,所述多肽包含SEQ IDNO:100所示的氨基酸序列或其保守取代的氨基酸序列。本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4t多肽的核酸的表达构建体,所述多肽包含与SEQ ID NO:100具有至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4t多肽的核酸的表达构建体,所述多肽包含与SEQ ID NO:100具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4t多肽的核酸的表达构建体,所述多肽包含与SEQ ID NO:100具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4t多肽的核酸的表达构建体,所述多肽包含与SEQ ID NO:100具有至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4t多肽的核酸的表达构建体,所述多肽包含与SEQ ID NO:100具有至少65%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4t多肽的核酸的表达构建体,所述多肽包含与SEQ ID NO:100具有至少75%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4t多肽的核酸的表达构建体,所述多肽包含与SEQ ID NO:100具有至少85%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4t多肽的核酸的表达构建体,所述多肽包含与SEQ ID NO:100具有至少95%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4t多肽的核酸的表达构建体,所述多肽包含与SEQ ID NO:100具有至少65%的氨基酸序列同一性的氨基酸序列或其保守取代的氨基酸序列。本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4t多肽的核酸的表达构建体,所述多肽包含与SEQ ID NO:100具有至少75%的氨基酸序列同一性的氨基酸序列或其保守取代的氨基酸序列。本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4t多肽的核酸的表达构建体,所述多肽包含与SEQ ID NO:100具有至少85%的氨基酸序列同一性的氨基酸序列或其保守取代的氨基酸序列。本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4t多肽的核酸的表达构建体,所述多肽包含与SEQ ID NO:100具有至少95%的氨基酸序列同一性的氨基酸序列或其保守取代的氨基酸序列。
本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4多肽的核酸的表达构建体,所述多肽包含SEQ ID NO:110所示的氨基酸序列。本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4多肽的核酸的表达构建体,所述多肽包含SEQ IDNO:110所示的氨基酸序列或其保守取代的氨基酸序列。本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4多肽的核酸的表达构建体,所述多肽包含与SEQ ID NO:110具有至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4多肽的核酸的表达构建体,所述多肽包含与SEQ ID NO:110具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4多肽的核酸的表达构建体,所述多肽包含与SEQ ID NO:110具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4多肽的核酸的表达构建体,所述多肽包含与SEQID NO:110具有至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4多肽的核酸的表达构建体,所述多肽包含与SEQ ID NO:110具有至少65%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4多肽的核酸的表达构建体,所述多肽包含与SEQ ID NO:110具有至少75%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4多肽的核酸的表达构建体,所述多肽包含与SEQ ID NO:110具有至少85%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4多肽的核酸的表达构建体,所述多肽包含与SEQ ID NO:110具有至少95%的氨基酸序列同一性的氨基酸序列。本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4多肽的核酸的表达构建体,所述多肽包含与SEQ ID NO:110具有至少65%的氨基酸序列同一性的氨基酸序列或其保守取代的氨基酸序列。本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4多肽的核酸的表达构建体,所述多肽包含与SEQ ID NO:110具有至少75%的氨基酸序列同一性的氨基酸序列或其保守取代的氨基酸序列。本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4多肽的核酸的表达构建体,所述多肽包含与SEQ ID NO:110具有至少85%的氨基酸序列同一性的氨基酸序列或其保守取代的氨基酸序列。本发明的一些实施方案涉及包含一种或多种编码GOT多肽,即CsPT4多肽的核酸的表达构建体,所述多肽包含与SEQ ID NO:110具有至少95%的氨基酸序列同一性的氨基酸序列或其保守取代的氨基酸序列。
本发明的一些实施方案涉及包含CsPT4核酸的表达构建体,所述核酸包含SEQ IDNO:111所示的核苷酸序列。本发明的一些实施方案涉及包含CsPT4核酸的表达构建体,所述核酸包含SEQ ID NO:111所示的核苷酸序列或其密码子简并核苷酸序列。本发明的一些实施方案涉及包含CsPT4核酸的表达构建体,所述核酸包含与SEQ ID NO:111具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。本发明的一些实施方案涉及包含CsPT4核酸的表达构建体,所述核酸包含与SEQ ID NO:111具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。本发明的一些实施方案涉及包含CsPT4核酸的表达构建体,所述核酸包含与SEQ ID NO:111具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
本发明的一些实施方案涉及包含CsPT4核酸的表达构建体,所述核酸包含与SEQID NO:111具有至少85%的序列同一性的核苷酸序列。本发明的一些实施方案涉及包含CsPT4核酸的表达构建体,所述核酸包含与SEQ ID NO:111具有至少95%的序列同一性的核苷酸序列。本发明的一些实施方案涉及包含CsPT4核酸的表达构建体,所述核酸包含与SEQID NO:111具有至少85%的序列同一性的核苷酸序列或其密码子简并核苷酸序列。本发明的一些实施方案涉及包含CsPT4核酸的表达构建体,所述核酸包含与SEQ ID NO:111具有至少95%的序列同一性的核苷酸序列或其密码子简并核苷酸序列。
本发明的一些实施方案涉及包含CsPT4核酸的表达构建体,所述核酸包含SEQ IDNO:225所示的核苷酸序列。本发明的一些实施方案涉及包含CsPT4核酸的表达构建体,所述核酸包含SEQ ID NO:225所示的核苷酸序列或其密码子简并核苷酸序列。本发明的一些实施方案涉及包含CsPT4核酸的表达构建体,所述核酸包含与SEQ ID NO:225具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。本发明的一些实施方案涉及包含CsPT4核酸的表达构建体,所述核酸包含与SEQ ID NO:225具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。本发明的一些实施方案涉及包含CsPT4核酸的表达构建体,所述核酸包含与SEQ ID NO:225具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
本发明的一些实施方案涉及包含CsPT4核酸的表达构建体,所述核酸包含与SEQID NO:225具有至少85%的序列同一性的核苷酸序列。本发明的一些实施方案涉及包含CsPT4核酸的表达构建体,所述核酸包含与SEQ ID NO:225具有至少95%的序列同一性的核苷酸序列。本发明的一些实施方案涉及包含CsPT4核酸的表达构建体,所述核酸包含与SEQID NO:225具有至少85%的序列同一性的核苷酸序列或其密码子简并核苷酸序列。本发明的一些实施方案涉及包含CsPT4核酸的表达构建体,所述核酸包含与SEQ ID NO:225具有至少95%的序列同一性的核苷酸序列或其密码子简并核苷酸序列。
本发明的一些实施方案涉及包含CsPT4t核酸的表达构建体,所述核酸包含SEQ IDNO:221所示的核苷酸序列。本发明的一些实施方案涉及包含CsPT4t核酸的表达构建体,所述核酸包含SEQ ID NO:221所示的核苷酸序列或其密码子简并核苷酸序列。本发明的一些实施方案涉及包含CsPT4t核酸的表达构建体,所述核酸包含与SEQ ID NO:221具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。本发明的一些实施方案涉及包含CsPT4t核酸的表达构建体,所述核酸包含与SEQ ID NO:221具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。本发明的一些实施方案涉及包含CsPT4t核酸的表达构建体,所述核酸包含与SEQ ID NO:221具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
本发明的一些实施方案涉及包含CsPT4t核酸的表达构建体,所述核酸包含与SEQID NO:221具有至少85%的序列同一性的核苷酸序列。本发明的一些实施方案涉及包含CsPT4t核酸的表达构建体,所述核酸包含与SEQ ID NO:221具有至少95%的序列同一性的核苷酸序列。本发明的一些实施方案涉及包含CsPT4t核酸的表达构建体,所述核酸包含与SEQ ID NO:221具有至少85%的序列同一性的核苷酸序列或其密码子简并核苷酸序列。本发明的一些实施方案涉及包含CsPT4t核酸的表达构建体,所述核酸包含与SEQ ID NO:221具有至少95%的序列同一性的核苷酸序列或其密码子简并核苷酸序列。
本发明的一些实施方案涉及包含CsPT4t核酸的表达构建体,所述核酸包含SEQ IDNO:224所示的核苷酸序列。本发明的一些实施方案涉及包含CsPT4t核酸的表达构建体,所述核酸包含SEQ ID NO:224所示的核苷酸序列或其密码子简并核苷酸序列。本发明的一些实施方案涉及包含CsPT4t核酸的表达构建体,所述核酸包含与SEQ ID NO:224具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。本发明的一些实施方案涉及包含CsPT4t核酸的表达构建体,所述核酸包含与SEQ ID NO:224具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。本发明的一些实施方案涉及包含CsPT4t核酸的表达构建体,所述核酸包含与SEQ ID NO:224具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
本发明的一些实施方案涉及包含CsPT4t核酸的表达构建体,所述核酸包含与SEQID NO:224具有至少85%的序列同一性的核苷酸序列。本发明的一些实施方案涉及包含CsPT4t核酸的表达构建体,所述核酸包含与SEQ ID NO:224具有至少95%的序列同一性的核苷酸序列。本发明的一些实施方案涉及包含CsPT4t核酸的表达构建体,所述核酸包含与SEQ ID NO:224具有至少85%的序列同一性的核苷酸序列或其密码子简并核苷酸序列。本发明的一些实施方案涉及包含CsPT4t核酸的表达构建体,所述核酸包含与SEQ ID NO:224具有至少95%的序列同一性的核苷酸序列或其密码子简并核苷酸序列。
用于产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物的多肽、核酸和基因修饰的宿主细胞
本发明提供了用于产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物的基因修饰的宿主细胞。本发明的基因修饰的宿主细胞可以用编码一种或多种本文公开的多肽的一种或多种本文公开的异源核酸基因修饰。在合适的培养基中培养基因修饰的宿主细胞提供了大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物以可回收的量的合成。在一些实施方案中,本发明的基因修饰的宿主细胞产生大麻素或大麻素衍生物。
本发明还提供了核酸,其可以被引入微生物(例如,基因修饰的宿主细胞)中,导致一种或多种多肽的表达或过表达,所述多肽随后可以在体外(例如,无细胞)或体内被利用以产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。在某些这样的实施方案中,产生了大麻素或大麻素衍生物。
本文公开了一种或多种可以用于产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物的多肽,其可以包括但不限于:一种或多种具有在大麻素生物合成途径中存在的多肽的至少一种活性的多肽,所述在大麻素生物合成途径中存在的多肽例如GOT多肽、CBDA或THCA合成酶多肽、TKS多肽和OAC多肽;一种或多种具有在甲羟戊酸(MEV)途径中存在的多肽的至少一种活性的多肽;产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽(例如,酰基活化酶多肽、脂肪酰辅酶A合成酶多肽或脂肪酰辅酶A连接酶多肽);产生GPP的多肽;产生丙二酰辅酶A的多肽;使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽,和丙酮酸脱氢酶复合物多肽。另外,可用于产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物的多肽可以是一种或多种具有在DXP途径中而不是在MEV途径中存在的多肽的至少一种活性的多肽。
可用于产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物的多肽还可以包括己酰辅酶A合成酶(HCS)多肽或一种或多种作为产生己酰辅酶A的生物合成途径的部分的多肽,包括但不限于:MCT1多肽、PaaH1多肽、Crt多肽、Ter多肽和BktB多肽;MCT1多肽、PhaB多肽、PhaJ多肽、Ter多肽和BktB多肽;短链脂肪酰辅酶A硫酯酶(SCFA-TE)多肽;或脂肪酸合成酶(FAS)多肽。己酰辅酶A衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物也可以通过这样的途径和多肽形成。
可以用于产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物的多肽还可以包括调节NADH或NADPH氧化还原平衡的多肽、产生橙花基焦磷酸的多肽和NphB多肽。
本发明还提供了编码所述多肽的核酸,其可以用于产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。本发明还提供了包含所述核酸和多肽中的一种或多种的基因修饰的宿主细胞,其可以用于产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。
香叶基焦磷酸:橄榄醇酸香叶基转移酶(GOT)多肽、核酸和表达所述多肽的基因修 饰的宿主细胞
在一些实施方案中,用一种或多种编码香叶基焦磷酸:橄榄醇酸香叶基转移酶(GOT)多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。
本文公开的示例性GOT多肽可以包括全长GOT多肽、GOT多肽的片段、GOT多肽的变体、截短的GOT多肽或具有GOT多肽的至少一种活性的融合多肽。在一些实施方案中,GOT多肽具有芳族异戊烯基转移酶(PT)活性。在一些实施方案中,GOT多肽修饰大麻素前体或大麻素前体衍生物。在某些这样的实施方案中,GOT多肽修饰橄榄醇酸或橄榄醇酸衍生物。在一些实施方案中,GOT多肽不能催化5-香叶基橄榄醇酸的产生。
在一些实施方案中,用一种或多种编码GOT多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞,其中所述GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在一些实施方案中,用一种或多种编码GOT多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞,其中所述GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少200-500倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在一些实施方案中,用一种或多种编码GOT多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞,其中所述GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少10、至少20、至少30、至少40、至少50、至少60、至少70、至少80、至少90、至少100、至少200、至少300、至少400或至少500倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在一些实施方案中,用一种或多种编码GOT多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞,其中所述GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少10-50、至少50-100、至少100-200、至少100-300、至少100-400、至少200-400、至少100-500、至少200-500或至少300-500倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。
在一些实施方案中,由一种或多种异源核酸编码的GOT多肽包含SEQ ID NO:100或SEQ ID NO:110所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽包含SEQ ID NO:100或SEQ ID NO:110所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽包含与SEQ ID NO:100或SEQ IDNO:110具有至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的GOT多肽包含SEQ ID NO:12、SEQ ID NO:82、SEQ ID NO:98、SEQ ID NO:99或SEQ ID NO:223所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽包含SEQ ID NO:12、SEQ ID NO:82、SEQID NO:98、SEQ ID NO:99或SEQ ID NO:223所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽包含与SEQ ID NO:12、SEQ IDNO:82、SEQ ID NO:98、SEQ ID NO:99或SEQ ID NO:223具有至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的GOT多肽包含SEQ ID NO:13、SEQ ID NO:101、SEQ ID NO:102或SEQ ID NO:103所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽包含SEQ ID NO:13、SEQ ID NO:101、SEQ ID NO:102或SEQ ID NO:103所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽包含与SEQ ID NO:13、SEQ ID NO:101、SEQ ID NO:102或SEQ ID NO:103具有至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的GOT多肽包含SEQ ID NO:211、SEQ ID NO:213、SEQ ID NO:215、SEQ ID NO:217或SEQ ID NO:219所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽包含SEQ ID NO:211、SEQ ID NO:213、SEQ ID NO:215、SEQ ID NO:217或SEQ ID NO:219所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽包含与SEQ ID NO:211、SEQ ID NO:213、SEQ ID NO:215、SEQ ID NO:217或SEQ ID NO:219具有至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的GOT多肽包含SEQ ID NO:12所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽包含SEQ IDNO:12所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽包含与SEQ ID NO:12具有至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽包含与SEQ ID NO:12具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽包含与SEQID NO:12具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的GOT多肽包含SEQ ID NO:13所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽包含SEQ IDNO:13所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽包含与SEQ ID NO:13具有至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽包含与SEQ ID NO:13具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽包含与SEQID NO:13具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT1多肽,并且包含SEQ ID NO:82所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT1多肽,并且包含SEQ ID NO:82所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT1多肽,并且包含与SEQID NO:82具有至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT1多肽,并且包含与SEQ ID NO:82具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT1多肽,并且包含与SEQ ID NO:82具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是截短的CsPT1(CsPT1_t75)多肽,并且包含SEQ ID NO:223所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT1_t75多肽,并且包含SEQ ID NO:223所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT1_t75多肽,并且包含与SEQ ID NO:223具有至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT1_t75多肽,并且包含与SEQ ID NO:223具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT1_t75多肽,并且包含与SEQ ID NO:223具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsGOTt75多肽,并且包含SEQ ID NO:98所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsGOTt75多肽,并且包含SEQ ID NO:98所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsGOTt75多肽,并且包含与SEQ ID NO:98具有至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsGOTt75多肽,并且包含与SEQ ID NO:98具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsGOTt75多肽,并且包含与SEQ ID NO:98具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsGOTt33多肽,并且包含SEQ ID NO:99所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsGOTt33多肽,并且包含SEQ ID NO:99所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsGOTt33多肽,并且包含与SEQ ID NO:99具有至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsGOTt33多肽,并且包含与SEQ ID NO:99具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsGOTt33多肽,并且包含与SEQ ID NO:99具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT4t多肽,并且包含SEQ ID NO:100所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT4t多肽,并且包含SEQ ID NO:100所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT4t多肽,并且包含与SEQ ID NO:100具有至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT4t多肽,并且包含与SEQID NO:100具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT4t多肽,并且包含与SEQ ID NO:100具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT4t多肽,并且包含与SEQ ID NO:100具有至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT4t多肽,并且包含与SEQ ID NO:100具有至少65%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT4t多肽,并且包含与SEQ ID NO:100具有至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT4t多肽,并且包含与SEQ ID NO:100具有至少85%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT4t多肽,并且包含与SEQ ID NO:100具有至少95%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT4t多肽,并且包含与SEQ ID NO:100具有至少65%的氨基酸序列同一性的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT4t多肽,并且包含与SEQ ID NO:100具有至少75%的氨基酸序列同一性的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT4t多肽,并且包含与SEQ ID NO:100具有至少85%的氨基酸序列同一性的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT4t多肽,并且包含与SEQ ID NO:100具有至少95%的氨基酸序列同一性的氨基酸序列或其保守取代的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT7t多肽,并且包含SEQ ID NO:101所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT7t多肽,并且包含SEQ ID NO:101所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT7t多肽,并且包含与SEQ ID NO:101具有至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT7t多肽,并且包含与SEQID NO:101具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT7t多肽,并且包含与SEQ ID NO:101具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是H1PT1Lt多肽,并且包含SEQ ID NO:102所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是H1PT1Lt多肽,并且包含SEQ ID NO:102所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是H1PT1Lt多肽,并且包含与SEQ ID NO:102具有至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是H1PT1Lt多肽,并且包含与SEQ ID NO:102具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是H1PT1Lt多肽,并且包含与SEQ ID NO:102具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是H1PT2Lt多肽,并且包含SEQ ID NO:103所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是H1PT2Lt多肽,并且包含SEQ ID NO:103所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是H1PT2Lt多肽,并且包含与SEQ ID NO:103具有至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是H1PT2Lt多肽,并且包含与SEQ ID NO:103具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是H1PT2Lt多肽,并且包含与SEQ ID NO:103具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT4多肽,并且包含SEQ ID NO:110所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT4多肽,并且包含SEQ ID NO:110所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT4多肽,并且包含与SEQ ID NO:110具有至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT4多肽,并且包含与SEQ IDNO:110具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT4多肽,并且包含与SEQ ID NO:110具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT4多肽,并且包含与SEQ ID NO:110具有至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT4多肽,并且包含与SEQ ID NO:110具有至少65%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT4多肽,并且包含与SEQ ID NO:110具有至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT4多肽,并且包含与SEQ ID NO:110具有至少85%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT4多肽,并且包含与SEQ ID NO:110具有至少95%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT4多肽,并且包含与SEQ ID NO:110具有至少65%的氨基酸序列同一性的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT4多肽,并且包含与SEQ ID NO:110具有至少75%的氨基酸序列同一性的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT4多肽,并且包含与SEQ ID NO:110具有至少85%的氨基酸序列同一性的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT4多肽,并且包含与SEQ ID NO:110具有至少95%的氨基酸序列同一性的氨基酸序列或其保守取代的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是截短的CsPT4(CsPT4_t112)多肽,并且包含SEQ ID NO:211所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT4_t112多肽,并且包含SEQ ID NO:211所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT4_t112多肽,并且包含与SEQ ID NO:211具有至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT4_t112多肽,并且包含与SEQ ID NO:211具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT4_t112多肽,并且包含与SEQ ID NO:211具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是截短的CsPT4(CsPT4_t131)多肽,并且包含SEQ ID NO:213所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT4_t131多肽,并且包含SEQ ID NO:213所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT4_t131多肽,并且包含与SEQ ID NO:213具有至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT4_t131多肽,并且包含与SEQ ID NO:213具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT4_t131多肽,并且包含与SEQ ID NO:213具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是截短的CsPT4(CsPT4_t142)多肽,并且包含SEQ ID NO:215所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT4_t142多肽,并且包含SEQ ID NO:215所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT4_t142多肽,并且包含与SEQ ID NO:215具有至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT4_t142多肽,并且包含与SEQ ID NO:215具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT4_t142多肽,并且包含与SEQ ID NO:215具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是截短的CsPT4(CsPT4_t166)多肽,并且包含SEQ ID NO:217所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT4_t166多肽,并且包含SEQ ID NO:217所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT4_t166多肽,并且包含与SEQ ID NO:217具有至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT4_t166多肽,并且包含与SEQ ID NO:217具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT4_t166多肽,并且包含与SEQ ID NO:217具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是截短的CsPT4(CsPT4_t186)多肽,并且包含SEQ ID NO:219所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT4_t186多肽,并且包含SEQ ID NO:219所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT4_t186多肽,并且包含与SEQ ID NO:219具有至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT4_t186多肽,并且包含与SEQ ID NO:219具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽是CsPT4_t186多肽,并且包含与SEQ ID NO:219具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
本文公开的示例性GOT异源核酸可以包括编码GOT多肽的核酸,所述GOT多肽例如全长GOT多肽、GOT多肽的片段、GOT多肽的变体、截短的GOT多肽或具有GOT多肽的至少一种活性的融合多肽。
在一些实施方案中,GOT多肽在基因修饰的宿主细胞中过表达。过表达可以通过增加编码GOT多肽的异源核酸的拷贝数,例如,通过使用高拷贝数表达载体(例如,以每个细胞10-40个拷贝存在的质粒)来实现和/或通过将编码GOT多肽的异源核酸可操作地连接到强启动子来实现。在一些实施方案中,基因修饰的宿主细胞具有一个拷贝的编码GOT多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有两个拷贝的编码GOT多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有三个拷贝的编码GOT多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有四个拷贝的编码GOT多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有五个拷贝的编码GOT多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有四个拷贝的编码GOT多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有六个拷贝的编码GOT多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有四个拷贝的编码GOT多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有七个拷贝的编码GOT多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有四个拷贝的编码GOT多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有八个拷贝的编码GOT多肽的异源核酸。
在一些实施方案中,一种或多种编码GOT多肽的异源核酸包含编码GOT多肽的核苷酸序列,其中所述GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。
在一些实施方案中,一种或多种编码GOT多肽的异源核酸包含SEQ ID NO:111、SEQID NO:221、SEQ ID NO:224或SEQ ID NO:225所示的核苷酸序列。在一些实施方案中,一种或多种编码GOT多肽的异源核酸包含SEQ ID NO:111、SEQ ID NO:221、SEQ ID NO:224或SEQID NO:225所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码GOT多肽的异源核酸包含与SEQ ID NO:111、SEQ ID NO:221、SEQ ID NO:224或SEQ IDNO:225具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码GOT多肽的异源核酸包含SEQ ID NO:220或SEQ ID NO:222所示的核苷酸序列。在一些实施方案中,一种或多种编码GOT多肽的异源核酸包含SEQ ID NO:220或SEQ ID NO:222所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码GOT多肽的异源核酸包含与SEQ ID NO:220或SEQ ID NO:222具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码GOT多肽的异源核酸包含SEQ ID NO:210、SEQID NO:212、SEQ ID NO:214、SEQ ID NO:216或SEQ ID NO:218所示的核苷酸序列。在一些实施方案中,一种或多种编码GOT多肽的异源核酸包含SEQ ID NO:210、SEQ ID NO:212、SEQID NO:214、SEQ ID NO:216或SEQ ID NO:218所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码GOT多肽的异源核酸包含与SEQ ID NO:210、SEQ IDNO:212、SEQ ID NO:214、SEQ ID NO:216或SEQ ID NO:218具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码CsPT4多肽的异源核酸包含SEQ ID NO:111所示的核苷酸序列。在一些实施方案中,一种或多种编码CsPT4多肽的异源核酸包含SEQ IDNO:111所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码CsPT4多肽的异源核酸包含与SEQ ID NO:111具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码CsPT4多肽的异源核酸包含与SEQ ID NO:111具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码CsPT4多肽的异源核酸包含与SEQ ID NO:111具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码CsPT4多肽的异源核酸包含与SEQ ID NO:111具有至少85%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码CsPT4多肽的异源核酸包含与SEQ ID NO:111具有至少95%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码CsPT4多肽的异源核酸包含与SEQ ID NO:111具有至少85%的序列同一性的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码CsPT4多肽的异源核酸包含与SEQ ID NO:111具有至少95%的序列同一性的核苷酸序列或其密码子简并核苷酸序列。
在一些实施方案中,一种或多种编码CsPT4多肽的异源核酸包含SEQ ID NO:225所示的核苷酸序列。在一些实施方案中,一种或多种编码CsPT4多肽的异源核酸包含SEQ IDNO:225所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码CsPT4多肽的异源核酸包含与SEQ ID NO:225具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码CsPT4多肽的异源核酸包含与SEQ ID NO:225具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码CsPT4多肽的异源核酸包含与SEQ ID NO:225具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码CsPT4多肽的异源核酸包含与SEQ ID NO:225具有至少85%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码CsPT4多肽的异源核酸包含与SEQ ID NO:225具有至少95%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码CsPT4多肽的异源核酸包含与SEQ ID NO:225具有至少85%的序列同一性的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码CsPT4多肽的异源核酸包含与SEQ ID NO:225具有至少95%的序列同一性的核苷酸序列或其密码子简并核苷酸序列。
在一些实施方案中,一种或多种编码CsPT4t多肽的异源核酸包含SEQ ID NO:221所示的核苷酸序列。在一些实施方案中,一种或多种编码CsPT4t多肽的异源核酸包含SEQID NO:221所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码CsPT4t多肽的异源核酸包含与SEQ ID NO:221具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码CsPT4t多肽的异源核酸包含与SEQ ID NO:221具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码CsPT4t多肽的异源核酸包含与SEQ ID NO:221具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码CsPT4t多肽的异源核酸包含与SEQ ID NO:221具有至少85%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码CsPT4t多肽的异源核酸包含与SEQ ID NO:221具有至少95%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码CsPT4t多肽的异源核酸包含与SEQ ID NO:221具有至少85%的序列同一性的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码CsPT4t多肽的异源核酸包含与SEQ ID NO:221具有至少95%的序列同一性的核苷酸序列或其密码子简并核苷酸序列。
在一些实施方案中,一种或多种编码CsPT4t多肽的异源核酸包含SEQ ID NO:224所示的核苷酸序列。在一些实施方案中,一种或多种编码CsPT4t多肽的异源核酸包含SEQID NO:224所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码CsPT4t多肽的异源核酸包含与SEQ ID NO:224具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码CsPT4t多肽的异源核酸包含与SEQ ID NO:224具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码CsPT4t多肽的异源核酸包含与SEQ ID NO:224具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码CsPT4t多肽的异源核酸包含与SEQ ID NO:224具有至少85%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码CsPT4t多肽的异源核酸包含与SEQ ID NO:224具有至少95%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码CsPT4t多肽的异源核酸包含与SEQ ID NO:224具有至少85%的序列同一性的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码CsPT4t多肽的异源核酸包含与SEQ ID NO:224具有至少95%的序列同一性的核苷酸序列或其密码子简并核苷酸序列。
在一些实施方案中,一种或多种编码CsPT4_t112多肽的异源核酸包含SEQ ID NO:210所示的核苷酸序列。在一些实施方案中,一种或多种编码CsPT4_t112多肽的异源核酸包含SEQ ID NO:210所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码CsPT4_t112多肽的异源核酸包含与SEQ ID NO:210具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码CsPT4_t112多肽的异源核酸包含与SEQ ID NO:210具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码CsPT4_t112多肽的异源核酸包含与SEQ ID NO:210具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码CsPT4_t131多肽的异源核酸包含SEQ ID NO:212所示的核苷酸序列。在一些实施方案中,一种或多种编码CsPT4_t131多肽的异源核酸包含SEQ ID NO:212所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码CsPT4_t131多肽的异源核酸包含与SEQ ID NO:212具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码CsPT4_t131多肽的异源核酸包含与SEQ ID NO:212具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码CsPT4_t131多肽的异源核酸包含与SEQ ID NO:212具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码CsPT4_t142多肽的异源核酸包含SEQ ID NO:214所示的核苷酸序列。在一些实施方案中,一种或多种编码CsPT4_t142多肽的异源核酸包含SEQ ID NO:214所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码CsPT4_t142多肽的异源核酸包含与SEQ ID NO:214具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码CsPT4_t142多肽的异源核酸包含与SEQ ID NO:214具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码CsPT4_t142多肽的异源核酸包含与SEQ ID NO:214具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码CsPT4_t166多肽的异源核酸包含SEQ ID NO:216所示的核苷酸序列。在一些实施方案中,一种或多种编码CsPT4_t166多肽的异源核酸包含SEQ ID NO:216所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码CsPT4_t166多肽的异源核酸包含与SEQ ID NO:216具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码CsPT4_t166多肽的异源核酸包含与SEQ ID NO:216具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码CsPT4_t166多肽的异源核酸包含与SEQ ID NO:216具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码CsPT4_t186多肽的异源核酸包含SEQ ID NO:218所示的核苷酸序列。在一些实施方案中,一种或多种编码CsPT4_t186多肽的异源核酸包含SEQ ID NO:218所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码CsPT4_t186多肽的异源核酸包含与SEQ ID NO:218具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码CsPT4_t186多肽的异源核酸包含与SEQ ID NO:218具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码CsPT4_t186多肽的异源核酸包含与SEQ ID NO:218具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码CsPT1多肽的异源核酸包含SEQ ID NO:220所示的核苷酸序列。在一些实施方案中,一种或多种编码CsPT1多肽的异源核酸包含SEQ IDNO:220所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码CsPT1多肽的异源核酸包含与SEQ ID NO:220具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码CsPT1多肽的异源核酸包含与SEQ ID NO:220具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码CsPT1多肽的异源核酸包含与SEQ ID NO:220具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码CsPT1_t75多肽的异源核酸包含SEQ ID NO:222所示的核苷酸序列。在一些实施方案中,一种或多种编码CsPT1_t75多肽的异源核酸包含SEQ ID NO:222所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码CsPT1_t75多肽的异源核酸包含与SEQ ID NO:222具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码CsPT1_t75多肽的异源核酸包含与SEQ ID NO:222具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码CsPT1_t75多肽的异源核酸包含与SEQ ID NO:222具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
大麻素合成酶多肽、包含所述多肽的核酸和表达所述多肽的基因修饰的宿主细胞
在一些实施方案中,用一种或多种编码大麻素合成酶多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。
在一些实施方案中,用一种或多种编码多于一种大麻素合成酶多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码多于两种大麻素合成酶多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码多于三种大麻素合成酶多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码两种大麻素合成酶多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码三种大麻素合成酶多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码1、2、3或更多种大麻素合成酶多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码1、2或3种大麻素合成酶多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。
在一些实施方案中,大麻素合成酶多肽是四氢大麻酚酸合成酶(THCAS)多肽。THCAS多肽可以催化大麻萜酚酸转化为THCA。本文公开的示例性THCAS多肽可以包含THCAS多肽的片段、全长THCAS多肽、THCAS多肽的变体、截短的THCAS多肽或具有THCAS多肽的至少一种活性的融合多肽。
在一些实施方案中,用一种或多种编码THCAS多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码多于一种THCAS多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码多于两种THCAS多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码多于三种THCAS多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码两种THCAS多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码三种THCAS多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码1、2、3或更多种THCAS多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码1、2或3种THCAS多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。
在一些实施方案中,由一种或多种异源核酸编码的THCAS多肽包含SEQ ID NO:14、SEQ ID NO:86、SEQ ID NO:104、SEQ ID NO:153或SEQ ID NO:155所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的THCAS多肽包含SEQ ID NO:14、SEQ ID NO:86、SEQ ID NO:104、SEQ ID NO:153或SEQ ID NO:155所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的THCAS多肽包含与SEQ ID NO:14、SEQ ID NO:86、SEQ ID NO:104、SEQ ID NO:153或SEQ ID NO:155具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的THCAS多肽包含SEQ ID NO:14所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的THCAS多肽包含SEQID NO:14所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的THCAS多肽包含与SEQ ID NO:14具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的THCAS多肽包含与SEQ ID NO:14具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的THCAS多肽包含与SEQ ID NO:14具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的THCAS多肽包含SEQ ID NO:86所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的THCAS多肽包含SEQID NO:86所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的THCAS多肽包含与SEQ ID NO:86具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的THCAS多肽包含与SEQ ID NO:86具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的THCAS多肽包含与SEQ ID NO:86具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的THCAS多肽包含SEQ ID NO:155所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的THCAS多肽包含SEQID NO:155所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的THCAS多肽包含与SEQ ID NO:155具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的THCAS多肽包含与SEQ ID NO:155具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的THCAS多肽包含与SEQ ID NO:155具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,THCAS多肽可以包括具有N末端截短的修饰的THCAS多肽,以去除分泌肽并定位到细胞质。例如,在一些实施方案中,THCAS多肽缺少SEQ ID NO:14所示的氨基酸序列的N末端氨基酸1-28或另一种THCAS多肽的相应信号肽。
在一些实施方案中,由一种或多种异源核酸编码的THCAS多肽包含SEQ ID NO:15所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的THCAS多肽包含SEQID NO:15所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的THCAS多肽包含与SEQ ID NO:15具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的THCAS多肽包含与SEQ ID NO:15具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的THCAS多肽包含与SEQ ID NO:15具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的THCAS多肽包含SEQ ID NO:104所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的THCAS多肽包含SEQID NO:104所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的THCAS多肽包含与SEQ ID NO:104具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的THCAS多肽包含与SEQ ID NO:104具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的THCAS多肽包含与SEQ ID NO:104具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的THCAS多肽包含SEQ ID NO:153所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的THCAS多肽包含SEQID NO:153所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的THCAS多肽包含与SEQ ID NO:153具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的THCAS多肽包含与SEQ ID NO:153具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的THCAS多肽包含与SEQ ID NO:153具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
本文公开的示例性THCAS异源核酸可以包括编码THCAS多肽的核酸,所述THCAS多肽例如THCAS多肽的片段、THCAS多肽的变体、全长THCAS多肽、截短的THCAS多肽或具有THCAS多肽的至少一种活性的融合多肽。
在一些实施方案中,THCAS多肽在基因修饰的宿主细胞中过表达。过表达可以通过增加编码THCAS多肽的异源核酸的拷贝数,例如,通过使用高拷贝数表达载体(例如,以每个细胞10-40个拷贝存在的质粒)来实现和/或通过将编码THCAS多肽的异源核酸可操作地连接到强启动子来实现。在一些实施方案中,基因修饰的宿主细胞具有一个拷贝的编码THCAS多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有两个拷贝的编码THCAS多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有三个拷贝的编码THCAS多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有四个拷贝的编码THCAS多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有五个拷贝的编码THCAS多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有六个拷贝的编码THCAS多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有七个拷贝的编码THCAS多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有八个拷贝的编码THCAS多肽的异源核酸。
在一些实施方案中,一种或多种编码THCAS多肽的异源核酸包含SEQ ID NO:85、SEQ ID NO:154或SEQ ID NO:156所示的核苷酸序列。在一些实施方案中,一种或多种编码THCAS多肽的异源核酸包含SEQ ID NO:85、SEQ ID NO:154或SEQ ID NO:156所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码THCAS多肽的异源核酸包含与SEQ ID NO:85、SEQ ID NO:154或SEQ ID NO:156具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码THCAS多肽的异源核酸包含SEQ ID NO:85所示的核苷酸序列。在一些实施方案中,一种或多种编码THCAS多肽的异源核酸包含SEQ IDNO:85所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码THCAS多肽的异源核酸包含与SEQ ID NO:85具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码THCAS多肽的异源核酸包含与SEQ ID NO:85具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码THCAS多肽的异源核酸包含SEQ ID NO:154所示的核苷酸序列。在一些实施方案中,一种或多种编码THCAS多肽的异源核酸包含SEQ IDNO:154所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码THCAS多肽的异源核酸包含与SEQ ID NO:154具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码THCAS多肽的异源核酸包含与SEQ ID NO:154具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码THCAS多肽的异源核酸包含SEQ ID NO:156所示的核苷酸序列。在一些实施方案中,一种或多种编码THCAS多肽的异源核酸包含SEQ IDNO:156所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码THCAS多肽的异源核酸包含与SEQ ID NO:156具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码THCAS多肽的异源核酸包含与SEQ ID NO:156具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,大麻素合成酶多肽是大麻二酚酸合成酶(CBDAS)多肽。CBDAS多肽可以催化大麻萜酚酸转化为大麻二酚酸(CBDA)。本文公开的示例性CBDAS多肽可以包括全长CBDAS多肽、CBDAS多肽的片段、CBDAS多肽的变体、截短的CBDAS多肽或具有CBDAS多肽的至少一种活性的融合多肽。
在一些实施方案中,用一种或多种编码CBDAS多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码多于一种CBDAS多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码多于两种CBDAS多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码多于三种CBDAS多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码两种CBDAS多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码三种CBDAS多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码1、2、3或更多种CBDAS多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码1、2或3种CDBAS多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。
在一些实施方案中,由一种或多种异源核酸编码的CBDAS多肽包含SEQ ID NO:88或SEQ ID NO:151所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的CBDAS多肽包含SEQ ID NO:88或SEQ ID NO:151所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的CBDAS多肽包含与SEQ ID NO:88或SEQ ID NO:151具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的CBDAS多肽包含SEQ ID NO:88所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的CBDAS多肽包含SEQID NO:88所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的CBDAS多肽包含与SEQ ID NO:88具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的CBDAS多肽包含与SEQ ID NO:88具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的CBDAS多肽包含与SEQ ID NO:88具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,CBDAS多肽可以包括具有N末端截短的修饰的CBDAS多肽,以去除分泌肽并定位到细胞质。例如,在一些实施方案中,CBDAS多肽缺少SEQ ID NO:88所示的氨基酸序列的N末端氨基酸1-28或另一种CBDAS多肽的相应信号肽。
在一些实施方案中,由一种或多种异源核酸编码的CBDAS多肽包含SEQ ID NO:16所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的CBDAS多肽包含SEQID NO:16所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的CBDAS多肽包含与SEQ ID NO:16具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的CBDAS多肽包含与SEQ ID NO:16具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的CBDAS多肽包含与SEQ ID NO:16具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的CBDAS多肽包含SEQ ID NO:105所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的CBDAS多肽包含SEQID NO:105所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的CBDAS多肽包含与SEQ ID NO:105具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的CBDAS多肽包含与SEQ ID NO:105具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的CBDAS多肽包含与SEQ ID NO:105具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的CBDAS多肽包含SEQ ID NO:151所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的CBDAS多肽包含SEQID NO:151所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的CBDAS多肽包含与SEQ ID NO:151具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的CBDAS多肽包含与SEQ ID NO:151具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的CBDAS多肽包含与SEQ ID NO:151具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
本文公开的示例性CBDAS异源核酸可以包括编码CBDAS多肽的核酸,所述CBDAS多肽例如全长CBDAS多肽、CBDAS多肽的片段、CBDAS多肽的变体、截短的CBDAS多肽或具有CBDAS多肽的至少一种活性的融合多肽。
在一些实施方案中,CBDAS多肽在基因修饰的宿主细胞中过表达。过表达可以通过增加编码CBDAS多肽的异源核酸的拷贝数,例如,通过使用高拷贝数表达载体(例如,以每个细胞10-40个拷贝存在的质粒)来实现和/或通过将编码CBDAS多肽的异源核酸可操作地连接到强启动子来实现。在一些实施方案中,基因修饰的宿主细胞具有一个拷贝的编码CBDAS多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有两个拷贝的编码CBDAS多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有三个拷贝的编码CBDAS多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有四个拷贝的编码CBDAS多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有五个拷贝的编码CBDAS多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有六个拷贝的编码CBDAS多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有七个拷贝的编码CBDAS多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有八个拷贝的编码CBDAS多肽的异源核酸。
在一些实施方案中,一种或多种编码CBDAS多肽的异源核酸包含SEQ ID NO:152或SEQ ID NO:167所示的核苷酸序列。在一些实施方案中,一种或多种编码CBDAS多肽的异源核酸包含SEQ ID NO:152或SEQ ID NO:167所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码CBDAS多肽的异源核酸包含与SEQ ID NO:152或SEQ IDNO:167具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码CBDAS多肽的异源核酸包含SEQ ID NO:87所示的核苷酸序列。在一些实施方案中,一种或多种编码CBDAS多肽的异源核酸包含SEQ IDNO:87所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码CBDAS多肽的异源核酸包含与SEQ ID NO:87具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码CBDAS多肽的异源核酸包含与SEQ ID NO:87具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码CBDAS多肽的异源核酸包含SEQ ID NO:152所示的核苷酸序列。在一些实施方案中,一种或多种编码CBDAS多肽的异源核酸包含SEQ IDNO:152所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码CBDAS多肽的异源核酸包含与SEQ ID NO:152具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码CBDAS多肽的异源核酸包含与SEQ ID NO:152具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码CBDAS多肽的异源核酸包含SEQ ID NO:167所示的核苷酸序列。在一些实施方案中,一种或多种编码CBDAS多肽的异源核酸包含SEQ IDNO:167所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码CBDAS多肽的异源核酸包含与SEQ ID NO:167具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码CBDAS多肽的异源核酸包含与SEQ ID NO:167具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,编码大麻素合成酶多肽的异源核酸中的至少一种可操作地连接到诱导型启动子。在一些实施方案中,编码大麻素合成酶多肽的异源核酸中的至少一种可操作地连接到组成型启动子。在一些实施方案中,信号肽连接到THCAS或CBDAS多肽或其他大麻素合成酶多肽的N末端。
产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽、包含所述多肽的核酸和 表达所述多肽的基因修饰的宿主细胞
在一些实施方案中,用一种或多种编码产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。这样的多肽可以包括但不限于,酰基活化酶(AAE)多肽、脂肪酰辅酶A合成酶(FAA)多肽或脂肪酰辅酶A连接酶多肽。
在一些实施方案中,用一种或多种编码AAE、FAA或脂肪酰辅酶A连接酶多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码多于一种AAE、FAA或脂肪酰辅酶A连接酶多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码多于两种AAE、FAA或脂肪酰辅酶A连接酶多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码多于三种AAE、FAA或脂肪酰辅酶A连接酶多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码两种AAE、FAA或脂肪酰辅酶A连接酶多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码三种AAE、FAA或脂肪酰辅酶A连接酶多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码1、2、3或更多种AAE、FAA或脂肪酰辅酶A连接酶多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码1、2或3种AAE、FAA或脂肪酰辅酶A连接酶多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。
AAE多肽、FAA多肽和脂肪酰辅酶A连接酶多肽可以将羧酸转化为其辅酶A形式并产生酰基辅酶A化合物或酰基辅酶A化合物衍生物。各种各样的酰基活化酶多肽,如CsAAE1和CsAAE3、FAA多肽或脂肪酰辅酶A连接酶多肽可以允许产生大麻素衍生物(例如,大麻萜酚酸衍生物)或大麻素前体衍生物(例如,橄榄醇酸衍生物),以及大麻素(例如,大麻萜酚酸)或其前体(例如,橄榄醇酸)。在一些实施方案中,己酸或除己酸以外的羧酸被进料给表达AAE多肽、FAA多肽或脂肪酰辅酶A连接酶多肽的基因修饰的宿主细胞(例如,存在于细胞生长的培养基中),以产生己酰辅酶A、酰基辅酶A化合物、己酰辅酶A的衍生物或酰基辅酶A化合物的衍生物。在某些这样的实施方案中,包含基因修饰的宿主细胞的细胞培养基包含己酸。在一些实施方案中,包含基因修饰的宿主细胞的细胞培养基包含除己酸以外的羧酸。
本文公开的示例性AAE、FAA或脂肪酰辅酶A连接酶多肽可以包括全长AAE、FAA或脂肪酰辅酶A连接酶多肽;AAE、FAA或脂肪酰辅酶A连接酶多肽的片段;AAE、FAA或脂肪酰辅酶A连接酶多肽的变体;截短的AAE、FAA或脂肪酰辅酶A连接酶多肽;或具有AAE、FAA或脂肪酰辅酶A连接酶多肽的至少一种活性的融合多肽。
在一些实施方案中,由一种或多种异源核酸编码的AAE多肽是CsAAE1多肽,并且包含SEQ ID NO:90所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的AAE多肽是CsAAE1多肽,并且包含SEQ ID NO:90所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的AAE多肽是CsAAE1多肽,并且包含与SEQ ID NO:90具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的AAE多肽是CsAAE1多肽,并且包含与SEQ ID NO:90具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的AAE多肽是CsAAE1多肽,并且包含与SEQ ID NO:90具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的AAE多肽是CsAAE1多肽,并且包含与SEQ ID NO:90具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的AAE多肽是CsAAE3多肽,并且包含SEQ ID NO:92或SEQ ID NO:149所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的AAE多肽是CsAAE3多肽,并且包含SEQ ID NO:92或SEQ ID NO:149所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的AAE多肽是CsAAE3多肽,并且包含与SEQ ID NO:92或SEQ ID NO:149具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的AAE多肽是CsAAE3多肽,并且包含SEQ ID NO:92所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的AAE多肽是CsAAE3多肽,并且包含SEQ ID NO:92所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的AAE多肽是CsAAE3多肽,并且包含与SEQ ID NO:92具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的AAE多肽是CsAAE3多肽,并且包含与SEQ ID NO:92具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的AAE多肽是CsAAE3多肽,并且包含与SEQ ID NO:92具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的AAE多肽是CsAAE3多肽,并且包含SEQ ID NO:112所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的AAE多肽是CsAAE3多肽,并且包含SEQ ID NO:112所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的AAE多肽是CsAAE3多肽,并且包含与SEQ ID NO:112具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的AAE多肽是CsAAE3多肽,并且包含与SEQ ID NO:112具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的AAE多肽是CsAAE3多肽,并且包含与SEQ ID NO:112具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。在这些进行中的实施方案中,CsAAE3多肽缺少RELIQKVRSNM C末端氨基酸。
在一些实施方案中,由一种或多种异源核酸编码的AAE多肽是CsAAE3多肽,并且包含SEQ ID NO:149所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的AAE多肽是CsAAE3多肽,并且包含SEQ ID NO:149所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的AAE多肽是CsAAE3多肽,并且包含与SEQ ID NO:149具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的AAE多肽是CsAAE3多肽,并且包含与SEQ ID NO:149具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的AAE多肽是CsAAE3多肽,并且包含与SEQ ID NO:149具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。在这些进行中的实施方案中,CsAAE3多肽缺少RRELIQKVRSNM C末端氨基酸。
在一些实施方案中,由一种或多种异源核酸编码的脂肪酰辅酶A连接酶多肽是FADK多肽,并且包含SEQ ID NO:145或SEQ ID NO:147所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的脂肪酰辅酶A连接酶多肽是FADK多肽,并且包含SEQ IDNO:145或SEQ ID NO:147所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的脂肪酰辅酶A连接酶多肽是FADK多肽,并且包含与SEQ IDNO:145或SEQ ID NO:147具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的脂肪酰辅酶A连接酶多肽是FADK多肽,并且包含SEQ ID NO:145所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的脂肪酰辅酶A连接酶多肽是FADK多肽,并且包含SEQ ID NO:145所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的脂肪酰辅酶A连接酶多肽是FADK多肽,并且包含与SEQ ID NO:145具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的脂肪酰辅酶A连接酶多肽是FADK多肽,并且包含与SEQID NO:145具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的脂肪酰辅酶A连接酶多肽是FADK多肽,并且包含与SEQ ID NO:145具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的脂肪酰辅酶A连接酶多肽是FADK多肽,并且包含SEQ ID NO:147所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的脂肪酰辅酶A连接酶多肽是FADK多肽,并且包含SEQ ID NO:147所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的脂肪酰辅酶A连接酶多肽是FADK多肽,并且包含与SEQ ID NO:147具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的脂肪酰辅酶A连接酶多肽是FADK多肽,并且包含与SEQID NO:147具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的脂肪酰辅酶A连接酶多肽是FADK多肽,并且包含与SEQ ID NO:147具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的FAA多肽包含SEQ ID NO:169、SEQ ID NO:192、SEQ ID NO:194、SEQ ID NO:196、SEQ ID NO:198或SEQ ID NO:200所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的FAA多肽包含SEQ ID NO:169、SEQ ID NO:192、SEQ ID NO:194、SEQ ID NO:196、SEQ ID NO:198或SEQ ID NO:200所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的FAA多肽包含与SEQ ID NO:169、SEQ ID NO:192、SEQ ID NO:194、SEQ ID NO:196、SEQ ID NO:198或SEQ ID NO:200具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的FAA多肽是FAA2多肽,并且包含SEQ ID NO:169所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的FAA多肽是FAA2多肽,并且包含SEQ ID NO:169所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的FAA多肽是FAA2多肽,并且包含与SEQ IDNO:169具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的FAA多肽是FAA2多肽,并且包含与SEQ ID NO:169具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的FAA多肽是FAA2多肽,并且包含与SEQ ID NO:169具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的FAA多肽是FAA2多肽,并且包含与SEQ ID NO:169具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的FAA多肽是截短的FAA2(tFAA2)多肽。在一些实施方案中,由一种或多种异源核酸编码的FAA多肽是tFAA2多肽,并且包含SEQ ID NO:194所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的FAA多肽是tFAA2多肽,并且包含SEQ ID NO:194所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的FAA多肽是tFAA2多肽,并且包含与SEQ ID NO:194具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的FAA多肽是tFAA2多肽,并且包含与SEQ ID NO:194具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的FAA多肽是tFAA2多肽,并且包含与SEQ ID NO:194具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的FAA多肽是tFAA2多肽,并且包含与SEQ ID NO:194具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的FAA多肽是突变的FAA2(FAA2mut)多肽。在一些实施方案中,由一种或多种异源核酸编码的FAA多肽是FAA2mut多肽,并且包含SEQ ID NO:196所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的FAA多肽是FAA2mut多肽,并且包含SEQ ID NO:196所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的FAA多肽是FAA2mut多肽,并且包含与SEQ ID NO:196具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的FAA多肽是FAA2mut多肽,并且包含与SEQ ID NO:196具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的FAA多肽是FAA2mut多肽,并且包含与SEQ ID NO:196具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的FAA多肽是FAA2mut多肽,并且包含与SEQ ID NO:196具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的FAA多肽是FAA1多肽,并且包含SEQ ID NO:192所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的FAA多肽是FAA1多肽,并且包含SEQ ID NO:192所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的FAA多肽是FAA1多肽,并且包含与SEQ IDNO:192具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的FAA多肽是FAA1多肽,并且包含与SEQ ID NO:192具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的FAA多肽是FAA1多肽,并且包含与SEQ ID NO:192具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的FAA多肽是FAA1多肽,并且包含与SEQ ID NO:192具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的FAA多肽是FAA3多肽,并且包含SEQ ID NO:198所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的FAA多肽是FAA3多肽,并且包含SEQ ID NO:198所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的FAA多肽是FAA3多肽,并且包含与SEQ IDNO:198具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的FAA多肽是FAA3多肽,并且包含与SEQ ID NO:198具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的FAA多肽是FAA3多肽,并且包含与SEQ ID NO:198具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的FAA多肽是FAA3多肽,并且包含与SEQ ID NO:198具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的FAA多肽是FAA4多肽,并且包含SEQ ID NO:200所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的FAA多肽是FAA4多肽,并且包含SEQ ID NO:200所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的FAA多肽是FAA4多肽,并且包含与SEQ IDNO:200具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的FAA多肽是FAA4多肽,并且包含与SEQ ID NO:200具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的FAA多肽是FAA4多肽,并且包含与SEQ ID NO:200具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的FAA多肽是FAA4多肽,并且包含与SEQ ID NO:200具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
本文公开的示例性AAE、FAA或脂肪酰辅酶A连接酶异源核酸可以包括编码AAE、FAA或脂肪酰辅酶A连接酶多肽的核酸,所述AAE、FAA或脂肪酰辅酶A连接酶多肽例如全长AAE、FAA或脂肪酰辅酶A连接酶多肽;AAE、FAA或脂肪酰辅酶A连接酶多肽的片段;AAE、FAA或脂肪酰辅酶A连接酶多肽的变体;截短的AAE、FAA或脂肪酰辅酶A连接酶多肽;或具有AAE、FAA或脂肪酰辅酶A连接酶多肽的至少一种活性的融合多肽。
在一些实施方案中,AAE、FAA或脂肪酰辅酶A连接酶多肽在基因修饰的宿主细胞中过表达。过表达可以通过增加编码AAE、FAA或脂肪酰辅酶A连接酶多肽的异源核酸的拷贝数,例如,通过使用高拷贝数表达载体(例如,以每个细胞10-40个拷贝存在的质粒)来实现和/或通过将编码AAE、FAA或脂肪酰辅酶A连接酶多肽的异源核酸可操作地连接到强启动子来实现。在一些实施方案中,基因修饰的宿主细胞具有一个拷贝的编码AAE、FAA或脂肪酰辅酶A连接酶多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有两个拷贝的编码AAE、FAA或脂肪酰辅酶A连接酶多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有三个拷贝的编码AAE、FAA或脂肪酰辅酶A连接酶多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有四个拷贝的编码AAE、FAA或脂肪酰辅酶A连接酶多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有五个拷贝的编码AAE、FAA或脂肪酰辅酶A连接酶多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有六个拷贝的编码AAE、FAA或脂肪酰辅酶A连接酶多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有七个拷贝的编码AAE、FAA或脂肪酰辅酶A连接酶多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有八个拷贝的编码AAE、FAA或脂肪酰辅酶A连接酶多肽的异源核酸。
在一些实施方案中,一种或多种编码CsAAE1多肽的异源核酸包含SEQ ID NO:164或SEQ ID NO:165所示的核苷酸序列。在一些实施方案中,一种或多种编码CsAAE1多肽的异源核酸包含SEQ ID NO:164或SEQ ID NO:165所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码CsAAE1多肽的异源核酸包含与SEQ ID NO:164或SEQ ID NO:165具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码CsAAE1多肽的异源核酸包含SEQ ID NO:89所示的核苷酸序列。在一些实施方案中,一种或多种编码CsAAE1多肽的异源核酸包含SEQ IDNO:89所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码CsAAE1多肽的异源核酸包含与SEQ ID NO:89具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码CsAAE1多肽的异源核酸包含与SEQ ID NO:89具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码CsAAE1多肽的异源核酸包含SEQ ID NO:164所示的核苷酸序列。在一些实施方案中,一种或多种编码CsAAE1多肽的异源核酸包含SEQID NO:164所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码CsAAE1多肽的异源核酸包含与SEQ ID NO:164具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码CsAAE1多肽的异源核酸包含与SEQ ID NO:164具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码CsAAE1多肽的异源核酸包含SEQ ID NO:165所示的核苷酸序列。在一些实施方案中,一种或多种编码CsAAE1多肽的异源核酸包含SEQID NO:165所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码CsAAE1多肽的异源核酸包含与SEQ ID NO:165具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码CsAAE1多肽的异源核酸包含与SEQ ID NO:165具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码CsAAE3多肽的异源核酸包含SEQ ID NO:150或SEQ ID NO:166所示的核苷酸序列。在一些实施方案中,一种或多种编码CsAAE3多肽的异源核酸包含SEQ ID NO:150或SEQ ID NO:166所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码CsAAE3多肽的异源核酸包含与SEQ ID NO:150或SEQ ID NO:166具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码CsAAE3多肽的异源核酸包含SEQ ID NO:91所示的核苷酸序列。在一些实施方案中,一种或多种编码CsAAE3多肽的异源核酸包含SEQ IDNO:91所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码CsAAE3多肽的异源核酸包含与SEQ ID NO:91具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码CsAAE3多肽的异源核酸包含与SEQ ID NO:91具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码CsAAE3多肽的异源核酸包含SEQ ID NO:150所示的核苷酸序列。在一些实施方案中,一种或多种编码CsAAE3多肽的异源核酸包含SEQID NO:150所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码CsAAE3多肽的异源核酸包含与SEQ ID NO:150具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码CsAAE3多肽的异源核酸包含与SEQ ID NO:150具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码CsAAE3多肽的异源核酸包含SEQ ID NO:166所示的核苷酸序列。在一些实施方案中,一种或多种编码CsAAE3多肽的异源核酸包含SEQID NO:166所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码CsAAE3多肽的异源核酸包含与SEQ ID NO:166具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码CsAAE3多肽的异源核酸包含与SEQ ID NO:166具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码FADK多肽的异源核酸包含SEQ ID NO:146或SEQ ID NO:148所示的核苷酸序列。在一些实施方案中,一种或多种编码FADK多肽的异源核酸包含SEQ ID NO:146或SEQ ID NO:148所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码FADK多肽的异源核酸包含与SEQ ID NO:146或SEQ IDNO:148具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码FADK多肽的异源核酸包含SEQ ID NO:146所示的核苷酸序列。在一些实施方案中,一种或多种编码FADK多肽的异源核酸包含SEQ IDNO:146所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码FADK多肽的异源核酸包含与SEQ ID NO:146具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码FADK多肽的异源核酸包含与SEQ ID NO:146具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码FADK多肽的异源核酸包含SEQ ID NO:148所示的核苷酸序列。在一些实施方案中,一种或多种编码FADK多肽的异源核酸包含SEQ IDNO:148所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码FADK多肽的异源核酸包含与SEQ ID NO:148具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码FADK多肽的异源核酸包含与SEQ ID NO:148具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码FAA多肽的异源核酸包含SEQ ID NO:168、SEQID NO:191、SEQ ID NO:193、SEQ ID NO:195、SEQ ID NO:197或SEQ ID NO:199所示的核苷酸序列。在一些实施方案中,一种或多种编码FAA多肽的异源核酸包含SEQ ID NO:168、SEQID NO:191、SEQ ID NO:193、SEQ ID NO:195、SEQ ID NO:197或SEQ ID NO:199所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码FAA多肽的异源核酸包含与SEQ ID NO:168、SEQ ID NO:191、SEQ ID NO:193、SEQ ID NO:195、SEQ ID NO:197或SEQ ID NO:199具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码FAA2多肽的异源核酸包含SEQ ID NO:168所示的核苷酸序列。在一些实施方案中,一种或多种编码FAA2多肽的异源核酸包含SEQ IDNO:168所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码FAA2多肽的异源核酸包含与SEQ ID NO:168具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码FAA2多肽的异源核酸包含与SEQ ID NO:168具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码FAA2多肽的异源核酸包含与SEQ ID NO:168具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码tFAA2多肽的异源核酸包含SEQ ID NO:193所示的核苷酸序列。在一些实施方案中,一种或多种编码tFAA2多肽的异源核酸包含SEQ IDNO:193所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码tFAA2多肽的异源核酸包含与SEQ ID NO:193具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码tFAA2多肽的异源核酸包含与SEQ ID NO:193具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码tFAA2多肽的异源核酸包含与SEQ ID NO:193具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码FAA2mut多肽的异源核酸包含SEQ ID NO:195所示的核苷酸序列。在一些实施方案中,一种或多种编码FAA2mut多肽的异源核酸包含SEQID NO:195所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码FAA2mut多肽的异源核酸包含与SEQ ID NO:195具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码FAA2mut多肽的异源核酸包含与SEQ ID NO:195具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码FAA2mut多肽的异源核酸包含与SEQ ID NO:195具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码FAA1多肽的异源核酸包含SEQ ID NO:191所示的核苷酸序列。在一些实施方案中,一种或多种编码FAA1多肽的异源核酸包含SEQ IDNO:191所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码FAA1多肽的异源核酸包含与SEQ ID NO:191具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码FAA1多肽的异源核酸包含与SEQ ID NO:191具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码FAA1多肽的异源核酸包含与SEQ ID NO:191具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码FAA3多肽的异源核酸包含SEQ ID NO:197所示的核苷酸序列。在一些实施方案中,一种或多种编码FAA3多肽的异源核酸包含SEQ IDNO:197所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码FAA3多肽的异源核酸包含与SEQ ID NO:197具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码FAA3多肽的异源核酸包含与SEQ ID NO:197具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码FAA3多肽的异源核酸包含与SEQ ID NO:197具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码FAA4多肽的异源核酸包含SEQ ID NO:199所示的核苷酸序列。在一些实施方案中,一种或多种编码FAA4多肽的异源核酸包含SEQ IDNO:199所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码FAA4多肽的异源核酸包含与SEQ ID NO:199具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码FAA4多肽的异源核酸包含与SEQ ID NO:199具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码FAA4多肽的异源核酸包含与SEQ ID NO:199具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
产生己酰辅酶A、己酰辅酶A衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物 或作为产生己酰辅酶A、己酰辅酶A衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物的 途径的部分的多肽、包含所述多肽的核酸和表达所述多肽的基因修饰的宿主细胞
在一些实施方案中,用一种或多种异源核酸基因修饰本发明的基因修饰的宿主细胞,所述异源核酸编码一种或多种产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物或作为产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物的生物合成途径的部分的多肽。
在一些实施方案中,用一种或多种异源核酸基因修饰本发明的基因修饰的宿主细胞,所述异源核酸编码多于一种产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物或作为产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物的生物合成途径的部分的多肽。在一些实施方案中,用一种或多种异源核酸基因修饰本发明的基因修饰的宿主细胞,所述异源核酸编码多于两种产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物或作为产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物的生物合成途径的部分的多肽。在一些实施方案中,用一种或多种异源核酸基因修饰本发明的基因修饰的宿主细胞,所述异源核酸编码多于三种产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物或作为产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物的生物合成途径的部分的多肽。在一些实施方案中,用一种或多种异源核酸基因修饰本发明的基因修饰的宿主细胞,所述异源核酸编码多于四种产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物或作为产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物的生物合成途径的部分的多肽。在一些实施方案中,用一种或多种异源核酸基因修饰本发明的基因修饰的宿主细胞,所述异源核酸编码多于五种产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物或作为产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物的生物合成途径的部分的多肽。在一些实施方案中,用一种或多种异源核酸基因修饰本发明的基因修饰的宿主细胞,所述异源核酸编码两种产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物或作为产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物的生物合成途径的部分的多肽。在一些实施方案中,用一种或多种异源核酸基因修饰本发明的基因修饰的宿主细胞,所述异源核酸编码三种产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物或作为产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物的生物合成途径的部分的多肽。在一些实施方案中,用一种或多种异源核酸基因修饰本发明的基因修饰的宿主细胞,所述异源核酸编码四种产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物或作为产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物的生物合成途径的部分的多肽。在一些实施方案中,用一种或多种异源核酸基因修饰本发明的基因修饰的宿主细胞,所述异源核酸编码五种产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物或作为产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物的生物合成途径的部分的多肽。在一些实施方案中,用一种或多种异源核酸基因修饰本发明的基因修饰的宿主细胞,所述异源核酸编码1、2、3、4、5种或更多种产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物或作为产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物的生物合成途径的部分的多肽。在一些实施方案中,用一种或多种异源核酸基因修饰本发明的基因修饰的宿主细胞,所述异源核酸编码1、2、3、4或5种产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物或作为产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物的生物合成途径的部分的多肽。
本文公开的产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物或作为产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物的生物合成途径的部分的示例性多肽可以包括产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物或作为产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物的生物合成途径的部分的全长多肽;产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物或作为产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物的生物合成途径的部分的多肽的片段;产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物或作为产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物的生物合成途径的部分的多肽的变体;产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物或作为产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物的生物合成途径的部分的截短的多肽;或融合多肽,其具有产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物或作为产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物的生物合成途径的部分的多肽的至少一种活性。
在一些实施方案中,一种或多种产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物或作为产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物的生物合成途径的部分的多肽可以包括己酰辅酶A合成酶(HCS)多肽(例如,如图1的方框1a中所描绘)。在一些实施方案中,一种或多种产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物或作为产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物的生物合成途径的部分的多肽是HCS多肽,并且包含基因修饰的宿主细胞的细胞培养基包含己酸。在一些实施方案中,一种或多种产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物或作为产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物的生物合成途径的部分的多肽是HCS多肽,并且包含基因修饰的宿主细胞的细胞培养基包含除己酸以外的羧酸。在一些实施方案中,己酸或除己酸以外的羧酸被进料给表达HCS多肽的基因修饰的宿主细胞(例如,存在于细胞生长的培养基中),以产生己酰辅酶A、酰基辅酶A化合物、己酰辅酶A的衍生物或酰基辅酶A化合物的衍生物。
在一些实施方案中,由一种或多种异源核酸编码的HCS多肽包含SEQ ID NO:1所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的HCS多肽包含SEQ ID NO:1所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的HCS多肽包含与SEQ ID NO:1具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的HCS多肽是RevS多肽,并且包含SEQ ID NO:2所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的HCS多肽是RevS多肽,并且包含SEQ ID NO:2所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的HCS多肽是RevS多肽,并且包含与SEQ ID NO:2具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的HCS多肽是AflA多肽,并且包含SEQ ID NO:3所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的HCS多肽是AflA多肽,并且包含SEQ ID NO:3所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的HCS多肽是AflA多肽,并且包含与SEQ ID NO:3具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的HCS多肽是AflB多肽,并且包含SEQ ID NO:4所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的HCS多肽是AflB多肽,并且包含SEQ ID NO:4所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的HCS多肽是AflB多肽,并且包含与SEQ ID NO:4具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,用以下异源核酸基因修饰本发明的基因修饰的宿主细胞:i)一种或多种编码AflA多肽的异源核酸,和ii)一种或多种编码AflB多肽的异源核酸。
在一些实施方案中,一种或多种产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物或作为产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物的生物合成途径的部分的多肽包括MCT1多肽、PaaH1多肽、Crt多肽、Ter多肽和BktB多肽。参见例如,Machado等人(2012)Metabolic Engineering14:504。在一些实施方案中,由一种或多种异源核酸编码的PaaH1(3-羟基酰基辅酶A脱氢酶)多肽包含SEQ ID NO:18或SEQ ID NO:46所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的PaaH1多肽包含SEQ ID NO:18或SEQ ID NO:46所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的PaaH1多肽包含与SEQ ID NO:18或SEQ ID NO:46具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的Crt(巴豆酸酶)多肽包含SEQ ID NO:19或SEQ ID NO:48所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的Crt多肽包含SEQ ID NO:19或SEQ ID NO:48所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的Crt多肽包含与SEQ ID NO:19或SEQ ID NO:48具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的Ter(反式-2-烯酰辅酶A还原酶)多肽包含SEQ ID NO:20或SEQ ID NO:50所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的Ter多肽包含SEQ ID NO:20或SEQ ID NO:50所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的Ter多肽包含与SEQ ID NO:20或SEQ ID NO:50具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的BktB(β-酮硫解酶)多肽包含SEQ ID NO:21或SEQ ID NO:44所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的BktB多肽包含SEQ IDNO:21或SEQ ID NO:44所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的BktB多肽包含与SEQ ID NO:21或SEQ ID NO:44具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,一种或多种产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物或作为产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物的生物合成途径的部分的多肽包括MCT1多肽、PhaB多肽、PhaJ多肽、Ter多肽和BktB多肽。在一些实施方案中,由一种或多种异源核酸编码的PhaB(乙酰乙酰辅酶A还原酶)多肽包含SEQ ID NO:94所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的PhaB多肽包含SEQ ID NO:94所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的PhaB多肽包含与SEQ IDNO:94具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的PhaJ((R)-特异性烯酰辅酶A水合酶)多肽包含SEQ ID NO:96所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的PhaJ多肽包含SEQ ID NO:96所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的PhaJ多肽包含与SEQ ID NO:96具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,使用的Ter(反式-2-烯酰辅酶A还原酶)和BktB(β-酮硫解酶)多肽选自本文公开的Ter和BktB多肽。
在一些实施方案中,一种或多种产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物或作为产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物的生物合成途径的部分的多肽包括使乙酰辅酶A和丙二酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽。使乙酰辅酶A和丙二酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽可以包括丙二酰辅酶A-酰基载体蛋白转酰酶(MCT1)多肽。在一些实施方案中,由一种或多种异源核酸编码的MCT1多肽包含SEQ ID NO:42所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的MCT1多肽包含SEQ ID NO:42所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的MCT1多肽包含与SEQ ID NO:42具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,用一种或多种异源核酸基因修饰宿主细胞,所述异源核酸编码使乙酰辅酶A和丙二酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽。在某些这样的实施方案中,使乙酰辅酶A和丙二酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽是MCT1多肽。
一种或多种产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽还可以包括短链脂肪酰辅酶A硫酯酶(SCFA-TE)多肽(例如,如图1的方框1c所描绘)。在一些实施方案中,由一种或多种异源核酸编码的SCFA-TE多肽包含SEQ IDNO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30或SEQ ID NO:31所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的SCFA-TE多肽包含SEQ IDNO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ ID NO:30或SEQ ID NO:31所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的SCFA-TE多肽包含与SEQ ID NO:26、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29、SEQ IDNO:30或SEQ ID NO:31具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,一种或多种作为产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物的生物合成途径的部分的多肽包括脂肪酸合成酶多肽,如FAS1或FAS2多肽。在一些实施方案中,由一种或多种异源核酸编码的FAS1多肽是FAS1(I306A,R1834K)多肽,并且包含SEQ ID NO:106所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的FAS1多肽是FAS1(I306A,R1834K)多肽,并且包含SEQ ID NO:106所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的FAS1多肽是FAS1(I306A,R1834K)多肽,并且包含与SEQ ID NO:106具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的FAS2多肽是FAS2(G1250S)多肽,并且包含SEQ ID NO:107所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的FAS2多肽是FAS2(G1250S)多肽,并且包含SEQ ID NO:107所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的FAS2多肽是FAS2(G1250S)多肽,并且包含与SEQ ID NO:107具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
本文公开的示例性异源核酸可以包括编码产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物或作为产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物的生物合成途径的部分的多肽的核酸,所述多肽例如产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物或作为产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物的生物合成途径的部分的全长多肽;产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物或作为产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物的生物合成途径的部分的多肽的片段;产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物或作为产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物的生物合成途径的部分的多肽的变体;产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物或作为产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物的生物合成途径的部分的截短的多肽;或融合多肽,其具有产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物或作为产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物的生物合成途径的部分的多肽的至少一种活性。
在一些实施方案中,产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物或作为产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物的生物合成途径的部分的多肽在基因修饰的宿主细胞中过表达。过表达可以通过增加编码产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物或作为产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物的生物合成途径的部分的多肽的异源核酸的拷贝数,例如,通过使用高拷贝数表达载体(例如,以每个细胞10-40个拷贝存在的质粒)来实现和/或通过将编码产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物或作为产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物的生物合成途径的部分的多肽的异源核酸可操作地连接到强启动子来实现。在一些实施方案中,基因修饰的宿主细胞具有一个拷贝的编码产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物或作为产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物的生物合成途径的部分的多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有两个拷贝的编码产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物或作为产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物的生物合成途径的部分的多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有三个拷贝的编码产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物或作为产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物的生物合成途径的部分的多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有四个拷贝的编码产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物或作为产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物的生物合成途径的部分的多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有五个拷贝的编码产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物或作为产生己酰辅酶A、己酰辅酶A的衍生物、酰基辅酶A化合物或酰基辅酶A化合物衍生物的生物合成途径的部分的多肽的异源核酸。
在一些实施方案中,一种或多种编码MCT1多肽的异源核酸包含SEQ ID NO:41所示的核苷酸序列。在一些实施方案中,一种或多种编码MCT1多肽的异源核酸包含SEQ ID NO:41所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码MCT1多肽的异源核酸包含与SEQ ID NO:41具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码BktB多肽的异源核酸包含SEQ ID NO:43所示的核苷酸序列。在一些实施方案中,一种或多种编码BktB多肽的异源核酸包含SEQ ID NO:43所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码BktB多肽的异源核酸包含与SEQ ID NO:43具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码PaaH1多肽的异源核酸包含SEQ ID NO:45所示的核苷酸序列。在一些实施方案中,一种或多种编码PaaH1多肽的异源核酸包含SEQ ID NO:45所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码PaaH1多肽的异源核酸包含与SEQ ID NO:45具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码Crt多肽的异源核酸包含SEQ ID NO:47所示的核苷酸序列。在一些实施方案中,一种或多种编码Crt多肽的异源核酸包含SEQ ID NO:47所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码Crt多肽的异源核酸包含与SEQ ID NO:47具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码Ter多肽的异源核酸包含SEQ ID NO:49所示的核苷酸序列。在一些实施方案中,一种或多种编码Ter多肽的异源核酸包含SEQ ID NO:49所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码Ter多肽的异源核酸包含与SEQ IDNO:49具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码PhaB多肽的异源核酸包含SEQ ID NO:93所示的核苷酸序列。在一些实施方案中,一种或多种编码PhaB多肽的异源核酸包含SEQ ID NO:93所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码PhaB多肽的异源核酸包含与SEQ ID NO:93具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码PhaJ多肽的异源核酸包含SEQ ID NO:95所示的核苷酸序列。在一些实施方案中,一种或多种编码PhaJ多肽的异源核酸包含SEQ ID NO:95所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码PhaJ多肽的异源核酸包含与SEQ ID NO:95具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
产生丙二酰辅酶A的多肽、包含所述多肽的核酸和表达所述多肽的基因修饰的宿 主细胞
在一些实施方案中,用一种或多种编码产生丙二酰辅酶A的多肽的异源核酸基因修饰宿主细胞。在一些实施方案中,产生丙二酰辅酶A的多肽是乙酰辅酶A羧化酶(ACC)多肽。在一些实施方案中,用一种或多种编码ACC多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。
本文公开的示例性ACC多肽可以包括全长ACC多肽、ACC多肽的片段、ACC多肽的变体、截短的ACC多肽或具有ACC多肽的至少一种活性的融合多肽。
在一些实施方案中,由一种或多种异源核酸编码的ACC多肽包含SEQ ID NO:9、SEQID NO:97或SEQ ID NO:207所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的ACC多肽包含SEQ ID NO:9、SEQ ID NO:97或SEQ ID NO:207所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的ACC多肽包含与SEQ ID NO:9、SEQ ID NO:97或SEQ ID NO:207具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的ACC多肽是ACC1多肽,并且包含SEQ ID NO:9所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的ACC多肽是ACC1多肽,并且包含SEQ ID NO:9所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的ACC多肽是ACC1多肽,并且包含与SEQ ID NO:9具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的ACC多肽是ACC1多肽,并且包含与SEQ ID NO:9具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的ACC多肽是ACC1多肽,并且包含与SEQ ID NO:9具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的ACC多肽是ACC1(S659A,S1157A)多肽,并且包含SEQ ID NO:97所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的ACC多肽是ACC1(S659A,S1157A)多肽,并且包含SEQ ID NO:97所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的ACC多肽是ACC1(S659A,S1157A)多肽,并且包含与SEQ ID NO:97具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的ACC多肽是ACC1(S659A,S1157A)多肽,并且包含与SEQ ID NO:97具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的ACC多肽是ACC1(S659A,S1157A)多肽,并且包含与SEQ ID NO:97具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的ACC多肽是ACC1(S659A,S1157A)多肽,并且包含SEQ ID NO:207所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的ACC多肽是ACC1(S659A,S1157A)多肽,并且包含SEQ ID NO:207所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的ACC多肽是ACC1(S659A,S1157A)多肽,并且包含与SEQ ID NO:207具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的ACC多肽是ACC1(S659A,S1157A)多肽,并且包含与SEQ ID NO:207具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的ACC多肽是ACC1(S659A,S1157A)多肽,并且包含与SEQ ID NO:207具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
本文公开的示例性ACC异源核酸可以包括编码ACC多肽的核酸,所述ACC多肽例如全长ACC多肽、ACC多肽的片段、ACC多肽的变体、截短的ACC多肽或具有ACC多肽的至少一种活性的融合多肽。
在一些实施方案中,ACC多肽在基因修饰的宿主细胞中过表达。参见例如,Runguphan and Keasling(2014)Metabolic Engineering 21:103。过表达可以通过增加编码ACC多肽的异源核酸的拷贝数,例如,通过使用高拷贝数表达载体(例如,以每个细胞10-40个拷贝存在的质粒)来实现和/或通过将编码ACC多肽的异源核酸可操作地连接到强启动子来实现。在一些实施方案中,基因修饰的宿主细胞具有一个拷贝的编码ACC多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有两个拷贝的编码ACC多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有三个拷贝的编码ACC多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有四个拷贝的编码ACC多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有五个拷贝的编码ACC多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有六个拷贝的编码ACC多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有七个拷贝的编码ACC多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有八个拷贝的编码ACC多肽的异源核酸。
在一些实施方案中,一种或多种编码ACC多肽的异源核酸包含SEQ ID NO:201所示的核苷酸序列。在一些实施方案中,一种或多种编码ACC多肽的异源核酸包含SEQ ID NO:201所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码ACC多肽的异源核酸包含与SEQ ID NO:201具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码ACC多肽的异源核酸包含与SEQ ID NO:201具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码ACC多肽的异源核酸包含与SEQID NO:201具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
使酰基辅酶A化合物或酰基辅酶A化合物衍生物与丙二酰辅酶A缩合以产生橄榄醇 酸或橄榄醇酸的衍生物的多肽、包含所述多肽的核酸和表达所述多肽的基因修饰的宿主细
在一些实施方案中,用一种或多种异源核酸基因修饰本发明的基因修饰的宿主细胞,所述异源核酸编码一种或多种使酰基辅酶A化合物(如己酰辅酶A)或酰基辅酶A化合物衍生物(如己酰辅酶A衍生物)与丙二酰辅酶A缩合以产生橄榄醇酸或橄榄醇酸的衍生物的多肽。使酰基辅酶A化合物或酰基辅酶A化合物衍生物与丙二酰辅酶A反应以产生橄榄醇酸或橄榄醇酸的衍生物的多肽可以包括TKS和OAC多肽。已经发现TKS和OAC多肽具有广泛的底物特异性,除了大麻素和大麻素前体以外,还能够产生大麻素衍生物或大麻素前体衍生物。
在一些实施方案中,用一种或多种编码TKS多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码多于一种TKS多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码多于两种TKS多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码多于三种TKS多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码两种TKS多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码三种TKS多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码1、2、3或更多种TKS多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码1、2或3种TKS多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。
在一些实施方案中,用一种或多种编码OAC多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码多于一种OAC多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码多于两种OAC多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码多于三种OAC多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码两种OAC多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码三种OAC多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码1、2、3或更多种OAC多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码1、2或3种OAC多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。
本文公开的示例性TKS或OAC多肽可以包括全长TKS或OAC多肽、TKS或OAC多肽的片段、TKS或OAC多肽的变体、截短的TKS或OAC多肽或具有TKS或OAC多肽的至少一种活性的融合多肽。
在一些实施方案中,由一种或多种异源核酸编码的TKS多肽包含SEQ ID NO:11或SEQ ID NO:76所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的TKS多肽包含SEQ ID NO:11或SEQ ID NO:76所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的TKS多肽包含与SEQ ID NO:11或SEQ ID NO:76具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的OAC多肽包含SEQ ID NO:10或SEQ ID NO:78所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的OAC多肽包含SEQ ID NO:10或SEQ ID NO:78所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的OAC多肽包含与SEQ ID NO:10或SEQ ID NO:78具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的TKS多肽包含SEQ ID NO:11所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的TKS多肽包含SEQ IDNO:11所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的TKS多肽包含与SEQ ID NO:11具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的TKS多肽包含与SEQ ID NO:11具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的TKS多肽包含与SEQ ID NO:11具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的TKS多肽包含SEQ ID NO:76所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的TKS多肽包含SEQ IDNO:76所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的TKS多肽包含与SEQ ID NO:76具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的TKS多肽包含与SEQ ID NO:76具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的TKS多肽包含与SEQ ID NO:76具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的OAC多肽包含SEQ ID NO:10所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的OAC多肽包含SEQ IDNO:10所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的OAC多肽包含与SEQ ID NO:10具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的OAC多肽包含与SEQ ID NO:10具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的OAC多肽包含与SEQ ID NO:10具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的OAC多肽包含SEQ ID NO:78所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的OAC多肽包含SEQ IDNO:78所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的OAC多肽包含与SEQ ID NO:78具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的OAC多肽包含与SEQ ID NO:78具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的OAC多肽包含与SEQ ID NO:78具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,将TKS和OAC多肽融合成单条多肽链(TKS/OAC融合多肽)。在一些实施方案中,由一种或多种异源核酸编码的TKS/OAC多肽包含SEQ ID NO:80所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的TKS/OAC多肽包含SEQ ID NO:80所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的TKS/OAC多肽包含与SEQ ID NO:80具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的TKS/OAC多肽包含与SEQ ID NO:80具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的TKS/OAC多肽包含与SEQ ID NO:80具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的TKS/OAC多肽包含与SEQ ID NO:80具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
本文公开的示例性TKS或OAC异源核酸可以包括编码TKS或OAC多肽的核酸,所述TKS或OAC多肽例如,全长TKS或OAC多肽、TKS或OAC多肽的片段、TKS或OAC多肽的变体、截短的TKS或OAC多肽或具有TKS或OAC多肽的至少一种活性的融合多肽。
在一些实施方案中,TKS或OAC多肽在基因修饰的宿主细胞中过表达。过表达可以通过增加编码TKS和/或OAC多肽的异源核酸的拷贝数,例如,通过使用高拷贝数表达载体(例如,以每个细胞10-40个拷贝存在的质粒)来实现和/或通过将编码TKS和/或OAC多肽的异源核酸可操作地连接到强启动子来实现。在一些实施方案中,基因修饰的宿主细胞具有一个拷贝的编码TKS和/或OAC多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有两个拷贝的编码TKS和/或OAC多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有三个拷贝的编码TKS和/或OAC多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有四个拷贝的编码TKS和/或OAC多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有五个拷贝的编码TKS和/或OAC多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有六个拷贝的编码TKS和/或OAC多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有七个拷贝的编码TKS和/或OAC多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有八个拷贝的编码TKS和/或OAC多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有九个拷贝的编码TKS和/或OAC多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有10个拷贝的编码TKS和/或OAC多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有11个拷贝的编码TKS和/或OAC多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有12个拷贝的编码TKS和/或OAC多肽的异源核酸。
在一些实施方案中,一种或多种编码OAC多肽的异源核酸包含SEQ ID NO:77或SEQID NO:163所示的核苷酸序列。在一些实施方案中,一种或多种编码OAC多肽的异源核酸包含SEQ ID NO:77或SEQ ID NO:163所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码OAC多肽的异源核酸包含与SEQ ID NO:77或SEQ ID NO:163具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码TKS多肽的异源核酸包含SEQ ID NO:75所示的核苷酸序列。在一些实施方案中,一种或多种编码TKS多肽的异源核酸包含SEQ ID NO:75所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码TKS多肽的异源核酸包含与SEQ ID NO:75具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码TKS多肽的异源核酸包含与SEQ ID NO:75具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码TKS多肽的异源核酸包含SEQ ID NO:162所示的核苷酸序列。在一些实施方案中,一种或多种编码TKS多肽的异源核酸包含SEQ ID NO:162所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码TKS多肽的异源核酸包含与SEQ ID NO:162具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码TKS多肽的异源核酸包含与SEQ ID NO:162具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码TKS多肽的异源核酸包含与SEQID NO:162具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码OAC多肽的异源核酸包含SEQ ID NO:77所示的核苷酸序列。在一些实施方案中,一种或多种编码OAC多肽的异源核酸包含SEQ ID NO:77所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码OAC多肽的异源核酸包含与SEQ ID NO:77具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码OAC多肽的异源核酸包含与SEQ ID NO:77具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码OAC多肽的异源核酸包含SEQ ID NO:163所示的核苷酸序列。在一些实施方案中,一种或多种编码OAC多肽的异源核酸包含SEQ ID NO:163所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码OAC多肽的异源核酸包含与SEQ ID NO:163具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码OAC多肽的异源核酸包含与SEQ ID NO:163具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码TKS/OAC多肽的异源核酸包含SEQ ID NO:79所示的核苷酸序列。在一些实施方案中,一种或多种编码TKS/OAC多肽的异源核酸包含SEQID NO:79所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码TKS/OAC多肽的异源核酸包含与SEQ ID NO:79具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码TKS/OAC多肽的异源核酸包含与SEQ ID NO:79具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码TKS/OAC多肽的异源核酸包含与SEQ ID NO:79具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
产生香叶基焦磷酸的多肽、包含所述多肽的核酸和表达所述多肽的基因修饰的宿 主细胞
在一些实施方案中,用一种或多种编码产生GPP的多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,产生GPP的多肽是香叶基二磷酸合成酶(GPPS)多肽。在一些实施方案中,GPPS多肽还具有法呢基二磷酸合成酶(FPPS)多肽活性。在一些实施方案中,修饰GPPS多肽,使得其具有比所述修饰的GPPS多肽来源的相应的野生型或亲本GPPS多肽降低的FPPS多肽活性(例如,低至少10%、20%、30%、40%、50%、60%、70%、80%、90%或大于90%的FPPS多肽活性)。在一些实施方案中,修饰GPPS多肽,使得其基本上不具有FPPS多肽活性。在一些实施方案中,用一种或多种编码GPPS多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。
本文公开的示例性GPPS多肽可以包括全长GPPS多肽、GPPS多肽的片段、GPPS多肽的变体、截短的GPPS多肽或具有GPPS多肽的至少一种活性的融合多肽。在一些实施方案中,一种或多种产生GPP或作为产生GPP的生物合成途径的部分的多肽是一种或多种具有在甲羟戊酸(MEV)途径中存在的多肽的至少一种活性的多肽。在一些实施方案中,一种或多种产生GPP或作为产生GPP的生物合成途径的部分的多肽是一种或多种具有在DXP途径中存在的多肽的至少一种活性的多肽。
在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含SEQ ID NO:7、SEQ ID NO:8或SEQ ID NO:60所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含SEQ ID NO:7、SEQ ID NO:8或SEQ ID NO:60所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含与SEQ ID NO:7、SEQ ID NO:8或SEQ ID NO:60具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含SEQ ID NO:121、SEQ ID NO:123、SEQ ID NO:125、SEQ ID NO:127、SEQ ID NO:129、SEQ ID NO:131、SEQ IDNO:133、SEQ ID NO:135、SEQ ID NO:137、SEQ ID NO:139、SEQ ID NO:141、SEQ ID NO:143或SEQ ID NO:203所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含SEQ ID NO:121、SEQ ID NO:123、SEQ ID NO:125、SEQ ID NO:127、SEQ IDNO:129、SEQ ID NO:131、SEQ ID NO:133、SEQ ID NO:135、SEQ ID NO:137、SEQ ID NO:139、SEQ ID NO:141、SEQ ID NO:143或SEQ ID NO:203所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含与SEQ ID NO:121、SEQ ID NO:123、SEQ ID NO:125、SEQ ID NO:127、SEQ ID NO:129、SEQ ID NO:131、SEQID NO:133、SEQ ID NO:135、SEQ ID NO:137、SEQ ID NO:139、SEQ ID NO:141、SEQ ID NO:143或SEQ ID NO:203具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含SEQ ID NO:5或SEQ ID NO:6所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含SEQ ID NO:5或SEQ ID NO:6所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含与SEQ ID NO:5或SEQ ID NO:6具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,用以下异源核酸基因修饰本发明的基因修饰的宿主细胞:i)一种或多种编码包含如SEQ ID NO:5所示的氨基酸序列的GPPS多肽的异源核酸;和ii)一种或多种编码包含如SEQ ID NO:6所示的氨基酸序列的GPPS多肽的异源核酸。
在一些实施方案中,由一种或多种异源核酸编码的GPPS(Erg20)多肽包含SEQ IDNO:7所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS(Erg20)多肽包含SEQ ID NO:7所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS(Erg20)多肽包含与SEQ ID NO:7具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS(Erg20)多肽包含与SEQ ID NO:7具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS(Erg20)多肽包含与SEQ ID NO:7具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的GPPS(Erg20(K197G))多肽包含SEQ ID NO:8所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS(Erg20(K197G))多肽包含SEQ ID NO:8所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS(Erg20(K197G))多肽包含与SEQ IDNO:8具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS(Erg20(K197G))多肽包含与SEQ ID NO:8具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS(Erg20(K197G))多肽包含与SEQ ID NO:8具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。由一种或多种异源核酸编码的GPPS(Erg20(K197G))多肽包含SEQ ID NO:8所示的氨基酸序列,其相对于SEQ ID NO:7所示的GPPS氨基酸序列包含K197G氨基酸取代。该突变改变了GPP与法呢基二磷酸(FPP)的比例,从而提高了产生CBDA所需的GPP的产生。
在一些实施方案中,用一种或多种编码GPPS大亚基多肽和GPPS小亚基多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞,其中所述GPPS大亚基多肽和GPPS小亚基多肽一起形成异源二聚体GPPS多肽。在一些实施方案中,由一种或多种异源核酸编码的GPPS大亚基多肽包含SEQ ID NO:72所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS大亚基多肽包含SEQ ID NO:72所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS大亚基多肽包含与SEQ ID NO:72具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS小亚基多肽包含SEQ ID NO:74所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS小亚基多肽包含SEQ ID NO:74所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS小亚基多肽包含与SEQ IDNO:74具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽是ERG20mut(F96W,N127W)多肽,并且包含SEQ ID NO:60所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽是ERG20mut(F96W,N127W)多肽,并且包含SEQ ID NO:60所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽是ERG20mut(F96W,N127W)多肽,并且包含与SEQ ID NO:60具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽是ERG20mut(F96W,N127W)多肽,并且包含与SEQ ID NO:60具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽是ERG20mut(F96W,N127W)多肽,并且包含与SEQ ID NO:60具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。该突变改变了GPP与法呢基二磷酸(FPP)的比例,提高了产生CBDA所需的GPP的产生。
在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含SEQ ID NO:121所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含SEQID NO:121所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含与SEQ ID NO:121具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含与SEQ ID NO:121具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含与SEQ ID NO:121具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含SEQ ID NO:123所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含SEQID NO:123所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含与SEQ ID NO:123具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含与SEQ ID NO:123具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含与SEQ ID NO:123具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含SEQ ID NO:125所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含SEQID NO:125所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含与SEQ ID NO:125具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含与SEQ ID NO:125具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含与SEQ ID NO:125具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含SEQ ID NO:127所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含SEQID NO:127所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含与SEQ ID NO:127具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含与SEQ ID NO:127具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含与SEQ ID NO:127具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含SEQ ID NO:129所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含SEQID NO:129所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含与SEQ ID NO:129具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含与SEQ ID NO:129具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含与SEQ ID NO:129具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含SEQ ID NO:131所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含SEQID NO:131所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含与SEQ ID NO:131具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含与SEQ ID NO:131具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含与SEQ ID NO:131具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含SEQ ID NO:133所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含SEQID NO:133所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含与SEQ ID NO:133具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含与SEQ ID NO:133具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含与SEQ ID NO:133具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含SEQ ID NO:135所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含SEQID NO:135所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含与SEQ ID NO:135具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含与SEQ ID NO:135具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含与SEQ ID NO:135具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含SEQ ID NO:137所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含SEQID NO:137所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含与SEQ ID NO:137具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含与SEQ ID NO:137具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含与SEQ ID NO:137具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含SEQ ID NO:139所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含SEQID NO:139所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含与SEQ ID NO:139具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含与SEQ ID NO:139具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含与SEQ ID NO:139具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含SEQ ID NO:141所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含SEQID NO:141所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含与SEQ ID NO:141具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含与SEQ ID NO:141具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含与SEQ ID NO:141具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含SEQ ID NO:143所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含SEQID NO:143所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含与SEQ ID NO:143具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含与SEQ ID NO:143具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含与SEQ ID NO:143具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含SEQ ID NO:203所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含SEQID NO:203所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含与SEQ ID NO:203具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含与SEQ ID NO:203具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GPPS多肽包含与SEQ ID NO:203具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
本文公开的示例性GPPS异源核酸可以包括编码GPPS多肽的核酸,所述GPPS多肽例如,全长GPPS多肽、GPPS多肽的片段、GPPS多肽的变体、截短的GPPS多肽或具有GPPS多肽的至少一种活性的融合多肽。
在一些实施方案中,GPPS多肽在基因修饰的宿主细胞中过表达。过表达可以通过增加编码GPPS多肽的异源核酸的拷贝数,例如,通过使用高拷贝数表达载体(例如,以每个细胞10-40个拷贝存在的质粒)来实现和/或通过将编码GPPS多肽的异源核酸可操作地连接到强启动子来实现。在一些实施方案中,基因修饰的宿主细胞具有一个拷贝的编码GPPS多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有两个拷贝的编码GPPS多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有三个拷贝的编码GPPS多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有四个拷贝的编码GPPS多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有五个拷贝的编码GPPS多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有六个拷贝的编码GPPS多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有七个拷贝的编码GPPS多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有八个拷贝的编码GPPS多肽的异源核酸。
在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含SEQ ID NO:122、SEQ ID NO:124、SEQ ID NO:126、SEQ ID NO:128、SEQ ID NO:130、SEQ ID NO:132、SEQ IDNO:134、SEQ ID NO:136、SEQ ID NO:138、SEQ ID NO:140、SEQ ID NO:142、SEQ ID NO:144或SEQ ID NO:202所示的核苷酸序列。在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含SEQ ID NO:122、SEQ ID NO:124、SEQ ID NO:126、SEQ ID NO:128、SEQ ID NO:130、SEQ ID NO:132、SEQ ID NO:134、SEQ ID NO:136、SEQ ID NO:138、SEQ ID NO:140、SEQID NO:142、SEQ ID NO:144或SEQ ID NO:202所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含与SEQ ID NO:122、SEQID NO:124、SEQ ID NO:126、SEQ ID NO:128、SEQ ID NO:130、SEQ ID NO:132、SEQ ID NO:134、SEQ ID NO:136、SEQ ID NO:138、SEQ ID NO:140、SEQ ID NO:142、SEQ ID NO:144或SEQ ID NO:202具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含SEQ ID NO:71和/或SEQ ID NO:73所示的核苷酸序列。在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含SEQ ID NO:71和/或SEQ ID NO:73所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含与SEQ ID NO:71和/或SEQ ID NO:73具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码GPPS多肽的异源核酸(ERG20mut(F96W,N127W))包含SEQ ID NO:59所示的核苷酸序列。在一些实施方案中,一种或多种编码GPPS多肽的异源核酸(ERG20mut(F96W,N127W))包含SEQ ID NO:59所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码GPPS多肽的异源核酸(ERG20mut(F96W,N127W))包含与SEQ ID NO:59具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码GPPS多肽的异源核酸(ERG20mut(F96W,N127W))包含与SEQ ID NO:59具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码GPPS多肽的异源核酸(ERG20mut(F96W,N127W))包含SEQ ID NO:161所示的核苷酸序列。在一些实施方案中,一种或多种编码GPPS多肽的异源核酸(ERG20mut(F96W,N127W))包含SEQ ID NO:161所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码GPPS多肽的异源核酸(ERG20mut(F96W,N127W))包含与SEQ ID NO:161具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码GPPS多肽的异源核酸(ERG20mut(F96W,N127W))包含与SEQ ID NO:161具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码GPPS多肽的异源核酸(ERG20mut(F96W,N127W))包含与SEQ ID NO:161具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含SEQ ID NO:122所示的核苷酸序列。在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含SEQ IDNO:122所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含与SEQ ID NO:122具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含与SEQ ID NO:122具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含SEQ ID NO:124所示的核苷酸序列。在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含SEQ IDNO:124所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含与SEQ ID NO:124具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含与SEQ ID NO:124具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含SEQ ID NO:126所示的核苷酸序列。在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含SEQ IDNO:126所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含与SEQ ID NO:126具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含与SEQ ID NO:126具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含SEQ ID NO:128所示的核苷酸序列。在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含SEQ IDNO:128所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含与SEQ ID NO:128具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含与SEQ ID NO:128具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含SEQ ID NO:130所示的核苷酸序列。在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含SEQ IDNO:130所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含与SEQ ID NO:130具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含与SEQ ID NO:130具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含SEQ ID NO:132所示的核苷酸序列。在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含SEQ IDNO:132所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含与SEQ ID NO:132具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含与SEQ ID NO:132具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含SEQ ID NO:134所示的核苷酸序列。在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含SEQ IDNO:134所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含与SEQ ID NO:134具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含与SEQ ID NO:134具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含SEQ ID NO:136所示的核苷酸序列。在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含SEQ IDNO:136所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含与SEQ ID NO:136具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含与SEQ ID NO:136具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含SEQ ID NO:138所示的核苷酸序列。在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含SEQ IDNO:138所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含与SEQ ID NO:138具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含与SEQ ID NO:138具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含SEQ ID NO:140所示的核苷酸序列。在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含SEQ IDNO:140所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含与SEQ ID NO:140具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含与SEQ ID NO:140具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含SEQ ID NO:142所示的核苷酸序列。在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含SEQ IDNO:142所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含与SEQ ID NO:142具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含与SEQ ID NO:142具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含SEQ ID NO:144所示的核苷酸序列。在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含SEQ IDNO:144所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含与SEQ ID NO:144具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含与SEQ ID NO:144具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含SEQ ID NO:202所示的核苷酸序列。在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含SEQ IDNO:202所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含与SEQ ID NO:202具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码GPPS多肽的异源核酸包含与SEQ ID NO:202具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
NphB多肽、包含所述多肽的核酸和表达所述多肽的基因修饰的宿主细胞
在一些实施方案中,使用NphB多肽代替GOT多肽以由GPP和橄榄醇酸产生大麻萜酚酸。在一些实施方案中,用一种或多种编码NphB多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。
本文公开的示例性NphB多肽可以包括全长NphB多肽、NphB多肽的片段、NphB多肽的变体、截短的NphB多肽或具有NphB多肽的至少一种活性的融合多肽。
在一些实施方案中,由一种或多种异源核酸编码的NphB多肽包含SEQ ID NO:84所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的NphB多肽包含SEQ IDNO:84所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的NphB多肽包含与SEQ ID NO:84具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
本文公开的示例性NphB异源核酸可以包括编码NphB多肽的核酸,所述NphB多肽例如全长NphB多肽、NphB多肽的片段、NphB多肽的变体、截短的NphB多肽或具有NphB多肽的至少一种活性的融合多肽。
在一些实施方案中,NphB多肽在基因修饰的宿主细胞中过表达。过表达可以通过增加编码NphB多肽的异源核酸的拷贝数,例如,通过使用高拷贝数表达载体(例如,以每个细胞10-40个拷贝存在的质粒)来实现和/或通过将编码NphB多肽的异源核酸可操作地连接到强启动子来实现。在一些实施方案中,基因修饰的宿主细胞具有一个拷贝的编码NphB多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有两个拷贝的编码NphB多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有三个拷贝的编码NphB多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有四个拷贝的编码NphB多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有五个拷贝的编码NphB多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有六个拷贝的编码NphB多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有七个拷贝的编码NphB多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有八个拷贝的编码NphB多肽的异源核酸。
在一些实施方案中,一种或多种编码NphB多肽的异源核酸包含SEQ ID NO:83所示的核苷酸序列。在一些实施方案中,一种或多种编码NphB多肽的异源核酸包含SEQ ID NO:83所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码NphB多肽的异源核酸包含与SEQ ID NO:83具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
产生橙花基焦磷酸或大麻橙花酸的多肽、包含所述多肽的核酸和表达所述多肽的 基因修饰的宿主细胞
在一些实施方案中,用一种或多种编码橙花基焦磷酸(NPP)合成酶(NPPS)多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞(图11)。NPP和橄榄醇酸可以是产生大麻橙花酸(cannabinerolic acid)(CBNRA)的底物。在一些实施方案中,GOT多肽作用于NPP和橄榄醇酸衍生物(如本文别处所述)以产生CBNRA衍生物。大麻橙花酸或其衍生物可以分别充当CBDAS或THCAS多肽的底物以产生CBDA或THCA或其衍生物。
本文公开的示例性NPPS多肽可以包括NPPS多肽的片段、NPPS多肽的变体、全长NPPS多肽、截短的NPPS多肽或具有NPPS多肽的至少一种活性的融合多肽。
在一些实施方案中,由一种或多种异源核酸编码的NPPS多肽包含SEQ ID NO:70所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的NPPS多肽包含SEQ IDNO:70所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的NPPS多肽包含与SEQ ID NO:70具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的NPPS多肽包含与SEQ ID NO:70具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的NPPS多肽包含与SEQ ID NO:70具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的NPPS多肽包含与SEQ ID NO:70具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
本文公开的示例性NPPS异源核酸可以包括编码NPPS多肽的核酸,所述NPPS多肽例如全长NPPS多肽、NPPS多肽的片段、NPPS多肽的变体、截短的NPPS多肽或具有NPPS多肽的至少一种活性的融合多肽。
在一些实施方案中,NPPS多肽在基因修饰的宿主细胞中过表达。过表达可以通过增加编码NPPS多肽的异源核酸的拷贝数,例如,通过使用高拷贝数表达载体(例如,以每个细胞10-40个拷贝存在的质粒)来实现和/或通过将编码NPPS多肽的异源核酸可操作地连接到强启动子来实现。在一些实施方案中,基因修饰的宿主细胞具有一个拷贝的编码NPPS多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有两个拷贝的编码NPPS多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有三个拷贝的编码NPPS多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有四个拷贝的编码NPPS多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有五个拷贝的编码NPPS多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有六个拷贝的编码NPPS多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有七个拷贝的编码NPPS多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有八个拷贝的编码NPPS多肽的异源核酸。
在一些实施方案中,一种或多种编码NPPS多肽的异源核酸包含SEQ ID NO:69所示的核苷酸序列。在一些实施方案中,一种或多种编码NPPS多肽的异源核酸包含SEQ ID NO:69所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码NPPS多肽的异源核酸包含与SEQ ID NO:69具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码NPPS多肽的异源核酸包含与SEQ ID NO:69具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码NPPS多肽的异源核酸包含与SEQID NO:69具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
由丙酮酸产生乙酰辅酶A的多肽、包含所述多肽的核酸和表达所述多肽的基因修 饰的宿主细胞
在一些实施方案中,用一种或多种编码由丙酮酸产生乙酰辅酶A的多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。由丙酮酸产生乙酰辅酶A的多肽可以包括丙酮酸脱氢酶复合物(PDC)多肽。在一些实施方案中,用一种或多种编码PDC多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。
本文公开的示例性PDC多肽可以包括全长PDC多肽、PDC多肽的片段、PDC多肽的变体、截短的PDC多肽或具有PDC多肽的至少一种活性的融合多肽。
在一些实施方案中,由一种或多种异源核酸编码的PDC多肽包含SEQ ID NO:117所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的PDC多肽包含SEQ IDNO:117所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的PDC多肽包含与SEQ ID NO:117具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的PDC多肽包含与SEQ ID NO:117具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的PDC多肽包含与SEQ ID NO:117具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的PDC多肽包含与SEQ ID NO:117具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
本文公开的示例性PDC异源核酸可以包括编码PDC多肽的核酸,所述PDC多肽例如全长PDC多肽、PDC多肽的片段、PDC多肽的变体、截短的PDC多肽或具有PDC多肽的至少一种活性的融合多肽。
在一些实施方案中,PDC多肽在基因修饰的宿主细胞中过表达。过表达可以通过增加编码PDC多肽的异源核酸的拷贝数,例如,通过使用高拷贝数表达载体(例如,以每个细胞10-40个拷贝存在的质粒)来实现和/或通过将编码PDC多肽的异源核酸可操作地连接到强启动子来实现。在一些实施方案中,基因修饰的宿主细胞具有一个拷贝的编码PDC多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有两个拷贝的编码PDC多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有三个拷贝的编码PDC多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有四个拷贝的编码PDC多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有五个拷贝的编码PDC多肽的异源核酸。
在一些实施方案中,一种或多种编码PDC多肽的异源核酸包含SEQ ID NO:118所示的核苷酸序列。在一些实施方案中,一种或多种编码PDC多肽的异源核酸包含SEQ ID NO:118所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码PDC多肽的异源核酸包含与SEQ ID NO:118具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码PDC多肽的异源核酸包含与SEQ ID NO:118具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码PDC多肽的异源核酸包含与SEQID NO:118具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽、包含所述多肽的核酸和表 达所述多肽的基因修饰的宿主细胞
在一些实施方案中,用一种或多种编码使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽的异源核酸基因修饰宿主细胞。在一些实施方案中,使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽是乙酰乙酰辅酶A硫解酶(ERG10p)多肽。在一些实施方案中,用一种或多种编码乙酰乙酰辅酶A硫解酶多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。
本文公开的示例性乙酰乙酰辅酶A硫解酶多肽可以包括全长乙酰乙酰辅酶A硫解酶多肽、乙酰乙酰辅酶A硫解酶多肽的片段、乙酰乙酰辅酶A硫解酶多肽的变体、截短的乙酰乙酰辅酶A硫解酶多肽或具有乙酰乙酰辅酶A硫解酶多肽的至少一种活性的融合多肽。
在一些实施方案中,由一种或多种异源核酸编码的乙酰乙酰辅酶A硫解酶(ERG10p)多肽包含SEQ ID NO:25所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的乙酰乙酰辅酶A硫解酶(ERG10p)多肽包含SEQ ID NO:25所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的乙酰乙酰辅酶A硫解酶(ERG10p)多肽包含与SEQ ID NO:25具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的乙酰乙酰辅酶A硫解酶(ERG10p)多肽包含与SEQ ID NO:25具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的乙酰乙酰辅酶A硫解酶(ERG10p)多肽包含与SEQ ID NO:25具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的乙酰乙酰辅酶A硫解酶(ERG10p)多肽包含与SEQ ID NO:25具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
本文公开的示例性乙酰乙酰辅酶A硫解酶异源核酸可以包括编码乙酰乙酰辅酶A硫解酶多肽的核酸,所述乙酰乙酰辅酶A硫解酶多肽例如全长乙酰乙酰辅酶A硫解酶多肽、乙酰乙酰辅酶A硫解酶多肽的片段、乙酰乙酰辅酶A硫解酶多肽的变体、截短的乙酰乙酰辅酶A硫解酶多肽或具有乙酰乙酰辅酶A硫解酶多肽的至少一种活性的融合多肽。
在一些实施方案中,乙酰乙酰辅酶A硫解酶多肽在基因修饰的宿主细胞中过表达。过表达可以通过增加编码乙酰乙酰辅酶A硫解酶多肽的异源核酸的拷贝数,例如,通过使用高拷贝数表达载体(例如,以每个细胞10-40个拷贝存在的质粒)来实现和/或通过将编码乙酰乙酰辅酶A硫解酶多肽的异源核酸可操作地连接到强启动子来实现。在一些实施方案中,基因修饰的宿主细胞具有一个拷贝的编码乙酰乙酰辅酶A硫解酶多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有两个拷贝的编码乙酰乙酰辅酶A硫解酶多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有三个拷贝的编码乙酰乙酰辅酶A硫解酶多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有四个拷贝的编码乙酰乙酰辅酶A硫解酶多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有五个拷贝的编码乙酰乙酰辅酶A硫解酶多肽的异源核酸。
在一些实施方案中,一种或多种编码乙酰乙酰辅酶A硫解酶(ERG10p)多肽的异源核酸包含SEQ ID NO:157所示的核苷酸序列。在一些实施方案中,一种或多种编码ERG10p多肽的异源核酸包含SEQ ID NO:157所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码乙酰乙酰辅酶A硫解酶(ERG10p)多肽的异源核酸包含与SEQID NO:157具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码乙酰乙酰辅酶A硫解酶(ERG10p)多肽的异源核酸包含与SEQ ID NO:157具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码乙酰乙酰辅酶A硫解酶(ERG10p)多肽的异源核酸包含与SEQ ID NO:157具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码乙酰乙酰辅酶A硫解酶(ERG10p)多肽的异源核酸包含SEQ ID NO:209所示的核苷酸序列。在一些实施方案中,一种或多种编码ERG10p多肽的异源核酸包含SEQ ID NO:209所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码乙酰乙酰辅酶A硫解酶(ERG10p)多肽的异源核酸包含与SEQID NO:209具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码乙酰乙酰辅酶A硫解酶(ERG10p)多肽的异源核酸包含与SEQ ID NO:209具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码乙酰乙酰辅酶A硫解酶(ERG10p)多肽的异源核酸包含与SEQ ID NO:209具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
甲羟戊酸途径多肽、包含所述多肽的核酸和表达所述多肽的基因修饰的宿主细胞
在一些实施方案中,用一种或多种异源核酸基因修饰本发明的基因修饰的宿主细胞,所述异源核酸编码一种或多种具有在甲羟戊酸(MEV)途径中存在的多肽的至少一种活性的多肽。
在一些实施方案中,一种或多种产生GPP或作为产生GPP的生物合成途径的部分的多肽是一种或多种具有在甲羟戊酸途径中存在的多肽的至少一种活性的多肽。甲羟戊酸途径可以包含催化以下步骤的多肽:(a)使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A(例如,通过乙酰乙酰辅酶A硫解酶多肽的作用);(b)使乙酰乙酰辅酶A与乙酰辅酶A缩合以形成羟甲基戊二酰辅酶A(HMG-辅酶A)(例如,通过HMGS多肽的作用);(c)将HMG-辅酶A转化为甲羟戊酸(例如,通过HMGR多肽的作用);(d)使甲羟戊酸磷酸化为甲羟戊酸5-磷酸(例如,通过MK多肽的作用);(e)将甲羟戊酸5-磷酸转化为甲羟戊酸5-焦磷酸(例如,通过PMK多肽的作用);(f)将甲羟戊酸5-焦磷酸转化为异戊烯基焦磷酸(例如,通过甲羟戊酸焦磷酸脱羧酶(MPD或MVD)多肽的作用);和(g)将异戊烯基焦磷酸转化为二甲基烯丙基焦磷酸(例如,通过异戊烯基焦磷酸异构酶(IDI)多肽的作用)。
在一些实施方案中,用一种或多种编码MEV途径多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码多于一种MEV途径多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码多于两种MEV途径多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码多于三种MEV途径多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码多于四种MEV途径多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码多于五种MEV途径多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码多于六种MEV途径多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码所有MEV途径多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。
在一些实施方案中,用一种或多种编码两种MEV途径多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码三种MEV途径多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码四种MEV途径多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码五种MEV途径多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码六种MEV途径多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码1、2、3、4、5、6种或更多种MEV途径多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码1、2、3、4、5或6种MEV途径多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。
本文公开的示例性MEV途径多肽可以包括全长MEV途径多肽、MEV途径多肽的片段、MEV途径多肽的变体、截短的MEV途径多肽或具有MEV途径多肽的至少一种活性的融合多肽。在一些实施方案中,一种或多种MEV途径多肽选自乙酰乙酰辅酶A硫解酶多肽、HMGS多肽、HMGR多肽、MK多肽、PMK多肽、MVD多肽和IDI多肽。
在一些实施方案中,由一种或多种异源核酸编码的HMGS多肽包含SEQ ID NO:23、SEQ ID NO:24或SEQ ID NO:115所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的HMGS多肽包含SEQ ID NO:23、SEQ ID NO:24或SEQ ID NO:115所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的HMGS多肽包含与SEQ ID NO:23、SEQ ID NO:24或SEQ ID NO:115具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的HMGS多肽是MvaS多肽,并且包含SEQ ID NO:23所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的HMGS多肽是MvaS多肽,并且包含SEQ ID NO:23所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的HMGS多肽是MvaS多肽,并且包含与SEQ ID NO:23具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的HMGS多肽是MvaS多肽,并且包含与SEQ ID NO:23具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的HMGS多肽是MvaS多肽,并且包含与SEQ ID NO:23具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的HMGS多肽是MvaS多肽,并且包含SEQ ID NO:56所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的HMGS多肽是MvaS多肽,并且包含SEQ ID NO:56所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的HMGS多肽是MvaS多肽,并且包含与SEQ ID NO:56具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的HMGS多肽是MvaS多肽,并且包含与SEQ ID NO:56具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的HMGS多肽是MvaS多肽,并且包含与SEQ ID NO:56具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的HMGS多肽是ERG13多肽,并且包含SEQ ID NO:24所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的HMGS多肽是ERG13多肽,并且包含SEQ ID NO:24所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的HMGS多肽是ERG13多肽,并且包含与SEQ ID NO:24具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的HMGS多肽是ERG13多肽,并且包含与SEQ ID NO:24具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的HMGS多肽是ERG13多肽,并且包含与SEQ ID NO:24具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的HMGS多肽是ERG13多肽,并且包含SEQ ID NO:115所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的HMGS多肽是ERG13多肽,并且包含SEQ ID NO:115所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的HMGS多肽是ERG13多肽,并且包含与SEQ ID NO:115具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的HMGS多肽是ERG13多肽,并且包含与SEQ ID NO:115具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的HMGS多肽是ERG13多肽,并且包含与SEQ ID NO:115具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的HMGR多肽是MvaE多肽,并且包含SEQ ID NO:22所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的HMGR多肽是MvaE多肽,并且包含SEQ ID NO:22所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的HMGR多肽是MvaE多肽,并且包含与SEQ ID NO:22具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的HMGR多肽是MvaE多肽,并且包含与SEQ ID NO:22具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的HMGR多肽是MvaE多肽,并且包含与SEQ ID NO:22具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的HMGR多肽是MvaE多肽,并且包含与SEQ ID NO:22具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的HMGR多肽是MvaE多肽,并且包含SEQ ID NO:54所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的HMGR多肽是MvaE多肽,并且包含SEQ ID NO:54所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的HMGR多肽是MvaE多肽,并且包含与SEQ ID NO:54具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的HMGR多肽是MvaE多肽,并且包含与SEQ ID NO:54具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的HMGR多肽是MvaE多肽,并且包含与SEQ ID NO:54具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,HMGR多肽是截短的HMGR(tHMGR)多肽。在一些实施方案中,由一种或多种异源核酸编码的tHMGR多肽包含SEQ ID NO:17、SEQ ID NO:52、SEQ ID NO:113或SEQ ID NO:208所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的tHMGR多肽包含SEQ ID NO:17、SEQ ID NO:52、SEQ ID NO:113或SEQ ID NO:208所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的tHMGR多肽包含与SEQ ID NO:17、SEQ ID NO:52、SEQ ID NO:113或SEQ ID NO:208具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的tHMGR多肽包含SEQ ID NO:17所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的tHMGR多肽包含SEQID NO:17所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的tHMGR多肽包含与SEQ ID NO:17具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的tHMGR多肽包含与SEQ ID NO:17具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的tHMGR多肽包含与SEQ ID NO:17具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的tHMGR多肽包含SEQ ID NO:52所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的tHMGR多肽包含SEQID NO:52所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的tHMGR多肽包含与SEQ ID NO:52具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的tHMGR多肽包含与SEQ ID NO:52具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的tHMGR多肽包含与SEQ ID NO:52具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的tHMGR多肽包含SEQ ID NO:113所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的tHMGR多肽包含SEQID NO:113所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的tHMGR多肽包含与SEQ ID NO:113具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的tHMGR多肽包含与SEQ ID NO:113具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的tHMGR多肽包含与SEQ ID NO:113具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的tHMGR多肽包含SEQ ID NO:208所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的tHMGR多肽包含SEQID NO:208所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的tHMGR多肽包含与SEQ ID NO:208具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的tHMGR多肽包含与SEQ ID NO:208具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的tHMGR多肽包含与SEQ ID NO:208具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的MK(ERG12)多肽包含SEQ IDNO:64所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的MK(ERG12)多肽包含SEQ ID NO:64所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的MK(ERG12)多肽包含与SEQ ID NO:64具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的MK(ERG12)多肽包含与SEQ ID NO:64具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的MK(ERG12)多肽包含与SEQ ID NO:64具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的MK(ERG12)多肽包含与SEQ ID NO:64具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的PMK多肽包含SEQ ID NO:62或SEQ ID NO:205所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的PMK多肽包含SEQ ID NO:62或SEQ ID NO:205所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的PMK多肽包含与SEQ ID NO:62或SEQ IDNO:205具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的PMK多肽包含SEQ ID NO:62所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的PMK多肽包含SEQ IDNO:62所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的PMK多肽包含与SEQ ID NO:62具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的PMK多肽包含与SEQ ID NO:62具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的PMK多肽包含与SEQ ID NO:62具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的PMK多肽是ERG8多肽,并且包含SEQ ID NO:205所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的PMK多肽是ERG8多肽,并且包含SEQ ID NO:205所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的PMK多肽是ERG8多肽,并且包含与SEQ IDNO:205具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的PMK多肽是ERG8多肽,并且包含与SEQ ID NO:205具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的PMK多肽是ERG8多肽,并且包含与SEQ ID NO:205具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,PMK多肽和MK多肽融合成单条多肽链(PMK/MK融合多肽)。在一些实施方案中,由一种或多种异源核酸编码的PMK/MK多肽包含SEQ ID NO:68所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的PMK/MK多肽包含SEQ ID NO:68所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的PMK/MK多肽包含与SEQ ID NO:68具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的PMK/MK多肽包含与SEQ ID NO:68具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的PMK/MK多肽包含与SEQ ID NO:68具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的PMK/MK多肽包含与SEQ ID NO:68具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的MVD多肽是ERG19多肽,并且包含SEQ ID NO:66所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的MVD多肽是ERG19多肽,并且包含SEQ ID NO:66所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的MVD多肽是ERG19多肽,并且包含与SEQID NO:66具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的MVD多肽是ERG19多肽,并且包含与SEQ ID NO:66具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的MVD多肽是ERG19多肽,并且包含与SEQ ID NO:66具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的MVD多肽是ERG19多肽,并且包含与SEQ ID NO:66具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的IDI1多肽包含SEQ ID NO:58所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的IDI1多肽包含SEQ IDNO:58所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的IDI1多肽包含与SEQ ID NO:58具有至少50%、至少55%、至少60%、至少65%、至少70%或至少75%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的IDI1多肽包含与SEQ ID NO:58具有至少80%、至少81%、至少82%、至少83%或至少84%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的IDI1多肽包含与SEQ ID NO:58具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的IDI1多肽包含与SEQ ID NO:58具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
本文公开的示例性MEV途径异源核酸可以包括编码MEV途径多肽的核酸。所述MEV途径多肽例如全长MEV途径多肽、MEV途径多肽的片段、MEV途径多肽的变体、截短的MEV途径多肽或具有作为MEV途径的部分的多肽的至少一种活性的融合多肽。
在一些实施方案中,MEV途径多肽在基因修饰的宿主细胞中过表达。过表达可以通过增加编码MEV途径多肽的异源核酸的拷贝数,例如,通过使用高拷贝数表达载体(例如,以每个细胞10-40个拷贝存在的质粒)来实现和/或通过将编码MEV途径多肽的异源核酸可操作地连接到强启动子来实现。在一些实施方案中,基因修饰的宿主细胞具有一个拷贝的编码MEV途径多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有两个拷贝的编码MEV途径多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有三个拷贝的编码MEV途径多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有四个拷贝的编码MEV途径多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有五个拷贝的编码MEV途径多肽的异源核酸。
在一些实施方案中,一种或多种编码HMGS(mvaS)多肽的异源核酸包含SEQ ID NO:55所示的核苷酸序列。在一些实施方案中,一种或多种编码HMGS(mvaS)多肽的异源核酸包含SEQ ID NO:55所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码HMGS(mvaS)多肽的异源核酸包含与SEQ ID NO:55具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码HMGS(mvaS)多肽的异源核酸包含与SEQ ID NO:55具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码HMGS(ERG13)多肽的异源核酸包含SEQ IDNO:116或SEQ ID NO:120所示的核苷酸序列。在一些实施方案中,一种或多种编码HMGS(ERG13)多肽的异源核酸包含SEQ ID NO:116或SEQ ID NO:120所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码HMGS(ERG13)多肽的异源核酸包含与SEQ ID NO:116或SEQ ID NO:120具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码HMGS(ERG13)多肽的异源核酸包含SEQ IDNO:116所示的核苷酸序列。在一些实施方案中,一种或多种编码HMGS(ERG13)多肽的异源核酸包含SEQ ID NO:116所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码HMGS(ERG13)多肽的异源核酸包含与SEQ ID NO:116具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码HMGS(ERG13)多肽的异源核酸包含与SEQ ID NO:116具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码HMGS(ERG13)多肽的异源核酸包含SEQ IDNO:120所示的核苷酸序列。在一些实施方案中,一种或多种编码HMGS(ERG13)多肽的异源核酸包含SEQ ID NO:120所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码HMGS(ERG13)多肽的异源核酸包含与SEQ ID NO:120具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码HMGS(ERG13)多肽的异源核酸包含与SEQ ID NO:120具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码HMGR(mvaE)多肽的异源核酸包含SEQ ID NO:53所示的核苷酸序列。在一些实施方案中,一种或多种编码HMGR(mvaE)多肽的异源核酸包含SEQ ID NO:53所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码HMGR(mvaE)多肽的异源核酸包含与SEQ ID NO:53具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码HMGR(mvaE)多肽的异源核酸包含与SEQ ID NO:53具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码tHMGR多肽的异源核酸包含SEQ ID NO:51、SEQ ID NO:114或SEQ ID NO:119所示的核苷酸序列。在一些实施方案中,一种或多种编码tHMGR多肽的异源核酸包含SEQ ID NO:51、SEQ ID NO:114或SEQ ID NO:119所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码tHMGR多肽的异源核酸包含与SEQ ID NO:51、SEQ ID NO:114或SEQ ID NO:119具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码tHMGR多肽的异源核酸包含SEQ ID NO:51所示的核苷酸序列。在一些实施方案中,一种或多种编码tHMGR多肽的异源核酸包含SEQ IDNO:51所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码tHMGR多肽的异源核酸包含与SEQ ID NO:51具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码tHMGR多肽的异源核酸包含与SEQ ID NO:51具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码tHMGR多肽的异源核酸包含SEQ ID NO:114所示的核苷酸序列。在一些实施方案中,一种或多种编码tHMGR多肽的异源核酸包含SEQ IDNO:114所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码tHMGR多肽的异源核酸包含与SEQ ID NO:114具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码tHMGR多肽的异源核酸包含与SEQ ID NO:114具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码tHMGR多肽的异源核酸包含SEQ ID NO:119所示的核苷酸序列。在一些实施方案中,一种或多种编码tHMGR多肽的异源核酸包含SEQ IDNO:119所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码tHMGR多肽的异源核酸包含与SEQ ID NO:119具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码tHMGR多肽的异源核酸包含与SEQ ID NO:119具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,用两种或更多种编码tHMGR多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用两种编码tHMGR多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用两种或更多种编码HMGR多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用两种编码HMGR多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。
在一些实施方案中,一种或多种编码MK(ERG12)多肽的异源核酸包含SEQ ID NO:63或SEQ ID NO:206所示的核苷酸序列。在一些实施方案中,一种或多种编码MK(ERG12)多肽的异源核酸包含SEQ ID NO:63或SEQ ID NO:206所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码MK(ERG12)多肽的异源核酸包含与SEQ ID NO:63或SEQ ID NO:206具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码MK(ERG12)多肽的异源核酸包含SEQ ID NO:63所示的核苷酸序列。在一些实施方案中,一种或多种编码MK(ERG12)多肽的异源核酸包含SEQ ID NO:63所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码MK(ERG12)多肽的异源核酸包含与SEQ ID NO:63具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码MK(ERG12)多肽的异源核酸包含与SEQ ID NO:63具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码MK(ERG12)多肽的异源核酸包含SEQ ID NO:206所示的核苷酸序列。在一些实施方案中,一种或多种编码MK(ERG12)多肽的异源核酸包含SEQ ID NO:206所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码MK(ERG12)多肽的异源核酸包含与SEQ ID NO:206具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码MK(ERG12)多肽的异源核酸包含与SEQ ID NO:206具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码PMK(ERG8)多肽的异源核酸包含SEQ ID NO:61、SEQ ID NO:160或SEQ ID NO:204所示的核苷酸序列。在一些实施方案中,一种或多种编码PMK(ERG8)多肽的异源核酸包含SEQ ID NO:61、SEQ ID NO:160或SEQ ID NO:204所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码PMK(ERG8)多肽的异源核酸包含与SEQ ID NO:61、SEQ ID NO:160或SEQ ID NO:204具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码PMK(ERG8)多肽的异源核酸包含SEQ ID NO:61所示的核苷酸序列。在一些实施方案中,一种或多种编码PMK(ERG8)多肽的异源核酸包含SEQ ID NO:61所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码PMK(ERG8)多肽的异源核酸包含与SEQ ID NO:61具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码PMK(ERG8)多肽的异源核酸包含与SEQ ID NO:61具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码PMK(ERG8)多肽的异源核酸包含SEQ ID NO:160所示的核苷酸序列。在一些实施方案中,一种或多种编码PMK(ERG8)多肽的异源核酸包含SEQ ID NO:160所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码PMK(ERG8)多肽的异源核酸包含与SEQ ID NO:160具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码PMK(ERG8)多肽的异源核酸包含与SEQ ID NO:160具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码PMK(ERG8)多肽的异源核酸包含SEQ ID NO:204所示的核苷酸序列。在一些实施方案中,一种或多种编码PMK(ERG8)多肽的异源核酸包含SEQ ID NO:204所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码PMK(ERG8)多肽的异源核酸包含与SEQ ID NO:204具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码PMK(ERG8)多肽的异源核酸包含与SEQ ID NO:204具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码PMK/MK多肽的异源核酸包含SEQ ID NO:67所示的核苷酸序列。在一些实施方案中,一种或多种编码PMK/MK多肽的异源核酸包含SEQ IDNO:67所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码PMK/MK多肽的异源核酸包含与SEQ ID NO:67具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码PMK/MK多肽的异源核酸包含与SEQ ID NO:67具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码PMK/MK多肽的异源核酸包含与SEQ ID NO:67具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码MVD(ERG19)多肽的异源核酸包含SEQ ID NO:65或SEQ ID NO:158所示的核苷酸序列。在一些实施方案中,一种或多种编码MVD(ERG19)多肽的异源核酸包含SEQ ID NO:65或SEQ ID NO:158所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码MVD(ERG19)多肽的异源核酸包含与SEQ IDNO:65或SEQ ID NO:158具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码MVD(ERG19)多肽的异源核酸包含SEQ ID NO:65所示的核苷酸序列。在一些实施方案中,一种或多种编码MVD(ERG19)多肽的异源核酸包含SEQ ID NO:65所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码MVD(ERG19)多肽的异源核酸包含与SEQ ID NO:65具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码MVD(ERG19)多肽的异源核酸包含与SEQ ID NO:65具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码MVD(ERG19)多肽的异源核酸包含SEQ ID NO:158所示的核苷酸序列。在一些实施方案中,一种或多种编码MVD(ERG19)多肽的异源核酸包含SEQ ID NO:158所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码MVD(ERG19)多肽的异源核酸包含与SEQ ID NO:158具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码MVD(ERG19)多肽的异源核酸包含与SEQ ID NO:158具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码IDI1多肽的异源核酸包含SEQ ID NO:57或SEQ ID NO:159所示的核苷酸序列。在一些实施方案中,一种或多种编码IDI1多肽的异源核酸包含SEQ ID NO:57或SEQ ID NO:159所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码IDI1多肽的异源核酸包含与SEQ ID NO:57或SEQ ID NO:159具有至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码IDI1多肽的异源核酸包含SEQ ID NO:57所示的核苷酸序列。在一些实施方案中,一种或多种编码IDI1多肽的异源核酸包含SEQ ID NO:57所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码IDI1多肽的异源核酸包含与SEQ ID NO:57具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码IDI1多肽的异源核酸包含与SEQ ID NO:57具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
在一些实施方案中,一种或多种编码IDI1多肽的异源核酸包含SEQ ID NO:159所示的核苷酸序列。在一些实施方案中,一种或多种编码IDI1多肽的异源核酸包含SEQ IDNO:159所示的核苷酸序列或其密码子简并核苷酸序列。在一些实施方案中,一种或多种编码IDI1多肽的异源核酸包含与SEQ ID NO:159具有至少80%、至少81%、至少82%、至少83%或至少84%的序列同一性的核苷酸序列。在一些实施方案中,一种或多种编码IDI1多肽的异源核酸包含与SEQ ID NO:159具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的序列同一性的核苷酸序列。
调节NADH或NADPH氧化还原平衡的多肽、包含所述多肽的核酸和表达所述多肽的 基因修饰的宿主细胞
在一些实施方案中,用一种或多种编码调节NADH或NADPH氧化还原平衡的多肽的异源核酸基因修饰宿主细胞。GPP产生中存在氧化还原失衡,其可以通过将使用NADPH的酶改变为使用NADH的酶来调节,从而使氧化还原达到更好的平衡。
在一些实施方案中,用一种或多种编码调节NADH或NADPH氧化还原平衡的多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码多于一种调节NADH或NADPH氧化还原平衡的多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码多于两种调节NADH或NADPH氧化还原平衡的多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码多于三种调节NADH或NADPH氧化还原平衡的多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码两种调节NADH或NADPH氧化还原平衡的多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码三种调节NADH或NADPH氧化还原平衡的多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码1、2、3种或更多种调节NADH或NADPH氧化还原平衡的多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码1、2或3种调节NADH或NADPH氧化还原平衡的多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。
本文公开的调节NADH或NADPH氧化还原平衡的示例性多肽可以包括调节NADH或NADPH氧化还原平衡的全长多肽、调节NADH或NADPH氧化还原平衡的多肽的片段、调节NADH或NADPH氧化还原平衡的多肽的变体、调节NADH或NADPH氧化还原平衡的截短的多肽或具有调节NADH或NADPH氧化还原平衡的多肽的至少一种活性的融合多肽。
示例性本文公开的异源核酸可以包括编码调节NADH或NADPH氧化还原平衡的多肽的核酸,所述调节NADH或NADPH氧化还原平衡的多肽例如调节NADH或NADPH氧化还原平衡的全长多肽、调节NADH或NADPH氧化还原平衡的多肽的片段、调节NADH或NADPH氧化还原平衡的多肽的变体、调节NADH或NADPH氧化还原平衡的截短的多肽或具有调节NADH或NADPH氧化还原平衡的多肽的至少一种活性的融合多肽。
在一些实施方案中,调节NADH或NADPH氧化还原平衡的多肽在基因修饰的宿主细胞中过表达。过表达可以通过增加编码调节NADH或NADPH氧化还原平衡的多肽的异源核酸的拷贝数,例如,通过使用高拷贝数表达载体(例如,以每个细胞10-40个拷贝存在的质粒)来实现和/或通过将编码调节NADH或NADPH氧化还原平衡的多肽的异源核酸可操作地连接到强启动子来实现。在一些实施方案中,基因修饰的宿主细胞具有一个拷贝的编码调节NADH或NADPH氧化还原平衡的多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有两个拷贝的编码调节NADH或NADPH氧化还原平衡的多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有三个拷贝的编码调节NADH或NADPH氧化还原平衡的多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有四个拷贝的编码调节NADH或NADPH氧化还原平衡的多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有五个拷贝的编码调节NADH或NADPH氧化还原平衡的多肽的异源核酸。
DXP途径多肽、包含所述多肽的核酸和表达所述多肽的基因修饰的宿主细胞
在一些实施方案中,用一种或多种异源核酸基因修饰本发明的基因修饰的宿主细胞,所述异源核酸编码一种或多种具有在脱氧木酮糖-5-磷酸(DXP)途径中存在的多肽的至少一种活性的多肽。
在一些实施方案中,一种或多种产生GPP或作为产生GPP的生物合成途径的部分的多肽是DXP途径的多肽。如本文所使用的术语“1-脱氧-D-木酮糖5-二磷酸途径”或“DXP途径”可以指通过DXP途径中间体将甘油醛-3-磷酸和丙酮酸转化为IPP和DMAPP的途径。
在DXP途径中,丙酮酸和D-甘油醛-3-磷酸通过一系列反应转化为IPP和DMAPP。该途径涉及以下多肽的作用:1-脱氧-D-木酮糖-5-磷酸合成酶(Dxs)多肽、1-脱氧-D-木酮糖-5-磷酸还原异构酶(IspC)多肽、4-二磷酸胞苷基-2-C-甲基-D-赤藓糖醇合成酶(IspD)多肽、4-二磷酸胞苷基-2-C-甲基-D-赤藓糖醇激酶(IspE)多肽、2C-甲基-D-赤藓糖醇2,4-环二磷酸合成酶(IspF)多肽、1-羟基-2-甲基-2-(E)-丁烯基4-二磷酸合成酶(IspG)多肽和异戊烯基焦磷酸异构酶(IspH)多肽。
在一些实施方案中,用一种或多种编码DXP途径多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码多于一种DXP途径多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码多于两种DXP途径多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码多于三种DXP途径多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码多于四种DXP途径多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码多于五种DXP途径多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码多于六种DXP途径多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码所有DXP途径多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。
在一些实施方案中,用一种或多种编码两种DXP途径多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码三种DXP途径多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码四种DXP途径多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码五种DXP途径多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码六种DXP途径多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码1、2、3、4、5、6种或更多种DXP途径多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。在一些实施方案中,用一种或多种编码1、2、3、4、5或6种DXP途径多肽的异源核酸基因修饰本发明的基因修饰的宿主细胞。
本文公开的作为DXP途径的部分的示例性多肽可以包括全长DXP途径多肽、DXP途径多肽的片段、DXP途径多肽的变体、截短的DXP途径多肽或具有作为DXP途径的部分的多肽的至少一种活性的融合多肽。
DXP途径的多肽的实例如SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34、SEQ IDNO:35、SEQ ID NO:36、SEQ ID NO:37、SEQ ID NO:38、SEQ ID NO:39、SEQ ID NO:40所示。
在一些实施方案中,由一种或多种异源核酸编码的1-脱氧-D-木酮糖-5-磷酸合成酶(Dxs)多肽包含SEQ ID NO:32所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的1-脱氧-D-木酮糖-5-磷酸合成酶(Dxs)多肽包含SEQ ID NO:32所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的1-脱氧-D-木酮糖-5-磷酸合成酶(Dxs)多肽包含与SEQ ID NO:32具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的1-脱氧-D-木酮糖5-磷酸还原异构酶多肽包含SEQ ID NO:33所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的1-脱氧-D-木酮糖5-磷酸还原异构酶多肽包含SEQ ID NO:33所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的1-脱氧-D-木酮糖5-磷酸还原异构酶多肽包含与SEQ ID NO:33具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的2-C-甲基-D-赤藓糖醇4-磷酸胞苷基转移酶多肽包含SEQ ID NO:34所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的2-C-甲基-D-赤藓糖醇4-磷酸胞苷基转移酶多肽包含SEQ ID NO:34所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的2-C-甲基-D-赤藓糖醇4-磷酸胞苷基转移酶多肽包含与SEQ ID NO:34具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的4-二磷酸胞苷基-2-C-甲基赤藓糖醇激酶多肽包含SEQ ID NO:35所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的4-二磷酸胞苷基-2-C-甲基赤藓糖醇激酶多肽包含SEQ ID NO:35所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的4-二磷酸胞苷基-2-C-甲基赤藓糖醇激酶多肽包含与SEQ ID NO:35具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的2C-甲基-D-赤藓糖醇2,4-环二磷酸合成酶多肽包含SEQ ID NO:36所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的2C-甲基-D-赤藓糖醇2,4-环二磷酸合成酶多肽包含SEQ ID NO:36所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的2C-甲基-D-赤藓糖醇2,4-环二磷酸合成酶多肽包含与SEQ ID NO:36具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的4-羟基-3-甲基丁-2-烯-1-基二磷酸合成酶多肽包含SEQ ID NO:37所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的4-羟基-3-甲基丁-2-烯-1-基二磷酸合成酶多肽包含SEQ ID NO:37所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的4-羟基-3-甲基丁-2-烯-1-基二磷酸合成酶多肽包含与SEQ ID NO:37具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的4-羟基-3-甲基丁-2-烯基二磷酸还原酶多肽包含SEQ ID NO:38所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的4-羟基-3-甲基丁-2-烯基二磷酸还原酶多肽包含SEQ ID NO:38所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的4-羟基-3-甲基丁-2-烯基二磷酸还原酶多肽包含与SEQ ID NO:38具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,由一种或多种异源核酸编码的异戊烯基二磷酸(IPP)异构酶多肽包含SEQ ID NO:39所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的异戊烯基二磷酸(IPP)异构酶多肽包含SEQ ID NO:39所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的异戊烯基二磷酸(IPP)异构酶多肽包含与SEQ ID NO:39具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,DXP途径多肽是突变的FPP合成酶多肽。在一些实施方案中,由一种或多种异源核酸编码的突变的FPP合成酶多肽包含SEQ ID NO:40所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的突变的FPP合成酶多肽包含SEQ ID NO:40所示的氨基酸序列或其保守取代的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的突变的FPP合成酶异构酶多肽包含与SEQ ID NO:40具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。
本文公开的示例性DXP途径异源核酸可以包括编码DXP途径多肽的核酸,所示DXP途径多肽例如全长DXP途径多肽、DXP途径多肽的片段、DXP途径多肽的变体、截短的DXP途径多肽或具有作为DXP途径的部分的多肽的至少一种活性的融合多肽。
在一些实施方案中,DXP途径多肽在基因修饰的宿主细胞中过表达。过表达可以通过增加编码DXP途径多肽的异源核酸的拷贝数,例如,通过使用高拷贝数表达载体(例如,以每个细胞10-40个拷贝存在的质粒)来实现和/或通过将编码DXP途径多肽的异源核酸可操作地连接到强启动子来实现。在一些实施方案中,基因修饰的宿主细胞具有一个拷贝的编码DXP途径多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有两个拷贝的编码DXP途径多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有三个拷贝的编码DXP途径多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有四个拷贝的编码DXP途径多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞具有五个拷贝的编码DXP途径多肽的异源核酸。
产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物的基因修饰的宿主 细胞
本发明提供了用于产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物的基因修饰的宿主细胞。为了产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物,可以基因修饰本文公开的基因修饰的宿主细胞以表达或过表达编码一种或多种本文公开的多肽的一种或多种本文公开的异源核酸。在一些实施方案中,本公开的基因修饰的宿主细胞产生大麻素或大麻素衍生物。本发明还提供了被基因修饰以表达或过表达编码一种或多种本文公开的多肽的一种或多种本文公开的异源核酸的基因修饰的宿主细胞。
在一些实施方案中,为了产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物,编码一种或多种本文公开的多肽的一种或多种本文公开的异源核酸在基因修饰的宿主细胞中的表达或过表达可以与编码一种或多种本文公开的多肽的一种或多种本文公开的其他异源核酸在基因修饰的宿主细胞中的表达或过表达组合进行。在某些这样的实施方案中,基因修饰的宿主细胞产生大麻素或大麻素衍生物。
表达GOT多肽的示例性基因修饰的宿主细胞,其中所述GOT多肽可以以比包含SEQID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由香叶基焦磷酸和橄榄醇酸产生大麻萜酚酸
本发明的一些实施方案涉及一种用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞,所述基因修饰的宿主细胞包含一种或多种编码GOT多肽的异源核酸,其中所述GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。
本发明还提供了被基因修饰以表达或过表达一种或多种编码GOT多肽的异源核酸的基因修饰的宿主细胞,其中所述GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。
在一些实施方案中,包含一种或多种编码GOT多肽的异源核酸的基因修饰的宿主细胞还包含一种或多种编码TKS多肽的异源核酸和一种或多种编码OAC多肽的异源核酸,其中所述GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在某些这样的实施方案中,TKS多肽包含与SEQ ID NO:11或SEQ ID NO:76具有至少50%的序列同一性的氨基酸序列,并且OAC多肽包含与SEQ IDNO:10或SEQ ID NO:78具有至少50%的序列同一性的氨基酸序列。
在一些实施方案中,包含一种或多种编码GOT多肽的异源核酸的基因修饰的宿主细胞还包含以下中的一种或多种:a)一种或多种编码产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽的异源核酸;b)一种或多种编码产生GPP的多肽的异源核酸;或c)一种或多种编码产生丙二酰辅酶A的多肽的异源核酸,其中所述GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在某些这样的实施方案中,产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽是酰基活化酶(AAE)多肽。在某些这样的实施方案中,AAE多肽包含与SEQ ID NO:90具有至少50%的序列同一性的氨基酸序列。在一些实施方案中,AAE多肽包含与SEQ ID NO:92或SEQ ID NO:149具有至少50%的序列同一性的氨基酸序列。在一些实施方案中,产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽是脂肪酰辅酶A连接酶多肽。在某些这样的实施方案中,脂肪酰辅酶A连接酶多肽包含与SEQ ID NO:145或SEQ ID NO:147具有至少50%的序列同一性的氨基酸序列。在一些实施方案中,产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽是脂肪酰辅酶A合成酶(FAA)多肽。在某些这样的实施方案中,FAA多肽包含与SEQ IDNO:169、SEQ ID NO:192、SEQ ID NO:194、SEQ ID NO:196、SEQ ID NO:198或SEQ ID NO:200具有至少50%的序列同一性的氨基酸序列。在一些实施方案中,产生GPP的多肽是GPPS多肽。在某些这样的实施方案中,GPPS多肽包含与SEQ ID NO:7、SEQ ID NO:8或SEQ ID NO:60具有至少50%的序列同一性的氨基酸序列。在一些实施方案中,产生丙二酰辅酶A的多肽是ACC多肽。在某些这样的实施方案中,ACC多肽包含与SEQ ID NO:9、SEQ ID NO:97或SEQ IDNO:207具有至少50%的序列同一性的氨基酸序列。
在一些实施方案中,包含一种或多种编码GOT多肽的异源核酸的基因修饰的宿主细胞还包含以下一种或多种:a)一种或多种编码HMGS多肽的异源核酸;b)一种或多种编码3-羟基-3-甲基-戊二酰辅酶A还原酶(HMGR)多肽的异源核酸;c)一种或多种编码MK多肽的异源核酸;d)PMK多肽;e)一种或多种编码MVD多肽的异源核酸;或f)一种或多种编码IDI多肽的异源核酸,其中所述GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在某些这样的实施方案中,基因修饰的宿主细胞还包含一种或多种编码IDI多肽的异源核酸。在某些这样的实施方案中,IDI多肽包含与SEQ ID NO:58具有至少50%的序列同一性的氨基酸序列。在一些实施方案中,基因修饰的宿主细胞还包含一种或多种编码HMGR多肽的异源核酸。在某些这样的实施方案中,HMGR多肽包含与SEQ ID NO:22具有至少50%的序列同一性的氨基酸序列。在一些实施方案中,HMGR多肽是截短的HMGR(tHMGR)多肽。在某些这样的实施方案中,tHMGR多肽包含与SEQ ID NO:17、SEQ ID NO:52、SEQ ID NO:113或SEQ ID NO:208具有至少50%的序列同一性的氨基酸序列。在一些实施方案中,基因修饰的宿主细胞还包含一种或多种编码HMGS多肽的异源核酸。在某些这样的实施方案中,HMGS多肽包含与SEQ ID NO:23、SEQ ID NO:24或SEQ ID NO:115具有至少50%的序列同一性的氨基酸序列。在一些实施方案中,基因修饰的宿主细胞还包含一种或多种编码MK多肽的异源核酸。在某些这样的实施方案中,MK多肽包含与SEQ ID NO:64具有至少50%的序列同一性的氨基酸序列。在一些实施方案中,基因修饰的宿主细胞还包含一种或多种编码PMK多肽的异源核酸。在某些这样的实施方案中,PMK多肽包含与SEQ ID NO:62或SEQ ID NO:205具有至少50%的序列同一性的氨基酸序列。在一些实施方案中,基因修饰的宿主细胞还包含一种或多种编码MVD多肽的异源核酸。在某些这样的实施方案中,MVD多肽包含与SEQ ID NO:66具有至少50%的序列同一性的氨基酸序列。
在一些实施方案中,包含一种或多种编码GOT多肽的异源核酸的基因修饰的宿主细胞还包含一种或多种编码使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽的异源核酸,其中所述GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在某些这样的实施方案中,使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽是乙酰乙酰辅酶A硫解酶多肽。在某些这样的实施方案中,乙酰乙酰辅酶A硫解酶多肽包含与SEQ ID NO:25具有至少50%的序列同一性的氨基酸序列。
在一些实施方案中,包含一种或多种编码GOT多肽的异源核酸的基因修饰的宿主细胞还包含一种或多种编码PDC多肽的异源核酸,其中所述GOT多肽可以以比包含SEQ IDNO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在某些这样的实施方案中,PDC多肽包含与SEQ ID NO:117具有至少50%的序列同一性的氨基酸序列。
在一些实施方案中,包含一种或多种编码GOT多肽的异源核酸的基因修饰的宿主细胞还包含一种或多种编码大麻素合成酶多肽的异源核酸,其中所述GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在某些这样的实施方案中,大麻素合成酶多肽是THCA合成酶多肽。在某些这样的实施方案中,THCA合成酶多肽包含与SEQ ID NO:14、SEQ ID NO:86、SEQ ID NO:104、SEQ IDNO:153或SEQ ID NO:155具有至少50%的序列同一性的氨基酸序列。在一些实施方案中,大麻素合成酶多肽是CBDA合成酶多肽。在某些这样的实施方案中,CBDA合成酶多肽包含与SEQID NO:88或SEQ ID NO:151具有至少50%的序列同一性的氨基酸序列。
表达包含与SEQ ID NO:110具有序列同一性的氨基酸序列的多肽的示例性基因修饰的宿主细胞
本发明的一些实施方案涉及一种用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞,所述基因修饰的宿主细胞包含一种或多种编码GOT多肽的异源核酸,所述GOT多肽包含与SEQ ID NO:110具有至少65%的序列同一性的氨基酸序列。在某些这样的实施方案中,由一种或多种异源核酸编码的GOT多肽包含与SEQ ID NO:110具有至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽包含SEQ ID NO:110所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽包含SEQ ID NO:110所示的氨基酸序列或其保守取代的氨基酸序列。
本发明还提供了被基因修饰以表达或过表达一种或多种编码GOT多肽的异源核酸的基因修饰的宿主细胞,所述GOT多肽包含与SEQ ID NO:110具有至少65%的序列同一性的氨基酸序列。在某些这样的实施方案中,由一种或多种异源核酸编码的GOT多肽包含与SEQID NO:110具有至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽包含SEQ ID NO:110所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽包含SEQID NO:110所示的氨基酸序列或其保守取代的氨基酸序列。
在一些实施方案中,包含一种或多种编码GOT多肽的异源核酸的基因修饰的宿主细胞还包含一种或多种编码TKS多肽的异源核酸和一种或多种编码OAC多肽的异源核酸,所述GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在某些这样的实施方案中,TKS多肽包含与SEQ ID NO:11或SEQ ID NO:76具有至少50%的序列同一性的氨基酸序列,并且OAC多肽包含与SEQ ID NO:10或SEQ ID NO:78具有至少50%的序列同一性的氨基酸序列。
在一些实施方案中,包含一种或多种编码GOT多肽的异源核酸的基因修饰的宿主细胞还包含以下一种或多种:a)一种或多种编码产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽的异源核酸;b)一种或多种编码产生GPP的多肽的异源核酸;或c)一种或多种编码产生丙二酰辅酶A的多肽的异源核酸,所述GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在某些这样的实施方案中,产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽是酰基活化酶(AAE)多肽。在某些这样的实施方案中,AAE多肽包含与SEQ ID NO:90具有至少50%的序列同一性的氨基酸序列。在一些实施方案中,AAE多肽包含与SEQ ID NO:92或SEQ ID NO:149具有至少50%的序列同一性的氨基酸序列。在一些实施方案中,产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽是脂肪酰辅酶A连接酶多肽。在某些这样的实施方案中,脂肪酰辅酶A连接酶多肽包含与SEQID NO:145或SEQ ID NO:147具有至少50%的序列同一性的氨基酸序列。在一些实施方案中,产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽是脂肪酰辅酶A合成酶(FAA)多肽。在某些这样的实施方案中,FAA多肽包含与SEQ ID NO:169、SEQ ID NO:192、SEQ ID NO:194、SEQ ID NO:196、SEQ ID NO:198或SEQ ID NO:200具有至少50%的序列同一性的氨基酸序列。在一些实施方案中,产生GPP的多肽是GPPS多肽。在某些这样的实施方案中,GPPS多肽包含与SEQ ID NO:7、SEQ ID NO:8或SEQ ID NO:60具有至少50%的序列同一性的氨基酸序列。在一些实施方案中,产生丙二酰辅酶A的多肽是ACC多肽。在某些这样的实施方案中,ACC多肽包含与SEQ ID NO:9、SEQ ID NO:97或SEQ ID NO:207具有至少50%的序列同一性的氨基酸序列。
在一些实施方案中,包含一种或多种编码GOT多肽的异源核酸的基因修饰的宿主细胞还包含以下中的一种或多种:a)一种或多种编码HMGS多肽的异源核酸;b)一种或多种编码3-羟基-3-甲基-戊二酰辅酶A还原酶(HMGR)多肽的异源核酸;c)一种或多种编码MK多肽的异源核酸;d)一种或多种编码PMK多肽的异源核酸;e)一种或多种编码MVD多肽的异源核酸;或f)一种或多种编码IDI多肽的异源核酸,所述GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在某些这样的实施方案中,基因修饰的宿主细胞还包含一种或多种编码IDI多肽的异源核酸。在某些这样的实施方案中,IDI多肽包含与SEQ ID NO:58具有至少50%的序列同一性的氨基酸序列。在一些实施方案中,基因修饰的宿主细胞还包含一种或多种编码HMGR多肽的异源核酸。在某些这样的实施方案中,HMGR多肽包含与SEQ ID NO:22具有至少50%的序列同一性的氨基酸序列。在一些实施方案中,HMGR多肽是截短的HMGR(tHMGR)多肽。在某些这样的实施方案中,tHMGR多肽包含与SEQ ID NO:17、SEQ ID NO:52、SEQ ID NO:113或SEQ ID NO:208具有至少50%的序列同一性的氨基酸序列。在一些实施方案中,基因修饰的宿主细胞还包含一种或多种编码HMGS多肽的异源核酸。在某些这样的实施方案中,HMGS多肽包含与SEQ ID NO:23、SEQ ID NO:24或SEQ ID NO:115具有至少50%的序列同一性的氨基酸序列。在一些实施方案中,基因修饰的宿主细胞还包含一种或多种编码MK多肽的异源核酸。在某些这样的实施方案中,MK多肽包含与SEQ ID NO:64具有至少50%的序列同一性的氨基酸序列。在一些实施方案中,基因修饰的宿主细胞还包含一种或多种编码PMK多肽的异源核酸。在某些这样的实施方案中,PMK多肽包含与SEQ ID NO:62或SEQ ID NO:205具有至少50%的序列同一性的氨基酸序列。在一些实施方案中,基因修饰的宿主细胞还包含一种或多种编码MVD多肽的异源核酸。在某些这样的实施方案中,MVD多肽包含与SEQ ID NO:66具有至少50%的序列同一性的氨基酸序列。
在一些实施方案中,包含一种或多种编码GOT多肽的异源核酸的基因修饰的宿主细胞还包含一种或多种编码使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽的异源核酸,所述GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在某些这样的实施方案中,使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽是乙酰乙酰辅酶A硫解酶多肽。在某些这样的实施方案中,乙酰乙酰辅酶A硫解酶多肽包含与SEQ ID NO:25具有至少50%的序列同一性的氨基酸序列。
在一些实施方案中,包含一种或多种编码GOT多肽的异源核酸的基因修饰的宿主细胞还包含一种或多种编码PDC多肽的异源核酸,所述GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在某些这样的实施方案中,PDC多肽包含与SEQ ID NO:117具有至少50%的序列同一性的氨基酸序列。
在一些实施方案中,包含一种或多种编码GOT多肽的异源核酸的基因修饰的宿主细胞还包含一种或多种编码大麻素合成酶多肽的异源核酸,所述GOT多肽包含与SEQ IDNO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在某些这样的实施方案中,大麻素合成酶多肽是THCA合成酶多肽。在某些这样的实施方案中,THCA合成酶多肽包含与SEQ ID NO:14、SEQ ID NO:86、SEQ ID NO:104、SEQ ID NO:153或SEQ ID NO:155具有至少50%的序列同一性的氨基酸序列。在一些实施方案中,大麻素合成酶多肽是CBDA合成酶多肽。在某些这样的实施方案中,CBDA合成酶多肽包含与SEQ ID NO:88或SEQ ID NO:151具有至少50%的序列同一性的氨基酸序列。
表达包含与SEQ ID NO:100具有序列同一性的氨基酸序列的多肽的示例性基因修饰的宿主细胞
本发明提供了一种用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞,所述基因修饰的宿主细胞包含一种或多种编码GOT多肽的异源核酸,所述GOT多肽包含与SEQ IDNO:100具有至少65%的序列同一性的氨基酸序列。在某些这样的实施方案中,由一种或多种异源核酸编码的GOT多肽包含与SEQ ID NO:100具有至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽包含SEQ ID NO:100所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽包含SEQ ID NO:100所示的氨基酸序列或其保守取代的氨基酸序列。
本发明还提供了被基因修饰以表达或过表达一种或多种编码GOT多肽的异源核酸的基因修饰的宿主细胞,所述GOT多肽包含与SEQ ID NO:100具有至少65%的序列同一性的氨基酸序列。在某些这样的实施方案中,由一种或多种异源核酸编码的GOT多肽包含与SEQID NO:100具有至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少99.5%、至少99.6%、至少99.7%、至少99.8%、至少99.9%或100%的氨基酸序列同一性的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽包含SEQ ID NO:100所示的氨基酸序列。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽包含SEQID NO:100所示的氨基酸序列或其保守取代的氨基酸序列。
在一些实施方案中,包含一种或多种编码GOT多肽的异源核酸的基因修饰的宿主细胞还包含一种或多种编码TKS多肽的异源核酸和一种或多种编码OAC多肽的异源核酸,所述GOT多肽包含与SEQ ID NO:100具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在某些这样的实施方案中,TKS多肽包含与SEQ ID NO:11或SEQ ID NO:76具有至少50%的序列同一性的氨基酸序列,并且OAC多肽包含与SEQ ID NO:10或SEQ ID NO:78具有至少50%的序列同一性的氨基酸序列。
在一些实施方案中,包含一种或多种编码GOT多肽的异源核酸的基因修饰的宿主细胞还包含以下中的一种或多种:a)一种或多种编码产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽的异源核酸;b)一种或多种编码产生GPP的多肽的异源核酸;或c)一种或多种编码产生丙二酰辅酶A的多肽的异源核酸,所述GOT多肽包含与SEQ ID NO:100具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在某些这样的实施方案中,产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽是酰基活化酶(AAE)多肽。在某些这样的实施方案中,AAE多肽包含与SEQ ID NO:90具有至少50%的序列同一性的氨基酸序列。在一些实施方案中,AAE多肽包含与SEQ ID NO:92或SEQ ID NO:149具有至少50%的序列同一性的氨基酸序列。在一些实施方案中,产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽是脂肪酰辅酶A连接酶多肽。在某些这样的实施方案中,脂肪酰辅酶A连接酶多肽包含与SEQID NO:145或SEQ ID NO:147具有至少50%的序列同一性的氨基酸序列。在一些实施方案中,产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽是脂肪酰辅酶A合成酶(FAA)多肽。在某些这样的实施方案中,FAA多肽包含与SEQ ID NO:169、SEQ ID NO:192、SEQ ID NO:194、SEQ ID NO:196、SEQ ID NO:198或SEQ ID NO:200具有至少50%的序列同一性的氨基酸序列。在一些实施方案中,产生GPP的多肽是GPPS多肽。在某些这样的实施方案中,GPPS多肽包含与SEQ ID NO:7、SEQ ID NO:8或SEQ ID NO:60具有至少50%的序列同一性的氨基酸序列。在一些实施方案中,产生丙二酰辅酶A的多肽是ACC多肽。在某些这样的实施方案中,ACC多肽包含与SEQ ID NO:9、SEQ ID NO:97或SEQ ID NO:207具有至少50%的序列同一性的氨基酸序列。
在一些实施方案中,包含一种或多种编码GOT多肽的异源核酸的基因修饰的宿主细胞还包含以下中的一种或多种:a)一种或多种编码HMGS多肽的异源核酸;b)一种或多种编码3-羟基-3-甲基-戊二酰辅酶A还原酶(HMGR)多肽的异源核酸;c)一种或多种编码MK多肽的异源核酸;d)一种或多种编码PMK多肽的异源核酸;e)一种或多种编码MVD多肽的异源核酸;或f)一种或多种编码IDI多肽的异源核酸,所述GOT多肽包含与SEQ ID NO:100具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在某些这样的实施方案中,基因修饰的宿主细胞还包含一种或多种编码IDI多肽的异源核酸。在某些这样的实施方案中,IDI多肽包含与SEQ ID NO:58具有至少50%的序列同一性的氨基酸序列。在一些实施方案中,基因修饰的宿主细胞还包含一种或多种编码HMGR多肽的异源核酸。在某些这样的实施方案中,HMGR多肽包含与SEQ ID NO:22具有至少50%的序列同一性的氨基酸序列。在一些实施方案中,HMGR多肽是截短的HMGR(tHMGR)多肽。在某些这样的实施方案中,tHMGR多肽包含与SEQ ID NO:17、SEQ ID NO:52、SEQ ID NO:113或SEQ ID NO:208具有至少50%的序列同一性的氨基酸序列。在一些实施方案中,基因修饰的宿主细胞还包含一种或多种编码HMGS多肽的异源核酸。在某些这样的实施方案中,HMGS多肽包含与SEQ ID NO:23、SEQ ID NO:24或SEQ ID NO:115具有至少50%的序列同一性的氨基酸序列。在一些实施方案中,基因修饰的宿主细胞还包含一种或多种编码MK多肽的异源核酸。在某些这样的实施方案中,MK多肽包含与SEQ ID NO:64具有至少50%的序列同一性的氨基酸序列。在一些实施方案中,基因修饰的宿主细胞还包含一种或多种编码PMK多肽的异源核酸。在某些这样的实施方案中,PMK多肽包含与SEQ ID NO:62或SEQ ID NO:205具有至少50%的序列同一性的氨基酸序列。在一些实施方案中,基因修饰的宿主细胞还包含一种或多种编码MVD多肽的异源核酸。在某些这样的实施方案中,MVD多肽包含与SEQ ID NO:66具有至少50%的序列同一性的氨基酸序列。
在一些实施方案中,包含一种或多种编码GOT多肽的异源核酸的基因修饰的宿主细胞还包含一种或多种编码使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽的异源核酸,所述GOT多肽包含与SEQ ID NO:100具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在某些这样的实施方案中,使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽是乙酰乙酰辅酶A硫解酶多肽。在某些这样的实施方案中,乙酰乙酰辅酶A硫解酶多肽包含与SEQ ID NO:25具有至少50%的序列同一性的氨基酸序列。
在一些实施方案中,包含一种或多种编码GOT多肽的异源核酸的基因修饰的宿主细胞还包含一种或多种编码PDC多肽的异源核酸,所述GOT多肽包含与SEQ ID NO:100具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在某些这样的实施方案中,PDC多肽包含与SEQ ID NO:117具有至少50%的序列同一性的氨基酸序列。
在一些实施方案中,包含一种或多种编码GOT多肽的异源核酸的基因修饰的宿主细胞还包含一种或多种编码大麻素合成酶多肽的异源核酸,所述GOT多肽包含与SEQ IDNO:100具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在某些这样的实施方案中,大麻素合成酶多肽是THCA合成酶多肽。在某些这样的实施方案中,THCA合成酶多肽包含与SEQ ID NO:14、SEQ ID NO:86、SEQ ID NO:104、SEQ ID NO:153或SEQ ID NO:155具有至少50%的序列同一性的氨基酸序列。在一些实施方案中,大麻素合成酶多肽是CBDA合成酶多肽。在某些这样的实施方案中,CBDA合成酶多肽包含与SEQ ID NO:88或SEQ ID NO:151具有至少50%的序列同一性的氨基酸序列。
表达GOT多肽的示例性基因修饰的宿主细胞
本发明提供了产生大麻素或大麻素衍生物的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用以下异源核酸基因修饰:a)一种或多种编码GOT多肽的异源核酸,和b)一种或多种编码THCA合成酶多肽的异源核酸。在某些这样的实施方案中,GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在一些实施方案中,GOT多肽包含与SEQ ID NO:100或SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在某些这样的实施方案中,GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在一些实施方案中,THCA合成酶多肽包含与SEQ ID NO:14、SEQ ID NO:86、SEQ ID NO:104、SEQID NO:153或SEQ ID NO:155具有至少50%的序列同一性的氨基酸序列。
本发明提供了产生大麻素或大麻素衍生物的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用以下异源核酸基因修饰:a)一种或多种编码GOT多肽的异源核酸,和b)一种或多种编码CBDA合成酶多肽的异源核酸。在某些这样的实施方案中,GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在一些实施方案中,GOT多肽包含与SEQ ID NO:100或SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在某些这样的实施方案中,GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在一些实施方案中,CBDA合成酶多肽包含与SEQ ID NO:88或SEQ ID NO:151具有至少50%的序列同一性的氨基酸序列。
本发明提供一种用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用以下异源核酸基因修饰:a)一种或多种编码GOT多肽的异源核酸,和b)一种或多种编码TKS多肽的异源核酸和一种或多种编码OAC多肽的异源核酸。在某些这样的实施方案中,GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在一些实施方案中,GOT多肽包含与SEQ IDNO:100或SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在某些这样的实施方案中,GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在一些实施方案中,TKS多肽包含与SEQ ID NO:11或SEQ IDNO:76具有至少50%的序列同一性的氨基酸序列;OAC多肽包含与SEQ ID NO:10或SEQ IDNO:78具有至少50%的序列同一性的氨基酸序列。
本发明提供一种用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用以下异源核酸基因修饰:a)一种或多种编码GOT多肽的异源核酸,b)一种或多种编码TKS多肽的异源核酸和一种或多种编码OAC多肽的异源核酸,和c)一种或多种编码THCA合成酶多肽的异源核酸。在某些这样的实施方案中,GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在一些实施方案中,GOT多肽包含与SEQ ID NO:100或SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在某些这样的实施方案中,GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在一些实施方案中,TKS多肽包含与SEQ ID NO:11或SEQ ID NO:76具有至少50%的序列同一性的氨基酸序列;OAC多肽包含与SEQ ID NO:10或SEQ ID NO:78具有至少50%的序列同一性的氨基酸序列;THCA合成酶多肽包含与SEQ ID NO:14、SEQ ID NO:86、SEQ ID NO:104、SEQID NO:153或SEQ ID NO:155具有至少50%的序列同一性的氨基酸序列。
本发明提供一种用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用以下异源核酸基因修饰:a)一种或多种编码GOT多肽的异源核酸,b)一种或多种编码TKS多肽的异源核酸和一种或多种编码OAC多肽的异源核酸,和c)一种或多种编码CBDA合成酶多肽的异源核酸。在某些这样的实施方案中,GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在一些实施方案中,GOT多肽包含与SEQ ID NO:100或SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在某些这样的实施方案中,GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在一些实施方案中,TKS多肽包含与SEQ ID NO:11或SEQ ID NO:76具有至少50%的序列同一性的氨基酸序列;OAC多肽包含与SEQ ID NO:10或SEQ ID NO:78具有至少50%的序列同一性的氨基酸序列;CBDA合成酶多肽包含与SEQ ID NO:88或SEQ ID NO:151具有至少50%的序列同一性的氨基酸序列。
本发明提供一种用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用以下异源核酸基因修饰:a)一种或多种编码GOT多肽的异源核酸,和b)一种或多种编码产生GPP的多肽的异源核酸。在某些这样的实施方案中,GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在一些实施方案中,GOT多肽包含与SEQ ID NO:100或SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在某些这样的实施方案中,GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在一些实施方案中,产生GPP的多肽是GPPS多肽,并且包含与SEQ ID NO:7、SEQ ID NO:8或SEQID NO:60具有至少50%的序列同一性的氨基酸序列。
本发明提供一种用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用以下异源核酸基因修饰:a)一种或多种编码GOT多肽的异源核酸,b)一种或多种编码产生GPP的多肽的异源核酸,和c)一种或多种编码THCA合成酶多肽的异源核酸。在某些这样的实施方案中,GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在一些实施方案中,GOT多肽包含与SEQ ID NO:100或SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在某些这样的实施方案中,GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在一些实施方案中,产生GPP的多肽是GPPS多肽,并且包含与SEQ ID NO:7、SEQ ID NO:8或SEQ ID NO:60具有至少50%的序列同一性的氨基酸序列;THCA合成酶多肽包含与SEQ ID NO:14、SEQ ID NO:86、SEQ ID NO:104、SEQ ID NO:153或SEQ ID NO:155具有至少50%的序列同一性的氨基酸序列。
本发明提供一种用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用以下异源核酸基因修饰:a)一种或多种编码GOT多肽的异源核酸,b)一种或多种编码产生GPP的多肽的异源核酸,和c)一种或多种编码CBDA合成酶多肽的异源核酸。在某些这样的实施方案中,GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在一些实施方案中,GOT多肽包含与SEQ ID NO:100或SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在某些这样的实施方案中,GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在一些实施方案中,产生GPP的多肽是GPPS多肽,并且包含与SEQ ID NO:7、SEQ ID NO:8或SEQ ID NO:60具有至少50%的序列同一性的氨基酸序列;CBDA合成酶多肽包含与SEQ ID NO:88或SEQ ID NO:151具有至少50%的序列同一性的氨基酸序列。
本发明提供一种用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用以下异源核酸基因修饰:a)一种或多种编码GOT多肽的异源核酸;b)一种或多种编码产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽的异源核酸;和c)一种或多种编码TKS多肽的异源核酸和一种或多种编码OAC多肽的异源核酸。在某些这样的实施方案中,GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在一些实施方案中,GOT多肽包含与SEQ IDNO:100或SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在某些这样的实施方案中,GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在一些实施方案中,产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽包含与SEQ ID NO:90、SEQ ID NO:92、SEQ ID NO:145、SEQ ID NO:147、SEQID NO:149、SEQ ID NO:169、SEQ ID NO:192、SEQ ID NO:194、SEQ ID NO:196、SEQ ID NO:198或SEQ ID NO:200具有至少50%的序列同一性的氨基酸序列;TKS多肽包含与SEQ IDNO:11或SEQ ID NO:76具有至少50%的序列同一性的氨基酸序列;OAC多肽包含与SEQ IDNO:10或SEQ ID NO:78具有至少50%的序列同一性的氨基酸序列。
本发明提供一种用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用以下异源核酸基因修饰:a)一种或多种编码GOT多肽的异源核酸;b)一种或多种编码产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽的异源核酸;c)一种或多种编码TKS多肽的异源核酸和一种或多种编码OAC多肽的异源核酸;和d)一种或多种编码THCA合成酶多肽的异源核酸。在某些这样的实施方案中,GOT多肽可以以比包含SEQID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在一些实施方案中,GOT多肽包含与SEQ ID NO:100或SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在某些这样的实施方案中,GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在一些实施方案中,产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽包含与SEQ ID NO:90、SEQID NO:92、SEQ ID NO:145、SEQ ID NO:147、SEQ ID NO:149、SEQ ID NO:169、SEQ ID NO:192、SEQ ID NO:194、SEQ ID NO:196、SEQ ID NO:198或SEQ ID NO:200具有至少50%的序列同一性的氨基酸序列;TKS多肽包含与SEQ ID NO:11或SEQ ID NO:76具有至少50%的序列同一性的氨基酸序列;OAC多肽包含与SEQ ID NO:10或SEQ ID NO:78具有至少50%的序列同一性的氨基酸序列;THCA合成酶多肽包含与SEQ ID NO:14、SEQ ID NO:86、SEQ ID NO:104、SEQ ID NO:153或SEQ ID NO:155具有至少50%的序列同一性的氨基酸序列。
本发明提供一种用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用以下异源核酸基因修饰:a)一种或多种编码GOT多肽的异源核酸;b)一种或多种编码产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽的异源核酸;c)一种或多种编码TKS多肽的异源核酸和一种或多种编码OAC多肽的异源核酸;和d)一种或多种编码CBDA合成酶多肽的异源核酸。在某些这样的实施方案中,GOT多肽可以以比包含SEQID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在一些实施方案中,GOT多肽包含与SEQ ID NO:100或SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在某些这样的实施方案中,GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在一些实施方案中,产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽包含与SEQ ID NO:90、SEQID NO:92、SEQ ID NO:145、SEQ ID NO:147、SEQ ID NO:149、SEQ ID NO:169、SEQ ID NO:192、SEQ ID NO:194、SEQ ID NO:196、SEQ ID NO:198或SEQ ID NO:200具有至少50%的序列同一性的氨基酸序列;TKS多肽包含与SEQ ID NO:11或SEQ ID NO:76具有至少50%的序列同一性的氨基酸序列;OAC多肽包含与SEQ ID NO:10或SEQ ID NO:78具有至少50%的序列同一性的氨基酸序列;CBDA合成酶多肽包含与SEQ ID NO:88或SEQ ID NO:151具有至少50%的序列同一性的氨基酸序列。
本发明提供一种用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用以下异源核酸基因修饰:a)一种或多种编码GOT多肽的异源核酸;b)一种或多种编码产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽的异源核酸;c)一种或多种编码TKS多肽的异源核酸和一种或多种编码OAC多肽的异源核酸;和d)一种或多种编码产生丙二酰辅酶A的多肽的异源核酸。在某些这样的实施方案中,GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在一些实施方案中,GOT多肽包含与SEQ ID NO:100或SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在某些这样的实施方案中,GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在一些实施方案中,产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽包含与SEQ ID NO:90、SEQ ID NO:92、SEQ ID NO:145、SEQ ID NO:147、SEQ ID NO:149、SEQ ID NO:169、SEQID NO:192、SEQ ID NO:194、SEQ ID NO:196、SEQ ID NO:198或SEQ ID NO:200具有至少50%的序列同一性的氨基酸序列;TKS多肽包含与SEQ ID NO:11或SEQ ID NO:76具有至少50%的序列同一性的氨基酸序列;OAC多肽包含与SEQ ID NO:10或SEQ ID NO:78具有至少50%的序列同一性的氨基酸序列;产生丙二酰辅酶A的多肽是ACC多肽,并且包含与SEQ IDNO:9、SEQ ID NO:97或SEQ ID NO:207具有至少50%的序列同一性的氨基酸序列。
本发明提供一种用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用以下异源核酸基因修饰:a)一种或多种编码GOT多肽的异源核酸;b)一种或多种编码产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽的异源核酸;c)一种或多种编码TKS多肽的异源核酸和一种或多种编码OAC多肽的异源核酸;d)一种或多种编码产生丙二酰辅酶A的多肽的异源核酸;和e)一种或多种编码THCA合成酶多肽的异源核酸。在某些这样的实施方案中,GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在一些实施方案中,GOT多肽包含与SEQ ID NO:100或SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在某些这样的实施方案中,GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在一些实施方案中,产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽包含与SEQ ID NO:90、SEQ ID NO:92、SEQ ID NO:145、SEQID NO:147、SEQ ID NO:149、SEQ ID NO:169、SEQ ID NO:192、SEQ ID NO:194、SEQ ID NO:196、SEQ ID NO:198或SEQ ID NO:200具有至少50%的序列同一性的氨基酸序列;TKS多肽包含与SEQ ID NO:11或SEQ ID NO:76具有至少50%的序列同一性的氨基酸序列;OAC多肽包含与SEQ ID NO:10或SEQ ID NO:78具有至少50%的序列同一性的氨基酸序列;产生丙二酰辅酶A的多肽是ACC多肽,并且包含与SEQ ID NO:9、SEQ ID NO:97或SEQ ID NO:207具有至少50%的序列同一性的氨基酸序列;THCA合成酶多肽包含与SEQ ID NO:14、SEQ ID NO:86、SEQ ID NO:104、SEQ ID NO:153或SEQ ID NO:155具有至少50%的序列同一性的氨基酸序列。
本发明提供一种用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用以下异源核酸基因修饰:a)一种或多种编码GOT多肽的异源核酸;b)一种或多种编码产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽的异源核酸;c)一种或多种编码TKS多肽的异源核酸和一种或多种编码OAC多肽的异源核酸;d)一种或多种编码产生丙二酰辅酶A的多肽的异源核酸;和e)一种或多种编码CBDA合成酶多肽的异源核酸。在某些这样的实施方案中,GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在一些实施方案中,GOT多肽包含与SEQ ID NO:100或SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在某些这样的实施方案中,GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在一些实施方案中,产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽包含与SEQ ID NO:90、SEQ ID NO:92、SEQ ID NO:145、SEQID NO:147、SEQ ID NO:149、SEQ ID NO:169、SEQ ID NO:192、SEQ ID NO:194、SEQ ID NO:196、SEQ ID NO:198或SEQ ID NO:200具有至少50%的序列同一性的氨基酸序列;TKS多肽包含与SEQ ID NO:11或SEQ ID NO:76具有至少50%的序列同一性的氨基酸序列;OAC多肽包含与SEQ ID NO:10或SEQ ID NO:78具有至少50%的序列同一性的氨基酸序列;产生丙二酰辅酶A的多肽是ACC多肽,并且包含与SEQ ID NO:9、SEQ ID NO:97或SEQ ID NO:207具有至少50%的序列同一性的氨基酸序列;CBDA合成酶多肽包含与SEQ ID NO:88或SEQ ID NO:151具有至少50%的序列同一性的氨基酸序列。
本发明提供一种用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用以下异源核酸基因修饰:a)一种或多种编码GOT多肽的异源核酸;b)一种或多种编码产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽的异源核酸;c)一种或多种编码产生GPP的多肽的异源核酸;和d)一种或多种编码TKS多肽的异源核酸和一种或多种编码OAC多肽的异源核酸。在某些这样的实施方案中,GOT多肽可以以比包含SEQID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在一些实施方案中,GOT多肽包含与SEQ ID NO:100或SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在某些这样的实施方案中,GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在一些实施方案中,产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽包含与SEQ ID NO:90、SEQID NO:92、SEQ ID NO:145、SEQ ID NO:147、SEQ ID NO:149、SEQ ID NO:169、SEQ ID NO:192、SEQ ID NO:194、SEQ ID NO:196、SEQ ID NO:198或SEQ ID NO:200具有至少50%的序列同一性的氨基酸序列;产生GPP的多肽是GPPS多肽,并且包含与SEQ ID NO:7、SEQ ID NO:8或SEQ ID NO:60具有至少50%的序列同一性的氨基酸序列;TKS多肽包含与SEQ ID NO:11或SEQ ID NO:76具有至少50%的序列同一性的氨基酸序列;OAC多肽包含与SEQ ID NO:10或SEQ ID NO:78具有至少50%的序列同一性的氨基酸序列。
本发明提供一种用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用以下异源核酸基因修饰:a)一种或多种编码GOT多肽的异源核酸;b)一种或多种编码产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽的异源核酸;c)一种或多种编码TKS多肽的异源核酸和一种或多种编码OAC多肽的异源核酸;d)一种或多种编码产生GPP的多肽的异源核酸;和e)一种或多种编码THCA合成酶多肽的异源核酸。在某些这样的实施方案中,GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在一些实施方案中,GOT多肽包含与SEQID NO:100或SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在某些这样的实施方案中,GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在一些实施方案中,产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽包含与SEQ ID NO:90、SEQ ID NO:92、SEQ ID NO:145、SEQ ID NO:147、SEQID NO:149、SEQ ID NO:169、SEQ ID NO:192、SEQ ID NO:194、SEQ ID NO:196、SEQ ID NO:198或SEQ ID NO:200具有至少50%的序列同一性的氨基酸序列;TKS多肽包含与SEQ IDNO:11或SEQ ID NO:76具有至少50%的序列同一性的氨基酸序列;OAC多肽包含与SEQ IDNO:10或SEQ ID NO:78具有至少50%的序列同一性的氨基酸序列;产生GPP的多肽是GPPS多肽,并且包含与SEQ ID NO:7、SEQ ID NO:8或SEQ ID NO:60具有至少50%的序列同一性的氨基酸序列;THCA合成酶多肽包含与SEQ ID NO:14、SEQ ID NO:86、SEQ ID NO:104、SEQ IDNO:153或SEQ ID NO:155具有至少50%的序列同一性的氨基酸序列。
本发明提供一种用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用以下异源核酸基因修饰:a)一种或多种编码GOT多肽的异源核酸;b)一种或多种编码产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽的异源核酸;c)一种或多种编码TKS多肽的异源核酸和一种或多种编码OAC多肽的异源核酸;d)一种或多种编码产生GPP的多肽的异源核酸;和e)一种或多种编码CBDA合成酶多肽的异源核酸。在某些这样的实施方案中,GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在一些实施方案中,GOT多肽包含与SEQID NO:100或SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在某些这样的实施方案中,GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在一些实施方案中,产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽包含与SEQ ID NO:90、SEQ ID NO:92、SEQ ID NO:145、SEQ ID NO:147、SEQID NO:149、SEQ ID NO:169、SEQ ID NO:192、SEQ ID NO:194、SEQ ID NO:196、SEQ ID NO:198或SEQ ID NO:200具有至少50%的序列同一性的氨基酸序列;TKS多肽包含与SEQ IDNO:11或SEQ ID NO:76具有至少50%的序列同一性的氨基酸序列;OAC多肽包含与SEQ IDNO:10或SEQ ID NO:78具有至少50%的序列同一性的氨基酸序列;产生GPP的多肽是GPPS多肽,并且包含与SEQ ID NO:7、SEQ ID NO:8或SEQ ID NO:60具有至少50%的序列同一性的氨基酸序列;CBDA合成酶多肽包含与SEQ ID NO:88或SEQ ID NO:151具有至少50%的序列同一性的氨基酸序列。
本发明提供一种用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用以下异源核酸基因修饰:a)一种或多种编码GOT多肽的异源核酸;b)一种或多种编码产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽的异源核酸;c)一种或多种编码TKS多肽的异源核酸和一种或多种编码OAC多肽的异源核酸;d)一种或多种编码产生GPP的多肽的异源核酸;和e)一种或多种编码产生丙二酰辅酶A的多肽的异源核酸。在某些这样的实施方案中,GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在一些实施方案中,GOT多肽包含与SEQ ID NO:100或SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在某些这样的实施方案中,GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在一些实施方案中,产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽包含与SEQ ID NO:90、SEQ ID NO:92、SEQ ID NO:145、SEQID NO:147、SEQ ID NO:149、SEQ ID NO:169、SEQ ID NO:192、SEQ ID NO:194、SEQ ID NO:196、SEQ ID NO:198或SEQ ID NO:200具有至少50%的序列同一性的氨基酸序列;TKS多肽包含与SEQ ID NO:11或SEQ ID NO:76具有至少50%的序列同一性的氨基酸序列;OAC多肽包含与SEQ ID NO:10或SEQ ID NO:78具有至少50%的序列同一性的氨基酸序列;产生GPP的多肽是GPPS多肽,并且包含与SEQ ID NO:7、SEQ ID NO:8或SEQ ID NO:60具有至少50%的序列同一性的氨基酸序列;产生丙二酰辅酶A的多肽是ACC多肽,并且包含与SEQ ID NO:9、SEQ ID NO:97或SEQ ID NO:207具有至少50%的序列同一性的氨基酸序列。
本发明提供一种用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用以下异源核酸基因修饰:a)一种或多种编码GOT多肽的异源核酸;b)一种或多种编码产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽的异源核酸;c)一种或多种编码TKS多肽的异源核酸和一种或多种编码OAC多肽的异源核酸;d)一种或多种编码产生丙二酰辅酶A的多肽的异源核酸;e)一种或多种编码产生GPP的多肽的异源核酸;和f)一种或多种编码THCA合成酶多肽的异源核酸。在某些这样的实施方案中,GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在一些实施方案中,GOT多肽包含与SEQ ID NO:100或SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在某些这样的实施方案中,GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在一些实施方案中,产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽包含与SEQ ID NO:90、SEQ ID NO:92、SEQ ID NO:145、SEQ ID NO:147、SEQ ID NO:149、SEQ ID NO:169、SEQID NO:192、SEQ ID NO:194、SEQ ID NO:196、SEQ ID NO:198或SEQ ID NO:200具有至少50%的序列同一性的氨基酸序列;TKS多肽包含与SEQ ID NO:11或SEQ ID NO:76具有至少50%的序列同一性的氨基酸序列;OAC多肽包含与SEQ ID NO:10或SEQ ID NO:78具有至少50%的序列同一性的氨基酸序列;产生丙二酰辅酶A的多肽是ACC多肽,并且包含与SEQ IDNO:9、SEQ ID NO:97或SEQ ID NO:207具有至少50%的序列同一性的氨基酸序列;产生GPP的多肽是GPPS多肽,并且包含与SEQ ID NO:7、SEQ ID NO:8或SEQ ID NO:60具有至少50%的序列同一性的氨基酸序列;THCA合成酶多肽包含与SEQ ID NO:14、SEQ ID NO:86、SEQ IDNO:104、SEQ ID NO:153或SEQ ID NO:155具有至少50%的序列同一性的氨基酸序列。
本发明提供一种用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用以下异源核酸基因修饰:a)一种或多种编码GOT多肽的异源核酸;b)一种或多种编码产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽的异源核酸;c)一种或多种编码TKS多肽的异源核酸和一种或多种编码OAC多肽的异源核酸;d)一种或多种编码产生丙二酰辅酶A的多肽的异源核酸;e)一种或多种编码产生GPP的多肽的异源核酸;和f)一种或多种编码CBDA合成酶多肽的异源核酸。在某些这样的实施方案中,GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在一些实施方案中,GOT多肽包含与SEQ ID NO:100或SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在某些这样的实施方案中,GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在一些实施方案中,产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽包含与SEQ ID NO:90、SEQ ID NO:92、SEQ ID NO:145、SEQ ID NO:147、SEQ ID NO:149、SEQ ID NO:169、SEQID NO:192、SEQ ID NO:194、SEQ ID NO:196、SEQ ID NO:198或SEQ ID NO:200具有至少50%的序列同一性的氨基酸序列;TKS多肽包含与SEQ ID NO:11或SEQ ID NO:76具有至少50%的序列同一性的氨基酸序列;OAC多肽包含与SEQ ID NO:10或SEQ ID NO:78具有至少50%的序列同一性的氨基酸序列;产生丙二酰辅酶A的多肽是ACC多肽,并且包含与SEQ IDNO:9、SEQ ID NO:97或SEQ ID NO:207具有至少50%的序列同一性的氨基酸序列;产生GPP的多肽是GPPS多肽,并且包含与SEQ ID NO:7、SEQ ID NO:8或SEQ ID NO:60具有至少50%的序列同一性的氨基酸序列;CBDA合成酶多肽包含与SEQ ID NO:88或SEQ ID NO:151具有至少50%的序列同一性的氨基酸序列。
本发明提供一种用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用以下异源核酸基因修饰:a)一种或多种编码GOT多肽的异源核酸;b)一种或多种编码产生GPP的多肽的异源核酸;c)一种或多种编码以下多肽中的一种或多种的异源核酸:HMGS多肽、tHMGR多肽、MK多肽、PMK多肽、MVD多肽或IDI多肽;d)一种或多种编码使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽的异源核酸;和e)一种或多种编码PDC多肽的异源核酸。在某些这样的实施方案中,GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在一些实施方案中,GOT多肽包含与SEQ ID NO:100或SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在某些这样的实施方案中,GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在一些实施方案中,产生GPP的多肽是GPPS多肽,并且包含与SEQ ID NO:7、SEQ ID NO:8或SEQ ID NO:60具有至少50%的序列同一性的氨基酸序列;IDI多肽包含与SEQ ID NO:58具有至少50%的序列同一性的氨基酸序列;tHMGR多肽包含与SEQ ID NO:17、SEQ ID NO:52、SEQ ID NO:113或SEQ ID NO:208具有至少50%的序列同一性的氨基酸序列;HMGS多肽包含与SEQ ID NO:23、SEQ ID NO:24或SEQ ID NO:115具有至少50%的序列同一性的氨基酸序列;MK多肽包含与SEQ ID NO:64具有至少50%的序列同一性的氨基酸序列;PMK多肽包含与SEQ ID NO:62或SEQ ID NO:205具有至少50%的序列同一性的氨基酸序列;MVD多肽包含与SEQ ID NO:66具有至少50%的序列同一性的氨基酸序列;使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽是乙酰乙酰辅酶A硫解酶多肽,并且包含与SEQ ID NO:25具有至少50%的序列同一性的氨基酸序列;PDC多肽包含与SEQ ID NO:117具有至少50%的序列同一性的氨基酸序列。
本发明提供一种用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用以下异源核酸基因修饰:a)一种或多种编码GOT多肽的异源核酸;b)一种或多种编码产生GPP的多肽的异源核酸;c)一种或多种编码THCA合成酶多肽的异源核酸;d)一种或多种编码以下多肽中的一种或多种的异源核酸:HMGS多肽、tHMGR多肽、MK多肽、PMK多肽、MVD多肽或IDI多肽;e)一种或多种编码使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽的异源核酸;和f)一种或多种编码PDC多肽的异源核酸。在某些这样的实施方案中,GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在一些实施方案中,GOT多肽包含与SEQ ID NO:100或SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在某些这样的实施方案中,GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在一些实施方案中,产生GPP的多肽是GPPS多肽,并且包含与SEQ ID NO:7、SEQ ID NO:8或SEQ ID NO:60具有至少50%的序列同一性的氨基酸序列;IDI多肽包含与SEQ ID NO:58具有至少50%的序列同一性的氨基酸序列;tHMGR多肽包含与SEQ ID NO:17、SEQ ID NO:52、SEQ ID NO:113或SEQ ID NO:208具有至少50%的序列同一性的氨基酸序列;HMGS多肽包含与SEQ ID NO:23、SEQ ID NO:24或SEQ ID NO:115具有至少50%的序列同一性的氨基酸序列;MK多肽包含与SEQ ID NO:64具有至少50%的序列同一性的氨基酸序列;PMK多肽包含与SEQ ID NO:62或SEQ ID NO:205具有至少50%的序列同一性的氨基酸序列;MVD多肽包含与SEQ ID NO:66具有至少50%的序列同一性的氨基酸序列;使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽是乙酰乙酰辅酶A硫解酶多肽,并且包含与SEQ IDNO:25具有至少50%的序列同一性的氨基酸序列;PDC多肽包含与SEQ ID NO:117具有至少50%的序列同一性的氨基酸序列;THCA合成酶多肽包含与SEQ ID NO:14、SEQ ID NO:86、SEQ ID NO:104、SEQ ID NO:153或SEQ ID NO:155具有至少50%的序列同一性的氨基酸序列。
本发明提供一种用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用以下异源核酸基因修饰:a)一种或多种编码GOT多肽的异源核酸;b)一种或多种编码产生GPP的多肽的异源核酸;c)一种或多种编码CBDA合成酶多肽的异源核酸;d)一种或多种编码以下多肽中的一种或多种的异源核酸:HMGS多肽、tHMGR多肽、MK多肽、PMK多肽、MVD多肽或IDI多肽;e)一种或多种编码使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽的异源核酸;和f)一种或多种编码PDC多肽的异源核酸。在某些这样的实施方案中,GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在一些实施方案中,GOT多肽包含与SEQ ID NO:100或SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在某些这样的实施方案中,GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在一些实施方案中,产生GPP的多肽是GPPS多肽,并且包含与SEQ ID NO:7、SEQ ID NO:8或SEQ ID NO:60具有至少50%的序列同一性的氨基酸序列;IDI多肽包含与SEQ ID NO:58具有至少50%的序列同一性的氨基酸序列;tHMGR多肽包含与SEQ ID NO:17、SEQ ID NO:52、SEQ ID NO:113或SEQ ID NO:208具有至少50%的序列同一性的氨基酸序列;HMGS多肽包含与SEQ ID NO:23、SEQ ID NO:24或SEQ ID NO:115具有至少50%的序列同一性的氨基酸序列;MK多肽包含与SEQ ID NO:64具有至少50%的序列同一性的氨基酸序列;PMK多肽包含与SEQ ID NO:62或SEQ ID NO:205具有至少50%的序列同一性的氨基酸序列;MVD多肽包含与SEQ ID NO:66具有至少50%的序列同一性的氨基酸序列;使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽是乙酰乙酰辅酶A硫解酶多肽,并且包含与SEQ IDNO:25具有至少50%的序列同一性的氨基酸序列;PDC多肽包含与SEQ ID NO:117具有至少50%的序列同一性的氨基酸序列;CBDA合成酶多肽包含与SEQ ID NO:88或SEQ ID NO:151具有至少50%的序列同一性的氨基酸序列。
本发明提供一种用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用以下异源核酸基因修饰:a)一种或多种编码GOT多肽的异源核酸;b)一种或多种编码产生GPP的多肽的异源核酸;c)一种或多种编码以下多肽中的一种或多种的异源核酸:HMGS多肽、tHMGR多肽、MK多肽、PMK多肽、MVD多肽或IDI多肽;d)一种或多种编码使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽的异源核酸;e)一种或多种编码PDC多肽的异源核酸;和f)一种或多种编码产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽的异源核酸。在某些这样的实施方案中,GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在一些实施方案中,GOT多肽包含与SEQ ID NO:100或SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在某些这样的实施方案中,GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在一些实施方案中,产生GPP的多肽是GPPS多肽,并且包含与SEQ ID NO:7、SEQ ID NO:8或SEQ ID NO:60具有至少50%的序列同一性的氨基酸序列;IDI多肽包含与SEQ ID NO:58具有至少50%的序列同一性的氨基酸序列;tHMGR多肽包含与SEQ ID NO:17、SEQ ID NO:52、SEQ ID NO:113或SEQ ID NO:208具有至少50%的序列同一性的氨基酸序列;HMGS多肽包含与SEQ ID NO:23、SEQ ID NO:24或SEQ ID NO:115具有至少50%的序列同一性的氨基酸序列;MK多肽包含与SEQ ID NO:64具有至少50%的序列同一性的氨基酸序列;PMK多肽包含与SEQ ID NO:62或SEQ ID NO:205具有至少50%的序列同一性的氨基酸序列;MVD多肽包含与SEQ ID NO:66具有至少50%的序列同一性的氨基酸序列;使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽是乙酰乙酰辅酶A硫解酶多肽,并且包含与SEQ ID NO:25具有至少50%的序列同一性的氨基酸序列;产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽包含与SEQ ID NO:90、SEQ IDNO:92、SEQ ID NO:145、SEQ ID NO:147、SEQ ID NO:149、SEQ ID NO:169、SEQ ID NO:192、SEQ ID NO:194、SEQ ID NO:196、SEQ ID NO:198或SEQ ID NO:200具有至少50%的序列同一性的氨基酸序列;PDC多肽包含与SEQ ID NO:117具有至少50%的序列同一性的氨基酸序列。
本发明提供一种用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用以下异源核酸基因修饰:a)一种或多种编码GOT多肽的异源核酸;b)一种或多种编码产生GPP的多肽的异源核酸;c)一种或多种编码THCA合成酶多肽的异源核酸;d)一种或多种编码以下多肽中的一种或多种的异源核酸:HMGS多肽、tHMGR多肽、MK多肽、PMK多肽、MVD多肽或IDI多肽;e)一种或多种编码使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽的异源核酸;f)一种或多种编码PDC多肽的异源核酸;和g)一种或多种编码产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽的异源核酸。在某些这样的实施方案中,GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在一些实施方案中,GOT多肽包含与SEQ ID NO:100或SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在某些这样的实施方案中,GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在一些实施方案中,产生GPP的多肽是GPPS多肽,并且包含与SEQ ID NO:7、SEQ ID NO:8或SEQ ID NO:60具有至少50%的序列同一性的氨基酸序列;IDI多肽包含与SEQ ID NO:58具有至少50%的序列同一性的氨基酸序列;tHMGR多肽包含与SEQ ID NO:17、SEQ ID NO:52、SEQ ID NO:113或SEQ ID NO:208具有至少50%的序列同一性的氨基酸序列;HMGS多肽包含与SEQ ID NO:23、SEQ ID NO:24或SEQ ID NO:115具有至少50%的序列同一性的氨基酸序列;MK多肽包含与SEQ ID NO:64具有至少50%的序列同一性的氨基酸序列;PMK多肽包含与SEQ ID NO:62或SEQ ID NO:205具有至少50%的序列同一性的氨基酸序列;MVD多肽包含与SEQ ID NO:66具有至少50%的序列同一性的氨基酸序列;使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽是乙酰乙酰辅酶A硫解酶多肽,并且包含与SEQ IDNO:25具有至少50%的序列同一性的氨基酸序列;PDC多肽包含与SEQ ID NO:117具有至少50%的序列同一性的氨基酸序列;产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽包含与SEQ ID NO:90、SEQ ID NO:92、SEQ ID NO:145、SEQ ID NO:147、SEQ ID NO:149、SEQID NO:169、SEQ ID NO:192、SEQ ID NO:194、SEQ ID NO:196、SEQ ID NO:198或SEQ ID NO:200具有至少50%的序列同一性的氨基酸序列;THCA合成酶多肽包含与SEQ ID NO:14、SEQID NO:86、SEQ ID NO:104、SEQ ID NO:153或SEQ ID NO:155具有至少50%的序列同一性的氨基酸序列。
本发明提供一种用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用以下异源核酸基因修饰:a)一种或多种编码GOT多肽的异源核酸;b)一种或多种编码产生GPP的多肽的异源核酸;c)一种或多种编码CBDA合成酶多肽的异源核酸;d)一种或多种编码以下多肽中的一种或多种的异源核酸:HMGS多肽、tHMGR多肽、MK多肽、PMK多肽、MVD多肽或IDI多肽;e)一种或多种编码使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽的异源核酸;f)一种或多种编码PDC多肽的异源核酸;和g)一种或多种编码产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽的异源核酸。在某些这样的实施方案中,GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在一些实施方案中,GOT多肽包含与SEQ ID NO:100或SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在某些这样的实施方案中,GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在一些实施方案中,产生GPP的多肽是GPPS多肽,并且包含与SEQ ID NO:7、SEQ ID NO:8或SEQ ID NO:60具有至少50%的序列同一性的氨基酸序列;IDI多肽包含与SEQ ID NO:58具有至少50%的序列同一性的氨基酸序列;tHMGR多肽包含与SEQ ID NO:17、SEQ ID NO:52、SEQ ID NO:113或SEQ ID NO:208具有至少50%的序列同一性的氨基酸序列;HMGS多肽包含与SEQ ID NO:23、SEQ ID NO:24或SEQ ID NO:115具有至少50%的序列同一性的氨基酸序列;MK多肽包含与SEQ ID NO:64具有至少50%的序列同一性的氨基酸序列;PMK多肽包含与SEQ ID NO:62或SEQ ID NO:205具有至少50%的序列同一性的氨基酸序列;MVD多肽包含与SEQ ID NO:66具有至少50%的序列同一性的氨基酸序列;使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽是乙酰乙酰辅酶A硫解酶多肽,并且包含与SEQ IDNO:25具有至少50%的序列同一性的氨基酸序列;PDC多肽包含与SEQ ID NO:117具有至少50%的序列同一性的氨基酸序列;产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽包含与SEQ ID NO:90、SEQ ID NO:92、SEQ ID NO:145、SEQ ID NO:147、SEQ ID NO:149、SEQID NO:169、SEQ ID NO:192、SEQ ID NO:194、SEQ ID NO:196、SEQ ID NO:198或SEQ ID NO:200具有至少50%的序列同一性的氨基酸序列;CBDA合成酶多肽包含与SEQ ID NO:88或SEQID NO:151具有至少50%的序列同一性的氨基酸序列。
本发明提供一种用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用以下异源核酸基因修饰:a)一种或多种编码GOT多肽的异源核酸;b)一种或多种编码产生GPP的多肽的异源核酸;c)一种或多种编码以下多肽中的一种或多种的异源核酸:HMGS多肽、tHMGR多肽、MK多肽、PMK多肽、MVD多肽或IDI多肽;d)一种或多种编码使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽的异源核酸;e)一种或多种编码PDC多肽的异源核酸;f)一种或多种编码TKS多肽的异源核酸和一种或多种编码OAC多肽的异源核酸;和g)一种或多种编码产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽的异源核酸。在某些这样的实施方案中,GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在一些实施方案中,GOT多肽包含与SEQ ID NO:100或SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在某些这样的实施方案中,GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在一些实施方案中,产生GPP的多肽是GPPS多肽,并且包含与SEQ ID NO:7、SEQ ID NO:8或SEQ ID NO:60具有至少50%的序列同一性的氨基酸序列;IDI多肽包含与SEQ ID NO:58具有至少50%的序列同一性的氨基酸序列;tHMGR多肽包含与SEQ ID NO:17、SEQ ID NO:52、SEQ ID NO:113或SEQ ID NO:208具有至少50%的序列同一性的氨基酸序列;HMGS多肽包含与SEQ ID NO:23、SEQ ID NO:24或SEQ ID NO:115具有至少50%的序列同一性的氨基酸序列;MK多肽包含与SEQ ID NO:64具有至少50%的序列同一性的氨基酸序列;PMK多肽包含与SEQ ID NO:62或SEQ ID NO:205具有至少50%的序列同一性的氨基酸序列;MVD多肽包含与SEQ ID NO:66具有至少50%的序列同一性的氨基酸序列;使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽是乙酰乙酰辅酶A硫解酶多肽,并且包含与SEQ ID NO:25具有至少50%的序列同一性的氨基酸序列;产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽包含与SEQ ID NO:90、SEQ ID NO:92、SEQ ID NO:145、SEQ ID NO:147、SEQ ID NO:149、SEQ ID NO:169、SEQ ID NO:192、SEQID NO:194、SEQ ID NO:196、SEQ ID NO:198或SEQ ID NO:200具有至少50%的序列同一性的氨基酸序列;PDC多肽包含与SEQ ID NO:117具有至少50%的序列同一性的氨基酸序列;TKS多肽包含与SEQ ID NO:11或SEQ ID NO:76具有至少50%的序列同一性的氨基酸序列;OAC多肽包含与SEQ ID NO:10或SEQ ID NO:78具有至少50%的序列同一性的氨基酸序列。
本发明提供一种用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用以下异源核酸基因修饰:a)一种或多种编码GOT多肽的异源核酸;b)一种或多种编码产生GPP的多肽的异源核酸;c)一种或多种编码THCA合成酶多肽的异源核酸;d)一种或多种编码以下多肽中的一种或多种的异源核酸:HMGS多肽、tHMGR多肽、MK多肽、PMK多肽、MVD多肽或IDI多肽;e)一种或多种编码使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽的异源核酸;f)一种或多种编码PDC多肽的异源核酸;g)一种或多种编码TKS多肽的异源核酸和一种或多种编码OAC多肽的异源核酸;和h)一种或多种编码产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽的异源核酸。在某些这样的实施方案中,GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在一些实施方案中,GOT多肽包含与SEQ ID NO:100或SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在某些这样的实施方案中,GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在一些实施方案中,产生GPP的多肽是GPPS多肽,并且包含与SEQ ID NO:7、SEQ IDNO:8或SEQ ID NO:60具有至少50%的序列同一性的氨基酸序列;IDI多肽包含与SEQ IDNO:58具有至少50%的序列同一性的氨基酸序列;tHMGR多肽包含与SEQ ID NO:17、SEQ IDNO:52、SEQ ID NO:113或SEQ ID NO:208具有至少50%的序列同一性的氨基酸序列;HMGS多肽包含与SEQ ID NO:23、SEQ ID NO:24或SEQ ID NO:115具有至少50%的序列同一性的氨基酸序列;MK多肽包含与SEQ ID NO:64具有至少50%的序列同一性的氨基酸序列;PMK多肽包含与SEQ ID NO:62或SEQ ID NO:205具有至少50%的序列同一性的氨基酸序列;MVD多肽包含与SEQ ID NO:66具有至少50%的序列同一性的氨基酸序列;使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽是乙酰乙酰辅酶A硫解酶多肽,并且包含与SEQ ID NO:25具有至少50%的序列同一性的氨基酸序列;PDC多肽包含与SEQ ID NO:117具有至少50%的序列同一性的氨基酸序列;产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽包含与SEQID NO:90、SEQ ID NO:92、SEQ ID NO:145、SEQ ID NO:147、SEQ ID NO:149、SEQ ID NO:169、SEQ ID NO:192、SEQ ID NO:194、SEQ ID NO:196、SEQ ID NO:198或SEQ ID NO:200具有至少50%的序列同一性的氨基酸序列;THCA合成酶多肽包含与SEQ ID NO:14、SEQ IDNO:86、SEQ ID NO:104、SEQ ID NO:153或SEQ ID NO:155具有至少50%的序列同一性的氨基酸序列;TKS多肽包含与SEQ ID NO:11或SEQ ID NO:76具有至少50%的序列同一性的氨基酸序列;OAC多肽包含与SEQ ID NO:10或SEQ ID NO:78具有至少50%的序列同一性的氨基酸序列。
本发明提供一种用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用以下异源核酸基因修饰:a)一种或多种编码GOT多肽的异源核酸;b)一种或多种编码产生GPP的多肽的异源核酸;c)一种或多种编码CBDA合成酶多肽的异源核酸;d)一种或多种编码以下多肽中的一种或多种的异源核酸:HMGS多肽、tHMGR多肽、MK多肽、PMK多肽、MVD多肽或IDI多肽;e)一种或多种编码使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽的异源核酸;f)一种或多种编码PDC多肽的异源核酸;g)一种或多种编码TKS多肽的异源核酸和一种或多种编码OAC多肽的异源核酸;和h)一种或多种编码产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽的异源核酸。在某些这样的实施方案中,GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在一些实施方案中,GOT多肽包含与SEQ ID NO:100或SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在某些这样的实施方案中,GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在一些实施方案中,产生GPP的多肽是GPPS多肽,并且包含与SEQ ID NO:7、SEQ IDNO:8或SEQ ID NO:60具有至少50%的序列同一性的氨基酸序列;IDI多肽包含与SEQ IDNO:58具有至少50%的序列同一性的氨基酸序列;tHMGR多肽包含与SEQ ID NO:17、SEQ IDNO:52、SEQ ID NO:113或SEQ ID NO:208具有至少50%的序列同一性的氨基酸序列;HMGS多肽包含与SEQ ID NO:23、SEQ ID NO:24或SEQ ID NO:115具有至少50%的序列同一性的氨基酸序列;MK多肽包含与SEQ ID NO:64具有至少50%的序列同一性的氨基酸序列;PMK多肽包含与SEQ ID NO:62或SEQ ID NO:205具有至少50%的序列同一性的氨基酸序列;MVD多肽包含与SEQ ID NO:66具有至少50%的序列同一性的氨基酸序列;使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽是乙酰乙酰辅酶A硫解酶多肽,并且包含与SEQ ID NO:25具有至少50%的序列同一性的氨基酸序列;PDC多肽包含与SEQ ID NO:117具有至少50%的序列同一性的氨基酸序列;产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽包含与SEQID NO:90、SEQ ID NO:92、SEQ ID NO:145、SEQ ID NO:147、SEQ ID NO:149、SEQ ID NO:169、SEQ ID NO:192、SEQ ID NO:194、SEQ ID NO:196、SEQ ID NO:198或SEQ ID NO:200具有至少50%的序列同一性的氨基酸序列;CBDA合成酶多肽包含与SEQ ID NO:88或SEQ IDNO:151具有至少50%的序列同一性的氨基酸序列;TKS多肽包含与SEQ ID NO:11或SEQ IDNO:76具有至少50%的序列同一性的氨基酸序列;OAC多肽包含与SEQ ID NO:10或SEQ IDNO:78具有至少50%的序列同一性的氨基酸序列。
本发明提供一种用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用以下异源核酸基因修饰:a)一种或多种编码GOT多肽的异源核酸;b)一种或多种编码产生GPP的多肽的异源核酸;c)一种或多种编码以下多肽中的一种或多种的异源核酸:HMGS多肽、tHMGR多肽、MK多肽、PMK多肽、MVD多肽或IDI多肽;d)一种或多种编码使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽的异源核酸;e)一种或多种编码PDC多肽的异源核酸;和f)一种或多种编码TKS多肽的异源核酸和一种或多种编码OAC多肽的异源核酸。在某些这样的实施方案中,GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在一些实施方案中,GOT多肽包含与SEQ ID NO:100或SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在某些这样的实施方案中,GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在一些实施方案中,产生GPP的多肽是GPPS多肽,并且包含与SEQ ID NO:7、SEQ ID NO:8或SEQ ID NO:60具有至少50%的序列同一性的氨基酸序列;IDI多肽包含与SEQ ID NO:58具有至少50%的序列同一性的氨基酸序列;tHMGR多肽包含与SEQ ID NO:17、SEQ ID NO:52、SEQ ID NO:113或SEQ ID NO:208具有至少50%的序列同一性的氨基酸序列;HMGS多肽包含与SEQ ID NO:23、SEQ ID NO:24或SEQ ID NO:115具有至少50%的序列同一性的氨基酸序列;MK多肽包含与SEQ ID NO:64具有至少50%的序列同一性的氨基酸序列;PMK多肽包含与SEQ ID NO:62或SEQ ID NO:205具有至少50%的序列同一性的氨基酸序列;MVD多肽包含与SEQ ID NO:66具有至少50%的序列同一性的氨基酸序列;使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽是乙酰乙酰辅酶A硫解酶多肽,并且包含与SEQ ID NO:25具有至少50%的序列同一性的氨基酸序列;PDC多肽包含与SEQ ID NO:117具有至少50%的序列同一性的氨基酸序列;TKS多肽包含与SEQ ID NO:11或SEQ ID NO:76具有至少50%的序列同一性的氨基酸序列;OAC多肽包含与SEQ ID NO:10或SEQ ID NO:78具有至少50%的序列同一性的氨基酸序列。
本发明提供一种用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用以下异源核酸基因修饰:a)一种或多种编码GOT多肽的异源核酸;b)一种或多种编码产生GPP的多肽的异源核酸;c)一种或多种编码THCA合成酶多肽的异源核酸;d)一种或多种编码以下多肽中的一种或多种的异源核酸:HMGS多肽、tHMGR多肽、MK多肽、PMK多肽、MVD多肽或IDI多肽;e)一种或多种编码使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽的异源核酸;f)PDC多肽;和g)一种或多种编码TKS多肽的异源核酸和一种或多种编码OAC多肽的异源核酸。在某些这样的实施方案中,GOT多肽可以以比包含SEQ IDNO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在一些实施方案中,GOT多肽包含与SEQ ID NO:100或SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在某些这样的实施方案中,GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在一些实施方案中,产生GPP的多肽是GPPS多肽,并且包含与SEQ ID NO:7、SEQ ID NO:8或SEQ ID NO:60具有至少50%的序列同一性的氨基酸序列;IDI多肽包含与SEQ ID NO:58具有至少50%的序列同一性的氨基酸序列;tHMGR多肽包含与SEQ ID NO:17、SEQ ID NO:52、SEQ ID NO:113或SEQID NO:208具有至少50%的序列同一性的氨基酸序列;HMGS多肽包含与SEQ ID NO:23、SEQID NO:24或SEQ ID NO:115具有至少50%的序列同一性的氨基酸序列;MK多肽包含与SEQID NO:64具有至少50%的序列同一性的氨基酸序列;PMK多肽包含与SEQ ID NO:62或SEQID NO:205具有至少50%的序列同一性的氨基酸序列;MVD多肽包含与SEQ ID NO:66具有至少50%的序列同一性的氨基酸序列;使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽是乙酰乙酰辅酶A硫解酶多肽,并且包含与SEQ ID NO:25具有至少50%的序列同一性的氨基酸序列;PDC多肽包含与SEQ ID NO:117具有至少50%的序列同一性的氨基酸序列;THCA合成酶多肽包含与SEQ ID NO:14、SEQ ID NO:86、SEQ ID NO:104、SEQ ID NO:153或SEQ IDNO:155具有至少50%的序列同一性的氨基酸序列;TKS多肽包含与SEQ ID NO:11或SEQ IDNO:76具有至少50%的序列同一性的氨基酸序列;OAC多肽包含与SEQ ID NO:10或SEQ IDNO:78具有至少50%的序列同一性的氨基酸序列。
本发明提供一种用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用以下异源核酸基因修饰:a)一种或多种编码GOT多肽的异源核酸;b)一种或多种编码产生GPP的多肽的异源核酸;c)一种或多种编码CBDA合成酶多肽的异源核酸;d)一种或多种编码以下多肽中的一种或多种的异源核酸:HMGS多肽、tHMGR多肽、MK多肽、PMK多肽、MVD多肽或IDI多肽;e)一种或多种编码使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽的异源核酸;f)一种或多种编码PDC多肽的异源核酸;和g)一种或多种编码TKS多肽的异源核酸和一种或多种编码OAC多肽的异源核酸。在某些这样的实施方案中,GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在一些实施方案中,GOT多肽包含与SEQ ID NO:100或SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在某些这样的实施方案中,GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在一些实施方案中,产生GPP的多肽是GPPS多肽,并且包含与SEQ ID NO:7、SEQID NO:8或SEQ ID NO:60具有至少50%的序列同一性的氨基酸序列;IDI多肽包含与SEQ IDNO:58具有至少50%的序列同一性的氨基酸序列;tHMGR多肽包含与SEQ ID NO:17、SEQ IDNO:52、SEQ ID NO:113或SEQ ID NO:208具有至少50%的序列同一性的氨基酸序列;HMGS多肽包含与SEQ ID NO:23、SEQ ID NO:24或SEQ ID NO:115具有至少50%的序列同一性的氨基酸序列;MK多肽包含与SEQ ID NO:64具有至少50%的序列同一性的氨基酸序列;PMK多肽包含与SEQ ID NO:62或SEQ ID NO:205具有至少50%的序列同一性的氨基酸序列;MVD多肽包含与SEQ ID NO:66具有至少50%的序列同一性的氨基酸序列;使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽是乙酰乙酰辅酶A硫解酶多肽,并且包含与SEQ ID NO:25具有至少50%的序列同一性的氨基酸序列;PDC多肽包含与SEQ ID NO:117具有至少50%的序列同一性的氨基酸序列;CBDA合成酶多肽包含与SEQ ID NO:88或SEQ ID NO:151具有至少50%的序列同一性的氨基酸序列;TKS多肽包含与SEQ ID NO:11或SEQ ID NO:76具有至少50%的序列同一性的氨基酸序列;OAC多肽包含与SEQ ID NO:10或SEQ ID NO:78具有至少50%的序列同一性的氨基酸序列。
本发明提供一种用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用以下异源核酸基因修饰:a)一种或多种编码GOT多肽的异源核酸;b)一种或多种编码产生GPP的多肽的异源核酸;c)一种或多种编码以下多肽中的一种或多种的异源核酸:HMGS多肽、tHMGR多肽、MK多肽、PMK多肽、MVD多肽或IDI多肽;d)一种或多种编码使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽的异源核酸;e)一种或多种编码PDC多肽的异源核酸;f)一种或多种编码TKS多肽的异源核酸和一种或多种编码OAC多肽的异源核酸;g)一种或多种编码产生丙二酰辅酶A的多肽的异源核酸;和h)一种或多种编码产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽的异源核酸。在某些这样的实施方案中,GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在一些实施方案中,GOT多肽包含与SEQ ID NO:100或SEQID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在某些这样的实施方案中,GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在一些实施方案中,产生GPP的多肽是GPPS多肽,并且包含与SEQ ID NO:7、SEQID NO:8或SEQ ID NO:60具有至少50%的序列同一性的氨基酸序列;IDI多肽包含与SEQ IDNO:58具有至少50%的序列同一性的氨基酸序列;tHMGR多肽包含与SEQ ID NO:17、SEQ IDNO:52、SEQ ID NO:113或SEQ ID NO:208具有至少50%的序列同一性的氨基酸序列;HMGS多肽包含与SEQ ID NO:23、SEQ ID NO:24或SEQ ID NO:115具有至少50%的序列同一性的氨基酸序列;MK多肽包含与SEQ ID NO:64具有至少50%的序列同一性的氨基酸序列;PMK多肽包含与SEQ ID NO:62或SEQ ID NO:205具有至少50%的序列同一性的氨基酸序列;MVD多肽包含与SEQ ID NO:66具有至少50%的序列同一性的氨基酸序列;使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽是乙酰乙酰辅酶A硫解酶多肽,并且包含与SEQ ID NO:25具有至少50%的序列同一性的氨基酸序列;产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽包含与SEQ ID NO:90、SEQ ID NO:92、SEQ ID NO:145、SEQ ID NO:147、SEQ ID NO:149、SEQ ID NO:169、SEQ ID NO:192、SEQ ID NO:194、SEQ ID NO:196、SEQ ID NO:198或SEQ ID NO:200具有至少50%的序列同一性的氨基酸序列;PDC多肽包含与SEQ ID NO:117具有至少50%的序列同一性的氨基酸序列;产生丙二酰辅酶A的多肽是ACC多肽,并且包含与SEQ ID NO:9、SEQ ID NO:97或SEQ ID NO:207具有至少50%的序列同一性的氨基酸序列;TKS多肽包含与SEQ ID NO:11或SEQ ID NO:76具有至少50%的序列同一性的氨基酸序列;OAC多肽包含与SEQ ID NO:10或SEQ ID NO:78具有至少50%的序列同一性的氨基酸序列。
本发明提供一种用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用以下异源核酸基因修饰:a)一种或多种编码GOT多肽的异源核酸;b)一种或多种编码产生GPP的多肽的异源核酸;c)一种或多种编码THCA合成酶多肽的异源核酸;d)一种或多种编码以下多肽中的一种或多种的异源核酸:HMGS多肽、tHMGR多肽、MK多肽、PMK多肽、MVD多肽或IDI多肽;e)一种或多种编码使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽的异源核酸;f)一种或多种编码PDC多肽的异源核酸;g)一种或多种编码TKS多肽的异源核酸和一种或多种编码OAC多肽的异源核酸;h)一种或多种编码产生丙二酰辅酶A的多肽的异源核酸;和i)一种或多种编码产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽的异源核酸。在某些这样的实施方案中,GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在一些实施方案中,GOT多肽包含与SEQ ID NO:100或SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在某些这样的实施方案中,GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在一些实施方案中,产生GPP的多肽是GPPS多肽,并且包含与SEQ ID NO:7、SEQ ID NO:8或SEQ ID NO:60具有至少50%的序列同一性的氨基酸序列;IDI多肽包含与SEQ ID NO:58具有至少50%的序列同一性的氨基酸序列;tHMGR多肽包含与SEQ ID NO:17、SEQ ID NO:52、SEQ ID NO:113或SEQ ID NO:208具有至少50%的序列同一性的氨基酸序列;HMGS多肽包含与SEQ ID NO:23、SEQ ID NO:24或SEQ ID NO:115具有至少50%的序列同一性的氨基酸序列;MK多肽包含与SEQ ID NO:64具有至少50%的序列同一性的氨基酸序列;PMK多肽包含与SEQ ID NO:62或SEQ ID NO:205具有至少50%的序列同一性的氨基酸序列;MVD多肽包含与SEQ ID NO:66具有至少50%的序列同一性的氨基酸序列;使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽是乙酰乙酰辅酶A硫解酶多肽,并且包含与SEQ ID NO:25具有至少50%的序列同一性的氨基酸序列;PDC多肽包含与SEQ ID NO:117具有至少50%的序列同一性的氨基酸序列;产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽包含与SEQ ID NO:90、SEQ ID NO:92、SEQ IDNO:145、SEQ ID NO:147、SEQ ID NO:149、SEQ ID NO:169、SEQ ID NO:192、SEQ ID NO:194、SEQ ID NO:196、SEQ ID NO:198或SEQ ID NO:200具有至少50%的序列同一性的氨基酸序列;THCA合成酶多肽包含与SEQ ID NO:14、SEQ ID NO:86、SEQ ID NO:104、SEQ ID NO:153或SEQ ID NO:155具有至少50%的序列同一性的氨基酸序列;产生丙二酰辅酶A的多肽是ACC多肽,并且包含与SEQ ID NO:9、SEQ ID NO:97或SEQ ID NO:207具有至少50%的序列同一性的氨基酸序列;TKS多肽包含与SEQ ID NO:11或SEQ ID NO:76具有至少50%的序列同一性的氨基酸序列;OAC多肽包含与SEQ ID NO:10或SEQ ID NO:78具有至少50%的序列同一性的氨基酸序列。
本发明提供一种用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用以下异源核酸基因修饰:a)一种或多种编码GOT多肽的异源核酸;b)一种或多种编码产生GPP的多肽的异源核酸;c)一种或多种编码CBDA合成酶多肽的异源核酸;d)一种或多种编码以下多肽中的一种或多种的异源核酸:HMGS多肽、tHMGR多肽、MK多肽、PMK多肽、MVD多肽或IDI多肽;e)一种或多种编码使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽的异源核酸;f)一种或多种编码PDC多肽的异源核酸;g)一种或多种编码TKS多肽的异源核酸和一种或多种编码OAC多肽的异源核酸;h)一种或多种编码产生丙二酰辅酶A的多肽的异源核酸;和i)一种或多种编码产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽的异源核酸。在某些这样的实施方案中,GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在一些实施方案中,GOT多肽包含与SEQ ID NO:100或SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在某些这样的实施方案中,GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在一些实施方案中,产生GPP的多肽是GPPS多肽,并且包含与SEQ ID NO:7、SEQ ID NO:8或SEQ ID NO:60具有至少50%的序列同一性的氨基酸序列;IDI多肽包含与SEQ ID NO:58具有至少50%的序列同一性的氨基酸序列;tHMGR多肽包含与SEQ ID NO:17、SEQ ID NO:52、SEQ ID NO:113或SEQ ID NO:208具有至少50%的序列同一性的氨基酸序列;HMGS多肽包含与SEQ ID NO:23、SEQ ID NO:24或SEQ ID NO:115具有至少50%的序列同一性的氨基酸序列;MK多肽包含与SEQ ID NO:64具有至少50%的序列同一性的氨基酸序列;PMK多肽包含与SEQ ID NO:62或SEQ ID NO:205具有至少50%的序列同一性的氨基酸序列;MVD多肽包含与SEQ ID NO:66具有至少50%的序列同一性的氨基酸序列;使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽是乙酰乙酰辅酶A硫解酶多肽,并且包含与SEQ ID NO:25具有至少50%的序列同一性的氨基酸序列;PDC多肽包含与SEQ ID NO:117具有至少50%的序列同一性的氨基酸序列;产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽包含与SEQ ID NO:90、SEQ ID NO:92、SEQ IDNO:145、SEQ ID NO:147、SEQ ID NO:149、SEQ ID NO:169、SEQ ID NO:192、SEQ ID NO:194、SEQ ID NO:196、SEQ ID NO:198或SEQ ID NO:200具有至少50%的序列同一性的氨基酸序列;CBDA合成酶多肽包含与SEQ ID NO:88或SEQ ID NO:151具有至少50%的序列同一性的氨基酸序列;产生丙二酰辅酶A的多肽是ACC多肽,并且包含与SEQ ID NO:9、SEQ ID NO:97或SEQ ID NO:207具有至少50%的序列同一性的氨基酸序列;TKS多肽包含与SEQ ID NO:11或SEQ ID NO:76具有至少50%的序列同一性的氨基酸序列;OAC多肽包含与SEQ ID NO:10或SEQ ID NO:78具有至少50%的序列同一性的氨基酸序列。
本发明提供一种用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用以下异源核酸基因修饰:a)一种或多种编码GOT多肽的异源核酸;b)一种或多种编码产生GPP的多肽的异源核酸;c)一种或多种编码以下多肽中的一种或多种的异源核酸:HMGS多肽、tHMGR多肽、MK多肽、PMK多肽、MVD多肽或IDI多肽;d)一种或多种编码使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽的异源核酸;e)一种或多种编码PDC多肽的异源核酸;f)一种或多种编码产生丙二酰辅酶A的多肽的异源核酸;和g)一种或多种编码TKS多肽的异源核酸和一种或多种编码OAC多肽的异源核酸。在某些这样的实施方案中,GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在一些实施方案中,GOT多肽包含与SEQ ID NO:100或SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在某些这样的实施方案中,GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在一些实施方案中,产生GPP的多肽是GPPS多肽,并且包含与SEQ ID NO:7、SEQ ID NO:8或SEQ ID NO:60具有至少50%的序列同一性的氨基酸序列;IDI多肽包含与SEQ ID NO:58具有至少50%的序列同一性的氨基酸序列;tHMGR多肽包含与SEQ ID NO:17、SEQ ID NO:52、SEQ ID NO:113或SEQ ID NO:208具有至少50%的序列同一性的氨基酸序列;HMGS多肽包含与SEQ ID NO:23、SEQ ID NO:24或SEQ ID NO:115具有至少50%的序列同一性的氨基酸序列;MK多肽包含与SEQ ID NO:64具有至少50%的序列同一性的氨基酸序列;PMK多肽包含与SEQ ID NO:62或SEQ ID NO:205具有至少50%的序列同一性的氨基酸序列;MVD多肽包含与SEQ ID NO:66具有至少50%的序列同一性的氨基酸序列;使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽是乙酰乙酰辅酶A硫解酶多肽,并且包含与SEQ IDNO:25具有至少50%的序列同一性的氨基酸序列;PDC多肽包含与SEQ ID NO:117具有至少50%的序列同一性的氨基酸序列;产生丙二酰辅酶A的多肽是ACC多肽,并且包含与SEQ IDNO:9、SEQ ID NO:97或SEQ ID NO:207具有至少50%的序列同一性的氨基酸序列;TKS多肽包含与SEQ ID NO:11或SEQ ID NO:76具有至少50%的序列同一性的氨基酸序列;OAC多肽包含与SEQ ID NO:10或SEQ ID NO:78具有至少50%的序列同一性的氨基酸序列。
本发明提供一种用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用以下异源核酸基因修饰:a)一种或多种编码GOT多肽的异源核酸;b)一种或多种编码产生GPP的多肽的异源核酸;c)一种或多种编码THCA合成酶多肽的异源核酸;d)一种或多种编码以下多肽中的一种或多种的异源核酸:HMGS多肽、tHMGR多肽、MK多肽、PMK多肽、MVD多肽或IDI多肽;e)一种或多种编码使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽的异源核酸;f)一种或多种编码PDC多肽的异源核酸;g)一种或多种编码产生丙二酰辅酶A的多肽的异源核酸;和h)一种或多种编码TKS多肽的异源核酸和一种或多种编码OAC多肽的异源核酸。在某些这样的实施方案中,GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在一些实施方案中,GOT多肽包含与SEQ ID NO:100或SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在某些这样的实施方案中,GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在一些实施方案中,产生GPP的多肽是GPPS多肽,并且包含与SEQ ID NO:7、SEQ ID NO:8或SEQ ID NO:60具有至少50%的序列同一性的氨基酸序列;IDI多肽包含与SEQ ID NO:58具有至少50%的序列同一性的氨基酸序列;tHMGR多肽包含与SEQ ID NO:17、SEQ ID NO:52、SEQ ID NO:113或SEQID NO:208具有至少50%的序列同一性的氨基酸序列;HMGS多肽包含与SEQ ID NO:23、SEQID NO:24或SEQ ID NO:115具有至少50%的序列同一性的氨基酸序列;MK多肽包含与SEQID NO:64具有至少50%的序列同一性的氨基酸序列;PMK多肽包含与SEQ ID NO:62或SEQID NO:205具有至少50%的序列同一性的氨基酸序列;MVD多肽包含与SEQ ID NO:66具有至少50%的序列同一性的氨基酸序列;使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽是乙酰乙酰辅酶A硫解酶多肽,并且包含与SEQ ID NO:25具有至少50%的序列同一性的氨基酸序列;PDC多肽包含与SEQ ID NO:117具有至少50%的序列同一性的氨基酸序列;THCA合成酶多肽包含与SEQ ID NO:14、SEQ ID NO:86、SEQ ID NO:104、SEQ ID NO:153或SEQ IDNO:155具有至少50%的序列同一性的氨基酸序列;产生丙二酰辅酶A的多肽是ACC多肽,并且包含与SEQ ID NO:9、SEQ ID NO:97或SEQ ID NO:207具有至少50%的序列同一性的氨基酸序列;TKS多肽包含与SEQ ID NO:11或SEQ ID NO:76具有至少50%的序列同一性的氨基酸序列;OAC多肽包含与SEQ ID NO:10或SEQ ID NO:78具有至少50%的序列同一性的氨基酸序列。
本发明提供一种用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用以下异源核酸基因修饰:a)一种或多种编码GOT多肽的异源核酸;b)一种或多种编码产生GPP的多肽的异源核酸;c)一种或多种编码CBDA合成酶多肽的异源核酸;d)一种或多种编码以下多肽中的一种或多种的异源核酸:HMGS多肽、tHMGR多肽、MK多肽、PMK多肽、MVD多肽或IDI多肽;e)一种或多种编码使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽的异源核酸;f)一种或多种编码PDC多肽的异源核酸;g)一种或多种编码产生丙二酰辅酶A的多肽的异源核酸;和h)一种或多种编码TKS多肽的异源核酸和一种或多种编码OAC多肽的异源核酸。在某些这样的实施方案中,GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在一些实施方案中,GOT多肽包含与SEQ ID NO:100或SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在某些这样的实施方案中,GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在一些实施方案中,产生GPP的多肽是GPPS多肽,并且包含与SEQ ID NO:7、SEQ ID NO:8或SEQ ID NO:60具有至少50%的序列同一性的氨基酸序列;IDI多肽包含与SEQ ID NO:58具有至少50%的序列同一性的氨基酸序列;tHMGR多肽包含与SEQ ID NO:17、SEQ ID NO:52、SEQ ID NO:113或SEQID NO:208具有至少50%的序列同一性的氨基酸序列;HMGS多肽包含与SEQ ID NO:23、SEQID NO:24或SEQ ID NO:115具有至少50%的序列同一性的氨基酸序列;MK多肽包含与SEQID NO:64具有至少50%的序列同一性的氨基酸序列;PMK多肽包含与SEQ ID NO:62或SEQID NO:205具有至少50%的序列同一性的氨基酸序列;MVD多肽包含与SEQ ID NO:66具有至少50%的序列同一性的氨基酸序列;使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽是乙酰乙酰辅酶A硫解酶多肽,并且包含与SEQ ID NO:25具有至少50%的序列同一性的氨基酸序列;PDC多肽包含与SEQ ID NO:117具有至少50%的序列同一性的氨基酸序列;CBDA合成酶多肽包含与SEQ ID NO:88或SEQ ID NO:151具有至少50%的序列同一性的氨基酸序列;产生丙二酰辅酶A的多肽是ACC多肽,并且包含与SEQ ID NO:9、SEQ ID NO:97或SEQ IDNO:207具有至少50%的序列同一性的氨基酸序列;TKS多肽包含与SEQ ID NO:11或SEQ IDNO:76具有至少50%的序列同一性的氨基酸序列;OAC多肽包含与SEQ ID NO:10或SEQ IDNO:78具有至少50%的序列同一性的氨基酸序列。
本发明提供一种用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用以下异源核酸基因修饰:a)一种或多种编码产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽的异源核酸;b)一种或多种编码产生GPP的多肽的异源核酸;c)一种或多种编码产生丙二酰辅酶A的多肽的异源核酸;d)一种或多种异源核酸,其编码一种或多种使酰基辅酶A化合物或酰基辅酶A化合物衍生物与丙二酰辅酶A缩合以产生橄榄醇酸或橄榄醇酸的衍生物的多肽;e)一种或多种异源核酸,其编码香叶基焦磷酸:橄榄醇酸转移酶(GOT)多肽或芳族异戊烯基转移酶多肽,如NphB多肽;和f)一种或多种编码大麻素合成酶多肽的异源核酸。
本发明还提供了一种用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用以下异源核酸基因修饰:a)一种或多种编码产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽的异源核酸;b)一种或多种编码产生橙花基焦磷酸(NPP)的多肽的异源核酸;c)一种或多种编码产生丙二酰辅酶A的多肽的异源核酸;d)一种或多种异源核酸,其编码一种或多种使酰基辅酶A化合物或酰基辅酶A化合物衍生物与丙二酰辅酶A缩合以产生橄榄醇酸或橄榄醇酸的衍生物的多肽;e)一种或多种编码GOT多肽或NphB多肽的异源核酸;和f)一种或多种编码大麻素合成酶多肽的异源核酸。在某些这样的实施方案中,在合适的培养基中培养基因修饰的宿主细胞提供了大麻素或大麻素衍生物的可回收的量合成。
本发明提供一种用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用以下异源核酸基因修饰:a)一种或多种编码产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽的异源核酸;b)一种或多种编码TKS/OAC融合多肽的异源核酸;和c)一种或多种编码GOT多肽或NphB多肽的异源核酸。在某些这样的实施方案中,在包含羧酸的培养基中培养基因修饰的宿主细胞提供了大麻素衍生物或大麻素的可回收的量合成。在一些实施方案中,所述基因修饰的宿主细胞用一种或多种编码THCAS或CBDAS多肽的异源核酸进一步基因修饰。在某些这样的实施方案中,在包含羧酸的培养基中培养基因修饰的宿主细胞提供了大麻素衍生物或大麻素的可回收的量的合成。
表达NPPS多肽的示例性基因修饰的宿主细胞
在一些实施方案中,用以下异源核酸基因修饰本发明的基因修饰的宿主细胞:a)一种或多种编码使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽的异源核酸;b)一种或多种编码一种或多种甲羟戊酸途径多肽的异源核酸;和c)一种或多种编码NPPS多肽的异源核酸。
在一些实施方案中,用以下异源核酸基因修饰本发明的基因修饰的宿主细胞:a)一种或多种编码使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽的异源核酸;b)一种或多种编码一种或多种甲羟戊酸途径多肽的异源核酸;c)一种或多种编码NPPS多肽的异源核酸;和d)一种或多种编码TKS多肽的异源核酸和一种或多种编码OAC多肽的异源核酸。
在一些实施方案中,用以下异源核酸基因修饰本发明的基因修饰的宿主细胞:a)一种或多种编码使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽的异源核酸;b)一种或多种编码一种或多种甲羟戊酸途径多肽的异源核酸;c)一种或多种编码NPPS多肽的异源核酸;d)一种或多种编码产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽的异源核酸;和e)一种或多种编码TKS多肽的异源核酸和一种或多种编码OAC多肽的异源核酸。
使用NPP和橄榄醇酸作为底物的GOT多肽可以产生大麻橙花酸(CBNRA)。在一些实施方案中,GOT多肽作用于NPP和橄榄醇酸衍生物(如本文别处所述)以产生CBNRA衍生物。大麻橙花酸或其衍生物可以分别充当CBDAS或THCAS多肽的底物以产生CBDA或THCA或其衍生物。
在一些实施方案中,用以下异源核酸基因修饰本发明的基因修饰的宿主细胞:a)一种或多种编码使一分子乙酰辅酶A和一分子丙二酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽的异源核酸;b)一种或多种编码一种或多种甲羟戊酸途径多肽的异源核酸;c)一种或多种编码NPPS多肽的异源核酸;和d)一种或多种编码GOT多肽的异源核酸。在某些这样的实施方案中,由一种或多种异源核酸编码的GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽包含与SEQ ID NO:100或SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的氨基酸序列同一性的氨基酸序列。在某些这样的实施方案中,由一种或多种异源核酸编码的GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,用以下异源核酸基因修饰本发明的基因修饰的宿主细胞:a)一种或多种编码使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽的异源核酸;b)一种或多种编码一种或多种甲羟戊酸途径多肽的异源核酸;c)一种或多种编码NPPS多肽的异源核酸;和d)一种或多种编码GOT多肽或NphB多肽的异源核酸。在某些这样的实施方案中,由一种或多种异源核酸编码的GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽包含与SEQ ID NO:100或SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的氨基酸序列同一性的氨基酸序列。在某些这样的实施方案中,由一种或多种异源核酸编码的GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,用以下异源核酸基因修饰本发明的基因修饰的宿主细胞:a)一种或多种编码使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽的异源核酸;b)一种或多种编码一种或多种甲羟戊酸途径多肽的异源核酸;c)一种或多种编码NPPS多肽的异源核酸;d)一种或多种编码GOT多肽或NphB多肽的异源核酸;和e)一种或多种编码CBDAS或THCAS多肽的异源核酸。在某些这样的实施方案中,由一种或多种异源核酸编码的GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽包含与SEQID NO:100或SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的氨基酸序列同一性的氨基酸序列。在某些这样的实施方案中,由一种或多种异源核酸编码的GOT多肽包含与SEQ IDNO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,用以下异源核酸基因修饰本发明的基因修饰的宿主细胞:a)一种或多种编码使一分子乙酰辅酶A和一分子丙二酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽的异源核酸;b)一种或多种编码一种或多种甲羟戊酸途径多肽的异源核酸;c)一种或多种编码NPPS多肽的异源核酸;d)一种或多种编码TKS多肽的异源核酸和一种或多种编码OAC多肽的异源核酸;和e)一种或多种编码GOT多肽的异源核酸。在某些这样的实施方案中,由一种或多种异源核酸编码的GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽包含与SEQ ID NO:100或SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的氨基酸序列同一性的氨基酸序列。在某些这样的实施方案中,由一种或多种异源核酸编码的GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,用以下异源核酸基因修饰本发明的基因修饰的宿主细胞:a)一种或多种编码使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽的异源核酸;b)一种或多种编码一种或多种甲羟戊酸途径多肽的异源核酸;c)一种或多种编码NPPS多肽的异源核酸;d)一种或多种编码TKS多肽的异源核酸和一种或多种编码OAC多肽的异源核酸;和e)一种或多种编码GOT多肽或NphB多肽的异源核酸。在某些这样的实施方案中,由一种或多种异源核酸编码的GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽包含与SEQ ID NO:100或SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的氨基酸序列同一性的氨基酸序列。在某些这样的实施方案中,由一种或多种异源核酸编码的GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,用以下异源核酸基因修饰本发明的基因修饰的宿主细胞:a)一种或多种编码使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽的异源核酸;b)一种或多种编码一种或多种甲羟戊酸途径多肽的异源核酸;c)一种或多种编码NPPS多肽的异源核酸;d)一种或多种编码TKS多肽的异源核酸和一种或多种编码OAC多肽的异源核酸;e)一种或多种编码GOT多肽或NphB多肽的异源核酸;和f)一种或多种编码CBDAS或THCAS多肽的异源核酸。在某些这样的实施方案中,由一种或多种异源核酸编码的GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽包含与SEQ ID NO:100或SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的氨基酸序列同一性的氨基酸序列。在某些这样的实施方案中,由一种或多种异源核酸编码的GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,用以下异源核酸基因修饰本发明的基因修饰的宿主细胞:a)一种或多种编码使一分子乙酰辅酶A和一分子丙二酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽的异源核酸;b)一种或多种编码一种或多种甲羟戊酸途径多肽的异源核酸;c)一种或多种编码NPPS多肽的异源核酸;d)一种或多种编码TKS多肽的异源核酸和一种或多种编码OAC多肽的异源核酸;e)一种或多种编码产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽的异源核酸;和f)一种或多种编码GOT多肽的异源核酸。在某些这样的实施方案中,由一种或多种异源核酸编码的GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽包含与SEQ ID NO:100或SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的氨基酸序列同一性的氨基酸序列。在某些这样的实施方案中,由一种或多种异源核酸编码的GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,用以下异源核酸基因修饰本发明的基因修饰的宿主细胞:a)一种或多种编码使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽的异源核酸;b)一种或多种编码一种或多种甲羟戊酸途径多肽的异源核酸;c)一种或多种编码NPPS多肽的异源核酸;d)一种或多种编码TKS多肽的异源核酸和一种或多种编码OAC多肽的异源核酸;e)一种或多种编码产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽的异源核酸;和f)一种或多种编码GOT多肽或NphB多肽的异源核酸。在某些这样的实施方案中,由一种或多种异源核酸编码的GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽包含与SEQ ID NO:100或SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的氨基酸序列同一性的氨基酸序列。在某些这样的实施方案中,由一种或多种异源核酸编码的GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的氨基酸序列同一性的氨基酸序列。
在一些实施方案中,用以下异源核酸基因修饰本发明的基因修饰的宿主细胞:a)一种或多种编码使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽的异源核酸;b)一种或多种编码一种或多种甲羟戊酸途径多肽的异源核酸;c)一种或多种编码NPPS多肽的异源核酸;d)一种或多种编码TKS多肽的异源核酸和一种或多种编码OAC多肽的异源核酸;e)一种或多种编码产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽的异源核酸;f)一种或多种编码GOT多肽或NphB多肽的异源核酸;和g)一种或多种编码CBDAS或THCAS多肽的异源核酸。在某些这样的实施方案中,由一种或多种异源核酸编码的GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在一些实施方案中,由一种或多种异源核酸编码的GOT多肽包含与SEQ ID NO:100或SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的氨基酸序列同一性的氨基酸序列。在某些这样的实施方案中,由一种或多种异源核酸编码的GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的氨基酸序列同一性的氨基酸序列。
用于制备橄榄醇酸或橄榄醇酸衍生物的示例性基因修饰的宿主细胞
本发明提供了用于产生橄榄醇酸或橄榄醇酸衍生物的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用以下异源核酸基因修饰:a)一种或多种编码产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽的异源核酸,和b)一种或多种编码TKS多肽的异源核酸和一种或多种编码OAC多肽的异源核酸。在某些这样的实施方案中,产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽包含与SEQ ID NO:90、SEQ ID NO:92、SEQ ID NO:145、SEQ ID NO:147、SEQ ID NO:149、SEQ ID NO:169、SEQ ID NO:192、SEQ ID NO:194、SEQ IDNO:196、SEQ ID NO:198或SEQ ID NO:200具有至少50%的序列同一性的氨基酸序列;TKS多肽包含与SEQ ID NO:11或SEQ ID NO:76具有至少50%的序列同一性的氨基酸序列;OAC多肽包含与SEQ ID NO:10或SEQ ID NO:78具有至少50%的序列同一性的氨基酸序列。在某些这样的实施方案中,在包含羧酸的培养基中培养本文公开的基因修饰的宿主细胞提供了橄榄醇酸或橄榄醇酸衍生物的可回收的量的合成。
本发明提供了用于产生橄榄醇酸或橄榄醇酸衍生物的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用以下异源核酸基因修饰:a)一种或多种编码产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽的异源核酸;和b)一种或多种编码TKS/OAC融合多肽的异源核酸。在某些这样的实施方案中,在包含羧酸的培养基中培养基因修饰的宿主细胞提供了橄榄醇酸或橄榄醇酸衍生物的可回收的量的合成。
适合的宿主细胞
适合用于产生本发明的基因修饰的宿主细胞的亲本宿主细胞可以包括原核细胞和真核细胞。在一些实施方案中,真核细胞是酵母细胞。在一些实施方案中,真核细胞是植物细胞。
在一些实施方案中,宿主细胞(包括亲本宿主细胞和基因修饰的宿主细胞)是单细胞生物,或作为单个细胞在培养物中生长。在一些实施方案中,宿主细胞是真核细胞。合适的真核宿主细胞可以包括但不限于,酵母细胞、昆虫细胞、植物细胞、真菌细胞和藻类细胞。合适的真核宿主细胞可以包括但不限于,巴斯德毕赤酵母(Pichia pastoris)、芬兰毕赤酵母(Pichia finlandica)、喜海藻糖毕赤酵母(Pichia trehalophila)、库德毕赤酵母(Pichia koclamae)、膜醭毕赤酵母(Pichia membranaefaciens)、仙人掌毕赤酵母(Pichiaopuntiae)、耐热毕赤酵母(Pichia thermotolerans)、柳毕赤酵母(Pichia salictaria)、栎毕赤酵母(Pichia guercuum)、皮杰普毕赤酵母(Pichia pijperi)、树干毕赤酵母(Pichia stiptis)、甲醇毕赤酵母(Pichia methanolica)、毕赤酵母属(Pichia sp.)、酿酒酵母、酵母属(Saccharomyces sp.)、多形汉逊酵母(Hansenula polymorpha)(现在称为安格斯毕赤酵母(Pichia angusta))、克鲁维酵母属(Kluyveromyces sp.)、乳酸克鲁维酵母(Kluyveromyces lactis)、马克斯克鲁维酵母(Kluyveromyces marxianus)、粟酒裂殖酵母(Schizosaccharomyces pombe)、布鲁塞尔德克酵母(Dekkera bruxellensis)、解腺嘌呤阿氏酵母(Arxula adeninivorans)、白色假丝酵母(Candida albicans)、构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)、米曲霉(Aspergillus oryzae)、里氏木霉(Trichoderma reesei)、劳肯诺温斯金孢子菌(Chrysosporium lucknowense)、镰孢菌属(Fusarium sp.)、禾谷镰孢菌(Fusarium gramineum)、毒性镰孢菌(Fusariumvenenatum)、粗糙脉孢菌(Neurospora crassa)、莱茵衣藻(Chlamydomonas reinhardtii)等。在一些实施方案中,宿主细胞是酿酒酵母的蛋白酶缺陷菌株。在一些实施方案中,宿主细胞是除植物细胞以外的真核细胞。在一些实施方案中,真核细胞是植物细胞。在一些实施方案中,真核细胞是植物细胞,其中所述植物细胞不是通常产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物的植物细胞。在一些实施方案中,宿主细胞是酿酒酵母。在一些实施方案中,本文公开的基因修饰的宿主细胞在体外培养。
在一些实施方案中,宿主细胞是原核细胞。合适的原核细胞可以包括但不限于大肠杆菌(Escherichia coli)、乳杆菌属(Lactobacillus sp.)、沙门氏菌属(Salmonellasp.)、志贺氏菌属(Shigella sp.)等各种实验室菌株中的任何一种。参见例如Carrier等人(1992)J.Immunol.148:1176-1181;第6,447,784号美国专利;和Sizemore等人(1995)Science 270:299-302。可以使用的沙门氏菌菌株的实例可以包括但不限于伤寒沙门氏菌(Salmonella typhi)和鼠伤寒沙门氏菌(S.typhimurium)。合适的志贺氏菌菌株可以包括但不限于弗氏志贺氏菌(Shigella flexneri)、索内氏志贺氏菌(Shigella sonnei)和痢疾志贺氏菌(Shigella disenteriae)。通常,实验室菌株是非致病性的。其他合适的细菌的非限制性实例可包括但不限于枯草芽孢杆菌(Bacillus subtilis)、恶臭假单胞菌(Pseudomonas putida)、铜绿假单胞菌(Pseudomonas aeruginosa)、迈氏假单胞菌(Pseudomonas mevalonii)、类球红细菌(Rhodobacter sphaeroides)、荚膜红细菌(Rhodobacter capsulatus)、深红螺菌(Rhodospirillum rubrum)、红球菌属(Rhodococcussp.)等。在一些实施方案中,宿主细胞是大肠杆菌。
宿主细胞的基因修饰
本发明提供了制备用于产生大麻素、大麻素衍生物、大麻素前体衍生物或大麻素前体的基因修饰的宿主细胞的方法,包括向所述基因修饰的宿主细胞中引入一种或多种本文公开的异源核酸。在一些实施方案中,基因修饰的宿主细胞产生大麻素或大麻素衍生物。本发明还提供了用于制备基因修饰的宿主细胞的方法,所述基因修饰的宿主细胞被基因修饰以表达或过表达编码一种或多种本文公开的多肽的一种或多种本文公开的异源核酸,所述方法包括向所述基因修饰的宿主细胞中引入一种或多种本文公开的异源核酸。
在一些实施方案中,本发明提供了制备一种用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞的方法,包括向基因修饰的宿主细胞中引入一种或多种编码GOT多肽的异源核酸,其中所述GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在一些实施方案中,本发明提供了制备基因修饰的宿主细胞的方法,所述基因修饰的宿主细胞被基因修饰以表达或过表达一种或多种编码GOT多肽的异源核酸,其中所述GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸,所述方法包括向基因修饰的宿主细胞中引入一种或多种编码GOT多肽的异源核酸,其中所述GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。
在一些实施方案中,本发明提供了制备一种用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞的方法,包括向基因修饰的宿主细胞中引入一种或多种编码GOT多肽的异源核酸,所述GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在一些实施方案中,本发明提供了制备基因修饰的宿主细胞的方法,所述基因修饰的宿主细胞被基因修饰以表达或过表达一种或多种编码GOT多肽的异源核酸,所述GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列,所述方法包括向基因修饰的宿主细胞中引入一种或多种编码GOT多肽的异源核酸,所述GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。
本发明提供了制备用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞的方法,所述方法包括向基因修饰的宿主细胞中引入一种或多种编码GOT多肽的异源核酸,所述GOT多肽包含与SEQ ID NO:100具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在一些实施方案中,本发明提供了制备基因修饰的宿主细胞的方法,所述基因修饰的宿主细胞被基因修饰以表达或过表达一种或多种编码GOT多肽的异源核酸,所述GOT多肽包含与SEQ ID NO:100具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列,所述方法包括向基因修饰的宿主细胞中引入一种或多种编码GOT多肽的异源核酸,所述GOT多肽包含与SEQ ID NO:100具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。
为了基因修饰亲本宿主细胞以产生本发明的基因修饰的宿主细胞,使用已确立的技术将一种或多种本文公开的异源核酸稳定或瞬时引入宿主细胞中。这样的技术可以包括但不限于,电穿孔、磷酸钙沉淀、DEAE-葡聚糖介导的转染、脂质体介导的转染等。为了稳定转化,异源核酸通常将进一步包括可选择标记,例如几种众所周知的可选择标记中的任何一种,例如新霉素抗性、氨苄青霉素抗性、四环素抗性、氯霉素抗性、卡那霉素抗性等。在一些实施方案中,使用CRISPR/Cas9系统,用一种或多种本文公开的异源核酸修饰亲本宿主细胞,对亲本宿主细胞进行基因修饰以产生本发明的基因修饰的宿主细胞。
一种或多种本文公开的核酸可以存在于表达载体或构建体中。合适的表达载体可以包括但不限于,杆状病毒载体、噬菌体载体、质粒、噬菌粒、粘粒、福斯质粒、细菌人工染色体、病毒载体(例如基于牛痘病毒、脊髓灰质炎病毒、腺病毒、腺相关病毒、SV40、单纯疱疹病毒等的病毒载体)、基于P1的人工染色体、酵母质粒、酵母人工染色体以及对特定目标宿主具有特异性的任何其他载体(例如大肠杆菌和酵母)。因此,例如,一种或多种编码(多种)甲羟戊酸途径基因产物的核酸包含在多种用于表达(多种)甲羟戊酸途径基因产物的表达载体中的任一种中。这样的载体可以包括染色体序列、非染色体序列和合成DNA序列。
许多其他合适的表达载体是本领域技术人员已知的,并且许多是可商购的。通过举例提供以下载体;对于细菌宿主细胞:pQE载体(Qiagen)、pBluescript质粒、pNH载体、λ-ZAP载体(Stratagene);pTrc99a、pKK223-3、pDR540和pRIT2T(Pharmacia);对于真核宿主细胞:pXT1、pSG5(Stratagene)、pSVK3、pBPV、pMSG和pSVLSV40(Pharmacia)。然而,可以使用任何其他质粒或其他载体,只要其与宿主细胞相容即可。
在一些实施方案中,本文公开的核酸中的一种或多种存在于单一表达载体中。在一些实施方案中,本文公开的核酸中的两种或更多种存在于单一表达载体中。在一些实施方案中,本文公开的核酸中的三种或更多种存在于单一表达载体中。在一些实施方案中,本文公开的核酸中的四种或更多种存在于单一表达载体中。在一些实施方案中,本文公开的核酸中的五种或更多种存在于单一表达载体中。在一些实施方案中,本文公开的核酸中的六种或更多种存在于单一表达载体中。在一些实施方案中,本文公开的核酸中的七种或更多种存在于单一表达载体中。
在一些实施方案中,两种或更多种本文公开的核酸在分开的表达载体中。在一些实施方案中,三种或更多种本文公开的核酸在分开的表达载体中。在一些实施方案中,四种或更多种本文公开的核酸在分开的表达载体中。在一些实施方案中,五种或更多种本文公开的核酸在分开的表达载体中。在一些实施方案中,六种或更多种本文公开的核酸在分开的表达载体中。在一些实施方案中,七种或更多种本文公开的核酸在分开的表达载体中。在一些实施方案中,八种或更多种本文公开的核酸在分开的表达载体中。在一些实施方案中,九种或更多种本文公开的核酸在分开的表达载体中。在一些实施方案中,十种或更多种本文公开的核酸在分开的表达载体中。
在一些实施方案中,本文公开的核酸中的一种或多种存在于单一表达构建体中。在一些实施方案中,本文公开的核酸中的两种或更多种存在于单一表达构建体中。在一些实施方案中,本文公开的核酸中的三种或更多种存在于单一表达构建体中。在一些实施方案中,本文公开的核酸中的四种或更多种存在于单一表达构建体中。在一些实施方案中,本文公开的核酸中的五种或更多种存在于单一表达构建体中。在一些实施方案中,本文公开的核酸中的六种或更多种存在于单一表达构建体中。在一些实施方案中,本文公开的核酸中的七种或更多种存在于单一表达构建体中。
在一些实施方案中,两种或更多种本文公开的核酸在分开的表达构建体中。在一些实施方案中,三种或更多种本文公开的核酸在分开的表达构建体中。在一些实施方案中,四种或更多种本文公开的核酸在分开的表达构建体中。在一些实施方案中,五种或更多种本文公开的核酸在分开的表达构建体中。在一些实施方案中,六种或更多种本文公开的核酸在分开的表达构建体中。在一些实施方案中,七种或更多种本文公开的核酸在分开的表达构建体中。在一些实施方案中,八种或更多种本文公开的核酸在分开的表达构建体中。在一些实施方案中,九种或更多种本文公开的核酸在分开的表达构建体中。在一些实施方案中,十种或更多种本文公开的核酸在分开的表达构建体中。
本发明提供了制备用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞的方法,包括向基因修饰的宿主细胞中引入包含一种或多种编码GOT多肽的异源核酸的载体,其中所述GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。本发明提供了制备用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞的方法,包括向基因修饰的宿主细胞中引入包含一种或多种编码GOT多肽的异源核酸的载体,所述GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。本发明还提供了制备用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞的方法,包括向基因修饰的宿主细胞中引入包含一种或多种编码GOT多肽的异源核酸的载体,所述GOT多肽包含与SEQ ID NO:100具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。
本发明还提供了制备用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞的方法,包括向基因修饰的宿主细胞中引入包含CsPT4异源核酸的载体,所述CsPT4异源核酸包含与SEQ ID NO:111具有至少80%的序列同一性的核苷酸序列。本发明还提供了制备用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞的方法,包括向基因修饰的宿主细胞中引入包含CsPT4异源核酸的载体,所述CsPT4异源核酸包含与SEQ ID NO:225具有至少80%的序列同一性的核苷酸序列。本发明还提供了制备用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞的方法,包括向基因修饰的宿主细胞中引入包含CsPT4t异源核酸的载体,所述CsPT4t异源核酸包含与SEQ ID NO:221具有至少80%的序列同一性的核苷酸序列。本发明还提供了制备用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞的方法,包括向基因修饰的宿主细胞中引入包含CsPT4t异源核酸的载体,所述CsPT4t异源核酸与SEQ IDNO:224具有至少80%的序列同一性的核苷酸序列。
本发明提供了制备基因修饰的宿主细胞的方法,所述基因修饰的宿主细胞被基因修饰以表达或过表达一种或多种编码GOT多肽的异源核酸,其中所述GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸,所述方法包括向基因修饰的宿主细胞中引入包含一种或多种编码GOT多肽的异源核酸的载体,其中所述GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。本发明提供了制备基因修饰的宿主细胞的方法,所述基因修饰的宿主细胞被基因修饰以表达或过表达一种或多种编码GOT多肽的异源核酸,所述GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列,所述方法包括向基因修饰的宿主细胞中引入包含一种或多种编码GOT多肽的异源核酸的载体,所述GOT多肽包含与SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。本发明提供了制备基因修饰的宿主细胞的方法,所述基因修饰的宿主细胞被基因修饰以表达或过表达一种或多种编码GOT多肽的异源核酸,所述GOT多肽包含与SEQ ID NO:100具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列,所述方法包括向基因修饰的宿主细胞中引入包含一种或多种编码GOT多肽的异源核酸的载体,所述GOT多肽包含与SEQ ID NO:100具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。
本发明还提供了制备基因修饰的宿主细胞的方法,所述基因修饰的宿主细胞被基因修饰以表达或过表达CsPT4异源核酸,所述CsPT4异源核酸包含与SEQ ID NO:111具有至少80%的序列同一性的核苷酸序列,所述方法包括向基因修饰的宿主细胞中引入包含CsPT4异源核酸的载体,所述CsPT4异源核酸包含与SEQ ID NO:111具有至少80%的序列同一性的核苷酸序列。本发明还提供了制备基因修饰的宿主细胞的方法,所述基因修饰的宿主细胞被基因修饰以表达或过表达CsPT4异源核酸,所述CsPT4异源核酸包含与SEQ ID NO:225具有至少80%的序列同一性的核苷酸序列,所述方法包括向基因修饰的宿主细胞中引入包含CsPT4异源核酸的载体,所述CsPT4异源核酸包含与SEQ ID NO:225具有至少80%的序列同一性的核苷酸序列。本发明还提供了制备基因修饰的宿主细胞的方法,所述基因修饰的宿主细胞被基因修饰以表达或过表达CsPT4t异源核酸,所述CsPT4t异源核酸包含与SEQ ID NO:221具有至少80%的序列同一性的核苷酸序列,所述方法包括向基因修饰的宿主细胞中引入包含CsPT4t异源核酸的载体,所述CsPT4t异源核酸包含与SEQ ID NO:221具有至少80%的序列同一性的核苷酸序列。本发明还提供了制备基因修饰的宿主细胞的方法,所述基因修饰的宿主细胞被基因修饰以表达或过表达CsPT4t异源核酸,所述CsPT4t异源核酸包含与SEQ ID NO:224具有至少80%的序列同一性的核苷酸序列,所述方法包括向基因修饰的宿主细胞中引入包含CsPT4t异源核酸的载体,所述CsPT4t异源核酸包含与SEQID NO:224具有至少80%的序列同一性的核苷酸序列。
在一些实施方案中,本文公开的异源核酸中的一种或多种存在于高拷贝数质粒,例如以每个细胞约10-50个拷贝或每个细胞多于50个拷贝存在的质粒中。在一些实施方案中,本文公开的异源核酸中的一种或多种存在于低拷贝数质粒中。在一些实施方案中,本文公开的异源核酸中的一种或多种存在于中拷贝数质粒中。
根据利用的宿主/载体或宿主/构建体系统,可以在表达载体或构建体中使用许多合适的转录和翻译控制元件中的任何一种,包括组成型和诱导型启动子、转录增强子元件、转录终止子等(参见例如Bitter等人(1987)Methods in Enzymology,153:516-544)。
在一些实施方案中,本文公开的异源核酸可操作地连接到启动子。在一些实施方案中,启动子是组成型启动子。在一些实施方案中,启动子是诱导型启动子。在一些实施方案中,启动子在原核细胞中发挥功能。在一些实施方案中,启动子在真核细胞中发挥功能。在一些实施方案中,启动子可以是表达的强驱动子。在一些实施方案中,启动子可以是表达的弱驱动子。在一些实施方案中,启动子可以是表达的中驱动子。
用于原核宿主细胞中的合适的启动子可以包括但不限于,噬菌体T7RNA聚合酶启动子;trp启动子;lac操纵子启动子;杂合启动子,例如lac/tac杂合启动子、tac/trc杂合启动子、trp/lac启动子、T7/lac启动子;trc启动子;tac启动子等;araBAD启动子;体内调控的启动子,如ssaG启动子或相关启动子(参见例如第20040131637号美国专利公开文件)、pagC启动子(Pulkkinen和Miller,J.Bacteriol.,1991:173(1):86-93;Alpuche-Aranda等人,PNAS,1992;89(21):10079-83)、nirB启动子(Harborne等人(1992)Mol.Micro.6:2805-2813)等(参见例如,Dunstan等人(1999)Infect.Immun.67:5133-5141;McKelvie等人(2004)Vaccine 22:3243-3255;和Chatfield等人(1992)Biotechnol.10:888-892);sigma70启动子,例如,共有sigma70启动子(参见例如,GenBank登录号AX798980、AX798961和AX798183);静止期启动子,例如dps启动子、spv启动子等;源自致病岛SPI-2的启动子(参见例如,WO96/17951);和actA启动子(参见例如,Shetron-Rama等人(2002)Infect.Immun.70:1087-1096);rpsM启动子(参见例如,Valdivia和Falkow(1996).Mol.Microbiol.22:367-378);tet启动子(参见例如,Hillen,W.和Wissmann,A.(1989)InSaenger,W.和Heinemann,U.(编),Topics in Molecular and Structural Biology,Protein–Nucleic Acid Interaction.Macmillan,London,UK,Vol.10,pp.143–162);SP6启动子(参见例如,Melton等人(1984)Nucl.Acids Res.12:7035);等等。
用于原核细胞的合适的组成型启动子是本领域已知的,并且还可以包括但不限于sigma70启动子,例如共有sigma70启动子。
合适的真核启动子的非限制性实例可以包括即刻早期CMV、HSV胸苷激酶、早期和晚期SV40、来自逆转录病毒的LTR和小鼠金属硫蛋白-I。适宜的载体、构建体和启动子的选择完全在本领域普通技术人员的水平内。表达载体或构建体还可包含用于翻译起始的核糖体结合位点和转录终止子。表达载体或构建体还可包括用于扩增表达的适宜序列。
在酵母中,可以使用许多包含组成型或诱导型启动子的载体或构建体。有关综述,请参见Current Protocols in Molecular Biology,Vol.2,1988,Ausubel等人编,GreenePublish.Assoc.&Wiley Interscience,Ch.13;Grant等人,1987,Expression andSecretion Vectors for Yeast,in Methods in Enzymology,Wu&Grossman编,31987,Acad.Press,N.Y.,Vol.153,pp.516-544;Glover,1986,DNA Cloning,Vol.II,IRL Press,Wash.,D.C.,Ch.3;和Bitter,1987,Heterologous Gene Expression in Yeast,Methodsin Enzymology,Berger&Kimmel编,Acad.Press,N.Y.,Vol.152,pp.673-684;和TheMolecular Biology of the Yeast Saccharomyces,1982,Strathern等人编,Cold SpringHarbor Press,Vols.I and II。可以使用组成型酵母启动子如ADH或LEU2或诱导型启动子如GAL(Cloning in Yeast,Ch.3,R.Rothstein:DNACloning Vol.11,A PracticalApproach,DM Glover编,1986,IRL Press,Wash.,D.C.)。供选择地,可以使用促进外源DNA序列整合到酵母染色体中的载体。
通常,重组表达载体将包括复制起点和允许宿主细胞转化的可选择标记,例如大肠杆菌的氨苄青霉素抗性基因、酿酒酵母TRP1基因等;以及源自高表达的基因以引导编码序列的转录的启动子。这样的启动子可以源自编码糖酵解酶的操纵子,例如3-磷酸甘油酸激酶(PGK)、α-因子、酸性磷酸酶或热休克蛋白等等。
诱导型启动子是本领域众所周知的。合适的诱导型启动子可包括但不限于,噬菌体λ的pL;Plac;Ptrp;Ptac(Ptrp-lac杂合启动子);异丙基-β-D-硫代半乳糖吡喃糖苷(IPTG)诱导型启动子,例如lacZ启动子;四环素诱导型启动子;阿拉伯糖诱导型启动子,例如PBAD(参见例如,Guzman等人(1995)J.Bacteriol.177:4121-4130);木糖诱导型启动子,例如Pxyl(参见例如,Kim等人(1996)Gene 181:71-76);GAL1启动子;色氨酸启动子;lac启动子;醇诱导型启动子,例如甲醇诱导型启动子、乙醇诱导型启动子;棉子糖诱导型启动子;热诱导型启动子,例如热诱导λPL启动子、由热敏阻遏物控制的启动子(例如,CI857阻遏的基于λ的表达载体;参见,例如,Hoffmann等人(1999)FEMS Microbiol Lett.177(2):327-34);等等。
另外,在许多实施方案中,表达载体或构建体将包含一种或多种可选择的标记基因,以提供用于选择转化的宿主细胞的表型性状,例如真核细胞培养物的二氢叶酸还原酶或新霉素抗性,或例如原核宿主细胞如大肠杆菌的四环素或氨苄青霉素抗性。
在一些实施方案中,一种或多种本文公开的异源核酸整合到本文公开的基因修饰的宿主细胞的基因组中。在一些实施方案中,一种或多种本文公开的异源核酸保持游离(即未整合到基因修饰的宿主细胞的基因组中)。在一些实施方案中,一种或多种本文公开的异源核酸中的至少一种保持在染色体外。
在一些实施方案中,主题异源核酸或主题重组表达载体或构建体包含用于在植物细胞中表达的启动子或其他(多种)调节元件。在植物细胞中发挥功能的合适的组成型启动子的非限制性实例是花椰菜花叶病毒35S启动子、串联35S启动子(Kay等人,Science 236:1299(1987))、花椰菜花叶病毒19S启动子、胭脂碱合成酶基因启动子(Singer等人,PlantMol.Biol.14:433(1990);An,Plant Physiol.81:86(1986))、章鱼碱合成酶基因启动子和泛素启动子。在植物细胞中发挥功能的合适的诱导型启动子可以包括但不限于苯丙氨酸解氨酶基因启动子、查尔酮合成酶基因启动子、病程相关蛋白基因启动子、铜诱导型调节元件(Mett等人,Proc.Natl.Acad.Sci.USA 90:4567-4571(1993);Furst等人,Cell 55:705-717(1988));四环素和氯四环素诱导型调节元件(Gatz等人,Plant J.2:397-404(1992);
Figure BDA0002337530530002341
等人,Mol.Gen.Genet.243:32-38(1994);Gatz,Meth.Cell Biol.50:411-424(1995));蜕皮激素诱导型调节元件(Christopherson等人,Proc.Natl.Acad.Sci.USA 89:6314-6318(1992);Kreutzweiser等人,Ecotoxicol.Environ.Safety 28:14-24(1994));热休克诱导型调节元件(Takahashi等人,Plant Physiol.99:383-390(1992);Yabe等人,Plant Cell Physiol.35:1207-1219(1994);Ueda等人,Mol.Gen.Genet.250:533-539(1996));和lac操纵子元件,其与组成型表达的lac阻遏物结合使用,以赋予例如IPTG诱导型表达(Wilde等人,EMBO J.11:1251-1259(1992));源自菠菜亚硝酸还原酶基因的硝酸诱导型启动子(Back等人,Plant Mol.Biol.17:9(1991));光诱导型启动子,例如与RuBP羧化酶的小亚基或LHCP基因家族相关的启动子(Feinbaum等人,Mol.Gen.Genet.226:449(1991);Lam和Chua,Science 248:471(1990));如第20040038400号美国专利公开文件中所述的光响应调节元件;水杨酸诱导型调节元件(Uknes等人,Plant Cell 5:159-169(1993);Bi等人,Plant J.8:235-245(1995));植物激素诱导型调节元件(Yamaguchi-Shinozaki等人,Plant Mol.Biol.15:905(1990);Kares等人,Plant Mol.Biol.15:225(1990));以及人激素诱导型调节元件,例如人糖皮质激素应答元件(Schena等人,Proc.Natl.Acad.Sci.USA88:10421(1991))。
植物组织选择性调节元件也可以包括在主题异源核酸或主题载体或构建体中。可以用于在单个组织或有限数量的组织中异位表达异源核酸的合适的组织选择性调节元件可以包括但不限于,木质部选择性调节元件、管胞选择性调节元件、纤维选择性调节元件、毛状体选择性调节元件(参见例如,Wang等人(2002)J.Exp.Botany 53:1891-1897),腺毛选择性调节元件等。
适用于植物细胞的载体是本领域已知的,并且任何这样的载体均可用于将主题异源核酸引入植物宿主细胞中。合适的载体可以包括例如,根瘤农杆菌(Agrobacteriumtumefaciens)的Ti质粒或发根农杆菌(A.rhizogenes)的Ri1质粒。Ti或Ri1质粒在植物细胞被农杆菌感染后被传输到植物细胞,并稳定整合到植物基因组中。J.Schell,Science,237:1176-83(1987)。植物人工染色体也适合使用,例如在第6,900,012号美国专利中描述的。
如本领域技术人员将理解的,核苷酸序列的轻微变化不一定改变编码的多肽的氨基酸序列。本领域技术人员将理解,改变编码的多肽的氨基酸序列的特定基因序列中的核苷酸的同一性的改变可导致基因有效性的降低或增强,并且在某些应用中(例如,反义、共抑制或RNAi)部分序列通常与全长形式一样有效地起作用。可以改变或缩短核苷酸序列的方式是本领域技术人员众所周知的,测试改变的基因的有效性的方式也是如此。在某些实施方案中,可以通过例如常规气相色谱法容易地测试有效性。因此,基因的所有这样的变异均作为本发明的一部分包括在内。
密码子使用
如本领域技术人员众所周知的,有可能通过使编码特定氨基酸的核苷酸序列(即密码子)被在宿主生物体中更好表达的另一种密码子替代来改善宿主生物体中异源核酸的表达(即密码子优化)。产生这种效应的一种原因是由于不同的生物体显示出对不同密码子的偏好这一事实。在一些实施方案中,本文公开的异源核酸被修饰或优化,使得核苷酸序列反映针对特定宿主细胞的密码子偏好。例如,在一些实施方案中,核苷酸序列将针对酵母密码子偏好进行修饰或优化。参见例如,Bennetzen和Hall(1982)J.Biol.Chem.257(6):3026-3031。作为另一个非限制性实例,在一些实施方案中,核苷酸序列将针对大肠杆菌密码子偏好进行修饰或优化。参见例如,Gouy和Gautier(1982)Nucleic Acids Res.10(22):7055-7074;Eyre-Walker(1996)Mol.Biol.Evol.13(6):864-872。还参见Nakamura等人(2000)Nucleic Acids Res.28(1):292。
已经产生了统计方法来分析各种生物体中的密码子使用偏性,并且已经开发了许多计算机算法以在密码子优化的基因序列的设计中实施这些统计分析(Lithwick G,Margalit H(2003)Hierarchy of sequence-dependent features associated withprokaryotic translation.Genome Research 13:2665-73)。还已经描述了不依赖密码子偏性而增加蛋白表达的密码子使用的其他修饰(Welch等人(2009).Design parameters tocontrol synthetic gene expression in Escherichia coli.PLoS ONE 4:e7002)。
在一些实施方案中,修饰编码序列的密码子使用,使得编码的mRNA的翻译水平降低。通过修饰密码子使用来降低mRNA的翻译水平是通过修饰序列以包括稀有密码子或宿主细胞不常用的密码子来实现的。可获得许多生物的密码子使用表,这些表总结了特定生物体使用特定密码子编码氨基酸的次数百分比。某些密码子比其他“稀有”密码子使用得频繁。在序列中使用“稀有”密码子通常会降低其翻译速率。因此,例如,通过引入一种或多种稀有密码子来修饰编码序列,所述稀有密码子影响翻译的速率,但不影响翻译的多肽的氨基酸序列。例如,存在6个编码精氨酸的密码子:CGT、CGC、CGA、CGG、AGA和AGG。在大肠杆菌中,密码子CGT和CGC的使用频率(在大肠杆菌中各自编码约40%的精氨酸)比密码子AGG(在大肠杆菌中编码约2%的精氨酸)高得多。将基因序列中的CGT密码子修改为AGG密码子不会改变多肽的序列,但可能会降低基因的翻译速率。
此外,将理解的是,本发明涵盖密码子使用的简并性,如本领域普通技术人员将理解的并且在下表中示出。
密码子简并性
Figure BDA0002337530530002361
Figure BDA0002337530530002371
基因修饰的植物
本发明提供基因修饰的植物,其中所述基因修饰的植物用一种或多种本文公开的异源核酸基因修饰,以产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。在一些实施方案中,基因修饰的植物是除大麻属以外的属的植物。
本发明提供了基因修饰的植物,其中所述基因修饰的植物用以下异源核酸基因修饰的:a)一种或多种编码产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽的异源核酸;b)一种或多种编码产生GPP的多肽的异源核酸;c)一种或多种编码产生丙二酰辅酶A的多肽的异源核酸;d)一种或多种异源核酸,其编码一种或多种使酰基辅酶A化合物或酰基辅酶A化合物衍生物与丙二酰辅酶A缩合以产生橄榄醇酸或橄榄醇酸的衍生物的多肽;e)一种或多种异源核酸,其编码使GPP和橄榄醇酸缩合以产生大麻萜酚酸或其衍生物的多肽;或f)一种或多种编码大麻素合成酶多肽的异源核酸,其中所述多肽在植物中产生,并且其中所述多肽的产生导致基因修饰的植物产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。在一些实施方案中,植物是单子叶植物。在一些实施方案中,植物是双子叶植物。在一些实施方案中,编码多肽的异源核酸中的一种或多种可操作地连接到组成型启动子。在一些实施方案中,编码多肽的异源核酸中的一种或多种可操作地连接到诱导型启动子。在一些实施方案中,编码多肽的异源核酸中的一种或多种可操作地连接到组织特异性启动子。在一些实施方案中,组织特异性启动子是毛状体特异性启动子。
本发明提供了产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物的方法,所述方法包括将转基因植物保持在有利于编码的一种或多种多肽的产生的条件下,其中编码的一种或多种多肽的产生导致大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物的产生。
在一些实施方案中,转基因植物的基因组包含主题异源核酸。在一些实施方案中,转基因植物对于基因修饰是纯合的。在一些实施方案中,转基因植物对于基因修饰是杂合的。
在一些实施方案中,主题转基因植物产生一种或多种本文公开的转基因编码的多肽,其导致产生的大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物的量比相同种属的对照植物,例如非转基因植物(未包含转基因编码所述一种或多种多肽的植物)产生的大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物的量高至少约50%、至少约2倍、至少约5倍、至少约10倍、至少约25倍、至少约50倍或至少约100倍或更高。
在一些实施方案中,主题转基因植物是对照非转基因植物的转基因形式,其通常产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物,所述大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物由产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物的转基因编码的一种或多种多肽产生,或是产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物的转基因编码的一种或多种多肽的下游产物;其中所述转基因植物产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物的量比相同种属的对照植物,例如非转基因植物(未包含转基因编码所述一种或多种多肽的植物)产生的大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物的量高至少约50%、至少约2倍、至少约5倍、至少约10倍、至少约25倍、至少约50倍或至少约100倍或更高。
将外源核酸引入植物细胞的方法是本领域众所周知的。这样的植物细胞被认为是“转化的”。合适的方法可能包括病毒感染(例如双链DNA病毒)、转染、结合、原生质体融合、电穿孔、粒子枪技术、磷酸钙沉淀、直接显微注射、碳化硅晶须技术、农杆菌介导的转化、CRISPR/Cas9介导的基因组编辑等。方法的选择通常取决于被转化的细胞的类型和发生转化的环境(例如,体外、离体或体内)。
CRISPR/Cas9系统可以用于产生本发明的转基因(基因修饰的)植物。CRISPR/Cas9系统和方法是本领域已知的。参见例如Bortesi和Fischer(2015)Biotechnol.Advances33:41;和Fan等人(2015)Sci.Reports 5:12217。
基于土壤细菌根瘤农杆菌的转化方法可以用于将外源核酸引入维管植物中。农杆菌的野生型形式包含Ti(诱导肿瘤的)质粒,该质粒引导宿主植物上致瘤冠瘿组织的产生。Ti质粒的诱导肿瘤的T-DNA区域向植物基因组的转移需要Ti质粒编码的毒力基因以及T-DNA边界,所述T-DNA边界是描绘出要转移的区域的一组正向DNA重复序列。基于农杆菌的载体是Ti质粒的修饰形式,其中肿瘤诱导功能被要引入植物宿主中的目标核苷酸序列替代。
农杆菌介导的转化通常使用共整合载体或例如二元载体系统,其中Ti质粒的组分在永久存在于农杆菌宿主中并携带毒力基因的辅助载体和包含以T-DNA序列为边界的目标基因的穿梭载体之间分配。多种二元载体在本领域中是众所周知的,并且可以从例如Clontech(Palo Alto,Calif.)商购获得。例如,将农杆菌与培养的植物细胞或受伤的组织如叶组织、根外植体、下胚轴(hypocotyledon)、茎块或块茎共培养的方法也是本领域众所周知的。参见例如,Glick和Thompson,(编),Methods in Plant Molecular Biology andBiotechnology,Boca Raton,Fla.:CRC Press(1993)。
农杆菌介导的转化可用于产生多种转基因维管植物(Wang等人,同上,1995),包括至少一种桉树(Eucalyptus)和饲用豆科植物如紫花苜蓿(苜蓿);百脉根(birdsfoottrefoil)、白三叶草(white clover)、柱花草(Stylosanthes)、罗顿豆(Lotononisbainessii)和红豆草(sainfoin)。
微粒介导的转化也可以用于产生主题转基因植物。该方法首先由Klein等人描述(Nature 327:70-73(1987)),其依赖于微粒,例如通过用氯化钙、亚精胺或聚乙二醇沉淀而被期望异源核酸包被的金或钨。使用诸如BIOLISTIC PD-1000(Biorad;Hercules Calif.)的装置使微粒颗粒高速地加速进入被子植物组织中。
主题异源核酸可以以使得异源核酸能够例如经由体内或离体方案进入(多种)植物细胞的方式引入到植物中。“体内”是指将异源核酸施用于植物的活体,例如浸润。“离体”可以是指在植物外部修饰细胞或外植体,然后将这样的细胞或器官再生为植物。已经描述了许多适用于稳定转化植物细胞或建立转基因植物的载体或构建体,包括在Weissbach和Weissbach,(1989)Methods for Plant Molecular Biology Academic Press,和Gelvin等人,(1990)Plant Molecular Biology Manual,Kluwer Academic Publishers中描述的那些。具体的实例可以包括源自根瘤农杆菌的Ti质粒的那些,以及Herrera-Estrella等人(1983)Nature 303:209,Bevan(1984)Nucl Acid Res.12:8711-8721,Klee(1985)Bio/Technolo 3:637-642公开的那些。供选择地,通过使用自由DNA递送技术,非Ti载体可以用于将DNA转移到植物和细胞中。通过使用这些方法,可以产生转基因植物,例如小麦、水稻(Christou(1991)Bio/Technology 9:957-962)和玉米(Gordon-Kamm(1990)Plant Cell 2:603-618)。不成熟的胚也可以是单子叶植物通过使用粒子枪进行直接DNA递送技术(Weeks等人(1993)Plant Physiol 102:1077-1084;Vasil(1993)Bio/Technolo 10:667-674;Wan和Lemeaux(1994)Plant Physiol 104:37-48)以及进行农杆菌介导的DNA转移(Ishida等人(1996)Nature Biotech 14:745-750)的良好目标组织。将DNA引入叶绿体的示例性方法是基因枪、原生质体的聚乙二醇转化和显微注射(Danieli等人Nat.Biotechnol 16:345-348,1998;Staub等人Nat.Biotechnol 18:333-338,2000;O’Neill等人Plant J.3:729-738,1993;Knoblauch等人Nat.Biotechnol 17:906-909;第5,451,513号、第5,545,817号、第5,545,818号和第5,576,198号美国专利;第WO95/16783号国际申请;和Boynton等人,Methodsin Enzymology 217:510-536(1993),Svab等人,Proc.Natl.Acad.Sci.USA90:913-917(1993),和McBride等人,Proc.Natl.Acad.Sci.USA 91:7301-7305(1994))。任何适用于基因枪、原生质体的聚乙二醇转化和显微注射方法的载体都将适合作为叶绿体转化的靶向载体。任何双链DNA载体都可以用作转化载体,特别是当引入方法不利用农杆菌时。
可被基因修饰的植物可包括谷物、饲料作物、水果、蔬菜,油料作物、棕榈、林产和藤本植物。可以修饰的植物的具体实例可以包括但不限于玉米、香蕉、花生、豌豆、向日葵、烟草、番茄、油菜、烟草、小麦、大麦、燕麦、马铃薯、大豆、棉花、高粱、羽扇豆和水稻。可以被基因修饰的植物可以包括可可树(Theobroma cacao)。
本发明还提供了转化的植物细胞、组织、植物和包含转化的植物细胞的产物。主题转化细胞以及包含其的组织和产物的特征是存在整合到基因组中的主题异源核酸,并且由植物细胞产生一种或多种用于产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物的多肽。本发明的重组植物细胞可用作重组细胞群,或用作组织、种子、整株植物、茎、果实、叶、根、花、茎、块茎、谷物、动物饲料、植物田等等。
本发明还提供了主题转基因植物的生殖材料,其中所述生殖材料可以包括种子、子代植物和克隆材料,其中这样的材料可以产生植物,所述植物可以产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。
产生大麻素、大麻素前体、大麻素衍生物或大麻素前体衍生物的方法
本发明提供了产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物的方法。所述方法可以包括在合适的培养基中培养本发明的基因修饰的宿主细胞,并回收产生的大麻素、大麻素前体、大麻素前体衍生物或大麻素衍生物。所述方法还可以包括使用由本发明的基因修饰的宿主细胞表达或过表达的一种或多种本文公开的多肽无细胞产生大麻素、大麻素前体、大麻素前体衍生物或大麻素衍生物。
本发明提供了产生大麻素或大麻素衍生物的方法。所述方法可以包括在合适的培养基中培养本发明的基因修饰的宿主细胞,并回收产生的大麻素或大麻素衍生物。所述方法还可以包括使用由本发明的基因修饰的宿主细胞表达或过表达的一种或多种本文公开的多肽无细胞产生大麻素或大麻素衍生物。
可以使用本发明的方法或基因修饰的宿主细胞产生的大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物可以包括但不限于,大麻色烯(CBC)型(例如大麻色烯酸)、大麻萜酚(CBG)型(例如大麻萜酚酸)、大麻二酚(CBD)型(例如大麻二酚酸)、Δ9-反式-四氢大麻酚(Δ9-THC)型(例如Δ9-四氢大麻酚酸)、Δ8-反式-四氢大麻酚(Δ8-THC)型、大麻环酚(CBL)型、大麻艾尔松(CBE)型、大麻酚(CBN)型、脱氢大麻二酚(CBND)型、大麻三酚(CBT)型、橄榄醇酸、GPP、前述任一种的衍生物和其他在Elsohly M.A.and Slade D.,LifeSci.2005Dec 22;78(5):539-48.Epub 2005年9月30日中列举的。
可以使用本发明的方法或基因修饰的宿主细胞产生的大麻素或大麻素衍生物还可以包括但不限于,大麻萜酚酸(CBGA)、大麻萜酚酸单甲醚(CBGAM)、大麻萜酚(CBG)、大麻萜酚单甲醚(CBGM)、次大麻萜酚酸(CBGVA)、次大麻萜酚(CBGV)、大麻色烯酸(CBCA)、大麻色烯(CBC)、次大麻色酚酸(CBCVA)、次大麻色酚(CBCV)、大麻二酚酸(CBDA)、大麻二酚(CBD)、大麻二酚单甲醚(CBDM)、大麻二酚-C4(CBD-C4)、次大麻二酚酸(CBDVA)、次大麻二酚(CBDV)、大麻二苔黑酚(CBD-C1)、Δ9-四氢大麻酚酸A(THCA-A)、Δ9-四氢大麻酚酸B(THCA-B)、Δ9-四氢大麻酚(THC)、Δ9-四氢大麻酚酸-C4(THCA-C4)、Δ9-四氢大麻酚-C4(THC-C4)、Δ9-四氢次大麻酚酸(THCVA)、Δ9-四氢次大麻酚(THCV)、Δ9-四氢大麻苔黑酚酸(THCA-C1)、Δ9-四氢大麻苔黑酚(THC-C1)、Δ7-顺式-异四氢次大麻酚、Δ8-四氢大麻酚酸(Δ8-THCA)、Δ8-四氢大麻酚(Δ8-THC)、大麻环酚酸(CBLA)、大麻环酚(CBL)、次大麻环酚(CBLV)、大麻艾尔松酸A(CBEA-A)、大麻艾尔松酸B(CBEA-B)、大麻艾尔松(CBE)、大麻艾尔松酸、大麻二吡喃环烷酸、大麻酚酸(CBNA)、大麻酚(CBN)、大麻酚甲醚(CBNM)、大麻酚-C4,(CBN-C4)、次大麻酚(CBV)、大麻酚-C2(CNB-C2)、大麻苔黑酚(CBN-C1)、脱氢大麻二酚(CBND)、次大麻二酚(CBVD)、大麻三酚(CBT)、10-乙氧基-9-羟基-δ-6a-四氢大麻酚、8,9-二羟基-δ-6a-四氢大麻酚、次大麻三酚(CBTVE)、脱氢大麻呋喃(DCBF)、大麻呋喃(CBF)、大麻色满酮(CBCN)、大麻二吡喃环烷(CBT)、10-氧代-δ-6a-四氢大麻酚(OTHC)、δ-9-顺式-四氢大麻酚(顺式-THC)、3,4,5,6-四氢-7-羟基-α-α-2-三甲基-9-正丙基-2,6-桥亚甲基-2H-1-苯并恶辛因-5-甲醇(OH-异-HHCV)、cannabiripsol(CBR)、三羟基-δ-9-四氢大麻酚(三OH-THC)和前述任一种的衍生物。
可以使用所述方法或基因修饰的宿主细胞产生的另外的大麻素衍生物还可以包括但不限于,2-香叶基-5-戊基-二羟基苯甲酸、2-香叶基-5-(4-戊炔基)-二羟基苯甲酸、2-香叶基-5-(反式-2-戊烯基)-二羟基苯甲酸、2-香叶基-5-(4-甲基己基)-二羟基苯甲酸、2-香叶基-5-(5-己炔基)二羟基苯甲酸、2-香叶基-5-(反式-2-己烯基)-二羟基苯甲酸、2-香叶基-5-(5-己烯基)-二羟基苯甲酸、2-香叶基-5-庚基-二羟基苯甲酸、2-香叶基-5-(6-庚炔基)-二羟基苯甲酸、2-香叶基-5-辛基-二羟基苯甲酸、2-香叶基-5-(反式-2-辛烯基)-二羟基苯甲酸、2-香叶基-5-壬基-二羟基苯甲酸、2-香叶基-5-(反式-2-壬烯基)二羟基苯甲酸、2-香叶基-5-癸基-二羟基苯甲酸、2-香叶基-5-(4-苯基丁基)-二羟基苯甲酸、2-香叶基-5-(5-苯基戊基)-二羟基苯甲酸、2-香叶基-5-(6-苯基己基)-二羟基苯甲酸、2-香叶基-5-(7-苯基庚基)-二羟基苯甲酸、(6aR,10aR)-1-羟基-6,6,9-三甲基-3-丙基-6a,7,8,10a-四氢-6H-二苯并[b,d]吡喃-2-羧酸、(6aR,10aR)-1-羟基-6,6,9-三甲基-3-(4-甲基己基)-6a,7,8,10a-四氢-6H-二苯并[b,d]吡喃-2-羧酸、(6aR,10aR)-1-羟基-6,6,9-三甲基-3-(5-己烯基)-6a,7,8,10a-四氢-6H-二苯并[b,d]吡喃-2-羧酸、(6aR,10aR)-1-羟基-6,6,9-三甲基-3-(5-己烯基)-6a,7,8,10a-四氢-6H-二苯并[b,d]吡喃-2-羧酸、(6aR,10aR)-1-羟基-6,6,9-三甲基-3-(6-庚炔基)-6a,7,8,10a-四氢-6H-二苯并[b,d]吡喃-2-羧酸、3-[(2E)-3,7-二甲基辛-2,6-二烯-1-基]-6-(己-2-基)-2,4-二羟基苯甲酸、3-[(2E)-3,7-二甲基辛-2,6-二烯-1-基]-2,4-二羟基-6-(2-甲基戊基)苯甲酸、3-[(2E)-3,7-二甲基辛-2,6-二烯-1-基]-2,4-二羟基-6-(3-甲基戊基)苯甲酸、3-[(2E)-3,7-二甲基辛-2,6-二烯-1-基]-2,4-二羟基-6-(4-甲基戊基)苯甲酸、3-[(2E)-3,7-二甲基辛-2,6-二烯-1-基]-2,4-二羟基-6-[(1E)-戊-1-烯-1-基]苯甲酸、3-[(2E)-3,7-二甲基辛-2,6-二烯-1-基]-2,4-二羟基-6-[(2E)-戊-2-烯-1-基]苯甲酸、3-[(2E)-3,7-二甲基辛-2,6-二烯-1-基]-2,4-二羟基-6-[(2E)-戊-3-烯-1-基]苯甲酸、3-[(2E)-3,7-二甲基辛-2,6-二烯-1-基]-2,4-二羟基-6-(戊-4-烯-1-基)苯甲酸、3-[(2E)-3,7-二甲基辛-2,6-二烯-1-基]-2,4-二羟基-6-丙基苯甲酸、3-[(2E)-3,7-二甲基辛-2,6-二烯-1-基]-2,4-二羟基-6-丁基苯甲酸、3-[(2E)-3,7-二甲基辛-2,6-二烯-1-基]-2,4-二羟基-6-己基苯甲酸、3-[(2E)-3,7-二甲基辛-2,6-二烯-1-基]-2,4-二羟基-6-庚基苯甲酸、3-[(2E)-3,7-二甲基辛-2,6-二烯-1-基]-2,4-二羟基-6-辛基苯甲酸、3-[(2E)-3,7-二甲基辛-2,6-二烯-1-基]-2,4-二羟基-6-壬基苯甲酸、3-[(2E)-3,7-二甲基辛-2,6-二烯-1-基]-2,4-二羟基-6-癸基苯甲酸、3-[(2E)-3,7-二甲基辛-2,6-二烯-1-基]-2,4-二羟基-6-十一基苯甲酸、6-(4-氯丁基)-3-[(2E)-3,7-二甲基辛-2,6-二烯-1-基]-2,4-二羟基苯甲酸、3-[(2E)-3,7-二甲基辛-2,6-二烯-1-基]-2,4-二羟基-6-[4-(甲基磺酰基)丁基]苯甲酸和在Bow,E.W.和Rimoldi,J.M.,“The Structure–Function Relationships of Classical Cannabinoids:CB1/CB2Modulation,”Perspectives in Medicinal Chemistry 2016:8 17–39doi:10.4137/PMC.S32171中列举的其他的,所述文献以引用方式并入本文。
可以用本发明的方法或基因修饰的宿主细胞产生的大麻素前体衍生物还可以包括但不限于,次大麻二酚酸(divarinolic acid)、5-戊基-二羟基苯甲酸、5-(4-戊炔基)-二羟基苯甲酸、5-(反式-2-戊烯基)-二羟基苯甲酸、5-(4-甲基己基)-二羟基苯甲酸、5-(5-己炔基)-二羟基苯甲酸、5-(反式-2-己烯基)-二羟基苯甲酸、5-(5-己烯基)-二羟基苯甲酸、5-庚基-二羟基苯甲酸、5-(6-庚炔基)-二羟基苯甲酸、5-辛基-二羟基苯甲酸、5-(反式-2-辛烯基)-二羟基苯甲酸、5-壬基-二羟基苯甲酸、5-(反式-2-壬烯基)-二羟基苯甲酸、5-癸基-二羟基苯甲酸、5-(4-苯基丁基)-二羟基苯甲酸、5-(5-苯基戊基)-二羟基苯甲酸、5-(6-苯基己基)-二羟基苯甲酸和5-(7-苯基庚基)-二羟基苯甲酸。
可以用本发明的方法或基因修饰的宿主细胞产生的大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物还可以包括但不限于,聚酮或聚酮衍生物。
大麻素衍生物或大麻素前体衍生物可以缺少一种或多种在天然存在的大麻素或天然存在的大麻素前体中存在的化学部分。这样的化学部分可以包括但不限于,甲基、烷基、烯基、甲氧基、烷氧基、乙酰基、羧基、羰基、氧代基、酯基、羟基、芳基、杂芳基、环烷基、环烯基、环烷基烯基、环烯基烷基、环烯基烯基、杂环基烯基、杂芳基烯基、芳基烯基、杂环基、芳烷基、环烷基烷基、杂环基烷基、杂芳基烷基等。在一些实施方案中,缺少一种或多种在天然存在的大麻素或天然存在的大麻素前体中存在的化学部分,并且由本文公开的基因修饰的宿主细胞产生或在包含本文公开的多肽中的一种或多种的无细胞反应混合物中产生的大麻素衍生物或大麻素前体衍生物,还可以包含本文所述的官能团和/或反应性基团中的任何一种或多种。官能团和反应性基团可以任选地被一个或多个另外的官能团或反应性基团取代。
大麻素衍生物或大麻素前体衍生物可以是包含一个或多个官能团和/或反应性基团的大麻素或大麻素前体,并且由本文公开的基因修饰的宿主细胞产生或在包含本文公开的多肽中的一种或多种的无细胞反应混合物中产生。官能团可以包括但不限于,叠氮基、卤素(例如,氯、溴、碘、氟)、甲基、烷基、炔基、烯基、甲氧基、烷氧基、乙酰基、氨基、羧基、羰基、氧代基、酯基、羟基、硫基、氰基、芳基、杂芳基、环烷基、环烯基、环烷基烯基、环烷基炔基、环烯基烷基、环烯基烯基、环烯基炔基、杂环基烯基、杂环基炔基、杂芳基烯基、杂芳基炔基、芳基烯基、芳基炔基、螺环基、杂螺环基、杂环基、硫代烷基、砜基、磺酰基、亚砜基、酰胺基、烷基氨基、二烷基氨基、芳基氨基、烷基芳基氨基、二芳基氨基、N-氧化物、酰亚胺基、烯胺基、亚胺基、肟基、腙基、腈基、芳烷基、环烷基烷基、卤素烷基、杂环基烷基、杂芳基烷基、硝基、硫代基等等。参见例如图12和13。适合的反应性基团可以包括但不必限于,叠氮基、羧基、羰基、胺基(例如,烷基胺基(例如,低级烷基胺基)、芳基胺基)、卤化物基团、酯基(例如,烷基酯基(例如,低级烷基酯基、苄基酯基)、芳基酯基、取代的芳基酯基)、氰基、硫酯基、硫醚基、磺酰卤化物基、醇基、硫醇基、琥珀酰亚胺酯基、异硫氰酸酯基、碘乙酰胺基、马来酰亚胺基、肼基、炔基、烯基、乙酰基等。在一些实施方案中,反应性基团选自羧基、羰基、胺基、酯基、硫酯基、硫醚基、磺酰卤化物基、醇基、硫醇基、炔基、烯基、叠氮基、琥珀酰亚胺酯基、异硫氰酸酯基、碘乙酰胺基、马来酰亚胺基和肼基。官能团和反应性基团可以任选地被一个或多个另外的官能团或反应性基团取代。
反应性基团可以有助于目标分子的共价连接。合适的目标分子可以包括但不限于,可检测标记;造影剂;毒素(包括细胞毒素);接头;肽;药物(例如小分子药物);特异性结合对的成员;表位标签;通过靶受体结合的配体;有助于纯化的标签;增加溶解度的分子;等等。接头可以是肽接头或非肽接头。
在一些实施方案中,可以通过“点击化学”使包含叠氮基的大麻素衍生物或大麻素前体衍生物与包含炔基的化合物反应,以产生包含杂环的产物,也称为叠氮-炔环加成。在一些实施方案中,可以通过点击化学使包含炔基的大麻素衍生物或大麻素前体衍生物与包含叠氮基的化合物反应以产生包含杂环的产物。
期望用于连接到大麻素衍生物或大麻素前体衍生物的另外的分子可以包括但不必限于,可检测标记(例如,自旋标记、荧光共振能量转移(FRET)型染料,例如用于研究体内生物分子的结构);小分子药物;细胞毒性分子(例如,药物);造影剂;用于被目标受体结合的配体;通过例如亲和色谱法而有助于纯化的标签(例如,连接到FLAG表位);增加溶解度的分子(例如,聚乙二醇);增强生物利用度的分子;增加体内半衰期的分子;靶向特定细胞类型的分子(例如,对靶细胞上的表位具有特异性的抗体);靶向特定组织的分子;提供跨过血脑屏障的分子;和促进选择性附着到表面的分子;等等。
在一些实施方案中,目标分子包括造影剂。合适的造影剂可以包括阳性造影剂和阴性造影剂。合适的阳性造影剂可以包括但不限于,钆-四氮杂环十二烷四乙酸(Gd-DOTA);钆-二乙烯三胺五乙酸(Gd-DTPA);钆-1,4,7-三(羰基甲基)-10-(2'-羟基丙基)-1,4,7,10-四氮杂环十二烷(Gd-HP-DO3A);锰(II)-二吡多醛二磷酸(Mn-DPDP);Gd-二乙烯三胺五乙酸-双(甲酰胺)(Gd-DTPA-BMA);等等。合适的阴性造影剂可以包括但不限于,超顺磁性氧化铁(SPIO)造影剂;和全氟化碳,其中合适的全氟化碳可以包括但不限于,氟代庚烷,氟代环庚烷,氟代甲基环庚烷,氟代己烷,氟代环己烷,氟代戊烷、氟代环戊烷、氟代甲基环戊烷、氟代二甲基环戊烷、氟代甲基环丁烷、氟代二甲基环丁烷、氟代三甲基环丁烷、氟代丁烷、氟代环丁烷、氟代丙烷、氟代醚、氟聚醚、氟代三乙胺、全氟己烷、全氟戊烷、全氟丁烷、全氟丙烷、六氟化硫等。
可以用本发明的方法或基因修饰的宿主细胞产生的另外的大麻素衍生物和大麻素前体衍生物可以包括已经通过有机合成或酶促途径修饰以改变药物代谢和药代动力学(例如溶解度、生物利用度、吸收、分布、血浆半衰期和代谢清除率)的衍生物。修饰实例可以包括但不限于卤化、乙酰化和甲基化。
本文所述的大麻素、大麻素衍生物、大麻素前体和大麻素前体衍生物还包括所有药学上可接受的同位素标记的大麻素、大麻素衍生物、大麻素前体和大麻素前体衍生物。“同位素标记的”或“放射性标记的”化合物是其中一个或多个原子被原子质量或质量数与自然界中通常存在的(即天然存在的)原子质量或质量数不同的原子替代或取代的化合物。例如,在一些实施方案中,在本文所述的大麻素、大麻素衍生物、大麻素前体和大麻素前体衍生物中,氢原子被一个或多个氘或氚替代或取代。本发明的某些同位素标记的大麻素、大麻素衍生物、大麻素前体和大麻素前体衍生物,例如掺入放射性同位素的那些,可用于药物和/或底物组织分布研究。考虑到放射性同位素氚即3H和碳即14C的掺入的容易程度和现有的检测手段,其对此目的特别有用。用更重的同位素如氘(即2H)取代可以由于更大的代谢稳定性而提供某些治疗优势,例如,增加的体内半衰期或降低的剂量需求,因此在某些情况下可以是优选的。可以掺入本文所述的大麻素、大麻素衍生物、大麻素前体和大麻素前体衍生物的合适的同位素包括但不限于2H(对于氘也写为D)、3H(对于氚也写为T)、11C、13C、14C、13N、15N、15O、17O、18O、18F、35S、36Cl、82Br、75Br、76Br、77Br、123I、124I、125I和131I。用正电子发射同位素,如11C、18F、15O和13N取代可用于正电子发射断层扫描(PET)研究。
本文公开的生物生产的方法能够实现具有确定的立体化学的大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物的合成,这使用化学合成是具有挑战性的。本文公开的大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物可以是对映异构体或非对映异构体。术语“对映异构体”可以指一对立体异构体,它们是彼此的不可重叠的镜像。在一些实施方案中,大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物可以是(S)-对映异构体。在一些实施方案中,大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物可以是(R)-对映异构体。在一些实施方案中,大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物可以是(+)或(-)对映异构体。术语“非对映异构体”可以指不能通过围绕单键旋转而使其重叠的一组立体异构体。例如,可以将顺式和反式双键,双环系统上的内和外取代,以及具有不同相对构型的包含多个立体异构中心的化合物视为非对映异构体。术语“非对映异构体”可以指该组化合物的任何成员。本文公开的大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物可以包含双键或稠环。在某些这样的实施方案中,双键或稠环可以是顺式或反式的,除非具体限定了构型。如果大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物含有双键,则取代基可以为E或Z构型,除非具体限定了构型。
在一些实施方案中,当从细胞裂解物、从培养基、从细胞裂解液和培养基二者或从包含本文公开的一种或多种多肽的无细胞反应混合物中回收大麻素、大麻素前体、大麻素前体衍生物或大麻素衍生物时,则回收的大麻素、大麻素前体、大麻素前体衍生物或大麻素衍生物为盐的形式。在某些这样的实施方案中,盐是药学上可接受的盐。在一些实施方案中,然后如本文公开的那样纯化回收的大麻素、大麻素前体、大麻素前体衍生物或大麻素衍生物的盐。
本发明包括本文所述的大麻素、大麻素衍生物、大麻素前体和大麻素前体衍生物的药学上可接受的盐。“药学上可接受的盐”是指保留在生物学上或其他方面都不是不希望的游离碱的生物学有效性和性质的那些盐。代表性的药学上可接受的盐包括但不限于例如,水溶性和水不溶性盐,例如乙酸盐、氨茋磺酸盐(amsonate)(4,4-二氨基茋-2,2-二磺酸盐)、苯磺酸盐、苯甲酸盐、碳酸氢盐、硫酸氢盐、酒石酸氢盐、硼酸盐、溴盐、丁酸盐、钙盐、依地酸钙盐、樟脑磺酸盐、碳酸盐、氯盐、柠檬酸盐、克拉维酸盐、二盐酸盐、依地酸盐、乙二磺酸盐、依托酸盐、乙磺酸盐、富马酸盐、葡庚糖酸盐、葡糖酸盐、谷氨酸盐、对羟乙酰氨基苯胂酸盐(glycollylarsanilate)、六氟磷酸盐、己基间苯二酚盐(hexylresorcinate)、海巴明(hydrabamine)、氢溴酸盐、盐酸盐、羟基萘甲酸盐、碘盐、羟乙基磺酸盐、乳酸盐、乳糖醛酸盐、月桂酸盐、镁盐、苹果酸盐、马来酸盐、扁桃酸盐、甲磺酸盐、甲基溴盐、甲基硝酸盐、甲基硫酸盐、粘酸盐、萘磺酸盐、硝酸盐、N-甲基葡糖胺铵盐、3-羟基-2-萘甲酸盐、油酸盐、草酸盐、棕榈酸盐、双羟萘酸盐(1,1-亚甲基双-2-羟基3-萘甲酸盐,依伯酸盐(einbonate))、泛酸盐、磷酸盐/二磷酸盐、苦味酸盐、聚半乳糖醛酸盐、丙酸盐、对甲苯磺酸盐、水杨酸盐、硬脂酸盐、碱式乙酸盐、琥珀酸盐、硫酸盐、磺基水杨酸盐、苏拉酸盐(suramate)、鞣酸盐、酒石酸盐、茶氯酸盐(teoclate)、甲苯磺酸盐、三乙基碘盐和戊酸盐。
“药学上可接受的盐”还包括酸和碱加成盐。“药学上可接受的酸加成盐”是指保留在生物学上或其他方面都不是不希望的游离碱的生物学有效性和性质的盐,并且其由以下形成:无机酸,例如但不限于盐酸、氢溴酸、硫酸、硝酸、磷酸等、以及有机酸,例如但不限于乙酸、2,2-二氯乙酸、己二酸、藻酸、抗坏血酸、天冬氨酸、苯磺酸、苯甲酸、4-乙酰氨基苯甲酸、樟脑酸、樟脑-10-磺酸、癸酸、己酸、辛酸、碳酸、肉桂酸、柠檬酸、环拉酸、十二烷基硫酸、乙烷-1,2-二磺酸、乙磺酸、2-羟基乙磺酸、甲酸、富马酸、半乳糖二酸、龙胆酸、葡庚糖酸、葡萄糖酸、葡萄糖醛酸、谷氨酸、戊二酸、2-氧代戊二酸、甘油磷酸、乙醇酸、马尿酸、异丁酸、乳酸、乳糖酸、月桂酸、马来酸、苹果酸、丙二酸酸、扁桃酸、甲磺酸、粘酸、萘-1,5-二磺酸、萘-2-磺酸、1-羟基-2-萘甲酸、烟酸、油酸、乳清酸、草酸、棕榈酸、扑酸、丙酸、焦谷氨酸、丙酮酸、水杨酸、4-氨基水杨酸、癸二酸、硬脂酸、琥珀酸、酒石酸、硫氰酸、对甲苯磺酸、三氟乙酸、十一碳烯酸等。
“药学上可接受的碱加成盐”是指保留了在生物学上或其他方面都不是不希望的游离酸的生物学有效性和性质的那些盐。这些盐是通过将无机碱或有机碱添加到游离酸中来制备的。衍生自无机碱的盐包括但不限于钠、钾、锂、铵、钙、镁、铁、锌、铜、锰、铝盐等。例如,无机盐包括但不限于铵盐、钠盐、钾盐、钙盐和镁盐。衍生自有机碱的盐包括但不限于以下物质的盐:伯胺、仲胺和叔胺,取代的胺,包括天然存在的取代的胺、环胺和碱性离子交换树脂,如氨、异丙胺、三甲胺、二乙胺、三乙胺、三丙胺、二乙醇胺、乙醇胺、二甲基乙醇胺(deanol)、2-二甲基氨基乙醇、2-二乙基氨基乙醇、二环己胺、赖氨酸、精氨酸、组氨酸、咖啡因、普鲁卡因、海巴明、胆碱、甜菜碱、苯乙苄胺(benethamine)、苄星(benzathine)、乙二胺、葡萄糖胺、甲基葡糖胺、可可碱、三乙醇胺、氨丁三醇、嘌呤、哌嗪、哌啶、N-乙基哌啶、多胺树脂等。
使用宿主细胞产生大麻素、大麻素前体、大麻素衍生物或大麻素前体衍生物的方
本发明提供了在基因修饰的宿主细胞中产生大麻素、大麻素前体、大麻素前体衍生物或大麻素衍生物的方法,所述方法包括:在合适的培养基中培养本发明的基因修饰的宿主细胞,并回收产生的大麻素、大麻素前体、大麻素前体衍生物或大麻素衍生物。在某些这样的实施方案中,然后如本文所公开的,纯化产生的大麻素、大麻素前体、大麻素前体衍生物或大麻素衍生物。
在一些实施方案中,在合适的培养基中培养本发明的基因修饰的宿主细胞以与在类似条件下培养的非基因修饰的宿主细胞相比增加的量提供大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物的合成。
本发明提供了产生大麻素、大麻素前体、大麻素前体衍生物或大麻素衍生物的方法,所述方法包括:在包含羧酸的合适的培养基中培养本发明的基因修饰的宿主细胞,并回收产生的大麻素、大麻素前体、大麻素前体衍生物或大麻素衍生物。在某些这样的实施方案中,然后如本文所公开的,纯化产生的大麻素、大麻素前体、大麻素前体衍生物或大麻素衍生物。
在一些实施方案中,从细胞裂解物、从培养基或从细胞裂解物和培养基二者中回收大麻素、大麻素前体、大麻素前体衍生物或大麻素衍生物。在某些这样的实施方案中,然后如本文所公开的,纯化回收的大麻素、大麻素前体、大麻素前体衍生物或大麻素衍生物。
本发明提供了在基因修饰的宿主细胞产生大麻素或大麻素衍生物的方法,所述方法包括:在合适的培养基中培养本发明的基因修饰的宿主细胞,并回收产生的大麻素或大麻素衍生物。在某些这样的实施方案中,然后如本文所公开的,纯化产生的大麻素或大麻素衍生物。
在一些实施方案中,在合适的培养基中培养本发明的基因修饰的宿主细胞以与在类似条件下培养的非基因修饰的宿主细胞相比增加的量提供大麻素或大麻素衍生物的合成。
本发明提供了产生大麻素或大麻素衍生物的方法,所述方法包括:在包含羧酸的合适的培养基中培养本发明的基因修饰的宿主细胞,并回收产生的大麻素或大麻素衍生物。在某些这样的实施方案中,然后如本文所公开的,纯化产生的大麻素或大麻素衍生物。
在一些实施方案中,从细胞裂解物、从培养基或从细胞裂解物和培养基二者回收大麻素或大麻素衍生物。在某些这样的实施方案中,然后如本文所公开的,纯化回收的大麻素或大麻素衍生物。
在一些实施方案中,在包含羧酸的合适的培养基中培养本发明的基因修饰的宿主细胞,以产生酰基辅酶A化合物或酰基辅酶A化合物衍生物。在某些这样的实施方案中,基因修饰的宿主细胞用一种或多种编码AAE多肽、FAA多肽或脂肪酰辅酶A连接酶多肽的异源核酸基因修饰,如本文所述。在一些实施方案中,本发明的基因修饰的宿主细胞还可以将酰基辅酶A化合物或酰基辅酶A化合物衍生物转化为大麻素、大麻素前体、大麻素前体衍生物或大麻素衍生物。
羧酸可以包括但不限于,C3-C18脂肪酸、丁酸、异丁酸、戊酸、己酸、庚酸、辛酸、壬酸、癸酸、十一烷酸、月桂酸、肉豆蔻酸、C15-C18脂肪酸、富马酸、衣康酸、苹果酸、琥珀酸、马来酸、丙二酸、戊二酸、葡糖二酸、草酸、己二酸、庚二酸、辛二酸、壬二酸、癸二酸、十二烷二酸、戊烯二酸、邻苯二甲酸、间苯二甲酸、对苯二甲酸、柠檬酸、异柠檬酸、乌头酸、丙三酸和均苯三甲酸。羧酸可包括C4-C10羧酸。在一些实施方案中,羧酸是C4羧酸。在一些实施方案中,羧酸是C5羧酸。在一些实施方案中,羧酸是C6羧酸。在一些实施方案中,羧酸是C7羧酸。在一些实施方案中,羧酸是C8羧酸。在一些实施方案中,羧酸是C9羧酸。在一些实施方案中,羧酸是C10羧酸。在一些实施方案中,羧酸是丁酸。在一些实施方案中,羧酸是戊酸。在一些实施方案中,羧酸是己酸。在一些实施方案中,羧酸是庚酸。在一些实施方案中,羧酸是辛酸。在一些实施方案中,羧酸是壬酸。在一些实施方案中,羧酸是癸酸。参见例如图12。
在一些实施方案中,羧酸包含一个或多个官能团和/或反应性基团以产生己酰辅酶A的衍生物或酰基辅酶A化合物的衍生物。官能团可以包括但不限于,叠氮基、卤素(例如,氯、溴、碘、氟)、甲基、烷基、炔基、烯基、甲氧基、烷氧基、乙酰基、氨基、羧基、羰基、氧代基、酯基、羟基、硫基、氰基、芳基、杂芳基、环烷基、环烯基、环烷基烯基、环烷基炔基、环烯基烷基、环烯基烯基、环烯基炔基、杂环基烯基、杂环基炔基、杂芳基烯基、杂芳基炔基、芳基烯基、芳基炔基、螺环基、杂螺环基、杂环基、硫代烷基、砜基、磺酰基、亚砜基、酰胺基、烷基氨基、二烷基氨基、芳基氨基、烷基芳基氨基、二芳基氨基、N-氧化物、酰亚胺基、烯胺基、亚胺基、肟基、腙基、腈基、芳烷基、环烷基烷基、卤素烷基、杂环基烷基、杂芳基烷基、硝基、硫代基等等。参见例如图12和13。反应性基团可以包括但不必限于、叠氮基、卤素、羧基、羰基、胺基(例如,烷基胺基(例如,低级烷基胺基)、芳基胺基)、酯基(例如,烷基酯基(例如,低级烷基酯基、苄基酯基)、芳基酯基、取代的芳基酯基)、氰基、硫酯基、硫醚基、磺酰卤化物基、醇基、硫醇基、琥珀酰亚胺酯基、异硫氰酸酯基、碘乙酰胺基、马来酰亚胺基、肼基、炔基、烯基等。在一些实施方案中,反应性基团选自羧基、羰基、胺基、酯基、硫酯基、硫醚基、磺酰卤化物基、醇基、硫醇基、琥珀酰亚胺酯基、异硫氰酸酯基、碘乙酰胺基、马来酰亚胺基、叠氮基、炔基、烯基和肼基。官能团和反应性基团可以任选地被一个或多个另外的官能团或反应性基团取代。
在一些实施方案中,羧酸是同位素标记的或放射性标记的。在一些实施方案中,羧酸可以是对映异构体或非对映异构体。在一些实施方案中,羧酸可以是(S)-对映异构体。在一些实施方案中,羧酸可以是(R)-对映异构体。在一些实施方案中,羧酸可以是(+)或(-)对映异构体。在一些实施方案中,羧酸可以包含双键或稠环。在某些这样的实施方案中,双键或稠环可以是顺式或反式的,除非具体限定了构型。如果羧酸含有双键,则取代基可以为E或Z构型,除非具体限定了构型。
在一些实施方案中,羧酸包含C=C基团。在一些实施方案中,羧酸包含炔基。在一些实施方案中,羧酸包含N3基团。在一些实施方案中,羧酸包含卤素。在一些实施方案中,羧酸包含CN基团。在一些实施方案中,羧酸包含碘。在一些实施方案中,羧酸包含溴。在一些实施方案中,羧酸包含氯。在一些实施方案中,羧酸包含氟。在一些实施方案中,羧酸包含羰基。在一些实施方案中,羧酸包含乙酰基。在一些实施方案中,羧酸包含烷基。
羧酸可以包括但不限于,2-甲基己酸、3-甲基己酸、4-甲基己酸、5-甲基己酸、2-己烯酸、3-己烯酸、4-己烯酸、5-己烯酸、5-氯戊酸、5-氨基戊酸、5-氰基戊酸、5-(甲基磺酰基)戊酸、5-羟基戊酸、5-苯基戊酸、2,3-二甲基己酸、d3-己酸、5-氯戊酸、5-(甲基磺酰基)戊酸、4-戊炔酸、反式-2-戊烯酸、5-己炔酸、反式-2-己烯酸、6-庚炔酸、反式-2-辛烯酸、反式-2-壬烯酸、4-苯基丁酸、6-苯基己酸、7-苯基庚酸等。在一些实施方案中,羧酸是2-甲基己酸。在一些实施方案中,羧酸是3-甲基己酸。在一些实施方案中,羧酸是4-甲基己酸。在一些实施方案中,羧酸是5-甲基己酸。在一些实施方案中,羧酸是2-己烯酸。在一些实施方案中,羧酸是3-己烯酸。在一些实施方案中,羧酸是4-己烯酸。在一些实施方案中,羧酸是5-己烯酸。在一些实施方案中,羧酸是5-氯戊酸。在一些实施方案中,羧酸是5-氨基戊酸。在一些实施方案中,羧酸是5-氰基戊酸。在一些实施方案中,羧酸是5-(甲基磺酰基)戊酸。在一些实施方案中,羧酸是5-羟基戊酸。在一些实施方案中,羧酸是5-苯基戊酸。在一些实施方案中,羧酸是2,3-二甲基己酸。在一些实施方案中,羧酸是d3-己酸。在一些实施方案中,羧酸是5-氯戊酸。在一些实施方案中,羧酸是5-(甲基磺酰基)戊酸。在一些实施方案中,羧酸是4-戊炔酸。在一些实施方案中,羧酸是反式-2-戊烯酸。在一些实施方案中,羧酸是5-己炔酸。在一些实施方案中,羧酸是反式-2-己烯酸。在一些实施方案中,羧酸是6-庚炔酸。在一些实施方案中,羧酸是反式-2-辛烯酸。在一些实施方案中,羧酸是反式-2-壬烯酸。在一些实施方案中,羧酸是4-苯基丁酸。在一些实施方案中,羧酸是6-苯基己酸。在一些实施方案中,羧酸是7-苯基庚酸。
本发明还提供了产生以下大麻素前体或前体衍生物的方法:橄榄醇酸或橄榄醇酸衍生物。在某些这样的实施方案中,所述方法包括:在包含羧酸的合适的培养基中培养本发明的基因修饰的宿主细胞,并回收产生的橄榄醇酸或橄榄醇酸衍生物。在某些这样的实施方案中,用以下异源核酸基因修饰本发明的基因修饰的宿主细胞:a)一种或多种编码产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽的异源核酸,所述多肽如AAE多肽、FAA多肽或脂肪酰辅酶A连接酶多肽;b)一种或多种编码TKS多肽的异源核酸;和c)一种或多种编码OAC多肽的异源核酸。在一些实施方案中,基因修饰的宿主细胞用以下异源核酸基因修饰:a)一种或多种编码产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽的异源核酸,如AAE多肽、FAA多肽或脂肪酰辅酶A连接酶多肽;和b)一种或多种编码TKS/OAC融合多肽的异源核酸。
在一些实施方案中,由本发明的方法或基因修饰的宿主细胞产生的橄榄醇酸衍生物具有下式:
Figure BDA0002337530530002521
如本文所公开的,其中R为烷基(例如,C1-C10烷基)、取代的烷基、烷基酯或烷基-X,其中X是反应性基团或官能团,如本文所公开的。在一些实施方案中,从细胞裂解物、从培养基或从细胞裂解物和培养基二者中回收橄榄醇酸或橄榄醇酸衍生物。在某些这样的实施方案中,然后如本文所公开的,纯化回收的橄榄醇酸或橄榄醇酸衍生物。在一些实施方案中,通过基因修饰的宿主细胞将橄榄醇酸或橄榄醇酸衍生物进一步转化为大麻素衍生物或大麻素。
本发明还提供了产生大麻素或大麻素衍生物的方法,所述方法包括:在包含橄榄醇酸或橄榄醇酸衍生物的合适的培养基中培养本发明的基因修饰的宿主细胞,并回收产生的大麻素或大麻素衍生物。在某些这样的实施方案中,然后如本文所公开的,纯化产生的大麻素或大麻素衍生物。本发明还提供了产生大麻素衍生物的方法,所述方法包括:在包含橄榄醇酸或橄榄醇酸衍生物的合适的培养基中培养本发明的基因修饰的宿主细胞,并回收产生的大麻素衍生物。在某些这样的实施方案中,然后如本文所公开的,纯化产生的大麻素衍生物。
在一些实施方案中,基因修饰的宿主细胞用以下异源核酸基因修饰:a)一种或多种编码GOT多肽的异源核酸,和b)一种或多种编码产生GPP的多肽的异源核酸(例如,GPPS多肽)。在一些实施方案中,将橄榄醇酸或橄榄醇酸衍生物进一步转化为大麻素衍生物或大麻素。
本文使用的橄榄醇酸衍生物可以包含一种或多种如本文所公开的反应性基团和/或官能团。在一些实施方案中,当合适的培养基包含橄榄醇酸衍生物时,橄榄醇酸衍生物是苔色酸。在一些实施方案中,当合适的培养基包含橄榄醇酸衍生物时,所述橄榄醇酸衍生物是次大麻二酚酸(divarinic acid)。
在一些实施方案中,产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物的方法可以包括在有利于产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物的条件下使本发明的转基因(基因修饰的)植物生长。可以从植物或植物的一部分中纯化大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。本发明提供了由本发明的转基因(基因修饰的)植物制成的食品。
示例性细胞培养条件
合适的培养基可以包括标准培养基(例如Luria-Bertani肉汤,任选地补充一种或多种其他试剂,例如诱导剂(例如,其中本文公开的异源核酸在诱导型启动子的控制下等);标准酵母培养基;等等)。在一些实施方案中,培养基可以补充可发酵的糖(例如己糖,例如葡萄糖、木糖等)。在一些实施方案中,培养基可以补充己酸、除己酸以外的羧酸、橄榄醇酸或橄榄醇酸衍生物。在一些实施方案中,培养基可以补充预处理的纤维素原料(例如,小麦草、小麦秸秆、大麦秸秆、高粱、稻草、甘蔗秸秆、甘蔗渣、柳枝稷、玉米秸秆、玉米纤维、谷物或其任何组合)。在一些实施方案中,培养基可以补充油酸。在一些实施方案中,合适的培养基包含不可发酵的碳源。在某些这样的实施方案中,不可发酵的碳源包括乙醇。在一些实施方案中,合适的培养基包含诱导剂。在某些这样的实施方案中,诱导剂包括半乳糖。
合适的培养基中的碳源可以显著不同,从简单的糖如葡萄糖到其他生物质的更复杂的水解产物,如酵母提取物。盐的添加通常提供必需的元素,例如镁、氮、磷和硫,以允许细胞合成多肽和核酸。合适的培养基还可以补充选择性试剂,例如抗生素,以选择维持某些质粒等。例如,如果微生物对某种抗生素具有抗性,如氨苄青霉素或四环素,则可以将该抗生素添加到培养基中,以阻止缺乏抗性的细胞生长。合适的培养基可以根据需要补充其他化合物以选择期望的生理或生化特性,如特定的氨基酸等。
在一些实施方案中,本文公开的基因修饰的宿主细胞在基本培养基中生长。如本文所使用,术语“基本培养基”或“多种基本培养基”可以指包含细胞生长可能的最低营养物的生长培养基,通常但不总是在一种或多种氨基酸(例如,1、2、3、4、5、6、7、8、9、10或更多种氨基酸)不存在的情况下。基本培养基通常包含:(1)用于细胞(例如细菌或酵母)生长的碳源;(2)各种盐,其在细胞(例如细菌或酵母)物种和生长条件之间可能有所不同;和(3)水。
在一些实施方案中,本文公开的基因修饰的宿主细胞在丰富培养基或多种丰富培养基中生长。在某些这样的实施方案中,丰富培养基或多种丰富培养基包含酵母提取物蛋白胨右旋糖(YPD)培养基,其包含水、10g/L酵母提取物、20g/L细菌蛋白胨和20g/L右旋糖(葡萄糖)。在一些实施方案中,丰富培养基或多种丰富培养基包含YP+20g/L半乳糖和1g/L葡萄糖。在一些实施方案中,丰富培养基或多种丰富培养基还包含羧酸(例如,1mM橄榄醇酸、1mM橄榄醇酸衍生物、2mM己酸或2mM除己酸以外的羧酸)。在一些实施方案中,与多种基本培养基或基本培养基相比,丰富培养基或多种丰富培养基提供更快的细胞生长。
本文例如在实施例部分中描述了适用于本发明的重组细胞的维持和生长的材料和方法。适用于细胞(例如细菌或酵母)培养物的维持和生长的其他材料和方法在本领域中是众所周知的。示例性技术可以见于第WO2009/076676号国际公开文件、第12/335,071号美国专利申请(第2009/0203102号美国公开文件)、WO2010/003007、第2010/0048964号美国公开文件、WO2009/132220、第2010/0003716号美国公开文件、Manual of Methods forGeneral Bacteriology Gerhardt等人编、American Society for Microbiology,Washington,D.C.(1994)或Brock in Biotechnology:A Textbook of IndustrialMicrobiology,第二版(1989)Sinauer Associates,Inc.,Sunderland,MA.。
标准细胞培养条件可以用于培养本文公开的基因修饰的宿主细胞(参见,例如,WO2004/033646和其中引用的参考文献)。在一些实施方案中,使细胞生长并维持在合适的温度、气体混合物和pH下(例如在约20℃至约37℃下,在约0.04%至约84%CO2下,在约0%至约100%溶解氧下和在约2至约9的pH下)。在一些实施方案中,本文公开的基因修饰的宿主细胞在约34℃下在合适的细胞培养基中生长。在一些实施方案中,本文公开的基因修饰的宿主细胞在约20℃至约37℃下在合适的细胞培养基中生长。在一些实施方案中,本文公开的基因修饰的宿主细胞在约20℃、约21℃、约22℃、约23℃、约24℃、约25℃、约26℃、约27℃、约28℃、约29℃、约30℃、约31℃、约32℃、约33℃、约34℃、约35℃、约36℃或约37℃下在合适的细胞培养基中生长。在一些实施方案中,用于发酵的pH范围为约pH 3.0至约pH 9.0(如约pH 3.0、约pH 3.5、约pH 4.0、约pH 4.5、约pH 5.0、约pH 5.5、约pH 6.0、约pH 6.5、约pH 7.0、约pH 7.5、约pH 8.0、约pH 8.5、约pH 6.0至约pH 8.0或约6.5至约7.0)。在一些实施方案中,用于发酵的pH范围为约pH 4.5至约pH 5.5。在一些实施方案中,用于发酵的pH范围为约pH 4.0至约pH 6.0。在一些实施方案中,用于发酵的pH范围为约pH 3.0至约pH 6.0。在一些实施方案中,用于发酵的pH范围为约pH 3.0至约pH 5.5。在一些实施方案中,用于发酵的pH范围为约pH 3.0至约pH 5.0。在一些实施方案中,溶解氧为约0%至约10%、约0%至约20%、约0%至约30%、约0%至约40%、约0%至约50%、约0%至约60%、约0%至约70%、约0%至约80%、约0%至约90%、约5%至约10%、约5%至约20%、约5%至约30%、约5%至约40%、约5%至约50%、约5%至约60%、约5%至约70%、约5%至约80%、约5%至约90%、约10%至约20%、约10%至约30%、约10%至约40%或约10%至约50%。在一些实施方案中,CO2水平为约0.04%至约0.1%CO2、约0.04%至约1%CO2、约0.04%至约5%CO2、约0.04%至约10%CO2、约0.04%至约20%CO2、约0.04%至约30%CO2、约0.04%至约40%CO2、约0.04%至约50%CO2、约0.04%至约60%CO2、约0.04%至约70%CO2、约0.1%至约5%CO2、约0.1%至约10%CO2、约0.1%至约20%CO2、约0.1%至约30%CO2、约0.1%至约40%CO2、约0.1%至约50%CO2、约1%至约5%CO2、约1%至约10%CO2、约1%至约20%CO2、约1%至约30%CO2、约1%至约40%CO2、约1%至约50%CO2、约5%至约10%CO2、约10%至约20%CO2、约10%至约30%CO2、约10%至约40%CO2、约10%至约50%CO2、约10%至约60%CO2、约10%至约70%CO2、约10%至约80%CO2、约50%至约60%CO2、约50%至约70%CO2或约50%至约80%CO2。基于细胞的需要,本文公开的基因修饰的宿主细胞可以在需氧、缺氧、微需氧或厌氧条件下生长。
第WO2009/076676号国际公开文件、第12/335,071号美国专利申请(第2009/0203102号美国公开文件)、WO2010/003007、第2010/0048964号美国公开文件、WO2009/132220、第2010/0003716号美国公开文件中描述了可以使用的标准培养条件和发酵模式,例如分批、补料分批或连续发酵,其全部内容通过引用整体并入本文。分批和补料分批发酵在本领域中是普遍且众所周知的,实例可见于Brock,Biotechnology:A Textbook ofIndustrial Microbiology,第二版(1989)Sinauer Associates,Inc.。
产生的大麻素、大麻素前体、大麻素衍生物或大麻素前体衍生物的产生和回收
在一些实施方案中,本发明的方法提供了本发明的基因修饰的宿主细胞以约1mg/L培养基至约1g/L培养基的可回收量产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。在一些实施方案中,本发明的方法提供了以约1mg/L培养基至约500mg/L培养基的可回收量产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。在一些实施方案中,本发明的方法提供了以约1mg/L培养基至约100mg/L培养基的可回收量产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。例如,在一些实施方案中,本发明的方法提供了以约1mg/L培养基至约5mg/L培养基、约5mg/L培养基至约10mg/L培养基、约10mg/L培养基至约25mg/L培养基、约25mg/L培养基至约50mg/L培养基、约50mg/L培养基至约75mg/L培养基或约75mg/L培养基至约100mg/L培养基的可回收量产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。在一些实施方案中,本发明的方法提供了以约100mg/L培养基至约150mg/L培养基、约150mg/L培养基至约200mg/L培养基、约200mg/L培养基至约250mg/L培养基、约250mg/L培养基至约500mg/L培养基、约500mg/L培养基至约750mg/L培养基或约750mg/L培养基至约1g/L培养基的可回收量产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。在一些实施方案中,本发明的方法提供了以约50mg/L培养基至约100mg/L培养基、约50mg/L培养基至约150mg/L培养基、约50mg/L培养基至约200mg/L培养基、约50mg/L培养基至约250mg/L培养基、约50mg/L培养基至约500mg/L培养基或约50mg/L培养基至约750mg/L培养基的可回收量产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。
在一些实施方案中,本发明的方法提供了以约100mg/L培养基至约500mg/L培养基或多于500mg/L培养基的可回收量产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。在一些实施方案中,本发明的方法提供了以约500mg/L培养基至约1g/L培养基或多于1g/L培养基的可回收量产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。在一些实施方案中,本发明的方法提供了以约1g/L培养基至约10g/L培养基或多于10g/L培养基的可回收量产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。在一些实施方案中,本发明的方法提供了以约10g/L培养基至约100g/L培养基或多于100g/L培养基的可回收量产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。在一些实施方案中,本发明的方法提供了以约1g/L培养基至约20g/L培养基或多于20g/L培养基的可回收量产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。在一些实施方案中,本发明的方法提供了以约1g/L培养基至约30g/L培养基或多于30g/L培养基的可回收量产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。在一些实施方案中,本发明的方法提供了以约1g/L培养基至约40g/L培养基或多于40g/L培养基的可回收量产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。在一些实施方案中,本发明的方法提供了以约1g/L培养基至约50g/L培养基或多于50g/L培养基的可回收量产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。在一些实施方案中,本发明的方法提供了以约1g/L培养基至约60g/L培养基或多于60g/L培养基的可回收量产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。在一些实施方案中,本发明的方法提供了以约1g/L培养基至约70g/L培养基或多于70g/L培养基的可回收量产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。在一些实施方案中,本发明的方法提供了以约1g/L培养基至约80g/L培养基或多于80g/L培养基的可回收量产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。在一些实施方案中,本发明的方法提供了以约1g/L培养基至约90g/L培养基或多于90g/L培养基的可回收量产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。在一些实施方案中,本发明的方法提供了以约10g/L培养基至约20g/L培养基或多于20g/L培养基的可回收量产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。在一些实施方案中,本发明的方法提供了以约10g/L培养基至约30g/L培养基或多于30g/L培养基的可回收量产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。在一些实施方案中,本发明的方法提供了以约10g/L培养基至约40g/L培养基或多于40g/L培养基的可回收量产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。在一些实施方案中,本发明的方法提供了以约10g/L培养基至约50g/L培养基或多于50g/L培养基的可回收量产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。在一些实施方案中,本发明的方法提供了以约10g/L培养基至约60g/L培养基或多于60g/L培养基的可回收量产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。在一些实施方案中,本发明的方法提供了以约10g/L培养基至约70g/L培养基或多于70g/L培养基的可回收量产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。在一些实施方案中,本发明的方法提供了以约10g/L培养基至约80g/L培养基或多于80g/L培养基的可回收量产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。在一些实施方案中,本发明的方法提供了以约10g/L培养基至约90g/L培养基或多于90g/L培养基的可回收量产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。在一些实施方案中,本发明的方法提供了以约50g/L培养基至约100g/L培养基或多于100g/L培养基的可回收量产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。在一些实施方案中,本发明的方法提供了以约50g/L培养基至约60g/L培养基或多于60g/L培养基的可回收量产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。在一些实施方案中,本发明的方法提供了以约50g/L培养基至约70g/L培养基或多于70g/L培养基的可回收量产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。在一些实施方案中,本发明的方法提供了以约50g/L培养基至约80g/L培养基或多于80g/L培养基的可回收量产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。在一些实施方案中,本发明的方法提供了以约50g/L培养基至约90g/L培养基或多于90g/L培养基的可回收量产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。在一些实施方案中,本发明的方法提供了以约20g/L培养基至约100g/L培养基或多于100g/L培养基的可回收量产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。在一些实施方案中,本发明的方法提供了以约20g/L培养基至约30g/L培养基或多于30g/L培养基的可回收量产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。在一些实施方案中,本发明的方法提供了以约20g/L培养基至约40g/L培养基或多于40g/L培养基的可回收量产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。在一些实施方案中,本发明的方法提供了以约20g/L培养基至约50g/L培养基或多于50g/L培养基的可回收量产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。在一些实施方案中,本发明的方法提供了以约20g/L培养基至约60g/L培养基或多于60g/L培养基的可回收量产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。在一些实施方案中,本发明的方法提供了以约20g/L培养基至约70g/L培养基或多于70g/L培养基的可回收量产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。在一些实施方案中,本发明的方法提供了以约20g/L培养基至约80g/L培养基或多于80g/L培养基的可回收量产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。在一些实施方案中,本发明的方法提供了以约20g/L培养基至约90g/L培养基或多于90g/L培养基的可回收量产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。
在一些实施方案中,本文公开的基因修饰的宿主细胞在包含前体酸的液体培养基中培养以产生酰基辅酶A化合物或酰基辅酶A化合物衍生物。合适的前体酸可包括但不限于羧酸。
在一些实施方案中,产生大麻素、大麻素衍生物、大麻素前体、大麻素前体衍生物或大麻素前体衍生物的方法可以包括在有利于产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物的条件下培养本发明的基因修饰的酵母细胞;其中所述大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物由基因修饰的酵母细胞产生,并且存在于在其中培养基因修饰的酵母细胞的培养基(例如,液体培养基)中。在一些实施方案中,在其中培养基因修饰的酵母细胞的培养基以1ng/L至1g/L(例如,1ng/L至50ng/L、50ng/L至100ng/L、100ng/L至500ng/L、500ng/L至1μg/L、1μg/L至50μg/L、50μg/L至100μg/L、100μg/L至500μg/L、500μg/L至1mg/L、1mg/L至50mg/L、50mg/L至100mg/L、100mg/L至500mg/L或500mg/L至1g/L)的量包含大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。在一些实施方案中,在其中培养基因修饰的酵母细胞的培养基以多于1g/L的量包含大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。
在一些实施方案中,产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物的方法可以包括在有利于糖发酵的条件下和在有利于产生大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物的条件下培养本发明的基因修饰的酵母细胞;其中所述大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物由基因修饰的酵母细胞产生,并且存在于由基因修饰的酵母细胞产生的醇中。本发明提供了由基因修饰的酵母细胞产生的酒精饮料,其中所述酒精饮料包含由基因修饰的酵母细胞产生的大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。酒精饮料可以包括啤酒、葡萄酒和蒸馏酒精饮料。在一些实施方案中,本发明的酒精饮料以1ng/L至1g/L(例如,1ng/L至50ng/L、50ng/L至100ng/L、100ng/L至500ng/L、500ng/L至1μg/L、1μg/L至50μg/L、50μg/L至100μg/L、100μg/L至500μg/L、500μg/L至1mg/L、1mg/L至50mg/L、50mg/L至100mg/L、100mg/L至500mg/L或500mg/L至1g/L)的量包含大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。在一些实施方案中,本发明的酒精饮料以多于1g/L的量包含大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。
在一些实施方案中,本发明的方法提供了增加的大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物的产生。在某些这样的实施方案中,在合适的培养基中培养本文公开的基因修饰的宿主细胞以与在类似条件下培养的非基因修饰的宿主细胞相比增加的量提供大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物的合成。与在类似条件下培养的非基因修饰的宿主细胞相比,本文公开的基因修饰的宿主细胞产生的大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物可以增加约5%至约1,000,000倍。与在类似条件下培养的非基因修饰的宿主细胞产生的大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物相比,本文公开的基因修饰的宿主细胞产生的大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物可以增加约10%至约1,000,000倍(例如,约50%至约1,000,000倍、约1至约500,000倍、约1至约50,000倍、约1至约5,000倍、约1至约1,000倍、约1至约500倍、约1至约100倍、约1至约50倍、约5至约100,000倍、约5至约10,000倍、约5至约1,000倍、约5至约500倍、约5至约100倍、约10至约50,000倍、约50至约10,000倍、约100至约5,000倍、约200至约1,000倍、约50至约500倍或约50至约200倍)。与在类似条件下培养的非基因修饰的宿主细胞产生的大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物相比,本文公开的基因修饰的宿主细胞产生的大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物还可以增加至少约10%、20%、30%、40%、50%、60%、70%、80%、90%、1倍、2倍、5倍、10倍、20倍、50倍、100倍、200倍、500倍、1000倍、2000倍、5000倍、10,000倍、20,000倍、50,000倍、100,000倍、200,000倍、500,000倍或1,000,000倍中的任一种。
在一些实施方案中,与在类似条件下培养的非基因修饰的宿主细胞产生的大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物相比,本发明的基因修饰的宿主细胞产生的大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物还可以增加至少约10%、20%、30%、40%、50%、60%、70%、80%或90%中的任一种。在一些实施方案中,与在类似条件下培养的非基因修饰的宿主细胞产生的大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物相比,本文公开的基因修饰的宿主细胞产生的大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物还可以增加至少约1-20%、2-20%、5-20%、10-20%、15-20%、1-15%、1-10%、2-15%、2-10%、5-15%、10-15%、1-50%、10-50%、20-50%、30-50%、40-50%、50-100%、50-60%、50-70%、50-80%或50-90%中的任一种。
在一些实施方案中,通过LC-MS分析确定本发明的基因修饰的宿主细胞产生的大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。在某些这样的实施方案中,每种大麻素、大麻素前体、大麻素衍生物或大麻素前体衍生物通过由可信的标准品确定的保留时间和多反应监测(MRM)转变确定。
在一些实施方案中,本发明的基因修饰的宿主细胞是酵母细胞。在某些这样的实施方案中,在生物反应器中培养本文公开的基因修饰的宿主细胞。在一些实施方案中,在补充己酸、除己酸以外的羧酸、橄榄醇酸或橄榄醇酸衍生物的合适的培养基中培养基因修饰的宿主细胞。
在一些实施方案中,从细胞裂解物中回收大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物,例如,通过裂解本文公开的基因修饰的宿主细胞并从裂解物中回收大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。在其他情况下,从其中培养本文公开的基因修饰的宿主细胞的培养基中回收大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。在其他情况下,从细胞裂解物和培养基二者中回收大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。
在一些实施方案中,然后纯化回收的大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。在一些实施方案中,可以用合适的有机溶剂提取来自包含本发明的基因修饰的宿主细胞的培养物的全细胞肉汤,以提供大麻素、大麻素前体、大麻素衍生物或大麻素前体衍生物。合适的有机溶剂包括但不限于,己烷、庚烷、乙酸乙酯、石油醚和二乙醚、氯仿和乙酸乙酯。在一些实施方案中,合适的有机溶剂包含己烷。在一些实施方案中,合适的有机溶剂可以以10:1的比例(10份全细胞肉汤—1份有机溶剂)添加到来自包含本发明的基因修饰的宿主细胞的发酵物的全细胞肉汤中,并搅拌30分钟。在某些这样的实施方案中,可以分离有机级分,并用等体积的酸性水(pH2.5)萃取两次。然后可以分离有机层并在浓缩器(在减压下在旋转蒸发器或薄膜蒸发器)中干燥以获得粗大麻素、大麻素前体、大麻素衍生物或大麻素前体衍生物晶体。在某些这样的实施方案中,可以将粗晶体加热至105℃持续15分钟,然后加热至145℃持续55分钟以使粗大麻素或大麻素衍生物脱羧。在某些这样的实施方案中,可以将粗结晶产物在合适的溶剂(例如正戊烷)中重新溶解和重结晶并过滤,以除去任何不溶性物质。在某些这样的实施方案中,然后可以例如通过旋转蒸发除去溶剂,以产生纯的结晶产物。
在一些实施方案中,大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物是纯的,例如至少约40%的纯度、至少约50%的纯度、至少约60%的纯度、至少约70%的纯度、至少约80%的纯度、至少约90%的纯度、至少约95%的纯度、至少约98%或大于98%的纯度,其中“纯的”在大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物的上下文中可以指不含其他大麻素、大麻素衍生物、大麻素前体、大麻素前体衍生物大分子、污染物等的大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。
产生大麻素、大麻素前体、橄榄醇酸衍生物、橄榄醇酸、大麻素衍生物或大麻素前 体衍生物的无细胞方法
本发明的方法可以包括使用由本发明的基因修饰的宿主细胞表达或过表达的一种或多种本文公开的多肽无细胞产生大麻素、大麻素前体、大麻素前体衍生物或大麻素衍生物。在一些实施方案中,由本发明的基因修饰的宿主细胞表达或过表达的一种或多种本文公开的多肽用于无细胞系统中,以产生大麻素、大麻素前体、大麻素前体衍生物或大麻素衍生物。在某些这样的实施方案中,用于产生大麻素、大麻素前体、大麻素前体衍生物或大麻素衍生物的适宜的起始原料可以在合适的反应容器中与由本发明的基因修饰的宿主细胞表达或过表达的一种或多种本文公开的多肽混合在一起以进行反应。由本发明的基因修饰的宿主细胞表达或过表达的一种或多种本文公开的多肽可以组合使用,以由适宜的起始原料实现大麻素、大麻素前体、大麻素前体衍生物或大麻素衍生物的全合成。在一些实施方案中,从包含本文公开的多肽中的一种或多种的无细胞反应混合物中回收大麻素、大麻素前体、大麻素前体衍生物或大麻素衍生物。
在一些实施方案中,然后纯化回收的大麻素、大麻素前体、大麻素前体衍生物或大麻素衍生物。在某些这样的实施方案中,可以用合适的有机溶剂提取包含本文公开的多肽中的一种或多种的无细胞反应混合物,以提供大麻素、大麻素前体、大麻素衍生物或大麻素前体衍生物。合适的有机溶剂包括但不限于,己烷、庚烷、乙酸乙酯、石油醚和二乙醚、氯仿和乙酸乙酯。在一些实施方案中,合适的有机溶剂包含己烷。在一些实施方案中,合适的有机溶剂可以以10:1的比例(10份反应混合物--1份有机溶剂)添加到包含本文公开的多肽中的一种或多种的无细胞反应混合物中,并搅拌30分钟。在某些这样的实施方案中,可以分离有机级分,并用等体积的酸性水(pH 2.5)萃取两次。然后可以分离有机层并在浓缩器(在减压下在旋转蒸发器或薄膜蒸发器)中干燥以获得粗大麻素、大麻素前体、大麻素衍生物或大麻素前体衍生物晶体。在某些这样的实施方案中,可以将粗晶体加热至105℃持续15分钟,然后加热至145℃持续55分钟以使粗大麻素或大麻素衍生物脱羧。在某些这样的实施方案中,可以将粗结晶产物在合适的溶剂(例如正戊烷)中重新溶解和重结晶并过滤,以除去任何不溶性物质。在某些这样的实施方案中,然后可以例如通过旋转蒸发除去溶剂,以产生纯的结晶产物。
在一些实施方案中,异戊烯基受体分子、异戊烯基供体分子和GOT多肽可以在合适的反应容器中混合在一起以进行反应。在某些这样的实施方案中,GOT多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由GPP和橄榄醇酸产生大麻萜酚酸。在一些实施方案中,GOT多肽包含与SEQ ID NO:100或SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列。在一些实施方案中,异戊烯基受体分子是橄榄醇酸或其衍生物。在一些实施方案中,异戊烯基供体分子是GPP或其衍生物。在一些实施方案中,反应产生大麻萜酚酸或其衍生物。
在一些实施方案中,由本发明的基因修饰的宿主细胞表达或过表达的一种或多种本文公开的多肽无细胞产生的大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物通过LC-MS分析确定。在某些这样的实施方案中,每种大麻素、大麻素前体、大麻素衍生物或大麻素前体衍生物通过由可信的标准品确定的保留时间和多反应监测(MRM)转变确定。
本发明的非限制性实施方案的实例
本文公开的本主题的实施方案单独或与一种或多种其他实施方案组合可以是有益的。在不限制前述描述的情况下,在下文中提供了本发明的某些非限制性实施方案,编号为I-1至I-54,II-1至II-55和III-1至III-81。对于本领域技术人员而言,在阅读本发明后将显而易见的是,每个单独编号的实施方案可以与任何之前或之后的单独编号的实施方案一起使用或组合。这旨在为实施方案的所有这样的组合提供支持,并且不限于以下明确提供的实施方案的组合。本发明的一些实施方案具有实施方案I:
实施方案I-1.一种产生大麻素化合物或大麻素前体的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用以下异源核酸基因修饰:a)一种或多种编码一种或多种产生己酰辅酶A或己酰辅酶A的衍生物的多肽的异源核酸;b)一种或多种编码一种或多种产生香叶基焦磷酸的多肽的异源核酸;c)一种或多种编码一种或多种产生丙二酰辅酶A的多肽的异源核酸;d)一种或多种异源核酸,其编码使己酰辅酶A或其衍生物与丙二酰辅酶A缩合以产生橄榄醇酸或橄榄醇酸的衍生物的融合TKS/OAC多肽;e)一种或多种编码截短的香叶基焦磷酸:橄榄醇酸香叶基转移酶(GOT)多肽或NphB多肽的异源核酸;和f)一种或多种编码大麻素合成酶多肽的异源核酸,其中在合适的培养基中培养基因修饰的宿主细胞提供了可回收量的大麻素化合物或大麻素前体的合成。
实施方案I-2.实施方案I-1所述的基因修饰的宿主细胞,其中所述宿主细胞是真核细胞。
实施方案I-3.实施方案I-2所述的基因修饰的宿主细胞,其中所述宿主细胞是酵母细胞。
实施方案I-4.实施方案I-3所述的基因修饰的宿主细胞,其中所述宿主细胞是酿酒酵母。
实施方案I-5.实施方案I-4所述的基因修饰的宿主细胞,其中所述宿主细胞是酿酒酵母的蛋白酶缺陷菌株。
实施方案I-6.实施方案I-2所述的基因修饰的宿主细胞,其中所述宿主细胞是植物细胞。
实施方案I-7.实施方案I-1所述的基因修饰的宿主细胞,其中所述宿主细胞是原核细胞。
实施方案I-8.实施方案I-1所述的基因修饰的宿主细胞,其中一种或多种产生己酰辅酶A或己酰辅酶A衍生物的多肽是己酰辅酶A合成酶(HCS)多肽,并且其中所述培养基包含己酸。
实施方案I-9.实施方案I-6所述的基因修饰的宿主细胞,其中所述HCS多肽包含与SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3或SEQ ID NO:4所示的氨基酸序列具有至少50%(至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%)的氨基酸序列同一性的氨基酸。
实施方案I-10.实施方案I-1所述的基因修饰的宿主细胞,其中一种或多种产生香叶基焦磷酸的多肽包括香叶基焦磷酸合成酶(GPPS)多肽。
实施方案I-11.实施方案I-11所述的基因修饰的宿主细胞,其中所述GPPS多肽包含与SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7或SEQ ID NO:8所示的氨基酸序列之一具有至少50%(至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%)的氨基酸序列同一性的氨基酸。
实施方案I-12.实施方案I-10所述的基因修饰的宿主细胞,其中所述GPPS多肽是显性失活变体,其降低内源GPPS多肽充当法呢基焦磷酸合成酶(FPPS)多肽的能力。
实施方案I-13.实施方案I-10所述的基因修饰的宿主细胞,其中所述GPPS多肽包含K197G氨基酸取代。
实施方案I-14.实施方案I-10所述的基因修饰的宿主细胞,其中所述GPPS多肽是异源二聚体蛋白,其包含GPPS大亚基多肽和GPPS小亚基多肽或同源二聚体或单体GPPS多肽。
实施方案I-15.实施方案I-1所述的基因修饰的宿主细胞,其中所述一种或多种产生丙二酰辅酶A的多肽包括乙酰辅酶A羧化酶-1(ACC1)多肽。
实施方案I-16.实施方案I-15所述的基因修饰的宿主细胞,其中所述ACC1多肽包含与SEQ ID NO:9所示的氨基酸序列具有至少50%(至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%)的氨基酸序列同一性的氨基酸。
实施方案I-17.实施方案I-1所述的基因修饰的宿主细胞,其中一种或多种产生己酰辅酶A的多肽包括MCT1多肽、PaaH1多肽、Crt多肽、Ter多肽和BktB多肽。
实施方案I-18.实施方案I-1所述的基因修饰的宿主细胞,其中一种或多种产生己酰辅酶A的多肽包括MCT1多肽、PhaB多肽、PhaJ多肽、Ter多肽和BktB多肽。
实施方案I-19.实施方案I-17所述的基因修饰的宿主细胞,其中:i)PaaH1多肽包含与SEQ ID NO:18或SEQ ID NO:46所示的氨基酸序列具有至少50%(至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%)的氨基酸序列同一性的氨基酸;ii)Crt多肽包含与SEQ ID NO:19或SEQ ID NO:48所示的氨基酸序列具有至少50%(至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%)的氨基酸序列同一性的氨基酸;iii)Ter多肽包含与SEQ ID NO:20或SEQ ID NO:50所示的氨基酸序列具有至少50%(至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%)的氨基酸序列同一性的氨基酸;和iv)BktB多肽包含与SEQ ID NO:21或SEQ ID NO:44所示的氨基酸序列具有至少50%(至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%)的氨基酸序列同一性的氨基酸。
实施方案I-20.实施方案I-18所述的基因修饰的宿主细胞,其中:i)PhaB多肽包含与SEQ ID NO:94所示的氨基酸序列具有至少50%(至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%)的氨基酸序列同一性的氨基酸;ii)PhaJ多肽包含与SEQ ID NO:96所示的氨基酸序列具有至少50%(至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%)的氨基酸序列同一性的氨基酸;iii)Ter多肽包含与SEQ ID NO:20或SEQ ID NO:50所示的氨基酸序列具有至少50%(至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%)的氨基酸序列同一性的氨基酸;和iv)BktB多肽包含与SEQ ID NO:21或SEQ ID NO:44所示的氨基酸序列具有至少50%(至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%)的氨基酸序列同一性的氨基酸。
实施方案I-21.实施方案I-1所述的基因修饰的宿主细胞,其中所述宿主细胞用编码一种或多种调节NADH氧化还原平衡的多肽的异源核酸基因修饰。
实施方案I-22.实施方案I-1所述的基因修饰的宿主细胞,其中所述宿主细胞用以下异源核酸中的一种或多种基因修饰:i)一种或多种编码HMG-辅酶A合成酶多肽的异源核酸;ii)一种或多种编码3-羟基-3-甲基-戊二酰辅酶A还原酶(HMGR)多肽的异源核酸;iii)一种或多种编码MK多肽的异源核酸;和iv)一种或多种编码异戊烯基焦磷酸异构酶(IDI)多肽的异源核酸。
实施方案I-23.实施方案I-22所述的基因修饰的宿主细胞,其中所述宿主细胞被基因修饰以过表达异源IDI多肽。
实施方案I-24.实施方案I-23所述的基因修饰的宿主细胞,其中所述IDI多肽包含与SEQ ID NO:58所示的氨基酸序列具有至少50%(至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%)的氨基酸序列同一性的氨基酸。
实施方案I-25.实施方案I-22所述的基因修饰的宿主细胞,其中所述宿主细胞被基因修饰以过表达截短的HMGR(tHMGR)多肽。
实施方案I-26.实施方案I-25所述的基因修饰的宿主细胞,其中所述tHMGR多肽包含与SEQ ID NO:17所示的氨基酸序列具有至少50%(至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%)的氨基酸序列同一性的氨基酸。
实施方案I-27.实施方案I-22所述的基因修饰的宿主细胞,其中所述HMGR多肽包含与SEQ ID NO:22所示的氨基酸序列具有至少50%(至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%)的氨基酸序列同一性的氨基酸。
实施方案I-28.实施方案I-22所述的基因修饰的宿主细胞,其中所述HMGS多肽包含与SEQ ID NO:23所示的MvaS多肽氨基酸序列具有至少50%(至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%)的氨基酸序列同一性的氨基酸,或其中所述HMGS多肽包含与SEQ ID NO:24所示的ERG13多肽氨基酸序列具有至少50%的氨基酸序列同一性的氨基酸。
实施方案I-29.实施方案I-22所述的基因修饰的宿主细胞,其中所述MK多肽包含与SEQ ID NO:64所示的ERG12多肽氨基酸序列具有至少50%(至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%)的氨基酸序列同一性的氨基酸。
实施方案I-30.实施方案I-1所述的基因修饰的宿主细胞,其中所述宿主细胞用异源核酸基因修饰,所述异源核酸编码一种或多种使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽。
实施方案I-31.实施方案I-30所述的基因修饰的宿主细胞,其中所述使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽是乙酰乙酰辅酶A硫解酶多肽。
实施方案I-32.实施方案I-31所述的基因修饰的宿主细胞,其中所述乙酰乙酰辅酶A硫解酶多肽包含与SEQ ID NO:25所示的氨基酸序列具有至少50%(至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%)的氨基酸序列同一性的氨基酸。
实施方案I-33.实施方案I-1所述的基因修饰的宿主细胞,其中所述宿主细胞用异源核酸基因修饰,所述异源核酸编码一种或多种使一分子乙酰辅酶A和一分子丙二酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽。
实施方案I-34.实施方案I-1至I-33中任一项所述的基因修饰的宿主细胞,其中一种或多种异源核酸中的至少一种整合到所述宿主细胞的染色体中。
实施方案I-35.实施方案I-1至I-33中任一项所述的基因修饰的宿主细胞,其中一种或多种异源核酸中的至少一种保持在染色体外。
实施方案I-36.实施方案I-1至I-33中任一项所述的基因修饰的宿主细胞,其中一种或多种异源核酸中的两种或更多种存在于单一表达载体中。
实施方案I-37.实施方案I-1至I-36中任一项所述的基因修饰的宿主细胞,其中所述大麻素化合物是大麻萜酚酸。
实施方案I-38.实施方案I-1所述的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用编码Δ9-THCA合成酶多肽的异源核酸基因修饰。
实施方案I-39.实施方案I-38所述的基因修饰的宿主细胞,其中所述THCA合成酶多肽包含与SEQ ID NO:14或SEQ ID NO:15具有至少50%(至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%)的氨基酸序列同一性的氨基酸。
实施方案I-40.实施方案I-1所述的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用编码CBDA合成酶多肽的异源核酸基因修饰。
实施方案I-41.实施方案I-40所述的基因修饰的宿主细胞,其中所述CBDA合成酶多肽包含与SEQ ID NO:88或SEQ ID NO:16具有至少50%(至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%)的氨基酸序列同一性的氨基酸。
实施方案I-42.实施方案I-1至I-41中任一项所述的基因修饰的宿主细胞,其中异源核酸中的至少一种可操作地连接到诱导型启动子。
实施方案I-43.实施方案I-1至I-41中任一项所述的基因修饰的宿主细胞,其中异源核酸中的至少一种可操作地连接到组成型启动子。
实施方案I-44.实施方案I-1所述的基因修饰的宿主细胞,其中所述大麻素化合物是大麻色烯酸、大麻萜酚酸、Δ9-四氢大麻酚酸、大麻二酚酸、Δ9-四氢大麻酚、大麻二酚或大麻色烯。
实施方案I-45.一种在宿主细胞中合成大麻素化合物或大麻素前体的方法,所述方法包括:a)在合适的培养基中培养实施方案I-1至I-40中任一项所述的宿主细胞;和b)回收产生的大麻素化合物或大麻素前体。
实施方案I-46.实施方案I-45所述的方法,其中所述培养基包含可发酵的糖。
实施方案I-47.实施方案I-45所述的方法,其中所述培养基包含预处理的纤维素原料。
实施方案I-48.一种产生橄榄醇酸衍生物的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用以下异源核酸基因修饰:a)一种或多种编码酰基活化酶(AAE)多肽的异源核酸;和b)一种或多种编码TKS/OAC融合多肽的异源核酸。
实施方案I-49.实施方案I-48所述的基因修饰的宿主细胞,其中所述AAE多肽包含与SEQ ID NO:90或SEQ ID NO:91所示的AAE氨基酸序列具有至少50%(至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%或100%)的氨基酸序列同一性的氨基酸序列。
实施方案I-50.一种产生大麻素衍生物的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用以下异源核酸基因修饰:a)一种或多种编码酰基活化酶(AAE)多肽的异源核酸;b)一种或多种编码TKS/OAC融合多肽的异源核酸;和c)一种或多种编码GOT多肽或NphB多肽的异源核酸。
实施方案I-51.实施方案I-50所述的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用编码THCAS多肽的异源核酸基因修饰。
实施方案I-52.实施方案I-50所述的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用编码CBDAS多肽的异源核酸基因修饰。
实施方案I-53.一种产生橄榄醇酸衍生物的方法,所述方法包括在包含羧酸的培养基中培养实施方案I-48或实施方案I-49的基因修饰的宿主细胞。
实施方案I-54.一种产生大麻素衍生物的方法,所述方法包括在包含羧酸的培养基中培养实施方案I-50至I-52中任一项所述的基因修饰的宿主细胞。
本发明的一些实施方案具有实施方案II:
实施方案II-1.一种产生大麻素化合物、大麻素衍生物或大麻素前体的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用以下异源核酸基因修饰:a)一种或多种编码一种或多种产生己酰辅酶A或己酰辅酶A的衍生物的多肽的异源核酸;b)一种或多种编码一种或多种产生香叶基焦磷酸的多肽的异源核酸;c)一种或多种编码一种或多种产生丙二酰辅酶A的多肽的异源核酸;d)一种或多种编码TKS多肽和OAC多肽或融合TKS和OAC多肽的异源核酸,所述TKS多肽和OAC多肽或融合TKS和OAC多肽使己酰辅酶A或其衍生物和丙二酰辅酶A转化为橄榄醇酸或橄榄醇酸的衍生物;e)一种或多种编码香叶基焦磷酸:橄榄醇酸香叶基转移酶(GOT)多肽或NphB多肽的异源核酸;和f)一种或多种编码大麻素合成酶多肽的异源核酸,其中在合适的培养基中培养基因修饰的宿主细胞提供了可回收量的大麻素化合物、大麻素衍生物或大麻素前体的合成。
实施方案II-2.实施方案II-1所述的基因修饰的宿主细胞,其中所述宿主细胞是真核细胞。
实施方案II-3.实施方案II-2所述的基因修饰的宿主细胞,其中所述宿主细胞是酵母细胞。
实施方案II-4.实施方案II-3所述的基因修饰的宿主细胞,其中所述宿主细胞是酿酒酵母。
实施方案II-5.实施方案II-4所述的基因修饰的宿主细胞,其中所述宿主细胞是酿酒酵母的蛋白酶缺陷菌株。
实施方案II-6.实施方案II-2所述的基因修饰的宿主细胞,其中所述宿主细胞是植物细胞。
实施方案II-7.实施方案II-1所述的基因修饰的宿主细胞,其中所述宿主细胞是原核细胞。
实施方案II-8.实施方案II-1所述的基因修饰的宿主细胞,其中一种或多种产生己酰辅酶A或己酰辅酶A衍生物的多肽是己酰辅酶A合成酶(HCS)多肽,并且其中所述培养基包含己酸。
实施方案II-9.实施方案II-8所述的基因修饰的宿主细胞,其中所述HCS多肽包含与SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3或SEQ ID NO:4所示的氨基酸序列具有至少50%的氨基酸序列同一性的氨基酸。
实施方案II-10.实施方案II-1所述的基因修饰的宿主细胞,其中所述一种或多种产生香叶基焦磷酸的多肽包括香叶基焦磷酸合成酶(GPPS)多肽。
实施方案II-11.实施方案II-11所述的基因修饰的宿主细胞,其中所述GPPS多肽包含与SEQ ID NO:5、SEQ ID NO:6、SEQ ID NO:7或SEQ ID NO:8所示的氨基酸序列之一具有至少50%的氨基酸序列同一性的氨基酸。
实施方案II-12.实施方案II-10所述的基因修饰的宿主细胞,其中所述GPPS多肽是显性失活变体,其降低内源GPPS多肽充当法呢基焦磷酸合成酶(FPPS)多肽的能力。
实施方案II-13.实施方案II-10所述的基因修饰的宿主细胞,其中所述GPPS多肽包含K197G氨基酸取代。
实施方案II-14.实施方案II-10所述的基因修饰的宿主细胞,其中所述GPPS多肽是异源二聚体蛋白,其包含GPPS大亚基多肽和GPPS小亚基多肽或同源二聚体或单体GPPS多肽。
实施方案II-15.实施方案II-1所述的基因修饰的宿主细胞,其中所述一种或多种产生丙二酰辅酶A的多肽包括乙酰辅酶A羧化酶-1(ACC1)多肽。
实施方案II-16.实施方案II-15所述的基因修饰的宿主细胞,其中所述ACC1多肽包含与SEQ ID NO:9所示的氨基酸序列具有至少50%的氨基酸序列同一性的氨基酸。
实施方案II-17.实施方案II-1所述的基因修饰的宿主细胞,其中所述一种或多种产生己酰辅酶A的多肽包括MCT1多肽、PaaH1多肽、Crt多肽、Ter多肽和BktB多肽。
实施方案II-18.实施方案II-1所述的基因修饰的宿主细胞,其中所述一种或多种产生己酰辅酶A的多肽包括MCT1多肽、PhaB多肽、PhaJ多肽、Ter多肽和BktB多肽。
实施方案II-19.实施方案II-17所述的基因修饰的宿主细胞,其中:i)PaaH1多肽包含与SEQ ID NO:18或SEQ ID NO:46所示的氨基酸序列具有至少50%的氨基酸序列同一性的氨基酸;ii)Crt多肽包含与SEQ ID NO:19或SEQ ID NO:48所示的氨基酸序列具有至少50%的氨基酸序列同一性的氨基酸;iii)Ter多肽包含与SEQ ID NO:20或SEQ ID NO:50所示的氨基酸序列具有至少50%的氨基酸序列同一性的氨基酸;和iv)BktB多肽包含与SEQID NO:21或SEQ ID NO:44所示的氨基酸序列具有至少50%的氨基酸序列同一性的氨基酸。
实施方案II-20.实施方案II-18所述的基因修饰的宿主细胞,其中:i)PhaB多肽包含与SEQ ID NO:94所示的氨基酸序列具有至少50%的氨基酸序列同一性的氨基酸;ii)PhaJ多肽包含与SEQ ID NO:96所示的氨基酸序列具有至少50%的氨基酸序列同一性的氨基酸;iii)Ter多肽包含与SEQ ID NO:20或SEQ ID NO:50所示的氨基酸序列具有至少50%的氨基酸序列同一性的氨基酸;和iv)BktB多肽包含与SEQ ID NO:21或SEQ ID NO:44所示的氨基酸序列具有至少50%的氨基酸序列同一性的氨基酸。
实施方案II-21.实施方案II-1所述的基因修饰的宿主细胞,其中所述宿主细胞用编码一种或多种调节NADH氧化还原平衡的多肽的异源核酸基因修饰。
实施方案II-22.实施方案II-1所述的基因修饰的宿主细胞,其中所述宿主细胞用以下异源核酸中的一种或多种基因修饰:i)一种或多种编码HMG-辅酶A合成酶多肽的异源核酸;ii)一种或多种编码3-羟基-3-甲基-戊二酰辅酶A还原酶(HMGR)多肽的异源核酸;iii)一种或多种编码MK多肽的异源核酸;和iv)一种或多种编码异戊烯基焦磷酸异构酶(IDI)多肽的异源核酸。
实施方案II-23.实施方案II-22所述的基因修饰的宿主细胞,其中所述宿主细胞被基因修饰以过表达异源IDI多肽。
实施方案II-24.实施方案II-23所述的基因修饰的宿主细胞,其中所述IDI多肽包含与SEQ ID NO:58所示的氨基酸序列具有至少50%的氨基酸序列同一性的氨基酸。
实施方案II-25.实施方案II-22所述的基因修饰的宿主细胞,其中所述宿主细胞被基因修饰以过表达截短的HMGR(tHMGR)多肽。
实施方案II-26.实施方案II-25所述的基因修饰的宿主细胞,其中所述tHMGR多肽包含与SEQ ID NO:17所示的氨基酸序列具有至少50%的氨基酸序列同一性的氨基酸。
实施方案II-27.实施方案II-22所述的基因修饰的宿主细胞,其中所述HMGR多肽包含与SEQ ID NO:22所示的氨基酸序列具有至少50%的氨基酸序列同一性的氨基酸。
实施方案II-28.实施方案II-22所述的基因修饰的宿主细胞,其中所述HMGS多肽包含与SEQ ID NO:23所示的MvaS多肽氨基酸序列具有至少50%的氨基酸序列同一性的氨基酸,或其中所述HMGS多肽包含与SEQ ID NO:24所示的ERG13多肽氨基酸序列具有至少50%的氨基酸序列同一性的氨基酸。
实施方案II-29.实施方案II-22所述的基因修饰的宿主细胞,其中所述MK多肽包含与SEQ ID NO:64所示的ERG12多肽氨基酸序列具有至少50%的氨基酸序列同一性的氨基酸。
实施方案II-30.实施方案II-1所述的基因修饰的宿主细胞,其中所述宿主细胞用异源核酸基因修饰,所述异源核酸编码一种或多种使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽。
实施方案II-31.实施方案II-30所述的基因修饰的宿主细胞,其中所述使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽是乙酰乙酰辅酶A硫解酶多肽。
实施方案II-32.实施方案II-31所述的基因修饰的宿主细胞,其中所述乙酰乙酰辅酶A硫解酶多肽包含与SEQ ID NO:25具有至少50%的序列同一性的氨基酸序列。
实施方案II-33.实施方案II-1所述的基因修饰的宿主细胞,其中所述宿主细胞用异源核酸基因修饰,所述异源核酸编码一种或多种使一分子乙酰辅酶A和一分子丙二酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽。
实施方案II-34.实施方案II-1至II-33中任一项所述的基因修饰的宿主细胞,其中一种或多种异源核酸中的至少一种整合到所述宿主细胞的染色体中。
实施方案II-35.实施方案II-1至II-33中任一项所述的基因修饰的宿主细胞,其中一种或多种异源核酸中的至少一种保持在染色体外。
实施方案II-36.实施方案II-1至II-33中任一项所述的基因修饰的宿主细胞,其中一种或多种异源核酸中的两种或更多种存在于单一表达载体中。
实施方案II-37.实施方案II-1至II-36中任一项所述的基因修饰的宿主细胞,其中所述大麻素化合物是大麻萜酚酸。
实施方案II-38.实施方案II-1所述的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用编码Δ9-THCA合成酶多肽的异源核酸基因修饰。
实施方案II-39.实施方案II-38所述的基因修饰的宿主细胞,其中所述THCA合成酶多肽包含与SEQ ID NO:14或SEQ ID NO:15具有至少50%的氨基酸序列同一性的氨基酸。
实施方案II-40.实施方案II-1所述的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用编码CBDA合成酶多肽的异源核酸基因修饰。
实施方案II-41.实施方案II-40所述的基因修饰的宿主细胞,其中所述CBDA合成酶多肽包含与SEQ ID NO:88或SEQ ID NO:16具有至少50%的氨基酸序列同一性的氨基酸。
实施方案II-42.实施方案II-1至II-41中任一项所述的基因修饰的宿主细胞,其中异源核酸中的至少一种可操作地连接到诱导型启动子。
实施方案II-43.实施方案II-1至II-41中任一项所述的基因修饰的宿主细胞,其中异源核酸中的至少一种可操作地连接到组成型启动子。
实施方案II-44.实施方案II-1所述的基因修饰的宿主细胞,其中所述大麻素化合物是大麻色烯酸、大麻萜酚酸、Δ9-四氢大麻酚酸、大麻二酚酸、Δ9-四氢大麻酚、大麻二酚或大麻色烯。
实施方案II-45.一种在宿主细胞中合成大麻素化合物或大麻素前体的方法,所述方法包括:a)在合适的培养基中培养实施方案II-1至II-40中任一项所述的宿主细胞;和b)回收产生的大麻素化合物或大麻素前体。
实施方案II-46.实施方案II-45所述的方法,其中所述培养基包含可发酵的糖。
实施方案II-47.实施方案II-45所述的方法,其中所述培养基包含预处理的纤维素原料。
实施方案II-48.一种产生橄榄醇酸衍生物的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用以下异源核酸基因修饰:a)一种或多种编码酰基活化酶(AAE)多肽的异源核酸;和b)一种或多种编码TKS/OAC融合多肽的异源核酸。
实施方案II-49.实施方案II-48所述的基因修饰的宿主细胞,其中所述AAE多肽包含与SEQ ID NO:90或SEQ ID NO:91所示的AAE氨基酸序列具有至少50%的氨基酸序列同一性的氨基酸序列。
实施方案II-50.一种产生大麻素衍生物的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用以下异源核酸基因修饰:a)一种或多种编码酰基活化酶(AAE)多肽的异源核酸;b)一种或多种编码TKS/OAC融合多肽的异源核酸;和c)一种或多种编码GOT多肽或NphB多肽的异源核酸。
实施方案II-51.实施方案II-50所述的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用编码THCAS多肽的异源核酸基因修饰。
实施方案II-52.实施方案II-50所述的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞用编码CBDAS多肽的异源核酸基因修饰。
实施方案II-53.一种产生橄榄醇酸衍生物的方法,所述方法包括在包含羧酸的培养基中培养实施方案II-48或II-49所述的基因修饰的宿主细胞。
实施方案II-54.一种产生大麻素衍生物的方法,所述方法包括在包含羧酸的培养基中培养实施方案II-50至II-52中任一项所述的基因修饰的宿主细胞。
实施方案II-55.实施方案II-1所述的基因修饰的宿主细胞,其中所述香叶基焦磷酸橄榄醇酸香叶基转移酶(GOT)多肽或所述NphB多肽包含分别与本文公开的GOT多肽,包括CsPT4t多肽的氨基酸序列或NphB多肽序列具有至少50%的氨基酸序列同一性的氨基酸。
本发明的一些实施方案具有实施方案III:
实施方案III-1.一种用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞,所述基因修饰的宿主细胞包含一种或多种编码香叶基焦磷酸:橄榄醇酸香叶基转移酶多肽的异源核酸,其中所述香叶基焦磷酸:橄榄醇酸香叶基转移酶多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由香叶基焦磷酸和橄榄醇酸产生大麻萜酚酸。
实施方案III-2.一种用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞,所述基因修饰的宿主细胞包含一种或多种编码香叶基焦磷酸:橄榄醇酸香叶基转移酶多肽的异源核酸,所述香叶基焦磷酸:橄榄醇酸香叶基转移酶多肽包含与SEQ ID NO:110具有至少65%的序列同一性的氨基酸序列。
实施方案III-3.一种用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞,所述基因修饰的宿主细胞包含一种或多种编码香叶基焦磷酸:橄榄醇酸香叶基转移酶多肽的异源核酸,所述香叶基焦磷酸:橄榄醇酸香叶基转移酶多肽包含与SEQ ID NO:100具有至少65%的序列同一性的氨基酸序列。
实施方案III-4.实施方案III-1至III-3中任一项所述的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞还包含一种或多种编码四酮体合成酶(TKS)多肽的异源核酸和一种或多种编码橄榄醇酸(OAC)多肽的异源核酸或一种或多种编码融合TKS和OAC多肽的异源核酸。
实施方案III-5.实施方案III-4所述的基因修饰的宿主细胞,其中所述TKS多肽包含与SEQ ID NO:11或SEQ ID NO:76具有至少50%的序列同一性的氨基酸序列。
实施方案III-6.实施方案III-4或III-5所述的基因修饰的宿主细胞,其中所述OAC多肽包含与SEQ ID NO:10或SEQ ID NO:78具有至少50%的序列同一性的氨基酸序列。
实施方案III-7.实施方案III-1至III-6中任一项所述的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞还包含以下一种或多种:a)一种或多种编码产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽的异源核酸;b)一种或多种编码产生香叶基焦磷酸的多肽的异源核酸;或c)一种或多种编码产生丙二酰辅酶A的多肽的异源核酸。
实施方案III-8.实施方案III-7所述的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞还包含一种或多种编码产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽的异源核酸,其中所述产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽是酰基活化酶(AAE)多肽。
实施方案III-9.实施方案III-8所述的基因修饰的宿主细胞,其中所述AAE多肽包含与SEQ ID NO:90具有至少50%的序列同一性的氨基酸序列。
实施方案III-10.实施方案III-8所述的基因修饰的宿主细胞,其中所述AAE多肽包含与SEQ ID NO:92或SEQ ID NO:149具有至少50%的序列同一性的氨基酸序列。
实施方案III-11.实施方案III-7所述的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞还包含一种或多种编码产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽的异源核酸,其中所述产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽是脂肪酰辅酶A连接酶多肽。
实施方案III-12.实施方案III-11所述的基因修饰的宿主细胞,其中所述脂肪酰辅酶A连接酶多肽包含与SEQ ID NO:145或SEQ ID NO:147具有至少50%的序列同一性的氨基酸序列。
实施方案III-13.实施方案III-7所述的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞还包含一种或多种编码产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽的异源核酸,其中所述产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽是脂肪酰辅酶A合成酶(FAA)多肽。
实施方案III-14.实施方案III-13所述的基因修饰的宿主细胞,其中所述FAA多肽包含与SEQ ID NO:169、SEQ ID NO:192、SEQ ID NO:194、SEQ ID NO:196、SEQ ID NO:198或SEQ ID NO:200具有至少50%的序列同一性的氨基酸序列。
实施方案III-15.实施方案III-7至III-14中任一项所述的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞还包含一种或多种编码产生香叶基焦磷酸的多肽的异源核酸,其中所述产生香叶基焦磷酸的多肽是香叶基焦磷酸合成酶(GPPS)多肽。
实施方案III-16.实施方案III-15所述的基因修饰的宿主细胞,其中所述GPPS多肽包含与SEQ ID NO:7、SEQ ID NO:8或SEQ ID NO:60具有至少50%的序列同一性的氨基酸序列。
实施方案III-17.实施方案III-7至III-16中任一项所述的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞还包含一种或多种编码产生丙二酰辅酶A的多肽的异源核酸,其中所述产生丙二酰辅酶A的多肽是乙酰辅酶A羧化酶-1(ACC1)多肽。
实施方案III-18.实施方案III-17所述的基因修饰的宿主细胞,其中所述ACC1多肽包含与SEQ ID NO:9、SEQ ID NO:97或SEQ ID NO:207具有至少50%的序列同一性的氨基酸序列。
实施方案III-19.实施方案III-1至III-18中任一项所述的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞还包含以下一种或多种:a)一种或多种编码HMG-辅酶A合成酶(HMGS)多肽的异源核酸;b)一种或多种编码3-羟基-3-甲基-戊二酰辅酶A还原酶(HMGR)多肽的异源核酸;c)一种或多种编码甲羟戊酸激酶(MK)多肽的异源核酸;d)一种或多种编码磷酸甲羟戊酸激酶(PMK)多肽的异源核酸;e)一种或多种编码甲羟戊酸焦磷酸脱羧酶(MVD)多肽的异源核酸;或f)一种或多种编码异戊烯基焦磷酸异构酶(IDI)多肽的异源核酸。
实施方案III-20.实施方案III-19所述的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞还包含一种或多种编码IDI多肽的异源核酸。
实施方案III-21.实施方案III-20所述的基因修饰的宿主细胞,其中所述IDI多肽包含与SEQ ID NO:58具有至少50%的序列同一性的氨基酸序列。
实施方案III-22.实施方案III-19至III-21中任一项所述的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞还包含一种或多种编码HMGR多肽的异源核酸。
实施方案III-23.实施方案III-22所述的基因修饰的宿主细胞,其中所述HMGR多肽包含与SEQ ID NO:22具有至少50%的序列同一性的氨基酸序列。
实施方案III-24.实施方案III-19至III-21中任一项所述的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞还包含一种或多种编码HMGR多肽的异源核酸,其中所述HMGR多肽是截短的HMGR(tHMGR)多肽。
实施方案III-25.实施方案III-24所述的基因修饰的宿主细胞,其中所述tHMGR多肽包含与SEQ ID NO:17、SEQ ID NO:52、SEQ ID NO:113或SEQ ID NO:208具有至少50%的序列同一性的氨基酸序列。
实施方案III-26.实施方案III-19至III-25中任一项所述的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞还包含一种或多种编码HMGS多肽的异源核酸。
实施方案III-27.实施方案III-26所述的基因修饰的宿主细胞,其中所述HMGS多肽包含与SEQ ID NO:23、SEQ ID NO:24或SEQ ID NO:115具有至少50%的序列同一性的氨基酸序列。
实施方案III-28.实施方案III-19至III-27中任一项所述的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞还包含一种或多种编码MK多肽的异源核酸。
实施方案III-29.实施方案III-28所述的基因修饰的宿主细胞,其中所述MK多肽包含与SEQ ID NO:64具有至少50%的序列同一性的氨基酸序列。
实施方案III-30.实施方案III-19至III-29中任一项所述的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞还包含一种或多种编码PMK多肽的异源核酸。
实施方案III-31.实施方案III-30所述的基因修饰的宿主细胞,其中所述PMK多肽包含与SEQ ID NO:62或SEQ ID NO:205具有至少50%的序列同一性的氨基酸序列。
实施方案III-32.实施方案III-19至III-31中任一项所述的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞还包含一种或多种编码MVD多肽的异源核酸。
实施方案III-33.实施方案III-32所述的基因修饰的宿主细胞,其中所述MVD多肽包含与SEQ ID NO:66具有至少50%的序列同一性的氨基酸序列。
实施方案III-34.实施方案III-1至III-33中任一项所述的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞还包含一种或多种编码使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽的异源核酸。
实施方案III-35.实施方案III-34所述的基因修饰的宿主细胞,其中所述使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽是乙酰乙酰辅酶A硫解酶多肽。
实施方案III-36.实施方案III-35所述的基因修饰的宿主细胞,其中所述乙酰乙酰辅酶A硫解酶多肽包含与SEQ ID NO:25具有至少50%的序列同一性的氨基酸序列。
实施方案III-37.实施方案III-1至III-36中任一项所述的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞还包含一种或多种编码丙酮酸脱氢酶复合物(PDC)多肽的异源核酸。
实施方案III-38.实施方案III-37所述的基因修饰的宿主细胞,其中所述PDC多肽包含与SEQ ID NO:117具有至少50%的序列同一性的氨基酸序列。
实施方案III-39.实施方案III-1至III-38中任一项所述的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞是真核细胞。
实施方案III-40.实施方案III-39所述的基因修饰的宿主细胞,其中所述真核细胞是酵母细胞。
实施方案III-41.实施方案III-40所述的基因修饰的宿主细胞,其中所述酵母细胞是酿酒酵母。
实施方案III-42.实施方案III-41所述的基因修饰的宿主细胞,其中所述酿酒酵母是酿酒酵母的蛋白酶缺陷菌株。
实施方案III-43.实施方案III-1至III-39中任一项所述的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞是植物细胞。
实施方案III-44.实施方案III-1至III-38中任一项所述的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞是原核细胞。
实施方案III-45.实施方案III-1至III-44中任一项所述的基因修饰的宿主细胞,其中一种或多种异源核酸中的至少一种整合到基因修饰的宿主细胞的染色体中。
实施方案III-46.实施方案III-1至III-44中任一项所述的基因修饰的宿主细胞,其中一种或多种异源核酸中的至少一种保持在染色体外。
实施方案III-47.实施方案III-1至III-44中任一项所述的基因修饰的宿主细胞,其中一种或多种异源核酸中的两种或更多种存在于单一表达载体中。
实施方案III-48.实施方案III-1至III-44中任一项所述的基因修饰的宿主细胞,其中异源核酸中的至少一种可操作地连接到诱导型启动子。
实施方案III-49.实施方案III-1至III-44中任一项所述的基因修饰的宿主细胞,其中异源核酸中的至少一种可操作地连接到组成型启动子。
实施方案III-50.实施方案III-1至III-49中任一项所述的基因修饰的宿主细胞,其中在合适的培养基中培养基因修饰的宿主细胞以与在类似条件下培养的非基因修饰的宿主细胞相比增加的量提供所述大麻素或大麻素衍生物的合成。
实施方案III-51.实施方案III-1至III-50中任一项所述的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞还包含一种或多种编码大麻素合成酶多肽的异源核酸。
实施方案III-52.实施方案III-51所述的基因修饰的宿主细胞,其中所述大麻素合成酶多肽是四氢大麻酚酸(THCA)合成酶多肽。
实施方案III-53.实施方案III-52所述的基因修饰的宿主细胞,其中所述THCA合成酶多肽包含与SEQ ID NO:14、SEQ ID NO:86、SEQ ID NO:104、SEQ ID NO:153或SEQ IDNO:155具有至少50%的序列同一性的氨基酸序列。
实施方案III-54.实施方案III-51所述的基因修饰的宿主细胞,其中所述大麻素合成酶多肽是大麻二酚酸(CBDA)合成酶多肽。
实施方案III-55.实施方案III-54所述的基因修饰的宿主细胞,其中所述CBDA合成酶多肽包含与SEQ ID NO:88或SEQ ID NO:151具有至少50%的序列同一性的氨基酸序列。
实施方案III-56.实施方案III-1至III-55中任一项所述的基因修饰的宿主细胞,其中所述大麻素是大麻萜酚酸、大麻萜酚、Δ9-四氢大麻酚酸、Δ9-四氢大麻酚、Δ8-四氢大麻酚酸、Δ8-四氢大麻酚、大麻二酚酸、大麻二酚、大麻色烯酸、大麻色烯、大麻酚酸、大麻酚、次大麻二酚酸、次大麻二酚、四氢次大麻酚酸、四氢次大麻酚、次大麻色酚酸、次大麻色酚、次大麻萜酚酸、次大麻萜酚、大麻环酚酸、大麻环酚、大麻艾尔松酸、大麻艾尔松、大麻二吡喃环烷酸或大麻二吡喃环烷。
实施方案III-57.实施方案III-56所述的基因修饰的宿主细胞,其中所述大麻素是大麻萜酚酸。
实施方案III-58.一种在基因修饰的宿主细胞中产生大麻素或大麻素衍生物的方法,所述方法包括:a)在合适的培养基中培养实施方案III-1至III-57中任一项所述的基因修饰的宿主细胞;和b)回收产生的大麻素或大麻素衍生物。
实施方案III-59.一种产生大麻素或大麻素衍生物的方法,所述方法包括:a)在包含羧酸的合适的培养基中培养实施方案III-1至III-57中任一项所述的基因修饰的宿主细胞;b)回收产生的大麻素或大麻素衍生物。
实施方案III-60.一种产生大麻素或大麻素衍生物的方法,所述方法包括:a)在包含橄榄醇酸或橄榄醇酸衍生物的合适的培养基中培养实施方案III-1至III-57中任一项所述的基因修饰的宿主细胞;b)回收产生的大麻素或大麻素衍生物。
实施方案III-61.一种在基因修饰的宿主细胞中产生大麻素或大麻素衍生物的方法,所述方法包括:a)在合适的培养基中培养包含一种或多种编码香叶基焦磷酸:橄榄醇酸香叶基转移酶多肽的异源核酸的基因修饰的宿主细胞,其中所述香叶基焦磷酸:橄榄醇酸香叶基转移酶多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由香叶基焦磷酸和橄榄醇酸产生大麻萜酚酸;和b)回收产生的大麻素或大麻素衍生物。
实施方案III-62.一种在基因修饰的宿主细胞中产生大麻素或大麻素衍生物的方法,所述方法包括:a)在合适的培养基中培养包含一种或多种编码香叶基焦磷酸:橄榄醇酸香叶基转移酶多肽的异源核酸的基因修饰的宿主细胞,所述香叶基焦磷酸:橄榄醇酸香叶基转移酶多肽包含与SEQ ID NO:110具有至少65%的序列同一性的氨基酸序列;和b)回收产生的大麻素或大麻素衍生物。
实施方案III-63.一种在基因修饰的宿主细胞中产生大麻素或大麻素衍生物的方法,所述方法包括:a)在合适的培养基中培养包含一种或多种编码香叶基焦磷酸:橄榄醇酸香叶基转移酶多肽的异源核酸的基因修饰的宿主细胞,所述香叶基焦磷酸:橄榄醇酸香叶基转移酶多肽包含与SEQ ID NO:100具有至少65%的序列同一性的氨基酸序列;和b)回收产生的大麻素或大麻素衍生物。
实施方案III-64.实施方案III-58至III-63中任一项所述的方法,其中所述合适的培养基包含可发酵的糖。
实施方案III-65.实施方案III-58至III-63中任一项所述的方法,其中所述合适的培养基包含预处理的纤维素原料。
实施方案III-66.实施方案III-58至III-63中任一项所述的方法,其中所述合适的培养基包含不可发酵的碳源。
实施方案III-67.实施方案III-66所述的方法,其中所述不可发酵的碳源包含乙醇。
实施方案III-68.实施方案III-58至III-67中任一项所述的方法,其中所述大麻素是大麻萜酚酸、大麻萜酚、Δ9-四氢大麻酚酸、Δ9-四氢大麻酚、Δ8-四氢大麻酚酸、Δ8-四氢大麻酚、大麻二酚酸、大麻二酚、大麻色烯酸、大麻色烯、大麻酚酸、大麻酚、次大麻二酚酸、次大麻二酚、四氢次大麻酚酸、四氢次大麻酚、次大麻色酚酸、次大麻色酚、次大麻萜酚酸、次大麻萜酚、大麻环酚酸、大麻环酚、大麻艾尔松酸、大麻艾尔松、大麻二吡喃环烷酸或大麻二吡喃环烷。
实施方案III-69.一种分离或纯化的香叶基焦磷酸:橄榄醇酸香叶基转移酶多肽,其中所述香叶基焦磷酸:橄榄醇酸香叶基转移酶多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由香叶基焦磷酸和橄榄醇酸产生大麻萜酚酸。
实施方案III-70.一种分离或纯化的多肽,其包含与SEQ ID NO:110具有至少65%的序列同一性的氨基酸序列。
实施方案III-71.一种分离或纯化的多肽,其包含与SEQ ID NO:100具有至少65%的序列同一性的氨基酸序列。
实施方案III-72.一种编码香叶基焦磷酸:橄榄醇酸香叶基转移酶多肽的分离或纯化的核酸,其中所述香叶基焦磷酸:橄榄醇酸香叶基转移酶多肽可以以比包含SEQ IDNO:82所示的氨基酸序列的多肽高至少十倍的量催化由香叶基焦磷酸和橄榄醇酸产生大麻萜酚酸。
实施方案III-73.一种分离或纯化的核酸,其编码包含与SEQ ID NO:110具有至少65%的序列同一性的氨基酸序列的多肽。
实施方案III-74.一种分离或纯化的核酸,其编码包含与SEQ ID NO:100具有至少65%的序列同一性的氨基酸序列的多肽。
实施方案III-75.一种载体,其包含编码香叶基焦磷酸:橄榄醇酸香叶基转移酶多肽的核酸,其中所述香叶基焦磷酸:橄榄醇酸香叶基转移酶多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由香叶基焦磷酸和橄榄醇酸产生大麻萜酚酸。
实施方案III-76.一种载体,其包含编码包含与SEQ ID NO:110具有至少65%的序列同一性的氨基酸序列的多肽的核酸。
实施方案III-77.一种载体,其包含编码包含与SEQ ID NO:100具有至少65%的序列同一性的氨基酸序列的多肽的核酸。
实施方案III-78.一种制备用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞的方法,包括向所述基因修饰的宿主细胞中引入一种或多种编码香叶基焦磷酸:橄榄醇酸香叶基转移酶多肽的异源核酸,其中所述香叶基焦磷酸:橄榄醇酸香叶基转移酶多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由香叶基焦磷酸和橄榄醇酸产生大麻萜酚酸。
实施方案III-79.一种制备用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞的方法,包括向基因修饰的宿主细胞中引入一种或多种编码香叶基焦磷酸:橄榄醇酸香叶基转移酶多肽的异源核酸,所述香叶基焦磷酸:橄榄醇酸香叶基转移酶多肽包含与SEQID NO:110具有至少65%的序列同一性的氨基酸序列。
实施方案III-80.一种制备用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞的方法,包括向基因修饰的宿主细胞中引入一种或多种编码香叶基焦磷酸:橄榄醇酸香叶基转移酶多肽的异源核酸,所述香叶基焦磷酸:橄榄醇酸香叶基转移酶多肽包含与SEQID NO:100具有至少65%的序列同一性的氨基酸序列。
实施方案III-81.一种制备用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞的方法,包括向基因修饰的宿主细胞中引入实施方案III-75至III-77中任一项所述的载体。
表1提供了本文公开的氨基酸和核苷酸序列。在注明属和/或种的情况下,序列不应被解释为仅限于指定的属和/或种,而是还包括表达所述序列的其他属和/或种。
表1:本发明的氨基酸和核苷酸序列
Figure BDA0002337530530002841
Figure BDA0002337530530002851
Figure BDA0002337530530002861
Figure BDA0002337530530002871
Figure BDA0002337530530002881
Figure BDA0002337530530002891
Figure BDA0002337530530002901
Figure BDA0002337530530002911
Figure BDA0002337530530002921
Figure BDA0002337530530002931
Figure BDA0002337530530002941
Figure BDA0002337530530002951
Figure BDA0002337530530002961
Figure BDA0002337530530002971
Figure BDA0002337530530002981
Figure BDA0002337530530002991
Figure BDA0002337530530003001
Figure BDA0002337530530003011
Figure BDA0002337530530003021
Figure BDA0002337530530003031
Figure BDA0002337530530003041
Figure BDA0002337530530003051
Figure BDA0002337530530003061
Figure BDA0002337530530003071
Figure BDA0002337530530003081
Figure BDA0002337530530003091
Figure BDA0002337530530003101
Figure BDA0002337530530003111
Figure BDA0002337530530003121
Figure BDA0002337530530003131
Figure BDA0002337530530003141
Figure BDA0002337530530003151
Figure BDA0002337530530003161
Figure BDA0002337530530003171
Figure BDA0002337530530003181
Figure BDA0002337530530003191
Figure BDA0002337530530003201
Figure BDA0002337530530003211
Figure BDA0002337530530003221
Figure BDA0002337530530003231
Figure BDA0002337530530003241
Figure BDA0002337530530003251
Figure BDA0002337530530003261
Figure BDA0002337530530003271
Figure BDA0002337530530003281
Figure BDA0002337530530003291
Figure BDA0002337530530003301
Figure BDA0002337530530003311
Figure BDA0002337530530003321
Figure BDA0002337530530003331
Figure BDA0002337530530003341
Figure BDA0002337530530003351
Figure BDA0002337530530003361
Figure BDA0002337530530003371
Figure BDA0002337530530003381
Figure BDA0002337530530003391
Figure BDA0002337530530003401
Figure BDA0002337530530003411
Figure BDA0002337530530003421
Figure BDA0002337530530003431
Figure BDA0002337530530003441
Figure BDA0002337530530003451
Figure BDA0002337530530003461
Figure BDA0002337530530003471
Figure BDA0002337530530003481
Figure BDA0002337530530003491
Figure BDA0002337530530003501
Figure BDA0002337530530003511
Figure BDA0002337530530003521
Figure BDA0002337530530003531
Figure BDA0002337530530003541
Figure BDA0002337530530003551
Figure BDA0002337530530003561
Figure BDA0002337530530003571
Figure BDA0002337530530003581
Figure BDA0002337530530003591
Figure BDA0002337530530003601
Figure BDA0002337530530003611
Figure BDA0002337530530003621
Figure BDA0002337530530003631
Figure BDA0002337530530003641
Figure BDA0002337530530003651
Figure BDA0002337530530003661
Figure BDA0002337530530003671
Figure BDA0002337530530003681
Figure BDA0002337530530003691
Figure BDA0002337530530003701
实施例
提出以下实施例以向本领域普通技术人员提供关于如何制备和使用本发明的完整公开内容和描述,并且既不旨在限制发明人视为其公开内容的范围,也不旨在表示以下实验是全部或仅进行的实验。已经尽力确保所使用的数字(例如量、温度等)的准确性,但是应该考虑一些实验误差和偏差。除非另有说明,否则份数是重量份,分子量是重均分子量,温度是摄氏度,压力是大气压或接近大气压。可以使用标准缩写,例如bp,碱基对;kb,千碱基;s或sec,秒;min,分钟;h或hr,小时;aa,氨基酸;kb,千碱基;bp,碱基对;nt,核苷酸;等等。
实施例的通用方法
酵母转化方法
在优化的乙酸锂(LiAc)转化中,使用标准分子生物学技术将包含一种或多种本文公开的异源核酸的每种DNA构建体(例如,表11中详述的构建体)整合到酿酒酵母(CEN.PK2)中。简而言之,使细胞在酵母提取物蛋白胨右旋糖(YPD)培养基中在30℃下在摇动(200rpm)下过夜生长,在100mL YPD中稀释至OD600为0.1,然后生长至OD600为0.6-0.8。对于每次转化,通过离心收集5mL培养物,在5mL无菌水中洗涤,再次离心,重悬于1mL 100mM LiAc中,并转移至微量离心管中。将细胞离心(13,000x g)30秒,除去上清液,然后将细胞重悬于转化混合物中,该混合物由240μL 50%PEG、36μL 1M LiAc、10μL煮沸的鲑鱼精DNA和74μL供体DNA组成。在42℃下热休克40分钟后,将细胞在YPD培养基中过夜复苏,然后铺板到选择性培养基上。使用对整合具有特异性的引物,通过菌落PCR证实了DNA整合。
酵母培养条件
将经验证含有预期的包含一种或多种本文公开的异源核酸的DNA组装体的酵母菌落,即基因修饰的宿主细胞,挑到含有360μL YPD(10g/L酵母提取物、20g/L细菌蛋白胨、20g/L右旋糖(葡萄糖))的96孔微量滴定板中,并用透气的薄膜密封条密封。将细胞在于1000rpm和80%湿度下摇动的高容量微量滴定板培养箱中于30℃下培养3天,直到培养物达到碳耗尽。通过从饱和培养物中取14.4μL并稀释到360μL新的培养基中,将生长饱和的培养物传代培养到含有YPGAL和橄榄醇酸或己酸或橄榄醇酸衍生物或除己酸以外的羧酸中的任一种(10g/L酵母提取物、20g/L细菌蛋白胨、20g/L半乳糖、1g/L葡萄糖和1mM橄榄醇酸或2mM己酸或1mM橄榄醇酸衍生物或2mM除己酸以外的羧酸中的任一种)的新的平板中,并用透气的薄膜密封条密封。将产生培养基中的基因修饰的宿主细胞在1000rpm和80%湿度下的高容量微量滴定板摇床中在30℃下再培养3天,然后提取和分析。完成后,将100μL全细胞肉汤稀释到900μL甲醇中,用箔密封条密封,并在1500rpm下摇动60秒以提取大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物。摇动后,将板以1000x g离心60秒以除去所有固体。离心后,将12μL上清液转移至含有228μL甲醇的新分析板中,用箔密封条密封,在900rpm下摇动60秒,通过LC-MS分析。
分析方法
使用具有以下梯度的Agilent Poroshell 120苯基己基2.1 x 50mm,1.9μm分析柱,通过LC-MS质谱仪(Agilent 6470)分析样品(流动相A:含0.1%甲酸的LC-MS级水;流动相B:含0.1%甲酸的LC-MS级乙腈):
时间(分钟) %B
0 40
0.1 40
0.6 60
1 65
1.01 95
2.01 95
2.02 40
2.5 40
质谱仪以负离子多反应监测模式操作。每种大麻素、大麻素前体、大麻素衍生物或大麻素前体衍生物均通过由可信的标准品确定的保留时间和多反应监测(MRM)转变确定:
化合物名称 Q1质量(Da) Q3质量(Da)
CBGA 359.2 341.1
CBGA 359.2 315.2
CBDA 357.2 339.1
CBDA 357.2 245.1
THCA 357.0 313.0
回收和纯化
用合适的有机溶剂提取来自包含本发明的基因修饰的宿主细胞的培养物的全细胞肉汤,以提供大麻素、大麻素前体、大麻素衍生物或大麻素前体衍生物。合适的有机溶剂包括但不限于,己烷、庚烷、乙酸乙酯、石油醚和二乙醚、氯仿和乙酸乙酯。合适的有机溶剂,如己烷以10:1的比例(10份全细胞肉汤—1份有机溶剂)添加到来自包含本发明的基因修饰的宿主细胞的发酵物的全细胞肉汤中,并搅拌30分钟。分离有机级分,并用等体积的酸性水(pH 2.5)萃取两次。然后分离有机层并在浓缩器(在减压下在旋转蒸发器或薄膜蒸发器)中干燥以获得粗大麻素、大麻素前体、大麻素衍生物或大麻素前体衍生物晶体。可以将粗晶体加热至105℃持续15分钟,然后加热至145℃持续55分钟以使粗大麻素或大麻素衍生物脱羧。将粗结晶产物在合适的溶剂(例如正戊烷)中重新溶解和重结晶并通过1μm滤器过滤,以除去任何不溶性物质。然后例如通过旋转蒸发除去溶剂,以产生纯的结晶产物。
体外酶分析和大麻素或大麻素衍生物的无细胞产生
在一些实施方案中,将基因修饰的宿主细胞,例如经验证含有一种或多种编码GOT多肽的异源核酸的基因修饰的酵母细胞在含有360μL YPD(10g/L酵母提取物、20g/L细菌蛋白胨、20g/L右旋糖(葡萄糖))的96孔微量滴定板中培养,并用透气的薄膜密封条密封,所述GOT多肽以比包含SEQ ID NO:82所示的氨基酸序列的多肽或包含与SEQ ID NO:100或SEQID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列的多肽高至少十倍的量催化由香叶基焦磷酸和橄榄醇酸产生大麻萜酚酸。然后将细胞在于1000rpm和80%湿度下摇动的高容量微量滴定板培养箱中于30℃下培养3天,直到培养物达到碳耗尽。将生长饱和的培养物传代培养到200mL YPGAL培养基中至OD600为0.2,并在30℃下在摇动下孵育20小时。然后通过在4℃下以3000x g离心5分钟来收获细胞。然后将收获的细胞重悬于50mL缓冲液(50mM Tris-HCl,1mM EDTA,0.1M KCl,pH 7.4、125单位Benzonase)中,然后裂解(Emulsiflex C3,Avestin,INC.,60巴,10min)。通过离心(10,000×g,10min,4℃)去除细胞碎片。随后将上清液进行超离心(150,000×g,1h,4℃,Beckman Coulter L-90K,TI-70)。得到的GOT多肽的膜级分重悬于3.3mL缓冲液(10mM Tris-HCl,10mM MgCl2,pH 8.0,10%甘油)中,并用组织研磨器溶解,所述GOT多肽以比包含SEQ ID NO:82所示的氨基酸序列的多肽或包含与SEQ ID NO:100或SEQ ID NO:110具有至少65%(例如,至少65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9%或100%)的序列同一性的氨基酸序列的多肽高至少十倍的量催化由香叶基焦磷酸和橄榄醇酸产生大麻萜酚酸。然后,将0.02%(v/v)的相应膜制备物溶解在反应缓冲液(50mM Tris-HCl,10mM MgCl2,pH8.5)和底物(500μM橄榄醇酸,500μM GPP)中至50μL的总体积,并在30℃下孵育1小时。然后通过添加两个反应体积的乙酸乙酯,然后涡旋振荡和离心来提取分析物。将有机层蒸发30分钟,重悬于乙腈/H2O/甲酸(880:20:0.05%)中,并用
Figure BDA0002337530530003741
-MC柱(0.22μm孔径,PVDF膜材料)过滤。然后,通过LC-MS检测大麻素或大麻素衍生物和/或对其进行回收和纯化。
在生物反应器中的酵母培养
包含本文公开的基因修饰的宿主细胞的单个酵母菌落在200rpm摇动下在30℃下在125mL烧瓶中的具有50mM琥珀酸盐(pH 5.0)和2%葡萄糖的15mL Verduyn培养基(最初由Verduyn等人,Yeast 8(7):501-17描述)中生长至OD600为4至9。然后将甘油添加到培养物中至浓度为20%,并将1mL小瓶的基因修饰的宿主细胞悬液保存在-80℃下。解冻一到两个小瓶的基因修饰的宿主细胞,并使其在含有50mM琥珀酸盐(pH 5.0)和4%蔗糖的Verduyn培养基中生长24小时,然后在相同培养基中传代培养至OD600读数为0.1。在30℃摇动下生长24小时后,将65mL培养物接种到1.3升发酵罐(Eppendorf DASGIP生物反应器)中,所述发酵罐中具有补充有己酸(2mM)、除己酸以外的羧酸(2mM)、橄榄醇酸(1mM)或橄榄醇酸衍生物(1mM)的含有20g/L半乳糖的585mL Verduyn发酵培养基。可以将聚-α-烯烃添加到发酵罐中作为提取剂。通过添加NH4OH使发酵罐保持在30℃和pH 5.0下。在最初的分批阶段,以0.5体积/体积/分钟空气(VVM)对发酵罐充气,并搅拌逐渐至保持30%的溶解氧。消耗了最初的糖后,溶解氧的增加触发半乳糖+己酸(每升800g半乳糖+每升9.28g己酸)以10g半乳糖/升剂量的脉冲以10g半乳糖/升/小时进料(供选择地,不向本文公开的基因修饰的宿主细胞进料己酸,而是将橄榄醇酸、橄榄醇酸衍生物或除己酸以外的羧酸进料到基因修饰的宿主细胞)。
在脉冲之间,进料速率降低至5g半乳糖/升/小时。当溶解氧增加10%时,进料速率将恢复为10g L-1小时-1。随着基因修饰的宿主细胞密度的增加,溶解氧允许达到0%,脉冲剂量增加至50g半乳糖/升。通过随着体积的增加调节搅拌,将氧气的传输速率保持在代表100mM/升/小时的满量程条件下的速率。使用在高进料速率和低进料速率之间交替的算法动态调整进料速率以满足需求。在低进料速率下,基因修饰的宿主细胞应消耗半乳糖和己酸,或者供选择地消耗橄榄醇酸、橄榄醇酸衍生物或除己酸以外的羧酸,以及高进料速率期间积累的任何溢出代谢物。溶解氧的增加触发高进料速率的恢复。低进料速率下花费的时间长度反映了基因修饰的宿主细胞在先前的高进料速率脉冲下过度进料或进料不足的程度;然后,此信息将被监视并用于向上或向下调整高进料速率,将低进料速率保持在限定的范围内。
随着时间的流逝,进料速率与来自基因修饰的宿主细胞的糖和己酸的需求,或者供选择地,橄榄醇酸、橄榄醇酸衍生物或除己酸以外的羧酸的需求相匹配。该算法确保以下物质的最小净积累:除大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物以外的发酵产物;生物质;和CO2。在一些实施方案中,该过程持续5至14天。在某些这样的实施方案中,每天去除积累的肉汤,并分析生物质和大麻素、大麻素衍生物、大麻素前体或大麻素前体衍生物的浓度。定期添加NH4H2PO4、微量金属和维生素的浓溶液以保持稳态浓度。
实施例1–橄榄醇酸或其衍生物的合成
大麻素途径由使用前体己酰辅酶A、丙二酰辅酶A和香叶基焦磷酸的四个生物合成步骤组成(图1,方框4)。酿酒酵母之前已经被工程化以产生高水平的丙二酰辅酶A。为了增加香叶基焦磷酸酯的供应,进行图1的方框3中概述的工程化策略。另外,编码ACC1多肽的异源核酸被过表达以增加通向丙二酰辅酶A的通量。
图1:示出了将糖或己酸转化为大麻素Δ9-THC和CBD的生物合成途径的图。
迄今为止,尚未描述酿酒酵母中前体己酰辅酶A的工程化生物合成。如图1中概述的,构思了在酿酒酵母中的己酰辅酶A生物合成的策略:途径1a)来自大麻(C.sativa)的己酰辅酶A合成酶多肽将己酸转化为己酰辅酶A(图1,方框1a)。将来自大麻的编码己酰辅酶A的异源核酸合成酶多肽整合到酿酒酵母(S.cerevisiae)中。向得到的细胞进料己酸以增加己酰辅酶A的供应(图2)。
图2:使用途径1a和TKS/OAC多肽的细胞内橄榄醇酸产生。表达编码TKS多肽的异源核酸和编码OAC多肽的异源核酸的酵母菌株yWL004和表达编码TKS多肽的异源核酸、编码OAC多肽的异源核酸和编码HCS多肽的异源核酸的yWL009在YPG中并且在1mM己酸不存在或存在的情况下生长,以产生橄榄醇酸。添加己酸导致在菌株yWL004中的橄榄醇酸产生增加六倍,表明内源性酰基辅酶A连接酶活性。产生菌株yWL009的编码己酰辅酶A合成酶多肽的异源核酸的染色体整合显示,由于己酰辅酶A的供应增加,橄榄醇酸产生额外增加了两倍。
通过整合途径1b提高了由可发酵的糖生物合成己酰辅酶A,该途径1b包含四种编码反向β-氧化途径的酶,该途径已在大肠杆菌(E.coli)中优化用于生产己醇(图1,方框1b)(Machado等人,2012)。LC-MS分析证实该途径在酿酒酵母中也发挥功能,并且其活性与途径1a相当,因为工程化菌株yWL009和yWL0013之间的橄榄醇酸产量相似(图3)。
图3:比较途径1a和1b的细胞内橄榄醇酸产生。表达编码TKS多肽的异源核酸、编码OAC多肽的异源核酸和编码HCS多肽的异源核酸的酵母菌株yWL009在生产条件(含有1mM己酸的YPG)下生长,并与在非生产(YPD)以及生产(YPG)条件下生长的表达编码TKS多肽的异源核酸、编码OAC多肽的异源核酸和己酰辅酶A供应途径1b的yWL013进行比较。在含有1mM己酸的YPG中生长时,己酰辅酶A途径的染色体整合在橄榄醇酸产生中产生的水平与菌株yWL009相似。
表2:本研究中使用的菌株列表
yWL004 Cen.PK2,ACC1::TKS-OAC,tHMGR::MvaE/S,
yWL009 Cen.PK2,ACC1::TKS-OAC,tHMGR::MvaE/S,URA3::HCS
yWL0013 CenPK2,ACC1::TKS-OAC,URA3::HexCoA
合成了密码子优化的基因,并在本研究中将其用于表3中所列举的多肽。
表3:本研究中使用的多肽列表
Figure BDA0002337530530003771
Figure BDA0002337530530003781
实施例2–橄榄醇酸或其衍生物或大麻素或其衍生物的合成
途径1b中的多种多肽需要NADH作为辅助因子。为了使通过途径1b的通量最大化,对竞争NADH供应的其他生物合成途径进行了修饰(图1,方框2)。一个靶标可以是由各种醇脱氢酶多肽介导的乙醇途径,但也可以包括消耗NADH的其他途径,例如甘油生物合成途径。
在途径1c中描述了另一种针对己酰辅酶A构思的途径:黄曲霉毒素生物合成基因簇(迭代I型PKS)编码用于产生己酰辅酶A的基于脂肪酸合成酶的机制(FasA和FasB)。在一些实施方案中,编码硫酯酶多肽的异源核酸和编码类似于C6耐受性硫酯酶多肽的辅酶A连接酶多肽的异源核酸(参见BMC Biochem.2011 Aug 10;12:44.doi:10.1186/1471-2091-12-44)和编码HCS多肽的异源核酸被表达以促进己酰基-ACP的释放并且将游离己酸活化成其酰基辅酶A化合物。另外,各种II型PKS生物合成途径(例如贝那他汀(benastatin),R1128)都包含FabH样KSIII(例如BenQ,ZhuH)、AT和ACP组分,这对于提供和选择稀有的己酸PKS起始单元至关重要。最后,用于雷弗霉素(reveromycin)生物合成的I型PKS途径编码脂肪酰辅酶A连接酶RevS多肽和FabH样KASIII组分RevR多肽,其表明通过脂肪酸降解以及脂肪酸从头生物合成来提供己酰辅酶A。
为了避免经由β-氧化竞争性消耗己酰辅酶A,将脂肪酸降解途径工程化为具有降低的活性。供选择地,酵母在油酸存在下生长以避免竞争作为能量来源的脂肪酸。
分别在Gal1、Gal10、Gal7和TEF2启动子的控制下构建了编码NADH途径以产生己酰辅酶A的四种基因的途径,包括多肽PaaH1、Crt、Ter和BktB。图4。将整个盒插入到ADE2的上游和下游同源区之间,并使用CRISPR/Cas9整合到酿酒酵母的基因组中以产生yXL001(使用如图4所示的构建体1/pXL044)。将编码NADPH途径的四种基因的途径(包括PhaB、PhaJ、Ter和BktB多肽)以相同的方式引入酿酒酵母中以产生yXL002(使用图4所示的构建体1/pXL072)。使用CRISPR/Cas9将侧接1622b同源区的在Gal1启动子控制下的MCT1基因(构建体2;图4)引入yXL001和yXL002的基因组中,以产生yXL003和yXL004(图4)。
使用CRISPR/Cas9将侧接在ACC1同源区的在Gal1和Gal10启动子控制下的编码TKS和OAC基因的盒(构建体4;图5)引入yXL003和yXL004的基因组中,以产生yXL005和yXL006。将在Gal1启动子控制下的编码TKS-OAC融合多肽的异源核酸(构建体5;图5)引入yXL003和yXL004中以产生yXL007和yXL008。将得到的菌株接种到补充2%右旋糖的10mL YP培养基中。在30℃下过夜培养并在3,000×g下离心5分钟后,将沉淀重新悬浮在补充2%半乳糖的YP培养基中。表达两天后,将培养上清液用等体积的乙酸乙酯萃取,并且在蒸发和过滤后,通过LC-MS分析样品,结果显示产生了大量的橄榄醇酸(图9和图10)。
使用CRISPR/Cas9将CsAAE(构建体3;图4)、TKS和OAC基因(构建体4;图5)引入酿酒酵母的基因组中以产生yXL009,其在外源供应的己酸存在下可以产生更高水平的橄榄醇酸(图11)。
另外,通过向生长培养基补充C4-C10的各种脂族酸,可以由yXL009产生各种橄榄醇酸衍生物(图11和图12)。某些橄榄醇酸衍生物可以通过生物或化学方法进一步修饰以共价连接于其他化合物。例如,可以对含有炔官能团的橄榄醇衍生物进行点击化学。将该橄榄醇衍生物溶于生物级二甲基亚砜(DMSO)中,并用含有叠氮基(1.0当量)、TBTA(DMSO:tBuOH 1:1)、CuSO4 5H2O、抗坏血酸钠和HEPES-KOH pH:7.0(最终HEPES-KOH 250mM)的交联剂的DMSO溶液处理。将反应置于37℃的水浴上12至16小时。反应混合物的液相色谱-质谱(LC-MS)分析显示16小时后反应完成,得到进一步修饰的橄榄醇酸。
将侧接ADE1同源区的在Gal1和Gal10启动子控制下的来自大麻的GPPS大亚基(GPPSlsu)和小亚基(GPPSssu)基因(构建体10;图7)引入yXL008和yXL009中以产生yXL010和yXL011。使用CRISPR/Cas9将侧接1014a同源区的在Gal1和Gal10启动子控制下的编码NphB多肽和THCAS多肽的盒(构建体12;图8)引入yXL010和yXL011的基因组中以产生yXL012和yXL013。将得到的菌株接种到补充2%右旋糖的10mL YP培养基中。在30℃下过夜培养并在3,000×g下离心5分钟后,将沉淀重新悬浮在补充2%半乳糖的YP培养基中。表达两天后,将培养上清液用等体积的乙酸乙酯萃取,并且在蒸发和过滤后,通过LC-MS分析样品,结果显示yXL010中的NphB的过表达导致大麻萜酚酸的产生(图14和15)。在THCAS多肽的存在下,大麻萜酚酸被转化为THCA或THC。在yXL013的情况下,将C4-C10酸添加到表达培养基中导致大麻萜酚酸衍生物的产生,然后将其用THCAS多肽修饰以产生THCA或THC衍生物。然后可以通过化学反应进一步修饰那些衍生物(图13)。
实施例3–前述大麻素前体、大麻素或衍生物的合成
为了在微生物中重建大麻素的产生,开发了底盘酿酒酵母菌株,其包含用于以下的代谢途径:(1)通过甲羟戊酸(Mva)途径产生GPP,(2)产生橄榄醇酸或衍生物,(3)产生CBGA或衍生物,和(4)产生由大麻素合成酶多肽产生的不同的大麻素或大麻素衍生物。
GPP的产生
通过过表达Mva途径基因并在ERG9上引入可阻遏的启动子来产生过量产生GPP的菌株GTY23。添加了先前描述的ERG20 F96W-N127W突变体ERG20mut,以在细胞中提供GPP前体的来源(图16)。该菌株用于筛选GOT多肽候选物。
橄榄醇酸或其衍生物的产生
通过引入基因CsTKS和CsOAC以及产生己酰辅酶A的途径,由糖产生橄榄醇酸。己酸和己酰辅酶A的产生途径在本领域是已知的(例如,Gajewski等人,“Engineering fungalde novo fatty acid synthesis for short chain fatty acid production,”NatureCommunications 2017)。为了产生橄榄醇酸或其衍生物,而不是使用己酰辅酶A途径,引入了先前报道的酰基辅酶A连接酶多肽,如CsAAE1或CsAAE3多肽,并向细胞外源性进料己酸或除己酸以外的其他羧酸(图17-19)。这些途径允许产生非天然存在的大麻素。
CBGA的产生
母体大麻素CBGA或其衍生物是由GOT多肽产生的。在二十世纪年代确定了一种大麻GOT多肽,但没有发现描述体内重构GOT多肽活性的报道。筛选了二十五种多肽变体,用于在包含GPP途径和外源进料的橄榄醇酸的菌株中体内产生CBGA。这些基因都是由GAL1启动子驱动的染色体整合的,并在酵母提取物蛋白胨半乳糖(YPG)培养基中筛选活性。GC-MS和LC-MS分析证明了由CsPT4t多肽体内产生CBGA(图26A-C)。CsPT4t多肽的基因序列称为GOT多肽(图20)。yL444是用于产生CBGA的菌株,其表达以下基因型:CEN.PK2-1D{1114a::GAL1p-CsPT4t-TDH1t;308a::GAL1p-ERG20(F96W-N127W)-TDH1t;erg9::KanMX_CTR3p-ERG9;leu2-3,112::His3MX6_GAL1p-ERG19/GAL10p-ERG8;ura3-52::ura3/GAL1p-MvaS(A110G)/GAL10p-MvaE;his3_1::hphMX4_GAL1p-ERG12/GAL10p-IDI1;MATa}(图6和20)。LC-MS如下进行(图26A-C):
柱信息:2015 Kinetex XB-C18 2.1x100mm RES6方法10.6min
方法信息:
0-5.6min,45%-73%B,0.2mL/min
5.6-6.2min,73%-97%B,0.2mL/min
6.2-11.3min,97%B,0.3mL/min
11.3-12.7,97-45%B,0.3mL/min
12.7-15.5,45%B,0.3mL/min
A:H2O+0.05%TFA
THCA和CBDA的产生
已经从大麻属基因组中确定了大麻素合成酶基因(包括但不限于THCA合成酶(THCAS)、CBDA合成酶(CBDAS)、JP450547、JP454863、JP471546、JP452622)。为了产生THCA和CBDA,将相应的THCA合成酶和CBDA合成酶分别引入到包含编码CsPT4t多肽的异源核酸的产生CBGA的菌株中。合成酶作为N末端截短多肽引入,所述N末端截短多肽具有连接的多肽标签,例如ProA信号序列(MIFDGTTMSIAIGLLSTLGIGAEA,来自UniProt登录号为F2QUG8的蛋白酶A),并且两种合成酶的转录均在GAL10启动子的控制下进行。最终的质粒构建体被命名为pESC-ProA-THCAS和pESC-ProA-CBDAS。将两种质粒分别转化到在橄榄醇酸的存在下具有高的CBGA产生的上述菌株中,从而得到菌株yXL046和yXL047(图21-25)。
在通过PCR确认THCAS或CBDAS的转化后,将来自每种培养物的两个菌落接种到限定的培养基(SC-Leu+2%右旋糖)中,并在30℃下在800RPM摇动下孵育。生长两天后,将培养物以1:50反稀释到诱导培养基(SC-Leu+2%半乳糖+1mM橄榄醇酸+CuSO4)中,并在30℃下在800RPM摇动下孵育4天。孵育4天后,将等体积的乙酸乙酯添加到表达培养物中,并将混合物进行三轮珠磨。然后将混合物以5000RPM离心,并将有机层送去LC-MS分析,其显示从相应的培养物中产生了THCA和CBGA(图27和28)。
实施例4–能够在橄榄醇酸进料的情况下高通量产生CBGA的基础酵母菌株的产生
通过在GAL1或GAL10启动子的控制下表达甲羟戊酸途径多肽和GOT多肽的基因,由野生型酿酒酵母菌株(CEN.PK2)建立了CBGA产生菌株。S21菌株包含来自酿酒酵母的以下染色体整合的甲羟戊酸途径基因:ERG10、ERG13、截短的HMG1(tHMGR)、ERG12、ERG8、ERG19和IDI1。S21菌株还包含来自运动发酵单胞菌的染色体整合的丙酮酸脱羧酶(PDC),以增加从丙酮酸到乙酰辅酶A的通量。
为了另外产生菌株,将优先产生GPP的ERG20的突变形式ERG20mut与来自大麻的以下染色体整合的GOT一起添加到S21菌株:CsPT1(S164)、截短的CsPT1(CsPT1_t75,S165)或CsPT4(S29)。表11中显示了S29、S164和S165中使用的构建体。
将经验证含有预期的包含一种或多种本文公开的异源核酸的DNA组装体的酵母菌落挑到含有360μL YPD(10g/L酵母提取物、20g/L细菌蛋白胨、20g/L右旋糖(葡萄糖))的96孔微量滴定板中,并用透气的薄膜密封条密封。将细胞在于1000rpm和80%湿度下摇动的高容量微量滴定板培养箱中于30℃下培养3天,直到培养物达到碳耗尽。通过从饱和培养物中取14.4μL并稀释到360μL新的培养基中,将生长饱和的培养物传代培养到含有YPGAL和橄榄醇酸(10g/L酵母提取物、20g/L细菌蛋白胨、20g/L半乳糖,1g/L葡萄糖和1mM橄榄醇酸)的新的平板中,并用透气的薄膜密封条密封。将产生培养基中的基因修饰的宿主细胞在1000rpm和80%湿度下的高容量微量滴定板摇床中在30℃下再培养3天,然后提取和分析。完成后,将100μL全细胞肉汤稀释到900μL甲醇中,用箔密封条密封,并在1500rpm下摇动60秒以提取大麻素。摇动后,将板以1000x g离心60秒以除去所有固体。离心后,将12μL上清液转移至含有228μL甲醇的新分析板中,用箔密封条密封,在900rpm下摇动60秒,并通过LC-MS分析。
使用具有以下梯度的Agilent Poroshell 120苯基己基2.1 x 50mm,1.9μm分析柱,通过LC-MS质谱仪(Agilent 6470)分析样品(流动相A:含0.1%甲酸的LC-MS级水;流动相B:含0.1%甲酸的LC-MS级乙腈):
时间(分钟) %B
0 40
0.1 40
0.6 60
1 65
1.01 95
2.01 95
2.02 40
2.5 40
质谱仪以负离子多反应监测模式操作。每种大麻素通过由可信的标准品确定的保留时间和MRM转变确定(参见图77和78):
化合物名称 Q1质量(Da) Q3质量(Da)
CBGA 359.2 341.1
CBGA 359.2 315.2
CsPT1多肽和CsPT1_t75多肽在体内产生等量的CBGA(1.3mg/L CBGA)。然而,CsPT4多肽在体内产生216mg/L CBGA(参见图79-82)。
实施例5–确定CsPT4的最小催化结构域
为了确定将GPP和橄榄醇酸转化为CBGA所需的CsPT4多肽的最小催化结构域,生成了CsPT4多肽的多个N端截短(参见表11),并在进料1mM橄榄醇酸的情况下在S21菌株中体内表达。仅全长CsPT4多肽和CsPT4_t76多肽(CsPT4t)在体内显示活性(表4)。
表4:CsPT4截短的多肽的筛选
CsPT4构建体 菌株 峰值强度
CsPT4 S29 8901
CsPT4_t76 S147 6859
CsPT4_t112 S166 19
CsPT4_t131 S167 24
CsPT4_t142 S168 20
CsPT4_t166 S169 21
CsPT4_t186 S170 29
实施例6–能够在己酸(己酸(caproic acid))进料的情况下高通量产生CBGA的基 础酵母菌株的产生
为了将用橄榄醇酸产生CBGA的高通量菌株(S29)转化成用己酸产生CBGA的高通量菌株,使用S29中的GAL1或GAL10启动子表达用于由脂肪酸产生橄榄醇酸的基因。该菌株包含以下来自大麻的染色体整合的橄榄醇酸途径基因:三个拷贝的TKS和三个拷贝的OAC。用两个拷贝的大麻AAE1(S78)、两个拷贝的大麻AAE3(S81)或两个拷贝的酿酒酵母FAA2(S83)产生了三种不同的菌株(有关菌株的信息,请参见表11)。如实施例4和5中所述使菌株生长并对其进行测试,但是向培养基中添加2mM己酸而不是1mM橄榄醇酸。观察到由菌株产生的CBGA(表5)。
表5:CBGA的产生
Figure BDA0002337530530003851
实施例7–能够高通量产生CBDA和THCA的基础酵母菌株的产生
为了将用于产生CBGA的高通量菌株转化为用于产生CBDA或THCA的高通量菌株,将编码CBDA合成酶多肽(S34)或THCA合成酶多肽(S123)的异源核酸添加到菌株S29中(有关菌株的信息,请参见表11)。如实施例4和5中所述,用1mM橄榄醇酸在培养基中测试菌株。如图83和84所示,所述菌株产生CBDA和THCA。
实施例8–向酵母进料大麻素前体衍生物以产生稀有和非天然存在的CBGA衍生物
如实施例4和5中所述使来自实施例6的菌株(S78、S81和S83)生长,但是向培养基中添加2mM羧酸(表6中详述),并且如实施例4中所述进行分析。表6详述了菌株产生的产物(产物峰值强度)。
表6:产生的CBGA衍生物
Figure BDA0002337530530003852
Figure BDA0002337530530003861
Figure BDA0002337530530003871
实施例9–向酵母进料大麻素前体衍生物以产生稀有和非天然存在的CBDA衍生物
如实施例4和5中所述,用1mM橄榄醇酸衍生物测试具有CBDA合成酶多肽的菌株(S34)或没有CBDA合成酶多肽的菌株(S29)(在表7中详述)。表7详述了由所述菌株产生的产物。
表7:产生的CBDA衍生物
Figure BDA0002337530530003872
实施例10–向酵母进料大麻素前体以产生CBDA或CBGA
由于存在产生大麻素前体(例如GPP)的多种方法,因此在体内测试了许多不同的基因以优化大麻素的产生。如下所述以各种组合测试了不同的GPP合成酶多肽、CBDA合成酶多肽、TKS多肽、OAC多肽、中链和长链脂肪酰辅酶A合成酶多肽(有关菌株的信息,请参见表11)。
用不同的GPP合成酶多肽构建菌株,以确定当进料1mM橄榄醇酸时用于产生CBGA的GPP最佳产生菌株。用编码CsPT4多肽和GPP合成酶多肽的异源核酸转化菌株S21。如实施例4中所述测量CBGA效价。表8中示出了CBGA效价、效价标准偏差(SD)和测试的重复次数。
表8:CBGA的产生
产物 菌株 效价(mg/L) SD n
CBGA S29 215.6 12.2 8
CBGA S114 6.8 0.7 3
CBGA S116 15.5 2.0 4
CBGA S108 8.5 1.7 4
CBGA S112 9.9 1.6 4
CBGA S104 10.2 1.6 3
CBGA S115 9.2 1.9 4
CBGA S118 5.1 NA 1
为了优化CBDA的产生,用具有两个拷贝的编码CBDA合成酶多肽的异源核酸的一系列构建体转化菌株S29,并如实施例4和5中所述用1mM橄榄醇酸使其生长。如实施例4中所述测量CBDA。CBDA峰值强度、峰值强度标准偏差(SD)和测试的重复次数如表9所示。
表9:CBDA的产生
Figure BDA0002337530530003881
Figure BDA0002337530530003891
为了优化由己酸产生CBGA,在体内测试了TKS多肽、OAC多肽和中链和长链脂肪酰辅酶A合成酶多肽的不同组合。所有菌株都是菌株S29的子代或孙代。如实施例4所述测试所有菌株,其中将2mM己酸添加到产生培养基中。表10示出了CBGA效价、效价标准偏差(SD)和测试的重复次数。
表10:CBGA的产生
Figure BDA0002337530530003892
表11:实施例中使用的构建体和菌株
Figure BDA0002337530530003901
Figure BDA0002337530530003911
Figure BDA0002337530530003921
Figure BDA0002337530530003931
Figure BDA0002337530530003941
Figure BDA0002337530530003951
Figure BDA0002337530530003961
*如果一个菌株具有亲本菌株,那么它是子代菌株。亲本菌株中存在的所有构建体也都存在于子代菌株中。
虽然已经参考本发明的特定实施方案描述了本发明,但是本领域技术人员应当理解,在不脱离本发明的真实精神和范围的情况下,可以做出各种改变并且可以用等价方案代替。另外,可以做出许多修改以使特定情况、材料、物质组成、方法、一个或多个方法步骤适应本发明的目的、精神和范围。所有这样的修改旨在落入所附权利要求的范围内。
序列表
<110> 加州大学董事会(The Regents of the University of California)
J·D·凯斯林(Keasling, Jay D.)
L·德斯帕克斯(d'Espaux, Leo)
J·黄(Wong, Jeff)
罗小舟(Luo, Xiaozhou)
M·雷特(Reiter, Michael)
C·登比(Denby, Charles)
A·莱希纳(Lechner, Anna)
<120> 产生大麻素和大麻素衍生物的微生物和方法
<130> FIC19210113P
<150> US 62/569,532
<151> 2017-10-07
<150> US 62/491,114
<151> 2017-04-27
<160> 225
<170> SIPOSequenceListing 1.0
<210> 1
<211> 776
<212> PRT
<213> Cannabis sativa
<400> 1
Met Ala Leu Glu Leu Pro His Leu Leu Pro Tyr Lys Leu Val Lys Gly
1 5 10 15
Gln Thr Leu Val Ala Gln Ala Ala Arg Ala Glu Leu Ala Ser Ser Ser
20 25 30
Ser Ser Ser Val Ile Leu Lys Ser Asn Phe Ile Asn Asn Asn Tyr Ile
35 40 45
Asn Tyr Cys Asn Asn Asn Asn Asn Asn Glu Arg Arg Leu Val Val Arg
50 55 60
Arg Asp Trp Glu Thr Met Ala Ser Ser Pro Ser His Ser Arg Asn Asn
65 70 75 80
Asn Asp Ile Arg Thr Ile Asn His Leu Arg His Val Asp Ser Met Ala
85 90 95
Thr Met Pro Ser Gly Ala Gly Lys Ile Pro Arg Leu Asn Ala Val Ile
100 105 110
Leu Gly Glu Ala Leu Ala Thr Glu Glu Asn Asp Leu Val Phe Pro Thr
115 120 125
Asp Glu Phe Ser Gln Gln Ala His Val Pro Ser Pro Gln Lys Tyr Leu
130 135 140
Glu Met Tyr Lys Arg Ser Ile Glu Asp Pro Ala Gly Phe Trp Ser Glu
145 150 155 160
Ile Ala Ser Gln Phe Tyr Trp Lys Gln Lys Trp Asp Asp Ser Val Tyr
165 170 175
Ser Glu Asn Leu Asp Val Ser Lys Gly Arg Val Asn Ile Glu Trp Phe
180 185 190
Lys Gly Gly Ile Thr Asn Ile Cys Tyr Asn Cys Leu Asp Lys Asn Val
195 200 205
Glu Ala Gly Leu Gly Asp Lys Ile Ala Leu Tyr Trp Glu Gly Asn Asp
210 215 220
Thr Gly Phe Asp Asp Ser Leu Thr Tyr Ser Gln Leu Leu His Lys Val
225 230 235 240
Cys Gln Leu Ala Asn Tyr Leu Lys Asp Met Gly Val Gln Lys Gly Asp
245 250 255
Ala Val Val Ile Tyr Leu Pro Met Leu Leu Glu Leu Pro Ile Thr Met
260 265 270
Leu Ala Cys Ala Arg Ile Gly Ala Val His Ser Val Val Phe Ala Gly
275 280 285
Phe Ser Ala Glu Ser Leu Ser Gln Arg Ile Ile Asp Cys Lys Pro Lys
290 295 300
Val Val Ile Thr Cys Asn Ala Val Lys Arg Gly Pro Lys Ile Ile His
305 310 315 320
Leu Lys Asp Ile Val Asp Ala Ala Leu Val Glu Ser Ala Lys Thr Gly
325 330 335
Val Pro Ile Asp Thr Cys Leu Val Tyr Glu Asn Gln Leu Ala Met Lys
340 345 350
Arg Asp Ile Thr Lys Trp Gln Asp Gly Arg Asp Ile Trp Trp Gln Asp
355 360 365
Val Ile Pro Lys Tyr Pro Thr Glu Cys Ala Val Glu Trp Val Asp Ala
370 375 380
Glu Asp Pro Leu Phe Leu Leu Tyr Thr Ser Gly Ser Thr Gly Lys Pro
385 390 395 400
Lys Gly Val Leu His Thr Thr Gly Gly Tyr Met Val Tyr Thr Ala Thr
405 410 415
Thr Phe Lys Tyr Ala Phe Asp Tyr Lys Pro Ser Asp Val Tyr Trp Cys
420 425 430
Thr Ala Asp Cys Gly Trp Ile Thr Gly His Ser Tyr Val Thr Tyr Gly
435 440 445
Pro Leu Leu Asn Gly Ala Ser Cys Ile Val Phe Glu Gly Ala Pro Asn
450 455 460
Tyr Pro Asp Ser Gly Arg Cys Trp Asp Ile Val Asp Lys Tyr Lys Val
465 470 475 480
Thr Ile Phe Tyr Thr Ala Pro Thr Leu Val Arg Ser Leu Met Arg Asp
485 490 495
Gly Asp Glu Tyr Val Thr Arg Tyr Ser Arg Lys Ser Leu Arg Ile Leu
500 505 510
Gly Ser Val Gly Glu Pro Ile Asn Pro Ser Ala Trp Arg Trp Phe Tyr
515 520 525
Asn Val Val Gly Asp Ser Arg Cys Pro Ile Ser Asp Thr Trp Trp Gln
530 535 540
Thr Glu Thr Gly Gly Phe Met Ile Thr Pro Leu Pro Gly Ala Trp Pro
545 550 555 560
Gln Lys Pro Gly Ser Ala Thr Phe Pro Phe Phe Gly Val Lys Pro Val
565 570 575
Ile Val Asp Glu Lys Gly Val Glu Ile Glu Gly Glu Cys Ser Gly Tyr
580 585 590
Leu Cys Val Lys Gly Ser Trp Pro Gly Ala Phe Arg Thr Leu Tyr Gly
595 600 605
Asp Tyr Glu Arg Tyr Glu Thr Thr Tyr Phe Lys Pro Phe Thr Gly Tyr
610 615 620
Tyr Phe Thr Gly Asp Gly Cys Ser Arg Asp Lys Asp Gly Tyr His Trp
625 630 635 640
Leu Thr Gly Arg Val Asp Asp Val Ile Asn Val Ser Gly His Arg Ile
645 650 655
Gly Thr Ala Glu Val Glu Ser Ala Leu Val Ser His Pro Lys Cys Ala
660 665 670
Glu Ala Ala Val Val Gly Ile Glu His Glu Val Lys Gly Gln Ala Ile
675 680 685
Tyr Ala Phe Val Thr Leu Val Glu Gly Glu Pro Tyr Ser Glu Glu Leu
690 695 700
Arg Lys Ser Leu Ile Leu Ser Val Arg Lys Gln Ile Gly Ala Phe Ala
705 710 715 720
Ala Pro Glu Arg Ile His Trp Ala Pro Gly Leu Pro Lys Thr Arg Ser
725 730 735
Gly Lys Ile Met Arg Arg Ile Leu Arg Lys Ile Ala Ser Gly Gln Leu
740 745 750
Asp Glu Leu Gly Asp Thr Ser Thr Leu Ala Asp Pro Asn Val Val Glu
755 760 765
Gln Leu Ile Ser Leu Ser Asn Cys
770 775
<210> 2
<211> 579
<212> PRT
<213> Streptomyces sp.
<400> 2
Met Glu Leu Ala Leu Pro Ala Glu Leu Ala Pro Thr Leu Pro Glu Ala
1 5 10 15
Leu Arg Leu Arg Ser Glu Gln Gln Pro Asp Thr Val Ala Tyr Val Phe
20 25 30
Leu Arg Asp Gly Glu Thr Pro Glu Glu Thr Leu Thr Tyr Gly Arg Leu
35 40 45
Asp Arg Ala Ala Arg Ala Arg Ala Ala Ala Leu Glu Ala Ala Gly Leu
50 55 60
Ala Gly Gly Thr Ala Val Leu Leu Tyr Pro Ser Gly Leu Glu Phe Val
65 70 75 80
Ala Ala Leu Leu Gly Cys Met Tyr Ala Gly Thr Ala Gly Ala Pro Val
85 90 95
Gln Val Pro Thr Arg Arg Arg Gly Met Glu Arg Ala Arg Arg Ile Ala
100 105 110
Asp Asp Ala Gly Ala Lys Thr Ile Leu Thr Thr Thr Ala Val Lys Arg
115 120 125
Glu Val Glu Glu His Phe Ala Asp Leu Leu Thr Gly Leu Thr Val Ile
130 135 140
Asp Thr Glu Ser Leu Pro Asp Val Pro Asp Asp Ala Pro Ala Val Arg
145 150 155 160
Leu Pro Gly Pro Asp Asp Val Ala Leu Leu Gln Tyr Thr Ser Gly Ser
165 170 175
Thr Gly Asp Pro Lys Gly Val Glu Val Thr His Ala Asn Phe Arg Ala
180 185 190
Asn Val Ala Glu Thr Val Glu Leu Trp Pro Val Arg Ser Asp Gly Thr
195 200 205
Val Val Asn Trp Leu Pro Leu Phe His Asp Met Gly Leu Met Phe Gly
210 215 220
Val Val Met Pro Leu Phe Thr Gly Val Pro Ala Tyr Leu Met Ala Pro
225 230 235 240
Gln Ser Phe Ile Arg Arg Pro Ala Arg Trp Leu Glu Ala Ile Ser Arg
245 250 255
Phe Arg Gly Thr His Ala Ala Ala Pro Ser Phe Ala Tyr Glu Leu Cys
260 265 270
Val Arg Ser Val Ala Asp Thr Gly Leu Pro Ala Gly Leu Asp Leu Ser
275 280 285
Ser Trp Arg Val Ala Val Asn Gly Ala Glu Pro Val Arg Trp Thr Ala
290 295 300
Val Ala Asp Phe Thr Glu Ala Tyr Ala Pro Ala Gly Phe Arg Pro Gln
305 310 315 320
Ala Met Cys Pro Gly Tyr Gly Leu Ala Glu Asn Thr Leu Lys Leu Ser
325 330 335
Gly Ser Pro Glu Asp Arg Pro Pro Thr Leu Leu Arg Ala Asp Ala Ala
340 345 350
Ala Leu Gln Asp Gly Arg Val Val Pro Leu Thr Gly Pro Gly Thr Asp
355 360 365
Gly Val Arg Leu Val Gly Ser Gly Val Thr Val Pro Ser Ser Arg Val
370 375 380
Ala Val Val Asp Pro Gly Thr Gly Thr Glu Gln Pro Ala Gly Arg Val
385 390 395 400
Gly Glu Ile Trp Ile Asn Gly Pro Cys Val Ala Arg Gly Tyr His Gly
405 410 415
Arg Pro Ala Glu Ser Ala Glu Ser Phe Gly Ala Arg Ile Ala Gly Gln
420 425 430
Glu Ala Arg Gly Thr Trp Leu Arg Thr Gly Asp Leu Gly Phe Leu His
435 440 445
Asp Gly Glu Val Phe Val Ala Gly Arg Leu Lys Asp Val Val Ile His
450 455 460
Gln Gly Arg Asn Phe Tyr Pro Gln Asp Ile Glu Leu Ser Ala Glu Val
465 470 475 480
Ser Asp Arg Ala Leu His Pro Asn Cys Ala Ala Ala Phe Ala Leu Asp
485 490 495
Asp Gly Arg Thr Glu Arg Leu Val Leu Leu Val Glu Ala Asp Gly Arg
500 505 510
Ala Leu Arg Asn Gly Gly Ala Asp Ala Leu Arg Ala Arg Val His Asp
515 520 525
Ala Val Trp Asp Arg Gln Arg Leu Arg Ile Asp Glu Ile Val Leu Leu
530 535 540
Arg Arg Gly Ala Leu Pro Lys Thr Ser Ser Gly Lys Val Gln Arg Arg
545 550 555 560
Leu Ala Arg Ser Arg Tyr Leu Asp Gly Glu Phe Gly Pro Ala Pro Ala
565 570 575
Arg Glu Ala
<210> 3
<211> 1671
<212> PRT
<213> Aspergillus sp.
<400> 3
Met Val Ile Gln Gly Lys Arg Leu Ala Ala Ser Ser Ile Gln Leu Leu
1 5 10 15
Ala Ser Ser Leu Asp Ala Lys Lys Leu Cys Tyr Glu Tyr Asp Glu Arg
20 25 30
Gln Ala Pro Gly Val Thr Gln Ile Thr Glu Glu Ala Pro Thr Glu Gln
35 40 45
Pro Pro Leu Ser Thr Pro Pro Ser Leu Pro Gln Thr Pro Asn Ile Ser
50 55 60
Pro Ile Ser Ala Ser Lys Ile Val Ile Asp Asp Val Ala Leu Ser Arg
65 70 75 80
Val Gln Ile Val Gln Ala Leu Val Ala Arg Lys Leu Lys Thr Ala Ile
85 90 95
Ala Gln Leu Pro Thr Ser Lys Ser Ile Lys Glu Leu Ser Gly Gly Arg
100 105 110
Ser Ser Leu Gln Asn Glu Leu Val Gly Asp Ile His Asn Glu Phe Ser
115 120 125
Ser Ile Pro Asp Ala Pro Glu Gln Ile Leu Leu Arg Asp Phe Gly Asp
130 135 140
Ala Asn Pro Thr Val Gln Leu Gly Lys Thr Ser Ser Ala Ala Val Ala
145 150 155 160
Lys Leu Ile Ser Ser Lys Met Pro Ser Asp Phe Asn Ala Asn Ala Ile
165 170 175
Arg Ala His Leu Ala Asn Lys Trp Gly Leu Gly Pro Leu Arg Gln Thr
180 185 190
Ala Val Leu Leu Tyr Ala Ile Ala Ser Glu Pro Pro Ser Arg Leu Ala
195 200 205
Ser Ser Ser Ala Ala Glu Glu Tyr Trp Asp Asn Val Ser Ser Met Tyr
210 215 220
Ala Glu Ser Cys Gly Ile Thr Leu Arg Pro Arg Gln Asp Thr Met Asn
225 230 235 240
Glu Asp Ala Met Ala Ser Ser Ala Ile Asp Pro Ala Val Val Ala Glu
245 250 255
Phe Ser Lys Gly His Arg Arg Leu Gly Val Gln Gln Phe Gln Ala Leu
260 265 270
Ala Glu Tyr Leu Gln Ile Asp Leu Ser Gly Ser Gln Ala Ser Gln Ser
275 280 285
Asp Ala Leu Val Ala Glu Leu Gln Gln Lys Val Asp Leu Trp Thr Ala
290 295 300
Glu Met Thr Pro Glu Phe Leu Ala Gly Ile Ser Pro Met Leu Asp Val
305 310 315 320
Lys Lys Ser Arg Arg Tyr Gly Ser Trp Trp Asn Met Ala Arg Gln Asp
325 330 335
Val Leu Ala Phe Tyr Arg Arg Pro Ser Tyr Ser Glu Phe Val Asp Asp
340 345 350
Ala Leu Ala Phe Lys Val Phe Leu Asn Arg Leu Cys Asn Arg Ala Asp
355 360 365
Glu Ala Leu Leu Asn Met Val Arg Ser Leu Ser Cys Asp Ala Tyr Phe
370 375 380
Lys Gln Gly Ser Leu Pro Gly Tyr His Ala Ala Ser Arg Leu Leu Glu
385 390 395 400
Gln Ala Ile Thr Ser Thr Val Ala Asp Cys Pro Lys Ala Arg Leu Ile
405 410 415
Leu Pro Ala Val Gly Pro His Thr Thr Ile Thr Lys Asp Gly Thr Ile
420 425 430
Glu Tyr Ala Glu Ala Pro Arg Gln Gly Val Ser Gly Pro Thr Ala Tyr
435 440 445
Ile Gln Ser Leu Arg Gln Gly Ala Ser Phe Ile Gly Leu Lys Ser Ala
450 455 460
Asp Val Asp Thr Gln Ser Asn Leu Thr Asp Ala Leu Leu Asp Ala Met
465 470 475 480
Cys Leu Ala Leu His Asn Gly Ile Ser Phe Val Gly Lys Thr Phe Leu
485 490 495
Val Thr Gly Ala Gly Gln Gly Ser Ile Gly Ala Gly Val Val Arg Leu
500 505 510
Leu Leu Glu Gly Gly Ala Arg Val Leu Val Thr Thr Ser Arg Glu Pro
515 520 525
Ala Thr Thr Ser Arg Tyr Phe Gln Gln Met Tyr Asp Asn His Gly Ala
530 535 540
Lys Phe Ser Glu Leu Arg Val Val Pro Cys Asn Leu Ala Ser Ala Gln
545 550 555 560
Asp Cys Glu Gly Leu Ile Arg His Val Tyr Asp Pro Arg Gly Leu Asn
565 570 575
Trp Asp Leu Asp Ala Ile Leu Pro Phe Ala Ala Ala Ser Asp Tyr Ser
580 585 590
Thr Glu Met His Asp Ile Arg Gly Gln Ser Glu Leu Gly His Arg Leu
595 600 605
Met Leu Val Asn Val Phe Arg Val Leu Gly His Ile Val His Cys Lys
610 615 620
Arg Asp Ala Gly Val Asp Cys His Pro Thr Gln Val Leu Leu Pro Leu
625 630 635 640
Ser Pro Asn His Gly Ile Phe Gly Gly Asp Gly Met Tyr Pro Glu Ser
645 650 655
Lys Leu Ala Leu Glu Ser Leu Phe His Arg Ile Arg Ser Glu Ser Trp
660 665 670
Ser Asp Gln Leu Ser Ile Cys Gly Val Arg Ile Gly Trp Thr Arg Ser
675 680 685
Thr Gly Leu Met Thr Ala His Asp Ile Ile Ala Glu Thr Val Glu Glu
690 695 700
His Gly Ile Arg Thr Phe Ser Val Ala Glu Met Ala Leu Asn Ile Ala
705 710 715 720
Met Leu Leu Thr Pro Asp Phe Val Ala His Cys Glu Asp Gly Pro Leu
725 730 735
Asp Ala Asp Phe Thr Gly Ser Leu Gly Thr Leu Gly Ser Ile Pro Gly
740 745 750
Phe Leu Ala Gln Leu His Gln Lys Val Gln Leu Ala Ala Glu Val Ile
755 760 765
Arg Ala Val Gln Ala Glu Asp Glu His Glu Arg Phe Leu Ser Pro Gly
770 775 780
Thr Lys Pro Thr Leu Gln Ala Pro Val Ala Pro Met His Pro Arg Ser
785 790 795 800
Ser Leu Arg Val Gly Tyr Pro Arg Leu Pro Asp Tyr Glu Gln Glu Ile
805 810 815
Arg Pro Leu Ser Pro Arg Leu Glu Arg Leu Gln Asp Pro Ala Asn Ala
820 825 830
Val Val Val Val Gly Tyr Ser Glu Leu Gly Pro Trp Gly Ser Ala Arg
835 840 845
Leu Arg Trp Glu Ile Glu Ser Gln Gly Gln Trp Thr Ser Ala Gly Tyr
850 855 860
Val Glu Leu Ala Trp Leu Met Asn Leu Ile Arg His Val Asn Asp Glu
865 870 875 880
Ser Tyr Val Gly Trp Val Asp Thr Gln Thr Gly Lys Pro Val Arg Asp
885 890 895
Gly Glu Ile Gln Ala Leu Tyr Gly Asp His Ile Asp Asn His Thr Gly
900 905 910
Ile Arg Pro Ile Gln Ser Thr Ser Tyr Asn Pro Glu Arg Met Glu Val
915 920 925
Leu Gln Glu Val Ala Val Glu Glu Asp Leu Pro Glu Phe Glu Val Ser
930 935 940
Gln Leu Thr Ala Asp Ala Met Arg Leu Arg His Gly Ala Asn Val Ser
945 950 955 960
Ile Arg Pro Ser Gly Asn Pro Asp Ala Cys His Val Lys Leu Lys Arg
965 970 975
Gly Ala Val Ile Leu Val Pro Lys Thr Val Pro Phe Val Trp Gly Ser
980 985 990
Cys Ala Gly Glu Leu Pro Lys Gly Trp Thr Pro Ala Lys Tyr Gly Ile
995 1000 1005
Pro Glu Asn Leu Ile His Gln Val Asp Pro Val Thr Leu Tyr Thr Ile
1010 1015 1020
Cys Cys Val Ala Glu Ala Phe Tyr Ser Ala Gly Ile Thr His Pro Leu
1025 1030 1035 1040
Glu Val Phe Arg His Ile His Leu Ser Glu Leu Gly Asn Phe Ile Gly
1045 1050 1055
Ser Ser Met Gly Gly Pro Thr Lys Thr Arg Gln Leu Tyr Arg Asp Val
1060 1065 1070
Tyr Phe Asp His Glu Ile Pro Ser Asp Val Leu Gln Asp Thr Tyr Leu
1075 1080 1085
Asn Thr Pro Ala Ala Trp Val Asn Met Leu Leu Leu Gly Cys Thr Gly
1090 1095 1100
Pro Ile Lys Thr Pro Val Gly Ala Cys Ala Thr Gly Val Glu Ser Ile
1105 1110 1115 1120
Asp Ser Gly Tyr Glu Ser Ile Met Ala Gly Lys Thr Lys Met Cys Leu
1125 1130 1135
Val Gly Gly Tyr Asp Asp Leu Gln Glu Glu Ala Ser Tyr Gly Phe Ala
1140 1145 1150
Gln Leu Lys Ala Thr Val Asn Val Glu Glu Glu Ile Ala Cys Gly Arg
1155 1160 1165
Gln Pro Ser Glu Met Ser Arg Pro Met Ala Glu Ser Arg Ala Gly Phe
1170 1175 1180
Val Glu Ala His Gly Cys Gly Val Gln Leu Leu Cys Arg Gly Asp Ile
1185 1190 1195 1200
Ala Leu Gln Met Gly Leu Pro Ile Tyr Ala Val Ile Ala Ser Ser Ala
1205 1210 1215
Met Ala Ala Asp Lys Ile Gly Ser Ser Val Pro Ala Pro Gly Gln Gly
1220 1225 1230
Ile Leu Ser Phe Ser Arg Glu Arg Ala Arg Ser Ser Met Ile Ser Val
1235 1240 1245
Thr Ser Arg Pro Ser Ser Arg Ser Ser Thr Ser Ser Glu Val Ser Asp
1250 1255 1260
Lys Ser Ser Leu Thr Ser Ile Thr Ser Ile Ser Asn Pro Ala Pro Arg
1265 1270 1275 1280
Ala Gln Arg Ala Arg Ser Thr Thr Asp Met Ala Pro Leu Arg Ala Ala
1285 1290 1295
Leu Ala Thr Trp Gly Leu Thr Ile Asp Asp Leu Asp Val Ala Ser Leu
1300 1305 1310
His Gly Thr Ser Thr Arg Gly Asn Asp Leu Asn Glu Pro Glu Val Ile
1315 1320 1325
Glu Thr Gln Met Arg His Leu Gly Arg Thr Pro Gly Arg Pro Leu Trp
1330 1335 1340
Ala Ile Cys Gln Lys Ser Val Thr Gly His Pro Lys Ala Pro Ala Ala
1345 1350 1355 1360
Ala Trp Met Leu Asn Gly Cys Leu Gln Val Leu Asp Ser Gly Leu Val
1365 1370 1375
Pro Gly Asn Arg Asn Leu Asp Thr Leu Asp Glu Ala Leu Arg Ser Ala
1380 1385 1390
Ser His Leu Cys Phe Pro Thr Arg Thr Val Gln Leu Arg Glu Val Lys
1395 1400 1405
Ala Phe Leu Leu Thr Ser Phe Gly Phe Gly Gln Lys Gly Gly Gln Val
1410 1415 1420
Val Gly Val Ala Pro Lys Tyr Phe Phe Ala Thr Leu Pro Arg Pro Glu
1425 1430 1435 1440
Val Glu Gly Tyr Tyr Arg Lys Val Arg Val Arg Thr Glu Ala Gly Asp
1445 1450 1455
Arg Ala Tyr Ala Ala Ala Val Met Ser Gln Ala Val Val Lys Ile Gln
1460 1465 1470
Thr Gln Asn Pro Tyr Asp Glu Pro Asp Ala Pro Arg Ile Phe Leu Asp
1475 1480 1485
Pro Leu Ala Arg Ile Ser Gln Asp Pro Ser Thr Gly Gln Tyr Arg Phe
1490 1495 1500
Arg Ser Asp Ala Thr Pro Ala Leu Asp Asp Asp Ala Leu Pro Pro Pro
1505 1510 1515 1520
Gly Glu Pro Thr Glu Leu Val Lys Gly Ile Ser Ser Ala Trp Ile Glu
1525 1530 1535
Glu Lys Val Arg Pro His Met Ser Pro Gly Gly Thr Val Gly Val Asp
1540 1545 1550
Leu Val Pro Leu Ala Ser Phe Asp Ala Tyr Lys Asn Ala Ile Phe Val
1555 1560 1565
Glu Arg Asn Tyr Thr Val Arg Glu Arg Asp Trp Ala Glu Lys Ser Ala
1570 1575 1580
Asp Val Arg Ala Ala Tyr Ala Ser Arg Trp Cys Ala Lys Glu Ala Val
1585 1590 1595 1600
Phe Lys Cys Leu Gln Thr His Ser Gln Gly Ala Gly Ala Ala Met Lys
1605 1610 1615
Glu Ile Glu Ile Glu His Gly Gly Asn Gly Ala Pro Lys Val Lys Leu
1620 1625 1630
Arg Gly Ala Ala Gln Thr Ala Ala Arg Gln Arg Gly Leu Glu Gly Val
1635 1640 1645
Gln Leu Ser Ile Ser Tyr Gly Asp Asp Ala Val Ile Ala Val Ala Leu
1650 1655 1660
Gly Leu Met Ser Gly Ala Ser
1665 1670
<210> 4
<211> 1888
<212> PRT
<213> Aspergillus sp.
<400> 4
Met Gly Ser Val Ser Arg Glu His Glu Ser Ile Pro Ile Gln Ala Ala
1 5 10 15
Gln Arg Gly Ala Ala Arg Ile Cys Ala Ala Phe Gly Gly Gln Gly Ser
20 25 30
Asn Asn Leu Asp Val Leu Lys Gly Leu Leu Glu Leu Tyr Lys Arg Tyr
35 40 45
Gly Pro Asp Leu Asp Glu Leu Leu Asp Val Ala Ser Asn Thr Leu Ser
50 55 60
Gln Leu Ala Ser Ser Pro Ala Ala Ile Asp Val His Glu Pro Trp Gly
65 70 75 80
Phe Asp Leu Arg Gln Trp Leu Thr Thr Pro Glu Val Ala Pro Ser Lys
85 90 95
Glu Ile Leu Ala Leu Pro Pro Arg Ser Phe Pro Leu Asn Thr Leu Leu
100 105 110
Ser Leu Ala Leu Tyr Cys Ala Thr Cys Arg Glu Leu Glu Leu Asp Pro
115 120 125
Gly Gln Phe Arg Ser Leu Leu His Ser Ser Thr Gly His Ser Gln Gly
130 135 140
Ile Leu Ala Ala Val Ala Ile Thr Gln Ala Glu Ser Trp Pro Thr Phe
145 150 155 160
Tyr Asp Ala Cys Arg Thr Val Leu Gln Ile Ser Phe Trp Ile Gly Leu
165 170 175
Glu Ala Tyr Leu Phe Thr Pro Ser Ser Ala Ala Ser Asp Ala Met Ile
180 185 190
Gln Asp Cys Ile Glu His Gly Glu Gly Leu Leu Ser Ser Met Leu Ser
195 200 205
Val Ser Gly Leu Ser Arg Ser Gln Val Glu Arg Val Ile Glu His Val
210 215 220
Asn Lys Gly Leu Gly Glu Cys Asn Arg Trp Val His Leu Ala Leu Val
225 230 235 240
Asn Ser His Glu Lys Phe Val Leu Ala Gly Pro Pro Gln Ser Leu Trp
245 250 255
Ala Val Cys Leu His Val Arg Arg Ile Arg Ala Asp Asn Asp Leu Asp
260 265 270
Gln Ser Arg Ile Leu Phe Arg Asn Arg Lys Pro Ile Val Asp Ile Leu
275 280 285
Phe Leu Pro Ile Ser Ala Pro Phe His Thr Pro Tyr Leu Asp Gly Val
290 295 300
Gln Asp Arg Val Ile Glu Ala Leu Ser Ser Ala Ser Leu Ala Leu His
305 310 315 320
Ser Ile Lys Ile Pro Leu Tyr His Thr Gly Thr Gly Ser Asn Leu Gln
325 330 335
Glu Leu Gln Pro His Gln Leu Ile Pro Thr Leu Ile Arg Ala Ile Thr
340 345 350
Val Asp Gln Leu Asp Trp Pro Leu Val Cys Arg Gly Leu Asn Ala Thr
355 360 365
His Val Leu Asp Phe Gly Pro Gly Gln Thr Cys Ser Leu Ile Gln Glu
370 375 380
Leu Thr Gln Gly Thr Gly Val Ser Val Ile Gln Leu Thr Thr Gln Ser
385 390 395 400
Gly Pro Lys Pro Val Gly Gly His Leu Ala Ala Val Asn Trp Glu Ala
405 410 415
Glu Phe Gly Leu Arg Leu His Ala Asn Val His Gly Ala Ala Lys Leu
420 425 430
His Asn Arg Met Thr Thr Leu Leu Gly Lys Pro Pro Val Met Val Ala
435 440 445
Gly Met Thr Pro Thr Thr Val Arg Trp Asp Phe Val Ala Ala Val Ala
450 455 460
Gln Ala Gly Tyr His Val Glu Leu Ala Gly Gly Gly Tyr His Ala Glu
465 470 475 480
Arg Gln Phe Glu Ala Glu Ile Arg Arg Leu Ala Thr Ala Ile Pro Ala
485 490 495
Asp His Gly Ile Thr Cys Asn Leu Leu Tyr Ala Lys Pro Thr Thr Phe
500 505 510
Ser Trp Gln Ile Ser Val Ile Lys Asp Leu Val Arg Gln Gly Val Pro
515 520 525
Val Glu Gly Ile Thr Ile Gly Ala Gly Ile Pro Ser Pro Glu Val Val
530 535 540
Gln Glu Cys Val Gln Ser Ile Gly Leu Lys His Ile Ser Phe Lys Pro
545 550 555 560
Gly Ser Phe Glu Ala Ile His Gln Val Ile Gln Ile Ala Arg Thr His
565 570 575
Pro Asn Phe Leu Ile Gly Leu Gln Trp Thr Ala Gly Arg Gly Gly Gly
580 585 590
His His Ser Trp Glu Asp Phe His Gly Pro Ile Leu Ala Thr Tyr Ala
595 600 605
Gln Ile Arg Ser Cys Pro Asn Ile Leu Leu Val Val Gly Ser Gly Phe
610 615 620
Gly Gly Gly Pro Asp Thr Phe Pro Tyr Leu Thr Gly Gln Trp Ala Gln
625 630 635 640
Ala Phe Gly Tyr Pro Cys Met Pro Phe Asp Gly Val Leu Leu Gly Ser
645 650 655
Arg Met Met Val Ala Arg Glu Ala His Thr Ser Ala Gln Ala Lys Arg
660 665 670
Leu Ile Ile Asp Ala Gln Gly Val Gly Asp Ala Asp Trp His Lys Ser
675 680 685
Phe Asp Glu Pro Thr Gly Gly Val Val Thr Val Asn Ser Glu Phe Gly
690 695 700
Gln Pro Ile His Val Leu Ala Thr Arg Gly Val Met Leu Trp Lys Glu
705 710 715 720
Leu Asp Asn Arg Val Phe Ser Ile Lys Asp Thr Ser Lys Arg Leu Glu
725 730 735
Tyr Leu Arg Asn His Arg Gln Glu Ile Val Ser Arg Leu Asn Ala Asp
740 745 750
Phe Ala Arg Pro Trp Phe Ala Val Asp Gly His Gly Gln Asn Val Glu
755 760 765
Leu Glu Asp Met Thr Tyr Leu Glu Val Leu Arg Arg Leu Cys Asp Leu
770 775 780
Thr Tyr Val Ser His Gln Lys Arg Trp Val Asp Pro Ser Tyr Arg Ile
785 790 795 800
Leu Leu Leu Asp Phe Val His Leu Leu Arg Glu Arg Phe Gln Cys Ala
805 810 815
Ile Asp Asn Pro Gly Glu Tyr Pro Leu Asp Ile Ile Val Arg Val Glu
820 825 830
Glu Ser Leu Lys Asp Lys Ala Tyr Arg Thr Leu Tyr Pro Glu Asp Val
835 840 845
Ser Leu Leu Met His Leu Phe Ser Arg Arg Asp Ile Lys Pro Val Pro
850 855 860
Phe Ile Pro Arg Leu Asp Glu Arg Phe Glu Thr Trp Phe Lys Lys Asp
865 870 875 880
Ser Leu Trp Gln Ser Glu Asp Val Glu Ala Val Ile Gly Gln Asp Val
885 890 895
Gln Arg Ile Phe Ile Ile Gln Gly Pro Met Ala Val Gln Tyr Ser Ile
900 905 910
Ser Asp Asp Glu Ser Val Lys Asp Ile Leu His Asn Ile Cys Asn His
915 920 925
Tyr Val Glu Ala Leu Gln Ala Asp Ser Arg Glu Thr Ser Ile Gly Asp
930 935 940
Val His Ser Ile Thr Gln Lys Pro Leu Ser Ala Phe Pro Gly Leu Lys
945 950 955 960
Val Thr Thr Asn Arg Val Gln Gly Leu Tyr Lys Phe Glu Lys Val Gly
965 970 975
Ala Val Pro Glu Met Asp Val Leu Phe Glu His Ile Val Gly Leu Ser
980 985 990
Lys Ser Trp Ala Arg Thr Cys Leu Met Ser Lys Ser Val Phe Arg Asp
995 1000 1005
Gly Ser Arg Leu His Asn Pro Ile Arg Ala Ala Leu Gln Leu Gln Arg
1010 1015 1020
Gly Asp Thr Ile Glu Val Leu Leu Thr Ala Asp Ser Glu Ile Arg Lys
1025 1030 1035 1040
Ile Arg Leu Ile Ser Pro Thr Gly Asp Gly Gly Ser Thr Ser Lys Val
1045 1050 1055
Val Leu Glu Ile Val Ser Asn Asp Gly Gln Arg Val Phe Ala Thr Leu
1060 1065 1070
Ala Pro Asn Ile Pro Leu Ser Pro Glu Pro Ser Val Val Phe Cys Phe
1075 1080 1085
Lys Val Asp Gln Lys Pro Asn Glu Trp Thr Leu Glu Glu Asp Ala Ser
1090 1095 1100
Gly Arg Ala Glu Arg Ile Lys Ala Leu Tyr Met Ser Leu Trp Asn Leu
1105 1110 1115 1120
Gly Phe Pro Asn Lys Ala Ser Val Leu Gly Leu Asn Ser Gln Phe Thr
1125 1130 1135
Gly Glu Glu Leu Met Ile Thr Thr Asp Lys Ile Arg Asp Phe Glu Arg
1140 1145 1150
Val Leu Arg Gln Thr Ser Pro Leu Gln Leu Gln Ser Trp Asn Pro Gln
1155 1160 1165
Gly Cys Val Pro Ile Asp Tyr Cys Val Val Ile Ala Trp Ser Ala Leu
1170 1175 1180
Thr Lys Pro Leu Met Val Ser Ser Leu Lys Cys Asp Leu Leu Asp Leu
1185 1190 1195 1200
Leu His Ser Ala Ile Ser Phe His Tyr Ala Pro Ser Val Lys Pro Leu
1205 1210 1215
Arg Val Gly Asp Ile Val Lys Thr Ser Ser Arg Ile Leu Ala Val Ser
1220 1225 1230
Val Arg Pro Arg Gly Thr Met Leu Thr Val Ser Ala Asp Ile Gln Arg
1235 1240 1245
Gln Gly Gln His Val Val Thr Val Lys Ser Asp Phe Phe Leu Gly Gly
1250 1255 1260
Pro Val Leu Ala Cys Glu Thr Pro Phe Glu Leu Thr Glu Glu Pro Glu
1265 1270 1275 1280
Met Val Val His Val Asp Ser Glu Val Arg Arg Ala Ile Leu His Ser
1285 1290 1295
Arg Lys Trp Leu Met Arg Glu Asp Arg Ala Leu Asp Leu Leu Gly Arg
1300 1305 1310
Gln Leu Leu Phe Arg Leu Lys Ser Glu Lys Leu Phe Arg Pro Asp Gly
1315 1320 1325
Gln Leu Ala Leu Leu Gln Val Thr Gly Ser Val Phe Ser Tyr Ser Pro
1330 1335 1340
Asp Gly Ser Thr Thr Ala Phe Gly Arg Val Tyr Phe Glu Ser Glu Ser
1345 1350 1355 1360
Cys Thr Gly Asn Val Val Met Asp Phe Leu His Arg Tyr Gly Ala Pro
1365 1370 1375
Arg Ala Gln Leu Leu Glu Leu Gln His Pro Gly Trp Thr Gly Thr Ser
1380 1385 1390
Thr Val Ala Val Arg Gly Pro Arg Arg Ser Gln Ser Tyr Ala Arg Val
1395 1400 1405
Ser Leu Asp His Asn Pro Ile His Val Cys Pro Ala Phe Ala Arg Tyr
1410 1415 1420
Ala Gly Leu Ser Gly Pro Ile Val His Gly Met Glu Thr Ser Ala Met
1425 1430 1435 1440
Met Arg Arg Ile Ala Glu Trp Ala Ile Gly Asp Ala Asp Arg Ser Arg
1445 1450 1455
Phe Arg Ser Trp His Ile Thr Leu Gln Ala Pro Val His Pro Asn Asp
1460 1465 1470
Pro Leu Arg Val Glu Leu Gln His Lys Ala Met Glu Asp Gly Glu Met
1475 1480 1485
Val Leu Lys Val Gln Ala Phe Asn Glu Arg Thr Glu Glu Arg Val Ala
1490 1495 1500
Glu Ala Asp Ala His Val Glu Gln Glu Thr Thr Ala Tyr Val Phe Cys
1505 1510 1515 1520
Gly Gln Gly Ser Gln Arg Gln Gly Met Gly Met Asp Leu Tyr Val Asn
1525 1530 1535
Cys Pro Glu Ala Lys Ala Leu Trp Ala Arg Ala Asp Lys His Leu Trp
1540 1545 1550
Glu Lys Tyr Gly Phe Ser Ile Leu His Ile Val Gln Asn Asn Pro Pro
1555 1560 1565
Ala Leu Thr Val His Phe Gly Ser Gln Arg Gly Arg Arg Ile Arg Ala
1570 1575 1580
Asn Tyr Leu Arg Met Met Gly Gln Pro Pro Ile Asp Gly Arg His Pro
1585 1590 1595 1600
Pro Ile Leu Lys Gly Leu Thr Arg Asn Ser Thr Ser Tyr Thr Phe Ser
1605 1610 1615
Tyr Ser Gln Gly Leu Leu Met Ser Thr Gln Phe Ala Gln Pro Ala Leu
1620 1625 1630
Ala Leu Met Glu Met Ala Gln Phe Glu Trp Leu Lys Ala Gln Gly Val
1635 1640 1645
Val Gln Lys Gly Ala Arg Phe Ala Gly His Ser Leu Gly Glu Tyr Ala
1650 1655 1660
Ala Leu Gly Ala Cys Ala Ser Phe Leu Ser Phe Glu Asp Leu Ile Ser
1665 1670 1675 1680
Leu Ile Phe Tyr Arg Gly Leu Lys Met Gln Asn Ala Leu Pro Arg Asp
1685 1690 1695
Ala Asn Gly His Thr Asp Tyr Gly Met Leu Ala Ala Asp Pro Ser Arg
1700 1705 1710
Ile Gly Lys Gly Phe Glu Glu Ala Ser Leu Lys Cys Leu Val His Ile
1715 1720 1725
Ile Gln Gln Glu Thr Gly Trp Phe Val Glu Val Val Asn Tyr Asn Ile
1730 1735 1740
Asn Ser Gln Gln Tyr Val Cys Ala Gly His Phe Arg Ala Leu Trp Met
1745 1750 1755 1760
Leu Gly Lys Ile Cys Asp Asp Leu Ser Cys His Pro Gln Pro Glu Thr
1765 1770 1775
Val Glu Gly Gln Glu Leu Arg Ala Met Val Trp Lys His Val Pro Thr
1780 1785 1790
Val Glu Gln Val Pro Arg Glu Asp Arg Met Glu Arg Gly Arg Ala Thr
1795 1800 1805
Ile Pro Leu Pro Gly Ile Asp Ile Pro Tyr His Ser Thr Met Leu Arg
1810 1815 1820
Gly Glu Ile Glu Pro Tyr Arg Glu Tyr Leu Ser Glu Arg Ile Lys Val
1825 1830 1835 1840
Gly Asp Val Lys Pro Cys Glu Leu Val Gly Arg Trp Ile Pro Asn Val
1845 1850 1855
Val Gly Gln Pro Phe Ser Val Asp Lys Ser Tyr Val Gln Leu Val His
1860 1865 1870
Gly Ile Thr Gly Ser Pro Arg Leu His Ser Leu Leu Gln Gln Met Ala
1875 1880 1885
<210> 5
<211> 377
<212> PRT
<213> Mentha x piperita
<400> 5
Met Ser Ala Leu Val Asn Pro Val Ala Lys Trp Pro Gln Thr Ile Gly
1 5 10 15
Val Lys Asp Val His Gly Gly Arg Arg Arg Arg Ser Arg Ser Thr Leu
20 25 30
Phe Gln Ser His Pro Leu Arg Thr Glu Met Pro Phe Ser Leu Tyr Phe
35 40 45
Ser Ser Pro Leu Lys Ala Pro Ala Thr Phe Ser Val Ser Ala Val Tyr
50 55 60
Thr Lys Glu Gly Ser Glu Ile Arg Asp Lys Asp Pro Ala Pro Ser Thr
65 70 75 80
Ser Pro Ala Phe Asp Phe Asp Gly Tyr Met Leu Arg Lys Ala Lys Ser
85 90 95
Val Asn Lys Ala Leu Glu Ala Ala Val Gln Met Lys Glu Pro Leu Lys
100 105 110
Ile His Glu Ser Met Arg Tyr Ser Leu Leu Ala Gly Gly Lys Arg Val
115 120 125
Arg Pro Met Leu Cys Ile Ala Ala Cys Glu Leu Val Gly Gly Asp Glu
130 135 140
Ser Thr Ala Met Pro Ala Ala Cys Ala Val Glu Met Ile His Thr Met
145 150 155 160
Ser Leu Met His Asp Asp Leu Pro Cys Met Asp Asn Asp Asp Leu Arg
165 170 175
Arg Gly Lys Pro Thr Asn His Met Ala Phe Gly Glu Ser Val Ala Val
180 185 190
Leu Ala Gly Asp Ala Leu Leu Ser Phe Ala Phe Glu His Val Ala Ala
195 200 205
Ala Thr Lys Gly Ala Pro Pro Glu Arg Ile Val Arg Val Leu Gly Glu
210 215 220
Leu Ala Val Ser Ile Gly Ser Glu Gly Leu Val Ala Gly Gln Val Val
225 230 235 240
Asp Val Cys Ser Glu Gly Met Ala Glu Val Gly Leu Asp His Leu Glu
245 250 255
Phe Ile His His His Lys Thr Ala Ala Leu Leu Gln Gly Ser Val Val
260 265 270
Leu Gly Ala Ile Leu Gly Gly Gly Lys Glu Glu Glu Val Ala Lys Leu
275 280 285
Arg Lys Phe Ala Asn Cys Ile Gly Leu Leu Phe Gln Val Val Asp Asp
290 295 300
Ile Leu Asp Val Thr Lys Ser Ser Lys Glu Leu Gly Lys Thr Ala Gly
305 310 315 320
Lys Asp Leu Val Ala Asp Lys Thr Thr Tyr Pro Lys Leu Ile Gly Val
325 330 335
Glu Lys Ser Lys Glu Phe Ala Asp Arg Leu Asn Arg Glu Ala Gln Glu
340 345 350
Gln Leu Leu His Phe His Pro His Arg Ala Ala Pro Leu Ile Ala Leu
355 360 365
Ala Asn Tyr Ile Ala Tyr Arg Asp Asn
370 375
<210> 6
<211> 313
<212> PRT
<213> Mentha x piperita
<400> 6
Met Ala Ile Asn Leu Ser His Ile Asn Ser Lys Thr Cys Phe Pro Leu
1 5 10 15
Lys Thr Arg Ser Asp Leu Ser Arg Ser Ser Ser Ala Arg Cys Met Pro
20 25 30
Thr Ala Ala Ala Ala Ala Phe Pro Thr Ile Ala Thr Ala Ala Gln Ser
35 40 45
Gln Pro Tyr Trp Ala Ala Ile Glu Ala Asp Ile Glu Arg Tyr Leu Lys
50 55 60
Lys Ser Ile Thr Ile Arg Pro Pro Glu Thr Val Phe Gly Pro Met His
65 70 75 80
His Leu Thr Phe Ala Ala Pro Ala Thr Ala Ala Ser Thr Leu Cys Leu
85 90 95
Ala Ala Cys Glu Leu Val Gly Gly Asp Arg Ser Gln Ala Met Ala Ala
100 105 110
Ala Ala Ala Ile His Leu Val His Ala Ala Ala Tyr Val His Glu His
115 120 125
Leu Pro Leu Thr Asp Gly Ser Arg Pro Val Ser Lys Pro Ala Ile Gln
130 135 140
His Lys Tyr Gly Pro Asn Val Glu Leu Leu Thr Gly Asp Gly Ile Val
145 150 155 160
Pro Phe Gly Phe Glu Leu Leu Ala Gly Ser Val Asp Pro Ala Arg Thr
165 170 175
Asp Asp Pro Asp Arg Ile Leu Arg Val Ile Ile Glu Ile Ser Arg Ala
180 185 190
Gly Gly Pro Glu Gly Met Ile Ser Gly Leu His Arg Glu Glu Glu Ile
195 200 205
Val Asp Gly Asn Thr Ser Leu Asp Phe Ile Glu Tyr Val Cys Lys Lys
210 215 220
Lys Tyr Gly Glu Met His Ala Cys Gly Ala Ala Cys Gly Ala Ile Leu
225 230 235 240
Gly Gly Ala Ala Glu Glu Glu Ile Gln Lys Leu Arg Asn Phe Gly Leu
245 250 255
Tyr Gln Gly Thr Leu Arg Gly Met Met Glu Met Lys Asn Ser His Gln
260 265 270
Leu Ile Asp Glu Asn Ile Ile Gly Lys Leu Lys Glu Leu Ala Leu Glu
275 280 285
Glu Leu Gly Gly Phe His Gly Lys Asn Ala Glu Leu Met Ser Ser Leu
290 295 300
Val Ala Glu Pro Ser Leu Tyr Ala Ala
305 310
<210> 7
<211> 352
<212> PRT
<213> Saccharomyces sp.
<400> 7
Met Ala Ser Glu Lys Glu Ile Arg Arg Glu Arg Phe Leu Asn Val Phe
1 5 10 15
Pro Lys Leu Val Glu Glu Leu Asn Ala Ser Leu Leu Ala Tyr Gly Met
20 25 30
Pro Lys Glu Ala Cys Asp Trp Tyr Ala His Ser Leu Asn Tyr Asn Thr
35 40 45
Pro Gly Gly Lys Leu Asn Arg Gly Leu Ser Val Val Asp Thr Tyr Ala
50 55 60
Ile Leu Ser Asn Lys Thr Val Glu Gln Leu Gly Gln Glu Glu Tyr Glu
65 70 75 80
Lys Val Ala Ile Leu Gly Trp Cys Ile Glu Leu Leu Gln Ala Tyr Phe
85 90 95
Leu Val Ala Asp Asp Met Met Asp Lys Ser Ile Thr Arg Arg Gly Gln
100 105 110
Pro Cys Trp Tyr Lys Val Pro Glu Val Gly Glu Ile Ala Ile Asn Asp
115 120 125
Ala Phe Met Leu Glu Ala Ala Ile Tyr Lys Leu Leu Lys Ser His Phe
130 135 140
Arg Asn Glu Lys Tyr Tyr Ile Asp Ile Thr Glu Leu Phe His Glu Val
145 150 155 160
Thr Phe Gln Thr Glu Leu Gly Gln Leu Met Asp Leu Ile Thr Ala Pro
165 170 175
Glu Asp Lys Val Asp Leu Ser Lys Phe Ser Leu Lys Lys His Ser Phe
180 185 190
Ile Val Thr Phe Lys Thr Ala Tyr Tyr Ser Phe Tyr Leu Pro Val Ala
195 200 205
Leu Ala Met Tyr Val Ala Gly Ile Thr Asp Glu Lys Asp Leu Lys Gln
210 215 220
Ala Arg Asp Val Leu Ile Pro Leu Gly Glu Tyr Phe Gln Ile Gln Asp
225 230 235 240
Asp Tyr Leu Asp Cys Phe Gly Thr Pro Glu Gln Ile Gly Lys Ile Gly
245 250 255
Thr Asp Ile Gln Asp Asn Lys Cys Ser Trp Val Ile Asn Lys Ala Leu
260 265 270
Glu Leu Ala Ser Ala Glu Gln Arg Lys Thr Leu Asp Glu Asn Tyr Gly
275 280 285
Lys Lys Asp Ser Val Ala Glu Ala Lys Cys Lys Lys Ile Phe Asn Asp
290 295 300
Leu Lys Ile Glu Gln Leu Tyr His Glu Tyr Glu Glu Ser Ile Ala Lys
305 310 315 320
Asp Leu Lys Ala Lys Ile Ser Gln Val Asp Glu Ser Arg Gly Phe Lys
325 330 335
Ala Asp Val Leu Thr Ala Phe Leu Asn Lys Val Tyr Lys Arg Ser Lys
340 345 350
<210> 8
<211> 352
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(352)
<223> 突变的Erg20法呢基焦磷酸合成酶 (K197G)
<400> 8
Met Ala Ser Glu Lys Glu Ile Arg Arg Glu Arg Phe Leu Asn Val Phe
1 5 10 15
Pro Lys Leu Val Glu Glu Leu Asn Ala Ser Leu Leu Ala Tyr Gly Met
20 25 30
Pro Lys Glu Ala Cys Asp Trp Tyr Ala His Ser Leu Asn Tyr Asn Thr
35 40 45
Pro Gly Gly Lys Leu Asn Arg Gly Leu Ser Val Val Asp Thr Tyr Ala
50 55 60
Ile Leu Ser Asn Lys Thr Val Glu Gln Leu Gly Gln Glu Glu Tyr Glu
65 70 75 80
Lys Val Ala Ile Leu Gly Trp Cys Ile Glu Leu Leu Gln Ala Tyr Phe
85 90 95
Leu Val Ala Asp Asp Met Met Asp Lys Ser Ile Thr Arg Arg Gly Gln
100 105 110
Pro Cys Trp Tyr Lys Val Pro Glu Val Gly Glu Ile Ala Ile Asn Asp
115 120 125
Ala Phe Met Leu Glu Ala Ala Ile Tyr Lys Leu Leu Lys Ser His Phe
130 135 140
Arg Asn Glu Lys Tyr Tyr Ile Asp Ile Thr Glu Leu Phe His Glu Val
145 150 155 160
Thr Phe Gln Thr Glu Leu Gly Gln Leu Met Asp Leu Ile Thr Ala Pro
165 170 175
Glu Asp Lys Val Asp Leu Ser Lys Phe Ser Leu Lys Lys His Ser Phe
180 185 190
Ile Val Thr Phe Gly Thr Ala Tyr Tyr Ser Phe Tyr Leu Pro Val Ala
195 200 205
Leu Ala Met Tyr Val Ala Gly Ile Thr Asp Glu Lys Asp Leu Lys Gln
210 215 220
Ala Arg Asp Val Leu Ile Pro Leu Gly Glu Tyr Phe Gln Ile Gln Asp
225 230 235 240
Asp Tyr Leu Asp Cys Phe Gly Thr Pro Glu Gln Ile Gly Lys Ile Gly
245 250 255
Thr Asp Ile Gln Asp Asn Lys Cys Ser Trp Val Ile Asn Lys Ala Leu
260 265 270
Glu Leu Ala Ser Ala Glu Gln Arg Lys Thr Leu Asp Glu Asn Tyr Gly
275 280 285
Lys Lys Asp Ser Val Ala Glu Ala Lys Cys Lys Lys Ile Phe Asn Asp
290 295 300
Leu Lys Ile Glu Gln Leu Tyr His Glu Tyr Glu Glu Ser Ile Ala Lys
305 310 315 320
Asp Leu Lys Ala Lys Ile Ser Gln Val Asp Glu Ser Arg Gly Phe Lys
325 330 335
Ala Asp Val Leu Thr Ala Phe Leu Asn Lys Val Tyr Lys Arg Ser Lys
340 345 350
<210> 9
<211> 496
<212> PRT
<213> Rhizophagus irregularis
<400> 9
Met Arg Ala Gln Ala His Leu Gly Gly Gly Leu Lys Arg Ile Glu Thr
1 5 10 15
Gln His Gln Lys Gly Lys Leu Thr Ala Arg Glu Arg Ala Glu Leu Leu
20 25 30
Leu Asp Pro Gly Ser Phe Asn Glu Tyr Asp Thr Phe Val Glu His Gln
35 40 45
Cys Thr Asp Phe Gly Met Asp Lys Asn Lys Ile Ile Gly Asp Gly Val
50 55 60
Val Thr Gly His Gly Thr Ile Asn Gly Arg Arg Val Phe Thr Phe Ser
65 70 75 80
Gln Asp Phe Thr Ala Phe Gly Gly Ser Leu Ser Lys Met His Ala Gln
85 90 95
Lys Ile Cys Lys Ile Met Asp Lys Ala Met Leu Val Gly Ala Pro Val
100 105 110
Ile Gly Leu Asn Asp Ser Gly Gly Ala Arg Ile Gln Glu Gly Val Asp
115 120 125
Ser Leu Ala Gly Tyr Ala Asp Ile Phe Gln Arg Asn Val Leu Ser Ser
130 135 140
Gly Val Val Pro Gln Leu Ser Leu Ile Met Gly Pro Cys Ala Gly Gly
145 150 155 160
Ala Val Tyr Ser Pro Ala Leu Thr Asp Phe Thr Phe Met Val Arg Asp
165 170 175
Thr Ser Tyr Leu Phe Val Thr Gly Pro Glu Val Val Lys Ala Val Cys
180 185 190
Asn Glu Asp Val Thr Gln Glu Glu Leu Gly Gly Ala Asn Thr His Thr
195 200 205
Val Ile Ser Gly Val Ala His Ala Ala Phe Glu Asn Asp Ile Glu Ala
210 215 220
Ile Gln Arg Ile Arg Asp Phe Met Asp Phe Leu Pro Leu Ser Asn Arg
225 230 235 240
Glu Gln Ala Pro Thr Arg Tyr Ser Asp Asp Pro Ile Asp Arg Glu Asp
245 250 255
Pro Ser Leu Asn His Ile Ile Pro Val Asp Ser Thr Lys Ala Tyr Asp
260 265 270
Met Arg Glu Ile Ile Thr Arg Leu Ile Asp Asp Gly His Phe Phe Glu
275 280 285
Ile Met Pro Asp Tyr Ala Lys Asn Ile Val Val Gly Phe Ala Arg Met
290 295 300
Gly Gly Lys Thr Val Ser Ile Val Gly Asn Gln Pro Leu Val Ser Ser
305 310 315 320
Gly Val Leu Asp Ile Asn Ser Ser Val Lys Ala Ala Arg Phe Val Arg
325 330 335
Phe Cys Asp Ala Phe Asn Ile Pro Ile Ile Thr Leu Val Asp Val Pro
340 345 350
Gly Phe Leu Pro Gly Thr Ala Gln Glu His Asn Gly Ile Ile Arg His
355 360 365
Gly Ala Lys Leu Leu Tyr Ala Tyr Ala Glu Ala Thr Val Pro Lys Ile
370 375 380
Thr Ile Ile Thr Arg Lys Ala Tyr Gly Gly Ala Tyr Asp Val Met Ser
385 390 395 400
Ser Lys His Leu Arg Gly Asp Met Asn Tyr Ser Trp Pro Thr Gly Glu
405 410 415
Ile Ala Val Met Gly Ala Lys Gly Ala Val Glu Ile Ile Phe Arg His
420 425 430
Val Glu Asp Arg Thr Gln Ser Glu His Glu Tyr Ile Asp Lys Phe Ala
435 440 445
Asn Pro Ile Pro Ala Ala Gln Arg Gly Tyr Ile Asp Asp Ile Ile Leu
450 455 460
Pro Ala Ala Thr Arg Lys Arg Ile Ile Glu Asp Leu Phe Val Leu Ser
465 470 475 480
His Lys Gln Leu Pro Leu Ile Tyr Lys Lys His Asp Asn Cys Pro Leu
485 490 495
<210> 10
<211> 101
<212> PRT
<213> Cannabis sativa
<400> 10
Met Ala Val Lys His Leu Ile Val Leu Lys Phe Lys Asp Glu Ile Thr
1 5 10 15
Glu Ala Gln Lys Glu Glu Phe Phe Lys Thr Tyr Val Asn Leu Val Asn
20 25 30
Ile Ile Pro Ala Met Lys Asp Val Tyr Trp Gly Lys Asp Val Thr Gln
35 40 45
Lys Asn Lys Glu Glu Gly Tyr Thr His Ile Val Glu Val Thr Phe Glu
50 55 60
Ser Val Glu Thr Ile Gln Asp Tyr Ile Ile His Pro Ala His Val Gly
65 70 75 80
Phe Gly Asp Val Tyr Arg Ser Phe Trp Glu Lys Leu Leu Ile Phe Asp
85 90 95
Tyr Thr Pro Arg Lys
100
<210> 11
<211> 385
<212> PRT
<213> Cannabis sativa
<400> 11
Met Asn His Leu Arg Ala Glu Gly Pro Ala Ser Val Leu Ala Ile Gly
1 5 10 15
Thr Ala Asn Pro Glu Asn Ile Leu Leu Gln Asp Glu Phe Pro Asp Tyr
20 25 30
Tyr Phe Arg Val Thr Lys Ser Glu His Met Thr Gln Leu Lys Glu Lys
35 40 45
Phe Arg Lys Ile Cys Asp Lys Ser Met Ile Arg Lys Arg Asn Cys Phe
50 55 60
Leu Asn Glu Glu His Leu Lys Gln Asn Pro Arg Leu Val Glu His Glu
65 70 75 80
Met Gln Thr Leu Asp Ala Arg Gln Asp Met Leu Val Val Glu Val Pro
85 90 95
Lys Leu Gly Lys Asp Ala Cys Ala Lys Ala Ile Lys Glu Trp Gly Gln
100 105 110
Pro Lys Ser Lys Ile Thr His Leu Ile Phe Thr Ser Ala Ser Thr Thr
115 120 125
Asp Met Pro Gly Ala Asp Tyr His Cys Ala Lys Leu Leu Gly Leu Ser
130 135 140
Pro Ser Val Lys Arg Val Met Met Tyr Gln Leu Gly Cys Tyr Gly Gly
145 150 155 160
Gly Thr Val Leu Arg Ile Ala Lys Asp Ile Ala Glu Asn Asn Lys Gly
165 170 175
Ala Arg Val Leu Ala Val Cys Cys Asp Ile Met Ala Cys Leu Phe Arg
180 185 190
Gly Pro Ser Glu Ser Asp Leu Glu Leu Leu Val Gly Gln Ala Ile Phe
195 200 205
Gly Asp Gly Ala Ala Ala Val Ile Val Gly Ala Glu Pro Asp Glu Ser
210 215 220
Val Gly Glu Arg Pro Ile Phe Glu Leu Val Ser Thr Gly Gln Thr Ile
225 230 235 240
Leu Pro Asn Ser Glu Gly Thr Ile Gly Gly His Ile Arg Glu Ala Gly
245 250 255
Leu Ile Phe Asp Leu His Lys Asp Val Pro Met Leu Ile Ser Asn Asn
260 265 270
Ile Glu Lys Cys Leu Ile Glu Ala Phe Thr Pro Ile Gly Ile Ser Asp
275 280 285
Trp Asn Ser Ile Phe Trp Ile Thr His Pro Gly Gly Lys Ala Ile Leu
290 295 300
Asp Lys Val Glu Glu Lys Leu His Leu Lys Ser Asp Lys Phe Val Asp
305 310 315 320
Ser Arg His Val Leu Ser Glu His Gly Asn Met Ser Ser Ser Thr Val
325 330 335
Leu Phe Val Met Asp Glu Leu Arg Lys Arg Ser Leu Glu Glu Gly Lys
340 345 350
Ser Thr Thr Gly Asp Gly Phe Glu Trp Gly Val Leu Phe Gly Phe Gly
355 360 365
Pro Gly Leu Thr Val Glu Arg Val Val Val Arg Ser Val Pro Ile Lys
370 375 380
Tyr
385
<210> 12
<211> 327
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(327)
<223> 截短的香叶基焦磷酸橄榄醇酸香叶基转移酶(GOT)
<400> 12
Met Asn Ser Ile Arg Ala Ala Thr Thr Asn Gln Thr Glu Pro Pro Glu
1 5 10 15
Ser Asp Asn His Ser Val Ala Thr Lys Ile Leu Asn Phe Gly Lys Ala
20 25 30
Cys Trp Lys Leu Gln Arg Pro Tyr Thr Ile Ile Ala Phe Thr Ser Cys
35 40 45
Ala Cys Gly Leu Phe Gly Lys Glu Leu Leu His Asn Thr Asn Leu Ile
50 55 60
Ser Trp Ser Leu Met Phe Lys Ala Phe Phe Phe Leu Val Ala Ile Leu
65 70 75 80
Cys Ile Ala Ser Phe Thr Thr Thr Ile Asn Gln Ile Tyr Asp Leu His
85 90 95
Ile Asp Arg Ile Asn Lys Pro Asp Leu Pro Leu Ala Ser Gly Glu Ile
100 105 110
Ser Val Asn Thr Ala Trp Ile Met Ser Ile Ile Val Ala Leu Phe Gly
115 120 125
Leu Ile Ile Thr Ile Lys Met Lys Gly Gly Pro Leu Tyr Ile Phe Gly
130 135 140
Tyr Cys Phe Gly Ile Phe Gly Gly Ile Val Tyr Ser Val Pro Pro Phe
145 150 155 160
Arg Trp Lys Gln Asn Pro Ser Thr Ala Phe Leu Leu Asn Phe Leu Ala
165 170 175
His Ile Ile Thr Asn Phe Thr Phe Tyr Tyr Ala Ser Arg Ala Ala Leu
180 185 190
Gly Leu Pro Phe Glu Leu Arg Pro Ser Phe Thr Phe Leu Leu Ala Phe
195 200 205
Met Lys Ser Met Gly Ser Ala Leu Ala Leu Ile Lys Asp Ala Ser Asp
210 215 220
Val Glu Gly Asp Thr Lys Phe Gly Ile Ser Thr Leu Ala Ser Lys Tyr
225 230 235 240
Gly Ser Arg Asn Leu Thr Leu Phe Cys Ser Gly Ile Val Leu Leu Ser
245 250 255
Tyr Val Ala Ala Ile Leu Ala Gly Ile Ile Trp Pro Gln Ala Phe Asn
260 265 270
Ser Asn Val Met Leu Leu Ser His Ala Ile Leu Ala Phe Trp Leu Ile
275 280 285
Leu Gln Thr Arg Asp Phe Ala Leu Thr Asn Tyr Asp Pro Glu Ala Gly
290 295 300
Arg Arg Phe Tyr Glu Phe Met Trp Lys Leu Tyr Tyr Ala Glu Tyr Leu
305 310 315 320
Val Tyr Val Phe Ile Gly Ser
325
<210> 13
<211> 332
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(332)
<223> 工程化的香叶基焦磷酸橄榄醇酸香叶基转移酶 (GOT)
<400> 13
Met Lys Asp Gln Arg Gly Asn Ser Ile Arg Ala Ser Ala Gln Ile Glu
1 5 10 15
Asp Arg Pro Pro Glu Ser Gly Asn Leu Ser Ala Leu Thr Asn Val Lys
20 25 30
Asp Phe Val Ser Val Cys Trp Glu Tyr Val Arg Pro Tyr Thr Ala Lys
35 40 45
Gly Val Ile Ile Cys Ser Ser Cys Leu Phe Gly Arg Glu Leu Leu Glu
50 55 60
Asn Pro Asn Leu Phe Ser Trp Pro Leu Ile Phe Lys Ala Phe Phe Phe
65 70 75 80
Leu Val Ala Ile Leu Cys Ile Ala Ser Phe Thr Thr Thr Ile Asn Gln
85 90 95
Ile Tyr Asp Leu His Ile Asp Arg Ile Asn Lys Pro Asp Leu Pro Leu
100 105 110
Ala Ser Gly Glu Ile Ser Val Asn Thr Ala Trp Ile Met Ser Ile Ile
115 120 125
Val Ala Leu Phe Gly Leu Ile Ile Thr Ile Lys Met Lys Gly Gly Pro
130 135 140
Leu Tyr Ile Phe Gly Tyr Cys Phe Gly Ile Phe Gly Gly Ile Val Tyr
145 150 155 160
Ser Val Pro Pro Phe Arg Trp Lys Gln Asn Pro Ser Thr Ala Phe Leu
165 170 175
Leu Asn Phe Leu Ala His Ile Ile Thr Asn Phe Thr Phe Tyr Tyr Ala
180 185 190
Ser Arg Ala Ala Leu Gly Leu Pro Phe Glu Leu Arg Pro Ser Phe Thr
195 200 205
Phe Leu Leu Ala Phe Met Lys Ser Met Gly Ser Ala Leu Ala Leu Ile
210 215 220
Lys Asp Ala Ser Asp Val Glu Gly Asp Thr Lys Phe Gly Ile Ser Thr
225 230 235 240
Leu Ala Ser Lys Tyr Gly Ser Arg Asn Leu Thr Leu Phe Cys Ser Gly
245 250 255
Ile Val Leu Leu Ser Tyr Val Ala Ala Ile Leu Ala Gly Ile Ile Trp
260 265 270
Pro Gln Ala Phe Asn Ser Asn Val Met Leu Leu Ser His Ala Ile Leu
275 280 285
Ala Phe Trp Leu Ile Leu Gln Thr Arg Asp Phe Ala Leu Thr Asn Tyr
290 295 300
Asp Pro Glu Ala Gly Arg Arg Phe Tyr Glu Phe Met Trp Lys Leu Tyr
305 310 315 320
Tyr Ala Glu Tyr Leu Val Tyr Val Phe Ile Gly Ser
325 330
<210> 14
<211> 547
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(547)
<223> 突变的四氢大麻酚酸合成酶(THCAS)
<400> 14
Met Asn Cys Ser Ala Phe Ser Phe Trp Phe Val Cys Lys Ile Ile Phe
1 5 10 15
Phe Phe Leu Ser Phe His Ile Gln Ile Ser Ile Ala Asn Pro Arg Glu
20 25 30
Asn Phe Leu Lys Cys Phe Ser Lys His Ile Pro Asn Asn Val Ala Asn
35 40 45
Pro Lys Leu Val Tyr Thr Gln His Asp Gln Leu Tyr Met Ser Ile Leu
50 55 60
Asn Ser Thr Ile Gln Asn Leu Arg Phe Ile Ser Asp Thr Thr Pro Lys
65 70 75 80
Pro Leu Val Ile Val Thr Pro Ser Asn Asn Ser His Ile Gln Ala Thr
85 90 95
Ile Leu Cys Ser Lys Lys Val Gly Leu Gln Ile Arg Thr Arg Ser Gly
100 105 110
Gly His Asp Ala Glu Gly Met Ser Tyr Ile Ser Gln Val Pro Phe Val
115 120 125
Val Val Asp Leu Arg Asn Met His Ser Ile Lys Ile Asp Val His Ser
130 135 140
Gln Thr Ala Trp Val Glu Ala Gly Ala Thr Leu Gly Glu Val Tyr Tyr
145 150 155 160
Trp Ile Asn Glu Lys Asn Glu Asn Leu Ser Phe Pro Gly Gly Tyr Cys
165 170 175
Pro Thr Val Gly Val Gly Gly His Phe Ser Gly Gly Gly Tyr Gly Ala
180 185 190
Leu Met Arg Asn Tyr Gly Leu Ala Ala Asp Asn Ile Ile Asp Ala His
195 200 205
Leu Val Asn Val Asp Gly Lys Val Leu Asp Arg Lys Ser Met Gly Glu
210 215 220
Asp Leu Phe Trp Ala Ile Arg Gly Gly Gly Gly Glu Asn Phe Gly Ile
225 230 235 240
Ile Ala Ala Trp Lys Ile Lys Leu Val Ala Val Pro Ser Lys Ser Thr
245 250 255
Ile Phe Ser Val Lys Lys Asn Met Glu Ile His Gly Leu Val Lys Leu
260 265 270
Phe Asn Lys Trp Gln Asn Ile Ala Tyr Lys Tyr Asp Lys Asp Leu Val
275 280 285
Leu Met Thr His Phe Ile Thr Lys Asn Ile Thr Asp Asn His Gly Lys
290 295 300
Asn Lys Thr Thr Val His Gly Tyr Phe Ser Ser Ile Phe His Gly Gly
305 310 315 320
Val Asp Ser Leu Val Asp Leu Met Asn Lys Ser Phe Pro Glu Leu Gly
325 330 335
Ile Lys Lys Thr Asp Cys Lys Glu Phe Ser Trp Ile Asp Thr Thr Ile
340 345 350
Phe Tyr Ser Gly Val Val Asn Phe Asn Thr Ala Asn Phe Lys Lys Glu
355 360 365
Ile Leu Leu Asp Arg Ser Ala Gly Lys Lys Thr Ala Phe Ser Ile Lys
370 375 380
Leu Asp Tyr Val Lys Lys Pro Ile Pro Glu Thr Ala Met Val Lys Ile
385 390 395 400
Leu Glu Lys Leu Tyr Glu Glu Asp Val Gly Ala Gly Met Tyr Val Leu
405 410 415
Tyr Pro Tyr Gly Gly Ile Met Glu Glu Ile Ser Glu Ser Ala Ile Pro
420 425 430
Phe Pro His Arg Ala Gly Ile Met Tyr Glu Leu Trp Tyr Thr Ala Ser
435 440 445
Trp Glu Lys Gln Glu Asp Asn Glu Lys His Ile Asn Trp Val Arg Ser
450 455 460
Val Tyr Asn Phe Thr Thr Pro Tyr Val Ser Gln Asn Pro Arg Leu Ala
465 470 475 480
Tyr Leu Asn Tyr Arg Asp Leu Asp Leu Gly Lys Thr Asn His Ala Ser
485 490 495
Pro Asn Asn Tyr Thr Gln Ala Arg Ile Trp Gly Glu Lys Tyr Phe Gly
500 505 510
Lys Asn Phe Asn Arg Leu Val Lys Val Lys Thr Lys Val Asp Pro Asn
515 520 525
Asn Phe Phe Arg Asn Glu Gln Ser Ile Pro Pro Leu Pro Pro His His
530 535 540
His Gly Ser
545
<210> 15
<211> 520
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(520)
<223> 截短的四氢大麻酚酸合成酶(THCAS)
<400> 15
Met Asn Pro Arg Glu Asn Phe Leu Lys Cys Phe Ser Lys His Ile Pro
1 5 10 15
Asn Asn Val Ala Asn Pro Lys Leu Val Tyr Thr Gln His Asp Gln Leu
20 25 30
Tyr Met Ser Ile Leu Asn Ser Thr Ile Gln Asn Leu Arg Phe Ile Ser
35 40 45
Asp Thr Thr Pro Lys Pro Leu Val Ile Val Thr Pro Ser Asn Asn Ser
50 55 60
His Ile Gln Ala Thr Ile Leu Cys Ser Lys Lys Val Gly Leu Gln Ile
65 70 75 80
Arg Thr Arg Ser Gly Gly His Asp Ala Glu Gly Met Ser Tyr Ile Ser
85 90 95
Gln Val Pro Phe Val Val Val Asp Leu Arg Asn Met His Ser Ile Lys
100 105 110
Ile Asp Val His Ser Gln Thr Ala Trp Val Glu Ala Gly Ala Thr Leu
115 120 125
Gly Glu Val Tyr Tyr Trp Ile Asn Glu Lys Asn Glu Asn Leu Ser Phe
130 135 140
Pro Gly Gly Tyr Cys Pro Thr Val Gly Val Gly Gly His Phe Ser Gly
145 150 155 160
Gly Gly Tyr Gly Ala Leu Met Arg Asn Tyr Gly Leu Ala Ala Asp Asn
165 170 175
Ile Ile Asp Ala His Leu Val Asn Val Asp Gly Lys Val Leu Asp Arg
180 185 190
Lys Ser Met Gly Glu Asp Leu Phe Trp Ala Ile Arg Gly Gly Gly Gly
195 200 205
Glu Asn Phe Gly Ile Ile Ala Ala Trp Lys Ile Lys Leu Val Ala Val
210 215 220
Pro Ser Lys Ser Thr Ile Phe Ser Val Lys Lys Asn Met Glu Ile His
225 230 235 240
Gly Leu Val Lys Leu Phe Asn Lys Trp Gln Asn Ile Ala Tyr Lys Tyr
245 250 255
Asp Lys Asp Leu Val Leu Met Thr His Phe Ile Thr Lys Asn Ile Thr
260 265 270
Asp Asn His Gly Lys Asn Lys Thr Thr Val His Gly Tyr Phe Ser Ser
275 280 285
Ile Phe His Gly Gly Val Asp Ser Leu Val Asp Leu Met Asn Lys Ser
290 295 300
Phe Pro Glu Leu Gly Ile Lys Lys Thr Asp Cys Lys Glu Phe Ser Trp
305 310 315 320
Ile Asp Thr Thr Ile Phe Tyr Ser Gly Val Val Asn Phe Asn Thr Ala
325 330 335
Asn Phe Lys Lys Glu Ile Leu Leu Asp Arg Ser Ala Gly Lys Lys Thr
340 345 350
Ala Phe Ser Ile Lys Leu Asp Tyr Val Lys Lys Pro Ile Pro Glu Thr
355 360 365
Ala Met Val Lys Ile Leu Glu Lys Leu Tyr Glu Glu Asp Val Gly Ala
370 375 380
Gly Met Tyr Val Leu Tyr Pro Tyr Gly Gly Ile Met Glu Glu Ile Ser
385 390 395 400
Glu Ser Ala Ile Pro Phe Pro His Arg Ala Gly Ile Met Tyr Glu Leu
405 410 415
Trp Tyr Thr Ala Ser Trp Glu Lys Gln Glu Asp Asn Glu Lys His Ile
420 425 430
Asn Trp Val Arg Ser Val Tyr Asn Phe Thr Thr Pro Tyr Val Ser Gln
435 440 445
Asn Pro Arg Leu Ala Tyr Leu Asn Tyr Arg Asp Leu Asp Leu Gly Lys
450 455 460
Thr Asn His Ala Ser Pro Asn Asn Tyr Thr Gln Ala Arg Ile Trp Gly
465 470 475 480
Glu Lys Tyr Phe Gly Lys Asn Phe Asn Arg Leu Val Lys Val Lys Thr
485 490 495
Lys Val Asp Pro Asn Asn Phe Phe Arg Asn Glu Gln Ser Ile Pro Pro
500 505 510
Leu Pro Pro His His His Gly Ser
515 520
<210> 16
<211> 519
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(519)
<223> 截短的大麻二酚酸合成酶(CBDAS)
<400> 16
Met Asn Pro Arg Glu Asn Phe Leu Lys Cys Phe Ser Gln Tyr Ile Pro
1 5 10 15
Asn Asn Ala Thr Asn Leu Lys Leu Val Tyr Thr Gln Asn Asn Pro Leu
20 25 30
Tyr Met Ser Val Leu Asn Ser Thr Ile His Asn Leu Arg Phe Thr Ser
35 40 45
Asp Thr Thr Pro Lys Pro Leu Val Ile Val Thr Pro Ser His Val Ser
50 55 60
His Ile Gln Gly Thr Ile Leu Cys Ser Lys Lys Val Gly Leu Gln Ile
65 70 75 80
Arg Thr Arg Ser Gly Gly His Asp Ser Glu Gly Met Ser Tyr Ile Ser
85 90 95
Gln Val Pro Phe Val Ile Val Asp Leu Arg Asn Met Arg Ser Ile Lys
100 105 110
Ile Asp Val His Ser Gln Thr Ala Trp Val Glu Ala Gly Ala Thr Leu
115 120 125
Gly Glu Val Tyr Tyr Trp Val Asn Glu Lys Asn Glu Asn Leu Ser Leu
130 135 140
Ala Ala Gly Tyr Cys Pro Thr Val Cys Ala Gly Gly His Phe Gly Gly
145 150 155 160
Gly Gly Tyr Gly Pro Leu Met Arg Asn Tyr Gly Leu Ala Ala Asp Asn
165 170 175
Ile Ile Asp Ala His Leu Val Asn Val His Gly Lys Val Leu Asp Arg
180 185 190
Lys Ser Met Gly Glu Asp Leu Phe Trp Ala Leu Arg Gly Gly Gly Ala
195 200 205
Glu Ser Phe Gly Ile Ile Val Ala Trp Lys Ile Arg Leu Val Ala Val
210 215 220
Pro Lys Ser Thr Met Phe Ser Val Lys Lys Ile Met Glu Ile His Glu
225 230 235 240
Leu Val Lys Leu Val Asn Lys Trp Gln Asn Ile Ala Tyr Lys Tyr Asp
245 250 255
Lys Asp Leu Leu Leu Met Thr His Phe Ile Thr Arg Asn Ile Thr Asp
260 265 270
Asn Gln Gly Lys Asn Lys Thr Ala Ile His Thr Tyr Phe Ser Ser Val
275 280 285
Phe Leu Gly Gly Val Asp Ser Leu Val Asp Leu Met Asn Lys Ser Phe
290 295 300
Pro Glu Leu Gly Ile Lys Lys Thr Asp Cys Arg Gln Leu Ser Trp Ile
305 310 315 320
Asp Thr Ile Ile Phe Tyr Ser Gly Val Val Asn Tyr Asp Thr Asp Asn
325 330 335
Phe Asn Lys Glu Ile Leu Leu Asp Arg Ser Ala Gly Gln Asn Gly Ala
340 345 350
Phe Lys Ile Lys Leu Asp Tyr Val Lys Lys Pro Ile Pro Glu Ser Val
355 360 365
Phe Val Gln Ile Leu Glu Lys Leu Tyr Glu Glu Asp Ile Gly Ala Gly
370 375 380
Met Tyr Ala Leu Tyr Pro Tyr Gly Gly Ile Met Asp Glu Ile Ser Glu
385 390 395 400
Ser Ala Ile Pro Phe Pro His Arg Ala Gly Ile Leu Tyr Glu Leu Trp
405 410 415
Tyr Ile Cys Ser Trp Glu Lys Gln Glu Asp Asn Glu Lys His Leu Asn
420 425 430
Trp Ile Arg Asn Ile Tyr Asn Phe Met Thr Pro Tyr Val Ser Lys Asn
435 440 445
Pro Arg Leu Ala Tyr Leu Asn Tyr Arg Asp Leu Asp Ile Gly Ile Asn
450 455 460
Asp Pro Lys Asn Pro Asn Asn Tyr Thr Gln Ala Arg Ile Trp Gly Glu
465 470 475 480
Lys Tyr Phe Gly Lys Asn Phe Asp Arg Leu Val Lys Val Lys Thr Leu
485 490 495
Val Asp Pro Asn Asn Phe Phe Arg Asn Glu Gln Ser Ile Pro Pro Leu
500 505 510
Pro Arg His Arg His Gly Ser
515
<210> 17
<211> 502
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(502)
<223> 截短的3-羟基-3-甲基-戊二酰辅酶A还原酶(HMGR)
<400> 17
Met Val Leu Thr Asn Lys Thr Val Ile Ser Gly Ser Lys Val Lys Ser
1 5 10 15
Leu Ser Ser Ala Gln Ser Ser Ser Ser Gly Pro Ser Ser Ser Ser Glu
20 25 30
Glu Asp Asp Ser Arg Asp Ile Glu Ser Leu Asp Lys Lys Ile Arg Pro
35 40 45
Leu Glu Glu Leu Glu Ala Leu Leu Ser Ser Gly Asn Thr Lys Gln Leu
50 55 60
Lys Asn Lys Glu Val Ala Ala Leu Val Ile His Gly Lys Leu Pro Leu
65 70 75 80
Tyr Ala Leu Glu Lys Lys Leu Gly Asp Thr Thr Arg Ala Val Ala Val
85 90 95
Arg Arg Lys Ala Leu Ser Ile Leu Ala Glu Ala Pro Val Leu Ala Ser
100 105 110
Asp Arg Leu Pro Tyr Lys Asn Tyr Asp Tyr Asp Arg Val Phe Gly Ala
115 120 125
Cys Cys Glu Asn Val Ile Gly Tyr Met Pro Leu Pro Val Gly Val Ile
130 135 140
Gly Pro Leu Val Ile Asp Gly Thr Ser Tyr His Ile Pro Met Ala Thr
145 150 155 160
Thr Glu Gly Cys Leu Val Ala Ser Ala Met Arg Gly Cys Lys Ala Ile
165 170 175
Asn Ala Gly Gly Gly Ala Thr Thr Val Leu Thr Lys Asp Gly Met Thr
180 185 190
Arg Gly Pro Val Val Arg Phe Pro Thr Leu Lys Arg Ser Gly Ala Cys
195 200 205
Lys Ile Trp Leu Asp Ser Glu Glu Gly Gln Asn Ala Ile Lys Lys Ala
210 215 220
Phe Asn Ser Thr Ser Arg Phe Ala Arg Leu Gln His Ile Gln Thr Cys
225 230 235 240
Leu Ala Gly Asp Leu Leu Phe Met Arg Phe Arg Thr Thr Thr Gly Asp
245 250 255
Ala Met Gly Met Asn Met Ile Ser Lys Gly Val Glu Tyr Ser Leu Lys
260 265 270
Gln Met Val Glu Glu Tyr Gly Trp Glu Asp Met Glu Val Val Ser Val
275 280 285
Ser Gly Asn Tyr Cys Thr Asp Lys Lys Pro Ala Ala Ile Asn Trp Ile
290 295 300
Glu Gly Arg Gly Lys Ser Val Val Ala Glu Ala Thr Ile Pro Gly Asp
305 310 315 320
Val Val Arg Lys Val Leu Lys Ser Asp Val Ser Ala Leu Val Glu Leu
325 330 335
Asn Ile Ala Lys Asn Leu Val Gly Ser Ala Met Ala Gly Ser Val Gly
340 345 350
Gly Phe Asn Ala His Ala Ala Asn Leu Val Thr Ala Val Phe Leu Ala
355 360 365
Leu Gly Gln Asp Pro Ala Gln Asn Val Glu Ser Ser Asn Cys Ile Thr
370 375 380
Leu Met Lys Glu Val Asp Gly Asp Leu Arg Ile Ser Val Ser Met Pro
385 390 395 400
Ser Ile Glu Val Gly Thr Ile Gly Gly Gly Thr Val Leu Glu Pro Gln
405 410 415
Gly Ala Met Leu Asp Leu Leu Gly Val Arg Gly Pro His Ala Thr Ala
420 425 430
Pro Gly Thr Asn Ala Arg Gln Leu Ala Arg Ile Val Ala Cys Ala Val
435 440 445
Leu Ala Gly Glu Leu Ser Leu Cys Ala Ala Leu Ala Ala Gly His Leu
450 455 460
Val Gln Ser His Met Thr His Asn Arg Lys Pro Ala Glu Pro Thr Lys
465 470 475 480
Pro Asn Asn Leu Asp Ala Thr Asp Ile Asn Arg Leu Lys Asp Gly Ser
485 490 495
Val Thr Cys Ile Lys Ser
500
<210> 18
<211> 284
<212> PRT
<213> Ralstonia sp.
<400> 18
Met Ser Ile Arg Thr Val Gly Ile Val Gly Ala Gly Thr Met Gly Asn
1 5 10 15
Gly Ile Ala Gln Ala Cys Ala Val Val Gly Leu Asn Val Val Met Val
20 25 30
Asp Ile Ser Asp Ala Ala Val Gln Lys Gly Val Ala Thr Val Ala Ser
35 40 45
Ser Leu Asp Arg Leu Ile Lys Lys Glu Lys Leu Thr Glu Ala Asp Lys
50 55 60
Ala Ser Ala Leu Ala Arg Ile Lys Gly Ser Thr Ser Tyr Asp Asp Leu
65 70 75 80
Lys Ala Thr Asp Ile Val Ile Glu Ala Ala Thr Glu Asn Tyr Asp Leu
85 90 95
Lys Val Lys Ile Leu Lys Gln Ile Asp Gly Ile Val Gly Glu Asn Val
100 105 110
Ile Ile Ala Ser Asn Thr Ser Ser Ile Ser Ile Thr Lys Leu Ala Ala
115 120 125
Val Thr Ser Arg Ala Asp Arg Phe Ile Gly Met His Phe Phe Asn Pro
130 135 140
Val Pro Val Met Ala Leu Val Glu Leu Ile Arg Gly Leu Gln Thr Ser
145 150 155 160
Asp Thr Thr His Ala Ala Val Glu Ala Leu Ser Lys Gln Leu Gly Lys
165 170 175
Tyr Pro Ile Thr Val Lys Asn Ser Pro Gly Phe Val Val Asn Arg Ile
180 185 190
Leu Cys Pro Met Ile Asn Glu Ala Phe Cys Val Leu Gly Glu Gly Leu
195 200 205
Ala Ser Pro Glu Glu Ile Asp Glu Gly Met Lys Leu Gly Cys Asn His
210 215 220
Pro Ile Gly Pro Leu Ala Leu Ala Asp Met Ile Gly Leu Asp Thr Met
225 230 235 240
Leu Ala Val Met Glu Val Leu Tyr Thr Glu Phe Ala Asp Pro Lys Tyr
245 250 255
Arg Pro Ala Met Leu Met Arg Glu Met Val Ala Ala Gly Tyr Leu Gly
260 265 270
Arg Lys Thr Gly Arg Gly Val Tyr Val Tyr Ser Lys
275 280
<210> 19
<211> 261
<212> PRT
<213> Clostridium sp.
<400> 19
Met Glu Leu Asn Asn Val Ile Leu Glu Lys Glu Gly Lys Val Ala Val
1 5 10 15
Val Thr Ile Asn Arg Pro Lys Ala Leu Asn Ala Leu Asn Ser Asp Thr
20 25 30
Leu Lys Glu Met Asp Tyr Val Ile Gly Glu Ile Glu Asn Asp Ser Glu
35 40 45
Val Leu Ala Val Ile Leu Thr Gly Ala Gly Glu Lys Ser Phe Val Ala
50 55 60
Gly Ala Asp Ile Ser Glu Met Lys Glu Met Asn Thr Ile Glu Gly Arg
65 70 75 80
Lys Phe Gly Ile Leu Gly Asn Lys Val Phe Arg Arg Leu Glu Leu Leu
85 90 95
Glu Lys Pro Val Ile Ala Ala Val Asn Gly Phe Ala Leu Gly Gly Gly
100 105 110
Cys Glu Ile Ala Met Ser Cys Asp Ile Arg Ile Ala Ser Ser Asn Ala
115 120 125
Arg Phe Gly Gln Pro Glu Val Gly Leu Gly Ile Thr Pro Gly Phe Gly
130 135 140
Gly Thr Gln Arg Leu Ser Arg Leu Val Gly Met Gly Met Ala Lys Gln
145 150 155 160
Leu Ile Phe Thr Ala Gln Asn Ile Lys Ala Asp Glu Ala Leu Arg Ile
165 170 175
Gly Leu Val Asn Lys Val Val Glu Pro Ser Glu Leu Met Asn Thr Ala
180 185 190
Lys Glu Ile Ala Asn Lys Ile Val Ser Asn Ala Pro Val Ala Val Lys
195 200 205
Leu Ser Lys Gln Ala Ile Asn Arg Gly Met Gln Cys Asp Ile Asp Thr
210 215 220
Ala Leu Ala Phe Glu Ser Glu Ala Phe Gly Glu Cys Phe Ser Thr Glu
225 230 235 240
Asp Gln Lys Asp Ala Met Thr Ala Phe Ile Glu Lys Arg Lys Ile Glu
245 250 255
Gly Phe Lys Asn Arg
260
<210> 20
<211> 397
<212> PRT
<213> Treponema sp.
<400> 20
Met Ile Val Lys Pro Met Val Arg Asn Asn Ile Cys Leu Asn Ala His
1 5 10 15
Pro Gln Gly Cys Lys Lys Gly Val Glu Asp Gln Ile Glu Tyr Thr Lys
20 25 30
Lys Arg Ile Thr Ala Glu Val Lys Ala Gly Ala Lys Ala Pro Lys Asn
35 40 45
Val Leu Val Leu Gly Cys Ser Asn Gly Tyr Gly Leu Ala Ser Arg Ile
50 55 60
Thr Ala Ala Phe Gly Tyr Gly Ala Ala Thr Ile Gly Val Ser Phe Glu
65 70 75 80
Lys Ala Gly Ser Glu Thr Lys Tyr Gly Thr Pro Gly Trp Tyr Asn Asn
85 90 95
Leu Ala Phe Asp Glu Ala Ala Lys Arg Glu Gly Leu Tyr Ser Val Thr
100 105 110
Ile Asp Gly Asp Ala Phe Ser Asp Glu Ile Lys Ala Gln Val Ile Glu
115 120 125
Glu Ala Lys Lys Lys Gly Ile Lys Phe Asp Leu Ile Val Tyr Ser Leu
130 135 140
Ala Ser Pro Val Arg Thr Asp Pro Asp Thr Gly Ile Met His Lys Ser
145 150 155 160
Val Leu Lys Pro Phe Gly Lys Thr Phe Thr Gly Lys Thr Val Asp Pro
165 170 175
Phe Thr Gly Glu Leu Lys Glu Ile Ser Ala Glu Pro Ala Asn Asp Glu
180 185 190
Glu Ala Ala Ala Thr Val Lys Val Met Gly Gly Glu Asp Trp Glu Arg
195 200 205
Trp Ile Lys Gln Leu Ser Lys Glu Gly Leu Leu Glu Glu Gly Cys Ile
210 215 220
Thr Leu Ala Tyr Ser Tyr Ile Gly Pro Glu Ala Thr Gln Ala Leu Tyr
225 230 235 240
Arg Lys Gly Thr Ile Gly Lys Ala Lys Glu His Leu Glu Ala Thr Ala
245 250 255
His Arg Leu Asn Lys Glu Asn Pro Ser Ile Arg Ala Phe Val Ser Val
260 265 270
Asn Lys Gly Leu Val Thr Arg Ala Ser Ala Val Ile Pro Val Ile Pro
275 280 285
Leu Tyr Leu Ala Ser Leu Phe Lys Val Met Lys Glu Lys Gly Asn His
290 295 300
Glu Gly Cys Ile Glu Gln Ile Thr Arg Leu Tyr Ala Glu Arg Leu Tyr
305 310 315 320
Arg Lys Asp Gly Thr Ile Pro Val Asp Glu Glu Asn Arg Ile Arg Ile
325 330 335
Asp Asp Trp Glu Leu Glu Glu Asp Val Gln Lys Ala Val Ser Ala Leu
340 345 350
Met Glu Lys Val Thr Gly Glu Asn Ala Glu Ser Leu Thr Asp Leu Ala
355 360 365
Gly Tyr Arg His Asp Phe Leu Ala Ser Asn Gly Phe Asp Val Glu Gly
370 375 380
Ile Asn Tyr Glu Ala Glu Val Glu Arg Phe Asp Arg Ile
385 390 395
<210> 21
<211> 394
<212> PRT
<213> Ralstonia sp.
<400> 21
Met Thr Arg Glu Val Val Val Val Ser Gly Val Arg Thr Ala Ile Gly
1 5 10 15
Thr Phe Gly Gly Ser Leu Lys Asp Val Ala Pro Ala Glu Leu Gly Ala
20 25 30
Leu Val Val Arg Glu Ala Leu Ala Arg Ala Gln Val Ser Gly Asp Asp
35 40 45
Val Gly His Val Val Phe Gly Asn Val Ile Gln Thr Glu Pro Arg Asp
50 55 60
Met Tyr Leu Gly Arg Val Ala Ala Val Asn Gly Gly Val Thr Ile Asn
65 70 75 80
Ala Pro Ala Leu Thr Val Asn Arg Leu Cys Gly Ser Gly Leu Gln Ala
85 90 95
Ile Val Ser Ala Ala Gln Thr Ile Leu Leu Gly Asp Thr Asp Val Ala
100 105 110
Ile Gly Gly Gly Ala Glu Ser Met Ser Arg Ala Pro Tyr Leu Ala Pro
115 120 125
Ala Ala Arg Trp Gly Ala Arg Met Gly Asp Ala Gly Leu Val Asp Met
130 135 140
Met Leu Gly Ala Leu His Asp Pro Phe His Arg Ile His Met Gly Val
145 150 155 160
Thr Ala Glu Asn Val Ala Lys Glu Tyr Asp Ile Ser Arg Ala Gln Gln
165 170 175
Asp Glu Ala Ala Leu Glu Ser His Arg Arg Ala Ser Ala Ala Ile Lys
180 185 190
Ala Gly Tyr Phe Lys Asp Gln Ile Val Pro Val Val Ser Lys Gly Arg
195 200 205
Lys Gly Asp Val Thr Phe Asp Thr Asp Glu His Val Arg His Asp Ala
210 215 220
Thr Ile Asp Asp Met Thr Lys Leu Arg Pro Val Phe Val Lys Glu Asn
225 230 235 240
Gly Thr Val Thr Ala Gly Asn Ala Ser Gly Leu Asn Asp Ala Ala Ala
245 250 255
Ala Val Val Met Met Glu Arg Ala Glu Ala Glu Arg Arg Gly Leu Lys
260 265 270
Pro Leu Ala Arg Leu Val Ser Tyr Gly His Ala Gly Val Asp Pro Lys
275 280 285
Ala Met Gly Ile Gly Pro Val Pro Ala Thr Lys Ile Ala Leu Glu Arg
290 295 300
Ala Gly Leu Gln Val Ser Asp Leu Asp Val Ile Glu Ala Asn Glu Ala
305 310 315 320
Phe Ala Ala Gln Ala Cys Ala Val Thr Lys Ala Leu Gly Leu Asp Pro
325 330 335
Ala Lys Val Asn Pro Asn Gly Ser Gly Ile Ser Leu Gly His Pro Ile
340 345 350
Gly Ala Thr Gly Ala Leu Ile Thr Val Lys Ala Leu His Glu Leu Asn
355 360 365
Arg Val Gln Gly Arg Tyr Ala Leu Val Thr Met Cys Ile Gly Gly Gly
370 375 380
Gln Gly Ile Ala Ala Ile Phe Glu Arg Ile
385 390
<210> 22
<211> 813
<212> PRT
<213> Enterococcus sp.
<400> 22
Met Lys Glu Val Val Met Ile Asp Ala Ala Arg Thr Pro Ile Gly Lys
1 5 10 15
Tyr Arg Gly Ser Leu Ser Pro Phe Thr Ala Val Glu Leu Gly Thr Leu
20 25 30
Val Thr Lys Gly Leu Leu Asp Lys Thr Lys Leu Lys Lys Asp Lys Ile
35 40 45
Asp Gln Val Ile Phe Gly Asn Val Leu Gln Ala Gly Asn Gly Gln Asn
50 55 60
Val Ala Arg Gln Ile Ala Leu Asn Ser Gly Leu Pro Val Asp Val Pro
65 70 75 80
Ala Met Thr Ile Asn Glu Val Cys Gly Ser Gly Met Lys Ala Val Ile
85 90 95
Leu Ala Arg Gln Leu Ile Gln Leu Gly Glu Ala Glu Leu Val Ile Ala
100 105 110
Gly Gly Thr Glu Ser Met Ser Gln Ala Pro Met Leu Lys Pro Tyr Gln
115 120 125
Ser Glu Thr Asn Glu Tyr Gly Glu Pro Ile Ser Ser Met Val Asn Asp
130 135 140
Gly Leu Thr Asp Ala Phe Ser Asn Ala His Met Gly Leu Thr Ala Glu
145 150 155 160
Lys Val Ala Thr Gln Phe Ser Val Ser Arg Glu Glu Gln Asp Arg Tyr
165 170 175
Ala Leu Ser Ser Gln Leu Lys Ala Ala His Ala Val Glu Ala Gly Val
180 185 190
Phe Ser Glu Glu Ile Ile Pro Val Lys Ile Ser Asp Glu Asp Val Leu
195 200 205
Ser Glu Asp Glu Ala Val Arg Gly Asn Ser Thr Leu Glu Lys Leu Gly
210 215 220
Thr Leu Arg Thr Val Phe Ser Glu Glu Gly Thr Val Thr Ala Gly Asn
225 230 235 240
Ala Ser Pro Leu Asn Asp Gly Ala Ser Val Val Ile Leu Ala Ser Lys
245 250 255
Glu Tyr Ala Glu Asn Asn Asn Leu Pro Tyr Leu Ala Thr Ile Lys Glu
260 265 270
Val Ala Glu Val Gly Ile Asp Pro Ser Ile Met Gly Ile Ala Pro Ile
275 280 285
Lys Ala Ile Gln Lys Leu Thr Asp Arg Ser Gly Met Asn Leu Ser Thr
290 295 300
Ile Asp Leu Phe Glu Ile Asn Glu Ala Phe Ala Ala Ser Ser Ile Val
305 310 315 320
Val Ser Gln Glu Leu Gln Leu Asp Glu Glu Lys Val Asn Ile Tyr Gly
325 330 335
Gly Ala Ile Ala Leu Gly His Pro Ile Gly Ala Ser Gly Ala Arg Ile
340 345 350
Leu Thr Thr Leu Ala Tyr Gly Leu Leu Arg Glu Gln Lys Arg Tyr Gly
355 360 365
Ile Ala Ser Leu Cys Ile Gly Gly Gly Leu Gly Leu Ala Val Leu Leu
370 375 380
Glu Ala Asn Met Glu Gln Thr His Lys Asp Val Gln Lys Lys Lys Phe
385 390 395 400
Tyr Gln Leu Thr Pro Ser Glu Arg Arg Ser Gln Leu Ile Glu Lys Asn
405 410 415
Val Leu Thr Gln Glu Thr Ala Leu Ile Phe Gln Glu Gln Thr Leu Ser
420 425 430
Glu Glu Leu Ser Asp His Met Ile Glu Asn Gln Val Ser Glu Val Glu
435 440 445
Ile Pro Met Gly Ile Ala Gln Asn Phe Gln Ile Asn Gly Lys Lys Lys
450 455 460
Trp Ile Pro Met Ala Thr Glu Glu Pro Ser Val Ile Ala Ala Ala Ser
465 470 475 480
Asn Gly Ala Lys Ile Cys Gly Asn Ile Cys Ala Glu Thr Pro Gln Arg
485 490 495
Leu Met Arg Gly Gln Ile Val Leu Ser Gly Lys Ser Glu Tyr Gln Ala
500 505 510
Val Ile Asn Ala Val Asn His Arg Lys Glu Glu Leu Ile Leu Cys Ala
515 520 525
Asn Glu Ser Tyr Pro Ser Ile Val Lys Arg Gly Gly Gly Val Gln Asp
530 535 540
Ile Ser Thr Arg Glu Phe Met Gly Ser Phe His Ala Tyr Leu Ser Ile
545 550 555 560
Asp Phe Leu Val Asp Val Lys Asp Ala Met Gly Ala Asn Met Ile Asn
565 570 575
Ser Ile Leu Glu Ser Val Ala Asn Lys Leu Arg Glu Trp Phe Pro Glu
580 585 590
Glu Glu Ile Leu Phe Ser Ile Leu Ser Asn Phe Ala Thr Glu Ser Leu
595 600 605
Ala Ser Ala Cys Cys Glu Ile Pro Phe Glu Arg Leu Gly Arg Asn Lys
610 615 620
Glu Ile Gly Glu Gln Ile Ala Lys Lys Ile Gln Gln Ala Gly Glu Tyr
625 630 635 640
Ala Lys Leu Asp Pro Tyr Arg Ala Ala Thr His Asn Lys Gly Ile Met
645 650 655
Asn Gly Ile Glu Ala Val Val Ala Ala Thr Gly Asn Asp Thr Arg Ala
660 665 670
Val Ser Ala Ser Ile His Ala Tyr Ala Ala Arg Asn Gly Leu Tyr Gln
675 680 685
Gly Leu Thr Asp Trp Gln Ile Lys Gly Asp Lys Leu Val Gly Lys Leu
690 695 700
Thr Val Pro Leu Ala Val Ala Thr Val Gly Gly Ala Ser Asn Ile Leu
705 710 715 720
Pro Lys Ala Lys Ala Ser Leu Ala Met Leu Asp Ile Asp Ser Ala Lys
725 730 735
Glu Leu Ala Gln Val Ile Ala Ala Val Gly Leu Ala Gln Asn Leu Ala
740 745 750
Ala Leu Arg Ala Leu Val Thr Glu Gly Ile Gln Lys Gly His Met Gly
755 760 765
Leu Gln Ala Arg Ser Leu Ala Ile Ser Ile Gly Ala Ile Gly Glu Glu
770 775 780
Ile Glu Gln Val Ala Lys Lys Leu Arg Glu Ala Glu Lys Met Asn Gln
785 790 795 800
Gln Thr Ala Ile Gln Ile Leu Glu Lys Ile Arg Glu Lys
805 810
<210> 23
<211> 389
<212> PRT
<213> Lactobacillus plantarum
<400> 23
Met Lys Ile Gly Ile Asp Lys Leu His Phe Ala Thr Ser His Leu Tyr
1 5 10 15
Val Asp Met Ala Glu Leu Ala Thr Ala Arg Gln Ala Glu Pro Asp Lys
20 25 30
Tyr Leu Ile Gly Ile Gly Gln Ser Lys Met Ala Val Ile Pro Pro Ser
35 40 45
Gln Asp Val Val Thr Leu Ala Ala Asn Ala Ala Ala Pro Met Leu Thr
50 55 60
Ala Thr Asp Ile Ala Ala Ile Asp Leu Leu Val Val Gly Thr Glu Ser
65 70 75 80
Gly Ile Asp Asn Ser Lys Ala Ser Ala Ile Tyr Val Ala Lys Leu Leu
85 90 95
Gly Leu Ser Gln Arg Val Arg Thr Ile Glu Met Lys Glu Ala Cys Tyr
100 105 110
Ala Ala Thr Ala Gly Val Gln Leu Ala Gln Asp His Val Arg Val His
115 120 125
Pro Asp Lys Lys Ala Leu Val Ile Gly Ser Asp Val Ala Arg Tyr Gly
130 135 140
Leu Asn Thr Pro Gly Glu Pro Thr Gln Gly Gly Gly Ala Val Ala Met
145 150 155 160
Leu Ile Ser Ala Asp Pro Lys Val Leu Val Leu Gly Thr Glu Ser Ser
165 170 175
Leu Leu Ser Glu Asp Val Met Asp Phe Trp Arg Pro Leu Tyr His Thr
180 185 190
Glu Ala Leu Val Asp Gly Lys Tyr Ser Ser Asn Ile Tyr Ile Asp Tyr
195 200 205
Phe Gln Asp Val Phe Lys Asn Tyr Leu Gln Thr Thr Gln Thr Ser Pro
210 215 220
Asp Thr Leu Thr Ala Leu Val Phe His Leu Pro Tyr Thr Lys Met Gly
225 230 235 240
Leu Lys Ala Leu Arg Ser Val Leu Pro Leu Val Asp Ala Glu Lys Gln
245 250 255
Ala Gln Trp Leu Ala His Phe Glu His Ala Arg Gln Leu Asn Arg Gln
260 265 270
Val Gly Asn Leu Tyr Thr Gly Ser Leu Tyr Leu Ser Leu Leu Ser Gln
275 280 285
Leu Leu Thr Asp Pro Gln Leu Gln Pro Gly Asn Arg Leu Gly Leu Phe
290 295 300
Ser Tyr Gly Ser Gly Ala Glu Gly Glu Phe Tyr Thr Gly Val Ile Gln
305 310 315 320
Pro Asp Tyr Gln Thr Gly Leu Asp His Gly Leu Pro Gln Arg Leu Ala
325 330 335
Arg Arg Arg Arg Val Ser Val Ala Glu Tyr Glu Ala Leu Phe Ser His
340 345 350
Gln Leu Gln Trp Arg Ala Asp Asp Gln Ser Val Ser Tyr Ala Asp Asp
355 360 365
Pro His Arg Phe Val Leu Thr Gly Gln Lys Asn Glu Gln Arg Gln Tyr
370 375 380
Leu Asp Gln Gln Val
385
<210> 24
<211> 491
<212> PRT
<213> Saccharomyces cerevisiae
<400> 24
Met Lys Leu Ser Thr Lys Leu Cys Trp Cys Gly Ile Lys Gly Arg Leu
1 5 10 15
Arg Pro Gln Lys Gln Gln Gln Leu His Asn Thr Asn Leu Gln Met Thr
20 25 30
Glu Leu Lys Lys Gln Lys Thr Ala Glu Gln Lys Thr Arg Pro Gln Asn
35 40 45
Val Gly Ile Lys Gly Ile Gln Ile Tyr Ile Pro Thr Gln Cys Val Asn
50 55 60
Gln Ser Glu Leu Glu Lys Phe Asp Gly Val Ser Gln Gly Lys Tyr Thr
65 70 75 80
Ile Gly Leu Gly Gln Thr Asn Met Ser Phe Val Asn Asp Arg Glu Asp
85 90 95
Ile Tyr Ser Met Ser Leu Thr Val Leu Ser Lys Leu Ile Lys Ser Tyr
100 105 110
Asn Ile Asp Thr Asn Lys Ile Gly Arg Leu Glu Val Gly Thr Glu Thr
115 120 125
Leu Ile Asp Lys Ser Lys Ser Val Lys Ser Val Leu Met Gln Leu Phe
130 135 140
Gly Glu Asn Thr Asp Val Glu Gly Ile Asp Thr Leu Asn Ala Cys Tyr
145 150 155 160
Gly Gly Thr Asn Ala Leu Phe Asn Ser Leu Asn Trp Ile Glu Ser Asn
165 170 175
Ala Trp Asp Gly Arg Asp Ala Ile Val Val Cys Gly Asp Ile Ala Ile
180 185 190
Tyr Asp Lys Gly Ala Ala Arg Pro Thr Gly Gly Ala Gly Thr Val Ala
195 200 205
Met Trp Ile Gly Pro Asp Ala Pro Ile Val Phe Asp Ser Val Arg Ala
210 215 220
Ser Tyr Met Glu His Ala Tyr Asp Phe Tyr Lys Pro Asp Phe Thr Ser
225 230 235 240
Glu Tyr Pro Tyr Val Asp Gly His Phe Ser Leu Thr Cys Tyr Val Lys
245 250 255
Ala Leu Asp Gln Val Tyr Lys Ser Tyr Ser Lys Lys Ala Ile Ser Lys
260 265 270
Gly Leu Val Ser Asp Pro Ala Gly Ser Asp Ala Leu Asn Val Leu Lys
275 280 285
Tyr Phe Asp Tyr Asn Val Phe His Val Pro Thr Cys Lys Leu Val Thr
290 295 300
Lys Ser Tyr Gly Arg Leu Leu Tyr Asn Asp Phe Arg Ala Asn Pro Gln
305 310 315 320
Leu Phe Pro Glu Val Asp Ala Glu Leu Ala Thr Arg Asp Tyr Asp Glu
325 330 335
Ser Leu Thr Asp Lys Asn Ile Glu Lys Thr Phe Val Asn Val Ala Lys
340 345 350
Pro Phe His Lys Glu Arg Val Ala Gln Ser Leu Ile Val Pro Thr Asn
355 360 365
Thr Gly Asn Met Tyr Thr Ala Ser Val Tyr Ala Ala Phe Ala Ser Leu
370 375 380
Leu Asn Tyr Val Gly Ser Asp Asp Leu Gln Gly Lys Arg Val Gly Leu
385 390 395 400
Phe Ser Tyr Gly Ser Gly Leu Ala Ala Ser Leu Tyr Ser Cys Lys Ile
405 410 415
Val Gly Asp Val Gln His Ile Ile Lys Glu Leu Asp Ile Thr Asn Lys
420 425 430
Leu Ala Lys Arg Ile Thr Glu Thr Pro Lys Asp Tyr Glu Ala Ala Ile
435 440 445
Glu Leu Arg Glu Asn Ala His Leu Lys Lys Asn Phe Lys Pro Gln Gly
450 455 460
Ser Ile Glu His Leu Gln Ser Gly Val Tyr Tyr Leu Thr Asn Ile Asp
465 470 475 480
Asp Lys Phe Arg Arg Ser Tyr Asp Val Lys Lys
485 490
<210> 25
<211> 398
<212> PRT
<213> Saccharomyces cerevisiae
<400> 25
Met Ser Gln Asn Val Tyr Ile Val Ser Thr Ala Arg Thr Pro Ile Gly
1 5 10 15
Ser Phe Gln Gly Ser Leu Ser Ser Lys Thr Ala Val Glu Leu Gly Ala
20 25 30
Val Ala Leu Lys Gly Ala Leu Ala Lys Val Pro Glu Leu Asp Ala Ser
35 40 45
Lys Asp Phe Asp Glu Ile Ile Phe Gly Asn Val Leu Ser Ala Asn Leu
50 55 60
Gly Gln Ala Pro Ala Arg Gln Val Ala Leu Ala Ala Gly Leu Ser Asn
65 70 75 80
His Ile Val Ala Ser Thr Val Asn Lys Val Cys Ala Ser Ala Met Lys
85 90 95
Ala Ile Ile Leu Gly Ala Gln Ser Ile Lys Cys Gly Asn Ala Asp Val
100 105 110
Val Val Ala Gly Gly Cys Glu Ser Met Thr Asn Ala Pro Tyr Tyr Met
115 120 125
Pro Ala Ala Arg Ala Gly Ala Lys Phe Gly Gln Thr Val Leu Val Asp
130 135 140
Gly Val Glu Arg Asp Gly Leu Asn Asp Ala Tyr Asp Gly Leu Ala Met
145 150 155 160
Gly Val His Ala Glu Lys Cys Ala Arg Asp Trp Asp Ile Thr Arg Glu
165 170 175
Gln Gln Asp Asn Phe Ala Ile Glu Ser Tyr Gln Lys Ser Gln Lys Ser
180 185 190
Gln Lys Glu Gly Lys Phe Asp Asn Glu Ile Val Pro Val Thr Ile Lys
195 200 205
Gly Phe Arg Gly Lys Pro Asp Thr Gln Val Thr Lys Asp Glu Glu Pro
210 215 220
Ala Arg Leu His Val Glu Lys Leu Arg Ser Ala Arg Thr Val Phe Gln
225 230 235 240
Lys Glu Asn Gly Thr Val Thr Ala Ala Asn Ala Ser Pro Ile Asn Asp
245 250 255
Gly Ala Ala Ala Val Ile Leu Val Ser Glu Lys Val Leu Lys Glu Lys
260 265 270
Asn Leu Lys Pro Leu Ala Ile Ile Lys Gly Trp Gly Glu Ala Ala His
275 280 285
Gln Pro Ala Asp Phe Thr Trp Ala Pro Ser Leu Ala Val Pro Lys Ala
290 295 300
Leu Lys His Ala Gly Ile Glu Asp Ile Asn Ser Val Asp Tyr Phe Glu
305 310 315 320
Phe Asn Glu Ala Phe Ser Val Val Gly Leu Val Asn Thr Lys Ile Leu
325 330 335
Lys Leu Asp Pro Ser Lys Val Asn Val Tyr Gly Gly Ala Val Ala Leu
340 345 350
Gly His Pro Leu Gly Cys Ser Gly Ala Arg Val Val Val Thr Leu Leu
355 360 365
Ser Ile Leu Gln Gln Glu Gly Gly Lys Ile Gly Val Ala Ala Ile Cys
370 375 380
Asn Gly Gly Gly Gly Ala Ser Ser Ile Val Ile Glu Lys Ile
385 390 395
<210> 26
<211> 247
<212> PRT
<213> Bacteroides sp.
<400> 26
Met Ser Asp Asp Lys Lys Ile Gly Ser Tyr Lys Phe Ile Ala Glu Pro
1 5 10 15
Phe His Val Asp Phe Asn Gly Arg Leu Thr Met Gly Val Leu Gly Asn
20 25 30
His Leu Leu Asn Cys Ala Gly Phe His Ala Ser Glu Arg Gly Phe Gly
35 40 45
Ile Ala Thr Leu Asn Glu Asp Asn Tyr Thr Trp Val Leu Ser Arg Leu
50 55 60
Ala Ile Asp Leu Glu Glu Met Pro Tyr Gln Tyr Glu Glu Phe Thr Val
65 70 75 80
Gln Thr Trp Val Glu Asn Val Tyr Arg Leu Phe Thr Asp Arg Asn Phe
85 90 95
Ala Ile Ile Asp Lys Asp Gly Lys Lys Ile Gly Tyr Ala Arg Ser Val
100 105 110
Trp Ala Met Ile Asn Leu Asn Thr Arg Lys Pro Ala Asp Leu Leu Thr
115 120 125
Leu His Gly Gly Ser Ile Val Asp Tyr Val Cys Asp Glu Pro Cys Pro
130 135 140
Ile Glu Lys Pro Ser Arg Ile Lys Val Ala Thr Asp Gln Pro Cys Ala
145 150 155 160
Lys Leu Thr Ala Lys Tyr Ser Asp Ile Asp Ile Asn Gly His Val Asn
165 170 175
Ser Ile Arg Tyr Ile Glu His Ile Leu Asp Leu Phe Pro Ile Asp Leu
180 185 190
Tyr Lys Ser Lys Arg Ile Gln Arg Phe Glu Met Ala Tyr Val Ala Glu
195 200 205
Ser Tyr Tyr Gly Asp Glu Leu Ser Phe Phe Glu Glu Glu Val Ser Glu
210 215 220
Asn Glu Tyr His Val Glu Ile Lys Lys Asn Gly Ser Glu Val Val Cys
225 230 235 240
Arg Ala Lys Val Lys Phe Val
245
<210> 27
<211> 247
<212> PRT
<213> Bacteroides thetaiotaomicron
<400> 27
Met Ser Glu Glu Asn Lys Ile Gly Thr Tyr Gln Phe Val Ala Glu Pro
1 5 10 15
Phe His Val Asp Phe Asn Gly Arg Leu Thr Met Gly Val Leu Gly Asn
20 25 30
His Leu Leu Asn Cys Ala Gly Phe His Ala Ser Asp Arg Gly Phe Gly
35 40 45
Ile Ala Thr Leu Asn Glu Asp Asn Tyr Thr Trp Val Leu Ser Arg Leu
50 55 60
Ala Ile Glu Leu Asp Glu Met Pro Tyr Gln Tyr Glu Lys Phe Ser Val
65 70 75 80
Gln Thr Trp Val Glu Asn Val Tyr Arg Leu Phe Thr Asp Arg Asn Phe
85 90 95
Ala Val Ile Asp Lys Asp Gly Lys Lys Ile Gly Tyr Ala Arg Ser Val
100 105 110
Trp Ala Met Ile Asn Leu Asn Thr Arg Lys Pro Ala Asp Leu Leu Ala
115 120 125
Leu His Gly Gly Ser Ile Val Asp Tyr Ile Cys Asp Glu Pro Cys Pro
130 135 140
Ile Glu Lys Pro Ser Arg Ile Lys Val Thr Ser Asn Gln Pro Val Ala
145 150 155 160
Thr Leu Thr Ala Lys Tyr Ser Asp Ile Asp Ile Asn Gly His Val Asn
165 170 175
Ser Ile Arg Tyr Ile Glu His Ile Leu Asp Leu Phe Pro Ile Glu Leu
180 185 190
Tyr Gln Thr Lys Arg Ile Arg Arg Phe Glu Met Ala Tyr Val Ala Glu
195 200 205
Ser Tyr Phe Gly Asp Glu Leu Ser Phe Phe Cys Asp Glu Val Ser Glu
210 215 220
Asn Glu Phe His Val Glu Val Lys Lys Asn Gly Ser Glu Val Val Cys
225 230 235 240
Arg Ser Lys Val Ile Phe Glu
245
<210> 28
<211> 238
<212> PRT
<213> Bryantella formatexigen
<400> 28
Met Ile Tyr Met Ala Tyr Gln Tyr Arg Ser Arg Ile Arg Tyr Ser Glu
1 5 10 15
Ile Gly Glu Asp Lys Lys Leu Thr Leu Pro Gly Leu Val Asn Tyr Phe
20 25 30
Gln Asp Cys Ser Thr Phe Gln Ser Glu Ala Leu Gly Ile Gly Leu Asp
35 40 45
Thr Leu Gly Ala Arg Gln Arg Ala Trp Leu Leu Ala Ser Trp Lys Ile
50 55 60
Val Ile Asp Arg Leu Pro Arg Leu Gly Glu Glu Val Val Thr Glu Thr
65 70 75 80
Trp Pro Tyr Gly Phe Lys Gly Phe Gln Gly Asn Arg Asn Phe Arg Met
85 90 95
Leu Asp Gln Glu Gly His Thr Leu Ala Ala Ala Ala Ser Val Trp Ile
100 105 110
Tyr Leu Asn Val Glu Ser Gly His Pro Cys Arg Ile Asp Gly Asp Val
115 120 125
Leu Glu Ala Tyr Glu Leu Glu Glu Glu Leu Pro Leu Gly Pro Phe Ser
130 135 140
Arg Lys Ile Pro Val Pro Glu Glu Ser Thr Glu Arg Asp Ser Phe Leu
145 150 155 160
Val Met Arg Ser His Leu Asp Thr Asn His His Val Asn Asn Gly Gln
165 170 175
Tyr Ile Leu Met Ala Glu Glu Tyr Leu Pro Glu Gly Phe Lys Val Lys
180 185 190
Gln Ile Arg Val Glu Tyr Arg Lys Ala Ala Val Leu His Asp Thr Ile
195 200 205
Val Pro Phe Val Cys Thr Glu Pro Gln Arg Cys Thr Val Ser Leu Cys
210 215 220
Gly Ser Asp Glu Lys Pro Phe Ala Val Val Glu Phe Ser Glu
225 230 235
<210> 29
<211> 246
<212> PRT
<213> Lactobacillus brevis
<400> 29
Met Ala Ala Asn Glu Phe Ser Glu Thr His Arg Val Val Tyr Tyr Glu
1 5 10 15
Ala Asp Asp Thr Gly Gln Leu Thr Leu Ala Met Leu Ile Asn Leu Phe
20 25 30
Val Leu Val Ser Glu Asp Gln Asn Asp Ala Leu Gly Leu Ser Thr Ala
35 40 45
Phe Val Gln Ser His Gly Val Gly Trp Val Val Thr Gln Tyr His Leu
50 55 60
His Ile Asp Glu Leu Pro Arg Thr Gly Ala Gln Val Thr Ile Lys Thr
65 70 75 80
Arg Ala Thr Ala Tyr Asn Arg Tyr Phe Ala Tyr Arg Glu Tyr Trp Leu
85 90 95
Leu Asp Asp Ala Gly Gln Val Leu Ala Tyr Gly Glu Gly Ile Trp Val
100 105 110
Thr Met Ser Tyr Ala Thr Arg Lys Ile Thr Thr Ile Pro Ala Glu Val
115 120 125
Met Ala Pro Tyr His Ser Glu Glu Gln Thr Arg Leu Pro Arg Leu Pro
130 135 140
Arg Pro Asp His Phe Asp Glu Ala Val Asn Gln Thr Leu Lys Pro Tyr
145 150 155 160
Thr Val Arg Tyr Phe Asp Ile Asp Gly Asn Gly His Val Asn Asn Ala
165 170 175
His Tyr Phe Asp Trp Met Leu Asp Val Leu Pro Ala Thr Phe Leu Arg
180 185 190
Ala His His Pro Thr Asp Val Lys Ile Arg Phe Glu Asn Glu Val Gln
195 200 205
Tyr Gly His Gln Val Thr Ser Glu Leu Ser Gln Ala Ala Ala Leu Thr
210 215 220
Thr Gln His Met Ile Lys Val Gly Asp Leu Thr Ala Val Lys Ala Thr
225 230 235 240
Ile Gln Trp Asp Asn Arg
245
<210> 30
<211> 261
<212> PRT
<213> Lactobacillus plantarum
<400> 30
Met Ala Thr Leu Gly Ala Asn Ala Ser Leu Tyr Ser Glu Gln His Arg
1 5 10 15
Ile Thr Tyr Tyr Glu Cys Asp Arg Thr Gly Arg Ala Thr Leu Thr Thr
20 25 30
Leu Ile Asp Ile Ala Val Leu Ala Ser Glu Asp Gln Ser Asp Ala Leu
35 40 45
Gly Leu Thr Thr Glu Met Val Gln Ser His Gly Val Gly Trp Val Val
50 55 60
Thr Gln Tyr Ala Ile Asp Ile Thr Arg Met Pro Arg Gln Asp Glu Val
65 70 75 80
Val Thr Ile Ala Val Arg Gly Ser Ala Tyr Asn Pro Tyr Phe Ala Tyr
85 90 95
Arg Glu Phe Trp Ile Arg Asp Ala Asp Gly Gln Gln Leu Ala Tyr Ile
100 105 110
Thr Ser Ile Trp Val Met Met Ser Gln Thr Thr Arg Arg Ile Val Lys
115 120 125
Ile Leu Pro Glu Leu Val Ala Pro Tyr Gln Ser Glu Val Val Lys Arg
130 135 140
Ile Pro Arg Leu Pro Arg Pro Ile Ser Phe Glu Ala Thr Asp Thr Thr
145 150 155 160
Ile Thr Lys Pro Tyr His Val Arg Phe Phe Asp Ile Asp Pro Asn Arg
165 170 175
His Val Asn Asn Ala His Tyr Phe Asp Trp Leu Val Asp Thr Leu Pro
180 185 190
Ala Thr Phe Leu Leu Gln His Asp Leu Val His Val Asp Val Arg Tyr
195 200 205
Glu Asn Glu Val Lys Tyr Gly Gln Thr Val Thr Ala His Ala Asn Ile
210 215 220
Leu Pro Ser Glu Val Ala Asp Gln Val Thr Thr Ser His Leu Ile Glu
225 230 235 240
Val Asp Asp Glu Lys Cys Cys Glu Val Thr Ile Gln Trp Arg Thr Leu
245 250 255
Pro Glu Pro Ile Gln
260
<210> 31
<211> 250
<212> PRT
<213> Streptococcus dysgalactiae
<400> 31
Met Gly Leu Ser Tyr Arg Glu Asp Ile Lys Leu Pro Phe Glu Leu Cys
1 5 10 15
Asp Val Lys Ser Asp Ile Lys Phe Pro Leu Leu Leu Asp Tyr Cys Leu
20 25 30
Thr Val Ser Gly Arg Gln Ser Ala Gln Leu Gly Arg Ser Asn Asp Tyr
35 40 45
Leu Leu Glu Gln Tyr Gly Leu Ile Trp Ile Val Thr Asp Tyr Glu Ala
50 55 60
Thr Ile His Arg Leu Pro His Phe Gln Glu Thr Ile Thr Ile Glu Thr
65 70 75 80
Lys Ala Leu Ser Tyr Asn Lys Phe Phe Cys Tyr Arg Gln Phe Tyr Ile
85 90 95
Tyr Asp Gln Glu Gly Gly Leu Leu Val Asp Ile Leu Ala Tyr Phe Ala
100 105 110
Leu Leu Asn Pro Asp Thr Arg Lys Val Ala Thr Ile Pro Glu Asp Leu
115 120 125
Val Ala Pro Phe Glu Thr Asp Phe Val Lys Lys Leu His Arg Val Pro
130 135 140
Lys Met Pro Leu Leu Glu Gln Ser Ile Asp Arg Asp Tyr Tyr Val Arg
145 150 155 160
Tyr Phe Asp Ile Asp Met Asn Gly His Val Asn Asn Ser Lys Tyr Leu
165 170 175
Asp Trp Met Tyr Asp Val Leu Gly Cys Glu Phe Leu Lys Thr His Gln
180 185 190
Pro Leu Lys Met Thr Leu Lys Tyr Val Lys Glu Val Ser Pro Gly Gly
195 200 205
Gln Ile Thr Ser Ser Tyr His Leu Asp Gln Leu Thr Ser Tyr His Gln
210 215 220
Ile Thr Ser Asp Gly Gln Leu Asn Ala Gln Ala Met Ile Glu Trp Arg
225 230 235 240
Ala Ile Lys Gln Thr Glu Ser Glu Ile Asp
245 250
<210> 32
<211> 620
<212> PRT
<213> Escherichia coli
<400> 32
Met Ser Phe Asp Ile Ala Lys Tyr Pro Thr Leu Ala Leu Val Asp Ser
1 5 10 15
Thr Gln Glu Leu Arg Leu Leu Pro Lys Glu Ser Leu Pro Lys Leu Cys
20 25 30
Asp Glu Leu Arg Arg Tyr Leu Leu Asp Ser Val Ser Arg Ser Ser Gly
35 40 45
His Phe Ala Ser Gly Leu Gly Thr Val Glu Leu Thr Val Ala Leu His
50 55 60
Tyr Val Tyr Asn Thr Pro Phe Asp Gln Leu Ile Trp Asp Val Gly His
65 70 75 80
Gln Ala Tyr Pro His Lys Ile Leu Thr Gly Arg Arg Asp Lys Ile Gly
85 90 95
Thr Ile Arg Gln Lys Gly Gly Leu His Pro Phe Pro Trp Arg Gly Glu
100 105 110
Ser Glu Tyr Asp Val Leu Ser Val Gly His Ser Ser Thr Ser Ile Ser
115 120 125
Ala Gly Ile Gly Ile Ala Val Ala Ala Glu Lys Glu Gly Lys Asn Arg
130 135 140
Arg Thr Val Cys Val Ile Gly Asp Gly Ala Ile Thr Ala Gly Met Ala
145 150 155 160
Phe Glu Ala Met Asn His Ala Gly Asp Ile Arg Pro Asp Met Leu Val
165 170 175
Ile Leu Asn Asp Asn Glu Met Ser Ile Ser Glu Asn Val Gly Ala Leu
180 185 190
Asn Asn His Leu Ala Gln Leu Leu Ser Gly Lys Leu Tyr Ser Ser Leu
195 200 205
Arg Glu Gly Gly Lys Lys Val Phe Ser Gly Val Pro Pro Ile Lys Glu
210 215 220
Leu Leu Lys Arg Thr Glu Glu His Ile Lys Gly Met Val Val Pro Gly
225 230 235 240
Thr Leu Phe Glu Glu Leu Gly Phe Asn Tyr Ile Gly Pro Val Asp Gly
245 250 255
His Asp Val Leu Gly Leu Ile Thr Thr Leu Lys Asn Met Arg Asp Leu
260 265 270
Lys Gly Pro Gln Phe Leu His Ile Met Thr Lys Lys Gly Arg Gly Tyr
275 280 285
Glu Pro Ala Glu Lys Asp Pro Ile Thr Phe His Ala Val Pro Lys Phe
290 295 300
Asp Pro Ser Ser Gly Cys Leu Pro Lys Ser Ser Gly Gly Leu Pro Ser
305 310 315 320
Tyr Ser Lys Ile Phe Gly Asp Trp Leu Cys Glu Thr Ala Ala Lys Asp
325 330 335
Asn Lys Leu Met Ala Ile Thr Pro Ala Met Arg Glu Gly Ser Gly Met
340 345 350
Val Glu Phe Ser Arg Lys Phe Pro Asp Arg Tyr Phe Asp Val Ala Ile
355 360 365
Ala Glu Gln His Ala Val Thr Phe Ala Ala Gly Leu Ala Ile Gly Gly
370 375 380
Tyr Lys Pro Ile Val Ala Ile Tyr Ser Thr Phe Leu Gln Arg Ala Tyr
385 390 395 400
Asp Gln Val Leu His Asp Val Ala Ile Gln Lys Leu Pro Val Leu Phe
405 410 415
Ala Ile Asp Arg Ala Gly Ile Val Gly Ala Asp Gly Gln Thr His Gln
420 425 430
Gly Ala Phe Asp Leu Ser Tyr Leu Arg Cys Ile Pro Glu Met Val Ile
435 440 445
Met Thr Pro Ser Asp Glu Asn Glu Cys Arg Gln Met Leu Tyr Thr Gly
450 455 460
Tyr His Tyr Asn Asp Gly Pro Ser Ala Val Arg Tyr Pro Arg Gly Asn
465 470 475 480
Ala Val Gly Val Glu Leu Thr Pro Leu Glu Lys Leu Pro Ile Gly Lys
485 490 495
Gly Ile Val Lys Arg Arg Gly Glu Lys Leu Ala Ile Leu Asn Phe Gly
500 505 510
Thr Leu Met Pro Glu Ala Ala Lys Val Ala Glu Ser Leu Asn Ala Thr
515 520 525
Leu Val Asp Met Arg Phe Val Lys Pro Leu Asp Glu Ala Leu Ile Leu
530 535 540
Glu Met Ala Ala Ser His Glu Ala Leu Val Thr Val Glu Glu Asn Ala
545 550 555 560
Ile Met Gly Gly Ala Gly Ser Gly Val Asn Glu Val Leu Met Ala His
565 570 575
Arg Lys Pro Val Pro Val Leu Asn Ile Gly Leu Pro Asp Phe Phe Ile
580 585 590
Pro Gln Gly Thr Gln Glu Glu Met Arg Ala Glu Leu Gly Leu Asp Ala
595 600 605
Ala Gly Met Glu Ala Lys Ile Lys Ala Trp Leu Ala
610 615 620
<210> 33
<211> 398
<212> PRT
<213> Escherichia coli
<400> 33
Met Lys Gln Leu Thr Ile Leu Gly Ser Thr Gly Ser Ile Gly Cys Ser
1 5 10 15
Thr Leu Asp Val Val Arg His Asn Pro Glu His Phe Arg Val Val Ala
20 25 30
Leu Val Ala Gly Lys Asn Val Thr Arg Met Val Glu Gln Cys Leu Glu
35 40 45
Phe Ser Pro Arg Tyr Ala Val Met Asp Asp Glu Ala Ser Ala Lys Leu
50 55 60
Leu Lys Thr Met Leu Gln Gln Gln Gly Ser Arg Thr Glu Val Leu Ser
65 70 75 80
Gly Gln Gln Ala Ala Cys Asp Met Ala Ala Leu Glu Asp Val Asp Gln
85 90 95
Val Met Ala Ala Ile Val Gly Ala Ala Gly Leu Leu Pro Thr Leu Ala
100 105 110
Ala Ile Arg Ala Gly Lys Thr Ile Leu Leu Ala Asn Lys Glu Ser Leu
115 120 125
Val Thr Cys Gly Arg Leu Phe Met Asp Ala Val Lys Gln Ser Lys Ala
130 135 140
Gln Leu Leu Pro Val Asp Ser Glu His Asn Ala Ile Phe Gln Ser Leu
145 150 155 160
Pro Gln Pro Ile Gln His Asn Leu Gly Tyr Ala Asp Leu Glu Gln Asn
165 170 175
Gly Val Val Ser Ile Leu Leu Thr Gly Ser Gly Gly Pro Phe Arg Glu
180 185 190
Thr Pro Leu Arg Asp Leu Ala Thr Met Thr Pro Asp Gln Ala Cys Arg
195 200 205
His Pro Asn Trp Ser Met Gly Arg Lys Ile Ser Val Asp Ser Ala Thr
210 215 220
Met Met Asn Lys Gly Leu Glu Tyr Ile Glu Ala Arg Trp Leu Phe Asn
225 230 235 240
Ala Ser Ala Ser Gln Met Glu Val Leu Ile His Pro Gln Ser Val Ile
245 250 255
His Ser Met Val Arg Tyr Gln Asp Gly Ser Val Leu Ala Gln Leu Gly
260 265 270
Glu Pro Asp Met Arg Thr Pro Ile Ala His Thr Met Ala Trp Pro Asn
275 280 285
Arg Val Asn Ser Gly Val Lys Pro Leu Asp Phe Cys Lys Leu Ser Ala
290 295 300
Leu Thr Phe Ala Ala Pro Asp Tyr Asp Arg Tyr Pro Cys Leu Lys Leu
305 310 315 320
Ala Met Glu Ala Phe Glu Gln Gly Gln Ala Ala Thr Thr Ala Leu Asn
325 330 335
Ala Ala Asn Glu Ile Thr Val Ala Ala Phe Leu Ala Gln Gln Ile Arg
340 345 350
Phe Thr Asp Ile Ala Ala Leu Asn Leu Ser Val Leu Glu Lys Met Asp
355 360 365
Met Arg Glu Pro Gln Cys Val Asp Asp Val Leu Ser Val Asp Ala Asn
370 375 380
Ala Arg Glu Val Ala Arg Lys Glu Val Met Arg Leu Ala Ser
385 390 395
<210> 34
<211> 236
<212> PRT
<213> Escherichia coli
<400> 34
Met Ala Thr Thr His Leu Asp Val Cys Ala Val Val Pro Ala Ala Gly
1 5 10 15
Phe Gly Arg Arg Met Gln Thr Glu Cys Pro Lys Gln Tyr Leu Ser Ile
20 25 30
Gly Asn Gln Thr Ile Leu Glu His Ser Val His Ala Leu Leu Ala His
35 40 45
Pro Arg Val Lys Arg Val Val Ile Ala Ile Ser Pro Gly Asp Ser Arg
50 55 60
Phe Ala Gln Leu Pro Leu Ala Asn His Pro Arg Ile Thr Val Val Asp
65 70 75 80
Gly Gly Glu Glu Arg Ala Asp Ser Val Leu Ala Gly Leu Lys Ala Ala
85 90 95
Gly Asp Ala Gln Trp Val Leu Val His Asp Ala Ala Arg Pro Cys Leu
100 105 110
His Gln Asp Asp Leu Ala Arg Leu Leu Ala Leu Ser Glu Thr Ser Arg
115 120 125
Thr Gly Gly Ile Leu Ala Ala Pro Val Arg Asp Thr Met Lys Arg Ala
130 135 140
Glu Pro Gly Lys Asn Ala Ile Ala His Thr Val Asp Arg Asn Gly Leu
145 150 155 160
Trp His Ala Leu Thr Pro Gln Phe Phe Pro Arg Glu Leu Leu His Asp
165 170 175
Cys Leu Thr Arg Ala Leu Asn Glu Gly Ala Thr Ile Thr Asp Glu Ala
180 185 190
Ser Ala Leu Glu Tyr Cys Gly Phe His Pro Gln Leu Val Glu Gly Arg
195 200 205
Ala Asp Asn Ile Lys Val Thr Arg Pro Glu Asp Leu Ala Leu Ala Glu
210 215 220
Phe Tyr Leu Thr Arg Thr Ile His Gln Glu Asn Thr
225 230 235
<210> 35
<211> 283
<212> PRT
<213> Escherichia coli
<400> 35
Met Arg Thr Gln Trp Pro Ser Pro Ala Lys Leu Asn Leu Phe Leu Tyr
1 5 10 15
Ile Thr Gly Gln Arg Ala Asp Gly Tyr His Thr Leu Gln Thr Leu Phe
20 25 30
Gln Phe Leu Asp Tyr Gly Asp Thr Ile Ser Ile Glu Leu Arg Asp Asp
35 40 45
Gly Asp Ile Arg Leu Leu Thr Pro Val Glu Gly Val Glu His Glu Asp
50 55 60
Asn Leu Ile Val Arg Ala Ala Arg Leu Leu Met Lys Thr Ala Ala Asp
65 70 75 80
Ser Gly Arg Leu Pro Thr Gly Ser Gly Ala Asn Ile Ser Ile Asp Lys
85 90 95
Arg Leu Pro Met Gly Gly Gly Leu Gly Gly Gly Ser Ser Asn Ala Ala
100 105 110
Thr Val Leu Val Ala Leu Asn His Leu Trp Gln Cys Gly Leu Ser Met
115 120 125
Asp Glu Leu Ala Glu Met Gly Leu Thr Leu Gly Ala Asp Val Pro Val
130 135 140
Phe Val Arg Gly His Ala Ala Phe Ala Glu Gly Val Gly Glu Ile Leu
145 150 155 160
Thr Pro Val Asp Pro Pro Glu Lys Trp Tyr Leu Val Ala His Pro Gly
165 170 175
Val Ser Ile Pro Thr Pro Val Ile Phe Lys Asp Pro Glu Leu Pro Arg
180 185 190
Asn Thr Pro Lys Arg Ser Ile Glu Thr Leu Leu Lys Cys Glu Phe Ser
195 200 205
Asn Asp Cys Glu Val Ile Ala Arg Lys Arg Phe Arg Glu Val Asp Ala
210 215 220
Val Leu Ser Trp Leu Leu Glu Tyr Ala Pro Ser Arg Leu Thr Gly Thr
225 230 235 240
Gly Ala Cys Val Phe Ala Glu Phe Asp Thr Glu Ser Glu Ala Arg Gln
245 250 255
Val Leu Glu Gln Ala Pro Glu Trp Leu Asn Gly Phe Val Ala Lys Gly
260 265 270
Ala Asn Leu Ser Pro Leu His Arg Ala Met Leu
275 280
<210> 36
<211> 159
<212> PRT
<213> Escherichia coli
<400> 36
Met Arg Ile Gly His Gly Phe Asp Val His Ala Phe Gly Gly Glu Gly
1 5 10 15
Pro Ile Ile Ile Gly Gly Val Arg Ile Pro Tyr Glu Lys Gly Leu Leu
20 25 30
Ala His Ser Asp Gly Asp Val Val Leu His Ala Leu Thr Asp Ala Leu
35 40 45
Leu Gly Ala Ala Ala Leu Gly Asp Ile Gly Lys Leu Phe Pro Asp Thr
50 55 60
Asp Pro Ala Phe Lys Gly Ala Asp Ser Arg Glu Leu Leu Arg Glu Ala
65 70 75 80
Trp Arg Arg Ile Gln Ala Lys Gly Tyr Ala Leu Gly Asn Val Asp Val
85 90 95
Thr Ile Ile Ala Gln Ala Pro Arg Met Leu Pro His Ile Pro Gln Met
100 105 110
Arg Val Phe Ile Ala Glu Asp Leu Gly Cys His Met Asp Asp Val Asn
115 120 125
Val Lys Ala Thr Thr Thr Glu Lys Leu Gly Phe Thr Gly Arg Gly Glu
130 135 140
Gly Ile Ala Cys Glu Ala Val Ala Leu Leu Ile Lys Ala Thr Lys
145 150 155
<210> 37
<211> 372
<212> PRT
<213> Escherichia coli
<400> 37
Met His Asn Gln Ala Pro Ile Gln Arg Arg Lys Ser Thr Arg Ile Tyr
1 5 10 15
Val Gly Asn Val Pro Ile Gly Asp Gly Ala Pro Ile Ala Val Gln Ser
20 25 30
Met Thr Asn Thr Arg Thr Thr Asp Val Glu Ala Thr Val Asn Gln Ile
35 40 45
Lys Ala Leu Glu Arg Val Gly Ala Asp Ile Val Arg Val Ser Val Pro
50 55 60
Thr Met Asp Ala Ala Glu Ala Phe Lys Leu Ile Lys Gln Gln Val Asn
65 70 75 80
Val Pro Leu Val Ala Asp Ile His Phe Asp Tyr Arg Ile Ala Leu Lys
85 90 95
Val Ala Glu Tyr Gly Val Asp Cys Leu Arg Ile Asn Pro Gly Asn Ile
100 105 110
Gly Asn Glu Glu Arg Ile Arg Met Val Val Asp Cys Ala Arg Asp Lys
115 120 125
Asn Ile Pro Ile Arg Ile Gly Val Asn Ala Gly Ser Leu Glu Lys Asp
130 135 140
Leu Gln Glu Lys Tyr Gly Glu Pro Thr Pro Gln Ala Leu Leu Glu Ser
145 150 155 160
Ala Met Arg His Val Asp His Leu Asp Arg Leu Asn Phe Asp Gln Phe
165 170 175
Lys Val Ser Val Lys Ala Ser Asp Val Phe Leu Ala Val Glu Ser Tyr
180 185 190
Arg Leu Leu Ala Lys Gln Ile Asp Gln Pro Leu His Leu Gly Ile Thr
195 200 205
Glu Ala Gly Gly Ala Arg Ser Gly Ala Val Lys Ser Ala Ile Gly Leu
210 215 220
Gly Leu Leu Leu Ser Glu Gly Ile Gly Asp Thr Leu Arg Val Ser Leu
225 230 235 240
Ala Ala Asp Pro Val Glu Glu Ile Lys Val Gly Phe Asp Ile Leu Lys
245 250 255
Ser Leu Arg Ile Arg Ser Arg Gly Ile Asn Phe Ile Ala Cys Pro Thr
260 265 270
Cys Ser Arg Gln Glu Phe Asp Val Ile Gly Thr Val Asn Ala Leu Glu
275 280 285
Gln Arg Leu Glu Asp Ile Ile Thr Pro Met Asp Val Ser Ile Ile Gly
290 295 300
Cys Val Val Asn Gly Pro Gly Glu Ala Leu Val Ser Thr Leu Gly Val
305 310 315 320
Thr Gly Gly Asn Lys Lys Ser Gly Leu Tyr Glu Asp Gly Val Arg Lys
325 330 335
Asp Arg Leu Asp Asn Asn Asp Met Ile Asp Gln Leu Glu Ala Arg Ile
340 345 350
Arg Ala Lys Ala Ser Gln Leu Asp Glu Ala Arg Arg Ile Asp Val Gln
355 360 365
Gln Val Glu Lys
370
<210> 38
<211> 316
<212> PRT
<213> Escherichia coli
<400> 38
Met Gln Ile Leu Leu Ala Asn Pro Arg Gly Phe Cys Ala Gly Val Asp
1 5 10 15
Arg Ala Ile Ser Ile Val Glu Asn Ala Leu Ala Ile Tyr Gly Ala Pro
20 25 30
Ile Tyr Val Arg His Glu Val Val His Asn Arg Tyr Val Val Asp Ser
35 40 45
Leu Arg Glu Arg Gly Ala Ile Phe Ile Glu Gln Ile Ser Glu Val Pro
50 55 60
Asp Gly Ala Ile Leu Ile Phe Ser Ala His Gly Val Ser Gln Ala Val
65 70 75 80
Arg Asn Glu Ala Lys Ser Arg Asp Leu Thr Val Phe Asp Ala Thr Cys
85 90 95
Pro Leu Val Thr Lys Val His Met Glu Val Ala Arg Ala Ser Arg Arg
100 105 110
Gly Glu Glu Ser Ile Leu Ile Gly His Ala Gly His Pro Glu Val Glu
115 120 125
Gly Thr Met Gly Gln Tyr Ser Asn Pro Glu Gly Gly Met Tyr Leu Val
130 135 140
Glu Ser Pro Asp Asp Val Trp Lys Leu Thr Val Lys Asn Glu Glu Lys
145 150 155 160
Leu Ser Phe Met Thr Gln Thr Thr Leu Ser Val Asp Asp Thr Ser Asp
165 170 175
Val Ile Asp Ala Leu Arg Lys Arg Phe Pro Lys Ile Val Gly Pro Arg
180 185 190
Lys Asp Asp Ile Cys Tyr Ala Thr Thr Asn Arg Gln Glu Ala Val Arg
195 200 205
Ala Leu Ala Glu Gln Ala Glu Val Val Leu Val Val Gly Ser Lys Asn
210 215 220
Ser Ser Asn Ser Asn Arg Leu Ala Glu Leu Ala Gln Arg Met Gly Lys
225 230 235 240
Arg Ala Phe Leu Ile Asp Asp Ala Thr Asp Ile Gln Glu Glu Trp Val
245 250 255
Lys Glu Ala Lys Cys Val Gly Val Thr Ala Gly Ala Ser Ala Pro Asp
260 265 270
Ile Leu Val Gln Asn Val Val Ala Arg Leu Gln Gln Leu Gly Gly Gly
275 280 285
Glu Ala Ile Pro Leu Glu Gly Arg Glu Glu Asn Ile Val Phe Glu Val
290 295 300
Pro Lys Glu Leu Arg Val Asp Ile Arg Glu Val Asp
305 310 315
<210> 39
<211> 182
<212> PRT
<213> Escherichia coli
<400> 39
Met Gln Thr Glu His Val Ile Leu Leu Asn Ala Gln Gly Val Pro Thr
1 5 10 15
Gly Thr Leu Glu Lys Tyr Ala Ala His Thr Ala Asp Thr Arg Leu His
20 25 30
Leu Ala Phe Ser Ser Trp Leu Phe Asn Ala Lys Gly Gln Leu Leu Val
35 40 45
Thr Arg Arg Ala Leu Ser Lys Lys Ala Trp Pro Gly Val Trp Thr Asn
50 55 60
Ser Val Cys Gly His Pro Gln Leu Gly Glu Ser Asn Glu Asp Ala Val
65 70 75 80
Ile Arg Arg Cys Arg Tyr Glu Leu Gly Val Glu Ile Thr Pro Pro Glu
85 90 95
Ser Ile Tyr Pro Asp Phe Arg Tyr Arg Ala Thr Asp Pro Ser Gly Ile
100 105 110
Val Glu Asn Glu Val Cys Pro Val Phe Ala Ala Arg Thr Thr Ser Ala
115 120 125
Leu Gln Ile Asn Asp Asp Glu Val Met Asp Tyr Gln Trp Cys Asp Leu
130 135 140
Ala Asp Val Leu His Gly Ile Asp Ala Thr Pro Trp Ala Phe Ser Pro
145 150 155 160
Trp Met Val Met Gln Ala Thr Asn Arg Glu Ala Arg Lys Arg Leu Ser
165 170 175
Ala Phe Thr Gln Leu Lys
180
<210> 40
<211> 299
<212> PRT
<213> Escherichia coli
<400> 40
Met Asp Phe Pro Gln Gln Leu Glu Ala Cys Val Lys Gln Ala Asn Gln
1 5 10 15
Ala Leu Ser Arg Phe Ile Ala Pro Leu Pro Phe Gln Asn Thr Pro Val
20 25 30
Val Glu Thr Met Gln Tyr Gly Ala Leu Leu Gly Gly Lys Arg Leu Arg
35 40 45
Pro Phe Leu Val Tyr Ala Thr Gly His Met Phe Gly Val Ser Thr Asn
50 55 60
Thr Leu Asp Ala Pro Ala Ala Ala Val Glu Cys Ile His Ala Tyr Ser
65 70 75 80
Leu Ile His Asp Asp Leu Pro Ala Met Asp Asp Asp Asp Leu Arg Arg
85 90 95
Gly Leu Pro Thr Cys His Val Lys Phe Gly Glu Ala Asn Ala Ile Leu
100 105 110
Ala Gly Asp Ala Leu Gln Thr Leu Ala Phe Ser Ile Leu Ser Asp Ala
115 120 125
Asp Met Pro Glu Val Ser Asp Arg Asp Arg Ile Ser Met Ile Ser Glu
130 135 140
Leu Ala Ser Ala Ser Gly Ile Ala Gly Met Cys Gly Gly Gln Ala Leu
145 150 155 160
Asp Leu Asp Ala Glu Gly Lys His Val Pro Leu Asp Ala Leu Glu Arg
165 170 175
Ile His Arg His Lys Thr Gly Ala Leu Ile Arg Ala Ala Val Arg Leu
180 185 190
Gly Ala Leu Ser Ala Gly Asp Lys Gly Arg Arg Ala Leu Pro Val Leu
195 200 205
Asp Lys Tyr Ala Glu Ser Ile Gly Leu Ala Phe Gln Val Gln Asp Asp
210 215 220
Ile Leu Asp Val Val Gly Asp Thr Ala Thr Leu Gly Lys Arg Gln Gly
225 230 235 240
Ala Asp Gln Gln Leu Gly Lys Ser Thr Tyr Pro Ala Leu Leu Gly Leu
245 250 255
Glu Gln Ala Arg Lys Lys Ala Arg Asp Leu Ile Asp Asp Ala Arg Gln
260 265 270
Ser Leu Lys Gln Leu Ala Glu Gln Ser Leu Asp Thr Ser Ala Leu Glu
275 280 285
Ala Leu Ala Asp Tyr Ile Ile Gln Arg Asn Lys
290 295
<210> 41
<211> 1083
<212> DNA
<213> Saccharomyces cerevisiae
<400> 41
atgaagctac taaccttccc aggtcaaggg acctccatct ccatttcgat attaaaagcg 60
ataataagaa acaaatcaag agaattccaa acaatactga gtcagaacgg caaggaatca 120
aatgatctat tgcagtacat cttccagaac ccttccagcc ccggaagcat tgcagtctgc 180
tccaaccttt tctatcaatt gtaccagata ctctcgaatc cttctgatcc tcaagatcaa 240
gcaccaaaaa atatgactaa gatcgattcc cccgacaaga aagacaatga acaatgttac 300
cttttgggtc actcgctagg cgagttaaca tgtctgagtg ttaattcact gttttcgtta 360
aaggatcttt ttgatattgc taattttaga aataagttaa tggtaacatc tactgaaaag 420
tacttagtag cccacaatat caacagatcc aacaaatttg aaatgtgggc actctcttct 480
ccgagggcca cagatttacc gcaagaagtg caaaaactac taaattcccc taatttatta 540
tcatcttcac aaaataccat ttctgtagca aatgcaaatt cagtaaagca atgtgtagtc 600
accggtctgg ttgatgattt agagtcctta agaacagaat tgaacttaag gttcccgcgt 660
ttaagaatta cagaattaac taacccatac aacatcccct tccataatag cactgtgttg 720
aggcccgttc aggaaccact ctatgactac atttgggata tattaaagaa aaacggaact 780
cacacgttga tggagttgaa ccatccaata atagctaact tagatggtaa tatatcttac 840
tatattcatc atgccctaga tagattcgtt aagtgttcaa gcaggactgt gcaattcacc 900
atgtgttatg ataccataaa ctctggaacc ccagtggaaa ttgataagag tatttgcttt 960
ggcccgggca atgtgattta taaccttatt cggagaaatt gtccccaagt ggacactata 1020
gaatacacct ctttagcaac tatagacgct tatcacaagg cggcagagga gaacaaagat 1080
tga 1083
<210> 42
<211> 360
<212> PRT
<213> Saccharomyces cerevisiae
<400> 42
Met Lys Leu Leu Thr Phe Pro Gly Gln Gly Thr Ser Ile Ser Ile Ser
1 5 10 15
Ile Leu Lys Ala Ile Ile Arg Asn Lys Ser Arg Glu Phe Gln Thr Ile
20 25 30
Leu Ser Gln Asn Gly Lys Glu Ser Asn Asp Leu Leu Gln Tyr Ile Phe
35 40 45
Gln Asn Pro Ser Ser Pro Gly Ser Ile Ala Val Cys Ser Asn Leu Phe
50 55 60
Tyr Gln Leu Tyr Gln Ile Leu Ser Asn Pro Ser Asp Pro Gln Asp Gln
65 70 75 80
Ala Pro Lys Asn Met Thr Lys Ile Asp Ser Pro Asp Lys Lys Asp Asn
85 90 95
Glu Gln Cys Tyr Leu Leu Gly His Ser Leu Gly Glu Leu Thr Cys Leu
100 105 110
Ser Val Asn Ser Leu Phe Ser Leu Lys Asp Leu Phe Asp Ile Ala Asn
115 120 125
Phe Arg Asn Lys Leu Met Val Thr Ser Thr Glu Lys Tyr Leu Val Ala
130 135 140
His Asn Ile Asn Arg Ser Asn Lys Phe Glu Met Trp Ala Leu Ser Ser
145 150 155 160
Pro Arg Ala Thr Asp Leu Pro Gln Glu Val Gln Lys Leu Leu Asn Ser
165 170 175
Pro Asn Leu Leu Ser Ser Ser Gln Asn Thr Ile Ser Val Ala Asn Ala
180 185 190
Asn Ser Val Lys Gln Cys Val Val Thr Gly Leu Val Asp Asp Leu Glu
195 200 205
Ser Leu Arg Thr Glu Leu Asn Leu Arg Phe Pro Arg Leu Arg Ile Thr
210 215 220
Glu Leu Thr Asn Pro Tyr Asn Ile Pro Phe His Asn Ser Thr Val Leu
225 230 235 240
Arg Pro Val Gln Glu Pro Leu Tyr Asp Tyr Ile Trp Asp Ile Leu Lys
245 250 255
Lys Asn Gly Thr His Thr Leu Met Glu Leu Asn His Pro Ile Ile Ala
260 265 270
Asn Leu Asp Gly Asn Ile Ser Tyr Tyr Ile His His Ala Leu Asp Arg
275 280 285
Phe Val Lys Cys Ser Ser Arg Thr Val Gln Phe Thr Met Cys Tyr Asp
290 295 300
Thr Ile Asn Ser Gly Thr Pro Val Glu Ile Asp Lys Ser Ile Cys Phe
305 310 315 320
Gly Pro Gly Asn Val Ile Tyr Asn Leu Ile Arg Arg Asn Cys Pro Gln
325 330 335
Val Asp Thr Ile Glu Tyr Thr Ser Leu Ala Thr Ile Asp Ala Tyr His
340 345 350
Lys Ala Ala Glu Glu Asn Lys Asp
355 360
<210> 43
<211> 1191
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(1191)
<223> 人工β-酮硫解酶(BktB)核苷酸序列
<400> 43
atgactagag aagttgtcgt cgtttccggt gtccgtaccg ctatcggtac tttcggtggt 60
tccttaaagg atgttgctcc tgctgaattg ggtgctttag ttgttagaga agctttggcc 120
agagcccaag tctccggtga cgacgttggt cacgtcgttt tcggtaacgt catccaaact 180
gaaccacgtg acatgtactt gggtagagtc gccgctgtta acggtggtgt caccatcaac 240
gctcctgcct taactgttaa cagattatgt ggttccggtt tacaagctat tgtctctgcc 300
gcccaaacta tcttgttggg tgatactgac gttgctattg gtggtggtgc tgaatctatg 360
tctagagctc catacttggc tccagctgcc cgttggggtg ctagaatggg tgacgccggt 420
ttggtcgata tgatgttggg tgccttgcat gatcctttcc acagaatcca catgggtgtt 480
accgctgaaa acgttgctaa ggaatacgat atctctagag ctcaacaaga tgaagccgct 540
ttagaatctc acagacgtgc ctccgccgct attaaggctg gttacttcaa ggaccaaatt 600
gttccagttg tctctaaggg tcgtaaaggt gatgttacct ttgatactga cgaacacgtt 660
agacacgacg ccactattga cgatatgact aaattaagac cagtctttgt taaggagaat 720
ggtaccgtta ctgctggtaa cgcttctggt ttgaacgatg ccgccgctgc cgttgttatg 780
atggaaagag ctgaagccga aagacgtggt ttaaagccat tggccagatt agtctcctac 840
ggtcacgctg gtgtcgaccc aaaggctatg ggtatcggtc cagttcctgc tactaagatt 900
gctttagaaa gagctggttt gcaagtttct gacttggacg tcatcgaagc caacgaagcc 960
ttcgctgctc aagcttgtgc tgtcaccaag gctttgggtt tggatccagc taaagttaac 1020
cctaatggtt ctggtatttc cttgggtcac ccaatcggtg ctaccggtgc tttaatcact 1080
gttaaagcct tacacgaatt gaacagagtt caaggtagat acgctttggt cactatgtgc 1140
atcggtggtg gtcaaggtat cgctgctatc ttcgaaagaa tcggatccta a 1191
<210> 44
<211> 396
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(396)
<223> 工程化的β-酮硫解酶 (BktB)
<400> 44
Met Thr Arg Glu Val Val Val Val Ser Gly Val Arg Thr Ala Ile Gly
1 5 10 15
Thr Phe Gly Gly Ser Leu Lys Asp Val Ala Pro Ala Glu Leu Gly Ala
20 25 30
Leu Val Val Arg Glu Ala Leu Ala Arg Ala Gln Val Ser Gly Asp Asp
35 40 45
Val Gly His Val Val Phe Gly Asn Val Ile Gln Thr Glu Pro Arg Asp
50 55 60
Met Tyr Leu Gly Arg Val Ala Ala Val Asn Gly Gly Val Thr Ile Asn
65 70 75 80
Ala Pro Ala Leu Thr Val Asn Arg Leu Cys Gly Ser Gly Leu Gln Ala
85 90 95
Ile Val Ser Ala Ala Gln Thr Ile Leu Leu Gly Asp Thr Asp Val Ala
100 105 110
Ile Gly Gly Gly Ala Glu Ser Met Ser Arg Ala Pro Tyr Leu Ala Pro
115 120 125
Ala Ala Arg Trp Gly Ala Arg Met Gly Asp Ala Gly Leu Val Asp Met
130 135 140
Met Leu Gly Ala Leu His Asp Pro Phe His Arg Ile His Met Gly Val
145 150 155 160
Thr Ala Glu Asn Val Ala Lys Glu Tyr Asp Ile Ser Arg Ala Gln Gln
165 170 175
Asp Glu Ala Ala Leu Glu Ser His Arg Arg Ala Ser Ala Ala Ile Lys
180 185 190
Ala Gly Tyr Phe Lys Asp Gln Ile Val Pro Val Val Ser Lys Gly Arg
195 200 205
Lys Gly Asp Val Thr Phe Asp Thr Asp Glu His Val Arg His Asp Ala
210 215 220
Thr Ile Asp Asp Met Thr Lys Leu Arg Pro Val Phe Val Lys Glu Asn
225 230 235 240
Gly Thr Val Thr Ala Gly Asn Ala Ser Gly Leu Asn Asp Ala Ala Ala
245 250 255
Ala Val Val Met Met Glu Arg Ala Glu Ala Glu Arg Arg Gly Leu Lys
260 265 270
Pro Leu Ala Arg Leu Val Ser Tyr Gly His Ala Gly Val Asp Pro Lys
275 280 285
Ala Met Gly Ile Gly Pro Val Pro Ala Thr Lys Ile Ala Leu Glu Arg
290 295 300
Ala Gly Leu Gln Val Ser Asp Leu Asp Val Ile Glu Ala Asn Glu Ala
305 310 315 320
Phe Ala Ala Gln Ala Cys Ala Val Thr Lys Ala Leu Gly Leu Asp Pro
325 330 335
Ala Lys Val Asn Pro Asn Gly Ser Gly Ile Ser Leu Gly His Pro Ile
340 345 350
Gly Ala Thr Gly Ala Leu Ile Thr Val Lys Ala Leu His Glu Leu Asn
355 360 365
Arg Val Gln Gly Arg Tyr Ala Leu Val Thr Met Cys Ile Gly Gly Gly
370 375 380
Gln Gly Ile Ala Ala Ile Phe Glu Arg Ile Gly Ser
385 390 395
<210> 45
<211> 858
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(858)
<223> 人工PaaH1: 3-羟基酰基辅酶A脱氢酶核苷酸序列
<400> 45
atgtccatca gaactgtcgg tattgttggt gctggtacta tgggtaacgg tattgctcaa 60
gcctgtgctg tcgtcggttt gaacgtcgtc atggtcgaca tttctgacgc tgctgttcaa 120
aagggtgttg ctactgtcgc ttcctctttg gacagattaa ttaagaagga aaagttgacc 180
gaagccgaca aggcctctgc cttggccaga attaagggtt ccacttctta tgacgacttg 240
aaagctaccg acattgttat cgaagctgct actgaaaact acgatttgaa agttaagatc 300
ttgaagcaaa ttgatggtat cgtcggtgag aacgtcatta ttgcttctaa cacttcctcc 360
atttctatca ctaaattagc cgccgtcacc tctagagccg acagatttat cggtatgcac 420
ttctttaatc cagttccagt catggctttg gtcgaattaa ttagaggttt gcaaacctcc 480
gacaccaccc acgccgccgt tgaagctttg tctaagcaat tgggtaagta cccaatcacc 540
gttaaaaatt ccccaggttt cgttgtcaac cgtattttgt gcccaatgat caatgaagct 600
ttctgtgtct tgggtgaggg tttggcctcc ccagaagaaa tcgatgaagg tatgaagtta 660
ggttgtaacc accctattgg tcctttagcc ttggccgaca tgatcggttt agacactatg 720
ttggccgtta tggaagtctt gtacactgaa ttcgctgacc caaagtacag accagctatg 780
ttaatgagag aaatggttgc tgccggttat ttgggtagaa agactggtcg tggtgtttat 840
gtctactcta aagggatc 858
<210> 46
<211> 286
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(286)
<223> 工程化的PaaH1: 3-羟基酰基辅酶A脱氢酶
<400> 46
Met Ser Ile Arg Thr Val Gly Ile Val Gly Ala Gly Thr Met Gly Asn
1 5 10 15
Gly Ile Ala Gln Ala Cys Ala Val Val Gly Leu Asn Val Val Met Val
20 25 30
Asp Ile Ser Asp Ala Ala Val Gln Lys Gly Val Ala Thr Val Ala Ser
35 40 45
Ser Leu Asp Arg Leu Ile Lys Lys Glu Lys Leu Thr Glu Ala Asp Lys
50 55 60
Ala Ser Ala Leu Ala Arg Ile Lys Gly Ser Thr Ser Tyr Asp Asp Leu
65 70 75 80
Lys Ala Thr Asp Ile Val Ile Glu Ala Ala Thr Glu Asn Tyr Asp Leu
85 90 95
Lys Val Lys Ile Leu Lys Gln Ile Asp Gly Ile Val Gly Glu Asn Val
100 105 110
Ile Ile Ala Ser Asn Thr Ser Ser Ile Ser Ile Thr Lys Leu Ala Ala
115 120 125
Val Thr Ser Arg Ala Asp Arg Phe Ile Gly Met His Phe Phe Asn Pro
130 135 140
Val Pro Val Met Ala Leu Val Glu Leu Ile Arg Gly Leu Gln Thr Ser
145 150 155 160
Asp Thr Thr His Ala Ala Val Glu Ala Leu Ser Lys Gln Leu Gly Lys
165 170 175
Tyr Pro Ile Thr Val Lys Asn Ser Pro Gly Phe Val Val Asn Arg Ile
180 185 190
Leu Cys Pro Met Ile Asn Glu Ala Phe Cys Val Leu Gly Glu Gly Leu
195 200 205
Ala Ser Pro Glu Glu Ile Asp Glu Gly Met Lys Leu Gly Cys Asn His
210 215 220
Pro Ile Gly Pro Leu Ala Leu Ala Asp Met Ile Gly Leu Asp Thr Met
225 230 235 240
Leu Ala Val Met Glu Val Leu Tyr Thr Glu Phe Ala Asp Pro Lys Tyr
245 250 255
Arg Pro Ala Met Leu Met Arg Glu Met Val Ala Ala Gly Tyr Leu Gly
260 265 270
Arg Lys Thr Gly Arg Gly Val Tyr Val Tyr Ser Lys Gly Ile
275 280 285
<210> 47
<211> 792
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(792)
<223> 人工巴豆酸酶(Crt)核苷酸序列
<400> 47
atggaattga acaacgttat tttggaaaag gaaggtaagg tcgctgtcgt tactatcaac 60
agaccaaagg ctttaaacgc tttgaactct gacaccttga aagaaatgga ttatgttatc 120
ggtgaaatcg aaaatgactc tgaagttttg gccgttatct tgactggtgc tggtgaaaaa 180
tctttcgttg ctggtgctga catttctgaa atgaaggaga tgaataccat tgaaggtaga 240
aagttcggta tcttgggtaa caaggttttt agaagattgg aattgttgga aaaaccagtc 300
atcgctgctg ttaacggttt cgctttaggt ggtggttgtg aaatcgctat gtcctgtgac 360
attcgtatcg cctcctccaa tgctagattc ggtcaaccag aagttggttt aggtattact 420
ccaggtttcg gtggtaccca aagattgtct agattggtcg gtatgggtat ggctaagcaa 480
ttaattttca ctgctcaaaa cattaaggct gatgaagcct tacgtattgg tttggtcaac 540
aaggtcgttg aaccatctga attgatgaat accgctaagg aaattgctaa caaaattgtt 600
tctaatgccc cagttgctgt caagttgtcc aagcaagcta ttaacagagg tatgcaatgt 660
gatattgaca ctgctttggc tttcgaatcc gaagcttttg gtgaatgttt ttctaccgaa 720
gatcaaaagg atgctatgac cgctttcatc gagaagagaa agatcgaagg tttcaaaaac 780
agaggatcct aa 792
<210> 48
<211> 263
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(263)
<223> 工程化的巴豆酸酶(Crt)
<400> 48
Met Glu Leu Asn Asn Val Ile Leu Glu Lys Glu Gly Lys Val Ala Val
1 5 10 15
Val Thr Ile Asn Arg Pro Lys Ala Leu Asn Ala Leu Asn Ser Asp Thr
20 25 30
Leu Lys Glu Met Asp Tyr Val Ile Gly Glu Ile Glu Asn Asp Ser Glu
35 40 45
Val Leu Ala Val Ile Leu Thr Gly Ala Gly Glu Lys Ser Phe Val Ala
50 55 60
Gly Ala Asp Ile Ser Glu Met Lys Glu Met Asn Thr Ile Glu Gly Arg
65 70 75 80
Lys Phe Gly Ile Leu Gly Asn Lys Val Phe Arg Arg Leu Glu Leu Leu
85 90 95
Glu Lys Pro Val Ile Ala Ala Val Asn Gly Phe Ala Leu Gly Gly Gly
100 105 110
Cys Glu Ile Ala Met Ser Cys Asp Ile Arg Ile Ala Ser Ser Asn Ala
115 120 125
Arg Phe Gly Gln Pro Glu Val Gly Leu Gly Ile Thr Pro Gly Phe Gly
130 135 140
Gly Thr Gln Arg Leu Ser Arg Leu Val Gly Met Gly Met Ala Lys Gln
145 150 155 160
Leu Ile Phe Thr Ala Gln Asn Ile Lys Ala Asp Glu Ala Leu Arg Ile
165 170 175
Gly Leu Val Asn Lys Val Val Glu Pro Ser Glu Leu Met Asn Thr Ala
180 185 190
Lys Glu Ile Ala Asn Lys Ile Val Ser Asn Ala Pro Val Ala Val Lys
195 200 205
Leu Ser Lys Gln Ala Ile Asn Arg Gly Met Gln Cys Asp Ile Asp Thr
210 215 220
Ala Leu Ala Phe Glu Ser Glu Ala Phe Gly Glu Cys Phe Ser Thr Glu
225 230 235 240
Asp Gln Lys Asp Ala Met Thr Ala Phe Ile Glu Lys Arg Lys Ile Glu
245 250 255
Gly Phe Lys Asn Arg Gly Ser
260
<210> 49
<211> 1200
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(1200)
<223> 人工Ter: 反式-2-烯酰辅酶A还原酶核苷酸序列
<400> 49
atgattgtca aaccaatggt tcgtaacaac atttgtttaa atgcccaccc acaaggttgt 60
aagaagggtg ttgaagatca aatcgaatac actaaaaaga gaattaccgc tgaagttaaa 120
gctggtgcta aggccccaaa gaacgttttg gttttgggtt gttccaacgg ttacggtttg 180
gcctccagaa ttactgctgc ttttggttac ggtgccgcta ccatcggtgt ctctttcgaa 240
aaggccggtt ccgaaactaa gtacggtact ccaggttggt acaataactt ggctttcgat 300
gaagctgcta agagagaagg tttgtattcc gttactattg acggtgatgc cttttctgac 360
gaaatcaaag ctcaagtcat cgaagaagcc aaaaagaaag gtatcaagtt cgatttgatt 420
gtctactctt tagcctctcc tgttagaact gatccagata ctggtattat gcacaaatcc 480
gttttgaagc cattcggtaa gaccttcact ggtaaaactg tcgatccttt cactggtgaa 540
ttaaaggaaa tctctgctga acctgccaac gacgaagaag ctgctgccac tgttaaggtt 600
atgggtggtg aagactggga aagatggatc aagcaattat ctaaggaagg tttgttggaa 660
gaaggttgta tcaccttggc ttactcttac atcggtccag aagctaccca agctttgtac 720
agaaagggta ccattggtaa ggctaaagaa cacttggagg ctactgctca tagattgaac 780
aaggaaaatc catccatcag agcctttgtt tccgtcaata aaggtttggt cactagagcc 840
tctgccgtca ttccagttat ccctttatac ttggcttctt tgtttaaagt catgaaggaa 900
aagggtaacc atgaaggttg tatcgaacaa atcactcgtt tgtacgctga acgtttatac 960
agaaaggacg gtaccatccc tgtcgatgaa gaaaacagaa tcagaatcga cgattgggaa 1020
ttggaagaag atgttcaaaa agccgtttcc gccttgatgg aaaaggtcac cggtgaaaat 1080
gccgaatcct tgactgactt agctggttac agacatgact ttttagcttc taatggtttc 1140
gatgttgaag gtattaacta tgaggctgaa gtcgaaagat ttgacagaat cggatcctaa 1200
<210> 50
<211> 399
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(399)
<223> 工程化的Ter: 反式-2-烯酰辅酶A还原酶
<400> 50
Met Ile Val Lys Pro Met Val Arg Asn Asn Ile Cys Leu Asn Ala His
1 5 10 15
Pro Gln Gly Cys Lys Lys Gly Val Glu Asp Gln Ile Glu Tyr Thr Lys
20 25 30
Lys Arg Ile Thr Ala Glu Val Lys Ala Gly Ala Lys Ala Pro Lys Asn
35 40 45
Val Leu Val Leu Gly Cys Ser Asn Gly Tyr Gly Leu Ala Ser Arg Ile
50 55 60
Thr Ala Ala Phe Gly Tyr Gly Ala Ala Thr Ile Gly Val Ser Phe Glu
65 70 75 80
Lys Ala Gly Ser Glu Thr Lys Tyr Gly Thr Pro Gly Trp Tyr Asn Asn
85 90 95
Leu Ala Phe Asp Glu Ala Ala Lys Arg Glu Gly Leu Tyr Ser Val Thr
100 105 110
Ile Asp Gly Asp Ala Phe Ser Asp Glu Ile Lys Ala Gln Val Ile Glu
115 120 125
Glu Ala Lys Lys Lys Gly Ile Lys Phe Asp Leu Ile Val Tyr Ser Leu
130 135 140
Ala Ser Pro Val Arg Thr Asp Pro Asp Thr Gly Ile Met His Lys Ser
145 150 155 160
Val Leu Lys Pro Phe Gly Lys Thr Phe Thr Gly Lys Thr Val Asp Pro
165 170 175
Phe Thr Gly Glu Leu Lys Glu Ile Ser Ala Glu Pro Ala Asn Asp Glu
180 185 190
Glu Ala Ala Ala Thr Val Lys Val Met Gly Gly Glu Asp Trp Glu Arg
195 200 205
Trp Ile Lys Gln Leu Ser Lys Glu Gly Leu Leu Glu Glu Gly Cys Ile
210 215 220
Thr Leu Ala Tyr Ser Tyr Ile Gly Pro Glu Ala Thr Gln Ala Leu Tyr
225 230 235 240
Arg Lys Gly Thr Ile Gly Lys Ala Lys Glu His Leu Glu Ala Thr Ala
245 250 255
His Arg Leu Asn Lys Glu Asn Pro Ser Ile Arg Ala Phe Val Ser Val
260 265 270
Asn Lys Gly Leu Val Thr Arg Ala Ser Ala Val Ile Pro Val Ile Pro
275 280 285
Leu Tyr Leu Ala Ser Leu Phe Lys Val Met Lys Glu Lys Gly Asn His
290 295 300
Glu Gly Cys Ile Glu Gln Ile Thr Arg Leu Tyr Ala Glu Arg Leu Tyr
305 310 315 320
Arg Lys Asp Gly Thr Ile Pro Val Asp Glu Glu Asn Arg Ile Arg Ile
325 330 335
Asp Asp Trp Glu Leu Glu Glu Asp Val Gln Lys Ala Val Ser Ala Leu
340 345 350
Met Glu Lys Val Thr Gly Glu Asn Ala Glu Ser Leu Thr Asp Leu Ala
355 360 365
Gly Tyr Arg His Asp Phe Leu Ala Ser Asn Gly Phe Asp Val Glu Gly
370 375 380
Ile Asn Tyr Glu Ala Glu Val Glu Arg Phe Asp Arg Ile Gly Ser
385 390 395
<210> 51
<211> 812
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(812)
<223> 截短的3-羟基-3-甲基-戊二酰辅酶A还原酶(tHMG1)
<400> 51
atggcgcgtg accaattggt gaaaactgaa gtcaccaaga agtcttttac tgctcctgta 60
caaaaggctt ctacaccagt tttaaccaat aaaacagtca tttctggatc gaaagtcaaa 120
agtttatcat ctgcgcaatc gagctcatca ggaccttcat catctagtga ggaagatgat 180
tcccgcgata ttgaaagctt ggataagaaa atacgtcctt tagaagaatt agaagcatta 240
ttaagtagtg gaaatacaaa acaattgaag aacaaagagg tcgctgcctt ggttattcac 300
ggtaagttac ctttgtacgc tttggagaaa aaattaggtg atactacgag agcggttgcg 360
gtacgtagga aggctctttc aattttggca gaagctcctg tattagcatc tgatcgttta 420
ccatataaaa attatgacta cgaccgcgta tttggcgctt gttgtgaaaa tgttataggt 480
tacatgcctt tgcccgttgg tgttataggc cccttggtta tcgatggtac atcttatcat 540
ataccaatgg caactacaga gggttgtttg gtagcttctg ccatgcgtgg ctgtaaggca 600
atcaatgctg gcggtggtgc aacaactgtt ttaactaagg atggtatgac aagaggccca 660
gtagtccgtt tcccaacttt gaaaagatct ggtgcctgta agatatggtt agactcagaa 720
gagggacaaa acgcaattaa aaaagctttt aactctacat caagatttgc acgtctgcaa 780
catattcaaa cttgtctagc aggagatttg tt 812
<210> 52
<211> 270
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(270)
<223> 截短的3-羟基-3-甲基-戊二酰辅酶A还原酶(tHMG1)
<400> 52
Met Ala Arg Asp Gln Leu Val Lys Thr Glu Val Thr Lys Lys Ser Phe
1 5 10 15
Thr Ala Pro Val Gln Lys Ala Ser Thr Pro Val Leu Thr Asn Lys Thr
20 25 30
Val Ile Ser Gly Ser Lys Val Lys Ser Leu Ser Ser Ala Gln Ser Ser
35 40 45
Ser Ser Gly Pro Ser Ser Ser Ser Glu Glu Asp Asp Ser Arg Asp Ile
50 55 60
Glu Ser Leu Asp Lys Lys Ile Arg Pro Leu Glu Glu Leu Glu Ala Leu
65 70 75 80
Leu Ser Ser Gly Asn Thr Lys Gln Leu Lys Asn Lys Glu Val Ala Ala
85 90 95
Leu Val Ile His Gly Lys Leu Pro Leu Tyr Ala Leu Glu Lys Lys Leu
100 105 110
Gly Asp Thr Thr Arg Ala Val Ala Val Arg Arg Lys Ala Leu Ser Ile
115 120 125
Leu Ala Glu Ala Pro Val Leu Ala Ser Asp Arg Leu Pro Tyr Lys Asn
130 135 140
Tyr Asp Tyr Asp Arg Val Phe Gly Ala Cys Cys Glu Asn Val Ile Gly
145 150 155 160
Tyr Met Pro Leu Pro Val Gly Val Ile Gly Pro Leu Val Ile Asp Gly
165 170 175
Thr Ser Tyr His Ile Pro Met Ala Thr Thr Glu Gly Cys Leu Val Ala
180 185 190
Ser Ala Met Arg Gly Cys Lys Ala Ile Asn Ala Gly Gly Gly Ala Thr
195 200 205
Thr Val Leu Thr Lys Asp Gly Met Thr Arg Gly Pro Val Val Arg Phe
210 215 220
Pro Thr Leu Lys Arg Ser Gly Ala Cys Lys Ile Trp Leu Asp Ser Glu
225 230 235 240
Glu Gly Gln Asn Ala Ile Lys Lys Ala Phe Asn Ser Thr Ser Arg Phe
245 250 255
Ala Arg Leu Gln His Ile Gln Thr Cys Leu Ala Gly Asp Leu
260 265 270
<210> 53
<211> 2412
<212> DNA
<213> Enterococcus sp.
<400> 53
atgaagactg tcgttatcat agatgccttg agaacaccaa tcggtaaata caaaggttca 60
ttatcccaag tttccgccgt tgacttaggt actcatgtta ctacacaatt gttgaagaga 120
cactccacaa tcagtgaaga aatcgatcaa gtcatattcg gtaacgtatt gcaagctggt 180
aatggtcaaa acccagccag acaaatagct atcaattctg gtttatcaca tgaaattcct 240
gctatgacag taaacgaagt ttgtggttca ggcatgaaag cagtcatttt ggccaagcaa 300
ttgatacaat taggtgaagc agaagtttta atcgccggtg gtatagaaaa catgagtcaa 360
gctccaaaat tgcaaagatt caattacgaa actgaatctt acgatgcacc tttctcttcg 420
atgatgtatg atggtttgac tgacgctttt tctggtcaag caatgggttt aacagctgaa 480
aatgtcgcag aaaagtacca tgtaaccaga gaagaacaag atcaattttc cgttcacagt 540
caattaaaag ctgcacaagc acaagccgaa ggtattttcg ccgacgaaat agctccattg 600
gaagtttctg gtacattagt cgaaaaggat gaaggtatta gacctaactc cagtgttgaa 660
aaattgggta ctttgaagac agtattcaag gaagacggta cagttaccgc tggtaatgcc 720
tctaccatta acgatggtgc tagtgcattg attatagctt ctcaagaata tgccgaagct 780
catggtttgc catacttagc tatcattaga gatagtgtag aagttggtat tgacccagca 840
tacatgggta tctctcctat aaaagcaatc caaaagttgt tagccagaaa ccaattgacc 900
actgaagaaa ttgatttgta cgaaattaac gaagcatttg ccgctacatc aatcgttgtc 960
caaagagaat tggcattgcc agaagaaaag gttaacatct atggtggtgg tatctccttg 1020
ggtcacgcta taggtgcaac cggtgccaga ttgttgactt ccttaagtta ccaattgaac 1080
caaaaggaaa agaaatacgg tgttgcttct ttatgcattg gtggtggttt gggtttagca 1140
atgttgttag aaagaccaca acaaaagaaa aattctagat tctaccaaat gtcccctgaa 1200
gaaagattgg cctcattgtt aaatgaaggt caaatttccg cagatactaa gaaagaattt 1260
gaaaacaccg ctttatcttc acaaatcgca aaccatatga tcgaaaacca aatctctgaa 1320
acagaagttc caatgggtgt cggtttgcac ttaactgtcg atgaaacaga ctatttggta 1380
ccaatggcta ccgaagaacc tagtgttatc gcagccttat ctaatggtgc taagatagca 1440
caaggtttta agactgttaa ccaacaaaga ttgatgagag gtcaaatcgt attctacgat 1500
gttgctgacc cagaatcatt aatcgataag ttgcaagtaa gagaagccga agtttttcaa 1560
caagctgaat tgtcttaccc ttcaatagtt aagagaggtg gtggtttgag agatttgcaa 1620
tacagaactt ttgacgaatc cttcgtcagt gtagatttct tagttgatgt caaggacgcc 1680
atgggtgcta atattgttaa cgcaatgttg gaaggtgtcg ccgaattgtt tagagaatgg 1740
ttcgctgaac aaaagatttt gttttctatc ttgtcaaact acgctacaga atctgtagtt 1800
accatgaaaa ctgcaattcc agtttccaga ttgagtaagg gttctaacgg tagagaaatc 1860
gctgaaaaga ttgttttggc atcaagatat gcctccttag acccttacag agctgttact 1920
cataataagg gtataatgaa cggtatcgaa gctgtcgtat tagcaaccgg taatgatact 1980
agagcagtat ctgcctcatg tcacgcattc gccgttaagg aaggtagata ccaaggtttg 2040
acatcatgga ccttggatgg tgaacaatta attggtgaaa tatccgttcc attggcttta 2100
gcaactgttg gtggtgctac aaaagtcttg cctaagagtc aagctgcagc cgatttgtta 2160
gccgtcactg acgctaagga attgtctaga gttgtcgctg cagtaggttt agctcaaaat 2220
ttggccgctt taagagcatt ggtttcagaa ggtattcaaa aaggtcatat ggctttgcaa 2280
gcaagatcct tagccatgac agttggtgct accggtaaag aagtcgaagc cgtagctcaa 2340
caattaaaaa gacaaaagac aatgaaccaa gacagagcaa tggctatatt aaacgatttg 2400
agaaagcaat aa 2412
<210> 54
<211> 803
<212> PRT
<213> Enterococcus sp.
<400> 54
Met Lys Thr Val Val Ile Ile Asp Ala Leu Arg Thr Pro Ile Gly Lys
1 5 10 15
Tyr Lys Gly Ser Leu Ser Gln Val Ser Ala Val Asp Leu Gly Thr His
20 25 30
Val Thr Thr Gln Leu Leu Lys Arg His Ser Thr Ile Ser Glu Glu Ile
35 40 45
Asp Gln Val Ile Phe Gly Asn Val Leu Gln Ala Gly Asn Gly Gln Asn
50 55 60
Pro Ala Arg Gln Ile Ala Ile Asn Ser Gly Leu Ser His Glu Ile Pro
65 70 75 80
Ala Met Thr Val Asn Glu Val Cys Gly Ser Gly Met Lys Ala Val Ile
85 90 95
Leu Ala Lys Gln Leu Ile Gln Leu Gly Glu Ala Glu Val Leu Ile Ala
100 105 110
Gly Gly Ile Glu Asn Met Ser Gln Ala Pro Lys Leu Gln Arg Phe Asn
115 120 125
Tyr Glu Thr Glu Ser Tyr Asp Ala Pro Phe Ser Ser Met Met Tyr Asp
130 135 140
Gly Leu Thr Asp Ala Phe Ser Gly Gln Ala Met Gly Leu Thr Ala Glu
145 150 155 160
Asn Val Ala Glu Lys Tyr His Val Thr Arg Glu Glu Gln Asp Gln Phe
165 170 175
Ser Val His Ser Gln Leu Lys Ala Ala Gln Ala Gln Ala Glu Gly Ile
180 185 190
Phe Ala Asp Glu Ile Ala Pro Leu Glu Val Ser Gly Thr Leu Val Glu
195 200 205
Lys Asp Glu Gly Ile Arg Pro Asn Ser Ser Val Glu Lys Leu Gly Thr
210 215 220
Leu Lys Thr Val Phe Lys Glu Asp Gly Thr Val Thr Ala Gly Asn Ala
225 230 235 240
Ser Thr Ile Asn Asp Gly Ala Ser Ala Leu Ile Ile Ala Ser Gln Glu
245 250 255
Tyr Ala Glu Ala His Gly Leu Pro Tyr Leu Ala Ile Ile Arg Asp Ser
260 265 270
Val Glu Val Gly Ile Asp Pro Ala Tyr Met Gly Ile Ser Pro Ile Lys
275 280 285
Ala Ile Gln Lys Leu Leu Ala Arg Asn Gln Leu Thr Thr Glu Glu Ile
290 295 300
Asp Leu Tyr Glu Ile Asn Glu Ala Phe Ala Ala Thr Ser Ile Val Val
305 310 315 320
Gln Arg Glu Leu Ala Leu Pro Glu Glu Lys Val Asn Ile Tyr Gly Gly
325 330 335
Gly Ile Ser Leu Gly His Ala Ile Gly Ala Thr Gly Ala Arg Leu Leu
340 345 350
Thr Ser Leu Ser Tyr Gln Leu Asn Gln Lys Glu Lys Lys Tyr Gly Val
355 360 365
Ala Ser Leu Cys Ile Gly Gly Gly Leu Gly Leu Ala Met Leu Leu Glu
370 375 380
Arg Pro Gln Gln Lys Lys Asn Ser Arg Phe Tyr Gln Met Ser Pro Glu
385 390 395 400
Glu Arg Leu Ala Ser Leu Leu Asn Glu Gly Gln Ile Ser Ala Asp Thr
405 410 415
Lys Lys Glu Phe Glu Asn Thr Ala Leu Ser Ser Gln Ile Ala Asn His
420 425 430
Met Ile Glu Asn Gln Ile Ser Glu Thr Glu Val Pro Met Gly Val Gly
435 440 445
Leu His Leu Thr Val Asp Glu Thr Asp Tyr Leu Val Pro Met Ala Thr
450 455 460
Glu Glu Pro Ser Val Ile Ala Ala Leu Ser Asn Gly Ala Lys Ile Ala
465 470 475 480
Gln Gly Phe Lys Thr Val Asn Gln Gln Arg Leu Met Arg Gly Gln Ile
485 490 495
Val Phe Tyr Asp Val Ala Asp Pro Glu Ser Leu Ile Asp Lys Leu Gln
500 505 510
Val Arg Glu Ala Glu Val Phe Gln Gln Ala Glu Leu Ser Tyr Pro Ser
515 520 525
Ile Val Lys Arg Gly Gly Gly Leu Arg Asp Leu Gln Tyr Arg Thr Phe
530 535 540
Asp Glu Ser Phe Val Ser Val Asp Phe Leu Val Asp Val Lys Asp Ala
545 550 555 560
Met Gly Ala Asn Ile Val Asn Ala Met Leu Glu Gly Val Ala Glu Leu
565 570 575
Phe Arg Glu Trp Phe Ala Glu Gln Lys Ile Leu Phe Ser Ile Leu Ser
580 585 590
Asn Tyr Ala Thr Glu Ser Val Val Thr Met Lys Thr Ala Ile Pro Val
595 600 605
Ser Arg Leu Ser Lys Gly Ser Asn Gly Arg Glu Ile Ala Glu Lys Ile
610 615 620
Val Leu Ala Ser Arg Tyr Ala Ser Leu Asp Pro Tyr Arg Ala Val Thr
625 630 635 640
His Asn Lys Gly Ile Met Asn Gly Ile Glu Ala Val Val Leu Ala Thr
645 650 655
Gly Asn Asp Thr Arg Ala Val Ser Ala Ser Cys His Ala Phe Ala Val
660 665 670
Lys Glu Gly Arg Tyr Gln Gly Leu Thr Ser Trp Thr Leu Asp Gly Glu
675 680 685
Gln Leu Ile Gly Glu Ile Ser Val Pro Leu Ala Leu Ala Thr Val Gly
690 695 700
Gly Ala Thr Lys Val Leu Pro Lys Ser Gln Ala Ala Ala Asp Leu Leu
705 710 715 720
Ala Val Thr Asp Ala Lys Glu Leu Ser Arg Val Val Ala Ala Val Gly
725 730 735
Leu Ala Gln Asn Leu Ala Ala Leu Arg Ala Leu Val Ser Glu Gly Ile
740 745 750
Gln Lys Gly His Met Ala Leu Gln Ala Arg Ser Leu Ala Met Thr Val
755 760 765
Gly Ala Thr Gly Lys Glu Val Glu Ala Val Ala Gln Gln Leu Lys Arg
770 775 780
Gln Lys Thr Met Asn Gln Asp Arg Ala Met Ala Ile Leu Asn Asp Leu
785 790 795 800
Arg Lys Gln
<210> 55
<211> 1152
<212> DNA
<213> Enterococcus sp.
<400> 55
atgacaattg ggattgataa aattagtttt tttgtgcccc cttattatat tgatatgacg 60
gcactggctg aagccagaaa tgtagaccct ggaaaatttc atattggtat tgggcaagac 120
caaatggcgg tgaacccaat cagccaagat attgtgacat ttgcagccaa tgccgcagaa 180
gcgatcttga ccaaagaaga taaagaggcc attgatatgg tgattgtcgg gactgagtcc 240
agtatcgatg agtcaaaagc ggccgcagtt gtcttacatc gtttaatggg gattcaacct 300
ttcgctcgct ctttcgaaat caaggaagct tgttacggag caacagcagg cttacagtta 360
gctaagaatc acgtagcctt acatccagat aaaaaagtct tggtcgtagc ggcagatatt 420
gcaaaatatg gcttaaattc tggcggtgag cctacacaag gagctggggc ggttgcaatg 480
ttagttgcta gtgaaccgcg cattttggct ttaaaagagg ataatgtgat gctgacgcaa 540
gatatctatg acttttggcg tccaacaggc cacccgtatc ctatggtcga tggtcctttg 600
tcaaacgaaa cctacatcca atcttttgcc caagtctggg atgaacataa aaaacgaacc 660
ggtcttgatt ttgcagatta tgatgcttta gcgttccata ttccttacac aaaaatgggc 720
aaaaaagcct tattagcaaa aatctccgac caaactgaag cagaacagga acgaatttta 780
gcccgttatg aagaaagtat cgtctatagt cgtcgcgtag gaaacttgta tacgggttca 840
ctttatctgg gactcatttc ccttttagaa aatgcaacga ctttaaccgc aggcaatcaa 900
attggtttat tcagttatgg ttctggtgct gtcgctgaat ttttcactgg tgaattagta 960
gctggttatc aaaatcattt acaaaaagaa actcatttag cactgctgga taatcggaca 1020
gaactttcta tcgctgaata tgaagccatg tttgcagaaa ctttagacac agacattgat 1080
caaacgttag aagatgaatt aaaatatagt atttctgcta ttaataatac cgttcgttct 1140
tatcgaaact aa 1152
<210> 56
<211> 383
<212> PRT
<213> Enterococcus sp.
<400> 56
Met Thr Ile Gly Ile Asp Lys Ile Ser Phe Phe Val Pro Pro Tyr Tyr
1 5 10 15
Ile Asp Met Thr Ala Leu Ala Glu Ala Arg Asn Val Asp Pro Gly Lys
20 25 30
Phe His Ile Gly Ile Gly Gln Asp Gln Met Ala Val Asn Pro Ile Ser
35 40 45
Gln Asp Ile Val Thr Phe Ala Ala Asn Ala Ala Glu Ala Ile Leu Thr
50 55 60
Lys Glu Asp Lys Glu Ala Ile Asp Met Val Ile Val Gly Thr Glu Ser
65 70 75 80
Ser Ile Asp Glu Ser Lys Ala Ala Ala Val Val Leu His Arg Leu Met
85 90 95
Gly Ile Gln Pro Phe Ala Arg Ser Phe Glu Ile Lys Glu Ala Cys Tyr
100 105 110
Gly Ala Thr Ala Gly Leu Gln Leu Ala Lys Asn His Val Ala Leu His
115 120 125
Pro Asp Lys Lys Val Leu Val Val Ala Ala Asp Ile Ala Lys Tyr Gly
130 135 140
Leu Asn Ser Gly Gly Glu Pro Thr Gln Gly Ala Gly Ala Val Ala Met
145 150 155 160
Leu Val Ala Ser Glu Pro Arg Ile Leu Ala Leu Lys Glu Asp Asn Val
165 170 175
Met Leu Thr Gln Asp Ile Tyr Asp Phe Trp Arg Pro Thr Gly His Pro
180 185 190
Tyr Pro Met Val Asp Gly Pro Leu Ser Asn Glu Thr Tyr Ile Gln Ser
195 200 205
Phe Ala Gln Val Trp Asp Glu His Lys Lys Arg Thr Gly Leu Asp Phe
210 215 220
Ala Asp Tyr Asp Ala Leu Ala Phe His Ile Pro Tyr Thr Lys Met Gly
225 230 235 240
Lys Lys Ala Leu Leu Ala Lys Ile Ser Asp Gln Thr Glu Ala Glu Gln
245 250 255
Glu Arg Ile Leu Ala Arg Tyr Glu Glu Ser Ile Val Tyr Ser Arg Arg
260 265 270
Val Gly Asn Leu Tyr Thr Gly Ser Leu Tyr Leu Gly Leu Ile Ser Leu
275 280 285
Leu Glu Asn Ala Thr Thr Leu Thr Ala Gly Asn Gln Ile Gly Leu Phe
290 295 300
Ser Tyr Gly Ser Gly Ala Val Ala Glu Phe Phe Thr Gly Glu Leu Val
305 310 315 320
Ala Gly Tyr Gln Asn His Leu Gln Lys Glu Thr His Leu Ala Leu Leu
325 330 335
Asp Asn Arg Thr Glu Leu Ser Ile Ala Glu Tyr Glu Ala Met Phe Ala
340 345 350
Glu Thr Leu Asp Thr Asp Ile Asp Gln Thr Leu Glu Asp Glu Leu Lys
355 360 365
Tyr Ser Ile Ser Ala Ile Asn Asn Thr Val Arg Ser Tyr Arg Asn
370 375 380
<210> 57
<211> 867
<212> DNA
<213> Saccharomyces sp.
<400> 57
atgactgccg acaacaatag tatgccccat ggtgcagtat ctagttacgc caaattagtg 60
caaaaccaaa cacctgaaga cattttggaa gagtttcctg aaattattcc attacaacaa 120
agacctaata cccgatctag tgagacgtca aatgacgaaa gcggagaaac atgtttttct 180
ggtcatgatg aggagcaaat taagttaatg aatgaaaatt gtattgtttt ggattgggac 240
gataatgcta ttggtgccgg taccaagaaa gtttgtcatt taatggaaaa tattgaaaag 300
ggtttactac atcgtgcatt ctccgtcttt attttcaatg aacaaggtga attactttta 360
caacaaagag ccactgaaaa aataactttc cctgatcttt ggactaacac atgctgctct 420
catccactat gtattgatga cgaattaggt ttgaagggta agctagacga taagattaag 480
ggcgctatta ctgcggcggt gagaaaacta gatcatgaat taggtattcc agaagatgaa 540
actaagacaa ggggtaagtt tcacttttta aacagaatcc attacatggc accaagcaat 600
gaaccatggg gtgaacatga aattgattac atcctatttt ataagatcaa cgctaaagaa 660
aacttgactg tcaacccaaa cgtcaatgaa gttagagact tcaaatgggt ttcaccaaat 720
gatttgaaaa ctatgtttgc tgacccaagt tacaagttta cgccttggtt taagattatt 780
tgcgagaatt acttattcaa ctggtgggag caattagatg acctttctga agtggaaaat 840
gacaggcaaa ttcatagaat gctataa 867
<210> 58
<211> 288
<212> PRT
<213> Saccharomyces sp.
<400> 58
Met Thr Ala Asp Asn Asn Ser Met Pro His Gly Ala Val Ser Ser Tyr
1 5 10 15
Ala Lys Leu Val Gln Asn Gln Thr Pro Glu Asp Ile Leu Glu Glu Phe
20 25 30
Pro Glu Ile Ile Pro Leu Gln Gln Arg Pro Asn Thr Arg Ser Ser Glu
35 40 45
Thr Ser Asn Asp Glu Ser Gly Glu Thr Cys Phe Ser Gly His Asp Glu
50 55 60
Glu Gln Ile Lys Leu Met Asn Glu Asn Cys Ile Val Leu Asp Trp Asp
65 70 75 80
Asp Asn Ala Ile Gly Ala Gly Thr Lys Lys Val Cys His Leu Met Glu
85 90 95
Asn Ile Glu Lys Gly Leu Leu His Arg Ala Phe Ser Val Phe Ile Phe
100 105 110
Asn Glu Gln Gly Glu Leu Leu Leu Gln Gln Arg Ala Thr Glu Lys Ile
115 120 125
Thr Phe Pro Asp Leu Trp Thr Asn Thr Cys Cys Ser His Pro Leu Cys
130 135 140
Ile Asp Asp Glu Leu Gly Leu Lys Gly Lys Leu Asp Asp Lys Ile Lys
145 150 155 160
Gly Ala Ile Thr Ala Ala Val Arg Lys Leu Asp His Glu Leu Gly Ile
165 170 175
Pro Glu Asp Glu Thr Lys Thr Arg Gly Lys Phe His Phe Leu Asn Arg
180 185 190
Ile His Tyr Met Ala Pro Ser Asn Glu Pro Trp Gly Glu His Glu Ile
195 200 205
Asp Tyr Ile Leu Phe Tyr Lys Ile Asn Ala Lys Glu Asn Leu Thr Val
210 215 220
Asn Pro Asn Val Asn Glu Val Arg Asp Phe Lys Trp Val Ser Pro Asn
225 230 235 240
Asp Leu Lys Thr Met Phe Ala Asp Pro Ser Tyr Lys Phe Thr Pro Trp
245 250 255
Phe Lys Ile Ile Cys Glu Asn Tyr Leu Phe Asn Trp Trp Glu Gln Leu
260 265 270
Asp Asp Leu Ser Glu Val Glu Asn Asp Arg Gln Ile His Arg Met Leu
275 280 285
<210> 59
<211> 1059
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(1059)
<223> 突变的法呢基焦磷酸合成酶 (Erg20mut, F96W, N127W)
<400> 59
atggcttcag aaaaagaaat taggagagag agattcttga acgttttccc taaattagta 60
gaggaattga acgcatcgct tttggcttac ggtatgccta aggaagcatg tgactggtat 120
gcccactcat tgaactacaa cactccaggc ggtaagctaa atagaggttt gtccgttgtg 180
gacacgtatg ctattctctc caacaagacc gttgaacaat tggggcaaga agaatacgaa 240
aaggttgcca ttctaggttg gtgcattgag ttgttgcagg cttactggtt ggtcgccgat 300
gatatgatgg acaagtccat taccagaaga ggccaaccat gttggtacaa ggttcctgaa 360
gttggggaaa ttgccatctg ggacgcattc atgttagagg ctgctatcta caagcttttg 420
aaatctcact tcagaaacga aaaatactac atagatatca ccgaattgtt ccatgaggtc 480
accttccaaa ccgaattggg ccaattgatg gacttaatca ctgcacctga agacaaagtc 540
gacttgagta agttctccct aaagaagcac tccttcatag ttactttcaa gactgcttac 600
tattctttct acttgcctgt cgcattggcc atgtacgttg ccggtatcac ggatgaaaag 660
gatttgaaac aagccagaga tgtcttgatt ccattgggtg aatacttcca aattcaagat 720
gactacttag actgcttcgg taccccagaa cagatcggta agatcggtac agatatccaa 780
gataacaaat gttcttgggt aatcaacaag gcattggaac ttgcttccgc agaacaaaga 840
aagactttag acgaaaatta cggtaagaag gactcagtcg cagaagccaa atgcaaaaag 900
attttcaatg acttgaaaat tgaacagcta taccacgaat atgaagagtc tattgccaag 960
gatttgaagg ccaaaatttc tcaggtcgat gagtctcgtg gcttcaaagc tgatgtctta 1020
actgcgttct tgaacaaagt ttacaagaga agcaaatag 1059
<210> 60
<211> 352
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(352)
<223> 突变的法呢基焦磷酸合成酶 (Erg20mut, F96W, N127W)
<400> 60
Met Ala Ser Glu Lys Glu Ile Arg Arg Glu Arg Phe Leu Asn Val Phe
1 5 10 15
Pro Lys Leu Val Glu Glu Leu Asn Ala Ser Leu Leu Ala Tyr Gly Met
20 25 30
Pro Lys Glu Ala Cys Asp Trp Tyr Ala His Ser Leu Asn Tyr Asn Thr
35 40 45
Pro Gly Gly Lys Leu Asn Arg Gly Leu Ser Val Val Asp Thr Tyr Ala
50 55 60
Ile Leu Ser Asn Lys Thr Val Glu Gln Leu Gly Gln Glu Glu Tyr Glu
65 70 75 80
Lys Val Ala Ile Leu Gly Trp Cys Ile Glu Leu Leu Gln Ala Tyr Trp
85 90 95
Leu Val Ala Asp Asp Met Met Asp Lys Ser Ile Thr Arg Arg Gly Gln
100 105 110
Pro Cys Trp Tyr Lys Val Pro Glu Val Gly Glu Ile Ala Ile Trp Asp
115 120 125
Ala Phe Met Leu Glu Ala Ala Ile Tyr Lys Leu Leu Lys Ser His Phe
130 135 140
Arg Asn Glu Lys Tyr Tyr Ile Asp Ile Thr Glu Leu Phe His Glu Val
145 150 155 160
Thr Phe Gln Thr Glu Leu Gly Gln Leu Met Asp Leu Ile Thr Ala Pro
165 170 175
Glu Asp Lys Val Asp Leu Ser Lys Phe Ser Leu Lys Lys His Ser Phe
180 185 190
Ile Val Thr Phe Lys Thr Ala Tyr Tyr Ser Phe Tyr Leu Pro Val Ala
195 200 205
Leu Ala Met Tyr Val Ala Gly Ile Thr Asp Glu Lys Asp Leu Lys Gln
210 215 220
Ala Arg Asp Val Leu Ile Pro Leu Gly Glu Tyr Phe Gln Ile Gln Asp
225 230 235 240
Asp Tyr Leu Asp Cys Phe Gly Thr Pro Glu Gln Ile Gly Lys Ile Gly
245 250 255
Thr Asp Ile Gln Asp Asn Lys Cys Ser Trp Val Ile Asn Lys Ala Leu
260 265 270
Glu Leu Ala Ser Ala Glu Gln Arg Lys Thr Leu Asp Glu Asn Tyr Gly
275 280 285
Lys Lys Asp Ser Val Ala Glu Ala Lys Cys Lys Lys Ile Phe Asn Asp
290 295 300
Leu Lys Ile Glu Gln Leu Tyr His Glu Tyr Glu Glu Ser Ile Ala Lys
305 310 315 320
Asp Leu Lys Ala Lys Ile Ser Gln Val Asp Glu Ser Arg Gly Phe Lys
325 330 335
Ala Asp Val Leu Thr Ala Phe Leu Asn Lys Val Tyr Lys Arg Ser Lys
340 345 350
<210> 61
<211> 1356
<212> DNA
<213> Saccharomyces sp.
<400> 61
atgtcagagt tgagagcctt cagtgcccca gggaaagcgt tactagctgg tggatattta 60
gttttagata caaaatatga agcatttgta gtcggattat cggcaagaat gcatgctgta 120
gcccatcctt acggttcatt gcaagggtct gataagtttg aagtgcgtgt gaaaagtaaa 180
caatttaaag atggggagtg gctgtaccat ataagtccta aaagtggctt cattcctgtt 240
tcgataggcg gatctaagaa ccctttcatt gaaaaagtta tcgctaacgt atttagctac 300
tttaaaccta acatggacga ctactgcaat agaaacttgt tcgttattga tattttctct 360
gatgatgcct accattctca ggaggatagc gttaccgaac atcgtggcaa cagaagattg 420
agttttcatt cgcacagaat tgaagaagtt cccaaaacag ggctgggctc ctcggcaggt 480
ttagtcacag ttttaactac agctttggcc tccttttttg tatcggacct ggaaaataat 540
gtagacaaat atagagaagt tattcataat ttagcacaag ttgctcattg tcaagctcag 600
ggtaaaattg gaagcgggtt tgatgtagcg gcggcagcat atggatctat cagatataga 660
agattcccac ccgcattaat ctctaatttg ccagatattg gaagtgctac ttacggcagt 720
aaactggcgc atttggttga tgaagaagac tggaatatta cgattaaaag taaccattta 780
ccttcgggat taactttatg gatgggcgat attaagaatg gttcagaaac agtaaaactg 840
gtccagaagg taaaaaattg gtatgattcg catatgccag aaagcttgaa aatatataca 900
gaactcgatc atgcaaattc tagatttatg gatggactat ctaaactaga tcgcttacac 960
gagactcatg acgattacag cgatcagata tttgagtctc ttgagaggaa tgactgtacc 1020
tgtcaaaagt atcctgaaat cacagaagtt agagatgcag ttgccacaat tagacgttcc 1080
tttagaaaaa taactaaaga atctggtgcc gatatcgaac ctcccgtaca aactagctta 1140
ttggatgatt gccagacctt aaaaggagtt cttacttgct taatacctgg tgctggtggt 1200
tatgacgcca ttgcagtgat tactaagcaa gatgttgatc ttagggctca aaccgctaat 1260
gacaaaagat tttctaaggt tcaatggctg gatgtaactc aggctgactg gggtgttagg 1320
aaagaaaaag atccggaaac ttatcttgat aaataa 1356
<210> 62
<211> 451
<212> PRT
<213> Saccharomyces sp.
<400> 62
Met Ser Glu Leu Arg Ala Phe Ser Ala Pro Gly Lys Ala Leu Leu Ala
1 5 10 15
Gly Gly Tyr Leu Val Leu Asp Thr Lys Tyr Glu Ala Phe Val Val Gly
20 25 30
Leu Ser Ala Arg Met His Ala Val Ala His Pro Tyr Gly Ser Leu Gln
35 40 45
Gly Ser Asp Lys Phe Glu Val Arg Val Lys Ser Lys Gln Phe Lys Asp
50 55 60
Gly Glu Trp Leu Tyr His Ile Ser Pro Lys Ser Gly Phe Ile Pro Val
65 70 75 80
Ser Ile Gly Gly Ser Lys Asn Pro Phe Ile Glu Lys Val Ile Ala Asn
85 90 95
Val Phe Ser Tyr Phe Lys Pro Asn Met Asp Asp Tyr Cys Asn Arg Asn
100 105 110
Leu Phe Val Ile Asp Ile Phe Ser Asp Asp Ala Tyr His Ser Gln Glu
115 120 125
Asp Ser Val Thr Glu His Arg Gly Asn Arg Arg Leu Ser Phe His Ser
130 135 140
His Arg Ile Glu Glu Val Pro Lys Thr Gly Leu Gly Ser Ser Ala Gly
145 150 155 160
Leu Val Thr Val Leu Thr Thr Ala Leu Ala Ser Phe Phe Val Ser Asp
165 170 175
Leu Glu Asn Asn Val Asp Lys Tyr Arg Glu Val Ile His Asn Leu Ala
180 185 190
Gln Val Ala His Cys Gln Ala Gln Gly Lys Ile Gly Ser Gly Phe Asp
195 200 205
Val Ala Ala Ala Ala Tyr Gly Ser Ile Arg Tyr Arg Arg Phe Pro Pro
210 215 220
Ala Leu Ile Ser Asn Leu Pro Asp Ile Gly Ser Ala Thr Tyr Gly Ser
225 230 235 240
Lys Leu Ala His Leu Val Asp Glu Glu Asp Trp Asn Ile Thr Ile Lys
245 250 255
Ser Asn His Leu Pro Ser Gly Leu Thr Leu Trp Met Gly Asp Ile Lys
260 265 270
Asn Gly Ser Glu Thr Val Lys Leu Val Gln Lys Val Lys Asn Trp Tyr
275 280 285
Asp Ser His Met Pro Glu Ser Leu Lys Ile Tyr Thr Glu Leu Asp His
290 295 300
Ala Asn Ser Arg Phe Met Asp Gly Leu Ser Lys Leu Asp Arg Leu His
305 310 315 320
Glu Thr His Asp Asp Tyr Ser Asp Gln Ile Phe Glu Ser Leu Glu Arg
325 330 335
Asn Asp Cys Thr Cys Gln Lys Tyr Pro Glu Ile Thr Glu Val Arg Asp
340 345 350
Ala Val Ala Thr Ile Arg Arg Ser Phe Arg Lys Ile Thr Lys Glu Ser
355 360 365
Gly Ala Asp Ile Glu Pro Pro Val Gln Thr Ser Leu Leu Asp Asp Cys
370 375 380
Gln Thr Leu Lys Gly Val Leu Thr Cys Leu Ile Pro Gly Ala Gly Gly
385 390 395 400
Tyr Asp Ala Ile Ala Val Ile Thr Lys Gln Asp Val Asp Leu Arg Ala
405 410 415
Gln Thr Ala Asn Asp Lys Arg Phe Ser Lys Val Gln Trp Leu Asp Val
420 425 430
Thr Gln Ala Asp Trp Gly Val Arg Lys Glu Lys Asp Pro Glu Thr Tyr
435 440 445
Leu Asp Lys
450
<210> 63
<211> 1332
<212> DNA
<213> Saccharomyces sp.
<400> 63
atgtcattac cgttcttaac ttctgcaccg ggaaaggtta ttatttttgg tgaacactct 60
gctgtgtaca acaagcctgc cgtcgctgct agtgtgtctg cgttgagaac ctacctgcta 120
ataagcgagt catctgcacc agatactatt gaattggact tcccggacat tagctttaat 180
cataagtggt ccatcaatga tttcaatgcc atcaccgagg atcaagtaaa ctcccaaaaa 240
ttggccaagg ctcaacaagc caccgatggc ttgtctcagg aactcgttag tcttttggat 300
ccgttgttag ctcaactatc cgaatccttc cactaccatg cagcgttttg tttcctgtat 360
atgtttgttt gcctatgccc ccatgccaag aatattaagt tttctttaaa gtctacttta 420
cccatcggtg ctgggttggg ctcaagcgcc tctatttctg tatcactggc cttagctatg 480
gcctacttgg gggggttaat aggatctaat gacttggaaa agctgtcaga aaacgataag 540
catatagtga atcaatgggc cttcataggt gaaaagtgta ttcacggtac cccttcagga 600
atagataacg ctgtggccac ttatggtaat gccctgctat ttgaaaaaga ctcacataat 660
ggaacaataa acacaaacaa ttttaagttc ttagatgatt tcccagccat tccaatgatc 720
ctaacctata ctagaattcc aaggtctaca aaagatcttg ttgctcgcgt tcgtgtgttg 780
gtcaccgaga aatttcctga agttatgaag ccaattctag atgccatggg tgaatgtgcc 840
ctacaaggct tagagatcat gactaagtta agtaaatgta aaggcaccga tgacgaggct 900
gtagaaacta ataatgaact gtatgaacaa ctattggaat tgataagaat aaatcatgga 960
ctgcttgtct caatcggtgt ttctcatcct ggattagaac ttattaaaaa tctgagcgat 1020
gatttgagaa ttggctccac aaaacttacc ggtgctggtg gcggcggttg ctctttgact 1080
ttgttacgaa gagacattac tcaagagcaa attgacagct tcaaaaagaa attgcaagat 1140
gattttagtt acgagacatt tgaaacagac ttgggtggga ctggctgctg tttgttaagc 1200
gcaaaaaatt tgaataaaga tcttaaaatc aaatccctag tattccaatt atttgaaaat 1260
aaaactacca caaagcaaca aattgacgat ctattattgc caggaaacac gaatttacca 1320
tggacttcat aa 1332
<210> 64
<211> 443
<212> PRT
<213> Saccharomyces sp.
<400> 64
Met Ser Leu Pro Phe Leu Thr Ser Ala Pro Gly Lys Val Ile Ile Phe
1 5 10 15
Gly Glu His Ser Ala Val Tyr Asn Lys Pro Ala Val Ala Ala Ser Val
20 25 30
Ser Ala Leu Arg Thr Tyr Leu Leu Ile Ser Glu Ser Ser Ala Pro Asp
35 40 45
Thr Ile Glu Leu Asp Phe Pro Asp Ile Ser Phe Asn His Lys Trp Ser
50 55 60
Ile Asn Asp Phe Asn Ala Ile Thr Glu Asp Gln Val Asn Ser Gln Lys
65 70 75 80
Leu Ala Lys Ala Gln Gln Ala Thr Asp Gly Leu Ser Gln Glu Leu Val
85 90 95
Ser Leu Leu Asp Pro Leu Leu Ala Gln Leu Ser Glu Ser Phe His Tyr
100 105 110
His Ala Ala Phe Cys Phe Leu Tyr Met Phe Val Cys Leu Cys Pro His
115 120 125
Ala Lys Asn Ile Lys Phe Ser Leu Lys Ser Thr Leu Pro Ile Gly Ala
130 135 140
Gly Leu Gly Ser Ser Ala Ser Ile Ser Val Ser Leu Ala Leu Ala Met
145 150 155 160
Ala Tyr Leu Gly Gly Leu Ile Gly Ser Asn Asp Leu Glu Lys Leu Ser
165 170 175
Glu Asn Asp Lys His Ile Val Asn Gln Trp Ala Phe Ile Gly Glu Lys
180 185 190
Cys Ile His Gly Thr Pro Ser Gly Ile Asp Asn Ala Val Ala Thr Tyr
195 200 205
Gly Asn Ala Leu Leu Phe Glu Lys Asp Ser His Asn Gly Thr Ile Asn
210 215 220
Thr Asn Asn Phe Lys Phe Leu Asp Asp Phe Pro Ala Ile Pro Met Ile
225 230 235 240
Leu Thr Tyr Thr Arg Ile Pro Arg Ser Thr Lys Asp Leu Val Ala Arg
245 250 255
Val Arg Val Leu Val Thr Glu Lys Phe Pro Glu Val Met Lys Pro Ile
260 265 270
Leu Asp Ala Met Gly Glu Cys Ala Leu Gln Gly Leu Glu Ile Met Thr
275 280 285
Lys Leu Ser Lys Cys Lys Gly Thr Asp Asp Glu Ala Val Glu Thr Asn
290 295 300
Asn Glu Leu Tyr Glu Gln Leu Leu Glu Leu Ile Arg Ile Asn His Gly
305 310 315 320
Leu Leu Val Ser Ile Gly Val Ser His Pro Gly Leu Glu Leu Ile Lys
325 330 335
Asn Leu Ser Asp Asp Leu Arg Ile Gly Ser Thr Lys Leu Thr Gly Ala
340 345 350
Gly Gly Gly Gly Cys Ser Leu Thr Leu Leu Arg Arg Asp Ile Thr Gln
355 360 365
Glu Gln Ile Asp Ser Phe Lys Lys Lys Leu Gln Asp Asp Phe Ser Tyr
370 375 380
Glu Thr Phe Glu Thr Asp Leu Gly Gly Thr Gly Cys Cys Leu Leu Ser
385 390 395 400
Ala Lys Asn Leu Asn Lys Asp Leu Lys Ile Lys Ser Leu Val Phe Gln
405 410 415
Leu Phe Glu Asn Lys Thr Thr Thr Lys Gln Gln Ile Asp Asp Leu Leu
420 425 430
Leu Pro Gly Asn Thr Asn Leu Pro Trp Thr Ser
435 440
<210> 65
<211> 1191
<212> DNA
<213> Saccharomyces sp.
<400> 65
atgaccgttt acacagcatc cgttaccgca cccgtcaaca tcgcaaccct taagtattgg 60
gggaaaaggg acacgaagtt gaatctgccc accaattcgt ccatatcagt gactttatcg 120
caagatgacc tcagaacgtt gacctctgcg gctactgcac ctgagtttga acgcgacact 180
ttgtggttaa atggagaacc acacagcatc gacaatgaaa gaactcaaaa ttgtctgcgc 240
gacctacgcc aattaagaaa ggaaatggaa tcgaaggacg cctcattgcc cacattatct 300
caatggaaac tccacattgt ctccgaaaat aactttccta cagcagctgg tttagcttcc 360
tccgctgctg gctttgctgc attggtctct gcaattgcta agttatacca attaccacag 420
tcaacttcag aaatatctag aatagcaaga aaggggtctg gttcagcttg tagatcgttg 480
tttggcggat acgtggcctg ggaaatggga aaagctgaag atggtcatga ttccatggca 540
gtacaaatcg cagacagctc tgactggcct cagatgaaag cttgtgtcct agttgtcagc 600
gatattaaaa aggatgtgag ttccactcag ggtatgcaat tgaccgtggc aacctccgaa 660
ctatttaaag aaagaattga acatgtcgta ccaaagagat ttgaagtcat gcgtaaagcc 720
attgttgaaa aagatttcgc cacctttgca aaggaaacaa tgatggattc caactctttc 780
catgccacat gtttggactc tttccctcca atattctaca tgaatgacac ttccaagcgt 840
atcatcagtt ggtgccacac cattaatcag ttttacggag aaacaatcgt tgcatacacg 900
tttgatgcag gtccaaatgc tgtgttgtac tacttagctg aaaatgagtc gaaactcttt 960
gcatttatct ataaattgtt tggctctgtt cctggatggg acaagaaatt tactactgag 1020
cagcttgagg ctttcaacca tcaatttgaa tcatctaact ttactgcacg tgaattggat 1080
cttgagttgc aaaaggatgt tgccagagtg attttaactc aagtcggttc aggcccacaa 1140
gaaacaaacg aatctttgat tgacgcaaag actggtctac caaaggaata a 1191
<210> 66
<211> 396
<212> PRT
<213> Saccharomyces sp.
<400> 66
Met Thr Val Tyr Thr Ala Ser Val Thr Ala Pro Val Asn Ile Ala Thr
1 5 10 15
Leu Lys Tyr Trp Gly Lys Arg Asp Thr Lys Leu Asn Leu Pro Thr Asn
20 25 30
Ser Ser Ile Ser Val Thr Leu Ser Gln Asp Asp Leu Arg Thr Leu Thr
35 40 45
Ser Ala Ala Thr Ala Pro Glu Phe Glu Arg Asp Thr Leu Trp Leu Asn
50 55 60
Gly Glu Pro His Ser Ile Asp Asn Glu Arg Thr Gln Asn Cys Leu Arg
65 70 75 80
Asp Leu Arg Gln Leu Arg Lys Glu Met Glu Ser Lys Asp Ala Ser Leu
85 90 95
Pro Thr Leu Ser Gln Trp Lys Leu His Ile Val Ser Glu Asn Asn Phe
100 105 110
Pro Thr Ala Ala Gly Leu Ala Ser Ser Ala Ala Gly Phe Ala Ala Leu
115 120 125
Val Ser Ala Ile Ala Lys Leu Tyr Gln Leu Pro Gln Ser Thr Ser Glu
130 135 140
Ile Ser Arg Ile Ala Arg Lys Gly Ser Gly Ser Ala Cys Arg Ser Leu
145 150 155 160
Phe Gly Gly Tyr Val Ala Trp Glu Met Gly Lys Ala Glu Asp Gly His
165 170 175
Asp Ser Met Ala Val Gln Ile Ala Asp Ser Ser Asp Trp Pro Gln Met
180 185 190
Lys Ala Cys Val Leu Val Val Ser Asp Ile Lys Lys Asp Val Ser Ser
195 200 205
Thr Gln Gly Met Gln Leu Thr Val Ala Thr Ser Glu Leu Phe Lys Glu
210 215 220
Arg Ile Glu His Val Val Pro Lys Arg Phe Glu Val Met Arg Lys Ala
225 230 235 240
Ile Val Glu Lys Asp Phe Ala Thr Phe Ala Lys Glu Thr Met Met Asp
245 250 255
Ser Asn Ser Phe His Ala Thr Cys Leu Asp Ser Phe Pro Pro Ile Phe
260 265 270
Tyr Met Asn Asp Thr Ser Lys Arg Ile Ile Ser Trp Cys His Thr Ile
275 280 285
Asn Gln Phe Tyr Gly Glu Thr Ile Val Ala Tyr Thr Phe Asp Ala Gly
290 295 300
Pro Asn Ala Val Leu Tyr Tyr Leu Ala Glu Asn Glu Ser Lys Leu Phe
305 310 315 320
Ala Phe Ile Tyr Lys Leu Phe Gly Ser Val Pro Gly Trp Asp Lys Lys
325 330 335
Phe Thr Thr Glu Gln Leu Glu Ala Phe Asn His Gln Phe Glu Ser Ser
340 345 350
Asn Phe Thr Ala Arg Glu Leu Asp Leu Glu Leu Gln Lys Asp Val Ala
355 360 365
Arg Val Ile Leu Thr Gln Val Gly Ser Gly Pro Gln Glu Thr Asn Glu
370 375 380
Ser Leu Ile Asp Ala Lys Thr Gly Leu Pro Lys Glu
385 390 395
<210> 67
<211> 2751
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(2751)
<223> 工程化的磷酸甲羟戊酸激酶/甲羟戊酸激酶(Erg8-T2A-Erg12)
<400> 67
atgtcagagt tgagagcctt cagtgcccca gggaaagcgt tactagctgg tggatattta 60
gttttagata caaaatatga agcatttgta gtcggattat cggcaagaat gcatgctgta 120
gcccatcctt acggttcatt gcaagggtct gataagtttg aagtgcgtgt gaaaagtaaa 180
caatttaaag atggggagtg gctgtaccat ataagtccta aaagtggctt cattcctgtt 240
tcgataggcg gatctaagaa ccctttcatt gaaaaagtta tcgctaacgt atttagctac 300
tttaaaccta acatggacga ctactgcaat agaaacttgt tcgttattga tattttctct 360
gatgatgcct accattctca ggaggatagc gttaccgaac atcgtggcaa cagaagattg 420
agttttcatt cgcacagaat tgaagaagtt cccaaaacag ggctgggctc ctcggcaggt 480
ttagtcacag ttttaactac agctttggcc tccttttttg tatcggacct ggaaaataat 540
gtagacaaat atagagaagt tattcataat ttagcacaag ttgctcattg tcaagctcag 600
ggtaaaattg gaagcgggtt tgatgtagcg gcggcagcat atggatctat cagatataga 660
agattcccac ccgcattaat ctctaatttg ccagatattg gaagtgctac ttacggcagt 720
aaactggcgc atttggttga tgaagaagac tggaatatta cgattaaaag taaccattta 780
ccttcgggat taactttatg gatgggcgat attaagaatg gttcagaaac agtaaaactg 840
gtccagaagg taaaaaattg gtatgattcg catatgccag aaagcttgaa aatatataca 900
gaactcgatc atgcaaattc tagatttatg gatggactat ctaaactaga tcgcttacac 960
gagactcatg acgattacag cgatcagata tttgagtctc ttgagaggaa tgactgtacc 1020
tgtcaaaagt atcctgaaat cacagaagtt agagatgcag ttgccacaat tagacgttcc 1080
tttagaaaaa taactaaaga atctggtgcc gatatcgaac ctcccgtaca aactagctta 1140
ttggatgatt gccagacctt aaaaggagtt cttacttgct taatacctgg tgctggtggt 1200
tatgacgcca ttgcagtgat tactaagcaa gatgttgatc ttagggctca aaccgctaat 1260
gacaaaagat tttctaaggt tcaatggctg gatgtaactc aggctgactg gggtgttagg 1320
aaagaaaaag atccggaaac ttatcttgat aaaaagcttg agggcagagg aagtcttcta 1380
acatgcggtg acgtggagga gaatcccggc cctgctagca tgtcattacc gttcttaact 1440
tctgcaccgg gaaaggttat tatttttggt gaacactctg ctgtgtacaa caagcctgcc 1500
gtcgctgcta gtgtgtctgc gttgagaacc tacctgctaa taagcgagtc atctgcacca 1560
gatactattg aattggactt cccggacatt agctttaatc ataagtggtc catcaatgat 1620
ttcaatgcca tcaccgagga tcaagtaaac tcccaaaaat tggccaaggc tcaacaagcc 1680
accgatggct tgtctcagga actcgttagt cttttggatc cgttgttagc tcaactatcc 1740
gaatccttcc actaccatgc agcgttttgt ttcctgtata tgtttgtttg cctatgcccc 1800
catgccaaga atattaagtt ttctttaaag tctactttac ccatcggtgc tgggttgggc 1860
tcaagcgcct ctatttctgt atcactggcc ttagctatgg cctacttggg ggggttaata 1920
ggatctaatg acttggaaaa gctgtcagaa aacgataagc atatagtgaa tcaatgggcc 1980
ttcataggtg aaaagtgtat tcacggtacc ccttcaggaa tagataacgc tgtggccact 2040
tatggtaatg ccctgctatt tgaaaaagac tcacataatg gaacaataaa cacaaacaat 2100
tttaagttct tagatgattt cccagccatt ccaatgatcc taacctatac tagaattcca 2160
aggtctacaa aagatcttgt tgctcgcgtt cgtgtgttgg tcaccgagaa atttcctgaa 2220
gttatgaagc caattctaga tgccatgggt gaatgtgccc tacaaggctt agagatcatg 2280
actaagttaa gtaaatgtaa aggcaccgat gacgaggctg tagaaactaa taatgaactg 2340
tatgaacaac tattggaatt gataagaata aatcatggac tgcttgtctc aatcggtgtt 2400
tctcatcctg gattagaact tattaaaaat ctgagcgatg atttgagaat tggctccaca 2460
aaacttaccg gtgctggtgg cggcggttgc tctttgactt tgttacgaag agacattact 2520
caagagcaaa ttgacagctt caaaaagaaa ttgcaagatg attttagtta cgagacattt 2580
gaaacagact tgggtgggac tggctgctgt ttgttaagcg caaaaaattt gaataaagat 2640
cttaaaatca aatccctagt attccaatta tttgaaaata aaactaccac aaagcaacaa 2700
attgacgatc tattattgcc aggaaacacg aatttaccat ggacttcata a 2751
<210> 68
<211> 916
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(916)
<223> 工程化的磷酸甲羟戊酸激酶/甲羟戊酸激酶(Erg8-T2A-Erg12)
<400> 68
Met Ser Glu Leu Arg Ala Phe Ser Ala Pro Gly Lys Ala Leu Leu Ala
1 5 10 15
Gly Gly Tyr Leu Val Leu Asp Thr Lys Tyr Glu Ala Phe Val Val Gly
20 25 30
Leu Ser Ala Arg Met His Ala Val Ala His Pro Tyr Gly Ser Leu Gln
35 40 45
Gly Ser Asp Lys Phe Glu Val Arg Val Lys Ser Lys Gln Phe Lys Asp
50 55 60
Gly Glu Trp Leu Tyr His Ile Ser Pro Lys Ser Gly Phe Ile Pro Val
65 70 75 80
Ser Ile Gly Gly Ser Lys Asn Pro Phe Ile Glu Lys Val Ile Ala Asn
85 90 95
Val Phe Ser Tyr Phe Lys Pro Asn Met Asp Asp Tyr Cys Asn Arg Asn
100 105 110
Leu Phe Val Ile Asp Ile Phe Ser Asp Asp Ala Tyr His Ser Gln Glu
115 120 125
Asp Ser Val Thr Glu His Arg Gly Asn Arg Arg Leu Ser Phe His Ser
130 135 140
His Arg Ile Glu Glu Val Pro Lys Thr Gly Leu Gly Ser Ser Ala Gly
145 150 155 160
Leu Val Thr Val Leu Thr Thr Ala Leu Ala Ser Phe Phe Val Ser Asp
165 170 175
Leu Glu Asn Asn Val Asp Lys Tyr Arg Glu Val Ile His Asn Leu Ala
180 185 190
Gln Val Ala His Cys Gln Ala Gln Gly Lys Ile Gly Ser Gly Phe Asp
195 200 205
Val Ala Ala Ala Ala Tyr Gly Ser Ile Arg Tyr Arg Arg Phe Pro Pro
210 215 220
Ala Leu Ile Ser Asn Leu Pro Asp Ile Gly Ser Ala Thr Tyr Gly Ser
225 230 235 240
Lys Leu Ala His Leu Val Asp Glu Glu Asp Trp Asn Ile Thr Ile Lys
245 250 255
Ser Asn His Leu Pro Ser Gly Leu Thr Leu Trp Met Gly Asp Ile Lys
260 265 270
Asn Gly Ser Glu Thr Val Lys Leu Val Gln Lys Val Lys Asn Trp Tyr
275 280 285
Asp Ser His Met Pro Glu Ser Leu Lys Ile Tyr Thr Glu Leu Asp His
290 295 300
Ala Asn Ser Arg Phe Met Asp Gly Leu Ser Lys Leu Asp Arg Leu His
305 310 315 320
Glu Thr His Asp Asp Tyr Ser Asp Gln Ile Phe Glu Ser Leu Glu Arg
325 330 335
Asn Asp Cys Thr Cys Gln Lys Tyr Pro Glu Ile Thr Glu Val Arg Asp
340 345 350
Ala Val Ala Thr Ile Arg Arg Ser Phe Arg Lys Ile Thr Lys Glu Ser
355 360 365
Gly Ala Asp Ile Glu Pro Pro Val Gln Thr Ser Leu Leu Asp Asp Cys
370 375 380
Gln Thr Leu Lys Gly Val Leu Thr Cys Leu Ile Pro Gly Ala Gly Gly
385 390 395 400
Tyr Asp Ala Ile Ala Val Ile Thr Lys Gln Asp Val Asp Leu Arg Ala
405 410 415
Gln Thr Ala Asn Asp Lys Arg Phe Ser Lys Val Gln Trp Leu Asp Val
420 425 430
Thr Gln Ala Asp Trp Gly Val Arg Lys Glu Lys Asp Pro Glu Thr Tyr
435 440 445
Leu Asp Lys Lys Leu Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp
450 455 460
Val Glu Glu Asn Pro Gly Pro Ala Ser Met Ser Leu Pro Phe Leu Thr
465 470 475 480
Ser Ala Pro Gly Lys Val Ile Ile Phe Gly Glu His Ser Ala Val Tyr
485 490 495
Asn Lys Pro Ala Val Ala Ala Ser Val Ser Ala Leu Arg Thr Tyr Leu
500 505 510
Leu Ile Ser Glu Ser Ser Ala Pro Asp Thr Ile Glu Leu Asp Phe Pro
515 520 525
Asp Ile Ser Phe Asn His Lys Trp Ser Ile Asn Asp Phe Asn Ala Ile
530 535 540
Thr Glu Asp Gln Val Asn Ser Gln Lys Leu Ala Lys Ala Gln Gln Ala
545 550 555 560
Thr Asp Gly Leu Ser Gln Glu Leu Val Ser Leu Leu Asp Pro Leu Leu
565 570 575
Ala Gln Leu Ser Glu Ser Phe His Tyr His Ala Ala Phe Cys Phe Leu
580 585 590
Tyr Met Phe Val Cys Leu Cys Pro His Ala Lys Asn Ile Lys Phe Ser
595 600 605
Leu Lys Ser Thr Leu Pro Ile Gly Ala Gly Leu Gly Ser Ser Ala Ser
610 615 620
Ile Ser Val Ser Leu Ala Leu Ala Met Ala Tyr Leu Gly Gly Leu Ile
625 630 635 640
Gly Ser Asn Asp Leu Glu Lys Leu Ser Glu Asn Asp Lys His Ile Val
645 650 655
Asn Gln Trp Ala Phe Ile Gly Glu Lys Cys Ile His Gly Thr Pro Ser
660 665 670
Gly Ile Asp Asn Ala Val Ala Thr Tyr Gly Asn Ala Leu Leu Phe Glu
675 680 685
Lys Asp Ser His Asn Gly Thr Ile Asn Thr Asn Asn Phe Lys Phe Leu
690 695 700
Asp Asp Phe Pro Ala Ile Pro Met Ile Leu Thr Tyr Thr Arg Ile Pro
705 710 715 720
Arg Ser Thr Lys Asp Leu Val Ala Arg Val Arg Val Leu Val Thr Glu
725 730 735
Lys Phe Pro Glu Val Met Lys Pro Ile Leu Asp Ala Met Gly Glu Cys
740 745 750
Ala Leu Gln Gly Leu Glu Ile Met Thr Lys Leu Ser Lys Cys Lys Gly
755 760 765
Thr Asp Asp Glu Ala Val Glu Thr Asn Asn Glu Leu Tyr Glu Gln Leu
770 775 780
Leu Glu Leu Ile Arg Ile Asn His Gly Leu Leu Val Ser Ile Gly Val
785 790 795 800
Ser His Pro Gly Leu Glu Leu Ile Lys Asn Leu Ser Asp Asp Leu Arg
805 810 815
Ile Gly Ser Thr Lys Leu Thr Gly Ala Gly Gly Gly Gly Cys Ser Leu
820 825 830
Thr Leu Leu Arg Arg Asp Ile Thr Gln Glu Gln Ile Asp Ser Phe Lys
835 840 845
Lys Lys Leu Gln Asp Asp Phe Ser Tyr Glu Thr Phe Glu Thr Asp Leu
850 855 860
Gly Gly Thr Gly Cys Cys Leu Leu Ser Ala Lys Asn Leu Asn Lys Asp
865 870 875 880
Leu Lys Ile Lys Ser Leu Val Phe Gln Leu Phe Glu Asn Lys Thr Thr
885 890 895
Thr Lys Gln Gln Ile Asp Asp Leu Leu Leu Pro Gly Asn Thr Asn Leu
900 905 910
Pro Trp Thr Ser
915
<210> 69
<211> 756
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(756)
<223> 人工橙花基焦磷酸(NPP)合成酶(NPPS)核苷酸序列
<400> 69
atgtgctcac ttaatttgca aacggaaaag ctatgctatg aagacaatga caatgacttg 60
gacgaggaac tgatgccgaa gcacatagcg ctaatcatgg atggtaatag acgttgggca 120
aaagacaagg gcttagaagt gtacgaaggg cacaaacata taatcccgaa actaaaagaa 180
atatgtgaca tatcctccaa gttggggatt cagatcatca cagcgttcgc gttctccaca 240
gagaactgga agagatccaa ggaggaagtc gatttcctat tgcagatgtt tgaagaaatc 300
tatgacgaat ttagccgttc tggggtgaga gtgagtatca tcggatgcaa aagcgatttg 360
ccgatgaccc ttcaaaaatg tatcgcattg acagaggaaa cgacgaaagg caataaggga 420
ttacacctgg tcatagcact taactacggt gggtattacg atatcctaca agcaacgaag 480
tccattgtaa acaaggctat gaatggttta ttggacgttg aagacatcaa taaaaatctg 540
ttcgaccaag aattagaaag caaatgccct aaccctgact tgctgatcag aactggggga 600
gaacagaggg tctctaattt tcttctatgg caattggctt atactgagtt ctattttacc 660
aatactttat tccctgactt tggtgaagag gacctgaaag aagccatcat gaattttcaa 720
cagagacacc gtagattcgg aggacatact tattga 756
<210> 70
<211> 251
<212> PRT
<213> Solanum sp.
<400> 70
Met Cys Ser Leu Asn Leu Gln Thr Glu Lys Leu Cys Tyr Glu Asp Asn
1 5 10 15
Asp Asn Asp Leu Asp Glu Glu Leu Met Pro Lys His Ile Ala Leu Ile
20 25 30
Met Asp Gly Asn Arg Arg Trp Ala Lys Asp Lys Gly Leu Glu Val Tyr
35 40 45
Glu Gly His Lys His Ile Ile Pro Lys Leu Lys Glu Ile Cys Asp Ile
50 55 60
Ser Ser Lys Leu Gly Ile Gln Ile Ile Thr Ala Phe Ala Phe Ser Thr
65 70 75 80
Glu Asn Trp Lys Arg Ser Lys Glu Glu Val Asp Phe Leu Leu Gln Met
85 90 95
Phe Glu Glu Ile Tyr Asp Glu Phe Ser Arg Ser Gly Val Arg Val Ser
100 105 110
Ile Ile Gly Cys Lys Ser Asp Leu Pro Met Thr Leu Gln Lys Cys Ile
115 120 125
Ala Leu Thr Glu Glu Thr Thr Lys Gly Asn Lys Gly Leu His Leu Val
130 135 140
Ile Ala Leu Asn Tyr Gly Gly Tyr Tyr Asp Ile Leu Gln Ala Thr Lys
145 150 155 160
Ser Ile Val Asn Lys Ala Met Asn Gly Leu Leu Asp Val Glu Asp Ile
165 170 175
Asn Lys Asn Leu Phe Asp Gln Glu Leu Glu Ser Lys Cys Pro Asn Pro
180 185 190
Asp Leu Leu Ile Arg Thr Gly Gly Glu Gln Arg Val Ser Asn Phe Leu
195 200 205
Leu Trp Gln Leu Ala Tyr Thr Glu Phe Tyr Phe Thr Asn Thr Leu Phe
210 215 220
Pro Asp Phe Gly Glu Glu Asp Leu Lys Glu Ala Ile Met Asn Phe Gln
225 230 235 240
Gln Arg His Arg Arg Phe Gly Gly His Thr Tyr
245 250
<210> 71
<211> 1113
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(1113)
<223> 人工香叶基香叶基焦磷酸合成酶大亚基(GPPSlsu)核苷酸序列
<400> 71
atgagcaccg tgaatctgac ctgggtgcag acgtgctcta tgttcaacca gggcgggcgt 60
tcccgttcat tgtcaacctt caacttaaat ctgtaccatc cattgaagaa aacgcctttc 120
tctatccaga cacctaagca gaaaaggcca acttccccct tctcatctat cagtgccgta 180
ttaacggagc aggaagcagt aaaggagggt gacgaggaaa aaagcatatt taacttcaaa 240
tcttatatgg ttcagaaagc taatagcgtg aatcaggcac tagattctgc ggtgttattg 300
agagacccca ttatgataca tgaatctatg cgttactctt tgcttgcggg cggcaagcgt 360
gtcagaccga tgttatgctt aagtgcgtgc gagttagtag gaggtaaaga gtctgtagca 420
atgcccgcag catgtgctgt agaaatgata cacacaatgt cactgattca cgatgatctt 480
ccttgcatgg ataacgacga tcttcgtaga ggtaagccaa ccaaccacaa ggtattcggg 540
gaagacgtgg cagttttagc aggagacgcg ctactagcgt tcgcgtttga acacatggca 600
gttagcacag taggagttcc agcagcaaaa atagttaggg ctataggaga gttagcaaag 660
tccatcggta gcgagggcct tgttgccgga caggtagttg atatcgatag tgaagggttg 720
gctaacgtgg gactagaaca actggagttc atccacctac acaagacagg ggcactgctt 780
gaagcgagtg ttgtacttgg ggctattctg gggggaggaa cagatgagga ggtagaaaaa 840
ctacgtagtt ttgccaggtg tataggacta ctatttcaag ttgtagatga tatccttgac 900
gtcacgaaga gtagtcaaga gttaggaaaa acagcaggga aagatctagt tgccgataaa 960
gtaacctacc ccaggctaat gggtatcgat aaatctcgtg agttcgccga acaattaaat 1020
actgaggcta agcaacattt aagcgggttt gatcctatta aggctgcgcc gctgattgct 1080
ctagcaaact atattgcata tagacagaac tga 1113
<210> 72
<211> 370
<212> PRT
<213> Cannabis sativa
<400> 72
Met Ser Thr Val Asn Leu Thr Trp Val Gln Thr Cys Ser Met Phe Asn
1 5 10 15
Gln Gly Gly Arg Ser Arg Ser Leu Ser Thr Phe Asn Leu Asn Leu Tyr
20 25 30
His Pro Leu Lys Lys Thr Pro Phe Ser Ile Gln Thr Pro Lys Gln Lys
35 40 45
Arg Pro Thr Ser Pro Phe Ser Ser Ile Ser Ala Val Leu Thr Glu Gln
50 55 60
Glu Ala Val Lys Glu Gly Asp Glu Glu Lys Ser Ile Phe Asn Phe Lys
65 70 75 80
Ser Tyr Met Val Gln Lys Ala Asn Ser Val Asn Gln Ala Leu Asp Ser
85 90 95
Ala Val Leu Leu Arg Asp Pro Ile Met Ile His Glu Ser Met Arg Tyr
100 105 110
Ser Leu Leu Ala Gly Gly Lys Arg Val Arg Pro Met Leu Cys Leu Ser
115 120 125
Ala Cys Glu Leu Val Gly Gly Lys Glu Ser Val Ala Met Pro Ala Ala
130 135 140
Cys Ala Val Glu Met Ile His Thr Met Ser Leu Ile His Asp Asp Leu
145 150 155 160
Pro Cys Met Asp Asn Asp Asp Leu Arg Arg Gly Lys Pro Thr Asn His
165 170 175
Lys Val Phe Gly Glu Asp Val Ala Val Leu Ala Gly Asp Ala Leu Leu
180 185 190
Ala Phe Ala Phe Glu His Met Ala Val Ser Thr Val Gly Val Pro Ala
195 200 205
Ala Lys Ile Val Arg Ala Ile Gly Glu Leu Ala Lys Ser Ile Gly Ser
210 215 220
Glu Gly Leu Val Ala Gly Gln Val Val Asp Ile Asp Ser Glu Gly Leu
225 230 235 240
Ala Asn Val Gly Leu Glu Gln Leu Glu Phe Ile His Leu His Lys Thr
245 250 255
Gly Ala Leu Leu Glu Ala Ser Val Val Leu Gly Ala Ile Leu Gly Gly
260 265 270
Gly Thr Asp Glu Glu Val Glu Lys Leu Arg Ser Phe Ala Arg Cys Ile
275 280 285
Gly Leu Leu Phe Gln Val Val Asp Asp Ile Leu Asp Val Thr Lys Ser
290 295 300
Ser Gln Glu Leu Gly Lys Thr Ala Gly Lys Asp Leu Val Ala Asp Lys
305 310 315 320
Val Thr Tyr Pro Arg Leu Met Gly Ile Asp Lys Ser Arg Glu Phe Ala
325 330 335
Glu Gln Leu Asn Thr Glu Ala Lys Gln His Leu Ser Gly Phe Asp Pro
340 345 350
Ile Lys Ala Ala Pro Leu Ile Ala Leu Ala Asn Tyr Ile Ala Tyr Arg
355 360 365
Gln Asn
370
<210> 73
<211> 948
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(948)
<223> 人工香叶基香叶基焦磷酸合成酶小亚基(GPPSssu)核苷酸序列
<400> 73
atggctgttt acaacctttc aatcaactgt tctcccagat tcgtccatca tgtatacgtg 60
ccccatttta catgtaaatc aaataagagc ctgagccatg tccccatgag aatcacgatg 120
tcaaagcagc atcatcactc atactttgcc tctacaacgg cagatgtcga tgcccatcta 180
aaacaatcaa tcacaattaa acccccgttg tctgtccacg aagccatgta taactttatc 240
ttcagtacgc caccgaattt ggcgccatca ttatgtgtcg cagcatgtga attggttggg 300
ggtcaccagg gacaggcgat ggcagcggcc agcgcattaa gggtaataca tgctagcatc 360
gttacccacg atcaccttcc gttaacggga aggccaaacc ccacctcacc ggaggccgct 420
acgcacaatt cctataatcc aaacatacag ttgttattac ctgacgccat tacacccttc 480
gggtttgagc tattagcgtc cagtgatgat cttacacaca acaagagtga gagagttctt 540
agggtgatcg ttgaatttac gaggactttc ggttccagag gcactataga cgcccaatac 600
cacgaaaagt tggctagtag gtttgatgtg gatagccatg aggcaaagac cgtaggatgg 660
gggcattacc catcattgaa aaaggaggga gccatgcacg catgtgctgc tgcctgcgga 720
gcaatattgg gtgaggctca tgaagaagaa gtggaaaaat tgcgtacatt cgggctgtat 780
gtcggcatga tccaaggtta tgcgaacaga ttcatcatga gcagtacaga ggagaaaaaa 840
gaggctgaca ggataattga ggagcttacc aatttagcgc gtcaggagct gaaatacttc 900
gatggaagga acctagaacc gttttcaaca ttcttgttcc gtttgtag 948
<210> 74
<211> 315
<212> PRT
<213> Cannabis sativa
<400> 74
Met Ala Val Tyr Asn Leu Ser Ile Asn Cys Ser Pro Arg Phe Val His
1 5 10 15
His Val Tyr Val Pro His Phe Thr Cys Lys Ser Asn Lys Ser Leu Ser
20 25 30
His Val Pro Met Arg Ile Thr Met Ser Lys Gln His His His Ser Tyr
35 40 45
Phe Ala Ser Thr Thr Ala Asp Val Asp Ala His Leu Lys Gln Ser Ile
50 55 60
Thr Ile Lys Pro Pro Leu Ser Val His Glu Ala Met Tyr Asn Phe Ile
65 70 75 80
Phe Ser Thr Pro Pro Asn Leu Ala Pro Ser Leu Cys Val Ala Ala Cys
85 90 95
Glu Leu Val Gly Gly His Gln Gly Gln Ala Met Ala Ala Ala Ser Ala
100 105 110
Leu Arg Val Ile His Ala Ser Ile Val Thr His Asp His Leu Pro Leu
115 120 125
Thr Gly Arg Pro Asn Pro Thr Ser Pro Glu Ala Ala Thr His Asn Ser
130 135 140
Tyr Asn Pro Asn Ile Gln Leu Leu Leu Pro Asp Ala Ile Thr Pro Phe
145 150 155 160
Gly Phe Glu Leu Leu Ala Ser Ser Asp Asp Leu Thr His Asn Lys Ser
165 170 175
Glu Arg Val Leu Arg Val Ile Val Glu Phe Thr Arg Thr Phe Gly Ser
180 185 190
Arg Gly Thr Ile Asp Ala Gln Tyr His Glu Lys Leu Ala Ser Arg Phe
195 200 205
Asp Val Asp Ser His Glu Ala Lys Thr Val Gly Trp Gly His Tyr Pro
210 215 220
Ser Leu Lys Lys Glu Gly Ala Met His Ala Cys Ala Ala Ala Cys Gly
225 230 235 240
Ala Ile Leu Gly Glu Ala His Glu Glu Glu Val Glu Lys Leu Arg Thr
245 250 255
Phe Gly Leu Tyr Val Gly Met Ile Gln Gly Tyr Ala Asn Arg Phe Ile
260 265 270
Met Ser Ser Thr Glu Glu Lys Lys Glu Ala Asp Arg Ile Ile Glu Glu
275 280 285
Leu Thr Asn Leu Ala Arg Gln Glu Leu Lys Tyr Phe Asp Gly Arg Asn
290 295 300
Leu Glu Pro Phe Ser Thr Phe Leu Phe Arg Leu
305 310 315
<210> 75
<211> 1161
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(1161)
<223> 人工四酮体合成酶(TKS)核苷酸序列
<400> 75
atgaatcatt taagagctga aggtccagcc tccgttttgg ccatcggtac cgctaaccct 60
gaaaacattt tgttgcaaga cgaattccca gactactact tcagagtcac taagtccgaa 120
cacatgaccc aattgaagga gaagttcaga aagatttgtg acaagtccat gattagaaag 180
agaaactgtt tcttgaacga agaacacttg aagcaaaacc caagattggt tgaacatgaa 240
atgcaaactt tggacgctag acaagacatg ttggttgttg aagtccctaa gttgggtaag 300
gatgcctgtg ctaaggccat taaagaatgg ggtcaaccta agtccaagat tacccacttg 360
attttcacct ctgcctccac cactgacatg cctggtgctg attaccactg cgctaagtta 420
ttgggtttgt ctccatccgt taagagagtt atgatgtacc aattgggttg ctacggtggt 480
ggtactgttt taagaattgc taaggatatt gctgaaaaca acaagggtgc cagagtctta 540
gctgtctgct gtgacattat ggcttgttta ttcagaggtc catctgaatc cgacttggaa 600
ttgttggttg gtcaagctat cttcggtgac ggtgctgctg ccgttattgt tggtgctgaa 660
ccagacgaat ccgttggtga aagaccaatt tttgaattgg tttccaccgg tcaaactatt 720
ttgccaaatt ccgaaggtac catcggtggt catatcagag aagccggttt gatcttcgac 780
ttacataagg atgtcccaat gttgatctct aacaacattg aaaagtgttt gatcgaagct 840
tttaccccaa ttggtatttc tgactggaac tctatcttct ggattaccca tcctggtggt 900
aaggctattt tggataaggt cgaggaaaaa ttgcacttga agtctgacaa gttcgttgac 960
tctagacacg tcttgtccga acatggtaat atgtcctctt ccaccgtttt attcgttatg 1020
gatgagttga gaaagagatc cttagaagaa ggtaagtcca ccaccggtga tggttttgag 1080
tggggtgttt tgttcggttt cggtccaggt ttgaccgtcg aaagagttgt tgttagatct 1140
gtcccaatta agtacggatc c 1161
<210> 76
<211> 387
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(387)
<223> 人工四酮体合成酶(TKS)
<400> 76
Met Asn His Leu Arg Ala Glu Gly Pro Ala Ser Val Leu Ala Ile Gly
1 5 10 15
Thr Ala Asn Pro Glu Asn Ile Leu Leu Gln Asp Glu Phe Pro Asp Tyr
20 25 30
Tyr Phe Arg Val Thr Lys Ser Glu His Met Thr Gln Leu Lys Glu Lys
35 40 45
Phe Arg Lys Ile Cys Asp Lys Ser Met Ile Arg Lys Arg Asn Cys Phe
50 55 60
Leu Asn Glu Glu His Leu Lys Gln Asn Pro Arg Leu Val Glu His Glu
65 70 75 80
Met Gln Thr Leu Asp Ala Arg Gln Asp Met Leu Val Val Glu Val Pro
85 90 95
Lys Leu Gly Lys Asp Ala Cys Ala Lys Ala Ile Lys Glu Trp Gly Gln
100 105 110
Pro Lys Ser Lys Ile Thr His Leu Ile Phe Thr Ser Ala Ser Thr Thr
115 120 125
Asp Met Pro Gly Ala Asp Tyr His Cys Ala Lys Leu Leu Gly Leu Ser
130 135 140
Pro Ser Val Lys Arg Val Met Met Tyr Gln Leu Gly Cys Tyr Gly Gly
145 150 155 160
Gly Thr Val Leu Arg Ile Ala Lys Asp Ile Ala Glu Asn Asn Lys Gly
165 170 175
Ala Arg Val Leu Ala Val Cys Cys Asp Ile Met Ala Cys Leu Phe Arg
180 185 190
Gly Pro Ser Glu Ser Asp Leu Glu Leu Leu Val Gly Gln Ala Ile Phe
195 200 205
Gly Asp Gly Ala Ala Ala Val Ile Val Gly Ala Glu Pro Asp Glu Ser
210 215 220
Val Gly Glu Arg Pro Ile Phe Glu Leu Val Ser Thr Gly Gln Thr Ile
225 230 235 240
Leu Pro Asn Ser Glu Gly Thr Ile Gly Gly His Ile Arg Glu Ala Gly
245 250 255
Leu Ile Phe Asp Leu His Lys Asp Val Pro Met Leu Ile Ser Asn Asn
260 265 270
Ile Glu Lys Cys Leu Ile Glu Ala Phe Thr Pro Ile Gly Ile Ser Asp
275 280 285
Trp Asn Ser Ile Phe Trp Ile Thr His Pro Gly Gly Lys Ala Ile Leu
290 295 300
Asp Lys Val Glu Glu Lys Leu His Leu Lys Ser Asp Lys Phe Val Asp
305 310 315 320
Ser Arg His Val Leu Ser Glu His Gly Asn Met Ser Ser Ser Thr Val
325 330 335
Leu Phe Val Met Asp Glu Leu Arg Lys Arg Ser Leu Glu Glu Gly Lys
340 345 350
Ser Thr Thr Gly Asp Gly Phe Glu Trp Gly Val Leu Phe Gly Phe Gly
355 360 365
Pro Gly Leu Thr Val Glu Arg Val Val Val Arg Ser Val Pro Ile Lys
370 375 380
Tyr Gly Ser
385
<210> 77
<211> 309
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(309)
<223> 人工橄榄醇酸环化酶(OAC)核苷酸序列
<400> 77
atggccgtca agcacttgat cgttttgaag ttcaaggatg aaatcactga agctcaaaag 60
gaagaattct tcaaaaccta cgtcaactta gtcaatatta ttccagccat gaaggacgtc 120
tattggggta aggacgttac tcaaaagaat aaggaggaag gttatactca tatcgttgag 180
gtcactttcg aatctgttga gactattcaa gactacatca tccacccagc ccacgttggt 240
ttcggtgatg tttatcgttc cttctgggaa aaattgttga tcttcgacta cacccctaga 300
aagggatcc 309
<210> 78
<211> 103
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(103)
<223> 人工橄榄醇酸环化酶(OAC)
<400> 78
Met Ala Val Lys His Leu Ile Val Leu Lys Phe Lys Asp Glu Ile Thr
1 5 10 15
Glu Ala Gln Lys Glu Glu Phe Phe Lys Thr Tyr Val Asn Leu Val Asn
20 25 30
Ile Ile Pro Ala Met Lys Asp Val Tyr Trp Gly Lys Asp Val Thr Gln
35 40 45
Lys Asn Lys Glu Glu Gly Tyr Thr His Ile Val Glu Val Thr Phe Glu
50 55 60
Ser Val Glu Thr Ile Gln Asp Tyr Ile Ile His Pro Ala His Val Gly
65 70 75 80
Phe Gly Asp Val Tyr Arg Ser Phe Trp Glu Lys Leu Leu Ile Phe Asp
85 90 95
Tyr Thr Pro Arg Lys Gly Ser
100
<210> 79
<211> 1578
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(1578)
<223> 融合四酮体合成酶-橄榄醇酸环化酶(TKS-OAC)
<400> 79
atgaatcatt taagagctga aggtccagcc tccgttttgg ccatcggtac cgctaaccct 60
gaaaacattt tgttgcaaga cgaattccca gactactact tcagagtcac taagtccgaa 120
cacatgaccc aattgaagga gaagttcaga aagatttgtg acaagtccat gattagaaag 180
agaaactgtt tcttgaacga agaacacttg aagcaaaacc caagattggt tgaacatgaa 240
atgcaaactt tggacgctag acaagacatg ttggttgttg aagtccctaa gttgggtaag 300
gatgcctgtg ctaaggccat taaagaatgg ggtcaaccta agtccaagat tacccacttg 360
attttcacct ctgcctccac cactgacatg cctggtgctg attaccactg cgctaagtta 420
ttgggtttgt ctccatccgt taagagagtt atgatgtacc aattgggttg ctacggtggt 480
ggtactgttt taagaattgc taaggatatt gctgaaaaca acaagggtgc cagagtctta 540
gctgtctgct gtgacattat ggcttgttta ttcagaggtc catctgaatc cgacttggaa 600
ttgttggttg gtcaagctat cttcggtgac ggtgctgctg ccgttattgt tggtgctgaa 660
ccagacgaat ccgttggtga aagaccaatt tttgaattgg tttccaccgg tcaaactatt 720
ttgccaaatt ccgaaggtac catcggtggt catatcagag aagccggttt gatcttcgac 780
ttacataagg atgtcccaat gttgatctct aacaacattg aaaagtgttt gatcgaagct 840
tttaccccaa ttggtatttc tgactggaac tctatcttct ggattaccca tcctggtggt 900
aaggctattt tggataaggt cgaggaaaaa ttgcacttga agtctgacaa gttcgttgac 960
tctagacacg tcttgtccga acatggtaat atgtcctctt ccaccgtttt attcgttatg 1020
gatgagttga gaaagagatc cttagaagaa ggtaagtcca ccaccggtga tggttttgag 1080
tggggtgttt tgttcggttt cggtccaggt ttgaccgtcg aaagagttgt tgttagatct 1140
gtcccaatta agtacgcagc cacaagcggt tctacgggct ccacgggctc taccggcagt 1200
gggaggagca ctgggtcaac gggatcaaca ggtagtggaa gatcacacat ggttgccgtc 1260
aagcacttga tcgttttgaa gttcaaggat gaaatcactg aagctcaaaa ggaagaattc 1320
ttcaaaacct acgtcaactt agtcaatatt attccagcca tgaaggacgt ctattggggt 1380
aaggacgtta ctcaaaagaa taaggaggaa ggttatactc atatcgttga ggtcactttc 1440
gaatctgttg agactattca agactacatc atccacccag cccacgttgg tttcggtgat 1500
gtttatcgtt ccttctggga aaaattgttg atcttcgact acacccctag aaagggtaac 1560
tcgagagctt ttgattaa 1578
<210> 80
<211> 525
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(525)
<223> 融合四酮体合成酶-橄榄醇酸环化酶(TKS-OAC)
<400> 80
Met Asn His Leu Arg Ala Glu Gly Pro Ala Ser Val Leu Ala Ile Gly
1 5 10 15
Thr Ala Asn Pro Glu Asn Ile Leu Leu Gln Asp Glu Phe Pro Asp Tyr
20 25 30
Tyr Phe Arg Val Thr Lys Ser Glu His Met Thr Gln Leu Lys Glu Lys
35 40 45
Phe Arg Lys Ile Cys Asp Lys Ser Met Ile Arg Lys Arg Asn Cys Phe
50 55 60
Leu Asn Glu Glu His Leu Lys Gln Asn Pro Arg Leu Val Glu His Glu
65 70 75 80
Met Gln Thr Leu Asp Ala Arg Gln Asp Met Leu Val Val Glu Val Pro
85 90 95
Lys Leu Gly Lys Asp Ala Cys Ala Lys Ala Ile Lys Glu Trp Gly Gln
100 105 110
Pro Lys Ser Lys Ile Thr His Leu Ile Phe Thr Ser Ala Ser Thr Thr
115 120 125
Asp Met Pro Gly Ala Asp Tyr His Cys Ala Lys Leu Leu Gly Leu Ser
130 135 140
Pro Ser Val Lys Arg Val Met Met Tyr Gln Leu Gly Cys Tyr Gly Gly
145 150 155 160
Gly Thr Val Leu Arg Ile Ala Lys Asp Ile Ala Glu Asn Asn Lys Gly
165 170 175
Ala Arg Val Leu Ala Val Cys Cys Asp Ile Met Ala Cys Leu Phe Arg
180 185 190
Gly Pro Ser Glu Ser Asp Leu Glu Leu Leu Val Gly Gln Ala Ile Phe
195 200 205
Gly Asp Gly Ala Ala Ala Val Ile Val Gly Ala Glu Pro Asp Glu Ser
210 215 220
Val Gly Glu Arg Pro Ile Phe Glu Leu Val Ser Thr Gly Gln Thr Ile
225 230 235 240
Leu Pro Asn Ser Glu Gly Thr Ile Gly Gly His Ile Arg Glu Ala Gly
245 250 255
Leu Ile Phe Asp Leu His Lys Asp Val Pro Met Leu Ile Ser Asn Asn
260 265 270
Ile Glu Lys Cys Leu Ile Glu Ala Phe Thr Pro Ile Gly Ile Ser Asp
275 280 285
Trp Asn Ser Ile Phe Trp Ile Thr His Pro Gly Gly Lys Ala Ile Leu
290 295 300
Asp Lys Val Glu Glu Lys Leu His Leu Lys Ser Asp Lys Phe Val Asp
305 310 315 320
Ser Arg His Val Leu Ser Glu His Gly Asn Met Ser Ser Ser Thr Val
325 330 335
Leu Phe Val Met Asp Glu Leu Arg Lys Arg Ser Leu Glu Glu Gly Lys
340 345 350
Ser Thr Thr Gly Asp Gly Phe Glu Trp Gly Val Leu Phe Gly Phe Gly
355 360 365
Pro Gly Leu Thr Val Glu Arg Val Val Val Arg Ser Val Pro Ile Lys
370 375 380
Tyr Ala Ala Thr Ser Gly Ser Thr Gly Ser Thr Gly Ser Thr Gly Ser
385 390 395 400
Gly Arg Ser Thr Gly Ser Thr Gly Ser Thr Gly Ser Gly Arg Ser His
405 410 415
Met Val Ala Val Lys His Leu Ile Val Leu Lys Phe Lys Asp Glu Ile
420 425 430
Thr Glu Ala Gln Lys Glu Glu Phe Phe Lys Thr Tyr Val Asn Leu Val
435 440 445
Asn Ile Ile Pro Ala Met Lys Asp Val Tyr Trp Gly Lys Asp Val Thr
450 455 460
Gln Lys Asn Lys Glu Glu Gly Tyr Thr His Ile Val Glu Val Thr Phe
465 470 475 480
Glu Ser Val Glu Thr Ile Gln Asp Tyr Ile Ile His Pro Ala His Val
485 490 495
Gly Phe Gly Asp Val Tyr Arg Ser Phe Trp Glu Lys Leu Leu Ile Phe
500 505 510
Asp Tyr Thr Pro Arg Lys Gly Asn Ser Arg Ala Phe Asp
515 520 525
<210> 81
<211> 1185
<212> DNA
<213> Cannabis sativa
<400> 81
atgggattgt ccagcgtgtg caccttctca ttccaaacca actaccatac acttctcaat 60
ccgcacaata ataacccgaa aaccagctta ttatgttata gacacccgaa gacgcctatt 120
aagtacagtt ataacaactt tcctagcaag cattgctcta ctaaaagttt tcatctgcaa 180
aacaagtgct ctgagtcctt gagtatagca aagaatagca ttagagctgc aacgacaaat 240
caaaccgagc cgccggagtc tgataaccat agtgtggcga ccaagatact aaattttggc 300
aaagcgtgtt ggaagctaca acgaccttat actattatcg cgtttacgag ttgtgcatgt 360
gggctgttcg ggaaagagct cttgcacaat acaaacttaa tcagttggag tttgatgttc 420
aaagcatttt tttttctcgt cgctatctta tgtatcgcgt catttaccac gaccataaat 480
caaatatacg atctgcatat cgatcgtatc aataagcccg acctcccact ggcctcaggt 540
gaaatttccg ttaacacggc gtggattatg agtataatcg tagcactatt tggacttatt 600
ataaccatca aaatgaaggg cggtcctcta tacatttttg gatattgttt tgggattttt 660
ggaggtatag tctattccgt ccccccattc agatggaaac aaaacccgtc caccgctttc 720
cttttaaatt tcttggcaca tatcatcaca aacttcacgt tttactatgc cagccgagcc 780
gcactgggac tcccgttcga gttgcgtccg tcattcacct tccttttagc ttttatgaaa 840
tctatgggaa gcgctttagc tttaattaag gacgcgagcg acgtggaagg ggacacgaaa 900
ttcggtataa gcacgctggc ttcaaaatat ggaagtcgta atctcactct attttgttct 960
gggattgtac tcctaagtta cgtagctgcg atactcgcag gcattatatg gccacaagct 1020
ttcaactcca acgtaatgtt gctatcacat gcaatcttgg ccttctggct catccttcaa 1080
actagagatt ttgcactaac gaactacgat ccagaagcgg gtcgtcgatt ttacgaattt 1140
atgtggaaac tgtactatgc tgagtacctc gtctatgtgt tcata 1185
<210> 82
<211> 395
<212> PRT
<213> Cannabis sativa
<400> 82
Met Gly Leu Ser Ser Val Cys Thr Phe Ser Phe Gln Thr Asn Tyr His
1 5 10 15
Thr Leu Leu Asn Pro His Asn Asn Asn Pro Lys Thr Ser Leu Leu Cys
20 25 30
Tyr Arg His Pro Lys Thr Pro Ile Lys Tyr Ser Tyr Asn Asn Phe Pro
35 40 45
Ser Lys His Cys Ser Thr Lys Ser Phe His Leu Gln Asn Lys Cys Ser
50 55 60
Glu Ser Leu Ser Ile Ala Lys Asn Ser Ile Arg Ala Ala Thr Thr Asn
65 70 75 80
Gln Thr Glu Pro Pro Glu Ser Asp Asn His Ser Val Ala Thr Lys Ile
85 90 95
Leu Asn Phe Gly Lys Ala Cys Trp Lys Leu Gln Arg Pro Tyr Thr Ile
100 105 110
Ile Ala Phe Thr Ser Cys Ala Cys Gly Leu Phe Gly Lys Glu Leu Leu
115 120 125
His Asn Thr Asn Leu Ile Ser Trp Ser Leu Met Phe Lys Ala Phe Phe
130 135 140
Phe Leu Val Ala Ile Leu Cys Ile Ala Ser Phe Thr Thr Thr Ile Asn
145 150 155 160
Gln Ile Tyr Asp Leu His Ile Asp Arg Ile Asn Lys Pro Asp Leu Pro
165 170 175
Leu Ala Ser Gly Glu Ile Ser Val Asn Thr Ala Trp Ile Met Ser Ile
180 185 190
Ile Val Ala Leu Phe Gly Leu Ile Ile Thr Ile Lys Met Lys Gly Gly
195 200 205
Pro Leu Tyr Ile Phe Gly Tyr Cys Phe Gly Ile Phe Gly Gly Ile Val
210 215 220
Tyr Ser Val Pro Pro Phe Arg Trp Lys Gln Asn Pro Ser Thr Ala Phe
225 230 235 240
Leu Leu Asn Phe Leu Ala His Ile Ile Thr Asn Phe Thr Phe Tyr Tyr
245 250 255
Ala Ser Arg Ala Ala Leu Gly Leu Pro Phe Glu Leu Arg Pro Ser Phe
260 265 270
Thr Phe Leu Leu Ala Phe Met Lys Ser Met Gly Ser Ala Leu Ala Leu
275 280 285
Ile Lys Asp Ala Ser Asp Val Glu Gly Asp Thr Lys Phe Gly Ile Ser
290 295 300
Thr Leu Ala Ser Lys Tyr Gly Ser Arg Asn Leu Thr Leu Phe Cys Ser
305 310 315 320
Gly Ile Val Leu Leu Ser Tyr Val Ala Ala Ile Leu Ala Gly Ile Ile
325 330 335
Trp Pro Gln Ala Phe Asn Ser Asn Val Met Leu Leu Ser His Ala Ile
340 345 350
Leu Ala Phe Trp Leu Ile Leu Gln Thr Arg Asp Phe Ala Leu Thr Asn
355 360 365
Tyr Asp Pro Glu Ala Gly Arg Arg Phe Tyr Glu Phe Met Trp Lys Leu
370 375 380
Tyr Tyr Ala Glu Tyr Leu Val Tyr Val Phe Ile
385 390 395
<210> 83
<211> 921
<212> DNA
<213> Streptomyces sp.
<400> 83
atgtctgagg cggcagacgt agagagagta tacgctgcta tggaggaagc ggctggatta 60
ttgggggtgg cttgtgccag agacaagata tatccgttac tgtctacttt ccaggacact 120
cttgtagaag gagggagtgt ggtggtgttt agtatggcat caggccgtca ttcaacagag 180
ctagatttca gtatatctgt gccaacaagt cacggtgatc catacgcaac cgtagtcgag 240
aagggtcttt tcccggcaac agggcatcct gtagatgatt tgcttgccga cacacagaag 300
cacctgcccg tctccatgtt cgcaatcgat ggtgaggtga ccggaggatt taaaaagact 360
tacgctttct tcccgactga caatatgcca ggagttgccg agttgagtgc aataccatcc 420
atgccgccag cagtcgcgga gaacgccgaa ttgttcgccc gttacggctt ggacaaagtc 480
caaatgacta gtatggacta taaaaagagg caggtgaatc tatatttcag cgaactttct 540
gcccaaacct tggaggcgga gagcgtttta gcccttgtta gggagttagg gctacacgtc 600
ccgaatgagt tgggtttgaa attttgtaag cgtagctttt cagtatatcc gacgctgaac 660
tgggaaactg gaaagattga caggctatgc tttgcagtga tttctaatga ccctacgctt 720
gtaccttcct cagacgaggg cgacatcgag aaattccaca actatgccac aaaagctccg 780
tatgcctacg tcggcgaaaa acgtactcta gtatacggtt tgactctgag tcccaaggaa 840
gagtattaca agctaggagc gtactatcat atcactgatg tgcaacgtgg cttgctgaaa 900
gccttcgact ccttagagga c 921
<210> 84
<211> 307
<212> PRT
<213> Streptomyces sp.
<400> 84
Met Ser Glu Ala Ala Asp Val Glu Arg Val Tyr Ala Ala Met Glu Glu
1 5 10 15
Ala Ala Gly Leu Leu Gly Val Ala Cys Ala Arg Asp Lys Ile Tyr Pro
20 25 30
Leu Leu Ser Thr Phe Gln Asp Thr Leu Val Glu Gly Gly Ser Val Val
35 40 45
Val Phe Ser Met Ala Ser Gly Arg His Ser Thr Glu Leu Asp Phe Ser
50 55 60
Ile Ser Val Pro Thr Ser His Gly Asp Pro Tyr Ala Thr Val Val Glu
65 70 75 80
Lys Gly Leu Phe Pro Ala Thr Gly His Pro Val Asp Asp Leu Leu Ala
85 90 95
Asp Thr Gln Lys His Leu Pro Val Ser Met Phe Ala Ile Asp Gly Glu
100 105 110
Val Thr Gly Gly Phe Lys Lys Thr Tyr Ala Phe Phe Pro Thr Asp Asn
115 120 125
Met Pro Gly Val Ala Glu Leu Ser Ala Ile Pro Ser Met Pro Pro Ala
130 135 140
Val Ala Glu Asn Ala Glu Leu Phe Ala Arg Tyr Gly Leu Asp Lys Val
145 150 155 160
Gln Met Thr Ser Met Asp Tyr Lys Lys Arg Gln Val Asn Leu Tyr Phe
165 170 175
Ser Glu Leu Ser Ala Gln Thr Leu Glu Ala Glu Ser Val Leu Ala Leu
180 185 190
Val Arg Glu Leu Gly Leu His Val Pro Asn Glu Leu Gly Leu Lys Phe
195 200 205
Cys Lys Arg Ser Phe Ser Val Tyr Pro Thr Leu Asn Trp Glu Thr Gly
210 215 220
Lys Ile Asp Arg Leu Cys Phe Ala Val Ile Ser Asn Asp Pro Thr Leu
225 230 235 240
Val Pro Ser Ser Asp Glu Gly Asp Ile Glu Lys Phe His Asn Tyr Ala
245 250 255
Thr Lys Ala Pro Tyr Ala Tyr Val Gly Glu Lys Arg Thr Leu Val Tyr
260 265 270
Gly Leu Thr Leu Ser Pro Lys Glu Glu Tyr Tyr Lys Leu Gly Ala Tyr
275 280 285
Tyr His Ile Thr Asp Val Gln Arg Gly Leu Leu Lys Ala Phe Asp Ser
290 295 300
Leu Glu Asp
305
<210> 85
<211> 1635
<212> DNA
<213> Cannabis sativa
<400> 85
atgaactgtt ccgcgtttag tttctggttc gtgtgcaaga tcatcttctt ttttctaagc 60
ttcaacattc aaatcagcat cgcgaatcct caggagaact tcctgaagtg tttctcagaa 120
tacataccaa ataatcccgc caatcctaaa tttatatata cccaacatga tcagctatac 180
atgagtgtat tgaactctac gattcagaat ctaagattca catctgatac aacgccgaaa 240
cctctagtaa tcgtgacacc gtctaatgtc tcccatattc aagcttctat cttgtgctca 300
aagaaagtcg gtcttcaaat aaggacacgt tctggcgggc atgacgccga gggcatgtca 360
tatatcagcc aagtaccatt tgtagtcgtg gatttaagaa acatgcattc tataaaaatc 420
gacgttcact cccaaacggc atgggtggaa gctggagcga cactggggga ggtgtactac 480
tggatcaatg aaaagaacga aaatttttcc ttccccggag gatattgtcc gacagttggg 540
gtggggggcc acttctctgg cggcgggtac ggcgctctga tgcgtaatta tggactggcc 600
gcagataaca taatcgacgc gcatttggtg aacgttgacg ggaaggtttt ggataggaag 660
tctatgggag aggacctatt ctgggcaatt agaggcggag gaggagagaa ttttggtatt 720
attgctgcat ggaagattaa attggttgcg gtgccgagta aaagtaccat cttttccgtc 780
aagaaaaaca tggagattca cggactagtt aagctgttta ataaatggca aaacatcgcc 840
tataagtacg acaaagattt ggttctgatg acgcatttca taactaagaa tataactgat 900
aatcacggca agaataagac cactgtgcac ggttatttta gttcaatatt ccatggcggc 960
gttgactccc ttgtcgattt gatgaataag agcttccctg aattgggtat caagaagaca 1020
gactgcaaag aattctcctg gattgatacg actatcttct attcaggggt cgtgaatttc 1080
aacactgcga atttcaaaaa ggagatattg ttagaccgtt ccgcgggaaa aaaaactgcg 1140
ttttctatta aactagatta tgtgaaaaaa ccgattcctg agacagccat ggttaagatt 1200
cttgaaaaat tgtatgaaga ggatgtcggg gtcggtatgt acgtccttta cccttacgga 1260
ggaatcatgg aagaaatatc cgaatctgca attcctttcc cgcatcgtgc cggtattatg 1320
tatgagctat ggtacaccgc tagctgggag aagcaggaag ataacgagaa gcatatcaat 1380
tgggtgaggt ctgtgtataa ttttacaaca ccatacgtca gtcaaaaccc tagattggcc 1440
tatcttaact atcgtgatct ggacttggga aaaacaaatc cagaatcccc aaataactac 1500
actcaagccc gtatatgggg cgagaagtac ttcggcaaaa atttcaatag actggtcaaa 1560
gttaagacga aagcagaccc taataatttc ttccgtaacg aacaatcaat tcccccgctt 1620
ccgccacacc atcac 1635
<210> 86
<211> 545
<212> PRT
<213> Cannabis sativa
<400> 86
Met Asn Cys Ser Ala Phe Ser Phe Trp Phe Val Cys Lys Ile Ile Phe
1 5 10 15
Phe Phe Leu Ser Phe Asn Ile Gln Ile Ser Ile Ala Asn Pro Gln Glu
20 25 30
Asn Phe Leu Lys Cys Phe Ser Glu Tyr Ile Pro Asn Asn Pro Ala Asn
35 40 45
Pro Lys Phe Ile Tyr Thr Gln His Asp Gln Leu Tyr Met Ser Val Leu
50 55 60
Asn Ser Thr Ile Gln Asn Leu Arg Phe Thr Ser Asp Thr Thr Pro Lys
65 70 75 80
Pro Leu Val Ile Val Thr Pro Ser Asn Val Ser His Ile Gln Ala Ser
85 90 95
Ile Leu Cys Ser Lys Lys Val Gly Leu Gln Ile Arg Thr Arg Ser Gly
100 105 110
Gly His Asp Ala Glu Gly Met Ser Tyr Ile Ser Gln Val Pro Phe Val
115 120 125
Val Val Asp Leu Arg Asn Met His Ser Ile Lys Ile Asp Val His Ser
130 135 140
Gln Thr Ala Trp Val Glu Ala Gly Ala Thr Leu Gly Glu Val Tyr Tyr
145 150 155 160
Trp Ile Asn Glu Lys Asn Glu Asn Phe Ser Phe Pro Gly Gly Tyr Cys
165 170 175
Pro Thr Val Gly Val Gly Gly His Phe Ser Gly Gly Gly Tyr Gly Ala
180 185 190
Leu Met Arg Asn Tyr Gly Leu Ala Ala Asp Asn Ile Ile Asp Ala His
195 200 205
Leu Val Asn Val Asp Gly Lys Val Leu Asp Arg Lys Ser Met Gly Glu
210 215 220
Asp Leu Phe Trp Ala Ile Arg Gly Gly Gly Gly Glu Asn Phe Gly Ile
225 230 235 240
Ile Ala Ala Trp Lys Ile Lys Leu Val Ala Val Pro Ser Lys Ser Thr
245 250 255
Ile Phe Ser Val Lys Lys Asn Met Glu Ile His Gly Leu Val Lys Leu
260 265 270
Phe Asn Lys Trp Gln Asn Ile Ala Tyr Lys Tyr Asp Lys Asp Leu Val
275 280 285
Leu Met Thr His Phe Ile Thr Lys Asn Ile Thr Asp Asn His Gly Lys
290 295 300
Asn Lys Thr Thr Val His Gly Tyr Phe Ser Ser Ile Phe His Gly Gly
305 310 315 320
Val Asp Ser Leu Val Asp Leu Met Asn Lys Ser Phe Pro Glu Leu Gly
325 330 335
Ile Lys Lys Thr Asp Cys Lys Glu Phe Ser Trp Ile Asp Thr Thr Ile
340 345 350
Phe Tyr Ser Gly Val Val Asn Phe Asn Thr Ala Asn Phe Lys Lys Glu
355 360 365
Ile Leu Leu Asp Arg Ser Ala Gly Lys Lys Thr Ala Phe Ser Ile Lys
370 375 380
Leu Asp Tyr Val Lys Lys Pro Ile Pro Glu Thr Ala Met Val Lys Ile
385 390 395 400
Leu Glu Lys Leu Tyr Glu Glu Asp Val Gly Val Gly Met Tyr Val Leu
405 410 415
Tyr Pro Tyr Gly Gly Ile Met Glu Glu Ile Ser Glu Ser Ala Ile Pro
420 425 430
Phe Pro His Arg Ala Gly Ile Met Tyr Glu Leu Trp Tyr Thr Ala Ser
435 440 445
Trp Glu Lys Gln Glu Asp Asn Glu Lys His Ile Asn Trp Val Arg Ser
450 455 460
Val Tyr Asn Phe Thr Thr Pro Tyr Val Ser Gln Asn Pro Arg Leu Ala
465 470 475 480
Tyr Leu Asn Tyr Arg Asp Leu Asp Leu Gly Lys Thr Asn Pro Glu Ser
485 490 495
Pro Asn Asn Tyr Thr Gln Ala Arg Ile Trp Gly Glu Lys Tyr Phe Gly
500 505 510
Lys Asn Phe Asn Arg Leu Val Lys Val Lys Thr Lys Ala Asp Pro Asn
515 520 525
Asn Phe Phe Arg Asn Glu Gln Ser Ile Pro Pro Leu Pro Pro His His
530 535 540
His
545
<210> 87
<211> 1632
<212> DNA
<213> Cannabis sativa
<400> 87
atgaaatgtt ctactttcag tttttggttc gtgtgtaaga tcatcttttt ctttttcagc 60
ttcaatatac agacaagtat cgccaatcca agagaaaatt tcttaaaatg tttttcacag 120
tacatcccta ataacgccac taacctgaaa ttagtgtaca cccaaaataa tcctctttat 180
atgtctgttt taaactccac gatccataat ttaaggttta catcagatac gacaccaaag 240
cccttggtaa tcgtgactcc cagccacgtg agccacatac aggggaccat cctgtgctct 300
aagaaagtag gcttgcagat caggacaaga tccggtggac acgacagtga gggaatgtcc 360
tatatttcac aagtcccctt cgttatagta gatctgagga acatgaggtc cattaagatt 420
gatgtgcact cacaaacggc ttgggttgaa gctggagcca cattgggaga ggtttattac 480
tgggtgaatg agaagaacga gaacctttca ttagcagcgg gatattgtcc cacggtgtgc 540
gcaggtgggc atttcggggg aggagggtac ggccctttga tgagaaatta cgggctagcg 600
gcagacaaca tcatcgacgc ccatctggtg aacgtgcatg gaaaagtact ggacagaaag 660
tcaatgggcg aggacctgtt ttgggctttg agagggggcg gtgcagagtc atttggcatc 720
atagttgcat ggaaaatcag acttgttgcc gtcccaaagt ccacaatgtt ctctgttaag 780
aaaatcatgg agatacacga attggtgaaa ttagtgaata aatggcaaaa catagcgtac 840
aagtacgaca aagacttact gctgatgaca cactttatca cccgtaatat tacagataat 900
cagggtaaga acaaaaccgc gatccataca tatttttcat ccgtttttct aggcggtgtc 960
gattcattag tagatctgat gaacaaatct ttccccgaac ttggtatcaa aaagactgat 1020
tgcagacagt tatcatggat tgatacaata attttctatt ctggtgtcgt aaattacgat 1080
accgataatt ttaataagga aatactatta gatcgttccg ctgggcagaa tggtgcattc 1140
aagataaaac ttgattatgt caaaaagccc attccagaga gtgtctttgt gcagatcctt 1200
gagaagttgt atgaagaaga cattggtgca gggatgtacg cgctatatcc gtacgggggt 1260
attatggacg agatttctga gagcgccata ccattcccac acagagcagg aattttatac 1320
gagttatggt atatctgctc atgggaaaaa caggaagaca acgagaagca cttaaactgg 1380
atacgtaata tctataattt tatgacccca tacgtatcaa aaaatccgcg tcttgcgtac 1440
cttaactaca gggacctgga cataggtata aacgacccaa aaaatcccaa taattacacc 1500
caagctagaa tctgggggga gaagtatttc ggtaagaact ttgaccgttt ggtaaaagtc 1560
aaaactctgg tcgatccgaa caatttcttc cgtaacgagc aatccatacc tccgctaccg 1620
agacatagac at 1632
<210> 88
<211> 544
<212> PRT
<213> Cannabis sativa
<400> 88
Met Lys Cys Ser Thr Phe Ser Phe Trp Phe Val Cys Lys Ile Ile Phe
1 5 10 15
Phe Phe Phe Ser Phe Asn Ile Gln Thr Ser Ile Ala Asn Pro Arg Glu
20 25 30
Asn Phe Leu Lys Cys Phe Ser Gln Tyr Ile Pro Asn Asn Ala Thr Asn
35 40 45
Leu Lys Leu Val Tyr Thr Gln Asn Asn Pro Leu Tyr Met Ser Val Leu
50 55 60
Asn Ser Thr Ile His Asn Leu Arg Phe Thr Ser Asp Thr Thr Pro Lys
65 70 75 80
Pro Leu Val Ile Val Thr Pro Ser His Val Ser His Ile Gln Gly Thr
85 90 95
Ile Leu Cys Ser Lys Lys Val Gly Leu Gln Ile Arg Thr Arg Ser Gly
100 105 110
Gly His Asp Ser Glu Gly Met Ser Tyr Ile Ser Gln Val Pro Phe Val
115 120 125
Ile Val Asp Leu Arg Asn Met Arg Ser Ile Lys Ile Asp Val His Ser
130 135 140
Gln Thr Ala Trp Val Glu Ala Gly Ala Thr Leu Gly Glu Val Tyr Tyr
145 150 155 160
Trp Val Asn Glu Lys Asn Glu Asn Leu Ser Leu Ala Ala Gly Tyr Cys
165 170 175
Pro Thr Val Cys Ala Gly Gly His Phe Gly Gly Gly Gly Tyr Gly Pro
180 185 190
Leu Met Arg Asn Tyr Gly Leu Ala Ala Asp Asn Ile Ile Asp Ala His
195 200 205
Leu Val Asn Val His Gly Lys Val Leu Asp Arg Lys Ser Met Gly Glu
210 215 220
Asp Leu Phe Trp Ala Leu Arg Gly Gly Gly Ala Glu Ser Phe Gly Ile
225 230 235 240
Ile Val Ala Trp Lys Ile Arg Leu Val Ala Val Pro Lys Ser Thr Met
245 250 255
Phe Ser Val Lys Lys Ile Met Glu Ile His Glu Leu Val Lys Leu Val
260 265 270
Asn Lys Trp Gln Asn Ile Ala Tyr Lys Tyr Asp Lys Asp Leu Leu Leu
275 280 285
Met Thr His Phe Ile Thr Arg Asn Ile Thr Asp Asn Gln Gly Lys Asn
290 295 300
Lys Thr Ala Ile His Thr Tyr Phe Ser Ser Val Phe Leu Gly Gly Val
305 310 315 320
Asp Ser Leu Val Asp Leu Met Asn Lys Ser Phe Pro Glu Leu Gly Ile
325 330 335
Lys Lys Thr Asp Cys Arg Gln Leu Ser Trp Ile Asp Thr Ile Ile Phe
340 345 350
Tyr Ser Gly Val Val Asn Tyr Asp Thr Asp Asn Phe Asn Lys Glu Ile
355 360 365
Leu Leu Asp Arg Ser Ala Gly Gln Asn Gly Ala Phe Lys Ile Lys Leu
370 375 380
Asp Tyr Val Lys Lys Pro Ile Pro Glu Ser Val Phe Val Gln Ile Leu
385 390 395 400
Glu Lys Leu Tyr Glu Glu Asp Ile Gly Ala Gly Met Tyr Ala Leu Tyr
405 410 415
Pro Tyr Gly Gly Ile Met Asp Glu Ile Ser Glu Ser Ala Ile Pro Phe
420 425 430
Pro His Arg Ala Gly Ile Leu Tyr Glu Leu Trp Tyr Ile Cys Ser Trp
435 440 445
Glu Lys Gln Glu Asp Asn Glu Lys His Leu Asn Trp Ile Arg Asn Ile
450 455 460
Tyr Asn Phe Met Thr Pro Tyr Val Ser Lys Asn Pro Arg Leu Ala Tyr
465 470 475 480
Leu Asn Tyr Arg Asp Leu Asp Ile Gly Ile Asn Asp Pro Lys Asn Pro
485 490 495
Asn Asn Tyr Thr Gln Ala Arg Ile Trp Gly Glu Lys Tyr Phe Gly Lys
500 505 510
Asn Phe Asp Arg Leu Val Lys Val Lys Thr Leu Val Asp Pro Asn Asn
515 520 525
Phe Phe Arg Asn Glu Gln Ser Ile Pro Pro Leu Pro Arg His Arg His
530 535 540
<210> 89
<211> 2160
<212> DNA
<213> Cannabis sativa
<400> 89
atgggaaaaa actacaaaag tctggactcc gtcgtcgcgt cagacttcat tgccctaggc 60
ataacatcag aggtagcgga aaccttacac ggcagactag ccgagattgt ttgtaactac 120
ggggcggcta ctccccagac ttggatcaat atagccaatc acatattaag ccccgatttg 180
ccgttttccc ttcaccaaat gttgttctac ggctgctata aggactttgg accagcgccc 240
cccgcgtgga ttcctgatcc ggagaaagtt aaatccacga atcttggggc attactagaa 300
aaacgtggca aagaattcct aggagttaaa tataaggacc ccatatcttc cttttcacac 360
tttcaagaat tttcagttag aaacccagag gtttactgga ggacagtatt aatggatgag 420
atgaagataa gctttagtaa ggatccggag tgtattctgc gtagagatga cattaacaat 480
cctggcggaa gtgaatggct gcctggtggg tacctgaata gtgctaagaa ctgtttaaac 540
gtcaactcta ataaaaaatt gaatgataca atgattgtat ggagagacga agggaacgat 600
gacctaccat tgaacaagct gactctagat cagctacgta aacgtgtatg gttggtcggg 660
tacgcgctgg aggagatggg attagaaaaa ggatgcgcaa ttgctatcga catgcctatg 720
catgtggacg cggtagtcat ttacttggcc attgtcctag cgggttacgt cgtcgtttca 780
attgcagaca gcttttctgc acccgaaatc agtacccgtc tgcgtttgtc taaagctaag 840
gcaatattta cccaagacca tataattaga ggcaagaagc gtataccgtt gtacagtagg 900
gttgtagagg caaagtcacc catggctatt gtgataccat gctctggctc taatatagga 960
gcggagctta gagatggtga catctcctgg gattactttc ttgaacgtgc taaggagttt 1020
aaaaactgtg aatttactgc aagagagcag cccgtggatg catacacaaa catattgttc 1080
tccagcggta ctacgggaga acctaaagca ataccttgga cacaagctac accccttaaa 1140
gcggccgctg acggatggtc ccacctggat atcaggaagg gtgacgtcat agtttggccg 1200
actaacctgg gatggatgat gggcccttgg ctggtttacg ctagccttct gaatggggcc 1260
agcattgcat tgtacaatgg ctcaccgctt gtatcaggct tcgcgaagtt cgtacaggac 1320
gccaaggtaa caatgctagg cgtagttccg tccatagtta ggtcttggaa gagcacgaac 1380
tgcgttagtg gctacgattg gagcactatt cgttgtttca gctcttctgg cgaggccagc 1440
aacgttgatg aatatttgtg gttgatgggg agagcgaact acaaacctgt tattgagatg 1500
tgcggcggaa ctgagattgg gggagcattc tccgccggtt cttttctaca agcccaaagt 1560
ttatcctctt ttagcagcca gtgcatgggc tgtacactat acattctgga caaaaatggt 1620
tatccgatgc cgaaaaacaa gcccggcatc ggagaactgg ccctaggacc cgtgatgttc 1680
ggcgctagta agacgttgtt gaatgggaat caccacgacg tttattttaa gggaatgcca 1740
actttgaatg gcgaagtact tcgtagacac ggagacatct ttgagttgac ttcaaacggt 1800
tactaccacg ctcatggacg tgccgatgat acgatgaaca ttgggggaat taaaatttca 1860
tccatagaaa tagaacgtgt gtgtaacgaa gtcgatgatc gtgtattcga gactacagcg 1920
atcggtgtcc caccgttggg tgggggacca gaacaattgg taatcttttt tgttctgaaa 1980
gactccaacg atacgaccat cgacctaaat cagctgaggc tatcctttaa tctgggcttg 2040
cagaaaaagc taaatccttt attcaaagtc actagagttg ttcctttatc ttcattacca 2100
agaactgcaa caaataaaat aatgcgtaga gttctaaggc agcagtttag tcatttcgaa 2160
<210> 90
<211> 720
<212> PRT
<213> Cannabis sativa
<400> 90
Met Gly Lys Asn Tyr Lys Ser Leu Asp Ser Val Val Ala Ser Asp Phe
1 5 10 15
Ile Ala Leu Gly Ile Thr Ser Glu Val Ala Glu Thr Leu His Gly Arg
20 25 30
Leu Ala Glu Ile Val Cys Asn Tyr Gly Ala Ala Thr Pro Gln Thr Trp
35 40 45
Ile Asn Ile Ala Asn His Ile Leu Ser Pro Asp Leu Pro Phe Ser Leu
50 55 60
His Gln Met Leu Phe Tyr Gly Cys Tyr Lys Asp Phe Gly Pro Ala Pro
65 70 75 80
Pro Ala Trp Ile Pro Asp Pro Glu Lys Val Lys Ser Thr Asn Leu Gly
85 90 95
Ala Leu Leu Glu Lys Arg Gly Lys Glu Phe Leu Gly Val Lys Tyr Lys
100 105 110
Asp Pro Ile Ser Ser Phe Ser His Phe Gln Glu Phe Ser Val Arg Asn
115 120 125
Pro Glu Val Tyr Trp Arg Thr Val Leu Met Asp Glu Met Lys Ile Ser
130 135 140
Phe Ser Lys Asp Pro Glu Cys Ile Leu Arg Arg Asp Asp Ile Asn Asn
145 150 155 160
Pro Gly Gly Ser Glu Trp Leu Pro Gly Gly Tyr Leu Asn Ser Ala Lys
165 170 175
Asn Cys Leu Asn Val Asn Ser Asn Lys Lys Leu Asn Asp Thr Met Ile
180 185 190
Val Trp Arg Asp Glu Gly Asn Asp Asp Leu Pro Leu Asn Lys Leu Thr
195 200 205
Leu Asp Gln Leu Arg Lys Arg Val Trp Leu Val Gly Tyr Ala Leu Glu
210 215 220
Glu Met Gly Leu Glu Lys Gly Cys Ala Ile Ala Ile Asp Met Pro Met
225 230 235 240
His Val Asp Ala Val Val Ile Tyr Leu Ala Ile Val Leu Ala Gly Tyr
245 250 255
Val Val Val Ser Ile Ala Asp Ser Phe Ser Ala Pro Glu Ile Ser Thr
260 265 270
Arg Leu Arg Leu Ser Lys Ala Lys Ala Ile Phe Thr Gln Asp His Ile
275 280 285
Ile Arg Gly Lys Lys Arg Ile Pro Leu Tyr Ser Arg Val Val Glu Ala
290 295 300
Lys Ser Pro Met Ala Ile Val Ile Pro Cys Ser Gly Ser Asn Ile Gly
305 310 315 320
Ala Glu Leu Arg Asp Gly Asp Ile Ser Trp Asp Tyr Phe Leu Glu Arg
325 330 335
Ala Lys Glu Phe Lys Asn Cys Glu Phe Thr Ala Arg Glu Gln Pro Val
340 345 350
Asp Ala Tyr Thr Asn Ile Leu Phe Ser Ser Gly Thr Thr Gly Glu Pro
355 360 365
Lys Ala Ile Pro Trp Thr Gln Ala Thr Pro Leu Lys Ala Ala Ala Asp
370 375 380
Gly Trp Ser His Leu Asp Ile Arg Lys Gly Asp Val Ile Val Trp Pro
385 390 395 400
Thr Asn Leu Gly Trp Met Met Gly Pro Trp Leu Val Tyr Ala Ser Leu
405 410 415
Leu Asn Gly Ala Ser Ile Ala Leu Tyr Asn Gly Ser Pro Leu Val Ser
420 425 430
Gly Phe Ala Lys Phe Val Gln Asp Ala Lys Val Thr Met Leu Gly Val
435 440 445
Val Pro Ser Ile Val Arg Ser Trp Lys Ser Thr Asn Cys Val Ser Gly
450 455 460
Tyr Asp Trp Ser Thr Ile Arg Cys Phe Ser Ser Ser Gly Glu Ala Ser
465 470 475 480
Asn Val Asp Glu Tyr Leu Trp Leu Met Gly Arg Ala Asn Tyr Lys Pro
485 490 495
Val Ile Glu Met Cys Gly Gly Thr Glu Ile Gly Gly Ala Phe Ser Ala
500 505 510
Gly Ser Phe Leu Gln Ala Gln Ser Leu Ser Ser Phe Ser Ser Gln Cys
515 520 525
Met Gly Cys Thr Leu Tyr Ile Leu Asp Lys Asn Gly Tyr Pro Met Pro
530 535 540
Lys Asn Lys Pro Gly Ile Gly Glu Leu Ala Leu Gly Pro Val Met Phe
545 550 555 560
Gly Ala Ser Lys Thr Leu Leu Asn Gly Asn His His Asp Val Tyr Phe
565 570 575
Lys Gly Met Pro Thr Leu Asn Gly Glu Val Leu Arg Arg His Gly Asp
580 585 590
Ile Phe Glu Leu Thr Ser Asn Gly Tyr Tyr His Ala His Gly Arg Ala
595 600 605
Asp Asp Thr Met Asn Ile Gly Gly Ile Lys Ile Ser Ser Ile Glu Ile
610 615 620
Glu Arg Val Cys Asn Glu Val Asp Asp Arg Val Phe Glu Thr Thr Ala
625 630 635 640
Ile Gly Val Pro Pro Leu Gly Gly Gly Pro Glu Gln Leu Val Ile Phe
645 650 655
Phe Val Leu Lys Asp Ser Asn Asp Thr Thr Ile Asp Leu Asn Gln Leu
660 665 670
Arg Leu Ser Phe Asn Leu Gly Leu Gln Lys Lys Leu Asn Pro Leu Phe
675 680 685
Lys Val Thr Arg Val Val Pro Leu Ser Ser Leu Pro Arg Thr Ala Thr
690 695 700
Asn Lys Ile Met Arg Arg Val Leu Arg Gln Gln Phe Ser His Phe Glu
705 710 715 720
<210> 91
<211> 1599
<212> DNA
<213> Cannabis sativa
<400> 91
atggaaaagt ctggttatgg tagagatggt atctacaggt ctttaagacc accattgcat 60
ttgccaaaca acaacaactt gtccatggtc agtttcttgt tcagaaactc ttcttcctac 120
ccacaaaaac cagccttgat tgactctgaa actaatcaaa tcttgtcctt ctcccacttc 180
aaatccaccg ttattaaggt ttctcacggt ttcttgaact tgggtatcaa gaagaatgac 240
tggttgatct acgctccaaa ctctattcat ttcccagttt gctttttggg tattattgct 300
tctggtgcta ttgctactac ttccaaccca ttatacaccg tcagtgaatt gtctaagcaa 360
gtcaaggatt ctaacccaaa gttgattatc accgttccac aattattgga aaaggtcaag 420
ggtttcaact tgccaaccat tttgattggt ccagactcag aacaagaatc ctcttcagat 480
aaggttatga ccttcaacga tttggttaac ttgggtggtt cttctggttc tgaatttcca 540
atcgttgatg acttcaagca atctgatact gctgctttgt tgtactcttc tggtactact 600
ggtatgtcta aaggttggtt gactcacaag aactttatcg cctcttcttt gatggttacc 660
atggaacaag acttggttgg tgaaatggat aacgttttct tgtgcttctt gccaatgttc 720
catgttttcg gtttggccat tattacctac gctcaattgc aaagaggtaa cactgttatt 780
tccgccagat tcgatttgga aaagatgttg aaggacgtcg aaaagtatgt tactcatttg 840
tggtggcctc cagttatttt ggctttgtct aaaaactcca tggttaagtt caacttgtca 900
tccatcaagt acattggttc aggtgctgct ccattgggta aggatttgat ggaagaatgt 960
tctaaatggc catacggtat agttgctcaa ggttacggta tgactgaaac ttgtggtatc 1020
gtttctatgg aagatatcag aggtggtaag agaaattctg gttcagctgg tatgttggct 1080
tcaggtgttg aagctcaaat agtttctgtt gataccttga aaccattgcc accaaatcaa 1140
ttgggtgaaa tttgggttaa gggtccaaat atgatgcaag gttacttcaa caatccacaa 1200
gctaccaagt tgaccattga taagaaaggt tgggttcata ctggtgactt gggttacttt 1260
gatgaagatg gtcacttgta ctgggacaga atcaaagaat tgattaagta caagggtttt 1320
caagtcgctc cagctgaatt ggaaggtttg ttggtttctc atccagaaat attggatgcc 1380
tggattccat ttccagatgc tgaagctggt gaagttccag ttgcttattg gagatcacca 1440
aactcttcat tgactgaaaa cgacgtcaag aagttcattg ctggtcaagt tgcttctttc 1500
aagagattga gaaaggtcac cttcatcaac tctgttccaa aatctgcttc cggtaagatc 1560
ttgagaagag aattgatcca aaaggtcaga tccaatatg 1599
<210> 92
<211> 533
<212> PRT
<213> Cannabis sativa
<400> 92
Met Glu Lys Ser Gly Tyr Gly Arg Asp Gly Ile Tyr Arg Ser Leu Arg
1 5 10 15
Pro Pro Leu His Leu Pro Asn Asn Asn Asn Leu Ser Met Val Ser Phe
20 25 30
Leu Phe Arg Asn Ser Ser Ser Tyr Pro Gln Lys Pro Ala Leu Ile Asp
35 40 45
Ser Glu Thr Asn Gln Ile Leu Ser Phe Ser His Phe Lys Ser Thr Val
50 55 60
Ile Lys Val Ser His Gly Phe Leu Asn Leu Gly Ile Lys Lys Asn Asp
65 70 75 80
Trp Leu Ile Tyr Ala Pro Asn Ser Ile His Phe Pro Val Cys Phe Leu
85 90 95
Gly Ile Ile Ala Ser Gly Ala Ile Ala Thr Thr Ser Asn Pro Leu Tyr
100 105 110
Thr Val Ser Glu Leu Ser Lys Gln Val Lys Asp Ser Asn Pro Lys Leu
115 120 125
Ile Ile Thr Val Pro Gln Leu Leu Glu Lys Val Lys Gly Phe Asn Leu
130 135 140
Pro Thr Ile Leu Ile Gly Pro Asp Ser Glu Gln Glu Ser Ser Ser Asp
145 150 155 160
Lys Val Met Thr Phe Asn Asp Leu Val Asn Leu Gly Gly Ser Ser Gly
165 170 175
Ser Glu Phe Pro Ile Val Asp Asp Phe Lys Gln Ser Asp Thr Ala Ala
180 185 190
Leu Leu Tyr Ser Ser Gly Thr Thr Gly Met Ser Lys Gly Trp Leu Thr
195 200 205
His Lys Asn Phe Ile Ala Ser Ser Leu Met Val Thr Met Glu Gln Asp
210 215 220
Leu Val Gly Glu Met Asp Asn Val Phe Leu Cys Phe Leu Pro Met Phe
225 230 235 240
His Val Phe Gly Leu Ala Ile Ile Thr Tyr Ala Gln Leu Gln Arg Gly
245 250 255
Asn Thr Val Ile Ser Ala Arg Phe Asp Leu Glu Lys Met Leu Lys Asp
260 265 270
Val Glu Lys Tyr Val Thr His Leu Trp Trp Pro Pro Val Ile Leu Ala
275 280 285
Leu Ser Lys Asn Ser Met Val Lys Phe Asn Leu Ser Ser Ile Lys Tyr
290 295 300
Ile Gly Ser Gly Ala Ala Pro Leu Gly Lys Asp Leu Met Glu Glu Cys
305 310 315 320
Ser Lys Trp Pro Tyr Gly Ile Val Ala Gln Gly Tyr Gly Met Thr Glu
325 330 335
Thr Cys Gly Ile Val Ser Met Glu Asp Ile Arg Gly Gly Lys Arg Asn
340 345 350
Ser Gly Ser Ala Gly Met Leu Ala Ser Gly Val Glu Ala Gln Ile Val
355 360 365
Ser Val Asp Thr Leu Lys Pro Leu Pro Pro Asn Gln Leu Gly Glu Ile
370 375 380
Trp Val Lys Gly Pro Asn Met Met Gln Gly Tyr Phe Asn Asn Pro Gln
385 390 395 400
Ala Thr Lys Leu Thr Ile Asp Lys Lys Gly Trp Val His Thr Gly Asp
405 410 415
Leu Gly Tyr Phe Asp Glu Asp Gly His Leu Tyr Trp Asp Arg Ile Lys
420 425 430
Glu Leu Ile Lys Tyr Lys Gly Phe Gln Val Ala Pro Ala Glu Leu Glu
435 440 445
Gly Leu Leu Val Ser His Pro Glu Ile Leu Asp Ala Trp Ile Pro Phe
450 455 460
Pro Asp Ala Glu Ala Gly Glu Val Pro Val Ala Tyr Trp Arg Ser Pro
465 470 475 480
Asn Ser Ser Leu Thr Glu Asn Asp Val Lys Lys Phe Ile Ala Gly Gln
485 490 495
Val Ala Ser Phe Lys Arg Leu Arg Lys Val Thr Phe Ile Asn Ser Val
500 505 510
Pro Lys Ser Ala Ser Gly Lys Ile Leu Arg Arg Glu Leu Ile Gln Lys
515 520 525
Val Arg Ser Asn Met
530
<210> 93
<211> 744
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(744)
<223> 人工乙酰乙酰辅酶A还原酶(PhaB)核苷酸序列
<400> 93
atgacgcaga gaatcgccta tgtaacgggt gggatgggtg ggataggaac cgccatatgt 60
cagagactag caaaggacgg attcagggtt gtagccggtt gcggtcctaa tagtccaaga 120
agagagaaat ggttggaaca gcaaaaagct ctaggatttg attttatagc atcagaaggg 180
aatgttgctg actgggattc tacaaagacg gcatttgaca aagtgaaatc tgaagtcggc 240
gaggtcgatg tcctaattaa caacgccggc atcaccagag atgtggtttt caggaagatg 300
actagggctg actgggacgc cgtgatagac acaaatttga cgagcttgtt caacgtcaca 360
aagcaagtaa ttgacggcat ggcagatcgt gggtggggaa ggatagtcaa tatctccagc 420
gtcaacggtc agaaaggcca gttcggacag actaactact ccacagcgaa ggctggctta 480
cacggattca cgatggcctt ggcccaagag gtggctacta aaggggtgac tgtgaacaca 540
gtgtcaccag gatacatcgc gacggatatg gtcaaagcta ttagacaaga tgtcctggac 600
aagattgttg ccactattcc cgtaaagagg cttgggttac cagaagagat agcttcaatt 660
tgcgcttggc tatctagtga ggaatcaggg ttcagcactg gggcggactt ttcattaaac 720
ggtggattac acatgggagg atcc 744
<210> 94
<211> 248
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(248)
<223> 突变的乙酰乙酰辅酶A还原酶(PhaB)
<400> 94
Met Thr Gln Arg Ile Ala Tyr Val Thr Gly Gly Met Gly Gly Ile Gly
1 5 10 15
Thr Ala Ile Cys Gln Arg Leu Ala Lys Asp Gly Phe Arg Val Val Ala
20 25 30
Gly Cys Gly Pro Asn Ser Pro Arg Arg Glu Lys Trp Leu Glu Gln Gln
35 40 45
Lys Ala Leu Gly Phe Asp Phe Ile Ala Ser Glu Gly Asn Val Ala Asp
50 55 60
Trp Asp Ser Thr Lys Thr Ala Phe Asp Lys Val Lys Ser Glu Val Gly
65 70 75 80
Glu Val Asp Val Leu Ile Asn Asn Ala Gly Ile Thr Arg Asp Val Val
85 90 95
Phe Arg Lys Met Thr Arg Ala Asp Trp Asp Ala Val Ile Asp Thr Asn
100 105 110
Leu Thr Ser Leu Phe Asn Val Thr Lys Gln Val Ile Asp Gly Met Ala
115 120 125
Asp Arg Gly Trp Gly Arg Ile Val Asn Ile Ser Ser Val Asn Gly Gln
130 135 140
Lys Gly Gln Phe Gly Gln Thr Asn Tyr Ser Thr Ala Lys Ala Gly Leu
145 150 155 160
His Gly Phe Thr Met Ala Leu Ala Gln Glu Val Ala Thr Lys Gly Val
165 170 175
Thr Val Asn Thr Val Ser Pro Gly Tyr Ile Ala Thr Asp Met Val Lys
180 185 190
Ala Ile Arg Gln Asp Val Leu Asp Lys Ile Val Ala Thr Ile Pro Val
195 200 205
Lys Arg Leu Gly Leu Pro Glu Glu Ile Ala Ser Ile Cys Ala Trp Leu
210 215 220
Ser Ser Glu Glu Ser Gly Phe Ser Thr Gly Ala Asp Phe Ser Leu Asn
225 230 235 240
Gly Gly Leu His Met Gly Gly Ser
245
<210> 95
<211> 408
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(408)
<223> 人工(R)-特异性烯酰辅酶A水合酶 (PhaJ)
<400> 95
atgtctgccc agagtctgga agtcggtcaa aaagcaagac tgtcaaaaag atttggggcg 60
gcagaggtag cggcgttcgc ggcgctgtct gaggatttta atccactgca cttagatcct 120
gcgttcgccg cgacaacagc attcgagagg cccatcgtgc acggcatgct acttgcctct 180
ttgttctcag gtctactggg tcaacagtta cctgggaaag gaagcatcta tctgggacag 240
tcattgtctt ttaagctgcc cgtcttcgtc ggcgatgagg tgacagcaga agtagaagtc 300
acagcattga gggaagacaa gcctattgcg acccttacta ctcgtatttt tactcagggc 360
ggagccttag cagtgacagg agaagctgta gtaaaactac caggatcc 408
<210> 96
<211> 136
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(136)
<223> 突变的(R)-特异性烯酰辅酶A水合酶(PhaJ)
<400> 96
Met Ser Ala Gln Ser Leu Glu Val Gly Gln Lys Ala Arg Leu Ser Lys
1 5 10 15
Arg Phe Gly Ala Ala Glu Val Ala Ala Phe Ala Ala Leu Ser Glu Asp
20 25 30
Phe Asn Pro Leu His Leu Asp Pro Ala Phe Ala Ala Thr Thr Ala Phe
35 40 45
Glu Arg Pro Ile Val His Gly Met Leu Leu Ala Ser Leu Phe Ser Gly
50 55 60
Leu Leu Gly Gln Gln Leu Pro Gly Lys Gly Ser Ile Tyr Leu Gly Gln
65 70 75 80
Ser Leu Ser Phe Lys Leu Pro Val Phe Val Gly Asp Glu Val Thr Ala
85 90 95
Glu Val Glu Val Thr Ala Leu Arg Glu Asp Lys Pro Ile Ala Thr Leu
100 105 110
Thr Thr Arg Ile Phe Thr Gln Gly Gly Ala Leu Ala Val Thr Gly Glu
115 120 125
Ala Val Val Lys Leu Pro Gly Ser
130 135
<210> 97
<211> 2233
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(2233)
<223> 突变的乙酰辅酶A羧化酶 (ACC1) (S659A, S1157A)
<400> 97
Met Ser Glu Glu Ser Leu Phe Glu Ser Ser Pro Gln Lys Met Glu Tyr
1 5 10 15
Glu Ile Thr Asn Tyr Ser Glu Arg His Thr Glu Leu Pro Gly His Phe
20 25 30
Ile Gly Leu Asn Thr Val Asp Lys Leu Glu Glu Ser Pro Leu Arg Asp
35 40 45
Phe Val Lys Ser His Gly Gly His Thr Val Ile Ser Lys Ile Leu Ile
50 55 60
Ala Asn Asn Gly Ile Ala Ala Val Lys Glu Ile Arg Ser Val Arg Lys
65 70 75 80
Trp Ala Tyr Glu Thr Phe Gly Asp Asp Arg Thr Val Gln Phe Val Ala
85 90 95
Met Ala Thr Pro Glu Asp Leu Glu Ala Asn Ala Glu Tyr Ile Arg Met
100 105 110
Ala Asp Gln Tyr Ile Glu Val Pro Gly Gly Thr Asn Asn Asn Asn Tyr
115 120 125
Ala Asn Val Asp Leu Ile Val Asp Ile Ala Glu Arg Ala Asp Val Asp
130 135 140
Ala Val Trp Ala Gly Trp Gly His Ala Ser Glu Asn Pro Leu Leu Pro
145 150 155 160
Glu Lys Leu Ser Gln Ser Lys Arg Lys Val Ile Phe Ile Gly Pro Pro
165 170 175
Gly Asn Ala Met Arg Ser Leu Gly Asp Lys Ile Ser Ser Thr Ile Val
180 185 190
Ala Gln Ser Ala Lys Val Pro Cys Ile Pro Trp Ser Gly Thr Gly Val
195 200 205
Asp Thr Val His Val Asp Glu Lys Thr Gly Leu Val Ser Val Asp Asp
210 215 220
Asp Ile Tyr Gln Lys Gly Cys Cys Thr Ser Pro Glu Asp Gly Leu Gln
225 230 235 240
Lys Ala Lys Arg Ile Gly Phe Pro Val Met Ile Lys Ala Ser Glu Gly
245 250 255
Gly Gly Gly Lys Gly Ile Arg Gln Val Glu Arg Glu Glu Asp Phe Ile
260 265 270
Ala Leu Tyr His Gln Ala Ala Asn Glu Ile Pro Gly Ser Pro Ile Phe
275 280 285
Ile Met Lys Leu Ala Gly Arg Ala Arg His Leu Glu Val Gln Leu Leu
290 295 300
Ala Asp Gln Tyr Gly Thr Asn Ile Ser Leu Phe Gly Arg Asp Cys Ser
305 310 315 320
Val Gln Arg Arg His Gln Lys Ile Ile Glu Glu Ala Pro Val Thr Ile
325 330 335
Ala Lys Ala Glu Thr Phe His Glu Met Glu Lys Ala Ala Val Arg Leu
340 345 350
Gly Lys Leu Val Gly Tyr Val Ser Ala Gly Thr Val Glu Tyr Leu Tyr
355 360 365
Ser His Asp Asp Gly Lys Phe Tyr Phe Leu Glu Leu Asn Pro Arg Leu
370 375 380
Gln Val Glu His Pro Thr Thr Glu Met Val Ser Gly Val Asn Leu Pro
385 390 395 400
Ala Ala Gln Leu Gln Ile Ala Met Gly Ile Pro Met His Arg Ile Ser
405 410 415
Asp Ile Arg Thr Leu Tyr Gly Met Asn Pro His Ser Ala Ser Glu Ile
420 425 430
Asp Phe Glu Phe Lys Thr Gln Asp Ala Thr Lys Lys Gln Arg Arg Pro
435 440 445
Ile Pro Lys Gly His Cys Thr Ala Cys Arg Ile Thr Ser Glu Asp Pro
450 455 460
Asn Asp Gly Phe Lys Pro Ser Gly Gly Thr Leu His Glu Leu Asn Phe
465 470 475 480
Arg Ser Ser Ser Asn Val Trp Gly Tyr Phe Ser Val Gly Asn Asn Gly
485 490 495
Asn Ile His Ser Phe Ser Asp Ser Gln Phe Gly His Ile Phe Ala Phe
500 505 510
Gly Glu Asn Arg Gln Ala Ser Arg Lys His Met Val Val Ala Leu Lys
515 520 525
Glu Leu Ser Ile Arg Gly Asp Phe Arg Thr Thr Val Glu Tyr Leu Ile
530 535 540
Lys Leu Leu Glu Thr Glu Asp Phe Glu Asp Asn Thr Ile Thr Thr Gly
545 550 555 560
Trp Leu Asp Asp Leu Ile Thr His Lys Met Thr Ala Glu Lys Pro Asp
565 570 575
Pro Thr Leu Ala Val Ile Cys Gly Ala Ala Thr Lys Ala Phe Leu Ala
580 585 590
Ser Glu Glu Ala Arg His Lys Tyr Ile Glu Ser Leu Gln Lys Gly Gln
595 600 605
Val Leu Ser Lys Asp Leu Leu Gln Thr Met Phe Pro Val Asp Phe Ile
610 615 620
His Glu Gly Lys Arg Tyr Lys Phe Thr Val Ala Lys Ser Gly Asn Asp
625 630 635 640
Arg Tyr Thr Leu Phe Ile Asn Gly Ser Lys Cys Asp Ile Ile Leu Arg
645 650 655
Gln Leu Ala Asp Gly Gly Leu Leu Ile Ala Ile Gly Gly Lys Ser His
660 665 670
Thr Ile Tyr Trp Lys Glu Glu Val Ala Ala Thr Arg Leu Ser Val Asp
675 680 685
Ser Met Thr Thr Leu Leu Glu Val Glu Asn Asp Pro Thr Gln Leu Arg
690 695 700
Thr Pro Ser Pro Gly Lys Leu Val Lys Phe Leu Val Glu Asn Gly Glu
705 710 715 720
His Ile Ile Lys Gly Gln Pro Tyr Ala Glu Ile Glu Val Met Lys Met
725 730 735
Gln Met Pro Leu Val Ser Gln Glu Asn Gly Ile Val Gln Leu Leu Lys
740 745 750
Gln Pro Gly Ser Thr Ile Val Ala Gly Asp Ile Met Ala Ile Met Thr
755 760 765
Leu Asp Asp Pro Ser Lys Val Lys His Ala Leu Pro Phe Glu Gly Met
770 775 780
Leu Pro Asp Phe Gly Ser Pro Val Ile Glu Gly Thr Lys Pro Ala Tyr
785 790 795 800
Lys Phe Lys Ser Leu Val Ser Thr Leu Glu Asn Ile Leu Lys Gly Tyr
805 810 815
Asp Asn Gln Val Ile Met Asn Ala Ser Leu Gln Gln Leu Ile Glu Val
820 825 830
Leu Arg Asn Pro Lys Leu Pro Tyr Ser Glu Trp Lys Leu His Ile Ser
835 840 845
Ala Leu His Ser Arg Leu Pro Ala Lys Leu Asp Glu Gln Met Glu Glu
850 855 860
Leu Val Ala Arg Ser Leu Arg Arg Gly Ala Val Phe Pro Ala Arg Gln
865 870 875 880
Leu Ser Lys Leu Ile Asp Met Ala Val Lys Asn Pro Glu Tyr Asn Pro
885 890 895
Asp Lys Leu Leu Gly Ala Val Val Glu Pro Leu Ala Asp Ile Ala His
900 905 910
Lys Tyr Ser Asn Gly Leu Glu Ala His Glu His Ser Ile Phe Val His
915 920 925
Phe Leu Glu Glu Tyr Tyr Glu Val Glu Lys Leu Phe Asn Gly Pro Asn
930 935 940
Val Arg Glu Glu Asn Ile Ile Leu Lys Leu Arg Asp Glu Asn Pro Lys
945 950 955 960
Asp Leu Asp Lys Val Ala Leu Thr Val Leu Ser His Ser Lys Val Ser
965 970 975
Ala Lys Asn Asn Leu Ile Leu Ala Ile Leu Lys His Tyr Gln Pro Leu
980 985 990
Cys Lys Leu Ser Ser Lys Val Ser Ala Ile Phe Ser Thr Pro Leu Gln
995 1000 1005
His Ile Val Glu Leu Glu Ser Lys Ala Thr Ala Lys Val Ala Leu Gln
1010 1015 1020
Ala Arg Glu Ile Leu Ile Gln Gly Ala Leu Pro Ser Val Lys Glu Arg
1025 1030 1035 1040
Thr Glu Gln Ile Glu His Ile Leu Lys Ser Ser Val Val Lys Val Ala
1045 1050 1055
Tyr Gly Ser Ser Asn Pro Lys Arg Ser Glu Pro Asp Leu Asn Ile Leu
1060 1065 1070
Lys Asp Leu Ile Asp Ser Asn Tyr Val Val Phe Asp Val Leu Leu Gln
1075 1080 1085
Phe Leu Thr His Gln Asp Pro Val Val Thr Ala Ala Ala Ala Gln Val
1090 1095 1100
Tyr Ile Arg Arg Ala Tyr Arg Ala Tyr Thr Ile Gly Asp Ile Arg Val
1105 1110 1115 1120
His Glu Gly Val Thr Val Pro Ile Val Glu Trp Lys Phe Gln Leu Pro
1125 1130 1135
Ser Ala Ala Phe Ser Thr Phe Pro Thr Val Lys Ser Lys Met Gly Met
1140 1145 1150
Asn Arg Ala Val Ser Val Ala Asp Leu Ser Tyr Val Ala Asn Ser Gln
1155 1160 1165
Ser Ser Pro Leu Arg Glu Gly Ile Leu Met Ala Val Asp His Leu Asp
1170 1175 1180
Asp Val Asp Glu Ile Leu Ser Gln Ser Leu Glu Val Ile Pro Arg His
1185 1190 1195 1200
Gln Ser Ser Ser Asn Gly Pro Ala Pro Asp Arg Ser Gly Ser Ser Ala
1205 1210 1215
Ser Leu Ser Asn Val Ala Asn Val Cys Val Ala Ser Thr Glu Gly Phe
1220 1225 1230
Glu Ser Glu Glu Glu Ile Leu Val Arg Leu Arg Glu Ile Leu Asp Leu
1235 1240 1245
Asn Lys Gln Glu Leu Ile Asn Ala Ser Ile Arg Arg Ile Thr Phe Met
1250 1255 1260
Phe Gly Phe Lys Asp Gly Ser Tyr Pro Lys Tyr Tyr Thr Phe Asn Gly
1265 1270 1275 1280
Pro Asn Tyr Asn Glu Asn Glu Thr Ile Arg His Ile Glu Pro Ala Leu
1285 1290 1295
Ala Phe Gln Leu Glu Leu Gly Arg Leu Ser Asn Phe Asn Ile Lys Pro
1300 1305 1310
Ile Phe Thr Asp Asn Arg Asn Ile His Val Tyr Glu Ala Val Ser Lys
1315 1320 1325
Thr Ser Pro Leu Asp Lys Arg Phe Phe Thr Arg Gly Ile Ile Arg Thr
1330 1335 1340
Gly His Ile Arg Asp Asp Ile Ser Ile Gln Glu Tyr Leu Thr Ser Glu
1345 1350 1355 1360
Ala Asn Arg Leu Met Ser Asp Ile Leu Asp Asn Leu Glu Val Thr Asp
1365 1370 1375
Thr Ser Asn Ser Asp Leu Asn His Ile Phe Ile Asn Phe Ile Ala Val
1380 1385 1390
Phe Asp Ile Ser Pro Glu Asp Val Glu Ala Ala Phe Gly Gly Phe Leu
1395 1400 1405
Glu Arg Phe Gly Lys Arg Leu Leu Arg Leu Arg Val Ser Ser Ala Glu
1410 1415 1420
Ile Arg Ile Ile Ile Lys Asp Pro Gln Thr Gly Ala Pro Val Pro Leu
1425 1430 1435 1440
Arg Ala Leu Ile Asn Asn Val Ser Gly Tyr Val Ile Lys Thr Glu Met
1445 1450 1455
Tyr Thr Glu Val Lys Asn Ala Lys Gly Glu Trp Val Phe Lys Ser Leu
1460 1465 1470
Gly Lys Pro Gly Ser Met His Leu Arg Pro Ile Ala Thr Pro Tyr Pro
1475 1480 1485
Val Lys Glu Trp Leu Gln Pro Lys Arg Tyr Lys Ala His Leu Met Gly
1490 1495 1500
Thr Thr Tyr Val Tyr Asp Phe Pro Glu Leu Phe Arg Gln Ala Ser Ser
1505 1510 1515 1520
Ser Gln Trp Lys Asn Phe Ser Ala Asp Val Lys Leu Thr Asp Asp Phe
1525 1530 1535
Phe Ile Ser Asn Glu Leu Ile Glu Asp Glu Asn Gly Glu Leu Thr Glu
1540 1545 1550
Val Glu Arg Glu Pro Gly Ala Asn Ala Ile Gly Met Val Ala Phe Lys
1555 1560 1565
Ile Thr Val Lys Thr Pro Glu Tyr Pro Arg Gly Arg Gln Phe Val Val
1570 1575 1580
Val Ala Asn Asp Ile Thr Phe Lys Ile Gly Ser Phe Gly Pro Gln Glu
1585 1590 1595 1600
Asp Glu Phe Phe Asn Lys Val Thr Glu Tyr Ala Arg Lys Arg Gly Ile
1605 1610 1615
Pro Arg Ile Tyr Leu Ala Ala Asn Ser Gly Ala Arg Ile Gly Met Ala
1620 1625 1630
Glu Glu Ile Val Pro Leu Phe Gln Val Ala Trp Asn Asp Ala Ala Asn
1635 1640 1645
Pro Asp Lys Gly Phe Gln Tyr Leu Tyr Leu Thr Ser Glu Gly Met Glu
1650 1655 1660
Thr Leu Lys Lys Phe Asp Lys Glu Asn Ser Val Leu Thr Glu Arg Thr
1665 1670 1675 1680
Val Ile Asn Gly Glu Glu Arg Phe Val Ile Lys Thr Ile Ile Gly Ser
1685 1690 1695
Glu Asp Gly Leu Gly Val Glu Cys Leu Arg Gly Ser Gly Leu Ile Ala
1700 1705 1710
Gly Ala Thr Ser Arg Ala Tyr His Asp Ile Phe Thr Ile Thr Leu Val
1715 1720 1725
Thr Cys Arg Ser Val Gly Ile Gly Ala Tyr Leu Val Arg Leu Gly Gln
1730 1735 1740
Arg Ala Ile Gln Val Glu Gly Gln Pro Ile Ile Leu Thr Gly Ala Pro
1745 1750 1755 1760
Ala Ile Asn Lys Met Leu Gly Arg Glu Val Tyr Thr Ser Asn Leu Gln
1765 1770 1775
Leu Gly Gly Thr Gln Ile Met Tyr Asn Asn Gly Val Ser His Leu Thr
1780 1785 1790
Ala Val Asp Asp Leu Ala Gly Val Glu Lys Ile Val Glu Trp Met Ser
1795 1800 1805
Tyr Val Pro Ala Lys Arg Asn Met Pro Val Pro Ile Leu Glu Thr Lys
1810 1815 1820
Asp Thr Trp Asp Arg Pro Val Asp Phe Thr Pro Thr Asn Asp Glu Thr
1825 1830 1835 1840
Tyr Asp Val Arg Trp Met Ile Glu Gly Arg Glu Thr Glu Ser Gly Phe
1845 1850 1855
Glu Tyr Gly Leu Phe Asp Lys Gly Ser Phe Phe Glu Thr Leu Ser Gly
1860 1865 1870
Trp Ala Lys Gly Val Val Val Gly Arg Ala Arg Leu Gly Gly Ile Pro
1875 1880 1885
Leu Gly Val Ile Gly Val Glu Thr Arg Thr Val Glu Asn Leu Ile Pro
1890 1895 1900
Ala Asp Pro Ala Asn Pro Asn Ser Ala Glu Thr Leu Ile Gln Glu Pro
1905 1910 1915 1920
Gly Gln Val Trp His Pro Asn Ser Ala Phe Lys Thr Ala Gln Ala Ile
1925 1930 1935
Asn Asp Phe Asn Asn Gly Glu Gln Leu Pro Met Met Ile Leu Ala Asn
1940 1945 1950
Trp Arg Gly Phe Ser Gly Gly Gln Arg Asp Met Phe Asn Glu Val Leu
1955 1960 1965
Lys Tyr Gly Ser Phe Ile Val Asp Ala Leu Val Asp Tyr Lys Gln Pro
1970 1975 1980
Ile Ile Ile Tyr Ile Pro Pro Thr Gly Glu Leu Arg Gly Gly Ser Trp
1985 1990 1995 2000
Val Val Val Asp Pro Thr Ile Asn Ala Asp Gln Met Glu Met Tyr Ala
2005 2010 2015
Asp Val Asn Ala Arg Ala Gly Val Leu Glu Pro Gln Gly Met Val Gly
2020 2025 2030
Ile Lys Phe Arg Arg Glu Lys Leu Leu Asp Thr Met Asn Arg Leu Asp
2035 2040 2045
Asp Lys Tyr Arg Glu Leu Arg Ser Gln Leu Ser Asn Lys Ser Leu Ala
2050 2055 2060
Pro Glu Val His Gln Gln Ile Ser Lys Gln Leu Ala Asp Arg Glu Arg
2065 2070 2075 2080
Glu Leu Leu Pro Ile Tyr Gly Gln Ile Ser Leu Gln Phe Ala Asp Leu
2085 2090 2095
His Asp Arg Ser Ser Arg Met Val Ala Lys Gly Val Ile Ser Lys Glu
2100 2105 2110
Leu Glu Trp Thr Glu Ala Arg Arg Phe Phe Phe Trp Arg Leu Arg Arg
2115 2120 2125
Arg Leu Asn Glu Glu Tyr Leu Ile Lys Arg Leu Ser His Gln Val Gly
2130 2135 2140
Glu Ala Ser Arg Leu Glu Lys Ile Ala Arg Ile Arg Ser Trp Tyr Pro
2145 2150 2155 2160
Ala Ser Val Asp His Glu Asp Asp Arg Gln Val Ala Thr Trp Ile Glu
2165 2170 2175
Glu Asn Tyr Lys Thr Leu Asp Asp Lys Leu Lys Gly Leu Lys Leu Glu
2180 2185 2190
Ser Phe Ala Gln Asp Leu Ala Lys Lys Ile Arg Ser Asp His Asp Asn
2195 2200 2205
Ala Ile Asp Gly Leu Ser Glu Val Ile Lys Met Leu Ser Thr Asp Asp
2210 2215 2220
Lys Glu Lys Leu Leu Lys Thr Leu Lys
2225 2230
<210> 98
<211> 321
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(321)
<223> 截短的香叶基焦磷酸橄榄醇酸香叶基转移酶 CsGOTt75
<400> 98
Met Ala Ala Thr Thr Asn Gln Thr Glu Pro Pro Glu Ser Asp Asn His
1 5 10 15
Ser Val Ala Thr Lys Ile Leu Asn Phe Gly Lys Ala Cys Trp Lys Leu
20 25 30
Gln Arg Pro Tyr Thr Ile Ile Ala Phe Thr Ser Cys Ala Cys Gly Leu
35 40 45
Phe Gly Lys Glu Leu Leu His Asn Thr Asn Leu Ile Ser Trp Ser Leu
50 55 60
Met Phe Lys Ala Phe Phe Phe Leu Val Ala Ile Leu Cys Ile Ala Ser
65 70 75 80
Phe Thr Thr Thr Ile Asn Gln Ile Tyr Asp Leu His Ile Asp Arg Ile
85 90 95
Asn Lys Pro Asp Leu Pro Leu Ala Ser Gly Glu Ile Ser Val Asn Thr
100 105 110
Ala Trp Ile Met Ser Ile Ile Val Ala Leu Phe Gly Leu Ile Ile Thr
115 120 125
Ile Lys Met Lys Gly Gly Pro Leu Tyr Ile Phe Gly Tyr Cys Phe Gly
130 135 140
Ile Phe Gly Gly Ile Val Tyr Ser Val Pro Pro Phe Arg Trp Lys Gln
145 150 155 160
Asn Pro Ser Thr Ala Phe Leu Leu Asn Phe Leu Ala His Ile Ile Thr
165 170 175
Asn Phe Thr Phe Tyr Tyr Ala Ser Arg Ala Ala Leu Gly Leu Pro Phe
180 185 190
Glu Leu Arg Pro Ser Phe Thr Phe Leu Leu Ala Phe Met Lys Ser Met
195 200 205
Gly Ser Ala Leu Ala Leu Ile Lys Asp Ala Ser Asp Val Glu Gly Asp
210 215 220
Thr Lys Phe Gly Ile Ser Thr Leu Ala Ser Lys Tyr Gly Ser Arg Asn
225 230 235 240
Leu Thr Leu Phe Cys Ser Gly Ile Val Leu Leu Ser Tyr Val Ala Ala
245 250 255
Ile Leu Ala Gly Ile Ile Trp Pro Gln Ala Phe Asn Ser Asn Val Met
260 265 270
Leu Leu Ser His Ala Ile Leu Ala Phe Trp Leu Ile Leu Gln Thr Arg
275 280 285
Asp Phe Ala Leu Thr Asn Tyr Asp Pro Glu Ala Gly Arg Arg Phe Tyr
290 295 300
Glu Phe Met Trp Lys Leu Tyr Tyr Ala Glu Tyr Leu Val Tyr Val Phe
305 310 315 320
Ile
<210> 99
<211> 363
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(363)
<223> 截短的香叶基焦磷酸橄榄醇酸香叶基转移酶 CsGOTt33
<400> 99
Met Ser His Pro Lys Thr Pro Ile Lys Tyr Ser Tyr Asn Asn Phe Pro
1 5 10 15
Ser Lys His Cys Ser Thr Lys Ser Phe His Leu Gln Asn Lys Cys Ser
20 25 30
Glu Ser Leu Ser Ile Ala Lys Asn Ser Ile Arg Ala Ala Thr Thr Asn
35 40 45
Gln Thr Glu Pro Pro Glu Ser Asp Asn His Ser Val Ala Thr Lys Ile
50 55 60
Leu Asn Phe Gly Lys Ala Cys Trp Lys Leu Gln Arg Pro Tyr Thr Ile
65 70 75 80
Ile Ala Phe Thr Ser Cys Ala Cys Gly Leu Phe Gly Lys Glu Leu Leu
85 90 95
His Asn Thr Asn Leu Ile Ser Trp Ser Leu Met Phe Lys Ala Phe Phe
100 105 110
Phe Leu Val Ala Ile Leu Cys Ile Ala Ser Phe Thr Thr Thr Ile Asn
115 120 125
Gln Ile Tyr Asp Leu His Ile Asp Arg Ile Asn Lys Pro Asp Leu Pro
130 135 140
Leu Ala Ser Gly Glu Ile Ser Val Asn Thr Ala Trp Ile Met Ser Ile
145 150 155 160
Ile Val Ala Leu Phe Gly Leu Ile Ile Thr Ile Lys Met Lys Gly Gly
165 170 175
Pro Leu Tyr Ile Phe Gly Tyr Cys Phe Gly Ile Phe Gly Gly Ile Val
180 185 190
Tyr Ser Val Pro Pro Phe Arg Trp Lys Gln Asn Pro Ser Thr Ala Phe
195 200 205
Leu Leu Asn Phe Leu Ala His Ile Ile Thr Asn Phe Thr Phe Tyr Tyr
210 215 220
Ala Ser Arg Ala Ala Leu Gly Leu Pro Phe Glu Leu Arg Pro Ser Phe
225 230 235 240
Thr Phe Leu Leu Ala Phe Met Lys Ser Met Gly Ser Ala Leu Ala Leu
245 250 255
Ile Lys Asp Ala Ser Asp Val Glu Gly Asp Thr Lys Phe Gly Ile Ser
260 265 270
Thr Leu Ala Ser Lys Tyr Gly Ser Arg Asn Leu Thr Leu Phe Cys Ser
275 280 285
Gly Ile Val Leu Leu Ser Tyr Val Ala Ala Ile Leu Ala Gly Ile Ile
290 295 300
Trp Pro Gln Ala Phe Asn Ser Asn Val Met Leu Leu Ser His Ala Ile
305 310 315 320
Leu Ala Phe Trp Leu Ile Leu Gln Thr Arg Asp Phe Ala Leu Thr Asn
325 330 335
Tyr Asp Pro Glu Ala Gly Arg Arg Phe Tyr Glu Phe Met Trp Lys Leu
340 345 350
Tyr Tyr Ala Glu Tyr Leu Val Tyr Val Phe Ile
355 360
<210> 100
<211> 323
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(323)
<223> 截短的香叶基焦磷酸橄榄醇酸香叶基转移酶 CsPT4t
<400> 100
Met Ser Ala Gly Ser Asp Gln Ile Glu Gly Ser Pro His His Glu Ser
1 5 10 15
Asp Asn Ser Ile Ala Thr Lys Ile Leu Asn Phe Gly His Thr Cys Trp
20 25 30
Lys Leu Gln Arg Pro Tyr Val Val Lys Gly Met Ile Ser Ile Ala Cys
35 40 45
Gly Leu Phe Gly Arg Glu Leu Phe Asn Asn Arg His Leu Phe Ser Trp
50 55 60
Gly Leu Met Trp Lys Ala Phe Phe Ala Leu Val Pro Ile Leu Ser Phe
65 70 75 80
Asn Phe Phe Ala Ala Ile Met Asn Gln Ile Tyr Asp Val Asp Ile Asp
85 90 95
Arg Ile Asn Lys Pro Asp Leu Pro Leu Val Ser Gly Glu Met Ser Ile
100 105 110
Glu Thr Ala Trp Ile Leu Ser Ile Ile Val Ala Leu Thr Gly Leu Ile
115 120 125
Val Thr Ile Lys Leu Lys Ser Ala Pro Leu Phe Val Phe Ile Tyr Ile
130 135 140
Phe Gly Ile Phe Ala Gly Phe Ala Tyr Ser Val Pro Pro Ile Arg Trp
145 150 155 160
Lys Gln Tyr Pro Phe Thr Asn Phe Leu Ile Thr Ile Ser Ser His Val
165 170 175
Gly Leu Ala Phe Thr Ser Tyr Ser Ala Thr Thr Ser Ala Leu Gly Leu
180 185 190
Pro Phe Val Trp Arg Pro Ala Phe Ser Phe Ile Ile Ala Phe Met Thr
195 200 205
Val Met Gly Met Thr Ile Ala Phe Ala Lys Asp Ile Ser Asp Ile Glu
210 215 220
Gly Asp Ala Lys Tyr Gly Val Ser Thr Val Ala Thr Lys Leu Gly Ala
225 230 235 240
Arg Asn Met Thr Phe Val Val Ser Gly Val Leu Leu Leu Asn Tyr Leu
245 250 255
Val Ser Ile Ser Ile Gly Ile Ile Trp Pro Gln Val Phe Lys Ser Asn
260 265 270
Ile Met Ile Leu Ser His Ala Ile Leu Ala Phe Cys Leu Ile Phe Gln
275 280 285
Thr Arg Glu Leu Ala Leu Ala Asn Tyr Ala Ser Ala Pro Ser Arg Gln
290 295 300
Phe Phe Glu Phe Ile Trp Leu Leu Tyr Tyr Ala Glu Tyr Phe Val Tyr
305 310 315 320
Val Phe Ile
<210> 101
<211> 323
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(323)
<223> 截短的香叶基焦磷酸橄榄醇酸香叶基转移酶 CsPT7t
<400> 101
Met Ser Thr Asp Thr Ala Asn Gln Thr Glu Pro Pro Glu Ser Asn Thr
1 5 10 15
Lys Tyr Ser Val Val Thr Lys Ile Leu Ser Phe Gly His Thr Cys Trp
20 25 30
Lys Leu Gln Arg Pro Tyr Thr Phe Ile Gly Val Ile Ser Cys Ala Cys
35 40 45
Gly Leu Phe Gly Arg Glu Leu Phe His Asn Thr Asn Leu Leu Ser Trp
50 55 60
Ser Leu Met Leu Lys Ala Phe Ser Ser Leu Met Val Ile Leu Ser Val
65 70 75 80
Asn Leu Cys Thr Asn Ile Ile Asn Gln Ile Thr Asp Leu Asp Ile Asp
85 90 95
Arg Ile Asn Lys Pro Asp Leu Pro Leu Ala Ser Gly Glu Met Ser Ile
100 105 110
Glu Thr Ala Trp Ile Met Ser Ile Ile Val Ala Leu Thr Gly Leu Ile
115 120 125
Leu Thr Ile Lys Leu Asn Cys Gly Pro Leu Phe Ile Ser Leu Tyr Cys
130 135 140
Val Ser Ile Leu Val Gly Ala Leu Tyr Ser Val Pro Pro Phe Arg Trp
145 150 155 160
Lys Gln Asn Pro Asn Thr Ala Phe Ser Ser Tyr Phe Met Gly Leu Val
165 170 175
Ile Val Asn Phe Thr Cys Tyr Tyr Ala Ser Arg Ala Ala Phe Gly Leu
180 185 190
Pro Phe Glu Met Ser Pro Pro Phe Thr Phe Ile Leu Ala Phe Val Lys
195 200 205
Ser Met Gly Ser Ala Leu Phe Leu Cys Lys Asp Val Ser Asp Ile Glu
210 215 220
Gly Asp Ser Lys His Gly Ile Ser Thr Leu Ala Thr Arg Tyr Gly Ala
225 230 235 240
Lys Asn Ile Thr Phe Leu Cys Ser Gly Ile Val Leu Leu Thr Tyr Val
245 250 255
Ser Ala Ile Leu Ala Ala Ile Ile Trp Pro Gln Ala Phe Lys Ser Asn
260 265 270
Val Met Leu Leu Ser His Ala Thr Leu Ala Phe Trp Leu Ile Phe Gln
275 280 285
Thr Arg Glu Phe Ala Leu Thr Asn Tyr Asn Pro Glu Ala Gly Arg Lys
290 295 300
Phe Tyr Glu Phe Met Trp Lys Leu His Tyr Ala Glu Tyr Leu Val Tyr
305 310 315 320
Val Phe Ile
<210> 102
<211> 315
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(315)
<223> 截短的香叶基焦磷酸橄榄醇酸香叶基转移酶 HlPT1Lt
<400> 102
Met Asp Arg Pro Pro Glu Ser Gly Asn Leu Ser Ala Leu Thr Asn Val
1 5 10 15
Lys Asp Phe Val Ser Val Cys Trp Glu Tyr Val Arg Pro Tyr Thr Ala
20 25 30
Lys Gly Val Ile Ile Cys Ser Ser Cys Leu Phe Gly Arg Glu Leu Leu
35 40 45
Glu Asn Pro Asn Leu Phe Ser Trp Pro Leu Ile Phe Arg Ala Leu Leu
50 55 60
Gly Met Leu Ala Ile Leu Gly Ser Cys Phe Tyr Thr Ala Gly Ile Asn
65 70 75 80
Gln Ile Phe Asp Met Asp Ile Asp Arg Ile Asn Lys Pro Asp Leu Pro
85 90 95
Leu Val Ser Gly Arg Ile Ser Val Glu Ser Ala Trp Leu Leu Thr Leu
100 105 110
Ser Pro Ala Ile Ile Gly Phe Ile Leu Ile Leu Lys Leu Asn Ser Gly
115 120 125
Pro Leu Leu Thr Ser Leu Tyr Cys Leu Ala Ile Leu Ser Gly Thr Ile
130 135 140
Tyr Ser Val Pro Pro Phe Arg Trp Lys Lys Asn Pro Ile Thr Ala Phe
145 150 155 160
Leu Cys Ile Leu Met Ile His Ala Gly Leu Asn Phe Ser Val Tyr Tyr
165 170 175
Ala Ser Arg Ala Ala Leu Gly Leu Ala Phe Val Trp Ser Pro Ser Phe
180 185 190
Ser Phe Ile Thr Ala Phe Ile Thr Phe Met Thr Leu Thr Leu Ala Ser
195 200 205
Ser Lys Asp Leu Ser Asp Ile Asn Gly Asp Arg Lys Phe Gly Val Glu
210 215 220
Thr Phe Ala Thr Lys Leu Gly Ala Lys Asn Ile Thr Leu Leu Gly Thr
225 230 235 240
Gly Leu Leu Leu Leu Asn Tyr Val Ala Ala Ile Ser Thr Ala Ile Ile
245 250 255
Trp Pro Lys Ala Phe Lys Ser Asn Ile Met Leu Leu Ser His Ala Ile
260 265 270
Leu Ala Phe Ser Leu Phe Phe Gln Ala Arg Glu Leu Asp Arg Thr Asn
275 280 285
Tyr Thr Pro Glu Ala Cys Lys Ser Phe Tyr Glu Phe Ile Trp Ile Leu
290 295 300
Phe Ser Ala Glu Tyr Val Val Tyr Leu Phe Ile
305 310 315
<210> 103
<211> 329
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(329)
<223> 截短的香叶基焦磷酸橄榄醇酸香叶基转移酶 HlPT2t
<400> 103
Met Gly His Leu Pro Arg Pro Asn Ser Leu Thr Ala Trp Ser His Gln
1 5 10 15
Ser Glu Phe Pro Ser Thr Ile Val Thr Lys Gly Ser Asn Phe Gly His
20 25 30
Ala Ser Trp Lys Phe Val Arg Pro Ile Pro Phe Val Ala Val Ser Ile
35 40 45
Ile Cys Thr Ser Leu Phe Gly Ala Glu Leu Leu Lys Asn Pro Asn Leu
50 55 60
Phe Ser Trp Gln Leu Met Phe Asp Ala Phe Gln Gly Leu Val Val Ile
65 70 75 80
Leu Leu Tyr His Ile Tyr Ile Asn Gly Leu Asn Gln Ile Tyr Asp Leu
85 90 95
Glu Ser Asp Arg Ile Asn Lys Pro Asp Leu Pro Leu Ala Ala Glu Glu
100 105 110
Met Ser Val Lys Ser Ala Trp Phe Leu Thr Ile Phe Ser Ala Val Ala
115 120 125
Ser Leu Leu Leu Met Ile Lys Leu Lys Cys Gly Leu Phe Leu Thr Cys
130 135 140
Met Tyr Cys Cys Tyr Leu Val Ile Gly Ala Met Tyr Ser Val Pro Pro
145 150 155 160
Phe Arg Trp Lys Met Asn Thr Phe Thr Ser Thr Leu Trp Asn Phe Ser
165 170 175
Glu Ile Gly Ile Gly Ile Asn Phe Leu Ile Asn Tyr Ala Ser Arg Ala
180 185 190
Thr Leu Gly Leu Pro Phe Gln Trp Arg Pro Pro Phe Thr Phe Ile Ile
195 200 205
Gly Phe Val Ser Thr Leu Ser Ile Ile Leu Ser Ile Leu Lys Asp Val
210 215 220
Pro Asp Val Glu Gly Asp Lys Lys Val Gly Met Ser Thr Leu Pro Val
225 230 235 240
Ile Phe Gly Ala Arg Thr Ile Val Leu Val Gly Ser Gly Phe Phe Leu
245 250 255
Leu Asn Tyr Val Ala Ala Ile Gly Val Ala Ile Met Trp Pro Gln Ala
260 265 270
Phe Lys Gly Tyr Ile Met Ile Pro Ala His Ala Ile Phe Ala Ser Ala
275 280 285
Leu Ile Phe Lys Thr Trp Leu Leu Asp Lys Ala Asn Tyr Ala Lys Glu
290 295 300
Ala Ser Asp Ser Tyr Tyr His Phe Leu Trp Phe Leu Met Ile Ala Glu
305 310 315 320
Tyr Ile Leu Tyr Pro Phe Ile Ser Thr
325
<210> 104
<211> 514
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(514)
<223> 截短的四氢大麻酚酸合成酶THCASt28
<400> 104
Met Asn Phe Leu Lys Cys Phe Ser Glu Tyr Ile Pro Asn Asn Pro Ala
1 5 10 15
Asn Pro Lys Phe Ile Tyr Thr Gln His Asp Gln Leu Tyr Met Ser Val
20 25 30
Leu Asn Ser Thr Ile Gln Asn Leu Arg Phe Thr Ser Asp Thr Thr Pro
35 40 45
Lys Pro Leu Val Ile Val Thr Pro Ser Asn Val Ser His Ile Gln Ala
50 55 60
Ser Ile Leu Cys Ser Lys Lys Val Gly Leu Gln Ile Arg Thr Arg Ser
65 70 75 80
Gly Gly His Asp Ala Glu Gly Met Ser Tyr Ile Ser Gln Val Pro Phe
85 90 95
Val Val Val Asp Leu Arg Asn Met His Ser Ile Lys Ile Asp Val His
100 105 110
Ser Gln Thr Ala Trp Val Glu Ala Gly Ala Thr Leu Gly Glu Val Tyr
115 120 125
Tyr Trp Ile Asn Glu Lys Asn Glu Asn Phe Ser Phe Pro Gly Gly Tyr
130 135 140
Cys Pro Thr Val Gly Val Gly Gly His Phe Ser Gly Gly Gly Tyr Gly
145 150 155 160
Ala Leu Met Arg Asn Tyr Gly Leu Ala Ala Asp Asn Ile Ile Asp Ala
165 170 175
His Leu Val Asn Val Asp Gly Lys Val Leu Asp Arg Lys Ser Met Gly
180 185 190
Glu Asp Leu Phe Trp Ala Ile Arg Gly Gly Gly Gly Glu Asn Phe Gly
195 200 205
Ile Ile Ala Ala Trp Lys Ile Lys Leu Val Ala Val Pro Ser Lys Ser
210 215 220
Thr Ile Phe Ser Val Lys Lys Asn Met Glu Ile His Gly Leu Val Lys
225 230 235 240
Leu Phe Asn Lys Trp Gln Asn Ile Ala Tyr Lys Tyr Asp Lys Asp Leu
245 250 255
Val Leu Met Thr His Phe Ile Thr Lys Asn Ile Thr Asp Asn His Gly
260 265 270
Lys Asn Lys Thr Thr Val His Gly Tyr Phe Ser Ser Ile Phe His Gly
275 280 285
Gly Val Asp Ser Leu Val Asp Leu Met Asn Lys Ser Phe Pro Glu Leu
290 295 300
Gly Ile Lys Lys Thr Asp Cys Lys Glu Phe Ser Trp Ile Asp Thr Thr
305 310 315 320
Ile Phe Tyr Ser Gly Val Val Asn Phe Asn Thr Ala Asn Phe Lys Lys
325 330 335
Glu Ile Leu Leu Asp Arg Ser Ala Gly Lys Lys Thr Ala Phe Ser Ile
340 345 350
Lys Leu Asp Tyr Val Lys Lys Pro Ile Pro Glu Thr Ala Met Val Lys
355 360 365
Ile Leu Glu Lys Leu Tyr Glu Glu Asp Val Gly Val Gly Met Tyr Val
370 375 380
Leu Tyr Pro Tyr Gly Gly Ile Met Glu Glu Ile Ser Glu Ser Ala Ile
385 390 395 400
Pro Phe Pro His Arg Ala Gly Ile Met Tyr Glu Leu Trp Tyr Thr Ala
405 410 415
Ser Trp Glu Lys Gln Glu Asp Asn Glu Lys His Ile Asn Trp Val Arg
420 425 430
Ser Val Tyr Asn Phe Thr Thr Pro Tyr Val Ser Gln Asn Pro Arg Leu
435 440 445
Ala Tyr Leu Asn Tyr Arg Asp Leu Asp Leu Gly Lys Thr Asn Pro Glu
450 455 460
Ser Pro Asn Asn Tyr Thr Gln Ala Arg Ile Trp Gly Glu Lys Tyr Phe
465 470 475 480
Gly Lys Asn Phe Asn Arg Leu Val Lys Val Lys Thr Lys Ala Asp Pro
485 490 495
Asn Asn Phe Phe Arg Asn Glu Gln Ser Ile Pro Pro Leu Pro Pro His
500 505 510
His His
<210> 105
<211> 517
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(517)
<223> 截短的大麻二酚酸合成酶CBDASt28*
<400> 105
Met Asn Pro Arg Glu Asn Phe Leu Lys Cys Phe Ser Gln Tyr Ile Pro
1 5 10 15
Asn Asn Ala Thr Asn Leu Lys Leu Val Tyr Thr Gln Asn Asn Pro Leu
20 25 30
Tyr Met Ser Val Leu Asn Ser Thr Ile His Asn Leu Arg Phe Thr Ser
35 40 45
Asp Thr Thr Pro Lys Pro Leu Val Ile Val Thr Pro Ser His Val Ser
50 55 60
His Ile Gln Gly Thr Ile Leu Cys Ser Lys Lys Val Gly Leu Gln Ile
65 70 75 80
Arg Thr Arg Ser Gly Gly His Asp Ser Glu Gly Met Ser Tyr Ile Ser
85 90 95
Gln Val Pro Phe Val Ile Val Asp Leu Arg Asn Met Arg Ser Ile Lys
100 105 110
Ile Asp Val His Ser Gln Thr Ala Trp Val Glu Ala Gly Ala Thr Leu
115 120 125
Gly Glu Val Tyr Tyr Trp Val Asn Glu Lys Asn Glu Asn Leu Ser Leu
130 135 140
Ala Ala Gly Tyr Cys Pro Thr Val Cys Ala Gly Gly His Phe Gly Gly
145 150 155 160
Gly Gly Tyr Gly Pro Leu Met Arg Asn Tyr Gly Leu Ala Ala Asp Asn
165 170 175
Ile Ile Asp Ala His Leu Val Asn Val His Gly Lys Val Leu Asp Arg
180 185 190
Lys Ser Met Gly Glu Asp Leu Phe Trp Ala Leu Arg Gly Gly Gly Ala
195 200 205
Glu Ser Phe Gly Ile Ile Val Ala Trp Lys Ile Arg Leu Val Ala Val
210 215 220
Pro Lys Ser Thr Met Phe Ser Val Lys Lys Ile Met Glu Ile His Glu
225 230 235 240
Leu Val Lys Leu Val Asn Lys Trp Gln Asn Ile Ala Tyr Lys Tyr Asp
245 250 255
Lys Asp Leu Leu Leu Met Thr His Phe Ile Thr Arg Asn Ile Thr Asp
260 265 270
Asn Gln Gly Lys Asn Lys Thr Ala Ile His Thr Tyr Phe Ser Ser Val
275 280 285
Phe Leu Gly Gly Val Asp Ser Leu Val Asp Leu Met Asn Lys Ser Phe
290 295 300
Pro Glu Leu Gly Ile Lys Lys Thr Asp Cys Arg Gln Leu Ser Trp Ile
305 310 315 320
Asp Thr Ile Ile Phe Tyr Ser Gly Val Val Asn Tyr Asp Thr Asp Asn
325 330 335
Phe Asn Lys Glu Ile Leu Leu Asp Arg Ser Ala Gly Gln Asn Gly Ala
340 345 350
Phe Lys Ile Lys Leu Asp Tyr Val Lys Lys Pro Ile Pro Glu Ser Val
355 360 365
Phe Val Gln Ile Leu Glu Lys Leu Tyr Glu Glu Asp Ile Gly Ala Gly
370 375 380
Met Tyr Ala Leu Tyr Pro Tyr Gly Gly Ile Met Asp Glu Ile Ser Glu
385 390 395 400
Ser Ala Ile Pro Phe Pro His Arg Ala Gly Ile Leu Tyr Glu Leu Trp
405 410 415
Tyr Ile Cys Ser Trp Glu Lys Gln Glu Asp Asn Glu Lys His Leu Asn
420 425 430
Trp Ile Arg Asn Ile Tyr Asn Phe Met Thr Pro Tyr Val Ser Lys Asn
435 440 445
Pro Arg Leu Ala Tyr Leu Asn Tyr Arg Asp Leu Asp Ile Gly Ile Asn
450 455 460
Asp Pro Lys Asn Pro Asn Asn Tyr Thr Gln Ala Arg Ile Trp Gly Glu
465 470 475 480
Lys Tyr Phe Gly Lys Asn Phe Asp Arg Leu Val Lys Val Lys Thr Leu
485 490 495
Val Asp Pro Asn Asn Phe Phe Arg Asn Glu Gln Ser Ile Pro Pro Leu
500 505 510
Pro Arg His Arg His
515
<210> 106
<211> 2051
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(2051)
<223> 突变的脂肪酸合成酶(FAS1, I306A, R1834K)
<400> 106
Met Asp Ala Tyr Ser Thr Arg Pro Leu Thr Leu Ser His Gly Ser Leu
1 5 10 15
Glu His Val Leu Leu Val Pro Thr Ala Ser Phe Phe Ile Ala Ser Gln
20 25 30
Leu Gln Glu Gln Phe Asn Lys Ile Leu Pro Glu Pro Thr Glu Gly Phe
35 40 45
Ala Ala Asp Asp Glu Pro Thr Thr Pro Ala Glu Leu Val Gly Lys Phe
50 55 60
Leu Gly Tyr Val Ser Ser Leu Val Glu Pro Ser Lys Val Gly Gln Phe
65 70 75 80
Asp Gln Val Leu Asn Leu Cys Leu Thr Glu Phe Glu Asn Cys Tyr Leu
85 90 95
Glu Gly Asn Asp Ile His Ala Leu Ala Ala Lys Leu Leu Gln Glu Asn
100 105 110
Asp Thr Thr Leu Val Lys Thr Lys Glu Leu Ile Lys Asn Tyr Ile Thr
115 120 125
Ala Arg Ile Met Ala Lys Arg Pro Phe Asp Lys Lys Ser Asn Ser Ala
130 135 140
Leu Phe Arg Ala Val Gly Glu Gly Asn Ala Gln Leu Val Ala Ile Phe
145 150 155 160
Gly Gly Gln Gly Asn Thr Asp Asp Tyr Phe Glu Glu Leu Arg Asp Leu
165 170 175
Tyr Gln Thr Tyr His Val Leu Val Gly Asp Leu Ile Lys Phe Ser Ala
180 185 190
Glu Thr Leu Ser Glu Leu Ile Arg Thr Thr Leu Asp Ala Glu Lys Val
195 200 205
Phe Thr Gln Gly Leu Asn Ile Leu Glu Trp Leu Glu Asn Pro Ser Asn
210 215 220
Thr Pro Asp Lys Asp Tyr Leu Leu Ser Ile Pro Ile Ser Cys Pro Leu
225 230 235 240
Ile Gly Val Ile Gln Leu Ala His Tyr Val Val Thr Ala Lys Leu Leu
245 250 255
Gly Phe Thr Pro Gly Glu Leu Arg Ser Tyr Leu Lys Gly Ala Thr Gly
260 265 270
His Ser Gln Gly Leu Val Thr Ala Val Ala Ile Ala Glu Thr Asp Ser
275 280 285
Trp Glu Ser Phe Phe Val Ser Val Arg Lys Ala Ile Thr Val Leu Phe
290 295 300
Phe Gly Gly Val Arg Cys Tyr Glu Ala Tyr Pro Asn Thr Ser Leu Pro
305 310 315 320
Pro Ser Ile Leu Glu Asp Ser Leu Glu Asn Asn Glu Gly Val Pro Ser
325 330 335
Pro Met Leu Ser Ile Ser Asn Leu Thr Gln Glu Gln Val Gln Asp Tyr
340 345 350
Val Asn Lys Thr Asn Ser His Leu Pro Ala Gly Lys Gln Val Glu Ile
355 360 365
Ser Leu Val Asn Gly Ala Lys Asn Leu Val Val Ser Gly Pro Pro Gln
370 375 380
Ser Leu Tyr Gly Leu Asn Leu Thr Leu Arg Lys Ala Lys Ala Pro Ser
385 390 395 400
Gly Leu Asp Gln Ser Arg Ile Pro Phe Ser Glu Arg Lys Leu Lys Phe
405 410 415
Ser Asn Arg Phe Leu Pro Val Ala Ser Pro Phe His Ser His Leu Leu
420 425 430
Val Pro Ala Ser Asp Leu Ile Asn Lys Asp Leu Val Lys Asn Asn Val
435 440 445
Ser Phe Asn Ala Lys Asp Ile Gln Ile Pro Val Tyr Asp Thr Phe Asp
450 455 460
Gly Ser Asp Leu Arg Val Leu Ser Gly Ser Ile Ser Glu Arg Ile Val
465 470 475 480
Asp Cys Ile Ile Arg Leu Pro Val Lys Trp Glu Thr Thr Thr Gln Phe
485 490 495
Lys Ala Thr His Ile Leu Asp Phe Gly Pro Gly Gly Ala Ser Gly Leu
500 505 510
Gly Val Leu Thr His Arg Asn Lys Asp Gly Thr Gly Val Arg Val Ile
515 520 525
Val Ala Gly Thr Leu Asp Ile Asn Pro Asp Asp Asp Tyr Gly Phe Lys
530 535 540
Gln Glu Ile Phe Asp Val Thr Ser Asn Gly Leu Lys Lys Asn Pro Asn
545 550 555 560
Trp Leu Glu Glu Tyr His Pro Lys Leu Ile Lys Asn Lys Ser Gly Lys
565 570 575
Ile Phe Val Glu Thr Lys Phe Ser Lys Leu Ile Gly Arg Pro Pro Leu
580 585 590
Leu Val Pro Gly Met Thr Pro Cys Thr Val Ser Pro Asp Phe Val Ala
595 600 605
Ala Thr Thr Asn Ala Gly Tyr Thr Ile Glu Leu Ala Gly Gly Gly Tyr
610 615 620
Phe Ser Ala Ala Gly Met Thr Ala Ala Ile Asp Ser Val Val Ser Gln
625 630 635 640
Ile Glu Lys Gly Ser Thr Phe Gly Ile Asn Leu Ile Tyr Val Asn Pro
645 650 655
Phe Met Leu Gln Trp Gly Ile Pro Leu Ile Lys Glu Leu Arg Ser Lys
660 665 670
Gly Tyr Pro Ile Gln Phe Leu Thr Ile Gly Ala Gly Val Pro Ser Leu
675 680 685
Glu Val Ala Ser Glu Tyr Ile Glu Thr Leu Gly Leu Lys Tyr Leu Gly
690 695 700
Leu Lys Pro Gly Ser Ile Asp Ala Ile Ser Gln Val Ile Asn Ile Ala
705 710 715 720
Lys Ala His Pro Asn Phe Pro Ile Ala Leu Gln Trp Thr Gly Gly Arg
725 730 735
Gly Gly Gly His His Ser Phe Glu Asp Ala His Thr Pro Met Leu Gln
740 745 750
Met Tyr Ser Lys Ile Arg Arg His Pro Asn Ile Met Leu Ile Phe Gly
755 760 765
Ser Gly Phe Gly Ser Ala Asp Asp Thr Tyr Pro Tyr Leu Thr Gly Glu
770 775 780
Trp Ser Thr Lys Phe Asp Tyr Pro Pro Met Pro Phe Asp Gly Phe Leu
785 790 795 800
Phe Gly Ser Arg Val Met Ile Ala Lys Glu Val Lys Thr Ser Pro Asp
805 810 815
Ala Lys Lys Cys Ile Ala Ala Cys Thr Gly Val Pro Asp Asp Lys Trp
820 825 830
Glu Gln Thr Tyr Lys Lys Pro Thr Gly Gly Ile Val Thr Val Arg Ser
835 840 845
Glu Met Gly Glu Pro Ile His Lys Ile Ala Thr Arg Gly Val Met Leu
850 855 860
Trp Lys Glu Phe Asp Glu Thr Ile Phe Asn Leu Pro Lys Asn Lys Leu
865 870 875 880
Val Pro Thr Leu Glu Ala Lys Arg Asp Tyr Ile Ile Ser Arg Leu Asn
885 890 895
Ala Asp Phe Gln Lys Pro Trp Phe Ala Thr Val Asn Gly Gln Ala Arg
900 905 910
Asp Leu Ala Thr Met Thr Tyr Glu Glu Val Ala Lys Arg Leu Val Glu
915 920 925
Leu Met Phe Ile Arg Ser Thr Asn Ser Trp Phe Asp Val Thr Trp Arg
930 935 940
Thr Phe Thr Gly Asp Phe Leu Arg Arg Val Glu Glu Arg Phe Thr Lys
945 950 955 960
Ser Lys Thr Leu Ser Leu Ile Gln Ser Tyr Ser Leu Leu Asp Lys Pro
965 970 975
Asp Glu Ala Ile Glu Lys Val Phe Asn Ala Tyr Pro Ala Ala Arg Glu
980 985 990
Gln Phe Leu Asn Ala Gln Asp Ile Asp His Phe Leu Ser Met Cys Gln
995 1000 1005
Asn Pro Met Gln Lys Pro Val Pro Phe Val Pro Val Leu Asp Arg Arg
1010 1015 1020
Phe Glu Ile Phe Phe Lys Lys Asp Ser Leu Trp Gln Ser Glu His Leu
1025 1030 1035 1040
Glu Ala Val Val Asp Gln Asp Val Gln Arg Thr Cys Ile Leu His Gly
1045 1050 1055
Pro Val Ala Ala Gln Phe Thr Lys Val Ile Asp Glu Pro Ile Lys Ser
1060 1065 1070
Ile Met Asp Gly Ile His Asp Gly His Ile Lys Lys Leu Leu His Gln
1075 1080 1085
Tyr Tyr Gly Asp Asp Glu Ser Lys Ile Pro Ala Val Glu Tyr Phe Gly
1090 1095 1100
Gly Glu Ser Pro Val Asp Val Gln Ser Gln Val Asp Ser Ser Ser Val
1105 1110 1115 1120
Ser Glu Asp Ser Ala Val Phe Lys Ala Thr Ser Ser Thr Asp Glu Glu
1125 1130 1135
Ser Trp Phe Lys Ala Leu Ala Gly Ser Glu Ile Asn Trp Arg His Ala
1140 1145 1150
Ser Phe Leu Cys Ser Phe Ile Thr Gln Asp Lys Met Phe Val Ser Asn
1155 1160 1165
Pro Ile Arg Lys Val Phe Lys Pro Ser Gln Gly Met Val Val Glu Ile
1170 1175 1180
Ser Asn Gly Asn Thr Ser Ser Lys Thr Val Val Thr Leu Ser Glu Pro
1185 1190 1195 1200
Val Gln Gly Glu Leu Lys Pro Thr Val Ile Leu Lys Leu Leu Lys Glu
1205 1210 1215
Asn Ile Ile Gln Met Glu Met Ile Glu Asn Arg Thr Met Asp Gly Lys
1220 1225 1230
Pro Val Ser Leu Pro Leu Leu Tyr Asn Phe Asn Pro Asp Asn Gly Phe
1235 1240 1245
Ala Pro Ile Ser Glu Val Met Glu Asp Arg Asn Gln Arg Ile Lys Glu
1250 1255 1260
Met Tyr Trp Lys Leu Trp Ile Asp Glu Pro Phe Asn Leu Asp Phe Asp
1265 1270 1275 1280
Pro Arg Asp Val Ile Lys Gly Lys Asp Phe Glu Ile Thr Ala Lys Glu
1285 1290 1295
Val Tyr Asp Phe Thr His Ala Val Gly Asn Asn Cys Glu Asp Phe Val
1300 1305 1310
Ser Arg Pro Asp Arg Thr Met Leu Ala Pro Met Asp Phe Ala Ile Val
1315 1320 1325
Val Gly Trp Arg Ala Ile Ile Lys Ala Ile Phe Pro Asn Thr Val Asp
1330 1335 1340
Gly Asp Leu Leu Lys Leu Val His Leu Ser Asn Gly Tyr Lys Met Ile
1345 1350 1355 1360
Pro Gly Ala Lys Pro Leu Gln Val Gly Asp Val Val Ser Thr Thr Ala
1365 1370 1375
Val Ile Glu Ser Val Val Asn Gln Pro Thr Gly Lys Ile Val Asp Val
1380 1385 1390
Val Gly Thr Leu Ser Arg Asn Gly Lys Pro Val Met Glu Val Thr Ser
1395 1400 1405
Ser Phe Phe Tyr Arg Gly Asn Tyr Thr Asp Phe Glu Asn Thr Phe Gln
1410 1415 1420
Lys Thr Val Glu Pro Val Tyr Gln Met His Ile Lys Thr Ser Lys Asp
1425 1430 1435 1440
Ile Ala Val Leu Arg Ser Lys Glu Trp Phe Gln Leu Asp Asp Glu Asp
1445 1450 1455
Phe Asp Leu Leu Asn Lys Thr Leu Thr Phe Glu Thr Glu Thr Glu Val
1460 1465 1470
Thr Phe Lys Asn Ala Asn Ile Phe Ser Ser Val Lys Cys Phe Gly Pro
1475 1480 1485
Ile Lys Val Glu Leu Pro Thr Lys Glu Thr Val Glu Ile Gly Ile Val
1490 1495 1500
Asp Tyr Glu Ala Gly Ala Ser His Gly Asn Pro Val Val Asp Phe Leu
1505 1510 1515 1520
Lys Arg Asn Gly Ser Thr Leu Glu Gln Lys Val Asn Leu Glu Asn Pro
1525 1530 1535
Ile Pro Ile Ala Val Leu Asp Ser Tyr Thr Pro Ser Thr Asn Glu Pro
1540 1545 1550
Tyr Ala Arg Val Ser Gly Asp Leu Asn Pro Ile His Val Ser Arg His
1555 1560 1565
Phe Ala Ser Tyr Ala Asn Leu Pro Gly Thr Ile Thr His Gly Met Phe
1570 1575 1580
Ser Ser Ala Ser Val Arg Ala Leu Ile Glu Asn Trp Ala Ala Asp Ser
1585 1590 1595 1600
Val Ser Ser Arg Val Arg Gly Tyr Thr Cys Gln Phe Val Asp Met Val
1605 1610 1615
Leu Pro Asn Thr Ala Leu Lys Thr Ser Ile Gln His Val Gly Met Ile
1620 1625 1630
Asn Gly Arg Lys Leu Ile Lys Phe Glu Thr Arg Asn Glu Asp Asp Val
1635 1640 1645
Val Val Leu Thr Gly Glu Ala Glu Ile Glu Gln Pro Val Thr Thr Phe
1650 1655 1660
Val Phe Thr Gly Gln Gly Ser Gln Glu Gln Gly Met Gly Met Asp Leu
1665 1670 1675 1680
Tyr Lys Thr Ser Lys Ala Ala Gln Asp Val Trp Asn Arg Ala Asp Asn
1685 1690 1695
His Phe Lys Asp Thr Tyr Gly Phe Ser Ile Leu Asp Ile Val Ile Asn
1700 1705 1710
Asn Pro Val Asn Leu Thr Ile His Phe Gly Gly Glu Lys Gly Lys Arg
1715 1720 1725
Ile Arg Glu Asn Tyr Ser Ala Met Ile Phe Glu Thr Ile Val Asp Gly
1730 1735 1740
Lys Leu Lys Thr Glu Lys Ile Phe Lys Glu Ile Asn Glu His Ser Thr
1745 1750 1755 1760
Ser Tyr Thr Phe Arg Ser Glu Lys Gly Leu Leu Ser Ala Thr Gln Phe
1765 1770 1775
Thr Gln Pro Ala Leu Thr Leu Met Glu Lys Ala Ala Phe Glu Asp Leu
1780 1785 1790
Lys Ser Lys Gly Leu Ile Pro Ala Asp Ala Thr Phe Ala Gly His Ser
1795 1800 1805
Leu Gly Glu Tyr Ala Ala Leu Ala Ser Leu Ala Asp Val Met Ser Ile
1810 1815 1820
Glu Ser Leu Val Glu Val Val Phe Tyr Phe Gly Met Thr Met Gln Val
1825 1830 1835 1840
Ala Val Pro Arg Asp Glu Leu Gly Arg Ser Asn Tyr Gly Met Ile Ala
1845 1850 1855
Ile Asn Pro Gly Arg Val Ala Ala Ser Phe Ser Gln Glu Ala Leu Gln
1860 1865 1870
Tyr Val Val Glu Arg Val Gly Lys Arg Thr Gly Trp Leu Val Glu Ile
1875 1880 1885
Val Asn Tyr Asn Val Glu Asn Gln Gln Tyr Val Ala Ala Gly Asp Leu
1890 1895 1900
Arg Ala Leu Asp Thr Val Thr Asn Val Leu Asn Phe Ile Lys Leu Gln
1905 1910 1915 1920
Lys Ile Asp Ile Ile Glu Leu Gln Lys Ser Leu Ser Leu Glu Glu Val
1925 1930 1935
Glu Gly His Leu Phe Glu Ile Ile Asp Glu Ala Ser Lys Lys Ser Ala
1940 1945 1950
Val Lys Pro Arg Pro Leu Lys Leu Glu Arg Gly Phe Ala Cys Ile Pro
1955 1960 1965
Leu Val Gly Ile Ser Val Pro Phe His Ser Thr Tyr Leu Met Asn Gly
1970 1975 1980
Val Lys Pro Phe Lys Ser Phe Leu Lys Lys Asn Ile Ile Lys Glu Asn
1985 1990 1995 2000
Val Lys Val Ala Arg Leu Ala Gly Lys Tyr Ile Pro Asn Leu Thr Ala
2005 2010 2015
Lys Pro Phe Gln Val Thr Lys Glu Tyr Phe Gln Asp Val Tyr Asp Leu
2020 2025 2030
Thr Gly Ser Glu Pro Ile Lys Glu Ile Ile Asp Asn Trp Glu Lys Tyr
2035 2040 2045
Glu Gln Ser
2050
<210> 107
<211> 1887
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(1887)
<223> 突变的脂肪酸合成酶(FAS2, G1250S)
<400> 107
Met Lys Pro Glu Val Glu Gln Glu Leu Ala His Ile Leu Leu Thr Glu
1 5 10 15
Leu Leu Ala Tyr Gln Phe Ala Ser Pro Val Arg Trp Ile Glu Thr Gln
20 25 30
Asp Val Phe Leu Lys Asp Phe Asn Thr Glu Arg Val Val Glu Ile Gly
35 40 45
Pro Ser Pro Thr Leu Ala Gly Met Ala Gln Arg Thr Leu Lys Asn Lys
50 55 60
Tyr Glu Ser Tyr Asp Ala Ala Leu Ser Leu His Arg Glu Ile Leu Cys
65 70 75 80
Tyr Ser Lys Asp Ala Lys Glu Ile Tyr Tyr Thr Pro Asp Pro Ser Glu
85 90 95
Leu Ala Ala Lys Glu Glu Pro Ala Lys Glu Glu Ala Pro Ala Pro Thr
100 105 110
Pro Ala Ala Ser Ala Pro Ala Pro Ala Ala Ala Ala Pro Ala Pro Val
115 120 125
Ala Ala Ala Ala Pro Ala Ala Ala Ala Ala Glu Ile Ala Asp Glu Pro
130 135 140
Val Lys Ala Ser Leu Leu Leu His Val Leu Val Ala His Lys Leu Lys
145 150 155 160
Lys Ser Leu Asp Ser Ile Pro Met Ser Lys Thr Ile Lys Asp Leu Val
165 170 175
Gly Gly Lys Ser Thr Val Gln Asn Glu Ile Leu Gly Asp Leu Gly Lys
180 185 190
Glu Phe Gly Thr Thr Pro Glu Lys Pro Glu Glu Thr Pro Leu Glu Glu
195 200 205
Leu Ala Glu Thr Phe Gln Asp Thr Phe Ser Gly Ala Leu Gly Lys Gln
210 215 220
Ser Ser Ser Leu Leu Ser Arg Leu Ile Ser Ser Lys Met Pro Gly Gly
225 230 235 240
Phe Thr Ile Thr Val Ala Arg Lys Tyr Leu Gln Thr Arg Trp Gly Leu
245 250 255
Pro Ser Gly Arg Gln Asp Gly Val Leu Leu Val Ala Leu Ser Asn Glu
260 265 270
Pro Ala Ala Arg Leu Gly Ser Glu Ala Asp Ala Lys Ala Phe Leu Asp
275 280 285
Ser Met Ala Gln Lys Tyr Ala Ser Ile Val Gly Val Asp Leu Ser Ser
290 295 300
Ala Ala Ser Ala Ser Gly Ala Ala Gly Ala Gly Ala Ala Ala Gly Ala
305 310 315 320
Ala Met Ile Asp Ala Gly Ala Leu Glu Glu Ile Thr Lys Asp His Lys
325 330 335
Val Leu Ala Arg Gln Gln Leu Gln Val Leu Ala Arg Tyr Leu Lys Met
340 345 350
Asp Leu Asp Asn Gly Glu Arg Lys Phe Leu Lys Glu Lys Asp Thr Val
355 360 365
Ala Glu Leu Gln Ala Gln Leu Asp Tyr Leu Asn Ala Glu Leu Gly Glu
370 375 380
Phe Phe Val Asn Gly Val Ala Thr Ser Phe Ser Arg Lys Lys Ala Arg
385 390 395 400
Thr Phe Asp Ser Ser Trp Asn Trp Ala Lys Gln Ser Leu Leu Ser Leu
405 410 415
Tyr Phe Glu Ile Ile His Gly Val Leu Lys Asn Val Asp Arg Glu Val
420 425 430
Val Ser Glu Ala Ile Asn Ile Met Asn Arg Ser Asn Asp Ala Leu Ile
435 440 445
Lys Phe Met Glu Tyr His Ile Ser Asn Thr Asp Glu Thr Lys Gly Glu
450 455 460
Asn Tyr Gln Leu Val Lys Thr Leu Gly Glu Gln Leu Ile Glu Asn Cys
465 470 475 480
Lys Gln Val Leu Asp Val Asp Pro Val Tyr Lys Asp Val Ala Lys Pro
485 490 495
Thr Gly Pro Lys Thr Ala Ile Asp Lys Asn Gly Asn Ile Thr Tyr Ser
500 505 510
Glu Glu Pro Arg Glu Lys Val Arg Lys Leu Ser Gln Tyr Val Gln Glu
515 520 525
Met Ala Leu Gly Gly Pro Ile Thr Lys Glu Ser Gln Pro Thr Ile Glu
530 535 540
Glu Asp Leu Thr Arg Val Tyr Lys Ala Ile Ser Ala Gln Ala Asp Lys
545 550 555 560
Gln Asp Ile Ser Ser Ser Thr Arg Val Glu Phe Glu Lys Leu Tyr Ser
565 570 575
Asp Leu Met Lys Phe Leu Glu Ser Ser Lys Glu Ile Asp Pro Ser Gln
580 585 590
Thr Thr Gln Leu Ala Gly Met Asp Val Glu Asp Ala Leu Asp Lys Asp
595 600 605
Ser Thr Lys Glu Val Ala Ser Leu Pro Asn Lys Ser Thr Ile Ser Lys
610 615 620
Thr Val Ser Ser Thr Ile Pro Arg Glu Thr Ile Pro Phe Leu His Leu
625 630 635 640
Arg Lys Lys Thr Pro Ala Gly Asp Trp Lys Tyr Asp Arg Gln Leu Ser
645 650 655
Ser Leu Phe Leu Asp Gly Leu Glu Lys Ala Ala Phe Asn Gly Val Thr
660 665 670
Phe Lys Asp Lys Tyr Val Leu Ile Thr Gly Ala Gly Lys Gly Ser Ile
675 680 685
Gly Ala Glu Val Leu Gln Gly Leu Leu Gln Gly Gly Ala Lys Val Val
690 695 700
Val Thr Thr Ser Arg Phe Ser Lys Gln Val Thr Asp Tyr Tyr Gln Ser
705 710 715 720
Ile Tyr Ala Lys Tyr Gly Ala Lys Gly Ser Thr Leu Ile Val Val Pro
725 730 735
Phe Asn Gln Gly Ser Lys Gln Asp Val Glu Ala Leu Ile Glu Phe Ile
740 745 750
Tyr Asp Thr Glu Lys Asn Gly Gly Leu Gly Trp Asp Leu Asp Ala Ile
755 760 765
Ile Pro Phe Ala Ala Ile Pro Glu Gln Gly Ile Glu Leu Glu His Ile
770 775 780
Asp Ser Lys Ser Glu Phe Ala His Arg Ile Met Leu Thr Asn Ile Leu
785 790 795 800
Arg Met Met Gly Cys Val Lys Lys Gln Lys Ser Ala Arg Gly Ile Glu
805 810 815
Thr Arg Pro Ala Gln Val Ile Leu Pro Met Ser Pro Asn His Gly Thr
820 825 830
Phe Gly Gly Asp Gly Met Tyr Ser Glu Ser Lys Leu Ser Leu Glu Thr
835 840 845
Leu Phe Asn Arg Trp His Ser Glu Ser Trp Ala Asn Gln Leu Thr Val
850 855 860
Cys Gly Ala Ile Ile Gly Trp Thr Arg Gly Thr Gly Leu Met Ser Ala
865 870 875 880
Asn Asn Ile Ile Ala Glu Gly Ile Glu Lys Met Gly Val Arg Thr Phe
885 890 895
Ser Gln Lys Glu Met Ala Phe Asn Leu Leu Gly Leu Leu Thr Pro Glu
900 905 910
Val Val Glu Leu Cys Gln Lys Ser Pro Val Met Ala Asp Leu Asn Gly
915 920 925
Gly Leu Gln Phe Val Pro Glu Leu Lys Glu Phe Thr Ala Lys Leu Arg
930 935 940
Lys Glu Leu Val Glu Thr Ser Glu Val Arg Lys Ala Val Ser Ile Glu
945 950 955 960
Thr Ala Leu Glu His Lys Val Val Asn Gly Asn Ser Ala Asp Ala Ala
965 970 975
Tyr Ala Gln Val Glu Ile Gln Pro Arg Ala Asn Ile Gln Leu Asp Phe
980 985 990
Pro Glu Leu Lys Pro Tyr Lys Gln Val Lys Gln Ile Ala Pro Ala Glu
995 1000 1005
Leu Glu Gly Leu Leu Asp Leu Glu Arg Val Ile Val Val Thr Gly Phe
1010 1015 1020
Ala Glu Val Gly Pro Trp Gly Ser Ala Arg Thr Arg Trp Glu Met Glu
1025 1030 1035 1040
Ala Phe Gly Glu Phe Ser Leu Glu Gly Cys Val Glu Met Ala Trp Ile
1045 1050 1055
Met Gly Phe Ile Ser Tyr His Asn Gly Asn Leu Lys Gly Arg Pro Tyr
1060 1065 1070
Thr Gly Trp Val Asp Ser Lys Thr Lys Glu Pro Val Asp Asp Lys Asp
1075 1080 1085
Val Lys Ala Lys Tyr Glu Thr Ser Ile Leu Glu His Ser Gly Ile Arg
1090 1095 1100
Leu Ile Glu Pro Glu Leu Phe Asn Gly Tyr Asn Pro Glu Lys Lys Glu
1105 1110 1115 1120
Met Ile Gln Glu Val Ile Val Glu Glu Asp Leu Glu Pro Phe Glu Ala
1125 1130 1135
Ser Lys Glu Thr Ala Glu Gln Phe Lys His Gln His Gly Asp Lys Val
1140 1145 1150
Asp Ile Phe Glu Ile Pro Glu Thr Gly Glu Tyr Ser Val Lys Leu Leu
1155 1160 1165
Lys Gly Ala Thr Leu Tyr Ile Pro Lys Ala Leu Arg Phe Asp Arg Leu
1170 1175 1180
Val Ala Gly Gln Ile Pro Thr Gly Trp Asn Ala Lys Thr Tyr Gly Ile
1185 1190 1195 1200
Ser Asp Asp Ile Ile Ser Gln Val Asp Pro Ile Thr Leu Phe Val Leu
1205 1210 1215
Val Ser Val Val Glu Ala Phe Ile Ala Ser Gly Ile Thr Asp Pro Tyr
1220 1225 1230
Glu Met Tyr Lys Tyr Val His Val Ser Glu Val Gly Asn Cys Ser Gly
1235 1240 1245
Ser Ser Met Gly Gly Val Ser Ala Leu Arg Gly Met Phe Lys Asp Arg
1250 1255 1260
Phe Lys Asp Glu Pro Val Gln Asn Asp Ile Leu Gln Glu Ser Phe Ile
1265 1270 1275 1280
Asn Thr Met Ser Ala Trp Val Asn Met Leu Leu Ile Ser Ser Ser Gly
1285 1290 1295
Pro Ile Lys Thr Pro Val Gly Ala Cys Ala Thr Ser Val Glu Ser Val
1300 1305 1310
Asp Ile Gly Val Glu Thr Ile Leu Ser Gly Lys Ala Arg Ile Cys Ile
1315 1320 1325
Val Gly Gly Tyr Asp Asp Phe Gln Glu Glu Gly Ser Phe Glu Phe Gly
1330 1335 1340
Asn Met Lys Ala Thr Ser Asn Thr Leu Glu Glu Phe Glu His Gly Arg
1345 1350 1355 1360
Thr Pro Ala Glu Met Ser Arg Pro Ala Thr Thr Thr Arg Asn Gly Phe
1365 1370 1375
Met Glu Ala Gln Gly Ala Gly Ile Gln Ile Ile Met Gln Ala Asp Leu
1380 1385 1390
Ala Leu Lys Met Gly Val Pro Ile Tyr Gly Ile Val Ala Met Ala Ala
1395 1400 1405
Thr Ala Thr Asp Lys Ile Gly Arg Ser Val Pro Ala Pro Gly Lys Gly
1410 1415 1420
Ile Leu Thr Thr Ala Arg Glu His His Ser Ser Val Lys Tyr Ala Ser
1425 1430 1435 1440
Pro Asn Leu Asn Met Lys Tyr Arg Lys Arg Gln Leu Val Thr Arg Glu
1445 1450 1455
Ala Gln Ile Lys Asp Trp Val Glu Asn Glu Leu Glu Ala Leu Lys Leu
1460 1465 1470
Glu Ala Glu Glu Ile Pro Ser Glu Asp Gln Asn Glu Phe Leu Leu Glu
1475 1480 1485
Arg Thr Arg Glu Ile His Asn Glu Ala Glu Ser Gln Leu Arg Ala Ala
1490 1495 1500
Gln Gln Gln Trp Gly Asn Asp Phe Tyr Lys Arg Asp Pro Arg Ile Ala
1505 1510 1515 1520
Pro Leu Arg Gly Ala Leu Ala Thr Tyr Gly Leu Thr Ile Asp Asp Leu
1525 1530 1535
Gly Val Ala Ser Phe His Gly Thr Ser Thr Lys Ala Asn Asp Lys Asn
1540 1545 1550
Glu Ser Ala Thr Ile Asn Glu Met Met Lys His Leu Gly Arg Ser Glu
1555 1560 1565
Gly Asn Pro Val Ile Gly Val Phe Gln Lys Phe Leu Thr Gly His Pro
1570 1575 1580
Lys Gly Ala Ala Gly Ala Trp Met Met Asn Gly Ala Leu Gln Ile Leu
1585 1590 1595 1600
Asn Ser Gly Ile Ile Pro Gly Asn Arg Asn Ala Asp Asn Val Asp Lys
1605 1610 1615
Ile Leu Glu Gln Phe Glu Tyr Val Leu Tyr Pro Ser Lys Thr Leu Lys
1620 1625 1630
Thr Asp Gly Val Arg Ala Val Ser Ile Thr Ser Phe Gly Phe Gly Gln
1635 1640 1645
Lys Gly Gly Gln Ala Ile Val Val His Pro Asp Tyr Leu Tyr Gly Ala
1650 1655 1660
Ile Thr Glu Asp Arg Tyr Asn Glu Tyr Val Ala Lys Val Ser Ala Arg
1665 1670 1675 1680
Glu Lys Ser Ala Tyr Lys Phe Phe His Asn Gly Met Ile Tyr Asn Lys
1685 1690 1695
Leu Phe Val Ser Lys Glu His Ala Pro Tyr Thr Asp Glu Leu Glu Glu
1700 1705 1710
Asp Val Tyr Leu Asp Pro Leu Ala Arg Val Ser Lys Asp Lys Lys Ser
1715 1720 1725
Gly Ser Leu Thr Phe Asn Ser Lys Asn Ile Gln Ser Lys Asp Ser Tyr
1730 1735 1740
Ile Asn Ala Asn Thr Ile Glu Thr Ala Lys Met Ile Glu Asn Met Thr
1745 1750 1755 1760
Lys Glu Lys Val Ser Asn Gly Gly Val Gly Val Asp Val Glu Leu Ile
1765 1770 1775
Thr Ser Ile Asn Val Glu Asn Asp Thr Phe Ile Glu Arg Asn Phe Thr
1780 1785 1790
Pro Gln Glu Ile Glu Tyr Cys Ser Ala Gln Pro Ser Val Gln Ser Ser
1795 1800 1805
Phe Ala Gly Thr Trp Ser Ala Lys Glu Ala Val Phe Lys Ser Leu Gly
1810 1815 1820
Val Lys Ser Leu Gly Gly Gly Ala Ala Leu Lys Asp Ile Glu Ile Val
1825 1830 1835 1840
Arg Val Asn Lys Asn Ala Pro Ala Val Glu Leu His Gly Asn Ala Lys
1845 1850 1855
Lys Ala Ala Glu Glu Ala Gly Val Thr Asp Val Lys Val Ser Ile Ser
1860 1865 1870
His Asp Asp Leu Gln Ala Val Ala Val Ala Val Ser Thr Lys Lys
1875 1880 1885
<210> 108
<211> 371
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(371)
<223> MBP标签
<400> 108
Met Lys Ile Glu Glu Gly Lys Leu Val Ile Trp Ile Asn Gly Asp Lys
1 5 10 15
Gly Tyr Asn Gly Leu Ala Glu Val Gly Lys Lys Phe Glu Lys Asp Thr
20 25 30
Gly Ile Lys Val Thr Val Glu His Pro Asp Lys Leu Glu Glu Lys Phe
35 40 45
Pro Gln Val Ala Ala Thr Gly Asp Gly Pro Asp Ile Ile Phe Trp Ala
50 55 60
His Asp Arg Phe Gly Gly Tyr Ala Gln Ser Gly Leu Leu Ala Glu Ile
65 70 75 80
Thr Pro Asp Lys Ala Phe Gln Asp Lys Leu Tyr Pro Phe Thr Trp Asp
85 90 95
Ala Val Arg Tyr Asn Gly Lys Leu Ile Ala Tyr Pro Ile Ala Val Glu
100 105 110
Ala Leu Ser Leu Ile Tyr Asn Lys Asp Leu Leu Pro Asn Pro Pro Lys
115 120 125
Thr Trp Glu Glu Ile Pro Ala Leu Asp Lys Glu Leu Lys Ala Lys Gly
130 135 140
Lys Ser Ala Leu Met Phe Asn Leu Gln Glu Pro Tyr Phe Thr Trp Pro
145 150 155 160
Leu Ile Ala Ala Asp Gly Gly Tyr Ala Phe Lys Tyr Glu Asn Gly Lys
165 170 175
Tyr Asp Ile Lys Asp Val Gly Val Asp Asn Ala Gly Ala Lys Ala Gly
180 185 190
Leu Thr Phe Leu Val Asp Leu Ile Lys Asn Lys His Met Asn Ala Asp
195 200 205
Thr Asp Tyr Ser Ile Ala Glu Ala Ala Phe Asn Lys Gly Glu Thr Ala
210 215 220
Met Thr Ile Asn Gly Pro Trp Ala Trp Ser Asn Ile Asp Thr Ser Lys
225 230 235 240
Val Asn Tyr Gly Val Thr Val Leu Pro Thr Phe Lys Gly Gln Pro Ser
245 250 255
Lys Pro Phe Val Gly Val Leu Ser Ala Gly Ile Asn Ala Ala Ser Pro
260 265 270
Asn Lys Glu Leu Ala Lys Glu Phe Leu Glu Asn Tyr Leu Leu Thr Asp
275 280 285
Glu Gly Leu Glu Ala Val Asn Lys Asp Lys Pro Leu Gly Ala Val Ala
290 295 300
Leu Lys Ser Tyr Glu Glu Glu Leu Ala Lys Asp Pro Arg Ile Ala Ala
305 310 315 320
Thr Met Glu Asn Ala Gln Lys Gly Glu Ile Met Pro Asn Ile Pro Gln
325 330 335
Met Ser Ala Phe Trp Tyr Ala Val Arg Thr Ala Val Ile Asn Ala Ala
340 345 350
Ser Gly Arg Gln Thr Val Asp Glu Ala Leu Lys Asp Ala Gln Thr Arg
355 360 365
Ile Thr Lys
370
<210> 109
<211> 24
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(24)
<223> ProA标签
<400> 109
Met Ile Phe Asp Gly Thr Thr Met Ser Ile Ala Ile Gly Leu Leu Ser
1 5 10 15
Thr Leu Gly Ile Gly Ala Glu Ala
20
<210> 110
<211> 398
<212> PRT
<213> Cannibis sativa
<400> 110
Met Gly Leu Ser Leu Val Cys Thr Phe Ser Phe Gln Thr Asn Tyr His
1 5 10 15
Thr Leu Leu Asn Pro His Asn Lys Asn Pro Lys Asn Ser Leu Leu Ser
20 25 30
Tyr Gln His Pro Lys Thr Pro Ile Ile Lys Ser Ser Tyr Asp Asn Phe
35 40 45
Pro Ser Lys Tyr Cys Leu Thr Lys Asn Phe His Leu Leu Gly Leu Asn
50 55 60
Ser His Asn Arg Ile Ser Ser Gln Ser Arg Ser Ile Arg Ala Gly Ser
65 70 75 80
Asp Gln Ile Glu Gly Ser Pro His His Glu Ser Asp Asn Ser Ile Ala
85 90 95
Thr Lys Ile Leu Asn Phe Gly His Thr Cys Trp Lys Leu Gln Arg Pro
100 105 110
Tyr Val Val Lys Gly Met Ile Ser Ile Ala Cys Gly Leu Phe Gly Arg
115 120 125
Glu Leu Phe Asn Asn Arg His Leu Phe Ser Trp Gly Leu Met Trp Lys
130 135 140
Ala Phe Phe Ala Leu Val Pro Ile Leu Ser Phe Asn Phe Phe Ala Ala
145 150 155 160
Ile Met Asn Gln Ile Tyr Asp Val Asp Ile Asp Arg Ile Asn Lys Pro
165 170 175
Asp Leu Pro Leu Val Ser Gly Glu Met Ser Ile Glu Thr Ala Trp Ile
180 185 190
Leu Ser Ile Ile Val Ala Leu Thr Gly Leu Ile Val Thr Ile Lys Leu
195 200 205
Lys Ser Ala Pro Leu Phe Val Phe Ile Tyr Ile Phe Gly Ile Phe Ala
210 215 220
Gly Phe Ala Tyr Ser Val Pro Pro Ile Arg Trp Lys Gln Tyr Pro Phe
225 230 235 240
Thr Asn Phe Leu Ile Thr Ile Ser Ser His Val Gly Leu Ala Phe Thr
245 250 255
Ser Tyr Ser Ala Thr Thr Ser Ala Leu Gly Leu Pro Phe Val Trp Arg
260 265 270
Pro Ala Phe Ser Phe Ile Ile Ala Phe Met Thr Val Met Gly Met Thr
275 280 285
Ile Ala Phe Ala Lys Asp Ile Ser Asp Ile Glu Gly Asp Ala Lys Tyr
290 295 300
Gly Val Ser Thr Val Ala Thr Lys Leu Gly Ala Arg Asn Met Thr Phe
305 310 315 320
Val Val Ser Gly Val Leu Leu Leu Asn Tyr Leu Val Ser Ile Ser Ile
325 330 335
Gly Ile Ile Trp Pro Gln Val Phe Lys Ser Asn Ile Met Ile Leu Ser
340 345 350
His Ala Ile Leu Ala Phe Cys Leu Ile Phe Gln Thr Arg Glu Leu Ala
355 360 365
Leu Ala Asn Tyr Ala Ser Ala Pro Ser Arg Gln Phe Phe Glu Phe Ile
370 375 380
Trp Leu Leu Tyr Tyr Ala Glu Tyr Phe Val Tyr Val Phe Ile
385 390 395
<210> 111
<211> 1197
<212> DNA
<213> Cannibis sativa
<400> 111
atgggtttat ctttggtctg caccttctcc tttcaaacta actaccacac tttattgaat 60
ccacataata agaatcctaa gaactcttta ttgtcctacc aacacccaaa gactcctatt 120
atcaagtcct cttacgataa cttcccatct aagtactgtt tgactaagaa tttccatttg 180
ttgggtttga attctcacaa cagaatttcc tcccaatccc gttctattag agccggttct 240
gatcaaatcg aaggttcccc tcatcatgag tccgataact ccattgctac taaaatttta 300
aatttcggtc atacttgttg gaagttgcaa cgtccttacg ttgtcaaggg tatgatctct 360
attgcttgtg gtttgttcgg tagagaattg tttaacaaca gacacttgtt ctcttggggt 420
ttgatgtgga aagctttctt cgctttggtc ccaattttgt ctttcaattt cttcgccgcc 480
atcatgaacc aaatctacga tgttgatatc gaccgtatca acaagccaga cttaccttta 540
gtttccggtg aaatgtccat tgaaactgct tggatcttgt ctatcattgt tgccttgact 600
ggtttaattg ttactattaa gttgaagtcc gctccattgt ttgtcttcat ctacatcttc 660
ggtatcttcg ctggtttcgc ttactccgtc ccacctatta gatggaaaca atatcctttt 720
accaatttct tgatcactat ttcctctcat gttggtttgg ctttcacttc ttactctgcc 780
accacttctg ctttaggttt gcctttcgtt tggcgtcctg ccttctcttt cattattgct 840
ttcatgactg tcatgggtat gactattgcc tttgctaaag acatttctga tatcgaaggt 900
gatgctaagt acggtgtctc taccgttgct accaagttag gtgctagaaa tatgactttt 960
gttgtttctg gtgtcttatt gttgaactac ttggtttcta tctctattgg tatcatttgg 1020
ccacaagttt tcaagtctaa cattatgatc ttgtctcatg ctattttggc tttctgtttg 1080
atctttcaaa ctcgtgaatt agccttagcc aattatgcct ctgccccatc ccgtcaattt 1140
ttcgaattca tctggttgtt atactatgcc gaatacttcg tttacgtctt catttaa 1197
<210> 112
<211> 522
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(522)
<223> 截短的酰基活化酶AAE (CsAAE3截短)
<400> 112
Met Glu Lys Ser Gly Tyr Gly Arg Asp Gly Ile Tyr Arg Ser Leu Arg
1 5 10 15
Pro Pro Leu His Leu Pro Asn Asn Asn Asn Leu Ser Met Val Ser Phe
20 25 30
Leu Phe Arg Asn Ser Ser Ser Tyr Pro Gln Lys Pro Ala Leu Ile Asp
35 40 45
Ser Glu Thr Asn Gln Ile Leu Ser Phe Ser His Phe Lys Ser Thr Val
50 55 60
Ile Lys Val Ser His Gly Phe Leu Asn Leu Gly Ile Lys Lys Asn Asp
65 70 75 80
Trp Leu Ile Tyr Ala Pro Asn Ser Ile His Phe Pro Val Cys Phe Leu
85 90 95
Gly Ile Ile Ala Ser Gly Ala Ile Ala Thr Thr Ser Asn Pro Leu Tyr
100 105 110
Thr Val Ser Glu Leu Ser Lys Gln Val Lys Asp Ser Asn Pro Lys Leu
115 120 125
Ile Ile Thr Val Pro Gln Leu Leu Glu Lys Val Lys Gly Phe Asn Leu
130 135 140
Pro Thr Ile Leu Ile Gly Pro Asp Ser Glu Gln Glu Ser Ser Ser Asp
145 150 155 160
Lys Val Met Thr Phe Asn Asp Leu Val Asn Leu Gly Gly Ser Ser Gly
165 170 175
Ser Glu Phe Pro Ile Val Asp Asp Phe Lys Gln Ser Asp Thr Ala Ala
180 185 190
Leu Leu Tyr Ser Ser Gly Thr Thr Gly Met Ser Lys Gly Trp Leu Thr
195 200 205
His Lys Asn Phe Ile Ala Ser Ser Leu Met Val Thr Met Glu Gln Asp
210 215 220
Leu Val Gly Glu Met Asp Asn Val Phe Leu Cys Phe Leu Pro Met Phe
225 230 235 240
His Val Phe Gly Leu Ala Ile Ile Thr Tyr Ala Gln Leu Gln Arg Gly
245 250 255
Asn Thr Val Ile Ser Ala Arg Phe Asp Leu Glu Lys Met Leu Lys Asp
260 265 270
Val Glu Lys Tyr Val Thr His Leu Trp Trp Pro Pro Val Ile Leu Ala
275 280 285
Leu Ser Lys Asn Ser Met Val Lys Phe Asn Leu Ser Ser Ile Lys Tyr
290 295 300
Ile Gly Ser Gly Ala Ala Pro Leu Gly Lys Asp Leu Met Glu Glu Cys
305 310 315 320
Ser Lys Trp Pro Tyr Gly Ile Val Ala Gln Gly Tyr Gly Met Thr Glu
325 330 335
Thr Cys Gly Ile Val Ser Met Glu Asp Ile Arg Gly Gly Lys Arg Asn
340 345 350
Ser Gly Ser Ala Gly Met Leu Ala Ser Gly Val Glu Ala Gln Ile Val
355 360 365
Ser Val Asp Thr Leu Lys Pro Leu Pro Pro Asn Gln Leu Gly Glu Ile
370 375 380
Trp Val Lys Gly Pro Asn Met Met Gln Gly Tyr Phe Asn Asn Pro Gln
385 390 395 400
Ala Thr Lys Leu Thr Ile Asp Lys Lys Gly Trp Val His Thr Gly Asp
405 410 415
Leu Gly Tyr Phe Asp Glu Asp Gly His Leu Tyr Trp Asp Arg Ile Lys
420 425 430
Glu Leu Ile Lys Tyr Lys Gly Phe Gln Val Ala Pro Ala Glu Leu Glu
435 440 445
Gly Leu Leu Val Ser His Pro Glu Ile Leu Asp Ala Trp Ile Pro Phe
450 455 460
Pro Asp Ala Glu Ala Gly Glu Val Pro Val Ala Tyr Trp Arg Ser Pro
465 470 475 480
Asn Ser Ser Leu Thr Glu Asn Asp Val Lys Lys Phe Ile Ala Gly Gln
485 490 495
Val Ala Ser Phe Lys Arg Leu Arg Lys Val Thr Phe Ile Asn Ser Val
500 505 510
Pro Lys Ser Ala Ser Gly Lys Ile Leu Arg
515 520
<210> 113
<211> 526
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(526)
<223> 截短的3-羟基-3-甲基-戊二酰辅酶A还原酶(tHMG1)
<400> 113
Met Ser Asp Gln Leu Val Lys Thr Glu Val Thr Lys Lys Ser Phe Thr
1 5 10 15
Ala Pro Val Gln Lys Ala Ser Thr Pro Val Leu Thr Asn Lys Thr Val
20 25 30
Ile Ser Gly Ser Lys Val Lys Ser Leu Ser Ser Ala Gln Ser Ser Ser
35 40 45
Ser Gly Pro Ser Ser Ser Ser Glu Glu Asp Asp Ser Arg Asp Ile Glu
50 55 60
Ser Leu Asp Lys Lys Ile Arg Pro Leu Glu Glu Leu Glu Ala Leu Leu
65 70 75 80
Ser Ser Gly Asn Thr Lys Gln Leu Lys Asn Lys Glu Val Ala Ala Leu
85 90 95
Val Ile His Gly Lys Leu Pro Leu Tyr Ala Leu Glu Lys Lys Leu Gly
100 105 110
Asp Thr Thr Arg Ala Val Ala Val Arg Arg Lys Ala Leu Ser Ile Leu
115 120 125
Ala Glu Ala Pro Val Leu Ala Ser Asp Arg Leu Pro Tyr Lys Asn Tyr
130 135 140
Asp Tyr Asp Arg Val Phe Gly Ala Cys Cys Glu Asn Val Ile Gly Tyr
145 150 155 160
Met Pro Leu Pro Val Gly Val Ile Gly Pro Leu Val Ile Asp Gly Thr
165 170 175
Ser Tyr His Ile Pro Met Ala Thr Thr Glu Gly Cys Leu Val Ala Ser
180 185 190
Ala Met Arg Gly Cys Lys Ala Ile Asn Ala Gly Gly Gly Ala Thr Thr
195 200 205
Val Leu Thr Lys Asp Gly Met Thr Arg Gly Pro Val Val Arg Phe Pro
210 215 220
Thr Leu Lys Arg Ser Gly Ala Cys Lys Ile Trp Leu Asp Ser Glu Glu
225 230 235 240
Gly Gln Asn Ala Ile Lys Lys Ala Phe Asn Ser Thr Ser Arg Phe Ala
245 250 255
Arg Leu Gln His Ile Gln Thr Cys Leu Ala Gly Asp Leu Leu Phe Met
260 265 270
Arg Phe Arg Thr Thr Thr Gly Asp Ala Met Gly Met Asn Met Ile Ser
275 280 285
Lys Gly Val Glu Tyr Ser Leu Lys Gln Met Val Glu Glu Tyr Gly Trp
290 295 300
Glu Asp Met Glu Val Val Ser Val Ser Gly Asn Tyr Cys Thr Asp Lys
305 310 315 320
Lys Pro Ala Ala Ile Asn Trp Ile Glu Gly Arg Gly Lys Ser Val Val
325 330 335
Ala Glu Ala Thr Ile Pro Gly Asp Val Val Arg Lys Val Leu Lys Ser
340 345 350
Asp Val Ser Ala Leu Val Glu Leu Asn Ile Ala Lys Asn Leu Val Gly
355 360 365
Ser Ala Met Ala Gly Ser Val Gly Gly Phe Asn Ala His Ala Ala Asn
370 375 380
Leu Val Thr Ala Val Phe Leu Ala Leu Gly Gln Asp Pro Ala Gln Asn
385 390 395 400
Val Glu Ser Ser Asn Cys Ile Thr Leu Met Lys Glu Val Asp Gly Asp
405 410 415
Leu Arg Ile Ser Val Ser Met Pro Ser Ile Glu Val Gly Thr Ile Gly
420 425 430
Gly Gly Thr Val Leu Glu Pro Gln Gly Ala Met Leu Asp Leu Leu Gly
435 440 445
Val Arg Gly Pro His Ala Thr Ala Pro Gly Thr Asn Ala Arg Gln Leu
450 455 460
Ala Arg Ile Val Ala Cys Ala Val Leu Ala Gly Glu Leu Ser Leu Cys
465 470 475 480
Ala Ala Leu Ala Ala Gly His Leu Val Gln Ser His Met Thr His Asn
485 490 495
Arg Lys Pro Ala Glu Pro Thr Lys Pro Asn Asn Leu Asp Ala Thr Asp
500 505 510
Ile Asn Arg Leu Lys Asp Gly Ser Val Thr Cys Ile Lys Ser
515 520 525
<210> 114
<211> 1581
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(1581)
<223> 截短的3-羟基-3-甲基-戊二酰辅酶A还原酶(tHMG1)
<400> 114
atgtccgatc aattagtcaa gaccgaagtc accaagaagt ccttcaccgc cccagttcaa 60
aaagcctcca ctccagtctt aactaacaag accgttattt ctggttccaa ggttaagtct 120
ttatcctccg ctcaatcctc ctcttccggt ccatcttctt cttctgaaga agatgattcc 180
cgtgacattg agtccttgga taagaaaatc agacctttgg aagaattaga agctttgtta 240
tcctctggta atactaagca attgaaaaac aaggaagttg ctgctttggt tattcacggt 300
aaattacctt tgtacgcttt agagaagaag ttaggtgaca ctacccgtgc tgtcgccgtt 360
agaagaaaag ctttgtctat tttagctgag gcccctgttt tggcttctga cagattacca 420
tacaagaatt acgattacga tagagttttc ggtgcctgtt gtgagaacgt tatcggttat 480
atgccattac cagtcggtgt tatcggtcca ttggttattg acggtacctc ttaccacatc 540
ccaatggcta ctactgaagg ttgtttagtc gcctccgcca tgagaggttg taaggctatc 600
aatgctggtg gtggtgctac taccgtcttg actaaggatg gtatgactag aggtccagtt 660
gtccgttttc caactttgaa aagatctggt gcttgtaaga tttggttgga ttctgaagaa 720
ggtcaaaatg ccattaagaa ggctttcaat tccacctcta gatttgccag attacaacat 780
attcaaacct gtttagccgg tgatttgttg ttcatgagat tcagaactac tactggtgat 840
gctatgggta tgaacatgat ctctaagggt gtcgaatatt ctttaaaaca aatggttgaa 900
gagtatggtt gggaagacat ggaggtcgtc tctgtctctg gtaactactg tactgataag 960
aaaccagctg ctatcaactg gatcgaaggt cgtggtaagt ctgttgttgc cgaagctact 1020
attccaggtg atgttgttag aaaggtttta aaatccgatg tctctgcctt ggttgagttg 1080
aacattgcta aaaacttggt tggttctgct atggctggtt ctgtcggtgg ttttaatgcc 1140
catgccgcca acttagtcac cgccgttttc ttagctttgg gtcaagatcc agctcaaaat 1200
gtcgaatcct ccaactgtat cactttgatg aaagaggtcg acggtgactt gcgtatctct 1260
gtttccatgc catctatcga agttggtact atcggtggtg gtactgtttt ggagccacaa 1320
ggtgctatgt tggacttatt gggtgttaga ggtccacacg ccactgctcc tggtaccaac 1380
gccagacaat tagctagaat cgttgcctgt gccgtcttag ctggtgagtt gtctttatgt 1440
gctgccttag ctgctggtca cttggtccaa tcccacatga ctcataacag aaagccagct 1500
gaacctacca agcctaacaa cttggatgcc accgatatta atcgtttaaa agatggttct 1560
gtcacttgca ttaagtccta a 1581
<210> 115
<211> 461
<212> PRT
<213> Saccharomyces sp.
<400> 115
Met Thr Glu Leu Lys Lys Gln Lys Thr Ala Glu Gln Lys Thr Arg Pro
1 5 10 15
Gln Asn Val Gly Ile Lys Gly Ile Gln Ile Tyr Ile Pro Thr Gln Cys
20 25 30
Val Asn Gln Ser Glu Leu Glu Lys Phe Asp Gly Val Ser Gln Gly Lys
35 40 45
Tyr Thr Ile Gly Leu Gly Gln Thr Asn Met Ser Phe Val Asn Asp Arg
50 55 60
Glu Asp Ile Tyr Ser Met Ser Leu Thr Val Leu Ser Lys Leu Ile Lys
65 70 75 80
Ser Tyr Asn Ile Asp Thr Asn Lys Ile Gly Arg Leu Glu Val Gly Thr
85 90 95
Glu Thr Leu Ile Asp Lys Ser Lys Ser Val Lys Ser Val Leu Met Gln
100 105 110
Leu Phe Gly Glu Asn Thr Asp Val Glu Gly Ile Asp Thr Leu Asn Ala
115 120 125
Cys Tyr Gly Gly Thr Asn Ala Leu Phe Asn Ser Leu Asn Trp Ile Glu
130 135 140
Ser Asn Ala Trp Asp Gly Arg Asp Ala Ile Val Val Cys Gly Asp Ile
145 150 155 160
Ala Ile Tyr Asp Lys Gly Ala Ala Arg Pro Thr Gly Gly Ala Gly Thr
165 170 175
Val Ala Met Trp Ile Gly Pro Asp Ala Pro Ile Val Phe Asp Ser Val
180 185 190
Arg Ala Ser Tyr Met Glu His Ala Tyr Asp Phe Tyr Lys Pro Asp Phe
195 200 205
Thr Ser Glu Tyr Pro Tyr Val Asp Gly His Phe Ser Leu Thr Cys Tyr
210 215 220
Val Lys Ala Leu Asp Gln Val Tyr Lys Ser Tyr Ser Lys Lys Ala Ile
225 230 235 240
Ser Lys Gly Leu Val Ser Asp Pro Ala Gly Ser Asp Ala Leu Asn Val
245 250 255
Leu Lys Tyr Phe Asp Tyr Asn Val Phe His Val Pro Thr Cys Lys Leu
260 265 270
Val Thr Lys Ser Tyr Gly Arg Leu Leu Tyr Asn Asp Phe Arg Ala Asn
275 280 285
Pro Gln Leu Phe Pro Glu Val Asp Ala Glu Leu Ala Thr Arg Asp Tyr
290 295 300
Asp Glu Ser Leu Thr Asp Lys Asn Ile Glu Lys Thr Phe Val Asn Val
305 310 315 320
Ala Lys Pro Phe His Lys Glu Arg Val Ala Gln Ser Leu Ile Val Pro
325 330 335
Thr Asn Thr Gly Asn Met Tyr Thr Ala Ser Val Tyr Ala Ala Phe Ala
340 345 350
Ser Leu Leu Asn Tyr Val Gly Ser Asp Asp Leu Gln Gly Lys Arg Val
355 360 365
Gly Leu Phe Ser Tyr Gly Ser Gly Leu Ala Ala Ser Leu Tyr Ser Cys
370 375 380
Lys Ile Val Gly Asp Val Gln His Ile Ile Lys Glu Leu Asp Ile Thr
385 390 395 400
Asn Lys Leu Ala Lys Arg Ile Thr Glu Thr Pro Lys Asp Tyr Glu Ala
405 410 415
Ala Ile Glu Leu Arg Glu Asn Ala His Leu Lys Lys Asn Phe Lys Pro
420 425 430
Gln Gly Ser Ile Glu His Leu Gln Ser Gly Val Tyr Tyr Leu Thr Asn
435 440 445
Ile Asp Asp Lys Phe Arg Arg Ser Tyr Asp Val Lys Lys
450 455 460
<210> 116
<211> 1386
<212> DNA
<213> Saccharomyces sp.
<400> 116
atgaccgaat tgaagaagca aaagactgct gaacaaaaaa cccgtccaca aaatgttggt 60
atcaagggta ttcaaatcta cattccaact caatgcgtca accaatctga attggaaaaa 120
tttgatggtg tttctcaagg taaatacact attggtttgg gtcaaactaa tatgtccttc 180
gttaacgaca gagaagatat ttactccatg tccttgaccg tcttgtccaa attgattaag 240
tcttataata ttgacaccaa caagatcggt agattggaag ttggtactga aactttgatt 300
gataagtcta agtctgttaa gtctgtttta atgcaattgt tcggtgaaaa tactgacgtt 360
gaaggtattg acactttgaa cgcttgttac ggtggtacta atgctttatt taactctttg 420
aactggattg aatccaacgc ttgggacggt agagatgcca ttgtcgtttg tggtgacatt 480
gctatctatg acaagggtgc cgctcgtcca actggtggtg ctggtaccgt tgctatgtgg 540
atcggtcctg acgccccaat cgtttttgat tctgttcgtg cttcttacat ggagcatgct 600
tacgactttt ataagccaga ctttacctcc gaatatccat acgtcgatgg tcatttctct 660
ttgacctgct acgttaaagc cttagatcaa gtctacaagt cttactccaa gaaggccatt 720
tccaagggtt tagtctccga tccagctggt tccgatgctt taaacgtttt aaagtacttc 780
gattacaacg tttttcatgt ccctacttgt aaattggtta ccaaatctta cggtagatta 840
ttgtacaacg atttcagagc taatccacaa ttatttccag aagtcgatgc tgagttggct 900
actagagatt acgacgaatc cttgaccgac aaaaatattg aaaagacttt tgttaacgtt 960
gctaagccat ttcacaaaga gagagttgcc caatctttga ttgtcccaac taatactggt 1020
aatatgtata ctgcttctgt ttacgctgcc tttgcttctt tgttgaacta tgtcggttct 1080
gacgacttac aaggtaagcg tgtcggtttg ttctcctacg gttccggttt ggctgcctct 1140
ttgtattctt gtaagattgt cggtgatgtt caacacatca tcaaggaatt ggatatcacc 1200
aataaattgg ccaagagaat cactgaaact cctaaagact atgaagctgc tatcgaattg 1260
agagaaaatg ctcatttaaa gaaaaacttt aaaccacaag gttctattga acacttgcaa 1320
tccggtgttt actacttaac taacatcgat gacaagttcc gtagatccta cgacgtcaag 1380
aagtaa 1386
<210> 117
<211> 568
<212> PRT
<213> Zymomonas mobilis
<400> 117
Met Ser Tyr Thr Val Gly Thr Tyr Leu Ala Glu Arg Leu Val Gln Ile
1 5 10 15
Gly Leu Lys His His Phe Ala Val Ala Gly Asp Tyr Asn Leu Val Leu
20 25 30
Leu Asp Asn Leu Leu Leu Asn Lys Asn Met Glu Gln Val Tyr Cys Cys
35 40 45
Asn Glu Leu Asn Cys Gly Phe Ser Ala Glu Gly Tyr Ala Arg Ala Lys
50 55 60
Gly Ala Ala Ala Ala Val Val Thr Tyr Ser Val Gly Ala Leu Ser Ala
65 70 75 80
Phe Asp Ala Ile Gly Gly Ala Tyr Ala Glu Asn Leu Pro Val Ile Leu
85 90 95
Ile Ser Gly Ala Pro Asn Asn Asn Asp His Ala Ala Gly His Val Leu
100 105 110
His His Ala Leu Gly Lys Thr Asp Tyr His Tyr Gln Leu Glu Met Ala
115 120 125
Lys Asn Ile Thr Ala Ala Ala Glu Ala Ile Tyr Thr Pro Glu Glu Ala
130 135 140
Pro Ala Lys Ile Asp His Val Ile Lys Thr Ala Leu Arg Glu Lys Lys
145 150 155 160
Pro Val Tyr Leu Glu Ile Ala Cys Asn Ile Ala Ser Met Pro Cys Ala
165 170 175
Ala Pro Gly Pro Ala Ser Ala Leu Phe Asn Asp Glu Ala Ser Asp Glu
180 185 190
Ala Ser Leu Asn Ala Ala Val Glu Glu Thr Leu Lys Phe Ile Ala Asn
195 200 205
Arg Asp Lys Val Ala Val Leu Val Gly Ser Lys Leu Arg Ala Ala Gly
210 215 220
Ala Glu Glu Ala Ala Val Lys Phe Ala Asp Ala Leu Gly Gly Ala Val
225 230 235 240
Ala Thr Met Ala Ala Ala Lys Ser Phe Phe Pro Glu Glu Asn Pro His
245 250 255
Tyr Ile Gly Thr Ser Trp Gly Glu Val Ser Tyr Pro Gly Val Glu Lys
260 265 270
Thr Met Lys Glu Ala Asp Ala Val Ile Ala Leu Ala Pro Val Phe Asn
275 280 285
Asp Tyr Ser Thr Thr Gly Trp Thr Asp Ile Pro Asp Pro Lys Lys Leu
290 295 300
Val Leu Ala Glu Pro Arg Ser Val Val Val Asn Gly Ile Arg Phe Pro
305 310 315 320
Ser Val His Leu Lys Asp Tyr Leu Thr Arg Leu Ala Gln Lys Val Ser
325 330 335
Lys Lys Thr Gly Ala Leu Asp Phe Phe Lys Ser Leu Asn Ala Gly Glu
340 345 350
Leu Lys Lys Ala Ala Pro Ala Asp Pro Ser Ala Pro Leu Val Asn Ala
355 360 365
Glu Ile Ala Arg Gln Val Glu Ala Leu Leu Thr Pro Asn Thr Thr Val
370 375 380
Ile Ala Glu Thr Gly Asp Ser Trp Phe Asn Ala Gln Arg Met Lys Leu
385 390 395 400
Pro Asn Gly Ala Arg Val Glu Tyr Glu Met Gln Trp Gly His Ile Gly
405 410 415
Trp Ser Val Pro Ala Ala Phe Gly Tyr Ala Val Gly Ala Pro Glu Arg
420 425 430
Arg Asn Ile Leu Met Val Gly Asp Gly Ser Phe Gln Leu Thr Ala Gln
435 440 445
Glu Val Ala Gln Met Val Arg Leu Lys Leu Pro Val Ile Ile Phe Leu
450 455 460
Ile Asn Asn Tyr Gly Tyr Thr Ile Glu Val Met Ile His Asp Gly Pro
465 470 475 480
Tyr Asn Asn Ile Lys Asn Trp Asp Tyr Ala Gly Leu Met Glu Val Phe
485 490 495
Asn Gly Asn Gly Gly Tyr Asp Ser Gly Ala Gly Lys Gly Leu Lys Ala
500 505 510
Lys Thr Gly Gly Glu Leu Ala Glu Ala Ile Lys Val Ala Leu Ala Asn
515 520 525
Thr Asp Gly Pro Thr Leu Ile Glu Cys Phe Ile Gly Arg Glu Asp Cys
530 535 540
Thr Glu Glu Leu Val Lys Trp Gly Lys Arg Val Ala Ala Ala Asn Ser
545 550 555 560
Arg Lys Pro Val Asn Lys Leu Leu
565
<210> 118
<211> 1707
<212> DNA
<213> Zymomonas mobilis
<400> 118
atgtcctaca ccgttggtac ctacttagct gagcgtttgg tccaaatcgg tttgaagcac 60
catttcgccg ttgctggtga ttacaacttg gtcttgttag ataatttatt attgaacaag 120
aacatggaac aagtctactg ctgtaatgaa ttgaactgtg gtttctctgc tgaaggttat 180
gctagagcta aaggtgccgc tgccgctgtt gtcacttact ctgttggtgc tttgtctgcc 240
ttcgacgcta ttggtggtgc ttacgccgag aatttacctg ttattttaat ttctggtgcc 300
cctaacaata acgatcatgc tgctggtcat gttttacacc acgctttggg taaaactgac 360
taccattatc aattagagat ggccaaaaac atcaccgccg ctgccgaggc catttacact 420
ccagaagaag ccccagccaa aattgatcac gtcatcaaaa ccgccttgag agagaaaaaa 480
cctgtttact tggaaatcgc ctgtaatatc gcctctatgc cttgcgccgc tcctggtcct 540
gcttccgcct tattcaacga tgaggcttct gatgaagctt ccttaaacgc tgctgttgag 600
gagactttaa agttcatcgc taatagagat aaggtcgctg ttttagtcgg ttctaagttg 660
cgtgctgccg gtgccgagga agctgctgtt aaattcgccg atgctttagg tggtgctgtc 720
gccaccatgg ccgccgccaa atcctttttc cctgaagaaa acccacacta catcggtact 780
tcttggggtg aagtctctta cccaggtgtc gaaaagacta tgaaggaagc cgatgccgtc 840
atcgccttgg ccccagtttt taatgattat tccaccactg gttggactga tatcccagat 900
cctaaaaagt tagttttagc cgagcctaga tccgttgttg ttaacggtat tagattccct 960
tccgttcact tgaaggatta cttaactaga ttggctcaaa aggtttccaa gaagaccggt 1020
gctttggact ttttcaaatc tttgaacgcc ggtgagttaa agaaggccgc ccctgctgac 1080
ccatctgctc cattggttaa cgctgagatt gctagacaag tcgaagcttt attgacccca 1140
aacactaccg ttatcgccga aactggtgac tcttggttta atgctcaaag aatgaagtta 1200
ccaaatggtg ccagagttga gtacgaaatg caatggggtc atatcggttg gtctgtccca 1260
gctgcttttg gttatgctgt tggtgcccct gagagaagaa acatcttgat ggttggtgac 1320
ggttccttcc aattgactgc tcaagaagtc gctcaaatgg ttagattaaa attaccagtc 1380
atcatcttct tgatcaataa ctacggttac actatcgaag tcatgattca cgatggtcct 1440
tacaataata ttaagaactg ggactatgct ggtttgatgg aagtctttaa tggtaacggt 1500
ggttacgatt ccggtgctgg taagggttta aaggctaaga ctggtggtga attagctgaa 1560
gccattaagg ttgccttggc taacaccgac ggtcctactt taatcgaatg tttcattggt 1620
agagaggatt gtaccgaaga gttagttaag tggggtaaga gagttgccgc tgctaattcc 1680
cgtaagcctg tcaataaatt gttataa 1707
<210> 119
<211> 1575
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(1575)
<223> 截短的3-羟基-3-甲基-戊二酰辅酶A还原酶(tHMG1)
<400> 119
atgcaattgg tgaagactga agtcaccaag aagtctttta ctgctcctgt acaaaaggct 60
tctacaccag ttttaaccaa taaaacagtc atttctggat cgaaagtcaa aagtttatca 120
tctgcgcaat cgagctcatc aggaccttca tcatctagtg aggaagatga ttcccgcgat 180
attgaaagct tggataagaa aatacgtcct ttagaagaat tagaagcatt attaagtagt 240
ggaaatacaa aacaattgaa gaacaaagag gtcgctgcct tggttattca cggtaagtta 300
cctttgtacg ctttggagaa aaaattaggt gatactacga gagcggttgc ggtacgtagg 360
aaggctcttt caattttggc agaagctcct gtattagcat ctgatcgttt accatataaa 420
aattatgact acgaccgcgt atttggcgct tgttgtgaaa atgttatagg ttacatgcct 480
ttgcccgttg gtgttatagg ccccttggtt atcgatggta catcttatca tataccaatg 540
gcaactacag agggttgttt ggtagcttct gccatgcgtg gctgtaaggc aatcaatgct 600
ggcggtggtg caacaactgt tttaactaag gatggtatga caagaggccc agtagtccgt 660
ttcccaactt tgaaaagatc tggtgcctgt aagatatggt tagactcaga agagggacaa 720
aacgcaatta aaaaagcttt taactctaca tcaagatttg cacgtctgca acatattcaa 780
acttgtctag caggagattt actcttcatg agatttagaa caactactgg tgacgcaatg 840
ggtatgaata tgatttctaa gggtgtcgaa tactcattaa agcaaatggt agaagagtat 900
ggctgggaag atatggaggt tgtctccgtt tctggtaact actgtaccga caaaaaacca 960
gctgccatca actggatcga aggtcgtggt aagagtgtcg tcgcagaagc tactattcct 1020
ggtgatgttg tcagaaaagt gttaaaaagt gatgtttccg cattggttga gttgaacatt 1080
gctaagaatt tggttggatc tgcaatggct gggtctgttg gtggatttaa cgcacatgca 1140
gctaatttag tgacagctgt tttcttggca ttaggacaag atcctgcaca aaatgtcgaa 1200
agttccaact gtataacatt gatgaaagaa gtggacggtg atttgagaat ttccgtatcc 1260
atgccatcca tcgaagtagg taccatcggt ggtggtactg ttctagaacc acaaggtgcc 1320
atgttggact tattaggtgt aagaggccca catgctaccg ctcctggtac caacgcacgt 1380
caattagcaa gaatagttgc ctgtgccgtc ttggcaggtg aattatcctt atgtgctgcc 1440
ctagcagccg gccatttggt tcaaagtcat atgacccaca acaggaaacc tgctgaacca 1500
acaaaaccta acaatttgga cgccactgat ataaatcgtt tgaaagatgg gtccgtcacc 1560
tgcattaaat cctaa 1575
<210> 120
<211> 1387
<212> DNA
<213> Saccharomyces sp.
<400> 120
atgactgaac taaaaaaaca aaagaccgct gaacaaaaaa ccagacctca aaatgtcggt 60
attaaaggta tccaaattta catcccaact caatgtgtca accaatctga gctagagaaa 120
tttgatggcg tttctcaagg taaatacaca attggtctgg gccaaaccaa catgtctttt 180
gtcaatgaca gagaagatat ctactcgatg tccctaactg ttttgtctaa gttgatcaag 240
agttacaaca tcgacaccaa caaaattggt agattagaag tcggtactga aactctgatt 300
gacaagtcca agtctgtcaa gtctgtcttg atgcaattgt ttggtgaaaa cactgacgtc 360
gaaggtattg acacgcttaa tgcctgttac ggtggtacca acgcgttgtt caactctttg 420
aactggattg aatctaacgc atgggatggt agagacgcca ttgtagtttg cggtgatatt 480
gccatctacg ataagggtgc cgcaagacca accggtggtg ccggtactgt tgctatgtgg 540
atcggtcctg atgctccaat tgtatttgac tctgtaagag cttcttacat ggaacacgcc 600
tacgattttt acaagccaga tttcaccagc gaatatcctt acgtcgatgg tcatttttca 660
ttaacttgtt acgtcaaggc tcttgatcaa gtttacaaga gttattccaa gaaggctatt 720
tctaaagggt tggttagcga tcccgctggt tcggatgctt tgaacgtttt gaaatatttc 780
gactacaacg ttttccatgt tccaacctgt aaattggtca caaaatcata cggtagatta 840
ctatataacg atttcagagc caatcctcaa ttgttcccag aagttgacgc cgaattagct 900
actcgcgatt atgacgaatc tttaaccgat aagaacattg aaaaaacttt tgttaatgtt 960
gctaagccat tccacaaaga gagagttgcc caatctttga ttgttccaac aaacacaggt 1020
aacatgtaca ccgcatctgt ttatgccgcc tttgcatctc tattaaacta tgttggatct 1080
gacgacttac aaggcaagcg tgttggttta ttttcttacg gttccggttt agctgcatct 1140
ctatattctt gcaaaattgt tggtgacgtc caacatatta tcaaggaatt agatattact 1200
aacaaattag ccaagagaat caccgaaact ccaaaggatt acgaagctgc catcgaattg 1260
agagaaaatg cccatttgaa gaagaacttc aaacctcaag gttccattga gcatttgcaa 1320
agtggtgttt actacttgac caacatcgat gacaaattta gaagatctta cgatgttaaa 1380
aaataat 1387
<210> 121
<211> 420
<212> PRT
<213> Catharanthus sp.
<400> 121
Met Leu Phe Ser Arg Gly Leu Tyr Arg Ile Ala Arg Thr Ser Leu Asn
1 5 10 15
Arg Ser Arg Leu Leu Tyr Pro Leu Gln Ser Gln Ser Pro Glu Leu Leu
20 25 30
Gln Ser Phe Gln Phe Arg Ser Pro Ile Gly Ser Ser Gln Lys Val Ser
35 40 45
Gly Phe Arg Val Ile Tyr Ser Cys Val Ser Ser Ala Leu Ala Asn Val
50 55 60
Gly Gln Gln Val Gln Arg Gln Ser Asn Ser Val Ala Glu Glu Pro Leu
65 70 75 80
Asp Pro Phe Ser Leu Val Ala Asp Glu Leu Ser Ile Leu Ala Asn Arg
85 90 95
Leu Arg Ser Met Val Val Ala Glu Val Pro Lys Leu Ala Ser Ala Ala
100 105 110
Glu Tyr Phe Phe Lys Leu Gly Val Glu Gly Lys Arg Phe Arg Pro Thr
115 120 125
Val Leu Leu Leu Met Ala Thr Ala Ile Asp Ala Pro Ile Ser Arg Thr
130 135 140
Pro Pro Asp Thr Ser Leu Asp Thr Leu Ser Thr Glu Leu Arg Leu Arg
145 150 155 160
Gln Gln Ser Ile Ala Glu Ile Thr Glu Met Ile His Val Ala Ser Leu
165 170 175
Leu His Asp Asp Val Leu Asp Asp Ala Glu Thr Arg Arg Gly Ile Gly
180 185 190
Ser Leu Asn Phe Val Met Gly Asn Lys Leu Ala Val Leu Ala Gly Asp
195 200 205
Phe Leu Leu Ser Arg Ala Cys Val Ala Leu Ala Ser Leu Lys Asn Thr
210 215 220
Glu Val Val Ser Leu Leu Ala Thr Val Val Glu His Leu Val Thr Gly
225 230 235 240
Glu Thr Met Gln Met Thr Thr Thr Ser Asp Gln Arg Cys Ser Met Glu
245 250 255
Tyr Tyr Met Gln Lys Thr Tyr Tyr Lys Thr Ala Ser Leu Ile Ser Asn
260 265 270
Ser Cys Lys Ala Ile Ala Leu Leu Ala Gly Gln Thr Ser Glu Val Ala
275 280 285
Met Leu Ala Tyr Glu Tyr Gly Lys Asn Leu Gly Leu Ala Phe Gln Leu
290 295 300
Ile Asp Asp Val Leu Asp Phe Thr Gly Thr Ser Ala Ser Leu Gly Lys
305 310 315 320
Gly Ser Leu Ser Asp Ile Arg His Gly Ile Val Thr Ala Pro Ile Leu
325 330 335
Phe Ala Ile Glu Glu Phe Pro Glu Leu Arg Ala Val Val Asp Glu Gly
340 345 350
Phe Glu Asn Pro Tyr Asn Val Asp Leu Ala Leu His Tyr Leu Gly Lys
355 360 365
Ser Arg Gly Ile Gln Arg Thr Arg Glu Leu Ala Ile Lys His Ala Asn
370 375 380
Leu Ala Ser Asp Ala Ile Asp Ser Leu Pro Val Thr Asp Asp Glu His
385 390 395 400
Val Leu Arg Ser Arg Arg Ala Leu Val Glu Leu Thr Gln Arg Val Ile
405 410 415
Thr Arg Arg Lys
420
<210> 122
<211> 1263
<212> DNA
<213> Catharanthus sp.
<400> 122
atgttattct ctcgtggttt atacagaatc gccagaactt ctttgaacag atcccgtttg 60
ttgtaccctt tacaatctca atctcctgaa ttgttacaat ccttccaatt cagatctcca 120
atcggttcct ctcaaaaggt ttccggtttc agagttatct actcctgcgt ttcctctgct 180
ttagctaacg ttggtcaaca agtccaaaga caatctaatt ccgttgctga agaacctttg 240
gacccattct ccttggttgc cgatgaatta tccattttag ctaacagatt gcgttctatg 300
gtcgtcgctg aagttccaaa gttagcctcc gccgccgaat atttcttcaa gttgggtgtc 360
gagggtaaaa gattcagacc aactgttttg ttgttaatgg ccaccgccat tgatgcccca 420
atctctagaa ccccacctga cacctcctta gatactttat ccaccgaatt gcgtttgaga 480
caacaatcta tcgccgaaat tactgaaatg attcatgtcg cttccttgtt gcacgatgat 540
gttttggatg atgctgaaac tagaagaggt attggttctt taaattttgt catgggtaac 600
aaattggctg ttttggccgg tgacttctta ttatctagag cttgtgttgc cttagcttct 660
ttgaaaaaca ctgaagtcgt ctccttgtta gccactgtcg ttgaacactt agttactggt 720
gagactatgc aaatgactac cacctccgat caaagatgtt ctatggaata ctacatgcaa 780
aagacctatt acaagactgc ctctttgatt tctaactcct gtaaagccat tgccttgtta 840
gctggtcaaa cttctgaagt tgccatgttg gcttacgaat acggtaaaaa cttgggtttg 900
gctttccaat tgattgatga tgttttggat ttcactggta cttctgcttc cttaggtaaa 960
ggttctttgt ctgatattcg tcacggtatc gttaccgccc caatcttgtt cgctattgaa 1020
gaattcccag agttaagagc tgttgttgac gaaggtttcg aaaaccctta caatgttgac 1080
ttagccttgc actacttggg taaatctaga ggtattcaac gtaccagaga attagccatt 1140
aaacatgcta acttagcctc tgacgccatt gactctttac cagtcactga tgatgagcac 1200
gtcttacgtt ccagacgtgc cttagttgaa ttgactcaaa gagttattac tagaagaaag 1260
taa 1263
<210> 123
<211> 421
<212> PRT
<213> Mangifera indica
<400> 123
Met Leu Phe Ser Tyr Gly Leu Ser Arg Ile Ser Ile Asn Pro Arg Ala
1 5 10 15
Ser Leu Leu Thr Cys Arg Trp Leu Leu Ser His Leu Thr Gly Ser Leu
20 25 30
Ser Pro Ser Thr Ser Ser His Thr Ile Ser Asp Ser Val His Lys Val
35 40 45
Trp Gly Cys Arg Glu Ala Tyr Thr Trp Ser Val Pro Ala Leu His Gly
50 55 60
Phe Arg His Gln Ile His His Gln Ser Ser Ser Leu Ile Glu Asp Gln
65 70 75 80
Leu Asp Pro Phe Ser Leu Val Ala Asp Glu Leu Ser Leu Val Ala Asn
85 90 95
Arg Leu Arg Ser Met Val Val Thr Glu Val Pro Lys Leu Ala Ser Ala
100 105 110
Ala Glu Tyr Phe Phe Lys Met Gly Val Glu Gly Lys Arg Phe Arg Pro
115 120 125
Ala Val Leu Leu Leu Met Ala Thr Ala Leu Asn Val His Val Leu Glu
130 135 140
Pro Leu Pro Glu Gly Ala Gly Asp Ala Leu Met Thr Glu Leu Arg Thr
145 150 155 160
Arg Gln Gln Cys Ile Ala Glu Ile Thr Glu Met Ile His Val Ala Ser
165 170 175
Leu Leu His Asp Asp Val Leu Asp Asp Ala Asp Thr Arg Arg Gly Ile
180 185 190
Gly Ser Leu Asn Leu Val Met Gly Asn Lys Leu Ala Val Leu Ala Gly
195 200 205
Asp Phe Leu Leu Ser Arg Ala Cys Val Ala Leu Ala Ser Leu Lys Asn
210 215 220
Thr Glu Val Val Ser Leu Leu Ala Thr Val Val Glu His Leu Val Thr
225 230 235 240
Gly Glu Thr Met Gln Met Thr Thr Ser Ser Asp Gln Arg Cys Ser Met
245 250 255
Glu Tyr Tyr Met Gln Lys Thr Tyr Tyr Lys Thr Ala Ser Leu Ile Ser
260 265 270
Asn Ser Cys Lys Ala Ile Ala Leu Leu Ala Gly Gln Ser Ala Glu Val
275 280 285
Ala Met Leu Ala Phe Glu Phe Gly Lys Asn Leu Gly Leu Ala Tyr Gln
290 295 300
Leu Ile Asp Asp Val Leu Asp Phe Thr Gly Thr Ser Ala Ser Leu Gly
305 310 315 320
Lys Gly Ser Leu Ser Asp Ile Arg His Gly Ile Val Thr Ala Pro Ile
325 330 335
Leu Phe Ala Met Glu Glu Phe Pro Gln Leu Arg Ala Val Ile Asp Gln
340 345 350
Gly Phe Glu Asn Pro Ser Asn Val Asp Val Ala Leu Glu Tyr Leu Gly
355 360 365
Lys Ser Arg Gly Ile Gln Arg Thr Arg Glu Leu Ala Thr Asn His Ala
370 375 380
Asn Leu Ala Ala Ala Ala Ile Asp Ala Leu Pro Lys Thr Asp Asn Glu
385 390 395 400
Glu Val Arg Lys Ser Arg Arg Ala Leu Leu Asp Leu Thr Gln Arg Val
405 410 415
Ile Thr Arg Asn Lys
420
<210> 124
<211> 1266
<212> DNA
<213> Mangifera indica
<400> 124
atgttattct cttatggttt atctcgtatt tctattaacc ctcgtgcctc tttattgact 60
tgtagatggt tattatccca tttgactggt tctttatctc cttccacttc ttcccatact 120
atttctgact ccgtccataa agtctggggt tgcagagaag cctatacttg gtctgtccca 180
gctttacatg gttttagaca tcaaatccac catcaatcct cttccttgat tgaagatcaa 240
ttagacccat tctccttggt cgccgatgag ttgtccttgg ttgctaaccg tttaagatct 300
atggttgtca ctgaagtccc taaattagcc tctgccgccg aatacttttt caagatgggt 360
gtcgaaggta agcgtttcag accagctgtc ttgttgttaa tggccactgc cttaaacgtt 420
catgttttgg aacctttgcc tgaaggtgct ggtgacgctt taatgaccga gttgagaacc 480
cgtcaacaat gcattgctga aatcactgag atgatccacg tcgcctcttt attgcatgac 540
gatgttttag acgacgctga tactagaaga ggtattggtt ctttgaactt ggttatgggt 600
aacaaattgg ccgttttggc cggtgatttc ttgttatccc gtgcttgcgt tgctttagct 660
tctttgaaga acactgaagt tgtttctttg ttggccaccg tcgttgaaca cttagttact 720
ggtgagacta tgcaaatgac cacctcttct gaccaaagat gttccatgga atattacatg 780
caaaaaactt attacaaaac cgcctccttg atttctaact cctgtaaagc catcgcctta 840
ttagctggtc aatctgctga agttgccatg ttagccttcg agtttggtaa gaacttgggt 900
ttagcttacc aattgatcga tgatgtcttg gattttaccg gtacctctgc ttctttgggt 960
aagggttcct tgtccgacat tagacacggt attgttaccg ccccaatctt attcgctatg 1020
gaagagtttc cacaattgag agctgttatc gaccaaggtt tcgagaaccc atctaacgtt 1080
gacgtcgcct tagagtattt aggtaaatct agaggtatcc aacgtacccg tgaattagct 1140
actaaccatg ctaacttagc cgccgccgcc atcgatgcct tgcctaaaac cgataatgaa 1200
gaagtccgta agtccagacg tgctttatta gatttgactc aaagagtcat caccagaaac 1260
aaatag 1266
<210> 125
<211> 328
<212> PRT
<213> Mangifera indica
<400> 125
Met Pro Phe Val Val Pro Arg Arg Asn Arg Ser Leu Ser Val Ser Ala
1 5 10 15
Val Leu Thr Lys Glu Glu Thr Leu Arg Glu Glu Glu Glu Asp Pro Lys
20 25 30
Pro Val Phe Asp Phe Lys Ser Tyr Met Leu Gln Lys Gly Asn Ser Val
35 40 45
Asn Gln Ala Leu Asp Ala Val Val Ser Ile Arg Glu Pro Lys Lys Ile
50 55 60
His Glu Ala Met Arg Tyr Ser Leu Leu Ala Gly Gly Lys Arg Val Arg
65 70 75 80
Pro Val Leu Cys Ile Ala Ala Cys Glu Leu Val Gly Gly Asn Glu Ser
85 90 95
Met Ala Met Pro Ala Ala Cys Ala Val Glu Met Ile His Thr Met Ser
100 105 110
Leu Ile His Asp Asp Leu Pro Cys Met Asp Asn Asp Asp Leu Arg Arg
115 120 125
Gly Lys Pro Thr Asn His Lys Val Phe Gly Glu Asp Val Ala Val Leu
130 135 140
Ala Gly Asp Ala Leu Leu Ala Phe Ser Phe Glu Asn Met Ala Val Ser
145 150 155 160
Thr Val Gly Val Leu Pro Ser Arg Val Val Lys Ala Val Gly Glu Leu
165 170 175
Ala Lys Ser Ile Gly Ile Glu Gly Leu Val Ala Gly Gln Val Val Asp
180 185 190
Ile Asn Ser Glu Gly Leu Lys Glu Val Gly Leu Asp His Leu Glu Phe
195 200 205
Ile His Gln His Lys Thr Ala Ala Leu Leu Glu Gly Ser Val Val Leu
210 215 220
Gly Ala Ile Leu Gly Gly Gly Ser Asp Asp Glu Val Glu Lys Leu Arg
225 230 235 240
Thr Phe Ala Arg Cys Ile Gly Leu Leu Phe Gln Val Val Asp Asp Ile
245 250 255
Leu Asp Val Thr Lys Ser Ser Arg Glu Leu Gly Lys Thr Ala Gly Lys
260 265 270
Asp Leu Val Ala Asp Lys Val Thr Tyr Pro Lys Leu Leu Gly Ile Glu
275 280 285
Lys Ser Arg Glu Leu Ala Asp Lys Leu Asn Lys Asp Ala Gln Gln Gln
290 295 300
Leu Ser Gly Phe Asp Gln Glu Lys Ala Ala Pro Leu Ile Ala Leu Ser
305 310 315 320
Asn Tyr Ile Ala Tyr Arg Gln Asn
325
<210> 126
<211> 987
<212> DNA
<213> Mangifera indica
<400> 126
atgccattcg ttgttcctag aagaaaccgt tctttgtccg tttccgccgt tttgaccaag 60
gaagaaactt taagagagga agaagaagat ccaaagccag ttttcgactt caaatcttac 120
atgttacaaa agggtaattc tgttaatcaa gctttggatg ctgtcgtttc cattagagaa 180
cctaagaaaa tccatgaggc tatgcgttac tctttgttgg ctggtggtaa gagagttcgt 240
cctgttttgt gtattgccgc ctgtgaattg gtcggtggta acgaatctat ggctatgcca 300
gccgcctgtg ctgtcgaaat gatccacact atgtccttga ttcacgatga tttgccatgt 360
atggataatg acgatttgcg tcgtggtaaa cctaccaacc ataaagtttt cggtgaagac 420
gtcgccgttt tggctggtga cgctttatta gctttttcct tcgagaacat ggccgtttcc 480
actgttggtg tcttaccatc cagagttgtc aaggctgttg gtgaattggc caagtctatc 540
ggtattgaag gtttggttgc cggtcaagtc gtcgatatta attctgaggg tttaaaagag 600
gtcggtttag atcacttaga atttatccat caacacaaaa ccgctgcttt gttggagggt 660
tctgttgttt tgggtgctat tttaggtggt ggttctgatg atgaagtcga aaagttgcgt 720
acctttgcta gatgtatcgg tttgttgttt caagttgttg acgatatttt ggatgtcact 780
aagtcttcca gagaattggg taagactgcc ggtaaagatt tggttgctga taaagttact 840
tatccaaagt tgttaggtat tgaaaagtct cgtgaattgg ccgataagtt aaacaaggat 900
gctcaacaac aattatccgg ttttgatcaa gagaaggctg cccctttaat cgctttgtcc 960
aattacatcg cctacagaca aaactag 987
<210> 127
<211> 321
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(321)
<223> 截短的香叶基香叶基焦磷酸合成酶Cs2_GPPS_NTrunc
<400> 127
Met Val Ile Ala Glu Val Pro Lys Leu Ala Ser Ala Ala Glu Tyr Phe
1 5 10 15
Phe Lys Met Gly Val Glu Gly Lys Arg Phe Arg Pro Thr Val Leu Leu
20 25 30
Leu Met Ala Thr Ala Leu Asn Val Arg Val Pro Glu Pro Leu His Asp
35 40 45
Gly Val Glu Asp Ala Ser Ala Thr Glu Leu Arg Thr Arg Gln Gln Cys
50 55 60
Ile Ala Glu Ile Thr Glu Met Ile His Val Ala Ser Leu Leu His Asp
65 70 75 80
Asp Val Leu Asp Asp Ala Asp Thr Arg Arg Gly Ile Gly Ser Leu Asn
85 90 95
Phe Val Met Gly Asn Lys Leu Ala Val Leu Ala Gly Asp Phe Leu Leu
100 105 110
Ser Arg Ala Cys Val Ala Leu Ala Ser Leu Lys Asn Thr Glu Val Val
115 120 125
Thr Leu Leu Ala Thr Val Val Glu His Leu Val Thr Gly Glu Thr Met
130 135 140
Gln Met Thr Thr Ser Ser Asp Gln Arg Cys Ser Met Asp Tyr Tyr Met
145 150 155 160
Gln Lys Thr Tyr Tyr Lys Thr Ala Ser Leu Ile Ser Asn Ser Cys Lys
165 170 175
Ala Ile Ala Leu Leu Ala Gly Gln Thr Ala Glu Val Ala Ile Leu Ala
180 185 190
Phe Asp Tyr Gly Lys Asn Leu Gly Leu Ala Tyr Gln Leu Ile Asp Asp
195 200 205
Val Leu Asp Phe Thr Gly Thr Ser Ala Ser Leu Gly Lys Gly Ser Leu
210 215 220
Ser Asp Ile Arg His Gly Ile Ile Thr Ala Pro Ile Leu Phe Ala Met
225 230 235 240
Glu Glu Phe Pro Gln Leu Arg Thr Val Val Glu Gln Gly Phe Glu Asp
245 250 255
Ser Ser Asn Val Asp Ile Ala Leu Glu Tyr Leu Gly Lys Ser Arg Gly
260 265 270
Ile Gln Lys Thr Arg Glu Leu Ala Val Lys His Ala Asn Leu Ala Ala
275 280 285
Ala Ala Ile Asp Ser Leu Pro Glu Asn Asn Asp Glu Asp Val Thr Lys
290 295 300
Ser Arg Arg Ala Leu Leu Asp Leu Thr His Arg Val Ile Thr Arg Asn
305 310 315 320
Lys
<210> 128
<211> 966
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(966)
<223> 截短的香叶基香叶基焦磷酸合成酶Cs2_GPPS_NTrunc
<400> 128
atggtcattg ctgaagttcc taaattagcc tctgccgccg aatacttctt caagatgggt 60
gtcgagggta agagatttcg tcctaccgtt ttgttgttaa tggccaccgc cttaaacgtc 120
agagtccctg aaccattaca tgatggtgtt gaagatgcct ctgccaccga gttgagaact 180
agacaacaat gtattgctga aatcaccgag atgattcacg ttgcctcttt gttgcacgat 240
gatgttttgg atgatgctga tacccgtcgt ggtatcggtt ctttgaactt tgtcatgggt 300
aacaagttgg ctgtcttggc tggtgatttc ttattgtctc gtgcctgcgt tgccttagcc 360
tctttaaaaa ataccgaagt tgttacttta ttggccactg ttgttgagca cttggttact 420
ggtgaaacta tgcaaatgac cacctcttcc gaccaacgtt gttccatgga ctattacatg 480
caaaagacct actacaagac cgcttctttg atttccaatt cttgtaaagc cattgcctta 540
ttagctggtc aaactgctga agttgccatc ttggccttcg actacggtaa aaacttgggt 600
ttagcttacc aattgattga tgacgtttta gattttactg gtacttctgc ttctttgggt 660
aaaggttctt tatccgatat tcgtcatggt atcattaccg ctccaatctt attcgctatg 720
gaagaatttc ctcaattgcg tactgtcgtt gaacaaggtt tcgaagactc ctccaacgtt 780
gacattgcct tagaatactt gggtaagtct cgtggtattc aaaagacccg tgaattagcc 840
gttaaacatg ccaacttagc cgccgccgcc atcgattcct tgcctgaaaa caacgatgag 900
gatgtcacca agtcccgtcg tgctttgtta gatttaactc acagagttat tacccgtaac 960
aagtaa 966
<210> 129
<211> 416
<212> PRT
<213> Quercus sp.
<400> 129
Met Leu Phe Ser Arg Ile Ser Arg Ile Arg Arg Pro Gly Ser Asn Gly
1 5 10 15
Phe Arg Trp Phe Leu Ser His Lys Thr His Leu Gln Phe Leu Asn Pro
20 25 30
Pro Ala Tyr Ser Tyr Ser Ser Thr His Lys Val Leu Gly Cys Arg Glu
35 40 45
Ile Phe Ser Trp Gly Leu Pro Ala Leu His Gly Phe Arg His Asn Ile
50 55 60
His His Gln Ser Ser Ser Ile Val Glu Glu Gln Asn Asp Pro Phe Ser
65 70 75 80
Leu Val Ala Asp Glu Leu Ser Met Val Ala Asn Arg Leu Arg Ser Met
85 90 95
Val Val Thr Glu Val Pro Lys Leu Ala Ser Ala Ala Glu Tyr Phe Phe
100 105 110
Lys Met Gly Val Glu Gly Lys Arg Phe Arg Pro Thr Val Leu Leu Leu
115 120 125
Met Ala Thr Ala Met Asn Ile Ser Ile Leu Glu Pro Ser Leu Arg Gly
130 135 140
Pro Gly Asp Ala Leu Thr Thr Glu Leu Arg Ala Arg Gln Gln Arg Ile
145 150 155 160
Ala Glu Ile Thr Glu Met Ile His Val Ala Ser Leu Leu His Asp Asp
165 170 175
Val Leu Asp Asp Ala Asp Thr Arg Arg Gly Ile Gly Ser Leu Asn Phe
180 185 190
Val Met Gly Asn Lys Leu Ala Val Leu Ala Gly Asp Phe Leu Leu Ser
195 200 205
Arg Ala Cys Val Ala Leu Ala Ser Leu Lys Asn Thr Glu Val Val Ser
210 215 220
Leu Leu Ala Lys Val Val Glu His Leu Val Thr Gly Glu Thr Met Gln
225 230 235 240
Met Thr Thr Thr Cys Glu Gln Arg Cys Ser Met Glu Tyr Tyr Met Gln
245 250 255
Lys Thr Tyr Tyr Lys Thr Ala Ser Leu Ile Ser Asn Ser Cys Lys Ala
260 265 270
Ile Ala Leu Leu Gly Gly Gln Thr Ser Glu Val Ala Met Leu Ala Tyr
275 280 285
Glu Tyr Gly Lys Asn Leu Gly Leu Ala Tyr Gln Leu Ile Asp Asp Val
290 295 300
Leu Asp Phe Thr Gly Thr Ser Ala Ser Leu Gly Lys Gly Ser Leu Ser
305 310 315 320
Asp Ile Arg His Gly Ile Ile Thr Ala Pro Ile Leu Phe Ala Met Glu
325 330 335
Glu Phe Pro Gln Leu Arg Glu Val Val Asp Arg Gly Phe Asp Asp Pro
340 345 350
Ala Asn Val Asp Val Ala Leu Asp Tyr Leu Gly Lys Ser Arg Gly Ile
355 360 365
Gln Arg Ala Arg Glu Leu Ala Lys Lys His Ala Asn Ile Ala Ala Glu
370 375 380
Ala Ile Asp Ser Leu Pro Glu Ser Asn Asp Glu Asp Val Arg Lys Ser
385 390 395 400
Arg Arg Ala Leu Leu Asp Leu Thr Glu Arg Val Ile Thr Arg Thr Lys
405 410 415
<210> 130
<211> 1251
<212> DNA
<213> Quercus sp.
<400> 130
atgttgttct ctcgtatttc tcgtatccgt agaccaggtt ctaatggttt cagatggttc 60
ttgtcccata agactcattt acaattcttg aaccctccag cttattccta ctcttccact 120
cataaggtct tgggttgtag agaaattttt tcctggggtt tacctgcctt acatggtttc 180
agacacaaca ttcaccacca atcttcctct attgttgaag aacaaaatga ccctttctct 240
ttggtcgctg atgagttgtc catggttgct aacagattgc gttctatggt tgttactgaa 300
gttcctaaat tagcctccgc cgctgaatac ttttttaaaa tgggtgttga aggtaagaga 360
ttcagaccaa ctgttttatt gttgatggct accgccatga acatttccat cttagaacca 420
tctttgagag gtccaggtga cgctttgacc actgaattga gagccagaca acaaagaatt 480
gctgaaatta ccgagatgat ccacgttgct tccttgttgc acgatgacgt tttggatgac 540
gctgatacta gaagaggtat tggttcctta aactttgtca tgggtaataa attagctgtt 600
ttggctggtg attttttgtt atctcgtgcc tgtgttgctt tagcttcttt gaagaacacc 660
gaagttgtct ccttgttagc caaggtcgtc gaacacttgg ttactggtga aactatgcaa 720
atgaccacta cttgtgaaca aagatgttcc atggaatact acatgcaaaa gacttactat 780
aagaccgctt ctttaatttc caactcctgt aaagccattg ctttattagg tggtcaaact 840
tctgaggtcg ctatgttagc ctacgaatat ggtaaaaact tgggtttagc ttaccaattg 900
attgatgatg tcttggattt cactggtact tctgcttcct tgggtaaggg ttccttgtct 960
gatattagac atggtatcat tactgctcca attttgtttg ctatggaaga attcccacaa 1020
ttacgtgaag ttgtcgatag aggtttcgac gatcctgcca acgtcgatgt tgccttggac 1080
tacttgggta agtctagagg tatccaaaga gccagagagt tagctaaaaa acacgctaac 1140
attgctgccg aagccatcga ctctttgcca gaatccaacg acgaggacgt cagaaagtcc 1200
cgtcgtgctt tgttggactt gaccgaaaga gtcattactc gtactaagta a 1251
<210> 131
<211> 427
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(427)
<223> 截短的香叶基香叶基焦磷酸合成酶 Pa_GPPS_Ntrunc
<400> 131
Met Tyr Thr Arg Cys Ile Leu Arg Asp Lys Tyr Ser Arg Phe Asn Leu
1 5 10 15
Arg Arg Lys Phe Phe Thr Ser Ala Lys Ser Ile Asn Ala Leu Asn Gly
20 25 30
Leu Pro Asp Ser Gly Asn Pro Arg Gly Glu Ser Asn Gly Ile Ser Gln
35 40 45
Phe Glu Ile Gln Gln Val Phe Arg Cys Lys Glu Tyr Ile Trp Ile Asp
50 55 60
Arg His Lys Phe His Asp Val Gly Phe Gln Ala His His Lys Gly Ser
65 70 75 80
Ile Thr Asp Glu Glu Gln Val Asp Pro Phe Ser Leu Val Ala Asp Glu
85 90 95
Leu Ser Ile Leu Ala Asn Arg Leu Arg Ser Met Ile Leu Thr Glu Ile
100 105 110
Pro Lys Leu Gly Thr Ala Ala Glu Tyr Phe Phe Lys Leu Gly Val Glu
115 120 125
Gly Lys Arg Phe Arg Pro Met Val Leu Leu Leu Met Ala Ser Ser Leu
130 135 140
Thr Ile Gly Ile Pro Glu Val Ala Ala Asp Cys Leu Arg Lys Gly Leu
145 150 155 160
Asp Glu Glu Gln Arg Leu Arg Gln Gln Arg Ile Ala Glu Ile Thr Glu
165 170 175
Met Ile His Val Ala Ser Leu Leu His Asp Asp Val Leu Asp Asp Ala
180 185 190
Asp Thr Arg Arg Gly Val Gly Ser Leu Asn Phe Val Met Gly Asn Lys
195 200 205
Leu Ala Val Leu Ala Gly Asp Phe Leu Leu Ser Arg Ala Ser Val Ala
210 215 220
Leu Ala Ser Leu Lys Asn Thr Glu Val Val Glu Leu Leu Ser Lys Val
225 230 235 240
Leu Glu His Leu Val Thr Gly Glu Ile Met Gln Met Thr Asn Thr Asn
245 250 255
Glu Gln Arg Cys Ser Met Glu Tyr Tyr Met Gln Lys Thr Phe Tyr Lys
260 265 270
Thr Ala Ser Leu Met Ala Asn Ser Cys Lys Ala Ile Ala Leu Ile Ala
275 280 285
Gly Gln Pro Ala Glu Val Cys Met Leu Ala Tyr Asp Tyr Gly Arg Asn
290 295 300
Leu Gly Leu Ala Tyr Gln Leu Leu Asp Asp Val Leu Asp Phe Thr Gly
305 310 315 320
Thr Thr Ala Ser Leu Gly Lys Gly Ser Leu Ser Asp Ile Arg Gln Gly
325 330 335
Ile Val Thr Ala Pro Ile Leu Phe Ala Leu Glu Glu Phe Pro Gln Leu
340 345 350
His Asp Val Ile Asn Arg Lys Phe Lys Lys Pro Gly Asp Ile Asp Leu
355 360 365
Ala Leu Glu Phe Leu Gly Lys Ser Asp Gly Ile Arg Lys Ala Lys Gln
370 375 380
Leu Ala Ala Gln His Ala Gly Leu Ala Ala Phe Ser Val Glu Ser Phe
385 390 395 400
Pro Pro Ser Glu Ser Glu Tyr Val Lys Leu Cys Arg Lys Ala Leu Ile
405 410 415
Asp Leu Ser Glu Lys Val Ile Thr Arg Thr Arg
420 425
<210> 132
<211> 1284
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(1284)
<223> 截短的香叶基香叶基焦磷酸合成酶Pa_GPPS_N_trunc
<400> 132
atgtataccc gttgcatttt aagagacaag tattctcgtt tcaacttgag acgtaaattc 60
ttcacttccg ctaaatccat caatgccttg aatggtttac ctgactctgg taaccctaga 120
ggtgaatcta acggtatctc ccaattcgaa attcaacaag ttttccgttg taaagaatac 180
atttggatcg atcgtcacaa gttccacgat gttggttttc aagctcatca caagggttcc 240
atcactgacg aggaacaagt tgaccctttt tctttagtcg ctgatgaatt gtccatctta 300
gctaatcgtt taagatccat gatcttaacc gagattccaa agttaggtac cgctgccgaa 360
tactttttca agttgggtgt cgaaggtaag agatttagac caatggtttt gttgttgatg 420
gcctcctctt taactattgg tatccctgaa gttgccgctg attgtttgcg taagggtttg 480
gacgaagaac aaagattacg tcaacaacgt atcgctgaaa ttactgaaat gattcatgtc 540
gcctctttgt tgcacgatga tgttttggat gacgccgata ctagacgtgg tgttggttcc 600
ttgaactttg ttatgggtaa caagttggct gttttagccg gtgatttctt gttatctaga 660
gcttctgttg ccttagcttc tttaaagaac actgaggttg ttgagttatt gtctaaggtt 720
ttggagcact tagtcactgg tgagatcatg caaatgacta acactaatga acaaagatgt 780
tctatggaat attacatgca aaagactttc tacaagaccg cctctttgat ggctaattct 840
tgtaaagcca ttgccttgat cgctggtcaa cctgccgaag tctgcatgtt ggcctacgac 900
tacggtagaa acttgggttt agcttatcaa ttattggatg acgttttgga tttcactggt 960
accactgctt ctttaggtaa gggttcctta tccgacatca gacaaggtat tgttactgcc 1020
cctattttat tcgctttgga agaattccct caattacacg acgtcatcaa ccgtaagttc 1080
aaaaaaccag gtgacatcga tttggccttg gaatttttgg gtaagtctga tggtatccgt 1140
aaagccaaac aattggctgc tcaacatgct ggtttagctg ccttttctgt cgaatccttt 1200
ccaccatctg aatccgaata cgttaagtta tgtagaaagg ccttgatcga tttgtctgaa 1260
aaggtcatta ctcgtaccag ataa 1284
<210> 133
<211> 381
<212> PRT
<213> Abies grandis
<400> 133
Met Ala Tyr Ser Ala Met Ala Thr Met Gly Tyr Asn Gly Met Ala Ala
1 5 10 15
Ser Cys His Thr Leu His Pro Thr Ser Pro Leu Lys Pro Phe His Gly
20 25 30
Ala Ser Thr Ser Leu Glu Ala Phe Asn Gly Glu His Met Gly Leu Leu
35 40 45
Arg Gly Tyr Ser Lys Arg Lys Leu Ser Ser Tyr Lys Asn Pro Ala Ser
50 55 60
Arg Ser Ser Asn Ala Thr Val Ala Gln Leu Leu Asn Pro Pro Gln Lys
65 70 75 80
Gly Lys Lys Ala Val Glu Phe Asp Phe Asn Lys Tyr Met Asp Ser Lys
85 90 95
Ala Met Thr Val Asn Glu Ala Leu Asn Lys Ala Ile Pro Leu Arg Tyr
100 105 110
Pro Gln Lys Ile Tyr Glu Ser Met Arg Tyr Ser Leu Leu Ala Gly Gly
115 120 125
Lys Arg Val Arg Pro Val Leu Cys Ile Ala Ala Cys Glu Leu Val Gly
130 135 140
Gly Thr Glu Glu Leu Ala Ile Pro Thr Ala Cys Ala Ile Glu Met Ile
145 150 155 160
His Thr Met Ser Leu Met His Asp Asp Leu Pro Cys Ile Asp Asn Asp
165 170 175
Asp Leu Arg Arg Gly Lys Pro Thr Asn His Lys Ile Phe Gly Glu Asp
180 185 190
Thr Ala Val Thr Ala Gly Asn Ala Leu His Ser Tyr Ala Phe Glu His
195 200 205
Ile Ala Val Ser Thr Ser Lys Thr Val Gly Ala Asp Arg Ile Leu Arg
210 215 220
Met Val Ser Glu Leu Gly Arg Ala Thr Gly Ser Glu Gly Val Met Gly
225 230 235 240
Gly Gln Met Val Asp Ile Ala Ser Glu Gly Asp Pro Ser Ile Asp Leu
245 250 255
Gln Thr Leu Glu Trp Ile His Ile His Lys Thr Ala Met Leu Leu Glu
260 265 270
Cys Ser Val Val Cys Gly Ala Ile Ile Gly Gly Ala Ser Glu Ile Val
275 280 285
Ile Glu Arg Ala Arg Arg Tyr Ala Arg Cys Val Gly Leu Leu Phe Gln
290 295 300
Val Val Asp Asp Ile Leu Asp Val Thr Lys Ser Ser Asp Glu Leu Gly
305 310 315 320
Lys Thr Ala Gly Lys Asp Leu Ile Ser Asp Lys Ala Thr Tyr Pro Lys
325 330 335
Leu Met Gly Leu Glu Lys Ala Lys Glu Phe Ser Asp Glu Leu Leu Asn
340 345 350
Arg Ala Lys Gly Glu Leu Ser Cys Phe Asp Pro Val Lys Ala Ala Pro
355 360 365
Leu Leu Gly Leu Ala Asp Tyr Val Ala Phe Arg Gln Asn
370 375 380
<210> 134
<211> 1146
<212> DNA
<213> Abies grandis
<400> 134
atggcttatt ctgctatggc tactatgggt tacaacggta tggctgcttc ttgtcacact 60
ttacacccaa cttctccatt gaaacctttt cacggtgctt ctacttcctt ggaagccttc 120
aatggtgaac acatgggttt gttaagaggt tattctaagc gtaagttgtc ctcttacaaa 180
aatccagctt ctcgttcctc caatgctacc gtcgctcaat tattgaaccc accacaaaag 240
ggtaagaagg ctgttgaatt tgacttcaat aagtatatgg attctaaggc tatgaccgtc 300
aacgaggctt tgaataaagc catcccattg cgttacccac aaaagatcta cgaatctatg 360
agatattctt tgttagctgg tggtaagaga gtccgtccag ttttgtgtat cgccgcttgt 420
gaattagtcg gtggtactga ggagttagct attccaaccg cctgtgccat cgaaatgatc 480
cacaccatgt ctttgatgca cgatgatttg ccatgtatcg acaacgatga cttgagacgt 540
ggtaaaccta ccaatcataa gattttcggt gaagatactg ctgttactgc cggtaacgct 600
ttacactctt acgccttcga acatattgct gtttctactt ccaagactgt tggtgctgat 660
agaattttga gaatggtttc tgaattaggt cgtgctactg gttccgaagg tgttatgggt 720
ggtcaaatgg tcgatattgc ttctgaaggt gacccttcca ttgatttgca aactttagaa 780
tggatccaca tccacaagac tgctatgtta ttagaatgtt ctgttgtctg tggtgccatc 840
atcggtggtg cttctgaaat tgttattgag agagccagac gttatgctcg ttgtgtcggt 900
ttattgtttc aagttgttga cgacatttta gatgttacca aatcttctga cgaattgggt 960
aaaactgctg gtaaagattt aatctccgat aaagccacct accctaagtt gatgggtttg 1020
gagaaggcca aagagttttc cgatgaatta ttaaacagag ctaaaggtga attgtcttgc 1080
ttcgatccag ttaaggctgc cccattgtta ggtttggctg actacgttgc cttcagacaa 1140
aactaa 1146
<210> 135
<211> 257
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(257)
<223> 截短的香叶基香叶基焦磷酸合成酶Pb_GPPS_NTrunc
<400> 135
Met Ala Ala Ile Phe Pro Ser Ile Pro Ser Asn Phe Lys Pro Pro Gln
1 5 10 15
Ile Ser Gln Thr Leu Thr Arg Arg Arg Arg Pro Asn Arg Thr Leu Cys
20 25 30
Thr Ala Thr Ser Asp Gln Ser Tyr Leu Ser Ala Ser Ser Ala Asp Ile
35 40 45
Tyr Ser His Leu Leu Arg Ser Leu Pro Ala Thr Ile His Pro Ser Val
50 55 60
Lys Ala Pro Ile His Ser Leu Leu Ser Ser Pro Ile Pro Pro Thr Ile
65 70 75 80
Ala Pro Pro Leu Cys Leu Ala Ala Thr Glu Leu Val Gly Gly Asn Pro
85 90 95
Asn Ser Ala Ile Asn Ala Ala Cys Ala Ile His Leu Ile His Ala Val
100 105 110
Thr His Thr Arg Thr Ala Pro Pro Leu Ala Glu Phe Ser Pro Gly Val
115 120 125
Leu Leu Met Thr Gly Asp Gly Leu Leu Val Leu Ala Tyr Glu Met Leu
130 135 140
Ala Arg Ser Pro Ala Val Asp Ala Asp Thr Ser Val Arg Val Leu Lys
145 150 155 160
Glu Val Ala Arg Thr Ala Ala Ala Val Ala Ala Ala Tyr Glu Gly Gly
165 170 175
Arg Glu Gly Glu Leu Ala Ala Gly Ala Ala Ala Cys Gly Val Ile Leu
180 185 190
Gly Gly Gly Asn Glu Glu Glu Val Glu Arg Gly Arg Arg Val Gly Met
195 200 205
Phe Ala Gly Lys Met Glu Leu Val Glu Ala Glu Val Glu Leu Arg Leu
210 215 220
Gly Phe Glu Asp Ala Lys Ala Gly Ala Val Arg Arg Leu Leu Glu Glu
225 230 235 240
Met Arg Phe Thr Gln Ser Phe Val Asn Val Arg Asn Pro Phe Tyr Gly
245 250 255
Lys
<210> 136
<211> 774
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(774)
<223> 截短的香叶基香叶基焦磷酸合成酶Pb_GPPS_NTrunc
<400> 136
atggctgcta tctttccatc cattccatcc aacttcaaac cacctcaaat ctctcaaact 60
ttgaccagac gtagaagacc aaaccgtact ttatgtactg ccacctctga ccaatcttac 120
ttgtccgctt cttctgccga catttattct catttgttaa gatctttacc agctactatt 180
catccatctg ttaaagcccc aatccattct ttattgtcct ctccaattcc tccaaccatc 240
gctccacctt tgtgtttagc tgctaccgaa ttggttggtg gtaaccctaa ctctgccatt 300
aacgccgcct gtgccattca tttgattcat gctgttactc atactagaac cgctccacca 360
ttagctgaat tttctcctgg tgttttgttg atgactggtg atggtttatt agttttggct 420
tacgagatgt tggccagatc cccagctgtt gatgccgata cttctgtccg tgttttgaag 480
gaagtcgcta gaaccgccgc cgccgtcgcc gctgcttatg aaggtggtag agaaggtgaa 540
ttagctgccg gtgccgctgc ttgtggtgtc attttgggtg gtggtaacga agaagaggtc 600
gaaagaggtc gtagagtcgg tatgttcgct ggtaaaatgg aattagttga agctgaagtc 660
gaattgagat tgggtttcga agatgctaaa gccggtgccg ttagaagatt gttggaagaa 720
atgcgtttca cccaatcttt tgtcaacgtt agaaaccctt tttatggtaa gtaa 774
<210> 137
<211> 420
<212> PRT
<213> Azadirachta indica
<400> 137
Met Leu Phe Ser Arg Gly Leu Ser Arg Ile Ser Arg Ile Pro Arg Asn
1 5 10 15
Ser Leu Ile Gly Cys Arg Trp Leu Val Ser Tyr Arg Pro Asp Thr Ile
20 25 30
Leu Ser Gly Ser Ser His Ser Val Gly Asp Ser Thr Gln Lys Val Leu
35 40 45
Gly Cys Arg Glu Ala Tyr Leu Trp Ser Leu Pro Ala Leu His Gly Ile
50 55 60
Arg His Gln Ile His Gln Gln Ser Ser Ser Leu Ile Glu Glu Glu Leu
65 70 75 80
Asp Pro Phe Ser Leu Val Ala Asp Glu Leu Ser Leu Val Ala Asn Arg
85 90 95
Leu Arg Ser Met Val Val Ala Glu Val Pro Lys Leu Ala Ser Ala Ala
100 105 110
Glu Tyr Phe Phe Lys Met Gly Val Glu Gly Lys Arg Phe Arg Pro Thr
115 120 125
Val Leu Leu Leu Met Ala Ser Ala Leu Asn Val Gln Val Pro Gln Pro
130 135 140
Leu Ser Asp Gly Val Gly Asp Ala Leu Thr Thr Glu Leu Arg Thr Arg
145 150 155 160
Gln Gln Cys Ile Ala Glu Ile Thr Glu Met Ile His Val Ala Ser Leu
165 170 175
Leu His Asp Asp Val Leu Asp Asp Ala Asp Thr Arg Arg Gly Ile Gly
180 185 190
Ser Leu Asn Phe Val Met Gly Asn Lys Leu Ala Val Leu Ala Gly Asp
195 200 205
Phe Leu Leu Ser Arg Ala Cys Val Ala Leu Ala Ser Leu Lys Asn Thr
210 215 220
Glu Val Val Ser Leu Leu Ala Thr Val Val Glu His Leu Val Thr Gly
225 230 235 240
Glu Thr Met Gln Met Thr Thr Thr Ala Glu Gln Arg Arg Ser Met Asp
245 250 255
Tyr Tyr Met Gln Lys Thr Tyr Tyr Lys Thr Ala Ser Leu Ile Ser Asn
260 265 270
Ser Cys Lys Ala Ile Ala Leu Leu Ala Gly Gln Thr Thr Glu Val Ala
275 280 285
Met Leu Ala Phe Asp Tyr Gly Lys Asn Leu Gly Leu Ala Phe Gln Leu
290 295 300
Ile Asp Asp Val Leu Asp Phe Thr Gly Thr Ser Ala Ser Leu Gly Lys
305 310 315 320
Gly Ser Leu Ser Asp Ile Arg His Gly Ile Val Thr Ala Pro Ile Leu
325 330 335
Phe Ala Met Glu Glu Phe Pro Glu Leu Arg Lys Val Val Asp Lys Gly
340 345 350
Phe Asp Asp Pro Ser Asn Val Asp Ile Ala Leu Glu Tyr Leu Gly Lys
355 360 365
Ser Arg Gly Ile Gln Arg Thr Arg Glu Leu Ala Gln Lys His Ala Asn
370 375 380
Leu Ala Thr Val Ala Leu Asp Ser Leu Pro Glu Ser Asn Asp Asp Asp
385 390 395 400
Val Lys Lys Ser Arg Arg Ala Leu Leu Asp Leu Ala Gln Arg Val Ile
405 410 415
Thr Arg Asn Lys
420
<210> 138
<211> 1263
<212> DNA
<213> Azadirachta indica
<400> 138
atgttgtttt ccagaggttt atctcgtatt tccagaatcc cacgtaactc tttgatcggt 60
tgtagatggt tagtttctta ccgtcctgat accattttat ctggttcctc tcactccgtt 120
ggtgactcta ctcaaaaggt tttaggttgt cgtgaagctt acttgtggtc tttaccagcc 180
ttgcacggta ttagacacca aattcatcaa caatcctctt ctttgattga agaagaattg 240
gatccattct ctttagttgc tgatgaattg tctttagtcg ctaaccgttt gagatccatg 300
gtcgtcgctg aagtcccaaa attagcctcc gccgccgagt acttcttcaa gatgggtgtt 360
gagggtaaga gattccgtcc aactgtctta ttgttgatgg cctccgcctt aaacgttcaa 420
gtcccacaac ctttgtctga cggtgttggt gatgctttga ctaccgagtt gagaactaga 480
caacaatgca ttgctgagat tactgaaatg atccatgttg cttctttgtt gcatgacgac 540
gttttggatg atgctgacac tagacgtggt atcggttctt tgaacttcgt tatgggtaac 600
aagttggctg tcttggctgg tgatttcttg ttgtccagag cctgtgttgc tttagcttcc 660
ttgaagaata ctgaggttgt ctctttgttg gccaccgttg ttgaacactt ggtcaccggt 720
gaaactatgc aaatgactac tactgctgaa caaagacgtt ccatggatta ttacatgcaa 780
aagacttact ataagaccgc ctctttgatt tccaactctt gtaaagccat tgccttgtta 840
gctggtcaaa ctaccgaagt tgctatgttg gctttcgatt acggtaagaa tttgggttta 900
gcttttcaat tgatcgatga cgtcttggat tttactggta cctctgcttc tttaggtaaa 960
ggttccttgt ctgatattag acacggtatc gttaccgctc caattttatt cgctatggaa 1020
gaattcccag aattaagaaa ggttgttgat aagggttttg acgacccttc caacgttgac 1080
attgctttgg agtatttggg taagtctaga ggtattcaaa gaaccagaga attggctcaa 1140
aaacatgcca atttggccac cgtcgccttg gattctttac cagaatccaa cgacgacgat 1200
gttaagaagt ctcgtagagc tttattggac ttggctcaaa gagttattac tagaaacaag 1260
taa 1263
<210> 139
<211> 513
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(513)
<223> 截短的香叶基香叶基焦磷酸合成酶Es_GPPS_NTrunc
<400> 139
Met Arg Arg Ser Gly Ser Ala Thr Ala Ala Ala Ala Ala Thr Leu Ala
1 5 10 15
Arg His Ala Asn Ala Cys Cys Arg Ala Arg Ser Pro Ala Leu Gly Leu
20 25 30
Leu Pro Gly Ala Ala Ala Ser Ser Ser Thr His Arg Ala Ala Leu Ser
35 40 45
Ser Asn Ser Gly His Gly Gly Asp Gly Ser Gly His Tyr Asp Ala Ala
50 55 60
Met Arg Arg Arg Glu Ser Cys Ala Ser Arg Ser Arg His Arg Trp Ser
65 70 75 80
Gly Gln Glu Ala Ala Ala Ala Ser Ala Thr Thr Thr Thr Ala Arg Arg
85 90 95
Ala Pro Gly Gly Val Ala Gly Ala Ser Gly Gln Gly Ser Ala Ala Gly
100 105 110
Ser Val Arg Ala Leu Ser Ser Ser Phe Leu Ala Asp Ala Val Arg Glu
115 120 125
Thr Ala Thr Asn His Cys Ile Asp Arg Val Val Asn Gly Gly Leu Asp
130 135 140
Gly Ser Val Pro Val Asp Lys Asp Thr Pro Thr Val Glu Val Gln Asp
145 150 155 160
Phe Val Tyr Asp Ile Asp Phe Ala Gln Arg Pro Ser Gly Ala Ser Gln
165 170 175
Ser Leu Ala Asp Gly Pro Asp Pro Phe Glu Leu Val Ser Ala Glu Leu
180 185 190
Ala Gly Leu Ser Asp Gly Ile Lys Ser Leu Ile Gly Thr Glu His Ala
195 200 205
Val Leu Asn Ala Ala Ala Lys Tyr Phe Phe Glu Leu Asp Gly Gly Lys
210 215 220
Lys Ile Arg Pro Thr Met Val Ile Leu Met Ser Gln Ala Cys Asn Ser
225 230 235 240
Asn Ser Gln Gln Val Arg Pro Asp Val Gln Pro Gly Thr Glu Leu Val
245 250 255
Asn Pro Leu Gln Leu Arg Leu Ala Glu Ile Thr Glu Met Ile His Ala
260 265 270
Ala Ser Leu Phe His Asp Asp Val Ile Asp Glu Ala Asp Thr Arg Arg
275 280 285
Gly Val Pro Ser Val Asn Lys Val Phe Gly Asn Lys Leu Ala Ile Leu
290 295 300
Ala Gly Asp Phe Leu Leu Ala Arg Ser Ser Met Ser Leu Ala Arg Leu
305 310 315 320
Arg Ser Leu Glu Ser Val Glu Leu Met Ser Ala Ala Ile Glu His Leu
325 330 335
Val Lys Gly Glu Val Leu Gln Met Arg Pro Thr Glu Asp Gly Gly Gly
340 345 350
Ala Phe Glu Tyr Tyr Val Arg Lys Asn Tyr Tyr Lys Thr Gly Ser Leu
355 360 365
Met Ala Asn Ser Cys Lys Ala Ser Ala Val Leu Gly Gln His Asp Leu
370 375 380
Glu Val Gln Glu Val Ala Phe Glu Tyr Gly Lys Arg Val Gly Leu Ala
385 390 395 400
Phe Gln Leu Val Asp Asp Ile Leu Asp Phe Glu Gly Asn Thr Phe Thr
405 410 415
Leu Gly Lys Pro Ala Leu Asn Asp Leu Arg Gln Gly Leu Ala Thr Ala
420 425 430
Pro Val Leu Leu Ala Ala Glu Gln Gln Pro Gly Leu Ala Lys Leu Ile
435 440 445
Ser Arg Lys Phe Arg Gly Pro Gly Asp Val Asp Glu Ala Leu Glu Leu
450 455 460
Val His Arg Ser Asp Gly Ile Ala Arg Ala Lys Glu Val Ala Val Val
465 470 475 480
Gln Ala Glu Lys Ala Met Ser Ala Ile Leu Thr Leu His Asp Ser Pro
485 490 495
Ala Gln Asn Ala Leu Val Gln Leu Ala His Lys Ile Val Asn Arg Asn
500 505 510
His
<210> 140
<211> 1542
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(1542)
<223> 截短的香叶基香叶基焦磷酸合成酶Es_GPPS_NTrunc
<400> 140
atgcgtagat ccggttccgc taccgccgct gccgctgcca ccttagccag acacgccaac 60
gcctgttgta gagcccgttc cccagcttta ggtttgttgc ctggtgccgc cgcttcttcc 120
tctactcaca gagccgcctt gtcttctaat tctggtcatg gtggtgatgg ttccggtcat 180
tacgacgctg ctatgagaag aagagaatct tgcgcttcca gatctcgtca cagatggtcc 240
ggtcaagaag ctgccgccgc ctccgccact accaccaccg ctcgtcgtgc tccaggtggt 300
gtcgccggtg cttctggtca aggttctgct gccggttctg ttagagcctt atcctcttct 360
tttttagccg atgccgttcg tgaaaccgct actaaccact gtatcgaccg tgttgtcaac 420
ggtggtttgg acggttctgt cccagtcgat aaagataccc caactgtcga agttcaagac 480
tttgtttatg atattgactt tgctcaacgt ccatccggtg cctctcaatc tttagctgac 540
ggtccagatc cattcgagtt agtttccgct gagttggccg gtttgtctga tggtattaag 600
tctttgattg gtaccgaaca tgctgtcttg aacgccgccg ccaaatattt cttcgaatta 660
gatggtggta aaaagatcag acctactatg gttatcttaa tgtcccaagc ttgtaactct 720
aattcccaac aagttcgtcc tgacgttcaa ccaggtactg aattagtcaa tcctttgcaa 780
ttaagattgg ctgaaatcac cgagatgatt catgctgctt ctttattcca cgacgatgtt 840
attgatgagg ctgatactag acgtggtgtc ccttctgtta ataaagtttt cggtaacaaa 900
ttagccatct tggccggtga cttcttattg gctagatcct ctatgtcctt ggcccgttta 960
agatccttgg agtccgtcga attgatgtcc gccgctatcg aacacttggt caaaggtgaa 1020
gttttacaaa tgcgtccaac tgaggacggt ggtggtgctt tcgagtacta cgtcagaaaa 1080
aattactaca agactggttc tttgatggct aactcctgta aggcctccgc cgttttaggt 1140
caacacgact tagaagtcca agaggtcgct tttgaatacg gtaagagagt cggtttggct 1200
ttccaattgg ttgacgatat tttagatttt gaaggtaata ctttcacttt gggtaagcca 1260
gctttaaacg acttgagaca aggtttagcc actgcccctg tcttgttagc tgctgaacaa 1320
caacctggtt tagctaaatt gatctccaga aagtttagag gtcctggtga tgtcgatgaa 1380
gctttggaat tggtccacag atccgacggt attgctagag ctaaggaggt tgctgttgtc 1440
caagccgaaa aagctatgtc tgccattttg accttgcatg actccccagc tcaaaatgct 1500
ttggttcaat tggctcacaa aatcgtcaat cgtaaccatt ag 1542
<210> 141
<211> 415
<212> PRT
<213> Solanum sp.
<400> 141
Met Ile Phe Ser Lys Gly Leu Ala Gln Ile Ser Arg Asn Arg Phe Ser
1 5 10 15
Arg Cys Arg Trp Leu Phe Ser Leu Arg Pro Ile Pro Gln Leu His Gln
20 25 30
Ser Asn His Ile His Asp Pro Pro Lys Val Leu Gly Cys Arg Val Ile
35 40 45
His Ser Trp Val Ser Asn Ala Leu Ser Gly Ile Gly Gln Gln Ile His
50 55 60
Gln Gln Ser Thr Ala Val Ala Glu Glu Gln Val Asp Pro Phe Ser Leu
65 70 75 80
Val Ala Asp Glu Leu Ser Leu Leu Thr Asn Arg Leu Arg Ser Met Val
85 90 95
Val Ala Glu Val Pro Lys Leu Ala Ser Ala Ala Glu Tyr Phe Phe Lys
100 105 110
Leu Gly Val Glu Gly Lys Arg Phe Arg Pro Thr Val Leu Leu Leu Met
115 120 125
Ala Thr Ala Leu Asn Val Gln Ile Pro Arg Ser Ala Pro Gln Val Asp
130 135 140
Val Asp Ser Phe Ser Gly Asp Leu Arg Thr Arg Gln Gln Cys Ile Ala
145 150 155 160
Glu Ile Thr Glu Met Ile His Val Ala Ser Leu Leu His Asp Asp Val
165 170 175
Leu Asp Asp Ala Asp Thr Arg Arg Gly Ile Gly Ser Leu Asn Phe Val
180 185 190
Met Gly Asn Lys Leu Ala Val Leu Ala Gly Asp Phe Leu Leu Ser Arg
195 200 205
Ala Cys Val Ala Leu Ala Ser Leu Lys Asn Thr Glu Val Val Cys Leu
210 215 220
Leu Ala Thr Val Val Glu His Leu Val Thr Gly Glu Thr Met Gln Met
225 230 235 240
Thr Thr Ser Ser Asp Glu Arg Cys Ser Met Glu Tyr Tyr Met Gln Lys
245 250 255
Thr Tyr Tyr Lys Thr Ala Ser Leu Ile Ser Asn Ser Cys Lys Ala Ile
260 265 270
Ala Leu Leu Ala Gly His Ser Ala Glu Val Ser Val Leu Ala Phe Asp
275 280 285
Tyr Gly Lys Asn Leu Gly Leu Ala Phe Gln Leu Ile Asp Asp Val Leu
290 295 300
Asp Phe Thr Gly Thr Ser Ala Thr Leu Gly Lys Gly Ser Leu Ser Asp
305 310 315 320
Ile Arg His Gly Ile Val Thr Ala Pro Ile Leu Tyr Ala Met Glu Glu
325 330 335
Phe Pro Gln Leu Arg Thr Leu Val Asp Arg Gly Phe Asp Asp Pro Val
340 345 350
Asn Val Glu Ile Ala Leu Asp Tyr Leu Gly Lys Ser Arg Gly Ile Gln
355 360 365
Arg Thr Arg Glu Leu Ala Arg Lys His Ala Ser Leu Ala Ser Ala Ala
370 375 380
Ile Asp Ser Leu Pro Glu Ser Asp Asp Glu Glu Val Gln Arg Ser Arg
385 390 395 400
Arg Ala Leu Val Glu Leu Thr His Arg Val Ile Thr Arg Thr Lys
405 410 415
<210> 142
<211> 1248
<212> DNA
<213> Solanum sp.
<400> 142
atgatctttt ccaagggttt agctcaaatc tctcgtaata gattctctcg ttgcagatgg 60
ttattctctt tgcgtccaat tcctcaatta caccaatcca atcacatcca cgacccacca 120
aaagttttgg gttgtcgtgt cattcactct tgggtttcta atgccttgtc tggtatcggt 180
caacaaatcc atcaacaatc tactgccgtt gccgaggaac aagtcgaccc tttttctttg 240
gttgctgatg agttatcctt gttaaccaac agattgagat ccatggttgt cgctgaagtc 300
cctaagttag cctccgccgc tgagtatttc tttaagttag gtgtcgaagg taaacgtttc 360
cgtccaactg tcttgttgtt gatggccact gccttaaacg tccaaattcc tcgttctgct 420
ccacaagttg acgttgactc tttttctggt gacttgagaa ctagacaaca atgtatcgct 480
gaaattactg aaatgattca cgtcgcctct ttgttgcatg atgacgtctt agatgatgct 540
gatactagaa gaggtattgg ttccttaaat tttgttatgg gtaataagtt ggctgttttg 600
gctggtgatt tcttgttatc cagagcctgc gtcgccttag cctccttgaa gaacaccgaa 660
gttgtctgtt tattggccac cgttgtcgaa catttggtta ccggtgaaac tatgcaaatg 720
actacctcct ccgatgaaag atgttccatg gaatactaca tgcaaaagac ctactataag 780
actgcctctt tgatttctaa ctcttgtaaa gccattgcct tgttagccgg tcactctgct 840
gaagtttctg tcttggcctt cgattacggt aagaacttag gtttggcttt tcaattgatc 900
gacgatgttt tggacttcac cggtacctct gctactttgg gtaaaggttc cttgtccgat 960
atcagacatg gtatcgttac tgctcctatt ttgtatgcta tggaagaatt ccctcaatta 1020
cgtactttgg ttgacagagg tttcgatgat ccagttaatg ttgagatcgc tttggattac 1080
ttgggtaaat cccgtggtat tcaaagaact agagaattag ccagaaagca tgcctcttta 1140
gcctctgccg ccatcgattc cttgcctgaa tccgacgatg aggaagttca aagatctcgt 1200
agagctttgg tcgaattgac ccatagagtc attactcgta ctaagtaa 1248
<210> 143
<211> 330
<212> PRT
<213> Hevea brasiliensis
<400> 143
Met Gln Phe Leu Arg Gly Leu Ser Pro Ile Ser Arg Ser Gly Leu Arg
1 5 10 15
Leu Phe Leu Ser Arg Gln Leu Tyr Pro Phe Pro Val Ala Asn Ser Ser
20 25 30
Gln Leu Leu Gly Asp Ser Thr Gln Lys Val Phe Asn Arg Arg Glu Thr
35 40 45
Tyr Ser Trp Ser Leu Val Asp Ser His Gly Phe Lys Gln Gln Ile His
50 55 60
His Gln Ser Ser Phe Leu Ser Glu Glu Pro Leu Asp Pro Phe Ser Leu
65 70 75 80
Val Ala Asp Glu Leu Ser Leu Val Ala Asn Arg Leu Arg Ala Met Leu
85 90 95
Val Ser Glu Val Pro Lys Leu Ala Ser Ala Ala Glu Tyr Phe Phe Lys
100 105 110
Met Gly Val Glu Gly Lys Arg Leu Arg Pro Thr Val Leu Leu Leu Met
115 120 125
Ala Thr Ala Leu Asn Val His Ile His Glu Pro Met Pro Asn Gly Val
130 135 140
Gly Asp Thr Leu Gly Ala Glu Leu Arg Thr Arg Gln Gln Cys Ile Ala
145 150 155 160
Glu Ile Thr Glu Met Ile His Val Ala Ser Leu Leu His Asp Asp Val
165 170 175
Leu Asp Asp Ala Asp Thr Arg Arg Gly Ile Gly Ser Leu Asn Phe Val
180 185 190
Met Gly Asn Lys Val Ala Val Leu Ala Gly Asp Phe Leu Leu Ser Arg
195 200 205
Ala Cys Val Ala Leu Ala Ser Leu Lys Asn Thr Glu Val Val Ser Leu
210 215 220
Leu Ala Thr Val Val Glu His Leu Val Thr Gly Glu Thr Met Gln Met
225 230 235 240
Thr Ser Thr Ser Glu Gln Arg Cys Ser Met Asp His Tyr Met Gln Lys
245 250 255
Thr Tyr Tyr Lys Thr Ala Ser Leu Ile Ser Asp Ser Cys Lys Ala Ile
260 265 270
Ala Leu Leu Ala Gly Gln Thr Thr Glu Val Ala Met Leu Ala Phe Glu
275 280 285
Tyr Gly Lys Ser Leu Gly Leu Ala Phe Gln Leu Ile Asp Asp Val Leu
290 295 300
Asp Phe Thr Gly Thr Ser Ala Ser Leu Gly Lys Gly Ser Leu Ser Asp
305 310 315 320
Ile Arg His Val Ile Arg Leu Ser Leu Ile
325 330
<210> 144
<211> 993
<212> DNA
<213> Hevea brasiliensis
<400> 144
atgcaatttt tgagaggttt gtcccctatt tccagatccg gtttgcgttt attcttatct 60
cgtcaattat atccattccc agtcgccaac tcctcccaat tattaggtga ctctactcaa 120
aaggttttta acagacgtga gacttactct tggtctttgg tcgactctca cggttttaag 180
caacaaattc atcaccaatc ctcttttttg tctgaagaac cattggatcc attctctttg 240
gttgctgatg aattatcctt ggtcgctaac agattgcgtg ctatgttggt ttctgaagtc 300
ccaaaattag cctccgccgc tgaatatttt ttcaagatgg gtgttgaagg taagagattg 360
cgtccaaccg tcttgttatt aatggccact gctttaaacg ttcatatcca tgaacctatg 420
cctaacggtg ttggtgacac tttgggtgcc gaattgagaa ctagacaaca atgcatcgct 480
gaaatcaccg aaatgatcca tgttgcttct ttattacatg acgacgtttt agacgatgcc 540
gataccagaa gaggtattgg ttctttgaac ttcgttatgg gtaacaaggt tgctgttttg 600
gccggtgact ttttgttgtc cagagcttgt gttgccttag cttctttgaa gaataccgaa 660
gtcgtttctt tattggccac cgtcgtcgaa cacttggtta ctggtgagac tatgcaaatg 720
acctccactt ctgagcaacg ttgttccatg gatcattata tgcaaaagac ttactataag 780
accgcttcct taatctctga ttcctgtaaa gccatcgcct tgttagctgg tcaaactacc 840
gaggtcgcca tgttggcctt cgaatatggt aagtctttgg gtttagcttt tcaattaatc 900
gacgatgttt tagacttcac cggtacttct gcttccttgg gtaagggttc tttgtccgac 960
attagacacg ttattagatt atccttaatt taa 993
<210> 145
<211> 566
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(566)
<223> 突变的中链脂肪酸辅酶A连接酶Ec_FADK_v1
<400> 145
Met His Pro Thr Gly Pro His Leu Gly Pro Asp Val Leu Phe Arg Glu
1 5 10 15
Ser Asn Met Lys Val Thr Leu Thr Phe Asn Glu Gln Arg Arg Ala Ala
20 25 30
Tyr Arg Gln Gln Gly Leu Trp Gly Asp Ala Ser Leu Ala Asp Tyr Trp
35 40 45
Gln Gln Thr Ala Arg Ala Met Pro Asp Lys Ile Ala Val Val Asp Asn
50 55 60
His Gly Ala Ser Tyr Thr Tyr Ser Ala Leu Asp His Ala Ala Ser Cys
65 70 75 80
Leu Ala Asn Trp Met Leu Ala Lys Gly Ile Glu Ser Gly Asp Arg Ile
85 90 95
Ala Phe Gln Leu Pro Gly Trp Cys Glu Phe Thr Val Ile Tyr Leu Ala
100 105 110
Cys Leu Lys Ile Gly Ala Val Ser Val Pro Leu Leu Pro Ser Trp Arg
115 120 125
Glu Ala Glu Leu Val Trp Val Leu Asn Lys Cys Gln Ala Lys Met Phe
130 135 140
Phe Ala Pro Thr Leu Phe Lys Gln Thr Arg Pro Val Asp Leu Ile Leu
145 150 155 160
Pro Leu Gln Asn Gln Leu Pro Gln Leu Gln Gln Ile Val Gly Val Asp
165 170 175
Lys Leu Ala Pro Ala Thr Ser Ser Leu Ser Leu Ser Gln Ile Ile Ala
180 185 190
Asp Asn Thr Ser Leu Thr Thr Ala Ile Thr Thr His Gly Asp Glu Leu
195 200 205
Ala Ala Val Leu Phe Thr Ser Gly Thr Glu Gly Leu Pro Lys Gly Val
210 215 220
Met Leu Thr His Asn Asn Ile Leu Ala Ser Glu Arg Ala Tyr Cys Ala
225 230 235 240
Arg Leu Asn Leu Thr Trp Gln Asp Val Phe Met Met Pro Ala Pro Leu
245 250 255
Gly His Ala Thr Gly Phe Leu His Gly Val Thr Ala Pro Phe Leu Ile
260 265 270
Gly Ala Arg Ser Val Leu Leu Asp Ile Phe Thr Pro Asp Ala Cys Leu
275 280 285
Ala Leu Leu Glu Gln Gln Arg Cys Thr Cys Met Leu Gly Ala Thr Pro
290 295 300
Phe Val Tyr Asp Leu Leu Asn Val Leu Glu Lys Gln Pro Ala Asp Leu
305 310 315 320
Ser Ala Leu Arg Phe Phe Leu Cys Gly Gly Thr Thr Ile Pro Lys Lys
325 330 335
Val Ala Arg Glu Cys Gln Gln Arg Gly Ile Lys Leu Leu Ser Val Tyr
340 345 350
Gly Ser Thr Glu Ser Ser Pro His Ala Val Val Asn Leu Asp Asp Pro
355 360 365
Leu Ser Arg Phe Met His Thr Asp Gly Tyr Ala Ala Ala Gly Val Glu
370 375 380
Ile Lys Val Val Asp Asp Ala Arg Lys Thr Leu Pro Pro Gly Cys Glu
385 390 395 400
Gly Glu Glu Ala Ser Arg Gly Pro Asn Val Phe Met Gly Tyr Phe Asp
405 410 415
Glu Pro Glu Leu Thr Ala Arg Ala Leu Asp Glu Glu Gly Trp Tyr Tyr
420 425 430
Ser Gly Asp Leu Cys Arg Met Asp Glu Ala Gly Tyr Ile Lys Ile Thr
435 440 445
Gly Arg Lys Lys Asp Ile Ile Val Arg Gly Gly Glu Asn Ile Ser Ser
450 455 460
Arg Glu Val Glu Asp Ile Leu Leu Gln His Pro Lys Ile His Asp Ala
465 470 475 480
Cys Val Val Ala Met Ser Asp Glu Arg Leu Gly Glu Arg Ser Cys Ala
485 490 495
Tyr Val Val Leu Lys Ala Pro His His Ser Leu Ser Leu Glu Glu Val
500 505 510
Val Ala Phe Phe Ser Arg Lys Arg Val Ala Lys Tyr Lys Tyr Pro Glu
515 520 525
His Ile Val Val Ile Glu Lys Leu Pro Arg Thr Thr Ser Gly Lys Ile
530 535 540
Gln Lys Phe Leu Leu Arg Lys Asp Ile Met Arg Arg Leu Thr Gln Asp
545 550 555 560
Val Cys Glu Glu Ile Glu
565
<210> 146
<211> 1701
<212> DNA
<213> Escherichia coli
<400> 146
atgcatccaa ctggtccaca cttaggtcct gatgtcttat ttagagaatc taatatgaaa 60
gtcactttga cctttaatga acaaagacgt gccgcttaca gacaacaagg tttgtggggt 120
gacgcttctt tggctgacta ctggcaacaa actgctagag ctatgccaga caagatcgcc 180
gttgtcgata accacggtgc ttcttatacc tactctgctt tggatcatgc cgcttcttgt 240
ttggctaatt ggatgttggc taagggtatc gaatctggtg atcgtattgc ttttcaattg 300
ccaggttggt gtgaatttac cgttatctac ttggcttgtt tgaagattgg tgctgtttct 360
gtcccattgt tgccatcttg gagagaagcc gaattggttt gggttttgaa caaatgccaa 420
gctaagatgt tctttgctcc aaccttgttc aagcaaacta gaccagttga cttgatttta 480
cctttacaaa atcaattacc acaattgcaa caaatcgttg gtgttgacaa gttagctcca 540
gccacctcct ctttgtcctt gtcccaaatt atcgctgata atacttcttt aaccaccgct 600
atcactactc acggtgatga gttggctgct gttttgttca cttccggtac tgagggtttg 660
ccaaagggtg ttatgttgac ccacaataac attttggctt ccgaaagagc ttattgtgct 720
cgtttgaact tgacctggca agatgttttc atgatgccag ctccattggg tcatgctact 780
ggtttcttgc acggtgttac tgccccattc ttgattggtg ctagatctgt cttgttggat 840
atctttaccc cagacgcttg cttagcttta ttggaacaac aaagatgtac ctgtatgtta 900
ggtgctactc catttgttta cgatttattg aacgttttgg aaaaacaacc agctgatttg 960
tctgccttga gattcttttt gtgtggtggt actactattc caaagaaagt tgctagagaa 1020
tgccaacaaa gaggtatcaa gttgttgtcc gtctatggtt ccactgaatc ttctcctcat 1080
gctgttgtca atttagatga cccattgtct agattcatgc acaccgatgg ttacgccgct 1140
gctggtgttg agattaaggt tgtcgacgat gctagaaaga ccttacctcc aggttgtgaa 1200
ggtgaagaag cctctagagg tccaaatgtc tttatgggtt acttcgacga gccagaattg 1260
actgctagag ctttagatga ggaaggttgg tattactctg gtgatttgtg tagaatggat 1320
gaagctggtt acattaaaat cactggtaga aagaaggaca ttattgttag aggtggtgaa 1380
aatatctcct ccagagaagt tgaagatatt ttattgcaac acccaaagat tcatgatgct 1440
tgtgttgttg ctatgtccga tgagagatta ggtgaaagat cttgtgctta cgttgttttg 1500
aaggctccac atcactcttt gtctttagaa gaagtcgttg ctttcttctc tagaaagaga 1560
gtcgccaagt acaagtaccc agaacacatt gttgttatcg aaaaattgcc tagaactact 1620
tctggtaaaa ttcaaaaatt cttgttgaga aaggatatca tgagacgttt gacccaagat 1680
gtctgtgaag aaattgaata a 1701
<210> 147
<211> 566
<212> PRT
<213> Escherichia coli
<400> 147
Met His Pro Thr Gly Pro His Leu Gly Pro Asp Val Leu Phe Arg Glu
1 5 10 15
Ser Asn Met Lys Val Thr Leu Thr Phe Asn Glu Gln Arg Arg Ala Ala
20 25 30
Tyr Arg Gln Gln Gly Leu Trp Gly Asp Ala Ser Leu Ala Asp Tyr Trp
35 40 45
Gln Gln Thr Ala Arg Ala Met Pro Asp Lys Ile Ala Val Val Asp Asn
50 55 60
His Gly Ala Ser Tyr Thr Tyr Ser Ala Leu Asp His Ala Ala Ser Cys
65 70 75 80
Leu Ala Asn Trp Met Leu Ala Lys Gly Ile Glu Ser Gly Asp Arg Ile
85 90 95
Ala Phe Gln Leu Pro Gly Trp Cys Glu Phe Thr Val Ile Tyr Leu Ala
100 105 110
Cys Leu Lys Ile Gly Ala Val Ser Val Pro Leu Leu Pro Ser Trp Arg
115 120 125
Glu Ala Glu Leu Val Trp Val Leu Asn Lys Cys Gln Ala Lys Met Phe
130 135 140
Phe Ala Pro Thr Leu Phe Lys Gln Thr Arg Pro Val Asp Leu Ile Leu
145 150 155 160
Pro Leu Gln Asn Gln Leu Pro Gln Leu Gln Gln Ile Val Gly Val Asp
165 170 175
Lys Leu Ala Pro Ala Thr Ser Ser Leu Ser Leu Ser Gln Ile Ile Ala
180 185 190
Asp Asn Thr Ser Leu Thr Thr Ala Ile Thr Thr His Gly Asp Glu Leu
195 200 205
Ala Ala Val Leu Phe Thr Ser Gly Thr Glu Gly Leu Pro Lys Gly Val
210 215 220
Met Leu Thr His Asn Asn Ile Leu Ala Ser Glu Arg Ala Tyr Cys Ala
225 230 235 240
Arg Leu Asn Leu Thr Trp Gln Asp Val Phe Met Met Pro Ala Pro Leu
245 250 255
Gly His Ala Thr Gly Phe Leu His Gly Val Thr Ala Pro Phe Leu Ile
260 265 270
Gly Ala Arg Ser Val Leu Leu Asp Ile Phe Thr Pro Asp Ala Cys Leu
275 280 285
Ala Leu Leu Glu Gln Gln Arg Cys Thr Cys Met Leu Gly Ala Thr Pro
290 295 300
Phe Val Tyr Asp Leu Leu Asn Val Leu Glu Lys Gln Pro Ala Asp Leu
305 310 315 320
Ser Ala Leu Arg Phe Phe Leu Cys Gly Gly Thr Thr Ile Pro Lys Lys
325 330 335
Val Ala Arg Glu Cys Gln Gln Arg Gly Ile Lys Leu Leu Ser Val Tyr
340 345 350
Gly Ser Thr Glu Ser Ser Pro His Ala Val Val Asn Leu Asp Asp Pro
355 360 365
Leu Ser Arg Phe Met His Thr Asp Gly Tyr Ala Ala Ala Gly Val Glu
370 375 380
Ile Lys Val Val Asp Asp Ala Arg Lys Thr Leu Pro Pro Gly Cys Glu
385 390 395 400
Gly Glu Glu Ala Ser Arg Gly Pro Asn Val Phe Met Gly Tyr Phe Asp
405 410 415
Glu Pro Glu Leu Thr Ala Arg Ala Leu Asp Glu Glu Gly Trp Tyr Tyr
420 425 430
Ser Gly Asp Leu Cys Arg Met Asp Glu Ala Gly Tyr Ile Lys Ile Thr
435 440 445
Gly Arg Lys Lys Asp Ile Ile Val Arg Gly Gly Glu Asn Ile Ser Ser
450 455 460
Arg Glu Val Glu Asp Ile Leu Leu Gln His Pro Lys Ile His Asp Ala
465 470 475 480
Cys Val Val Ala Met Ser Asp Glu Arg Leu Gly Glu Arg Ser Cys Ala
485 490 495
Tyr Val Val Leu Lys Ala Pro His His Ser Leu Ser Leu Glu Glu Val
500 505 510
Val Ala Phe Phe Ser Arg Lys Arg Val Ala Lys Tyr Lys Tyr Pro Glu
515 520 525
His Ile Val Val Ile Glu Lys Leu Pro Arg Thr Thr Ser Gly Lys Ile
530 535 540
Gln Lys Phe Leu Leu Arg Lys Asp Ile Met Arg Arg Leu Thr Gln Asp
545 550 555 560
Val Cys Glu Glu Ile Glu
565
<210> 148
<211> 1701
<212> DNA
<213> Artificial Sequence
<220>
<221> attenuator
<222> (1)..(1701)
<223> 人工中链脂肪酸辅酶A连接酶Ec_FADK_v2核苷酸序列
<400> 148
atgcatccaa ctggtcctca cttaggtcca gatgtcttat tcagagaatc taacatgaaa 60
gtcactttaa cttttaacga acaacgtaga gctgcttata gacaacaagg tttgtggggt 120
gatgcttcct tggctgacta ctggcaacaa actgctagag ccatgccaga taaaattgcc 180
gttgttgaca atcacggtgc ttcttacact tattctgcct tagatcacgc tgcttcctgt 240
ttagctaact ggatgttagc taagggtatt gaatccggtg atagaattgc tttccaattg 300
ccaggttggt gcgaatttac tgtcatttat ttagcttgtt taaagattgg tgccgtctcc 360
gtccctttgt tgccatcctg gagagaggcc gagttggttt gggttttaaa caagtgtcaa 420
gctaaaatgt tctttgctcc taccttgttc aagcaaacca gaccagttga cttaattttg 480
ccattacaaa accaattacc acaattgcaa caaatcgtcg gtgttgataa attagctcca 540
gccacttctt ctttgtcctt atcccaaatt attgctgata acacttcttt aactactgct 600
attactactc acggtgatga attggccgct gttttgttca cttccggtac tgaaggtttg 660
cctaaaggtg tcatgttgac tcacaacaac attttggcct ctgaaagagc ttactgtgcc 720
cgtttaaatt tgacctggca agatgtcttc atgatgcctg ctccattggg tcacgctacc 780
ggtttcttac acggtgtcac tgccccattc ttgatcggtg ctcgttctgt tttattggat 840
atctttactc cagatgcttg cttggcttta ttggaacaac aaagatgtac ctgcatgtta 900
ggtgctactc ctttcgtcta tgatttattg aacgtcttag aaaaacaacc agctgattta 960
tccgctttaa gattcttttt gtgtggtggt actactatcc caaaaaaggt cgccagagaa 1020
tgtcaacaaa gaggtattaa attattgtcc gtttatggtt ccactgaatc ttcccctcat 1080
gctgttgtca atttagacga ccctttgtcc agattcatgc acactgatgg ttacgccgct 1140
gctggtgtcg aaatcaaggt tgttgatgac gctagaaaaa ctttaccacc tggttgcgaa 1200
ggtgaagagg cttccagagg tccaaacgtc tttatgggtt actttgatga accagaattg 1260
actgccagag ctttggatga ggaaggttgg tattattctg gtgatttgtg tagaatggat 1320
gaagccggtt acatcaagat caccggtaga aagaaagaca tcatcgttag aggtggtgaa 1380
aacatttctt ctagagaagt tgaagacatt ttgttgcaac acccaaagat ccacgacgct 1440
tgtgtcgtcg ccatgtctga cgaaagattg ggtgaacgtt cttgtgctta cgtcgtcttg 1500
aaagccccac accactcttt gtctttggaa gaagtcgttg cttttttctc tcgtaagcgt 1560
gttgccaagt acaagtaccc agagcacatc gttgttattg aaaaattgcc tcgtactact 1620
tccggtaaga ttcaaaagtt cttattacgt aaggacatca tgagaagatt gactcaagac 1680
gtctgcgaag aaattgaata a 1701
<210> 149
<211> 521
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(521)
<223> 截短的酰基活化酶(Cs_AAE3_Ctrunc)
<400> 149
Met Glu Lys Ser Gly Tyr Gly Arg Asp Gly Ile Tyr Arg Ser Leu Arg
1 5 10 15
Pro Pro Leu His Leu Pro Asn Asn Asn Asn Leu Ser Met Val Ser Phe
20 25 30
Leu Phe Arg Asn Ser Ser Ser Tyr Pro Gln Lys Pro Ala Leu Ile Asp
35 40 45
Ser Glu Thr Asn Gln Ile Leu Ser Phe Ser His Phe Lys Ser Thr Val
50 55 60
Ile Lys Val Ser His Gly Phe Leu Asn Leu Gly Ile Lys Lys Asn Asp
65 70 75 80
Trp Leu Ile Tyr Ala Pro Asn Ser Ile His Phe Pro Val Cys Phe Leu
85 90 95
Gly Ile Ile Ala Ser Gly Ala Ile Ala Thr Thr Ser Asn Pro Leu Tyr
100 105 110
Thr Val Ser Glu Leu Ser Lys Gln Val Lys Asp Ser Asn Pro Lys Leu
115 120 125
Ile Ile Thr Val Pro Gln Leu Leu Glu Lys Val Lys Gly Phe Asn Leu
130 135 140
Pro Thr Ile Leu Ile Gly Pro Asp Ser Glu Gln Glu Ser Ser Ser Asp
145 150 155 160
Lys Val Met Thr Phe Asn Asp Leu Val Asn Leu Gly Gly Ser Ser Gly
165 170 175
Ser Glu Phe Pro Ile Val Asp Asp Phe Lys Gln Ser Asp Thr Ala Ala
180 185 190
Leu Leu Tyr Ser Ser Gly Thr Thr Gly Met Ser Lys Gly Trp Leu Thr
195 200 205
His Lys Asn Phe Ile Ala Ser Ser Leu Met Val Thr Met Glu Gln Asp
210 215 220
Leu Val Gly Glu Met Asp Asn Val Phe Leu Cys Phe Leu Pro Met Phe
225 230 235 240
His Val Phe Gly Leu Ala Ile Ile Thr Tyr Ala Gln Leu Gln Arg Gly
245 250 255
Asn Thr Val Ile Ser Ala Arg Phe Asp Leu Glu Lys Met Leu Lys Asp
260 265 270
Val Glu Lys Tyr Val Thr His Leu Trp Trp Pro Pro Val Ile Leu Ala
275 280 285
Leu Ser Lys Asn Ser Met Val Lys Phe Asn Leu Ser Ser Ile Lys Tyr
290 295 300
Ile Gly Ser Gly Ala Ala Pro Leu Gly Lys Asp Leu Met Glu Glu Cys
305 310 315 320
Ser Lys Trp Pro Tyr Gly Ile Val Ala Gln Gly Tyr Gly Met Thr Glu
325 330 335
Thr Cys Gly Ile Val Ser Met Glu Asp Ile Arg Gly Gly Lys Arg Asn
340 345 350
Ser Gly Ser Ala Gly Met Leu Ala Ser Gly Val Glu Ala Gln Ile Val
355 360 365
Ser Val Asp Thr Leu Lys Pro Leu Pro Pro Asn Gln Leu Gly Glu Ile
370 375 380
Trp Val Lys Gly Pro Asn Met Met Gln Gly Tyr Phe Asn Asn Pro Gln
385 390 395 400
Ala Thr Lys Leu Thr Ile Asp Lys Lys Gly Trp Val His Thr Gly Asp
405 410 415
Leu Gly Tyr Phe Asp Glu Asp Gly His Leu Tyr Trp Asp Arg Ile Lys
420 425 430
Glu Leu Ile Lys Tyr Lys Gly Phe Gln Val Ala Pro Ala Glu Leu Glu
435 440 445
Gly Leu Leu Val Ser His Pro Glu Ile Leu Asp Ala Trp Ile Pro Phe
450 455 460
Pro Asp Ala Glu Ala Gly Glu Val Pro Val Ala Tyr Trp Arg Ser Pro
465 470 475 480
Asn Ser Ser Leu Thr Glu Asn Asp Val Lys Lys Phe Ile Ala Gly Gln
485 490 495
Val Ala Ser Phe Lys Arg Leu Arg Lys Val Thr Phe Ile Asn Ser Val
500 505 510
Pro Lys Ser Ala Ser Gly Lys Ile Leu
515 520
<210> 150
<211> 1563
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(1563)
<223> 截短的酰基活化酶(Cs_AAE3_Ctrunc)
<400> 150
atggaaaaat ctggttatgg tagagacggt atctacagat ccttgcgtcc tccattacac 60
ttgccaaaca ataataactt atctatggtt tcctttttgt tccgtaactc ttcctcttac 120
ccacaaaaac ctgctttgat tgactccgaa accaatcaaa tcttgtcctt ttcccacttc 180
aaatctactg tcattaaagt ctctcacggt ttcttgaact taggtattaa gaagaacgac 240
tggttgatct acgctcctaa ttccatccac tttccagttt gtttcttggg tatcattgct 300
tctggtgcca ttgctaccac ttctaaccct ttatacactg tttctgagtt atctaagcaa 360
gttaaagatt ctaacccaaa attgattatc actgtcccac aattattaga aaaggtcaag 420
ggtttcaatt taccaaccat tttaatcggt ccagactccg aacaagagtc ttcttccgat 480
aaagttatga cttttaacga cttagttaac ttgggtggtt cttctggttc tgagttccca 540
atcgtcgatg atttcaagca atctgacacc gccgctttat tgtattcctc tggtactact 600
ggtatgtcta agggttggtt gactcacaaa aactttatcg cttcctcttt gatggttacc 660
atggaacaag acttggttgg tgaaatggat aacgtcttct tgtgtttttt accaatgttc 720
catgttttcg gtttagctat cattacttac gctcaattac aaagaggtaa cactgtcatc 780
tctgctcgtt ttgacttaga aaagatgttg aaagacgttg aaaagtacgt tactcacttg 840
tggtggcctc ctgttatttt agctttgtct aagaattcta tggttaaatt caacttgtcc 900
tctatcaagt acattggttc tggtgccgct ccattaggta aggacttgat ggaagaatgt 960
tctaaatggc cttacggtat cgtcgctcaa ggttacggta tgactgaaac ttgtggtatc 1020
gtttctatgg aagacatcag aggtggtaag cgtaactccg gttctgctgg tatgttggct 1080
tccggtgttg aagcccaaat tgtttctgtc gatactttga aacctttgcc acctaaccaa 1140
ttaggtgaaa tttgggttaa aggtcctaac atgatgcaag gttacttcaa taaccctcaa 1200
gctactaagt taactattga taagaagggt tgggttcata ctggtgattt gggttacttc 1260
gatgaagatg gtcatttgta ctgggataga atcaaagaat taattaagta taaaggtttc 1320
caagttgccc cagctgaatt ggaaggtttg ttggtttctc atcctgaaat tttagatgct 1380
tggattcctt tcccagacgc tgaagccggt gaagttccag ttgcttactg gagatcccct 1440
aactcttcct tgactgaaaa cgacgtcaag aagttcatcg ctggtcaagt tgcttccttt 1500
aagagattaa gaaaagtcac cttcatcaac tccgttccaa agtctgcttc cggtaagatt 1560
ttg 1563
<210> 151
<211> 518
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(518)
<223> 截短的大麻二酚酸合成酶Cs_CBDASt28
<400> 151
Met Ser Asn Pro Arg Glu Asn Phe Leu Lys Cys Phe Ser Gln Tyr Ile
1 5 10 15
Pro Asn Asn Ala Thr Asn Leu Lys Leu Val Tyr Thr Gln Asn Asn Pro
20 25 30
Leu Tyr Met Ser Val Leu Asn Ser Thr Ile His Asn Leu Arg Phe Thr
35 40 45
Ser Asp Thr Thr Pro Lys Pro Leu Val Ile Val Thr Pro Ser His Val
50 55 60
Ser His Ile Gln Gly Thr Ile Leu Cys Ser Lys Lys Val Gly Leu Gln
65 70 75 80
Ile Arg Thr Arg Ser Gly Gly His Asp Ser Glu Gly Met Ser Tyr Ile
85 90 95
Ser Gln Val Pro Phe Val Ile Val Asp Leu Arg Asn Met Arg Ser Ile
100 105 110
Lys Ile Asp Val His Ser Gln Thr Ala Trp Val Glu Ala Gly Ala Thr
115 120 125
Leu Gly Glu Val Tyr Tyr Trp Val Asn Glu Lys Asn Glu Asn Leu Ser
130 135 140
Leu Ala Ala Gly Tyr Cys Pro Thr Val Cys Ala Gly Gly His Phe Gly
145 150 155 160
Gly Gly Gly Tyr Gly Pro Leu Met Arg Asn Tyr Gly Leu Ala Ala Asp
165 170 175
Asn Ile Ile Asp Ala His Leu Val Asn Val His Gly Lys Val Leu Asp
180 185 190
Arg Lys Ser Met Gly Glu Asp Leu Phe Trp Ala Leu Arg Gly Gly Gly
195 200 205
Ala Glu Ser Phe Gly Ile Ile Val Ala Trp Lys Ile Arg Leu Val Ala
210 215 220
Val Pro Lys Ser Thr Met Phe Ser Val Lys Lys Ile Met Glu Ile His
225 230 235 240
Glu Leu Val Lys Leu Val Asn Lys Trp Gln Asn Ile Ala Tyr Lys Tyr
245 250 255
Asp Lys Asp Leu Leu Leu Met Thr His Phe Ile Thr Arg Asn Ile Thr
260 265 270
Asp Asn Gln Gly Lys Asn Lys Thr Ala Ile His Thr Tyr Phe Ser Ser
275 280 285
Val Phe Leu Gly Gly Val Asp Ser Leu Val Asp Leu Met Asn Lys Ser
290 295 300
Phe Pro Glu Leu Gly Ile Lys Lys Thr Asp Cys Arg Gln Leu Ser Trp
305 310 315 320
Ile Asp Thr Ile Ile Phe Tyr Ser Gly Val Val Asn Tyr Asp Thr Asp
325 330 335
Asn Phe Asn Lys Glu Ile Leu Leu Asp Arg Ser Ala Gly Gln Asn Gly
340 345 350
Ala Phe Lys Ile Lys Leu Asp Tyr Val Lys Lys Pro Ile Pro Glu Ser
355 360 365
Val Phe Val Gln Ile Leu Glu Lys Leu Tyr Glu Glu Asp Ile Gly Ala
370 375 380
Gly Met Tyr Ala Leu Tyr Pro Tyr Gly Gly Ile Met Asp Glu Ile Ser
385 390 395 400
Glu Ser Ala Ile Pro Phe Pro His Arg Ala Gly Ile Leu Tyr Glu Leu
405 410 415
Trp Tyr Ile Cys Ser Trp Glu Lys Gln Glu Asp Asn Glu Lys His Leu
420 425 430
Asn Trp Ile Arg Asn Ile Tyr Asn Phe Met Thr Pro Tyr Val Ser Lys
435 440 445
Asn Pro Arg Leu Ala Tyr Leu Asn Tyr Arg Asp Leu Asp Ile Gly Ile
450 455 460
Asn Asp Pro Lys Asn Pro Asn Asn Tyr Thr Gln Ala Arg Ile Trp Gly
465 470 475 480
Glu Lys Tyr Phe Gly Lys Asn Phe Asp Arg Leu Val Lys Val Lys Thr
485 490 495
Leu Val Asp Pro Asn Asn Phe Phe Arg Asn Glu Gln Ser Ile Pro Pro
500 505 510
Leu Pro Arg His Arg His
515
<210> 152
<211> 1557
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(1557)
<223> 截短的大麻二酚酸合成酶Cs_CBDASt28
<400> 152
atgtctaatc caagagagaa tttcttaaag tgtttttctc aatacatccc aaacaatgct 60
actaacttaa agttggttta cactcaaaat aacccattgt acatgtctgt cttgaactct 120
accattcaca atttgcgttt tacttctgac accaccccta agccattagt tattgttacc 180
ccatcccacg tctctcacat ccaaggtact attttgtgtt ctaaaaaggt tggtttgcaa 240
attagaacta gatctggtgg tcacgactcc gagggtatgt cttacatctc tcaagttcca 300
ttcgttattg tcgacttgcg taacatgcgt tccatcaaaa tcgatgttca ctcccaaact 360
gcttgggtcg aagccggtgc cactttaggt gaggtttatt actgggtcaa tgagaagaat 420
gagaatttgt ccttggctgc tggttattgt ccaaccgtct gtgctggtgg tcattttggt 480
ggtggtggtt acggtccatt aatgagaaac tatggtttgg ctgccgataa cattatcgac 540
gctcacttgg ttaatgtcca cggtaaggtc ttagatagaa aatccatggg tgaggacttg 600
ttctgggctt tgagaggtgg tggtgctgag tcctttggta tcatcgttgc ttggaaaatt 660
cgtttagttg ctgtcccaaa atctactatg ttttctgtta agaagatcat ggaaattcac 720
gagttggtta agttggttaa taagtggcaa aatattgcct acaagtatga caaagacttg 780
ttattgatga ctcacttcat cactagaaac atcaccgata accaaggtaa aaataaaact 840
gctatccata cctacttctc ctccgttttc ttgggtggtg tcgactcctt agttgatttg 900
atgaacaaat cttttcctga attaggtatc aagaagactg attgtcgtca attgtcctgg 960
attgatacca ttatctttta ctctggtgtc gtcaattacg acaccgataa tttcaataag 1020
gaaattttat tggacagatc tgccggtcaa aacggtgctt tcaagatcaa gttggactac 1080
gttaaaaaac caatcccaga atccgtcttt gtccaaattt tggagaagtt atacgaggaa 1140
gacatcggtg ctggtatgta tgccttatat ccatacggtg gtattatgga tgaaatttcc 1200
gaatctgcta tcccatttcc acatcgtgct ggtattttgt atgaattatg gtacatttgt 1260
tcctgggaaa agcaagaaga taacgagaag cacttgaatt ggatcagaaa tatctacaat 1320
ttcatgactc cttacgtttc taagaatcct cgtttggctt acttgaacta cagagatttg 1380
gacatcggta ttaatgaccc aaagaaccca aataactata ctcaagctag aatttggggt 1440
gaaaagtact tcggtaaaaa ctttgacaga ttggttaagg ttaagacttt agttgatcca 1500
aataacttct tcagaaatga acaatccatc ccaccattgc ctagacacag acactaa 1557
<210> 153
<211> 519
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(519)
<223> 截短的四氢大麻酚酸合成酶Cs_THCASt28
<400> 153
Met Ser Asn Pro Arg Glu Asn Phe Leu Lys Cys Phe Ser Lys His Ile
1 5 10 15
Pro Asn Asn Val Ala Asn Pro Lys Leu Val Tyr Thr Gln His Asp Gln
20 25 30
Leu Tyr Met Ser Ile Leu Asn Ser Thr Ile Gln Asn Leu Arg Phe Ile
35 40 45
Ser Asp Thr Thr Pro Lys Pro Leu Val Ile Val Thr Pro Ser Asn Asn
50 55 60
Ser His Ile Gln Ala Thr Ile Leu Cys Ser Lys Lys Val Gly Leu Gln
65 70 75 80
Ile Arg Thr Arg Ser Gly Gly His Asp Ala Glu Gly Met Ser Tyr Ile
85 90 95
Ser Gln Val Pro Phe Val Val Val Asp Leu Arg Asn Met His Ser Ile
100 105 110
Lys Ile Asp Val His Ser Gln Thr Ala Trp Val Glu Ala Gly Ala Thr
115 120 125
Leu Gly Glu Val Tyr Tyr Trp Ile Asn Glu Lys Asn Glu Asn Leu Ser
130 135 140
Phe Pro Gly Gly Tyr Cys Pro Thr Val Gly Val Gly Gly His Phe Ser
145 150 155 160
Gly Gly Gly Tyr Gly Ala Leu Met Arg Asn Tyr Gly Leu Ala Ala Asp
165 170 175
Asn Ile Ile Asp Ala His Leu Val Asn Val Asp Gly Lys Val Leu Asp
180 185 190
Arg Lys Ser Met Gly Glu Asp Leu Phe Trp Ala Ile Arg Gly Gly Gly
195 200 205
Gly Glu Asn Phe Gly Ile Ile Ala Ala Trp Lys Ile Lys Leu Val Ala
210 215 220
Val Pro Ser Lys Ser Thr Ile Phe Ser Val Lys Lys Asn Met Glu Ile
225 230 235 240
His Gly Leu Val Lys Leu Phe Asn Lys Trp Gln Asn Ile Ala Tyr Lys
245 250 255
Tyr Asp Lys Asp Leu Val Leu Met Thr His Phe Ile Thr Lys Asn Ile
260 265 270
Thr Asp Asn His Gly Lys Asn Lys Thr Thr Val His Gly Tyr Phe Ser
275 280 285
Ser Ile Phe His Gly Gly Val Asp Ser Leu Val Asp Leu Met Asn Lys
290 295 300
Ser Phe Pro Glu Leu Gly Ile Lys Lys Thr Asp Cys Lys Glu Phe Ser
305 310 315 320
Trp Ile Asp Thr Thr Ile Phe Tyr Ser Gly Val Val Asn Phe Asn Thr
325 330 335
Ala Asn Phe Lys Lys Glu Ile Leu Leu Asp Arg Ser Ala Gly Lys Lys
340 345 350
Thr Ala Phe Ser Ile Lys Leu Asp Tyr Val Lys Lys Pro Ile Pro Glu
355 360 365
Thr Ala Met Val Lys Ile Leu Glu Lys Leu Tyr Glu Glu Asp Val Gly
370 375 380
Ala Gly Met Tyr Val Leu Tyr Pro Tyr Gly Gly Ile Met Glu Glu Ile
385 390 395 400
Ser Glu Ser Ala Ile Pro Phe Pro His Arg Ala Gly Ile Met Tyr Glu
405 410 415
Leu Trp Tyr Thr Ala Ser Trp Glu Lys Gln Glu Asp Asn Glu Lys His
420 425 430
Ile Asn Trp Val Arg Ser Val Tyr Asn Phe Thr Thr Pro Tyr Val Ser
435 440 445
Gln Asn Pro Arg Leu Ala Tyr Leu Asn Tyr Arg Asp Leu Asp Leu Gly
450 455 460
Lys Thr Asn His Ala Ser Pro Asn Asn Tyr Thr Gln Ala Arg Ile Trp
465 470 475 480
Gly Glu Lys Tyr Phe Gly Lys Asn Phe Asn Arg Leu Val Lys Val Lys
485 490 495
Thr Lys Val Asp Pro Asn Asn Phe Phe Arg Asn Glu Gln Ser Ile Pro
500 505 510
Pro Leu Pro Pro His His His
515
<210> 154
<211> 1560
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(1560)
<223> 截短的四氢大麻酚酸合成酶Cs_THCASt28
<400> 154
atgtctaacc ctcgtgagaa cttcttgaaa tgtttctcca aacatatccc aaacaatgtc 60
gctaacccta agttagttta cactcaacat gatcaattat atatgtctat cttgaactct 120
accatccaaa acttgagatt catctccgat accaccccaa aaccattggt tattgttacc 180
ccatccaaca attctcatat tcaagctacc attttgtgct ccaaaaaggt cggtttgcaa 240
atccgtacta gatctggtgg tcacgatgct gaaggtatgt cttacatttc ccaagtccca 300
ttcgttgttg tcgatttaag aaatatgcac tctatcaaaa tcgacgttca ctctcaaact 360
gcttgggttg aagccggtgc cactttaggt gaggtttact actggattaa cgaaaagaat 420
gaaaacttat cctttccagg tggttactgt ccaactgttg gtgttggtgg tcacttctct 480
ggtggtggtt atggtgcctt gatgagaaac tacggtttag ctgctgataa tattatcgac 540
gctcacttgg ttaatgtcga cggtaaggtt ttggacagaa aatccatggg tgaagattta 600
ttctgggcca ttagaggtgg tggtggtgaa aacttcggta tcattgctgc ttggaaaatt 660
aaattggtcg ctgtcccatc caagtctact attttctccg tcaagaaaaa catggaaatt 720
catggtttgg ttaaattatt caacaagtgg caaaacattg cttacaaata cgacaaagac 780
ttagttttga tgacccactt cattactaaa aacattaccg acaaccatgg taaaaataaa 840
actactgttc acggttactt ctcttccatt tttcatggtg gtgtcgactc cttggtcgat 900
ttaatgaaca aatctttccc tgagttgggt atcaagaaga ccgactgtaa agaattctct 960
tggatcgaca ctactatttt ctactctggt gtcgttaact tcaacaccgc taatttcaag 1020
aaggaaattt tattagatag atccgctggt aaaaagaccg ctttctctat caaattagac 1080
tacgttaaaa aaccaatccc agaaaccgct atggtcaaaa tcttggaaaa attatatgaa 1140
gaagacgttg gtgccggtat gtacgtctta tatccatatg gtggtattat ggaagagatc 1200
tctgaatccg ctatcccttt tccacacaga gccggtatta tgtacgaatt atggtacact 1260
gcttcctggg agaaacaaga agataatgaa aagcacatta actgggttag atctgtttac 1320
aacttcacta ctccatacgt ctctcaaaac ccaagattag cctacttaaa ctaccgtgat 1380
ttggatttag gtaaaactaa tcacgcttcc ccaaacaact acacccaagc tagaatttgg 1440
ggtgagaagt actttggtaa gaacttcaac cgtttagtca aggtcaagac taaagttgat 1500
ccaaacaatt ttttcagaaa cgaacaatct atcccacctt taccaccaca ccaccattag 1560
<210> 155
<211> 545
<212> PRT
<213> Cannabis sativa
<400> 155
Met Asn Cys Ser Ala Phe Ser Phe Trp Phe Val Cys Lys Ile Ile Phe
1 5 10 15
Phe Phe Leu Ser Phe His Ile Gln Ile Ser Ile Ala Asn Pro Arg Glu
20 25 30
Asn Phe Leu Lys Cys Phe Ser Lys His Ile Pro Asn Asn Val Ala Asn
35 40 45
Pro Lys Leu Val Tyr Thr Gln His Asp Gln Leu Tyr Met Ser Ile Leu
50 55 60
Asn Ser Thr Ile Gln Asn Leu Arg Phe Ile Ser Asp Thr Thr Pro Lys
65 70 75 80
Pro Leu Val Ile Val Thr Pro Ser Asn Asn Ser His Ile Gln Ala Thr
85 90 95
Ile Leu Cys Ser Lys Lys Val Gly Leu Gln Ile Arg Thr Arg Ser Gly
100 105 110
Gly His Asp Ala Glu Gly Met Ser Tyr Ile Ser Gln Val Pro Phe Val
115 120 125
Val Val Asp Leu Arg Asn Met His Ser Ile Lys Ile Asp Val His Ser
130 135 140
Gln Thr Ala Trp Val Glu Ala Gly Ala Thr Leu Gly Glu Val Tyr Tyr
145 150 155 160
Trp Ile Asn Glu Lys Asn Glu Asn Leu Ser Phe Pro Gly Gly Tyr Cys
165 170 175
Pro Thr Val Gly Val Gly Gly His Phe Ser Gly Gly Gly Tyr Gly Ala
180 185 190
Leu Met Arg Asn Tyr Gly Leu Ala Ala Asp Asn Ile Ile Asp Ala His
195 200 205
Leu Val Asn Val Asp Gly Lys Val Leu Asp Arg Lys Ser Met Gly Glu
210 215 220
Asp Leu Phe Trp Ala Ile Arg Gly Gly Gly Gly Glu Asn Phe Gly Ile
225 230 235 240
Ile Ala Ala Trp Lys Ile Lys Leu Val Ala Val Pro Ser Lys Ser Thr
245 250 255
Ile Phe Ser Val Lys Lys Asn Met Glu Ile His Gly Leu Val Lys Leu
260 265 270
Phe Asn Lys Trp Gln Asn Ile Ala Tyr Lys Tyr Asp Lys Asp Leu Val
275 280 285
Leu Met Thr His Phe Ile Thr Lys Asn Ile Thr Asp Asn His Gly Lys
290 295 300
Asn Lys Thr Thr Val His Gly Tyr Phe Ser Ser Ile Phe His Gly Gly
305 310 315 320
Val Asp Ser Leu Val Asp Leu Met Asn Lys Ser Phe Pro Glu Leu Gly
325 330 335
Ile Lys Lys Thr Asp Cys Lys Glu Phe Ser Trp Ile Asp Thr Thr Ile
340 345 350
Phe Tyr Ser Gly Val Val Asn Phe Asn Thr Ala Asn Phe Lys Lys Glu
355 360 365
Ile Leu Leu Asp Arg Ser Ala Gly Lys Lys Thr Ala Phe Ser Ile Lys
370 375 380
Leu Asp Tyr Val Lys Lys Pro Ile Pro Glu Thr Ala Met Val Lys Ile
385 390 395 400
Leu Glu Lys Leu Tyr Glu Glu Asp Val Gly Ala Gly Met Tyr Val Leu
405 410 415
Tyr Pro Tyr Gly Gly Ile Met Glu Glu Ile Ser Glu Ser Ala Ile Pro
420 425 430
Phe Pro His Arg Ala Gly Ile Met Tyr Glu Leu Trp Tyr Thr Ala Ser
435 440 445
Trp Glu Lys Gln Glu Asp Asn Glu Lys His Ile Asn Trp Val Arg Ser
450 455 460
Val Tyr Asn Phe Thr Thr Pro Tyr Val Ser Gln Asn Pro Arg Leu Ala
465 470 475 480
Tyr Leu Asn Tyr Arg Asp Leu Asp Leu Gly Lys Thr Asn His Ala Ser
485 490 495
Pro Asn Asn Tyr Thr Gln Ala Arg Ile Trp Gly Glu Lys Tyr Phe Gly
500 505 510
Lys Asn Phe Asn Arg Leu Val Lys Val Lys Thr Lys Val Asp Pro Asn
515 520 525
Asn Phe Phe Arg Asn Glu Gln Ser Ile Pro Pro Leu Pro Pro His His
530 535 540
His
545
<210> 156
<211> 1638
<212> DNA
<213> Cannabis sativa
<400> 156
atgaattgtt ctgctttctc tttctggttc gtttgtaaga tcatcttttt cttcttatct 60
ttccatattc aaatctctat cgctaaccct cgtgagaact tcttgaaatg tttctccaaa 120
catatcccaa acaatgtcgc taaccctaag ttagtttaca ctcaacatga tcaattatat 180
atgtctatct tgaactctac catccaaaac ttgagattca tctccgatac caccccaaaa 240
ccattggtta ttgttacccc atccaacaat tctcatattc aagctaccat tttgtgctcc 300
aaaaaggtcg gtttgcaaat ccgtactaga tctggtggtc acgatgctga aggtatgtct 360
tacatttccc aagtcccatt cgttgttgtc gatttaagaa atatgcactc tatcaaaatc 420
gacgttcact ctcaaactgc ttgggttgaa gccggtgcca ctttaggtga ggtttactac 480
tggattaacg aaaagaatga aaacttatcc tttccaggtg gttactgtcc aactgttggt 540
gttggtggtc acttctctgg tggtggttat ggtgccttga tgagaaacta cggtttagct 600
gctgataata ttatcgacgc tcacttggtt aatgtcgacg gtaaggtttt ggacagaaaa 660
tccatgggtg aagatttatt ctgggccatt agaggtggtg gtggtgaaaa cttcggtatc 720
attgctgctt ggaaaattaa attggtcgct gtcccatcca agtctactat tttctccgtc 780
aagaaaaaca tggaaattca tggtttggtt aaattattca acaagtggca aaacattgct 840
tacaaatacg acaaagactt agttttgatg acccacttca ttactaaaaa cattaccgac 900
aaccatggta aaaataaaac tactgttcac ggttacttct cttccatttt tcatggtggt 960
gtcgactcct tggtcgattt aatgaacaaa tctttccctg agttgggtat caagaagacc 1020
gactgtaaag aattctcttg gatcgacact actattttct actctggtgt cgttaacttc 1080
aacaccgcta atttcaagaa ggaaatttta ttagatagat ccgctggtaa aaagaccgct 1140
ttctctatca aattagacta cgttaaaaaa ccaatcccag aaaccgctat ggtcaaaatc 1200
ttggaaaaat tatatgaaga agacgttggt gccggtatgt acgtcttata tccatatggt 1260
ggtattatgg aagagatctc tgaatccgct atcccttttc cacacagagc cggtattatg 1320
tacgaattat ggtacactgc ttcctgggag aaacaagaag ataatgaaaa gcacattaac 1380
tgggttagat ctgtttacaa cttcactact ccatacgtct ctcaaaaccc aagattagcc 1440
tacttaaact accgtgattt ggatttaggt aaaactaatc acgcttcccc aaacaactac 1500
acccaagcta gaatttgggg tgagaagtac tttggtaaga acttcaaccg tttagtcaag 1560
gtcaagacta aagttgatcc aaacaatttt ttcagaaacg aacaatctat cccaccttta 1620
ccaccacacc accattag 1638
<210> 157
<211> 1197
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(1197)
<223> 人工Erg10p: 乙酰乙酰辅酶A硫解酶核苷酸序列
<400> 157
atgtcccaaa atgtttacat tgtttctact gctagaactc ctatcggttc cttccaaggt 60
tccttatctt ccaaaactgc cgtcgaattg ggtgccgttg ccttgaaagg tgctttagct 120
aaagttccag agttagacgc ttccaaagat ttcgatgaaa ttatcttcgg taacgtttta 180
tccgctaact tgggtcaagc tccagccaga caagttgcct tggctgccgg tttgtctaat 240
cacatcgttg cttctactgt caacaaagtt tgtgcctctg ctatgaaagc tatcatttta 300
ggtgcccaat ctattaaatg tggtaatgct gacgttgttg tcgctggtgg ttgtgagtcc 360
atgaccaacg ccccttacta catgccagcc gccagagccg gtgccaaatt cggtcaaact 420
gttttggttg acggtgttga aagagatggt ttgaacgatg cctatgacgg tttggctatg 480
ggtgttcacg ctgaaaagtg tgctagagac tgggacatta ccagagaaca acaagataat 540
ttcgctattg aatcttacca aaagtcccaa aaatctcaaa aggaaggtaa gtttgacaat 600
gaaatcgttc cagttactat caagggtttt cgtggtaagc ctgatactca agtcaccaag 660
gatgaagaac cagcccgttt acacgtcgaa aagttgagat ctgccagaac cgttttccaa 720
aaagaaaacg gtaccgttac tgctgccaat gcttctccaa tcaacgatgg tgccgctgct 780
gttattttag tctctgagaa ggttttgaag gagaaaaatt tgaagccttt agccatcatt 840
aagggttggg gtgaagctgc tcaccaacca gctgatttca cttgggcccc ttctttagct 900
gtcccaaagg ctttaaaaca cgctggtatt gaagatatca actctgttga ctacttcgaa 960
ttcaatgaag ctttctctgt cgtcggtttg gtcaatacca aaatcttgaa gttggatcct 1020
tctaaggtta acgtttacgg tggtgctgtc gccttaggtc accctttagg ttgttctggt 1080
gctagagttg ttgtcacctt gttgtccatt ttacaacaag aaggtggtaa gatcggtgtt 1140
gctgctatct gtaacggtgg tggtggtgct tcttccattg tcatcgaaaa gatctag 1197
<210> 158
<211> 1191
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(1191)
<223> 人工甲羟戊酸焦磷酸脱羧酶(Sc_ERG19)核苷酸序列
<400> 158
atgactgtct acactgcctc cgttactgcc cctgtcaaca ttgccacctt gaagtattgg 60
ggtaaaagag atactaaatt gaacttacca actaactcct ccatttctgt cactttgtct 120
caagatgatt tgagaacctt gacttccgct gccaccgccc ctgaatttga gagagatact 180
ttgtggttaa atggtgaacc tcattctatt gacaacgaaa gaacccaaaa ctgtttacgt 240
gacttgagac aattgcgtaa ggaaatggaa tctaaagacg cttctttacc taccttgtct 300
caatggaaat tgcatatcgt ttctgaaaat aacttcccta ctgctgccgg tttggcttcc 360
tccgctgctg gttttgctgc tttagtttct gccatcgcca aattatatca attgccacaa 420
tccacttccg aaatctctag aatcgctaga aaaggttccg gttctgcttg tagatccttg 480
ttcggtggtt acgttgcttg ggaaatgggt aaagctgaag acggtcatga ttctatggcc 540
gttcaaattg ccgactcctc cgattggcct caaatgaaag cttgtgtctt ggttgtctcc 600
gatatcaaaa aggatgtctc ttctactcaa ggtatgcaat taactgttgc cacttccgaa 660
ttgttcaaag agcgtatcga acacgttgtt ccaaagagat ttgaagttat gagaaaagct 720
atcgtcgaaa aggacttcgc tacctttgcc aaggagacta tgatggattc taactccttc 780
cacgctactt gtttggattc ctttccacct attttctaca tgaatgacac ctccaaacgt 840
attatctctt ggtgtcacac cattaaccaa ttttatggtg aaactatcgt cgcttacact 900
ttcgatgccg gtccaaacgc tgtcttgtac tatttggctg aaaacgaatc caagttattt 960
gcttttatct ataagttgtt cggttccgtc cctggttggg acaagaaatt caccactgaa 1020
caattggaag ctttcaacca ccaattcgaa tcttccaatt tcactgctag agaattagat 1080
ttggaattac aaaaggatgt cgctagagtc atcttaactc aagttggttc cggtccacaa 1140
gaaactaacg aatctttgat tgatgctaaa actggtttgc ctaaagaata a 1191
<210> 159
<211> 867
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(867)
<223> 人工异戊烯基焦磷酸异构酶Sc_IDI1核苷酸序列
<400> 159
atgaccgctg acaacaactc catgccacat ggtgctgtct cctcctacgc taaattagtc 60
caaaaccaaa cccctgaaga cattttagaa gagttccctg aaatcattcc attgcaacaa 120
agaccaaaca ctagatcctc cgagacttct aacgatgaat ctggtgaaac ttgtttttct 180
ggtcatgatg aagaacaaat caagttgatg aacgagaatt gtattgtttt ggactgggat 240
gacaacgcta tcggtgctgg taccaaaaag gtctgtcact tgatggaaaa catcgaaaag 300
ggtttgttgc atagagcctt ttccgtcttc atcttcaacg aacaaggtga gttattattg 360
caacaaagag ccactgaaaa aatcaccttt ccagatttat ggaccaacac ctgttgctcc 420
catccattgt gtattgatga tgaattgggt ttgaaaggta agttggacga caagattaaa 480
ggtgccatca ccgccgctgt tcgtaagtta gaccatgaat tgggtatccc tgaagacgaa 540
actaagacta gaggtaaatt ccatttcttg aatcgtattc actacatggc tccttccaat 600
gaaccatggg gtgaacacga aatcgactac attttgtttt acaaaattaa tgctaaagaa 660
aatttaaccg ttaacccaaa cgtcaacgag gttagagatt tcaagtgggt ctctccaaac 720
gatttgaaga ctatgttcgc tgacccatcc tacaagttca ctccatggtt taagatcatc 780
tgtgaaaact atttgtttaa ctggtgggag caattggacg acttatctga agttgaaaat 840
gatcgtcaaa ttcaccgtat gttgtaa 867
<210> 160
<211> 1356
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(1356)
<223> 人工磷酸甲羟戊酸激酶Sc_ERG8核苷酸序列
<400> 160
atgtccgagt taagagcctt ctccgctcct ggtaaagcct tattagctgg tggttactta 60
gtcttggata ctaaatatga agccttcgtc gtcggtttat ctgccagaat gcatgccgtc 120
gcccatccat acggttcctt gcaaggttct gacaagtttg aggtccgtgt caagtctaaa 180
caattcaaag atggtgaatg gttgtatcat atttctccaa aatccggttt cattccagtt 240
tctatcggtg gttctaagaa cccattcatc gaaaaagtca tcgctaacgt tttctcttac 300
ttcaagccta atatggatga ttattgcaat agaaatttat tcgttattga tatcttctcc 360
gatgacgcct atcattccca agaagactct gttaccgagc atagaggtaa cagaagatta 420
tctttccact ctcacagaat tgaagaagtt ccaaaaactg gtttaggttc ttctgctggt 480
ttagtcaccg ttttaaccac tgccttggct tctttctttg tttccgactt agaaaataac 540
gtcgacaagt atcgtgaagt catccacaac ttggcccaag ttgctcattg tcaagctcaa 600
ggtaagattg gttccggttt cgatgttgct gccgccgcct acggttccat cagatataga 660
agattccctc cagctttgat ttctaactta ccagatattg gttctgctac ttatggttcc 720
aagttggctc acttggttga cgaagaagat tggaacatta ccatcaagtc caatcacttg 780
ccatctggtt taactttgtg gatgggtgat atcaagaacg gttctgaaac tgtcaaattg 840
gtccaaaagg tcaaaaattg gtacgattcc catatgccag agtctttgaa gatctatact 900
gaattggacc acgctaactc tcgtttcatg gatggtttgt ctaagttgga cagattgcat 960
gaaactcacg acgactactc tgaccaaatt ttcgagtcct tggaaagaaa cgactgcact 1020
tgtcaaaagt atccagaaat caccgaggtt agagatgccg ttgctactat tagaagatcc 1080
ttcagaaaga ttaccaagga atctggtgct gatattgagc ctccagttca aacttctttg 1140
ttggatgatt gccaaacttt aaaaggtgtt ttaacttgtt taattcctgg tgctggtggt 1200
tacgacgcca tcgccgttat caccaaacaa gacgtcgact taagagccca aactgccaac 1260
gacaaaagat tctccaaggt tcaatggttg gacgtcactc aagctgattg gggtgttaga 1320
aaagaaaagg acccagagac ttacttggat aaatag 1356
<210> 161
<211> 1059
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(1059)
<223> 突变的法呢基焦磷酸合成酶(Erg20mut, F96W, N127W)
<400> 161
atggcttctg agaaggagat tcgtcgtgag agattcttga atgtttttcc taaattagtc 60
gaggaattga acgcttcttt gttggcttat ggtatgccta aggaagcttg tgattggtat 120
gctcactcct tgaattataa tactccaggt ggtaaattga accgtggttt gtctgttgtt 180
gacacttacg ctattttatc taacaagacc gtcgagcaat tgggtcaaga agagtatgaa 240
aaggtcgcta ttttaggttg gtgtattgaa ttgttgcaag cttactggtt ggttgccgat 300
gacatgatgg acaagtctat tactcgtcgt ggtcaacctt gctggtataa ggtcccagag 360
gttggtgaaa ttgctatctg ggacgctttc atgttggaag ctgctatcta taaattgttg 420
aaatcccact tcagaaacga gaaatactac attgacatca ccgagttgtt ccacgaagtc 480
actttccaaa ctgagttagg tcaattaatg gacttgatca ccgctccaga agacaaagtt 540
gacttgtcca agttttcctt gaaaaagcac tctttcatcg ttactttcaa gactgcttat 600
tactctttct acttaccagt tgccttggct atgtacgtcg ccggtatcac tgacgaaaag 660
gacttgaagc aagctcgtga cgttttgatt ccattaggtg aatatttcca aatccaagat 720
gactacttag actgttttgg tacccctgaa caaatcggta agatcggtac tgatattcaa 780
gataacaagt gctcttgggt tatcaacaag gctttagagt tagcctccgc cgaacaacgt 840
aaaactttag atgaaaacta cggtaaaaaa gactctgttg ctgaggccaa gtgtaagaag 900
atttttaacg atttaaaaat cgaacaattg tatcacgaat atgaagagtc cattgctaag 960
gatttgaagg ctaaaatttc tcaagttgac gaatcccgtg gtttcaaagc tgacgttttg 1020
actgcttttt taaacaaggt ttacaagcgt tccaaataa 1059
<210> 162
<211> 1158
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(1158)
<223> 人工四酮体合成酶(TKS)核苷酸序列
<400> 162
atgaaccatt taagagctga gggtccagct tccgtcttgg ctatcggtac tgctaatcca 60
gagaacattt tattacaaga tgagtttcca gattactatt tccgtgttac taagtccgag 120
catatgaccc aattgaaaga aaagttccgt aaaatctgtg ataaatctat gattagaaaa 180
agaaactgct ttttaaacga agaacacttg aagcaaaacc caagattagt tgaacacgag 240
atgcaaacct tggacgctag acaagatatg ttggttgtcg aggttcctaa attgggtaaa 300
gacgcctgtg ctaaagctat caaagagtgg ggtcaaccta agtccaagat cactcactta 360
atcttcactt ccgcttccac cactgacatg cctggtgctg attaccactg tgccaagttg 420
ttgggtttgt ctccttctgt caagagagtt atgatgtacc aattaggttg ttacggtggt 480
ggtactgtct taagaattgc taaggacatc gctgaaaaca acaaaggtgc tagagtttta 540
gccgtttgtt gtgacatcat ggcttgttta tttcgtggtc catctgaatc tgacttggag 600
ttgttggttg gtcaagctat ttttggtgat ggtgccgctg ccgtcatcgt tggtgctgag 660
ccagatgaat ccgttggtga aagaccaatt ttcgaattag tctctactgg tcaaactatt 720
ttgccaaact ccgagggtac tatcggtggt catattcgtg aagccggttt aatctttgat 780
ttgcacaaag acgttccaat gttgatctct aacaacatcg aaaagtgttt aattgaggct 840
tttactccaa ttggtatctc tgactggaac tctatcttct ggatcactca tccaggtggt 900
aaggctatct tggacaaggt tgaagaaaaa ttacatttaa agtccgataa attcgtcgat 960
tctcgtcatg ttttgtctga acacggtaac atgtcttcct ccactgtctt gtttgttatg 1020
gatgaattac gtaagagatc tttggaggag ggtaagtcta ctactggtga tggtttcgaa 1080
tggggtgttt tgttcggttt cggtcctggt ttgactgttg aacgtgttgt tgttagatct 1140
gttccaatta agtactag 1158
<210> 163
<211> 306
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(306)
<223> 人工橄榄醇酸环化酶(OAC)核苷酸序列
<400> 163
atggccgtca aacacttgat cgtcttaaaa ttcaaggatg aaattactga agctcaaaaa 60
gaagagttct tcaaaaccta tgtcaattta gtcaacatta ttcctgctat gaaggacgtt 120
tactggggta aggatgtcac ccaaaagaac aaggaagaag gttacactca cattgttgaa 180
gtcactttcg aatctgttga aactatccaa gattatatta tccacccagc tcatgtcggt 240
tttggtgatg tttacagatc tttttgggaa aaattgttga tctttgacta tactccaaga 300
aaataa 306
<210> 164
<211> 2163
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(2163)
<223> 人工酰基活化酶Cs_AAE1_v1核苷酸序列
<400> 164
atgggtaaga attacaagtc cttagactct gttgttgctt ctgactttat tgctttaggt 60
attacttccg aagttgctga aaccttacac ggtagattgg ctgaaattgt ttgcaactac 120
ggtgctgcta cccctcaaac ttggattaac attgctaatc atattttgtc tccagatttg 180
ccattttctt tacaccaaat gttgttctac ggttgttaca aggatttcgg tcctgctcct 240
ccagcttgga ttcctgatcc agaaaaagtc aaatctacta acttgggtgc tttgttggaa 300
aagagaggta aggagttttt gggtgttaag tacaaggacc caatttcttc tttctctcac 360
ttccaagaat tctctgttag aaaccctgaa gtttactgga gaactgtttt gatggatgag 420
atgaagattt ctttttctaa ggacccagag tgtatcttaa gaagagacga cattaacaat 480
ccaggtggtt ctgagtggtt accaggtggt tacttgaact ctgccaaaaa ttgcttgaac 540
gttaactcta acaagaaatt gaatgacact atgattgtct ggagagatga gggtaacgat 600
gatttgcctt tgaataaatt gactttggat caattgagaa aaagagtctg gttggttggt 660
tacgctttgg aagaaatggg tttagaaaaa ggttgtgcta tcgccatcga tatgcctatg 720
cacgttgatg ctgttgttat ttatttggct attgttttag ctggttatgt tgttgtttcc 780
atcgccgact ccttctctgc tccagaaatc tccaccagat tgagattgtc taaagccaaa 840
gccattttca cccaagacca catcattaga ggtaagaagc gtattccatt gtattctcgt 900
gttgttgaag ctaaatctcc tatggctatc gtcatcccat gctctggttc taacatcggt 960
gctgaattaa gagacggtga tatttcttgg gactactttt tagaaagagc taaagaattc 1020
aaaaactgcg agtttactgc tagagaacaa cctgtcgacg cttatactaa tattttattc 1080
tcttctggta ctactggtga acctaaggct attccatgga cccaagctac tcctttgaaa 1140
gccgctgctg atggttggtc ccatttagac atcagaaaag gtgatgtcat cgtctggcca 1200
actaacttag gttggatgat gggtccatgg ttagtctacg cttctttgtt gaatggtgcc 1260
tctatcgcct tatataatgg ttccccttta gtctctggtt ttgctaaatt cgttcaagat 1320
gctaaggtta ccatgttagg tgttgtccct tctatcgtta gatcttggaa atctactaac 1380
tgtgtttctg gttacgactg gtccactatt cgttgtttct cttcttctgg tgaagcttcc 1440
aatgtcgatg agtacttatg gttaatgggt cgtgctaact acaagccagt catcgaaatg 1500
tgcggtggta ctgaaattgg tggtgctttt tccgctggtt cttttttaca agcccaatcc 1560
ttgtcttcct tctcctctca atgtatgggt tgtactttat atatcttaga taagaatggt 1620
taccctatgc ctaaaaacaa gccaggtatt ggtgaattag ctttgggtcc tgttatgttt 1680
ggtgcttcta aaaccttgtt aaatggtaat catcacgacg tttacttcaa aggtatgcct 1740
actttgaacg gtgaggtttt gagacgtcat ggtgatattt tcgaattaac ttccaacggt 1800
tattatcacg ctcacggtag agctgatgat actatgaaca ttggtggtat taagatctct 1860
tccatcgaaa ttgagagagt ttgtaacgag gttgacgatc gtgttttcga aactactgct 1920
attggtgtcc ctcctttagg tggtggtcca gaacaattgg ttatcttttt cgtcttgaag 1980
gactccaacg acaccactat cgacttaaac caattaagat tgtctttcaa cttgggtttg 2040
caaaagaagt tgaatccatt atttaaggtt actcgtgtcg ttccattgtc ctccttgcca 2100
agaactgcta ccaacaagat tatgcgtaga gtcttgagac aacaattctc tcactttgag 2160
taa 2163
<210> 165
<211> 2163
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(2163)
<223> 人工酰基活化酶Cs_AAE1_v2核苷酸序列
<400> 165
atgggtaaga actacaaatc cttagattcc gtcgtcgctt ctgatttcat cgctttgggt 60
attacttctg aagttgctga aaccttgcat ggtagattgg ctgaaattgt ctgtaactac 120
ggtgctgcta ccccacaaac ttggatcaac attgctaacc acatcttatc ccctgacttg 180
ccattctcct tacaccaaat gttgttctac ggttgttata aagatttcgg tccagctcct 240
cctgcttgga ttcctgaccc agagaaggtt aagtctacta atttaggtgc tttgttagag 300
aagagaggta aggaattttt aggtgttaag tataaagatc caatttcttc cttctctcac 360
ttccaagaat tttctgttag aaacccagaa gtttactgga gaactgtttt gatggatgaa 420
atgaagatct ctttttccaa ggacccagag tgtattttga gacgtgatga catcaacaat 480
ccaggtggtt ctgagtggtt accaggtggt tacttgaact ctgccaagaa ttgtttgaac 540
gttaactcta acaaaaagtt gaacgatacc atgattgttt ggagagacga aggtaacgat 600
gatttgccat tgaataagtt aaccttggat caattgagaa aaagagtctg gttagtcggt 660
tacgctttgg aagagatggg tttggaaaag ggttgtgcta tcgccatcga tatgccaatg 720
catgttgatg ctgttgttat ctatttggcc attgttttgg ctggttacgt tgttgtttcc 780
atcgctgact ccttctctgc tccagaaatt tctactagat taagattgtc taaagccaaa 840
gccattttca ctcaagacca tattattaga ggtaagaaaa gaattccatt gtattccaga 900
gttgttgaag ctaaatcccc aatggccatc gtcatcccat gctctggttc taatattggt 960
gccgaattga gagacggtga tatctcttgg gactactttt tggagcgtgc taaagaattt 1020
aaaaactgcg aattcaccgc cagagaacaa ccagttgacg cctacactaa cattttgttt 1080
tcttctggta ctactggtga acctaaggct attccatgga ctcaagctac tccattgaaa 1140
gccgccgccg atggttggtc ccacttagat attagaaagg gtgatgtcat cgtctggcct 1200
actaacttgg gttggatgat gggtccttgg ttggtttacg cttccttatt gaacggtgcc 1260
tctatcgctt tatataatgg ttccccttta gtttctggtt ttgctaaatt cgttcaagat 1320
gctaaggtta ctatgttggg tgtcgtccca tccattgtcc gttcctggaa gtctaccaat 1380
tgtgtttctg gttatgattg gtctactatt cgttgttttt cttcctctgg tgaagcttct 1440
aatgtcgatg aatatttgtg gttaatgggt agagctaact acaagccagt tattgaaatg 1500
tgtggtggta ctgaaattgg tggtgctttc tctgctggtt cctttttgca agctcaatcc 1560
ttgtcttctt tctcctccca atgtatgggt tgcactttat acatcttgga caagaatggt 1620
taccctatgc caaagaataa accaggtatt ggtgaattgg ctttgggtcc agtcatgttc 1680
ggtgcttcta agactttgtt gaacggtaac catcatgacg tctacttcaa gggtatgcct 1740
accttgaacg gtgaagtttt aagacgtcac ggtgacattt tcgaattgac ttccaacggt 1800
tattatcatg ctcacggtag agctgacgac actatgaaca tcggtggtat taagatctct 1860
tctatcgaaa ttgaaagagt ttgcaacgag gttgatgatc gtgtcttcga aaccactgct 1920
attggtgtcc ctcctttagg tggtggtcct gagcaattgg ttattttctt tgtcttaaag 1980
gattctaacg acaccactat tgacttaaat caattgagat tgtccttcaa tttgggtttg 2040
caaaagaagt tgaacccatt attcaaggtt actcgtgtcg ttcctttgtc ctctttgcca 2100
agaaccgcta ccaataaaat tatgagacgt gttttgcgtc aacaattctc tcactttgaa 2160
taa 2163
<210> 166
<211> 1602
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(1602)
<223> 人工酰基活化酶Cs_AAE3核苷酸序列
<400> 166
atggaaaaat ctggttatgg tagagacggt atctacagat ccttgcgtcc tccattacac 60
ttgccaaaca ataataactt atctatggtt tcctttttgt tccgtaactc ttcctcttac 120
ccacaaaaac ctgctttgat tgactccgaa accaatcaaa tcttgtcctt ttcccacttc 180
aaatctactg tcattaaagt ctctcacggt ttcttgaact taggtattaa gaagaacgac 240
tggttgatct acgctcctaa ttccatccac tttccagttt gtttcttggg tatcattgct 300
tctggtgcca ttgctaccac ttctaaccct ttatacactg tttctgagtt atctaagcaa 360
gttaaagatt ctaacccaaa attgattatc actgtcccac aattattaga aaaggtcaag 420
ggtttcaatt taccaaccat tttaatcggt ccagactccg aacaagagtc ttcttccgat 480
aaagttatga cttttaacga cttagttaac ttgggtggtt cttctggttc tgagttccca 540
atcgtcgatg atttcaagca atctgacacc gccgctttat tgtattcctc tggtactact 600
ggtatgtcta agggttggtt gactcacaaa aactttatcg cttcctcttt gatggttacc 660
atggaacaag acttggttgg tgaaatggat aacgtcttct tgtgtttttt accaatgttc 720
catgttttcg gtttagctat cattacttac gctcaattac aaagaggtaa cactgtcatc 780
tctgctcgtt ttgacttaga aaagatgttg aaagacgttg aaaagtacgt tactcacttg 840
tggtggcctc ctgttatttt agctttgtct aagaattcta tggttaaatt caacttgtcc 900
tctatcaagt acattggttc tggtgccgct ccattaggta aggacttgat ggaagaatgt 960
tctaaatggc cttacggtat cgtcgctcaa ggttacggta tgactgaaac ttgtggtatc 1020
gtttctatgg aagacatcag aggtggtaag cgtaactccg gttctgctgg tatgttggct 1080
tccggtgttg aagcccaaat tgtttctgtc gatactttga aacctttgcc acctaaccaa 1140
ttaggtgaaa tttgggttaa aggtcctaac atgatgcaag gttacttcaa taaccctcaa 1200
gctactaagt taactattga taagaagggt tgggttcata ctggtgattt gggttacttc 1260
gatgaagatg gtcatttgta ctgggataga atcaaagaat taattaagta taaaggtttc 1320
caagttgccc cagctgaatt ggaaggtttg ttggtttctc atcctgaaat tttagatgct 1380
tggattcctt tcccagacgc tgaagccggt gaagttccag ttgcttactg gagatcccct 1440
aactcttcct tgactgaaaa cgacgtcaag aagttcatcg ctggtcaagt tgcttccttt 1500
aagagattaa gaaaagtcac cttcatcaac tccgttccaa agtctgcttc cggtaagatt 1560
ttgagaagag aattaatcca aaaggttcgt tccaacatgt ag 1602
<210> 167
<211> 1635
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(1635)
<223> 人工大麻二酚酸合成酶(CBDAS)核苷酸序列
<400> 167
atgaaatgtt ccaccttttc tttctggttt gtttgtaaga tcatcttctt cttcttctcc 60
ttcaacatcc aaacttccat cgctaatcca agagagaatt tcttaaagtg tttttctcaa 120
tacatcccaa acaatgctac taacttaaag ttggtttaca ctcaaaataa cccattgtac 180
atgtctgtct tgaactctac cattcacaat ttgcgtttta cttctgacac cacccctaag 240
ccattagtta ttgttacccc atcccacgtc tctcacatcc aaggtactat tttgtgttct 300
aaaaaggttg gtttgcaaat tagaactaga tctggtggtc acgactccga gggtatgtct 360
tacatctctc aagttccatt cgttattgtc gacttgcgta acatgcgttc catcaaaatc 420
gatgttcact cccaaactgc ttgggtcgaa gccggtgcca ctttaggtga ggtttattac 480
tgggtcaatg agaagaatga gaatttgtcc ttggctgctg gttattgtcc aaccgtctgt 540
gctggtggtc attttggtgg tggtggttac ggtccattaa tgagaaacta tggtttggct 600
gccgataaca ttatcgacgc tcacttggtt aatgtccacg gtaaggtctt agatagaaaa 660
tccatgggtg aggacttgtt ctgggctttg agaggtggtg gtgctgagtc ctttggtatc 720
atcgttgctt ggaaaattcg tttagttgct gtcccaaaat ctactatgtt ttctgttaag 780
aagatcatgg aaattcacga gttggttaag ttggttaata agtggcaaaa tattgcctac 840
aagtatgaca aagacttgtt attgatgact cacttcatca ctagaaacat caccgataac 900
caaggtaaaa ataaaactgc tatccatacc tacttctcct ccgttttctt gggtggtgtc 960
gactccttag ttgatttgat gaacaaatct tttcctgaat taggtatcaa gaagactgat 1020
tgtcgtcaat tgtcctggat tgataccatt atcttttact ctggtgtcgt caattacgac 1080
accgataatt tcaataagga aattttattg gacagatctg ccggtcaaaa cggtgctttc 1140
aagatcaagt tggactacgt taaaaaacca atcccagaat ccgtctttgt ccaaattttg 1200
gagaagttat acgaggaaga catcggtgct ggtatgtatg ccttatatcc atacggtggt 1260
attatggatg aaatttccga atctgctatc ccatttccac atcgtgctgg tattttgtat 1320
gaattatggt acatttgttc ctgggaaaag caagaagata acgagaagca cttgaattgg 1380
atcagaaata tctacaattt catgactcct tacgtttcta agaatcctcg tttggcttac 1440
ttgaactaca gagatttgga catcggtatt aatgacccaa agaacccaaa taactatact 1500
caagctagaa tttggggtga aaagtacttc ggtaaaaact ttgacagatt ggttaaggtt 1560
aagactttag ttgatccaaa taacttcttc agaaatgaac aatccatccc accattgcct 1620
agacacagac actaa 1635
<210> 168
<211> 2235
<212> DNA
<213> Saccharomyces sp.
<400> 168
atggccgctc cagattatgc acttaccgat ttaattgaat cggatcctcg tttcgaaagt 60
ttgaagacaa gattagccgg ttacaccaaa ggctctgatg aatatattga agagctatac 120
tctcaattac cactgaccag ctaccccagg tacaaaacat ttttaaagaa acaggcggtt 180
gccatttcga atccggataa tgaagctggt tttagctcga tttataggag ttctctttct 240
tctgaaaatc tagtgagctg tgtggataaa aacttaagaa ctgcatacga tcacttcatg 300
ttttctgcaa ggagatggcc tcaacgtgac tgtttaggtt caaggccaat tgataaagcc 360
acaggcacct gggaggaaac attccgtttc gagtcgtact ccacggtatc taaaagatgt 420
cataatatcg gaagtggtat attgtctttg gtaaacacga aaaggaaacg tcctttggaa 480
gccaatgatt ttgttgttgc tatcttatca cacaacaacc ctgaatggat cctaacagat 540
ttggcctgtc aggcctattc tctaactaac acggctttgt acgaaacatt aggtccaaac 600
acctccgagt acatattgaa tttaaccgag gcccccattc tgatttttgc aaaatcaaat 660
atgtatcatg tattgaagat ggtgcctgat atgaaatttg ttaatacttt ggtttgtatg 720
gatgaattaa ctcatgacga gctccgtatg ctaaatgaat cgttgctacc cgttaagtgc 780
aactctctca atgaaaaaat cacatttttt tcattggagc aggtagaaca agttggttgc 840
tttaacaaaa ttcctgcaat tccacctacc ccagattcct tgtatactat ttcgtttact 900
tctggtacta caggtttacc taaaggtgtg gaaatgtctc acagaaacat tgcgtctggg 960
atagcatttg ctttttctac cttcagaata ccgccagata aaagaaacca acagttatat 1020
gatatgtgtt ttttgccatt ggctcatatt tttgaaagaa tggttattgc gtatgatcta 1080
gccatcgggt ttggaatagg cttcttacat aaaccagacc caactgtatt ggtagaggat 1140
ttgaagattt tgaaacctta cgcggttgcc ctggttccta gaatattaac acggtttgaa 1200
gccggtataa aaaatgcttt ggataaatcg actgtccaga ggaacgtagc aaatactata 1260
ttggattcta aatcggccag atttaccgca agaggtggtc cagataaatc gattatgaat 1320
tttctagttt atcatcgcgt attgattgat aaaatcagag actctttagg tttgtccaat 1380
aactcgttta taattaccgg atcagctccc atatctaaag ataccttact atttttaaga 1440
agcgccttgg atattggtat aagacagggc tacggcttaa ctgaaacttt tgctggtgtc 1500
tgtttaagcg aaccgtttga aaaagatgtc ggatcttgtg gtgccatagg tatttctgca 1560
gaatgtagat tgaagtctgt tccagaaatg ggttaccatg ccgacaagga tttaaaaggt 1620
gaactgcaaa ttcgtggccc acaggttttt gaaagatatt ttaaaaatcc gaatgaaact 1680
tcaaaagccg ttgaccaaga tggttggttt tccacgggag atgttgcatt tatcgatgca 1740
aaaggtcgca tcagcgtcat tgatcgagtc aagaactttt tcaagctagc acatggtgaa 1800
tatattgctc cagagaaaat cgaaaatatt tatttatcat catgccccta tatcacgcaa 1860
atatttgtct ttggagatcc tttgaagaca tttttagttg gcatcgttgg tgttgatgtt 1920
gatgcagcgc aaccgatttt agctgcaaag cacccagagg tgaaaacgtg gactaaggaa 1980
gtgctagtag aaaacttaaa tcgtaataaa aagctaagga aggaattttt aaacaaaatt 2040
aataaatgca tcgatgggct acaaggattt gaaaaattgc acaacatcaa agtcggactt 2100
gagcctttga ctctcgagga tgatgttgtg acgccaactt ttaaaataaa gcgtgccaaa 2160
gcatcaaaat tcttcaaaga tacattagac caactatacg ccgaaggttc actagtcaag 2220
acagaaaagc tttag 2235
<210> 169
<211> 744
<212> PRT
<213> Saccharomyces sp.
<400> 169
Met Ala Ala Pro Asp Tyr Ala Leu Thr Asp Leu Ile Glu Ser Asp Pro
1 5 10 15
Arg Phe Glu Ser Leu Lys Thr Arg Leu Ala Gly Tyr Thr Lys Gly Ser
20 25 30
Asp Glu Tyr Ile Glu Glu Leu Tyr Ser Gln Leu Pro Leu Thr Ser Tyr
35 40 45
Pro Arg Tyr Lys Thr Phe Leu Lys Lys Gln Ala Val Ala Ile Ser Asn
50 55 60
Pro Asp Asn Glu Ala Gly Phe Ser Ser Ile Tyr Arg Ser Ser Leu Ser
65 70 75 80
Ser Glu Asn Leu Val Ser Cys Val Asp Lys Asn Leu Arg Thr Ala Tyr
85 90 95
Asp His Phe Met Phe Ser Ala Arg Arg Trp Pro Gln Arg Asp Cys Leu
100 105 110
Gly Ser Arg Pro Ile Asp Lys Ala Thr Gly Thr Trp Glu Glu Thr Phe
115 120 125
Arg Phe Glu Ser Tyr Ser Thr Val Ser Lys Arg Cys His Asn Ile Gly
130 135 140
Ser Gly Ile Leu Ser Leu Val Asn Thr Lys Arg Lys Arg Pro Leu Glu
145 150 155 160
Ala Asn Asp Phe Val Val Ala Ile Leu Ser His Asn Asn Pro Glu Trp
165 170 175
Ile Leu Thr Asp Leu Ala Cys Gln Ala Tyr Ser Leu Thr Asn Thr Ala
180 185 190
Leu Tyr Glu Thr Leu Gly Pro Asn Thr Ser Glu Tyr Ile Leu Asn Leu
195 200 205
Thr Glu Ala Pro Ile Leu Ile Phe Ala Lys Ser Asn Met Tyr His Val
210 215 220
Leu Lys Met Val Pro Asp Met Lys Phe Val Asn Thr Leu Val Cys Met
225 230 235 240
Asp Glu Leu Thr His Asp Glu Leu Arg Met Leu Asn Glu Ser Leu Leu
245 250 255
Pro Val Lys Cys Asn Ser Leu Asn Glu Lys Ile Thr Phe Phe Ser Leu
260 265 270
Glu Gln Val Glu Gln Val Gly Cys Phe Asn Lys Ile Pro Ala Ile Pro
275 280 285
Pro Thr Pro Asp Ser Leu Tyr Thr Ile Ser Phe Thr Ser Gly Thr Thr
290 295 300
Gly Leu Pro Lys Gly Val Glu Met Ser His Arg Asn Ile Ala Ser Gly
305 310 315 320
Ile Ala Phe Ala Phe Ser Thr Phe Arg Ile Pro Pro Asp Lys Arg Asn
325 330 335
Gln Gln Leu Tyr Asp Met Cys Phe Leu Pro Leu Ala His Ile Phe Glu
340 345 350
Arg Met Val Ile Ala Tyr Asp Leu Ala Ile Gly Phe Gly Ile Gly Phe
355 360 365
Leu His Lys Pro Asp Pro Thr Val Leu Val Glu Asp Leu Lys Ile Leu
370 375 380
Lys Pro Tyr Ala Val Ala Leu Val Pro Arg Ile Leu Thr Arg Phe Glu
385 390 395 400
Ala Gly Ile Lys Asn Ala Leu Asp Lys Ser Thr Val Gln Arg Asn Val
405 410 415
Ala Asn Thr Ile Leu Asp Ser Lys Ser Ala Arg Phe Thr Ala Arg Gly
420 425 430
Gly Pro Asp Lys Ser Ile Met Asn Phe Leu Val Tyr His Arg Val Leu
435 440 445
Ile Asp Lys Ile Arg Asp Ser Leu Gly Leu Ser Asn Asn Ser Phe Ile
450 455 460
Ile Thr Gly Ser Ala Pro Ile Ser Lys Asp Thr Leu Leu Phe Leu Arg
465 470 475 480
Ser Ala Leu Asp Ile Gly Ile Arg Gln Gly Tyr Gly Leu Thr Glu Thr
485 490 495
Phe Ala Gly Val Cys Leu Ser Glu Pro Phe Glu Lys Asp Val Gly Ser
500 505 510
Cys Gly Ala Ile Gly Ile Ser Ala Glu Cys Arg Leu Lys Ser Val Pro
515 520 525
Glu Met Gly Tyr His Ala Asp Lys Asp Leu Lys Gly Glu Leu Gln Ile
530 535 540
Arg Gly Pro Gln Val Phe Glu Arg Tyr Phe Lys Asn Pro Asn Glu Thr
545 550 555 560
Ser Lys Ala Val Asp Gln Asp Gly Trp Phe Ser Thr Gly Asp Val Ala
565 570 575
Phe Ile Asp Ala Lys Gly Arg Ile Ser Val Ile Asp Arg Val Lys Asn
580 585 590
Phe Phe Lys Leu Ala His Gly Glu Tyr Ile Ala Pro Glu Lys Ile Glu
595 600 605
Asn Ile Tyr Leu Ser Ser Cys Pro Tyr Ile Thr Gln Ile Phe Val Phe
610 615 620
Gly Asp Pro Leu Lys Thr Phe Leu Val Gly Ile Val Gly Val Asp Val
625 630 635 640
Asp Ala Ala Gln Pro Ile Leu Ala Ala Lys His Pro Glu Val Lys Thr
645 650 655
Trp Thr Lys Glu Val Leu Val Glu Asn Leu Asn Arg Asn Lys Lys Leu
660 665 670
Arg Lys Glu Phe Leu Asn Lys Ile Asn Lys Cys Ile Asp Gly Leu Gln
675 680 685
Gly Phe Glu Lys Leu His Asn Ile Lys Val Gly Leu Glu Pro Leu Thr
690 695 700
Leu Glu Asp Asp Val Val Thr Pro Thr Phe Lys Ile Lys Arg Ala Lys
705 710 715 720
Ala Ser Lys Phe Phe Lys Asp Thr Leu Asp Gln Leu Tyr Ala Glu Gly
725 730 735
Ser Leu Val Lys Thr Glu Lys Leu
740
<210> 170
<211> 1113
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(1113)
<223> MBP标签
<400> 170
atgaaaatcg aagagggtaa attggtcatc tggatcaatg gtgacaaagg ttacaacggt 60
ttggctgaag tcggtaaaaa attcgagaaa gacactggta ttaaggttac cgtcgaacac 120
ccagataagt tggaagaaaa atttccacaa gttgccgcta ctggtgatgg tccagacatc 180
attttctggg cccacgacag atttggtggt tatgctcaat ctggtttgtt agccgagatc 240
accccagaca aagcctttca agataaatta tacccattta cctgggatgc tgtccgttac 300
aacggtaagt tgatcgctta cccaatcgcc gttgaagctt tgtctttaat ctacaataaa 360
gacttattgc caaaccctcc aaagacctgg gaagaaattc ctgccttgga taaggaatta 420
aaggctaaag gtaaatctgc cttaatgttc aacttacaag agccttactt tacttggcca 480
ttgattgctg ctgatggtgg ttatgctttt aagtacgaaa atggtaaata cgacattaaa 540
gatgttggtg ttgacaatgc cggtgctaaa gccggtttaa ctttcttagt cgacttgatc 600
aagaacaagc acatgaatgc tgacactgat tattctatcg ctgaagccgc cttcaacaag 660
ggtgaaactg ctatgactat caatggtcct tgggcctggt ctaatattga cacctccaaa 720
gtcaactacg gtgttactgt cttaccaact ttcaaaggtc aaccttccaa gccatttgtc 780
ggtgttttgt ctgctggtat taacgctgcc tctccaaaca aagaattggc caaggaattt 840
ttggaaaact acttgttgac tgacgaaggt ttagaggctg ttaacaaaga caaaccattg 900
ggtgctgtcg ccttgaaatc ctacgaagaa gaattagcca aggatccaag aatcgccgct 960
accatggaaa atgctcaaaa aggtgaaatt atgccaaaca ttccacaaat gtccgctttt 1020
tggtacgctg ttagaactgc tgttattaat gctgcttctg gtagacaaac tgtcgatgaa 1080
gctttgaagg acgctcaaac cagaatcact aag 1113
<210> 171
<211> 36
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(36)
<223> GS12接头
<400> 171
ggaggtggag gaggtggttc cggaggaggt ggttct 36
<210> 172
<211> 12
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(12)
<223> GS12接头
<400> 172
Gly Gly Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser
1 5 10
<210> 173
<211> 174
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(174)
<223> GB1标签
<400> 173
atgtctgaca cttacaagtt gatcttgaac ggtaagactt tgaaaggtga aactactacc 60
gaagctgttg atgctgccac tgctgaaaag gtttttaagc aatacgccaa tgataacggt 120
gtcgacggtg aatggactta cgatgatgcc actaagactt ttaccgttac tgaa 174
<210> 174
<211> 58
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(58)
<223> GB1标签
<400> 174
Met Ser Asp Thr Tyr Lys Leu Ile Leu Asn Gly Lys Thr Leu Lys Gly
1 5 10 15
Glu Thr Thr Thr Glu Ala Val Asp Ala Ala Thr Ala Glu Lys Val Phe
20 25 30
Lys Gln Tyr Ala Asn Asp Asn Gly Val Asp Gly Glu Trp Thr Tyr Asp
35 40 45
Asp Ala Thr Lys Thr Phe Thr Val Thr Glu
50 55
<210> 175
<211> 57
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(57)
<223> MFα1_1-19
<400> 175
atgagatttc cttcaatttt tactgcagtt ttattcgcag catcctccgc attagct 57
<210> 176
<211> 19
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(19)
<223> MFα1_1-19
<400> 176
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala
<210> 177
<211> 267
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(267)
<223> MFα1_1-89
<400> 177
atgagatttc cttcaatttt tactgcagtt ttattcgcag catcctccgc attagctgct 60
ccagtcaaca ctacaacaga agatgaaacg gcacaaattc cggctgaagc tgtcatcggt 120
tacttagatt tagaagggga tttcgatgtt gctgttttgc cattttccaa cagcacaaat 180
aacgggttat tgtttataaa tactactatt gccagcattg ctgctaaaga agaaggggta 240
tctttggata aaagagaggc tgaagct 267
<210> 178
<211> 89
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(89)
<223> MFα1_1-89
<400> 178
Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser
1 5 10 15
Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln
20 25 30
Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Asp Leu Glu Gly Asp Phe
35 40 45
Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu
50 55 60
Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val
65 70 75 80
Ser Leu Asp Lys Arg Glu Ala Glu Ala
85
<210> 179
<211> 714
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(714)
<223> DasherGFP
<400> 179
atgaccgcac taacagaagg agctaaacta ttcgaaaagg agattcctta cattacagaa 60
ttagagggtg atgtcgaagg aatgaaattc attatcaagg gcgagggtac tggtgacgct 120
actaccggta cgattaaagc aaagtacatc tgtacaacag gtgaccttcc tgttccgtgg 180
gctactctgg tgagcacttt gtcttatgga gttcaatgtt ttgctaaata cccttcgcac 240
attaaagact ttttcaaaag tgcaatgcct gagggctata ctcaggagag aacaatatct 300
ttcgaaggag atggtgtgta taagactagg gctatggtca cgtatgaaag aggatccatc 360
tacaatagag taactttaac tggtgaaaac ttcaaaaagg acggtcacat ccttagaaag 420
aatgttgcct ttcaatgccc accatccatc ttgtacattt tgccagacac agttaacaat 480
ggtatcagag ttgagtttaa ccaagcttat gacatagagg gtgtcaccga aaagttggtt 540
acaaaatgtt cacagatgaa tcgtcccctg gcaggatcag ctgccgtcca tatcccacgt 600
taccatcata tcacttatca taccaagctg tccaaagatc gtgatgagag aagggatcac 660
atgtgtttgg ttgaagtggt aaaggccgtg gatttggata cttaccaagg ttga 714
<210> 180
<211> 237
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(237)
<223> DasherGFP
<400> 180
Met Thr Ala Leu Thr Glu Gly Ala Lys Leu Phe Glu Lys Glu Ile Pro
1 5 10 15
Tyr Ile Thr Glu Leu Glu Gly Asp Val Glu Gly Met Lys Phe Ile Ile
20 25 30
Lys Gly Glu Gly Thr Gly Asp Ala Thr Thr Gly Thr Ile Lys Ala Lys
35 40 45
Tyr Ile Cys Thr Thr Gly Asp Leu Pro Val Pro Trp Ala Thr Leu Val
50 55 60
Ser Thr Leu Ser Tyr Gly Val Gln Cys Phe Ala Lys Tyr Pro Ser His
65 70 75 80
Ile Lys Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Thr Gln Glu
85 90 95
Arg Thr Ile Ser Phe Glu Gly Asp Gly Val Tyr Lys Thr Arg Ala Met
100 105 110
Val Thr Tyr Glu Arg Gly Ser Ile Tyr Asn Arg Val Thr Leu Thr Gly
115 120 125
Glu Asn Phe Lys Lys Asp Gly His Ile Leu Arg Lys Asn Val Ala Phe
130 135 140
Gln Cys Pro Pro Ser Ile Leu Tyr Ile Leu Pro Asp Thr Val Asn Asn
145 150 155 160
Gly Ile Arg Val Glu Phe Asn Gln Ala Tyr Asp Ile Glu Gly Val Thr
165 170 175
Glu Lys Leu Val Thr Lys Cys Ser Gln Met Asn Arg Pro Leu Ala Gly
180 185 190
Ser Ala Ala Val His Ile Pro Arg Tyr His His Ile Thr Tyr His Thr
195 200 205
Lys Leu Ser Lys Asp Arg Asp Glu Arg Arg Asp His Met Cys Leu Val
210 215 220
Glu Val Val Lys Ala Val Asp Leu Asp Thr Tyr Gln Gly
225 230 235
<210> 181
<211> 87
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(87)
<223> ER1标签
<400> 181
atattagagc aacctctgaa atttgtgctt actgcggccg tcgtgctctt gacgacgtcg 60
gttctttgtt gtgtagtatt tacataa 87
<210> 182
<211> 28
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(28)
<223> ER1标签
<400> 182
Ile Leu Glu Gln Pro Leu Lys Phe Val Leu Thr Ala Ala Val Val Leu
1 5 10 15
Leu Thr Thr Ser Val Leu Cys Cys Val Val Phe Thr
20 25
<210> 183
<211> 96
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(96)
<223> ER2标签
<400> 183
tctacctctg aaaaccaaag taaaggtagt ggtacattgg ttgtcatatt ggccatttta 60
atgctaggtg ttgcttatta tttgttgaac gaataa 96
<210> 184
<211> 31
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(31)
<223> ER2标签
<400> 184
Ser Thr Ser Glu Asn Gln Ser Lys Gly Ser Gly Thr Leu Val Val Ile
1 5 10 15
Leu Ala Ile Leu Met Leu Gly Val Ala Tyr Tyr Leu Leu Asn Glu
20 25 30
<210> 185
<211> 99
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(99)
<223> PM1标签
<400> 185
tggtacaagg atctaaaaat gaagatgtgt ctggctttag taatcatcat attgcttgtt 60
gtaatcatcg tccccattgc tgttcacttt agtcgataa 99
<210> 186
<211> 32
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(32)
<223> PM1标签
<400> 186
Trp Tyr Lys Asp Leu Lys Met Lys Met Cys Leu Ala Leu Val Ile Ile
1 5 10 15
Ile Leu Leu Val Val Ile Ile Val Pro Ile Ala Val His Phe Ser Arg
20 25 30
<210> 187
<211> 108
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(108)
<223> VC1标签
<400> 187
aatataaaag aaataatgtg gtggcagaag gtcaaaaata ttacgttatt aactttcact 60
attatactat ttgtaagtgc tgctttcatg tttttctatc tgtggtaa 108
<210> 188
<211> 35
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(35)
<223> VC1标签
<400> 188
Asn Ile Lys Glu Ile Met Trp Trp Gln Lys Val Lys Asn Ile Thr Leu
1 5 10 15
Leu Thr Phe Thr Ile Ile Leu Phe Val Ser Ala Ala Phe Met Phe Phe
20 25 30
Tyr Leu Trp
35
<210> 189
<211> 12
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(12)
<223> PEX8标签
<400> 189
tctaaattat aa 12
<210> 190
<211> 3
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(3)
<223> PEX8标签
<400> 190
Ser Lys Leu
1
<210> 191
<211> 2103
<212> DNA
<213> Saccharomyces cerevisiae
<400> 191
atggttgctc aatataccgt tccagttggg aaagccgcca atgagcatga aactgctcca 60
agaagaaatt atcaatgccg cgagaagccg ctcgtcagac cgcctaacac aaagtgttcc 120
actgtttatg agtttgttct agagtgcttt cagaagaaca aaaattcaaa tgctatgggt 180
tggagggatg ttaaggaaat tcatgaagaa tccaaatcgg ttatgaaaaa agttgatggc 240
aaggagactt cagtggaaaa gaaatggatg tattatgaac tatcgcatta tcattataat 300
tcatttgacc aattgaccga tatcatgcat gaaattggtc gtgggttggt gaaaatagga 360
ttaaagccta atgatgatga caaattacat ctttacgcag ccacttctca caagtggatg 420
aagatgttct taggagcgca gtctcaaggt attcctgtcg tcactgccta cgatactttg 480
ggagagaaag ggctaattca ttctttggtg caaacggggt ctaaggccat ttttaccgat 540
aactctttat taccatcctt gatcaaacca gtgcaagccg ctcaagacgt aaaatacata 600
attcatttcg attccatcag ttctgaggac aggaggcaaa gtggtaagat ctatcaatct 660
gctcatgatg ccatcaacag aattaaagaa gttagacctg atatcaagac ctttagcttt 720
gacgacatct tgaagctagg taaagaatcc tgtaacgaaa tcgatgttca tccacctggc 780
aaggatgatc tttgttgcat catgtatacg tctggttcta caggtgagcc aaagggtgtt 840
gtcttgaaac attcaaatgt tgtcgcaggt gttggtggtg caagtttgaa tgttttgaag 900
tttgtgggca ataccgaccg tgttatctgt tttttgccac tagctcatat ttttgaattg 960
gttttcgaac tattgtcctt ttattggggg gcctgcattg gttatgccac cgtaaaaact 1020
ttaactagca gctctgtgag aaattgtcaa ggtgatttgc aagaattcaa gcccacaatc 1080
atggttggtg tcgccgctgt ttgggaaaca gtgagaaaag ggatcttaaa ccaaattgat 1140
aatttgccct tcctcaccaa gaaaatcttc tggaccgcgt ataataccaa gttgaacatg 1200
caacgtctcc acatccctgg tggcggcgcc ttaggaaact tggttttcaa aaaaatcaga 1260
actgccacag gtggccaatt aagatatttg ttaaacggtg gttctccaat cagtcgggat 1320
gctcaggaat tcatcacaaa tttaatctgc cctatgctta ttggttacgg tttaaccgag 1380
acatgcgcta gtaccaccat cttggatcct gctaattttg aactcggcgt cgctggtgac 1440
ctaacaggtt gtgttaccgt caaactagtt gatgttgaag aattaggtta ttttgctaaa 1500
aacaaccaag gtgaagtttg gatcacaggt gccaatgtca cgcctgaata ttataagaat 1560
gaggaagaaa cttctcaagc tttaacaagc gatggttggt tcaagaccgg tgacatcggt 1620
gaatgggaag caaatggcca tttgaaaata attgacagga agaaaaactt ggtcaaaaca 1680
atgaacggtg aatatatcgc actcgagaaa ttagagtccg tttacagatc taacgaatat 1740
gttgctaaca tttgtgttta tgccgaccaa tctaagacta agccagttgg tattattgta 1800
ccaaatcatg ctccattaac gaagcttgct aaaaagttgg gaattatgga acaaaaagac 1860
agttcaatta atatcgaaaa ttatttggag gatgcaaaat tgattaaagc tgtttattct 1920
gatcttttga agacaggtaa agaccaaggt ttggttggca ttgaattact agcaggcata 1980
gtgttctttg acggcgaatg gactccacaa aacggttttg ttacgtccgc tcagaaattg 2040
aaaagaaaag acattttgaa tgctgtcaaa gataaagttg acgccgttta tagttcgtct 2100
taa 2103
<210> 192
<211> 700
<212> PRT
<213> Saccharomyces cerevisiae
<400> 192
Met Val Ala Gln Tyr Thr Val Pro Val Gly Lys Ala Ala Asn Glu His
1 5 10 15
Glu Thr Ala Pro Arg Arg Asn Tyr Gln Cys Arg Glu Lys Pro Leu Val
20 25 30
Arg Pro Pro Asn Thr Lys Cys Ser Thr Val Tyr Glu Phe Val Leu Glu
35 40 45
Cys Phe Gln Lys Asn Lys Asn Ser Asn Ala Met Gly Trp Arg Asp Val
50 55 60
Lys Glu Ile His Glu Glu Ser Lys Ser Val Met Lys Lys Val Asp Gly
65 70 75 80
Lys Glu Thr Ser Val Glu Lys Lys Trp Met Tyr Tyr Glu Leu Ser His
85 90 95
Tyr His Tyr Asn Ser Phe Asp Gln Leu Thr Asp Ile Met His Glu Ile
100 105 110
Gly Arg Gly Leu Val Lys Ile Gly Leu Lys Pro Asn Asp Asp Asp Lys
115 120 125
Leu His Leu Tyr Ala Ala Thr Ser His Lys Trp Met Lys Met Phe Leu
130 135 140
Gly Ala Gln Ser Gln Gly Ile Pro Val Val Thr Ala Tyr Asp Thr Leu
145 150 155 160
Gly Glu Lys Gly Leu Ile His Ser Leu Val Gln Thr Gly Ser Lys Ala
165 170 175
Ile Phe Thr Asp Asn Ser Leu Leu Pro Ser Leu Ile Lys Pro Val Gln
180 185 190
Ala Ala Gln Asp Val Lys Tyr Ile Ile His Phe Asp Ser Ile Ser Ser
195 200 205
Glu Asp Arg Arg Gln Ser Gly Lys Ile Tyr Gln Ser Ala His Asp Ala
210 215 220
Ile Asn Arg Ile Lys Glu Val Arg Pro Asp Ile Lys Thr Phe Ser Phe
225 230 235 240
Asp Asp Ile Leu Lys Leu Gly Lys Glu Ser Cys Asn Glu Ile Asp Val
245 250 255
His Pro Pro Gly Lys Asp Asp Leu Cys Cys Ile Met Tyr Thr Ser Gly
260 265 270
Ser Thr Gly Glu Pro Lys Gly Val Val Leu Lys His Ser Asn Val Val
275 280 285
Ala Gly Val Gly Gly Ala Ser Leu Asn Val Leu Lys Phe Val Gly Asn
290 295 300
Thr Asp Arg Val Ile Cys Phe Leu Pro Leu Ala His Ile Phe Glu Leu
305 310 315 320
Val Phe Glu Leu Leu Ser Phe Tyr Trp Gly Ala Cys Ile Gly Tyr Ala
325 330 335
Thr Val Lys Thr Leu Thr Ser Ser Ser Val Arg Asn Cys Gln Gly Asp
340 345 350
Leu Gln Glu Phe Lys Pro Thr Ile Met Val Gly Val Ala Ala Val Trp
355 360 365
Glu Thr Val Arg Lys Gly Ile Leu Asn Gln Ile Asp Asn Leu Pro Phe
370 375 380
Leu Thr Lys Lys Ile Phe Trp Thr Ala Tyr Asn Thr Lys Leu Asn Met
385 390 395 400
Gln Arg Leu His Ile Pro Gly Gly Gly Ala Leu Gly Asn Leu Val Phe
405 410 415
Lys Lys Ile Arg Thr Ala Thr Gly Gly Gln Leu Arg Tyr Leu Leu Asn
420 425 430
Gly Gly Ser Pro Ile Ser Arg Asp Ala Gln Glu Phe Ile Thr Asn Leu
435 440 445
Ile Cys Pro Met Leu Ile Gly Tyr Gly Leu Thr Glu Thr Cys Ala Ser
450 455 460
Thr Thr Ile Leu Asp Pro Ala Asn Phe Glu Leu Gly Val Ala Gly Asp
465 470 475 480
Leu Thr Gly Cys Val Thr Val Lys Leu Val Asp Val Glu Glu Leu Gly
485 490 495
Tyr Phe Ala Lys Asn Asn Gln Gly Glu Val Trp Ile Thr Gly Ala Asn
500 505 510
Val Thr Pro Glu Tyr Tyr Lys Asn Glu Glu Glu Thr Ser Gln Ala Leu
515 520 525
Thr Ser Asp Gly Trp Phe Lys Thr Gly Asp Ile Gly Glu Trp Glu Ala
530 535 540
Asn Gly His Leu Lys Ile Ile Asp Arg Lys Lys Asn Leu Val Lys Thr
545 550 555 560
Met Asn Gly Glu Tyr Ile Ala Leu Glu Lys Leu Glu Ser Val Tyr Arg
565 570 575
Ser Asn Glu Tyr Val Ala Asn Ile Cys Val Tyr Ala Asp Gln Ser Lys
580 585 590
Thr Lys Pro Val Gly Ile Ile Val Pro Asn His Ala Pro Leu Thr Lys
595 600 605
Leu Ala Lys Lys Leu Gly Ile Met Glu Gln Lys Asp Ser Ser Ile Asn
610 615 620
Ile Glu Asn Tyr Leu Glu Asp Ala Lys Leu Ile Lys Ala Val Tyr Ser
625 630 635 640
Asp Leu Leu Lys Thr Gly Lys Asp Gln Gly Leu Val Gly Ile Glu Leu
645 650 655
Leu Ala Gly Ile Val Phe Phe Asp Gly Glu Trp Thr Pro Gln Asn Gly
660 665 670
Phe Val Thr Ser Ala Gln Lys Leu Lys Arg Lys Asp Ile Leu Asn Ala
675 680 685
Val Lys Asp Lys Val Asp Ala Val Tyr Ser Ser Ser
690 695 700
<210> 193
<211> 2226
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(2226)
<223> 截短的中链脂肪酰辅酶A合成酶Sc_FAA2_Ctrunc
<400> 193
atggccgctc cagattatgc acttaccgat ttaattgaat cggatcctcg tttcgaaagt 60
ttgaagacaa gattagccgg ttacaccaaa ggctctgatg aatatattga agagctatac 120
tctcaattac cactgaccag ctaccccagg tacaaaacat ttttaaagaa acaggcggtt 180
gccatttcga atccggataa tgaagctggt tttagctcga tttataggag ttctctttct 240
tctgaaaatc tagtgagctg tgtggataaa aacttaagaa ctgcatacga tcacttcatg 300
ttttctgcaa ggagatggcc tcaacgtgac tgtttaggtt caaggccaat tgataaagcc 360
acaggcacct gggaggaaac attccgtttc gagtcgtact ccacggtatc taaaagatgt 420
cataatatcg gaagtggtat attgtctttg gtaaacacga aaaggaaacg tcctttggaa 480
gccaatgatt ttgttgttgc tatcttatca cacaacaacc ctgaatggat cctaacagat 540
ttggcctgtc aggcctattc tctaactaac acggctttgt acgaaacatt aggtccaaac 600
acctccgagt acatattgaa tttaaccgag gcccccattc tgatttttgc aaaatcaaat 660
atgtatcatg tattgaagat ggtgcctgat atgaaatttg ttaatacttt ggtttgtatg 720
gatgaattaa ctcatgacga gctccgtatg ctaaatgaat cgttgctacc cgttaagtgc 780
aactctctca atgaaaaaat cacatttttt tcattggagc aggtagaaca agttggttgc 840
tttaacaaaa ttcctgcaat tccacctacc ccagattcct tgtatactat ttcgtttact 900
tctggtacta caggtttacc taaaggtgtg gaaatgtctc acagaaacat tgcgtctggg 960
atagcatttg ctttttctac cttcagaata ccgccagata aaagaaacca acagttatat 1020
gatatgtgtt ttttgccatt ggctcatatt tttgaaagaa tggttattgc gtatgatcta 1080
gccatcgggt ttggaatagg cttcttacat aaaccagacc caactgtatt ggtagaggat 1140
ttgaagattt tgaaacctta cgcggttgcc ctggttccta gaatattaac acggtttgaa 1200
gccggtataa aaaatgcttt ggataaatcg actgtccaga ggaacgtagc aaatactata 1260
ttggattcta aatcggccag atttaccgca agaggtggtc cagataaatc gattatgaat 1320
tttctagttt atcatcgcgt attgattgat aaaatcagag actctttagg tttgtccaat 1380
aactcgttta taattaccgg atcagctccc atatctaaag ataccttact atttttaaga 1440
agcgccttgg atattggtat aagacagggc tacggcttaa ctgaaacttt tgctggtgtc 1500
tgtttaagcg aaccgtttga aaaagatgtc ggatcttgtg gtgccatagg tatttctgca 1560
gaatgtagat tgaagtctgt tccagaaatg ggttaccatg ccgacaagga tttaaaaggt 1620
gaactgcaaa ttcgtggccc acaggttttt gaaagatatt ttaaaaatcc gaatgaaact 1680
tcaaaagccg ttgaccaaga tggttggttt tccacgggag atgttgcatt tatcgatgca 1740
aaaggtcgca tcagcgtcat tgatcgagtc aagaactttt tcaagctagc acatggtgaa 1800
tatattgctc cagagaaaat cgaaaatatt tatttatcat catgccccta tatcacgcaa 1860
atatttgtct ttggagatcc tttgaagaca tttttagttg gcatcgttgg tgttgatgtt 1920
gatgcagcgc aaccgatttt agctgcaaag cacccagagg tgaaaacgtg gactaaggaa 1980
gtgctagtag aaaacttaaa tcgtaataaa aagctaagga aggaattttt aaacaaaatt 2040
aataaatgca tcgatgggct acaaggattt gaaaaattgc acaacatcaa agtcggactt 2100
gagcctttga ctctcgagga tgatgttgtg acgccaactt ttaaaataaa gcgtgccaaa 2160
gcatcaaaat tcttcaaaga tacattagac caactatacg ccgaaggttc actagtcaag 2220
acatag 2226
<210> 194
<211> 741
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(741)
<223> 截短的中链脂肪酰辅酶A合成酶Sc_FAA2_Ctrunc
<400> 194
Met Ala Ala Pro Asp Tyr Ala Leu Thr Asp Leu Ile Glu Ser Asp Pro
1 5 10 15
Arg Phe Glu Ser Leu Lys Thr Arg Leu Ala Gly Tyr Thr Lys Gly Ser
20 25 30
Asp Glu Tyr Ile Glu Glu Leu Tyr Ser Gln Leu Pro Leu Thr Ser Tyr
35 40 45
Pro Arg Tyr Lys Thr Phe Leu Lys Lys Gln Ala Val Ala Ile Ser Asn
50 55 60
Pro Asp Asn Glu Ala Gly Phe Ser Ser Ile Tyr Arg Ser Ser Leu Ser
65 70 75 80
Ser Glu Asn Leu Val Ser Cys Val Asp Lys Asn Leu Arg Thr Ala Tyr
85 90 95
Asp His Phe Met Phe Ser Ala Arg Arg Trp Pro Gln Arg Asp Cys Leu
100 105 110
Gly Ser Arg Pro Ile Asp Lys Ala Thr Gly Thr Trp Glu Glu Thr Phe
115 120 125
Arg Phe Glu Ser Tyr Ser Thr Val Ser Lys Arg Cys His Asn Ile Gly
130 135 140
Ser Gly Ile Leu Ser Leu Val Asn Thr Lys Arg Lys Arg Pro Leu Glu
145 150 155 160
Ala Asn Asp Phe Val Val Ala Ile Leu Ser His Asn Asn Pro Glu Trp
165 170 175
Ile Leu Thr Asp Leu Ala Cys Gln Ala Tyr Ser Leu Thr Asn Thr Ala
180 185 190
Leu Tyr Glu Thr Leu Gly Pro Asn Thr Ser Glu Tyr Ile Leu Asn Leu
195 200 205
Thr Glu Ala Pro Ile Leu Ile Phe Ala Lys Ser Asn Met Tyr His Val
210 215 220
Leu Lys Met Val Pro Asp Met Lys Phe Val Asn Thr Leu Val Cys Met
225 230 235 240
Asp Glu Leu Thr His Asp Glu Leu Arg Met Leu Asn Glu Ser Leu Leu
245 250 255
Pro Val Lys Cys Asn Ser Leu Asn Glu Lys Ile Thr Phe Phe Ser Leu
260 265 270
Glu Gln Val Glu Gln Val Gly Cys Phe Asn Lys Ile Pro Ala Ile Pro
275 280 285
Pro Thr Pro Asp Ser Leu Tyr Thr Ile Ser Phe Thr Ser Gly Thr Thr
290 295 300
Gly Leu Pro Lys Gly Val Glu Met Ser His Arg Asn Ile Ala Ser Gly
305 310 315 320
Ile Ala Phe Ala Phe Ser Thr Phe Arg Ile Pro Pro Asp Lys Arg Asn
325 330 335
Gln Gln Leu Tyr Asp Met Cys Phe Leu Pro Leu Ala His Ile Phe Glu
340 345 350
Arg Met Val Ile Ala Tyr Asp Leu Ala Ile Gly Phe Gly Ile Gly Phe
355 360 365
Leu His Lys Pro Asp Pro Thr Val Leu Val Glu Asp Leu Lys Ile Leu
370 375 380
Lys Pro Tyr Ala Val Ala Leu Val Pro Arg Ile Leu Thr Arg Phe Glu
385 390 395 400
Ala Gly Ile Lys Asn Ala Leu Asp Lys Ser Thr Val Gln Arg Asn Val
405 410 415
Ala Asn Thr Ile Leu Asp Ser Lys Ser Ala Arg Phe Thr Ala Arg Gly
420 425 430
Gly Pro Asp Lys Ser Ile Met Asn Phe Leu Val Tyr His Arg Val Leu
435 440 445
Ile Asp Lys Ile Arg Asp Ser Leu Gly Leu Ser Asn Asn Ser Phe Ile
450 455 460
Ile Thr Gly Ser Ala Pro Ile Ser Lys Asp Thr Leu Leu Phe Leu Arg
465 470 475 480
Ser Ala Leu Asp Ile Gly Ile Arg Gln Gly Tyr Gly Leu Thr Glu Thr
485 490 495
Phe Ala Gly Val Cys Leu Ser Glu Pro Phe Glu Lys Asp Val Gly Ser
500 505 510
Cys Gly Ala Ile Gly Ile Ser Ala Glu Cys Arg Leu Lys Ser Val Pro
515 520 525
Glu Met Gly Tyr His Ala Asp Lys Asp Leu Lys Gly Glu Leu Gln Ile
530 535 540
Arg Gly Pro Gln Val Phe Glu Arg Tyr Phe Lys Asn Pro Asn Glu Thr
545 550 555 560
Ser Lys Ala Val Asp Gln Asp Gly Trp Phe Ser Thr Gly Asp Val Ala
565 570 575
Phe Ile Asp Ala Lys Gly Arg Ile Ser Val Ile Asp Arg Val Lys Asn
580 585 590
Phe Phe Lys Leu Ala His Gly Glu Tyr Ile Ala Pro Glu Lys Ile Glu
595 600 605
Asn Ile Tyr Leu Ser Ser Cys Pro Tyr Ile Thr Gln Ile Phe Val Phe
610 615 620
Gly Asp Pro Leu Lys Thr Phe Leu Val Gly Ile Val Gly Val Asp Val
625 630 635 640
Asp Ala Ala Gln Pro Ile Leu Ala Ala Lys His Pro Glu Val Lys Thr
645 650 655
Trp Thr Lys Glu Val Leu Val Glu Asn Leu Asn Arg Asn Lys Lys Leu
660 665 670
Arg Lys Glu Phe Leu Asn Lys Ile Asn Lys Cys Ile Asp Gly Leu Gln
675 680 685
Gly Phe Glu Lys Leu His Asn Ile Lys Val Gly Leu Glu Pro Leu Thr
690 695 700
Leu Glu Asp Asp Val Val Thr Pro Thr Phe Lys Ile Lys Arg Ala Lys
705 710 715 720
Ala Ser Lys Phe Phe Lys Asp Thr Leu Asp Gln Leu Tyr Ala Glu Gly
725 730 735
Ser Leu Val Lys Thr
740
<210> 195
<211> 2238
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(2238)
<223> 突变的中链脂肪酰辅酶A合成酶Sc_FAA2_Cmut
<400> 195
atggccgctc cagattatgc acttaccgat ttaattgaat cggatcctcg tttcgaaagt 60
ttgaagacaa gattagccgg ttacaccaaa ggctctgatg aatatattga agagctatac 120
tctcaattac cactgaccag ctaccccagg tacaaaacat ttttaaagaa acaggcggtt 180
gccatttcga atccggataa tgaagctggt tttagctcga tttataggag ttctctttct 240
tctgaaaatc tagtgagctg tgtggataaa aacttaagaa ctgcatacga tcacttcatg 300
ttttctgcaa ggagatggcc tcaacgtgac tgtttaggtt caaggccaat tgataaagcc 360
acaggcacct gggaggaaac attccgtttc gagtcgtact ccacggtatc taaaagatgt 420
cataatatcg gaagtggtat attgtctttg gtaaacacga aaaggaaacg tcctttggaa 480
gccaatgatt ttgttgttgc tatcttatca cacaacaacc ctgaatggat cctaacagat 540
ttggcctgtc aggcctattc tctaactaac acggctttgt acgaaacatt aggtccaaac 600
acctccgagt acatattgaa tttaaccgag gcccccattc tgatttttgc aaaatcaaat 660
atgtatcatg tattgaagat ggtgcctgat atgaaatttg ttaatacttt ggtttgtatg 720
gatgaattaa ctcatgacga gctccgtatg ctaaatgaat cgttgctacc cgttaagtgc 780
aactctctca atgaaaaaat cacatttttt tcattggagc aggtagaaca agttggttgc 840
tttaacaaaa ttcctgcaat tccacctacc ccagattcct tgtatactat ttcgtttact 900
tctggtacta caggtttacc taaaggtgtg gaaatgtctc acagaaacat tgcgtctggg 960
atagcatttg ctttttctac cttcagaata ccgccagata aaagaaacca acagttatat 1020
gatatgtgtt ttttgccatt ggctcatatt tttgaaagaa tggttattgc gtatgatcta 1080
gccatcgggt ttggaatagg cttcttacat aaaccagacc caactgtatt ggtagaggat 1140
ttgaagattt tgaaacctta cgcggttgcc ctggttccta gaatattaac acggtttgaa 1200
gccggtataa aaaatgcttt ggataaatcg actgtccaga ggaacgtagc aaatactata 1260
ttggattcta aatcggccag atttaccgca agaggtggtc cagataaatc gattatgaat 1320
tttctagttt atcatcgcgt attgattgat aaaatcagag actctttagg tttgtccaat 1380
aactcgttta taattaccgg atcagctccc atatctaaag ataccttact atttttaaga 1440
agcgccttgg atattggtat aagacagggc tacggcttaa ctgaaacttt tgctggtgtc 1500
tgtttaagcg aaccgtttga aaaagatgtc ggatcttgtg gtgccatagg tatttctgca 1560
gaatgtagat tgaagtctgt tccagaaatg ggttaccatg ccgacaagga tttaaaaggt 1620
gaactgcaaa ttcgtggccc acaggttttt gaaagatatt ttaaaaatcc gaatgaaact 1680
tcaaaagccg ttgaccaaga tggttggttt tccacgggag atgttgcatt tatcgatgca 1740
aaaggtcgca tcagcgtcat tgatcgagtc aagaactttt tcaagctagc acatggtgaa 1800
tatattgctc cagagaaaat cgaaaatatt tatttatcat catgccccta tatcacgcaa 1860
atatttgtct ttggagatcc tttgaagaca tttttagttg gcatcgttgg tgttgatgtt 1920
gatgcagcgc aaccgatttt agctgcaaag cacccagagg tgaaaacgtg gactaaggaa 1980
gtgctagtag aaaacttaaa tcgtaataaa aagctaagga aggaattttt aaacaaaatt 2040
aataaatgca tcgatgggct acaaggattt gaaaaattgc acaacatcaa agtcggactt 2100
gagcctttga ctctcgagga tgatgttgtg acgccaactt ttaaaataaa gcgtgccaaa 2160
gcatcaaaat tcttcaaaga tacattagac caactatacg ccgaaggttc actagtcaag 2220
acagaaaagc ttaaatag 2238
<210> 196
<211> 745
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(745)
<223> 突变的中链脂肪酰辅酶A合成酶Sc_FAA2_Cmut
<400> 196
Met Ala Ala Pro Asp Tyr Ala Leu Thr Asp Leu Ile Glu Ser Asp Pro
1 5 10 15
Arg Phe Glu Ser Leu Lys Thr Arg Leu Ala Gly Tyr Thr Lys Gly Ser
20 25 30
Asp Glu Tyr Ile Glu Glu Leu Tyr Ser Gln Leu Pro Leu Thr Ser Tyr
35 40 45
Pro Arg Tyr Lys Thr Phe Leu Lys Lys Gln Ala Val Ala Ile Ser Asn
50 55 60
Pro Asp Asn Glu Ala Gly Phe Ser Ser Ile Tyr Arg Ser Ser Leu Ser
65 70 75 80
Ser Glu Asn Leu Val Ser Cys Val Asp Lys Asn Leu Arg Thr Ala Tyr
85 90 95
Asp His Phe Met Phe Ser Ala Arg Arg Trp Pro Gln Arg Asp Cys Leu
100 105 110
Gly Ser Arg Pro Ile Asp Lys Ala Thr Gly Thr Trp Glu Glu Thr Phe
115 120 125
Arg Phe Glu Ser Tyr Ser Thr Val Ser Lys Arg Cys His Asn Ile Gly
130 135 140
Ser Gly Ile Leu Ser Leu Val Asn Thr Lys Arg Lys Arg Pro Leu Glu
145 150 155 160
Ala Asn Asp Phe Val Val Ala Ile Leu Ser His Asn Asn Pro Glu Trp
165 170 175
Ile Leu Thr Asp Leu Ala Cys Gln Ala Tyr Ser Leu Thr Asn Thr Ala
180 185 190
Leu Tyr Glu Thr Leu Gly Pro Asn Thr Ser Glu Tyr Ile Leu Asn Leu
195 200 205
Thr Glu Ala Pro Ile Leu Ile Phe Ala Lys Ser Asn Met Tyr His Val
210 215 220
Leu Lys Met Val Pro Asp Met Lys Phe Val Asn Thr Leu Val Cys Met
225 230 235 240
Asp Glu Leu Thr His Asp Glu Leu Arg Met Leu Asn Glu Ser Leu Leu
245 250 255
Pro Val Lys Cys Asn Ser Leu Asn Glu Lys Ile Thr Phe Phe Ser Leu
260 265 270
Glu Gln Val Glu Gln Val Gly Cys Phe Asn Lys Ile Pro Ala Ile Pro
275 280 285
Pro Thr Pro Asp Ser Leu Tyr Thr Ile Ser Phe Thr Ser Gly Thr Thr
290 295 300
Gly Leu Pro Lys Gly Val Glu Met Ser His Arg Asn Ile Ala Ser Gly
305 310 315 320
Ile Ala Phe Ala Phe Ser Thr Phe Arg Ile Pro Pro Asp Lys Arg Asn
325 330 335
Gln Gln Leu Tyr Asp Met Cys Phe Leu Pro Leu Ala His Ile Phe Glu
340 345 350
Arg Met Val Ile Ala Tyr Asp Leu Ala Ile Gly Phe Gly Ile Gly Phe
355 360 365
Leu His Lys Pro Asp Pro Thr Val Leu Val Glu Asp Leu Lys Ile Leu
370 375 380
Lys Pro Tyr Ala Val Ala Leu Val Pro Arg Ile Leu Thr Arg Phe Glu
385 390 395 400
Ala Gly Ile Lys Asn Ala Leu Asp Lys Ser Thr Val Gln Arg Asn Val
405 410 415
Ala Asn Thr Ile Leu Asp Ser Lys Ser Ala Arg Phe Thr Ala Arg Gly
420 425 430
Gly Pro Asp Lys Ser Ile Met Asn Phe Leu Val Tyr His Arg Val Leu
435 440 445
Ile Asp Lys Ile Arg Asp Ser Leu Gly Leu Ser Asn Asn Ser Phe Ile
450 455 460
Ile Thr Gly Ser Ala Pro Ile Ser Lys Asp Thr Leu Leu Phe Leu Arg
465 470 475 480
Ser Ala Leu Asp Ile Gly Ile Arg Gln Gly Tyr Gly Leu Thr Glu Thr
485 490 495
Phe Ala Gly Val Cys Leu Ser Glu Pro Phe Glu Lys Asp Val Gly Ser
500 505 510
Cys Gly Ala Ile Gly Ile Ser Ala Glu Cys Arg Leu Lys Ser Val Pro
515 520 525
Glu Met Gly Tyr His Ala Asp Lys Asp Leu Lys Gly Glu Leu Gln Ile
530 535 540
Arg Gly Pro Gln Val Phe Glu Arg Tyr Phe Lys Asn Pro Asn Glu Thr
545 550 555 560
Ser Lys Ala Val Asp Gln Asp Gly Trp Phe Ser Thr Gly Asp Val Ala
565 570 575
Phe Ile Asp Ala Lys Gly Arg Ile Ser Val Ile Asp Arg Val Lys Asn
580 585 590
Phe Phe Lys Leu Ala His Gly Glu Tyr Ile Ala Pro Glu Lys Ile Glu
595 600 605
Asn Ile Tyr Leu Ser Ser Cys Pro Tyr Ile Thr Gln Ile Phe Val Phe
610 615 620
Gly Asp Pro Leu Lys Thr Phe Leu Val Gly Ile Val Gly Val Asp Val
625 630 635 640
Asp Ala Ala Gln Pro Ile Leu Ala Ala Lys His Pro Glu Val Lys Thr
645 650 655
Trp Thr Lys Glu Val Leu Val Glu Asn Leu Asn Arg Asn Lys Lys Leu
660 665 670
Arg Lys Glu Phe Leu Asn Lys Ile Asn Lys Cys Ile Asp Gly Leu Gln
675 680 685
Gly Phe Glu Lys Leu His Asn Ile Lys Val Gly Leu Glu Pro Leu Thr
690 695 700
Leu Glu Asp Asp Val Val Thr Pro Thr Phe Lys Ile Lys Arg Ala Lys
705 710 715 720
Ala Ser Lys Phe Phe Lys Asp Thr Leu Asp Gln Leu Tyr Ala Glu Gly
725 730 735
Ser Leu Val Lys Thr Glu Lys Leu Lys
740 745
<210> 197
<211> 2085
<212> DNA
<213> Saccharomyces cerevisiae
<400> 197
atgtccgaac aacactctgt cgcagtcggt aaagctgcta atgagcacga gactgcccct 60
aggagaaatg ttagagtcaa gaagcggccc ttaattagac cattgaactc gtcagcatct 120
acgctgtatg aatttgccct agagtgtttc aacaagggtg gaaaacgaga tggtatggct 180
tggagagatg tcatcgagat tcatgagaca aagaaaacca ttgtgagaaa ggtagacggc 240
aaggataaat ctatagaaaa gacatggctg tattatgaaa tgtcaccata taaaatgatg 300
acctaccagg aactgatctg ggtgatgcac gatatgggcc gtgggctggc aaaaataggc 360
atcaagccca atggagaaca caaattccac atcttcgcat ctacttccca taaatggatg 420
aagattttcc ttggttgcat atcccagggt atccccgtag taaccgcgta tgatactttg 480
ggtgagagcg gtttgattca ctccatggtt gaaaccgagt ctgctgctat tttcactgat 540
aatcaattat tggctaaaat gatagtgcct ttgcaatctg ctaaagatat caaatttctt 600
atccataacg aacctatcga ccccaatgac agaagacaaa acggcaaact ttacaaggct 660
gctaaggatg ccattaataa gatcagagaa gttaggccag acataaaaat ttatagtttt 720
gaagaagttg tcaagatagg taaaaaaagt aaagatgagg tcaaacttca tccacctgag 780
ccaaaagatt tggcttgtat catgtacacc tcgggctcga tcagtgcacc aaaaggtgta 840
gtattgactc attataatat tgtttcgggt atcgctggtg taggtcacaa cgtctttgga 900
tggatcggct ctacagaccg tgttttgtcg ttcttgccat tggctcatat ttttgaactg 960
gtctttgaat tcgaagcctt ttactggaac ggtattcttg ggtacggtag tgttaagact 1020
ttgactaata cttcgactcg taattgtaag ggtgacctgg ttgagtttaa gcctactatt 1080
atgatcggtg tggctgccgt ttgggaaact gtgagaaaag ctattttgga aaagatcagc 1140
gatttaactc ccgtactcca aaagattttt tggtctgcct atagtatgaa agaaaagagt 1200
gtaccatgca ccgggttttt aagtcgtatg gtcttcaaga aagtcagaca agccaccggt 1260
ggtcatctta agtatattat gaacggtggg tctgcgatca gtattgatgc tcagaaattc 1320
ttttctatcg tcctgtgtcc tatgattatc ggttacggcc ttactgaaac agttgcgaat 1380
gcttgtgttt tggagcctga tcatttcgaa tatggtatag ttggtgatct tgttggatcg 1440
gtcactgcca aattggtgga tgttaaggac ctaggttatt atgcaaaaaa caatcaaggt 1500
gaattgcttc taaagggtgc gccggtctgt tctgaatatt ataagaatcc aatagaaacg 1560
gcggtctctt tcacttacga tggatggttt cgtactggtg atattgttga atggactccc 1620
aagggacaac ttaaaattat tgatagaaga aagaatttgg ttaaaaccct aaatggtgaa 1680
tatattgcat tagaaaagtt agaatctgtt tacaggtcaa actcctatgt gaaaaatatc 1740
tgtgtttatg ccgatgaaag tagggttaaa ccggtgggta ttgtggtacc caacccagga 1800
cccctatcta aatttgctgt caaattgcgt attatgaaaa agggtgaaga catcgaaaac 1860
tatatccatg acaaagcatt acgaaatgct gttttcaaag agatgatcgc aacagccaaa 1920
tctcaaggtt tggttggtat tgaactatta tgtggtattg ttttctttga tgaagaatgg 1980
acacctgaaa atggctttgt cacatctgct caaaaattaa agagaagaga aatcttagcc 2040
gctgttaaat cagaagtcga aagggtttac aaagaaaatt cttag 2085
<210> 198
<211> 694
<212> PRT
<213> Saccharomyces cerevisiae
<400> 198
Met Ser Glu Gln His Ser Val Ala Val Gly Lys Ala Ala Asn Glu His
1 5 10 15
Glu Thr Ala Pro Arg Arg Asn Val Arg Val Lys Lys Arg Pro Leu Ile
20 25 30
Arg Pro Leu Asn Ser Ser Ala Ser Thr Leu Tyr Glu Phe Ala Leu Glu
35 40 45
Cys Phe Asn Lys Gly Gly Lys Arg Asp Gly Met Ala Trp Arg Asp Val
50 55 60
Ile Glu Ile His Glu Thr Lys Lys Thr Ile Val Arg Lys Val Asp Gly
65 70 75 80
Lys Asp Lys Ser Ile Glu Lys Thr Trp Leu Tyr Tyr Glu Met Ser Pro
85 90 95
Tyr Lys Met Met Thr Tyr Gln Glu Leu Ile Trp Val Met His Asp Met
100 105 110
Gly Arg Gly Leu Ala Lys Ile Gly Ile Lys Pro Asn Gly Glu His Lys
115 120 125
Phe His Ile Phe Ala Ser Thr Ser His Lys Trp Met Lys Ile Phe Leu
130 135 140
Gly Cys Ile Ser Gln Gly Ile Pro Val Val Thr Ala Tyr Asp Thr Leu
145 150 155 160
Gly Glu Ser Gly Leu Ile His Ser Met Val Glu Thr Glu Ser Ala Ala
165 170 175
Ile Phe Thr Asp Asn Gln Leu Leu Ala Lys Met Ile Val Pro Leu Gln
180 185 190
Ser Ala Lys Asp Ile Lys Phe Leu Ile His Asn Glu Pro Ile Asp Pro
195 200 205
Asn Asp Arg Arg Gln Asn Gly Lys Leu Tyr Lys Ala Ala Lys Asp Ala
210 215 220
Ile Asn Lys Ile Arg Glu Val Arg Pro Asp Ile Lys Ile Tyr Ser Phe
225 230 235 240
Glu Glu Val Val Lys Ile Gly Lys Lys Ser Lys Asp Glu Val Lys Leu
245 250 255
His Pro Pro Glu Pro Lys Asp Leu Ala Cys Ile Met Tyr Thr Ser Gly
260 265 270
Ser Ile Ser Ala Pro Lys Gly Val Val Leu Thr His Tyr Asn Ile Val
275 280 285
Ser Gly Ile Ala Gly Val Gly His Asn Val Phe Gly Trp Ile Gly Ser
290 295 300
Thr Asp Arg Val Leu Ser Phe Leu Pro Leu Ala His Ile Phe Glu Leu
305 310 315 320
Val Phe Glu Phe Glu Ala Phe Tyr Trp Asn Gly Ile Leu Gly Tyr Gly
325 330 335
Ser Val Lys Thr Leu Thr Asn Thr Ser Thr Arg Asn Cys Lys Gly Asp
340 345 350
Leu Val Glu Phe Lys Pro Thr Ile Met Ile Gly Val Ala Ala Val Trp
355 360 365
Glu Thr Val Arg Lys Ala Ile Leu Glu Lys Ile Ser Asp Leu Thr Pro
370 375 380
Val Leu Gln Lys Ile Phe Trp Ser Ala Tyr Ser Met Lys Glu Lys Ser
385 390 395 400
Val Pro Cys Thr Gly Phe Leu Ser Arg Met Val Phe Lys Lys Val Arg
405 410 415
Gln Ala Thr Gly Gly His Leu Lys Tyr Ile Met Asn Gly Gly Ser Ala
420 425 430
Ile Ser Ile Asp Ala Gln Lys Phe Phe Ser Ile Val Leu Cys Pro Met
435 440 445
Ile Ile Gly Tyr Gly Leu Thr Glu Thr Val Ala Asn Ala Cys Val Leu
450 455 460
Glu Pro Asp His Phe Glu Tyr Gly Ile Val Gly Asp Leu Val Gly Ser
465 470 475 480
Val Thr Ala Lys Leu Val Asp Val Lys Asp Leu Gly Tyr Tyr Ala Lys
485 490 495
Asn Asn Gln Gly Glu Leu Leu Leu Lys Gly Ala Pro Val Cys Ser Glu
500 505 510
Tyr Tyr Lys Asn Pro Ile Glu Thr Ala Val Ser Phe Thr Tyr Asp Gly
515 520 525
Trp Phe Arg Thr Gly Asp Ile Val Glu Trp Thr Pro Lys Gly Gln Leu
530 535 540
Lys Ile Ile Asp Arg Arg Lys Asn Leu Val Lys Thr Leu Asn Gly Glu
545 550 555 560
Tyr Ile Ala Leu Glu Lys Leu Glu Ser Val Tyr Arg Ser Asn Ser Tyr
565 570 575
Val Lys Asn Ile Cys Val Tyr Ala Asp Glu Ser Arg Val Lys Pro Val
580 585 590
Gly Ile Val Val Pro Asn Pro Gly Pro Leu Ser Lys Phe Ala Val Lys
595 600 605
Leu Arg Ile Met Lys Lys Gly Glu Asp Ile Glu Asn Tyr Ile His Asp
610 615 620
Lys Ala Leu Arg Asn Ala Val Phe Lys Glu Met Ile Ala Thr Ala Lys
625 630 635 640
Ser Gln Gly Leu Val Gly Ile Glu Leu Leu Cys Gly Ile Val Phe Phe
645 650 655
Asp Glu Glu Trp Thr Pro Glu Asn Gly Phe Val Thr Ser Ala Gln Lys
660 665 670
Leu Lys Arg Arg Glu Ile Leu Ala Ala Val Lys Ser Glu Val Glu Arg
675 680 685
Val Tyr Lys Glu Asn Ser
690
<210> 199
<211> 2085
<212> DNA
<213> Saccharomyces cerevisiae
<400> 199
atgaccgaac aatattccgt tgcagttggc gaagccgaca atgagcatga aaccgctcca 60
agaagaaata tcagggttaa agacaagcct ttgattagac ccataaactc ctcagcatct 120
acactgtacg aattcgccct ggaatgtttt accaaaggtg gtaagagaga cggtatggca 180
tggagagata ttatagatat acatgagacg aaaaaaacca tagtcaagag ggtggatggt 240
aaggataagc ccatcgaaaa aacatggttg tactacgaac tgactcccta cataaccatg 300
acatacgagg agatgatctg cgtaatgcac gacattggac gtgggctgat aaagattggt 360
gttaaaccta acggtgagaa caagttccac atctttgcct ctacatctca caagtggatg 420
aaaacttttc ttggttgcat gtcacaaggt attcctgtgg tcaccgcgta cgacactttg 480
ggtgagagcg gtttgattca ctccatggtg gaaacggatt ccgtcgccat tttcacggac 540
aaccagctgt tgtccaaatt agcagttcct ttgaaaaccg ccaagaacgt aaaattcgtc 600
attcacaacg aacccatcga tccaagtgac aaaagacaaa atggtaagct ttacaaggct 660
gccaaggatg ctgttgacaa aatcaaggaa gttagaccgg acataaaaat ctacagtttc 720
gatgaaatta ttgagatagg taaaaaggcc aaggacgagg ttgaattgca tttccccaag 780
cctgaagatc cagcttgtat catgtacact tctggttcca ctggtacacc aaagggtgtg 840
gtattgacac attacaacat tgtagctggt attggtggtg tgggccataa cgttatcgga 900
tggattggcc caacagaccg tattatcgca ttcttgccat tggctcatat ttttgaatta 960
atctttgaat tcgaagcgtt ctactggaat ggtatcctag ggtacgccac tgtcaagact 1020
ttaaccccaa cttctacacg taattgccaa ggtgacctga tggagtttaa acctaccgta 1080
atggtaggtg ttgccgcagt ttgggaaaca gtgagaaaag gtatcctggc caagatcaac 1140
gaattgcccg gttggtctca aacgcttttc tggactgtct atgctttgaa agagagaaat 1200
ataccatgca gcggcttgct gagtgggttg atcttcaaga gaatcagaga agcaaccggt 1260
ggaaacttaa ggtttattct gaacggtggg tctgcaatca gcatagacgc ccaaaaattc 1320
ctctccaacc ttctatgtcc tatgctcatt ggatatgggc taactgaggg tgtggctaat 1380
gcctgtgtcc tggagcctga acattttgat tacggtattg ctggtgacct tgtcggaact 1440
attacagcta aattggtgga tgtcgaagat ttgggctatt ttgccaagaa taaccaaggt 1500
gaattgctgt taaagggtgc acccatctgt tctgaatact ataagaatcc tgaagaaact 1560
gctgcggcct ttaccgatga tggctggttc cgtaccggtg atatcgctga atggaccccc 1620
aagggacaaa ttaagatcat tgatagaaag aaaaatttgg tcaagacctt aaacggtgag 1680
tacattgcat tggaaaaatt agaatccatt tacagatcaa atccttacgt ccaaaacatc 1740
tgtgtctacg ctgatgaaaa caaagttaag cctgtcggta ttgtggtccc taacttagga 1800
cacttgtcta agctggctat cgaattaggt ataatggtac caggtgaaga tgtcgaaagc 1860
tatatccatg aaaagaagct acaggatgcc gtttgcaaag atatgctgtc aactgccaaa 1920
tctcaaggct tgaatggtat tgaattatta tgtggcattg ttttctttga agaagaatgg 1980
actccagaaa acggtcttgt tacatccgcc caaaaattaa agagaagaga tattctagcg 2040
gctgtcaagc cagatgtgga aagagtttat aaagaaaaca cttaa 2085
<210> 200
<211> 694
<212> PRT
<213> Saccharomyces cerevisiae
<400> 200
Met Thr Glu Gln Tyr Ser Val Ala Val Gly Glu Ala Asp Asn Glu His
1 5 10 15
Glu Thr Ala Pro Arg Arg Asn Ile Arg Val Lys Asp Lys Pro Leu Ile
20 25 30
Arg Pro Ile Asn Ser Ser Ala Ser Thr Leu Tyr Glu Phe Ala Leu Glu
35 40 45
Cys Phe Thr Lys Gly Gly Lys Arg Asp Gly Met Ala Trp Arg Asp Ile
50 55 60
Ile Asp Ile His Glu Thr Lys Lys Thr Ile Val Lys Arg Val Asp Gly
65 70 75 80
Lys Asp Lys Pro Ile Glu Lys Thr Trp Leu Tyr Tyr Glu Leu Thr Pro
85 90 95
Tyr Ile Thr Met Thr Tyr Glu Glu Met Ile Cys Val Met His Asp Ile
100 105 110
Gly Arg Gly Leu Ile Lys Ile Gly Val Lys Pro Asn Gly Glu Asn Lys
115 120 125
Phe His Ile Phe Ala Ser Thr Ser His Lys Trp Met Lys Thr Phe Leu
130 135 140
Gly Cys Met Ser Gln Gly Ile Pro Val Val Thr Ala Tyr Asp Thr Leu
145 150 155 160
Gly Glu Ser Gly Leu Ile His Ser Met Val Glu Thr Asp Ser Val Ala
165 170 175
Ile Phe Thr Asp Asn Gln Leu Leu Ser Lys Leu Ala Val Pro Leu Lys
180 185 190
Thr Ala Lys Asn Val Lys Phe Val Ile His Asn Glu Pro Ile Asp Pro
195 200 205
Ser Asp Lys Arg Gln Asn Gly Lys Leu Tyr Lys Ala Ala Lys Asp Ala
210 215 220
Val Asp Lys Ile Lys Glu Val Arg Pro Asp Ile Lys Ile Tyr Ser Phe
225 230 235 240
Asp Glu Ile Ile Glu Ile Gly Lys Lys Ala Lys Asp Glu Val Glu Leu
245 250 255
His Phe Pro Lys Pro Glu Asp Pro Ala Cys Ile Met Tyr Thr Ser Gly
260 265 270
Ser Thr Gly Thr Pro Lys Gly Val Val Leu Thr His Tyr Asn Ile Val
275 280 285
Ala Gly Ile Gly Gly Val Gly His Asn Val Ile Gly Trp Ile Gly Pro
290 295 300
Thr Asp Arg Ile Ile Ala Phe Leu Pro Leu Ala His Ile Phe Glu Leu
305 310 315 320
Ile Phe Glu Phe Glu Ala Phe Tyr Trp Asn Gly Ile Leu Gly Tyr Ala
325 330 335
Thr Val Lys Thr Leu Thr Pro Thr Ser Thr Arg Asn Cys Gln Gly Asp
340 345 350
Leu Met Glu Phe Lys Pro Thr Val Met Val Gly Val Ala Ala Val Trp
355 360 365
Glu Thr Val Arg Lys Gly Ile Leu Ala Lys Ile Asn Glu Leu Pro Gly
370 375 380
Trp Ser Gln Thr Leu Phe Trp Thr Val Tyr Ala Leu Lys Glu Arg Asn
385 390 395 400
Ile Pro Cys Ser Gly Leu Leu Ser Gly Leu Ile Phe Lys Arg Ile Arg
405 410 415
Glu Ala Thr Gly Gly Asn Leu Arg Phe Ile Leu Asn Gly Gly Ser Ala
420 425 430
Ile Ser Ile Asp Ala Gln Lys Phe Leu Ser Asn Leu Leu Cys Pro Met
435 440 445
Leu Ile Gly Tyr Gly Leu Thr Glu Gly Val Ala Asn Ala Cys Val Leu
450 455 460
Glu Pro Glu His Phe Asp Tyr Gly Ile Ala Gly Asp Leu Val Gly Thr
465 470 475 480
Ile Thr Ala Lys Leu Val Asp Val Glu Asp Leu Gly Tyr Phe Ala Lys
485 490 495
Asn Asn Gln Gly Glu Leu Leu Leu Lys Gly Ala Pro Ile Cys Ser Glu
500 505 510
Tyr Tyr Lys Asn Pro Glu Glu Thr Ala Ala Ala Phe Thr Asp Asp Gly
515 520 525
Trp Phe Arg Thr Gly Asp Ile Ala Glu Trp Thr Pro Lys Gly Gln Ile
530 535 540
Lys Ile Ile Asp Arg Lys Lys Asn Leu Val Lys Thr Leu Asn Gly Glu
545 550 555 560
Tyr Ile Ala Leu Glu Lys Leu Glu Ser Ile Tyr Arg Ser Asn Pro Tyr
565 570 575
Val Gln Asn Ile Cys Val Tyr Ala Asp Glu Asn Lys Val Lys Pro Val
580 585 590
Gly Ile Val Val Pro Asn Leu Gly His Leu Ser Lys Leu Ala Ile Glu
595 600 605
Leu Gly Ile Met Val Pro Gly Glu Asp Val Glu Ser Tyr Ile His Glu
610 615 620
Lys Lys Leu Gln Asp Ala Val Cys Lys Asp Met Leu Ser Thr Ala Lys
625 630 635 640
Ser Gln Gly Leu Asn Gly Ile Glu Leu Leu Cys Gly Ile Val Phe Phe
645 650 655
Glu Glu Glu Trp Thr Pro Glu Asn Gly Leu Val Thr Ser Ala Gln Lys
660 665 670
Leu Lys Arg Arg Asp Ile Leu Ala Ala Val Lys Pro Asp Val Glu Arg
675 680 685
Val Tyr Lys Glu Asn Thr
690
<210> 201
<211> 6702
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(6702)
<223> 突变的乙酰辅酶A羧化酶 (ACC1) (S659A, S1157A)
<400> 201
atgagcgaag aaagcttatt cgagtcttct ccacagaaga tggagtacga aattacaaac 60
tactcagaaa gacatacaga acttccaggt catttcattg gcctcaatac agtagataaa 120
ctagaggagt ccccgttaag ggactttgtt aagagtcacg gtggtcacac ggtcatatcc 180
aagatcctga tagcaaataa tggtattgcc gccgtgaaag aaattagatc cgtcagaaaa 240
tgggcatacg agacgttcgg cgatgacaga accgtccaat tcgtcgccat ggccacccca 300
gaagatctgg aggccaacgc agaatatatc cgtatggccg atcaatacat tgaagtgcca 360
ggtggtacta ataataacaa ctacgctaac gtagacttga tcgtagacat cgccgaaaga 420
gcagacgtag acgccgtatg ggctggctgg ggtcacgcct ccgagaatcc actattgcct 480
gaaaaattgt cccagtctaa gaggaaagtc atctttattg ggcctccagg taacgccatg 540
aggtctttag gtgataaaat ctcctctacc attgtcgctc aaagtgctaa agtcccatgt 600
attccatggt ctggtaccgg tgttgacacc gttcacgtgg acgagaaaac cggtctggtc 660
tctgtcgacg atgacatcta tcaaaagggt tgttgtacct ctcctgaaga tggtttacaa 720
aaggccaagc gtattggttt tcctgtcatg attaaggcat ccgaaggtgg tggtggtaaa 780
ggtatcagac aagttgaacg tgaagaagat ttcatcgctt tataccacca ggcagccaac 840
gaaattccag gctcccccat tttcatcatg aagttggccg gtagagcgcg tcacttggaa 900
gttcaactgc tagcagatca gtacggtaca aatatttcct tgttcggtag agactgttcc 960
gttcagagac gtcatcaaaa aattatcgaa gaagcaccag ttacaattgc caaggctgaa 1020
acatttcacg agatggaaaa ggctgccgtc agactgggga aactagtcgg ttatgtctct 1080
gccggtaccg tggagtatct atattctcat gatgatggaa aattctactt tttagaattg 1140
aacccaagat tacaagtcga gcatccaaca acggaaatgg tctccggtgt taacttacct 1200
gcagctcaat tacaaatcgc tatgggtatc cctatgcata gaataagtga cattagaact 1260
ttatatggta tgaatcctca ttctgcctca gaaatcgatt tcgaattcaa aactcaagat 1320
gccaccaaga aacaaagaag acctattcca aagggtcatt gtaccgcttg tcgtatcaca 1380
tcagaagatc caaacgatgg attcaagcca tcgggtggta ctttgcatga actaaacttc 1440
cgttcttcct ctaatgtttg gggttacttc tccgtgggta acaatggtaa tattcactcc 1500
ttttcggact ctcagttcgg ccatattttt gcttttggtg aaaatagaca agcttccagg 1560
aaacacatgg ttgttgccct gaaggaattg tccattaggg gtgatttcag aactactgtg 1620
gaatacttga tcaaactttt ggaaactgaa gatttcgagg ataacactat taccaccggt 1680
tggttggacg atttgattac tcataaaatg accgctgaaa agcctgatcc aactcttgcc 1740
gtcatttgcg gtgccgctac aaaggctttc ttagcatctg aagaagcccg ccacaagtat 1800
atcgaatcct tacaaaaggg acaagttcta tctaaagacc tactgcaaac tatgttccct 1860
gtagatttta tccatgaggg taaaagatac aagttcaccg tagctaaatc cggtaatgac 1920
cgttacacat tatttatcaa tggttctaaa tgtgatatca tactgcgtca actatctgat 1980
ggtggtcttt tgattgccat aggcggtaaa tcgcatacca tctattggaa agaagaagtt 2040
gctgctacaa gattatccgt tgactctatg actactttgt tggaagttga aaacgatcca 2100
acccagttgc gtactccatc ccctggtaaa ttggttaaat tcttggtgga aaatggtgaa 2160
cacattatca agggccaacc atatgcagaa attgaagtta tgaaaatgca aatgcctttg 2220
gtttctcaag aaaatggtat cgtccagtta ttaaagcaac ctggttctac cattgttgca 2280
ggtgatatca tggctattat gactcttgac gatccatcca aggtcaagca cgctctacca 2340
tttgaaggta tgctgccaga ttttggttct ccagttatcg aaggaaccaa acctgcctat 2400
aaattcaagt cattagtgtc tactttggaa aacattttga agggttatga caaccaagtt 2460
attatgaacg cttccttgca acaattgata gaggttttga gaaatccaaa actgccttac 2520
tcagaatgga aactacacat ctctgcttta cattcaagat tgcctgctaa gctagatgaa 2580
caaatggaag agttagttgc acgttctttg agacgtggtg ctgttttccc agctagacaa 2640
ttaagtaaat tgattgatat ggccgtgaag aatcctgaat acaaccccga caaattgctg 2700
ggcgccgtcg tggaaccatt ggcggatatt gctcataagt actctaacgg gttagaagcc 2760
catgaacatt ctatatttgt ccatttcttg gaagaatatt acgaagttga aaagttattc 2820
aatggtccaa atgttcgtga ggaaaatatc attctgaaat tgcgtgatga aaaccctaaa 2880
gatctagata aagttgcgct aactgttttg tctcattcga aagtttcagc gaagaataac 2940
ctgatcctag ctatcttgaa acattatcaa ccattgtgca agttatcttc taaagtttct 3000
gccattttct ctactcctct acaacatatt gttgaactag aatctaaggc taccgctaag 3060
gtcgctctac aagcaagaga aattttgatt caaggcgctt taccttcggt caaggaaaga 3120
actgaacaaa ttgaacatat cttaaaatcc tctgttgtga aggttgccta tggctcatcc 3180
aatccaaagc gctctgaacc agatttgaat atcttgaagg acttgatcga ttctaattac 3240
gttgtgttcg atgttttact tcaattccta acccatcaag acccagttgt gactgctgca 3300
gctgctcaag tctatattcg tcgtgcttat cgtgcttaca ccataggaga tattagagtt 3360
cacgaaggtg tcacagttcc aattgttgaa tggaaattcc aactaccttc agctgcgttc 3420
tccacctttc caactgttaa atctaaaatg ggtatgaaca gggctgtttc tgtttcagat 3480
ttgtcatatg ttgcaaacag tcagtcatct ccgttaagag aaggtatttt gatggctgtg 3540
gatcatttag atgatgttga tgaaattttg tcacaaagtt tggaagttat tcctcgtcac 3600
caatcttctt ctaacggacc tgctcctgat cgttctggta gctccgcatc gttgagtaat 3660
gttgctaatg tttgtgttgc ttctacagaa ggtttcgaat ctgaagagga aattttggta 3720
aggttgagag aaattttgga tttgaataag caggaattaa tcaatgcttc tatccgtcgt 3780
atcacattta tgttcggttt taaagatggg tcttatccaa agtattatac ttttaacggt 3840
ccaaattata acgaaaatga aacaattcgt cacattgagc cggctttggc cttccaactg 3900
gaattaggaa gattgtccaa cttcaacatt aaaccaattt tcactgataa tagaaacatc 3960
catgtctacg aagctgttag taagacttct ccattggata agagattctt tacaagaggt 4020
attattagaa cgggtcatat ccgtgatgac atttctattc aagaatatct gacttctgaa 4080
gctaacagat tgatgagtga tatattggat aatttagaag tcaccgacac ttcaaattct 4140
gatttgaatc atatcttcat caacttcatt gcggtgtttg atatctctcc agaagatgtc 4200
gaagccgcct tcggtggttt cttagaaaga tttggtaaga gattgttgag attgcgtgtt 4260
tcttctgccg aaattagaat catcatcaaa gatcctcaaa caggtgcccc agtaccattg 4320
cgtgccttga tcaataacgt ttctggttat gttatcaaaa cagaaatgta caccgaagtc 4380
aagaacgcaa aaggtgaatg ggtatttaag tctttgggta aacctggatc catgcattta 4440
agacctattg ctactcctta ccctgttaag gaatggttgc aaccaaaacg ttataaggca 4500
cacttgatgg gtaccacata tgtctatgac ttcccagaat tattccgcca agcatcgtca 4560
tcccaatgga aaaatttctc tgcagatgtt aagttaacag atgatttctt tatttccaac 4620
gagttgattg aagatgaaaa cggcgaatta actgaggtgg aaagagaacc tggtgccaac 4680
gctattggta tggttgcctt taagattact gtaaagactc ctgaatatcc aagaggccgt 4740
caatttgttg ttgttgctaa cgatatcaca ttcaagatcg gttcctttgg tccacaagaa 4800
gacgaattct tcaataaggt tactgaatat gctagaaagc gtggtatccc aagaatttac 4860
ttggctgcaa actcaggtgc cagaattggt atggctgaag agattgttcc actatttcaa 4920
gttgcatgga atgatgctgc caatccggac aagggcttcc aatacttata cttaacaagt 4980
gaaggtatgg aaactttaaa gaaatttgac aaagaaaatt ctgttctcac tgaacgtact 5040
gttataaacg gtgaagaaag atttgtcatc aagacaatta ttggttctga agatgggtta 5100
ggtgtcgaat gtctacgtgg atctggttta attgctggtg caacgtcaag ggcttaccac 5160
gatatcttca ctatcacctt agtcacttgt agatccgtcg gtatcggtgc ttatttggtt 5220
cgtttgggtc aaagagctat tcaggtcgaa ggccagccaa ttattttaac tggtgctcct 5280
gcaatcaaca aaatgctggg tagagaagtt tatacttcta acttacaatt gggtggtact 5340
caaatcatgt ataacaacgg tgtttcacat ttgactgctg ttgacgattt agctggtgta 5400
gagaagattg ttgaatggat gtcttatgtt ccagccaagc gtaatatgcc agttcctatc 5460
ttggaaacta aagacacatg ggatagacca gttgatttca ctccaactaa tgatgaaact 5520
tacgatgtaa gatggatgat tgaaggtcgt gagactgaaa gtggatttga atatggtttg 5580
tttgataaag ggtctttctt tgaaactttg tcaggatggg ccaaaggtgt tgtcgttggt 5640
agagcccgtc ttggtggtat tccactgggt gttattggtg ttgaaacaag aactgtcgag 5700
aacttgattc ctgctgatcc agctaatcca aatagtgctg aaacattaat tcaagaacct 5760
ggtcaagttt ggcatccaaa ctccgccttc aagactgctc aagctatcaa tgactttaac 5820
aacggtgaac aattgccaat gatgattttg gccaactgga gaggtttctc tggtggtcaa 5880
cgtgatatgt tcaacgaagt cttgaagtat ggttcgttta ttgttgacgc attggtggat 5940
tacaaacaac caattattat ctatatccca cctaccggtg aactaagagg tggttcatgg 6000
gttgttgtcg atccaactat caacgctgac caaatggaaa tgtatgccga cgtcaacgct 6060
agagctggtg ttttggaacc acaaggtatg gttggtatca agttccgtag agaaaaattg 6120
ctggacacca tgaacagatt ggatgacaag tacagagaat tgagatctca attatccaac 6180
aagagtttgg ctccagaagt acatcagcaa atatccaagc aattagctga tcgtgagaga 6240
gaactattgc caatttacgg acaaatcagt cttcaatttg ctgatttgca cgataggtct 6300
tcacgtatgg tggccaaggg tgttatttct aaggaactgg aatggaccga ggcacgtcgt 6360
ttcttcttct ggagattgag aagaagattg aacgaagaat atttgattaa aaggttgagc 6420
catcaggtag gcgaagcatc aagattagaa aagatcgcaa gaattagatc gtggtaccct 6480
gcttcagtgg accatgaaga tgataggcaa gtcgcaacat ggattgaaga aaactacaaa 6540
actttggacg ataaactaaa gggtttgaaa ttagagtcat tcgctcaaga cttagctaaa 6600
aagatcagaa gcgaccatga caatgctatt gatggattat ctgaagttat caagatgtta 6660
tctaccgatg ataaagaaaa attgttgaag actttgaaat aa 6702
<210> 202
<211> 894
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(894)
<223> 截短的香叶基香叶基焦磷酸合成酶Ag_GPPS_Ntrunc
<400> 202
atgtcttttg acttcaataa gtatatggat tctaaggcta tgaccgtcaa cgaggctttg 60
aataaagcca tcccattgcg ttacccacaa aagatctacg aatctatgag atattctttg 120
ttagctggtg gtaagagagt ccgtccagtt ttgtgtatcg ccgcttgtga attagtcggt 180
ggtactgagg agttagctat tccaaccgcc tgtgccatcg aaatgatcca caccatgtct 240
ttgatgcacg atgatttgcc atgtatcgac aacgatgact tgagacgtgg taaacctacc 300
aatcataaga ttttcggtga agatactgct gttactgccg gtaacgcttt acactcttac 360
gccttcgaac atattgctgt ttctacttcc aagactgttg gtgctgatag aattttgaga 420
atggtttctg aattaggtcg tgctactggt tccgaaggtg ttatgggtgg tcaaatggtc 480
gatattgctt ctgaaggtga cccttccatt gatttgcaaa ctttagaatg gatccacatc 540
cacaagactg ctatgttatt agaatgttct gttgtctgtg gtgccatcat cggtggtgct 600
tctgaaattg ttattgagag agccagacgt tatgctcgtt gtgtcggttt attgtttcaa 660
gttgttgacg acattttaga tgttaccaaa tcttctgacg aattgggtaa aactgctggt 720
aaagatttaa tctccgataa agccacctac cctaagttga tgggtttgga gaaggccaaa 780
gagttttccg atgaattatt aaacagagct aaaggtgaat tgtcttgctt cgatccagtt 840
aaggctgccc cattgttagg tttggctgac tacgttgcct tcagacaaaa ctaa 894
<210> 203
<211> 297
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(297)
<223> 截短的香叶基香叶基焦磷酸合成酶Ag_GPPS_Ntrunc
<400> 203
Met Ser Phe Asp Phe Asn Lys Tyr Met Asp Ser Lys Ala Met Thr Val
1 5 10 15
Asn Glu Ala Leu Asn Lys Ala Ile Pro Leu Arg Tyr Pro Gln Lys Ile
20 25 30
Tyr Glu Ser Met Arg Tyr Ser Leu Leu Ala Gly Gly Lys Arg Val Arg
35 40 45
Pro Val Leu Cys Ile Ala Ala Cys Glu Leu Val Gly Gly Thr Glu Glu
50 55 60
Leu Ala Ile Pro Thr Ala Cys Ala Ile Glu Met Ile His Thr Met Ser
65 70 75 80
Leu Met His Asp Asp Leu Pro Cys Ile Asp Asn Asp Asp Leu Arg Arg
85 90 95
Gly Lys Pro Thr Asn His Lys Ile Phe Gly Glu Asp Thr Ala Val Thr
100 105 110
Ala Gly Asn Ala Leu His Ser Tyr Ala Phe Glu His Ile Ala Val Ser
115 120 125
Thr Ser Lys Thr Val Gly Ala Asp Arg Ile Leu Arg Met Val Ser Glu
130 135 140
Leu Gly Arg Ala Thr Gly Ser Glu Gly Val Met Gly Gly Gln Met Val
145 150 155 160
Asp Ile Ala Ser Glu Gly Asp Pro Ser Ile Asp Leu Gln Thr Leu Glu
165 170 175
Trp Ile His Ile His Lys Thr Ala Met Leu Leu Glu Cys Ser Val Val
180 185 190
Cys Gly Ala Ile Ile Gly Gly Ala Ser Glu Ile Val Ile Glu Arg Ala
195 200 205
Arg Arg Tyr Ala Arg Cys Val Gly Leu Leu Phe Gln Val Val Asp Asp
210 215 220
Ile Leu Asp Val Thr Lys Ser Ser Asp Glu Leu Gly Lys Thr Ala Gly
225 230 235 240
Lys Asp Leu Ile Ser Asp Lys Ala Thr Tyr Pro Lys Leu Met Gly Leu
245 250 255
Glu Lys Ala Lys Glu Phe Ser Asp Glu Leu Leu Asn Arg Ala Lys Gly
260 265 270
Glu Leu Ser Cys Phe Asp Pro Val Lys Ala Ala Pro Leu Leu Gly Leu
275 280 285
Ala Asp Tyr Val Ala Phe Arg Gln Asn
290 295
<210> 204
<211> 1356
<212> DNA
<213> Saccharomyces cerevisiae
<400> 204
ttatttatca agataagttt ccggatcttt ttctttccta acaccccagt cagcctgagt 60
tacatccagc cattgaacct tagaaaatct tttgtcatca gcggtttgag ccctaagatc 120
aacatcttgc ttagcaatca ctgcaatggc gtcataacca ccagcaccag gtattaagca 180
agtaagaact ccttttaagg tctggcaatc atccaataag ctagtttgta cgggaggttc 240
gatatcggca ccagattctt tagttatttt tctaaaggaa cgtctaattg tggcaactgc 300
atctctaact tctgtgatct caggatactt ttgacaggta cagtcattcc tctcaagaga 360
ctcaaatatc tgatcgctgt aatcgtcatg agtctcgtgt aagcgatcta gtttagatag 420
tccatccata aatctagaat ttgcatgatc gagttctgta tatattttca agctttccgg 480
catatgcgaa tcataccaat tttttacctt ctggaccagt tttactgttt ctgaaccatt 540
cttaatatcg cccatccata aagttaatcc cgaaggtaaa tggttacttt taatcgttat 600
attccagtct tcttcattaa ccaaatgcgc cagtttactg ccgtaagtag cacttccaat 660
atctggcaaa ttagagatta atgcgggtgg gaatcttcta tatctgatag atccatatgc 720
tgccgccgct acatcaaacc cgcttccaat tttaccctga gcttgacaat gagcaacttg 780
tgataaatta tgaataactt ctctatattt gtctacatta ttttccaggt ccgatacaaa 840
aaaggaggcc aaagctgtag ttaaaactgt gactaaacct gccgaggagc ccagccctgt 900
tttgggaact tcttcaattc tgtgcgaatg aaaactcaat cttctgttgc cacgatgttc 960
ggtaacgctg tcctcctgag aatggtaggc atcatcagag aaaatatcaa taacgaacaa 1020
gtttctattg cagtagtcgt ccatgttagg cttaaagtag ctaaatacgt tagcgataac 1080
tttttcaatg aaagggttct tagatccgcc tatcgaaaca ggaatgaagc cagttttagg 1140
acttatatgg tacagccact ccccatcttt aaattgttta cttttcacac gcacttcaaa 1200
cttatcagac tcttgcaatg aaccgtaagg atgggctaca gcatgcattc ttgccgataa 1260
tccgactaca aatgcttcat atttcggatc taaaactaaa tatccaccag ctagtaacgc 1320
tttccctggg gcactgaagg ctctcaactc tgacat 1356
<210> 205
<211> 451
<212> PRT
<213> Saccharomyces cerevisiae
<400> 205
Met Ser Glu Leu Arg Ala Phe Ser Ala Pro Gly Lys Ala Leu Leu Ala
1 5 10 15
Gly Gly Tyr Leu Val Leu Asp Pro Lys Tyr Glu Ala Phe Val Val Gly
20 25 30
Leu Ser Ala Arg Met His Ala Val Ala His Pro Tyr Gly Ser Leu Gln
35 40 45
Glu Ser Asp Lys Phe Glu Val Arg Val Lys Ser Lys Gln Phe Lys Asp
50 55 60
Gly Glu Trp Leu Tyr His Ile Ser Pro Lys Thr Gly Phe Ile Pro Val
65 70 75 80
Ser Ile Gly Gly Ser Lys Asn Pro Phe Ile Glu Lys Val Ile Ala Asn
85 90 95
Val Phe Ser Tyr Phe Lys Pro Asn Met Asp Asp Tyr Cys Asn Arg Asn
100 105 110
Leu Phe Val Ile Asp Ile Phe Ser Asp Asp Ala Tyr His Ser Gln Glu
115 120 125
Asp Ser Val Thr Glu His Arg Gly Asn Arg Arg Leu Ser Phe His Ser
130 135 140
His Arg Ile Glu Glu Val Pro Lys Thr Gly Leu Gly Ser Ser Ala Gly
145 150 155 160
Leu Val Thr Val Leu Thr Thr Ala Leu Ala Ser Phe Phe Val Ser Asp
165 170 175
Leu Glu Asn Asn Val Asp Lys Tyr Arg Glu Val Ile His Asn Leu Ser
180 185 190
Gln Val Ala His Cys Gln Ala Gln Gly Lys Ile Gly Ser Gly Phe Asp
195 200 205
Val Ala Ala Ala Ala Tyr Gly Ser Ile Arg Tyr Arg Arg Phe Pro Pro
210 215 220
Ala Leu Ile Ser Asn Leu Pro Asp Ile Gly Ser Ala Thr Tyr Gly Ser
225 230 235 240
Lys Leu Ala His Leu Val Asn Glu Glu Asp Trp Asn Ile Thr Ile Lys
245 250 255
Ser Asn His Leu Pro Ser Gly Leu Thr Leu Trp Met Gly Asp Ile Lys
260 265 270
Asn Gly Ser Glu Thr Val Lys Leu Val Gln Lys Val Lys Asn Trp Tyr
275 280 285
Asp Ser His Met Pro Glu Ser Leu Lys Ile Tyr Thr Glu Leu Asp His
290 295 300
Ala Asn Ser Arg Phe Met Asp Gly Leu Ser Lys Leu Asp Arg Leu His
305 310 315 320
Glu Thr His Asp Asp Tyr Ser Asp Gln Ile Phe Glu Ser Leu Glu Arg
325 330 335
Asn Asp Cys Thr Cys Gln Lys Tyr Pro Glu Ile Thr Glu Val Arg Asp
340 345 350
Ala Val Ala Thr Ile Arg Arg Ser Phe Arg Lys Ile Thr Lys Glu Ser
355 360 365
Gly Ala Asp Ile Glu Pro Pro Val Gln Thr Ser Leu Leu Asp Asp Cys
370 375 380
Gln Thr Leu Lys Gly Val Leu Thr Cys Leu Ile Pro Gly Ala Gly Gly
385 390 395 400
Tyr Asp Ala Ile Ala Val Ile Ala Lys Gln Asp Val Asp Leu Arg Ala
405 410 415
Gln Thr Ala Asp Asp Lys Arg Phe Ser Lys Val Gln Trp Leu Asp Val
420 425 430
Thr Gln Ala Asp Trp Gly Val Arg Lys Glu Lys Asp Pro Glu Thr Tyr
435 440 445
Leu Asp Lys
450
<210> 206
<211> 1332
<212> DNA
<213> Saccharomyces cerevisiae
<400> 206
atgtcattac cgttcttaac ttctgcaccg ggaaaggtta ttatttttgg tgaacactct 60
gctgtgtaca acaagcctgc cgtcgctgct agtgtgtctg cgttgagaac ctacctgcta 120
ataagcgagt catctgcacc agatactatt gaattggact tcccggacat tagctttaat 180
cataagtggt ccatcaatga tttcaatgcc atcaccgagg atcaagtaaa ctcccaaaaa 240
ttggccaagg ctcaacaagc caccgatggc ttgtctcagg aactcgttag tcttttggat 300
ccgttgttag ctcaactatc cgaatccttc cactaccatg cagcgttttg tttcctgtat 360
atgtttgttt gcctatgccc ccatgccaag aatattaagt tttctttaaa gtctacttta 420
cccatcggtg ctgggttggg ctcaagcgcc tctatttctg tatcactggc cttagctatg 480
gcctacttgg gggggttaat aggatctaat gacttggaaa agctgtcaga aaacgataag 540
catatagtga atcaatgggc cttcataggt gaaaagtgta ttcacggtac cccttcagga 600
atagataacg ctgtggccac ttatggtaat gccctgctat ttgaaaaaga ctcacataat 660
ggaacaataa acacaaacaa ttttaagttc ttagatgatt tcccagccat tccaatgatc 720
ctaacctata ctagaattcc aaggtctaca aaagatcttg ttgctcgcgt tcgtgtgttg 780
gtcaccgaga aatttcctga agttatgaag ccaattctag atgccatggg tgaatgtgcc 840
ctacaaggct tagagatcat gactaagtta agtaaatgta aaggcaccga tgacgaggct 900
gtagaaacta ataatgaact gtatgaacaa ctattggaat tgataagaat aaatcatgga 960
ctgcttgtct caatcggtgt ttctcatcct ggattagaac ttattaaaaa tctgagcgat 1020
gatttgagaa ttggctccac aaaacttacc ggtgctggtg gcggcggttg ctctttgact 1080
ttgttacgaa gagacattac tcaagagcaa attgacagtt tcaaaaagaa attgcaagat 1140
gattttagtt acgagacatt tgaaacagac ttgggtggga ctggctgctg tttgttaagc 1200
gcaaaaaatt tgaataaaga tcttaaaatc aaatccctag tattccaatt atttgaaaat 1260
aaaactacca caaagcaaca aattgacgat ctattattgc caggaaacac gaatttacca 1320
tggacttcat aa 1332
<210> 207
<211> 2233
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(2233)
<223> 突变的乙酰辅酶A羧化酶(ACC1) (S659A, S1157A)
<400> 207
Met Ser Glu Glu Ser Leu Phe Glu Ser Ser Pro Gln Lys Met Glu Tyr
1 5 10 15
Glu Ile Thr Asn Tyr Ser Glu Arg His Thr Glu Leu Pro Gly His Phe
20 25 30
Ile Gly Leu Asn Thr Val Asp Lys Leu Glu Glu Ser Pro Leu Arg Asp
35 40 45
Phe Val Lys Ser His Gly Gly His Thr Val Ile Ser Lys Ile Leu Ile
50 55 60
Ala Asn Asn Gly Ile Ala Ala Val Lys Glu Ile Arg Ser Val Arg Lys
65 70 75 80
Trp Ala Tyr Glu Thr Phe Gly Asp Asp Arg Thr Val Gln Phe Val Ala
85 90 95
Met Ala Thr Pro Glu Asp Leu Glu Ala Asn Ala Glu Tyr Ile Arg Met
100 105 110
Ala Asp Gln Tyr Ile Glu Val Pro Gly Gly Thr Asn Asn Asn Asn Tyr
115 120 125
Ala Asn Val Asp Leu Ile Val Asp Ile Ala Glu Arg Ala Asp Val Asp
130 135 140
Ala Val Trp Ala Gly Trp Gly His Ala Ser Glu Asn Pro Leu Leu Pro
145 150 155 160
Glu Lys Leu Ser Gln Ser Lys Arg Lys Val Ile Phe Ile Gly Pro Pro
165 170 175
Gly Asn Ala Met Arg Ser Leu Gly Asp Lys Ile Ser Ser Thr Ile Val
180 185 190
Ala Gln Ser Ala Lys Val Pro Cys Ile Pro Trp Ser Gly Thr Gly Val
195 200 205
Asp Thr Val His Val Asp Glu Lys Thr Gly Leu Val Ser Val Asp Asp
210 215 220
Asp Ile Tyr Gln Lys Gly Cys Cys Thr Ser Pro Glu Asp Gly Leu Gln
225 230 235 240
Lys Ala Lys Arg Ile Gly Phe Pro Val Met Ile Lys Ala Ser Glu Gly
245 250 255
Gly Gly Gly Lys Gly Ile Arg Gln Val Glu Arg Glu Glu Asp Phe Ile
260 265 270
Ala Leu Tyr His Gln Ala Ala Asn Glu Ile Pro Gly Ser Pro Ile Phe
275 280 285
Ile Met Lys Leu Ala Gly Arg Ala Arg His Leu Glu Val Gln Leu Leu
290 295 300
Ala Asp Gln Tyr Gly Thr Asn Ile Ser Leu Phe Gly Arg Asp Cys Ser
305 310 315 320
Val Gln Arg Arg His Gln Lys Ile Ile Glu Glu Ala Pro Val Thr Ile
325 330 335
Ala Lys Ala Glu Thr Phe His Glu Met Glu Lys Ala Ala Val Arg Leu
340 345 350
Gly Lys Leu Val Gly Tyr Val Ser Ala Gly Thr Val Glu Tyr Leu Tyr
355 360 365
Ser His Asp Asp Gly Lys Phe Tyr Phe Leu Glu Leu Asn Pro Arg Leu
370 375 380
Gln Val Glu His Pro Thr Thr Glu Met Val Ser Gly Val Asn Leu Pro
385 390 395 400
Ala Ala Gln Leu Gln Ile Ala Met Gly Ile Pro Met His Arg Ile Ser
405 410 415
Asp Ile Arg Thr Leu Tyr Gly Met Asn Pro His Ser Ala Ser Glu Ile
420 425 430
Asp Phe Glu Phe Lys Thr Gln Asp Ala Thr Lys Lys Gln Arg Arg Pro
435 440 445
Ile Pro Lys Gly His Cys Thr Ala Cys Arg Ile Thr Ser Glu Asp Pro
450 455 460
Asn Asp Gly Phe Lys Pro Ser Gly Gly Thr Leu His Glu Leu Asn Phe
465 470 475 480
Arg Ser Ser Ser Asn Val Trp Gly Tyr Phe Ser Val Gly Asn Asn Gly
485 490 495
Asn Ile His Ser Phe Ser Asp Ser Gln Phe Gly His Ile Phe Ala Phe
500 505 510
Gly Glu Asn Arg Gln Ala Ser Arg Lys His Met Val Val Ala Leu Lys
515 520 525
Glu Leu Ser Ile Arg Gly Asp Phe Arg Thr Thr Val Glu Tyr Leu Ile
530 535 540
Lys Leu Leu Glu Thr Glu Asp Phe Glu Asp Asn Thr Ile Thr Thr Gly
545 550 555 560
Trp Leu Asp Asp Leu Ile Thr His Lys Met Thr Ala Glu Lys Pro Asp
565 570 575
Pro Thr Leu Ala Val Ile Cys Gly Ala Ala Thr Lys Ala Phe Leu Ala
580 585 590
Ser Glu Glu Ala Arg His Lys Tyr Ile Glu Ser Leu Gln Lys Gly Gln
595 600 605
Val Leu Ser Lys Asp Leu Leu Gln Thr Met Phe Pro Val Asp Phe Ile
610 615 620
His Glu Gly Lys Arg Tyr Lys Phe Thr Val Ala Lys Ser Gly Asn Asp
625 630 635 640
Arg Tyr Thr Leu Phe Ile Asn Gly Ser Lys Cys Asp Ile Ile Leu Arg
645 650 655
Gln Leu Ser Asp Gly Gly Leu Leu Ile Ala Ile Gly Gly Lys Ser His
660 665 670
Thr Ile Tyr Trp Lys Glu Glu Val Ala Ala Thr Arg Leu Ser Val Asp
675 680 685
Ser Met Thr Thr Leu Leu Glu Val Glu Asn Asp Pro Thr Gln Leu Arg
690 695 700
Thr Pro Ser Pro Gly Lys Leu Val Lys Phe Leu Val Glu Asn Gly Glu
705 710 715 720
His Ile Ile Lys Gly Gln Pro Tyr Ala Glu Ile Glu Val Met Lys Met
725 730 735
Gln Met Pro Leu Val Ser Gln Glu Asn Gly Ile Val Gln Leu Leu Lys
740 745 750
Gln Pro Gly Ser Thr Ile Val Ala Gly Asp Ile Met Ala Ile Met Thr
755 760 765
Leu Asp Asp Pro Ser Lys Val Lys His Ala Leu Pro Phe Glu Gly Met
770 775 780
Leu Pro Asp Phe Gly Ser Pro Val Ile Glu Gly Thr Lys Pro Ala Tyr
785 790 795 800
Lys Phe Lys Ser Leu Val Ser Thr Leu Glu Asn Ile Leu Lys Gly Tyr
805 810 815
Asp Asn Gln Val Ile Met Asn Ala Ser Leu Gln Gln Leu Ile Glu Val
820 825 830
Leu Arg Asn Pro Lys Leu Pro Tyr Ser Glu Trp Lys Leu His Ile Ser
835 840 845
Ala Leu His Ser Arg Leu Pro Ala Lys Leu Asp Glu Gln Met Glu Glu
850 855 860
Leu Val Ala Arg Ser Leu Arg Arg Gly Ala Val Phe Pro Ala Arg Gln
865 870 875 880
Leu Ser Lys Leu Ile Asp Met Ala Val Lys Asn Pro Glu Tyr Asn Pro
885 890 895
Asp Lys Leu Leu Gly Ala Val Val Glu Pro Leu Ala Asp Ile Ala His
900 905 910
Lys Tyr Ser Asn Gly Leu Glu Ala His Glu His Ser Ile Phe Val His
915 920 925
Phe Leu Glu Glu Tyr Tyr Glu Val Glu Lys Leu Phe Asn Gly Pro Asn
930 935 940
Val Arg Glu Glu Asn Ile Ile Leu Lys Leu Arg Asp Glu Asn Pro Lys
945 950 955 960
Asp Leu Asp Lys Val Ala Leu Thr Val Leu Ser His Ser Lys Val Ser
965 970 975
Ala Lys Asn Asn Leu Ile Leu Ala Ile Leu Lys His Tyr Gln Pro Leu
980 985 990
Cys Lys Leu Ser Ser Lys Val Ser Ala Ile Phe Ser Thr Pro Leu Gln
995 1000 1005
His Ile Val Glu Leu Glu Ser Lys Ala Thr Ala Lys Val Ala Leu Gln
1010 1015 1020
Ala Arg Glu Ile Leu Ile Gln Gly Ala Leu Pro Ser Val Lys Glu Arg
1025 1030 1035 1040
Thr Glu Gln Ile Glu His Ile Leu Lys Ser Ser Val Val Lys Val Ala
1045 1050 1055
Tyr Gly Ser Ser Asn Pro Lys Arg Ser Glu Pro Asp Leu Asn Ile Leu
1060 1065 1070
Lys Asp Leu Ile Asp Ser Asn Tyr Val Val Phe Asp Val Leu Leu Gln
1075 1080 1085
Phe Leu Thr His Gln Asp Pro Val Val Thr Ala Ala Ala Ala Gln Val
1090 1095 1100
Tyr Ile Arg Arg Ala Tyr Arg Ala Tyr Thr Ile Gly Asp Ile Arg Val
1105 1110 1115 1120
His Glu Gly Val Thr Val Pro Ile Val Glu Trp Lys Phe Gln Leu Pro
1125 1130 1135
Ser Ala Ala Phe Ser Thr Phe Pro Thr Val Lys Ser Lys Met Gly Met
1140 1145 1150
Asn Arg Ala Val Ser Val Ser Asp Leu Ser Tyr Val Ala Asn Ser Gln
1155 1160 1165
Ser Ser Pro Leu Arg Glu Gly Ile Leu Met Ala Val Asp His Leu Asp
1170 1175 1180
Asp Val Asp Glu Ile Leu Ser Gln Ser Leu Glu Val Ile Pro Arg His
1185 1190 1195 1200
Gln Ser Ser Ser Asn Gly Pro Ala Pro Asp Arg Ser Gly Ser Ser Ala
1205 1210 1215
Ser Leu Ser Asn Val Ala Asn Val Cys Val Ala Ser Thr Glu Gly Phe
1220 1225 1230
Glu Ser Glu Glu Glu Ile Leu Val Arg Leu Arg Glu Ile Leu Asp Leu
1235 1240 1245
Asn Lys Gln Glu Leu Ile Asn Ala Ser Ile Arg Arg Ile Thr Phe Met
1250 1255 1260
Phe Gly Phe Lys Asp Gly Ser Tyr Pro Lys Tyr Tyr Thr Phe Asn Gly
1265 1270 1275 1280
Pro Asn Tyr Asn Glu Asn Glu Thr Ile Arg His Ile Glu Pro Ala Leu
1285 1290 1295
Ala Phe Gln Leu Glu Leu Gly Arg Leu Ser Asn Phe Asn Ile Lys Pro
1300 1305 1310
Ile Phe Thr Asp Asn Arg Asn Ile His Val Tyr Glu Ala Val Ser Lys
1315 1320 1325
Thr Ser Pro Leu Asp Lys Arg Phe Phe Thr Arg Gly Ile Ile Arg Thr
1330 1335 1340
Gly His Ile Arg Asp Asp Ile Ser Ile Gln Glu Tyr Leu Thr Ser Glu
1345 1350 1355 1360
Ala Asn Arg Leu Met Ser Asp Ile Leu Asp Asn Leu Glu Val Thr Asp
1365 1370 1375
Thr Ser Asn Ser Asp Leu Asn His Ile Phe Ile Asn Phe Ile Ala Val
1380 1385 1390
Phe Asp Ile Ser Pro Glu Asp Val Glu Ala Ala Phe Gly Gly Phe Leu
1395 1400 1405
Glu Arg Phe Gly Lys Arg Leu Leu Arg Leu Arg Val Ser Ser Ala Glu
1410 1415 1420
Ile Arg Ile Ile Ile Lys Asp Pro Gln Thr Gly Ala Pro Val Pro Leu
1425 1430 1435 1440
Arg Ala Leu Ile Asn Asn Val Ser Gly Tyr Val Ile Lys Thr Glu Met
1445 1450 1455
Tyr Thr Glu Val Lys Asn Ala Lys Gly Glu Trp Val Phe Lys Ser Leu
1460 1465 1470
Gly Lys Pro Gly Ser Met His Leu Arg Pro Ile Ala Thr Pro Tyr Pro
1475 1480 1485
Val Lys Glu Trp Leu Gln Pro Lys Arg Tyr Lys Ala His Leu Met Gly
1490 1495 1500
Thr Thr Tyr Val Tyr Asp Phe Pro Glu Leu Phe Arg Gln Ala Ser Ser
1505 1510 1515 1520
Ser Gln Trp Lys Asn Phe Ser Ala Asp Val Lys Leu Thr Asp Asp Phe
1525 1530 1535
Phe Ile Ser Asn Glu Leu Ile Glu Asp Glu Asn Gly Glu Leu Thr Glu
1540 1545 1550
Val Glu Arg Glu Pro Gly Ala Asn Ala Ile Gly Met Val Ala Phe Lys
1555 1560 1565
Ile Thr Val Lys Thr Pro Glu Tyr Pro Arg Gly Arg Gln Phe Val Val
1570 1575 1580
Val Ala Asn Asp Ile Thr Phe Lys Ile Gly Ser Phe Gly Pro Gln Glu
1585 1590 1595 1600
Asp Glu Phe Phe Asn Lys Val Thr Glu Tyr Ala Arg Lys Arg Gly Ile
1605 1610 1615
Pro Arg Ile Tyr Leu Ala Ala Asn Ser Gly Ala Arg Ile Gly Met Ala
1620 1625 1630
Glu Glu Ile Val Pro Leu Phe Gln Val Ala Trp Asn Asp Ala Ala Asn
1635 1640 1645
Pro Asp Lys Gly Phe Gln Tyr Leu Tyr Leu Thr Ser Glu Gly Met Glu
1650 1655 1660
Thr Leu Lys Lys Phe Asp Lys Glu Asn Ser Val Leu Thr Glu Arg Thr
1665 1670 1675 1680
Val Ile Asn Gly Glu Glu Arg Phe Val Ile Lys Thr Ile Ile Gly Ser
1685 1690 1695
Glu Asp Gly Leu Gly Val Glu Cys Leu Arg Gly Ser Gly Leu Ile Ala
1700 1705 1710
Gly Ala Thr Ser Arg Ala Tyr His Asp Ile Phe Thr Ile Thr Leu Val
1715 1720 1725
Thr Cys Arg Ser Val Gly Ile Gly Ala Tyr Leu Val Arg Leu Gly Gln
1730 1735 1740
Arg Ala Ile Gln Val Glu Gly Gln Pro Ile Ile Leu Thr Gly Ala Pro
1745 1750 1755 1760
Ala Ile Asn Lys Met Leu Gly Arg Glu Val Tyr Thr Ser Asn Leu Gln
1765 1770 1775
Leu Gly Gly Thr Gln Ile Met Tyr Asn Asn Gly Val Ser His Leu Thr
1780 1785 1790
Ala Val Asp Asp Leu Ala Gly Val Glu Lys Ile Val Glu Trp Met Ser
1795 1800 1805
Tyr Val Pro Ala Lys Arg Asn Met Pro Val Pro Ile Leu Glu Thr Lys
1810 1815 1820
Asp Thr Trp Asp Arg Pro Val Asp Phe Thr Pro Thr Asn Asp Glu Thr
1825 1830 1835 1840
Tyr Asp Val Arg Trp Met Ile Glu Gly Arg Glu Thr Glu Ser Gly Phe
1845 1850 1855
Glu Tyr Gly Leu Phe Asp Lys Gly Ser Phe Phe Glu Thr Leu Ser Gly
1860 1865 1870
Trp Ala Lys Gly Val Val Val Gly Arg Ala Arg Leu Gly Gly Ile Pro
1875 1880 1885
Leu Gly Val Ile Gly Val Glu Thr Arg Thr Val Glu Asn Leu Ile Pro
1890 1895 1900
Ala Asp Pro Ala Asn Pro Asn Ser Ala Glu Thr Leu Ile Gln Glu Pro
1905 1910 1915 1920
Gly Gln Val Trp His Pro Asn Ser Ala Phe Lys Thr Ala Gln Ala Ile
1925 1930 1935
Asn Asp Phe Asn Asn Gly Glu Gln Leu Pro Met Met Ile Leu Ala Asn
1940 1945 1950
Trp Arg Gly Phe Ser Gly Gly Gln Arg Asp Met Phe Asn Glu Val Leu
1955 1960 1965
Lys Tyr Gly Ser Phe Ile Val Asp Ala Leu Val Asp Tyr Lys Gln Pro
1970 1975 1980
Ile Ile Ile Tyr Ile Pro Pro Thr Gly Glu Leu Arg Gly Gly Ser Trp
1985 1990 1995 2000
Val Val Val Asp Pro Thr Ile Asn Ala Asp Gln Met Glu Met Tyr Ala
2005 2010 2015
Asp Val Asn Ala Arg Ala Gly Val Leu Glu Pro Gln Gly Met Val Gly
2020 2025 2030
Ile Lys Phe Arg Arg Glu Lys Leu Leu Asp Thr Met Asn Arg Leu Asp
2035 2040 2045
Asp Lys Tyr Arg Glu Leu Arg Ser Gln Leu Ser Asn Lys Ser Leu Ala
2050 2055 2060
Pro Glu Val His Gln Gln Ile Ser Lys Gln Leu Ala Asp Arg Glu Arg
2065 2070 2075 2080
Glu Leu Leu Pro Ile Tyr Gly Gln Ile Ser Leu Gln Phe Ala Asp Leu
2085 2090 2095
His Asp Arg Ser Ser Arg Met Val Ala Lys Gly Val Ile Ser Lys Glu
2100 2105 2110
Leu Glu Trp Thr Glu Ala Arg Arg Phe Phe Phe Trp Arg Leu Arg Arg
2115 2120 2125
Arg Leu Asn Glu Glu Tyr Leu Ile Lys Arg Leu Ser His Gln Val Gly
2130 2135 2140
Glu Ala Ser Arg Leu Glu Lys Ile Ala Arg Ile Arg Ser Trp Tyr Pro
2145 2150 2155 2160
Ala Ser Val Asp His Glu Asp Asp Arg Gln Val Ala Thr Trp Ile Glu
2165 2170 2175
Glu Asn Tyr Lys Thr Leu Asp Asp Lys Leu Lys Gly Leu Lys Leu Glu
2180 2185 2190
Ser Phe Ala Gln Asp Leu Ala Lys Lys Ile Arg Ser Asp His Asp Asn
2195 2200 2205
Ala Ile Asp Gly Leu Ser Glu Val Ile Lys Met Leu Ser Thr Asp Asp
2210 2215 2220
Lys Glu Lys Leu Leu Lys Thr Leu Lys
2225 2230
<210> 208
<211> 524
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(524)
<223> 截短的3-羟基-3-甲基-戊二酰辅酶A还原酶(Sc_tHMG1)
<400> 208
Met Gln Leu Val Lys Thr Glu Val Thr Lys Lys Ser Phe Thr Ala Pro
1 5 10 15
Val Gln Lys Ala Ser Thr Pro Val Leu Thr Asn Lys Thr Val Ile Ser
20 25 30
Gly Ser Lys Val Lys Ser Leu Ser Ser Ala Gln Ser Ser Ser Ser Gly
35 40 45
Pro Ser Ser Ser Ser Glu Glu Asp Asp Ser Arg Asp Ile Glu Ser Leu
50 55 60
Asp Lys Lys Ile Arg Pro Leu Glu Glu Leu Glu Ala Leu Leu Ser Ser
65 70 75 80
Gly Asn Thr Lys Gln Leu Lys Asn Lys Glu Val Ala Ala Leu Val Ile
85 90 95
His Gly Lys Leu Pro Leu Tyr Ala Leu Glu Lys Lys Leu Gly Asp Thr
100 105 110
Thr Arg Ala Val Ala Val Arg Arg Lys Ala Leu Ser Ile Leu Ala Glu
115 120 125
Ala Pro Val Leu Ala Ser Asp Arg Leu Pro Tyr Lys Asn Tyr Asp Tyr
130 135 140
Asp Arg Val Phe Gly Ala Cys Cys Glu Asn Val Ile Gly Tyr Met Pro
145 150 155 160
Leu Pro Val Gly Val Ile Gly Pro Leu Val Ile Asp Gly Thr Ser Tyr
165 170 175
His Ile Pro Met Ala Thr Thr Glu Gly Cys Leu Val Ala Ser Ala Met
180 185 190
Arg Gly Cys Lys Ala Ile Asn Ala Gly Gly Gly Ala Thr Thr Val Leu
195 200 205
Thr Lys Asp Gly Met Thr Arg Gly Pro Val Val Arg Phe Pro Thr Leu
210 215 220
Lys Arg Ser Gly Ala Cys Lys Ile Trp Leu Asp Ser Glu Glu Gly Gln
225 230 235 240
Asn Ala Ile Lys Lys Ala Phe Asn Ser Thr Ser Arg Phe Ala Arg Leu
245 250 255
Gln His Ile Gln Thr Cys Leu Ala Gly Asp Leu Leu Phe Met Arg Phe
260 265 270
Arg Thr Thr Thr Gly Asp Ala Met Gly Met Asn Met Ile Ser Lys Gly
275 280 285
Val Glu Tyr Ser Leu Lys Gln Met Val Glu Glu Tyr Gly Trp Glu Asp
290 295 300
Met Glu Val Val Ser Val Ser Gly Asn Tyr Cys Thr Asp Lys Lys Pro
305 310 315 320
Ala Ala Ile Asn Trp Ile Glu Gly Arg Gly Lys Ser Val Val Ala Glu
325 330 335
Ala Thr Ile Pro Gly Asp Val Val Arg Lys Val Leu Lys Ser Asp Val
340 345 350
Ser Ala Leu Val Glu Leu Asn Ile Ala Lys Asn Leu Val Gly Ser Ala
355 360 365
Met Ala Gly Ser Val Gly Gly Phe Asn Ala His Ala Ala Asn Leu Val
370 375 380
Thr Ala Val Phe Leu Ala Leu Gly Gln Asp Pro Ala Gln Asn Val Glu
385 390 395 400
Ser Ser Asn Cys Ile Thr Leu Met Lys Glu Val Asp Gly Asp Leu Arg
405 410 415
Ile Ser Val Ser Met Pro Ser Ile Glu Val Gly Thr Ile Gly Gly Gly
420 425 430
Thr Val Leu Glu Pro Gln Gly Ala Met Leu Asp Leu Leu Gly Val Arg
435 440 445
Gly Pro His Ala Thr Ala Pro Gly Thr Asn Ala Arg Gln Leu Ala Arg
450 455 460
Ile Val Ala Cys Ala Val Leu Ala Gly Glu Leu Ser Leu Cys Ala Ala
465 470 475 480
Leu Ala Ala Gly His Leu Val Gln Ser His Met Thr His Asn Arg Lys
485 490 495
Pro Ala Glu Pro Thr Lys Pro Asn Asn Leu Asp Ala Thr Asp Ile Asn
500 505 510
Arg Leu Lys Asp Gly Ser Val Thr Cys Ile Lys Ser
515 520
<210> 209
<211> 1197
<212> DNA
<213> Saccharomyces cerevisiae
<400> 209
atgtctcaga acgtttacat tgtatcgact gccagaaccc caattggttc attccagggt 60
tctctatcct ccaagacagc agtggaattg ggtgctgttg ctttaaaagg cgccttggct 120
aaggttccag aattggatgc atccaaggat tttgacgaaa ttatttttgg taacgttctt 180
tctgccaatt tgggccaagc tccggccaga caagttgctt tggctgccgg tttgagtaat 240
catatcgttg caagcacagt taacaaggtc tgtgcatccg ctatgaaggc aatcattttg 300
ggtgctcaat ccatcaaatg tggtaatgct gatgttgtcg tagctggtgg ttgtgaatct 360
atgactaacg caccatacta catgccagca gcccgtgcgg gtgccaaatt tggccaaact 420
gttcttgttg atggtgtcga aagagatggg ttgaacgatg cgtacgatgg tctagccatg 480
ggtgtacacg cagaaaagtg tgcccgtgat tgggatatta ctagagaaca acaagacaat 540
tttgccatcg aatcctacca aaaatctcaa aaatctcaaa aggaaggtaa attcgacaat 600
gaaattgtac ctgttaccat taagggattt agaggtaagc ctgatactca agtcacgaag 660
gacgaggaac ctgctagatt acacgttgaa aaattgagat ctgcaaggac tgttttccaa 720
aaagaaaacg gtactgttac tgccgctaac gcttctccaa tcaacgatgg tgctgcagcc 780
gtcatcttgg tttccgaaaa agttttgaag gaaaagaatt tgaagccttt ggctattatc 840
aaaggttggg gtgaggccgc tcatcaacca gctgatttta catgggctcc atctcttgca 900
gttccaaagg ctttgaaaca tgctggcatc gaagacatca attctgttga ttactttgaa 960
ttcaatgaag ccttttcggt tgtcggtttg gtgaacacta agattttgaa gctagaccca 1020
tctaaggtta atgtatatgg tggtgctgtt gctctaggtc acccattggg ttgttctggt 1080
gctagagtgg ttgttacact gctatccatc ttacagcaag aaggaggtaa gatcggtgtt 1140
gccgccattt gtaatggtgg tggtggtgct tcctctattg tcattgaaaa gatatga 1197
<210> 210
<211> 867
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(867)
<223> 人工截短的香叶基焦磷酸橄榄醇酸香叶基转移酶CsPT4_t112
<400> 210
atgtcttacg ttgtcaaggg tatgatctct attgcttgtg gtttgttcgg tagagaattg 60
tttaacaaca gacacttgtt ctcttggggt ttgatgtgga aagctttctt cgctttggtc 120
ccaattttgt ctttcaattt cttcgccgcc atcatgaacc aaatctacga tgttgatatc 180
gaccgtatca acaagccaga cttaccttta gtttccggtg aaatgtccat tgaaactgct 240
tggatcttgt ctatcattgt tgccttgact ggtttaattg ttactattaa gttgaagtcc 300
gctccattgt ttgtcttcat ctacatcttc ggtatcttcg ctggtttcgc ttactccgtc 360
ccacctatta gatggaaaca atatcctttt accaatttct tgatcactat ttcctctcat 420
gttggtttgg ctttcacttc ttactctgcc accacttctg ctttaggttt gcctttcgtt 480
tggcgtcctg ccttctcttt cattattgct ttcatgactg tcatgggtat gactattgcc 540
tttgctaaag acatttctga tatcgaaggt gatgctaagt acggtgtctc taccgttgct 600
accaagttag gtgctagaaa tatgactttt gttgtttctg gtgtcttatt gttgaactac 660
ttggtttcta tctctattgg tatcatttgg ccacaagttt tcaagtctaa cattatgatc 720
ttgtctcatg ctattttggc tttctgtttg atctttcaaa ctcgtgaatt agccttagcc 780
aattatgcct ctgccccatc ccgtcaattt ttcgaattca tctggttgtt atactatgcc 840
gaatacttcg tttacgtctt catttaa 867
<210> 211
<211> 288
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(288)
<223> 截短的香叶基焦磷酸橄榄醇酸香叶基转移酶CsPT4_t112
<400> 211
Met Ser Tyr Val Val Lys Gly Met Ile Ser Ile Ala Cys Gly Leu Phe
1 5 10 15
Gly Arg Glu Leu Phe Asn Asn Arg His Leu Phe Ser Trp Gly Leu Met
20 25 30
Trp Lys Ala Phe Phe Ala Leu Val Pro Ile Leu Ser Phe Asn Phe Phe
35 40 45
Ala Ala Ile Met Asn Gln Ile Tyr Asp Val Asp Ile Asp Arg Ile Asn
50 55 60
Lys Pro Asp Leu Pro Leu Val Ser Gly Glu Met Ser Ile Glu Thr Ala
65 70 75 80
Trp Ile Leu Ser Ile Ile Val Ala Leu Thr Gly Leu Ile Val Thr Ile
85 90 95
Lys Leu Lys Ser Ala Pro Leu Phe Val Phe Ile Tyr Ile Phe Gly Ile
100 105 110
Phe Ala Gly Phe Ala Tyr Ser Val Pro Pro Ile Arg Trp Lys Gln Tyr
115 120 125
Pro Phe Thr Asn Phe Leu Ile Thr Ile Ser Ser His Val Gly Leu Ala
130 135 140
Phe Thr Ser Tyr Ser Ala Thr Thr Ser Ala Leu Gly Leu Pro Phe Val
145 150 155 160
Trp Arg Pro Ala Phe Ser Phe Ile Ile Ala Phe Met Thr Val Met Gly
165 170 175
Met Thr Ile Ala Phe Ala Lys Asp Ile Ser Asp Ile Glu Gly Asp Ala
180 185 190
Lys Tyr Gly Val Ser Thr Val Ala Thr Lys Leu Gly Ala Arg Asn Met
195 200 205
Thr Phe Val Val Ser Gly Val Leu Leu Leu Asn Tyr Leu Val Ser Ile
210 215 220
Ser Ile Gly Ile Ile Trp Pro Gln Val Phe Lys Ser Asn Ile Met Ile
225 230 235 240
Leu Ser His Ala Ile Leu Ala Phe Cys Leu Ile Phe Gln Thr Arg Glu
245 250 255
Leu Ala Leu Ala Asn Tyr Ala Ser Ala Pro Ser Arg Gln Phe Phe Glu
260 265 270
Phe Ile Trp Leu Leu Tyr Tyr Ala Glu Tyr Phe Val Tyr Val Phe Ile
275 280 285
<210> 212
<211> 810
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(810)
<223> 人工截短的香叶基焦磷酸橄榄醇酸香叶基转移酶CsPT4_t131核苷酸序列
<400> 212
atgtctaaca acagacactt gttctcttgg ggtttgatgt ggaaagcttt cttcgctttg 60
gtcccaattt tgtctttcaa tttcttcgcc gccatcatga accaaatcta cgatgttgat 120
atcgaccgta tcaacaagcc agacttacct ttagtttccg gtgaaatgtc cattgaaact 180
gcttggatct tgtctatcat tgttgccttg actggtttaa ttgttactat taagttgaag 240
tccgctccat tgtttgtctt catctacatc ttcggtatct tcgctggttt cgcttactcc 300
gtcccaccta ttagatggaa acaatatcct tttaccaatt tcttgatcac tatttcctct 360
catgttggtt tggctttcac ttcttactct gccaccactt ctgctttagg tttgcctttc 420
gtttggcgtc ctgccttctc tttcattatt gctttcatga ctgtcatggg tatgactatt 480
gcctttgcta aagacatttc tgatatcgaa ggtgatgcta agtacggtgt ctctaccgtt 540
gctaccaagt taggtgctag aaatatgact tttgttgttt ctggtgtctt attgttgaac 600
tacttggttt ctatctctat tggtatcatt tggccacaag ttttcaagtc taacattatg 660
atcttgtctc atgctatttt ggctttctgt ttgatctttc aaactcgtga attagcctta 720
gccaattatg cctctgcccc atcccgtcaa tttttcgaat tcatctggtt gttatactat 780
gccgaatact tcgtttacgt cttcatttaa 810
<210> 213
<211> 269
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(269)
<223> 截短的香叶基焦磷酸橄榄醇酸香叶基转移酶CsPT4_t131
<400> 213
Met Ser Asn Asn Arg His Leu Phe Ser Trp Gly Leu Met Trp Lys Ala
1 5 10 15
Phe Phe Ala Leu Val Pro Ile Leu Ser Phe Asn Phe Phe Ala Ala Ile
20 25 30
Met Asn Gln Ile Tyr Asp Val Asp Ile Asp Arg Ile Asn Lys Pro Asp
35 40 45
Leu Pro Leu Val Ser Gly Glu Met Ser Ile Glu Thr Ala Trp Ile Leu
50 55 60
Ser Ile Ile Val Ala Leu Thr Gly Leu Ile Val Thr Ile Lys Leu Lys
65 70 75 80
Ser Ala Pro Leu Phe Val Phe Ile Tyr Ile Phe Gly Ile Phe Ala Gly
85 90 95
Phe Ala Tyr Ser Val Pro Pro Ile Arg Trp Lys Gln Tyr Pro Phe Thr
100 105 110
Asn Phe Leu Ile Thr Ile Ser Ser His Val Gly Leu Ala Phe Thr Ser
115 120 125
Tyr Ser Ala Thr Thr Ser Ala Leu Gly Leu Pro Phe Val Trp Arg Pro
130 135 140
Ala Phe Ser Phe Ile Ile Ala Phe Met Thr Val Met Gly Met Thr Ile
145 150 155 160
Ala Phe Ala Lys Asp Ile Ser Asp Ile Glu Gly Asp Ala Lys Tyr Gly
165 170 175
Val Ser Thr Val Ala Thr Lys Leu Gly Ala Arg Asn Met Thr Phe Val
180 185 190
Val Ser Gly Val Leu Leu Leu Asn Tyr Leu Val Ser Ile Ser Ile Gly
195 200 205
Ile Ile Trp Pro Gln Val Phe Lys Ser Asn Ile Met Ile Leu Ser His
210 215 220
Ala Ile Leu Ala Phe Cys Leu Ile Phe Gln Thr Arg Glu Leu Ala Leu
225 230 235 240
Ala Asn Tyr Ala Ser Ala Pro Ser Arg Gln Phe Phe Glu Phe Ile Trp
245 250 255
Leu Leu Tyr Tyr Ala Glu Tyr Phe Val Tyr Val Phe Ile
260 265
<210> 214
<211> 777
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(777)
<223> 人工截短的香叶基焦磷酸橄榄醇酸香叶基转移酶CsPT4_t142核苷酸序列
<400> 214
atgtcttgga aagctttctt cgctttggtc ccaattttgt ctttcaattt cttcgccgcc 60
atcatgaacc aaatctacga tgttgatatc gaccgtatca acaagccaga cttaccttta 120
gtttccggtg aaatgtccat tgaaactgct tggatcttgt ctatcattgt tgccttgact 180
ggtttaattg ttactattaa gttgaagtcc gctccattgt ttgtcttcat ctacatcttc 240
ggtatcttcg ctggtttcgc ttactccgtc ccacctatta gatggaaaca atatcctttt 300
accaatttct tgatcactat ttcctctcat gttggtttgg ctttcacttc ttactctgcc 360
accacttctg ctttaggttt gcctttcgtt tggcgtcctg ccttctcttt cattattgct 420
ttcatgactg tcatgggtat gactattgcc tttgctaaag acatttctga tatcgaaggt 480
gatgctaagt acggtgtctc taccgttgct accaagttag gtgctagaaa tatgactttt 540
gttgtttctg gtgtcttatt gttgaactac ttggtttcta tctctattgg tatcatttgg 600
ccacaagttt tcaagtctaa cattatgatc ttgtctcatg ctattttggc tttctgtttg 660
atctttcaaa ctcgtgaatt agccttagcc aattatgcct ctgccccatc ccgtcaattt 720
ttcgaattca tctggttgtt atactatgcc gaatacttcg tttacgtctt catttaa 777
<210> 215
<211> 258
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(258)
<223> 截短的香叶基焦磷酸橄榄醇酸香叶基转移酶CsPT4_t142
<400> 215
Met Ser Trp Lys Ala Phe Phe Ala Leu Val Pro Ile Leu Ser Phe Asn
1 5 10 15
Phe Phe Ala Ala Ile Met Asn Gln Ile Tyr Asp Val Asp Ile Asp Arg
20 25 30
Ile Asn Lys Pro Asp Leu Pro Leu Val Ser Gly Glu Met Ser Ile Glu
35 40 45
Thr Ala Trp Ile Leu Ser Ile Ile Val Ala Leu Thr Gly Leu Ile Val
50 55 60
Thr Ile Lys Leu Lys Ser Ala Pro Leu Phe Val Phe Ile Tyr Ile Phe
65 70 75 80
Gly Ile Phe Ala Gly Phe Ala Tyr Ser Val Pro Pro Ile Arg Trp Lys
85 90 95
Gln Tyr Pro Phe Thr Asn Phe Leu Ile Thr Ile Ser Ser His Val Gly
100 105 110
Leu Ala Phe Thr Ser Tyr Ser Ala Thr Thr Ser Ala Leu Gly Leu Pro
115 120 125
Phe Val Trp Arg Pro Ala Phe Ser Phe Ile Ile Ala Phe Met Thr Val
130 135 140
Met Gly Met Thr Ile Ala Phe Ala Lys Asp Ile Ser Asp Ile Glu Gly
145 150 155 160
Asp Ala Lys Tyr Gly Val Ser Thr Val Ala Thr Lys Leu Gly Ala Arg
165 170 175
Asn Met Thr Phe Val Val Ser Gly Val Leu Leu Leu Asn Tyr Leu Val
180 185 190
Ser Ile Ser Ile Gly Ile Ile Trp Pro Gln Val Phe Lys Ser Asn Ile
195 200 205
Met Ile Leu Ser His Ala Ile Leu Ala Phe Cys Leu Ile Phe Gln Thr
210 215 220
Arg Glu Leu Ala Leu Ala Asn Tyr Ala Ser Ala Pro Ser Arg Gln Phe
225 230 235 240
Phe Glu Phe Ile Trp Leu Leu Tyr Tyr Ala Glu Tyr Phe Val Tyr Val
245 250 255
Phe Ile
<210> 216
<211> 705
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(705)
<223> 人工截短的香叶基焦磷酸橄榄醇酸香叶基转移酶CsPT4_t166核苷酸序列
<400> 216
atgtctgatg ttgatatcga ccgtatcaac aagccagact tacctttagt ttccggtgaa 60
atgtccattg aaactgcttg gatcttgtct atcattgttg ccttgactgg tttaattgtt 120
actattaagt tgaagtccgc tccattgttt gtcttcatct acatcttcgg tatcttcgct 180
ggtttcgctt actccgtccc acctattaga tggaaacaat atccttttac caatttcttg 240
atcactattt cctctcatgt tggtttggct ttcacttctt actctgccac cacttctgct 300
ttaggtttgc ctttcgtttg gcgtcctgcc ttctctttca ttattgcttt catgactgtc 360
atgggtatga ctattgcctt tgctaaagac atttctgata tcgaaggtga tgctaagtac 420
ggtgtctcta ccgttgctac caagttaggt gctagaaata tgacttttgt tgtttctggt 480
gtcttattgt tgaactactt ggtttctatc tctattggta tcatttggcc acaagttttc 540
aagtctaaca ttatgatctt gtctcatgct attttggctt tctgtttgat ctttcaaact 600
cgtgaattag ccttagccaa ttatgcctct gccccatccc gtcaattttt cgaattcatc 660
tggttgttat actatgccga atacttcgtt tacgtcttca tttaa 705
<210> 217
<211> 234
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(234)
<223> 截短的香叶基焦磷酸橄榄醇酸香叶基转移酶CsPT4_t166
<400> 217
Met Ser Asp Val Asp Ile Asp Arg Ile Asn Lys Pro Asp Leu Pro Leu
1 5 10 15
Val Ser Gly Glu Met Ser Ile Glu Thr Ala Trp Ile Leu Ser Ile Ile
20 25 30
Val Ala Leu Thr Gly Leu Ile Val Thr Ile Lys Leu Lys Ser Ala Pro
35 40 45
Leu Phe Val Phe Ile Tyr Ile Phe Gly Ile Phe Ala Gly Phe Ala Tyr
50 55 60
Ser Val Pro Pro Ile Arg Trp Lys Gln Tyr Pro Phe Thr Asn Phe Leu
65 70 75 80
Ile Thr Ile Ser Ser His Val Gly Leu Ala Phe Thr Ser Tyr Ser Ala
85 90 95
Thr Thr Ser Ala Leu Gly Leu Pro Phe Val Trp Arg Pro Ala Phe Ser
100 105 110
Phe Ile Ile Ala Phe Met Thr Val Met Gly Met Thr Ile Ala Phe Ala
115 120 125
Lys Asp Ile Ser Asp Ile Glu Gly Asp Ala Lys Tyr Gly Val Ser Thr
130 135 140
Val Ala Thr Lys Leu Gly Ala Arg Asn Met Thr Phe Val Val Ser Gly
145 150 155 160
Val Leu Leu Leu Asn Tyr Leu Val Ser Ile Ser Ile Gly Ile Ile Trp
165 170 175
Pro Gln Val Phe Lys Ser Asn Ile Met Ile Leu Ser His Ala Ile Leu
180 185 190
Ala Phe Cys Leu Ile Phe Gln Thr Arg Glu Leu Ala Leu Ala Asn Tyr
195 200 205
Ala Ser Ala Pro Ser Arg Gln Phe Phe Glu Phe Ile Trp Leu Leu Tyr
210 215 220
Tyr Ala Glu Tyr Phe Val Tyr Val Phe Ile
225 230
<210> 218
<211> 645
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(645)
<223> 人工截短的香叶基焦磷酸橄榄醇酸香叶基转移酶CsPT4_t186核苷酸序列
<400> 218
atgtctattg aaactgcttg gatcttgtct atcattgttg ccttgactgg tttaattgtt 60
actattaagt tgaagtccgc tccattgttt gtcttcatct acatcttcgg tatcttcgct 120
ggtttcgctt actccgtccc acctattaga tggaaacaat atccttttac caatttcttg 180
atcactattt cctctcatgt tggtttggct ttcacttctt actctgccac cacttctgct 240
ttaggtttgc ctttcgtttg gcgtcctgcc ttctctttca ttattgcttt catgactgtc 300
atgggtatga ctattgcctt tgctaaagac atttctgata tcgaaggtga tgctaagtac 360
ggtgtctcta ccgttgctac caagttaggt gctagaaata tgacttttgt tgtttctggt 420
gtcttattgt tgaactactt ggtttctatc tctattggta tcatttggcc acaagttttc 480
aagtctaaca ttatgatctt gtctcatgct attttggctt tctgtttgat ctttcaaact 540
cgtgaattag ccttagccaa ttatgcctct gccccatccc gtcaattttt cgaattcatc 600
tggttgttat actatgccga atacttcgtt tacgtcttca tttaa 645
<210> 219
<211> 214
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(214)
<223> 截短的香叶基焦磷酸橄榄醇酸香叶基转移酶CsPT4_t186
<400> 219
Met Ser Ile Glu Thr Ala Trp Ile Leu Ser Ile Ile Val Ala Leu Thr
1 5 10 15
Gly Leu Ile Val Thr Ile Lys Leu Lys Ser Ala Pro Leu Phe Val Phe
20 25 30
Ile Tyr Ile Phe Gly Ile Phe Ala Gly Phe Ala Tyr Ser Val Pro Pro
35 40 45
Ile Arg Trp Lys Gln Tyr Pro Phe Thr Asn Phe Leu Ile Thr Ile Ser
50 55 60
Ser His Val Gly Leu Ala Phe Thr Ser Tyr Ser Ala Thr Thr Ser Ala
65 70 75 80
Leu Gly Leu Pro Phe Val Trp Arg Pro Ala Phe Ser Phe Ile Ile Ala
85 90 95
Phe Met Thr Val Met Gly Met Thr Ile Ala Phe Ala Lys Asp Ile Ser
100 105 110
Asp Ile Glu Gly Asp Ala Lys Tyr Gly Val Ser Thr Val Ala Thr Lys
115 120 125
Leu Gly Ala Arg Asn Met Thr Phe Val Val Ser Gly Val Leu Leu Leu
130 135 140
Asn Tyr Leu Val Ser Ile Ser Ile Gly Ile Ile Trp Pro Gln Val Phe
145 150 155 160
Lys Ser Asn Ile Met Ile Leu Ser His Ala Ile Leu Ala Phe Cys Leu
165 170 175
Ile Phe Gln Thr Arg Glu Leu Ala Leu Ala Asn Tyr Ala Ser Ala Pro
180 185 190
Ser Arg Gln Phe Phe Glu Phe Ile Trp Leu Leu Tyr Tyr Ala Glu Tyr
195 200 205
Phe Val Tyr Val Phe Ile
210
<210> 220
<211> 1188
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(1188)
<223> 人工香叶基焦磷酸橄榄醇酸香叶基转移酶CsGOT (CsPT1)核苷酸序列
<400> 220
atgggtttat cttccgtttg tactttttct ttccaaacta actaccacac tttgttaaat 60
ccacacaaca acaaccctaa aacctccttg ttatgttaca gacacccaaa gacccctatt 120
aaatactcct acaacaactt cccatccaaa cactgctcca ctaagtcctt tcacttgcaa 180
aacaagtgtt ctgaatcctt gtccattgcc aagaactcta ttcgtgccgc tactactaac 240
caaactgagc cacctgaatc cgataaccac tccgtcgcca ccaagatctt gaattttggt 300
aaagcttgct ggaaattgca aagaccatac actattattg ctttcacttc ctgtgcttgt 360
ggtttattcg gtaaggaatt attgcataac accaacttga tttcttggtc cttaatgttc 420
aaagccttct tctttttagt tgccatttta tgtattgctt ctttcactac tactattaat 480
caaatttacg atttgcacat tgacagaatc aataagcctg acttgccatt agcttccggt 540
gaaatttctg ttaacactgc ttggatcatg tccatcattg tcgctttgtt cggtttaatt 600
atcaccatca aaatgaaggg tggtcctttg tacatcttcg gttattgctt cggtattttc 660
ggtggtattg tctactctgt cccaccattc agatggaagc aaaacccatc cactgccttt 720
ttgttgaatt tcttggctca catcattacc aattttactt tctactatgc ctcccgtgct 780
gctttaggtt tgccttttga gttacgtcca tccttcactt ttttattggc ttttatgaag 840
tccatgggtt ctgctttagc cttaattaag gacgcctctg acgttgaagg tgatactaag 900
ttcggtatct ctactttagc ctctaagtac ggttctcgta acttgacctt gttctgttct 960
ggtattgtct tgttgtctta cgtcgccgct attttggccg gtatcatctg gccacaagct 1020
ttcaactcta acgttatgtt gttgtctcat gctatcttag ctttctggtt gatcttacaa 1080
accagagact tcgctttgac taactacgac ccagaagccg gtcgtagatt ctacgaattc 1140
atgtggaaat tgtactacgc cgagtacttg gtctacgttt tcatttag 1188
<210> 221
<211> 972
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(972)
<223> 人工截短的香叶基焦磷酸橄榄醇酸香叶基转移酶CsPT4t核苷酸序列
<400> 221
atgtctgctg gctctgacca aattgaaggt tccccgcatc acgaatcaga taatagtatt 60
gccacaaaga tcttaaactt tgggcataca tgttggaaat tacaaaggcc ctacgtcgtc 120
aaaggaatga taagcatcgc ttgcggtctg ttcggaaggg aattatttaa caataggcat 180
ctattcagct gggggttaat gtggaaagct ttcttcgcgt tagtgccaat cctaagcttt 240
aactttttcg ccgccatcat gaaccagatt tatgatgttg atatcgacag gataaataag 300
ccagatcttc cattggtatc cggtgaaatg tcaatagaaa ctgcatggat attatctatt 360
atcgttgcgc tgaccggact gatagtaaca atcaaattga aatctgcacc cctgtttgtt 420
tttatatata tatttggtat tttcgctgga ttcgcttact cagtgccacc tatcaggtgg 480
aagcagtacc cattcacgaa ttttctgatc acgatctcta gccacgtcgg gttagcgttc 540
acatcttact ctgcaaccac gagtgccttg gggcttcctt tcgtctggcg tccagctttt 600
agttttatca ttgcctttat gaccgtaatg ggaatgacga tcgcattcgc aaaggacatt 660
tctgacatag agggggatgc aaaatacggt gtctccactg tggcgacaaa attaggagct 720
aggaatatga ctttcgtggt gtccggtgta ttattactaa attatctggt atctataagt 780
atcggcatca tatggccgca agtgtttaaa tccaacatta tgatactgag tcatgctatt 840
ttggcttttt gtctgatttt tcagacgcgt gagttggcgc ttgcaaacta tgcctctgcg 900
cccagcaggc agttttttga attcatatgg ttattgtact atgccgagta tttcgtctac 960
gtatttattt aa 972
<210> 222
<211> 969
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(969)
<223> 人工截短的香叶基焦磷酸橄榄醇酸香叶基转移酶CsGOT_t75 (CsPT1_t75)核苷酸序列
<400> 222
atgtctgccg ctactactaa ccaaactgag ccacctgaat ccgataacca ctccgtcgcc 60
accaagatct tgaattttgg taaagcttgc tggaaattgc aaagaccata cactattatt 120
gctttcactt cctgtgcttg tggtttattc ggtaaggaat tattgcataa caccaacttg 180
atttcttggt ccttaatgtt caaagccttc ttctttttag ttgccatttt atgtattgct 240
tctttcacta ctactattaa tcaaatttac gatttgcaca ttgacagaat caataagcct 300
gacttgccat tagcttccgg tgaaatttct gttaacactg cttggatcat gtccatcatt 360
gtcgctttgt tcggtttaat tatcaccatc aaaatgaagg gtggtccttt gtacatcttc 420
ggttattgct tcggtatttt cggtggtatt gtctactctg tcccaccatt cagatggaag 480
caaaacccat ccactgcctt tttgttgaat ttcttggctc acatcattac caattttact 540
ttctactatg cctcccgtgc tgctttaggt ttgccttttg agttacgtcc atccttcact 600
tttttattgg cttttatgaa gtccatgggt tctgctttag ccttaattaa ggacgcctct 660
gacgttgaag gtgatactaa gttcggtatc tctactttag cctctaagta cggttctcgt 720
aacttgacct tgttctgttc tggtattgtc ttgttgtctt acgtcgccgc tattttggcc 780
ggtatcatct ggccacaagc tttcaactct aacgttatgt tgttgtctca tgctatctta 840
gctttctggt tgatcttaca aaccagagac ttcgctttga ctaactacga cccagaagcc 900
ggtcgtagat tctacgaatt catgtggaaa ttgtactacg ccgagtactt ggtctacgtt 960
ttcatttag 969
<210> 223
<211> 322
<212> PRT
<213> Artificial Sequence
<220>
<221> CONFLICT
<222> (1)..(322)
<223> 截短的香叶基焦磷酸橄榄醇酸香叶基转移酶CsGOT_t75 (CsPT1_t75)
<400> 223
Met Ser Ala Ala Thr Thr Asn Gln Thr Glu Pro Pro Glu Ser Asp Asn
1 5 10 15
His Ser Val Ala Thr Lys Ile Leu Asn Phe Gly Lys Ala Cys Trp Lys
20 25 30
Leu Gln Arg Pro Tyr Thr Ile Ile Ala Phe Thr Ser Cys Ala Cys Gly
35 40 45
Leu Phe Gly Lys Glu Leu Leu His Asn Thr Asn Leu Ile Ser Trp Ser
50 55 60
Leu Met Phe Lys Ala Phe Phe Phe Leu Val Ala Ile Leu Cys Ile Ala
65 70 75 80
Ser Phe Thr Thr Thr Ile Asn Gln Ile Tyr Asp Leu His Ile Asp Arg
85 90 95
Ile Asn Lys Pro Asp Leu Pro Leu Ala Ser Gly Glu Ile Ser Val Asn
100 105 110
Thr Ala Trp Ile Met Ser Ile Ile Val Ala Leu Phe Gly Leu Ile Ile
115 120 125
Thr Ile Lys Met Lys Gly Gly Pro Leu Tyr Ile Phe Gly Tyr Cys Phe
130 135 140
Gly Ile Phe Gly Gly Ile Val Tyr Ser Val Pro Pro Phe Arg Trp Lys
145 150 155 160
Gln Asn Pro Ser Thr Ala Phe Leu Leu Asn Phe Leu Ala His Ile Ile
165 170 175
Thr Asn Phe Thr Phe Tyr Tyr Ala Ser Arg Ala Ala Leu Gly Leu Pro
180 185 190
Phe Glu Leu Arg Pro Ser Phe Thr Phe Leu Leu Ala Phe Met Lys Ser
195 200 205
Met Gly Ser Ala Leu Ala Leu Ile Lys Asp Ala Ser Asp Val Glu Gly
210 215 220
Asp Thr Lys Phe Gly Ile Ser Thr Leu Ala Ser Lys Tyr Gly Ser Arg
225 230 235 240
Asn Leu Thr Leu Phe Cys Ser Gly Ile Val Leu Leu Ser Tyr Val Ala
245 250 255
Ala Ile Leu Ala Gly Ile Ile Trp Pro Gln Ala Phe Asn Ser Asn Val
260 265 270
Met Leu Leu Ser His Ala Ile Leu Ala Phe Trp Leu Ile Leu Gln Thr
275 280 285
Arg Asp Phe Ala Leu Thr Asn Tyr Asp Pro Glu Ala Gly Arg Arg Phe
290 295 300
Tyr Glu Phe Met Trp Lys Leu Tyr Tyr Ala Glu Tyr Leu Val Tyr Val
305 310 315 320
Phe Ile
<210> 224
<211> 972
<212> DNA
<213> Artificial Sequence
<220>
<221> conflict
<222> (1)..(972)
<223> 人工截短的香叶基焦磷酸橄榄醇酸香叶基转移酶CsPT4_t76 (CsPT4t)核苷酸序列
<400> 224
atgtccgccg gttctgatca aatcgaaggt tcccctcatc atgagtccga taactccatt 60
gctactaaaa ttttaaattt cggtcatact tgttggaagt tgcaacgtcc ttacgttgtc 120
aagggtatga tctctattgc ttgtggtttg ttcggtagag aattgtttaa caacagacac 180
ttgttctctt ggggtttgat gtggaaagct ttcttcgctt tggtcccaat tttgtctttc 240
aatttcttcg ccgccatcat gaaccaaatc tacgatgttg atatcgaccg tatcaacaag 300
ccagacttac ctttagtttc cggtgaaatg tccattgaaa ctgcttggat cttgtctatc 360
attgttgcct tgactggttt aattgttact attaagttga agtccgctcc attgtttgtc 420
ttcatctaca tcttcggtat cttcgctggt ttcgcttact ccgtcccacc tattagatgg 480
aaacaatatc cttttaccaa tttcttgatc actatttcct ctcatgttgg tttggctttc 540
acttcttact ctgccaccac ttctgcttta ggtttgcctt tcgtttggcg tcctgccttc 600
tctttcatta ttgctttcat gactgtcatg ggtatgacta ttgcctttgc taaagacatt 660
tctgatatcg aaggtgatgc taagtacggt gtctctaccg ttgctaccaa gttaggtgct 720
agaaatatga cttttgttgt ttctggtgtc ttattgttga actacttggt ttctatctct 780
attggtatca tttggccaca agttttcaag tctaacatta tgatcttgtc tcatgctatt 840
ttggctttct gtttgatctt tcaaactcgt gaattagcct tagccaatta tgcctctgcc 900
ccatcccgtc aatttttcga attcatctgg ttgttatact atgccgaata cttcgtttac 960
gtcttcattt aa 972
<210> 225
<211> 1197
<212> DNA
<213> Cannabis sativa
<400> 225
atgggactct cattagtttg taccttttca tttcaaacta attatcatac tttattaaac 60
cctcataata agaatcccaa aaactcatta ttatcttatc aacaccccaa aacaccaata 120
attaaatcct cttatgataa ttttccctct aaatattgct taaccaagaa ctttcattta 180
cttggactca attcacacaa cagaataagc tcacaatcaa ggtccattag ggcaggtagc 240
gatcaaattg aaggttctcc tcatcatgaa tctgataatt caatagcaac taaaatttta 300
aattttggac atacttgttg gaaacttcaa agaccatatg tagtaaaagg gatgatttca 360
atcgcttgtg gtttgtttgg gagagagttg ttcaataaca gacatttatt cagttggggt 420
ttgatgtgga aggcattctt tgctttggtg cctatattgt ccttcaattt ctttgcagca 480
atcatgaatc aaatttacga tgtggacatc gacaggataa acaagcctga tctaccacta 540
gtttcagggg aaatgtcaat tgaaacagct tggattttga gcataattgt ggcactaact 600
gggttgatag taactataaa attgaaatct gcaccacttt ttgttttcat ttacattttt 660
ggtatatttg ctgggtttgc ctattctgtt ccaccaatta gatggaagca atatcctttt 720
accaattttc taattaccat atcgagtcat gtgggcttag ctttcacatc atattctgca 780
accacatcag ctcttggttt accatttgtg tggaggcctg cttttagttt catcatagca 840
ttcatgacag ttatgggtat gactattgct tttgccaaag atatttcaga tattgaaggc 900
gacgccaaat atggggtatc aactgttgca accaaattag gtgctaggaa catgacattt 960
gttgtttctg gagttcttct tctaaactac ttggtttcta tatctattgg gataatttgg 1020
cctcaggttt tcaagagtaa cataatgata ctttctcatg caatcttagc attttgctta 1080
atcttccaga ctcgtgagct tgctctagca aattacgcct cggcgccaag cagacaattc 1140
ttcgagttta tctggttgct atattatgct gaatactttg tatatgtatt tatataa 1197

Claims (81)

1.一种用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞,所述基因修饰的宿主细胞包含一种或多种编码香叶基焦磷酸:橄榄醇酸香叶基转移酶多肽的异源核酸,其中所述香叶基焦磷酸:橄榄醇酸香叶基转移酶多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由香叶基焦磷酸和橄榄醇酸产生大麻萜酚酸。
2.一种用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞,所述基因修饰的宿主细胞包含一种或多种编码香叶基焦磷酸:橄榄醇酸香叶基转移酶多肽的异源核酸,所述香叶基焦磷酸:橄榄醇酸香叶基转移酶多肽包含与SEQ ID NO:110具有至少65%的序列同一性的氨基酸序列。
3.一种用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞,所述基因修饰的宿主细胞包含一种或多种编码香叶基焦磷酸:橄榄醇酸香叶基转移酶多肽的异源核酸,所述香叶基焦磷酸:橄榄醇酸香叶基转移酶多肽包含与SEQ ID NO:100具有至少65%的序列同一性的氨基酸序列。
4.权利要求1-3中任一项所述的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞还包含一种或多种编码四酮体合成酶(TKS)多肽的异源核酸和一种或多种编码橄榄醇酸(OAC)多肽的异源核酸,或一种或多种编码融合TKS和OAC多肽的异源核酸。
5.权利要求4所述的基因修饰的宿主细胞,其中所述TKS多肽包含与SEQ ID NO:11或SEQ ID NO:76具有至少50%的序列同一性的氨基酸序列。
6.权利要求4或5所述的基因修饰的宿主细胞,其中所述OAC多肽包含与SEQ ID NO:10或SEQ ID NO:78具有至少50%的序列同一性的氨基酸序列。
7.权利要求1-6中任一项所述的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞还包含以下中的一种或多种:
a)一种或多种异源核酸,其编码产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽;
b)一种或多种异源核酸,其编码产生香叶基焦磷酸的多肽;或
c)一种或多种异源核酸,其编码产生丙二酰辅酶A的多肽。
8.权利要求7所述的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞还包含一种或多种编码产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽的异源核酸,其中所述产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽是酰基活化酶(AAE)多肽。
9.权利要求8所述的基因修饰的宿主细胞,其中所述AAE多肽包含与SEQ ID NO:90具有至少50%的序列同一性的氨基酸序列。
10.权利要求8所述的基因修饰的宿主细胞,其中所述AAE多肽包含与SEQ ID NO:92或SEQ ID NO:149具有至少50%的序列同一性的氨基酸序列。
11.权利要求7所述的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞还包含一种或多种编码产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽的异源核酸,其中所述产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽是脂肪酰辅酶A连接酶多肽。
12.权利要求11所述的基因修饰的宿主细胞,其中所述脂肪酰辅酶A连接酶多肽包含与SEQ ID NO:145或SEQ ID NO:147具有至少50%的序列同一性的氨基酸序列。
13.权利要求7所述的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞还包含一种或多种编码产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽的异源核酸,其中所述产生酰基辅酶A化合物或酰基辅酶A化合物衍生物的多肽为脂肪酰辅酶A合成酶(FAA)多肽。
14.权利要求13所述的基因修饰的宿主细胞,其中所述FAA多肽包含与SEQ ID NO:169、SEQ ID NO:192、SEQ ID NO:194、SEQ ID NO:196、SEQ ID NO:198或SEQ ID NO:200具有至少50%的序列同一性的氨基酸序列。
15.权利要求7-14中任一项所述的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞还包含一种或多种编码产生香叶基焦磷酸的多肽的异源核酸,其中所述产生香叶基焦磷酸的多肽是香叶基焦磷酸合成酶(GPPS)多肽。
16.权利要求15所述的基因修饰的宿主细胞,其中所述GPPS多肽包含与SEQ ID NO:7、SEQ ID NO:8或SEQ ID NO:60具有至少50%的序列同一性的氨基酸序列。
17.权利要求7-16中任一项所述的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞还包含一种或多种编码产生丙二酰辅酶A的多肽的异源核酸,其中所述产生丙二酰辅酶A的多肽是乙酰辅酶A羧化酶-1(ACC1)多肽。
18.权利要求17所述的基因修饰的宿主细胞,其中所述ACC1多肽包含与SEQ ID NO:9、SEQ ID NO:97或SEQ ID NO:207具有至少50%的序列同一性的氨基酸序列。
19.权利要求1-18中任一项所述的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞还包含以下中的一种或多种:a)一种或多种编码HMG-辅酶A合成酶(HMGS)多肽的异源核酸;b)一种或多种编码3-羟基-3-甲基-戊二酰辅酶A还原酶(HMGR)多肽的异源核酸;c)一种或多种编码甲羟戊酸激酶(MK)多肽的异源核酸;d)一种或多种编码磷酸甲羟戊酸激酶(PMK)多肽的异源核酸;e)一种或多种编码甲羟戊酸焦磷酸脱羧酶(MVD)多肽的异源核酸;或f)一种或多种编码异戊烯基焦磷酸异构酶(IDI)多肽的异源核酸。
20.权利要求19所述的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞还包含一种或多种编码IDI多肽的异源核酸。
21.权利要求20所述的基因修饰的宿主细胞,其中所述IDI多肽包含与SEQ ID NO:58具有至少50%的序列同一性的氨基酸序列。
22.权利要求19-21中任一项所述的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞还包含一种或多种编码HMGR多肽的异源核酸。
23.权利要求22所述的基因修饰的宿主细胞,其中所述HMGR多肽包含与SEQ ID NO:22具有至少50%的序列同一性的氨基酸序列。
24.权利要求19-21中任一项所述的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞还包含一种或多种编码HMGR多肽的异源核酸,其中所述HMGR多肽是截短的HMGR(tHMGR)多肽。
25.权利要求24所述的基因修饰的宿主细胞,其中所述tHMGR多肽包含与SEQ ID NO:17、SEQ ID NO:52、SEQ ID NO:113或SEQ ID NO:208具有至少50%的序列同一性的氨基酸序列。
26.权利要求19-25中任一项所述的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞还包含一种或多种编码HMGS多肽的异源核酸。
27.权利要求26所述的基因修饰的宿主细胞,其中所述HMGS多肽包含与SEQ ID NO:23、SEQ ID NO:24或SEQ ID NO:115具有至少50%的序列同一性的氨基酸序列。
28.权利要求19-27中任一项所述的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞还包含一种或多种编码MK多肽的异源核酸。
29.权利要求28所述的基因修饰的宿主细胞,其中所述MK多肽包含与SEQ ID NO:64具有至少50%的序列同一性的氨基酸序列。
30.权利要求19-29中任一项所述的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞还包含一种或多种编码PMK多肽的异源核酸。
31.权利要求30所述的基因修饰的宿主细胞,其中所述PMK多肽包含与SEQ ID NO:62或SEQ ID NO:205具有至少50%的序列同一性的氨基酸序列。
32.权利要求19-31中任一项所述的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞还包含一种或多种编码MVD多肽的异源核酸。
33.权利要求32所述的基因修饰的宿主细胞,其中所述MVD多肽包含与SEQ ID NO:66具有至少50%的序列同一性的氨基酸序列。
34.权利要求1-33中任一项所述的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞还包含一种或多种编码使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽的异源核酸。
35.权利要求34所述的基因修饰的宿主细胞,其中所述使两分子乙酰辅酶A缩合以产生乙酰乙酰辅酶A的多肽是乙酰乙酰辅酶A硫解酶多肽。
36.权利要求35所述的基因修饰的宿主细胞,其中所述乙酰乙酰辅酶A硫解酶多肽包含与SEQ ID NO:25具有至少50%的序列同一性的氨基酸序列。
37.权利要求1-36中任一项所述的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞还包含一种或多种编码丙酮酸脱氢酶复合物(PDC)多肽的异源核酸。
38.权利要求37所述的基因修饰的宿主细胞,其中所述PDC多肽包含与SEQ ID NO:117具有至少50%的序列同一性的氨基酸序列。
39.权利要求1-38中任一项所述的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞是真核细胞。
40.权利要求39所述的基因修饰的宿主细胞,其中所述真核细胞是酵母细胞。
41.权利要求40所述的基因修饰的宿主细胞,其中所述酵母细胞是酿酒酵母。
42.权利要求41所述的基因修饰的宿主细胞,其中所述酿酒酵母是酿酒酵母的蛋白酶缺陷菌株。
43.权利要求1-39中任一项所述的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞是植物细胞。
44.权利要求1-38中任一项所述的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞是原核细胞。
45.权利要求1-44中任一项所述的基因修饰的宿主细胞,其中一种或多种异源核酸中的至少一种整合到所述基因修饰的宿主细胞的染色体中。
46.权利要求1-44中任一项所述的基因修饰的宿主细胞,其中一种或多种异源核酸中的至少一种保持在染色体外。
47.权利要求1-44中任一项所述的基因修饰的宿主细胞,其中一种或多种异源核酸中的两种或更多种存在于单个表达载体中。
48.权利要求1-44中任一项所述的基因修饰的宿主细胞,其中所述异源核酸中的至少一种可操作地连接到诱导型启动子。
49.权利要求1-44中任一项所述的基因修饰的宿主细胞,其中所述异源核酸中的至少一种可操作地连接到组成型启动子。
50.权利要求1-49中任一项所述的基因修饰的宿主细胞,其中在合适的培养基中培养所述基因修饰的宿主细胞以与在类似条件下培养的非基因修饰的宿主细胞相比增加的量提供大麻素或大麻素衍生物的合成。
51.权利要求1-50中任一项所述的基因修饰的宿主细胞,其中所述基因修饰的宿主细胞还包含一种或多种编码大麻素合成酶多肽的异源核酸。
52.权利要求51所述的基因修饰的宿主细胞,其中所述大麻素合成酶多肽是四氢大麻酚酸(THCA)合成酶多肽。
53.权利要求52所述的基因修饰的宿主细胞,其中所述THCA合成酶多肽包含与SEQ IDNO:14、SEQ ID NO:86、SEQ ID NO:104、SEQ ID NO:153或SEQ ID NO:155具有至少50%的序列同一性的氨基酸序列。
54.权利要求51所述的基因修饰的宿主细胞,其中所述大麻素合成酶多肽是大麻二酚酸(CBDA)合成酶多肽。
55.权利要求54所述的基因修饰的宿主细胞,其中所述CBDA合成酶多肽包含与SEQ IDNO:88或SEQ ID NO:151具有至少50%的序列同一性的氨基酸序列。
56.权利要求1-55中任一项所述的基因修饰的宿主细胞,其中所述大麻素是大麻萜酚酸、大麻萜酚、Δ9-四氢大麻酚酸、Δ9-四氢大麻酚、Δ8-四氢大麻酚酸、Δ8-四氢大麻酚、大麻二酚酸、大麻二酚、大麻色烯酸、大麻色烯、大麻酚酸、大麻酚、次大麻二酚酸、次大麻二酚、四氢次大麻酚酸、四氢次大麻酚、次大麻色酚酸、次大麻色酚、次大麻萜酚酸、次大麻萜酚、大麻环酚酸、大麻环酚、大麻艾尔松酸、大麻艾尔松、大麻二吡喃环烷酸或大麻二吡喃环烷。
57.权利要求56所述的基因修饰的宿主细胞,其中所述大麻素是大麻萜酚酸。
58.一种在基因修饰的宿主细胞中产生大麻素或大麻素衍生物的方法,所述方法包括:
a)在合适的培养基中培养权利要求1-57中任一项所述的基因修饰的宿主细胞;和
b)回收产生的大麻素或大麻素衍生物。
59.一种产生大麻素或大麻素衍生物的方法,所述方法包括:
a)在包含羧酸的合适的培养基中培养权利要求1-57中任一项所述的基因修饰的宿主细胞;
b)回收产生的大麻素或大麻素衍生物。
60.一种产生大麻素或大麻素衍生物的方法,所述方法包括:
a)在包含橄榄醇酸或橄榄醇酸衍生物的合适的培养基中培养权利要求1-57中任一项所述的基因修饰的宿主细胞;
b)回收产生的大麻素或大麻素衍生物。
61.一种在基因修饰的宿主细胞中产生大麻素或大麻素衍生物的方法,所述方法包括:
a)在合适的培养基中培养包含一种或多种编码香叶基焦磷酸:橄榄醇酸香叶基转移酶多肽的异源核酸的基因修饰的宿主细胞,其中所述香叶基焦磷酸:橄榄醇酸香叶基转移酶多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由香叶基焦磷酸和橄榄醇酸产生大麻萜酚酸;和
b)回收产生的大麻素或大麻素衍生物。
62.一种在基因修饰的宿主细胞中产生大麻素或大麻素衍生物的方法,所述方法包括:
a)在合适的培养基中培养包含一种或多种编码香叶基焦磷酸:橄榄醇酸香叶基转移酶多肽的异源核酸的基因修饰的宿主细胞,所述香叶基焦磷酸:橄榄醇酸香叶基转移酶多肽包含与SEQ ID NO:110具有至少65%的序列同一性的氨基酸序列;和
b)回收产生的大麻素或大麻素衍生物。
63.一种在基因修饰的宿主细胞中产生大麻素或大麻素衍生物的方法,所述方法包括:
a)在合适的培养基中培养包含一种或多种编码香叶基焦磷酸:橄榄醇酸香叶基转移酶多肽的异源核酸的基因修饰的宿主细胞,所述香叶基焦磷酸:橄榄醇酸香叶基转移酶多肽包含与SEQ ID NO:100具有至少65%的序列同一性的氨基酸序列;和
b)回收产生的大麻素或大麻素衍生物。
64.权利要求58-63中任一项所述的方法,其中所述合适的培养基包含可发酵的糖。
65.权利要求58-63中任一项所述的方法,其中所述合适的培养基包含预处理的纤维素原料。
66.权利要求58-63中任一项所述的方法,其中所述合适的培养基包含不可发酵的碳源。
67.权利要求66所述的方法,其中所述不可发酵的碳源包括乙醇。
68.权利要求58-67中任一项所述的方法,其中所述大麻素是大麻萜酚酸、大麻萜酚、Δ9-四氢大麻酚酸、Δ9-四氢大麻酚、Δ8-四氢大麻酚酸、Δ8-四氢大麻酚、大麻二酚酸、大麻二酚、大麻色烯酸、大麻色烯、大麻酚酸、大麻酚、次大麻二酚酸、次大麻二酚、四氢次大麻酚酸、四氢次大麻酚、次大麻色酚酸、次大麻色酚、次大麻萜酚酸、次大麻萜酚、大麻环酚酸、大麻环酚、大麻艾尔松酸、大麻艾尔松、大麻二吡喃环烷酸或大麻二吡喃环烷。
69.一种分离或纯化的香叶基焦磷酸:橄榄醇酸香叶基转移酶多肽,其中所述香叶基焦磷酸:橄榄醇酸香叶基转移酶多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由香叶基焦磷酸和橄榄醇酸产生大麻萜酚酸。
70.一种分离或纯化的多肽,其包含与SEQ ID NO:110具有至少65%的序列同一性的氨基酸序列。
71.一种分离或纯化的多肽,其包含与SEQ ID NO:100具有至少65%的序列同一性的氨基酸序列。
72.一种分离或纯化的核酸,其编码香叶基焦磷酸:橄榄醇酸香叶基转移酶多肽,其中所述香叶基焦磷酸:橄榄醇酸香叶基转移酶多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由香叶基焦磷酸和橄榄醇酸产生大麻萜酚酸。
73.一种分离或纯化的核酸,其编码包含与SEQ ID NO:110具有至少65%的序列同一性的氨基酸序列的多肽。
74.一种分离或纯化的核酸,其编码包含与SEQ ID NO:100具有至少65%的序列同一性的氨基酸序列的多肽。
75.一种载体,其包含编码香叶基焦磷酸:橄榄醇酸香叶基转移酶多肽的核酸,其中所述香叶基焦磷酸:橄榄醇酸香叶基转移酶多肽可以以比包含SEQ ID NO:82所示的氨基酸序列的多肽高至少十倍的量催化由香叶基焦磷酸和橄榄醇酸产生大麻萜酚酸。
76.一种载体,其包含编码包含与SEQ ID NO:110具有至少65%的序列同一性的氨基酸序列的多肽的核酸。
77.一种载体,其包含编码包含与SEQ ID NO:100具有至少65%的序列同一性的氨基酸序列的多肽的核酸。
78.一种制备用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞的方法,包括向所述基因修饰的宿主细胞中引入一种或多种编码香叶基焦磷酸:橄榄醇酸香叶基转移酶多肽的异源核酸,其中所述香叶基焦磷酸:橄榄醇酸香叶基转移酶多肽可以以比包含SEQ IDNO:82所示的氨基酸序列的多肽高至少十倍的量催化由香叶基焦磷酸和橄榄醇酸产生大麻萜酚酸。
79.一种制备用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞的方法,包括向所述基因修饰的宿主细胞中引入一种或多种编码香叶基焦磷酸:橄榄醇酸香叶基转移酶多肽的异源核酸,所述香叶基焦磷酸:橄榄醇酸香叶基转移酶多肽包含与SEQ ID NO:110具有至少65%的序列同一性的氨基酸序列。
80.一种制备用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞的方法,包括向所述基因修饰的宿主细胞中引入一种或多种编码香叶基焦磷酸:橄榄醇酸香叶基转移酶多肽的异源核酸,所述香叶基焦磷酸:橄榄醇酸香叶基转移酶多肽包含与SEQ ID NO:100具有至少65%的序列同一性的氨基酸序列。
81.一种制备用于产生大麻素或大麻素衍生物的基因修饰的宿主细胞的方法,包括向所述基因修饰的宿主细胞中引入权利要求75-77中任一项所述的载体。
CN201880042884.3A 2017-04-27 2018-04-27 产生大麻素和大麻素衍生物的微生物和方法 Active CN110914416B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201762491114P 2017-04-27 2017-04-27
US62/491114 2017-04-27
US201762569532P 2017-10-07 2017-10-07
US62/569532 2017-10-07
PCT/US2018/029668 WO2018200888A1 (en) 2017-04-27 2018-04-27 Microorganisms and methods for producing cannabinoids and cannabinoid derivatives

Publications (2)

Publication Number Publication Date
CN110914416A true CN110914416A (zh) 2020-03-24
CN110914416B CN110914416B (zh) 2023-07-21

Family

ID=62455816

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880042884.3A Active CN110914416B (zh) 2017-04-27 2018-04-27 产生大麻素和大麻素衍生物的微生物和方法

Country Status (11)

Country Link
US (4) US10563211B2 (zh)
EP (2) EP3998336A1 (zh)
JP (1) JP7198555B2 (zh)
CN (1) CN110914416B (zh)
AU (1) AU2018256863B2 (zh)
BR (1) BR112019022500A2 (zh)
CA (1) CA3061718A1 (zh)
ES (1) ES2898272T3 (zh)
IL (1) IL270202B1 (zh)
SG (1) SG11201910019PA (zh)
WO (1) WO2018200888A1 (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112063647A (zh) * 2020-09-17 2020-12-11 云南农业大学 酿酒酵母重组菌Cuol01的构建方法、酿酒酵母重组菌Cuol02及应用
CN112410235A (zh) * 2020-11-23 2021-02-26 森瑞斯生物科技(深圳)有限公司 一种高产大麻萜酚的酿酒酵母菌株及其构建方法和应用
CN112795495A (zh) * 2020-12-14 2021-05-14 大连理工大学 利用酿酒酵母生产异源大麻环萜酚的方法
CN113234845A (zh) * 2021-03-12 2021-08-10 内蒙古农业大学 鉴别内蒙古地区主栽枣品种的snp分子标记引物及标记方法
CN113502255A (zh) * 2021-09-10 2021-10-15 北京蓝晶微生物科技有限公司 用于生产橄榄醇和橄榄醇酸的工程化微生物
CN113528365A (zh) * 2021-07-13 2021-10-22 浙江寿仙谷医药股份有限公司 产大麻二酚的重组酿酒酵母、其构建方法以及应用
CN113999870A (zh) * 2020-02-26 2022-02-01 森瑞斯生物科技(深圳)有限公司 一种表达cbdas的重组酿酒酵母及其构建方法和应用
CN114196645A (zh) * 2021-09-10 2022-03-18 北京蓝晶微生物科技有限公司 一种橄榄醇合成酶变体l及其用途
CN114214339A (zh) * 2021-12-08 2022-03-22 福建农林大学 一种汉麻thcsas2基因及其编码产物萜烯酚酸氧化环化酶与应用
CN114591923A (zh) * 2022-05-10 2022-06-07 森瑞斯生物科技(深圳)有限公司 大麻二酚酸合成酶突变体及其构建方法与应用
CN116574700A (zh) * 2023-05-12 2023-08-11 黑龙江八一农垦大学 大麻二酚酸合成酶突变体及其应用
CN116622784A (zh) * 2023-02-14 2023-08-22 黑龙江八一农垦大学 一种大麻二酚酸合成酶的应用
WO2024113412A1 (zh) * 2022-12-03 2024-06-06 中国科学院深圳先进技术研究院 一种产大麻萜酚的微生物细胞及其构建方法与应用

Families Citing this family (63)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11180781B2 (en) * 2016-08-21 2021-11-23 Insectergy, Llc Biosynthetic cannabinoid production methods
US10239808B1 (en) 2016-12-07 2019-03-26 Canopy Holdings, LLC Cannabis extracts
WO2018148849A1 (en) 2017-02-17 2018-08-23 Hyasynth Biologicals Inc. Method and cell line for production of polyketides in yeast
SG11201910019PA (en) * 2017-04-27 2019-11-28 Univ California Microorganisms and methods for producing cannabinoids and cannabinoid derivatives
US10837031B2 (en) 2017-05-10 2020-11-17 Baymedica, Inc. Recombinant production systems for prenylated polyketides of the cannabinoid family
EP3652327A4 (en) * 2017-07-12 2021-04-21 Biomedican, Inc. MAKING CANNABINOIDS IN YEAST
US11981938B2 (en) * 2017-10-05 2024-05-14 Eleszto Genetika, Inc. Microorganisms and methods for the fermentation of cannabinoids
US11202771B2 (en) 2018-01-31 2021-12-21 Treehouse Biotech, Inc. Hemp powder
CA3079760C (en) * 2018-04-30 2021-11-23 Algae-C Inc. Engineered microorganism for the production of cannabinoid biosynthetic pathway products
US10801049B2 (en) 2018-06-14 2020-10-13 Syntiva Therapeutics, Inc. Genetically engineered microorganisms and processes for the production of cannabinoids from a carbon source precursor
CA3107544A1 (en) 2018-08-01 2020-02-06 The Regents Of The University Of California Biosynthetic platform for the production of cannabinoids and other prenylated compounds
WO2020060948A1 (en) 2018-09-17 2020-03-26 Levadura Biotechnology, Inc. Production of cannabinoids in yeast using a fatty acid feedstock
WO2020069214A2 (en) * 2018-09-26 2020-04-02 Demetrix, Inc. Optimized expression systems for producing cannabinoid synthase polypeptides, cannabinoids, and cannabinoid derivatives
CA3119729A1 (en) 2018-10-10 2020-04-16 Treehouse Biotech, Inc. Synthesis of cannabigerol
CN113227353A (zh) * 2018-11-14 2021-08-06 马努斯生物合成股份有限公司 用于产生大麻素的微生物细胞及方法
WO2020112647A1 (en) * 2018-11-27 2020-06-04 Khona Scientific Llc Bidirectional multi-enzymatic scaffolds for biosynthesizing cannabinoids
EP3917642A4 (en) * 2019-01-30 2023-04-05 Genomatica, Inc. RECOVERY, DECARBOXYLATION AND PURIFICATION OF CANNABINOIDS FROM MODIFIED CELL CULTURES
US20220127649A1 (en) * 2019-01-30 2022-04-28 Genomatica, Inc. Engineered cells for improved production of cannabinoids
EP3921434A4 (en) * 2019-02-10 2022-11-30 Dyadic International (USA), Inc. PRODUCTION OF CANNABINOIDS IN THREAD FUNGI
WO2020169221A1 (en) * 2019-02-20 2020-08-27 Synbionik Gmbh Production of plant-based active substances (e.g. cannabinoids) by recombinant microorganisms
WO2020176547A1 (en) 2019-02-25 2020-09-03 Ginkgo Bioworks, Inc. Biosynthesis of cannabinoids and cannabinoid precursors
US20220243236A1 (en) * 2019-03-01 2022-08-04 The Regents Of The University Of California Production of cannabinoids using genetically engineered photosynthetic microorganisms
MX2021011185A (es) * 2019-03-15 2021-10-22 Amyris Inc Produccion microbiana de compuestos.
US20220186267A1 (en) * 2019-03-27 2022-06-16 Rynetech Bio, Inc. Biosynthetic Cannabidiol Production In Engineered Microorganisms
WO2020208411A2 (en) * 2019-04-11 2020-10-15 Eleszto Genetika, Inc. Microorganisms and methods for the fermentation of cannabinoids
WO2020210810A1 (en) * 2019-04-12 2020-10-15 Renew Biopharma, Inc. Compositions and methods for using genetically modified enzymes
BR112021023218A2 (pt) * 2019-05-22 2022-02-08 Demetrix Inc Polipeptídeos sintase de canabinoide otimizados
CA3142619A1 (en) * 2019-06-06 2020-12-10 Genomatica, Inc. Olivetolic acid cyclase variants and methods for their use
US20220298522A1 (en) * 2019-07-30 2022-09-22 The State Of Israel, Ministry Of Agriculture & Rural Development, Agricultural Research Organization Methods of controlling cannabinoid synthesis in plants or cells and plants and cells produced thereby
WO2021041572A1 (en) * 2019-08-27 2021-03-04 Natural Extraction Systems, LLC Compositions comprising decarboxylated cannabinoids
WO2021042057A1 (en) * 2019-08-30 2021-03-04 Lygos, Inc. Systems and methods for preparing cannabinoids and derivatives
WO2021035359A1 (en) * 2019-08-30 2021-03-04 Exponential Genomics Canada Inc. Production of gpp and cbga in a methylotrophic yeast strain
WO2021055597A1 (en) * 2019-09-18 2021-03-25 Demetrix, Inc. Optimized tetrahydrocannabinolic acid (thca) synthase polypeptides
CN114729386A (zh) * 2019-10-01 2022-07-08 杭州恩和生物科技有限公司 用于大麻素合成的酶及其制备和使用方法
JP2022552952A (ja) * 2019-10-11 2022-12-21 ナショナル ユニヴァーシティ オブ シンガポール 新規芳香族プレニルトランスフェラーゼを使用したカンナビノイド前駆体の生合成
JP2022552953A (ja) * 2019-10-11 2022-12-21 ナショナル ユニヴァーシティ オブ シンガポール サッカロマイセス・セレビシエを用いた簡単な前駆体原料からのカンナビノイドの持続可能な生成
EP4041874A4 (en) * 2019-10-11 2024-02-21 National University of Singapore BIOSYNTHESIS OF CANNABINOIDS FROM CANNABIGEROLIC ACID USING NOVEL CANNABINOID SYNTHASES
CN110669713A (zh) * 2019-10-18 2020-01-10 中国科学院青岛生物能源与过程研究所 一种合成d-柠檬烯的基因工程菌及其构建方法与应用
WO2021081648A1 (en) * 2019-10-29 2021-05-06 Algae-C Inc. Engineered microorganism for the production of cannabinoid biosynthetic pathway products
EP4087933A1 (en) * 2020-01-10 2022-11-16 Barrit Sarl Production of bioactive bibenzylic acid or derivatives thereof by genetically modified microbial hosts
BR112022013503A2 (pt) * 2020-01-10 2022-09-13 Univ California Plataforma biossintética para a produção de ácido olivetólico e análogos de ácido olivetólico
JP2023511109A (ja) * 2020-01-20 2023-03-16 ベイメディカ インコーポレイテッド カンナビゲロール酸、カンナビクロメン酸および関連するカンナビノイドの産生のための遺伝子改変酵母
CA3174592A1 (en) * 2020-03-03 2021-09-10 Ido Margalit Odorless cannabis plant
WO2021183448A1 (en) 2020-03-09 2021-09-16 Demetrix, Inc. Optimized olivetolic acid cyclase polypeptides
WO2021195517A2 (en) 2020-03-27 2021-09-30 Willow Biosciences, Inc. Compositions and methods for recombinant biosynthesis of cannabinoids
EP4142711A1 (en) 2020-04-29 2023-03-08 Willow Biosciences Inc. Compositions and methods for enhancing recombinant biosynthesis of cannabinoids
EP4146809A1 (en) * 2020-05-08 2023-03-15 Lygos, Inc. Large scale production of olivetol, olivetolic acid and other alkyl resorcinols by fermentation
BR112023002818A2 (pt) * 2020-08-19 2023-04-25 Amyris Inc Produção microbiana de canabinoides
CN112280699B (zh) * 2020-09-28 2022-06-21 嘉兴欣贝莱生物科技有限公司 生产戊基二羟基苯酸的方法
WO2022081615A1 (en) * 2020-10-13 2022-04-21 Ginkgo Bioworks, Inc. Biosynthesis of cannabinoids and cannabinoid precursors
US11884620B2 (en) 2020-12-11 2024-01-30 The Regents Of The University Of California Use of polyamines in the pretreatment of biomass
CA3201757A1 (en) 2020-12-11 2022-06-16 Mathias Schuetz Recombinant acyl activating enzyme (aae) genes for enhanced biosynthesis of cannabinoids and cannabinoid precursors
WO2022204007A2 (en) * 2021-03-22 2022-09-29 Willow Biosciences, Inc. Recombinant polypeptides for enhanced biosynthesis of cannabinoids
WO2022241298A2 (en) * 2021-05-14 2022-11-17 Cellibre, Inc. Engineered cells, enzymes, and methods for producing cannabinoids
CN113278597B (zh) * 2021-05-26 2023-04-21 重庆大学 新型短侧链脂肪酸CoA连接酶及其在制备广藿香酮中的应用
BR112023025334A2 (pt) * 2021-06-04 2024-02-27 Amyris Inc Métodos de purificação de canabinoides
CA3227215A1 (en) 2021-07-30 2023-02-02 Trish Choudhary Recombinant prenyltransferase polypeptides engineered for enhanced biosynthesis of cannabinoids
WO2023023621A1 (en) 2021-08-19 2023-02-23 Willow Biosciences, Inc. Recombinant olivetolic acid cyclase polypeptides engineered for enhanced biosynthesis of cannabinoids
WO2023069921A1 (en) 2021-10-19 2023-04-27 Epimeron Usa, Inc. Recombinant thca synthase polypeptides engineered for enhanced biosynthesis of cannabinoids
WO2023220728A2 (en) * 2022-05-12 2023-11-16 Manus Bio Inc. Enzymes, cells, and methods for producing cis-3 hexenol
WO2024042486A1 (en) 2022-08-26 2024-02-29 Amyris Bio Products Portugal, Unipessoal, Ltda. Compositions and methods for the production of polyurethanes
WO2024042405A1 (en) 2022-08-26 2024-02-29 Amyris Bio Products Portugal, Unipessoal, Ltda. Compositions and methods for the synthesis of bio-based polymers
WO2024116153A1 (en) 2022-12-02 2024-06-06 Amyris Bio Products Portugal, Unipessoal, Ltda. Compositions and methods for using previously cultured cells

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120144523A1 (en) * 2009-08-12 2012-06-07 Page Jonathan E Aromatic Prenyltransferase from Cannabis
WO2016010827A1 (en) * 2014-07-14 2016-01-21 Librede Inc. Production of cannabinoids in yeast
CN105555265A (zh) * 2013-02-28 2016-05-04 全谱实验室有限公司 大麻素的生物合成

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5451513A (en) 1990-05-01 1995-09-19 The State University of New Jersey Rutgers Method for stably transforming plastids of multicellular plants
US5576198A (en) 1993-12-14 1996-11-19 Calgene, Inc. Controlled expression of transgenic constructs in plant plastids
US5545817A (en) 1994-03-11 1996-08-13 Calgene, Inc. Enhanced expression in a plant plastid
US5545818A (en) 1994-03-11 1996-08-13 Calgene Inc. Expression of Bacillus thuringiensis cry proteins in plant plastids
WO1996017951A2 (en) 1994-12-09 1996-06-13 Rpms Technology Limited Identification of genes responsible for in vivo survival of microorganisms
US6900012B1 (en) 1997-06-03 2005-05-31 The University Of Chicago Plant artificial chromosome compositions and methods
US6080849A (en) 1997-09-10 2000-06-27 Vion Pharmaceuticals, Inc. Genetically modified tumor-targeted bacteria with reduced virulence
WO2002010398A2 (en) 2000-07-31 2002-02-07 Hahn Frederick M Manipulation of genes of the mevalonate and isoprenoid pathways to create novel traits in transgenic organisms
GB0105924D0 (en) 2001-03-09 2001-04-25 Microscience Ltd Promoter
US6733996B2 (en) 2002-08-26 2004-05-11 Trustees Of Dartmouth College Methods for regulating gene expression using light
CA2501574C (en) 2002-10-04 2013-12-03 E. I. Du Pont De Nemours And Company Process for the biological production of 1,3-propanediol with high yield
MX284139B (es) 2006-05-26 2011-02-18 Amyris Biotechnologies Inc Produccion de isoprenoides.
SG162265A1 (en) 2007-12-13 2010-07-29 Danisco Us Inc Compositions and methods for producing isoprene
SG165884A1 (en) 2008-04-23 2010-11-29 Goodyear Tire & Rubber Isoprene synthase variants for improved microbial production of isoprene
CA2729801A1 (en) 2008-07-02 2010-01-07 Danisco Us Inc. Compositions and methods for producing isoprene free of c5 hydrocarbons under decoupling conditions and/or safe operating ranges
CA3130705A1 (en) 2010-04-15 2011-10-20 National Research Council Of Canada Genes and proteins for aromatic polyketide synthesis
JP6177774B2 (ja) 2011-07-13 2017-08-16 ナショナル、リサーチ、カウンシル、オブ、カナダNational Research Council of Canada アルカノイル−coa合成のための遺伝子およびタンパク質
EP2968259B1 (en) 2013-03-14 2022-09-14 SC Laboratories Inc. Bioactive concentrates and uses thereof
DK3553177T3 (da) 2013-03-15 2021-02-15 Univ Leland Stanford Junior Benzylisoquinolinalkaloider (bia) som producerer mikrober, og fremgangsmåder til fremstilling og anvendelse deraf
WO2015196275A1 (en) 2014-06-27 2015-12-30 National Research Council Of Canada (Nrc) Cannabichromenic acid synthase from cannabis sativa
AU2015308136B2 (en) 2014-08-25 2020-07-09 Teewinot Technologies Limited Apparatus and methods for the simultaneous production of cannabinoid compounds
EP3250200A4 (en) 2015-01-31 2018-09-19 Constance Therapeutics, Inc. Methods for preparation of cannabis oil extracts and compositions
EP3067058A1 (en) * 2015-03-13 2016-09-14 Farmagens Health Care Srl Biological composition based on engineered lactobacillus paracasei subsp. paracasei f19 for the biosynthesis of cannabinoids
US20160298151A1 (en) 2015-04-09 2016-10-13 Sher Ali Butt Novel Method for the cheap, efficient, and effective production of pharmaceutical and therapeutic api's intermediates, and final products
WO2017139496A1 (en) 2016-02-09 2017-08-17 Cevolva Biotech, Inc. Microbial engineering for the production of cannabinoids and cannabinoid precursors
WO2018148849A1 (en) 2017-02-17 2018-08-23 Hyasynth Biologicals Inc. Method and cell line for production of polyketides in yeast
SG11201910019PA (en) * 2017-04-27 2019-11-28 Univ California Microorganisms and methods for producing cannabinoids and cannabinoid derivatives
EP3652327A4 (en) * 2017-07-12 2021-04-21 Biomedican, Inc. MAKING CANNABINOIDS IN YEAST
US11981938B2 (en) * 2017-10-05 2024-05-14 Eleszto Genetika, Inc. Microorganisms and methods for the fermentation of cannabinoids

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120144523A1 (en) * 2009-08-12 2012-06-07 Page Jonathan E Aromatic Prenyltransferase from Cannabis
CN105555265A (zh) * 2013-02-28 2016-05-04 全谱实验室有限公司 大麻素的生物合成
WO2016010827A1 (en) * 2014-07-14 2016-01-21 Librede Inc. Production of cannabinoids in yeast

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
XIAOZHOU LUO ET AL: "complete biosynthesis of cannabinoids and their unnatural analogues in yeast", 《NATURE》 *
无: "TSA: Cannabis sativa PK15523.1_1.CasaPuKu mRNA sequence", 《DATABASE EMBL》 *

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113999870A (zh) * 2020-02-26 2022-02-01 森瑞斯生物科技(深圳)有限公司 一种表达cbdas的重组酿酒酵母及其构建方法和应用
CN113999870B (zh) * 2020-02-26 2024-02-20 森瑞斯生物科技(深圳)有限公司 一种表达cbdas的重组酿酒酵母及其构建方法和应用
CN112063647B (zh) * 2020-09-17 2023-05-02 云南农业大学 酿酒酵母重组菌Cuol01的构建方法、酿酒酵母重组菌Cuol02及应用
CN112063647A (zh) * 2020-09-17 2020-12-11 云南农业大学 酿酒酵母重组菌Cuol01的构建方法、酿酒酵母重组菌Cuol02及应用
CN112410235A (zh) * 2020-11-23 2021-02-26 森瑞斯生物科技(深圳)有限公司 一种高产大麻萜酚的酿酒酵母菌株及其构建方法和应用
WO2022127481A1 (zh) * 2020-12-14 2022-06-23 大连理工大学 利用酿酒酵母生产异源大麻环萜酚的方法
CN112795495A (zh) * 2020-12-14 2021-05-14 大连理工大学 利用酿酒酵母生产异源大麻环萜酚的方法
CN112795495B (zh) * 2020-12-14 2021-10-26 大连理工大学 利用酿酒酵母生产异源大麻环萜酚的方法
CN113234845A (zh) * 2021-03-12 2021-08-10 内蒙古农业大学 鉴别内蒙古地区主栽枣品种的snp分子标记引物及标记方法
CN113528365A (zh) * 2021-07-13 2021-10-22 浙江寿仙谷医药股份有限公司 产大麻二酚的重组酿酒酵母、其构建方法以及应用
CN113528365B (zh) * 2021-07-13 2023-04-07 浙江寿仙谷医药股份有限公司 产大麻二酚的重组酿酒酵母、其构建方法以及应用
CN113502255B (zh) * 2021-09-10 2022-01-28 北京蓝晶微生物科技有限公司 用于生产橄榄醇和橄榄醇酸的工程化微生物
CN114196645A (zh) * 2021-09-10 2022-03-18 北京蓝晶微生物科技有限公司 一种橄榄醇合成酶变体l及其用途
CN113502255A (zh) * 2021-09-10 2021-10-15 北京蓝晶微生物科技有限公司 用于生产橄榄醇和橄榄醇酸的工程化微生物
CN114196645B (zh) * 2021-09-10 2022-08-09 北京蓝晶微生物科技有限公司 一种橄榄醇合成酶变体l及其用途
WO2023035396A1 (zh) * 2021-09-10 2023-03-16 北京蓝晶微生物科技有限公司 橄榄醇合成酶变体和表达其的工程化微生物
CN114214339A (zh) * 2021-12-08 2022-03-22 福建农林大学 一种汉麻thcsas2基因及其编码产物萜烯酚酸氧化环化酶与应用
CN114591923B (zh) * 2022-05-10 2022-08-30 森瑞斯生物科技(深圳)有限公司 大麻二酚酸合成酶突变体及其构建方法与应用
CN114591923A (zh) * 2022-05-10 2022-06-07 森瑞斯生物科技(深圳)有限公司 大麻二酚酸合成酶突变体及其构建方法与应用
WO2024113412A1 (zh) * 2022-12-03 2024-06-06 中国科学院深圳先进技术研究院 一种产大麻萜酚的微生物细胞及其构建方法与应用
CN116622784A (zh) * 2023-02-14 2023-08-22 黑龙江八一农垦大学 一种大麻二酚酸合成酶的应用
CN116622784B (zh) * 2023-02-14 2024-03-01 黑龙江八一农垦大学 一种大麻二酚酸合成酶的应用
CN116574700A (zh) * 2023-05-12 2023-08-11 黑龙江八一农垦大学 大麻二酚酸合成酶突变体及其应用
CN116574700B (zh) * 2023-05-12 2023-11-14 黑龙江八一农垦大学 大麻二酚酸合成酶突变体及其应用

Also Published As

Publication number Publication date
IL270202A (en) 2019-12-31
US20230340506A1 (en) 2023-10-26
CA3061718A1 (en) 2018-11-01
WO2018200888A1 (en) 2018-11-01
EP3615667A1 (en) 2020-03-04
IL270202B1 (en) 2024-03-01
US11542512B2 (en) 2023-01-03
US20200172917A1 (en) 2020-06-04
BR112019022500A2 (pt) 2020-06-16
US20210332374A1 (en) 2021-10-28
US10563211B2 (en) 2020-02-18
CN110914416B (zh) 2023-07-21
US10975379B2 (en) 2021-04-13
AU2018256863A1 (en) 2019-11-14
US20190300888A1 (en) 2019-10-03
JP2020517293A (ja) 2020-06-18
ES2898272T3 (es) 2022-03-04
EP3998336A1 (en) 2022-05-18
AU2018256863B2 (en) 2024-06-06
EP3615667B1 (en) 2021-08-11
SG11201910019PA (en) 2019-11-28
JP7198555B2 (ja) 2023-01-04

Similar Documents

Publication Publication Date Title
CN110914416B (zh) 产生大麻素和大麻素衍生物的微生物和方法
IL270214B1 (en) Anti-sortilin antibodies and methods of using them
US9181539B2 (en) Strains for the production of flavonoids from glucose
KR20210032928A (ko) 트립타민의 생산 방법
EP2169075B1 (en) Method for production of alkaloid
JP2022534032A (ja) 最適化されたカンナビノイド合成酵素ポリペプチド
CN114207108A (zh) 产生糖基化大麻素的基因修饰的宿主细胞
CN114196648B (zh) 一种橄榄醇合成酶变体t及其用途
US20190071474A1 (en) Production of gibberellins in recombinant hosts
CN115038786A (zh) 优化的四氢大麻酚酸(thca)合酶多肽
CN115261293A (zh) 一种产羟基己二酸的基因工程菌

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant